この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第94回)では、1ビットLLMの進化版「BitNet v2」と、AIに何度も自己議論させることで精度が向上していく手法「CoRT 」を取り上げます。
YuEやDiffRhythmなど、オープンソース版も充実してきた楽曲生成AIですが、また中国から新しいソフトが公開されました。「ACE-Step」は、英語、日本語を含む19言語の歌詞に対応し、Lyrics to Musicの生成が可能。
Google のスマートフォン Pixel 9a を「AIスマホ」として試してみました。
今回は、現在AIモデル評価の業界標準とされているランキング形式(リーダーボード)のAIベンチマーク「Chatbot Arena」における問題を明らかにした研究「The Leaderboard Illusion」を取り上げます。
高速でかつ長時間の動画生成が可能なオープンソースAI「FramePack」。Image to Videoで入力した画像から逆方向に生成していく仕組みですが、これを順方向。つまり、他の多くの動画生成AIと同じやり方で生成するオプション「F1」がサポートされました。
AI作曲サービスのSunoがひさびさの(2024年11月20日以来)メジャーバージョンアップを果たし、最新版はv4.5となりました。一度で生成できる楽曲の長さはなんと8分となります。そのほかにも改善点・新機能が多数。
最近のChatGPTが過度にユーザーを褒め称えたり、回答の正しさよりも迎合を優先すると批判が高まっていた件について。
HiDream-I1-FullとDevの違いは!?
OpenAIは、ChatGPTが18歳未満の未成年ユーザーとのチャットで性的に露骨な画像を生成したり、NFSWな会話を展開するのを制限するための修正を「積極的に行っている」と述べています。
Google NotebookLMには、PDF、テキスト、YouTubeなどを読み込んで、その内容についてリアルな対話ポッドキャスト解説を生成する機能があります。2024年9月11日にローンチした時点では英語でしか使えなかったのですが、4月30日、ついに日本語対応しました。
AI企業OpenAIのCEOであるサム・アルトマン氏は、生成AIチャットボットサービス ChatGPTの標準モデルであるGPT-4oが「媚びへつらいすぎて気に障る(良い部分もあるが)」と述べ、早急に性格を修正する予定であることを明らかにしました。
動画生成AIで、今回は3つの大きなニュースがあります。そのうち2つは前回お伝えした驚異的なオープンソース動画生成AI「FramePack」に関すること。
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、GitHub上のリポジトリを自動的に解析し、ドキュメントを生成してくれるオープンソースAIツール「DeepWiki」を取り上げます。
「NVIDIA Gamer Day」の模様をお伝えしていきます!
韓国のスタートアップ「Newnal」が開発中のAIスマートフォンは、個人データを活用したアシスタント機能を備え、プライバシー保護にも配慮されている。2025年5月に発売予定。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第92回)では、ByteDanceが発表した2つのモデル、動画生成AI「Seaweed-7B」とGPT-4o超えという画像生成AI「Seedream 3.0」を取り上げます。
ロンドンで開催中のイベント Adobe MAX London 2025で、アドビがクリエイティブAIソリューション Firefly の最新アップデートを披露しました。
米司法省のGoogleに対する反トラスト法裁判に、証人として出廷したPerplexityの幹部、ドミトリー・シェベレンコ氏は、GoogleからChrome事業が分割されれば、喜んで買収を申し出るだろうと述べています。
4月18日に登場した、驚異的な動画生成AI「FramePack」。自宅のWindowsマシンにインストールして以来、RTX 4090で生成し続けています。最大2分間の一発生成も数回試してみて、わかったことがあります。
火曜日、ワシントンで行われたGoogleに対する反トラスト法裁判で、OpenAI幹部のニック・ターリー氏は、もしGoogleからChromeブラウザー事業が分割・売却されるならば、それを買収することに興味があると述べました。
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、AIモデルに「逆転裁判」をプレイさせて推論能力を調査した内容を取り上げます。
本日2本目のAI記事。ControlNet、WebUI Forge、Fooocusなど、画像生成AIソフトに多大な貢献をしてきたlllyasvielさんが、動画生成AIの新しいオープンソースソフト「FramePack」を公開しました。NVIDIA GPU専用ですが、WindowsとLinuxですぐに使えます。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第91回)では、複数の写真に写る被写体を1枚の写真に統合させる画像生成AI「UNO」や、1枚の写真から音声に応じた話す人物映像を作成するトーキングヘッド生成AI「FantasyTalking」を取り上げます。
オープンで高性能のHiDream-I1(サービス利用編)
OpenAIのChatGPT o3とo4-mini、o4-mini-highが投入されてすぐに試したのは、o3による音楽解析でした。その日のうちにもう1つ、試してみたので今回はそちらをご報告します。それは、写真分析です。
OpenAIがChatGPTのLLM(大規模言語モデル)の新モデル、o3とo4-mini、o4-mini、o4-mini-highを公開しました。現在ではPlus、Pro、Teamユーザーが使えます。
今回は、大規模言語モデル(LLM)が人間の本質をどのように捉えているかを調査した論文「Measurement of LLM’s Philosophies of Human Nature」を取り上げます。
一部ユーザーにのみ開放され、それ以外の人はウェイティングリストに登録するだけ……そんな状態が続いていたGoogleの動画生成AIサービス「Veo 2」が、Gemini Advancedでロールアウト開始しました。
テクノエッジ編集部は、AIグラビア、ゲームAI、音楽・動画AI、そしてヴァイブ・コーディングなど、生成AIの最新動向を解説するイベントを5月20日19時から開催します。
先週金曜日、シリコンバレー周辺の一部の横断歩道で、歩行者横断用のボタンを押すと信号待ちの間にイーロン・マスク氏やドナルド・トランプ大統領、マーク・ザッカーバーグ氏らのAI音声による小話が聞けるようになりました。地元紙Palo Alto Onlineによると、これは何者かが歩行者用ボタンをハッキングしたために起こった事案であるようです。
Xに搭載されているLLM(大規模言語モデル)のGrok(現在はGrok 3 beta)に、Edit Imageという画像編集機能が追加されました。
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第90回)では、写真内の人物をテキスト指示に応じたアニメーション映像を生成する動画AI「DreamActor-M1」や、テキストから映画級の人物映像を生成できる動画AI「MoCha」をご紹介します。
OpenAIはChatGPTの過去のチャット履歴全てを参照できるオプションの提供を始めました。
Google Cloudは、日本時間で今日(2025年4月10日)未明に開幕した「Google Cloud Next 2025」において、AIエージェントの開発を容易にするフレームワーク「Agent Development Kit」をオープンソースとして公開することを発表しました。
GoogleがA2A Protocolを発表しました。最近注目されているAIエージェントを複数動作させる場合の標準プロトコルを提唱するというものですが、これを見て、「30年前のあの技術の再発明か」と思ったのは私だけではないようです。
きのう完成させたばかりのミュージックビデオが早くも作り直しです。Take 2を公開しました。どうしてそうなったかというと、現在メインで使っている動画生成AIサービスのRunway Gen-4に新しく高速モードが登場したからです。
最近、曲を作りました。AIで。そのワークフローがいろいろなAIツールを少しずつ使っていく、ちょっと面白いものだったので、その流れを紹介しつつ、最近のAIツールについて紹介していければと思います。
今回は、アイデアを自然言語で入力するだけでブラウザ上でゲームやWebサイトを生成できる完全無料でオープンソースなヴァイブコーディングAI「DeepSite」を取り上げます。
AI動画生成を「25秒まで生成できます」「5フレーム分の画像から生成できます」というところが現れました。それがPikaです。
今回は別の記事を書いていたのですが、Midjourneyの新バージョンであるV7を試してみたらすごいことになっていたので急遽切り替えて、こちらをレポートすることにしました。
米国時間の4月1日、Mondayという新しいAIボイスがChatGPTに登場しました。
4月1日、iPhone、iPad、Mac、Apple Watch、そしてVision Proまでが一斉にアップデートされました。この大型アップデート最大のポイントは、日本でApple Intelligenceが使えるようになったことです。