
eスポーツと生成AIが融合したらどうなる? 画像生成AIのプロンプトで戦うアーケードゲーム「VS AI街頭對戰」世界大会決勝を審査して感じた未来(CloseBox)
筆者は先日、今年二度目の台湾旅行をしてきました。前回は、自分の作品が台北当代芸術館(MOCA Taipei)の「Hello, Human!」に展示されるというのでその様子を見に行ったのですが、今回は台湾南部の大都市、高雄市で行われているTTXC(台湾技術文化展示会)に参加するためです。具体的には、TTXCの目玉展示の一つである、対戦型AIアーケードゲーム「VS AI街頭對戰」の世界大会決勝の審査員を務めるというのが目的でした。

グラミー受賞の超大物プロデューサーがAI作曲サービスSuno活用を宣言。ティンバランドによるAIツール支持は反AIに動く音楽業界を揺らすか(CloseBox)
主要音楽レーベルがAI作曲サービスのSunoとUdioを提訴したのが6月24日。それから4カ月が過ぎたタイミングで、Sunoがクリエイティブな方向からの反撃を仕掛けました。超大物プロデューサーが活用しているという事例です。

ノーベル化学賞受賞の「AlphaFold2」、精子と卵子が結びつく仕組みを新発見(生成AIクローズアップ)
今年のノーベル化学賞を受賞した2人が開発に貢献したタンパク質構造AI予測ツール「AlphaFold」シリーズによって、精子と卵子の結合メカニズムを明らかにした論文「A conserved fertilization complex bridges sperm and egg in vertebrates」に注目します。

OpenAIの複数AIが協力するマルチエージェント用システム「Swarm」、商用利用可能なオープンな動画生成AI「Pyramid Flow」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第67回)では、商用利用可能なマルチモーダル大規模言語モデル「ARIA」と動画生成AI「Pyramid Flow」などを取り上げます。

撮影したもの全てを曲にできる、Suno AI iPhoneアプリが人生をサントラ化する(CloseBox)
Suno AIの公式iOSアプリに新機能「Scenes」が追加されました。Sunoのモバイルアプリは米国App Storeでしか公開されていませんが、米国App Store専用にしているiPhoneを使い、試してみました。

わずか10秒の元音声でもリアルな「なりきりボイチェン」できる無料ソフト『Seed-VC』は過去最高レベルの再現度か(CloseBox)
筆者はUTAUによる波形接続の時代から「その人の声になりきる」技術を試してきましたが、このほど、その中でも画期的と思える技術に出会いました。『Seed-VC』(Seed Voice Conversion)というオープンソースソフトです。
![生成AIグラビアをグラビアカメラマンが作るとどうなる?第34回:FLUX 1.1 [pro]出たけど… / 表情を自在に操るAdvanceLivePortrait (西川和久) 画像](/imgs/p/I7E-tRhECAmbEbuwokhjFw2aqJSmlZSTkpGQ/20375.jpg)
生成AIグラビアをグラビアカメラマンが作るとどうなる?第34回:FLUX 1.1 [pro]出たけど… / 表情を自在に操るAdvanceLivePortrait (西川和久)
10月2日FLUX 1.1 [pro]発表!でも使用はAPIのみ

実写もAI動画も2秒だけ伸ばせるAdobe Premiere ProのAI新機能『生成拡張』を試したら、違和感がなさすぎて驚いた(CloseBox)
Adobe MAX 2024が始まりました。Sneak Previewについては西田宗千佳さんに速報を執筆いただいているところなのですが、生成AI機能が使えるようになった動画エディターのPremier Proのベータ版がすでに公開されていて試すことができたので、ファーストインプレッションを。

AIがRNA新種ウイルス7万以上を発見。中国の研究チームが新AIモデルLucaProtでサンプル分析(生成AIクローズアップ)
AIがRNAの未知なる領域を解析し、7万以上の新種ウイルスを発見した論文「Using artificial intelligence to document the hidden RNA virosphere」について。

日本人をうまく動かせる動画生成AI「Hailuo」が3日間無制限モード開放中。有償プランスタートに合わせ(CloseBox)
中国製の動画生成AIサービス「Hailuo」の紹介をし、その中でサブスクリプションサービスが待たれる、と書いていましたが、意外なほど早くきました。本日(10月11日)スタートです。

Appleの奥行き推定AI「Depth Pro」・Metaの動画生成AI「MovieGen」・日本語専用AIベンチ「JMMMU」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第66回)では、日本語専用LLMベンチマーク「JMMMU」や、Appleの画像深度推定モデル「Depth Pro」を取り上げます。また、Metaが開発した動画生成AI「MovieGen」や、テキストや画像1枚から3Dコンテンツを生成する「Flex3D」をご紹介します。

Suno AIで80年代J-POP偽コンピを作ってみたけど、歌詞間違いのボツがつらい……いや、簡単に部分修正できるようになってるじゃないか(CloseBox)
これはすごいと話題になっていたYouTube動画。これに対抗しようとやってみました。

動画生成AIにまたもや新星。「Hailuo」は写真を6秒の動画にできて(今のところは)無料。かつ人物の一貫性に優れている(CloseBox)
Image to Video、つまり静止画を短い動画にできる動画生成AIの新サービスが登場しました。中国の「Hailuo」(ハイルオ)がそれで、中国製動画生成AIとしては、KLING、Viduに次ぐ3番手となります。

第三回AIアートグランプリ、一次審査通過10作品、絵画部門11作品決まる。最終審査会は11月9日
AIアート作品コンテスト「第三回AIアートグランプリ」の予選通過作品が決定しました。

スマートグラスで個人情報を「透視」。見ている相手のプライバシーデータをリアルタイムで表示する技術「I-XRAY」(生成AIクローズアップ)
今回は、スマートグラスに映る他人の顔から名前や住所などの個人情報を特定する技術を説明したドキュメント「I-XRAY: The AI Glasses That Reveal Anyone’s Personal Details—Home Address, Name, Phone Number, and More—Just from Looking at Them」に注目します。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第33回:FLUX.1登場から約2ヶ月(西川和久)
FLUX.1登場から約2ヶ月経った現状

AIリップシンクのHedraが大幅機能アップの「Character-2」投入。AIミュージックビデオやAIポッドキャストが実用域に(CloseBox)
AIリップシンクサービスのHedraが新バージョン「Character-2」を公開したので使ってみました。

PDFを対話ポッドキャスト化するローカルAI「PDF2Audio」、キャラ1枚絵を滑らかに動かせる「MIMO」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第66回)では、2つの新しいマルチモーダルモデル「Emu3」と「Molmo」を取り上げます。Emu3は拡散アーキテクチャを使用しないモデルで、Molmoは人間が画像を見て音声でラベル付けした独自データセットを使用したモデルです。

AI普及で人間の役割は「発想力」へ。東京24時間AIハッカソン 2024イベントリポートPR
PCパーツショップのドスパラの運営元であるサードウェーブが主催する「24時間AIハッカソン Powered by GALLERIA」は9月14日から15日、「東京24時間AIハッカソン 2024」を開催しました。

AI編集画像・動画の「ニセ記憶」で人の記憶を上書きできるか? 200人を対象にMITが実験(生成AIクローズアップ)
今回は、AIで編集された画像や動画によって人間の記憶をどれだけニセの記憶に上書きできるかを調査した論文「Synthetic Human Memories: AI-Edited Images and Videos Can Implant False Memories and Distort Recollection」に注目します。

グラビアカメラマンがAI生成したグラビア写真をAIで動画化してみた。架空ゲームショウの謎コスプレもあるよ(西川和久&松尾公也)
今回は、過去作った記事などのヘッダー画像+αから松尾氏に動画を作っていただくという、コラボ企画。元画像はSD 1.5、SDXL、SD3 Medium、そしてFLUX.1 [dev] が入り乱れての動画となる。

Meta初のARメガネ「Orion」発表。70度の広視野角、視線認識や筋電リストバンドで操作
日本時間9月26日未明に開催されたMeta Connect 2024より。Metaは同社初となるARグラス「Orion」を発表しました。

人間のようなやり取りで話すローカル会話AI「Moshi」、10秒の話し声を既存楽曲のボーカルに変換できる音楽生成AI「Seed-Music」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をピックアップして解説する「生成AIウィークリー」(第65回)では、対話スピードや会話中の割り込みの自然さなど、人間と話しているかのような会話ができるモデル「Moshi」や、ByteDanceが開発した音楽生成・編集モデル「Seed-Music」を取り上げます。

遅れに遅れたChatGPT高度な音声モードが公開開始されたので、AIパーソナリティーのポッドキャストを作ってみた(CloseBox)
OpenAIがようやくAdvanced Voice Modeのロールアウトを始めました。

Googleの「私はロボットではありません」を100%突破するCAPTCHA解きAI登場。もう人間とボットを区別できない?(生成AIクローズアップ)
「私はロボットではありません」でお馴染みのGoogleが開発する「CAPTCHA」を突破するAIシステムを提案した論文「Breaking reCAPTCHAv2」を取り上げます。

AI動画生成もローカルマシンで動かす時代に。Image to Video含め生成し放題のCogVideoを一発インストールできるPinokioという選択肢(CloseBox)
話題のオープンソース動画生成AI「CogVideo」をローカルマシンに超簡単インストールできたのです。

オープンワールドゲームを生成するAI「GameGen-O」、テキスト化を省き瞬時に応えるオープン音声AIモデル「LLaMA-Omni」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をピックアップして解説する「生成AIウィークリー」(第64回)では、オープンソースな音声AI技術を2つ、AIと音声対話できる「LLaMA-Omni」と、テキストを読み上げる「Fish Speech V1.4」を取り上げます。

AI作曲のSunoがネガティブプロンプト「Exclude Styles」投入「この楽器や歌声いらない」ができて超便利(CloseBox)
Sunoが投入してきた新機能、ネガティブプロンプト「Exclude Styles」について解説します。

生まれた時にはこの世にいない「写真1枚だけの父親」がAIで動く姿を親父に見せた(CloseBox)
今年90歳になった僕の父は、自分の父親の記憶がありません。生まれた時には亡くなっていたからです。唯一残された写真をAIで動画にして見せてみました。

生成AIのハルシネーションは原理的に排除不能。不完全性定理など数学・計算機理論で説明 モデル改良や回避システムでも不可避とする論文(生成AIクローズアップ)
1週間の気になる生成AI技術・研究をピックアップして解説する連載「生成AIウィークリー」から、特に興味深い技術や研究にスポットライトを当てる生成AIクローズアップ。
今回は、大規模言語モデル(LLM)は自身が出力する「幻覚」(ハルシネーション)からは避けられない現象を指摘した論文「LLMs Will Always Hallucinate, and We Need to Live With This」に注目します。

AIがカバー曲を作れるように。Suno AI曲の音楽スタイルや歌詞を変えて新しいアレンジで(CloseBox)
作曲AIサービスのSunoが、新しい機能「Covers」を追加しました。楽曲のアレンジや歌詞を変えた「カバー曲」を作るためのものです。

一貫したキャラクターAI動画生成が超簡単に。LoRAいらず、参照画像1枚だけでいいなんて(CloseBox)
中国産動画生成AI「Vidu」に、Reference to Videoという新機能が加わりました。AI動画生成でObject Consistency、つまり対象物の一貫性を保つことが可能になったのです。

Apple Intelligenceをフル活用するならiPhone 16やApple Watch 10を買わないとダメ?(CloseBox)
今回のAppleの発表で気になるのは、「新製品は、Apple Intelligenceのために必要なものかどうか」です。

最高性能うたうオープンソースLLM「Reflection 70B」、動画生成AIでスーパーマリオのプレイ映像を生成する「MarioVGG」など生成AI技術6つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術・研究をピックアップして解説する「生成AIウィークリー」(第63回)では、GPT-4oやClaude 3.5 SonnetなどのクローズドLLMと同等以上の性能を謳うオープンソースLLM「Reflection 70B」や、画像生成AI「FLUX」をベースにした音楽生成AI「FluxMusic」などを取り上げます。

プロンプトで画像生成ストリートファイトするAIアーケードゲーム大会「VS AI街頭對戰」、台湾で世界大会決勝(CloseBox)
画像生成AIのプロンプト技を競う世界大会が10月、台湾で開催されます。

R18成人向け文章も生成できる高性能ローカルAI「Command R+」最新版登場、プレイ画面をリアタイで画像生成できるゲームエンジン「GameNGen」など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第62回)では、主要LLMでは制限がかかるような内容でも精度高く出力できるローカルLLM「Command R+」の最新バージョンや、論文などのドキュメントとチャットできるAIインタフェース「kotaemon」を取り上げます。

Suno酷似のAI作曲サービス「LoudMe」、課金サービス開始したが実態はSunoへの違法アクセスか(CloseBox)
AI音楽生成サービス「LoudMe」が、実はSunoから違法にアクセスしているという指摘が浮上。LoudMeはSunoの無料アカウントを利用し、無断で楽曲を生成しているとの情報が公開された。

NVIDIA他、長い動画を理解する視覚言語モデル『LongVILA』開発・画像とテキストを1つのモデルで統一する『Show-o』など生成AI技術5つを解説(生成AIウィークリー)
この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第61回)では、AIがAIエージェントを自動設計して改善を続けて進化するシステム「ADAS」や、NVIDIAの長時間動画を理解する「LongVILA」を取り上げます。

AIによる科学的発見を目指す「KAN 2.0」新星ニューラルネットワークアーキテクチャKANを科学に応用(生成AI論文ピックアップ)
この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第61回)では、AIがAIエージェントを自動設計して改善を続けて進化するシステム「ADAS」や、NVIDIAの長時間動画を理解する「LongVILA」を取り上げます。

Googleの新画像生成AI『ImageFX』が考える非実在日本アイドル史(1968~83)。超リアルだが全部偽物(CloseBox)
非常に高性能な画像生成AI「ImageFX(Imagen 3)」の登場です。

Meta Reality Labs、人の画像から姿勢や立体形状を高精度に理解するビジョンモデル「Sapiens」発表。3億枚以上の画像で学習(生成AI論文ピックアップ)
この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第61回)では、AIがAIエージェントを自動設計して改善を続けて進化するシステム「ADAS」や、NVIDIAの長時間動画を理解する「LongVILA」を取り上げます。

自律AIが自律AIを改良し続ける自動設計システム「ADAS」発表。手動設計を大幅に上回る性能
この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」(第61回)では、AIがAIエージェントを自動設計して改善を続けて進化するシステム「ADAS」や、NVIDIAの長時間動画を理解する「LongVILA」を取り上げます。