AI | テクノエッジ TechnoEdge

テクノロジー 2024 Jul 29

世界一斉ブルースクリーン事件などを語るポッドキャスト第63回を本日（7月29日）正午にライブ配信

テクノエッジ編集部では、「TechnoEdge-Side」（テクノエッジ・サイド）を2週に1回のペースでお届けしています。その第62回放送を、本日（7月29日）正午（12時）に、YouTubeで行います。

テクノエッジ編集部

テクノロジー 2024 Jul 29

AIが量産するデータで何度も学習するAIは「モデル崩壊」する研究結果、SD級の大型画像生成AIを「約29万円」「2.6日」の高コスパで訓練できるSonyAI開発「MicroDiT」など生成AI技術5つを解説（生成AIウィークリー）

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」（第57回）では、生成AIが生成したコンテンツを生成AIが学習し続けると性能低下が見られ、モデル崩壊が起きるという研究報告を取り上げます。また、Sony AIが大型の画像生成AI（11.6億パラメータ）の訓練を8台のNVIDIA H100 GPUを使用してわずか2.6日で完了し、しかもそれが約29万円という高いコストパフォーマンスを達成した手法「MicroDiT」をご紹介します。

山下（Seamless）

ガジェット 2024 Jul 29

人物Image to Videoの進化がすごい。Luma、Runway、KLING、HeyGenの最新動画生成AIをVision Proの空間ミュージックビデオで見る（CloseBox）

動画生成AIはわずか1カ月ちょっとで急激な進化を遂げました。この期間の進化を、人物Image to Videoに絞ってまとめてみます。

AI

世界一斉ブルースクリーン事件などを語るポッドキャスト第63回を本日（7月29日）正午にライブ配信

AIが量産するデータで何度も学習するAIは「モデル崩壊」する研究結果、SD級の大型画像生成AIを「約29万円」「2.6日」の高コスパで訓練できるSonyAI開発「MicroDiT」など生成AI技術5つを解説（生成AIウィークリー）

人物Image to Videoの進化がすごい。Luma、Runway、KLING、HeyGenの最新動画生成AIをVision Proの空間ミュージックビデオで見る（CloseBox）

AI作曲UdioとChatGPTで甦る昭和歌謡。1973年のヒット曲とカラオケ本人映像をAIで捏造した（CloseBox）

AI作曲サービスのSunoとUdioが相次いでステム分離機能搭載。Udioは待望の2分超え生成が可能に（CloseBox）

アジア系に強い新世代動画生成AI「KLING」がやってきたので試した。実用性高く無料生成も可能、静止画KOLORSも使える（CloseBox）

無限ループ動画が簡単にできる。Luma AIのDream Machineが進化してまた楽しみが増えた（CloseBox）

AIとの対話を長期記録してLLMの応答をパーソナライズする「Mem0」、オープンソースLLMを商用モデル精度で使用する方法など生成AI技術5つを解説（生成AIウィークリー）

日本語は外国人話者にとって難しすぎるので、新しい簡易日本語「Japhalbet」をAIに作ってもらった（CloseBox）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第28回：SD3 Mediumその後と、KolorsなどポストSD的なtxt2imgモデルを試す(西川和久)

漫画の1コマから続く20コマ以上を作り出す物語生成AI「SEED-Story」、イラストの制作過程動画を生成するAI「PaintsUndo」など生成AI技術5つを解説（生成AIウィークリー）

Apple Intelligence対抗Google AIを搭載してカメラバーは丸く？ 2カ月前倒しの8月13日「Made by Google」イベントで何が発表されるのか予想（Google Tales）

AIプログラミングにリミックス文化が？ Claude Artifacts生成物がページ公開できて自由な改変も可能に（CloseBox）

万能系Artifacts登場。「Poe Previews」ならGeminiもGPT-4もClaudeもAI共同開発者にできる（CloseBox）

他人の顔でYouTuber？ 写真内の顔を思うように動かして話をさせるAI「LivePortrait」を動画生成AI「KLING」開発元が発表など生成AI技術5つを解説（生成AIウィークリー）

ChatGPT Artifactsができた？ GPT-4oでもClaudeみたいな楽しいプロンプト開発ができるのだ（CloseBox）

45年前の初代ウォークマンからiPod、iPhoneと進化した音楽リスニング体験。Suno AI公式アプリの登場でどう変わるか（CloseBox）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第27回：SD3 Mediumリリース！Part2(西川和久)

現実と超現実を動画AIが描く「Gen-3 Alpha」にできること、できないこと。老舗Runwayが投入したSora世代の高性能動画生成AI（CloseBox）

ドラムマシン、シンセ、サンプラーがわずか数分で完成。非プログラマーなのにClaude + Artifactsのプロンプト開発が楽しすぎて限度超える（CloseBox）

AI生成の動画を“5倍以上長く”する拡張モデル「ExVideo」、無音動画に“それっぽい音”を挿入できる「FoleyCrafter」など生成AI技術5つを解説（生成AIウィークリー）

Soraレベルの超高性能動画生成Luma AI「Dream Machine」が2枚の元絵指定できる「キーフレーム」機能追加。弱点の「別人化問題」がこれで解消するか、試してみた（CloseBox）

米国の主要レコード会社がAI作曲サービスSunoとUdioを提訴。訴訟の根拠となったヒット曲再現プロンプトを検証してみる（CloseBox）

プロ作成モデルに匹敵する写真1枚→3Dモデル生成「Unique3D」、アーティストが丁寧に作ったようなポリゴンメッシュ生成「MeshAnything」など生成AI技術5つを解説（生成AIウィークリー）

WWDC24、Luma Dream Machineについて語るポッドキャスト第59回を配信（TechnoEdge-Side）

新世代AIリップシンク対決。感情豊かで高速な「Hedra Character-1」とオープンソースだがNVIDIA GPU必須「Hallo」。どっちが使い物になるか試してみた結果（CloseBox）

直感的コントロールも予告した話題の高性能動画AI、Luma AI「Dream Machine」、10秒以上の動画生成が可能になったので試してみた（CloseBox）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第26回：ローカルで使えるSD3 Mediumリリース！実力を試す(西川和久)

WWDC24総括とLuma AIを語るポッドキャスト第59回を本日（6月17日）正午にライブ配信

画像内キャラに楽曲を歌わせる「Hallo」、“行列の掛け算なし”にLLMの開発が可能な「MatMul-Free LM」など重要論文5本を解説（生成AIウィークリー）

もうSoraは不要なのか。動画生成AIの新基準、Luma AI「Dream Machine」をサブスクしてわかった「ハリー・ポッターに出てくるような魔法」の使いこなし術（CloseBox）

今そこにあるSora、現時点最高クラスの誰でも使える動画生成AI「Luma Dream Machine」が人気すぎて数時間の待ち行列（CloseBox）

短い演奏・歌を十数秒で4分の完成曲に。作曲AIが未完成曲をフィニッシュするSunoの新機能を試して見つけた黄金パターン（CloseBox）

Apple Intelligenceはどのように開発されたのか？ 中核をなすオンデバイスAIモデルとPrivate Cloud Computeについて今わかっていること（CloseBox）

手のひら投影AIデバイス「Humane Ai Pin」はGTP-4oとGemini両刀使い。アップデートされた使い勝手をチェックした

中国AIが加速。Soraに匹敵する中国の動画生成AI「KLING」、中国アリババの最新オープンLLM「Qwen 2」登場など生成AI関連技術5つを紹介（生成AIウィークリー）

AI作曲サービスのUdio、アップロードした音楽を前後に拡張できる新機能「Audio uploads」でSunoを出し抜く（CloseBox）

動画AIが豊作。アニメ絵2枚の間の“中割り”を生成し映像化するAI「ToonCrafter」、画像内キャラを滑らかに踊らせるAI「MusePose」など重要論文5本を解説（生成AIウィークリー）

AI作曲サービスは「長さ」の戦いに。Udioが2分10秒の生成に対応、Sunoは全ユーザーに4分生成を開放（CloseBox）

iOS 18ではAIがテキストメッセージからカスタム絵文字をその場で生成、Siriとのより自然な対話が実現する可能性あり？

マイクロソフトのCopilot+ PC戦略とは？ ポッドキャスト第56回を本日（5月27日）正午にライブ配信（TechnoEdge-Side）

“株”選びにGPT-4の利益予測は使えるのか？ “文学作品”を翻訳する複数AIが働く出版社「TransAgents」など重要論文5本を解説（生成AIウィークリー）

Apple Intelligence対抗Google AIを搭載してカメラバーは丸く？　2カ月前倒しの8月13日「Made by Google」イベントで何が発表されるのか予想（Google Tales）

AIプログラミングにリミックス文化が？　Claude Artifacts生成物がページ公開できて自由な改変も可能に（CloseBox）

他人の顔でYouTuber？　写真内の顔を思うように動かして話をさせるAI「LivePortrait」を動画生成AI「KLING」開発元が発表など生成AI技術5つを解説（生成AIウィークリー）

ChatGPT Artifactsができた？　GPT-4oでもClaudeみたいな楽しいプロンプト開発ができるのだ（CloseBox）

Apple Intelligenceはどのように開発されたのか？　中核をなすオンデバイスAIモデルとPrivate Cloud Computeについて今わかっていること（CloseBox）

マイクロソフトのCopilot+ PC戦略とは？　ポッドキャスト第56回を本日（5月27日）正午にライブ配信（TechnoEdge-Side）

“株”選びにGPT-4の利益予測は使えるのか？　“文学作品”を翻訳する複数AIが働く出版社「TransAgents」など重要論文5本を解説（生成AIウィークリー）