AI | テクノエッジ TechnoEdge

テクノロジー 2024 Aug 8

高性能すぎて本人証明がないと買えないAIボイチェン「Vocoflex」製品版登場。無限声色ボーカルはAI DTMに欠かせない存在に（CloseBox）

しばらくベータテスターをしていた、DreamtonicsのAIボイスチェンジャー「Vocoflex」。その製品版がついにリリースされたので、購入しました。

松尾公也

テクノロジー 2024 Aug 5

Google、批判受けGemini AIのオリンピックCMを放送中止。なんでも相談して怒られる

Google は、批判を受けていたGemini AIのコマーシャル『Google + Team USA − Dear Sydney』を放送から取り下げました。

Ittousai

テクノロジー 2024 Aug 5

元Stable Diffusion開発チームによる高性能画像生成AI「FLUX.1」、Perplexity精度のオープンソース検索AI「MindSearch」など生成AI技術5つを解説（生成AIウィークリー）

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」（第58回）では、先日OpenAIが発表した「SearchGPT」など、Webのタイムリーな情報と大規模言語モデルを組みわせた検索AIのオープンソースモデル「MindSearch」や、Stability AIが発表した、単一の入力画像から3Dメッシュを0.5秒で生成する「Stable Fast 3D」を取り上げます。

山下裕毅（Seamless）

テクノロジー 2024 Aug 1

1枚の人物写真から動画生成できる、4つの最新AIモデルを比較。Luma、Runway、KLING、Viduの結局どれがいい？（CloseBox）

1枚の人物画像から動画を生成するAIモデルが4種類、揃いました。Luma AI Dream Machine、Runway Gen-3 Alpha、KLING、Vidu。これらを同じ人物写真（画像）、同じプロンプトで比較してみます。

松尾公也

テクノロジー 2024 Jul 31

Google、生成AIがアプリUIを動的生成する「AI Generated UI」発表。ユーザー入力をLLMが把握、レイアウトもロジックも都度生成

基本的に、アプリケーションのユーザーインターエイス（UI）は開発時に設計され実装されて、その実装通りに実行時に表示されるものです。

新野淳一

テクノロジー 2024 Jul 31

高性能動画生成AI「Vidu」の実力を試す。Character to Videoとは何か。KLINGやRunwayとはどこが違うのか（CloseBox）

KLINGのサブスクリプションが開始されたばかりですが、翌日の7月31日に早くもライバルが登場しました。同じく中国の動画生成AIサービスで、「Vidu」というものです。といってもぽっと出ではなく、4月末辺りからSoraクラスの動画生成AIとして発表され、注目はされていました。このViduが一般利用可能になったのです。

松尾公也

テクノロジー 2024 Jul 30

Runway Gen-3でImage to Videoとリップシンク生成可能に。これは現時点最強のAI動画モデルなのか？（CloseBox）

7月30日、動画生成AIサービスの老舗であるRunwayが、最新モデルであるGen-3 AlphaでImage to Videoを使えるようにしました。

松尾公也

テクノロジー 2024 Jul 30

生成AIグラビアをグラビアカメラマンが作るとどうなる？第29回：知ってるとちょっと便利かも？なカスタムNode・ワークフロー特集(西川和久)

1つ何役？controlnet-union-sdxl-1.0

西川和久

テクノロジー 2024 Jul 29

世界一斉ブルースクリーン事件などを語るポッドキャスト第63回を本日（7月29日）正午にライブ配信

テクノエッジ編集部では、「TechnoEdge-Side」（テクノエッジ・サイド）を2週に1回のペースでお届けしています。その第62回放送を、本日（7月29日）正午（12時）に、YouTubeで行います。

テクノエッジ編集部

テクノロジー 2024 Jul 29

AIが量産するデータで何度も学習するAIは「モデル崩壊」する研究結果、SD級の大型画像生成AIを「約29万円」「2.6日」の高コスパで訓練できるSonyAI開発「MicroDiT」など生成AI技術5つを解説（生成AIウィークリー）

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」（第57回）では、生成AIが生成したコンテンツを生成AIが学習し続けると性能低下が見られ、モデル崩壊が起きるという研究報告を取り上げます。また、Sony AIが大型の画像生成AI（11.6億パラメータ）の訓練を8台のNVIDIA H100 GPUを使用してわずか2.6日で完了し、しかもそれが約29万円という高いコストパフォーマンスを達成した手法「MicroDiT」をご紹介します。

山下裕毅（Seamless）

ガジェット 2024 Jul 29

人物Image to Videoの進化がすごい。Luma、Runway、KLING、HeyGenの最新動画生成AIをVision Proの空間ミュージックビデオで見る（CloseBox）

動画生成AIはわずか1カ月ちょっとで急激な進化を遂げました。この期間の進化を、人物Image to Videoに絞ってまとめてみます。

松尾公也

テクノロジー 2024 Jul 26

AI作曲UdioとChatGPTで甦る昭和歌謡。1973年のヒット曲とカラオケ本人映像をAIで捏造した（CloseBox）

音質が爆上がりして長さも2分10秒と完成曲が作りやすくなったUdio。1970年代初期のバラード（ユーミンとか）を作ろうと思ってやってみたら、なぜか昭和歌謡っぽいものを連発してきました。

松尾公也

テクノロジー 2024 Jul 25

AI作曲サービスのSunoとUdioが相次いでステム分離機能搭載。Udioは待望の2分超え生成が可能に（CloseBox）

AI作曲サービスのSunoに、ステム分離機能が追加されました。翌日、Udioがステム分離を含む大幅な機能強化。

松尾公也

テクノロジー 2024 Jul 24

アジア系に強い新世代動画生成AI「KLING」がやってきたので試した。実用性高く無料生成も可能、静止画KOLORSも使える（CloseBox）

Soraに匹敵する高品質の動画生成AIとして注目を浴びながら、中国の携帯電話番号が必須だったことから世界中の羨望を集めていた、KLINGが一般ユーザーも利用可能になりました。

松尾公也

テクノロジー 2024 Jul 23

無限ループ動画が簡単にできる。Luma AIのDream Machineが進化してまた楽しみが増えた（CloseBox）

ポストSoraというか、ビフォーSoraというか、新世代の動画生成AIも老舗であるRunway Gen-3登場以降、目新しいニュースがなかったのですが、Luma AIのDream Machineがちょっとした新機能を追加しました。

松尾公也

テクノロジー 2024 Jul 22

AIとの対話を長期記録してLLMの応答をパーソナライズする「Mem0」、オープンソースLLMを商用モデル精度で使用する方法など生成AI技術5つを解説（生成AIウィークリー）

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」（第56回）では、AIとユーザーの対話内容を長期記録し、LLMの応答をそのユーザーにパーソナライズしていくメモリ機能「Mem0」や、音声の理解に優れている大規模言語モデル「Qwen2-Audio」などを取り上げます。

山下裕毅（Seamless）

テクノロジー 2024 Jul 20

日本語は外国人話者にとって難しすぎるので、新しい簡易日本語「Japhalbet」をAIに作ってもらった（CloseBox）

AI研究家の清水亮さんが面白いことをやっています。「Lispっぽい記法で書けるけど他の言語に慣れた人にも使える言語」の処理系だそうです。

松尾公也

テクノロジー 2024 Jul 18

生成AIグラビアをグラビアカメラマンが作るとどうなる？第28回：SD3 Mediumその後と、KolorsなどポストSD的なtxt2imgモデルを試す(西川和久)

SD3 Mediumその後

西川和久

テクノロジー 2024 Jul 15

漫画の1コマから続く20コマ以上を作り出す物語生成AI「SEED-Story」、イラストの制作過程動画を生成するAI「PaintsUndo」など生成AI技術5つを解説（生成AIウィークリー）

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」（第55回）では、1枚の完成したイラスト絵を入力に、そのイラストの制作過程のタイムラプス動画を生成する「PaintsUndo」や、画像とテキストをペアにした1コマを入力に、続きの物語を生成する「SEED-Story」などを取り上げます。

山下裕毅（Seamless）

ガジェット 2024 Jul 10

Apple Intelligence対抗Google AIを搭載してカメラバーは丸く？　2カ月前倒しの8月13日「Made by Google」イベントで何が発表されるのか予想（Google Tales）

Googleは毎年、5月に開発者会議「Google I/O」を、10月にハードウェア発表イベント「Made by Google」を開催してきました。ところが今年は後者を8月13日に開催します。

佐藤由紀子

テクノロジー 2024 Jul 10

AIプログラミングにリミックス文化が？　Claude Artifacts生成物がページ公開できて自由な改変も可能に（CloseBox）

Claude ArtifactsにPublish Artifact、Remix Artifactという新機能が追加されました。

松尾公也

テクノロジー 2024 Jul 9

万能系Artifacts登場。「Poe Previews」ならGeminiもGPT-4もClaudeもAI共同開発者にできる（CloseBox）

このところプログラミングの楽しみを覚えて毎日Claude ArtifactsとChatGPT Artifactsで遊んでいる筆者ですが、またまた新しいツールに出会ってしまいました。

松尾公也

テクノロジー 2024 Jul 8

他人の顔でYouTuber？　写真内の顔を思うように動かして話をさせるAI「LivePortrait」を動画生成AI「KLING」開発元が発表など生成AI技術5つを解説（生成AIウィークリー）

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」（第54回）では、KLINGを開発した快手が、画像内のキャラクターの顔を自在に動かす技術「LivePortrait」を発表しました。

山下裕毅（Seamless）

テクノロジー 2024 Jul 8

ChatGPT Artifactsができた？　GPT-4oでもClaudeみたいな楽しいプロンプト開発ができるのだ（CloseBox）

大規模言語モデルのClaudeが送り出した新機能、Artifactsを使った記事が思いのほか好評のようですが、問題が一つ。使用量制限がかかってしまい、次のアクションまで数時間待たされることが頻発しているのです。

松尾公也

テクノロジー 2024 Jul 4

45年前の初代ウォークマンからiPod、iPhoneと進化した音楽リスニング体験。Suno AI公式アプリの登場でどう変わるか（CloseBox）

45年前に発売された革命的デバイス、ウォークマン。そのアニバーサリーにふさわしいエポックメイキングなアプリが登場しました。

松尾公也

テクノロジー 2024 Jul 2

生成AIグラビアをグラビアカメラマンが作るとどうなる？第27回：SD3 Mediumリリース！Part2(西川和久)

前回に引き続きStable Diffusion 3 Mediumの話

西川和久

テクノロジー 2024 Jul 2

現実と超現実を動画AIが描く「Gen-3 Alpha」にできること、できないこと。老舗Runwayが投入したSora世代の高性能動画生成AI（CloseBox）

動画生成AIでは老舗のRunwayがGen-3 Alphaを一般公開しました。使えるユーザーはStandardプラン以上。筆者はそれに該当しているので使ってみました。

松尾公也

テクノロジー 2024 Jul 1

ドラムマシン、シンセ、サンプラーがわずか数分で完成。非プログラマーなのにClaude + Artifactsのプロンプト開発が楽しすぎて限度超える（CloseBox）

ノンプログラマーな自分が、大規模言語モデル（LLM）の助力で、初めてまともに動くプログラムを完成させることができました。

松尾公也

テクノロジー 2024 Jul 1

AI生成の動画を“5倍以上長く”する拡張モデル「ExVideo」、無音動画に“それっぽい音”を挿入できる「FoleyCrafter」など生成AI技術5つを解説（生成AIウィークリー）

この1週間の気になる生成AI技術をピックアップして解説する「生成AIウィークリー」（第53回）では、生成する動画時間の延長や無音ビデオに適した音を生成するなど動画AIに関する内容が盛りだくさんです。

山下裕毅（Seamless）

テクノロジー 2024 Jun 28

Soraレベルの超高性能動画生成Luma AI「Dream Machine」が2枚の元絵指定できる「キーフレーム」機能追加。弱点の「別人化問題」がこれで解消するか、試してみた（CloseBox）

Soraレベルの超高性能動画生成AI、Luma AIの「Dream Machine」に新しい機能が投入されました。プロンプトでの指定以外に、2枚の参照画像を入力し、それを始点と終点にできる、ある意味モーフィング的な機能です。

松尾公也

テクノロジー 2024 Jun 26

米国の主要レコード会社がAI作曲サービスSunoとUdioを提訴。訴訟の根拠となったヒット曲再現プロンプトを検証してみる（CloseBox）

いずれ起きるかなと思っていた、米音楽業界団体からAI作曲サービスへの訴訟がついに来ました。

松尾公也

テクノロジー 2024 Jun 24

プロ作成モデルに匹敵する写真1枚→3Dモデル生成「Unique3D」、アーティストが丁寧に作ったようなポリゴンメッシュ生成「MeshAnything」など生成AI技術5つを解説（生成AIウィークリー）

この1週間の気になる生成AI技術をピックアップして解説する、生成AIウィークリー（第52回）では、オープンソースで成長する動画生成AI「Open-Sora」の新バージョンや、精度の伸び代が見込まれるAIによる3Dメッシュ生成分野から「Unique3D」と「MeshAnything」を取り上げます。

山下裕毅（Seamless）

テクノロジー 2024 Jun 20

WWDC24、Luma Dream Machineについて語るポッドキャスト第59回を配信（TechnoEdge-Side）

テクノエッジ編集部では、人気のテック系ポッドキャスト「backspace.fm」の中に「TechnoEdge-Side」（テクノエッジ・サイド）というチャンネルを設け、週1回のペースでお届けしています。

テクノエッジ編集部

テクノロジー 2024 Jun 19

新世代AIリップシンク対決。感情豊かで高速な「Hedra Character-1」とオープンソースだがNVIDIA GPU必須「Hallo」。どっちが使い物になるか試してみた結果（CloseBox）

オーディオに合わせたリップシンクができる新しい技術が登場しました。「Hedra」という、これまで聞いたことのないサービスです。

松尾公也

テクノロジー 2024 Jun 18

直感的コントロールも予告した話題の高性能動画AI、Luma AI「Dream Machine」、10秒以上の動画生成が可能になったので試してみた（CloseBox）

SoraやKLINGレベルの「今使える代替動画生成AIサービス」として登場したLuma AIの「Dream Machine」が機能追加のアップデートしました。従来の5秒からのExtend（延長）が可能になりました。

松尾公也

テクノロジー 2024 Jun 17

生成AIグラビアをグラビアカメラマンが作るとどうなる？第26回：ローカルで使えるSD3 Mediumリリース！実力を試す(西川和久)

ローカルPCで生成可能なStable Diffusion 3 Medium、遂に登場！

西川和久

テクノロジー 2024 Jun 17

WWDC24総括とLuma AIを語るポッドキャスト第59回を本日（6月17日）正午にライブ配信

テクノエッジ編集部では、「TechnoEdge-Side」（テクノエッジ・サイド）を週1回のペースでお届けしています。その第59回放送を、本日（6月17日）正午（12時）に、YouTubeで行います。

テクノエッジ編集部

テクノロジー 2024 Jun 17

画像内キャラに楽曲を歌わせる「Hallo」、“行列の掛け算なし”にLLMの開発が可能な「MatMul-Free LM」など重要論文5本を解説（生成AIウィークリー）

第51回の生成AIウィークリーでは、この1週間の興味深い生成AIに関する研究論文をピックアップし、解説します。特に注目したいのは、大規模言語モデル（LLM）の開発において、常識とされている行列乗算を排除するという「MatMul-Free LM」です。この研究は、GitHubにおいて2000件（執筆現在）のStarを獲得しており、注目されています。

山下裕毅（Seamless）

テクノロジー 2024 Jun 14

もうSoraは不要なのか。動画生成AIの新基準、Luma AI「Dream Machine」をサブスクしてわかった「ハリー・ポッターに出てくるような魔法」の使いこなし術（CloseBox）

テキストプロンプトからリアルな動きのある映像を生成できる動画生成AISora、KLINGが使えずにヤキモキしていた人々が大挙して押し寄せた「Luma Dream Machine」。このサービスの有償プランに申し込んで使ってみたので、その使い方のコツをお伝えします。

松尾公也

テクノロジー 2024 Jun 13

今そこにあるSora、現時点最高クラスの誰でも使える動画生成AI「Luma Dream Machine」が人気すぎて数時間の待ち行列（CloseBox）

今使えるSoraのライバルが登場しました。

松尾公也

テクノロジー 2024 Jun 13

短い演奏・歌を十数秒で4分の完成曲に。作曲AIが未完成曲をフィニッシュするSunoの新機能を試して見つけた黄金パターン（CloseBox）

オーディオをアップロードして、そこから曲を拡張していく機能がようやくSunoでも使えるようになりました。

松尾公也

テクノロジー 2024 Jun 12

Apple Intelligenceはどのように開発されたのか？　中核をなすオンデバイスAIモデルとPrivate Cloud Computeについて今わかっていること（CloseBox）

アップルが打ち出したAIフレームワーク「Apple Intelligence」ですが、個々の機能についてはわかるものの、全体像がつかみにくいものになっています。

松尾公也

AI

高性能すぎて本人証明がないと買えないAIボイチェン「Vocoflex」製品版登場。無限声色ボーカルはAI DTMに欠かせない存在に（CloseBox）

Google、批判受けGemini AIのオリンピックCMを放送中止。なんでも相談して怒られる

元Stable Diffusion開発チームによる高性能画像生成AI「FLUX.1」、Perplexity精度のオープンソース検索AI「MindSearch」など生成AI技術5つを解説（生成AIウィークリー）

1枚の人物写真から動画生成できる、4つの最新AIモデルを比較。Luma、Runway、KLING、Viduの結局どれがいい？（CloseBox）

Google、生成AIがアプリUIを動的生成する「AI Generated UI」発表。ユーザー入力をLLMが把握、レイアウトもロジックも都度生成

高性能動画生成AI「Vidu」の実力を試す。Character to Videoとは何か。KLINGやRunwayとはどこが違うのか（CloseBox）

Runway Gen-3でImage to Videoとリップシンク生成可能に。これは現時点最強のAI動画モデルなのか？（CloseBox）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第29回：知ってるとちょっと便利かも？なカスタムNode・ワークフロー特集(西川和久)

世界一斉ブルースクリーン事件などを語るポッドキャスト第63回を本日（7月29日）正午にライブ配信

AIが量産するデータで何度も学習するAIは「モデル崩壊」する研究結果、SD級の大型画像生成AIを「約29万円」「2.6日」の高コスパで訓練できるSonyAI開発「MicroDiT」など生成AI技術5つを解説（生成AIウィークリー）

人物Image to Videoの進化がすごい。Luma、Runway、KLING、HeyGenの最新動画生成AIをVision Proの空間ミュージックビデオで見る（CloseBox）

AI作曲UdioとChatGPTで甦る昭和歌謡。1973年のヒット曲とカラオケ本人映像をAIで捏造した（CloseBox）

AI作曲サービスのSunoとUdioが相次いでステム分離機能搭載。Udioは待望の2分超え生成が可能に（CloseBox）

アジア系に強い新世代動画生成AI「KLING」がやってきたので試した。実用性高く無料生成も可能、静止画KOLORSも使える（CloseBox）

無限ループ動画が簡単にできる。Luma AIのDream Machineが進化してまた楽しみが増えた（CloseBox）

AIとの対話を長期記録してLLMの応答をパーソナライズする「Mem0」、オープンソースLLMを商用モデル精度で使用する方法など生成AI技術5つを解説（生成AIウィークリー）

日本語は外国人話者にとって難しすぎるので、新しい簡易日本語「Japhalbet」をAIに作ってもらった（CloseBox）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第28回：SD3 Mediumその後と、KolorsなどポストSD的なtxt2imgモデルを試す(西川和久)

漫画の1コマから続く20コマ以上を作り出す物語生成AI「SEED-Story」、イラストの制作過程動画を生成するAI「PaintsUndo」など生成AI技術5つを解説（生成AIウィークリー）

Apple Intelligence対抗Google AIを搭載してカメラバーは丸く？ 2カ月前倒しの8月13日「Made by Google」イベントで何が発表されるのか予想（Google Tales）

AIプログラミングにリミックス文化が？ Claude Artifacts生成物がページ公開できて自由な改変も可能に（CloseBox）

万能系Artifacts登場。「Poe Previews」ならGeminiもGPT-4もClaudeもAI共同開発者にできる（CloseBox）

他人の顔でYouTuber？ 写真内の顔を思うように動かして話をさせるAI「LivePortrait」を動画生成AI「KLING」開発元が発表など生成AI技術5つを解説（生成AIウィークリー）

ChatGPT Artifactsができた？ GPT-4oでもClaudeみたいな楽しいプロンプト開発ができるのだ（CloseBox）

45年前の初代ウォークマンからiPod、iPhoneと進化した音楽リスニング体験。Suno AI公式アプリの登場でどう変わるか（CloseBox）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第27回：SD3 Mediumリリース！Part2(西川和久)

現実と超現実を動画AIが描く「Gen-3 Alpha」にできること、できないこと。老舗Runwayが投入したSora世代の高性能動画生成AI（CloseBox）

ドラムマシン、シンセ、サンプラーがわずか数分で完成。非プログラマーなのにClaude + Artifactsのプロンプト開発が楽しすぎて限度超える（CloseBox）

AI生成の動画を“5倍以上長く”する拡張モデル「ExVideo」、無音動画に“それっぽい音”を挿入できる「FoleyCrafter」など生成AI技術5つを解説（生成AIウィークリー）

Soraレベルの超高性能動画生成Luma AI「Dream Machine」が2枚の元絵指定できる「キーフレーム」機能追加。弱点の「別人化問題」がこれで解消するか、試してみた（CloseBox）

米国の主要レコード会社がAI作曲サービスSunoとUdioを提訴。訴訟の根拠となったヒット曲再現プロンプトを検証してみる（CloseBox）

プロ作成モデルに匹敵する写真1枚→3Dモデル生成「Unique3D」、アーティストが丁寧に作ったようなポリゴンメッシュ生成「MeshAnything」など生成AI技術5つを解説（生成AIウィークリー）

WWDC24、Luma Dream Machineについて語るポッドキャスト第59回を配信（TechnoEdge-Side）

新世代AIリップシンク対決。感情豊かで高速な「Hedra Character-1」とオープンソースだがNVIDIA GPU必須「Hallo」。どっちが使い物になるか試してみた結果（CloseBox）

直感的コントロールも予告した話題の高性能動画AI、Luma AI「Dream Machine」、10秒以上の動画生成が可能になったので試してみた（CloseBox）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第26回：ローカルで使えるSD3 Mediumリリース！実力を試す(西川和久)

WWDC24総括とLuma AIを語るポッドキャスト第59回を本日（6月17日）正午にライブ配信

画像内キャラに楽曲を歌わせる「Hallo」、“行列の掛け算なし”にLLMの開発が可能な「MatMul-Free LM」など重要論文5本を解説（生成AIウィークリー）

もうSoraは不要なのか。動画生成AIの新基準、Luma AI「Dream Machine」をサブスクしてわかった「ハリー・ポッターに出てくるような魔法」の使いこなし術（CloseBox）

今そこにあるSora、現時点最高クラスの誰でも使える動画生成AI「Luma Dream Machine」が人気すぎて数時間の待ち行列（CloseBox）

短い演奏・歌を十数秒で4分の完成曲に。作曲AIが未完成曲をフィニッシュするSunoの新機能を試して見つけた黄金パターン（CloseBox）

Apple Intelligenceはどのように開発されたのか？ 中核をなすオンデバイスAIモデルとPrivate Cloud Computeについて今わかっていること（CloseBox）

Apple Intelligence対抗Google AIを搭載してカメラバーは丸く？　2カ月前倒しの8月13日「Made by Google」イベントで何が発表されるのか予想（Google Tales）

AIプログラミングにリミックス文化が？　Claude Artifacts生成物がページ公開できて自由な改変も可能に（CloseBox）

他人の顔でYouTuber？　写真内の顔を思うように動かして話をさせるAI「LivePortrait」を動画生成AI「KLING」開発元が発表など生成AI技術5つを解説（生成AIウィークリー）

ChatGPT Artifactsができた？　GPT-4oでもClaudeみたいな楽しいプロンプト開発ができるのだ（CloseBox）

Apple Intelligenceはどのように開発されたのか？　中核をなすオンデバイスAIモデルとPrivate Cloud Computeについて今わかっていること（CloseBox）