テクノロジー

1000憶パラメータLLMをシングルCPUでローカル実行できる「bitnet.cpp 1.0」、新テキスト読み上げAI「F5-TTS」など生成AI技術6つを解説(生成AIウィークリー) 画像
AI

1000憶パラメータLLMをシングルCPUでローカル実行できる「bitnet.cpp 1.0」、新テキスト読み上げAI「F5-TTS」など生成AI技術6つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第68回)では、テキストを読み上げるTTSシステム「F5-TTS」や、会話AIモデル「Ichigo」を取り上げます。また、単一CPUでLLMで実行できる、Microsoftの1ビットLLM推論フレームワーク「bitnet.cpp 1.0」などをご紹介します。

ARグラス XREAL Air 2が赤だけ30%オフの台数限定「スペシャルレッドセール」 画像
Science

ARグラス XREAL Air 2が赤だけ30%オフの台数限定「スペシャルレッドセール」

ARグラスのXREAL が、本体色レッドのみ30%オフの台数限定セール「スペシャルレッドセール」を開始しました。

eスポーツと生成AIが融合したらどうなる? 画像生成AIのプロンプトで戦うアーケードゲーム「VS AI街頭對戰」世界大会決勝を審査して感じた未来(CloseBox) 画像
AI

eスポーツと生成AIが融合したらどうなる? 画像生成AIのプロンプトで戦うアーケードゲーム「VS AI街頭對戰」世界大会決勝を審査して感じた未来(CloseBox)

筆者は先日、今年二度目の台湾旅行をしてきました。前回は、自分の作品が台北当代芸術館(MOCA Taipei)の「Hello, Human!」に展示されるというのでその様子を見に行ったのですが、今回は台湾南部の大都市、高雄市で行われているTTXC(台湾技術文化展示会)に参加するためです。具体的には、TTXCの目玉展示の一つである、対戦型AIアーケードゲーム「VS AI街頭對戰」の世界大会決勝の審査員を務めるというのが目的でした。

グラミー受賞の超大物プロデューサーがAI作曲サービスSuno活用を宣言。ティンバランドによるAIツール支持は反AIに動く音楽業界を揺らすか(CloseBox) 画像
AI

グラミー受賞の超大物プロデューサーがAI作曲サービスSuno活用を宣言。ティンバランドによるAIツール支持は反AIに動く音楽業界を揺らすか(CloseBox)

主要音楽レーベルがAI作曲サービスのSunoとUdioを提訴したのが6月24日。それから4カ月が過ぎたタイミングで、Sunoがクリエイティブな方向からの反撃を仕掛けました。超大物プロデューサーが活用しているという事例です。

ノーベル化学賞受賞の「AlphaFold2」、精子と卵子が結びつく仕組みを新発見(生成AIクローズアップ) 画像
AI

ノーベル化学賞受賞の「AlphaFold2」、精子と卵子が結びつく仕組みを新発見(生成AIクローズアップ)

今年のノーベル化学賞を受賞した2人が開発に貢献したタンパク質構造AI予測ツール「AlphaFold」シリーズによって、精子と卵子の結合メカニズムを明らかにした論文「A conserved fertilization complex bridges sperm and egg in vertebrates」に注目します。

24時間AIハッカソン優勝チームインタビュー。AI活用のポイントやハッカソン挑戦者へのアドバイスを訊きました 画像
AI

24時間AIハッカソン優勝チームインタビュー。AI活用のポイントやハッカソン挑戦者へのアドバイスを訊きましたPR

PCパーツショップのドスパラの運営元であるサードウェーブが主催する「24時間AIハッカソン Powered by GALLERIA」。9月に東京大会が開催され、5月の大阪、7月の福岡と3大会の優勝チームが決まりました。

OpenAIの複数AIが協力するマルチエージェント用システム「Swarm」、商用利用可能なオープンな動画生成AI「Pyramid Flow」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

OpenAIの複数AIが協力するマルチエージェント用システム「Swarm」、商用利用可能なオープンな動画生成AI「Pyramid Flow」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第67回)では、商用利用可能なマルチモーダル大規模言語モデル「ARIA」と動画生成AI「Pyramid Flow」などを取り上げます。

撮影したもの全てを曲にできる、Suno AI iPhoneアプリが人生をサントラ化する(CloseBox) 画像
AI

撮影したもの全てを曲にできる、Suno AI iPhoneアプリが人生をサントラ化する(CloseBox)

Suno AIの公式iOSアプリに新機能「Scenes」が追加されました。Sunoのモバイルアプリは米国App Storeでしか公開されていませんが、米国App Store専用にしているiPhoneを使い、試してみました。

Adobe MAXの華、驚きの新技術・2024年の「Sneaks」をチェック(西田宗千佳) 画像
AI

Adobe MAXの華、驚きの新技術・2024年の「Sneaks」をチェック(西田宗千佳)

今年も、Adobeの年次イベント「Adobe MAX 2024」の取材に来ている。例年は米ロサンゼルス開催だったが、今年は米国東側のマイアミビーチでの開催である。

わずか10秒の元音声でもリアルな「なりきりボイチェン」できる無料ソフト『Seed-VC』は過去最高レベルの再現度か(CloseBox) 画像
AI

わずか10秒の元音声でもリアルな「なりきりボイチェン」できる無料ソフト『Seed-VC』は過去最高レベルの再現度か(CloseBox)

筆者はUTAUによる波形接続の時代から「その人の声になりきる」技術を試してきましたが、このほど、その中でも画期的と思える技術に出会いました。『Seed-VC』(Seed Voice Conversion)というオープンソースソフトです。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第34回:FLUX 1.1 [pro]出たけど… / 表情を自在に操るAdvanceLivePortrait (西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第34回:FLUX 1.1 [pro]出たけど… / 表情を自在に操るAdvanceLivePortrait (西川和久)

10月2日FLUX 1.1 [pro]発表!でも使用はAPIのみ

実写もAI動画も2秒だけ伸ばせるAdobe Premiere ProのAI新機能『生成拡張』を試したら、違和感がなさすぎて驚いた(CloseBox) 画像
AI

実写もAI動画も2秒だけ伸ばせるAdobe Premiere ProのAI新機能『生成拡張』を試したら、違和感がなさすぎて驚いた(CloseBox)

Adobe MAX 2024が始まりました。Sneak Previewについては西田宗千佳さんに速報を執筆いただいているところなのですが、生成AI機能が使えるようになった動画エディターのPremier Proのベータ版がすでに公開されていて試すことができたので、ファーストインプレッションを。

アドビ、動画生成AI『Firefly Video Model』ベータ提供開始。文章や画像を動画化・クリップ延長など、Premiere Pro等に組込み 画像
AI

アドビ、動画生成AI『Firefly Video Model』ベータ提供開始。文章や画像を動画化・クリップ延長など、Premiere Pro等に組込み

Adobe MAXイベントにあわせて、アドビが動画生成AIモデル『Adobe Firefly Video Model』のベータ提供開始を発表しました。

AIがRNA新種ウイルス7万以上を発見。中国の研究チームが新AIモデルLucaProtでサンプル分析(生成AIクローズアップ) 画像
AI

AIがRNA新種ウイルス7万以上を発見。中国の研究チームが新AIモデルLucaProtでサンプル分析(生成AIクローズアップ)

AIがRNAの未知なる領域を解析し、7万以上の新種ウイルスを発見した論文「Using artificial intelligence to document the hidden RNA virosphere」について。

日本人をうまく動かせる動画生成AI「Hailuo」が3日間無制限モード開放中。有償プランスタートに合わせ(CloseBox) 画像
AI

日本人をうまく動かせる動画生成AI「Hailuo」が3日間無制限モード開放中。有償プランスタートに合わせ(CloseBox)

中国製の動画生成AIサービス「Hailuo」の紹介をし、その中でサブスクリプションサービスが待たれる、と書いていましたが、意外なほど早くきました。本日(10月11日)スタートです。

テスラのマスク氏、自動運転ロボタクシー『サイバーキャブ』発表。20人乗れる『ロボバン』もサプライズ公開 画像
Mobility

テスラのマスク氏、自動運転ロボタクシー『サイバーキャブ』発表。20人乗れる『ロボバン』もサプライズ公開

テスラは日本時間10月11日に開催されたイベント「We, Robot」で2人乗りの自動運転ロボットカー「サイバーキャブ(Cybercab)」と、最大20人が乗れるという「ロボバン(Robovan)」を発表しました。

Appleの奥行き推定AI「Depth Pro」・Metaの動画生成AI「MovieGen」・日本語専用AIベンチ「JMMMU」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

Appleの奥行き推定AI「Depth Pro」・Metaの動画生成AI「MovieGen」・日本語専用AIベンチ「JMMMU」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第66回)では、日本語専用LLMベンチマーク「JMMMU」や、Appleの画像深度推定モデル「Depth Pro」を取り上げます。また、Metaが開発した動画生成AI「MovieGen」や、テキストや画像1枚から3Dコンテンツを生成する「Flex3D」をご紹介します。

Suno AIで80年代J-POP偽コンピを作ってみたけど、歌詞間違いのボツがつらい……いや、簡単に部分修正できるようになってるじゃないか(CloseBox) 画像
AI

Suno AIで80年代J-POP偽コンピを作ってみたけど、歌詞間違いのボツがつらい……いや、簡単に部分修正できるようになってるじゃないか(CloseBox)

これはすごいと話題になっていたYouTube動画。これに対抗しようとやってみました。

任天堂、目覚まし時計『Alarmo』(アラーモ)をサプライズ発売。ゼルダやマリオの楽曲内蔵、動きセンサで起床判定や二度寝防止 画像
Nintendo

任天堂、目覚まし時計『Alarmo』(アラーモ)をサプライズ発売。ゼルダやマリオの楽曲内蔵、動きセンサで起床判定や二度寝防止

任天堂が目覚まし時計『ニンテンドーサウンドクロック Alarmo』(アラーモ)を発売しました。

動画生成AIにまたもや新星。「Hailuo」は写真を6秒の動画にできて(今のところは)無料。かつ人物の一貫性に優れている(CloseBox) 画像
AI

動画生成AIにまたもや新星。「Hailuo」は写真を6秒の動画にできて(今のところは)無料。かつ人物の一貫性に優れている(CloseBox)

Image to Video、つまり静止画を短い動画にできる動画生成AIの新サービスが登場しました。中国の「Hailuo」(ハイルオ)がそれで、中国製動画生成AIとしては、KLING、Viduに次ぐ3番手となります。

マイクロソフト、『Halo』独自エンジン捨てUnreal Engine 5採用。新スタジオ Halo Studiosで複数の新作を開発中 画像
Science

マイクロソフト、『Halo』独自エンジン捨てUnreal Engine 5採用。新スタジオ Halo Studiosで複数の新作を開発中

マイクロソフトが看板ゲームシリーズのひとつ Halo を制作する新組織 Halo Studious の設立と、複数の新作を開発中であることを発表しました。

第三回AIアートグランプリ、一次審査通過10作品、絵画部門11作品決まる。最終審査会は11月9日 画像
AI

第三回AIアートグランプリ、一次審査通過10作品、絵画部門11作品決まる。最終審査会は11月9日

AIアート作品コンテスト「第三回AIアートグランプリ」の予選通過作品が決定しました。

トバログ鳥羽恒彰さんをゲストに迎え、ポッドキャスト第68回を本日(10月7日)正午にライブ配信 画像
スマートフォン

トバログ鳥羽恒彰さんをゲストに迎え、ポッドキャスト第68回を本日(10月7日)正午にライブ配信

テクノエッジ編集部では、「TechnoEdge-Side」(テクノエッジ・サイド)を2週に1回のペースでお届けしています。

スマートグラスで個人情報を「透視」。見ている相手のプライバシーデータをリアルタイムで表示する技術「I-XRAY」(生成AIクローズアップ) 画像
AI

スマートグラスで個人情報を「透視」。見ている相手のプライバシーデータをリアルタイムで表示する技術「I-XRAY」(生成AIクローズアップ)

今回は、スマートグラスに映る他人の顔から名前や住所などの個人情報を特定する技術を説明したドキュメント「I-XRAY: The AI Glasses That Reveal Anyone’s Personal Details—Home Address, Name, Phone Number, and More—Just from Looking at Them」に注目します。

生成AIグラビアをグラビアカメラマンが作るとどうなる?第33回:FLUX.1登場から約2ヶ月(西川和久) 画像
AI

生成AIグラビアをグラビアカメラマンが作るとどうなる?第33回:FLUX.1登場から約2ヶ月(西川和久)

FLUX.1登場から約2ヶ月経った現状

AIリップシンクのHedraが大幅機能アップの「Character-2」投入。AIミュージックビデオやAIポッドキャストが実用域に(CloseBox) 画像
AI

AIリップシンクのHedraが大幅機能アップの「Character-2」投入。AIミュージックビデオやAIポッドキャストが実用域に(CloseBox)

AIリップシンクサービスのHedraが新バージョン「Character-2」を公開したので使ってみました。

PDFを対話ポッドキャスト化するローカルAI「PDF2Audio」、キャラ1枚絵を滑らかに動かせる「MIMO」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

PDFを対話ポッドキャスト化するローカルAI「PDF2Audio」、キャラ1枚絵を滑らかに動かせる「MIMO」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する「生成AIウィークリー」(第66回)では、2つの新しいマルチモーダルモデル「Emu3」と「Molmo」を取り上げます。Emu3は拡散アーキテクチャを使用しないモデルで、Molmoは人間が画像を見て音声でラベル付けした独自データセットを使用したモデルです。

AI普及で人間の役割は「発想力」へ。東京24時間AIハッカソン 2024イベントリポート 画像
AI

AI普及で人間の役割は「発想力」へ。東京24時間AIハッカソン 2024イベントリポートPR

PCパーツショップのドスパラの運営元であるサードウェーブが主催する「24時間AIハッカソン Powered by GALLERIA」は9月14日から15日、「東京24時間AIハッカソン 2024」を開催しました。

AI編集画像・動画の「ニセ記憶」で人の記憶を上書きできるか? 200人を対象にMITが実験(生成AIクローズアップ) 画像
AI

AI編集画像・動画の「ニセ記憶」で人の記憶を上書きできるか? 200人を対象にMITが実験(生成AIクローズアップ)

今回は、AIで編集された画像や動画によって人間の記憶をどれだけニセの記憶に上書きできるかを調査した論文「Synthetic Human Memories: AI-Edited Images and Videos Can Implant False Memories and Distort Recollection」に注目します。

グラビアカメラマンがAI生成したグラビア写真をAIで動画化してみた。架空ゲームショウの謎コスプレもあるよ(西川和久&松尾公也) 画像
AI

グラビアカメラマンがAI生成したグラビア写真をAIで動画化してみた。架空ゲームショウの謎コスプレもあるよ(西川和久&松尾公也)

今回は、過去作った記事などのヘッダー画像+αから松尾氏に動画を作っていただくという、コラボ企画。元画像はSD 1.5、SDXL、SD3 Medium、そしてFLUX.1 [dev] が入り乱れての動画となる。

消される可能性あるデジタルコンテンツに『購入』は不当表示、所有でなく一時的アクセス権と明記義務付ける消費者保護法がカリフォルニア州で成立 画像
Other

消される可能性あるデジタルコンテンツに『購入』は不当表示、所有でなく一時的アクセス権と明記義務付ける消費者保護法がカリフォルニア州で成立

オンライン販売の実態を消費者に正確に伝え、権利を守る取り組みが進んでいます。

ViXion01Sがクラファン開始。可変焦点レンズで遠近対応のオートフォーカスアイウェア新モデル、サイバーすぎた見た目改善 画像
ウェアラブル

ViXion01Sがクラファン開始。可変焦点レンズで遠近対応のオートフォーカスアイウェア新モデル、サイバーすぎた見た目改善

『オートフォーカスアイウェア』のViXion株式会社が、新モデル ViXion01Sのクラウンドファンディングを開始しました。

人間のようなやり取りで話すローカル会話AI「Moshi」、10秒の話し声を既存楽曲のボーカルに変換できる音楽生成AI「Seed-Music」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

人間のようなやり取りで話すローカル会話AI「Moshi」、10秒の話し声を既存楽曲のボーカルに変換できる音楽生成AI「Seed-Music」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をピックアップして解説する「生成AIウィークリー」(第65回)では、対話スピードや会話中の割り込みの自然さなど、人間と話しているかのような会話ができるモデル「Moshi」や、ByteDanceが開発した音楽生成・編集モデル「Seed-Music」を取り上げます。

遅れに遅れたChatGPT高度な音声モードが公開開始されたので、AIパーソナリティーのポッドキャストを作ってみた(CloseBox) 画像
AI

遅れに遅れたChatGPT高度な音声モードが公開開始されたので、AIパーソナリティーのポッドキャストを作ってみた(CloseBox)

OpenAIがようやくAdvanced Voice Modeのロールアウトを始めました。

X / Twitter、ブロックしても相手は投稿が読めるよう仕様変更。イーロン・マスク氏がブロック廃止を進める理由 画像
Other

X / Twitter、ブロックしても相手は投稿が読めるよう仕様変更。イーロン・マスク氏がブロック廃止を進める理由

X / 旧Twitter のイーロン・マスク氏が、ブロック機能の仕様変更を告知しました。

「VR酔い」低減と順応には1時間の休憩が効果的「収まったら再開」は逆効果。ヤマハ発動機と慶應大・静岡大研究者ら発表 画像
Health

「VR酔い」低減と順応には1時間の休憩が効果的「収まったら再開」は逆効果。ヤマハ発動機と慶應大・静岡大研究者ら発表

静岡大学情報学部の宮崎真研究室は9月22日、ヤマハ発動機、慶應義塾大学との共同研究により、1時間の休憩を挟んで再度シミュレータを体験することで、シミュレータ酔いを低減できることを発見した、と発表した。

Googleの「私はロボットではありません」を100%突破するCAPTCHA解きAI登場。もう人間とボットを区別できない?(生成AIクローズアップ) 画像
AI

Googleの「私はロボットではありません」を100%突破するCAPTCHA解きAI登場。もう人間とボットを区別できない?(生成AIクローズアップ)

「私はロボットではありません」でお馴染みのGoogleが開発する「CAPTCHA」を突破するAIシステムを提案した論文「Breaking reCAPTCHAv2」を取り上げます。

ロータス 、未来のEVコンセプトカー『セオリー1』発表。F1や軽量スポーツのルーツと最新技術を融合、NVIDIA DRIVE採用 画像
Mobility

ロータス 、未来のEVコンセプトカー『セオリー1』発表。F1や軽量スポーツのルーツと最新技術を融合、NVIDIA DRIVE採用

スポーツカーメーカーのロータス・カーズは、そのデザインルーツに立ち返りつつ、未来的な技術を盛り込んだ電気スポーツカーコンセプト「Theory 1(セオリー1)」を発表しました。

元Appleのジョニー・アイブ、OpenAIサム・アルトマンとのAIデバイス開発を認める。年内に10億ドル規模の調達も 画像
AI

元Appleのジョニー・アイブ、OpenAIサム・アルトマンとのAIデバイス開発を認める。年内に10億ドル規模の調達も

元Appleで数多くの製品デザインを手掛けたジョニー・アイブが、OpenAIのサム・アルトマンと「AIデバイス」製品を開発していることを認めました。

AI動画生成もローカルマシンで動かす時代に。Image to Video含め生成し放題のCogVideoを一発インストールできるPinokioという選択肢(CloseBox) 画像
AI

AI動画生成もローカルマシンで動かす時代に。Image to Video含め生成し放題のCogVideoを一発インストールできるPinokioという選択肢(CloseBox)

話題のオープンソース動画生成AI「CogVideo」をローカルマシンに超簡単インストールできたのです。

世界初のPS5 Pro一般公開はTGS。SIEブースは 『モンハンワイルズ』など最新10作を試遊出展 画像
Science

世界初のPS5 Pro一般公開はTGS。SIEブースは 『モンハンワイルズ』など最新10作を試遊出展

プレイステーションブースではPS 5 Proの一般公開も実施。『FINAL FANTASY VII REBIRTH』『グランツーリスモ7』どちらかのタイトルを体験できます。

オープンワールドゲームを生成するAI「GameGen-O」、テキスト化を省き瞬時に応えるオープン音声AIモデル「LLaMA-Omni」など生成AI技術5つを解説(生成AIウィークリー) 画像
AI

オープンワールドゲームを生成するAI「GameGen-O」、テキスト化を省き瞬時に応えるオープン音声AIモデル「LLaMA-Omni」など生成AI技術5つを解説(生成AIウィークリー)

この1週間の気になる生成AI技術・研究をピックアップして解説する「生成AIウィークリー」(第64回)では、オープンソースな音声AI技術を2つ、AIと音声対話できる「LLaMA-Omni」と、テキストを読み上げる「Fish Speech V1.4」を取り上げます。