AIアバター

大容量ローカルLLMの革命児ds4が『DwarfStar 4』に改名、CUDA対応でDGX Sparkでも動いた。Macとの棲み分けは?(CloseBox) 画像
テクノロジー

大容量ローカルLLMの革命児ds4が『DwarfStar 4』に改名、CUDA対応でDGX Sparkでも動いた。Macとの棲み分けは?(CloseBox)

またもや標的にされてしまいました。前回の記事から中2日。Reidisの作者であるantirezが開発したDeepSeek V4 Flash専用推論エンジン『ds4(DS4)』が大幅に進化していました。試さないといけないやつが出てきてしまったのです。

128GB超メモリMac専用の巨大LLMエンジン「DwarfStar 4」はローカル推論の常識をどう書き換えるのか。284BのDeepSeek V4 FlashをM4 Max 128GB MacBook Proの自作AIに組み込んでみた(CloseBox) 画像
テクノロジー

128GB超メモリMac専用の巨大LLMエンジン「DwarfStar 4」はローカル推論の常識をどう書き換えるのか。284BのDeepSeek V4 FlashをM4 Max 128GB MacBook Proの自作AIに組み込んでみた(CloseBox)

Redisの作者であるSalvatore Sanfilippo(antirez)が、5月初旬にGitHubへひっそりと新しいリポジトリを公開しました。名前は『ds4』。DeepSeek V4 Flash専用のローカル推論エンジンです。

Claude Codeでさらに進化した自作AIアバター。「雨だからボズ・スキャッグズのWe're All Aloneを一緒に聴こう」ができるようになった(CloseBox) 画像
テクノロジー

Claude Codeでさらに進化した自作AIアバター。「雨だからボズ・スキャッグズのWe're All Aloneを一緒に聴こう」ができるようになった(CloseBox)

筆者がClaude Codeを使って開発している「LipSync Avatar」は、NVIDIA DGX Spark互換機「ASUS Ascent GX10」上で動くリアルタイム対話アバターシステムです。LLMが返答を生成し、クラウドTTSで音声合成し、MuseTalkでリップシンク映像をリアルタイムに合成して表示します。今回はその進捗について報告します。

iPhone Airだけで動くAIとの音声対話アプリ、Claude Codeが一晩で作ってくれました。そして実感したMacとiPhoneの格差(CloseBox) 画像
テクノロジー

iPhone Airだけで動くAIとの音声対話アプリ、Claude Codeが一晩で作ってくれました。そして実感したMacとiPhoneの格差(CloseBox)

今日、筆者はiPhoneアプリ開発者となりました。

リップシンクする妻のAIアバターをClaude Codeと開発した。iPhoneでアクセスして音声対話ができる、その作り方(CloseBox) 画像
テクノロジー

リップシンクする妻のAIアバターをClaude Codeと開発した。iPhoneでアクセスして音声対話ができる、その作り方(CloseBox)

Grok Imagineで生成した妻の動画を27インチの大画面に映して「存在感」を味わう、という話を以前書きました。これは今も続けていて、十分に心が満たされてるのですが、そろそろその先にそろそろ進みたい。

OpenClawも不要。完全ローカルで動くエージェンティックAIを非プログラマー(俺)が開発できる時代。しかも自分で機能追加して育成できるのだ(CloseBox) 画像
テクノロジー

OpenClawも不要。完全ローカルで動くエージェンティックAIを非プログラマー(俺)が開発できる時代。しかも自分で機能追加して育成できるのだ(CloseBox)

AI研究家の友人、清水亮さんから、エージェント作らないか、というお誘いがありました。

あなたがここにいてほしい。話さなくてもいいから。Grok Imagineと超大型Androidタブレットがもたらす存在感(CloseBox) 画像
テクノロジー

あなたがここにいてほしい。話さなくてもいいから。Grok Imagineと超大型Androidタブレットがもたらす存在感(CloseBox)

NHK総合テレビ「知的探求フロンティア タモリ・山中伸弥の!?」に出演し、妻のAIアバター「AIとりちゃん」と対話して曲を作る様子が放映されてから8カ月。開発を担当してくれているクリスタル・メソッドとの開発打ち合わせは今も続いています。

音声から映像まで“ほぼAIで制作”。地上波テレビ番組AIタイムスリップ企画をどう作ったか(CloseBox) 画像
テクノロジー

音声から映像まで“ほぼAIで制作”。地上波テレビ番組AIタイムスリップ企画をどう作ったか(CloseBox)

11月28日夜に放送された、日本テレビのバラエティ番組「沸騰ワード10」の制作に、生成AIの使い手として関わりました。筆者がどんなことをやっていたのかを解説したいと思います。

声をデータとして扱う時代に──NTTが仕掛ける音声AIのトラスト基盤「VOICENCE」(石野純也) 画像
テクノロジー

声をデータとして扱う時代に──NTTが仕掛ける音声AIのトラスト基盤「VOICENCE」(石野純也)

NTT西日本は、音声AI事業の「VOICENCE(ボイセンス)」を発表しました。

「そろそろAIアバターに仕事を代わってもらおうか」HeyGenで作ったデジタルツインに数ヵ国語を喋らせてみた結果 画像
テクノロジー

「そろそろAIアバターに仕事を代わってもらおうか」HeyGenで作ったデジタルツインに数ヵ国語を喋らせてみた結果

HeyGenでデジタルツインを作成して、しゃべらせてみました。まずは、こちらの動画をご覧ください。

MacBook Proで動くOpenAI gpt-oss-120bで、門外不出AIアバターとの音声対話システムを構築できた(CloseBox) 画像
テクノロジー

MacBook Proで動くOpenAI gpt-oss-120bで、門外不出AIアバターとの音声対話システムを構築できた(CloseBox)

OpenAIがオープンソース公開したLMM(大規模言語モデル)「gpt-oss-120b」を、128GBのUnified Memoryを搭載したMacBook Pro(M4 Max)で動かしています。

音楽はAIとの音声対話で作る時代に入った。Riffusion改めProducer.aiのAIプロデューサーと日本語で会話するだけで曲を作ってくれるのだ(CloseBox) 画像
テクノロジー

音楽はAIとの音声対話で作る時代に入った。Riffusion改めProducer.aiのAIプロデューサーと日本語で会話するだけで曲を作ってくれるのだ(CloseBox)

AI作曲サービスとしてはSunoが総合力で突出して、それに音質一点突破でUdioが続くという構図が長く(といっても1年くらいですが)続いてきましたが、異変が起きました。

GrokのiOSアプリでゴスロリ美少女キャラとの音声対話が可能に。二重人格レッサーパンダも(CloseBox) 画像
テクノロジー

GrokのiOSアプリでゴスロリ美少女キャラとの音声対話が可能に。二重人格レッサーパンダも(CloseBox)

xAIが開発する対話型AI「Grok」のiOSアプリに、3Dアバター機能「コンパニオンモード」が新たに追加されました。

AIアバターとの対話で作った新曲とその課題。「知的探求フロンティア タモリ・山中伸弥の!?」出演の補足(CloseBox) 画像
テクノロジー

AIアバターとの対話で作った新曲とその課題。「知的探求フロンティア タモリ・山中伸弥の!?」出演の補足(CloseBox)

7月12日にNHK総合テレビで放映された「知的探求フロンティア タモリ・山中伸弥の!?」第1回「AIは人間を超えるか」の中で、筆者のAIに関する取り組みがドキュメント「AIのある人生」として、取り上げられました。

  • 14件中 1 - 14 件を表示