gpt-oss-20bを凌駕する軽量AI「GLM-4.7-Flash」、3秒の音声からボイスクローンを生成できて商用利用可の音声AI「Qwen3-TTS」、など生成AI技術5つを解説(生成AIウィークリー)
“ほぼ人間”のAI音声を複数話者で一括生成。日本語対応オープンソースTTS「Fish Audio S2」、単語レベルの感情制御も可(生成AIクローズアップ) 2枚目の写真・画像
テクノロジー
AI
編集部おすすめの記事
-
gpt-oss-20bを凌駕する軽量AI「GLM-4.7-Flash」、3秒の音声からボイスクローンを生成できて商用利用可の音声AI「Qwen3-TTS」、など生成AI技術5つを解説(生成AIウィークリー)
-
5秒の声から良質ボイスクローンを生成できるCPU動作の軽量ローカルAI「Pocket TTS」、AIにゲームで遊ばせたら別ジャンルでも能力が向上した研究など生成AI技術5つを解説(生成AIウィークリー)
-
複数話者ポッドキャストがAIだけでできるから、俺たちはもうお払い箱なの? 話題のVibeVoiceをインストールして試してみた(CloseBox)
-
コード全体を改良し続けるGoogleの自己進化型AI「AlphaEvolve」、写真内の照明を点灯させるGoogle開発AI「LightLab」など生成AI技術5つを解説(生成AIウィークリー)
-
動画内の人物を好きなキャラに変更できる動画AI「VACE」、3DビデオゲームをAIにプレイさせる「PORTAL」など生成AI技術5つを解説(生成AIウィークリー)
-
メールやサーバ権限などを与えた自律AIによる実環境2週間の大暴走実録、「情報漏洩」「DoS状態」「リソース大量消費」など11の失態発覚。生成AI技術5つを解説(生成AIウィークリー)
-
「わずか8GBのメモリ」MacBook Neo上に構築した完全オリジナルAIエージェントをさらに進化させる。音声対話、MVビジュアライザーを実装した(CloseBox)
