LLM

テクノロジー 2026 Jan 23

5秒の声から良質ボイスクローンを生成できるCPU動作の軽量ローカルAI「Pocket TTS」、AIにゲームで遊ばせたら別ジャンルでも能力が向上した研究など生成AI技術5つを解説（生成AIウィークリー）

この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」（第128回）は、5秒の音声サンプルから話者の声を模倣できるオープンソース軽量モデル「Pocket TTS」や、画像から撮影場所を特定するAI技術「Thinking with Map」を取り上げます。

5秒の声から良質ボイスクローンを生成できるCPU動作の軽量ローカルAI「Pocket TTS」、AIにゲームで遊ばせたら別ジャンルでも能力が向上した研究など生成AI技術5つを解説（生成AIウィークリー）

Sora 2 Pro超えのローカル動画生成AI「LTX-2」登場、英語ネイティブでない研究者がAI利用で論文投稿数89%増など生成AI技術5つを解説（生成AIウィークリー）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第58回：大晦日に登場したQwen-Image-2512の実力は？（西川和久）

AI動画生成を最大200倍高速化する「TurboDiffusion」、映像で音声を分離するMeta開発のAI「SAM Audio」など生成AI技術5つを解説（生成AIウィークリー）

ポケモンバトルの最強AIはどれ？ Gemini 、GPT、Claude、DeepSeek、Grokが総当たり戦した結果（生成AIクローズアップ）

LLMを機能不全に追い込む新型DoS攻撃「ThinkTrap」、論文からコードを生成するAI「DeepCode」など生成AI技術5つを解説（生成AIウィークリー）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第57回：充実してきたZ-Image-Turboその後（西川和久）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第56回：2025年秋の陣Part 2は高速無検閲のZ-Image-Turbo（西川和久）

見破れないAIの嘘は脳波が見破る、全LLMが抱える未解決問題「デジタル健忘症」をGoogleが解決か、など生成AI技術5つを解説（生成AIウィークリー）

Sora/Veo超えうたうロシア製オープンソース動画AI、新たな幻覚を繰り返し生成して何度も怒られるAIの事情など生成AI技術5つを解説（生成AIウィークリー）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第55回：2025年秋の陣Part 1はFLUX.2 [dev]でローカル生成（西川和久）

「原神」を56分でクリアしたゲームAI「Lumine」、画像に秘密の500文字をこっそり埋め込める「S²LM」など生成AI技術5つを解説（生成AIウィークリー）

Google、推論能力強化の生成AIモデル最新版「Gemini 3」をリリース

再生中に動画内の人や物を好きに動かせるAdobeの編集AI「MotionStream」、イーロンの「Grokipedia」と「Wikipedia」は何が違うのか、など生成AI技術5つを解説（生成AIウィークリー）

AI普及で優秀な人の仕事は減り、能力の低い人の仕事が増えた？ LLMで「実力主義」が崩壊（生成AIクローズアップ）

GPT-5同等精度の軍事AI「EdgeRunner」はOpenAI gpt-oss-20bで構築、1万6000以上のAPIから必要ツールを選び実行する自律AI「DeepAgent」など生成AI技術5つを解説（生成AIウィークリー）

AIグラス Halliday レビュー。網膜投影ディスプレイに「先読み」AI、指輪操作ミライガジェットの実用性は？

Microsoftの1ビットLLM「BitNet」の進化版「BitNet Distillation」、既存マルチモーダルLLMで長文を画像化する効率的AI処理など生成AI技術5つを解説（生成AIウィークリー）

AIも脳が腐る。“Xの人気だが低俗な投稿”を見続けるとAIも品質が低下（生成AIクローズアップ）

“ほぼ無限”の動画をリアルタイムに理解できるAI「StreamingVLM」、1台のH100 GPUで320億パラメータのLLMを強化学習できる「QeRL」など生成AI技術5つを解説（生成AIウィークリー）

同じような答えを繰り返す“退屈なAI”が、プロンプトのわずかな工夫で多様性ある回答（生成AIクローズアップ）

巨大AIを打ち負かす、わずか700万パラメータの超小型AI「TRM」、著者自身が論文プレゼンする動画を自動生成するAI「PaperTalker」など生成AI技術5つを解説（生成AIウィークリー）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第52回：オープン画像生成AIが怒涛の登場果たした2025年9月（西川和久）

Sora 2がリアルな人物を固定できない問題。プロンプトオンリーメソッドはAPI開放で不要に？（CloseBox）

生成AIがゼロから完全なソフトリポジトリを開発するMicrosoftの「ZeroRepo」、細菌を殺すウイルスをAIが生成した世界初の研究など生成AI技術5つを解説（生成AIウィークリー）

生成AIグラビアをグラビアカメラマンが作るとどうなる？第51回：Qwen-Image旋風だった2025年8月まとめ（西川和久）

VC以上の目利きAI「VCBench」、OpenAIのDeep Researchと同等性能のオープンソースAIエージェント「Tongyi DeepResearch」など生成AI技術5つを解説（生成AIウィークリー）

AIに同じ質問をするとなぜ毎回違う答えなのか？ 元OpenAIチームが解明。毎回同じ返答をする新システムも開発など生成AI技術5つを解説（生成AIウィークリー）

ここは電波の届かない地下つけ麺屋。iPhone内蔵のApple純正スタンドアロンLLM「アシスタント」と暇つぶしチャットしてみた（CloseBox）

iOS 26始動。Apple IntelligenceのFoundation Modelとネット無接続でチャットしたら「iPhone純正LLM、意外とやるじゃん」（CloseBox）

“生成AIのせい”で新卒雇用は減るが代替できない経験を持つ熟練者は安泰、新しいブラックホールを見つけるGoogle開発AIなど生成AI技術5つを解説（生成AIウィークリー）

OpenAI、「幻覚」の根本原因と対策を解明。ハルシネーションは「難問に直面した学生と同じ」（生成AIクローズアップ）

GPT-5に迫る性能のオープンソースAIモデル「InternVL3.5」、4人会話の90分ポッドキャスト番組を生成できるAI「VibeVoice」、など生成AI技術5つを解説（生成AIウィークリー）

医療AI、ベンチマークは優秀なのになぜ現場で使えないのか？ スタンフォード大学が医療AIの不都合を暴く（生成AIクローズアップ）

あなたのスマホでgpt-oss-20bは動く？ iPhoneとAndroidでローカルLLM対決してみたら（CloseBox）

複数話者ポッドキャストがAIだけでできるから、俺たちはもうお払い箱なの？ 話題のVibeVoiceをインストールして試してみた（CloseBox）

患者の臓器9つそれぞれを自律AIで独立エージェント化→臓器間で連携させ未来の体内状態を高精度予測（生成AIクローズアップ）

音楽もAIエージェントに。新星作曲AI「Tunee」を試してみたら、マスタリング、展開に合わせた緻密なミュージックビデオまで自動で作っちゃう驚き。何より曲がいい（CloseBox）

どっちに有効？脆弱性突くハッカーとサイバーセキュリティ業界の双方でAI活用が浸透中

MacBook Proで動くOpenAI gpt-oss-120bで、門外不出AIアバターとの音声対話システムを構築できた（CloseBox）

“漢字”を正確に描画する生成AI「Qwen-Image」、5秒間の動画を4090なら21秒で生成するAI「FastWan」など生成AI技術5つを解説（生成AIウィークリー）

なぜ推論AIは深く考えているフリをするのか。CoTは真の思考か、それともパターン暗記か（生成AIクローズアップ）

ポケモンバトルの最強AIはどれ？　Gemini 、GPT、Claude、DeepSeek、Grokが総当たり戦した結果（生成AIクローズアップ）

AI普及で優秀な人の仕事は減り、能力の低い人の仕事が増えた？　LLMで「実力主義」が崩壊（生成AIクローズアップ）

AIに同じ質問をするとなぜ毎回違う答えなのか？　元OpenAIチームが解明。毎回同じ返答をする新システムも開発など生成AI技術5つを解説（生成AIウィークリー）

医療AI、ベンチマークは優秀なのになぜ現場で使えないのか？　スタンフォード大学が医療AIの不都合を暴く（生成AIクローズアップ）

あなたのスマホでgpt-oss-20bは動く？　iPhoneとAndroidでローカルLLM対決してみたら（CloseBox）

複数話者ポッドキャストがAIだけでできるから、俺たちはもうお払い箱なの？　話題のVibeVoiceをインストールして試してみた（CloseBox）