この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第148回)は、テキスト生成を最大4倍高速化するGoogle開発のAIモデル「DiffusionGemma」や、1兆パラメータのコーディング特化AI「Kimi-K2.7-Code」を取り上げてます。
また、Qwen3.5やGemma 4を凌駕するコーディング向けAIモデル「North Mini Code」や、既存の衛星画像から地球を3D生成する中国アリババ開発のAI「ABot-Earth 0.5」をご紹介します。
そして、生成AIウィークリーの中でも特に興味深いAI技術や研究にスポットライトを当てる「生成AIクローズアップ」では、自分のパソコンでどのローカルLLMが快適にかつ賢く動くのか、その答えをコマンド一つで教えてくれるCLIツール「whichllm」を別の単体記事で取り上げています。
Google、テキスト生成を最大4倍高速化するモデル「DiffusionGemma」を公開
Googleは、テキスト生成を高速化するAIモデル「DiffusionGemma」をApache 2.0ライセンスで公開しました。
Gemma 4ファミリーをベースにした総パラメータ数260億(推論時アクティブ38億)のMoE(Mixture of Experts)モデルを採用しています。量子化すれば18GBのVRAMに収まるため、ハイエンドな消費者向けGPUでも動作します。
このモデルは従来のLLMで一般的な自己回帰型(トークンを一つずつ左から右へ生成する方式)とは異なり、画像生成などで使われる拡散技術をテキストに応用しています。
最大256トークンのテキストブロックを一度に同時生成するため、専用GPU上での推論スピードが最大4倍に向上し、NVIDIA GeForce RTX 5090では毎秒700トークン以上、H100では毎秒1000トークン以上の生成が可能です。




DiffusionGemma
Google Team
Blog | Hugging Face
1兆パラメータのコーディング特化AIモデル「Kimi-K2.7-Code」が無料・商用利用可能で登場
Moonshot AIは、コーディングに特化したエージェント型のAIモデル「Kimi-K2.7-Code」のオープンウェイトを公開しました。このモデルはKimi K2.6を基盤として構築されており、複雑なソフトウェアエンジニアリングのワークフローにおける、現実世界での長期的なコーディングタスクの遂行能力を強化しています。
アーキテクチャにはMoE(Mixture-of-Experts)を採用し、総パラメータ数は1兆、アクティブパラメータ数は320億、コンテキスト長は最大256Kです。
また、トークン効率も改善されており、K2.6と比較して思考プロセスにかかるトークンの消費量を約30%削減することに成功しました。さらにMoonViTによるビジョンエンコーダを備えており、テキストだけでなく画像や動画の入力にも対応しています。
各種ベンチマークテストにおいては、全体的なスコアでGPT-5.5やClaude Opus 4.8にはまだ及ばない項目が多いものの、前世代のK2.6から大幅な性能向上を果たしています。実際に、一部のエージェントタスク(MCP Mark Verified)ではClaude Opus 4.8を上回り、MLS Bench LiteではGPT-5.5に肉薄するなど、最先端のモデルに迫る高いパフォーマンスを示しています。
月間アクティブユーザー数が1億人を超える場合、または月間売上が2,000万米ドルを超える場合はクレジットが必要ですが、商用利用も可能です。


Kimi K2.7 Code
Moonshot AI
Hugging Face
Qwen3.5やGemma 4を凌駕するCohereのコーディング向けAIモデル「North Mini Code」
カナダのAIチーム「Cohere」は、コーディング向けAIモデル「North Mini Code」をApache 2.0ライセンスで公開しました。
このモデルは、300億パラメータ(アクティブパラメータ30億)のMoEアーキテクチャを採用しており、自律型エージェントのソフトウェアエンジニアリングタスクやターミナル操作、コード生成に特化して設計されています。
Artificial Analysisのコーディング指標においては33.4というスコアを記録し、Qwen3.5やGemma 4などの同規模モデルだけでなく、1000億パラメータを超える一部の大規模モデルをも凌駕する高い性能を示しています。






North Mini Code
Cohere
Blog | Hugging Face
既存の衛星画像から地球を3D化、中国アリババ開発の生成AI「ABot-Earth 0.5」
Alibaba GroupのAMAP CV Labは、衛星画像から広大な探索できる3D環境を生成するAIモデル「ABot-Earth 0.5」を発表しました。
これまで都市を3D化するには、飛行機などから斜めに撮影する写真測量(フォトグラメトリ)や、LiDARによるレーザースキャンが主に用いられておりコストと時間がかかっていました。
一方ABot-Earth 0.5は、すでに手に入る衛星画像だけを材料にして、1平方キロメートルあたり10分未満で新たな3Dシーンを合成することが可能です。
技術面では、写実的な表現に適した「3D Gaussian Splatting」(3DGS)をベースにしており、現実の都市データを用いて学習が行われています。そのため、建物の外観や植物などの複雑な構造も不自然にならずに再現できます。
また、詳細なデータを階層的に扱うLOD(Level of Detail)構造を標準で備えています。これにより、Webベースの地図エンジン上で、地球規模の広い視点からストリートレベルの視点まで、動きを止めることなくスムーズに拡大・縮小して閲覧することができます。
生成された3D環境は、単なる視覚的な地図としてだけでなく、シミュレーション空間としても活用できます。例えば、ドローンの自動航行や障害物回避など、AIの訓練環境として実世界に近い条件を提供します。




ABot-Earth 0.5: Generative 3D Earth Model
Ming Qian, Tianjian Ouyang, Mingchao Sun, Zijian Wang, Jincheng Xiong, Jiarong Han, Yongchang Zhang, Jiawei Zhang, Xu Wang, Yu Liu, Luyang Tang, Fei Yu, Zengye Ge, Mengmeng Du, Yuan Liu, Nianfei Fan, Song Wang, Yingliang Peng, Chunxue Jia, Yang Liu, Shiying Zeng, Haozhe Shi, Junnan Lai, Hongyu Pan, Zheng Wu, Ning Guo, Mu Xu, Hang Zhang
Project | Paper | GitHub










