この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第111回)は、まずTencentから2つの技術、小型の翻訳モデル「Hunyuan-MT」と1枚の画像から探索可能な3D世界を生成できる「HunyuanWorld-Voyager」をご紹介します。
また、生成AIが登場してから新卒雇用が減少している米国の就職事情を調査した研究や、宇宙からの微弱な信号を捉える観測装置の精度を大幅に向上させ、ブラックホールの衝突などをより詳しく研究できるようになったGoogle DeepMindのAI技術「Deep Loop Shaping」を取り上げます。
そして、生成AIウィークリーの中でも特に興味深いAI技術や研究にスポットライトを当てる「生成AIクローズアップ」では、OpenAIが大規模言語モデル(LLM)がなぜ事実と異なる情報「幻覚」(ハルシネーション)を自信満々に生成してしまうのか、その根本原因を明らかにした研究を別で単体記事として取り上げています。
1枚の画像から動き回れる3Dワールドを生成できるTencent開発のAIモデル「HunyuanWorld-Voyager」
Tencentの研究チームHunyuanが開発する「HunyuanWorld-Voyager」は、単一画像から探索可能な3D世界を生成するビデオ生成フレームワークです。例えば、部屋の写真を1枚撮影すれば、その写真から部屋全体を動き回れる3D空間を自動生成できます。
このモデルの特徴は、RGB画像と深度マップを同時に生成するアーキテクチャです。従来手法では部分的なRGB画像のみを条件として使用していたため、複雑な遮蔽関係において視覚的なアーティファクトが発生しやすいという問題がありました。Voyagerは深度情報を空間事前情報として活用することで、この問題を解決しています。
訓練には10万以上のビデオクリップが使用され、独自のデータエンジンが自動的にカメラパラメータと深度を推定します。VGGTによる初期推定、MoGEによる精度向上、Metric3Dによるスケール調整という3段階のプロセスにより、多様なソースからの高品質な訓練データ生成を実現しています。
性能評価では、RealEstate10Kデータセットで優れた数値を記録し、ViewCrafterやSee3Dなどの既存手法を全指標で上回りました。WorldScoreベンチマークでも高得点を獲得し、特にカメラ制御精度と3D一貫性で高い評価を得ています。



小型の翻訳モデル「Hunyuan-MT」をTencentが発表。GPT-4.1やGemini-2.5-Proなどの大型モデルに匹敵する品質
Tencentの研究チームHunyuanが、機械翻訳モデル「Hunyuan-MT-7B」をオープンソースとして発表しました。このモデルは、70億パラメータという比較的コンパクトなサイズながら、GPT-4.1やGemini-2.5-Pro、Claude-Sonnet-4といった大規模言語モデルに匹敵する翻訳品質を実現しています。
このモデルは33言語間の双方向翻訳に対応し、特に中国語と少数民族言語(チベット語、モンゴル語、ウイグル語、カザフ語)間の翻訳で既存モデルを大幅に上回る成果を示しています。WMT2025の共有タスクでは31言語ペアのうち30で第1位を獲得しました。
技術的には5段階の訓練フレームワーク(一般事前学習、翻訳特化事前学習、教師あり微調整、強化学習、弱から強への強化学習)を採用しています。評価実験では、FLORES-200ベンチマークで高いスコアを記録し、大規模モデルを超える結果となりました。
実際の翻訳例では、中国のソーシャルメディア用語「小紅薯」を正しく「REDnote」と訳すなど、文化的文脈やスラングの理解に優れています。また、Hunyuan-MT-Chimera-7Bは複数の翻訳候補を統合して最適な翻訳を生成するアプローチを採用しています。

新しいブラックホールを見つけるのに役立つGoogle開発のAI「Deep Loop Shaping」
Google DeepMindはカリフォルニア工科大学が運営する「LIGO」(レーザー干渉計重力波観測所)およびグランサッソ科学研究所(GSSI)と共同で、重力波観測所の制御精度を飛躍的に向上させるAI「Deep Loop Shaping」を開発しました。
重力波は、ブラックホールの合体や中性子星の衝突といった宇宙の巨大な現象によって生じる時空のさざ波です。「LIGO」は、4キロメートル離れた鏡の間でレーザー光を反射させ、その干渉パターンからこの微細な波動を検出します。
測定精度は陽子の1万分の1という極めて高い水準が求められ、100マイル離れた海岸の波でさえも測定に影響を与えるほど繊細な装置です。
Deep Loop Shapingは、強化学習を用いてLIGOのフィードバック制御システムを最適化します。従来の制御方法では、振動を抑えようとすると逆にノイズが増幅されるという問題がありましたが、新手法はこの制御ノイズを30倍から100倍削減することに成功しました。これにより、最も不安定で困難だった制御ループが初めて意味のあるノイズ源ではなくなりました。
この技術により、新たな重力波イベントをより詳細に観測できるようになると期待されています。特に、銀河進化の解明に重要な中間質量ブラックホールの観測能力が向上します。


Improving cosmological reach of a gravitational wave observatory using Deep Loop Shaping
Jonas Buchli et al.
Paper | Blog
“生成AIのせい”で新卒雇用が減少、35歳以上の熟練者は安泰。経験で培われる「暗黙知」はAIで代替できない
スタンフォード大学の最新研究によると、生成AIの普及により米国の若年労働者の雇用が大幅に減少していることが判明しました。
研究チームは、米国最大の給与計算ソフトウェア企業であるADPの大規模な管理データを活用し、数百万人の労働者と数万社の企業を対象に、AIが雇用に与える影響を詳細に分析した。
分析の結果、2022年11月のChatGPT登場以降、ソフトウェア開発者やカスタマーサービス担当者など、AIの影響を受けやすい職業において22-25歳の若年労働者の雇用が13%減少したことを発見しました。
一方で、同じ職業でも経験豊富な労働者の雇用は安定しているか、むしろ増加傾向にあります。ソフトウェア開発職では若年労働者は約20%の減少が見られた一方、35歳以上の熟練労働者の雇用は増加を続けています。
この現象の背後にある理由として、研究者たちは、AIが主に教科書的な知識、つまり正規教育で学ぶ「体系化された知識」を代替する傾向があることを指摘しています。対照的に、熟練労働者が持つ長年の経験から蓄積された「暗黙知」は、AIによる代替がより困難であるとしています。

Canaries in the Coal Mine? Six Facts about the Recent Employment Effects of Artificial Intelligence
Erik Brynjolfsson, Bharat Chandar, Ruyu Chen
Paper | Blog