この1週間の気になる生成AI技術・研究をいくつかピックアップして解説する今回の「生成AIウィークリー」(第113回)は、AIの世界理解を向上させる大規模データセット「OmniWorld」や、アリババグループ開発のオープンソースAIエージェント「Tongyi DeepResearch」を取り上げます。
また、起業で成功する人かを予測するAI「VCBench」や、OpenAIが公開したChatGPTの利用実態レポートをご紹介します。
そして、生成AIウィークリーの中でも特に興味深いAI技術や研究にスポットライトを当てる「生成AIクローズアップ」では、自律型AIエージェントたちが自然発生的に始める新たな経済圏の未来と課題、その対策を提言したGoogleの研究を別の単体記事で取り上げています。
OpenAIのDeep Researchと同等性能のオープンソースAIエージェント「Tongyi DeepResearch」をアリババグループが開発
アリババのTongyi Labが発表した「Tongyi DeepResearch」は、OpenAIのDeep Researchと同等の性能を実現したオープンソースAIエージェントです。このモデルは、総計305億のパラメータを持ちながら、トークンごとにアクティブになるのは33億パラメータのみという効率的な設計となっています。
このプロジェクトでは、AIエージェントを作成するための開発方法も説明しています。エージェント型継続的事前学習から教師あり微調整、強化学習まで、トレーニングパイプライン全体で新しいデータ合成ソリューションを適用しています。特にAgentFounderという大規模データ合成システムにより、文書や知識グラフなどから質問回答ペアを自動生成できます。
モデルは128Kのコンテキスト長を持ち、プロンプトエンジニアリングなしで動作する「Native ReAct Mode」と、複雑で長いタスクでも高い推論品質を維持できる「Heavy Mode」をサポートしています。
Tongyi DeepResearchは、学術推論タスクのHLEで32.9点、複雑な情報検索のBrowseCompで43.4点など、様々なエージェント検索ベンチマークにおいて最先端のパフォーマンスを発揮しています。
実用面では、地図アプリ「Amap」と開発したAI「Xiao Gao」が複雑な旅行計画を自動作成したり、法律エージェント「FaRui」が判例検索から分析統合まで実行したりと、実世界での応用も期待されます。




Tongyi DeepResearch
Alibaba Tongyi Lab
GitHub | Blog | Hugging Face
AIの”世界理解”を向上させる大規模データセット「OmniWorld」が登場
上海AI研究所と浙江大学の研究チームが、4次元世界モデリング向けの大規模データセット「OmniWorld」を発表しました。このデータセットは、AIが物理世界の空間と時間の変化を理解し、シミュレーションする能力を向上させることを目的としています。
OmniWorldの中核となる「OmniWorld-Game」は、9万6000以上のクリップと1850万フレーム以上を含むデータセットです。これらは720Pの映像に加え、深度マップ、カメラポーズ、テキスト説明、オプティカルフロー、前景マスクなどのアノテーションが付与されています。
データセットは4つのドメインから構成されています。シミュレーター環境からの高精度データ、ロボット操作のシーケンス、人間の日常活動、そして実世界のストリートビュー映像を統合することで、現実世界の複雑さをカバーしています。合計で60万以上のビデオシーケンス、3億フレーム以上という前例のない規模を実現しました。
既存のモデルをOmniWorldでファインチューニングを行った結果、複数のモデルで顕著な性能向上が確認されました。DUSt3Rは単眼深度推定で大幅な改善を示し、AC3Dはカメラ制御の精度とビデオ品質の両方で向上しました。これらの結果は、OmniWorldが効果的な訓練リソースとして機能することを実証しています。


OmniWorld: A Multi-Domain and Multi-Modal Dataset for 4D World Modeling
Yang Zhou, Yifan Wang, Jianjun Zhou, Wenzheng Chang, Haoyu Guo, Zizun Li, Kaijing Ma, Xinyue Li, Yating Wang, Haoyi Zhu, Mingyu Liu, Dingning Liu, Jiange Yang, Zhoujie Fu, Junyi Chen, Chunhua Shen, Jiangmiao Pang, Kaipeng Zhang, Tong He
Project | Paper | GitHub
起業で成功する人かを予測するAI「VCBench」はベンチャーキャピタルの専門家を上回る精度
オックスフォード大学とVela Researchの研究チームが、ベンチャーキャピタル分野で起業する創業者の成功を予測するベンチマーク「VCBench」を開発しました。
VCBenchには9,000人の匿名化された創業者プロフィールが含まれており、そのうち810人が成功者として分類されています。成功の定義は、企業が5億ドル以上でのエグジットやIPO、または5億ドル以上の資金調達を達成した場合とされています。
データはLinkedInとCrunchbaseから収集され、創業者名や企業名などの識別情報を削除する厳格な匿名化プロセスを経て、再識別率を92%削減することに成功しました。
9つの大規模言語モデル(LLM)による評価では、結果が得られました。GPT-4oが最高のF0.5スコア25.1%を達成し、その精度29.1%は市場インデックスの3.2倍の成績で、市場インデックスの2.9倍の成績を持つトップティアVC企業をも上回りました。DeepSeek-V3は59.1%という最高精度を示し、多くのAIモデルが人間の専門家を上回る成績を収めています。

VCBench: Benchmarking LLMs in Venture Capital
Rick Chen, Joseph Ternasky, Afriyie Samuel Kwesi, Ben Griffin, Aaron Ontoyin Yin, Zakari Salifu, Kelvin Amoaba, Xianling Mu, Fuat Alican, Yigit Ihlamur
Paper
OpenAI、ChatGPTの利用実態を公開。70%は仕事以外の目的で使用
OpenAIとハーバード大学の研究チームが、ChatGPT(2022年11月の公開から2025年7月まで)の利用実態を包括的に分析しました。分析の結果、2025年7月時点で週間アクティブユーザーは7億人を超え、1日26億通のメッセージが送信されていることがわかりました。
注目すべきは、利用の70%以上が仕事以外の目的であることです。最も多い用途は「実用的なガイダンス」「情報検索」「文章作成」の3つで、全体の約77%を占めます。プログラミング関連の利用は4.2%にとどまりました。
仕事関連では文章作成が40%を占め、その多くはユーザーが提供したテキストの編集や翻訳です。また、全メッセージの10%が教育や個別指導に関連しています。
利用者層では、初期は男性が80%でしたが、2025年6月には性別格差がほぼ解消されました。低中所得国での利用も急速に拡大しています。高学歴の専門職ほど仕事での利用が多く、ChatGPTは主に意思決定支援ツールとして価値を提供していることが明らかになりました。


How people are using ChatGPT
Aaron Chatterji, Thomas Cunningham, David J. Deming, Zoe Hitzig, Christopher Ong, Carl Yan Shan, Kevin Wadman
Paper | Blog