1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。
今回は、大規模言語モデル(LLM)を活用した都市シミュレーターを紹介した論文「CitySim: Modeling Urban Behaviors and City Dynamics with Large-Scale LLM-Driven Agent Simulation」を取り上げます。トヨタ自動車により設立された研究機関ウーブン・バイ・トヨタによる研究です。
都市環境における人間行動のモデル化は、社会科学、行動研究、都市計画において基本的な課題です。これまでの手法では、硬直的で手作業によるルールに依存していたため、微妙な意図や計画、適応的な行動をシミュレートする能力に限界がありました。
今回のシステム「CitySim」は、LLMが示す人間レベルの知能を活用することで、これらの課題に対処しています。
CitySimのAIエージェントは、必須活動、個人的な習慣、状況要因のバランスを取る再帰的な価値駆動型アプローチを使用して、現実的な日常スケジュールを生成します。長期的でリアルな シミュレーションを可能にするため、AIエージェントには信念、長期目標、ナビゲーション用の空間記憶が備わっています。
各AIエージェントは、過去の経験を記憶し、訪れた場所についての信念を形成・更新し、それに応じて将来の決定を適応させることができる時間的・空間的記憶を装備しています。

▲CitySimの概要
CitySimでは最大100万体のAIエージェントによるシミュレーションが可能ですが、今回の実験では東京都市圏で1000体のAIエージェント(GPT-4o-mini)を使用してシミュレーションが行われました。
その結果、CitySimは従来の手法と比較して、ミクロレベルでもマクロレベルでも実際の人間により近い行動を示すことが確認されました。例えば、実際の移動パターンを忠実に再現しており、通勤ピークと週末のレジャー活動のタイミングと振幅が合致していました。
CitySimのエージェントは高度な認知表現を持っています。ペルソナモジュールには、名前、年齢、性別、職業、収入、趣味、教育、世帯構成などの人口統計学的属性が含まれています。また、ビッグファイブ性格特性(開放性、誠実性、外向性、協調性、神経症傾向)も組み込まれており、各AIエージェントの行動パターンに影響を与えます。
記憶モジュールは時間的記憶、反省的記憶、空間的記憶の3つのコンポーネントで構成されています。時間的記憶は時系列で整理され、反省的記憶はエージェントの思考や態度を記録します。空間的記憶は訪問した場所に関する信念を維持し、カルマンフィルターを使用して更新されます。
ニーズモジュールは、空腹、エネルギー、安全、社会的つながりという4つの主要なニーズを追跡し、優先順位を付けます。これらのニーズスコアは時間とともに減衰し、AIエージェントの行動に影響を与えます。長期目標モジュールは、マズローの欲求階層説に基づいてAIエージェントの高レベルの願望の形成と修正をモデル化します。
計画モジュールでは、日々のスケジュールが時間ブロックへの再帰的分解を通じて生成されます。必須タスク(睡眠、仕事など)から始まり、中優先度のタスク(食事、衛生など)で残りの空きブロックを再帰的に埋めていきます。場所選択モジュールは、信念を考慮したモデルを使用して各活動の場所を決定します。
研究チームは、CitySimを使用して数万体のAIエージェントをモデル化し、群衆密度の推定、場所の人気予測、幸福度評価などの様々な現実世界のシナリオでの集団行動を評価する洞察に富んだ実験を実施しました。
渋谷地区での実験では、CitySimが実世界の群衆密度パターンを正確に再現できることが示されました。中央の交通結節点や主要商業通り沿いで最も高い密度を示し、実際の観測データと一致しました。

▲渋谷におけるシミュレーション(左)と現実世界(右)の群衆密度ヒートマップの比較
また、GoogleマップのレーティングデータとシミュレーションによるPOI(興味のある地点)訪問数を比較したところ、CitySimは正の相関を示しました。これは、CitySimが位置ベースのビジネス戦略のためのPOI人気予測の実用的なツールとしての可能性を示しています。
幸福度調査の実験では、1200人の実際の調査回答者と同じプロファイルでAIエージェントを初期化し、3週間のシミュレーション都市生活を行わせました。その後、同じ質問セットに回答させたところ、CitySimは従来のAIエージェントベースの手法を上回る精度を示しました。