OpenAIは、最新の生成AIモデル「GPT-5.2」を発表しました。このバージョンはサム・アルトマンCEOによる「Code Red宣言」で急遽開発の優先順位を変更し、ユーザー体験向上や「プロフェッショナルユース」で能力を発揮するようになっているとされます。
アルトマンCEOは、GoogleのGemini 3 Proが登場し、Googleの「Gemini 3 Pro」やAnthropicの「Claude Opus 4.5」が登場し、特にGeminiが生成AIランキングサイトLMArenaで6位から一躍トップに躍り出たことを受けて、Code Red宣言のメモを社内に配布しました。
Geminiがリリースして2週間後には、ChatGPTのユニークデイリーアクティブユーザー数(7日間平均)が6%も減少したことも指摘されており、最近、競合他社を凌駕すると豪語して1兆4000億ドル以上のインフラ契約を締結したばかりだったアルトマンCEOの胸の内で、市場の反応に対する危機感が高まったのかもしれません。
OpenAIの収益はその多くが依然として消費者向けサブスクリプションに頼っている状況ですが、最近この市場ではGoogleのGeminiがメキメキと力を増しています。
そんななかのCode Red宣言により、GPT-5.2の開発はそれまで進められていた広告導入などの取り組みを延期しするなど優先順位を転換し、エンタープライズ市場への進出を強化しようとしているようです。OpenAIは今週、企業における同社のAIツールの利用が過去1年間で飛躍的に増加したことを新たなデータを示して強調していました。
そんな状況もあり、GPT-5.2はOpenAIがリーダーシップを取り戻すための取り組みとなっています。OpenAIはコーディング、数学、科学、視覚認識、長文におけるコンテキスト推論、ツール操作において新たなベンチマークスコアを樹立したと発表し、この結果から、より信頼性の高い自律型ワークフロー、実運用レベルのコード、大規模な文脈や実世界データにわたって動作する複雑なシステム」が実現可能だと主張しました。
これらはGemini 3のDeep Thinkモードと直接競合するもので、OpenAIが独自に行ったベンチマークによれば、GPT-5.2 Thinkingは、実世界のソフトウェアエンジニアリングタスク(SWE-Bench Pro)や博士レベルの科学知識(GPQA Diamond)、抽象的推論やパターン発見(ARC-AGI suite)に至るまで、ほぼすべての推論テストにおいて、Gemini 3やAnthropicのClaude Opus 4.5をわずかながら上回るとされています。
また、OpenAIのプロダクトリーダーであるマックス・シュワルツァー氏は、GPT-5.2が「コード生成とデバッグに大幅な改善をもたらし」複雑な数学とロジックを段階的に実行できると述べました。さらに、シュワルツァー氏はコーディング以外でも、GPT-5.2は思考応答において前モデルよりもエラーが38%少ななり、日常的な意思決定、調査、執筆においても信頼性が高くたとしています。
OpenAIは再びAIモデルにおける推論モデルの強化に注力しているようですが、これはAI企業にとってリスクでもあります。ThinkingモードとDeep Researchモードと呼ばれるモードは非常に多くの計算リソースを消費し、当然ながら標準的なチャットボットよりも運用コストが上昇します。
GPT-5.2でこの種のモデルに注力することで、OpenAIはさらにコスト高な運営状態になりつつあります。それでなくともOpenAIは以前公表していたよりも多くの費用を計算のために費やしていると報じられており、TechCrunchは先月、OpenAIが訓練済みのAIモデルを実行するためのコンピューティング費用の大部分を現金決済としていることを指摘し、この数字がOpenAIが収益よりも推論コストに多く支出している(つまりモデル運用では赤字である)可能性を示唆していると報じていました。
GPT-5.2はInstant、Thinking、Proの3つのバージョンで提供されます。また少なくともしばらくの間はGPT-5.1も継続して提供するとのこと。有料ユーザーは、レガシーモデルセクションから旧バージョンを選択すれば、今後3ヶ月間はそれを引き続き使い続けられます。






