OpenAI、ChatGPT Images 2.0発表。「思考機能」備え画像出力の精度、一貫性、視覚的な整合性高める。日本語も上達

GPT-Image-1.5のリリースからわずか4か月後、OpenAIは新バージョンとなるChatGPT Images 2.0を発表しました。

以前のバージョンでは、1枚の画像内に長文のテキストブロックや複数のテキストパネルを配置したり、ウェブサイトのスクリーンショットをリアルに生成したり、ウェブを検索して得た情報を画像に盛り込んだりといった機能をユーザーに提供してきました。

今回公開されたChatGPT Images 2.0は「詳細な指示に従い、オブジェクトを正確に配置・関連付け、高密度なテキストを備え『意図的にデザインされたような』画像が生成可能になったとOpenAIは説明しています。

特にテキスト関連では日本語、韓国語、中国語、ヒンディー語、ベンガル語といった非ラテン文字の文章表現で「著しい進歩」を果たしており、正しく、また自然な流れでテキストを記述できるようになっています。

また、Images 2.0は画像モデルとして同社初の思考機能（thinking capabilities）を備えました。ChatGPTでこのモードを選択することで「ウェブからリアルタイム情報を検索し、1つのプロンプトから複数の異なる画像を作成し、自身の出力を二重チェックする」ことが可能になります。

そのほか、出力する画像はアスペクト比の選択肢が増えており、最大2K解像度で、一度に8枚までの出力に対応するようになっています。

OpenAIは、Images 2.0の良くなったところだけでなく、不得手な処理ケースについても述べています。

たとえば、折り紙やルービックキューブといったパズルの解説のような、隠れた面、傾斜した面、反転した面が正しく表示される必要がある詳細図などでは、表現に破綻が起きる可能性があります。図面におけるラベルや矢印の表示など、特に正確性が求められるケースにおいても、出力後の確認が必要になるとしており、これらについては今後の課題だとしました。

OpenAIは、従来モデルからChatGPT Images 2.0への移行を「ツール」から「ビジュアルシステム」への進化だと述べました。そして、これにより人々がアイデアを理解し、共有し、教え、発展させることができる成果物へと変換するのを支援するとしています。

ChatGPT Images 2.0はすでに、すべてのChatGPTおよびCodexユーザーが利用できるようになっています。ただし、Thinkingモードによる高度な出力機能は、ChatGPT Plus、Pro、およびBusinessといった有料プランのユーザー向けに提供されます。

なお、開発者や企業ユーザーはChatGPT Images 2.0の画像モデルであるgpt-image-2をAPI経由で利用できますが、価格は出力する画像の品質や解像度により異なります。

Apple iPhone 17e 256GB：6.1インチSuper Retina XDRディスプレイ、A19チップ、一日中使えるバッテリー、48MP Fusionカメラ、最小ストレージ256GB；ホワイト
￥99,800
(価格・在庫状況は記事公開時点のものです)

Amazon

Apple iPhone 17 256GB (SIMフリー)：ProMotionを採用した6.3インチディスプレイ、A19チップ、グループセルフィーを一段とスマートに撮れるセンターフレームフロントカメラ、向上した耐擦傷性能、一日中使えるバッテリー；ブラック
￥129,800
(価格・在庫状況は記事公開時点のものです)

Amazon

【整備済み品】Apple iPhone17 Pro Max 256GB コズミックオレンジ SIMフリー 5G対応
￥254,800
(価格・在庫状況は記事公開時点のものです)

Amazon

Apple iPhone Air 256GB (SIMフリー)：史上最薄のiPhone、最大120HzのProMotionを採用した6.5インチディスプレイ、パワフルなA19 Proチップ、センターフレームフロントカメラ、一日中使えるバッテリー；ライトゴールド
￥159,800
(価格・在庫状況は記事公開時点のものです)

Amazon

【整備済み品】Apple iPhone17 Pro 1TB ディープブルー SIMフリー 5G対応
￥239,800
(価格・在庫状況は記事公開時点のものです)

Amazon

OpenAI、ChatGPT Images 2.0発表。「思考機能」備え画像出力の精度、一貫性、視覚的な整合性高める。日本語も上達

Munenori Taniguchi

特集

Munenori Taniguchi

ショート動画

特集

『テクノエッジアルファ』会員募集中

グラビアカメラマンが教える「生成AIグラビア実践ワークショップ」【アーカイブ配信あります】

どこにもないディープな会話が楽しめる「ハカセとアックンのスマホ沼」

自作PCのノウハウをわかりやすく解説するオンラインワークショップ「AI時代の自作PCワークショップ」【アーカイブ配信あります】

さまざまなテーマでオフラインのイベントを開催。ディスコードでコミュニケーションもできます

PS5 Proクラス性能目指す『OS代込みで12万円のゲーミング自作PC』はどの程度まで行けるか。【AI時代の自作PCワークショップ】

Amazonプライム感謝祭で高性能ロボット掃除機MOVA P50 Ultraが半額＋さらに5％オフ。水拭きモップ自動洗浄・乾燥まで対応ハイエンドモデル

生成AIグラビアギャラリー

「AIを使う人材が欲しい」企業と「AIを使いこなせない」現場——ギャップを埋める方法とは

テクノエッジアルファ会員登録はこちら。コミュニティ参加ガイド

CORSAIR K65 PLUS WIRELESS・M75レビュー Macと映える静音75%メカニカルゲーミングキーボード・マウスで勝率も生産性も向上

【LINE公式アカウントはじめました】最新ガジェットとテック情報をお届けします。友だち募集中。

西川善司のバビンチョなテクノコラム（西川善司）

生成AIグラビアをグラビアカメラマンが作るとどうなる？（西川和久）

人知れず消えていったマイナーCPUを語ろう（大原雄介）

Google Tales（佐藤由紀子）

てくのじ何でも実験室（宮里圭介）

Munenori Taniguchi

特集

SHARE THE STORY この記事をみんなにシェア

Munenori Taniguchi

ショート動画

特集

『テクノエッジ アルファ』会員募集中

『テクノエッジアルファ』会員募集中