2026/06/26 21:03

OpenAIのGPT-5.6 Sol、深い推論を単体モデルからサブエージェント運用へ広げた

OpenAIは2026年6月26日、GPT-5.6 Sol、Terra、Lunaを発表し、まずAPIとCodexで一部の信頼済みパートナー向けに限定プレビューを始めました。今回の主役は単に「より賢いモデル」ではありません。Solには深く考えるための`max` reasoning effortが入り、さらに単体エージェントを越えてサブエージェントを使う`ultra` modeが用意されます。モデルの進化が、回答性能だけでなく、作業を分け、並列化し、監督し、安全確認で止める運用面へ広がっています。

Sol、Terra、Lunaは性能差ではなく運用差を示す名前になった

OpenAIはGPT-5.6で、Sol、Terra、Lunaという3つのモデル名を導入しました。数字が世代を示し、名前が長く続く能力階層を示す設計です。Solは旗艦モデル、Terraは低コスト寄り、Lunaは最速かつ最も費用効率の高いモデルとして位置づけられています。

OpenAIモデル発表を示すInterface Wire編集用サムネイル — 画像: Interface Wire

これは、モデル選びを単純な「一番強いもの」から、仕事の種類に合わせた運用判断へ寄せる変更です。OpenAIは価格も3段階で示しており、100万トークンあたりSolは入力5ドル、出力30ドル、Terraは入力2.50ドル、出力15ドル、Lunaは入力1ドル、出力6ドルです。高速な下書き、長い検証、重い分析を同じモデル名の中で使い分ける前提が見えます。

さらにGPT-5.6以降では、明示的なcache breakpointsと30分以上のキャッシュ保持を含む、より予測しやすいprompt cachingも導入されます。AIアプリやエージェントを本番運用する側にとっては、モデルの賢さだけでなく、待ち時間、キャッシュ、費用、再実行の読みやすさがインターフェース設計の一部になります。

`ultra` modeは、深い推論を複数エージェントの作業へ広げる

OpenAIはGPT-5.6 Solで、新しい`max` reasoning effortを導入すると説明しています。これはSolに最も長く深く考えさせるための推論設定です。加えて、`ultra` modeは単体エージェントの能力を越え、サブエージェントを使って複雑な作業を加速するモードとして紹介されています。

ここで重要なのは、能力向上の見せ方がチャット応答の品質だけではなくなっていることです。OpenAIはcoding、biology、cybersecurityの評価を並べ、Terminal-Bench 2.1、GeneBench v1、ExploitBench、ExploitGymといった長めの作業やツール調整を含むベンチマークで説明しています。つまりSolは、ひとつの返答を上手に書くモデルというより、計画、反復、ツール、複数の作業単位を扱うモデルとして出されています。

Codexで使われる意味もそこにあります。エージェント作業のUIは、質問欄ではなく、タスクの分割、実行ログ、サブタスクの合流、失敗時の停止、レビュー可能な成果物を扱う面へ近づきます。`ultra` modeという名前が示しているのは、ユーザーが一つのAIと会話するだけでなく、AI側が複数の作業者を束ねるような構成です。

強いサイバー能力は、速度より確認の設計を必要にする

OpenAIはGPT-5.6 Solを、同社の中で最も有能なサイバーセキュリティ向けモデルだと説明しています。同時に、GPT-5.6 Sol、Terra、LunaをPreparedness Framework上でCybersecurityおよびBiological and ChemicalのHigh capabilityとして扱い、AI Self-ImprovementではHigh thresholdに達していないとシステムカードで明記しています。

記事とシステムカードは、ここをかなり慎重に扱っています。SolとTerraは脆弱性やexploit primitivesを見つけられる一方、テスト条件下では強化された標的に対して自律的なend-to-end attackを実行できなかった、と説明されています。OpenAIはこれを、守る側が脆弱性を見つけ、パッチを作り、レビューする利益につなげたいという方向で位置づけています。

そのためGPT-5.6の体験は、速く答えるだけではありません。生成中のリアルタイム分類器、より大きな推論モデルによる追加レビュー、アカウント単位のリスク確認、アクセス差、監視、継続テストが重なります。プレビュー中は、正当な防御作業でもブロックされたり、追加確認で遅くなったりする可能性があるとOpenAIは述べています。これは弱点ではなく、強いモデルを作業環境へ出すときのUIそのものです。

GPT-5.6 Solの発表は、モデル競争を「どれが一番賢いか」から「どの仕事を、どの速度と費用で、どれだけ深く考えさせ、どこで止めるか」へ移しています。Sol、Terra、Lunaの階層、`max` reasoning effort、`ultra` mode、Codex/APIの限定プレビュー、サイバー能力に合わせた段階的アクセスは、AIのインターフェースがチャット欄から運用面へ広がっていることを示しています。強いモデルほど、答えだけでなく、レビュー、遅延、拒否、アクセス制御まで含めて設計する必要があります。