記事2026年2月7日 00:00報道#LLM#OpenAI#Codex#エージェント#セキュリティ

GPT-5.3-Codexリリース：Steering機能で変わるエージェント操作体験

GPT-5.3-Codexは2026年2月5日発表のOpenAI最新モデル。Steering機能でエージェント作業中の割り込み指示が可能に。Terminal-Bench 2.0で77.3%、OSWorld-Verifiedで64.7%を達成しています。

要点まとめ

📌 この記事のポイント

1GPT-5.3-Codexは2026年2月5日発表、GPT-5.2の推論能力とCodexのコーディング能力を統合
2Steering機能でエージェント作業中に割り込み指示が可能、待ち行列方式からの転換
3Terminal-Bench 2.0で77.3%、OSWorld-Verifiedで64.7%を達成
4サイバー領域でHigh capability分類、脆弱性特定に特化したトレーニングを実施

GPT-5.3-Codexリリース：Steering機能で変わるエージェント操作体験のサムネイル

https://zenn.dev/galirage/articles/openai-gpt-5-3-codex

1. これは何の話？

Article Overview

OpenAIは2026年2月5日、Codex向けエージェントモデルの最新版GPT-5.3-Codexを発表しました。エージェント型開発ツールの導入を検討するチーム向けに、このモデルの新機能と従来との違いを整理します。 GPT-5.3-Codexは、GPT-5.2の推論・専門知識とGPT-5.2-Codexのコーディング性能を統合し、処理速度が25%向上しています。目的が「コード生成」から「PC上のほぼ全業務を担うエージェント」へ拡張された点が、今回の発表の核心です。

2. 何がわかったか

公開情報から確認できる主な事実は三つあります。第一に、Terminal-Bench 2.0で77.3%を達成し、従来のGPT-5.2-Codexの64.0%を大きく上回りました。OSWorld-Verifiedでは64.7%で、人間スコア約72%に迫っています。第二に、知識業務ベンチマークGDPvalでもGPT-5.2に匹敵する性能（wins or tiesで70.9%）を示し、コーディング専用から汎用知識労働支援へ進化しています。第三に、Steering機能の導入により、エージェント作業中でもコンテキストを保ったまま追加指示や対話を続けられるようになりました。

3. 他とどう違うのか

従来のCodexモデルでは、ユーザーがエージェント作業中に追加指示を送ると、キュー方式で待ち行列に入れられ、現在のタスク完了後に処理されていました。 GPT-5.3-CodexのSteering機能は、作業中でも並走して指示を差し込める設計に変わっています。また、サイバー領域でHigh capabilityに分類された初のモデルであり、ソフトウェア脆弱性の特定に特化したトレーニングが行われた点も従来と異なります。

4. なぜこれが重要か

エージェントの実用性において、人間がリアルタイムで軌道修正できるかどうかは重要な課題でした。 Steering機能は「完全自律」ではなく「人機協調」の設計思想を示しており、課題が「エージェントに何ができるか」から「人が多数エージェントをどう管理するか」に移行したことを象徴しています。開発チームにとって、エージェントの進捗監視と介入のUXが改善される点が実務的なメリットです。

5. 未来の展開・戦略性

OpenAIはCodexを「開発者向けエージェント」から「あらゆる知識労働者向けエージェント」へ拡張しようとしています。 APIアクセスは「近日中の有効化に向けて取り組み中」とされており、正式公開後はCI/CDパイプラインや監視ダッシュボードとの統合が進むと予想されます。サイバーセキュリティ領域での活用も、Trusted Access for CyberパイロットやAardvarkベータ拡大を通じて加速しそうです。

6. どう考え、どう動くか

例えば、現在のコードレビューやデバッグ作業を一部Codexに委譲しているチームなら、Steering機能の有効化で作業中断なく追加指示を送れるかを検証すると導入効果が測れます。

GPT-5.2-Codexと同じタスクで実行し、生成品質とレスポンス速度の差を比較する。
Steering機能の設定（「設定」→「一般」→「フォローアップの動作」）を確認し、割り込み処理の挙動を把握する。
API正式公開の動向を追い、自動化パイプラインへの組み込み計画を立てる。

次の一歩：

今日やること：ChatGPTアプリまたはCLIでGPT-5.3-Codexを呼び出し、既存タスクと比較する。
今週やること：Steering機能を使った作業中断・再開のフローを1つ試し、UXの改善点を記録する。

7. 限界と未確定

APIアクセスは「近日中」とされているだけで、正式な提供開始日は未発表です。
サイバーセキュリティ能力の評価はCybersecurity CTFで77.6%ですが、実務での脆弱性検出精度は未検証です。
価格体系やレート制限についても詳細な情報は公開されていません。

8. 用語ミニ解説

エージェント作業中でもコンテキストを保ったまま追加指示を差し込める機能です。（Steering / ステアリング）
米国GDPの5%以上を占める主要産業の実務タスクで性能を測るベンチマークです。（GDPval / 知識業務評価）

9. 出典と日付

Zenn galirage（公開日：2026-02-07）：https://zenn.dev/galirage/articles/openai-gpt-5-3-codex

関連メモで深掘り

テーマやツールが近い投稿をピックアップしました。

OpenAI の最近の動き

同じツールに紐づいた投稿から厳選しました。

公式

OpenAI3月12日3分

OpenAI Codexのベストプラクティス：AIエージェントを最大限に活用するためのガイド

OpenAIが公開したCodexのベストプラクティスでは、プロンプトの工夫から自動化まで、コーディングエージェントを効果的に使う実践的手法が解説されています。

#ガイド

公式

OpenAI3月11日3分

ChatGPTに数学・科学のインタラクティブな視覚的解説機能が追加される

ChatGPTが70以上の数学・科学トピックに対して、ユーザーが変数を操作できる動的なビジュアル解説機能の提供を開始しました。

#ChatGPT#教育

公式

OpenAI3月7日4分

OpenAIが「GPT-5.4」向けプロンプトガイドを公開、構造化出力と検証ループが鍵

OpenAIが「GPT-5.4」の長文脈・エージェント性能を最大限に引き出すための公式プロンプトガイドラインを公開しました。

#プロンプトエンジニアリング#ガイドライン

3月6日4分

ChatGPTが直にエクセルやスプレッドシートを編集——対話型データ分析アドイン「ChatGPT for Excel（β版）」の衝撃

OpenAIの大規模言語モデルが直接Excelに介入し、データ整理や分析を支援してくれる「ChatGPT for Excel」ベータ版がリリースされました。

#AI#ChatGPT

似ているタグの投稿

タグの重なりが多い投稿をおすすめしています。

3月10日4分

AI時代の開発基盤設計ガイド：Claude CodeとCodexのためのHarness Engineering

Claude CodeやCodexなどのAIエージェント時代において、人間がコードを書く代わりにAIを制御する仕組みづくり「Harness Engineering」のベストプラクティスを解説したブログ記事のポイントをまとめます。

#Architecture#Engineering

3月10日3分

Karpathyが「AIエージェントが自分のモデルを自律チューニング」に成功——11%の性能改善を達成

KarpathyがAIエージェントにnanochatのトレーニングを2日間自律実行させ約700回の実験から20件の改善を発見。累積でTime to GPT-2が約11%短縮し、「autoresearch」の可能性を実証した報告。

#AI研究#エージェント

公式

OpenAI3月7日3分

OpenAI、自律型セキュリティエージェント「Codex Security」をプレビュー公開

OpenAIがソフトウェアコードの脆弱性の発見から修正パッチ作成までを自律的に行うセキュリティエージェント「Codex Security」のプレビュー公開を開始しました。

#セキュリティ#アップデート

3月6日3分

みずほFGが「GPT-5.2同等精度」の金融特化LLMを自社開発——Qwen3-32Bベースでオンプレ環境でのセキュア運用を実現

みずほFGは、自社環境（オンプレミス）で安全に稼働し、トップクラスの精度を持つ金融領域特化の独自LLMの開発に成功しました。

#AI#Finance

Journey

キーワードで深掘り

キーワードをクリックして関連記事を探索しましょう

Timeline

次に読む

OpenAI のタイムラインの流れで前後の記事を辿れます。

→

OpenClaw v2026.2.6: Opus 4.6 & Codex 5.3対応、xAI (Grok) 正式サポート

2月8日

OpenAI←

公式

OpenAI Frontier発表：AIエージェントを企業の「同僚」にする新プラットフォーム

2月6日

著者Yuji Sakuta

公開日2026年2月7日

検証日2026年4月18日

元の投稿を開く

📌 この記事のポイント

1GPT-5.3-Codexは2026年2月5日発表、GPT-5.2の推論能力とCodexのコーディング能力を統合

2Steering機能でエージェント作業中に割り込み指示が可能、待ち行列方式からの転換

3Terminal-Bench 2.0で77.3%、OSWorld-Verifiedで64.7%を達成

4サイバー領域でHigh capability分類、脆弱性特定に特化したトレーニングを実施

1. これは何の話？

Article Overview

2. 何がわかったか

3. 他とどう違うのか

4. なぜこれが重要か

5. 未来の展開・戦略性

6. どう考え、どう動くか

GPT-5.2-Codexと同じタスクで実行し、生成品質とレスポンス速度の差を比較する。
Steering機能の設定（「設定」→「一般」→「フォローアップの動作」）を確認し、割り込み処理の挙動を把握する。
API正式公開の動向を追い、自動化パイプラインへの組み込み計画を立てる。

次の一歩：

今日やること：ChatGPTアプリまたはCLIでGPT-5.3-Codexを呼び出し、既存タスクと比較する。
今週やること：Steering機能を使った作業中断・再開のフローを1つ試し、UXの改善点を記録する。

7. 限界と未確定

APIアクセスは「近日中」とされているだけで、正式な提供開始日は未発表です。
サイバーセキュリティ能力の評価はCybersecurity CTFで77.6%ですが、実務での脆弱性検出精度は未検証です。
価格体系やレート制限についても詳細な情報は公開されていません。

8. 用語ミニ解説

エージェント作業中でもコンテキストを保ったまま追加指示を差し込める機能です。（Steering / ステアリング）
米国GDPの5%以上を占める主要産業の実務タスクで性能を測るベンチマークです。（GDPval / 知識業務評価）

9. 出典と日付

Zenn galirage（公開日：2026-02-07）：https://zenn.dev/galirage/articles/openai-gpt-5-3-codex

GPT-5.3-Codexリリース：Steering機能で変わるエージェント操作体験

📌 この記事のポイント

1. これは何の話？

2. 何がわかったか

3. 他とどう違うのか

4. なぜこれが重要か

5. 未来の展開・戦略性

6. どう考え、どう動くか

7. 限界と未確定

8. 用語ミニ解説

9. 出典と日付

関連ツール

関連メモで深掘り

キーワードで深掘り

次に読む

GPT-5.3-Codexリリース：Steering機能で変わるエージェント操作体験

📌 この記事のポイント

1. これは何の話？

2. 何がわかったか

3. 他とどう違うのか

4. なぜこれが重要か

5. 未来の展開・戦略性

6. どう考え、どう動くか

7. 限界と未確定

8. 用語ミニ解説

9. 出典と日付

関連ツール

関連メモで深掘り

キーワードで深掘り

次に読む