記事2025年11月19日 00:00公式発表#Agent#フロンティアモデル

GoogleがGemini 3を発表：Deep ThinkとAntigravityで知能・エージェントを全面刷新

GoogleとGoogle DeepMindが次世代モデル「Gemini 3」を公開し、Reasoning性能向上やDeep Thinkモード、Antigravityによるエージェント開発基盤を含む全方位アップデートを明らかにしました。

要点まとめ

📌 この記事のポイント

1Gemini 3 ProがLMArena 1501 Eloなど主要ベンチマークでSOTAを更新し、Search/Geminiアプリ/AI Studio/Vertex AI/Antigravityに同日展開
2強化推論モード「Gemini 3 Deep Think」がHumanity’s Last ExamやARC-AGI-2でさらに高スコアを達成、Google AI Ultra向けに安全評価後提供
3Google Antigravityを公開し、Gemini 3とGemini 2.5 Computer Useを組み合わせたエージェント開発・実行環境を提供

https://blog.google/products/gemini/gemini-3/

これは何の話？ — 事実

GoogleとGoogle DeepMindは2025年11月18日、Gemini 3シリーズを発表しました。Gemini 3 ProがSearch、Geminiアプリ、AI Studio、Vertex AI、Gemini CLI、そして新しいエージェント開発プラットフォーム「Google Antigravity」に同日実装され、ユーザーは“学ぶ・作る・計画する”すべてで統一されたモデルを利用できるようになります。[1]

何がわかったか — 事実

Gemini 3 ProはLMArena 1501 Elo、GPQA Diamond 91.9%、MathArena Apex 23.4%など主要ベンチマークでGemini 2.5を大幅に上回り、MMMU-Pro 81%、Video-MMMU 87.6%、SimpleQA Verified 72.1%とマルチモーダルでもSOTAを更新。[1]
強化推論モード「Gemini 3 Deep Think」はHumanity’s Last Exam 41.0%、GPQA Diamond 93.8%、ARC-AGI-2 45.1%（コード実行込み）というトップ水準を記録し、Google AI Ultra向けに安全テスト後の提供を予定。[1]
「Learn/Build/Plan anything」では、100万トークン文脈と多言語対応を活かした学習支援、Zero-shotでUIを構成するvibe coding、Vending-Bench 2首位の長期計画など具体例が示され、Gemini AgentがGeminiアプリ（Google AI Ultra）で長期タスクを実行可能になった。[1]
開発者向けにはGoogle Antigravityを公開。Gemini 3 ProとGemini 2.5 Computer Use（ブラウザ操作）、Nano Banana（画像編集）を統合し、エージェントがエディタ/ターミナル/ブラウザを跨いで自律計画→検証まで行うIDEを提供。[1]
責任ある開発として、Gemini 3はこれまでで最も広範な安全評価を済ませ、シンコファンシー低減、プロンプトインジェクション耐性向上、英国AISIなどとの第三者評価を受けたと説明。[1]

他とどう違うのか — 比較

Gemini 1がマルチモーダル化、Gemini 2がエージェント化を推進したのに対し、Gemini 3は「推論・ツール・エージェント」を統合し、SearchなどGoogle製品に“Day 1”で同時導入した点が大きく異なります。Deep Thinkモードのように推論時間を意図的に深く取る仕組みを公式に組み込んだ点も先進的です。[1]

なぜこれが重要か — So What?

AIを「サービス単位」ではなく「モデル＋モード＋エージェント群」で捉える時代が到来したことを意味します。GoogleはGemini 3をSearchやMapsなどメインストリームに展開することで、エンタープライズと消費者の両方に“統合知能”を提供し、OpenAIなどとの競争軸を性能だけでなく運用面に広げています。[1]

未来の展開・戦略性 — 展望

GoogleはAntigravityやGemini Agentを起点に「エージェント・アズ・プラットフォーム」を育て、AIモードの検索や生産性アプリにも波及させる構えです。近くDeep Thinkの安全評価が完了すれば、より高度な推論モードが一般ユーザーにも展開され、競合にもモード切替の実装圧力が高まります。[1]

どう考え、どう動くか — 見解

例：自社サービスでGemini 3のモード別挙動をテストし、既存LLMとの差分を測る。

まずAI StudioやVertex AI SandboxでGemini 3 Proを検証し、長文コンテキストやマルチモーダル処理の安定性を確認。
Google Antigravity（プレビュー申請）やGemini CLIで、既存CI/CDやブラウザ作業の自動化が可能かPoCを行う。
Deep Thinkが公開された際に備え、追加料金や推論遅延といった運用条件を事前に整理する。
次の一歩：
・今日やること：Gemini 3 ProをAI Studioで試し、社内ユースケース（学習、開発、計画）ごとにプロンプトと評価指標を定義する。
・今週やること：Gemini Agent（Google AI Ultra）で長期タスクを試し、Plan系ベンチマーク同等のシナリオを再現してみる。

限界と未確定 — 事実

Deep Thinkモードは安全レビュー中で、一般ユーザーはまだ利用できない。
Google Antigravityは発表時点で詳細な価格やAPI公開範囲が不明で、企業での導入コストを見積もるには追加情報が必要。
Gemini 3のSOTA指標は公開ベンチマークに依存し、特定業務ドメインでの実力検証はコミュニティ次第。[1]

用語ミニ解説

Gemini 3 Deep Think：推論量を増やす“熟考モード”。標準モードより時間をかけ、Humanity’s Last ExamやARC-AGI-2で最高スコアを記録。
Google Antigravity：Gemini 3とツール群を統合したエージェント開発プラットフォーム。AIがエディタ・ターミナル・ブラウザを横断して作業計画と実行を行う。

出典と日付

[1] Google Blog（公開日：2025-11-18／最終確認日：2025-11-18）："A new era of intelligence with Gemini 3"：https://blog.google/products/gemini/gemini-3/

関連メモで深掘り

テーマやツールが近い投稿をピックアップしました。

Google の最近の動き

同じツールに紐づいた投稿から厳選しました。

公式

Google1月17日3分

TranslateGemma公開：Gemma 3ベースの翻訳特化モデル、55言語対応で12Bが27Bを上回る効率性

GoogleがGemma 3ベースのオープン翻訳モデル「TranslateGemma」を公開。4B/12B/27Bの3サイズで55言語に対応し、12Bモデルが27Bベースラインを上回る効率性を実現。画像内テキスト翻訳にも対応しています。

#Google#Translation

1月13日3分

Apple公式発表｜次世代SiriにGoogle Geminiを採用、2026年内リリース予定

AppleがCNBCに対し、次世代版SiriにGoogle Geminiを採用すると公式に発表しました。「慎重な評価の結果、Googleの技術がApple Foundation Modelsの最も有能な基盤を提供すると判断した」との声明を出しています。この次世代Siriは2024年のWWDC基調講演で初めて予告されていたものの、その後延期が発表されていました。現在はiOS 26.4で2026年3〜4月に一般公開される見込みです。iPh

#提携#音声アシスタント

1月10日4分

GmailがAIでパーソナルアシスタント化：執筆支援からToDoリスト自動生成まで

GoogleがGmailに新AI機能を導入。「Help Me Write」で執筆スタイルを学習して提案、AI Overviews風の会話型検索、受信箱からToDoリストを自動生成するAI Inboxなど、30億ユーザーの生産性を変える可能性があります。

#Gmail#AI

12月29日4分

ChatGPTのシェア68%に低下、Geminiが18%で急追｜生成AI市場の変化を読む

ChatGPTの生成AIウェブトラフィックシェアが87%から68%に19ポイント下落。Geminiは5.4%から18.2%に急上昇、3倍以上の成長を記録。Androidエコシステムで優位を築くGoogleの戦略と、OpenAIの対応を分析します。

#市場分析#ChatGPT

似ているタグの投稿

タグの重なりが多い投稿をおすすめしています。

12月18日3分

Gemini 3 FlashがAI検索と会話のデフォルトモデルに——Googleが価格破壊で市場をリードへ

GoogleがGemini 3 Flashを発表し、AI検索モードとGeminiアプリのデフォルトモデルに採用。入力100万トークンあたり0.50ドルという価格設定で競合を圧倒しつつ、GPQA Diamond 90.4%など高性能を維持する戦略を解説。

#Gemini#フロンティアモデル

12月7日4分

Hugging Face × Claude Code：コーディングエージェントで独自のLLMを微調整可能に

Hugging Faceがコーディングエージェント（Claude Code/Gemini CLI等）向けのスキルを公開。自然言語の指示だけで、GPU選定からSFT/DPO/GRPOによるモデル微調整までを全自動で行える画期的なワークフローが登場

#Fine-tuning#Agent

論文

arXiv12月5日2分

CARL：重要行動に焦点を当てたマルチステップ強化学習でエージェントを改善

マルチステップ環境で全行動を均一に最適化する従来手法の非効率を指摘し、成功に決定的な行動に報酬を集中させるCARLを提案。LLMエージェントの長タスク成功率を底上げした。

#Reinforcement Learning#Agent

12月5日2分

CorityがEHS向け「Cortex AI」を発表：25分野以上のリスクをAIで統制

EHSソフトウェアのCorityが、点検画像解析や医療記録サマリなど25分野超をカバーするAIプラットフォーム「Cortex AI」をリリースし、エージェント群と中央管理ハブで現場業務を統制する構成を示した。

#Business AI#EHS

Journey

キーワードで深掘り

キーワードをクリックして関連記事を探索しましょう

Timeline

次に読む

Google のタイムラインの流れで前後の記事を辿れます。

arXiv→

論文

専門家ロールのLLMはどこまで自分を名乗るか

11月26日

←

Gemini CLIでGemini 3 Proが解禁：5つの実践アクションでわかる開発体験の刷新

11月19日

メモ

Image prompt: "futuristic multimodal AI intelligence core with layers for reasoning, coding and planning, vibrant Google colors"

著者Yuji Sakuta

公開日2025年11月19日

検証日2026年1月21日

元の投稿を開く

📌 この記事のポイント

1Gemini 3 ProがLMArena 1501 Eloなど主要ベンチマークでSOTAを更新し、Search/Geminiアプリ/AI Studio/Vertex AI/Antigravityに同日展開

2強化推論モード「Gemini 3 Deep Think」がHumanity’s Last ExamやARC-AGI-2でさらに高スコアを達成、Google AI Ultra向けに安全評価後提供

3Google Antigravityを公開し、Gemini 3とGemini 2.5 Computer Useを組み合わせたエージェント開発・実行環境を提供

これは何の話？ — 事実

何がわかったか — 事実

Gemini 3 ProはLMArena 1501 Elo、GPQA Diamond 91.9%、MathArena Apex 23.4%など主要ベンチマークでGemini 2.5を大幅に上回り、MMMU-Pro 81%、Video-MMMU 87.6%、SimpleQA Verified 72.1%とマルチモーダルでもSOTAを更新。[1]
強化推論モード「Gemini 3 Deep Think」はHumanity’s Last Exam 41.0%、GPQA Diamond 93.8%、ARC-AGI-2 45.1%（コード実行込み）というトップ水準を記録し、Google AI Ultra向けに安全テスト後の提供を予定。[1]
「Learn/Build/Plan anything」では、100万トークン文脈と多言語対応を活かした学習支援、Zero-shotでUIを構成するvibe coding、Vending-Bench 2首位の長期計画など具体例が示され、Gemini AgentがGeminiアプリ（Google AI Ultra）で長期タスクを実行可能になった。[1]
開発者向けにはGoogle Antigravityを公開。Gemini 3 ProとGemini 2.5 Computer Use（ブラウザ操作）、Nano Banana（画像編集）を統合し、エージェントがエディタ/ターミナル/ブラウザを跨いで自律計画→検証まで行うIDEを提供。[1]
責任ある開発として、Gemini 3はこれまでで最も広範な安全評価を済ませ、シンコファンシー低減、プロンプトインジェクション耐性向上、英国AISIなどとの第三者評価を受けたと説明。[1]

他とどう違うのか — 比較

なぜこれが重要か — So What?

未来の展開・戦略性 — 展望

どう考え、どう動くか — 見解

例：自社サービスでGemini 3のモード別挙動をテストし、既存LLMとの差分を測る。

まずAI StudioやVertex AI SandboxでGemini 3 Proを検証し、長文コンテキストやマルチモーダル処理の安定性を確認。
Google Antigravity（プレビュー申請）やGemini CLIで、既存CI/CDやブラウザ作業の自動化が可能かPoCを行う。
Deep Thinkが公開された際に備え、追加料金や推論遅延といった運用条件を事前に整理する。
次の一歩：
・今日やること：Gemini 3 ProをAI Studioで試し、社内ユースケース（学習、開発、計画）ごとにプロンプトと評価指標を定義する。
・今週やること：Gemini Agent（Google AI Ultra）で長期タスクを試し、Plan系ベンチマーク同等のシナリオを再現してみる。

限界と未確定 — 事実

Deep Thinkモードは安全レビュー中で、一般ユーザーはまだ利用できない。
Google Antigravityは発表時点で詳細な価格やAPI公開範囲が不明で、企業での導入コストを見積もるには追加情報が必要。
Gemini 3のSOTA指標は公開ベンチマークに依存し、特定業務ドメインでの実力検証はコミュニティ次第。[1]

用語ミニ解説

出典と日付

[1] Google Blog（公開日：2025-11-18／最終確認日：2025-11-18）："A new era of intelligence with Gemini 3"：https://blog.google/products/gemini/gemini-3/

GoogleがGemini 3を発表：Deep ThinkとAntigravityで知能・エージェントを全面刷新

📌 この記事のポイント

これは何の話？ — 事実

何がわかったか — 事実

他とどう違うのか — 比較

なぜこれが重要か — So What?

未来の展開・戦略性 — 展望

どう考え、どう動くか — 見解

限界と未確定 — 事実

用語ミニ解説

出典と日付

関連ツール

関連メモで深掘り

キーワードで深掘り

次に読む

メモ

GoogleがGemini 3を発表：Deep ThinkとAntigravityで知能・エージェントを全面刷新

📌 この記事のポイント

これは何の話？ — 事実

何がわかったか — 事実

他とどう違うのか — 比較

なぜこれが重要か — So What?

未来の展開・戦略性 — 展望

どう考え、どう動くか — 見解

限界と未確定 — 事実

用語ミニ解説

出典と日付

関連ツール

関連メモで深掘り

キーワードで深掘り

次に読む

メモ