記事2026年2月12日 00:00公式発表#Google#Gemini#Reasoning

Gemini 3 Deep Think更新、Humanity’s Last Exam 48.4%やARC-AGI-2 84.6%を提示

Gemini 3 Deep Thinkは、Googleが科学・研究・工学向けに強化した推論モードです。難度の高い学術ベンチマークでの結果を示しつつ、Google AI UltraとGemini API早期アクセスで実利用フェーズへ進んだ点が重要です。

要点まとめ

📌 この記事のポイント

1Gemini 3 Deep Thinkの大規模アップデートが公開
2Humanity’s Last Exam 48.4%（without tools）、ARC-AGI-2 84.6%、Codeforces Elo 3455を提示
3Google AI Ultraユーザー向け提供とGemini API早期アクセス受付を開始

Gemini 3 Deep Think更新、Humanity’s Last Exam 48.4%やARC-AGI-2 84.6%を提示のサムネイル

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-deep-think/

1. これは何の話？

Gemini 3 Deep Thinkの全体像

Googleは2026年2月12日、推論モード「Gemini 3 Deep Think」の大規模アップデートを公開しました。想定読者は、難度の高い研究課題やエンジニアリング課題でAIを使う研究者・開発チームです。検索ニーズは「Gemini 3 Deep Thinkの最新性能」と「利用可能な提供形態」が中心です。

今回の更新は、単なるモデル更新ではなく、研究用途での実証例とベンチマーク結果、提供チャネルの拡大を同時に示した発表です。

2. 何がわかったか

Googleは、更新後Deep Thinkの指標として、Humanity’s Last Exam 48.4%（without tools）とARC-AGI-2 84.6%を提示しています。さらに、Codeforces Elo 3455と、IMO 2025での金メダル水準パフォーマンスを示しました。

科学領域では、2025年の物理・化学オリンピック筆記で金メダル水準、CMT-Benchmark 50.5%を記載しています。数学者・研究室・プロダクト開発者による早期検証事例も紹介され、研究利用を前提にした実運用を強調しています。

提供面では、GeminiアプリのGoogle AI Ultraユーザー向け提供を開始し、Gemini APIは研究者・エンジニア・企業向けに早期アクセスの受付を始めています。

3. 他とどう違うのか

多くのモデル更新は、日常タスクでの平均精度改善を中心に示します。Deep Think更新は、学術難問や研究支援のような高難度領域を主戦場として明確に打ち出しています。

また、性能指標だけでなく、研究現場の具体例を併記している点が特徴です。これにより、ベンチマーク値と実務利用の接続が見えやすくなっています。

4. なぜこれが重要か

重要なのは、生成AIの価値軸が「一般用途の便利さ」から「高難度課題での突破力」へ拡張していることです。研究や工学では、1つの正解より、探索効率や仮説発見の速度が成果を左右します。

今回の発表は、推論強化モデルが研究補助の実作業へ本格的に入り始めた流れを示しています。

5. 未来の展開・戦略性

今後は、通常モデルとDeep Thinkの使い分けが標準化し、課題難易度に応じた2層運用が進む可能性があります。難題だけDeep Thinkへ振り分ける設計が、コストと精度の両立に有効です。

GoogleがGemini APIで早期アクセスを始めたことで、研究用途の検証が外部で進み、ベンダー間でも難問特化モードの競争が強まる公算があります。

6. どう考え、どう動くか

例えば、社内で「失敗コストが高い問題」を10件抽出し、通常モードとDeep Thinkで結果差を比較すると、どこに高推論モードを使うべきかが見えてきます。

まず試すこと: 高難度課題だけを選別し、Deep Think適用時の改善幅を測定します。
影響が大きい領域: 数理検証、研究文書レビュー、物理設計や材料探索の補助です。
追うべき指標: 解答品質、再試行回数、推論時間、実験サイクル短縮率です。
今日やること: 既存の難問タスクを分類し、Deep Think対象候補を決める。
今週やること: 10件程度の比較実験を行い、運用基準を作る。

7. 限界と未確定

公開結果はGoogle提示の評価条件に基づくため、同値再現には条件合わせが必要です。
API提供は早期アクセス枠であり、全ユーザーが同時に同条件で利用できるわけではありません。
高推論モードは運用コストと推論時間が増える可能性があり、常時利用には選別基準が必要です。

8. 用語ミニ解説

人類レベルの難問でモデル限界を測る評価ベンチ。（Humanity’s Last Exam / Humanity’s Last Exam）
競技プログラミング成績を相対的に示す指標。（Codeforces Elo / Codeforces Elo）

9. 出典と日付

Google（公開日／更新日／最終確認日：2026-02-12／記載なし／2026-02-14）：https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-deep-think/

関連メモで深掘り

テーマやツールが近い投稿をピックアップしました。

Gemini の最近の動き

同じツールに紐づいた投稿から厳選しました。

公式

Google3月11日3分

Googleがマルチモーダル埋め込みモデル「Gemini Embedding 2」を公開

テキスト・画像・動画・音声・PDFを単一ベクトル空間にマッピングするGemini Embedding 2が登場。RAGやマルチモーダル検索の精度向上に直結します。

#AIモデル#マルチモーダル

公式

Google3月4日4分

Gemini 3.1 Flash-Lite：$0.25/1Mトークンで2.5Xの速度、Googleの最安コストAIモデル登場

Gemini 3.1 Flash-Lite は入力$0.25/1Mトークンでgemini 3シリーズ最安値、2.5 Flashより2.5倍高速なGoogleのコスト効率特化AIモデル。高ボリューム翻訳・コンテンツモデレーションに最適。

#Google#Gemini

公式

Google2月28日4分

Google DeepMindがNano Banana 2を発表、ProレベルをFlash速度で実現する画像生成モデル

Google DeepMindがNano Banana 2（Gemini 3.1 Flash Image）を発表。Nano Banana Proの高品質Gemini Flashの高速度を統合し、512px～4Kの幅広い解像度と被写体一貫性を実現。SynthID⭐C2PA対応で出所証明も強化。

#Google#画像生成

2月21日3分

Googleが中小事業者を支援するAIトレーニング「Make AI Work for You」を展開

Googleが米国の中小企業（要EIN・従業員500人以下）を対象に、生産性向上を支援するAIトレーニングプログラムを開始。

#中小企業支援#トレーニング

似ているタグの投稿

タグの重なりが多い投稿をおすすめしています。

公式

Google3月11日5分

Google WorkspaceのGeminiが進化——複数アプリを横断し資料作成やデータ分析を共同作業で実行

GoogleがWorkspace内のGeminiをアップデートし、DriveやGmailの情報を横断連携して文書・シート・スライドの生成・提案を行う新機能群を発表した。

#Google Workspace#Gemini

2月28日4分

GoogleがAI Edge GalleryにiOS対応とオンデバイス関数呼び出しを追加、270Mパラメータで端末内完結エージェント動作

Google AI Edge GalleryにiOS対応とFunctionGemma搭載のオンデバイス関数呼び出し機能が追加。270Mパラメータで完全オフライン動作し、Pixel 7 Proで1916トークン/秒を達成した。

#オンデバイスAI#エージェント

公式

Google2月20日3分

Gemini 3.1 Pro発表——複雑な推論が日常のアプリへ、ARC-AGI-2は77.1%を達成

GoogleがGemini 3.1 Pro（プレビュー）を発表。ARC-AGI-2ベンチマークで77.1%を達成し、3 Proと比べて推論性能が2倍以上に向上。Gemini API（AI Studio経由）、Gemini CLI、Google Antigravity、Android Studio、Vertex AI、Gemini Enterprise、Geminiアプリ、NotebookLMに展開開始。Gemini AI Pro・Ultraプラン向けの利用上限も引き上げ。GAリリース前の検証フェーズとして今回はプレビュー提供。

#Google#Gemini

公式

Google2月20日3分

GeminiアプリでAI音楽生成が解禁——Lyria 3が30秒のカスタム楽曲を作る

Google DeepMindの最新音楽生成モデル「Lyria 3」が2026年2月18日からGeminiアプリにβ版として統合。テキストや画像・映像を入力して30秒のカスタム楽曲が作れる。歌詞の自動生成やvocal/tempo/styleの詳細制御が可能になり、生成楽曲にはSynthIDの透かしが全件埋め込まれる。YouTubeのDream Trackでも展開が開始された。

#Google#Gemini

Journey

キーワードで深掘り

キーワードをクリックして関連記事を探索しましょう

Timeline

次に読む

Gemini のタイムラインの流れで前後の記事を辿れます。

arXiv→

論文

プロンプトを2回送るだけでLLMの精度が上がる——Googleエンジニアの検証結果

2月20日

Google←

公式

Alphabet Q4決算：年間売上4000億ドル突破、Gemini 3が全事業を牽引

2月5日

著者Yuji Sakuta

公開日2026年2月12日

検証日2026年4月18日

元の投稿を開く

記事2026年2月12日 00:00公式発表#Google#Gemini#Reasoning

Gemini 3 Deep Think更新、Humanity’s Last Exam 48.4%やARC-AGI-2 84.6%を提示

要点まとめ

📌 この記事のポイント

1Gemini 3 Deep Thinkの大規模アップデートが公開
2Humanity’s Last Exam 48.4%（without tools）、ARC-AGI-2 84.6%、Codeforces Elo 3455を提示
3Google AI Ultraユーザー向け提供とGemini API早期アクセス受付を開始

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-deep-think/

1. これは何の話？

Gemini 3 Deep Thinkの全体像

今回の更新は、単なるモデル更新ではなく、研究用途での実証例とベンチマーク結果、提供チャネルの拡大を同時に示した発表です。

2. 何がわかったか

提供面では、GeminiアプリのGoogle AI Ultraユーザー向け提供を開始し、Gemini APIは研究者・エンジニア・企業向けに早期アクセスの受付を始めています。

3. 他とどう違うのか

4. なぜこれが重要か

今回の発表は、推論強化モデルが研究補助の実作業へ本格的に入り始めた流れを示しています。

5. 未来の展開・戦略性

GoogleがGemini APIで早期アクセスを始めたことで、研究用途の検証が外部で進み、ベンダー間でも難問特化モードの競争が強まる公算があります。

6. どう考え、どう動くか

まず試すこと: 高難度課題だけを選別し、Deep Think適用時の改善幅を測定します。
影響が大きい領域: 数理検証、研究文書レビュー、物理設計や材料探索の補助です。
追うべき指標: 解答品質、再試行回数、推論時間、実験サイクル短縮率です。
今日やること: 既存の難問タスクを分類し、Deep Think対象候補を決める。
今週やること: 10件程度の比較実験を行い、運用基準を作る。

7. 限界と未確定

公開結果はGoogle提示の評価条件に基づくため、同値再現には条件合わせが必要です。
API提供は早期アクセス枠であり、全ユーザーが同時に同条件で利用できるわけではありません。
高推論モードは運用コストと推論時間が増える可能性があり、常時利用には選別基準が必要です。

8. 用語ミニ解説

人類レベルの難問でモデル限界を測る評価ベンチ。（Humanity’s Last Exam / Humanity’s Last Exam）
競技プログラミング成績を相対的に示す指標。（Codeforces Elo / Codeforces Elo）

9. 出典と日付

Google（公開日／更新日／最終確認日：2026-02-12／記載なし／2026-02-14）：https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-deep-think/

キーワードで深掘り

キーワードをクリックして関連記事を探索しましょう

Timeline

次に読む

Gemini のタイムラインの流れで前後の記事を辿れます。

arXiv→

論文

プロンプトを2回送るだけでLLMの精度が上がる——Googleエンジニアの検証結果

2月20日

Google←

公式

Alphabet Q4決算：年間売上4000億ドル突破、Gemini 3が全事業を牽引

2月5日

著者Yuji Sakuta

公開日2026年2月12日

検証日2026年4月18日

元の投稿を開く

Gemini 3 Deep Think更新、Humanity’s Last Exam 48.4%やARC-AGI-2 84.6%を提示

📌 この記事のポイント

1. これは何の話？

2. 何がわかったか

3. 他とどう違うのか

4. なぜこれが重要か

5. 未来の展開・戦略性

6. どう考え、どう動くか

7. 限界と未確定

8. 用語ミニ解説

9. 出典と日付

関連ツール

関連メモで深掘り

キーワードで深掘り

次に読む

Gemini 3 Deep Think更新、Humanity’s Last Exam 48.4%やARC-AGI-2 84.6%を提示

📌 この記事のポイント

1. これは何の話？

2. 何がわかったか

3. 他とどう違うのか

4. なぜこれが重要か

5. 未来の展開・戦略性

6. どう考え、どう動くか

7. 限界と未確定

8. 用語ミニ解説

9. 出典と日付

関連ツール

関連メモで深掘り

キーワードで深掘り

次に読む