
Googleがマルチモーダル埋め込みモデル「Gemini Embedding 2」を公開
テキスト・画像・動画・音声・PDFを単一ベクトル空間にマッピングするGemini Embedding 2が登場。RAGやマルチモーダル検索の精度向上に直結します。
LLM / 34 件

テキスト・画像・動画・音声・PDFを単一ベクトル空間にマッピングするGemini Embedding 2が登場。RAGやマルチモーダル検索の精度向上に直結します。

Gemini 3.1 Flash-Lite は入力$0.25/1Mトークンでgemini 3シリーズ最安値、2.5 Flashより2.5倍高速なGoogleのコスト効率特化AIモデル。高ボリューム翻訳・コンテンツモデレーションに最適。

Google DeepMindがNano Banana 2(Gemini 3.1 Flash Image)を発表。Nano Banana Proの高品質Gemini Flashの高速度を統合し、512px~4Kの幅広い解像度と被写体一貫性を実現。SynthID⭐C2PA対応で出所証明も強化。

Googleが米国の中小企業(要EIN・従業員500人以下)を対象に、生産性向上を支援するAIトレーニングプログラムを開始。

GoogleがGemini 3.1 Pro(プレビュー)を発表。ARC-AGI-2ベンチマークで77.1%を達成し、3 Proと比べて推論性能が2倍以上に向上。Gemini API(AI Studio経由)、Gemini CLI、Google Antigravity、Android Studio、Vertex AI、Gemini Enterprise、Geminiアプリ、NotebookLMに展開開始。Gemini AI Pro・Ultraプラン向けの利用上限も引き上げ。GAリリース前の検証フェーズとして今回はプレビュー提供。

Google DeepMindの最新音楽生成モデル「Lyria 3」が2026年2月18日からGeminiアプリにβ版として統合。テキストや画像・映像を入力して30秒のカスタム楽曲が作れる。歌詞の自動生成やvocal/tempo/styleの詳細制御が可能になり、生成楽曲にはSynthIDの透かしが全件埋め込まれる。YouTubeのDream Trackでも展開が開始された。

GoogleエンジニアがプロンプトをそのままコピーしてLLMに再送する「Prompt Repetition」を提案・検証。非推論モードのGemini・GPT・Claude・DeepSeekの7モデルについて70ベンチマーク組み合わせで47勝0敗を記録。生成トークン数が概ね増えないためレイテンシへの影響も限定的で、既存システムへのドロップイン適用が可能な点が特徴。

Gemini 3 Deep Thinkは、Googleが科学・研究・工学向けに強化した推論モードです。難度の高い学術ベンチマークでの結果を示しつつ、Google AI UltraとGemini API早期アクセスで実利用フェーズへ進んだ点が重要です。

Alphabet CEOのSundar PichaiがQ4 2025決算を発表。年間売上高が初めて4000億ドルを超え、Gemini 3の12月ローンチが全事業の成長を牽引しました。Google Cloud収益は48%成長、Geminiアプリは7.5億MAUを達成。2026年の設備投資は1750〜1850億ドルを予定しています。

GoogleはGemini 3 Flashに「Agentic Vision」機能を導入しました。従来の静的な画像認識とは異なり、AIが「思考(Think)→行動(Act)→観察(Observe)」のループを回し、Pythonコードを実行して画像をズーム、アノテーション、分析することで、ピクセルレベルの正確な理解を実現します。

Googleが2026年1月27日、新しいAIサブスクリプションプラン「Google AI Plus」を35カ国で提供開始しました。月額7.99ドル(期間限定50%オフで3.99ドル)で、Gemini 3 Pro、Nano Banana Pro画像生成、Veo 3.1動画生成、NotebookLM、200GBクラウドストレージを利用可能。既存のGoogle One Premium 2TBユーザーには自動付与されます。ProやUltraより手頃な価格で主要AI機能を提供する中間プランとして位置づけられています。

GeminiにPersonal Intelligenceが登場。Gmail・Photos・YouTube・Searchとワンタップ連携し、個人データを活用したパーソナライズを実現。プライバシー設計と米国ベータ開始の詳細を解説します。

Google AntigravityがAIエージェント拡張のためのSkillsシステムを公開。agentskills.ioのオープン標準に基づき、SKILL.mdファイルでエージェントの能力を拡張可能。ワークスペース固有とグローバルの2種類の配置に対応し、プログレッシブ・ディスクロージャーで自動的にスキルを選択・実行する。

Apple公式発表|次世代SiriにGoogle Geminiを採用、2026年内リリース予定. 1. これは何の話? AppleがCNBCに対し、次世代版SiriにGoogle Geminiを採用すると公式に発表しました。「慎重な評価の結果、Googleの技術がApple Foundation

GoogleがVeo 3.1 Ingredients to Videoの大型アップデートを発表。画像から動画を生成する機能が強化され、ネイティブ9:16縦動画出力、1080p/4Kアップスケール、キャラクター・背景の一貫性維持が可能に。Geminiアプリ、YouTube Shorts、Flow、Vertex AIで利用可能。

CES 2026でGoogle TVへのGemini強化を発表。音声で画質・音質調整、写真検索、インタラクティブなDeep Diveが可能に。さらにQualcommとの自動車向けAIエージェント提携を10年に拡大、次世代車載AIを共同開発へ。

ChatGPTの生成AIウェブトラフィックシェアが87%から68%に19ポイント下落。Geminiは5.4%から18.2%に急上昇、3倍以上の成長を記録。Androidエコシステムで優位を築くGoogleの戦略と、OpenAIの対応を分析します。

Google Labsが実験的AI生産性エージェント「CC」を発表。Gemini搭載でGmail/Drive/Calendarを統合し、日々のタスク整理を自動化します。

GoogleのNano Bananaに描画プロンプト機能が追加。画像上に直接描き込んで編集箇所を指定でき、テキストプロンプトなしで精密な編集が可能に。

360ChannelがGoogle AIプロジェクト『Music Video with Gemini』に参画し、藤井隆の名曲3曲のMV制作で動画生成AI「Veo」を活用。オリジナルCFの世界観をAIで拡張するプロンプトエンジニアリングを担当。

Google Labsが開発するAIミニアプリ作成ツール「Opal」がGeminiウェブアプリに直接統合されました。Gemsマネージャーから実験的なGemsとしてミニアプリを作成でき、プロンプトをステップリストで可視化する新機能も追加。高度なカスタマイズにはopal.googleのAdvanced Editorを利用可能です。

Gemini 2.5 Native Audioがアップグレード、リアルタイム音声翻訳も登場. 1. これは何の話? 音声AIを活用したカスタマーサービスやリアルタイム翻訳を検討する開発者・企業向けに、GoogleがGemini音声モデルの大幅アップグレードを発表しました。今回のアップデートでは、Gemini 2.5
Google Pixel Watch 4にAIジェスチャー機能追加、ダブルピンチで操作可能に. 1. これは何の話? ウェアラブルデバイスでのAI活用に関心のあるユーザー向けに、GoogleがPixel Watch 4のジェスチャー機能を拡充しました。

ディズニーがGoogleのAIモデルによる著作権侵害を主張し停止通告書を送付。一方でOpenAIとは200以上のキャラクターをライセンスする10億ドル規模の契約を締結し、AIと著作権をめぐる対照的な姿勢を鮮明にしています。

Googleがより強力になったGemini Deep ResearchエージェントをInteractions API経由で提供開始。開発者は自律型リサーチ機能をアプリに組み込め、新ベンチマークDeepSearchQAも公開されました。

GoogleがGeminiモデルやDeep Researchエージェントと対話するための統一インターフェース「Interactions API」を発表。サーバーサイド状態管理、バックグラウンド実行などエージェントアプリ構築を支援する機能を提供します。

Gemini 2.5 Flash/Pro TTS プレビュー登場 ─ 表現力・ペース制御・多言語マルチスピーカーが大幅強化. 1. これは何の話? オーディオブック、ポッドキャスト、eラーニング教材など 高品質な音声コンテンツ を作りたい開発者やクリエイター向けに、Google が Gemini 2.5 Flash

Google DeepMindが開発したAlphaEvolveがGoogle Cloudで限定公開。Geminiモデルと進化的アルゴリズムを融合し、データセンター効率化やTPU設計など自社でも実績を出した最適化エージェントが企業向けに提供開始。

Nano Banana Pro で日本語テキスト描写が劇的進化 ─ Gemini公式が語る5つの特徴と活用術. 1. これは何の話? AI画像生成を業務や創作に活用したいクリエイター・マーケター向けに、Google の Gemini 公式 note が Nano Banana Pro の特徴と活用術を解説しました。

Geminiアプリで「Deep Think」モードが利用可能に(Google AI Ultra契約者限定)。複数の仮説を並列検証する高度な推論プロセスにより、数学・科学・論理の難問解決力が劇的に向上
Geminiの検索ハルシネーションを防ぐカスタム指示. Geminiがいきなり回答生成を始めてしまい、検索結果をハルシネーションで上書きしてしまう問題に対する解決策です。 「回答前の確認プロセス」として、情報の鮮度を自問し、必要なら必ず検索を行うよう指示することで、正確な情報提供を促します。 https://x.
OpenAI Code Red: Garlic & Shallotpeat (Combined Update). OpenAIがGoogleのGemini 3.0の性能を受けて「Code Red(緊急事態)」を宣言しました。 内部ではGemini

Gemini 3ベースのNano Banana Pro向けプロンプト術7選を解説し、テキスト描写や構図制御のコツを整理する。

Gemini 3、Nano Banana Pro、NotebookLMのアップデートを紹介する動画の要点を整理し、エコシステム強化の方向性をまとめる。