1. これは何の話?

Gemini CLI向けの画像生成・編集・修復拡張機能「Nano Banana」が、gemini-cli-extensions オーガニゼーション配下のGitHubリポジトリで公開された。コマンドラインから自然言語プロンプトを入力するだけで、テキストから画像を生成したり、既存画像を編集・修復したりできる。[1]

Gemini CLI自体はGoogleが提供するターミナルベースのAIアシスタントだが、拡張機能(Extensions)の仕組みを通じて機能を追加できる。Nano BananaはGemini CLIにとって初の本格的な画像生成特化拡張として位置付けられている。

2. 何がわかったか

Nano Banana 機能概要フロー

Nano Bananaが提供する主な機能は以下のとおりだ。[1]

画像生成:テキストプロンプトから画像を生成。スタイル・バリエーション・サイズを細かく指定できる。

画像編集:既存の画像にテキスト指示で変更を加えるインペインティング相当の操作が可能。

画像修復:古くなった、または損傷した写真の復元・強化処理をサポート。

対応モデル

  • gemini-3.1-flash-image-preview(Nano Banana 2・デフォルト)
  • gemini-3-pro-image-preview(Nano Banana Pro・高品質)
  • gemini-2.5-flash-image(Nano Banana v1)

ファイル管理:スマートなファイル名の自動生成と重複ファイルの自動防止機能を内蔵。

特化した生成カテゴリ:アイコン生成・パターン&テクスチャ生成・ビジュアルストーリーテリング・技術ダイアグラム生成といった専用コマンドが用意されている。

3. 他とどう違うのか

画像生成AIツールは数多く存在するが、Nano BananaはGemini CLIの拡張として動作するため、開発ワークフローと統合しやすい点が特徴だ。[1]

たとえばコードレビューの流れの中でアーキテクチャ図をその場で生成しCLI上で管理する、といった使い方が想定される。MCP(Model Context Protocol)サーバーとして動作する設計になっており、他のGemini CLI拡張と同一のプロトコルで連携できる。GUI不要でAPIキーとコマンド操作のみで完結するため、CIパイプラインへの組み込みも視野に入る。

4. なぜこれが重要か

3つの対応モデル比較

Gemini CLIのエコシステムが拡張機能プラットフォームとして成熟しつつある証左として、今回のリリースは重要だ。geminicli.comのExtensions Marketplaceには現時点で430以上の拡張が並んでおり、Nano Bananaも有力な画像生成ツールとしてエコシステムを牽引している。[2]

テキスト→コード→画像という一連の制作物をCLI一つで生成・管理できる環境が整備されることで、単独の開発者やスモールチームの制作効率大幅向上が見込まれる。

5. 未来の展開・戦略性

GeminiモデルはGemini 3.1 Flashなど最新世代への更新が続いており、Nano Bananaが対応モデルを追随して更新することで、画質・速度の両面で恩恵を受ける構造になっている。

Nano Banana ProがGemini 3 Pro画像プレビューを使う設計は、将来的な商用グレードの高解像度生成拡張への道筋を示している。また、ビジュアルストーリーテリングやダイアグラム生成などのドメイン特化コマンドが先行実装されていることから、職種別ユースケース拡充への積極的な設計意図が読み取れる。

6. どう考え、どう動くか

コマンド操作フロー

CLIベースで開発業務をこなすエンジニア・デザイナーにとって、Nano Bananaは試してみる価値が高い。インストールは1コマンドで完了し、初期コストが低い。[1]

指針:

  • gemini extensions install https://github.com/gemini-cli-extensions/nanobanana でインストールし、最初は generate image コマンドをシンプルなプロンプトで試す。
  • 技術ダイアグラム生成(UML・フローチャート)機能を試し、既存のドキュメント生成ワークフローと組み合わせられるか評価する。
  • Nano Banana ProとNano Banana 2の生成品質を同一プロンプトで比較し、速度・品質トレードオフを計測する。

次の一歩:
・今日やること:NANOBANANA_GEMINI_API_KEY を設定してインストールし、アイコン1枚を生成してみる。
・今週やること:プロジェクトのアーキテクチャ図やカバー画像の生成をNano Banana経由で試し、既存ツールとの比較レポートをまとめる。

7. 限界と未確定

  • Nano Banana Proが使用する gemini-3-pro-image-preview は現時点でプレビュー段階であり、安定版での挙動が変わる可能性がある。[1]
  • 生成コストはGemini APIの従量課金に依存し、高解像度・大量生成では費用が嵩む可能性がある。
  • GUI生成ツール(Midjourney・DALL·E等)と比べた生成品質の客観的な比較データは未公開のため、ユースケースごとに判断が必要。
  • Real-ESRGANによる超解像処理はドキュメントに言及があるが、設定の複雑さは利用者によって異なる。

8. 用語ミニ解説

  • Gemini CLI:Googleが提供するターミナルベースのAIアシスタント。コマンドラインから自然言語でAI機能を呼び出せる。(Gemini Command Line Interface)
  • Gemini CLI Extensions:Gemini CLIの機能を拡張するプラグイン機構。GitHubリポジトリをURLで指定して1コマンドでインストールできる。
  • MCP(Model Context Protocol):AI モデルとツール間の通信を標準化するプロトコル。Nano BananaはMCPサーバーとして動作する。
  • Nano Banana 2 / Pro / v1:Gemini画像生成モデルの通称。ProはGemini 3 Pro、2はGemini 3.1 Flash、v1はGemini 2.5 Flashをベースとする。

9. 出典と日付

[1] GitHub - gemini-cli-extensions/nanobanana(最終確認日:2026-03-03):https://github.com/gemini-cli-extensions/nanobanana
[2] geminicli.com Extensions Marketplace(最終確認日:2026-03-03):https://geminicli.com/extensions/