GoogleのNano Banana Proが登場。Gemini 3 Proで画像生成とテキスト表現を強化
Googleの画像生成・編集ツールNano Banana Proが公開。Gemini 3 Proを基盤に視覚的忠実度や文脈理解、タイポグラフィ、検索連携、ローカル編集を強化。提供範囲と料金も解説。多言語対応、2K/4K生成、NotebookLMやAI in Searchでの提供状況も紹介し、利用プラン別の上限チェック。
Googleの画像生成・編集ツールNano Banana Proが公開。Gemini 3 Proを基盤に視覚的忠実度や文脈理解、タイポグラフィ、検索連携、ローカル編集を強化。提供範囲と料金も解説。多言語対応、2K/4K生成、NotebookLMやAI in Searchでの提供状況も紹介し、利用プラン別の上限チェック。
© B. Naumkin
Googleは画像生成・編集ツール「Nano Banana」を拡充し、前日に正式公開された「Gemini 3 Pro」モデルを土台にした新バージョン「Nano Banana Pro」を投入した。今回の刷新は、視覚的な忠実度をいっそう高め、文脈の捉え方にも手堅い改良を加えている。
Googleによれば、Nano Banana Proはプロトタイプやインフォグラフィックから、手書きメモをもとに自動生成するチャートまで、ほぼあらゆる種類のビジュアル素材づくりを支援するという。推論の連鎖が強化され、現実世界への理解が深まり、最新データにもアクセスできるため、学習用の資料や視覚的なガイドも精密に仕上げられる。狙いは単に“絵を作る”ことにとどまらず、説明性のある役立つビジュアルを組み立てる方向に明確に振れている。
検索との連携も大きい。Pro版はGoogle Searchと結びつくことで、レシピから料理のイメージを即座に可視化したり、現在の天気情報を引き出したり、スポーツの統計を表示したりと、リアルタイムで情報を絵に落とし込める。
テキスト処理は目玉の改良点だ。Nano Banana Proは画像上の文字表現をはるかに忠実に再現でき、レイアウト、ポスター、チャートでも、複雑な書体やカリグラフィー風のニュアンス、さまざまな質感を伴った緻密なタイポグラフィを描ける。Geminiの多言語アーキテクチャにより、異なる言語での文言作成や翻訳、既存ビジュアルのローカライズにも対応する。制作現場では、この“文字の強さ”が効いてきそうだ。
編集機能も一段と細やかだ。最大14枚の画像をひとつのシーンに合成し、同時に最大5人の顔の特徴を保ったまま扱えるほか、画像の任意の部分にピンポイントなローカル編集を加えられる。カメラアングル、被写界深度、照明、カラーグレーディングの変更もひとつのプロンプトで指示可能で、2K/4Kかつ多様なアスペクト比での生成に対応する。総じて、プロンプトから離れずに精密なコントロールへ踏み込む姿勢が読み取れる。
提供状況は次のとおりだ。「Gemini」アプリでは、モデルに「Reasoning」を選んだうえで「Create images」モードを使うと、すでに世界中でNano Banana Proを利用できる。無料ユーザーには制限枠が設定され、上限に達すると標準版のNano Bananaに切り替わる。有料のGoogle AI Plus、Pro、Ultraの各プラン加入者には、より広い生成上限が用意されている。
米国では、「AI in Search」モードでもGoogle AI ProおよびAI Ultraの加入者がNano Banana Proを利用可能だ。更新版モデルは、世界の加入者向けにNotebookLMにも展開されている。