Google Gemini API ノード ComfyUI 公式サンプル

Google Gemini は、Google が開発した強力な AI モデルであり、対話およびテキスト生成機能をサポートしています。現在、ComfyUI には Google Gemini API が統合されており、関連ノードを ComfyUI 上で直接使用して対話機能を実現できます。本ガイドでは、対話機能の実装手順を段階的に解説します。

APIノードを使用するには、正しくログインしていることと、許可されたネットワーク環境で使用していることを確認する必要があります。APIノードの使用に必要な具体的な要件については、ドキュメントの「APIノードの概要」セクションをご参照ください。

ポータブル版または自宅サーバーで実行しているユーザー
デスクトップ版またはクラウド版ユーザー

ComfyUI が最新版に更新されていることを確認してください。

このガイドで紹介するワークフローは、ワークフローテンプレートから入手できます。
テンプレート内に該当のワークフローが見つからない場合、ComfyUI のバージョンが古くなっている可能性があります。（デスクトップ版の更新は若干遅れることがあります）ワークフローを読み込んだ際にノードが欠落している場合の主な原因：

最新の ComfyUI（Nightly 版）を使用していない
起動時に一部のノードのインポートに失敗している

Google Gemini Chat ワークフロー

1. ワークフローファイルのダウンロード

以下の JSON ファイルをダウンロードし、ComfyUI にドラッグ＆ドロップすることで、対応するワークフローを読み込むことができます。

JSON 形式のワークフローファイルをダウンロード

2. ワークフロー実行の手順

対応するテンプレートでは、画像を解析して描画プロンプトへと変換するための「役割プロンプト（role prompt）」を生成するためのプロンプトを構築しています。

画像内の番号を参考にして、基本的なテキストから画像を生成するワークフローを実行してください：

Load Image ノードで、AI に解析してほしい画像を読み込みます。
（任意）必要に応じて、Google Gemini ノード内のプロンプトを編集し、AI に特定のタスクを実行させることができます。
Run ボタンをクリックするか、ショートカットキー Ctrl（Windows）／Cmd（macOS） + Enter を押して対話を実行します。
API からの結果が返信されるのを待った後、Preview Any ノードで AI が返した内容を確認できます。

3. 補足情報

現在、ファイル入力ノード Gemini Input Files は、ファイルを事前に ComfyUI/input/ ディレクトリへアップロードする必要があります。このノードは現在改良中であり、更新後にテンプレートも修正する予定です。
ワークフローには、Batch Images を用いた入力のサンプルが含まれています。複数の画像を AI に解析させる必要がある場合は、手順図を参考に、対象ノードを右クリックしてモードを Always（常に実行） に設定することで有効化できます。

はじめに

基本概念

インターフェースガイド

チュートリアル

Google Gemini API ノード ComfyUI 公式サンプル

Google Gemini Chat ワークフロー

1. ワークフローファイルのダウンロード

2. ワークフロー実行の手順

3. 補足情報

はじめに

基本概念

インターフェースガイド

チュートリアル

Documentation Index

​Google Gemini Chat ワークフロー

​1. ワークフローファイルのダウンロード

​2. ワークフロー実行の手順

​3. 補足情報

Google Gemini Chat ワークフロー

1. ワークフローファイルのダウンロード

2. ワークフロー実行の手順

3. 補足情報