Documentation Index
Fetch the complete documentation index at: https://dripart-mintlify-e28287af.mintlify.app/llms.txt
Use this file to discover all available pages before exploring further.
Qwen-Image-Layered は、アリババ社の通義千問(Qwen)チームが開発したモデルで、入力画像を複数の RGBA レイヤーに分解することができます。このレイヤー化された表現により、本質的な編集可能性が実現されます:各レイヤーを他のコンテンツに影響を与えることなく独立して操作できます。
主な特長:
- 本質的な編集可能性:各レイヤーを他のコンテンツに影響を与えることなく独立して操作可能
- 高忠実度の基本操作:サイズ変更、再配置、色変更をサポート。意味的コンポーネント間で物理的に分離された状態を維持
- 可変レイヤー数の分解:固定数のレイヤーに限定されず、必要に応じて 3、4、8、あるいはそれ以上のレイヤーへと分解可能
- 再帰的分解:任意のレイヤーをさらに細分化でき、無限の分解深度を実現
関連リンク:
Qwen-Image-Layered ワークフロー
JSON ワークフローファイルをダウンロード
ComfyUI Cloud で実行
Make sure your ComfyUI is updated.Workflows in this guide can be found in the Workflow Templates.
If you can’t find them in the template, your ComfyUI may be outdated. (Desktop version’s update will delay sometime)If nodes are missing when loading a workflow, possible reasons:
- You are not using the latest ComfyUI version (Nightly version)
- Some nodes failed to import at startup
- The Desktop is base on ComfyUI stable release, it will auto-update when there is a new Desktop stable release available.
- Cloud will update after ComfyUI stable release.
So, if you find any core node missing in this document, it might be because the new core nodes have not yet been released in the latest stable version. Please wait for the next stable release.
モデルのダウンロード先
text_encoders
diffusion_models
vae
モデルの保存場所
📂 ComfyUI/
├── 📂 models/
│ ├── 📂 text_encoders/
│ │ └── qwen_2.5_vl_7b_fp8_scaled.safetensors
│ ├── 📂 diffusion_models/
│ │ └── qwen_image_layered_bf16.safetensors
│ └── 📂 vae/
│ └── qwen_image_layered_vae.safetensors
FP8 バージョン
デフォルトでは bf16 を使用していますが、これは高い VRAM を必要とします。VRAM 使用量を削減したい場合は、FP8 バージョンをご利用ください:
その後、サブグラフ内の Load Diffusion model ノードを更新し、このファイルを使用するように設定してください。
ワークフローの設定
サンプラー設定
このモデルは処理が遅いため、オリジナルのサンプリング設定(ステップ数: 50、CFG: 4.0)では、生成時間が少なくとも2倍になります。
入力サイズ
入力サイズとしては、640px を推奨します。高解像度出力を希望する場合は、1024px を使用してください。
プロンプト(任意)
テキストプロンプトは、入力画像全体の内容を記述することを目的としています——たとえば、前景オブジェクトの後ろに隠れている文字など、部分的に遮蔽されている要素も含めて指定可能です。ただし、個々のレイヤーの意味的内容を明示的に制御するためのものではありません。