ComfyMaster の履歴(No.20)

私的AI研究会 > ComfyMaster

「ComfyUI マスターガイド」読解メモ　== 編集中 ==†

　「ComfyUI マスターガイド」を読み解く

▲　目　次

「ComfyUI マスターガイド」読解メモ　== 編集中 ==
- 「ComfyUI マスターガイド」
- 更新履歴
参考資料

※ 最終更新:2026/03/08　

↑

「ComfyUI マスターガイド」†

「ComfyUI マスターガイド」学習メモ

↑

はじめに†

書籍「ComfyUI マスターガイド」（SB クリエイティブ刊）を参考にして「ComfyUI」の使い方をまとめる
「SDXL」モデルを中心に体系的にまとめられているので、これまで作成してきた「SD1.5」ワークフローを同じように再構築する

↑

ワークフロー†

ComfyUI_ex_proj.zip をダウンロード（随時更新中）※2026/03/04更新
・解凍してできるフォルダ

📂ComfyUI
  ├─📂input　　　　　　　　　　　　　　← ワークフローに含まれる入力画像
  └─📂user
        └─📂default
              └─📂workflows　　　　　　　　← ワークフローの保存場所（この章で作成するワークフロー）

・解凍してできる「ComfyUI/」フォルダを「StabilityMatrix/Data/Packages/ComfyUI」へ上書きコピーする

プライベート仕様
・冒頭に 4桁の識別番号（分類番号）をつける
・最終出力ノードは「Preview」「Save」を付加して必要に応じて保存できるようにする
　　保存ファイル：　[日付 YYYY-MM-DD]/[識別番号 XXXX]_[日付 YYYY-MM-DD]_[連番 XXXXX]_.png

・画像サイズの指定の必要なワークフローでは、できるだけ切り替え設定できるノードにする

ID 方向内容

1 landscape 横配置

2 portrait 縦配置

3 square 正方形

ID	方向	内容
1	landscape	横配置
2	portrait	縦配置
3	square	正方形

ワークフローの一覧

決定版ワークフロー	機能（詳細ページへのリンク）	このサイトにある同じ機能のワークフロー
1001_sd15_t2i_base.json	SD15 モデル Text To Image 基本ワークフロー	base.json, txt2img_webui_test.json, bs_text2img.json
1002_sd15_t2i_hires.json	SD15 モデル Text To Image 高解像度 (hires.fix)	bs_text2img_hires.json
1003_sd15_i2i_base.json	SD15 モデル Image To Image 基本ワークフロー	bs_img2img.json
1004_sd15_i2i_inpaint.json	SD15 モデル Inpaint ワークフロー	i2i_inpaint.json
1005_sd15_i2i_inpaint.json	SD15 モデル Outpaint ワークフロー	test_img2img_outpaint.json
1111_sdxl_t2i_base.json	SDXL モデル Text To Image 基本ワークフロー	base-sdxl.json
1112_sdxl_t2i_hires.json	SDXL モデル Text To Image 高解像度 (hires.fix)
1113_sdxl_i2i_base.json	SDXL モデル Image To Image 基本ワークフロー
1114_sdxl_i2i_inpaint.json	SDXL モデル Inpaint ワークフロー
1115_sdxl_i2i_outpaint.json	SDXL モデル Outpaint ワークフロー
2101_z_image_turbo_simple.json	Z-Image-Turbo 基本ワークフロー	image_z_image_turbo
2102_z_image_turbo_controlnet.json	Z-Image-Turbo コントロールネットで画像を制御
2111_z_image_base_simple.json	Z-Image-Base 基本ワークフロー	image_z_image_base
3111_flux1_schnell_simple.json	FLUX.1モデル Text To Image 基本ワークフロー

ワークフローと動作環境による生成時間（分：秒）

ワークフロー	機　能	CPU					CPU
ワークフロー	機　能	RTX 4070	RTX 4060	RTX 4060L	RTX 3050	GTX 1050	i7-1260P	i7-1185G7
1001_sd15_t2i_base.json	SD15モデル T2I基本ワークフロー	00:07.90	00:16.70	00:20.84	00:37.82	00:53.22	05:30.83	05:03.94
1002_sd15_t2i_hires.json	SD15モデル T2I高解像度 (hires.fix)	00:10.24	00:16.55	00:23.46	00:32.25	03:24.60	30:21.26	25:54.37
1003_sd15_i2i_base.json	SD15モデル I2I基本ワークフロー	00:05.64	00:06.22	00:18.66	00:33.65	00:29.81	03:13.47	02:58.65
1004_sd15_i2i_inpaint.json	SD15モデル Inpaintワークフロー	00:02.14	00:02.57	00:04.09	00:05.85	00:26.25	03:09.29	02:56.59
1005_sd15_i2i_inpaint.json	SD15 モデル Outpaintワークフロー
1111_sdxl_t2i_base.json	SDXLモデル T2I基本ワークフロー	00:36.48	00:50.17	00:44.20	02:36.31	03:29.06	26:12.80	21:03.79
1112_sdxl_t2i_hires.json	SDXLモデル T2I高解像度 (hires.fix)	01:08.33	01:52.59	02:13.50	05:00.20	23:54.44	223:14.65	160:42.34
1113_sdxl_i2i_base.json	SDXLモデル I2I基本ワークフロー	00:14.06	00:19.43	00:41.96	02:51.50	03:33.91	29:21.72	21:38.96
1114_sdxl_i2i_inpaint.json	SDXLモデル Inpaintワークフロー	00:14.06	00:20.58	00:55.78	00:40.58	03:20.98	20:13.70	21:33.10
1115_sdxl_i2i_outpaint.json	SDXL モデル Outpaintワークフロー
2101_z_image_turbo_simple.json	Z-Image-Turbo 基本ワークフロー	00:07.46	00:18.99	00:27.22	00:39.74	05:05.45	34:09.71	27:47.87
2102_z_image_turbo_controlnet.json	Z-Image-Turbo コントロールネット	00:07.22	00:21.02	00:29.68	00:43.61	05:38.72	41:15.66	31:09.73
2111_z_image_base_simple.json	Z-Image-Base 基本ワークフロー	00:35.91	01:28.12	02:27.91	04:10.93	23:17.65	283:57.25	199:24.86
3111_flux1_schnell_simple.json	FLUX.1 モデル基本ワークフロー	01:06.92	01:23.28	01:22.22	05:37.47	04:24.33	37:26.13	×

↑

『SD1.5』†

　「ComfyUI マスターガイド」では SDXL モデルを主にしているが、これまでの SD1.5 系のワークフローについても見直して再構成してみる

SD1.5 モデルのパフォーマンスを発揮するための推奨解像度

width height 比率

正方形 512 512 1:1

横長画像 768 512 3:2

縦長画像 512 768 2:3

	width	height	比率
正方形	512	512	1:1
横長画像	768	512	3:2
縦長画像	512	768	2:3

『SD1.5』Text To Image 基本ワークフロー

model StableDiffusion モデル（SD1.5 系）

size (pixel) 768x512, 512x768, 512x512

Workflow
1001_sd15_t2i_base.json

『SD1.5』「Hires.fix」Text To Image 高解像度の画像生成ワークフロー

model StableDiffusion モデル（SD1.5 系）

size (pixel) 768x512, 512x768, 512x512

Workflow
1002_sd15_t2i_hires.json

『SD1.5』Image To Image 基本ワークフロー

model StableDiffusion モデル（SD1.5 系）

size (pixel) 768x512, 512x768, 512x512

Workflow
1003_sd15_i2i_base.json

『SD1.5』Inpaint ワークフロー

model StableDiffusion モデル（SD1.5 系）

size (pixel) 768x512, 512x768, 512x512

Workflow
1004_sd15_i2i_inpaint.json

『SD1.5』Outpaint ワークフロー

model StableDiffusion モデル（SD1.5 系）

size (pixel) 768x512, 512x768, 512x512

Workflow
1005_sd15_i2i_outpaint.json

↑

『SDXL』†

　「ComfyUI マスターガイド」で取り上げているモデルだけでなくこれまで作成した SDXL モデルのワークフローについても見直して再構成する

SDXL モデルのパフォーマンスを発揮するための推奨解像度

width height 比率

正方形 1024 1024 1:1

横長画像 1152 896 4:3

1216 832 3:2

1344 768 16:9

1536 640 21:9

縦長画像 896 1152 3:4

832 1216 2:3

768 1344 9:16

640 1536 9:21

	width	height	比率
正方形	1024	1024	1:1
横長画像	1152	896	4:3
1216	832	3:2
1344	768	16:9
1536	640	21:9
縦長画像	896	1152	3:4
832	1216	2:3
768	1344	9:16
640	1536	9:21

『SDXL』Text To Image 基本ワークフロー

model realvisxlV50_v50LightningBakedvae.safetensors,　add-detail-xl.safetensors,　SDXL モデル

size (pixel) 1152x896, 896x1152, 1024x1024

Workflow
1111_sdxl_t2i_base.json

『SDXL』「Hires.fix」Text To Image 高解像度の画像生成ワークフロー

・基本的な「text to image」ワークフローに高解像度化を行うと Hires.fix を追加したワークフロー
・Hires.fix(High-Resolution Fix) は、生成された画像をもとにしてより高い解像度の画像を生成する技術
・低解像度の画像に含まれる情報を元に AI が欠落している高周波成分（細部情報）を推論・補完することで高解像度化する
・単なる引き延ばしの拡大とは異なり画像の内部を理解することで補完する過程に AI による推論が行われている
　このような画像の拡大をアップスケール（高解像度化）という

model	realvisxlV50_v50LightningBakedvae.safetensors,　add-detail-xl.safetensors,　SDXL モデル
size (pixel)	2304x1792, 1792x2304, 2048x2048
Workflow	1112_sdxl_t2i_hires.json

『SDXL』Image To Image 基本ワークフロー

・最も基本的な「image to image」ワークフロー。VAE エンコーダーで画像を潜在空間へ圧縮し、空の潜在空間画像の代わりにして画像を生成する
・「text to image」とほとんど同じだが、サンプリングに空の潜在空間ではなく、入力した画像を潜在空間に圧縮したものを使用する
・この技術は、写真の編集や修正、アートスタイルの返還、キャラクターデザインの変更、風景画の変更や拡張など、幅広い用途に活用できる

model	realvisxlV50_v50LightningBakedvae.safetensors,　add-detail-xl.safetensors,　SDXL モデル
size (pixel)	入力画像のサイズ
Workflow	1113_sdxl_i2i_base.json

『SDXL』Inpaint ワークフロー

・「image to image」にカテゴライズされる inpaint と呼ばれるマスクを利用して、入力画像の一部の書き換えを行う
・通常の img2img とは異なる専用の VAE エンコーダーで画像とマスク画像の処理を行う

Prompt	realistic, photograph, 8k, high quality, masterpiece, 1girl, smile, 20 years old, portrait,
	リアル、写真、8k、高品質、傑作、女の子1人、笑顔、20歳、ポートレート、
Negative Prompt	worst quality, low quality, normal quality, text,
	最低品質、低品質、通常品質、テキスト、

入力画像	マスク画像	生成画像

model	realvisxlV50_v50LightningBakedvae.safetensors,　add-detail-xl.safetensors,　SDXL モデル
size (pixel)	入力画像のサイズ
Workflow	1114_sdxl_i2i_inpaint.json

『SDXL』Outpaint ワークフロー

・「image to image」にカテゴライズされる Outpaint と呼ばれる入力画像の外側を新たに生成するもの
・ノード「Pad Image for Outpainting0」を利用し新たに拡張する領域を指定して、そこにプロンプトによる条件付けに従った画像を生成する

Prompt	bright and clear blue sky, light but saturated blue, vibrant sky, no deep blues, white clouds, abundant clouds, detailed clouds, dramatic clouds, cumulus clouds, summertime brightness, clear atmosphere, soft light, vast blue sky
	明るく澄んだ青空、淡いが彩度の高い青、鮮やかな空、深い青がない、白い雲、豊かな雲、細かい雲、ドラマチックな雲、積雲、夏の明るさ、澄んだ空気、柔らかな光、広大な青空
Negative Prompt	worst quality, low quality, normal quality, text,
	最低品質、低品質、通常品質、テキスト、

入力画像	上に 128 pixel 追加生成画像	上に 128+128 pixel 追加生成画像

model	realvisxlV50_v50LightningBakedvae.safetensors,　add-detail-xl.safetensors,　SDXL モデル
size (pixel)	入力画像のサイズ + 指定した拡張サイズ
Workflow	1115_sdxl_i2i_outpaint.json

『SDXL』Gallery 生成画像例
　①

▼　Prompt

　②

▼　Prompt

　③

▼　Prompt

　④

▼　Prompt

　⑤

▼　Prompt

　⑥

▼　Prompt

　⑦

▼　Prompt

↑

『FLUX.1』†

　FLUX.1 の特徴は自然言語の理解力と、幅広い作風の生成力にある。プロンプトを工夫することで従来モデルでは難しかった作風や構成が可能になるかもしれない。
FLUX.1 のワークフローは SD1.5 / SDXL などの StableDiffusion モデルのものとは異なった構造をしている。

FLUX.1 モデルのパフォーマンスを発揮するための解像度設定例

	2.0M pixel		1.0M pixel		0.2M pixel		0.1M pixel		比率
	width	height	width	height	width	height	width	height	比率
正方形	1408	1408	1024	1024	512	512	320	320	1:1
横長画像	1664	1216	1152	896			448	320	4:3
	1728	1152	1216	832	768	512	354	256	3:2
	1920	1088	1344	768			448	256	16:9
	2176	960	1536	640	1216	512	576	256	21:9
縦長画像	1216	1664	896	1152			320	448	3:4
	1152	1728	832	1216	512	768	256	384	2:3
	1088	1920	768	1344			256	448	9:16
	960	2176	640	1536	512	1216	256	576	9:21

『FLUX.1』基本ワークフロー

model flux1-schnell-fp8.safetensors,　t5xxl_fp8_e4m3fn.safetensors,　ae.safetensors

size (pixel) 1152x896, 1024x1024

Workflow
3111_flux1_schnell_simple.json

『FLUX.1』Gallery 生成画像例
　①

▼　Prompt

Hyper-detailed cross-sectional close-up of pour-over coffee preparation by third-wave Japanese barista with competition-level technique, perfectly formed pour creating concentric ripples in coffee grounds, precise temperature gradient visualization from 96°C water to extraction, individual coffee grounds with visible cellular structure, steam with volumetric lighting, Japanese minimalist coffee bar setting with hinoki wood counter showing grain pattern, morning light at precise 32° angle through east-facing windows, reflections in polished brass equipment, shot on Canon EOS R3 with Canon RF 100mm F2.8 L MACRO IS USM at f/4, 16-bit color depth, focus stacked across 45 individual frames, authentic coffee shop ambient sound visualization, microscopic bubbles in crema, scientific accuracy in liquid physics, precise timing at golden ratio point of extraction, Albert Watson lighting with Irving Penn composition, technical perfection with emotional connection

コンテストレベルの技術を持つサードウェーブの日本人バリスタによる、ドリップコーヒーの超詳細な断面クローズアップ、コーヒー粉に同心円状の波紋を描く完璧な注ぎ口、96℃のお湯から抽出までの正確な温度勾配の視覚化、細胞構造が目に見える個々のコーヒー粉、ボリュームのある照明で照らされた蒸気、木目模様が見えるヒノキ材のカウンターを備えた日本のミニマリストコーヒーバーのセッティング、東向きの窓から正確に32度の角度で差し込む朝日、磨かれた真鍮製の器具への反射、Canon EOS R3とCanon RF 100mm F2.8 L MACRO IS USM（f/4）で撮影、16ビットの色深度、45の個別フレームにわたるフォーカススタック、本物のコーヒーショップの環境音の視覚化、クレマの微細な泡、液体物理学の科学的正確さ、黄金比抽出ポイントでの正確なタイミング、アルバート・ワトソンの照明とアーヴィング・ペンの構図、感情的なつながりを伴う完璧な技術的

　②

▼　Prompt

　③

▼　Prompt

Philosophical exploration of Japanese wabi-sabi aesthetics applied to technological decline, featuring abandoned Showa-era electronics factory reclaimed by nature, perfect balance of geometric technological forms and organic growth, hyper-detailed textures of rusting metal with accurate oxidation patterns, fractured concrete with individual aggregate stones, precise botanical accuracy in pioneering plant species, complex interplay of natural and artificial light sources, dust particles illuminated in light shafts with physically accurate behavior, water accumulation creating reflective surfaces with perfect mirror properties, advanced volumetric fog with meteorologically accurate behavior, shot on technical camera with medium format digital back and perspective control lens at f/16 for maximum depth of field, micro and macro scales simultaneously rendered, Andreas Gursky compositional precision with Andrei Tarkovsky atmospheric sensibility, rainfall creating dynamic surface interactions, visible spectrum extended to near-infrared rendering, archeologically accurate technological strata

日本の侘び寂びの美学を技術の衰退に適用した哲学的探求。自然に再生された昭和の廃墟となった電子工場、幾何学的な技術的形態と有機的な成長の完璧なバランス、正確な酸化パターンを持つ錆びた金属の超詳細なテクスチャ、個々の集合石が砕けたコンクリート、先駆的な植物種の正確な植物学的正確さ、自然光源と人工光源の複雑な相互作用、物理的に正確な動作で光軸に照らされた塵の粒子、完璧な鏡面特性を持つ反射面を作り出す水の蓄積、気象学的に正確な動作をする高度なボリュームフォグ。中判デジタルバックと遠近法コントロールレンズを搭載したテクニカルカメラで撮影され、被写界深度を最大化するためにf/16に設定、ミクロとマクロのスケールが同時にレンダリング、アンドレアス・グルスキーの構図の精度とアンドレイ・タルコフスキーの大気の感受性、ダイナミックな表面相互作用を生み出す降雨、近赤外線レンダリングに拡張された可視スペクトル、考古学的に正確な技術地層

↑

更新履歴†

2026/03/03 初版

↑

参考資料†

SDXL
- RealVisXL V5.0 - V5.0 Lightning (BakedVAE)
- Detail Tweaker XL

FLUX.1

model	StableDiffusion モデル（SD1.5 系）
size (pixel)	768x512, 512x768, 512x512
Workflow	1001_sd15_t2i_base.json

model	flux1-schnell-fp8.safetensors,　t5xxl_fp8_e4m3fn.safetensors,　ae.safetensors
size (pixel)	1152x896, 1024x1024
Workflow	3111_flux1_schnell_simple.json

ComfyMaster の履歴(No.20)

「ComfyUI マスターガイド」読解メモ == 編集中 ==†

「ComfyUI マスターガイド」†

はじめに†

ワークフロー†

『SD1.5』†

『SDXL』†

『FLUX.1』†

更新履歴†

参考資料†

「ComfyUI マスターガイド」読解メモ　== 編集中 ==†