私的AI研究会 > ComfyUI10

画像生成AI「ComfyUI」10(実践編) == 編集中 ==

 「ComfyUI」を使ってローカル環境でのAI画像生成を検証する

▲ 目 次
※ 最終更新:2026/02/27 

『Z-Image-Turbo』を検証する

 高速かつ高品質な画像を生成することができると評価の高い最新の画像生成AIモデル『Z-Image-Turbo』を検証する

概要

プロジェクトで作成するワークフロー

画像生成のための環境構築

  1. 必要モデルのダウンロードと配置
    モデル名ファイル名(.safetensors)配置先ダウンロード URL
    Z-Image-Turbo本体
    diffusion_models
    z_image_turbo_nvfp4/StabilityMatrix/Data/
    Models/
    diffusion_models/https://huggingface.co/Comfy-Org/z_image_turbo/tree/main/split_files/diffusion_models
    z_image_turbo_bf16
    テキストエンコーダー
    text_encoders
    qwen_3_4b_fp4_mixedtext_encoders/https://huggingface.co/Comfy-Org/z_image_turbo/tree/main/split_files/text_encoders
    qwen_3_4b_fp8_mixed
    qwen_3_4b
    vaeaeVAE/https://huggingface.co/Comfy-Org/z_image_turbo/tree/main/split_files/vae
    ControlNetZ-Image-Turbo-Fun-Controlnet-Union/StabilityMatrix/Data/
    Packages/ComfyUI/models/
    model_patches/https://huggingface.co/alibaba-pai/Z-Image-Turbo-Fun-Controlnet-Union/tree/main

Step 1:標準テンプレートによる生成

  1. ワークフローを選ぶ
    ① 左端のメニューから「Template」を選択
    ② 検索欄に「Z-Image-Turbo」を入力する
    ③「Z-Image-Turbo Text to Image」を選ぶ
    ④ アラートダイアログが出るが無視して閉じる
    ⑤ 矮躯フローを拡大して「clip_name」をクリック
    ⑥ 表示されるリストから「qwen_3_4b_fp4_mixed.safetensors」を指定する

  2. ワークフローを実行する
    ①「Run」を押して画像を生成する
    z-image-turbo_00002_m.jpg

  3. ワークフローを整理する
     ※ ワークフロー:「z_image/」fileimage_z_image_turbo.json

Step 2:ComfyUI_examples サイト のワークフローによる生成

  1. サイトからワークフローをダウンロード

    ① ダウンロードしたワークフローに「Preview Image」ノードを追加
    ② ネガティブ・プロンプトは不要なので「ConditioningZeroOut」に置き換える
    ③ プロンプトを変更する
    ④ いめーひサイズを 1024/768ピクセル にする
    ⑤ ノード配置を整理する

  2. ワークフローを実行する
    プロンプト
    Close-up portrait of a young woman in her 20s, natural makeup, soft expression.
    85mm lens, f/1.4, shallow depth of field, bokeh background.
    Soft window light from the left, golden hour glow, warm skin tones.
    Cinematic, realistic, high detail, professional photography.
    NOT: oversaturated, anime style, low resolution, distorted face.
    20代の若い女性のクローズアップポートレート。ナチュラルメイク、柔らかな表情。
    85mmレンズ、f/1.4、浅い被写界深度、背景のボケ。
    左から差し込む柔らかな窓の光、ゴールデンアワーの輝き、温かみのある肌色。
    映画のような、リアルな、細部までこだわった、プロフェッショナルな写真。
    注意点:彩度過度、アニメ調、低解像度、歪んだ顔。
    ワークフロー:「z_image/」file2101_z_image_turbo_simple.json
    comfyui_711_m.jpg

  3. 日本語文字の入ったカタログを生成してみる
    プロンプト
    A luxury-style bilingual (Japanease + English) poster advertisement for a minimalist wireless earphone.
    Show the product on a matte black surface with premium studio lighting, soft highlights on metal edges, deep controlled shadows, and flawless color accuracy.
    Textures should appear refined and tactile, with micro-detail clarity and a high-end commercial finish.
    Design the poster in an elegant, high-fashion aesthetic: generous negative space, balanced composition, and minimal visual noise.
    Use a sophisticated monochrome palette with subtle gold or silver accents to emphasize the premium feel.
    Include a minimal English headline: “Pure Sound. Perfect Silence.”
    Add the Japanease counterpart in refined typography: “純粋な音 · 静寂の極み”.
    Place a small bilingual tagline beneath: “Wireless Crafted Quality · 職人技が宿る仕上り”.
    Ensure the text integrates naturally with the design without distracting from the product.
    Background should be a smooth gradient charcoal black with a luxury ambiance.
    Use centered composition, vertical 3:4 aspect ratio, no logo, no watermark.
    ミニマルなワイヤレスイヤホンの、高級感あふれるバイリンガル(日本語+英語)ポスター広告です。
    マットブラックの表面に、プレミアムスタジオ照明、金属エッジの柔らかなハイライト、深くコントロールされた陰影、そして完璧な色彩精度で製品を映し出します。
    テクスチャは洗練され、触感があり、微細なディテールまで鮮明で、高級感のある商業的な仕上がりを実現します。
    ポスターは、エレガントでハイファッションな美学に基づき、十分なネガティブスペース、バランスの取れた構成、そして最小限の視覚的ノイズでデザインします。
    洗練されたモノクロパレットに、さりげないゴールドまたはシルバーのアクセントを加え、高級感を強調します。
    簡潔な英語の見出し「Pure Sound. Perfect Silence.」を記載します。
    洗練されたタイポグラフィで日本語の見出し「純粋な音・静寂の極み」を追加します。
    その下に、小さなバイリンガルのタグライン「Wireless Crafted Quality・職人技が宿る仕上り」を配置します。
    テキストは、製品から気を散らすことなく、デザインに自然に溶け込むようにしてください。
    背景は、高級感のある滑らかなグラデーションのチャコールブラックにしてください。
    中央配置、縦長の3:4アスペクト比、ロゴや透かしは使用しないでください
    ワークフロー:「z_image/」file2101_z_image_turbo_simple.json
    comfyui_712_m.jpg

Step 3:コントロールネットで画像を制御する

  1. ワークフローを作成する
    ワークフロー:「z_image/」file2102_z_image_turbo_controlnet.json入力画像プロンプト
    comfyui_713_m.jpg portrait_02_m.jpg Close-up portrait of a young woman in her 20s, natural makeup, soft expression.
    85mm lens, f/1.4, shallow depth of field, bokeh background.
    Soft window light from the left, golden hour glow, warm skin tones.
    Cinematic, realistic, high detail, professional photography.
    NOT: oversaturated, anime style, low resolution, distorted face.
  2. ワークフローを実行する
    種類ワークフロー(変更部分)コントロール画像生成画像
    Canny comfyui_714_m.jpg ComfyUI_temp_vpqkh_00001_m.jpg zimage_2026-02-25_00001_m.jpg
    Pose comfyui_715_m.jpg ComfyUI_temp_vpqkh_00002_m.jpg zimage_2026-02-25_00002_m.jpg
    Depyh comfyui_716_m.jpg ComfyUI_temp_vpqkh_00003_m.jpg zimage_2026-02-25_00003_m.jpg
    HED
    LineArt
    comfyui_717_m.jpg ComfyUI_temp_vpqkh_00004_m.jpg zimage_2026-02-25_00004_m.jpg
    MLSD comfyui_718_m.jpg ComfyUI_temp_vpqkh_00005_m.jpg zimage_2026-02-25_00005_m.jpg
 

更新履歴

 

参考資料