私的AI研究会 > ComfyUI13

画像生成AI「ComfyUI」13(実践編Ⅲ) == 編集中 ==

 「ComfyUI」を使ってローカル環境でのAI画像生成を検証する

▲ 目 次
※ 最終更新:2026/04/24 

『ERNIE-Image』を検証する

 2026年4月 中国 Baidu(百度)(バイドゥ)から発表された 日本語文字に対応できる画像生成モデル「ERNIE-Image(アーニー・イメージ)」を検証してみる

概要

プロジェクトで作成するワークフロー

このプロジェクトで作成するワークフローと関連データは下記にアップロードしている(更新されている場合は再度ダウンロードのこと)

画像生成のための環境構築

  1. 必要モデルのダウンロードと配置
    モデル名ファイル名(.safetensors)配置先ダウンロード URL
    checkpointsernie-image/StabilityMatrix/Data/
    Models/
    diffusion_models/ernie-image.safetensors.safetensors
    ernie-image-turboernie-image-turbo.safetensors
    ernie-image-turbo-fp8 ※ernie-image-turbo-fp8.safetensors
    text_encodersernie-image-prompt-enhancertext_encodersernie-image-prompt-enhancer.safetensors
    ministral-3-3bministral-3-3b.safetensors
    VAEflux2-vaeVAE/flux2-vae.safetensors
     ※「ernie-image-turbo-fp8.safetensors」は低メモリー環境の場合「ernie-image-turbo.safetensors」の代わりに使用する(GPU の場合)

Step 1:標準テンプレートによる生成

  1. ワークフローを選ぶ

    ① 左端のメニューから「Template」を選択
    ② 検索欄に「 Ernie-Image 」を入力する
    ③「Ernie Image: Text to Image」を選択する。または
    ④「Ernie Image Turbo: Text to Image」を選ぶ

    ※ エラーが発生する場合はモデルのインストールを再確認する(適切に配置されていればエラーは出ない)

  2. 通常版「Ernie Image: Text to Image」ワークフロー →「image_ernie_image_org.json」
    入力プロンプトPrompt Enhancer によるプロンプト
    High-fashion style summer outfit infographic featuring color-coordinated floating elements arranged in an elegant expanded circular composition. It includes a breathable straw hat, a sleeveless organic cotton top, a flowing pleated skirt, handcrafted leather sandals, and a woven palm leaf handbag. Exquisite annotations highlight fabric breathability, refreshing texture, moisture-wicking properties, and seasonal comfort. The color palette adopts warm neutral tones—ivory white, terracotta, sand, and soft tan. Subtle dynamic trajectories and flowing fabric swirls suggest a gentle summer breeze, while bright natural sunlight creates soft shadows and sun-kissed sheen, in a Mediterranean style. 这是一张高端时尚风格的夏季穿搭信息图,采用优雅的扩展圆形构图。画面中心是一套精心搭配的夏日服饰,所有元素呈环绕状悬浮在空中。主体包括:一顶浅米色的宽檐草帽,质地轻盈透气;一件象牙白色的无袖有机棉上衣,面料纹理清晰可见;一条赤陶色(Terracotta)的长款褶皱裙,裙摆随风飘动;一双手工皮革凉鞋,带有精致的金属扣件;以及一个编织精美的棕榈叶手提包,呈现出自然的植物纹理。背景为柔和的暖中性色调,融合了象牙白、赤陶色、沙色和柔和的浅褐色。画面中点缀着微妙的动态轨迹线和流动的布料旋涡,暗示着温和的夏日微风。明亮的自然阳光从侧方照射,在物体下方投射出柔和的阴影,赋予材质一种“被阳光熏染”的光泽感。整体风格呈现出地中海式的优雅与宁静。画面中分布着多处精致的标注文字,通过细线指向对应的单品,文字内容包括:'Breathable fabric'、'Refreshing texture'、'Moisture-wicking properties' 以及 'Seasonal comfort'。
    色調を合わせた浮遊要素をエレガントな円形の構図に配置した、ハイファッションスタイルのサマーコーディネートのインフォグラフィック。通気性の良い麦わら帽子、袖なしのオーガニックコットントップス、流れるようなプリーツスカート、手作りのレザーサンダル、そしてヤシの葉を編んだハンドバッグが含まれています。精緻な注釈は、生地の通気性、爽やかな質感、吸湿発散性、そして季節の快適さを強調しています。カラーパレットは、アイボリーホワイト、テラコッタ、サンド、ソフトタンといった温かみのあるニュートラルカラーを採用しています。繊細なダイナミックな軌跡と流れるような生地の渦巻きは、穏やかな夏のそよ風を連想させ、明るい自然光は地中海風の柔らかな影と日焼けしたような輝きを生み出します。これは、優雅で広がりのある円形の構図を用いた、夏の装いを特集したハイエンドなファッションインフォグラフィックです。画像の中央には、綿密にコーディネートされた夏の装いが配置され、すべての要素がまるで空中に浮かんでいるかのように見えます。主な要素は、軽量で通気性に優れたライトベージュのつば広麦わら帽子、生地の質感がはっきりと見えるアイボリーのノースリーブオーガニックコットントップス、裾がそよ風になびくプリーツの長いテラコッタ色のスカート、繊細な金属製のバックルが付いた手作りの革サンダル、そして自然な植物の質感が際立つ美しいヤシの葉のハンドバッグです。背景は、アイボリー、テラコッタ、サンド、そして柔らかなライトブラウンをブレンドした、柔らかく温かみのあるニュートラルカラーパレットです。繊細なダイナミックラインと流れるような生地の渦巻きが画像にアクセントを加え、穏やかな夏のそよ風を連想させます。明るい自然光が横から差し込み、被写体の下に柔らかな影を落とし、素材に太陽の光を浴びたような輝きを与えています。全体的なスタイルは、地中海の優雅さと静けさを彷彿とさせます。画像には、対応するアイテムを細い線で示す、繊細なラベル付きのテキストがいくつか配置されています。テキストには、「通気性の良い生地」「爽やかな肌触り」「吸湿発散性」「季節を問わず快適」といったフレーズが含まれています。
    ワークフロー (通常版):「ERNIE/」4100_ernie_image_t2i.jsonSubGraph
    comfyui_820_m.jpg comfyui_820a_m.jpg

  3. 蒸留版「Ernie Image Turbo: Text to Image」ワークフロー →「image_ernie_image_turbo_org.json」
    入力プロンプトPrompt Enhancer によるプロンプト
    A stylized cinematic side-profile medium shot portrait of a young European woman with sleek dark hair in a tight low bun, wearing a crisp white ruffled-collar shirt, eyes closed in serene contemplation, standing against a moody, dark gradient deep indigo-blue twilight sky with layered misty mountain silhouettes in the background, extreme high-contrast split neon lighting: 95% of the scene bathed in deep, saturated cool cyan-blue ambient light (dim, moody, low-key), with a sharp, intense, vivid neon pink-orange rim light tracing her facial profile, neck, and collar, creating bold color blocking and a surreal, artistic aesthetic, minimalist composition, high-fashion editorial, 8K, ultra-sharp focus on subject, moody desaturated blue tones, dramatic contrast, atmospheric depth, tranquil introspective vibe, dark atmospheric background, no overexposure, stylized color grading, neon rim light glow, low-key cool fill light. 这是一张具有电影质感的艺术肖像摄影作品,采用侧面中景构图。画面主体是一位年轻的欧洲女性,她梳着整齐的深色发髻,身穿一件带有褶皱领口的白色衬衫,双眼轻闭,神情宁静沉思。背景是昏暗的深靛蓝色渐变天空,远处可见层叠的山脉剪影,笼罩在朦胧的雾气之中。画面采用极端高对比度的霓虹分割式照明:约95%的场景被深沉、饱和的冷青蓝色环境光笼罩,呈现出低调、忧郁的氛围;而一道锐利、强烈且鲜艳的霓虹粉橙色轮廓光精准地勾勒出人物的面部轮廓、颈部线条和衣领边缘,形成了大胆的色彩分割效果。整体风格极简且富有艺术感,呈现出高级时尚编辑摄影的视觉特征,画面清晰度极高,焦点锐利,色调经过风格化处理,营造出一种超现实的、充满内省气息的氛围。
    スタイリッシュな映画風の横顔ミディアムショットポートレート。滑らかな黒髪を低い位置でタイトなシニヨンにまとめ、パリッとした白いフリル襟のシャツを着て、静かに物思いにふけるように目を閉じている若いヨーロッパ人女性。背景には、霧のかかった山々のシルエットが幾重にも重なった、物憂げで暗いグラデーションの深いインディゴブルーの夕暮れの空が広がっている。極めてコントラストの高いスプリットネオン照明:シーンの95%は、深く彩度の高いクールなシアンブルーの環境光(薄暗く、物憂げで、ローキー)に照らされ、シャープで強烈な鮮やかなネオンピンクオレンジのリムライトが彼女の顔の輪郭、首、襟をなぞり、大胆なカラーブロッキングとシュールで芸術的な美学を生み出している。ミニマルな構図、ハイファッションのエディトリアル、8K、被写体への超シャープなフォーカス、物憂げで彩度の低いブルートーン、劇的なコントラスト、雰囲気のある奥行き、静かで内省的な雰囲気、暗い雰囲気のある背景、露出オーバーなし、スタイリッシュなカラーグレーディング、ネオンリムライト控えめでクールな、温かみのあるフィルライト。これは、中距離からの横からの構図を用いた、映画のような芸術的なポートレート写真です。被写体は、きちんとスタイリングされた黒髪の若いヨーロッパ人女性で、フリル付きの襟の白いブラウスを着て、目を優しく閉じ、穏やかで物思いにふけるような表情をしています。背景は、重厚な深い藍色のグラデーションの空で、遠くには霞がかった山々のシルエットが幾重にも重なっています。この画像では、非常にコントラストの高いネオンセグメント照明が用いられています。シーンの約95%は、深く彩度の高い、クー​​ルなシアンブルーの環境光に照らされ、控えめで憂鬱な雰囲気を醸し出しています。一方、シャープで強烈なネオンピンクオレンジのリムライトが、被写体の顔の輪郭、首筋、襟元を正確に際立たせ、大胆な色彩分割効果を生み出しています。全体的なスタイルはミニマルでありながら芸術的で、ハイファッション誌の編集写真のような視覚的特徴を備えています。画像は非常に鮮明で、細部まで精緻に描写されており、様式化された色調が、シュールで内省的な雰囲気を醸し出している。
    ワークフロー (蒸留版):「ERNIE/」4200_ernie_image_turbo_t2i.jsonSubGraph
    comfyui_821_m.jpg comfyui_821a_m.jpg

  4. Prompt Enhancer(プロンプト拡張)のシステムプロンプト
    中国語(簡体)日本語訳(Gemini による)
    <s>[SYSTEM_PROMPT]你是一个专业的文生图 Prompt 增强助手。你将收到用户的简短图片描述及目标生成分辨率,请据此扩写为一段内容丰富、细节充分的视觉描述,以帮助文生图模型生成高质量的图片。仅输出增强后的描述,不要包含任何解释或前缀。[/SYSTEM_PROMPT][INST]{"prompt": "{prompt}", "width": {width}, "height": {height}}[/INST]<s>[SYSTEM_PROMPT]あなたはプロフェッショナルなテキストベースの画像補正アシスタントです。ユーザーから簡単な画像の説明と目標生成解像度を受け取ります。この説明を、テキストベースの画像モデルが高品質な画像を生成できるよう、豊富で詳細な視覚的説明に展開してください。展開された説明のみを出力し、説明文や接頭辞は含めないでください。[/SYSTEM_PROMPT][INST]{"prompt": "{prompt}", "width": {width}, "height": {height}}[/INST]
    ・Workflowではこの機能を ON/OFFできるようになっているが、単に出力を切り替えているだけで、Prompt拡張自体は毎回作動するのでその分 時間がかかる
    ・システムプロンプトと同じ内容を LLMに設定て Promptを入れると、このシステムプロンプトに沿った内容が生成されるので、ワークフローと分離も可能

  5. ワークフローを整理する(Prompt Enhancer は削除)
    ワークフロー (通常版):「ERNIE/」4101_ernie_image_t2i_simple.jsonワークフロー (蒸留版):「ERNIE/」4201_ernie_image_turbo_t2i_simple.json
    comfyui_822_m.jpg comfyui_823_m.jpg
    4101_2026-04-21_00001_m.jpg
    4101_ernie_image_t2i_simple.json
    4100_2026-04-20_00001_m.jpg
    4100_ernie_image_t2i.json
    4201_2026-04-21_00001_m.jpg
    4201_ernie_image_turbo_t2i_simple.json
    4200_2026-04-20_00001_m.jpg
    4200_ernie_image_turbo_t2i.json

  6. SubGraph 機能で汎用版のワークフローにする
    ワークフロー (通常版):「ERNIE/」4102_ernie_image_t2i_general.jsonワークフロー (蒸留版):「ERNIE/」4202_ernie_image_turbo_t2i_general.json
    comfyui_824_m.jpg comfyui_825_m.jpg

Step 2:文字のあるデザインと日本語プロンプト入力の検証

Step 3:『ChatGPT』でプロンプトを作成

英語/日本語プロンプトによる生成画像の違い

日本語プロンプトによる生成

様々なジャンルの画像生成

Step 2 以降の生成データ詳細

 

更新履歴

 

参考資料