私的AI研究会 > Diffusion > SDtutorial

 画像生成 AI「Stable Diffusion」チュートリアル 1 基本編

StableDiffusion_902_m.jpg

 画像生成 AI「Stable Diffusion」の操作ガイド

▲ 目 次
※ 最終更新:2025/03/05 

「Stable Diffusion web UI」最初の一歩

はじめに

基本操作編

Diffusion_51_m.jpg
  1. 最も簡単に 画像を生成する

    ① モデルを指定する
     v1-5-pruned-emaonly.safetensors(v1.5 標準モデル)

    ② プロンプトを入力
     " a busy city street in a modern city"(近代的な都市のにぎやかな街路)

    ③「Generate」を押す

    ④ 生成結果の画像表示
    ⑤ 生成パラメータに表示
    ⑥ 生成画像ファイルの場所を開くボタン
    ・生成画像
    web UI v1.10web UI v1.6web UI v1.6 (OpenVINO)
    tutorial_001_m.jpg tutorial_002_m.jpg tutorial_011_m.jpg tutorial_012_m.jpg tutorial_021_m.jpg tutorial_022_m.jpg
    00000-1144206800001-149166379300000-1144206800001-149166379300000-1144206800001-1491663793
    Steps: 20, Sampler: DPM++ 2M, Schedule type: Automatic, CFG scale: 7, Version: v1.10.1 / v1.6.1
    入力したプロンプト(英語)から画像を生成することができます。
     生成結果は「stable-diffusion-webui/outputs/txt2img-images/XXXX-XX-XX/」(XX… は日付) フォルダに保存 ⑥ボタンで表示されます
     ファイル名は '5桁通し番号-シード値.png'

  2. 出力画像から生成パラメータを得る
    元画像元画像からパラメータを取得して画像生成する手順
    00100-2290528465.png

    この画像をダウンロードして元画像とする
     生成パラメータを取得する

    ①「PNG info」タブを選択

    ② 元画像をドラッグアンドドロップ

    ③「Send to txt2img」を押す
    Diffusion_52_m.jpg
     画像を生成する

    ④「txt2img」タブを選択

    ⑤ モデルを選ぶ

    ⑥「Generate」ボタンを押す
    web UI v1.10web UI v1.6web UI v1.6(OV)
    tutorial_031_m.jpg tutorial_033_m.jpg tutorial_035_m.jpg
    Steps: 20, Seed 2290528465, Sampler: Euler a, Schedule type: Automatic, CFG scale: 7, Version: v1.10.1 / v1.6.1
    「PNG info」機能を利用することで生成済みの画像から各種パラメータを取得して画像を再生成することができます。
     (処理ソフトなどで加工した 'png' ファイルはタグ情報が消去されるため利用できません)

  3. 生成モデルを変えてみる

    標準モデル(v1-5-pruned-emaonly.safetensors)は人物の生成には向いていないので、別のモデルを用意します

    1. 次の リンク から beautifulRealistic_brav5.safetensors モデルをダウンロードします
    2. ダウンロードしたファイルを「./models/Stable-diffusion/」に配置します
    3. Webページを閉じターミナルを終了してから、再度「Stable Diffusion web UI」を起動して上記操作を行います
    4.⑤で配置したモデルを選択してから ⑥「Generate」ボタンを押します

    ・生成画像の比較
    v1-5-pruned-emaonlybeautifulRealistic_brav5
    web UI v1.10web UI v1.6web UI v1.6 (OV)web UI v1.10web UI v1.6web UI v1.6 (OV)
    tutorial_031_m.jpg tutorial_033_m.jpg tutorial_035_m.jpg tutorial_032_m.jpg tutorial_034_m.jpg tutorial_036_m.jpg
    Steps: 20, Seed 2290528465, Sampler: Euler a, Schedule type: Automatic, CFG scale: 7, Version: v1.10.1 / v1.6.1
    モデルは生成画像の品質に大きく影響します。画像の種類によって適切なモデルを指定することで生成結果の品質が向上します。
     → StableDiffusion モデル

パラメータ設定編1

  1. ⑫ シード値 Seed
    番号メニュー機 能
    Seedシード値「-1」はランダム生成、特定の画像を生成したい場合はその画像のシード値を入力する
    StableDiffusion_00-11.jpgランダム生成シード値を -1 に設定
    StableDiffusion_00-12.jpgリロード現在のシード値に固定

    ・シード値を変えた場合の生成画像
    beautifulRealistic_brav5
    web UI v1.10web UI v1.6 (OpenVINO)
    tutorial_042_m.jpg tutorial_043_m.jpg tutorial_041_m.jpg tutorial_044_m.jpg tutorial_045_m.jpg tutorial_046_m.jpg
    1679936866172166774168188530016799368661721667741681885300
    Steps: 20, Sampler: Euler a, Schedule type: Automatic, CFG scale: 7, Version: v1.10.1 / v1.6.1
    シード値を固定すれば同じ条件下で同じ画像を生成することができます

  2. ⑨ 画像サイズ Width/Height
    ModelbeautifulRealistic_brav5
    Ver.web UI v1.10web UI v1.6 (OpenVINO)
    512x512 tutorial_042_m.jpg tutorial_043_m.jpg tutorial_041_m.jpg tutorial_044_m.jpg tutorial_045_m.jpg tutorial_046_m.jpg
    768x512 tutorial_052_m.jpg tutorial_055_m.jpg tutorial_058_m.jpg tutorial_062_m.jpg tutorial_065_m.jpg tutorial_068_m.jpg
    512x768 tutorial_053_m.jpg tutorial_056_m.jpg tutorial_053_m.jpg tutorial_063_m.jpg tutorial_066_m.jpg tutorial_069_m.jpg
    Seed1679936866172166774168188530016799368661721667741681885300
    Steps: 20, Sampler: Euler a, Schedule type: Automatic, CFG scale: 7, Version: v1.10.1
    画像サイズを変更すれば生成画像は大きく変化します。指定サイズによっては画像が崩れる場合もあります

パラメータ設定編2

 → 詳しくは 「Stable Diffusion」パラメータ

  1. Sampling steps (Steps)
    拡散モデルによる画像生成でノイズを除去する回数
     サンプリング回数が多いほど繊細な画像が出力されるが画像の生成に時間がかかります
    推奨値:20~100 デフォールト値:20

  2. Sampling method (Sampler)
    画像を生成する際に、どのような数値計算法を使用するかを指定するオプション
     数値計算法の違いは、画像の生成速度や品質に影響があります。最適なサンプリング方法は画像生成モデルやプロンプトなどの様々な条件によります
    DPM++ 2M SDE, DPM++ 2M SDE Heun, DPM++ 3M SDE, LMS, DPM fast, PLM,LCM
    デフォールト値では正常な生成ができないので 他のパラメータを調整する必要がある
    モデルによって差はあるがおおむね Steps 80~100 が適当 LMS の場合は回数を増やしたほうが結果は良い 80 ~ 200
    LCM は CFG scale を 2.0~4.0 の範囲とすることで概ね良好な画像が生成できる

  3. Schedule type
    ■ ノイズの除去をステップごとに増やしていき最終的にノイズをゼロにする曲線比率 ■
     バージョン1.90以降デフォルトスケジュール以外のスケジュールも適用できるよう追加されました
     「Automatic」を選択するとサンプリングメソッドのデフォルトスケジュールが自動的に選択されます
    推奨値:Automatic デフォールト値:Automatic

  4. CFG scale
    プロンプトに対してどれだけ忠実な画像を生成するかを指定する数値
     数値が大きいほど、プロンプトに忠実な画像を生成。一般的に 7〜11 の範囲で数値を指定します
    推奨値:3.0~11.0 デフォールト値:7.0

  5. Clip skip ※ 設定変更には オプション・パラメータの設定 が必要です
    プロンプトをどれだけ正確に反映してほしいかを設定する指標
     プロンプト解釈の途中で生成を止め、ある程度プロンプトを無視した抽象的な画像を出力するもの 1〜12 の範囲で数値を指定
    推奨値:1~6 デフォールト値:1

  6. Checkpoint name (Model)
    「Stable Diffusion」の学習中に生成された画像の特徴を保存した訓練済みモデルファイル
     画像のスタイルに関する特徴を持ったファイル。複数のファイルを用意して切り替えることで、さまざまな特徴を持つ画像を生成できます
    生成画像の品質は モデルの設定によって大きく変わるので 用途に合った適切なモデルを選ぶ必要がある
     → StableDiffusion モデル

パラメータ設定を自動実行する機能

(参考)ハードウェアによる生成画像の違い

  → 環境による生成画像の違い

 

更新履歴

参考資料

私的AI研究会: サイト内リンク