私的AI研究会 > Diffusion > SDtutorial
画像生成 AI「Stable Diffusion」チュートリアル 1 基本編 †
画像生成 AI「Stable Diffusion」の操作ガイド
▼ 目 次
▲ 目 次
※ 最終更新:2025/03/05
「Stable Diffusion web UI」最初の一歩 †
はじめに †
- インストール後に表示される Webページの一通りの操作についての概要(Diffusion サイトのダイジェスト版)です
- 「Stable Diffusion web UI」の 2つの応バージョンに対応しています
- 基本的に「v1.10」GPU(NVIDIA RTX1070TI/1060)環境下の記述です
他の環境では出力画像など多少の相違が生じるかもしれません
- 「v1.6」では OpenVINO スクリプトを使うことができます
- 「v1.6」起動直後は AUTOMATIC1111 v1.6.1 の CPU動作モードとなります
- OpenVINO スクリプトを使用するためには起動後に毎回設定する必要があります
- OpenVINO で Intel®GPU を使用するためには Device 項目で GPU に設定しなければなりません
- OpenVINO スクリプトで GPU を有効とすることで高速化が期待できますが、
最初の動作でモデルなどの変換が行われるため 2度目以降に効果が出ます
- 変換ファイルは「./cache/」ディレクトリに保存され自動削除はありません。動作がおかしい場合など適宜手動で削除してください
- OpenVINO スクリプトは評価版(開発は止まっているよう)ですので「v1.10」版に比べて安定性は落ちます
- 「v1.6」で OpenVINO スクリプトを設定しなければ「AUTOMATIC1111 v1.6.1」の CPU動作となります
- 「v1.6」では「v1.10」での『Schedule type』の項目がありません
『Sampling method』のリストで同時に指定するようになっています
- 生成画像から情報を得る「PNG info」は「v1.10」「v1.6」どちらの画像も使用できます
- 『Sampling method』『Schedule type』の関連項目に注意してください
- Model(Checkpoint name)は自動的には送信されません。OpenVINO では記録もされません
基本操作編 †

- 最も簡単に 画像を生成する
① モデルを指定する
v1-5-pruned-emaonly.safetensors(v1.5 標準モデル)
② プロンプトを入力
" a busy city street in a modern city"(近代的な都市のにぎやかな街路)
③「Generate」を押す
④ 生成結果の画像表示
⑤ 生成パラメータに表示
⑥ 生成画像ファイルの場所を開くボタン
・生成画像
web UI v1.10 | web UI v1.6 | web UI v1.6 (OpenVINO) |
 |  |  |  |  |  |
00000-11442068 | 00001-1491663793 | 00000-11442068 | 00001-1491663793 | 00000-11442068 | 00001-1491663793 |
Steps: 20, Sampler: DPM++ 2M, Schedule type: Automatic, CFG scale: 7, Version: v1.10.1 / v1.6.1 |
■入力したプロンプト(英語)から画像を生成することができます。■ 生成結果は「stable-diffusion-webui/outputs/txt2img-images/XXXX-XX-XX/」(XX… は日付) フォルダに保存 ⑥ボタンで表示されます ファイル名は '5桁通し番号-シード値.png' |
- 出力画像から生成パラメータを得る
元画像 | 元画像からパラメータを取得して画像生成する手順 |

この画像をダウンロードして元画像とする | 生成パラメータを取得する
①「PNG info」タブを選択
② 元画像をドラッグアンドドロップ
③「Send to txt2img」を押す |  |
画像を生成する
④「txt2img」タブを選択
⑤ モデルを選ぶ
⑥「Generate」ボタンを押す | web UI v1.10 | web UI v1.6 | web UI v1.6(OV) |
 |  |  |
Steps: 20, Seed 2290528465, Sampler: Euler a, Schedule type: Automatic, CFG scale: 7, Version: v1.10.1 / v1.6.1 |
■「PNG info」機能を利用することで生成済みの画像から各種パラメータを取得して画像を再生成することができます。■ (処理ソフトなどで加工した 'png' ファイルはタグ情報が消去されるため利用できません) |
- 生成モデルを変えてみる
標準モデル(v1-5-pruned-emaonly.safetensors)は人物の生成には向いていないので、別のモデルを用意します
1. 次の リンク から beautifulRealistic_brav5.safetensors モデルをダウンロードします
2. ダウンロードしたファイルを「./models/Stable-diffusion/」に配置します
3. Webページを閉じターミナルを終了してから、再度「Stable Diffusion web UI」を起動して上記操作を行います
4.⑤で配置したモデルを選択してから ⑥「Generate」ボタンを押します
・生成画像の比較
v1-5-pruned-emaonly | beautifulRealistic_brav5 |
web UI v1.10 | web UI v1.6 | web UI v1.6 (OV) | web UI v1.10 | web UI v1.6 | web UI v1.6 (OV) |
 |  |  |  |  |  |
Steps: 20, Seed 2290528465, Sampler: Euler a, Schedule type: Automatic, CFG scale: 7, Version: v1.10.1 / v1.6.1 |
パラメータ設定編1 †
- ⑫ シード値 Seed
番号 | メニュー | 機 能 |
⑫ | Seed | シード値「-1」はランダム生成、特定の画像を生成したい場合はその画像のシード値を入力する |
ランダム生成 | シード値を -1 に設定 |
リロード | 現在のシード値に固定 |
・シード値を変えた場合の生成画像
beautifulRealistic_brav5 |
web UI v1.10 | web UI v1.6 (OpenVINO) |
 |  |  |  |  |  |
1679936866 | 172166774 | 1681885300 | 1679936866 | 172166774 | 1681885300 |
Steps: 20, Sampler: Euler a, Schedule type: Automatic, CFG scale: 7, Version: v1.10.1 / v1.6.1 |
■ シード値を固定すれば同じ条件下で同じ画像を生成することができます■ |
- ⑨ 画像サイズ Width/Height
Model | beautifulRealistic_brav5 |
Ver. | web UI v1.10 | web UI v1.6 (OpenVINO) |
512x512 |  |  |  |  |  |  |
768x512 |  |  |  |  |  |  |
512x768 |  |  |  |  |  |  |
Seed | 1679936866 | 172166774 | 1681885300 | 1679936866 | 172166774 | 1681885300 |
Steps: 20, Sampler: Euler a, Schedule type: Automatic, CFG scale: 7, Version: v1.10.1 |
■ 画像サイズを変更すれば生成画像は大きく変化します。指定サイズによっては画像が崩れる場合もあります■ |
- SD1.5 モデルのパフォーマンスを発揮するための推奨解像度
| width | height | 比率 |
正方形 | 512 | 512 | 1:1 |
横長画像 | 768 | 512 | nealy 4:3 |
縦長画像 | 512 | 768 | nealy 3:4 |
パラメータ設定編2 †
→ 詳しくは 「Stable Diffusion」パラメータ
- 対象の設定値と基本画像
プロンプト Prompt |
(masterpiece,best quality:1.4),(8k,raw photo,photo realistic:1.2),shiny skin,detailed skin,detailed face,detailed eyes,1girl,Japanese idol,beautiful face, |
(傑作、最高品質: 1.4)、(8k、生写真、フォトリアル: 1.2)、光沢のある肌、詳細な肌、詳細な顔、詳細な目、1人の女の子、日本のアイドル、美しい顔、 |
ネガティブ・プロンプト Negative prompt |
(worst quality,low quality:2),(painting,sketch,flat color),monochrome,grayscale,ugly face,bad face,bad anatomy,deformed eyes,missing fingers,acnes,skin blemishes,nsfw,nude,nipples |
(最悪の品質、低品質:2)、(絵画、スケッチ、フラットカラー)、モノクロ、グレースケール、醜い顔、悪い顔、悪い解剖学、変形した目、欠けている指、ニキビ、皮膚の傷、nsfw※、ヌード、乳首 |
Ver. | 基本画像 | Checkpoint (Model) | Seed | Sampler | Scadule type | Steps | Clip skip |
1.10 (GPU) |  | beautifulRealistic _brav5 | 2623281671 | DPM++ 2M | Automatic | 20 | 1 |
1.6 (CPU) |  | DPM++ 2M karras | - |
※ nsfw (Not Safe for Work) 「職場での閲覧は危険」「閲覧注意」の意味
- ⑤ Sampling steps (Steps)
■ 拡散モデルによる画像生成でノイズを除去する回数 ■ サンプリング回数が多いほど繊細な画像が出力されるが画像の生成に時間がかかります |
推奨値:20~100 デフォールト値:20 |
- ④ Sampling method (Sampler)
■ 画像を生成する際に、どのような数値計算法を使用するかを指定するオプション ■ 数値計算法の違いは、画像の生成速度や品質に影響があります。最適なサンプリング方法は画像生成モデルやプロンプトなどの様々な条件によります |
・DPM++ 2M SDE, DPM++ 2M SDE Heun, DPM++ 3M SDE, LMS, DPM fast, PLM,LCM デフォールト値では正常な生成ができないので 他のパラメータを調整する必要がある モデルによって差はあるがおおむね Steps 80~100 が適当 LMS の場合は回数を増やしたほうが結果は良い 80 ~ 200 |
・LCM は CFG scale を 2.0~4.0 の範囲とすることで概ね良好な画像が生成できる |
- ⑥ Schedule type
■ ノイズの除去をステップごとに増やしていき最終的にノイズをゼロにする曲線比率 ■ バージョン1.90以降デフォルトスケジュール以外のスケジュールも適用できるよう追加されました 「Automatic」を選択するとサンプリングメソッドのデフォルトスケジュールが自動的に選択されます |
推奨値:Automatic デフォールト値:Automatic |
- ⑪ CFG scale
■ プロンプトに対してどれだけ忠実な画像を生成するかを指定する数値 ■ 数値が大きいほど、プロンプトに忠実な画像を生成。一般的に 7〜11 の範囲で数値を指定します |
推奨値:3.0~11.0 デフォールト値:7.0 |
- Clip skip ※ 設定変更には オプション・パラメータの設定 が必要です
■ プロンプトをどれだけ正確に反映してほしいかを設定する指標 ■ プロンプト解釈の途中で生成を止め、ある程度プロンプトを無視した抽象的な画像を出力するもの 1〜12 の範囲で数値を指定 |
推奨値:1~6 デフォールト値:1 |
- ① Checkpoint name (Model)
■「Stable Diffusion」の学習中に生成された画像の特徴を保存した訓練済みモデルファイル ■ 画像のスタイルに関する特徴を持ったファイル。複数のファイルを用意して切り替えることで、さまざまな特徴を持つ画像を生成できます |
生成画像の品質は モデルの設定によって大きく変わるので 用途に合った適切なモデルを選ぶ必要がある |
→ StableDiffusion モデル
パラメータ設定を自動実行する機能 †
- ⑬ Script「X/Y/Z plot」
■ 比較画像の作成 ■ 比較対象の要素を3軸まで指定できます。比較画像の保存先「stable-diffusion-webui/outputs/txt2img-grids/XXXX-XX-XX/」(XX… は日付) |
パラメータの違いによる生成画像の出力結果を簡単に比較できる便利機能 |
Type | Values |
X type | Steps | 10,15,20,30,50 |
Y type | Nothing | |
Z type | Nothing | |
 |
Sampler: DPM++ 2M, Schedule type: Karras, CFG scale: 7, Seed: 2623281671, Model: beautifulRealistic_brav5, Version: v1.10.1 |
※ v1.6.1 では画像生成はできるが最後のグリッド表示(一覧ファイル生成)はエラーとなる
(参考)ハードウェアによる生成画像の違い †
→ 環境による生成画像の違い
更新履歴 †
参考資料 †
私的AI研究会: サイト内リンク †
- ローカルマシンへのインストール手順
- 「Stable Diffusion」チュートリアル
- 「Stable Diffusion」で画像生成
- 使い方の検証
- 「Stable Diffusion」の別のバージョン