私的AI研究会 > Diffusion > Diffusion_param
「Stable-Diffusion」で設定するパラメータを調査する
プロンプト Prompt | |
(masterpiece,best quality:1.4),(8k,raw photo,photo realistic:1.2),shiny skin,detailed skin,detailed face,detailed eyes,1girl,Japanese idol,beautiful face,{個別プロンプト},white background,wearing a white t-shirts | |
(傑作、最高品質:1.4)、(8k、生写真、フォトリアル:1.2)、つやのある肌、詳細な肌、詳細な顔、詳細な目、1人の女の子、日本のアイドル、美しい顔、{個別プロンプト}、白背景、白い T シャツを着て |
ネガティブ・プロンプト Negative prompt | ||
(worst quality,low quality:2),(painting,sketch,flat color),monochrome,grayscale,ugly face,bad face,bad anatomy,deformed eyes,missing fingers,acnes,skin blemishes,nsfw,nude,nipples | ||
(最悪の品質、低品質:2)、(絵画、スケッチ、フラットカラー)、モノクロ、グレースケール、醜い顔、悪い顔、悪い解剖学、変形した目、欠けている指、ニキビ、皮膚の傷、nsfw、ヌード、乳首 |
■ Seed は画像のID番号 ■ 同じ Seed値とプロンプトなどの設定を使うことで、同じ画像を再現することができる また一度に近いSeed値で多くの画像を生成することで、理想の画像が見つけやすくなる |
プロンプト Prompt | |
(masterpiece,best quality:1.4),(8k,raw photo,photo realistic:1.2),shiny skin,detailed skin,detailed face,detailed eyes,1girl,Japanese idol,beautiful face, | |
(傑作、最高品質: 1.4)、(8k、生写真、フォトリアル: 1.2)、光沢のある肌、詳細な肌、詳細な顔、詳細な目、1人の女の子、日本のアイドル、美しい顔、 |
ネガティブ・プロンプト Negative prompt | ||
(worst quality,low quality:2),(painting,sketch,flat color),monochrome,grayscale,ugly face,bad face,bad anatomy,deformed eyes,missing fingers,acnes,skin blemishes,nsfw,nude,nipples | ||
(最悪の品質、低品質:2)、(絵画、スケッチ、フラットカラー)、モノクロ、グレースケール、醜い顔、悪い顔、悪い解剖学、変形した目、欠けている指、ニキビ、皮膚の傷、nsfw、ヌード、乳首 |
■ 拡散モデルによる画像生成でノイズを除去する回数 ■ サンプリング回数が多いほど繊細な画像が出力されるが画像の生成に時間がかかる |
推奨値:20~100 デフォールト値:20 |
■ 画像を生成する際に、どのような数値計算法を使用するかを指定するオプション ■ 数値計算法の違いは、画像の生成速度や品質に影響がある。最適なサンプリング方法は画像生成モデルやプロンプトなどの様々な条件による |
・DPM++ 2M SDE, DPM++ 2M SDE Heun, DPM++ 3M SDE, LMS, DPM fast, PLM,LCM デフォールト値では正常な生成ができないので 他のパラメータを調整する必要がある モデルによって差はあるがおおむね Steps 80~100 が適当 LMS の場合は回数を増やしたほうが結果は良い 80 ~ 200 |
・LCM は CFG scale を 2.0~4.0 の範囲とすることで概ね良好な画像が生成できる |
■ ノイズの除去をステップごとに増やしていき最終的にノイズをゼロにする曲線比率 ■ バージョン1.90以降デフォルトスケジュール以外のスケジュールも適用できるよう追加された 「Automatic」を選択するとサンプリングメソッドのデフォルトスケジュールが自動的に選択される |
推奨値:Automatic デフォールト値:Automatic |
画像を生成したバージョン | PNG info の受信情報 | 生成前にすべき処理 | ||||
Ver. | Sampling method | Schedule type | Ver. | Sampling method | Override setting | |
1.10.0 | DPM++ 2M | Automatic | 1.6.1 | DPM++ 2M | Schedule type Karras | 「Schedule type Karas」を削除 「Sampling method」を「DPM++ 2M Karras」に設定 |
1.6.1 | DPM++ 2M Karras | - | 1.10.0 | DPM++ 2M | Karras | - |
■ プロンプトに対してどれだけ忠実な画像を生成するかを指定する数値 ■ 数値が大きいほど、プロンプトに忠実な画像を生成。一般的に 7〜11 の範囲で数値を指定 |
推奨値:3.0~11.0 デフォールト値:7.0 |
■ プロンプトをどれだけ正確に反映してほしいかを設定する指標 ■ プロンプト解釈の途中で生成を止め、ある程度プロンプトを無視した抽象的な画像を出力するもの 1〜12 の範囲で数値を指定 |
推奨値:1~6 デフォールト値:1 |
Sampler | 特徴 | 推奨ステップ数 |
Euler a | 高速で軽量なサンプラー。短時間で結果を得たい場合や、プロトタイピング、大量生成に適している 画像のディテールが他のサンプラーに比べてやや劣る場合がある | 20 〜 30 |
LMS (Laplacian Pyramid Sampling) | 複雑なテクスチャや構造の生成に適しており、安定した品質を求める場合に使用される 生成速度は中程度 ディテールが求められるプロジェクトで有効 | 50 〜 70 |
PLMS (Pseudo Linear Multistep) | 計算コストが低く、品質と速度のバランスが良いサンプラー 幅広い用途で利用されており一般的な画像生成に適する | 30 〜 50 |
DPM++ 2M | DPM(Denoising Diffusion Probabilistic Models)サンプラーの一種で、2つの順序でステップを進行する「2M」手法を使用する 精度と速度のバランスが取れており、ディテールを重視するプロジェクトに適する 複数のステップを経て、滑らかで自然な仕上がりになる傾向がある | 20 〜 50 |
DPM++ 3M | 「DPM++ 3M」は、DPM++ 2Mの拡張版で、3つの順序でステップを進行する これにより、さらに高精度で安定した画像生成が可能となる 特に、ディテールが非常に重要な場合や、微細な表現を求めるプロジェクトに適する | 30 〜 60 |
DPM++ 3M SDE | DPM++ 3Mに「SDE」(Stochastic Differential Equation)を組み合わせたサンプラー。SDEを用いることで、ステップの進行がより安定し、ディテールを重視した高精度な画像生成が可能になる 質感や微細なディテールが求められる高難度のアート制作に適する | 40 〜 70 |
2S a | 高速でありながら品質も良好なサンプラー 生成結果が安定しやすい特性があり、短時間で高品質な画像を求める場合に有効 | 20〜40 |
Heun | 中程度の速度と品質を提供するサンプラーで、特定の状況で優れたパフォーマンスを発揮する 一般的な画像生成に使用される | 30〜50 |
DPM Fast | 画像を素早く生成するためのサンプラー 時間を短縮しながらも比較的高い品質を保つ プロトタイピングや高速処理が必要な場合に適する | 10 〜 20 |
DPM Adaptive | 状況に応じて適応的にサンプリングを行う 必要な箇所に焦点を当てた画像生成が可能となり、ディテールと速度のバランスを取ることができる | 30 〜 50 |
Schedule Type | 特徴 |
Uniform | ステップごとに均等に進行するスケジュールタイプ 各ステップで均一な変化が加わるため、全体のバランスが取りやすく、安定した結果を得られる |
Karras | ステップが進むごとに、変化が滑らかに加速していくタイプ 特に高品質な画像生成に向いており、ディテールの表現が滑らかに仕上がる |
Exponential | 初期のステップではゆっくりと進行し、後半で急激に変化するタイプ ディテールを強調したい場合に有効 |
Polyexponential | 複数の指数関数的進行を組み合わせたスケジュールタイプ 生成プロセスが複雑になるため、独特なディテールやテクスチャ表現に適する |
SGM Uniform | SGM(Stochastic Gradient Method)とUniform進行の組み合わせ ステップごとに均一な進行を保ちながらも、確率的な変動が加わる |
KL Optimal | KL(Kullback-Leibler)ダイバージェンスを最小化するために最適化されたスケジュール&br 高精度な結果を得ることができ、特に複雑な画像生成に向いている |
Align Your Steps | 特定のステップに重点を置いて進行を調整するタイプ 生成プロセス全体で特定の効果を強調したい場合に使用する |
Simple | シンプルな進行を行うスケジュールタイプ 特別な変化を加えず、標準的な結果を求める場合に適する |
標準正規分布 | 正規分布に基づいてステップを進行するタイプ これにより、生成される画像が自然な変化を伴い、リアリスティックに仕上がる |
DDIM (Denoising Diffusion Implicit Models) | 高速で計算量が少なく、スピードと品質のバランスが取れたスケジュール 効率的に画像生成を行いたい場合に適する |
Beta | ベータ分布に基づくスケジュールタイプ 生成プロセス全体で細かい調整を行い、特定の特徴を強調する |
Turbo | 生成プロセスを加速するためのスケジュールタイプ 時間を短縮しつつ、結果を迅速に得たい場合に使用される |
Sampling method | 特徴 |
DDIM (Denoising Diffusion Implicit Models) | 高速で計算量が少なく、効率的に画像生成が行えるサンプリング方法 スピードとクオリティのバランスを重視する場合に適する |
SDE (Stochastic Differential Equation) | サンプラー内での進行を確率的に進める手法 結果の品質が安定しやすくなる 特にディテールが重要な場合に効果的 |
Ancestral | 生成プロセスで前のステップに依存する手法 よりランダム性が加わり、クリエイティブな生成が求められる場面に適する |
DPM | 高速でありながら品質の良い結果を得ることができる手法 特に、計算コストを抑えつつ、一定のクオリティを維持する場合に使用される |
最も一般的なアップスケール方法。このオプションをチェックすると画像生成後に自動でアップスケールされる |
Upscaler | 特徴 |
LDSR (Latent Diffusion Super Resolution) | 低解像度のビデオでも品質を大幅に向上させることができる |
ESRGAN 4x | 4Kまでの画像をアップスケーリングするのに適する |
R-ESRGAN 4x | ESRGANの改良版で、AI生成画像や実写画像の復元に適する |
4x_UltraSharp | 生成した画像の特徴を維持しながら、美しく高解像度化することが可能。リアル系やアニメ系の画像に適する |
Latent | 他のアップスケーラーと比較して、はディテールが豊かで色彩が鮮やかな画風になりやすい、元の画像からの変化が大きくなることもある。イラストやアニメ風の画像に特に適する。Denoising strength(ノイズ除去強度)を高めに設定しないと、ノイズが残る傾向がある |
シンプルで直感的な操作で高品質な拡大が可能。生成済みの画像に対して後処理として実行できる特徴がある プロンプトなどを設定する必要がないため、Stable Diffusion で生成していない画像でも高画質化できる |
名称 | 機能 | 特徴 | 仕上り | アニメへの適用 | 処理時間 |
Upscale | アップスケール | ||||
GFPGAN ※ | ディテールを補正 | 理想的な顔に修正 | なめらかでリアル | 不向き | 比較的短い |
CodeFormer ※ | 顔の修復 | 元の顔の特徴を維持しつつ補正 | 元画像に近い形を維持 | ある程度可能 | やや長い |
Split oversized images | 巨大な画像を分割する | ||||
Auto focal point crop | 自動で焦点をクロップ | ||||
Auto-sized crop | 自動サイズで切り取り | ||||
Create flipped copies | 反転画像を生成する | ||||
Caption | 画像の説明文を生成 |
処理方法 | 処理できる画像数 | 画像の選び方 | |
Single Image | 単一画像 | 1枚 | アップロード |
Batch Process | バッチ処理 | 複数 | 一括してアップロード |
Batch from Directory | ディレクトリからバッチ処理 | 複数 | 画像を保存しているディレクトリ(フォルダ)のパスを入力 |
txt2img/img2img/PNGinfo | 各機能から転送 | 1枚 | 三角定規のアイコン(📐)をクリック |
項目 | 機能 | |
Upscaler 1 | アップスケーラー 1 | 高解像度化するアルゴリズム・手法 |
Upscaler 2 | アップスケーラー 2 | 同時に使うアップスケーラー |
Upscaler 2 visibility | Upscaler 2の視認性 | アップスケーラー 2による処理の強さ(値が小さいとアップスケーラー 1による処理が強くなる) |
Scale by | 倍率指定 | 解像度の拡大倍率(8倍まで指定できる) |
Max side length | 拡大した画像の最大幅 | |
Width | 幅 | 拡大した画像の幅 |
Height | 高さ | 拡大した画像の高さ |
Crop to fit | 合うように切り抜き | 解像度指定でアスペクト比が変わる場合の切り抜き可否(チェック無しの場合、幅か高さの大きい方に合わせる) |