私的AI研究会 > Diffusion > Diffusion_nv
高性能画像生成AI「Stable Diffusion」を検証する
NVIDIA GPU 搭載機種へのインストール手順
以前(2022/11)OpenVINO™ 版の「Stable-Diffusion」の検証 をおこなったがさらに進化した新しい版を動かしてみる
AUTOMATIC1111版はインストールが簡単(特に Windows環境では秀逸)で Python の動作環境を用意すればコマンド一つで完了する
(base) conda create -n StableDiffusion python=3.10.6 -y
(base) conda activate StableDiffusion (StableDiffusion) conda env list
(StableDiffusion) cd workspace_3
(StableDiffusion) git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git (StableDiffusion) cd stable-diffusion-webui※(参考1)プロジェクトディレクトリを指定する場合(例:stable-diffusion-webui_cpu/ )
(StableDiffusion) git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git stable-diffusion-webui_cpu (StableDiffusion) cd stable-diffusion-webui_cpu※(参考2)GPU 未搭載機種の場合は「webui-user.bat」の COMMANDLINE_ARGS の行を修正する
1: @echo off 2: 3: set PYTHON= 4: set GIT= 5: set VENV_DIR= 6: set COMMANDLINE_ARGS=--skip-torch-cuda-test --upcast-sampling --no-half-vae --use-cpu interrogate --precision full --no-half 7: 8: call webui.bat
(StableDiffusion) ./webui-user.batLinux の場合
(StableDiffusion) ./webui.sh※「webui-user.sh」にユーザー個別設定を記述して最初に呼び出すようになっている(デフォールトは個別設定なし)
http://127.0.0.1:7860/?__theme=dark
(StableDiffusion) cd /anaconda_win/workspace_3/stable-diffusion-webui (StableDiffusion) webui-user.bat・起動スクリプトを作成「/anaconda_win/stable_diffusion.ps1」した場合
$name = @" *** Stable Diffusion environment *** "@ Write-Host $name conda activate StableDiffusion Set-Location '/anaconda_win/workspace_3/stable-diffusion-webui' ./webui-user.bat
(StableDiffusion) cd ~/workspace_3/stable-diffusion-webui (StableDiffusion) ./webui.sh・起動スクリプトを作成「~/stable_diffusion.sh」した場合
#!/bin/sh echo -e "\n*** StableDiffusion environment ***" cd $HOME/workspace_3/stable-diffusion-webui conda activate StableDiffusion ./webui.sh
(StableDiffusion) git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git stable-diffusion-webui_cpu (StableDiffusion) cd stable-diffusion-webui_cpu
rd C:\anaconda_win\workspace_3\stable-diffusion-webui_cpu\models\Stable-diffusion mklink /d "C:\anaconda_win\workspace_3\stable-diffusion-webui_cpu\models\Stable-diffusion" "C:\anaconda_win\workspace_3\stable-diffusion-webui\models\Stable-diffusion"ControlNet モデル
rd C:\anaconda_win\workspace_3\stable-diffusion-webui_cpu\models\ControlNet mklink /d "C:\anaconda_win\workspace_3\stable-diffusion-webui_cpu\models\ControlNet" "C:\anaconda_win\workspace_3\stable-diffusion-webui\models\ControlNet"
cd ~/workspace_3/stable-diffusion-webui_cpu/models ln -s ~/workspace_3/stable-diffusion-webui/models/Stable-diffusion Stable-diffusionControlNet モデル
cd ~/workspace_3/stable-diffusion-webui_cpu/models ln -s ~/workspace_3/stable-diffusion-webui/models/ControlNet ControlNet
6: set COMMANDLINE_ARGS=--xformers・RTX 4070
Model loaded in 2.2s (load weights from disk: 0.3s, create model: 0.4s, apply weights to model: 1.1s, move model to device: 0.3s). 100%|██████████████████████████████████████████████████████| 20/20 [00:01<00:00, 11.02it/s] Total progress: 100%|██████████████████████████████████████| 20/20 [00:01<00:00, 13.43it/s] 100%|██████████████████████████████████████████████████████| 20/20 [00:01<00:00, 12.64it/s] Total progress: 100%|██████████████████████████████████████| 20/20 [00:01<00:00, 13.37it/s]≪ありの場合≫
Model loaded in 2.2s (load weights from disk: 0.3s, create model: 0.4s, apply weights to model: 1.1s, move model to device: 0.3s). Model loaded in 1.7s (load weights from disk: 0.2s, create model: 0.4s, apply weights to model: 0.9s). 100%|██████████████████████████████████████████████████████| 20/20 [00:01<00:00, 15.00it/s] Total progress: 100%|██████████████████████████████████████| 20/20 [00:01<00:00, 18.96it/s] 100%|██████████████████████████████████████████████████████| 20/20 [00:01<00:00, 19.44it/s] Total progress: 100%|██████████████████████████████████████| 20/20 [00:01<00:00, 18.70it/s]・GTX 1050Ti
Model loaded in 3.9s (load weights from disk: 0.7s, create model: 0.7s, apply weights to model: 2.0s, calculate empty prompt: 0.1s). 100%|██████████████████████████████████████████████████████| 20/20 [00:24<00:00, 1.23s/it] Total progress: 100%|██████████████████████████████████████| 20/20 [00:25<00:00, 1.29s/it] 100%|██████████████████████████████████████████████████████| 20/20 [00:22<00:00, 1.14s/it] Total progress: 100%|██████████████████████████████████████| 20/20 [00:26<00:00, 1.33s/it]≪ありの場合≫
Model loaded in 4.3s (load weights from disk: 0.8s, load config: 0.2s, create model: 0.5s, apply weights to model: 2.1s, apply half(): 0.4s, calculate empty prompt: 0.1s). 100%|██████████████████████████████████████████████████████| 20/20 [00:22<00:00, 1.15s/it] Total progress: 100%|██████████████████████████████████████| 20/20 [00:24<00:00, 1.24s/it] 100%|██████████████████████████████████████████████████████| 20/20 [00:21<00:00, 1.06s/it] Total progress: 100%|██████████████████████████████████████| 20/20 [00:25<00:00, 1.27s/it]・導入により「画像生成速度の大幅な向上」「使用するVRAM量の大幅削減」が期待できるとあるが、それほど違いはないよう
Cannot locate TCMalloc. Do you have tcmalloc or google-perftool installed on your system? (improves CPU memory usage)