私的AI研究会 > GPUanalysys
AI 開発における GPU考察 †
「AI プログラム」における GPU の速度について考察する
※ 最終更新:2024/09/03
GPU 考察 †
実行速度比較 †
- 静止画から動画を作る:First Order Motion Model
機能 | プログラム | GPU | CPU |
RTX 4070Ti | RTX 4060 | GTX 1050 | i9-13900 | i7-14700 | i7-1260P |
トランプのように話すモナリザ | demo2.py | 2秒 | 4秒 | 18秒 | 2分20秒 | 3分4秒 | 4分39秒 |
トランプ似のモナリザ | 2秒 | 5秒 | 18秒 | 2分19秒 | 3分5秒 | 4分35秒 |
トランプのように話すモナリザ | fomm.py | 2秒 | 4秒 | 17秒 | 2分24秒 | 3分5秒 | 4分40秒 |
トランプのように話す北川景子 | fomm_test.py | 3秒 | 4秒 | 18秒 | 2分17秒 | 2分59秒 | 4分14秒 |
「ファッション」カテゴリー | fomm_test.py | 4秒 | 8秒 | 35秒 | 4分21秒 | 5分36秒 | 7分58秒 |
「アニメーション」カテゴリー | fomm_test.py | 0秒 | 0秒 | 2秒 | 20秒 | 25秒 | 36秒 |
「太極拳」カテゴリー | fomm_test.py | 4秒 | 8秒 | 32秒 | 4分4秒秒 | 5分10秒 | 7分22秒 |
- 動画のパーツを入れ替える:Motion Supervised co-part Segmentation
機能 | プログラム | GPU | CPU |
RTX 4070Ti | RTX 4060 | GTX 1050 | i9-13900 | i7-14700 | i7-1260P |
赤い唇のトランプ | part_swap2.py | 3秒 | 4秒 | 20秒 | 3分0秒 | 3分5秒 | 4分49秒 |
青い目の女優 | 1秒 | 3秒 | 10秒 | 1分33秒 | 1分36秒 | 2分26秒 |
赤い唇のトランプ | motion_seg.py | 2秒 | 4秒 | 20秒 | 2分59秒 | 3分3秒 | 4分22秒 |
青い目の女優 | 1秒 | 2秒 | 10秒 | 1分33秒 | 1分35秒 | 2分17秒 |
- 人間の年齢による顔の変化:DLFS
データ | プログラム | GPU | CPU |
RTX 4070Ti | RTX 4060 | GTX 1050 | i9-13900 | i7-14700 | i7-1260P |
images/14.jpg | dlfs_test2.py | 10秒 | 1分1.7秒 | 54分32秒 ※ | × | × | × |
dlfs_gui.py | 13秒 | 53.7秒 | 53分26秒 ※ | × | × | × |
×: CPU 動作不可
※ メモリ不足によりキャシュ動作のため速度低下
- StyleGANを使った画像編集:StyleGAN e4e
データ | プログラム | GPU | CPU |
RTX 4070Ti | RTX 4060 | GTX 1050 | i9-13900 | i7-14700 | i7-1260P |
images/03.jpg | e4e_demo.py | 1分30秒 | 1分35秒 | 3分37秒 | × | × | × |
×: CPU 動作不可
- 画像スタイル変換:CycleGAN
データ | プログラム | GPU | CPU |
RTX 4070Ti | RTX 4060 | GTX 1050 | i9-13900 | i7-14700 | i7-1260P |
images/ | test2.py | 11秒 | 13.8秒 | 32秒 | 3分22秒 | 3分24秒 | 4分24秒 |
images2/ | gan_paint.py | 10秒 | 12.5秒 | 26秒 | 3分19秒 | 3分21秒 | 4分50秒 |
- 顔の合成:StarGAN-v2
データ | プログラム | GPU | CPU |
RTX 4070Ti | RTX 4060 | GTX 1050 | i9-13900 | i7-14700 | i7-1260P |
custom_src/ | starv2_align.py | 1.5秒 | 11.5秒 | 3.5秒 | × | × | 11.7秒 |
src_3/, ref2_3/ | starv2_sample.py | 1分8秒 | 32.5秒 | 51.5秒 | × | × | 17分24秒 |
×: CPU 選択不可(自動選択)
- GANによる似顔絵生成:QMUPD
データ | プログラム | GPU | CPU |
RTX 4070Ti | RTX 4060 | GTX 1050 | i9-13900 | i7-14700 | i7-1260P |
examples/ | qmupd_demo.py | 29秒 | 30.7秒 | 1分13秒 | 2分23秒 | 2分27秒 | 3分4秒 |
- 画像に別の画像のスタイルを転送:PAMA
データ | プログラム | GPU | CPU |
RTX 4070Ti | RTX 4060 | GTX 1050 | i9-13900 | i7-14700 | i7-1260P |
content/10.jpg,style/03.jpg | pama.py | 4秒 | 4秒 | 7秒 | × | × | 13秒 |
video/02.mp4, style/03.jpg | pama_movie.py | 13.8秒 | 20.2秒 | 1分12秒 | × | × | 23分9秒 |
×: CPU 動作不可(自動選択)
- 顔画像に様々なスタイルをブレンドする:BlendGAN
データ | プログラム | GPU | CPU |
RTX 4070Ti | RTX 4060 | GTX 1050 | i9-13900 | i7-14700 | i7-1260P |
pic/66.jpg | blendgan_demo.py | 34.1秒 | 36.5秒 | 57秒 | 19.7秒※ | 19.6秒※ | 29.4秒※ |
※ CPU の場合表示のみの時間
ハードウェア詳細 †
- 計測に使用したハードウェア
詳細 | GPU | CPU |
RTX 4070Ti | RTX 4060 | GTX 1050 | i9-13900 | i7-14700 | i7-1260P |
GPU Memory | 12GB | 8GB | 4GB | | | × |
CPU | i9-13900 | i7-14700 | i7-6700 | | | |
Memory | 64GB | 32GB | 32GB | 64GB | 32GB | 32GB |
Main Storage | 1TB M.2 SSD | 1TB M.2 SSD | 1TB SATA SSD | 1TB M.2 SSD | 1TB M.2 SSD | 1TB SATA SSD |
OS | Windows11pro | Windows11home | Windows10pro | Windows11pro | Windows11home | Windows11pro |
本体機種名 |
|
|
|
|
|
|
HP ENVY TE02 | HP Victus TG02 | HP EliteDesk 800 | HP ENVY TE02 | HP Victus TG02 | DELL XPS Plus 9320 |
- NVIDIA の GPUアーキテクチャ(参考)
アーキテクチャ (読み方) | プロセスルール | 販売開始 | 採用シリーズ |
Kepler (ケプラー) | 28nm | 2012年 | GeForce GTX/GT 600シリーズ |
2012年 | GeForce GTX/GT 700シリーズ |
2013年 | GeForce GTX TITANシリーズ |
Maxwell (マクスウェル) | 28nm | 2014年 | GeForce GTX 700シリーズ |
2015年 | GeForce GTX 900シリーズ |
Pascal (パスカル) | 16nm/14nm | 2016年 | GeForce GTX 10シリーズ |
Turing (チューリング) | 12nm | 2018年 | GeForce RTX 20シリーズ |
2019年 | GeForce GTX 16シリーズ |
Ampere (アンペア) | 8nm | 2020年 | GeForce RTX 30シリーズ |
Ada Lovelace (エイダ・ラブレス) | 5nm | 2022年 | GeForce RTX 40シリーズ |
更新履歴 †
参考資料 †