私的AI研究会 > OpenVINOtest

OpenVINO™ 動作テスト

※ 最終更新:2021/07/15 

OpenVINO™ Benchmark Test

OpenVINO™ ベンチマークテスト概要

 OpenVINO™ インストール時のサンプルデモ「demo_benchmark_app.sh」を実行することにより、ベンチマークテストのツールがインストールされる。

※ benchmark_app コマンドオプション(抜粋)

option説明
-m PATH_TO_MODEL推論に使用するIRモデルファイルを指定(.xml)
-d TARGET_DEVICE推論デバイスを指定。CPU, GPU, MYRIAD, HDDL, HETERO: FPGA, CPUなどを指定可能
-niter NUMBER_ITERATIONS実行する推論数。省略すると1分間推論を行う
-nireq NUMBER_INFER_REQUESTS同時推論実行数。たとえば4を指定すると同じデバイスに推論要求を同時に4つ投げる。Throughputを上げるためにはデバイス特性に合った同時推論数を指定するのが肝要。省略するとbenchmark_appが自動的に推論デバイスに適切な同時推論数を使用
-b BATCH_SIZEバッチ推論数
-i PATH_TO_INPUT推論に使用する入力画像ファイルを指定。benchmark_appでは省略可能(入力データなしでもベンチマーク可能)
-pcレイヤーごとの詳細実行レポートを表示。レイヤーごとの実行時間も含まれる
▼ 「benchmark_app コマンド・オプション詳細」
 

ベンチマークテスト実行スクリプト

 パラメータ指定を省略した実行スクリプトを「~/run_app/」に作る。

▼ 「_benchmark_app.sh」
 

OpenVINO™ ベンチマークテスト実行結果

項目Core™ i7-1185G7Core™ i3-1115G4Core™ i5-10210UCore™ i7-6700Core™ i7-2620MCore™ i5-M520
GPU(32)GPU(16)CPU(32)CPU(16)
Duration (ms)13322263234223894332211929332467132341
Latency (ms)5.177.859.429.603.898.419.9022.2130.36
Throughput (fps)751442427419230.847234140.530.92
▼ 「benchmark_app 実行コマンド」
 

Neural Compute Stick 2 (NCS2) の実行速度

項目NCS2
Core™ i7-1185G7Core™ i3-1115G4Core™ i5-10210UCore™ i7-6700Core™ i7-2620MRaspberry Pi4※
Duration (ms)3505360134773716106593533
Latency (ms)14.014.2913.8614.6941.0414.08
Throughput (fps)28527828826993.8283.07

  ※ CPU Broadcom 2711/4コア1.5GHz Arm Cortex-A72

▼ Neural Compute Stick 2 (NCS2) で benchmark_app を実行

Neural Compute Stick 2 (NCS2) 並列動作時の実行速度

項目NCS2 (Core™ i7-1185G7)
3本2本1本
Duration (ms)118117553505
Latency (ms)--14.0
Throughput (fps)853.6569.7285
▼ Neural Compute Stick 2 (NCS2) マルチ駆動で benchmark_app を実行
▼ hello_query_device 実行結果
▼ benchmark_app 実行結果
 

VirtualBox を使う

VirtualBox 動作環境のチューニング

● Virtual マシンの「設定」→「システム」を選択
●「マザーボード」タグの「メインメモリー」を推奨値の最大にする。
●「プロセッサー」タグの「プロセッサー数」を推奨値の最大にする。
●「ディスプレイ」タグの「ビデオメモリー」を推奨値の最大にする。

項目Core™ i7-6700Core™ i7-2620MNCS2 (Core™ i7-6700)NCS2 (Core™ i7-2620M)
チューニング前チューニング後チューニング前チューニング後チューニング前チューニング後チューニング前チューニング後
Duration (ms)976029333479124671365737161106110659
Latency (ms)8.549.9033.3322.2114.4414.6942.5441.04
Throughput (fps)10234128.740.527326990.4193.8
▼ VirtualBox チューニング benchmark_app 実行結果
 

Open Model Zoo Demos を動かす (まとめ)

3D Human Pose Estimation Python* Demo

Action Recognition Python* Demo

Object Detection Python* Demo

Human Pose Estimation Python* Demo

Gesture Recognition Python* Demo

Handwritten Text Recognition Demo

Text Detection C++ Demo

Crossroad Camera C++ Demo

Human Pose Estimation C++ Demo

Object Detection C++ Demo

Smart Classroom C++ Demo

Pedestrian Tracker C++ Demo

Super Resolution C++ Demo

Single Human Pose Estimation Demo (top-down pipeline)

Interactive Face Detection C++ Demo

Gaze Estimation Demo

Security Barrier Camera C++ Demo

Image Inpainting Python Demo

Colorization Python Demo

Image Deblurring Python* Demo

Hello Query Device Python* Sample

 使用可能なすべての推論エンジン デバイスを照会し、サポートされているメトリックと既定の構成値を出力する。

 

テスト環境

 

更新履歴

参考資料

 

Last-modified: 2021-07-21 (水) 09:39:38