OpenCV4 - PukiWiki

[ トップ ] [ 一覧 | 検索 | 履歴 | ログイン ]

最新の20件

2024-05-03

RevYOLOv5_2

2024-05-01

2024-04-10

YOLOv7_Colab3

2024-03-18

PyLearn

2024-03-17

2024-03-15

2024-03-05

RecentDeleted

2024-03-02

OpenVINOv2

2024-03-01

Anaconda1

2024-02-16

ProjectEnv3

2024-02-15

2024-02-14

SendMail

2024-01-21

GanFOMM

2024-01-18

ハードウェアTips

2024-01-17

進捗メモ-mizutu

私的AI研究会 > OpenCV4

OpenCV カスケード分類器 †

　OpenCV に実装されているカスケード分類器を使った処理を検証をしてみる。

OpenCV カスケード分類器
- 事前準備
- カスケード分類器を使う
参考資料

事前準備 †

プログラムの動作環境 †

　OpenVINO™ ツールキットをインストールした環境で検証する。

Open CVのバージョン確認

pi@raspberrypi:~ $ python3
Python 3.7.3 (default, Jul 25 2020, 13:03:44) 
[GCC 8.3.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import cv2
>>> cv2.__version__
'4.5.1-openvino'
>>> quit()

OpenCV バージョン 4.5.1
参考サイト → インストールされたOpenCVのバージョンを確認するコマンド

プログラムの動作するディレクトリ。
```
~/work-opencv
```

機械学習データ（カスケード分類器）のインストール †

Raspberry Pi 上のウエブブラウザからアクセスする。
GitHub ? opencv/opencv: Open Source Computer Vision Library
表示されたページの右上「Clone or download」をクリックする。
ダウンロードした opencv-master.zip を解凍する。
```
$ cd ~/Downloads
$ unzip opencv-master.zip
```

解凍された「opencv-master」フォルダ内の「data」フォルダの中にある「haarcascades」フォルダを ~/work-opencv フォルダにコピーする。

$ cd opencv-master/data
$ cp -r haarcascades ~/work-opencv
$ ls ~/work-opencv/haarcascades
haarcascade_eye.xml                      haarcascade_frontalface_alt_tree.xml        haarcascade_profileface.xml
haarcascade_eye_tree_eyeglasses.xml      haarcascade_frontalface_default.xml         haarcascade_righteye_2splits.xml
haarcascade_frontalcatface.xml           haarcascade_fullbody.xml                    haarcascade_russian_plate_number.xml
haarcascade_frontalcatface_extended.xml  haarcascade_lefteye_2splits.xml             haarcascade_smile.xml
haarcascade_frontalface_alt.xml          haarcascade_licence_plate_rus_16stages.xml  haarcascade_upperbody.xml
haarcascade_frontalface_alt2.xml         haarcascade_lowerbody.xml

含まれるカスケード分類器の一覧 †

ファイル名	対象物
haarcascade_eye.xml	目
haarcascade_eye_tree_eyeglasses.xml	眼鏡
haarcascade_frontalcatface.xml	猫の顔（正面）
haarcascade_frontalcatface_extended.xml	猫の顔（正面）
haarcascade_frontalface_alt.xml	顔（正面）
haarcascade_frontalface_alt2.xml	顔（正面）
haarcascade_frontalface_alt_tree.xml	顔（正面）
haarcascade_frontalface_default.xml	顔（正面）
haarcascade_fullbody.xml	全身
haarcascade_lefteye_2splits.xml	左目
haarcascade_licence_plate_rus_16stages.xml	ロシアのナンバープレート（全体）
haarcascade_lowerbody.xml	下半身
haarcascade_profileface.xml	顔（証明写真）
haarcascade_righteye_2splits.xml	右目
haarcascade_russian_plate_number.xml	ロシアのナンバープレート（数字）
haarcascade_smile.xml	笑顔
haarcascade_upperbody.xml	上半身

カスケード分類器を使う †

顔と目に枠を描画するプログラム †

face_eye.py を新規作成する。

~/work-opencv $ vi face_eye.py

# -*- coding: utf-8 -*-

"""
カスケード分類器
顔と目を探す
"""
import cv2
import time

def __main():
    img = cv2.imread('face9.jpg')
    img = getResize(img)

    timeStart = time.time()
    # ここから処理を実行する
    img = getProcess(img)

    timeEnd = time.time()
    print("{0} = {1}".format('CPU', (timeEnd - timeStart) * 1000) + "/ms")

    cv2.imshow('Final result', img)
    cv2.waitKey(0)

    cv2.destroyAllWindows()

def getProcess(img):
    global face_cascade, eye_cascade

    # 顔検出の処理効率化のために、写真の情報量を落とす（モノクロにする）
    grayimg = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    # 顔検出を行う
    facerect = face_cascade.detectMultiScale(grayimg, scaleFactor=1.2, minNeighbors=2, minSize=(1, 1))
    # 目検出を行う
    eyerect = eye_cascade.detectMultiScale(grayimg)

    print(facerect)
    print(eyerect)

    # 顔を検出した場合
    if len(facerect) > 0:
        # 検出した場所すべてに赤色で枠を描画する
        for rect in facerect:
            cv2.rectangle(img, tuple(rect[0:2]), tuple(rect[0:2]+rect[2:4]), (0, 0, 255), thickness=3)

    # 目を検出した場合
    if len(eyerect) > 0:
        # 検出した場所すべてに緑色で枠を描画する
        for rect in eyerect:
            cv2.rectangle(img, tuple(rect[0:2]), tuple(rect[0:2]+rect[2:4]), (0, 255, 0), thickness=3)

    return img

def getResize(img):
    basePixSize = 1280  # 縦横で大きい辺の変更したいサイズ
    height = img.shape[0]
    width = img.shape[1]

    largeSize = max(height, width)  # 大きい方の辺のサイズ
    resizeRate = basePixSize / largeSize  # 変更比率を計算
    img = cv2.resize(img, (int(width * resizeRate), int(height * resizeRate)))

    return img

if __name__ == '__main__':
    print(cv2.__version__)

    # 顔検出のための学習元データを読み込む
    face_cascade = cv2.CascadeClassifier('haarcascades/haarcascade_frontalface_default.xml')
    # 目検出のための学習元データを読み込む
    eye_cascade = cv2.CascadeClassifier('haarcascades/haarcascade_eye.xml')
    __main()

実行結果

~/work-opencv $ python3 face_eye.py
4.5.1-openvino
[[778 189 156 156]
 [505 266 168 168]
 [404 389  55  55]]
[[402 163  23  23]
 [593 177  24  24]
 [ 20  69  86  86]
 [859 224  45  45]
 [798 229  46  46]
 [535 307  46  46]
 [595 313  39  39]
 [824 286  47  47]
 [557 366  49  49]]
CPU = 1057.8985214233398/ms

動作はしたが、目や顔でない部分も検出されている。

顔を認識したら写真を撮影するプログラム †

cam_face.py を新規作成する。左は実行し写した写真 →

~/work-opencv $ vi cam_face.py

# -*- coding: utf-8 -*-

"""
カスケード分類器
顔を認識したら写真を撮影する
"""
import cv2
import numpy as np      

def __main():
    # カメラ準備 
    cap = cv2.VideoCapture(0)

    # メインループ 
    while True:
        ret, frame = cap.read()
        img = getResize(frame)

        # Reload on error 
        if ret == False:
            continue

        # 顔検出の処理効率化のために、写真の情報量を落とす（モノクロにする）
        grayimg = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

        # 顔検出を行う
        facerect = face_cascade.detectMultiScale(grayimg, scaleFactor=1.2, minNeighbors=2, minSize=(100, 100))

        # 顔が検出された場合
        if len(facerect) > 0:
            # そのときの画像を保存する
            cv2.imwrite('my_face.jpg', frame)
            break

        # 画像表示
        cv2.imshow('Object-Detect', frame)

        # 何らかのキーが押されたら終了
        key = cv2.waitKey(1)
        if key != -1:
            break

    # 画像表示
    cv2.imshow('Object-Detect', frame)

    # キーが押されたら終了
    cv2.waitKey(0)

    # 終了処理
    cap.release()
    cv2.destroyAllWindows()

def getResize(img):
    basePixSize = 1280  # 縦横で大きい辺の変更したいサイズ
    height = img.shape[0]
    width = img.shape[1]

    largeSize = max(height, width)  # 大きい方の辺のサイズ
    resizeRate = basePixSize / largeSize  # 変更比率を計算
    img = cv2.resize(img, (int(width * resizeRate), int(height * resizeRate)))

    return img

if __name__ == '__main__':
    print(cv2.__version__)

    # 顔検出のための学習元データを読み込む
    face_cascade = cv2.CascadeClassifier('haarcascades/haarcascade_frontalface_default.xml')
    __main()

動画の中で顔を捕捉、追従するプログラム †

cam_face1.py を新規作成する。

~/work-opencv $ vi cam_face1.py

# -*- coding: utf-8 -*-

"""
カスケード分類器
動画の中で顔を捕捉、追従する
"""
import cv2
import time

def __main():
    # カメラ準備 
    cap = cv2.VideoCapture(0)

    # メインループ 
    while True:
        ret, frame = cap.read()
        img = getResize(frame)

        # Reload on error 
        if ret == False:
            continue

        # 顔検出の処理効率化のために、写真の情報量を落とす（モノクロにする）
        grayimg = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

        # 顔検出を行う
        facerect = face_cascade.detectMultiScale(grayimg, scaleFactor=1.2, minNeighbors=2, minSize=(10, 10))

        # 顔が検出された場合
        if len(facerect) > 0:
            # 検出した場所すべてに赤色で枠を描画する
            for rect in facerect:
                cv2.rectangle(img, tuple(rect[0:2]), tuple(rect[0:2]+rect[2:4]), (0, 0, 255), thickness=3)

        # 画像表示
        cv2.imshow('Object-Detect', img)

        # 何らかのキーが押されたら終了
        key = cv2.waitKey(1)
        if key != -1:
            break

    # 終了処理
    cap.release()
    cv2.destroyAllWindows()

def getResize(img):
    basePixSize = 640  # 縦横で大きい辺の変更したいサイズ
    height = img.shape[0]
    width = img.shape[1]

    largeSize = max(height, width)  # 大きい方の辺のサイズ
    resizeRate = basePixSize / largeSize  # 変更比率を計算
    img = cv2.resize(img, (int(width * resizeRate), int(height * resizeRate)))

    return img

if __name__ == '__main__':
    print(cv2.__version__)

    # 顔検出のための学習元データを読み込む
    face_cascade = cv2.CascadeClassifier('haarcascades/haarcascade_frontalface_default.xml')
   __main()

顔検出のパラメータ
- 顔検出のコード
```
facerect = face_cascade.detectMultiScale(grayimg, scaleFactor=1.2, minNeighbors=2, minSize=(10, 10))
```
- scaleFactor は各画像スケールにおける縮小量を表し、１より大きくしていくことで細かい領域をそれだけ飛ばして計算することになりる。計算も早くなるが、大きくしすぎると見逃しも多くなる。
- minNeighbors は物体の検出候補となる矩形が、最低でもこの数だけの近傍矩形を含むものとしている。物体と認識する部分がたくさん重なっているものに対して検出するというイメージで、大きくすると誤った検出は少なくなるが、見逃しも多くなる。
検出精度を上げるためのパラメータの調整が難しい。

参考資料 †

顔認証
- 顔認証の仕組みをわかりやすく解説 → マスクをした顔を正しく判断！精度の違いは？
- Raspberry PiとOpenCVによる画像認識で人の顔を判別する
- 【Python】OpenCVのHaar Cascadesによる顔検出

Last-modified: 2021-01-16 (土) 05:32:07