私的AI研究会 > ミーティング履歴

ミーティング履歴

▼ 目 次

次回予定

2024/05/18 10:00~12:00 in 桶川邸

Official YOLOv5 考察2 学習編

drive003_ts0_s.gif
  1. オープンデータセットを用いた追加学習「交通標識の検出」
     ・前準備
     ・学習の実行
     ・実行結果を使って推論
     ・実行結果を使って推論(日本語表示)
     ・結果から見た疑問点
     ・疑問点についての考察
     ・「Traffic Signs Dataset」を再学習
     ・2つまでの学習済みモデルを指定できる YOLO V5 物体検出プログラム

  2. オープンデータセットによる学習「マスク着用の判定」
     ・前準備
     ・学習の実行
     ・実行結果を使って推論
     ・実行結果を使って推論(日本語表示)

  3. カスタムセットによる学習「じゃんけんの判定」
     ・前準備
     ・学習の実行
     ・実行結果を使って推論
     ・実行結果を使って推論(日本語表示)

  4. Official YOLOv5 まとめ

      新規ページ物体検出アルゴリズム「YOLO V5」2(学習編)

2024/04/14 10:00~12:00 in 桶川邸

img01x.jpg

 Chapter04【復習】物体検出アルゴリズム「YOLO V5」

  1. Official YOLOv5 考察
     ・物体検出とは
     ・YOLO について
     ・YOLOv5 をローカルマシンにインストール
     ・YOLOv5 デモプログラムの実行
     ・実行プログラムの修正「detect.py」→「detect2.py」
     ・推論プログラム「detect2.py」の実行
     ・学習済みモデルのフォーマット変換「export.py」
     ・変換した学習済みモデルで 推論プログラム「detect2.py」の実行

  2. YOLO V5 を「PyTorch」で使う
     ・YOLO V5 テストプログラム
     ・YOLO V5 物体検出プログラム「detect2_yolov5.py」の作成
     ・PyTorch モデル実行速度
     ・モデルによる推論結果の違い
     ・YOLO V5 / YOLO V3 比較

  3. YOLO V5 を「OpenVINO™」で使う
     ・OpenVINO™ API 2.0 対応方法を調べる
     ・YOLO V5 学習済みモデル バージョンによる違い
     ・「export.py」で得られた ONNXファイルを OpenVINO™ IR に変換
     ・OpenVINO™ API 2.0 対応プログラム「yolov5_OV.py」を作成

     新規ページ【復習】物体検出アルゴリズム「YOLO V5」

2024/03/16 10:00~11:45 in 桶川邸

2024/02/24 10:00 in 桶川邸

pytorch_book_s.jpg

2024/01/20 10:00~12:15 in 桶川邸

  1. Windows / Linux デュアルブートについて
     ・AI 機械学習に適合するハードウェア
     ・Linux 環境の必要性と WSL(Windows Subsystem for Linux)

  2. このサイトを検証するために必要な開発環境の構築
     ・Windows(Windows10/11)の場合
     ・Linux(Ubuntu20.04LTS/22.04LTS)

  3. 画像生成 2 GAN(敵対的生成ネットワーク)
     ・前回の続き

 ※ データファイルをサイトにアップしています → update_20240117.zip (9.93MB)

2023/12/17 10:00~12:00 in 桶川邸

GAN(敵対的生成ネットワーク)

2023/10/21 10:00~12:00 in 桶川邸

reference_0_m.jpg

2023/09/23 10:00~12:00 in 桶川邸

colab_s.jpg

2023/08/20 10:00~13:00 in 桶川邸

jankenn_tet2.gif

2023/07/22 10:00~13:00 in 桶川邸

jk2_test_batch0_labels.jpg

2023/06/18 10:00~12:00 in 桶川邸

jk_test_batch0_labels.jpg

2023/05/20 10:00~12:00 in 桶川邸

20230509_000001_001m.jpg
  1. 「YOLO V7」でカスタムデータによる学習をする
    ・Google Colaboratory 上に「YOLO V7」を実装
    ・カスタムデータによる学習1「マスク着用の判定」
    ・新規ページ → YOLO V7 on Google Colaboratory

2023/04/22 10:00~12:00 in 桶川邸

yolo7_out1.jpg

2023/03/25 10:00~12:00 in 桶川邸

20230210_000021_001m.jpg
  1. ディープ・ラーニングの今 2023
     『インターフェース4月号』の特集3を参考に、画像処理向け深層学習のタスクと ChatGPT やStable Diffusion でも使われる深層学習の最新アーキテクチャ「Transformer」について
    ・新規ページ → ディープ・ラーニングの今 2023 「私的AI研究会」レポート

  2. 画像の外側を生成する「Stable Diffusion Infinity」を試す
     実行には GPU 必須なので、クラウドサービス「Google Colaboratory」を使ってみる。
    ・新規ページ → 「Stable-Diffusion infinity」を試してみる
             実行環境に「Google Colaboratory」を使う

2023/02/11 10:00~11:30 in 桶川邸~

  1. AI チャットポット
    ・新規ページ → チャットGPT を試してみる

  2. 画像生成AI まとめ
    ・新規ページ → 画像生成 プロジェクト環境構築(Windows編)
    プロジェクト・ファイル
    AI_project_20230203.zip (55.9MB) <Stable-deffusion プロジェクト一式>

2023/01/21 10:00~11:30 in 桶川邸

20221225_000000_001m.jpg

  アップデートファイル
  update_20230104.zip (1.27GB) <Windows/Linux 追加ファイル>

  1. Stable-diffusion 自動翻訳を組み合わせる
    ・自動翻訳機能を追加する
    ・GUI プログラムを改良する(stable_diffusion2.py / stable_diffusion_make2.py)

  2. Stable-Diffusion 画像生成を試す
    ・画像生成を片っ端から試してみる

  3. Stable-Diffusion 実用性を探る
    ・Webデザイン素材の生成

  4. Stable-Diffusion 人物画像を生成する
    ・人物画像生成の手法と問題点

  5. Stable-Diffusion 画像を元にして生成する
    ・元画像から画像を生成する

2022/12/17 10:00~12:00 in 桶川邸~

20221130_000000_002m.jpg

  アップデートファイル
  update_20221208.zip (52.8MB) <Windows 追加ファイル>
  update_20221208.tar.gz (52.3MB) <Linux 追加ファイル>

  1. Stable-diffusion GUI インターフェース版を動かす
     ・Stable-diffusion 設定パラメータについて
     ・同じ画像を生成する方法
     ・主なパラメータの意味
     ・自動実行版
  2. 画像生成AI「Stable-Diffusion」画像生成を試す
  3. 画像生成AI「Stable-Diffusion」パラメータを検証する

    (参考) 「openvino」py37で作成したプログラムを新しい py38 の環境で動かす
     ・必要となる処置
     ・windows 環境下の場合 Path 設定の追加が必要

2022/11/24 15:00~15:30 AI研究会成果報告 on zoom

2022/11/19 10:00~12:00 in 桶川邸

output_015.jpg

  アップデートファイル
   update_20221109.zip (733MB) <Windows 追加ファイル>
   update_20221109.tar.gz (733MB) <Linux 追加ファイル>

2022/10/22 10:00~12:30 in 桶川邸

アップデートファイル
update_20221015.zip (2.48MB) <Windows 追加ファイル>
update_20221015.tar.gz (2.47MB) <Linux 追加ファイル>

  1. 前回 Step 6 までの成果を「AI受付システム」へ改良してみる
  2. 「未登録の顔」を認識すると自動的に顔画像をキャプチャーして名前入力ダイアログを表示させる
  3. 判別の閾値を低め(0.5)に設定して精度を上げる
  4. 起動時の動作モード指定で登録専用モードに移行できるようにする

    作成ページ → 受付システム・プログラム

2022/09/23 10:00~12:00 in 桶川邸~

アップデートファイル
update_20220916.zip (95.4MB) <Windows 追加ファイル>
update_20220916.tar.gz (341KB) <Linux 追加ファイル>

  1. 顔認証プログラムの開発 Step 5  作成ページ → 認証結果を音声とメールで知らせる
  2. 日本語発声について
     作成ページ → Open JTalk で日本語発声
  3. メール送信について
     作成ページ → Python でメール送信
  4. 今後の展開について
     ショートメール送信など...

2022/08/27 10:00~12:00 in 桶川邸~

auto_door.gif
  1. 顔認証の応用
    前回の最終プログラム「face_rec3.py」に模型の『自動ドア』制御を組み込んでみる
    作成ページ → 顔認証の結果で『自動ドア』を制御する

  2. 作成した『自動ドア』模型の概要
    作成ページ → PC からコントロールできる『自動ドア』を作る

  3. PC インターフェース作成方法とその環境
    Raspberry Pico マイコンと新しくなった Raspberry OS 再検証
    作成ページ → Raspberry Pi Pico を動かす
            RaspberryOS「Bullseye」
            Raspberry Pi 再検証

  4. 今後の展開について
    受付システムへの応用を検討する

2022/07/23 10:00~12:00 in 桶川邸~

  1. 前回の復習
    ・顔データを追加した実行結果 → Face Recognition

  2. 顔認証プログラム Step 1
    ・作成ページ →「カメラによるリアルタイム顔判定」

  3. 顔認証プログラム Step 2
    ・作成ページ →「カメラで認識した顔画像を登録」

  4. 顔認証プログラム Step 3
    ・作成ページ →「顔認証パッケージ「Face recognition」のテスト 」
    ・作成ページ →「顔登録の方法と認識手法を改良する」

  5. 今後の展開について
    ・顔認証の実用的な使い方を考える。
    ・開閉ゲート出力のモデルの検討。

2022/06/25 10:00~13:30 in 桶川邸~

  1. 顔識別/顔認識についての復習
    顔認証 (Face recognition) 概要
  2. 顔識別/顔認識をやってみる
    ・新規作成ページ → 顔認証/顔認識について
  3. 今後の展開について

2022/05/14 10:00~13:30 in 桶川邸

  1. 「EasyOCR」の環境構築
  2. 「EasyOCR」動作確認
    ・アップデートファイル(~/workspace_py37/easyocr ディレクトリに追加)
    update_20220511.zip (458KB) <Windows EasyOCR 追加プロジェクト>
    update_20220511.tar.gz (449KB) <Linux EasyOCR 追加プロジェクト>
  3. 「EasyOCR」についても概要
    ・新規作成ページ  → 文字認識エンジン「EasyOCR」

2022/04/23 10:00~13:30 in 桶川邸

  1. 「TryOCR」プログラム全体を見直した「FormOCR」について
    ・入力の前処理プログラム「prepros.py」
     PDFファイル柄画像抽出・縦横変換・水平傾き補正を行う。
    ・自動実行プログラム「formocr.py」の傾き補正は選択可能とする。
     デフォールトでは実行しない。
     → 帳票OCRプログラム FormOCR
  2. 環境設定の新規ページ
     Windows/Linux 向けのパッケージをアップロード
     → FormOCR 環境構築
  3. 操作マニュアルのページについて
     → FormOCR 操作マニュアル
  4. 次回のテーマ
    ・EasyOCR についての調査
    ・顔認識・認証システム実現の方向調査

2022/03/19 10:00~14:00 in 桶川邸

  1. OCRプログラム改良版
    ・アップデートファイル
    update_win_20220312.zip (54.1MB) Win版追加更新ファイル
    update_data_20220312.zip 218MB) テスト伝票データ
     → ダウンロード URL
    ※ ダウンロード・解凍してコピー (コピー前に ~/workspace_py37/tryocr ディレクトリを削除すること)

    ・フォームの位置ずれ(傾き&縦横のずれ)に対応。

  2. 実際の帳票データでの結果報告。

  3. 結果の検討と AI-OCR 実現への課題

  4. 今回追加したページ
     → OCR アプリケーション実用編 2

2022/02/19 10:00~13:30 in 桶川邸

20220209_000002_001m.jpg
  1. 伝票処理のためのOCRプログラム実証版
    ・アップデートファイル

      update_win_20220214.zip (45.8M) Win版追加更新ファイル
      update_20220214.tar.gz (263MB) Linux版更新ファイル

    ・これまで「~Step6」のプログラムをまとめて新しく自動化プログラム「tryocr_go.py」を作成。

  2. 実際の帳票データでフォームを入力して自動化処理した結果報告。

  3. 現状の結果と問題点。次のステップへの課題。
    ・帳票の位置のずれ対策 (ヒント:最初の「請求書」項目の領域をある程度広くとっておき OCR出力の認識文字位置を記録しておき別のフォームでの検出結果と比較、オフセット値として補正する)
    ・傾きのある帳票の処理の自動化 (ヒント:現在のアルゴリズムを再検証して組み込む)
    ・処理速度の向上 (ヒント:今のところ思いつかず。)

  4. 今回追加したページ
     → OCR アプリケーション実用編
     → OCR プログラム基礎編のまとめ

2022/01/22 10:00~14:00 in 桶川邸

20220119_000001_001m.jpg
  1. 伝票処理のためのOCRプログラム試作版
    ・アップデートファイル

      update_win_20220119.zip (1.20M) Win版追加更新ファイル
      update_20220119.tar.gz (351MB) Linux版更新ファイル

    ・帳票画像から項目の位置情報を入力して配置情報ファイルを作成するソフト「Step 4」
    ・配置情報ファイルを使用して帳票の項目を自動的に文字化するソフト「Step 5」
     → OCRアプリケーションを作る 2 「Step4~5」

    ・帳票の項目を自動的に文字化して CSV ファイル出力するソフト「Step 6」
     → OCRアプリケーションを作る 3 「Step6」

  2. Windows環境でこれまで作成したソフトを動かす
     → Windows環境で動かす

  3. (参考)今回新しく追加した主なページ
    ・開発の基礎 Python GUI演習
     → マウス・イベント編
     → ダイアログ・コントロール編
     → PySympleGUI編
     → cvui編
     → Python OpenCV GUI Tips

    ・事前検証
     → Python「PyYaml」モジュール
     → OCRアプリケーションを作る 1 「Step1~3」

2021/12/18 10:00~14:00 in 桶川邸

pyocr_06_s.jpg

実用的なAI開発に向けて、OCRプログラムを創ってみる。
・アップデートファイル update_20211214.tar.gz (73.2MB)

  1. 文字認識エンジン「Tesseract」
    ・文字認識エンジンをテストする
  2. 文字認識エンジンのための画像処理
    ・OCR処理の前処理としての画像処理プログラム
  3. OCRプログラム 試作版
    ・静止画/動画/カメラ 対応の OCRプログラム試作版
  4. 次のステップへの課題ほか

2021/11/13 10:00~14:00 in 桶川邸

pytorch7_ai_13.jpg

アップデートファイル「update_20211110.tar.gz」

  1. 「第7章 線画をイラストに変換する」
    学習結果と問題点など。
  2. 書籍「PyTorch ではじめる AI開発」全体のまとめと課題

2021/10/23 10:00~14:00 in 桶川邸

chapt05_result3_s.gif
  1. 画像認識 (Image Recognition) とは
     画像認識技術の分類、アルゴリズム(モデル)などについて
    「第5章 動画の背景を入れ替える」
  2. 物体検出アルゴリズム「YOLO V5」
    「第4章 物体検出と学習済みモデル」
  3. 顔認証 (Face recognition) 概要
    「第6章 アジア人向けに強化された顔認証」
  4. 敵対的生成ネットワーク(GAN)
    「第7章 線画をイラストに変換する」
  5. 日本語OCRプログラム
    「第8章 OCR における文字認識」
    「第9章 CHAPTER 09 OCR を完成させる」

  6. GPU (NVIDIA GeForce GTX 1050 Ti) を使う
  7. OpenVINO™ を利用する(ONNXモデルコンバート検証)

2021/09/18 10:00~14:00 in 桶川邸

2021/08/28 16:00~14:00 in 桶川邸

2021/07/20 16:00~16:40 AI研究会成果報告 on ZOOM

2021/07/17 10:00 in 桶川邸

2021/06/26 10:00 in 桶川邸

2021/05/15 10:00 in 桶川邸

2021/04/17 in 桶川邸 & Zoom

20210401_161018_001m.jpg

2021/03/27 in 桶川邸

2021/02/27 in 井筒邸 & Zoom

2021/01/23 in 桶川邸

20201215_162458_001m.jpg

2020/12/13 in 桶川邸

2020/11/21 in 桶川邸

20201112_091643_001m.jpg

2020/10/24 in 桶川邸

2020/09/26 in 桶川邸

2020/08/29 in 桶川邸

raspi_books1_.jpg

2020/07/18 in 桶川邸

raspi_books2_.jpg

2020/06/20 in 桶川邸

2020/05/16 リモート会議 on Zoom

2020/05/04 リモート会議 on Zoom

2020/04/12 in 桶川邸

2020/03/20 in 桶川邸

「Raspberry Pi+AI 電子工作超入門」

「Raspberry Pi ではじめる機械学習」

raspi_books_ml.jpg

2020/02/11 in 桶川邸

Section6 までの調達部品の分配

20200126_163046_001s.jpg
20200123_131301_001s.jpg

Section2~4 ハードウェアの確認

2020/01/11 in 大阪日本橋

第一段階ミッション

raspberry_books.jpg

「Raspberry Pi+AI 電子工作超入門」に従って基本検証をすすめる。

 

部品調達

20200111_162919_001s.jpg