ミーティング履歴

ミーティング履歴 †

▼　目　次

↑

次回予定 †

2025/08/23 10:00～　桶川邸

↑

2025/07/12 10:00～12:00　桶川邸 †

　大規模言語モデル（LLM）のローカルマシンでの検証（前回の続き）

ローカル PC で LLM を利用する（構築編）『Ollama / Open WebUI』
　・サイバーエージェントが日本語に対応させた「DeepSeek-R1 日本語版」を使ってみる
ローカル PC で LLM を利用する（運用編）『Open WebUI で Gemma 3 を使う』
　・ウェブ情報を活用して応答結果の精度を上げる
　・任意の Python コードを実行して応答結果の精度を上げる
　・RAG（検索拡張生成）を試してみる

↑

2025/06/21 10:00～12:00 桶川邸 †

　大規模言語モデル（LLM）のローカルマシンでの検証

↑

2025/05/10 10:00～11:15 on ZOOM †

便利な「Stable Diffusion」拡張機能の紹介
・画像の顔を入れ替える（FaceSwap）『Reacror』
・画像の背景を消す『Rembg』
・画像の背景を消す（高精度）『BiRefNet』
・生成画像を一括で表示・管理する『ImageBrowser』
・プロンプトの入力を簡単にボタンで入力『EasyPromptSelector』
生成画像の比較
・ハードウェアの違いによる生成画像の比較　reFoege
・ハードウェアの違いによる生成画像の比較　SD.Next
画像生成AI まとめ
・画像生成AI まとめ・索引
次回の予定
・ローカル PC で LLM を利用する

↑

2025/04/12 14:00～16:00 in 桶川邸 †

前回の復習
→ 「Stable Diffusion」チュートリアル 2
画像生成を細かく制御する「ControlNet」詳細
→ 「Stable Diffusion」拡張機能「ControlNet」
画像の解像度を上げる（アップスケーラー）
→ 「Stable Diffusion」パラメータ『アップスケーラー』

↑

2025/03/29 10:00～12:00 on ZOOM †

参照ページ → 「Stable Diffusion」チュートリアル 2 応用編
● 新しく「Stability Matrix」環境下の「reForge」を使います

　1. 写真から「水彩画/油絵」を生成　～「ControlNet」を使う～
　　・事前準備
　　・写真から「水彩画/油絵」を生成する
　2. 写真からイメージに合った画像を生成　～「Tagger」「ADetailer」「openPose」を使う～
　　・STEP 1：「Tagger」でプロンプトを抽出
　　・STEP 2：「ADetailer」で顔の崩れを修正します
　　・STEP 3：「openPose」でポーズを変更します
　　：STEP 4：「img2img」で元画像のイメージに近づけてみます

　※ サンプル画像 → SD_sample.zip (200MB)

↑

2025/02/22 10:00～12:00 in 桶川邸 †

参照ページ → 「Stable Diffusion web UI」最初の一歩

はじめに
1. 基本操作編最も簡単に画像を生成する
2. パラメータ設定編１操作画面の主要パラメータについて
3. パラメータ設定編２モデルとサンプリング関連設定
3. 自動でパラメータ変化を実行させることのできる便利機能
5. ハードウェア環境による生成画像の違い

※ CPU 動作では画像生成1枚に数分かかります
生成AI専用ページを作成しています ➡ 画像生成 AI「Stable Diffusion」

↑

2025/01/18 10:00～12:00 in 桶川邸 †

ディープフェイク「FaceFusion」
・プロジェクトの実行に必要なファイル
　 project_facefusion.zip (15.6MB) <facefusion>
画像生成 AI「Stable Diffusion」
・次回予定の「Stable Diffusion」の概要

↑

2024/12/14 10:00～11:45 in 桶川邸 †

　音声認識/音声合成

≪ 事前設定 ≫
下記ファイルをダウンロードし解凍してできた「workspace_2/」ディレクトリを先月までの実行環境に上書きしてください
・project_mylib.zip (470MB) <myLibrary> ※20241121更新

音声で顔画像を動かす：One Shot Talking Face（その２）
・『One Shot Talking Face』のデモプログラム「talk_face.py」を動かす
・音声認識エンジン pocketsphinx のテスト「talk_text.py」
・認識結果を日本語に翻訳する機能を追加「talk_text2.py」
音声認識 / 音声合成
・音声認識『SpeechRecognition』
・音声合成『pyttsx3』
・音声合成『pyopenjtalk』
・音声アシスタントの作成

プロジェクトの実行に必要なファイル
・project_talking-face.zip (27.1MB) <talking-face> ※20241118更新
・project_speech_rec.zip (50.2MB) <speech_rec> ※20241118更新

↑

2024/11/16 10:00～11:00 in 桶川邸 †

　「敵対的生成ネットワーク GAN」GUI 実行プログラムを作成

　　≪ 事前設定 ≫

下記ファイルをダウンロード
update_20241111.zip (55.5MB) <2024/11/11 までのアップデート> ※20241111更新
「anaconda_win/workspace_2/motion-co-seg/」ディレクトリ内の「results/」「results_save/」フォルダを削除する
解凍してできた「workspace_2/」ディレクトリを先月までの実行環境に上書きする

≪ GUI プログラムの実行 ≫
AI demo 起動プログラム (GUI 対応版)
静止画から動画を作る (First Order Motion Modell)
動画のパーツを入れ替える (Motion Supervised co-part Segmentation)

↑

2024/10/19 10:00～12:15 in 桶川邸 †

　「敵対的生成ネットワーク GAN」をローカルマシンで実行する２

　プロジェクトの実行に必要なファイル

update_20240921.zip (16kB) <2024/09/21 までのアップデート> ※20240921更新
project_stargan-v2.zip (694MB) <stargan-v2> ※20240921更新
project_QMUPD.zip (83.7MB) <QMUPD> ※20240920更新
project_PAMA.zip (398MB) <PAMA> ※20240921更新
project_BlendGAN.zip (4.97GB) <BlendGAN> ※20240920更新
project_stylegan3.zip (1.47GB) <StyleGAN> ※20241012更新

　GAN ここまでのまとめ
GAN AI demo 起動プログラム
AI 開発における GPU速度考察

↑

2024/09/07 10:00～12:00 in 桶川邸 †

　「敵対的生成ネットワーク GAN」をローカルマシンで実行する

　プロジェクトの実行に必要なファイル

project_DLFS.zip (393MB) <DLFS>
project_e4e.zip (1.12GB) <encoder4editing>
project_CycleGAN.zip (166MB) <CycleGAN>

↑

2024/08/10 10:00～12:00 in 桶川邸 †

動画のパーツを入れ替える「Motion Supervised co-part Segmentation」

提供されているデモ「part_swap.py」を試す
GUI で操作できるプログラム「motion_seg.py」を作成する

「face-parsing」顔のパーツに関するピクセル単位のラベルマップを求める
P 提供されているデモ「makeup.py」を試す
GUI で操作できるプログラム「makeup2.py」を作成
顔のパーツを分離するプログラム「parsing.py」を作成
メークアップをシュミレーションできる「makeup_gui.py」を作る

　　新規ページ → 動画のパーツを入れ替える「Motion Supervised co-part Segmentation」

↑

2024/07/20 10:00～12:00 in 桶川邸 †

　静止画から動画を作る：First Order Motion Model（その２）

実行環境の準備
・新しく仮想環境『py38_learn』とプロジェクト『workspace_2』を作成する
・提供されているデモ「demo.py」を試す
カテゴリーを簡単に指定できるプログラム「fomm.py」を作成する
GUI で操作できるプログラム「fomm_test.py」を作成する
顔のカテゴリーを試す
その他のカテゴリー
・全身のカテゴリー
・アニメーション(Moving GIF) のカテゴリー
・太極拳(Taichi) のカテゴリー
First Order Motion Model ここまでのまとめ

　　新規ページ → 静止画から動画を作る：First Order Motion Model（その２）

↑

2024/06/22 10:00～12:00 in 桶川邸 †

　『ナンバープレート判別』「YOLO V5」３

プロジェクト実行の準備
Step 1: ナンバープレートの領域を判別
　・データセットの準備
　・学習の実行
　・実行結果を使って推論
Step 2: ナンバープレートの情報を識別
　・データセットの準備
　・学習の実行
　・実行結果を使って推論
　・ナンバープレート識別プログラムを作成
ナンバープレート判別まとめ

　新規ページ → ナンバープレート判別』「YOLO V5」３

↑

2024/05/18 10:00～12:00 in 桶川邸 †

　Official YOLOv5 考察２学習編

オープンデータセットを用いた追加学習「交通標識の検出」
　・前準備
　・学習の実行
　・実行結果を使って推論
　・実行結果を使って推論（日本語表示）
　・結果から見た疑問点
　・疑問点についての考察
　・「Traffic Signs Dataset」を再学習
　・2つまでの学習済みモデルを指定できる YOLO V5 物体検出プログラム
オープンデータセットによる学習「マスク着用の判定」
　・前準備
　・学習の実行
　・実行結果を使って推論
　・実行結果を使って推論（日本語表示）
カスタムセットによる学習「じゃんけんの判定」
　・前準備
　・学習の実行
　・実行結果を使って推論
　・実行結果を使って推論（日本語表示）
Official YOLOv5 まとめ

　 新規ページ → 物体検出アルゴリズム「YOLO V5」２（学習編）

↑

2024/04/14 10:00～12:00 in 桶川邸 †

　Chapter04【復習】物体検出アルゴリズム「YOLO V5」

Official YOLOv5 考察
　・物体検出とは
　・YOLO について
　・YOLOv5 をローカルマシンにインストール
　・YOLOv5 デモプログラムの実行
　・実行プログラムの修正「detect.py」→「detect2.py」
　・推論プログラム「detect2.py」の実行
　・学習済みモデルのフォーマット変換「export.py」
　・変換した学習済みモデルで推論プログラム「detect2.py」の実行
YOLO V5 を「PyTorch」で使う
　・YOLO V5 テストプログラム
　・YOLO V5 物体検出プログラム「detect2_yolov5.py」の作成
　・PyTorch モデル実行速度
　・モデルによる推論結果の違い
　・YOLO V5 / YOLO V3 比較
YOLO V5 を「OpenVINO™」で使う
　・OpenVINO™ API 2.0 対応方法を調べる
　・YOLO V5 学習済みモデルバージョンによる違い
　・「export.py」で得られた ONNXファイルを OpenVINO™ IR に変換
　・OpenVINO™ API 2.0 対応プログラム「yolov5_OV.py」を作成

　新規ページ → 【復習】物体検出アルゴリズム「YOLO V5」

↑

2024/03/16 10:00～11:45 in 桶川邸 †

「【復習】PyTorch ではじめる AI開発」
　〇 Anaconda 環境再構築
　　新規ページ → 【復習】Anaconda

　〇 CHAPTER 02 定点カメラの映像を認識する
　　更新ページ → 【復習】PyTorch ではじめる AI開発

　〇 CHAPTER 03 教師データにない状況を異常検出
　　新規ページ → 【復習】PyTorch ではじめる AI開発3

↑

2024/02/24 10:00～12:00 in 桶川邸 †

「PyTorch ではじめる AI開発」を元に進めた AI学習をもう一度復習する
　〇 CHAPTER 01 環境構築
　　新しく python3.11 仮想環境を作成する
　〇 CHAPTER 02 定点カメラの映像を認識する
　　新しい仮想環境で学習/推論を実行する

　新規ページ → 【復習】PyTorch ではじめる AI開発
　※ データファイルをサイトにアップしています → update_20240214.zip (2.56GB)

↑

2024/01/20 10:00～12:15 in 桶川邸 †

Windows / Linux デュアルブートについて
　・AI 機械学習に適合するハードウェア
　・Linux 環境の必要性と WSL（Windows Subsystem for Linux）
このサイトを検証するために必要な開発環境の構築
　・Windows（Windows10/11）の場合
　・Linux（Ubuntu20.04LTS/22.04LTS）
画像生成 2　GAN（敵対的生成ネットワーク）
　・前回の続き

　※ データファイルをサイトにアップしています → update_20240117.zip (9.93MB)

↑

2023/12/17 10:00～12:00 in 桶川邸 †

GAN（敵対的生成ネットワーク）

↑

2023/10/21 10:00～12:00 in 桶川邸 †

「StarGAN-v2」による顔の合成
　オフィシャルサイト StarGAN v2 - Official PyTorch Implementation をもとにローカルマシンで顔合成をやってみる

　※ 実行に必要なデータファイルをサイトにアップしています → update_20231015.zip (687MB)
新規ページ → 顔の合成：StarGAN-v2

↑

2023/09/23 10:00～12:00 in 桶川邸 †

無償で利用可能なクラウド上の Python 環境「Google Colaboratory」を使ってカスタムデータによる学習を新規に実行してみる
　1. 新しく「YOLO V7」の動作環境を作成する（所要時間およそ20分）
　2. カスタムデータセットによる追加学習（所要時間およそ30分）
　3. 学習済みモデルを使用してローカルマシンでの推論実行（所要時間およそ10分）
「じゃんけん」カスタムデータによる学習まとめ

　新規ページ → Google Colaboratory で機械学習
　　　　　　　「じゃんけん」カスタムデータによる学習モデルまとめ

↑

2023/08/20 10:00～13:00 in 桶川邸 †

#ref(): File not found: "jankenn_tet2.gif" at page "私的AI研究会"

新規の画像データから新しく2種類のデータセットを作成し「じゃんけんの判定」をする
　1. 学習回数(epochs) = 60 として「GoogleColab」上で学習する（実行時間約50分 x 2）
　2. ローカルマシンで推論実行する
　3. データセットの違いによる推論結果を検討する

　※ 学習結果のファイルをサイトにアップしています → update_20230813.zip (1.32GB)
新規ページ → カスタムデータによる学習４「じゃんけんの判定３」
　　　　　　　　元になる学習モデルの違いによる考察

↑

2023/07/22 10:00～13:00 in 桶川邸 †

カスタムデータによる学習時のパラメータについて調べる
　1. 学習回数(epochs) の違いについて 300/100/50 を試す~
　2. バッチサイズ(batch-size) を小さく 2 してみる
　3. Official YOLOv7 の付属プログラムの機能について
　4. GPUのメモリーサイズについて
新しくデータセットを作成し直して「じゃんけんの判定」をする
　1. 学習回数(epochs) = 60 として「GoogleColab」上で学習する（実行時間約50分）
　2. ローカルマシンで推論実行する

　※ 学習結果のファイルをサイトにアップしています → update_20230718.zip (784MB)
新規ページ → 学習パラメータ考察
　　　　　　　カスタムデータによる学習３「じゃんけんの判定２」

↑

2023/06/18 10:00～12:00 in 桶川邸 †

「じゃんけんの判定」を実現できる手法を検証する
　1. 前回作成した Google Colaboratory 上の「YOLO V7」環境に追加する
　2. 学習データの作成とラベリング（アノテーション）をおこない自前のデータセットを作成する方法を知る
　3. できたデータセットを使って「YOLO v7」で学習モデルを作成する
　4.できた学習モデルを「onnx」形式にコンバートしローカルマシン上の OpenVINO を使用して推論を実行してみる

　※ 時間のかかるものは結果のファイルをサイトにアップしています → update_20230616.zip (1.22GB)
新規ページ → カスタムデータによる学習２「じゃんけんの判定」

↑

2023/05/20 10:00～12:00 in 桶川邸 †

「YOLO V7」でカスタムデータによる学習をする
・Google Colaboratory 上に「YOLO V7」を実装
・カスタムデータによる学習１「マスク着用の判定」
・新規ページ → YOLO V7 on Google Colaboratory

↑

2023/04/22 10:00～12:00 in 桶川邸 †

物体認識のタスクのひとつ「YOLO V7」を検証する
・オフィシャルサイトからプロジェクトを作成し動作させる
・これまでに調べた「YOLO V5」「YOLO V3」との比較
・新規ページ → 物体認識の深層学習タスク：YOLO V7

↑

2023/03/25 10:00～12:00 in 桶川邸 †

ディープ・ラーニングの今 2023
　『インターフェース4月号』の特集3を参考に、画像処理向け深層学習のタスクと ChatGPT やStable Diffusion でも使われる深層学習の最新アーキテクチャ「Transformer」について
・新規ページ → ディープ・ラーニングの今 2023 「私的AI研究会」レポート
画像の外側を生成する「Stable Diffusion Infinity」を試す
　実行には GPU 必須なので、クラウドサービス「Google Colaboratory」を使ってみる。
・新規ページ → 「Stable-Diffusion infinity」を試してみる
　　　　　　　　実行環境に「Google Colaboratory」を使う

↑

2023/02/11 10:00～11:30 in 桶川邸 †

AI チャットポット
・新規ページ → チャットGPT を試してみる
画像生成AI まとめ
・新規ページ → 画像生成プロジェクト環境構築（Windows編）
・プロジェクト・ファイル
AI_project_20230203.zip (55.9MB) <Stable-deffusion プロジェクト一式>

↑

2023/01/21 10:00～11:30 in 桶川邸 †

　　アップデートファイル
　　update_20230104.zip (1.27GB) <Windows/Linux 追加ファイル>

Stable-diffusion 自動翻訳を組み合わせる
・自動翻訳機能を追加する
・GUI プログラムを改良する（stable_diffusion2.py / stable_diffusion_make2.py）
Stable-Diffusion 画像生成を試す
・画像生成を片っ端から試してみる
Stable-Diffusion 実用性を探る
・Webデザイン素材の生成
Stable-Diffusion 人物画像を生成する
・人物画像生成の手法と問題点
Stable-Diffusion 画像を元にして生成する
・元画像から画像を生成する

↑

2022/12/17 10:00～12:00 in 桶川邸 †

　　アップデートファイル
　 update_20221208.zip (52.8MB) <Windows 追加ファイル>
　 update_20221208.tar.gz (52.3MB) <Linux 追加ファイル>

Stable-diffusion GUI インターフェース版を動かす
　・Stable-diffusion 設定パラメータについて
　・同じ画像を生成する方法
　・主なパラメータの意味
　・自動実行版
画像生成AI「Stable-Diffusion」画像生成を試す
画像生成AI「Stable-Diffusion」パラメータを検証する

(参考) 「openvino」py37で作成したプログラムを新しい py38 の環境で動かす
　・必要となる処置
　・windows 環境下の場合 Path 設定の追加が必要

↑

2022/11/24 15:00～15:30 AI研究会成果報告 on zoom †

受付システム・プログラムのデモ
・自動ドア開閉
・受付時の発話
・メール送信
[画像生成AI「Stable-Diffusion」のデモ
ZOOMによる発表は設定したストーリーに対して思っていたほどスムーズには進行できずに反省
音声/カメラを使用するアプリケーションは難しい。今後方法を検討する余地あり。

↑

2022/11/19 10:00～12:00 in 桶川邸 †

　　アップデートファイル
　　 update_20221109.zip (733MB) <Windows 追加ファイル>
　　 update_20221109.tar.gz (733MB) <Linux 追加ファイル>

OpenVINO™ ツールキットインストール環境でこれまでに作成した各種プログラムを OpenVINO ランタイム・パッケージ環境で実行できるようにして検証する
作成ページ → OpenVINO™ ツールキットを利用する
画像生成AI「Stable Diffusion（ステーブル・ディフュージョン）」を試してみる
作成ページ → Stable-Diffusion
次回テーマ「Stable Diffusion」を掘り下げる
・GPU動作方法
・GUIインターフェースの付加など...

↑

2022/10/22 10:00～12:30 in 桶川邸 †

アップデートファイル
update_20221015.zip (2.48MB) <Windows 追加ファイル>
update_20221015.tar.gz (2.47MB) <Linux 追加ファイル>

前回 Step 6 までの成果を「AI受付システム」へ改良してみる
「未登録の顔」を認識すると自動的に顔画像をキャプチャーして名前入力ダイアログを表示させる
判別の閾値を低め(0.5)に設定して精度を上げる
起動時の動作モード指定で登録専用モードに移行できるようにする

作成ページ → 受付システム・プログラム

↑

2022/09/23 10:00～12:00 in 桶川邸 †

アップデートファイル
update_20220916.zip (95.4MB) <Windows 追加ファイル>
update_20220916.tar.gz (341KB) <Linux 追加ファイル>

顔認証プログラムの開発 Step 5 　作成ページ → 認証結果を音声とメールで知らせる
日本語発声について
　作成ページ → Open JTalk で日本語発声
メール送信について
　作成ページ → Python でメール送信
今後の展開について
　ショートメール送信など...

↑

2022/08/27 10:00～12:00 in 桶川邸 †

顔認証の応用
前回の最終プログラム「face_rec3.py」に模型の『自動ドア』制御を組み込んでみる
作成ページ → 顔認証の結果で『自動ドア』を制御する
作成した『自動ドア』模型の概要
作成ページ → PC からコントロールできる『自動ドア』を作る
PC インターフェース作成方法とその環境
Raspberry Pico マイコンと新しくなった Raspberry OS 再検証
作成ページ → Raspberry Pi Pico を動かす
　　　　　　 RaspberryOS「Bullseye」
　　　　　　 Raspberry Pi 再検証
今後の展開について
受付システムへの応用を検討する

↑

2022/07/23 10:00～12:00 in 桶川邸 †

前回の復習
・顔データを追加した実行結果 → Face Recognition
顔認証プログラム Step 1
・作成ページ →「カメラによるリアルタイム顔判定」
顔認証プログラム Step 2
・作成ページ →「カメラで認識した顔画像を登録」
顔認証プログラム Step 3
・作成ページ →「顔認証パッケージ「Face recognition」のテスト」
・作成ページ →「顔登録の方法と認識手法を改良する」
今後の展開について
・顔認証の実用的な使い方を考える。
・開閉ゲート出力のモデルの検討。

↑

2022/06/25 10:00～13:30 in 桶川邸 †

顔識別/顔認識についての復習
顔認証 (Face recognition) 概要
顔識別/顔認識をやってみる
・新規作成ページ → 顔認証/顔認識について
今後の展開について

参考ページ

↑

2022/05/14 10:00～13:30 in 桶川邸 †

「EasyOCR」の環境構築
「EasyOCR」動作確認
・アップデートファイル(~/workspace_py37/easyocr ディレクトリに追加)
update_20220511.zip (458KB) <Windows EasyOCR 追加プロジェクト>
update_20220511.tar.gz (449KB) <Linux EasyOCR 追加プロジェクト>
「EasyOCR」についても概要
・新規作成ページ　→ 文字認識エンジン「EasyOCR」

↑

2022/04/23 10:00～13:30 in 桶川邸 †

「TryOCR」プログラム全体を見直した「FormOCR」について
・入力の前処理プログラム「prepros.py」
　PDFファイル柄画像抽出・縦横変換・水平傾き補正を行う。
・自動実行プログラム「formocr.py」の傾き補正は選択可能とする。
　デフォールトでは実行しない。
　→ 帳票OCRプログラム FormOCR
環境設定の新規ページ
　Windows/Linux 向けのパッケージをアップロード
　→ FormOCR 環境構築
操作マニュアルのページについて
　→ FormOCR 操作マニュアル
次回のテーマ
・EasyOCR についての調査
・顔認識・認証システム実現の方向調査

↑

2022/03/19 10:00～14:00 in 桶川邸 †

OCRプログラム改良版
・アップデートファイル
update_win_20220312.zip (54.1MB) Win版追加更新ファイル
update_data_20220312.zip 218MB) テスト伝票データ
　→ ダウンロード URL
※ ダウンロード・解凍してコピー (コピー前に ~/workspace_py37/tryocr ディレクトリを削除すること)

・フォームの位置ずれ（傾き&縦横のずれ）に対応。
実際の帳票データでの結果報告。
結果の検討と AI-OCR 実現への課題
今回追加したページ
　→ OCR アプリケーション実用編 2

↑

2022/02/19 10:00～13:30 in 桶川邸 †

伝票処理のためのOCRプログラム実証版
・アップデートファイル

　　update_win_20220214.zip (45.8M) Win版追加更新ファイル
　　update_20220214.tar.gz (263MB) Linux版更新ファイル

・これまで「～Step6」のプログラムをまとめて新しく自動化プログラム「tryocr_go.py」を作成。
実際の帳票データでフォームを入力して自動化処理した結果報告。
現状の結果と問題点。次のステップへの課題。
・帳票の位置のずれ対策 (ヒント：最初の「請求書」項目の領域をある程度広くとっておき OCR出力の認識文字位置を記録しておき別のフォームでの検出結果と比較、オフセット値として補正する)
・傾きのある帳票の処理の自動化 (ヒント：現在のアルゴリズムを再検証して組み込む）
・処理速度の向上 (ヒント：今のところ思いつかず。)
今回追加したページ
　→ OCR アプリケーション実用編
　→ OCR プログラム基礎編のまとめ

↑

2022/01/22 10:00～14:00 in 桶川邸 †

伝票処理のためのOCRプログラム試作版
・アップデートファイル

　　update_win_20220119.zip (1.20M) Win版追加更新ファイル
　　update_20220119.tar.gz (351MB) Linux版更新ファイル

・帳票画像から項目の位置情報を入力して配置情報ファイルを作成するソフト「Step 4」
・配置情報ファイルを使用して帳票の項目を自動的に文字化するソフト「Step 5」
　→ OCRアプリケーションを作る 2 「Step4～5」

・帳票の項目を自動的に文字化して CSV ファイル出力するソフト「Step 6」
　→ OCRアプリケーションを作る 3 「Step6」
Windows環境でこれまで作成したソフトを動かす
　→ Windows環境で動かす
(参考)今回新しく追加した主なページ
・開発の基礎 Python GUI演習
　→ マウス・イベント編
　→ ダイアログ・コントロール編
　→ PySympleGUI編
　→ cvui編
　→ Python OpenCV GUI Tips

・事前検証
　→ Python「PyYaml」モジュール
　→ OCRアプリケーションを作る 1 「Step1～3」

↑

2021/12/18 10:00～14:00 in 桶川邸 †

実用的なAI開発に向けて、OCRプログラムを創ってみる。
・アップデートファイル update_20211214.tar.gz (73.2MB)

文字認識エンジン「Tesseract」
・文字認識エンジンをテストする
文字認識エンジンのための画像処理
・OCR処理の前処理としての画像処理プログラム
OCRプログラム試作版
・静止画/動画/カメラ対応の OCRプログラム試作版
次のステップへの課題ほか

↑

2021/11/13 10:00～14:00 in 桶川邸 †

アップデートファイル「update_20211110.tar.gz」

「第7章線画をイラストに変換する」
学習結果と問題点など。
書籍「PyTorch ではじめる AI開発」全体のまとめと課題

↑

2021/10/23 10:00～14:00 in 桶川邸 †

画像認識 (Image Recognition) とは
　画像認識技術の分類、アルゴリズム（モデル）などについて
・「第5章動画の背景を入れ替える」
物体検出アルゴリズム「YOLO V5」
・「第4章物体検出と学習済みモデル」
顔認証 (Face recognition) 概要
・「第6章アジア人向けに強化された顔認証」
敵対的生成ネットワーク(GAN)
・「第7章線画をイラストに変換する」
日本語OCRプログラム
・「第8章 OCR における文字認識」
・「第9章 CHAPTER 09 OCR を完成させる」
GPU (NVIDIA GeForce GTX 1050 Ti) を使う
OpenVINO™ を利用する（ONNXモデルコンバート検証）

↑

2021/09/18 10:00～14:00 in 桶川邸 †

書籍「PyTorch ではじめる AI開発」を履修するための環境構築。
・ Python 統合開発環境としての「Anaconda」について
「第2章定点カメラの映像を認識する」
・一般的な物体認識用の学習済みモデル(Resnet50) を定点カメラからの映像で転移学習(ファインチューニング)する。(時間がかかるので結果のみ)
・学習結果を使って動作する認識プログラムの作成。
できた学習済みモデルを、ONNXフォーマット経由でフォーマットに変換しOpenVINO™ で実行してみる。
「第3章教師データにない状況を異常検出」
・ PyTorch による距離学習で異常データを検出する。(時間がかかるので結果のみ)
・学習結果を使って動作する異常検出プログラムの作成。
YoloV5 について

↑

2021/08/28 10:00～14:00 in 桶川邸 †

OpenVINO™ Toolkit の使い方
OpenVINO™「2021.4LTS」を検証する
OpenVINO™ 最新版の VirtualBoxイメージで手元のPCをアップデート。
OpenVINO™ 付属のデモを修正する
OpenVINO™ 更新に伴い発生した表示不具合を修正。
Image Processing C++ Demo
OpenVINO™ 更新に伴い追加されたデモ。低解像度のイメージから高解像度のイメージを再構築。
PyTorch ではじめる AI開発
AI学習にあたっての環境構築。日本語OCRの著者である坂本俊之氏の本をもとに進行。
(1) Linux OS での環境構築
(2) Anaconda と OpenVINO™ toolkit
(3) OpenVINO™ toolkit 環境に Anaconda をインストール
※ AI学習を進めるにあたって Anaconda を OpenVINO Toolkit インストール環境から利用できるを実習。時間がなければ VirtualBoxイメージから構築する。

↑

2021/07/20 16:00～16:40 AI研究会成果報告 on ZOOM †

「I研究会レポート Vol1」に基づいてディープラーニング概要説明。
これまでの調査過程と成果報告。
OpenVINO™ ツールキット付属のサンプルソフトのデモ。
作成したアプリケーションの一部紹介。
ZOOMによる発表は初めての経験で当初思っていたほどスムーズには進行できずに反省。
Linux での画面共有でのデモはやはり速度の面でやや遅い。内容や進行を検討する必要あり。

↑

2021/07/17 10:00 in 桶川邸 †

DELL Vostro 3500 SSD換装
NCS2 並列動作の検証結果報告
OpenVINO™ ツールキット最新版「2021.4 LTS」について
「Yasunori Shimura(yas-sim) GitHub」のデモソフトを動かす。
2021/07/19 16:00 Zoom デモ事前テスト
2021/07/20 16:40 AI研究会成果報告

↑

2021/06/26 10:00 in 桶川邸 †

DELL Vostro 3500 VirtualBoxをチューニング後のベンチマークテスト。
NCS2 複数起動の動作確認とベンチマークテストの実施。
- 次回までに再検証
CPUの違いによる動作テストのまとめ。
「マスク着用の有無を調べるアプリケーション」について。
2021/07/20 16:40～17:00 経過報告予定 in Zoom

↑

2021/05/15 10:00 in 桶川邸 †

VirtualBox については後日新しーノートパソコンが来てから。
バーチャル試着アプリケーションについて。
NCU2 の並列動作は2個差しただけでは機能しない。ソフトウェア設定かプログラム対応が必要のよう。次回魔の課題とする。
第11世代 CPU を搭載し GPU内蔵した開発マシンについての途中経過報告。GPUの起動に時間がかかる点は次回までの課題とする
次回までに社内オンライン講座(30分程度)の実施依頼あり。

↑

2021/04/17 in 桶川邸 & Zoom †

インテル第10世代CPUのミニPC NUC での OpenVINO™付属デモの検証結果リベンジ。
RaspberryPi 新システム OpenVINO 2021.3 SDカード
AI 開発システムについて
日本語OCR について

↑

2021/03/27 in 桶川邸 †

Raspberry Pi 人物追跡・顔追跡アプリ
インテルのミニPC NUC での OpenVINO™付属デモの検証結果報告。
思ったより速度が出ず、成果が伝わりにくい。
次回までにバージョンアップした NCU での再実行を試みる。

↑

2021/02/27 in 井筒邸 & Zoom †

1000オブジェクト検出モデルの検証結果報告。OpenCV 日本語描画処理。
NCAppZooアプリケーションの検証報告。
OpenVINO™アプリケーションの動作報告。
次回、OpenVINO™ツールキット付属でもアプリなどの検証報告予定。

↑

2021/01/23 in 桶川邸 †

Neural Compute Stick と OpenVINO™の検証報告。
ディープラーニングについての考察。
OpenCV 応用サンプルの報告。
次回 1000オブジェクト検出モデルの検証結果報告。OpenCV 日本語描画処理についてなど。

↑

2020/12/13 in 桶川邸 †

２軸カメラ台付きキャタピラーロボット検証。
機械学習について → AI・機械学習調査メモ
サイトでの考察 → ディープラーニング概要
次回「Neural Compute Stick と OpenVINO™」検証と経過報告

↑

2020/11/21 in 桶川邸 †

2軸カメラ台。対象物追跡。
ディープラーニング　caffeについて。
２軸カメラ台検討。
次回、２軸カメラ台キャタピラーロボットに装着。物体検出ほか。
次回、物体検出から。
要調査サイト →
- Raspberry Piで Caffe Deep Learning Frameworkで物体認識を行なってみるテスト
- Google検索「caffe ディープラーニングラズパイ」

↑