ai1_icon32.png AI推進準備室 トップページ

 --「システム開発に利用できる AI 技術」を探求中 --
ai2_icon32.png 私的AI研究会 の成果をまとめたサイトです。
※ 最終更新:2025/03/01 
< ▼ 項目が開きます ▲ 項目を閉じます >
▼ 目 次

ローカルマシンでAI開発

現在検証中テーマ

敵対的生成ネットワーク GAN

  1. 静止画から動画を作る:First Order Motion Model
  2. 動画のパーツを入れ替える:Motion Supervised co-part Segmentation
  3. 人間の年齢による顔の変化(その2):Disentangled Lifespan Face Synthesis
  4. StyleGANを使った画像編集(その2):StyleGAN e4e
  5. 画像スタイル変換(その2):CycleGAN
  6. 顔の合成(その2):StarGAN-v2
  7. GANによる似顔絵生成:QMUPD(その2)
  8. 画像に別の画像のスタイルを転送:PAMA(その2)
  9. 顔画像に様々なスタイルをブレンドする:BlendGAN(その2)
  10. StyleGAN3による画像の編集:StyleGAN3(その2)
  11. 音声で顔画像を動かす:One Shot Talking Face(その2)
    音声認識 / 音声合成
  12. ディープフェイク 「FaceFusion」

物体認識

  1. 定点カメラの映像を認識する「+ OpenVINO™ API 2.0 対応」
  2. 教師データにない状況を異常検出
  3. 物体検出アルゴリズム「YOLO V5」1(推論/モデル変換編)
  4. 物体検出アルゴリズム「YOLO V5」2(学習編)
  5. 『ナンバープレート判別』「YOLO V5」3

環境構築 -最新版-

理論学習

実用的なAI開発へ

画像生成 2 GAN(敵対的生成ネットワーク)

  1. 顔の合成:StarGAN-v2
  2. 画像スタイル変換:CycleGAN
  3. 人間の年齢による顔の変化:DLFS
  4. StyleGANを使った画像編集:StyleGAN e4e
  5. StyleGAN3による画像とビデオの編集:StyleGAN3
  6. 静止画から作るフェイク動画:First Order Motion Model
  7. GANによる似顔絵生成:QMUPD
  8. 画像に別の画像のスタイルを転送:PAMA
  9. 音声で顔画像を動かす:One Shot Talking Face
  10. 顔画像に様々なスタイルをブレンドする:BlendGAN
  11. 個別の学習プロセス無しでFaceSwapを実現する:SberSwap

物体認識

  1. 物体認識の深層学習タスク:YOLO V7
  2. カスタムデータによる学習1「マスク着用の判定」
  3. カスタムデータによる学習2「じゃんけんの判定1」
  4. 学習パラメータ考察
  5. カスタムデータによる学習3「じゃんけんの判定2」
  6. カスタムデータによる学習4「じゃんけんの判定3」
  7. 元になる学習モデルの違いによる考察
  8. 「じゃんけん」カスタムデータによる学習モデルまとめ

ディープ・ラーニングの新技術

画像生成

顔認証 (Face recognition)~

▲ 顔認証アプリケーション実用編
▲ 顔認証アプリケーション基礎編

PyTorch ではじめる AI開発

AI・エッジコンピューティング

▲「OpenVINO™ Toolkit」について

 INTEL® が提供する高性能なコンピューター・ビジョンやディープラーニングを開発が可能になるソフトウェア
 TensorFlow、MxNet、Caffe、Kaldi、、ONNX などの AI フレームワークでトレーニングされた学習済みモデルを使って推論処理を実行するソフトウェアを容易に作成できます。

 出典 → INTEL® OpenVINO™ Toolkit 製品概要

▲ アプリケーション例 1


 ↑ OpenVINO™ Toolkit 付属のデモプログラム 詳しくは こちら

3D 人間のポーズ推定デモ
3D Human Pose Estimation Python* Demo

アクション認識デモ
Action Recognition Python* Demo
入力ビデオで実行されているアクションを分類するアクション認識アルゴリズムのデモアプリケーション

オブジェクト検出 Python デモ
Object Detection Python\* Demo
SSD、Yoloなどいくつかのオブジェクト検出モデルタイプのデモアプリケーション

人間のポーズ推定 Python デモ
Human Pose Estimation Python* Demo

ジェスチャ認識 Python デモ
Gesture Recognition Python* Demo
入力ビデオで実行されているジェスチャアクションを分類するジェスチャー認識アルゴリズム

手書きテキスト認識 Python デモ
Handwritten Text Recognition Python* Demo
手書きの日本語認識モデルと手書きの簡体字中国語認識モデルを実行するデモ

単一の人間のポーズ推定 Python デモ
Single Human Pose Estimation Demo (top-down pipeline)
ビデオまたは画像での人間のポーズ推定。検出されたすべての人のポーズを予測します。

テキスト検出 C++ デモ
Text Detection C++ Demo
入力イメージ上の多重指向のシーン テキストを検出して認識し、検出された領域の周囲に境界ボックスを配置します

クロスロードカメラ C++ デモ
Crossroad Camera C++ Demo
人の属性認識と人の再識別、人の検出は画像/ビデオとカメラの入力をサポート

人間のポーズ推定 C++ デモ
Human Pose Estimation C++ Demo

オブジェクト検出 C++ デモ~
Object Detection C++ Demo
異なるモデルアーキテクチャをサポートしたオブジェクト検出ネットワークのデモ

スマート教室 デモ
Smart Classroom C++ Demo
教室環境向けの顔認識とアクション検出のデモ

歩行者トラッカー C++ デモ
Pedestrian Tracker C++ Demo
歩行者追跡シナリオのためのデモアプリケーション

スーパー解像度 C++ デモ
Super Resolution C++ Demo
デモは入力として画像のみをサポート。入力イメージの解像度を向上させます。

インタラクティブな顔検出 C++ デモ
Interactive Face Detection C++ Demo
年齢/性別認識、頭部ポーズ推定、感情認識、顔面ランドマーク検出、などの並列推論要求を同時に実行します。

視線推定 C++ デモ
Gaze Estimation Demo

セキュリティバリアカメラ C++ デモ
Security Barrier Camera C++ Demo
車両属性認識およびライセンス プレート認識ネットワークのデモ。

推論エンジンを使って画像を修正
Image Inpainting Python Demo
画像の穴を埋めるために適切なピクセル情報を推定します。

白黒画像のカラー化
Colorization Python Demo
ニューラル ネットワークを使用してモノクロビデオの色付けをします。

ボケ画像の修正
Image Deblurring Python* Demo
ニューラル ネットワークを使用してボケ画像の修正をします。

イメージ処理 C++ デモ
Image Processing C++ Demo
入力イメージの解像度の向上やボケ画像の修正をします。


 ↑ OpenVINO™ Toolkit を利用した Python プログラム 詳しくは こちら

▲ アプリケーション例 2

マスク着用の有無を調べるアプリケーション
学習済みモデルを使ってマスク着用の有無を調べます。

バーチャル試着アプリケーション
顔認識の推論モデルを使って「メガネ」「帽子」の試着をします。

感情分析アプリケーション
画像から顔を部分を特定しディープラーニングで人の感情を推論します。

年齢/性別分析アプリケーション
画像から顔を部分を特定しディープラーニングで年齢/性別を推論します。

物体検出アプリケーション
画像からディープラーニングで 80種類のオブジェクトを検出します。

人物追跡アプリケーション
機械学習で画像から人物を検出し、人物の一致を調べて、追跡します。

顔追跡アプリケーション
機械学習で画像から顔を検出し、顔の一致を調べて、追跡します。

リアルタイム感情分析アプリケーション
画像から人の顔を特定し感情分析して結果をリアルタイムで表示します。

リアルタイム画像分類アプリケーション
カメラなどの画像から何が写っているかを推論します。

 

トピックス

最新情報icon_new.gif

■ 現在検証中テーマ

■ 敵対的生成ネットワーク GAN

■ 物体認識

■ 環境構築 -最新版-

■ 理論学習

■ 画像生成 2 GAN(敵対的生成ネットワーク)

■ 物体認識

■ ディープ・ラーニングの新技術

■ 画像生成

■ 顔認証アプリケーション実用編

■ 顔認証アプリケーション基礎編

▼ ~ 履歴 ~

「私的AI研究会 レポート」

参考資料

読み物

▼ (コラム) 人工知能の過去、現在、未来

Intel® オフィシャルサイト

更新履歴


Last-modified: 2025-03-01 (土) 04:50:26