私的AI研究会 > PyTorch8

PyTorch ではじめる AI開発 8

 実用的な用途を想定した広義の AI 開発において重要になるのは、ニューラルネットワークのモデル構造の詳細ではなく、学習させたモデルをどのように使うのか、といった応用面であることが多い。
 広義の AI を構成するプログラム部分はそのままに、ニューラルネットワークのモデルのみを入れ替えることで AI 機能を拡張する手法をやってみる。

※ 最終更新:2021/10/15 

CHAPTER 08 OCR における文字認識

 「PyTorch ではじめる AI開発」の著者が公開している OCR プログラムのニューラルネットワークのモデルのみを差し替えることで新しい OCR を作成する。
 → 以前の検証 日本語OCR の検証

SECTION-022 OCR プログラム解説

 著者のサイト「日本語OCR解説」に詳しい解説がある。
 ここでは理解のため、本書の内容をまとめる。(説明の図は著者のサイトからの引用)

OCR プログラムを用意する。

OCR プログラム詳細

SECTION-023 文字認識モデルを入れ替える

モデルの構造

SECTION-024 モデルを学習させる

データの用意

学習プログラムの作成

文字認識モデルの学習

ファインチューニング学習後のモデルを使って実行

 

更新履歴

参考資料

 

Last-modified: 2021-10-19 (火) 05:24:41