私的AI研究会 > PyTorch9

PyTorch ではじめる AI開発 9

 公開されている AIモデルを改良して性能を向上させる開発手法を学ぶ。
 一般的な条件下での性能をある程度妥協して、特定の条件下において性能を向上させる。

※ 最終更新:2021/10/18 

CHAPTER 09 OCR を完成させる

 「PyTorch ではじめる AI開発」の著者が公開している OCR プログラムでは、文に縦書きと横書きがあるという日本語の特性によって認識精度が低下するという問題を含んでいる。
 OCR プログラムを横書き専用とすることで、横書きの文字列に対する OCR の認識精度を向上させる。

SECTION-025 横書き専用 OCR の作成

 「Chapter 08」では「文字種類の認識」を行うモデルのファインチューニングを行った。  ここでは「文の検出」と「文字領域の検出」を行うニューラルネットワークを位置から学習させることで新たに作成する。

横書き文字列の確認

DetectionNet の動作を確認する。

「DetectionNet」の動作を可視化して確認する。

SECTION-026 DetectionNet の実装

U-Net について

U-Net を実装する

SECTION-027 モデルを学習させる

学習のためのコードを実装

「文の検出/文字領域の検出」(DetectionNet) の学習

SECTION-028 モデルの動作を確認する

Jupyter Notebook で確認

● 学習結果のモデルは「chapt09-model.pth」として保存されている。
●「Jupyter Notebook」を起動しブラウザからアクセスして「chapt09.ipynb」を開く。

(py37) $ cd ~/workspace_py37/chapter09
(py37) $ jupyter notebook

● [2]モデルファイルを読み込んでいるセルのファイル名を変更する。
● ノートブック全体を再実行する。

横書き専用 OCR の実行

 

更新履歴

参考資料

 

Last-modified: 2021-10-23 (土) 15:22:08