私的AI研究会 > Tesseract6

OCR アプリケーション実用編

 基本編での検証をもとに実用的な AI開発に向けて、文字認識エンジン「Tesseract」(テッセラクト)を使用した「OCR アプリケーション」を開発する。

※ 最終更新:2022/02/16 

OCR プログラム基礎編のまとめ

実用編へ向けて解決すべきテーマ

問題点考えられる解決方法実現レベル現状
不要なページがある(納品書など)タイトル項目から「請求書」以外を除外する事前に排除
画像に傾きがある傾き補正をする(画像の大きさと座標調整に難あり)前処理対応、未実装
西暦以外の日付の場合対応すると将来的な変更対応が必要になる「令和」のみ実装
同じ帳票が複数ある場合請求書番号などがあればチェックできる。ない場合は人的対応?未対応
PDFフォーマットの処理含まれる帳票をページごとにフォルダに画像ファイルとして作成していく対応済 事前に別処理で
CSV 出力の2重登録「ファイル名」で除外対応済 同じ帳票で別ファイル名の場合は対応不可
案件が複数項目ある場合がある一つの案件名で代用
タイトル(請求書)が装飾されている読めない場合は別の「請求」関連箇所で代用
文字の認識精度の向上学習モデルの変更
項目ごとに文字種別を制限する
別途対策

OCR 認識文字列検証プログラム「mylib_text.py」

ファイル関連操作プログラム「mylib_file.py」

 アプリケーションで必要となるファイル操作を検証する。

 

更新履歴]

 

参考資料

 

Last-modified: 2022-02-16 (水) 09:56:00