私的AI研究会 > FormOCR1

Form OCR Program 環境構築

 帳票OCRプログラム「formocr.py」の実行環境を整える。

※ 最終更新:2023/12/20 

Windows OS での環境構築

 環境構築は更新されました 新しページを参照して下さいAI開発プロジェクト環境構築(Windows編)

 以下は Anaconda on Windows の要約改訂版である。オリジナルサイトからのダウンロードを省略し手順を簡素化している。

プログラム・ソースの配置

Anaconda のインストール

  1. インストーラ「Anaconda3-2021.11-Windows-x86_64.exe」を起動し手順に従って進めて Anaconda をインストールする。

  2. 『Microsoft VisualC++ Redistributable』を「VC_redist.x64.exe」を起動してインストールする。

Anaconda の起動と Python 環境の構築

  1. Windows のスタートメニューから「Anaconda Powershell Prompt (anaconda3)」を選択する。

    ・「Anaconda Prompt (anaconda3)」も使用できるが初回の環境構築は「Anaconda Powershell Prompt (anaconda3)」を使用すること。
    ・以降の作業は「Anaconda Powershell Prompt (anaconda3)」内で行う。

    ・表示ウインドウなサイズや文字の大きさなどは、ウインドウ上部のタイトルバーを右クリック「プロパティ」で設定する。


    ・主要なコマンド
    コマンドパラメータ用途
    cd (chdir)現在のカレンディレクトリを表示
    パスカレンディレクトリの変更
    ls(dir)カレンディレクトリのファイルやフォルダ一覧
    パス指定したパスのファイル表示
    treeカレンディレクトリのツリー表示
    パス指定したパスのツリー表示
    ren対象ファイル名 新しいファイル名ファイル名を変更
    move移動するファイル名 移動先パスファイルを移動
    変更前ディレクトリ 変更後ディレクトリディレクトリ名を変更
    copyコピー元 コピー先ファイルをコピー
    delファイルファイルやフォルダを削除
    helpコマンド名コマンドのヘルプ表示
    clsコンソールのクリア
    md (mkdir)(パス)ディレクトリ名ディレクトリの作成
    rm (rmdir)(パス)ディレクトリ名ディレクトリの削除
    type(パス)ファイル名テキストファイルの中身表示
    more(パス)ファイル名テキストファイルの1画面表示
    ipconfigネットワークの設定確認
    exitコマンドプロンプトを終了

  2. 仮想環境設定ファイルから conda 仮想環境を構築する
    (base) PS $ cd /anaconda_win/workspace_py37         ← 「environment_py37w.yaml」ファイルのある場所へ
    (base) PS $ conda env create -f environment_py37w.yaml
    Collecting package metadata (repodata.json): done
        :
    (base) PS $ conda info -e
    # conda environments:
    #
    base                  *  C:\Users\XXXXX\anaconda3
    py37w                    C:\Users\XXXXX\anaconda3\envs\py37w
    
    (base) PS > conda activate py37w
    (py37w) PS >

環境の確認

OCRパッケージ「tesseract」の導入

環境変数の設定

ターミナル起動時の環境設定

  1. 「スタートボタン」を押し「Anaconda Powershell Prompt (anaconda3)」の上で 右クリック → その他 → ファイルの場所を開く を選択する。
  2. 表示されるエクスプローラ上の「Anaconda Powershell Prompt (anaconda3)」で 右クリック → プロパティ を選ぶ。
  3. リンク先の項目を変更する。
    ・元の記述
    %windir%\System32\WindowsPowerShell\v1.0\powershell.exe -ExecutionPolicy ByPass -NoExit -Command "& 'C:\ProgramData\Anaconda3\shell\condabin\conda-hook.ps1' ; conda activate 'C:\Users\<User>\anaconda3' "
    ・次のように変更 <User> = ユーザー名 X: = anaconda_winを配置したドライブ
    %windir%\System32\WindowsPowerShell\v1.0\powershell.exe -ExecutionPolicy ByPass -NoExit -Command "& 'C:\ProgramData\Anaconda3\shell\condabin\conda-hook.ps1' ; conda activate 'C:\Users\<User>\anaconda3\envs\py37w' ; Set-Location 'X:\anaconda_win\workspace_py37' "
  4. 「Anaconda Prompt (anaconda3)」で 右クリック → プロパティ を選ぶ。
    ・元の記述
    %windir%\System32\cmd.exe "/K" C:\Users\<User>\anaconda3\Scripts\activate.bat C:\\Users\<User>\anaconda3
    ・次のように変更 <User> = ユーザー名 X: = anaconda_winを配置したドライブ
    %windir%\System32\cmd.exe "/K" C:\Users\<User>\anaconda3\Scripts\activate.bat C:\Users\<User>\anaconda3\envs\py37w & cd /d X:\anaconda_win\workspace_py37

Windowsのターミナルで ANSI エスケープシーケンスを有効にする設定

Linux OS での環境構築

 以下は PyTorch ではじめる AI開発/Linux OS での環境構築 の要約改訂版である。

プログラム・ソースの配置

Ubuntu20.04LTS のインストール

  1. Ubuntu20.04LTS Desktop 版イメージをUSBメモリーにコピーしてインストール。
  2. USB起動してインストール画面が出てくるまで待つ。(USB 起動できない場合は BIOS 画面を呼び出し設定変更)
  3. ソフトウェアのアップデート
    $ sudo apt-get update
    $ sudo apt-get upgrade
  4. 日本語関連設定
  5. 各種ツール類をインストールする。
    • フォント設定
      $ sudo apt install gnome-tweaks
    • SSHサーバー
      $ sudo apt install openssh-server
    • ネットワークツール
      $ sudo apt install net-tools
    • 「vi」エディタの設定
      $ vi ~/.vimrc
      set nocompatible
      set backspace=indent,eol,start
      set expandtab
      set tabstop=4
      set shiftwidth=4
      set autoindent
      sudo 付きで vi を実行した場合は、root の設定が使用されるので、rootの .vimrcを ~/vimrc のシンボリックリンクにする。
      $ sudo ln -s ~/.vimrc /root/.vimrc
      $ sudo ls -la /root
      合計 24
      drwx------  4 root root 4096  3月 31 19:07 .
      drwxr-xr-x 20 root root 4096  3月 31 17:29 ..
      -rw-r--r--  1 root root 3106 12月  5  2019 .bashrc
      drwx------  2 root root 4096  2月 10 03:51 .cache
      -rw-r--r--  1 root root  161 12月  5  2019 .profile
      lrwxrwxrwx  1 root root   19  3月 31 19:07 .vimrc -> /home/mizutu/.vimrc
      drwxr-xr-x  3 root root 4096  3月 31 17:33 snap
    • 各種形式の動画や音声を再生できるようにする
      $ sudo apt-get install ubuntu-restricted-extras

Python 環境の構築

  1. 最初に「pip3」の売ジョンを確認する。
    $ pip3 -V
    なければインストールする。
    $ sudo apt install python3-pip
  2. Ubuntu に Anaconda をインストールする。

    オフィシャルページ Anaconda Individual Edition を開く。
    ●「Get Additional Installers」を押す。

    ●「64Bit(x86) Installer」を押す。
  3. ダウンロードファイルを実行する。
    $ cd ダウンロード
    $ ls
    Anaconda3-2021.11-Linux-x86_64.sh
    $ bash Anaconda3-2021.11-Linux-x86_64.sh 
    	:
    手順に従いインストールを進める。(ライセンスの項目のみ「yes」その他はデフォールト)

Anaconda の設定

  1. Anaconda の設定ファイルを読み込む。
    $ cd ~/
    $ ls
    __share                         ダウンロード  ドキュメント  ミュージック
    anaconda3                       テンプレート  ビデオ        公開
    vbox_anaconda_install_log1.txt  デスクトップ  ピクチャ
    $ source ~/anaconda3/etc/profile.d/conda.sh
    $ printenv CONDA_EXE
    /home/mizutu/anaconda3/bin/conda

  2. 環境設定ファイルから conda 仮想環境を構築する
    $ cd ~/workspace_py37
    $ conda env create -f environment_py37x.yml
    Collecting package metadata (repodata.json): done
    Solving environment: done
    Preparing transaction: done
    Verifying transaction: done
        :
    done
    #
    # To activate this environment, use
    #
    #     $ conda activate py37x
    #
    # To deactivate an active environment, use
    #
    #     $ conda deactivate
    $ conda info -e
    # conda environments:
    #
    base                  *  /home/mizutu/anaconda3
    py37x                    /home/mizutu/anaconda3/envs/py37x

  3. 仮想環境を起動する。
    $ conda activate py37x
    (py37x) $
     ※ 現在の仮想環境から出る場合
    (py37x) $ conda deactivate
    $

  4. Anaconda 仮想環境起動スクリプトを作成する。
    起動時に環境を切り替える場合は別途スクリプトを作成するのでこの項は無視する。
    最後の行に自作 python ライブラリへのパスを加えておく。
    $ cd ~/
    $ vi anaconda3_setup.sh 
    
    #!/bin/sh
    
    echo [anaconda3_setup.sh] Anaconda3 environment initialized
    source ~/anaconda3/etc/profile.d/conda.sh
    
    echo "conda activate py37"
    echo " Exit >> 'conda deactivate'"
    conda activate py37x
    
    export PYTHONPATH=$PYTHONPATH:$HOME/workspace/lib
  5. 自動起動にする場合は「~/.bashrc」ファイルの最後に「source anaconda3_setup.sh」と追記しておく。
    $ cd ~/
    $ vi .bashrc
    
        :
        :
    source anaconda3_setup.sh

  6. 「tesseract」学習済みデータの精度を上げる。
    $ cp ~/workspace_py37/formocr/tessdata_best/* ~/anaconda3/envs/py37x/share/tessdata

Conda 環境のアップデート

環境の確認

  1. 端末(ターミナル)を再起動する
  2. 「Pytorch」のインストール確認
    (py37) $ python -c "import torch"
  3. 「tkinter」パッケージのインストール確認
    (py37) $ python -c 'import tkinter'

Anaconda 環境設定の確認方法

  1. パスが通っていることの確認
    (py37) $ which python
    (py37) $ which ipython
    (py37) $ which pip
    (py37) $ which conda
  2. python のバージョンの確認
    (py37) $ python --version
  3. conda の動作確認
    ※ エラーメッセージが出なければ OK.
    (py37) $ conda info
  4. python3, pip3 は,システムのものよりも,Anaconda のものが優先して使用されることの確認
    (py37) $ which python3
    (py37) $ which pip3
  5. Anaconda の Python の numpy を確認
    ※ バージョン番号が表示されれば OK.
    (py37) $ python -c "import numpy; print( numpy.__version__ )"
 

更新履歴

参考資料

 

Last-modified: 2023-12-19 (火) 03:54:14