私的AI研究会 > FormOCR1
帳票OCRプログラム「formocr.py」の実行環境を整える。
環境構築は更新されました 新しページを参照して下さい → AI開発プロジェクト環境構築(Windows編)
以下は Anaconda on Windows の要約改訂版である。オリジナルサイトからのダウンロードを省略し手順を簡素化している。
X:/anaconda_win ├─anaconda ← windows 環境構築のためのファイル │ ├─tesdata_best ← 使用する tesseract 学習済みデータ │ ├─Anaconda3-2021.11-Windows-x86_64.exe │ ├─tesseract-ocr-w64-setup-v5.0.0.20211201.exe │ └─VC_redist.x64.exe ├─workspace │ └─lib ← python 共有ライブラリ (パスが通っていること) └─workspace_py37 ← anaconda 環境下のアプリケーション・プロジェクト └─formocr ← OCR アプリケーション作成プロジェクト ※ ※ anaconda (Windows/Linux) 環境に対応したプロジェクト
コマンド | パラメータ | 用途 |
cd (chdir) | 現在のカレンディレクトリを表示 | |
パス | カレンディレクトリの変更 | |
ls(dir) | カレンディレクトリのファイルやフォルダ一覧 | |
パス | 指定したパスのファイル表示 | |
tree | カレンディレクトリのツリー表示 | |
パス | 指定したパスのツリー表示 | |
ren | 対象ファイル名 新しいファイル名 | ファイル名を変更 |
move | 移動するファイル名 移動先パス | ファイルを移動 |
変更前ディレクトリ 変更後ディレクトリ | ディレクトリ名を変更 | |
copy | コピー元 コピー先 | ファイルをコピー |
del | ファイル | ファイルやフォルダを削除 |
help | コマンド名 | コマンドのヘルプ表示 |
cls | コンソールのクリア | |
md (mkdir) | (パス)ディレクトリ名 | ディレクトリの作成 |
rm (rmdir) | (パス)ディレクトリ名 | ディレクトリの削除 |
type | (パス)ファイル名 | テキストファイルの中身表示 |
more | (パス)ファイル名 | テキストファイルの1画面表示 |
ipconfig | ネットワークの設定確認 | |
exit | コマンドプロンプトを終了 |
(base) PS $ cd /anaconda_win/workspace_py37 ← 「environment_py37w.yaml」ファイルのある場所へ (base) PS $ conda env create -f environment_py37w.yaml Collecting package metadata (repodata.json): done : (base) PS $ conda info -e # conda environments: # base * C:\Users\XXXXX\anaconda3 py37w C:\Users\XXXXX\anaconda3\envs\py37w (base) PS > conda activate py37w (py37w) PS >
(py37w) PS > python -c "import torch"※「python3」ではエラーとなるので「python」コマンドを使用する。
(py37w) PS > python -c "import tkinter"
(py37w) PS > python -c "from openvino.inference_engine import IECore"
(py37w) PS > echo $env:TESSDATA_PREFIX C:\Program Files\Tesseract-OCR\tessdata (py37w) PS > echo $env:PYTHONPATH X:\anaconda_win\workspace\lib・Command Prompt の場合
(py37w) > echo %PYTHONPATH% X:\anaconda_win\workspace\lib (py37w) >echo %TESSDATA_PREFIX% C:\Program Files\Tesseract-OCR\tessdata
%windir%\System32\WindowsPowerShell\v1.0\powershell.exe -ExecutionPolicy ByPass -NoExit -Command "& 'C:\ProgramData\Anaconda3\shell\condabin\conda-hook.ps1' ; conda activate 'C:\Users\<User>\anaconda3' "・次のように変更 <User> = ユーザー名 X: = anaconda_winを配置したドライブ
%windir%\System32\WindowsPowerShell\v1.0\powershell.exe -ExecutionPolicy ByPass -NoExit -Command "& 'C:\ProgramData\Anaconda3\shell\condabin\conda-hook.ps1' ; conda activate 'C:\Users\<User>\anaconda3\envs\py37w' ; Set-Location 'X:\anaconda_win\workspace_py37' "
%windir%\System32\cmd.exe "/K" C:\Users\<User>\anaconda3\Scripts\activate.bat C:\\Users\<User>\anaconda3・次のように変更 <User> = ユーザー名 X: = anaconda_winを配置したドライブ
%windir%\System32\cmd.exe "/K" C:\Users\<User>\anaconda3\Scripts\activate.bat C:\Users\<User>\anaconda3\envs\py37w & cd /d X:\anaconda_win\workspace_py37
以下は PyTorch ではじめる AI開発/Linux OS での環境構築 の要約改訂版である。
~/ ← ホームディレクトリ ├─workspace │ └─lib ← python 共有ライブラリ (パスが通っていること) └─workspace_py37 ← anaconda 環境下のアプリケーション・プロジェクト └─formocr ← OCR アプリケーション作成プロジェクト ※ ※ anaconda (Windows/Linux) 環境に対応したプロジェクト
$ sudo apt-get update $ sudo apt-get upgrade
$ sudo apt-get update ... $ sudo apt-get install -y fonts-noto
$ sudo apt install gnome-tweaks
$ sudo apt install openssh-server
$ sudo apt install net-tools
$ vi ~/.vimrc set nocompatible set backspace=indent,eol,start set expandtab set tabstop=4 set shiftwidth=4 set autoindentsudo 付きで vi を実行した場合は、root の設定が使用されるので、rootの .vimrcを ~/vimrc のシンボリックリンクにする。
$ sudo ln -s ~/.vimrc /root/.vimrc $ sudo ls -la /root 合計 24 drwx------ 4 root root 4096 3月 31 19:07 . drwxr-xr-x 20 root root 4096 3月 31 17:29 .. -rw-r--r-- 1 root root 3106 12月 5 2019 .bashrc drwx------ 2 root root 4096 2月 10 03:51 .cache -rw-r--r-- 1 root root 161 12月 5 2019 .profile lrwxrwxrwx 1 root root 19 3月 31 19:07 .vimrc -> /home/mizutu/.vimrc drwxr-xr-x 3 root root 4096 3月 31 17:33 snap
$ sudo apt-get install ubuntu-restricted-extras
$ pip3 -Vなければインストールする。
$ sudo apt install python3-pip
$ cd ダウンロード $ ls Anaconda3-2021.11-Linux-x86_64.sh $ bash Anaconda3-2021.11-Linux-x86_64.sh :手順に従いインストールを進める。(ライセンスの項目のみ「yes」その他はデフォールト)
$ cd ~/ $ ls __share ダウンロード ドキュメント ミュージック anaconda3 テンプレート ビデオ 公開 vbox_anaconda_install_log1.txt デスクトップ ピクチャ $ source ~/anaconda3/etc/profile.d/conda.sh $ printenv CONDA_EXE /home/mizutu/anaconda3/bin/conda
$ cd ~/workspace_py37 $ conda env create -f environment_py37x.yml Collecting package metadata (repodata.json): done Solving environment: done Preparing transaction: done Verifying transaction: done : done # # To activate this environment, use # # $ conda activate py37x # # To deactivate an active environment, use # # $ conda deactivate $ conda info -e # conda environments: # base * /home/mizutu/anaconda3 py37x /home/mizutu/anaconda3/envs/py37x
$ conda activate py37x (py37x) $※ 現在の仮想環境から出る場合
(py37x) $ conda deactivate $
$ cd ~/ $ vi anaconda3_setup.sh #!/bin/sh echo [anaconda3_setup.sh] Anaconda3 environment initialized source ~/anaconda3/etc/profile.d/conda.sh echo "conda activate py37" echo " Exit >> 'conda deactivate'" conda activate py37x export PYTHONPATH=$PYTHONPATH:$HOME/workspace/lib
$ cd ~/ $ vi .bashrc : : source anaconda3_setup.sh
$ cp ~/workspace_py37/formocr/tessdata_best/* ~/anaconda3/envs/py37x/share/tessdata
current version: 4.10.3 latest version: 4.11.0 Please update conda by running $ conda update -n base -c defaults conda
$ conda update -n base -c defaults conda
(py37) $ python -c "import torch"
(py37) $ python -c 'import tkinter'
(py37) $ which python (py37) $ which ipython (py37) $ which pip (py37) $ which conda
(py37) $ python --version
(py37) $ conda info
(py37) $ which python3 (py37) $ which pip3
(py37) $ python -c "import numpy; print( numpy.__version__ )"