AI推進準備室 > AIGlossary
AI 用語集 †
※ 最終更新:2021/09/01
用語の解説と参考サイト †
ABテスト †
- ABテストとは、A案とB案を用意し、より反応の良い方を採用する方法。
- Webマーケティングにおける手法の一つ。
bandit algorithm【バンディットアルゴリズム】 †
- 複数案から最適なものを一つ選ぶとき、実際に試行して最適化するためのアルゴリズム。
- 「ワンアームド・バンディット」という別称を持つスロットマシンがその語源で、「スロットマシンが複数台あるとき、限られたコインをどの台にどれだけ使えば最大の成果が得られるか」を計算する手法として、1950年代から研究が始まったとされている。
classification【分類】 †
- 分類(classification)とは、機械学習においては、離散的な入力値を、事前に定義された複数のクラスに分類することを指す。
- 離散的な入力値とは、例えば画像からの犬猫判定を考えると、動物の顔の特徴(耳/目/鼻/口など)を何らかの方法で数値化してグラフ上に点としてプロットすると、線状ではなく、ばらばらの点々になってしまうようなデータのこと。この場合は、「犬の点の集まり」や「猫の点の集まり」の中間に境界線を引いて(=学習できる)区分けすることで、犬猫判定の分類が実現できる。
clustering【クラスタリング】 †
- データ間の類似度にもとづいて、データをグループ分けする手法。
- クラスタリングによってできた、似たもの同士が集まったグループのことをクラスタと呼ぶ。
CNN【畳み込みニューラルネットワーク】 †
- 畳み込みニューラルネットワーク(CNN)は畳み込み層とプーリング層が積み重なったニューラルネットワークのこと。
Faster R-CNN †
- 2015年にMicrosoftが発明した物体検出アルゴリズム。Deep LearningによるEnd-to-Endな実装に初めて成功している。
- STEP1: ある矩形の中身が物体なのか背景( = 何も写っていない)なのかを学習する
Resion Proposal Network(RPN)と呼ばれるCNN構造を用い Deep Learningによって実装
- STEP2: STEP1で検出した場所に、具体的に何が写っているのかを学習する。
HDF5 †
- Hierarchical Data Format(階層的データ形式、略称:HDF)は、大量のデータを格納および構造化するために設計された一連のファイル形式(HDF4、HDF5)。
- 米国立スーパーコンピュータ応用研究所で開発され、非営利法人である HDF グループによってサポートされている。
- HDFグループは、HDF5 テクノロジーの継続的な開発と HDF で保存されたデータの継続的なアクセスを確保することを使命としている。
Inception Resnet V2 †
- Inception-ResNet-v2 は、ImageNet データベース [1] の 100 万枚を超えるイメージで学習済みの畳み込みニューラル ネットワーク。
- このネットワークは、深さが 164 層であり、イメージを 1000 個のオブジェクト カテゴリ (キーボード、マウス、鉛筆、多くの動物など) に分類できる。
- 結果として、このネットワークは広範囲のイメージに対する豊富な特徴表現を学習している。
- ネットワークのイメージ入力サイズは 299 x 299。
LabelImg †
- LabelImgは、グラフィカル画像アノテーションツール。
- Pythonで書かれており、GUIとして Qtを使用している。
- アノテーションは、ImageNetで使用される形式であるPASCAL VOC形式で XMLファイルとして保存される。
Monte Carlo method【モンテカルロ法】 †
- 数値計算手法の一つで、乱数を用いた試行を繰り返すことにより近似解を求める手法。
- ある事象をモデル化した数式や関数があるとき、その定義域に含まれる値をランダムにたくさん生成して実際に計算を行い、得られた結果を統計的に処理することで推定値を得ることができる。
- 数式を解析的に解くのが困難あるいは不可能な場合でも数値的に近似解を求めることができる。
pytesseract「Python Tesseract」 †
- Python-tesseractは、Python用の光学式文字認識(OCR)ツール。画像に埋め込まれたテキストを認識する。
- Python-tesseractは、 GoogleのTesseract-OCR Engineのラッパー。 jesseg、png、gif、bmp、tiffなどの Python Imaging Libraryでサポートされているすべてのイメージタイプを読み取ることができる。
regression【回帰】 †
- 回帰(regression)とは、機械学習においては、連続する入力値に対する次の値を予測することを指す。
Reinforcement Learning【強化学習】 †
- 機械学習の一種であり、コンピューター エージェントが動的環境と、繰り返し試行錯誤のやりとりを重ねることによってタスクを実行できるようになる手法。
RPA(Robotic Process Automation) †
- ロボティックプロセスオートメーション(Robotic Process Automation)、通称RPAは、これまで人間のみが対応可能と想定されていた作業、もしくはより高度な作業を、人間に代わって実施できるルールエンジンやAI、機械学習等を含む認知技術を活用して代行・代替する取り組み。
Supervised/Unsupervised Learning【教師あり学習/教師なし学習】 †
- 教師あり学習では、人間があらかじめ付けた正解のラベルに基づき、機械が学習を行い、データセットに対する応答値の予測を行うモデルを構築する。
- 教師なし学習では、入力データのみがあり、ペアとなる正解のデータは存在しない。
ゴールは、データに対する理解を深めるためにデータの基本的な構造や分布をモデル化すること。
Tensorflow †
- TensorFlow(テンソルフロー、テンサーフロー)とは、Googleが開発しオープンソースで公開している、機械学習に用いるためのソフトウェアライブラリ。
VGG16 †
- VGG16というのは,「ImageNet」と呼ばれる大規模画像データセットで学習された16層からなる CNNモデル。Oxford 大学の研究グループが提案し2014年のILSVRで好成績を収めた。16層からなる CNNモデルには、(224×224)の入力サイズのカラーチャネルの入力層と1000クラス分類の出力層を含み様々な研究に使用されている。
- 名前の由来は、VGGチームが作った、畳み込み13層+全結合層3層=16層のニューラルネットワークということで、VGG-16となっているそうな。
更新履歴 †
参考資料 †