AI推進準備室 > AIGlossary
AI 用語集 †
※ 最終更新:2021/10/18
用語の解説と参考サイト †
ABテスト †
- ABテストとは、A案とB案を用意し、より反応の良い方を採用する方法。
- Webマーケティングにおける手法の一つ。
annotation【アノテーション】 †
- 機械学習において、データにメタデータをつけて意味づけをすることを指す。
- 膨大なデータに対して、アノテーションを行い、正解のデータ(=教師データ)を付与することで、機械学習のモデルの何が正しいものかを判断できる。
bandit algorithm【バンディットアルゴリズム】 †
- 複数案から最適なものを一つ選ぶとき、実際に試行して最適化するためのアルゴリズム。
- 「ワンアームド・バンディット」という別称を持つスロットマシンがその語源で、「スロットマシンが複数台あるとき、限られたコインをどの台にどれだけ使えば最大の成果が得られるか」を計算する手法として、1950年代から研究が始まったとされている。
batch size【バッチサイズ】 †
- データセットを幾つかのサブセットに分けたぞれぞれのサブセットに含まれるデータの数。
classification【分類】 †
- 分類(classification)とは、機械学習においては、離散的な入力値を、事前に定義された複数のクラスに分類することを指す。
- 離散的な入力値とは、例えば画像からの犬猫判定を考えると、動物の顔の特徴(耳/目/鼻/口など)を何らかの方法で数値化してグラフ上に点としてプロットすると、線状ではなく、ばらばらの点々になってしまうようなデータのこと。この場合は、「犬の点の集まり」や「猫の点の集まり」の中間に境界線を引いて(=学習できる)区分けすることで、犬猫判定の分類が実現できる。
clustering【クラスタリング】 †
- データ間の類似度にもとづいて、データをグループ分けする手法。
- クラスタリングによってできた、似たもの同士が集まったグループのことをクラスタと呼ぶ。
CNN【畳み込みニューラルネットワーク】 †
- 畳み込みニューラルネットワーク(CNN)は畳み込み層とプーリング層が積み重なったニューラルネットワークのこと。
Data Augmentation【水増し】 †
- 元の学習データに変換を加えてデータ量を増やすテクニックで、特にCNN(畳み込みニューラルネットワーク)などを使った画像処理で効果を発揮する。
epoch数【エポック数】 †
- 「一つの訓練データを何回繰り返して学習させるか」の数のこと。
Faster R-CNN †
- 2015年にMicrosoftが発明した物体検出アルゴリズム。Deep LearningによるEnd-to-Endな実装に初めて成功している。
- STEP1: ある矩形の中身が物体なのか背景( = 何も写っていない)なのかを学習する
Resion Proposal Network(RPN)と呼ばれるCNN構造を用い Deep Learningによって実装
- STEP2: STEP1で検出した場所に、具体的に何が写っているのかを学習する。
Fine Tuning【ファインチューニング】 †
- 訓練済のモデルを各タスクに合わせて調整するように訓練すること。
- ファインチューニングにおいて、既存の学習済モデルは、「特徴抽出器」として用いられ、パラメータの更新はされない。
- 出力側に追加した層のパラメータが更新され、学習が行われる。
FNN【フィードフォワード・ニューラルネットワーク】 †
- ディープラーニングで用いられるニューラルネットワークは、大きく分けて二つあるうちの一つ。
- FNNは日本語で「順伝播型ニューラルネットワーク」とも訳され、入力層で受け取ったデータが出力層へ向け、一方通行で処理されていくのが特徴。
- 上位の隠れ層から下位の隠れ層に、順番にデータが受け渡されていく事から「順伝搬型」と名付けられている。
garbage collection; GC【カベージコレクション】 †
- コンピュータプログラムが動的に確保したメモリ領域のうち、不要になった領域を自動的に解放する機能。
HDF5 †
- Hierarchical Data Format(階層的データ形式、略称:HDF)は、大量のデータを格納および構造化するために設計された一連のファイル形式(HDF4、HDF5)。
- 米国立スーパーコンピュータ応用研究所で開発され、非営利法人である HDF グループによってサポートされている。
- HDFグループは、HDF5 テクノロジーの継続的な開発と HDF で保存されたデータの継続的なアクセスを確保することを使命としている。
Keras【ケラス】 †
- TensorFlowの上で実行可能な高水準のニューラルネットワークライブラリ。
- 迅速な実験を可能にすることに重点を置いて開発されたため、簡単なPythonのコードで多くのモデルを素早く実装できる。
- ディープラーニングの初心者が実装を始めるには最も適したライブラリ。
ILSVRC †
- コンピュータによる画像認識技術に関するコンペティション形式の研究集会。
- ILSVRCは、ImageNet Large Scale Visual Recognition Challengeの略。
- 大規模な画像データセットImageNetを保有する組織が提唱し、2010年から始まった。
- スタンフォード大学やプリンストン大学などが運営にかかわる。
Inception Resnet V2 †
- Inception-ResNet-v2 は、ImageNet データベース [1] の 100 万枚を超えるイメージで学習済みの畳み込みニューラル ネットワーク。
- このネットワークは、深さが 164 層であり、イメージを 1000 個のオブジェクト カテゴリ (キーボード、マウス、鉛筆、多くの動物など) に分類できる。
- 結果として、このネットワークは広範囲のイメージに対する豊富な特徴表現を学習している。
- ネットワークのイメージ入力サイズは 299 x 299。
LabelImg †
- LabelImgは、グラフィカル画像アノテーションツール。
- Pythonで書かれており、GUIとして Qtを使用している。
- アノテーションは、ImageNetで使用される形式であるPASCAL VOC形式で XMLファイルとして保存される。
Monte Carlo method【モンテカルロ法】 †
- 数値計算手法の一つで、乱数を用いた試行を繰り返すことにより近似解を求める手法。
- ある事象をモデル化した数式や関数があるとき、その定義域に含まれる値をランダムにたくさん生成して実際に計算を行い、得られた結果を統計的に処理することで推定値を得ることができる。
- 数式を解析的に解くのが困難あるいは不可能な場合でも数値的に近似解を求めることができる。
Pillow 【ピロー】/ PIL / Python Imaging Library 【ピー・アイ・エル】 †
- Python Imaging Library(略称 PIL)は、プログラミング言語Pythonに、各種形式の画像ファイルの読み込み・操作・保存を行う機能を提供するフリーのライブラリ。
pytesseract「Python Tesseract」 †
- Python-tesseractは、Python用の光学式文字認識(OCR)ツール。画像に埋め込まれたテキストを認識する。
- Python-tesseractは、 GoogleのTesseract-OCR Engineのラッパー。 jesseg、png、gif、bmp、tiffなどの Python Imaging Libraryでサポートされているすべてのイメージタイプを読み取ることができる。
regression【回帰】 †
- 回帰(regression)とは、機械学習においては、連続する入力値に対する次の値を予測することを指す。
RNN【カレント・ニューラルネットワーク】 †
- ディープラーニングで用いられるニューラルネットワークは、大きく分けて二つあるうちの一つ。
- 日本語では「再帰型ニューラルネットワーク」と呼ばれる。
- 隠れ層内をデータが行ったり来たりして処理されていくのが特徴で、出力したいデータが時系列を持っていたり、データの大きさが一定で無い場合、FNNより対応しやすいのが特徴。
Reinforcement Learning【強化学習】 †
- 機械学習の一種であり、コンピューター エージェントが動的環境と、繰り返し試行錯誤のやりとりを重ねることによってタスクを実行できるようになる手法。
- 試行錯誤を通じて「価値を最大化するような行動」を学習するもの。
- 囲碁や将棋といったゲームは、本質的に将来の価値(つまり今その手を打つことにより、最終的に勝つのか負けるのか)を最大化することが目的なので、強化学習とは相性が良い問題である。
RPA(Robotic Process Automation) †
- ロボティックプロセスオートメーション(Robotic Process Automation)、通称RPAは、これまで人間のみが対応可能と想定されていた作業、もしくはより高度な作業を、人間に代わって実施できるルールエンジンやAI、機械学習等を含む認知技術を活用して代行・代替する取り組み。
Supervised/Unsupervised Learning【教師あり学習/教師なし学習】 †
- 教師あり学習では、人間があらかじめ付けた正解のラベルに基づき、機械が学習を行い、データセットに対する応答値の予測を行うモデルを構築する。
- 教師なし学習では、入力データのみがあり、ペアとなる正解のデータは存在しない。
ゴールは、データに対する理解を深めるためにデータの基本的な構造や分布をモデル化すること。
Tensor【テンソル】 †
- ベクトルの考え方を拡張したもので、数学、とくに幾何学や、物理学で重要な働きをする概念。
- 張力tensionに由来することば。
- ベクトル・行列・内積といえば、代表的な基本的概念である。
Tensorflow【テンソルフロー】 †
- TensorFlow(テンソルフロー、テンサーフロー)とは、Googleが開発しオープンソースで公開している、機械学習に用いるためのソフトウェアライブラリ。
Tcl/Tk 【ティクル・ティーケー】/ Tk【ツールキット】 †
- Tcl/Tk(ティクル・ティーケー)は、スクリプト言語 Tcl と、その GUIツールキット Tk を指す。
- 非常に強力な GUI ツールキットと、シンプルな文法をもつ言語により、GUI ツールを素早く作り上げるのに適した強力なスクリプティング環境。
- Tkは、GUIを開発するための、オープンソースの、クロスプラットフォームのウィジェット・ツールキット。
Tkinter †
- PythonでGUIを組むことのできるツールキットのこと。
- Tcl/Tk の Tk 部分を Python で利用できるようにしたもので、使い方も可能な限り Tcl/Tk にあわせられるように作られている。
Transfer learning【転移学習】 †
- 転移学習とは、効果的な仮説を効率的に見つけ出すために、別のタスクで学習された知識を転移する機械学習の手法である。
- 転移学習に学習済みモデルを転用することで、大量のデータと学習にかかる時間を削減することができる。
- 転移学習では既存の学習済みモデルのデータは変更せず、新たに追加したモデルのデータのみ学習する。
Triplet loss †
- トリプレット損失は、ベースライン入力が正の入力および負の入力と比較される機械学習アルゴリズムの損失関数。ベースライン入力から正の入力までの距離が最小化され、ベースライン入力から負の入力までの距離が最大になる。(ウイキペディア)
VGG16 †
- VGG16というのは,「ImageNet」と呼ばれる大規模画像データセットで学習された16層からなる CNNモデル。Oxford 大学の研究グループが提案し2014年のILSVRで好成績を収めた。16層からなる CNNモデルには、(224×224)の入力サイズのカラーチャネルの入力層と1000クラス分類の出力層を含み様々な研究に使用されている。
- 名前の由来は、VGGチームが作った、畳み込み13層+全結合層3層=16層のニューラルネットワークということで、VGG-16となっているそうな。
更新履歴 †
参考資料 †