AIGlossary のバックアップ(No.19)

AI推進準備室 > AIGlossary

AI 用語集 †

AI 用語集
- 用語の解説と参考サイト
- 更新履歴
参考資料

※ 最終更新:2021/10/23　

↑

用語の解説と参考サイト †

↑

ABテスト †

ABテストとは、A案とB案を用意し、より反応の良い方を採用する方法。
Webマーケティングにおける手法の一つ。

参考サイト
- ABテストとは？実施方法やメリット・注意点などを解説

↑

annotation【アノテーション】 †

機械学習において、データにメタデータをつけて意味づけをすることを指す。
膨大なデータに対して、アノテーションを行い、正解のデータ（＝教師データ）を付与することで、機械学習のモデルの何が正しいものかを判断できる。

参考サイト
- アノテーションとは AI・機械学習に必須の知識を解説

↑

bandit algorithm【バンディットアルゴリズム】 †

複数案から最適なものを一つ選ぶとき、実際に試行して最適化するためのアルゴリズム。
「ワンアームド・バンディット」という別称を持つスロットマシンがその語源で、「スロットマシンが複数台あるとき、限られたコインをどの台にどれだけ使えば最大の成果が得られるか」を計算する手法として、1950年代から研究が始まったとされている。

参考サイト
- バンディッドアルゴリズム
- バンディットアルゴリズムデジタル大辞泉の解説

↑

batch size【バッチサイズ】 †

データセットを幾つかのサブセットに分けたぞれぞれのサブセットに含まれるデータの数。

参考サイト
- 機械学習／ディープラーニングにおけるバッチサイズ、イテレーション数、エポック数の決め方
- 【ミニバッチ学習と学習率】低バッチサイズから始めよ

↑

classification【分類】 †

分類（classification）とは、機械学習においては、離散的な入力値を、事前に定義された複数のクラスに分類することを指す。
離散的な入力値とは、例えば画像からの犬猫判定を考えると、動物の顔の特徴（耳／目／鼻／口など）を何らかの方法で数値化してグラフ上に点としてプロットすると、線状ではなく、ばらばらの点々になってしまうようなデータのこと。この場合は、「犬の点の集まり」や「猫の点の集まり」の中間に境界線を引いて（＝学習できる）区分けすることで、犬猫判定の分類が実現できる。

参考サイト
- 分類（classification）とは？

↑

clustering【クラスタリング】 †

データ間の類似度にもとづいて、データをグループ分けする手法。
クラスタリングによってできた、似たもの同士が集まったグループのことをクラスタと呼ぶ。

参考サイト
- クラスタリングとは | 概要・手順・活用事例を紹介

↑

CNN【畳み込みニューラルネットワーク】 †

畳み込みニューラルネットワーク（CNN）は畳み込み層とプーリング層が積み重なったニューラルネットワークのこと。

CNN の例

参考サイト
- 畳み込みニューラルネットワーク（CNN）をなるべくわかりやすく解説
- レクチャー：畳み込みニューラルネットワークの概要

↑

Data Augmentation【水増し】 †

元の学習データに変換を加えてデータ量を増やすテクニックで、特にCNN（畳み込みニューラルネットワーク）などを使った画像処理で効果を発揮する。

参考サイト
- 水増しと転移学習 (Vol.7)
- データが足りないなら増やせば良いじゃない。

↑

epoch数【エポック数】 †

「一つの訓練データを何回繰り返して学習させるか」の数のこと。

参考サイト
- エポック(epoch)数とは
- 【初心者】ネコでも分かる「学習回数」ってなに？

↑

Faster R-CNN †

2015年にMicrosoftが発明した物体検出アルゴリズム。Deep LearningによるEnd-to-Endな実装に初めて成功している。

STEP1: ある矩形の中身が物体なのか背景( = 何も写っていない)なのかを学習する
Resion Proposal Network(RPN)と呼ばれるCNN構造を用い Deep Learningによって実装
STEP2: STEP1で検出した場所に、具体的に何が写っているのかを学習する。

参考サイト
- Faster R-CNNにおけるRPNの世界一分かりやすい解説

↑

Fine Tuning【ファインチューニング】 †

訓練済のモデルを各タスクに合わせて調整するように訓練すること。
ファインチューニングにおいて、既存の学習済モデルは、「特徴抽出器」として用いられ、パラメータの更新はされない。
出力側に追加した層のパラメータが更新され、学習が行われる。

参考サイト
- 【自然言語処理】ファインチューニング(Fine-Tuning)とは何か

↑

FNN【フィードフォワード・ニューラルネットワーク】 †

ディープラーニングで用いられるニューラルネットワークは、大きく分けて二つあるうちの一つ。
FNNは日本語で「順伝播型ニューラルネットワーク」とも訳され、入力層で受け取ったデータが出力層へ向け、一方通行で処理されていくのが特徴。
上位の隠れ層から下位の隠れ層に、順番にデータが受け渡されていく事から「順伝搬型」と名付けられている。

参考サイト
- ディープラーニングとは？できること・仕組み・アルゴリズム・実用例

↑

garbage collection; GC【カベージコレクション】 †

コンピュータプログラムが動的に確保したメモリ領域のうち、不要になった領域を自動的に解放する機能。

参考サイト
- ガベージコレクション

↑

HDF5 †

Hierarchical Data Format（階層的データ形式、略称：HDF）は、大量のデータを格納および構造化するために設計された一連のファイル形式（HDF4、HDF5）。
米国立スーパーコンピュータ応用研究所で開発され、非営利法人である HDF グループによってサポートされている。
HDFグループは、HDF5 テクノロジーの継続的な開発と HDF で保存されたデータの継続的なアクセスを確保することを使命としている。

参考サイト
- Hierarchical Data Format
- Kerasで学習済みディープラーニングモデルを保存・読込みする方法【Tensorflow】

↑

IoU（Intersection over Union）【アイオーユー】 †

Intersection(領域の共通部分) over Union(領域の和集合)の略。
2つの領域が「どれくらい重なっているか」を表す指標。

参考サイト
- IoU（評価指標）の意味と値の厳しさ

↑

Keras【ケラス】 †

TensorFlowの上で実行可能な高水準のニューラルネットワークライブラリ。
迅速な実験を可能にすることに重点を置いて開発されたため、簡単なPythonのコードで多くのモデルを素早く実装できる。
ディープラーニングの初心者が実装を始めるには最も適したライブラリ。

参考サイト
- Keras とは？

↑

ILSVRC †

コンピュータによる画像認識技術に関するコンペティション形式の研究集会。
ILSVRCは、ImageNet Large Scale Visual Recognition Challengeの略。
大規模な画像データセットImageNetを保有する組織が提唱し、2010年から始まった。
スタンフォード大学やプリンストン大学などが運営にかかわる。

参考サイト
- ILSVRC（コトバンク）

↑

Inception Resnet V2 †

Inception-ResNet-v2 は、ImageNet データベース [1] の 100 万枚を超えるイメージで学習済みの畳み込みニューラルネットワーク。
このネットワークは、深さが 164 層であり、イメージを 1000 個のオブジェクトカテゴリ (キーボード、マウス、鉛筆、多くの動物など) に分類できる。
結果として、このネットワークは広範囲のイメージに対する豊富な特徴表現を学習している。
ネットワークのイメージ入力サイズは 299 x 299。

参考サイト
- inceptionresnetv2

↑

LabelImg †

LabelImgは、グラフィカル画像アノテーションツール。
Pythonで書かれており、GUIとして Qtを使用している。
アノテーションは、ImageNetで使用される形式であるPASCAL VOC形式で XMLファイルとして保存される。

参考サイト
- labelImg – 🤘画像の注釈ツール
- labelImgとChainerCVを使ってアノテーション作業を楽にする

↑

mAP(mean Average Precision)【平均平均精度】 †

検出した物体の分類があっているか（画像が「犬」のとき物体認識結果も「犬」となっているか）の程度を示す指標で、数値が大きいほど精度が高くなる。
参考サイト
- MAP（Mean Average Precision）という指標の意味

↑

Monte Carlo method【モンテカルロ法】 †

数値計算手法の一つで、乱数を用いた試行を繰り返すことにより近似解を求める手法。
ある事象をモデル化した数式や関数があるとき、その定義域に含まれる値をランダムにたくさん生成して実際に計算を行い、得られた結果を統計的に処理することで推定値を得ることができる。
数式を解析的に解くのが困難あるいは不可能な場合でも数値的に近似解を求めることができる。

参考サイト
- モンテカルロ法【Monte Carlo method】

↑

Pillow 【ピロー】/ PIL / Python Imaging Library 【ピー・アイ・エル】 †

Python Imaging Library（略称 PIL）は、プログラミング言語Pythonに、各種形式の画像ファイルの読み込み・操作・保存を行う機能を提供するフリーのライブラリ。

参考サイト

↑

pytesseract「Python Tesseract」 †

Python-tesseractは、Python用の光学式文字認識（OCR）ツール。画像に埋め込まれたテキストを認識する。

Python-tesseractは、 GoogleのTesseract-OCR Engineのラッパー。 jesseg、png、gif、bmp、tiffなどの Python Imaging Libraryでサポートされているすべてのイメージタイプを読み取ることができる。

参考サイト
- pytesseract – Google TesseractのPythonラッパー
- pytesseract 概要と使い方メモ

↑

regression【回帰】 †

回帰（regression）とは、機械学習においては、連続する入力値に対する次の値を予測することを指す。

参考サイト
- 回帰（regression）とは？

↑

RNN【カレント・ニューラルネットワーク】 †

ディープラーニングで用いられるニューラルネットワークは、大きく分けて二つあるうちの一つ。
日本語では「再帰型ニューラルネットワーク」と呼ばれる。
隠れ層内をデータが行ったり来たりして処理されていくのが特徴で、出力したいデータが時系列を持っていたり、データの大きさが一定で無い場合、FNNより対応しやすいのが特徴。

参考サイト
- ディープラーニングとは？できること・仕組み・アルゴリズム・実用例

↑

Reinforcement Learning【強化学習】 †

機械学習の一種であり、コンピューターエージェントが動的環境と、繰り返し試行錯誤のやりとりを重ねることによってタスクを実行できるようになる手法。
試行錯誤を通じて「価値を最大化するような行動」を学習するもの。
囲碁や将棋といったゲームは、本質的に将来の価値（つまり今その手を打つことにより、最終的に勝つのか負けるのか）を最大化することが目的なので、強化学習とは相性が良い問題である。

参考サイト
- 強化学習これだけは知っておきたい 3 つのこと
- 強化学習入門～これから強化学習を学びたい人のための基礎知識～

↑

RPA（Robotic Process Automation） †

ロボティックプロセスオートメーション(Robotic Process Automation)、通称RPAは、これまで人間のみが対応可能と想定されていた作業、もしくはより高度な作業を、人間に代わって実施できるルールエンジンやAI、機械学習等を含む認知技術を活用して代行・代替する取り組み。

参考サイト
- 用語解説 RPA

↑

Supervised/Unsupervised Learning【教師あり学習/教師なし学習】 †

教師あり学習では、人間があらかじめ付けた正解のラベルに基づき、機械が学習を行い、データセットに対する応答値の予測を行うモデルを構築する。
教師なし学習では、入力データのみがあり、ペアとなる正解のデータは存在しない。ゴールは、データに対する理解を深めるためにデータの基本的な構造や分布をモデル化すること。

参考サイト
- 【機械学習入門】教師あり学習と教師なし学習
- GAN：敵対的生成ネットワークとは何か　～「教師なし学習」による画像生成

↑

Tensor【テンソル】 †

ベクトルの考え方を拡張したもので、数学、とくに幾何学や、物理学で重要な働きをする概念。
張力tensionに由来することば。
ベクトル・行列・内積といえば、代表的な基本的概念である。

参考サイト
- テンソルとは『コトバンク』
- テンソル『ウィキペディア（Wikipedia）』

↑

Tensorflow【テンソルフロー】 †

TensorFlow（テンソルフロー、テンサーフロー）とは、Googleが開発しオープンソースで公開している、機械学習に用いるためのソフトウェアライブラリ。

参考サイト
- TensorFlow
- TensorflowとKeras、PyTorchの比較

↑

Tcl/Tk 【ティクル・ティーケー】/ Tk【ツールキット】 †

Tcl/Tk（ティクル・ティーケー）は、スクリプト言語 Tcl と、その GUIツールキット Tk を指す。
非常に強力な GUI ツールキットと、シンプルな文法をもつ言語により、GUI ツールを素早く作り上げるのに適した強力なスクリプティング環境。
Tkは、GUIを開発するための、オープンソースの、クロスプラットフォームのウィジェット・ツールキット。

参考サイト
- Tcl/Tk
- Tk (ツールキット)

↑

Tkinter †

PythonでGUIを組むことのできるツールキットのこと。
Tcl/Tk の Tk 部分を Python で利用できるようにしたもので、使い方も可能な限り Tcl/Tk にあわせられるように作られている。

参考サイト
- PythonのTkinterを使ってみる
- Tkinter

↑

Transfer learning【転移学習】 †

転移学習とは、効果的な仮説を効率的に見つけ出すために、別のタスクで学習された知識を転移する機械学習の手法である。
転移学習に学習済みモデルを転用することで、大量のデータと学習にかかる時間を削減することができる。
転移学習では既存の学習済みモデルのデータは変更せず、新たに追加したモデルのデータのみ学習する。

参考サイト
- 転移学習とは？ファインチューニングとの違いや活用例をご紹介

↑

Triplet loss †

トリプレット損失は、ベースライン入力が正の入力および負の入力と比較される機械学習アルゴリズムの損失関数。ベースライン入力から正の入力までの距離が最小化され、ベースライン入力から負の入力までの距離が最大になる。（ウイキペディア）

参考サイト
- Deep Metric Learning の定番⁈ Triplet Lossを徹底解説
- Triplet lossを使った高速な異常検知

↑

VGG16 †

VGG16というのは，「ImageNet」と呼ばれる大規模画像データセットで学習された16層からなる CNNモデル。Oxford 大学の研究グループが提案し2014年のILSVRで好成績を収めた。16層からなる CNNモデルには、（224×224）の入力サイズのカラーチャネルの入力層と1000クラス分類の出力層を含み様々な研究に使用されている。
名前の由来は、VGGチームが作った、畳み込み13層＋全結合層３層＝16層のニューラルネットワークということで、VGG-16となっているそうな。

モデルイメージ

参考サイト
- VGG16モデルを使用してオリジナル写真の画像認識を行ってみる
- Keras：VGG16、VGG19とかってなんだっけ？？

↑

更新履歴 †

2021/09/01 初版

↑

AIGlossary のバックアップ(No.19)

AI 用語集 †

用語の解説と参考サイト †

ABテスト †

annotation【アノテーション】 †

bandit algorithm【バンディットアルゴリズム】 †

batch size【バッチサイズ】 †

classification【分類】 †

clustering【クラスタリング】 †

CNN【畳み込みニューラルネットワーク】 †

Data Augmentation【水増し】 †

epoch数【エポック数】 †

Faster R-CNN †

Fine Tuning【ファインチューニング】 †

FNN【フィードフォワード・ニューラルネットワーク】 †

garbage collection; GC【カベージコレクション】 †

HDF5 †

IoU（Intersection over Union）【アイオーユー】 †

Keras【ケラス】 †

ILSVRC †

Inception Resnet V2 †

LabelImg †

mAP(mean Average Precision)【平均平均精度】 †

Monte Carlo method【モンテカルロ法】 †

Pillow 【ピロー】/ PIL / Python Imaging Library 【ピー・アイ・エル】 †

pytesseract「Python Tesseract」 †

regression【回帰】 †

RNN【カレント・ニューラルネットワーク】 †

Reinforcement Learning【強化学習】 †

RPA（Robotic Process Automation） †

Supervised/Unsupervised Learning【教師あり学習/教師なし学習】 †

Tensor【テンソル】 †

Tensorflow【テンソルフロー】 †

Tcl/Tk 【ティクル・ティーケー】/ Tk【ツールキット】 †

Tkinter †

Transfer learning【転移学習】 †

Triplet loss †

VGG16 †

更新履歴 †

参考資料 †