AI推進準備室 > AIrepVol5

「私的AI研究会」レポート VOL.5

interface202304s.jpg

これまで取り上げたテーマを振り返ってみる。以下は CQ 出版刊「インターフェース 2023年4月号」特集3 からの抜粋。

※ 最終更新:2023/03/18 

ディープ・ラーニングの今 2023

ディープ・ラーニング(深層学習)の位置づけ

ディープ・ラーニングの応用例

ディープ・ラーニングのシステム構成

  deep2023_02.jpg

 引用 → スマホでAI!?エヌビディアのアーム買収で何が起こるのか?

代表的なフレームワーク ➡ ディープラーニングのフレームワーク

画像処理向け深層学習のタスク

deep2023_13.jpg

深層学習タスクの入手先

タスク手法入手先(URL)
物体認識Faster R-CNNDetectron
YOLOv7Official YOLOv7
DETRDE:TR: End-to-End Object Detection with Transformers
セグメンテーションPSPNetPyTorch Semantic Segmentation
Mask R-CNNMask R-CNN for Object Detection and Segmentation
Panoptic FPNDetectron2
物体追跡SORTSORT
Deep SORTDeep SORT
姿勢推定CPNCascaded Pyramid Network (CPN)
HRNetDeep High-Resolution Representation Learning for Human Pose Estimation (CVPR 2019)
OpenPoseOpenPose
画像生成(GAN)SycleGANStyleGAN -- Official TensorFlow Implementation
Pix2PixPix2Pix
Pix2PixHDPix2PixHD
CycleGANCycleGAN
PGGANProgressive Growing of GANs for Improved Quality, Stability, and Variation -- Official TensorFlow implementation of the ICLR 2018 paper
DALL-E2 *1DALL-E2
Imagen *1Imagen
Parti *1Parti
Midjourney *2Midjourney
Stable DiffusionStable Diffusion

  *1 公式のソースコードは未公開だが、ウェブページで一部機能を試すことができる
  *2 公式のソースコードは非公開だが、ベータ版を試すための権利を申し込むことができる

 

深層学習の最新アーキテクチャ Transformer

Transformer とは

 Transformer は最新のニューラル・ネットワークの一つ。従来の CNN(畳み込みニューラル・ネットワーク)や RNN(再帰型ニューラル・ネットワーク)にとって代わる新技術。2017年にグーグルとトロント大学の研究者によって開発された。「ChatGPT」「Stable Diffusion」などにも使われ現在、汎用人工知能に向けた開発が続いている。

代表的な Transformer アーキテクチャ

 角国の企業や研究機関で開発された Transformer モデル、もしくは Transformer モデルを含んだ AIツール。大きな流れとしてグーグルと OpenAI社が主要な開発を行っている。グーグルが開発した「BERT」から派生したもの、OpenAI社の「GPT」から派生したものなどがある。OpenAI社の「CLIP」を起源とする画像生成AIも Transformer アーキテクチャのファミリ・ツリーを広げている。「BERT」「GPT」「CLIP」の深層モデルを中心にこれらをもとにしたAIツールが作られている。

deep2023_20.jpg

    画像引用 → TRANSFORMER MODELS: AN INTRODUCTION AND CATALOG

更新履歴

参考資料