NVIDIA GPUの歴史ざっくりまとめ

GPUアーキテクチャの変遷について自分用のメモです

2006年 CUDA発表
G80アーキテクチャ発表 初めてのUnfied shader architecture
GeForce8800

2007年 Tesla HPC用
TSUBAME1.2 Tesla S1070 2008年Top500で20位

2009年 Fermi世代
double precisionの大幅な性能向上
TSUBAME2.0 Tesla M2050 TOP500で4位

2012年 Keplar世代 28nm
電力性能比の向上
多くのスパコンに採用される
TSUBAME KFC Tesla K20x Green500で1位

2014年 Maxwell世代 28nm
single precisionがKeplarの1.4倍に
doubleはKeplarより劣る -> スパコンには採用されなかった 
ディープラーニングなどのワークロードに最適化

2016年 Pascal世代 16nm
HBM2の採用
NVLink 160GB/s GPU間インターコネクト
Unified Memory CPU-GPU memory
Tesla P100
FP32: 10.6TFlops
FP64: 5.3TFlops 倍精度の性能向上
FP16: 21.2TFlops
HPCも機械学習にも対応
TSUBAME 3.0 Green500で1位
GPU仮想化に対応

2017年 Volta世代
Tensor coreの追加: 4x4 half float matrix mul -> half or single float / one clock
120TFlops
Tesla V100
AWS TeslaV100x8のP3インスタンスの提供