NVIDIA、Voltaアーキテクチャベースの「Tesla V100」を発表

米NVIDIAは5月10日(現地時間)、米国サンノゼで開催中の技術カンファレンス「GPU Technology Conference 2017」(GTC 2017)にて、次世代GPUアーキテクチャ"Volta"ベースの「Tesla V100」を発表した。

Tesla V100

Tesla V10を披露するNVIDIA 創設者兼CEOのジェンスン・フアン氏。中央にあるGPUは「Apple Watch程度のサイズ」とのこと

GPUコアに"Volta"ベースの「GV100」コアを採用。プロセスルールはTSMCの12nm FFNで、5,120基ものCUDAコアを搭載する。トランジスタ数は211億。ダイサイズは815平方mmで、前世代である"Pascal"アーキテクチャベースの「GP100」コアと比べて、1.3倍以上の規模となった。さらにディープラーニング向けに最適化された「Tensor Core」を統合する。

GV100コアのブロック図

Streaming Multiprocessorの構成

一方でメモリは従来同様に16GBの第2世代HBM(High Bandwidth Memory)を搭載する。また、プロセッサ間の接続インタフェース「NVLink」も第2世代に刷新。リンクの増加や大域幅が拡大し、最大6つのNVLinkリンクで300GB/sのデータ転送をサポートする。

演算性能はFP32(32ビット単精度浮動小数点数)で15TFLOPS、FP64(64ビット倍精度浮動小数点数)で7.5TFLOPS。動作クロックは最大1,455MHz。TDPは300W。従来世代のTeslaとの比較は以下の通り。

製品名Tesla K40Tesla M40Tesla P100Tesla V100
GPUコアGK110(Kepler)GM200(Maxwell)GP100(Pascal)GV100(Volta)
製造プロセス28nm28nm16nm FinFET12nm FFN
トランジスタ数71億個80億個153億個211億個
ダイサイズ551平方mm601平方mm610平方mm815平方mm
SM15245680
TPC15242840
SMあたりの32FP CUDAコア1921286464
32FP CUDAコア合計2880307235845120
SMあたりの64FP CUDAコア6443232
64FP CUDAコア合計9609617922560
ブーストクロック810/875MHz1114MHz1480MHz1455MHz
Texture Units240192224320
メモリインタフェース384-bit GDDR5384-bit GDDR54096-bit HBM24096-bit HBM2
メモリ容量12GB24GB16GB16GB
L2キャッシュ1.5MB3MB4MB6MB
レジスタファイル3840KB6144KB14336KB20480 KB
TDP235W250W300W300W

引用元:この記事を読む

この商品の在庫を見てみる

ドスパラ

▼タップして詳細をみる▼

コメントは受け付けていません。

サブコンテンツ

このページの先頭へ