北森瓦版 - Northwood Blog (Author : 北森四葉. Since July 10, 2006.)
NVIDIA、Voltaアーキテクチャのプロ向けGPU「Quadro GV100」(Impress PC Watch)
NVIDIA RTX Technology Delivers Biggest Advance in Computer Graphics in 15 Years(NVIDIA)

NVIDIAは3月28日、GTC Technology ConferenceでQuadro GV100を発表した。Quadro GV100は同じく今回発表されたNVIDIA RTX technologyとともに、リアルタイムのレイトレーシングを世界で初めて提供する製品となる。

Quadro GV100は32GBのHBM 2メモリを搭載しており、NV Link interconnect technologyにより、2数のQuadro GV100を搭載することで64GBまでのスケーラビリティを確保している。ベースとなるGPUのアーキテクチャは“Volta”で、演算性能は倍精度 7.4TFlops, 単精度 14.8TFlps, そしてdeep learningにおける性能は118.5TFlopsとなる。

現段階で判明しているスペック・性能は以下の通り。
 
Quadro
GPU coreCUDA coreGPU memory演算性能消費電力
GV100GV100
(Volta)
5120HBM2 32GBFP64 7.4TFlops
FP32 14.8 TFlops
Tensor 118.5TFlops
***W
GP100GP100
(Pascal)
3584HBM2 16GBFP64 5.2TFlops
FP32 10.3 TFlops
FP16 20.7TFlops
235W


CUDA coreの増加により演算性能が向上、さらにTensor coreによりdeep learningの性能を前世代から大幅に向上させている。NVIDIAのプレスリリースには、RTX technologyと合わせてリアルタイムのレイトレーシングを可能とし、さらにワークステーション向けに最高性能を実現したと記載されている。

価格は今のところ明らかにされていないようだが、Titan Vの$2999より安価になることはないと思われる(そもそも個人の自作PC向けじゃない)。



(追記:2018年3月28日23時44分)

NVIDIA Announces World's Most Powerful Professional GPU - The Quadro GV100(techPowerUp!)
NVIDIA announces Quadro GV100(VideoCardz)
NVIDIA Quadro GV100 GPU Announced For $9000 US – Packs A Massive 32 GB HBM2 Memory, 5120 CUDA Cores, Designed Around NVIDIA’s RTX Technology(WCCF Tech)

Tesla V100 (PCIe)Titan VQuadro GV100
コア・プロセスGV100 12nm
ダイサイズ815mm2
トランジスタ数211億
SM80
CUDA core数5120
コア
周波数
Base****MHz1200MHz****MHz
Boost1370MHz1455MHz1450MHz
Tensor core数640
演算性能Tensor112TFlops110TFlops118.5TFlops
FP3214TFlops13.8TFlops14.8TFlops
FP647.0TFlops6.9TFLops7.4TFLops
搭載メモリHBM2 16GB
HBM2 32GB
HBM2 12GBHBM2 32GB
メモリ帯域900GB/sec652.8GB/sec870GB/sec
メモリ周波数879MHz850MHz850MHz
メモリインターフェース4096-bit3072-bit4096-bit
L2 cache6MB4MB6MB
TDP250W250W250W


Quadro GV100の価格は$9000となるよう。

同時にTesla V100のHBM 2をこれまでの16GBから32GBに増強することも明らかにされている。

[GTC 2018]NVIDIA,8万1920基のCUDA Coreを統合した“世界最大のGPU”「DGX-2」発表。新開発の「NVSwitch」で16基のTeslaを相互接続(4Gamer.net)

そしてこの32GB版Tesla V100をNVLinkベースのスイッチ―NVSwitchにより16基搭載したDGX-2と呼ばれるGPUクラスタが発表された。メモリ容量は合計512GB、半精度浮動小数点演算性能は2PFlopsとなる。
NVSwitchは12基用意されており、16基のGPU間の帯域は14TB/s。

なおこのDGX-2の価格は39万9000ドル。消費電力は180kW HPCの世界はいろいろと桁違いである



コメント
この記事へのコメント
159619 
シミュレーションに使うと毎度結果が違う問題はどうなってるんだろうね http://gigazine.net/news/20180326-nvidia-titan-v-different-answer/
2018/03/28(Wed) 07:06 | URL | LGA774 #-[ 編集]
159625 
そういえば次期Geforceはやっぱ11xxになりましたね
1桁目も使うようになるのはNVらしい命名規則の崩れ方ではあるけど
2018/03/28(Wed) 16:03 | URL | LGA774 #-[ 編集]
159640 
結果が違う問題は独立した他の症例が出ないことにはわからん
だいたいこういう話の8割はプログラマが馬鹿だから起こるものだしな
2018/03/29(Thu) 20:15 | URL | LGA774 #-[ 編集]
159651 
>159619
昔から言われてる話だよな。
で、間違いは許さない派と非ECCメモリに文句言うな派に割れる。
2018/03/31(Sat) 14:19 | URL | LGA774 #-[ 編集]
コメントを投稿する(投稿されたコメントは承認後表示されます)
URL:
Comment:
Pass:
秘密: 管理者にだけ表示を許可する
 
トラックバック
この記事のトラックバックURL
https://northwood.blog.fc2.com/tb.php/9318-b3fdb840
この記事にトラックバックする(FC2ブログユーザー)
この記事へのトラックバック