NVIDIA、Voltaアーキテクチャのプロ向けGPU「Quadro GV100」(Impress PC Watch)
NVIDIA RTX Technology Delivers Biggest Advance in Computer Graphics in 15 Years(NVIDIA)
NVIDIAは3月28日、GTC Technology ConferenceでQuadro GV100を発表した。Quadro GV100は同じく今回発表されたNVIDIA RTX technologyとともに、リアルタイムのレイトレーシングを世界で初めて提供する製品となる。
Quadro GV100は32GBのHBM 2メモリを搭載しており、NV Link interconnect technologyにより、2数のQuadro GV100を搭載することで64GBまでのスケーラビリティを確保している。ベースとなるGPUのアーキテクチャは“Volta”で、演算性能は倍精度 7.4TFlops, 単精度 14.8TFlps, そしてdeep learningにおける性能は118.5TFlopsとなる。
現段階で判明しているスペック・性能は以下の通り。
NVIDIA RTX Technology Delivers Biggest Advance in Computer Graphics in 15 Years(NVIDIA)
NVIDIAは3月28日、GTC Technology ConferenceでQuadro GV100を発表した。Quadro GV100は同じく今回発表されたNVIDIA RTX technologyとともに、リアルタイムのレイトレーシングを世界で初めて提供する製品となる。
Quadro GV100は32GBのHBM 2メモリを搭載しており、NV Link interconnect technologyにより、2数のQuadro GV100を搭載することで64GBまでのスケーラビリティを確保している。ベースとなるGPUのアーキテクチャは“Volta”で、演算性能は倍精度 7.4TFlops, 単精度 14.8TFlps, そしてdeep learningにおける性能は118.5TFlopsとなる。
現段階で判明しているスペック・性能は以下の通り。
Quadro | |||||
GPU core | CUDA core | GPU memory | 演算性能 | 消費電力 | |
GV100 | GV100 (Volta) | 5120 | HBM2 32GB | FP64 7.4TFlops FP32 14.8 TFlops Tensor 118.5TFlops | ***W |
GP100 | GP100 (Pascal) | 3584 | HBM2 16GB | FP64 5.2TFlops FP32 10.3 TFlops FP16 20.7TFlops | 235W |
CUDA coreの増加により演算性能が向上、さらにTensor coreによりdeep learningの性能を前世代から大幅に向上させている。NVIDIAのプレスリリースには、RTX technologyと合わせてリアルタイムのレイトレーシングを可能とし、さらにワークステーション向けに最高性能を実現したと記載されている。
価格は今のところ明らかにされていないようだが、Titan Vの$2999より安価になることはないと思われる(そもそも個人の自作PC向けじゃない)。
(追記:2018年3月28日23時44分)
NVIDIA Announces World's Most Powerful Professional GPU - The Quadro GV100(techPowerUp!)
NVIDIA announces Quadro GV100(VideoCardz)
NVIDIA Quadro GV100 GPU Announced For $9000 US – Packs A Massive 32 GB HBM2 Memory, 5120 CUDA Cores, Designed Around NVIDIA’s RTX Technology(WCCF Tech)
Tesla V100 (PCIe) | Titan V | Quadro GV100 | ||
コア・プロセス | GV100 12nm | |||
ダイサイズ | 815mm2 | |||
トランジスタ数 | 211億 | |||
SM | 80 | |||
CUDA core数 | 5120 | |||
コア 周波数 | Base | ****MHz | 1200MHz | ****MHz | Boost | 1370MHz | 1455MHz | 1450MHz |
Tensor core数 | 640 | |||
演算性能 | Tensor | 112TFlops | 110TFlops | 118.5TFlops |
FP32 | 14TFlops | 13.8TFlops | 14.8TFlops | FP64 | 7.0TFlops | 6.9TFLops | 7.4TFLops |
搭載メモリ | HBM2 16GB HBM2 32GB | HBM2 12GB | HBM2 32GB | |
メモリ帯域 | 900GB/sec | 652.8GB/sec | 870GB/sec | |
メモリ周波数 | 879MHz | 850MHz | 850MHz | |
メモリインターフェース | 4096-bit | 3072-bit | 4096-bit | |
L2 cache | 6MB | 4MB | 6MB | |
TDP | 250W | 250W | 250W |
Quadro GV100の価格は$9000となるよう。
同時にTesla V100のHBM 2をこれまでの16GBから32GBに増強することも明らかにされている。
[GTC 2018]NVIDIA,8万1920基のCUDA Coreを統合した“世界最大のGPU”「DGX-2」発表。新開発の「NVSwitch」で16基のTeslaを相互接続(4Gamer.net)
そしてこの32GB版Tesla V100をNVLinkベースのスイッチ―NVSwitchにより16基搭載したDGX-2と呼ばれるGPUクラスタが発表された。メモリ容量は合計512GB、半精度浮動小数点演算性能は2PFlopsとなる。
NVSwitchは12基用意されており、16基のGPU間の帯域は14TB/s。
なおこのDGX-2の価格は39万9000ドル。消費電力は180kW
この記事へのコメント
シミュレーションに使うと毎度結果が違う問題はどうなってるんだろうね http://gigazine.net/news/20180326-nvidia-titan-v-different-answer/
2018/03/28(Wed) 07:06 | URL | LGA774 #-[ 編集]
そういえば次期Geforceはやっぱ11xxになりましたね
1桁目も使うようになるのはNVらしい命名規則の崩れ方ではあるけど
1桁目も使うようになるのはNVらしい命名規則の崩れ方ではあるけど
2018/03/28(Wed) 16:03 | URL | LGA774 #-[ 編集]
結果が違う問題は独立した他の症例が出ないことにはわからん
だいたいこういう話の8割はプログラマが馬鹿だから起こるものだしな
だいたいこういう話の8割はプログラマが馬鹿だから起こるものだしな
2018/03/29(Thu) 20:15 | URL | LGA774 #-[ 編集]
>159619
昔から言われてる話だよな。
で、間違いは許さない派と非ECCメモリに文句言うな派に割れる。
昔から言われてる話だよな。
で、間違いは許さない派と非ECCメモリに文句言うな派に割れる。
2018/03/31(Sat) 14:19 | URL | LGA774 #-[ 編集]
この記事のトラックバックURL
https://northwood.blog.fc2.com/tb.php/9318-b3fdb840
この記事にトラックバックする(FC2ブログユーザー)
この記事にトラックバックする(FC2ブログユーザー)
この記事へのトラックバック