北森瓦版 - Northwood Blog (Author : 北森四葉. Since July 10, 2006.)
(初出:2014年11月17日22時46分)
NVIDIA announces Tesla K80, first graphics card with 24GB RAM(VideoCardz)
NVIDIA Introduces Tesla K80 With Two GK210 GPUs – World’s Fastest Accelerator With 2.9 TFlops of Compute(WCCF Tech)

NVIDIAは“Kepler”世代のGPUであるGK210を2基搭載したTesla K80を発表した。Tesla K80は最速のProfessional向けグラフィックカード製品となり、合計で4992のCUDA coreと416のTMU、96のROPを搭載する。2基のGPUはそれぞれ384-bitのメモリインターフェースを有しており、合計で24GBのGDDR5を搭載する。

Tesla K80はTesla K40の2倍の速度となり、倍精度浮動小数点演算性能は2.9TFlopsとなる。単精度浮動小数点演算性能は8TFlops程度になるという。
 
メモリバンド幅は2系統の384-bitメモリインターフェースにより480GB/sに達する。この数字はGeForce GTX Titan Zを下回るが、GeForce GTX Titan Zの搭載メモリはGDDR5 12GBであるのに対し、Tesla K80は24GBである。
 
メモリバンド幅は2系統の384-bitメモリインターフェースにより480GB/sに達する。この数字はGeForce GTX Titan Zを下回るが、GeForce GTX Titan Zの搭載メモリはGDDR5 12GBであるのに対し、Tesla K80は24GBである。

Tesla K80はTesla K40と同様にGPU Boostに対応する。Tesla K80では設計が多少改められており、GeForce GTX Titanと同様のマグネシウム製の覆いを用いたクーラーが用いられている。

上記は11月17日22時46分時点(日本時間)のものです。この時はまだNVIDIAのWebサイトにおいてもTesla K80の記載を確認できました。しかし、翌日にNVIDIAからプレスリリースが出され、各メディアからも詳しいスペックが報じられました。



(追記:2014年11月18日21時49分)
NVIDIA Launches Tesla K80, GK210 GPU(AnandTech)
NVidia Unveils Tesla K80 Dual-GPU Accelerator(CPU World)
NVIDIA Breathes Life into Kepler with the GK210 Silicon(techPowerUp!)
Tesla K80 packs dual GK210 GPUs(The Tech Report)
NVIDIA Unveils World's Fastest Accelerator for Data Analytics and Scientific Computing(NVIDIA)

NVIDIAは11月17日、Tesla K80 dual-GPU acceleratorを追加した。このTesla K80は最高の性能を誇るアクセラレータで、データ解析や科学計算、High performance computing applicationなど幅広く用いることができる。

Tesla K80はGK210を2基搭載しており、1基に2496のCUDA coreを搭載する。GK210を搭載したコンシューマ向けカードは出てきていないが、その前のコアであるGK110はGeForce GTX Titan Zに用いられている。

Tesla K40と比較するとTesla K80は浮動小数点演算性能とメモリ帯域が大幅に高められていることが分かる。また合計のメモリ容量も増大しているが、GPU 1基あたりがアクセスできるRAMは12GBとなる。Tesla K80の周波数はBaseでは他のGK110(またはGK110B)搭載Teslaよりも低く抑えられているが、Boost時はTesla K40と同じ周波数まで上がる。

GK210はGK110Bと比較するとSMXあたりのレジスタファイルサイズが2倍の512KBとなり、またL1 cache/shared memoryも2倍の128KBとなっている。このローカルキャッシュの増量により、SMXがより持続的にGPU-computing workloadに携わることができるようになっている。

スペックは以下の通り。

Tesla
K80K40K20XK20
コア
プロセス
GK210×2
28nm
GK110B
28nm
GK110
28nm
SMX数13×2151413
CUDA core数2496×2288026882496
コア周波数Base562MHz745MHz732MHz706MHz
Boost875MHz810MHz,
875MHz
搭載メモリGDDR5
12GB×2
GDDR5
12GB
GDDR5
6GB
GDDR5
5GB
メモリ周波数1250MHz
(5000MHz)
1500MHz
(6000MHz)
1300MHz
(5200MHz)
1300MHz
(5200MHz)
メモリインターフェース384-bit×2384-bit384-bit320-bit
演算
性能
単精度8.74TFlops4.29TFlops3.95TFlops3.52TFlops
倍精度2.91TFlops1.43TFlops1.31TFlops1.17TFlops
TDP300W235W235W225W


The Tech ReportやAnandTechで指摘されていますが、Tesla K80のBase周波数は562MHzと他のGK110搭載Teslaより低く抑えられています。Boost周波数はTesla K40のそれと同等となります。上記の演算性能はBoost時のものとなります。
Tesla K80のGPUコアはGK210で、GK110と比較するとSMXあたりのキャッシュとレジスタファイルサイズが倍増されています。しかし基本となるアーキテクチャは“Kepler”でこの点は他のTesla K seriesと変わりはありません。


コメント
この記事へのコメント
146188 
NVIDIAの優先順位はゲフォ>tesla>Quadroなんだろうか
2014/11/18(Tue) 18:21 | URL | LGA774 #-[ 編集]
146198 
146188>
危ない橋>安定的に多数>業務用少数、、、じゃね?
2014/11/19(Wed) 01:59 | URL | 木津健介 #-[ 編集]
146204 
優先順位じゃなくてシステムの安定性を考慮しなきゃいけないからリリースが遅れるだけ。
色んなソフトウェアでの動作保証もしなきゃだし
2014/11/19(Wed) 07:41 | URL | LGA774 #-[ 編集]
146232 
略してTK-80
2014/11/20(Thu) 22:53 | URL | LGA774 #-[ 編集]
146272 
K40を2枚差した方が速くて安くて実績があるので、しばらくはそっちだな。
2014/11/26(Wed) 18:04 | URL | LGA774 #-[ 編集]
コメントを投稿する(投稿されたコメントは承認後表示されます)
URL:
Comment:
Pass:
秘密: 管理者にだけ表示を許可する
 
トラックバック
この記事のトラックバックURL
https://northwood.blog.fc2.com/tb.php/7847-ebc694e7
この記事にトラックバックする(FC2ブログユーザー)
この記事へのトラックバック