北森瓦版 - Northwood Blog (Author : 北森八雲. Since July 10, 2006.)
NVIDIA Launches World's First High-Speed GPU Interconnect(techPowerUp!)
Nvidia's Pascal to use stacked memory, proprietary NVLink interconnect(The Tech Report)
NVIDIA Refreshes GPU Roadmap and Announces Pascal(Guru3D)
NVIDIA Launches NVLINK - High-Speed GPU Interconnect(Guru3D)
NVIDIA Updates GPU Roadmap; Unveils Pascal Architecture For 2016(AnandTech)
NVIDIA Announces Pascal GPU Coming in 2016(Legit Reviews)
Nvidia reveals new ‘Pascal’ GPU at GTC 2014, shuffles roadmap(VR-Zone)
NVIDIA announces Pascal architecture(VideoCardz)
【基調講演レポート】次世代GPUのPascal、次期TegraのEristaなどを発表(Impress PC Watch)
[GTC 2014]NVIDIAの次世代GPUは2016年の「Pascal」。3次元メモリ技術で帯域幅は1TB/sに(4Gamer.net)

GPU Technology ConferenceのキーノートでNVIDIAのCEOであるJen-Husn Huang氏がGPU製品のロードマップのアップデートを行った。今回のアップデートの最大tのトピックは“Pascal”と呼ばれるGPUで、“Maxwell”の次の世代に位置するGPUである。
 
“Pascal”の第1の革新はStacked "3D" memoryが導入され、GPUにサブストレートにメモリが配置されることである。これにより従来のように基板上にDRAMを搭載するよりも遙かに広い帯域を得られる。

この部分だけ見るとNVIDIAが昨年のGTC 2013で“Maxwell”の次の世代として紹介した“Volta”によく似ている。“Volta”もまたオンパッケージのStacked memoryを特徴としていた。
“Volta”は今回のロードマップからは追いやられたが、おそらくは“Pascal”の次に登場し、GPUアーキテクチャにより劇的な変化がもたらされるのではないかと思われる。


NVIDIAは“Pascal”をStacked memoryとそのほかの革新によるアドバンテージを得るために今回挿入したと考えられる(そもそも“Volta”のリリース時期は明かされていないため、“Volta”が遅延したと言うことはできない)。“Pascal”のStream Multiprocessorは“Maxwell”の改良版になるとみられるが、それでもなお興味深い存在である。(“Pascal”で改善される)メモリ帯域は今までGPUの性能を縛ってきたものであり、サブストレートにDRAMを搭載することができれば、劇的な性能向上が見込まれるからである。

NVIDIAは“Project Pascal”の紹介の中で“Memory Bandwidth”と題されたグラフを提示した。このグラフはメモリ帯域に依存するSGEMM matrix multiplication testのスコアを示したものである。これによると“Pascal”は現行の“Kepler”の3倍、“Maxwell”の2倍近くのスコアを出している。この比較は同レベルの消費電力で行われており、“Pascal”がEnergy efficencyを順調に増していることもわかる。

現在のGPUメモリシステムと比較すると“Pascal”の3D memoryは「数倍」の帯域を有するとHuang氏は主張し、容量は2.5倍、電力効率は4倍になるとした。“Pascal”のGPU自体は3D stackingには関わらず、同じパッケージ内で(GPUの周囲に)積層されたDRAMが配置される。“Pascal”のテストモジュールの写真ではGPUチップのそばに積層されたDRAMが配置されている様子がよくわかる。

もう1つの“Pascal”の新機能は独自のチップ間インターコネクトであるNVLinkである。このインターコネクトはPCI-Express 3.0よりも高い帯域を有し、電力効率にも優れるという。ただ、いろいろな見方をしてもNVLinkはPCI-Expressと非常に良くている。NVLinkは内蔵クロックを有するディファレンシャルシグナリングを使用しており、またDMA+を含むPCI-Expressのプログラミングモデルをサポートする。そのため、ドライバのサポートは用意である。NVIDIAはこのNVLinkをGPU同士の接続、あるいはGPUとCPUの接続に用いようとしている。そして第2世代のNVLinkは複数のチップ間でキャッシュコヒーレンシを保つようになるだろう。

NVLinkはPCI-Expressの5~12倍の帯域を有するとHuang氏は主張する。NVLinkは接続のブロックあるいは“brick”ごとに8本のレーンを有する。それぞれのレーンは20Gbpsでデータの転送が可能で、1つの“brick”の帯域は20GB/sとなる。PCI-Express 3.0はレーンあたり8Gbpsで、x8レーンでは8GB/sである。現在策定中のPCI-Express 4.0でもこの2倍にとどまる。

GTC 2014でNVIDIAのGPUロードマップが更新され、“Maxwell”の次の世代のGPUとして2016年に“Pascal”が予定されていることが明らかになりました。昨年のGTCではこの位置に“Volta”がありましたが、今回のロードマップでは“Volta”は姿を消しており、これがどうなったのかは不明です(The Tech Reportでは後ろにずらされたと考えているよう)。“Pascal”の特徴として示されたのはより広い帯域を得るための3D Stacked memoryと高速インターコネクトであるNVLinkで、後者はGPU同士のみならずGPUとCPUの接続にも用いることができるものとなります。

Tegraのロードマップもアップデートされており、Tegra K1の次の世代のチップとして“Maxwell”をGPUとして統合する“Erista”が示されました。昨年はここに“Parker”がありましたが、これも今回のロードマップでは示されず、どうなったのかは不明です。

パソコン工房のお得なキャンペーン



コメント
この記事へのコメント
143293 
DX12対応で遅延してるのかな
2014/03/27(Thu) 03:08 | URL | LGA774 #-[ 編集]
143295 
Pascalでの変化が大きすぎてMaxwellが本格的に出る前なのに楽しみで仕方ないんですが、2016年とは結構待たないといけないな
2014/03/27(Thu) 09:36 | URL | LGA774 #-[ 編集]
143297 
DX12はこれまでと違ってAPIの変更だからDX12対応という作業はないんじゃないのかな?
2014/03/27(Thu) 10:01 | URL | LGA774 #382VQomQ[ 編集]
143299 
stacked memoryが3D memoryに改めてられ(多分)、VoltaはPascalに統合されるって話じゃなかった?
2014/03/27(Thu) 17:49 | URL | LGA774 #-[ 編集]
143302 
コードネームだから変化があったところでユーザには関係ないやね
スタックメモリはコストがかかってハイエンドのみになるだろうからこっちも大半のユーザーには関係なし
2014/03/27(Thu) 23:14 | URL | LGA774 #-[ 編集]
143306 
NVは情報を出すのが早すぎる感じがするんだよなぁ。
2014/03/28(Fri) 10:10 | URL | LGA774 #-[ 編集]
143307 
Maxwellの立場は…
2014/03/28(Fri) 21:40 | URL | LGA774 #-[ 編集]
143309 
エクサスケールプロジェクトの受注がIntelになるのかNvidiaになるのかの決定が今年だから
2018年の"Echelon"へ向けた開発が順調なことをアピールしないといかんのよ。
2014/03/29(Sat) 00:24 | URL | LGA774 #-[ 編集]
143310 
CPUもこういうメモリで高速化して欲しいな。
2014/03/29(Sat) 00:57 | URL | LGA774 #-[ 編集]
143315 
※143310
L3メモリ復活ですね? わかります。
2014/03/29(Sat) 23:01 | URL | LGA774 #-[ 編集]
143320 
2014/03/30(Sun) 11:40 | URL | LGA774 #17ClnxRY[ 編集]
コメントを投稿する(投稿されたコメントは承認後表示されます)
トラックバック
この記事のトラックバックURL
https://northwood.blog.fc2.com/tb.php/7467-e20bba43
この記事にトラックバックする(FC2ブログユーザー)
この記事へのトラックバック