北森瓦版 - Northwood Blog (Author : 北森八雲. Since July 10, 2006.)
The AMD Vega GPU Architecture Teaser: Higher IPC, Tiling, & More, Coming in H1’2017(AnandTech)
The curtain comes up on AMD's Vega architecture(The Tech Report)
AMD boasts of Vega NCU improvement claims(bit-tech.net)
Exclusive: AMD VEGA Presentation(VideoCardz)
VEGA architecture(VideoCardz)
AMD VEGA GPU pictured, features two HBM2 stacks(VideoCardz)
AMDが次世代GPUアーキテクチャ「Vega」の概要を明らかに(Impress PC Watch)
西川善司の3DGE:AMD,次世代GPU「Vega」における4つの技術ポイントを公開。HBM2はキャッシュで使う!?(4Gamer.net)

AMDはCES 2017で次世代GPUアーキテクチャとなる“Vega”の概要を明らかにした。

実際に“Vega”のパッケージを掲げて説明がされています。パッケージは大型のチップが1つと小型のチップ2つで合計3つのチップが搭載されたものです。このうち大型のチップが“Vega” GPU本体で、小型のチップ2つはHBM 2メモリのstackとなります。HBM 2メモリ1 stackの容量は最大8GBで2つのstackの場合は最大16GBとなります。“Vega”本体のサイズは520~540mm2と推測されています。
 
HBM 2に話を戻すとこれに対してAMDは従来の“VRAM”ではなく“high-bandwidth cache”という言葉を用いています。VideoCardzにはプレゼンテーションに使用されたであろうスライドが多数掲載されています。

その中に“Vega”のブロックとともに“Introducing the world's most scalable GPU memory architecture”と題されたものがあります。そしてそこに“High-Bandwidth Cache”という言葉が登場します。ブロック時ではパッケージの中の右下に描かれています。こればHBM 2となるようです。HBM 2は(“Fiji”で使用されたHBM 1と比較し)pinあたり2倍の帯域とstackあたり8倍の容量を持つと説明されています。“High-Bandwidth Cache”としてHBM 2が使用されることは確かですが、さらに興味深いのは続く“High-Bandwidth Cache Controller (HBCC)”で、“High-Bandwidth Cache”の上に描かれている小さなチップがこれに相当します。そしてこの“High-Bandwidth Cache Controller (HBCC)”からパッケージの外にバスが伸びており、System DRAMやNetwork Storage、NVRAM(不揮発メモリ)につながっています。解説記事によるとこの“High-Bandwidth Cache Controller (HBCC)”がGPUパッケージの外のメモリアクセスとGPUに対する仮想アドレス空間の提供をになうとしています。仮想アドレス空間は512TBとなります(つまりGPUパッケージ内のHBM 2に加え、GPUの外のメモリを直接扱っているように出来る仕組みを実現するのがHBCCの役割だろうか)。

HBCCの上のブロックはL2 cacheでそこからL1 cacheとGeometry Pipeline, Compute Engine, Pixel Engineがつながっています(つまり“Vega”のキャッシュ・メモリ階層はL1 cache, L2 cache High-Bandwidth Cache (=HBM 2), HBCCを介してアクセスする外部メモリの4層立てとなる?)。

続いてGeometry Pipelineですが“New Programable Geometry Pipeline”と題されています。新たにPrimitive Shaderが導入され、これによりピーク時で周波数当たり2倍以上のスループットを実現する模様です。

Compute Engineも“Next-Generation Compute Engine”と呼ばれるものになります。最近のGPUのトレンドに沿い、2-wayの16-bit SIMD演算と4-way 8-bit SIMD演算が導入され、16-bit, 8-bitのスループットを高めています(“Vega NCU”と題されたスライドに 128 32-bit ops per clock, 256 16-bit ops per clock, 512 8-bit ops per clockと具体的な数字が示されている)。Radeon Instinct MI25の発表時にも16-bit演算能力が高められたことが強調されており、今回はそれが確認された形となるでしょうか。

今回の“Vega”のアーキテクチャ紹介は膨大であり、ここでは紹介しきれない点も多数あります。詳しくは日本語の解説記事をご参照ください。

AMD VEGA 10 and VEGA 20 slides revealed(VideoCardz)

最後に“Vega”のスペックやその後のロードマップがスライドに掲載されています。

まず“Vega 10”ですが、2017年上半期予定となります。製造プロセスは14nm、第9世代のGFXアーキテクチャとなり、64基のCompute unitを搭載するとあります。HBM 2を2 stack搭載し、この帯域は512GB/sとなります。対応インターフェースはPCI-Express 3.0 x16、電力は225Wとなるようです。
続いて“Vega 10”のDual-GPUカードが2017年下半期に予定されています。スペックは“Vega 10”をそのまま2倍したものとなりますが、電力は300Wで収まるようです。

2018下半期には“Vega 20”が予定されているようです。これは第9世代のGFXアーキテクチャでCompute unit数64と、この部分だけ見ると”Vega 10”と変わらないものの、製造プロセスは7nmとなり微細化されます。これに伴ってか電力も150~300Wと幅のある数字となっています。メモリは4 stackのHBM 2により容量16~32GB、帯域は1TB/sを確保するようです。インターフェースはPCI-Express 4.0 x16となっています。

さらにその先の2019年には”Navi”が予定されている模様です(HPC向けの倍精度浮動小数点演算用途は”Vega”が続投するよう)。”Navi”については細かいスペックは伝えられていませんが、スライドの通りのロードマップであるならば”Polaris 10/11”は2017年に”Vega 11”で置き換えられ、2019年は”Navi 11”が担うことになります(示されているロードマップはあくまでもProfessional / Server向けで、この流れはUltrascale instance Float16/Single の枠のものである)。


パソコン工房のお得なキャンペーン



コメント
この記事へのコメント
154631 
HBM2の供給量が少ないせいでしょうけど随分先の話ですね
GDDR系のVEGA11だけ先に出てくるんでしょうか
キャンセルされたのかもしれないけど謎生物だったRX490は
下半期まで弾がないのでやむをえずの繋ぎだのか
2017/01/07(Sat) 10:09 | URL | LGA774 #-[ 編集]
154633 
dGPUの規模と性能を引き上げることで、APU単体のヘテロジニアスからの脱却とM/Bに刺さるdGPUも含めたHSAってのを2015年の半ばに言ってたけど、Vegaがある種の到達点って事か。Fijiは巨大なチップにとりあえず乗っけてみたって感じの試作品レベルだったけど、膨大なデータを捌くにはもっと内部から改革をってことでキャッシュにHBM2持ち込んだのだろうか。

でもNaviじゃなくVegaの方をHPCで継投って事はハイエンドを好むゲーマー(笑)はNaviの方が期待できるのかもね。でもZenも出るし買うしかないじゃないか
2017/01/07(Sat) 12:48 | URL | LGA774 #-[ 編集]
154634 
本当にまったく新しい石になっていたのか
それをzenと同時にやるとか相変わらず攻めてるな…
2017/01/07(Sat) 18:18 | URL | LGA774 #-[ 編集]
154640 
面白いものを持ってきたね
階層メモリの制御に自信があるんだろう
この辺りは自前でシステム丸ごと作ってるAMDの強みなんだろうな
どんな性能を発揮するか予測するのが難しいが演算プロセッサとして「今までやれなかったこと」ができるというのは漠然と感じる
深層学習やVRの新しい波に見事に乗ってる感が凄い
今年のAMDは面白いなあ
2017/01/08(Sun) 23:52 | URL | LGA774 #Hxirk5jw[ 編集]
154645 
AMDは定期的に面白いことやってくれるから期待感はあるけど
(AMD64とかBulldozerとか)
今回はどっちに転ぶかねぇ
2017/01/09(Mon) 12:31 | URL | LGA774 #5VDlvI1w[ 編集]
154655 
自分の気になることは
下位までこのアーキテクチャが
使えるんだろうかということ
例えばBristol RidgeだとPCIE3.0x8がネックだろうしZenやKaby Lakeだって
Crossfire構成ならPCIE3.0x8になるので転送帯域が半減してしまう
HBM2もこれ以上減らすと最大4GB 256GB/sと
256BitGDDR5-8000と大差ないので
旨みが薄い
無論メモリコントローラーの設計を変更すればGDDR5/DDR4とかでも
以来のHyperMemory的な使い方はできてコスト削減には有効なんだろうけど
2017/01/10(Tue) 02:09 | URL | LGA774 #-[ 編集]
コメントを投稿する(投稿されたコメントは承認後表示されます)
トラックバック
この記事のトラックバックURL
https://northwood.blog.fc2.com/tb.php/8798-edfe1f2d
この記事にトラックバックする(FC2ブログユーザー)
この記事へのトラックバック