AMD Instinct MI200 with MCM Aldebaran GPU might feature 110 Compute Units(VideoCardz)
Aldebaran/MI200 は 110CU か?(Coelancath's Dream)
[Tuning] rocm 4.4 update for release branch #1132 (ROCm Github)
Coelancath's DreamがGithubにCDNA2世代の“Aldebaran”をベースとするAMDの次世代Accelerator―Instinct MI200のCompute Unit数が110基になることを示す記述を発見した。
“Aldebaran”を示すコードはGFX90Aである。そして当該コードにはInstinct MI60がGFX906_60、Instinct MI100がGFX908_120と記載されている。そしてInstinuct MI200に相当するコードはGFX90A_110となっている。
Aldebaran/MI200 は 110CU か?(Coelancath's Dream)
[Tuning] rocm 4.4 update for release branch #1132 (ROCm Github)
Coelancath's DreamがGithubにCDNA2世代の“Aldebaran”をベースとするAMDの次世代Accelerator―Instinct MI200のCompute Unit数が110基になることを示す記述を発見した。
“Aldebaran”を示すコードはGFX90Aである。そして当該コードにはInstinct MI60がGFX906_60、Instinct MI100がGFX908_120と記載されている。そしてInstinuct MI200に相当するコードはGFX90A_110となっている。

Instinct MI100のCompute Unit数は120基なので、その次の世代となるInstinct MI200のCompute Unit数がそれよりも少ない110基となるのは一見奇妙に見える。ましてはInstinct MI200は2つのGPUダイを使用したMulti-Chip-Module設計であり、なおのことCompute Unit数の減少はなおのこと奇異に感じる人もいるだろう。
ただ、Instinct MI200のベースとなるCDNA2については公式からはほとんど情報が出ておらず、その内部構造もわかっていない。
Coelancath's DreamがおそらくInstinct MI200に関する情報を最もよく集めている。その中でも以下の項目が目を引く。
・Fullrate FP64演算に対応。FP32 Packed実行に対応
・Shader Engineあたり14 CUの構成を取る
Instinct MI100 (CDNA1) ではFP64の性能はFP32の半分だったので、Instinct MI200 (CDNA2) でFullrate FP64に対応するならば、CDNA2で内部構造の大幅な変化が推測される。Instinct MI200は2ダイ構成なので1ダイのCompute Unit数は55 CUとなる。Shader Engineあたり14 CUのくだりからはなんとなく1ダイあたりに4 Shader Engine = 56 CUの構成になりそうな雰囲気を感じるが、文字通り「なんとなく」以上のものではない。Coelancath's Dreamでは1ダイあたり5 Shader Engine = 70 CUとして冗長性を高めている可能性を指摘している。
なお、Instinct MI200はI/O dieに相当するダイがメモリコントローラを有するのではなく、2つのGPUダイが4基のメモリコントローラを搭載する。どちらかというと“Naples”(これは4ダイであるが、それぞれのダイがメモリコントローラ・I/Oを有する)に近い構成となるようである。

≪ASRockのIntel 600 seriesチップセット搭載マザーボードのラインナップ
| ホーム |
GeForce RTX 40 series―“Ada Lovelace”はTSMC N5を使用するらしい≫