北森瓦版 - Northwood Blog (Author : 北森八雲. Since July 10, 2006.)
NVIDIA Unveils Grace: A High-Performance Arm Server CPU For Use In Big AI Systems(AnandTech)
NVIDIA Announces Grace CPU for Giant AI and High Performance Computing Workloads(techPowerUp!)
NVIDIA announces GRACE CPU for Giant-Scale AI and HPC applications(VideoCardz)
NVIDIA releases its CPU, GPU and DPU datacenter 2020-2025 roadmap(VideoCardz)
NVIDIA、Arm採用で初のデータセンター向けCPU「Grace」(Impress PC Watch)
NVIDIA Announces CPU for Giant AI and High Performance Computing Workloads(NVIDIA)

NVIDIAはGTC 2020は4月12日、同社初のデータセンター向けのCPU―“Grace”を発表した。ARMをベースとしたProcessorで、複雑なAIおよびHPCワークロードにおいて、現時点で最高のサーバーに搭載されているProcessorの10倍の性能を有するに至る。
 
“Grace”のCPUのコア数や、そもそもArm v9なのかあるいはArm v8なのかもまだ不明であるが、現段階で明らかにされているのは高いメモリ帯域、高速なインターコネクト、そしてCPUそのものについては次世代のArmである“Neoverse”と呼ばれるコアを用いることである。

高いメモリ帯域はLPDDR5X (ECC) を用いることで実現し、500GB/s以上の帯域を有しながらも、10倍以上の電力効率を実現するとしている。そしてインターコネクトはNVLinkによりCPU・GPU間は900GB/s以上、CPU・CPU間は600GB/s以上を目指すとする。CPU・GPU間の接続にはCache cohrentも保たれるとしている。そしてCPU・GPUをメッシュ状に接続し、それぞれの“Grace”CPUからLPDDR5xが接続される図が別のスライドに掲載されている。

“Grace”CPUに用いられる“Neoverse”は次世代Armで、SPECrate2017_int_baseで300以上とだけ記されている。

“Grace”の登場は2023年を予定している。

ARM社の買収は今回はあまり触れられていないが、NVIDIAがARM社を買収したことにより、今までより密接に連携がとれるようになり、NVIDIAによるArm CPUの開発は加速しそうである。ロードマップについても2023年の“Grace”に続き、2025~2026年頃にその次が予定されている。製品ソリューションとしてはArmだけでなくx86向けのものも顧客の要求に応じてやっていくそうではあるが、Arm偏重は強まりそうである。

Parker (Denver 2) は2016年、その次のXavierに載せられているCarmelが2018年とAnandTechにある。これまではどちらかというと組み込み向けであったが、今回の“Grace”は明らかに毛色が異なり、HPC向けを意識している(Impress PC Watchによるとスイスと米国のスーパーコンピュータへの採用が決定している模様)。あるいはその強力なインターコネクトですさまじいまでのスケーラビリティを確保し、組み込み向けからHPC向けまでを狙うつもりだろうか?
この場合、1つか2つのユニットであれば普通の家の電気でも悠々動かせるものになるので、Xavierを載せた開発向けボードが一時期秋葉原で出回ったように、“Grace”を載せた開発向けボードなんてものも出てくるのかもしれない(扱うのはなかなか難しそうだが)。



コメント
この記事へのコメント
180920 
>NVIDIAによるArm CPUの開発は加速しそう
ただNVIDIAの開発するARMはHPC以外には使いどころがなさそう
少なくともGraceはスマホはおろかPC向きでもないように見える

AMDなりIntelなりが作れば似たようなことをx64でやるだろうね
2021/04/13(Tue) 22:47 | URL | LGA774 #-[ 編集]
180923 
こいつに対抗するにはもはやPS5に超広帯域
インターコネクトを載せるしかっ…(錯乱)
2021/04/13(Tue) 23:40 | URL | LGA774 #-[ 編集]
180924 
よくあるスパコンで話題を稼いでHPCで利益を稼ぎたい作戦ですかねえ
2021/04/13(Tue) 23:47 | URL | LGA774 #-[ 編集]
180926 
スパコンは数が出ないので利益率高くても言うほど儲からないけど、HPCなら世界中に点在する自称プロの心を鷲掴みして数年分の利益確保もウハウハですね
2021/04/13(Tue) 23:51 | URL | LGA774 #-[ 編集]
180929 
Hopperは次世代GeForceのコードネームと呼ばれていましたが、ファーストネームのGraceがこっちに使われたらGraceとセットにするHPC用GPUの可能性も出てきましたね。
x64はNVLinkを統合できないので、ArmでNVLink統合してGPUとのレイテンシを減らしたいという思惑が強そうです。
2021/04/14(Wed) 00:04 | URL | LGA774 #-[ 編集]
180931 
スパコンとハイパフォーマンスコンピューティングはどう違うんだ?
後者の方が広いカテゴリ?
2021/04/14(Wed) 00:14 | URL | LGA774 #-[ 編集]
180938 
APUもDIMMじゃなくてLPDDRにすればもっと性能上げられそう
というかそれをやってるのがPS5やXboxだよね
最適な設計にするにはモジュール形式の自作は将来的に諦めるしかないのか
2021/04/14(Wed) 04:02 | URL | LGA774 #-[ 編集]
180939 
ARMは、性能面ではAWS Gravitonなどにより、既にXeonと同程度の性能を出せることはわかっている(電力効率は圧倒的に上)。
ただ、そういうものは自社向けばかりで、他社が簡単に製品を調達できなかった。
そこにNVIDIAが製品を供給する…
という流れ。

ちなみに、データセンター向けCPUでシェア9割のintelは、利益の大部分をここから出しているので、決して「小さな市場」ではない。
2021/04/14(Wed) 06:09 | URL | LGA774 #-[ 編集]
180943 
>180929
なんかマツモトキヨシみたいなネーミングセンスだな

要するにマルチプロセッサでユニファイドメモリやろうってことかな
2021/04/14(Wed) 08:32 | URL | LGA774 #-[ 編集]
180944 
>AMDなりIntelなりが作れば似たようなことをx64でやるだろうね

x86/x64の強みは鬼互換性だから、
用途が決まってる=都度開発でヨシとするスパコンとは相性が悪いと思う。
2021/04/14(Wed) 09:08 | URL |   #-[ 編集]
180954 
GPUとCPU内のAIアクセラレーション、そのメモリ構成こそが肝心で
CPUアーキテクチャはx64だろうがARMだろうが、何ならPOWERでも良さそう。

2010年代にCPU+GPUのシステムがCPUだけのシステムに取って代わったように
こんなシステムが次世代HPCのトレンドになるかもしれないね。
たぶんこっちのほうがCPUとGPUの良いとこ取りで汎用性は高いはず。
2021/04/14(Wed) 21:29 | URL | LGA774 #-[ 編集]
181001 
あー、これが次世代Switchなのか(嘘)
2021/04/16(Fri) 10:41 | URL | LGA774 #-[ 編集]
181030 
同じメモリ上のデータを処理するのにCPUもGPUもあります、って上手くいけば
ラーメン(メモリ)を食べるのに箸(CPU)とレンゲ(GPU)みたいに使い分けできるけど
下手したら箸とフォークとか、ストローとレンゲみたいにもなりうるか。
2021/04/17(Sat) 09:48 | URL | LGA774 #-[ 編集]
コメントを投稿する(投稿されたコメントは承認後表示されます)