北森瓦版 - Northwood Blog (Author : 北森八雲. Since July 10, 2006.)
Intel 5th Gen Xeon “Emerald Rapids” CPUs Detailed: Up To 40% Faster Than Sapphire Rapids, Die-Shot Pictured(WCCF Tech)
#Intel "Data Centric Processor Roadmap" with #EmeraldRapids / 5th Gen #Xeon Scalable:(InstLatX64@InstLatX64)
午前0:23 · 2023年11月29日(188号@momomo_us)

“Emerald Rapids”に関する情報がTwitterに投稿されている。
今回の情報元はInstLatX64氏と188号@momomo_us氏である。まずInstLatX64氏であるが、Intelのスライド資料を掲載しており、そこに“Emerald Rapids”の特徴が記されている。

5th Gen Intel Xeon Scalable processors deliverというスライドには“Emerald Rapids”の機能・特徴が4項目に分けて記載されている。
 
◇Growth with workload-optimized performance
  ・Performance-per-wattの向上
  ・より多いコア数(最大64-core)
  ・大容量化したL3 cache(最大320MB)
  ・Compute Express Link Type 1, 2, 3への対応
  ・Intel Ultra Path Interconnect (UPI) 速度の向上
  ・80本のPCI-Express 5.0レーン
  ・Intel Accelerator Engine
  ・対応メモリ速度の向上

この項目は主に性能に関する事柄だ。最大64-coreとなること、XCCダイではL3 cacheが5MB/coreに大容量化され、最大320MBとなることが記されている。また具体的な数字は出ていないがUPIリンク速度の向上と、対応するDDR5メモリの速度の向上もある。

◇Bringing AI Everywhere
  ・AI accelerator―Intel Advanced Matrix Engine (AMX) を全コアに搭載
  ・オープンソースフレームワーク・ツールに最適化したIntel AI software suite

この項目は現在はやりのAI機能に関するもの。Intel AMXは“Sapphire Rapids”から搭載されており、書かれている事柄を見る限りでは“Emerald Rapids”でそれほど大きな変化はなさそうに見える。

3項目目はあまり見るところはない。4項目目はセキュリティ機能に関する事柄で、Intel SGXとIntel TDXが挙げられている。Intel TDXは“Emerald Rapids”世代から広く提供されるもののようだ。

インテル(R) Xeon(R) プロセッサーはどのような インテル(R) Trust Domain Extensions をサポートしていますか (インテル(R) TDX)(Intel)

性能向上幅については“Achieve perfomance gains with 5th Gen Intel(R) Xeon(R) CPUs”というスライドに記されている。またAccelerator Engineが関わる性能向上については次の“Achieve Real-Workload Performance Gains with Intel(R) Accelerator Engines”というスライドにある。
ここでは前者について取り上げる。比較はXeon Platinum 8592+ (64-core) とXeon Platinum 8480+ (56-core) で行われている。

  Web (Severe-side Java):1.2× higher Java Throughput
  HPC (LAMMPS - Copper):1.3× higher performance
  Media (Transcode (FFMPEG)):1.2× aggregate FPS



188号@momomo_us氏は“Emerald Rapids”のラインナップを投稿している。以下の通りである。

◇Xeon Platinum 8500(Emerald Rapids / Intel 7 / LGA4677 / 8ch DDR5)
  8593Q 64-core 2.20GHz L3=320MB
  8593 64-core 1.90GHz L3=320MB
  8592V 64-core 2.00GHz L3=320MB
  8581V 60-core 2.00GHz L3=300MB
  8580 60-core 2.00GHz L3=300MB
  8571N 56-core 2.40GHz L3=300MB
  8570 56-core 2.10GHz L3=300MB
  8568Y 48-core 2.30GHz L3=300MB
  8562Y up to 12-core 2.80GHz L3=60MB
  8558 52-core 2.10GHz L3=260MB
  8558P 52-core 2.70GHz L3=260MB
  8558U 52-core 2.00GHz L3=260MB

◇Xeon Gold 6500/5500(Emerald Rapids / Intel 7 / LGA4677 / 8ch DDR5)
  6558Q up to 32-core 3.20GHz L3=60MB
  6554S 36-core 2.20GHz L3=180MB
  6548Y up to 32-core 2.50GHz L3=60MB
  6548N up to 32-core 2.80GHz L3=60MB
  6544Y up to 24-core 3.60GHz L3=45MB
  6542Y up to 32-core 2.90GHz L3=60MB
  6538Y up to 32-core 2.20GHz L3=60MB
  6538N up to 32-core 2.10GHz L3=60MB
  6534 up to 12-core 3.90GHz L3=22.5MB
  6530 32-core 2.10GHz L3=160MB
  6526Y up to 20-core 2.80GHz L3=37.5MB
  5520 up to 28-core 2.20GHz L3=52.5MB
  5515 up to 12-core 3.20GHz L3=22.5MB
  5512U up to 28-core 2.20GHz L3=52.5MB

◇Xeon Silver 4500(Emerald Rapids / Intel 7 / LGA4677 / 8ch DDR5)
  4516Y up to 24-core 2.20GHz L3=45MB
  4514Y up to 16-core 2.00GHz L3=30MB

“Emerald Rapids”はXCCダイとMCCダイの区別がつきやすい。XCCダイはL3=5MB/coreの大容量なので3桁MBのL3 cacheを搭載するものがXCCダイ、L3 cacheが2桁MBにとどまるものはMCCダイである(おそらく例外はXeon Platinum 8462Y)。
XCCダイのモデルについては過去にもコア数を含むスペックが掲載されたこともあり、今回の情報に過去の情報から得たコア数の情報も追加している。MCCダイのモデルについては今回が初出である。コア数に関する記載はないが、MCCダイのL3 cacheは1.875MB/coreであるため、とりうる最大コア数を推定することが出来るので、up to~の形で付記している。なお、あくまでもL3 cache容量から推定した取り得る最大コア数であるため、実際にはコア数がより少ない場合もあり得ることに注意して欲しい(例えばXeon Gold 6542Yは周波数が高いため、少コア数のモデルの可能性が高い)。

MCCダイと推定されるモデルは最大32-coreまでがラインナップされるようだ。1.875MB/coreのL3 cache容量も合わせると、見かけはほとんど“Sapphire Rapids”のMCCダイの製品と変わらない。もしかするとメモリ速度やQPIの速度を上げただけで、ダイ自体は“Sapphire Rapids”のMCCダイのStepping change程度のものかもしれない。
関連記事



○Amazon売れ筋ランキング CPU メモリ グラフィックカード マザーボード SSD 電源

コメント
この記事へのコメント
198390 
【XCC】
❧両端にI/Oブロック、真ん中にコア+メモコンの配置はGNRと同じで、GNRの分割方法への遷移過程の一つであるように見える。
❧1.2-1.3倍の性能向上は、ほぼコア数とキャッシュの増分で説明できるが、注釈によると同TDPなので、ソケット単位でワッパが20%ほど向上している。これはMilan (Zen3世代)と同程度。
❧ワッパ向上分はRPL用のIntel 7+への変更で説明できる(同コア同電力クロック+10%、同コア同クロック電力-20%)
❧歩留まりは向上している模様:
 SPRのコア数別SKU数は 60c=1, 56c=2, 52c=4, 48c=4
 EMRのそれは最低限 64c=4, 60c=2, 56c=2, 41c=4
❧AMX使用時AI性能がSPR比1.4倍は多分キャッシュ増が効きやすいだけ。そもそもGPUを使う分野なので需要の程度はわからない
❧QATの2.4倍、DSAの1.7倍、IAAの1.3倍は、有効時/無効時の比較で対SPRではない。中程度の汎用性の特殊機能という意味ではMilan-Xのような立場で、ワッパで追いつくSRF/GNR世代以降効きそう

【MCC】
❧6426Y(2.5GHz)→6526Y(2.8), 6538Y+(2.0)→6538Y(2.2)等、下の桁が同じで同コア数と思われる型番で10%前後クロック引き上げ
❧同コア数同電力クロック+10%はほぼRPL用のIntel 7+の特徴を満たす。
2023/12/06(Wed) 13:08 | URL | LGA774 #-[ 編集]
198394 
前々から言われてたことだけど、HとMaxはSapphire続投か
Granite Rapidsの登場時期次第で2年選手になりそうだ
2023/12/06(Wed) 22:54 | URL | LGA774 #-[ 編集]
コメントを投稿する(投稿されたコメントは承認後表示されます)