午前11:14 · 2023年3月26日(Yuuki_AnS@yuuki_ans)
午後2:41 · 2023年3月26日(@harukaze5719)
サーバー向けプラットフォームのリーク情報ではおなじみとなりつつあるYuuKi_AnS氏であるが、3月26日のツイートで“Granite Rapids”と“Sierra Forest”のプラットフォームに関する資料を紹介している。
ただし、同氏も指摘しているとおり、この資料はやや古いものの可能性があり、資料が作られた後に何かしらの変更が加わっている可能性は十分にあることは注意したい。
午後2:41 · 2023年3月26日(@harukaze5719)
サーバー向けプラットフォームのリーク情報ではおなじみとなりつつあるYuuKi_AnS氏であるが、3月26日のツイートで“Granite Rapids”と“Sierra Forest”のプラットフォームに関する資料を紹介している。
ただし、同氏も指摘しているとおり、この資料はやや古いものの可能性があり、資料が作られた後に何かしらの変更が加わっている可能性は十分にあることは注意したい。
Maybe some old documents,
— 结城安穗-YuuKi_AnS🍥 (@yuuki_ans) March 26, 2023
please refer to the actual production. pic.twitter.com/jAwXxh81fT
“Granite Rapids”と“Sierra Forest”が使用するプラットフォームは“Birch Stream”と呼ばれる。ちなみに“Sapphire Rapids”と“Emerald Rapids”のプラットフォームは“Eagle Stream”であり、今後サーバー向けのプラットフォームの名は“~Stream”となるのかもしれない。
そして今回の情報において最も重要な点が、“Birch Stream”には“Birch Stream-SP”と“Birch Stream-AP”の規模の異なる2種類のプラットフォームが存在することだ。
“Birch Stream-SP”に対応するCPUが“Granite Rapids-SP”、“Birch Stream-AP”に対応するCPUが“Granite Rapids-AP”となる。“-AP”の方がより規模が大きく、話題となっている超巨大SocketであるLGA7529を用いるのは“Birch Stream-AP”だ。メモリコントローラは12ch DDR5に対応、PCI-Express 5.0は96本/socketである。
一方、“Birch Stream-SP”は現行の“Sapphire Rapids”とよく似ており、SocketはLGA4677(※)、メモリコントローラは8ch DDR5に対応、PCI-Express 5.0は88本/socketである。
※ただし、“Sapphire Rapids”のLGA4677とは後述の理由で互換性はないと推定される。
Birch Stream-SP | Birch Stream-AP | |
CPU | Granite Rapids-SP up to 80-core, Redwood Cove | Granite Rapids-AP up to 120-core, Redwood Cove |
Socket, TDP | Socket E2 (LGA4677), up to 350W | Socket BR (LGA7529), up to 500W |
Scalability | 1S, 2S, 4S, 8S | 1S, 2S |
Accelerators | Next-Gen QAT, DLB, DSA, IAX, 5GISA, BFloat16, AMX-FP16 | |
Memory | 8ch DDR5 6400MT/s 1DPC / 5200MT/s 2DPC | 12ch DDR5 6400MT/s 1DPC / 5200MT/s 2DPC |
UPI 2.0 | up to 4 links/CPU (x24 width) 16, 20, 24GTs | up to 6 links/CPU (x24 width) 16, 20, 24GT/s |
PCI-Express | PCI-Express 5.0 ×88 lanes/CPU 56 lanes north / 32 lanes sough of socket | PCI-Express 5.0 ×96 lanes/CPU 64 lanes north / 32 lanes sough of socket |
CXL | CXL 2.0 ×64 lanes/CPU |
◇“Granite Rapids”の構造
過去にMoore's Law Is Deadでも紹介されている(というよりMoore's Law Is Deadもこの資料を参考にした可能性がありそう?)。
“Granite Rapids”はMulti tileとなり、Compute DieがIntel 7nm、I/O dieがIntel 10nmとなっている。このプロセス表記は古いものであり、現在の呼称に直すと、Compute DieはIntel 4またはIntel 3、I/O dieはIntel 7となる。この表記揺れのあたりもこの資料がやや古いものであることを示している。
Intel 7で製造されるI/O dieは“Granite Rapids-SP / -AP”そして“Sierra Forest”で共通である。そしてI/O dieは2ダイが“Birch Stream”プラットフォーム対応製品全てに共通して搭載される。前述のプラットフォームのPCI-Expressの項目にNorth, Southの記載があったが、この2つのダイのどちら側から出ているのかを示しているものと推定される。
“Birch Stream”プラットフォームにおいてはI/O dieを共通とし、Compute dieの種類や規模、個数を変えること多様なニーズに応えられるようにしている。
“Granite Rapids”のCompute dieは新しい情報を元にすればIntel 3で製造され、“Redwood Cove+”と呼ばれるコアを使用する。“Redwood Cove”は“Meteor Lake”のPerformance Coreであるが、これをIntel 3に移行させ、サーバー向けに改良したものが“Redwood Cove+”になるのだろう。ダイの種類としては2種類―Low Core Count (LCC) とHigh Core Count (HCC) のダイがある。その上にExtreme Core Count (XCC) とUltra Core Count (UCC) のダイがあるが、XCCはHCCのダイを2ダイ、UCCはHCCのダイを3ダイ使用したものである。LCC, HCC, XCCは“Granpite Rapids-SP”として用いられ、UCCは“Granite Rapids-AP”として用いられる。
◇“Sierra Forest”の構造
“Sierra Forest”は“Crestmont”と呼ばれるE-coreを多数搭載した製品である。資料では“Sierra Forest-SP”が示されており、Intel 3で製造されるCompute dieが1ダイと、“Granite Rapids”と共通のIntel 7で製造されるI/O dieが2ダイで構成される。
Compute dieを2ダイとした“Sierra Forest-AP”なんてものもありそうな雰囲気だが、今回の資料には“Sierra Forest-AP”に相当するものの記述はない。
◇“Granite Rapids”と“Sierra Forest”のコアの相違点
“Granite Rapids”がPerformace coreの系譜、“Sierra Forest”がEfficent Coreの系譜であることはご存じの通りである。前者はこれまでのXeon製品の正当進化形である。一方、後者はコア数をより増すことにより高いスループットとと良好な電力効率を実現したものとなる。
この2者は素性の異なるコアを使用しているため、その中身も少なからぬ違いがある。
まずAVX命令であるが“Granite Rapids”は当然AVX-512まで対応するが、“Sierra Forest”はAVX2止まりでAVX-512には対応しない。またHyper Threading technologyであるがこれも“Granite Rapids”は対応するが、“Sierra Forest”は対応しない。この2つは“Granite Rapids / Sierra Forest”のみならず元となっているコアを使用する“Meteor Lake”にも関係する。
つまり“Meteor Lake”のP-coreはAVX-512とHyper Threading technologyに対応するが、E-coreはこれまでと同様にAVX-512にもHyper Threading technologyにも対応しないことになる。AVX-512に関してはおそらく“Meteor Lake”全体としては対応しないという措置になるだろう。そして6 P-core + 8 E-coreの構成の場合、E-coreはHyper Threading technologyに対応しないのでコア・スレッド数は14-core/20-threadとなる。
この他、TSXやAMX/TMULが“Granite Rapids”に搭載されるが、“Sierra Forest”には搭載されないものとなる。一方で、いくつかのアクセラレータ―QAT, DSA, IAX, DLBは“Granite Rapids”と“Sierra Forest”がとも搭載するようだ。
◇その他、“Eagle Stream”との相違点など
“Birch Stream”と“Eagle Stream”の相違点はいろいろとあるものの、ここまで挙げていなかった項目の中で最も大きいものはPCH―チップセットの廃止だ。現行の“Sapphire Rapids”はXeon SPであればC741、Xeon WであればW790チップセットと組み合わされる。“Birch Stream”プラットフォームではチップセットが廃止され、基本的にI/OはProcessor側で用意される。第2世代以降のEPYCと同様の形だ。
“Birch Stream-SP”のSocketは見かけ上は“Eagle Stream”と同じLGA4677であるが、PCHの廃止が大きな相違点であり、両者に互換性がないであろうことを示している。“Eagle Stream”は現在の“Sapphire Rapids”とその次の“Emerald Rapids”までのプラットフォームになりそうだ。
ここまでかなりの量となったが、冒頭でも述べたとおりこの資料は若干古い資料である可能性がある。そのため、最終的な製品が出てくるまで変更がかかる可能性がある(MLIDなどの話を聞いていると、むしろ既に変更がかかってる節もある)。大枠からひっくり返ることはないと思いたいが、細かい点は変わってくる可能性があるということは留意すべきだろう。

この記事へのコメント
Granite Rapids+Sierra Forestは明確にMeteor Lake世代のXeonって分かるけど、その先はどうなるんだろう?
Arrow Lakeと同じLion Coveベースになるのか、それともLunar Lakeベースの新アーキテクチャになるのか
Arrow Lakeと同じLion Coveベースになるのか、それともLunar Lakeベースの新アーキテクチャになるのか
2023/03/27(Mon) 00:28 | URL | LGA774 #-[ 編集]