AMD EPYC Bergamo CPU Die Detailed: 16 Zen 4C “Vindhya” Cores Per CCD & 35% Smaller Core Area(WCCF Tech)
Zen 4c: AMD’s Response to Hyperscale ARM & Intel Atom(Semianalysis)
“Bergamo”は最大128-coreの高性能86 CPUで、クラウド向けに焦点を置いて開発されたコアである。“Bergamo”の土台となるのが“Zen 4c”である。“Zen 4c”は“Zen 4”の派生アーキテクチャで、より多くのコアを1つのSocketに搭載できるようにしたものである。しかし、“Zen 4c”に関する情報は少なかった。Ryzen 7000 seriesのkeynoteではAMDのCTOであるMark Papermaster氏が以下のように説明していた。
“Zen 4c”はコンパクトで高密度なコアで、AMDのコアロードマップのもう1つの流れである。“Zen 4c”は“Zen 4”と同じ機能を、概ね半分のcore areaで実現する。
以下は“Zen 4”と“Zen 4c”のスペックをSemianalysisがまとめた表である。
Zen 4c: AMD’s Response to Hyperscale ARM & Intel Atom(Semianalysis)
“Bergamo”は最大128-coreの高性能86 CPUで、クラウド向けに焦点を置いて開発されたコアである。“Bergamo”の土台となるのが“Zen 4c”である。“Zen 4c”は“Zen 4”の派生アーキテクチャで、より多くのコアを1つのSocketに搭載できるようにしたものである。しかし、“Zen 4c”に関する情報は少なかった。Ryzen 7000 seriesのkeynoteではAMDのCTOであるMark Papermaster氏が以下のように説明していた。
“Zen 4c”はコンパクトで高密度なコアで、AMDのコアロードマップのもう1つの流れである。“Zen 4c”は“Zen 4”と同じ機能を、概ね半分のcore areaで実現する。
以下は“Zen 4”と“Zen 4c”のスペックをSemianalysisがまとめた表である。

“Bergamo”を使用したEPYCは128-coreのEPYC 9754と112-coreのEPYC 9654が計画されている。EPYC 9754はフルスペック仕様で、EPYC 9654は各CCXから1-core分―全体の1/8を無効化したものである。“Genoa”は最大96-coreであり、これと比較すると“Bergamo”は1.33倍のコア数を実現している。Socketは“Genoa”と同じSocketSP5、TDPは360Wとされる。
“Zen 4c”のL1 cacheとL2 cacheは“Zen 4”と同様量である。十分なprivate cacheを有することはクラウドや仮想化環境では重要である。また共有リソースへの依存と「うるさい隣人」の影響を低下させ、性能の一貫性を保持することができる。(※直訳気味。「うるさい隣人」は複数の仮想環境の割り当て時に起こりうる(?)リソースの競合のことだろうか?)
周波数は96-coreの“Genoa”と比較すると128-coreの“Bergamo”はBase 150MHz / Boost 600MHzだけ低下している。より多くのコアを同じTDPで納めるためには周波数の低下は避けられない。しかし、生のCPUスループット(コア数×周波数)は“Bergamo”で1.25倍に達している。
“Bergamo”の大きな変更点はCCXあたりのL3 cacheの削減と、CCDあたりに2つのCCXを搭載することである。“Zen 4c”のCCDは合計で16-coreを搭載する。CCXあたりのコア数は8-coreで、“Zen 4c”の1つのCCDには2つのCCXが搭載されていることになる。そしてCCXあたりのL3 cache容量は16MBで、“Zen 4”の32MBから半減されている。L3 cacheの半減はMobile向けの“Phoenix”でも行われており、ダイサイズの削減に貢献している。“Bergamo”では共有リソースはそれほど重要視されないため、L3 cacheの半減はダイエリアあたりの性能を向上させる方向に働く。CCDの数であるが、128-coreないしは112-coreの場合、搭載されるCCDの数は8となる。
I/O dieは“Genoa”と変わらない。12-channelのDDR5-4800対応メモリコントローラと、128本のPCI-Express 5.0を有する。2-socket構成まで対応する。
実際のダイ写真も掲載されている。


L3 cacheだけでなくコアそのものも縮小している。各ユニットが再配置されるとともに、それぞれのダイサイズががっつりと縮小している。L2 cacheはほとんど縮小していないようだが、その他の領域は34~47%程度縮小しているようだ。そしてコアのエリアは“Zen 4”から“Zen 4c”で35.4%程縮小しているようである。
これにL3 cacheの縮小分も合わせ、“Zen 4”のダイサイズが66.3mm2に対し、“Zen 4c”は72.7%とコア数を倍としながらもダイサイズの増大幅は10%程度に抑えられている。
AMDは6月13日に次世代データセンターおよびAIに関するイベント―“AMD Data Center and AI Technology Premiere”を予定している。そこで“Zen 4c”を搭載する“Bergamo”が発表される可能性は大いにありそうで、“Zen 4c”の中身もそこで明らかになるかもしれない。

この記事へのコメント
半分とは素晴らしい。
お値段据え置きで8c+16cのRyzen作れるね。
お値段据え置きで8c+16cのRyzen作れるね。
2023/06/08(Thu) 01:22 | URL | LGA774 #-[ 編集]
L3量が変わっただけの同じマイクロアーキテクチャだから、ソフトウェアから見れば7950X3Dと同じ仕組みでハイブリッド構成を取れる
2023/06/08(Thu) 02:04 | URL | LGA774 #-[ 編集]
>「うるさい隣人」
その解釈で合ってます
直訳というか日本語で普通に「うるさい隣人問題」と呼ばれているのでそのままの表記でよろしいかと
その解釈で合ってます
直訳というか日本語で普通に「うるさい隣人問題」と呼ばれているのでそのままの表記でよろしいかと
2023/06/08(Thu) 05:37 | URL | LGA774 #wLMIWoss[ 編集]
Zen4ではやや爆熱のレッテルを貼られた感があるが、大体Zen世代はTSMCプロセスの優秀さもあって電力効率そのものは高い。Intelのように全く異なるアーキテクチャでなくとも、物理設計や運用方法を変えることで、E-Core相当のコア運用も可能だと思う。
2023/06/08(Thu) 07:34 | URL | LGA774 #-[ 編集]
4も4cも、N5じゃなかったっけ?
あれ、N4?
あれ、N4?
2023/06/08(Thu) 08:02 | URL | LGA774 #-[ 編集]
当初のハイブリッドコア計画がZen5+Zen4C世代からだったのに
計画が変更されZen4+Zen4CやZen5+Zen5Cになったのは、
コアの縮小率がAMDの予想よりも大きかったからなのだろうか?
計画が変更されZen4+Zen4CやZen5+Zen5Cになったのは、
コアの縮小率がAMDの予想よりも大きかったからなのだろうか?
2023/06/08(Thu) 08:25 | URL | LGA774 #-[ 編集]
>195659
確かに電力効率は高いんだけど、今回のZen4は微細化のし過ぎで熱が篭りやすくなって爆熱になった
そこにデフォルトで95℃まで加熱する仕様とセンサー破壊のダブルパンチで先日燃える事件が発生した
Intelは確かに消費電力こそ多いけど、発熱は比較的大人しい
確かに電力効率は高いんだけど、今回のZen4は微細化のし過ぎで熱が篭りやすくなって爆熱になった
そこにデフォルトで95℃まで加熱する仕様とセンサー破壊のダブルパンチで先日燃える事件が発生した
Intelは確かに消費電力こそ多いけど、発熱は比較的大人しい
2023/06/08(Thu) 08:59 | URL | LGA774 #-[ 編集]
本当にL3縮小だけで済ませてきたか。CCX間リンクが遅いとかの問題がなければほぼzen4と同じように機能しそうだな。
しかしライブラリ変更と最適化でここまで変わるとは。見事なものだ。(個人的にはクロックも欲しいので縁はなさそうだが)
しかしライブラリ変更と最適化でここまで変わるとは。見事なものだ。(個人的にはクロックも欲しいので縁はなさそうだが)
2023/06/08(Thu) 09:59 | URL | LGA774 #-[ 編集]
Semianalysisの表をみるとZen4、Zen4cいずれもTSMC N5ですね。
cell library変えただけでここまで変わるものかな?
と思ったけどSemianalysisにちゃんと書かれてますね
* ターゲット周波数を下げ(て論理合成す)る
* デザイン階層のさらなる平坦化 (ソフトウェアのグローバル最適化やリンク時最適化に相当)
* コア内のSRAM (たぶんL1 cacheとBTB) のcellを8Tから6Tに変更
cell library変えただけでここまで変わるものかな?
と思ったけどSemianalysisにちゃんと書かれてますね
* ターゲット周波数を下げ(て論理合成す)る
* デザイン階層のさらなる平坦化 (ソフトウェアのグローバル最適化やリンク時最適化に相当)
* コア内のSRAM (たぶんL1 cacheとBTB) のcellを8Tから6Tに変更
2023/06/08(Thu) 14:56 | URL | LGA774 #-[ 編集]
BergamoのZen4cにTSVが用意されていれば、Bergamo-Xがすぐ出てきそうだけど、そんな隙間もないワケだね
2023/06/08(Thu) 15:46 | URL | 名無しです #-[ 編集]
BergamoもN4で、N4は高性能が3/3セルで高密度が2/2セルだから、セルの選択だけで面積半分にできるか?という疑問はある。
Semianalysisでは設計難易度が上がってもいいから詰め込みを強化したと書いてるが、
例えばクロックが上がらないことを前提にパイプラインの段数を削るなど、論理設計面で手が入っていても不思議ではない気がする。
Semianalysisでは設計難易度が上がってもいいから詰め込みを強化したと書いてるが、
例えばクロックが上がらないことを前提にパイプラインの段数を削るなど、論理設計面で手が入っていても不思議ではない気がする。
2023/06/08(Thu) 20:35 | URL | LGA774 #-[ 編集]
リングバスの仕様上、CCXあたりのコア数は増やせないから
CCDあたりのコア数増やすにはL3の容量半減プラスαでCCXニコイチにするしかないのね
N5→N3ではSRAMはほぼ縮小しないらしく高密度化のネックになっているし
CCXがリングバス継続ならZen5cはL3廃止してCCDはCCX4個で構成
レイテンシーは3D V-Cacheで隠蔽するという解もあるのかな
CCDあたりのコア数増やすにはL3の容量半減プラスαでCCXニコイチにするしかないのね
N5→N3ではSRAMはほぼ縮小しないらしく高密度化のネックになっているし
CCXがリングバス継続ならZen5cはL3廃止してCCDはCCX4個で構成
レイテンシーは3D V-Cacheで隠蔽するという解もあるのかな
2023/06/08(Thu) 22:30 | URL | LGA774 #-[ 編集]
Zen4cは具体的にどこまでクロック上がるんだろ
4GHz台で回せるなら16CのRyzenをシングルCCDで作れるという夢のコスパが達成できそう
まぁさすがに頑張っても3GHz台届くかどうかのラインだと思うが
4GHz台で回せるなら16CのRyzenをシングルCCDで作れるという夢のコスパが達成できそう
まぁさすがに頑張っても3GHz台届くかどうかのラインだと思うが
2023/06/08(Thu) 22:47 | URL | LGA774 #-[ 編集]
用途によってはコンシューマ向けに、Zen4c/16コア品が製品化されても良さそうな気が。
2023/06/09(Fri) 01:36 | URL | LGA774 #L6m4KOWY[ 編集]
Zen4c/~8コア品を、Athlonブランドに使う手段の方が、有りそうだ。
2023/06/09(Fri) 01:45 | URL | LGA774 #L6m4KOWY[ 編集]
パイプラインの数を変更するなど、CPUコアをほぼ新設計できる余裕があるならば、
「Zen4C」なんて名乗らせないで、宣伝も含めて別ネーミングにする気がする
「Zen4C」なんて名乗らせないで、宣伝も含めて別ネーミングにする気がする
2023/06/09(Fri) 08:07 | URL | LGA774 #-[ 編集]
>>195671
下記記事によれば、3nm世代の6T SRAMは、0.75Vで1.9GHz な模様。orz
https://pc.watch.impress.co.jp/img/pcw/docs/1507/283/html/photo023_o.jpg.html
下記記事によれば、3nm世代の6T SRAMは、0.75Vで1.9GHz な模様。orz
https://pc.watch.impress.co.jp/img/pcw/docs/1507/283/html/photo023_o.jpg.html
2023/06/09(Fri) 09:59 | URL | LGA774 #L6m4KOWY[ 編集]
intelのように高性能と高効率2つアーキを同時に開発できる余力が無い中でどうするか
AMDは頑張って自分なりの道を出してきたな
省電力性能とかダイサイズとかの問題はあれ
ともかくこれでintelがEコアにAVX-512載せるまでの間ハイブリッドでの土俵で戦える
AMDは頑張って自分なりの道を出してきたな
省電力性能とかダイサイズとかの問題はあれ
ともかくこれでintelがEコアにAVX-512載せるまでの間ハイブリッドでの土俵で戦える
2023/06/09(Fri) 16:16 | URL | LGA774 #-[ 編集]
サーバー向けの多コア製品としては理想的な形だと思う
逆にシングル重視のコンシュマー向けだとハイブリッドにならない限り採用されないかもね
逆にシングル重視のコンシュマー向けだとハイブリッドにならない限り採用されないかもね
2023/06/09(Fri) 21:08 | URL | LGA774 #-[ 編集]
>>195708
そもそもEPYC向けで高く売れる石をわざわざコンシューマで安売りしようとは考えない可能性。
しかし実装面積を削ってコア数で押し切るのはBulldozerの再来と取れなくもなく、感慨深い。あれは斬新で良い石だった。
そもそもEPYC向けで高く売れる石をわざわざコンシューマで安売りしようとは考えない可能性。
しかし実装面積を削ってコア数で押し切るのはBulldozerの再来と取れなくもなく、感慨深い。あれは斬新で良い石だった。
2023/06/10(Sat) 12:39 | URL | LGA774 #-[ 編集]
steamroller とexcavatorアーキテクチャの違いを思い出す
phoenix2も期待ができそう
15w程度のワッパモンスターが期待できる
phoenix2も期待ができそう
15w程度のワッパモンスターが期待できる
2023/06/11(Sun) 20:33 | URL | LGA774 #-[ 編集]
そもそもAPUにはずっとL3 cache削減版が使われてきたし
それにキャッチ―な名前が付いただけな気がする。
開発リソース的に仕方がないんだけど、
IntelやAppleのように2ライン用意しているように見せるのはちょっと不誠実かな…
それにキャッチ―な名前が付いただけな気がする。
開発リソース的に仕方がないんだけど、
IntelやAppleのように2ライン用意しているように見せるのはちょっと不誠実かな…
2023/06/12(Mon) 07:14 | URL | LGA774 #-[ 編集]
>195751
「見せかける」とはなにを? 不誠実とは何に対して?
そもなにが「2ライン用意しているように見せる」なのかがさっぱりわからぬ…
「見せかける」とはなにを? 不誠実とは何に対して?
そもなにが「2ライン用意しているように見せる」なのかがさっぱりわからぬ…
2023/06/12(Mon) 23:03 | URL | LGA774 #-[ 編集]
>195760
モダンなCPUって設計がものすごく大変で、
本当は同じISAのマイクロアーキテクチャなんて1本に絞りたいのを
最近はアムダールの法則を乗り越えるためにbig.LITTLEな2本立てにしている。
目的を考えるとbig.LITTLEの場合かなり極端な設計がされるのが当然で
Intelは言わずもがなだけどappleの場合でも小型と大型のコアは4倍程度の規模の違いがある。
これはキャッシュ量の違いなんかじゃなく全く別物のマイクロアーキテクチャを用意したからなんだ。
armの場合arm社のIPがイマイチだったのもあるけど
big.LITTLE導入前はsamsungやqualcommは自社開発をしていた。
それがbig.LITTLE導入あたりで自社開発を断念している。
もっとも最近は差別化のために再び自社開発しようという方向だけどね。
製造を外注するしかないAMDにとって開発費の高騰は製品価格に直結しちゃうので
ある意味贅沢なbig.LITTLEは難しい。
そのためかzenはあまり肥らないようにダイ効率も注意しながら拡張されていて、
基本的に高性能コアとしては小さめ=高効率にできている。
キャッシュ削減の廉価版なんて昔からたくさんあって、
北森さんにもNorthwood-128Kという妹分がいるけどこれを他人のようには扱わないでしょってこと。
モダンなCPUって設計がものすごく大変で、
本当は同じISAのマイクロアーキテクチャなんて1本に絞りたいのを
最近はアムダールの法則を乗り越えるためにbig.LITTLEな2本立てにしている。
目的を考えるとbig.LITTLEの場合かなり極端な設計がされるのが当然で
Intelは言わずもがなだけどappleの場合でも小型と大型のコアは4倍程度の規模の違いがある。
これはキャッシュ量の違いなんかじゃなく全く別物のマイクロアーキテクチャを用意したからなんだ。
armの場合arm社のIPがイマイチだったのもあるけど
big.LITTLE導入前はsamsungやqualcommは自社開発をしていた。
それがbig.LITTLE導入あたりで自社開発を断念している。
もっとも最近は差別化のために再び自社開発しようという方向だけどね。
製造を外注するしかないAMDにとって開発費の高騰は製品価格に直結しちゃうので
ある意味贅沢なbig.LITTLEは難しい。
そのためかzenはあまり肥らないようにダイ効率も注意しながら拡張されていて、
基本的に高性能コアとしては小さめ=高効率にできている。
キャッシュ削減の廉価版なんて昔からたくさんあって、
北森さんにもNorthwood-128Kという妹分がいるけどこれを他人のようには扱わないでしょってこと。
2023/06/13(Tue) 20:51 | URL | 195751 #-[ 編集]
>195773
どのSoCもピークパフォーマンスとワットパフォーマンスとフットプリントのトレードオフをしてるだけで、別なマイクロアーキテクチャを使うのは手段であって目的ではない。
見せかける必要性なんて全然ないよ。だって消費者は能書きなんか気にせず仕様とコスパで選ぶじゃんね。
どのSoCもピークパフォーマンスとワットパフォーマンスとフットプリントのトレードオフをしてるだけで、別なマイクロアーキテクチャを使うのは手段であって目的ではない。
見せかける必要性なんて全然ないよ。だって消費者は能書きなんか気にせず仕様とコスパで選ぶじゃんね。
2023/06/14(Wed) 01:14 | URL | LGA774 #-[ 編集]
>195773
当たり前のことを並べた長文なだけで、何が言いたいのかさっぱりわからないのは凄い
最後にだけ突っ込めば単純にキャッシュ削減版と再設計したCPUを同じに見ている事もすごい
当たり前のことを並べた長文なだけで、何が言いたいのかさっぱりわからないのは凄い
最後にだけ突っ込めば単純にキャッシュ削減版と再設計したCPUを同じに見ている事もすごい
2023/06/14(Wed) 07:35 | URL | LGA774 #-[ 編集]
コアを新しく設計する事が素晴らしいと考えている人がいる謎
使えるモノを使えるならばそうすべきだし、Intelのように別コア(ATOM系)を組み込んだ結果として
CPU全体に機能制限が出るくらいならばやらない方がマシまである
使えるモノを使えるならばそうすべきだし、Intelのように別コア(ATOM系)を組み込んだ結果として
CPU全体に機能制限が出るくらいならばやらない方がマシまである
2023/06/14(Wed) 08:13 | URL | LGA774 #-[ 編集]