北森瓦版 - Northwood Blog (Author : 北森四葉. Since July 10, 2006.)
AMD's Future in Servers: New 7000-Series CPUs Launched and EPYC Analysis(AnandTech)
AMD Unveils Record-Setting EPYC Datacenter Processor(techPowerUp!)
AMD Reveals EPYC Datacenter Processor Pricing(techPowerUp!)
AMD's Epyc 7000-series CPUs revealed(The Tech Report)
AMD EPYC 7000 Series Architecture Overview for Non-CE or EE Majors(ServerTheHome)
AMDがサーバー向けCPU「EPYC 7000」ファミリを正式発表(Impress PC Watch / 後藤弘茂のWeekly海外ニュース)
AMD、サーバー向け新アーキテクチャCPU「EPYC」を発表(後藤弘茂氏による詳細レポート)(Impress Cloud Watch)
AMD,新世代サーバー向けCPU「EPYC 7000」を正式発表。8C16Tから32C64Tまでの計12製品をラインナップ(4Gamer.net)
AMD EPYC(TM) Datacenter Processor Launches with Record-Setting Performance, Optimized Platforms, and Global Server Ecosystem Support(AMD)
EPYC(TM) 7000 series(AMD)

AMDは6月20日、データセンター向けの高性能Processor製品となるEPYC 7000 seriesを正式発表した。EPYC 7000 seriesは高性能な“Zen”アーキテクチャのコアを最大32-coreまで搭載する。

まずラインナップが以下の通りとなります。
 
EPYC 7000 series(14nm / Naples / SocketSP3, 2-way)
MNコア数
スレッド数
定格周波数キャッシュTDP対応メモリ
Turbo時周波数PCIe 3.0
EPYC
7601
32-core
64-thread
2.20GHzL3=64MB180W8ch DDR4
-2666
'17/6/20
All core 2.70GHz
Max 3.20GHz
128
EPYC
7551
32-core
64-thread
2.00GHzL3=64MB180W8ch DDR4
-2666
'17/6/20
All core 2.55GHz
Max 3.00GHz
128
EPYC
7501
32-core
64-thread
2.00GHzL3=64MB155W
170W
8ch DDR4
-2400
-2666
'17/6/20
All core 2.60GHz
Max 3.00GHz
128
EPYC
7451
24-core
48-thread
2.30GHzL3=64MB180W8ch DDR4
-2666
'17/6/20
All core 2.90GHz
Max 3.20GHz
128
EPYC
7401
24-core
48-thread
2.00GHzL3=64MB155W
170W
8ch DDR4
-2400
-2666
'17/6/20
All core 2.80GHz
Max 3.00GHz
128
EPYC
7351
16-core
32-thread
2.40GHzL3=64MB155W
170W
8ch DDR4
-2400
-2666
'17/6/20
All core 2.90GHz
Max 2.90GHz
128
EPYC
7301
16-core
32-thread
2.20GHzL3=64MB155W
170W
8ch DDR4
-2400
-2666
'17/6/20
All core 2.70GHz
Max 2.70GHz
128
EPYC
7281
16-core
32-thread
2.10GHzL3=32MB155W
170W
8ch DDR4
-2400
-2666
'17/6/20
All core 2.70GHz
Max 2.70GHz
128
EPYC
7251
8-core
16-thread
2.10GHzL3=32MB120W8ch DDR4
-2400
'17/6/20
All core 2.90GHz
Max 2.90GHz
128


EPYC 7000P series(14nm / Naples / SocketSP3, 1-way)
MNコア数
スレッド数
定格周波数キャッシュTDP対応メモリ
Turbo時周波数PCIe 3.0
EPYC
7551P
32-core
64-thread
2.00GHzL3=64MB180W8ch DDR4
-2666
'17/6/20
All core 2.55GHz
Max 3.00GHz
128
EPYC
7401P
24-core
48-thread
2.00GHzL3=64MB155W
170W
8ch DDR4
-2400
-2666
'17/6/20
All core 2.80GHz
Max 3.00GHz
128
EPYC
7351P
16-core
32-thread
2.40GHzL3=64MB155W
170W
8ch DDR4
-2400
-2666
'17/6/20
All core 2.90GHz
Max 2.90GHz
128


EPYC 7000 seriesのページに行くと上記12種類それぞれのモデルの詳細なスペックを知ることができます(一度に複数を比較できないのが難点)。既報の通り末尾に“P”がつくモデルは1-way専用、それ以外は2-wayまでの対応となります。同型番の“P”ありとなしはDual processorの対応の有無を除いては基本的なスペックは同じです。

L3キャッシュ容量はEPYC 7301以上が64MB、EPYC 7281と7251は32MBとなっています。このことはEPYC 7301以上の製品は8-coreのダイを4つ搭載して作られていることを示しています。EPYC 7281と7251は断定はできないものの、4-coreのダイを4つ搭載している可能性があります(Ryzen 5 1400という反例はあるので断定はできないが、特にEPYC 7251の場合は4-coreダイ×4の方が無駄は少ないと思われる)。

I/Oは既報の通りメモリチャネルが8ch DDR4-2400/-2666対応です。EPYC 7251のみは8ch DDR4-2400止まりの対応となりますが、それ以外はDDR4-2666まで対応する模様です(TDP180WのモデルはDDR4-2666と記され、TDP155/170WのモデルはDDR4-2400/-2666と記されているのは意味深である)。搭載できるメモリの容量は1 CPUあたり最大2TBで、2-way構成であれば4TBとなります。スライド資料の写真を見る限り1chあたり2 DIMMまで搭載できるようで、128GB×16 DIMMで最大容量を実現できます。

PCI-Expressレーンは128レーンを備えます。1-wayの場合は文字通り128レーンとなりますが、2-wayの場合は1 CPUあたり64レーンで、2つのCPU合計で128レーンとなります。これは2-way環境において2つのCPUの接続に64レーン分のinfinity fabricを使用するためと説明されています。この128レーンという多数のPCI-Expressレーンにより最大8リンクのPCI-Express x16レーンを構成することができます。またPCI-Express x16レーンは最大8系統まで分割できます。SATAもサポートされており、理論上はSATAデバイスを64基搭載することもとAnandTechで説明されています。NVMeデバイスについては32デバイスをサポートするとしています。
これに関連し、1-wayでは1つのCPUに6基のGPUを、2-wayでは1つのCPUあたり3基のGPUを接続する様子がスライドに示されています。このスライドでは1-wayでは8 Drives、2-wayでは1 CPUあたり4 Drivesが接続されている様子が描かれています。

EPYCの鍵となるのがinfinity fabricです。4ダイ構成となるEPYC 7000 seriesですがパッケージ内のダイは3本のinfinity fabricで他3つのダイと接続されます。ダイ間の帯域は42GB/sの双方向(AnandTechに42.6GB/sというより細かい数字が出ている)で、2pJ/bit未満のエネルギーで実現しているとしています。パッケージ内の4つのダイはいずれもOne hopで接続されます。

2-way構成の場合は、1つのダイから16レーンのinfinity fabricが1リンク出ることになり、これが4ダイ分合計4リンク・64レーンによりSocket間が接続されます。リンクあたり帯域は38GB/s・双方向(これもAnandTechに37.9GB/sというより細かい数字が出ている)で、9pJ/bit未満のエネルギーで実現しているとしています。4つのダイから出たinfinity fabricは別socketの4つのダイそれぞれに接続されます。そのため直接接続するダイはOne hop、直接接続しない他の3つのダイはTwo hopでの接続となります(CPUのダイ0から出たinfinity fabricはCPU 1のダイ0に接続される。以下CPU 0の第1から出たinfinity fabricはCPU 1のダイ1に・・・と続く。CPU 0のダイ0からCPU 1のダイ3への接続はCPU 0ダイ0→CPU 1ダイ0→CPU 1ダイ3となる)。

EPYCはサウスブリッジに相当する機能も取り込んでおり、別にチップセットを必要としません。搭載しているI/OとしてUSB 3.0×4, SMBus, I2C, SPI, eSPI, TPM, GIPOs, timers, UARTsが挙げられています。

価格についてはtechPowerUp!に以下のように掲載されています。

  EPYC 7601 32-core $4200
  EPYC 7501 32-core $3400
  EPYC 7401 24-core $1850
  EPYC 7301 16-core $825
  EPYC 7281 16-core $650
  EPYC 7251 8-core $475

  EPYC 7551P 32-core $2100
  EPYC 7401P 24-core $1075
  EPYC 7351P 16-core $750

リテール販売開始時期も同じtechPowerUp!の記事に掲載されており、EPYC 7601, 7551, 7501, 7451が6月20日から、それ以外は7月末となっています。

EPYC 7000 seriesの型番の下1桁が世代を表しているようで、次の世代は7xx2となるのでしょうか。また8-coreから32-coreまでが7000番台に納められており、後から、2ダイ仕様のEPYC 5000 seriesや1ダイ仕様のEPYC 3000 seriesが出てきそうな雰囲気があります(実際、該当する製品の噂として“Snowy Owl”がある)。

EPYCに使用されている8-coreダイには外に出る32レーン分のinifinity fabricとは別に、内部接続用のinfinity fabricが存在することになりますが、結局この8-coreダイは何本のinfinity fabricを持つのでしょうか(ダイ写真を見ると右上と左下のブロックがinfinity fabricと推測され、1ブロックあたり8×3+4×2の32本、合計64本がありそうに見える。パッケージ内に用いられているinfinity fabricは16×3か20×3・・・だろうか。2ダイなら16×1~2で済みそうなので、外に出せれば16レーン分をsocket間接続に使えそうである。なお、ここの部分は適当に憶測を述べているに過ぎないので、真に受けないで欲しい。このあたりの解説記事を待ちたいところだ)

(追記:2017年6月22日19時01分)
後藤弘茂氏のコラムに「パッケージ上で、4個のコアを、32レーンのファブリックで相互接続している」と記載がありました。

AMD Announces the Radeon Instinct MI25 Deep Learning Accelerator(techPowerUp!)
AMD also Announces Radeon Instinct MI8 and MI6 Machine Learning Accelerators(techPowerUp!)

EPYCのスライドで6基ぶら下がっていたGPUがありますが、おそらくRadeon Instinct seriesを意識したものと思われます。そしてEPYCと同時にRadeon Instinct MI25, MI8, MI6が発表されています。ラインナップは以下の通り。

◇Radeon Instinct series
  MI25 Vega 64 CU HBM2 16GB 484GB/s FP16:24.6TFlps/FP32 12.3TFlops 300W
  MI8 Fiji 64 CU HBM1 4GB 512GB/s FP16:8.2TFlps/FP32 8.2TFlops 175W
  MI6 Polaris 36 CU GDDR5 16GB 224GB/s FP16:5.7TFlps/FP32 5.7TFlops 150W

MI6はSingle-slot仕様、MI8とMI25はDual-slot仕様のカードとなりますが、MI8はRadeon R9 Nanoのような短いカードとなっています。


コメント
この記事へのコメント
156614 
2way向けは16コアのモデル、1way向けは24コアのモデルがコスパ最高ですね

これはたまりませんなぁ(ヨダレ
2017/06/22(Thu) 02:10 | URL | LGA774 #-[ 編集]
156615 
ダイの右上と左下にあるのはそれぞれx16のSerDesでダイ全体ではIO用に合計x32分が存在
ソケット間のInfinity Fabric接続時はx16を使用する
一方、パッケージ内のInfinity Fabric接続にはSerDesではなく別のパラレルインターフェースを使用する
パラレルインターフェースはダイの左上隅、上辺のSerDesの左隣、下辺のSerDesの右隣、制御用らしいx2のSerDesを挟んでその右隣、の計4個存在
そのうち3つを使用する

という感じだと思います
https://en.wikichip.org/w/images/e/ea/zen_soc.png
上の図はAMDのProcessor Programming Referenceに載ってますが、GMIがパラレル、xGMIがSerDesを用いたInfinity Fabric用のインターフェースだと思います
2017/06/22(Thu) 02:14 | URL | LGA774 #H6hNXAII[ 編集]
156616 
1ダイ8コアなら16C32T定格2GhzでXEON-D対抗のが欲しいわ。TDP45〜65でなんとかならないかな。メモリ4chで苦労するなら2chで十分なんだけど
2017/06/22(Thu) 10:19 | URL | LGA774 #-[ 編集]
156620 
メモリの詳細情報がない感じ。
エンタープライズ用だからLRDIMMには対応しているだろうと思うけど、3DS には対応しているのだろうか。
2017/06/22(Thu) 17:12 | URL | _ #-[ 編集]
156625 
CloudWatchに後藤氏の詳細レポ来てますね
メモリサポートはRDIMM/LRDIMM/NVDIMM-N/3DS DIMM
とのこと。

ところでこれって各コアに最低1本はメモリ必要とかあるのかな?
メモリ無いコアがあってもfabric経由で他コアのメモリ拝借するのかな?
2017/06/23(Fri) 11:20 | URL | LGA774 #-[ 編集]
156628 
DT用と比べるとIntelに対する優位性がだいぶ落ちたね
DT用はほぼ同じ電力でIntel比2倍のコア数を同90%近い周波数で回せてたのに、EPICは電力1~2割増しで2倍のコア数を70%程度の周波数
AVXのリソースを切り捨てた分、AVXを多用されると厳しいのかな、128bit幅でダラダラと処理してたらいつまで経ってもスリープに入れないからな
Intelは512bitまで一気に処理してさっさとスリープに入れるのに
2017/06/24(Sat) 00:21 | URL | LGA774 #-[ 編集]
156631 
興味半分で申し訳ないが
こういうのってどの位実際に生産されるんでしょうか?
2017/06/24(Sat) 06:50 | URL | LGA774 #-[ 編集]
156634 
EPYCメモリサポートはRDIMM/LRDIMM/NVDIMM-N/3DS DIMM/LRDIMMとサーバ用に必要なメモリはほとんどサポートする。
2017/06/24(Sat) 17:56 | URL | LGA774 #-[ 編集]
156639 
>156628

インテルも実効256bit幅だと思うが違ったかな
しかも強烈に消費電力が上がると聞いている
AVX512を実効512bit演算できるのってナイトほにゃららしか知らん
問題はそれで何を計算するかだけどもDT用ってなんだろ
無知ですまんがそれはGPUじゃできんのかい?
2017/06/25(Sun) 22:15 | URL | LGA774 #-[ 編集]
156641 
デスクトップ用の略じゃないかなDT用
一般的ではないオレオレ略語は使うべきじゃないよなあ…

サーバーベンチだとRyzenは性能良かったんじゃなかったか。
2017/06/26(Mon) 00:36 | URL | LGA774 #-[ 編集]
156653 
http://www.serversdirect.com/でデュアルEPYCマザーが$595!
鯖用としては至って普通の値段で嬉しい
2017/06/26(Mon) 09:47 | URL | LGA774 #-[ 編集]
156660 
7251は120Wですよ
2017/06/27(Tue) 02:23 | URL | LGA774 #-[ 編集]
156661 
512bitぽっちを繰り返しGPUメモリに移したり戻したりするコストは
演算よりもたぶん圧倒的にでかいので、GPUはもっと大きなデータを
いっぺんに扱うとき以外には出番ないのよ。

ただ、汎用サーバ用途でAVX512が現行プロセスでの実装コストに
見合うかどうかはわりと博打だと思うわ。げんに時期尚早と判断したAMDは
intelよりもコンパクトでAVX以外では互角以上に戦える
Zenコアの開発に成功したのだし。

サーバーベンチで成績が良いというのは、まさにAVX512を使う用途が
今現在のそのタスクでは限定的なせいで
評価値が足を引っ張りがたいってことでもある。
2017/06/27(Tue) 08:27 | URL | LGA774 #-[ 編集]
コメントを投稿する(投稿されたコメントは承認後表示されます)
URL:
Comment:
Pass:
秘密: 管理者にだけ表示を許可する
 
トラックバック
この記事のトラックバックURL
https://northwood.blog.fc2.com/tb.php/8988-c8156d7d
この記事にトラックバックする(FC2ブログユーザー)
この記事へのトラックバック