北森瓦版 - Northwood Blog (Author : 北森八雲. Since July 10, 2006.)
Intel Formally Introduces Next-Generation Xeon Phi “Knights Landing”.(X-bit labs)

Supercomputing Conefernce 13でIntelは“Knight Landing”のコードネームで呼ばれる次世代Xeon Phiを紹介し、“Knight Landing”のCPU版のメモリ仕様とフォームファクタを明らかにした。この“Knight Landing”のCPU版はプログラマビリティを容易にし、さらに性能向上を期待するものである。

“Knight Landing”はHost processorとして使用できる。つまり、標準的なラックに搭載でき、今までのようにCoprocessorとしてデータをオフロードする必要がなく、完全にNativeな形でアプリケーションを走らせることが出来る。つまり、プログラミングの複雑さが減少し、データのオフロードの手間が省けるため、性能の向上とメモリやPCI-Express、ネットワーキングに起因するレイテンシの減少が実現する。
 
“Knight Landing”のメモリオプションは求められる性能により3種類がある。
Socketベースの“Knight Landing”はインパッケージで広帯域のメモリバッファを搭載し、メモリ周りの性能を要求するワークロードでの性能を底上げする。また同様にインパッケージのDDRメモリバッファを搭載する。さらに一般的なDDR3/DDR4プラットフォームにも対応する。“Knight Landing”は多量のメモリを要求するワークロードも最大限サポートする。


過去にリークしたスライドによると“Knight Landing”は14nmプロセスで製造され、2014~2015年のリリースが予定されている。“Knight Landing”はPCI-Express対応のco-processorカードとCPUフォームファクタで提供される。対応メモリセットとしてはAVX 3.1が挙げられている。メモリコントローラはDDR4対応になり、さらにオンパッケージの高速メモリの搭載や、その他いくつかの改良が行われる。

この次世代Xeon Phi―“Knight Landing”の性能であるが、倍精度浮動小数点演算性能で3TFlopsまたは14~16GFlops/Wになるといい、現行の“Knight Corner”(1TFlops, 4~6GFlops/W)と比較し大幅に演算能力が向上している。

自作PCでこれを使う猛者はなかなかいないでしょうが、もし2-way Xeonマザーの片方にこれを載せられるのであれば使ってみたいと思うユーザーも必ずいることでしょう。

そのXeon Phi搭載PCで何をするのか?
・・・一部からはTwitterとか艦これとかいう答えが元気よく返ってきそうな気がします。



(追記:2013年11月25日23時57分)
Intel’s Xeon Phi Knights series expands in 2015(VR-Zone)

“Knight Landing”の詳細に関してIntelの資料と思われるスライドがいくつか掲載されています。基本的には前述の通りですが、いくつか興味深い事柄が掲載されています。

2枚目の“Knight Landing Integrated On-Package Memory”というスライドにはメモリ周りのスペックについて描かれています。まずメモリコントローラはDDR4-2400まで対応し、6-channelとなります。最大搭載可能容量は384GBとなります。またオプションとして最大500GB/sの帯域で8または16GBのMCDRAMを搭載できるとあります。

3枚目の“Knight Landing Processor Architecture”というスライドには“Knight Landing”のアーキテクチャの概要が書かれています。使用されるコアは“Silvermont”をベースとし、最大72-coreを搭載します。そして1-coreあたり4-threadを駆動できます。また1-coreに2基の512-bitベクタユニットを搭載します。これにより“Knight Corner”と比較して3倍のSingle-thread性能を有することになるようです。命令セットとしてはAVX-512のサポートが書かれています。I/OはHPC interconnectとしてPCI-Express 3.0 x36が用意されるようです。TDPは200Wとなっており、4枚目のスライドには160~200Wという記載が見られます。

その4枚目のスライドは“KNL-F: KNL Processor with Integratged Fabric”と題されたもので、“Knight Landing-F”と呼ばれる特別なパッケージのものとなります。“Knight Landing”ではPCI-Express 3.0 x36であったI/OがPCI-Express 3.0 x32になる、オンパッケージで“Sotrm Lake Host Fabric Inteface (HFI)”を2ポート搭載する、TDPが175~215Wになるなどの違いがあります。

“Knight Landing”からやや外れますが、VR-Zoneの記事中には“16-core Broadwell Xeon E5 v4”という記載が見られます。“Haswell-EP”は最大14-coreと言われていますが、その次の“Broadwell-EP”は16-coreになると言うことでしょうか。
パソコン工房のお得なキャンペーン



コメント
この記事へのコメント
141425 
2コアHaswell+64コアPhiとかなら面白いのに。
まぁ2コアAtomでもいいけど。
OS用に今時のCPUコアがないときついかと。
2013/11/24(Sun) 21:37 | URL | LGA774 #-[ 編集]
141430 
Kngiht
4件の一致
2013/11/25(Mon) 06:27 | URL | LGA774 #-[ 編集]
141431 
一部からは「ベンチ」が最大の声だろうが!
2013/11/25(Mon) 14:38 | URL | LGA774 #-[ 編集]
141438 
ジーオン ファイッ!!
2013/11/25(Mon) 23:49 | URL | LGA774 #-[ 編集]
141441 
インパッケージで最大500GB/sの8/16GB
+6chDDR4の384GB

メモリ周りが異次元過ぎるw
プロセス先行だけじゃなく
メモリまで独自規格で先行じゃ
他社は付いて行けないわな

メモリメーカーとファウンダリ頼みの
Nvidiaがこの世代で戦えるとは思えない
2013/11/26(Tue) 00:41 | URL | - #-[ 編集]
141442 
んー、OSのインストールに一晩くらいかかりそう
2013/11/26(Tue) 00:44 | URL | LGA774 #-[ 編集]
141443 
Silvermontが72コアものるのかね?
VPUがあるので元々あるFPUは載せないでダイサイズを確保しているのかもしれないけど…
HTのないSilvemontに4スレッドというのも謎だし
2013/11/26(Tue) 00:57 | URL | LGA774 #-[ 編集]
141444 
ここまで誤字が多いと狙ってるんじゃないかと思えてくる。
2013/11/26(Tue) 01:48 | URL | LGA774 #-[ 編集]
141446 
有能な人って誤字やスペルミスに
寛容なのは何故なんだ?
2013/11/26(Tue) 02:19 | URL | LGA774 #-[ 編集]
141447 
有能な人が誤字やスペルミスに
寛容なのは何故なんだろ?
2013/11/26(Tue) 02:20 | URL | LGA774 #PpCXbfmU[ 編集]
141449 
phiがAtomベースになると言われてたけど次で来るのか
2013/11/26(Tue) 02:42 | URL | LGA774 #-[ 編集]
141455 
ベースと氏→ベースとし
ですね
2013/11/26(Tue) 11:42 | URL | LGA774 #-[ 編集]
141460 
Intrlが最新プロセスを他社に提供するのも知らずに喜んじゃって
2013/11/26(Tue) 12:54 | URL | LGA774 #-[ 編集]
141463 
これに他社が対抗するのはきつそうだなぁ
maxwellとかR390(仮)だと単精度なら勝てても倍精度とかメモリ周りやワッパじゃ勝負にならなさそう
IBMならPower7のダイ互換で以前ポシャった拡張版cellを更に進化させたの出せば足廻り含めてなんとかなるだろうけど価格が違いすぎるし
2013/11/26(Tue) 14:47 | URL | LGA774 #-[ 編集]
141468 
※141446
「その程度の事よりも、内容で突っ込むことがある」からでは・・・。
2013/11/26(Tue) 17:15 | URL | LGA774 #-[ 編集]
141472 
>>141443
>HTのないSilvemontに4スレッドというのも謎だし
SMT自体は実装コストの低い機能だと思います。元々LarrabeeもPentiumの2wayインオーダ構成をベースに4waySMTを拡張しているわけで、別に不思議ではないと思いますよ。
2013/11/26(Tue) 21:07 | URL | LGA774 #9zOzYU0I[ 編集]
141476 
CPUとGPUにおいてintel、nVidia、AMDの三者三様でおもしろい

intelはGPUにもなれるCPU
nVidiaはCPUにもなれるGPU
AMDはCPUとGPUを独立させ高度な連携を実現する

はたしてどれが一番になるか
サーバー部門だとintel方式一択
スパコン部門だとnVidia方式優勢?
ゲームハード部門はAMD(PS4、XBOX ONE)?
デスクトップ部門(自作PC)はintel優勢
ノート部門もintel優勢
スマホ、タブレット部門はダークホースARM

てな感じかな
2013/11/26(Tue) 22:34 | URL | LGA774 #-[ 編集]
141495 
有能な人って誤字やスペルミスに
寛容なのは何故なんだ?

 有能?俺のことかーーー!
2013/11/27(Wed) 21:16 | URL | LGA774 #-[ 編集]
141498 
>>141476
根本的にこの記事と違うというか見誤っているというか違和感を感じる。
2013/11/28(Thu) 00:35 | URL | LGA774 #-[ 編集]
141502 
>141447
通じればOK。
体裁より内容。

研究されてたけど、
単語の最初と最後があってれば理解できるらしい。

こちんには(以下略)

でも固有名詞はまちがえちゃだめよ。

>141476
nvidiaってそんなスペシャルあったっけ。
2013/11/28(Thu) 21:05 | URL | LGA774 #-[ 編集]
141505 
>141476
3択だとタブレットはNV優勢じゃないかな
地味にTegra採用端末増えてきたね
ARMにはAMDもNVも絡むのでその括りは不十分かと
あと据え置きタイプのAndroid互換ゲーム機もNVが圧倒的(市場は小さいが)
WiiもAMDなので家庭用ゲーム機ではAMD制覇だね
2013/11/29(Fri) 03:51 | URL | LGA774 #EnGitwzo[ 編集]
141510 
現状のPhiはHawaiiの浮動小数点演算に絶対性能でもワットパフォーマンスでも負けているけどこれで追いぬくつもりなんかな
2013/11/29(Fri) 23:36 | URL | LGA774 #-[ 編集]
141522 
>141510
この記事で、現行のPhi(Knights Corner)とHawaiiを比較する意味が解らない。
2013/12/01(Sun) 02:20 | URL | LGA774 #-[ 編集]
141565 
これ相当インパクトあるよ。ハイエンドGPU並のピーク性能やメモリ帯域はもちろんだが、
何よりも「それがフリーランチで手に入る」ってのが素晴らしい。
CUDAやHSAに対し、ソフトの生産性ではぶっちぎりの首位に立ったと言えるだろう。

まあ価格とか、72コアでキャッシュコヒーレンシ維持して実効性能が出るのかとか
いろいろ疑問はあるし、真価はまだわからないけど。
2013/12/02(Mon) 03:25 | URL | LGA774 #-[ 編集]
コメントを投稿する(投稿されたコメントは承認後表示されます)
トラックバック
この記事のトラックバックURL
https://northwood.blog.fc2.com/tb.php/7227-dd7b8dd0
この記事にトラックバックする(FC2ブログユーザー)
この記事へのトラックバック