北森瓦版 - Northwood Blog (Author : 北森八雲. Since July 10, 2006.)
Intel Arrow Lake-S 24 Thread CPU Leaked - Lacks Hyper-Threading & AX-512 Support(TechPowerUp)
Next-gen Intel Arrow Lake-S CPU spotted with 24-threads and no AVX-512 functionality(Tom's Hardware)
(OC3D)
Intel Arrow Lake-S CPU spotted with 24 threads, no Hyper Threading and AVX512 support(VideoCardz)
I spotted a new #ArrowLake-S (CPUID C0660, 24 threads, 3GHz, w/o #AVX512) among the #Intel test machines:(InstLatX64@InstLatX64)

InstLatX64氏がTwitterで“Arrow Lake-S”のEngineering Sampleを搭載したIntelのテストシステムを紹介している。テストシステムのCPUのスレッド数は24-thread、周波数は3GHzであった。そしておそらくファームウェアで無効化されているものと推定されるがAVX-512のサポートを欠いていた。

シンプルにスレッド数だけ比較すると今回の“Arrow Lake-S”は“Meteor Lake”ベースのCore Ultra 9の22-threadよりも2-thread分多い。しかし、より興味深いのは24-coreで24-threadであることだ。“Arrow Lake”はHyperThreading technologyを欠くという噂があったが、今回のシステムで見られるそれはその噂に沿っていることになる。
 


上から4番目に“Allowing 24 CPUs”の文字列がある。おそらくこれがスレッド数を示しているのだろう。噂では“Arrow Lake-S”の最大構成は8 P-core + 16 E-coreの合計24-coreであるとされる。現行の“Raptor Lake-S”と同じ構成であるが、“Raptor Lake-S”はP-coreがHyperThreading technologyに対応しており、24-core/32-thread動作となる。一方、“Arrow Lake-S”はHyperThreading technologyに対応しないと言われており、シンプルに24-core/24-thread動作となるようだ。HyperThreading technologyの代わりにRentable Unitが将来的に導入されるという噂もあるが、“Arrow Lake”世代では間に合わないという見方が多い。

HyperThreading technologyは“Willamette / Foster”で実装され、“Northwood / Prestonia”で有効化された。Core 2世代で一度引っ込められるが、その次の“Nehalem”から再び実装され、現在の“Raptor Lake-S”や“Meteor Lake-S”に至る。中断はあるが20年以上使われ続けている技術となるが、この話の通りであればいよいよ転機が訪れるのかもしれない。

AVX-512については“Alder Lake”や“Raptor Lake”と事情は同じだろう。P-coreは対応しているが、E-coreが対応しておらず、全体としては無効となっているのだろう。将来的にはP-core, E-coreの命令セットの違いを吸収できるようにする予定のようだが、“Arrow Lake”世代は間に合わないのかもしれない。
関連記事



○Amazon売れ筋ランキング CPU メモリ グラフィックカード マザーボード SSD 電源

コメント
この記事へのコメント
199287 
Zen 2 登場以降、年2モデル投入も有る強行スケジュールの無理が目に見える形で出て来た…と言った所でしょうか?

外野から見れば、一度立ち止まって
HT又はその後継機能搭載のP-core
P-coreと同じ命令セットが処理出来るE-core
この辺を時間を掛けてでも、しっかり造り込んだCPUを投入すれば良いのでは?…と思いますが、現場はそうも行かないのでしょうね
2024/02/03(Sat) 04:50 | URL | LGA774 #-[ 編集]
199290 
RUへの移行の準備でしょう
2024/02/03(Sat) 07:19 | URL | LGA774 #-[ 編集]
199297 
SMTの廃止はセキュリティや消費電力・シングル性能の面ではプラスに働くけど、マルチ性能とワッパ・何よりカタログスペック面でマイナスだ

Lion CoveはSandy Brige以来の革新的アーキテクチャなのだろうか?
2024/02/03(Sat) 15:16 | URL | LGA774 #-[ 編集]
199302 
言われて納得したのが、
・HT用にフロントエンドを増やすとその分消費電力は増える
・しかしPC用途でHTで上がるマルチ性能はせいぜい2割
・よってHTで得られるマルチ性能増分の電力効率は低い

・Intelはハイブリッド化したのでEコアを増やせば効率よくマルチ性能を稼げる
・TDP付近の電力効率の面で、HTのδとEコアクロック向上のδを比べると、後者の方が高効率

という理屈でHTを無効化してEコアのクロックを上げるほうが結果的に同電力性能が上がる、という説は説得力があった
2024/02/03(Sat) 20:44 | URL | LGA774 #-[ 編集]
199303 
HTが効果があるのはメモリの待ち時間で、サーバー用多コアでは効きやすくなるので、たぶんXeonでは無効化されない。むしろSMT4を実装してくる可能性すらある。
2024/02/03(Sat) 20:45 | URL | LGA774 #-[ 編集]
199304 
なんかSkylake並みの生煮え感しかないな
せめてエラッタだけは少なくあって欲しい
2024/02/03(Sat) 21:36 | URL | LGA774 #-[ 編集]
199305 
ワッパを少しでも稼ごうとして、訳わかんなくなってなければいいけど。
2024/02/03(Sat) 23:39 | URL | LGA774 #-[ 編集]
199310 
>>199302
どっかのサイトのリーク情報だけど
8+16でRaptorとコア数が変わらなくてPコアのIPCも10%程度の上昇という話と一緒に
HTが無効化されてはいるがマルチ性能が大幅に上がるみたいな話も併記してあって
「そんなことあるか?」って思ったけど199302の話の通りなら「有り得る」のかな?

今後はクライアントPCではHTをオミットして
HTが有効なXeonにだけ実装するみたいな展開もあるのだろうか?
2024/02/04(Sun) 00:49 | URL | LGA774 #8l8tEjwk[ 編集]
199315 
>>199302
一理ありますが、恐らくクライアント向け限定の話でしょうね。
他の方も仰っていますが、サーバー/データセンター・HPCでは、まずSMTは死なないでしょうし、ハイブリッド構成もここまで本格的に導入されることもないと思います。
2024/02/04(Sun) 07:25 | URL | LGA774 #-[ 編集]
199316 
クライアントPCではマルチスレッド性能はEコアだけでも「お腹いっぱい」になりつつある。

なので、HTを止めても実害はほとんどない。それよりも、スケジューラーとデコーダーが軽くなったPコアのパイプラインが縮む可能性の方が明るいニュース。
2024/02/04(Sun) 08:45 | URL | LGA774 #-[ 編集]
199317 
スループットが低くてもいいからPコアと命令が完全に共通なEコアくれ
2024/02/04(Sun) 08:54 | URL | LGA774 #-[ 編集]
199319 
>199302
なんだか不自然に聞こえる
HT用にフロントエンドを増やすとその分消費電力は増えるけど
SMTをやめてEコアを増やせばフロントエンドだけの消費電力増加じゃ済まないし
マルチ・シングルのタスクでそれぞれPコアとEコアが遊んでしまう問題は悪化する

結局Rentable unitとセットで運用しないうちはメリットを殺してデメリットを得るだけという気がする
2024/02/04(Sun) 11:13 | URL | LGA774 #-[ 編集]
199320 
Raptor比Eコア増量で補償してほしい気持ちはないではないけど、HT廃止自体は避けられない方向性には感じる
1コア2コアのスレッド数が倍になる頃は効果絶大だったけどコア自体が多い今となっては効果も限定されるしHT実装コストをシングルスレッドに振って気はする
Eコアならマルチ性能を底上げしつつモバイルなら省電力に転用できるしね(というか本来はそっちが主目的のはずだが)
HT付きPコア+EコアなんてやってるのはIntelだけで理想的なスレッド割当をするのも困難だし、HTやめますか、Eコアやめますかなら今はHTやめるのが時代の流れかなと。
2024/02/04(Sun) 13:51 | URL | LGA774 #-[ 編集]
199324 
>>199319 結局Rentable unitとセットで運用しないうちはメリットを殺してデメリットを得るだけという気がする

私もこれな気がします。
ちなみにYoutubeに13900kをHT切ってゲームしてる動画上げてる人いましたが大差がなかったという結論でしたのでクライアントは今の時代そこまで影響ないと思いますよ。
ARLの性能向上が低いのはHTが無いからというのはまず無いです,これはプロセスによる大幅なクロック回帰によるものでしょう。
2024/02/04(Sun) 15:22 | URL | LGA774 #-[ 編集]
199326 
現行の製品の多くでPコアのSMTが有効になっている理由のひとつに、全スレッドがフルに動く場面でスレッドごとの性能差を小さくできる(1P2T≒2E2T)からハイブリッド構成を前提にしていないプログラムでも性能が出しやすいというのがあると思いますが、アプリやOSの進歩で差が問題にならなくなったとintelが考えているのかもしれません
ArrowLakeの段階ではPE共に設計の大幅な変更はないと思いますが、性能比2:1にこだわる必要がなくなったとなれば将来的にさらに巨大で少数のPコアとシンプルさを維持した(場合によってはより小規模になった)多数のEコアという構成に進化するのではないかと予想します
2024/02/04(Sun) 15:44 | URL | LGA774 #-[ 編集]
199331 
今時のHTなんてベンチのスコア稼ぎ程度にしかならないからなぁ…(ゲームはむしろHT有効でFPS下がる)
サーバーならともかく、ゲーミングをうたうコンシュマー向けなら廃止した方が良いだろう
2024/02/04(Sun) 23:49 | URL | LGA774 #-[ 編集]
199337 
>>199319
それこそ以前言われたダークシリコン問題ってやつだろうpコア最適化進めてさらにシュリンク進めると熱発生領域が集中しすぎて思ったより速度上がらなくなってると思われる
シングル上げるにはそれもやむなしで進めていくしか無いんだけどそれに必要なのはコア8個じゃなくてスレッド8つなんだとIntel割り切ったんじゃ無いかと
で、あとはマルチ用のeコアで埋める
2024/02/05(Mon) 04:45 | URL | LGA774 #-[ 編集]
199339 
HTTとかSMT切ったほうがfps安定するゲームいまだに多いからな
2024/02/05(Mon) 11:13 | URL | LGA774 #-[ 編集]
199341 
>>199317
それずっと思ってたんだけど、いつまでも変わらないままAVX10で命令が共通でなくてもいい仕組みを作ってきたってことはEコアへの実装に何か不都合があったのかなあ。
別に短い演算器を複数回回すのは他でもやってることだし何が問題なのか分からないが。
2024/02/05(Mon) 12:58 | URL | LGA774 #-[ 編集]
199343 
電力効率で言えばインオーダ型が最高なのは周知。
電力食ってるのはフロントエンドだから、できるだけシンプルなコアに回したほうがいいということでは?
SMTが優れているのは、少ないトランジスタで性能をあげられる点。




2024/02/05(Mon) 17:17 | URL | LGA774 #-[ 編集]
199344 
Xeonでは同じ物理コア数で稼働できるVMの減少はクラウド・ベンダー的に受け入れがたいのでSMTの機能自体は存在するような気もしつつも、クラウド・ベンダー向けにはE-Core Xeonの存在があるのでどちらに転ぶのかちょっと予測が難しいですね。

クラウド・ベンダーのVMの最近のラインナップをみるに、HPC向けなどでシングルスレッド性能重視のインスタンス・タイプが専用で用意されていたりするので、E-Core Xeonがメインストリームのスループット重視で、SMTを外してその分レイテンシーの短縮に全振りする可能性も。

前述の理由でXeon側の都合に振り回されてP-CoreにSMTなしは十分あり得るかと。
2024/02/05(Mon) 18:08 | URL | LGA774 #-[ 編集]
199353 
HTやAVX512はコアの熱密度という点では厳しい、特に3D積層。
Eコア増やしていく方向なら熱密度の問題は無い。
一番の問題はPコアのスレッド数を減らすとEコアに誤爆するアプリが増えるという点。
古いアプリは切り捨てなのかもしれないが。
2024/02/07(Wed) 10:43 | URL | LGA774 #oyV.6EWY[ 編集]
199355 
>199319
そだろか?SMTは多くの命令が実行回路が空くまで待たされて、フロントエンド増やしても効率悪そう。
Pen4ではメモリレイテンシや分岐予測外れペナルティの隠蔽効果もあったけど、予測精度向上&大量L3な昨今のCPUじゃSMTの恩恵も薄れてないかなぁ。
ただデスクトップはこんなところの消費電力論じてもなという気はする。
2024/02/07(Wed) 15:38 | URL | LGA774 #-[ 編集]
199398 
>>199324
あれは最高品質設定でGPUに負荷がかかってる状態だったからだったと思う(HTが大きく影響するのはGPUに余裕があるとき)
「ARLの性能向上が低い」っていうのは何の比較結果を元にしているのかは分からないけど、ベンチマークならほぼ確実にHTが原因
2024/02/10(Sat) 19:07 | URL | LGA774 #-[ 編集]
コメントを投稿する(投稿されたコメントは承認後表示されます)