北森瓦版 - Northwood Blog (Author : 北森八雲. Since July 10, 2006.)
Intel 15th Gen CPUs to Get Rentable Units: Why Hyper-Threading is Going Away (Hardwaretimes.com)
This will be the secret weapon of the future Intel Core CPUs, its Renting Unit(El Chapuzas Informatico)

最近のIntel CPUに関する噂でHyperThreading technologyが終焉を迎えるというものがある。2024年下半期予定の“Arrow Lake”ではHyperThreading technologyに代わり、Rentable Unitが重要な機能となるようだ。

ことにPCにおいては異なる性能のCPUコアを搭載したProcessorを最大限活用することは難しい。基本的にOSのカーネルが様々な実行スレッドをCPUに割り当てている。だがP-coreとE-coreが混在するとことは複雑になる。その解答がProcessorに特別なユニットを搭載することで、このユニットにプロセスをCPUコアに適切に割り振らせる。まだこれは未来の話であり、今はOSがこの仕事を担っている。だが将来のIntel CPUはこの問題を解決する方向に進む。
 
今回の話題となるIntelのパテントは“Methods and Apparatus for Parallel Instruction Scheduling Unit Hybrid Cores.”と題されている。このパテントの内容こそ、今後のIntel CPUからHyperThreading technologyが消え去る理由を明確にしており、Rentable Unitが何をするものかを示している。

現時点で、CPUに加えられたE-coreは性能の問題を引き起こしている。バックグラウンドタスクや負荷の低いタスクをE-coreに割り当てられることで、P-coreが何もせずニート状態となり性能を低下させている。
Rentable Unitの内容や先のパテントに記されている。パテント内では該当する回路は“instruction processing circuitry (104)”と記されているが、これがRentable Unitに相当する。Rentable Unitの働きは以下の通りである。


  • Processorの命令の取得に際し、Rentable Unitは実行スレッドに送るプロセスを受け取る。
  • 次の段階で、使用できるリソースと状態に応じてRentable Unitがそれぞれのプロセスを異なるパーティションに分割する。パーティション分割はコードの複雑さと実行時間、あるいはCPUそのものの状態、そしてパーティションの順番に応じて行われる
  • この考え方は同じスレッドのパーティションを様々なコアにスケジューリングすることで、ワークロードの実行速度と効率を高めるというものである。


Rentable Unitが搭載された将来のIntel CPUはコアの数や複雑さに強調されることなくIPCを高めることができる。一方でHyperThreading technologyの諸問題も排除される。

Rentable Unitの概念をより良く示した図がパテント内にある。例として2つの異なるタスクがある。Rentable Unitがない現在ではこの2つのタスクはそれぞれ異なる実行スレッドとして処理される。
P-coreに割り振られたスレッド1はコアの高い性能により割り当て時間が100%に達する前に処理が終わってしまう。そしてその後はコアが何もしないバブルが発生する。一方、E-coreに割り当てられたスレッド2はE-coreの性能の低さで、割り当て時間内に処理が終わらない。
Rentable Unitはこれらの実行スレッドを分割し、P-coreの割り当て時間を100%使用できるように配分する。HyperThreading technologyを使用せずともP-coreを効率よく使用できるのである。Rentable UnitはP-coreが処理を終了してバブルに入る前にE-coreのタスクを割り振るという言い方もできるかもしれない。
Rentable Unitによるスレッド分割・割り振りはP-coreとE-coreの間だけでなく、E-core同士あるいはP-core同士でも行うことができる。Rentable Unitの考え方は、1つのコアが間に合わなくとも、別の使えるリソースを用いてプログラム実行を高速化することで、Processor内に使われていないリソースが存在しないようにするものだ。


“Arrow Lake”で導入されるというRentable Unitであるが、それに関するパテントの解説記事である。なんとか頑張って読んでみたが、理解が追いついていないところも多々ありそうなので是非とも原文も当たってみて欲しい。

一言で言うとRentable Unitの役割はProcessor内のリソースを余すことなく使うためのもののようだ。スレッドを分割し、Processor内のリソースを最大限使用できるよう配分する。コアの使用効率が上がるので、HyperThreading technologyで無理してスレッドを詰め込む必要はなくなり、諸問題を抱えるHyperThreading technologyを追放できる。

コンセプトはわかりやすいが、スレッドを適切に分割する方法、Processor内のリソースを正しく監視し、分割したスレッドを散らかすことなく配分する方法・・・このあたりが難しい点になりそうだ。

スレッドの分割と並列実行というと生まれることのなかった“Tejas”で導入されるかもしれないといわれていたヘルパースレッドを思い出す方もいるかもしれない。もっとも、ヘルパースレッドはHyperThreading technologyをさらに進化させてメモリアクセスレイテンシを隠蔽するためのもの、今回のRentable Unitは異種混合Multi-core時代にコアをより効率的に使うためのものなので別物ではあるが、最初のスレッドを分割する点は似ているかもしれない(?)

Intel、次世代Hyper-Threadingテクノロジを公開(Impress PC Watch / 後藤弘茂のWeekly海外ニュース)

ヘルパースレッドが語られた当時の記事を見返してみた。
今はCEOとなっているPat Gelsinger氏が当時はCTO兼上級副社長としてヘルパースレッド関連の研究に携わっていたようだ。

・・・偶然だろうか?
関連記事



○Amazon売れ筋ランキング CPU メモリ グラフィックカード マザーボード SSD 電源

コメント
この記事へのコメント
196847 
令和版bulldozerとな
2023/08/20(Sun) 14:59 | URL | LGA774 #-[ 編集]
196848 
処理内容によってCPUコア内のリソースを丸々使ったり分割して並列処理できる様になる?

HTTやハイブリッドアーキより洗練されるけど、ヒルズボロが開発してるのだろうか?
2023/08/20(Sun) 15:30 | URL | LGA774 #-[ 編集]
196849 
特許はこれなのかな?本文とはちょっと題名違うけど。
https://patents.google.com/patent/US20230168898A1/

演算器の稼働率はHyperThreadingより良くなるだろうけど、別のコアに途中で移動するとなるとレジスタやキャッシュの効率が悪そう。
特にデータ移動に伴って電力効率が悪くなる気がするんだけど、大丈夫なのかな。
2023/08/20(Sun) 16:36 | URL | LGA774 #-[ 編集]
196850 
シンプルなP/Eですらちゃんと機能してないのにどんどん複雑化してるなぁ
2023/08/20(Sun) 16:54 | URL | LGA774 #-[ 編集]
196851 
1年半前に動画エンコードで、Pコア遊ぶ現象はWindows11環境で確認した。
Windows10環境だと、Pコア遊ぶことがなくEと共にフルで動作する。
OSとIntel Thread Directorの組み合わせによる欠陥と思っていた。
2023/08/20(Sun) 17:18 | URL | LGA774 #-[ 編集]
196852 
イマイチピンと来ないけど、P-Coreを遊ばしておく位ならE-Coreとして使えば良いんじゃね。
って話っぽく見える。
2023/08/20(Sun) 18:01 | URL | LGA774 #-[ 編集]
196853 
Hardwaretimesを読んでみたけど、OSがやってきたスケジューリングをハードウェアでやります程度にしか理解できんな。
仮想化支援機能みたいにソフトウェアでもできるけど、ハードウェアでやれば速くなりますよって感じ。
負荷測定とかスレッド切り替えがOSから解放されたら軽くなる期待はあるね。

これによってソフトウェア側に変化を強いるのかどうかが気になるな。まぁゲームとか独自に空きコア探しやってたりの最適かやってたら、ご破算にされるだろうけど。

> PCI-Express電源においては
これってパテントの方に書いてあるんですかね?文量多くて読む気失せた :-(
2023/08/20(Sun) 18:37 | URL | LGA774 #-[ 編集]
196854 
HTTも実装当時は上位でも4コア?くらいだった記憶あるけど
現在はミドル以下ですら多コア化に加えてEコアまで付いてくるからなぁ…
2023/08/20(Sun) 19:30 | URL | LGA774 #-[ 編集]
196855 
色々と感慨深いものがある。
HTTについてはよく「ユニットの有効利用」と言われるが、昔マニアの方が「本質的にはメモリレイテンシの隠蔽の方が重要」という説を推されていて、その説に基づけばRUとは競合するとは思えないのだが。
そう言えば昔、逆HTTともいうべきInverse(Reverse) HTなる技術の話が出たことがあったが、もしかして、Intelのハイブリッド路線そしてRUの導入はその布石なのかもしれない。
2023/08/20(Sun) 19:50 | URL | LGA774 #-[ 編集]
196856 
いくつか見方ができると思うけど、
・HT(SMT)がより効率化される
・AVX-512問題が解決される(事前判定でPコアにだけ振り分ける)
・GPGPUやVPUなどさらなる異種コアが入れられる(特許に書いてある)
技術的な見方は
・継続的に開発されている異種コア間オフロードの一つ
・HTの発展形としての巨大HT
・Thread Director(OSに対するヒント)をハードウェア振り分けに変えた
・フロントエンドのみのコアとバックエンドのみのコアを分離して独立に組み合わせられるようにした

EコアにAVX-512を入れる動きがないとか、いろいろな動きと整合的ではある
2023/08/20(Sun) 20:48 | URL | LGA774 #-[ 編集]
196858 
↑特許の4枚目の図を見てやっと理解できた気がする

スレッド毎にPコアEコア振り分けてたのをパズルの様に細かく分けて最短で並列処理させる仕組みなんだな

既存のプログラムにも効果あるものなのかわからないがNetburst以来四半世紀振りに新構造きた
2023/08/20(Sun) 21:40 | URL | LGA774 #-[ 編集]
196859 
Win12にはAI系だけでなくこいつの制御プログラムも組み込まれてそう
2023/08/20(Sun) 21:47 | URL | LGA774 #-[ 編集]
196862 
ちょっと期待してもいいのかな?
今のIntel製CPUはあまりにも酷すぎる。
マーケティング的に絶対言わないがメニーコアが必要なタスクで同期取らないベンチを除くと
実アプリでは殆どRyzenに勝てないどころか、低TDP枠では大幅に負けるからな。Eコアで足引っ張られてるのにワッパでも負けるし。
言わんけどIntelも理解はしてるからこそのギミックなんだろう。
少なくとも実アプリで酷い事にはならない様にはしたいんだろうな。
2023/08/20(Sun) 22:31 | URL | LGA774 #-[ 編集]
196863 
Rentable Unitによってシングルスレッドタスクの実行速度がシングルコアの理論値を超えることもあり得るんだろうか?
2023/08/20(Sun) 22:36 | URL | LGA774 #-[ 編集]
196864 
マルチコア化に対するひとつの回答って感じ
ただ余計な処理も増えて電力効率は悪そう
データの移動を抑制するためにL2$を大きくしてきたとも考えられるかもね
見かけよりキャッシュ量が少なくなって文句が出そうだけども、そこはADM$で補うのかな
2023/08/20(Sun) 23:55 | URL | LGA774 #-[ 編集]
196865 
Pコアがほとんど完了させた処理とEコアが手こずってる処理をいいタイミングで交換して同時フィニッシュを目指す仕組みという理解で合ってますかね?
レジスタにとどまらずL1L2も頻繁に更新されることになるのである程度時間がかかる処理でないとメリットが小さくなりそうです

CGレンダリングのような、早く処理を終わらせても遊ぶ暇なく次の処理が入ってくる、単純なEコア増量もPコアのSMTも両方有効に働くような用途だと逆に性能が下がってしまうのではないかという心配がありますが、まあintelなので大丈夫でしょう
2023/08/21(Mon) 00:28 | URL | LGA774 #-[ 編集]
196866 
bulldozerというならEコアがbulldozerやな
bulldozerが2個のコアでL2キャッシュを共有
Eコアが4個のコアでL2キャッシュを共有
2023/08/21(Mon) 01:15 | URL | LGA774 #wLMIWoss[ 編集]
196867 
もうe-core, p-coreの混在をやめてどちらか一方に統一したほうが無駄もなくなるのではなかろうか。
2023/08/21(Mon) 01:16 | URL | LGA774 #-[ 編集]
196868 
>>196855
数値計算みたいに演算器をギチギチに回すプログラムを全コアで立ち上げる時は、そもそも全プログラムが同じ演算器を使っていることになるので、少なくともスパコンとかワークステーションとかそういうの向けのCPUのHTは、メモリレイテンシ隠蔽が本質というか目的そのものなんでしょうね。その極致がGPUになるわけですし

HTをやめるってことは、sierra forestを筆頭にEコアだけのCPUの評価が進んできて、HTは少なくともPC用のベンチマーク走らせす分にはさしたる効果ないわって結論になったんですかね? メモリレイテンシよりも先に問題になる箇所が多すぎる的な?
2023/08/21(Mon) 02:54 | URL | LGA774 #-[ 編集]
196869 
ふっふっふ、Pコアのみの我らに死角などない(12400系)。
2023/08/21(Mon) 07:38 | URL | LGA774 #-[ 編集]
196870 
>e-core, p-coreの混在をやめてどちらか一方に
AMD「せやな」

P-coreやE-coreというよりも全体的な効率化にみえる
スケジューラーをCPUの処理振り分け前に持ってくる感じだから、ソフト(とコンパイラー)側が対応しないとまともに動かなそうまである
ただ、E-core以外にもNPUなどの存在を考えると、全体を効率的に動かすには必要になってくる機能ではありそう
2023/08/21(Mon) 08:16 | URL | LGA774 #-[ 編集]
196871 
μOPs Fusion…ってコト!?
2023/08/21(Mon) 09:01 | URL | LGA774 #-[ 編集]
196872 
>>196867
今のP/E実装は対AMDの時間稼ぎで最終的には統一方向に行くんだろうなあという気はしますが、
ただ今回のRentable UnitはEをP相当にする前にPをSuperPにする方に使われそうな気はする
シングル動作するときに隣のPの遊んでるUnitを借りてきてボトルネック解消みたいな使い方があり得るから
その分普段のコアあたりのユニットは少なめに出来るのでサイズは小さくなる
2023/08/21(Mon) 10:17 | URL | LGA774 #-[ 編集]
196873 
ハードウェアで強制的にコアのリソース管理するならマルチスレッドに対応していない古いアプリにも効果ありそう
2023/08/21(Mon) 14:14 | URL | LGA774 #-[ 編集]
196874 
熱的に余裕がある負荷印加初期やコア数の少ないCPUでは効果有りそうだけれど。。
2023/08/21(Mon) 17:21 | URL | LGA774 #-[ 編集]
196875 
シンプルなのが合理的なのに複雑なのが勝つ不思議。
2023/08/21(Mon) 18:29 | URL | LGA774 #-[ 編集]
196877 
>196867
デスクトップでオールEコアはシングル不足になるし、オールPコアはComet Lakeの再来になるので現実的ではない
サーバー向けは最初からその計画だけど
2023/08/21(Mon) 18:59 | URL | LGA774 #-[ 編集]
196878 
eコアpコア混在がそもそもの間違いでは…っていう気もするがそれを直さずに別の手段で何とかしようとするのはすごくintelっぽい
2023/08/21(Mon) 22:59 | URL |   #-[ 編集]
196879 
>196868
HPCはハードに合わせて走らせるプログラムのほうを最適化させるから最初からSMTなんか要らないのよ。

出来合いのソフトウェアで軽量なタスクを大量に処理するサーバではPコアにSMTがあったほうが利用効率は上がるけど、それならEコア4つのほうが良いだろうしね。
2023/08/21(Mon) 23:17 | URL | LGA774 #-[ 編集]
196880 
既にツッコミ入ってるけど確かにPコアオンリーでHTオンにした方が大抵の場合で早そうだよね
MLIDだとIntel(というかJim Keller?)は4way/8wayのHTTも検討してたが蹴ったって事だから相当なギャンブル

Intelとしては電力効率&面積効率を重視してのRentable Unit採用なんだろうけど、スループット重視ってまんまBulldozerでは?

Pコアがどんだけシングルスレッド偏重に出来るか次第でコケるかうまく行くか、極端に結果変わりそう
2023/08/21(Mon) 23:37 | URL | LGA774 #-[ 編集]
196881 
>>196871
ソレな気がする
スレッドを命令に分解→ 振り分け
2023/08/21(Mon) 23:42 | URL | LGA774 #-[ 編集]
196882 
Arrow lakeもBIOSでEコア無効にして使うのが正解だな
2023/08/21(Mon) 23:49 | URL | LGA774 #-[ 編集]
196883 
P+Eで今まで不便だったり処理が遅くなったことはないけど、単に運が良かっただけ?
それとも、10だとガチで使い分けできないとか?(当方は11使用中)
2023/08/21(Mon) 23:57 | URL | LGA774 #-[ 編集]
196885 
>196883
あるいは単純にCPUをフルパワーで使っていない
2023/08/22(Tue) 08:05 | URL | LGA774 #-[ 編集]
196886 
PオンリーのG7400とEオンリーのN305が勝負したらN305が勝つからなぁ(有効コアの面積はほぼ一緒)
今更統一するより使い分けを強化した方が良いのは理にかなってると思う
2023/08/22(Tue) 08:30 | URL | LGA774 #-[ 編集]
196888 
終了時間の分からないものをどうやって分けるんだ
振り分けはOSの仕事だと思う
2023/08/22(Tue) 13:34 | URL | LGA774 #-[ 編集]
196891 
計算の前に振り分け工程が必ず入るって事はモッサリしそう
2023/08/22(Tue) 20:24 | URL | LGA774 #-[ 編集]
196892 
>>196883
ハイブリッドが明白に分かるほどネガティブなら、とっくに検証記事が出回ってるし、雑誌のルーティーンの実アプリベンチでも引っかかる。
レビュー記事のメタアナリシスでもハイブリッド由来のネガティブな影響は全然出てこないので、自分はしょうがないから自前で検証したくらい。
確かにネガティブな影響を及ぼす例はあるが、ここで書いてる人はノイジーマイノリティか思い込みが多いと思う。
HWiNFOで測ってもらったら単なるサーマルスロットリングをハイブリッドのせいと思い込んでた人なんてのも複数例見かけてる。
2023/08/22(Tue) 20:34 | URL | LGA774 #-[ 編集]
196893 
>>196855
メモリレイテンシが一番遅くてそれを待っている場合HTは有効だが、メモリレイテンシ以外がボトルネックになってくるとHTは無駄にリソース競合を作っているだけでむしろ効率を落とす(Hardwaretimesのこの部分)。
"Not all workloads have the stalls needed to make hyper-threading relevant, in which case the two threads start competing for resources, lowering the performance in the process. "

Rentable Unitの分割単位(パーティション)の粒度が十分に小さければHTと同じことをさせることが可能だが、特許だけ見るとそうとは限らないように見える。
2023/08/22(Tue) 20:43 | URL | LGA774 #-[ 編集]
196895 
Eコアって言ってもSkylakeに近い性能あるんだろ
2023/08/22(Tue) 23:21 | URL | LGA774 #-[ 編集]
196897 
将来、より沢山のコア、より多種類のコアが搭載されることを想定しているんでしょうねぇ
2023/08/23(Wed) 04:28 | URL | LGA774 #vxAodCeM[ 編集]
196899 
Skylakeに近いというと少しは聞こえがいいけどSkylake自体SandyからIPCが大きくは向上してないですしそう考えるとやっぱり微妙では?
2023/08/23(Wed) 08:44 | URL | LGA774 #-[ 編集]
196901 
y=y+x*rand()のループみたいな処理ってそう簡単にCPUで分割できるもの?
2023/08/23(Wed) 12:25 | URL | LGA774 #-[ 編集]
196903 
自分はAlder/Raptor使いではないけど、何でこうもハイブリッド構成にネガティブな意見が出るのか分からない。Eコアが単純に数を盛るためのインチキな印象を与えるからだろうか。

理論的に考えると、処理すべきスレッドが決して潤沢でない個人用途では、どう考えてもハイブリッド構成の方が合理的。同じダイサイズで仮定すると、明らかにホモジニアス構成よりもハイブリッド構成の方がST/MT共に性能は向上する。
2023/08/23(Wed) 22:25 | URL | LGA774 #-[ 編集]
196904 
>>196903
問題点はintel自身がRentable Unitのパテントで提示してるし、それを無視するのは合理的でも論理的でもない単なる思い込みだよ。
2023/08/24(Thu) 00:34 | URL | LGA774 #-[ 編集]
196905 
>>196903
上でも話がでてたけれども、HPCのようなCPUにあわせてソフトウェアを作る業界は、ハイブリッドとかやめてくれよとなっていると思います
一般個人向けPCでもゲームエンジンなどはそういう面が大いにあるでしょうし、文句をいう人がでること自体は不思議ではないかと
2023/08/24(Thu) 02:21 | URL | LGA774 #-[ 編集]
196906 
>>196904
>それを無視するのは合理的でも論理的でもない単なる思い込み
その解釈は間違いだと思う。
理論的にはハイブリッド構成の方が優れているが、現時点では机上の計算通りに行かない点があり、その一つがパテントで示されたE-Coreのボトルネック、ということだと思う。
もしそもそもハイブリッド構成の方が優れているという理屈が思い込みであるのなら、大前提からして間違えているということなので、IntelはRUなどという機構を考える以前にハイブリッド構成を切り捨てるべき、ということになる。
2023/08/24(Thu) 05:29 | URL | LGA774 #-[ 編集]
196910 
>196888
自社製品の性能の生命線を「あ、対応リソース無いんでAMDでいいです」とか言い出しかねない第三者に依存する仕組みってどうかと思うよ
Linuxでさえカーネルにまともなパッチが当たったのが去年の秋頃だし
2023/08/24(Thu) 09:25 | URL | LGA774 #-[ 編集]
196911 
ハイブリッド構成自体はいいと思うけどEコアをひたすら増やしていく路線はどうなのかな?って思ってます。
Eコアが生きてきそうなPコアが少ないローエンドにはEコアないですし。
2023/08/24(Thu) 10:49 | URL | LGA774 #-[ 編集]
196912 
196903の「処理すべきスレッドが決して潤沢でない」が「個人でサーバーみたいな多くの処理しない」と「個人ではマシンリソースは限られる」のどちらとも読めるんだが、後者としておく。

トランジスタ数が潤沢でなくなる今後を考えれば、少ないトランジスタ(ダイ面積)でそこそこの性能のEコアは経済合理性で私も肯定的に見てる。
CPUの中身理解して高いけどPコアだから金は惜しまんなんて購買者、世の中ではかなり少数派と自覚すべきかと。
2023/08/24(Thu) 11:49 | URL | LGA774 #-[ 編集]
196913 
この概念を発展させればPコアEコアの二種類じゃなくて何種類でも作れそうだな
スマホ用はもう4種類くらいになってるしこの辺の構成が自由自在だと強いと思う
2023/08/24(Thu) 12:43 | URL | LGA774 #-[ 編集]
196916 
>>196912
すみません・・・前者です・・・。
まぁでも前者でもEコアが有用(だと思う)という意見は変わらないです。
2023/08/24(Thu) 23:37 | URL | LGA774 #-[ 編集]
196922 
>196906
理論というなら問題は古典的なアムダールの法則そのままで
しかも低速なEコアがスレッドを離さないから尚タチが悪い

QualcommやAppleはじめとしてハイブリットもいろいろあるけど
こんなアプローチは大手ではIntelしかやってないし
AMDに言わせればデスクトップにおいては適当でない
要するに大前提から間違えている可能性は多分にある
2023/08/25(Fri) 01:24 | URL | LGA774 #-[ 編集]
196924 
>>HPCのようなCPUにあわせてソフトウェアを作る業界は、ハイブリッドとかやめてくれよとなっている
誤解があります。
私がハイブリッドが有効だと言う大前提として「個人用途ではサーバーのような多数のスレッド処理の機会はまずないし、並列データ処理にはGPUという選択肢もあるので、本来はシングルスレッド性能を重視する設計に最適化すべき」との考えがあります。
ですので、サーバー向けやHPC向けにE-Coreは不適当だと思っていますし、実際Intelもサーバー向けは従来のホモジニアス構成で展開しているのはご承知の通りです。
2023/08/25(Fri) 06:20 | URL | LGA774 #-[ 編集]
196934 
>AMDに言わせればデスクトップにおいては適当でない
Zen4cなんていうキャッシュ減らしただけのもの作ったりするから、開発力不足を隠すハッタリに見えちゃうんだよなぁ。
2023/08/25(Fri) 11:21 | URL | LGA774 #-[ 編集]
196938 
>196916
Eコアが有能なのはそれはそう。ただIntelのアプローチが正しいかは別かなと
AMDのように通常コアを再配置・再設計してEコア化するアプローチの方が現時点ではよさそう

記事の機能に限って話すならば将来的には有益になってくる可能性は高い
汎用コアではなくCPUに統合されたより専用コアを効率的に使えるようになる可能性があるから
2023/08/25(Fri) 12:49 | URL | LGA774 #-[ 編集]
196942 
アムダールの法則に基づけば、Eコアを導入することによってPコアはより大きくできて並列化できない部分を高速化でき、コア数を増やす方向に考えれば並列度の高い部分が高速化できるので、どっちに転んでもいい効果しかないと思うけども
実際のプログラムでは並列スレッドの上限が設けられていてアムダールの法則通りにはいかないけれどもこれは理想的には無視できるので(プロセッサーが多コア化するほどいずれそれに最適化してくれるとも言う)
2023/08/25(Fri) 22:32 | URL | LGA774 #-[ 編集]
196951 
>196934
コア設計再配置・高密度化・キャッシュ構成などの変更を行ったZen4Cを「キャッシュ減らしただけ」に見えるのは逆にすごい
ミリ系にあるある勘違いのF-2とF-16が同じ設計と言っているぐらいに凄い
2023/08/26(Sat) 11:04 | URL | LGA774 #-[ 編集]
196954 
>>196924
いや誤解はないです

元のレスはゲームはどうなのという話ですね。シングル性能が重要とされるタイトルが多いとはいえ、マルチスレッド対応自体は今時みんなやってるわけで、少なくともコアエンジンを作っている所はHPCとやってることはあまり変わらないのではないかと思うのですけれども、どうでしょうか

またそれとは別に前提についてですが、i3とかi5とかなら、どうせ重い処理はシングルで動いていてまた並列に何本も走ってたりはしないだろ、という仮定は確かに妥当かなと思います
一方でi7やi9になってくると、個人用途とはいえエンコーダーを延々ぶん回すとかいったようなHPCに片足踏み込んだ用途が無視できなくなってきて、前提が正しいかは怪しいのではとも思います
i7i9をどういう層が買っているのかの正確なところは知らないので、実際はそんなことないのかもしれませんけれども
2023/08/26(Sat) 12:56 | URL | LGA774 #-[ 編集]
196960 
>>196954
>ゲームはどうなのという話
少し古い(2019年)ですが、同一アーキでコア数違いのゲームベンチスコア比較を見たことがあります。
League of Legendsで2コア→4コア時にフレームレートが45%改善を示していましたが、それ以外は「コア数を2倍3倍にした割に大した伸びではない」という印象でした。
少なくとも、コア数を倍にしたからといって、スコアが倍になることはないし、それどころか平方根(要するにポラックの法則)にすら遠く及んでいないものがほとんどです。
実際にゲームをプレイする方からすると「コア数を4倍にして50%改善は劇的」となるのでしょうが、自分の感覚では「4倍のコア数で2倍にすらならないのは、マルチスレッド対応としては落第点」というところです。
しかも、自分の知る限り、そもそも同一アーキでコア数4倍にしてスコアが50%改善すること自体ほぼ皆無のレアケースですし。

最新のゲーム環境を存じ上げないのですが、こういう認識の違いがあるので、私は基本的にゲームで謳われるマルチスレッド対応には基本辛口です。
だからこそ、ゲームにおいてもハイブリッドでシングルスレッド性能に重点を置いた方が(少なくとも理論上は)有利である、という立場です。
2023/08/26(Sat) 18:02 | URL | LGA774 #-[ 編集]
コメントを投稿する(投稿されたコメントは承認後表示されます)