Intel 14th Gen Meteor Lake CPUs May Embrace An L4 Cache(Tom's Hardware)
Intel Meteor Lake Could Bring Back L4 Caches(techPowerUp!)
Define MOCS and PAT tables for MTL(Freedesktop.org)
Linuxのパッチに“Meteor Lake”でL4 cacheを扱う記述が見られた。L4 cacheはIntelのProcessorであれば“Haswell GT3e / Broadwell GT3e”等においてeDRAMの形で相当するものが搭載されたことはあるが、それほど多く採用されているものではない。
そのLinuxのパッチにはこのような記載がある。
“Meteor Lake”のiGPUはLast Level Cache (LLC) を参照できない。LLCを参照できるのはCPUのみである。このパッチでは、ADM/L4 cacheのサポートを追加し、MOCS/PAT tableの呼び出しを更新する。
Intel Meteor Lake Could Bring Back L4 Caches(techPowerUp!)
Define MOCS and PAT tables for MTL(Freedesktop.org)
Linuxのパッチに“Meteor Lake”でL4 cacheを扱う記述が見られた。L4 cacheはIntelのProcessorであれば“Haswell GT3e / Broadwell GT3e”等においてeDRAMの形で相当するものが搭載されたことはあるが、それほど多く採用されているものではない。
そのLinuxのパッチにはこのような記載がある。
“Meteor Lake”のiGPUはLast Level Cache (LLC) を参照できない。LLCを参照できるのはCPUのみである。このパッチでは、ADM/L4 cacheのサポートを追加し、MOCS/PAT tableの呼び出しを更新する。
ADM/L4 cacheとあり、“ADM”が何を示すかはわかってないが、Tom's HardwareはL4 cacheに対するマーケティング的な名称ではないかと推定している。ADM/L4 cacheの容量は現時点では不明である。
“Meteor Lake”は4つのTile―CPU tile, Graphics tile, SoC tile, IO extender tileからなることが明らかにされている。そしてこれらの下にBase tileがしかれておりインターポーザの役割を果たす。
このうち一番下のBase tileについては純粋にインターポーザであることが明らかにされている。過去のようにeDRAMを搭載しないのであれば、L4 cacheが搭載されそうなのはSoC tileだろうか。
“Meteor Lake”の図を見ると、CPU tileとGraphics tileの間にはSoC tileがあり、CPU tileにあるLLCをGraphics tileが参照できないのも頷ける(=tileまたぎで参照できるようにしなければならない)。SoC tileであればCPU tileともGraphics tileとも隣接するのでL4 cacheを置くならうってつけのように見える(あくまでもそう見えるというだけで、何か根拠があるわけではない)。
このあたりも今後“Meteor Lake”のリリースが近づくにつれ、徐々に明らかになっていくだろうか。色々と興味深い製品になりそうな“Meteor Lake”であるが、デスクトップ向けへの展開が怪しいのは気がかりである。

この記事へのコメント
AMDのDRAM積層計画(northwood.blog.fc2.com/?no=11753)へのあてつけなのか?突拍子もないか,いまいち釈然としないな.
2023/04/13(Thu) 02:12 | URL | LGA774 #-[ 編集]
L1・L2の強化で勝負するZEN5と
L4の新設で勝負するMeteorLakeのどちらに軍配が上がるか楽しみ
L4の新設で勝負するMeteorLakeのどちらに軍配が上がるか楽しみ
2023/04/13(Thu) 03:15 | URL | LGA774 #-[ 編集]
キャッシュレベルがどんどん深くなっていく…
2023/04/13(Thu) 08:03 | URL | LGA774 #-[ 編集]
>194646 思わず「あてつけ」の意味を調べてしまったよ。
goo曰く「遠まわしに言ったり、わざと反対のことを言ったりして非難すること。」だそうだ。
goo曰く「遠まわしに言ったり、わざと反対のことを言ったりして非難すること。」だそうだ。
2023/04/13(Thu) 10:11 | URL | LGA774 #-[ 編集]
問題はL4 cacheはiGPU性能を底上げするくらいにしか役に立たないのに何故かLLCのiGPUアクセスをブロックする謎仕様
という事ならCPU性能を向上させる為のキャッシュという事になるんだけど以前は遅くて使い物にならなかった筈
改良されたんだろうか?
という事ならCPU性能を向上させる為のキャッシュという事になるんだけど以前は遅くて使い物にならなかった筈
改良されたんだろうか?
2023/04/13(Thu) 18:28 | URL | LGA774 #-[ 編集]
Coelacanth's Dreamがこのネタを扱ってるから、技術的な詳細はそちらを見ることをお勧めする。そちらではPonte Vecchioがそうであることを理由にベースダイにL4が置かれると予想している。
>>194646
本文読めば、タイル分割に伴ってGPUがリングバスから切り離されてL3にアクセスできなくなったからiGPU用に必要になったもの、と読み取れると思う。
DRAM積層自体はIntelはLakefieldでやっているからやりたきゃいつでもできるし、たぶんLunar lakeがLakefieldのリベンジでタブレット・スマホへの再進出でDRAM積層をやると思う。
あと現世代のFoverosは半田バンプ方式で、速度的にL4キャッシュ扱いせざるを得ない。
今年後半以降、V-Cacheで使ってるSoICと同じ銅柱接合方式のFoveros Directが量産体制に入るので、それ以降はL3扱いでの増強が可能になる。CPUタイルにPowerVIA通せばベースダイの電源用TSVはいらなくなってレイアウトがしやすくなるし。
>>194646
本文読めば、タイル分割に伴ってGPUがリングバスから切り離されてL3にアクセスできなくなったからiGPU用に必要になったもの、と読み取れると思う。
DRAM積層自体はIntelはLakefieldでやっているからやりたきゃいつでもできるし、たぶんLunar lakeがLakefieldのリベンジでタブレット・スマホへの再進出でDRAM積層をやると思う。
あと現世代のFoverosは半田バンプ方式で、速度的にL4キャッシュ扱いせざるを得ない。
今年後半以降、V-Cacheで使ってるSoICと同じ銅柱接合方式のFoveros Directが量産体制に入るので、それ以降はL3扱いでの増強が可能になる。CPUタイルにPowerVIA通せばベースダイの電源用TSVはいらなくなってレイアウトがしやすくなるし。
2023/04/13(Thu) 20:40 | URL | LGA774 #-[ 編集]
Broadwell-Cみたいなのを出せれば低価格ゲーミングに使えそう
2023/04/13(Thu) 21:48 | URL | LGA774 #-[ 編集]
SoCタイルにキャッシュが入るという情報は前から出てたね
それがL3なのかL4なのかは未だに不明だが
それがL3なのかL4なのかは未だに不明だが
2023/04/13(Thu) 22:03 | URL | LGA774 #-[ 編集]
ADMとはつまりaccelerator dedicated memoryの略でVPU/GNA専用のメモリとしても共用のL4 cacheとしても使える…という妄想
2023/04/13(Thu) 22:05 | URL | LGA774 #-[ 編集]
別件だけれども
IntelとArmが手を組んだのには驚いた。
IntelとArmが手を組んだのには驚いた。
2023/04/14(Fri) 07:18 | URL | LGA774 #-[ 編集]
Haswellの高性能グラフィックスのカギ「Intel内製eDRAM」の詳細(2014/3/10)
という記事を見てると、当時22nmで128MB=約60mm²の専用チップが作られ、
MTLのベースダイ (22FFL)の推定サイズ173.43mm²より十分小さい。
なお22FFLのSRAMはeDRAMの3倍の大きさで64MBで90mm²程度。
接続帯域は102.4 GB/sでDDR5-6400 = 51.2 GB/sより速い。
SoCタイル上だと、32MB程度配置するとしてN7/6で約32mm²。
SoCタイル自体が90mm²しかないのに、その1/3を食ってまで
効果の限定的なL4を配置するか?という疑問はある。
こう考えるとHaswellと同じ22nmのベースダイでeDRAMを使う、というほうが現実的に見えてくるが、どうだろう。
という記事を見てると、当時22nmで128MB=約60mm²の専用チップが作られ、
MTLのベースダイ (22FFL)の推定サイズ173.43mm²より十分小さい。
なお22FFLのSRAMはeDRAMの3倍の大きさで64MBで90mm²程度。
接続帯域は102.4 GB/sでDDR5-6400 = 51.2 GB/sより速い。
SoCタイル上だと、32MB程度配置するとしてN7/6で約32mm²。
SoCタイル自体が90mm²しかないのに、その1/3を食ってまで
効果の限定的なL4を配置するか?という疑問はある。
こう考えるとHaswellと同じ22nmのベースダイでeDRAMを使う、というほうが現実的に見えてくるが、どうだろう。
2023/04/14(Fri) 20:42 | URL | LGA774 #-[ 編集]
194709 訂正&返信
>>194646
脈略はあった(northwood.blog.fc2.com/?no=11762)が,チェリーピッキングしちゃってた,すまん
>>194648
本丸は~X3D潰しな気がする.Broadwellやってたから尚更カタルシスが大きいと思う
>>194651
「良きに計らえ」ればいいんじゃない?
>>194659
建設的じゃないコメ欄の使い方は願い下げ.語弊を指弾する余裕があるなら,先達が教授すればいい話.バタフライ効果を起こせる
>>194671
それこそ肝要でしょうに.全員が全員エンスーじゃない
>>194674
来た,見た,勝った
>>194676
exactly
>>194679
👍
>>194687
確かにすげーよな,商売敵と手を組む神経って(pc.watch.impress.co.jp/docs/news/1493272.html
>>194703
22nm生産ライン,キャパ空いていたっけ?ECUかなんか受注してなかった?
脈略はあった(northwood.blog.fc2.com/?no=11762)が,チェリーピッキングしちゃってた,すまん
>>194648
本丸は~X3D潰しな気がする.Broadwellやってたから尚更カタルシスが大きいと思う
>>194651
「良きに計らえ」ればいいんじゃない?
>>194659
建設的じゃないコメ欄の使い方は願い下げ.語弊を指弾する余裕があるなら,先達が教授すればいい話.バタフライ効果を起こせる
>>194671
それこそ肝要でしょうに.全員が全員エンスーじゃない
>>194674
来た,見た,勝った
>>194676
exactly
>>194679
👍
>>194687
確かにすげーよな,商売敵と手を組む神経って(pc.watch.impress.co.jp/docs/news/1493272.html
>>194703
22nm生産ライン,キャパ空いていたっけ?ECUかなんか受注してなかった?
2023/04/15(Sat) 00:06 | URL | 194646 #-[ 編集]
ベースダイにキャッシュ入れるのは効率を考えるとアリだと思うし、個人的にはMI300でもメモコンのダイにキャッシュ載せてるような気がしてるけど、電源とか配線がちゃんと出来るのかどうか分からん。
あと、eDRAMの技術がintel的に今も使えるものだと思われているかどうか・・・。なんとなく不遇な雰囲気を感じるんだが。
あと、eDRAMの技術がintel的に今も使えるものだと思われているかどうか・・・。なんとなく不遇な雰囲気を感じるんだが。
2023/04/15(Sat) 07:47 | URL | LGA774 #-[ 編集]
eDRAMまさかのきのこりか!?
2023/04/15(Sat) 07:59 | URL | LGA774 #-[ 編集]
ベースタイルにeDRAMは消費電力が大きくなりそうではある。
IntelはMRAMに22FFLを使っているので、ベースタイルにL4としてMRAMが使われると面白いが、2020年以降音沙汰がない……。あと、コストについても分からない。
2022年にFeRAMについて発表しているから、こっちもあるかな?
IntelはMRAMに22FFLを使っているので、ベースタイルにL4としてMRAMが使われると面白いが、2020年以降音沙汰がない……。あと、コストについても分からない。
2022年にFeRAMについて発表しているから、こっちもあるかな?
2023/04/15(Sat) 13:20 | URL | LGA774 #-[ 編集]
Radeon RX 6000シリーズの発表会の時にInfinity Cacheの説明で、FHDの場合はL3が32MBでヒット率が50%を超え、48MBで妥協できる(だいぶ飽和点に近い)性能を出している。
その点では、素直にSRAMを最大48MB、下位では一部無効化して24~32MB積めば十分な性能は出せるかと思う。iGPUではFHDより上の解像度は実行ユニット側の制約でまず無理だしね。
>>194709
昨年夏の時点で22FFLの使用は公言済み。
その点では、素直にSRAMを最大48MB、下位では一部無効化して24~32MB積めば十分な性能は出せるかと思う。iGPUではFHDより上の解像度は実行ユニット側の制約でまず無理だしね。
>>194709
昨年夏の時点で22FFLの使用は公言済み。
2023/04/15(Sat) 20:44 | URL | LGA774 #-[ 編集]