北森瓦版 - Northwood Blog (Author : 北森八雲. Since July 10, 2006.)
AMD Issues Official Statement on Reported Ryzen 7000 Burnout Issues(AnandTech)
AMD Releases First Statement on Ryzen 7000X3D Series Burn-out Issues(techPowerUp!)
AMD Ryzen 7000 Burning Out: EXPO and SoC Voltages to Blame (AMD Responds)(Tom's Hardware)
ASUS Responds to Concerns Surrounding Ryzen 7000 Series CPUs(Guru3D)
AMD & Its Board Partners Issue First Official Statement on Ryzen 7000 CPU Burnout Issues(WCCF Tech)
Community Notice - ASUS AM5 motherboard owners(Joan Juse Guerrro@ASUSTechMKTJJ)

今月中旬頃からRyzen 7000X3D seriesが焼損する問題がReddit等海外のフォーラムで散発的に報告されていた。多くはASUSのX670EマザーとRyzen 7000X3D series(Ryzen 9 7950X3D, Ryzen7 7800X3D)の組み合わせて報告されており、CPUとマザーボード双方の損傷が認められた。提供された写真にはCPUとSocketに過熱を示す痕が見られた。

この報告を受けてマザーボード各社とAMDが対応に乗り出し、4月25日にAMDから報告文章が出された。

AMDは少数ではあるが、CPUのpin padとマザーボードのSocketが損傷する問題があると報告を受けた。それは、オーバークロック時に過剰な電圧により引き起こされるものだ。AMDはこのような状況に陥らないよう、各ODMパートナーと連携し、Ryzen 7000X3D seriesにおいてマザーボードBIOSの設定を、製品が定める値の範囲に収まるようにすることを確認した。
万が一、今回の問題でCPUが損傷を受けた場合はAMDのカスタマーサポートまで連絡して欲しい。
 
このオーバークロック時というのがくせ者である。今回の場合は、AMD EXPOを使用したときの電圧設定が悪さをしていたのではないかと推定されている。Der8auer氏によると、この問題の根幹はSoC voltageが安全域を超えた高い数値に達したことであるとしている。そしてSoC voltageがこのように引き上げられる要因として、ユーザー側が手動でSoC voltageを調整しただけではなく、EXPO memoryのオーバークロックプロファイルを読み込み、電圧が調整される時にも起こるとしている。

いくつかのケースでは過剰なSoC voltageがチップのサーマルセンサーと温度保護機構を破壊したものとみられる。これにより、オーバーヒートを防ぐないしはProcessorを保護する機能が失われる。結果、Processorは温度を監視できない状態で動作し、最悪温度保護機構を超えて動作してしまう。

ASUSから出された声明もやはり同じようにAMD EXPO memoryの設定時にSoC voltageが過剰に盛られることが原因としている。CPU側の個体差により、ある程度耐えうるものもあれば、過電圧に他よりも敏感なものもあるようだ。

解決策としてこの過電圧を防ぐ新しいBIOSへのアップデートがが得られている。ASUSの場合は、新しいBIOSでSoC voltageの最大値を1.3Vに制限したとしている。
他のメーカーからも同じようにSoC voltageが過電圧となるのを防ぐ新しいBIOSが出ており、ぜひともアップデートをしておきたい。

X3DではないRyzen 7000 seriesでも潜在的にこの問題はあったようだが、Ryzen 7000X3D seriesの3D V-cache搭載ダイは過電圧・発熱に弱いため、今回の問題が顕在化してしまったのかもしれない。

とはいえ、BIOS updateで解決できるのであれば一件落着であろうか?

・・・ちょうど私自身Ryzen 9 7950X3DとASUS ROG STRIX X670E-F Gaming WiFiを揃え、ゴールデンウィーク辺りでくみ上げようと考えていた矢先の騒動なので大分肝を冷やすことになった。今回、BIOS updateで解決しそうなので、一応は安心して良いだろうか(メモリはJEDEC準拠こそ至宝という信念がまた高まった)



(追記:2023年4月30日23時37分)
◇AGESA ComboAM5 1.0.7.0で焼損を防ぐ措置がとられる模様
AMD Issues Second Statement on Ryzen 7000 Burnout Issues: Caps SoC Voltages(AnandTech)
AMD issues a new statement on Ryzen 7000 burnout issues - "We have the root cause"(OC3D)
AGESA 1.0.7.0 Fixes Temp Control Issues Causing Ryzen 7000 Burnouts(Tom's Hardware)
AGESA ComboAM5 1.0.7.0 for AMD’s Ryzen 7000 in detail: memory management and an important update of the protection features against overheating(Igor's Labs)

Ryzen 7000X3D seriesで生じた過熱問題に対し、AMDから公式な文章が出されている。

AMDはこの問題の根本的解決を行うとともに、新しいAGESAを配布する。新しいAGESAはSocketAM5マザーボードに確実な電力供給を行い、CPUが定められた上限値を超えて動作しないようにする。これにはSoC voltageの上限を1.3Vとすることも含まれる。なお、今回の措置により、Ryzen 7000 seriesでのEXPOやXMPに対応したオーバークロックメモリの使用や、PBOを用いたBoost機能に影響が出ることはない。
今後数日の間に全てのODMパートナーから、SocketAM5向けの新しいBIOSがリリースされる見込みである。ユーザーには自身のマザーボードの製造メーカーのWebサイトを確認し、Processorに応じて新しいBIOSに更新して欲しい。
万が一今回の問題でCPUが損傷した場合はAMD customer supporまで連絡を入れて欲しい。


そしてこの問題を解決するAGESAがAGESA ComboAM5 1.0.7.0となるようだ。

Tom's Hardwareの記事の最後の段落で、このAGESA ComboAM5 1.0.7.0が適用されたBIOSが登場し次第、BIOSのアップグレードを行うことを推奨すると説明している。

Igor's LabsやTom's Hardwareには過熱に至った原因に対して考察が行われている。CBS SMU_COMMON 'PROCHOT Control'とPROCHOT Deassertation Ramp Timeの2つが関係しているようだが、私はあまりよく理解できなかった。興味のあるかたはIgor's LabsとTom's Hardwareの記事を参照して欲しい。

パソコン工房のお得なキャンペーン



コメント
この記事へのコメント
194968 
完全に故障まで行かなくてもダメージ受けてて時間経ってから故障したら最悪
中古で売って買い直すのが一番安心かも
2023/04/27(Thu) 02:22 | URL | LGA774 #-[ 編集]
194969 
これって本当にそれだけなのかな?
CPUそのものに欠陥がありそうな気がする
2023/04/27(Thu) 02:58 | URL | LGA774 #-[ 編集]
194970 
7950X3Dと7900X3Dは、キャッシュ乗せありとなしが混在してるから、制御がややこしいよね。
メモリの過電圧体制をそろえる意味で(?)、これを機に、
キャッシュ2個乗せの 7951X3D と 7901X3D を出してほしい。
計算処理にCPU使用すると、追加キャッシュの有無やCCD跨ぎの有無で処理jobごとの
終了時間が大きく異なるのはプログラム書く上で、めんどくさくてかなわない。
2023/04/27(Thu) 03:33 | URL | LGA774 #-[ 編集]
194971 
AM5になって不幸が続いているから、早めにAM6に変えたほうが良いかもな
2023/04/27(Thu) 03:45 | URL | LGA774 #-[ 編集]
194972 
OCメモリなんて百害あって一利なしとまでは言わなくとも、十害とせいぜい一利程度のもんですね。僅かなパフォーマンスアップのために負うデメリットが多すぎる。

・OCプロファイルを読ませて動作させても不安定な場合がある。
・電圧過多でCPUに物理的ダメージがある。今回のようにトラブルの要因にもなる。
・消費電力が多くなる。
・発熱が多くなる。それはメモリはもちろんのこと、CPU側(メモコン側)も多くなる。
・余計なヒートシンクが付くことでCPUクーラーに干渉する。
・通常電圧では標準的なチップより動作周波数が遅いハズレチップを、電圧喝入れして標準より少しだけ速くしただけの製品が多く、廃品利用に協力させられている。

OCメモリは買わない使わないに限りますね。
2023/04/27(Thu) 04:07 | URL | LGA774 #1wIl0x2Y[ 編集]
194973 
DDR4では標準1.2VでOCメモリは一般的に1.35Vでした。

この比率を仮に維持させるとすると、DDR5の標準1.1Vに対しOCメモリは1.2375Vが妥当といったところ。にもかかわらず1.35VのOCメモリ製品がDDR5では出回ってるんですよね。電圧かけすぎも甚だしい。この仕様で出したDIMMモジュールメーカーが馬鹿なんですよ。

とはいえOCは自己責任。何が起きても買った人使った人の責任です。こういうリスクを負ってまで、動作の遅い逆選別品チップをボランティアで高値で買ってくれるいいお客さんがOCメモリ愛好家ですよ。カモですね。
2023/04/27(Thu) 04:39 | URL | LGA774 #1wIl0x2Y[ 編集]
194974 
やはりJEDEC準拠
相性問題も最小化され使いまわしやすくお財布への優しさは圧倒的
JEDECよ地に満ちよ
JEDECよ永遠なれ
2023/04/27(Thu) 04:59 | URL | LGA774 #-[ 編集]
194975 
SOCが1.4~1.5vとかになって壊れるらしいですね。
定格が1.1v以下なのにそんなに高い電圧で疑問も持たずにOC状態で使う人が居ることに驚きです。
私だったらそんな高電圧じゃ怖くて使えないので、XMPセットして自動でSOC盛られても手動で下げますね。

例えば、SOCのVRMが1フェーズの50Aだと、定格電圧(1.08v)の25Wぐらいなら大丈夫ですが、
1.5vなんてやったら消費電力は2倍以上になるのでFETの限界を超えてショートモード(12vがそのまま流れ込む)でCPUが飛んでもおかしくないです。
レギュレータの製造元が保証している出力はFETのケースの温度を25℃に保った時の値なので、温度が高い場合は電力を制限する必要があります。
RDNA2の2CUでもOCするとSOCの電力が60W行くそうですから、温度センサーの無いSOC側のVRM温度がどれぐらいなのか分からないと怖いですね。
壊れたマザーはCPUを外してもダメなようなので、FETが飛んでCPUが焼けた可能性が高いです。
CPUダイはPPTで制限かかるんでどのマザーでも大丈夫でしょうけど、SOC側は制限が無いのでメーカーによってはリミッター無かったりします。
EDCもトータルの電力を制限しているだけで、SOC側だけが高電力になっても止めてくれませんからね。
X3Dの場合はCPUダイの消費電力が少ないので、PPTにもEDCにも引っかからなかった、そしてSOC-VRMが電流オーバーで壊れた、
こんな感じじゃないかなぁと思います。
2023/04/27(Thu) 06:30 | URL | LGA774 #mQop/nM.[ 編集]
194977 
オーバークロックしていなければダメージ受けてないと考えていいのかな…
これは安定性考えるとIntelのほうが無難ということなのか?
2023/04/27(Thu) 07:21 | URL | LGA774 #-[ 編集]
194979 
>JEDEC準拠こそ至宝

わかる。凄いわかる
ちょっと前(?)まではDDR4-3200でJEDEC準拠がほぼなくて、OCメモリを使うのが嫌だったのを思い出した
2023/04/27(Thu) 10:11 | URL | LGA774 #-[ 編集]
194980 
AMD は自社CPUが破損するに、EXPOを提示したのが謎だ。
2023/04/27(Thu) 10:17 | URL | LGA774 #-[ 編集]
194981 
CPUの電気的特性としてpin毎に電圧の上限下限が決まっていると思うけど、それ以内なのに燃えたのかどうかが気になる
2023/04/27(Thu) 10:32 | URL | LGA774 #-[ 編集]
194982 
SoC voltageは初代Ryzenの頃からデリケートだったのでOCするに当たって注意が必要なのは広く知られていた。
その時問題が起きたのもASUSだったような…。
2023/04/27(Thu) 11:11 | URL | LGA774 #-[ 編集]
194985 
センサー周りがぶっ壊れるのはX3D関係ないと思うんだけど...
そうすると実はセンサーが壊れたまま元気に動いてる非X3Dとか居そうよね。
2023/04/27(Thu) 19:11 | URL | LGA774 #-[ 編集]
194987 
AMDはファブリックのクロックを1:1にできるDDR5-6000がスイートスポットだと言ってるけど、
SoCの昇圧が制限されたらそのクロックに到達できない個体がゴロゴロ出てきそう
2023/04/27(Thu) 20:53 | URL | LGA774 #-[ 編集]
194988 
そういえば昔AMDの開発コード「Thunderbird」のAthlonが焼けて「焼き鳥」と揶揄されたことあったなあ…
今回は開発コード「Raphael」だから「焼き天使」か?
これが開発コード「Phoenix」だったら…
2023/04/27(Thu) 22:56 | URL | LGA774 #-[ 編集]
194989 
ヒートシンクのついたOCメモリを定格で使うのが俺は好きだ。
なんか酷使しても壊れない気がして、心の平穏のひとつになってる。
2023/04/27(Thu) 23:15 | URL | LGA774 #-[ 編集]
194990 
XMPで自動設定されるSOCの値って仕様書に出てこないから大変ね。
ちなみに、Ryzen7800X3D + ASRock B650 PG Lightning + CMK32GX5M2B6000C40(DDR5 6000) をXMPで動かしたら、初期BIOS(たぶんSOC上限無し)でもSOC=1.25Vだった。
ご参考までに。
2023/04/27(Thu) 23:28 | URL | LGA774 #-[ 編集]
194994 
まぁ何だかんだ言っても、OC設定でCPUとマザー焼いても無償交換してくれるなら良いですね。

それにしても、1.1v→1.4~1.5vって3割以上盛ってるし、ちょっとやり過ぎな感がありますよね。
CPUダイが200W消費してもCPU側12フェーズなら1/12(16Wづつ)に分散されますが、
安価なマザーでSOCが1フェーズで1.5v 50Wとか食ったら非常に厳しいですね。
局所的に120℃超えたりしないのかな、温度センサーは大抵CPU側のFETの所にあるので実際の温度と乖離が生じそうです。
もしFETが飛んだら部品剥がしてテスターでショートしているか確認すれば判断出来ますね。
2023/04/28(Fri) 03:58 | URL | LGA774 #oyV.6EWY[ 編集]
194996 
DDR5はレイテンシが増えすぎてJEDEC準拠品だと遅いのも原因
DDR5自体が半分失敗作
2023/04/28(Fri) 08:32 | URL | LGA774 #-[ 編集]
194997 
せっかく3d~vcacheがついてるんだから、電圧そんなに上げずに、周波数(6000ぐらいで)を上げてタイミングをゆるゆるにするのか(←こっちかな)、またはその逆のどちらかで十分速そうだが?
2023/04/28(Fri) 09:35 | URL | 名無しです #-[ 編集]
194998 
これ、RyzenX3D系の耐性が低いからX3D系で露呈しただけで、
大本はメモリメーカーが異常な設定してたせいだよね。

普通のRyzenやIntelでもダメージ入ってるけど動いてる例がありそう。
2023/04/28(Fri) 09:56 | URL | LGA774 #-[ 編集]
195001 
要するにEXPOメモリ使用時の挙動におけるエラッタだよね
メーカーによる火葬プロファイルが設定可能
2023/04/28(Fri) 11:26 | URL | LGA774 #-[ 編集]
195005 
zen2zen3ですらSoC1.2Vより上は効果薄い上に破損リスク高まるからやめろって言われてたのにな。さらに微細化して耐圧落ちてるのに1.3とか4とか正気の沙汰とは思えないんだけど。ただでさえ無駄盛りVRMの高額マザーだらけなのに制御がおざなりとかもはや詐欺では。
2023/04/28(Fri) 13:32 | URL | LGA774 #-[ 編集]
195006 
>194988
>今回は開発コード「Raphael」だから「焼き天使」か?
電圧の業火で落ちた天使…
堕天使でいこう 語呂も良い
2023/04/28(Fri) 14:42 | URL | LGA774 #-[ 編集]
195009 
>>194994
そこで出てくるのが194968の話ですよ
壊れてなきゃ大丈夫って話ではなく、中古市場に地雷があるかもってなったらリセールバリューガタ落ちだし、何があっても絶対手放さないという人以外7000X3Dに手を出さなくなっちゃうよ
ある程度期限切って、ダメージ受けた可能性のある人全員フォローした方がいいと思うなぁ
2023/04/28(Fri) 17:10 | URL | LGA774 #2BSsCYBw[ 編集]
195012 
xmpでは聞いたことないし,改めてソフトウェア開発は人の数が全てだなぁと思いましたまる
2023/04/28(Fri) 20:20 | URL | LGA774 #-[ 編集]
195015 
>>195009
自分の周囲は皆「何があっても絶対手放さない」(中古として売るのがめんどくさい)派だなあ。
売上にはあまり影響がないんじゃない?>リセールバリューガタ落ち
2023/04/29(Sat) 08:55 | URL | LGA774 #-[ 編集]
195018 
>>194970
今回の過電圧がコアの負荷割り当てと関係してるエビデンスは記事に無いから示して

全CCDを3DにしてデスクトップでもIODを5nmでRDNA3に変更したのが欲しいのは同意
2023/04/29(Sat) 11:29 | URL | LGA774 #-[ 編集]
195020 
>195018
「なぜIODを分離しているか」を理解していれば
無理にプロセスを進めるよりもGPUを別チップで実装の方が現実的
2023/04/29(Sat) 14:22 | URL | LGA774 #-[ 編集]
195021 
EXPOがだめでXMPなら問題ないなら
メモリメーカーがダメって理由はおかしい。
あとEXPOはOC設定なんだから
規定以上の電圧はかかるのは想定しなければいけないわけで
フェイルセーフ機構は
システム側につけるべきだろう。
2023/04/29(Sat) 15:05 | URL | LGA774 #195Lvy4Y[ 編集]
195022 
Toms Hardwareによると、ASUS以外でも全てのRyzen7000シリーズで起きうるケースなので、X3D以外の方も注視した方がよろしいかと。

熱によってハンダが溶けたり膨張したり、マザボのピン、CPUが焦げたりする。

こりゃ、ダメージ判定ツールが
必要ですな。
2023/04/29(Sat) 19:25 | URL | LGA774 #-[ 編集]
195023 
>>195009
車やノートPC、メーカPCはその通りで私もリセールバリュー思ったけど
よく考えたらグラボとかの拡張ボードと違ってCPUは単品で中古にするならグリスでくっついたヒートシンク剥がしてるわけで、その時点で地雷な気がする
2023/04/29(Sat) 19:45 | URL | LGA774 #-[ 編集]
195024 
そもそもOCは動作マージンを削る行為なんだけど、最近のマザボは定格超えの設定ができる時点でやり過ぎ感は否めないなぁ
よくわからない人が盛りすぎて壊してしまう可能性を自己責任という便利な言葉で正当化しているベンダー側も悪い
2023/04/30(Sun) 02:05 | URL | LGA774 #-[ 編集]
195027 
Ryzen7000シリーズの発売前のレビュアーの知人なるアカが暴露話で「AMDから口止めされてた」と記事があったけど、それがそもそも大事にならなかったのは設定自体が間違っていたことと最近のきわどい設定値のせいでもあったのかなとも思う。BIOS更新後が前よりシビアになった気もするが。特にCCD1側の方。

>>195018
メーカーとしての言い分は両方V-Cache搭載しても性能の変化は少なかったとか言ってなかったっけ? 実際にはコスト面や別の理由もあるだろうが。
2023/04/30(Sun) 09:28 | URL | LGA774 #-[ 編集]
195032 
>195020
同じIODを見て逆の結論になってるのが面白いですわ

> 「なぜIODを分離しているか」を理解していれば
> 無理にプロセスを進めるよりもGPUを別チップで実装の方が現実的
言うようにGPU別チップの方がAPUも含めたスケーラビリティ出せそうなのに
「なぜGPUをIODに取り込んでいるか」を考えて
IO機能だけではダイの周長を確保出来ないからGPUを取り込んだ大きなダイにしたと推定してるので
GPU別チップよりGPUのIPに合わせたプロセスに変更の方が現実的と思ってるのよ
2023/04/30(Sun) 20:04 | URL | 195018 #-[ 編集]
195035 
>>195024
OC自体がずっと前から保証範囲外の自己責任なんだけど今さら何言ってるの?
スキルの低いユーザーが全面的に悪い、それがOCの世界
2023/04/30(Sun) 20:28 | URL | LGA774 #-[ 編集]
195037 
センサー真っ先にぶっ壊れるのにデフォルトで限界まで加熱するとか詰みでは?
通常使用すらNGじゃん
2023/04/30(Sun) 22:04 | URL | LGA774 #-[ 編集]
195039 
昔からIntelAMDどちらでも焼損しかねない設定は可能だったからね。
明らかにヤバい数字だから極冷でも無い限りそんな設定する人が居なかっただけで。

今回の場合、その明らかにヤバい範囲の数字がメモリのプロフィールに格納されてたのが根本原因では?
何らかのバグで正常な数値を設定してるのにヤバい電圧かけてたなら話は変わるけどさ。
2023/04/30(Sun) 23:27 | URL | LGA774 #-[ 編集]
195048 
根本の解決になってないな
温度が上がっても強制終了しないでCPUが燃える状態そのままだからな
2023/05/01(Mon) 14:51 | URL | LGA774 #-[ 編集]
195050 
>195032
>「なぜGPUをIODに取り込んでいるか」

IODに含まれるGPUはサーバー用途などで、いままではコンソロール画面表示用に別途GPUチップを積む必要があったが、この世代からはIODに含まれているので、別途チップを積む必要性がなくなる
それはM/Bからチップが減る事で故障要因を省くこともできるし、その検証作業も減らすことができる
一般的なデスクトップ用途でもBIOS画面を別途GPUなしに実現できるので、検証に別途専用GPUを必要としない点で有利

なのでIODに統合されたGPUは完全に最低限度の表示ができるだけの規模のGPU。それ以上は期待されていないし、期待するものではない
もしかしたらデジタルサイネージ用途で使う可能性はあるが、その場合は規模的には十分な規模である
2023/05/01(Mon) 16:56 | URL | LGA774 #-[ 編集]
195056 
OCメモリってそこそこ値段するやつは電圧低くしても十分に回ったりするんだけど、安物とかは選別落ちに喝入れしてるから電圧下げらんないんよな
特に海賊とかチームの安いやつとかは…
2023/05/02(Tue) 03:25 | URL | LGA774 #-[ 編集]
195059 
IOD、俺の仕事を奪った悪魔の機械
by ATI RAGE
2023/05/02(Tue) 04:56 | URL | LGA774 #-[ 編集]
195067 
>195032
そもそもなぜIODとCCDのプロセスルールが異なるかに立ち返らないとだめよ。

TSMCの5nm系では、外部回路を駆動できる電流を出す回路を作ると、7nm系より製造コストが非効率で高電圧耐性も悪くなる。
だからこそ、メモリやチップセットというパッケージ外の回路を駆動するIODが7nm系にしてあるわけ。
そうしないとOC耐性が確保できない。

なので、「IODを5nmにすれば」というのは、設計の根本的動機からして外れてるの。
2023/05/02(Tue) 14:47 | URL | LGA774 #-[ 編集]
195075 
>>SocketAM5向けの新しいBIOSがリリースされる見込みでアル。

突然のエセ中国人に笑ったアル
2023/05/03(Wed) 06:53 | URL | LGA774 #-[ 編集]
195078 
>>195050
鯖向けMBのグラフィック機能はBMCの一部なので単に画面表示が出来るだけでは意味がない
むしろCPUとは独立していることに価値がある
zen4世代でもsIODにはグラフィック機能自体が存在しない見込みだが、これは以上の理由からごく妥当だ
2023/05/03(Wed) 12:35 | URL | LGA774 #-[ 編集]
コメントを投稿する(投稿されたコメントは承認後表示されます)