The possible reason for crashes and instabilities of the NVIDIA GeForce RTX 3080 and RTX 3090 | Investigative(Igor's Labs)
RTX 3080 Crash to Desktop Problems Likely Connected to AIB-Designed Capacitor Choice(techPowerUp!)
Message about EVGA GeForce RTX 3080 POSCAPs(EVGA)
少し前よりGeForce RTX 3080環境でデスクトップがクラッシュするという報告が寄せられている模様である。そしてその原因が電源周りの設計―もう少し突っ込んで言えば使用しているキャパシタにあるという推定が成されている。
そして9月26日になり、EVGAが初めてメーカーとして公式な見解を明らかにした。
RTX 3080 Crash to Desktop Problems Likely Connected to AIB-Designed Capacitor Choice(techPowerUp!)
Message about EVGA GeForce RTX 3080 POSCAPs(EVGA)
少し前よりGeForce RTX 3080環境でデスクトップがクラッシュするという報告が寄せられている模様である。そしてその原因が電源周りの設計―もう少し突っ込んで言えば使用しているキャパシタにあるという推定が成されている。
そして9月26日になり、EVGAが初めてメーカーとして公式な見解を明らかにした。
EVGA GeForce RTX 3080 seriesの量産時のQC testにおいて、6個のPOSCAPのみを用いたカードでは実際のアプリケーションテストをクリアできなかった。そのため、POSCAPを4個に減らし、20個のMLCCを追加した。この設計変更は1週間ほどの時間を要するものであり、EVGA GeForce RTX 3080 FTW3 seriesのローンチが遅れた理由でもある。製品版のEVGA GeForce RTX 3080 FTW3 seriesにおいては(テストをクリアできなかった)6個のPOSCAPを用いたカードは出荷されていない。
しかしながら、レビュワーの一部には最終的な製品版となる前の6個のPOSCAPを用いたものが渡ってしまった。EVGAとしては該当するレビュワーに対し、最終的な製品版との交換を行っている。
EVGA GeForce RTX 3080 XC seriesは5個のPOSCAPと10個のMLCCを用いており、この問題は生じていない。
POSCAPはConductive Polymoer Tantalum Solid Capacitor、MLCCはMultilyaer Ceramic Chip Capasiterの略である。Igor's Labsに両者を使用した基板の図がわかりやすく示されており、赤色がPOSCAP、緑色がMLCCで、後者は10個で1つのユニットを形成している。問題となっている部分はPOSCAPとMLCCの合計が6ユニットで構成されている。
GeForce RTX 3080のリファレンスボードはPG132と呼ばれ、これを元に製品設計が行われている。そしてBill of Material (BOM) と呼ばれるものが使用する部品を規定する。BoMは6月頃に配布され、当該回路においてはPOSCAPまたはMLCCを使用するものとされていた。MLCCは高価であるが特に高い周波数を扱う部位においてはより良いフィルタ性能を有している。当該部位は6つのキャパシタでNVVDDやMSVDDのような高周波数駆動のための高い電圧回路を扱う。
私自身が電気回路に明るいわけではないため、なかなかうまく訳しきれないが、当該回路はGPUコアのまさに裏側にあり、高い周波数・・・それもBoostのたびに変動する代物にさらされる部分で、相応の質が求められる回路のようである。そしてこの部分に用いるPOSCAPとMLCCの比率がメーカーによって異なっている。たとえばZOTACは安価なPOSCAPのみ6個で構成されている。NVIDIAのFounders EditionではPOSCAPが4個・MLCCが2ユニットで構成される。そしてこのキャパシタの選択がGeForce RTX 3080のクラッシュにつながっているという。
EVGAはPOSCAP 6個では実際のアプリケーションテストを通過しなかったと述べており、POSCAP 4+MLCC 2ないしはPOSCAP 5 + MLCC 1の構成としている。
この問題が表在化した背景としては、とにかくも時間がなかったようである。スケジュールがタイトでAIBパートナーが実テストを行う時間が削られたとtechPowerUp!は指摘している。とはいえ、高い周波数時だけでなく50~100MHzに周波数が落ちているときにもクラッシュが生じているとあり、このキャパシタが原因という説はあくまでも仮説であるとIgor's LabsもtechPowerUp!も述べている。
だが今日になってEVGAが見解を出したことにより、この部分が原因である可能性が高まったようである(ただ、これが原因だとするとZOTACの奴ばかりクラッシュしているのか?という話になるが・・・)。
今回はいつにもまして訳が怪しいので、詳しい方は是非ともIgor's LabsやEVGAの該当ページを参照して欲しい。
※POSCAPはPanasonicのコンデンサの製品名であり、記事中でPOSCAPとされている大型コンデンサとは異なる物であるという情報をいただきました。ありがとうございます。POSCAPの部分は大型の固体コンデンサと読み替えれば良いでしょうか?
(参照:導電性高分子タンタル固体電解コンデンサ(POSCAP)(Panasonic))

この記事へのコメント
MSIやZOTACが起きててASUSのTUF(POSCAP 0・MLCC 6らしい)が起きてないって噂もあるのでそのあたりっぽさそうですね。
該当部分がメーカーごとに違うし回収騒ぎになるのかは微妙?
該当部分がメーカーごとに違うし回収騒ぎになるのかは微妙?
2020/09/26(Sat) 15:11 | URL | LGA774 #-[ 編集]
給電回路とか別に目新しいものじゃない
おおかたnvidiaがスペック違反かましてデータシートの数値より大電流を消費してるとかそんなところだろう
おおかたnvidiaがスペック違反かましてデータシートの数値より大電流を消費してるとかそんなところだろう
2020/09/26(Sat) 15:38 | URL | LGA774 #-[ 編集]
POSCAPは使われてないんですけどねぇ・・・
2020/09/26(Sat) 17:27 | URL | LGA774 #-[ 編集]
高ブースト時に起こる個体もあれば起らない個体もあるようなのでGPUの品質ムラだと思うけど サムスンだし
ASUSは力業で抑えてきた感
ASUSは力業で抑えてきた感
2020/09/26(Sat) 17:34 | URL | LGA774 #-[ 編集]
リーク防止のために、ボードメーカーは発表前の開発時に実用プログラムを回すのを禁止されていたらしいし、これのせいでもあるんじゃないですかね。そうであれば、NVIDIAのせいで消費者が未熟な製品を掴まされたことになる。
https://www.guru3d.com/articles-pages/geforce-rtx-3080-and-3090-what-we-know,1.html
https://www.guru3d.com/articles-pages/geforce-rtx-3080-and-3090-what-we-know,1.html
2020/09/26(Sat) 18:03 | URL | LGA774 #-[ 編集]
初期ロットの怖い部分出ちゃったな
ドライバーで対応できれば良いけど・・
ドライバーで対応できれば良いけど・・
2020/09/26(Sat) 18:30 | URL | LGA774 #-[ 編集]
PCIEコネクタの規約違反までして大電流流してたAMDじゃあるまいしnVIdiaがスペック違反なんてするはずもない
2020/09/26(Sat) 18:48 | URL | LGA774 #-[ 編集]
このコンデンサが何の目的化によるけれど、
ノイズ対策であれば基本的にコンデンサは容量によって周波数特性が異なる。
(例えば1.0uFは0.1uFの代わりにならない)
そのため特定のノイズ周波数に対して適切な容量を選択するので、複数搭載が必要なMLCC側が結果的に相性が良かった可能性が有る。
POSCAPについては詳しくないけれど、
記載の通り周波数特性がMLCCに劣るのであれば特定の周波数(OC時?)のノイズが除去できなかったのかもしれない。
または性能の良いPOSCAPを選定していれ問題なかったのかもしれない。
nvidiaの見解次第だけれども、この記事が正しい場合製造メーカーからすると中々しゃれにならないので大きな問題になりそうだなぁ。
ノイズ対策であれば基本的にコンデンサは容量によって周波数特性が異なる。
(例えば1.0uFは0.1uFの代わりにならない)
そのため特定のノイズ周波数に対して適切な容量を選択するので、複数搭載が必要なMLCC側が結果的に相性が良かった可能性が有る。
POSCAPについては詳しくないけれど、
記載の通り周波数特性がMLCCに劣るのであれば特定の周波数(OC時?)のノイズが除去できなかったのかもしれない。
または性能の良いPOSCAPを選定していれ問題なかったのかもしれない。
nvidiaの見解次第だけれども、この記事が正しい場合製造メーカーからすると中々しゃれにならないので大きな問題になりそうだなぁ。
2020/09/26(Sat) 19:13 | URL | LGA774 #-[ 編集]
時間なくて検証してないけど、リファレンスボードでPOSCAP6でもOKに読めるからヨシ!したんだとしたら、
最終製品として保証するのはメーカーなんだから、回収騒ぎになっても文句言えないよね
逆にしっかり検証して、コストアップにもなる対策入れてるEVGAは評価上がる。
わざわざ見解出してるのはそのアピールも兼ねてるのかもだけど
最終製品として保証するのはメーカーなんだから、回収騒ぎになっても文句言えないよね
逆にしっかり検証して、コストアップにもなる対策入れてるEVGAは評価上がる。
わざわざ見解出してるのはそのアピールも兼ねてるのかもだけど
2020/09/26(Sat) 19:16 | URL | LGA774 #-[ 編集]
変な形の基盤も影響してそう。
設計しにくそうだもの。
設計しにくそうだもの。
2020/09/26(Sat) 20:00 | URL | LGA774 #-[ 編集]
Turingの時も発火してましたし初物は様子見が正解
2020/09/26(Sat) 21:10 | URL | LGA774 #-[ 編集]
>>175480
PCIeコネクタからの過剰吸い上げはnVIDIAが先に始めてるぞ
PCIeコネクタからの過剰吸い上げはnVIDIAが先に始めてるぞ
2020/09/26(Sat) 22:05 | URL | LGA774 #-[ 編集]
GDDR6Xがシビアだと言う話が有ったがその辺はどうなのだろう
2020/09/26(Sat) 22:40 | URL | LGA774 #-[ 編集]
推測も混じってたり情報が錯綜してて、何かを決めつけるには早い気がするね
2020/09/26(Sat) 23:03 | URL | LGA774 #-[ 編集]
直接の原因は色々あるにしてもそれらの大元はNvidiaの拙速にある
検証に時間を割いていればこんな無様な格好をせずに済んだでしょうな
検証に時間を割いていればこんな無様な格好をせずに済んだでしょうな
2020/09/27(Sun) 00:58 | URL | LGA774 #-[ 編集]
NVがスペック違反しないてネタ?
970のVRAMとか20シリーズのインベーダーとかもう忘れちゃった?
970のVRAMとか20シリーズのインベーダーとかもう忘れちゃった?
2020/09/27(Sun) 02:12 | URL | LGA774 #-[ 編集]
衝動買いしそうだったけどおかげさまで地雷回避出来そう感謝感謝
しかし直近4世代で最初から安定していたのはpascalだけ?
発熱と消費電力が多い世代は何かしらありますねー
なぜかそういう世代の時ほど欲しくなるのが不思議ですけど
しかし直近4世代で最初から安定していたのはpascalだけ?
発熱と消費電力が多い世代は何かしらありますねー
なぜかそういう世代の時ほど欲しくなるのが不思議ですけど
2020/09/27(Sun) 07:29 | URL | LGA774 #-[ 編集]
RTX2080Ti の時も初期ロットは色々出たし
やっぱRTX3080も出たかな感じ
早くて半年、余裕みて一年は待ちたい
やっぱRTX3080も出たかな感じ
早くて半年、余裕みて一年は待ちたい
2020/09/27(Sun) 07:50 | URL | LGA774 #-[ 編集]
センセーショナルだった発表(実際凄い技術的進歩)から興奮のレビューそして色々分かってくる現実。電源の件は直すことも出来るだろうけど、アムダールの法則やらPC自身の無数にあるボトルネックポイントから考えてGPU単体の能力アップでは限界なんだなぁと感じましたね。
2020/09/27(Sun) 09:25 | URL | LGA774 #-[ 編集]
これは高周波向けではなく、低周波向けのパスコンですね。
低周波向けをサイズが大きいコンデンサ(アルミ電解、タンタル、大型MLCC)で、
高周波向けをサイズが小さいMLCCで構成します。
大きければいいと言うものではなく、小さい方が高周波特性がいいので使い分けが必要です。
POSCAPはPanasonicが商標を持ってるタンタルコンデンサで、大型のMLCCと変わらないぐらい特性がいいので、この用途で問題が起きるかというと疑問。
POSCAPではない、同一形状の別のメーカー品とかアルミ電解使ってたら分かりませんが。
画像見ると赤いPOSCAPとされてる物のメーカーが様々だし(少なくともPanaのPOSCAPではない)、容量も220uFと470uF混ぜてたりとか、よく分からずに使ってる可能性が…
低周波向けをサイズが大きいコンデンサ(アルミ電解、タンタル、大型MLCC)で、
高周波向けをサイズが小さいMLCCで構成します。
大きければいいと言うものではなく、小さい方が高周波特性がいいので使い分けが必要です。
POSCAPはPanasonicが商標を持ってるタンタルコンデンサで、大型のMLCCと変わらないぐらい特性がいいので、この用途で問題が起きるかというと疑問。
POSCAPではない、同一形状の別のメーカー品とかアルミ電解使ってたら分かりませんが。
画像見ると赤いPOSCAPとされてる物のメーカーが様々だし(少なくともPanaのPOSCAPではない)、容量も220uFと470uF混ぜてたりとか、よく分からずに使ってる可能性が…
2020/09/27(Sun) 12:42 | URL | LGA774 #-[ 編集]
※175480
ネットの書き込みだとよく見かける論調だけど
記事とは全く関係ないメーカーを持ち出して
「A社は過去に問題を起こしたけど、それに比較してB社の問題はちっぽけ」
っていうのは、単なるA社とB社に対するネガキャンだよね…
ネットの書き込みだとよく見かける論調だけど
記事とは全く関係ないメーカーを持ち出して
「A社は過去に問題を起こしたけど、それに比較してB社の問題はちっぽけ」
っていうのは、単なるA社とB社に対するネガキャンだよね…
2020/09/27(Sun) 13:26 | URL | LGA774 #-[ 編集]
どこにもPOSCAP(製品名)が使われてないのにSMD電解コンが全部ひっくるめてPOSCAPと呼ばれてて草
2020/09/27(Sun) 14:09 | URL | LGA774 #-[ 編集]
175480
i社やn社の都合の悪い記事が出る度に引き合いに出されるA社可哀想…
i社やn社の都合の悪い記事が出る度に引き合いに出されるA社可哀想…
2020/09/27(Sun) 17:03 | URL | LGA774 #-[ 編集]
175480はかつてマザーファッカーと呼ばれた伝説の「ビデオカード」を知らない世代か
まぁいずれにしろ最大300W超えるグラボがじゃじゃ馬でない筈がない
高品質なマザボ設計できるメーカーのものを選んだ方がいい
まぁいずれにしろ最大300W超えるグラボがじゃじゃ馬でない筈がない
高品質なマザボ設計できるメーカーのものを選んだ方がいい
2020/09/27(Sun) 19:21 | URL | LGA774 #-[ 編集]
GeForceのグラボってNvidiaのリファレンス設計しか許されないんじゃなかったのかよ
2020/09/28(Mon) 00:37 | URL | LGA774 #-[ 編集]
とりあえず不具合の原因は毎回違えど、初期ロットを買うときは何かしろ覚悟しろってことなんですね
2020/09/28(Mon) 02:10 | URL | LGA774 #-[ 編集]
一番の被害者は使われてもいないのにPOSCAPはクソ、みたいに言われてるPanasonicだわ
2020/09/28(Mon) 05:54 | URL | LGA774 #oyV.6EWY[ 編集]
>>175506
いずれにしても普通に評価していれば分かることではある
波形を評価する技術がない→基板メーカーで通常それは考えられない
実環境に近い状態での評価が出来ていない→何とも言えない。複数の可能性があり得る。
いずれにしても普通に評価していれば分かることではある
波形を評価する技術がない→基板メーカーで通常それは考えられない
実環境に近い状態での評価が出来ていない→何とも言えない。複数の可能性があり得る。
2020/09/28(Mon) 12:06 | URL | LGA774 #-[ 編集]
POSCAPと言われてSANYOと思った人は怒らないから正直に手を挙げなさい
(・・)ノ
(・・)ノ
2020/09/28(Mon) 17:30 | URL | LGA774 #-[ 編集]
最初のほうで囁かれてたドライバひとつで直るってのがまさにそのとおりに終わったみたい
次の話題はなんだろうか
次の話題はなんだろうか
2020/09/29(Tue) 00:34 | URL | LGA774 #-[ 編集]
リファレンスで問題がないのなら、オリジナル基板モデルで問題が起きてると言うことか。
もうそれは最終製品メーカーの技術力やろ。
もうそれは最終製品メーカーの技術力やろ。
2020/09/29(Tue) 11:50 | URL | LGA774 #-[ 編集]
>しかし直近4世代で最初から安定していたのはpascalだけ?
VRAMの異常発熱問題があってEVGAが冷却用にサーマルパッド配布してた
まるで成長していない… (´·ω·)
VRAMの異常発熱問題があってEVGAが冷却用にサーマルパッド配布してた
まるで成長していない… (´·ω·)
2020/09/29(Tue) 18:36 | URL | LGA774 #-[ 編集]
これまでにバグで焼殺ドライバだったものはあるけど、調整不十分で結果的に焼死するのは新しいパターンだったな。
まー、性能下げていいならドライバだけでどうとでもなる。
まー、性能下げていいならドライバだけでどうとでもなる。
2020/09/29(Tue) 21:01 | URL | LGA774 #-[ 編集]