北森瓦版 - Northwood Blog (Author : 北森四葉. Since July 10, 2006.)
◇その1~“Fermi”の製品が潤沢に出回るのは第2四半期
Fermi Architecture GPUs Will Only “Hit the Full Stride” in Q2 – CEO of Nvidia.(X-bit labs)
Nvidia Fermi ramp up expected for Q2(TechConnect Magazine)
GeForce GTX 480 in stock in May at best ...(NordicHardware)
Geforce GTX 480 to launch after Cebit(Fudzilla)

NVIDIAは“Fermi”(GF100, GT300, NV60)アーキテクチャをベースとしたGeForce GTX 400シリーズを今年1月31日~4月29日の期間中に出荷開始するが、潤沢に出回るのは4月30日~7月30日の期間中になるという。

「4月30日~7月30日の期間中は“Fermi”が全方面展開される期間となる。“Fermi”をベースとした製品は、多くの価格帯で提供されるだけでなく、GeForceやQuadroそしてTeslaといった様々な製品で展開される。つまり“Fermi”製品の(実質的な)立ち上げは4月30日と~7月30日の期間中なる」とNVIDIAのCEOであるJen-Hsun Huang氏は語った。
 
元々、NVIDIAは“Fermi”ベースの製品群の立ち上げを2010年1月31日~4月29日の期間中に行う予定だった。現在、多くのメディアはGeForce GTX 480, 470は3月または4月にローンチされると予測している。しかし、ローンチ直後は潤沢に出回ることはなさそうである。

今回のX-bit labsの記事ではQ2 FY 2011という期間のあらわし方が使われていますが、そのまま訳すと誤解を生みやすいのであえて具体的な日付で書きました。そのため多少読みにくい部分もありますがご了承ください。

・・・まあ、ローンチ直後に品不足というのはよくある話です。これ自体はあまり驚くような話でもありません。とにかくこれらの情報では“Fermi”系列が潤沢に出回るのは2010年5月以降としています。
ローンチの予測自体は前と変わらず3月末から4月初めとしているところが多いようで、時期としてはCeBITの後となります。



◇その2~NVIDIAは月曜(2月22日)に最初のDirectX 11対応カードをローンチする?
Nvidia launching its first DirectX 11 cards on Monday?(TechConnect Magazine)

NVIDIAファンにとってはこの週末は長いものとなりそうだ。なぜなら週明けの月曜日(2月22日)にSanta Claraから「大きなアナウンス」があるというからだ。Twitter経由でのアナウンスによると、NVIDIAは2月22日月曜日に何か大きな話をするという。そしてそのアナウンスは高い確率で“Fermi”に関するものだと思われる。

さて・・・何が話されるのでしょうね。
とりあえずはお茶でも飲みながらゆっくりしていってね・・・じゃなくてゆったり2月22日を待ちましょう。

・・・もしコメント欄で喧嘩なんかすると・・・あなたの大切な何かがもげます、もしくは抜けます。



◇その3~“Fermi”は終わっている―SemiAccurateの“Fermi”悲観論
Nvidia's Fermi GTX480 is broken and unfixable(SemiAccurate)

GF100のA3シリコンは1月末にはSanta Claraにあった。つまりそのシリコンの特性が生産ラインに反映された時であったのだが、サンタクララで催しが行われたという話は一切聞かなかった。なぜこうなったのか。(GF100 A3シリコンは)当面の最高製品向けのStream Processor数448、周波数600MHz/1200MHzでも熱かったのだ。それでいてFabでのウエハのイールドは未だに一桁台という有様である。

状況はお察しのとおりで、周波数を下げても一部のユニットを無効化してもイールドは惨憺たるものであった。さらに問題なのがこの低イールドを解決するには(チップを)完全に再設計(re-layout)をしなければならないということである。

今までの3ステップ(A1~A3)のGF100はMetal layer spinを行ったものである。これはFull base layer respinよりは安価にそして短期間に行え、費やす期間は2ヶ月ほどとなる。ちなみにFull base layer respinでは一四半期以上かかり、多くは6ヶ月以上かかる。そしてコストも新たなマスクを作るのに100万ドル以上かかる。Metal layer spinではA1からA2のように数字が上がっていく。一方、Base layer respinではA3からB1のようにアルファベットが変更される。NVIDIAは最初のシリコンをA1とし、現行のシリコンはA3であるから今回は3度目のMetal layer spinである。

Metal layer spinは1+1=3のようなロジックの問題を解決するもので、消費電力やイールドの問題を解決できるものではない。イールド問題のほとんどはそのチップが製造される過程で起こり、これにトランジスタの駆動速度が要素として関係してくる。この設計ルールを捻じ曲げようとすると別の問題が出てくることになる。
とにかく、Metal layer spinでは消費電力の問題もイールドの問題も解決しないのである。


NVIDIAは最初のGF100のシリコンを昨年9月初めに受け取っていた。このときは周波数は500MHz程度で、イールドは一桁台だった。この数字は衝撃的な低さであるが、最初のシリコンでもあり、この手の問題は一般的である。

2番目のシリコンであるA2では周波数は若干上がったものの、イールドは依然として低かった。そしてA3シリコンはクリスマス前にできたようだが、周波数は上がらず、問題は解決しなかった。
NVIDIAはMetal layer spinを周波数と消費電力問題の解決に使ったが、これが誤りであった。このままでは生産に耐えうるものではなく、問題を解決するにはおそらくFull base layer respinが必要である。


こうなった原因はいたって単純でNVIDIAが(新プロセスの)テストを行わなかったためである。AMDはRV740(Radeon HD 4770)を製品投入したが、これは同時にTSMC 40nmプロセスのテストを兼ねていた。TSMCの40nm決していい状況ではなくむしろ酷かったが、AMDはなぜイールドが低いのかを学び、その教訓が“Evergreen”(Radeon HD 5000シリーズ)に生かされた。

NVIDIAは2009年第1四半期の時点では4種類の40nm GPUを計画していた。その名前はGT212, GT214, GT216, GT218でそれぞれGT200b, G92b, G94, G96をシュリンクし改良したものとなるはずだった。ところが、GT212は出来が悪くシリコンがお目見えする前に打ち切られた。2番目のGT214も大幅な規模縮小を強いられ、StreamProcessor数を128から96として、GT215と名前を変えられた。そして2009年11月になってようやくお目見えした。GT215はGeForce GT 240として、GT216はGeForce GT 220として、GT218はGeForce G210として投入された。

GT215, GT216, GT218のダイサイズはそれぞれ139mm2、100mm2、57mm2である。一方AMDのRV740は137mm2である。いずれも十分小さいサイズである。
AMDは137mm2のRV740を2009年4月に販売できる量を生産することができた。NVIDIAの方はもっと問題が深刻でGT216とGT218は2009年8月にOEM向けのみとして出荷され、リテール向けに出荷できるようなイールドに達するには数ヶ月を要した。そしてGT215はさらに数ヶ月を要することになった。


イールドの具合は大雑把に言ってダイサイズの2乗に反比例する。100mm2のチップのイールドを1とすると、200mm2のチップのイールドはその1/4、逆に50mm2のチップのイールドは4倍となる。チップメーカーは設計に冗長性を待たせることで製造時の種々のエラーを回避しようとしているが、それでも限界はある。

あまりにも冗長性を持たせるとその分ダイサイズに跳ね返り、チップの価格も高価となってしまう。このあたりはトレードオフで半導体メーカーが頭を悩ませるところである。つまり、余計なダイエリア(=冗長性を持たせた部分)を極力少なくし、なおかつ高イールドのチップを作れれば大成功である。

NVIDIAが問題に気づいたときには既にとき遅し。TSMCが奇跡でも起こさない限りGF100に待っている運命は破滅である。
GF100は550mm2である。NVIDIAは100mm2のチップで深刻なイールド問題を抱え、139mm2のチップでは3ヶ月の遅延を起こした。そして、それよりも大きなダイのチップ
(=GT212のこと)は生産することができずお蔵入りとなってしまった。NVIDIAはこんな状況で550mm2のチップを作ろうとしているのである。
GF100のダイサイズはGT215の約4倍である。つまりGF100のイールドは大雑把にいってGT215の1/16となる。GT215のイールドも本当は決して良いものではないのだが、仮にGT215のイールドが99%だったとしても、GF100のイールドは1桁台になってしまうことが想像できるだろう
(・・・個人的にこの図式は少々乱暴すぎるのではないかと思いますが)。そしてGT215の実際のイールドはそこまで高くない。

NVIDIAに今必要なものは多くの試験期間と、Full base layer respinである。そしておそらくはMetal layer spinも最低1回は必要となるだろう。もし、すべてがうまくいったとしても、修正版GF100が出回るのは6ヶ月以上先となる。

内部情報によるとCESでお披露目されたGF100の消費電力は280Wだったという。NVIDIAはテープアウト時からGF100が高消費電力であることは知っていたようだが、Compute boardは225Wになると主張してきた。

NVIDIAのエンジニアの話によると、GF100は1.05Vという低い電圧で動作させるはずだったという。ちなみにAMDの“Cypress”は1.15Vである。TDP188Wである“Cypress”に対し、GF100をTDP225W収めるため、NVIDIAはGF100の電圧を調節する必要が出てきた。大雑把に言ってコア電圧が0.1V上がると電流は50%上昇する。
ここでトランジスタのばらつきを思い出して欲しい。鍵となるのはリーク電流である。リーク電流が多いトランジスタはそうでない物に比べてより多くの電流を消費し、一方であるトランジスタは動作が遅いことがある。低速のトランジスタに対する処方箋は電圧を上げることで、これにより「弱い」トランジスタはしばしば正常に動作するようになる。ところが、同時にリーク電流の多いトランジスタでは電圧を上げたことによりリーク電流が増大しより熱くなってしまう。
熱いトランジスタは冷たいものに比べてリーク電流が多いわけであり、チップが熱いということはそれだけリーク電流が多いということは予想がつく。ヒートシンクやファンで積極的に冷やすという手もないわけではないが、余計なコストがかかる。おまけにうるさい。


TSMCの40nmでは「弱い」トランジスタが多く、またリーク電流の多いトランジスタも多かった。もしここで電圧を上げれば消費電力の増大を招き、しかし電圧を上げなければ「弱い」トランジスタが動作しない。そして動作しない部分は「欠損部分」となる。

問題はまだある。GF100は32のStreamProcessorが1つのクラスタをつくり、それが16クラスタ集まって構成されている。ここで、1箇所「欠損部分」ができたとすると、32のStreamProcessorを無効化しなくてはならないことになる。2つなら64である。

NVIDIAがA3シリコンでとった対処法は2つである。つまり2つのクラスタを無効化することと電圧を上げることである。結果、消費電力が増大し、一方で性能は12.5%減となってしまった。

高消費電力と「弱い」トランジスタの存在により、GF100は十分高い周波数で動作できなくなってしまった。昨年3月の情報ではGF100は750MHz/1500MHzで動作すると言われていた。しかし、A3シリコンの最高周波数は2クラスタを無効化した状態でも600MHz/1200MHzだという。

NVIDIAは昨年の秋、GF100は“Cypress”より60%高い性能を有すると述べていた。しかしすぐに40%高速と言われるようになった。そしてCESではGF100が強みを発揮するゲーム・ベンチマークを厳選してデモを行った。その時の性能が“Cypress”の60%増しであったことから、これが最良のケースであると思われる。

“Cypress”の60%増しの性能というのが512spで750MHz/1500MHz動作の場合だとすると、おそらくこのときの消費電力が280Wである。これを448spで600MHz/1200MHzとするとフルスペックの87.5%のStreamProcessor数と80%の周波数となる。そして性能的には160 x 0.875 x 0.8=112で“Cypress”の12%増しとなる。こうなると“Cypress Reflesh”の射程圏内であり、さらに“Cypress”の上にはDual-GPUカードである“Hemlock”もある。

・・・もうとにかく疲れました。
実はまだこの続きがあって、GF100の価格のことが書かれています。簡単に書くとGF100のイールドが低いために、その製造コストの時点で“Hemlock”よりも高い価格となってしまうとされています。

・・・本題とはやや外れますがMetal layer spinやFull base layer respinの話、トランジスタのリーク電流の話はなかなか興味深い話ですね。

で、本題についてですか? ・・・まあSemiAccurateは以前から“Fermi”に対して否定的でしたから・・・。しかしまあよくぞここまで書けるものだと思います。とりあえず、これは読み物として紹介します。こういう意見もあるという程度で読んでいただければ幸いです。

・・・いろいろな意味でため息が出てしまいます。

・・・お願いですので、コメント欄で不毛な争いはしないでください。コメント欄が荒れると私の胃も荒れてしまいます・・・。



(追加:2010年2月21日13時00分)

◇その4~NV Fermiの溜息―SemiAccurateの“Fermi”悲観論 その2
SemiAccurate gets some GTX480 scores(SemiAccurate)

NVIDIAがGeForce GTX 480の性能に関して一部情報を明らかにした。そして、SemiAccurateのメンバーの一部が何枚かのカードを入手し、データを集めた。結果は極めて悲惨だった。

GF100には2種類がある。512のStreamProcessorを搭載するGeForce GTX 480と448のStreamProcessorを搭載するGeForce GTX 470である。GeForce GTX 480の周波数は600/1200MHzまたは625MHz/1250MHzと言われている。昨春、NVIDIAは750MHz/1500MHzであるとしていたが、これは大きな誤りであった。600MHz/1200MHzか625MHz/1250MHzかはメディアによって異なるが、どちらにしろこれが最終周波数であることに皆溜息をついている。

GeForce GTX 470は448spで周波数は625MHz/1250MHzである。GeForce GTX 480が600MHz/1200MHzであった場合、周波数はGeForce GTX 470の方が若干速いことになる。
ところでGeForce GTX 480(GF100)がトランジスタの最小駆動電圧に問題を抱えているという話を覚えているだろうか? NIVIDAはトランジスタのどうにか駆動させるために、電圧を上げざるを得なかった。そしてこれにより今度は発熱の問題が襲い掛かってきた。SemiAccurateで得た情報ではいずれもGeForce GTX 480は非常に熱く、2D描出時のIdle時でさえも70℃だったという報告もある。


またIdle時でも冷却ファンが最大回転数の70%で回っていたという。明らかに普通の使用と比較して高い回転数である。これがBIOSの問題で、本来はこんなにファンが回るはずがないのだと思いたい。あるいはGF100はIdle時も電圧が下げられないのかもしれない(→サンプルだから? BIOSが未成熟だから?)。とにかく、ファンが高回転でやかましいということはお伝えしておく。

SemiAccurateのメンバーはGeForce GTX 480で高解像度で現行のゲームをいろいろと動かしてみた。
まず、GeForce GTX 480であるがスペックをおさらいするとStreamProcessor数は512で周波数は600MHzまたは625MHz
(周波数に関しては情報によって数字が異なっている)である。そしてGeForce GTX 480のスコアであるがRadeon HD 5870(“Cypress”)より平均して5%良い程度であった。これを踏まえるとGeForce GTX 470はテストを行っていないものの、Radeon HD 5870よりも遅くなることが予想がつく。
ただ、“Heaven”でのテッセレーション性能に関しては非常に優秀で、この場合はスコアはRadeon HD 5870の2倍以上で、Radeon HD 5970も超えることになるだろう。ただ、この報告をしてきた情報源は他のゲームあるいはベンチマークでこの性能が反映されることはないと述べている。Shaderが「本来の仕事」で必要としない状況で、テッセレーションを行うという限られた状況でしかこのような良好なスコアを出せないためである。


GeForce GTX 480(GF100)はGPUというよりも、GPGPUのためのチップでグラフィックを行っているようなものである。GeForce GTX 480は良いグラフィックチップとなるにはmath/DP FPが重厚すぎた。だが、Shaderをループさせてテッセレーションを行う場合は相乗効果を発揮するときで、このときのみGeForce GTX 480がRadeon HD 5870を大きく引き離す。CESでNVIDIAが見せたベンチマークはまさにこれである。
しかし、その情報筋が指摘するには“Heaven”そのものにも問題があるといい、このベンチマークは明らかに目立つそして極めて目障りな粗
(glitches)があるという。CEDでNVIDIAが特定のクリップしか見せたなかった理由がこれである。DirectX 11がGeForce GTX 480ではまともに動かないのである。一部の噂では、DirectX 11対応ドライバはGeForce GTX 480のローンチには間に合わないのではないかとささやかれている。だが、我々はDirectX 11対応ドライバなしにNVIDIAがGeForce GTX 480をローンチすることはできないと見ている。

GeForce GTX 480の性能がRadeon HD 5870とあまりにも近いため、NVIDIAはGeForce GTX 480をRadeon HD 5870の価格―$400で販売しようとしている。この価格設定では赤字であり、本当ならばRadeon HD 5870と$600のRadeon HD 5970の間の価格で販売したいところである。だが、GeForce GTX 480はPRとマーケッティングのツールに使われてしまうようである。

もしレビュワーにに幅広いベンチマークが行われ、正直なスペックを書かれると、GeForce GTX 480はRadeon HD 5870同等の性能と結論付けられてしまう。なので、数ヶ月間はGeForce GTX 480を独自に購入・入手してのレビューは出てこない。NVIDIAのコントロール下にある者だけが、GeForce GTX 480を手に入れ、厳選されたレビューを送り出すことができる(持って回った表現になったが、ぶっちゃけてしまうと提灯ライターだけがGeForce GTX 480を入手し、提灯レビューを出すことが許されるということ。これが本当ならだめだこいつ早く何とかしないと・・・とまでは言わないにしろかなりの末期状態である)

もし正直なジャーナリストがレビューを書くとGeForce GTX 480=Radeon HD 5870とされてしまうため、NVIDIAはこの手の正直なジャーナリスト・メディアを締め出すつもりである。そしてネガティブな部分は押さえ、NVIDIAのPRポイントを重点的に書く「レビュワーガイド」に忠実に従うとされているジャーナリストのみが、早くからGeForce GTX 480を手に入れられる。いくらなんでもこんなことをするはずがないだろうとお思いの方もいるのではないかと思うが、GeForce GTS 250のローンチ時に実際AnandやKyleなどのメディアが締め出しを食っている。GeForce GTS 250の時はこの企みがうまく運び、そして今回もう1度同じことをするつもりである。もし、このことが本当だとばれたら大炎上間違いなしだろう。

NVIDIAはGeForce GTX 480を5000~8000枚ほどしか生産しないという。そして、このカードは売れば売るほど赤字となってしまう。

おいおい・・・いくらなんでもボロクソに書きすぎでしょう・・・。
真実であったとしても間違いであったとしてもどちらにしろ問題です。

さて・・・出てくるのは“Conroe”か“Prescott”か。どちらでしょうね?