北森瓦版 - Northwood Blog (Author : 北森四葉. Since July 10, 2006.)
◇GK104=640~768sp説
Nvidia Kepler “GT-600″ to Unveil in Q1 2012(WCCF Tech)
Nvidia’s Kepler based GTX/GTR 700 Series GPU’s performance compared to Geforce 500 Series in Next Generation Performance Chart(WCCF Tech)

NVIDIAの次世代GPUの性能を示したグラフが明らかになった。このグラフは28nmプロセスで製造される“Kepler”と現行のGeForce 500 seriesで性能を比較したものである。“Kepler”はここではGeForce 700 seriesになるとされている。
 
グラフに書かれている“GeForce 700 series”はGeForce GTX 790, GTR 785, GTX 780, GTX 770, GTX 760の5種類で、このうちGTR 785をのぞく4種類については一部のスペックが記載されています。GTR 785に関してはスペックは不明です。

  ・GTX 790:GK110、Dual-GPUのフラッグシップ。GeForce GTX 590後継
  ・GTX 780:GK100~GK112、Single-GPUのフラッグシップ。GeForce GTX 580後継
  ・GTX 770:GK104、Perfomance向け。GeForce GTX 570後継
  ・GTX 760:GK104またはGK106、メインストリームの上。GeForce GTX 560 Ti後継

グラフではGeForce 700 seriesはその前世代と比較し1.5~2倍の性能を有することが示されている。

それぞれのコアのスペックであるがGK104は640~768のCUDA coreと80~96のTexture unitを有する。コア周波数は1GHz近辺に達する。メモリインターフェースは256~384-bitで搭載するメモリはGDDR5となる。
これの上に位置するのがGK100 / GK112でSingle-GPUのフラッグシップとなるコアである。GK100 / GK112は1024のCUDA coreを搭載し、メモリはGDDR5 2~4GBを搭載、512-bitメモリインターフェースで接続される。


おおむね以前4Gamer.netに出ていたスペックに沿っています。インターフェースはエントリー向けのGK107はPCI-Express 2.0にとどまりますが、GK106以上はPCI-Express 3.0に対応します。



◇GK104=1536sp説
Nvidia Kepler in Detail(Xtreview.com)

NVIDIAの次世代GPU―GK100, GK104, GK106, GK107, GK108のスペックの詳細がChiphellに掲載された。

今回明らかになったのはCUDA core数と周波数である。特にCUDA core数に関しては前世代と比較すると大幅に増加している。例えばGK104ではCUDA core数は1536となり、Texture unit数は64、ROP数は32、コア周波数は1050MHz、メモリインターフェースは256-bitとなっている。

もっと強烈なのがGK100でGK100のCUDA core数は2304に達するという。Texture unit数は96、ROP数は64、メモリインターフェースは512-bit、コア周波数は950MHzである。

以下にXtreview.comに掲載された“Kepler”のスペックを掲載します。

GK100GK104GK106GK107GK108
GPC数64211
StreamProcessor数23041536768384192
コア周波数950MHz1050MHz1150MHz1000MHz900MHz
Shader周波数950MHz1050MHz1150MHz1000MHz900MHz
Texture Units9664643216
メモリ周波数1250MHz
(5000MHz)
1450MHz
(5800MHz)
1437.5MHz
(5750MHz)
1250MHz
(5000MHz)
1000MHz
(4000MHz)
メモリインターフェース512-bit256-bit192-bit128-bit64-bit
ROP643224168
TDP300W225W150W75W35W


見て頂ければ分かるとおり、非常に強烈な数字が並んでいます。特にCUDA core数に関しては最上位のGK100で2304、GK104で1536とGeForce GTX 580の512から大幅に増加しています。こうなると40nmから28nmへのシュリンクがあることを考えても、GK104ですらGF114と同等どころかGF110レベルのダイサイズに収めるのが難しいのではないかと感じますが、“Fermi”から“Kepler”でCUDA coreの構造を根本から見直すような―それこそCUDA coreの定義が変わるような大変革があればこの数字も全くあり得ないとは言い切れません。逆に“Fermi”の正当進化で“CUDA core”という言葉が指し示すものが“Fermi”から変わらないのであれば、このスペックはかなり無理があるように思えます。

3DMark 11のだいたいのスコアも掲載されており、GK100がX4500、GK104がX3000、GK106がX1600となっています。