北森瓦版 - Northwood Blog (Author : 北森四葉. Since July 10, 2006.)
PC hardware new "Kepler," GPU micro-architecture(Chiphell / 繁体中文)
The new "Kepler," GPU micro-architecture(HKEPC / 繁体中文)
GTX 680 Generally Faster Than HD 7970: New Benchmarks(techPowerUp!)
GK104 Block Diagram Explained(techPowerUp!)
NVIDIA's New AA Algo is TXAA, Adaptive V-Sync and New 3DVision Surround Detailed(techPowerUp!)

“Kepler”では消費電力を低減した新しい“Advanced SMX”と呼ばれるアーキテクチャを採用する。製造プロセスは28nmプロセス。そしてGK104では35億4000万のトランジスタを集積する。

現行世代の“Fermi”では発熱と消費電力が問題視された。“Kepler”ではコアの性能と消費電力の最適化を行い、高いPerformance-per-Wattを実現した。これが一番の注目点である。
“Kepler”のコア自体は完全な新アーキテクチャというわけではなく、“Fermi 2.0”をベースにアーキテクチャの改良・最適化を行ったものである。
複数のRaster Engineを搭載すること、GPC(Graphics Processing Clusters)と呼ばれるユニット構造となっていること、L2キャッシュとメモリコントローラなどは“Fermi”から引き継がれているが、要素要素で改良が行われている。
 
GK104では今までのStreaming multiprocessor(SM)と呼ばれていたものがSMXに進化している。SMXはCUDA core, PolyMorph Engine, Texture unitなどを内蔵する。1つのSMXに内蔵されるCUDA coreは192と大幅に増加している。

CUDA coreは主にPixel, Vertex, Geometory Shading, Physxの処理を行う。一方、Texture unitはFilteringやFetchを扱う。SMXではCUDA coreが大幅に上昇し、Pixel, Vertex, Geometory Shadingなどの処理能力が大幅に向上した。

Tessellationを担うPolyMorph Engineは“Kepler”でVersion 2.0に更新され、Tessellatorの性能が大幅に向上し、“Fermi”の2倍、Radeon HD 7970の4倍となった。

GK104では2つのSMXが1つのGPCを構築し、4個のGPCと4個のRaster Engineから構成されている。L2キャッシュは768kBで4個のGPCで共有するものとなる。インターフェースはPCI-Express 3.0に対応する。メモリコントローラは64-bitのものが4機搭載され、合計で256-bitインターフェースとなる。

“GK104”ではGPU Boostと呼ばれる機能が搭載されている。GPU Boostは性能を向上させるためのもので、動的にGPUのオーバークロックを行うものである。ちょうどIntelのTurbo BoostやAMDのTurbo COREと似たようなものである。しかし、dGPUの世界ではこの機能を搭載しているのは現時点ではGeForce GTX 680のみである。

GeForce GTX 680はBase ClockとBoost Clockという2つのクロックを有することとなる。そして、Bace Clockはグラフィックコアの標準の動作周波数となる。そしてBoost ColockはGPU Boostによりオーバークロックが行われたときの周波数となる。GeForce GTX 680ではBase Clockが1006MHz、Boost Clockが1058MHzとなる。

この他に新しいAntialiasing technologyであるTXAAや、ゲームを滑らかに動作させるためのAdaptive VSync technology(フレームレートの急激な変動を防いで一定のレートに保つようなもののよう)などの機能が搭載されるようです。

HKEPCの記事の6ページ目にベンチマークが掲載されています。スコアは以下の通り。

GeForce
GTX 680
GeForce
GTX 580
Radeon HD
7970
3DMark11ExtremeOverallX3165X2077X2669
GPU score286919052474
Combined score342125202848
PerformanceOverallP9303P6578P7713
GPU score929860277406
Combined score765563927010
Battlefield 3 (1920 x 1080 4xAA)72.254.470.5
Batman Arkham City (1920 x 1080 8xAA)574249
Call lf Duty - MW3 (1920 x 1080 8xAA)746774
Heaven Benchmark (1920 x 1080 8xAA)46.534.941.5
Lost Planet 2 (1920 x 1080 8xAA)73.454.658.5


ほぼ全ての場面においてGeForce GTX 680はRadeon HD 7970を上回るスコアを出しています。消費電力については推移を示したグラフのみが掲載されていますが、Idle時はRadeon HD 7970の方が低いものの、Load時はGeForce GTX 680の方が低い値に収まっています。