北森瓦版 - Northwood Blog (Author : 北森八雲. Since July 10, 2006.)
 
Radeon HD 7970ではGraphics Core Nextと呼ばれる新アーキテクチャが採用され、ゲーム性能においても演算性能においても劇的な強化が成された。

Radeon HD 7970のスペックは以下の通り。

Radeon HD 7990Radeon HD 7970Radeon HD 7950
アーキテクチャGraphics Core Next
コア
プロセス
NewZealand
28nm
Tahiti XT
28nm
Tahiti Pro
28nm
Compute unit数32×23230
Radeon Core数2048×220481920
コア周波数***MHz925MHz***MHz
搭載メモリGDDR5GDDR5
3GB
GDDR5
メモリ周波数****MHz
(****MHz)
1375MHz
(5500MHz)
****MHz
(****MHz)
メモリインターフェース384-bit×2384-bit384-bit
Texture unit数128×2128120
ROPs
Z-stencil
32×2
128×2
32
128
32
128


StreamProcesor数は2048で周波数は925MHz、演算能力は3.79TFlopsとなります。ダイサイズは365mm2で前世代の“Cayman”の389mm2よりもやや小型化されています。一方でトランジスタ数は28nmプロセス化により“Cayman”の26億4000万から大幅に増え、43億1000万となります。

APIはDirectX 11.1に対応、インターフェースはPCI-Express 3.0に対応します。消費電力は最大が260W、待機時(ディスプレイOFFの状態)が3W、一般的なIdle時は15W以下となります。待機時の3Wは新たに導入されたAMD ZeroCore Power Technologyによるもので、Windowsの待機時間が長長時間に及びディスプレイの電源が落とされた状態―Lond Idle mode時にPCI-Expressインターフェース以外の電力供給をカットするものです。これにより待機時の消費電力を3Wという極めて低い値に抑えることに成功しています。

アーキテクチャは既報の通り“Graphics Core Next”となり、64のStreamProcessor(Radeon Core)が1つのCompute unitを構成します。Radeon HD 7970ではこのCompute unitが32集まっています(つまり、StreamProcessor数は2048となる)。
Compute unitの中身をもう少し詳しく見ていくと、4個のStreamProcessorで構成されるSIMD型ベクタ演算ユニットが4個、スカラ演算ユニットが1個備えられています。キャッシュもCU内にL1 data cacheが16kB、Local date share memoryが64kB備えられています。Copmpute unitは4基で1個のクラスタを構成し、64kBのL1 cacheと16kBのL1 scalar cacheをクラスタ内で共有します。
さらにGPU全体で768kBのL2キャッシュを搭載します。
メモリコントローラは“Tahiti”の場合は12基(32-bit×12で384-bit)ですが、これまでのようにメモリコントローラとROPユニットが強固に結合しているわけではないようです。“Tahiti”ではメモリコントローラの数が12に対し、ROPユニット数は32で、メモリコントローラの数とROPユニットの数は1:1や2:1などの綺麗な関係にはなっていません。

アーキテクチャの解説については日本語の記事としては後藤氏のコラムが一番詳しく書かれているのでそちらを併せてご参照ください。

また今回の正式発表に合わせ、レビューも掲載されています。

Civilization V
Radeon HD
7970
Radeon HD
6970
Radeon HD
6990
GeForce
GTX 580
GeForce
GTX 590
Crysis Warhead
1920 x 1200 4xAA
50.339.166.341.764
Min. fps34.327.451.132.650.9
Metro 2033
1920 x 1200 AAA/16xAF
544270.544.563.5
DiRT 3
1920 x 1200 4xAA
10472.2123.798.4147
Min. fps83.957.5101.484124.3
Total War: Shogun 2
1920 x 1200 16xAF
110.774.5138.780.9127.4
Batman: Arkham City
1920 x 1200 4xAA
81605671102
Portal 2
1920 x 1200
4xMSAA 16xAF182.2140.5237.1164.4252.1
4xSSAA 16xAF72.257.7105.866.1104
Battlefield 3
1920 x 1200
4xMSAA48.836.465.546.369.3
FXAA High69.155.197.365.894.8
Starcraft II
1920 x 1200 4xMSAA
9267.7105.190127.1
Civilization V
2560 x 1600 4xMSAA
56.634.865.675.676.6
Compute
259163.7165.12230.2205.3
Compute
SmallLux GPU 2.0d4
2070011900228001200019900
Compute
DirectX 11 Compute Shader Fluid Simulation
Nearest Neighbor133565491.575
Grid Search16901150110019301460
Compute
AESEncryptDecrypt
297 sec※
324 sec
455 sec474 sec263 sec358 sec
Compute
MonteCarloAsian
4.53 sec5.19 sec5.47 sec6.04 sec6.47 sec
Theoretical
3DMark Vantage Pixel Fill
13.38.7815.719.7516.55
Theoretical
3DMark Vantage Texture Fill
107.5573.43129.6345.7174.04
Tesselation
DirectX 11 Detail Tesselation Sample
Max22201416134617931266
Normal25502317220425231445
Tesselation
Unigine Heaven
63.540.775.349.880.8
消費電力Idle113W120W140W133W155W
Long Idle103W118W140W132W146W
Load
Metro 2033
391W370W545W425W572W
Load
OCCT
357W303W461W451W546W
※PCI-Express 3.0環境

性能に関しては手堅い向上が見られます。
特に“Graphics Core Next”が目指していたTesselationや演算周りは前世代のRadeon HD 6970から大幅にスコアが向上しています。