AMD Kaveri - graphics performance on par with Radeon HD 7750(NordicHardware)
次のA series APUとなる“Trinity”は今夏にローンチされるだろうが、早くもその次の世代の情報が出始めている。“Trinity”の次の世代のAPUとなる“Kaveri”は第3世代の“Bulldozer”系アーキテクチャのコアをCPUとして搭載し、GPUはRadeon HD 7700系と同等のものを搭載する。
AMDが2013年に第3世代のAPUとして計画しているものが“Kaveri”である。“Kaveri”は今までのようにCPUにGPUを内蔵するだけでなく、もう1段階進んでCPUとGPUが排他的にメモリを使用するのではなくメモリを共有できるようになる。“Kaveri”ではCPUもGPUも搭載されているメモリ空間をすべて使うことができるようになる。
次のA series APUとなる“Trinity”は今夏にローンチされるだろうが、早くもその次の世代の情報が出始めている。“Trinity”の次の世代のAPUとなる“Kaveri”は第3世代の“Bulldozer”系アーキテクチャのコアをCPUとして搭載し、GPUはRadeon HD 7700系と同等のものを搭載する。
AMDが2013年に第3世代のAPUとして計画しているものが“Kaveri”である。“Kaveri”は今までのようにCPUにGPUを内蔵するだけでなく、もう1段階進んでCPUとGPUが排他的にメモリを使用するのではなくメモリを共有できるようになる。“Kaveri”ではCPUもGPUも搭載されているメモリ空間をすべて使うことができるようになる。
AMDの資料から分かった“Kaveri”のスペックを見ていくと、まずCPUは第3世代“Bulldozer”系アーキテクチャのコアとなる“Streamroller”となる。GPUは“Graphics Core Next”系となり、Compute unit数は最大8となる。つまり、Radeon HD 7750と同じ数である。“Kaveri”はTDP100Wまでが想定されており、APUとしては初めて1TFOPSに到達するものになる。
スペック上はRadeon HD 7750と同等となる“Kaveri”のGPUであるが、もし“Kaveri”のメモリコントローラがDual-channelにとどまるとすると、メモリ帯域が足かせになることが容易に想像できる。しかし、“Kaveri”は全く新しい方法でメモリ制御を行うことができるため、“Llano”程はメモリ帯域による問題が顕在化しにくいのではないかと思われる。“Kaveri”のSocketが何になるかは分からないが、もし“Kaveri”でメモリチャネルを増やすというのであれば、さらにメモリ帯域のボトルネックは緩和されるだろう。だが、“Kaveri”が性能を重視してメモリチャネルを増やしてくるか、コストを重視してDual-channelのままにしてくるかはまだ分からない。
“Kaveri”では演算性能が1TFLOPSを超えて1050GFLOPSとなる。この演算性能から周波数を推測することができる。もしCPUが4-coreで4GHzならばその演算性能は128GFLOPSとなる。一方、GPUはRadeon HD 7750と同等のStreamProcessor数512で800MHzであれば819GFLPSとなる。このままだと1050GFLOPSにはやや届かないが、GPUの周波数を900MHzとしてやると921.6GFLOPSとなり、CPUの128GFLOPSとあわせて1049.6GFLOPSとなる。
“Kaveri”が使用する28nmプロセスは“Llano”や“Trinity”が使用しているGlobalFoundriesの32nm SOI / HKMGから見るとハーフノードの世代に当たる。そのため、28nmの“Kaveri”のトランジスタ密度は“Llano / Trinity”世代と比較すると25%程の向上になると思われる。もし“Kaveri”が“Trinity”の1年後である2013年夏に登場するのであれば、競争相手はIntel 22nmプロセスの“Haswell”となるだろう。
以下に“Llano”、“Trinity”、“Kaveri”と3世代のAPUの仕様をまとめました。
Llano | Trinity | Kaveri | |
製造プロセス | 32nm | 32nm | 28nm |
CPUコア | Husky | Piledriver | Steamroller |
CPUコア数 | 4 | 4 | 4 |
CPU周波数 | ~3GHz | ~4GHz | ~4GHz? |
L2キャッシュ | 1MB×4 | 2MB×2 | 2MB×2? |
メモリチャネル | 2ch / 128-bit | 2ch / 128-bit | ? |
GPUアーキテクチャ | VLIW 5 | VLIW 4 | GCN |
StreamProcessor数 | 400 | 384 | 512 |
GPU周波数 | 600MHz | 800MHz | 900MHz? |
Texture unit数 | 20 | 24 | 32 |
ROP数 | 8 | 8? | 16 |
動画処理エンジン | UVD 3 | UVD 3 / VCE | ? |
TDP | 100W | 100W | 100W |
演算性能 | 573GFLOPS | 819GFLOPS | 1050GFLOPS |
Socket | SocketFM1 | SocketFM2 | ? |
これをみるとCPUは“Steamroller”世代となるものの、コア数は“Trinity”と同じ4-core / 2-moduleにとどめられるようです。一方、GPUは“Trinity”世代から大幅に更新され“Graphics Core Next”世代のコアが使用され、StreamProcessor数は512となります。予想される周波数は900MHzでスペック上はRadeon HD 7750と同等以上のものが統合されることになります。なかなか強力なGPUが統合されることになりますが、“Cape Verde”のダイサイズは130mm2と小型であるためこれをベースとしたものがAPUへ統合されるというシナリオは決して無理のあるものではありません。
まだ分かっていないのがSocketやメモリコントローラの仕様で、今回の記事ではメモリチャネル増加の可能性についても言及しています。メモリチャネル数が増加した場合、Socketは確実に変更されることになるでしょう(SocketFM3?)。こうなると“Llano”、“Trinity”、“Kaveri”と3世代が3種類のSocketを使うというややせわしないものになります(3chメモリコントローラを搭載して、SocketFM3(仮)に搭載したときは3chが有効、SocketFM2に搭載した場合は2chが有効になるというシナリオもなくはない・・・?)。
(過去の関連エントリー)
AMD 2013年までのロードマップを公開―32nmの次は28nmへ(2012年2月3日)
