北森瓦版 - Northwood Blog (Author : 北森四葉. Since July 10, 2006.)
NVIDIA's Upcoming GK110 GPU With Hyper-Q To More Than Double HPC Performance(Legit Reviews)

NVIDIAは“Kepler”アーキテクチャのGK110で“Hyper-Q”と呼ばれる新機能により、High Performance Computing(HPC)性能を2倍以上に高めようとしている。

“Fermi”アーキテクチャのGF110ではHPC性能は限られたものであった。その理由が高度に並列化されたGPUではCPUからのデータ供給が満足に得られないためで、順序化されたワークブロックの間の独立性が誤っていること(False dependencies)がボトルネックとなっていた。結果として低速化を引き起こしていた。
GK110で導入される“Hyper-Q”はこのボトルネックを解消するものだとNVIDIAは説明している。
 
「“Hyper-Q”は1基のGPUに対して同時に複数のCPUコアをロードに携わらせることが出来る。これによりGPUの使用率を上げ、またCPUがIdle状態になっている時間を短縮できる。“Hyper-Q”ではホスト(CPU?)とGK110 GPU間の接続は最大で同時に32まで可能である」

“Hyper-Q”はCUDA streamとMessage Passing Interface(MPI)プロセスあるいはスレッドとの接続に柔軟性をもたせている。Fals dependenciesで制限されているようなアプリケーションならば、コードを変更せずとも32倍の性能向上を実現することも可能だという。

NVIDIAは“Hyper-Q”による速度向上をベンチマークで提示しており、従来GPU向けのコードを書くのが難しかったCP2Kと呼ばれるものを使ってそれを示した。CP2KはMPIベースのmolecular simulation codeである。CP2Kアプリケーションで“Hyper-Q”の設定を最大限GPUが活用できるようにすると、この設定をしない場合と比較し同じコードで2倍以上の性能向上が見て取れた。示されたグラフではおおむね2.5倍以上の性能向上となっていた。

GK110は“Kepler”アーキテクチャを使用したGPUでHPC向けに重点を置いたコアとなります。このGK110を使用した製品がTesla K20として既に明らかにされており、今年末に登場するといわれています。
このGK110に導入される新技術が“Hyper-Q”で、データのロードに関わるもののようです。この技術の導入により、現行のGPU演算によるボトルネックの1つが解消され、大幅な性能向上を見込めるとしています。