Intel Documents Point to AVX-512 Support for Cannon Lake Consumer CPUs(AnandTech)
Intel "Cannon Lake" Could Bring AVX-512 Instruction-set to the Mainstream(techPowerUp!)
Intelの次世代CPUである“Cannon Lake”はAVX-512命令がメインストリーム向けにもたらされる序章となる。現時点でAVX-512命令をサポートしている製品はハイエンドデスクトップ向けの“Skylake-X”、サーバー向けの“Skylake-SP”及び“Skylake-W”、そして演算アクセラレータである“Knights Landing”と“Knights Mill”である。
“Cannona Lake”がサポートする角はAVX512F, AVX512CD, AVX512DQ, AVX512BW, AVX512VL命令で、さらにAVX512_IFMAとAVX512_VBMIコマンドをサポートする。これは現行の“Skylake-SP”がAVX-512命令群とほぼ同等の範囲をサポートすることになる。
Intel "Cannon Lake" Could Bring AVX-512 Instruction-set to the Mainstream(techPowerUp!)
Intelの次世代CPUである“Cannon Lake”はAVX-512命令がメインストリーム向けにもたらされる序章となる。現時点でAVX-512命令をサポートしている製品はハイエンドデスクトップ向けの“Skylake-X”、サーバー向けの“Skylake-SP”及び“Skylake-W”、そして演算アクセラレータである“Knights Landing”と“Knights Mill”である。
“Cannona Lake”がサポートする角はAVX512F, AVX512CD, AVX512DQ, AVX512BW, AVX512VL命令で、さらにAVX512_IFMAとAVX512_VBMIコマンドをサポートする。これは現行の“Skylake-SP”がAVX-512命令群とほぼ同等の範囲をサポートすることになる。
サーバー向けの製品と比較して制限がかかるかどうかは分からないという但し書きはありますが、“Cannon Lake”がサポートするAVX-512命令群の範囲としては“Skylake-SP”とほぼ同等だとAnandTechで解説されています。
AnandTechによると“Cannona Lake”は元々“Kaby Lake”や“Coffee Lake”とよく似たCPUアーキテクチャだったとしており、最初の計画時点ではAVX-512命令のサポートは考えていなかった可能性が示唆されています。しかし“Cannon Lake”は当初の2016~17年の予定であったものが10nmプロセスの遅延とともに先送りされて現在に至ります。その過程で“Cannon Lake”がAVX-512をサポートするアーキテクチャに変更された可能性があるとしています。
AVX-512命令のサポートは“Cannon Lake”の次の“Ice Lake”でさらに拡大されるようで、“Knights Mill”がサポートしているAVX512_VPOPCNTDQコマンドや、AVX512_VNNI, AVX512_VBMI2, AVX512+VPCLMULQDQ, AVX512_BITALG命令が追加され模様です。
“Cannon Lake”で追加される新命令はAVX-512だけにとどまらず、SHA-NIと呼ばれる暗号化アクセラレーションの追加もあります。SHA-NIは先行してAtom系列コアの“Goldmont”で搭載されているもので、AES-NIをベースとしたもののようです。
“Ice Lake”でも新命令の追加が行われ、その中にはCPUに接続されたNVMe SSDの制御に関連するCLWB (Cache Line Write Back) があります。この命令は“Skylake-SP”で既に実装されているもので、“Skylake-SP”の場合は3D Xpointを使用したNVDIMMのコントロールも視野に入れたものです。一方でコンシューマ向け製品である“Ice Lake”でこのCLWBをどのように活用するのかはまだ不明な点が多いようです。

この記事へのコメント
AVX512でクロックが思いっきり下がるのがどうなるのやら
2017/10/22(Sun) 00:21 | URL | LGA774 #-[ 編集]
元々Skylake自体にAVX-512が実装されてて機能がOFFになってただけ
2017/10/22(Sun) 01:50 | URL | LGA774 #-[ 編集]
インテルだから使われやすくなりそうな、でも512bit長の命令をホイホイ扱う用途とは・・・
2017/10/22(Sun) 07:56 | URL | LGA774 #-[ 編集]
やっぱりIntelは堅実な命令拡張が強みだな
2017/10/22(Sun) 13:46 | URL | LGA774 #-[ 編集]
/未だにPentiumとCeleronではAVX1さえサポートされていない状況で、AVX512がメインストリームにも!と言われても少々微妙な気がしますね
2017/10/22(Sun) 20:42 | URL | LGA774 #-[ 編集]
手持ちのiGPUに仕事させた方がいいんじゃあないかな。
2017/10/23(Mon) 00:25 | URL | LGA774 #-[ 編集]
GPGPUで敗北したIntelの武器はAVXとTSXだけか。
2017/10/23(Mon) 21:24 | URL | LGA774 #-[ 編集]
たしかにそれよりPentiumとかにもAVX2位まで標準実装して欲しい。
AMDとの性能差出るところだし。
AMDとの性能差出るところだし。
2017/10/24(Tue) 00:30 | URL | _ #-[ 編集]
デスクトップ用Skylake/Kaby LakeにはAVX512は搭載されてない。そもそもL1D$のロード帯域がAVX2(256 bit)用の32B/cycle x2で512bitロードに2サイクルかかってしまうので活かせない。ロード帯域が64B/cycle x2に拡張されたのはSkylake-SP。
2017/10/24(Tue) 03:55 | URL | LGA774 #-[ 編集]
AVX512何に使うの?
2017/10/24(Tue) 09:53 | URL | LGA774 #-[ 編集]
iGPUは処理能力だけ見ると強そうに見えるが、1回の計算にかかる時間はCPUに比べるとかなり長い
あくまで多数の演算器を使い切れるほど並列化できる処理しか速くない
CPUだと並列化できない部分やデータの依存関係が複雑な部分も高速で処理できる
あくまで多数の演算器を使い切れるほど並列化できる処理しか速くない
CPUだと並列化できない部分やデータの依存関係が複雑な部分も高速で処理できる
2017/10/24(Tue) 10:29 | URL | LGA774 #-[ 編集]
そこまでやるならCUDAとかでいいじゃんと思ったが
NvidiaがAIでも強くなった今Intelにとっては死活問題なんだろうな
NvidiaがAIでも強くなった今Intelにとっては死活問題なんだろうな
2017/10/25(Wed) 06:41 | URL | LGA774 #-[ 編集]
熱そう(小並感)
2017/10/25(Wed) 08:40 | URL | null #7x.pT8a2[ 編集]
>158204
GPGPUや携帯向けに開発されだしたAIエンジンも要は大量の行列計算機だから、今後は需要が増えるんじゃないだろうか。
条件判断の多い計算だと有利かもしれないけど、電力効率は高くなさそうだし、某氏はAVX2よりキャッシュヒット率改善する方が高速化に効いたって言ってたしなぁ。
GPGPUや携帯向けに開発されだしたAIエンジンも要は大量の行列計算機だから、今後は需要が増えるんじゃないだろうか。
条件判断の多い計算だと有利かもしれないけど、電力効率は高くなさそうだし、某氏はAVX2よりキャッシュヒット率改善する方が高速化に効いたって言ってたしなぁ。
2017/10/25(Wed) 11:14 | URL | LGA774 #-[ 編集]
AMDがこれにどう対応するかだな。
画質面でH/WエンコードがS/Wエンコードに及ばない現状では、存在意義はあるでしょう。
画質面でH/WエンコードがS/Wエンコードに及ばない現状では、存在意義はあるでしょう。
2017/10/25(Wed) 22:28 | URL | 青人 #-[ 編集]
AMDはこの手の計算はRadeonに投げて、Zenをこのままコンパクト&高効率なコアとして育てたほうがいい。
まともなGPUを持っていないIntelの苦しいところで、力押し。
まともなGPUを持っていないIntelの苦しいところで、力押し。
2017/10/26(Thu) 06:35 | URL | LGA774 #-[ 編集]
AVX命令はアプリが限られるから、あえてSSE2を高速化しAVXは限定的なものを実装したAMDだけど、仮にAVX命令を強化してくるならZen2辺りからかな?
ちなみに、Ryzenの場合はPCSX2のGSDXはAVXよりSSE2を使った方が速いようだ(試してみたw)
ちなみに、Ryzenの場合はPCSX2のGSDXはAVXよりSSE2を使った方が速いようだ(試してみたw)
2017/10/27(Fri) 17:53 | URL | LGA774 #-[ 編集]
AVXが使われるのは特殊用途といえば特殊用途だから、別にZenが同等のサポートする必要はないだろう
というかそのような多様性はあって良いしある方が選択肢が増えてよろしい
ただ、CPUのレジスタを用いて並列処理できるというのは思われているよりも強力
というかそのような多様性はあって良いしある方が選択肢が増えてよろしい
ただ、CPUのレジスタを用いて並列処理できるというのは思われているよりも強力
2017/10/28(Sat) 16:23 | URL | LGA774 #-[ 編集]
この記事のトラックバックURL
https://northwood.blog.fc2.com/tb.php/9153-d5eaa1ba
この記事にトラックバックする(FC2ブログユーザー)
この記事にトラックバックする(FC2ブログユーザー)
この記事へのトラックバック