北森瓦版 - Northwood Blog (Author : 北森四葉. Since July 10, 2006.)
Nvidia Launches Pascal based Tesla P4 and P40 accelerators(Guru3D)
Tesla P4, P40 Accelerators Deliver 45x Faster AI; TensorRT and DeepStream Software Boost AI for Video Inferencing(VideoCardz)

NVIDIAは9月13日、“Pascal”アーキテクチャをベースとしたディープラーニング向けのアクセラレータとしてTesla P4とTesla P40を発表した。

スペックは以下の通りです。
 
Tesla
P40P4
コア・プロセスGP102 16nmGP104 16nm
SM3020
CUDA core数38402560
単精度浮動小数点演算性能12TFlops5.5TFlops
Peak INT847 TOPS22 TOPS
搭載メモリGDDR5 24GBGDDR5 8GB
メモリ帯域346GB/s192GB/s
消費電力250W50W&75W


CUDA core数からTesla P40はGP102を、Tesla P4はGP104をベースとしていると考えられます。これらの特徴として、NVIDIAがしばしば強調するdeep neural network用途があり、そのために8-bit (INT-8) operationをベースとした命令処理に特化させたと述べています(と言われても私自身あまりピンと来ないのが正直なところ。最近のNVIDIAがdeep learningという言葉をしばしば持ち出してくるのは広く知られているところであるが。ビッグデータ処理やらAIあたりが該当するのだろうか。今回のリリースにもより先進的なAI serviceに必要な高演算性能を、とある ・・・個人用途だとちょびっツの開発用?)。

Tesla P4は11月、Tesla P40は10月に出回る見込みです。



コメント
この記事へのコメント
153730 
Deep Learningには単精度までの精度はいらない.その分速さを重視して半精度で演算させよう.というのがほんの少し前まで流行っていて
現在はGoogleがAlpha Goで使用したASICが8-bitだったということからか
8-bit推しに変化しているようです
2016/09/14(Wed) 23:12 | URL | LGA774 #-[ 編集]
153734 
ロープロのteslaってどこに需要があるんだろう
もうちょっと安かったらなあ
2016/09/15(Thu) 12:51 | URL | LGA774 #-[ 編集]
153736 
コンピュータが経験を元に自分で正解を見つけ出すのがdeep learning
要するに自己学習型プログラム
そう言ってしまえば実に陳腐だが
プログラマーが考え付かないようなロジックをコンピュータが勝手に蓄積していく様は本気で怖くなる
ちなみに碁で名人がdeep learningを備えたコンピュータに負けたらしい
そんなロジックは人には絶対組めない
まあ余談ですが
2016/09/15(Thu) 21:48 | URL | LGA774 #-[ 編集]
153740 
>153736
数撃ちゃ当たるという究極の力押しでもあるから
非力なシステムには持ってこられない欠点もある

たとえばSiriとかCortanaのようにスパコンで得られた結果だけを
デスクトップやスマホでおいしく使う時代になると思うが
ツールのひとつとして何をどう使うか取捨選択するのが
プログラマーの仕事になってくるのではないかな

つまり根っこは何も変わらないというw
2016/09/17(Sat) 23:13 | URL | LGA774 #-[ 編集]
154083 
メモリバンド幅がショボいので見送りかなと・・・
2016/10/29(Sat) 03:37 | URL | LGA774 #-[ 編集]
コメントを投稿する(投稿されたコメントは承認後表示されます)
URL:
Comment:
Pass:
秘密: 管理者にだけ表示を許可する
 
トラックバック
この記事のトラックバックURL
https://northwood.blog.fc2.com/tb.php/8695-3e94124a
この記事にトラックバックする(FC2ブログユーザー)
この記事へのトラックバック