北森瓦版 - Northwood Blog (Author : 北森八雲. Since July 10, 2006.)
AMD Files Patent for Chiplet Machine Learning Accelerator to be Paired With GPU, Cache Chiplets(techPowerUp!)

AMDがGPU(例えばRDNA 3)ユニットとキャッシュユニット(RDNA 2のInfinity Cacheだけを独立させたようなもの)と機械学習アクセラレータ (Macine Learning accelerator, MLA) のchipletを組み合わせる特許を保有している。これらのChipletの組み合わせによりできるチップをAMDはAPD (Accelerated Processing Device) と読んでいる。このデザインは一つの機能に特化した機械学習、特に行列乗算のようなアクセラレータをchipletベースで製造できる。
 
この特許はchipletという形を通してモジュラー方式で機械学習の機能を追加宇することを可能にし、ひょっとするとAMDが予定しているDLSS類似の機能もこの形で実装されるかもしれない。この方式はGPUそのものに統合することに寄る欠点、ダイサイズの肥大やそれに伴うコストの増加やイールドの低下を避けられる。
特許には異なる製造プロセス技術で製造されたchipletを組み合わせることにも言及している。実際RyzenやEPYCは7nmプロセスのCPU chipletと12nmプロセスのI/O dieを組み合わせている。またGPU dieからcache chipletへのキャッシュリクエストのアクセラレーションについても触れられており、on-the-flyでの使用あるいは直接アクセス可能なメモリとしての使用が考えられている。


一部訳が怪しい箇所があるがご容赦を。
RDNA 3あたりでGPUも現行RyzenのようなChipletデザインを採用するという噂があるが、そのChipletはGPU dieだけでなく他のもの、今回の話題であれば機械学習のユニットをchipletとして組み合わせることを考えているようである。また別途cacheのchipletを用意し、これを効率的に使用する方法も研究されている模様だ。先日Raja Koduri氏によってダイが公開されたXe-HPCも複数ダイを先進技術で接続したものであるが、同様の進化をAMDのGPUも遂げるのかもしれない。
関連記事



○Amazon売れ筋ランキング CPU メモリ グラフィックカード マザーボード SSD 電源

コメント
この記事へのコメント
178975 
まぁ、特許を取っているからと言って、製品化するかは全然別の話ですからね。

それ以前の問題として、AIの機械学習向けだとARMの独壇場なので、どうやって競争してくのかが全然見えないわけですが。
何せ、ARMが機械学習向けの製品を開発したのは2018年の初頭なので…
周回遅れ感が…
2021/01/30(Sat) 23:31 | URL | LGA774 #-[ 編集]
178978 
RTレイトレをchipletにしてくれ
こんなもん要らんw
2021/01/31(Sun) 00:15 | URL | LGA774 #-[ 編集]
178979 
レイトレをChipletに別にしたら使い物にならないからAIだけって感じですかね
2021/01/31(Sun) 01:26 | URL | LGA774 #-[ 編集]
178980 
機械学習自体をするんじゃなくて、以前から噂されていたDLSS対抗の機能をこれで処理するという話では。
2021/01/31(Sun) 01:28 | URL | LGA774 #-[ 編集]
178984 
チップレットの組み合わせなんてもので特許が取れるというのは
特許権の濫用としか思えないんだけどなぁ
2021/01/31(Sun) 05:24 | URL | LGA774 #AIlHpmOk[ 編集]
178987 
>178975
ARM命令セットの話と実行ユニットのハードウェア実装の話から
いったい何の競争をするのかと
2021/01/31(Sun) 10:18 | URL | LGA774 #-[ 編集]
178988 
いろいろと条件が付けてあるんだろうけど、今まで別チップでボードに実装しなければならなかったものをchipletにしただけだったら「容易に類推可」とならんか?
2021/01/31(Sun) 10:26 | URL | LGA774 #-[ 編集]
178990 
※178975
「機械学習」に関して明らかに知識不足感ある書き込み
どの分野の機械学習を前提にして話しているんだろう?

※178978
別チップにするとさらに遅延するだけで誰も喜ばないよっと
そのうち最適化していく技術だから我慢して。お爺ちゃん!
2021/01/31(Sun) 10:31 | URL | LGA774 #-[ 編集]
178992 
Rembrandtのリーク情報の中に、機械学習の機能が搭載されていることが示されていましたが、この技術が活用されるのかもしれませんね。個人的には178978氏のおっしゃる通り、レイトレ・機械学習・GPUはチップレットとして別チップ化出来る方が、製品展開上有利だと思います。性能面の不利を抑えられれば、ですが。
2021/01/31(Sun) 13:11 | URL | LGA774 #9zOzYU0I[ 編集]
178996 
公開番号を知りたいなあ。US特許をざっと検索した感じだと、2018年10月31日に出願され2021年1月26日に成立したUS 20200133993 A1か?
2021/01/31(Sun) 18:55 | URL | LGA774 #-[ 編集]
178997 
「一部役が怪しい箇所があるがご容赦を。」という文に怪しさを感じるあたり突っ込み待ちとみた
2021/01/31(Sun) 21:15 | URL | LGA774 #-[ 編集]
179001 
>178978
ゲーム機の台頭で1%ハードウェアに成り下がったRTコアこそ要らない
"DLSS対抗の機能"が互換性無くてゲーム側の作り分けが必要な物であるなら尚更
2021/02/01(Mon) 08:04 | URL | LGA774 #-[ 編集]
179005 
>178990
レイトレは最適化しようが回路の規模的に1nmプロセス世代を待たなければいけない技術
それまでダイの5-10%のロスをずっとユーザーが支払い続けるって酷い話だよ
2021/02/01(Mon) 12:35 | URL | LGA774 #-[ 編集]
179008 
そりゃ小分けにした方が柔軟性とかよくなるだろうけど、そんなにチップ間通信技術に自信あるの?
TensorCoreみたいなのが特許で抑えられてるので、その回避策というのは疑い過ぎか。
2021/02/01(Mon) 18:39 | URL | LGA774 #-[ 編集]
179012 
DLSSに限らず機械学習モデルのCG領域への応用はこれから益々進んでいくだろうし
学習向けというより主に推論向けのアクセラレータであればあり得るかなと
2021/02/01(Mon) 21:12 | URL | LGA774 #-[ 編集]
179014 
>チップレットの組み合わせなんてもので特許が取れるというのは
>特許権の濫用としか思えないんだけどなぁ
そもそもチップレットそのものがAMDの特許だったような
インテルの公式発表でも"チップレットのような"という言い方をしても、自社製品を指して"これはチップレットだ"とは言わないし

>いろいろと条件が付けてあるんだろうけど、今まで別チップでボードに実装しなければならなかったものをchipletにしただけだったら「容易に類推可」とならんか?
だから RDNA 3にあって Ponte Vecchioに無い物が今回の特許なのだろう
類推よりも容易な"最初の発案"なんて存在しないから特許という概念が成り立つのであって
インテルが先に発案出来た事ならAMDより先に特許を取っていた 只それだけだよ
2021/02/02(Tue) 12:02 | URL | LGA774 #-[ 編集]
179018 
機械学習だけなら別チップでもいいだろうけど、ゲーム用途ではあまり向いてない気もしますが
2021/02/02(Tue) 18:20 | URL | LGA774 #-[ 編集]
179023 
中身はxilinxのFPGAだったりして
まだ合併後の製品が出て来るには早すぎるかな
2021/02/02(Tue) 23:23 | URL | LGA774 #-[ 編集]
179025 
XilinxのFPGAあたり統合して処理ごとに回路を組み直すことで複数の機能を実現するとかやってくれないかな
2021/02/03(Wed) 03:24 | URL | LGA774 #-[ 編集]
179033 
ゲームでリアルタイムアップスケーリングに使うんだったらかなり向いてるんじゃないか。レイテンシや帯域が問題になる用途ではないので。
2021/02/03(Wed) 18:08 | URL | LGA774 #-[ 編集]
179039 
そもそもインフィニティ何とかって超高速にて極めて低レイテンシな接続ですよ
CPU間のキャッシュ共有では流石に遅延が出たけどもマイナスイメージ持つのは早計過ぎる
今のところ他のどんな接続より速いって
だからもう少し夢を持とうぜ
2021/02/03(Wed) 23:23 | URL | LGA774 #-[ 編集]
179069 
機械学習は一般的によくいわれるようにコア設計によって
CPUやGPUとでは得手不得手がわかれるのでこの"chiplet"を使えば、
例えばサードパーティー製のARMコアに接続できるバスさえ用意しておけば
AMDのGPUを簡単に統合することができる事を目指しているのでは?
それこそ一個のコアと複数個の"chiplet"を繋げたシステムを簡単に設計できるみたいな?
2021/02/05(Fri) 22:35 | URL | LGA774 #-[ 編集]
179071 
>179069
それらをシームレスに繋げるためにHSAを造ったのさ
2021/02/06(Sat) 00:31 | URL | LGA774 #-[ 編集]
179099 
>179071
その肝心なHSAも息してないんだよね。
HSA Foundationの活動見てても更新がだいぶ前で止まってるし、肝心なAMDも今はROCmとCDNA系にかかりっきりで。
でも内容はHSAとCDNA2のシステムでは同じようなものだから無駄ではなかった…のだろうか??
2021/02/07(Sun) 21:19 | URL | LGA774 #-[ 編集]
コメントを投稿する(投稿されたコメントは承認後表示されます)