北森瓦版 - Northwood Blog (Author : 北森八雲. Since July 10, 2006.)
NVIDIA is Working on Technology Similar to AMD's Smart Access Memory(techPowerUp!)
Nvidia working on AMD SAM GPU performance boost facsimile(HEXUS)
NVIDIA has its own 'Smart Access Memory' like AMD's new RDNA 2 coming(TweakTown)

AMDのSmart Access MemoryはRyzen 5000 seriesとRadeon RX 6000 seriesとともに導入された新技術である。これまで、CPUが1回でアクセスできるGPUのVRAMはその総量の一部に限られており、システムのボトルネックとなっていた。Smart Access Memoryはこの問題を解決する技術である。PCI-Expressの帯域を利用し、Smart Access Memoryはデータチャネルを広げる、そしてPCI-Express接続の速度を利用して全てのVRAMにアクセスできるようにするものである。

ところが、同様の技術を開発しているのはAMDだけではない。NVIDIAもまたAMDのSmart Access Memoryと同様の技術を開発しているのである。
 
NVIDIAによると「BAR (Base Address Register)を可変とする技術はPCI-Expressのスペックの1つに組み込まれている。NVIDIAのハードウェアも同様の機能をサポートし、将来のソフトウェアアップデートで“Ampere”世代のGPUで有効化できる。現在NVIDIAでは開発を進めており、同様の性能を得られることを確認している」

techPowerUp!はPCI-SIGの2008年1月22日付けの資料を紹介しており、そこに今回の技術に関連する技術についての記載がある。

表題は「Resizable BAR Capability」とあり、BARを可変とできるような技術だろうというのはなんとなくわかり、ハードウェアの要求に応じてソフトウェアが最大のリソース配置を返すことができる(ここのところは非常に怪しい)・・・ような感じである(正直さっぱりわからないので、詳しい方は是非PCI-SIGの元資料を参照して欲しい)

(参考:PCI-SIG ENGINEERING CHANGE NOTICE (PCI-SIG))

Smart Access Memoryはいきなりゴロっとでてきた独自技術ではなく、長い間PCI-SIG等とも連携して出てきたものなのだろう(当該資料にもスポンサーとしてAMDとHPの名前がある)。そしてAMDのSmart Access Memoryは現時点ではRyzen 5000 series CPUとRadeon RX 6000 seriesの組み合わせに限られるが、NVIDIAはより幅広い組み合わせで実現したい模様で、IntelやAMDのCPUでも使用できるようにするようだ。そしてIntelのCPUが現状PCI-Express 3.0にとどまっているため、NVIDIA版Smart Access MemoryはPCI-Epxress 3.0環境下でも使用できる可能性が指摘されている(とはいえNVIDIAの方は現在開発中であり、それが世に出る頃にはIntelも“Rocket Lake-S”や“Ice Lake-SP”が登場してPCI-Express 4.0での利用が前提になる可能性もあるだろう。少なくとも“Ampere”側はPCI-Express 4.0に対応しているので、本領を発揮するのはPCI-Express 4.0環境下だろうか)。


コメント
この記事へのコメント
177106 
ドライバで数回に分けてアクセスしていたのが1アクセスで済むから最大で13%アップする場合があったということか
2020/11/16(Mon) 20:27 | URL | LGA774 #-[ 編集]
177107 
nvでもようやくソフト側で対応いらない機能が出るのか…
レイトレとかRTX IOとか夢はあるけどソフトで対応必要なやつばっかりだったからなぁ…。
2020/11/16(Mon) 20:36 | URL | LGA774 #-[ 編集]
177108 
> ハードウェアの要求の宇治手

ハードウェアの要求に応じて、かな
2020/11/16(Mon) 21:01 | URL | LGA774 #-[ 編集]
177109 
実はSmart Access Memoryと同様の機能(VRAMへのアクセス制限の解除)はLinux上では何年か前からサポートされているのだそうで
とあるサイトでRyzen 5 2600とRX 560をA320マザーに載せたシステム(つまりPCI-Epxress 3.0環境下)でその機能を有効化できたとの記事がありました
2020/11/16(Mon) 22:01 | URL | LGA774 #-[ 編集]
IIntelが既にやってたんですよ実は

まず注意したいのは、Xeon Phiを使うのにあたって、BIOSが「Above 4G Decoding」に対応する必要がある点。これはドライバが4GB以上のメモリ空間にアクセスするために必要なものだ。基本的にシステム対応していても、32bit OS互換性のためにオフにされており、オンにするためにはBIOSでその設定項目が用意されている必要がある。
2020/11/16(Mon) 22:19 | URL | LGA774 #-[ 編集]
177113 
>ハードウェアの要求の宇治手

抹茶?
という冗談はともかく「要求に応じて」ですか
2020/11/16(Mon) 23:06 | URL | LGA774 #-[ 編集]
177114 
NVが後手に回るというか、うちもやってますアピールするのって珍しいな
記事を読んでいるとAMDが名前寄せてる同等技術を後出しで発表していた姿が重なった
2020/11/17(Tue) 01:34 | URL | LGA774 #-[ 編集]
177115 
>実はSmart Access Memoryと同様の機能(VRAMへのアクセス制限の解除)はLinux上では何年か前からサポートされているのだそうで
PCIパススルーとかプリミティブシェーダーとかROCmとか、Linux上ではあたりまえに使えるけどWindowsでは動かない機能が地味に沢山あるよね

>Xeonなら恐らくIntel でも…
そういえばIntel HD GrahicsはPCIパススルーを阻害するんだったね
だからPhyをやめることができなくて長いこと引きずってたのか…
2020/11/17(Tue) 02:10 | URL | LGA774 #-[ 編集]
177116 
グラボからきしめんケーブルが生えてて2スロット占有とかそのうち出るのかね
2020/11/17(Tue) 04:29 | URL | LGA774 #-[ 編集]
177118 
ちょこちょこと、マザボの仕様変更が繰り返されそうだね。
でも、まあ、これで半導体業界は生き残らないと。ね。
2020/11/17(Tue) 07:27 | URL | LGA774 #a2H6GHBU[ 編集]
177119 
「実はAMDで揃えないと使えない専用機能がある」
って、最近の情勢下だと(昔からのAMDユーザーすら)思わずワクワクしてしまうような人も結構いた話だったけど、
良く考えたら、それってやっぱりマーケティングありきのアピールに過ぎないわけで、
「他社では使えない独自機能」って、本質的には「ユーザーにとっていい話」じゃない。

CPUもGPUも所詮はパーツ。他社も含めて相互に使えるような機能の方が、当然利便性も高く、結果として競争も進む。

別にAMDが他社を邪魔してたわけではないだろうし、結局マーケティングフレーズだったんだろうけど、
ユーザーとしては、強い側の立場になってきた時ほど、今後も「AMDはオープン」を貫いて欲しいものです。
2020/11/17(Tue) 08:06 | URL | LGA774 #-[ 編集]
177120 
GPUみたくデバイス側メモリが巨大になるとメモリマップトIOは覗き窓になるから、例えばドライバがGPUメモリにデータ転送する場合、転送先のGPUメモリのアドレス範囲を決定→IOアドレス範囲に対応するGPU物理アドレス範囲を変更→IOアドレスに書き込みって手順を踏む必要があった。IOマップサイズがGPUメモリサイズより大きければGPU側のメモリアドレスが決まればすぐ転送できるし操作も1回で済むから、コマンド数を削減できたりして嬉しいという話。
2020/11/17(Tue) 09:03 | URL | LGA774 #-[ 編集]
177121 
AMDはハードを握っているので、制限つけるならいくらでも付けられますよね。
方法はいくつかあるのでしょうが、かつて専用チップを付けて制限していたg-syncのように囲い込みを行わない保証はないですね。
2020/11/17(Tue) 09:28 | URL | LGA774 #-[ 編集]
177122 
NV「俺もできるんですよ。すぐ対応しますよ! みていてください!」
ユーザー「じゃ。なんでやらなかったの?」
2020/11/17(Tue) 10:08 | URL | LGA774 #-[ 編集]
177137 
実際、ないとは思うけど、それこそドライバレベルで「他社相手には使えなくする」事は簡単にできるわけでな。
Intelにしろ、Nvidiaにしろ、マーケットで有利な側は、そういう禁じ手を大なり小なり使ってきた歴史もある。

今度は、AMDがそれを警戒される側になってきたと思うと感慨深くはあるけど、
それを「営利企業だから当然」だの、「ライバルもやってきたからセーフ」みたいな持ち上げ方をする奴にだけはなりたくないものだ。
2020/11/18(Wed) 07:38 | URL | LGA774 #-[ 編集]
177139 
Above 4G Decoding つまり4GB以内なら1回のアクセスで参照可能な訳で
PCに搭載されたメモリ容量の内、実ゲームでどこまで扱う事か許されるのかを考えたら可変BARが必要となるケースはそう多くはない
…ってことなんだろうね 今までは…

RTコアの代わりにメモリを爆食いする例のレイトレ方式を視野に入れたら一変する
Direct Storageで膨大な仮想メモリ空間を直接参照可能となっても、1回のアクセスは4GBまでという制限があったら何の意味もない
そりゃあNVが後手に回る訳だ

> 参考:PCI-SIG ENGINEERING CHANGE NOTICE (PCI-SIG)
Jan 22, 2008
PCI Express Base version 2.0
ずいぶん放置していたな
2020/11/18(Wed) 08:14 | URL | LGA774 #-[ 編集]
177151 
>ユーザー「じゃ。なんでやらなかったの?」

言うほど効率よくならないというか、効率が良くなる状況が限られてるから。
大抵はメモリアクセスには局所性があるので、一度に4GBしかアクセスできないと言っても困ることは少ない。
GPU自体が連続アドレスへのアクセス以外は極端に効率落ちるので、とびとびにアクセスする需要が無い。

とはいえ、16GBとか24GBなんてGPUも出てきてるので、そろそろ対応しよっかなーと言ったところ?
2020/11/18(Wed) 22:03 | URL | LGA774 #-[ 編集]
177159 
PCIE以降は窓が256MBだろうと透過的に分割してそれ以上扱えるように見えてたから困らなかったとも
それ以前のAGPアパーチャサイズとかはBIOSで制限して256MBとか指定するのでOpenCLで転送すると256MB以上の割り当てで失敗します。
2020/11/19(Thu) 01:04 | URL | LGA774 #-[ 編集]
177162 
>「他社では使えない独自機能」って、本質的には「ユーザーにとっていい話」じゃない。

糞重たいDirectX Raytracingの演算コストをNVだけが棒引き出来るDLSSとか、まさにこれに該当する
五分の条件で競い合ってこそ技術は発展を遂げるものだし、NVにその気が無いのならMSはDXRをさっさと終息させるべき
NVの囲い込みは許されるけどAMDは絶対にゆるさない? おまえは何を言っているんだ
ゲームの爆速起動など副次的な恩恵があるDirect Storageと違ってニートコアなど百害あって一利なし
2020/11/19(Thu) 01:38 | URL | LGA774 #-[ 編集]
177171 
ゲーマーからすれば実ゲームが高クオリティで快適に動くなら囲い込みでも何でもしれくれて結構だよ
DLSSなんて個別に16Kプリレンダして学習プロファイル作るとか超泥臭い手法で実現してんだからさ
AMDももっと金と時間突っ込んで最適化を模索して欲しいもんだわ
2020/11/19(Thu) 06:49 | URL | LGA774 #-[ 編集]
177197 
>NVの囲い込みは許されるけどAMDは絶対にゆるさない? おまえは何を言っているんだ
そんなこと一言も言ってない言ってない
過剰反応しすぎ
2020/11/19(Thu) 13:35 | URL | LGA774 #-[ 編集]
177222 
>AMDももっと金と時間突っ込んで最適化を模索して欲しいもんだわ

今回話題のSAMは「AMDが膨大な金と時間を突っ込んで」GPUベンダーを買収して作り上げたエコシステムでしょ
そんな言い分が通るならx86 CPUを取得するための模索を怠ったnvidiaが悪いという話にしかならないよ
2020/11/20(Fri) 07:29 | URL | LGA774 #-[ 編集]
177228 
SMAってCPU側のキャッシュのコヒーレントを気にしなくていいとか、MMUを通らないでアクセス出来るとか、
そういうCPU側に根差した機能も含まれてるという物じゃなかったっけ?
(もしかしたら通信もPCIeでは無いと言う噂もあるし。)

となれば、nvidiaはそう簡単に相応の機能を乗せる事は難しいのでは?
(実パフォーマンスがRADEON並みなら文句は無いけど)
2020/11/20(Fri) 11:40 | URL | LGA774 #-[ 編集]
177240 
>NVが後手に回るというか、うちもやってますアピールするのって珍しいな
NVはAMDの技術でも「先に言ったもん勝ち」とばかりに自分のもののようにアピールするからねぇ
ロスレスデルタカラー圧縮がNVの技術だと勘違いしてる人は多いけど、あれはAMDがGPU Openに掲載してるものだし
AMDから「そうやって使うものじゃないんだけど(笑)」と突っ込まれたのはImage Sharpeningだっけ?
だからSAMはギリギリまで公表しなかったんだろうね
2020/11/20(Fri) 19:59 | URL | LGA774 #-[ 編集]
コメントを投稿する(投稿されたコメントは承認後表示されます)