

Intel 與 AMD 在 RSQRTSS 的不同
source link: https://blog.gslin.org/archives/2021/09/13/10321/intel-%e8%88%87-amd-%e5%9c%a8-rsqrtss-%e7%9a%84%e4%b8%8d%e5%90%8c/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

Intel 與 AMD 在 RSQRTSS 的不同
看到「rr Trace Portability: Diverging Behavior of RSQRTSS in AMD vs Intel」這個,作者因為在 rr 上發現 replay 不正確,發現是 SSE 裡面的 RSQRTSS
這個指令在 Intel 與 AMD 平台上會有不同的值出現導致的。
RSQRTSS
是計算平方根倒數,也就是計算 ,另外比較特別的是,這個指令不保證正確性,是允許有誤差產生的。
提到平方根倒數,這個演算法更有名的應該是「反平方根快速演算法」這個用到 0x5f3759df
這個魔術數字的奇技淫巧,不過這不是這次的重點...
作者發現 RSQRTSS
在 Intel 與 AMD 平台的值不一定一樣,像是 256 的平方根導數是 1/16 (0.0625),但兩個平台跑出來不同:
On Intel Skylake I get out = 3d7ff000, float = 0.062485 On AMD Rome I get out = 3d7ff800, float = 0.062492
在這邊的 case 可以看出來 AMD 算的比較正確 (誤差值比較低),但都還是在 spec 允許的誤差範圍。
後來作者還發現有其他不同的指令也有類似的問題,為了解決在 rr 上可以正確 replay 的問題,他生了對應的 mapping table 來解:「Emulating AMD Approximate Arithmetic Instructions On Intel」。
苦啊... 不過這個主題還蠻有趣的。
Related
Mass Effect 的 3D 場景黑塊問題一路追到 Intel/AMD 的 SSE2 指令集...
Mass Effect 是個 2007 在 Xbox 上推出的遊戲,並且在 2008 推出 Windows 版,這個遊戲在 2011 年 AMD 推出的 CPU 上 (Bulldozer),某些場景會產生人物黑塊的 bug,社群有些猜測但一直都沒被證實,作者一路追出不少問題,並且給了一個還算乾淨的 workaround:「Fixing Mass Effect black blobs on modern AMD CPUs」,另外在 Hacker News 上有很精彩的討論:「Fixing Mass Effect black blobs on modern AMD CPUs (cookieplmonster.github.io)」。 這篇主要是看趣味的,裡面的狀況有點複雜。 社群有一些 workaround 可以避開這個問題,作者後來是從關閉 PSGP (Processor Specific Graphics Pipeline) 的方法找問題,然後發現在計算時會產生出…
July 20, 2020In "Computer"
Fast Inverse Square Root 演算法...
中文稱為「平方根倒數速演算法」,英文則是「Fast Inverse Square Root」。 好像是在 Twitter 還是 Facebook 上看到的 (還是是在其他管道?),仔細看中文版維基百科條目,發現中文版的資料相當完整了 (看了一下歷史記錄,是去年 2012 年 6 月的時候從英文版翻出來的)。 當時很有名的 magic hack,比查表法快: 在1990年代初(也即該演算法發明的大概時間),軟體開發時通用的平方根計算方法多是從尋找表中取得近似值,而這段代碼取近似值耗時比之更短,達到精確度要求的速度也比通常使用的浮點除法計演算法快四倍, 然後還比 CPU 指令集快 XD 由於演算法所生成的用於輸入牛頓法的首次近似值已經相當精確,此演算法所得近似值的精度已可接受,而若使用與《雷神之鎚III競技場》同為1999年發行的Pentium III中的SSE指令rsqrtss計算,則計算平方根倒數的收斂速度更慢,精度也更低。 Update:請參考 comment,看起來中文版有誤譯... 我本來以為我之前寫過,找了找沒翻到... 補記錄下來 :p
September 2, 2013In "Computer"
hashcat v3.00
hashcat 是個用暴力法拿來計算各種 reverse hash 的的工具,也就是對於 HASH(key) = value 時,給 value 的值,要求得出 key 的值 (被稱為 Preimage attack)。 雖然是暴力法,但還是花了很多力氣加速,尤其在這個 GPU 已經很常見的年代,這套軟體也支援透過 GPU 加速運算。 先前的版本是 CPU 與 GPU 分開兩個版本可以用 (CPU 版本的叫 hashcat,GPU 版本的叫做 oclHashcat),而 GPU 的版本只支援 nVidia 與 AMD 兩家大廠的顯卡。 而在 v3.00 版,透過 OpenCL 的界面將這些全部都合而為一了:「hashcat v3.00」,所以不只是支援 CPU 與 nVidia + AMD 的 GPU,還包括了:…
July 2, 2016In "Computer"
Leave a Reply Cancel reply
Your email address will not be published. Required fields are marked *
Comment
Name *
Email *
Website
Notify me of follow-up comments by email.
Notify me of new posts by email.
Post navigation
Recommend
-
7
上次错失了移动通讯市场,如今再失去移动PC市场,对intel来说恐怕是难以接受的。
-
12
配图来自Canva可画 疫情对绝大多数个人和组织带来的都是磨难和考验,但对一众科技大厂却不尽然如此。2020年疫情爆发以来,远程办公...
-
6
AMD Hits Intel Below The Belt In The Datacenter Wallet What Intel calls “cloud digestion” as the cause of the massive pullback in spending in its Data Center Group is looking more and more like a case of “Epyc indigestion” for Intel...
-
5
AMD is smashing Intel in retail desktop CPU sales Three out of four CPUs sold in July were from AMD By
-
5
Comparing AMD EPYC Performance with Intel Xeon in GCP Back to the Blog
-
6
芯片战争50年,Intel为什么干不掉AMD?-51CTO.COM 芯片战争50年,Intel为什么干不掉AMD? 作者:码农翻身刘欣 2022-03-16 10:07:35 随着AMD的重新崛起,两个老对手即将开始新的征程。未来会怎么样...
-
8
Intel vPro vs AMD Ryzen PRO: What are the key differences and which one’s better? Picking the right laptop or a desktop PC that can handle your day-to-day workloads isn’t exa...
-
25
AMD Ryzen 5 5600 vs. Intel Core i5-12400F GPU Scaling Benchmark By Steven Walton April 13, 2022
-
7
赶紧自查,AMD和Intel CPU又曝新漏洞-51CTO.COM 赶紧自查,AMD和Intel CPU又曝新漏洞 作者:苏苏 2022-07-15 10:19:40 ...
-
4
AMD市值超越Intel,一个新时代的开端半导体行业观察·2022-08-01 02:48Intel市值被反超看似突然,但是Intel的颓势却是从多年前就埋下了种子。...
About Joyk
Aggregate valuable and interesting links.
Joyk means Joy of geeK