鐵之狂傲

 取回密碼
 註冊
搜尋

切換到指定樓層
1#
  AMD的推土機架構公佈之時絶對讓人震驚,被譽為自X86體系確立以來架構變化最大的一次,模組化的設計思路很新穎,當時一片叫好之聲。可惜理想很豐滿,現實太骨感,等到真正的推土機上市時,推土機帶給人們的只是失望。   實際性能上推土機不僅比不過Intel Sdandy Bridge架構,甚至不如自家上一代Phenom II,而功耗和發熱又大幅超出,推土機沒有帶給AMD復興的榮耀,反倒成了滑鐵盧。時至今日,AMD官方多次用CPU性能過剩來安慰自己和客戶,這話不無道理,但是AMD在CPU性能上暫時無力跟Intel爭雄了,最簡單的例子就是國內外各大IT媒體的評測平台基本上都是Intel CPU和主機板了。
comic.jpg
圖片來源於Techreport

  即便過去了這麼久,推土機性能不濟一事依然沒有準確合理的解釋,各方總結起來的原因主要有以下幾點:
1.GlobalFoundries工藝不成熟
  雖然FX-8150的預設頻率已經達到3.6GHz,Turbo頻率4.2GHz,但是這仍然低於AMD預期,而且GlobalFoundries並不成熟的32nm SOI工藝使得推土機的功耗和發熱巨大,進一步限制了CPU性能提升。
2.軟體最佳化不到位
  推土機模組化的設計需要系統和軟體的最佳化,否則難以發揮真正的性能。這方面微軟已經推出了任務調度補丁,根據我們的測試,性能確實有一定提升,但是比率非常小,並不足以改變推土機的命運。
3.推土機架構的快取延遲太高
  還是推土機獨特的架構所致,因為它也使用了長管線設計,被稱為AMD版的Pentium 4,延遲周期太高,有人認為這是性能失利的主要原因,但是從媒體測試Trinity APU的表現來看,即便是做了改進的Piledriver(二代推土機架構)的IPC性能也沒有改變多少。
  其他理由還有很多,但是這都不是主要原因。Anandtech網站近日撰文分析了推土機架構兵敗的原因,原文很長,這裡只摘錄結論來看。
  首先他們也認為推土機的高延遲對桌面應用有一定影響,但是這並非導致性能受影響的主要原因,因為Intel首次使用4周期延遲的Nehalem並不比上一代Penryn架構快多少。
cycle.jpg
主流CPU架構的L2分支預測延遲

尋找元兇分支預測誤預測懲罰及指令快取命中率
  在經過對比測試之後,Anandtech認為影響推土機性能更嚴重的是其分支誤預測(Branch Misprediction)帶來的後果以及指令快取命中率(Instruction Cache Hit Rate)問題,這才是主要影響因素。
42775.png
分支預測性能測試

  推土機跟Sady Bridge一樣都是長管線設計,但是後者針對可能的分支誤預測做了補救措施,有專門的µop快取以減少預取和解碼過程中的延遲。性能低於預期的SAP、SQL Server以及更嚴重的SPEC CPU2006測試中都表明了推土機在分支誤預測上有嚴重問題。
  前面的測試證明了AMD推土機工程師在分支預測性能上做的不錯,但是分支誤預測上就不如Intel SNB架構了,即便是Trinity APU使用的Piledriver也沒有明顯改進,性能變化只有1%左右。
  不知AMD是否會在未來的架構設計中也增加µop快取,它可以減少分支誤預測帶來的懲罰,節省能耗,並給解碼單元減少負擔,看起來是很完美的設計。
  另一個問題是L1指令快取似乎並不能適應雙執行緒操作,測試中只要在2-way 64KB L1指令快取中進行雙執行緒操作,命中率就明顯下降,看來推土機的模組化設計中快取的結關聯性還是太低,而Intel的做法是雙執行緒應用中使用8-way關聯性快取。
桌面性能以及伺服器性能的平衡
  文章最後還談到了推土機的設計思路,這是AMD為什麼採用這樣的設計的出發點,因為推土機並非針對桌面應用設計,伺服器負載才是重點。
  桌面應用要求更高的IPC性能,對分支預測敏感,但是對執行緒數量要求比較低,這些恰好不是推土機的強項,AMD只能使用提高CPU頻率以及Turbo頻率的做法來滿足高級玩家的需要,原本的目標是同功耗下頻率至少要高20-30%,但是最終的結果是隻高了10%,而且功耗也大幅飆升。
46035.png
伺服器應用是推土機架構特性發揮比較好的領域

  伺服器應用才是推土機架構最擅長的領域,SPEC CPU2006的測試中推土機表現就很好,這裡對CPU IPC性能不慎敏感,就算CPU的命中失誤比較高,延遲方面所受的影響也比較小,但是它對CPU並行、記憶體占用要求比較高,因此推土機高延遲但是大容量的L2快取在測試中表現就很好。
  無論那種理由或者缺陷導致了推土機桌面性能不濟,目前的現實就是除非架構有較大變化,否則基於推土機架構演變而來的AMD處理器依然難以跟Intel相提並論。在這一代失利中,不知AMD心裡是否真的不在意CPU性能了,因為他們的重心轉向了APU這樣的全功能、低成本處理器。
  從實際應用上看AMD的CPU性能過剩論確實很有道理,隨便一顆3GHz左右的雙核或者四核都可以滿足目前的軟體和遊戲需要,但是仍然不希望也不願看到CPU領域是Intel一家獨大,只是推土機架構的CPU路線圖已經延伸到了2015年,未來兩三年內都不會看到AMD有新架構CPU發布,前景實在難料。
 
轉播0 分享0 收藏0

回覆 使用道具 檢舉

你需要登入後才可以回覆 登入 | 註冊

存檔|手機版|聯絡我們|新聞提供|鐵之狂傲

GMT+8, 25-2-8 18:28 , Processed in 0.018444 second(s), 18 queries , Gzip On.

回頂部