鐵之狂傲
標題:
更小更節能,AMD Jaguar處理器架構一覽
[列印本頁]
作者:
CANCERS
時間:
12-9-5 12:02
標題:
更小更節能,AMD Jaguar處理器架構一覽
AMD CTO Mark Papermaster講解了Steamroller架構之後,Jeff Rupley也公開了“Bobcat”
山貓架構的繼任者Jaguar(美洲豹)
詳情,如果說推土機主攻的還是AMD的主業---傳統處理器,而山貓、美洲豹則是輕量級的隨身市場,但是前途無量。 Jaguar架構用於2013年的低功耗APU產品中,主要是2核的Tamesh以及2-4核的Kabini APU中,他們的GPU也會升級到GCN架構。
12-9-5 12:09 上傳
下載附件 (點選圖片檢視原圖)
(85.04 KB)
Jaguar的架構體系與Bobcat類似,不同於Atom使用順序指令架構(in order),AMD的低功耗產品也堅持使用亂序指令體系(out of order),前者的結構簡單,但是後者的性能更強。
此外,Jaguar也要與時俱進,支援SSE 4.1、SSE 4.2、AVX及AES指令,同時還支援虛擬化功能,不過這一點沒有實際細節。
12-9-5 12:09 上傳
下載附件 (點選圖片檢視原圖)
(81 KB)
Jaguar將使用28nm工藝製造,每個內核的面積只有3.1mm2,而Bobca使用40nm工藝製造,每個內核面積有4.9mm2。
前端設計
12-9-5 12:09 上傳
下載附件 (點選圖片檢視原圖)
(75.96 KB)
前端部分與Bobcat的結構大部分相同,都是2路32KB指令快取,512 4KB頁面,2發射解碼,但是Jaguar做了增強,改進了IC預取器,提升了性能。
12-9-5 12:09 上傳
下載附件 (點選圖片檢視原圖)
(71.18 KB)
整個架構最大的變化是增加了硬體除法器(Hardware divider),這也是Llano所不具備的功能。
12-9-5 12:09 上傳
下載附件 (點選圖片檢視原圖)
(75.81 KB)
12-9-5 12:09 上傳
下載附件 (點選圖片檢視原圖)
(74.74 KB)
浮點單元部分依然是2條執行管線,亂序指令調度,但是原生128bit浮點單元現在可以執行更複雜的操作,並通過加倍dumping支援256bit AVX指令。
另外,L1數據快取還是32KB,但是AMD做了儲存/載入最佳化,現在它也可以通過128bit通道連接浮點單元。
12-9-5 12:09 上傳
下載附件 (點選圖片檢視原圖)
(64.8 KB)
12-9-5 12:09 上傳
下載附件 (點選圖片檢視原圖)
(73.87 KB)
L2快取部分AMD也做了較大調整,這也是與Bobcat架構區別較大的地方。2MB快取被一條L2界面分成4部分512KB的區塊,每部分L2D都是獨占的,這一設計其實跟剛剛介紹過的Steamroller架構的動態L2快取差不多,以1/4隔斷按需分配L2快取,不用的就可以關閉以節省能耗,主要目的就是省電,特別是對Jaguar這樣針對隨身平台設計的處理器來說,節能降耗對提升續航意義重大。
另外,為了節能AMD還為Jaguar的每個內核增加了C6狀態,可以獨立啟用或者關閉。
至於性能提升,AMD稱IPC(每週期指令)性能提升了15%,其中頻率提升貢獻了10%,換句話說架構設計帶來的性能提升微乎其微,Jaguar的目標應該集中在升級製程,降低功耗,提升續航,減少核心面積等方面,反正性能也不是這類處理器的主要出發點。
Jaguar處理器將在明年發布,不過Intel明年也會發布
22nm工藝的新一代Atom處理器Valleyview
,後者在製程上及SOC上很有優勢,二者的遭遇戰又會如何呢?
歡迎光臨 鐵之狂傲 (https://gamez.com.tw/)