鐵之狂傲

 取回密碼
 註冊
搜尋

切換到指定樓層
1#
  NVIDIA昨天公佈了GK110架構的Tesla K20加速卡,而且給出了晶圓結構圖,部分規格如記憶體位寬也得以確認,不過未知的東西依然很多,比如核心頻率、TDP功耗、性能等等。   NV給出的圖不太容易看出GK110架構的實際配備,Beyond3D論壇有人作出了配以文字說明的分析圖,如下圖所示:

  GK110有15組SMX單元,每組SMX單元還是維持了GK104的192個CUDA核心,16個紋理單元,理論上有2880個CUDA核心,240個紋理單元,實際啟用的可能是14組SMX,總計2688個CUDA核心,224個紋理單元,ROP單元為48個。
  不過Guru3D稱新的消息顯示GK110實際上是16組SMX單元,CUDA核心總數是3072個,如果屏蔽一組的話也有2880個CUDA核心,240個紋理單元,只是guru3D並沒有給出更詳細的說明。
  記憶體位寬已經確認為384bit,不過頻率未知,另外記憶體容量也沒有公佈,不過黃仁勛在演講中稱記憶體容量配備取決於DRAM業界,6GB、12GB甚至24GB都是有可能的。
  對比一下,上一代的Tesla M2090配備的是6GB記憶體,Tesla K10配備的則是8GB記憶體,支援GPU虛擬化的NVIDIA顯示卡搭配的則是16GB記憶體,但是規格只是DDR3。如此一來,GK110搭配的記憶體容量不可能比上一代的6GB還低,12GB是最可能的配備,24GB容量也有可能,不過黃仁勛也說了實際容量要依賴DRAM產業界,意味着要看DRAM廠商什麼時候能推出單顆容量更高的記憶體顆粒,目前主流的是2Gb(512MB),24GB需要48顆,現在顯然沒空間佈置這麼多記憶體。
  以上是基於Tesla加速卡考慮的,如果是GK110顯示卡,最可能的記憶體容量應該是3GB,比GTX 580高一倍,比GTX 680高50%,廠商則會有6GB版非公版顯示卡推出。
  核心頻率也是未知數,3DCenter認為在800MHz左右,PCGH認為有880MHz,並且DEGMM效率高達80-85%,與Fermi架構約50%的效率高得多。以此估算GK110架構的雙精度浮點效效能為:14SMX*192SP*2FLOPS*0.85*880MHz/4=1000GFLOPS,而上一代最強的計算卡M2090最高上665GFLOPS,以DEGMM計則為332GFLOPS,GK110恰好是其三倍左右。
k20.jpg
NVIDIA公佈的K10浮點效能只有0.19TFLOPS,K20未知

  其他方面,GK110加速卡的TDP功耗是300W,使用6pin+8pin介面,預計GK110顯示卡的TDP功耗也是如此。
 
轉播0 分享0 收藏0

回覆 使用道具 檢舉

你需要登入後才可以回覆 登入 | 註冊

存檔|手機版|聯絡我們|新聞提供|鐵之狂傲

GMT+8, 25-2-1 05:04 , Processed in 0.016519 second(s), 17 queries , Gzip On.

回頂部