鐵之狂傲

 取回密碼
 註冊
搜尋

切換到指定樓層
1#
  作為GTC 2012大會的一部分,最後的一天還有個採訪活動,接受採訪的是GK110的兩位設計師,Jonah albums是GPU工程部門的高級副總裁,Danskin則是負責GPU架構的副總裁。
07-AlbenDanskin.jpg
GK110設計師Jonah albums(左)和John Danskin(右)

  以下就是Heise網站帶來的報導,問答形式,內容很勁爆,提問的一方沒什麼客套,植入主題,回答的一方“太極推手”防守嚴密,從中能得到多少收穫就看自己的理解了。
Q:GK110性能比GK104強多少?
Albums:我們已經公佈了GK110的規格,但是最終的頻率之類的還沒有定,這是項目開發中很自然的事,問題是功能單元的數量還是記憶體位寬會影響產品的性能?基於這些因素,你們可以期待性能提升50%,而SGEMM之類對計算性能敏感的應用中,性能幾乎與功能單元的數目成正比。(GK110有15組SMX單元,這麼說性能比8組SMX的GK104可以高出近一倍了?)
Q:也是就說,GK110的性能優勢在50-70%左右?
Albums:這是一般的情況,如果是在充分利用了Hyper-Q、Dynamic Parallelism以及雙精度運算的HPC應用中,這個(性能提升)比列還會更高。
Q:Kepler開發了多長時間了?
Albums:這個取決於你問的是誰了。我是在G80架構完成之後開始Kepler項目的,大約是7年前了,直到三年前NVIDIA才開始有大批人手加入這個團隊的。
Q:為什麼GK110架構要等到年底才能發布,比GK104晚了這麼久?
Danskin:這個問題很難回答。GK104功能更少,而且主要針對顯示卡而非計算應用,它必須要及時發布。另一方面,GK110則是一款大核心架構,TSMC在流片和製造過程中要扮演更大的角色。(TSMC又中槍了,不過這麼複雜的晶片確實是個問題)
Albums:GK110這樣龐大的晶片不可能在新架構的同時再使用新工藝,還需要更成熟的28nm工藝。
Q:研發GK110架構最大的挑戰是什麼?
Albums:很明顯,就是新開發的Hyper-Q和Dynamic Parallelism技術
Danskin:由於GPU需要自動刷新執行緒,Dynamic Parallelism技術實際上非常複雜,Hyper-Q對有些人很有意義,更容易實現而且會帶來更好的性能。Dynamic Parallelism可以簡化寫代碼的過程,這在以往是不可能的,對我們而言它是最重要的功能。
Q:NVIDIA增強了GK110的雙精度浮點性能,它是靠幾個單精度核心聯合工作實現的嗎?
Danskin:GK110有獨立的雙精度運算單元。(昨天PCGH的解析中已經明確了這一點。)
Q:這是GK110為什麼占用這麼多核心的原因?
Ablbums:實際上(雙精度單元)占用的並不多。主要還是SMX單元增多帶來的,另一個占面積較大的功能是ECC校驗單元。
Q:GK110的雙精度性能是單晶的1/3,為什麼不是1/2?
Danskin:由於架構不同,1/2的比列很難實現。
Albums:簡單來說那樣做需要更多的資源,我們要重新考慮寄存器之類的設計。
Danskin:還有就是每瓦性能比的問題,我們認為目前的(1/3)比列是合適的。
Q:GK110為什麼使用384bit位寬而非512bit?
Danskin:使用512bit位寬也會導致功耗及其他代價升高,GK110使用384bit位寬則可以在性能和代價中保持平衡。
Q:目前的GK110隻使用了13-14組SMX單元,未來是否會有開啟完整15組SMX單元的產品?
Albums:某種意義上說,很有可能。
Q:GK110的硬體編碼單元與GK104有什麼提升嗎?
Ablums:GK110的硬體編碼單元跟GK104是一樣的。
Q:你們認為未來的GPU開發最困難的挑戰是什麼?
Danskin:最大的挑戰是功耗。回顧一下過往的歷程,我們以及AMD都是一樣的:更高的性能,更高的功耗。現在一切都改變了,功耗是明顯的分界線。另外,如以往走過的相似,先進的製造技術有利於改善(功耗)問題。
Albums:主要挑戰還是每瓦性能比,圖形晶片設計中這倒是個次要因素。
 
轉播0 分享0 收藏0

回覆 使用道具 檢舉

你需要登入後才可以回覆 登入 | 註冊

存檔|手機版|聯絡我們|新聞提供|鐵之狂傲

GMT+8, 25-2-8 04:47 , Processed in 0.020549 second(s), 17 queries , Gzip On.

回頂部