【顯示卡】 GK110設計師專訪，講述70億巨獸背後的故事

[複製連結] 檢視: 495|回覆: 0

ARIESS

名望的勇者

電梯直達

1^#

發表於 12-5-18 14:20:49 |只看該作者 |降序瀏覽大字中字小字正體化简体化

　　作為GTC 2012大會的一部分，最後的一天還有個採訪活動，接受採訪的是GK110的兩位設計師，Jonah albums是GPU工程部門的高級副總裁，Danskin則是負責GPU架構的副總裁。

GK110設計師Jonah albums(左)和John Danskin(右)

　　以下就是Heise網站帶來的報導，問答形式，內容很勁爆，提問的一方沒什麼客套，植入主題，回答的一方“太極推手”防守嚴密，從中能得到多少收穫就看自己的理解了。
Q：GK110性能比GK104強多少？
Albums：我們已經公佈了GK110的規格，但是最終的頻率之類的還沒有定，這是項目開發中很自然的事，問題是功能單元的數量還是記憶體位寬會影響產品的性能？基於這些因素，你們可以期待性能提升50%，而SGEMM之類對計算性能敏感的應用中，性能幾乎與功能單元的數目成正比。(GK110有15組SMX單元，這麼說性能比8組SMX的GK104可以高出近一倍了？)
Q：也是就說，GK110的性能優勢在50-70%左右？
Albums：這是一般的情況，如果是在充分利用了Hyper-Q、Dynamic Parallelism以及雙精度運算的HPC應用中，這個(性能提升)比列還會更高。
Q：Kepler開發了多長時間了？
Albums：這個取決於你問的是誰了。我是在G80架構完成之後開始Kepler項目的，大約是7年前了，直到三年前NVIDIA才開始有大批人手加入這個團隊的。
Q：為什麼GK110架構要等到年底才能發布，比GK104晚了這麼久?
Danskin：這個問題很難回答。GK104功能更少，而且主要針對顯示卡而非計算應用，它必須要及時發布。另一方面，GK110則是一款大核心架構，TSMC在流片和製造過程中要扮演更大的角色。(TSMC又中槍了，不過這麼複雜的晶片確實是個問題)
Albums：GK110這樣龐大的晶片不可能在新架構的同時再使用新工藝，還需要更成熟的28nm工藝。
Q：研發GK110架構最大的挑戰是什麼？
Albums：很明顯，就是新開發的Hyper-Q和Dynamic Parallelism技術。
Danskin：由於GPU需要自動刷新執行緒，Dynamic Parallelism技術實際上非常複雜，Hyper-Q對有些人很有意義，更容易實現而且會帶來更好的性能。Dynamic Parallelism可以簡化寫代碼的過程，這在以往是不可能的，對我們而言它是最重要的功能。
Q：NVIDIA增強了GK110的雙精度浮點性能，它是靠幾個單精度核心聯合工作實現的嗎？
Danskin：GK110有獨立的雙精度運算單元。(昨天PCGH的解析中已經明確了這一點。)
Q：這是GK110為什麼占用這麼多核心的原因？
Ablbums：實際上(雙精度單元)占用的並不多。主要還是SMX單元增多帶來的，另一個占面積較大的功能是ECC校驗單元。
Q：GK110的雙精度性能是單晶的1/3，為什麼不是1/2？
Danskin：由於架構不同，1/2的比列很難實現。
Albums：簡單來說那樣做需要更多的資源，我們要重新考慮寄存器之類的設計。
Danskin：還有就是每瓦性能比的問題，我們認為目前的(1/3)比列是合適的。
Q：GK110為什麼使用384bit位寬而非512bit？
Danskin：使用512bit位寬也會導致功耗及其他代價升高，GK110使用384bit位寬則可以在性能和代價中保持平衡。
Q：目前的GK110隻使用了13-14組SMX單元，未來是否會有開啟完整15組SMX單元的產品？
Albums：某種意義上說，很有可能。
Q：GK110的硬體編碼單元與GK104有什麼提升嗎？
Ablums：GK110的硬體編碼單元跟GK104是一樣的。
Q：你們認為未來的GPU開發最困難的挑戰是什麼？
Danskin：最大的挑戰是功耗。回顧一下過往的歷程，我們以及AMD都是一樣的：更高的性能，更高的功耗。現在一切都改變了，功耗是明顯的分界線。另外，如以往走過的相似，先進的製造技術有利於改善(功耗)問題。
Albums：主要挑戰還是每瓦性能比，圖形晶片設計中這倒是個次要因素。

轉播0 分享0 收藏0

回覆使用道具檢舉

最後更新返回清單

帳號		自動登入	取回密碼
密碼			註冊