開普勒架構是什么意思-費米和開普勒框架
自從NVIDIA在2012年初期發布了28納米制造工藝的全新開普勒架構以后,直到今天2014年9月這個麥克斯韋馬上即將接替開普勒架構的時候。開普勒架構作為一款讓桌面顯卡首次進入高功耗比時代的里程碑架構,已經有接近3年的壽命了,開普勒不僅僅用它驚人的工作效率給玩家帶來了極強的游戲性能,而本身開普勒架構更大的意義在于它一改了原本40納米工藝顯卡的高發熱量形象。首次讓玩家享受到高性能,低功耗,追求最佳游戲體驗。這都是NVIDIA過去無法為玩家帶來的,它也充分印證了NVIDIA在圖形處理器架構上面不斷前進的腳步。
說到了開普勒的芯片的產品部分,必須要提的就那幾個大家基本都知道的芯片型號,其中必然包括GK110,GK104,GK106,GK107這四個熟悉的不能再熟悉的名字了。因為這四個產品是任何一個游戲玩家和專業工作者最為常用的產品,也是因為它們支撐了整個開普勒市場。無論從移動產品還是桌面產品,從低端到高端,GK107支撐了大部分移動產品和低端桌面產品,而GK106在早期主要支撐中低端產品,GK104早期支撐了高端產品,而后期又可以轉型成為移動產品和中端桌面產品,GK110雖然上市非常晚,但卻完整的支撐了旗艦產品的性能。毫不客氣的說,這四個芯片就是開普勒架構的代表。
如果從芯片角度說,我們可以說四個芯片就可以支撐一個市場,但如果從顯卡角度說,這話明顯就說不通了,大家不妨想一想,NVIDIA或許可以靠著4個芯片就可以支撐一個GPU市場。但顯卡的市場可不是區區4個顯卡就可以支撐的起來的。要知道從低端到高端,產品線可以說是豐富又復雜,從低端入門,甜品中端到高端發燒旗艦,如此之多的產品誰也無法分配4個芯片到這么多種類的顯卡上面,此時就有了芯片重復利用這一說法。也就有了芯片“刪減”之戰略,俗話講就是“閹割”二字,當然為了讓文章更加專業一些,筆者這里一定要用“刪減”二字。
由此我們就可以清楚從商家和制造商的產品定位和市場角度著手進行分析,所謂刪減芯片規格的最終目的很明顯是以商業性為目的的市場分配而已,目的就是分配不同規格的某個型號芯片到多個產品來豐富產線。所以這就意味著一個芯片可能會被刪減多次,通常是1-2次刪減。
而刪減芯片規格的目的也并非是為了節約成本或者坑害消費者。這一點很多玩家和DIY愛好者誤解的非常深。實際上為了豐富產品線,拉開多個產品之間性能差距。合理的刪減芯片規模就是最佳方案,同時也是非常節約成本的方案。也正是因為如此的刪減和閹割,很多產品的性價比才會有所提高。玩家才能買到那些稱心如意的產品,要知道通常情況下完整芯片的顯卡售價都不便宜。
既然說到產品線和分配問題,筆者就帶領讀者一同來回顧一下NVIDIA GeForce 600系列以及700系列全部產品。就拿大部分游戲玩家使用的最多的產品而言GeForce GTX660/GTX650Ti/GTX650Ti boost分別采用GK106芯片,而GeForce GTX660Ti/GTX670/GTX680/GTX690/GTX760/GTX770則采用GK104芯片,GeForce GTX780/GTXTITAN/GTX780Ti/GTXTITAN BLACK則采用GK110芯片。
我們不妨列個表明細一下:
GK106:GTX660/GTX650Ti/GTX650Ti boost
GK104:GeForce GTX660Ti/GTX670/GTX680/GTX690/GTX760/GTX770
GK110:GeForce GTX780/GTXTITAN/GTX780Ti/GTXTITAN BLACK
根據上面列表所述,我們大致是可以評估一下NVIDIA的商業策略,而甜品級中低端產品主要是GK106負責,高性能中高端產品主要是GK104負責,發燒級旗艦產品主要是GK110負責。
說到刪減規格部分,通常NVIDIA刪減芯片規格主要可以歸類為兩種“刪減前端性能”和“刪減后端性能”,所謂前端部分主要是顯卡流處理器數量以及紋理單元TMUs數量,主要影響顯卡處理能力和工作效率主要部分,直接影響顯卡能生成多少FPS以及生成FPS的周期和所花時間。通常情況下后端部分代表顯卡的顯存位寬以及光柵單元ROPs數量,主要影響部分高端光線運算以及抗鋸齒柔滑平滑處理等,是主要強化高分辨率游戲并提高細節質量的輔助部分。 (這里特別說明顯存容量嚴格意義上講并非顯卡主要屬性,也并非芯片內部規格。顯存顆粒焊接于PCB,所以不屬于核心部分。)
所以根據以上不同的刪減方式,我們不難看出部分顯卡的顯存位寬從256bit降低到192bit,而ROPs也隨著從24個降低到16個,而另外一部分產品則是刪減了一組或者幾組SMX的流處理器。所以不同顯卡采用了不同的刪減方式,如何刪減取舍是NVIDIA需要衡量的重要部分。一個合理刪減的顯卡通常可以在節約成本降低價格的同時盡量減少性能的損失,而刪減不太合理的產品可能會性能過高,而成本也沒有明顯降低。要么就是性能被縮減的過分了導致價格虛高不合理。
可見合理的刪減一個芯片是多么的重要,不同的刪減方式直接就可以影響一個顯卡的性能!所以有句話講“芯片架構做的好,更要切的好”。
接下來筆者便帶領讀者們一起觀摩并分析一下,NVIDIA是如何刪減這些芯片的。
說到GK104這款開普勒中可說有頂梁柱地位的芯片,游戲玩家和DIY愛好者們不約而同的想到了諸如GeForce GTX680 GeForce GTX770 以及GTX690,甚至是某些移動產品GTX680M以及GTX780M, GTX880M等,這些產品都是完整GK104性能的代表,同時兼備功耗比和超頻能力結合與一身的GK104芯片不僅體積小,成本低,良品率高。既可以高頻率支撐桌面市場,又可以降低頻率進入移動市場,真可以說可進可退,攻守兼備,大丈夫能伸能屈,各種能夠表示高自由度和高靈活性,類似的詞匯你都可以用來形容它,完全不覺得過分。
然而很多人也忽視了GK104最大的優點,那就是它具備不同等級的刪減版本直接讓NVIDIA的中端市場變得充實了,可以說是GK104撐起了NVIDIA的中端產品線,甚至更夸張的說,它也是NVIDIA利潤主要來源之一。這都歸功于GK104自由度高的優勢,可以進行多種不同程度的刪減,從而一個核心同時應用于多個產品,而本身成本低,良品率又占據優勢的GK104輕松可以支撐大半個市場,而即使在今天GK110作為旗艦產品逐漸代替GK104高端產品中的位置,GK104仍舊具備難以撼動的地位。或許它會一直持續到NVIDIA發布GM204后才會真正被徹底代替。
而要說到NVIDIA對于個GK104這個芯片刪減規模中最為經典的兩個例子,絕對是GeForce GTX760與GTX660Ti這兩個不同刪減方案的代表作品。
GeForce GTX660Ti-偏向于后端部分刪減的方案
說到GTX660Ti,相信很多游戲玩家和顯卡發燒友都非常熟悉,因為GTX660Ti幾乎是開普勒架構中爭議最大的產品之一,一度流傳的GTX660Ti僅有192bit對應1500MB顯存的說法直到今天仍舊存在。而這里要分析是作為一個GK104刪減后的經典案例,GTX660Ti是如何刪減規模的呢?
GK104早期的兩款中高端產品
這里我們拿出一個規格對比圖片可以一目了然的看到,GTX660Ti對比GTX670最大的變化在于顯存位寬縮減到了192bit,這樣導致同樣6000MHz顯存頻率下,GTX660Ti的顯存帶寬則遠低于GTX670,而這樣一點肯定會被很多不太懂顯卡的消費者看到,因為更多的不懂顯卡的人喜歡以顯存位寬判斷性能。
而另外一點住的注意的就是:GTX660Ti的流處理器數量和GTX670完全一樣,均為1344個,可見它們的SMX數量是完全相同的,才會有相同的流處理器數量,同時也意味著有相同的紋理單元數量。而且兩款產品的頻率也沒有任何區別。可見同等頻率下,GTX660Ti擁有大約等同于GTX670的核心處理能力,同時對于高特效和抗鋸齒等后期處理部分GTX660Ti則較為虛弱,而面對高分辨率和高特效的游戲,GTX660Ti顯然會和GTX670拉開較大差距。這便是刪減后端部分最明顯的影響。這也就是為什么GTX660Ti在某些低特效壓力較小的單機游戲里面反而表現出僅次于GTX670的成績。主要原因還是因為顯存帶寬以及光柵單元數量不足造成的。其中因為顯存位寬的減少到192bit,光柵單元也從32個降低到了24個。
這或許才是GTX660Ti高分辨率成績較差的主要原因,顯然這和網絡上流傳的GTX660Ti只能利用1500MB顯存的說法不同。影響成績的關鍵還是后端部分。
GeForce GTX760-偏向于前端部分刪減的方案
GK104后期的兩款中高端產品
通過規格列表可以看到,GeForce GTX760同樣也是一款GK104的刪減后的產品,而卻與GTX660Ti呈現了完全不同的特點。顯然GTX760的前端規格部分收到了重創,流處理器從1344個進一步刪減到了1152個,而紋理單元也降低到僅有96個規模了。唯一完好的是保留了幾乎完整的后端部分,與完整的GK104相同的顯存位寬和光柵單元數量。
或許是因為這個原因,GTX760的高分辨率和低分辨率表現幾乎是差不多的,并沒有明顯降低,而GTX760因為默認頻率更高,配備了GPU boost2.0加速機制,也輕松得到了比GTX660Ti更高的性能。這就是同樣一個芯片不同的刪減方案帶來的不同影響。而GTX760很聰明的靠著自己的高頻率彌補了流處理器數量的損失。而后端規格完整讓它不畏懼高特效高分辨率。
經過了對GK104兩種不同方案的剖析,我們可以清楚的了解到,不同的刪減方案將會帶來不同的結果,就如同GTX660Ti和GTX760同時作為GTX670刪減后的方案,但它們卻得到了不同的結果。雖然GTX760也付出了一些頻率代價,但顯然NVIDIA認為有GPU boost2.0情況下這些頻率代價是可以彌補的。這恐怕就是“取舍的藝術吧”?
說到GK106這款這款芯片顯然很多消費者也并不陌生,作為一款主流級的產品定位,GK106幾乎支撐了整個GeForce 600系列的所有中低端產品。也是大部分玩家都經常用的產品范圍。
GK106本身芯片體積較小,僅配備了192bit以及24個ROPs。這樣的規模非常像是GK104刪減之后的規格。從后端部分來看和GTX660Ti非常相似。同時GK106芯片的流處理器僅有960個,這樣數量的流處理器遠要比GK104少太多了。
GK106看上去很像GK104切了一刀的樣子
而可以代表GK106的顯卡當然是GeForce GTX660/GTX650Ti/GTX650Ti boost這三款產品了,顯然GK106在桌面產品中的數量遠不如GK104,而且細心的顯卡愛好者已經不難發現,自從NVIDIA進入GeForce 700系列以后,GK106已經很少在桌面產品中出現了,而NVIDIA似乎直接采用了GK104代替所有的GK106。從此GK106便逐漸悄悄隱退。
而GTX660便是搭載了完整GK106芯片的顯卡代表,GTX650Ti/GTX650Ti boost這兩款產品分別可以代表GK106刪減規格中作為經典的范例。讓我們通過一個圖片就可以較為直觀的對比。
GK106兩種刪減方案規格對比
重重一刀,前后都砍-GeForce GTX650Ti
說到GTX650Ti,對于低端產品較為熟悉的玩家很多都用過這張卡,由于該卡僅有128bit顯存位寬,定位比較低,更多的人不會質疑它的性能,更不會期待它能帶動什么大型游戲。
但它仍舊可以作為一個GK106刪減的最佳代表之一,作為完整版GK106刪減出來的版本,GTX650Ti的性能非常之低,遠要比完整GK106的GTX660低了太多了。是如何原因造成如此大的性能降低呢?
這里我們拿出一個規格對比圖片可以一目了然的看到,GTX650Ti真可以說是重重一刀毫無翻身機會了,不僅前端部分的流處理器和紋理單元大幅縮減,而后端部分的顯存位寬和光柵單元直接讓它從一個中端級別顯卡縮減成了名副其實的低端卡。
這也就是為什么性能如此大落差的原因了,畢竟刪減了這么多地方。性能當然損失很大了。而GTX650Ti不僅僅是128bit和5400MHz導致它的顯存帶寬無法承受高分辨率。而本身16個光柵單元也導致它無法適應抗鋸齒需求。而即使它看起來有不少流處理器和紋理單元,但仍舊改變不了它是個低端卡的事實。
輕輕一刀,砍前不砍后-GeForce GTX650Ti boost
說到GTX650Ti boost這張卡,至今都是NVIDIA GeForce 600系列里面廣受好評的產品之一,原因就是它出奇低的價格和優秀的超頻能力結合一體。而且它幾乎是保留了幾乎完整的后端部分,這讓它高分辨率表現自然和GTX660差距縮小。這款產品自從NVIDIA發布出來對位HD7850之后,一直都非常受到歡迎,其原因自然是因為這張卡的規格刪減非常有機巧。
觀看規格表我們不妨可以看到,GeForce GTX650Ti具備完整GK106的顯存位寬和光柵單元,而其中流處理器和紋理單元進行了小規模刪減,規模持平于GTX650Ti。但兩張卡的性能確實截然不同,差距甚大,GTX650Ti的性能損失巨大,而GTX650Ti boost只有略微小的損失。仍舊可以作為一個中端產品偏低的位置支撐市場,而GTX650Ti顯然性能不足以承受高壓力單機游戲。
通過了GK106兩次輕重不同的刪減,大家不妨看出了一個細節,那就是刪減規模這一刀砍得輕與重,關鍵是看前端和后端的完整度。通常砍了前端而不砍后端的顯卡往往性能保留完整,在高分辨率受到影響也較小。而刪減了顯存位寬和光柵單元的顯卡基本都會直接性能大跌。而且那些刪減了前端規模的顯卡也都有一個小細節,就是提高了核心頻率來彌補流處理器的不足。或許這就是刪減規模的技巧所在。
GK110作為開普勒在2013年發布的新主力產品,也作為性能最高的代表作品,直接撐起了高端旗艦產品的市場。作為一款發燒級旗艦產品定位,GK110搭載的產品均是高價格旗艦產品。盡管上市時期較為晚,而GK110搭載了三款產品 GeForce GTX 780以及GTX780Ti,還有著名的GeForce GTXTITAN系列。其中GTXTITAN BLACK的規格同GTX780Ti完全相同,暫時可以視為一個產品。
GK110本身芯片體積巨大,不僅芯片體積做到了561 mm2。而且配備了完整的15組SMX一共包含240個TMUs以及2880個流處理器。這樣的規格看起來很像是兩個GK104的規模,或許也是正是因此如此一個高頻率的完整GK110性能應該是較為接近兩個GK104芯片的性能,這樣的推理結果直接印證了GTX690和GTX780Ti較小的性能差距。
GK110應該是目前最大的一個芯片
作為旗艦產品的芯片,可以代表GK110的顯卡當然是GeForce GTX780/GTXTitan/GTX780Ti這三款產品了,盡管旗艦產品在市場中的地位面向少數高端群體,這就意味著它們的市場占據比例必須會非常小,而為數不多的GK110仍舊可以靠著三個產品支撐旗艦市場。拋開GTX Titan不屬于GeForce 700系這個特例,GK110仍舊也有一款GTX780作為刪減版本出現。而GTX Titan也是完整GK110的另外一個小幅度刪減版本。
讓我們通過一個圖片就可以較為直觀的對比GK110三張卡的規格。
所有GK110顯卡規格橫向對比
聰明的選擇-砍前不砍后,還要拉高頻率
如果用一句話來形容GK110的刪減方案,那么就是“聰明的選擇”這句話,或許是GK110作為NVIDIA最后一款開普勒芯片發布,而NVIDIA經過了多次刪減GK104和GK106規模已經得到了不少經驗了,所以非常清楚哪些地方影響小,又能拉開性能差距并節約成本。因此,GK110很聰明的全部采用了刪減前端部分的方式。這里通過圖片可以看出,所有GK110顯卡的顯存位寬以及ROPs均為恒定的384bit/48個。而只有流處理器和紋理單元進行了不同程度的刪減。而GTXTITAN雖然看起來規模僅次于GTX780Ti似乎沒有較大幅度刪減,但很不幸的是,GTXTITAN的工作頻率較低,默認頻率只給了很低的數值,這顯然是它成績低的主要原因。畢竟它只有876MHz的加速頻率基礎值。
而GTX780的情況就不同了,GTX780的芯片刪減幅度可以說非常之大,真的可以用“驚天一刀”來形容,但雖然收到了“驚天一刀”的超高傷害,而GTX780反而性能損失看起來并沒有很大,反而價格降低了很多,這一點其實不難理解,因為GTX780GHZ版本的頻率很高,當拉高一定頻率的時候,配合GPU boost 2.0就可以明顯提高顯卡工作頻率。這樣的情況下興許就可以彌補一些流處理器的損失。雖然在同等頻率下必然是流處理器多的一方是勝者,但刪減了規模的一方卻可以很容易降低成本和價位,合理的定位于更低的市場位置。所以GTX780并沒有因為受到驚天一刀而遭受重創,反而提高了核心頻率以后還能維持很高性能。
通過了GK110的兩次刪減,我們也不難發現一個細節,就是NVIDIA這一次聰明狡猾的直接刪減了流處理器數量,甚至完全沒有考慮碰顯存位寬和光柵單元,一方面是因為高端旗艦顯卡必須具備足夠強大的規格承擔高壓力單機游戲。另外一方面就是NVIDIA已經掌握了性能損失較少的刪減技巧了。
經過了筆者總結了GK104 GK106 GK110三款芯片不同程度的刪減方案,同時也拿出了NVIDIA幾乎所有的經典案例匯總。讀者們多少通過這樣的簡單的分析領悟了很多關于芯片規格的重要知識,而芯片中每一個指標都是非常重要的,不管是前端部分還是后端部分,一旦顯卡規格進行刪減,那么勢必會造成巨大性能損失,而如何刪減才能讓損失減少,或者哪種刪減可以更容易彌補性能損失。這才是芯片制造商要考慮的重要問題。
而通過了以上一些真實案例的分析總結,我們不難發現“刪減后端往往要比刪減前端更為致命”,于是很多DIY愛好者也發現了這一點,他們一看到刪減了顯存位寬的顯卡就認為是非常“坑爹”的體現。事實上這種說法也不一定絕對正確,因為刪減前端的損失并不比后端小,只是因為顯卡提高了核心頻率以后多少彌補了一些流處理器數量上的損失。而通過高頻彌補的這種戰術,必須建立在芯片具備一定體質和良品的基礎上,同時還要確保顯卡的PCB和其他元件以及制造工藝上面一同配合才行。
換而言之,NVIDIA今天刪減前端損失較少的刪減方法并非可以隨意效仿的,因為早前沒人預想到新一代顯卡的工作頻率可以超頻的如此之高,更沒有人想到NVIDIA還首次加入了動態GPU boost這種特殊工作機制,畢竟這種機制在GPU上可是第一次采用。而NVIDIA這樣的“原創”戰術也確實讓人不得不佩服。
芯片做得好是不夠的 還要學會如何“切”出藝術
經過了NVIDIA“切”芯片真是案例回顧以及刪減規模的簡單分析以后,縱觀整個NVIDIA 開普勒架構產品線,大部分的產品都是通過這樣的方式進行合理分配的,同樣一個芯片經過了多種不同的刪減處理,完全可以形成新的產品,單獨適應另外一個產品線。而NVIDIA和AMD其實都是用了這樣的方式才滿足了市場需求。對比AMD來說,NVIDIA刪減手段更加自由和藝術化,不僅要砍的狠,還不能致命。驚天一刀砍下去,還能拉高頻率把性能補回來很多。這確實是需要“經驗”。
經過了GTX660Ti與GTX760這兩種GK104不同的刪減方案,最終影響了它們兩個不同的命運,GTX660Ti由于刪減了后端部分性能損失慘重,而高分辨率游戲受到限制。而GTX760雖然流處理器比GTX670還要少,但由于保留了完整的顯存帶寬和光柵單元,配合GPU boost2.0有效的彌補了性能損失。反而成為了一個成功例子。而這樣的例子也被NVIDIA后續產品做了參考。這就是兩種不同角度的刪減帶來不同結局。
而對于GK106的兩種輕重不同刪減方式,我們更是知道了前端與和后端同時刪減的情況下對顯卡的性能損失更大,通常可以直接讓一個中端顯卡變成低端卡。這些性能損失都是建立在流處理器,紋理單元,光柵單元,顯存帶寬這幾個主要指標上面,而GTX650Ti boost是第二個成功的例子,原因是它很聰明的和GTX760一樣緊緊刪減了流處理器和紋理單元,還維持不變的核心頻率。導致幾乎沒有折損太多性能。這就是芯片刪減過程中把握輕重度數的重要性。
而GK110的刪減則是一個充滿經驗和技巧的方案,多次刪減出經驗的NVIDIA對此顯得熟能生巧,一下就找到了完美的比例,雖然GTX780身重致命傷,流處理器一下刪減了500多個,僅有2304個流處理器的GTX780GHZ仍舊可以靠著高頻率反超那些頻率追不上它的對手。這就是所謂的“驚天一刀卻不致命”。
新的芯片更要考慮如何去“切”
經過了筆者全篇文章對NVIDIA刪減規模之藝術進行的剖析,讀者應該對芯片規格刪減技巧多少明白一些門道,相信很多讀者已經了解到刪減芯片規模對于顯卡性能有著重大的影響,GTX760和GTX660Ti告訴我們兩種不同的刪減方式將會造成不同的結果,而GTX650Ti與GTX650Ti boost告訴我們刪減程度的輕重對一個顯卡性能影響是致命的,而GTX780告訴我們合理的刪減規模不僅可以縮減成本,還可以減少性能損失。這幾位顯卡用它們親身經歷告訴我們:合理的刪減芯片規模是多么的重要,學會“切”芯片也是一門藝術。
無論AMD還是NVIDIA都會每代設計幾顆核心,然后通過對每款核心進行規格屏蔽獲得不同型號,這樣做的好處是提升良率、提升型號數量、降低研發周期等。那么NVIDIA在這方面具體是怎么做的呢?看看本文編輯為您做的簡單解析。
林光楠