分類
在進入統一渲染架構時代後,提高Shader運行頻率與效率是NVIDIA主導的設計思路,而AMD則維持龐大的流處理器數量。兩種思路各有優劣。n1、N的優勢和A的劣勢nN卡的GPU中每個流處理器都具有完整的ALU(算術邏輯單元)功能,在發出一條操作指令時每個流處理器都能充分工作。而A卡的GPU中每個流處理器的5個流處理單元都是固定的,不能拆開重組,如果在處理純4D指令的時候,每個流處理器隻能處理一條4D指令,有一個流處理器單元閑置,但卻無法加入其他組合來共同工作。n簡單地說,一個指令任務派發下來的時候,N卡的GPU是需要1個“人”獨立工作即可完成。而A卡的GPU則需要5個“人”。結組工作才能完成ATI的人數雖然多,但這5個“人”中有可能會有4個“人”閑置,因為這4個“人”不具有獨立完整的ALU功能,不能執行函數運算,浮點運算和Multipy運算。n2、N的劣勢和A的優勢nATI的設計也有其顯著的特點——浮點運算能力強大。也就是說如果單純比拼顯示核心在浮點運算上的能力的話,可能ATI則要強一些,在GPGPU(通用圖形處理器)項目應用比較多的科學計算方面,理論上能适應GPU和CPU融合的趨勢。n3、結論n開篇提到的,因為N卡的一個流處理器等于五個A卡的流處理單元,也即HD5970的3200個流處理單元相當于640(3200/5)個流處理器。
詳細定義
AMD-ATI顯卡(以下簡稱A卡)和NVIDIA(以下簡稱N卡)在流處理器數量上的巨大差異給許多讀者造成巨大的困惑。其實,這個情況和不同廠商、相當于CPU的二級緩存數量存在差異情況類似,簡單來說就是“不同架構的GPU,流處理器的作用不盡相同,不能直接比較數量。”深入的解釋請看下文說明。n
AMD馬上就會官方展示下一代顯卡,但各種洩露已經攔不住了。除了疑似性能、照片,我們還了解到了Hawaii GPU的更多規格參數,尤其是最關鍵的流處理器數量,可以說相當意外。早在微軟推出的DirectX 7當中就曾經提出過一個概念——T&L(中文名稱是坐标轉換和光源),它可以看做是流處理器的鼻祖,随着顯卡核心芯片技術的發展,在DirectX 8中。由微軟首次提出了Shader的概念。并且将Shader分為Vertex Shader(頂點着色器,又稱VS單元)和Pixel Shader(像素着色器,又稱PS單元)。