流處理器

流處理器

處理多媒體圖形數據流的儀器
流處理器(SP,Stream Processor)是直接将多媒體的圖形數據流映射到流處理器上進行處理的,有可編程和不可編程兩種。流處理器可以更高效的優化Shader引擎,它可以處理流數據,同樣輸出一個流數據,這個流數據可以應用在其它超标量流處理器(Stream Processors,簡稱SPs)當中,流處理器可以成組或者大數量的運行,從而大幅度提升了并行處理能力。每個流處理器當中都有專門高速單元負責解碼和執行流數據。片載緩存是一個典型的采用流處理器的單元,它可以迅速輸入和讀取數據從而完成下一步的渲染。
    中文名:流處理器 外文名:Stream Processors 用途: 包括:可編程和不可編程 優點:大幅度提升了并行處理能力 處理方式:直接将多媒體的圖形數據流映射到流處理器上

起源

流處理器這個名詞第一次出現在人們的視線中還要上溯到2006年12月4日,NVIDIA在當天正式對外發布新一代DX10顯卡8800GTX。在技術參數表裡面,看不到慣常使用的兩個參數:Pixel Pipelines(像素渲染管線)和Vertex Pipelines(頂點着色單元),取而代之的是一個新名詞:streaming processor,中文翻譯過來就是流處理器(也有叫SP單元的,一個意思)它的作用就是處理由CPU傳輸過來的數據,處理後轉化為顯示器可以辨識的數字信号。

原理

1995年公布的名為Cheops中的流處理器,是針對某一個特定的視頻處理功能而設計的一種不可編程的流處理器。但為了得到一定的靈活性,系統中也包含一個通用的可編程處理器。

從1996年到2001年,MIT和Standford針對圖像處理的應用,,研制了名為Imagine的可編程流處理器。Imagine流處理器沒有采用cache,而是采用一個流寄存器文件SRF(Stream Register File),作為流(主)存儲器與處理器寄存器之間的緩沖存儲器,來解決存儲器帶寬問題的。流存儲器與SRF之間的帶寬是2GB/s,SRF與處理器寄存器之間的帶寬是32GB/s,ALU簇(ALU Cluster)内寄存器與ALU之間的帶寬是544GB/s,三種帶寬的比例關系為1:16:272。

抗鋸齒是3D特效中最重要的效果之一,它經過多年的發展,變為一個龐大的家庭。

效果

每個流處理器當中都有專門高速單元負責解碼和執行流數據。片載緩存是一個典型的采用流處理器的單元,它可以迅速輸入和讀取數據從而完成下一步的渲染。

流處理器多少對顯卡性能有決定性作用,可以說高中低端的顯卡除了核心不同外最主要的差别就在于流處理器數量,但是有一點要注意,就是NV和AMD的顯卡流處理器數量不具有可比性,他們兩家的顯卡核心架構不同,不能通過比較流處理器多少來看性能,一般情況下NV的顯卡流處理器數量會明顯少于AMD,要從流處理器多少來看性能,隻能自家的與自家的比,比如3850與3450相比,8600與8800相比。

當然,就像你的CPU主頻高低一樣的道理.一般顯卡流處理的多少都會影響視頻與高清視頻的解碼功能,不過最主要的還是你的顯卡核心.現在最好的核心應該是G106的.不過,光這些還不夠,你的顯卡架構也決定性能.就像專業顯卡和遊戲顯卡的區别一樣,即使東西都完全一樣但不是一個概念.8800GTS還不如一張普通的G92核心的專業顯卡性能強悍。

這是顯卡的一個參數,2006年由NVIDIA公司首先提出的一個概念,也就是以前常說的兩個顯卡參數Pixel Pipelines(像素渲染管線)和Vertex Pipelines(頂點着色單元),簡稱SP,其作用就是處理CPU傳過來的信号,直接變成顯示器可以識别的數字信号。

一般來說,流處理器數量越多,顯卡性能越強勁,比如擁有640個流處理器的顯卡要比擁有80個流處理器的顯卡高出幾個檔次。

作用

去除物體邊緣的鋸齒現象,廣州話稱之為“狗牙”,大家可以想像一下狗牙是如何的凹凸不平。

處理原理

我們在真實世界看到的物體,由無限的像素組成,不會看到有鋸齒現象,而顯示器沒有足夠多的點來表現圖形,點與點之間的不連續就造成了鋸齒。抗鋸齒通過采樣算法,在像素與像素之間進行平均值計算,增加像素的數目,達到像素之間平滑過渡的效果。去掉鋸齒後,還可以模拟高分辨率遊戲的精緻畫面。它是目前最熱門的特效,主要用于1600x1200以下的低分辨率。理論上來說,在17寸顯示器上,1600x1200分辨率已經很難看到鋸齒,無須使用抗鋸齒算法。如此類推,在19寸顯示器上,必須使用1920x1080分辨率,總之,越大的顯示器,分辨率越高,才越不會看到抗鋸齒1920x1200。由于RAMDAC(Random Access Memory Digital to Analog Converter,随機存儲器數/模轉換器)頻率和顯示器制造技術的限制,我們不可能永無止境地提升顯示器和顯卡的分辨率,抗鋸齒技術變得很有必要了。

最早期的全屏抗鋸齒,方法簡單直接。首先,圖像創建到一個分離的緩沖區,緩沖區圖像分辨率高于屏幕分辨率,假設是2x1(或2x),那麼緩沖區場景的水平尺寸比屏幕分辨率高兩倍,若是2x2(或4x)抗鋸齒,緩沖區圖像的水平和垂直均比顯示圖像大兩倍。像素計算加倍之後,選取2個或4個鄰近像素,此過程稱為采樣。把這些采樣混合起來後,生成的最終像素,擁有鄰近像素的特征,那麼像素與像素之間的過渡色彩,就變得更為近似,整個圖像的色彩過渡趨于平滑。再把最終像素輸出到幀緩沖,作為一幅圖像存儲起來,然後發到顯示器,顯示出一幀畫面。每幀都進行抗鋸齒處理,遊戲過程中的所有畫面都變得帶有抗鋸齒效果了。

遊戲卡曼奇四中采用的4X抗鋸齒算法,Commanche 4 4xs。

超級采樣效果很好,但效率極低,嚴重影響顯卡性能。新的4x抗鋸齒方法,隻把抗鋸齒應用于物體邊緣,避免占用過大的緩沖區。工作過程比超級采樣稍為複雜,幾何引擎生成多邊形後,光栅單元會進行描色工作,同時檢查當前的紋理,看看它是否需要用2x2采樣的方式填充到多邊形邊緣。如果不是,GPU隻計算一種色彩,在中間插入紋理像素,然後用單色填充這個塊。這些就是非邊緣像素,無須進行抗鋸齒處理。

上一篇:開博爾f4

下一篇:9500GT

相關詞條

相關搜索

其它詞條