内存帶寬

内存帶寬

内存控制器的數據傳輸速率
從功能上理解,大家可以将内存看作是内存控制器(一般位于北橋芯片中)與CPU之間的橋梁或與倉庫。顯然,内存的容量決定“倉庫”的大小,而内存的帶寬決定“橋梁”的寬窄,兩者缺一不可,這也就是常常說道的“内存容量”與“内存速度”。除了内存容量與内存速度,延時周期也是決定其性能的關鍵。
    中文名:内存帶寬 外文名: 适用領域: 所屬學科: 重要性:決定系統的表現 含義:内存控制器的數據傳輸速率 提高速度關鍵:縮短整個周期時間

測試分析

對于不同的CPU平台,内存帶寬的重要性不盡相同,而在與内存延時的搭配上,内存帶寬也有很多學問。好了,還是請大家看具體的測評。由于服務器主闆的内存部分電路設計的複雜性,現在業界還沒有一個硬件的内存性能測試工具。浪潮作為服務器産業的領導廠商,一直緻力于内存模塊性能測試方面的研究,在國内率先引入了STREAM内存性能軟件測試方法,從而為全面把握浪潮服務器的産品性能提供了保證,也掌握了通過軟、硬件的優化來提升服務器産品整體性能的技術,從而為用戶帶來更多的實用價值。

1.AMD-nForce2平台的内存帶寬分析

正是nForce2芯片組的出現才讓AthlonXP平台向更高的前端總線發展,而經過一段時間的超頻體驗,不少用戶都會前端總線與内存帶寬之間的關聯有了一定的認識。一般而言,我們的常理告訴我們内存頻率越高越好,因為它直接決定了内存帶寬。然而在nForce2芯片組中則并不是這樣一回事。由于内存控制器的特殊性,它要求DDR内存與CPU同步運行時才能達到最佳性能。下面是nForce2芯片組在内存同步/異步條件下的測試成績:

簡單說來,即CPU設定為166MHz外頻(333MHz前端總線)、DDR運行于DDR333模式時,其性能要比CPU設定為166MHz外頻、DDR運行于DDR400模式的方案更好。所以,無論在何種情況下,我們都建議nForce2用戶将“MemoryFrequency”設定為“Sync(同步)”。事實上,同樣的情況也出現在ALiMAGiK1和SiS745這兩款芯片組上,DDR333在不同步時性能反而不如DDR266同步,好在它們的市場份額并不大。

此外,當我們使用不集成顯卡的SPP北橋時,單通道與雙通道之間的性能差距微乎其微,甚至都可以将微小的差距理解為測試誤差。而在使用集成顯卡的IGP北橋中,雙通道确實展現出很大的優勢。毫無疑問,對于nForce2而言,雙通道盡管能夠提升内存帶寬,但是AthlonXP的前端總線利用不上,單通道DDR已經完全能夠滿足其需求。之所以nForce2能再KT400面前橫行霸道,其關鍵還在于内存控制器的效率,而非雙通道技術。

2.AMD-KT400A平台

VIA的KT400A也是一款主流SocketA芯片組,那麼它究竟是否會出現高内存頻率異步時性能不佳的情況呢?請大家先不要忙着下結論,更應該抛棄以往對KT333/400的陳見,因為KT400A的内存控制器經過了VIA的重新設計。

顯然,KT400A已經能夠利用裡DDR400的高帶寬,即便是在内存異步的情況下。現大家應該很明白在SocketA平台下的内存優化了吧,确實很簡單:nForce2要保持同步,而KT400A/600應該盡可能提高内存頻率。

3.Intel-I845PE平台

盡管單通道的I845PE芯片組已經略顯落伍,但是我們能夠從中分析出單通道情況下,内存帶寬的重要性。事實上,P4處理器很早就達到533MHz前端總線(133MHz外頻),此時隻有使用DDR333才算是同步運行。

很明顯,DDR333的高内存帶寬在此表現出明顯的性能優勢,無論對3D遊戲還是商業應用軟件都大有裨益。事實上,單通道DDR對于Pentium4的Netburst架構而言僅僅是杯水車薪,即便是DDR333也無法滿足Pentium4的需求,因為533MHz前端總線的Pentium4必須擁有4。2GB/s的内存帶寬才能充分别發揮性能,而單通道的DDR333隻具備2。7GB/s,更不用說DDR266了。

4.Intel-I865PE

I865PE芯片組是如今毫無疑問的當紅小生,憑借雙通道DDR技術。它完全解決了内存帶寬的瓶頸,引爆P4處理器的最大動力。在這裡,我們将對比單通道DDR400、雙通道DDR400以及雙通道DDR333之間的性能。當然,此時的P4處理器運行于800MHz前端總線。

雙通道DDR确實是P4處理器的最佳拍檔,在這種環境下,系統的整體性能得到最佳發揮。如果對比一下各種前端總線的P4處理器所需要的帶寬以及各種内存模式能夠提供的帶寬,我們也就不難理解出現這一現象的原因了。

由于雙通道DDR400的帶寬是6.4GB/s,正好滿足800MHz前端總線的P4處理器,因此表現出最佳的組合。

5.Intel-SiS655

Intel芯片組一直對于内存異步相當保守,甚至一直不允許内存頻率高于CPU的外頻。不過SiS可并不這樣認為,其高端的SiS655芯片組同樣支持雙通道DDR400,而且能夠以更加靈活的方式進行異步,這意味着即便我們的P4處理器運行于533MHz前端總線,也可以在SiS655芯片組上使用DDR400。那麼這種異步模式是否有價值呢?測試中,我們選擇了533MHz前端總線的P4處理器,分别配合單通道DDR400、單通道DDR333以及雙通道DDR333。

計算

内存帶寬計算公式:帶寬=内存時鐘頻率×内存總線位數×倍增系數/8。以DDR400内存為例,它的運行頻率為200MHz,數據總線位數為64bit,由于上升沿和下降沿都傳輸數據,因此倍增系數為2,此時帶寬為:200×64×2/8=3.2GB/s(如果是兩條内存組成的雙通道,那帶寬則為6.4GB/s)。很明顯,在現有技術水準下,運行頻率很難成倍提升,此時數據總線位數與倍增系數是技術突破點。

單通道内存節制器一般都是64-bit的,8個二進制位相當于1個字節,換算成字節是64/8=8,再乘以内存的運行頻率,如果是DDR内存就要再乘以2,因為它是以SD内存雙倍的速度傳輸數據的,所以:

DDR266,運行頻率為133MHz,帶寬為133×2×64/8=2.1GBps(PC2100)

DDR333,運行頻率為166MHz,帶寬為166×2×64/8=2.7GBps(PC2700)

DDR400,運行頻率為200MHz,帶寬為200×2×64/8=3.2GBps(PC3200)

所謂雙通道DDR,就是芯片組可以在兩個不同的數據通道上分離尋址、讀取數據。這兩個相互獨立工作的内存通道是依靠于兩個獨立并行工作的、位寬為64-bit的内存節制器下,因此使普通的DDR内存可以到達128-bit的位寬,因此,内存帶寬是單通道的兩倍,因此:

雙通道DDR266的帶寬為133×2×64/8×2=4.2GBps

雙通道DDR333的帶寬為166×2×64/8×2=5.4GBps

雙通道DDR400的帶寬為200×2×64/8×2=6.4GBps

提醒,在顯卡選購時,不要隻看顯存的大小,還要注意顯存位寬這個因素,除非有特殊需求,64bit顯存的顯卡是不建議遊戲玩家購買的。

在了解一些相關的重要知識之後,我們将通過詳細的測試向大家展示内存帶寬的奧秘。對于不同的CPU平台,内存帶寬與内存延時的搭配上,有很多學問。

單說來:1、CPU設定為166MHz外頻(333MHz前端總線)、DDR運行于DDR333模式;2、CPU設定為166MHz外頻、DDR運行于DDR400。1模式的方案更好。所以,無論在何種情況下,我們都建議nForce2用戶将"MemoryFrequency"設定為"Sync(同步)"。事實上,同樣的情況也出現在ALiMAGiK1和SiS745這兩款芯片組上。相反:DDR333在不同步時,性能反而不如DDR266同步,好在它們的市場份額并不大。

矛盾

熟悉内存優化的朋友一定知道内存延時(CL值)的重要性,然而如今大多數DDR内存都難以運行在CL=2的模式下,特别在提高其工作頻率的情況下。很多DDR266内存能夠在266MHz下穩定運行于CL=2,也可以在333MHz下穩定運行于CL=2.5,同樣的情況也出現在DDR333内存中。這就帶給我們這樣一個矛盾,究竟應該提高内存頻率還是縮短内存延時。

?為此,分别選擇了AMD和Intel的平台進行測試。為了凸現出内存帶寬的重要性,我們特意将CL=2時的内存頻率低于CPU外頻,這樣的數據更有評判價值。

從測試結果來看,AthlonXP平台顯然對于内存延時更加敏感。對于前端總線并不高的AthlonXP平台而言,我們認為DDR333+CL2的性能肯定在DDR400+CL2.5之上,因此建議大家在可能的情況下優化CL延時。至于I865PE平台,畢竟Pentium4還是對内存帶寬相當饑渴,此時自然應該盡可能地保證内存頻率,而犧牲内存延時。

比較

通過上面的表格,很明顯,DDR2的工作電壓比DDR低近30%,功耗也能相應下降大約50%了。采用FBGA等CSP方式封裝,減小了模組尺寸,并提高信号完整性,它增加了各模塊之間的空氣流動空間因而提高了熱性能和可靠性。綜合來看,更容易達到最高的頻率。廠商等不及動作太慢的JEDEC,自行推出了DDR1066的産品。這種産品單條即有8.5GB/s的帶寬,相當于雙通道DDR533。

由于核心頻率和外部頻率的倍進關系,而我們又是以外部頻率作為衡量内存時鐘頻率的标準,因此同頻DDR2内存和DDR内存相比,數據傳輸率是一樣的。

僅僅是頻率上的提升,頂多算個“DDR.改”,談不上“DDR2”。DDR2的重大改進之處就在于數據預取從DDR的2bit提升為4bit。所謂2bit預取,可以理解為内存核心向外部I/O緩沖傳遞一次數據,可供外部I/O傳輸兩次的量。而4bit預取,就是内存核心向外部I/O緩沖傳遞一次數據,可供外部I/O傳輸4次的量。

内存芯片的頻率也有芯片核心頻率和外部頻率兩種:在DDR時代,這兩個頻率是相同的;但在DDR2時代,核心頻率就變成了外部頻率的一半。這是為什麼呢?因為DDR的2bit預取,核心一次傳輸的數據可供外部I/O緩沖傳輸2次,而數據以DDR方式傳輸,數據傳輸是CLK時鐘的上下沿觸發,因此外部時鐘頻率與核心頻率保持一緻。而4bit預取就不一樣了,核心一次傳輸數可供外部I/O緩沖傳輸4次,同樣使DDR方式傳輸,外部頻率也要是核心頻率的兩倍才行。

DDR3與DDR2内存帶寬比拼

1、邏輯Bank數量

DDR2SDRAM中有4Bank和8Bank的設計,目的就是為了應對未來大容量芯片的需求。而DDR3很可能将從2Gb容量起步,因此起始的邏輯Bank就是8個,另外還為未來的16個邏輯Bank做好了準備。

2、封裝(Packages)

DDR3由于新增了一些功能,所以在引腳方面會有所增加,8bit芯片采用78球FBGA封裝,16bit芯片采用96球FBGA封裝,而DDR2則有60/68/84球FBGA封裝三種規格。并且DDR3必須是綠色封裝,不能含有任何有害物質。

3、突發長度(BL,BurstLength)

由于DDR3的預取為8bit,所以突發傳輸周期(BL,BurstLength)也固定為8,而對于DDR2和早期的DDR架構的系統,BL=4也是常用的,DDR3為此增加了一個4-bitBurstChop(突發突變)模式,即由一個BL=4的讀取操作加上一個BL=4的寫入操作來合成一個BL=8的數據突發傳輸,屆時可通過A12地址線來控制這一突發模式。而且需要指出的是,任何突發中斷操作都将在DDR3内存中予以禁止,且不予支持,取而代之的是更靈活的突發傳輸控制(如4bit順序突發)。

4、尋址時序(Timing)

就像DDR2從DDR轉變而來後延遲周期數增加一樣,DDR3的CL周期也将比DDR2有所提高。DDR2的CL範圍一般在2至5之間,而DDR3則在5至11之間,且附加延遲(AL)的設計也有所變化。DDR2時AL的範圍是0至4,而DDR3時AL有三種選項,分别是0、CL-1和CL-2。另外,DDR3還新增加了一個時序參數——寫入延遲(CWD),這一參數将根據具體的工作頻率而定。

相關詞條

相關搜索

其它詞條