APU

APU

美國AMD公司研發的加速處理器
APU(AcceleratedProcessingUnit)中文名字叫加速處理器,是AMD“融聚未來”理念的産品,它第一次将中央處理器和獨顯核心做在一個晶片上,它同時具有高性能處理器和最新獨立顯卡的處理性能,支持DX11遊戲和最新應用的“加速運算”,大幅提升了電腦運行效率。2011年1月,AMD推出了一款革命性的産品AMDAPU,是AMDFusion技術的首款産品。
  • 公司名稱:
  • 外文名:
  • 所屬行業:
  • 法定代表人:
  • 總部地點:
  • 經營範圍:
  • 公司類型:
  • 公司口号:
  • 年營業額:
  • 員工數:
  • 中文名:加速處理器
  • 英文名:APU
  • 其他外文名:Accelerated Processing Unit
  • 所屬公司:AMD
  • 首次推出:2011年1月
  • 平台:Socket FM2+
  • 系列:A4到A10

簡介

APU中文名字叫加速處理器,是AMD融聚理念的産品,它第一次将處理器和獨顯核心做在一個晶片上,它同時具有高性能處理器和最新獨立顯卡的處理性能,支持DX11遊戲和最新應用的“加速運算”,大幅提升電腦運行效率,實現了CPU與GPU真正的融合。APU性能強悍的秘密在于其革新的核心架構,最新的視頻解碼引擎,超小芯片和超低功耗設計,強悍的顯示性能。

曆史

超微(AMD)在并購ATI以後,随即公布了代号為“AMDFusion”(融聚計劃)。簡要地說,這個項目的目标是在一塊芯片上,集成傳統中央處理器和圖形處理器,并且内置最少16通道、可與外部PCI-E設備鍊接的PCI-E控制器,存儲器控制器等。

而這種設計會将北橋芯片從主闆上移除,集成到中央處理器中,CPU核心還可以将原來依賴CPU核心處理的任務(如浮點運算)交給為運算進行過優化的GPU處理(如處理浮點數運算)。AMD認為這是加速處理單元(APU)的一類,是為AMD加速處理器(AMDAcceleratedProcessingUnits,AMDAPU)。

除了硬件規格的提升,超微也發布了多個AMDCatalyst驅動程序更新,用于提升内置的RadeonHD顯示核心的性能表現。

2013年,超微取消了基于Bobcat2.0架構的FusionAPU,取而代之的是Jaguar架構,核心代号分别為“Kabini”和“Temash”,對應超低功耗設備和平闆設備,芯片采用台積電的28納米制程制造。

2014年的CES展會上AMD正式公布了第四代APU——Kaveri(卡佛裡),同時也是AMD自2011年發布LlanoAPU以來最重要的一次升級,因為KaveriAPU身上有很多第一,比如首次升級28nmSHP工藝,首次使用第三代模塊化Steamroller架構,首次使用GCN架構GPU核心,首次支持HSA異構運算等等。

商标争議

開始“AMDFusion”隻是超微的項目代号,後來成為超微的一個商标,然而這樣卻引起了争議。歐盟商标持有者的BoostUp國際有限公司和ArcticSwitzerlandAG稱它們早在2006年首先使用了“Fusion”作為它們一系列電源供應器的産品商标。

在2013年1月23日,Arctic宣布和AMD達成最終私人協議。為消除争議,在2013年1月31日前,超微産品的制造商(包括搭載AMD處理器的品牌電腦和筆電、以及OEM制品)和代理商被要求立即終止“Fusion”和“AMDFusion”商标的使用。

融合步奏

第一步是物理整合過程(PhysicalIntegration),将CPU和GPU集成在同一塊矽芯片上,并利用高帶寬的内部總線通訊,集成高性能的内存控制器,借助開放的軟件系統促成異構計算。

第二步稱為平台優化(OptimizedPlatforms),CPU和GPU之間互連接口進一步增強,并且統一進行雙向電源管理,GPU也支持高級編程語言,這部分才是最關鍵的。

第三步是架構整合(ArchitecturalIntegration),實現統一的CPU/GPU尋址空間、GPU使用可分頁系統内存、GPU硬件可調度、CPU/GPU/APU内存協同一緻,這已在APU中初步完成。

第四步是架構和系統整合(Architectural&OSIntegration),主要特點包括GPU計算環境切換、GPU圖形優先計算、獨立顯卡的PCI-E協同、任務并行運行實時整合等等,這些需要和微軟、ADOBE等行業軟件巨頭不停的溝通交流。

客制化

2013年5月1日,AMD公布将會提供半客制化APU服務。這些APU專為各間公司的不同要求而定制,種類包括一般的消費級APU到特定用途APU。其中最廣為人知的例子就是PS4和XboxOne所采用的客制化APU。

架構解析

LlanoAPU并沒有使用全新的内核架構,甚至不像BrazosAPU平台那樣至少處理器部分是新的“山貓”(Bobcat)架構,說白了主要就是K10處理器、DX11顯卡(以及北橋芯片)的合體。

LlanoAPU芯片采用GlobalFoundries32nmHKMG工藝制造,又分為兩種版本,其一是完整版本,集成14.5億個晶體管,核心面積228平方毫米,又稱為BigLlano或者Llano1。

其二是精簡版本,集成7.58億個晶體管,核心面積暫時不詳,又稱為SmallLlano或者Llano2。二者都采用了新的microPGA封裝接口SocketFS1,772針無頂蓋,引腳間距1.2192毫米,芯片尺寸35×35=1225平方毫米。

和之前的BrazosAPU類似,LlanoAPU也在單獨一顆矽片上集成了以下衆多模塊:x86處理器核心、二級緩存、DDR3内存控制器、圖形SIMD陣列(也就是GPU)、顯示控制器、UVD解碼引擎、PCI-E控制器。從下邊這兩張圖上你就可以看出各個模塊的分布位置和相對大小。

LlanoAPU内集成了如此衆多的功能模塊,如何确保它們之間的高速互連、以便讓整體随時保持在最佳狀态、避免任何潛在的瓶頸,這無疑是APU設計過程中最關鍵的一點,也是獲得1+1>2效果的基本前提。

AMD在這方面顯然是下足了功夫,比如特意設計了全新的FusionComputeLink(Fusion計算連接)來将北橋模塊、GPU、IO輸入輸出串聯在一起,允許GPU訪問一緻性緩存/内存,同時在GPU和北橋之間還搭建了RadeonMemoryBus(Radeon内存總線),讓沒有獨立顯存的GPU通過高速帶寬去訪問系統内存。

内存支持上,LlanoAPU移動版支持雙通道DDR3SO-DIMM,每通道一條内存條,也就是總共隻能插兩條内存,容量最大32GB。頻率和電壓方面标準版DDR3最高1600MHz,電壓1.5V,低壓版DDR3L最高1333MHz,電壓1.35V,帶寬最高25.6GB/s。

LlanoAPU的桌面版則支持雙通道DDR3DIMM,每通道兩條内存條,總共可以插入四條内存,容量最大64GB,支持1.35VDDR3-1333、1.5VDDR3-1866,帶寬最高29.8GB/s。

LlanoAPU處理器搭配的Hudson系列芯片組同樣是單芯片設計,在移動平台上有A70M、A60M兩款型号,代号分别為Hudson-M3、Hudson-M2,通過UMI總線(PCI-E1.0x4+DP)與處理器互連。和之前用于BrazosAPU平台的Hudson-M1A50M是同門師兄弟。

A70M/A60M芯片組采用65nm工藝制造,605球腳FC,BGA封裝,芯片尺寸23×23=529平方毫米,典型熱設計功耗2.7-4.7W。

兩款芯片組均支持六個SATA6Gbps存儲接口并支持RAID0/1陣列方式,可提供四條PCI-E2.0x1連接通道,集成時鐘發生器、消費級紅外接收器、風扇控制、電壓感應、DAC(支持VGA)等等,主要區别則在于USB接口:A70M原生支持四個USB3.0、十個USB2.0和兩個内部USB1.1,A60M則沒有USB3.0,而是改成了十四個USB2.0。

Kaveri,AMD史上最先進的APU産品,帶來了革命性的架構,啟用了全新的“SteamrollerB”架構,也就是“B類壓路機架構”。它相比同檔次的推土機和打樁機架構,綜合性能提升大約15%~20%。

在CPU前端部分,指令緩存追蹤失敗幾率降低30%、分支預測失敗幾率降低20%,對每個線程增加了25%的數據調度寬度,為每個整數單元配備了獨立的解碼單元。在CPU執行部分,增加了5%~10%的調度效能,主要提升L1一級數據緩存的存儲性能。還引入了動态調整大小的L2緩存,增加了微解碼操作隊列,提升了L1和L2緩存的接口性能。

KaveriAPU的核心改進在于采用了由GCN架構獨立顯卡改進而來的RadeonR7融合顯示核心,其GPU部分從之前的VLIW升級到了GCN架構,規格上,新的KaveriAPU完美支持DirectX11.2、UVD4.2、VCE2.0、DDR3-2133、第三代PCIExpress等一些新技術。

KaveriAPU是目前全球首款能夠支持CPU和GPU統一内存尋址(簡稱hUMA)的處理器,也是AMD未來發展異構系統架構(簡稱為HSA)的核心産品。hUMA設計,使得CPU和GPU能夠使用統一的内存空間。

數據存放于CPU和GPU公共的空間中,可以被CPU和GPU同時調用和讀取,完全沒有任何帶寬和數據存儲上的阻隔,效率相比傳統的CPU+GPU分離式設計有了翻天覆地般的提升,同時為異構計算本身的發展打開了大門。

處理器列表

第一代桌面型APU于2011年秋季推出,采用SocketFM1,包括A4、A6和A8。

第二代桌面型APU于2012年推出,采用SocketFM2,包括A4、A6、A8和A10。

第三代桌面型APU于2013年推出,采用SocketFM2,包括A4到A10。

第四代桌面型APU于2014年推出,采用SocketFM2+,包括A4到A10。

第五代桌面型APU将于2015年上半年推出,采用SocketFM2+,包括A4到A10。

相關詞條

相關搜索

其它詞條