APU

APU

美国AMD公司研发的加速处理器
APU(AcceleratedProcessingUnit)中文名字叫加速处理器,是AMD“融聚未来”理念的产品,它第一次将中央处理器和独显核心做在一个晶片上,它同时具有高性能处理器和最新独立显卡的处理性能,支持DX11游戏和最新应用的“加速运算”,大幅提升了电脑运行效率。2011年1月,AMD推出了一款革命性的产品AMDAPU,是AMDFusion技术的首款产品。
  • 公司名称:
  • 外文名:
  • 所属行业:
  • 法定代表人:
  • 总部地点:
  • 经营范围:
  • 公司类型:
  • 公司口号:
  • 年营业额:
  • 员工数:
  • 中文名:加速处理器
  • 英文名:APU
  • 其他外文名:Accelerated Processing Unit
  • 所属公司:AMD
  • 首次推出:2011年1月
  • 平台:Socket FM2+
  • 系列:A4到A10

简介

APU中文名字叫加速处理器,是AMD融聚理念的产品,它第一次将处理器和独显核心做在一个晶片上,它同时具有高性能处理器和最新独立显卡的处理性能,支持DX11游戏和最新应用的“加速运算”,大幅提升电脑运行效率,实现了CPU与GPU真正的融合。APU性能强悍的秘密在于其革新的核心架构,最新的视频解码引擎,超小芯片和超低功耗设计,强悍的显示性能。

历史

超微(AMD)在并购ATI以后,随即公布了代号为“AMDFusion”(融聚计划)。简要地说,这个项目的目标是在一块芯片上,集成传统中央处理器和图形处理器,并且内置最少16通道、可与外部PCI-E设备链接的PCI-E控制器,存储器控制器等。

而这种设计会将北桥芯片从主板上移除,集成到中央处理器中,CPU核心还可以将原来依赖CPU核心处理的任务(如浮点运算)交给为运算进行过优化的GPU处理(如处理浮点数运算)。AMD认为这是加速处理单元(APU)的一类,是为AMD加速处理器(AMDAcceleratedProcessingUnits,AMDAPU)。

除了硬件规格的提升,超微也发布了多个AMDCatalyst驱动程序更新,用于提升内置的RadeonHD显示核心的性能表现。

2013年,超微取消了基于Bobcat2.0架构的FusionAPU,取而代之的是Jaguar架构,核心代号分别为“Kabini”和“Temash”,对应超低功耗设备和平板设备,芯片采用台积电的28纳米制程制造。

2014年的CES展会上AMD正式公布了第四代APU——Kaveri(卡佛里),同时也是AMD自2011年发布LlanoAPU以来最重要的一次升级,因为KaveriAPU身上有很多第一,比如首次升级28nmSHP工艺,首次使用第三代模块化Steamroller架构,首次使用GCN架构GPU核心,首次支持HSA异构运算等等。

商标争议

开始“AMDFusion”只是超微的项目代号,后来成为超微的一个商标,然而这样却引起了争议。欧盟商标持有者的BoostUp国际有限公司和ArcticSwitzerlandAG称它们早在2006年首先使用了“Fusion”作为它们一系列电源供应器的产品商标。

在2013年1月23日,Arctic宣布和AMD达成最终私人协议。为消除争议,在2013年1月31日前,超微产品的制造商(包括搭载AMD处理器的品牌电脑和笔电、以及OEM制品)和代理商被要求立即终止“Fusion”和“AMDFusion”商标的使用。

融合步奏

第一步是物理整合过程(PhysicalIntegration),将CPU和GPU集成在同一块硅芯片上,并利用高带宽的内部总线通讯,集成高性能的内存控制器,借助开放的软件系统促成异构计算。

第二步称为平台优化(OptimizedPlatforms),CPU和GPU之间互连接口进一步增强,并且统一进行双向电源管理,GPU也支持高级编程语言,这部分才是最关键的。

第三步是架构整合(ArchitecturalIntegration),实现统一的CPU/GPU寻址空间、GPU使用可分页系统内存、GPU硬件可调度、CPU/GPU/APU内存协同一致,这已在APU中初步完成。

第四步是架构和系统整合(Architectural&OSIntegration),主要特点包括GPU计算环境切换、GPU图形优先计算、独立显卡的PCI-E协同、任务并行运行实时整合等等,这些需要和微软、ADOBE等行业软件巨头不停的沟通交流。

客制化

2013年5月1日,AMD公布将会提供半客制化APU服务。这些APU专为各间公司的不同要求而定制,种类包括一般的消费级APU到特定用途APU。其中最广为人知的例子就是PS4和XboxOne所采用的客制化APU。

架构解析

LlanoAPU并没有使用全新的内核架构,甚至不像BrazosAPU平台那样至少处理器部分是新的“山猫”(Bobcat)架构,说白了主要就是K10处理器、DX11显卡(以及北桥芯片)的合体。

LlanoAPU芯片采用GlobalFoundries32nmHKMG工艺制造,又分为两种版本,其一是完整版本,集成14.5亿个晶体管,核心面积228平方毫米,又称为BigLlano或者Llano1。

其二是精简版本,集成7.58亿个晶体管,核心面积暂时不详,又称为SmallLlano或者Llano2。二者都采用了新的microPGA封装接口SocketFS1,772针无顶盖,引脚间距1.2192毫米,芯片尺寸35×35=1225平方毫米。

和之前的BrazosAPU类似,LlanoAPU也在单独一颗硅片上集成了以下众多模块:x86处理器核心、二级缓存、DDR3内存控制器、图形SIMD阵列(也就是GPU)、显示控制器、UVD解码引擎、PCI-E控制器。从下边这两张图上你就可以看出各个模块的分布位置和相对大小。

LlanoAPU内集成了如此众多的功能模块,如何确保它们之间的高速互连、以便让整体随时保持在最佳状态、避免任何潜在的瓶颈,这无疑是APU设计过程中最关键的一点,也是获得1+1>2效果的基本前提。

AMD在这方面显然是下足了功夫,比如特意设计了全新的FusionComputeLink(Fusion计算连接)来将北桥模块、GPU、IO输入输出串联在一起,允许GPU访问一致性缓存/内存,同时在GPU和北桥之间还搭建了RadeonMemoryBus(Radeon内存总线),让没有独立显存的GPU通过高速带宽去访问系统内存。

内存支持上,LlanoAPU移动版支持双通道DDR3SO-DIMM,每通道一条内存条,也就是总共只能插两条内存,容量最大32GB。频率和电压方面标准版DDR3最高1600MHz,电压1.5V,低压版DDR3L最高1333MHz,电压1.35V,带宽最高25.6GB/s。

LlanoAPU的桌面版则支持双通道DDR3DIMM,每通道两条内存条,总共可以插入四条内存,容量最大64GB,支持1.35VDDR3-1333、1.5VDDR3-1866,带宽最高29.8GB/s。

LlanoAPU处理器搭配的Hudson系列芯片组同样是单芯片设计,在移动平台上有A70M、A60M两款型号,代号分别为Hudson-M3、Hudson-M2,通过UMI总线(PCI-E1.0x4+DP)与处理器互连。和之前用于BrazosAPU平台的Hudson-M1A50M是同门师兄弟。

A70M/A60M芯片组采用65nm工艺制造,605球脚FC,BGA封装,芯片尺寸23×23=529平方毫米,典型热设计功耗2.7-4.7W。

两款芯片组均支持六个SATA6Gbps存储接口并支持RAID0/1阵列方式,可提供四条PCI-E2.0x1连接通道,集成时钟发生器、消费级红外接收器、风扇控制、电压感应、DAC(支持VGA)等等,主要区别则在于USB接口:A70M原生支持四个USB3.0、十个USB2.0和两个内部USB1.1,A60M则没有USB3.0,而是改成了十四个USB2.0。

Kaveri,AMD史上最先进的APU产品,带来了革命性的架构,启用了全新的“SteamrollerB”架构,也就是“B类压路机架构”。它相比同档次的推土机和打桩机架构,综合性能提升大约15%~20%。

在CPU前端部分,指令缓存追踪失败几率降低30%、分支预测失败几率降低20%,对每个线程增加了25%的数据调度宽度,为每个整数单元配备了独立的解码单元。在CPU执行部分,增加了5%~10%的调度效能,主要提升L1一级数据缓存的存储性能。还引入了动态调整大小的L2缓存,增加了微解码操作队列,提升了L1和L2缓存的接口性能。

KaveriAPU的核心改进在于采用了由GCN架构独立显卡改进而来的RadeonR7融合显示核心,其GPU部分从之前的VLIW升级到了GCN架构,规格上,新的KaveriAPU完美支持DirectX11.2、UVD4.2、VCE2.0、DDR3-2133、第三代PCIExpress等一些新技术。

KaveriAPU是目前全球首款能够支持CPU和GPU统一内存寻址(简称hUMA)的处理器,也是AMD未来发展异构系统架构(简称为HSA)的核心产品。hUMA设计,使得CPU和GPU能够使用统一的内存空间。

数据存放于CPU和GPU公共的空间中,可以被CPU和GPU同时调用和读取,完全没有任何带宽和数据存储上的阻隔,效率相比传统的CPU+GPU分离式设计有了翻天覆地般的提升,同时为异构计算本身的发展打开了大门。

处理器列表

第一代桌面型APU于2011年秋季推出,采用SocketFM1,包括A4、A6和A8。

第二代桌面型APU于2012年推出,采用SocketFM2,包括A4、A6、A8和A10。

第三代桌面型APU于2013年推出,采用SocketFM2,包括A4到A10。

第四代桌面型APU于2014年推出,采用SocketFM2+,包括A4到A10。

第五代桌面型APU将于2015年上半年推出,采用SocketFM2+,包括A4到A10。

相关词条

相关搜索

其它词条