寻找真相 AMD推土机核心发展规划探密
2012年全面转向BulldozerAMD到2012年的时候,会全面完成由Hound(K10)向「Bulldozer」架构的转移。为此AMD将会推出基于Bulldozer架构的Fusion处理器(APU:Accelerated Processing Unit)。由此,Bulldozer架构推出一年左右就可以实现产品从高端至低端的全面覆盖。
一方面,低端产品将会向「Bobcat」系列过渡。因此2012年时,AMD公司Bulldozer和Bobcat是分别进行发展的。其中Bulldozer将主要面向主流台式PC和低价PC,而低端的产品则交由Bobcat来主攻。在与Intel的竞争中,Bobcat将会占据低功耗产品的大部分份额,而平板电脑等新兴市场当然也是由Bobcat来负责。
在11月9日于美国召开的 2010 Financial Analyst Day大会上,AMD公司正式公布了其2012年的产品路线。而通过这张图,也可以让我们对AMD CPU架构的发展战略有一个了解。
首先AMD将会于2011年推出基于K10架构的APU 「Llano」,此产品的过渡性质是相当清楚的。而在另一方面,在2012年时,Bobcat会继续推出四核心版产品,并且会保持原先的定位不变。
AMD公司在宣布Bulldozer战略的同时,在此次的Analyst Day上,AMD同样也进行了Bulldozer的运行展示。根据AMD的说法,2011年夏天以前,该公司将会上市基于Bulldozer架构的处理器。不过对于Bulldozer,AMD目前仍然还保留着很多秘密。
AMD CPU路线图
公开的Bulldozer核心照片
象征Bulldozer秘密的就是下面这张Bulldozer架构「Orochi」的核心照片。但是内行人可以看出,这张图片是经过加工的,并不是真正的核心照片。如果回看AMD在9月份公布的核心照片,就会发现奇怪的部分。这张照片不要说CPU核心不清楚,就连核心尺寸也没有展示出来。
AMD公开的32nm “Orochi”核心照片
比如上面这张核心照片,一般都会认为CPU核心是上下一共配置了四个核心。Bulldozer架构是2个CPU核心组成一个模块,因此八核心的Orochi就会内置有4个Bulldozer模块。但在照片中,上面2个模块和下面2个模块的缓存大小不同。
上下模块以及缓存,在放大的情况下感觉一样,但是在缩小之后尺寸却又好像变掉了。比如缓存subblock的尺寸上下就存在差异,因此这是一张明显异常的照片。并且在CPU核心部分也由于过于粗糙而无法看清。应该说CPU厂商公布模糊不清的照片也是经常有的,但是这种明显进行过修饰的照片却并不多见,因此想要通过这张照片对Bulldozer进行分析是不会获得什么成果的。按照这张图片来看,唯一可以获得证实的就是基于32nm工艺的8核心Bulldozer处理器,其核心面积要小于45nm 6核心K10处理器。
当然AMD对Bulldozer采取如此的保密手法会让人奇怪,因为同样作为AMD的新款CPU,Bobcat所公布的信息可信度是相当高的。由此可以说,对于AMD而言,Bulldozer的重要性是不言而喻的。
Bulldozer架构探密
Bulldozer架构的一个特征,就是其融合了2个CPU核心的Clustered架构设计。Bulldozer CPU核心能够被所有的单元所共享,同时将对性能影响较大的部分设计成专用单元。比如负责解码指令的front end部分和浮点运算部分为共享部分。
多线程架构比较
Bulldozer架构(推定)
通过下图,让我们再仔细观察一下多线程结构部分。共享的前端部分,一个线程由每个单元执行,线程的转换能够以最小的单位进行。这里并不是以前端实现整体转换,而是各个单元执行其它的线程,包括L1缓存指令也是为前端共享。
在另一方面,浮点(FP)/SIMD(Single Instruction, Multiple Data)单元,会由类似于Hyper-Threading一样的SMT(Simultaneous Multithreading)所控制。内部的单元,可以执行不同的线程指令。而执行单元也变成了2个128-bit SIMD和2个128-bit SIMD的整数运算单元。
Bulldozer模块多线程
由于通过一个模块执行双线程,这样Bulldozer单个整数核心的实际带宽就很小。之前的K10架构单个整数管线能够最大执行6条内部指令,不过对于一个模块融合了2个整数管线的Bulldozer来说,单个整数管线最大只能执行4条指令,因此其性能会与K10的单个整数管线产生明显差别。
偏离计划的Bulldozer APU
AMD的最初计划是通过Bulldozer升级至32nm,而最初的APU也会基于Bulldozer,至少AMD在3年前发布的计划中是这样确定的。准确得说,在2007年7月的Analyst Day上进行的演示就已经确定了这个计划。同时Bulldozer当时也是计划于2009年推出。而低功耗Bobcat架构除了PC市场以外,家电和便携设备也是其发展计划中。
AMD产品路线图向后推迟之后,其结果就是32nm K10核心的推出,即最初面向主流PC推出的APU将会基于K10架构,而Bulldozer也推后至2011年登场。同时原计划也面向家电和便携带设备的SoC(System on a Chip)产品Bobcat目前也只局限于PC市场。因此目前的路线图与其说是慎重计划的结果,而不如说原先的路线已经完全被重新改写了。
目前来看AMD的计划还不稳定。首先就是基于K10架构的Llano寿命周期不长的可能性还是相当高的,因此32nm K10核心只是短期内的解决方案。而Bulldozer核心的APU作为在Llano之后面向主流市场推出的后继产品,其产品定位会很困难。原因就是Bulldozer架构与K10架构差别很大,性能特性也有很大不同。
AMD似乎认为虽然Bulldozer架构单个整数管线变小,但是由于效率和核心频率的提升 ,依然能够获得足够的整数运算性能。正是由于这种情况,作为AMD来说在推出32nm Bulldozer APU之后会很容易实现产品的差异化。而这从AMD 2007年的路线计划中也可以清楚得感受到这种意图。可是同样的32nm APU,现在是由K10架构向Bulldozer进行过渡,用户如果拿K10和Bulldozer进行性能比较,AMD就要为如何为性能的差异进行说明而辛苦了。
AMD架构对比
计划推20核心处理器
Bulldozer的优点就是能够提升单元核心面积的容许量。AMD通过Bulldozer将实现由现在的六核心提升至八核心。这就是分别集成了4个模块的Orochi核心,以及基于Orochi核心的桌面处理器「Zambezi」,服务器处理器「Valencia」和「Interlagos」。
实际上作为最高端的Interlagos,其封装了2个MCM(Multi-Chip Module),核心间通过HyperTransport连接。同时集成有4通道内存控制器,这个构成与当前的Opteron系列产品相同,因此插座也同样获得了继承。
一般认为到2012年时,AMD将会推出32nm Bulldozer架构的「Sepang」和「Terramar」,两款处理器的核心数量分别会达到10个和20个。至于插槽肯定会发生改变,但是具体细节信息目前仍然未知。
通过下面的图可以对此情况进行大体推测,应该说接口变化的可能性是有的。另外顺便介绍一下的就是2012年将会成为DDR4内存的启动年,不过2012年就采用的话会面临较高风险。另外就是,目前负责定制DDR4标准的JEDEC主席就是AMD公司的Joe Macri先生(CTO, Fusion)。
AMD CPU架构路线图(2010年~2012年)
期待AMD的技术更进步,逼着INTEL拿住真本事。。。
页:
[1]