用户
 找回密码
 立即注册
搜索

寻找真相 AMD推土机核心发展规划探密

[复制链接]

87

主题

1294

帖子

3297

积分

游客

积分
3297
发表于 2010-11-29 19:45:54
2012年全面转向Bulldozer

    AMD到2012年的时候,会全面完成由Hound(K10)向「Bulldozer」架构的转移。为此AMD将会推出基于Bulldozer架构的Fusion处理器(APU:Accelerated Processing Unit)。由此,Bulldozer架构推出一年左右就可以实现产品从高端至低端的全面覆盖。

    一方面,低端产品将会向「Bobcat」系列过渡。因此2012年时,AMD公司Bulldozer和Bobcat是分别进行发展的。其中Bulldozer将主要面向主流台式PC和低价PC,而低端的产品则交由Bobcat来主攻。在与Intel的竞争中,Bobcat将会占据低功耗产品的大部分份额,而平板电脑等新兴市场当然也是由Bobcat来负责。

    在11月9日于美国召开的 2010 Financial Analyst Day大会上,AMD公司正式公布了其2012年的产品路线。而通过这张图,也可以让我们对AMD CPU架构的发展战略有一个了解。

    首先AMD将会于2011年推出基于K10架构的APU 「Llano」,此产品的过渡性质是相当清楚的。而在另一方面,在2012年时,Bobcat会继续推出四核心版产品,并且会保持原先的定位不变。

    AMD公司在宣布Bulldozer战略的同时,在此次的Analyst Day上,AMD同样也进行了Bulldozer的运行展示。根据AMD的说法,2011年夏天以前,该公司将会上市基于Bulldozer架构的处理器。不过对于Bulldozer,AMD目前仍然还保留着很多秘密。




AMD CPU路线图


公开的Bulldozer核心照片

    象征Bulldozer秘密的就是下面这张Bulldozer架构「Orochi」的核心照片。但是内行人可以看出,这张图片是经过加工的,并不是真正的核心照片。如果回看AMD在9月份公布的核心照片,就会发现奇怪的部分。这张照片不要说CPU核心不清楚,就连核心尺寸也没有展示出来。




AMD公开的32nm “Orochi”核心照片

    比如上面这张核心照片,一般都会认为CPU核心是上下一共配置了四个核心。Bulldozer架构是2个CPU核心组成一个模块,因此八核心的Orochi就会内置有4个Bulldozer模块。但在照片中,上面2个模块和下面2个模块的缓存大小不同。

    上下模块以及缓存,在放大的情况下感觉一样,但是在缩小之后尺寸却又好像变掉了。比如缓存subblock的尺寸上下就存在差异,因此这是一张明显异常的照片。并且在CPU核心部分也由于过于粗糙而无法看清。应该说CPU厂商公布模糊不清的照片也是经常有的,但是这种明显进行过修饰的照片却并不多见,因此想要通过这张照片对Bulldozer进行分析是不会获得什么成果的。按照这张图片来看,唯一可以获得证实的就是基于32nm工艺的8核心Bulldozer处理器,其核心面积要小于45nm 6核心K10处理器。

    当然AMD对Bulldozer采取如此的保密手法会让人奇怪,因为同样作为AMD的新款CPU,Bobcat所公布的信息可信度是相当高的。由此可以说,对于AMD而言,Bulldozer的重要性是不言而喻的。


Bulldozer架构探密

    Bulldozer架构的一个特征,就是其融合了2个CPU核心的Clustered架构设计。Bulldozer CPU核心能够被所有的单元所共享,同时将对性能影响较大的部分设计成专用单元。比如负责解码指令的front end部分和浮点运算部分为共享部分。




多线程架构比较




Bulldozer架构(推定)

    通过下图,让我们再仔细观察一下多线程结构部分。共享的前端部分,一个线程由每个单元执行,线程的转换能够以最小的单位进行。这里并不是以前端实现整体转换,而是各个单元执行其它的线程,包括L1缓存指令也是为前端共享。

    在另一方面,浮点(FP)/SIMD(Single Instruction, Multiple Data)单元,会由类似于Hyper-Threading一样的SMT(Simultaneous Multithreading)所控制。内部的单元,可以执行不同的线程指令。而执行单元也变成了2个128-bit SIMD和2个128-bit SIMD的整数运算单元。




Bulldozer模块多线程

    由于通过一个模块执行双线程,这样Bulldozer单个整数核心的实际带宽就很小。之前的K10架构单个整数管线能够最大执行6条内部指令,不过对于一个模块融合了2个整数管线的Bulldozer来说,单个整数管线最大只能执行4条指令,因此其性能会与K10的单个整数管线产生明显差别。



偏离计划的Bulldozer APU

    AMD的最初计划是通过Bulldozer升级至32nm,而最初的APU也会基于Bulldozer,至少AMD在3年前发布的计划中是这样确定的。准确得说,在2007年7月的Analyst Day上进行的演示就已经确定了这个计划。同时Bulldozer当时也是计划于2009年推出。而低功耗Bobcat架构除了PC市场以外,家电和便携设备也是其发展计划中。

    AMD产品路线图向后推迟之后,其结果就是32nm K10核心的推出,即最初面向主流PC推出的APU将会基于K10架构,而Bulldozer也推后至2011年登场。同时原计划也面向家电和便携带设备的SoC(System on a Chip)产品Bobcat目前也只局限于PC市场。因此目前的路线图与其说是慎重计划的结果,而不如说原先的路线已经完全被重新改写了。

    目前来看AMD的计划还不稳定。首先就是基于K10架构的Llano寿命周期不长的可能性还是相当高的,因此32nm K10核心只是短期内的解决方案。而Bulldozer核心的APU作为在Llano之后面向主流市场推出的后继产品,其产品定位会很困难。原因就是Bulldozer架构与K10架构差别很大,性能特性也有很大不同。

    AMD似乎认为虽然Bulldozer架构单个整数管线变小,但是由于效率和核心频率的提升 ,依然能够获得足够的整数运算性能。正是由于这种情况,作为AMD来说在推出32nm Bulldozer APU之后会很容易实现产品的差异化。而这从AMD 2007年的路线计划中也可以清楚得感受到这种意图。可是同样的32nm APU,现在是由K10架构向Bulldozer进行过渡,用户如果拿K10和Bulldozer进行性能比较,AMD就要为如何为性能的差异进行说明而辛苦了。




AMD架构对比


计划推20核心处理器

    Bulldozer的优点就是能够提升单元核心面积的容许量。AMD通过Bulldozer将实现由现在的六核心提升至八核心。这就是分别集成了4个模块的Orochi核心,以及基于Orochi核心的桌面处理器「Zambezi」,服务器处理器「Valencia」和「Interlagos」。

    实际上作为最高端的Interlagos,其封装了2个MCM(Multi-Chip Module),核心间通过HyperTransport连接。同时集成有4通道内存控制器,这个构成与当前的Opteron系列产品相同,因此插座也同样获得了继承。

    一般认为到2012年时,AMD将会推出32nm Bulldozer架构的「Sepang」和「Terramar」,两款处理器的核心数量分别会达到10个和20个。至于插槽肯定会发生改变,但是具体细节信息目前仍然未知。

    通过下面的图可以对此情况进行大体推测,应该说接口变化的可能性是有的。另外顺便介绍一下的就是2012年将会成为DDR4内存的启动年,不过2012年就采用的话会面临较高风险。另外就是,目前负责定制DDR4标准的JEDEC主席就是AMD公司的Joe Macri先生(CTO, Fusion)。




AMD CPU架构路线图(2010年~2012年)

使用道具 举报 回复
发表于 2010-11-29 22:11:50
期待AMD的技术更进步,逼着INTEL拿住真本事。。。
使用道具 举报 回复 支持 反对
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则