用户
登录
注册
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
科技快讯
评测体验
专题
活动
分享
设为首页
收藏本站
搜索
搜索
设为首页
收藏本站
开启辅助访问
切换到窄版
请
登录
后使用快捷导航
没有帐号?
立即注册
本版
文章
帖子
用户
道具
勋章
任务
设置
我的收藏
退出
腾讯QQ
微信登录
发布分享
查看:
7672
|
回复:
4
玩家社区
›
讨论区
›
查看内容
AMD八核“推土机”处理器设计特点探秘
[复制链接]
slan7777
87
主题
1294
帖子
3297
积分
游客
积分
3297
发消息
slan7777
当前离线
积分
3297
slan7777
游客
7672
4
|
只看该作者
|
倒序浏览
|
阅读模式
楼主
电梯直达
发表于 2011-3-3 16:58:44
八核心处理器竞争开始
-
AMD计划在今年年中的时候正式推出新的处理器架构「Bulldozer」("推土机"),实际的芯片设计目前已经很清楚了。在上周于美国圣弗兰西斯科召开的「ISSCC(IEEE International Solid-State Circuits Conference)」大会上,AMD宣布了其CPU内核心组件的Bulldozer Module的概况。
每个Bulldozer Module内置有2个CPU核心,基于的是32nm工艺。同时在ISSCC上,我们还得知每个Bulldozer Module将会集成2M L2缓存,核心面积为30.9平方毫米。AMD计划在今年年中面向高端桌面及服务器市场推出内置4个Bulldozer Module,核心数量总计8个的CPU核心「Orochi」。
Bulldozer的组件
Bulldozer的组件和单元
Bulldozer核心
Intel同样也计划在今年下半年推出基于Sandy Bridge架构的8核心处理器,包括桌面和移动版产品。这次Intel和AMD在高端桌面处理器市场均没有推出异构(Heterogeneous:异种混合)处理器(CPU+GPU),而是继续走同构(Homogeneous)CPU路线,两家公司所做的都是继续增加处理器的核心数量。
不过虽然都叫八核心处理器,AMD的Bulldozer系列和Intel的Sandy Bridge系列还是有几处较大的差异,其象征就是核心尺寸。如果通过Bulldozer Module倒过来推算的话,基于Bulldozer架构的Orochi处理器的核心面积大约为300平方毫米,而AMD当前的六核心处理器「Istanbul/Thuban」的核心面积为346平方毫米,因此在生产成本方面,Bulldozer架构的八核心处理器要低于六核心处理器,而这也表示Bulldozer Module的尺寸会更小。
Bulldozer与Sandy Bridge 八核心对比
CPU路线图
如果拿Intel的八核心Sandy Bridge处理器与Bulldozer相比,差异就更明显了。此次在ISSCC上Intel也公开了八核心Sandy Bridge的概要。Intel表示将会面向高端桌端高面及服务器市场推出Sandy Bridge-EN,Sandy Bridge-EP和EX系列处理器。这些全都是八核心产品。不过由于PCI Express 3.0推出变更的原因,产品推出计划出现了一定延迟。
处理器架构差异分析
-
此次在ISSCC上发布的八核心Sandy Bridge处理器核心的面积约400平方毫米,比AMD的八核心Orochi大了约30%。由于高端处理器往往都伴随着高价格,因此核心尺寸上的成本可以很容易消化掉。同时Intel架构可以通过SMT实现16线程,因此在多线程服务器应用领域有其优点。因此在这里核心尺寸的差别并不是关键,而在于两个架构之间的差异。
Bulldozer和Sandy Bridge的差异除了CPU核心尺寸以外,Sandy Bridge 八核心的DRAM通道数量更多,PCI Express lane数量也比Orochi多。如果粗略得说,Sandy Bridge单个CPU核心的尺寸非常靠近1个Bulldozer Module的尺寸。相比而言,八核心Sandy Bridge要大一些。
当然大也有大的理由,Sandy Bridge核心可以实现2线程SMT(Simultaneous Multithreading)的Hyper-Threading。并且每个核心均支持AVX,可实现256-bit SIMD(Single Instruction, Multiple Data)等。
Bulldozer架构
从CPU资源的分区来看的话理解起来会更容易一些。当前CPU设计的一个关注点就是多线程性能,以及如何提升每个核心的多线程性能。目前在X86处理器设计上,主要采用3种方法。
多线程对比
Bulldozer架构线程
如果想要提升CMP单线程的性能,就需要更多的资源;相对的SMT多线程化的资源则最小。而Bulldozer则同时具备了CMP和SMT的优点,能够有效率得增加实际的线程数量。由于可以像SMT相同的实现资源竞争,因此其预期的性能下降也会少很多。对此AMD表示,采用簇架构可以增加50%的CPU核心资源,容许量会提升80%。因此估计AMD 内置4个Bulldozer Module的8核心Orochi处理器可以获得出色的性能。
因此Bulldozer的优点就是能够有效得增加CPU核心数量。而Orochi核心也确实表现出了这一优点。
Bulldozer的优点
实际上如果拿Sandy Bridge 8核心与Orochi相比的话,Sandy Bridge核心面积使用效率会更出色。比如它连接核心的环形总线与缓存设置在了上部,因此不太占面积。而Orochi则占据了中间位置,从总体来看,其核心的CPU核心面积比率要比Sandy Bridge大。
K10与Bulldozer Module核心比较
-
Bulldozer Module在设计上的变化很大,与AMD以前的K10核心有很大的不同,比较Bulldozer Module和K10核心就可以看到明显差异。而AMD低成本低功耗处理器架构「Bobcat」的核心布置也有很大不同。
Bulldozer与Llano/Bobcat对比
在Bulldozer Module的布置上,最突出的就是前端的大型化。与Llano的K10核心相比的话,负责指令fetch&decoding和分支预测的前端均明显大型化。可以看到Bulldozer架构中,2个核心共用一个前端。
Bulldozer与Llano对比
●L1缓存及整数核心差异
Bulldozer Module前端配备了2个整数核心,因此融合了2个核心的Bulldozer Module实际上是指拥有2个整数运算核心,这个由Bulldozer Module的布局来看的话,就可以看得很清楚了。
可以看到整数核心,整数执行块 (Integer Execution),载入/存储模块以及L1缓存。从面积上来说,K10核心面积更大,不过大半都是L1缓存的差异。K10上L1缓存容量为64KB,但是Bulldozer Module每个核心减少至16KB,因此核心面积也就显得更紧凑了。
整数运算模块的尺寸上,Bulldozer Module与K10差别不大,仅仅只是Bulldozer 载入/存储模块稍大一些。说到原因主要是由于Bulldozer整数核心的执行管线有2个,算上载入/存储模块就共计4个。而K10整数核心的执行管线是3个,载入/存储模块3个,总计6个。不过实际上Bulldozer的整数运算管线完全进行了重新设计,因此执行效率是不同的。
AMD架构对比
Bulldozer的整数核心
位于2个整数核心下面的就是浮点(FP)单元。以前K10拥有1个128-bit乘法单元累加单元以及其他处理单元。Bulldozer的128-bit累加单元是1个,其容许量提升了2倍,但是面积却没有因此增加2倍。
Bulldozer的浮点单元
位于这些单元的右面,边上就是L2 高速缓存单元(CU)。L2 高速缓存为2MB 6T SRAM。
Bulldozer节电技术分析
-
Bulldozer Module周围可以看到被细线包围。这个就是控制组件供电的「VSS power gating (CC6)」。可以根据实际情况完全终止对待机状态处理器核心的供电,同时也可以减少约95%的漏电。Bulldozer可以实现对融合了2个CPU核心的组件以及L2高速缓存进行节能控制,这也使得AMD向Bulldozer进入移动市场的热情相当高。
Bulldozer的功耗
Bulldozer的省电性主要通过三种方式实现。一个就是生产工艺,AMD处理器从32nm工艺开始使用的是HKMG(High-K/Metal Gate)技术。而由于使用了High-k材料,可以减少门的电子泄漏。Intel自45nm时代就开始使用HKMG技术,而为AMD代工的GLOBALFOUNDRIES公司从32nm工艺开始也使用了此项技术。因此Bulldozer和Llano等AMD的32nm CPU通过生产工艺就可以实现更好的漏电控制。
另外就是AMD Bulldozer使用了更多漏电较少的晶体管。到目前为止,AMD在CPU中使用的是不同电压的晶体管,如果想要减少漏电,那么就应该使用高Vt(HVt)晶体管。不过Bulldozer将HVt晶体管的比率下降了,并大量使用了长通道晶体管(LC-RVt)。据说这样可以实现更低的核心电压。此次长通道LC-RVt占据了Bulldozer Module内核心部分晶体管的53%。 另外就是Bulldozer对电路设计以及架构级节电特别重视。
Bulldozer组件的频率活动
硬派观点:
AMD的8核心“推土机”,实际上定位并不与intel的8核心产品等同。从设计特点看,它是通过每个Module内置两个整数核心,这样集成4个Module来达到8个核心的,但浮点部分每个Module仍为1个。因此从传统意义讲,它还并非完整的8核心产品,其核心面积也远小于intel的8核心产品。也许我们更愿意叫它“4模块”处理器,对手也应该是intel的4核心产品或者6核心产品。
收藏
0
使用道具
举报
回复
乐叔
当前离线
积分
15322
乐叔
信息监察员
|
只看该作者
沙发
发表于 2011-3-3 17:34:26
继续纸面文章。。。
使用道具
举报
回复
支持
反对
风谷希雨
当前离线
积分
6417
风谷希雨
论坛元老
|
只看该作者
板凳
发表于 2011-3-3 18:34:29
围观等待中~:a113::a117:
使用道具
举报
回复
支持
反对
东东的宝贝
当前离线
积分
1886
东东的宝贝
高级会员
|
只看该作者
地板
发表于 2011-3-3 19:16:11
偶也围观一下。
使用道具
举报
回复
支持
反对
wlrwyk
当前离线
积分
14264
wlrwyk
版主
|
只看该作者
5
#
发表于 2011-3-5 15:43:38
和上一代产品上看还是有些改进的 就是看性能处于Intel的哪一个级别了
使用道具
举报
回复
支持
反对
返回列表
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页