三周前,AMD首次公开了下一代微处理器架构“推土机”(Bulldozer)的架构细节,提出新观念的同时也留下了个问题:以后的处理器核心数量该怎么计算?
Intel Nehalem架构支持单核心双线程,而AMD推土机架构则颇有点儿反其道而行之的意思,将每两个核心捆绑在一块儿,称之为一个“推土机模块”(Bulldozer Module),让其中着两个核心既有各自独立的执行管线、整数调度器和一级缓存,也有共享的预取和解码单元、浮点调度器(和两个128-bit FMAC乘法累加单元)、二级缓存。
Intel在Core/Nehalem微架构中使用一个统一调度器处理所有指令,不管是整数的还是浮点的,而AMD推土机架构将它们独立开来。AMD表示,每个推土机模块都有一个浮点调度器,辅以两个128-bit FMAC,而分配给核心的每个线程都可以使用任意一个FMAC单元;如果一个线程是纯整数的,另一个就可以将所有浮点执行资源据为己有。
另外AMD相信,常规服务器工作负载量中有80%都是纯整数操作,所以才给每个推土机模块配备了两个整数调度器,每个核心一个。
那么在AMD路线图上的新架构四核心处理器指的是四个这样的模块呢,还是四个计算核心呢?
AMD对此给出的回复是:“将每个拥有双整数核心的推土机模块视为一个独立的单元,就对了。”显然,AMD在这里刻意回避了单纯的核心数量问题,更强调两两组成的有机整体,所以在面对推土机架构处理器的时候我们可以说它是四核心、八核心的,也可以说是双模块、四模块的。或许,以后不会再有奇数核心了,因为推土机的每个模块都是整体的,看起来不能单独屏蔽其中一个核心。
双模块四核心推土机处理器示意图(所有核心共享三级缓存和北桥)
四模块八核心示意图 Intel的超线程技术让处理器核心面积增加了不到5%,可带来最多30%的性能提升,其中浮点7%、整数13%,当然实际应用中差异很大。
AMD推土机模块使用两个整数核心增加的核心面积则有50%左右,但AMD表示这在线程代码上获得的性能提升最多能有80%。当然,不要指望新架构就能带来翻天覆地的变化。根据路线图,“赞比西河”(Zambezi)会有四核心和八核心版本(双模块和四模块),其中四核心的整数性能大约比频率类似的Phenom II X4高出10-35%,八核心的将成为一个线程怪兽。
顺便再说说CPU/GPU合二为一的APU。首款产品代号“Llano”,其中CPU部分源于现在的K10 Phenom II,只不过会改用新工艺(32nm),GPU部分则可能来自DX11 Evergreen,当然也是同样的新工艺。
Llano核心示意图 当然,APU并不仅仅是简单滴集成GPU,否则也不会用这么久。按照规划,再过三到五年,AMD就会把CPU和GPU的执行单元完全做到一起,其中绝大部分浮点操作都脱离CPU而转入擅长此道的GPU部分,CPU和GPU的概念也会模糊起来。
K8架构普及了64位计算和集成内存控制器,K10架构首次引入了共享三级缓存和专用二级缓存,模块化的推土机和融合化的APU能否再次引领新潮流呢? |