用户
 找回密码
 立即注册
搜索

从HD6900系列看AMD显卡的发展瓶颈

  [复制链接]

1

主题

5

帖子

2523

积分

金牌会员

Rank: 6Rank: 6

积分
2523
发表于 2010-12-24 12:56:49
显卡厂商在规划产品的时候一般都要考虑到两年之后乃至更久的情况,所以HD 6900系列的设计那时候就已经着手了。当时GPGPU通用计算才刚刚起步,NVIDIA开始追逐的那个市场最多价值几百万美元,DX10游戏也还没有成型,但是业内预测,通用计算将在两年后(也就是现在)变得非常重要,DX9也会基本让路给DX10/11,所以就必须提前重新评估VLIW5设计的优劣。
果不其然,GPGPU通用计算已经开始大行其道,Windows 7、DX10/11也正在将DX9挤下历史舞台。根据AMD的内部数据,VLIW5架构的五个处理槽中平均只能用到3.4个,也就是在游戏里会有一个半白白浪费了。显然,DX9下非常理想的VLIW5设计已经过时,它太宽了,必须缩短流处理器单元(SPU),重新设计里边的流处理器(SP)布局。
AMD的显卡核心架构非常依赖指令级并行运算(ILP),也就是将指令放在单独一个线程内(事实上目前AMD显卡从高到底都只有唯一一个单线程)和其他可以并行的线程没有任何关联。VLIW5下最理想的情况就是五个指令能够在每个时钟周期里、每个SPU上一起调度执行,但这种概率非常低。按说平均使用3.4个已经不错了,但换算下来还是不足70%,结果就是从工作负载种提取ILP非常困难,导致最好、最坏应用环境相差太多。
与之形成鲜明对比的是线程级并行计算(TLP),那些没有任何关联的多个线程也可以同时执行。这正是NVIDIA在高端核心上所依赖的设计理念,GF100/GF110都是借助TLP达到高效率的标量架构。
个人感觉,AMD的新品构架像是在老的DX9、DX10下做一些小的修补,这种修补一方面造成用料的浪费和成本的上涨,另一方面在一些大型的图形渲染场景中有着巨大的瓶颈,这种瓶颈导致AMD显卡在低渲染和高渲染场景中表现反差极大。而NVIDIA更像是将之前的构架推倒后重建的新型构架,这种构架代表的未来趋势和高效率。随着DX11的技术运用的越来越多,AMD老构架表现将会下降的幅度将会很厉害,AMD也需要在短期内找到解决方案来挽回将要大面积失去的拥护者。
使用道具 举报 回复
发表于 2010-12-24 16:59:32
呵呵~
使用道具 举报 回复 支持 反对
发表于 2010-12-24 17:55:14
AMD的浪费情况,MC上已经写过了
使用道具 举报 回复 支持 反对
发表于 2010-12-24 21:18:41
呵呵,是啊。其实假如AMD也玩多线程多分配,再加多个曲面细分单元,即便是SIMD也能发挥强性能
使用道具 举报 回复 支持 反对
发表于 2010-12-24 21:44:25
{:3_258:}这个什么统一渲染架构有个特点就是小改进,就能升级……
使用道具 举报 回复 支持 反对
发表于 2010-12-24 22:07:50
色叔看MC?
使用道具 举报 回复 支持 反对
发表于 2010-12-24 23:21:22
貌似电脑报上看到过
使用道具 举报 回复 支持 反对
发表于 2010-12-25 10:03:43
如果A卡只有单线程的话,早就被Branch Prediction造成的延迟弄死了.
A卡的新架构何来浪费之说?北岛砍掉了不必要的复杂运算单元,VLIW5变成VLIW4,成本降低,效率提升.
而且北岛用了两个UTDP,使原来的双组结构更像两个核心,而由于GDS的存在,数据分享的延迟不会增加,指令效率更加高了.
使用道具 举报 回复 支持 反对
发表于 2010-12-31 22:07:44
同意
使用道具 举报 回复 支持 反对
发表于 2011-1-1 17:50:08
lizoyu 发表于 2010-12-25 10:03
如果A卡只有单线程的话,早就被Branch Prediction造成的延迟弄死了.
A卡的新架构何来浪费之说?北岛砍掉了不 ...

说HD6900 还揪着 ,VLIW5 不放
这种文章的回复就两个字  “呵呵~"
使用道具 举报 回复 支持 反对
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则