lloovveerr 发表于 2010-11-20 18:56
5000只有只有一组UTDP 6000变成了2组 那只是固定功能流水线 使用的依旧是抢占式分配模式
不只是看流水线 ...
不通过线程执行是不可能的吧.
原子操作将线程内的任务分离成无数块,防止多个SP征用同一地址造成效率低下,
可见它还是基于线程之上,只是为了提高GPC内的线程全局同步的效率.
说明白一点就是提高单个线程的效率,但是线程数比较少,所以不能说它就比AMD的UTDP要强.
况且AMD的SIMD(单指令多数据)也提高了单个线程的效率,只是提高程度不如原子操作来的大而已.
至于Kernel,AMD这方面有CKE(Concurrent Kernels Execution),
不过要实现并发运行需要循环时间,这方面的效率可能要比Fermi差一些.
|