作为外行人说说见解。
CU单元是AMD显卡的基础运算单位,上图是GCN架构和RDNA架构在CU层面的示意图。
GCN的CU是4SIMD阵列,这个架构在处理【1周期4指令】类型的运算时是最高效的,而对于游戏指令来说,【1周期4指令】是少数状态,GCN架构跑游戏时,总会有SIMD阵列闲置,效率较低。
游戏开发者给GCN架构做优化,大多数时候都是想方设法凑4指令输入,游戏适配和驱动优化都不好做。而科学运算很多情况都是4X16矩阵,完美匹配4SIMD阵列,这也是大家常说的GCN架构挖矿牛逼计算牛逼就是游戏不行的重要原因。
而RDNA架构做的一大改动就是CU单元变成了2个增强型SIMD阵列,这样就比较容易匹配游戏指令的常态了,9.7T浮点的5700XT游戏性能几乎追上14T浮点的RADEON7,很大程度就源自于此。
简单来说,就是RDNA架构更适合游戏的需求了。