不知道有人注意到RDNA3的浮点(流处理器)对比RDAN2增加的很夸张?我合理怀疑AMD的RDNA3很可能也跟上了双倍FP32的车。
Nvidia在Ampere消费级上把FP32 ALU在SM中的比例翻倍,造成了“CUDA”和FP32理论性能的暴增。Apple A15上的GPU也是做了FP32翻倍的设计。
现在从RDNA3的入魔来看,大概也是类似的。
RDNA2 Navi 21 是有4个Shader Engines,共计40个WGP,80个CU,每个CU有64SP,最终共计5120SP,那么可以看到说每个Shader Engine是1280SP,每个WGP是128SP。
而现在这个RDNA3的传闻是2*3个Shader Engines,共计60个WGP,最终15360SP,小学数学计算可以看出来1个Shader Engine 是2560SP,一个WGP是256SP,一个CU大概率是128SP了,或者是类似形式。
所以RNDA2到RDNA3,大概率是有类似Ampere那种WGP/SM浮点轻松翻倍FP32 ALU的设计的~ 属于数字可以刷的很好看,实际性能得打折那种。
其实我一直有个问题,为什么现在的GPU都不约而同的这么做?从Apple和Nvidia来看,这个倍增的FP32所带来的提升其实不是很大(可参考性能和FP32理论的比值)...