作为曾经在N公司从事GPU power研究的来说上两句。
1.首先现代芯片的功率远比你想象的高,随随便便上100W。这里面绝大部分都会变成热能扩散出去。功耗已经成为制约处理器性能的重要瓶颈之一,曾经intel有个趋势图,说按之前芯片的集成发展速度,芯片的能量密度将超过太阳,是不是很夸张!
2.芯片体积小,比热值低。导致功率很快就能反应在温度上,滞后时间非常短。跑计算密集型的应用,如果去除散热装置,几秒钟芯片就能从常温升到八九十度。
既然芯片的温度跟功率息息相关,那有哪些因素会影响功率呢?芯片的功率由芯片上的晶体管组成,而晶体管的功率包括静态功率和动态功率。静态功率是主要受电压,温度,制成的影响;动态功率主要受频率,IPC(instruction per cycle)和电压影响。其中电压与静态和动态功率呈平方关系。
在题主所谓的烤机过程中,频率会在PMU控制下很快上升,同时为保证芯片的稳定运行,电压也必须伴随频率提升。再加上烤机的程序都是计算密集型,IPC非常高。这一切的一切都会导致温度上升飞快。在这过程中,有一瞬间会出现峰值性能,但是这个时间维持不了太久。因为受温度或power budget的限制,PMU要开始降频啦!最后会比较稳定的运行在某个频率上。
那为什么停止烤机,温度或者说功耗会下降的如此之快呢?很多同学可能会误以为是频率和电压下降导致的。但实际上IPC在这里才起了决定性作用。IPC随着程序停止,瞬间降到几乎为0。所以功耗和温度自然就下来了。电压和频率恰恰发生在这只后,PMU在一段时间内芯片idle才开始下调频率和电压。