先简要回答一下吧
AI框架领域最近两年已发生的最大的一个事件是PyTorch以eager模式的优势超越TensorFlow;
AI框架领域最近两年已显现的一个最大需求是大规模预训练模型,进而提出的复杂的并行模式的支持(数据,模型,流水,专家等并行),主流框架还不能原生支持这些需求,都需要通过定制的wrapper或plugin才可以,一些新兴的深度学习框架(譬如OneFlow) 在这方面具有比较明显的领先优势,原生就可以支持这些复杂的并行模式。
一个肉眼可见的事情是“自动placement和自动并行”很快就会被完全解决了,将真正实现单卡代码不需要任何改动就可以扩展到任意多的计算资源上去,分布式并行方面的痛点将不复存在。
所以可以预期,未来的主流框架将继承PyTorch在单卡易用性方面的优点,同时在分布式易用性、分布式效率方面也会非常突出,当然也会解决掉PyTorch今天遇到的部署方面的麻烦(也就是训练推理一体化)。
这是一个比较近期的预测,应该在一年内发生。
更远一点,深度学习编译器领域也会发生一些有趣的事情。