TVM ARM CPU/GPU的性能一直不错,有兴趣的同学可以看arxiv的论文。本次更新的内容可以直接看release note https://github.com/dmlc/tvm/releases/tag/v0.3
本次更新的第一个重点在于TOPI开始引入对于物体检测(SSD, YOLO) 等的支持,这个是深度学习编译跨向更多应用实用化的一步。
另一个比较有趣的是RPC tracker。TVM的设计理念是不光是授人以鱼(高性能算子),更包含了授人以渔(自动生成,调优部署高性能算子的编译平台)。其中自动调优里面一个非常头疼的的问题是移动设备(手机,板子)怎么样自动优化。传统的做法编译部署和调优都需要手工来做,没有办法自动化起来。TVM的RPC接口基本解决了这个问题,可以直接在python端对于远程的手机和板子进行调优。新版的RPC tracker从支持一个板子直接升级到了一个集群,也就是可以通过本机python脚本直接连接到一堆板子去做自动调优。
最后,对于深度学习和区块链有兴趣的同学可以自行寻找一下亮点。
关于tvm的其它介绍可以关注专栏 tvm