更新:文章已放上个人主页 yuandong.tian.com, 链接请见
http:// openreview.net/pdf? id=Hk3mPK5gg谢邀。
这次很荣幸我们在Track1拿了第一名,看分数甩开第二名还挺多的。之前只是想以VizDoom作为增强学习算法的测试平台,后来想想还是多花点时间在比赛上,比赛的这个模型是在7月下旬才开始训练,所以没有更多的精力和时间去训练模型去参加Track2,长远来说,Track2是更重要的方向。另外第二名刚刚也加入了FAIR,在巴黎的办公室。
代码都是
@吴育昕写的,我就做了些方向上的指导工作。文章正在撰写中,预计会投今年的ICLR,本着FAIR一贯的态度,代码也会公开。在文章公开之前我们不会透露技术细节,不过可以说我们这次设计的是一个更加一般化的框架,训练时不需要游戏后台给神经网络提供太多额外信息,也没有用太多的trick,对具体哪款游戏不太敏感,能拿第一说明这个框架有比较大的潜力。
另外两小时的全视频在这里:
Track 1
https://www. youtube.com/watch? v=94EPSjQH38YTrack 2
https://www. youtube.com/watch? v=tDRdgpkleXI