百科问答小站 logo
百科问答小站 font logo



如果把《王者荣耀》当做一门课程,你会出一份什么样的试卷进行考核? 第1页

  

user avatar   zhangyutong926 网友的相关建议: 
      

问:请定义术语《王者荣耀》。

答:多方参与的部分信息Markov决策博弈过程。

填空: 强化学习 可供我们解决上述问题。

连线:观察以下游戏界面,将每个区域连线相应的较优处理算法。

答:将spatial连接到卷积网络,将stats(和announcement、voice)连接到循环网络,将单位信息连接到多层ReLU/Sigmoid网络。

简答:观察Ye, Chen, Zhang, et.al.文献中一图:

你认为在优化算法的过程中,Action Mask部分的引入能够给算法提供什么样的提高?

答:算法会避免进行无效或极低效的操作,例如对static object尝试攻击等。

问:

在算法中引入平方和来设计evaluator function的意义何在?

答:去除符号影响,光滑化函数以进行梯度下降。

填空:Ye, Chen, Zhang, et.al.文献中使用PPO(proximal policy optimization)相对于之前算法的主要提升在于其 对时间步长不敏感

问:举一例选举英雄的策略。

答:Monte-Carlo决策搜索。


(加个私货黑下ML)问:Ye, Chen, Zhang, et. al.等的论文从数学的角度看缺乏什么?

答:结果的effectiveness和efficiency是通过experiment得到的而不是proof得到的。




  

相关话题

  王者荣耀:我连对面技能都不知道,却靠一个英雄80胜率上了星耀,我还能在走多远? 
  《王者荣耀》巅峰前十玩家出现华东理工学生,昵称「欢迎考华理」,这波操作会吸引高考生报考吗? 
  王者荣耀会不会有一天凉凉,甚至关服? 
  现在的国产游戏更需要《原神》还是《黑神话:悟空》? 
  如何看待《原神》中的角色「迪奥娜」? 
  中国政法大学专家称「游戏账号租售属违法行为,成年人把账号卖给成年人也违法」,还有哪些信息值得关注? 
  一个号称是百星王者的陪玩,带我打星耀局却三连败正常吗? 
  如何评价网易发布的《代号MOBA》? 
  《王者荣耀》你认为最被低估的英雄是谁? 
  为什么买断制游戏不花钱就不能玩,还有那么多人玩? 

前一个讨论
如何评价这个人自称初一自学高等数学并秀优越?
下一个讨论
关于化学有什么表情包?





© 2025-03-25 - tinynew.org. All Rights Reserved.
© 2025-03-25 - tinynew.org. 保留所有权利