百科问答小站 logo
百科问答小站 font logo



2020年CVPR有哪些优秀的论文? 第1页

  

user avatar   gambling_db 网友的相关建议: 
      

CV 现在真的不得了了,大家关注的都是算法,单纯从应用场景上看到两篇有意思的。

  1. Fantastic Answers and Where to Find Them: Immersive Question-Directed Visual Attention.

视觉注意力的两种分析法:

  • 自上而下(Top-down):由任务驱动的,给被试一项任务,然后看被试在环境中的注意力分配,是人因工程研究的;
  • 自下而上(Bottom-up):由实验刺激(stimulus)驱动的,不关注被试,通过实验刺激的基本属性来直接预测被试的注意力分配,就是CV搞的。

说穿了,自下而上关注的是人,自上而下关注的是机器,正好是反着来的。对应的也就是人因工程和机器学习这两个方向。

这篇文章,首先做了自上而下的分析,让一群被试带着360度的VR设备,内嵌有眼动仪。然后让他们看着提供的视觉刺激,来回答一些问题,比如问他们图片里有几个人。然后发现回答正确和回答错误的人的注视区域是不一样的。

接着做了自下而上的分析,就是直接用他们的算法,根据视觉刺激来进行注意力预测。

最终发现,在忽视被试的情况下,单纯用他们的算法来对视觉刺激进行注意力预测,和用人来做实验看他们的注意力区域,是很接近的,而且适用于回答正确和回答错误两种情况,这个就有点神了。

2017年有一篇发在CVPR上的paper,原理类似,直接用视频来简单粗暴地预测司机的注意力分析,效果还可以。

2. Bringing Old Photos Back to Life.

是修复有折损的老照片的,折痕和噪点修复的都很好。


Reference:

  • Jiang, M., Chen, S., Yang, J., & Zhao, Q. (2020). Fantastic Answers and Where to Find Them: Immersive Question-Directed Visual Attention. InProceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition(pp. 2980-2989).
  • Palazzi, A., Abati, D., Solera, F., & Cucchiara, R. (2018). Predicting the Driver's Focus of Attention: the DR (eye) VE Project.IEEE transactions on pattern analysis and machine intelligence,41(7), 1720-1733.
  • Wan, Z., Zhang, B., Chen, D., Zhang, P., Chen, D., Liao, J., & Wen, F. (2020). Bringing Old Photos Back to Life. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 2747-2757).



  

相关话题

  CVPR 2018 有什么值得关注的亮点? 
  如何看待「SCI 论文越多,科研能力越差」的评价? 
  北京某211学校某位美籍华裔教授说中国大部分博士论文都是不值得参考的rubbish,这个说法对吗? 
  论文上的一些小问题,导师为什么不能直接帮我改了? 
  如何看待各大高校文史类研究生每学期需要提交 5 篇以上课程论文以及日常课堂教学中轮番轰炸的课堂汇报? 
  遇到学术论文作者犯了大忌,例如成了被判刑的贪官,还应该引用他的文章吗? 
  想要发表一些文章有哪些途径和方式? 
  想要发表一些文章有哪些途径和方式? 
  什么样的论文会被导师枪毙?或者说,一般论文存在哪些问题会让老师无法容忍? 
  为什么有的博士生毕业时候没文章? 

前一个讨论
如何计算CNN中batch normalization的计算复杂度(FLOPs)?
下一个讨论
在机器学习中,L2正则化为什么能够缓过拟合?





© 2024-09-19 - tinynew.org. All Rights Reserved.
© 2024-09-19 - tinynew.org. 保留所有权利