百科问答小站 logo
百科问答小站 font logo



如何评价 MSRA 最新的 Deformable Convolutional Networks? 第1页

  

user avatar   tang-xu-60-83 网友的相关建议: 
      

蹲个马桶的功夫来总结下这篇论文。


目前已有的三篇讲这篇deformable convolution network的文章:

1.

mp.weixin.qq.com/s/OETZ

2.

mp.weixin.qq.com/s/Ulu8

3.

mp.weixin.qq.com/s/okI3

一如既往的Jifeng Dai的work,继承了STN,刚花了一个下午看完这篇论文,很novel的工作,共同作者是msra的实习生们。

第一篇文章有句很生动的概括:“文章通俗的说法就是,图片中的物体形状本来就是千奇百怪,方框型的卷积核,即使卷积多次反卷积回去仍然是方框,不能真实表达物体的形状,如果卷积核的形状是可以变化的,这样卷积后反卷积回去就可以形成一个物体真实的多边形,更贴切的表达物体形状,从而可以更好的进行像素分割和物体检测。”

这张图可以很明显看出方法的有效性,每个三列的图中,左边是背景上的点对应的激活它的点(感受野),可以看出是覆盖天空的背景的。中间一列对应的是小物体,反向回去对应的激活点是几乎覆盖小物体上所有区域,同理右边那列对应大物体。

几个值得注意的地方:

1. 2.3一开头那几句讲解如何初始化deformable的部分。


2.主要是在一些detection和segmentation的task上取得了进步。后续关于分类任务的应用值得展望。

3.Learning the offset部分讲述了offset的学习过程的细节。


user avatar   yuwen-xiong 网友的相关建议: 
      

冒个泡,一个半月以后终于把code release出来了,放在了

msracver/Deformable-ConvNets

,当时做实验用的是内部的只能在Windows上跑的支持多卡做detection的Caffe,基本没法release,花了一个多月迁移到了MXNet上。其实我们的实现跟现有的repo并不太一样,欢迎大家来围观。




  

相关话题

  人工智能是否毁灭人类? 
  技术一旦被用来作恶,究竟会有多可怕? 
  老师给了一个神经网络的程序,他之前是跑通了的,但是我迭代几十次或者一百多次就报错。这个怎么解决? 
  如何看待多模态transformer,是否会成为多模态领域的主流? 
  马斯克称「特斯拉或许应该制造一款连接交通灯的 AI 设备」,透露了哪些信息? 
  如何评价浙江大学发布的“绝影”四足机器人? 
  如何看待2019年8月19日美方给予华为禁令额外的90天延期,但同时在禁令增加46个华为子公司? 
  人工智能可以为人类找寻他们心目中的另一半吗? 
  没有顶会的CV/NLP方向的博士生毕业出路在哪里? 
  如何看待马毅老师深度学习第一性原理的文章在 ICML 四个审稿人一致接收的情况下被 AC 拒了? 

前一个讨论
为什么 Non-Convex Optimization 受到了越来越大的关注?
下一个讨论
如何看待Yoav Goldberg 怒怼来自MILA的GAN for NLG的paper?





© 2025-04-03 - tinynew.org. All Rights Reserved.
© 2025-04-03 - tinynew.org. 保留所有权利