首页

如何评价 Face++ 旷视科技最新出品的检测专用 backbone 网络 DetNet ？第1页

1

skicy-yu 网友的相关建议:

简单讲一下这篇文章的思路。

目前我们所有的检测算法大部分都是依赖于一个backbone网络，也就是传统大家说的ImageNet based model。但是ImageNet的base model往往是针对分类问题来train的，如果直接用来做detection/segmentation/skeleton等相关任务，其实是有比较明显的gap的。

最简单来讲，detection/segmentation等往往需要做pixel-level的定位，所以需要有尽可能大的feature map的spatial resolution。但是传统分类网络往往越卷越小，最后一个global average pool或者fc把所有spatial信息融合在一起，所以对空间信息的保存是非常不友好的。

传统大家做法是在ImageNet base model上面打补丁，比如加U-shape结构等。但是往往丢了的spatial很难被补回来。我们这篇工作希望是抛砖引玉，首先需要说明的是，我们在往这个方面努力，希望设计一个对detection/segmentation友好的网络，但是确实这个问题还是有许多需要改进的地方。

具体做法大家可以看paper细节。从结果上面来看，我们在只替换backbone网络的情况下，以更小的复杂度（少了近一倍）做到了更高的结果（超过一个多点）。无论是COCO的object detection还是instance segmentation上面，这个结果应该都是很impressive的。

最后，宣传一下我们最近的一些工作。

比如我们组去年做COCO skeleton第一的paper, 我们已经放出了完整的code

另外，我们之前的一个detection工作Light-head RCNN也放了code:

如何评价 Face++ 旷视科技最新出品的检测专用 backbone 网络 DetNet ？的其他答案点击这里

1

相关话题

  NIPS 2018 有什么值得关注的亮点？
  有哪些人工智能上的事实，没有一定人工智能知识的人不会相信？
  柯洁与 AlphaGo 三场皆负，对围棋今后的发展会有哪些影响？
  如何解决图神经网络（GNN）训练中过度平滑的问题？
  如何评价最新的Octave Convolution？
  国内哪些公司在用caffe、torch、TensorFlow、paddle等框架，哪些在用自研框架？
  如果人类的意识被科学家证明只是一种物质或者一种活动，那时候我们该怎么安置我们存在的意义？
  PyTorch中在反向传播前为什么要手动将梯度清零？
  2019 年 8 月 9-11 日召开的华为开发者大会（HDC.2019）上有哪些值得关注的信息？
  如何全面理解工程师红利？

前一个讨论

全世界目前最大威胁是什么？

下一个讨论

Mac 上使用 SSD 进行 Win To Go 的体验如何？

相关的话题

  如何评价FAIR提出的ConvNeXt：CNN匹敌Swin Transformer?
  如何看待 Deepmind 宣称最新版 AlphaGo 能让李世乭版本 AlphaGo 三子？
  如何看待饶毅的「人工智能还是伪智能」命题？
  如果人工智能迎来下一个寒冬，你认为会是卡在什么问题上？
  如何看待媒体报道称「Facebook将关闭人工智能系统：因AI已经发明语言」？
  如何评价「Patches are all you need」?
  Transformer在工业界的应用瓶颈如何突破？
  如何看待人工智能攻破德州扑克？
  请解释下variational inference？
  导盲犬一只训练成本高达22万，为什么不用相同的钱雇人为盲人导盲？
  如何看待AI参与文学创作？
  我应该从计算机视觉回到做FPGA 吗？
  如何看待百度无人车，三千多个场景，一万多个if？
  adversarial training为什么会起作用？
  如何看待关于“数据结构与算法基础”的重要性？
  济南成功实施首例「人工心脏」植入手术，「人工心脏」相对于传统心脏移植有哪些优势？
  如果有一个按钮，按下去之后人类现存的AI技术立刻消失，会对人类社会造成什么影响？
  2019 秋招的 AI 岗位竞争激烈吗？
  为什么微软要删除世界上最大的公开人脸识别数据库？
  如何评价轮子哥认为alphago(master)是靠暴力下棋？
  为什么大家都害怕人工智能取代人类？
  如何评价 7 月 31 日一流科技开源的深度学习框架 OneFlow？
  深度学习在信息安全的应用有哪些可以关注的人或论文？
  人类被机器人统治的条件有哪些？
  AlphaGo「理解」围棋吗？
  人工智能可以为人类找寻他们心目中的另一半吗?
  现在的BERT等语言模型，最快训练要多久？
  如何看待旷视科技新产品监视学生上课？
  如何评价 7 月 31 日一流科技开源的深度学习框架 OneFlow？
  目前 CS 本科加硕士，请问博士申请 CS，还是 Neuroscience？

© 2025-06-01 - tinynew.org. All Rights Reserved.
© 2025-06-01 - tinynew.org. 保留所有权利