首页

如何看待谷歌研究人员提出的卷积正则化方法「DropBlock」？第1页

1

mileistone 网友的相关建议:

发现了一个发文章的思路。

先看看各种norm

15年提出的batch norm，从三个维度做norm；

16年提出的layer norm，从三个维度做norm；

16年提出的instance norm，从两个维度做norm；

18年提出的group norm，从上面做norm，是在把这个维度切成多个部分；

总结起来就是在四个维度上面做排列组合，进行norm，每个维度还可以切成多个部分。好像还没有论文做norm，下一篇norm的论文也许就是这个了，哈哈哈。

再看看各种drop

14年的dropout，随机drop一个的特征；

15年的spatialdropout，随机drop一个的特征；

18年的dropblock，随机drop一个特征，是在上取一个region，跟group norm的group比较像；

总结起来就是在四个维度上面做排列组合，进行drop，每个维度还可以切成多个部分。我试着继续做一下排列组合：、、、、、，下一篇drop的论文也许就在上述排列组合中。

从norm系列论文和drop系列论文来看，当出现了一篇经典论文后，快速发现这篇论文方法的可拓展性，比如上述的，做实验，有效果了就可以发论文。

之前看non local neural networks的时候也发现了一种想idea的方法，还写了一篇回答。

这篇文章还有一个有趣的彩蛋，backbone为ResNet-50 FPN的retinanet直接train from scratch跟在ImageNet数据pretrain的网络上效果相当。

就这个彩蛋，我写了一篇文章简单介绍了一下。

如何看待谷歌研究人员提出的卷积正则化方法「DropBlock」？的其他答案点击这里

1

相关话题

  2019年CVPR有哪些糟糕的论文?
  Kaggle如何入门？
  R 中的哪些命令或者包让你相见恨晚？
  如何评价 DeepMind 公司？
  Yann LeCun、Geoffrey Hinton或Yoshua Bengio能得图灵奖吗？
  什么是博弈机器学习？
  如何评价 DeepMind 在北京时间 19 年 1 月 25 日 2 点的《星际争霸 2》项目演示？
  人脸识别哪家强？
  OpenAI 发布文字生成图像工具 DALL·E 2，它的画作水平如何？从技术角度如何评价它的能力？
  下一代 AI 框架长什么样？

前一个讨论

有哪些令你印象深刻的魔改transformer？

下一个讨论

为什么癌症往往一发现就是晚期？

相关的话题

  到了 2022 年，人工智能有哪些真正可落地的应用？
  为什么读论文最好打印出来读？
  Batch Normalization 训练的时候为什么不使用 moving statistics？
  NLP文本匹配问题的本质是不是对于要预测的句子，遍历候选句子从训练数据集里寻找最相似的pair？
  深度学习领域有哪些瓶颈？
  为什么图形学的会议siggraph的论文代码很少会开源？好像视觉如CVPR、ICCV开源的更多一些。
  为什么机器学习解决网络安全问题总是失败?
  如何正确理解小概率事件，以及概率和哲学的关系？
  视觉Transformer如何优雅地避开位置编码？
  如何看待谷歌公开 tensorflow 专用处理器 TPU?
  如何评价Hinton在加拿大多伦多大学关于用“capsule”作为下一代CNN的演讲？
  网络上一位长者提出了“完全不依靠人工神经网络与机器学习算法实现人工智能”的理论，大家怎么看？
  如何通俗易懂地介绍 Gaussian Process？
  如何评价MXNet发布的1.0版本？
  新手如何实现个简单AutoML框架。有参考的github开源项目介绍吗？
  一张图片怎么用matlab 把颜色反相，就是红的部分变成绿的，蓝的部分变成黄的？
  使用pytorch时，训练集数据太多达到上千万张，Dataloader加载很慢怎么办?
  如何用最简单的语言统一描述多元函数求导（对向量求导、对矩阵求导等）？
  如何评价 CVPR 2020的论文接收结果？有哪些亮点论文？
  Partial Multi-Label Learning是什么？它的发展史又是怎样的？最新的进展如何？
  国内有哪些不错的CV(计算机视觉)团队?
  2021年，作为算法工程师的你们会在CV业务落地上用Transformer吗？
  卷积神经网络如果将池化层去除，与神经网络的区别还大么？
  既然使用神经网络也可以解决分类问题，那SVM、决策树这些算法还有什么意义呢？
  主动学习（Active Learning）近几年的研究有哪些进展，现在有哪些代表性成果？
  CNN网络的pooling层有什么用？
  attention跟一维卷积的区别是啥？
  如何理解 Swin Transformer 和 Vision Transformer不同任务上的差异？
  时间序列和回归分析有什么本质区别？
  深度学习调参有哪些技巧？

© 2025-05-31 - tinynew.org. All Rights Reserved.
© 2025-05-31 - tinynew.org. 保留所有权利