首页

如何证明数据增强（Data Augmentation）有效性？第1页

1

FesianXu 网友的相关建议:

你这个说法是不准确的，一个机器学习模型由几大部分组成：数据，模型，损失函数，以及学习策略等。模型提供了假设空间和搜索空间，数据，损失函数和学习策略让算法得以在假设空间，搜索空间里面得以找到合适的解（也即是模型每个可学习参数的值），具体论证可见博客：

也就是说数据其实是学习模型的一部分，离开了数据无法谈及学习模型的泛化性能。那么我们回到正题，“如何证明数据增强（Data Augmentation）有效性？”，在论文

中，对图像上进行数据增广的方法进行了很多总结，其中谈到了什么是有效的数据增广，有效的数据增广的前提首先是label preserve的，也就是说增广前后起码数据的label要保持不变性，当然这个还不够全面，有些任务会要求协变性，具体两者区别见：

当然，label不变/协变只是必要条件，整个数据增广有效的充分必要条件应该是：label不变/协变（取决于任务），而且提供了足够的先验知识。比如说：对图片进行旋转，平移，镜像，颜色空间抖动，像素抖动等等，都是模拟拍摄过程中可能产生的一些情况，由于数据集过小可能没有覆盖所有情况因此需要人工去提供这些先验。

那么这些先验必须要从数据增广中去添加吗？那也不一定，只是从数据增广的角度去处理是最简单的。你甚至可以去模型中修改模型的结构去提供这些先验假设。

总的来说，你会产生这个问题的原因就是：你没有认识到学习模型是由数据，模型，学习算法和损失等几部分组成的，并不是model万能。

以上

如何证明数据增强（Data Augmentation）有效性？的其他答案点击这里

1

相关话题

  二分类问题，应该选择sigmoid还是softmax？
  请问下大家训练 SimCSE 时, loss 有没有这样的情况?
  AMD 开源高性能机器智能库MIopen是否可以和cuDNN抗衡？
  现代人工神经网络是不是一个死胡同？这个技术是不是骗人的？
  如何看待MXNet在CVPR2017上公布的gluon接口？
  如何看待 Google TPU？寒武纪芯片较之有哪些优势与不足？
  数据委托给office ，出现这种问题，怎么处理？
  各种机器学习算法的应用场景分别是什么（比如朴素贝叶斯、决策树、K 近邻、SVM、逻辑回归最大熵模型）？
  经过足够长的时间， AlphaGo 的棋谱能收敛到一张上吗？
  汉语拼音里，哪些字母用的最多？

前一个讨论

预算 2021 元以内，你会如何打造自己的穿搭造型呢？

下一个讨论

最好的分手方式是怎样的?

相关的话题

  2021年深度学习哪些方向比较新颖，处于上升期或者朝阳阶段，没那么饱和，比较有研究潜力？
  如何理解深度学习中的deconvolution networks？
  为什么要学习吴恩达的机器学习？
  百度在深度学习上使用Xilinx FPGA?
  如何评价何恺明等 arxiv 新作 Rethinking ImageNet Pre-training？
  从人脑角度来说为什么人画画会越来越准（形准）？
  为什么多标签分类（不是多类分类）损失函数可以使用Binary Cross Entropy？
  有没有可能让计算机去理解代码，从而写代码？
  NIPS 2018 有什么值得关注的亮点？
  请大家帮我分析一下到底是谁的问题？
  有没有可以完全替代并超越excel的表格和数据处理软件?
  贝叶斯深度学习是什么，和传统神经网络有何不同？
  是不是并不是所有问题都适合用神经网络预测？
  多模态训练，怎么解决不同模态之间差异的问题？
  深度学习和强化学习之间的差别有多大？
  机器学习，深度神经网络等方法是否是正确的方向？
  梯度下降法的神经网络容易收敛到局部最优，为什么应用广泛？
  为什么有的论文放出训练好的模型和测试脚本，但不开源训练代码？
  如何评价 7 月 31 日一流科技开源的深度学习框架 OneFlow？
  为什么现在不看好 CV 方向了呢?
  word2vec有什么应用？
  视觉Transformer如何优雅地避开位置编码？
  医学生学习机器学习该如何入门？
  Batch normalization和Instance normalization的对比？
  如何评价Hinton组的新工作SimCLR?
  如何成为一名优秀的商业分析师？
  各种机器学习算法的应用场景分别是什么（比如朴素贝叶斯、决策树、K 近邻、SVM、逻辑回归最大熵模型）？
  机器学习如何才能避免「只是调参数」？
  谁来用最通俗易懂的语言跟我讲一下k平均算法（k means clustering）？？
  让人工智能去下路边街头的象棋残局会赢吗？

© 2025-06-06 - tinynew.org. All Rights Reserved.
© 2025-06-06 - tinynew.org. 保留所有权利