首页

如何证明数据增强（Data Augmentation）有效性？第1页

1

FesianXu 网友的相关建议:

你这个说法是不准确的，一个机器学习模型由几大部分组成：数据，模型，损失函数，以及学习策略等。模型提供了假设空间和搜索空间，数据，损失函数和学习策略让算法得以在假设空间，搜索空间里面得以找到合适的解（也即是模型每个可学习参数的值），具体论证可见博客：

也就是说数据其实是学习模型的一部分，离开了数据无法谈及学习模型的泛化性能。那么我们回到正题，“如何证明数据增强（Data Augmentation）有效性？”，在论文

中，对图像上进行数据增广的方法进行了很多总结，其中谈到了什么是有效的数据增广，有效的数据增广的前提首先是label preserve的，也就是说增广前后起码数据的label要保持不变性，当然这个还不够全面，有些任务会要求协变性，具体两者区别见：

当然，label不变/协变只是必要条件，整个数据增广有效的充分必要条件应该是：label不变/协变（取决于任务），而且提供了足够的先验知识。比如说：对图片进行旋转，平移，镜像，颜色空间抖动，像素抖动等等，都是模拟拍摄过程中可能产生的一些情况，由于数据集过小可能没有覆盖所有情况因此需要人工去提供这些先验。

那么这些先验必须要从数据增广中去添加吗？那也不一定，只是从数据增广的角度去处理是最简单的。你甚至可以去模型中修改模型的结构去提供这些先验假设。

总的来说，你会产生这个问题的原因就是：你没有认识到学习模型是由数据，模型，学习算法和损失等几部分组成的，并不是model万能。

以上

如何证明数据增强（Data Augmentation）有效性？的其他答案点击这里

1

相关话题

  在五到十年内，人工智能能复原成人影片中的被马赛克部分吗？
  如何评价余凯在朋友圈发表呼吁大家用 caffe、mxnet 等框架，避免使用 TensorFlow？
  有没有可能运用人工神经网络将一种编程语言的代码翻译成任意的另一种编程语言，而不经过人工设计的编译过程？
  能否把一个人的所有物理数据输入在一个模型里，然后计算他接下来的状态变化？
  多任务学习中loss多次backward和loss加和后backward有区别吗？
  贝叶斯定理厉害在哪里？
  如何评价 MSRA 最新的 Deformable Convolutional Networks？
  如何评价周志华教授新提出的 Deep Forest 模型，它会取代当前火热的深度学习 DNN 吗？
  如何看待指出神经网络的训练罪魁祸首是退化一文？
  你是如何走上数据分析之路的？

前一个讨论

预算 2021 元以内，你会如何打造自己的穿搭造型呢？

下一个讨论

最好的分手方式是怎样的?

相关的话题

  机器学习，深度神经网络等方法是否是正确的方向？
  深度学习做股票预测靠谱吗？
  深度学习在无人驾驶汽车上面的运用有哪些？
  如何看待 Google TPU？寒武纪芯片较之有哪些优势与不足？
  如何评价 DeepMind 新提出的关系网络（Relation Network）？
  有哪些东西的产量、资源、或消费量等，中国在人均生产、占有或消费量排名第一或前几的？
  如何评价 MSRA 视觉组最新提出的 Deformable ConvNets V2？
  Linear least squares, Lasso,ridge regression有何本质区别？
  深度学习领域有哪些瓶颈？
  为什么要压缩模型，而不是直接训练一个小的CNN？
  如何看待MXNet获得amazon官方支持首位？
  除了深度神经网络已经实现的特性以外，大脑还有哪些特性是值得机器学习领域借鉴的？
  如何看待 Nervana 被 Intel 收购？
  机器学习包含哪些学习思想？
  如何看待《Nature》发布的新研究：摄像头是天生的神经网络，速度超越传统方法千倍?
  如何评价AWS的图神经网络框架DGL？
  如何评价Kaiming He的Momentum Contrast for Unsupervised?
  DL/ML 模型如何部署到生产环境中？
  深度学习方面还有什么Open Problem?
  现代人工神经网络是不是一个死胡同？这个技术是不是骗人的？
  法国计算机研究生（应届）是留在欧洲工作好，还是回国直接工作好？
  神经网络中，bias有什么用，为什么要设置bias，当加权和大于某值时，激活才有意义？
  GAN的生成器是怎么产生图片的？
  2021年深度学习哪些方向比较新颖，处于上升期或者朝阳阶段，没那么饱和，比较有研究潜力？
  为啥gan里面几乎不用pooling？
  未来五年，数据科学家（Data Scientist）的岗位需求会如何变化？
  如何评价移动端吊打一切万众期待的商汤深度学习推理框架PPL开源了却没有支持移动端？
  因果推断会是下一个AI热潮吗？
  深度学习在信息安全的应用有哪些可以关注的人或论文？
  如何评价mixup: BEYOND EMPIRICAL RISK MINIMIZATION？

© 2025-06-25 - tinynew.org. All Rights Reserved.
© 2025-06-25 - tinynew.org. 保留所有权利