首页

验证集loss上升，准确率却上升该如何理解？第1页

1

virter 网友的相关建议:

如题主自己回复，这种情况是由于模型得到的结果过于极端（自信）导致，上几张图，题主的情况应该和我下面情况差不多：

可以看到随着迭代增加ValidationLoss越来越大快跑飞了，不过准确率却逐渐平稳变化不大。而且验证集的准确率最高点也出现在先下降后上升区间。实际上准确率最高点（10 epoch左右）的预测结果是这样的：

而训练200 epoch后的预测结果是这样的：

可以明显看出训练200轮后结果趋于极端，而这些极端的负面Loss拉大了总体Loss导致验证集Loss飙升。出现这种情况大多是训练集验证集数据分布不一致，或者训练集过小，未包含验证集中所有情况，也就是过拟合导致的。而解决这种现象可以尝试以下几种策略：

增加训练样本
增加正则项系数权重，减小过拟合
加入早停机制，ValLoss上升几个epoch直接停止
采用Focal Loss
加入Label Smoothing

不过个人感觉主要还是增加训练样本比较靠谱..而且不用太关心ValLoss，关注下ValAccuracy就好。我的这个实验虽然只训练10个epoch在验证集上的准确率高且ValLoss小，但在测试集上结果是巨差的，而训练200个epoch的模型ValLoss虽然巨高但测试集效果还不错。

验证集loss上升，准确率却上升该如何理解？的其他答案点击这里

1

相关话题

  为什么CV能做到让一幅人脸图动了笑了，而NLP的text-style-transfer进展貌似一般？
  机器之心提问：如何评价Facebook Training ImageNet in 1 Hour这篇论文?
  对自己深度学习方向的论文有idea，可是工程实践能力跟不上，实验搞不定怎么办？
  如何评价移动端吊打一切万众期待的商汤深度学习推理框架PPL开源了却没有支持移动端？
  人工智能领域有哪些精妙的数学原理？
  2021年了，如何评价微软亚研提出的对偶学习（Dual Learning）？
  有哪些令你印象深刻的魔改transformer？
  AI（或者说神经网络/深度学习）能够实现科学（尤其是物理学）研究中提出假设这一步嘛？
  2017年1月18日Facebook发行的PyTorch相比TensorFlow、MXNet有何优势？
  计算流体力学（CFD）里应用注意力机制（attention）是否可行？

前一个讨论

为什么学习深度学习感觉无法入门？

下一个讨论

联邦学习/联盟学习 (Federated Learning) 的发展现状及前景如何？

相关的话题

  现在的人工智能是否走上了数学的极端？
  如何看待NLP领域最近比较火的prompt，能否借鉴到CV领域？
  验证集loss上升，准确率却上升该如何理解？
  如何评价浪潮发布的2457亿参数源1.0智能大模型？与GPT-3相比如何？处于AI模型领域什么水平？
  如何评价生成模型框架 ZhuSuan?
  如何计算CNN中batch normalization的计算复杂度（FLOPs）？
  神经网络的万能逼近定理已经发展到什么地步了？
  为什么计算注意力机制的时候不加偏置项？
  《失控玩家》中的游戏有可能实现出来吗？
  要研究深度学习的可解释性（Interpretability），应从哪几个方面着手？
  视觉算法的工业部署及落地方面的技术知识，怎么学？
  如何看待SIREN激活函数的提出？
  如何看待SIREN激活函数的提出？
  为什么 BERT 的 intermediate_size 这么大？
  如何将某个分布作为机器学习的特征？
  word2vec 相比之前的 Word Embedding 方法好在什么地方？
  基于深度学习的自然语言处理在 2016 年有哪些值得期待的发展？
  如何评价 BERT 模型？
  神经网络激活函数的作用和原理？有没有形象解释？
  Google 的神经网络生成图像 (Inceptionism) 是怎么做到的？
  如何评价微软机器翻译在 WMT2017 中英翻译达到「人类水平」？
  如何解读 Jeff Dean 等联合在 arXiv 上发布的用深度学习分析电子病历的论文？
  如何看待2021年秋招算法岗灰飞烟灭？
  如何看待旷视科技新产品监视学生上课？
  如何评价最近火热的对比学习，会引领预训练模型新的范式嘛?
  多模态方面，有哪些牛组值得我们follow他们的工作？
  NLP领域，你推荐哪些综述性的文章？
  有没有什么可以节省大量时间的 Deep Learning 效率神器？
  如何看UCBerkeley RISELab即将问世的Ray，replacement of Spark？
  深度学习方面还有什么Open Problem?

© 2025-06-14 - tinynew.org. All Rights Reserved.
© 2025-06-14 - tinynew.org. 保留所有权利