首页

验证集loss上升，准确率却上升该如何理解？第1页

1

virter 网友的相关建议:

如题主自己回复，这种情况是由于模型得到的结果过于极端（自信）导致，上几张图，题主的情况应该和我下面情况差不多：

可以看到随着迭代增加ValidationLoss越来越大快跑飞了，不过准确率却逐渐平稳变化不大。而且验证集的准确率最高点也出现在先下降后上升区间。实际上准确率最高点（10 epoch左右）的预测结果是这样的：

而训练200 epoch后的预测结果是这样的：

可以明显看出训练200轮后结果趋于极端，而这些极端的负面Loss拉大了总体Loss导致验证集Loss飙升。出现这种情况大多是训练集验证集数据分布不一致，或者训练集过小，未包含验证集中所有情况，也就是过拟合导致的。而解决这种现象可以尝试以下几种策略：

增加训练样本
增加正则项系数权重，减小过拟合
加入早停机制，ValLoss上升几个epoch直接停止
采用Focal Loss
加入Label Smoothing

不过个人感觉主要还是增加训练样本比较靠谱..而且不用太关心ValLoss，关注下ValAccuracy就好。我的这个实验虽然只训练10个epoch在验证集上的准确率高且ValLoss小，但在测试集上结果是巨差的，而训练200个epoch的模型ValLoss虽然巨高但测试集效果还不错。

验证集loss上升，准确率却上升该如何理解？的其他答案点击这里

1

相关话题

  word2vec有什么应用？
  应届硕士毕业生如何拿到知名互联网公司算法岗（机器学习、数据挖掘、深度学习） offer？
  国内 top2 高校研一在读，为什么感觉深度学习越学越懵?
  如何进行图像模糊与清晰的分类？
  能否把一个人的所有物理数据输入在一个模型里，然后计算他接下来的状态变化？
  为何感觉“知识蒸馏”这几年没有什么成果？
  如何简单形象又有趣地讲解神经网络是什么？
  如何评价 MSRA 最新的 Deformable Convolutional Networks？
  为何总感觉人工智能和神经科学（神经网络）被绑在一起？
  如何评价openai的新工作DALL·E?

前一个讨论

为什么学习深度学习感觉无法入门？

下一个讨论

联邦学习/联盟学习 (Federated Learning) 的发展现状及前景如何？

相关的话题

  有哪些令你印象深刻的魔改transformer？
  强化学习和自适应控制的关系是什么？
  国内做NLP业务的香侬科技值得去吗？
  为什么GAT能够实现Inductive learning，而GCN不行？
  如何看待华为 4 月 25 日发布的盘古智能大模型？在这个行业处于什么水平？
  现在的人工智能是否走上了数学的极端？
  迁移学习入门，新手该如何下手？
  为什么说大模型训练很难？
  是不是并不是所有问题都适合用神经网络预测？
  使用强化学习解决实际问题时常常避不开环境模拟或者使用离线强化学习算法，两者分别有什么优缺点？
  NLP 方向在国内清北读博还是国外？
  分类机器学习中，某一标签占比太大（标签稀疏），如何学习？
  实验室一块GPU都没有怎么做深度学习？
  计算机视觉顶级会议论文中比较适合初学计算机视觉的人做的复现实验有哪些？
  如何评价 2015 版的 Magi 搜索引擎？
  能否把一个人的所有物理数据输入在一个模型里，然后计算他接下来的状态变化？
  计算机视觉和自然语言处理，哪个更具有发展前景呢，还是各有千秋呢？
  有哪些比较好的元学习（meta learning）领域的学习资源？
  ICLR 2021 有什么值得关注的投稿？
  如何评价 Self-Normalizing Neural Networks 这篇论文?
  人工智能会是泡沫吗？
  AlphaGo 与李世石的对战会推动人类的极限还是机器学习的进步和觉醒？
  如何评价Sony新出的深度学习库NNabla？
  Batch Normalization 训练的时候为什么不使用 moving statistics？
  Transformer是如何处理可变长度数据的？
  如果你是面试官，你怎么去判断一个面试者的深度学习水平？
  能否把一个人的所有物理数据输入在一个模型里，然后计算他接下来的状态变化？
  如果你是面试官，你怎么去判断一个面试者的深度学习水平？
  注意力机制是如何学习到模型所应注意的区域的？
  在文本分类任务中，有哪些论文中很少提及却对性能有重要影响的tricks？

© 2025-06-15 - tinynew.org. All Rights Reserved.
© 2025-06-15 - tinynew.org. 保留所有权利