首页

为什么softmax很少会出现[0.5，0.5]？第1页

1

wang-feng-98-82 网友的相关建议:

因为训练的时候你没有跟网络说什么样的东西应该不确定。

你只给了确定的label，要么是[0,1]要么是[1,0]，那网络就只会出接近这两个值的输出。

-----------------分界线------------------

当然这背后是有数学原理的，二分类的softmax其实等价于sigmoid，如果一直给one-hot的标签，在训练集几乎都能分正确的前提下，网络趋向于将feature的norm无限拉长，sigmoid越来越接近0-1的阶跃函数，几乎所有样本的输出就都在接近0和接近1的位置，中间态几乎没有。

注意这里引入了一个假设，即“训练集几乎都能分正确”。如果你的训练集拟合得不好，你会发现输出0.3、0.5之类的样本的机会会大大增加。

-----------------分界线------------------

怎么告诉网络不确定性呢？

有两种方式：一种是soft label，即你直接就给部分样本[0.5, 0.5]的label；一种是noise label，就是你觉得不确定的东西，一会给0的label，一会给1的label。

这两种方式都可以起作用，当然第一种效果更好一些，网络有比较明确的目标，第二种方式在batch training下其实也是有效的，只是看起来比较奇怪。

为什么softmax很少会出现[0.5，0.5]？的其他答案点击这里

1

相关话题

  ICLR 2018 有什么值得关注的亮点？
  语音识别中，声学模型与语言模型扮演什么角色？或者说是怎么通过两个模型进行语音识别的?
  这一波人工智能泡沫将会怎么破灭？
  如何学习视频识别技术？
  用 TensorFlow 可以做什么有意思的事情？
  CNN（卷积神经网络）、RNN（循环神经网络）、DNN（深度神经网络）的内部网络结构有什么区别？
  如何评价何恺明等 arxiv 新作 Rethinking ImageNet Pre-training？
  从算法的角度来看，Elsagate 事件暴露出了「自动推荐」的哪些问题，该如何规避？
  如何评价谷歌提出的 Pix2Seq：将目标检测看成语言建模，效果超过 DETR？
  人工智能技术会不会最终赶上微积分的历史地位？

前一个讨论

目前 AI 在疾病的诊断和治疗上，有哪些成功的应用？

下一个讨论

一位合格的博士生需要有哪些条件和素质？

相关的话题

  除了深度神经网络已经实现的特性以外，大脑还有哪些特性是值得机器学习领域借鉴的？
  为什么在SGD中使用L1正则化很难获得稀疏性？
  国内外有哪些做小样本学习(Few-Shot Learning)的优秀团队？
  机器学习中macro-F1的计算公式？
  如何直观地解释 backpropagation 算法？
  TensorFlow 有哪些令人难以接受的地方？
  超越人类的人工智能 (AI) 是否能够实现？
  如何进行图像模糊与清晰的分类？
  adversarial training为什么会起作用？
  神经网络中如果一个重要特征C等于特征A+特征B（算数意义上的相加），选特征的时候还有必要选特征C吗?
  2017年1月18日Facebook发行的PyTorch相比TensorFlow、MXNet有何优势？
  物理专业的学生如何看待机器学习和大数据这些方向呢？
  为什么相比于计算机视觉(cv)，自然语言处理(nlp)领域的发展要缓慢？
  应该选择TensorFlow还是Theano？
  如何评价1700亿参数的GPT-3？
  如何看待FAIR提出的8-bit optimizer：效果和32-bit optimizer相当？
  有什么深度学习数学基础书推荐？
  编程达到什么水平才能编写出像caffe这样的深度学习框架？
  上学和读书有什么区别?
  什么是迁移学习 (Transfer Learning)？这个领域历史发展前景如何？
  如何评价哈工大的左旺孟老师？
  怎么选取训练神经网络时的Batch size?
  计算机视觉中，目前有哪些经典的目标跟踪算法？
  贝叶斯深度学习是什么，和传统神经网络有何不同？
  无人车为什么一定要用激光雷达做，双目视觉难道不行吗？
  为什么交叉熵（cross-entropy）可以用于计算代价？
  语义网所谓的“本体”的具体例子是什么？
  阿里的TDM树深度模型为什么很少有人用，是有哪些问题吗？
  为什么有些学数学的看不惯甚至鄙视 Deep Learning？
  如何评价mixup: BEYOND EMPIRICAL RISK MINIMIZATION？

© 2025-06-07 - tinynew.org. All Rights Reserved.
© 2025-06-07 - tinynew.org. 保留所有权利