首页

神经网络，分类和回归问题，在网络结构上的区别是什么？分类比回归多一层softmax吗？诚心求教？第1页

1

huo-hua-de-41 网友的相关建议:

感觉现在已有的回答还没说到点上。例如，0-1的回归，我把0-1分成100个bin，每0.01当作一个类，然后用变成100类的分类任务，是不是就只是精度差异呢？进一步可以衍生几个问题：

为什么回归任务常使用mse作为损失函数？
为什么分类任务常用交叉熵作为损失函数?

首先，我们要知道，使用特定损失函数的前提是我们对标签的分布进行了某种假设。

二分类问题的常见假设就是标签服从伯努利分布，多分类问题背后的假设是多项分布（Multinomial Distribution）。根据数据分布，结合最大似然估计，就可以推导出交叉墒的公式。

同样的，回归问题背后的假设是标签服从正态分布，这时候根据数据分布，结合最大似然估计，就可以推导出mse的公式。

然后实际问题中，我们遇到的标签不一定真的服从正态分布。根据样本分布不同，大家还提出了tweedie loss、possion loss等损失函数替代mse。我说这么多，只是抛砖引玉，详细的推到大家可以看看 @马东什么的文章

神经网络，分类和回归问题，在网络结构上的区别是什么？分类比回归多一层softmax吗？诚心求教？的其他答案点击这里

1

相关话题

  普通FPGA工程师怎样向人工智能靠拢？
  普通程序员如何正确学习人工智能方向的知识？
  未来 3~5 年内，哪个方向的机器学习人才最紧缺？
  机器学习小白来提问：关于联邦学习FedAVG和FedSGD的问题？
  在Lasso中，oracle property指的是什么性质？
  时间序列和回归分析有什么本质区别？
  为什么做机器学习的很少使用假设检验？
  如何用一句话证明自然语言处理很难？
  如何看待周志华等人的新书《机器学习理论导引》？
  神经网络中的能量函数是如何定义的？

前一个讨论

python中[[3,5],[2,3]]怎么转化为[['3','5'],['2','3']]？

下一个讨论

对于智力和勤奋程度都一般的人来说，博士毕业有多难？

相关的话题

  到了 2022 年，人工智能有哪些真正可落地的应用？
  普通程序员如何正确学习人工智能方向的知识？
  除了深度学习，机器学习领域近年来还有什么热点吗？
  如何评价 MSRA 视觉组最新提出的 Deformable ConvNets V2？
  为什么现在的CNN模型都是在GoogleNet、VGGNet或者AlexNet上调整的？
  你见过最差的算法工程师能差到什么程度？
  ICML2020有哪些值得关注的工作?
  因果推断（causal inference）是回归（regression）问题的一种特例吗？
  请问人工神经网络中的activation function的作用具体是什么？为什么ReLu要好过于tanh和sigmoid function?
  Evidential deep learning里一般怎么估计多标签分类的Uncertainty？
  机器学习中macro-F1的计算公式？
  Deep Learning 的专家如此急缺，它难在何处？
  有哪些贝叶斯推理入门的书籍？
  attention跟一维卷积的区别是啥？
  机器学习里面的流形都是怎么用的？
  如何看待字节跳动 AI 实验室总监李磊入职 UCSB？
  如何评价 MXNet 被 Amazon AWS 选为官方深度学习平台？
  神经网络为什么可以（理论上）拟合任何函数？
  AI（或者说神经网络/深度学习）能够实现科学（尤其是物理学）研究中提出假设这一步嘛？
  人工智能在发展到极高的程度之后能否算得上是一种生命？
  为什么计算机科学专业背景的人喜欢黑机器学习？
  Dirichlet Processes 是一个什么样的随机过程？
  对神经网络某一层做了小改进，效果却提升显著，可以发论文吗？
  如何评价陈天奇团队新开源的TVM？
  如果人工智能迎来下一个寒冬，你认为会是卡在什么问题上？
  二次型的意义是什么？有什么应用？
  去美国读CS博士，方向是机器人导航，视觉方面，推荐一下相关编程方面准备？还有相关算法需要学习哪些？
  你见过哪些“人工智障”?
  27岁了跨考计算机研究生会不会太晚？
  老师给了一个神经网络的程序，他之前是跑通了的，但是我迭代几十次或者一百多次就报错。这个怎么解决?

© 2025-06-27 - tinynew.org. All Rights Reserved.
© 2025-06-27 - tinynew.org. 保留所有权利