首页

特征工程中的「归一化」有什么作用？第1页

1

qinlibo_nlp 网友的相关建议:

为什么要进行归一化处理，下面从寻找最优解这个角度给出自己的看法。

例子

假定为预测房价的例子，自变量为面积，房间数两个，因变量为房价。

那么可以得到的公式为：

其中代表面积, 代表房间数变量。

首先我们祭出两张图代表数据是否均一化的最优解寻解过程。

未归一化：

归一化之后

为什么会出现上述两个图，并且它们分别代表什么意思。

我们在寻找最优解的过程也就是在使得损失函数值最小的theta1,theta2。

上述两幅图代码的是损失函数的等高线。

我们很容易看出，当数据没有归一化的时候，面积数的范围可以从0~1000，房间数的范围一般为0~10，可以看出面积数的取值范围远大于房间数。

影响

这样造成的影响就是在画损失函数的时候，

数据没有归一化的表达式，可以为：

造成图像的等高线为类似椭圆形状，最优解的寻优过程就是像下图所示：

而数据归一化之后，损失函数的表达式可以表示为：

其中变量的前面系数几乎一样，则图像的等高线为类似圆形形状，最优解的寻优过程像下图所示：

从上可以看出，数据归一化后，最优解的寻优过程明显会变得平缓，更容易正确的收敛到最优解。

这也是数据为什么要归一化的一个原因。

上面的梯度方向都应该和等高线方向，因为找不到原图，文字进行修正一下。

特征工程中的「归一化」有什么作用？的其他答案点击这里

1

相关话题

  如何评价微软亚洲研究院提出的LightRNN？
  国内 top2 高校研一在读，为什么感觉深度学习越学越懵?
  如何评价 2018 清华大学特等奖学金计算机大类（贵系、软院、姚班）无人通过一轮筛选？
  神经网络中，bias有什么用，为什么要设置bias，当加权和大于某值时，激活才有意义？
  另类数据（alternative data）在对冲基金的投资中有哪些应用？能否举例说明？
  在NLP当中，不同的评价指标，BLEU, METEOR, ROUGE和CIDEr的逻辑意义？
  pytorch 的高层库ignite怎么样？
  数据科学家 / 统计学家应该养成哪些好习惯？
  如何比较Keras, TensorLayer, TFLearn ？
  如何看待多所 985 大学开设人工智能专业？

前一个讨论

放弃保研是一种什么体验？

下一个讨论

在线教育网站（Coursera、网易云课堂、腾讯课堂等）有哪些值得推荐的 Python 课程？

相关的话题

  第七次人口普查5月份会公布数据吗？
  神经网络能否代替决策树算法？
  目前强化学习在控制领域的应用有哪些？
  数据挖掘与数据分析的主要区别是什么？
  深度学习方面还有什么Open Problem?
  能否用具体的例子解释一下 (Model-based) Structural Estimation？
  机器学习自嘲的炼丹和化学材料自嘲的炒菜有什么本质上的区别？
  word2vec有什么应用？
  如何评价 Kaiming He 在 ICCV 2017 上拿下双 Best 的 paper？
  相比于时下流行的机器学习方法（联接主义），传统的人工智能方法（符号主义）有什么独一无二的优势？
  R 和 Python (numpy scipy pandas) 用于统计学分析，哪个更好？
  CVPR 2019 有哪些值得关注的亮点？
  《长安十二时辰》里的「大案牍术」是什么？是否有可行性？
  为什么最近几年 FPGA 变得越发受大家重视了？
  如何评价今日头条这个app？
  支持向量机（SVM）是什么意思？
  如何通俗理解 beta 分布？
  R 中的哪些命令或者包让你相见恨晚？
  为什么像会计等非it行业处理数据要用excel而不是sql？
  离职的时候老板挽留，该如何拒绝？
  中美之间的军事力量差距究竟有多大？
  如何评价余凯创立的horizon robotics？
  微软小冰测颜值是否比较准？为什么？
  NIPS 2018 有什么值得关注的亮点？
  如果你是面试官，你怎么去判断一个面试者的深度学习水平？
  如何在一晚内速成概率论与数理统计？
  如何评价微软新出的自拍软件 Microsoft Selfie？
  如何进行互联网金融运营数据的分析，都有哪些方法？
  有哪些比较好的机器学习，深度学习的网络资源可利用？
  如何看待微软小冰写的诗？

© 2025-07-02 - tinynew.org. All Rights Reserved.
© 2025-07-02 - tinynew.org. 保留所有权利