首页

基于对比学习(Contrastive Learning)的文本表示模型【为什么】能学到语义【相似】度？第1页

1

gordon-lee 网友的相关建议:

更新了回答，请大家指正~

其实这是一个蛮常见的误解。模型并不懂什么叫做语义。

1.单句之间的对比学习其实只需要学到足够区分正负例之间的特征，它的loss就能降下来，其实也没有真正去捕捉整个句子的意思。

比如: 我喜欢足球和我喜欢篮球；如果这两个是负例的话，那么模型不用知道我喜欢XXX的意思，只需要知道足球和篮球是不同的东西就行。说白了，就是只需要学到一些足够区分的特征就ok。

2.模型是不是真的学到语义了？

并不是。语义就是人为定义的东西。比如：我今天去上海。和我今天去北京。

A: 从意图上看，这两个都是去某个地方，从这个意义上讲，应该被认为是相似句。

B: 但是从到达点看，这两个去的都不是一个地方，那么不应该被认为是相似句。

假如这个例子在测试集中的label是相似句。模型也认为这两个是相似的。那么模型真的就学到语义了吗？

其实可能情况是，训练集中，模型看到了这种case: 我今天吃苹果和我今天吃梨子被打上了相似句的label。模型只需要学到两个句子有较多的重叠部分，那么两个句子就是相似的，这一特征。

总之就是，当你觉得模型学到了语义时，模型没准只是恰好捕捉的特征和你想的方面一样而已。当你觉得模型没学到语义时，模型没准是从另一方面觉得他们是相似的

基于对比学习(Contrastive Learning)的文本表示模型【为什么】能学到语义【相似】度？的其他答案点击这里

1

相关话题

  PyTorch中在反向传播前为什么要手动将梯度清零？
  为什么现在有这么多人工智能无用论？
  如何评价深度学习之父Hinton发布的Capsule论文？
  如何用自然语言处理判断一句话是否符合中文口语习惯？
  注意力机制是如何学习到模型所应注意的区域的？
  如何看待NIPS2017图灵奖得主贝叶斯网络之父Judea Pearl讲座无人问津？
  机器学习中的机器是如何分辨哪些是有用的知识，哪些是没用的信息呢？
  BERT模型可以使用无监督的方法做文本相似度任务吗？
  神经网络的万能逼近定理已经发展到什么地步了？
  有什么深度学习数学基础书推荐？

前一个讨论

毕业前，要学会什么技能才算是能走出校园，融入社会？

下一个讨论

目标检测算法中Two-stage算法速度慢,到底在哪里?

相关的话题

  为什么现在不看好 CV 方向了呢?
  硕士方向，选择迁移学习还是自然语言处理？
  实验室只有1080的显卡，老师还想让发深度学习论文，也不给配置好的显卡怎么办？
  为什么最近几年 FPGA 变得越发受大家重视了？
  中科院某所研一新生，小样本学习、数据融合、强化学习、图神经网络、资源受限的计算这几个方向选哪个更好？
  神经网络为什么可以（理论上）拟合任何函数？
  如何评价陈天奇团队新开源的TVM？
  请问下大家训练 SimCSE 时, loss 有没有这样的情况?
  计算机视觉研一，只学过Python基础，目前代码能力很差，要不要换导师，不换的话如何毕业？
  Transformer是如何处理可变长度数据的？
  PyTorch中在反向传播前为什么要手动将梯度清零？
  二分类问题，应该选择sigmoid还是softmax？
  有什么深度学习数学基础书推荐？
  如何评价微软机器翻译在 WMT2017 中英翻译达到「人类水平」？
  AlphaGo 与李世石的对战会推动人类的极限还是机器学习的进步和觉醒？
  如何评价CVPR2019程序主席Derek Hoiem的论点：计算机视觉只是记忆，不是智能？
  DeepMind 研发的围棋 AI AlphaGo 是如何下棋的？
  计算流体力学（CFD）里应用注意力机制（attention）是否可行？
  不觉得最大熵原理很奇怪吗？
  有没有什么可以节省大量时间的 Deep Learning 效率神器？
  人工智能可以为人类找寻他们心目中的另一半吗?
  如何评价 MXNet 被 Amazon AWS 选为官方深度学习平台？
  如果百年后深度学习最终有了公认的数学理论作为基础，能解释实验中的各类玄学，那这个理论会长什么样子？
  如何评价最近火热的对比学习，会引领预训练模型新的范式嘛?
  为什么在SGD中使用L1正则化很难获得稀疏性？
  当前深度学习理论基础薄弱是否意味着我们应该放弃深度学习应用(计算机视觉、自然语言处理)？
  有哪些令你印象深刻的魔改transformer？
  如何评价基于游戏毁灭战士（Doom）的AI死亡竞赛大赛结果？
  如何评价 On Unifying Deep Generative Models 这篇 paper?
  pytorch dataloader数据加载占用了大部分时间，各位大佬都是怎么解决的？

© 2025-06-18 - tinynew.org. All Rights Reserved.
© 2025-06-18 - tinynew.org. 保留所有权利