首页

BERT模型可以使用无监督的方法做文本相似度任务吗？第1页

1

cai-jian-wei-47 网友的相关建议:

语义相似度的方法，一般包括：不交互的方法（query和doc各自构建embedding，再由匹配层计算相似度）、交互的方法（基于query和doc的二维相似度矩阵，构建交互的embedding，直接计算相似度）。从训练的loss或者语义相似度的效果来看，交互的方法都会比不交互的方法好。

不过工业界为了构建embedding，正常会使用第一种方法，主要是为了利用faiss或者nsg等，更方便的做大规模语义向量的检索。第二种方法，会用于精排序。

拿bert做语义相似度的任务，可以考虑以下两方面：

1）复用了预训练模型学习到外部语料的表征（直接使用开源bert模型的cls embedding计算出来的pooled output效果会比较差；主要是数据的差异性导致的，因此需要做fine-tune）。正常gpu充裕可以做一版特定领域数据的预训练模型，学习到领域数据的表征

2）在下游的语义匹配任务，做fine-tune。利用了bert模型里面的transformer结构，相比以往的lstm或者cnn模型，对文本的表征更好。

su-jian-lin-22 网友的相关建议:

女王:求求题主放过我，我可不敢有什么政绩。。。

BERT模型可以使用无监督的方法做文本相似度任务吗？的其他答案点击这里

1

相关话题

  为什么图形学的会议siggraph的论文代码很少会开源？好像视觉如CVPR、ICCV开源的更多一些。
  在中小学阶段设置人工智能相关课程对于培养人工智能人才具有哪些意义？如何推进会比较有效？
  TensorFlow 中 padding 的 SAME 和 VALID 两种方式有何异同？
  GAN的生成器是怎么产生图片的？
  对神经网络某一层做了小改进，效果却提升显著，可以发论文吗？
  5-10年后，你觉得哪些科技会让我们“遗忘”现在的生活？
  深度学习（机器学习）的下一步如何发展？
  Yann LeCun、Geoffrey Hinton或Yoshua Bengio能得图灵奖吗？
  计算机视觉是否已经进入瓶颈期？
  机器学习中非均衡数据集的处理方法？

前一个讨论

男方家境不好真的不能嫁嘛？?

下一个讨论

在优化问题里，强化学习相比启发式搜索算法有什么好处？

相关的话题

  现在的BERT等语言模型，最快训练要多久？
  普通FPGA工程师怎样向人工智能靠拢？
  如何评价2020年计算机视觉顶会CVPR投稿量破万的现象？
  深度学习中，模型大了好还是小了好呢？
  如何看待NVIDIA 即将开源的DLA？
  NLP 方向在国内清北读博还是国外？
  当前人工智能特别是深度学习最前沿的研究方向是什么？
  如何评价论文「Stochastic Training is Not Necessary ...」?
  为什么有的论文放出训练好的模型和测试脚本，但不开源训练代码？
  为什么Transformer要用LayerNorm？
  自然语言处理方向研究生好找工作吗？
  是不是并不是所有问题都适合用神经网络预测？
  AI 都学会看论文了，科研工作者会被淘汰么？
  resnet（残差网络）的F（x）究竟长什么样子？
  如何评价各种关联因素分析算法,尤其是在算法效果对比方面?
  如何评价 MSRA 视觉组最新提出的 Deformable ConvNets V2？
  有没有可能运用人工神经网络将一种编程语言的代码翻译成任意的另一种编程语言，而不经过人工设计的编译过程？
  如何评价剑桥，腾讯， DeepMind以及港大团队新作 SimCTG ?
  深度学习做股票预测靠谱吗？
  深度学习领域有哪些瓶颈？
  为什么在R语言里多用<-而不是=表示赋值？
  如何才能看得懂变分贝叶斯方法（Variational Bayesian）？
  CVPR 2018 有什么值得关注的亮点？
  人工智能可以解决人类难题吗？
  如果不按套路下棋是不是就能赢 Alpha Go 了？
  AI（或者说神经网络/深度学习）能够实现科学（尤其是物理学）研究中提出假设这一步嘛？
  机器学习包含哪些学习思想？
  计算机视觉研一，只学过Python基础，目前代码能力很差，要不要换导师，不换的话如何毕业？
  如果推出一款有「滤镜」功能的写作软件，修饰平庸的文字，会有市场吗？
  深度学习和强化学习之间的差别有多大？

© 2025-05-04 - tinynew.org. All Rights Reserved.
© 2025-05-04 - tinynew.org. 保留所有权利