首页

transformer中的Q,K,V到底是什么？第1页

1

zhaomingming0617 网友的相关建议:

Q:查询向量
K:表示被查询信息与其他信息的相关性的向量
V:表示被查询信息的向量

输入向量为：x， 1xm向量

       Q  = x * Wq K  = x * Wk V  = x * Wv  x对应信息V的注意力权重 与 Q*K.tranpose 成正比 等于说：x的注意力权重，由x自己来决定，所以叫自注意力。 Wq,Wk,Wv会根据任务目标更新变化，保证了自注意力机制的效果。  以下是点乘自注意力机制的公式

llllllllllll-6 网友的相关建议:

哈哈，突然想到了一个很形象的解释方法：

你有一个问题Q，然后去搜索引擎里面搜，搜索引擎里面有好多文章，每个文章V有一个能代表其正文内容的标题K，然后搜索引擎用你的问题Q和那些文章V的标题K进行一个匹配，看看相关度（QK --->attention值），然后你想用这些检索到的不同相关度的文章V来表示你的问题，就用这些相关度将检索的文章V做一个加权和，那么你就得到了一个新的Q'，这个Q'融合了相关性强的文章V更多信息，而融合了相关性弱的文章V较少的信息。这就是注意力机制，注意力度不同，重点关注（权值大）与你想要的东西相关性强的部分，稍微关注（权值小）相关性弱的部分。

transformer中的Q,K,V到底是什么？的其他答案点击这里

1

相关话题

  如何评价余凯在朋友圈发表呼吁大家用 caffe、mxnet 等框架，避免使用 TensorFlow？
  pytorch 分布式计算你们都遇到过哪些坑/bug？
  如何看待谷歌公开 tensorflow 专用处理器 TPU?
  如何计算CNN中batch normalization的计算复杂度（FLOPs）？
  Bert中的词向量各向异性具体什么意思啊？
  神经网络中，bias有什么用，为什么要设置bias，当加权和大于某值时，激活才有意义？
  如何评价最近火热的对比学习，会引领预训练模型新的范式嘛?
  为什么相比于计算机视觉(cv)，自然语言处理(nlp)领域的发展要缓慢？
  卷积神经网络如果将池化层去除，与神经网络的区别还大么？
  NLP 中 prompt learning 有哪些可能的天生缺陷？目前有什么样的方法来解决这样的缺陷？

前一个讨论

国家自然科学基金青年基金（2020）有那么难拿吗？

下一个讨论

想自学编程怎样下手？

相关的话题

  ICLR 2022有哪些值得关注的投稿？
  2021年，作为算法工程师的你们会在CV业务落地上用Transformer吗？
  为什么Transformer要用LayerNorm？
  面试官如何判断面试者的机器学习水平？
  深度学习领域，你心目中 idea 最惊艳的论文是哪篇？
  硕士方向，选择迁移学习还是自然语言处理？
  深度学习应用在哪些领域让你觉得「我去，这也能行！」？
  如何评价 NVIDIA 发布的 DGX-1？
  transformer中的Q,K,V到底是什么？
  2018年了，MXNet 发展的如何了？
  写深度学习代码是先写model还是dataset还是train呢，有个一般化的顺序吗？
  怎么选取训练神经网络时的Batch size?
  如何看待Transformer在CV上的应用前景，未来有可能替代CNN吗？
  有哪些人工智能上的事实，没有一定人工智能知识的人不会相信？
  如何看待华为 4 月 25 日发布的盘古智能大模型？在这个行业处于什么水平？
  为什么 BERT 的 intermediate_size 这么大？
  2021年，作为算法工程师的你们会在CV业务落地上用Transformer吗？
  如何评价微软亚研院提出的把 Transformer 提升到了 1000 层的 DeepNet？
  神经网络中的能量函数是如何定义的？
  如何比较Keras, TensorLayer, TFLearn ？
  如何理解 Swin Transformer 和 Vision Transformer不同任务上的差异？
  如何解读 Jeff Dean 等联合在 arXiv 上发布的用深度学习分析电子病历的论文？
  TVM 最新发布版本 0.3 有哪些亮点？
  石头和塑料袋对于计算机传感器的差别在于什么？为什么无人驾驶系统会依然存在对周围环境的误判？
  中国和美国谁能成人工智能领域的领军者？
  有哪些令你印象深刻的魔改transformer？
  在中文 NLP 等论文中，应该如何翻译 token 这个词？
  如何评价MSRA视觉组最新对spatial attention mechanism分析论文？
  百度学术能否替代 Google 学术网站？有没有其他选择？
  当前人工智能特别是深度学习最前沿的研究方向是什么？

© 2025-06-05 - tinynew.org. All Rights Reserved.
© 2025-06-05 - tinynew.org. 保留所有权利