首页

在计算机视觉任务中，运用Transformer和Non-local有何本质区别？第1页

1

shaohuali 网友的相关建议:

3年后再看non-local NN，原来 non-local block = transformer layer (single head) - FFN - positional encoding啊！

[1] 证明了FFN(即MLP)的重要性。这可能解释了为什么几层Non-local layer叠起来提升不大。我自己的实验证明positional encoding对分割任务是有提升的。另外很多transformer for cv的paper都证明multi head表现的比single head更好。

[1] Attention is Not All You Need: Pure Attention Loses Rank Doubly Exponentially with Depth. arXiv:2103.03404.

ai-hardcore 网友的相关建议:

女王:求求题主放过我，我可不敢有什么政绩。。。

在计算机视觉任务中，运用Transformer和Non-local有何本质区别？的其他答案点击这里

1

相关话题

  机器视觉为什么不用手机的镜头，而要用那么大的工业相机？
  如何看待Meta（恺明）最新论文ViTDet：只用ViT做backbone（不使用FPN）的检测模型？
  如何评价李飞飞和李佳加盟谷歌？
  如何评价 MSRA 最新的 Deformable Convolutional Networks？
  为什么计算注意力机制的时候不加偏置项？
  如何评价mixup: BEYOND EMPIRICAL RISK MINIMIZATION？
  计算机视觉顶尖期刊和会议有哪些？
  为什么这么多 NLP 大牛硕士毕业去企业不留在学术界？
  如何评价Google最新提出的gMLP：MLP模型在CV和NLP任务上均取得较好的效果？
  国内有哪些不错的CV(计算机视觉)团队?

前一个讨论

如果你是《了不起的盖茨比》中的盖茨比，且深爱着黛西，会如何优雅地追回她？

下一个讨论

电脑怎样执行编程语言的？

相关的话题

  如何看待马毅教授在国内评不上杰青？
  如何评价 MSRA 最新的 Deformable Convolutional Networks？
  大三电子类专业要分流，大家能给个建议吗?
  AAAI 2022有哪些值得关注的方向？
  Transformer中的Mask矩阵已经有顺序了，能去掉position embedding吗?
  为什么现在很多人不看好商汤科技？
  为什么Transformer要用LayerNorm？
  为什么图形学的会议siggraph的论文代码很少会开源？好像视觉如CVPR、ICCV开源的更多一些。
  如何评价何恺明、Ross Girshick组的自监督时空表征学习新作？
  为什么ViT里的image patch要设计成不重叠？
  一张图片怎么用matlab 把颜色反相，就是红的部分变成绿的，蓝的部分变成黄的？
  为什么CV能做到让一幅人脸图动了笑了，而NLP的text-style-transfer进展貌似一般？
  为什么nlp没有像cv四小龙一样的创业公司？
  视觉算法的工业部署及落地方面的技术知识，怎么学？
  2020年，多标签学习（multi-label）有了哪些新的进展？
  如何理解Inductive bias？
  如何评价谷歌提出的 Pix2Seq：将目标检测看成语言建模，效果超过 DETR？
  如何看待Meta（恺明）最新论文ViTDet：只用ViT做backbone（不使用FPN）的检测模型？
  有没有一些图像处理新手可以练习的项目？
  如何评价微软提出的无监督视觉模型BEiT：ImageNet达到88.6，ADE20K达到57.0？
  如何评价谷歌推出1.6万亿参数超级语言模型Switch Transformer？
  如何评价VOLO: Vision Outlooker for Visual Recognition？
  假如我穿越到2017年第一个提出了Transformer、BERT等模型，我可以保送到清华北大吗？
  如何评价 Kaiming 团队新作 Masked Autoencoders (MAE)？
  如何评价MSRA视觉组最新对spatial attention mechanism分析论文？
  如何评价谷歌用30亿数据训练的20亿参数ViT-G/14模型在 ImageNet 达到新的 SOTA？
  为什么Transformer适合做多模态任务？
  CVPR 2019 有哪些值得关注的亮点？
  坐标日本，计算机视觉专攻。有英文交流氛围浓厚的研究室推荐吗？
  如何评价Google最新提出的gMLP：MLP模型在CV和NLP任务上均取得较好的效果？

© 2025-06-14 - tinynew.org. All Rights Reserved.
© 2025-06-14 - tinynew.org. 保留所有权利