百科问答小站 logo
百科问答小站 font logo



为什么deep lab v3起,输出不再接 DenseCRF了? 第1页

  

user avatar   qin-se-zai-yu-57-56 网友的相关建议: 
      

用CRF的目的在于什么,用CRF主要是为了连接图像的全局信息。

语义分割与分类不同。分类主要是识别物体,而语义分割不但要识别物体,还要找出物体的位置信息。DCNN卷积网络越深,其位置信息丢失的越严重。所以在deeplab v1/v2中用到了,全局CRF增强其位置信息。

但是在deeplabv3中,使用大采样率的3X3空洞卷积,图像边界响应无法捕捉远距离信息,会退化为1×1的卷积, 所以deeplabv3将图像级特征融合到ASPP模块中。融合图像级特征,相当于融合了其位置信息。所以就不需要最后再用CRF了(这也是楼上说的,用了CRF,其精度也增加的不多的原因)。




  

相关话题

  基于计算机视觉从一张图片重建人体的三维网格,能否获取腰围、胸围、臂长、腿长等数据? 
  有哪些人工智能上的事实,没有一定人工智能知识的人不会相信? 
  我决定进军期货市场,您有什么建议吗? 
  测试集在构造的时候需要人为控制其中应该正确的和应该错误的数据比例吗? 
  人工智能、模式识别领域最终是否会被一种本质、通用的算法主导? 
  现在人工智能的某些学派,是不是跟中医有些像? 
  如果不按套路下棋是不是就能赢 Alpha Go 了? 
  为什么最近几年 FPGA 变得越发受大家重视了? 
  Transformer中的Mask矩阵已经有顺序了,能去掉position embedding吗? 
  机器学习,数据挖掘在研究生阶段大概要学些什么? 

前一个讨论
计算机视觉中,目前有哪些经典的目标跟踪算法?
下一个讨论
如何理解压缩感知(compressive sensing)?





© 2025-05-03 - tinynew.org. All Rights Reserved.
© 2025-05-03 - tinynew.org. 保留所有权利