百科问答小站 logo
百科问答小站 font logo



为什么yolov5从零开始训练(不在ImageNet上预训练)能够达到如此高的性能? 第1页

  

user avatar   na-tiao-mei-you-ren-de-jie 网友的相关建议: 
      

1.大量的数据增强:颜色变换,仿射变换,mosaic等;

2.增加正样本的方法,邻域匹配的思想,以前yolo系列都是单个网格产生落在该网格的目标,现在有上、下、左、右(根据中心点位置选择2个)和中间网格对该目标进行预测,正样本数量大大增加,所以整体训练收敛比较快;

3.形状shape对正样本选择;

4.邻域匹配的思想改变了xy的编解码,正样本选择的基础上改变了wh的编解码,原来是e指数乘anchor,现在是sigmoid乘上anchor;

5.loss方面:obj loss,giou / ciou loss,不同特征图上的iou loss权重大小,focal loss等;

6.训练方面:ema,warmup,余弦学习率衰减,超参搜索等;

7.网络结构方面等。




  

相关话题

  2021年了,如何评价微软亚研提出的对偶学习(Dual Learning)? 
  计算商品embedding然后平均得到用户embedding,会不会存在这种问题? 
  AMD 开源高性能机器智能库MIopen是否可以和cuDNN抗衡? 
  练完胸,第二天练肩不可取吗。(听说)那么关于部位训练顺序有哪些建议,怎么安排,有什么要注意的。? 
  如何看待timm作者发布ResNet新基准:ResNet50提至80.4,这对后续研究会带来哪些影响? 
  百度学术能否替代 Google 学术网站?有没有其他选择? 
  有谁照着论文把 AlphaGo 重现出来了? 
  深度学习到底是「实验科学」还是「理论科学」?能否称为「算法」? 
  了解/从事机器学习/深度学习系统相关的研究需要什么样的知识结构? 
  为什么现在的CNN模型都是在GoogleNet、VGGNet或者AlexNet上调整的? 

前一个讨论
为什么很多年轻人不愿意回家过年?「过年焦虑」究竟在焦虑什么?
下一个讨论
为什么图形学的会议siggraph的论文代码很少会开源?好像视觉如CVPR、ICCV开源的更多一些。





© 2025-03-04 - tinynew.org. All Rights Reserved.
© 2025-03-04 - tinynew.org. 保留所有权利