首页

为什么yolov5从零开始训练（不在ImageNet上预训练）能够达到如此高的性能？第1页

1

na-tiao-mei-you-ren-de-jie 网友的相关建议:

1.大量的数据增强：颜色变换，仿射变换，mosaic等；

2.增加正样本的方法，邻域匹配的思想，以前yolo系列都是单个网格产生落在该网格的目标，现在有上、下、左、右（根据中心点位置选择2个）和中间网格对该目标进行预测，正样本数量大大增加，所以整体训练收敛比较快；

3.形状shape对正样本选择；

4.邻域匹配的思想改变了xy的编解码，正样本选择的基础上改变了wh的编解码，原来是e指数乘anchor，现在是sigmoid乘上anchor；

5.loss方面：obj loss，giou / ciou loss，不同特征图上的iou loss权重大小，focal loss等；

6.训练方面：ema，warmup，余弦学习率衰减，超参搜索等；

7.网络结构方面等。

为什么yolov5从零开始训练（不在ImageNet上预训练）能够达到如此高的性能？的其他答案点击这里

1

相关话题

  国内外有哪些做小样本学习(Few-Shot Learning)的优秀团队？
  为什么学习深度学习感觉无法入门？
  如何系统学习机器学习？
  深度学习中，模型大了好还是小了好呢？
  为什么softmax很少会出现[0.5，0.5]？
  要研究深度学习的可解释性（Interpretability），应从哪几个方面着手？
  实体提取任务中使用BERT-CRF时，CRF根据数据统计可以得到转移概率，为啥还要训练呢？
  有哪些可以自学机器学习、深度学习、人工智能的网站？
  Transformer是如何处理可变长度数据的？
  有哪些比较好的元学习（meta learning）领域的学习资源？

前一个讨论

为什么很多年轻人不愿意回家过年？「过年焦虑」究竟在焦虑什么？

下一个讨论

为什么图形学的会议siggraph的论文代码很少会开源？好像视觉如CVPR、ICCV开源的更多一些。

相关的话题

  如何评价 DeepMind 发表在 Nature 上的使用深度强化学习对托卡马克等离子体进行磁控制？
  深度学习（机器学习）的下一步如何发展？
  scikit-learn, tensorflow, pytorch真的只需要查下API，不需要学吗?
  adversarial training为什么会起作用？
  深度学习的多个loss如何平衡？
  计算机视觉（cv）方向今年招聘情况怎么样?是否已经人才过剩?
  基于深度卷积神经网络进行人脸识别的原理是什么？
  TensorFlow的自动求导具体是在哪部分代码里实现的？
  大牛Bengio 团队最新的研究和我自己之前的研究成果重复了，应该怎么办？
  pytorch 分布式计算你们都遇到过哪些坑/bug？
  如果有第谷的数据，现在的机器学习，深度学习有办法学出开普勒三定律吗？
  为什么在SGD中使用L1正则化很难获得稀疏性？
  如何评价MXNet发布的1.0版本？
  有哪些令你印象深刻的魔改transformer？
  目标检测算法中Two-stage算法速度慢,到底在哪里?
  2020年，多标签学习（multi-label）有了哪些新的进展？
  神经网络中的能量函数是如何定义的？
  深度学习在无人驾驶汽车上面的运用有哪些？
  研一刚入学，从未接触过神经网络，python也是才开始学，现在导师要我做LSTM，我应该去学什么？
  PyTorch中在反向传播前为什么要手动将梯度清零？
  机器学习能否用于综合评价？具体怎么操作？
  有没有根据一张人物的立绘正面像，自动生成同风格各侧面角度像并自动衍生表情的软件啊？
  深度学习cnn中，怎么理解图像进行池化（pooling）后的平移不变性？
  视觉Transformer如何优雅地避开位置编码？
  如何评价李飞飞和李佳加盟谷歌？
  全连接层的作用是什么？
  神经网络中的能量函数是如何定义的？
  GAN:固定训练好的判别器网络，去指导训练生成器为什么不可以？
  2019年，计算机视觉领域，你推荐哪些综述性的文章？
  2020年，多标签学习（multi-label）有了哪些新的进展？

© 2025-06-26 - tinynew.org. All Rights Reserved.
© 2025-06-26 - tinynew.org. 保留所有权利