1.大量的数据增强:颜色变换,仿射变换,mosaic等;
2.增加正样本的方法,邻域匹配的思想,以前yolo系列都是单个网格产生落在该网格的目标,现在有上、下、左、右(根据中心点位置选择2个)和中间网格对该目标进行预测,正样本数量大大增加,所以整体训练收敛比较快;
3.形状shape对正样本选择;
4.邻域匹配的思想改变了xy的编解码,正样本选择的基础上改变了wh的编解码,原来是e指数乘anchor,现在是sigmoid乘上anchor;
5.loss方面:obj loss,giou / ciou loss,不同特征图上的iou loss权重大小,focal loss等;
6.训练方面:ema,warmup,余弦学习率衰减,超参搜索等;
7.网络结构方面等。