百科问答小站 logo
百科问答小站 font logo



大家用resnet50在imagenet上面top1最高能到多少? 第1页

  

user avatar   maxsky-5 网友的相关建议: 
      

因为大多数paper报的baseline都是100epoch+[30 60 90] step learning schedule的setting,也就是fb复现resnet时用的setting,具体见github.com/facebookarch

nas出现以后大家开始用一些更牛逼的training setting来训练自己的网络了,跑几百个epoch,cosine learning schedule,label smooth,mixup,auto augmentation等等,所以resnet50的结果也越来越高,具体可参考arxiv.org/pdf/1812.0118

后面还有distill,unlabeled data等一堆技巧,关注Quoc V. Le,你就能拥有一切。[doge]




  

相关话题

  梯度下降法的神经网络容易收敛到局部最优,为什么应用广泛? 
  为什么 larger batch size 对对比学习的影响比对监督学习的影响要大? 
  为什么谈论深度学习工具时,很少有人讨论matlab的神经网络工具包? 
  2019年CVPR有哪些糟糕的论文? 
  如何评价MXNet发布的1.0版本? 
  图片上训的模型,怎么迁移视频上呢? 
  基于深度学习的人工智能程序和传统程序的差别在哪里? 
  如何评价 CVPR2022 的审稿结果和录取情况? 
  视觉Transformer如何优雅地避开位置编码? 
  深度学习应用在哪些领域让你觉得「我去,这也能行!」? 

前一个讨论
如何看待《工作细胞 第一季》将在2021年2月13日于CCTV-6播出?
下一个讨论
不婚不孕的女性会普遍比同龄已婚已育女性显得更年轻吗?





© 2025-05-07 - tinynew.org. All Rights Reserved.
© 2025-05-07 - tinynew.org. 保留所有权利