百科问答小站 logo
百科问答小站 font logo



大家用resnet50在imagenet上面top1最高能到多少? 第1页

  

user avatar   maxsky-5 网友的相关建议: 
      

因为大多数paper报的baseline都是100epoch+[30 60 90] step learning schedule的setting,也就是fb复现resnet时用的setting,具体见github.com/facebookarch

nas出现以后大家开始用一些更牛逼的training setting来训练自己的网络了,跑几百个epoch,cosine learning schedule,label smooth,mixup,auto augmentation等等,所以resnet50的结果也越来越高,具体可参考arxiv.org/pdf/1812.0118

后面还有distill,unlabeled data等一堆技巧,关注Quoc V. Le,你就能拥有一切。[doge]




  

相关话题

  经过足够长的时间, AlphaGo 的棋谱能收敛到一张上吗? 
  如何评价FAIR提出的ConvNeXt:CNN匹敌Swin Transformer? 
  如何解读 Jeff Dean 等联合在 arXiv 上发布的用深度学习分析电子病历的论文? 
  如何评价mixup: BEYOND EMPIRICAL RISK MINIMIZATION? 
  如何评价 CVPR2022 的审稿结果和录取情况? 
  为什么很少人用FFT加速CNN卷积层的运算? 
  是不是并不是所有问题都适合用神经网络预测? 
  如何看待Jeff Dean&Hinton投到ICLR17的MoE的工作? 
  LSTM如何来避免梯度弥散和梯度爆炸? 
  计算机图形学是否已经进入瓶颈期? 

前一个讨论
如何看待《工作细胞 第一季》将在2021年2月13日于CCTV-6播出?
下一个讨论
不婚不孕的女性会普遍比同龄已婚已育女性显得更年轻吗?





© 2025-03-31 - tinynew.org. All Rights Reserved.
© 2025-03-31 - tinynew.org. 保留所有权利