百科问答小站 logo
百科问答小站 font logo



Transformer是如何处理可变长度数据的? 第1页

  

user avatar   xpqiu 网友的相关建议: 
      

@TniL 的回答还是太复杂,见下图:)


user avatar   tylin98 网友的相关建议: 
      

女王:求求题主放过我,我可不敢有什么政绩。。。


user avatar   xuyige 网友的相关建议: 
      

女王:求求题主放过我,我可不敢有什么政绩。。。




  

相关话题

  为什么我用相同的模型,数据,超参,随机种子,在两台服务器会得到不同的结果? 
  在机器学习中,L2正则化为什么能够缓过拟合? 
  为何感觉“知识蒸馏”这几年没有什么成果? 
  NLP 方向在国内清北读博还是国外? 
  有没有什么可以节省大量时间的 Deep Learning 效率神器? 
  实验室只有1080的显卡,老师还想让发深度学习论文,也不给配置好的显卡怎么办? 
  Python中 __init__的通俗解释是什么? 
  2021年,作为算法工程师的你们会在CV业务落地上用Transformer吗? 
  你所在的研究领域里,有哪些工作的结果虽然不是造假,但是是精挑细选出来的? 
  如何看待 Richard Sutton 说的「人工智能中利用算力才是王道」? 

前一个讨论
你见过的身边生化环材转行很成功的案例有哪些(不包括本专业出国和读博)?
下一个讨论
有哪些值得推荐的《动力系统》教材或者参考书?





© 2025-03-29 - tinynew.org. All Rights Reserved.
© 2025-03-29 - tinynew.org. 保留所有权利