百科问答小站 logo
百科问答小站 font logo



mxnet的并行计算为什么这么牛,是什么原理? 第1页

  

user avatar   james-82 网友的相关建议: 
      

个人理解

通过执行引擎来达到计算和收发的并行,例如后向时算完某一个参数的梯度后,执行引擎会立刻提交到发送队列中开始发送,这时候其他的后向计算还在进行中。

此外发送与接收的队列有优先级,时刻保证最高优先级参数的接收与发送

上述机制保证了对于较深的网络能够达到了很好的线性加速比,不过对于浅层网络,比如只有两层lstm的 encoder decoder这种方法的并行效果欠佳。

总的来说还是灰常牛逼滴!


user avatar   mli65 网友的相关建议: 
      

简单来说是当计算开销大于通讯开销时,通过并行两者可以达到将近线性的加速。

具体可参见 Sec 4.4 和 4.5

cs.cmu.edu/~muli/mu-the

ps: 这里有新的在256块GPU上的加速,和10台机器vs单机的收敛:




详细见:

dmlc/mxnet



  

相关话题

  如何评价CVPR2019程序主席Derek Hoiem的论点:计算机视觉只是记忆,不是智能? 
  为什么Bert中的CLS在未fine tune时作为sentence embedding性能非常糟糕? 
  NLP领域,你推荐哪些综述性的文章? 
  目前,人工智能语音在说中文时的语气感觉上还比较机械,怎样使人工智能语音的语气更自然一些? 
  李航的统计学习方法,吴恩达的视频,关于机器学习的东西都看不懂是怎么回事? 
  ICLR 2018 有什么值得关注的亮点? 
  有哪些解决完之后让你拍案叫绝的算法问题? 
  使用pytorch时,训练集数据太多达到上千万张,Dataloader加载很慢怎么办? 
  硕士方向,选择迁移学习还是自然语言处理? 
  Kaggle如何入门? 

前一个讨论
如何看待Jeff Dean&Hinton投到ICLR17的MoE的工作?
下一个讨论
如何评价 MXNet 被 Amazon AWS 选为官方深度学习平台?





© 2025-03-23 - tinynew.org. All Rights Reserved.
© 2025-03-23 - tinynew.org. 保留所有权利