首页

如何评价 NVIDIA 发布的 DGX-1？第1页

1

mli65 网友的相关建议:

分享下实际使用体验，主要针对深度学习。

DGX-1主要卖点是两个，p100和nvlink。

P100性能类似Pascal Titan X。跟Tesla前面系列比基本是 1 P100 ~= 2 M40 ~= 4 K40。在常见CNNs上具体性能可以参见

Performance - mxnet 0.7.0 documentation

NVLink号称提供三倍PCIe 16x的带宽，实测下来确实带宽有显著提升。不过比较纠结的是，DGX-1的GPU连接比较复杂，具体可以参考nvida blog的这张图

首先一块卡只能直接跟另三块卡通讯。要想跟更远的卡通讯，需要要么通过另外一块GPU，要么通过PCIe走CPU。目前CUDA 8似乎是默认走CPU。PCIe一个switch连2块GPU和一块CPU，外加一个IB接口。所以左上角GPU要跟右下角GPU通讯，那么就是

GPU <-> PCIe <-> QPI <-> PCIe <-> GPU

不管是latency还是bandwidth自然都是很差。综合下来，8卡的all-to-all通讯，我们发现DGX-1跟纯PCIe的EC2 P2.8xlarge差不多。

在DGX1比较好的做法应该是通过中间GPU来转，这样可以全走nvlink，但这样编程会稍微复杂点。

总结下是P100单卡性能符合预期，NVLINK用得好会不错，但需要额外针对性的优化。但考虑到其价格，仅推荐土豪用户购买。

个人推荐：小厂和个人用户推荐Pascal Titan X，大厂推荐PCIe based P100。

另外，Pascal下一代Volta据说也不远了，至少又是2倍的性能提升。真是一个幸运和不幸的时代。

如何评价 NVIDIA 发布的 DGX-1？的其他答案点击这里

1

相关话题

  为什么ViT里的image patch要设计成不重叠？
  如何评价 NVIDIA GeForce RTX 2060 ？
  TVM 最新发布版本 0.3 有哪些亮点？
  如何看待华为 4 月 25 日发布的盘古智能大模型？在这个行业处于什么水平？
  人工智能相关的岗位薪酬状况如何？
  2020到2021年小样本学习取得重大进展了吗？
  Google 的神经网络生成图像 (Inceptionism) 是怎么做到的？
  如何看待华为 4 月 25 日发布的盘古智能大模型？在这个行业处于什么水平？
  多任务学习中loss多次backward和loss加和后backward有区别吗？
  你有哪些deep learning（rnn、cnn）调参的经验？

前一个讨论

做底层 AI 框架和做上层 AI 应用，哪个对自己的学术水平（或综合能力）促进更大？

下一个讨论

如何看待Jeff Dean&Hinton投到ICLR17的MoE的工作？

相关的话题

  如何看待NVIDIA 即将开源的DLA？
  英伟达表示「RTX 30 系列和 40 系显卡将同时共存以确保供应稳定」，有何信息值得关注？
  编程达到什么水平才能编写出像caffe这样的深度学习框架？
  为什么我认为AMD的显卡比不过同时期NVIDIA的显卡？
  实体提取任务中使用BERT-CRF时，CRF根据数据统计可以得到转移概率，为啥还要训练呢？
  简单解释一下sparse autoencoder, sparse coding和restricted boltzmann machine的关系？
  ICLR 2021 有什么值得关注的投稿？
  adversarial training为什么会起作用？
  阿里的TDM树深度模型为什么很少有人用，是有哪些问题吗？
  如何看待 TI7 上与 Dendi solo 的 OpenAI？
  2021 年了，机器/深度学习还有哪些坑比较好挖？
  如何看待百度无人车，三千多个场景，一万多个if？
  如何看待 NVIDIA 470.05 版本驱动疑似解除限制 RTX 3060 挖矿？
  A卡和N卡的架构有什么区别？
  如何看待 Richard Sutton 说的「人工智能中利用算力才是王道」？
  如何看待 2019 年 1 月 10 日发布的 Radeon Ⅶ ？
  为什么说大模型训练很难？
  如何评价Deepmind自监督新作BYOL？
  如何看待Capsule Network在NLP领域的潜力？
  现在入手3080ti是否值得？
  5700显卡和2060super显卡差距有多大？
  如何看待Capsule Network在NLP领域的潜力？
  如何评价戴尔最新上市的灵越16 Plus，搭载11代处理器和 RTX30系显卡，是否值得入手？
  Evidential deep learning里一般怎么估计多标签分类的Uncertainty？
  请问，如何查看GPU的计算能力？
  为什么英伟达和超威半导体（AMD）已经实质垄断显卡市场，但国内玩家却没有说他们垄断？
  目前有哪些比较成功的人工智能应用？
  为什么ITX架构的短显卡大部分都是Nvidia的，而AMD的高端ITX显卡则一卡难求？
  应届硕士毕业生如何拿到知名互联网公司算法岗（机器学习、数据挖掘、深度学习） offer？
  使用pytorch时，训练集数据太多达到上千万张，Dataloader加载很慢怎么办?

© 2025-06-26 - tinynew.org. All Rights Reserved.
© 2025-06-26 - tinynew.org. 保留所有权利