首页

DL/ML 模型如何部署到生产环境中？第1页

1

professor-ho 网友的相关建议:

是时候给出我的文章了，如果你使用的神经网络框架是TensorFlow，那么TensorFlow Serving是你非常好的选择。目前本人用的是TensorFlow Serving + Docker + Tornado的组合，Docker非常易于部署任何模型，而Tornado负责处理高并发请求。

详细教程请移步查看我的文章：

如果你觉得有用，请先点赞再收藏。

另外，如果你使用的是其它神经网络框架，例如caffe、pytorch，我会推荐Nvidia的TensorRT Inference Server，它支持所有模型的部署，包括TF系、ONNX系、mxnet等等，TRT会先对你的网络进行融合，合并可以同步计算的层，然后量化计算子图，让你的模型以float16、int8等精度进行推理，大大加速推理速度，而你只需要增加几行简单的代码就能实现。而且TRT Inference Server能够处理负载均衡，让你的GPU保持高利用率。

日后有机会再写一篇TRT Inference Server的教程，这里先挖个坑，大家可以保持关注。

模型部署的方式越来越简单，许多大团队已经帮在帮我们简化部署的流程，以及提高部署的性能，我们只需要学会怎么用起来，剩下的就是写一些业务逻辑了，这为我们省下了大量的时间，专注于算法的研究。

--------19.1.27更新--------

现在又写了篇Mxnet Model Server的部署教程，大家可以参考学习：

DL/ML 模型如何部署到生产环境中？的其他答案点击这里

1

相关话题

  如何评价 UCLA 朱松纯教授近日访谈中对深度学习的批评？
  如何评价 Kaiming 团队新作 Masked Autoencoders (MAE)？
  如何评价AWS的图神经网络框架DGL？
  GAN的生成器是怎么产生图片的？
  为什么 Non-Convex Optimization 受到了越来越大的关注？
  为什么多标签分类（不是多类分类）损失函数可以使用Binary Cross Entropy？
  如何理解深度学习源码里经常出现的logits？
  网络上一位长者提出了“完全不依靠人工神经网络与机器学习算法实现人工智能”的理论，大家怎么看？
  目标检测中的mAP是什么含义？
  Dirichlet Processes 是一个什么样的随机过程？

前一个讨论

SQLite 的读写效率很高，有哪些使用其他数据库的理由？

下一个讨论

如何看待《工作细胞第一季》将在2021年2月13日于CCTV-6播出？

相关的话题

  中国和美国谁能成人工智能领域的领军者？
  如何评价MXNet发布的1.0版本？
  AMD 开源高性能机器智能库MIopen是否可以和cuDNN抗衡？
  马上计算机研一，想问一下机器学习、深度学习…大家都是怎么入门的？
  如果用机器学习的理论来理解人的行为，会有什么发现？
  老师给了一个神经网络的程序，他之前是跑通了的，但是我迭代几十次或者一百多次就报错。这个怎么解决?
  计算机技术的进步与模拟运算，在未来真的可以解决磁约束核聚变技术中所有关键问题吗？
  为何总感觉人工智能和神经科学（神经网络）被绑在一起？
  在算力充沛，深度学习模型大行其道的今天，传统机器学习的未来在哪里？
  如何理解 Swin Transformer 和 Vision Transformer不同任务上的差异？
  为什么有的论文放出训练好的模型和测试脚本，但不开源训练代码？
  神经网络中 warmup 策略为什么有效；有什么理论解释么？
  为什么小模型已经可以很好地拟合数据集了，换大模型效果却要比小模型好？
  写深度学习代码是先写model还是dataset还是train呢，有个一般化的顺序吗？
  我应该从计算机视觉回到做FPGA 吗？
  为什么CV能做到让一幅人脸图动了笑了，而NLP的text-style-transfer进展貌似一般？
  视觉算法的工业部署及落地方面的技术知识，怎么学？
  是不是机器学习的框架都偏向 Python ？如果是，为什么？
  人工智能 CV 岗位是不是现在供严重大于需？
  如何看待MXNet获得amazon官方支持首位？
  对于技术岗位而言，开发岗累还是算法岗累呢？
  深度学习到底是「实验科学」还是「理论科学」？能否称为「算法」？
  广告算法工程师的核心竞争力是什么？
  国内 top2 高校研一在读，为什么感觉深度学习越学越懵?
  现代人工神经网络是不是一个死胡同？这个技术是不是骗人的？
  为什么谈论深度学习工具时，很少有人讨论matlab的神经网络工具包？
  结合深度学习的图像修复怎么实现？
  自然语言处理怎么最快入门？
  深度学习（机器学习）的下一步如何发展？
  如何看待 Nervana 被 Intel 收购？

© 2025-05-25 - tinynew.org. All Rights Reserved.
© 2025-05-25 - tinynew.org. 保留所有权利