首页

如何计算CNN中batch normalization的计算复杂度（FLOPs）？第1页

1

quarrying 网友的相关建议:

下面分析在推理 (或者说测试) 时 BN 层的计算量:

设是BN层的输入, 其尺寸为 ; 是BN层的moving mean, 是BN层的moving variance, 是BN层的scale, 是BN层的shift, 它们的尺寸均为 . 为了简化推导, 设 , 并令 , , , , , . 则BN层的输出的第k个通道为:

, 式中是全1矩阵(而不是单位矩阵), 是一个很小的正数, 防止除零的发生.

令 , 则 . 由于都是已知的, 和可以预先计算 (NCNN中就是这样做的^[1]), 在推理时不会占用额外的计算时间, 于是的计算量只有次乘法运算和次加法运算, 对于C个通道计算量则有次乘法运算和次加法运算. 这个计算量相对于一般卷积层的计算量是很小的. 对于一般卷积则需要次乘法运算, 次加法运算(有偏置项) 或次加法运算(无偏置项), 这些符号可以顾名思义, 这里就不赘述了, 详细的推导可以参考^[2].

另外如果网络采用Conv-BN-ReLU的设置, 则BN的参数还可以折叠 (fold) 到前面的卷积层的参数中, 这时BN的计算被包含到卷积的计算中了.

参考

如何计算CNN中batch normalization的计算复杂度（FLOPs）？的其他答案点击这里

1

相关话题

  围棋AI为什么没有下出同局？
  请问一下，机器学习领域的联邦学习技术，目前看到最多的是微众银行，国内还有哪些顶级专家及机构和大学？
  如何理解 Graph Convolutional Network（GCN）？
  有没有可能运用人工神经网络将一种编程语言的代码翻译成任意的另一种编程语言，而不经过人工设计的编译过程？
  2021年了，如何评价微软亚研提出的对偶学习（Dual Learning）？
  如何看待SIREN激活函数的提出？
  请问下大家训练 SimCSE 时, loss 有没有这样的情况?
  如何理解空洞卷积（dilated convolution）？
  计算商品embedding然后平均得到用户embedding，会不会存在这种问题？
  有哪些LSTM(Long Short Term Memory)和RNN(Recurrent)网络的教程？

前一个讨论

CPU和GPU跑深度学习差别有多大？

下一个讨论

2020年CVPR有哪些优秀的论文？

相关的话题

  如何评价 Exploring Simple Siamese Learning?
  究竟什么是损失函数 loss function?
  在CV/NLP/DL领域中，有哪些修改一行代码或者几行代码提升性能的算法？
  深度学习有哪些好玩的案例？
  如何看待 Google 既可以作 Inference，又可以作 Training 的新一代 TPU？
  有哪些深度学习效果不如传统方法的经典案例？
  如果你是面试官，你怎么去判断一个面试者的深度学习水平？
  怎样让机器有意识?
  如何评价微软机器翻译在 WMT2017 中英翻译达到「人类水平」？
  如何评价Kaiming He的Momentum Contrast for Unsupervised?
  卷积神经网络如果将池化层去除，与神经网络的区别还大么？
  如何看待Transformer在CV上的应用前景，未来有可能替代CNN吗？
  为什么机器学习解决网络安全问题总是失败?
  使用pytorch时，训练集数据太多达到上千万张，Dataloader加载很慢怎么办?
  2021年，ncnn发展的如何了？
  想问下专业人士 OpenCv会被深度学习进一步取代吗进一步取代吗？
  如何评价最新的Octave Convolution？
  为什么小模型已经可以很好地拟合数据集了，换大模型效果却要比小模型好？
  假如我穿越到2017年第一个提出了Transformer、BERT等模型，我可以保送到清华北大吗？
  如何评价AWS的图神经网络框架DGL？
  如何看待知乎的AI答主「四十二」？人工智能有可能理解生命的意义是什么吗？
  Transformer中的Mask矩阵已经有顺序了，能去掉position embedding吗?
  如何评价MSRA视觉组最新对spatial attention mechanism分析论文？
  为何感觉“知识蒸馏”这几年没有什么成果？
  在推荐系统中，如何较好的采用深度学习方法获取用户长短期兴趣？
  如何看待华为 4 月 25 日发布的盘古智能大模型？在这个行业处于什么水平？
  如何评价周志华在微博对 AlphaGo 和机器学习技术的评论？
  CVPR 2018 有什么值得关注的亮点？
  请问应该怎样去学习图像识别和深度学习？
  深度学习cnn中，怎么理解图像进行池化（pooling）后的平移不变性？

© 2025-07-02 - tinynew.org. All Rights Reserved.
© 2025-07-02 - tinynew.org. 保留所有权利