首页

为啥gan里面几乎不用pooling？第1页

1

GordonQian 网友的相关建议:

谈一下自己的理解。

ICLR16的DCGAN（https://arxiv.org/pdf/1511.06434.pdf）文章，里面的实验表明：全卷积网络训练更稳定。

这个是有时代背景的，GAN（https://papers.nips.cc/paper/5423-generative-adversarial-nets.pdf） 14年刚被提出来的时候，loss function是有log函数的，这个log函数其实是个小bug，导致网络难以训练。详情点击【令人拍案叫绝的Wasserstein GAN】（https://zhuanlan.zhihu.com/p/25071913）

因此14年未来两年的文章有许多是攻克GAN的训练难度问题。 DCGAN是其中之一。不过，自从ICML17的WGAN（https://arxiv.org/abs/1701.07875）被提出后，很大程度上解决了GAN的训练稳定性问题。

WGAN之后，也出现了许多影响力比较高的文章，并非用的全卷积网络，因为训练GAN并不是多大的问题了。比如ICLR18 Progressive Growing of GANs for Improved Quality, Stability, and Variation （https://arxiv.org/abs/1710.10196）（引用近1000，被认为第一篇具有高质量输出的GAN）就在D网络中用了average pooling. 再比如deep mind的bibiggan系列也并非是全卷积。

最近arxiv上也有文章指出，全卷积网络并不是最好的选择。FCCGAN（https://arxiv.org/pdf/1905.02417.pdf）还没看 ‍: )

为啥gan里面几乎不用pooling？的其他答案点击这里

1

相关话题

  计算机视觉（CV）的算法有哪些，具体都有哪些特点？
  如何评价微软亚洲研究院提出的LightRNN？
  视觉算法的工业部署及落地方面的技术知识，怎么学？
  深度学习底层开发对数学有哪些要求？
  为什么最近几年 FPGA 变得越发受大家重视了？
  深度学习应用在哪些领域让你觉得「我去，这也能行！」？
  现在tensorflow和mxnet很火，是否还有必要学习scikit-learn等框架？
  主动学习（Active Learning）近几年的研究有哪些进展，现在有哪些代表性成果？
  如何解决测试中充斥着大量训练集中没见过的样本类型模型将其识别成非我族类仍然保持测试集的高精度？
  如何看待指出神经网络的训练罪魁祸首是退化一文？

前一个讨论

如何评价 TGA 2019 年度游戏提名名单？

下一个讨论

随着各个领域越来越多的人都开始学习编程，计算机专业的人优势在哪里?

相关的话题

  百度学术能否替代 Google 学术网站？有没有其他选择？
  Python 如何画出漂亮的地图？
  凸分析和凸优化有什么推荐的教材吗？
  ICML2020有哪些值得关注的工作?
  为什么都说神经网络是个黑箱？
  为什么Bert中的CLS在未fine tune时作为sentence embedding性能非常糟糕？
  深度学习（机器学习）的下一步如何发展？
  为什么 sin(x²)+sin(y²)=1 的图像这么复杂？
  为什么都说神经网络是个黑箱？
  神经网络训练多个epoch，写论文的时候可以取最好的效果那一个epoch作为结果吗？
  目前有哪些比较成功的人工智能应用？
  神经网络为什么可以（理论上）拟合任何函数？
  如何评价谷歌推出1.6万亿参数超级语言模型Switch Transformer？
  在NLP当中，不同的评价指标，BLEU, METEOR, ROUGE和CIDEr的逻辑意义？
  2019年NeurIPS有哪些糟糕的论文？
  如何看待谷歌研究人员提出的卷积正则化方法「DropBlock」？
  深度学习中Attention与全连接层的区别何在？
  27岁了跨考计算机研究生会不会太晚？
  为什么有的论文放出训练好的模型和测试脚本，但不开源训练代码？
  如何看待Geoffrey Hinton的言论，深度学习要另起炉灶，彻底抛弃反向传播？
  如何看待 NIPS 2018 submission达到近 5000 篇？
  在算力充沛，深度学习模型大行其道的今天，传统机器学习的未来在哪里？
  人工「神经网络」技术在信息处理上有何特点，工作原理是什么？
  如何评价沐神他们写的《动手学深度学习》这本书？
  有哪些看了让你醍醐灌顶的书籍、论文、期刊，使你对如何做数据挖掘、特征工程、统计挖掘有了眉目？
  机器学习（machine learning）在经济学领域是否有应用前景？
  自监督学习（Self-supervised Learning）有什么比较新的思路？
  如何证明马尔科夫链一定会达到稳态？
  为什么要压缩模型，而不是直接训练一个小的CNN？
  有哪些有趣的图形学(CG)和计算机视觉(CV)相结合的应用的例子？

© 2025-06-24 - tinynew.org. All Rights Reserved.
© 2025-06-24 - tinynew.org. 保留所有权利