首页

为什么CV能做到让一幅人脸图动了笑了，而NLP的text-style-transfer进展貌似一般？第1页

1

shaohuali 网友的相关建议:

因为脸的复杂度很低。虽然人们可以感到脸的各种微妙差异，但其实是因为人脑里有专门的脸部识别区 [1-2]，放大了实际图像里的variations。实际上人脸图像是可以用一个低维manifold表示的，所以StyleGAN之类模型可以把人脸表示得很好。而nlp是高度非线性，语义很diverse，每个段落都很specific，所以语料里可以直接transfer的语义比较稀疏，导致style transfer很难做。

[1] https://m.guokr.com/article/441966/

[2]

xie-ling-xi 网友的相关建议:

女王:求求题主放过我，我可不敢有什么政绩。。。

为什么CV能做到让一幅人脸图动了笑了，而NLP的text-style-transfer进展貌似一般？的其他答案点击这里

1

相关话题

  Yann LeCun、Geoffrey Hinton或Yoshua Bengio能得图灵奖吗？
  插值和拟合最根本的区别是什么？机器学习为啥用拟合？？
  如何理解attention中的Q,K,V？
  如何理解深度学习中的deconvolution networks？
  机器学习的解释模型存在嘛？
  如何看待NIPS2017图灵奖得主贝叶斯网络之父Judea Pearl讲座无人问津？
  2021年人工智能领域有哪些关键性进展和突破？
  为什么ViT里的image patch要设计成不重叠？
  有哪些有趣的图形学(CG)和计算机视觉(CV)相结合的应用的例子？
  为什么我用相同的模型，数据，超参，随机种子，在两台服务器会得到不同的结果？

前一个讨论

理论研究、基础研究、应用研究的区别在哪？理论和应用能明白，基础到底是什么概念？

下一个讨论

男朋友跟我说不想出彩礼怎么办？

相关的话题

  为什么图形学的会议siggraph的论文代码很少会开源？好像视觉如CVPR、ICCV开源的更多一些。
  你见过最差的算法工程师能差到什么程度？
  你遇见过什么当时很有潜力但是最终没有流行的深度学习算法?
  请问刘知远老师提供的网易新闻标注数据集开源吗？
  深度学习cnn中，怎么理解图像进行池化（pooling）后的平移不变性？
  如何评价 UCLA 朱松纯教授近日访谈中对深度学习的批评？
  如果用机器学习的理论来理解人的行为，会有什么发现？
  准研一，导师NLP方向，导师接下了一个项目让我跟着手工标数据，请问是不是在PUA我?
  研一，在学机器学习和深度学习，为什么感觉越学越不会，怎么解决这个问题？
  如何评价「Patches are all you need」?
  神经网络的损失函数为什么是非凸的?
  现在互联网公司还有做特征工程的工作吗？
  做底层 AI 框架和做上层 AI 应用，哪个对自己的学术水平（或综合能力）促进更大？
  NLP文本匹配问题的本质是不是对于要预测的句子，遍历候选句子从训练数据集里寻找最相似的pair？
  在中小学阶段设置人工智能相关课程对于培养人工智能人才具有哪些意义？如何推进会比较有效？
  如何评价2020年计算机视觉顶会CVPR投稿量破万的现象？
  新手如何实现个简单AutoML框架。有参考的github开源项目介绍吗？
  如何看待timm作者发布ResNet新基准：ResNet50提至80.4，这对后续研究会带来哪些影响？
  如何评价微软提出的无监督视觉模型BEiT：ImageNet达到88.6，ADE20K达到57.0？
  是不是并不是所有问题都适合用神经网络预测？
  BERT模型可以使用无监督的方法做文本相似度任务吗？
  迁移学习与fine-tuning有什么区别？
  卷积神经网络（CNN）的结构设计都有哪些思想？
  如何评价CUHK以及Yuanjun Xiong提出的Trajectory Convolution？
  是不是对于任意 n×n 大小的围棋棋盘，人类都赢不了 AlphaGo Zero 了？
  普通FPGA工程师怎样向人工智能靠拢？
  有哪些人工智能上的事实，没有一定人工智能知识的人不会相信？
  有哪些深度学习效果不如传统方法的经典案例？
  如何看待百度无人车，三千多个场景，一万多个if？
  NTIRE2017夺冠的EDSR去掉了Batch Normalization层就获得了提高为什么？

© 2025-06-15 - tinynew.org. All Rights Reserved.
© 2025-06-15 - tinynew.org. 保留所有权利