百科问答小站 logo
百科问答小站 font logo



为什么CV能做到让一幅人脸图动了笑了,而NLP的text-style-transfer进展貌似一般? 第1页

  

user avatar   shaohuali 网友的相关建议: 
      

因为脸的复杂度很低。虽然人们可以感到脸的各种微妙差异,但其实是因为人脑里有专门的脸部识别区 [1-2],放大了实际图像里的variations。实际上人脸图像是可以用一个低维manifold表示的,所以StyleGAN之类模型可以把人脸表示得很好。而nlp是高度非线性,语义很diverse,每个段落都很specific,所以语料里可以直接transfer的语义比较稀疏,导致style transfer很难做。

[1] m.guokr.com/article/441

[2]


user avatar   xie-ling-xi 网友的相关建议: 
      

女王:求求题主放过我,我可不敢有什么政绩。。。




  

相关话题

  为什么图形学的会议siggraph的论文代码很少会开源?好像视觉如CVPR、ICCV开源的更多一些。 
  学习机器学习应该看哪些书籍? 
  如何激怒一位人工智能(机器学习、深度学习、强化学习等)爱好者? 
  预训练模型的训练任务在 MLM 之外还有哪些有效方式? 
  你见过最差的算法工程师能差到什么程度? 
  如何看待KDD'21的文章,异质图神经网络的效果不如简单的GCN、GAT? 
  GAN的生成器是怎么产生图片的? 
  老师给了一个神经网络的程序,他之前是跑通了的,但是我迭代几十次或者一百多次就报错。这个怎么解决? 
  NLP文本分类的本质是不是其实是找相似,对于要分类的句子,在训练集里找最相似的句子? 
  怎样计算两个服从高斯分布的向量乘积的期望? 

前一个讨论
理论研究、基础研究、应用研究的区别在哪?理论和应用能明白,基础到底是什么概念?
下一个讨论
男朋友跟我说不想出彩礼怎么办?





© 2025-02-22 - tinynew.org. All Rights Reserved.
© 2025-02-22 - tinynew.org. 保留所有权利