百科问答小站 logo
百科问答小站 font logo



为什么CV能做到让一幅人脸图动了笑了,而NLP的text-style-transfer进展貌似一般? 第1页

  

user avatar   shaohuali 网友的相关建议: 
      

因为脸的复杂度很低。虽然人们可以感到脸的各种微妙差异,但其实是因为人脑里有专门的脸部识别区 [1-2],放大了实际图像里的variations。实际上人脸图像是可以用一个低维manifold表示的,所以StyleGAN之类模型可以把人脸表示得很好。而nlp是高度非线性,语义很diverse,每个段落都很specific,所以语料里可以直接transfer的语义比较稀疏,导致style transfer很难做。

[1] m.guokr.com/article/441

[2]


user avatar   xie-ling-xi 网友的相关建议: 
      

女王:求求题主放过我,我可不敢有什么政绩。。。




  

相关话题

  深度学习有哪些好玩的案例? 
  你实践中学到的最重要的机器学习经验是什么? 
  如何评价 CVPR2022 的审稿结果和录取情况? 
  多因子模型是否真的可以带来阿尔法(alpha)? 
  机器学习专家与统计学家观点上有哪些不同? 
  2021年深度学习哪些方向比较新颖,处于上升期或者朝阳阶段,没那么饱和,比较有研究潜力? 
  Word2vec 翻译到另一种语言,其向量空间之间的映射会不会是线性的? 
  实体提取任务中使用BERT-CRF时,CRF根据数据统计可以得到转移概率,为啥还要训练呢? 
  有哪些比较好的机器学习,深度学习的网络资源可利用? 
  deepmind发表的neural processes(神经过程),这个是怎么实现的呢? 

前一个讨论
理论研究、基础研究、应用研究的区别在哪?理论和应用能明白,基础到底是什么概念?
下一个讨论
男朋友跟我说不想出彩礼怎么办?





© 2025-03-23 - tinynew.org. All Rights Reserved.
© 2025-03-23 - tinynew.org. 保留所有权利