百科问答小站 logo
百科问答小站 font logo



有哪些有趣的图形学(CG)和计算机视觉(CV)相结合的应用的例子? 第1页

  

user avatar   li-xiao-yao-67-98 网友的相关建议: 
      

虚拟试衣(Virtual Try-On)就是一个Vision和Graphic相结合的应用。首先,虚拟试衣这个任务的设定基本上是,给定一个人和一件衣服,生成一张图片让这个人穿上这件衣服

对于这个任务,如果想要人的身材和衣服的物理性质被完美模拟的话需要,需要精准用graphic技术对衣服和人进行3D建模。但是考虑到数据收集的成本和运算时间,一些vision people提出算法,用GAN或者别的neural network来取代某些建模的步骤。虽然并不能保证衣服的物理性质完全正确,但也是plausible的。

比如VITON(Han et al. CVPR 2018) 完全把这个task当成一个2D image task来做——直接以一张人的图片和一张衣服的图片作为输入,然后用GAN来直接生成这个人穿上这件衣服的样子。这种模型end-to-end,不涉及到任何3D运算。

再比如比如NHRR(Sarkar et al. ECCV 2020)2D转3D,先用densepose+SMPL把一张2D人像照片转换成3D人体模型,再用neural network从2D的衣服上学UV map,把衣服render到3D人体模型上。

最后如果对纯2D的虚拟试衣模型感兴趣可以阅读我的文章


References

Han, Xintong, et al. "Viton: An image-based virtual try-on network."Proceedings of the IEEE conference on computer vision and pattern recognition. 2018.

Sarkar, Kripasindhu, et al. "Neural re-rendering of humans from a single image."European Conference on Computer Vision. Springer, Cham, 2020.




  

相关话题

  下一个革命性的人机交互方式会是什么? 
  为什么这么多 NLP 大牛硕士毕业去企业不留在学术界? 
  大学生如何实现一个数据库? 
  买到一台新笔记本电脑之后要做些什么? 
  如果你现在是一个IT毕业生,你最想去国内的哪个城市或者具体的哪个公司发展,为什么? 
  解压文件的速度瓶颈在cpu还是硬盘速度? 
  在中国象棋中,最少用多少只马才能控制住整个棋盘?(马控棋盘)? 
  历届 SIGGRAPH 上有什么新奇、有趣的项目? 
  有哪些只有程序员才能 get 到笑点的故事? 
  做底层 AI 框架和做上层 AI 应用,哪个对自己的学术水平(或综合能力)促进更大? 

前一个讨论
语音识别中,声学模型与语言模型扮演什么角色?或者说是怎么通过两个模型进行语音识别的?
下一个讨论
人机交互中的一个热门研究领域 Tangible Interaction 在业内有常用的翻译吗?





© 2025-04-25 - tinynew.org. All Rights Reserved.
© 2025-04-25 - tinynew.org. 保留所有权利