百科问答小站 logo
百科问答小站 font logo



元宇宙(Metaverse)的关键技术挑战和机会有哪些? 第1页

  

user avatar   zhangshujia 网友的相关建议: 
      

谈到Metaverse的技术面,虽然是缺少系统实践的新兴领域,很多外界讨论难免天马行空,但如今看到Metaverse正在成为下代虚拟现实的基石构想。

很多流传于投行界的研报都在诠释Metaverse;参照了影视中的想象力设定,被描述成带有强社交属性的 <内容创造+虚拟身份+空间交互+经济系统> 及其IT基础设施的组合体;当然,换成任何buzz word都可以这么写,但却缺少具象的解读。

1,谈谈概念 - 第二数据平面与虚拟逻辑拓扑

我们早期谈论Internet,也有<万维网>这样的象形称谓,也有很多buzz word。不如放下辞藻,谈谈所谓元宇宙的构建:我们从技术面更为关注的是第二数据平面(虚拟数据平面),倘若我们的共识是将物理上的设备和IoT连接、Internet链路、IDC甚至software本身全部视为第一数据平面,那么忽略上述元素,而仅控制它们彼此所发生的数据往来和业务拓扑,这就是第二平面;这些数据往来包括了Owner与Guest(即主体/客体)的身份和角色标定、数据元自身的地址锚点和属性标签(即坐标系统)、数据在宿主和客体交互时的对价(比如数字货币)等;因为所有物理硬件的功能都是可以虚拟化标定,并且可以跨空间通过标准API和标准原语进行交互的,以及所有software都是Cloud_native甚至serverless的,并且假设带宽、存储和API吞吐无限,那么就不需要关心软件封装/IDC/设备位置,仅关心数据往来关系即可,即数据平面的拓扑;于是数据就会携带坐标系统在存储设备和API之间流动,因此构成了逻辑拓扑,这也是我们常谈虚拟世界的原因。因为这是我们第一次可以如此跨设备、跨地域的使用分布式软件功能和API,并让API仅交互数据,而不需要去重新驱动任何设备。但这些物理/逻辑的构成都需要标准化才能驱动,尤其是物理层关系映射。

作为类比Internet的无限系统,倘若要讨论一个元宇宙技术组合列表,就很容易把现存的一切支撑技术全部列举了(如下有一幅流行的图:涵盖了3D Graphic、AGI、光学与语音的人机交互与传感技术、通讯与接口技术、分布式计算和存储技术,以及身份鉴别和征信技术等等)—— 但这样的列举意义不大,它没有解释系统级工作--比如像原始搭建云计算或是HPC环境一样去解释全栈架构及其服务原语。此外,落实Metaverse的技术设想,不应该只想到<互联网技术向3D空间扩展>,而应该驱动更加开放的标准;因为Metaverse的逻辑网络就是一个由大量独立的3D空间以指数形式互连而成的庞大拓扑,让任何ID都可以参与其中的内容体验和创造、交易和交互,进而才形成了有广义社会属性的虚拟社交平台,无论在技术或是内容上,它都会演变为一个无限系统。而开放标准,曾经驱动了互联网的无限成长,云网边端进一步的开放标准和开放协作则会驱动下一代虚拟现实的无限成长。

Metaverse,我的兴趣点是三个技术方面:
1、空间锚点的存储和跨平台利用;以及跨计算平台跨内容平台的通用数据格式/协议/原语如USD);
2、基于图论/复杂网络图谱的全局知识逻辑
3、以及从开发标准的角度谈谈并不甚解的Graphic引擎的标准化
* 当然还有工程侧的云网边端应用联动问题;

2,谈谈空间锚点,以及多平台之间的兼容数据格式、原语、协议:

从一个误区谈起;很多声音认为$RBLX是一个儿童游戏的UGC社区,与Metaverse关联牵强,那么试想Unity也是游戏开发工具?显然是草率的说法。设想基于同一套runtime,Roblox能够吸引上亿的自然人用户分享第一人称角色及其空间锚点(认证虚拟角色的同时又关联其物理存在,且可以跨平台/跨设备的存在);纵使不去考虑它的低代码IDE正在辅助用户创造/编辑虚拟现实内容的事实,仅评价其平台构建虚/实社会的双向链接、建立空间锚点数据库、建立秩序和治理本身也是极具想象力的。

而这里 “空间锚点spatial_anchor” 的作用,就是把物理和虚拟联系在一起的链接(包括数字孪生的场景搭建和标定),是赋予了坐标标定和寻址的属性,且需要跨越物理计算平台的LBS服务;当我们构建全虚拟场景、或是将数字化图像叠加到用户第一视角的现实世界场景上并提供交互的时候,就必须考虑虚实对象标定和寻址的问题。比如它可以作为AR托管内容的映射,在AR环境里定位虚实身份和虚实道具,甚至是在AR中建立导航寻址、多人协作和权限绑定的场景从而更加沉浸;也可以理解为是把3D虚拟构建出的一个对象锁定在物理空间的映射地址,反之亦然;总之就是一个携带丰富虚实定义的坐标系统。类似像Cesium这样从事虚拟地理场景构建的公司就主张尽可能利用用户端上传的真实世界位置坐标或是直接购买数据库(用户端上传包括端设备的环境扫描、点云、摄像头测量数据以及各种格式的渲染图)。那么设想一下,当有海量的空间锚点彼此标定时,就形成了可用于标定出跨设备、跨网络、跨内容的模型实时状态的坐标链接,而模型又可以链接到其他数据源里(进入或是参与构建其它3D虚拟内容);甚至是将广义的物联网透明化,在网络设施和硬件节点之上构建起第二层带寻址的数据平面。再进一步,倘若将空间锚点与虚/实用户身份及其个人资产之间建立映射,那么就可以添加角色访问控制,添加共识因素,进而成为虚拟社会征信的基础;就可以为不同ID的坐标设定额外的安全后缀,从而起到将特定的资产/功能/权利,链接(授予)给其他特定ID的作用,并录入共识因素--这也是我认为Roblox未来比较有力的价值,它不仅仅是供应开发工具,同样可以中心化的监控整个虚拟环境中的<虚实身份、地址空间、应用API、设备/人机交互、角色与权利、资产/信用/交易等 “种种秩序”>。而无论在技术或是内容上,Metaverse都将会演变为一个无限系统,因此搭建这些原始秩序和标准变得尤为重要。【这里谈到Metaverse需要跨越物理计算平台的基于空间锚点和USD数据结构的LBS服务,其实不仅是支持游戏/社交,还包括适用于智慧城市和工业物联等场景,或是将游戏与非游戏应用领域融合,为非专业开发者创造参与数字内容创作的可能】

这里值得关注的是,Unity和Unreal也在尝试与MSFT合作类似的项目。复杂空间锚点的挑战不仅在于存储,还关乎于3D图形渲染;图形计算的工作效率与空间锚点的创建/标定/寻址效率是紧密相关的。当然 Metaverse中的大量内容都需要实时渲染,因此就目前的云边端分布式渲染算力和API还无法构建起像电影中一样足以容纳海量社会道具及其空间锚点的虚实环境,当下仅限于在小规模AR/VR应用中。

【除了空间锚点问题;还有跨计算平台、跨内容平台的互通数据格式/协议的问题,以便于场景内容能够动态的通用化资产、统一渲染工具、共用原语/流程/数据结构等,这方面可以看NV与Pixar合作USD的例子Universal Scene Description 21.11 documentationOmniverse支持)。】

3,谈谈基于图论/复杂网络在Metaverse中的全局知识逻辑:

其实容易理解,就是一个设定了不同角色子图的自学习-自收敛的图谱,但是图谱规模将是无限扩张且跨平台、跨区域的,以便于在有庞大用户在线交互的虚拟环境中可以描述关系;比如Community网络可以描述资产属主或是ID族群间的私密关系,Cluster网络可以建立物以类聚或是放在推荐系统里,Clique网络可以描述全链接拓扑,Motif网络刚好在交易或是社交场景中描述ID与ID之间或是资产与资产之间的动力学关系,等等。-- 而对于经常被提及的AI在元宇宙中的应用前景,我想象不出现今流行的AI方案能够解决元宇宙的工程难题,倘若实在要讲,想必最重要的还是要有World Model(/AGI),以及视觉系统也不能仅仅使用图像信息,必须要有视觉信息背后的机制,否则不容易走远。这样的图谱不会是一蹴而就的,会是迭代收敛的过程,从单一系统/单一内容到物理现实空间和自然人的链接,直到跨越多重系统、多重内容平台、多重现实空间的链接。

4,谈谈Graphic引擎的标准化问题:

元宇宙的基础体验就是3D沉浸式体验(尤其自主沉浸,即在不破坏监管秩序的情况下,用户自主去构造/建设一个3D虚拟环境)。这里对3D Graphic技术不甚了解,仅谈一下开放标准的问题。对于Metaverse而言,本地设备渲染和远程渲染都是刚需性的,图形API/数学函数库/解码库和编译工具的开放标准和开放协作至关重要(当然如Unity的转换/翻译引擎也很重要);而当下所有的VR/AR及端侧游戏辅助设备都是基于专有硬件和软件栈,自然的都不能很完美支持开放标准的或是第三方的图形API(如OpenGL/WebGL);比如Xbox专门基于MS DirectX,而Sony PlayStation专门基于GNMX,任天堂Switch使用与NV联创的NVN等;虽然移动设备通常支持多种标准,但却又会出于保护专有性而刻意设置针对第三方公版API的壁垒,比如Andriod围绕OpenGL构建了方案,但也是出于谷歌Chrome和Chromium的主导地位而控制这些标准;而PC和Mac看似开放,但也对DirectX和Apple Metal API进行过专属优化或阉割(当然NV驱动程序也是与这些API协同)。因此,开发者也要为每个平台的"专有标准"单独编写程序版本和内容。这种疆域分化有很多商业好处,但就像当初的互联网发展一样,需要有统一的底层标准体系以及上层翻译和兼容机制才能促进Metaverse的规模效应;目前较好的例子可能是跨平台的游戏引擎...Unreal/Unity。

Graphic引擎的标准化可以包括并不限于:
1、开发的实时协作,需要整合用户和主流3D设计工具,以及对应的API和图形库;让开发者无需准备数据就能实时进行更新、迭代和更改,从而简化开发流程;
2、实时性的光线追踪和路径追踪,不仅让实时的作品更精美,也需要对应物理属性准确(环境搭建);
3、模型的可扩展性,让开发者只用构建模型一次,就能在不同设备上渲染;包括跨平台/跨内容的语义、数据格式和服务原语的统一;这方面参考NV与Pixar合作USD的例子。

综上;以及还包括工程方向的云网边端协同问题。这是Infrastructure的设定,涉及存-算-通-联的一切;尤其端边侧的软硬件设施薄弱,开发和运行标准不统一,服务原语不统一,并且很难通过软件OS集中监管和调度,也很难提供全局低延迟服务(比如端侧-远程实时3D渲染)。即使算力下沉MEC也解决不掉末端体验的掣肘,也许物理外挂机箱是一条出路:)

5,谈谈所谓数字货币及其交易秩序:

关于所谓数字货币及其交易秩序。网媒热议的另一个方向是<头号玩家>虚拟社会中的交易属性,引申到了区块链话题...。很自然的想,元宇宙的物理结构是由无限的去中心化网络组成,社会信用即共识规则也是去中心化的分布存在,但是个别底层的秩序则应该在一个中心化的场景下监管,例如数字货币(或NFT)的分配规则和交易规则,进而履行个人征信和CP内容提供商的组织征信的规则;这种底层秩序中心化监管的意义就是,比如需要严格控制币值,避免币值像是比特币一样的大幅波动(与比特币不同的是,毕竟Metaverse货币具有普遍意义的虚拟商品交易属性,而不是用来炒波动的);而中心化的管理就是为了管控这方面,而货币发行和流通本身,也是要确保场内交易有序,场外交易严控的原则。

Roblox作为元宇宙概念公司,在上述的每一类技术中都有硬伤,且这些硬伤都不是它能够独立解决的,同样的评价也适用于Unity/Unreal。—— $RBLX的当下主营是游戏,这是出于获客和现金流的考虑,游戏既是现金流,也是繁荣社区-扩大群聚效应的手段【开发者和CP彼此协作、CP活跃在素材交易的Marketplace、平台兼顾了推广发行、外围提供了各类市场化外包服务(设计/运营/推广)】等等。Roblox拥有这个社区的中心化治理角色,也具备引导和整合内容生产的能力,还能够提供数据身份之间的跨空间共享和协作(对标Microsoft Mesh;提供远程设计协作、虚拟培训、教育、文娱以及社交聚会等等),这些都是初级形态;而距离Metaverse最遥远的掣肘仍是技术工程。【BTW:Unity希望做生态,所以做了广告和内容发行体系,但是被RBLX的经济体系压制(U社区是交换/交易生产资料、工具/素材以及代码开发服务的外包,而R社区还可以交易社会资源(道具/服装/情报/地图等,有别于传统技术社区的驱动力是它的强社交属性);但倘若仅讨论图形工具和渲染效果,Unity是领先Roblox的;只是单纯的IDE+引擎生意盈利较弱,Unreal才值多少,如今引擎就是送出去抢占市场和生态的阶段;但是RBLX的模式不仅是抽拥take%,而是税收属性】。元宇宙的基础体验就是沉浸式体验(尤其自主沉浸,在不破坏底层秩序的情况下,ID可以遵循自己的想法去构造/建设这个3D虚拟世界),用户可以在游戏世界中创造各种新的游戏,也可以去玩别人创造的游戏,如果一个游戏特别受欢迎,创造者还能得到这个游戏世界中的虚拟货币,而这个货币可以兑换成现实美元。如今,RBLX世界中最大的庄家仍是它自己,很多规则秩序都是它制订并监管的,所以它尚且不是去中心化的,而一旦它实行去中心化,也势必让公司的盈利能力失控。

最后,所谓元宇宙的社会属性也体现在:很多文章把Metaverse与数字孪生相联系,这其实是指代不同的自然人有不同的虚拟身份和数字大脑,每个人都有自己与之联接的数字分身(现实世界是生存需求,虚拟现实则是满足精神需求的平行世界),进而形成了虚实个体的孪生比喻关系。当然还有工业元宇宙,如Nvidia Omniverse的定位,用于为生产环境提供仿真的数字孪生,再根据这个仿真状态不断追踪和调优它的实体版本;这个相比传统的基于入库数据的数字孪生要有意义得多,它更遵循物理定律(重力/压力/电磁等等工况);不仅可以仿真一条产线、一个工厂,还可以仿真一座城市;而Omniverse也提供了完备的编程语言和模型,这应该是距离我们最近的Metaverse实践;从未来工业数字孪生的角度讲,将元宇宙视作生产力工具就不为过。以及,Metaverse最矛盾前途是跨平台标准化,各方机构和厂商都觊觎做标准主创:云计算寡头、内容应用寡头、API寡头、GPU、区块链厂商、消费电子设备厂商等等,但都不会独创成功,就像Internet当年,这是工业界的协同工作。


BTW:有篇文章总结了Metaverse的四个属性,似乎有些道理,摘录如下:
1、同步和拟真。虚拟空间与现实社会保持高度同步和互通,交互效果接近真实。同步和拟真的虚拟世界是原宇宙构成的基础条件,这意味着现实社会中发生的一切事件将同步于虚拟世界,同时用户在虚拟的元宇宙中进行交互时能得到接近真实的 反馈信息。
2、开源和创造。开源同时意味着技术开源和平台开源,元宇宙通过制定“标准” 和“协议”将代码进行不同程度的封装和模块化,不同需求的用户都可以在元宇宙进行创造,形成原生虚拟世界,不断扩展元宇宙边际。
3、永续。元宇宙平台不会“暂停”或“结束”,而是以开源的方式运行并无限期地持续。
4、闭环经济系统。用户的生产和工作活动将以平台统一的货币被认可,玩家可 以使用货币在平台内消费内容,也可以通过一定比例置换现实货币。经济系统是驱动元宇宙不断前进和发展的引擎。

BTW:几篇网文可以搭配参考(虽然没有细节,但不算离谱):【关于Metaverse的几个属性关于国内某家Metaverse概念公司关于Metaverse开放标准的解读1和解读2关于技术体系结构所谓6层架构以及细分赛道关于概念和机会的解读1和解读2关于NFT在Metaverse中的定位Rokid AR产品实践一家兼顾图形开发+空间锚点的初创-粒界




  

相关话题

  如何看待参加《2060》的虚拟主播凉了一大片,虚拟人行业的寒冬是否要来了? 
  大家都说元宇宙是骗局,为什么还有这么多明星富豪往里砸钱?他们是傻子吗? 
  为什么 VR 始终不能崛起呢? 
  你觉得未来10年vr会发展成什么样? 
  被刷屏热议的天下秀「虹宇宙」究竟是什么? 
  Meta 首次公开元宇宙业绩,去年亏损逾 100 亿美元,透露出了哪些信息,还有哪些数据值得关注? 
  英特尔副总裁称「需将计算力提升 1000 倍才能实现元宇宙」,透露出了哪些信息? 
  如何看待周杰伦持有的价值超 300 万的 NFT 被盗,为什么那么多名人都在购买 NFT 头像? 
  如何看待虚拟偶像向晚的早安动态只坚持了一周? 
  Meta 公布 AI 概念「Builder Bot」,能够通过语言建造 VR 世界,技术方向上有亮点? 

前一个讨论
如何看待世界疫情对中国经济的影响?
下一个讨论
兆芯的x86授权是怎么来的?





© 2025-06-28 - tinynew.org. All Rights Reserved.
© 2025-06-28 - tinynew.org. 保留所有权利