CN116582660A - 面向增强现实的视频处理方法、装置和计算机设备 - Google Patents

面向增强现实的视频处理方法、装置和计算机设备 Download PDF

Info

Publication number
CN116582660A
CN116582660A CN202310612206.9A CN202310612206A CN116582660A CN 116582660 A CN116582660 A CN 116582660A CN 202310612206 A CN202310612206 A CN 202310612206A CN 116582660 A CN116582660 A CN 116582660A
Authority
CN
China
Prior art keywords
eye
grid
augmented reality
video
virtual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310612206.9A
Other languages
English (en)
Inventor
孙超
李巍
潘卫敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Beimian Information Technology Co ltd
Original Assignee
Shanghai Beimian Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Beimian Information Technology Co ltd filed Critical Shanghai Beimian Information Technology Co ltd
Priority to CN202310612206.9A priority Critical patent/CN116582660A/zh
Publication of CN116582660A publication Critical patent/CN116582660A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/122Improving the 3D impression of stereoscopic images by modifying image signal contents, e.g. by filtering or adding monoscopic depth cues
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/131Protocols for games, networked simulations or virtual reality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/275Image signal generators from 3D object models, e.g. computer-generated stereoscopic image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/332Displays for viewing with the aid of special glasses or head-mounted displays [HMD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/363Image reproducers using image projection screens
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本申请涉及一种面向增强现实的视频处理方法、装置、计算机设备、存储介质和计算机程序产品。应用于增强现实设备;接收立体视觉视频;立体视觉视频包含真实对象;基于立体视觉视频生成左目动态纹理和右目动态纹理;将左目动态纹理映射于左网格,将右目动态纹理映射于右网格;将左网格连同三维虚拟世界渲染至左目虚拟相机中,得到左目渲染结果,以及将右网格连同三维虚拟世界渲染至右目虚拟相机中,得到右目渲染结果;将左目渲染结果投影至增强现实设备的左目显示镜,将右目渲染结果投影至增强现实设备的右目显示镜,以实现增强现实场景下的立体视觉视频的立体视觉。采用本方法能够提升增强现实系统对真实场景的交互能力。

Description

面向增强现实的视频处理方法、装置和计算机设备
技术领域
本申请涉及增强现实技术领域,特别是涉及一种面向增强现实的视频处理方法、装置和计算机设备。
背景技术
增强现实(Augmented Reality,简称AR)技术是一种基于计算机实时计算和多传感器融合,将现实世界与虚拟信息结合起来的技术。该技术通过对人的视觉、听觉、嗅觉、触觉等感受进行模拟和再输出,并将虚拟信息叠加到真实信息上,给人提供超越真实世界感受的体验。
然而现有的增强现实系统通常是将虚拟三维模型作为数据对象进行展示和交互,显然,现有的增强现实系统存在对真实场景交互能力不足的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高对真实场景交互能力的面向增强现实的视频处理方法、装置和计算机设备。
第一方面,本申请提供了一种面向增强现实的视频处理方法。应用于增强现实设备;所述方法包括:
接收立体视觉视频;所述立体视觉视频包含真实对象;
基于所述立体视觉视频生成左目动态纹理和右目动态纹理;
将所述左目动态纹理映射于左网格,将所述右目动态纹理映射于右网格;
将所述左网格连同三维虚拟世界渲染至左目虚拟相机中,得到左目渲染结果,以及将所述右网格连同所述三维虚拟世界渲染至右目虚拟相机中,得到右目渲染结果;
将所述左目渲染结果投影至所述增强现实设备的左目显示镜,将所述右目渲染结果投影至所述增强现实设备的右目显示镜,以实现所述增强现实场景下的所述立体视觉视频的立体视觉。
在其中一个实施例中,所述方法还包括:
接收对象信息;所述对象信息包括对象动作、对象表情和对象手势,且是通过对所述立体视觉视频进行识别得到的;
依据对象信息控制对应的虚拟三维模型。
在其中一个实施例中,所述方法还包括:
确定所述虚拟三维模型的局部坐标系;
依据所述局部坐标系分别对所述左网格和所述右网格进行绑定处理,以使所述立体视觉视频伴随于所述虚拟三维模型的周围。
在其中一个实施例中,所述方法还包括:
通过传感器实时采集三维空间信息;
依据所述三维空间信息控制所述左目虚拟相机和所述右目虚拟相机进行移动。
在其中一个实施例中,所述将所述左目动态纹理映射于左网格,将所述右目动态纹理映射于右网格之后,所述方法还包括:
依据所述真实对象对所述左网格进行剪裁处理,得到左目头像网格;
依据所述真实对象对所述右网格进行剪裁处理,得到右目头像网格;
将所述左目头像网格渲染至所述左目虚拟相机中,得到所述左目渲染结果,以及将所述右目头像网格渲染至所述右目虚拟相机中,得到所述右目渲染结果。在其中一个实施例中,所述基于所述立体视觉视频生成左目动态纹理和右目动态纹理包括:
将所述立体视觉视频拆分为左目视频和右目视频;
依据所述左目视频生成左目动态纹理;
依据所述右目视频生成右目动态纹理。
第二方面,本申请还提供了一种面向增强现实的视频处理装置。所述装置包括:
接收模块,用于接收立体视觉视频;所述立体视觉视频包含真实对象;
生成模块,用于基于所述立体视觉视频生成左目动态纹理和右目动态纹理;
映射模块,用于将所述左目动态纹理映射于左网格,将所述右目动态纹理映射于右网格;
渲染模块,用于将所述左网格连同三维虚拟世界渲染至左目虚拟相机中,得到左目渲染结果,以及将所述右网格连同所述三维虚拟世界渲染至右目虚拟相机中,得到右目渲染结果;
投影模块,用于将所述左目渲染结果投影至所述增强现实设备的左目显示镜,将所述右目渲染结果投影至所述增强现实设备的右目显示镜,以实现增强现实场景下的所述立体视觉视频的立体视觉。
在其中一个实施例中,所述装置还包括:
控制模块,用于接收对象信息;所述对象信息包括对象动作、对象表情和对象手势,且是通过对所述立体视觉视频进行识别得到的;依据对象信息控制对应的虚拟三维模型。
在其中一个实施例中,所述装置还包括:
绑定模块,用于确定所述虚拟三维模型的局部坐标系;依据所述局部坐标系分别对所述左网格和所述右网格进行绑定处理,以使所述立体视觉视频伴随于所述虚拟三维模型的周围。
在其中一个实施例中,所述控制模块还用于通过传感器实时采集三维空间信息;依据所述三维空间信息控制所述左目虚拟相机和所述右目虚拟相机进行移动。
在其中一个实施例中,所述渲染模块还用于
依据所述真实对象对所述左网格进行剪裁处理,得到左目头像网格;
依据所述真实对象对所述右网格进行剪裁处理,得到右目头像网格;
将所述左目头像网格渲染至所述左目虚拟相机中,得到所述左目渲染结果,以及将所述右目头像网格渲染至所述右目虚拟相机中,得到所述右目渲染结果。在其中一个实施例中,所述生成模块还用于将所述立体视觉视频拆分为左目视频和右目视频;依据所述左目视频生成左目动态纹理;依据所述右目视频生成右目动态纹理。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
上述面向增强现实的视频处理方法、装置、计算机设备、存储介质和计算机程序产品,通过接收立体视觉视频;立体视觉视频包含真实对象;基于立体视觉视频生成左目动态纹理和右目动态纹理;将左目动态纹理映射于左网格,将右目动态纹理映射于右网格;将左网格连同三维虚拟世界渲染至左目虚拟相机中,得到左目渲染结果,以及将右网格连同三维虚拟世界渲染至右目虚拟相机中,得到右目渲染结果;将左目渲染结果投影至增强现实设备的左目显示镜,将右目渲染结果投影至增强现实设备的右目显示镜,以实现增强现实场景下的立体视觉视频的立体视觉,通过实现包含真实对象的立体视觉视频的立体视觉,即实现了用户可利用增强现实系统与真实对象的立体视觉进行交互,有效的提升了增强现实系统对真实场景的交互能力。
附图说明
图1为一个实施例中面向增强现实的视频处理方法的应用环境图;
图2为一个实施例中面向增强现实的视频处理方法的流程示意图;
图3为一个实施例中渲染步骤的流程示意图;
图4为一个实施例中增强现实系统中用户端的设备节点示意图;
图5为一个实施例中增强现实系统的示意图;
图6为一个实施例中增强现实设备的示意图;
图7a为一个实施例中立体视频采集设备的示意图;
图7b为另一个实施例中增强现实设备的示意图;
图8为一个实施例中面向增强现实的视频处理装置的结构框图;
图9为一个实施例中面向增强现实的视频处理装置的结构框图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的面向增强现实的视频处理方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。本实施例以终端102为增强现实设备执行为例进行说明。
增强现实设备接收立体视觉视频;立体视觉视频包含真实对象;增强现实设备基于立体视觉视频生成左目动态纹理和右目动态纹理;增强现实设备将左目动态纹理映射于左网格,将右目动态纹理映射于右网格;增强现实设备将左网格连同三维虚拟世界渲染至左目虚拟相机中,得到左目渲染结果,以及将右网格连同三维虚拟世界渲染至右目虚拟相机中,得到右目渲染结果;增强现实设备将左目渲染结果投影至增强现实设备的左目显示镜,将右目渲染结果投影至增强现实设备的右目显示镜,以实现增强现实场景下的立体视觉视频的立体视觉。
其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为增强现实设备、智能手表、智能手环、头戴设备等。增强现实设备可为增强现实眼镜设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种面向增强现实的视频处理方法,以该方法应用于图1中的终端102为增强现实设备为例进行说明,包括以下步骤:
S202,接收立体视觉视频;立体视觉视频包含真实对象。
其中,立体视觉视频在本案中可以指反映立体视觉的真实场景视频。立体视觉(steroscopic vision)可用于感受三维视觉空间和感知深度,立体视觉以双眼单视为基础,其形成是由于两眼在观察一个三维物体时,由于两眼球之间存在距离,故而存在视差角,物体在两眼视网膜上的成像存在相似性及一定的差异,形成双眼视差(binoculardisparity)。真实对象可以指现实中的对象,例如,真实对象可为真人和真动物。
具体地,增强现实设备响应于视频的接收指令,接收云端发送的立体视觉视频;立体视觉视频包含真实对象。
S204,基于立体视觉视频生成左目动态纹理和右目动态纹理。
其中,左目动态纹理可以指左目对应的动态纹理。右目动态纹理可以指右目对应的动态纹理。动态纹理是相对于常规的纹理而言的,通常的纹理都是静态的,而动态纹理就是模型保持不动,而纹理动态变化,凡是能够对模型应用的变换,也能作用于纹理,比如平移,旋转,缩放,投影和shear(错切)操作等。常规的纹理包括物体表面的纹理即使物体表面呈现凹凸不平的沟纹,同时也包括在物体的光滑表面上的彩色图案,对于沟纹而言,实际上也是要在表面绘出彩色花纹或图案,同时要求视觉上给人以凹凸不平感即可。
具体地,将立体视觉视频拆分为左目视频和右目视频;依据左目视频生成左目动态纹理;依据右目视频生成右目动态纹理。
其中,左目视频可以指左目(左眼)对应的视频。右目视频可以指右目(右眼)对应的视频。
S206,将左目动态纹理映射于左网格,将右目动态纹理映射于右网格。
其中,左网格可指图形学世界坐标系中对应虚拟三维模型的局部坐标系下的与左目虚拟相机对应的网格区域。右网格可指图形学世界坐标系中对应虚拟三维模型的局部坐标系下的与右目虚拟相机对应的网格区域。增强现实设备还包括左目虚拟相机和右目虚拟相机。左目虚拟相机可以指观察虚拟世界的第一人称的虚拟三维模型的左目对应的虚拟相机,左目虚拟相机可用于处理观察虚拟世界的第一人称的虚拟三维模型的左目所看到画面的相关数据。右目虚拟相机可以指观察虚拟世界的第一人称的虚拟三维模型的右目对应的虚拟相机,右目虚拟相机可用于处理观察虚拟世界的第一人称的虚拟三维模型的右目所看到画面的相关数据,虚拟世界包括虚拟三维世界,虚拟三维世界又可称三维虚拟世界。
在一个实施例中,在基于图形学和GPU管线的虚拟三维世界中,建立对应虚拟世界的第三人称某用户角色的虚拟三维模型,在该模型的模型局部坐标系下,建立两个图元,分别是左网格和右网格,这两个网格在局部坐标系下叠放,也就是说二者拥有相同的(x,y,z)坐标值。作为伴随虚拟三维模型运动的真实视频展示板。
在一个实施例中,在左网格上,对左目动态纹理进行纹理映射,在右网格上,对右目动态纹理进行纹理映射。
其中,纹理映射(Texture Mapping)是一种将物体空间坐标点转化为纹理坐标,进而从纹理上获取对应点的值,以增强着色细节的方法,在本申请中,上述“物体空间坐标”是指左网格或右网格中各网格的坐标,纹理上对应点的值是指左目动态纹理或右目动态纹理中各点的值。
设置观察虚拟三维世界的两部虚拟相机,分别是左目虚拟相机和右目虚拟相机。其中,虚拟相机(virtul camera)是将虚拟三维世界的世界坐标系下的三维点进行模型视点变换(model-view transform)到视点坐标系下,从而映射到屏幕的表示视点状态的(包括外部参数:三自由度平移,三自由度旋转;和内部参数:视场角大小)数学模型。为了实现观察虚拟三维世界的立体视觉效果,本实施例设置具有符合人眼视差的左目虚拟相机和右目虚拟相机,也就是说这两部虚拟相机在世界坐标系下具有相同的(y,z)值,而水平方向(x)值相差对应人眼瞳距距离,本实施例采用80mm取得符合人眼视差的立体视觉效果,本实施例下可操作性的操作是将左目虚拟相机与观察虚拟世界的第一人称角色的左眼绑定,将右目虚拟相机与观察虚拟世界的第一人称角色的右眼绑定。
S208,将左网格连同三维虚拟世界渲染至左目虚拟相机中,得到左目渲染结果,以及将右网格连同三维虚拟世界渲染至右目虚拟相机中,得到右目渲染结果。
本实施中,该渲染结果已经包括了传统增强现实场景中的虚拟三维模型和展示真实场景视频的左、右网格。
其中,左目渲染结果可以指将左网格进行渲染处理后得到的图像。右目渲染结果可以指将右网格进行渲染处理后得到的图像。渲染(Render)在电脑绘图中指从模型生成图像的过程。模型是用严格定义的语言或者数据结构对于三维物体的描述,它包括几何、视点、纹理以及照明信息,在本申请中上述“模型”指左网格或右网格。图像是数字图像或者位图图像。
具体地,将包含左目动态纹理的左网格连同三维虚拟世界渲染至左目虚拟相机中,得到左目渲染结果,以及将包含右目动态纹理的右网格连同三维虚拟世界渲染至右目虚拟相机中,得到右目渲染结果。
在一个实施例中,在左目虚拟相机中,对包含左目动态纹理的左网格连同三维虚拟世界进行渲染处理,得到左目渲染结果,并对右网格进行消隐处理;在右目虚拟相机中,对包含右目动态纹理的右网格连同三维虚拟世界进行渲染处理,得到右目渲染结果,并对右网格进行消隐处理。
其中,消隐处理又可称消除处理,可通过Z-buffer算法、扫描线算法、Warnock消隐算法、Roberts算法和光线投射法等等算法实现。
在一个实施例中,将左网格连同整个虚拟世界渲染至左目虚拟相机中,得到左目渲染结果称之为虚拟世界左投影,左虚拟世界将投影至左目显示镜。
在一个实施例中,将右网格连同整个虚拟世界渲染至右目虚拟相机中,得到右目渲染结果称之为虚拟世界右投影,右虚拟世界将投影至右目显示镜。
其中,虚拟世界左投影和虚拟世界右投影对应的虚拟模型除左、右网格外,其他部分为相同的虚拟世界模型。
在一个实施例中,增强现实设备可以先确定左网格在虚拟三维世界中的位置,再通过左目模型视点变换,渲染到左目虚拟相机,得到左目渲染结果,以及确定右网格在虚拟三维世界中的位置,再通过右目模型视点变换,渲染到右目虚拟相机,得到右目渲染结果。
其中,左网格位置可以指左网格在虚拟三维世界中的位置;右网格位置可以指右网格在虚拟三维世界中的位置,依据双目立体视觉的原理,双目所看为同一目标,所以左网格和右网格位置重合叠放。
S210,将左目渲染结果投影至增强现实设备的左目显示镜,将右目渲染结果投影至增强现实设备的右目显示镜,以实现增强现实场景下的立体视觉视频的立体视觉。
其中,左目显示镜是指增强现实设备中左目对应的显示镜。右目显示镜是指增强现实设备中右目对应的显示镜。投影又可称投射,可指用一组光线将物体的形状投射到一个平面上,在本案中“平面”是指左目显示镜或右目显示镜。
在一个实施例中,增强现实设备可获取左目虚拟相机的外部参数从而确定左目模型视点矩阵,依据左目模型视点矩阵将左目渲染结果投影至增强现实设备的左目显示镜,以及获取右目虚拟相机的外部参数从而确定右目模型视点矩阵,依据右目模型视点矩阵将右目渲染结果投影至增强现实设备的右目显示镜,以实现立体视觉视频的立体视觉。
其中,左目虚拟相机的外部参数可指左目虚拟相机在虚拟三维世界中的三维平移数据,与三维旋转数据。右目虚拟相机的外部参数可指右目虚拟相机在虚拟三维世界中的三维平移数据,与三维旋转数据。左目模型视点矩阵可指左目对应的模型视点矩阵。右目模型视点矩阵可以指右目对应的模型视点矩阵。模型视点矩阵可以指基于模型视点变换得到的矩阵。
在一个实施例中,接收对象信息;对象信息包括对象动作、对象表情和对象手势,且是通过对立体视觉视频进行识别得到的;依据对象信息控制对应的虚拟三维模型。
其中,对象信息可以指真实对象的相关信息,对象信息包括对象动作、对象表情和对象手势。对象动作可以指与对象的肢体动作相关的信息。对象表情可以指与对象的表情相关的信息。对象手势可以指与对象手的姿势相关的信息。虚拟三维模型可指三维的虚拟形象,虚拟形象包括人物形象、拟人的动物形象、拟人的植物形象和自定义的形象等等。
在一个实施例中,依据对象信息控制对应的虚拟三维模型包括依据对象动作、对象表情和对象手势控制真实对象对应的虚拟三维模型的动作、表情和手势。
在一个实施例中,确定虚拟三维模型的局部坐标系;依据局部坐标系分别对左网格和右网格进行绑定处理,以使立体视觉视频伴随于虚拟三维模型的周围,例如,立体视觉视频伴位于虚拟三维模型的左上角、右上角、左下角和右下角等等。其中,虚拟三维模型的局部坐标系是指以虚拟三维模型的中心为原点建立的坐标系。
在一个实施例中,通过传感器实时采集三维空间信息;依据三维空间信息控制虚拟三维模型左目虚拟相机和右目虚拟相机进行移动。
在一个实施例中,通过传感器实时采集三维空间信息;依据三维空间信息反算用户运动行为,从而控制观察虚拟世界的第一人称虚拟三维模型进行移动。
其中,三维空间信息可指真实环境中与空间相关的信息。
在一个实施例中,依据三维空间信息控制观察虚拟世界的第一人称虚拟三维模型进行移动包括依据三维空间信息确定真实环境中的真实对象的三自由度移动速度和移动位置,三自由度旋转角度与旋转角速度,依据该三自由度移动速度和移动位置、三自由度旋转角度与旋转角速度控制虚拟三维模型进行移动。
上述面向增强现实的视频处理方法中,通过接收立体视觉视频;立体视觉视频包含真实对象;基于立体视觉视频生成左目动态纹理和右目动态纹理;在虚拟三维世界坐标系中对应虚拟三维模型的局部坐标系下设置左网格和右网格;将左目动态纹理映射于左网格,将右目动态纹理映射于右网格;将左网格渲染至左目虚拟相机中,得到左目渲染结果,以及将右网格渲染至右目虚拟相机中,得到右目渲染结果;将左目渲染结果投影至增强现实设备的左目显示镜,将右目渲染结果投影至增强现实设备的右目显示镜,以实现立体视觉视频的立体视觉,通过实现包含真实对象的立体视觉视频的立体视觉,即实现了用户可利用增强现实系统与真实对象的立体视觉进行交互,有效的提升了增强现实系统对真实场景的交互能力。
在一个实施例中,如图3所示,渲染步骤包括:
S302,依据真实对象对左网格进行剪裁处理,得到左目头像网格。
其中,左目头像网格可指主要包含真实对象的头像的网格,左目头像网格可用于生成左目渲染结果。
在一个实施例中,增强现实设备获取真实对象对应的左目剪裁参数,依据左目剪裁参数对左网格进行剪裁处理,得到左目头像网格。
其中,左目剪裁参数包括第一左侧剪裁长度、第一右侧剪裁长度、第一上侧剪裁宽度和第一下侧剪裁宽度。第一左侧剪裁长度是指对左网格左侧的剪裁长度。第一右侧剪裁长度是指对左网格右侧的剪裁长度。第一上侧剪裁宽度是指对左网格上侧的剪裁宽度。第一下侧剪裁宽度是指对左网格下侧的剪裁宽度。
S304,依据真实对象对右网格进行剪裁处理,得到右目头像网格。
其中,右目头像网格可指主要包含真实对象的头像的网格,右目头像网格可用于生成右目渲染结果。
在一个实施例中,增强现实设备获取真实对象对应的右目剪裁参数,依据右目剪裁参数对右网格进行剪裁处理,得到右目头像网格。
其中,右目剪裁参数包括第二左侧剪裁长度、第二右侧剪裁长度、第二上侧剪裁宽度和第二下侧剪裁宽度。第二左侧剪裁长度是指对右网格左侧的剪裁长度。第二右侧剪裁长度是指对右网格右侧的剪裁长度。第二上侧剪裁宽度是指对右网格上侧的剪裁宽度。第二下侧剪裁宽度是指对右网格下侧的剪裁宽度。
S306,将左目头像网格渲染至左目虚拟相机中,得到左目渲染结果,以及将右目头像网格渲染至右目虚拟相机中,得到右目渲染结果。
本实施例中,通过依据真实对象对左网格进行剪裁处理,得到左目头像网格,依据真实对象对右网格进行剪裁处理,得到右目头像网格,将左目头像网格渲染至左目虚拟相机中,得到左目渲染结果,以及将右目头像网格渲染至右目虚拟相机中,得到右目渲染结果,实现了用户可利用增强现实系统与真实对象的头像的立体视觉进行交互,将实时真人头像展示在到其虚拟化身(虚拟三维模型)身旁,有效地补充了虚拟化身的实时真实视频信息,有效的提升了增强现实系统对真实场景的交互能力。
在一个实施例中,增强现实系统包括增强现实设备、立体视频采集设备和云端,其中,立体视频采集设备可称双目的视频采集设备,立体视频采集设备中的左目摄像头和右目摄像头分别对真实对象进行视频采集,分别得到左目视频和右目视频,将左目视频和右目视频组合成立体视觉视频,并将立体视觉视频发送至云端,云端对立体视觉视频进行识别,得到对象的人体动作捕捉信息(对象信息),并将该立体视觉视频和对象信息发送至增强现实设备。
在一个实施例中,左目摄像头和右目摄像头分别对真实对象进行视频采集,分别得到左目视频和右目视频包括:当左目摄像头和右目摄像头为广角摄像头时,分别直接对真实对象进行视频采集,分别得到左目视频和右目视频;当左目摄像头和右目摄像头为窄角摄像头时,根据预设距离分别对真实对象进行视频采集,分别得到左目视频和右目视频。
其中,预设距离可以指预先设置的距离,预设距离在本申请中需以能拍摄到完整的真实对象进行设置。
作为一个示例,本实施例如下:
本方案提供了一种立体视觉视频辅助的增强现实多地协同系统(增强现实系统)。该系统将增强现实构造的三维虚拟世界和立体视频采集设备采集的立体视觉视频有机的融合在一起,借助双目增强现实眼镜(增强现实眼镜设备)呈现,符合人体立体视觉的习惯,实现了三维增强现实环境和立体视觉视频的优势互补。
本增强现实系统中的每个用户拥有两个设备节点,图4为一个实施例中增强现实系统中用户端的设备节点示意图;如图4所示,其中一个为增强现实眼镜设备节点,下文称眼镜节点,另一个为立体视频采集设备节点。进一步地,图5为一个实施例中增强现实系统的示意图;如图5所示,众多用户间的眼镜节点,通过云端处理中心相互联网。
图6为一个实施例中增强现实设备的示意图;如图6所示,当增强现实设备为增强现实眼镜设备时,该增强现实眼镜设备具有1.传感器装置2.双目显示装置(半反半透双目显示装置)3.处理模块。其中,
传感器装置包括但不限于1.摄像头等视觉传感器2.陀螺仪惯导传感器3.深度传感器4.GPS传感器。传感器装置负责感知三维空间信息。
双目显示装置可以是双目半反半透光学显示镜,还可以是两个内置显示器的独立显示镜片,在设置该双目显示模块的相对位置时,可以将其设置为基本符合人体双眼的相对位置。
处理器模块负责处理三维空间信息,进而求解出渲染增强现实场景的模型视点矩阵,渲染正确的增强现实场景。增强现实场景,该场景中有1.一般三维对象,经过前述矩阵变换以正确的三维位姿进行渲染;2.双目对应的立体视频显示网格:左网格和右网格,用以分别呈现多媒体采集节点传来的左目和右目视频流。处理模块还包括接收互联网数据的4G/5G/wifi基带。
图7a为一个实施例中立体视频采集设备的示意图;如图7a所示,立体视频采集设备节点具有1.双目立体视觉采集摄像头;2.处理模块,其中:
双目的立体视觉采集摄像头通过符合人双眼瞳距设置的双目摄像头分别采集对应左目的左目视频和右目对应的右目视频。处理模块,将独立的左目视频和右目视频组装成立体视觉视频,并通过4G/5G/wifi基带将立体视觉视频流上传到互联网。
云端处理中心负责立体视觉视频流进行人工智能处理(人体动作识别处理),并分发到远程用户的眼镜端。
各个远程用户在自己的增强现实眼镜设备节点中看到增强现实场景,场景包括每个远程用户对应的虚拟人形象,以及融合在场景中各个远程用户的真实世界的立体视觉视频。
增强现实系统工作时,各个用户通过各自的立体视频采集节点采集立体视觉视频,并上传到云端,云端对立体视觉视频信息进行人工智能处理,检测用户的真实场景中的物体信息,提取人体动作、表情、手势等人体信息,将人体动作、表情、手势等人体信息实时映射到虚拟化身虚拟三维模型上,并将立体视觉视频分发给系统中获权看到视频的对应用户,放置在虚拟化身三维模型身旁的左右网格中,具体方案如下:
多地协同的增强现实系统中,云端处理中心维护参与协作空间的多名用户身份、位置、行为等数据,比如代表用户A的信息,会广播到每个眼镜节点,每个用户的增强现实场景中会看到代表用户A的虚拟人三维模型,虚拟人A。眼镜节点对虚拟人A分别进行左、右两个虚拟视角的投影-透视变换,变换后经过GPU管线渲染符合左、右目人眼的立体视觉3D场景到眼镜的双目显示装置,佩戴眼镜的用户一次看到符合人眼立体视觉的虚拟人A呈现在眼前;注意,虚拟人A模型对象在每个眼镜节点中只有一份,但对于左、右目虚拟各渲染一次,因此总共渲染2次,分别送给左右目显示镜,虚拟人A的立体视觉得以呈现。
立体视觉视频来自于用户A的立体视频采集设备节点采集的立体视频,立体视觉视频A,经有云端处理中心分派,将立体视觉视频A传送到需要观看的用户的眼镜节点,眼镜节点的处理模块获得网络传来的立体视觉视频A,将其对应的左右目部分分拆为左目动态纹理和右目动态纹理。左目动态纹理映射到增强现实场景的左网格,右目动态纹理映射到增强现实场景的右网格。图7b为另一个实施例中增强现实设备的示意图;如图7b所示,左网格只渲染到左目虚拟相机,在右目虚拟相机中消隐,右网格只渲染到右目虚拟相机,在左目虚拟相机中消隐,又因为左目虚拟相机渲染的结果将投影到眼镜节点的左目显示镜,右目虚拟相机渲染的结果将投影到眼镜节点的右目显示镜,最终呈现的增强现实场景就会呈现出立体视觉的视频流(立体视觉视频)。实施方案中,可将左右网格绑定虚拟人A的局部坐标系,这样在增强现实眼镜中就会体现随虚拟人A运动的立体视觉视频,伴随在虚拟人A周围。
应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的面向增强现实的视频处理方法的面向增强现实的视频处理装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个面向增强现实的视频处理装置实施例中的具体限定可以参见上文中对于面向增强现实的视频处理方法的限定,在此不再赘述。
在一个实施例中,如图8所示,提供了一种面向增强现实的视频处理装置,包括:接收模块802、生成模块804、映射模块806、渲染模块808和投影模块810,其中:
接收模块802,用于接收立体视觉视频;立体视觉视频包含真实对象;
生成模块804,用于基于立体视觉视频生成左目动态纹理和右目动态纹理;
映射模块806,用于将左目动态纹理映射于左网格,将右目动态纹理映射于右网格;
渲染模块808,用于将左网格连同三维虚拟世界渲染至左目虚拟相机中,得到左目渲染结果,以及将右网格连同三维虚拟世界渲染至右目虚拟相机中,得到右目渲染结果;
投影模块810,用于将左目渲染结果投影至增强现实设备的左目显示镜,将右目渲染结果投影至增强现实设备的右目显示镜,以实现增强现实场景下的立体视觉视频的立体视觉。
在一个实施例中,渲染模块808还用于依据真实对象对左网格进行剪裁处理,得到左目头像网格;依据真实对象对右网格进行剪裁处理,得到右目头像网格;将左目头像网格渲染至左目虚拟相机中,得到左目渲染结果,以及将右目头像网格渲染至右目虚拟相机中,得到右目渲染结果。
在一个实施例中,生成模块804还用于将立体视觉视频拆分为左目视频和右目视频;依据左目视频生成左目动态纹理;依据右目视频生成右目动态纹理。
在一个实施例中,如图9所示,提供了一种面向增强现实的视频处理装置,包括:控制模块812和绑定模块814,其中:
控制模块812,用于接收对象信息;对象信息包括对象动作、对象表情和对象手势,且是通过对立体视觉视频进行识别得到的;依据对象信息控制对应的虚拟三维模型。
绑定模块814,用于确定虚拟三维模型的局部坐标系;依据局部坐标系分别对左网格和右网格进行绑定处理,以使立体视觉视频伴随于虚拟三维模型的周围。
在一个实施例中,控制模块812还用于通过传感器实时采集三维空间信息;依据三维空间信息控制左目虚拟相机和右目虚拟相机进行移动。
上述实施例,通过接收立体视觉视频;立体视觉视频包含真实对象;基于立体视觉视频生成左目动态纹理和右目动态纹理;将左目动态纹理映射于左网格,将右目动态纹理映射于右网格;将左网格连同三维虚拟世界渲染至左目虚拟相机中,得到左目渲染结果,以及将右网格连同三维虚拟世界渲染至右目虚拟相机中,得到右目渲染结果;将左目渲染结果投影至增强现实设备的左目显示镜,将右目渲染结果投影至增强现实设备的右目显示镜,以实现增强现实场景下的立体视觉视频的立体视觉,通过实现包含真实对象的立体视觉视频的立体视觉,即实现了用户可利用增强现实系统与真实对象的立体视觉进行交互,有效的提升了增强现实系统对真实场景的交互能力。
上述面向增强现实的视频处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图10所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种面向增强现实的视频处理方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置,显示屏可以是液晶显示屏或电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各实施例。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各实施例。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各实施例。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种面向增强现实的视频处理方法,其特征在于,应用于增强现实设备;所述方法包括:
接收立体视觉视频;所述立体视觉视频包含真实对象;
基于所述立体视觉视频生成左目动态纹理和右目动态纹理;
将所述左目动态纹理映射于左网格,将所述右目动态纹理映射于右网格;
将所述左网格连同三维虚拟世界渲染至左目虚拟相机中,得到左目渲染结果,以及将所述右网格连同所述三维虚拟世界渲染至右目虚拟相机中,得到右目渲染结果;
将所述左目渲染结果投影至所述增强现实设备的左目显示镜,将所述右目渲染结果投影至所述增强现实设备的右目显示镜,以实现增强现实场景下的所述立体视觉视频的立体视觉。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收对象信息;所述对象信息包括对象动作、对象表情和对象手势,且是通过对所述立体视觉视频进行识别得到的;
依据对象信息控制对应的虚拟三维模型。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
确定所述虚拟三维模型的局部坐标系;
依据所述局部坐标系分别对所述左网格和所述右网格进行绑定处理,以使所述立体视觉视频伴随于所述虚拟三维模型的周围。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
通过传感器实时采集三维空间信息;
依据所述三维空间信息控制所述左目虚拟相机和所述右目虚拟相机进行移动。
5.根据权利要求1所述的方法,其特征在于,所述将所述左目动态纹理映射于左网格,将所述右目动态纹理映射于右网格之后,所述方法还包括:
依据所述真实对象对所述左网格进行剪裁处理,得到左目头像网格;
依据所述真实对象对所述右网格进行剪裁处理,得到右目头像网格;
将所述左目头像网格渲染至所述左目虚拟相机中,得到所述左目渲染结果,以及将所述右目头像网格渲染至所述右目虚拟相机中,得到所述右目渲染结果。
6.根据权利要求1所述的方法,其特征在于,所述基于所述立体视觉视频生成左目动态纹理和右目动态纹理包括:
将所述立体视觉视频拆分为左目视频和右目视频;
依据所述左目视频生成左目动态纹理;
依据所述右目视频生成右目动态纹理。
7.一种面向增强现实的视频处理装置,其特征在于,应用于增强现实眼镜设备;所述装置包括:
接收模块,用于接收立体视觉视频;所述立体视觉视频包含真实对象;
生成模块,用于基于所述立体视觉视频生成左目动态纹理和右目动态纹理;
映射模块,用于将所述左目动态纹理映射于左网格,将所述右目动态纹理映射于右网格;
渲染模块,用于将所述左网格连同三维虚拟世界渲染至左目虚拟相机中,得到左目渲染结果,以及将所述右网格连同所述三维虚拟世界渲染至右目虚拟相机中,得到右目渲染结果;
投影模块,用于将所述左目渲染结果投影至所述增强现实设备的左目显示镜,将所述右目渲染结果投影至所述增强现实设备的右目显示镜,以实现增强现实场景下的所述立体视觉视频的立体视觉。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202310612206.9A 2023-05-29 2023-05-29 面向增强现实的视频处理方法、装置和计算机设备 Pending CN116582660A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310612206.9A CN116582660A (zh) 2023-05-29 2023-05-29 面向增强现实的视频处理方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310612206.9A CN116582660A (zh) 2023-05-29 2023-05-29 面向增强现实的视频处理方法、装置和计算机设备

Publications (1)

Publication Number Publication Date
CN116582660A true CN116582660A (zh) 2023-08-11

Family

ID=87537573

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310612206.9A Pending CN116582660A (zh) 2023-05-29 2023-05-29 面向增强现实的视频处理方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN116582660A (zh)

Similar Documents

Publication Publication Date Title
US11838518B2 (en) Reprojecting holographic video to enhance streaming bandwidth/quality
US10460512B2 (en) 3D skeletonization using truncated epipolar lines
EP3057066B1 (en) Generation of three-dimensional imagery from a two-dimensional image using a depth map
CN106157359B (zh) 一种虚拟场景体验系统的设计方法
US10999412B2 (en) Sharing mediated reality content
EP3959688B1 (en) Generative latent textured proxies for object category modeling
WO2022108662A1 (en) Multiple device sensor input based avatar
TWI813098B (zh) 用於新穎視圖合成之神經混合
US20180239514A1 (en) Interactive 3d map with vibrant street view
CN114401414A (zh) 沉浸式直播的信息显示方法及系统、信息推送方法
CN108881886A (zh) 一种基于相机矩阵技术实现在显示端进行大数据无损交互应用的方法
CN116097316A (zh) 用于非模态中心预测的对象识别神经网络
CN111602391B (zh) 用于根据物理环境定制合成现实体验的方法和设备
US20190295324A1 (en) Optimized content sharing interaction using a mixed reality environment
CN113678173A (zh) 用于虚拟对象的基于图绘的放置的方法和设备
CN116582660A (zh) 面向增强现实的视频处理方法、装置和计算机设备
CN113139992A (zh) 多分辨率体素网格化
WO2022224964A1 (ja) 情報処理装置及び情報処理方法
WO2017124871A1 (zh) 一种呈现多媒体信息的方法及装置
JP7261121B2 (ja) 情報端末装置及びプログラム
CN116560511A (zh) 画面展示方法、装置、计算机设备和存储介质
US20240112394A1 (en) AI Methods for Transforming a Text Prompt into an Immersive Volumetric Photo or Video
WO2022249536A1 (ja) 情報処理装置及び情報処理方法
JP2023513980A (ja) 画面上の話者のフューショット合成
CN117075771A (zh) 基于虚拟现实空间的画面显示方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination