CN112150603A

CN112150603A - 基于三维点云的初始视角控制和呈现方法及系统

Info

Publication number: CN112150603A
Application number: CN201910590125.7A
Authority: CN
Inventors: 徐异凌; 高粼遥; 李哲; 朱文婕; 管云峰
Original assignee: Shanghai Jiaotong University
Current assignee: Shanghai Jiaotong University
Priority date: 2019-06-28
Filing date: 2019-07-02
Publication date: 2020-12-29
Anticipated expiration: 2039-07-02
Also published as: EP3992917A1; US11836882B2; JP7317401B2; CN112150603B; CN117635815A; JP2022534269A; US20220148280A1; EP3992917A4; KR20220013410A; WO2020259682A1

Abstract

本发明提供了一种基于三维点云的初始视角控制和呈现方法及系统，包括：读取并解析三维媒体流；确定初始视点、初始视点的法向量方向、初始视点的正方向向量；反馈用户位置对于初始视点的相对位移；确定内容制作方指定的缩放尺度，或确定根据用户位置与初始视点的相对位移计算的深度值设定的缩放尺度。本发明提供的基于三维点云的初始视角及呈现方法，支持用户在初始消费三维媒体内容时观看到内容制作方指定的初始角度即感兴趣区域，同时支持三维媒体内容的缩放，即尺度变换。此外，在实时交互的场景下，用户观看到的视野范围能够根据用户与初始视点的相对位置进行调整，依据用户交互行为充分提高视觉媒体消费自由度，提供身临其境的用户体验。

Description

基于三维点云的初始视角控制和呈现方法及系统

技术领域

本发明涉及3D媒体数据封装与消费过程的设计领域，具体地，涉及一种基于三维点云的初始视角控制和呈现方法及系统。

背景技术

随着信息技术的快速发展，基于文字、图片、传统视频的消费模式趋于成熟，提供更高逼真度、更强交互性、更多元化的视觉通信逐渐成为发展热点。视觉通信通过精确渲染的三维点云、六自由度全方位体验、虚实结合实时交互等技术手段，为用户提供不受时间、地域、现实条件限制的、身临其境的真实体验的同时，更给新应用带来无限空间。

视觉媒体数据生成、传输、处理和呈现等方面与传统媒体数据存在较大的不同，视觉媒体数据更加复杂多元。为满足用户的呈现需求，相应的数据描述方法也受到了广泛的关注。得益于三维扫描技术和系统日趋成熟，三维点云数据在学术界和工业界引起了广泛的关注。

三维点云是空间中一系列点的几何，记录了被扫描物体表面各点的一组的三维坐标信息和多种属性信息，如纹理、材质、法向量、反射强度等。三维点云数据是真实物体的几何描述，是一种新的三维模型数据格式，作为视觉通信场景下表达信息的主要载体，不仅可以有效的表示视觉媒体服务中的静态实物和场景，还可以实时渲染精确的立体模型，真实地描述动态实物或场景信息。因此，三维点云数据可以为用户带来虚实结合、实时交互的沉浸式消费体验。

目前对于如何存储、传输三维点云数据已有一定的研究，但现有三维点云封装信息只考虑了点云数据整体呈现效果，并未考虑不同场景下用户的呈现需求，如用户对于三维点云媒体的初始呈现需求。当用户打开点云媒体文件时，更希望直接消费感兴趣的区域，而不是某些奇怪的角度或不感兴趣区域。因此，为满足用户不同场景下的初始呈现需求，需要对三维点云媒体数据的封装信息进行扩展，对三维点云呈现时的初始视角信息进行定义，使用户在初始消费三维媒体内容时观看到内容制作方指定的初始观看角度即用户感兴趣区域，以满足用户对于三维视觉媒体的初始呈现需求。

发明内容

针对现有技术中的缺陷，本发明的目的是提供一种基于三维点云的初始视角控制和呈现方法及系统。

根据本发明提供的一种基于三维点云的初始视角控制和呈现方法，包括：

读取并解析三维媒体流；

确定初始视点、初始视点的法向量方向、初始视点的正方向向量；

反馈用户位置对于初始视点的相对位移；

确定内容制作方指定的缩放尺度，或确定根据用户位置与初始视点的相对位移计算的深度值设定的缩放尺度；

根据用户位置视点内的视野和深度，确定当前用户位置的观看视野范围；

呈现三维媒体流中观看视野范围的部分媒体内容或全部媒体内容。

优选地，还包括：

变更后视点位置和变更后视点的法向量方向。

优选地，所述初始视点的正方向向量为与呈现设备规定的正方向平行的方向向量，初始视点的正方向向量包括：以初始视点为坐标原点建立坐标系，确定初始视点以外的正方向向量终点的x坐标信息、y坐标信息、z坐标信息。

优选地，所述深度值为用户位置相对初始视点的距离。

优选地，所述视点内视野为用户起始位置点为圆心，到初始视点的距离为半径的一个圆形视野。

优选地，所述三维媒体流是经过三维媒体数据封装形成，在所述三维媒体数据中添加指示信息，所述指示信息包括：

信息一：初始视点位置信息；

信息二：初始视点法向量相对初始视点的位置信息；

信息三：初始视点的正方向向量信息；

以及至少一个以下信息：

信息四：三维媒体的缩放尺度信息；

信息五：变更后视点的位置信息，变更后视点的法向量相对变更后视点的位置信息；

信息六：实时相对位移：用户实时位置相对初始视点的位置信息；

信息七：根据用户实时位置调整对应的观看区域范围。

优选地，所述初始视点的法向量方向包括：以初始视点为坐标原点建立坐标系，确定初始视点以外的法向量终点的x坐标信息、y坐标信息、z坐标信息。

优选地，所述用户位置与初始视点的相对位移包括：以初始视点为坐标原点建立坐标系，用户观看位置的x坐标信息、y坐标信息、z坐标信息。

优选地，所述缩放尺度为三维媒体内容呈现的缩放系数。

优选地，所述变更后视点位置包括：变更后视点的x坐标信息、y坐标信息、z坐标信息。

优选地，所述变更后视点的法向量方向包括：以变更后视点为坐标原点建立坐标系，确定变更后视点以外的法向量终点的x坐标信息、y坐标信息、z坐标信息。

根据本发明提供的一种基于三维点云的初始视角控制和呈现系统，包括：

解析模块：用于读取并解析三维媒体流；

初始视角确定模块：用于确定初始视点、初始视点的法向量方向、初始视点的正方向向量；

位移反馈模块：用于反馈用户实时位置对于初始视点的相对位移；

缩放尺度确定模块：用于确定内容制作方指定的缩放尺度，或确定根据用户位置与初始视点的相对位移计算的深度值设定的缩放尺度；

观看视野范围确定模块：用于根据用户位置视点内的视野和深度，确定当前用户位置的观看视野范围；

三维媒体呈现模块：用于呈现三维媒体流中观看视野范围的部分媒体内容或全部媒体内容。

优选地，还包括：

视点变更模块：用于确定变更后视点的位置和变更后视点的法向量方向。

与现有技术相比，本发明具有如下的有益效果：

本发明提供的基于三维点云的初始视角及呈现方法，支持用户在初始消费三维媒体内容时观看到内容制作方指定的初始角度即感兴趣区域，同时支持三维媒体内容的缩放，即尺度变换。此外，在实时交互的场景下，用户观看到的视野范围能够根据用户与初始视点的相对位置进行调整，依据用户交互行为充分提高视觉媒体消费自由度，提供身临其境的用户体验。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1为本发明实施例中一种基于三维点云的初始视角控制和呈现方法流程示意图；

图2为本发明实施例中一种基于三维点云的初始视角控制和呈现系统功能框示意图；

图3-1和图3-2为本发明实施例中用户实时观看位置与当前用户位置观看视野范围关系的一个具体应用实例示意图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明，但不以任何形式限制本发明。应当指出的是，对本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变化和改进。这些都属于本发明的保护范围。

如图1所示，根据本发明提供的一种基于三维点云的初始视角控制和呈现方法，包括：

解析步骤：读取并解析三维媒体流；

初始视角确定步骤：确定初始视点、初始视点的法向量方向、初始视点的正方向向量；

位移反馈步骤：根据用户实时观看位置反馈用户位置对于初始视点的相对位移；

缩放尺度确定步骤：根据内容制作方指定的缩放尺度，或根据用户位置与初始视点的相对位移确定当前深度值，根据深度值设定缩放尺度；

视点变更步骤：确定变更后视点位置及变更后视点的法向量方向；

观看视野范围确定步骤：根据用户位置对于初始视点的相对位移确定当前深度值，根据用户位置视点内视野和深度的关系确定当前用户位置的观看视野范围；

三维媒体呈现步骤：呈现三维媒体流中与观看视野范围相应的内容或全部媒体内容。

根据本发明提供的一种基于三维点云的初始视角控制及呈现系统，包括：

解析模块：用于读取并解析三维媒体流；

位移反馈模块：用于反馈用户实时观看位置对于初始视点的相对位移；

缩放尺度确定模块：用于确定三维媒体内容制作方指定的缩放尺度，或根据用户位置与初始视点的相对位移确定当前深度值，根据深度值确定缩放尺度；

视点变更模块：用于确定变更后视点位置及变更后视点的法向量方向；

观看视野范围确定模块：用于根据用户位置视点内视野和深度的关系确定当前用户位置的观看视野范围；

三维媒体呈现模块：用于呈现三维媒体流中与观看视野范围相应的内容或全部媒体内容。

本发明的目的是提供一种基于三维点云的初始视角控制及呈现方法，能够指示用户在消费三维点云媒体内容时的初始观看方向，并支持尺度变换。同时，指示用户在消费三维点云媒体内容时的交互行为，以获取符合用户需求以及不同应用场景的三维点云媒体内容。

下面结合附图和具体实例对本发明中的技术方案做更加详细的说明。

以三维点云数字文化遗产展示为例。文化遗产数字化即利用激光扫描技术获取文化遗产的三维点云数据并最终实现文化遗产的三维重建，对文物进行存档，以永久、完整地展示文化遗产内涵。针对不同的文物类型，如大型文物建筑、小型文物、大型遗址场景等，用户的消费需求也不尽相同。

实施例1：

针对小型文物的三维点云模型，媒体内容制作方可以指定用户打开媒体内容文件时呈现的初始方向、缩放尺度及是否旋转展示，即指定初始视点的位置信息、初始视点的法向量信息、初始视点的正方向向量信息、缩放系数，以及根据用户需求指定物体旋转的变更的初始视点位置信息、变更后视点的法向量信息，以便全方位、多尺度观察文物。

实施例2：

如图3-1和图3-2所示，针对大型遗址场景的三维点云模型，如虚拟现实博物馆，用户可以在展区内与周围的三维点云场景以及附近的三维点云物体相互作用，所看到的展览区域会与用户移动的位置成一定关系变化，模拟现实中用户“靠近”及“远离”观看对象的效果，即支持用户实际观看区域随交互行为(记作“实时相对位移”)的适应性调整。例如，用户可以通过靠近展品的行为观察场景中更细节的部分，以获得沉浸式的用户体验。

在这种场景下，除支持三维点云媒体内容呈现时的初始方向、缩放尺度、是否旋转展示信息外，用户还可以沉浸式的消费三维点云媒体内容。如支持用户在场景内随意走动，此时客户端会通过定位用户实时位置信息，直接将用户实时相对位移反馈给服务器，服务器可以根据反馈的用户实时位置信息得到当前用户观看位置相对初始视点的相对距离即深度值，并根据解析的深度值、缩放系数确定当前位置用户能够观看的区域范围，然后将当前用户观看位置相应的观看视野范围呈现给用户，以满足用户在场景内走动时能够实现“靠近”及“远离”观看对象效果的需求。

为实现上述目的，需在三维点云媒体数据的封装信息中增加新的指示信息，所述指示信息包括：

信息一：初始视点位置信息；

信息二：初始视点法向量相对初始视点的位置信息；

信息三：初始视点的正方向向量信息；

以及至少一个以下信息：

信息四：三维媒体的缩放尺度信息；

信息七：根据用户实时位置调整对应的观看区域范围。

对三维媒体内容的初始视角及呈现进行信息标识，标识信息指示了初始视点位置信息、初始视点的法向量信息、初始视点的正方向向量信息、缩放尺度信息、变更后视点位置信息、变更后视点的法向量信息、用户实时观看位置信息及当前用户观看位置对应的观看视野范围。

针对以上问题，可以根据需要合理地添加如下字段：

viewpoint_x：指示初始视点位置的x坐标信息；

viewpoint_y：指示初始视点位置的y坐标信息；

viewpoint_z：指示初始视点位置的z坐标信息；

normal_x：指示初始视点的法向量相对初始视点的x坐标信息；

normal_y：指示初始视点的法向量相对初始视点的y坐标信息；

normal_z：指示初始视点的法向量相对初始视点的z坐标信息；

scale_factor：定义为一个缩放系数；

positive_direction_vector_x：指示初始视点的正方向向量相对初始视点的x坐标信息；

positive_direction_vector_y：指示初始视点的正方向向量相对初始视点的x坐标信息；

positive_direction_vector_z：指示初始视点的正方向向量相对初始视点的x坐标信息；

rotation_included_flag：指示媒体播放过程中是否支持旋转，即初始视角是否改变；rotation_included_flag为0表示媒体播放过程中不支持旋转，即初始视角不改变；否则，初始视角改变，变更后视点位置信息由viewpoint_rx、viewpoint_ry、viewpoint_rz表示，变更后视点的法向量信息由normal_rx、normal_ry、normal_rz表示。

viewpoint_rx：指示变更后视点位置的x坐标信息；

viewpoint_ry：指示变更后视点位置的y坐标信息；

viewpoint_rz：指示变更后视点位置的z坐标信息；

normal_rx：指示变更后视点的法向量相对变更后视点的x坐标信息；

normal_ry：指示变更后视点的法向量相对变更后视点的y坐标信息；

normal_rz：指示变更后视点的法向量相对变更后视点的z坐标信息；

real_time_interaction_flag：指示媒体播放过程中是否支持用户位置的实时交互；real_time_interaction_flag为0表示不支持媒体播放过程中用户位置的实时交互；否则，支持媒体播放过程中用户位置的实时交互，用户实时位置信息由vposition_x、vposition_y、vposition_z表示。

vposition_x：指示用户实时位置相对初始视点的x坐标信息；

vposition_y：指示用户实时位置相对初始视点的y坐标信息；

vposition_z：指示用户实时位置相对初始视点的z坐标信息；

move_depth：指示用户实时位置相对初始视点的相对距离，记为观看深度，可以根据反馈用户实时位置坐标信息vposition_x、vposition_y、vposition_z得出。

viewing_range_field：指示用户在实时位置上能够观看的区域范围，可以根据观看深度、缩放系数确定；

以下实施例中为了描述方便，引用上述的一组指示信息描述，但在其他实施例中，也可以或也可能是其他信息。

基于以上信息，以InitialViewingOrientationSample为例，下面给出一种对这些信息的组织结构。

上述各字段的含义已在上文中做出说明。

需要注意的是，本发明中只是以上述字段为例对可伸缩扩展特性进行说明，并不局限于以上字段及其大小。

本实施例中以InitialViewingOrientationSample为例，阐明所提出的解决方案，但是这些方案同样可以用于其他文件封装协议里。

基于上述表述，以下给出具体应用实例：

具体地，针对小型文物的三维点云模型，媒体内容制作方可以指定用户打开媒体内容文件时呈现的初始方向、缩放尺度及是否旋转展示，即指定初始视点的位置viewpoint_x、viewpoint_y、viewpoint_z信息，初始视点的法向量normal_x、normal_y、normal_z信息，初始视点的正方向向量信息positive_direction_vector_x、positive_direction_vector_y、positive_direction_vector_z，缩放系数scale_fator，以及根据是否支持旋转的需求指定物体旋转的变更的初始视点位置viewpoint_rx、viewpoint_ry、viewpoint_rz信息，变更后视点的法向量normal_rx、normal_ry、normal_rz信息，以便全方位、多尺度观察文物。

具体地，如图3-1和图3-2所示，针对大型遗址场景的三维点云模型，如虚拟现实博物馆，用户可以在展区内与周围的三维点云场景以及附近的三维点云物体相互作用，所看到的展览区域会与用户移动的位置成一定关系变化，模拟现实中用户“靠近”及“远离”观看对象的效果，即支持用户实际观看区域随交互行为(记作“实时相对位移”)的适应性调整。例如，用户可以通过靠近展品的行为观察场景中更细节的部分，以获得沉浸式的用户体验。在这种场景下，除支持三维点云媒体内容呈现时的初始方向、缩放尺度、是否旋转展示信息，即初始视点的位置viewpoint_x、viewpoint_y、viewpoint_z信息，初始视点的法向量normal_x、normal_y、normal_z信息，初始视点的正方向向量信息positive_direction_vector_x、positive_direction_vector_y、positive_direction_vector_z，缩放系数scale_fator，以及根据是否支持旋转的需求指定物体旋转的变更的初始视点位置viewpoint_rx、viewpoint_ry、viewpoint_rz信息，变更后视点的法向量normal_rx、normal_ry、normal_rz信息外，用户还可以沉浸式的消费三维点云媒体内容。如支持用户在场景内随意走动，此时客户端会通过定位用户实时位置vposition_x、vposition_y、vposition_z信息，直接将用户实时相对位移反馈给服务器，服务器可以根据反馈的用户实时位置vposition_x、vposition_y、vposition_z信息得到当前用户观看位置相对初始视点的相对距离即深度值move_depth，并根据解析的深度值、缩放系数确定当前位置用户能够观看的区域范围viewing_range_field，然后将当前用户观看位置相应的观看视野范围呈现给用户，以满足用户在场景内走动时能够实现“靠近”及“远离”观看对象效果的需求。

本领域技术人员知道，除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外，完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以，本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件，而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构；也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。

以上对本发明的具体实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，本领域技术人员可以在权利要求的范围内做出各种变化或修改，这并不影响本发明的实质内容。在不冲突的情况下，本申请的实施例和实施例中的特征可以任意相互组合。

Claims

1.一种基于三维点云的初始视角控制和呈现方法，其特征在于，包括：

读取并解析三维媒体流；

反馈用户位置对于初始视点的相对位移；

2.根据权利要求1所述的一种基于三维点云的初始视角控制和呈现方法，其特征在于，还包括：

变更后视点位置和变更后视点的法向量方向。

3.根据权利要求1所述的一种基于三维点云的初始视角控制和呈现方法，其特征在于，所述初始视点的正方向向量为与呈现设备规定的正方向平行的方向向量，初始视点的正方向向量包括：以初始视点为坐标原点建立坐标系，确定初始视点以外的正方向向量终点的x坐标信息、y坐标信息、z坐标信息。

4.根据权利要求1所述的一种基于三维点云的初始视角控制和呈现方法，其特征在于，所述深度值为用户位置相对初始视点的距离。

5.根据权利要求1所述的一种基于三维点云的初始视角控制和呈现方法，其特征在于，所述视点内视野为用户起始位置点为圆心，到初始视点的距离为半径的一个圆形视野。

6.根据权利要求1所述的一种基于三维点云的初始视角控制和呈现方法，其特征在于，所述三维媒体流是经过三维媒体数据封装形成，在所述三维媒体数据中添加指示信息，所述指示信息包括：

信息一：初始视点位置信息；

信息二：初始视点法向量相对初始视点的位置信息；

信息三：初始视点的正方向向量信息；

以及至少一个以下信息：

信息四：三维媒体的缩放尺度信息；

信息七：根据用户实时位置调整对应的观看区域范围。

7.根据权利要求1所述的一种基于三维点云的初始视角控制和呈现方法，其特征在于，所述初始视点的法向量方向包括：以初始视点为坐标原点建立坐标系，确定初始视点以外的法向量终点的x坐标信息、y坐标信息、z坐标信息。

8.根据权利要求1所述的一种基于三维点云的初始视角控制和呈现方法，其特征在于，所述用户位置与初始视点的相对位移包括：以初始视点为坐标原点建立坐标系，用户观看位置的x坐标信息、y坐标信息、z坐标信息。

9.根据权利要求1所述的一种基于三维点云的初始视角控制和呈现方法，其特征在于，所述缩放尺度为三维媒体内容呈现的缩放系数。

10.根据权利要求1或权利要求2所述的一种基于三维点云的初始视角控制和呈现方法，其特征在于，所述变更后视点位置包括：变更后视点的x坐标信息、y坐标信息、z坐标信息。

11.根据权利要求1或权利要求2所述的一种基于三维点云的初始视角控制和呈现方法，其特征在于，所述变更后视点的法向量方向包括：以变更后视点为坐标原点建立坐标系，确定变更后视点以外的法向量终点的x坐标信息、y坐标信息、z坐标信息。

12.一种基于三维点云的初始视角控制和呈现系统，其特征在于，包括：

解析模块：用于读取并解析三维媒体流；

13.根据权利要求12所述的一种基于三维点云的初始视角控制和呈现系统，其特征在于，还包括：