WO2022095467A1

WO2022095467A1 - 增强现实场景下的展示方法、装置、设备、介质及程序

Info

Publication number: WO2022095467A1
Application number: PCT/CN2021/102191
Authority: WO
Inventors: 刘旭; 栾青; 李斌
Original assignee: 北京市商汤科技开发有限公司
Priority date: 2020-11-06
Filing date: 2021-06-24
Publication date: 2022-05-12
Also published as: CN112348969B; TW202220438A; CN112348969A

Abstract

一种增强现实场景下的展示方法、装置、设备、介质及程序，其中，首先获取增强现实AR设备拍摄的当前场景图像（S110）；其次，基于所述当前场景图像对目标对象的识别结果，确定所述目标对象匹配的特效数据以及所述特效数据的展示位置信息（S120）；最后，基于所述展示位置信息，控制所述AR设备播放所述特效数据；其中，所述特效数据包括虚拟影像和音频中的至少之一，所述虚拟影像的展示位置与所述目标对象之间具有预设位置关系（S130）。

Description

增强现实场景下的展示方法、装置、设备、介质及程序

相关申请的交叉引用

本专利申请要求2020年11月06日提交的中国专利申请号为202011233879.6、申请人为北京市商汤科技开发有限公司，申请名称为“增强现实场景下的展示方法、装置、电子设备及存储介质”的优先权，该申请的全文以引用的方式并入本申请中。

技术领域

本公开涉及增强现实技术领域，尤其涉及一种增强现实场景下的展示方法、装置、设备、介质及程序。

背景技术

增强现实(Augmented Reality，AR)技术，通过将实体信息(视觉信息、声音、触觉等)通过模拟仿真后，叠加到真实世界中，从而将真实的环境和虚拟的物体实时地在同一个画面或空间呈现。

相关技术中，定位方式是通过识别AR设备当前所处的位置，映射到三维地图模型中的某一位置，进而展示该位置所在范围内的预设好的虚拟特效数据。这种方式不仅需要采集大批量图像来重构真实环境对应的三维地图模型，而且预设好的虚拟数据展示出来的效果单一，不够丰富和生动。

发明内容

本公开实施例提供一种增强现实场景下的展示方法、装置、设备、介质及程序。

本公开实施例提供了一种增强现实场景下的展示方法，所述方法由电子设备执行，所述方法包括：

获取增强现实AR设备拍摄的当前场景图像；

基于所述当前场景图像对目标对象的识别结果，确定所述目标对象匹配的特效数据以及所述特效数据的展示位置信息；

基于所述展示位置信息，控制所述AR设备播放所述特效数据；所述特效数据包括虚拟影像和音频中的至少之一，所述虚拟影像的展示位置与所述目标对象之间具有预设位置关系。

如此，能够基于对目标对象的识别结果，实现虚拟影像和音频的综合展示，即不仅能够展示与目标对象匹配的AR画面、视频、全息影像等虚拟影像，另外，无需重新构建三维地图模型，能够直接通过目标对象的识别结果即可触发匹配的特效数据进行展示，并且，特效数据中的虚拟影像的展示位置与目标对象之间具有预设位置关系，使其展示效果能够与目标对象紧密关联，能够更有针对性的去展示特效数据。

在本公开的一些实施例中，所述基于所述当前场景图像对目标对象的识别结果，确定所述特效数据的展示位置信息，包括：在所述当前场景图像中识别到所述目标对象的情况下，基于所述目标对象在所述当前场景图像中的图像位置信息，确定所述特效数据的展示位置信息。如此，基于当前场景图像中目标对象的识别结果，切换对应的定位方式来确定特效数据的展示位置信息，可以有效降低由于其中一种定位方式定位失败而中断特效数据的展示的概率，提高了特效数据展示的稳定性。

在本公开的一些实施例中，所述基于所述当前场景图像对目标对象的识别结果，确定所述特效数据的展示位置信息，包括：在所述当前场景图像中未识别到所述目标对象的情况下，获取世界坐标系下所述目标对象与所述AR设备之间的相对位置信息，并基于所述相对位置信息，确定所述特效数据的展示位置信息。如此，基于当前场景图像中目标对象的识别结果，切换对应的定位方式来确定特效数据的展示位置信息，可以有效降低由于其中一种定位方式定位失败而中断特效数据的展示的概率，提高了特效数据展示的稳定性。

在本公开的一些实施例中，所述基于所述展示位置信息，控制所述AR设备播放所述特效数据，包括：在确定所述目标对象的至少部分在所述AR设备的图像展示范围的情况下，基于所述展示位置信息，控制所述AR设备播放所述特效数据中的至少部分特效数据；其中，所述至少部分特效数据为所述目标对象的至少部分对应的所述虚拟影像和音频中的至少之一；在确定所述目标对象未在所述AR设备的图像展示范围的情况下，基于所述展示位置信息，控制所述AR设备按照所述音频的已播放进度继续播放所述音频。如此，在AR设备的图像展示范围内包括至少部分目标对象的情况下，展示至少部分对应的虚拟影像和音频中的至少之一，在AR设备的图像展示范围内不包括目标对象时，不展示虚拟影像，只展示音频，使得特效数据展示的效果更为合理，也使得特效数据的展示效果更为连贯。

在本公开的一些实施例中，所述虚拟影像包括全息影像；所述展示方法还包括：获取与所述目标对象匹配的待处理视频，所述待处理视频中包括与所述目标对象关联的目标关联对象；为所述待处理视频中的每个像素点设置透明通道，得到第一视频；基于所述透明通道，从所述第一视频中去除背景像素点，得到第二视频；基于所述第二视频生成包括所述目标关联对象的全息影像。如此，虚拟影像还包括全息影像，展示与目标对象关联的目标关联对象对应的全息影像，还可以在当前场景图像中叠加显示全息影像，使得AR内容的展示效果更为丰富。

在本公开的一些实施例中，所述基于所述透明通道，从所述第一视频中去除背景像素点，得到第二视频，包括：将所述第一视频中的背景像素点对应的透明通道设置为白色，得到第三视频；所述第一视频包括所述目标关联对象的目标像素点和除所述目标像素点以外的背景像素点；将所述第一视频中的第一类像素点对应的透明通道设置为黑色，将第一视频中的第二类像素点对应的透明通道设置为白色，将所述第一视频中的第三类像素点对应的透明通道设置为预设灰色值，得到第四视频；所述第三类像素点包括与所述背景像素点相邻的目标像素点和与所述目标像素点相邻的背景像素点；所述第一类像素点包括除所述第三类像素点以外的所述背景像素点，所述第二类像素点包括除所述第三类像素点以外的目标像素点；基于第三视频和第四视频，生成所述第二视频。如此，通过对第一视频的不同类型像素点进行处理，可以实现将原视频调整为全息影像的展示效果。

在本公开的一些实施例中，所述虚拟影像包括多个虚拟对象的影像，以及多个虚拟对象之间的展示顺序和交互数据中的至少之一；所述基于所述展示位置信息，控制所述AR设备播放所述特效数据，包括：在所述展示位置信息对应的展示位置上，基于所述多个虚拟对象之间的展示顺序和交互数据中的至少之一，展示所述虚拟对象的影像。如此，按照多个虚拟对象之间的展示顺序，展示包括多个虚拟对象的影像以及多个虚拟对象之间的交互数据，能够丰富AR展示的内容，提高AR内容的展示效果。

在本公开的一些实施例中，所述基于所述目标对象在所述当前场景图像中的图像位置信息，确定所述特效数据的展示位置信息，包括：基于所述目标对象在所述当前场景图像中的图像位置信息，确定所述目标对象在世界坐标系下的位置信息；基于所述目标对象在所述世界坐标系下的位置信息和所述AR设备在所述世界坐标系下的位置信息，确定所述特效数据的展示位置信息。如此，可以较为准确地确定出目标对象在当前场景图像中的图像位置信息，基于目标对象的图像位置信息可以较为准确地得到特效数据的展示位置信息，从而为特效数据的准确展示提供支持。

在本公开的一些实施例中，所述获取世界坐标系下所述目标对象与所述AR设备之间的相对位置信息，包括：基于所述当前场景图像、历史场景图像、以及所述AR设备在拍摄所述历史场景图像时与所述目标对象在所述世界坐标系下的相对位置信息，确定所述AR设备在拍摄当前场景图像时，与所述目标对象之间的相对位置信息。如此，利用当前场景图像、历史场景图像、以及所述AR设备在拍摄所述历史场景图像时与所述目标对象在世界坐标系下的相对位置信息，能够较为准确的确定AR设备在拍摄当前场景图像时，与所述目标对象之间的相对位置信息，从而为特效数据的准确展示提供支持。

在本公开的一些实施例中，按照以下方式识别所述当前场景图像中是否包含所述目标对象：对所述当前场景图像进行特征点提取，得到所述当前场景图像包含的多个特征点分别对应的特征信息；所述多个特征点位于所述当前场景图像中的目标检测区域中；基于所述多个特征点分别对应的特征信息与预先存储的所述目标对象包含的多个特征点分别对应的特征信息进行比对，确定所述当前场景图像中是否包含所述目标对象。如此，利用上述特征点的提取和比对能够较为准确的确定当前场景图像中是否存在目标对象。

以下装置、电子设备等的效果描述参见上述增强现实场景下的展示方法的说明。

本公开实施例提供了一种增强现实场景下的展示装置，包括：

图像获取模块，配置为获取增强现实AR设备拍摄的当前场景图像；

位置确定模块，配置为基于所述当前场景图像对目标对象的识别结果，确定所述目标对象匹配的特效数据以及所述特效数据的展示位置信息；

特效播放模块，配置为基于所述展示位置信息，控制所述AR设备播放所述特效数据；所述特效数据包括虚拟影像和音频中的至少之一，所述虚拟影像的展示位置与所述目标对象之间具有预设位置关系。

在本公开的一些实施例中，所述位置确定模块，配置为在所述当前场景图像中识别到所述目标对象的情况下，基于所述目标对象在所述当前场景图像中的图像位置信息，确定所述特效数据的展示位置信息。

在本公开的一些实施例中，所述位置确定模块，配置为在所述当前场景图像中未识别到所述目标对象的情况下，获取世界坐标系下所述目标对象与所述AR设备之间的相对位置信息，并基于所述相对位置信息，确定所述特效数据的展示位置信息。

在本公开的一些实施例中，所述特效播放模块，配置为在确定所述目标对象的至少部分在所述AR设备的图像展示范围的情况下，基于所述展示位置信息，控制所述AR设备播放所述特效数据中的至少部分特效数据；其中，所述至少部分特效数据为所述目标对象的至少部分对应的所述虚拟影像和音频中的至少之一；在确定所述目标对象未在所述AR设备的图像展示范围的情况下，基于所述展示位置信息，控制所述AR设备按照所述音频的已播放进度继续播放所述音频。

在本公开的一些实施例中，所述虚拟影像包括全息影像；所述展示装置还包括全息影像生成模块，配置为获取与所述目标对象匹配的待处理视频，所述待处理视频中包括与所述目标对象关联的目标关联对象；为所述待处理视频中的每个像素点设置透明通道，得到第一视频；基于所述透明通道，从所述第一视频中去除背景像素点，得到第二视频；基于所述第二视频生成包括所述目标关联对象的全息影像。

在本公开的一些实施例中，所述全息影像生成模块，配置为将所述第一视频中的背景像素点对应的透明通道设置为白色，得到第三视频；所述第一视频包括所述目标关联对象的目标像素点和除所述目标像素点以外的背景像素点；将所述第一视频中的第一类像素点对应的透明通道设置为黑色，将所述第一视频中的第二类像素点对应的透明通道设置为白色，将所述第一视频中的第三类像素点对应的透明通道设置为预设灰色值，得到第四视频；所述第三类像素点包括与所述背景像素点相邻的目标像素点和与所述目标像素点相邻的背景像素点；所述第一类像素点包括除所述第三类像素点以外的背景像素点，所述第二类像素点包括除所述第三类像素点以外的目标像素点；基于第三视频和第四视频，生成所述第二视频。

在本公开的一些实施例中，所述虚拟影像包括多个虚拟对象的影像，以及所述多个虚拟对象之间的展示顺序和交互数据中的至少之一；所述特效播放模块，配置为在所述展示位置信息对应的展示位置上，基于所述多个虚拟对象之间的展示顺序和交互数据中的至少之一，展示所述虚拟对象的影像。

在本公开的一些实施例中，所述位置确定模块，配置为基于所述目标对象在所述当前场景图像中的图像位置信息，确定所述目标对象在世界坐标系下的位置信息；基于所述目标对象在所述世界坐标系下的位置信息和所述AR设备在所述世界坐标系下的位置信息，确定所述特效数据的展示位置信息。

在本公开的一些实施例中，所述位置确定模块，配置为基于所述当前场景图像、历史场景图像、以及所述AR设备在拍摄所述历史场景图像时与所述目标对象在所述世界坐标系下的相对位置信息，确定所述AR设备在拍摄当前场景图像时，与所述目标对象之间的相对位置信息。

在本公开的一些实施例中，所述位置确定模块，配置为按照以下方式识别所述当前场景图像中是否包含所述目标对象：对所述当前场景图像进行特征点提取，得到所述当前场景图像包含的多个特征点分别对应的特征信息；所述多个特征点位于所述当前场景图像中的目标检测区域中；基于所述多个特征点分别对应的特征信息与预先存储的所述目标对象包含的多个特征点分别对应的特征信息进行比对，确定所述当前场景图像中是否包含所述目标对象。

本公开实施例还提供一种电子设备，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行上述任一实施例所述的增强现实场景下的展示方法。

本公开实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述任一实施例所述的增强现实场景下的展示方法。

本公开实施例还提供一种计算机程序，所述计算机程序包括计算机可读代码，在所述计算机可读代码在电子设备中运行的情况下，所述电子设备的处理器执行如上述任一实施例所述的增强现实场景下的展示方法。

本公开实施例至少提供一种增强现实场景下的展示方法、装置、设备、介质及程序，能够基于对目标对象的识别结果，实现虚拟影像和音频的综合展示，即不仅能够展示与目标对象匹配的AR画面、视频、全息影像等虚拟影像，另外，无需重新构建三维地图模型，能够直接通过目标对象的识别结果即可触发匹配的特效数据进行展示，并且，特效数据中的虚拟影像的展示位置与目标对象之间具有预设位置关系，使其展示效果能够与目标对象紧密关联，能够更有针对性的去展示特效数据。

为使本公开的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本公开实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，此处的附图被并入说明书中并构成本说明书中的一部分，这些附图示出了符合本公开的实施例，并与说明书一起用于说明本公开实施例的技术方案。应当理解，以下附图仅示出了本公开的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本公开实施例所提供的一种增强现实场景下的展示方法的流程示意图；

图2示出可以应用本公开实施例的增强现实场景下的展示方法的一种系统架构示意图；

图3示出了本公开实施例所提供的基于目标对象在AR设备的图像展示范围内，控制AR设备播放特效数据的流程示意图；

图4A示出了本公开实施例所提供的生成全息影像的流程示意图；

图4B示出了本公开实施例所提供的去除第一视频中的背景像素点，得到第二视频的流程示意图；

图5A示出了本公开中展示的特效数据的示意图之一；

图5B示出了本公开中待处理视频中的一张图像；

图5C示出了本公开中第四视频中的一张图像；

图6A示出了本公开中展示的特效数据的示意图之二；

图6B示出了本公开中展示的特效数据的示意图之三；

图6C示出了本公开中展示的特效数据的示意图之四；

图7示出了本公开实施例所提供的识别当前场景图像中是否包含目标对象的流程示意图；

图8示出了本公开实施例所提供的一种增强现实场景下的展示装置的结构示意图；

图9示出了本公开实施例所提供的一种电子设备的结构示意图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围，而是仅仅表示本公开的选定实施例。基于本公开的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本公开保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

本文中术语“和/或”，仅仅是描述一种关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合，例如，包括A、B、C中的至少一种，可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。

本公开实施例中的多个或者多种可以分别指的是至少两个或者至少两种。

随着AR技术的发展，逐渐将AR技术应用于多种领域中，比如可以在实体对象上叠加AR内容，通过AR内容向用户形象生动地介绍实体对象。但是相关技术中，AR设备上展示AR内容时，需要识别AR设备当前所处的位置，之后映射到三维地图模型中的某一位置，进而展示该位置所在范围内的预设好的虚拟特效数据。这种方式不仅需要采集大批量图像来重构真实环境对应的三维地图模型，而且预设好的虚拟数据展示出来的效果单一，不够丰富和生动。

针对相关技术中，存在的AR内容展示时需采集大批量图像来重构真实环境对应的三维地图模型、虚拟数据效果单一的缺陷，本公开实施例提供了一种增强现实场景下的展示方法、装置、设备、介质及程序，本公开实施例能够基于对目标对象的识别结果，实现虚拟影像和音频的综合展示，即不仅能够展示与目标对象匹配的AR画面、视频、全息影像等虚拟影像，另外，无需重新构建三维地图模型，能够直接通过目标对象的识别结果即可触发匹配的特效数据进行展示，并且，特效数据中的虚拟影像的展示位置与目标对象之间具有预设位置关系，使其展示效果能够与目标对象紧密关联，能够更有针对性的去展示特效数据。

通过以下实施例，对本公开实施例公开的增强现实场景下的展示方法、装置、设备、介质及程序进行说明。

如图1所示，本公开实施例公开了一种增强现实场景下的展示方法，该方法可以应用于具有计算能力的设备。其中，设备可以是服务器，也可以是AR设备。该增强现实场景下的展示方法可以包括如下步骤：

S110、获取增强现实AR设备拍摄的当前场景图像。

示例性地，AR设备可以包括但不限于AR眼镜、平板电脑、智能手机、智能穿戴式设备等具有显示功能和数据处理能力的设备，这些AR设备中可以安装用于展示AR场景内容的应用程序，用户可以在该应用程序中体验AR场景内容。

示例性地，AR设备还可以包含用于拍摄图像的图像采集部件，比如三原色(Red Green Blue，RGB)摄像头，在获取到AR设备拍摄的当前场景图像后，可以对该当前场景图像进行识别，识别是否包含触发特效数据进行展示的目标对象。

S120、基于所述当前场景图像对目标对象的识别结果，确定所述目标对象匹配的特效数据以及所述特效数据的展示位置信息。

示例性地，针对不同的应用场景，目标对象可以为具有特定形态的物体，比如可以为书本、字画、建筑物等实体物体，通过特效数据可以对该实体物体进行介绍，增加用户对实体物体的了解。

示例性地，针对进行日历特效数据展示的场景，目标对象可以为具有预设形态的日历，特效数据可以为基于该日历的内容预先设计好的虚拟展示内容，可以向用户介绍日历的内容，以吸引用户查阅日历。

拍摄的当前场景图像中可能包括目标对象，也可能不包括目标对象，因此在执行步骤S120之前，可以对当前场景图像进行识别，以确定当前场景图像中是否包括目标对象。

在识别到目标对象之后，可以基于目标对象的标识符等获取与目标对象相匹配的特效数据。这里的特效数据可以包括虚拟影像、视频以及音频等。虚拟影像可以包括与目标对象匹配的视频、全息影像、AR画面等。

在一些实施例中，在当前场景图像中包括目标对象的情况下，可以基于当前场景图像，利用标识物(marker)进行定位的方式，确定与所述目标对象相匹配的特效数据的展示位置信息。其中，利用marker进行定位可以是，利用目标对象的图像作为marker，确定目标对象在当前场景图像中的图像位置信息，之后基于图像位置信息确定特效数据的展示位置信息。

在一些实施例中，在当前场景图像中不包括目标对象的情况下，利用其他的定位方式，例如实时定位或地图构建(Simultaneous Localization And Mapping，SLAM)定位方式，确定目标对象对应的位置信息或相对于AR设备的相对位置信息，之后利用确定的上述位置信息或相对位置信息来确定特效数据的展示位置信息。其中，利用SLAM确定相对位置信息的步骤见下面实施例的描述。

上述展示位置信息可以包括特效数据在世界坐标系下的坐标信息。该世界坐标系为在真实空间中构建的三维坐标系，是一个绝对坐标系。其中，世界坐标系不随AR设备、目标对象、特效数据的位置而改变。

S130、基于所述展示位置信息，控制所述AR设备播放所述特效数据；所述特效数据包括虚拟影像和音频中的至少之一，所述虚拟影像的展示位置与所述目标对象之间具有预设位置关系。

若上述当前场景图像为识别到目标对象的首帧图像，则基于展示位置信息，控制特效数据从开始进行播放；若在AR设备之前拍摄的历史场景图像中已经识别到目标对象，则基于特效数据当前的播放进度，继续播放特效数据。特效数据播放完之后，还可以通过点击AR设备上的显示的按钮，重新播放该特效数据。

上述实施例能够直接通过目标对象的识别结果即可触发匹配的特效数据进行展示，无需重新构建三维地图模型，相比基于当前AR设备的定位结果去触发展示特效数据的方式，展示效果能够与目标对象紧密关联，能够更有针对性的去展示特效数据。另外，本公开实施例无需重新构建三维地图模型，能够直接通过目标对象的识别结果即可触发匹配的特效数据进行展示，并且，特效数据中的虚拟影像的展示位置与目标对象之间具有预设位置关系，使其展示效果能够与目标对象紧密关联，能够更有针对性的去展示特效数据。

图2示出可以应用本公开实施例的增强现实场景下的展示方法的一种系统架构示意图；如图2所示，该系统架构中包括：当前场景图像获取终端201、网络202和控制终端203。为实现支撑一个示例性应用，当前场景图像获取终端201和控制终端203通过网络202建立通信连接，当前场景图像获取终端201通过网络202向控制终端203上报当前场景图像，控制终端203响应于当前场景图像，并基于当前场景图像对目标对象的识别结果，确定目标对象匹配的特效数据以及特效数据的展示位置信息，其次，基于展示位置信息，控制AR设备播放特效数据；特效数据包括虚拟影像和音频中的至少之一，虚拟影像的展示位置与目标对象之间具有预设位置关系。最后，控制终端203将展示位置信息和特效数据上传至网络202，并通过网络202发送给当前场景图像获取终端201。

作为示例，当前场景图像获取终端201可以包括图像采集设备，控制终端203可以包括具有视觉信息处理能力的视觉处理设备或远程服务器。网络202可以采用有线或无线连接方式。其中，当控制终端203为视觉处理设备时，当前场景图像获取终端201可以通过有线连接的方式与视觉处理设备通信连接，例如通过总线进行数据通信；当控制终端203为远程服务器时，当前场景图像获取终端201可以通过无线网络与远程服务器进行数据交互。

或者，在一些场景中，当前场景图像获取终端201可以是带有视频采集模组的视觉处理设备，可以是带有摄像头的主机。这时，本公开实施例的增强现实场景下的展示方法可以由当前场景图像获取终端201执行，上述系统架构可以不包含网络202和控制终端203。

在一些实施例中，AR设备图像展示范围有限，无法展示所有位置上的特效数据，因此，在基于所述展示位置信息，控制所述AR设备播放所述特效数据时，首先判断特效数据是否位于所述AR设备的图像展示范围内。

特效数据是与目标对象相匹配的，特效数据中的虚拟影像的展示位置与目标对象之间具有预设位置关系。在一些实施例中，在目标对象为日历时，特效数据对应的虚拟影像的展示位置可以与日历的封面相垂直。

在一些实施例中，通过当前场景图像可以确定目标对象是否在AR设备的图像展示范围内，以确定展示的特效数据，进而使得特效数据展示的效果更为合理。即可以利用以下步骤，如图3所示，控制所述AR设备播放所述特效数据：

在确定所述目标对象的至少部分在所述AR设备的图像展示范围的情况下，基于所述展示位置信息，控制所述AR设备播放所述特效数据中的至少部分特效数据；其中，所述至少部分特效数据为所述目标对象的至少部分对应的虚拟影像和音频中的至少之一；在确定所述目标对象未在所述AR设备的图像展示范围的情况下，基于所述展示位置信息，控制所述AR设备按照所述音频的已播放进度继续播放所述音频。

在一些实施例中，若当前场景图像中包括至少部分目标对象，则确定所述目标对象的至少部分在所述AR设备的图像展示范围内，此时目标对象的至少部分对应的的特效数据位于AR设备的图像展示范围内，此时在基于所述展示位置信息，控制所述AR设备播放目标对象的至少部分对应的特效数据时，可以是控制所述AR设备播放目标对象的至少部分对应的所述虚拟影像和音频中的至少之一。

在一些实施例中，若当前场景图像中不包括目标对象，则确定所述目标对象不在所述AR设备的图像展示范围内，此时与目标对象匹配的特效数据中的虚拟影像不在AR设备的图像展示范围内，此时在基于所述展示位置信息，控制所述AR设备播放所述特效数据时，可以是控制所述AR设备按照音频的已播放进度继续播放所述音频。

在一些实施例中，在AR设备的图像展示范围内包括至少部分目标对象的情况下，展示至少部分对应的虚拟影像和音频中的至少之一，在AR设备的图像展示范围内不包括目标对象时，不展示虚拟影像，只展示音频，使得特效数据展示的效果更为合理，也使得特效数据的展示效果更为连贯。

在一些实施例中，上述确定当前场景图像中是否包括目标对象，或者是否包括至少部分目标对象，例如可以按照如下步骤实现：

第一步，对所述当前场景图像进行特征点提取，得到所述当前场景图像包含的多个特征点分别对应的特征信息；所述多个特征点位于所述当前场景图像中的目标检测区域中。

第二步，基于所述多个特征点分别对应的特征信息与预先存储的所述目标对象包含的多个特征点分别对应的特征信息进行比对，确定所述当前场景图像中是否包含所述目标对象，或者是否包括部分目标对象。

在一些实施例中，若从当前场景图像中提取的特征点与预先存储的特征点全部匹配成功，则确定当前场景图像中包括完整的目标对象；若从当前场景图像中提取的特征点与预先存储的特征点匹配成功的比例高于预设比例，则确定当前场景图像中包括部分目标对象；若从当前场景图像中提取的特征点与预先存储的特征点匹配成功的比例低于或等于预设比例，则确定当前场景图像中不包括目标对象。如此，利用上述特征点的提取和比对能够较为准确的确定当前场景图像中是否存在目标对象。匹配过程可见下述步骤S510至S520。

在当前场景图像中包括完整的目标对象的情况下，AR设备的图像展示范围内包括完整的目标对象，此时AR设备展示完整的所述虚拟影像和音频中的至少之一；在当前场景图像中包括部分目标对象的情况下，AR设备的图像展示范围内包括部分目标对象，此时AR设备展示部分虚拟影像和音频中的至少之一；在当前场景图像中不包括目标对象的情况下，AR设备的图像展示范围内不包括目标对象，此时AR设备不展示虚拟影像，只展示音频。如此，能够提高特效数据展示的合理性以及连贯性。

在一些实施例中，为了提高展示的AR内容的丰富性，提高AR内容展示的效果，还可以展示与目标对象匹配的全息影像，全息影像中包括与目标对象关联的目标关联对象。如图4A所示，在一些实施例中可以利用如下步骤S210至S240，生成全息影像：

S210、获取与所述目标对象匹配的待处理视频，所述待处理视频中包括与所述目标对象关联的目标关联对象。

目标关联对象与目标对象相关联，例如，如图5A所示，在目标对象为某一场所501时，目标关联对象可以是对该场所进行介绍的导游502。

如图5B所示，为待处理视频中的一张图像，该图像有背景，其中包括目标关联对象，即对该场所进行介绍的导游502。

S220、为所述待处理视频中的每个像素点设置透明通道，得到第一视频。

这里是为待处理视频中每张图像中的每个像素点设置透明通道，利用透明通道可以控制对应的像素点的透明程度，透明的像素点不对图像提供贡献，即该像素点不显示；不透明的像素点对图像提供贡献，即该像素点显示。

S230、基于所述透明通道，从所述第一视频中去除背景像素点，得到第二视频。

如果将某一像素点的透明通道的值设置为0，则表示该像素点为透明，此时该像素点的透明通道设置为了黑色，该像素点不对图像提供贡献；如果将某一像素点的透明通道的值设置为1，则表示该像素点为不透明，此时该像素点的透明通道设置为了白色，该像素点对图像提供贡献。利用对透明通道透明度的设置，可以从所述第一视频中去除背景像素点。

在一些实施例中，如图4B所示，可以利用如下步骤S2301至S2303，去除第一视频中的背景像素点，得到第二视频：

S2301、将第一视频中的背景像素点对应的透明通道设置为白色，得到第三视频；所述第一视频包括所述目标关联对象的目标像素点和除所述目标像素点以外的背景像素点。

示例性的，将背景像素点对应的透明通道设置为1。

S2302、将所述第一视频中的第一类像素点对应的透明通道设置为黑色，将所述第一视频中的第二类像素点对应的透明通道设置为白色，将所述第一视频中的第三类像素点对应的透明通道设置为预设灰色值，得到第四视频；所述第三类像素点包括与所述背景像素点相邻的目标像素点和与所述目标像素点相邻的背景像素点；所述第一类像素点包括除所述第三类像素点以外的背景像素点，所述第二类像素点包括除所述第三类像素点以外的目标像素点。

示例性的，将第一类像素点对应的透明通道设置为0，将第二类像素点对应的透明通道设置为1，将第三类像素点对应的透明通道设置为0到1之间的值，即预设灰度值。将第三类像素点设置为预设灰度值是为了将目标关联对象边缘的像素的颜色与背景的透明色相接近，能够使得显示的目标关联对象边缘颜色平滑过度。如图5C所示为第四视频中一张图像。

S2303、基于第三视频和第四视频，生成所述第二视频。

将第三视频和第四视频进行整合，即能够得到去除背景，只保留目标关联对象的第二视频。如图3A所示，导游302的背景是透明的。

在一些实施例中，通过对第一视频的不同类型像素点进行处理，可以实现将原视频调整为全息影像的展示效果。

S240、基于所述第二视频生成包括所述目标关联对象的全息影像。

生成的全息影像如图5A所示。

在一些实施例中，首先，可以通过蒙版方式把与目标对象匹配的待处理视频处理为带透明通道的视频素材(对应于本公开实施例中的第一视频)；其中，蒙版即为选框的外部(选框的内部就是选区)。然后，将该视频素材中的背景像素点对应的透明通道设置为白色，得到第三视频。并将该视频素材中的背景像素点对应的透明通道设置为黑色，将该视频素材中的目标关联对象的目标像素点对应的透明通道设置为白色，将该视频素材中的渐变部分的像素点对应的透明通道设置为预设灰色值，得到第四视频；其中，渐变部分的像素点为与背景像素点相邻的目标像素点和与目标像素点相邻的背景像素点。最后，将第三视频和第四视频进行横向整合，得到第二视频。如此，能够以减少视频大小，进而提高制作视频相关联的全息效果和特效数据的效率。在一些实施例中，虚拟影像还包括全息影像，展示与目标对象关联的目标关联对象对应的全息影像，还可以在当前场景图像中叠加显示全息影像，使得AR内容的展示效果更为丰富。

在一些实施例中，为了提高AR内容显示的丰富性，虚拟影像中还可以包括视频、AR画面、文字等，如图6A所示，在识别到目标对象蛋糕时，显示“生日快乐”的文字。同时如图6B所示，在识别到目标对象日历时，显示与日历对象的AR画面，AR画面中包括龙、松鼠等虚拟对象。

在一些实施例中，为了丰富AR展示的内容，提高AR内容的展示效果，可以在虚拟影像中设置多个虚拟对象的影像，并预先设置多个虚拟对象之间的展示顺序和交互数据中的至少之一。基于所述展示位置信息，控制所述AR设备播放所述特效数据，可以是通过以下过程来实现：

在所述展示位置信息对应的展示位置上，基于多个虚拟对象之间的展示顺序和交互数据中的至少之一，展示所述虚拟对象的影像。

如图6C所示，虚拟影像中设置虚拟对象战士一601和虚拟对象战士二602的影像，在扫描到游戏字样时，显示战士一601的虚拟影像先出现在AR设备展示的画面中，战士二602战斗的虚拟影像后出现在AR设备展示的画面中。之后，根据预设的战士一601和战士二602之间的交互数据，展示两者的战斗状态。

在一些实施例中，按照多个虚拟对象之间的展示顺序，展示包括多个虚拟对象的影像以及多个虚拟对象之间的交互数据，能够丰富AR展示的内容，提高AR内容的展示效果。

特效数据展示的过程中，在一些情况下，目标对象或者AR设备可能发生移动，在移动过程中，若目标对象的位置发生变化，如何能够继续确定特效数据的展示位置信息，从而对特效数据进行连贯展示，以提供更加逼真的展示效果，是值得研究的问题。

在一些实施例中，特效数据可以是三维(3-Dimension，3D)模型、视频、音频或透明视频等任一内容，也可以是上述多种内容任意组合。

针对上述问题，本公开实施例利用两种定位方式确定特效数据的展示位置信息，即可以利用以下步骤来确定特效数据的展示位置信息：

所述当前场景图像中识别到所述目标对象的情况下，基于所述目标对象在所述当前场景图像中的图像位置信息，确定所述特效数据的展示位置信息。

在所述当前场景图像中未识别到所述目标对象的情况下，获取世界坐标系下所述目标对象与所述AR设备之间的相对位置信息，并基于所述相对位置信息，确定所述特效数据的展示位置信息。

在一些实施例中，在识别到当前场景图像中包含目标对象的情况下，可以利用第一定位方式，基于所述目标对象在所述当前场景图像中的图像位置信息，确定所述特效数据的展示位置信息。

在一些实施例中，在识别到当前场景图像中不包含目标对象的情况下，即在所述当前场景图像中未识别到所述目标对象的情况下，可以利用第二定位方式，获取世界坐标系下所述目标对象与所述AR设备之间的相对位置信息，并基于所述相对位置信息，确定所述特效数据的展示位置信息。

上述在未识别到当前场景图像中包含目标对象的情况下，可以根据第二定位方式确定出特效数据的展示位置信息，这样可以基于确定的展示位置信息控制AR设备继续对未展示的特效数据进行展示，能够提高特效数据在展示过程中的连贯性，使得特效数据的展示更加逼真。

在一些实施例中，基于当前场景图像中目标对象的识别结果，切换对应的定位方式来确定特效数据的展示位置信息，可以有效降低由于其中一种定位方式定位失败而中断特效数据的展示的概率，提高了特效数据展示的稳定性。

示例性地，目标对象为日历，特效数据包括动态展示的总时长为30s的视频，若在该视频展示到第10s时，AR设备拍摄的当前场景图像中识别不到目标对象，此时可以根据基于第二定位方式确定的特效数据的展示位置信息，继续控制AR设备按照视频继续从第10s处进行展示。若在继续展示过程中，基于场景图像确定出日历完全离开AR设备的图像展示范围，比如AR设备的拍摄角度完全离开日历，视频自然位于图像展示范围之外，此时尽管视频还在继续展示，但是用户无法通过AR设备观看到特效数据对应的视频。若在继续展示过程中，基于场景图像确定出日历偏离但是未全部离开AR设备的图像展示范围，比如AR设备的拍摄角度还可以拍摄到日历的部分区域，此时用户可以通过AR设备观看到视频的部分视频。

示例性地，目标对象为日历，特效数据包括动态展示的总时长为30s的视频，若在该视频展示到第10s时，AR设备拍摄的当前场景图像中识别全部目标对象，此时可以根据基于利用日历在当前场景图像中的图像位置信息确定的展示位置信息，继续控制AR设备按照视频继续从第10s处进行展示。

在一些实施例中，AR设备播放特效数据可以跟随目标对象的移动而移动，即根据目标对象在当前场景图像中的出现情况而变化。比如，当对目标对象的识别中断时，对应本公开实施例中在拍摄的当前场景图像中识别不到目标对象的情况下，比如，可以是目标对象被遮挡、移除扫描区域等情况下，可以根据基于SLAM定位方式确定的特效数据的展示位置信息，继续控制AR设备进行特效数据的播放。之后在拍摄的当前场景图像中重新识别到目标对象的情况下，继续以实时定位方式确定特效数据的展示位置信息，并控制AR设备进行特效数据的播放。

示例性的，可以利用如下步骤识别日历是否在当前场景图像中：

对所述当前场景图像进行特征点提取，得到所述当前场景图像包含的多个特征点分别对应的特征信息；所述多个特征点位于所述当前场景图像中的目标检测区域中；基于所述多个特征点分别对应的特征信息与预先存储的所述日历包含的多个特征点分别对应的特征信息进行比对，确定所述当前场景图像中是否包含所述日历。

若从当前场景图像中提取的特征点与预先存储的日历特征点全部匹配成功，则确定当前场景图像中包括完整的日历。若从当前场景图像中提取的特征点与预先存储的日历的特征点匹配成功的比例高于预设比例，则确定当前场景图像中包括部分日历。若从当前场景图像中提取的特征点与预先存储的日历的特征点匹配成功的比例低于或等于预设比例，则确定当前场景图像中不包括日历。

上述利用第一定位方式，基于图像识别技术，可以较为准确地确定出目标对象在当前场景图像中的图像位置信息，因此，这里基于目标对象的图像位置信息可以较为准确地得到特效数据的展示位置信息，从而为特效数据的准确展示提供支持。

第一定位方式是基于目标对象在当前场景图像中的图像位置信息，来确定的特效数据的展示位置信息，因此在基于第一定位方式对目标对象进行定位的过程中，可以同时确定出AR设备在拍摄每张场景图像时，与目标对象之间的相对位置信息，并保存该相对位置信息。这样在当前场景图像为未识别到目标对象的情况下，可以结合保存的AR设备与目标对象之间的相对位置信息，以及实时定位与SLAM技术，确定出AR设备在拍摄当前场景图像时，与目标对象之间的相对位置信息。在一些实施例中可以基于该相对位置信息以及特效数据与目标对象的相对位置关系，确定出特效数据的展示位置信息，该过程将在后文进行详细阐述。

在一些实施例中，可以按照以下方式识别当前场景图像中是否包含目标对象，如图7所示：

S510，对当前场景图像进行特征点提取，得到当前场景图像包含的多个特征点分别对应的特征信息；多个特征点位于当前场景图像中的目标检测区域中。

示例性地，在对当前场景图像进行识别过程中，可以通过图像检测算法，定位出当前场景图像中包含实体对象的目标检测区域。然后在目标检测区域中进行特征点提取，比如可以提取目标检测区域中位于实体对象轮廓上的特征点、位于标识图案区域的特征点以及位于文字区域的特征点等。示例性地，为了使得提取到的特征点能够完整的表示目标对象，特征点可以基于目标对象在当前场景图像中对应的位置区域进行均匀提取，比如目标对象为日历的情况下，可以在日历封面在当前场景图像中对应的矩形区域中进行均匀提取。

示例性地，这里提取到的特征点包含的特征信息可以包含特征点对应的纹理特征值、RGB特征值、灰度值等能够表示该特征点特征的信息。

S520，基于多个特征点分别对应的特征信息与预先存储的目标对象包含的多个特征点分别对应的特征信息进行比对，确定当前场景图像中是否包含目标对象。

示例性地，可以按照相同的方式预先对目标对象进行拍摄，得到并保存目标对象包含的多个特征点分别对应的特征信息。

示例性地，在基于多个特征点分别对应的特征信息与预先存储的目标对象包含的多个特征点分别对应的特征信息进行比对时，可以先基于当前场景图像提取到的多个特征点分别对应的特征信息确定当前场景图像中目标检测区域对应的第一特征向量，以及基于目标对象包含的多个特征点分别对应的特征信息确定目标对象对应的第二特征向量。然后可以通过第一特征向量和第二特征向量确定目标检测区域和目标对象之间的相似度，比如可以通过余弦公式进行确定。

示例性地，在确定第一特征向量和第二特征向量之间的相似度大于或等于预设相似度阈值的情况下，确定当前场景图像中包含目标对象。反之，在确定第一特征向量和第二特征向量之间的相似度小于预设相似度阈值的情况下，确定当前场景图像中不包含目标对象。

在一些实施例中，利用上述特征点的提取和比对能够较为准确的确定当前场景图像中是否存在目标对象。

在一些实施例中，在识别到当前场景图像包括目标对象的情况下，可以利用如下步骤确定特效数据的展示位置信息：

基于所述目标对象在所述当前场景图像中的图像位置信息，确定所述目标对象在世界坐标系下的位置信息；基于所述目标对象在所述世界坐标系下的位置信息和所述AR设备在所述世界坐标系下的位置信息，确定所述特效数据的展示位置信息。

在执行上述步骤之前，首先获取目标对象在当前场景图像中的图像位置信息。示例性地，可以以当前场景图像建立图像坐标系，获取目标对象包含的多个特征点在图像坐标系中的图像坐标值，得到目标对象在当前场景图像中的图像位置信息。

上述基于目标对象在当前场景图像中的图像位置信息，确定目标对象在世界坐标系下的位置信息，可以是基于上述图像位置信息、图像坐标系和AR设备对应的相机坐标系之间的转换关系、以及AR设备对应的相机坐标系与世界坐标系之间的转换关系，确定目标对象在世界坐标系下的位置信息。

示例性地，AR设备对应的相机坐标系可以以AR设备包含的图像采集部件的聚焦中心为原点，以光轴为Z轴建立的三维直角坐标系。在AR设备拍摄到当前场景图像后，可以基于图像坐标系和相机坐标系之间的转换关系，确定出目标对象在相机坐标系下的位置信息。

示例性地，世界坐标系可以以目标对象的中心点为原点进行建立，比如上文提到的在目标对象为日历的情况下，可以以日历的中心为原点，以通过日历中心的长边为X轴、以通过日历中心的短边为Y轴、以通过日历中心且垂直于日历封面的直线为Z轴进行建立的。

其中，相机坐标系和世界坐标系之间的转换为刚体转换，即相机坐标系经过旋转、平移可以与世界坐标系重合的一种转换方式。相机坐标系和世界坐标系之间的转换关系可以通过目标对象中的多个位置点在世界坐标系下的位置坐标，以及在相机坐标系下对应的位置坐标进行确定。这里在得到目标对象在相机坐标系下的位置信息后，可以基于AR设备对应的相机坐标系与世界坐标系之间的转换关系，确定出目标对象在世界坐标系下的位置信息。

上述基于所述目标对象在所述世界坐标系下的位置信息和所述AR设备在所述世界坐标系下的位置信息，确定所述特效数据的展示位置信息，可以是AR设备在世界坐标系下的位置信息通过AR设备拍摄的当前场景图像来确定。比如在当前场景图像中选定特征点，通过确定选定的特征点在以目标对象建立的世界坐标系下的位置坐标，以及选定的特征点在AR设备对应的相机坐标系下的位置坐标，可以确定出AR设备在拍摄当前场景图像时在世界坐标系下的位置信息。

考虑到特效数据的展示位置与目标对象在相同坐标系下具有预设位置关系，因此这里基于目标对象和AR设备在相同的世界坐标系下的位置信息，可以确定出特效数据的展示位置信息。

上述在基于目标对象在世界坐标系下的位置信息和AR设备在世界坐标系下的位置信息，确定特效数据的展示位置信息时，可以是：

基于目标对象在世界坐标系下的位置信息，确定特效数据在世界坐标系下的位置信息；基于特效数据在世界坐标系下的位置信息和AR设备在世界坐标系下的位置信息，确定特效数据的展示位置信息。

示例性地，可以按照目标对象在世界坐标系下的位置信息，以及预先设置的特效数据的展示位置与目标对象在相同坐标系下的预设位置关系，确定出特效数据在世界坐标系下的展示位置信息。

在一些实施例中，可以较为准确地确定出目标对象在当前场景图像中的图像位置信息，基于目标对象的图像位置信息可以较为准确地得到特效数据的展示位置信息，从而为特效数据的准确展示提供支持。

在一些实施例中，在当前场景图像中未识别到目标对象的情况下，可以利用如下步骤确定特效数据的展示位置信息：

基于所述当前场景图像、历史场景图像、以及所述AR设备在拍摄所述历史场景图像时与所述目标对象在所述世界坐标系下的相对位置信息，确定所述AR设备在拍摄当前场景图像时，与所述目标对象之间的相对位置信息；基于确定的相对位置信息，确定特效数据的展示位置信息。

示例性地，下面以当前场景图像为AR设备拍摄的第三帧场景图像为例，结合SLAM技术简要说明如何确定AR设备在拍摄当前场景图像时，AR设备与目标对象之间的相对位置信息。

从AR设备拍摄第一帧包含目标对象的场景图像开始，可以基于以目标对象的中心点为原点建立的世界坐标系，以及AR设备拍摄的第一帧场景图像中选定的特征点分别在世界坐标系和AR设备对应的相机坐标系下的位置坐标，确定出AR设备在拍摄第一帧场景图像时在世界坐标系下的位置信息，同时确定的还包含目标对象在AR设备在拍摄第一帧场景图像时在世界坐标系下的位置信息。基于AR设备在拍摄第一帧场景图像时在世界坐标系下的位置信息，以及目标对象在AR设备在拍摄第一帧场景图像时在世界坐标系下的位置信息，可以确定出AR设备拍摄第一帧场景图像时与目标对象在世界坐标系下的相对位置信息。

在一些实施例中，当AR设备拍摄第二帧场景图像时，可以在第二帧场景图像中找到第一帧场景图像中包含的目标特征点，基于目标特征点分别在AR设备拍摄这两帧场景图像时在相机坐标系下的位置信息，确定出AR设备在拍摄第二帧场景图像时相对于拍摄第一帧场景图像时的位置偏移量。然后基于该位置偏移量，以及AR设备在拍摄第一帧场景图像时与目标对象在建立的世界坐标系下的相对位置信息，确定出AR设备在拍摄第二帧场景图像时与目标对象在世界坐标系下的相对位置信息。

在一些实施例中，可以通过相同的方式，确定出AR设备在当前场景图像时，相对于拍摄第二帧场景图像时的位置偏移量，这样可以结合AR设备拍摄当前场景图像时相比拍摄第二帧场景图像时的位置偏移量，以及AR设备在拍摄第二帧场景图像时与目标对象在世界坐标系下的相对位置信息，确定出AR设备在拍摄当前场景图像时与目标对象在世界坐标系下的相对位置信息。

利用当前场景图像、历史场景图像、以及所述AR设备在拍摄所述历史场景图像时与所述目标对象在世界坐标系下的相对位置信息，能够较为准确的确定AR设备在拍摄当前场景图像时，与所述目标对象之间的相对位置信息，从而为特效数据的准确展示提供支持。

在确定特效数据在世界坐标系下的展示位置信息时，还可以确定特效数据在世界坐标系下的展示姿态信息，处理逻辑基本相同。在展示特效数据的时候，可以同时结合确定的展示位置信息和展示姿态信息进行展示。

本公开实施例提供的增强现实场景下的展示方法，可以基于获取的当前场景图像对目标对象的识别结果，实现虚拟影响和音频的综合展示。同时本公开实施例提供的特效数据的展示位置信息，可以是根据对当前场景图像中目标对象的识别结果而确定，即若根据特效数据的展示位置信息，控制AR设备播放特效数据，即是根据当前场景图像中目标对象的识别结果，控制AR设备播放特效数据，且特效数据的展示位置与目标对象之间具有预设位置信息。

在一种应用场景中，当前场景图像为制作的婚礼请帖，目标对象为新人，基于婚礼请帖中部分区域识别到新人的情况下，确定与新人匹配的特效数据，比如：展示新人相恋、相爱的点点滴滴的视频，以及该视频对应的展示位置信息；基于婚礼请帖中部分区域未识别到新人的情况下，确定与新人匹配的音频信息，比如：新人合唱的有关婚礼的音频，以及与该音频对应的展示位置信息。之后，分别基于两个不同的展示位置信息，控制AR设备播放该视频或音频等，如此，可增加婚礼请帖的可看性和观赏性。

对应于上述增强现实场景下的展示方法，本公开实施例还公开了一种增强现实场景下的展示装置，该装置中的各个模块能够实现上述在服务端或AR设备上执行的各个实施例的增强现实场景下的展示方法，并且能够取得相同的有益效果。如图8所示，增强现实场景下的展示装置包括：

图像获取模块810，配置为获取增强现实AR设备拍摄的当前场景图像。

位置确定模块820，配置为基于所述当前场景图像对目标对象的识别结果，确定所述目标对象匹配的特效数据以及所述特效数据的展示位置信息。

特效播放模块830，配置为基于所述展示位置信息，控制所述AR设备播放所述特效数据；所述特效数据包括虚拟影像和音频中的至少之一，所述虚拟影像的展示位置与所述目标对象之间具有预设位置关系。

在本公开的一些实施例中，所述位置确定模块820，配置为在所述当前场景图像中识别到所述目标对象的情况下，基于所述目标对象在所述当前场景图像中的图像位置信息，确定所述特效数据的展示位置信息。

在本公开的一些实施例中，所述位置确定模块820，配置为在所述当前场景图像中未识别到所述目标对象的情况下，获取世界坐标系下所述目标对象与所述AR设备之间的相对位置信息，并基于所述相对位置信息，确定所述特效数据的展示位置信息。

在本公开的一些实施例中，所述特效播放模块830，配置为在确定所述目标对象的至少部分在所述AR设备的图像展示范围的情况下，基于所述展示位置信息，控制所述AR设备播放所述特效数据中的至少部分特效数据；其中，所述至少部分特效数据为所述目标对象的至少部分对应的所述虚拟影像和音频中的至少之一；在确定所述目标对象未在所述AR设备的图像展示范围的情况下，基于所述展示位置信息，控制所述AR设备按照所述音频的已播放进度继续播放所述音频。

在本公开的一些实施例中，所述虚拟影像包括多个虚拟对象的影像，以及所述多个虚拟对象之间的展示顺序和交互数据中的至少之一；所述特效播放模块830，配置为在所述展示位置信息对应的展示位置上，基于所述多个虚拟对象之间的展示顺序和交互数据中的至少之一，展示所述虚拟对象的影像。

在本公开的一些实施例中，所述位置确定模块820，配置为基于所述目标对象在所述当前场景图像中的图像位置信息，确定所述目标对象在世界坐标系下的位置信息；基于所述目标对象在所述世界坐标系下的位置信息和所述AR设备在所述世界坐标系下的位置信息，确定所述特效数据的展示位置信息。

在本公开的一些实施例中，所述位置确定模块820，配置为基于所述当前场景图像、历史场景图像、以及所述AR设备在拍摄所述历史场景图像时与所述目标对象在所述世界坐标系下的相对位置信息，确定所述AR设备在拍摄当前场景图像时，与所述目标对象之间的相对位置信息。

在本公开的一些实施例中，所述位置确定模块820，配置为按照以下方式识别所述当前场景图像中是否包含所述目标对象：对所述当前场景图像进行特征点提取，得到所述当前场景图像包含的多个特征点分别对应的特征信息；所述多个特征点位于所述当前场景图像中的目标检测区域中；基于所述多个特征点分别对应的特征信息与预先存储的所述目标对象包含的多个特征点分别对应的特征信息进行比对，确定所述当前场景图像中是否包含所述目标对象。

对应于上述增强现实场景下的展示方法，本公开实施例还提供了一种电子设备900，如图9所示，为本公开实施例提供的电子设备900结构示意图，包括：

处理器91、存储器92、和总线93；所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行上述任一实施例中的增强现实场景下的展示方法。

存储器92配置为存储执行指令，包括内存921和外部存储器922；这里的内存921也称内存储器，配置为暂时存放处理器91中的运算数据，以及与硬盘等外部存储器922交换的数据，处理器91通过内存921与外部存储器922进行数据交换，当电子设备900运行时，处理器91与存储器92之间通过总线93通信，使得处理器91执行以下指令：

获取增强现实AR设备拍摄的当前场景图像；基于所述当前场景图像对目标对象的识别结果，确定所述目标对象匹配的特效数据以及所述特效数据的展示位置信息；基于所述展示位置信息，控制所述AR设备播放所述特效数据；所述特效数据包括虚拟影像和音频中的至少之一，所述虚拟影像的展示位置与所述目标对象之间具有预设位置关系。

本公开实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述方法实施例中所述增强现实场景下的展示方法。其中，该存储介质可以是易失性或非易失的计算机可读取存储介质。

本公开实施例还提供一种计算机程序，所述计算机程序包括计算机可读代码，在所述计算机可读代码在电子设备中运行的情况下，所述电子设备的处理器执行如上述任一实施例所述增强现实场景下的展示方法。

本公开实施例还提供另一种计算机程序产品，包括存储了程序代码的计算机可读存储介质，所述程序代码包括的指令可配置为执行上述方法实施例中所述增强现实场景下的展示方法，可参见上述方法实施例。

其中，该计算机程序产品可以通过硬件、软件或其结合的方式实现。在一些实施例中，所述计算机程序产品可以体现为计算机存储介质，在另一些实施例中，计算机程序产品可以体现为软件产品，例如软件开发包(Software Development Kit，SDK)等等。

本公开实施例中涉及的设备可以是系统、方法和计算机程序产品中的至少之一。计算机程序产品可以包括计算机可读存储介质，其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(Random Access Memory，RAM)、只读存储器(Read-Only Memory，ROM)、可擦除可编程只读存储器(Electrical Programmable Read Only Memory，EPROM)或闪存、静态随机存取存储器(Static Random-Access Memory，SRAM)、便携式压缩盘只读存储器(Compact Disc Read-Only Memory，CD-ROM)、数字多功能盘(Digital Video Disc，DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和无线网中的至少之一下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和边缘服务器中的至少之一。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(Industry Standard Architecture，ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码，所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等，以及常规的过程式编程语言，诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络，包括局域网(Local Area Network，LAN)或广域网(Wide Area Network，WAN)连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中，通过利用计算机可读程序指令的状态信息来个性化定制电子电路，例如可编程逻辑电路、FPGA或可编程逻辑阵列(Programmable Logic Arrays，PLA)，该电子电路可以执行计算机可读程序指令，从而实现本公开的各个方面。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统和装置的工作过程，可以参考前述方法实施例中的对应过程。在本公开所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本公开各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上所述实施例，仅为本公开的具体实施方式，用以说明本公开的技术方案，而非对其限制，本公开的保护范围并不局限于此，尽管参照前述实施例对本公开进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围，都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应所述以权利要求的保护范围为准。

工业实用性

本公开实施例提供一种增强现实场景下的展示方法、装置、设备、介质及程序，该方法包括：获取增强现实AR设备拍摄的当前场景图像；基于所述当前场景图像对目标对象的识别结果，确定所述目标对象匹配的特效数据以及所述特效数据的展示位置信息；基于所述展示位置信息，控制所述AR设备播放所述特效数据；所述特效数据包括虚拟影像和音频中的至少之一，所述虚拟影像的展示位置与所述目标对象之间具有预设位置关系。

Claims

一种增强现实场景下的展示方法，所述方法由电子设备执行，所述方法包括：

获取增强现实AR设备拍摄的当前场景图像；

基于所述当前场景图像对目标对象的识别结果，确定所述目标对象匹配的特效数据以及所述特效数据的展示位置信息；

基于所述展示位置信息，控制所述AR设备播放所述特效数据；所述特效数据包括虚拟影像和音频中的至少之一，所述虚拟影像的展示位置与所述目标对象之间具有预设位置关系。
根据权利要求1所述的方法，其中，所述基于所述当前场景图像对目标对象的识别结果，确定所述特效数据的展示位置信息，包括：

在所述当前场景图像中识别到所述目标对象的情况下，基于所述目标对象在所述当前场景图像中的图像位置信息，确定所述特效数据的展示位置信息。
根据权利要求1或2所述的方法，其中，所述基于所述当前场景图像对目标对象的识别结果，确定所述目标对象匹配的特效数据以及所述特效数据的展示位置信息，包括：

在所述当前场景图像中未识别到所述目标对象的情况下，获取世界坐标系下所述目标对象与所述AR设备之间的相对位置信息，并基于所述相对位置信息，确定所述特效数据的展示位置信息。
根据权利要求1至3任一项所述的方法，其中，所述基于所述展示位置信息，控制所述AR设备播放所述特效数据，包括：

在确定所述目标对象的至少部分在所述AR设备的图像展示范围的情况下，基于所述展示位置信息，控制所述AR设备播放所述特效数据中的至少部分特效数据；其中，所述至少部分特效数据为所述目标对象的至少部分对应的虚拟影像和音频中的至少之一；

在确定所述目标对象未在所述AR设备的图像展示范围的情况下，基于所述展示位置信息，控制所述AR设备按照所述音频的已播放进度继续播放所述音频。
根据权利要求1至4任一项所述的方法，其中，所述虚拟影像包括全息影像；所述方法还包括：

获取与所述目标对象匹配的待处理视频，所述待处理视频中包括与所述目标对象关联的目标关联对象；

为所述待处理视频中的每个像素点设置透明通道，得到第一视频；

基于所述透明通道，从所述第一视频中去除背景像素点，得到第二视频；

基于所述第二视频生成包括所述目标关联对象的全息影像。
根据权利要求5所述的方法，其中，所述基于所述透明通道，从所述第一视频中去除背景像素点，得到第二视频，包括：

将所述第一视频中的背景像素点对应的透明通道设置为白色，得到第三视频；所述第一视频包括所述目标关联对象的目标像素点和除所述目标像素点以外的背景像素点；

将所述第一视频中的第一类像素点对应的透明通道设置为黑色，将所述第一视频中的第二类像素点对应的透明通道设置为白色，将所述第一视频中的第三类像素点对应的透明通道设置为预设灰色值，得到第四视频；所述第三类像素点包括与所述背景像素点相邻的目标像素点和与所述目标像素点相邻的背景像素点；所述第一类像素点包括除所述第三类像素点以外的背景像素点，所述第二类像素点包括除所述第三类像素点以外的目标像素点；

基于第三视频和第四视频，生成所述第二视频。
根据权利要求1至6任一项所述的方法，其中，所述虚拟影像包括多个虚拟对象的影像，以及所述多个虚拟对象之间的展示顺序和交互数据中的至少之一；所述基于所述展示位置信息，控制所述AR设备播放所述特效数据，包括：

在所述展示位置信息对应的展示位置上，基于所述多个虚拟对象之间的展示顺序和交互数据中的至少之一，展示所述虚拟对象的影像。
根据权利要求2所述的方法，其中，所述基于所述目标对象在所述当前场景图像中的图像位置信息，确定所述特效数据的展示位置信息，包括：

基于所述目标对象在所述当前场景图像中的图像位置信息，确定所述目标对象在世界坐标系下的位置信息；

基于所述目标对象在所述世界坐标系下的位置信息和所述AR设备在所述世界坐标系下的位置信息，确定所述特效数据的展示位置信息。
根据权利要求3所述的展示方法，其中，所述获取世界坐标系下所述目标对象与所述AR设备之间的相对位置信息，包括：

基于所述当前场景图像、历史场景图像、以及所述AR设备在拍摄所述历史场景图像时与所述目标对象在所述世界坐标系下的相对位置信息，确定所述AR设备在拍摄当前场景图像时，与所述目标对象之间的相对位置信息。
根据权利要求1至9任一项所述的方法，其中，按照以下方式识别所述当前场景图像中是否包含所述目标对象：

对所述当前场景图像进行特征点提取，得到所述当前场景图像包含的多个特征点分别对应的特征信息；所述多个特征点位于所述当前场景图像中的目标检测区域中；

基于所述多个特征点分别对应的特征信息与预先存储的所述目标对象包含的多个特征点分别对应的特征信息进行比对，确定所述当前场景图像中是否包含所述目标对象。
一种增强现实场景下的展示装置，包括：

图像获取模块，配置为获取增强现实AR设备拍摄的当前场景图像；

位置确定模块，配置为基于所述当前场景图像对目标对象的识别结果，确定所述目标对象匹配的特效数据以及所述特效数据的展示位置信息；

特效播放模块，配置为基于所述展示位置信息，控制所述AR设备播放所述特效数据；所述特效数据包括虚拟影像和音频中的至少之一，所述虚拟影像的展示位置与所述目标对象之间具有预设位置关系。
一种电子设备，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行如权利要求1至10任一项所述的增强现实场景下的展示方法。
一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如权利要求1至10任一项所述的增强现实场景下的展示方法。
一种计算机程序，所述计算机程序包括计算机可读代码，在所述计算机可读代码在电子设备中运行的情况下，所述电子设备的处理器执行用于实现如权利要求1至10任一项所述的增强现实场景下的展示方法。