WO2022199441A1

WO2022199441A1 - 全景视频的播放方法、装置、计算机设备和存储介质

Info

Publication number: WO2022199441A1
Application number: PCT/CN2022/081149
Authority: WO
Inventors: 张伟俊; 陈聪; 马龙祥
Original assignee: 影石创新科技股份有限公司
Priority date: 2021-03-23
Filing date: 2022-03-16
Publication date: 2022-09-29
Also published as: CN112954443A

Abstract

本申请涉及一种全景视频的播放方法、装置、计算机设备和存储介质。所述方法包括：获取全景视频，对所述全景视频进行目标检测，得到检测结果；其中，所述检测结果包括目标物体所在的候选区域；根据所述检测结果生成推荐观看视角视频；其中，所述推荐观看视角视频的画面内容包括所述目标物体；将所述推荐观看视角视频与预设观看视角视频在同一显示画面上进行展示；其中，所述预设观看视角视频的画面内容与所述推荐观看视角视频的画面内容不同。采用本方法能够实现对全景视频中其他目标物体的展示，避免用户错过精彩内容，提高全景视频的观看体验。

Description

全景视频的播放方法、装置、计算机设备和存储介质

技术领域

本申请涉及图像处理技术领域，特别是涉及一种全景视频的播放方法、装置、计算机设备和存储介质。

背景技术

全景视频是采用多个摄像头对环境进行360°的全方位拍摄，得到多个视频流，再通过同步、拼接、投影等技术，将多个视频流合成而成，用户可以在上下左右前后360°范围内选择任意角度进行观看，获得一种身临其境的观看体验。

为确保全景视频的观赏效果，在播放全景视频时，显示装置只显示全景视频中所涵盖的全景区域的部分区域，用户可以改变观看视角以观看全景视频中的其他区域。通常将用户当前可视区域范围称为观看视角(FOV，Field of View)。传统技术中，则是以预设的观看视角播放全景视频中的部分区域。

技术问题

然而，以预设视角播放全景视频的传统方法，导致用户容易错过全景视频中其他区域的精彩内容，降低了对于全景视频的观看体验。

技术解决方案

基于此，有必要针对上述技术问题，提供一种全景视频的播放方法、装置、计算机设备和存储介质。

一种全景视频的播放方法，包括：

获取全景视频，对全景视频进行目标检测，得到检测结果；其中，检测结果包括目标物体所在的候选区域；

根据检测结果生成推荐观看视角视频；其中，推荐观看视角视频的画面内容包括目标物体；

将推荐观看视角视频与预设观看视角视频在同一显示画面上进行展示；其中，预设观看视角视频的画面内容与推荐观看视角视频的画面内容不同。

在其中一个实施例中，对全景视频进行目标检测，得到检测结果，包括：

通过预设间隔抽取全景视频中的单帧图像，得到单帧图像集合；

对单帧图像集合中每个单帧图像进行目标检测，得到检测结果；其中，检测结果包括多个单帧图像各自对应的候选区域，候选区域包括目标物体。

在其中一个实施例中，根据检测结果生成推荐观看视角视频，包括：

基于多个单帧图像各自对应的候选区域的特征参数，确定每个单帧图像的目标候选区域；确定每个单帧图像的目标候选区域的中心点为每个单帧图像中目标物体的位置；

根据每个单帧图像的目标物体的位置，生成每个单帧图像对应的推荐画面；

根据每个单帧图像对应的推荐画面生成推荐观看视角视频。

在其中一个实施例中，特征参数包括候选区域在单帧图像中的置信度，基于多个单帧图像各自对应的候选区域的特征参数，确定每个单帧图像的目标候选区域，包括：

获取每个单帧图像中的置信度最大的候选区域作为目标候选区域。

在其中一个实施例中，特征参数包括候选区域在单帧图像中的面积，单帧图像集合中包括N个单帧图像，N个单帧图像之间具有时间顺序，N为正整数；

基于特征参数从每个单帧图像对应的候选区域中，确定每个单帧图像的目标候选区域，包括：

若N＝1，将第1帧单帧图像中面积最大的候选区域作为第1帧单帧图像的目标候选区域。

在其中一个实施例中，特征参数还包括候选区域的中心点位置，基于特征参数从每个单帧图像对应的候选区域中，确定每个单帧图像的目标候选区域，还包括：

若N大于1，则确定第N帧单帧图像中各个候选区域的中心点位置；

计算第N帧单帧图像中各个候选区域的中心点位置与第N-1帧单帧图像中目标候选区域的中心点位置之间的欧式距离；

将欧式距离最小的候选区域确定为第N帧单帧图像的目标候选区域。

在其中一个实施例中，根据每个单帧图像的感兴趣目标的位置，生成每个单帧图像对应的推荐画面，包括：

获取每个单帧图像的目标物体的位置所属目标候选区域所包括的目标物体的类型；

若目标物体的类型为预设目标类型，则生成预设大小，且目标物体的位置位于画面预设位置的推荐画面；

若目标物体的类型不为预设目标类型，则生成包括目标候选区域的面积最小的推荐画面。

在其中一个实施例中，根据每个单帧图像对应的推荐画面生成推荐观看视角视频，包括：

对相邻推荐画面中目标物体的位置坐标采用插值算法进行插值计算，得到中间位置坐标；

根据中间位置坐标生成包括目标物体的中间推荐画面；其中，中间推荐画面的播放时刻位于相邻推荐画面之间；

由推荐画面和中间推荐画面按照播放时刻由前至后排序生成推荐观看视角视频。

一种全景视频自动生成推荐观看视角视频的方法，包括：

根据检测结果生成推荐观看视角视频；其中，推荐观看视角视频的画面内容包括目标物体。

一种全景视频的播放装置，包括：

目标检测模块，用于获取全景视频，对全景视频进行目标检测，得到检测结果；其中，检测结果包括目标物体所在的候选区域；

视频生成模块，用于根据检测结果生成推荐观看视角视频；其中，推荐观看视角视频的画面内容包括目标物体；

同步展示模块，用于将推荐观看视角视频与预设观看视角视频在同一显示画面上进行展示；其中，预设观看视角视频的画面内容与推荐观看视角视频的画面内容不同。

一种全景视频自动生成推荐观看视角视频的装置，包括：

视频生成模块，用于根据检测结果生成推荐观看视角视频；其中，推荐观看视角视频的画面内容包括目标物体。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

技术效果

上述全景视频的播放方法、装置、计算机设备和存储介质，通过获取全景视频，并对全景视频进行目标检测，得到包括目标物体所在的候选区域的检测结果，并根据检测结果生成包括目标物体的推荐观看视角视频，将画面内容不同的推荐观看视角视频与预设观看视角视频在同一显示画面上进行展示，以此实现对全景视频中其他目标物体的展示，避免用户错过精彩内容，提高全景视频的观看体验。

附图说明

图1为一个实施例中计算机设备的内部结构图；

图2为一个实施例中全景视频的播放方法的流程示意图；

图3为一个实施例全景视频与推荐观看视角视频以及预设观看视角视频的关系示意图；

图4a～图4e为推荐观看视角视频与预设观看视角视频的显示示意图；

图5为一个实施例中对全景视频进行目标检测的流程示意图；

图6为一个实施例中生成推荐观看视角视频的流程示意图；

图7为一个实施例中确定目标候选区域的流程示意图；

图8为一个实施例中生成推荐画面的流程示意图；

图9为另一个实施例中生成推荐观看视角视频的流程示意图；

图10为另一个实施例中生成推荐观看视角视频的流程示意图；

图11为一个实施例中全景视频的播放装置的结构框图；

图12为一个实施例中基于全景视频的推荐观看视角视频生成装置的结构框图。

本发明的实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的全景视频的播放方法，可以应用于如图1所示的计算机设备中。该计算机设备可以是终端，其内部结构图可以如图1所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信，无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种全景视频的播放方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图1中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，如图2所示，提供了一种全景视频的播放方法，以该方法应用于图1中的计算机设备为例进行说明，包括以下步骤：

S210、获取全景视频，对全景视频进行目标检测，得到检测结果。

其中，检测结果包括检测出的目标物体所在的候选区域，候选区域用于表征目标物体在单帧图像中的位置区域，可通过矩形框在单帧图像上框选确定，还可以通过目标物体的边界线在单帧图像上框选确定。本实施例中，对于候选区域的表现形式不做具体限定。

可选地，计算机设备获取全景视频后，可根据预设的用户所关注的感兴趣目标对全景视频进行目标检测，得到包括该感兴趣目标所在的候选区域的检测结果。感兴趣目标为用户预先设定的所关注的目标物体即兴趣点，例如，感兴趣目标可以是人物，动物，也可以是车辆，飞机等，可以是静态的，如建筑物，路上的树木，还可以是动态的，如行驶的车辆，奔跑中的运动员等。计算机设备还可以根据预设的目标识别算法对全景视频进行目标检测，得到识别出的所有目标物体所在候选区域的检测结果。

S220、根据检测结果生成推荐观看视角视频。

其中，推荐观看视角视频的画面内容包括目标物体。

可选地，计算机设备根据检测结果中目标物体所在的候选区域生成推荐画面，由该推荐画面构成推荐观看视角视频。可选地，可直接以候选区域作为推荐画面，还可以以候选区域的中心点为中心，外扩预设尺寸规格，在单帧图像中框选得到推荐图像。

在单帧图像的检测结果中包括多个目标物体的候选区域时，可选地，可针对同一目标物体的候选区域生成一推荐观看视角视频，存在多个目标物体时，即可生成对应的多个推荐观看视角视频。例如，对于全景视频中播放时间连续的100帧单帧图像(第1帧～第100帧)进行目标物体为车辆的目标检测，第1帧～第50帧单帧图像中包括车辆A和车辆B的候选区域，第51帧～第100帧单帧图像中只包括车辆B的候选区域，计算机设备则根据第1帧～第50帧单帧图像中车辆A的候选区域生成关于车辆A的推荐画面，形成车辆A的推荐观看角视频，并根据第1帧～第100帧单帧图像中车辆B的候选区域生成关于车辆B的推荐画面，形成车辆B的推荐观看角视频。还可以采用预设的筛选条件，在多个候选区域中确定一目标候选区域，生成该目标候选区域所对应的推荐画面，对应形成该目标候选区域所对应的推荐视角观看视频，筛选条件可以是检测结果的置信度最大或最小，还可以是检测结果中候选区域的面积最大或最小。

S230、将推荐观看视角视频与预设观看视角视频在同一显示画面上进行展示。

其中，预设观看视角视频的画面内容与推荐观看视角视频的画面内容不同。预设观看视角视频为计算机设备基于全景视频在默认观看视角下生成的视频，可基于用户输入的指令进行画面调整，以根据用户的意愿显示全景视频中的其他区域。例如，预设观看视角视频可以是预设摄像头获取的视频，也可以是画面内容包括预设目标物体的视频。本实施例中，对于预设观看视角视频的形成方式不做具体限定。

例如，如图3所示，计算机设备对全景视频中的单帧图像进行目标物体为人的目标检测，进而根据检测结果生成推荐观看视角视频，预设观看视角为某一摄像头获取的视频，计算机设备则将生成推荐观看视角视频以及与推荐观看视角视频不同的预设观看视角视频在同一显示画面上进行展示。

可选地，计算机设备可以将推荐观看视角视频与预设观看视角视频并列在同一显示画面上显示，如同行显示(图4a)、同列显示(图4c和图4d)、或者对角显示，可先显示推荐观看视角视频，后显示预设观看视角视频，也可先显示预设观看视角视频，后显示推荐观看视角视频。计算机设备还可以推荐观看视角视频为次要显示的视频，以预设观看视角视频主要显示的视频，将推荐观看视角视频与预设观看视角在同一显示画面上显示，例如，全屏显示预设观看视角视频，以缩略图显示推荐观看视角视频，缩略图可位于整个显示画面上的任意位置，如左上角(图4d)、左下角、中间、右上角或者右下角(图4e)。计算机设备也可以全屏实现推荐观看视角视频，以缩略图显示预设观看视角视频。本实施例中，对于推荐观看视角视频和预设观看视角视频显示的大小以及位置关系不做具体限定。

本实施例中，计算机设备对全景视频进行目标检测，得到包括目标物体所在的候选区域的检测结果，并根据检测结果生成包括目标物体的推荐观看视角视频，将画面内容不同的推荐观看视角视频与预设观看视角视频在同一显示画面上进行展示，以此实现对全景视频中其他目标物体的展示，避免用户错过精彩内容，提高全景视频的观看体验。

在一个实施例中，为提高目标检测效率，如图5所示，上述S210包括：

S510、通过预设间隔抽取全景视频中的单帧图像，得到单帧图像集合。

可选地，计算机设备可以预设时间周期间隔抽取全景视频中的单帧图像，得到单帧图像集合。例如，时间周期T＝1s，计算机设备则每隔1s则在全景视频中抽取一帧单帧图像，对应得到单帧图像集合A。计算机设备还可以预设间隔帧数间隔抽取全景视频中的单帧图像，得到单帧图像集合。例如，预设间隔帧数5帧，计算机设备则每隔5帧则在全景视频中抽取一帧单帧图像，对应得到单帧图像集合B。

S520、对单帧图像集合中每个单帧图像进行目标检测，得到检测结果。

其中，检测结果包括多个单帧图像各自对应的候选区域，候选区域包括目标物体。目标物体的类型可以是人、人脸、车辆或者建筑物等。

可选地，计算机设备可采用基于机器学习的目标检测模型对单帧图像集合中的每一单帧图像进行目标检测，得到检测结果。例如，计算机设备则将单帧图像集合中的每一单帧图像输入采用大量人脸图像作为训练样本训练得到的人脸检测模型以及采用大量车辆图像作为训练样本训练得到的车辆检测模型中进行目标检测，进而得到对应的检测结果，检测结果中则包括单帧图像各自对应的包括人脸的候选区域，以及包括车辆的候选区域。还可以采用模板匹配、关键点匹配、关键特征检测等方式进行目标物体的目标检测。

本实施例中，计算机设备通过预设间隔抽取全景视频中的单帧图像，得到单帧图像集合，并对单帧图像集合中每个单帧图像进行目标检测，得到包括多个单帧图像各自对应的包括目标物体的候选区域的检测结果，通过预设间隔抽取全景视频中的单帧图像并进行目标检测的方式，降低了需要进行目标检测的数据量，从而提高了目标检测效率。

在一个实施例中，为提高推荐观看视角视频的画面效果，如图6所示，上述S220包括：

S610、基于多个单帧图像各自对应的候选区域的特征参数，确定每个单帧图像的目标候选区域。

其中，特征参数可用于表征候选区域的区域特性，如面积、中心点位置、颜色直方图或者候选区域中目标类型的置信度中的至少一种。

在单帧图像对应的检测结果中包括多个候选区域时，计算机设备则需根据多个候选区域的特征参数从多个候选区域中确定该单帧图像所对应的目标候选区域。

在一可选地实施例中，特征参数包括候选区域在单帧图像中的置信度，即候选区域所表征的目标类型的置信度，计算机设备针对每一单帧图像，可获取对应检测结果中多个候选区域的置信度最大的候选区域作为该单帧图像的目标候选区域。例如，针对单帧图像1～200，单帧图像1～100对应的检测结果中，均为候选区域A的置信度最大，计算机设备则确定单帧图像1～150中的候选区域A为单帧图像1～100所对应的目标候选区域，而单帧图像151～200对应的检测结果中，均为候选区域B的置信度最大，则单帧图像1～150中的候选区域A为单帧图像1～100所对应的目标候选区域，计算机设备则确定单帧图像151～200中的候选区域B为单帧图像151～200所对应的目标候选区域。

可选地，计算机设备还可以针对具有时间顺序的N个单帧图像中的第1帧单帧图像，获取该第1帧单帧图像中多个候选区域的置信度最大的候选区域作为该第1帧单帧图像的目标候选区域，在确定第1帧单帧图像的目标候选区域后，则获取第2帧单帧图像中多个候选区域与第1帧单帧图像中目标候选区域之间的相似度，确定第2帧单帧图像中的目标候选区域，具体可将相似度最大的候选目标区域确定为该第2帧单帧图像中的目标候选区域。以此类推，最终得到N个单帧图像中每一单帧图像的目标候选区域。其中，上述相似度可以是候选区域与目标候选区域之间面积的交并比、颜色直方图的相关系数或者巴氏距离。

S620、确定每个单帧图像的目标候选区域的中心点为每个单帧图像中目标物体的位置。

可选地，若目标检测得到的候选区域为矩形框在单帧图像中框选得到的区域，相应地，目标候选区域也为矩形框在单帧图像中框选得到的区域，计算机设备则获取该目标候选区域的两对角线交点为单帧图像中目标物体的位置。若目标检测得到的候选区域为目标物体的边界线在单帧图像中框选得到的区域，相应地，目标候选区域也为目标物体的边界线在单帧图像中框选得到的区域，计算机设备则获取该目标候选区域的几何中心为单帧图像中目标物体的位置。

S630、根据每个单帧图像的目标物体的位置，生成每个单帧图像对应的推荐画面。

S640、根据每个单帧图像对应的推荐画面生成推荐观看视角视频。

可选地，计算机设备可以每个单帧图像的目标物体的位置为中心点，向外延伸预设长度形成以预设长度为半径的圆形区域，并以该圆形区域作为对应单帧图像的推荐画面。计算机设备还可以每个单帧图像的目标物体的位置为中心点，向X轴方向外延伸预设长度，同时向Y轴延伸预设长度，形成以预设长度的矩形区域，并以该矩形区域作为对应单帧图像的推荐画面。相应地，得到推荐画面构成的推荐观看视角视频。

本实施例中，计算机设备基于多个单帧图像各自对应的候选区域的置信度或者面积，在对应的候选区域中确定每个单帧图像的目标候选区域，并确定每个单帧图像的目标候选区域的中心点为每个单帧图像中目标物体的位置，以根据每个单帧图像的目标物体的位置，生成每个单帧图像对应的推荐画面，再由每个单帧图像对应的推荐画面生成推荐观看视角视频，使得生成的推荐观看视角视频中的每一帧图像包括置信度最大或者面积适宜的目标物体，进而提高了推荐观看视角视频的画面效果。

在一个实施例中，特征参数包括候选区域在单帧图像中的面积，上述单帧图像集合中包括N个单帧图像，N个单帧图像之间具有时间顺序，N为正整数，在根据候选区域的面积确定单帧图像的目标候选区域时，上述S610则包括：

若N＝1，计算机设备则将第1帧单帧图像中面积最大的候选区域作为第1帧单帧图像的目标候选区域。

其中，第1帧单帧图像为单帧图像集合中的第1帧图像，不一定为全景视频中的第1帧图像。

具体地，计算机设备获取单帧图像集合中第1帧单帧图像中所有候选区域的面积，并将面积最大的候选区域确定为该第1帧单帧图像的目标候选区域。

在一可选地实施例中，特征参数还包括候选区域的中心点位置，如图7所示，若N大于1，上述S610则还包括：

S710、确定第N帧单帧图像中各个候选区域的中心点位置。

具体地，计算机设备获取第N帧单帧图像中各个候选区域的几何中心位置，并将该几何中心位置作为对应候选区域的中心点位置。

S720、计算第N帧单帧图像中各个候选区域的中心点位置与第N-1帧单帧图像中目标候选区域的中心点位置之间的欧式距离。

S730、将欧式距离最小的候选区域确定为第N帧单帧图像的目标候选区域。

具体地，计算机设备计算第N帧单帧图像中各个候选区域的中心点位置与第N-1帧(即前一帧)单帧图像的目标候选区域的中心点位置之间的欧式距离，并将欧式距离最小的第N帧单帧图像中的候选区域作为该第N帧单帧图像的目标候选区域。例如，在确定第1帧单帧图像的目标候选区域后，在N＝2时，第2帧单帧图像中包括候选区域a、b、c三个候选区域，计算机设备则获取第1帧单帧图像的目标候选区域的中心点位置分别与第2帧单帧图像中a、b、c三个候选区域的中心点位置之间的欧式距离，对应得到L1、L2和L3三个欧式距离，其中L2＜L1＜L3，计算机设备则确定最小欧式距离L2所对应的候选区域b为第2帧单帧图像的目标候选区域，以此类推，再计算第2帧单帧图像中目标候选区域的中心点位置与第3帧单帧图像中候选区域的中心点位置之间的欧式距离，并从中确定欧式距离最小的候选区域为第3帧单帧图像的目标候选区域…以根据前一帧单帧图像的目标候选区域在后一帧单帧图像的候选区域中确定目标候选区域。

本实施例中，计算机设备确定单帧图像集合的第1帧单帧图像中面积最大的候选区域为第1帧单帧图像的目标候选区域，并通过计算前一帧单帧图像中目标候选区域中心点位置与后一帧单帧图像中候选区域中心点位置之间的欧式距离，确定欧氏距离最小的后一帧单帧图像中的候选区域为该后一帧单帧图像的目标候选区域，使得推荐观看视角视频中始终包括同一目标物体，进而提高了对于同一目标物体的追溯显示。

在一个实施例中，为进一步提高推荐观看视角视频的画面效果，如图8所示，上述S630包括：

S810、获取每个单帧图像的目标物体的位置所属目标候选区域所包括的目标物体的类型。

具体地，计算机设备在确定每个单帧图像的目标物体的位置后，进一步获取该位置所属的目标候选区域所包括的目标物体的类型，并根据该目标物体的类型确定所生成的推荐画面。

S820、若目标物体的类型为预设目标类型，则生成预设大小，且目标物体的位置位于画面预设位置的推荐画面。

S830、若目标物体的类型不为预设目标类型，则生成包括目标候选区域的面积最小的推荐画面。

可选地，若目标物体的类型为预设目标类型，计算机设备则生成预设大小的推荐画面，且目标物体的位置位于所生成的推荐画面的画面预设位置。例如，预设目标类型为人脸，若目标物体的类型为人脸，计算机设备则生成人脸的位置位于所生成的推荐画面2/3高度，1/2宽度处的推荐画面。若目标物体的类型不为预设目标类型，计算机设备则生成包括目标候选区域的面积最小的推荐画面。例如，目标物体的类型为足球场(不为人脸)，计算机设备则生成包括足球场所在目标候选区域的面积最小的推荐画面。

本实施例中，计算机设备获取每个单帧图像的目标物体的位置所属目标候选区域所包括的目标物体的类型，并在目标物体的类型为预设目标类型的情况下，生成预设大小，且目标物体的位置位于画面预设位置的推荐画面，在目标物体的类型不为预设目标类型的情况下，生成包括目标候选区域的面积最小的推荐画面，以此实现根据不同目标物体的类型对应确定不同推荐画面，使得推荐观看视角视频的每一画面中目标物体位置适宜，使用户可以看到预设目标类型的目标物体的局部画面，也可以看到非预设目标类型的目标物体的整体画面，进一步提高了推荐观看视角视频的画面效果。

在一个实施例中，为提高推荐观看视角视频的流畅性，如图9所示，上述S640包括：

S910、对相邻推荐画面中目标物体的位置坐标采用插值算法进行插值计算，得到中间位置坐标。

具体地，每一推荐画面所在的单帧图像在全景视频中均具有唯一确定的播放时刻，计算机设备对播放时间相邻的，且包括同一目标物体的推荐画面中目标物体的位置采用插值算法进行插值计算，以补全相邻两推荐画面中空缺画面中目标物体的位置。可选地，计算机设备对相邻推荐画面中目标物体的位置坐标采用公式

进行线性插值计算，得到中间位置坐标。其中，P ^t为前一播放时刻t的推荐画面中目标物体的位置坐标，P ^t+N为后一播放时刻t+N的推荐画面中目标物体的位置坐标，P ^t+k为位于前一播放时刻与后一播放时刻之间的一时刻t+k所对应的中间推荐画面中目标物体的位置坐标。

可选地，上述目标物体的位置坐标可以是该目标物体在对应推荐图像中的位置坐标，还可以是该目标物体在对应所属单帧图像中的位置坐标，还可以是该目标物体在实际环境中的位置坐标。

S920、根据中间位置坐标生成包括目标物体的中间推荐画面。

其中，中间推荐画面的播放时刻位于相邻推荐画面之间。

S930、由推荐画面和中间推荐画面按照播放时刻由前至后排序生成推荐观看视角视频。

具体地，计算机设备基于中间位置坐标生成与上述推荐画面大小相同，包括相同目标物体的中间推荐画面，并由推荐画面和中间推荐画面按照播放时刻由前至后排序生成推荐观看视角视频。

可选地，计算机设备还可以对构成推荐观看视角视频的推荐图像和中间推荐图像中的目标物体的位置采用卡尔曼滤波算法及其变种、滑动窗口平均法等滤波算法进行滤波，使得生成的推荐观看视角视频更加平稳，抖动小，进一步提高推荐观看视角视频的画面效果。

本实施例中，计算机设备对相邻推荐画面中目标物体的位置坐标采用插值算法进行插值计算，得到中间位置坐标，并根据中间位置坐标生成播放时刻位于相邻推荐画面之间，包括目标物体的中间推荐画面，进而由推荐画面和中间推荐画面按照播放时刻由前至后排序生成推荐观看视角视频，对播放时刻不连续的推荐画面进行了中间推荐画面的补充，进而提高了推荐观看视角视频的流畅性。

在一个实施例中，上述全景视频的播放方法可针对至少两目标物体，相应生成至少两个推荐观看视角视频。例如，在一个篮球赛事直播/录播场景中，用户预先设置讲解员和篮球场为目标物体，计算机设备根据讲解员和篮球场对赛事全景视频中的单帧视频进行目标检测，检测到赛事全景视频中每一单帧图像中的讲解员，生成讲解员位于中间位置的第一推荐图像，并由第一推荐图像构成针对该讲解员的第一推荐观看视角视频。同时，检测到赛事全景视频中每一单帧图像中的篮球场，生成包括整个篮球场且面积最小的第二推荐图像，并由第二推荐图像构成针对该篮球场的第二推荐观看视角视频。计算机设备再将得到的针对讲解员的第一推荐观看视角视频和针对篮球场的第二推荐观看视角视频，与预设观看视角视频在同一显示画面上进行展示。

在一个实施例中，如图10所示，提供了一种全景视频自动生成推荐观看视角视频的方法，包括：

S1010、获取全景视频，对全景视频进行目标检测，得到检测结果。

其中，检测结果包括目标物体所在的候选区域。

S1020、根据检测结果生成推荐观看视角视频。

其中，推荐观看视角视频的画面内容目标物体。

具体地，上述基于全景视频的推荐观看视角视频的生成过程可参见图5～图9所示的实施例，在此不再赘述。

应该理解的是，虽然图2-10的中流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2-10中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图11所示，提供了一种全景视频的播放装置，包括：目标检测模块1101、视频生成模块1102和同步展示模块1103，其中：

目标检测模块1101用于获取全景视频，对全景视频进行目标检测，得到检测结果；其中，检测结果包括目标物体所在的候选区域；视频生成模块1102用于根据检测结果生成推荐观看视角视频；其中，推荐观看视角视频的画面内容包括目标物体；同步展示模块1103用于将推荐观看视角视频与预设观看视角视频在同一显示画面上进行展示；其中，预设观看视角视频的画面内容与推荐观看视角视频的画面内容不同。

在其中一个实施例中，目标检测模块1101具体用于：

通过预设间隔抽取全景视频中的单帧图像，得到单帧图像集合；对单帧图像集合中每个单帧图像进行目标检测，得到检测结果；其中，检测结果包括多个单帧图像各自对应的候选区域，候选区域包括目标物体。

在其中一个实施例中，视频生成模块1102具体用于：

基于多个单帧图像各自对应的候选区域的特征参数，确定每个单帧图像的目标候选区域；确定每个单帧图像的目标候选区域的中心点为每个单帧图像中目标物体的位置；根据每个单帧图像的目标物体的位置，生成每个单帧图像对应的推荐画面；根据每个单帧图像对应的推荐画面生成推荐观看视角视频。

在其中一个实施例中，特征参数包括候选区域在单帧图像中的置信度，视频生成模块1102具体用于：

在其中一个实施例中，特征参数包括候选区域在单帧图像中的面积，单帧图像集合中包括N个单帧图像，N个单帧图像之间具有时间顺序，N为正整数；视频生成模块1102具体用于：

在其中一个实施例中，特征参数还包括候选区域的中心点位置，视频生成模块1102还用于：

若N大于1，则确定第N帧单帧图像中各个候选区域的中心点位置；计算第N帧单帧图像中各个候选区域的中心点位置与第N-1帧单帧图像中目标候选区域的中心点位置之间的欧式距离；将欧式距离最小的候选区域确定为第N帧单帧图像的目标候选区域。

在其中一个实施例中，视频生成模块1102具体用于：

获取每个单帧图像的目标物体的位置所属目标候选区域所包括的目标物体的类型；若目标物体的类型为预设目标类型，则生成预设大小，且目标物体的位置位于画面预设位置的推荐画面；若目标物体的类型不为预设目标类型，则生成包括目标候选区域的面积最小的推荐画面。

在其中一个实施例中，视频生成模块1002具体用于：

对相邻推荐画面中目标物体的位置坐标采用插值算法进行插值计算，得到中间位置坐标；根据中间位置坐标生成包括目标物体的中间推荐画面；其中，中间推荐画面的播放时刻位于相邻推荐画面之间；由推荐画面和中间推荐画面按照播放时刻由前至后排序生成推荐观看视角视频。

在一个实施例中，如图12所示，提供了一种全景视频自动生成推荐观看视角视频的装置，包括：目标检测模块1201和视频生成模块1202。其中：

目标检测模块1201与上述目标检测模块1101的作用相同，视频生成模块1202与上述视频生成模块1102的作用相同，在此不再赘述。

关于全景视频的播放装置的具体限定可以参见上文中对于全景视频的播放方法的限定，关于全景视频自动生成推荐观看视角视频的装置的具体限定可以参见上文中对于全景视频自动生成推荐观看视角视频的方法的限定，在此不再赘述。上述全景视频的播放装置和全景视频自动生成推荐观看视角视频的装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现以下步骤：

获取全景视频，对全景视频进行目标检测，得到检测结果；其中，检测结果包括目标物体所在的候选区域；根据检测结果生成推荐观看视角视频；其中，推荐观看视角视频的画面内容包括目标物体；将推荐观看视角视频与预设观看视角视频在同一显示画面上进行展示；其中，预设观看视角视频的画面内容与推荐观看视角视频的画面内容不同。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：

在一个实施例中，特征参数包括候选区域在单帧图像中的置信度，处理器执行计算机程序时还实现以下步骤：

在一个实施例中，特征参数包括候选区域在单帧图像中的面积，单帧图像集合中包括N个单帧图像，N个单帧图像之间具有时间顺序，N为正整数；处理器执行计算机程序时还实现以下步骤：

在一个实施例中，特征参数还包括候选区域的中心点位置，处理器执行计算机程序时还实现以下步骤：

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：

在一个实施例中，特征参数包括候选区域在单帧图像中的置信度，计算机程序被处理器执行时还实现以下步骤：

在一个实施例中，特征参数包括候选区域在单帧图像中的面积，单帧图像集合中包括N个单帧图像，N个单帧图像之间具有时间顺序，N为正整数；计算机程序被处理器执行时还实现以下步骤：

在一个实施例中，特征参数还包括候选区域的中心点位置，计算机程序被处理器执行时还实现以下步骤：

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory，ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic Random Access Memory，DRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

一种全景视频的播放方法，其特征在于，所述方法包括：

获取全景视频，对所述全景视频进行目标检测，得到检测结果；其中，所述检测结果包括目标物体所在的候选区域；

根据所述检测结果生成推荐观看视角视频；其中，所述推荐观看视角视频的画面内容包括所述目标物体

将所述推荐观看视角视频与预设观看视角视频在同一显示画面上进行展示；其中，所述预设观看视角视频的画面内容与所述推荐观看视角视频的画面内容不同。
根据权利要求1所述的方法，其特征在于，所述对所述全景视频进行目标检测，得到检测结果，包括：

通过预设间隔抽取所述全景视频中的单帧图像，得到单帧图像集合；

对所述单帧图像集合中每个单帧图像进行目标检测，得到所述检测结果；其中，所述检测结果包括多个单帧图像各自对应的候选区域，所述候选区域包括所述目标物体。
根据权利要求2所述的方法，其特征在于，所述根据所述检测结果生成推荐观看视角视频，包括：

基于所述多个单帧图像各自对应的候选区域的特征参数，确定每个单帧图像的目标候选区域；

确定每个单帧图像的目标候选区域的中心点为所述每个单帧图像中所述目标物体的位置；

根据所述每个单帧图像中所述目标物体的位置，生成每个单帧图像对应的推荐画面；

根据每个单帧图像对应的推荐画面生成所述推荐观看视角视频。
根据权利要求3所述的方法，其特征在于，所述特征参数包括所述候选区域在所述单帧图像中的置信度，所述基于所述多个单帧图像各自对应的候选区域的特征参数，确定每个单帧图像的目标候选区域，包括：

获取每个单帧图像中的置信度最大的候选区域作为所述目标候选区域。
根据权利要求3所述的方法，其特征在于，所述特征参数包括所述候选区域在所述单帧图像中的面积，所述单帧图像集合中包括N个单帧图像，N个单帧图像之间具有时间顺序，所述N为正整数；

所述基于所述特征参数从每个单帧图像对应的候选区域中，确定每个单帧图像的目标候选区域，包括：

若N＝1，将第1帧单帧图像中面积最大的候选区域作为所述第1帧单帧图像的目标候选区域。
根据权利要求5所述的方法，其特征在于，所述特征参数还包括所述候选区域的中心点位置，所述基于所述特征参数从每个单帧图像对应的候选区域中，确定每个单帧图像的目标候选区域，还包括：

若N大于1，则确定第N帧单帧图像中各个候选区域的中心点位置；

计算第N帧单帧图像中各个候选区域的中心点位置与第N-1帧单帧图像中目标候选区域的中心点位置之间的欧式距离；

将欧式距离最小的候选区域确定为所述第N帧单帧图像的目标候选区域。
根据权利要求3所述的方法，其特征在于，所述根据所述每个单帧图像中所述目标物体的位置，生成每个单帧图像对应的推荐画面，包括：

获取每个单帧图像中所述目标物体的位置所属目标候选区域所包括的目标物体的类型；

若所述目标物体的类型为预设目标类型，则生成预设大小，且所述目标物体的位置位于画面预设位置的所述推荐画面；

若所述目标物体的类型不为所述预设目标类型，则生成包括所述目标候选区域的面积最小的所述推荐画面。
根据权利要求3-7任一项所述的方法，其特征在于，所述根据每个单帧图像对应的推荐画面生成所述推荐观看视角视频，包括：

对相邻所述推荐画面中所述目标物体的位置坐标采用插值算法进行插值计算，得到中间位置坐标；

根据所述中间位置坐标生成包括所述目标物体的中间推荐画面；其中，所述中间推荐画面的播放时刻位于所述相邻所述推荐画面之间；

由所述推荐画面和所述中间推荐画面按照所述播放时刻由前至后排序生成所述推荐观看视角视频。
一种全景视频自动生成推荐观看视角视频的方法，其特征在于，所述方法包括：

获取全景视频，对所述全景视频进行目标检测，得到检测结果；其中，所述检测结果包括目标物体所在的候选区域；

根据所述检测结果生成推荐观看视角视频；其中，所述推荐观看视角视频的画面内容包括所述目标物体。
一种全景视频的播放装置，其特征在于，所述装置包括：

目标检测模块，用于获取全景视频，对所述全景视频进行目标检测，得到检测结果；其中，所述检测结果包括目标物体所在的候选区域；

视频生成模块，用于根据所述检测结果生成推荐观看视角视频；其中，所述推荐观看视角视频的画面内容包括所述目标物体；

同步展示模块，用于将所述推荐观看视角视频与预设观看视角视频在同一显示画面上进行展示；其中，所述预设观看视角视频的画面内容与所述推荐观看视角视频的画面内容不同。
一种全景视频自动生成推荐观看视角视频的装置，其特征在于，所述装置包括：

目标检测模块，用于获取全景视频，对所述全景视频进行目标检测，得到检测结果；其中，所述检测结果包括目标物体所在的候选区域；

视频生成模块，用于根据所述检测结果生成推荐观看视角视频；其中，所述推荐观看视角视频的画面内容包括所述目标物体。
一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述方法的步骤。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。