CN111739105B

CN111739105B - 一种直播机位摄像方案自动学习方法

Info

Publication number: CN111739105B
Application number: CN202010786600.0A
Authority: CN
Inventors: 梁栋; 丁刚毅; 李鹏; 唐明湘; 黄天羽; 李立杰
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2020-08-07
Filing date: 2020-08-07
Publication date: 2020-11-20
Anticipated expiration: 2040-08-07
Also published as: CN111739105A

Abstract

本发明涉及一种直播机位摄像方案自动学习方法，包括以下步骤：对已有直播视频进行镜头分割；逐帧提取得到视频关键帧序列；对相邻的毎两帧图像进行特征点提取和匹配；利用匹配的特征点得到摄像机帧间运动的旋转矩阵和平移向量；根据摄像机帧间运动参数得到对应于每个关键帧时间点的摄像机世界坐标和姿态，从而获得摄像机在摄像过程中的运动轨迹和姿态参数；对所有视频片段进行摄像机运动轨迹和姿态参数生成，得到直播过程使用的所有摄像机参数构成的直播摄像方案。本发明通过对已有直播视频进行图像处理生成直播摄像方案，对直播摄像方案的学习提供了辅助方法和工具，也为直播摄像过程的自动化提供了可能。

Description

一种直播机位摄像方案自动学习方法

技术领域

本发明涉及一种电视直播方案生成方法，特别涉及一种直播机位摄像方案自动学习方法。

背景技术

电视台在进行现场直播的时候，直播人员需要具有丰富的经验。当碰到电视台以前没有拍摄制作过的活动，就会给负责现场直播的电视台提出挑战。进行现场直播时应该怎么布设直播的摄像机，在直播过程中怎么对摄像机进行控制，都成为直播过程中面临的技术难题。面对这种问题，一个可行的解决方案是从以往类似活动的直播视频资源中进行直播摄像方案的学习。使用纯人工的方式对海量视频数据进行分析和学习是不可取的，图像处理、视频处理领域的各项成果应该被广泛使用进行直播摄像方案的学习。如果能够进行直播摄像方案的自动化学习，那么不仅仅可用于没有经验的直播摄像方案的设计，也为直播摄像机的自动布设、控制也就是摄像过程的自动化提供了可能。但是现有技术中从未见有直播摄像方案自动学习相关技术的报道。

发明内容

本发明的目的在于针对现有技术的不足，提供一种直播机位摄像方案自动学习方法，包括以下步骤：

对已有直播视频进行镜头分割，使得每个视频片段不包含相机切换；

选取一段分割后的视频片段，标定摄像机类型，并逐帧提取得到视频关键帧序列；

对相邻的毎两帧图像进行特征点提取和匹配；

利用匹配的特征点得到摄像机帧间运动的旋转矩阵和平移向量；

根据摄像机帧间运动参数得到对应于每个关键帧时间点的摄像机世界坐标和姿态，从而获得摄像机在摄像过程中的运动轨迹和姿态参数；

对所有视频片段进行摄像机运动轨迹和姿态参数生成，得到直播过程使用的所有摄像机参数构成的直播摄像方案。

根据本发明实施例的一种具体实现方式，所述标定摄像机类型通过人工方式标定，或者通过对每种摄像机拍摄图像特征进行特征建模，实现对视频片段的自动标定。

根据本发明实施例的一种具体实现方式，对视频片段进行关键动作片段标定，从而生成对应关键动作片段的直播摄像方案。

根据本发明实施例的一种具体实现方式，还包括回环检测步骤，比较每两帧图像的相似度，当相似度大于阈值，就认为这两帧图像是在同一点观测到的，并对摄像机的轨迹进行修正。

根据本发明实施例的一种具体实现方式，还包括人工修正摄像机参数的步骤。

根据本发明实施例的一种具体实现方式，还包括对视频关键帧的运动模糊进行复原的步骤。

根据本发明实施例的一种具体实现方式，还包括对视频关键帧进行图像增强的步骤。

另一方面，本发明还提供了一种电子设备，所述电子设备包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行前述的一种直播机位摄像方案自动学习方法。

另一方面，本发明还提供了一种非暂态计算机可读存储介质，该非暂态计算机可读存储介质存储计算机指令，该计算机指令用于使该计算机执行前述的一种直播机位摄像方案自动学习方法。

另一方面，本发明还提供了一种计算机程序产品，包括存储在非暂态计算机可读存储介质上的计算程序，该计算机程序包括程序指令，当该程序指令被计算机执行时，使该计算机执行前述的一种直播机位摄像方案自动学习方法。

有益效果

本发明提出的一种直播机位摄像方案自动学习方法，通过对已有直播视频进行图像处理生成直播摄像方案，对直播摄像方案的学习提供了辅助方法和工具，也为直播摄像过程的自动化提供了可能。

附图说明

图1为本发明实施例所述方法的流程图；

图2为相机成像原理示意图。

具体实施方式

下面结合附图，具体说明本发明的优选实施方式。

本发明实施例提供了一种直播机位摄像方案自动学习方法，如图1所示，包括以下步骤：

S1：对已有直播视频进行镜头分割，使得每个视频片段不包含相机切换；

因为直播视频包含多个直播摄像机摄像视频，所以首先需要对已有直播视频进行镜头分割，使得每个视频片段不包含相机切换。分割后的每个视频片段只包含某一个摄像机的视频数据。

S2：选取一段分割后的视频片段，标定摄像机类型，并逐帧提取得到视频关键帧序列；

根据本发明实施例的一种具体实现方式，由于直播过程中使用的摄像机种类很少，所以可以通过人工方式标定每一种摄像机类型。也可以对有限的几种摄像机拍摄图像特征进行特征建模，实现对视频片段的自动标定。

S3：对相邻的毎两帧图像进行特征点提取和匹配；

这个步骤可以使用图像处理领域已有的特征点提取和匹配算法，例如ORB、SIFT、SURF 等。

S4：利用匹配的特征点得到摄像机帧间运动的旋转矩阵和平移向量；

图2为相机小孔成像原理示意图。如图2所示，步骤S3中已经给定成功匹配的空间点在相机平面内投影的坐标，需要计算相机在观察点之间的运动状态。这个步骤可以借鉴移动机器人自主导航领域为机器人定位和建图时使用的SLAM视觉里程计技术。在视觉里程计技术中，有多种方法可以用来估计相机运动状态，例如PnP方法、ICP方法、对极几何方法等。例如在对极几何方法中，每两个成功匹配的点可以提供一对对极约束，提供八个点就可以计算出本质矩阵，对本质矩阵进行SVD分解就可以解出相机运动的旋转矩阵R和平移向量t。相机的帧间运动一般用四元数、欧拉角或者旋转矩阵、平移矢量表示。

S5：根据摄像机帧间运动参数得到对应于每个关键帧时间点的摄像机世界坐标和姿态，从而获得摄像机在摄像过程中的运动轨迹和姿态参数；

获得每两帧之间的摄像机帧间运动参数即旋转矩阵R和平移向量t后，就可以计算得出对应于每个关键帧时间点的摄像机世界坐标和姿态，从而获得摄像机在摄像过程中的运动轨迹和姿态参数。

步骤S2-S5是对一段视频片段进行处理的步骤，获得的是与该视频片段对应的摄像机运动轨迹和姿态参数。对所有视频片段进行摄像机运动轨迹和姿态参数生成，得到直播过程使用的所有摄像机参数构成的直播摄像方案。

在直播视频中，很多视频片段对应着一些关键动作。例如，高空滑雪运动员做了一个高空翻滚特技，此时往往会有一段特写镜头。用户可以对感兴趣的视频片段进行关键动作标定，从而生成针对这些关键动作的直播摄像方案。

由于计算每两帧之间的帧间运动都会存在误差，误差不断积累会使得结果产生严重的偏离。所以本实施例还包括回环检测步骤，比较每两帧图像的相似度，当相似度大于阈值，就认为这两帧图像是在同一点观测到的，对应这两帧的摄像机位置应该一致。回环检测的关键问题是如何度量两个图像帧之间的相似性，当前的成熟的方法是词袋模型，创建词袋，利用词袋中每一帧图像中的特征元素比较每两帧图像的相似度，当相似度大于某一个阈值的时候，就认为这两幅图像是在同一点观测到的，相机回到了曾经到达过的位置。根据检测结果对摄像机的轨迹进行修正。

根据本发明实施例的一种具体实现方式，还包括人工修正摄像机参数的步骤。本实施例的方法还提供了人机交互接口，用户可以手动对摄像机参数进行修正，从而可以人工加入先验参数，或者修改直播视频中用户认为需要改进之处，或者生成根据不同用户定制的直播摄像方案。

直播视频可能会存在拍摄质量问题，可以通过图像处理技术对视频中的运动模糊进行复原。提高视频质量有助于获得正确的摄像机运动参数。

根据本发明实施例的一种具体实现方式，还包括对视频关键帧进行图像增强的步骤。图像增强步骤可以对低质量视频进行去雾、增强对比度等处理，提高图像的清晰度。

至少一个处理器；以及，

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。其中，单元的名称并不构成对该单元本身的限定。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种直播机位摄像方案自动学习方法，其特征在于，包括以下步骤：

对相邻的毎两帧图像进行特征点提取和匹配；

2.根据权利要求1所述的一种直播机位摄像方案自动学习方法，其特征在于，所述标定摄像机类型通过人工方式标定，或者通过对每种摄像机拍摄图像特征进行特征建模，实现对视频片段的自动标定。

3.根据权利要求1或2所述的一种直播机位摄像方案自动学习方法，其特征在于，对视频片段进行关键动作片段标定，从而生成对应关键动作片段的直播摄像方案。

4.根据权利要求3所述的一种直播机位摄像方案自动学习方法，其特征在于，还包括回环检测步骤，比较每两帧图像的相似度，当相似度大于阈值，就认为这两帧图像是在同一点观测到的，并对摄像机的轨迹进行修正。

5.根据权利要求4所述的一种直播机位摄像方案自动学习方法，其特征在于，还包括人工修正摄像机参数的步骤。

6.根据权利要求5所述的一种直播机位摄像方案自动学习方法，其特征在于，还包括对视频关键帧的运动模糊进行复原的步骤。

7.根据权利要求6所述的一种直播机位摄像方案自动学习方法，其特征在于，还包括对视频关键帧进行图像增强的步骤。

8.一种电子设备，其特征在于，所述电子设备包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行前述任一权利要求1-7所述的一种直播机位摄像方案自动学习方法。

9.一种非暂态计算机可读存储介质，其特征在于，该非暂态计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行前述任一权利要求1-7所述的一种直播机位摄像方案自动学习方法。