CN112860198A

CN112860198A - 视频会议的画面切换方法、装置、计算机设备及存储介质

Info

Publication number: CN112860198A
Application number: CN202110006064.2A
Authority: CN
Inventors: 徐飞扬
Original assignee: Quarkdata Software Co ltd
Current assignee: Quarkdata Software Co ltd
Priority date: 2021-01-05
Filing date: 2021-01-05
Publication date: 2021-05-28
Anticipated expiration: 2041-01-05
Also published as: CN112860198B

Abstract

本申请提供了一种视频会议的画面切换方法、装置、计算机设备及存储介质，涉及视频处理技术领域，用于提高视频会议画面切换的效果及切换速度。该方法主要包括：通过摄像头实时采集当前视频会议场景图像数据；从所述当前视频会议场景图像数据中识别出各个参会人员的位置坐标；获取所述参会人员中置信值最大的位置坐标，并将所述置信值最大的位置坐标确定为目标图像坐标；将视频会议当前图像的位置坐标和所述目标图像坐标带入S形函数得到多个按照时间先后顺序排列的中间图像坐标；根据所述中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像。

Description

视频会议的画面切换方法、装置、计算机设备及存储介质

技术领域

本申请涉及视频处理技术领域，尤其涉及一种视频会议的画面切换方法、装置、计算机设备及存储介质。

背景技术

传统的视频会议系统，通常是通过机械云台结合变焦镜头的方式去捕捉参会者发言人的位置，调整画面大小。比如，有5人参会，A发言的时候，摄像头转向A，如果发言人切换到B，则机械云台需要机械的调整转动方向，同时镜头变焦马达配合推动变焦镜组达到拉远拉近的效果。

传统机械云台为能达到镜头变焦的需求，往往使用变焦模组。相较于定焦模组，为兼顾图像画质与变焦功能，变焦模组中都会加入大量镜片，造成体积较为庞大且造价不菲。同时，由于电动机械变焦结构的限制，变焦过程往往也存在着对焦点偏移、变焦过程较为缓慢等情况。

发明内容

本申请实施例提供一种视频会议的画面切换方法、装置、计算机设备及存储介质，用于提高视频会议画面切换的效果及切换速度。

本发明实施例提供一种视频会议的画面切换方法，所述方法包括：

通过摄像头实时采集当前视频会议场景图像数据；

从所述当前视频会议场景图像数据中识别出各个参会人员的位置坐标；

获取所述参会人员中置信值最大的位置坐标，并将所述置信值最大的位置坐标确定为目标图像坐标；

将视频会议当前图像的位置坐标和所述目标图像坐标带入S形函数得到多个按照时间先后顺序排列的中间图像坐标；

根据所述中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像。

本发明实施例提供一种视频会议的画面切换装置，所述装置包括：

采集模块，用于通过摄像头实时采集当前视频会议场景图像数据；

识别模块，用于从所述当前视频会议场景图像数据中识别出各个参会人员的位置坐标；

确定模块，用于获取所述参会人员中置信值最大的位置坐标，并将所述置信值最大的位置坐标确定为目标图像坐标；

计算模块，用于将视频会议当前图像的位置坐标和所述目标图像坐标带入S形函数得到多个按照时间先后顺序排列的中间图像坐标；

切换模块，用于根据所述中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述视频会议的画面切换方法。

一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述视频会议的画面切换方法。

本发明提供一种视频会议的画面切换方法、装置、计算机设备及存储介质，首先通过摄像头实时采集当前视频会议场景图像数据；然后从当前视频会议场景图像数据中识别出各个参会人员的位置坐标；获取参会人员中置信值最大的位置坐标，并将所述置信值最大的位置坐标确定为目标图像坐标；将视频会议当前图像的位置坐标和所述目标图像坐标带入S形函数得到多个按照时间先后顺序排列的中间图像坐标；最后根据中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像。与目前通过在变焦模组中加入大量镜片实现会议画面的切换相比，本发明基于确定的目标图像坐标和当前图像的位置坐标确定按照顺序排列的中间图像坐标，然后根据中间图像坐标的先后顺序将视频会议当前图像切换到所述目标图像坐标对应的目标图像，从而实现了视频画面的切换，提高了视频会议画面切换的效果及切换速度。

附图说明

图1为本申请实施例提供的视频会议的画面切换方法流程图；

图2为本申请实施例提供的确定参会人员的位置坐标流程图；

图3为本申请一个实施例提供的视频会议的画面切换装置的结构框图；

图4为本申请一个实施例提供的计算机设备的一示意图。

具体实施方式

为了更好的理解上述技术方案，下面通过附图以及具体实施例对本申请实施例的技术方案做详细的说明，应当理解本申请实施例以及实施例中的具体特征是对本申请实施例技术方案的详细的说明，而不是对本申请技术方案的限定，在不冲突的情况下，本申请实施例以及实施例中的技术特征可以相互组合。

请参阅图1，所示为本发明第一实施例当中的视频会议的画面切换方法，所述方法具体包括步骤S10-步骤S50：

步骤S10，通过摄像头实时采集当前视频会议场景图像数据。

其中，当前视频会议场景图像数据为视频流(video image buffer/视频中每一帧的画面)，通过对视频流进行识别可获取视频中各个参会人员的位置坐标。

步骤S20，从当前视频会议场景图像数据中识别出各个参会人员的位置坐标。

具体的如图2所示，从所述当前视频会议场景图像数据中识别出各个参会人员的位置坐标，包括：

步骤S201，从所述当前视频会议场景图像数据中识别出各个参会人员的人型位置信息、人脸位置信息。

其中，人型位置信息代表参会人员人体的中心中标，人脸位置坐标信息为参会人员的人脸中心的位置坐标，位置坐标具体可以通过(x，y)表示。

步骤S202，根据人型位置信息、所述人脸位置信息确定各个参会人员的位置坐标。

在本实施例中，具体可以根据画面切换后显示的需求确定参会人员的位置坐标，若参会人员是站立状态(需要全身显示参会人员视频画面)，则可以将人型位置信息确定为参会人员的位置坐标；若参会人员为坐立状态(需要半身显示参会人员视频画面)，则可将人脸位置信息确定为参会人员的位置坐标；还可以个根据人型位置坐标信息和人脸位置信息所对应的中心坐标确定为参会人员的位置坐标，本发明实施例不做具体限定。

步骤S30，获取所述参会人员中置信值最大的位置坐标，并将所述置信值最大的位置坐标确定为目标图像坐标。

需要说明的是，本实施例在获取到各个参会人员的位置坐标之后，需要裁剪出位置坐标所在的区域，该区域的大小具体可以根据位置坐标在参会人员的位置确定，如位置坐标在参会人员的人脸位置，则裁剪出的区域为人脸所在的区域(如横版区域)，如位置坐标在参会人员身体的中间位置，则裁剪出的区域为人体所在的区域(如竖版区域)。之后，根据裁剪区域内的图像信息确定置信值，该置信值代表该区域检测的可信值，如人脸检测算法中，置信值代表这一块图像区域与人脸的接近程度，置信值为100％则代表一定是人脸。

在本发明提供的一个实施例中，置信值除了可以根据裁剪区域的图像信息确定，还可以根据声源位置信息确定，具体确定置信值的过程为：通过拾音模块获取声源位置信息；根据所述各个参会人员的位置坐标与所述声源位置坐标的位置关系确定各参会人员的置信值。具体的，参会人员的位置坐标与声源位置坐标越近，对应位置坐标的参会人员的置信值也就越大，即从参会人员的位置坐标中选择一个距离声源位置坐标最近的坐标作为目标图像坐标。

此外，本实施例还可以结合裁剪区域内图像信息的置信值，以及参会人员的位置坐标与所述声源位置坐标的位置关系确定目标图像坐标。具体的，通过加权计算得到对应的目标坐标，例如存在3个位置坐，分别位置坐标1、位置坐标2和位置坐标3，位置坐标1对应裁剪区域的置信值度为9，位置坐标2对应的裁剪区域的置信值为8，位置坐标3对应的裁剪区域的置信值为5，若声源位置坐标2距离位置坐标2最近，对应的置信值为9、其次是位置坐标1，对应的置信值为7，最后是位置坐标3，对应的置信值为5；若裁剪区域图像的权重值为0.6，声源位置坐标对应的权重值为0.4，则经过计算位置坐标1的置信值为9*0.6+7*0.4＝7；位置坐标2的置信值为8*0.6+9*0.4＝8.4；位置坐标3的置信值为5*0.6+5*0.4＝5；即最后选择位置坐标2作为目标图像坐标。

步骤S40，将视频会议当前图像的位置坐标和所述目标图像坐标带入S形函数得到多个按照时间先后顺序排列的中间图像坐标。

具体的，通过下述位置拟合函数模型(Logistic函数，一类函数曲线伟S型的函数)计算多个按照时间先后顺序排列的中间图像坐标：

其中，所述P₀为所述视频会议当前图像的位置坐标，所述K为所述目标图像坐标，所述r为衡量S曲线的变化率，所述t为时间。t的时间单位是s，本实施中是以帧率计算时间间隔t，例如当视频为30帧时，时间递增的间隔就是1/30s。

置信值与rt正相关，在图像开始变换时，变换速度从0开始加速增长，随着当前位置到达中间值时，变换速度达到最大值。之后，随着变换的继续进行，速度开始逐渐降低，当前位置越接近目标位置，速度降低的越慢。最终，当前图像的位置与目标图像位置重合后，变换速度降为0。

步骤S50，根据所述中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像。

对于本发明实施例，在根据所述中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像之前，所述方法还包括：确定将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像所需要的帧数；根据所述帧数对所述S曲线进行等距分割得到每一帧的位置坐标。在本实施例中，确定了帧数就相当于确定了起始时间to和结束时间ts，ts-to的值就等于帧数x帧间隔的时长，所以对应的最终取的中间过程的P(t0),P(t1),P(t2).....的数量是和帧数相等的。

具体的，根据所述中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像，包括：裁剪并放大所述每一帧的位置坐标对应的位置区域；按照裁剪并放大的各位置区域对应的顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像。

需要说明的是，每一步裁切下来的图像大小是变化的，将所有的中间过程的图像经过不同比例的放大，最终得到相同大小的图像。

本发明提供一种视频会议的画面切换方法，首先通过摄像头实时采集当前视频会议场景图像数据；然后从当前视频会议场景图像数据中识别出各个参会人员的位置坐标；获取参会人员中置信值最大的位置坐标，并将所述置信值最大的位置坐标确定为目标图像坐标；将视频会议当前图像的位置坐标和所述目标图像坐标带入S形函数得到多个按照时间先后顺序排列的中间图像坐标；最后根据中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像。与目前通过在变焦模组中加入大量镜片实现会议画面的切换相比，本发明基于确定的目标图像坐标和当前图像的位置坐标确定按照顺序排列的中间图像坐标，然后根据中间图像坐标的先后顺序将视频会议当前图像切换到所述目标图像坐标对应的目标图像，从而实现了视频画面的切换，提高了视频会议画面切换的效果及切换速度。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

在一实施例中，提供一种视频会议的画面切换装置，该视频会议的画面切换装置与上述实施例中视频会议的画面切换方法一一对应。如图3所示，所述视频会议的画面切换装置各功能模块详细说明如下所示：

采集模块10，用于通过摄像头实时采集当前视频会议场景图像数据；

识别模块20，用于从所述当前视频会议场景图像数据中识别出各个参会人员的位置坐标；

确定模块30，用于获取所述参会人员中置信值最大的位置坐标，并将所述置信值最大的位置坐标确定为目标图像坐标；

计算模块40，用于将视频会议当前图像的位置坐标和所述目标图像坐标带入S形函数得到多个按照时间先后顺序排列的中间图像坐标；

切换模块50，用于根据所述中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像。

所述识别模块20，具体用于：

从所述当前视频会议场景图像数据中识别出各个参会人员的人型位置信息、人脸位置信息；

根据人型位置信息、所述人脸位置信息确定各个参会人员的位置坐标。

进一步的，确定模块30，还用于：

通过拾音模块获取声源位置信息；

根据所述各个参会人员的位置坐标与所述声源位置坐标的位置关系确定各参会人员的置信值。

计算模块40，用于通过下述公式计算多个按照时间先后顺序排列的中间图像坐标：

其中，所述P₀为所述视频会议当前图像的位置坐标，所述K为所述目标图像坐标，所述r为衡量S曲线的变化率，所述t为时间。

所述确定模块30，还用于确定将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像所需要的帧数；根据所述帧数对所述S曲线进行等距分割得到每一帧的位置坐标。

所述切换模块50，具体用于：

裁剪并放大所述每一帧的位置坐标对应的位置区域；

按照裁剪并放大的各位置区域对应的顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像。

关于视频会议的画面切换装置的具体限定可以参见上文中对于视频会议的画面切换方法的限定，在此不再赘述。上述设备中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种视频会议的画面切换方法。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现以下步骤：

通过摄像头实时采集当前视频会议场景图像数据；

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

通过摄像头实时采集当前视频会议场景图像数据；

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种视频会议的画面切换方法，其特征在于，所述方法包括：

通过摄像头实时采集当前视频会议场景图像数据；

2.根据权利要求1所述的视频会议的画面切换方法，其特征在于，从所述当前视频会议场景图像数据中识别出各个参会人员的位置坐标，包括：

3.根据权利要求2所述的视频会议的画面切换方法，其特征在于，所述方法还包括：

通过拾音模块获取声源位置信息；

4.根据权利要求1所述的视频会议的画面切换方法，其特征在于，所述将视频会议当前图像的位置坐标和所述目标图像坐标带入S形函数得到多个按照时间先后顺序排列的中间图像坐标，包括：

通过下述公式计算多个按照时间先后顺序排列的中间图像坐标：

5.根据权利要求4所述的视频会议的画面切换方法，其特征在于，在根据所述中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像之前，所述方法还包括：

确定将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像所需要的帧数；

根据所述帧数对所述S曲线进行等距分割得到每一帧的位置坐标。

6.根据权利要求5所述的视频会议的画面切换方法，其特征在于，根据所述中间图像坐标的先后顺序将所述视频会议当前图像切换到所述目标图像坐标对应的目标图像，包括：

裁剪并放大所述每一帧的位置坐标对应的位置区域；

7.一种视频会议的画面切换装置，其特征在于，所述装置包括：

8.根据权利要求7所述的视频会议的画面切换装置，其特征在于，所述识别模块，具体用于：

9.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的视频会议的画面切换方法。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的视频会议的画面切换方法。