CN108682032A

CN108682032A - 控制视频图像输出的方法、装置、可读存储介质及终端

Info

Publication number: CN108682032A
Application number: CN201810284993.8A
Authority: CN
Inventors: 运如靖
Original assignee: Guangzhou Shiyuan Electronics Thecnology Co Ltd; Guangzhou Shirui Electronics Co Ltd
Current assignee: Guangzhou Shiyuan Electronics Thecnology Co Ltd; Guangzhou Shirui Electronics Co Ltd
Priority date: 2018-04-02
Filing date: 2018-04-02
Publication date: 2018-10-19
Anticipated expiration: 2038-04-02
Also published as: CN108682032B

Abstract

一种控制视频图像输出的方法、装置、可读存储介质及终端，该方法包括步骤：根据麦克风阵列接收的语音信号的时间差信息获取当前发言人的位置信息，并根据所述位置信息确定所述当前发言人在摄像头获取的原始图像中的位置坐标；将摄像头获取的原始图像切分为多个区域图像；确定所述多个区域图像中所述位置坐标所在的区域图像，并将所述位置坐标所在的区域图像放大输出。本发明通过麦克风阵列获取当前发言人的位置信息，并将摄像头获取的原始图像切分为多个区域图像。根据当前发言人的位置信息确定中发言人的图像位于哪一个或哪几个区域图像中，再将确定的区域图像放大输出。实现了摄像头自动追踪物体及进行人物特写的功能。

Description

控制视频图像输出的方法、装置、可读存储介质及终端

技术领域

本发明涉及视频图像处理技术领域，特别是涉及一种控制视频图像输出的方法、装置、可读存储介质及终端。

背景技术

目前商用的多媒体视频会议系统包括用以采集会场视频画面的摄像机、用以采集发言人语音信号的麦克风阵列以及用以播放当前会场视频画面的显示装置。在会议进行当中，为了更好的使与会人员更能详细的了解当前发言人的情况，通常需要将布置于会场的摄像机对准当前发言人，并实时采集并播放其实际发言情况。

目前，声源定位技术的应用非常广泛，在多媒体视频会议中，通过声源定位技术可以估计出声源的位置和方向角，为实现对发言人进行拍摄追踪提供了技术支持。

然而，现有技术中，一般的视频摄像头是固定不动的，要实现摄像机对准当前发言人，需要通过人为进行调整视频摄像头的位置，或通过步进电机控制摄像头旋转，无疑增加了人力和物力成本，而且无法自动追踪物体及进行人物特写。

发明内容

鉴于上述状况，有必要针对现有技术中无法自动追踪物体及进行人物特写的问题，提供一种控制视频图像输出的方法及装置。

本发明提供了一种控制视频图像输出的方法，包括步骤：

根据麦克风阵列接收的语音信号的时间差信息获取当前发言人的位置信息，并根据所述位置信息确定所述当前发言人在摄像头获取的原始图像中的位置坐标；

将所述摄像头获取的原始图像切分为多个区域图像；

确定所述多个区域图像中所述位置坐标所在的区域图像，并将所述位置坐标所在的区域图像放大输出。

上述方法，其中，所述根据麦克风阵列接收的语音信号的时间差信息获取当前发言人的位置信息的步骤包括：根据麦克风阵列接收的语音信号的时间差信息获取当前发言人相对与所述麦克风阵列的第一位置信息；根据所述第一位置信息及所述麦克风阵列相对于摄像头的位置获取所述当前发言人相对于所述摄像头的第二位置信息，所述第二位置信息包括所述当前发言人相对于所述摄像头的当前距离和角度；

所述根据所述位置信息确定所述当前发言人在摄像头获取的原始图像中的位置坐标的步骤包括：根据所述第二位置信息及摄像头获取的原始图像的成像范围，确定所述当前发言人在所述原始图像中的位置坐标。

上述方法，其中，所述将所述摄像头获取的原始图像切分为多个区域图像的步骤包括：

根据预设的参考距离与所述当前距离的比值，将所述原始图像切分为与所述比值对应的个数的区域图像。

上述方法，其中，所述根据预设的参考距离与所述当前距离的比值，将所述原始图像切分为与所述比值对应的个数的区域图像的步骤包括：

计算所述当前距离与预设的参考距离的比值，并判断所述比值是否大于1；

当所述比值大于1时将所述原始图像切分为与所述比值对应的个数的区域图像。

上述方法，其中，所述确定所述多个区域图像中所述位置坐标所在的区域图像的步骤包括：

以所述位置坐标为中心，确定围绕所述中心的区域范围覆盖的一个或多个所述区域图像，所述区域范围为以所述位置坐标为中心以预设的半径所形成的圆形区域，所述长度与所述当前距离相关。

本发明还提供了一种控制视频图像输出的装置，包括：

获取模块，用于根据麦克风阵列接收的语音信号的时间差信息获取当前发言人的位置信息；

第一确定模块，用于根据所述位置信息确定所述当前发言人在摄像头获取的原始图像中的位置坐标；

视频图像切割模块，用于将所述摄像头获取的原始图像切分为多个区域图像；

第二确定模块，用于确定所述多个区域图像中所述位置坐标所在的区域图像；

放大模块，用于放大所述确定的区域图像；

输出模块，用于输出视频图像。

上述装置，其中，所述获取模块包括：

第一获取子模块，用于根据麦克风阵列接收的语音信号的时间差信息获取当前发言人相对与所述麦克风阵列的第一位置信息；

第二获取子模块，用于根据所述第一位置信息及所述麦克风阵列相对于摄像头的位置获取所述当前发言人相对于所述摄像头的第二位置信息，所述第二位置信息包括所述当前发言人相对于所述摄像头的当前距离和角度；

所述第一确定子模块具体用于根据所述第二位置信息及摄像头获取的原始图像的成像范围，确定所述当前发言人在原始图像中的位置坐标。

上述装置，其中，所述视频图像切割模块包括：

切分数量计算模块，用于计算所述当前距离与预设的参考距离的比值；

切分实施模块，用于将所述原始图像切分为与所述比值对应的个数的区域图像。

上述装置，其中，所述视频图像切割模块还包括：

判断模块，用于判断所述比值是否大于1，当所述比值大于1时将所述原始图像切分为与所述比值对应的个数的区域图像。

上述装置，其中，所述确定所述多个区域图像中所述位置坐标所在的区域图像的步骤包括：

本发明实施例还提供了一种可读存储介质，其上存储有计算机程序，所述程序被处理器执行时可实现上述方法的步骤。

本发明实施例还提供了一种终端，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时可实现上述方法的步骤。

本发明通过麦克风阵列获取当前发言人的位置信息，并将摄像头获取的原始图像切分为多个区域图像。根据当前发言人的位置信息确定中发言人的图像位于哪一个或哪几个区域图像中，再将确定的区域图像放大输出。实现了摄像头自动追踪物体及进行人物特写的功能。

附图说明

图1为本发明第一实施例提供的控制视频图像输出的方法流程图；

图2为本发明第二实施例提供的控制视频图像输出的方法流程图；

图3为本发明实施例中麦克风阵列与摄像头的位置关系图；

图4为本发明实施例提供的控制视频图像输出装置的结构框图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

参照下面的描述和附图，将清楚本发明的实施例的这些和其他方面。在这些描述和附图中，具体公开了本发明的实施例中的一些特定实施方式，来表示实施本发明的实施例的原理的一些方式，但是应当理解，本发明的实施例的范围不受此限制。相反，本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。

请参阅图1，为本发明第一实施例提供一种控制视频图像输出的方法流程图。如图所示，所述方法包括步骤S11～S13。

步骤S11，根据麦克风阵列接收的语音信号的时间差信息获取当前发言人的位置信息，并根据所述位置信息确定所述当前发言人在摄像头获取的原始图像中的位置坐标。

麦克风阵列主要由多个麦克风组成，当前发言人距离每个麦克风的距离不同，即每个麦克风接收的语音信号的传播距离不同，因而每个麦克风接收的语音信号时间不同，因此可以根据语音信号的时间差信息获取当前发言人的位置信息。

由于麦克风阵列与摄像头的角度和距离为已知固定值，当确定了发言人相对于麦克风阵列原点的位置信息时，可根据位置换算，计算出发言人相对于摄像头的位置坐标。由于摄像头的拍摄的角度和拍摄的范围是固定的，当确定了发言人相对于摄像头的角度和距离时，可确定发言人在摄像头拍摄的原始图像上的位置坐标。

步骤S12，将所述摄像头获取的原始图像切分为多个区域图像。本实施例中摄像头为广角摄像头，选用2M以上像素进行拍摄，并选用1920×1080的分辨率输出。摄像头通过感光器件(COMS)对拍摄的原始图像进行光电处理，并通过ISP(Image Signal Processor，影视处理)进行摄像头的数据处理，将摄像头获取的原始图像根据分离像素点的方法进行切分，形成多个区域图像。

步骤S13，确定所述多个区域图像中所述位置坐标所在的区域图像，并将所述位置坐标所在的区域图像放大输出。

上述步骤中，通过确定所述多个区域图像中与当前发言人所在的区域图像，并将确定的区域图像全屏放大输出，即可得到清晰、且发言人位于画面的中心或靠近中心位置的视频图像。一般可通过点对点方式或通过压缩像素点方式进行放大图像。

本实施例通过麦克风阵列获取当前发言人的位置信息，并将摄像头获取的原始图像切分为多个区域图像。并根据发言人的位置信息确定中发言人位于哪一个或哪几个区域图像中，再将发言人所在的区域图像放大输出。实现了摄像头自动追踪物体及进行人物特写的功能。

请参阅图2，为本发明第二实施例提供一种控制视频图像输出的方法流程图。如图所示，所述方法包括步骤S21～S28。

步骤S21，根据麦克风阵列接收的语音信号的时间差信息获取当前发言人相对与所述麦克风阵列的第一位置信息。由于发言人在同一位置，麦克风接收到的语音接收的时间不同，通过麦克风阵列接收发言人的语音信息，并计算出语音到达不同麦克风的时间差，可计算出当前发言人相对于麦克风阵列的角度和当前距离，即可确定发言人相对于麦克风阵列原点的位置信息。

步骤S22，根据所述第一位置信息及所述麦克风阵列相对于摄像头的位置确定所述当前发言人相对于所述摄像头的第二位置信息，所述第二位置信息包括所述当前发言人相对于所述摄像头的当前距离和角度。

步骤S23，根据所述第二位置信息及摄像头获取原始图像的成像范围，确定所述当前发言人在所述原始图像中的位置坐标。

步骤S24，计算所述当前距离与预设的参考距离的比值。该参考距离为摄像头呈现的发言人图像大小适中时，发言人距离摄像头的距离。当发言人距离摄像头的距离大于该参考距离时，摄像头获取的发言人图像过小，当发言人距离摄像头的距离小于该参考距离时，摄像头获取的发言人图像过大。

步骤S25，判断所述比值是否大于1，当所述比值大于1时执行步骤S26，否则执行步骤S28。

步骤S26，将所述原始图像切分为与所述比值对应的个数的区域图像。所述比值不为整数时，采用四舍五入后的比值，原始图像切分的区域图像的个数即为四舍五入后的比值。

步骤S27，确定所述多个区域图像中所述位置坐标所在的区域图像。

如图3所示，麦克风阵列200与摄像头100的角度和距离为已知固定值，当确定了发言人相对于麦克风阵列200的原点的位置信息时，可根据坐标换算，计算出发言人相对于摄像头100的位置信息，及第二位置信息。由于摄像头的拍摄的角度和拍摄的范围是固定的，当确定了发言人相对于摄像头的第二位置信息(r1,r2)时，根据所述第二位置信息及所述原始图像的成像范围，可确定发言人在摄像头拍摄的原始图像上的位置坐标(r1’,r2’)。

进一步的，所述确定所述多个区域图像中所述位置坐标所在的区域图像的步骤包括：

以所述位置坐标为中心，确定围绕所述中心的区域范围覆盖的一个多个所述区域图像，所述区域范围为以所述位置坐标为中心以预设的半径所形成的圆形区域，所述长度与所述当前距离相关

由于发言人在摄像头拍摄的原始图像上的位置为一个点坐标，只有根据该坐标设定有效区域，如圆形区域，才能形成发言人图像。所述圆形区域的半径根据当前发言人与摄像头的相对距离设定。例如，当前发言人与摄像头的相对距离越大，所述圆形区域的半径越小；当前发言人与摄像头的相对距离越小，所述圆形区域的半径越大。

步骤S27，将确定的所述区域图像全屏放大输出。

步骤S28，输出摄像头获取的原始图像。

当发言人与摄像头的距离与所述参考距离的比值越大时，说明当前发言人距离摄像头越远，发言人在原始图像中呈现的越小。因此需要将原始图像切割成较多数量的区域图像，这样将当发言人的位置对应的区域图像放大的倍数就越大，发言人的图像也能保持在大小适中、且位于图像中心的状态。当计算的所述比值等于1时，说明发言人处于合适的位置，不需要调整摄像头获取的图像，直接输出原始图像。当计算的所述比值小于1时，说明发言人距离摄像头的很近，也不需要调整图像。

本实施例通过麦克风阵列获取当前发言人相对于麦克风阵列的位置信息。将摄像头获取的原始图像切分为多个区域图像，并根据所述位置信息确定发言人的图像位于哪一个或哪几个区域图像中，再将确定的区域图像放大输出。本实施例根据当前发言人与摄像头的距离来确定摄像头获取的原始图像进行切分的数量，使摄像头呈现的发言人图像始终保持大小适中、且位于视频图像中心的状态，实现摄像头自动追踪物体及进行人物特写的功能。

请参阅图4，为本发明实施例提供的一种控制视频图像输出的装置。如图4所示，所述装置包括：获取模块30、第一确定模块31、视频图像切割模块32、第二确定模块33、放大模块34和输出模块35。

所述获取模30块用于根据麦克风阵列接收的语音信号的时间差信息获取当前发言人的位置信息。

具体的，所述获取模块30包括：

第二获取子模块，用于根据所述第一位置信息及所述麦克风阵列相对于摄像头的位置获取所述当前发言人相对于所述摄像头的第二位置信息，所述第二位置信息包括所述当前发言人相对于所述摄像头的当前距离和角度。

第一确定模块31用于根据所述位置信息确定所述当前发言人在摄像头获取的原始图像中的位置坐标。具体的，所述第一确定模块用于根据所述第二位置信息及摄像头获取的原始图像的成像范围，确定所述当前发言人在所述原始图像中的位置坐标。

所述视频图像切割模块32用于根据当前发言人相对于所述麦克风阵列的当前距离将摄像头获取的原始图像切分为多个区域图像。原始图像根据分离像素点的方法进行切分，形成多个区域图像。

进一步的，所述视频图像切割模块包括：

判断模块，用于判断所述比值是否大于1；

切分实施模块，用于当所述比值大于1时将所述原始图像切分为与所述比值对应的个数的区域图像。

所述第二确定模块33用于确定所述多个区域图像中所述位置坐标所在的区域图像。其具体步骤为：

放大模块34用于放大所述第二确定模块33确定的区域图像。一般可通过点对点方式或通过压缩像素点方式全屏放大图像。

输出模块35用于输出视频图像。当摄像头获取的原始图像切分后输出放大模块放大的区域图像。当摄像头获取的原始图像没有经过切分时，输出原始图像。

本实施例通过麦克风阵列获取当前发言人相对于麦克风阵列的位置信息，并将摄像头获取的原始图像切分为多个区域图像。根据当前发言人的位置信息确定中发言人的图像位于哪一个或哪几个区域图像中，再将确定的区域图像放大输出。实现了摄像头自动追踪物体及进行人物特写的功能。

本发明还提出一种可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述实施例的方法。

本发明实施例还提供了一种终端，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述方法的步骤。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。

计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种控制视频图像输出的方法，其特征在于，包括步骤：

将所述摄像头获取的原始图像切分为多个区域图像；

2.如权利要求1所述的控制视频图像输出的方法，其特征在于，所述根据麦克风阵列接收的语音信号的时间差信息获取当前发言人的位置信息的步骤包括：

根据麦克风阵列接收的语音信号的时间差信息获取当前发言人相对与所述麦克风阵列的第一位置信息；根据所述第一位置信息及所述麦克风阵列相对于摄像头的位置获取所述当前发言人相对于所述摄像头的第二位置信息，所述第二位置信息包括所述当前发言人相对于所述摄像头的当前距离和角度；

所述根据所述位置信息确定所述当前发言人在摄像头获取的原始图像中的位置坐标的步骤包括：

根据所述第二位置信息及摄像头获取的原始图像的成像范围，确定所述当前发言人在所述原始图像中的位置坐标。

3.如权利要求2所述的控制视频图像输出的方法，其特征在于，所述将所述摄像头获取的原始图像切分为多个区域图像的步骤包括：

4.如权利要求3所述的控制视频图像输出的方法，其特征在于，所述根据预设的参考距离与所述当前距离的比值，将所述原始图像切分为与所述比值对应的个数的区域图像的步骤包括：

5.如权利要求1所述的控制视频图像输出的方法，其特征在于，所述确定所述多个区域图像中所述位置坐标所在的区域图像的步骤包括：

6.一种控制视频图像输出的装置，其特征在于，包括：

放大模块，用于放大所述确定的区域图像；

输出模块，用于输出视频图像。

7.如权利要求6所述的装置，其特征在于，所述获取模块包括：

8.如权利要求7所述的装置，其特征在于，所述视频图像切割模块包括：

9.一种可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1－5中任意一项所述的方法的步骤。

10.一种终端，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1－5中任意一项所述的方法的步骤。