CN114554095B

CN114554095B - 一种4k摄像机的目标对象确定方法以及相关装置

Info

Publication number: CN114554095B
Application number: CN202210184340.9A
Authority: CN
Inventors: 刘纹高; 谢金元; 廖海; 晏瑞龙; 张秋
Original assignee: Sz Reach Tech Co ltd
Current assignee: Sz Reach Tech Co ltd
Priority date: 2022-02-25
Filing date: 2022-02-25
Publication date: 2024-04-16
Anticipated expiration: 2042-02-25
Also published as: CN114554095A

Abstract

本发明实施例公开了一种4k摄像机的目标对象确定方法以及相关装置，其中，一种4k摄像机的目标对象确定方法包括：定位第一镜头设备拍摄的当前帧图像内的各个人物对象轮廓；移动第二镜头设备拍摄当前帧图像内的各个人物对象轮廓区域，并捕捉各个所述人物对象轮廓区域的人物嘴部区域；对所述人物嘴部区域进行嘴部运动分析，根据分析结果，确定所述人物对象中的目标对象。可以实现第二镜头设备只对第一镜头设备定位的人物对象轮廓区域进行处理，使得第二镜头设备处理的图像区域范围更明确，有效提高对人物对象轮廓区域的人物嘴部区域捕捉的准确性，进而能够有效提高目标对象确定的准确性。

Description

一种4k摄像机的目标对象确定方法以及相关装置

技术领域

本发明涉及图像处理技术领域，尤其涉及一种4k摄像机的目标对象确定方法以及相关装置。

背景技术

如今视频直播已经尤为普遍了，在直播时，不仅需要全景的拍摄也需要对重点人物进行聚焦变倍，拉大重点人物的视角，比如说有人在视频直播中进行发言时，则这时需要将镜头切换给发言人，拉大发言人的视角，因此如何准确确定发言人是关键一步，而现有的技术中的4K摄像机跟踪方法，依然需要依靠人工阈值调节和样本训练，并没有结合现在智能识别技术来使用摄像机设备自动捕捉目标对象，因此，如何采用摄像机设备自动地捕捉目标对象还有待提高。

发明内容

本发明的主要目的在于提供一种4k摄像机的目标对象确定方法、装置、计算机设备及存储介质，可以解决现有技术中的需要依靠人工阈值调节和样本训练来确定图像中的目标对象。

为实现上述目的，本发明第一方面提供一种4k摄像机的目标对象确定方法，所述方法包括：

定位第一镜头设备拍摄的当前帧图像内的各个人物对象轮廓；所述第一镜头设备用于拍摄全景；

移动第二镜头设备拍摄当前帧图像内的各个人物对象轮廓区域，并捕捉各个所述人物对象轮廓区域的人物嘴部区域；所述第二镜头设备用于捕捉并聚焦人物对象；

对所述人物嘴部区域进行嘴部运动分析，根据分析结果，确定所述人物对象中的目标对象。

在该技术方案中，通过待第一镜头设备定位了当前帧图像内的各个人物对象轮廓后，再移动第二镜头设备对准第一镜头设备定位的当前帧图像内的各个人物对象轮廓区域进行人物嘴部区域的捕捉，这样可以实现第二镜头设备只对第一镜头设备定位的人物对象轮廓区域进行处理，使得第二镜头设备处理的图像区域范围更明确，有效提高对人物对象轮廓区域的人物嘴部区域捕捉的准确性。同时，后续通过第二镜头设备定位的人物嘴部区域得到的嘴部运动分析结果，来确定所述人物对象中的目标对象，能够有效提高目标对象确定的准确性。

结合第一方面，在一种可能的实现方式中，上述所述定位第一镜头设备中拍摄的当前帧图像内的各个人物对象轮廓，包括：计算所述当前帧图像中每两个相邻像素灰度值之间的差值，将所述差值与预设阈值比较，确定多个人物轮廓边缘特征点，得到至少一个人物轮廓边缘特征点集；根据所述人物轮廓边缘特征点集，确定所述当前帧图像中各个人物对象的轮廓，所述一个所述人物轮廓边缘特征点集对应于一个人物对象轮廓。

结合第一方面，在一种可能的实现方式中，上述所述移动第二镜头设备拍摄当前帧图像内的各个人物对象轮廓区域，包括：

获取所述人物对象轮廓区域的中心点与所述第一镜头设备的镜头中心点之间构成的第一角度；

计算所述第一镜头设备的镜头中心点与所述第二镜头设备的镜头中心点之间构成的第二角度；

根据第一角度和第二角度，移动第二镜头设备拍摄当前帧图像内的各个人物对象轮廓区域。

结合第一方面，在一种可能的实现方式中，上述所述捕捉各个人物对象轮廓区域的人物嘴部区域，包括：

根据面部轮廓匹配比例算法，捕捉各个人物对象轮廓区域的人物嘴部区域。

结合第一方面，在一种可能的实现方式中，上述所述根据分析结果，确定人物对象中的目标对象，包括：当分析结果为单人嘴动时，则将进行嘴动动作的人物对象作为目标对象；当分析结果为多人嘴动时，则根据各个人物对象对应的所述人物嘴部区域计算出各个人物对象的嘴动频率值，将所述嘴动频率值最高的人物对象作为目标对象。通过计算出各个人物对象的嘴动频率值，可以有效地确定所述嘴动频率值最高的人物对象作为目标对象。

结合第一方面，在一种可能的实现方式中，上述所述根据各个人物对象对应的所述人物嘴部区域计算出各个人物对象的嘴动频率值，包括：通过多帧差法，对预设时间段内获取到的每一帧图像内的同一个人物对象的所述人物嘴部区域进行嘴动频率计算，得到各个人物对象的嘴动频率值。

结合第一方面，在一种可能的实现方式中，上述所述确定所述人物对象中的目标对象之后，包括：获取所述目标对象在当前帧图像中的坐标信息，根据所述坐标信息控制所述第二镜头设备聚焦所述目标对象。

为实现上述目的，本发明第二方面提供一种4k摄像机的目标对象确定装置，包括如下步骤：

人像轮廓定位模块：用于定位第一镜头设备拍摄的当前帧图像内的各个人物对象轮廓；

嘴部区域捕捉模块：用于移动第二镜头设备拍摄当前帧图像内的各个人物对象轮廓区域，并捕捉各个所述人物对象轮廓区域的人物嘴部区域；

目标对象确定模块：用于对所述人物嘴部区域进行嘴部运动分析，根据分析结果，确定所述人物对象中的目标对象。

为实现上述目的，本发明第三方面提供一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行以下步骤：

为实现上述目的，本发明第四方面提供一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行以下步骤：

采用本发明实施例，具有如下有益效果：待第一镜头设备定位了当前帧图像内的各个人物对象轮廓后，再移动第二镜头设备对准第一镜头设备定位的当前帧图像内的各个人物对象轮廓区域进行人物嘴部区域的捕捉，这样可以实现第二镜头设备只对第一镜头设备定位的人物对象轮廓区域进行处理，使得第二镜头设备处理的图像区域范围更明确，有效提高对人物对象轮廓区域的人物嘴部区域捕捉的准确性。同时，后续通过第二镜头设备定位的人物嘴部区域得到的嘴部运动分析结果，来确定所述人物对象中的目标对象，能够有效提高目标对象确定的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

其中：

图1为本发明实施例中一种4k摄像机的目标对象确定方法的流程示意图；

图2为本发明实施例中定位第一镜头设备拍摄的当前帧图像内的各个人物对象轮廓的流程示意图；

图3为本发明实施例中根据分析结果确定所述人物对象中的目标对象的流程示意图；

图4为本发明实施例中一种4k摄像机的目标对象确定装置的结构示意图

图5为本发明实施例中计算机设备的结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请的技术方案可适用于各种利用摄像机拍摄进行直播导播场景。

参照图1，图1为本申请实施例提供的一种4k摄像机的目标对象确定方法的流程示意图，如图1所示，该方法包括如下步骤：

步骤S101、定位第一镜头设备拍摄的当前帧图像内的各个人物对象轮廓；所述第一镜头设备用于拍摄全景。

步骤S102、移动第二镜头设备拍摄当前帧图像内的各个人物对象轮廓区域，并捕捉各个所述人物对象轮廓区域的人物嘴部区域；所述第二镜头设备用于捕捉并聚焦人物对象。

步骤S103、对所述人物嘴部区域进行嘴部运动分析，根据分析结果，确定所述人物对象中的目标对象。

下面先对步骤S101、第一镜头设备拍摄的当前帧图像内的各个人物对象轮廓的定位进行介绍：

在很多摄像机直播场景中，不仅需要全景的拍摄也需要对重点人物聚焦变倍进行拍摄，比如说有人在视频直播中进行发言时，则这时需要将镜头切换给发言人，对发言人进行聚焦变倍，将发言人的视角拉大。在本实施例中，为了准确地确定目标对象，该目标对象是指正在说话的人，可以理解为当前的发言人，先确定图像中存在的人物对象。具体地，在本实施例中，使用第一镜头设备拍摄全景，通过定位第一镜头设备中当前帧图像内的各个人物对象轮廓来确定图像中的存在的人物对象。

具体地，参照图2所示，图2为本申请实施例提供的定位第一镜头设备拍摄的当前帧图像内的各个人物对象轮廓的流程示意图，如图2所示，该方法包括如下步骤：

步骤S1011、计算所述当前帧图像中每两个相邻像素灰度值之间的差值，将所述差值与预设阈值比较，确定多个人物轮廓边缘特征点，得到至少一个人物轮廓边缘特征点集；

步骤S1012、根据所述人物轮廓边缘特征点集，确定所述当前帧图像中各个人物对象的轮廓，所述一个所述人物轮廓边缘特征点集对应于一个人物对象轮廓。

由于图像中的场景的各种颜色、亮度的不同，每个像素点的灰度值会有所差别，因此，在本实施例中，可以根据每两个相邻像素点的灰度值的差值，来确定人物轮廓边缘特征点，从而定位每一个人物对象。具体地，由于图像中有很多个像素点，因此通过计算每两个相邻像素点的灰度值的差值，会得到多个人物轮廓边缘特征点，将连续的多个人物轮廓边缘特征点确定为一个人物轮廓边缘特征点集，根据人物轮廓边缘特征点集得到一个人物对象的人物轮廓，从而定位到一个人物对象。若图像中的人物对象具有多个时，则可以通过上述方法得到多个人物轮廓边缘特征点集，从而定位到多个人物对象。其中，一个人物轮廓边缘特征点集对应于一个人物对象轮廓。通过根据每两个相邻像素点的灰度值的差值来确定人物轮廓边缘特征点，可以有效地根据连续的多个人物轮廓边缘特征点定位每一个人物对象。

由于最终是要确定正在发言的目标对象，因此，待获取到图像中的人物对象之后，需要确定人物对象中谁在发言。在本实施例中，通过分析各个人物对象轮廓区域的人物嘴部区域，来确定目标对象，因此，首先要确定人物对象轮廓区域的人物嘴部区域，即执行步骤S102、移动第二镜头设备拍摄当前帧图像内的各个人物对象轮廓区域，并捕捉各个所述人物对象轮廓区域的人物嘴部区域；所述第二镜头设备用于捕捉并聚焦人物对象。

由于第一镜头设备拍摄的是全景图像，因此第一镜头设备识别定位的当前帧图像中的人物图像轮廓比较小，为了更加准确捕捉人物对象轮廓区域的人物嘴部区域，本实施例中，采用第二镜头设备对第一镜头设备识别定位的人物图像轮廓区域进行拍摄，使得该人物图像轮廓更加明确清晰。具体地，控制第二镜头设备移动到适当位置对准第一镜头设备识别定位的人物图像轮廓区域进行拍摄，可通过如下方法实现：

步骤S1021、获取所述人物对象轮廓区域的中心点与所述第一镜头设备的镜头中心点之间构成的第一角度；

步骤S1022、计算所述第一镜头设备的镜头中心点与所述第二镜头设备的镜头中心点之间构成的第二角度；

步骤S1023、根据第一角度和第二角度，移动第二镜头设备拍摄当前帧图像内的各个人物对象轮廓区域。

在本实施例中，为了更好地实现第二镜头设备对人物对象进行拍摄，通过计算第二镜头设备的移动角度，将第二镜头设备移动到合适的位置对任务对象进行拍摄。具体地，获取人物对象轮廓区域的中心点与第一镜头设备的镜头中心点之间构成的第一角度，第一角度可以为第一镜头设备的镜头中心点向人物对象轮廓区域的中心点方向水平发射的直线与以第一镜头设备的第一镜头中心点为起点向拍摄场景方向发射的直线之间构成的角度，并获取第二镜头设备的镜头中心点与第一镜头设备的镜头中心点之间构成的第二角度，第二角度可以为以第二镜头设备的镜头中心点为起点水平向前方向发射的直线与以第一镜头设备的第一镜头中心点为起点水平向前方向发射的直线之间构成的角度。最后，根据第一角度和第二角度计算出第二镜头设备旋转角度，确定第二镜头设备移动到达的位置。

在本实施例中，可以将第一角度与第二角度相减得到旋转角度。比如，第一镜头设备与第二镜头设备上下垂直放置，第一镜头设备为广角镜头，且可以固定不动，第二镜头设备为4k变焦镜头，可以进行360℃旋转来改变镜头方向。由于第一镜头设备的镜头中心点与第二镜头设备的镜头中心点距离较近，因此，为了方便计算旋转角度，将第一镜头设备的镜头中心点与第二镜头设备的镜头中心点看作为一点。在本实施例中，以第一镜头设备的第一镜头中心点为起点向拍摄场景方向发射的直线为中线，往这条中心线的左边为正，右边为负。也就是说，当人物对象在中线的左边，则第一角度为正值；当人物对象在中线的右边，则第一角度为负值，第二角度的正负同理可得。若第一角度为60°，第二角度为-30°，则第二镜头设备需要旋转90°。

将第二镜头设备根据移动角度，移动到确定的位置后，控制第二镜头设备变倍聚焦人物对象轮廓区域，通过根据面部轮廓匹配比例算法，捕捉各个人物对象轮廓区域的人物嘴部区域。

待获取到各个人物对象轮廓区域的人物嘴部区域，对各个人物对象轮廓区域的人物嘴部区域进行嘴部运动分析，根据分析结果，确定所述人物对象中的目标对象，即执行步骤S103、对所述人物嘴部区域进行嘴部运动分析，根据分析结果，确定所述人物对象中的目标对象。

在本实施例中，对人物嘴部区域进行嘴部运动分析，来判断图像中的人物对象有谁在发言。由于通过一帧图像的人物嘴部区域是无法判断哪个人物对象的嘴在运动的，因此，需要获取多帧图像的人物嘴部区域判断进行嘴动的人物对象。在本实施例中，可以获取预设时间段内的多帧图像的人物嘴部区域。从多帧图像中的每一帧图像中，获取同一个人物对象的人物嘴部区域，通过多帧差法对该人物对象的人物嘴部区域进行分析，判断该人物对象是否进行了嘴动。在本实施例中，通过上述方法对图像中的每一个人物对象同时进行嘴动判断分析，得到分析结果为单人嘴动还是多人嘴动。

在本实施例中，可以通过如下方法来确定多帧图像中的每一帧图像所对应的同一个人物对象：

获取上一帧图像中人物对象的P个人物轮廓边缘特征点的图像像素点坐标(x，y)，以及下一帧图像中P个人物轮廓边缘特征点的图像像素点坐标(x1，y2)，通过分水岭分割法进行计算，如下式计算：

A＝Σ_P|M(x，y)*δ-M(x1,y1)|>Y

其中M(x，y)为上一帧划定人物轮廓边缘特征点的图像像素点坐标，M(x1,y1)为下一帧划定人物轮廓边缘特征点的图像像素点坐标，δ为图像加权修正系数，Y为分水岭分割灰度值差得阈值，如果A大于给定阈值区，一般为A图形区域大于设定条件，则认为A是一个坐标集特征区域，则用于计算的上一帧的人物轮廓边缘特征点的图像像素点对应的人物对象轮廓与下一帧划定人物轮廓边缘特征点的图像像素点对应的人物对象轮廓为同一个人物对象的轮廓。

待得到分析结果后，对不同的分析结果分别通过不同方式来确定目标对象。参照图3所示，图3是本实施例提供的根据分析结果确定所述人物对象中的目标对象的流程示意图，如图3所示，该方法包括如下步骤：

步骤S1031、当分析结果为单人嘴动时，则将进行嘴动动作的人物对象作为目标对象；

步骤S1032、当分析结果为多人嘴动时，则根据各个人物对象对应的所述人物嘴部区域计算出各个人物对象的嘴动频率值，将所述嘴动频率值最高的人物对象作为目标对象。

当分析结果为单人嘴动时，则说明发言人只有一个人，则该人物对象作为目标对象。当分析结果为多人嘴动时，则说明说话的人至少有两个，有可能是两人对话也有可能是多人讨论，这时计算出各个人物对象的嘴动频率值，将所述嘴动频率值最高的人物对象作为目标对象。同样地于由于通过一帧图像的人物嘴部区域是无法计算出人物对象的嘴动频率值的，因此，同样地获取预设时间段内的多帧图像的人物嘴部区域，从多帧图像中的每一帧图像中，获取同一个人物对象的人物嘴部区域，通过多帧差法对该人物对象的人物嘴部区域进行嘴动频率值计算。通过计算出各个人物对象的嘴动频率值，可以有效地确定所述嘴动频率值最高的人物对象作为目标对象。

进一步地，在本实施例中，可以控制第二镜头设备对目标对象进行聚焦变倍。具体地，待确定目标对象后，第二镜头设备接收聚焦变倍指令，根据聚焦变倍指令，获取目标对象在当前帧图像中的坐标信息，根据该坐标信息控制第二镜头设备聚焦变倍目标对象。

上述介绍了本申请的方法，为了更好地实施本申请的方法，接下来介绍本申请的4k摄像机的目标对象确定装置。

参照图4，图4为本申请实施例提供的一种4k摄像机的目标对象确定装置的结构示意图。如图4所示，该4k摄像机的目标对象确定装置40包括：

人像轮廓定位模块401：用于定位第一镜头设备拍摄的当前帧图像内的各个人物对象轮廓；

嘴部区域捕捉模块402：用于移动第二镜头设备拍摄当前帧图像内的各个人物对象轮廓区域，并捕捉各个所述人物对象轮廓区域的人物嘴部区域；

目标对象确定模块403：用于对所述人物嘴部区域进行嘴部运动分析，根据分析结果，确定所述人物对象中的目标对象。

在一种可能的设计中，上述人像轮廓定位模块401具体用于：计算所述当前帧图像中每两个相邻像素灰度值之间的差值，将所述差值与预设阈值比较，确定多个人物轮廓边缘特征点，得到至少一个人物轮廓边缘特征点集；根据所述人物轮廓边缘特征点集，确定所述当前帧图像中各个人物对象的轮廓，所述一个所述人物轮廓边缘特征点集对应于一个人物对象轮廓。

在一种可能的设计中，上述嘴部区域捕捉模块402具体用于：根据面部轮廓匹配比例算法，捕捉各个人物对象轮廓区域的人物嘴部区域。

在一种可能的设计中，上述嘴部区域捕捉模块402具体用于：当分析结果为单人嘴动时，则将进行嘴动动作的人物对象作为目标对象；当分析结果为多人嘴动时，则根据各个人物对象对应的所述人物嘴部区域计算出各个人物对象的嘴动频率值，将所述嘴动频率值最高的人物对象作为目标对象。

在一种可能的设计中，上述嘴部区域捕捉模块402具体用于：获取所述人物对象轮廓区域的中心点与所述第一镜头设备的镜头中心点之间构成的第一角度；计算所述第一镜头设备的镜头中心点与所述第二镜头设备的镜头中心点之间构成的第二角度；根据第一角度和第二角度，移动第二镜头设备拍摄当前帧图像内的各个人物对象轮廓区域。

在一种可能的设计中，上述嘴部区域捕捉模块402具体用于：通过多帧差法，对预设时间段内获取到的每一帧图像内的同一个人物对象的所述人物嘴部区域进行嘴动频率计算，得到各个人物对象的嘴动频率值。

上述装置中，通过待第一镜头设备定位了当前帧图像内的各个人物对象轮廓后，再移动第二镜头设备对准第一镜头设备定位的当前帧图像内的各个人物对象轮廓区域进行人物嘴部区域的捕捉，这样可以实现第二镜头设备只对第一镜头设备定位的人物对象轮廓区域进行处理，使得第二镜头设备处理的图像区域范围更明确，有效提高对人物对象轮廓区域的人物嘴部区域捕捉的准确性。同时，后续通过第二镜头设备定位的人物嘴部区域得到的嘴部运动分析结果，来确定所述人物对象中的目标对象，能够有效提高目标对象确定的准确性。

图5示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端，也可以是服务器。如图5所示，该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统，还可存储有计算机程序，该计算机程序被处理器执行时，可使得处理器实现上述方法实施例中的各个步骤。该内存储器中也可储存有计算机程序，该计算机程序被处理器执行时，可使得处理器执行上述方法实施例中的各个步骤。本领域技术人员可以理解，图5中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提出了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行以下步骤：

在一个实施例中，提出了一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行以下步骤：

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种4k摄像机的目标对象确定方法，其特征在于，包括：

对所述人物嘴部区域进行嘴部运动分析，根据分析结果，确定所述人物对象中的目标对象；

所述移动第二镜头设备拍摄当前帧图像内的各个人物对象轮廓区域，包括：

获取所述人物对象轮廓区域的中心点与所述第一镜头设备的镜头中心点之间构成的第一角度；其中，所述第一角度为第一镜头设备的镜头中心点向人物对象轮廓区域的中心点方向水平发射的直线与以第一镜头设备的镜头中心点为起点向拍摄场景方向发射的直线之间构成的角度；

计算所述第一镜头设备的镜头中心点与所述第二镜头设备的镜头中心点之间构成的第二角度；其中，所述第二角度为以第二镜头设备的镜头中心点为起点水平向前方向发射的直线与以第一镜头设备的镜头中心点为起点水平向前方向发射的直线之间构成的角度；

2.根据权利要求1所述的方法，其特征在于，所述定位第一镜头设备拍摄的当前帧图像内的各个人物对象轮廓，包括：

计算所述当前帧图像中每两个相邻像素灰度值之间的差值，将所述差值与预设阈值比较，确定多个人物轮廓边缘特征点，得到至少一个人物轮廓边缘特征点集；

根据所述人物轮廓边缘特征点集，确定所述当前帧图像中各个人物对象的轮廓，所述一个所述人物轮廓边缘特征点集对应于一个人物对象轮廓。

3.根据权利要求1所述的方法，其特征在于，所述捕捉各个人物对象轮廓区域的人物嘴部区域，包括：

4.根据权利要求1所述的方法，其特征在于，所述根据分析结果，确定人物对象中的目标对象，包括：

当分析结果为单人嘴动时，则将进行嘴动动作的人物对象作为目标对象；

当分析结果为多人嘴动时，则根据各个人物对象对应的所述人物嘴部区域计算出各个人物对象的嘴动频率值，将所述嘴动频率值最高的人物对象作为目标对象。

5.根据权利要求4所述的方法，其特征在于，所述根据各个人物对象对应的所述人物嘴部区域计算出各个人物对象的嘴动频率值，包括：

通过多帧差法，对预设时间段内获取到的每一帧图像内的同一个人物对象的所述人物嘴部区域进行嘴动频率计算，得到各个人物对象的嘴动频率值。

6.根据权利要求1所述的方法，其特征在于，所述确定所述人物对象中的目标对象之后，包括：

获取所述目标对象在当前帧图像中的坐标信息，根据所述坐标信息控制所述第二镜头设备对所述目标对象进行聚焦变倍。

7.一种4k摄像机的目标对象确定装置，其特征在于，所述装置包括：

嘴部区域捕捉模块：用于移动第二镜头设备拍摄当前帧图像内的各个人物对象轮廓区域，并捕捉各个所述人物对象轮廓区域的人物嘴部区域；获取所述人物对象轮廓区域的中心点与所述第一镜头设备的镜头中心点之间构成的第一角度；其中，所述第一角度为第一镜头设备的镜头中心点向人物对象轮廓区域的中心点方向水平发射的直线与以第一镜头设备的镜头中心点为起点向拍摄场景方向发射的直线之间构成的角度；计算所述第一镜头设备的镜头中心点与所述第二镜头设备的镜头中心点之间构成的第二角度；其中，所述第二角度为以第二镜头设备的镜头中心点为起点水平向前方向发射的直线与以第一镜头设备的镜头中心点为起点水平向前方向发射的直线之间构成的角度；根据第一角度和第二角度，移动第二镜头设备拍摄当前帧图像内的各个人物对象轮廓区域；

8.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，使得所述处理器执行如权利要求1至6中任一项所述方法的步骤。

9.一种计算机设备，包括存储器和处理器，其特征在于，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如权利要求1至6中任一项所述方法的步骤。