CN104166840A

CN104166840A - 一种基于视频会议系统的聚焦实现方法

Info

Publication number: CN104166840A
Application number: CN201410349789.1A
Authority: CN
Inventors: 孔令波
Original assignee: Xiamen Yealink Network Technology Co Ltd
Current assignee: Xiamen Yealink Network Technology Co Ltd
Priority date: 2014-07-22
Filing date: 2014-07-22
Publication date: 2014-11-26

Abstract

本发明提供一种基于视频会议系统的聚焦实现方法，所述方法为：1、对视频会议系统采集的原始图像进行预处理，得到特征图像；2、对特征图像进行区域划分，分成多个的小尺寸图像，且小尺寸图像与特征匹配模板的尺寸一致，通过adaboost算法依次识别各区域是否包含人的头肩部特征；是，则记录区域坐标以及尺寸，否，则不记录坐标信息；以此类推，对整个图像进行遍历搜索，从而确定图像中的头肩部位置以及所占画面的比例信息；3、将头肩部的位置信息以及所占画面比例信息传递给视频会议系统的聚焦模块，进而实现视频会议系统的人物聚焦。本发明利用人物头肩部特征进行人物分类，简单易行、效率高；且提升聚焦算法聚焦到人物的准确度。

Description

一种基于视频会议系统的聚焦实现方法

技术领域

本发明涉及视频处理技术领域，尤其涉及一种基于视频会议系统的聚焦实现方法。

背景技术

视频会议系统主要关注对象是“人”，但是由于摄像头品质差异以及周围环境影响，可能导致摄像头对焦点不在人物周围，使人物图像模糊不清。现有技术的部分方案采用人脸特征作为参考依据，但是由于检测人脸需要较为清晰的图像，要求待搜索的图像分辨率较高，为实现较好的检测、识别效果，至少需要D1分辨率以上，并且需要人物面部在画面内可见。因此识别要求比较高。

为解决该类问题，本专利申请提出一种方法，高效、准确地获取人物特征，并且将人物位置以及在画面中的权重比例信息反馈给聚焦算法模块，供其作为调整焦距的判断条件，从而提升聚焦到人物的概率，使人物图像保持清晰。

发明内容

本发明要解决的技术问题，在于提供一种基于视频会议系统的聚焦实现方法，本发明利用人物头肩部特征进行人物分类，简单易行、效率高；且提升聚焦算法聚焦到人物的准确度。

本发明是这样实现的：一种基于视频会议系统的聚焦实现方法，包括如下步骤：

步骤1、对视频会议系统采集的原始图像进行预处理，得到特征图像；

步骤2、定义一特征匹配模板，且对该特征匹配模板的尺寸进行设定，对特征图像进行区域划分，分成多个的小尺寸图像，且小尺寸图像与特征匹配模板的尺寸一致，通过adaboost算法依次识别各区域是否包含人的头肩部特征；如果判断为是，则记录区域坐标以及尺寸，如果判断为否，则不记录坐标信息；以此类推，对整个图像进行遍历搜索，从而确定图像中的头肩部位置以及所占画面的比例信息；

步骤3、将头肩部的位置信息以及所占画面比例信息传递给视频会议系统的聚焦模块，作为聚焦模块的焦距调整算法的参数，进而实现视频会议系统的人物聚焦。

进一步地，所述步骤1具体为：对视频会议系统采集的原始图像通过haar-like特征进行人物头肩部特征提取，通过haar-like特征设置三个适用于头肩部特征提取的模板；三个模板用于计算haar-like特征值，每一种特征的计算都是由黑色填充区域的像素值之和与白色填充区域的像素值之和的差值，而计算出来的这个差值就是所谓的haar-like特征的特征值，从而得到特征图像。

本发明具有如下优点：1、高效、快速提取人物特征；

2、鲁棒性强，受人物动作影响较小，正向、侧向、背向均可；

3、向聚焦模块提供人物位置信息以及占图像的比例信息，提高聚焦人物的准确度。

附图说明

图1为本发明haar-like特征进行精简的四个模板。

图2为本发明三个模板结构示意图。

图3为本发明像素临域示意图。

具体实施方式

adaboost是目前应用广泛并且效果很好的分类算法之一，其核心思想是针对同一个训练集训练不同的弱分类器，然后把这些弱分类器集合起来，构成一个强分类器，该强分类器具有良好的分类效果。

本发明使用adaboost分类算法结合调整后的haar-like特征进行人物头肩部特征提取以及识别。

请参阅图1至图3所示，本发明为一种基于视频会议系统的聚焦实现方法，包括如下步骤：

其中，所述步骤1具体为：对视频会议系统采集的原始图像通过haar-like特征进行人物头肩部特征提取，通过haar-like特征设置三个适用于头肩部特征提取的模板；三个模板用于计算haar-like特征值，每一种特征的计算都是由黑色填充区域的像素值之和与白色填充区域的像素值之和的差值，而计算出来的这个差值就是所谓的haar-like特征的特征值，从而得到特征图像。

haar-like特征，是计算机视觉领域一种常用的特征描述算子,它最早是用于人脸描述。目前常用的haar-like特征可以分为四类：线性特征、边缘特征、点特征、对角线特征等。本发明根据头肩部特点，对原有haar-like特征进行了精简(如图1所示)，并且增加了三个适用于头肩部特征提取的模板(如图2所示)。这些模板用于计算haar-like特征值。

另外，所述adaboost算法进一步包括：adaboost强分类器训练过程，该训练过程具体为：

设输入样本为：{(X₁,Y₁),(X₂,Y₂),...,(X_n,Y_n)}，其中X_i为输入的训练样本，Y_i＝0或1，其中Y_i＝0表示正样本，Y_i＝1表示负样本，其中正样本的数目为p，负样本的数目为q，所以n＝p+q；正样本表示该特征图像包含人的头肩部，负样本表示该特征图像不包含人的头肩部信息；

训练过程具体步骤如下：

步骤10、初始化每个样本的权重W_i＝1/n；

步骤20、对每个样本t＝1,...,T；其中，T为弱分类器的数目

即为：步骤20.1、把权重归一化为一个概率分布

步骤20.2、对每个特征f，训练一个弱分类器h_j，并且计算对应所有特征的弱分类器的加权错误率

e_{j} = Σ_{i = 1}^{n} w_{t} (x_{i}) | h_{j} (x_{i}) &NotEqual; y_{i} |

步骤20.3、选择拥有最小错误率e_t的弱分类器h_t，

步骤20.4、按照这个最小错误率e_t的弱分类器，调整权重其中e_i＝0表示被正确分类，e_i＝1表示被错误分类，

β_{t} = \frac{e_{t}}{1 - e_{t}}

步骤30、最后的强分类器为

h (x) = \{\begin{matrix} 1 . . . Σ_{t = 1}^{T} α_{t} h_{t} (x) &GreaterEqual; \frac{1}{2} Σ_{t = 1}^{T} α_{t} \\ 0 . . . Σ_{t = 1}^{T} α_{t} h_{t} (x) < \frac{1}{2} Σ_{t = 1}^{T} α_{t} \end{matrix}, α_{t} = \log \frac{1}{β_{t}}

这里值得一提的是：

本发明还涉及：头肩部图像纹理特征预处理算法

即为提升检测效果并且尽量减少复杂计算，本发明用自定义梯度作为头肩部纹理特征，其中像素临域如图3，自定义梯度表达式如公式1所示。

头肩部图像纹理特征Gradx＝(|B0-B2|+|A0-C2|+|A1-C1|+|A2-C0|)>>2；(公式1)；其中，A0、A1、A2、B0、B2、X、C0、C1、C2为区域的像素。

总之，本发明以人物的头肩部特征作为主要参考依据，细节纹理信息需求度较低，仅提取人物头肩部轮廓信息，从而降低的待搜索图像的分辨率要求(一般情况cif分辨率已经满足要求)，实现快速、高效的特征提取以及识别方法，并且对人物动作无特殊要求，即人物正向镜头、侧向镜头或者背向镜头等场景均可，具有较强的鲁棒性。

以上所述仅为本发明的较佳实施例，凡依本发明申请专利范围所做的均等变化与修饰，皆应属本发明的涵盖范围。

Claims

1.一种基于视频会议系统的聚焦实现方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的一种基于视频会议系统的聚焦实现方法，其特征在于，所述步骤1具体为：对视频会议系统采集的原始图像通过haar-like特征进行人物头肩部特征提取，通过haar-like特征设置三个适用于头肩部特征提取的模板；三个模板用于计算haar-like特征值，每一种特征的计算都是由黑色填充区域的像素值之和与白色填充区域的像素值之和的差值，而计算出来的这个差值就是所谓的haar-like特征的特征值，从而得到特征图像。

3.根据权利要求1所述的一种基于视频会议系统的聚焦实现方法，其特征在于：所述adaboost算法进一步包括：adaboost强分类器训练过程，该训练过程具体为：