CN104166840A - 一种基于视频会议系统的聚焦实现方法 - Google Patents

一种基于视频会议系统的聚焦实现方法 Download PDF

Info

Publication number
CN104166840A
CN104166840A CN201410349789.1A CN201410349789A CN104166840A CN 104166840 A CN104166840 A CN 104166840A CN 201410349789 A CN201410349789 A CN 201410349789A CN 104166840 A CN104166840 A CN 104166840A
Authority
CN
China
Prior art keywords
shoulder
image
feature
video conferencing
focusing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410349789.1A
Other languages
English (en)
Inventor
孔令波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Yealink Network Technology Co Ltd
Original Assignee
Xiamen Yealink Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Yealink Network Technology Co Ltd filed Critical Xiamen Yealink Network Technology Co Ltd
Priority to CN201410349789.1A priority Critical patent/CN104166840A/zh
Publication of CN104166840A publication Critical patent/CN104166840A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提供一种基于视频会议系统的聚焦实现方法,所述方法为:1、对视频会议系统采集的原始图像进行预处理,得到特征图像;2、对特征图像进行区域划分,分成多个的小尺寸图像,且小尺寸图像与特征匹配模板的尺寸一致,通过adaboost算法依次识别各区域是否包含人的头肩部特征;是,则记录区域坐标以及尺寸,否,则不记录坐标信息;以此类推,对整个图像进行遍历搜索,从而确定图像中的头肩部位置以及所占画面的比例信息;3、将头肩部的位置信息以及所占画面比例信息传递给视频会议系统的聚焦模块,进而实现视频会议系统的人物聚焦。本发明利用人物头肩部特征进行人物分类,简单易行、效率高;且提升聚焦算法聚焦到人物的准确度。

Description

一种基于视频会议系统的聚焦实现方法
技术领域
本发明涉及视频处理技术领域,尤其涉及一种基于视频会议系统的聚焦实现方法。 
背景技术
视频会议系统主要关注对象是“人”,但是由于摄像头品质差异以及周围环境影响,可能导致摄像头对焦点不在人物周围,使人物图像模糊不清。现有技术的部分方案采用人脸特征作为参考依据,但是由于检测人脸需要较为清晰的图像,要求待搜索的图像分辨率较高,为实现较好的检测、识别效果,至少需要D1分辨率以上,并且需要人物面部在画面内可见。因此识别要求比较高。 
为解决该类问题,本专利申请提出一种方法,高效、准确地获取人物特征,并且将人物位置以及在画面中的权重比例信息反馈给聚焦算法模块,供其作为调整焦距的判断条件,从而提升聚焦到人物的概率,使人物图像保持清晰。 
发明内容
本发明要解决的技术问题,在于提供一种基于视频会议系统的聚焦实现方法,本发明利用人物头肩部特征进行人物分类,简单易行、效率高;且提升聚焦算法聚焦到人物的准确度。 
本发明是这样实现的:一种基于视频会议系统的聚焦实现方法,包括如下步骤: 
步骤1、对视频会议系统采集的原始图像进行预处理,得到特征图像; 
步骤2、定义一特征匹配模板,且对该特征匹配模板的尺寸进行设定,对特征图像进行区域划分,分成多个的小尺寸图像,且小尺寸图像与特征匹配模板的尺寸一致,通过adaboost算法依次识别各区域 是否包含人的头肩部特征;如果判断为是,则记录区域坐标以及尺寸,如果判断为否,则不记录坐标信息;以此类推,对整个图像进行遍历搜索,从而确定图像中的头肩部位置以及所占画面的比例信息; 
步骤3、将头肩部的位置信息以及所占画面比例信息传递给视频会议系统的聚焦模块,作为聚焦模块的焦距调整算法的参数,进而实现视频会议系统的人物聚焦。 
进一步地,所述步骤1具体为:对视频会议系统采集的原始图像通过haar-like特征进行人物头肩部特征提取,通过haar-like特征设置三个适用于头肩部特征提取的模板;三个模板用于计算haar-like特征值,每一种特征的计算都是由黑色填充区域的像素值之和与白色填充区域的像素值之和的差值,而计算出来的这个差值就是所谓的haar-like特征的特征值,从而得到特征图像。 
本发明具有如下优点:1、高效、快速提取人物特征; 
2、鲁棒性强,受人物动作影响较小,正向、侧向、背向均可; 
3、向聚焦模块提供人物位置信息以及占图像的比例信息,提高聚焦人物的准确度。 
附图说明
图1为本发明haar-like特征进行精简的四个模板。 
图2为本发明三个模板结构示意图。 
图3为本发明像素临域示意图。 
具体实施方式
adaboost是目前应用广泛并且效果很好的分类算法之一,其核心思想是针对同一个训练集训练不同的弱分类器,然后把这些弱分类器集合起来,构成一个强分类器,该强分类器具有良好的分类效果。 
本发明使用adaboost分类算法结合调整后的haar-like特征进行人物头肩部特征提取以及识别。 
请参阅图1至图3所示,本发明为一种基于视频会议系统的聚焦实 现方法,包括如下步骤: 
步骤1、对视频会议系统采集的原始图像进行预处理,得到特征图像; 
步骤2、定义一特征匹配模板,且对该特征匹配模板的尺寸进行设定,对特征图像进行区域划分,分成多个的小尺寸图像,且小尺寸图像与特征匹配模板的尺寸一致,通过adaboost算法依次识别各区域是否包含人的头肩部特征;如果判断为是,则记录区域坐标以及尺寸,如果判断为否,则不记录坐标信息;以此类推,对整个图像进行遍历搜索,从而确定图像中的头肩部位置以及所占画面的比例信息; 
步骤3、将头肩部的位置信息以及所占画面比例信息传递给视频会议系统的聚焦模块,作为聚焦模块的焦距调整算法的参数,进而实现视频会议系统的人物聚焦。 
其中,所述步骤1具体为:对视频会议系统采集的原始图像通过haar-like特征进行人物头肩部特征提取,通过haar-like特征设置三个适用于头肩部特征提取的模板;三个模板用于计算haar-like特征值,每一种特征的计算都是由黑色填充区域的像素值之和与白色填充区域的像素值之和的差值,而计算出来的这个差值就是所谓的haar-like特征的特征值,从而得到特征图像。 
haar-like特征,是计算机视觉领域一种常用的特征描述算子,它最早是用于人脸描述。目前常用的haar-like特征可以分为四类:线性特征、边缘特征、点特征、对角线特征等。本发明根据头肩部特点,对原有haar-like特征进行了精简(如图1所示),并且增加了三个适用于头肩部特征提取的模板(如图2所示)。这些模板用于计算haar-like特征值。 
另外,所述adaboost算法进一步包括:adaboost强分类器训练过程,该训练过程具体为: 
设输入样本为:{(X1,Y1),(X2,Y2),...,(Xn,Yn)},其中Xi为输入的训 练样本,Yi=0或1,其中Yi=0表示正样本,Yi=1表示负样本,其中正样本的数目为p,负样本的数目为q,所以n=p+q;正样本表示该特征图像包含人的头肩部,负样本表示该特征图像不包含人的头肩部信息; 
训练过程具体步骤如下: 
步骤10、初始化每个样本的权重Wi=1/n; 
步骤20、对每个样本t=1,...,T;其中,T为弱分类器的数目 
即为:步骤20.1、把权重归一化为一个概率分布
步骤20.2、对每个特征f,训练一个弱分类器hj,并且计算对应所有特征的弱分类器的加权错误率 
e j = Σ i = 1 n w t ( x i ) | h j ( x i ) ≠ y i |
步骤20.3、选择拥有最小错误率et的弱分类器ht, 
步骤20.4、按照这个最小错误率et的弱分类器,调整权重 其中ei=0表示被正确分类,ei=1表示被错误分类,  β t = e t 1 - e t
步骤30、最后的强分类器为 
h ( x ) = 1 . . . &Sigma; t = 1 T &alpha; t h t ( x ) &GreaterEqual; 1 2 &Sigma; t = 1 T &alpha; t 0 . . . &Sigma; t = 1 T &alpha; t h t ( x ) < 1 2 &Sigma; t = 1 T &alpha; t , &alpha; t = log 1 &beta; t
这里值得一提的是: 
本发明还涉及:头肩部图像纹理特征预处理算法 
即为提升检测效果并且尽量减少复杂计算,本发明用自定义梯度作为头肩部纹理特征,其中像素临域如图3,自定义梯度表达式如公式1所示。 
头肩部图像纹理特征Gradx=(|B0-B2|+|A0-C2|+|A1-C1|+|A2-C0|)>>2;(公式1);其中,A0、A1、A2、B0、B2、X、C0、C1、C2为区域的像素。 
总之,本发明以人物的头肩部特征作为主要参考依据,细节纹理信息需求度较低,仅提取人物头肩部轮廓信息,从而降低的待搜索图像的分辨率要求(一般情况cif分辨率已经满足要求),实现快速、高效的特征提取以及识别方法,并且对人物动作无特殊要求,即人物正向镜头、侧向镜头或者背向镜头等场景均可,具有较强的鲁棒性。 
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。 

Claims (3)

1.一种基于视频会议系统的聚焦实现方法,其特征在于,包括如下步骤: 
步骤1、对视频会议系统采集的原始图像进行预处理,得到特征图像; 
步骤2、定义一特征匹配模板,且对该特征匹配模板的尺寸进行设定,对特征图像进行区域划分,分成多个的小尺寸图像,且小尺寸图像与特征匹配模板的尺寸一致,通过adaboost算法依次识别各区域是否包含人的头肩部特征;如果判断为是,则记录区域坐标以及尺寸,如果判断为否,则不记录坐标信息;以此类推,对整个图像进行遍历搜索,从而确定图像中的头肩部位置以及所占画面的比例信息; 
步骤3、将头肩部的位置信息以及所占画面比例信息传递给视频会议系统的聚焦模块,作为聚焦模块的焦距调整算法的参数,进而实现视频会议系统的人物聚焦。 
2.根据权利要求1所述的一种基于视频会议系统的聚焦实现方法,其特征在于,所述步骤1具体为:对视频会议系统采集的原始图像通过haar-like特征进行人物头肩部特征提取,通过haar-like特征设置三个适用于头肩部特征提取的模板;三个模板用于计算haar-like特征值,每一种特征的计算都是由黑色填充区域的像素值之和与白色填充区域的像素值之和的差值,而计算出来的这个差值就是所谓的haar-like特征的特征值,从而得到特征图像。 
3.根据权利要求1所述的一种基于视频会议系统的聚焦实现方法,其特征在于:所述adaboost算法进一步包括:adaboost强分类器训练过程,该训练过程具体为: 
设输入样本为:{(X1,Y1),(X2,Y2),...,(Xn,Yn)},其中Xi为输入的训练样本,Yi=0或1,其中Yi=0表示正样本,Yi=1表示负样本,其中正样本的数目为p,负样本的数目为q,所以n=p+q;正样本表示 该特征图像包含人的头肩部,负样本表示该特征图像不包含人的头肩部信息; 
训练过程具体步骤如下: 
步骤10、初始化每个样本的权重Wi=1/n; 
步骤20、对每个样本t=1,...,T;其中,T为弱分类器的数目 
即为:步骤20.1、把权重归一化为一个概率分布
步骤20.2、对每个特征f,训练一个弱分类器hj,并且计算对应所有特征的弱分类器的加权错误率 
步骤20.3、选择拥有最小错误率et的弱分类器ht, 
步骤20.4、按照这个最小错误率et的弱分类器,调整权重 其中ei=0表示被正确分类,ei=1表示被错误分类, 
步骤30、最后的强分类器为 
CN201410349789.1A 2014-07-22 2014-07-22 一种基于视频会议系统的聚焦实现方法 Pending CN104166840A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410349789.1A CN104166840A (zh) 2014-07-22 2014-07-22 一种基于视频会议系统的聚焦实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410349789.1A CN104166840A (zh) 2014-07-22 2014-07-22 一种基于视频会议系统的聚焦实现方法

Publications (1)

Publication Number Publication Date
CN104166840A true CN104166840A (zh) 2014-11-26

Family

ID=51910644

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410349789.1A Pending CN104166840A (zh) 2014-07-22 2014-07-22 一种基于视频会议系统的聚焦实现方法

Country Status (1)

Country Link
CN (1) CN104166840A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105450932A (zh) * 2015-12-31 2016-03-30 华为技术有限公司 逆光拍照方法和装置
CN106101857A (zh) * 2016-06-16 2016-11-09 华为技术有限公司 一种视频画面的显示方法及装置
CN106125941A (zh) * 2016-08-12 2016-11-16 东南大学 多设备切换控制装置及多设备控制系统
CN108763242A (zh) * 2018-03-26 2018-11-06 广州视源电子科技股份有限公司 标签生成方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101398893A (zh) * 2008-10-10 2009-04-01 北京科技大学 一种改进AdaBoost算法的鲁棒人耳检测方法
US20090322915A1 (en) * 2008-06-27 2009-12-31 Microsoft Corporation Speaker and Person Backlighting For Improved AEC and AGC
CN101980245A (zh) * 2010-10-11 2011-02-23 北京航空航天大学 一种基于自适应模板匹配的客流统计方法
CN102646279A (zh) * 2012-02-29 2012-08-22 北京航空航天大学 一种基于运动预测与多子块模板匹配相结合的抗遮挡跟踪方法
CN103226711A (zh) * 2013-03-28 2013-07-31 四川长虹电器股份有限公司 一种快速Haar小波特征对象检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090322915A1 (en) * 2008-06-27 2009-12-31 Microsoft Corporation Speaker and Person Backlighting For Improved AEC and AGC
CN101398893A (zh) * 2008-10-10 2009-04-01 北京科技大学 一种改进AdaBoost算法的鲁棒人耳检测方法
CN101980245A (zh) * 2010-10-11 2011-02-23 北京航空航天大学 一种基于自适应模板匹配的客流统计方法
CN102646279A (zh) * 2012-02-29 2012-08-22 北京航空航天大学 一种基于运动预测与多子块模板匹配相结合的抗遮挡跟踪方法
CN103226711A (zh) * 2013-03-28 2013-07-31 四川长虹电器股份有限公司 一种快速Haar小波特征对象检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李庆忠 等: "一种视频运动目标的检测与识别方法", 《模式识别与人工智能》 *
焦智慧: "多核加速的视频人脸及人脸特征获取", 《中国优秀硕士学位论文全文数据库》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105450932A (zh) * 2015-12-31 2016-03-30 华为技术有限公司 逆光拍照方法和装置
WO2017114399A1 (zh) * 2015-12-31 2017-07-06 华为技术有限公司 逆光拍照方法和装置
CN105450932B (zh) * 2015-12-31 2018-11-09 华为技术有限公司 逆光拍照方法和装置
CN106101857A (zh) * 2016-06-16 2016-11-09 华为技术有限公司 一种视频画面的显示方法及装置
CN106101857B (zh) * 2016-06-16 2019-07-19 华为技术有限公司 一种视频画面的显示方法及装置
CN106125941A (zh) * 2016-08-12 2016-11-16 东南大学 多设备切换控制装置及多设备控制系统
CN106125941B (zh) * 2016-08-12 2023-03-10 东南大学 多设备切换控制装置及多设备控制系统
CN108763242A (zh) * 2018-03-26 2018-11-06 广州视源电子科技股份有限公司 标签生成方法及装置
CN108763242B (zh) * 2018-03-26 2022-03-08 广州视源电子科技股份有限公司 标签生成方法及装置

Similar Documents

Publication Publication Date Title
CN109993160B (zh) 一种图像矫正及文本与位置识别方法及系统
CN109344701B (zh) 一种基于Kinect的动态手势识别方法
KR102462818B1 (ko) 모션벡터 및 특징벡터 기반 위조 얼굴 검출 방법 및 장치
JP5517858B2 (ja) 画像処理装置、撮像装置、画像処理方法
CN101339607B (zh) 人脸识别方法及系统、人脸识别模型训练方法及系统
JP4743823B2 (ja) 画像処理装置、撮像装置、画像処理方法
CN110008909B (zh) 一种基于ai的实名制业务实时稽核系统
CN102932605B (zh) 一种视觉感知网络中摄像机的组合选择方法
CN104573617B (zh) 一种摄像控制方法
CN104050448B (zh) 一种人眼定位、人眼区域定位方法及装置
CN111160291B (zh) 基于深度信息与cnn的人眼检测方法
CN102375970A (zh) 一种基于人脸的身份认证方法和认证装置
CN111126240A (zh) 一种三通道特征融合人脸识别方法
CN112101208A (zh) 高龄老人特征串联融合手势识别方法及装置
Redondo-Cabrera et al. All together now: Simultaneous object detection and continuous pose estimation using a hough forest with probabilistic locally enhanced voting
CN107038400A (zh) 人脸识别装置及方法和利用其的目标人跟踪装置及方法
CN111967288A (zh) 智能三维物体识别和定位系统和方法
Vadlapati et al. Facial recognition using the OpenCV Libraries of Python for the pictures of human faces wearing face masks during the COVID-19 pandemic
CN104166840A (zh) 一种基于视频会议系统的聚焦实现方法
Shrivastava et al. Conceptual model for proficient automated attendance system based on face recognition and gender classification using Haar-Cascade, LBPH algorithm along with LDA model
Li et al. Face detection based on depth information using HOG-LBP
JP2013218605A (ja) 画像認識装置、画像認識方法及びプログラム
Shah et al. All smiles: automatic photo enhancement by facial expression analysis
Muthukumar et al. Vision based hand gesture recognition for Indian sign languages using local binary patterns with support vector machine classifier
CN115471901A (zh) 基于生成对抗网络的多姿态人脸正面化方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20141126

WD01 Invention patent application deemed withdrawn after publication