CN109583262B - 对象侦测的适应系统与方法 - Google Patents
对象侦测的适应系统与方法 Download PDFInfo
- Publication number
- CN109583262B CN109583262B CN201710897400.0A CN201710897400A CN109583262B CN 109583262 B CN109583262 B CN 109583262B CN 201710897400 A CN201710897400 A CN 201710897400A CN 109583262 B CN109583262 B CN 109583262B
- Authority
- CN
- China
- Prior art keywords
- object detection
- current
- window
- possible value
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/174—Facial expression recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明是有关于一种对象侦测的适应方法,如果目前可能值小于预设背景临界值,则略过目前窗口影像之后的多数个窗口影像。如果目前窗口影像之前的前一个窗口影像含有所要侦测对象,且目前可能值大于或等于预设前景临界值,则提早结束对象侦测。本发明目的可根据背景或/且前景局部区域而适应地略过窗口影像或提早结束,因而达到快速侦测对象。
Description
技术领域
本发明是有关一种对象侦测,特别是关于一种对象侦测的适应系统与方法。
背景技术
对象侦测(例如脸部侦测)为一种计算机技术,可使用于各种应用,用以从数字影像当中识别对象的位置与大小。保罗·维尔拉(Paul Viola)与迈克尔·琼斯(MichaelJones)于2001年提出一种对象侦测架构,可提供具竞争性的实时(real time)对象侦测率。维尔拉-琼斯方法具高侦测率,且可适用于实时应用(例如每秒处理至少二图框)。维尔拉-琼斯方法采用串接(cascade)训练机制以达成好的侦测率。
低功耗应用(例如智能型手机)为一种趋势,其具有限的电力与处理能力。快速应用为另一种趋势,其要求快速(但通常为粗略)的对象侦测。目前的方法无法(或极为困难)达到准确或实时的对象侦测。因此,亟需提出一种新颖方法,以有效加速对象侦测。
有鉴于上述现有技术存在的缺陷,本发明人基于从事此类产品设计制造多年丰富的实务经验及专业知识,积极加以研究创新,以期创设一种对象侦测的适应系统与方法。
发明内容
本发明的主要目的在于,提出一种对象侦测的适应系统与方法,可根据背景或/且前景局部区域(locality)而适应地(adaptively)略过窗口影像或提早结束,因而达到快速侦测对象。
本发明的目的及解决其技术问题是采用以下的技术方案来实现的。依据本发明提出的一种对象侦测的适应方法,其包含:准备输入影像当中的一列窗口影像;对目前窗口影像执行对象侦测,以产生目前可能值,其代表对象被侦测的可能性;如果目前可能值小于预设背景临界值,则略过目前窗口影像之后的多数个窗口影像;及如果目前可能值不小于预设背景临界值,且如果目前窗口影像之前的前一个窗口影像含有所要侦测对象,且目前可能值大于或等于预设前景临界值,则提早结束对象侦测。
本发明的目的及解决其技术问题还可以可采用以下的技术措施来进一步实现。
前述的对象侦测的适应方法,其更包含:将所略过的多数个窗口影像的可能值设为最小可能值,其表示未出现所要侦测对象。
前述对象侦测的适应方法,其中当前一个窗口影像所对应的前一个可能值等于最大可能值,即表示前一个窗口影像含有所要侦测对象,其中该最大可能值表示出现所要侦测对象。
前述对象侦测的适应方法,其更包含:于提早对象侦测之后,将目前窗口影像的可能值设为最大可能值,其表示出现所要侦测对象。
前述对象侦测的适应方法,其中该对象侦测是由串接分类器来执行的。
本发明的目的及解决其技术问题还采用以下技术方案来实现。依据本发明提出的一种对象侦测的适应系统,其包含:多数个分类器,串接以形成串接分类器;窗口控制器,根据串接分类器对目前扫描窗口的输出,以决定串接分类器的下一个扫描窗口;其中串接分类器对目前窗口影像执行对象侦测,以产生目前可能值,其代表对象被侦测的可能性;如果目前可能值小于预设背景临界值,则窗口控制器略过目前窗口影像之后的多数个窗口影像;及如果目前窗口影像之前的前一个窗口影像含有所要侦测对象,且目前可能值大于或等于预设前景临界值,则提早结束对象侦测。
本发明的目的及解决其技术问题还可以可采用以下的技术措施来进一步实现。
前述的对象侦测的适应系统,其中该窗口控制器更将所略过的多数个窗口影像的可能值设为最小可能值,其表示未出现所要侦测对象。
前述对象侦测的适应系统,其中当前一个窗口影像所对应的前一个可能值等于最大可能值,即表示前一个窗口影像含有所要侦测对象,其中该最大可能值表示出现所要侦测对象。
前述对象侦测的适应系统,其中该窗口控制器更于提早对象侦测之后,将目前窗口影像的可能值设为最大可能值,其表示出现所要侦测对象。
前述对象侦测的适应系统,其中每一个分类器包含多数个次分类器,每一个次分类器包含一个特征。
前述对象侦测的适应系统,其中该分类器更包含:加法器,收集次分类器所产生的结果并予以加总,因而产生总和;及比较器,比较加法器的总和与预设阶层临界值,以产生比较结果,据以决定目前窗口影像是否含有所要侦测对象的至少一部分。
本发明与现有技术相比具有明显的优点和有益效果。经由以上可知,为了达到上述目的,本发明提供了一种对目前窗口影像执行对象侦测,以产生目前可能值,其代表对象被侦测的可能性。如果目前可能值小于预设背景临界值,则略过目前窗口影像之后的多数个窗口影像。
对目前窗口影像执行对象侦测,以产生目前可能值,其代表对象被侦测的可能性。如果目前窗口影像之前的前一个窗口影像含有所要侦测对象,且目前可能值大于或等于预设前景临界值,则提早结束对象侦测。
可根据背景或/且前景局部区域(locality)而适应地(adaptively)略过窗口影像或提早结束,因而达到快速侦测对象。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
图1的方框图显示本发明实施例的对象侦测的适应系统。
图2显示图1的其中一阶层分类器的方框图。
图3的流程图显示本发明实施例的对象侦测的适应方法。
图4例示一列窗口影像的可能值分布曲线。
图中编号:
100:适应系统 11:分类器
110:扫描窗口 111:弱分类器
112:加法器 113:比较器
12:窗口控制器 300:适应方法
31:准备窗口影像 32:侦测窗口影像
33:比较目前可能值与预设背景临界值
34:略过接下来数个窗口影像并设可能值为零
35:比较前一个可能值与最大可能值
36:比较目前可能值与预设前景临界值
37:提早结束并设可能值为最大可能值
38:决定是否还有窗口影像尚未侦测
39:输出每一窗口影像的可能值
具体实施方式
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的对象侦测的适应系统与方法其具体实施方式、结构、特征及其功效,详细说明如后。
图1的方框图显示本发明实施例的对象侦测的适应系统100。本实施例的适应系统100可适用于脸部侦测,但不限定于此。在一实施例中,适应系统100为维尔拉-琼斯脸部侦测器,细节可参阅保罗·维尔拉(Pau l Vio l a)等人提出的“使用增强串接的简易特征的快速对象侦测(Rapid Object Detection Using a Boosted Cascade of SimpleFeatures)”,公开于2001年,刊登于计算机视觉与图型辨识会议(Conference on ComputerVision and Pattern Recognition);及保罗·维尔拉等人提出的“强健实时对象侦测(Robust Real-time Object Detection)”,公开于2001年七月,刊登于视觉统计与计算理论-模型、学习、计算与取样的第二次国际研讨会(Second International Workshop onStatistical and Computational Theories of Vision–Modeling,Learning,Computing,and Sampling),其内容视为本说明书的一部份。
在本实施例中,适应系统100可包含多数个分类器(classifier)11(例如图1例示的第一阶层分类器至第n阶层分类器),其互相串接,因而形成多阶层系统或串接分类器11。本实施例的适应系统100可包含窗口控制器12,其根据串接分类器11对目前扫描窗口的输出,以决定串接分类器11的下一个扫描窗口。当进行输入影像的整个图框(frame)的对象搜寻时,扫描窗口会移动于输入影像当中(例如从左至右水平扫描并往下移动,或称为光栅扫描(raster scan)),且扫描窗口内的影像(简称为窗口影像)受到串接分类器11的侦测。根据本实施例的特征之一,窗口控制器12可快速侦测对象,细节将描述于以下段落。
图2显示图1的其中一阶层分类器11的方框图。在本实施例中,分类器11可包含多数个次分类器(sub-classifier),例如弱分类器(weak classifier)111(例如WCi-2至WCi+2),每一个弱分类器111包含一个特征(feature),例如哈尔(Haar)特征。图2还例示了弱分类器111(例如WCi)的细部方框图。一般来说,特征是为了解答某个应用的计算工作时的相关信息。特征可为影像中的特定结构,例如点、边或对象。每一个对象分类有其各自的特殊特征,用以帮助分类的进行。例如,于进行脸部侦测时,可借以找出眼睛、鼻子与嘴唇,且找出肤色特征及眼睛之间的距离。
如图2所示,使用弱分类器111对(目前)扫描窗口110内的影像进行侦测。所谓“弱”分类器(或学习器)是机器学习或对象侦测领域常用的术语,用以表示该分类器的计算简单,且以简单方式来执行。多个弱分类器可组合起来形成一个“强”分类器。
本实施例的分类器11可包含加法器112,其收集弱分类器111所产生的结果并予以加总,因而产生总和。在本说明书中,弱分类器111的结果可为一个数值,用以表示所属阶层可产生脸部或非脸部的阶层决定的信心(confidence)值(例如某个扫描窗口内出现或不出现脸部的可能值)。接着,比较器113比较加法器112的总和与预设阶层临界值θ。根据比较器113的比较结果,分类器11可决定扫描窗口110内是否含有对象的至少一部分(例如脸部)。如果分类器11的决定是肯定的,则该阶层为通过;否则该阶层为失败。如果一个阶层通过,同一个扫描窗口110的影像继续由下一个阶层,使用更多特征与更多时间来进行侦测。根据串接分类器11的通过/失败状态,适应系统100(第一图)产生可能值,用以表示对象被串接分类器11侦测到的可能性。在本实施例中,如果m个阶层通过,则可能值即为m。
图3的流程图显示本发明实施例的对象(例如脸部)侦测的适应方法300。于步骤31,准备输入影像的一列窗口影像。例如,准备相隔一个像素的一列窗口影像。于步骤32,使用串接分类器11以侦测目前窗口影像。
图4例示一列窗口影像的可能值分布曲线。一般来说,含有所要侦测对象(例如脸部)的窗口影像的可能值是相当大的,例如大于预设前景临界值θfg;不含有所要侦测对象的窗口影像的可能值是相当小的,例如小于预设背景临界值θbg,其中θbg<θfg。如图4所例示,窗口影像Wj含有对象(例如脸部),因此其可能值大于预设前景临界值θfg;窗口影像Wj+2不含有对象,因此其可能值小于预设背景临界值θbg。
于步骤33,比较目前可能值L与预设背景临界值θbg。如果目前可能值L小于预设背景临界值θbg(亦即L<θbg),表示目前窗口影像与相邻窗口影像皆为背景影像,不含有所要侦测对象。换句话说,目前窗口影像位于背景局部区域(locality)。因此,于步骤34,略过目前窗口影像后面的δ个窗口影像,其中δ为默认值,表示区域性的程度。换句话说,所略过窗口影像不进行侦测,因而加速对象的侦测。再者,于本实施例的步骤34,所略过的窗口影像的可能值设为最小可能值Lmin(例如L=0),其表示未出现所要侦测对象。于另一实施例中,所略过的窗口影像的可能值设为小于预设背景临界值θbg的一个默认值。
如果步骤33的结果为否定的(亦即L≧θbg),表示目前窗口影像与相邻窗口影像不属于背景影像,则进入步骤35,比较(前一个窗口影像相应的)前一个可能值L与最大可能值Lmax(例如25),其表示出现所要侦测对象。于另一实施例中,步骤35决定前一个可能值L是否大于一个默认值,其大于默认前景临界值θfg。
如果前一个可能值L等于最大可能值Lmax(步骤35),表示目前窗口影像的前一个窗口影像含有所要侦测对象,则进入步骤36,进一步比较目前可能值L与预设前景临界值θfg。如果目前可能值L大于或等于预设前景临界值θfg(亦即L≧θfg),表示目前窗口影像属于前景影像且含有所要侦测对象。换句话说,目前窗口影像位于前景局部区域(locality)。因此,接下来进入步骤37,略过尚未侦测的剩余窗口影像。换句话说,所略过窗口影像不进行侦测,或者适应方法300的流程提早结束,因而加速对象的侦测。再者,于本实施例的步骤37,所略过窗口影像的可能值设为最大可能值Lmax,其表示出现所要侦测对象。于另一实施例中,所略过的窗口影像的可能值设为大于预设前景临界值θfg的一个默认值。
如果步骤35或步骤36的结果为否定,则适应方法300的流程进入步骤38,决定是否还有窗口影像尚未侦测。如果步骤38的结果为肯定,适应方法300的流程进入步骤32以侦测下一个窗口影像;否则,流程进入步骤39,输出整列窗口影像的可能值L。
根据上述实施例,当窗口影像位于背景局部区域时,可略过多数个窗口影像;或者当窗口影像位于前景局部区域时,可提早结束适应方法300。借此,可节省相当多的处理时间及功耗。因此,本发明实施例可适用于低功耗(或功率限制)的相机以快速侦测对象。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
Claims (9)
1.一种对象侦测的适应方法,其特征在于包含:
准备输入影像当中的一列窗口影像;
对目前窗口影像执行对象侦测,以产生目前可能值,其代表对象被侦测的可能性;
如果目前可能值小于预设背景临界值,则略过目前窗口影像之后的多数个窗口影像;及
如果目前可能值不小于预设背景临界值,且如果目前窗口影像之前的前一个窗口影像所对应的前一个可能值等于最大可能值或大于默认值,且目前可能值大于或等于预设前景临界值,则提早结束对象侦测,其中,所述默认值大于预设前景临界值。
2.根据权利要求1所述对象侦测的适应方法,其特征在于更包含:
将所略过的多数个窗口影像的可能值设为最小可能值,其表示未出现所要侦测对象。
3.根据权利要求1所述对象侦测的适应方法,其特征在于更包含:
于提早对象侦测之后,将目前窗口影像的可能值设为最大可能值,其表示出现所要侦测对象。
4.根据权利要求1所述对象侦测的适应方法,其特征在于该对象侦测是由串接分类器来执行的。
5.一种对象侦测的适应系统,其特征在于包含:
多数个分类器,串接以形成串接分类器;
窗口控制器,根据串接分类器对目前扫描窗口的输出,以决定串接分类器的下一个扫描窗口;
其中串接分类器对目前窗口影像执行对象侦测,以产生目前可能值,其代表对象被侦测的可能性;
如果目前可能值小于预设背景临界值,则窗口控制器略过目前窗口影像之后的多数个窗口影像;及
如果目前窗口影像之前的前一个窗口影像所对应的前一个可能值等于最大可能值或大于默认值,且目前可能值大于或等于预设前景临界值,则提早结束对象侦测,其中,所述默认值大于预设前景临界值。
6.根据权利要求5所述对象侦测的适应系统,其特征在于该窗口控制器更将所略过的多数个窗口影像的可能值设为最小可能值,其表示未出现所要侦测对象。
7.根据权利要求5所述对象侦测的适应系统,其特征在于该窗口控制器更于提早对象侦测之后,将目前窗口影像的可能值设为最大可能值,其表示出现所要侦测对象。
8.根据权利要求5所述对象侦测的适应系统,其特征在于每一个分类器包含多数个次分类器,每一个次分类器包含一个特征。
9.根据权利要求8所述对象侦测的适应系统,其特征在于该分类器更包含:
加法器,收集次分类器所产生的结果并予以加总,因而产生总和;及
比较器,比较加法器的总和与预设阶层临界值,以产生比较结果,据以决定目前窗口影像是否含有所要侦测对象的至少一部分。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710897400.0A CN109583262B (zh) | 2017-09-28 | 2017-09-28 | 对象侦测的适应系统与方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710897400.0A CN109583262B (zh) | 2017-09-28 | 2017-09-28 | 对象侦测的适应系统与方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109583262A CN109583262A (zh) | 2019-04-05 |
CN109583262B true CN109583262B (zh) | 2021-04-20 |
Family
ID=65912866
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710897400.0A Active CN109583262B (zh) | 2017-09-28 | 2017-09-28 | 对象侦测的适应系统与方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109583262B (zh) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8649604B2 (en) * | 2007-03-05 | 2014-02-11 | DigitalOptics Corporation Europe Limited | Face searching and detection in a digital image acquisition device |
CN101615291B (zh) * | 2008-06-27 | 2012-10-10 | 睿致科技股份有限公司 | 一种反馈式对象侦测方法 |
US9165190B2 (en) * | 2012-09-12 | 2015-10-20 | Avigilon Fortress Corporation | 3D human pose and shape modeling |
CN103605953B (zh) * | 2013-10-31 | 2018-06-19 | 电子科技大学 | 基于滑窗搜索的车辆兴趣目标检测方法 |
CN104077786A (zh) * | 2014-06-27 | 2014-10-01 | 深圳市赛为智能股份有限公司 | 一种基于自适应核密度估计模型的运动目标检测方法 |
CN106846362B (zh) * | 2016-12-26 | 2020-07-24 | 歌尔科技有限公司 | 一种目标检测跟踪方法和装置 |
-
2017
- 2017-09-28 CN CN201710897400.0A patent/CN109583262B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109583262A (zh) | 2019-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8265392B2 (en) | Inter-mode region-of-interest video object segmentation | |
EP1984896B1 (en) | Multi-mode region-of-interest video object segmentation | |
US8265349B2 (en) | Intra-mode region-of-interest video object segmentation | |
CN105184763B (zh) | 图像处理方法和装置 | |
Butler et al. | Real-time adaptive foreground/background segmentation | |
US8155396B2 (en) | Method, apparatus, and program for detecting faces | |
US20100067863A1 (en) | Video editing methods and systems | |
CN107066963B (zh) | 一种自适应人群计数方法 | |
JP5578816B2 (ja) | 画像処理装置 | |
JP2009140369A (ja) | 集団学習装置及び集団学習方法、対象物検出装置及び対象物検出方法、並びにコンピュータ・プログラム | |
CN111931572B (zh) | 一种遥感影像的目标检测方法 | |
Bae et al. | Dual-dissimilarity measure-based statistical video cut detection | |
US9646386B2 (en) | Method and apparatus for generating temporally consistent superpixels | |
CN109583262B (zh) | 对象侦测的适应系统与方法 | |
Gupta et al. | A learning-based approach for automatic image and video colorization | |
Mahmoodi et al. | Boosting performance of face detection by using an efficient skin segmentation algorithm | |
Ishida et al. | Shadow detection by three shadow models with features robust to illumination changes | |
US20190087644A1 (en) | Adaptive system and method for object detection | |
TWI624793B (zh) | 物件偵測的適應系統與方法 | |
Chihaoui et al. | Implementation of skin color selection prior to Gabor filter and neural network to reduce execution time of face detection | |
Ciaramello et al. | Real-time face and hand detection for videoconferencing on a mobile device | |
JP2010186343A (ja) | コンテンツ識別方法及び装置 | |
Lestari et al. | Boundary Matched Human Area Segmentation for Chroma Keying Using Hybrid Depth-Color Analysis | |
Tsai | Multilevel image thresholding based on an extended within-class variance criterion | |
Weibel et al. | An integrated approach to visual attention modelling using spatial-temporal saliency and objectness |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |