CN103514453A - 对象识别设备和方法 - Google Patents
对象识别设备和方法 Download PDFInfo
- Publication number
- CN103514453A CN103514453A CN201210203740.6A CN201210203740A CN103514453A CN 103514453 A CN103514453 A CN 103514453A CN 201210203740 A CN201210203740 A CN 201210203740A CN 103514453 A CN103514453 A CN 103514453A
- Authority
- CN
- China
- Prior art keywords
- edge
- edge direction
- local
- probability
- distribution pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000004364 calculation method Methods 0.000 claims description 29
- 239000013598 vector Substances 0.000 claims description 18
- 238000000605 extraction Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 238000003066 decision tree Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种对象识别设备和方法,所述对象识别设备包括:边缘方向分布模式计算装置,被配置为计算候选对象的多个局部区域中每个局部区域的边缘方向分布模式,作为候选对象的多个局部边缘方向分布模式特征;以及分类器,被配置为基于多个局部边缘方向分布模式特征对候选对象进行分类。
Description
技术领域
本发明总体上涉及图像处理领域,具体涉及模式识别和人机交互领域,更具体地,本发明涉及一种用于对象识别的设备和方法。
背景技术
在计算机视觉应用中,基于数字图像或视频输入的自动对象识别是一项重要技术。作为对象识别系统的前端,快速有效的对象识别方法是非常重要的,尤其对于低计算能力的装置比如移动电话、平板电脑等而言更是如此。对象识别中的难点在于如何提取描述对象的稳定特征。
传统的方法通常设计一些简单的规则来定义海量的基本特征,然后使用机器学习方法比如boosting通过大量训练样本来选择出一些最有效的特征构成分类器,将目标对象与背景区分开。现有的特征包括例如类Haar矩形特征、局部二值模式(LBP)、梯度方向直方图(HOG)等。
但是,这些方法都存在一些缺陷。例如,类Haar特征太简单,为获得满意的性能,学习得到的分类器通常要包括上千个矩形特征。大量的特征提取使得训练过程和测试过程都十分耗时。另外,采用LBP特征的优点在于不受图像灰度的整体变换的影响,但是,如果灰度反转,该特征会改变较大。如图1所示,当对象(例如,杯子)处于不同亮度的背景,例如如图1a所示处于暗背景和如图1b所示处于亮背景中时,同样位置的LBP特征完全不一样。相比而言,HOG特征对背景灰度反转较为鲁棒,但是该特征向量是由4个局部直方图级联得到的高维向量(例如,36维)。在这种高维的特征空间中训练弱分类器十分耗时,因此只能承受较简单的弱分类器,例如线性支持向量机(SVM)。
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
鉴于背景技术部分所述的需求,本发明关注于采用局部边缘方向分布模式特征进行分类以识别对象。由于所采用的特征的候选集小、表示简单且不受背景灰度反转的影响,因此本发明可以在降低计算量的同时提供更好的识别性能。
因此,根据本发明的一个方面,提供了一种对象识别设备,包括:边缘方向分布模式计算装置,被配置为计算候选对象的多个局部区域中每个局部区域的边缘方向分布模式,作为所述候选对象的多个局部边缘方向分布模式特征;以及分类器,被配置为基于所述多个局部边缘方向分布模式特征对所述候选对象进行分类。
根据本发明的另一个方面,提供了一种对象识别方法,包括:计算候选对象的多个局部区域中每个局部区域的边缘方向分布模式,作为所述候选对象的多个局部边缘方向分布模式特征;以及使用分类器基于所述多个局部边缘方向分布模式特征对所述候选对象进行分类。
依据本发明的其它方面,还提供了相应的计算机程序代码、计算机可读存储介质和计算机程序产品。
通过以下结合附图对本发明的优选实施例的详细说明,本发明的这些以及其他优点将更加明显。
附图说明
为了进一步阐述本发明的以上和其它优点和特征,下面结合附图对本发明的具体实施方式作进一步详细的说明。所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分。具有相同的功能和结构的元件用相同的参考标号表示。应当理解,这些附图仅描述本发明的典型示例,而不应看作是对本发明的范围的限定。在附图中:
图1a是示出了对象处于暗背景中的图;
图1b是示出了对象处于亮背景中的图;
图2示出了根据本发明的一个实施例的对象识别设备的结构;
图3示出了根据本发明的一个实施例的对象识别设备中的边缘方向分布模式计算装置的结构;
图4示出了根据本发明的一个实施例的边缘方向的概率分布计算的实例的图;
图5示出了根据本发明的一个实施例对图4中的直方图进行二值化的图;
图6示出了根据本发明的一个实施例的对象识别方法的流程图;
图7示出了根据本发明的一个实施例的对象识别方法中计算每个局部区域的边缘方向分布模式的步骤的流程图;以及
图8是其中可以实现根据本发明的实施例的方法和/或设备的通用个人计算机的示例性结构的框图。
具体实施方式
在下文中将结合附图对本发明的示范性实施例进行描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。
在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的设备结构和/或处理步骤,而省略了与本发明关系不大的其他细节。
下文中的描述按如下顺序进行:
1.对象识别设备
1-1.边缘方向分布模式计算装置
i)边缘提取模块
ii)概率分布计算模块
iii)二值化模块
1-2.分类器
2.对象识别方法
3.用以实施本申请的设备和方法的计算设备
[1.对象识别设备]
首先参照图2描述根据本发明的实施例的对象识别设备的结构。如图2所示,对象识别设备100包括边缘方向分布模式计算装置101和分类器102。其中,边缘方向分布模式计算装置101被配置为计算候选对象的多个局部区域中每个局部区域的边缘方向分布模式,作为所述候选对象的多个局部边缘方向分布模式特征。分类器102被配置为基于所述多个局部边缘方向分布模式特征对所述候选对象进行分类。
具体地,当向对象识别设备100中输入一幅图像时,对象识别设备100可以用不同尺寸的滑动窗口扫描图像,以检测不同位置、不同大小的对象。相应地,每一个滑动窗口中的图像为候选对象。对于候选对象,边缘方向分布模式计算装置101采用具有某一尺寸的特征窗口对候选对象进行扫描。对于特征窗口所限定的每个局部区域计算其边缘方向分布模式。其中,特征窗口的尺寸、位置和长宽比可以任意指定或改变,只要该特征窗口在候选对象的范围内即可。
当对候选对象的扫描完成之后,边缘方向分布模式计算装置101获得了一组边缘方向分布模式作为该候选对象的多个局部边缘方向分布模式特征,并将这些特征传递给分类器102。
分类器102例如是采用大量的正样本(表示是对象)和负样本(表示不是对象)预先训练得到的。因此,该训练好的分类器102基于从边缘方向分布模式计算装置101传递来的多个局部边缘方向分布模式特征,对候选对象进行分类,例如,可以判断候选对象是否是要检测的对象。
下面将参照图3更进一步地详细描述边缘方向分布模式计算装置101的结构。
<1-1.边缘方向分布模式计算装置>
如图3所示,边缘方向分布模式计算装置101包括边缘提取模块1001、概率分布计算模块1002和二值化模块1003。
i)边缘提取模块
边缘提取模块1001用于提取每个局部区域内的边缘。作为一个示例,边缘提取模块1001可以通过计算局部区域内的梯度向量的分布来提取该局部区域内的边缘。
具体地,例如可以通过使用索贝尔(Sobel)算子来实现边缘的提取,如以下公式(1)所示。
Gx(x,y)=Sobelx*I(x,y)
Gy(x,y)=Sobely*I(x,y)
其中,I(x,y)表示横坐标为x、纵坐标为y处的像素的灰度值,G(x,y)为对应像素的梯度向量的模,θ(x,y)为对应像素的梯度向量的方向。另外,T是表示背景噪声上限的阈值,在公式(1)中,将每个像素的梯度向量的模与该阈值进行比较,去除梯度向量的模在该阈值以下的像素,即对背景进行屏蔽。T的取值大小根据应用进行设置。
应该理解,虽然以上示出了边缘提取的一种方式,但是边缘提取模块1001的实现并不限于此,而是可以采用各种其他边缘检测的算法,例如还可以使用Roberts算子、prewitt算子、log算子、canny算子等。
经过公式(1)的处理之后,边缘提取模块1001获得了每个局部区域内的梯度向量的分布,从而提取出各个区域内的边缘,并将其传递给概率分布计算模块1002。
ii)概率分布计算模块
概率分布计算模块1002被配置为计算所提取的边缘的方向的概率分布。在一个实施例中,概率分布计算模块1002将边缘像素中方向相同的梯度向量的模累加作为该方向的概率,以获得边缘的方向的概率分布。
优选地,概率分布计算模块1002被配置为将边缘的方向的取值范围划分为多个区间,并将每个区间内的所有方向的概率累加作为边缘方向位于该区间的概率,以得到边缘方向在所述多个区间之间的概率分布作为边缘的方向的概率分布。
具体地,例如可以将边缘的方向的取值范围划分为K个区间,并采用直方图作为概率的表示形式。对应于一个局部区域的梯度直方图的第k个值由公式(2)计算。
其中,bink表示第k个区间的值域。另外,区间数目K可以取任意正整数值。在一个示例中,考虑到与1个字节包括8位相配合,K可以取值为8。梯度方向的范围可以为0°-180°或0°-360°,K个区间均匀地分布在该范围内,为了便于整除,首先将K设置为9,然后,用h0+h8来代替h0。
如图4所示,示出了在以上K为8的情况下计算边缘方向的概率分布的实例的图,其中,F是覆盖候选对象中的一个局部区域的特征窗口,H1和H2分别表示所得到的该特征窗口对应的9柱直方图和8柱直方图,梯度方向的范围采用0°-180°,因此直方图H1中每个柱的范围为20°,直方图H2是将直方图H1的第一个柱和第9个柱合并之后的直方图。直方图中间的柱表示垂直方向,直方图的柱所代表的值从左到右依次对应于h0、……、h7。
虽然以上采用了直方图来表示概率,但是本领域的技术人员应该理解,概率的表示形式并不限于此。
在另一个实施例中,概率分布计算模块1002被配置为将边缘像素中方向相同的像素的个数累加作为该方向的概率,以获得所述边缘的方向的概率分布。类似地,该概率分布也可以优选地用上述直方图的形式表示,在此不再赘述。
概率分布计算模块1002将计算得到的边缘方向的概率分布传递给二值化模块1003。
iii)二值化模块
二值化模块1003将所述概率分布二值化,以得到该局部区域的边缘方向分布模式。优选地,二值化模块1003用数字1和0进行二值化,并将得到的数字序列作为所述边缘方向分布模式特征。在一个实施例中,二值化模块1003被配置为利用概率的均值或中值作为阈值实施二值化。具体地,二值化模块1003将各个边缘方向的概率与作为概率的均值或中值的阈值相减,并根据所得到的值的正负来确定该边缘方向的二进制位为1还是0,最终得到一个数字序列作为该局部区域的边缘方向分布模式特征。另外,还可以进一步将该数字序列转换为其他进制的数值。
作为示例,在采用直方图表示概率的情况下,二值化模块1003可以通过如下公式(3)来实现其功能。
其中,表示给定阈值,且通过公式(3)可以将K维直方图量化为K个二进制数字。在图5位于中间的图中,示意了8个二进制数字的空间分布,这种空间分布就是边缘方向的分布模式。其中,h0、……、h7分别代表各个方向区间对应的二进制数字,这些二进制数字可以表示在该方向区间上的梯度是否占主导。例如,1表示该方向区间上的梯度占主导,0则反之。作为举例而非限制,作为该空间分布模式的表达,可以将该K个二进制数字串联为一个K位的二进制码,作为局部区域的边缘方向分布模式特征。当考虑图4所示的直方图H2时,二值化模块1003例如可以得到8位二进制码00001100,如图5所示。另外,还可以将二进制码转换为十进制数值或者其他进制的数值,例如,在图5中,二进制码00001100可以转换为十进制的12。在K=8的情况下,其取值范围为[0,255]。
虽然上述示例中进行二值化时采用概率的均值作为阈值,但是阈值的选择不限于此。在另一个实施例中,二值化模块1003被配置为利用概率的中值作为阈值实施二值化。具体地,概率的中值为将概率升序排列时位于序列中间的值。在采用直方图表示概率的情况下,当得到图5所示的直方图时,将直方图各个柱所代表的概率值进行升序排列,例如得到序列{h1,h7,h2,h0,h6,h3,h4,h5},由于序列包括偶数项,因此中值为中间两项的均值,即采用中值作为阈值。
可以看出,本发明的局部边缘方向分布模式特征为二进制序列或数值,可以基于其训练高效的非线性分类器。另外,该特征的候选集合小,且由于其基于边缘方向分布,因此不会受到背景灰度反转的影响,从而使得本发明的实施例可以实现更好的识别性能。根据本发明的实施例的对象识别设备100尤其适用于描述具有一定稳定形状的物体。
然后,边缘方向分布模式计算装置101将得到的多个局部边缘方向分布模式特征传递给分类器102。
<1-2.分类器>
分类器102基于所述多个局部边缘方向分布模式特征对候选对象进行分类。在一个实施例中,分类器102被配置为基于从所述多个局部边缘方向分布模式中在线选取的子集中的局部边缘方向分布模式特征对所述候选对象进行分类。
由于根据本发明的实施例的局部边缘方向分布模式特征是一种无顺序的描述或类别性特征,即特征值的绝对大小没有意义,因此普通的基于阈值比较的分类器不适合该特征。可以采用如下基于特征子集划分的分类器:
其中,Ω是局部边缘方向分布模式特征的值域,在K=8的情况下,Ω={0,1,..,255}。
如前所述,分类器102需要预先进行训练。在训练的过程中,确定公式(4)中的S1和S2,例如可以通过分类回归树(CART)算法中采用的基尼纯度准则(Gini“purity”criteria)来进行该确定。
虽然这里示出了基于特征子集划分的分类器作为示例,但是可以采用的分类器不限于此。在另一个实施例中,还可以采用决策树分类器。
[2.对象识别方法]
以上结合附图描述了根据本发明的对象识别设备的实施方式,在此过程中事实上也描述了一种对象识别方法。下面对所述方法结合附图予以简要描述,其中的细节可参见前文对对象识别设备的描述。
图6示出了根据本发明的一个实施例的对象识别方法的流程图。该方法包括:计算候选对象的多个局部区域中每个局部区域的边缘方向分布模式,作为所述候选对象的多个局部边缘方向分布模式特征(S11);以及使用分类器基于所述多个局部边缘方向分布模式特征对所述候选对象进行分类(S12)。
其中,可以采用基于滑动窗口的对象识别方法的实施步骤。当输入一幅图像时,将每个滑动窗口所覆盖的图像区域作为候选对象,并对其进行图6的流程图所示的处理,以判断该候选对象是否是要检测的对象。通过改变滑动窗口的大小和位置,可以实现不同大小的对象识别。
图7示出了根据本发明的一个实施例的对象识别方法中的计算每个局部区域的边缘方向分布模式的步骤的流程图。该步骤包括:提取所述局部区域内的边缘(S21);计算所述边缘的方向的概率分布(S22);以及将所述概率分布二值化,以得到所述局部区域的边缘方向分布模式(S23)。
在一个优选实施例中,通过计算所述局部区域内的梯度向量的分布来提取所述局部区域内的边缘。梯度向量可以通过对各个像素的灰度应用例如Sobel算子来计算得到。
在一个优选实施例中,将边缘像素中方向相同的梯度向量的模累加作为该方向的概率,以获得所述边缘的方向的概率分布。
在另一个优选实施例中,还可以将边缘像素中方向相同的像素的个数累加作为该方向的概率,以获得所述边缘的方向的概率分布。
在实施中,优选地,将边缘方向的取值范围划分为多个区间,并将每个区间内的所有方向的概率累加作为边缘方向位于所述区间的概率,以得到边缘方向在所述多个区间之间的概率分布作为所述边缘的方向的概率分布。区间的数目可以为任意正整数,考虑到与1个字节包括8位相配合,区间数目优选地为8。
在一个优选实施例中,将所述概率分布二值化包括用数字1和0进行二值化,并将得到的数字序列作为所述边缘方向分布模式特征。其中,将所述概率分布二值化包括利用概率的均值或中值作为阈值实施所述二值化。
在进行上述二值化之后,可以得到一个二进制码。在一个优选实施例中,可以进一步将所述数字序列转换为其他进制(例如,十进制)的数值,作为所述边缘方向分布模式特征的表征。
在一个优选实施例中,使用分类器基于所述多个局部边缘方向分布模式特征对所述候选对象进行分类还包括:在所述多个局部边缘方向分布模式特征中在线选取一个子集,使用所述分类器基于该子集中的局部边缘方向分布模式特征对所述候选对象进行分类。
由于本发明所采用的局部边缘方向分布模式特征是一种无顺序的描述或类别性特征,即特征值的绝对大小没有意义,因此普通的基于阈值比较的分类器不适合该特征。在一个优选实施例中,所述分类器为基于特征子集分割的分类器或决策树分类器。
其中,基于特征子集分割的分类器优选地基于基尼纯度规则训练得到。
[3.用以实施本申请的设备和方法的计算设备]
上述设备中各个组成模块、单元可通过软件、固件、硬件或其组合的方式进行配置。配置可使用的具体手段或方式为本领域技术人员所熟知,在此不再赘述。在通过软件或固件实现的情况下,从存储介质或网络向具有专用硬件结构的计算机(例如图8所示的通用计算机1100)安装构成该软件的程序,该计算机在安装有各种程序时,能够执行各种功能等。
在图8中,中央处理单元(CPU)1101根据只读存储器(ROM)1102中存储的程序或从存储部分1108加载到随机存取存储器(RAM)1103的程序执行各种处理。在RAM 1103中,也根据需要存储当CPU 1101执行各种处理等等时所需的数据。CPU 1101、ROM 1102和RAM 1103经由总线1104彼此连接。输入/输出接口1105也连接到总线1104。
下述部件连接到输入/输出接口1105:输入部分1106(包括键盘、鼠标等等)、输出部分1107(包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD)等,和扬声器等)、存储部分1108(包括硬盘等)、通信部分1109(包括网络接口卡比如LAN卡、调制解调器等)。通信部分1109经由网络比如因特网执行通信处理。根据需要,驱动器1110也可连接到输入/输出接口1105。可拆卸介质1111比如磁盘、光盘、磁光盘、半导体存储器等等根据需要被安装在驱动器1110上,使得从中读出的计算机程序根据需要被安装到存储部分1108中。
在通过软件实现上述系列处理的情况下,从网络比如因特网或存储介质比如可拆卸介质1111安装构成软件的程序。
本领域的技术人员应当理解,这种存储介质不局限于图8所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质1111。可拆卸介质1111的例子包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者,存储介质可以是ROM 1102、存储部分1108中包含的硬盘等等,其中存有程序,并且与包含它们的设备一起被分发给用户。
本发明还提出一种存储有机器可读取的指令代码的程序产品。所述指令代码由机器读取并执行时,可执行上述根据本发明实施例的方法。
相应地,用于承载上述存储有机器可读取的指令代码的程序产品的存储介质也包括在本发明的公开中。所述存储介质包括但不限于软盘、光盘、磁光盘、存储卡、存储棒等等。
最后,还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。此外,在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上虽然结合附图详细描述了本发明的实施例,但是应当明白,上面所描述的实施方式只是用于说明本发明,而并不构成对本发明的限制。对于本领域的技术人员来说,可以对上述实施方式作出各种修改和变更而没有背离本发明的实质和范围。因此,本发明的范围仅由所附的权利要求及其等效含义来限定。
通过上述的描述,本发明的实施例提供了以下的技术方案。
附记1.一种对象识别设备,包括:
边缘方向分布模式计算装置,被配置为计算候选对象的多个局部区域中每个局部区域的边缘方向分布模式,作为所述候选对象的多个局部边缘方向分布模式特征;以及
分类器,被配置为基于所述多个局部边缘方向分布模式特征对所述候选对象进行分类。
附记2.根据附记1所述的对象识别设备,其中,所述边缘方向分布模式计算装置包括:
边缘提取模块,被配置为提取所述局部区域内的边缘;
概率分布计算模块,被配置为计算所述边缘的方向的概率分布;以及
二值化模块,被配置为将所述概率分布二值化,以得到所述局部区域的边缘方向分布模式。
附记3.根据附记2所述的对象识别设备,其中,所述边缘提取模块被配置为通过计算所述局部区域内的梯度向量的分布来提取所述局部区域内的边缘。
附记4.根据附记3所述的对象识别设备,其中,所述概率分布计算模块被配置为将边缘像素中方向相同的梯度向量的模累加作为该方向的概率,以获得所述边缘的方向的概率分布。
附记5.根据附记3所述的对象识别设备,其中,所述概率分布计算模块被配置为将边缘像素中方向相同的像素的个数累加作为该方向的概率,以获得所述边缘的方向的概率分布。
附记6.根据附记4或5所述的对象识别设备,其中,所述概率分布计算模块被配置为将边缘方向的取值范围划分为多个区间,并将每个区间内的所有方向的概率累加作为边缘方向位于所述区间的概率,以得到边缘方向在所述多个区间之间的概率分布作为所述边缘的方向的概率分布。
附记7.根据附记2至5中的任意一项所述的对象识别设备,其中,所述二值化模块被配置为用数字1和0进行二值化,并将得到的数字序列作为所述边缘方向分布模式特征。
附记8.根据附记2所述的对象识别设备,其中,所述二值化模块被配置为利用概率的均值或中值作为阈值实施所述二值化。
附记9.根据附记1至4中的任意一项所述的对象识别设备,其中,所述分类器被配置为基于从所述多个局部边缘方向分布模式中在线选取的子集中的局部边缘方向分布模式特征对所述候选对象进行分类。
附记10.根据附记1至4中的任意一项所述的对象识别设备,其中,所述分类器为基于特征子集分割的分类器或决策树分类器。
附记11.一种对象识别方法,包括:
计算候选对象的多个局部区域中每个局部区域的边缘方向分布模式,作为所述候选对象的多个局部边缘方向分布模式特征;以及
使用分类器基于所述多个局部边缘方向分布模式特征对所述候选对象进行分类。
附记12.根据附记11所述的对象识别方法,其中,计算每个局部区域的边缘方向分布模式的步骤包括:
提取所述局部区域内的边缘;
计算所述边缘的方向的概率分布;以及
将所述概率分布二值化,以得到所述局部区域的边缘方向分布模式。
附记13.根据附记12所述的对象识别方法,其中,通过计算所述局部区域内的梯度向量的分布来提取所述局部区域内的边缘。
附记14.根据附记13所述的对象识别方法,其中,计算所述边缘的方向的概率分布包括:
将边缘像素中方向相同的梯度向量的模累加作为该方向的概率,以获得所述边缘的方向的概率分布。
附记15.根据附记13所述的对象识别方法,其中,计算所述边缘的方向的概率分布包括:
将边缘像素中方向相同的像素的个数累加作为该方向的概率,以获得所述边缘的方向的概率分布。
附记16.根据附记14或15所述的对象识别方法,计算所述边缘的方向的概率分布还包括:
将边缘方向的取值范围划分为多个区间,并将每个区间内的所有方向的概率累加作为边缘方向位于所述区间的概率,以得到边缘方向在所述多个区间之间的概率分布作为所述边缘的方向的概率分布。
附记17.根据附记12至15中的任意一项所述的对象识别方法,其中,将所述概率分布二值化包括用数字1和0进行二值化,并将得到的数字序列作为所述边缘方向分布模式特征。
附记18.根据附记12所述的对象识别方法,其中,将所述概率分布二值化包括利用概率的均值或中值作为阈值实施所述二值化。
附记19.根据附记11至14中的任意一项所述的对象识别方法,使用分类器基于所述多个局部边缘方向分布模式特征对所述候选对象进行分类还包括:
在所述多个局部边缘方向分布模式特征中在线选取一个子集,使用所述分类器基于该子集中的局部边缘方向分布模式特征对所述候选对象进行分类。
附记20.根据附记11至14中的任意一项所述的对象识别方法,其中,所述分类器为基于特征子集分割的分类器或决策树分类器。
Claims (10)
1.一种对象识别设备,包括:
边缘方向分布模式计算装置,被配置为计算候选对象的多个局部区域中每个局部区域的边缘方向分布模式,作为所述候选对象的多个局部边缘方向分布模式特征;以及
分类器,被配置为基于所述多个局部边缘方向分布模式特征对所述候选对象进行分类。
2.根据权利要求1所述的对象识别设备,其中,所述边缘方向分布模式计算装置包括:
边缘提取模块,被配置为提取所述局部区域内的边缘;
概率分布计算模块,被配置为计算所述边缘的方向的概率分布;以及
二值化模块,被配置为将所述概率分布二值化,以得到所述局部区域的边缘方向分布模式。
3.根据权利要求2所述的对象识别设备,其中,所述边缘提取模块被配置为通过计算所述局部区域内的梯度向量的分布来提取所述局部区域内的边缘。
4.根据权利要求3所述的对象识别设备,其中,所述概率分布计算模块被配置为将边缘像素中方向相同的梯度向量的模累加作为该方向的概率,以获得所述边缘的方向的概率分布。
5.根据权利要求3所述的对象识别设备,其中,所述概率分布计算模块被配置为将边缘像素中方向相同的像素的个数累加作为该方向的概率,以获得所述边缘的方向的概率分布。
6.根据权利要求4或5所述的对象识别设备,其中,所述概率分布计算模块被配置为将边缘方向的取值范围划分为多个区间,并将每个区间内的所有方向的概率累加作为边缘方向位于所述区间的概率,以得到边缘方向在所述多个区间之间的概率分布作为所述边缘的方向的概率分布。
7.根据权利要求2至5中的任意一项所述的对象识别设备,其中,所述二值化模块被配置为用数字1和0进行二值化,并将得到的数字序列作为所述边缘方向分布模式特征。
8.根据权利要求2所述的对象识别设备,其中,所述二值化模块被配置为利用概率的均值或中值作为阈值实施所述二值化。
9.根据权利要求1至4中的任意一项所述的对象识别设备,其中,所述分类器被配置为基于从所述多个局部边缘方向分布模式中在线选取的子集中的局部边缘方向分布模式特征对所述候选对象进行分类。
10.一种对象识别方法,包括:
计算候选对象的多个局部区域中每个局部区域的边缘方向分布模式,作为所述候选对象的多个局部边缘方向分布模式特征;以及
使用分类器基于所述多个局部边缘方向分布模式特征对所述候选对象进行分类。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210203740.6A CN103514453B (zh) | 2012-06-15 | 2012-06-15 | 对象识别设备和方法 |
JP2013124489A JP2014002734A (ja) | 2012-06-15 | 2013-06-13 | オブジェクト認識設備及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210203740.6A CN103514453B (zh) | 2012-06-15 | 2012-06-15 | 对象识别设备和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103514453A true CN103514453A (zh) | 2014-01-15 |
CN103514453B CN103514453B (zh) | 2017-07-11 |
Family
ID=49897146
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210203740.6A Expired - Fee Related CN103514453B (zh) | 2012-06-15 | 2012-06-15 | 对象识别设备和方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2014002734A (zh) |
CN (1) | CN103514453B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101982258B1 (ko) | 2014-09-19 | 2019-05-24 | 삼성전자주식회사 | 오브젝트 검출 방법 및 오브젝트 검출 장치 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101059836A (zh) * | 2007-06-01 | 2007-10-24 | 华南理工大学 | 一种人眼定位及人眼状态识别方法 |
CN101609509A (zh) * | 2008-06-20 | 2009-12-23 | 中国科学院计算技术研究所 | 一种基于预分类器的图像物体检测方法及系统 |
CN102024141A (zh) * | 2010-06-29 | 2011-04-20 | 上海大学 | 基于Gabor小波变换和局部二值模式优化的人脸识别方法 |
CN102243706A (zh) * | 2011-08-18 | 2011-11-16 | 杭州海康威视软件有限公司 | 基于目标边缘方向的目标分类方法和系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011203853A (ja) * | 2010-03-24 | 2011-10-13 | Toyota Central R&D Labs Inc | 画像処理装置及びプログラム |
JP2012088787A (ja) * | 2010-10-15 | 2012-05-10 | Canon Inc | 画像処理装置、画像処理方法 |
-
2012
- 2012-06-15 CN CN201210203740.6A patent/CN103514453B/zh not_active Expired - Fee Related
-
2013
- 2013-06-13 JP JP2013124489A patent/JP2014002734A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101059836A (zh) * | 2007-06-01 | 2007-10-24 | 华南理工大学 | 一种人眼定位及人眼状态识别方法 |
CN101609509A (zh) * | 2008-06-20 | 2009-12-23 | 中国科学院计算技术研究所 | 一种基于预分类器的图像物体检测方法及系统 |
CN102024141A (zh) * | 2010-06-29 | 2011-04-20 | 上海大学 | 基于Gabor小波变换和局部二值模式优化的人脸识别方法 |
CN102243706A (zh) * | 2011-08-18 | 2011-11-16 | 杭州海康威视软件有限公司 | 基于目标边缘方向的目标分类方法和系统 |
Non-Patent Citations (2)
Title |
---|
孙瑾,顾宏斌,侯建波: "基于梯度方向二值模式特征的飞机翼尖跟踪技术", 《航空学报》 * |
孙瑾,顾宏斌,郑吉平: "一种基于梯度方向信息的运动目标检测算法", 《中国图象图形学报》 * |
Also Published As
Publication number | Publication date |
---|---|
CN103514453B (zh) | 2017-07-11 |
JP2014002734A (ja) | 2014-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10430663B2 (en) | Method, electronic device and non-transitory computer readable storage medium for image annotation | |
CN108388822B (zh) | 一种检测二维码图像的方法和装置 | |
US20120163708A1 (en) | Apparatus for and method of generating classifier for detecting specific object in image | |
EP2743888B1 (en) | Feature extraction device, feature extraction program, and image processing device | |
US9449222B2 (en) | Image processing device and method | |
JP6897749B2 (ja) | 学習方法、学習システム、および学習プログラム | |
CN110717497B (zh) | 图像相似度匹配方法、装置及计算机可读存储介质 | |
CN108133224B (zh) | 用于评估分类任务复杂度的方法 | |
Chen et al. | Seeking multi-thresholds directly from support vectors for image segmentation | |
Wang et al. | Color text image binarization based on binary texture analysis | |
US20190392207A1 (en) | Handwriting detector, extractor, and language classifier | |
Mammeri et al. | Road-sign text recognition architecture for intelligent transportation systems | |
CN111507344A (zh) | 从图像中识别出文字的方法和装置 | |
Michalak et al. | Fast adaptive image binarization using the region based approach | |
US20240331346A1 (en) | Division of images into separate color layers | |
Umadevi et al. | Dynamic hidden feature space detection of noisy image set by weight binarization | |
Cüceloğlu et al. | Detecting handwritten signatures in scanned documents | |
US9881228B2 (en) | Method and apparatus for removing a mark in a document image | |
CN103514453B (zh) | 对象识别设备和方法 | |
Tong et al. | QR code detection based on local features | |
Nasiri et al. | A new binarization method for high accuracy handwritten digit recognition of slabs in steel companies | |
CN113158745B (zh) | 一种基于多特征算子的乱码文档图片识别方法及系统 | |
Shirdhonkar et al. | Discrimination between printed and handwritten text in documents | |
JP2003216953A (ja) | 画像から対象物を抽出する方法およびその装置 | |
Fraz et al. | Exploiting Color Information for Better Scene Text Recognition. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170711 Termination date: 20180615 |