CN104182981B - 一种图像检测方法及装置 - Google Patents
一种图像检测方法及装置 Download PDFInfo
- Publication number
- CN104182981B CN104182981B CN201410424372.7A CN201410424372A CN104182981B CN 104182981 B CN104182981 B CN 104182981B CN 201410424372 A CN201410424372 A CN 201410424372A CN 104182981 B CN104182981 B CN 104182981B
- Authority
- CN
- China
- Prior art keywords
- training
- node
- visual signature
- model
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Image Analysis (AREA)
Abstract
本申请公开了一种图像检测方法及装置,方法包括:进行图像分割,获取训练对象集,构建多特征树,得到若干个在视觉特征上相互独立的范本对象,由于多特征树的建立过程是一种利用多种视觉特征按一定层次距离细分的过程,所以很好的表达出同类对象在多种视觉特征上的相似性,仅在少数视觉特征上不同,而异类对象只在少数特征上相似,在大多数视觉特征上不同。进一步,将获得的所有范本对象都用于对象表达中,通过计算图像对象与不同范本对象的相似程度,很好的将同类的多样性信息和异类的差异信息共同编码到对象表达中,因此使得最后的对象检测子同时具备良好的同类整合能力和异类区分能力。
Description
技术领域
本申请涉及计算机视觉技术领域,更具体地说,涉及一种图像检测方法及装置。
背景技术
图像检测是计算机视觉领域的热点研究问题,其性能对于后续的图像分类和目标识别有着重要的影响。
影响图像检测性能的因素有:同类间的多样性和异类间的模糊性。其中,同类多样性是指同属一类的对象在特征上并非呈现出预期的一致性,在特征、姿势、视角等多个方面呈现出巨大的多样性;而异类间的模糊性则表现在分属不同语义类的对象可能在特征上呈现出较大的相似性。因此,图像检测算法既要具备对同类对象多样性的整合能力,也要具备对存在模糊性的异类对象的区分能力。
现有方法通常是利用每类对象的特征构建该类对象唯一的对象检测子,而由于同类多样性,仅靠一个检测子难以拟合该类所有的对象,因此检测性能不高。
发明内容
有鉴于此,本申请提供了一种图像检测方法及装置,用于解决现有检测方法不能够同时具备对同类对象多样性的整合能力及异类对象的区分能力的问题。
为了实现上述目的,现提出的方案如下:
一种图像检测方法,包括:
利用图像分割算法将训练集中的每一个复合图像进行分割,得到由若干个训练对象构成的训练对象集,其中每一个训练对象均确定了类别标签;
利用所述训练对象集和预设的视觉特征集构造多特征树,该过程包括:
步骤S1:将所述训练对象集作为多特征树的根节点,并将根节点确定为目标节点;
步骤S2:在所述视觉特征集中挑选一个未被选取过的视觉特征,并利用选取的视觉特征对所述目标节点进行聚类,得到多特征树下一层中与所述目标节点对应的若干个子节点;
步骤S3:判断所述视觉特征集中是否存在未选取过的视觉特征,如果是,执行步骤S4,否则,执行步骤S5;
步骤S4:将所述若干个子节点分别确定为目标节点,返回执行步骤S2;
步骤S5:将所述若干个子节点确定为多特征树的叶子节点;
计算所述多特征树中除去根节点之外的所有节点的聚类均值;
将由根节点至每一个所述叶子节点的路径上的节点的聚类均值的顺序组合确定为该叶子节点的范本对象,所有的范本对象构成范本对象集;
对所述训练对象集中每一个训练对象,按照所述预设的视觉特征集,提取不同的视觉特征,并用提取的每一个视觉特征的顺序组合来表示该训练对象;
计算每一个所述训练对象与所述范本对象集中所有的范本对象的高斯相似性,将计算结果确定为该训练对象基于范本对象的表达;
利用每一个所述训练对象基于范本对象的表达以及该训练对象的类别标签,训练预先获取的携带有待定参数的对象检测子,以确定最优对象检测子;
利用所述最优对象检测子进行待测图像的检测。
优选地,所述将由根节点至每一个所述叶子节点的路径上的节点的聚类均值的顺序组合确定为该叶子节点的范本对象,所有的范本对象构成范本对象集,包括:
设定叶子节点的个数为M个,视觉特征集包含L个视觉特征,则第j个叶子节点的范本对象Fj表示为Fj=(fj1,fj2,...,fjL),其中,fjL为根节点至第j个叶子节点的路径上的第L个节点的聚类均值,范本对象集表示为EOB={F1,F2,...,FM}。
优选地,所述对所述训练对象集中每一个训练对象,按照所述预设的视觉特征集,提取不同的视觉特征,并用提取的每一个视觉特征的顺序组合来表示该训练对象,包括:
设定训练对象集为X={x1,x2,...,xN},视觉特征集为V={v1,...,vL},对于训练对象xi,提取视觉特征集中的L种视觉特征,并将训练对象xi表示为xi=(xi1,xi2,...,xiL)。
优选地,所述计算每一个所述训练对象与所述范本对象集中所有的范本对象的高斯相似性,将计算结果确定为该训练对象基于范本对象的表达,包括:
计算训练对象xi与范本对象集中所有范本对象的高斯相似性:
hi=(Gs(xi1,f11),...,Gs(xiL,f1L),Gs(xi1,f21),...,Gs(xiL,f2L),......,Gs(xi1,fM1),...,Gs(xiL,fML))
其中,Gs可以按照下式求解:Gs(x,f)=exp{-||x-f||2/δ2},δ2代表聚类均值f所在的节点的聚类方差;
将hi确定为训练对象xi基于范本对象的表达。
优选地,所述训练预先获取的携带有待定参数的对象检测子,包括:
利用结构正则化学习方法来训练预先获取的携带有待定参数的对象检测子。
优选地,所述图像分割算法为均值漂移算法。
一种图像检测装置,包括:
图像分割单元,用于利用图像分割算法将训练集中的每一个复合图像进行分割,得到由若干个训练对象构成的训练对象集,其中每一个训练对象均确定了类别标签;
多特征树建立单元,用于利用所述训练对象集和预设的视觉特征集构造多特征树,该过程包括:步骤S1:将所述训练对象集作为多特征树的根节点,并将根节点确定为目标节点;步骤S2:在所述视觉特征集中挑选一个未被选取过的视觉特征,并利用选取的视觉特征对所述目标节点进行聚类,得到多特征树下一层中与所述目标节点对应的若干个子节点;步骤S3:判断所述视觉特征集中是否存在未选取过的视觉特征,如果是,执行步骤S4,否则,执行步骤S5;步骤S4:将所述若干个子节点分别确定为目标节点,返回执行步骤S2;步骤S5:将所述若干个子节点确定为多特征树的叶子节点;
聚类均值计算单元,用于计算所述多特征树中除去根节点之外的所有节点的聚类均值;
范本对象确定单元,用于将由根节点至每一个所述叶子节点的路径上的节点的聚类均值的顺序组合确定为该叶子节点的范本对象,所有的范本对象构成范本对象集;
训练对象表示单元,用于对所述训练对象集中每一个训练对象,按照所述预设的视觉特征集,提取不同的视觉特征,并用提取的每一个视觉特征的顺序组合来表示该训练对象;
相似性计算单元,用于计算每一个所述训练对象与所述范本对象集中所有的范本对象的高斯相似性,将计算结果确定为该训练对象基于范本对象的表达;
对象检测子训练单元,用于利用每一个所述训练对象基于范本对象的表达以及该训练对象的类别标签,训练预先获取的携带有待定参数的对象检测子,以确定最优对象检测子;
图像检测单元,用于利用所述最优对象检测子进行待测图像的检测。
优选地,所述范本对象确定单元确定叶子节点的范本对象的过程包括:设定叶子节点的个数为M个,视觉特征集包含L个数据特征,则第j个叶子节点的范本对象Fj表示为Fj=(fj1,fj2,...,fjL),其中,fjL为根节点至第j个叶子节点的路径上的第L个节点的聚类均值,范本对象集表示为EOB={F1,F2,...,FM}。
优选地,所述对象检测子训练单元包括:
第一训练子单元,用于利用结构正则化学习方法来训练预先获取的携带有待定参数的对象检测子。
优选地,所述图像分割单元包括:
第一图像分割子单元,用于利用均值漂移算法对训练集中的每一个复合图像进行分割。
从上述的技术方案可以看出,本申请实施例提供的图像检测方法,通过构建多特征树,得到了许多在视觉特征上相互独立的范本对象,由于多特征树的建立过程是一种利用多种视觉特征按一定层次距离细分的过程,所以很好的表达出同类对象在多种视觉特征上的相似性,仅在少数视觉特征上不同;而异类对象只在少数特征上相似,在大多数视觉特征上不同。很好的体现了同类对象间的特征多样性和异类对象间的模糊性。进一步,本申请将获得的所有范本对象都用于对象表达中,通过计算图像对象与不同范本对象的相似程度,很好的将同类的多样性信息和异类的差异信息共同编码到对象表达中,因此使得最后的对象检测子同时具备良好的同类整合能力和异类区分能力。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例公开的一种图像检测方法流程图;
图2为本申请实施例公开的一种构造多特征树的方法流程图;
图3为本申请实施例公开的一种图像检测装置结构示意图;
图4为本申请实施例公开的对象检测子训练单元的结构示意图;
图5为本申请实施例公开的图像分割单元的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参见图1,图1为本申请实施例公开的一种图像检测方法流程图。
如图1所示,该方法包括:
步骤S100:利用图像分割算法将训练集中的每一个复合图像进行分割,得到由若干个训练对象构成的训练对象集;
具体地,这里图像分割算法可以是现有的算法,例如均值漂移mean shift算法等。由于训练集中的图像有可能是复合图像,即一幅图像有可能包含若干个独立的物体,因此需要将复合图像进行分割,分割后的每一幅图像对象只包含一个物体。举例如:复合图像里包括:一只牛、一只羊和一只兔子。分割之后,得到三幅图像对象,分别为牛、羊和兔子。并且,每一个训练对象均确定了类别标签,即为分割后的每个对象均赋予类别标签,以标注该图像对象的类别。
步骤S110:利用所述训练对象集和预设的视觉特征集构造多特征树;
具体地,预设的视觉特征集包括若干个视觉特征。则构造多特征树的过程可以参见图2,图2为本申请实施例公开的一种构造多特征树的方法流程图。如图2所示,该过程包括:
步骤S1:将所述训练对象集作为多特征树的根节点,并将根节点确定为目标节点;
具体地,将上述确定的训练对象集作为所要建立的多特征树的根节点。
步骤S2:在所述视觉特征集中挑选一个未被选取过的视觉特征,并利用选取的视觉特征对所述目标节点进行聚类;
具体地,利用预设的视觉特征集中任意一个未被选取过的视觉特征,对目标节点进行聚类,得到多特征树下一层中与所述目标节点对应的若干个子节点。这里,聚类的过程为对目标节点进行视觉特征的提取,将归属于同一类型视觉特征的对象聚成一类,最终将目标节点所包含的图像对象划分为多个子类,每个子类均为目标节点的子节点。例如,目标节点包含的对象有黑羊、白羊、灰羊,则提取颜色视觉特征后,将目标节点分为三类,分别为黑羊,白羊和灰羊,三个子类作为目标节点的三个子节点。
步骤S3:判断所述视觉特征集中是否存在未选取过的视觉特征,如果是,执行步骤S4,否则,执行步骤S5;
步骤S4:将所述若干个子节点分别确定为目标节点,返回执行步骤S2;
具体地,在视觉特征集中存在未被选取过的视觉特征时,则将上述步骤S2确定的若干个子节点分别确定为目标节点,然后返回步骤S2,重复进行聚类操作。这里,聚类操作的对象是之前确定的子节点,如果仍使用上述例子的话,即对黑羊节点、白羊节点和灰羊节点分别进行聚类,聚类时使用的视觉特征未重新选取的视觉特征。
需要说明的是,对于多特征树中处于同一层的节点,采用相同的视觉特征来进行聚类。
步骤S5:将所述若干个子节点确定为多特征树的叶子节点。
具体地,如果预设的视觉特征集中包括L个视觉特征,则经过上述多特征树构建过程,从根节点下的一层算起,多特征树共有L层。
步骤S120:计算所述多特征树中除去根节点之外的所有节点的聚类均值;
具体地,除去根节点之外的每一层的节点均是对其父节点进行聚类后得到的子节点。进行聚类时,所得到的每个子节点包括聚类得到的若干个图像对象,每个图像对象的类别值表示为一个向量,针对每个节点,求取该节点所有的图像对象的类别值的平均值,得到该节点的聚类均值。在此基础上,我们还可以求取该节点的聚类方差。
步骤S130:将由根节点至每一个所述叶子节点的路径上的节点的聚类均值的顺序组合确定为该叶子节点的范本对象;
具体地,由根节点至某一个叶子节点A的路径是唯一的。如果选取视觉特征集包括L个视觉特征,则该路径经过了L个节点,将每个节点的聚类均值按照顺序进行组合,将所有的聚类均值的组合确定为该叶子节点A的范本对象,所有的叶子节点的范本对象构成范本对象集。
步骤S140:对所述训练对象集中每一个训练对象,按照所述预设的视觉特征集,提取不同的视觉特征,并用提取的每一个视觉特征的顺序组合来表示该训练对象;
具体地,按照上述设定的L个视觉特征,分别提取每一个训练对象的视觉特征,将提取出的视觉特征按照顺序组合,将其表示成与范本对象对应的表达方式。
步骤S150:计算每一个所述训练对象与所述范本对象集中所有的范本对象的高斯相似性,将计算结果确定为该训练对象基于范本对象的表达;
具体地,通过计算一个训练对象与所有范本对象在特征上的相似程度来表达它。在这种表达方法中,我们既通过计算训练对象与同类范本对象的特征相似性,全面地在训练对象的表达中体现了同类对象间的多样性信息;也通过计算训练对象与其他类范本对象在特征上的差异程度,更加直观的将不同对象间的差异信息编码到了对象的表达中。
步骤S160:训练预先获取的携带有待定参数的对象检测子,以确定最优对象检测子;
具体地,利用每一个所述训练对象基于范本对象的表达以及该训练对象的类别标签,来训练对象检测子,确定训练对象检测子中的待定参数,从而得到最优的对象检测子。
步骤S170:利用所述最优对象检测子进行待测图像的检测。
具体地,利用上述确定的对象检测子,来对待测图像进行检测分类。
本申请实施例提供的图像检测方法,通过构建多特征树,得到了许多在视觉特征上相互独立的范本对象,由于多特征树的建立过程是一种利用多种视觉特征按一定层次距离细分的过程,所以很好的表达出同类对象在多种视觉特征上的相似性,仅在少数视觉特征上不同;而异类对象只在少数特征上相似,在大多数视觉特征上不同。很好的体现了同类对象间的特征多样性和异类对象间的模糊性。进一步,本申请将获得的所有范本对象都用于对象表达中,通过计算图像对象与不同范本对象的相似程度,很好的将同类的多样性信息和异类的差异信息共同编码到对象表达中,因此使得最后的对象检测子同时具备良好的同类整合能力和异类区分能力。
下面,我们详细的对上述整个过程进行介绍。
首先,设定训练对象集为X={x1,x2,...,xN},选取L中不同的视觉特征,构成视觉特征集V={v1,...,vL}。
将训练对象集作为多特征树的根节点,从根节点开始,以视觉特征集V中一个视觉特征对根节点进行聚类,得到下一层的若干个子节点。
再从视觉特征集V中选取一个未被选取过的视觉特征对上述若干个子节点分别进行聚类,再次得到下一层的若干个子节点,重复该过程,直至将L中视觉特征全部选取完毕,得到第L层的若干个叶子节点。这里,我们假设第L层共有M个叶子节点。
第j个叶子节点的范本对象Fj表示为Fj=(fj1,fj2,...,fjL),其中,fjL为根节点至第j个叶子节点的路径上的第L个节点的聚类均值,范本对象集表示为EOB={F1,F2,...,FM}。
接下来,对于训练对象xi,提取视觉特征集中的L种视觉特征,并将训练对象xi表示为xi=(xi1,xi2,...,xiL)。
计算训练对象xi与范本对象集中所有范本对象的高斯相似性:
hi=(Gs(xi1,f11),...,Gs(xiL,f1L),Gs(xi1,f21),...,Gs(xiL,f2L),......,Gs(xi1,fM1),...,Gs(xiL,fML))
其中,Gs可以按照下式求解:Gs(x,f)=exp{-||x-f||2/δ2},δ2代表聚类均值f所在的节点的聚类方差。
将hi确定为训练对象xi基于范本对象的表达。
让E={e1,...,eN}∈RD×N表示N个训练对象基于范本对象的表达,即ei=hi。训练对象的类别标签为Y=(y1,y2,...,yN)∈{1,...,K}N。
本文使用线性分类器在1-versus-all(一对多)的分类策略下构建出对象检测子:
其中,为待定参数,βk∈RD×1,k=1,...,K。y是对象ei的类别,通过带入不同的训练对象基于范本对象的表达ei及该训练对象的类别标签,训练得到最优的。
在训练对象检测子时,可以选用结构正则化学习方法来进行训练。
其中
λ是平衡参数可以通过交叉验证的方法来确定;L(.)是损失函数,本文选择了广泛使用的Log loss,R(βk)是正则项,考虑到存在多个范本对象同属一类,并且这些同属一类的范本对象往往存在着预测的一致性,因此我们选择l1/l2+l1的正项形式来实现稀疏化,即:
R(βk)=||βk||1,2+λ′||β|||1
其中βk j是属于范本对象集中第j个范本对象对应的待定参数,λ′是平衡参数可以通过交叉验证来确定。
可选的,我们利用coordinate descent algorithm算法解决(1)中的寻优问题得到了参数βk。将确定的βk带入对象检测子公式,然后利用对象检测子公式进行待定对象的检测分类。
下面对本申请实施例提供的图像检测装置进行描述,下文描述的图像检测装置与上文描述的图像检测方法可相互对应参照。
参见图3,图3为本申请实施例公开的一种图像检测装置结构示意图。
如图3所示,该装置包括:
图像分割单元31,用于利用图像分割算法将训练集中的每一个复合图像进行分割,得到由若干个训练对象构成的训练对象集,其中每一个训练对象均确定了类别标签;
多特征树建立单元32,用于利用所述训练对象集和预设的视觉特征集构造多特征树,该过程包括:步骤S1:将所述训练对象集作为多特征树的根节点,并将根节点确定为目标节点;步骤S2:在所述视觉特征集中挑选一个未被选取过的视觉特征,并利用选取的视觉特征对所述目标节点进行聚类,得到多特征树下一层中与所述目标节点对应的若干个子节点;步骤S3:判断所述视觉特征集中是否存在未选取过的视觉特征,如果是,执行步骤S4,否则,执行步骤S5;步骤S4:将所述若干个子节点分别确定为目标节点,返回执行步骤S2;步骤S5:将所述若干个子节点确定为多特征树的叶子节点;
聚类均值计算单元33,用于计算所述多特征树中除去根节点之外的所有节点的聚类均值;
范本对象确定单元34,用于将由根节点至每一个所述叶子节点的路径上的节点的聚类均值的顺序组合确定为该叶子节点的范本对象,所有的范本对象构成范本对象集;
具体地,设定叶子节点的个数为M个,视觉特征集包含L个数据特征,则第j个叶子节点的范本对象Fj表示为Fj=(fj1,fj2,...,fjL),其中,fjL为根节点至第j个叶子节点的路径上的第L个节点的聚类均值,范本对象集表示为EOB={F1,F2,...,FM}。
训练对象表示单元35,用于对所述训练对象集中每一个训练对象,按照所述预设的视觉特征集,提取不同的视觉特征,并用提取的每一个视觉特征的顺序组合来表示该训练对象;
相似性计算单元36,用于计算每一个所述训练对象与所述范本对象集中所有的范本对象的高斯相似性,将计算结果确定为该训练对象基于范本对象的表达;
对象检测子训练单元37,用于利用每一个所述训练对象基于范本对象的表达以及该训练对象的类别标签,训练预先获取的携带有待定参数的对象检测子,以确定最优对象检测子;
图像检测单元38,用于利用所述最优对象检测子进行待测图像的检测。
可选的,图4示例了本申请实施例公开的对象检测子训练单元的一种可选结构,如图4所示,对象检测子训练单元37包括:
第一训练子单元371,用于利用结构正则化学习方法来训练预先获取的携带有待定参数的对象检测子。
可选的,图5示例了本申请实施例公开的图像分割单元的一种可选结构,如图5所示,图像分割单元31包括:
第一图像分割子单元311,用于利用均值漂移算法对训练集中的每一个复合图像进行分割。
本申请实施例提供的图像检测装置,通过构建多特征树,得到了许多在视觉特征上相互独立的范本对象,由于多特征树的建立过程是一种利用多种视觉特征按一定层次距离细分的过程,所以很好的表达出同类对象在多种视觉特征上的相似性,仅在少数视觉特征上不同;而异类对象只在少数特征上相似,在大多数视觉特征上不同。很好的体现了同类对象间的特征多样性和异类对象间的模糊性。进一步,本申请将获得的所有范本对象都用于对象表达中,通过计算图像对象与不同范本对象的相似程度,很好的将同类的多样性信息和异类的差异信息共同编码到对象表达中,因此使得最后的对象检测子同时具备良好的同类整合能力和异类区分能力。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种图像检测方法,其特征在于,包括:
利用图像分割算法将训练集中的每一个复合图像进行分割,得到由若干个训练对象构成的训练对象集,其中每一个训练对象均确定了类别标签;
利用所述训练对象集和预设的视觉特征集构造多特征树,包括:
步骤S1:将所述训练对象集作为多特征树的根节点,并将根节点确定为目标节点;
步骤S2:在所述视觉特征集中挑选一个未被选取过的视觉特征,并利用选取的视觉特征对所述目标节点进行聚类,得到多特征树下一层中与所述目标节点对应的若干个子节点;
步骤S3:判断所述视觉特征集中是否存在未选取过的视觉特征,如果是,执行步骤S4,否则,执行步骤S5;
步骤S4:将所述若干个子节点分别确定为目标节点,返回执行步骤S2;
步骤S5:将所述若干个子节点确定为多特征树的叶子节点;
计算所述多特征树中除去根节点之外的所有节点的聚类均值;
将由根节点至每一个所述叶子节点的路径上的节点的聚类均值的顺序组合确定为该叶子节点的范本对象,所有的范本对象构成范本对象集;
对所述训练对象集中每一个训练对象,按照所述预设的视觉特征集,提取不同的视觉特征,并用提取的每一个视觉特征的顺序组合来表示该训练对象;
计算每一个所述训练对象与所述范本对象集中所有的范本对象的高斯相似性,将计算结果确定为该训练对象基于范本对象的表达;
利用每一个所述训练对象基于范本对象的表达以及该训练对象的类别标签,训练预先获取的携带有待定参数的对象检测子,以确定最优对象检测子;
利用所述最优对象检测子进行待测图像的检测。
2.根据权利要求1所述的图像检测方法,其特征在于,所述将由根节点至每一个所述叶子节点的路径上的节点的聚类均值的顺序组合确定为该叶子节点的范本对象,所有的范本对象构成范本对象集,包括:
设定叶子节点的个数为M个,视觉特征集包含L个视觉特征,则第j个叶子节点的范本对象Fj表示为Fj=(fj1,fj2,...,fjL),其中,fjL为根节点至第j个叶子节点的路径上的第L个节点的聚类均值,范本对象集表示为EOB={F1,F2,...,FM}。
3.根据权利要求2所述的图像检测方法,其特征在于,所述对所述训练对象集中每一个训练对象,按照所述预设的视觉特征集,提取不同的视觉特征,并用提取的每一个视觉特征的顺序组合来表示该训练对象,包括:
设定训练对象集为X={x1,x2,...,xN},视觉特征集为V={v1,...,vL},对于训练对象xi,提取视觉特征集中的L种视觉特征,并将训练对象xi表示为xi=(xi1,xi2,...,xiL)。
4.根据权利要求3所述的图像检测方法,其特征在于,所述计算每一个所述训练对象与所述范本对象集中所有的范本对象的高斯相似性,将计算结果确定为该训练对象基于范本对象的表达,包括:
计算训练对象xi与范本对象集中所有范本对象的高斯相似性:
hi=(Gs(xi1,f11),...,Gs(xiL,f1L),Gs(xi1,f21),...,Gs(xiL,f2L),......,Gs(xi1,fM1),...,Gs(xiL,fML))
其中,Gs按照下式求解:δ2代表聚类均值f所在的节点的聚类方差;
将hi确定为训练对象xi基于范本对象的表达。
5.根据权利要求1所述的图像检测方法,其特征在于,所述训练预先获取的携带有待定参数的对象检测子,包括:
利用结构正则化学习方法来训练预先获取的携带有待定参数的对象检测子。
6.根据权利要求1所述的图像检测方法,其特征在于,所述图像分割算法为均值漂移算法。
7.一种图像检测装置,其特征在于,包括:
图像分割单元,用于利用图像分割算法将训练集中的每一个复合图像进行分割,得到由若干个训练对象构成的训练对象集,其中每一个训练对象均确定了类别标签;
多特征树建立单元,用于利用所述训练对象集和预设的视觉特征集构造多特征树,包括:步骤S1:将所述训练对象集作为多特征树的根节点,并将根节点确定为目标节点;步骤S2:在所述视觉特征集中挑选一个未被选取过的视觉特征,并利用选取的视觉特征对所述目标节点进行聚类,得到多特征树下一层中与所述目标节点对应的若干个子节点;步骤S3:判断所述视觉特征集中是否存在未选取过的视觉特征,如果是,执行步骤S4,否则,执行步骤S5;步骤S4:将所述若干个子节点分别确定为目标节点,返回执行步骤S2;步骤S5:将所述若干个子节点确定为多特征树的叶子节点;
聚类均值计算单元,用于计算所述多特征树中除去根节点之外的所有节点的聚类均值;
范本对象确定单元,用于将由根节点至每一个所述叶子节点的路径上的节点的聚类均值的顺序组合确定为该叶子节点的范本对象,所有的范本对象构成范本对象集;
训练对象表示单元,用于对所述训练对象集中每一个训练对象,按照所述预设的视觉特征集,提取不同的视觉特征,并用提取的每一个视觉特征的顺序组合来表示该训练对象;
相似性计算单元,用于计算每一个所述训练对象与所述范本对象集中所有的范本对象的高斯相似性,将计算结果确定为该训练对象基于范本对象的表达;
对象检测子训练单元,用于利用每一个所述训练对象基于范本对象的表达以及该训练对象的类别标签,训练预先获取的携带有待定参数的对象检测子,以确定最优对象检测子;
图像检测单元,用于利用所述最优对象检测子进行待测图像的检测。
8.根据权利要求7所述的图像检测装置,其特征在于,所述范本对象确定单元确定叶子节点的范本对象的过程包括:设定叶子节点的个数为M个,视觉特征集包含L个数据特征,则第j个叶子节点的范本对象Fj表示为Fj=(fj1,fj2,...,fjL),其中,fjL为根节点至第j个叶子节点的路径上的第L个节点的聚类均值,范本对象集表示为EOB={F1,F2,...,FM}。
9.根据权利要求7所述的图像检测装置,其特征在于,所述对象检测子训练单元包括:
第一训练子单元,用于利用结构正则化学习方法来训练预先获取的携带有待定参数的对象检测子。
10.根据权利要求7所述的图像检测装置,其特征在于,所述图像分割单元包括:
第一图像分割子单元,用于利用均值漂移算法对训练集中的每一个复合图像进行分割。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410424372.7A CN104182981B (zh) | 2014-08-26 | 2014-08-26 | 一种图像检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410424372.7A CN104182981B (zh) | 2014-08-26 | 2014-08-26 | 一种图像检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104182981A CN104182981A (zh) | 2014-12-03 |
CN104182981B true CN104182981B (zh) | 2017-02-22 |
Family
ID=51963999
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410424372.7A Active CN104182981B (zh) | 2014-08-26 | 2014-08-26 | 一种图像检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104182981B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108496185B (zh) * | 2016-01-18 | 2022-09-16 | 北京市商汤科技开发有限公司 | 用于对象检测的系统和方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102819836A (zh) * | 2012-06-28 | 2012-12-12 | 北京邮电大学 | 一种图像分割方法及系统 |
-
2014
- 2014-08-26 CN CN201410424372.7A patent/CN104182981B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102819836A (zh) * | 2012-06-28 | 2012-12-12 | 北京邮电大学 | 一种图像分割方法及系统 |
Non-Patent Citations (2)
Title |
---|
Urban Building Detection by Visual and Geometrical Features;Hoang-Hon Trinh et al.;《International Conference on Control, Automation and Systems 2007》;20071017;第1779-1784页 * |
多特征稳健主成分分析的视频运动目标分割;甘超 等;《中国图象图形学报》;20130930;第18卷(第9期);第1124-1132页 * |
Also Published As
Publication number | Publication date |
---|---|
CN104182981A (zh) | 2014-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Willhauck et al. | Comparison of object oriented classification techniques and standard image analysis for the use of change detection between SPOT multispectral satellite images and aerial photos | |
CN106682697A (zh) | 一种基于卷积神经网络的端到端物体检测方法 | |
Hoiem et al. | Recovering surface layout from an image | |
CN110363131B (zh) | 基于人体骨架的异常行为检测方法、系统及介质 | |
CN108764142A (zh) | 基于3dcnn的无人机影像森林烟雾检测和分类方法 | |
CN109145939A (zh) | 一种小目标敏感的双通道卷积神经网络语义分割方法 | |
CN102682302A (zh) | 一种基于关键帧的多特征融合的人体姿态识别方法 | |
CN106462940A (zh) | 图像中通用对象检测 | |
CN105844295A (zh) | 一种基于颜色模型与运动特征的视频烟雾精细分类方法 | |
CN106682696A (zh) | 基于在线示例分类器精化的多示例检测网络及其训练方法 | |
CN106127197A (zh) | 一种基于显著标签排序的图像显著性目标检测方法 | |
CN106815824B (zh) | 一种提高大规模三维重建效率的图像近邻优化方法 | |
CN101894276A (zh) | 人体动作识别的训练方法和识别方法 | |
CN104240256A (zh) | 一种基于层次化稀疏建模的图像显著性检测方法 | |
KR20200075114A (ko) | 이미지와 텍스트간 유사도 매칭 시스템 및 방법 | |
CN104679818A (zh) | 一种视频关键帧提取方法及系统 | |
CN106570874A (zh) | 一种结合图像局部约束与对象全局约束的图像标记方法 | |
CN103106265A (zh) | 相似图像分类方法及系统 | |
CN106126585A (zh) | 基于质量分级与感知哈希特征组合的无人机图像检索方法 | |
CN103886030B (zh) | 基于代价敏感决策树的信息物理融合系统数据分类方法 | |
Jampani et al. | Efficient facade segmentation using auto-context | |
CN105243356A (zh) | 一种建立行人检测模型的方法及装置及行人检测方法 | |
CN107615272A (zh) | 用于预测人群属性的系统和方法 | |
CN107392254A (zh) | 一种通过联合嵌入从像素中构造图像的语义分割方法 | |
CN108399366A (zh) | 一种基于逐像素分类的遥感图像场景分类提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |