CN102289681B - 一种信封图像匹配方法 - Google Patents

一种信封图像匹配方法 Download PDF

Info

Publication number
CN102289681B
CN102289681B CN201110224869.0A CN201110224869A CN102289681B CN 102289681 B CN102289681 B CN 102289681B CN 201110224869 A CN201110224869 A CN 201110224869A CN 102289681 B CN102289681 B CN 102289681B
Authority
CN
China
Prior art keywords
prime
ang
theta
distance
cdis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110224869.0A
Other languages
English (en)
Other versions
CN102289681A (zh
Inventor
吕岳
刘丽
吕淑静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Post Technology Co.,Ltd.
Original Assignee
SHANGHAI POST SCIENCE INST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI POST SCIENCE INST filed Critical SHANGHAI POST SCIENCE INST
Priority to CN201110224869.0A priority Critical patent/CN102289681B/zh
Publication of CN102289681A publication Critical patent/CN102289681A/zh
Application granted granted Critical
Publication of CN102289681B publication Critical patent/CN102289681B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种信封图像匹配方法,将待匹配的两个信封图像分别用图表示出来,则图像之间的相似度计算转化为图匹配问题,采用基于最小权重的二分图匹配算法计算两个图之间的距离。进一步的,首先对信封图像进行分割,基于分割结果构建图像的图表示。其中,图的每个顶点代表信封图像中的一个区域,而图的每一条边用来表示两个区域之间的邻接关系。由于图像在采集过程中易受到噪声等因素的影响,可能会导致对应于同一个信封的多个图像的图表示有所不同,故本发明采用一种非精确图匹配算法。大量实验结果表明,该方法对于光照、倾斜、旋转等具有较强的鲁棒性,能够高效地实现基于信封图像的信函信息查询。

Description

一种信封图像匹配方法
技术领域
本发明属于邮政技术领域,特别涉及一种信封图像匹配方法。
背景技术
信封图像匹配是邮政自动化领域的一项重要研究内容,即将信封图像作为查询依据和信函分拣系统数据库中的所有图像做匹配,将获得成功匹配的图像以及其在数据库中的相关处理信息比如邮编或地址识别结果作为最终查询结果返回。
根据格式塔视觉原理,对象中各个部分之间的相对位置关系在人的视觉系统中起着关键作用,相对位置关系的变化必然会导致视觉差异。传统采用特征向量来描述对象的方法,并不能准确地表达出对象中各个部分之间的关系。此外,基于特征向量的匹配方法,容易受到旋转、倾斜等因素的影响。
图作为一种数据结构不仅能表示对象,而且能较好地刻画对象各个部分之间的关系,符合人的视觉特性。尤其是后者在实际的模式识别应用中尤为重要,比如在信封图像检索中,信封图像一般由一些显著区域组成,如邮编、地址、邮票区等,故在匹配时,可以充分利用这些区域之间的相对拓扑结构关系。对于拓扑结构有很大差异的两个信封图像,基本上可以确定它们之间的不匹配关系。
图匹配有坚实的数学理论基础,对旋转、平移均具有良好的不变性。近年来,许多学者开展了图匹配方法的研究。主要分为两大类:精确匹配以及非精确匹配。其中精确匹配要求待匹配的两个图具有完全相同的顶点以及顶点之间的拓扑结构关系,这种苛刻的要求限制了其在实际中的应用。而在非精确匹配中,更多关注的是在两个图不完全相同的情况下,如何给出一个合适的相似性度量方法。
发明内容
本发明的目的是提供一种信封图像匹配方法,以实现以信封图像作为查询依据在信函分拣系统的数据库中查询相关信息。
本发明的技术方案是,一种信封图像匹配方法,包括对信封图像进行高斯平滑滤波、边缘检测、二值化以及闭运算的预处理步骤,还包括以下步骤:
A1,对所述信封图像进行分割,分割结果为Ω={R1,R2,...,RN},其中N表示区域总数,区域Ri的邻接区域为N(Ri),基于分割结果Ω构建该信封图像的图表示G=(V,E,μ,v),其中V是顶点集,E是边集,μ:V→LV为顶点属性函数,v:E→LE为边属性函数,其中LV和LE以是任意类型的集合,图G中的顶点vi对应Ω中的区域Ri,图G中的任两个顶点vi及vj,其对应区域分别为Ri∈Ω及Rj∈Ω,vi和vj之间存在边eij的条件是Ri∈N(Rj)或者Rj∈N(Ri),
对于图G中的顶点vi其属性定义为vi={Fi,Ti,Mi,Ci},
前景像素比例F,即区域Ri中前景像素占整个图像中前景像素的比例,纹理特征为特征向量Ti={Entavg,Entvar,Conavg,Convar,Homavg,Homvar}.计算区域Ri的四方向,包括0度、45度、90度以及180度的灰度共生矩阵Pj(j=1,2,3,4),其大小为S×S,基于每个Pj提取熵Ent、对比度Con和逆差距Hom三个特征:
Ent j = - Σ a = 0 S Σ b = 0 S P j ( a , b ) × log P j ( a , b ) - - - ( 1 )
Con j = - Σ a = 0 S Σ b = 0 S ( a - b ) 2 × P j ( a , b ) - - - ( 2 )
Hom j = - Σ a = 0 S Σ b = 0 S P j ( a , b ) 1 + ( a - b ) 2 - - - ( 3 )
对每个特征分别求四个方向的均值与方差,则纹理特征最终表示为特征向量Ti={Entavg,Entvar,Conavg,Convar,Homavg,Homvar}.
矩特征M。假定区域Ri的灰度级范围为[0-L],则其归一化后灰度直方图表示成Hi={h(0),h(1),...,h(L)},其中h(k)(k=0,1,...,L)代表灰度级k在区域Ri中所占比例,该区域的直方图二阶矩为:
M i = Σ k = 0 L ( k - m ) 2 × h ( k ) - - - ( 4 )
其中m为区域Ri的平均灰度值。
上下文特征C。令(Cxi,Cyi)为Ri的中心,Rj∈N(Ri)的中心为(Cxj,Cyj)。
Figure BDA0000081472010000032
连接(Cxi,Cyi)与(Cxj,Cyj),则形成以(Cxi,Cyi)为中心的星形拓扑结构,将整个平面划分为||N(Ri)||份,该拓扑结构较好地描述了N(Ri)之间相对于Ri的位置关系。用θ来表示两条直线间的夹角,则Ri的上下文特征可以描述为特征向量
Figure BDA0000081472010000033
图G中连接顶点vi和vj的边eij,其属性描述所连接两个区域Ri和Rj之间的邻接关系,边eij的属性为eij={Cdisij,Angij}
归一化的中心连线距离Cdis
Cdis ij = ( Cx i - Cx j ) 2 + ( Cy i - Cy j ) 2 ImgH 2 + ImgW 2 - - - ( 5 )
Ri的中心坐标为(Cxi,Cyi),Rj的中心坐标为(Cxj,Cyj),其中ImgH和ImgW分别代表信封图像的高和宽,
边eij的角度特征Ang指该边与其它所有与顶点vi或vj相连的边之间的夹角集合,设Ei={eim|m=1,2,...,Ni,m≠j,m≠i}表示与顶点vi相连的边集,Ej={ejn|n=1,2,...,Nj,n≠i,n≠j}表示与顶点vj相连的边集,其中Ni和Nj分别表示与顶点vi及vj相连的边数,则eij的角度特征Ang为:
Angij=Angi∪Angj                  (6)
其中,
Ang i = { θ e ij e i 1 , θ e ij e i 2 , . . . , θ e ij e im } , e im ∈ E i - - - ( 7 )
Ang j = { θ e ij e j 1 , θ e ij e j 2 , . . . , θ e ij e jn } , e jn ∈ E j - - - ( 8 )
θ e ij e im = arccos ( e ij · e im | e ij | × | e im | ) - - - ( 9 )
A2,令图库中任一图表示为G′=(V′,E′,μ′,v′),计算图G=(V,E,μ,v)与G′=(V′,E′,μ′,v′)之间的相似度,具体步骤为:
B1,计算vi∈G与vi′∈G′顶点之间的距离
d(vi,vi′)=dF+dT+dM+dC                 (15)
其中,
属性F之间的距离dF
d F = | F i - F i ′ | F i + F i ′ - - - ( 10 )
属性T之间的距离dT
d T = 1 - Π K = Ent , Con , Hom min ( K avgi , K avgi ′ ) min ( K vari , K vari ′ ) max ( K avgi , K avgi ′ ) max ( K vari , K vari ′ ) - - - ( 11 )
属性M之间的距离dM
d M = | M i - M i ′ | M i + M i ′
属性C之间的距离dC
采用Hausdorff距离计算dC,具体方法如下,
假定Ci={θ1,θ2,...,θp},Ci′={θ′1,θ′2,...,θ′p′},则
d C = max ( h ( C i , C i ′ ) , h ( C i ′ , C i ) ) Context _ MAX - - - ( 12 )
其中,
h ( C i , C i ′ ) = max θ ∈ C i min θ ′ ∈ C i ′ | θ - θ ′ | - - - ( 13 )
h ( C i ′ , C i ) = max θ ′ ∈ C i ′ min θ ∈ C i | θ ′ - θ | - - - ( 14 )
Context_MAX是两个顶点属性C之间可能取到的最大Hausdorff距离,即获得vi∈G与vi′∈G′之间的距离d(vi,vi′)如下,
d(vi,vi′)=dF+dT+dM+dC                (15)
B2,计算对于eij∈G和ei′j′∈G′,边之间的距离为
d(eij,ei′j′)=dCdis+dAng              (16)
其中dCdis表示Cdis属性之间的距离,dAng表示Ang属性之间的距离,
属性Cdis之间的距离dCdis
d Cdis = | Cdis ij - Cdis i ′ j ′ | | Cdis ij + Cdis i ′ j ′ |
属性Ang之间的距离dAng采用Hausdorff距离计算,主要步骤如下:
假设Angij={θ1,θ2,...,θp},Angi′j′={θ′1,θ′2,...,θ′p′},则
d Ang = max ( h ( Ang ij , Ang i ′ j ′ ) , h ( Ang i ′ j ′ , Ang ij ) ) Ang _ MAX
其中,
h ( Ang ij , Ang i ′ j ′ ) = max θ ∈ Ang ij min θ ′ ∈ Ang i ′ j ′ | θ - θ ′ |
h ( Ang i ′ j ′ , Ang ij ) = max θ ′ ∈ Ang i ′ j ′ min θ ∈ Ang ij | θ ′ - θ |
Ang_MAX是两条边属性Ang之间可能取到的最大Hausdorff距离;
B3,计算图之间的距离Dist(G,G′)
根据G=(V,E,μ,v)和G′=(V′,E′,μ′,v′)建立二分图BP,具体为:令 BP = ( U ‾ , W ‾ , E ‾ ) , 其中 U ‾ = V , W ‾ = V ′ , E ‾ = U ‾ × W ‾
Figure BDA0000081472010000061
令其权重 w ( e ‾ ii ′ ) = d ( v i , v i ′ )
基于二分图BP,运用Munkre算法获得具有最小权重的匹配,将该最小权重作为两个图之间的顶点距离DistNode
假设图G=(V,E,μ,v)与G′=(V′,E′,μ′,v′)中顶点数目分别为N和N′,则采用Munkre算法获得min(N,N′)对顶点对应关系,定义0-1矩阵Z,大小为N×N′,即
Figure BDA0000081472010000063
基于矩阵Z可以获得两个图之间隐含的边匹配关系,主要分为以下四种情况:假设vi∈G,vj∈G及vi′∈G′,vj′∈G′,Z[i][i′]=1并且Z[j][j′]=1,
对于eij∈E∩ei′j′∈E′,d(eij,ei′j′)值不变,
对于
Figure BDA0000081472010000064
令d(eij,ei′j′)=0
对于令d(eij,ei′j′)=σ,其中σ为大于0的常数,
对于
Figure BDA0000081472010000066
令d(eij,ei′j′)=σ,其中σ为大于0的常数,
则G=(V,E,μ,v)和G′=(V′,E′,μ′,v′)之间的边距离DistEdge为:
Dist Edge = Σ a = 0 N Σ b = a + 1 N Σ a ′ = 0 N ′ Σ b ′ = a ′ + 1 N ′ Z [ a ] [ a ′ ] Z [ b ] [ b ′ ] d ( e ab , e a ′ b ′ ) - - - ( 18 )
当图G=(V,E,μ,v)与G′=(V′,E′,μ′,v′)中顶点数目不同时,额外的匹配代价Penal(G,G′)为:
Penal ( G , G ′ ) = fabs ( | | V | | - | | V ′ | | ) | | V | | + | | V ′ | | - - - ( 19 )
其中||·||表示图中顶点数目,fabs(·)为取绝对值操作,
图G=(V,E,μ,v)和G′=(V′,E′,μ′,v′)之间的距离Dist(G,G′)为:
Dist(G,G′)=DistNode(G,G′)+DistEdge(G,G′)+Penal(G,G′)(20),距离Dist(G,G′)即为G=(V,E,μ,v)和G′=(V′,E′,μ′,v′)之间的相似度。
本发明将待匹配的两个信封图像分别用图表示出来,则图像之间的相似度计算转化为图匹配问题,采用基于最小权重的二分图匹配算法计算两个图之间的距离。
进一步的,首先对信封图像进行分割,基于分割结果构建图像的图表示。其中,图的每个顶点代表信封图像中的一个区域,而图的每一条边用来表示两个区域之间的邻接关系。
由于图像在采集过程中易受到噪声等因素的影响,可能会导致对应于同一个信封的多个图像的图表示有所不同,故本发明采用一种非精确图匹配算法。大量实验结果表明,该方法对于光照、倾斜、旋转等具有较强的鲁棒性,能够高效地实现基于信封图像的信函信息查询。
附图说明
图1是本发明实施例中信封图像的预处理流程图
图2是本发明实施例中信封图像的分割结果示意图
图3是本发明实施例中信封图像中各个区域之间的邻接关系
图4是本发明实施例中信封图像的图表示
图5是本发明实施例中信封图像中每个区域与其邻接区域之间形成的“星型”拓扑结构
图6是本发明实施例中所构建的图中顶点的上下文属性
图7是本发明实施例中所构建的图中边的角度属性
图8是本发明实施例中基于最小权重的二分图匹配
图9是本发明实施例中信封图像的检索流程
具体实施方式
以下结合附图对本发明的具体实施方式做详细说明。
为了减少噪声等干扰对后续图像分割以及匹配的影响,需要对图像进行预处理,主要包括高斯平滑滤波、边缘检测、二值化以及闭运算等几个步骤,如图1所示。
将图匹配方法应用在实际问题中时,首先要解决的问题是如何准确地将待处理对象用图表示出来。方法是,先对信封图像进行分割,得到若干不相交区域,然后基于分割结果来构建图。采用基于区域的方法来构建信封图像的图表示主要原因在于区域是介于像素以及整幅图像之间的一种有效的图像表征方法,通过对每个区域属性的描述可以获得图像的局部特征,而各个区域之间的关系则可以表达出图像的全局拓扑结构。所以较通常采用的基于特征点构建图的方法在描述对象的能力方面具有一定优势。
结合信封图像版面格式的先验知识,采用连通元分析(CCA)方法对信封图像进行分割,分割结果的一个实例如图2所示。
本发明技术方案中涉及的一些概念和方法如下所述。
1,构建信封图像的图表示。
以下对如何基于信封图像的分割结果构建其图表示G做详细说明。
令图像分割结果为Ω={R1,R2,...,RN},其中N表示区域总数。定义区域Ri的邻接区域为N(Ri),基于Ω构建图像的图表示G的主要方法如下:
(1)图G中的每个顶点vi对应Ω中的一个区域Ri
(2)对于图G中的两个顶点vi及vj,假设其对应区域分别为Ri∈Ω及Rj∈Ω。则vi和vj之间存在边eij的条件是Ri∈N(Rj)或者Rj∈N(Ri)。
具体来说,将图G表示为四元组G=(V,E,μ,v),其中V是顶点集,E是边集,μ:V→LV为顶点属性函数,v:E→LE为边属性函数。其中LV和LE可以是任意类型的集合,比如实数、向量或者符号。图3显示了信封图像中各个区域之间的邻接关系,图4为对应于该信封图像的图表示。
1.1,关于前述的图中顶点属性的定义特别说明如下。
图中顶点属性对应于其所代表图像区域的特征,由于光照的影响,会导致直接基于图像灰度的特征具有不稳定性,所以后续操作均是基于图像的边缘图进行的。一方面边缘保留了原始图像中的所有重要信息,并且对光照有一定鲁棒性。
(1)前景像素比例F。即区域Ri中前景像素占整个图像中前景像素的比例。
(2)纹理特征T。分别计算区域Ri的四方向(0度、45度、90度以及180度)灰度共生矩阵Pj(j=1,2,3,4),其大小为S×S。基于每个Pj提取熵Ent、对比度Con和逆差距Hom三个特征。
Ent j = - Σ a = 0 S Σ b = 0 S P j ( a , b ) × log P j ( a , b ) - - - ( 1 )
Con j = - Σ a = 0 S Σ b = 0 S ( a - b ) 2 × P j ( a , b ) - - - ( 2 )
Hom j = - Σ a = 0 S Σ b = 0 S P j ( a , b ) 1 + ( a - b ) 2 - - - ( 3 )
对每个特征分别求四个方向的均值与方差,则纹理特征最终表示为特征向量Ti={Entavg,Entvar,Conavg,Convav,Homavg,Homvar}.
(3)矩特征M。假定区域Ri的灰度级范围为[0-L],则其归一化后灰度直方图表示成Hi={h(0),h(1),...,h(L)},其中h(k)(k=0,1,...,L)代表灰度级k在区域Ri中所占比例。该区域的直方图二阶矩被定义为:
M i = Σ k = 0 L ( k - m ) 2 × h ( k ) - - - ( 4 )
其中m为区域Ri的平均灰度值。
(4)上下文特征C。令(Cxi,Cyi)为Ri的中心,Rj∈N(Ri)的中心为(Cxj,Cyj)。
Figure BDA0000081472010000095
连接(Cxi,Cyi)与(Cxj,Cyj),则形成以(Cxi,Cyi)为中心的星形拓扑结构,如图5所示,将整个平面划分为||N(Ri)||份,该拓扑结构较好地描述了N(Ri)之间相对于Ri的位置关系。用θ来表示两条直线间的夹角,则Ri的上下文特征可以描述为特
征向量 C i = { θ 1 , θ 2 , . . . , θ | | N ( R i ) | | } , 如图6所示。
从上述定义方式来看,上下文特征具有良好的旋转不变性,只要区域Ri和其相邻区域N(Ri)之间相对位置关系维持不变,则Ri的上下文特征具有稳定性。
综合起来,
Figure BDA0000081472010000102
其属性定义为vi={Fi,Ti,Mi,Ci}。
1.2,图中边属性定义
对于G中任意一条连接顶点vi和vj的边eij,其属性主要用来描述所连接两个区域Ri和Rj之间的邻接关系,以下分别从距离Cdis以及角度Ang两个方面来考虑。
(1)归一化的中心连线距离Cdis
令Ri的中心坐标为(Cxi,Cyi),Rj的中心坐标为(Cxj,Cyj),则
Cdis ij = ( Cx i - Cx j ) 2 + ( Cy i - Cy j ) 2 ImgH 2 + ImgW 2 - - - ( 5 )
其中ImgH和ImgW分别代表信封图像的高和宽。
(2)角度Ang
边eij的角度特征Ang指该边与其它所有与顶点vi或vj相连的边之间的夹角集合,如图7所示。假设Ei={eim|m=1,2,...,Ni,m≠j,m≠i}表示与顶点vi相连的边集,Ej={ejn|n=1,2,...,Nj,n≠i,n≠j}表示与顶点vj相连的边集,其中Ni和Nj分别表示与顶点vi及vj相连的边数,则eij的角度特征Ang定义如下,
Angij=Angi∪Angj                   (6)
其中,
Ang i = { θ e ij e i 1 , θ e ij e i 2 , . . . , θ e ij e im } , e im ∈ E i - - - ( 7 )
Ang j = { θ e ij e j 1 , θ e ij e j 2 , . . . , θ e ij e jn } , e jn ∈ E j - - - ( 8 )
θ e ij e im = arccos ( e ij · e im | e ij | × | e im | ) - - - ( 9 )
故图中边eij的属性定义为eij={Cdisij,Angij}。
2,图匹配算法
以下主要介绍本发明中采用的图匹配算法。
为计算两个图G=(V,E,μ,v)与G′=(V′,E′,μ′,v′)之间的相似度,采用基于最小权重的二分图匹配算法,虽然属于一种次优图匹配方法,即不保证得到最优解,但是通过大量实验证明,该方法在基本不影响匹配性能的前提下大大提高了时间效率。
2.1,顶点之间的距离
vi∈G与vi′∈G′之间的距离d(vi,vi′)定义为各个属性分量之间的距离和。
(1)属性F之间的距离dF
d F = | F i - F i ′ | F i + F i ′ - - - ( 10 )
(2)属性T之间的距离dT
d T = 1 - Π K = Ent , Con , Hom min ( K avgi , K avgi ′ ) min ( K vari , K vari ′ ) max ( K avgi , K avgi ′ ) max ( K vari , K vari ′ ) - - - ( 11 )
(3)属性M之间的距离dM
dM定义方法与dF相似, d M = | M i - M i ′ | M i + M i ′
(4)属性C之间的距离dC
采用Hausdorff距离计算dC,具体方法如下,
假定Ci={θ1,θ2,...,θp},Ci′={θ′1,θ′2,...,θ′p′},则
d C = max ( h ( C i , C i ′ ) , h ( C i ′ , C i ) ) Context _ MAX - - - ( 12 )
其中,
h ( C i , C i ′ ) = max θ ∈ C i min θ ′ ∈ C i ′ | θ - θ ′ | - - - ( 13 )
h ( C i ′ , C i ) = max θ ′ ∈ C i ′ min θ ∈ C i | θ ′ - θ | - - - ( 14 )
Context_MAX是两个顶点属性C之间可能取到的最大Hausdorff距离。
即vi∈G与vi′∈G之间的距离d(vi,vi′)定义如下,
d(vi,vi′)=dF+dT+dM+dC                    (15)
2.2,边之间的距离
边之间的距离定义为两条边各个属性分量之间的距离和。
与顶点之间距离计算方法类似,边之间的距离同样定义为各个属性分量之间的距离和,对于eij∈G和ei′j′∈G′,其距离为
d(eij,ei′j′)=dCdis+dAng                 (16)
其中dCdis表示Cdis属性之间的距离,采用与dF相似的定义方法。dAng表示Ang属性之间的距离,定义方法与dC类似。
(1)属性Cdis之间的距离dCdis
d Cdis = | Cdis ij - Cdis i ′ j ′ | | Cdis ij + Cdis i ′ j ′ |
(2)属性Ang之间的距离dAng
采用Hausdorff距离计算dAng,主要步骤如下:
假设Angij={θ1,θ2,...,θp},Angi′j′={θ′1,θ′2,...,θ′p′},则
d Ang = max ( h ( Ang ij , Ang i ′ j ′ ) , h ( Ang i ′ j ′ , Ang ij ) ) Ang _ MAX
其中,
h ( Ang ij , Ang i ′ j ′ ) = max θ ∈ Ang ij min θ ′ ∈ Ang i ′ j ′ | θ - θ ′ |
h ( Ang i ′ j ′ , Ang ij ) = max θ ′ ∈ Ang i ′ j ′ min θ ∈ Ang ij | θ ′ - θ |
Ang_MAX是两条边属性Ang之间可能取到的最大Hausdorff距离。
2.3,图之间的距离
采用一种基于最小权重的二分图匹配算法来计算两个图之间的距离,首先根据G=(V,E,μ,v)和G′=(V′,E′,μ′,v′)建立二分图BP,如图8所示,具体步骤如下,
(1)令 BP = ( U ‾ , W ‾ , E ‾ ) , 其中 U ‾ = V , W ‾ = V ′ , E ‾ = U ‾ × W ‾
Figure BDA0000081472010000137
令其权重 w ( e ‾ ii ′ ) = d ( v i , v i ′ )
基于二分图BP,运用Munkre算法获得具有最小权重的匹配,将该最小权重作为两个图之间的顶点距离DistNode
假设图G=(V,E,μ,v)与G′=(V′,E′,μ′,v′)中顶点数目分别为N和N′,则采用Munkre算法获得min(N,N′)对顶点对应关系,为了便于描述,定义0-1矩阵Z,大小为N×N′,即
Figure BDA0000081472010000139
基于矩阵Z可以获得两个图之间隐含的边匹配关系,主要分为以下四种情况来讨论:假设vi∈G,vj∈G及vi′∈G′,vj′∈G′,Z[i][i′]=1并且Z[j][j′]=1,
( 1 ) e ij ∈ E ∩ e i ′ j ′ ∈ E ′
( 2 ) e ij ∈ E ∩ e i ′ j ′ ∉ E ′
( 3 ) e ij ∉ E ∩ e i ′ j ′ ∈ E ′
( 4 ) e ij ∉ E ∩ e i ′ j ′ ∉ E ′
对于(1),采用2.2中所述方法计算边eij,ei′j′之间的距离d(eij,ei′j′)。
对于(4),令d(eij,ei′j′)=0。
对于(2)(3),令d(eij,ei′j′)=σ,其中σ为大于0的常数。
则两个图之间的边距离DistEdge定义为
Dist Edge = Σ a = 0 N Σ b = a + 1 N Σ a ′ = 0 N ′ Σ b ′ = a ′ + 1 N ′ Z [ a ] [ a ′ ] Z [ b ] [ b ′ ] d ( e ab , e a ′ b ′ ) - - - ( 18 )
此外,当两个图中顶点数目不同时,需要考虑额外的匹配代价Penal(G,G′),具体定义为,
Penal ( G , G ′ ) = fabs ( | | V | | - | | V ′ | | ) | | V | | + | | V ′ | | - - - ( 19 )
其中||·||表示图中顶点数目,fabs(·)为取绝对值操作。
则最终两个图G=(V,E,μ,v)和G′=(V′,E′,μ′,v′)之间的距离Dist(G,G′)定义如下:
Dist(G,G′)=DistNode(G,G′)+DistEdge(G,G′)+Penal(G,G′)(20)
3,信封图像检索系统
基于上述图匹配方法建立信封图像检索系统,预先构建数据库中所有图像的图表示形成图库,当查询图像被提交后,对查询图像进行同样处理并生成其图表示,依次与图库中所有图进行匹配,将最为相似即相应两个图之间距离最小的图像以及其相关信息作为查询结果返回。上述做法存在一个问题,当数据库中图像数目很大时,将查询图像和数据库中所有图像依次做匹配带来的时间开销将是不可忍受的。针对此问题,将检索过程分解为两个阶段:粗匹配与细匹配,具体流程如图9所示。在粗匹配阶段剔除大多数无关图像,获得与查询图像Q最相关的候选匹配集R。基于该候选匹配集R,再进一步进行细匹配,通常情况下该候选匹配集中图像数目远远小于数据库中图像总数目,所以大大减少了匹配次数,降低了时间复杂度。
3.1,粗匹配
在粗匹配阶段,主要解决的问题是如何高效地剔除数据库中与查询图像无关的信封图像。前面介绍的图匹配算法虽然准确率高,但是时间开销大,所以尝试用特征向量将图表示出来,这样图匹配问题就转化为了计算两个特征向量之间的距离,而后者可以运用统计模式识别中丰富的数学工具来解决,本文采用简单直观的欧式距离。
下面具体介绍如何用特征向量将图表示出来。
(1)对图库中的所有图按照顶点数目分类,并选取每一类的中心组成集合A={G1,G2,...,GJ},其中J表示类别总数。这里的“中心”定义为该图到其所属类中所有图的距离之和最小。
(2)任给图G  ,其特征向量表示为(Dist(G,G1),Dist(G,G2),...,Dist(G,GJ))。
该方法既结合了图在描述对象方面的优势,由于通过计算两个特征向量之间的距离来近似图匹配,故在节省时间开销方面也很明显。基于此方法,获得数据库中与查询图像最相关的图像组成候选匹配集R。
3.2,细匹配
在此阶段,查询图像需要依次和候选匹配集R中的每个图像进行匹配,采用前文第2标题部分中所述图匹配算法,最终将与查询图像最相似的图像及其相关信息返回。

Claims (1)

1.一种信封图像匹配方法,包括对信封图像进行高斯平滑滤波、边缘检测、二值化以及闭运算的预处理步骤,其特征在于,还包括以下步骤:
步骤A1,对所述信封图像进行分割,分割结果为Ω={R1,R2,...,RN},其中N表示区域总数,区域Ri的邻接区域为N(Ri),基于分割结果Ω构建该信封图像的图G=(V,E,μ,ν),其中V是顶点集,E是边集,μ:V→LV为顶点属性函数,ν:E→LE为边属性函数,其中LV和LE可以是任意类型的集合,图G中的顶点vi对应Ω中的区域Ri,图G中的任两个顶点vi及vj,其对应区域分别为Ri∈Ω及Rj∈Ω,vi和vj之间存在边eij的条件是Ri∈N(Rj)或者Rj∈N(Ri),图G顶点数目与区域总数相等,也为N,
对于图G中的顶点vi,vi∈V,根据描述习惯,记vi∈G,其属性定义为vi={Fi,Ti,Mi,Ci},
其中,Fi为前景像素比例,即区域Ri中前景像素占整个图像中前景像素的比例;
Ti为纹理特征向量,且
Ti={Entavg,Entvar,Conavg,Convar,Homavg,Homvar},
即计算区域Ri的四方向,包括0度、45度、90度以及180度的灰度共生矩阵Pj(j=1,2,3,4),其大小为S×S,基于每个Pj提取熵Ent、对比度Con和逆差距Hom三个特征:
Ent j = - Σ a = 0 S Σ b = 0 S P j ( a , b ) × log P j ( a , b ) - - - ( 1 )
Con j = - Σ a = 0 S Σ b = 0 S ( a - b ) 2 × P j ( a , b ) - - - ( 2 )
Hom j = - Σ a = 0 S Σ b = 0 S P j ( a , b ) 1 + ( a - b ) 2 - - - ( 3 )
对每个特征分别求四个方向的均值与方差,则纹理特征最终表示为特征向量Ti={Entavg,Entvar,Conavg,Convar,Homavg,Homvar};
Mi为矩特征,假定区域Ri的灰度级范围为[0-L],则其归一化后灰度直方图表示成Hi={h(0),h(1),...,h(L)},其中h(k)(k=0,1,...,L)代表灰度级k在区域Ri中所占比例,该区域的直方图二阶矩为:
M i = Σ k = 0 L ( k - m ) 2 × h ( k ) - - - ( 4 )
其中m为区域Ri的平均灰度值;
Ci为上下文特征,令(Cxi,Cyi)为Ri的中心,Rj∈N(Ri)的中心为(Cxj,Cyj),
Figure FDA00003520941000023
连接(Cxi,Cyi)与(Cxj,Cyj),则形成以(Cxi,Cyi)为中心的星形拓扑结构,将整个平面划分为||N(Ri)||份,该拓扑结构较好地描述了N(Ri)之间相对于Ri的位置关系,用θ来表示两条直线间的夹角,则Ri的上下文特征可以描述为特征向量
Figure FDA00003520941000024
对于图G中连接顶点vi和vj的边eij,其属性描述所连接两个区域Ri和Rj之间的邻接关系,边eij={Cdisij,Angij}
其中Cdisij为归一化的中心连线距离,
Cdis ij = ( Cx i - Cx j ) 2 + ( Cy i - Cy j ) 2 ImgH 2 + Img W 2 - - - ( 5 )
Ri的中心坐标为(Cxi,Cyi),Rj的中心坐标为(Cxj,Cyj),其中ImgH和ImgW分别代表信封图像的高和宽,
边eij的角度特征Ang指该边与其它所有与顶点vi或vj相连的边之间的夹角集合,设Ei={eim|m=1,2,...,Ni,m≠j,m≠i}表示与顶点vi相连的边集,Ej={ejn|n=1,2,...,Nj,n≠i,n≠j}表示与顶点vj相连的边集,其中Ni和Nj分别表示与顶点vi及vj相连的边数,则eij的角度特征Ang为:
Angij=Angi∪Angj    (6)
其中,
Ang i = { θ e ij e i 1 , θ e ij e i 2 , · · · · , θ e ij e im } , e im ∈ E i - - - ( 7 )
Ang j = { θ e ij e j 1 , θ e ij e j 2 , · · · , θ e ij e jn } , e jn ∈ E j - - - ( 8 )
θ e ij e im = arccos ( e ij · e im | e ij | × | e im | ) - - - ( 9 ) ;
A2,令图库中任一图,表示为G'=(V',E',μ',ν'),计算图G=(V,E,μ,ν)与G'=(V',E',μ',ν')之间的相似度,具体步骤为:
B1,计算vi∈G与vi'∈G'顶点之间的距离
d(vi,vi')=dF+dT+dM+dC    (15)
其中,
Fi之间的距离dF
d F = | F i - F i ′ | F i + F i ′ - - - ( 10 )
Ti之间的距离dT
d T = 1 - Π K = Ent , Con , Hom min ( K avgi , K avgi ′ ) min ( K vari , K var i ′ ) max ( K avgi , K avgi ′ ) max ( K vari , K vari ′ ) - - - ( 11 )
Mi之间的距离dM
d M = | M i - M i ′ | M i + M i ′
Ci之间的距离dC
采用Hausdorff距离计算dC,具体方法如下,
假定Ci={θ12,...,θp},Ci'={θ'1,θ'2,...,θ'p'},则
d C = max ( h ( C i , C i ′ ) , h ( C i ′ , C i ) ) Context _ MAX - - - ( 12 )
其中,
h ( C i , C i ′ ) = max θ ∈ C i max θ ′ ∈ C i ′ | θ - θ ′ | - - - ( 13 )
h ( C i ′ , C i ) = max θ ′ ∈ C i ′ min θ ∈ C i | θ ′ - θ | - - - ( 14 )
Context_MAX是两个顶点属性C之间取到的最大Hausdorff距离,即获得vi∈G与vi'∈G'之间的距离d(vi,vi')如下,
d(vi,vi')=dF+dT+dM+dC    (15)
B2,计算对于eij∈G和ei'j'∈G',边之间的距离为
d(eij,ei'j')=dCdis+dAng    (16)
其中dCdis表示Cdis属性之间的距离,dAng表示Ang属性之间的距离,
属性Cdis之间的距离dCdis
d Cdis = | Cdis ij - Cdis i ′ j ′ | | Cdis ij + Cdis i ′ j ′ |
属性Ang之间的距离dAng采用Hausdorff距离计算,主要步骤如下:
假设Angij={θ12,...,θp},Angi'j'={θ'1,θ'2,...,θ'p'},则
d Ang = max ( h ( A ng ij , Ang i ′ j ′ ) ) , h ( Ang i ′ j ′ , Ang ij ) Ang _ MAX
其中,
h ( Ang ij , Ang i ′ j ′ ) = max θ ∈ Ang ij min θ ′ ∈ Ang i ′ j ′ | θ - θ ′ |
h ( Ang i ′ j ′ , Ang ij ) = min θ ′ ∈ Ang i ′ j ′ min θ ∈ Ang ij | θ ′ - θ |
Ang_MAX是两条边属性Ang之间取到的最大Hausdorff距离;
B3,计算图之间的距离Dist(G,G')
根据G=(V,E,μ,ν)和G'=(V',E',μ',ν')建立二分图BP,具体为:令 BP = ( U ‾ , W ‾ , E ‾ ) , 其中 U ‾ = V , W ‾ = V ′ , E ‾ = U ‾ × W ‾ , e ‾ ii ′ ∈ E ‾ , 则令其权重为 w ( e ‾ ii ′ ) = d ( v i , v i ′ ) ,
基于二分图BP,运用Munkre算法获得具有最小权重的匹配,将该最小权重作为两个图之间的顶点距离DistNode
假设图G=(V,E,μ,ν)与G'=(V',E',μ',ν')中顶点数目分别为N和N',则采用Munkre算法获得min(N,N')对顶点对应关系,定义0-1矩阵Z,大小为N×N',即
Figure FDA00003520941000051
基于矩阵Z可以获得两个图之间隐含的边匹配关系,主要分为以下四种情况:假设vi∈G,vj∈G及vi'∈G',vj'∈G',Z[i][i']=1并且Z[j][j']=1,
对于eij∈E∩ei'j'∈E',d(eij,ei'j')值不变,
对于 e ij ∉ E ∩ e i ′ j ′ ∉ E ′ , 令d(eij,ei'j')=0
对于
Figure FDA000035209410000510
令d(eij,ei'j')=σ,其中σ为大于0的常数,
对于
Figure FDA000035209410000511
令d(eij,ei'j')=σ,其中σ为大于0的常数,
则G=(V,E,μ,ν)和G'=(V',E',μ',ν')之间的边距离DistEdge为:
Dist Edge = Σ a = 0 N Σ b = a + 1 N Σ a ′ = 0 N ′ Σ b ′ = a ′ + 1 N ′ Z [ a ] [ a ′ ] Z [ b ] [ b ′ ] d ( e ab , e a ′ b ′ ) - - - ( 18 )
当图G=(V,E,μ,ν)与G'=(V',E',μ',ν')中顶点数目不同时,额外的匹配代价Penal(G,G')为:
Penal ( G , G ′ ) = fabs ( | | V | | - | | V ′ | | ) | | V | | + | | V ′ | | - - - ( 19 )
其中||·||表示图中顶点数目,fabs(·)为取绝对值操作,
图G=(V,E,μ,ν)和G'=(V',E',μ',ν')之间的距离Dist(G,G')为:
Dist(G,G')=DistNode(G,G')+DistEdge(G,G')+Penal(G,G')(20),距离Dist(G,G')即为G=(V,E,μ,ν)和G'=(V',E',μ',ν')之间的相似度。
CN201110224869.0A 2011-08-05 2011-08-05 一种信封图像匹配方法 Active CN102289681B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110224869.0A CN102289681B (zh) 2011-08-05 2011-08-05 一种信封图像匹配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110224869.0A CN102289681B (zh) 2011-08-05 2011-08-05 一种信封图像匹配方法

Publications (2)

Publication Number Publication Date
CN102289681A CN102289681A (zh) 2011-12-21
CN102289681B true CN102289681B (zh) 2014-03-19

Family

ID=45336087

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110224869.0A Active CN102289681B (zh) 2011-08-05 2011-08-05 一种信封图像匹配方法

Country Status (1)

Country Link
CN (1) CN102289681B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810499B (zh) * 2014-02-25 2017-04-12 南昌航空大学 复杂背景下红外弱目标检测与跟踪的应用
CN105279508A (zh) * 2015-09-08 2016-01-27 哈尔滨工程大学 一种基于kap有向图模型的医学图像分类方法
CN105678778B (zh) * 2016-01-13 2019-02-26 北京大学深圳研究生院 一种图像匹配方法和装置
CN107622247B (zh) * 2017-09-26 2020-08-25 华东师范大学 一种快递运单的定位与提取方法
CN108768718B (zh) * 2018-05-23 2021-07-20 湖南女子学院 基于mRNA/miRNA节点的二分网络模块识别方法、系统及存储介质
CN108961240A (zh) * 2018-07-03 2018-12-07 北京邮电大学 爆炸装置电路板残片识别方法
CN109272541B (zh) * 2018-08-27 2023-10-24 温州大学激光与光电智能制造研究院 一种图像匹配方法、设备
CN109242009B (zh) * 2018-08-27 2023-08-08 厦门风云科技股份有限公司 一种图像匹配系统
CN109712043B (zh) * 2018-12-28 2021-03-19 杭州大拿科技股份有限公司 一种答案批改方法及装置
CN111144322A (zh) * 2019-12-28 2020-05-12 广东拓斯达科技股份有限公司 一种分拣方法、装置、设备和存储介质
CN111582163B (zh) * 2020-05-07 2020-12-25 北京理工大学 一种大规模人群位置变换方案生成方法
CN113496222B (zh) * 2021-09-09 2021-12-07 南方电网数字电网研究院有限公司 基于无标签图表数据的模式识别方法、装置和计算机设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6658168B1 (en) * 1999-05-29 2003-12-02 Lg Electronics Inc. Method for retrieving image by using multiple features per image subregion
CN201054150Y (zh) * 2006-12-15 2008-04-30 华南理工大学 一种邮政信封自动识别系统
CN101551823A (zh) * 2009-04-20 2009-10-07 浙江师范大学 一种综合多特征图像检索方法
CN101817001A (zh) * 2010-04-20 2010-09-01 上海邮政科学研究院 一种信封图像的查询方法
JP2011000533A (ja) * 2009-06-18 2011-01-06 Nec Corp 画像同定装置とこの画像同定装置を備えた書状物区分機、画像同定方法及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6658168B1 (en) * 1999-05-29 2003-12-02 Lg Electronics Inc. Method for retrieving image by using multiple features per image subregion
CN201054150Y (zh) * 2006-12-15 2008-04-30 华南理工大学 一种邮政信封自动识别系统
CN101551823A (zh) * 2009-04-20 2009-10-07 浙江师范大学 一种综合多特征图像检索方法
JP2011000533A (ja) * 2009-06-18 2011-01-06 Nec Corp 画像同定装置とこの画像同定装置を備えた書状物区分機、画像同定方法及びプログラム
CN101817001A (zh) * 2010-04-20 2010-09-01 上海邮政科学研究院 一种信封图像的查询方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
P.Liu等.An Effective Iamge Retrieval Method Based on Color and Texture Combined Features.《Third International Conference on Intelligent Information Hiding and Multimedia Signal Processing》.2007,169-172. *
P.S.Hiremath等.Content Based Image Retrieval Using Color,Texture and Shape Features.《15th International conference On Advanced Computing and Communications》.2007,780-784. *
P.S.Hiremath等.ContentBasedImageRetrievalUsingColor Texture and Shape Features.《15th International conference On Advanced Computing and Communications》.2007
张新晨等.利用图像分析实现函件自动登单处理系统.《武汉大学学报(理学版)》.2002,第48卷(第1期),116-120. *

Also Published As

Publication number Publication date
CN102289681A (zh) 2011-12-21

Similar Documents

Publication Publication Date Title
CN102289681B (zh) 一种信封图像匹配方法
Gu et al. Recognition using regions
CN101593205B (zh) 基于视频的三维模型检索方法
CN107563377A (zh) 一种利用边缘和文字区域的证件关键区域检测定位方法
WO2021082168A1 (zh) 一种场景图像中特定目标对象的匹配方法
CN105809651B (zh) 基于边缘非相似性对比的图像显著性检测方法
CN105956560A (zh) 一种基于池化多尺度深度卷积特征的车型识别方法
CN105528575B (zh) 基于上下文推理的天空检测方法
CN106846404A (zh) 一种基于工件内外轮廓几何特征的快速位姿检测方法
CN102508917B (zh) 部分特征图像的多维度目标快速鲁棒检索定位方法
CN101996245B (zh) 一种图形对象的形状特征描述与检索方法
CN101847163A (zh) 一种多特征融合的外观设计专利图像检索方法
CN103927511A (zh) 基于差异特征描述的图像识别方法
Li et al. Place recognition based on deep feature and adaptive weighting of similarity matrix
Arican et al. An RGB-D descriptor for object classification
CN106529407A (zh) 一种车载指纹识别方法
CN110852327A (zh) 图像处理方法、装置、电子设备及存储介质
CN111401380A (zh) 一种基于深度特征增强和边缘优化的rgb-d图像语义分割方法
CN103399863B (zh) 基于边缘方向差特征袋的图像检索方法
CN113989340A (zh) 一种基于分布的点云配准方法
CN111104924B (zh) 一种识别低分辨率商品图像的处理算法
Lin et al. Scale invariant point feature (SIPF) for 3D point clouds and 3D multi-scale object detection
CN112329647A (zh) 基于U-Net神经网络的土地利用类型识别方法
Han et al. Accurate and robust vanishing point detection method in unstructured road scenes
Farhani et al. Object recognition approach based on generalized hough transform and color distribution serving in generating arabic sentences

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20190903

Address after: 200062 Putuo District, Zhongshan North Road, No. 3185,

Patentee after: China Post Science and Technology Co., Ltd.

Address before: 200062 Putuo District, Zhongshan North Road, No. 3185,

Patentee before: Shanghai Post Science Inst.

TR01 Transfer of patent right
CP03 Change of name, title or address

Address after: No. 3185, Zhongshan North Road, Putuo District, Shanghai 200333

Patentee after: China Post Technology Co.,Ltd.

Address before: 200062 No. 3185, Putuo District, Shanghai, Zhongshan North Road

Patentee before: CHINA POST SCIENCE AND TECHNOLOGY Co.,Ltd.

CP03 Change of name, title or address