CN104766096A - 一种基于多尺度全局特征和局部特征的图像分类方法 - Google Patents

一种基于多尺度全局特征和局部特征的图像分类方法 Download PDF

Info

Publication number
CN104766096A
CN104766096A CN201510186133.7A CN201510186133A CN104766096A CN 104766096 A CN104766096 A CN 104766096A CN 201510186133 A CN201510186133 A CN 201510186133A CN 104766096 A CN104766096 A CN 104766096A
Authority
CN
China
Prior art keywords
pixel
image
represent
marking area
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510186133.7A
Other languages
English (en)
Other versions
CN104766096B (zh
Inventor
路通
秦龙飞
梁国柱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN201510186133.7A priority Critical patent/CN104766096B/zh
Publication of CN104766096A publication Critical patent/CN104766096A/zh
Application granted granted Critical
Publication of CN104766096B publication Critical patent/CN104766096B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于多尺度全局特征和局部特征的图像分类方法,该方法利用图像中的文本信息,提取有效显著区域并计算显著区域中的颜色特征和空间分布特征,利用小波图像金字塔得到多尺度全局特征,利用四分树算法得到局部特征;最终结合多尺度全局特征和局部特征对图像进行分类,该方法的分类正确率可以到达88%。通过分别对分类前后的图像进行文本检测和识别的对比实验发现,图像分类能够有效提高图像中文本信息的检测与识别。

Description

一种基于多尺度全局特征和局部特征的图像分类方法
技术领域
本发明涉及计算机图像分类方法,特别是一种基于多尺度全局特征和局部特征的图像分类方法。
背景技术
图像分类一直是计算机图像领域的一个基本问题,特别是随着互联网的急速发展,大量的无分类的图像出现在网络中,给图像的快速检索及建立在分类之上的应用带来了极大挑战。
目前为止,常见的图像分类技术包括基于色彩特征的分类技术,基于纹理特征的分类技术,基于形状特征的分类技术和基于空间关系的分类技术。基于色彩特征的分类技术假设每种物体都有其特有的色彩特征,由于颜色直方图具有简单且对旋转和缩放不敏感等特征,得到了广泛的关注;基于纹理的图像分类技术,经历了从灰度共生矩阵到小波变换的过程,达到了一定分类效果;基于形状分析的图像分类技术大多围绕着形状的轮廓特征和形状的区域特征,更常用的办法是采用区域特征和边界特征相结合的形式进行形状相似性分析;基于空间关系的图像分类技术,由于利用图像中对象间的位置空间关系区别图像,符合人们识别图像的习惯,所以近些年许多研究人员从图像中对象空间位置关系出发着手分析,虽然起到过一定作用,但由于它们都是采用对象的最小外接矩形来表示一个对象空间位置,这对于矩形对象来说是比较合适的,但是当两个对象是不规则形状,且它们在空间关系上是分离时,它们的外接矩形却存在着某种包含和交叠,结果出现对这些对象空间关系的错误表示。
虽然目前图像分类的方法很多,但大多没有考虑图像中的文本特征对分类起到的作用。同时,对整个图像提取特征不但不是必须的而且需要花费大量计算时间。
发明内容
发明目的:本发明所要解决的问题是针对目前图像分类技术的不足,提供一种基于多尺度全局特征和局部特征的图像分类方法,特别是利用图像中的文本信息提取有效显著区域并计算显著区域中的颜色特征和空间分布特征,利用小波图像金字塔得到多尺度全局特征,利用四分树算法得到局部特征,最后结合多尺度全局特征和局部特征对图像进行分类。
为了解决上述问题,本发明公开了一种基于多尺度全局特征和局部特征的图像分类方法,包括以下步骤:
将待分类图像数据库中的每张原始图像I作为输入,执行步骤1~步骤11:
步骤1:利用MATLAB软件提供的小波图像金字塔算法输入原始图像I,输出五种不同尺度的图像,每种尺度的图像作为下一步的输入图像,执行步骤2~步骤9;五种不同尺度的图像处理完毕后执行步骤10;
步骤2:计算输入图像的灰度图像。其中输入图像属于RGB颜色空间,每个像素由红,绿,蓝三个颜色值决定,每种颜色取值范围0~255。计算后的灰度图像每个像素由一个灰度值决定,灰度值取值范围0~255;
步骤3:利用MATLAB软件提供的Canny边缘和Sobel边缘计算方法,计算灰度图像的Canny边缘图像和Sobel边缘图像。其中,Canny边缘图像和Sobel边缘图像都属于二值图像,每个像素取值0或1;
步骤4:分别计算Canny边缘图像的特征向量场和Sobel边缘图像的特征向量场。计算得到的特征向量场在每个像素处,其值为一个向量,表示该像素处场值的大小和方向;
步骤5:分别计算Canny特征向量场的显著区域和Sobel特征向量场的显著区域。其中,显著区域表现为二值图像,像素值为0表示该像素不属于显著区域,像素值为1表示该像素属于显著区域;
步骤6:计算Canny显著区域和Sobel显著区域的交集,得到这两种显著区域的重合区域,过滤后作为最终显著区域;
步骤7:提取最终显著区域的空间分布特征;
步骤8:根据最终显著区域,保留其对应位置处输入图像的像素值,提取这些像素值的颜色特征。颜色特征包括RGB颜色特征,HSV颜色特征和灰度颜色特征;
步骤9:合并步骤7得到的空间分布特征和步骤8得到的颜色特征,得到原始图像的全局特征。
步骤10:将原始图像I用四分树算法四等分为四个区域,每一个区域作为输入图像,执行步骤2~步骤8,得到输入图像的空间分布特征和颜色特征,合并空间分布特征和颜色特征,得到原始图像的局部特征;
步骤11:整合步骤9和步骤10得到的原始图像的全局特征和局部特征,作为图像的分类特征;
步骤12:选择逻辑回归分类器,对数据库中的图像进行分类。
本发明步骤4中,计算Canny边缘图像的特征向量场和Sobel边缘图像的特征向量场包括以下步骤,定义能量函数ε,通过最小化能量函数ε计算Canny边缘图像的特征向量场gCanny
ϵ = ∫ ∫ α · ( u x 2 + u y 2 + v x 2 + v y 2 ) + ( 1 - α ) | ▿ F Canny | 2 | g Canny - ▿ f Canny | 2 dxdy ,
其中,ε表示能量函数的值,(x,y)表示像素坐标,fCanny(x,y)表示Canny边缘图像,表示Canny边缘图像的梯度,gCanny=(u(x,y),v(x,y)),表示待计算的Canny边缘图像特征向量场,u(x,y)和v(x,y)分别是像素坐标(x,y)处特征向量场第一分量和第二分量的值,ux表示第一分量u(x,y)对像素坐标x的偏导数,uy表示第一分量u(x,y)对像素坐标y的偏导数,vx表示第二分量v(x,y)对像素坐标x的偏导数,vy表示第二分量v(x,y)对像素坐标y的偏导数,α表示归一化参数,取值范围0~1,其值可根据图像中的噪声数量设置,本发明专利中,设置α=0.4。
定义能量函数ξ,通过最小化能量函数ξ计算Sobel边缘图像的特征向量场gSobel
ξ = ∫ ∫ α · ( u x 2 + u y 2 + v x 2 + v y 2 ) + ( 1 - α ) | ▿ f Sobel | 2 | g Sobel - ▿ f Sobel | 2 dxdy ,
其中,ξ表示能量函数的值,(x,y)表示像素坐标,fSobel(x,y)表示Sobel边缘图像,表示边缘图像的梯度,gSobel=(u(x,y),v(x,y)),表示待计算的Sobel边缘图像特征向量场,u(x,y)和v(x,y)分别是像素坐标(x,y)处特征向量场第一分量和第二分量值,ux表示第一分量u(x,y)对像素坐标x的偏导数,uy表示第一分量u(x,y)对像素坐标y的偏导数,vx表示第二分量v(x,y)对像素坐标x的偏导数,vy表示第二分量v(x,y)对像素坐标y的偏导数,α表示归一化参数,取值范围0~1,其值根据图像中的噪声数量设置,本发明专利中,设置α=0.4。
本发明步骤5中,在特征向量场中,显著区域的计算可以通过计算显著像素点得到。如果像素P属于显著区域,其坐标为(x,y),当且仅当以下四个不等式至少有一个成立,则判定像素P属于显著区域:
g(x,y)·g(x+1,y)<θ,
g(x,y)·g(x-1,y)<θ,
g(x,y)·g(x,y+1)<θ,
g(x,y)·g(x,y-1)<θ,
其中,g(x,y)表示像素坐标(x,y)处的特征向量,g(x-1,y)表示像素坐标(x-1,y)处的特征向量,g(x,y+1)表示像素坐标(x,y+1)处的特征向量,g(x,y-1)表示像素坐标(x,y-1)处的特征向量。g(x,y)·g(x+1,y)表示特征向量g(x,y)与特征向量g(x+1,y)的点积,θ=π/4,表示一个阈值。
本发明步骤6中,为了得到最终的显著区域,需要对Canny显著区域和Sobel显著区域求交集然后过滤掉包含像素小于一定值得显著区域,得到最终显著区域。C={cm}表示计算得到的Canny显著区域,每个元素cm表示一个连通分量,1≤m≤NC,NC表示Canny显著区域中连通分量的个数;S={sn}表示Sobel显著区域,每个元素sn表示一个连通分量,1≤n≤NS,NS表示Sobel显著区域中连通分量的个数;
首先,对两种连通分量过滤,保留每个连通分量中包含像素点个数大于ρ的连通分量,其中ρ=10。即所保留的连通分量必须满足以下条件:
|cm|≥ρ,
|sn|≥ρ,
其中,|cm|表示连通分量cm包含像素点个数,|sn|表示连通分量sn包含像素点个数。
过滤后,求两种显著区域的交集,表示为C∩S。像素P∈C∩S,当且仅当P∈C且p∈S。最后,对交集C∩S再做一次同上的过滤,作为最终的显著区域。
本发明步骤7中,显著区域空间分布特征的计算包括以下步骤:
首先计算最终显著区域中的四种顶点,这四种顶点分别是单支顶点,普通顶点,三路交叉点和十字交叉点。CONP表示像素P所在的连通区域,ADJP表示像素P的邻接像素,CONP与ADJP求交后,所包含像素点的数目为1表示单支顶点,所包含的像素点数目为2表示普通顶点,所包含的像素点数目为3表示三路交叉点,所包含的像素点数目为4表示十字交叉点,如下所示:
利用动态规划算法计算单支顶点间的测地距离,本发明中利用MATLAB提供的动态规划之最短路径算法求解。像素点是两个单支顶点,则像素点之间的测地距离EDk,h可表示为:
ED k , h = NGD ( P End k , P End h ) ,
其中,表示单支顶点之间的测地距离,1≤Endk,Endh≤Nend,Nend表示单支顶点的个数;
计算单支顶点之间测地距离均值和方差:
Mean ED = 1 N end Σ End k = 1 N end Σ End h = 1 End k ED k , h ,
Var ED = 1 N end Σ End k = 1 N end Σ End h = 1 End k ( ED k , h - Mean ED ) 2 ,
其中,MeanED表示单支顶点之间测地距离的均值,VarED表示单支顶点之间测地距离的方差。
利用动态规划算法计算普通顶点间的测地距离,本发明中利用MATLAB提供的动态规划之最短路径算法求解。像素点是两个普通顶点,则像素点之间的测地距离PDk,n可表示为:
PD k , h = NGD ( P Pixel k , P Pixel h ) ,
其中,表示普通顶点之间的测地距离,1≤Pixelk,Pixeln≤NPixel,NPixel表示普通顶点的个数;
计算普通顶点之间测地距离均值和方差:
Mean PD = 1 N Pixel Σ Pixel k = 1 N Pixel Σ Pixel h = 1 Pixel k PD k , h ,
Var PD = 1 N Pixel Σ Pixel k = 1 N Pixel Σ Pixel h = 1 Pixel k ( PD k , h - Mean PD ) 2 ,
其中,MeanPD表示普通顶点之间测地距离的均值,VarPD表示普通顶点之间测地距离的方差。
利用动态规划算法计算三路交叉点间的测地距离,本发明中利用MATLAB提供的动态规划之最短路径算法求解。像素点是两个三路交叉点,则像素点之间的测地距离JDk,h可表示为:
JD k , h = NGD ( P Junc k , P Junc h ) ,
其中,表示三路交叉点之间的测地距离,1≤Jumck,Junch≤NJunc,NJunc表示三路交叉点的个数;
计算三路交叉点之间测地距离均值和方差:
Mean JD = 1 N Junc Σ Junc k = 1 N Junc Σ Junc h = 1 Junc k JD k , h ,
Var JD = 1 N Junc Σ Junc k = 1 N Junc Σ Junc h = 1 Junc k ( JD k , h - Mean JD ) 2 ,
其中,MeanJD表示三路交叉点之间测地距离的均值,VarJD表示三路交叉点之间测地距离的方差。
利用动态规划算法计算十字交叉点间的测地距离,本发明中利用MATLAB提供的动态规划之最短路径算法求解。像素点是两个十字交叉点,则像素点之间的测地距离IDk,h可表示为:
ID k , h = NGD ( P Inter k , P Inter h ) ,
其中,表示十字交叉点之间的测地距离,1≤Interk,Interh≤NInter,NInter表示十字交叉点的个数;
计算十字交叉点之间测地距离均值和方差:
Mean ID = 1 N Inter Σ Inter k = 1 N Inter Σ Inter h = 1 Inter k ID k , h ,
Var ID = 1 N Inter Σ Inter k = 1 N inter Σ Inter h = 1 Inter k ( ID k , h - Mean ID ) 2 ,
其中,MeanID表示十字交叉点之间测地距离的均值,VarID表示十字交叉点之间测地距离的方差。
最终得到8个特征作为最终显著区域的空间分布特征,分别是单支顶点之间测地距离的均值和方差,普通顶点单支顶点之间测地距离的均值和方差,三路交叉点之间测地距离的均值和方差,十字交叉点之间测地距离的均值和方差;
本发明步骤8中,显著区域颜色特征的计算包括以下步骤:
首先,根据最终显著区域对应的输入图像位置,可以得到对应位置处的RGB颜色值,统计RGB每个颜色通道值的分布,将每个通道的取值范围0~255平均划分为10个区间,统计每个区间内像素点的个数占总像素个数的比例,可以得到30维的RGB特征;
然后,将RGB颜色空间转换为HSV颜色空间,得到对应位置处的HSV颜色值,统计HSV每个通道值得分布,将每个通道的取值范围0~255平均划分为10个区间,统计每个区间内像素点的个数占总像素个数的比例,得到30维的HSV特征;
最后,将RGB颜色空间转换为灰度空间,得到对应位置处的灰度颜色值,将灰度值的取值范围0~255平均划分为10个区间,统计每个区间内像素点的个数占总像素个数的比例,得到10维灰度特征,最终得到90维颜色特征。
有益效果:本发明是一种基于多尺度全局特征和局部特征的图像分类方法,特别是利用图像中的文本信息提取有效显著区域并计算显著区域中的颜色特征和空间分布特征,利用小波图像金字塔得到多尺度全局特征,利用四分树算法得到局部特征,最后结合多尺度全局特征和局部特征对图像进行分类。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述和/或其他方面的优点将会变得更加清楚。
图1为本发明流程图。
图2为本发明提出的颜色特征和空间分布特征的计算流程。
图3表示输入的原始图像。
图4表示输入图像的边缘图像。
图5表示输入图像的特征向量场。
图6表示输入图像的显著区域。
图7表示得到的最终显著区域。
图8表示最终显著区域对应的原始图像。
具体实施方式:
本发明所述的基于多尺度全局特征和局部特征的图像分类方法的基本出发点是提取图像显著区域的颜色特征和空间分布特征,进而利用小波图像金字塔和四叉树算法得到全局特征和局部特征进行图像分类。
实施例
下面结合图1和图2对本发明做更加详细的解释:
如图3所示(由于本发明的特殊性,不可避免的采用灰度照片展示处理效果),表示输入的原始图像。将待分类图像数据库中的每张原始图像I作为输入,执行步骤1~步骤11:
步骤1:利用MATLAB软件提供的小波图像金字塔算法,输入原始图像Iw×h,输出五种不同尺度的图像I0 w×h,I1 w/2×h/1,I2 w/4×h/4,I3 w/8×h/8,I4 w/16×h/16,每种尺度的图像作为下一步的输入图像,执行步骤2~步骤9,其中,w表示原始图像的宽度,h表示原始图像的高度,输入图像I′是五种不同尺度图像中的任意一种;
步骤2:计算输入图像的灰度图像。其中输入图像属于RGB颜色空间,每个像素由红,绿,蓝三个颜色值决定,每种颜色取值范围0~255。计算后的灰度图像每个像素由一个灰度值决定,灰度值取值范围0~255;
步骤3:利用MATLAB软件提供的Canny边缘和Sobel边缘计算方法,计算灰度图像的Canny边缘图像和Sobel边缘图像。如图4所示,图4中(a)表示输入图像的Canny边缘图像,图4中(b)表示输入图像的Sobel边缘图像。
其中,Canny边缘图像和Sobel边缘图像都属于二值图像,每个像素取值0或1;
步骤4:分别计算Canny边缘图像的梯度向量场和Sobel边缘图像的梯度向量场。如图5所示(由于本发明的特殊性,不可避免的采用灰度照片展示处理效果),图5中(a)表示输入图像的Canny特征向量场,图5中(b)表示输入图像的Sobel特征向量场。
计算得到的梯度向量场在每个像素处,其值为一个向量,表示该像素处场值的大小和方向。定义能量函数ε,通过最小化能量函数ε计算Canny边缘图像的特征向量场gCanny
ϵ = ∫ ∫ α · ( u x 2 + u y 2 + v x 2 + v y 2 ) + ( 1 - α ) | ▿ F Canny | 2 | g Canny - ▿ f Canny | 2 dxdy ,
其中,ε表示能量函数的值,(x,y)表示像素坐标,fCanny(x,y)表示Canny边缘图像,表示Canny边缘图像的梯度,gCanny=(u(x,y),v(x,y)),表示待计算的Canny边缘图像特征向量场,u(x,y)和v(x,y)分别是像素坐标(x,y)处特征向量场第一分量和第二分量的值,ux表示第一分量u(x,y)对像素坐标x的偏导数,uy表示第一分量u(x,y)对像素坐标y的偏导数,vx表示第二分量v(x,y)对像素坐标x的偏导数,uy表示第二分量v(x,y)对像素坐标y的偏导数,α表示归一化参数,取值范围0~1,其值可根据图像中的噪声数量设置,本发明专利中,设置α=0.4。
定义能量函数ξ,通过最小化能量函数ξ计算Sobel边缘图像的特征向量场gSobel
ξ = ∫ ∫ α · ( u x 2 + u y 2 + v x 2 + v y 2 ) + ( 1 - α ) | ▿ f Sobel | 2 | g Sobel - ▿ f Sobel | 2 dxdy ,
其中,ξ表示能量函数的值,(x,y)表示像素坐标,fSobel(x,y)表示Sobel边缘图像,表示边缘图像的梯度,gSobel=(u(x,y),v(x,y)),表示待计算的Sobel边缘图像特征向量场,u(x,y)和v(x,y)分别是像素坐标(x,y)处特征向量场第一分量和第二分量值,ux表示第一分量u(x,y)对像素坐标x的偏导数,uy表示第一分量u(x,y)对像素坐标y的偏导数,vx表示第二分量v(x,y)对像素坐标x的偏导数,vy表示第二分量v(x,y)对像素坐标y的偏导数,α表示归一化参数,取值范围0~1,其值根据图像中的噪声数量设置,本发明专利中,设置α=0.4。
步骤5:分别计算Canny特征向量场的显著区域和Sobel特征向量场的显著区域。其中,显著区域表现为二值图像,像素值为0表示该像素不属于显著区域,像素值为1表示该像素属于显著区域。如果像素P属于显著区域,其坐标为(x,y),当且仅当以下四个不等式至少有一个成立,则判定像素P属于显著区域:
g(x,y)·g(x+1,y)<θ,
g(x,y)·g(x-1,y)<θ,
g(x,y)·g(x,y+1)<θ,
g(x,y)·g(x,y-1)<θ,
其中,g(x,y)表示像素坐标(x,y)处的特征向量,g(x-1,y)表示像素坐标(x-1,y)处的特征向量,g(x,y+1)表示像素坐标(x,y+1)处的特征向量,g(x,y-1)表示像素坐标(x,y-1)处的特征向量。g(x,y)·g(x+1,y)表示特征向量g(x,y)与特征向量g(x+1,y)的点积,θ=π/4,表示一个阈值。如图6所示,图6中(a)表示输入图像的Canny显著区域,图6中(b)表示输入图像的Sobel显著区域。
步骤6:计算Canny显著区域和Sobel显著区域的交集,得到这两种显著区域的重合区域,过滤后作为最终显著区域。C={cm}表示计算得到的Canny显著区域,每个元素cm表示一个连通分量,1≤m≤NC,NC表示Canny显著区域中连通分量的个数;S={sn}表示Sobel显著区域,每个元素sn表示一个连通分量,1≤n≤NS,NS表示Sobel显著区域中连通分量的个数;
首先,对两种连通分量过滤,保留每个连通分量中包含像素点个数大于ρ的连通分量,其中ρ=10。即所保留的连通分量必须满足以下条件:
|cm|≥ρ,
|sn|≥ρ,
其中,|cm|表示连通分量cm包含像素点个数,|sn|表示连通分量sn包含像素点个数。
过滤后,求两种显著区域的交集,表示为C∩S。像素P∈C∩S,当且仅当P∈C且P∈S。最后,对交集C∩S再做一次同上的过滤,作为最终的显著区域。如图7所示,表示经步骤6得到的最终显著区域。
步骤7:提取最终显著区域的空间分布特征。包括以下步骤:
首先计算最终显著区域中的四种顶点,这四种顶点分别是单支顶点,普通顶点,三路交叉点和十字交叉点。CONP表示像素P所在的连通区域,ADJP表示像素P的邻接像素,CONP与ADJP求交后,所包含像素点的数目为1表示单支顶点,所包含的像素点数目为2表示普通顶点,所包含的像素点数目为3表示三路交叉点,所包含的像素点数目为4表示十字交叉点,如下所示:
利用动态规划算法计算单支顶点间的测地距离,本发明中利用MATLAB提供的动态规划之最短路径算法求解。像素点是两个单支顶点,则像素点之间的测地距离EDk,h可表示为:
ED k , h = NGD ( P End k , P End h ) ,
其中,表示单支顶点之间的测地距离,1≤Endk,Endh≤Nend,Nend表示单支顶点的个数;
计算单支顶点之间测地距离均值和方差:
Mean ED = 1 N end Σ End k = 1 N end Σ End h = 1 End k ED k , h ,
Var ED = 1 N end Σ End k = 1 N end Σ End h = 1 End k ( ED k , h - Mean ED ) 2 ,
其中,MeanED表示单支顶点之间测地距离的均值,VarED表示单支顶点之间测地距离的方差。
利用动态规划算法计算普通顶点间的测地距离,本发明中利用MATLAB提供的动态规划之最短路径算法求解。像素点是两个普通顶点,则像素点之间的测地距离PDk,h可表示为:
PD k , h = NGD ( P Pixel k , P Pixel h ) ,
其中,表示普通顶点之间的测地距离,1≤Pixelk,Pixelh≤NPixel,NPixel表示普通顶点的个数;
计算普通顶点之间测地距离均值和方差:
Mean PD = 1 N Pixel Σ Pixel k = 1 N Pixel Σ Pixel h = 1 Pixel k PD k , h ,
Var PD = 1 N Pixel Σ Pixel k = 1 N Pixel Σ Pixel h = 1 Pixel k ( PD k , h - Mean PD ) 2 ,
其中,MeanPD表示普通顶点之间测地距离的均值,VarPD表示普通顶点之间测地距离的方差。
利用动态规划算法计算三路交叉点间的测地距离,本发明中利用MATLAB提供的动态规划之最短路径算法求解。像素点是两个三路交叉点,则像素点之间的测地距离JDk,h可表示为:
JD k , h = NGD ( P Junc k , P Junc h ) ,
其中,表示三路交叉点之间的测地距离,1≤Junck,Junch≤NJunc,NJunc表示三路交叉点的个数;
计算三路交叉点之间测地距离均值和方差:
Mean JD = 1 N Junc Σ Junc k = 1 N Junc Σ Junc h = 1 Junc k JD k , h ,
Var JD = 1 N Junc Σ Junc k = 1 N Junc Σ Junc h = 1 Junc k ( JD k , h - Mean JD ) 2 ,
其中,MeanJD表示三路交叉点之间测地距离的均值,VarJD表示三路交叉点之间测地距离的方差。
利用动态规划算法计算十字交叉点间的测地距离,本发明中利用MATLAB提供的动态规划之最短路径算法求解。像素点是两个十字交叉点,则像素点之间的测地距离IDk,h可表示为:
ID k , h = NGD ( P Inter k , P Inter h ) ,
其中,表示十字交叉点之间的测地距离,1≤Interk,Interh≤NInter,NInter表示十字交叉点的个数;
计算十字交叉点之间测地距离均值和方差:
Mean ID = 1 N Inter Σ Inter k = 1 N Inter Σ Inter h = 1 Inter k ID k , h ,
Var ID = 1 N Inter Σ Inter k = 1 N inter Σ Inter h = 1 Inter k ( ID k , h - Mean ID ) 2 ,
其中,MeanID表示十字交叉点之间测地距离的均值,VarID表示十字交叉点之间测地距离的方差。
最终得到8个特征作为最终显著区域的空间分布特征,分别是单支顶点之间测地距离的均值和方差,普通顶点单支顶点之间测地距离的均值和方差,三路交叉点之间测地距离的均值和方差,十字交叉点之间测地距离的均值和方差;
步骤8:根据最终显著区域,保留其对应位置处输入图像的像素值,提取这些像素值的颜色特征。颜色特征包括RGB颜色特征,HSV颜色特征和灰度颜色特征。具体步骤包括:
首先,根据最终显著区域对应的输入图像位置,可以得到对应位置处的RGB颜色值,统计RGB每个颜色通道值的分布,将每个通道的取值范围0~255平均划分为10个区间,统计每个区间内像素点的个数占总像素个数的比例,可以得到30维的RGB特征;
然后,将RGB颜色空间转换为HSV颜色空间,得到对应位置处的HSV颜色值,统计HSV每个通道值得分布,将每个通道的取值范围0~255平均划分为10个区间,统计每个区间内像素点的个数占总像素个数的比例,得到30维的HSV特征;
最后,将RGB颜色空间转换为灰度空间,得到对应位置处的灰度颜色值,将灰度值的取值范围0~255平均划分为10个区间,统计每个区间内像素点的个数占总像素个数的比例,得到10维灰度特征,最终得到90维颜色特征。如图8所示(由于本发明的特殊性,不可避免的采用灰度照片展示处理效果),表示最终显著区域对应的原始图像。
步骤9:合并步骤7得到的空间分布特征和步骤8得到的颜色特征,得到原始图像的全局特征。
步骤10:将原始图像I四等分,四等分具体指将原始图像I平均分成四部分,四部分分别是原始图像的左上部分,右上部分,左下部分,右下部分。每一个部分作为输入图像,执行步骤2~步骤8,得到输入图像的空间分布特征和颜色特征,合并输入图像的空间分布特征和颜色特征,得到原始图像的局部特征。
步骤11:整合全局特征和局部特征。由五种尺度的图像得到的特征视为全局特征,由四等分后的图像得到的特征视为局部特征。将局部特征追加到全局特征末尾,形成原始输入图像特征;
步骤12:选择逻辑回归分类器,对数据库中的图像进行分类。
本发明提供了一种基于多尺度全局特征和局部特征的图像分类方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。

Claims (6)

1.一种基于多尺度全局特征和局部特征的图像分类方法,其特征在于,包括以下步骤:
将待分类图像数据库中的每张原始图像I作为输入,执行步骤1~步骤11:
步骤1:利用小波图像金字塔算法输入原始图像I,输出五种不同尺度的图像,每种尺度的图像作为下一步的输入图像,执行步骤2~步骤9,五种不同尺度的图像处理完毕后执行步骤10;
步骤2:计算输入图像的灰度图像,其中输入图像属于RGB颜色空间,每个像素由红,绿,蓝三个颜色值决定,每种颜色取值范围0~255,计算后的灰度图像每个像素由一个灰度值决定,灰度值取值范围0~255;
步骤3:计算灰度图像的Canny边缘图像和Sobel边缘图像,其中,Canny边缘图像和Sobel边缘图像都属于二值图像,每个像素取值0或1;
步骤4:分别计算Canny边缘图像的特征向量场和Sobel边缘图像的特征向量场,计算得到的特征向量场在每个像素处,其值为一个向量,表示该像素处场值的大小和方向;
步骤5:分别计算Canny特征向量场的显著区域和Sobel特征向量场的显著区域,其中,显著区域表现为二值图像,像素值为0表示该像素不属于显著区域,像素值为1表示该像素属于显著区域;
步骤6:计算Canny显著区域和Sobel显著区域的交集,得到这两种显著区域的重合区域,过滤后作为最终显著区域;
步骤7:提取最终显著区域的空间分布特征;
步骤8:根据最终显著区域,保留其对应位置处输入图像的像素值,提取这些像素值的颜色特征,颜色特征包括RGB颜色特征,HSV颜色特征和灰度颜色特征,RGB颜色指红色Red,绿色Green和蓝色Blue首字母缩写,HSV颜色指色调Hue,饱和度Saturation和亮度Value首字母缩写;
步骤9:合并步骤7得到的空间分布特征和步骤8得到的颜色特征,得到原始图像的全局特征;
步骤10:将原始图像I用四分树算法四等分为四个区域,每一个区域作为输入图像,执行步骤2~步骤8,得到输入图像的空间分布特征和颜色特征,合并空间分布特征和颜色特征,得到原始图像的局部特征;
步骤11:整合步骤9和步骤10得到的原始图像的全局特征和局部特征,作为图像的分类特征;
步骤12:选择逻辑回归分类器,对待分类图像数据库中的图像进行分类。
2.根据权利要求1所述的一种基于多尺度全局特征和局部特征的图像分类方法,其特征在于,步骤4中,
定义能量函数ε,通过最小化能量函数ε计算Canny边缘图像的特征向量场gCanny
ϵ = ∫ ∫ α · ( u x 2 + u y 2 + v x 2 + v y 2 ) + ( 1 - α ) | ▿ f Canny | 2 | g Canny - ▿ f Canny | 2 dxdy ,
其中,ε表示能量函数的值,(x,y)表示像素坐标,fCanny(x,y)表示Canny边缘图像,表示Canny边缘图像的梯度,gCanny=(u(x,y),v(x,y)),u(x,y)和v(x,y)分别是像素坐标(x,y)处特征向量场第一分量和第二分量的值,ux表示第一分量u(x,y)对像素坐标x的偏导数,uy表示第一分量u(x,y)对像素坐标y的偏导数,vx表示第二分量v(x,y)对像素坐标x的偏导数,vy表示第二分量v(x,y)对像素坐标y的偏导数,α表示归一化参数,取值范围0~1,其值根据图像中的噪声数量设置;
定义能量函数ξ,通过最小化能量函数ξ计算Sobel边缘图像的特征向量场gSobel
ξ = ∫ ∫ α · ( u x 2 + u y 2 + v x 2 + v y 2 ) + ( 1 - α ) | ▿ f Sobel | 2 | g Sobel - ▿ f Sboel | 2 dxdy ,
其中,ξ表示能量函数的值,(x,y)表示像素坐标,fSobel(x,y)表示Sobel边缘图像,表示边缘图像的梯度,gSobel=(u(x,y),v(x,y)),表示待计算的Sobel边缘图像特征向量场,u(x,y)和v(x,y)分别是像素坐标(x,y)处特征向量场第一分量和第二分量值,ux表示第一分量u(x,y)对像素坐标x的偏导数,uy表示第一分量u(x,y)对像素坐标y的偏导数,vx表示第二分量v(x,y)对像素坐标x的偏导数,vy表示第二分量v(x,y)对像素坐标y的偏导数,α表示归一化参数,取值范围0~1,其值根据图像中的噪声数量设置。
3.根据权利要求2所述的一种基于多尺度全局特征和局部特征的图像分类方法,其特征在于,步骤5中,
如果像素P属于显著区域,其坐标为(x,y),当且仅当以下四个不等式至少有一个成立,则判定像素P属于显著区域:
g(x,y)·g(x+1,y)<θ,
g(x,y)·g(x-1,y)<θ,
g(x,y)·g(x,y+1)<θ,
g(x,y)·g(x,y-1)<θ,
其中,g(x,y)表示像素坐标(x,y)处的特征向量,g(x-1,y)表示像素坐标(x-1,y)处的特征向量,g(x,y+1)表示像素坐标(x,y+1)处的特征向量,g(x,y-1)表示像素坐标(x,y-1)处的特征向量,g(x,y)·g(x+1,y)表示特征向量g(x,y)与特征向量g(x+1,y)的点积,θ=π/4,表示一个阈值。
4.根据权利要求3所述的一种基于多尺度全局特征和局部特征的图像分类方法,其特征在于,步骤6中,
使用C={cm}表示计算得到的Canny显著区域,每个元素cm表示一个连通分量,1≤m≤NC,NC表示Canny显著区域中连通分量的总数;S={sn}表示Sobel显著区域,每个元素sn表示一个连通分量,1≤n≤Ns,Ns表示Sobel显著区域中连通分量的总数;
对两种连通分量过滤,保留每个连通分量中包含像素点个数大于阈值ρ的连通分量,其中ρ=10,即所保留的连通分量必须满足以下条件:
|cm|≥ρ,
|sn|≥ρ,
其中,|cm|表示连通分量cm包含像素点个数,|sn|表示连通分量sn包含像素点个数;
经过首次过滤,得到Canny显著区域C′和Sobel显著区域S′,计算这两种显著区域的交集,表示为C′∩S′,像素PCC′∩S′,当且仅当P∈C′且P∈S′,然后对交集C′∩S′中的连通分量再次过滤,保留交集中连通分量包含的像素点个数大于ρ的连通分量作为最终显著区域,其中ρ=10。
5.根据权利要求4所述的一种基于多尺度全局特征和局部特征的图像分类方法,其特征在于,步骤7中,
计算最终显著区域中的四种顶点,这四种顶点分别是单支顶点,普通顶点、三路交叉点和十字交叉点,CONP表示像素P所在的连通区域,ADJP表示像素P的邻接像素,根据连通区域CONP与邻接像素ADJP求交后所包含像素点的数目判定像素P的类型:
利用动态规划算法计算单支顶点间的测地距离,像素点Pk和Ph是两个单支顶点,则像素点Pk和Ph之间的测地距离EPf,h可表示为:
EPk,h=NGD(Pk,h),
其中,NGD(Pk,h)表示单支顶点Pk与Ph之间的测地距离,1≤k,h≤Nend,Nend表示单支顶点的个数;
计算单支顶点之间测地距离均值和方差:
Mean EP = 1 N end Σ k = 1 N end Σ h = 1 k EP k , h ,
Var EP = 1 N end Σ k = 1 N end Σ h = 1 k ( EP k , h - Mean EP ) 2 ,
其中,MeanEP表示单支顶点之间测地距离的均值,VarEP表示单支顶点之间测地距离的方差;
利用动态规划算法首先计算普通顶点之间的测地距离,然后计算普通顶点之间测地距离的均值和方差;
利用动态规划算法首先计算三路交叉点之间的测地距离,然后计算三路交叉点之间测地距离的均值和方差;
利用动态规划算法首先计算十字交叉点之间的测地距离,然后计算十字交叉点之间测地距离的均值和方差;
最终得到8个特征作为最终显著区域的空间分布特征,分别是单支顶点之间测地距离的均值和方差,普通顶点之间测地距离的均值和方差,三路交叉点之间测地距离的均值和方差,十字交叉点之间测地距离的均值和方差。
6.根据权利要求5所述的一种基于多尺度全局特征和局部特征的图像分类方法,其特征在于,步骤8中,
根据最终显著区域对应的输入图像位置,得到对应位置处的RGB颜色值,统计RGB每个颜色通道值的分布,将每个通道的取值范围0~255平均划分为10个区间,统计每个区间内像素点的个数占总像素个数的比例,得到30维的RGB特征;
将RGB颜色空间转换为HSV颜色空间,得到对应位置处的HSV颜色值,统计HSV每个通道值得分布,将每个通道的取值范围0~255平均划分为10个区间,统计每个区间内像素点的个数占总像素个数的比例,得到30维的HSV特征;
将RGB颜色空间转换为灰度空间,得到对应位置处的灰度颜色值,将灰度值的取值范围0~255平均划分为10个区间,统计每个区间内像素点的个数占总像素个数的比例,得到10维灰度特征,最终得到90维颜色特征。
CN201510186133.7A 2015-04-17 2015-04-17 一种基于多尺度全局特征和局部特征的图像分类方法 Expired - Fee Related CN104766096B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510186133.7A CN104766096B (zh) 2015-04-17 2015-04-17 一种基于多尺度全局特征和局部特征的图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510186133.7A CN104766096B (zh) 2015-04-17 2015-04-17 一种基于多尺度全局特征和局部特征的图像分类方法

Publications (2)

Publication Number Publication Date
CN104766096A true CN104766096A (zh) 2015-07-08
CN104766096B CN104766096B (zh) 2017-11-10

Family

ID=53647910

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510186133.7A Expired - Fee Related CN104766096B (zh) 2015-04-17 2015-04-17 一种基于多尺度全局特征和局部特征的图像分类方法

Country Status (1)

Country Link
CN (1) CN104766096B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021575A (zh) * 2016-05-31 2016-10-12 北京奇艺世纪科技有限公司 一种视频中同款商品检索方法及装置
CN106504294A (zh) * 2016-10-17 2017-03-15 浙江工业大学 基于扩散曲线的rgbd图像矢量化方法
CN107103325A (zh) * 2017-04-20 2017-08-29 湘潭大学 一种组织病理图像分类方法
CN108537235A (zh) * 2018-03-27 2018-09-14 北京大学 一种低复杂度尺度金字塔提取图像特征的方法
CN108648150A (zh) * 2018-05-10 2018-10-12 句容康泰膨润土有限公司 一种图像拼接方法
CN109271895A (zh) * 2018-08-31 2019-01-25 西安电子科技大学 基于多尺度特征学习和特征分割的行人重识别方法
CN109840552A (zh) * 2019-01-14 2019-06-04 湖北工业大学 一种动态图像分类方法
CN109857889A (zh) * 2018-12-19 2019-06-07 苏州科达科技股份有限公司 一种图像检索方法、装置、设备及可读存储介质
CN110019915A (zh) * 2018-07-25 2019-07-16 北京京东尚科信息技术有限公司 检测图片的方法、装置和计算机可读存储介质
CN111325198A (zh) * 2018-12-13 2020-06-23 北京地平线机器人技术研发有限公司 视频对象特征提取方法和装置、视频对象匹配方法和装置
CN111401309A (zh) * 2020-04-08 2020-07-10 中国人民解放军海军航空大学 基于小波变换的cnn训练和遥感图像目标识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101118593A (zh) * 2007-09-04 2008-02-06 西安电子科技大学 基于swbct的纹理图像分类方法
CN101807256A (zh) * 2010-03-29 2010-08-18 天津大学 一种基于多分辨率框架的物体识别检测方法
CN102024258A (zh) * 2010-12-15 2011-04-20 中国科学院遥感应用研究所 具有边界保持特性的遥感图像多尺度分割方法
US8538081B2 (en) * 2011-02-28 2013-09-17 Seiko Epson Corporation Contextual boost for object detection

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101118593A (zh) * 2007-09-04 2008-02-06 西安电子科技大学 基于swbct的纹理图像分类方法
CN101807256A (zh) * 2010-03-29 2010-08-18 天津大学 一种基于多分辨率框架的物体识别检测方法
CN102024258A (zh) * 2010-12-15 2011-04-20 中国科学院遥感应用研究所 具有边界保持特性的遥感图像多尺度分割方法
US8538081B2 (en) * 2011-02-28 2013-09-17 Seiko Epson Corporation Contextual boost for object detection

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021575A (zh) * 2016-05-31 2016-10-12 北京奇艺世纪科技有限公司 一种视频中同款商品检索方法及装置
CN106504294B (zh) * 2016-10-17 2019-04-26 浙江工业大学 基于扩散曲线的rgbd图像矢量化方法
CN106504294A (zh) * 2016-10-17 2017-03-15 浙江工业大学 基于扩散曲线的rgbd图像矢量化方法
CN107103325A (zh) * 2017-04-20 2017-08-29 湘潭大学 一种组织病理图像分类方法
CN108537235A (zh) * 2018-03-27 2018-09-14 北京大学 一种低复杂度尺度金字塔提取图像特征的方法
CN108537235B (zh) * 2018-03-27 2020-09-08 北京大学 一种低复杂度尺度金字塔提取图像特征的方法
CN108648150A (zh) * 2018-05-10 2018-10-12 句容康泰膨润土有限公司 一种图像拼接方法
CN110019915A (zh) * 2018-07-25 2019-07-16 北京京东尚科信息技术有限公司 检测图片的方法、装置和计算机可读存储介质
CN109271895A (zh) * 2018-08-31 2019-01-25 西安电子科技大学 基于多尺度特征学习和特征分割的行人重识别方法
CN111325198A (zh) * 2018-12-13 2020-06-23 北京地平线机器人技术研发有限公司 视频对象特征提取方法和装置、视频对象匹配方法和装置
CN109857889A (zh) * 2018-12-19 2019-06-07 苏州科达科技股份有限公司 一种图像检索方法、装置、设备及可读存储介质
CN109857889B (zh) * 2018-12-19 2021-04-09 苏州科达科技股份有限公司 一种图像检索方法、装置、设备及可读存储介质
CN109840552A (zh) * 2019-01-14 2019-06-04 湖北工业大学 一种动态图像分类方法
CN111401309A (zh) * 2020-04-08 2020-07-10 中国人民解放军海军航空大学 基于小波变换的cnn训练和遥感图像目标识别方法
CN111401309B (zh) * 2020-04-08 2022-07-12 中国人民解放军海军航空大学 基于小波变换的cnn训练和遥感图像目标识别方法

Also Published As

Publication number Publication date
CN104766096B (zh) 2017-11-10

Similar Documents

Publication Publication Date Title
CN104766096A (zh) 一种基于多尺度全局特征和局部特征的图像分类方法
CN107230202B (zh) 路面病害图像的自动识别方法和系统
Wang et al. Character location in scene images from digital camera
CN107578035A (zh) 基于超像素‑多色彩空间的人体轮廓提取方法
CN103824059B (zh) 一种基于视频图像序列的人脸表情识别方法
Chen et al. An improved license plate location method based on edge detection
WO2017084204A1 (zh) 一种二维视频流中的人体骨骼点追踪方法及系统
WO2018145470A1 (zh) 一种图像检测方法和装置
CN106651872A (zh) 基于Prewitt算子的路面裂缝识别方法及系统
US20100008576A1 (en) System and method for segmentation of an image into tuned multi-scaled regions
CN105205489A (zh) 基于颜色纹理分析器与机器学习的车牌检测方法
CN106548160A (zh) 一种人脸微笑检测方法
CN107154044B (zh) 一种中餐食物图像的分割方法
CN110852323B (zh) 一种基于角点的空中目标探测方法
CN107633491A (zh) 一种基于目标检测的区域图像增强方法及存储介质
CN107545571A (zh) 一种图像检测方法及装置
CN109544583B (zh) 一种提取皮革图像感兴趣区域的方法、装置及设备
CN103984946A (zh) 一种基于K-means的高分辨率遥感地图道路提取方法
CN104156941A (zh) 一种确定图像上几何轮廓区域的方法及系统
CN104966285A (zh) 一种显著性区域的检测方法
CN106506901A (zh) 一种显著性视觉注意模型的混合式数字图像半色调方法
CN113221881B (zh) 一种多层级的智能手机屏幕缺陷检测方法
CN107909083A (zh) 一种基于轮廓匹配优化的矩形检测提取方法
CN103903257B (zh) 基于几何块间隔共生特征和语义信息的图像分割方法
CN107103266A (zh) 二维人脸欺诈检测分类器的训练及人脸欺诈检测方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171110