CN104951795A - 图像分类识别判断方法 - Google Patents

图像分类识别判断方法 Download PDF

Info

Publication number
CN104951795A
CN104951795A CN201510274373.2A CN201510274373A CN104951795A CN 104951795 A CN104951795 A CN 104951795A CN 201510274373 A CN201510274373 A CN 201510274373A CN 104951795 A CN104951795 A CN 104951795A
Authority
CN
China
Prior art keywords
image
picture
positive example
determination methods
identification determination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510274373.2A
Other languages
English (en)
Other versions
CN104951795B (zh
Inventor
汪成亮
严莎莎
李丽丽
白家莲
张志良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Jinshan Science and Technology Group Co Ltd
Original Assignee
Chongqing Jinshan Science and Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Jinshan Science and Technology Group Co Ltd filed Critical Chongqing Jinshan Science and Technology Group Co Ltd
Priority to CN201510274373.2A priority Critical patent/CN104951795B/zh
Publication of CN104951795A publication Critical patent/CN104951795A/zh
Application granted granted Critical
Publication of CN104951795B publication Critical patent/CN104951795B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明提出了一种图像分类识别判断方法,包括如下步骤:步骤1,采集图像,对图像进行预处理,通过顶帽变换方法去除图像噪声之后,采用直方图均衡化对图像进行增强;步骤2,对增强后的图像进行特征提取,得到N维向量的联合直方图,对N维向量进行降维操作,所述N为正整数;步骤3,对降维操作的N维向量,通过训练集训练归纳出分类集,通过分类或筛选提取出特征图像。

Description

图像分类识别判断方法
技术领域
本发明涉及计算机图像识别领域,尤其涉及一种图像分类识别判断方法。
背景技术
HSI特征是颜色特征,基于人的视觉感知角度建立的HSI颜色空间。H为色度,是描述纯色的属性;S为饱和度,给出一种纯色被白光稀释的程度的度量;I为亮度,是视觉对光刺激的亮度响应。
特征提取方法是对HSI颜色空间按下式进行量化,把色度H量化成8个空间,把饱和度S分成3个空间,把亮度I分成3个空间,即颜色空间被分成72区间。
构造H、S、I三个分量的三维的联合直方图,但是HSI特征提取方法在复杂的图像环境下,对特征图像提取的效果并不明显,
此外,在SVM分类器情况下,复杂的图像环境对特征图像提取的效果并不明显,这就需要本领域技术人员继续解决相应的技术问题。
此外,原始图像总是会有一些噪声。比如有水印、光照不均匀、光照不足导致图片灰暗等。这些都会对分类效果有影响。
发明内容
本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种 图像分类识别判断方法。
为了实现本发明的上述目的,本发明提供了一种图像分类识别判断方法,其关键在于,包括如下步骤:
步骤1,采集图像,对图像进行预处理,通过顶帽变换方法去除图像噪声之后,采用直方图均衡化对图像进行增强;
步骤2,对增强后的图像进行特征提取,得到N维向量的联合直方图,对N维向量进行降维操作,所述N为正整数;
步骤3,对降维操作的N维向量,通过训练集训练归纳出分类集,通过分类或筛选提取出特征图像。
所述的图像分类识别判断方法,优选的,所述步骤1包括:
步骤1-1,提取出一个不包含水印的边框掩码图像,使用所述的边框掩码图像替换掉原始图像中的边框。
所述的图像分类识别判断方法,优选的,所述步骤1-1包括:
步骤1-2,将边框掩码图像进行开操作,构造一个区分边框掩码图像与原始图像部分的分段函数,最后提取出边框掩码图像;
步骤1-3,开操作公式分别如下所示,
表示集合A被结构元素B腐蚀;
X = A ⊕ B = { X : ( - B + X ) ∩ A ≠ Φ } , 表示集合A被结构B元素膨胀;
步骤1-4,进行开操作和闭操作公式如下所示,
表示集合A被结构元素B开操作;
表示集合A被结构元素B闭操作;
步骤1-5,根据设定阈值来提取掩码图像,其公式如下:
Mask = Iopen if g < 10 255 else ,
其中g表示图像的灰度值,Iopen是图像进行开运算后的图像;
得到提取掩码图像后,使用该提取掩码图像替换掉原有的边框,在RGB三个通道分别进行下列操作,
Io = I if g = 255 Mask else ,
其中I为原图,Io为最终得到的图像,即可得到最终的去水印后的图像。
所述的图像分类识别判断方法,优选的,所述步骤1包括:
步骤1-6,对图像进行顶帽变换,所述顶帽变换公式如下,
即在集合A中减去B对A的开操作;
步骤1-7,对经过顶帽变换的图像进行图像增强,采用的是直方图均衡化,
令X={X(i,j)}表示由L个灰度级{X0,X1,...,XL-1}组成的一张图像,其中X(i,j)表示图像在空间(i,j)处的强度,且X(i,j)∈{X0,X1,...,XL-1}。对于一张图像X,概率密度分布p(Xk)可定义为:
p ( X k ) = n k n ,
其中k=0,1,…,L-1,L为正整数,nk表示在图片X中Xk灰度级出现的次数,n是整张图片中像素的个数,nk-Xk的直方图是图像X的灰度直方图,基于概率密度函数,定义累积分布函数为:
c ( x ) = &Sigma; j = 0 k p ( X j ) ,
其中,对于k=0,1,…,L-1,Xk=x。需注意c(XL-1)=1,直方图均衡化是通过累积分布函数作为转换函数,将整幅输入图像映射到从X0到XL-1的空间,定义转换函数f(x)为
f(x)=X0+(XL-1-X0)c(x),
则直方图均衡化后的输出图像Y={Y(i,j)}写成:
Y = f ( X ) = { f ( x ( i , j ) ) | &ForAll; X ( i , j ) &Element; X } .
所述的图像分类识别判断方法,优选的,所述步骤2包括:
步骤2-1,提取方法是对于图像中每一个像素,将其相邻的8个点进行比较,如果中心像素值比该邻点大,则将邻点赋值为1,否则赋值为0,这样每个点都会获得一个8位二进制数。通过分别计算RGB三个通道上的LBP值,可得到一个三元组LBPk(x,y),其中k∈{R,G,B},构造出一个三维的联合直方图,最终得到一个256×256×256维的向量,
步骤2-2,对图像进行降维操作,找到有两次跳变的LBP二进制模式,跳变是指由0变为1,或由1变为0,执行步骤2-3;
步骤2-3,在步骤2-2已经找到的二进制模式中,将最长的连续的1或0的长度作为该二进制模式的LBP值,取值为1~n;
构造R、G、B颜色空间的三维的联合直方图,最终得到一个n3维的向量,所述7≤n≤255。
所述的图像分类识别判断方法,优选的,所述步骤3包括:
步骤3-1,朴素贝叶斯分类器引入朴素贝叶斯假设:在给定类别C的条件下,所有的属性Ai相互独立。下标i、j为正整数,P代表概率,
P ( A i | C , A j ) = P ( A i | C ) , &ForAll; A i , A j , P ( C ) > 0 ;
步骤3-2,假设A1,A2,........An是数据集n的特征,假设有m个类C={C1,C2,C3,.....Cm},给定一个具体的实例X,其属性为{x1,x2,....xm},这里xi是属性Ai的具体取值,该实例属于某一个类Ci的后验概率是P(X|Ci),c(X)表示分类所得的类标签,贝叶斯分类器表示为,
c(X)=argmaxP(Ci)P(X|Ci)。
所述的图像分类识别判断方法,优选的,还包括:
步骤4,将分类后的图片按图片采集的时间顺序进行排列,利用时序关系进行图片颜色分类结果进行二次筛选。
所述的图像分类识别判断方法,优选的,所述步骤4包括:
步骤4-1,给出一个标注预测结果的图片时间序列,Bi表示位于ti时刻的负例,Ri表示位于第j时刻的正例;定义两个相邻正例Ri和Rj之间的时间间隔为Gij=(j-i),滑动窗口W长度为L,在图片时间序列上,Wj标示滑动窗口W的其实位置滑动到第j时刻;
B0,B1,…,Ri,Bi+1,Bi+2,…,Rj,….Bn。
所述的图像分类识别判断方法,优选的,所述步骤4-1包括:
进行显著相邻正例间隔,假设r为一个正例间隔长度,
若Xr=(Nr–N*Pr)/N*Pr(1-Pr)>Xsup,其中,Nr为所有长度小于等于r的相邻正例间隔个数,N为所有长度小于等于L的相邻正例间隔个数;Pr=r/L,L是滑动窗口长度,Xsup为一个人工给定的阈值,则所有长度不大于r的相邻正例间隔为显著相邻正例间隔,表示为sig(Gij);
进行显著滑动窗口:给定一个有效窗口Wj,其中的显著相邻正例间隔数大于给定的阈值Fsup,则Wj称为显著滑动窗口;
基于时序关系的正例预测结果筛选方法:计算每个正例图片存在于显著滑动窗口中的个数,这个值越大,则图片被正确预测为正例的概率越大,将每个被预测为正例的图片存在于显著滑动窗口中的个数作为预测结果输出。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
经过朴素贝叶斯分类器分类之后,以及经过颜色分类结果的二次排序,使 特征图片提取的更加精确、稳定。
对特征图像的灰度识别精准。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明图像分类识别判断方法流程图;
图2是本发明图像分类识别判断方法去除水印示意图;
图3是本发明图像分类识别判断方法去除不均匀光照示意图;
图4是本发明图像分类识别判断方法的直方图示意图;
图5是本发明图像分类识别判断方法顶帽变换后的直方图示意图;
图6是本发明图像分类识别判断方法LBP特征与HSI特征的准确率比较图;
图7是本发明图像分类识别判断方法LBP特征和HSI特征覆盖率比较图;
图8是本发明图像分类识别判断方法SVM分类器与朴素贝叶斯分类器覆盖率的比较图;
图9是本发明图像分类识别判断方法SVM分类器与朴素贝叶斯分类器准确率的比较图;
图10是本发明图像分类识别判断方法SVM分类器与朴素贝叶斯分类器F值的比较图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描 述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,除非另有规定和限定,需要说明的是,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是机械连接或电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
一 图片预处理
原始图像总是会有一些噪声。比如有水印、光照不均匀、光照不足导致图片灰暗等。这些都会对分类效果有影响。针对这些情况,对图片进行去除水印、去除不均匀光照、图像增强预处理。
(1)去除水印
去除水印的思想主要是,首先提取出一个不包含水印的边框掩码图,然后使用这张边框掩码图替换掉原图中的边框。
提取边框掩码图首先需要将图片进行开操作,然后根据边框与组织图片灰度相差很大的特性,构造一个能良好区分这两部分的分段函数,最后提取出边框掩码图。
开操作的数学基础是腐蚀和膨胀,公式分别如下所示:
X = A&Theta;B = { X : B + X &Subset; A } - - - ( 1 )
X = A &CirclePlus; B = { X : ( - B + X ) &cap; A &NotEqual; &Phi; } - - - ( 2 )
公式1表示集合A被结构元素B腐蚀,公式2表示集合A被结构B元素膨胀。这两个操作可以组成开操作和闭操作。公式如下所示:
A &CenterDot; B = ( A &CirclePlus; B ) &Theta;B - - - ( 4 )
公式3表示集合A被结构元素B开操作,公式4表示集合A被结构元素B闭操作。开操作可以去除小物体,将各个物体很好的分开,将大物体的边界平滑。闭操作可以将物体上的小空洞填充,将两个临近的物体连接起来,平滑物体的边界。在此我们需要用到开操作。
开操作完成后,可以得到如图2中(c)所示的图像。我们可以明显看出边框上的水印已经被去除,而且消化道组织的图片也变得模糊。
由于边框的灰度值大都集中在10以下,因此可以将10作为一个阈值来提取掩码图像。其公式如下:
Mask = Iopen if g < 10 255 else - - - ( 5 )
其中g表示图像的灰度值,Iopen是图像进行开运算后的图像。255是白色的灰度值,即将其他区域填充为白色。
得到掩码图后,需要做的就是用这样掩码图替换掉原有的边框。在RGB三个通道分别进行下列操作,即可得到最终的去水印后的图像。
Io = I if g = 255 Mask else - - - ( 6 )
其中I为原图,Io为最终得到的图像。
去水印的效果如下所示,图2中(a)为原图,(b)为灰度图,(c)为开操作后的图像,(d)为提取的边框掩码图,(e)为最终得到的去水印后的图像。
(2)去除不均匀光照
采用的方法是顶帽变换。顶帽变换是一种非线性的滤波器,可以用来去除噪声、提取特征以及图像分割。它的一个特性是可以将复杂图片分解,提取出其中特征部分的图像。
顶帽变换(Top-hat,简写为HAT)是数学形态学变换的一种,它在白色背景 中寻找黑点以及在黑色背景中寻找白点有非常好的性能。顶帽变换的公式如下:
从上述公式7中能直观地看出,顶帽变换的操作实质就是在集合A中减去B对A的开操作。
以其中一幅正常图片为例,在结构算子B为半径r=15的平面圆形时,可得到顶帽变换的结果如图3所示第1张为原图,第2张为去掉水印后的灰度图,第3张为顶帽变换后的图,第4张是进行灰度调整后的图。
(3)图像增强
采用的是直方图均衡化。其主要思想是使图片的灰度级分布更平缓,增强图片的对比度。
令X={X(i,j)}表示由L个灰度级{X0,X1,...,XL-1}组成的一张图片,其中X(i,j)表示在图片在空间(i,j)处的强度,且X(i,j)∈{X0,X1,...,XL-1}。对于一张图片X,概率密度分布p(Xk)可定义为:
p ( X k ) = n k n - - - ( 8 )
其中k=0,1,…,L-1,nk表示在图片X中Xk灰度级出现的次数,n是整张图片中像素的个数。实际上,nk-Xk的直方图就是图片X的灰度直方图。基于概率密度函数,定义累积分布函数为:
c ( x ) = &Sigma; j = 0 k p ( X j ) - - - ( 9 )
其中,对于k=0,1,…,L-1,Xk=x。需注意c(XL-1)=1。直方图均衡化就是通过累积分布函数作为转换函数,将整幅输入图像映射到从X0到XL-1的空间。定义转换函数f(x)为
f(x)=X0+(XL-1-X0)c(x)              (10) 
则直方图均衡化后的输出图像Y={Y(i,j)}可以写成:
Y = f ( X ) = { f ( X ( i , j ) ) | &ForAll; X ( i , j ) &Element; X } - - - ( 11 )
图4给出了直方图均衡化的效果图。其中(a)和(c)为正常图片的灰度图和均衡化后的灰度图,其右侧两幅图是左侧这两张图的灰度直方图。其右侧两幅图是左侧这两张图的灰度直方图。从图中可看出,直方图均衡化后可以使细节特征更加明显,灰度值趋于均匀分布,不再集中在其中的某个灰度级上。
顶帽变换后再做直方图均衡化的效果如图5所示。(a)(c)为顶帽变换后再直方图均衡化的图像,右侧为其灰度直方图
二 特征提取与降维
提取的特征为LBP特征;对图片提取LBP特征最终会得到一个343维的向量。
LBP特征
LBP(Local Binary Pattern,局部二值模式)是一种用来描述图像局部纹理特征的方法;它具有旋转不变性和灰度不变性等显著的优点。
提取方法是对于图像中每一个像素,将其相邻的8个点进行比较,如果中心像素值比该邻点大,则将邻点赋值为1,否则赋值为0,这样每个点都会获得一个8位二进制数。通过分别计算RGB三个通道上的LBP值,可得到一个三元组LBPk(x,y),其中k∈{R,G,B},构造出一个三维的联合直方图。最终得到一个256×256×256维的向量。可见其维度很高,会使分类效率大大下降。故需要对其进行降维。
降维主要分为以下两步:
第一步,找到有两次跳变的LBP二进制模式。跳变是指由0变为1,或由1变为0。
第二步,在第一步已经找到的二进制模式中,将最长的连续的1或0的长度作为该二进制模式的LBP值,取值为1~7。
构造R、G、B颜色空间的三维的联合直方图,最终得到一个7×7×7=343维的向量。
三 朴素贝叶斯分类器分类
朴素贝叶斯分类器通过训练集(已分类的例子集)训练而归纳出分类器,并利用分类器对未分类的数据进行分类。朴素贝叶斯分类器并不是把一个实例绝对指派给某一类,而是通过计算得出属于某一类的概率,具有最大概率的类是该实例所属的类。
朴素贝叶斯分类器引入朴素贝叶斯假设:在给定类别C的条件下,所有的属性Ai相互独立。下标i、j为正整数,P代表概率。
P ( A i | C , A j ) = P ( A i | C ) , &ForAll; A i , A j , P ( C ) > 0 ;
数学描述如下:
假设A1,A2,........An是数据集的n特征(属性),假设有m个类C={C1,C2,C3,.....Cm},给定一个具体的实例X,其属性为{x1,x2,....xm},这里xi是属性Ai的具体取值,该实例属于某一个类Ci的后验概率是P(X|Ci),c(X)表示分类所得的类标签。贝叶斯分类器表示为:
c(X)=argmaxP(Ci)P(X|Ci)
即预测实例X属于在属性给定条件下后验概率最大的类别时,预测的正确率最大。
为了得到特征图片与正常图片在哪个比例下分类效果最好。分别在正常图片与出血图片比例为1:10,1:30,1:50下进行实验。实验数据集如下:
不同比例下各个训练集:
不同比例下各个测试集的图片数:
四、基于图片时序关系的颜色分类结果二次排序
将分类后的图片按图片采集的时间顺序进行排列,利用时序关系进行图片颜色分类结果进行二次筛选的思想是越相邻的图片越容易被分类为相同颜色的图片。例如,当一个图片被分类为红色,如果它附近(相邻时间区间内)的图片中也被分类为红色,那么这张图片被正确分类为红色的概率应该很高。反之,如果与它相邻的图片中很少甚至没有图片被分类为红色,那么这张图片被正确分类为红色的概率应该很低,即为噪声的可能性很高。
以分类图片为红色(正例)或非红色(负例)为例,通过上述分析可以发现,在图片时间序列中,如果某个时间区间内的图片被预测为正例的密度很大(该区间内大多数图片被预测为红色)则认为这些图片被正确预测,作为结果输出。如果该区间内图片被预测为正例的密度较小,则认为这些预测的准确率不高,不作为预测结果输出(或者做出标示)。
我们提出一种基于卡方检验的方法来判定任意区间内正确预测密度的显 著性。
如下式,给出一个标注预测结果的图片时间序列,Bi表示位于ti时刻的负例,Ri表示位于第j时刻的正例。定义两个相邻正例Ri和Rj之间的时间间隔为Gij=(j-i)(Ri和Rj相邻表示Ri和Rj之间没有其它正例存在),滑动窗口W长度为L,在图片时间序列上,Wj标示滑动窗口W的其实位置滑动到第j时刻。
B0,B1,…,Ri,Bi+1,Bi+2,…,Rj,….Bn
定义1:有效滑动窗口:给出一个滑动窗口Wj(窗口其实位置为Wj),若在j时刻的图片为正例(即Rj出现在于滑动窗口的起始时刻),则Wj称为有效滑动窗口;
定义2:显著相邻正例间隔:假设r为一个正例间隔长度(如,Gij=r),若Xr=(Nr–N*Pr)/N*Pr(1-Pr)>Xsup,其中,Nr为所有长度小于等于r的相邻正例间隔个数,N为所有长度小于等于L的相邻正例间隔个数;Pr=r/L,L是滑动窗口长度,Xsup为一个人工给定的阈值。则所有长度不大于r的相邻正例间隔为显著相邻正例间隔,表示为sig(Gij);
定义3:显著滑动窗口:给定一个有效窗口Wj,其中的显著相邻正例间隔数大于一个人工给定的阈值Fsup,则Wj称为显著滑动窗口。
基于时序关系的正例预测结果筛选方法:计算每个正例图片存在于显著滑动窗口中的个数,这个值越大,则图片被正确预测为正例的概率越大,将每个被预测为正例的图片存在于显著滑动窗口中的个数作为预测结果输出。
五、实验结果,如图6-10所示,
LBP特征与HSI特征的准确率比较:
结论:LBP特征普遍比HSI特征好。
LBP特征与HSI特征的覆盖率比较:
结论:LBP特征普遍比HSI特征好。
SVM分类器与朴素贝叶斯分类器覆盖率的比较(NB代表朴素贝叶斯分类器):
结论:朴素贝叶斯分类器普遍比SVM覆盖率高,且比较稳定。
SVM分类器与朴素贝叶斯分类器准确率的比较(NB代表朴素贝叶斯分类器):
结论:对于不明显出血NB准确率比较高。
SVM分类器与朴素贝叶斯分类器F值的比较(NB代表朴素贝叶斯分类器):
结论:对于不明显出血NB的F值较高,并且NB比SVM稳定。
通过上面准确率和覆盖率的比较,LBP特征均比HSI特征好。在LBP特征下朴素贝叶斯分类器得到的覆盖率非常高,近似接近于1,对于特征图像,特别是医疗图像来说,检测到具有特征图像的覆盖率,尤其是出血图像覆盖率比准确率有意义。覆盖率越高,说明特征图像,或出血图像被检测出来的概率越高。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理 解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (9)

1.一种图像分类识别判断方法,其特征在于,包括如下步骤:
步骤1,采集图像,对图像进行预处理,通过顶帽变换方法去除图像噪声之后,采用直方图均衡化对图像进行增强;
步骤2,对增强后的图像进行特征提取,得到N维向量的联合直方图,对N维向量进行降维操作,所述N为正整数;
步骤3,对降维操作的N维向量,通过训练集训练归纳出分类集,通过分类或筛选提取出特征图像。
2.根据权利要求1所述的图像分类识别判断方法,其特征在于,所述步骤1包括:
步骤1-1,提取出一个不包含水印的边框掩码图像,使用所述的边框掩码图像替换掉原始图像中的边框。
3.根据权利要求2所述的图像分类识别判断方法,其特征在于,所述步骤1-1包括:
步骤1-2,将边框掩码图像进行开操作,构造一个区分边框掩码图像与原始图像部分的分段函数,最后提取出边框掩码图像;
步骤1-3,开操作公式分别如下所示,
表示集合A被结构元素B腐蚀;
X = A &CirclePlus; B = { X : ( - B + X ) &cap; A &NotEqual; &Phi; } , 表示集合A被结构B元素膨胀;
步骤1-4,进行开操作和闭操作公式如下所示,
表示集合A被结构元素B开操作;
表示集合A被结构元素B闭操作;
步骤1-5,根据设定阈值来提取掩码图像,其公式如下:
Mask = Iopen ifg < 10 255 else ,
其中g表示图像的灰度值,Iopen是图像进行开运算后的图像;
得到提取掩码图像后,使用该提取掩码图像替换掉原有的边框,在RGB三个通道分别进行下列操作,
Io = I ifg < 255 Mask else ,
其中I为原图,Io为最终得到的图像,即可得到最终的去水印后的图像。
4.根据权利要求1所述的图像分类识别判断方法,其特征在于,所述步骤1包括:
步骤1-6,对图像进行顶帽变换,所述顶帽变换公式如下,
即在集合A中减去B对A的开操作;
步骤1-7,对经过顶帽变换的图像进行图像增强,采用的是直方图均衡化,
令X={X(i,j)}表示由L个灰度级{X0,X1,...,XL-1}组成的一张图像,其中X(i,j)表示图像在空间(i,j)处的强度,且X(i,j)∈{X0,X1,...,XL-1}。对于一张图像X,概率密度分布p(Xk)可定义为:
p ( X k ) = n k n ,
其中k=0,1,…,L-1,L为正整数,nk表示在图片X中Xk灰度级出现的次数,n是整张图片中像素的个数,nk-Xk的直方图是图像X的灰度直方图,基于概率密度函数,定义累积分布函数为:
c ( x ) = &Sigma; j = 0 k p ( X j ) ,
其中,对于k=0,1,…,L-1,Xk=x。需注意c(XL-1)=1,直方图均衡化是通过累积分布函数作为转换函数,将整幅输入图像映射到从X0到XL-1的空间,定义转换函数f(x)为
f(x)=X0+(XL-1-X0)c(x),
则直方图均衡化后的输出图像Y={Y(i,j)}写成:
Y = f ( X ) = { f ( x ( i , j ) ) | &ForAll; X ( i , j ) &Element; X } .
5.根据权利要求1所述的图像分类识别判断方法,其特征在于,所述步骤2包括:
步骤2-1,特征提取方法是对于图像中每一个像素,将其相邻的8个点进行比较,如果中心像素值比该邻点大,则将邻点赋值为1,否则赋值为0,这样每个点都会获得一个8位二进制数。通过分别计算RGB三个通道上的LBP值,可得到一个三元组LBPk(x,y),其中k∈{R,G,B},构造出一个三维的联合直方图,最终得到一个256×256×256维的向量,
步骤2-2,对图像进行降维操作,找到有两次跳变的LBP二进制模式,跳变是指由0变为1,或由1变为0,执行步骤2-3;
步骤2-3,在步骤2-2已经找到的二进制模式中,将最长的连续的1或0的长度作为该二进制模式的LBP值,取值为1~n;
构造R、G、B颜色空间的三维的联合直方图,最终得到一个n3维的向量,所述7≤n≤255。
6.根据权利要求1所述的图像分类识别判断方法,其特征在于,所述步骤3包括:
步骤3-1,朴素贝叶斯分类器引入朴素贝叶斯假设:在给定类别C的条件下,所有的属性Ai相互独立。下标i、j为正整数,P代表概率,
P ( A i | C , A j ) = P ( A i | C ) , &ForAll; A i , A j , P ( C ) > 0 ;
步骤3-2,假设A1,A2,........An是数据集n的特征,假设有m个类C={C1,C2,C3,.....Cm},给定一个具体的实例X,其属性为{x1,x2,....xm},这里xi是属性Ai的具体取值,该实例属于某一个类Ci的后验概率是P(X|Ci),c(X)表示分类所得的类标签,贝叶斯分类器表示为,
c(X)=argmaxP(Ci)P(X|Ci)。
7.根据权利要求1所述的图像分类识别判断方法,其特征在于,还包括:
步骤4,将分类后的图片按图片采集的时间顺序进行排列,利用时序关系进行图片颜色分类结果进行二次筛选。
8.根据权利要求7所述的图像分类识别判断方法,其特征在于,所述步骤4包括:
步骤4-1,给出一个标注预测结果的图片时间序列,Bi表示位于ti时刻的负例,Ri表示位于第j时刻的正例;定义两个相邻正例Ri和Rj之间的时间间隔为Gij=(j-i),滑动窗口W长度为L,在图片时间序列上,Wj标示滑动窗口W的其实位置滑动到第j时刻;
B0,B1,…,Ri,Bi+1,Bi+2,…,Rj,….Bn。
9.根据权利要求8所述的图像分类识别判断方法,其特征在于,所述步骤4-1包括:
进行显著相邻正例间隔,假设r为一个正例间隔长度,
若Xr=(Nr–N*Pr)/N*Pr(1-Pr)>Xsup,其中,Nr为所有长度小于等于r的相邻正例间隔个数,N为所有长度小于等于L的相邻正例间隔个数;Pr=r/L,L是滑动窗口长度,Xsup为一个人工给定的阈值,则所有长度不大于r的相邻正例间隔为显著相邻正例间隔,表示为sig(Gij);
进行显著滑动窗口:给定一个有效窗口Wj,其中的显著相邻正例间隔数大于给定的阈值Fsup,则Wj称为显著滑动窗口;
基于时序关系的正例预测结果筛选方法:计算每个正例图片存在于显著滑动窗口中的个数,这个值越大,则图片被正确预测为正例的概率越大,将每个被预测为正例的图片存在于显著滑动窗口中的个数作为预测结果输出。
CN201510274373.2A 2015-05-26 2015-05-26 图像分类识别判断方法 Active CN104951795B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510274373.2A CN104951795B (zh) 2015-05-26 2015-05-26 图像分类识别判断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510274373.2A CN104951795B (zh) 2015-05-26 2015-05-26 图像分类识别判断方法

Publications (2)

Publication Number Publication Date
CN104951795A true CN104951795A (zh) 2015-09-30
CN104951795B CN104951795B (zh) 2019-07-05

Family

ID=54166435

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510274373.2A Active CN104951795B (zh) 2015-05-26 2015-05-26 图像分类识别判断方法

Country Status (1)

Country Link
CN (1) CN104951795B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105809174A (zh) * 2016-03-29 2016-07-27 北京小米移动软件有限公司 识别图像的方法及装置
CN106910186A (zh) * 2017-01-13 2017-06-30 陕西师范大学 一种基于cnn深度学习的桥梁裂缝检测定位方法
CN109785292A (zh) * 2018-12-20 2019-05-21 江苏大学 一种基于机器视觉的芯线顺序判别方法
CN110243818A (zh) * 2019-07-17 2019-09-17 深圳市象形字科技股份有限公司 一种利用尿检仪进行饮食健康监控的方法
CN110502950A (zh) * 2019-08-09 2019-11-26 广东技术师范大学 一种光照不均的qr码快速自适应二值化方法
CN110517226A (zh) * 2019-07-24 2019-11-29 南京大树智能科技股份有限公司 基于双边滤波的多特征纹理图像融合的烟梗区域提取方法
CN111932431A (zh) * 2020-07-07 2020-11-13 华中科技大学 基于水印分解模型的可见水印去除方法和电子设备
CN118657917A (zh) * 2024-08-19 2024-09-17 山东济矿鲁能煤电股份有限公司阳城煤矿 用于煤矿井下低压漏电保护的图像增强的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101002682A (zh) * 2007-01-19 2007-07-25 哈尔滨工程大学 用于身份识别的手背静脉特征提取和匹配方法
CN101852768A (zh) * 2010-05-05 2010-10-06 电子科技大学 磁粉探伤环境下基于复合特征的工件伤痕识别方法
CN102663413A (zh) * 2012-03-09 2012-09-12 中盾信安科技(江苏)有限公司 一种面向多姿态和跨年龄的人脸图像认证方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101002682A (zh) * 2007-01-19 2007-07-25 哈尔滨工程大学 用于身份识别的手背静脉特征提取和匹配方法
CN101852768A (zh) * 2010-05-05 2010-10-06 电子科技大学 磁粉探伤环境下基于复合特征的工件伤痕识别方法
CN102663413A (zh) * 2012-03-09 2012-09-12 中盾信安科技(江苏)有限公司 一种面向多姿态和跨年龄的人脸图像认证方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
孙文荣等: "基于直方图均衡化、PCA 和SVM算法的人脸识别", 《软件》 *
王鹤智等: "阈值分割和数学形态学在遥感图像边缘提取中的应用", 《森林工程》 *
秦颖博: "基于改进的LBP 方法相结合的尿液细胞识别研究", 《计算机应用与软件》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105809174A (zh) * 2016-03-29 2016-07-27 北京小米移动软件有限公司 识别图像的方法及装置
CN105809174B (zh) * 2016-03-29 2019-04-30 北京小米移动软件有限公司 识别图像的方法及装置
CN106910186A (zh) * 2017-01-13 2017-06-30 陕西师范大学 一种基于cnn深度学习的桥梁裂缝检测定位方法
CN106910186B (zh) * 2017-01-13 2019-12-27 陕西师范大学 一种基于cnn深度学习的桥梁裂缝检测定位方法
CN109785292A (zh) * 2018-12-20 2019-05-21 江苏大学 一种基于机器视觉的芯线顺序判别方法
CN110243818A (zh) * 2019-07-17 2019-09-17 深圳市象形字科技股份有限公司 一种利用尿检仪进行饮食健康监控的方法
CN110517226A (zh) * 2019-07-24 2019-11-29 南京大树智能科技股份有限公司 基于双边滤波的多特征纹理图像融合的烟梗区域提取方法
CN110517226B (zh) * 2019-07-24 2021-04-09 南京大树智能科技股份有限公司 基于双边滤波的多特征纹理图像融合的烟梗区域提取方法
CN110502950A (zh) * 2019-08-09 2019-11-26 广东技术师范大学 一种光照不均的qr码快速自适应二值化方法
CN111932431A (zh) * 2020-07-07 2020-11-13 华中科技大学 基于水印分解模型的可见水印去除方法和电子设备
CN118657917A (zh) * 2024-08-19 2024-09-17 山东济矿鲁能煤电股份有限公司阳城煤矿 用于煤矿井下低压漏电保护的图像增强的方法

Also Published As

Publication number Publication date
CN104951795B (zh) 2019-07-05

Similar Documents

Publication Publication Date Title
CN104951795A (zh) 图像分类识别判断方法
CN104050471B (zh) 一种自然场景文字检测方法及系统
CN103761531B (zh) 基于形状轮廓特征的稀疏编码车牌字符识别方法
CN104504383B (zh) 一种基于肤色和Adaboost算法的人脸检测方法
CN108765443A (zh) 一种自适应颜色阈值分割的标志增强处理方法
CN106651872A (zh) 基于Prewitt算子的路面裂缝识别方法及系统
CN110866879B (zh) 一种基于多密度雨纹感知的图像去雨方法
CN103488974A (zh) 基于模拟生物视觉神经网络的人脸表情识别方法及系统
CN103824091B (zh) 一种用于智能交通系统的车牌识别方法
CN105809121A (zh) 多特征协同的交通标志检测与识别方法
CN109670515A (zh) 一种用于无人机影像中建筑物变化的检测方法及系统
CN110598560A (zh) 基于神经网络增强的夜间监控识别方法和系统
CN107066972B (zh) 基于多通道极值区域的自然场景文本检测方法
CN106599870A (zh) 一种基于自适应加权局部特征融合的人脸识别方法
CN102103690A (zh) 一种自动的头发区域分割方法
CN104751142A (zh) 一种基于笔划特征的自然场景文本检测算法
CN106529592A (zh) 一种基于混合特征与灰度投影的车牌识别方法
CN106529532A (zh) 一种基于积分特征通道与灰度投影的车牌识别系统
CN105447503A (zh) 基于稀疏表示lbp和hog融合的行人检测方法
CN103824081A (zh) 一种室外恶劣光照条件下的快速鲁棒交通标志检测方法
CN103996018A (zh) 基于4dlbp的人脸识别方法
CN104318252A (zh) 基于分层概率模型的高光谱图像分类方法
CN106934386A (zh) 一种基于自启发式策略的自然场景文字检测方法及系统
CN104217440B (zh) 一种从遥感图像中提取建成区的方法
CN110728302A (zh) 一种基于HSV和Lab颜色空间的色纺织物组织识别的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Image classification and recognition method

Effective date of registration: 20210126

Granted publication date: 20190705

Pledgee: Agricultural Bank of China Limited Chongqing Yubei sub branch

Pledgor: CHONGQING JINSHAN SCIENCE & TECHNOLOGY (GROUP) Co.,Ltd.

Registration number: Y2021500000004

PE01 Entry into force of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20220214

Granted publication date: 20190705

Pledgee: Agricultural Bank of China Limited Chongqing Yubei sub branch

Pledgor: CHONGQING JINSHAN SCIENCE & TECHNOLOGY (GROUP) Co.,Ltd.

Registration number: Y2021500000004

PC01 Cancellation of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Image classification, recognition and judgment method

Effective date of registration: 20220627

Granted publication date: 20190705

Pledgee: Agricultural Bank of China Limited Chongqing Yubei sub branch

Pledgor: CHONGQING JINSHAN SCIENCE & TECHNOLOGY (GROUP) Co.,Ltd.

Registration number: Y2022500000034

PE01 Entry into force of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20231020

Granted publication date: 20190705

Pledgee: Agricultural Bank of China Limited Chongqing Yubei sub branch

Pledgor: Chongqing Jinshan Medical Technology Research Institute Co.,Ltd.|BEIJING ZHONGJIN SILICON VALLEY TECHNOLOGY CO.,LTD.|CHONGQING JINSHAN SCIENCE & TECHNOLOGY (GROUP) Co.,Ltd.

Registration number: Y2022500000034

PC01 Cancellation of the registration of the contract for pledge of patent right
CP03 Change of name, title or address

Address after: 401120 18 neon Road, two Road Industrial Park, Yubei District, Chongqing

Patentee after: Chongqing Jinshan Technology Group Co.,Ltd.

Country or region after: China

Address before: 401120 18 neon Road, two Road Industrial Park, Yubei District, Chongqing

Patentee before: CHONGQING JINSHAN SCIENCE & TECHNOLOGY (GROUP) Co.,Ltd.

Country or region before: China

CP03 Change of name, title or address