CN106295653B - 一种水质图像分类方法 - Google Patents

一种水质图像分类方法 Download PDF

Info

Publication number
CN106295653B
CN106295653B CN201610620318.9A CN201610620318A CN106295653B CN 106295653 B CN106295653 B CN 106295653B CN 201610620318 A CN201610620318 A CN 201610620318A CN 106295653 B CN106295653 B CN 106295653B
Authority
CN
China
Prior art keywords
water quality
image
color
images
key point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610620318.9A
Other languages
English (en)
Other versions
CN106295653A (zh
Inventor
赵杰煜
叶绪伦
蒋玉
钟意伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ningbo University
Original Assignee
Ningbo University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ningbo University filed Critical Ningbo University
Priority to CN201610620318.9A priority Critical patent/CN106295653B/zh
Publication of CN106295653A publication Critical patent/CN106295653A/zh
Application granted granted Critical
Publication of CN106295653B publication Critical patent/CN106295653B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • G06V10/464Salient features, e.g. scale invariant feature transforms [SIFT] using a plurality of salient features, e.g. bag-of-words [BoW] representations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • G06V10/507Summing image-intensity values; Histogram projection analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种水质图像分类方法,使用多特征融合的词包对水质图像进行分类,具体包括以下步骤:①水质图像采集;②对水质图像中的关键点进行方向梯度直方图与颜色特征的提取,融合成描述当前关键点的特征向量;③对图像生成的各关键点特征向量进行编码生成图像词包;④使用图像词包和类别标签训练监督型主题模型,用于后续的分类任务中;⑤将需要分类的水质图像作为输入图像,根据步骤②的方法对该输入图像进行特征提取操作,并量化成词包,然后使用步骤④得到的训练后的监督型主题模型进行分类,得到输入图像所属的类别;优点是能够消除图像特征中的冗余像素,消除视觉词典中视觉单词间的相关和冗余性,从而提高水质图像识别率。

Description

一种水质图像分类方法
技术领域
本发明涉及一种图像分类技术,尤其是涉及一种水质图像分类方法。
背景技术
近年来随着人们对水环境越来越重视,水资源保护越来越受到关注。对于水资源监测,目前常用的方法有生物式水质监测方法和利用各种传感器进行水质监测的方法。生物式水质监测方法,例如德国的BBE公司研发的基于动态图像理解的生物式水质监测系统,其通过水蚤、鱼类的行为习惯和分布状态受水质的影响实现对水质的评价,但是这种方法受实验环境约束,在复杂的自然水环境下,易产生误判,同时不能对污染源做出判定。利用各种传感器进行水质监测的方法,例如利用温度、溶氧度、PH值等传感器,这种方法可以得到的水体质量的精确数据,但是成本相对较高且测量参数有限,直观性不足。
运用图像分析技术进行水质评估,具有成本低廉、通用性强、数据采集便捷等优点,通过调查和采集,水质图像区域分布具有不规则性,出现的水质异常部分作为感兴趣区域,这些感兴趣区域作为分类的主要依据。对感兴趣区域划分,大致可分为:正常,水华污染,水葫芦污染,工厂排污污染,生活垃圾污染5种水质。正常的水质应该通透,无异常颜色,且具有斑驳感。水华污染的水质,颜色呈绿色,通透性弱,有粒状绿色区域。水葫芦污染的水质,水面上具有水葫芦区域。工厂排污的水质,主要是颜色出现异常,甚至会产生许多白色气泡。生活垃圾污染的水质,水面漂着大量无规则物体,水体浑浊。可见五类水质图像具有明显不同的特点。
水质图像分类的难点有两方面:一是光照变化会使得水面发生很大变化,例如水体的颜色在不同光照下有明显不同;另一方面,污染区域的纹理在复杂的水情下也会产生变化,例如水华和水葫芦的纹理容易产生混淆。
发明内容
本发明所要解决的技术问题是提供一种准确有效的水质图像分类方法。
本发明解决上述技术问题所采用的技术方案为:一种水质图像分类方法,使用多特征融合的词包对水质图像进行分类,具体包括以下步骤:
①水质图像采集,标记水质图像类别标签,以指示训练图像属于正常,水华污染,水葫芦污染,工厂排污污染和生活垃圾污染五种图像中的哪个类别;
②对水质图像使用图像金字塔进行关键点检测,并对水质图像中的关键点进行方向梯度直方图与颜色特征的提取,融合成描述当前关键点的特征向量;
③使用狄利克雷混合模型进行视觉词典学习,对图像生成的各关键点特征向量进行编码生成图像词包,具体过程为:
设模型的后验概率为
Figure GDA0002232819570000021
K取值为1000,将其作为每个关键点可能属于的类别数,N为样本数,qγk(Vk)是参数为γk,1k,2的贝塔分布,Vk是该分布的随机变量,为一实值随机数;
Figure GDA0002232819570000022
是参数为
Figure GDA0002232819570000023
的高斯威沙特分布,其中
Figure GDA0002232819570000024
为一个35维的列向量,ak为实值,Bk为35*35的矩阵,I为35*35的单位矩阵,
Figure GDA0002232819570000025
是该分布的随机变量,分别取两个随机向量,一个是35维的列向量,一个是35*35的矩阵;
Figure GDA0002232819570000026
是参数为
Figure GDA0002232819570000027
的多项式分布,
Figure GDA0002232819570000028
表示第n个样本属于1000个类别中第1个类别的概率,zn是该分布的随机变量,为一实值整数随机数;
③-1、将类别数K作为初始化类别数,给定一个初始化模型参数λ,λ取高斯威沙特分布的四个参数,分别为均值参数0,方差矩阵,取35*35的单位矩阵I,自由度参数取为关键点特征维数D,取值为35,尺度矩阵,取35*35的单位矩阵I,随机初始化参数
Figure GDA0002232819570000029
表示每个样本属于K个类别的概率,总概率相加为1;
③-2、对于训练样本中的每个关键点,记其特征为Xi,计算后验概率中的贝塔分布参数以及共轭分布参数
Figure GDA00022328195700000210
Figure GDA00022328195700000211
Figure GDA00022328195700000212
Figure GDA00022328195700000213
Figure GDA00022328195700000214
其中D为关键点特征维数,取值为35,
Figure GDA0002232819570000031
表示第i个样本属于k类别的后验概率,γk,1k,2是后验概率q(Vkk *,zn)中贝塔分布
Figure GDA0002232819570000032
的两个参数,ak
Figure GDA0002232819570000033
Bk,I表示q(Vkk *,zn)中高斯威沙特分布
Figure GDA0002232819570000034
的四个参数,其中I为单位矩阵,k从1取到1000,α为模型参数,取值为0.001;
③-3、对于每个样本,根据以下公式求该样本对应每个类别的概率:
Figure GDA0002232819570000035
其中
Figure GDA0002232819570000036
的取值如下:
Figure GDA0002232819570000037
D为关键点特征维数,取值为35,e为自然底数,π为圆周率常数,ψ()为伽马函数的二阶导数,
Figure GDA0002232819570000038
是参数为
Figure GDA0002232819570000039
的高斯分布,包含两个参数,分别是均值向量和方差矩阵;
③-4、观察
Figure GDA00022328195700000310
的变化情况,若该值不变,则停止更新,否则转③-2重新计算,当停止更新时,记住此时的变分后验概率参数γk,1k,2
Figure GDA00022328195700000311
对于对应的所有N个样本,用狄利克雷混合模型估算得出N个样本所属类别,并将不同的类别数记为H,然后将H个不同的类别记为视觉词典;
③-5、对于每个关键点特征Xi,使用训练得到的γk,1k,2
Figure GDA00022328195700000312
估算特征Xi属于每个类别的后验概率:
Figure GDA00022328195700000313
Figure GDA00022328195700000314
③-6、找到当前关键点特征Xi在视觉词典中所属的视觉单词wi,估算公式如下:
Figure GDA00022328195700000315
在该编码中,找到使得
Figure GDA00022328195700000316
最大的k值将其作为当前关键点特征Xi在视觉词典中的视觉单词wi,将其作为当前关键点特征Xi所属的视觉单词;
③-7、对于每幅水质图像,首先使用图像金字塔得到所有的关键点,然后得到每个关键点的35维特征向量,重复步骤③-5、③-6得到所有关键点属于词典中的哪个视觉单词,形成水质图像的视觉词包;
④使用图像词包和类别标签训练监督型主题模型,得到监督型主题模型参数,并将训练得到的监督型主题模型用于后续的分类任务中;
⑤将需要分类的水质图像作为输入图像,根据步骤②的方法对该输入图像进行特征提取操作,并量化成词包,然后使用步骤④得到的训练后的监督型主题模型进行分类,得到输入图像所属的类别。
所述步骤①的具体过程为:
①-1、采用高清摄像机或照相机对水面图像进行采集,将采集的水质图像分成5类,分别为正常,水华污染,水葫芦污染,工厂排污污染和生活垃圾污染;
①-2、对采集的水质图像进行初步处理,去掉包含人和船只的图像,对于出现两类及以上污染的水质图像,将其所属污染区域分割开,作为多幅训练图像;
①-3、使用图像缩放方法,对图像大小进行调整,将其调整为400*400大小的图像;
①-4、对5类水质图像给定训练标签:正常标签为1,水华污染标签为2,水葫芦污染标签为3,工厂排污污染标签为4,生活垃圾污染标签为5。
所述步骤②的具体过程为:
②-1、使用图像金字塔标定水质图像的关键点;
②-2、计算以当前关键点为中心的24*24邻域窗口内的所有像素点的R、G、B三个颜色通道颜色均值;
②-3、将256颜色通道转换为64颜色通道,将第c个颜色通道的颜色均值映射到64色颜色空间后的值记为blockc
Figure GDA0002232819570000041
其中,1≤c≤3,c=1时第c个颜色通道为R颜色通道,c=2时第c个颜色通道为G颜色通道,c=3时第c个颜色通道为B颜色通道,block表示第c个颜色通道的颜色均值,colorm表示64色颜色空间中的第m种颜色,1≤m≤64,符号“|| ||”为求欧氏距离符号,
Figure GDA0002232819570000051
表示取使得||block-colorm||的值最小的一种颜色,将最小的颜色取为当前通道的颜色值,三个通道共形成三个颜色特征;
②-4、采用Gamma校正法对输入图像进行颜色空间的归一化;
②-5、将当前关键点所在的24*24的像素区域分化成16个cell,6*6像素/cell,计算单个cell中每个像素的梯度方向
Figure GDA0002232819570000052
和梯度大小
Figure GDA0002232819570000053
这里x和y表示该像素点的坐标,f(x,y)表示像素在x和y的灰度值,统计每个cell的梯度直方图,形成每个cell的描述;将相邻4*4的cell组成一个block,并将一个block内所有的cell的特征串联起来,得到该关键点的方向梯度直方图特征描述。
所述步骤④、⑤的具体过程为:
④-1、输入每一副图像的视觉词包,将其记为r,以及对应的水质图像类别标签,将其记为C;
④-2、在监督型主题模型中,使用变分方法学习得到训练后的监督型主题模型;
⑤-1、将摄像头采集的水质图像进行特征提取,得到图像的每个关键点特征Xi的特征向量;
⑤-2、对于每个关键点特征Xi,估算Xi属于每个类别的概率:
Figure GDA0002232819570000054
其中
Figure GDA0002232819570000055
的取值如下:
Figure GDA0002232819570000056
然后计算当前关键点特征Xi在视觉词典中所属的视觉单词wi,估算公式如下:
Figure GDA0002232819570000057
对当前水质图像的所有关键点特征Xi,计算其所属视觉单词wi,然后形成图像词包;
⑤-3、将该幅水质图像的图像词包代入训练后的监督型主题模型中,得到类别标签。
与现有技术相比,本发明的优点在于:
1)本发明方法首先采用高斯金字塔检测图像中的极值点,这样有利于消除图像特征中的冗余像素,提高识别精度;
2)在建立视觉词典时,本发明方法使用狄利克雷混合模型进行水质图像视觉词典生成,相比于传统视觉词典学习中的传统的确定大小的模型相比,该算法能自动估算视觉词典数目,有利于消除视觉词典中视觉单词间的相关和冗余性;
3)在进行识别时,利用视觉词典首先得到图像视觉词包模型,然后再训练监督型主题模型,引入该模型使得水质图像识别框架在统计角度描述了水质图像中的随机因素,同时在语义层次描述水质图像的各类特征,从而提高水质图像识别率。
附图说明
图1为本发明方法水质图像分类过程示意图;
图2为本发明方法中不同尺度的高斯金字塔描述示意图;
图3为本发明监督型主题模型图示意图;
图4为狄利克雷混合模型概率图示意图;
图5为不同污染水质的示意图片。
具体实施方式
以下结合附图实施例对本发明作进一步详细描述。
一种水质图像分类方法,使用多特征融合的词包对水质图像进行分类,具体包括以下步骤:
①-1、采用高清摄像机或照相机,对正常水面、水华污染水面、水葫芦污染水面、工厂排污污染水面和生活垃圾污染水面分别进行M次图像采集,得到每种水面的M幅水质图像,将采集的水质图像分成5类,分别为正常,水华污染,水葫芦污染,工厂排污污染和生活垃圾污染;在图像采集时,正常水面、水华污染水面、水葫芦污染水面、工厂排污污染水面和生活垃圾污染水面是通过人眼判定的,对每种水质图像采集最好在多个不同的地方采集,在此要求采集图片数目M≥100,这样可有效提高该水质图像分类方法的鲁棒性,在此基础上,M越大越好。
①-2、对采集的水质图像进行初步处理,去掉包含人和船只的图像,对于出现两类及以上污染的水质图像,将其所属污染区域分割开,作为多幅训练图像;
①-3、使用现有的图像缩放方法,对得到的所有水质图像大小进行调整,将其调整为像素为400*400大小的图像,使所有水质图像的大小一致;
①-4、对5类水质图像给定训练标签:正常标签为1,水华污染标签为2,水葫芦污染标签为3,工厂排污污染标签为4,生活垃圾污染标签为5;
②-1、使用图像金字塔标定水质图像的关键点,得到每幅水质图像中的每个关键点的位置信息,图2给出了采用高斯金字塔提取关键点的位置信息示意图;
②-2、计算以当前关键点为中心的24*24邻域窗口内的所有像素点的R、G、B三个颜色通道颜色均值;
②-3、将256颜色通道转换为64颜色通道,将第c个颜色通道的颜色均值映射到64色颜色空间后的值记为blockc
Figure GDA0002232819570000071
其中,1≤c≤3,c=1时第c个颜色通道为R颜色通道,c=2时第c个颜色通道为G颜色通道,c=3时第c个颜色通道为B颜色通道,block表示第c个颜色通道的颜色均值,colorm表示64色颜色空间中的第m种颜色,1≤m≤64,符号“|| ||”为求欧氏距离符号,
Figure GDA0002232819570000072
表示取使得||block-colorm||的值最小的一种颜色,将最小的颜色取为当前通道的颜色值,三个通道共形成三个颜色特征;
②-4、采用Gamma校正法对输入图像进行颜色空间的归一化;
②-5、将当前关键点所在的24*24的像素区域分化成16个cell,6*6像素/cell,计算单个cell中每个像素的梯度方向
Figure GDA0002232819570000073
和梯度大小
Figure GDA0002232819570000074
这里x和y表示该像素点的坐标,f(x,y)表示像素在x和y的灰度值,统计每个cell的梯度直方图,形成每个cell的描述;将相邻4*4的cell组成一个block,并将一个block内所有的cell的特征串联起来,得到该关键点的方向梯度直方图特征描述;
设模型的后验概率为
Figure GDA0002232819570000081
K取值为1000,将其作为每个关键点可能属于的类别数,N为样本数,
Figure GDA0002232819570000082
是参数为γk,1k,2的贝塔分布,Vk是该分布的随机变量,为一实值随机数;
Figure GDA0002232819570000083
是参数为
Figure GDA0002232819570000084
的高斯威沙特分布,其中
Figure GDA0002232819570000085
为一个35维的列向量,ak为实值,Bk为35*35的矩阵,I为35*35的单位矩阵,
Figure GDA0002232819570000086
是该分布的随机变量,分别取两个随机向量,一个是35维的列向量,一个是35*35的矩阵;
Figure GDA0002232819570000087
是参数为
Figure GDA0002232819570000088
的多项式分布,
Figure GDA0002232819570000089
表示第n个样本属于1000个类别中第1个类别的概率,zn是该分布的随机变量,为一实值整数随机数;
③-1、将类别数K作为初始化类别数,给定一个初始化模型参数λ,λ取高斯威沙特分布的四个参数,分别为均值参数0,方差矩阵,取35*35的单位矩阵I,自由度参数取为关键点特征维数D,取值为35,尺度矩阵,取35*35的单位矩阵I,随机初始化参数
Figure GDA00022328195700000810
表示每个样本属于K个类别的概率,总概率相加为1;
③-2、对于训练样本中的每个关键点,记其特征为Xi,计算后验概率中的贝塔分布参数以及共轭分布参数
Figure GDA00022328195700000811
Figure GDA00022328195700000812
Figure GDA00022328195700000813
Figure GDA00022328195700000814
Figure GDA00022328195700000815
其中D为关键点特征维数,取值为35,
Figure GDA00022328195700000821
表示第i个样本属于k类别的后验概率,γk,1k,2是后验概率q(Vkk *,zn)中贝塔分布
Figure GDA00022328195700000816
的两个参数,ak
Figure GDA00022328195700000817
Bk,I表示q(Vkk *,zn)中高斯威沙特分布
Figure GDA00022328195700000818
的四个参数,其中I为单位矩阵,k从1取到1000,α为模型参数,取值为0.001;
③-3、对于每个样本,根据以下公式求该样本对应每个类别的概率:
Figure GDA00022328195700000819
其中
Figure GDA00022328195700000820
的取值如下:
Figure GDA0002232819570000091
D为关键点特征维数,取值为35,e为自然底数,π为圆周率常数,ψ()为伽马函数的二阶导数,
Figure GDA0002232819570000092
是参数为
Figure GDA0002232819570000093
的高斯分布,包含两个参数,分别是均值向量和方差矩阵;
③-4、观察
Figure GDA0002232819570000094
的变化情况,若该值不变,则停止更新,否则转③-2重新计算,当停止更新时,记住此时的变分后验概率参数γk,1k,2
Figure GDA0002232819570000095
对于对应的所有N个样本,用狄利克雷混合模型估算得出N个样本所属类别,并将不同的类别数记为H,然后将H个不同的类别记为视觉词典;
③-5、对于每个关键点特征Xi,使用训练得到的γk,1k,2
Figure GDA0002232819570000096
估算特征Xi属于每个类别的后验概率:
Figure GDA0002232819570000097
Figure GDA0002232819570000098
③-6、找到当前关键点特征Xi在视觉词典中所属的视觉单词wi,估算公式如下:
Figure GDA0002232819570000099
在该编码中,找到使得
Figure GDA00022328195700000910
最大的k值将其作为当前关键点特征Xi在视觉词典中的视觉单词wi,将其作为当前关键点特征Xi所属的视觉单词;
③-7、对于每幅水质图像,首先使用图像金字塔得到所有的关键点,然后得到每个关键点的35维特征向量,重复步骤③-5、③-6得到所有关键点属于词典中的哪个视觉单词,形成水质图像的视觉词包;
④-1、输入每一副图像的视觉词包,将其记为r,以及对应的水质图像类别标签,将其记为C;
④-2、在监督型主题模型中,使用变分方法学习得到监督型主题模型;
⑤-1、将摄像头采集的水质图像进行特征提取,得到图像的每个关键点特征Xi的特征向量;
⑤-2、对于每个关键点特征Xi,估算Xi属于每个类别的概率:
Figure GDA0002232819570000101
其中
Figure GDA0002232819570000102
的取值如下:
Figure GDA0002232819570000103
然后计算当前关键点特征Xi在视觉词典中所属的视觉单词wi,估算公式如下:
Figure GDA0002232819570000104
对当前水质图像的所有关键点特征Xi,计算其所属视觉单词wi,然后形成图像词包;
⑤-3、将该幅水质图像的图像词包代入训练后的监督型主题模型中,得到类别标签。
上述实施例中,监督型主题模型及如何通过变分方法学习得到训练后的监督型主题模型,采用现有技术《Wang C,Blei D,Li F F.Simultaneous image classificationand annotation[C]//IEEE Conference on Computer Vision&PatternRecognition.2009:1903-1910.)》中的方法。

Claims (4)

1.一种水质图像分类方法,其特征在于使用多特征融合的词包对水质图像进行分类,具体包括以下步骤:
①水质图像采集,标记水质图像类别标签,以指示训练图像属于正常,水华污染,水葫芦污染,工厂排污污染和生活垃圾污染五种图像中的哪个类别;
②对水质图像使用图像金字塔进行关键点检测,并对水质图像中的关键点进行方向梯度直方图与颜色特征的提取,融合成描述当前关键点的特征向量;
③使用狄利克雷混合模型进行视觉词典学习,对图像生成的各关键点特征向量进行编码生成图像词包,具体过程为:
设模型的后验概率为
Figure FDA0002293186360000011
K取值为1000,将其作为每个关键点可能属于的类别数,N为样本数,
Figure FDA0002293186360000012
是参数为γk,1k,2的贝塔分布,Vk是该分布的随机变量,为一实值随机数;
Figure FDA0002293186360000013
是参数为
Figure FDA0002293186360000014
的高斯威沙特分布,其中
Figure FDA0002293186360000015
为一个35维的列向量,ak为实值,Bk为35*35的矩阵,I为35*35的单位矩阵,
Figure FDA0002293186360000016
是该分布的随机变量,分别取两个随机向量,一个是35维的列向量,一个是35*35的矩阵;
Figure FDA0002293186360000017
是参数为
Figure FDA0002293186360000018
的多项式分布,
Figure FDA0002293186360000019
表示第n个样本属于1000个类别中第1个类别的概率,zn是该分布的随机变量,为一实值整数随机数;
③-1、将类别数K作为初始化类别数,给定一个初始化模型参数λ,λ取高斯威沙特分布的四个参数,分别为均值参数0,方差矩阵,取35*35的单位矩阵I,自由度参数取为关键点特征维数D,取值为35,尺度矩阵,取35*35的单位矩阵I,随机初始化参数
Figure FDA00022931863600000110
表示每个样本属于K个类别的概率,总概率相加为1;
③-2、对于训练样本中的每个关键点,记其特征为Xi,计算后验概率中的贝塔分布参数以及共轭分布参数
Figure FDA00022931863600000111
Figure FDA00022931863600000112
Figure FDA00022931863600000113
Figure FDA00022931863600000114
Figure FDA00022931863600000115
其中D为关键点特征维数,取值为35,
Figure FDA0002293186360000021
表示第i个样本属于k类别的后验概率,γk,1k,2是后验概率q(Vkk *,zn)中贝塔分布
Figure FDA0002293186360000022
的两个参数,ak
Figure FDA0002293186360000023
Bk,I表示q(Vkk *,zn)中高斯威沙特分布
Figure FDA0002293186360000024
的四个参数,其中I为单位矩阵,k从1取到1000,α为模型参数,取值为0.001;
③-3、对于每个样本,根据以下公式求该样本对应每个类别的概率:
Figure FDA0002293186360000025
其中
Figure FDA0002293186360000026
的取值如下:
Figure FDA0002293186360000027
D为关键点特征维数,取值为35,e为自然底数,π为圆周率常数,ψ()为伽马函数的二阶导数,
Figure FDA0002293186360000028
是参数为
Figure FDA0002293186360000029
的高斯分布,包含两个参数,分别是均值向量和方差矩阵;
③-4、观察
Figure FDA00022931863600000210
的变化情况,若该值不变,则停止更新,否则转③-2重新计算,当停止更新时,记住此时的变分后验概率参数γk,1k,2
Figure FDA00022931863600000211
对于对应的所有N个样本,用狄利克雷混合模型估算得出N个样本所属类别,并将不同的类别数记为H,然后将H个不同的类别记为视觉词典;
③-5、对于每个关键点特征Xi,使用训练得到的
Figure FDA00022931863600000212
估算特征Xi属于每个类别的后验概率:
Figure FDA00022931863600000213
Figure FDA00022931863600000214
③-6、找到当前关键点特征Xi在视觉词典中所属的视觉单词wi,估算公式如下:
Figure FDA00022931863600000215
在该编码中,找到使得
Figure FDA00022931863600000216
最大的k值将其作为当前关键点特征Xi在视觉词典中的视觉单词wi,将其作为当前关键点特征Xi所属的视觉单词;
③-7、对于每幅水质图像,首先使用图像金字塔得到所有的关键点,然后得到每个关键点的35维特征向量,重复步骤③-5、③-6得到所有关键点属于词典中的哪个视觉单词,形成水质图像的视觉词包;
④使用图像词包和类别标签训练监督型主题模型,得到监督型主题模型参数,并将训练得到的监督型主题模型用于后续的分类任务中;
⑤将需要分类的水质图像作为输入图像,根据步骤②的方法对该输入图像进行特征提取操作,并量化成词包,然后使用步骤④得到的训练后的监督型主题模型进行分类,得到输入图像所属的类别。
2.如权利要求1所述的一种水质图像分类方法,其特征在于所述步骤①的具体过程为:
①-1、采用高清摄像机或照相机对水面图像进行采集,将采集的水质图像分成5类,分别为正常,水华污染,水葫芦污染,工厂排污污染和生活垃圾污染;
①-2、对采集的水质图像进行初步处理,去掉包含人和船只的图像,对于出现两类及以上污染的水质图像,将其所属污染区域分割开,作为多幅训练图像;
①-3、使用图像缩放方法,对图像大小进行调整,将其调整为400*400大小的图像;
①-4、对5类水质图像给定训练标签:正常标签为1,水华污染标签为2,水葫芦污染标签为3,工厂排污污染标签为4,生活垃圾污染标签为5。
3.如权利要求1所述的一种水质图像分类方法,其特征在于所述步骤②的具体过程为:
②-1、使用图像金字塔标定水质图像的关键点;
②-2、计算以当前关键点为中心的24*24邻域窗口内的所有像素点的R、G、B三个颜色通道颜色均值;
②-3、将256颜色通道转换为64颜色通道,将第c个颜色通道的颜色均值映射到64色颜色空间后的值记为blockc
Figure FDA0002293186360000031
其中,1≤c≤3,c=1时第c个颜色通道为R颜色通道,c=2时第c个颜色通道为G颜色通道,c=3时第c个颜色通道为B颜色通道,block表示第c个颜色通道的颜色均值,colorm表示64色颜色空间中的第m种颜色,1≤m≤64,符号“||||”为求欧氏距离符号,
Figure FDA0002293186360000041
表示取使得||block-colorm||的值最小的一种颜色,将最小的颜色取为当前通道的颜色值,三个通道共形成三个颜色特征;
②-4、采用Gamma校正法对输入图像进行颜色空间的归一化;
②-5、将当前关键点所在的24*24的像素区域分化成16个cell,6*6像素/cell,计算单个cell中每个像素的梯度方向
Figure FDA0002293186360000042
和梯度大小
Figure FDA0002293186360000043
这里x和y表示该像素点的坐标,f(x,y)表示像素在x和y的灰度值,统计每个cell的梯度直方图,形成每个cell的描述;将相邻4*4的cell组成一个block,并将一个block内所有的cell的特征串联起来,得到该关键点的方向梯度直方图特征描述。
4.如权利要求1所述的一种水质图像分类方法,其特征在于所述步骤④、⑤的具体过程为:
④-1、输入每一副图像的视觉词包,将其记为r,以及对应的水质图像类别标签,将其记为C;
④-2、在监督型主题模型中,使用变分方法学习得到训练后的监督型主题模型;
⑤-1、将摄像头采集的水质图像进行特征提取,得到图像的每个关键点特征Xi的特征向量;
⑤-2、对于每个关键点特征Xi,估算Xi属于每个类别的概率:
Figure FDA0002293186360000044
其中
Figure FDA0002293186360000045
的取值如下:
Figure FDA0002293186360000046
然后计算当前关键点特征Xi在视觉词典中所属的视觉单词wi,估算公式如下:
Figure FDA0002293186360000051
对当前水质图像的所有关键点特征Xi,计算其所属视觉单词wi,然后形成图像词包;
⑤-3、将该幅水质图像的图像词包代入训练后的监督型主题模型中,得到类别标签。
CN201610620318.9A 2016-07-29 2016-07-29 一种水质图像分类方法 Active CN106295653B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610620318.9A CN106295653B (zh) 2016-07-29 2016-07-29 一种水质图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610620318.9A CN106295653B (zh) 2016-07-29 2016-07-29 一种水质图像分类方法

Publications (2)

Publication Number Publication Date
CN106295653A CN106295653A (zh) 2017-01-04
CN106295653B true CN106295653B (zh) 2020-03-31

Family

ID=57663865

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610620318.9A Active CN106295653B (zh) 2016-07-29 2016-07-29 一种水质图像分类方法

Country Status (1)

Country Link
CN (1) CN106295653B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874948A (zh) * 2017-02-08 2017-06-20 武汉海卓科科技有限公司 一种黑臭水自动识别与评估方法
CN107421510A (zh) * 2017-08-28 2017-12-01 爱易成技术(天津)有限公司 一种水文监测设备及方法
CN107514626B (zh) * 2017-09-01 2019-05-10 浙江大唐国际绍兴江滨热电有限责任公司 一种锅炉定排水池排水回收方法及装置
CN108020501B (zh) * 2017-11-15 2019-08-20 华南理工大学 一种大气腐蚀等级图绘制方法
CN109118548A (zh) * 2018-07-17 2019-01-01 浙江大学 一种综合智能水质识别方法
CN109187534A (zh) * 2018-08-01 2019-01-11 江苏凯纳水处理技术有限公司 水质检测方法及其水样图像识别装置
CN109325403B (zh) * 2018-08-07 2020-12-11 广州粤建三和软件股份有限公司 一种基于图像识别的水域污染识别治理方法和系统
CN110222698B (zh) * 2019-05-24 2020-12-29 广东沁华智能环境技术股份有限公司 一种基于色彩信息处理进行水质分析的方法及系统
CN110311743B (zh) * 2019-06-05 2021-06-22 宁波大学 一种变分推断估计主用户占空比的方法
CN110289924B (zh) * 2019-06-05 2021-06-22 宁波大学 一种变分推断估计噪声功率的方法
CN110289925B (zh) * 2019-06-05 2021-06-11 宁波大学 一种判决后变分推断估计主用户占空比的方法
CN110334673A (zh) * 2019-07-10 2019-10-15 青海中水数易信息科技有限责任公司 具有智能识别图像功能的河长制信息化系统及方法
CN112468961A (zh) * 2020-11-25 2021-03-09 浙江有色勘测规划设计有限公司 水体污染检测数据处理方法、系统、终端及介质
CN113033313A (zh) * 2021-02-26 2021-06-25 澜途集思生态科技集团有限公司 基于深度学习的水质污染判断方法
CN113469090B (zh) * 2021-07-09 2023-07-14 王晓东 水质污染预警方法、装置及存储介质
CN113936132B (zh) * 2021-12-16 2022-03-11 山东沃能安全技术服务有限公司 基于计算机视觉的化工厂水体污染检测方法与系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102819746A (zh) * 2012-07-10 2012-12-12 电子科技大学 基于作者-流派主题模型的遥感图像自动类别标注方法
CN103440501A (zh) * 2013-09-01 2013-12-11 西安电子科技大学 基于非参数空间判决隐狄利克雷模型的场景分类方法
CN105677769A (zh) * 2015-12-29 2016-06-15 广州神马移动信息科技有限公司 一种基于潜在狄利克雷分配(lda)模型的关键词推荐方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102819746A (zh) * 2012-07-10 2012-12-12 电子科技大学 基于作者-流派主题模型的遥感图像自动类别标注方法
CN103440501A (zh) * 2013-09-01 2013-12-11 西安电子科技大学 基于非参数空间判决隐狄利克雷模型的场景分类方法
CN105677769A (zh) * 2015-12-29 2016-06-15 广州神马移动信息科技有限公司 一种基于潜在狄利克雷分配(lda)模型的关键词推荐方法和系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Simultaneous Image Classification and Annotation;Chong Wang.et.;《2009 IEEE Conference on Computer Vision and Pattern Recognition》;20091231;第1903-1910页 *
图像场景分类中视觉词包模型方法综述;赵理君等;《中国图象图形学报》;20141231(第3期);第333-343页 *
基于视觉特征和主题模型的自然场景分类;钟意伟;《中国优秀硕士学位论文全文数据库 信息科技辑》;20150315(第3期);摘要和第15-29、49-55页 *

Also Published As

Publication number Publication date
CN106295653A (zh) 2017-01-04

Similar Documents

Publication Publication Date Title
CN106295653B (zh) 一种水质图像分类方法
CN111709909B (zh) 基于深度学习的通用印刷缺陷检测方法及其模型
CN108562589B (zh) 一种对磁路材料表面缺陷进行检测的方法
CN111563452B (zh) 一种基于实例分割的多人体姿态检测及状态判别方法
CN106529537A (zh) 一种数字仪表读数图像识别方法
CN110598693A (zh) 一种基于Faster-RCNN的船牌识别方法
CN107038416B (zh) 一种基于二值图像改进型hog特征的行人检测方法
CN111310850B (zh) 车牌检测模型的构建方法及系统、车牌检测方法及系统
CN109712105A (zh) 一种结合彩色和深度信息的图像显著目标检测方法
CN109840483B (zh) 一种滑坡裂缝检测与识别的方法及装置
CN111310756A (zh) 一种基于深度学习的损伤玉米颗粒检测和分类方法
CN109189965A (zh) 图像文字检索方法及系统
CN113870254B (zh) 目标对象的检测方法、装置、电子设备及存储介质
CN106340007A (zh) 一种基于图像处理的车身漆膜缺陷检测识别方法
CN109086772A (zh) 一种扭曲粘连字符图片验证码的识别方法及系统
CN114463843A (zh) 一种基于深度学习的多特征融合鱼类异常行为检测方法
CN116188756A (zh) 一种基于深度学习的仪表角度校正与示数识别方法
CN113780484B (zh) 工业产品缺陷检测方法和装置
CN109815957A (zh) 一种基于彩色图像在复杂背景下的文字识别方法
CN105243390B (zh) 昆虫图像检测方法以及昆虫分类方法
CN110188662A (zh) 一种水表数字的ai智能识别方法
CN111274882A (zh) 基于弱监督的人脸年龄自动估计方法
CN116343205A (zh) 一种浮游藻类细胞荧光-明场显微图像自动标注方法
CN115082922A (zh) 基于深度学习的水表数字图片处理方法及系统
CN112364844B (zh) 一种基于计算机视觉技术的数据采集方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant