CN105488536A - 一种基于多特征深度学习技术的农田害虫图像识别方法 - Google Patents

一种基于多特征深度学习技术的农田害虫图像识别方法 Download PDF

Info

Publication number
CN105488536A
CN105488536A CN201510923464.4A CN201510923464A CN105488536A CN 105488536 A CN105488536 A CN 105488536A CN 201510923464 A CN201510923464 A CN 201510923464A CN 105488536 A CN105488536 A CN 105488536A
Authority
CN
China
Prior art keywords
feature
phi
sigma
represent
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510923464.4A
Other languages
English (en)
Other versions
CN105488536B (zh
Inventor
谢成军
宋良图
张超凡
李�瑞
张洁
周林立
陈红波
刘磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Institutes of Physical Science of CAS
Original Assignee
Hefei Institutes of Physical Science of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Institutes of Physical Science of CAS filed Critical Hefei Institutes of Physical Science of CAS
Priority to CN201510923464.4A priority Critical patent/CN105488536B/zh
Publication of CN105488536A publication Critical patent/CN105488536A/zh
Application granted granted Critical
Publication of CN105488536B publication Critical patent/CN105488536B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于多特征深度学习技术的农田害虫图像识别方法,与现有技术相比解决了复杂环境条件下害虫图像识别性能差的缺陷。本发明包括以下步骤:针对大规模害虫图像样本进行多特征提取,提取大规模害虫图像样本的颜色特征、纹理特征、形状特征、尺度不变特征转换特征和方向梯度直方图特征;多特征深度学习,对不同类型特征分别进行非监督字典训练,获得不同类型特征的稀疏表示;训练样本的多特征表示,通过结合不同类型特征,构建害虫图像样本的多特征表示形式-多特征稀疏编码直方图;构建多核学习分类器,通过学习害虫图像正负样本的稀疏编码直方图构建多核分类器,实现害虫图像的分类。本发明提高了害虫识别的准确率。

Description

一种基于多特征深度学习技术的农田害虫图像识别方法
技术领域
本发明涉及图像处理技术领域,具体来说是一种基于多特征深度学习技术的农田害虫图像识别方法。
背景技术
依靠科技创新促进农业发展成为当今发展农业的主题,计算机技术在新兴农业科技中占有相当重要的作用,害虫图像识别技术就是其中之一。利用该技术可以及时、准确地识别害虫,减少农药的使用,提高作物产量和质量,保护生态环境。现今已经提出了多种害虫图像识别方法在环境得到有效控制的前提下取得了一定的识别准确率。但在实际复杂的农田环境中,害虫图像受到来自背景环境的干扰,其识别性能将受到一定限制。多特征深度学习与多核学习技术可以综合学习害虫图像的多种类型特征,保证不会由于一种类型特征而影响总体的识别效果,因此如何增强害虫特征表现能力与有效分类成为亟需解决的问题。
发明内容
本发明的目的是为了解决现有技术中复杂环境条件下害虫图像识别性能差的缺陷,提供一种基于多特征深度学习技术的农田害虫图像识别方法来解决上述问题。
为了实现上述目的,本发明的技术方案如下:
一种基于多特征深度学习技术的农田害虫图像识别方法,包括以下步骤:
针对大规模害虫图像样本进行多特征提取,提取大规模害虫图像样本的颜色特征、纹理特征、形状特征、尺度不变特征转换特征和方向梯度直方图特征;
多特征深度学习,对不同类型特征分别进行非监督字典训练,获得不同类型特征的稀疏表示;
训练样本的多特征表示,通过结合不同类型特征,构建害虫图像样本的多特征表示形式-多特征稀疏编码直方图;
构建多核学习分类器,通过学习害虫图像正负样本的稀疏编码直方图构建多核分类器,实现害虫图像的分类。
所述的针对大规模害虫图像样本进行多特征提取包括以下步骤:
提取害虫图像样本的颜色特征,包括均值、方差、标准差、偏度、峰度、熵,其分别定义如下:
μ = Σ i = 0 L - 1 i h ( i ) , σ 2 = Σ i = 0 L - 1 ( i - μ ) 2 h ( i )
s = 1 / n - 1 Σ i = 0 L - 1 ( i - μ ) 2 , S = 1 / σ 3 Σ i = 0 L - 1 ( i - μ ) 3 h ( i )
K = 1 / σ 4 Σ i = 0 L - 1 ( i - μ ) 4 h ( i ) , R E = - Σ i = 0 L - 1 h ( i ) l o g [ h ( i ) ]
其中,μ为均值、σ2为方差、σ3为σ的三次方,σ4为σ的四次方,s为标准差、S为偏度、K表示峰度、RE为熵值、i表示颜色分量值、L表示图像灰度级数、h(i)表示颜色分量值为i的像素概率;
采用图像局部二值模式特征来提取害虫图像样本的纹理特征,其公式如下:
LBP P , R ( x , y ) = Σ p = 0 P - 1 s ( g n - g c ) 2 p
s ( x ) = 1 x &GreaterEqual; 0 0 x < 0 ,
其中LBPP,R(x,y)表示局部二值模式特征,gc表示中心像素点(x,y)的灰度值、gn表示在半径R处相邻点的灰度值、P表示中心像素点周围相邻像素点的个数;
使用联合不变矩特征来提取害虫图像样本的形状特征,其定义如下:
&theta; 1 = &phi; 2 / &phi; 1 , θ2=φ61φ4
&theta; 3 = &phi; 5 / &phi; 4 , θ4=φ53φ4
θ5=φ1φ62φ3 &theta; 6 = ( &phi; 1 + &phi; 2 ) &phi; 3 / &phi; 6
θ7=φ1φ53φ6 &theta; 6 = ( &phi; 1 + &phi; 4 ) / &phi; 5
其中φi为Hu不变矩,θi是第i维联合不变矩特征;
提取害虫图像样本的尺度不变特征转换特征;
提取害虫图像样本的方向梯度直方图特征,取像素值下的梯度幅值G(x,y)和梯度方向α(x,y),其计算公式如下:
G ( x , y ) = ( H ( x + 1 , y ) - H ( x - 1 , y ) ) 2 + ( H ( x , y + 1 ) - H ( x , y - 1 ) ) 2
α(x,y)=arctan((H(x,y+1)-H(x,y-1))/(H(x+1,y)-H(x-1,y))),
其中,H(x,y)为点(x,y)处的像素值,
其特征向量描述如下:在8×8块上分割4个4×4块,获得一个4×8共32维的特征向量;
在若干个害虫图像样本中均进行颜色特征、纹理特征、形状特征、尺度不变特征转换特征和方向梯度直方图特征的提取。
所述的多特征深度学习包括以下步骤:
针对第k种特征类型进行非监督字典训练,固定随机字典Dk对输入数据yk进行稀疏表示,得到稀疏向量矩阵xk,其公式如下:
< D k , x k > = arg min D , X | | y k - D k x k | | 2 2 , s . t . | | x i k | | 0 &le; T
其中:xk表示稀疏向量矩阵,通过||xi||0≤T进行系数限制;Dk表示第k类特征训练字典;yk表示输入害虫图像第k类特征集合;
逐列更新随机字典D,其公式如下:
| | Y - D X | | 2 = | | ( Y - &Sigma; i &NotEqual; s d i x T i ) - d s x T s | | 2
其中ds表示Dk中第s列,表示第s个行矢量,表示字典的贡献矩阵;
判断误差是否满足精度要求或是否达到指定的迭代次数,满足则结束训练,产生非监督字典不满足则继续计算稀疏向量矩阵xk并更新随机字典Dk
对m种害虫图像样本特征均进行非监督字典学习方式,学习获得m种非监督字典,其中m种害虫图像样本特征包括颜色特征、纹理特征、形状特征、尺度不变特征转换特征和方向梯度直方图特征。
所述的训练样本的多特征表示包括以下步骤:
针对第k种特征类型的非监督字典与第k类特征获得表示该种特征的稀疏编码,其计算公式如下:
a ^ i k = arg m i n | | &alpha; i k | | 1 , s . t . | | p i k - D T k &alpha; i k | | 2 < &epsiv; , k = 1 , ... , m
其中表示第k类害虫图像特征中第i个特征向量;
使用稀疏编码直方图来表示稀疏编码的分布情况,公式如下:
H k ( q ) = C 0 &Sigma; i I k ( | | Y - c i h | | 2 ) | a ^ i q k |
其中:Hk(q)表示第k类特征的稀疏编码直方图中第q个组距,C0为归一化常数,k()表示一个各向同性核函数,分配不同的权值,对于远离中心点的位置分配较小的权值,靠近中心点的位置分配较大的权值,Y表示目标点,ci表示图像中心点位置,表示第i个稀疏特征的第q维数据;
分别计算颜色特征、纹理特征、形状特征、尺度不变特征转换特征和方向梯度直方图特征的稀疏编码直方图,获得m类稀疏编码直方图Hk
所述的构建多核学习分类器包括以下步骤:
对分类器的学习训练采取有监督的方式,对负样本与每个特征类别进行人为区分;获取N个训练样本,使用m类的稀疏编码直方图Hk,对m类特征和负样本图像特征均采取特征形式为其中j∈N,其多核学习公式如下:
min { W K } , b , &xi; 1 2 &Sigma; k = 1 m 1 &omega; k | | W k | | 2 + C &Sigma; i = 1 N &xi; i
s . t . y i ( &Sigma; k = 1 m < W k , R k ( H i k ) > ) + &xi; i &GreaterEqual; 1 , 0 &le; i &le; N , &xi; i &GreaterEqual; 0 , &Sigma; k = 1 m &omega; k = 1 , &omega; k &GreaterEqual; 0
其中ωk表示对应核函数的权重,Wk为超平面参数;
使用支持向量机对不同的核函数学习不同的权值,对于测试样本,其分类的决策函数为:
f ( x ) = &Sigma; k = 1 m &omega; k &Sigma; i = 1 N &alpha; i y i O k ( H i , x ) + b
其中,b为阀值量,Ok(Hi,x)表示不同的核函数。
所述的提取害虫图像样本的尺度不变特征转换特征包括以下步骤:
尺度空间极值点检测,采用角点检测方法进行极值点检测,获得候选特征点,由可变尺度高斯函数G(x,y,σ)与输入图像I(x,y)卷积得到尺度空间定义函数L(x,y,σ),其公式如下:
L(x,y,σ)=G(x,y,σ)*I(x,y)
其中,*为x和y上的卷积运算,
特征点D(x,y,σ)为:
D(x,y,σ)=(G(x,y,kσ)-G(x,y,σ))*I(x,y)=L(x,y,kσ)-L(x,y,σ)
其中k为相邻两尺度差异的常数因子;
对候选特征点过滤获得精确特征点,针对获选特征点处进行拟合函数运算,其公式如下:
D ( X ) = D + &part; D T &part; X X + 1 2 X T &part; 2 D &part; X 2 X
其中,D为D(x,y,σ)在特征点位置的值;
确定特征点方向,尺度空间中任一点L(x,y)处的梯度值m(x,y)与方向θ(x,y)分别为:
m ( x , y ) = ( L ( x + 1 , y ) - L ( x - 1 , y ) ) 2 + ( L ( x , y + 1 ) - L ( x , y - 1 ) ) 2
θ(x,y)=arctan((L(x,y+1)-L(x,y-1))/(L(x+1,y)-L(x-1,y)));
其特征向量描述如下:以特征点为中心的16×16区域中4×4为一个单位,统计每个单位内的8维梯度直方图,每个特征点有4×4个单位,共4×4×8=128维特征向量。
有益效果
本发明的一种基于多特征深度学习技术的农田害虫图像识别方法,与现有技术相比提高了害虫识别的准确率。利用害虫图像的全局特征(颜色、形状、纹理)与局部特征(HOG、SIFT)对害虫图像进行深度学习得到多特征表示-多特征编码直方图,结合多核学习分类器,实现了害虫图像识别较高的识别率。
附图说明
图1为本发明的方法流程图。
具体实施方式
为使对本发明的结构特征及所达成的功效有更进一步的了解与认识,用以较佳的实施例及附图配合详细的说明,说明如下:
本方法先获取大规模的害虫样本图像,此害虫样本图像只包括害虫个体,不包括外界环境的表达。针对害虫样本从颜色特征、纹理特征、形状特征、尺度不变特征转换特征和方向梯度直方图特征五个特征对不同的害虫进行区分。针对五个特征进行深度学习得到多特征表示-多特征编码直方图,再利用多核学习分类器,对害虫图像(包括外界环境的害虫图像)进行分类,从而提高了害虫图像的识别度。
如图1所示,本发明所述的一种基于多特征深度学习技术的农田害虫图像识别方法,包括以下步骤:
第一步,针对大规模害虫图像样本进行多特征提取,提取大规模害虫图像样本的颜色特征、纹理特征、形状特征、尺度不变特征转换(SIFT)特征和方向梯度直方图(HOG)特征。目前的害虫识别主要根据图像的单一特征进行,缺乏对多种特征的综合应用。单一特征限制了众多特征联合对图像进行诠释的可能,对提高害虫图像识别性能范围有限。基于以上分析,本发明综合考虑多种特征,包括全局特征(颜色、形状、纹理)和局部特征(SIFT、HOG)。得到的多种类型特征表示图像中包含的多种信息,从而提高识别性能。其具体包括以下步骤:
(1)提取害虫图像样本的颜色特征,包括均值、方差、标准差、偏度、峰度、熵,其分别定义如下:
&mu; = &Sigma; i = 0 L - 1 i h ( i ) , &sigma; 2 = &Sigma; i = 0 L - 1 ( i - &mu; ) 2 h ( i )
s = 1 / n - 1 &Sigma; i = 0 L - 1 ( i - &mu; ) 2 , S = 1 / &sigma; 3 &Sigma; i = 0 L - 1 ( i - &mu; ) 3 h ( i )
K = 1 / &sigma; 4 &Sigma; i = 0 L - 1 ( i - &mu; ) 4 h ( i ) , R E = - &Sigma; i = 0 L - 1 h ( i ) l o g &lsqb; h ( i ) &rsqb;
其中,μ为均值、σ2为方差、σ3为σ的三次方,σ4为σ的四次方,s为标准差、S为偏度、K表示峰度、RE为熵值、i表示颜色分量值、L表示图像灰度级数、h(i)表示颜色分量值为i的像素概率。
(2)采用图像局部二值模式特征来提取害虫图像样本的纹理特征,其公式如下:
LBP P , R ( x , y ) = &Sigma; p = 0 P - 1 s ( g n - g c ) 2 p
s ( x ) = 1 x &GreaterEqual; 0 0 x < 0 ,
其中LBPP,R(x,y)表示局部二值模式特征,gc表示中心像素点(x,y)的灰度值、gn表示在半径R处相邻点的灰度值、P表示中心像素点周围相邻像素点的个数。
(3)根据害虫图像的形状特征,使用联合不变矩特征来提取害虫图像样本的形状特征,其具有缩放、旋转不变性,能够对区域与轮廓进行统一表示。其定义如下:
&theta; 1 = &phi; 2 / &phi; 1 , θ2=φ61φ4
&theta; 3 = &phi; 5 / &phi; 4 , θ4=φ53φ4
θ5=φ1φ62φ3 &theta; 6 = ( &phi; 1 + &phi; 2 ) &phi; 3 / &phi; 6
θ7=φ1φ53φ6 &theta; 6 = ( &phi; 1 + &phi; 4 ) / &phi; 5
其中φi为Hu不变矩,θi是第i维联合不变矩特征。
(4)提取害虫图像样本的尺度不变特征转换特征,尺度不变特征转换(SIFT)特征是目前最有效的局部不变特征描述方法。作为特征描述子,其对于图像的旋转、平移、尺度变化和亮度变化具有不变性。其包括以下步骤:
A、尺度空间极值点检测,SIFT方法采用角点检测DoG(difference-of-Gaussianfunction)方法进行极值点检测,获得候选特征点,由可变尺度高斯函数G(x,y,σ)与输入图像I(x,y)卷积得到尺度空间定义函数L(x,y,σ),其公式如下:
L(x,y,σ)=G(x,y,σ)*I(x,y)
其中,*为x和y上的卷积运算,
特征点D(x,y,σ)为:
D(x,y,σ)=(G(x,y,kσ)-G(x,y,σ))*I(x,y)=L(x,y,kσ)-L(x,y,σ)
其中k为相邻两尺度差异的常数因子;
B、对候选特征点过滤获得精确特征点,由于计算获得特征点不一定位于整数坐标位置,需要对其进行定位,去除对比度低的特征点与边缘相应点。
针对获选特征点处进行拟合函数运算,其公式如下:
D ( X ) = D + &part; D T &part; X X + 1 2 X T &part; 2 D &part; X 2 X
其中,D为D(x,y,σ)在特征点位置的值;
C、确定特征点方向,尺度空间中任一点L(x,y)处的梯度值m(x,y)与方向θ(x,y)分别为:
m ( x , y ) = ( L ( x + 1 , y ) - L ( x - 1 , y ) ) 2 + ( L ( x , y + 1 ) - L ( x , y - 1 ) ) 2
θ(x,y)=arctan((L(x,y+1)-L(x,y-1))/(L(x+1,y)-L(x-1,y)));
其特征向量描述如下:以特征点为中心的16×16区域中4×4为一个单位,统计每个单位内的8维梯度直方图,每个特征点有4×4个单位,共4×4×8=128维特征向量。
(5)提取害虫图像样本的方向梯度直方图(HOG)特征,计算局部区域梯度上的梯度方向直方图构成特征,其为SIFT特征方法的最后两步,取像素值下的梯度幅值G(x,y)和梯度方向α(x,y),其计算公式如下:
G ( x , y ) = ( H ( x + 1 , y ) - H ( x - 1 , y ) ) 2 + ( H ( x , y + 1 ) - H ( x , y - 1 ) ) 2
α(x,y)=arctan((H(x,y+1)-H(x,y-1))/(H(x+1,y)-H(x-1,y))),
其中,H(x,y)为点(x,y)处的像素值,
其特征向量描述如下:在8×8块上分割4个4×4块,获得一个4×8共32维的特征向量。
(6)在若干个害虫图像样本中均进行颜色特征、纹理特征、形状特征、尺度不变特征转换特征和方向梯度直方图特征的提取,形成害虫图像样本的5种特征集合。
第二步,多特征深度学习,采用深度学习理论中稀疏编码理论对不同类型特征分别进行非监督字典训练,获得不同类型特征的稀疏表示。经过针对大规模害虫图像样本进行多特征提取的步骤,共获得m=5种害虫图像特征类型,包括颜色、纹理、形状、SIFT和HOG。在此基于深度学习稀疏编码理论,则针对第k种特征类型k∈m,采用KSVD方法进行非监督字典训练。其具体要求步骤如下:
(1)针对第k种特征类型(5种害虫图像特征类型之一)进行非监督字典训练,固定随机字典Dk对输入数据yk进行稀疏表示,得到稀疏向量矩阵xk,其公式如下:
< D k , x k > = arg min D , X | | y k - D k x k | | 2 2 , s . t . | | x i k | | 0 &le; T
其中:xk表示稀疏向量矩阵,通过||xi||0≤T进行系数限制;Dk表示第k类特征训练字典;yk表示输入害虫图像第k类特征集合。
(2)逐列更新随机字典D,其公式如下:
| | Y - D X | | 2 = | | ( Y - &Sigma; i &NotEqual; s d i x T i ) - d s x T s | | 2
其中ds表示Dk中第s列,表示第s个行矢量,表示字典的贡献矩阵。
(3)判断误差是否满足精度要求或是否达到指定的迭代次数,满足则结束训练,产生非监督字典不满足则继续计算稀疏向量矩阵xk并更新随机字典Dk
(4)对m种害虫图像样本特征均进行非监督字典学习方式,学习获得m种非监督字典,其中m种害虫图像样本特征包括颜色特征、纹理特征、形状特征、尺度不变特征转换特征和方向梯度直方图特征。
第三步,训练样本的多特征表示,通过结合不同类型特征(分别针对m种非监督字典),构建害虫图像样本的多特征表示形式-多特征稀疏编码直方图。其具体包括以下步骤:
(1)针对第k种特征类型的非监督字典与第k类特征获得表示该种特征的稀疏编码,其计算公式如下:
a ^ i k = arg m i n | | &alpha; i k | | 1 , s . t . | | p i k - D T k &alpha; i k | | 2 < &epsiv; , k = 1 , ... , m
其中表示第k类害虫图像特征中第i个特征向量。
(2)使用稀疏编码直方图来表示稀疏编码的分布情况,公式如下:
H k ( q ) = C 0 &Sigma; i I k ( | | Y - c i h | | 2 ) | a ^ i q k |
其中:Hk(q)表示第k类特征的稀疏编码直方图中第q个组距,C0为归一化常数,k()表示一个各向同性核函数,分配不同的权值,对于远离中心点的位置分配较小的权值,靠近中心点的位置分配较大的权值,Y表示目标点,ci表示图像中心点位置,表示第i个稀疏特征的第q维数据。
(3)分别计算颜色特征、纹理特征、形状特征、尺度不变特征转换特征和方向梯度直方图特征的稀疏编码直方图,获得m类稀疏编码直方图Hk
第四步,构建多核学习分类器,通过学习害虫图像正负样本的稀疏编码直方图构建多核分类器,实现害虫图像的分类。害虫图像正样本指需进行害虫分类的训练图像中,带有害虫的图像,即含有m类特征的图像。在实际应用中,还有一类图像是不含任何害虫的图像,即负样本,此类图像只有环境背景,无害虫体现,而在图像采集过程中,不可能做到只采集有害虫图像,不采集无害虫图像,因此分类器的分类过程中,也要考虑负样本的存在,则把负样本作为单独特殊(自定义)一类害虫图像进行分类处理即可。其主要包括以下步骤:
(1)对分类器的学习训练采取有监督的方式,对负样本与每个特征类别进行人为区分,人工区分出正样本(5个特征类别)和负样本。获取N个训练样本,使用m类的稀疏编码直方图Hk,对m类特征和负样本图像特征均采取特征形式为其中j∈N。在此将负样本图像也并入正样本训练中,就是将负样本列为另一类特殊的害虫类别,其多核学习公式如下:
min { W K } , b , &xi; 1 2 &Sigma; k = 1 m 1 &omega; k | | W k | | 2 + C &Sigma; i = 1 N &xi; i
s . t . y i ( &Sigma; k = 1 m < W k , R k ( H i k ) > ) + &xi; i &GreaterEqual; 1 , 0 &le; i &le; N , &xi; i &GreaterEqual; 0 , &Sigma; k = 1 m &omega; k = 1 , &omega; k &GreaterEqual; 0
其中ωk表示对应核函数的权重,Wk为超平面参数。
(2)使用支持向量机对不同的核函数学习不同的权值,对于测试样本,其分类的决策函数为:
f ( x ) = &Sigma; k = 1 m &omega; k &Sigma; i = 1 N &alpha; i y i O k ( H i , x ) + b
其中,b为阀值量,Ok(Hi,x)表示不同的核函数。分类向量机对多个图像进行分类,从而将害虫类别进行区分、分类,并将没有害虫的图像单独分为一类,实现害虫的图像识别处理。
在针对D1和D2样本库进行试验过程中,其中D1样本库包括训练集与测试集,训练集中有20张128×128蝴蝶图像,测试集中包含720张蝴蝶图像。D2样本库包括9个类目共225张昆虫图像,随机选取其中一部分作为训练样本,其余为测试样本。对于D1样本库中蝴蝶图像均具有相似的外形特征,比如形状,其主要的不同特征表现在纹理特征,因此基于多核学习可以根据识别害虫具体情况学习得到不同的核函数权重,实现自动分类识别。实验中将本发明方法与多种现有图像识别分类模型相比较,其中包括NSC(非负稀疏编码)、SVM(支持向量机)、SC(稀疏编码)、LRSC(低秩稀疏编码)、SCSPM(空间金字塔匹配稀疏编码),在D1和D2样本库上比较结果如下表1:
表1在D1和D2样本库下不同方法识别率对比(%)
由以上表中结果可以看出,本发明所提出的方法在这两种公共训练集上表现性能均优于现有技术的其他方法,其应用有效并合理,能够达到识别害虫的功能,因此,本发明所提出的方法与系统性能较优,具有实用价值。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。

Claims (6)

1.一种基于多特征深度学习技术的农田害虫图像识别方法,其特征在于,包括以下步骤:
11)针对大规模害虫图像样本进行多特征提取,提取大规模害虫图像样本的颜色特征、纹理特征、形状特征、尺度不变特征转换特征和方向梯度直方图特征;
12)多特征深度学习,对不同类型特征分别进行非监督字典训练,获得不同类型特征的稀疏表示;
13)训练样本的多特征表示,通过结合不同类型特征,构建害虫图像样本的多特征表示形式-多特征稀疏编码直方图;
14)构建多核学习分类器,通过学习害虫图像正负样本的稀疏编码直方图构建多核分类器,实现害虫图像的分类。
2.根据权利要求1所述的一种基于多特征深度学习技术的农田害虫图像识别方法,其特征在于,所述的针对大规模害虫图像样本进行多特征提取包括以下步骤:
21)提取害虫图像样本的颜色特征,包括均值、方差、标准差、偏度、峰度、熵,其分别定义如下:
&mu; = &Sigma; i = 0 L - 1 i h ( i ) , &sigma; 2 = &Sigma; i = 0 L - 1 ( i - &mu; ) 2 h ( i )
s = 1 / n - 1 &Sigma; i = 0 L - 1 ( i - &mu; ) 2 , S = 1 / &sigma; 3 &Sigma; i = 0 L - 1 ( i - &mu; ) 3 h ( i )
K = 1 / &sigma; 4 &Sigma; i = 0 L - 1 ( i - &mu; ) 4 h ( i ) , R E = - &Sigma; i = 0 L - 1 h ( i ) l o g &lsqb; h ( i ) &rsqb;
其中,μ为均值、σ2为方差、σ3为σ的三次方,σ4为σ的四次方,s为标准差、S为偏度、K表示峰度、RE为熵值、i表示颜色分量值、L表示图像灰度级数、h(i)表示颜色分量值为i的像素概率;
22)采用图像局部二值模式特征来提取害虫图像样本的纹理特征,其公式如下:
LBP P , R ( x , y ) = &Sigma; p = 0 P - 1 s ( g n - g c ) 2 p
s ( x ) = 1 x &GreaterEqual; 0 0 x < 0 ,
其中LBPP,R(x,y)表示局部二值模式特征,gc表示中心像素点(x,y)的灰度值、gn表示在半径R处相邻点的灰度值、P表示中心像素点周围相邻像素点的个数;
23)使用联合不变矩特征来提取害虫图像样本的形状特征,其定义如下:
&theta; 1 = &phi; 2 / &phi; 1 , &theta; 2 = &phi; 6 / &phi; 1 &phi; 4
&theta; 3 = &phi; 5 / &phi; 4 , &theta; 4 = &phi; 5 / &phi; 3 &phi; 4
&theta; 5 = &phi; 1 &phi; 6 / &phi; 2 &phi; 3 , &theta; 6 = ( &phi; 1 + &phi; 2 ) &phi; 3 / &phi; 6
&theta; 7 = &phi; 1 &phi; 5 / &phi; 3 &phi; 6 , &theta; 6 = ( &phi; 1 + &phi; 4 ) / &phi; 5
其中φi为Hu不变矩,θi是第i维联合不变矩特征;
24)提取害虫图像样本的尺度不变特征转换特征;
25)提取害虫图像样本的方向梯度直方图特征,取像素值下的梯度幅值G(x,y)和梯度方向α(x,y),其计算公式如下:
G ( x , y ) = ( H ( x + 1 , y ) - H ( x - 1 , y ) ) 2 + ( H ( x , y + 1 ) - H ( x , y - 1 ) ) 2
α(x,y)=arctan((H(x,y+1)-H(x,y-1))/(H(x+1,y)-H(x-1,y))),
其中,H(x,y)为点(x,y)处的像素值,
其特征向量描述如下:在8×8块上分割4个4×4块,获得一个4×8共32维的特征向量;
26)在若干个害虫图像样本中均进行颜色特征、纹理特征、形状特征、尺度不变特征转换特征和方向梯度直方图特征的提取。
3.根据权利要求1所述的一种基于多特征深度学习技术的农田害虫图像识别方法,其特征在于,所述的多特征深度学习包括以下步骤:
31)针对第k种特征类型进行非监督字典训练,固定随机字典Dk对输入数据yk进行稀疏表示,得到稀疏向量矩阵xk,其公式如下:
< D k , x k > = argmin D , X | | y k - D k x k | | 2 2 , s . t . | | x i k | | 0 &le; T
其中:xk表示稀疏向量矩阵,通过||xi||0≤T进行系数限制;Dk表示第k类特征训练字典;yk表示输入害虫图像第k类特征集合;
32)逐列更新随机字典D,其公式如下:
| | Y - D X | | 2 = | | ( Y - &Sigma; i &NotEqual; s d i x T i ) - d s x T s | | 2
其中ds表示Dk中第s列,表示第s个行矢量,表示字典的贡献矩阵;
33)判断误差是否满足精度要求或是否达到指定的迭代次数,满足则结束训练,产生非监督字典不满足则继续计算稀疏向量矩阵xk并更新随机字典Dk
34)对m种害虫图像样本特征均进行非监督字典学习方式,学习获得m种非监督字典,其中m种害虫图像样本特征包括颜色特征、纹理特征、形状特征、尺度不变特征转换特征和方向梯度直方图特征。
4.根据权利要求1所述的一种基于多特征深度学习技术的农田害虫图像识别方法,其特征在于,所述的训练样本的多特征表示包括以下步骤:
41)针对第k种特征类型的非监督字典与第k类特征获得表示该种特征的稀疏编码,其计算公式如下:
a ^ i k = arg m i n | | &alpha; i k | | 1 , s . t . | | p i k - D T k &alpha; i k | | 2 < &epsiv; , k = 1 , ... , m
其中表示第k类害虫图像特征中第i个特征向量;
42)使用稀疏编码直方图来表示稀疏编码的分布情况,公式如下:
H k ( q ) = C 0 &Sigma; i I k ( | | Y - c i h | | 2 ) | a ^ i q k |
其中:Hk(q)表示第k类特征的稀疏编码直方图中第q个组距,C0为归一化常数,k()表示一个各向同性核函数,分配不同的权值,对于远离中心点的位置分配较小的权值,靠近中心点的位置分配较大的权值,Y表示目标点,ci表示图像中心点位置,表示第i个稀疏特征的第q维数据;
43)分别计算颜色特征、纹理特征、形状特征、尺度不变特征转换特征和方向梯度直方图特征的稀疏编码直方图,获得m类稀疏编码直方图Hk
5.根据权利要求1所述的一种基于多特征深度学习技术的农田害虫图像识别方法,其特征在于,所述的构建多核学习分类器包括以下步骤:
51)对分类器的学习训练采取有监督的方式,对负样本与每个特征类别进行人为区分;获取N个训练样本,使用m类的稀疏编码直方图Hk,对m类特征和负样本图像特征均采取特征形式为其中j∈N,其多核学习公式如下:
m i n { W K } , b , &xi; 1 2 &Sigma; k = 1 m 1 &omega; k | | W k | | 2 + C &Sigma; i = 1 N &xi; i
s . t . y i ( &Sigma; k = 1 m < W k , R k ( H i k ) > ) + &xi; i &GreaterEqual; 1 , 0 &le; i &le; N , &xi; i &GreaterEqual; 0 , &Sigma; k = 1 m &omega; k = 1 , &omega; k &GreaterEqual; 0
其中ωk表示对应核函数的权重,Wk为超平面参数;
52)使用支持向量机对不同的核函数学习不同的权值,对于测试样本,其分类的决策函数为:
f ( x ) = &Sigma; k = 1 m &omega; k &Sigma; i = 1 N &alpha; i y i O k ( H i , x ) + b
其中,b为阀值量,Ok(Hi,x)表示不同的核函数。
6.根据权利要求2所述的一种基于多特征深度学习技术的农田害虫图像识别方法,其特征在于,所述的提取害虫图像样本的尺度不变特征转换特征包括以下步骤:
61)尺度空间极值点检测,采用角点检测方法进行极值点检测,获得候选特征点,由可变尺度高斯函数G(x,y,σ)与输入图像I(x,y)卷积得到尺度空间定义函数L(x,y,σ),其公式如下:
L(x,y,σ)=G(x,y,σ)*I(x,y)
其中,*为x和y上的卷积运算,
特征点D(x,y,σ)为:
D(x,y,σ)=(G(x,y,kσ)-G(x,y,σ))*I(x,y)=L(x,y,kσ)-L(x,y,σ)
其中k为相邻两尺度差异的常数因子;
62)对候选特征点过滤获得精确特征点,针对获选特征点处进行拟合函数运算,其公式如下:
D ( X ) = D + &part; D T &part; X X + 1 2 X T &part; 2 D &part; X 2 X
其中,D为D(x,y,σ)在特征点位置的值;
63)确定特征点方向,尺度空间中任一点L(x,y)处的梯度值m(x,y)与方向θ(x,y)分别为:
m ( x , y ) = ( L ( x + 1 , y ) - L ( x - 1 , y ) ) 2 + ( L ( x , y + 1 ) - L ( x , y - 1 ) ) 2
θ(x,y)=arctan((L(x,y+1)-L(x,y-1))/(L(x+1,y)-L(x-1,y)));
其特征向量描述如下:以特征点为中心的16×16区域中4×4为一个单位,统计每个单位内的8维梯度直方图,每个特征点有4×4个单位,共4×4×8=128维特征向量。
CN201510923464.4A 2015-12-10 2015-12-10 一种基于多特征深度学习技术的农田害虫图像识别方法 Active CN105488536B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510923464.4A CN105488536B (zh) 2015-12-10 2015-12-10 一种基于多特征深度学习技术的农田害虫图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510923464.4A CN105488536B (zh) 2015-12-10 2015-12-10 一种基于多特征深度学习技术的农田害虫图像识别方法

Publications (2)

Publication Number Publication Date
CN105488536A true CN105488536A (zh) 2016-04-13
CN105488536B CN105488536B (zh) 2019-03-05

Family

ID=55675507

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510923464.4A Active CN105488536B (zh) 2015-12-10 2015-12-10 一种基于多特征深度学习技术的农田害虫图像识别方法

Country Status (1)

Country Link
CN (1) CN105488536B (zh)

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106251345A (zh) * 2016-07-26 2016-12-21 成都市高博汇科信息科技有限公司 一种实时监测视频对比度异常的方法
CN106845401A (zh) * 2017-01-20 2017-06-13 中国科学院合肥物质科学研究院 一种基于多空间卷积神经网络的害虫图像识别方法
CN106845497A (zh) * 2017-01-12 2017-06-13 天津大学 基于多特征融合的玉米前期图像旱情识别方法
CN107025431A (zh) * 2017-02-24 2017-08-08 中国科学院合肥物质科学研究院 基于深度特征与多核Boosting学习相结合的害虫图像识别方法
CN107316055A (zh) * 2017-05-26 2017-11-03 昆山遥矽微电子科技有限公司 一种非标准字体的汉字自动符识别方法
CN107463958A (zh) * 2017-08-04 2017-12-12 成都东谷利农农业科技有限公司 昆虫识别预警方法及系统
CN107480620A (zh) * 2017-08-04 2017-12-15 河海大学 基于异构特征融合的遥感图像自动目标识别方法
CN107609600A (zh) * 2017-09-27 2018-01-19 北京农业信息技术研究中心 一种温室粘虫板害虫自动识别分类方法及系统
CN108021894A (zh) * 2017-12-07 2018-05-11 中国科学院合肥物质科学研究院 一种基于深度策略学习的小麦病害检测方法
CN108256386A (zh) * 2016-12-28 2018-07-06 南宁市浩发科技有限公司 自适应特征选择的夜间车辆检测方法
CN108280469A (zh) * 2018-01-16 2018-07-13 佛山市顺德区中山大学研究院 一种基于稀疏表示的超市商品图像识别方法
CN108399620A (zh) * 2018-03-19 2018-08-14 嘉兴学院 一种基于低秩稀疏矩阵分解的图像质量评价方法
CN108510490A (zh) * 2018-03-30 2018-09-07 深圳春沐源控股有限公司 一种分析虫害趋势的方法、装置及计算机存储介质
CN108710838A (zh) * 2018-05-08 2018-10-26 河南工程学院 一种夜视环境下热红外人脸图像识别方法
CN108734277A (zh) * 2018-05-18 2018-11-02 拓普暨达(广州)基因精准医疗科技有限公司 一种基于卷积神经网络的靶向药物喷洒方法
CN109002850A (zh) * 2018-07-06 2018-12-14 无锡众创未来科技应用有限公司 一种计算图像中食物热量的方法及装置
CN109214440A (zh) * 2018-08-23 2019-01-15 华北电力大学(保定) 一种基于聚类算法的多特征数据分类识别方法
CN109635738A (zh) * 2018-12-13 2019-04-16 中国船舶工业综合技术经济研究院 一种图像特征提取方法及系统
CN109658405A (zh) * 2018-12-20 2019-04-19 中国气象局气象探测中心 一种农作物实景观测中图像数据质量控制方法及系统
CN111340096A (zh) * 2020-02-24 2020-06-26 北京工业大学 一种基于对抗互补学习的弱监督蝴蝶目标检测方法
CN111429304A (zh) * 2020-02-28 2020-07-17 鄂尔多斯市斯创网络科技有限责任公司 一种食品安全监管平台
CN112257730A (zh) * 2020-11-20 2021-01-22 湖南本业绿色防控科技股份有限公司 植物害虫图像识别方法、装置、设备及存储介质
CN112508908A (zh) * 2020-12-02 2021-03-16 哈尔滨市科佳通用机电股份有限公司 基于图像处理动车组撒砂管接头断开故障检测方法
CN112730275A (zh) * 2021-02-04 2021-04-30 华东理工大学 显微光谱成像系统、农药检测系统及其方法
CN113095949A (zh) * 2020-01-09 2021-07-09 孔华 有害虫体分布状态上传系统
CN113155293A (zh) * 2021-04-06 2021-07-23 内蒙古工业大学 一种基于无人机的人体遥感测温监测识别系统
CN115272667A (zh) * 2022-06-24 2022-11-01 中科星睿科技(北京)有限公司 农田图像分割模型训练方法、装置、电子设备和介质
CN117853937A (zh) * 2024-03-08 2024-04-09 吉林农业大学 一种基于次要颜色聚类分析的水稻病害识别方法和系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
亓晓振: "一种基于稀疏编码的多核学习图像分类方法", 《电子学报》 *
程东阳: "基于稀疏编码和多核学习的图像分类算法", 《上海交通大学学报》 *
胡永强: "基于稀疏表示的多特征融合害虫图像识别", 《模式识别与人工智能》 *

Cited By (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106251345A (zh) * 2016-07-26 2016-12-21 成都市高博汇科信息科技有限公司 一种实时监测视频对比度异常的方法
CN108256386A (zh) * 2016-12-28 2018-07-06 南宁市浩发科技有限公司 自适应特征选择的夜间车辆检测方法
CN106845497A (zh) * 2017-01-12 2017-06-13 天津大学 基于多特征融合的玉米前期图像旱情识别方法
CN106845401A (zh) * 2017-01-20 2017-06-13 中国科学院合肥物质科学研究院 一种基于多空间卷积神经网络的害虫图像识别方法
CN107025431A (zh) * 2017-02-24 2017-08-08 中国科学院合肥物质科学研究院 基于深度特征与多核Boosting学习相结合的害虫图像识别方法
CN107025431B (zh) * 2017-02-24 2019-06-18 中国科学院合肥物质科学研究院 基于深度特征与多核Boosting学习相结合的害虫图像识别方法
CN107316055A (zh) * 2017-05-26 2017-11-03 昆山遥矽微电子科技有限公司 一种非标准字体的汉字自动符识别方法
CN107463958A (zh) * 2017-08-04 2017-12-12 成都东谷利农农业科技有限公司 昆虫识别预警方法及系统
CN107480620A (zh) * 2017-08-04 2017-12-15 河海大学 基于异构特征融合的遥感图像自动目标识别方法
CN107480620B (zh) * 2017-08-04 2020-06-16 河海大学 基于异构特征融合的遥感图像自动目标识别方法
CN107609600A (zh) * 2017-09-27 2018-01-19 北京农业信息技术研究中心 一种温室粘虫板害虫自动识别分类方法及系统
CN108021894A (zh) * 2017-12-07 2018-05-11 中国科学院合肥物质科学研究院 一种基于深度策略学习的小麦病害检测方法
CN108021894B (zh) * 2017-12-07 2020-06-05 中国科学院合肥物质科学研究院 一种基于深度策略学习的小麦病害检测方法
CN108280469A (zh) * 2018-01-16 2018-07-13 佛山市顺德区中山大学研究院 一种基于稀疏表示的超市商品图像识别方法
CN108399620A (zh) * 2018-03-19 2018-08-14 嘉兴学院 一种基于低秩稀疏矩阵分解的图像质量评价方法
CN108399620B (zh) * 2018-03-19 2022-04-19 嘉兴学院 一种基于低秩稀疏矩阵分解的图像质量评价方法
CN108510490A (zh) * 2018-03-30 2018-09-07 深圳春沐源控股有限公司 一种分析虫害趋势的方法、装置及计算机存储介质
CN108510490B (zh) * 2018-03-30 2021-02-19 深圳春沐源控股有限公司 一种分析虫害趋势的方法、装置及计算机存储介质
CN108710838A (zh) * 2018-05-08 2018-10-26 河南工程学院 一种夜视环境下热红外人脸图像识别方法
CN108734277A (zh) * 2018-05-18 2018-11-02 拓普暨达(广州)基因精准医疗科技有限公司 一种基于卷积神经网络的靶向药物喷洒方法
CN109002850A (zh) * 2018-07-06 2018-12-14 无锡众创未来科技应用有限公司 一种计算图像中食物热量的方法及装置
CN109214440A (zh) * 2018-08-23 2019-01-15 华北电力大学(保定) 一种基于聚类算法的多特征数据分类识别方法
CN109635738A (zh) * 2018-12-13 2019-04-16 中国船舶工业综合技术经济研究院 一种图像特征提取方法及系统
CN109658405A (zh) * 2018-12-20 2019-04-19 中国气象局气象探测中心 一种农作物实景观测中图像数据质量控制方法及系统
CN109658405B (zh) * 2018-12-20 2020-11-24 中国气象局气象探测中心 一种农作物实景观测中图像数据质量控制方法及系统
CN113095949A (zh) * 2020-01-09 2021-07-09 孔华 有害虫体分布状态上传系统
CN111340096A (zh) * 2020-02-24 2020-06-26 北京工业大学 一种基于对抗互补学习的弱监督蝴蝶目标检测方法
CN111429304A (zh) * 2020-02-28 2020-07-17 鄂尔多斯市斯创网络科技有限责任公司 一种食品安全监管平台
CN112257730A (zh) * 2020-11-20 2021-01-22 湖南本业绿色防控科技股份有限公司 植物害虫图像识别方法、装置、设备及存储介质
CN112508908B (zh) * 2020-12-02 2021-07-16 哈尔滨市科佳通用机电股份有限公司 基于图像处理动车组撒砂管接头断开故障检测方法
CN112508908A (zh) * 2020-12-02 2021-03-16 哈尔滨市科佳通用机电股份有限公司 基于图像处理动车组撒砂管接头断开故障检测方法
CN112730275A (zh) * 2021-02-04 2021-04-30 华东理工大学 显微光谱成像系统、农药检测系统及其方法
CN113155293A (zh) * 2021-04-06 2021-07-23 内蒙古工业大学 一种基于无人机的人体遥感测温监测识别系统
CN115272667A (zh) * 2022-06-24 2022-11-01 中科星睿科技(北京)有限公司 农田图像分割模型训练方法、装置、电子设备和介质
CN115272667B (zh) * 2022-06-24 2023-08-29 中科星睿科技(北京)有限公司 农田图像分割模型训练方法、装置、电子设备和介质
CN117853937A (zh) * 2024-03-08 2024-04-09 吉林农业大学 一种基于次要颜色聚类分析的水稻病害识别方法和系统
CN117853937B (zh) * 2024-03-08 2024-06-04 吉林农业大学 一种基于次要颜色聚类分析的水稻病害识别方法和系统

Also Published As

Publication number Publication date
CN105488536B (zh) 2019-03-05

Similar Documents

Publication Publication Date Title
CN105488536A (zh) 一种基于多特征深度学习技术的农田害虫图像识别方法
CN104599275B (zh) 基于概率图模型的非参数化的rgb-d场景理解方法
CN106682696B (zh) 基于在线示例分类器精化的多示例检测网络及其训练方法
Lim et al. Sketch tokens: A learned mid-level representation for contour and object detection
Huang et al. Robust scene text detection with convolution neural network induced mser trees
CN105930815B (zh) 一种水下生物检测方法和系统
Sirmacek et al. Urban-area and building detection using SIFT keypoints and graph theory
CN110674874B (zh) 基于目标精细组件检测的细粒度图像识别方法
Hsu et al. An interactive flower image recognition system
CN105528595A (zh) 在无人机航拍图像中对输电线路绝缘子的识别定位方法
CN106611420B (zh) 基于反卷积网络和素描图方向约束的sar图像分割方法
CN109063649B (zh) 基于孪生行人对齐残差网络的行人重识别方法
Zawbaa et al. An automatic flower classification approach using machine learning algorithms
CN115170805A (zh) 一种结合超像素和多尺度分层特征识别的图像分割方法
CN105321176A (zh) 一种基于分层高阶条件随机场的图像分割方法
CN103258210B (zh) 一种基于字典学习的高清图像分类方法
CN105574545B (zh) 街道环境图像多视角语义切割方法及装置
CN105069478A (zh) 基于超像素张量稀疏编码的高光谱遥感地物分类方法
Wu et al. Scene text detection using adaptive color reduction, adjacent character model and hybrid verification strategy
Neena et al. Image classification using an ensemble-based deep CNN
CN112464983A (zh) 一种用于苹果树叶病害图像分类的小样本学习方法
Keskin et al. Image classification of human carcinoma cells using complex wavelet-based covariance descriptors
CN104751475A (zh) 一种面向静态图像对象识别的特征点优选匹配方法
CN104268552A (zh) 一种基于部件多边形的精细类别分类方法
Zhang et al. Category modeling from just a single labeling: Use depth information to guide the learning of 2d models

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant