CN110147734B - 一种自适应聚类的生菜品种鉴别方法 - Google Patents

一种自适应聚类的生菜品种鉴别方法 Download PDF

Info

Publication number
CN110147734B
CN110147734B CN201910321709.4A CN201910321709A CN110147734B CN 110147734 B CN110147734 B CN 110147734B CN 201910321709 A CN201910321709 A CN 201910321709A CN 110147734 B CN110147734 B CN 110147734B
Authority
CN
China
Prior art keywords
lettuce
clustering
value
spectrum
fuzzy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910321709.4A
Other languages
English (en)
Other versions
CN110147734A (zh
Inventor
武小红
刘伟
武斌
陈勇
傅海军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu University
Original Assignee
Jiangsu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu University filed Critical Jiangsu University
Priority to CN201910321709.4A priority Critical patent/CN110147734B/zh
Publication of CN110147734A publication Critical patent/CN110147734A/zh
Application granted granted Critical
Publication of CN110147734B publication Critical patent/CN110147734B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明公开了一种自适应聚类的生菜品种鉴别方法,包括:步骤1、生菜样本光谱的采集:用光谱仪采集不同品种的生菜样本,获取生菜样本的漫反射光谱;步骤2、光谱的降维处理:采用主成分分析方法(PCA)将生菜样本光谱的维数降低;步骤3、进行生菜光谱的模糊C均值聚类,得到模糊隶属度以及聚类中心;步骤4、计算自适应聚类方法的参数λ;步骤5、采用自适应聚类方法进行生菜品种的鉴别。本发明采用无损检测技术,无需学习样本,具有检测速度快,鉴别准确率高等优点,可对多个品种的生菜进行准确鉴别。特别是在聚类包含噪声数据的生菜光谱数据方面优于模糊C均值聚类,在聚类性能上要优于现有的模糊C均值聚类。

Description

一种自适应聚类的生菜品种鉴别方法
技术领域
本发明涉及一种生菜品种鉴别方法,具体涉及一种自适应聚类方法和傅里叶光谱检测技术的生菜品种鉴别方法。
背景技术
生菜是人们经常食用的主要蔬菜之一,生菜营养丰富,它含有大量的维生素,β胡萝卜素,膳食纤维等。根据叶子的形态生菜可分为结球生菜、皱叶生菜和直立生菜。不同品种的生菜,其外部形态和内部品质存在差异,如何选择产量高,品质高的生菜品种是农业科技工作者研究的重要课题,所以研究一种简单、快速、无损的生菜品种鉴别方法是非常必要的。
近红外,中红外,远红外,紫外可见吸收光谱等光谱检测技术可应用于农产品和食品成份的快速检测。通过对农产品和食品的光谱扫描获得反射光谱,反射光谱中含有物品组分相关的信息。由于不同品种的生菜,其内部组分存在差异,因此不同品种生菜的漫反射光谱是有差异的,利用这个原理,可以实现生菜品种的鉴别。但是光谱检测存在的问题是:光谱仪器采集的原始光谱中除了包含与样品组成有关的信息外,也包含了来自各方面的因素所产生的噪声信号。这些噪声信号会对谱图信息产生干扰,有些情况下还很严重,从而影响样本数据模型的建立和对未知样品组成或性质的预测。
模糊C均值聚类(FCM)是建立在模糊类内散射矩阵基础上的模糊聚类,它没有考虑到模糊类间散射矩阵对聚类的影响。并且FCM建立在可能性约束条件(即同一个样本对所有类别的隶属度之和为1)基础上,所以FCM对噪声数据敏感,在聚类含噪声的数据时,聚类效果不好。
发明内容
本发明为了解决模糊C均值聚类的噪声敏感性问题、以及未考虑到模糊类间散射矩阵对聚类的影响问题和无学习样本情况下的生菜品种鉴别问题,设计一种自适应聚类和光谱检测技术的生菜品种鉴别方法。本发明具有减小噪声敏感性,无需学习样本,无损检测等优点。
一种自适应聚类的生菜品种鉴别方法,具体包括以下步骤:
步骤1、生菜样本光谱的采集:用光谱仪采集不同品种的生菜样本,获取生菜样本的漫反射光谱。
步骤2、光谱的降维处理:采用主成分分析方法(PCA)将生菜样本光谱的维数降低。
步骤3、生菜光谱的模糊C均值聚类。
步骤4、计算自适应聚类方法的参数λ。
uik,FCM是步骤3模糊C均值聚类得到的样本xk隶属于类别i的模糊隶属度值;d(xk,vi,FCM)=||xk-vi,FCM||2xk为第k(k=1,2,3,…,n)个生菜光谱样本,/>为样本的均值,/>n(n>c>1)为样本数,c(+∞>c>1)为类别数;vi,FCM是步骤三模糊C均值聚类得到的类别i的类中心值。
步骤5、采用自适应聚类方法进行生菜品种的鉴别。具体是:
5.1.初始化
(1)固定生菜光谱样本类别数c(+∞>c>1)和样本数n(n>c>1),权重指数m(+∞>m>1)和p(+∞>p>1),最大迭代数rmax,初始迭代次数r=1,误差上限的值ε,固定参数a(+∞>a>0)、b(+∞>b>0)。初始聚类中心νi (0)为步骤3中模糊C均值聚类得到的聚类中心。
(2)计算生菜光谱样本的协方差σ2
这里xk为第k(k=1,2,3,…,n)个生菜光谱样本,/>为样本的均值,/>
5.2.计算第r(r=1,2,…,rmax)次迭代时的模糊隶属度值uik (r)
uik是样本xk隶属于类别i的模糊隶属度值; vi是第i(i=1,2,3,…,c)类的类中心值,νi (r-1)是第r-1次迭代计算的类中心vi的值;vj是第j(j=1,2,3,…,c)类的类中心值,νj (r-1)是第r-1次迭代计算的类中心vj的值,/>为样本均值。
5.3.计算第r(r=1,2,…,rmax)次迭代时的典型值tik (r)
tik是样本xk隶属于类别i的典型值。
5.4.计算第r次迭代时的第i类的类中心值νi (r)
νi (r)是第r次迭代计算的类中心vi的值;
5.5.循环计数增加,即r=r+1;当或者r=rmax-1时,迭代结束,否则,r=r+1,返回步骤5.2继续迭代计算。迭代终止后可得到模糊隶属度值和典型值并根据模糊隶属度值或典型值鉴别生菜品种。
本发明的有益效果:
1、本发明的一种自适应聚类的生菜品种鉴别方法采用本发明设计的自适应聚类方法聚类生菜光谱数据,因而具有聚类准确率高,聚类速度快;采用的光谱检测技术而具有无损检测的优点。
2、本发明的一种自适应聚类方法在聚类包含噪声数据的生菜光谱数据方面优于模糊C均值聚类(FCM),可快速实现生菜品种的准确鉴别。
3、本发明的一种自适应聚类方法建立在模糊类内散射矩阵和模糊类间散射矩阵基础上,因而在对生菜进行品种鉴别时,在聚类性能上要优于现有的模糊C均值聚类。
附图说明
图1是本发明的流程图;
图2是生菜样本的光谱图;
图3是模糊C均值聚类得到的模糊隶属度;
图4是本发明设计的自适应聚类方法得到的模糊隶属度;
图5是本发明设计的自适应聚类方法得到的典型值。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。
本发明的实施流程如图1所示。本实施例以三种品种的生菜样本进行阐述。如图1所示,本发明提出的一种自适应聚类的生菜品种鉴别方法,包括以下步骤:
步骤1、生菜样本光谱的采集:用光谱仪采集不同品种的生菜样本,获取生菜样本的漫反射光谱。
在生菜成熟期,采集香港玻璃生菜,意大利全年耐抽苔生菜和大禹奶油生菜三个品种的生菜样本,每个品种生菜样本数为40个。采用美国ASD公司生产的FieldSpec@3型便携式光谱分析仪,光谱测量范围350~2500nm,在350~1000nm光谱区采样间隔为1.4nm,分辨率为3nm;在1000~2500nm光谱区采样间隔为2nm,分辨率为10nm。在恒温恒湿环境下,将生菜叶片放置于黑色绒布上,测量时将光谱探头置于工作台上方5cm处,垂直于被测物,设定视场为25度。测量叶片之前先测量标准反射板,以消除环境因素(主要是光强)引起的系统误差,每片叶片测量3次,取平均值作为最终测量结果。120个生菜样本的漫反射光谱图如图2所示。所得的生菜样本光谱为2151维数据。
步骤2、光谱的降维处理:采用主成分分析方法(PCA)将生菜样本光谱的维数降低。
采用主成分分析方法(PCA)将生菜样本光谱从2151维数据变换为6维数据。
步骤3、生菜光谱的模糊C均值聚类。
对步骤2的6维数据进行模糊C-均值聚类。模糊C-均值聚类的初始化参数设置为:类别数为3,权重指数为2,最大迭代数为100次,误差上限为0.00001。模糊C-均值聚类迭代终止后得到的模糊隶属度uik,FCM如图3所示,得到的聚类中心vi,FCM
上式中v1,FCM,v2,FCM和v3,FCM分别是模糊C-均值聚类迭代终止后的第1,第2和第3类聚类中心,即聚类中心vi,FCM(i=1,2,3)。
步骤4、计算自适应聚类方法的参数λ。
uik,FCM是步骤3模糊C均值聚类得到的样本xk隶属于类别i的模糊隶属度值;d(xk,vi,FCM)=||xk-vi,FCM||2xk为第k(k=1,2,3,…,n)个生菜光谱样本,/>为样本的均值,/>n(n>c>1)为样本数,c(+∞>c>1)为类别数;vi,FCM是步骤3模糊C均值聚类得到的类别i的类中心值。
根据图3的模糊隶属度uik,FCM和步骤3的聚类中心vi,FCM可计算得到参数λ的值为:λ=0.0068。
步骤5、采用本发明设计的自适应聚类方法进行生菜品种的鉴别。具体步骤如下:
5.1.初始化
(1)固定生菜光谱样本类别数c(+∞>c>1)和样本数n(n>c>1),权重指数m(+∞>m>1)和p(+∞>p>1),最大迭代数rmax,初始迭代次数r=1,误差上限的值ε,固定参数a(+∞>a>0)、b(+∞>b>0)。初始聚类中心νi (0)为步骤3中模糊C均值聚类得到的聚类中心。
具体参数值为:c=3,n=120,m=2.0,p=3.0,ε=0.00001,a=1,b=1,νi (0)=vi,FCM
(2)计算生菜光谱样本的协方差σ2
这里xk为第k(k=1,2,3,…,n)个生菜光谱样本,/>为样本的均值,/>
计算可得:σ2=1.8636。
5.2.计算第r(r=1,2,…,rmax)次迭代时的模糊隶属度值uik (r)
uik是样本xk隶属于类别i的模糊隶属度值; vi是第i(i=1,2,3,…,c)类的类中心值,νi (r-1)是第r-1次迭代计算的类中心vi的值;vj是第j(j=1,2,3,…,c)类的类中心值,νj (r-1)是第r-1次迭代计算的类中心vj的值,/>为样本均值。
5.3.计算第r(r=1,2,…,rmax)次迭代时的典型值tik (r)
tik是样本xk隶属于类别i的典型值。
5.4.计算第r次迭代时的第i类的类中心值νi (r)
νi (r)是第r次迭代计算的类中心vi的值;
5.5.循环计数增加,即r=r+1;
或者r=rmax-1时,迭代结束,否则,r=r+1,返回步骤5.2继续迭代计算。迭代终止后可得到模糊隶属度值和典型值并根据模糊隶属度值或典型值鉴别生菜品种。
运算结果:经过r=37次迭代计算后迭代终止,得到的模糊隶属度值如图4所示和典型值如图5所示。根据模糊隶属度值可得生菜品种鉴别准确率为87.5%。
迭代终止后的类中心νi (37)为:
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。

Claims (8)

1.一种自适应聚类的生菜品种鉴别方法,其特征在于,包括如下步骤:
步骤1、生菜样本光谱的采集:用光谱仪采集不同品种的生菜样本,获取生菜样本的漫反射光谱;
步骤2、光谱的降维处理:采用主成分分析方法(PCA)将生菜样本光谱的维数降低;
步骤3、进行生菜光谱的模糊C均值聚类,得到模糊隶属度以及聚类中心;
步骤4、计算自适应聚类方法的参数λ;
步骤5、采用自适应聚类方法进行生菜品种的鉴别;
所述步骤5的具体过程如下:
5.1.初始化
5.1.1固定生菜光谱样本类别数c和样本数n,权重指数m和p,最大迭代数rmax,初始迭代次数r=1,误差上限的值ε,固定参数a、b,初始聚类中心νi (0)为步骤3中模糊C均值聚类得到的聚类中心;其中,+∞>c>1,n>c>1,+∞>m>1,+∞>p>1,+∞>a>0,+∞>b>0;
5.1.2计算生菜光谱样本的协方差σ2
这里xk为第k个生菜光谱样本,x为样本的均值,/>其中,k=1,2,3,…,n;
5.2.计算第r次迭代时的模糊隶属度值uik (r),其中,r=1,2,…,rmax
uik是样本xk隶属于类别i的模糊隶属度值; vi是第i类的类中心值,νi (r-1)是第r-1次迭代计算的类中心vi的值;vj是第j类的类中心值,νj (r-1)是第r-1次迭代计算的类中心vj的值,/>为样本均值;其中,i=1,2,3,…,c;j=1,2,3,…,c;
5.3.计算第r次迭代时的典型值tik (r)
tik是样本xk隶属于类别i的典型值;其中,r=1,2,…,rmax
5.4.计算第r次迭代时的第i类的类中心值νi (r)
νi (r)是第r次迭代计算的类中心vi的值;
5.5.循环计数增加,即r=r+1;
或者r=rmax-1时,迭代结束,否则,r=r+1,返回步骤5.2继续迭代计算,迭代终止后可得到模糊隶属度值和典型值并根据模糊隶属度值或典型值鉴别生菜品种。
2.根据权利要求1所述的一种自适应聚类的生菜品种鉴别方法,其特征在于,所述步骤1中,光谱采集的条件为:在350~1000nm光谱区采样间隔为1.4nm,分辨率为3nm;在1000~2500nm光谱区采样间隔为2nm,分辨率为10nm。
3.根据权利要求1所述的一种自适应聚类的生菜品种鉴别方法,其特征在于,所述步骤2中,所述光谱的维数由2151维数据降低为6维数据。
4.根据权利要求3所述的一种自适应聚类的生菜品种鉴别方法,其特征在于,所述步骤3的具体过程如下:
对步骤2的6维光谱数据进行模糊C-均值聚类;模糊C-均值聚类的初始化参数设置为:类别数为3,权重指数为2,最大迭代数为100次,误差上限为0.00001。
5.根据权利要求4所述的一种自适应聚类的生菜品种鉴别方法,其特征在于,生菜品种为香港玻璃生菜,意大利全年耐抽苔生菜和大禹奶油生菜时,计算的聚类中心vi,FCM
6.根据权利要求1所述的一种自适应聚类的生菜品种鉴别方法,其特征在于,所述步骤4的计算方法为:
uik,FCM是步骤3模糊C均值聚类得到的样本xk隶属于类别i的模糊隶属度值;d(xk,vi,FCM)=||xk-vi,FCM||2xk为第k个生菜光谱样本,/>为样本的均值,/>n为样本数,c为类别数;vi,FCM是步骤3模糊C均值聚类得到的类别i的类中心值;
其中,k=1,2,3,…,n,n>c>1,+∞>c>1。
7.根据权利要求1所述的一种自适应聚类的生菜品种鉴别方法,其特征在于,步骤5.1.1中具体参数值设置为:c=3,n=120,m=2.0,p=3.0,ε=0.00001,a=1,b=1,νi (0)=vi,FCM
8.根据权利要求1所述的一种自适应聚类的生菜品种鉴别方法,其特征在于,利用所述方法在经过r=37次迭代计算得到的类中心νi (37)值为:
CN201910321709.4A 2019-04-22 2019-04-22 一种自适应聚类的生菜品种鉴别方法 Active CN110147734B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910321709.4A CN110147734B (zh) 2019-04-22 2019-04-22 一种自适应聚类的生菜品种鉴别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910321709.4A CN110147734B (zh) 2019-04-22 2019-04-22 一种自适应聚类的生菜品种鉴别方法

Publications (2)

Publication Number Publication Date
CN110147734A CN110147734A (zh) 2019-08-20
CN110147734B true CN110147734B (zh) 2023-08-15

Family

ID=67589799

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910321709.4A Active CN110147734B (zh) 2019-04-22 2019-04-22 一种自适应聚类的生菜品种鉴别方法

Country Status (1)

Country Link
CN (1) CN110147734B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104568770A (zh) * 2014-12-09 2015-04-29 江苏大学 无监督可能模糊学习矢量量化的生菜品种光谱鉴别方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104568770A (zh) * 2014-12-09 2015-04-29 江苏大学 无监督可能模糊学习矢量量化的生菜品种光谱鉴别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
茶叶傅里叶红外光谱的可能模糊K调和均值聚类分析;武斌等;《茶叶傅里叶红外光谱的可能模糊K调和均值聚类分析》;20180331;第38卷(第3期);第745-749页 *

Also Published As

Publication number Publication date
CN110147734A (zh) 2019-08-20

Similar Documents

Publication Publication Date Title
Shao et al. Visible/near-infrared spectra for linear and nonlinear calibrations: a case to predict soluble solids contents and pH value in peach
CN101713731B (zh) 一种药物制剂包衣质量的鉴别方法
CN104374739A (zh) 一种基于近红外定性分析的种子品种真实性鉴别方法
CN109685098B (zh) 一种模糊簇间分离聚类的茶叶品种分类方法
Lu et al. Fluorescence hyperspectral image technique coupled with HSI method to predict solanine content of potatoes
Yin et al. Non-destructive detection of foreign contaminants in toast bread with near infrared spectroscopy and computer vision techniques
CN110082310A (zh) 一种橡胶树叶片氮素含量的近红外波段高光谱诊断方法
Rathna Priya et al. Characterising corn grain using infrared imaging and spectroscopic techniques: a review
CN109685099A (zh) 一种光谱波段优选模糊聚类的苹果品种辨别方法
CN104990891B (zh) 一种种子近红外光谱和光谱图像定性分析模型建立方法
CN117874609A (zh) 快速鉴别天然产物是否为特定产地的通用快速方法
CN110147734B (zh) 一种自适应聚类的生菜品种鉴别方法
Chen et al. Sugariness prediction of Syzygium samarangense using convolutional learning of hyperspectral images
CN109001181A (zh) 一种拉曼光谱典型相关分析融合的食用油种类快速鉴别方法
CN105067558B (zh) 近红外定性鉴别特征提取方法
CN102519903B (zh) 一种近红外光谱测定双孢蘑菇白度值的方法
CN114062305B (zh) 基于近红外光谱和1D-In-Resnet网络的单籽粒品种鉴定方法及系统
CN110231300A (zh) 一种无损快速鉴别真假阿克苏红富士苹果的方法
CN116399848A (zh) 一种基于深度学习的拉曼光谱大米检测方法
CN112801173B (zh) 一种qr模糊鉴别分析的生菜近红外光谱分类方法
Cheng et al. Identification of wine grape varieties based on near-infrared hyperspectral imaging
CN111693484A (zh) 一种基于太赫兹时域光谱的芝麻油品种识别方法
CN112763448A (zh) 一种基于atr-ftir技术的米糠中多糖含量的快速检测方法
Hong et al. Identification between Fimbristylis miliacea (L.) Vahl and Fimbristhlis stauntonii Debeaux et Franch. by CWT‐FTIR‐RBFNN
CN104568770B (zh) 无监督可能模糊学习矢量量化的生菜品种光谱鉴别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant