CN104568770B - 无监督可能模糊学习矢量量化的生菜品种光谱鉴别方法 - Google Patents

无监督可能模糊学习矢量量化的生菜品种光谱鉴别方法 Download PDF

Info

Publication number
CN104568770B
CN104568770B CN201410745102.6A CN201410745102A CN104568770B CN 104568770 B CN104568770 B CN 104568770B CN 201410745102 A CN201410745102 A CN 201410745102A CN 104568770 B CN104568770 B CN 104568770B
Authority
CN
China
Prior art keywords
romaine lettuce
spectrum
sample
fuzzy
iteration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410745102.6A
Other languages
English (en)
Other versions
CN104568770A (zh
Inventor
武小红
武斌
孙俊
蔡培强
嵇港
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu University
Original Assignee
Jiangsu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu University filed Critical Jiangsu University
Priority to CN201410745102.6A priority Critical patent/CN104568770B/zh
Publication of CN104568770A publication Critical patent/CN104568770A/zh
Application granted granted Critical
Publication of CN104568770B publication Critical patent/CN104568770B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明公开一种无监督可能模糊学习矢量量化的生菜品种光谱鉴别方法,首先用光谱仪采集生菜样本的光谱,然后优选生菜光谱的波段,再用主成分分析方法对生菜的光谱进行降维处理,对降维后的生菜光谱数据运行模糊C‑均值聚类,最后用无监督可能模糊学习矢量量化方法对生菜品种进行鉴别;无需学习样本,能对含有噪声信息的生菜光谱数据进行快速和无破坏性的检测,去除光谱中的冗余信息,加快处理速度和提高鉴别的准确率。

Description

无监督可能模糊学习矢量量化的生菜品种光谱鉴别方法
技术领域
本发明涉及一种生菜品种鉴别方法,具体涉及无监督可能模糊学习矢量量化和光谱检测技术的生菜品种鉴别方法。
背景技术
生菜是人们经常食用的主要蔬菜之一,生菜中含有丰富的营养成分,它含有丰富的膳食纤维和维生素等。不同品种的生菜则其外部品质和内部品质都是不相同的,如何选择产量高、品质高的生菜品种是农业科技工作者研究的重要课题,所以研究一种简单、快速、非破坏的生菜品种鉴别方法是非常必要的。
光谱检测技术是研究光与物质分子之间相互作用的吸收光谱,是鉴定化合物和分析有机物结构的有效工具。光谱检测技术具有非破坏性检测、检测速度快、可同时检测多种成分等优点,广泛应用于农产品(包括谷物、饲料、水果、蔬菜等)成份的快速检测中。光谱射向生菜后得到漫反射光谱,在不同品种的生菜上获得的漫反射光谱是不同的,利用这个原理,可以实现生菜品种的鉴别。但是光谱检测存在的问题是:光谱仪器采集的原始光谱中除了包含与样品组成有关的信息外,也包含了来自各方面的因素所产生的噪声信号。这些噪声信号会对谱图信息产生干扰,有些情况下还很严重,从而影响样本数据模型的建立和对未知样品组成或性质的预测。
模糊学习矢量量化(参见Tsao E C, Bezdek J C, Pal N R. Fuzzy Kohonenclustering networks. Pattern Recognition, 1994, 27(5): 757–764.)是建立在模糊C-均值聚类(FCM)和Kohonen聚类网络基础上的聚类方法。模糊学习矢量量化利用模糊C-均值聚类的隶属度作为学习网络的学习速率。但是FCM建立在可能性约束条件(即同一个样本对所有类别的隶属度之和为1)基础上,对噪声数据敏感,影响聚类结果(参见KrishnapuramR, Keller J. A possibilistic approach to clustering. IEEE Trans. FuzzySystems, 1993, 1(2): 98-110.)。模糊学习矢量量化(FLVQ)建立在FCM基础上,其得到的隶属度值也要满足可能性约束条件,所以模糊学习矢量量化对噪声数据敏感(参见Xiaohong Wu, Haijun Fu, Bin Wu, Jiewen Zhao. Possibilistic fuzzy learningvector quantization,Journal of Information and Computational Science, 2010,7(3): 777-783)。噪声数据会影响模糊学习矢量量化的隶属度值从而影响聚类准确率。
目前,在应用光谱检测技术进行果蔬品种鉴别时所采用的主要鉴别方法有:偏最小二乘判别分析(PLSDA)、软独立模式分类(SIMCA)、人工神经网络(ANN),支持向量机(SVM)、K-近邻法(KNN)等。这些鉴别方法属于有监督的模式识别方法,需要提供训练样本集供分类器学习,学习后再对测试集样本进行分类。在没有学习样本,或者学习样本比较少的情况下运用以上方法难以实现生菜品种的正确鉴别。
发明内容
本发明为了解决由于光谱所含的噪声数据对聚类准确率的影响,以及无学习样本或学习样本较少情况下的生菜品种鉴别问题,提出一种基于无监督可能模糊学习矢量量化和光谱检测技术的生菜品种鉴别方法,属于无监督学习方法,不需要学习样本,能快速、无损地鉴别生菜品种。
本发明采用的技术方案是包括以下步骤:
1)在恒温恒湿环境下用光谱仪采集不同品种的生菜样本的漫反射光谱;
2)根据生菜品种之间的内部成份差异对漫反射光谱进行波段优选;
3)采用主成分分析方法对优选后的生菜样本光谱进行降维处理,将生菜样本光谱从高维数据变换为低维数据;
4)对降维后的生菜光谱数据运行模糊C-均值聚类,得到初始聚类中心
5)计算生菜光谱样本的协方差,根据初始聚类中心和协方差计算生菜光谱样本的第r次迭代时的模糊隶属度值、第r次迭代时的典型值i=1,2,……,c,j=1,2,……,n,c是生菜光谱样本类别数,n是生菜光谱样本数;
6)第r次迭代结束时,根据第j个样本中模糊隶属度的最大值所对应的i值,即判定第j个样本属于第i类;根据第j个样本中典型值的最大值所对应的i值,即判定第j个样本属于第i类,实现不同品种的生菜鉴别。
进一步的方案是:协方差,为第k个生菜光谱样本,为样本的均值,k=1,2,……,n
模糊隶属度值为第j个生菜光谱样本,r=1,2,……,-1,j=1,2,……,n为第r-1次迭代时第i类的聚类中心,为第r-1次迭代计算时第k类的聚类中心,为第r次迭代时的权重指数;
典型值为第r次迭代时的权重指数。
与现有技术相比,本发明采用上述技术方案具有的优点是:
1、本发明采用光谱检测技术检测生菜,能快速和无破坏性的对生菜进行检测。
2、本发明采用无监督可能模糊聚类更新聚类网络的学习速率,能对含有噪声信息的生菜光谱数据进行准确聚类。
3、本发明采用无监督可能模糊学习矢量量化方法,无需学习样本,可以在无学习样本情况下进行生菜品种鉴别,可实现不同品种生菜的鉴别。
4、本发明采用了波段优选,能去除光谱中的冗余信息,加快处理速度和提高鉴别的准确率。
附图说明
图1是本发明的流程图;
图2是实施例中生菜样本的漫反射光谱图。
具体实施方式
参见图1,本发明首先用光谱仪采集生菜样本的光谱,然后优选生菜光谱的波段,再用主成分分析方法对生菜的光谱进行降维处理,对降维后的生菜光谱数据运行模糊C-均值聚类,最后用无监督可能模糊学习矢量量化方法对生菜品种进行鉴别。具体如下:
采集不同品种的生菜样本,在恒温恒湿环境下,用光谱仪采集不同品种的生菜样本的漫反射光谱。漫反射光谱是指光谱范围为350~2500nm,采集到的每个生菜样本的光谱是2151维的数据。
对漫反射光谱进行波段优选。根据生菜品种之间的内部成份差异选择漫反射光谱的波段。从光谱范围为350~2500nm中选择出体现不同品种生菜差异的光谱波段,具体为:(1)选择的波段是400~660nm,该波段包含了生菜维生素含量的信息;(2)选择的波段是800~1320nm,该波段是生菜营养成分(如膳食纤维,碳水化合物和蛋白质等)的C-H和N-H基团的三倍频区域。(3)选择的波段1500~1820nm,该波段是生菜营养成分的C-H和N-H基团的二倍频区域。不同品种的生菜它们的维生素含量和营养成分是不同的,所以本发明选择的波段光谱体现出生菜品种之间的维生素含量和营养成分的差别信息。
对优选后的生菜样本光谱进行降维处理:采用主成分分析方法(PCA)将生菜样本光谱从高维数据变换为低维数据。
对降维后的生菜光谱数据运行模糊C-均值聚类,得到聚类中心。模糊C-均值聚类的参数设置为:类别数为3,权重指数为2,最大迭代数为100次,误差上限为0.00001。模糊C-均值聚类迭代终止后得到的聚类中心作为无监督可能模糊学习矢量量化方法的初始聚类中心。
用无监督可能模糊学习矢量量化方法进行生菜品种的鉴别。具体是:
1.初始化
(1)固定生菜光谱样本类别数),初始权重指数)和),最大迭代数r= 1,误差上限的值,固定参数a()、b()和样本数n;得到的初始聚类中心i=1,2,……,c)。
(2)计算生菜光谱样本的协方差
,这里为第k个生菜光谱样本, 为样本的均值,k=1,2,……,nn是生菜光谱样本数。
2.计算第rr=1,2,……,-1)次迭代时的模糊隶属度值
为第j个生菜光谱样本,r=1,2,……,-1,j=1,2,……,n
隶属度值表示第r次迭代计算时第j个样本隶属于第i类的隶属度值,其中为第r-1次迭代时第i类的类中心, 为第r-1次迭代计算时第k类的类中心;为第r次迭代时的权重指数,;
3. 计算第r次迭代时的典型值
,典型值表示第r次迭代计算时第j个样本隶属于第i类的典型值,为第r次迭代时的权重指数,;
4.计算第r次迭代时的学习速率
5.计算第r次迭代时的类中心i=1,2,……,c
,其中为第r次迭代计算时第ii=1,2,……,c)类的类中心,为第r-1次迭代计算时第i类的类中心;
或者时,迭代结束,否则,r=r+1,返回步骤2继续迭代计算。
根据模糊隶属度和典型值可实现不同品种的生菜鉴别。根据第r次迭代终止时的模糊隶属度和典型值,则第j个样本中模糊隶属度的最大值所对应的i值,即判定第j个样本属于第i类;第j个样本中典型值的最大值所对应的i值,即判定第j个样本属于第i类。这是无监督可能模糊学习矢量量化方法得到的两个聚类划分方法。
以下提供本发明的一个实施例。
实施例
下面结合实施例和附图对本发明进一步详细说明。
如图1所示,生菜的漫反射光谱包含了生菜内部成分信息,品种不同的生菜所对应的内部成分含量是不同的,则它们的漫反射光谱也不相同,所以本发明可以实现。
步骤一、生菜样本光谱采集:在生菜成熟期,采集香港玻璃生菜,意大利全年耐抽苔生菜和大禹奶油生菜三个品种样本,每个品种生菜样本数为40个。采用美国ASD公司生产的FieldSpec@3型便携式光谱分析仪,该仪器光谱测量范围350~2500nm,在350~1000nm光谱区采样间隔为1.4nm,分辨率为3nm;在1000~2500nm光谱区采样间隔为2nm,分辨率为10nm。在恒温恒湿环境下,将生菜叶片放置于黑色绒布上,测量时将光谱探头置于工作台上方5cm处,垂直于被测物,设定视场为25度。测量叶片之前先测量标准反射板,以消除环境因素(主要是光强)引起的系统误差,每片叶片测量3次,取平均值作为最终测量结果。120个生菜样本的漫反射光谱图如图2所示。所得的生菜样本光谱为2151维数据。
步骤二、对光谱进行波段优选:根据生菜品种之间的内部成份差异选择光谱波段。具体为:(1)选择波段400~660nm,该波段包含了生菜维生素含量的信息;(2)选择波段800~1320nm,该波段是生菜营养成分(如膳食纤维,碳水化合物和蛋白质等)的C-H和N-H基团的三倍频区域。(3)选择波段1500~1820nm,该波段是生菜营养成分的C-H和N-H基团的二倍频区域。波段优选后的生菜光谱为1101维数据。
步骤三、对生菜样本光谱进行降维处理:采用主成分分析方法(PCA)将生菜样本光谱从1101维数据变换为10维数据。分别选取前L个主成分得到其累计可信度如表1所示(累计可信度=前L个主成分特征值除以总的特征值之和)。本实施例取前10个主成分,则累计可信度达100.00%(见表1)。
表1 主成分累计可信度
步骤四、运行模糊C-均值聚类以得到初始聚类中心:对降维后得到的10维光谱数据运行模糊C-均值聚类(FCM),得到初始聚类中心如下:
步骤五、用无监督可能模糊学习矢量量化方法进行生菜品种的鉴别:
1.初始化
(1)固定生菜光谱样本类别数,初始权重指数=2.0和=2.0,最大迭代数=100,r=1,误差上限的值=0.00001,固定参数a=1.0,b=2.5和样本数n=120,步骤四的得到的初始聚类中心作为无监督可能模糊学习矢量量化方法的初始聚类中心i=1,2,……,c);
(2)计算生菜光谱样本的协方差
,这里为第k个生菜光谱样本,为样本的均值;
实验计算结果:
2.计算第rr=1,2,……,-1)次迭代时的隶属度值
,隶属度值表示第rr=1,2,……,-1)次迭代计算时第j个样本隶属于第i类的隶属度值,其中为第r-1次迭代时第i类的类中心,为第r-1次迭代计算时第k类的类中心;为第r次迭代时的权重指数,;
实验结果:迭代终止时(此时r=99)时的隶属度值的部分值如表3所示,取第j个样本中的最大值所对应的i值,即判定第j个样本属于第i类。例如,当j=1时,因为最大,则判定第1个样本属于第1类(即香港玻璃生菜)。
表3隶属度的部分值
3. 计算第r次迭代时的典型值
,典型值表示第r次迭代计算时第j个样本隶属于第i类的典型值,为第r次迭代时的权重指数,;
实验结果:迭代终止时(此时r=99)时的典型值的部分值如表4所示,取第j个样本中的最大值所对应的i值,即判定第j个样本属于第i类。
表4典型值隶属度的部分值
4.计算第r次迭代时的学习速率
实验结果:迭代终止时r=99,的部分数值如表5所示,的部分数值如表6所示。
表5 的部分值
表6 的部分值
5.计算第r次迭代时的类中心i=1,2,……,c
,其中为第r次迭代计算时第ii=1,2,……,c)类的类中心,为第r-1次迭代计算时第i类的类中心;
或者时,迭代结束,否则,r=r+1,返回步骤2继续迭代计算。
实验结果:迭代终止时r=99,为:
,
最后,根据隶属度值实现生菜品种鉴别,鉴别准确率达到87.5%。根据典型值实现生菜品种鉴别,鉴别准确率达到87.5%。

Claims (3)

1.一种无监督可能模糊学习矢量量化的生菜品种光谱鉴别方法,包括如下步骤:
1)在恒温恒湿环境下用光谱仪采集不同品种的生菜样本的漫反射光谱;
2)根据生菜品种之间的内部成份差异对漫反射光谱进行波段优选;
3)采用主成分分析方法对优选后的生菜样本光谱进行降维处理,将生菜样本光谱从高维数据变换为低维数据;
4)对降维后的生菜光谱数据运行模糊C-均值聚类,得到初始聚类中心
5)计算生菜光谱样本的协方差,根据初始聚类中心和协方差计算生菜光谱样本的第r次迭代时的模糊隶属度值、第r次迭代时的典型值i=1,2,……,c,j=1,2,……,n,c是生菜光谱样本类别数,n是生菜光谱样本数;协方差,为第k个生菜光谱样本,为样本的均值,k=1,2,……,n;模糊隶属度值为第j个生菜光谱样本,r=1,2,……,-1,j=1,2,……,n为第r-1次迭代时第i类的聚类中心,为第r-1次迭代计算时第k类的聚类中心,为第r次迭代时的权重指数;
典型值为第r次迭代时的权重指数,b是固定参数;
6)第r次迭代结束时,根据第j个样本中模糊隶属度的最大值所对应的i值,即判定第j个样本属于第i类;根据第j个样本中典型值的最大值所对应的i值,即判定第j个样本属于第i类,实现不同品种的生菜鉴别,
其特征是:当或者时,迭代结束;为第r次迭代计算时第i类的类中心,,学习速率,a、b是固定参数,是误差上限。
2.根据权利要求1所述生菜品种光谱鉴别方法,其特征是:步骤4)中,模糊C-均值聚类的参数设置为:类别数为3,权重指数为2,最大迭代数为100次,误差上限为0.00001。
3.根据权利要求1所述生菜品种光谱鉴别方法,其特征是:步骤2)中,优择的漫反射光谱的波段是400~660nm、800~1320nm、1500~1820nm,波段400~660nm包含了生菜维生素含量的信息,波段800~1320nm是生菜营养成分的C-H和N-H基团的三倍频区域,波段1500~1820nm是生菜营养成分的C-H和N-H基团的二倍频区域。
CN201410745102.6A 2014-12-09 2014-12-09 无监督可能模糊学习矢量量化的生菜品种光谱鉴别方法 Expired - Fee Related CN104568770B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410745102.6A CN104568770B (zh) 2014-12-09 2014-12-09 无监督可能模糊学习矢量量化的生菜品种光谱鉴别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410745102.6A CN104568770B (zh) 2014-12-09 2014-12-09 无监督可能模糊学习矢量量化的生菜品种光谱鉴别方法

Publications (2)

Publication Number Publication Date
CN104568770A CN104568770A (zh) 2015-04-29
CN104568770B true CN104568770B (zh) 2017-07-18

Family

ID=53085347

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410745102.6A Expired - Fee Related CN104568770B (zh) 2014-12-09 2014-12-09 无监督可能模糊学习矢量量化的生菜品种光谱鉴别方法

Country Status (1)

Country Link
CN (1) CN104568770B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110147734B (zh) * 2019-04-22 2023-08-15 江苏大学 一种自适应聚类的生菜品种鉴别方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03202707A (ja) * 1989-12-29 1991-09-04 Canon Inc 基板実装検査装置
JPH03204089A (ja) * 1989-12-29 1991-09-05 Canon Inc 画像処理方法
CN101419671A (zh) * 2008-11-10 2009-04-29 北方工业大学 基于模糊支持向量机的人脸性别识别方法
CN103646252A (zh) * 2013-12-05 2014-03-19 江苏大学 一种基于优化的模糊学习矢量量化的苹果分类方法
CN103955629A (zh) * 2014-02-18 2014-07-30 吉林大学 基于模糊k均值的宏基因组片段聚类方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03202707A (ja) * 1989-12-29 1991-09-04 Canon Inc 基板実装検査装置
JPH03204089A (ja) * 1989-12-29 1991-09-05 Canon Inc 画像処理方法
CN101419671A (zh) * 2008-11-10 2009-04-29 北方工业大学 基于模糊支持向量机的人脸性别识别方法
CN103646252A (zh) * 2013-12-05 2014-03-19 江苏大学 一种基于优化的模糊学习矢量量化的苹果分类方法
CN103955629A (zh) * 2014-02-18 2014-07-30 吉林大学 基于模糊k均值的宏基因组片段聚类方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A possibilistic approach to clustering;Krishnapuram R, Keller J;《 IEEE Trans. Fuzzy Systems》;19930531;第98-110页 *
Fuzzy Kohonen clustering networks;Tsao E C, Bezdek J C, Pal N R;《Pattern Recognition》;19941231;第27卷(第5期);第757–764页 *
可能性模糊C-均值聚类新算法;武小红等;《电子学报》;20081015;第36卷(第10期);第1996-2000页 *
学习矢量量化的推广及其典型形式的比较;程剑锋等;《计算机工程与应用》;20060611;第82-85页 *

Also Published As

Publication number Publication date
CN104568770A (zh) 2015-04-29

Similar Documents

Publication Publication Date Title
Cen et al. Theory and application of near infrared reflectance spectroscopy in determination of food quality
Cai et al. Using FTIR spectra and pattern recognition for discrimination of tea varieties
Xiaowei et al. Measurement of total anthocyanins content in flowering tea using near infrared spectroscopy combined with ant colony optimization models
Wu et al. Classification of apple varieties using near infrared reflectance spectroscopy and fuzzy discriminant c‐means clustering model
Theanjumpol et al. Non-destructive identification and estimation of granulation in ‘Sai Num Pung’tangerine fruit using near infrared spectroscopy and chemometrics
CN104316491B (zh) 基于同步‑异步二维近红外相关谱检测牛奶掺尿素的方法
Shafiee et al. Combined data mining/NIR spectroscopy for purity assessment of lime juice
Schuhfried et al. Classification of 7 monofloral honey varieties by PTR-ToF-MS direct headspace analysis and chemometrics
CN103048273A (zh) 基于模糊聚类的水果近红外光谱分类方法
CN103278473B (zh) 白胡椒中胡椒碱及水分含量的测定和品质评价方法
Shao et al. A new quantitative index for the assessment of tomato quality using Vis-NIR hyperspectral imaging
CN103344602A (zh) 一种基于近红外光谱的水稻种质真伪无损检测方法
de Lima et al. Methods of authentication of food grown in organic and conventional systems using chemometrics and data mining algorithms: A review
Jiang et al. Sweetness detection and grading of peaches and nectarines by combining short-and long-wave fourier-transform near-infrared spectroscopy
Li et al. Non-destructive discrimination of paddy seeds of different storage age based on Vis/NIR spectroscopy
CN110749565A (zh) 一种快速鉴别普洱茶存储年份的方法
CN111272696A (zh) 一种快速检测普洱茶中掺杂香精的方法
Cui et al. Identification of maize seed varieties based on near infrared reflectance spectroscopy and chemometrics
Arslan et al. NIR spectroscopy coupled chemometric algorithms for rapid antioxidants activity assessment of Chinese dates (Zizyphus Jujuba Mill.)
CN102937575A (zh) 一种基于二次光谱重组的西瓜糖度快速建模方法
Yang et al. Comprehensive evaluation of Dendrobium officinale from different geographical origins using near-infrared spectroscopy and chemometrics
CN105138834A (zh) 基于近红外光谱波数k均值聚类的烟草化学值定量方法
CN105806803B (zh) 一种多指标协同分析波长组合及其选择方法
Kane et al. Spectral sensing of different citrus varieties for precision agriculture
CN103954582A (zh) 一种混合k调和聚类的苹果品种近红外光谱分类方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170718

Termination date: 20171209