CN103954582B - 一种混合k调和聚类的苹果品种近红外光谱分类方法 - Google Patents
一种混合k调和聚类的苹果品种近红外光谱分类方法 Download PDFInfo
- Publication number
- CN103954582B CN103954582B CN201410143595.6A CN201410143595A CN103954582B CN 103954582 B CN103954582 B CN 103954582B CN 201410143595 A CN201410143595 A CN 201410143595A CN 103954582 B CN103954582 B CN 103954582B
- Authority
- CN
- China
- Prior art keywords
- apple
- sample
- near infrared
- mediation
- mixing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种混合K调和聚类的苹果品种近红外光谱分类方法,其包括以下步骤:(1)苹果样本近红外光谱采集;(2)对苹果样本近红外光谱进行降维处理;(3)用混合K调和聚类方法进行苹果品种的分类。本发明具有检测速度快,分类准确率高,分类效率高,对苹果不造成损坏等优点。可实现苹果品种的正确分类。
Description
技术领域
本发明涉及一种苹果品种分类方法,具体涉及一种基于混合K调和聚类方法和近红外光谱技术的苹果品种分类方法。
背景技术
苹果是人们经常食用的水果之一。苹果果实里包含了一些与健康和感官有关的成分,包括单糖、矿物质、膳食纤维和各种生活性物质,如维生素C和酚类化合物。不同品种的苹果其内部的糖度,酸度和可溶性固形物等是不相同的。即苹果品种不同,其内部品质是不同的。所以,优选好的品种的苹果是农业科技人员的重要任务。
近红外光谱技术是利用物质对光的吸收、散射、反射和透射等特性来确定其成分含量的一种非破坏性检测技术。近红外光谱技术具有非破坏性检测,检测速度快,可同时检测多种成分等优点。近红外光谱射向苹果后得到漫反射光谱,在不同品种的苹果上获得的漫反射光谱是不同的,利用这个原理,可以将不同品种的苹果区分开来,即实现不同品种苹果的分类。
K调和均值聚类是一种无监督的学习方法,是一种基于中心的迭代聚类方法。K调和均值聚类将所有数据点到每个聚类中心的调和平均值的和作为聚类的目标函数。K均值聚类对初始聚类中心敏感,而由于提升函数的作用使K调和均值聚类对初始聚类中心不敏感。另外一方面,K调和均值聚类容易陷入局部极小点。为了解决这个问题,一些学者提出了一些改进算法,比如:Yang等人提出一种粒子群优化的K调和均值聚类方法(PSOKHM),PSOKHM能避免局部极小点,并且解决了粒子群优化收敛速度慢问题。Jiang等人提出一种基于蚁群聚类的K调和均值聚类方法。在给定初始温度值后模拟退火用来搜寻一些空间分子的平衡状态,它是一种求解组合优化问题的方法。Güngör和Ünler在模拟退火和K调和均值聚类基础上提出一种新的聚类算法以求得K调和均值聚类的全局最优解。Güngör和Ünler利用禁忌搜索方法提出禁忌K调和均值聚类方法,该方法解决了K调和均值聚类的局部极小点问题。但是,K调和均值聚类还存在着对噪声敏感的问题。因为K调和均值聚类建立在可能性约束条件基础上,K调和均值聚类使数据点在所有类中的隶属度之和为1。可能性约束条件避免了所有隶属度为0的平凡解,但是造成了K调和均值聚类对噪声敏感。为了解决K调和均值聚类对噪声敏感的问题,本发明提出一种混合调和聚类方法。
近红外光谱技术作为一种无损、快速的检测方法,已被广泛用于农产品和食品检测领域。目前,在应用近红外光谱技术分类水果时对近红外光谱的分类方法主要有软独立模式分类(SIMCA),偏最小二乘判别分析(PLSDA),人工神经网络(ANN)、支持向量机(SVM)、K-近邻法(KNN)等方法。这些方法属于有监督的学习方法,即它们需要学习样本来获取先验知识。在没有学习样本,或者学习样本比较少的情况下运用以上方法进行水果分类时会导致分类准确率低而难以实现水果的正确分类。为解决这个问题,本发明应用提出的一种混合调和聚类方法进行苹果品种的分类,属于无监督的苹果品种分类方法。
发明内容
本发明的目的是在于克服现有技术存在的上述缺陷,提供一种运用近红外漫反射光谱技术和一种混合K调和聚类方法的苹果品种分类方法,具有检测速度快,分类准确率高,无需学习样本,对苹果不造成损坏等优点。
本发明依据的原理:研究表明,苹果的近红外漫反射光谱包含了苹果内部的糖度,酸度和可溶性固形物等内部品种信息,不同品种的苹果所对应的近红外漫反射光谱也不同。运用主成分分析压缩不同品种苹果的近红外光谱数据。再根据一种混合调和聚类方法将不同品种苹果进行分类。
根据上述原理,采用的技术方案包括以下步骤:
步骤一、苹果样本近红外光谱采集:针对不同品种的苹果样本,用近红外光谱仪对这些苹果样本投射近红外,获取苹果样本的近红外漫反射光谱信息,将光谱信息存储在计算机里。实验过程中,尽量保持室内的温度和湿度基本一致。
步骤二、对苹果样本近红外光谱数据进行压缩:将苹果样本近红外光谱采用主成分分析方法(PCA)进行压缩。
步骤三、用一种混合K调和聚类方法进行苹果品种的分类:运行一种混合K调和聚类方法得到模糊隶属度和典型值,根据模糊隶属度和典型值可将不同品种苹果进行分类。
所述步骤一中近红外漫反射光谱信息是指光谱的波数范围为10000~4000cm-1,采集到每个苹果样本的光谱是1557维的数据。
所述步骤二中用主成分分析方法进行降维时,在满足主成分的累计可信度≥98%条件下选取主成分个数。
所述步骤三中的一种混合K调和聚类方法方法如下:
1.初始化
(1)确定类别数k,样本数n和权重指数m和w的值,且满足n>k>1,+∞>m,w>1;设置迭代次数初始值r =0和最大迭代次数为rmax;设置迭代最大误差参数ε;
(2)确定聚类的初始类中心;
(3)计算样本的协方差
:
,
这里为第i个苹果近红外光谱样本,为样本的均值,。
2.计算隶属度值
,为第j类第i个样本数据的模糊隶属度值,其中,为第j类的类中心。
3.计算典型值
,为第j类第i个样本数据的典型值。
4.计算类中心
,其中,为第s类第i个样本数据的模糊隶属度值,为第s类第i个样本数据的典型值。
5.
当)
或者 (r>rmax)则计算终止,否则从“2.计算隶属度值”开始重新计算。
本发明的有益效果是:
本发明用近红外光谱技术和一种混合K调和聚类方法建立苹果品种分类的快速检测方法。该检测方法具有检测速度快,准确率高,效率高,无化学试剂,不破坏检测样本等优点。
附图说明
图1是一种混合K调和聚类的苹果品种近红外光谱分类方法的流程图;
图2是苹果样本的近红外光谱图;
图3是一种混合K调和聚类方法产生的模糊隶属度;
图4是一种混合K调和聚类产生的典型值。
具体实施方式
下面结合实施例和附图对本发明进一步详细说明。
本发明的一种混合K调和聚类的苹果品种近红外光谱分类方法适用于多个品种的苹果分类。例如:红富士,花牛,蛇果,嘎拉等苹果的分类。因为不同品种苹果,其漫反射近红外光谱也是不同的,所以本发明可以实现。本发明的实施流程如图1所示。下文为方便叙述,以红富士,花牛,加纳三种苹果作为例子进行阐述。
实施例
步骤一:取红富士,花牛,加纳三种苹果样本,每种苹果样本50个。苹果样本在温度为20~
25℃实验室内存放12小时,Antaris
II近红外光谱分析仪开机预热1个小时。采用反射积分球模式采集苹果近红外光谱,近红外光谱分析仪扫描每个样品32次以获取样品的漫反射光谱均值。光谱扫描的波数为10000~4000cm-1,扫描间隔为3.856cm-1,采集到每个样品的光谱是1557维的数据。为减少误差,每个苹果样本沿赤道轨迹采样3次,取其平均值作为最终的实验数据。150个苹果样本的近红外光谱如图2所示。
步骤二:苹果样本近红外光谱的降维处理:因为前6个主成分累计可信度为100%≥98%,所以采用主成分分析方法将苹果样本近红外光谱进行特征分解得到前6个特征向量和6个特征值。每个特征向量都是1557维的数据,,,,,,。将苹果样本近红外光谱投影到6个特征向量上得到6维的数据,即从1557维压缩到6维。
步骤三:用一种混合K调和聚类方法对6维的数据进行分类,其具体步骤为:
1、初始化
(1)设置权重指数和,参数,类别数k=3,样本数n=150;设置循环计数初始值 r =0和最大迭代次数为rmax=100;误差;
(2)选取6维的数据的前3个数据作为初始类中心:
(3)计算样本的方差: ,
为第k个样本,n为样本数,这里n=150,为样本均值,。
计算结果:。
2、计算隶属度值
,为第j类第i个样本数据的模糊隶属度值,其中,,为第i个样本,为第j类的类中心,为第s类的类中心。
3、 计算典型值
,为第j类第i个样本数据的典型值。
4、计算类中心
,其中,为第s类第i个样本数据的模糊隶属度值,为第s类第i个样本数据的典型值。
5、;
当)
或者 (r>rmax)则计算终止,否则继续步骤1。
实验结果:模糊隶属度和典型值产生的聚类准确率均为93.3%,即对三种苹果的分类准确率能达到93.75%。
图3和图4分别是一种混合K调和聚类方法分类三种苹果近红外光谱时产生的模糊隶属度值和典型值。图3中的四个小图代表三种苹果的模糊隶属度值,图4中的四个小图代表三种苹果的典型值。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.一种混合K调和聚类的苹果品种近红外光谱分类方法,具体包括如下步骤:
(1)苹果样本近红外光谱采集:针对不同品种的苹果样本,用近红外光谱仪对这些苹果样本投射近红外,获取苹果样本的近红外漫反射光谱信息,将光谱信息存储在计算机里;
(2)对苹果样本近红外光谱数据进行压缩:将苹果样本近红外光谱采用主成分分析方法进行压缩;
(3)用一种混合K调和聚类方法进行苹果品种的分类:运行一种混合K调和聚类方法得到模糊隶属度和典型值,根据模糊隶属度和典型值将不同品种苹果进行分类;
步骤(3)中,所述一种混合K调和聚类方法的具体步骤为:
A、初始化:
a、确定类别数k,样本数n和权重指数m和w的值,且满足n>k>1,+∞>m,w>1;设置迭代次数初始值r=0和最大迭代次数为rmax;设置迭代最大误差参数ε;
b、确定聚类的初始类中心;
c、计算样本的协方差σ2:
其中,xi为第i个苹果近红外光谱样本,为样本的均值,
B、计算隶属度值uij:
uij为第j类第i个样本数据的模糊隶属度值,其中dij=||xi-cj||,cj为第j类的类中心;
C、计算典型值tij:
tij为第j类第i个样本数据的典型值;
D、计算类中心cj:
其中,dis=||xi-cs||,uis为第s类第i个样本数据的模糊隶属度值,tis为第s类第i个样本数据的典型值;
E、r=r+1:
当或者r>rmax则计算终止,否则从“步骤B计算隶属度值uij”开始重新计算。
2.根据权利要求1所述的一种混合K调和聚类的苹果品种近红外光谱分类方法,其特征在于:所述步骤(1)中,保持室内的温度和湿度一致。
3.根据权利要求1所述的一种混合K调和聚类的苹果品种近红外光谱分类方法,其特征在于:所述步骤(1)中,近红外漫反射光谱信息是指光谱的波数范围为10000~4000cm-1,采集到每个苹果样本的光谱是1557维的数据。
4.根据权利要求1所述的一种混合K调和聚类的苹果品种近红外光谱分类方法,其特征在于:所述步骤(2)中,用主成分分析方法进行降维时,在满足主成分的累计可信度≥98%条件下选取主成分个数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410143595.6A CN103954582B (zh) | 2014-04-11 | 2014-04-11 | 一种混合k调和聚类的苹果品种近红外光谱分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410143595.6A CN103954582B (zh) | 2014-04-11 | 2014-04-11 | 一种混合k调和聚类的苹果品种近红外光谱分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103954582A CN103954582A (zh) | 2014-07-30 |
CN103954582B true CN103954582B (zh) | 2016-04-06 |
Family
ID=51331887
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410143595.6A Expired - Fee Related CN103954582B (zh) | 2014-04-11 | 2014-04-11 | 一种混合k调和聚类的苹果品种近红外光谱分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103954582B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105181650B (zh) * | 2015-10-08 | 2018-08-17 | 滁州职业技术学院 | 一种使用近红外光谱技术快速鉴别茶叶品种的方法 |
CN106408012A (zh) * | 2016-09-09 | 2017-02-15 | 江苏大学 | 一种模糊鉴别聚类的茶叶红外光谱分类方法 |
CN106932359A (zh) * | 2017-03-02 | 2017-07-07 | 兰州大学 | 一种基于近红外光谱的苹果分类方法 |
CN107860739A (zh) * | 2017-11-27 | 2018-03-30 | 江苏大学 | 一种模糊k调和网络聚类的茶叶中红外光谱分类方法 |
CN109030407B (zh) * | 2018-04-16 | 2020-12-18 | 江苏大学 | 一种混合模糊c均值聚类的苹果品种分类方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5126709B2 (ja) * | 2007-07-06 | 2013-01-23 | 国立大学法人島根大学 | 貝分別方法 |
CN103048273B (zh) * | 2012-11-09 | 2014-12-03 | 江苏大学 | 基于模糊聚类的水果近红外光谱分类方法 |
CN103646252B (zh) * | 2013-12-05 | 2017-01-11 | 江苏大学 | 一种基于优化的模糊学习矢量量化的苹果分类方法 |
-
2014
- 2014-04-11 CN CN201410143595.6A patent/CN103954582B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN103954582A (zh) | 2014-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103954582B (zh) | 一种混合k调和聚类的苹果品种近红外光谱分类方法 | |
CN103048273B (zh) | 基于模糊聚类的水果近红外光谱分类方法 | |
Wang et al. | Fruit quality evaluation using spectroscopy technology: a review | |
CN109030407A (zh) | 一种混合模糊c均值聚类的苹果品种分类方法 | |
CN103646252B (zh) | 一种基于优化的模糊学习矢量量化的苹果分类方法 | |
CN103674854A (zh) | 一种基于联合区间偏最小二乘判别分析的苹果分级方法 | |
CN106248621B (zh) | 一种评价方法与系统 | |
CN105913448B (zh) | 基于张量匹配子空间的高光谱图像目标检测方法 | |
CN103235095A (zh) | 注水肉检测方法和装置 | |
CN106408012A (zh) | 一种模糊鉴别聚类的茶叶红外光谱分类方法 | |
CN107202761A (zh) | 一种快速检测水果内部品质的便携式检测设备及检测方法 | |
CN102982339A (zh) | 一种高光谱特征变量选取的方法 | |
CN109543720A (zh) | 一种基于对抗生成网络的晶圆图缺陷模式识别方法 | |
Granados-López et al. | Feature selection for CIE standard sky classification | |
CN106951822B (zh) | 一种基于多尺度稀疏保持投影一维距离像融合识别方法 | |
CN115661069A (zh) | 一种高光谱异常检测方法及计算机装置 | |
Liu et al. | Diagnosis of citrus greening using raman spectroscopy-based pattern recognition | |
Qu et al. | Application of serum mid-infrared spectroscopy combined with an ensemble learning method in rapid diagnosis of gliomas | |
Zhao et al. | Comparison of two cluster analysis methods using single particle mass spectra | |
Wang et al. | Radar HRRP target recognition in frequency domain based on autoregressive model | |
CN104463227A (zh) | 基于fqpso和目标分解的极化sar图像分类方法 | |
You et al. | Classification of food powders with open set using portable VIS-NIR spectrometer | |
CN107886115A (zh) | 一种自适应可能c均值聚类的茶叶中红外光谱分类方法 | |
CN106323466A (zh) | 一种连续小波变换分析的叶片氮含量高光谱估算方法 | |
Fang et al. | Enhanced predictions of wood properties using hybrid models of PCR and PLS with high-dimensional NIR spectral data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160406 Termination date: 20170411 |