CN107886115A - 一种自适应可能c均值聚类的茶叶中红外光谱分类方法 - Google Patents
一种自适应可能c均值聚类的茶叶中红外光谱分类方法 Download PDFInfo
- Publication number
- CN107886115A CN107886115A CN201711027252.3A CN201711027252A CN107886115A CN 107886115 A CN107886115 A CN 107886115A CN 201711027252 A CN201711027252 A CN 201711027252A CN 107886115 A CN107886115 A CN 107886115A
- Authority
- CN
- China
- Prior art keywords
- tealeaves
- sample
- value
- mid
- infrared light
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000002329 infrared spectrum Methods 0.000 claims abstract description 34
- 238000001514 detection method Methods 0.000 claims abstract description 9
- 239000011159 matrix material Substances 0.000 claims abstract description 8
- 238000012937 correction Methods 0.000 claims abstract description 6
- 230000003044 adaptive effect Effects 0.000 claims abstract description 5
- 239000000284 extract Substances 0.000 claims abstract description 3
- 241001122767 Theaceae Species 0.000 claims abstract 2
- 238000012360 testing method Methods 0.000 claims description 23
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000001228 spectrum Methods 0.000 claims description 13
- 238000012549 training Methods 0.000 claims description 10
- 238000000513 principal component analysis Methods 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 7
- 230000003595 spectral effect Effects 0.000 claims description 6
- 238000013144 data compression Methods 0.000 claims description 4
- 101100001669 Emericella variicolor andD gene Proteins 0.000 claims description 2
- YEPGIYSLLAGBSS-UHFFFAOYSA-M chloro-[3-[(4-iodophenyl)carbamoylamino]-2-methoxypropyl]mercury Chemical compound Cl[Hg]CC(OC)CNC(=O)NC1=CC=C(I)C=C1 YEPGIYSLLAGBSS-UHFFFAOYSA-M 0.000 abstract description 10
- 238000007621 cluster analysis Methods 0.000 abstract description 2
- 230000000694 effects Effects 0.000 abstract description 2
- 235000013616 tea Nutrition 0.000 description 16
- 244000269722 Thea sinensis Species 0.000 description 13
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 5
- 235000017491 Bambusa tulda Nutrition 0.000 description 5
- 241001330002 Bambuseae Species 0.000 description 5
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 5
- 241000270295 Serpentes Species 0.000 description 5
- 239000011425 bamboo Substances 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000001788 irregular Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 241001269238 Data Species 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000012850 discrimination method Methods 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 235000009024 Ceanothus sanguineus Nutrition 0.000 description 1
- 240000003553 Leptospermum scoparium Species 0.000 description 1
- 235000015459 Lycium barbarum Nutrition 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000000862 absorption spectrum Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 235000009569 green tea Nutrition 0.000 description 1
- 150000002484 inorganic compounds Chemical class 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000000985 reflectance spectrum Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000002791 soaking Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3563—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种自适应可能C均值聚类的茶叶中红外光谱分类方法,包括步骤:(1)茶叶样本中红外光谱采集;(2)用多元散射矫正(MSC)进行茶叶样本中红外光谱的预处理;(3)对茶叶样本中红外光谱进行降维处理和鉴别信息提取;(4)用自适应可能C均值聚类方法鉴别茶叶品种。本发明解决了用基于欧氏距离的改进型可能C‑均值(IPCM)聚类方法在聚类分析茶叶的中红外光谱数据时聚类效果不理想的问题,本发明采用基于模糊协方差矩阵的自适应距离测度来代替IPCM聚类方法中的欧氏距离测度。本发明具有检测速度快,检测准确率高,绿色无污染,所需茶叶样本少等优点。
Description
技术领域
本发明涉及茶叶品种分类领域,具体涉及一种自适应可能C均值聚类的茶叶中红外光谱分类方法。
背景技术
茶叶是茶树的叶子经过一定工艺加工而成,人们喜欢将茶叶泡成饮品饮用。随着出口贸易市场的开放和国内市场流通的增多,快速准确的茶叶品种鉴别方法变得至关重要。然而传统的茶叶鉴别方法一般是由经验丰富的业内人士人工鉴别,效率和准确率都比较低下。
中红外光谱检测技术作为一种快速无损检测技术,近年来应用于食品的检测分析中。中红外光谱的波数范围在4000cm-1~400cm-1之间,大多数的无机化合物和有机化合物的化学键振动的基频均在此区域。不同的分子中官能团、化合物的类别和化合物的立体结构,其中红外吸收光谱不尽相同。中红外光谱技术以其方便、快速、高效、无损、低成本等特点成为检测食品和药品的有效检测技术。
改进型可能C-均值(IPCM)聚类方法(Zhang,J.-S.,Leung,Y.-W.,Improvedpossibilistic C-means clustering algorithms,IEEE Trans.Fuzzy Systems,2004,12(2):209-217)解决了模糊C均值聚类(FCM)对噪声敏感和可能C-均值聚类(PCM)一致性聚类的缺点;但IPCM的目标函数中使用的是欧氏距离,在使用基于欧氏距离的IPCM处理不规则聚类形状的数据时,聚类准确率会受到影响。
用中红外光谱仪采集多个品种茶叶的中红外光谱数据在进行数据降维后,各品种茶叶数据的边界往往是不规则形状的,如果用基于欧氏距离的IPCM来聚类分析茶叶的中红外光谱数据则效果往往不理想。
发明内容
本发明是针对现有的IPCM聚类方法在聚类茶叶中红外光谱数据时存在的缺点,提出一种自适应可能C均值聚类的茶叶中红外光谱分类方法,相比原有的IPCM聚类方法,本发明的一种自适应可能C均值聚类的茶叶中红外光谱分类方法采用基于模糊协方差矩阵的自适应距离测度来代替IPCM聚类方法中的欧氏距离测度。本发明具有检测速度快,检测准确率高,绿色无污染,所需茶叶样本少等优点。
本发明依据的原理:研究表明茶叶的中红外漫反射光谱包含了茶叶内部的组分信息,不同品种茶叶所对应的中红外漫反射光谱不同,因而可以采用聚类方法将不同品种的茶叶中红外光谱进行分类。
一种自适应可能C均值聚类的茶叶中红外光谱分类方法,具体包括以下步骤:
S1,茶叶样本中红外光谱采集:针对不同种类茶叶样本,用中红外光谱仪对茶叶样本进行检测,获取茶叶样本中红外漫反射光谱信息,将光谱信息存储在计算机里;中红外漫反射光谱信息是指光谱的波数范围为4001.569~401.1211cm-1,采集到每个茶叶样本的光谱是1868维的数据;将茶叶样本分为训练样本和测试样本,设置类别数为c,训练样本数为nr,测试样本数为n。
S2,用多元散射矫正(MSC)对茶叶样本中红外光谱预处理。
S3,对茶叶样本中红外光谱进行降维处理和鉴别信息提取:利用主成分分析(PCA)将在S2中获得的茶叶样本中红外光谱数据压缩;然后利用线性判别分析(LDA)提取茶叶样本的鉴别信息。
S4,对S3中包含鉴别信息的测试样本用自适应可能C均值聚类方法以鉴别测试样本中的茶叶品种;
S4.1,初始化:设置权重指数m、w,类别数c,其中m>1、w>1;设置循环计数r的初始值和最大迭代次数rmax;设置迭代最大误差参数ε;运行模糊C均值聚类得到的模糊隶属度值和类中心值分别作为初始的模糊隶属度值uik (0)和类中心值νi (0);
S4.2,计算第r(r=1,2,…,rmax)次迭代时的典型值:其中tik是样本xk隶属于类别i的典型值,tik (r)是第r次迭代计算的典型值,为样本xk到类中心vi的距离范数,且xk为第k个样本,vi是第i类的类中心值,νi (r-1)是第r-1次迭代计算的类中心vi的值;Sfi为模糊协方差矩阵,且d为样本的维数,n为样本数,uik (r-1)是第r-1次迭代计算的模糊隶属度值;
S4.3,计算第r次迭代时的模糊隶属度值uik (r):其中uik是样本xk隶属于类别i的模糊隶属度值,uik (r)是第r次迭代计算的模糊隶属度值;
S4.4,计算第r次迭代时第i类的类中心值νi (r):其中νi (r)是第r次迭代计算的类中心vi的值,由c个类中心值组成类中心矩阵V(r)=[ν1 (r),ν2 (r),…,νc (r)];
S4.5,循环计数增加,即r=r+1;若满足条件:||V(r)-V(r-1)||<ε或r>rmax则计算终止,否则继续S4.2,根据计算得到的模糊隶属度值和典型值,实现不同种类茶叶分类。
本发明的有益效果:
1、本发明的一种自适应可能C均值聚类的茶叶中红外光谱分类方法,利用样本到类中心的距离范数,在聚类边界不规则的中红外光谱数据方面要优于改进型可能C-均值(IPCM)聚类方法,具有聚类准确率高,聚类速度快的优点。
2、本发明采用样本隶属于类别的典型值,在聚类包含噪声数据的中红外光谱数据方面优于模糊C均值聚类(FCM),可快速实现不同品种的中红外光谱的快速和准确鉴别。
附图说明
图1是本发明的流程图;
图2是茶叶的中红外光谱图;
图3是MSC处理后的茶叶中红外光谱图;
图4是茶叶的中红外光谱经LDA提取鉴别信息后得到的测试样本数据图;
图5是初始的模糊隶属度值;
图6是一种自适应可能C均值聚类方法产生的模糊隶属度;
图7是一种自适应可能C均值聚类方法产生的典型值。
具体实施方式
下面结合附图和具体实施方式对本发明的装置及方法做进一步说明。
如图1所示,一种自适应可能C均值聚类的茶叶中红外光谱分类方法,包括步骤:
步骤一、茶叶样本中红外光谱采集:针对不同种类茶叶样本,用中红外光谱仪对茶叶样本进行检测,获取茶叶样本中红外漫反射光谱信息,将光谱信息存储在计算机里。
实验过程中尽量保持室内的温度和湿度基本一致,中红外漫反射光谱信息是指光谱的波数范围为4001.569~401.1211cm-1,采集到每个茶叶样本的光谱是1868维的数据;将茶叶样本分为训练样本和测试样本,设置类别数c,训练样本数为nr和测试样本数为n。
步骤二、用多元散射矫正(MSC)对茶叶样本中红外光谱预处理:
用多元散射矫正(MSC)预处理,有效地减少茶叶样本的散射影响,增强了与茶叶样本相关的光谱吸收信息,提高茶叶鉴别的识别率;
步骤三、对茶叶样本中红外光谱进行降维处理和鉴别信息提取:
利用主成分分析(PCA)将在步骤二中获得的茶叶样本中红外光谱数据压缩;然后用线性判别分析(LDA)提取茶叶样本的鉴别信息。
步骤四、对步骤三中包含鉴别信息的测试样本,使用自适应可能C均值聚类方法,以鉴别测试样本中的茶叶品种。
步骤四的具体过程如下:
A、初始化过程:设置权重指数m(m>1)和权重指数w(w>1),类别数c;设置循环计数r的初始值和最大迭代次数为rmax;设置迭代最大误差参数ε;运行模糊C均值聚类得到的模糊隶属度值和类中心值分别作为初始的模糊隶属度值uik (0)和类中心值νi (0);
B、计算第r(r=1,2,…,rmax)次迭代时的典型值:
其中:tik是样本xk隶属于类别i的典型值,tik (r)是第r次迭代计算的典型值,为样本xk到类中心vi的距离范数,xk为第k个样本,vi是第i类的类中心值,νi (r-1)是第r-1次迭代计算的类中心vi的值,Sfi为模糊协方差矩阵,d为样本的维数,n为样本数,uik (r-1)是第r-1次迭代计算的模糊隶属度值;
C、计算第r次迭代时的模糊隶属度值uik (r)
其中,uik是样本xk隶属于类别i的模糊隶属度值,uik (r)是第r次迭代计算的模糊隶属度值;
D、计算第r次迭代时的第i类的类中心值νi (r)
其中νi (r)是第r次迭代计算的类中心vi的值,由c个类中心值组成类中心矩阵V(r)=[ν1 (r),ν2 (r),…,νc (r)];
E、循环计数增加,即r=r+1;
若满足条件:||V(r)-V(r-1)||<ε或r>rmax,则计算终止,否则继续步骤B;根据以上计算结果可得到模糊隶属度值和典型值并利用它们最终实现不同种类茶叶分类。
本发明的一种自适应可能C均值聚类的茶叶中红外光谱分类方法适用于对茶叶品种的鉴别,例如:毛尖、竹叶青、龙井、铁观音等茶叶品种的鉴别。因为不同品种茶叶,其内部组分不同,因此漫射中红外光谱也有所不同,为实现茶叶品种的鉴别提供了条件。为方便叙述,选取峨眉山茶叶、乐山市优质竹叶青和劣质竹叶青为实验对象。
实施例1
步骤一、茶叶样本中红外光谱采集:将FTIR-7600型傅里叶中红外光谱分析仪开机预热1个小时,扫描次数为32,光谱扫描的波数4001.569cm-1~401.1211cm-1,扫描间隔为1.928cm-1,分辨率为4cm-1;茶叶样本为:峨眉山茶叶、乐山市优质竹叶青和劣质竹叶青。茶叶经研磨粉碎,再用40目筛进行过滤后,各取0.5g分别与溴化钾1:100均匀混合;每个样本取混合物1g进行压膜,然后用光谱仪扫描3次,取3次的平均值作为样本光谱数据。采集光谱时环境温度和相对湿度保持相对稳定,每种茶叶采集32个样本,共获得96个样本,每个样本为一个1868维的数据。每个品种的茶叶样本选取22个为测试集,则测试样本数n为66;剩余10个样本为训练集,则训练样本数nr为30;测试集为待鉴别的茶叶样本,训练集为已知品种的茶叶样本;设置类别数c=3;茶叶样本的中红外光谱如图2所示。
步骤二、对茶叶样本中红外光谱预处理:用多元散射校正(MSC)对茶叶样本中红外光谱进行预处理,预处理后的茶叶中红外光谱图如图3所示。
步骤三、对茶叶样本中红外光谱进行降维处理和鉴别信息提取:利用主成分分析(PCA)将在步骤二中获得的茶叶样本中红外光谱数据压缩;然后用线性判别分析(LDA)提取茶叶样本的鉴别信息。
因为前14个主成分累计可信度大于98%,所以采用主成分分析方法(PCA)将茶叶样本中红外光谱进行特征分解得到前14个特征向量和14个特征值;每个特征向量都是1868维的数据,特征值为:λ1=293.91、λ2=129.02、λ3=19.00、λ4=14.88、λ5=6.43、λ6=3.82、λ7=2.00、λ8=1.4、λ9=1.07、λ10=0.63、λ11=0.40、λ12=0.32、λ13=0.27、λ14=0.23;将茶叶样本中红外光谱投影到14个特征向量上得到14维的数据,即从1868维压缩到14维。
设置鉴别向量数为2,采用线性判别分析(LDA)提取步骤三中14维数据的鉴别信息后得到包含鉴别信息的训练样本和测试样本数据,其中测试样本数据如图4所示。
步骤四、对步骤三中包含鉴别信息的测试样本用一种自适应可能C均值聚类方法以鉴别测试样本中的茶叶品种:
A、初始化过程:设置权重指数m(m>1)和权重指数w(w>1),类别数c;设置循环计数r的初始值和最大迭代次数为rmax;设置迭代最大误差参数ε;运行模糊C均值聚类得到的模糊隶属度值和类中心值分别作为初始的模糊隶属度值uik (0)和类中心值νi (0)。
初始化的数值设置:由步骤一可知:类别数c=3(即三个类别),测试样本数n=66;设置权重指数m=2,w=2,迭代次数初始值r=0和最大迭代数rmax=100,误差上限值ε=0.00001,测试样本的维数d为2;对步骤四的两组一维测试数据进行模糊C均值聚类(FCM),FCM运行终止后的聚类中心作为一种自适应可能C均值聚类方法的初始聚类中心,则初始聚类中心νi (0)为:ν1 (0)=(-0.1580,0.0403)、ν2 (0)=(-0.0020,0.0049)、ν3 (0)=(0.1194,-0.0056);初始的模糊隶属度值uik (0)如图5所示。
B、由公式(1)-(4)计算第r(r=1,2,…,rmax)次迭代时的典型值。
C、由公式(5)计算第r次迭代时的模糊隶属度值uik (r)。
D、由公式(6)计算第r次迭代时第i类的类中心值νi (r)。
E、循环计数增加,即r=r+1;若满足条件:||V(r)-V(r-1)||<ε或r>rmax则计算终止,否则继续步骤B;根据以上计算结果可得到模糊隶属度值和典型值并利用它们最终实现不同种类茶叶分类。
实验结果为:迭代终止时r=51,为: 迭代终止时模糊隶属度如图6所示,根据模糊隶属度值可得茶叶品种的分类准确率为87.9%;迭代终止时典型值如图7所示,根据典型值可得茶叶品种的分类准确率为97%。
以上所述对本发明进行了简单说明,并不受上述工作范围限值,只要采取本发明思路和工作方法进行简单修改运用到其他设备,或在不改变本发明主要构思原理下做出改进和润饰的等行为,均在本发明的保护范围之内。
Claims (8)
1.一种自适应可能C均值聚类的茶叶中红外光谱分类方法,其特征在于,包括以下步骤:
S1,茶叶样本中红外光谱采集:针对不同种类茶叶样本,用中红外光谱仪对茶叶样本进行检测,获取茶叶样本中红外漫反射光谱信息,将光谱信息存储在计算机里;将茶叶样本分为训练样本和测试样本;
S2,用多元散射矫正MSC对茶叶样本中红外光谱进行预处理;
S3,对茶叶样本中红外光谱进行降维处理和鉴别信息提取;
S4,对S3中包含鉴别信息的测试样本,使用自适应可能C均值聚类方法鉴别出测试样本中的茶叶品种。
2.如权利要求1所述的一种自适应可能C均值聚类的茶叶中红外光谱分类方法,其特征在于,所述S1中红外漫反射光谱信息是指光谱的波数范围为4001.569~401.1211cm-1,采集到每个茶叶样本的光谱是1868维的数据。
3.如权利要求1所述的一种自适应可能C均值聚类的茶叶中红外光谱分类方法,其特征在于,所述S1中设置茶叶样本的类别数为c,训练样本数为nr,测试样本数为n。
4.如权利要求1所述的一种自适应可能C均值聚类的茶叶中红外光谱分类方法,其特征在于,所述S3具体为:利用主成分分析PCA将在S2中获得的茶叶样本中红外光谱数据压缩,然后利用线性判别分析LDA提取茶叶样本的鉴别信息。
5.如权利要求1所述的一种自适应可能C均值聚类的茶叶中红外光谱分类方法,其特征在于,所述S4具体为:
S4.1,初始化:设置权重指数m、w,类别数c,其中m>1、w>1;设置循环计数r的初始值和最大迭代次数rmax;设置迭代最大误差参数ε;运行模糊C均值聚类得到的模糊隶属度值和类中心值分别作为初始的模糊隶属度值uik (0)和初始的类中心值νi (0);
S4.2,计算第r次迭代时的典型值tik (r),r=1,2,…,rmax;
S4.3,计算第r次迭代时的模糊隶属度值uik (r);
S4.4,计算第r次迭代时第i类的类中心值νi (r);
S4.5,循环计数增加,即r=r+1;若满足条件:||V(r)-V(r-1)||<ε或r>rmax,则计算终止,否则继续S4.2;根据计算得到的模糊隶属度值和典型值,实现不同种类茶叶分类。
6.如权利要求5所述的一种自适应可能C均值聚类的茶叶中红外光谱分类方法,其特征在于,所述S4.2中计算第r次迭代时的典型值的公式为:其中tik是样本xk隶属于类别i的典型值,tik (r)是第r次迭代计算的典型值,为样本xk到类中心vi的距离范数,且xk为第k个样本,vi是第i类的类中心值,νi (r-1)是第r-1次迭代计算的类中心vi的值;Sfi为模糊协方差矩阵,且d为样本的维数,n为样本数,uik (r-1)是第r-1次迭代计算的模糊隶属度值。
7.如权利要求5或6所述的一种自适应可能C均值聚类的茶叶中红外光谱分类方法,其特征在于,所述S4.3中计算第r次迭代时的模糊隶属度值uik (r)的公式为:其中uik是样本xk隶属于类别i的模糊隶属度值,uik (r)是第r次迭代计算的模糊隶属度值。
8.如权利要求5或6所述的一种自适应可能C均值聚类的茶叶中红外光谱分类方法,其特征在于,所述S4.4中计算第r次迭代时第i类的类中心值νi (r)的公式为:其中νi (r)是第r次迭代计算的类中心vi的值,由c个类中心值组成类中心矩阵V(r)=[ν1 (r),ν2 (r),…,νc (r)]。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711027252.3A CN107886115A (zh) | 2017-10-27 | 2017-10-27 | 一种自适应可能c均值聚类的茶叶中红外光谱分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711027252.3A CN107886115A (zh) | 2017-10-27 | 2017-10-27 | 一种自适应可能c均值聚类的茶叶中红外光谱分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107886115A true CN107886115A (zh) | 2018-04-06 |
Family
ID=61782593
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711027252.3A Pending CN107886115A (zh) | 2017-10-27 | 2017-10-27 | 一种自适应可能c均值聚类的茶叶中红外光谱分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107886115A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109030407A (zh) * | 2018-04-16 | 2018-12-18 | 江苏大学 | 一种混合模糊c均值聚类的苹果品种分类方法 |
CN111008653A (zh) * | 2019-11-18 | 2020-04-14 | 西安建筑科技大学 | 一种混合颜料信息解混的聚类优化方法 |
CN111898690A (zh) * | 2020-08-05 | 2020-11-06 | 山东大学 | 一种电力变压器故障分类方法及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107192686A (zh) * | 2017-04-11 | 2017-09-22 | 江苏大学 | 一种模糊协方差矩阵的可能模糊聚类茶叶品种鉴别方法 |
-
2017
- 2017-10-27 CN CN201711027252.3A patent/CN107886115A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107192686A (zh) * | 2017-04-11 | 2017-09-22 | 江苏大学 | 一种模糊协方差矩阵的可能模糊聚类茶叶品种鉴别方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109030407A (zh) * | 2018-04-16 | 2018-12-18 | 江苏大学 | 一种混合模糊c均值聚类的苹果品种分类方法 |
CN111008653A (zh) * | 2019-11-18 | 2020-04-14 | 西安建筑科技大学 | 一种混合颜料信息解混的聚类优化方法 |
CN111008653B (zh) * | 2019-11-18 | 2023-04-18 | 西安建筑科技大学 | 一种混合颜料信息解混的聚类优化方法 |
CN111898690A (zh) * | 2020-08-05 | 2020-11-06 | 山东大学 | 一种电力变压器故障分类方法及系统 |
CN111898690B (zh) * | 2020-08-05 | 2022-11-18 | 山东大学 | 一种电力变压器故障分类方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103048273B (zh) | 基于模糊聚类的水果近红外光谱分类方法 | |
CN105181650B (zh) | 一种使用近红外光谱技术快速鉴别茶叶品种的方法 | |
CN102819745A (zh) | 一种基于AdaBoost的高光谱遥感影像分类方法 | |
CN107886115A (zh) | 一种自适应可能c均值聚类的茶叶中红外光谱分类方法 | |
CN106408012A (zh) | 一种模糊鉴别聚类的茶叶红外光谱分类方法 | |
CN110378374B (zh) | 一种模糊鉴别信息提取的茶叶近红外光谱分类方法 | |
CN108872132A (zh) | 一种利用近红外光谱判别茶鲜叶品种的方法 | |
CN107767079A (zh) | 一种烟叶风格特征的客观综合评价方法 | |
CN109685098B (zh) | 一种模糊簇间分离聚类的茶叶品种分类方法 | |
Yan et al. | Recognition of different Longjing fresh tea varieties using hyperspectral imaging technology and chemometrics | |
CN103364359A (zh) | Simca模式识别法在近红外光谱识别大黄药材中的应用 | |
CN110398473A (zh) | 一种农产品产地检测方法及系统 | |
CN103411912A (zh) | 一种利用THz-TDS结合模糊规则专家系统鉴定中草药的方法 | |
CN109030407A (zh) | 一种混合模糊c均值聚类的苹果品种分类方法 | |
Yun et al. | Identification of tea based on CARS‐SWR variable optimization of visible/near‐infrared spectrum | |
CN108764288A (zh) | 一种gk鉴别聚类的茶叶品种分类方法 | |
CN102937575A (zh) | 一种基于二次光谱重组的西瓜糖度快速建模方法 | |
CN107192686A (zh) | 一种模糊协方差矩阵的可能模糊聚类茶叶品种鉴别方法 | |
CN107271394A (zh) | 一种模糊Kohonen鉴别聚类网络的茶叶红外光谱分类方法 | |
CN106226267B (zh) | 一种辣椒干色价的近红外测定方法 | |
CN106570520A (zh) | 一种混合gk聚类的红外光谱茶叶优劣鉴别方法 | |
CN108872128B (zh) | 一种模糊非相关c均值聚类的茶叶红外光谱分类方法 | |
CN114112983A (zh) | 一种基于Python数据融合的藏药全缘叶绿绒蒿产地判别方法 | |
CN111595804A (zh) | 一种模糊聚类的茶叶近红外光谱分类方法 | |
CN108491894B (zh) | 一种可能模糊鉴别c-均值聚类的茶叶分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180406 |
|
RJ01 | Rejection of invention patent application after publication |