CN109685098A - 一种模糊簇间分离聚类的茶叶品种分类方法 - Google Patents
一种模糊簇间分离聚类的茶叶品种分类方法 Download PDFInfo
- Publication number
- CN109685098A CN109685098A CN201811338340.XA CN201811338340A CN109685098A CN 109685098 A CN109685098 A CN 109685098A CN 201811338340 A CN201811338340 A CN 201811338340A CN 109685098 A CN109685098 A CN 109685098A
- Authority
- CN
- China
- Prior art keywords
- tealeaves
- sample
- cluster
- near infrared
- fuzzy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 241001122767 Theaceae Species 0.000 title claims abstract description 33
- 238000002329 infrared spectrum Methods 0.000 claims abstract description 46
- 238000004458 analytical method Methods 0.000 claims abstract description 9
- 238000000513 principal component analysis Methods 0.000 claims abstract description 9
- 238000001228 spectrum Methods 0.000 claims abstract description 9
- 238000012937 correction Methods 0.000 claims abstract description 7
- 238000000926 separation method Methods 0.000 claims abstract description 6
- 239000000284 extract Substances 0.000 claims abstract description 5
- 239000011159 matrix material Substances 0.000 claims description 16
- 239000013598 vector Substances 0.000 claims description 13
- 238000012360 testing method Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 8
- 238000006073 displacement reaction Methods 0.000 claims description 4
- 238000004611 spectroscopical analysis Methods 0.000 claims description 4
- 238000013519 translation Methods 0.000 claims description 4
- 101100001669 Emericella variicolor andD gene Proteins 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims description 3
- 238000012417 linear regression Methods 0.000 claims description 2
- 230000003595 spectral effect Effects 0.000 claims description 2
- 238000001514 detection method Methods 0.000 abstract description 4
- 230000000694 effects Effects 0.000 abstract description 4
- 238000012545 processing Methods 0.000 abstract description 2
- 238000009659 non-destructive testing Methods 0.000 abstract 1
- 230000001788 irregular Effects 0.000 description 2
- 241000923831 Chlorostilbon melanorhynchus Species 0.000 description 1
- 241001180747 Hottea Species 0.000 description 1
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- NNBFNNNWANBMTI-UHFFFAOYSA-M brilliant green Chemical compound OS([O-])(=O)=O.C1=CC(N(CC)CC)=CC=C1C(C=1C=CC=CC=1)=C1C=CC(=[N+](CC)CC)C=C1 NNBFNNNWANBMTI-UHFFFAOYSA-M 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004438 eyesight Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000031700 light absorption Effects 0.000 description 1
- 150000008442 polyphenolic compounds Chemical class 0.000 description 1
- 235000013824 polyphenols Nutrition 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000000985 reflectance spectrum Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000035922 thirst Effects 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3563—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N2021/3595—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using FTIR
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Analytical Chemistry (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Evolutionary Computation (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种模糊簇间分离聚类的茶叶品种分类方法,包括步骤如下:S1茶叶样本的傅里叶近红外光谱采集;S2用多元散射校正进行茶叶样本近红外光谱的预处理;S3用主成分分析实现近红外光谱降维处理;S4用线性判别分析实现近红外光谱数据的鉴别信息提取;S5用一种模糊簇间分离聚类进行茶叶品种分类。本发明解决了用传统模糊簇间分离聚类处理复杂数据结构时聚类效果不理想问题。本发明具有检测速度快,无损检测,能处理复杂光谱数据,茶叶品种分类准确率高等优点。
Description
技术领域
本发明属于人工智能技术领域,尤其是一种模糊簇间分离聚类的茶叶品种分类方法。
背景技术
茶叶中含有茶多酚类、植物碱、蛋白质、氨基酸、维生素等多种成分。茶叶具有安神、明目、止渴生津、清热消暑等疗效。茶是世界三大饮品之一,饮茶是一种传统饮食文化,客来敬茶是人们日常社交生活中的往来礼仪。但是,茶叶品种繁多,普通民众无法辨别茶叶品种和品质优劣。因此,茶叶品种的鉴别是非常重要的研究方向,而设计一种简单快速的茶叶品种鉴别方法是非常有必要和价值的。
近红外光谱技术是利用物质对光的吸收、散射、反射和透射等特性来确定其成分含量的一种非破坏性检测技术。近红外光谱射向茶叶后得到漫反射近红外光谱,反射光谱中包含了有机分子里C-H、N-H和O-H原子间振动的倍频和合频信息。对于不同品种的茶叶其反射的近红外光谱是不同的,利用这个原理,可以将不同品种的茶叶区分开来,即实现茶叶品种的分类。
类间分离聚类方法(D,Akarun L.Fuzzy algorithms for combinedquantization and dithering,IEEE Transactions on Image Processing,2001,10(6):923-931.)在模糊C-均值聚类(FCM)目标函数中增加一个分裂项,该分裂项是第i个类中心和所有类中心之间的距离之和。由于分裂项的存在,类间分离聚类方法可以调节类中心之间的紧凑程度。但是,类间分离聚类方法是建立在欧氏距离基础上,适合于聚类椭圆形簇状数据,在具有不规则边界的簇状数据时,聚类效果不理想。
用傅里叶近红外光谱仪采集的茶叶近红外光谱数据是一种高维数据,数据结构较为复杂,用基于欧氏距离的类间分离聚类方法来聚类分析茶叶近红外光谱数据则效果不理想,其聚类准确率有待进一步提高。
发明内容
本发明是针对现有的类间分离聚类方法在聚类茶叶近红外光谱数据时存在的缺点,提出一种模糊簇间分离聚类的茶叶品种分类方法,相比现有的类间分离聚类方法,本发明的一种模糊簇间分离聚类的茶叶品种分类方法采用基于模糊协方差矩阵的自适应距离测度来代替类间分离聚类方法中的欧氏距离测度。本发明具有检测速度快,检测准确率高,不消耗化学试剂,不污染环境等优点。
一种模糊簇间分离聚类的茶叶品种分类方法,具体包括以下步骤:
S1,茶叶样本近红外光谱采集:用傅里叶近红外光谱仪对茶叶样本进行检测,获取茶叶样本近红外漫反射光谱数据,将光谱数据存储在计算机里。
S2,用多元散射矫正(MSC)对茶叶近红外光谱进行预处理。
S3,对茶叶样本近红外光谱进行降维处理和鉴别信息提取:利用主成分分析(PCA)将在S2中获得的茶叶近红外光谱数据压缩;然后利用线性判别分析(LDA)提取茶叶样本的鉴别信息。
S4,对S3中包含鉴别信息的测试样本用一种模糊簇间分离聚类方法进行茶叶品种分类;
S4.1,初始化:设置权重指数m,类别数c,其中m>1;设置参数β;设置循环计数r的初始值和最大迭代次数rmax;设置迭代最大误差参数ε;以S3中包含鉴别信息的训练样本的均值作为初始类中心值νi (0)(i=1,2,3,…,c),计算初始的模糊隶属度值uik (0)如下:
上式中,νj (0)(j=1,2,3,…,c)是第j类的初始类中心值。
S4.2,计算第r(r=1,2,…,rmax)次迭代时的模糊隶属度值uik (r):
为样本xk到类中心vi的距离范数,且xk为第k个样本,vi是第i类的类中心值,νi (r-1)是第r-1次迭代计算的类中心vi的值;Sfi为模糊协方差矩阵,且d为样本的维数,n为测试样本数,uik (r-1)是第r-1次迭代计算的模糊隶属度值;全部样本的模糊隶属度组成模糊隶属度矩阵U(r)={uik (r)}c×n。
S4.3,计算第r次迭代时第i类的类中心值νi (r):
其中νi (r-1)是第r-1次迭代计算时类中心vi的值。
S4.4,循环计数增加,即r=r+1;若满足条件:||U(r)-U(r-1)||<ε或r>rmax则计算终止,否则继续S4.2,根据计算得到的模糊隶属度值,实现茶叶品种分类。
本发明的有益效果:
1、本发明的一种模糊簇间分离聚类的茶叶品种分类方法,利用样本到类中心的距离范数,在聚类边界不规则的近红外光谱数据方面要优于类间分离聚类方法,具有聚类准确率高,聚类速度快的优点。
2、本发明一种模糊簇间分离聚类的茶叶品种分类方法,在聚类茶叶红外光谱数据时可调整簇间类中心距离,聚类准确率方面优于模糊C均值聚类(FCM),可快速实现茶叶品种的准确鉴别。
附图说明
图1是本发明的流程图;
图2是茶叶的近红外光谱图;
图3是多元散射校正处理后的茶叶近红外光谱图;
图4是茶叶近红外光谱经线性判别分析提取鉴别信息后得到的测试样本数据图;
图5是初始的模糊隶属度值;
图6是一种模糊簇间分离聚类迭代终止后的模糊隶属度值。
具体实施方式
下面结合附图和具体实施例对本发明方法做进一步说明。
如图1所示,一种模糊簇间分离聚类的茶叶品种分类方法,包括步骤:
S1,茶叶样本近红外光谱采集:用傅里叶近红外光谱仪对茶叶样本进行检测,获取茶叶样本近红外漫反射光谱数据,将光谱数据存储在计算机里。
采集岳西翠兰、六安瓜片、施集毛峰、黄山毛峰四种安徽品牌茶叶,每种茶叶的样本数为65,合计260个样本。所有茶叶样本被研磨粉粹后经40目筛过滤。实验室温度和相对湿度保持相对不变,Antaris II近红外光谱分析仪开机预热1个小时。采用反射积分球模式采集茶叶近红外光谱,近红外光谱分析仪扫描每个样品32次以获取样品的漫反射光谱均值。光谱扫描的波数为10000~4000cm-1,扫描间隔为3.857cm-1,采集到每个茶叶样品的光谱是1557维的数据。每个样本采样3次,取其平均值作为后续模型建立的实验数据。
S2,用多元散射矫正(MSC)对茶叶近红外光谱进行预处理。
将S1中每个茶叶样本的近红外光谱与茶叶近红外光谱平均值做线性回归,计算每个茶叶样本的近红外光谱相对于平均值的线性平移量和倾斜偏移量,最后,在每个茶叶样本的近红外光谱中减去线性平移量同时除以倾斜偏移量以实现茶叶近红外光谱的多元散射校正(MSC);预处理后的光谱图如图2所示。
S3,对茶叶样本近红外光谱进行降维处理和鉴别信息提取:利用主成分分析(PCA)将在S2中获得的茶叶近红外光谱数据压缩;然后利用线性判别分析(LDA)提取茶叶样本的鉴别信息。
将S2中的光谱用主成分分析计算特征值和特征向量,λkvk=Cvk,λk是第个特征值,vk是第k个特征向量,C是S2中由茶叶近红外光谱数据构成的协方差矩阵,将特征值从大到小排列,取前7个最大特征值(分别为:22.69,1.19,0.47,0.18,0.05,0.03,0.01)对应的7个特征向量,将260个茶叶样本的近红外光谱数据投影到这7个特征向量组成的特征矩阵W上,即yk=WTzk,zk是S2中第k个茶叶近红外光谱,yk是zk投影到特征矩阵W后得到的数据。经过投影转换将近红外光谱从1557维压缩到7维。将这7维光谱数据分为两个部分:从每类茶叶样本中选取22个样本组成茶叶样本训练集,剩余43个样本组成茶叶样本测试集。
用线性判别分析(LDA)根据式SW -1SBw=βw计算茶叶样本训练集的特征值和特征向量,类内散射矩阵SW和类间散射矩阵SB是由茶叶样本训练集计算得到的,β和w分别为特征值和对应的特征向量,取前3个最大特征值(分别为:232.29,16.13,2.60)对应的3个特征向量,将茶叶样本测试集投影到这3个特征(鉴别)向量上得到经过线性判别分析处理后的三维数据图如图4所示。图4中,四种茶叶为,HS:黄山毛峰,LA:六安瓜片,SG:施集毛峰,YX:岳西翠兰。
S4,对S3中包含鉴别信息的测试样本用一种模糊簇间分离聚类方法进行茶叶品种分类;
S4.1,初始化:设置茶叶测试样本数n=172,样本类别数目c=4,权重指数m=2.0;设置参数β=0.1;设置迭代次数初始值r=1和最大迭代次数rmax=100;设置迭代最大误差参数为ε=0.00001。以S3中包含鉴别信息的训练样本的均值作为初始类中心值νi (0):
计算初始的模糊隶属度值uik (0)如下:
初始的模糊隶属度值uik (0)的结果如图5所示。
S4.2,计算第r(r=1,2,…,rmax)次迭代时的模糊隶属度值uik (r):
为样本xk到类中心vi的距离范数,且xk为第k个样本,vi是第i类的类中心值,νi (r-1)是第r-1次迭代计算的类中心vi的值;Sfi为模糊协方差矩阵,且d为样本的维数,n为样本数,uik (r-1)是第r-1次迭代计算的模糊隶属度值;全部样本的模糊隶属度组成模糊隶属度矩阵U(r)={uik (r)}c×n。
实验结果:迭代终止r=33,模糊隶属度值如图6所示。
迭代33次后迭代结束,模糊协方差矩阵Sfi值如下:
第i=1类模糊协方差矩阵为:
第i=2类模糊协方差矩阵为:
第i=3类模糊协方差矩阵为:
第i=4类模糊协方差矩阵为:
S4.3,计算第r次迭代时第i类的类中心值νi (r):
其中νi (r)是第r次迭代计算的类中心vi的值。
实验结果:迭代33次后迭代结束,第i类的类中心值νi (r)值如下:
S4.4,循环计数增加,即r=r+1;若满足条件:||U(r)-U(r-1)||<ε或r>rmax则计算终止,否则继续S4.2,根据计算得到的模糊隶属度值,实现茶叶品种分类。
实验结果:在迭代33次后迭代结束,模糊隶属度值如图6所示,根据模糊隶属度值可判定测试茶叶样本所属类别,茶叶品种分类准确率达100%。
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。
Claims (8)
1.一种模糊簇间分离聚类的茶叶品种分类方法,其特征在于,包括如下步骤:
步骤S1,采集茶叶样本近红外光谱,获取茶叶样本近红外漫反射光谱数据;
步骤S2,利用多元散射矫正(MSC)对获取的茶叶样本近红外漫反射光谱进行预处理;
步骤S3,对茶叶样本近红外光谱进行降维处理和鉴别信息提取;
步骤S4,对S3中包含鉴别信息的测试样本用一种模糊簇间分离聚类方法进行茶叶品种分类。
2.根据权利要求1所述的一种模糊簇间分离聚类的茶叶品种分类方法,其特征在于,步骤S1中,采集茶叶样本近红外光谱时利用傅里叶近红外光谱仪。
3.根据权利要求2所述的一种模糊簇间分离聚类的茶叶品种分类方法,其特征在于,所述采集茶叶样本近红外光谱数据的具体方法如下:
将茶叶样本研磨粉粹后经40目筛过滤;环境温度和相对湿度保持相对不变,AntarisII近红外光谱分析仪开机预热1个小时;采用反射积分球模式采集茶叶近红外光谱,近红外光谱分析仪扫描每个样品32次以获取样品的漫反射光谱均值;光谱扫描的波数为10000~4000cm-1,扫描间隔为3.857cm-1,采集每个茶叶样品的光谱为1557维的数据;每个样本采样3次,取其平均值作为茶叶样本近红外漫反射光谱数据。
4.根据权利要求1所述的一种模糊簇间分离聚类的茶叶品种分类方法,其特征在于,步骤S2中,所述预处理的方法包括:
将步骤S1中每个茶叶样本的近红外光谱与茶叶近红外光谱平均值做线性回归,计算每个茶叶样本的近红外光谱相对于平均值的线性平移量和倾斜偏移量,最后,在每个茶叶样本的近红外光谱中减去线性平移量同时除以倾斜偏移量以实现茶叶近红外光谱的多元散射校正(MSC)。
5.根据权利要求1所述的一种模糊簇间分离聚类的茶叶品种分类方法,其特征在于,步骤S3中,所述降维处理是利用主成分分析(PCA)将在S2中获得的茶叶近红外光谱数据压缩;具体地:
将S2中的光谱用主成分分析计算特征值和特征向量,λkvk=Cvk,λk是第个特征值,vk是第k个特征向量,C是S2中由茶叶近红外光谱数据构成的协方差矩阵,将特征值从大到小排列,取前7个最大特征值对应的7个特征向量,将260个茶叶样本的近红外光谱数据投影到这7个特征向量组成的特征矩阵W上,即yk=WTzk,zk是S2中第k个茶叶近红外光谱,yk是zk投影到特征矩阵W后得到的数据,经过投影转换将近红外光谱从1557维压缩到7维。
6.根据权利要求5所述的一种模糊簇间分离聚类的茶叶品种分类方法,其特征在于,还包括:将这7维光谱数据分为两个部分:从每类茶叶样本中选取若干个样本组成茶叶样本训练集,剩余的样本组成茶叶样本测试集。
7.根据权利要求1所述的一种模糊簇间分离聚类的茶叶品种分类方法,其特征在于,步骤S3中,所述鉴别信息提取是利用线性判别分析(LDA)提取茶叶样本的鉴别信息;具体地:
用线性判别分析根据式SW -1SBw=βw计算茶叶样本训练集的特征值和特征向量,类内散射矩阵SW和类间散射矩阵SB是由茶叶样本训练集计算得到的,β和w分别为特征值和对应的特征向量,取前3个最大特征值对应的3个特征向量,将茶叶样本测试集投影到这3个特征向量上得到经过线性判别分析处理后的三维数据。
8.根据权利要求1所述的一种模糊簇间分离聚类的茶叶品种分类方法,其特征在于,步骤S4的实现包括:
S4.1,初始化:设置权重指数m,类别数c,其中m>1;设置参数β;设置循环计数r的初始值和最大迭代次数rmax;设置迭代最大误差参数ε;以S3中包含鉴别信息的训练样本的均值作为初始类中心值νi (0),计算初始的模糊隶属度值uik (0)如下:
S4.2,计算第r(r=1,2,…,rmax)次迭代时的模糊隶属度值uik (r):
为样本xk到类中心vi的距离范数,且xk为第k个样本,vi是第i类的类中心值,νi (r-1)是第r-1次迭代计算的类中心vi的值;Sfi为模糊协方差矩阵,且d为样本的维数,n为样本数,uik (r-1)是第r-1次迭代计算的模糊隶属度值;全部样本的模糊隶属度组成模糊隶属度矩阵U(r)={uik (r)}c×n。
S4.3,计算第r次迭代时第i类的类中心值νi (r):
其中νi (r)是第r次迭代计算的类中心vi的值;
S4.4,循环计数增加,即r=r+1;若满足条件:||U(r)-U(r-1)||<ε或r>rmax则计算终止,否则继续S4.2,根据计算得到的模糊隶属度值,实现茶叶品种分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811338340.XA CN109685098B (zh) | 2018-11-12 | 2018-11-12 | 一种模糊簇间分离聚类的茶叶品种分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811338340.XA CN109685098B (zh) | 2018-11-12 | 2018-11-12 | 一种模糊簇间分离聚类的茶叶品种分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109685098A true CN109685098A (zh) | 2019-04-26 |
CN109685098B CN109685098B (zh) | 2024-03-19 |
Family
ID=66184679
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811338340.XA Active CN109685098B (zh) | 2018-11-12 | 2018-11-12 | 一种模糊簇间分离聚类的茶叶品种分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109685098B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110308111A (zh) * | 2019-06-14 | 2019-10-08 | 湖北省农业科学院果树茶叶研究所 | 一种应用近红外光谱技术快速预测远安黄茶闷黄时间的方法 |
CN110378374A (zh) * | 2019-06-12 | 2019-10-25 | 江苏大学 | 一种模糊鉴别信息提取的茶叶近红外光谱分类方法 |
CN110378373A (zh) * | 2019-06-12 | 2019-10-25 | 江苏大学 | 一种模糊非相关线性鉴别分析的茶叶品种分类方法 |
CN110414549A (zh) * | 2019-06-12 | 2019-11-05 | 江苏大学 | 一种模糊正交线性鉴别分析的茶叶近红外光谱分类方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107271394A (zh) * | 2017-05-16 | 2017-10-20 | 江苏大学 | 一种模糊Kohonen鉴别聚类网络的茶叶红外光谱分类方法 |
-
2018
- 2018-11-12 CN CN201811338340.XA patent/CN109685098B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107271394A (zh) * | 2017-05-16 | 2017-10-20 | 江苏大学 | 一种模糊Kohonen鉴别聚类网络的茶叶红外光谱分类方法 |
Non-Patent Citations (1)
Title |
---|
武小红等: "模糊非相关鉴别C均值聚类的茶叶傅里叶红外光谱分类", 《光谱学与光谱分析》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110378374A (zh) * | 2019-06-12 | 2019-10-25 | 江苏大学 | 一种模糊鉴别信息提取的茶叶近红外光谱分类方法 |
CN110378373A (zh) * | 2019-06-12 | 2019-10-25 | 江苏大学 | 一种模糊非相关线性鉴别分析的茶叶品种分类方法 |
CN110414549A (zh) * | 2019-06-12 | 2019-11-05 | 江苏大学 | 一种模糊正交线性鉴别分析的茶叶近红外光谱分类方法 |
CN110378373B (zh) * | 2019-06-12 | 2024-03-12 | 江苏大学 | 一种模糊非相关线性鉴别分析的茶叶品种分类方法 |
CN110378374B (zh) * | 2019-06-12 | 2024-03-15 | 江苏大学 | 一种模糊鉴别信息提取的茶叶近红外光谱分类方法 |
CN110414549B (zh) * | 2019-06-12 | 2024-03-22 | 江苏大学 | 一种模糊正交线性鉴别分析的茶叶近红外光谱分类方法 |
CN110308111A (zh) * | 2019-06-14 | 2019-10-08 | 湖北省农业科学院果树茶叶研究所 | 一种应用近红外光谱技术快速预测远安黄茶闷黄时间的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109685098B (zh) | 2024-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109685098A (zh) | 一种模糊簇间分离聚类的茶叶品种分类方法 | |
CN110378374B (zh) | 一种模糊鉴别信息提取的茶叶近红外光谱分类方法 | |
CN104374738B (zh) | 一种基于近红外提高鉴别结果的定性分析方法 | |
CN105973858B (zh) | 一种中药品质自动检测系统 | |
Di et al. | Studies on hyperspectral face recognition in visible spectrum with feature band selection | |
CN105181650B (zh) | 一种使用近红外光谱技术快速鉴别茶叶品种的方法 | |
CN103048273B (zh) | 基于模糊聚类的水果近红外光谱分类方法 | |
CN107677647A (zh) | 基于主成分分析和bp神经网络的中药材产地鉴别方法 | |
CN108872132A (zh) | 一种利用近红外光谱判别茶鲜叶品种的方法 | |
CN106408012A (zh) | 一种模糊鉴别聚类的茶叶红外光谱分类方法 | |
CN109030407A (zh) | 一种混合模糊c均值聚类的苹果品种分类方法 | |
CN104374739A (zh) | 一种基于近红外定性分析的种子品种真实性鉴别方法 | |
CN107192686A (zh) | 一种模糊协方差矩阵的可能模糊聚类茶叶品种鉴别方法 | |
CN103411912A (zh) | 一种利用THz-TDS结合模糊规则专家系统鉴定中草药的方法 | |
CN110378373B (zh) | 一种模糊非相关线性鉴别分析的茶叶品种分类方法 | |
CN108764288A (zh) | 一种gk鉴别聚类的茶叶品种分类方法 | |
CN107271394A (zh) | 一种模糊Kohonen鉴别聚类网络的茶叶红外光谱分类方法 | |
Chen et al. | Identification of tea varieties using computer vision | |
CN105869161B (zh) | 基于图像质量评价的高光谱图像波段选择方法 | |
CN108491894B (zh) | 一种可能模糊鉴别c-均值聚类的茶叶分类方法 | |
CN108872128B (zh) | 一种模糊非相关c均值聚类的茶叶红外光谱分类方法 | |
CN114331474A (zh) | 一种模糊线性判别分析的牛奶产地溯源方法 | |
CN106570520A (zh) | 一种混合gk聚类的红外光谱茶叶优劣鉴别方法 | |
CN107886115A (zh) | 一种自适应可能c均值聚类的茶叶中红外光谱分类方法 | |
CN110414549B (zh) | 一种模糊正交线性鉴别分析的茶叶近红外光谱分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |