CN108491894B - 一种可能模糊鉴别c-均值聚类的茶叶分类方法 - Google Patents

一种可能模糊鉴别c-均值聚类的茶叶分类方法 Download PDF

Info

Publication number
CN108491894B
CN108491894B CN201810335781.8A CN201810335781A CN108491894B CN 108491894 B CN108491894 B CN 108491894B CN 201810335781 A CN201810335781 A CN 201810335781A CN 108491894 B CN108491894 B CN 108491894B
Authority
CN
China
Prior art keywords
class
sample
tea
fuzzy
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810335781.8A
Other languages
English (en)
Other versions
CN108491894A (zh
Inventor
武小红
翟艳丽
傅海军
陈勇
武斌
高洪燕
戴春霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanli Zhizao Yunnan Agricultural Science and Technology Development Co.,Ltd.
Original Assignee
Jiangsu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu University filed Critical Jiangsu University
Priority to CN201810335781.8A priority Critical patent/CN108491894B/zh
Publication of CN108491894A publication Critical patent/CN108491894A/zh
Application granted granted Critical
Publication of CN108491894B publication Critical patent/CN108491894B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3563Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2132Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
    • G06F18/21322Rendering the within-class scatter matrix non-singular
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种可能模糊鉴别C‑均值聚类的茶叶红外光谱的分类方法,用傅里叶红外光谱分析仪采集茶叶样本红外光谱数据;对茶叶样本红外光谱数据进行预处理;采用主成分分析方法对预处理后的茶叶样本红外光谱数据进行降维处理;采用线性鉴别分析提取茶叶训练样本的红外光谱的鉴别信息。对步骤4的训练样本进行可能模糊鉴别C‑均值聚类,得到的聚类中心;用一种可能模糊鉴别C‑均值聚类方法进行茶叶品种的判定。本发明融合了可能模糊C‑均值聚类和线性判别分析,具有检测速度快,分类速度快,分类准确率高等优点,可实现茶叶品种的正确分类。

Description

一种可能模糊鉴别C-均值聚类的茶叶分类方法
技术领域
本发明属于人工智能技术领域,,尤其涉及一种可能模糊鉴别C-均值聚类的茶叶分类 方法。
背景技术
茶叶早已成为日常保健的饮料,具有生津止渴,提神益思,消炎解毒,醒酒强心等功 效。随着生活水平的提高,人们对茶叶的质量要求越来越高,但是,面对如此庞大数目的茶叶品种,其优劣实难分辨。另外,假冒伪劣的茶叶在中国市场屡见不鲜,这样给茶叶生 产者和消费者都带来了一定的利益损害。因此,研究出一种简单、快速且准确率较高的鉴 别茶叶优劣的方法已经是科研工作者的一个重要任务。
中红外光谱检测技术作为一种快速无损检测技术,近年来应用于茶叶品质的检测分析 中。中红外光谱的频率在4000cm-1~625cm-1之间,物质在此范围的吸收峰是基频、倍频 或合频吸收,具有分子结构的特征性,不同化合物有其特异的红外吸收光谱,其谱带的数 目、位置、形状和强队均随化合物及其聚集态的不同而不同,因此,根据化合物或其官能团是否存在,从而定性分析有机化合物;根据物质组分的吸收峰强度,依据朗伯—比耳定律(A=εbc)便可实现对其化合物的定量分析。中红外光谱的频谱特性能检测出分子中官能团、化合物的类别、化合物的立体结构、取代基的位置及数目,从而根据已有的数据判 断出茶叶的真伪。与此同时,中红外线光谱检测技术以其方便、快速、高效、无损、低成 本等特点成为检测判别真伪的首选。
模糊聚类已经被广泛应用于数字图像处理、计算机视觉和模式识别中,使用最广泛的 模糊聚类算法是由Bezdek提出的模糊C-均值聚类(FCM)。建立在最小平方误差准则上的 FCM可对线性可分的数据进行聚类,然而,FCM对噪声敏感,为了克服这个缺点,Krishnapuram和Keller放弃了FCM的可能性约束条件,构造了一个新的目标函数,提出 了可能性C-均值聚类(PCM),PCM能够聚类包含噪声或野值点的数据,且使噪声数据很 小的隶属度值,因而噪声对聚类的影响可以忽略.但是PCM对初始聚类中心很敏感,常常 会导致一致性聚类结果,为了克服FCM和PCM对噪声数据敏感产生一致性聚类的缺点,Pal 等在FCM和PCM的基础上提出了可能性模糊C-均值聚类(PFCM)。但是PFCM在聚类 过程中无法动态提取鉴别信息和改变数据维数。
发明内容
本发明根据现有技术的不足与缺陷,提出了一种可能模糊鉴别C-均值聚类的茶叶分类 方法,目的在于实现模糊聚类过程中进行数据鉴别信息的提取和数据压缩,可以达到更高 的聚类准确率。
采用的技术方案包括以下步骤:
步骤1,采集茶叶样本红外光谱数据;
步骤2,对红外光谱数据进行预处理,用多元散射校正(MSC)对茶叶红外光谱进行预处理;
步骤3,采用主成分分析方法(PCA)对预处理后的茶叶样本红外光谱进行降维处理;
步骤4,采用线性鉴别分析(LDA)提取茶叶训练样本的红外光谱的鉴别信息。
步骤5,设置可能模糊鉴别C-均值聚类(PFDCM)的权重指数m,最大迭代数rmax, 设置迭代最大误差参数ε。对步骤四的训练样本进行可能模糊鉴别C-均值聚类(PFDCM)得 到的聚类中心作为一种模糊鉴别聚类方法的初始聚类中心V(0)
Figure BDA0001629202530000021
步骤6,用一种可能模糊鉴别C-均值聚类方法进行茶叶品种的判定。
具体过程如下:
1)初始化:设置参数a,b的值,a>0,b>0,类别数c,权重指数m和η,m,η∈(1,+∞),测试样本数n;设置迭代次数r的初始值和最大迭代次数为rmax
计算协方差矩阵σ2
Figure BDA0001629202530000022
这里,n为样本数,xk为第k个样本,
Figure BDA0001629202530000023
为样本的均值,
Figure BDA0001629202530000024
训练样本的初始类中心
Figure BDA0001629202530000025
初始模糊隶属度
Figure BDA0001629202530000026
和初始典型值分别计算如下:
Figure BDA0001629202530000027
Figure BDA0001629202530000031
Figure BDA0001629202530000032
其中,
Figure BDA0001629202530000037
为第i类训练样本的类中心值,
Figure BDA0001629202530000038
由每类训练样本的样本均值组成,
Figure BDA0001629202530000039
为第一 类训练样本的类中心值,
Figure BDA00016292025300000310
为第二类训练样本的类中心值,
Figure BDA00016292025300000311
为第三类训练样本的类中 心值,
Figure BDA00016292025300000312
Figure BDA00016292025300000313
为第k个样本xk隶属于第i类 的初始模糊隶属度值,
Figure BDA00016292025300000314
为第j类训练样本的初始类中心值,xk为第k个测试样本,m为 权重指数,c为类别数;
Figure BDA00016292025300000315
第k个样本xk隶属于第i类的初始典型值,参数a>0,b>0。
2)计算模糊类间散射矩阵SfB
Figure BDA0001629202530000033
其中,
Figure BDA00016292025300000316
为第r次迭代时第k个样本xk隶属于第i类的模糊隶属度;
Figure BDA00016292025300000317
是为第r次迭 代时第k个样本xk隶属于第i类的典型值。m代表权重;c为类别数,参数a>0,b>0,
Figure BDA00016292025300000318
为第r次迭代时第i类的类中心值,
Figure BDA00016292025300000319
为测试样本的均值,
Figure BDA0001629202530000034
n为测试样本数, xj为第j个测试样本,上标T代表矩阵转置运算。
3)计算模糊总体散射矩阵SfT
Figure BDA0001629202530000035
其中,xk为第k个测试样本。
4)计算特征向量
Figure BDA0001629202530000036
其中,
Figure BDA0001629202530000043
为模糊离散度矩阵的逆矩阵,SfB为模糊类间散列矩阵,λ是特征向量ψ所对应的特征值。
5)将xk∈Rq转换到由ψ12,...,ψp组成的特征空间中
yk=xk T12,...,ψp](yk∈Rp)
其中,p和q均为样本的维数,ψp为第p个特征向量。
6)同样将
Figure BDA0001629202530000044
由Rq空间转化到Rp
Figure BDA0001629202530000045
Figure BDA0001629202530000046
其中,
Figure BDA0001629202530000047
是第r次迭代计算的第i类的类中心值,ψp为第p个特征向量。
7)在Rp空间计算yk的模糊隶属度函数值
Figure BDA0001629202530000041
其中,yk为Rp空间里第k个样本,
Figure BDA0001629202530000048
是第r+1次迭代时样本yk隶属于类别i的模糊隶属度值;
Figure BDA0001629202530000049
Figure BDA00016292025300000410
分别是第r次迭代计算的第i类和第j类的类中心值。
在Rp空间计算yk的典型值
Figure BDA0001629202530000042
其中,yk为特征空间里第k个样本,
Figure BDA00016292025300000411
是第r+1次迭代时样本yk隶属于类别i的模糊隶属度值,uik (r+1)是第r+1次迭代计算的模糊隶属度值;vi'(r)和vj'(r)分别是第r次迭代计算的第i类和第j类的类中心值;c为类别数,m为权重值。
8)在Rp空间中计算i类的类中心值
Figure BDA00016292025300000412
Figure BDA0001629202530000051
其中,
Figure BDA0001629202530000052
是第r+1次迭代计算的第i类的类中心值。
9)增加迭代数r值,即r=r+1;直到
Figure BDA0001629202530000053
或者r>rmax计算终止,否则将
Figure BDA0001629202530000054
的值赋给变量
Figure BDA0001629202530000055
Figure BDA0001629202530000056
的值赋给变量
Figure BDA0001629202530000057
Figure BDA0001629202530000058
的值赋给变量
Figure BDA0001629202530000059
继续从2)开始 重新计算。
本发明的有益效果:
本发明采用中红外光谱技术和一种可能模糊鉴别C-均值聚类的茶叶分类方法,这种方 法具有检测速度快、分类效率高、无污染、所需茶叶训练样本少等优点,且可实现模糊聚 类过程中进行数据鉴别信息的提取和数据压缩的目的、达到比模糊C-均值聚类更高的聚类 准确率和实现不同品种茶叶的正确分类的功能。
附图说明
图1是可能模糊鉴别C-均值聚类的茶叶红外光谱分类方法的流程图;
图2是茶叶样本的红外光谱图;
图3是MSC处理后的茶叶红外光谱图;
图4是LDA得到的二维测试样本。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本 发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用于解释本发明,并不 用于限定本发明。
如图1所示,一种可能模糊鉴别C-均值聚类的茶叶分类方法,包括以下步骤:
步骤1,采集茶叶样本红外光谱数据;将FTIR-7600型傅里叶红外光谱分析仪开机预 热1个小时,扫描次数为32,光谱扫描的波数4001.569cm-1~401.1211cm-1,扫描间隔为1.928cm-1,分辨率为4cm-1;茶叶样本:峨眉山茶叶、乐山市优质竹叶青和劣质竹叶青; 茶叶经研磨粉碎,再用40目筛进行过滤后,各取0.5g分别与溴化钾1:100均匀混合;每个 样本取混合物1g进行压膜,然后用光谱仪扫描3次,取3次的平均值作为样本光谱数据; 采集光谱时环境温度和相对湿度保持相对稳定;每种茶叶采集32个样本,共获得96个样 本。每个样本为一个1868维的数据,每种样本选取22个为测试样本,则测试样本共66个; 剩余的30个样本作为训练样本。获得茶叶样本的红外光谱如图2所示。
步骤2,对红外光谱数据进行预处理,用多元散射校正(MSC)对茶叶红外光谱进行预处理,经过MSC处理后的茶叶红外光谱如图3所示。
步骤3,采用主成分分析方法(PCA)对预处理后的茶叶样本红外光谱进行降维处理;因 为前14个主成分累计可信度为100%>98%,所以采用主成分分析方法(PCA)将茶叶样本红 外光谱进行特征分解得到前14个特征向量v1,v2…v14和对应的14个特征值λ1,λ2…λ14,每个特征向量都是1868维的数据,特征值具体如下:
λ1=293.9148,λ2=129.0279,λ3=19.0010,λ4=14.8802,
λ5=6.4349,λ6=3.8189,λ7=2.0033,λ8=1.4310,
λ9=1.0661,λ10=0.6298,λ11=0.4020,λ12=0.3169,
λ13=0.2706,λ14=0.2294。
将茶叶样本红外光谱投影到14个特征向量上得到14维的数据,即从1868维压缩到14维。
步骤4,采用线性鉴别分析(LDA)提取茶叶训练样本的红外光谱的鉴别信息,具体过程为:采用线性鉴别分析(LDA)提取步骤三的14维训练样本数据的鉴别信息,鉴别向 量数为2,LDA将14维的测试样本数据投影到其鉴别向量上可得到二维的测试样本数据, 如图4所示。
步骤5、设置模糊C-均值聚类(FCM)的权重指数m=2,最大迭代数rmax=100,设置迭代最大误差参数ε=0.00001。对步骤4的二维测试样本数进行模糊C均值聚类(FCM)得到的聚类中心作为一种模糊鉴别聚类方法的初始聚类中心V(0)
Figure BDA0001629202530000061
步骤6,用一种模糊鉴别聚类方法进行茶叶品种的判定:
1)初始化过程:设置类别数c,权重指数m,m∈(1,+∞);设置迭代次数初始值和最大迭代次数为rmax
2)计算模糊类间散射矩阵SfB
Figure BDA0001629202530000071
其中,
Figure BDA0001629202530000075
为第r次迭代时第k个样本xk隶属于第i类的模糊隶属度,m代表权重;c为类别数,
Figure BDA0001629202530000076
为第r次迭代时第i类的类中心值,
Figure BDA0001629202530000077
为测试样本的均值,
Figure BDA0001629202530000072
n为 测试样本数,xj为第j个测试样本,上标T代表矩阵转置运算。
3)计算模糊总体散射矩阵SfT
Figure BDA0001629202530000073
其中,xk为第k个测试样本。
4)计算特征向量
Figure BDA0001629202530000078
其中,
Figure BDA0001629202530000079
为模糊离散度矩阵的逆矩阵,SfB为模糊类间散列矩阵,λ是特征向量ψ所对应的特征值。
5)将xk∈Rq转化到特征空间(由ψ12,...,ψp组成)
yk=xk T12,...,ψp](yk∈Rp) (5)
其中,p和q均为样本的维数,ψp为第p个特征向量。
6)同样将
Figure BDA00016292025300000710
转化到特征空间
Figure BDA00016292025300000711
其中,
Figure BDA00016292025300000712
为步骤5中PFDCM中的类中心值,ψp为第p个特征向量。
7)在特征空间中计算模糊隶属度函数值
Figure BDA0001629202530000074
其中,yk为特征空间里第k个样本,
Figure BDA0001629202530000083
是第r+1次迭代时样本yk隶属于类别i的模糊隶属度值,uik (r+1)是第r+1次迭代计算的模糊隶属度值;vi'(r)和vj'(r)分别是第r次迭代计算的第i类和第j类的类中心值;
8)在特征空间中计算i类的类中心值
Figure BDA0001629202530000084
Figure BDA0001629202530000081
其中,
Figure BDA0001629202530000085
是第r+1次迭代计算的第i类的类中心
Figure BDA0001629202530000086
的值。
9)增加迭代数r值,即r=r+1;,直到
Figure BDA0001629202530000087
或者r>rmax计算终止,否则将
Figure BDA0001629202530000088
的值赋给变量
Figure BDA0001629202530000089
Figure BDA00016292025300000810
的值赋给变量
Figure BDA00016292025300000811
继续从2)开始重新计算。
实验结果:p=2,q=2,迭代终止时r=34次,类中心矩阵为
Figure BDA0001629202530000082
训练样本是已知的三个品种茶叶,即正品竹叶青、劣质竹叶青和峨眉山毛峰,计算每 种茶叶的训练样本的平均值为:
峨眉山毛峰平均值为
Figure BDA00016292025300000812
正品竹叶青平均值为
Figure BDA00016292025300000813
劣质竹叶青的平均值为
Figure BDA00016292025300000814
注:这里的训练样本和测试样本是指在步骤3中经过LDA计算后得到的数据样本;
判断测试样本的茶叶的三个类别分别属于哪个品种茶叶的方法是:分别计算测试样本 的某个聚类中心和训练样本三类茶叶的平均值的欧式距离,某个聚类中心离哪种训练茶叶 品种的欧式距离最小则判定该聚类中心所属茶叶品种和这种训练茶叶品种是相同品种。
具体计算和分析如下:
判断以
Figure BDA00016292025300000815
为类中心的茶叶所属类别:
Figure BDA0001629202530000091
很明显
Figure BDA0001629202530000092
距离
Figure BDA0001629202530000093
最近,则判定
Figure BDA0001629202530000094
为类中心的茶叶是峨眉山毛峰。
同样方法可判定
Figure BDA0001629202530000095
为类中心的茶叶是正品竹叶青,
Figure BDA0001629202530000096
为类中心的茶叶是劣质竹叶 青。
对于第k个测试样本xk,判断其属于哪一类的方法是:如果其模糊隶属度
Figure BDA0001629202530000097
则判定xk属于
Figure BDA0001629202530000098
所属的类别。具体举例分析如下:
本例中迭代终止后的模糊隶属度值,第1个样本的模糊隶属度为
Figure RE-GDA0001705990020000099
Figure RE-GDA00017059900200000910
所以
Figure RE-GDA00017059900200000911
则判定第1个样本属于
Figure RE-GDA00017059900200000912
所属的类别,即峨眉山毛峰。其余测试样本同样方法判断其所属的茶叶种类。
根据以上方法计算和判断,66个测试样本,根据模糊隶属度可得聚类准确率可高达 95.45%。
以上实施例仅用于说明本发明的设计思想和特点,其目的在于使本领域内的技术人员 能够了解本发明的内容并据以实施,本发明的保护范围不限于上述实施例。所以,凡依据 本发明所揭示的原理、设计思路所作的等同变化或修饰,均在本发明的保护范围之内。

Claims (5)

1.一种可能模糊鉴别C-均值聚类的茶叶分类方法,其特征在于,包括以下步骤:
步骤1,采集茶叶样本红外光谱数据;
步骤2,对茶叶样本红外光谱数据进行预处理;
步骤3,采用主成分分析方法对预处理后的茶叶样本红外光谱数据进行降维处理;
步骤4,采用线性鉴别分析提取茶叶训练样本的红外光谱的鉴别信息;
步骤5,对步骤4的训练样本进行可能模糊鉴别C-均值聚类,得到的聚类中心;
步骤6,用一种可能模糊鉴别C-均值聚类方法进行茶叶品种的判定;
所述步骤6的具体过程如下:
1)初始化:设置参数a、b的值,a>0,b>0,类别数c,权重指数m和η,m,η∈(1,+∞),测试样本数n;设置迭代次数r的初始值;
计算协方差矩阵σ2
Figure FDA0002402366010000011
其中,xk为第k个样本,
Figure FDA0002402366010000012
为样本的均值;
2)计算模糊类间散射矩阵SfB
Figure FDA0002402366010000013
其中,
Figure FDA0002402366010000014
为第r次迭代时第k个样本xk隶属于第i类的模糊隶属度;
Figure FDA0002402366010000015
是为第r次迭代时第k个样本xk隶属于第i类的典型值,
Figure FDA0002402366010000016
为第r次迭代时第i类的类中心值,xj为第j个测试样本,上标T代表矩阵转置运算;
3)计算模糊总体散射矩阵SfT
Figure FDA0002402366010000017
4)计算特征向量:
Figure FDA0002402366010000018
其中,
Figure FDA0002402366010000019
为模糊离散度矩阵的逆矩阵,λ是特征向量ψ所对应的特征值;
5)将xk∈Rq转换到由ψ12,...,ψp组成的特征空间中
yk=xk T12,...,ψp],yk∈Rp
其中,p和q均为样本的维数,ψp为第p个特征向量;
6)同样将
Figure FDA0002402366010000021
由Rq空间转化到Rp
Figure FDA0002402366010000022
Figure FDA0002402366010000023
7)在Rp空间计算yk的模糊隶属度函数值
Figure FDA0002402366010000024
其中,yk为Rp空间里第k个样本,
Figure FDA0002402366010000025
是第r+1次迭代时样本yk隶属于类别i的模糊隶属度值;
Figure FDA0002402366010000026
Figure FDA0002402366010000027
分别是第r次迭代计算的第i类和第j类的类中心值;
在Rp空间计算yk的典型值
Figure FDA0002402366010000028
其中,uik (r+1)是第r+1次迭代计算的模糊隶属度值;
8)在Rp空间中计算i类的类中心值
Figure FDA0002402366010000029
Figure FDA00024023660100000210
其中,
Figure FDA00024023660100000211
是第r+1次迭代计算的第i类的类中心值;
9)增加迭代数r值,即r=r+1;直到
Figure FDA00024023660100000212
或者r>rmax计算终止,否则将
Figure FDA00024023660100000213
的值赋给变量
Figure FDA00024023660100000214
Figure FDA00024023660100000215
的值赋给变量
Figure FDA00024023660100000216
Figure FDA00024023660100000217
的值赋给变量
Figure FDA00024023660100000218
继续从2)开始重新计算;
所述初始模糊隶属度
Figure FDA00024023660100000219
和初始典型值分别计算如下:
Figure FDA0002402366010000031
Figure FDA0002402366010000032
其中,
Figure FDA0002402366010000033
为第i类训练样本的类中心值;
Figure FDA0002402366010000034
为第k个样本xk隶属于第i类的初始模糊隶属度值,
Figure FDA0002402366010000035
为第j类训练样本的初始类中心值,
Figure FDA0002402366010000036
第k个样本xk隶属于第i类的初始典型值;
所述步骤5中获得聚类中心的方法为:
设置可能模糊鉴别C-均值聚类的权重指数m,最大迭代数rmax,设置迭代最大误差参数ε;对步骤4的测试样本数进行可能模糊鉴别C-均值聚类,得到的聚类中心作为一种模糊鉴别聚类方法的初始聚类中心V(0)
Figure FDA0002402366010000037
其中,
Figure FDA0002402366010000038
为第一类训练样本的类中心值,
Figure FDA0002402366010000039
为第二类训练样本的类中心值,
Figure FDA00024023660100000310
为第三类训练样本的类中心值,
Figure FDA00024023660100000311
2.根据权利要求1所述的一种可能模糊鉴别C-均值聚类的茶叶分类方法,其特征在于,所述步骤1中所述红外光谱数据采用FTIR-7600型傅里叶红外光谱分析仪测得。
3.根据权利要求1所述的一种可能模糊鉴别C-均值聚类的茶叶分类方法,其特征在于,所述步骤2中采用多元散射校正MSC对茶叶红外光谱进行预处理。
4.根据权利要求1所述的一种可能模糊鉴别C-均值聚类的茶叶分类方法,其特征在于,所述步骤4中采用线性鉴别分析LDA具体过程为:采用线性鉴别分析LDA提取步骤3的14维训练样本数据的鉴别信息,鉴别向量数为2,LDA将14维的测试样本数据投影到其鉴别向量上可得到二维的测试样本数据。
5.根据权利要求1所述的一种可能模糊鉴别C-均值聚类的茶叶分类方法,其特征在于,所述样本的均值的计算方法为:
Figure FDA0002402366010000041
CN201810335781.8A 2018-04-16 2018-04-16 一种可能模糊鉴别c-均值聚类的茶叶分类方法 Active CN108491894B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810335781.8A CN108491894B (zh) 2018-04-16 2018-04-16 一种可能模糊鉴别c-均值聚类的茶叶分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810335781.8A CN108491894B (zh) 2018-04-16 2018-04-16 一种可能模糊鉴别c-均值聚类的茶叶分类方法

Publications (2)

Publication Number Publication Date
CN108491894A CN108491894A (zh) 2018-09-04
CN108491894B true CN108491894B (zh) 2020-12-18

Family

ID=63316188

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810335781.8A Active CN108491894B (zh) 2018-04-16 2018-04-16 一种可能模糊鉴别c-均值聚类的茶叶分类方法

Country Status (1)

Country Link
CN (1) CN108491894B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111126496B (zh) * 2019-12-25 2023-09-08 深圳供电局有限公司 变压器固体绝缘材料类型确定方法
CN111898690B (zh) * 2020-08-05 2022-11-18 山东大学 一种电力变压器故障分类方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106408012A (zh) * 2016-09-09 2017-02-15 江苏大学 一种模糊鉴别聚类的茶叶红外光谱分类方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Detecting Fraudulent Words: Using PFCM;Ritika Singhal, N Deepika;《IEEE International Conference On Recent Trends In Electronics Information Communication Technology》;20160331;第2015-2016页 *
FUDT在苹果近红外光谱分类中的应用;武斌;《计算机工程与应用》;20161231;第193-196页 *
一种快速的广义噪声聚类算法;武斌;《计算机工程与应用》;20131231;第145-148页 *
可能性模糊C-均值聚类新算法;武小红;《电子学报》;20081031;第1996-2000页 *
基于聚类中心分离的模糊聚类模型;武小红;《自动化技术》;20080430;第110-114页 *

Also Published As

Publication number Publication date
CN108491894A (zh) 2018-09-04

Similar Documents

Publication Publication Date Title
CN107677647B (zh) 基于主成分分析和bp神经网络的中药材产地鉴别方法
CN106408012A (zh) 一种模糊鉴别聚类的茶叶红外光谱分类方法
CN105181650B (zh) 一种使用近红外光谱技术快速鉴别茶叶品种的方法
CN110068544B (zh) 物质识别网络模型训练方法及太赫兹光谱物质识别方法
CN109685098B (zh) 一种模糊簇间分离聚类的茶叶品种分类方法
CN109030407B (zh) 一种混合模糊c均值聚类的苹果品种分类方法
CN106951914B (zh) 一种优化模糊鉴别向量提取的电子鼻鉴别食醋品种方法
CN108491894B (zh) 一种可能模糊鉴别c-均值聚类的茶叶分类方法
CN108844917A (zh) 一种基于显著性假设检验和偏最小二乘法的近红外光谱数据分析方法
CN107192686B (zh) 一种模糊协方差矩阵的可能模糊聚类茶叶品种鉴别方法
CN114112983B (zh) 一种基于Python数据融合的藏药全缘叶绿绒蒿产地判别方法
CN108872128B (zh) 一种模糊非相关c均值聚类的茶叶红外光谱分类方法
CN108764288A (zh) 一种gk鉴别聚类的茶叶品种分类方法
CN111523587A (zh) 一种基于机器学习的木本植物物种光谱识别方法
CN106570520A (zh) 一种混合gk聚类的红外光谱茶叶优劣鉴别方法
CN110378374B (zh) 一种模糊鉴别信息提取的茶叶近红外光谱分类方法
CN110008989A (zh) 一种光谱特征相似条件下不同目标的红外光谱识别方法
CN107886115A (zh) 一种自适应可能c均值聚类的茶叶中红外光谱分类方法
CN110108661B (zh) 一种模糊极大熵聚类的茶叶近红外光谱分类方法
CN111595804A (zh) 一种模糊聚类的茶叶近红外光谱分类方法
CN113640244B (zh) 一种基于可见近红外光谱的果树品种鉴别方法
CN113095305B (zh) 一种医药异物高光谱分类检测方法
CN114331474A (zh) 一种模糊线性判别分析的牛奶产地溯源方法
CN110047062B (zh) 一种用于茶叶外形品质检测的高光谱特征波段优化方法
CN115420726A (zh) 一种利用重构sers光谱快速识别目标物的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210125

Address after: No. 605, Jianshe Road, Sanmao street, Yangzhong City, Zhenjiang City, Jiangsu Province, 212200

Patentee after: Jiangsu Jiayi Technology Information Service Co.,Ltd.

Address before: Zhenjiang City, Jiangsu Province, 212013 Jingkou District Road No. 301

Patentee before: JIANGSU University

Effective date of registration: 20210125

Address after: No.10 Jinshan Road, West Industrial Park, Ji'an County, Ji'an City, Jiangxi Province 343100

Patentee after: Ji'an Jirui Technology Co.,Ltd.

Address before: No. 605, Jianshe Road, Sanmao street, Yangzhong City, Zhenjiang City, Jiangsu Province, 212200

Patentee before: Jiangsu Jiayi Technology Information Service Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220531

Address after: Area 07, floor 7, huihuishi building, No. 17, Longquan Road, Wuhua District, Kunming, Yunnan 650000

Patentee after: Shanli Zhizao Yunnan Agricultural Science and Technology Development Co.,Ltd.

Address before: No.10 Jinshan Road, West Industrial Park, Ji'an County, Ji'an City, Jiangxi Province 343100

Patentee before: Ji'an Jirui Technology Co.,Ltd.