CN112801173B - 一种qr模糊鉴别分析的生菜近红外光谱分类方法 - Google Patents
一种qr模糊鉴别分析的生菜近红外光谱分类方法 Download PDFInfo
- Publication number
- CN112801173B CN112801173B CN202110098787.XA CN202110098787A CN112801173B CN 112801173 B CN112801173 B CN 112801173B CN 202110098787 A CN202110098787 A CN 202110098787A CN 112801173 B CN112801173 B CN 112801173B
- Authority
- CN
- China
- Prior art keywords
- lettuce
- fuzzy
- near infrared
- infrared spectrum
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 235000003228 Lactuca sativa Nutrition 0.000 title claims abstract description 76
- 238000002329 infrared spectrum Methods 0.000 title claims abstract description 60
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000004458 analytical method Methods 0.000 title claims abstract description 25
- 240000008415 Lactuca sativa Species 0.000 title 1
- 241000208822 Lactuca Species 0.000 claims abstract description 75
- 238000012549 training Methods 0.000 claims abstract description 49
- 238000012360 testing method Methods 0.000 claims abstract description 42
- 230000009467 reduction Effects 0.000 claims abstract description 15
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 11
- 239000013598 vector Substances 0.000 claims abstract description 7
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 239000011159 matrix material Substances 0.000 claims description 53
- 238000012937 correction Methods 0.000 claims description 4
- 239000006185 dispersion Substances 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 3
- 230000006835 compression Effects 0.000 claims description 2
- 238000007906 compression Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 claims description 2
- 238000005070 sampling Methods 0.000 claims description 2
- 238000012353 t test Methods 0.000 claims 3
- 238000001514 detection method Methods 0.000 abstract description 7
- 230000035945 sensitivity Effects 0.000 abstract description 3
- 238000001228 spectrum Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 235000013305 food Nutrition 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000000513 principal component analysis Methods 0.000 description 3
- 235000013311 vegetables Nutrition 0.000 description 3
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 206010007269 Carcinogenicity Diseases 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 208000017667 Chronic Disease Diseases 0.000 description 1
- ZZZCUOFIHGPKAK-UHFFFAOYSA-N D-erythro-ascorbic acid Natural products OCC1OC(=O)C(O)=C1O ZZZCUOFIHGPKAK-UHFFFAOYSA-N 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 208000007443 Neurasthenia Diseases 0.000 description 1
- IOVCWXUNBOPUCH-UHFFFAOYSA-M Nitrite anion Chemical compound [O-]N=O IOVCWXUNBOPUCH-UHFFFAOYSA-M 0.000 description 1
- 244000269722 Thea sinensis Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 229930003268 Vitamin C Natural products 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 230000000840 anti-viral effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 206010003549 asthenia Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 235000019658 bitter taste Nutrition 0.000 description 1
- 230000007670 carcinogenicity Effects 0.000 description 1
- 231100000260 carcinogenicity Toxicity 0.000 description 1
- 230000032677 cell aging Effects 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 235000013325 dietary fiber Nutrition 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000003891 environmental analysis Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 239000002799 interferon inducing agent Substances 0.000 description 1
- VJQAFLAZRVKAKM-QQUHWDOBSA-N lactucin Chemical compound O[C@@H]1CC(C)=C2C(=O)C=C(CO)[C@@H]2[C@H]2OC(=O)C(=C)[C@@H]21 VJQAFLAZRVKAKM-QQUHWDOBSA-N 0.000 description 1
- VJQAFLAZRVKAKM-UHFFFAOYSA-N lactucine Natural products OC1CC(C)=C2C(=O)C=C(CO)C2C2OC(=O)C(=C)C21 VJQAFLAZRVKAKM-UHFFFAOYSA-N 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- XKLJHFLUAHKGGU-UHFFFAOYSA-N nitrous amide Chemical compound ON=N XKLJHFLUAHKGGU-UHFFFAOYSA-N 0.000 description 1
- 230000004792 oxidative damage Effects 0.000 description 1
- 239000000447 pesticide residue Substances 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 235000019154 vitamin C Nutrition 0.000 description 1
- 239000011718 vitamin C Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3563—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/02—Computing arrangements based on specific mathematical models using fuzzy logic
- G06N7/023—Learning or tuning the parameters of a fuzzy system
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N2021/3595—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using FTIR
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/68—Food, e.g. fruit or vegetables
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Chemical & Material Sciences (AREA)
- Automation & Control Theory (AREA)
- Fuzzy Systems (AREA)
- Pathology (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Mathematical Optimization (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Analysis (AREA)
- Biomedical Technology (AREA)
- Algebra (AREA)
- Molecular Biology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种QR模糊鉴别分析的生菜近红外光谱分类方法,首先获取待分类生菜样本的近红外线光谱数据;对生菜的近红外线光谱数据进行预处理,消除散射影响;对S2中预处理后的近红外线光谱数据进行降维处理,并将降维处理后的近红外线光谱数据划分为生菜样本训练集和生菜样本测试集;采用QR模糊鉴别分析方法提取出降维处理后的近红外线光谱数据的鉴别信息;基于p范数距离测度的模糊聚类方法对测试样本进行分类。本发明的分类方法通过QR模糊鉴别分析提取生菜近红外线光谱的分类信息数据,再用QR分解方法使特征空间正交化,消除投影空间中特征向量之间的相关性,降低模糊聚类对噪声数据的敏感性;实现对生菜的快速、准确、无损的安全检测。
Description
技术领域
本发明涉及模式识别和人工智能领域,具体涉及一种QR模糊鉴别分析的生菜近红外光谱分类方法。
背景技术
生菜作为一类非常受欢迎的蔬菜,富含膳食纤维和维生素C,有消除多余脂肪的作用,故又叫减肥生菜;不仅如此,膳食中摄入适量蔬菜,能够有效清除体内代谢过程中产生的自由基,预防和修复自由基造成的氧化损伤,延缓细胞衰老和癌化,降低心血管疾病、癌症和衰老相关疾病等慢性疾病的发生率;因其茎叶中含有莴苣素,故味微苦,具有镇痛催眠、降低胆固醇、辅助治疗神经衰弱等功效;还值得注意的是,生菜中含有一种“干扰素诱生剂”,可刺激人体正常细胞产生干扰素,从而产生一种“抗病毒蛋白”进而抑制病毒。但是,长期摄入储存时间过长的生菜,会使人体摄入大量亚硝酸盐,而亚硝胺是危害性极高的化合物之一,其毒性和致癌性极强,进而大大威胁着人体的健康,但人们往往忽略了食品储存期鉴别这一重要步骤。因此非常有必要研究一种设计简易、便于操作、检测速度快的生菜储藏时间鉴别方法。
近红外线光谱技术是一种光谱分析技术,具有快速、无损、低成本、高精度、操作简单等优点。目前,近红外线光谱技术已广泛应用到环境分析、食品工程、医疗安全等多个领域。在食品工程方面,目前该技术主要应用于食品农药残留鉴定、特殊物质含量分析、种类鉴定以及新鲜度检测等多个方面。由于不同储藏时间的生菜其反射的近红外线光谱是不同的,据此,可以对不同储藏时间的生菜进行鉴别,进而实现生菜储藏时间的分类。
模糊聚类是一种模式识别算法,广泛应用于数据挖掘、模式分类、计算机视觉和数据分类等领域。但模糊聚类存在一些问题,例如对噪声数据很敏感,容易陷入局部最小值;模糊线性判别分析(FLDA)是在模糊集基础上,利用模糊类内散射矩阵和模糊总体散射矩阵改进了线性判别分析(LDA)方法,FLDA能有效的提取样本的模糊鉴别信息。但是,FLDA在处理复杂的光谱数据时,其模糊鉴别信息提取效果有待进一步提高。
发明内容
为了解决现有技术中的不足,本发明提出了一种QR模糊鉴别分析的生菜近红外光谱分类方法,通过QR模糊鉴别分析提取生菜近红外线光谱的分类信息数据,再用QR分解方法使特征空间正交化,消除投影空间中特征向量之间的相关性,降低模糊聚类对噪声数据的敏感性;实现对生菜的快速、准确、无损的安全检测。
本发明所采用的技术方案如下:
一种QR模糊鉴别分析的生菜近红外光谱分类方法,包括如下步骤:
S1,获取待分类生菜样本的近红外线光谱数据;
S2,对生菜的近红外线光谱数据进行预处理,消除散射影响;
S3,对S2中预处理后的近红外线光谱数据进行降维处理,并将降维处理后的近红外线光谱数据划分为生菜样本训练集和生菜样本测试集;
S4,采用QR模糊鉴别分析方法提取出降维处理后的近红外线光谱数据的鉴别信息;
S5,基于p范数距离测度的模糊聚类方法对测试样本进行分类。
进一步,所述S4中采用QR模糊鉴别分析方法提取近红外线光谱数据的鉴别信息的方法为:
S4.1,初始化生菜样本训练集的训练样本数ntr、生菜样本测试集的测试样本数nte、权重指数m和类别数c,其中m>1;
S4.2,对降维处理后的训练样本矩阵进行QR分解,得到:A=QR;其中,/>为实数矩阵集合;d为训练样本的维数;/>为一个维数是d×ntr的实数矩阵;/>为一个维数是ntr×ntr的实数矩阵:
S4.3,对训练样本矩阵A中的第k(1≤k≤ntr)个训练样本yk进行QR分解,xk为QR分解后的第k(1≤k≤ntr)个训练样本,表示为:
xk=ykQ
S4.4,计算训练样本xk隶属于第i(1≤i≤c)类的模糊隶属度uik:
其中,c为类别数;m为权重指数;vi为训练样本第i类的均值,vj为训练样本第j类的均值;
S4.5,计算训练样本模糊类间离散矩阵SfB和模糊类内离散度矩阵SfW:
其中,表示m已知时,训练样本xk隶属于第i(1≤i≤c)类的模糊隶属度;/>为训练样本的总均值,/>
S4.6,根据训练样本模糊类间离散矩阵SfB和模糊类内离散度矩阵SfW,计算出模糊类内离散度矩阵SfW的逆矩阵[SfW]-1与模糊类间离散矩阵SfB乘积矩阵的特征值γ和特征向量ψ,表示为:
[SfW]-1SfBψ=γψ,
其中,ψ和γ分别为逆矩阵[SfW]-1与模糊类间离散矩阵SfB乘积矩阵的特征向量和特征值。
S4.7,将第t(t=1,2,…,nte)个测试样本y′t进行如下变换:
zt=y′t(Qψ)
其中,zt为基于矩阵Q与特征向量ψ对测试样本y′t进行变换后求得的待分类样本数据;nte为测试样本数。
进一步,所述S5中对测试样本进行分类的方法为:
S5.1,建立目标函数如下:
其中,J为目标函数,为已知m=mf时第t(1≤t≤nte)个测试样本zt隶属于第i(1≤i≤c)类的模糊隶属度;/>为第t(1≤t≤nte)个测试样本zt隶属于第i(1≤i≤c)类的典型值;γi为测试样本第i类的类中心;权重系数mf,mp∈(1,+∞);p为指数。
约束条件如下:
其中,p为指数;μit为第t(1≤t≤nte)个测试样本zt隶属于第i(1≤i≤c)类的模糊隶属度;τit为第t(1≤t≤nte)个测试样本zt隶属于第i(1≤i≤c)类的典型值;权重系数mf,mp∈(1,+∞),γi为测试样本第i类的类中心。
S5.2,根据上述模型,计算模糊隶属度μit、典型值τit和类中心γi:
当迭代终止后,根据计算得到的模糊隶属度值和典型值,对生菜的储藏时间进行分类。
进一步,所述S3中采用主成分分析方法对近红外线光谱数据进行压缩降维处理。
进一步,所述S2中采用多元散射校正方法对近红外线光谱数据进行预处理。
进一步,所述S1中获取近红外线光谱数据的方法为:傅里叶近红外光谱仪对对每个生菜样本进行多次采样,取每个生菜样本多个采样值的平均值作为实验数据。
本发明的有益效果:
现有的模糊聚类算法之所以能够有效、准确地描述数据中包含的不确定性和不准确性,一部分原因是引入了模糊隶属度,使得样本无论距离数据簇中心多远,都会对各数据簇中心产生较大的作用力。但是,若将样本点与数据簇中心点间的欧氏距离代入计算模糊隶属度,当距离无上限增大时,这两点间的作用力也会无限增大,意味着该样本极大可能性属于某一数据簇中心,这显然是不合理的;据此本文提出来基于p范数距离测度的模糊聚类算法,解决模糊聚类中的噪声问题,有效提高聚类算法的鲁棒性。
本发明所提出的一种QR模糊鉴别分析的生菜近红外光谱分类方法,基于p范数距离测度实现对不同储存时间的生菜进行分类,能够无损、快速地对样品进行检测且不产生污染,体现了算法的强鲁棒性和优异的综合性能。
附图说明
图1为本发明的流程图;
图2为生菜的近红外光谱图;
图3为多元散射校正处理后的生菜近红外光谱图;
图4为初始模糊隶属度值;
图5为本发明基于p范数距离测度的模糊聚类方法的模糊隶属度值;
图6为本发明基于p范数距离测度的模糊聚类方法的典型值;
图7为生菜测试样本经过本发明模糊聚类后得到的聚类效果图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。
如图1所示,一种QR模糊鉴别分析的生菜近红外光谱分类方法,具体包括以下步骤:
S1,采集生菜样本的近红外线光谱:用傅里叶近红外光谱仪对生菜样本进行检测,获取生菜样本的近红外线光谱数据,将光谱数据存储在计算机中;在本实施例中,采集新鲜生菜样本60个,故有60类样本,将生菜清洗干净后放入贴有标签的保鲜袋中,再放入4℃冰箱里储藏备用,每隔12h取出生菜进行近红外光谱检测,共检测三次,得到60×3=180个近红外光谱数据。采集光谱时实验室温度保持在(15±2)℃,相对湿度在70%左右,AntarisⅡ近红外光谱分析仪开机预测1h。采用反射积分球模式采集生菜近红外光谱,近红外光谱分析仪扫描每个样品32次以获取样品的漫反射光谱均值。光谱扫描的波数范围为10000~4000cm-1,扫描间隔为3.856cm-1,采集到每个样本的近红外光谱是1557维的数据。为减少误差,每个样本采样3次,取其平均值作为最终的实验数据。生菜样本的漫反射近红外光谱图如图2所示。
S2,利用多元散射校正(MSC)对生菜近红外光谱进行预处理,消除散射影响。预处理后的光谱图如图3所示。
S3,对生菜样本近红外光谱进行降维处理:利用主成分分析(PCA)将S2中预处理后的生菜近红外光谱数据进行压缩处理,具体过程为:
将S2中的生菜近红外光谱用主成分分析计算特征值,将特征值从大到小排序,取前15个最大特征值(分别为:133.462,4.632,1.723,0.333,0.214,0.113,0.047,0.036,0.023,0.013,0.005,0.004,0.003,0.003,0.002)和特征值所对应的前15个特征向量,将60类生菜样本的近红外线光谱数据投影到这15个特征向量上,从而将近红外线光谱从1557维压缩到15维。将这15维光谱数据分为两个部分:将40类样本组成生菜样本训练集,剩余20类样本组成生菜样本测试集。
S4,提取生菜近红外光谱的模糊鉴别信息:采用QR模糊鉴别分析方法提取S3中降维处理后的生菜近红外线光谱数据的鉴别信息——模糊隶属度、典型值和类中心,具体步骤如下:
S4.1,初始化:由于每类样本均采集三次,故生菜样本训练集中的生菜训练样本数ntr=120;生菜样本测试集中的测试样本数nte=60;训练样本维度d=15;权重指数m=2,类别数c=3。
S4.2,对训练样本数据进行QR分解:对主成分分析后的训练样本矩阵进行QR分解:
A=QR,
其中,为实数矩阵集合;d为训练样本的维数;/>表示Q是一个维数为d×ntr的实数矩阵;/>表示R是一个维数为ntr×ntr的实数矩阵:ntr=120为训练样本个数,d=15为训练样本的维数;
S4.3,基于QR分解后的Q,对训练样本矩阵A中的训练样本yk进行映射处理得到待分类数据xk,表示为:xk=ykQ,1≤k≤ntr;
S4.4,计算第k(1≤k≤ntr)个样本xk隶属于第i(1≤i≤c)类的模糊隶属度uik:
其中,c为类别数;m为权重指数;vi为训练样本第i类的均值,i=1、2、...、c;vj为vj为训练样本第j类的均值,j=1、2、...、c;在本实施例中,类别数c=3,m=2;
故求得模糊隶属度uik如图4所示。
S4.5,根据下式分别计算训练样本的模糊类间离散矩阵Sfb和模糊类内离散度矩阵Sfw:
其中,为当m=2时,第k(1≤k≤ntr)个样本xk隶属于第i(1≤i≤c)类的模糊隶属度;/>为训练样本的总均值,/>vi为训练样本第i类的均值,i=1、2、...、c。
S4.6,基于训练样本模糊类间离散矩阵SfB和模糊类内离散度矩阵SfW,计算出模糊类内离散度矩阵SfW的逆矩阵[SfW]-1与模糊类间离散矩阵SfB乘积矩阵的特征值γ和特征向量ψ:
[SfW]-1SfBψ=γψ,
其中,ψ和γ分别代表逆矩阵[SfW]-1与模糊类间离散矩阵SfB乘积矩阵的特征向量和对应的特征值,取最大的两个特征值所对应的3个特征向量。
S4.7,将第t(t=1,2,…,nte)个测试样本y′t进行如下变换:
zt=y′t(Qψ)
其中,zt为基于矩阵Q与特征向量ψ对测试样本y′t进行变换后求得的待分类样本数据;nte=60为测试样本数。
S5,采用基于p范数距离测度的模糊聚类方法对测试样本zt进行分类,具体步骤如下:
S5.1,建立目标函数如下:
其中,J为目标函数,为已知m等于mf时,第t(1≤t≤nte)个测试样本zt隶属于第i(1≤i≤c)类的模糊隶属度;/>为第t(1≤t≤nte)个测试样本zt隶属于第i(1≤i≤c)类的典型值;γi为测试样本第i类的类中心;权重系数mf=mp=2;p=3为指数。
约束条件如下:
其中,p=3为指数;μit为第t(1≤t≤nte)个测试样本zt隶属于第i(1≤i≤c)类的模糊隶属度;τit为第t(1≤t≤nte)个测试样本zt隶属于第i(1≤i≤c)类的典型值;权重系数mf=mp=2。迭代次数为100次。γi为测试样本第i类的类中心。
S5.2,根据S5.1中的目标函数和约束条件,计算模糊隶属度μit、典型值τit和类中心γi:
当迭代次数达到100后,根据计算得到的模糊隶属度值和典型值,对生菜的储藏时间进行分类。
基于p范数距离测度的模糊聚类方法对收敛后得到的模糊隶属度如图5,典型值如图6,测试样本数据分类情况如图7。图5中三类样本的模糊隶属度与图6中三类样本的典型值差别较为明显,故本发明用于生菜储藏时间鉴别的精确度较高,三类生菜样本的类中心为图7中突出显示的三个较大标签所在的坐标。
以上实施例仅用于说明本发明的设计思想和特点,其目的在于使本领域内的技术人员能够了解本发明的内容并据以实施,本发明的保护范围不限于上述实施例。所以,凡依据本发明所揭示的原理、设计思路所作的等同变化或修饰,均在本发明的保护范围之内。
Claims (5)
1.一种QR模糊鉴别分析的生菜近红外光谱分类方法,其特征在于,包括如下步骤:
S1,获取待分类生菜样本的近红外线光谱数据;
S2,对生菜的近红外线光谱数据进行预处理,消除散射影响;
S3,对S2中预处理后的近红外线光谱数据进行降维处理,并将降维处理后的近红外线光谱数据划分为生菜样本训练集和生菜样本测试集;
S4,采用QR模糊鉴别分析方法提取出降维处理后的近红外线光谱数据的鉴别信息;
S5,基于p范数距离测度的模糊聚类方法对测试样本进行分类;
所述S4中采用QR模糊鉴别分析方法提取近红外线光谱数据的鉴别信息的方法为:
S4.1,初始化生菜样本训练集的训练样本数ntr、生菜样本测试集的测试样本数nte、权重指数m和类别数c,其中m>1;
S4.2,对降维处理后的训练样本矩阵进行QR分解,得到:A=QR;其中,/>为实数矩阵集合;d为训练样本的维数;/>为一个维数是d×ntr的实数矩阵;
为一个维数是ntr×ntr的实数矩阵:
S4.3,对训练样本矩阵A中的第k个训练样本yk进行QR分解,xk为QR分解后的第k个训练样本,表示为:
xk=ykQ
S4.4,计算训练样本xk隶属于第i类的模糊隶属度uik:
其中,c为类别数;m为权重指数;vi为训练样本第i类的均值,vj为训练样本第j类的均值;
S4.5,计算训练样本模糊类间离散矩阵SfB和模糊类内离散度矩阵SfW:
其中,表示m已知时,训练样本xk隶属于第i类的模糊隶属度;/>为训练样本的总均值,
S4.6,根据训练样本模糊类间离散矩阵SfB和模糊类内离散度矩阵SfW,计算出模糊类内离散度矩阵SfW的逆矩阵[SfW]-1与模糊类间离散矩阵SfB乘积矩阵的特征值γ和特征向量ψ,表示为:
[SfW]-1SfBψ=γψ,
其中,ψ和γ分别为逆矩阵[SfW]-1与模糊类间离散矩阵SfB乘积矩阵的特征向量和特征值;
S4.7,将第t个测试样本yt′进行如下变换,t=1,2,…,nte:
zt=yt′(Qψ)
其中,zt为基于矩阵Q与特征向量ψ对测试样本yt′进行变换后求得的待分类样本数据;nte为测试样本数。
2.根据权利要求1所述的一种QR模糊鉴别分析的生菜近红外光谱分类方法,其特征在于,所述S5中对测试样本进行分类的方法为:
S5.1,建立目标函数如下:
其中,J为目标函数,为已知m=mf时第t个测试样本zt隶属于第i类的模糊隶属度;为第t个测试样本zt隶属于第i类的典型值;γi为测试样本第i类的类中心;权重系数mf,mp∈(1,+∞);p为指数;
约束条件如下:
其中,p为指数;μit为第t个测试样本zt隶属于第i类的模糊隶属度;τit为第t个测试样本zt隶属于第i类的典型值;权重系数mf,mp∈(1,+∞),γi为测试样本第i类的类中心;
S5.2,根据上述模型,计算模糊隶属度μit、典型值τit和类中心γi:
当迭代终止后,根据计算得到的模糊隶属度值和典型值,对生菜的储藏时间进行分类。
3.根据权利要求1或2所述的一种QR模糊鉴别分析的生菜近红外光谱分类方法,其特征在于,所述S3中采用主成分分析方法对近红外线光谱数据进行压缩降维处理。
4.根据权利要求3所述的一种QR模糊鉴别分析的生菜近红外光谱分类方法,其特征在于,所述S2中采用多元散射校正方法对近红外线光谱数据进行预处理。
5.根据权利要求3所述的一种QR模糊鉴别分析的生菜近红外光谱分类方法,其特征在于,所述S1中获取近红外线光谱数据的方法为:傅里叶近红外光谱仪对对每个生菜样本进行多次采样,取每个生菜样本多个采样值的平均值作为实验数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110098787.XA CN112801173B (zh) | 2021-01-25 | 2021-01-25 | 一种qr模糊鉴别分析的生菜近红外光谱分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110098787.XA CN112801173B (zh) | 2021-01-25 | 2021-01-25 | 一种qr模糊鉴别分析的生菜近红外光谱分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112801173A CN112801173A (zh) | 2021-05-14 |
CN112801173B true CN112801173B (zh) | 2024-06-07 |
Family
ID=75811633
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110098787.XA Active CN112801173B (zh) | 2021-01-25 | 2021-01-25 | 一种qr模糊鉴别分析的生菜近红外光谱分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112801173B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114384042B (zh) * | 2021-12-30 | 2024-06-07 | 江苏大学 | 一种模糊加权鉴别信息提取的黄山毛峰等级鉴定方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005045548A2 (en) * | 2003-11-06 | 2005-05-19 | Elan Group Ltd | System and process for predictively classifying objects |
CN108764288A (zh) * | 2018-04-25 | 2018-11-06 | 江苏大学 | 一种gk鉴别聚类的茶叶品种分类方法 |
CN109886296A (zh) * | 2019-01-11 | 2019-06-14 | 滁州职业技术学院 | 一种鉴别信息提取式噪声聚类的茶叶品种分类方法 |
CN110378374A (zh) * | 2019-06-12 | 2019-10-25 | 江苏大学 | 一种模糊鉴别信息提取的茶叶近红外光谱分类方法 |
CN111595804A (zh) * | 2020-05-09 | 2020-08-28 | 滁州职业技术学院 | 一种模糊聚类的茶叶近红外光谱分类方法 |
-
2021
- 2021-01-25 CN CN202110098787.XA patent/CN112801173B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005045548A2 (en) * | 2003-11-06 | 2005-05-19 | Elan Group Ltd | System and process for predictively classifying objects |
CN108764288A (zh) * | 2018-04-25 | 2018-11-06 | 江苏大学 | 一种gk鉴别聚类的茶叶品种分类方法 |
CN109886296A (zh) * | 2019-01-11 | 2019-06-14 | 滁州职业技术学院 | 一种鉴别信息提取式噪声聚类的茶叶品种分类方法 |
CN110378374A (zh) * | 2019-06-12 | 2019-10-25 | 江苏大学 | 一种模糊鉴别信息提取的茶叶近红外光谱分类方法 |
CN111595804A (zh) * | 2020-05-09 | 2020-08-28 | 滁州职业技术学院 | 一种模糊聚类的茶叶近红外光谱分类方法 |
Non-Patent Citations (2)
Title |
---|
一种广义噪声聚类的红外光谱茶叶品种鉴别研究;武斌;崔艳海;武小红;贾红雯;李敏;;光谱学与光谱分析;20160715(第07期);全文 * |
广义模糊K调和均值聚类的近红外光谱生菜储藏时间鉴别;武小红;潘明辉;武斌;嵇港;孙俊;;光谱学与光谱分析;20160615(第06期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112801173A (zh) | 2021-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104374738B (zh) | 一种基于近红外提高鉴别结果的定性分析方法 | |
CN110378374B (zh) | 一种模糊鉴别信息提取的茶叶近红外光谱分类方法 | |
CN109030407B (zh) | 一种混合模糊c均值聚类的苹果品种分类方法 | |
CN109685098B (zh) | 一种模糊簇间分离聚类的茶叶品种分类方法 | |
CN106408012A (zh) | 一种模糊鉴别聚类的茶叶红外光谱分类方法 | |
CN107192686B (zh) | 一种模糊协方差矩阵的可能模糊聚类茶叶品种鉴别方法 | |
CN107219510B (zh) | 基于无限最大间隔线性判别投影模型的雷达目标识别方法 | |
CN110874576B (zh) | 一种基于典型相关分析融合特征的行人再识别方法 | |
CN106951914A (zh) | 一种优化模糊鉴别向量提取的电子鼻鉴别食醋品种方法 | |
CN109376805A (zh) | 一种基于白酒基酒指纹图谱特征的分类方法 | |
CN105954412A (zh) | 用于山核桃新鲜度检测的传感器阵列优化方法 | |
CN110378373B (zh) | 一种模糊非相关线性鉴别分析的茶叶品种分类方法 | |
CN112801173B (zh) | 一种qr模糊鉴别分析的生菜近红外光谱分类方法 | |
CN114113471A (zh) | 一种基于机器学习的人工鼻冰箱食品新鲜度检测方法及系统 | |
CN108764288A (zh) | 一种gk鉴别聚类的茶叶品种分类方法 | |
CN108491894B (zh) | 一种可能模糊鉴别c-均值聚类的茶叶分类方法 | |
CN109886296A (zh) | 一种鉴别信息提取式噪声聚类的茶叶品种分类方法 | |
CN114331474A (zh) | 一种模糊线性判别分析的牛奶产地溯源方法 | |
CN111595804A (zh) | 一种模糊聚类的茶叶近红外光谱分类方法 | |
CN110398472A (zh) | 一种基于二维相关光谱量化的植物油鉴别分类方法 | |
CN110414549B (zh) | 一种模糊正交线性鉴别分析的茶叶近红外光谱分类方法 | |
CN111595805A (zh) | 一种可能性聚类的白菜农药残留定性分析方法 | |
CN110108661B (zh) | 一种模糊极大熵聚类的茶叶近红外光谱分类方法 | |
CN113640244B (zh) | 一种基于可见近红外光谱的果树品种鉴别方法 | |
CN111881738B (zh) | 一种核模糊正交鉴别分析的茶叶近红外光谱分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |