CN110097127A - 基于核主成分分析的黄芪谱图特征提取与产地鉴别方法 - Google Patents
基于核主成分分析的黄芪谱图特征提取与产地鉴别方法 Download PDFInfo
- Publication number
- CN110097127A CN110097127A CN201910375862.5A CN201910375862A CN110097127A CN 110097127 A CN110097127 A CN 110097127A CN 201910375862 A CN201910375862 A CN 201910375862A CN 110097127 A CN110097127 A CN 110097127A
- Authority
- CN
- China
- Prior art keywords
- spectrogram
- astragalus
- sample
- equation
- kernel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 18
- 239000009636 Huang Qi Substances 0.000 title claims abstract description 9
- 238000012850 discrimination method Methods 0.000 title abstract 2
- 239000000284 extract Substances 0.000 title abstract 2
- 238000004519 manufacturing process Methods 0.000 title description 3
- 235000006533 astragalus Nutrition 0.000 claims abstract description 33
- 241001061264 Astragalus Species 0.000 claims abstract description 29
- 210000004233 talus Anatomy 0.000 claims abstract description 29
- 238000000034 method Methods 0.000 claims abstract description 20
- 241000411851 herbal medicine Species 0.000 claims abstract description 18
- 238000000605 extraction Methods 0.000 claims abstract description 11
- 239000011159 matrix material Substances 0.000 claims description 23
- 239000013598 vector Substances 0.000 claims description 17
- 238000012360 testing method Methods 0.000 claims description 14
- 238000000513 principal component analysis Methods 0.000 claims description 11
- 238000005457 optimization Methods 0.000 claims description 10
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 claims description 8
- 239000000126 substance Substances 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 7
- 239000000843 powder Substances 0.000 claims description 6
- 239000000047 product Substances 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 5
- 238000001816 cooling Methods 0.000 claims description 3
- 230000001186 cumulative effect Effects 0.000 claims description 3
- 239000000706 filtrate Substances 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 239000000463 material Substances 0.000 claims description 3
- 238000002156 mixing Methods 0.000 claims description 3
- 238000010561 standard procedure Methods 0.000 claims description 3
- 238000003756 stirring Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 18
- 230000008901 benefit Effects 0.000 abstract description 3
- 238000004422 calculation algorithm Methods 0.000 abstract description 2
- 238000009614 chemical analysis method Methods 0.000 abstract description 2
- 238000010183 spectrum analysis Methods 0.000 abstract 2
- 238000002474 experimental method Methods 0.000 abstract 1
- 238000013508 migration Methods 0.000 abstract 1
- 230000005012 migration Effects 0.000 abstract 1
- 239000003814 drug Substances 0.000 description 12
- 230000000694 effects Effects 0.000 description 8
- 230000009467 reduction Effects 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- 238000002211 ultraviolet spectrum Methods 0.000 description 6
- 238000001514 detection method Methods 0.000 description 5
- 238000001871 ion mobility spectroscopy Methods 0.000 description 5
- 241000045403 Astragalus propinquus Species 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000001237 Raman spectrum Methods 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 238000005033 Fourier transform infrared spectroscopy Methods 0.000 description 1
- 238000001069 Raman spectroscopy Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000001506 fluorescence spectroscopy Methods 0.000 description 1
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 1
- 238000000589 high-performance liquid chromatography-mass spectrometry Methods 0.000 description 1
- 238000002329 infrared spectrum Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012567 pattern recognition method Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000005556 structure-activity relationship Methods 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- 238000000870 ultraviolet spectroscopy Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/33—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using ultraviolet light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/62—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Artificial Intelligence (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biochemistry (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Electrochemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本发明公开了一种基于核主成分分析的谱图特征提取算法,并在此基础上应用稀疏表示分类器对黄芪谱图进行分析,从而实现黄芪产地的快速鉴别方法。本发明采用的化学分析方法主要离子迁移谱分析技术和紫外荧光光谱分析技术,具有谱图采集快速、区分度好等优势,是实现中草药品质快速鉴别的重要方法。本发明的采取的技术方案主要内容包括黄芪谱图信息的采集,基于核主成分分析的中草药谱图特征提取,基于稀疏表示分类器的黄芪产地鉴别方法;实验表明,该方法运算速度快,识别率高,为实现我国中草药的品质快速鉴别提供了一种技术解决思路和方案,具有广泛的应用意义。
Description
1技术领域
本发明所涉及一种基于核主成分分析和基于稀疏表示分类器的黄芪谱图特征提取与产地鉴别方法,具体的说是在化学计量学领域范畴内,将模式识别技术与中草药谱图分析技术相结合,以谱图分析技术为手段,以核主成分分析技术为谱图特征提取方法,以稀疏表示分类器作为识别方案的中草药质量鉴定新技术。
2背景技术
《国家中长期科学和技术发展规划纲要(2006—2020年)》明确地将中医药传承与创新发展作为优先主题,“重点研究中医药诊疗、评价技术与标准,发展现代中药研究开发和生产制造技术,有效保护和合理利用中药资源,加强中医药知识产权保护研究和国际合作平台建设”。同时纲要指出“通过技术创新与多学科融合,丰富和发展中医药理论,构建适合中医药特点的技术方法和标准规范体系,提高临床疗效,促进中医药产业的健康发展”。
对中药材质量评价的中药指纹谱图主要集中在以化学成分为中心的质量控制,即以分子结构清楚,构效关系明确的已知的活性组分为基础建立药材指纹谱图,以进行检测,常用检测手段有UV、FTIR、HPLC、HPLC-MS、GC、GC-MS、X-ray等仪器检测法。现阶段化学计量学的主要研究方向之一,就是将模式识别技术与常用的谱图分析技术相结合开展交叉学科的研究,产生了大量的研究成果。然而更多还是针对中草药产品中特定组分的化学分析,缺少对重要产品全局性、整体性的评判,难以避免不法商贩针对特定组分进行造假的行为。
通过具有“整体性”和“模糊性”的中草药指纹谱图技术,结合现代模式识别的方法和理论,构建中草药品质快速检测分析方法,能较为全面地反映中药及其制剂中所含化学成分的种类与数量,进而对药品质量进行整体描述和评价,对于提高中药质量,打击假冒伪劣产品,促进中药现代化具有重要意义。
3发明内容
3.1发明目的:
本发明为了进一步丰富中草药品质鉴别的快速检测技术,在化学计量学分析的基础上,提出一种基于核主成分分析的谱图特征提取算法,并在此基础上应用稀疏表示分类器对黄芪谱图进行分析,从而实现黄芪产地的快速鉴别。
本发明采用的化学分析方法主要包括离子迁移谱分析技术和紫外荧光光谱分析技术,这些技术具有谱图采集快速、区分度好等优势,是实现中草药品质快速鉴别的重要方法。
3.2技术方案
为达到上述目的,本发明的采取的技术方案为:基于核主成分分析和基于稀疏表示分类器的黄芪谱图特征提取与产地鉴别方法,主要内容包括黄芪谱图信息的采集,基于核主成分分析的中草药谱图特征提取,基于稀疏表示分类器的黄芪产地鉴别方法;
(1)黄芪谱图信息的采集:
利用现阶段化学谱图分析领域内的规范方法进行黄芪谱图信息采集。作为优选方案,本发明中,黄芪样品置于中药材粉碎机中25000转/分钟粉碎至粉末,而后取3克黄芪粉末样品,置于30毫升乙醇溶液,混合均匀后,100摄氏度搅拌条件下,冷凝水回流2小时,而后自然冷却,过滤收集滤液,据此样品进行谱图信号采集。
(2)黄芪谱图信息的特征提取
设样本个数为n,谱图维度为p,则n个对象的谱图数据组成样本数据矩阵为y,yi={yi1,yi2,…,yij},(i=1,2,…,n;j=1,2,…,p)。
为了排除数量级和量纲不同带来的影响,首先对原始数据进行标准化处理,
其中,mj,σj分别为第j个指标向量(y1j,y2j,…,ynj)的均值和方差,这样形成新的数据矩阵x,xi={xi1,xi2,…,xij},(i=1,2,…,n;j=1,2,…,p)。
设变换Φ实现了样本空间Rp到特征空间F的映射,即样本数据xi在F空间的像为Φ(xi),则映射数据的协方差矩阵为
对C求特征λ(λ1≥λ2≥…≥λn≥0)和特征向量V∈F,则
CV=λV (3)
然后进行核变换,即对每个样本与该式求内积,得
λ(Φ(xi)·V)=Φ(xi)·CV,i=1,2,…,n (4)
特征向量矩阵V可以用Φ(xi)表示为
式中,Φ(x)=(Φ(x1),…,Φ(xn)),α=(α1,...,αn)T,则代入式(2)有
定义n×n矩阵K,Kij=Φ(xi)Φ(xj),注意到K是一个对称阵,式(5)可写为
nλα=Kα (7)
一般映射数据为非零均值的,这时可以通过修正式(7)得到
式中,In为n维大小的单位矩阵,1n×n表示各元素为1的n×n维矩阵。对式(8)求解,获得要求的特征值λ(λ1≥λ2≥…≥λn≥0)和特征向量V。测试样本x在F空间向量Vk的投影为
按照前m个非线性主成分的累积贡献率大于85%的原则选取非线性主成分,确定前m个主成分,则测试样本的特征成分数据集为
通常,非线性变换函数Φ(·)相当复杂,而实际运算过程中用到的核函数K(·,·)则相对简单的多,常用的核函数如下:
a.线性核函数K(x,xi)=x·xi
b.多项式核函数K(x,xi)=(x·xi+1)d其中d是正整数。
c.高斯核函数
其中σ为控制核函数高宽的参数。
(3)基于稀疏表示的分类器的构建
设A=[A1A2...Ac]为一组训练样本集,样本总数为n,其中 为第i类训练样本集,y∈Rm为第i类的一测试样本,则y可由Ai线性表示为:
但现实中,测试样本的类别往往是未知的,因此,式(1)可改写为:
y=Ax0 (2)
其中,
当m>n时,式(2)有唯一解;然而,在大多数应用中,m≤n,这使得式(2)有无穷个解.为了使得测试样本尽可能的用测试样本所在类的训练样本进行线性表示,所求得系数向量x0包含的非零向量应该尽可能少些.那么,对式(2)的求解可转换对式(3)进行求解.
其中,||·||0表示l0范数,其表示计算向量中非零元素的个数.然而,式(3)是一个NP难题,求解非常困难.
最近,压缩感知理论揭示出:当所求系数足够稀疏时,最小化l0范数的NP难题可以转化为最小化l1范数问题来进行求解.为此,(3)式可改写为:
由于,所获取的数据中经常包含噪声,y很难准确的由A进行线性表示,为此,将式(4)改写为:
式(5)可通过(6)式来求解
通过求解优化问题,所得的y即为样本对应的分类标签。
3.3有益效果:
本发明所构建的基于KPCA和SRC的黄芪产地鉴别方法,可以广泛用于各种中草药的产地鉴别。
本发明所采用的谱图分析技术,也可以采用除紫外光谱和离子迁移谱外的其他分析技术,如拉曼光谱、质谱、红外光谱等;
本发明基于核主成分分析和基于稀疏表示分类器的黄芪谱图特征提取与产地鉴别方法,主要内容包括黄芪谱图信息的采集,基于核主成分分析的中草药谱图特征提取,基于稀疏表示分类器的黄芪产地鉴别方法,为实现我国中草药的品质快速鉴别提供了一种技术解决思路和方案,具有广泛的应用意义。
4附图说明:
图1是紫外光谱的核函数选择和参数寻优结果图;
图2是参数45-50范围进行局部寻优结果图;
图3是四种黄芪样本在紫外光谱下的KPCA降维效果图;
图4是离子迁移谱的核函数选择和参数寻优结果图;
图5是0-5范围进行局部寻优结果图;
图6是四种黄芪样本在离子迁移谱下的KPCA降维效果图;
5具体实施方式
下面结合具体实施案例,进一步阐明本发明,应理解这些仅用于阐释本发明而不用于限制本发明的范围,在阅读本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本发明所附权利要求书所限定的范围。
(1)黄芪样品的处理和采集:
黄芪谱图信息的采集:利用现阶段化学谱图分析领域内的规范方法进行黄芪谱图信息采集。作为优选方案,本发明中,黄芪样品置于中药材粉碎机中25000转/分钟粉碎至粉末,而后取3克黄芪粉末样品,置于30毫升乙醇溶液,混合均匀后,100摄氏度搅拌条件下,冷凝水回流2小时,而后自然冷却,过滤收集滤液,据此样品进行谱图信号采集。
乙醇(色谱级)购买于瑞典Oceanpak Alexative化学试剂有限公司,
黄芪购置于先声再康药业公司,甘肃、内蒙古、山西、四川产地的黄芪样本各10个不同批次的样本。
拉曼光谱使用美国Enwave Optronics公司的Prott-ezRaman-D3型号激光拉曼光谱仪采集获得。
紫外光谱使用北京普析通用仪器有限责任公司的T6新世纪型号紫外光谱仪采集获得。
离子迁移谱使用本发明申请单位自制离子迁移谱仪采集获得。
(2)谱图信息的特征提取:
设样本个数为n=40,谱图维度为p,则n个对象的谱图数据组成样本数据矩阵为y,yi={yi1,yi2,…,yij},(i=1,2,…,n;j=1,2,…,p)。
为了排除数量级和量纲不同带来的影响,首先对原始数据进行标准化处理,
其中,mj,σj分别为第j个指标向量(y1j,y2j,…,ynj)的均值和方差,这样形成新的数据矩阵x,xi={xi1,xi2,…,xij},(i=1,2,…,n;j=1,2,…,p)。
设变换Φ实现了样本空间Rp到特征空间F的映射,即样本数据xi在F空间的像为Φ(xi),则映射数据的协方差矩阵为
对C求特征λ(λ1≥λ2≥…≥λn≥0)和特征向量V∈F,则然后进行核变换,即对每个样本与该式求内积,得
λ(Φ(xi)·V)=Φ(xi)·CV,i=1,2,…,n
定义n×n矩阵K,Kij=Φ(xi)Φ(xj),注意到K是一个对称阵,计算:
式中,In为n维大小的单位矩阵,1n×n表示各元素为1的n×n维矩阵。对上式求解,获得要求的特征值λ(λ1≥λ2≥…≥λn≥0)和特征向量V。测试样本x在F空间向量Vk的投影为
按照前m个非线性主成分的累积贡献率大于85%的原则选取非线性主成分,确定前m个主成分,则测试样本的特征成分数据集为
(3)稀疏表示分类器的构建
①对训练样本集A中的每一个列向量进行归一化.
②求解最小化l1范数问题:
s.t.Ax=y
或求解
s.t.||Ax-y||2≤ε
③计算残差其中,
④l(y)=argminiri(y).l(y)表示y的标记.
(4)应用效果分析
从PCA和KPCA对于谱图特征提取和结合SRC分类器的识别率可以看出,核函数的使用大大提高了分类的效果,并且从直观降维效果图上给出了一定的解释。核函数的使用也保持了一致性,其中高斯核函数在参数(d或者gamma)取很小的时候,识别率总是好于多项式核函数;当参数逐渐取大的时候,多项式核函数的识别率提高很快,并且远远好于高斯核函数。因此,在选择高斯核函数时,可以考虑gamma取较小的值,而选择多项式核函数时,d可以考虑取相对较大的值。
图1-图6分别给出了紫外光谱和离子迁移谱在选择不同核函数的基础上,在交叉验证和SRC分类器下,给出的最优核函数和参数,其中图像横轴代表着核参数d(对应着多项式核函数)和gamma(对应着高斯核函数)取值范围,纵轴对应着识别率大小;图3和图6对应着最佳核函数和参数下的KPCA降维图(其中坐标轴对应着核主成分1、2、3)。
从图1给出的紫外光谱的核函数寻优结果来看,由图1可知识别率最高点参数在45-50区间取到;
图2对45-50范围进行局部寻优,可以得到在核函数选择多项式核函数下,参数d=45.6时,得到最高的识别率为92.20%。
图3是四种黄芪样本在紫外光谱下的KPCA降维图,直观反映出了分类了效果;
图4给出了离子迁移谱的核函数选择和参数寻优结果,由图4可知最高点参数在0-5区间取到,
图5对0-5范围进行局部寻优,可以得到在核函数选择多项式核函数下,参数d=4.25~5时,得到最高的识别率为94.51%。
图6是四种黄芪样本在离子迁移谱下的KPCA降维图,直观反映出了分类了效果;
表1给出了三种谱图对于KPCA+SRC模型下,在9-交叉验证条件下的平均识别率的情况,核函数的选择都保持了一致性,都是在核函数选择多项式核函数时达到最优,运行时间都相差不多。对比表2中给出的传统PCA+SRC模型下的识别率,可以看出,本发明所利用的KPCA+SRC模型,具有明显的正确率优势。
表格1三种谱图不同产地黄芪在KPCA+SRC模型下的识别率
表格2三种谱图不同产地黄芪在PCA+SRC模型下的识别率
Claims (4)
1.一种基于核主成分分析和稀疏表示分类器的黄芪谱图特征提取与产地鉴别方法,其特征在于,包含如下主要步骤:(1)黄芪谱图信息的采集,(2)基于核主成分分析的中草药谱图特征提取,(3)基于稀疏表示分类器的黄芪产地鉴别方法。
2.根据权利要求书1中所述的一种基于核主成分分析和稀疏表示分类器的黄芪谱图特征提取与产地鉴别方法,其特征在于,黄芪谱图信息采集方式为:利用现阶段化学谱图分析领域内的规范方法进行黄芪谱图信息采集。作为优选方案,本发明中,黄芪样品置于中药材粉碎机中25000转/分钟粉碎至粉末,而后取3克黄芪粉末样品,置于30毫升乙醇溶液,混合均匀后,100摄氏度搅拌条件下,冷凝水回流2小时,而后自然冷却,过滤收集滤液,据此样品进行谱图信号采集。
3.根据权利要求书1中所述的一种基于核主成分分析和稀疏表示分类器的黄芪谱图特征提取与产地鉴别方法,其特征在于,谱图信息特征提取采用如下方式进行计算:
设样本个数为n,谱图维度为p,则n个对象的谱图数据组成样本数据矩阵为y,yi={yi1,yi2,...,yij},(i=1,2,...,n;j=1,2,...,p)。
为了排除数量级和量纲不同带来的影响,首先对原始数据进行标准化处理,
其中,mj,σj分别为第j个指标向量(y1j,y2j,...,ynj)的均值和方差,这样形成新的数据矩阵x,xi={xi1,xi2,...,xij},(i=1,2,...,n;j=1,2,...,p)。
设变换Φ实现了样本空间Rp到特征空间F的映射,即样本数据xi在F空间的像为Φ(xi),则映射数据的协方差矩阵为
对C求特征λ(λ1≥λ2≥...≥λn≥0)和特征向量V∈F,则
CV=λV (3)
然后进行核变换,即对每个样本与该式求内积,得
λ(Φ(xi)·V)=Φ(xi)·CV,i=1,2,...,n (4)
特征向量矩阵V可以用Φ(xi)表示为
式中,Φ(x)=(Φ(x1),...,Φ(xn)),α=(α1,...,αn)T,则代入式(2)有
定义n×n矩阵K,Kij=Φ(xi)Φ(xj),注意到K是一个对称阵,式(5)可写为
nλα=Kα (7)
一般映射数据为非零均值的,这时可以通过修正式(7)得到
式中,In为n维大小的单位矩阵,1n×n表示各元素为1的n×n维矩阵。对式(8)求解,获得要求的特征值λ(λ1≥λ2≥...≥λn≥0)和特征向量V。测试样本x在F空间向量Vk的投影为
按照前m个非线性主成分的累积贡献率大于85%的原则选取非线性主成分,确定前m个主成分,则测试样本的特征成分数据集为
通常,非线性变换函数Φ(·)相当复杂,而实际运算过程中用到的核函数K(·,·)则相对简单的多,常用的核函数如下:
a.线性核函数K(x,xi)=x·xi
b.多项式核函数K(x,xi)=(x·xi+1)d其中d是正整数。
c.高斯核函数
其中σ为控制核函数高宽的参数。
4.根据权利要求书1中所述的一种基于核主成分分析和稀疏表示分类器的黄芪谱图特征提取与产地鉴别方法,其特征在于,在特征提取后,采用如下稀疏表示分类器进行识别:
设A=[A1A2...Ac]为一组训练样本集,样本总数为n,其中 为第i类训练样本集,y∈Rm为第i类的一测试样本,则y可由Ai线性表示为:
但现实中,测试样本的类别往往是未知的,因此,式(1)可改写为:
y=Ax0 (2)
其中,
当m>n时,式(2)有唯一解;然而,在大多数应用中,m≤n,这使得式(2)有无穷个解.为了使得测试样本尽可能的用测试样本所在类的训练样本进行线性表示,所求得系数向量x0包含的非零向量应该尽可能少些.那么,对式(2)的求解可转换对式(3)进行求解.
当所求系数足够稀疏时,最小化l0范数的N P难题可以转化为最小化l1范数问题来进行求解.为此,(3)式可改写为:
由于,所获取的数据中经常包含噪声,y很难准确的由A进行线性表示,为此,将式(4)改写为:
式(5)可通过(6)式来求解
通过求解优化问题,所得的y即为样本对应的分类标签。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910375862.5A CN110097127A (zh) | 2019-05-07 | 2019-05-07 | 基于核主成分分析的黄芪谱图特征提取与产地鉴别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910375862.5A CN110097127A (zh) | 2019-05-07 | 2019-05-07 | 基于核主成分分析的黄芪谱图特征提取与产地鉴别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110097127A true CN110097127A (zh) | 2019-08-06 |
Family
ID=67447143
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910375862.5A Pending CN110097127A (zh) | 2019-05-07 | 2019-05-07 | 基于核主成分分析的黄芪谱图特征提取与产地鉴别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110097127A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110632162A (zh) * | 2019-09-11 | 2019-12-31 | 山西大学 | 一种地方野生黄芪和栽培黄芪的识别方法 |
CN111178627A (zh) * | 2019-12-30 | 2020-05-19 | 杭州电子科技大学 | 一种基于spca的神经网络混合优化预测方法 |
CN111753877A (zh) * | 2020-05-19 | 2020-10-09 | 海克斯康制造智能技术(青岛)有限公司 | 一种基于深度神经网络迁移学习的产品质量检测方法 |
CN112986408A (zh) * | 2019-12-13 | 2021-06-18 | 中国科学院大连化学物理研究所 | 一种黄芪与红芪的鉴别分析方法 |
CN113138248A (zh) * | 2021-04-25 | 2021-07-20 | 贵州中烟工业有限责任公司 | 特征图谱提取方法及料液配制质量稳定性的检测方法 |
CN113899826A (zh) * | 2021-09-29 | 2022-01-07 | 中国农业大学 | 一种黄芪种子的分类方法及系统 |
CN114694771A (zh) * | 2020-12-31 | 2022-07-01 | 清华大学 | 样品分类方法、分类器的训练方法、设备和介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103245713A (zh) * | 2013-03-25 | 2013-08-14 | 江苏易谱恒科技有限公司 | 基于支持向量机和离子迁移谱的中草药产地鉴别方法 |
CN105574475A (zh) * | 2014-11-05 | 2016-05-11 | 华东师范大学 | 一种基于共同向量词典的稀疏表示分类方法 |
CN106568759A (zh) * | 2016-10-11 | 2017-04-19 | 王海燕 | 一种基于多谱融合的道地药材质量鉴别方法 |
CN107677647A (zh) * | 2017-09-25 | 2018-02-09 | 重庆邮电大学 | 基于主成分分析和bp神经网络的中药材产地鉴别方法 |
-
2019
- 2019-05-07 CN CN201910375862.5A patent/CN110097127A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103245713A (zh) * | 2013-03-25 | 2013-08-14 | 江苏易谱恒科技有限公司 | 基于支持向量机和离子迁移谱的中草药产地鉴别方法 |
CN105574475A (zh) * | 2014-11-05 | 2016-05-11 | 华东师范大学 | 一种基于共同向量词典的稀疏表示分类方法 |
CN106568759A (zh) * | 2016-10-11 | 2017-04-19 | 王海燕 | 一种基于多谱融合的道地药材质量鉴别方法 |
CN107677647A (zh) * | 2017-09-25 | 2018-02-09 | 重庆邮电大学 | 基于主成分分析和bp神经网络的中药材产地鉴别方法 |
Non-Patent Citations (4)
Title |
---|
吕蔚 等,: "基于核主成分分析的高校科技创新能力评价研究", 《国防科技大学学报》 * |
宋超,: "基于多谱融合—稀疏模型在黄芪原产地质量管理评价中的应用", 《中国优秀硕士学位论文全文数据库经济与管理科学辑》 * |
范自柱,: "快速稀疏表示分类的人脸识别算法", 《计算机工程与应用》 * |
陈才扣 等,: "一种快速的基于稀疏表示分类器", 《南京大学学报(自然科学)》 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110632162A (zh) * | 2019-09-11 | 2019-12-31 | 山西大学 | 一种地方野生黄芪和栽培黄芪的识别方法 |
CN110632162B (zh) * | 2019-09-11 | 2021-07-27 | 山西大学 | 一种地方野生黄芪和栽培黄芪的识别方法 |
CN112986408A (zh) * | 2019-12-13 | 2021-06-18 | 中国科学院大连化学物理研究所 | 一种黄芪与红芪的鉴别分析方法 |
CN111178627A (zh) * | 2019-12-30 | 2020-05-19 | 杭州电子科技大学 | 一种基于spca的神经网络混合优化预测方法 |
CN111178627B (zh) * | 2019-12-30 | 2022-05-31 | 杭州电子科技大学 | 一种基于spca的神经网络混合优化预测方法 |
CN111753877A (zh) * | 2020-05-19 | 2020-10-09 | 海克斯康制造智能技术(青岛)有限公司 | 一种基于深度神经网络迁移学习的产品质量检测方法 |
CN111753877B (zh) * | 2020-05-19 | 2024-03-05 | 海克斯康制造智能技术(青岛)有限公司 | 一种基于深度神经网络迁移学习的产品质量检测方法 |
CN114694771A (zh) * | 2020-12-31 | 2022-07-01 | 清华大学 | 样品分类方法、分类器的训练方法、设备和介质 |
CN113138248A (zh) * | 2021-04-25 | 2021-07-20 | 贵州中烟工业有限责任公司 | 特征图谱提取方法及料液配制质量稳定性的检测方法 |
CN113899826A (zh) * | 2021-09-29 | 2022-01-07 | 中国农业大学 | 一种黄芪种子的分类方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110097127A (zh) | 基于核主成分分析的黄芪谱图特征提取与产地鉴别方法 | |
CN107677647B (zh) | 基于主成分分析和bp神经网络的中药材产地鉴别方法 | |
CN105574474B (zh) | 一种基于质谱信息的生物特征图像识别方法 | |
Goodarzi et al. | Similarity analyses of chromatographic herbal fingerprints: a review | |
Alaerts et al. | Recent developments in chromatographic fingerprints from herbal products: set-up and data analysis | |
Wong et al. | Differentiating Puerariae Lobatae Radix and Puerariae Thomsonii Radix using HPTLC coupled with multivariate classification analyses | |
Yu et al. | Raisin quality classification using least squares support vector machine (LSSVM) based on combined color and texture features | |
Lee et al. | Discrimination and prediction of cultivation age and parts of Panax ginseng by Fourier-transform infrared spectroscopy combined with multivariate statistical analysis | |
CN110110789A (zh) | 一种基于多谱图信息融合技术的中草药品质鉴别方法 | |
Yu et al. | Accuracy and stability improvement in detecting Wuchang rice adulteration by piece-wise multiplicative scatter correction in the hyperspectral imaging system | |
Dong et al. | Deep learning for geographical discrimination of Panax notoginseng with directly near-infrared spectra image | |
CN104809471B (zh) | 一种基于空间光谱信息的高光谱图像残差融合分类方法 | |
Zhang et al. | Recent trends of machine learning applied to multi-source data of medicinal plants | |
Fu et al. | Rapid Recognition of Geoherbalism and Authenticity of a Chinese Herb by Data Fusion of Near‐Infrared Spectroscopy (NIR) and Mid‐Infrared (MIR) Spectroscopy Combined with Chemometrics | |
Devassy et al. | Ink classification using convolutional neural network | |
EP2717046B1 (en) | Method for attributing peaks, attribution program, and attribution device | |
CN115661069A (zh) | 一种高光谱异常检测方法及计算机装置 | |
Gong et al. | Spectrum-image dual-modality fusion empowered accurate and efficient classification system for traditional Chinese medicine | |
Zhang et al. | Machine learning applications for multi-source data of edible crops: A review of current trends and future prospects | |
Liu et al. | Network pharmacology and fingerprint for the integrated analysis of mechanism, identification and prediction in Panax notoginseng | |
Jiang et al. | Near-infrared spectroscopy combined with machine learning for rapid identification of Atractylodis rhizoma decoction pieces | |
CN107944474B (zh) | 基于局部自适应字典的多尺度协作表达高光谱分类方法 | |
Tan et al. | Near-infrared spectroscopy analysis of compound fertilizer based on GAF and quaternion convolution neural network | |
CN111896609B (zh) | 一种基于人工智能分析质谱数据的方法 | |
Zhang et al. | Chromatographic fingerprinting and chemometric techniques for quality control of herb medicines |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190806 |