CN103076300A - 专属性模式识别模型判别分析中药材资源指纹信息的方法 - Google Patents

专属性模式识别模型判别分析中药材资源指纹信息的方法 Download PDF

Info

Publication number
CN103076300A
CN103076300A CN2012105931000A CN201210593100A CN103076300A CN 103076300 A CN103076300 A CN 103076300A CN 2012105931000 A CN2012105931000 A CN 2012105931000A CN 201210593100 A CN201210593100 A CN 201210593100A CN 103076300 A CN103076300 A CN 103076300A
Authority
CN
China
Prior art keywords
matrix
chinese
training
traditional chinese
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012105931000A
Other languages
English (en)
Other versions
CN103076300B (zh
Inventor
杨天鸣
付海燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South Central Minzu University
Original Assignee
WUHAN XINFANG BIOLOGICAL TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WUHAN XINFANG BIOLOGICAL TECHNOLOGY Co Ltd filed Critical WUHAN XINFANG BIOLOGICAL TECHNOLOGY Co Ltd
Priority to CN201210593100.0A priority Critical patent/CN103076300B/zh
Publication of CN103076300A publication Critical patent/CN103076300A/zh
Application granted granted Critical
Publication of CN103076300B publication Critical patent/CN103076300B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明属于中药质量控制技术领域,具体公开了一种专属性模式识别模型判别分析中药材资源指纹信息的方法,该方法按如下步骤进行:(1)中药材样品的制备;(2)中药材近红外和中红外光谱全息指纹图谱的获取与光谱预处理校正;(3)对中药材资源进行虚拟的矩阵编码;(4)中药材质量控制专属性模式识别训练模型的构建;(5)专属性训练模型对中药材资源的辨识与判断。本发明方法为客观评价中药材的种属、真伪、优劣和道地性保护等质量控制问题提供一种简便快速、科学客观、准确可靠的技术手段。

Description

专属性模式识别模型判别分析中药材资源指纹信息的方法
技术领域
本发明涉及中药质量控制技术领域,尤其涉及一种专属性模式识别模型判别分析中药材资源指纹信息的方法,该方法是一种对中药材资源的近红外和中红外指纹图谱构建专属性模式识别模型进行判别分析的质量控制方法。
背景技术
中药质量控制研究一直是中药化学非常热衷的研究领域之一。尽管我国有关中药质量控制方法的记载是世界上最早最全面的,但传统中药材在安全、有效、均匀、稳定等质量方面依然缺乏标准化的科学质量评价体系,中药国家质量标准还很不完善,尚不能充分反映中药质量状况,特别是一些指标成分含量测定,难以通过“量”达到控制“质”的目的。且许多指标成分并非某一药材所独有,通过指标成分控制质量,专属性也较差。而且中药材属生物体,因地理环境、种植条件、栽培技术、异地引种、采收时间和采集部位不同等诸方面的因素,即使同一种中药材,也很难控制化学成分的一致性。为了确保中药材的稳定性和高效性,以及保证中药其疗效和用药安全性,充分利用好中药这一博大的优势资源,必须对中药材资源进行质量控制,这主要包括控制对中药材资源的不同基源、有无掺杂使假、质量等级以及药材的道地性进行质量控制。但是,通常这些不同基源、真伪优劣中药材、道地性中药材的形态学特征和大多数化学物理特征可能几乎没有区别,仅由专家进行感官评价或性状鉴别、组织显微鉴别、理化鉴别等传统方法难以判别并且也缺乏客观依据。而从分析科学的角度出发,若沿用西药质控模式,测定一种或几种有效成分对中药进行质量判别,不能真正反映中药的质量。因为对于中药,其单味药的化学组成都已非常复杂并且大多为未知,少则几十种,多则成百上千种。而且,在传统的物理或化学分离过程中可能会造成一些组分或有效组分的损失甚至破坏,特别是那些微量或痕量组分极易流失或分解,这样从一部分组分的化学分析结果或一部分形态指数进行评价中药质量,不仅工作量极大,耗时耗材,而且对于中药的信息获取的不充分导致分析评价结果存在大的偏差。
发明内容
针对现有技术中存在的不足,本发明的目的在于提供了一种简便快速、科学客观、准确可靠的评价中药材资源的基源种属、真伪、优劣和道地性保护等质量控制问题的方法。该方法通过获取中药材的全息近红外和中红外的指纹校正信息,并对其进行虚拟的矩阵编码,再运用连续滑动窗口偏最小二乘判别分析方法对各中药材在所有窗口中校正指纹信息与虚拟的矩阵编码间关联建模,构建对各药材校正指纹信息的专属性模式识别模型,从而实现对未知中药材的辨识与判别。
本发明的目的通过如下技术方案实现:一种专属性模式识别模型判别分析中药材资源指纹信息的方法,其特征在于,按如下步骤进行:
(1)中药材样品的制备;
(2)中药材近红外和中红外光谱全息指纹图谱的获取与光谱预处理校正;
(3)对中药材资源进行虚拟的矩阵编码;
(4)中药材质量控制专属性模式识别训练模型的构建;
(5)专属性训练模型对中药材资源的辨识与判断。
本发明中药材样品的制备为经去泥沙、清洗干净,真空干燥后,用中药粉碎机粉碎过目筛,获取可供分析的中药材样品。
本发明中药材样品的近红外指纹图谱的获取是以金箔为参比进行近红外光谱全波段扫描。中红外指纹图谱的获取可将中药材样品与适量溴化钾混合后压片,进行中红外全波段扫描。对全息中红外和近红外指纹图谱进行多元散射校正处理以克服不同波长点可能存在的不同程度影响以及由样品颗粒的大小和折射率等物理性质使光谱散射所导致的差异和/或通过二阶导数校正消除基线漂移和倾斜所造成的误差,改善光谱分辨峰,获取中药材全息得以增强的校正指纹信息。
本发明中对中药材资源进行虚拟的矩阵编码,是通过将用于训练模型的中药材资源(如不同种植品种、不同产地、不同采收时期、不同加工炮制、不同贮存时间等的中药材,本发明列举了不同基源中药材,真伪中药材,不同道地性中药材的实施例)进行虚拟编码,每一行代表一个样品,将其虚拟编码为矢量code=vj,其编码原则为第j个元素为1,其余元素均为0。由此,可将用于训练模型的不同类中药材资源编码为一个矩阵In×m,该矩阵的行数等于建模所用的中药材资源训练样本数n,列数等于中药材资源不同类别数m。
本发明中对中药材质量控制专属性模式识别训练模型的构建,是通过设置一个以指纹校正图谱中第一个光谱数据点为窗口的起点,且窗口大小w取值为20至40间的任意窗口连续地在中药材训练集的全息近红外或中红外的校正指纹图谱数据中滑动,连续滑动的窗口中的光谱作为n个训练样本的响应信号矩阵Xn×p的子矩阵Xn×w,运用偏最小二乘判别分析方法将滑动的每一个窗口中的中药材训练集近红外和中红外的指纹校正图谱数据分别与编码的中药材资源的类别训练矩阵In×m关联,且在每一个窗口位置,对所有训练集样本建立不同隐变量的偏最小二乘判别分析子模型,即:In×m,t=Xn×w,tRwxm,t+En×m,t;其中,Rw×m,t是t个隐变量的偏最小二乘判别分析模型的回归系数矩阵,En×m,t为残差矩阵。然后计算这一系列不同隐变量下偏最小二乘判别分析子模型训练的分类残差,并对窗口作图,获取具有低的(优先选择分类残差在整个光谱区间最小的区段,若指纹信息量不够,依次选择次小的区段进行组合)分类残差和低维数(当模型中隐变量的增加不能显著减小分类残差时,则优选该隐变量数)模型的特征指纹信息区间,即由此有效地消除不同类中药材资源指纹信息中非线性和复共线性等相关因素的影响,甄别得到中药材全息校正光谱中所隐含的专属指纹特征信息的系列有用变量区间,并将其组合后与中药材资源的虚拟编码类别矩阵间构建具有专属性特征的偏最小二乘判别分析模型,即:In×m=Xn×pRp×m;其中,p是提取得到的差异性专属指纹特征信息区间所含的波长数,m是类别数。编码的中药材资源的类别训练矩阵In×m的每一列对获得的专属性特征信息矩阵Xn×p进行PLS1回归,回归矩阵Rp×m的每一列为PLS1的回归系数量,最佳隐变量数由n-重交互验证(n不小于5)确定。
本发明中专属性训练模式识别模型对中药材资源的辨识与判断,是通过辨识和判别未知中药材资源样品类别矩阵Iun的解码进行。该未知样品类别矩阵Iun的解码的获得计算如下:在未知样品的响应信号矩阵Xun和专属性模型回归得到的矩阵Rp×m之间建模,即:Iun=XunRp×m。通过解码的Iun则可获知未知的任意第j个样品的类别解码矢量v′中最大值所出现的第m个位置,从而判定中药材资源的类别属性。即:Mj=decodemax(v′j..);其中,Mj为第j个样品的类别,decodemax(v′j...)表示第j个样品的解码矢量v′j最大元素的位置。
本发明中所阐述的方法,相比传统以指标化学成分含量高低评判中药质量的方法有诸多优势,包括样品预处理简单、无损分析、无有机溶剂污染、操作简便、分析速度快,能更全面科学客观地从不同的中药材中寻找出决定样本差异的特征隐变量,从而达到对不同属性和特征的中药材进行专属性快速判别的目的。相比近红外全息指纹质量控制方法,该方法通过甄别剔除无用光谱信息干扰和专属性提取隐含的有用特征指纹信息,不仅能极大提高分析速度,而且能提高识别能力,更适应于大批量药材质量控制与监测。本发明为客观评价中药材的种属、真伪、优劣和道地性保护等质量控制问题提供一种简便快速、科学客观、准确可靠的技术手段。
附图说明
图1为中药材秦艽4种基原植物共1120个样品的近红外指纹图谱(a)原始光谱;(b)多元散射校正光谱;(c)二阶导数光谱;(d)多元散射校正结合二阶导数校正光谱;
图2为中药材秦艽4种基原植物共1120个样品的中红外指纹图谱(a)原始光谱;(b)多元散射校正光谱;(c)二阶导数光谱;(d)多元散射校正结合二阶导数校正光谱;
图3为甄别的中药材秦艽4种基原植物的专属性特征差异指纹信息区间图示。(a)近红外;(b)中红外;箭头间所指区域为专属性指纹区间。
图4为本发明方法建立的专属性训练模式识别模型对4种基原植物解码的辨识与判断图示。(a)近红外;(b)中红外。
图5为麻花秦艽与2种其伪品黑秦艽和红秦艽共560个样品的近红外指纹图谱(a)原始光谱;(b)多元散射校正光谱;(c)二阶导数光谱。
图6为麻花秦艽与2种其伪品黑秦艽和红秦艽共560个样品的中红外指纹图谱(a)原始光谱;(b)多元散射校正光谱;(c)二阶导数光谱。
图7为甄别的麻花秦艽与2种其伪品黑秦艽和红秦艽的专属性特征差异指纹信息区间图示。(a)近红外;(b)中红外;箭头间所指区域为专属性指纹区间。
图8为本发明方法建立的专属性训练模式识别模型对麻花秦艽与2种其伪品黑秦艽和红秦艽解码的辨识与判断图示。(a)近红外;(b)中红外。
图9为6种不同道地性小秦艽共480个样品的近红外指纹图谱(a)原始光谱;(b)多元散射校正光谱;(c)二阶导数光谱。
图10为6种不同道地性小秦艽共480个样品的中红外指纹图谱(a)原始光谱;(b)多元散射校正光谱;(c)二阶导数光谱。
图11为甄别的6种不同道地性小秦艽的专属性特征差异指纹信息区间图示。(a)近红外;(b)中红外;箭头间所指区域为专属性指纹区间。
图12为本发明方法建立的专属性训练模式识别模型对6种不同道地性的小秦艽解码的辨识与判断图示。(a)近红外;(b)中红外。
具体实施方式
下面申请人将结合具体的实施例对本发明方法做进一步的详细说明,以使本领域技术人员更加清楚地理解本发明。但以下内容不应理解为是对本发明的权利要求书请求保护范围的限制。
实施例1:中药材秦艽4种基源植物指纹信息的判别分析
主要仪器:AntarisⅡ傅立叶变换近红外光谱仪;FT-IR NICOLET6700傅立叶变换红外光谱仪。
1.中药材秦艽4种基源植物近红外光谱和中红外光谱指纹信息采集
将中药材粗茎秦艽、秦艽、小秦艽、麻花秦艽4种秦艽的基源植物分别经去泥沙、清洗干净,真空干燥2小时,用中药粉碎机粉碎后过200目筛,分别取适量各秦艽的基源植物样品置测量杯中,以金箔为参比,在4000-10000cm-1波数范围进行近红外全谱扫描,共收集了1120个4种秦艽的基源植物样品的近红外光谱指纹信息,见图1(a);另取适量各秦艽的基源植物样品粉末2mg与200mg溴化钾混合研磨均匀、压片,经傅立叶变换红外光谱仪进行测定,也共收集了1120个4种秦艽的基源植物样品的中红外光谱指纹信息,见图2(a);对于采集得到的近红外光谱和中红外光谱的数据集划分一致,均将1120个4种秦艽的基源植物样品光谱随机随机划分为726个训练样本和394个预测样本,其中各基源植物样品光谱标记信息具体参见表1。
表1中药材秦艽4种基源植物样品光谱标记信息
2.对中药材秦艽4种基源植物样品的近红外光谱以及中红外光谱均进行全息多元散射校正和二阶导数校正处理,所获得的中药材秦艽4种基源植物样品的近红外多元散射校正全息指纹图谱、二阶导数校正指纹图谱、多元散射校正全息结合二阶导数校正指纹图谱,分别参见图1(b)、(c)、(d);所获中药材秦艽4种基源植物样品的中红外多元散射校正全息指纹图谱、二阶导数校正指纹图谱、多元散射校正全息结合二阶导数校正指纹图谱,分别参见图2(b)、(c)、(d)。
3.对于中药材秦艽4种基源植物各类别的每个样品进行虚拟的矢量编码,即每个粗茎秦艽样品编码为code=v1(1,0,0,0),则108个粗茎秦艽编码为一个矩阵I108×4;每个秦艽样品编码为code=v2(0,1,0,0),则54个秦艽编码为一个矩阵I54×4;每个小秦艽样品编码为code=v3(0,0,1,0),则298个小秦艽编码为一个矩阵I298×4;每个麻花秦艽样品编码为code=v4(0,0,0,1),则266个麻花秦艽编码为一个矩阵I266×4
4.中药材秦艽4种基源植物专属性指纹信息区间的获取及专属性模式训练模型的构建:
通过设置一个大小为w40的窗口(其大小可取经验值范围为20-40之间任意窗口,其效果不受影响)在中药材秦艽4种基源植物的726个训练样品的近红外或中红外多元散射校正全息指纹图谱、二阶导数校正指纹图谱、多元散射校正结合二阶导数校正指纹图谱数据中连续的滑动,能获得秦艽4种基源植物的726个训练样本的系列子矩阵X726×4,运用偏最小二乘判别分析方法将其与图谱数据与秦艽4种基源植物矩阵I726×4关联,且在每一个窗口位置,对所有训练集样本建立不同隐变量的偏最小二乘判别分析子模型,然后计算这一系列不同隐变量下偏最小二乘判别分析子模型训练的辨识残差,并对窗口作图,获取具有低的辨识残差和低维数模型的特征指纹信息区间,即得到中药材秦艽4种基源植物全息校正光谱中所隐含的专属指纹特征信息的系列有用变量区间,最佳隐变量数由10-重交互验证确定为8。以此获得辨识残差小的近红外多元散射校正谱的专属指纹特征信息区间(4100-4350nm、5020-5300nm、5420-5800nm)见图3(a1),二阶导数校正谱的专属指纹特征信息区间(4050-4320nm、5000-5250nm、5340-5700nm)见图3(a2),以及多元散射校正谱结合二阶导数校正谱的专属指纹特征信息区间(4060-4300nm、5250-5500nm、5650-5950nm)见图3(a3)。获得的中红外多元散射校正谱的专属指纹特征信息区间(1650-1870nm)见图3(b1),二阶导数校正谱的专属指纹特征信息区间(1650-1870nm)见图3(b2),以及多元散射校正谱结合二阶导数校正谱的专属指纹特征信息区间(1630-1850)见图3(b3)。以此获取对判别中药材秦艽4种基源植物间所存差异最为有利的专属性指纹信息区间。
5.专属性训练模式识别模型预测各未知秦艽药材所属的基源植物类别;
将甄别得到的近红外或中红外专属指纹特征信息区间组合后与药材秦艽4种基源植物样品的虚拟编码类别矩阵间构建具有专属性特征的偏最小二乘判别分析模型,即:I726×4=X726×pRp×4;其中,p是提取得到的近红外或中红外差异性专属指纹特征信息区间所含的波长数,见表2。并由10-倍交互验证确定模型最优隐变量的数目均为8。然后,通过未知的中药材秦艽4种基源植物样品的响应信号矩阵X394×p和专属性模型回归得到的矩阵Rp×4之间建模获得未知秦艽药材所属的基源植物样品类别矩阵I394×4,即:I394×4=X394×pRp×4。则可获知未知的任意第j个秦艽基原植物样品的类别解码矢量v′中最大值所出现的第m个位置,从而预测和判定未知药材秦艽所属的基源植物类别。图4(a1)、4(a2)、4(a3)分别为专属性训练模式识别模型对4种秦艽基源植物近红外多元散射校正谱、二阶导数校正谱、多元散射校正谱结合二阶导数校正谱辨识的类别归属图。图4(b1)、4(b2)、4(b3)分别为专属性训练模式识别模型对4种秦艽基源植物中红外多元散射校正谱、二阶导数校正谱、多元散射校正谱结合二阶导数校正谱辨识的类别归属图。v1′代表52个粗茎秦艽样品,v2′代表26个秦艽样品,v3′代表182个小秦艽样品,v4′代表134个麻花秦艽样品。由图4(a1)、4(a2)、4(a3)可见,对四类秦艽基原植物所有样品的解码矢量最大值均完全归类准确,判别正确率达100%。由图4(b1)和4(b2)可见,对四类秦艽基原植物所有样品的多元散射校正谱或二阶导数校正谱的解码矢量最大值仅有第271号小秦艽样品被错误判别为粗茎秦艽样品,其余均完全解码归类准确,判别正确率为99.8%。由图4(b3)可见多元散射校正谱结合二阶导数校正谱的解码矢量最大值均完全解码归类准确,判别正确率为100%。结果列于表2。
表2专属性训练模式识别模型对394个4种秦艽基源植物样品预测结果
Figure BDA00002687658100071
Figure BDA00002687658100081
实施例2:真伪麻花秦艽指纹信息的判别分析
主要仪器:AntarisⅡ傅立叶变换近红外光谱仪;FT-IR NICOLET6700傅立叶变换红外光谱仪。
1.真伪麻花秦艽近红外光谱和中红外光谱指纹信息采集
将麻花秦艽以及伪品黑秦艽、红秦艽样本分别经去泥沙、清洗干净,真空干燥2小时,用中药粉碎机粉碎后过200目筛,分别取适量麻花秦艽秦艽和其伪品黑秦艽、红秦艽样品置测量杯中,以金箔为参比,在4000-10000cm-1波数范围进行近红外全谱扫描,共收集了560个真伪麻花秦艽样品的近红外光谱指纹信息,见图5(a);另取适量各真伪麻花秦艽样品粉末2mg与200mg溴化钾混合研磨均匀、压片,经傅立叶变换红外光谱仪进行测定,也共收集了560个真伪麻花秦艽样品的中红外光谱指纹信息,见图6(a);对于采集得到的近红外光谱和中红外光谱的数据集划分一致,均将560个真伪麻花秦艽样品光谱随机分为380个训练样本和180个预测样本,其中各真伪麻花秦艽样品光谱标记信息具体参见表3。
表3真伪麻花秦艽样品光谱标记信息
Figure BDA00002687658100082
2.对真伪麻花秦艽样品的近红外光谱以及中红外光谱均进行全息多元散射校正和二阶导数校正处理,所获得的近红外多元散射校正全息指纹图谱和二阶导数校正指纹图谱,参见图5(b)和(c);所获的中红外多元散射校正全息指纹图谱和二阶导数校正指纹图谱,参见图6(b)和(c)。
3.对于真伪麻花秦艽样品进行虚拟的矢量编码,即伪品黑秦艽的每个训练样品编码为code=v1(1,0,0),则58个黑秦艽编码为一个矩阵I58×3;真品麻花秦艽的每个训练样品编码为code=v2(0,1,0),则267个麻花秦艽编码为一个矩阵I267×3;伪品红秦艽每个训练样品编码为code=v3(0,0,1),则55个红秦艽编码为一个矩阵I55×3
4.真伪麻花秦艽专属性指纹信息区间的获取及专属性模式训练模型的构建:
通过设置一个大小为w=40的窗口(其大小可取经验值范围为20-40之间任意窗口,其效果不受影响)在真伪麻花秦艽的380个训练样品的近红外或中红外多元散射校正全息指纹图谱和二阶导数校正指纹图谱数据中连续的滑动,获得系列子矩阵X380×3,运用偏最小二乘判别分析方法将其与图谱数据关联,且在每一个窗口位置,对所有训练集样本建立不同隐变量的偏最小二乘判别分析子模型,然后计算这一系列不同隐变量下偏最小二乘判别分析子模型训练的辨识残差,并对窗口作图,获取具有低的辨识残差和低维数模型的特征指纹信息区间,即得到真伪麻花秦艽全息校正光谱中所隐含的专属指纹特征信息的系列有用变量区间,最佳隐变量数由10-重交互验证确定为6。以此获得分类残差小的近红外多元散射校正谱的专属指纹特征信息区间(4040-4900nm、5650-5980nm)见图7(a1),以及二阶导数校正谱的专属指纹特征信息区间(4050-4580nm、4640-5020nm)见图7(a2)。获得的中红外多元散射校正谱的专属指纹特征信息区间(1220-1520nm、1650-1800nm)见图7(b1),以及二阶导数校正谱的专属指纹特征信息区间(1220-1520nm、1650-1800nm)见图7(b2)。以此获得对判别真伪麻花秦艽所存差异最为有利的专属性指纹信息区间。
5.专属性训练模式识别模型预测各真伪麻花秦艽;
将甄别得到的近红外或中红外专属指纹特征信息区间组合后与真伪麻花秦艽样品的虚拟编码类别矩阵间构建具有专属性特征的偏最小二乘判别分析模型,即:I380×3=X380×pRp×3;其中,p是提取得到的近红外或中红外差异性专属指纹特征信息区间所含的波长变量数,见表4。并由10-倍交互验证确定模型最优隐变量的数目均为6。然后,通过对所需预测的真伪麻花秦艽样品的响应信号矩阵X180×p和专属性模型回归得到的矩阵Rp×3之间建模获得未知样品类别矩阵I180×3,即:I180×3=X180×pRp×3。则可解析得到任意第j个真伪麻花秦艽样品的类别解码矢量v′中最大值所出现的第m个位置,从而预测和判定所预测的麻花秦艽的真伪。图8(a1)和8(a2)分别为专属性训练模式识别模型对真伪麻花秦艽近红外多元散射校正谱和二阶导数校正谱辨识的类别归属图。图8(b1)和8(b2)分别为专属性训练模式识别模型对真伪麻花秦艽中红外多元散射校正谱和二阶导数校正谱辨识的类别归属图。v1′代表22个伪品黑秦艽样品,v2′代表133个真品麻花秦艽,v3′代表25个伪品红秦艽样品。由图8(a1)和(a2)可见,对真伪麻花秦艽所有样品的解码矢量最大值均完全归类准确,判别正确率达100%。由图8(b1)和(b2)可见,对真伪麻花秦艽所有样品的解码矢量也均完全归类准确,判别正确率达到100%。结果列于表4。
表4专属性训练模式识别模型对180个真伪麻花秦艽样品预测结果
Figure BDA00002687658100101
实施例3:不同道地性小秦艽指纹信息的判别分析
主要仪器:AntarisⅡ傅立叶变换近红外光谱仪;FT-IR NICOLET6700傅立叶变换红外光谱仪。
1.不同道地性小秦艽近红外光谱和中红外光谱指纹信息采集
将来自6个不同产区的小秦艽分别经去泥沙、清洗干净,真空干燥2小时,用中药粉碎机粉碎后过200目筛,分别取各产区小秦艽样品置测量杯中,以金箔为参比,在4000-10000cm-1波数范围进行近红外全谱扫描,共收集了480个不同道地性的小秦艽样品的近红外光谱指纹信息,见图9(a);另取适量各产区小秦艽样品粉末2mg与200mg溴化钾混合研磨均匀、压片,经傅立叶变换红外光谱仪进行测定,也共收集了480个不同道地性的小秦艽样品的中红外光谱指纹信息,见图10(a);对于采集得到的近红外光谱和中红外光谱的数据集划分一致,均将480个不同道地性的小秦艽样品光谱随机分为325个训练样本和155个预测样本,其中各不同道地性小秦艽光谱标记信息具体参见表5。
表5不同道地性小秦艽样品光谱标记信息
Figure BDA00002687658100111
2.对不同道地性小秦艽样品的近红外光谱以及中红外光谱均进行全息多元散射校正和二阶导数校正处理,所获得的近红外多元散射校正全息指纹图谱和二阶导数校正指纹图谱,参见图9(b)和(c);所获的中红外多元散射校正全息指纹图谱和二阶导数校正指纹图谱,参见图10(b)和(c)。
3.对于6种不同道地性小秦艽样品进行虚拟的矢量编码,即将甘肃小秦艽的每个训练样品编码为code=v1(1,0,0,0,0,0),则58个甘肃小秦艽编码为一个矩阵I58×6;青海小秦艽的每个训练样品编码为code=v2(0,1,0,0,0,0),则52个青海小秦艽编码为一个矩阵I52×6;内蒙古北部小秦艽的每个训练样品编码为code=v3(0,0,1,0,0,0),则54个内蒙古北部小秦艽编码为一个矩阵I54×6;内蒙古南部小秦艽的每个训练样品编码为code=v4(0,0,0,1,0,0),则55个内蒙古南部小秦艽编码为一个矩阵I55×6;河北小秦艽的每个训练样品编码为code=v5(0,0,0,0,1,0),则56个河北小秦艽编码为一个矩阵I56×6;宁夏小秦艽的每个训练样品编码为code=v6(0,0,0,0,0,1),则50个宁夏小秦艽编码为一个矩阵I50×6
4.6种不同道地性小秦艽专属性指纹信息区间的获取及专属性模式训练模型的构建:
通过设置一个大小为w=40的窗口(其大小可取经验值范围为20-40之间任意窗口,其效果不受影响)在不同道地性小秦艽的325个训练样品的近红外或中红外多元散射校正全息指纹图谱和二阶导数校正指纹图谱数据中连续的滑动,获得系列子矩阵X325×6,运用偏最小二乘判别分析方法将其与图谱数据关联,且在每一个窗口位置,对所有训练集样本建立不同隐变量的偏最小二乘判别分析子模型,然后计算这一系列不同隐变量下偏最小二乘判别分析子模型训练的辨识残差,并对窗口作图,获取具有低的辨识残差和低维数模型的特征指纹信息区间,即得到不同道地性小秦艽全息校正光谱中所隐含的专属指纹特征信息的系列有用变量区间,最佳隐变量数由10-重交互验证确定为8。以此获得分类残差小的近红外多元散射校正谱的专属指纹特征信息区间(4000-4490nm、5000-5120nm、5880-6000nm)见图11(a1),以及二阶导数校正谱的专属指纹特征信息区间也为(4000-4490nm、5000-5120nm、5880-6000nm)见图11(a2)。获得的中红外多元散射校正谱的专属指纹特征信息区间(1400-1660nm)见图11(b1),以及二阶导数校正谱的专属指纹特征信息区间(1480-1680nm)见图11(b2)。以此方法获得的专属性指纹是对判别不同道地性小秦艽所存差异最为有利的信息区间。
5.专属性训练模式识别模型预测不同道地性小秦艽;
将甄别得到的近红外或中红外专属指纹特征信息区间组合后与6种不同道地性小秦艽样品的虚拟编码类别矩阵间构建具有专属性特征的偏最小二乘判别分析模型,即:I325×6=X325×pRp×6;其中,p是提取得到的近红外或中红外差异性专属指纹特征信息区间所含的波长变量数,见表4。并由10-倍交互验证确定模型最优隐变量的数目均为8。然后,通过对所需预测的不同道地性小秦艽样品的响应信号矩阵X155×p和专属性模型回归得到的矩阵Rp×6之间建模获得未知样品类别矩阵I155×6,即:I155×6=X155×pRp×6。则可解析得到任意第j个小秦艽样品的道地性类别解码矢量v′中最大值所出现的第m个位置,从而达到预测和判定所预测的小秦艽的不同道地性的目的。图12(a1)和12(a2)分别为专属性训练模式识别模型对6种不同道地性小秦艽近红外多元散射校正谱和二阶导数校正谱辨识的类别归属图。图12(b1)和12(b2)分别为专属性训练模式识别模型对6种不同道地性小秦艽中红外多元散射校正谱和二阶导数校正谱辨识的类别归属图。v1′为22个甘肃小秦艽;v2′为28个青海小秦艽,v3′为26个内蒙古北部小秦艽;v4′为25个内蒙古南部小秦艽,v5′为24个河北小秦艽,v6′为30个宁夏小秦艽。由图12(a1)和(a2)可见,对六种不同道地性小秦艽样品的解码矢量均完全归类准确,判别正确率达100%。由图12(b1)和(b2)可见,对六种不同道地性小秦艽样品的解码矢量也均完全归类准确,判别正确率达到100%。结果列于表6。
表6专属性训练模式识别模型对155个不同道地性小秦艽预测结果
Figure BDA00002687658100131

Claims (7)

1.一种专属性模式识别模型判别分析中药材资源指纹信息的方法,其特征在于,按如下步骤进行:
(1)中药材样品的制备;
(2)中药材近红外和中红外光谱全息指纹图谱的获取与光谱预处理校正;
(3)对中药材资源进行虚拟的矩阵编码;
(4)中药材质量控制专属性模式识别训练模型的构建;
(5)专属性训练模型对中药材资源的辨识与判断。
2.如权利要求1所述的方法,其特征在于步骤(1)中药材样品的制备过程为去泥沙、清洗干净,真空干燥后,用中药粉碎机粉碎过目筛,获取可分析的中药材样品。
3.如权利要求1所述的方法,其特征在于步骤(2)中中药材样品的近红外指纹图谱的获取是以金箔为参比进行近红外光谱全波段扫描;中红外指纹图谱的获取为将中药材样品与适量溴化钾混合后压片,进行中红外全波段扫描,并对全息中红外和近红外指纹图谱进行多元散射校正和/或通过二阶导数校正,获取中药材全息得以增强的校正指纹信息。
4.如权利要求1所述的方法,其特征在于步骤(3)中对中药材资源进行虚拟的矩阵编码,是通过将用于训练模型的中药材资源进行虚拟编码,每一行代表一个样品,将其虚拟编码为矢量code=vj,其编码原则为第j个元素为1,其余元素均为0,由此,将用于训练模型的不同类中药材资源编码为一个矩阵In×m,该矩阵的行数等于建模所用的中药材资源训练样本数n,列数等于均中药材资源不同类别数m。
5.如权利要求1所述的方法,其特征在于步骤(4)中对中药材质量控制专属性模式识别训练模型的构建,通过设置一个以指纹校正图谱中第一个光谱数据点为起点、大小取值在20至40间的任意窗口连续地在中药材各训练样本集的全息近红外或中红外的校正指纹图谱数据中滑动,连续滑动的窗口中的光谱作为n个训练样本的响应信号矩阵Xn×p的子矩阵Xn×w,运用偏最小二乘判别分析方法将滑动的窗口中的中药材训练集近红外或中红外的指纹校正图谱数据与编码的中药材资源的类别训练矩阵In×m关联,且在每一个窗口位置,对所有训练集样本建立不同隐变量的偏最小二乘判别分析子模型:
In×m,t=Xn×w,tRw×m,t+En×m,t
其中,In×m,t是t个隐变量的偏最小二乘判别分析模型的类别训练矩阵,Rw×m,t是t个隐变量的偏最小二乘判别分析模型的回归系数矩阵,En×m,t为残差矩阵;
计算这一系列不同隐变量下偏最小二乘判别分析子模型的分类残差,并对窗口作图,获取具有低的分类残差和低维数模型的特征指纹信息区间,甄别得到中药材全息校正光谱中所隐含的专属指纹特征信息的系列有用变量区间,并将其组合后与中药材资源的虚拟编码类别矩阵间构建具有专属性特征的偏最小二乘判别分析模型,即:In×m=Xn×pRp×m;其中,p是提取得到的差异性专属指纹特征信息区间所含的波长数,m是类别数,In×m为中药材资源的类别训练矩阵,Xn×p为获得的专属性特征信息矩阵,Rp×m为回归矩阵;模型对In×m的每一列对获得的专属性特征信息矩阵Xn×p进行PLS1回归,回归矩阵Rp×m的每一列为PLS1的回归系数量,最佳隐变量数由n-重交互验证确定。
6.如权利要求1所述的方法,其特征在于步骤(5)中专属性训练模式识别模型对中药材资源的辨识与判断,是通过对辨识和判别的未知中药材资源样品的类别矩阵Iun进行解码,获知未知的任意第j个样品的类别解码矢量中最大值所出现的第m个位置,从而判定中药材资源的类别属性。
7.如权利要求6所述的方法,其特征在于步骤(5)中未知样品类别矩阵Iun的解码的获得计算如下:通过未知样品的响应信号矩阵Xun和专属性模型回归得到的矩阵Rp×m之间建模获得未知样品类别矩阵Iun的解码,即:Iun=XunRp×m,Mj=Mj=decodemax(v′j..);其中,Mj为第j个样品的类别,decodemax(v′j..)表示某个所需预测判别的未知中药材样品解码矢量v′j最大元素的位置。
CN201210593100.0A 2012-12-31 2012-12-31 专属性模式识别模型判别分析中药材资源指纹信息的方法 Active CN103076300B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210593100.0A CN103076300B (zh) 2012-12-31 2012-12-31 专属性模式识别模型判别分析中药材资源指纹信息的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210593100.0A CN103076300B (zh) 2012-12-31 2012-12-31 专属性模式识别模型判别分析中药材资源指纹信息的方法

Publications (2)

Publication Number Publication Date
CN103076300A true CN103076300A (zh) 2013-05-01
CN103076300B CN103076300B (zh) 2015-03-04

Family

ID=48152903

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210593100.0A Active CN103076300B (zh) 2012-12-31 2012-12-31 专属性模式识别模型判别分析中药材资源指纹信息的方法

Country Status (1)

Country Link
CN (1) CN103076300B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105203362A (zh) * 2015-10-20 2015-12-30 安徽中医药大学 一种快速鉴别霍山石斛的方法
CN105223164A (zh) * 2015-08-04 2016-01-06 内蒙古农业大学 鉴别荞麦或燕麦粉掺假小麦粉的方法及系统
CN106501210A (zh) * 2016-11-01 2017-03-15 合肥齐赢网络技术有限公司 一种基于近红外光谱的物质成分检测系统
CN116908138A (zh) * 2023-07-13 2023-10-20 中南民族大学 植物类中药的四气量化表征方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1447110A (zh) * 2003-04-26 2003-10-08 清华大学 中药药材红外光谱非分离提取多级宏观指纹鉴定方法
CN1602830A (zh) * 2004-11-09 2005-04-06 清华大学 一种对中药生产工艺进行实时监控的方法
CN101485805A (zh) * 2009-02-27 2009-07-22 中南民族大学 六味地黄丸近红外全息指纹图谱的质量控制方法
US7840359B2 (en) * 2000-03-10 2010-11-23 Smiths Detection Inc. Measuring and analyzing multi-dimensional sensory information for identification purposes

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7840359B2 (en) * 2000-03-10 2010-11-23 Smiths Detection Inc. Measuring and analyzing multi-dimensional sensory information for identification purposes
CN1447110A (zh) * 2003-04-26 2003-10-08 清华大学 中药药材红外光谱非分离提取多级宏观指纹鉴定方法
CN1602830A (zh) * 2004-11-09 2005-04-06 清华大学 一种对中药生产工艺进行实时监控的方法
CN101485805A (zh) * 2009-02-27 2009-07-22 中南民族大学 六味地黄丸近红外全息指纹图谱的质量控制方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HAI-YAN FU等: "《Construction of an efficacious model for a nondestructive identification of traditional Chinese medicines Liuwei Dihuang pills from different manufacturers using near-infrared spectroscopy and moving window partial least-squares discriminant analysis》", 《ANALYTICAL SCIENCES》, vol. 25, 10 September 2009 (2009-09-10) *
付海燕: "《化学模式识别和多维校正方法及其在复杂体系分析中的应用研究》", 《万方学位论文全文数据库》, 28 September 2011 (2011-09-28), pages 1 - 47 *
张立国: "《基础化学计量学及其应用》", 31 July 2011, article "《第8章 化学模式识别及其应用》", pages: 315-320 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105223164A (zh) * 2015-08-04 2016-01-06 内蒙古农业大学 鉴别荞麦或燕麦粉掺假小麦粉的方法及系统
CN105223164B (zh) * 2015-08-04 2017-11-07 内蒙古农业大学 鉴别荞麦或燕麦粉掺假小麦粉的方法及系统
CN105203362A (zh) * 2015-10-20 2015-12-30 安徽中医药大学 一种快速鉴别霍山石斛的方法
CN105203362B (zh) * 2015-10-20 2018-07-06 安徽中医药大学 一种快速鉴别霍山石斛的方法
CN106501210A (zh) * 2016-11-01 2017-03-15 合肥齐赢网络技术有限公司 一种基于近红外光谱的物质成分检测系统
CN116908138A (zh) * 2023-07-13 2023-10-20 中南民族大学 植物类中药的四气量化表征方法
CN116908138B (zh) * 2023-07-13 2024-02-06 中南民族大学 植物类中药的四气量化表征方法

Also Published As

Publication number Publication date
CN103076300B (zh) 2015-03-04

Similar Documents

Publication Publication Date Title
CN110514611B (zh) 一种基于药效信息建立评价中药质量的化学模式识别方法
CN101961379B (zh) 丹参的近红外光谱鉴别方法
CN101961360B (zh) 三七的近红外光谱鉴别方法
CN109870421A (zh) 一种基于可见光/近红外光谱分析的递增式木材树种分类识别方法
CN108072626A (zh) 一种沥青品牌识别方法
CN102288551A (zh) 利用高光谱数据鉴别中药材的方法
CN103076300B (zh) 专属性模式识别模型判别分析中药材资源指纹信息的方法
CN111007032B (zh) 一种快速无损鉴别甘草及其伪品刺果甘草的近红外光谱法
CN102937575B (zh) 一种基于二次光谱重组的西瓜糖度快速建模方法
CN103411906A (zh) 珍珠粉和贝壳粉的近红外光谱定性鉴别方法
CN107478595A (zh) 一种快速鉴别珍珠粉真伪及定量预测掺伪贝壳粉含量的方法
CN104345045A (zh) 一种基于化学模式识别和近红外光谱的相似药材鉴别方法
CN103743705A (zh) 一种假高粱及其近似物种的快速检测方法
CN103411895A (zh) 珍珠粉掺伪的近红外光谱鉴别方法
CN105223140A (zh) 同源物质的快速识别方法
CN113655027A (zh) 一种近红外快速检测植物中单宁含量的方法
CN111398208B (zh) 一种利用近红外技术对传统工艺翡翠进行快速鉴定的方法
CN113176227A (zh) 一种快速预测河南石斛掺伪霍山石斛的方法
CN105334183A (zh) 一种基于近红外光谱鉴别法定麻黄药材的方法
AU2018101606A4 (en) A method for identifying meconopsis quintuplinervia regel from different geographical origins
CN113744075A (zh) 一种基于人工智能的农产品营养品质等级划分系统
CN102890062A (zh) 一种远红外功能纤维的鉴别方法
CN113191618A (zh) 一种基于中红外光谱技术及特征提取的小米产地溯源方法
CN116429718B (zh) 一种不同采收月份唐古特大黄药材的多元红外光谱判别方法、系统、存储介质及终端
Lu et al. Classification of fir seeds based on feature selection and near-infrared spectroscopy

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190920

Address after: 430074 No. 182 National Road, Hongshan District, Hubei, Wuhan

Patentee after: South-Central University for Nationalities

Address before: 430075 666 hi tech Avenue, East Lake New Technology Development Zone, Wuhan, Hubei

Patentee before: Wuhan Xinfang Biological Technology Co., Ltd.