CN103411912A - 一种利用THz-TDS结合模糊规则专家系统鉴定中草药的方法 - Google Patents

一种利用THz-TDS结合模糊规则专家系统鉴定中草药的方法 Download PDF

Info

Publication number
CN103411912A
CN103411912A CN2013101924939A CN201310192493A CN103411912A CN 103411912 A CN103411912 A CN 103411912A CN 2013101924939 A CN2013101924939 A CN 2013101924939A CN 201310192493 A CN201310192493 A CN 201310192493A CN 103411912 A CN103411912 A CN 103411912A
Authority
CN
China
Prior art keywords
sample
chinese herbal
herbal medicine
thz
tds
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2013101924939A
Other languages
English (en)
Inventor
张卓勇
汪景荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Capital Normal University
Original Assignee
Capital Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Capital Normal University filed Critical Capital Normal University
Priority to CN2013101924939A priority Critical patent/CN103411912A/zh
Publication of CN103411912A publication Critical patent/CN103411912A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明涉及一种利用THz-TDS结合模糊规则专家系统鉴定中草药的方法,主要包括如下步骤:利用THz-TDS对中草药样品进行检测,得到太赫兹时域光谱,对所述太赫兹时域光谱进行预处理,并将所述太赫兹时域光谱进行划分得到所述训练集样本和所述验证集样本;所述训练集样本和所述验证集样本采用模糊规则专家系统建立定性分析模型,以对中草药样品进行鉴定。本发明方法简便、无污染,并易于实现自动化,能够快速准确地对中草药进行无损鉴别,适用于中草药生产过程中的质量控制。

Description

一种利用THz-TDS结合模糊规则专家系统鉴定中草药的方法
技术领域
本发明涉及一种利用THz-TDS结合模糊规则专家系统鉴定中草药的方法,属于中草药的鉴定与分析技术领域。
背景技术
随着中医及中药理论逐渐走出国门为世界所关注,人们对中医及中药原理的探索欲望越来越强烈,研究手段也逐渐丰富。但是随之也出现了越来越多的伪劣中草药产品充斥于市场中,不仅影响治疗效果也成为中医中药进一步发展的制约。近年来,随着生产实际需要的增长和现代科学的迅速发展,对中草药的鉴别手段也日臻完善,主要集中于研究中草药的鉴别特征和化学成分,并以此鉴定中草药的真伪及优劣,进而确保中草药的疗效及病人的用药安全。目前,对于中草药的鉴别,较多采用中药指纹图谱技术以实现快速、准确鉴定中草药的目的。中药指纹图谱技术是一种以分析手段标出中药特性共有峰的技术,包括各种色谱、光谱技术以及基因指纹图谱技术。但上述各种中草药指纹图谱技术都需对样品进行浸渍、分离、浓缩等预处理,分析时间长,操作繁琐,且检测结束后,药材不能再用,因此,上述指纹图谱技术只适于对中草药进行抽查检测。
随着研究的深入及广泛,有些中草药的有效成分和分子结构已经全部或部分地研究清楚,然而还有更多成分复杂的中草药,其有效成分和分子结构还在研究中,然而采用现有技术难以对上述中草药进行有效鉴定。其中,对大黄的真伪鉴别更成为中草药鉴别领域的难点及研究热点。
大黄,具体指蓼科植物,是一种成分部分未知且组成极为复杂的中草药,从而对大黄的鉴定一直是业界内人士公认的难题。其中,药典收录了三种正品大黄,包括掌叶大黄、唐古特大黄和药用大黄,上述三种正品大黄的干燥根及根茎,性寒味苦,具有泻下攻积、清热泻火、凉血解毒、逐瘀通经、利湿退黄的功效。近年来,随着大黄的广泛应用,市面上出现了将华北大黄、藏边大黄、河套大黄等伪品大黄的根和根茎混入正品大黄中的情况,但这些伪品大黄的泻下作用远不及正品大黄,有些甚至可能会引起腹痛。但是,现有技术中广泛使用的鉴别方法却无法实现对真伪大黄的鉴别,也成为了中医用药上的困扰。
太赫兹辐射(也称“THz辐射”)是指频率在0.1THz-10THz,波长在0.03-3mm之间的电磁波,其波段位于微波和红外线之间,是宏观电子学向微观光子学过渡的区域,在电磁波频谱中占有很特殊的位置。现有技术中已逐渐开发出利用太赫兹辐射以鉴别中草药的方法。与其他方法相比,将THz辐射用于中草药研究具有以下优点:(1)大多数中草药所含生物大分子的低频振动或转动模式处在THz波段,因此不同中草药有相应的特征谱,可以有效区别各种中草药成分;(2)THz辐射的光子能量较低,不会对中草药产生有害的电离辐射,鉴别后的中草药依然可以使用;(3)THz辐射具有相干性,能够直接测量电场的振幅和相位,可以方便地提取中草药样品的折射率和吸收系数,而红外光谱只能得到某一频率光的强度信息;(4)THz辐射脉冲宽度在皮秒到飞秒量级,可以对中草药进行时间分辨的瞬态光谱研究,而且通过采样测量技术,能有效抑制背景辐射的干扰,得到信噪比很高的时域谱。
基于此,中国专利CN1614391A公开了一种对中草药真伪及质量鉴别的快速无损分析方法,其包括以下步骤:(1)利用THz-TDS装置分别测定已知和待测中草药的THz-TDS光谱图,经过傅里叶变换,再对纵坐标取对数,得到中草药的指纹吸收图谱;(2)对比上述中草药的指纹吸收图谱,相同波段的指纹吸收峰图谱相近,则待测中草药为真药材;吸收峰弱,则待测中草药中化学组分含量减少;若图谱不同,则判为假药材。上述分析方法利用中草药样品中有效成分的指纹图谱进行快速、无损地检测与鉴别,但该方法的鉴别是依赖于已经建立的中草药的指纹吸收图谱,但是对于诸多的没有明显特征指纹图谱的中草药样品尤其是特征指纹图谱极其不易辨识的大黄而言,则并不适用。
中国专利文献CN102590135A公开了一种基于最小二乘支持向量机的除草剂鉴别方法,主要包括以下步骤:首先应用太赫兹时域光谱系统对训练样品集进行检测,获得太赫兹时域光谱;然后经傅里叶变换和太赫兹光学参数提取模型,计算吸收系数谱,并利用偏二小乘法提取有效特征向量,以有效特征向量为基础建立除草剂鉴别模型数据库;再利用太赫兹时域光谱系统检测验证样品集,得到太赫兹时域光谱,然后经傅里叶变换和太赫兹光学参数提取模型,计算吸收系数谱,并利用偏最小二乘法提取有效特征向量,最后调用已经建立的除草剂鉴别模型数据库,利用最小二乘支持向量机确定验证样品集的类别。上述方法中利用THz-TDS光谱结合化学计量学方法完成了对除草剂的快速、准确的鉴别,但是由于除草剂本身是由几种已知的化合物组成,其不仅成分简单,且鉴别目标物质特征清晰,这与中草药成分复杂且成分未知的特性大相径庭,因此,对于成分复杂且未知的中草药尤其是大黄而言,上述方法依然难以实现样品的鉴别与分析;此外,上述方法测量得到样品的太赫兹时域光谱,需要经傅里叶变换和太赫兹光学参数提取模型,从而计算得到样品的吸收系数谱,再将样品的吸收系数谱采用最小二乘支持向量机方法建立定性分析模型,进而才能进行后续数据处理以完成样品的鉴别分析,由此可见,上述方法不仅信息处理过程复杂耗时,不易实现方法的程序自动化,并且利用吸收系数谱建立模型时,由于样品参数提取方法的不成熟,将会导致鉴定误差较大。
发明内容
本发明所要解决的技术问题是现有技术中利用THz-TDS结合最小二乘支持向量机不仅难以实现对成分复杂且未知的中草药的鉴别与分析,而且样品的太赫兹时域光谱须转换成吸收系数谱才能进行后续数据处理及分析,从而信息处理过程复杂耗时,鉴定误差较大的问题,进而提供一种利用THz-TDS结合模糊规则专家系统快速、准确、简易的鉴定中草药尤其是鉴别大黄真伪的方法。
为解决上述技术问题,本发明所述利用THz-TDS结合模糊规则专家系统鉴定中草药的方法,其技术方案为:
一种利用THz-TDS结合模糊规则专家系统鉴定中草药的方法,其包括如下步骤:
(1)利用THz-TDS光谱仪对中草药样品进行测试,得到太赫兹时域光谱;
(2)对所述太赫兹时域光谱进行预处理,并将所述太赫兹时域光谱进行划分得到训练集样本和验证集样本;
(3)所述训练集样本和所述验证集样本采用模糊规则专家系统建立定性分析模型,以对中草药样品进行鉴定;具体步骤包括:调整由光谱数据得到的一个初始权重向量,以使分类熵H(C|A)最小化;模拟温度值决定熵值,通过控制模拟温度值使得熵的一阶导数最大化,以实现分类熵的梯度优化;并由此得到训练集样本的分类规则集,再利用所述分类规则集对未知样本进行判断识别;
所述模糊规则专家系统通过梯度优化法寻求分类器的最小分类熵,并运用多叉决策树分类算法使分类熵H(C|A)最小化,建立对样本进行分类的最小生成树;
所述决策树是一个类似于流程图的树结构:内部节点(非树叶节点)表示在一个属性上的测试,每个分枝代表一个测试输出,而每个叶节点(或终节点)存放一个类标号,位于树的最顶层节点是根节点,它包含了整个数据集合空间,被看作是一棵树型的预测模型,每个内部节点是一个分裂问题,它是对一个单一变量的测试,该测试将数据集合空间分割成两个或更多部分,得出的测试结论标记在叶节点,则每个叶节点是带有分类的数据分割,决策树也可解释成一种特殊形式的规则集,其特征是规则的层次组织关系;
所述模糊规则专家系统基于局部处理构建一个分类树,所述分类树的每个规则都是温度控制的符号逻辑函数,而所述温度是通过对权重矢量归一化得到的模拟温度;熵是描述系统信息的参数,所述模糊熵将模糊理论引入熵的计算,相关逻辑函数表示如下:
C A ( x k ) = ( 1 + e - ( x k w - a ) / t ) - 1 - - - ( a )
其中,xk为对象集,w为权重向量,a为偏差值,t为计算温度。
p ( c i | a j ) = Σ k = 1 n i x A ( x k ) / Σ k = 1 n x A ( x k ) - - - ( b )
选择测试属性aj进行测试,xA表示对xk模糊数据集的隶属度,ni为i类样本的个数,每个ci代表一类,则样本集在属性aj时隶属于模糊数据集的i类的条件概率为p(ci|aj),而属性aj生成的熵值H(C|aj),如公式(c)所示:
H ( C | a j ) = - Σ i = 1 n p ( c i | a j ) ln [ p ( c i | a j ) ] - - - ( c )
各属性的熵值加权求和得系统的分类熵H(C|A),如公式(d)所示:
H ( C | A ) = Σ j = 1 2 p ( a j ) H ( C | a j ) - - - ( d )
其中,2代表属性总数,p(aj)表示具有属性aj样本的条件概率。
所述中草药为大黄。
在所述步骤(2)中,对所述太赫兹时域光谱进行预处理的方法包括Savitzky-Golay(S-G)平滑处理、S-G一阶导数处理、S-G二阶导数处理、自动调整、变量标准化(SNV)、多元散射校正(MSC)、加强正交信号校正(EOSC)、主成分正交信号校正(PC-OSC)等方法中的一种或几种的组合。并优选加强正交信号校正(EOSC)、主成分正交信号校正(PC-OSC)方法进行处理。
在所述步骤(2)中,利用自助拉丁配分法对所述太赫兹时域光谱进行划分得到所述训练集样本和所述验证集样本。
利用所述自助拉丁配分法进行划分时选择配分数为4,取其中3/4作为训练集样本,1/4作为验证集样本。
利用所述自助拉丁配分法进行划分时,重复配分计算10次。
所述步骤(1)中,所述THz-TDS的测试条件为:25℃时,以氮气作为参考,光谱仪扫描系统的步进电机扫描区间为24.6-27.6mm,步长为0.01mm。
所述中草药样品为薄片或粉末状。
所述步骤(2)中,利用S-G一阶导数结合EOSC进行预处理,并选取所述自助拉丁配分法的校正主因子数为11。
所述步骤(2)中,利用S-G一阶导数结合PC-OSC进行预处理,并选取所述自助拉丁配分法的校正主因子数为5。
本发明的上述技术方案相比现有技术具有以下优点:
(1)本发明所述的利用THz-TDS结合模糊规则专家系统鉴定中草药的方法,利用THz-TDS光谱仪对中草药样品进行测试,得到太赫兹时域光谱后,不需专门设置傅里叶变换和参数提取的步骤,直接将测量得到的样品太赫兹时域光谱进行预处理,接着进行划分得到所述训练集样本和所述验证集样本,所述训练集样本和所述验证集样本即可采用模糊规则专家系统建立定性分析模型,从而完成对中草药样品的鉴定与分析;相对于现有技术中采用太赫兹时域光谱对样品检测后还需要经傅里叶变换和太赫兹光学参数提取模型得到样品的吸收系数谱后,再利用吸收系数谱建立定性分析模型,才能进行后续数据处理以完成样品的鉴别分析的方法而言,完全解决了由于信息处理过程复杂耗时,难以实现方法的自动化,并且导致在利用吸收系数谱建立模型时,由于样品参数提取方法不成熟,而使得鉴定误差较大的技术难题。本发明所采用的模糊规则专家系统(FuRES)是基于模糊数学对于模糊集的划分理论,产生模糊规则,从而实现知识诊断的程序系统;所述FuRES将不确定性的专家经验以模糊子集的知识表示方式存储在知识库中,同时采用模糊近似匹配规则的模糊推理过程,以实现快速的不确定性的模糊推理,从而本发明利用THz-TDS结合模糊规则专家系统鉴定中草药尤其是鉴定难度较高的大黄时,不需要将样品的太赫兹时域光谱转换为吸收系数谱,就可以直接用于进行后面数据的分析鉴定,不仅处理过程简便,鉴定正确率高,且容易实现方法的自动化;
(2)本发明所述的利用THz-TDS结合模糊规则专家系统鉴定中草药的方法,利用自助拉丁配分法(Bootstrappd Latin-Partitions)对所述训练集和所述验证集样本进行划分,实现对分类模型预测能力和稳定性的评价,由于所述自助拉丁配分法是一种建立在交叉验证和随机抽样验证基础上的模型验证方法,利用自助拉丁配分能够实现均匀的随机抽样验证,每实施一次,每个样本用于且仅用于一次预测,确保了真伪中草药样本在训练集和验证集中以同样的比例出现,从而实现对所建模型预测能力的无偏评价,使鉴定模型更可靠,分析结果更具有统计学意义;
(3)本发明采用所述自助拉丁配分法在太赫兹时域光谱中进行划分时,选择3/4作为训练集样本时域谱,1/4作为验证集样本时域谱,重复配分计算10次,这样设置可避免单次建模中选择样本不同而造成的失真,利用自助拉丁配分划分训练集和验证集样本使得到的模型更可靠;
(4)本发明所述的利用THz-TDS结合模糊规则专家系统鉴定中草药的方法,其步骤(2)中对所述太赫兹时域光谱进行预处理的方法包括Savitzky-Golay(S-G)平滑处理、S-G一阶导数、S-G二阶导数、自动调整、变量标准化(SNV)、多元散射校正(MSC)、加强正交信号校正(EOSC)、主成分正交信号校正(PC-OSC)中的一种或几种的组合,设置所述预处理步骤的目的是为了滤除背景和噪声,提高鉴定正确率;其中,作为优选的实施方式,利用S-G一阶导数结合EOSC进行预处理,同时采用自助拉丁配分法来选取校正因子数,当校正主因子数为11时,鉴定正确率达到最大,为94.84±0.48%;利用S-G一阶导数结合PC-OSC进行预处理,同时采用自助拉丁配分法来选取校正主因子数,当校正主因子数为5时,鉴定正确率达到最大,为95.16±0.09%。
附图说明
为了使本发明的内容更容易被清楚的理解,下面结合附图,对本发明作进一步详细的说明。其中:
图1为实施例1所述大黄样品的鉴定正确率与校正主因子数的关系图;
图2为实施例2所述大黄样品的鉴定正确率与校正主因子数的关系图。
具体实施方式:
实施例1
本实施例利用THz-TDS结合模糊规则专家系统对大黄的进行鉴定,其中采用Savitzky-Golay(S-G)一阶导数结合EOSC方法对所述时域谱进行预处理,其包括步骤如下:
(1)采用北京同仁堂股份公司科学研究所提供41个大黄样品来建立模型,其中17个为正品大黄,24个为非正品大黄;41个大黄样品的制备方法完全相同,每个大黄样品的制备步骤为:(a)将所述大黄样品经干燥后粉碎成60目的粉末;(b)所述粉末再次进行真空干燥后,取一定量样品转移至玛瑙研钵中进行研磨得到细粉;(c)最后,在6.5t的压力下将所述细粉制成直径13mm、厚度0.9-1.2mm的薄片作为待测大黄样品,所述薄片两表面平行、表面光滑且没有裂缝;将所述薄片在保证能够区分正品和非正品的前提下,依次进行编号为1-41,待测;
(2)利用Z-3透射式THz-TDS系统(Zomiga公司),MVDS-400controller配套软件,室温(25℃)下,以氮气作为参考,测量得到所述编号1-41的待测大黄样品的太赫兹时域光谱;太赫兹光谱测量通常在1-10THz(0.03-3mm)范围内进行;本实施例中使用的Z-3THz-TDS系统的频率范围是0.1-3.0THz;在实验中使用的太赫兹光谱扫描系统的步进电机扫描区间为24.6-27.6mm,步长为0.01mm。测量时先需要测量参考的THz时域光谱信号,接着移动样品的位置,每个样品先后取3个不同的点进行测定,最后取样品的THz时域光谱信号的平均值用于后续分析;
(3)采用S-G一阶导数结合EOSC方法对所述编号1-41的大黄样品的太赫兹时域光谱信号进行预处理。具体处理如下:首先,将大黄样品的太赫兹时域光谱信号进行S-G一阶导数处理;接着,选择不同的校正主因子数,使用EOSC方法对大黄样品的时域谱进行预处理;
所述EOSC方法是消除THz-TDS光谱中噪声和其它无关信号的重要步骤,具体如下:
1)EOSC方法的核心基于如下的关系:
M = ( Y - Y ‾ ) T ( X - X ‾ ) - - - ( 1 )
B=null(M)        (2)
Q = ( X - X ‾ ) B - - - ( 3 )
其中,所述M是协方差矩阵,所述X是测试得到的数据矩阵,即所述训练集样本和所述验证集样本时域谱的数据矩阵,所述
Figure BDA00003230733500092
是平均数据矩阵,所述Y是以二进制编码表示的输出矩阵,所述
Figure BDA00003230733500093
是平均二进制编码矩阵,所述B是所述协方差矩阵M的零空间矩阵,所述B是由M的最小的p-k个特征值对应的特征向量组成的p×(p-k)维变换矩阵,所述Q是由B张成的子空间,所述Q也是与Y正交的子空间。由于所述B空间和M是互补空间,则B空间包含全空间中除M之外的余秩。矩阵B的信息将要从X中剔除掉,也就是说所述子空间B包含了背景噪声;Q在这里则充当了沟通零空间和光谱数据的一个桥梁;验证集中的背景噪声同样存在于B空间中,但是,在验证集中的背景噪声的波动会和训练集中有所区别;
2)对Q进行奇异值分解,得到下面的关系:
Q=USVT              (4)
其中,所述U是一个行矩阵,V是一个列矩阵,S是以Q的奇异值为对角元素的对角矩阵,所述关系式(4)用于计算伪逆的成分数,决定了对数据的校正程度,其目的是通过奇异值分解找到一个转换矩阵,用于校正样本;
D = I p - BV S - 1 U T ( X - X ‾ ) - - - ( 5 )
X ^ = ( X - X ‾ ) D - - - ( 6 )
其中
Figure BDA00003230733500096
是经过加强正交信号校正法校正后的数据,矩阵D是要寻找的转换矩阵;所述IP是指维数为p的单位矩阵;
对于验证集的样本:
X ^ prediction = ( X prediction - X ‾ training ) D training - - - ( 7 )
其中
Figure BDA00003230733500098
是经过加强正交信号校正法校正过的验证集样本;
在太赫兹光谱测量中,所测得的信号是各种信号的混杂系统,采用现有光谱预处理方法直接进行信号预处理很难将有用信号有效提取出来;所述加强正交信号校正通过利用变量变换使测量光谱从测量空间变换到一个正交空间,基于在正交空间中有用信号与噪声和其它无关信号正交的基本思想,通过正交计算保留有用信息,去除噪声和其它无关信息,从而,采用正交信号校正相较于现有光谱预处理方法具有更高的鉴定准确率;
(4)经过预处理后,采用自助拉丁配分法对大黄样品的太赫兹时域光谱进行划分,选择配分数为4,取其中3/4作为训练集样本,1/4作为验证集样本,具体为:首先将待测样本分为4份,选择其中1份作为验证集样本,其余3份作为训练集样本,重复配分10次,即重复此过程10次;需要说明的是,在每次计算中,每个样本仅用于一次预测验证;
(5)所述训练集样本和所述验证集样本采用模糊规则专家系统建立定性分析模型,以对中草药样品进行鉴定;
所述模糊规则产生的具体算法为多叉树算法(Interative DicremiserVersion3,ID3),是一种基于信息论的决策树分类算法,该算法以信息论为基础,以信息熵和信息增益度为衡量标准,从而实现对数据的归纳分类,其核心是在生成决策树时使用信息增益(即平均互信息量)作为训练样本集合的分裂度量标准;
所述模糊规则专家系统(即FuRES)可被类似地看作一个人工神经网络,通过梯度优化法寻求分类器的最小分类熵,因分类器的决策过程类似树状,因此有时也称为分类树或决策树。运用所述多叉决策树分类算法(ID算法)通过使分类熵H(C|A)最小化,建立最小生成树;所述决策树是一个类似于流程图的树结构:内部节点(非树叶节点)表示在一个属性上的测试,每个分枝代表一个测试输出,而每个叶节点(或终节点)存放一个类标号,位于树的最顶层节点是根节点,它包含了整个数据集合空间,被看作是一棵树型的预测模型,每个内部节点是一个分裂问题,它是对一个单一变量的测试,该测试将数据集合空间分割成两个或更多部分,得出的测试结论标记在叶节点,则每个叶节点是带有分类的数据分割,所述决策树也可解释成一种特殊形式的规则集,其特征是规则的层次组织关系;所述FuRES基于局部处理构建一个上述分类树,所述分类树的每个规则是一个温度控制的logistic函数,而所述温度是通过对权重矢量归一化得到的模拟温度,模糊熵将模糊理论引入熵的计算,所述模糊熵的计算引入了Shannon的信息论,相关逻辑函数表示如下:
C A ( x k ) = ( 1 + e - ( x k w - a ) / t ) - 1 - - - ( a )
其中,xk为对象集,w为权重向量,a为偏差值,t为计算温度。
p ( c i | a j ) = Σ k = 1 n i x A ( x k ) / Σ k = 1 n x A ( x k ) - - - ( b )
选择测试属性aj进行测试,xA表示对xk模糊集的隶属度,ni为i类样本的个数,每个ci代表一类,则样本集在属性aj时隶属于模糊集的i类的条件概率为p(ci|aj),而属性aj生成的熵值H(C|aj),如公式(c)所示:
H ( C | a j ) = - Σ i = 1 n p ( c i | a j ) ln [ p ( c i | a j ) ] - - - ( c )
各属性的熵值加权求和可得系统的分类熵H(C|A),如公式(d)所示:
H ( C | A ) = Σ j = 1 2 p ( a j ) H ( C | a j ) - - - ( d )
其中,2代表属性总数,p(aj)表示具有属性aj样本的条件概率;
所述模糊规则应用于THz时域光谱进行分类判别算法如下:调整由光谱数据得到的一个初始权重向量,以使分类熵H(C|A)最小化;模拟温度值决定熵值,控制模拟温度值t,以使熵的一阶导数最大化,从而实现分类熵的梯度优化;由此得到训练集样本的分类规则集,再利用所述分类规则集对未知样本的判断识别,这个过程完成了模糊规则专家系统的构建,并且实现了系统诊断识别的功能。
本实施例采用自助拉丁配分法进行划分、S-G一阶导数结合EOSC方法对原始时域谱进行预处理后,采用模糊规则专家系统建立定性分析模型,以对中草药样品进行鉴定,计算并得到不同校正主因子数下的鉴定正确率(也称“预测正确率”)。如图1所示为本实施例大黄样品的鉴定正确率与校正主因子数的关系图,其中,实线显示了实际测量的鉴定正确率随校正主因子数的变化情况,虚线显示了置信度为95%时得到的鉴定正确率置信区间。从图中可见,当校正主因子数为11时,鉴定正确率最大为94.84±0.48%。
所述鉴定正确率的计算方法为:在大黄样品建模和鉴定中,首先指定正品大黄样品的期望输出向量为[1 0],非正品大黄样品的期望输出向量为[01],如果正品大黄的计算输出向量在误差范围内与期望输出向量[1 0]相一致,则认为鉴定正确,否则认为鉴定错误;同理,如果非正品大黄的计算输出向量与期望输出向量[0 1]相一致,即认为鉴定正确,否则为鉴定错误。每次采用自助拉丁配分法进行划分后计算其鉴定正确率,重复配分10次后共计算10次并取平均值作为最终的鉴定正确率。
如表1所示为本实施例采用S-G一阶导数结合EOSC方法对所述时域谱进行预处理,在校正因子数为11时,鉴定正确率的相关数据。所述鉴定正确率按照下式计算:鉴定正确率(%)=鉴定结果正确样品数/鉴定样品总数×100%。
表1用S-G一阶导数结合EOSC方法进行预处理后的结果(主因子数=11)
Figure BDA00003230733500121
实施例2
本实施例采用与实施例1相同的自助拉丁配分法进行划分、相同的模糊规则专家系统建立定性分析模型,以利用THz-TDS结合模糊规则专家系统对大黄的进行鉴定,区别仅在于实施例1采用S-G一阶导数结合EOSC方法进行预处理,而本实施例采用S-G一阶导数结合PC-OSC方法进行预处理。
PC-OSC方法是Harrington基于PCA产生的,用于去除原始光谱矩阵中与性质矩阵不相关的信息,从而达到光谱校正的目的,所述PC-OSC方法其算法简单易懂,计算速度快,所述PC-OSC方法的具体算法如下:
1)中心化原始数据:
X 1 = X - X ‾ - - - ( 8 )
Y 1 = Y - Y ‾ - - - ( 9 )
2)通过最小二乘模型计算背景:
X 0 = X 1 - X ^ 1 = X 1 - Y 1 ( Y 1 T Y 1 ) - 1 Y 1 T X 1 - - - ( 10 )
3)对背景数据奇值分解:
X0=USVT                    (11)
4)选择前n个特征向量定义背景空间的基:
Vn=[v1,v2,...,vn]          (12)
5)校正新样本:
x pc = ( x p - X ‾ ) - [ ( x p - X ‾ ) V n ] V n T - - - ( 13 )
结果分析,如图2所示为本实施例大黄样品的鉴定正确率与校正主因子数的关系图,其中,实线显示了实际测量的鉴定正确率随校正主因子数的变化情况,虚线显示了置信度为95%时得到的鉴定正确率置信区间,从图中可见,当校正主因子数为5时,鉴定正确率达到最大为95.16±0.09%。
如表2所示为本实施例采用S-G一阶导数结合PC-OSC方法对所述时域谱进行预处理,在校正因子数为5时,鉴定正确率的相关数据。所述鉴定正确率按照下式计算:鉴定正确率(%)=鉴定结果正确样品数/鉴定样品总数×100%。
表2用S-G一阶导数结合PC-OSC处理后的结果(校正主因子数=5)
Figure BDA00003230733500135
Figure BDA00003230733500141
实施例3
本实施例采用与实施例1相同的预处理方法、相同的定性分析模型,以利用THz-TDS结合模糊规则专家系统对大黄的进行鉴定,区别在于:实施例1采用自助拉丁配分法对大黄样品进行划分,而本实施例采用现有技术中的随机方法对大黄样品进行划分,结果显示,当校正主因子数为6时,其鉴定正确率最大为93.64±0.52。
如表3所示为本实施例方法在校正主因子数为6时,鉴定正确率的相关数据。
表3用随机方法处理后的结果(校正主因子数=6)
Figure BDA00003230733500142
实施例4
本实施例采用与实施例1相同的自助拉丁配分法进行划分、相同的定性分析模型,以对大黄的太赫兹时域光谱进行鉴定,区别仅在于实施例1采用S-G一阶导数结合EOSC方法对所述时域谱进行预处理,而本实施例采用S-G平滑处理结合EOSC方法对所述太赫兹时域光谱进行预处理,结果显示,当校正主因子数为14时,其鉴定正确率最大为92.93±0.48%。
如表4所示为本对比例方法在校正主因子数为14时,鉴定正确率的相关数据。
表4用S-G平滑处理结合EOSC进行预处理的结果(校正主因子数=14)
Figure BDA00003230733500151
需要说明的是,本发明所述利用THz-TDS结合模糊规则专家系统鉴定中草药的方法,以大黄类中草药为例进行说明,由于大黄是一种成分复杂且未知的中草药,从而适于鉴别大黄的分析方法原则上也适用于其它各种中草药的鉴定。此外,本发明实施例中所述中草药样品为薄片,作为可以选择的实施方式,本发明方法也可以对粉末状中草药样品进行鉴定。
显然,上述实施例仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims (10)

1.一种利用THz-TDS结合模糊规则专家系统鉴定中草药的方法,其特征在于,包括如下步骤:
(1)利用THz-TDS光谱仪对中草药样品进行测试,得到太赫兹时域光谱;
(2)对所述太赫兹时域光谱进行预处理,并将所述太赫兹时域光谱进行划分得到训练集样本和验证集样本;
(3)所述训练集样本和所述验证集样本采用模糊规则专家系统建立定性分析模型,以对中草药样品进行鉴定,具体步骤包括:调整由光谱数据得到的一个初始权重向量,以使分类熵H(C|A)最小化;模拟温度值决定熵值,通过控制模拟温度值,以使熵的一阶导数最大化,进而实现分类熵的梯度优化;并由此得到训练集样本的分类规则集,再利用所述分类规则集对未知样本进行判断识别;所述模糊规则专家系统的相关逻辑函数表示如下:
C A ( x k ) = ( 1 + e - ( x k w - a ) / t ) - 1 - - - ( a )
其中,xk为对象集,w为权重向量,a为偏差值,t为计算温度;
P ( c i | a j ) = Σ k = 1 n i x A ( x k ) / Σ k = 1 n x A ( x k ) - - - ( b )
aj代表属性,xA表示对xk模糊数据集的隶属度,ni为i类样本的个数,每个ci代表一类,选择测试属性aj进行测试,则样本集在属性aj时隶属于模糊数据集的i类的条件概率为p(ci|aj),而属性aj生成的熵值H(C|aj),如公式(c)所示:
H ( C | a j ) = - Σ i = 1 n p ( c i | a j ) ln [ p ( c i | a j ) ] - - - ( c )
各属性的熵值加权求和得系统的分类熵H(C|A),如公式(d)所示:
H ( C | A ) = Σ j = 1 2 p ( a j ) H ( C | a j ) - - - ( d )
其中,2代表属性总数,p(aj)表示具有属性aj样本的条件概率。
2.根据权利要求1所述的利用THz-TDS结合模糊规则专家系统鉴定中草药的方法,其特征在于,所述中草药为大黄。
3.根据权利要求1或2所述的利用THz-TDS结合模糊规则专家系统鉴定中草药的方法,其特征在于,在所述步骤(2)中,对所述太赫兹时域光谱进行预处理的步骤包括S-G平滑处理、S-G一阶导数处理、S-G二阶导数处理、自动调整、变量标准化、多元散射校正、加强正交信号校正、主成分正交信号校正等方法中的一种或几种的组合。
4.根据权利要求1或2或3所述的利用THz-TDS结合模糊规则专家系统鉴定中草药的方法,其特征在于,在所述步骤(2)中,利用自助拉丁配分法对所述太赫兹时域光谱进行划分得到所述训练集样本和所述验证集样本。
5.根据权利要求4所述的利用THz-TDS结合模糊规则专家系统鉴定中草药的方法,其特征在于,利用所述自助拉丁配分法进行划分时选择配分数为4,取其中3/4作为训练集样本,1/4作为验证集样本。
6.根据权利要求4或5所述的利用THz-TDS结合模糊规则专家系统鉴定中草药的方法,其特征在于,利用所述自助拉丁配分法进行划分时,重复配分计算10次。
7.根据权利要求1-6任一所述的利用THz-TDS结合模糊规则专家系统鉴定中草药的方法,其特征在于,所述步骤(1)中,所述THz-TDS的测试条件为:25℃时,以氮气作为参考,光谱仪扫描系统的步进电机扫描区间为24.6-27.6mm,步长为0.01mm。
8.根据权利要求1-6任一所述的利用THz-TDS结合模糊规则专家系统鉴定中草药的方法,其特征在于,所述中草药样品为薄片或粉末状。
9.根据权利要求4-8任一所述的利用THz-TDS结合模糊规则专家系统鉴定中草药的方法,其特征在于,所述步骤(2)中,利用S-G一阶导数结合EOSC进行预处理,并选取所述自助拉丁配分法的校正主因子数为11。
10.根据权利要求4-8任一所述的利用THz-TDS结合模糊规则专家系统鉴定中草药的方法,其特征在于,所述步骤(2)中,利用S-G一阶导数结合PC-OSC进行预处理,并选取所述自助拉丁配分法的校正主因子数为5。
CN2013101924939A 2013-05-22 2013-05-22 一种利用THz-TDS结合模糊规则专家系统鉴定中草药的方法 Pending CN103411912A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2013101924939A CN103411912A (zh) 2013-05-22 2013-05-22 一种利用THz-TDS结合模糊规则专家系统鉴定中草药的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2013101924939A CN103411912A (zh) 2013-05-22 2013-05-22 一种利用THz-TDS结合模糊规则专家系统鉴定中草药的方法

Publications (1)

Publication Number Publication Date
CN103411912A true CN103411912A (zh) 2013-11-27

Family

ID=49604939

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2013101924939A Pending CN103411912A (zh) 2013-05-22 2013-05-22 一种利用THz-TDS结合模糊规则专家系统鉴定中草药的方法

Country Status (1)

Country Link
CN (1) CN103411912A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104215599A (zh) * 2014-08-06 2014-12-17 首都师范大学 一种利用THz-TDS技术定量检测粮食中农药残留的方法
CN104297202A (zh) * 2014-09-28 2015-01-21 首都师范大学 利用THz-TDS频域谱定量检测粮食中农药残留的方法
CN104330384A (zh) * 2014-11-14 2015-02-04 首都师范大学 应用太赫兹频域光谱技术检测粮食中氨基酸含量的方法
CN105223153A (zh) * 2015-09-17 2016-01-06 滨州学院 一种基于太赫兹光谱技术的全成分颗粒剂中草药桑枝的检测方法
CN106990214A (zh) * 2017-05-08 2017-07-28 云南民族大学 一种评价中药材质量的方法
WO2019040002A1 (en) * 2017-08-25 2019-02-28 National University Of Singapore ADVANCED THZ SYSTEM AND METHOD
CN109491348A (zh) * 2018-12-18 2019-03-19 江南大学 基于ppls模型的间歇过程产品设计方法
CN111027488A (zh) * 2019-12-11 2020-04-17 深圳先进技术研究院 一种信号分类的方法和设备

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
PETER B.HARRINGTON: "FUZZY MULTIVARIATE RULE-BUILDING EXPERT SYSTEMS:MINIMAL NEURAL NETWORKS", 《JOURNAL OF CHEMOMETRICS》 *
杨帆等: "基于主成分正交信号校正算法和加强正交信号校正算法对柑桔酸度的检测", 《光谱学与光谱分析》 *
相玉红等: "利用自助拉丁配分和模糊规则对橄榄油进行分类研究", 《计算机与应用化学》 *
陈艳江等: "基于支持向量机的中药太赫兹光谱鉴别", 《光谱学与光谱分析》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104215599A (zh) * 2014-08-06 2014-12-17 首都师范大学 一种利用THz-TDS技术定量检测粮食中农药残留的方法
CN104297202A (zh) * 2014-09-28 2015-01-21 首都师范大学 利用THz-TDS频域谱定量检测粮食中农药残留的方法
CN104330384A (zh) * 2014-11-14 2015-02-04 首都师范大学 应用太赫兹频域光谱技术检测粮食中氨基酸含量的方法
CN105223153A (zh) * 2015-09-17 2016-01-06 滨州学院 一种基于太赫兹光谱技术的全成分颗粒剂中草药桑枝的检测方法
CN106990214A (zh) * 2017-05-08 2017-07-28 云南民族大学 一种评价中药材质量的方法
CN106990214B (zh) * 2017-05-08 2019-11-15 云南民族大学 一种评价中药材质量的方法
WO2019040002A1 (en) * 2017-08-25 2019-02-28 National University Of Singapore ADVANCED THZ SYSTEM AND METHOD
CN109491348A (zh) * 2018-12-18 2019-03-19 江南大学 基于ppls模型的间歇过程产品设计方法
CN109491348B (zh) * 2018-12-18 2020-05-01 江南大学 基于ppls模型的青霉素发酵设计方法
CN111027488A (zh) * 2019-12-11 2020-04-17 深圳先进技术研究院 一种信号分类的方法和设备
WO2021115059A1 (zh) * 2019-12-11 2021-06-17 深圳先进技术研究院 一种信号分类的方法和设备

Similar Documents

Publication Publication Date Title
CN103364362B (zh) 一种利用THz-TDS结合化学计量学鉴定中草药的方法
CN103411912A (zh) 一种利用THz-TDS结合模糊规则专家系统鉴定中草药的方法
CN104374738B (zh) 一种基于近红外提高鉴别结果的定性分析方法
WO2019192433A1 (zh) 一种基于近红外光谱技术对中药皂角刺的真伪进行化学模式识别的方法
CN107677647A (zh) 基于主成分分析和bp神经网络的中药材产地鉴别方法
CN105630743B (zh) 一种光谱波数的选择方法
CN103134765A (zh) 一种基于太赫兹时域光谱的中药样品真伪初筛方法
CN107219188B (zh) 一种基于改进dbn的近红外光谱分析纺织品棉含量的方法
CN104062258B (zh) 一种采用近红外光谱快速测定复方阿胶浆中可溶性固形物的方法
CN110068544B (zh) 物质识别网络模型训练方法及太赫兹光谱物质识别方法
CN104062259B (zh) 一种采用近红外光谱快速测定复方阿胶浆中总皂苷含量的方法
CN108872132A (zh) 一种利用近红外光谱判别茶鲜叶品种的方法
CN113008805B (zh) 基于高光谱成像深度分析的白芷饮片质量预测方法
CN109858477A (zh) 用深度森林在复杂环境中识别目标物的拉曼光谱分析方法
CN106841083A (zh) 基于近红外光谱技术的芝麻油品质检测方法
CN104020129A (zh) 一种基于近红外光谱结合氨基酸分析技术的工夫红茶发酵质量的判别方法
CN110243806A (zh) 拉曼光谱下基于相似度的混合物组分识别方法
CN108844917A (zh) 一种基于显著性假设检验和偏最小二乘法的近红外光谱数据分析方法
CN104376325A (zh) 一种近红外定性分析模型的建立方法
CN103674884A (zh) 基于近红外光谱信息的烟叶风格特征的随机森林分类方法
CN102749297A (zh) 一种基于太赫兹理论模拟光谱的农药鉴别方法
CN106770003A (zh) 基于近红外光谱技术的木材识别方法及系统
CN105758819A (zh) 一种利用近红外光谱检测土壤的有机组分的方法
CN105138834A (zh) 基于近红外光谱波数k均值聚类的烟草化学值定量方法
CN107132194A (zh) 一种基于紫外可见光谱及化学模式识别的三七及其伪品鉴别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20131127