CN116429718B - 一种不同采收月份唐古特大黄药材的多元红外光谱判别方法、系统、存储介质及终端 - Google Patents

一种不同采收月份唐古特大黄药材的多元红外光谱判别方法、系统、存储介质及终端 Download PDF

Info

Publication number
CN116429718B
CN116429718B CN202310306770.8A CN202310306770A CN116429718B CN 116429718 B CN116429718 B CN 116429718B CN 202310306770 A CN202310306770 A CN 202310306770A CN 116429718 B CN116429718 B CN 116429718B
Authority
CN
China
Prior art keywords
different
months
spectrum
discrimination
spectrograms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310306770.8A
Other languages
English (en)
Other versions
CN116429718A (zh
Inventor
孙菁
冯丹
龙若兰
罗西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwest Institute of Plateau Biology of CAS
Original Assignee
Northwest Institute of Plateau Biology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwest Institute of Plateau Biology of CAS filed Critical Northwest Institute of Plateau Biology of CAS
Publication of CN116429718A publication Critical patent/CN116429718A/zh
Application granted granted Critical
Publication of CN116429718B publication Critical patent/CN116429718B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N1/00Sampling; Preparing specimens for investigation
    • G01N1/28Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light

Landscapes

  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明公开了一种不同采收月份唐古特大黄药材的多元红外光谱判别方法、系统、存储介质及终端,包括:在同一种红外谱图下比较不同月份样品的红外光谱特征,得到光谱特征判别结果;分别在不同的红外谱图下建立判别模型;训练得到不同红外谱图下对应的最优判别模型;利用不同的最优判别模型分别进行判别,并结合所述光谱特征判别结果选定判别效果最好的红外谱图及其对应的最优判别模型。本发明通过采集不同月份药材多种不同的光谱信息,在分析其红外光谱特征的基础上,建立了多种红外光谱信息下的不同采收月份大黄药材判别模型,籍此实现对不同采收月份唐古特大黄的快速判别,为指导唐古特大黄药材采收及后续的生产实践活动提供科学依据。

Description

一种不同采收月份唐古特大黄药材的多元红外光谱判别方 法、系统、存储介质及终端
技术领域
本发明涉及红外光谱检测技术领域,尤其涉及一种不同采收月份唐古特大黄药材的多元红外光谱判别方法、系统、存储介质及终端。
背景技术
中药材的采收月份是影响中药材质量和产量的重要因素,不同生长时期药材的有效成分含量和药理药效活性都存在一定差异。如现有技术中测得3月底采收麦冬果糖、总皂苷等含量较高,不同采收期的枸橘中芸香柚皮苷、柚皮苷和枸橘苷的含量差异较大,不同采收期唐古特大黄的游离型蒽醌等4类功效组分含量存在显著影响。可见,为保障药材质量的安全性和有效性,有必要选择最佳的采收时期,对药材的采收月份进行准确鉴别。
唐古特大黄为蓼科大黄属,多年生高大草本,是青海省道地中藏药材,也是《中华人民共和国药典》中收载的三种正品大黄之一。其以干燥根及根茎入药,具有泻下攻积、凉血解毒、利湿退黄的功效,在一些国家也常被作为泻药和胃健康促进剂。大黄的品质受到药材采收期的影响,然而,不同月份采收的唐古特大黄从外观上难以准确区分。以往的鉴别工作均需借助高效液相色谱等传统常规检测方法,但是存在分析检测时间长、对检测样品易造成损耗、化学试剂污染等缺点,因此亟需建立一种可用于唐古特大黄不同月份鉴别的快速而准确的方法。
近年来,快速、无损、环境友好的红外光谱分析技术在药材真伪判别、产地鉴别、含量检测、过程分析等领域得到了广泛应用,取得了较好的实践效果,但未涉及对药材不同采收期的鉴别,对于药材采收缺乏指导依据。
发明内容
本发明的目的在于克服现有技术中未针对药材不同采收期进行鉴别的问题,提供了一种不同采收月份唐古特大黄药材的多元红外光谱判别方法、系统、存储介质及终端。
本发明的目的是通过以下技术方案来实现的:
在第一方案中,提供一种不同采收月份唐古特大黄药材的多元红外光谱判别方法,所述方法包括:
收集不同月份的唐古特大黄药材作为样品;
分别采集每一个月份样品的多种红外谱图;
在同一种红外谱图下比较不同月份样品的红外光谱特征,得到光谱特征判别结果;
分别在不同的红外谱图下建立判别模型,其中,对不同的判别模型采用不同的建模方法和优化方法;
对所述判别模型进行训练,得到不同红外谱图下对应的最优判别模型;
利用不同的最优判别模型分别对样品进行判别,得到模型判别结果;
结合所述光谱特征判别结果选定判别效果最好的红外谱图及其对应的最优判别模型。
作为一优选项,一种不同采收月份唐古特大黄药材的多元红外光谱判别方法,所述收集不同月份的唐古特大黄药材作为样品,包括:
在4月到10月植物生长期内每月采集一次样品。
作为一优选项,一种不同采收月份唐古特大黄药材的多元红外光谱判别方法,以不同采收月份唐古特大黄药用部位根部为研究对象。
作为一优选项,一种不同采收月份唐古特大黄药材的多元红外光谱判别方法,所述分别采集每一个月份样品的多种红外谱图,包括:
分别采集近红外光谱NIR、衰减全反射红外光谱ATR以及中红外光谱MIR并取每一种光谱的平均谱图。
作为一优选项,一种不同采收月份唐古特大黄药材的多元红外光谱判别方法,所述光谱特征判别结果,包括:
近红外光谱NIR的一阶导数谱图在5600~5900cm-1、4400~4250cm-1处振动明显;
衰减全反射红外光谱ATR的一阶导数谱图在2400~1900cm-1、1700~400cm-1处振动明显;
中红外光谱MIR的一阶导数谱图在3000~2800cm-1、1800~400cm-1处振动明显。
作为一优选项,一种不同采收月份唐古特大黄药材的多元红外光谱判别方法,所述分别在不同的红外谱图下建立判别模型,包括:
分别将样品的各红外谱图导入TQ Analyst软件,以校正集与预测集比例2:1对样本集进行随机划分,并每月抽取20%样品作为外部测试集。
作为一优选项,一种不同采收月份唐古特大黄药材的多元红外光谱判别方法,所述建模方法包括优化距离匹配DM和判别分析DA;所述优化方法包括分别使用不同的预处理方法对谱图进行处理。
在第二方案中,提供一种不同采收月份唐古特大黄药材的多元红外光谱判别系统,所述系统包括:
样品采集模块,用于收集不同月份的唐古特大黄药材作为样品;
红外谱图采集模块,用于分别采集每一个月份样品的多种红外谱图;
光谱特征判别模块,用于在同一种红外谱图下比较不同月份样品的红外光谱特征,得到光谱特征判别结果;
判别模型建立模块,用于分别在不同的红外谱图下建立判别模型,其中,对不同的判别模型采用不同的建模方法和优化方法;
模型训练模块,用于对所述判别模型进行训练,得到不同红外谱图下对应的最优判别模型;
模型判别模块,利用不同的最优判别模型分别对样品进行判别,得到模型判别结果;
模型比对模块,结合所述光谱特征判别结果选定判别效果最好的红外谱图及其对应的最优判别模型。
在第三方案中,提供一种存储介质,其上存储有计算机指令,所述计算机指令运行时执行任意一项所述多元红外光谱判别方法的步骤。
在第四方案中,提供一种终端,包括存储器和处理器,存储器上存储有可在处理器上运行的计算机指令处理器运行计算机指令时执行任意一项所述多元红外光谱判别方法的步骤。
需要进一步说明的是,上述系统各选项对应的技术特征在不冲突的情况下可以相互组合或替换构成新的技术方案。
与现有技术相比,本发明有益效果是:
本发明在同一种红外谱图下比较不同月份样品的红外光谱特征,得到光谱特征判别结果,同时分别在不同的红外谱图下建立判别模型,结合所述光谱特征判别结果选定判别效果最好的红外谱图及其对应的最优判别模型,通过采集不同月份药材多种不同的光谱信息,在分析其红外光谱特征的基础上,建立了多种红外光谱信息下的不同采收月份大黄药材判别模型,籍此实现对不同采收月份唐古特大黄的快速判别,为指导唐古特大黄药材采收及后续的生产实践活动提供科学依据。
附图说明
图1为本发明实施例示出的一种不同采收月份唐古特大黄药材的多元红外光谱判别方法的流程图;
图2为本发明实施例示出的近红外光谱NIR原始谱图;
图3为本发明实施例示出的近红外光谱NIR下不同月份平均谱图;
图4为本发明实施例示出的近红外光谱NIR下不同月份平均一阶导数谱图;
图5为本发明实施例示出的衰减全反射红外光谱ATR原始谱图;
图6为本发明实施例示出的衰减全反射红外光谱ATR下不同月份平均谱图;
图7为本发明实施例示出的衰减全反射红外光谱ATR下不同月份平均一阶导数谱图;
图8为本发明实施例示出的中红外光谱MIR原始谱图;
图9为本发明实施例示出的中红外光谱MIR下不同月份平均谱图;
图10为本发明实施例示出的中红外光谱MIR下不同月份平均一阶导数谱图;
图11为本发明实施例示出的NIR光谱3D显示图;
图12为本发明实施例示出的ATR光谱3D显示图;
图13为本发明实施例示出的MIR光谱3D显示图。
具体实施方式
下面结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
在一示例性实施例中,提供一种不同采收月份唐古特大黄药材的多元红外光谱判别方法,如图1所示,所述方法包括:
收集不同月份的唐古特大黄药材作为样品;
分别采集每一个月份样品的多种红外谱图;
在同一种红外谱图下比较不同月份样品的红外光谱特征,得到光谱特征判别结果;
分别在不同的红外谱图下建立判别模型,其中,对不同的判别模型采用不同的建模方法和优化方法;
对所述判别模型进行训练,得到不同红外谱图下对应的最优判别模型;
利用不同的最优判别模型分别对样品进行判别,得到模型判别结果;
结合所述光谱特征判别结果选定判别效果最好的红外谱图及其对应的最优判别模型。
通过采集不同月份药材多种不同的光谱信息,在分析其红外光谱特征的基础上,建立了多种红外光谱信息下的不同采收月份大黄药材判别模型,籍此实现对不同采收月份唐古特大黄的快速判别,为指导唐古特大黄药材采收及后续的生产实践活动提供科学依据。
在一个示例中,所述收集不同月份的唐古特大黄药材作为样品,包括:
在4月到10月植物生长期内每月采集一次样品,具体地,实验用材料采自青海省西宁市湟中县唐古特大黄种植基地,共得到7个不同月份的134份样品,样品带回实验室经超纯水洗净、阴干,切片置于45℃烘箱内烘干至恒重,粉碎后装入自封袋,置于干燥器内备用。
在一个示例中,以不同采收月份唐古特大黄药用部位根部为研究对象,根部为《中华人民共和国药典》规定的药用部位,蒽醌等活性成分含量较高。
在一个示例中,一种不同采收月份唐古特大黄药材的多元红外光谱判别方法,所述分别采集每一个月份样品的多种红外谱图,包括:
分别采集近红外光谱NIR、衰减全反射红外光谱ATR以及中红外光谱MIR并取每一种光谱的平均谱图。
具体地,谱图采集涉及的仪器包括傅里叶变换红外光谱分析仪(Nicolet iS 50,ThermoFisher公司,美国)、压片模具(直径13mm,PIKE公司,美国)、电子天平(ME104,0.0001g,Mettler Toledo,瑞士)、超纯水机(Milion-Q Integral 3,默克化工技术有限公司,德国)、烘箱(上海一恒科学仪器有限公司,中国)、粉碎机(天津市泰斯特有限公司,中国)。用到的试剂包括溴化钾(光谱纯,Thermofisher公司,美国)。
进一步地,利用傅里叶变换红外光谱仪的NIR光纤模块对待测样品进行NIR光谱的采集。扫描次数为32次,分辨率为4cm-1,光谱采集范围为10000-4000cm-1,以空气为谱图采集背景,每份样品扫描6次,取平均谱图进行分析。
利用傅里叶变换红外光谱仪的衰减全反射模块对待测样品进行ATR-IR一维红外光谱采集,扫描次数为32次,分辨率为4cm-1,光谱采集范围为4000-400cm-1,每个样品扫描3次,每次扫描前扣除空气背景值,取平均谱图进行分析。
样品粉末(约0.0030g)与KBr按照1:100比例压片制样后,采集MIR一维光谱图。扫描次数为32次,分辨率为4cm-1,每次扫描前扣除空气背景值,光谱的采集范围为4000-400cm-1,每个样品扫描3次,分别取平均谱图进行分析。
在一个示例中,一种不同采收月份唐古特大黄药材的多元红外光谱判别方法,所述光谱特征判别结果,包括:
近红外光谱NIR的一阶导数谱图在5600~5900cm-1、4400~4250cm-1处振动明显。具体地,图2为不同月份唐古特大黄样品NIR指纹图谱,经分析,唐古特大黄的红外一维谱图共7个吸收峰,对各吸收峰的吸收个数进行统计,将样品波数缺失率小于5%的波数确定为共有吸收峰,唐古特大黄样品共有吸收峰有6个,分别是6829cm-1、5776cm-1、5664cm-1、5170cm-1、4746cm-1、4322cm-1。6829cm-1附近为O-H的一级倍频吸收峰,5776cm-1附近为C-H的一级倍频吸收峰,5664cm-1附近为CH2的一级倍频吸收峰,5166cm-1附近为O-H的合频吸收峰,4746cm-1附近为N-H的合频吸收峰,4322cm-1附近为C-H的合频吸收峰。取不同月份大黄NIR光谱平均谱图,结果见图3,由图3可知,相较于其他月份,4、5月谱图差异稍大,4月在8254cm-1附近的吸收峰弱,即含亚甲基的脂肪烃类含量相对较低;5月在6847cm-1附近的O-H吸收峰发生蓝移,其余峰位置相对一致。
对不同月份平均一阶导数谱图进行分析,参见图4,NIR一阶导数谱图在5600~5900cm-1、4400~4250cm-1的振动明显。将振动明显处放大分析,可见在导数峰处不同月份平均谱图存在差异,尤其是5767cm-1与4318cm-1处,4、5月份谱图较其他月份峰值低,对应C-H峰强差异大。
衰减全反射红外光谱ATR的一阶导数谱图在2400~1900cm-1、1700~400cm-1处振动明显;具体地,对所有不同月份大黄样品进行ATR光谱采集,得到样品的ATR指纹图谱,如图5。由结果可知,唐古特大黄的ATR一维谱图有17个吸收峰,共有吸收峰有13个,分别为3298cm-1、2926cm-1、2323cm-1、2050cm-1、1980cm-1、1602cm-1、1445cm-1、1316cm-1、1235cm-1、1144cm-1、1016cm-1、764cm-1、516cm-1,比近红外峰数多。3298cm-1附近为O-H的伸缩振动,2926cm-1附近为C-H的伸缩振动,2323cm-1附近为C≡C振动,1602cm-1为芳香环内C=C伸缩振动,1445cm-1、764cm-1为C-H的变形振动,1316cm-1为O-H的变形振动;1235cm-1、1016cm-1、516cm-1为C-C骨架振动,1144cm-1为醇C-O的伸缩振动。1602cm-1、1316cm-1、1144cm-1处可能为大黄素等蒽醌类物质吸收峰。从图6中可以看出,4月、10月3298cm-1附近的峰出现红移,4月尤其明显;4、5月缺少572cm-1处的峰;只有5月在1 366cm-1处有较强峰,可能为酚O-H变形和C-O伸缩振动,并且5月在779cm-1处有额外的峰。除此之外,6月在818cm-1处有额外的峰,7、8、9月有1074cm-1附近的峰,为C-O的伸缩振动。
对不同月份平均一阶导数谱图进行分析,结果见图7,ATR一阶导数谱图在2 400~1 900cm-1、1 700~400cm-1的振动明显,以400~500cm-1波段内不同月份导数谱图差异明显。将其放大分析,在多个峰值处不同月份谱图峰强差异大,在1196cm-1、1070cm-1、980cm-1、918cm-1、702cm-1、568cm-1处,7月谱图峰强最强,4、5月谱图较低,而在1309cm-1、777cm-1处4月谱图峰强最高,1044cm-1处4、5月谱图较高。
中红外光谱MIR的一阶导数谱图在3000~2800cm-1、1800~400cm-1处振动明显。具体地,对所有不同月份大黄样品进行MIR-KBr压片光谱采集,得到样品的MIR指纹图谱,见图8。由结果可知,唐古特大黄的MIR一维谱图有15个吸收峰,共有吸收峰有9个,分别为3416cm-1、2928cm-1、1618cm-1、1515cm-1、1449cm-1、1368cm-1、1241cm-1、1024cm-1、577cm-1。3416cm-1附近为氢键缔合O-H的伸缩振动,2928cm-1附近为C-H的伸缩振动,1618cm-1为芳香环内C=C伸缩振动,1515cm-1为C=C伸缩振动,1449cm-1为C-H的变形振动,1368cm-1为O-H的变形振动;1241cm-1、577cm-1为C-C骨架振动,与ATR信息大致吻合。将不同月份大黄MIR光谱取平均谱图,结果见图9。从图中可以发现,4、5月1154cm-1附近的峰出现了红移,1077cm-1、441cm-1处的峰不明显,也缺少1027cm-1、863cm-1处的峰。此外,7、8、9、10月在931cm-1有明显峰,而4、5月峰强较弱。
对不同月份MIR平均一阶导数谱图进行分析,如图10,谱图在3000~2800cm-1、1800~400cm-1的振动明显。将差异明显处放大分析,4、5月峰强在2953cm-1、2846cm-1、1595cm-1处较强,在1140cm-1、1073cm-1、980cm-1处较弱,4月谱图在1312cm-1、778cm-1处峰强尤其高。综合以上结果,4、5月唐古特大黄的各类红外谱图尤其是MIR图谱与其他月份有很明显的差别,三种类型光谱补充分析可以用于月份的初步判别。
在一个示例中,一种不同采收月份唐古特大黄药材的多元红外光谱判别方法,所述分别在不同的红外谱图下建立判别模型,包括:
分别将样品的各红外谱图导入TQ Analyst软件,以校正集与预测集比例2:1对样本集进行随机划分,并每月抽取20%样品作为外部测试集。其中,建模方法包括优化距离匹配DM和判别分析DA;优化方法包括分别使用不同的预处理方法对谱图进行处理,具体地,对多元散射校正(multiplicative scatter correction,MSC)、标准归一化(standardnormal variate,SNV)、原始光谱(original spectrum)、一阶导数(first derivative,1D)和二阶导数(second derivative,2D)等谱图预处理方法进行优化。
光谱特征分析可以看出不同谱图间的具体差异,然而分析需要的难度较大,它可以为建模区间等参数的选择提供参考,并能与模型建立结果进行相互印证,光谱差异大的样品更容易建立好的判别模型。相比于谱图解析,判别模型的建立可以更快捷、普适地对样品进行区分,对于不同领域的人员都能适用。判别模型的优化具体如下:
对不同建模方法、谱图预处理方法进行优化。在预实验过程中,originalspectrum+no smoothing及2D+SG smoothing模型效果普遍偏差,其余条件优化模型相关指标见表1:
表1不同光谱条件下的唐古特大黄月份判别模型优化
在NIR光谱条件下,优化结果为DM+1D+constant+SG smoothing时,建模效果最好,此时模型的识别率、预测率与总和均达到了100%,判别效果较好。将外部测试集的27份样品谱图代入模型中进行验证,4份样品识别错误,外部测试集识别率为85.19%。
在ATR光谱条件下,优化结果为DM+1D+SNV+Norris smoothing时,建模效果最好,此时模型的识别率为100%,预测率为72.73%,总和为91.59%,判别效果较好。27份外部测试集样品中,10份样品识别错误,外部测试集识别率为62.97%。
MIR光谱在DM+1D+MSC/SNV+Norris smoothing条件下时,建模效果最好,此时模型的识别率为100.00%,预测率为78.79%,总合为93.46%,判别效果较好。27份外部测试集样品中,9份样品识别错误,外部测试集识别率为66.67%。
进一步地,记录不同建模条件下模型的校正集误判数和预测集误判数,分别计算模型的识别率和预测率,识别率和预测率最高的为最优组合,计算公式如下:
识别率=(校正集总数-校正集误判数)/校正集总数×100%;
预测率=(预测集总数-预测集误判数)/预测集总数×100%;
另外,采用真阳性率(True Positive Rate,TPR),真阴性率(True NegativeRate,TNR)、判别错误率(ERR,Error Rate)和F1得分(F1-score,F1)进行模型评价,TPR、TNR和F1越高,ER越低,分类模型的性能越好。使用真阳性(True Positive,TP)、假阳性(FalsePositive,FP)、真阴性(True Negative,TN)、假阴性(False Negative,FN)对指标进行计算,TP表示真样本被识别为真样本,FP表示伪样本被识别为真样本,TN表示伪样本被识别为伪样本,FN表示真样本被识别为伪样本。计算公式如下:
TPR=TP/(TP+FN);TNR=TN/(FP+TN);ERR=(FP+FN)/(TP+TN+FP+FN);
F1=2×TP/(2×TP+FP+FN)。
模型识别性能的评价采用TPR、TNR、F1和ERR参数进行评价,结果如表2所示。
表2不同光谱条件下最优判别模型识别性能评价参数
总体来说,4、5、6月三个月的样品判别效果较好,8月份样品判别效果最差。在NIR光谱条件下的最优模型中,除8月份外,该模型的TPR值在0.95以上,F1值在0.93以上;所有月份的TNR均在0.97以上,ERR在0.03以下,说明该模型具有较好实用性,能对不同月份样品进行较好区分。以ATR光谱为基础建立的最优模型中,前三个月样品判别效果较好,模型的TPR值、F1值在0.90以上,TNR在0.98以上,ERR在0.03以下;对9月判别效果最差,TPR、F1只达到了0.80。在MIR光谱条件下的最优模型中,4至7月样品判别效果较好,模型的TPR值、F1值在0.9以上,TNR在0.98以上,ERR在0.03以下;对8、9月份样品判别效果较差。
进一步地,综合三种光谱所建立的月份快速判别模型,对不同光谱条件下的最优建模方法以及模型指标进行比较,如表3所示:
表3不同光谱条件下唐古特大黄不同月份判别模型比较
所有光谱均以距离匹配方法与一阶导数下建模效果较好,NIR在constant+SGsmoothing下效果最好,ATR及MIR在SNV+Norris smoothing下效果最好。
在所有光谱类型下,模型识别率均能达到100%;模型预测率除了NIR光谱外,其他光谱类型下预测率均在70-80%之间;所有光谱类型下的外部验证集集识别率普遍偏低,只有NIR最佳光谱达到了85%以上;总体识别率均高于90%,说明不同月份唐古特大黄的NIR光谱判别效果较好。
进一步地,各光谱模型的前三主成分3D显示图见图11-图13,根据前三主成分得出的各样品三维空间分布,可以直观地观察到不同月份样品谱图远近关系,也可以与判别模型的结果相互印证,判别效果好的模型在前三主成分3D图中不同月份样品区分清楚,相同月份样品聚集紧密;谱图差异较大的月份样品与其他月份样品距离较远。不同图中标出了模型内部各月份判别的正确率。NIR光谱模型各个月份的样品在图中基本被分开,正确率均100%,模型效果好。ATR光谱模型5、6月预测正确率为100%,8月正确率最低为85%,图中可见略有混杂。MIR光谱模型4、5、10月预测正确率为100%,3D图中分散较远,9月正确率最低为85%,与模型性能评价参数向匹配。
综合比较所建立的唐古特大黄三种不同光谱的月份判别模型,NIR光谱下模型对不同月份样品判别的效果最好,最佳建模条件为DM+1D+constant+SG smoothing,其模型识别率、预测率、总和均达到100%,外部测试集识别率为85.19%。NIR要比MIR的模型效果好,SNV方法的优势是消除固体颗粒大小、表面散射等影响,可能对直接在固体颗粒表面采集的ATR及MIR光谱优化效果好。即ATR及MIR在SNV+Norris smoothing下效果最好。该实验所建立模型具有较好实用性,可用于快速、准确地鉴别不同月份的唐古特大黄,为其他药材资源的不同月份快速识别提供借鉴参考。工作人员可根据实际情况选择不同的光谱采集方式以及判别模型。
在第二方案中,提供一种不同采收月份唐古特大黄药材的多元红外光谱判别系统,所述系统包括:
样品采集模块,用于收集不同月份的唐古特大黄药材作为样品;
红外谱图采集模块,用于分别采集每一个月份样品的多种红外谱图;
光谱特征判别模块,用于在同一种红外谱图下比较不同月份样品的红外光谱特征,得到光谱特征判别结果;
判别模型建立模块,用于分别在不同的红外谱图下建立判别模型,其中,对不同的判别模型采用不同的建模方法和优化方法;
模型训练模块,用于对所述判别模型进行训练,得到不同红外谱图下对应的最优判别模型;
模型判别模块,利用不同的最优判别模型分别对样品进行判别,得到模型判别结果;
模型比对模块,结合所述光谱特征判别结果选定判别效果最好的红外谱图及其对应的最优判别模型。
在另一示例性实施例中,本发明提供一种存储介质,其上存储有计算机指令,所述计算机指令运行时执行所述多元红外光谱判别方法的步骤。
基于这样的理解,本实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
在另一示例性实施例中,本发明提供一种终端,包括存储器和处理器,存储器上存储有可在处理器上运行的计算机指令,处理器运行计算机指令时执行所述多元红外光谱判别方法的步骤。
处理器可以是单核或者多核中央处理单元或者特定的集成电路,或者配置成实施本发明的一个或者多个集成电路。
本说明书中描述的主题及功能操作的实施例可以在以下中实现:有形体现的计算机软件或固件、包括本说明书中公开的结构及其结构性等同物的计算机硬件、或者它们中的一个或多个的组合。本说明书中描述的主题的实施例可以实现为一个或多个计算机程序,即编码在有形非暂时性程序载体上以被数据处理装置执行或控制数据处理装置的操作的计算机程序指令中的一个或多个模块。可替代地或附加地,程序指令可以被编码在人工生成的传播信号上,例如机器生成的电、光或电磁信号,该信号被生成以将信息编码并传输到合适的接收机装置以由数据处理装置执行。
本说明书中描述的处理及逻辑流程可以由执行一个或多个计算机程序的一个或多个可编程计算机执行,以通过根据输入数据进行操作并生成输出来执行相应的功能。所述处理及逻辑流程还可以由专用逻辑电路—例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)来执行,并且装置也可以实现为专用逻辑电路。
适合用于执行计算机程序的处理器包括,例如通用和/或专用微处理器,或任何其他类型的中央处理单元。通常,中央处理单元将从只读存储器和/或随机存取存储器接收指令和数据。计算机的基本组件包括用于实施或执行指令的中央处理单元以及用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括用于存储数据的一个或多个大容量存储设备,例如磁盘、磁光盘或光盘等,或者计算机将可操作地与此大容量存储设备耦接以从其接收数据或向其传送数据,抑或两种情况兼而有之。然而,计算机不是必须具有这样的设备。此外,计算机可以嵌入在另一设备中,例如移动电话、个人数字助理(PDA)、移动音频或视频播放器、游戏操纵台、全球定位系统(GPS)接收机、或例如通用串行总线(USB)闪存驱动器的便携式存储设备,仅举几例。
虽然本说明书包含许多具体实施细节,但是这些不应被解释为限制任何发明的范围或所要求保护的范围,而是主要用于描述特定发明的具体实施例的特征。本说明书内在多个实施例中描述的某些特征也可以在单个实施例中被组合实施。另一方面,在单个实施例中描述的各种特征也可以在多个实施例中分开实施或以任何合适的子组合来实施。此外,虽然特征可以如上所述在某些组合中起作用并且甚至最初如此要求保护,但是来自所要求保护的组合中的一个或多个特征在一些情况下可以从该组合中去除,并且所要求保护的组合可以指向子组合或子组合的变型。
类似地,虽然在附图中以特定顺序描绘了操作,但是这不应被理解为要求这些操作以所示的特定顺序执行或顺次执行、或者要求所有例示的操作被执行,以实现期望的结果。在某些情况下,多任务和并行处理可能是有利的。此外,上述实施例中的各种系统模块和组件的分离不应被理解为在所有实施例中均需要这样的分离,并且应当理解,所描述的程序组件和系统通常可以一起集成在单个软件产品中,或者封装成多个软件产品。
以上具体实施方式是对本发明的详细说明,不能认定本发明的具体实施方式只局限于这些说明,对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演和替代,都应当视为属于本发明的保护范围。

Claims (7)

1.一种不同采收月份唐古特大黄药材的多元红外光谱判别方法,其特征在于,所述方法包括:
收集不同月份的唐古特大黄药材作为样品;
分别采集每一个月份样品的多种红外谱图;分别采集近红外光谱NIR、衰减全反射红外光谱ATR以及中红外光谱MIR并取每一种光谱的平均谱图;
在同一种红外谱图下比较不同月份样品的红外光谱特征,得到光谱特征判别结果;
所述光谱特征判别结果包括:
对不同月份近红外光谱NIR的平均一阶导数谱图进行分析,NIR一阶导数谱图在5600~5900cm-1、4400~4250cm-1的振动明显,将振动明显处放大分析,在导数峰处不同月份平均谱图存在差异,其中,5767cm-1与4318cm-1处,4、5月份谱图较其他月份峰值低,对应C-H峰强差异大;
对不同月份衰减全反射红外光谱ATR的平均一阶导数谱图进行分析,ATR一阶导数谱图在2 400~1 900cm-1、1 700~400cm-1的振动明显,以1400~500cm-1波段内不同月份导数谱图差异明显,将其振动明显处放大分析,在多个峰值处不同月份谱图峰强差异大,在1196cm-1、1070cm-1、980cm-1、918cm-1、702cm-1、568cm-1处,7月谱图峰强最强,4、5月谱图较低,而在1309cm-1、777cm-1处4月谱图峰强最高,1044cm-1处4、5月谱图较高;
对不同月份中红外光谱MIR的平均一阶导数谱图进行分析,谱图在3000~2800cm-1、1800~400cm-1的振动明显,将差异明显处放大分析,4、5月峰强在2953cm-1、2846cm-1、1595cm-1处较强,在1140cm-1、1073cm-1、980cm-1处较弱,4月谱图在1312cm-1、778cm-1处峰强尤其高;
分别在不同的红外谱图下建立判别模型,其中,对不同的判别模型采用不同的建模方法和优化方法,所述建模方法包括优化距离匹配DM和判别分析DA;所述优化方法包括分别使用不同的预处理方法对谱图进行处理;在NIR光谱条件下,优化结果为DM+1D+constant+SG smoothing;在ATR光谱条件下,优化结果为DM+1D+SNV+Norris smoothing;在MIR光谱条件下,优化结果为DM+1D+MSC/SNV+Norris smoothing;
对所述判别模型进行训练,得到不同红外谱图下不同月份对应的最优判别模型;
利用不同的最优判别模型分别对样品进行判别,得到模型判别结果;
结合所述光谱特征判别结果选定判别效果最好的红外谱图及其对应的最优判别模型。
2.根据权利要求1所述的一种不同采收月份唐古特大黄药材的多元红外光谱判别方法,其特征在于,所述收集不同月份的唐古特大黄药材作为样品,包括:
在4月到10月植物生长期内每月采集一次样品。
3.根据权利要求2所述的一种不同采收月份唐古特大黄药材的多元红外光谱判别方法,其特征在于,以不同采收月份唐古特大黄药用部位根部为研究对象。
4.根据权利要求1所述的一种不同采收月份唐古特大黄药材的多元红外光谱判别方法,其特征在于,所述分别在不同的红外谱图下建立判别模型,包括:
分别将样品的各红外谱图导入TQ Analyst软件,以校正集与预测集比例2:1对样本集进行随机划分,并每月抽取20 %样品作为外部测试集。
5.一种不同采收月份唐古特大黄药材的多元红外光谱判别系统,其特征在于,所述系统包括:
样品采集模块,用于收集不同月份的唐古特大黄药材作为样品;
红外谱图采集模块,用于分别采集每一个月份样品的多种红外谱图;分别采集近红外光谱NIR、衰减全反射红外光谱ATR以及中红外光谱MIR并取每一种光谱的平均谱图;
光谱特征判别模块,用于在同一种红外谱图下比较不同月份样品的红外光谱特征,得到光谱特征判别结果;
所述光谱特征判别结果包括:
对不同月份近红外光谱NIR的平均一阶导数谱图进行分析,NIR一阶导数谱图在5600~5900cm-1、4400~4250cm-1的振动明显,将振动明显处放大分析,在导数峰处不同月份平均谱图存在差异,其中,5767cm-1与4318cm-1处,4、5月份谱图较其他月份峰值低,对应C-H峰强差异大;
对不同月份衰减全反射红外光谱ATR的平均一阶导数谱图进行分析,ATR一阶导数谱图在2 400~1 900cm-1、1 700~400cm-1的振动明显,以1400~500cm-1波段内不同月份导数谱图差异明显,将其振动明显处放大分析,在多个峰值处不同月份谱图峰强差异大,在1196cm-1、1070cm-1、980cm-1、918cm-1、702cm-1、568cm-1处,7月谱图峰强最强,4、5月谱图较低,而在1309cm-1、777cm-1处4月谱图峰强最高,1044cm-1处4、5月谱图较高;
对不同月份中红外光谱MIR的平均一阶导数谱图进行分析,谱图在3000~2800cm-1、1800~400cm-1的振动明显,将差异明显处放大分析,4、5月峰强在2953cm-1、2846cm-1、1595cm-1处较强,在1140cm-1、1073cm-1、980cm-1处较弱,4月谱图在1312cm-1、778cm-1处峰强尤其高;
判别模型建立模块,用于分别在不同的红外谱图下建立判别模型,其中,对不同的判别模型采用不同的建模方法和优化方法,所述建模方法包括优化距离匹配DM和判别分析DA;所述优化方法包括分别使用不同的预处理方法对谱图进行处理;在NIR光谱条件下,优化结果为DM+1D+constant+SG smoothing;在ATR光谱条件下,优化结果为DM+1D+SNV+Norrissmoothing;在MIR光谱条件下,优化结果为DM+1D+MSC/SNV+Norris smoothing;
模型训练模块,用于对所述判别模型进行训练,得到不同红外谱图下不同月份对应的最优判别模型;
模型判别模块,利用不同的最优判别模型分别对样品进行判别,得到模型判别结果;
模型比对模块,结合所述光谱特征判别结果选定判别效果最好的红外谱图及其对应的最优判别模型。
6.一种存储介质,其上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1-4中任意一项所述多元红外光谱判别方法的步骤。
7.一种终端,包括存储器和处理器,存储器上存储有可在处理器上运行的计算机指令,其特征在于,处理器运行计算机指令时执行权利要求1-4中任意一项所述多元红外光谱判别方法的步骤。
CN202310306770.8A 2022-12-21 2023-03-27 一种不同采收月份唐古特大黄药材的多元红外光谱判别方法、系统、存储介质及终端 Active CN116429718B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202211651296 2022-12-21
CN2022116512964 2022-12-21

Publications (2)

Publication Number Publication Date
CN116429718A CN116429718A (zh) 2023-07-14
CN116429718B true CN116429718B (zh) 2024-03-19

Family

ID=87078917

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310306770.8A Active CN116429718B (zh) 2022-12-21 2023-03-27 一种不同采收月份唐古特大黄药材的多元红外光谱判别方法、系统、存储介质及终端

Country Status (1)

Country Link
CN (1) CN116429718B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103364359A (zh) * 2012-04-11 2013-10-23 天士力制药集团股份有限公司 Simca模式识别法在近红外光谱识别大黄药材中的应用
CN103884676A (zh) * 2014-02-27 2014-06-25 浙江大学 一种中药材多指标成分含量的快速测定方法
CN105352913A (zh) * 2015-11-25 2016-02-24 浙江百山祖生物科技有限公司 一种近红外光谱检测灵芝提取物多糖含量的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103364359A (zh) * 2012-04-11 2013-10-23 天士力制药集团股份有限公司 Simca模式识别法在近红外光谱识别大黄药材中的应用
CN103884676A (zh) * 2014-02-27 2014-06-25 浙江大学 一种中药材多指标成分含量的快速测定方法
CN105352913A (zh) * 2015-11-25 2016-02-24 浙江百山祖生物科技有限公司 一种近红外光谱检测灵芝提取物多糖含量的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王冬等.偏最小二乘-判别分析模型影响因素初步研究.食品安全质量检测学报.2016,7(2),第445-452页. *
申云霞等.不同采收期滇龙胆的红外光谱鉴别研究.光谱学与光谱分析.2016,36(5),第1358-1362页. *

Also Published As

Publication number Publication date
CN116429718A (zh) 2023-07-14

Similar Documents

Publication Publication Date Title
CN104062263B (zh) 光物性相近水果品质指标的近红外通用模型检测方法
Fortier et al. Identification of cotton and cotton trash components by Fourier transform near-infrared spectroscopy
CN101692052B (zh) 基于超光谱图像技术的名优茶真伪鉴别方法及装置
CN104990892B (zh) 种子的光谱图像无损鉴别模型建立方法及种子鉴别方法
CN103344602A (zh) 一种基于近红外光谱的水稻种质真伪无损检测方法
CN102706813B (zh) 基于高光谱图像的草地早熟禾品种识别方法
CN113008817A (zh) 一种基于高光谱成像技术快速鉴别苦杏仁真伪优劣的方法
CN108072626A (zh) 一种沥青品牌识别方法
CN102937575B (zh) 一种基于二次光谱重组的西瓜糖度快速建模方法
CN102288551A (zh) 利用高光谱数据鉴别中药材的方法
CN103411906A (zh) 珍珠粉和贝壳粉的近红外光谱定性鉴别方法
CN110749565A (zh) 一种快速鉴别普洱茶存储年份的方法
CN104345045A (zh) 一种基于化学模式识别和近红外光谱的相似药材鉴别方法
CN107132194A (zh) 一种基于紫外可见光谱及化学模式识别的三七及其伪品鉴别方法
CN101620178B (zh) 基于近红外光谱技术快速检测中成药、保健食品或食品中添加化学成分的方法
CN104297206A (zh) 一种液态牛奶品牌快速鉴别方法
CN113008805A (zh) 基于高光谱成像深度分析的白芷饮片质量预测方法
Hu et al. Comparison and application of fluorescence EEMs and DRIFTS combined with chemometrics for tracing the geographical origin of Radix Astragali
CN116429718B (zh) 一种不同采收月份唐古特大黄药材的多元红外光谱判别方法、系统、存储介质及终端
CN107101972B (zh) 一种近红外光谱快速检测三叶青产地方法
CN203572772U (zh) 基于多波长led荧光光谱的云端中药品质检测系统
CN103076300B (zh) 专属性模式识别模型判别分析中药材资源指纹信息的方法
CN105334183A (zh) 一种基于近红外光谱鉴别法定麻黄药材的方法
CN111912823A (zh) 一种多成分农药残留荧光检测分析方法
CN105606544A (zh) 无损检测冬虫夏草虫体真伪的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant