CN113376117A - 一种当归的近红外在线质量检测方法 - Google Patents

一种当归的近红外在线质量检测方法 Download PDF

Info

Publication number
CN113376117A
CN113376117A CN202110221860.8A CN202110221860A CN113376117A CN 113376117 A CN113376117 A CN 113376117A CN 202110221860 A CN202110221860 A CN 202110221860A CN 113376117 A CN113376117 A CN 113376117A
Authority
CN
China
Prior art keywords
angelica
dimensional
convolution
infrared
angelica sinensis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110221860.8A
Other languages
English (en)
Inventor
蔡宝昌
刘晓
王天舒
金俊杰
秦昆明
李伟东
杨超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Haichang Chinese Medicine Group Co ltd
Nanjing Haiyuan Chinese Herbal Pieces Co ltd
Original Assignee
Nanjing Haichang Chinese Medicine Group Co ltd
Nanjing Haiyuan Chinese Herbal Pieces Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Haichang Chinese Medicine Group Co ltd, Nanjing Haiyuan Chinese Herbal Pieces Co ltd filed Critical Nanjing Haichang Chinese Medicine Group Co ltd
Priority to CN202110221860.8A priority Critical patent/CN113376117A/zh
Publication of CN113376117A publication Critical patent/CN113376117A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N1/00Sampling; Preparing specimens for investigation
    • G01N1/28Preparing specimens for investigation including physical details of (bio-)chemical methods covered elsewhere, e.g. G01N33/50, C12Q
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明公开了一种当归的近红外在线质量检测方法,包括以下步骤:(1)样品制备:取不同产地、不同批次的当归饮片样品;(2)近红外光谱数据采集:同时采集并记录当归样品的近红外光谱图和当归打粉后的近红外光谱图;(3)对光谱数据进行预处理:分别采用原始光谱、一阶求导、二阶求导、多元散射校正、矢量归一化、卷积平滑滤波、多元散射校正+矢量归一化、卷积平滑滤波+多元散射校正、卷积平滑滤波+矢量归一化对光谱数据进行预处理;(4)采用卷积神经网络、偏最小二乘回归方法或分段PLSR进行模型筛选,建立当归定量校正模型。本发明方法操作快速、简单,所建立的模型准确可靠,可用于当归饮片中阿魏酸和水分含量的定量分析。

Description

一种当归的近红外在线质量检测方法
技术领域
本发明属于药材检测技术领域;具体涉及一种基于偏最小二乘回归方法(PLSR)的当归的近红外质量检测方法。
背景技术
当归为伞形科植物当归Angelica sinensis(Oliv.)Diels的干燥根,是我国传统中药材,最早记载在《神农本草经》中,已有2000多年药用历史。具有补血活血、调经止痛、润肠通便的功效。近年来,医药市场中存在将当归属的一些植物,其根部在干燥或切片后冒充当归使用,严重影响当归质量,故提升当归质量检测势在必行。
目前《中华人民共和国药典2020年版》当中当归的检测指标包括性状鉴别、薄层鉴别、醇浸出物含量鉴别、挥发油含量测定及高效液相含量测定。当归分布地域广泛,客观上给其质量评价带来了困难。尽管已有许多学者在性状及显微研究、薄层色谱鉴别、醇浸出物、理化鉴定、微量元素、指纹图谱等多个方面对其质量进行了大量评价与分析,但目前在质量控制方面还是存在许多不足。尤其当归炮制品的质量评价,中药本身所含化学成分复杂,经炮制后产生的变化就更加复杂,亦应根据其炮制后的变化制定质量评价方法。
本发明采用基于偏最小二乘回归方法(PLSR)的近红外质量检测方法,通过原材料质量检测、提取过程检测等环节,建立提取物生产在线检测体系,可有效解决生产检测中存在的取样不便、效率低下、污染环境等诸多弊端,提高产品质量;同时为反应终止提供指导,减少能源消耗,实现提取物绿色生产。
发明内容
为解决以上技术问题,本发明提供了一种基于偏最小二乘回归方法(PLSR)的当归的近红外质量检测方法。本发明筛选出的检测方法,所建立的模型准确可靠,操作快速、简单,不需要提取步骤,可无损检测,可广泛用于当归饮片中阿魏酸和水分含量的定量分析。
为实现以上目的,本发明提供的技术方案如下:
一种当归的近红外在线质量检测方法,包括以下步骤:
(1)样品制备:取不同产地、不同批次的当归饮片样品;
(2)近红外光谱数据采集:同时采集并记录当归样品的近红外光谱图和当归打粉后的近红外光谱图;
(3)对光谱数据进行预处理:分别采用原始光谱(Spectrum)、一阶求导(Firstderivative, 1stD)、二阶求导(Second derivative, 2stD)、多元散射校正(MSC)、矢量归一化(SNV)、卷积平滑滤波(Savitzky-Golay filter, S-G)、多元散射校正+矢量归一化、卷积平滑滤波+多元散射校正、卷积平滑滤波+矢量归一化对光谱数据进行预处理;
(4)采用卷积神经网络(CNN,模型面向全体光谱波段)、偏最小二乘回归方法(PLSR)或分段PLSR(模型可选择全体光谱波段的部分波段信息)进行模型筛选,建立当归定量校正模型。
作为优选方案,以上所述的一种当归的近红外在线质量检测方法,步骤(4)采用卷积神经网络建立当归定量校正模型时,卷积神经网络模型包括一层一维卷积池化层、一层二维卷积池化层和一层全连接层;一维卷积池化层将输入的一维向量转化成二维矩阵;一维卷积池化层包括一维卷积操作、激活操作与池化操作,其中一维卷积操作卷积核的数目为32个,大小为10*1,卷积的步长为6;并由修正线性单元(RectifiedLiner Unit,ReLU)完成激活操作,使神经网络中的神经元具有稀疏激活性;池化操作使用平均池化模型,每次取10*1的池化窗口,步长设为2;之后,将经过一维卷积池化层得到的二维矩阵输入至二维卷积池化层,并经过二维卷积操作、激活操作与二维池化操作,将其转化成多个二维矩阵;二维卷积操作中卷积核数目为64个,大小为10*32;将二维卷积池化层得到的二维矩阵输入至全连接层,输出一维高阶向量;
并采用学习率衰减机制,学习率初始值设为0.03,衰减指数为1/e,在网络训练的过程中随时间逐步衰减学习率进行动态调整,每层权重初始值服从标准差为0.1的零均值高斯分布。
作为优选方案,以上所述的当归的近红外在线质量检测方法,步骤(2)中将100批当归饮片全部打粉过5号筛,分别测100批当归饮片和打粉后当归的近红外光谱图,打粉后的样品取约10 g加入石英样品管中,填实压平样品;未打粉的样品选取平整的样品,使之与近红外漫反射光纤探头能够充分接触;测试环境温度为25 ℃,相对湿度为45 %~60 %,以仪器内置背景为参比,扣除背景,采集方式为积分球漫反射,波数区间12000~4000 cm-1,分辨率为8 cm-1,扫描次数64次,每份样品扫描2次,取其平均光谱作为样品的近红外光谱。
为优选方案,以上所述的当归的近红外在线质量检测方法,步骤(4)中,采用偏最小二乘回归方法(PLSR)建立当归定量校正模型。
PLSR模型优化和建立
本发明中近红外光谱的定量模型设计采用Python编程语言,集成开发环境为PyCharm Coummunity,操作系统为Windows 10。
在建立定量校正模型之前,对原始光谱进行预处理,从而避免在测定过程中存在高频噪音、散射光、杂散光、样品状态和仪器响应等诸多因素的影响。光谱的预处理可以去除不必要信息,提高模型的预测精度。本模型针对不同成分,采用不同的光谱预处理方法,包括:原始光谱(Spectrum)、一阶求导(First derivative, 1stD)、二阶求导(Secondderivative, 2stD)、多元散射校正(MSC)、矢量归一化(SNV)、卷积平滑滤波(Savitzky-Golay filter, S-G)、多元散射校正+矢量归一化、卷积平滑滤波+多元散射校正、卷积平滑滤波+矢量归一化。
选择合适的光谱波段,可以减少光谱中多余的信息,提高模型的预测精度。同时,利用PLSR方法建模时,不同的主成分数会对模型预测结果产生较大的影响。若主成分数过高,会产生“过拟合”的现象,但若主成分数过少,则利用的光谱信息过少。以R值,均方根误差(RMSE)和校正均方差(RMSEC)为指标,粉末-阿魏酸的最优预处理方法为矢量归一化,最佳光谱波段为6785.39~5053.36cm-1 ,选择的主成分数为5;粉末-水分的最优预处理方法为多元散射校正+矢量归一化,最佳光谱波段为11221.55~11032.53cm-1 ,选择的主成分数为13;饮片-阿魏酸的最优预处理方法为一阶求导,最佳光谱波段为5049.50~3996.40cm-1 ,选择的主成分数为4;饮片-水分的最优预处理方法为卷积平滑滤波+多元散射校正,最佳光谱波段为10064.29~9682.39cm-1 ,选择的主成分数为2。校正模型及评价参数如表1所示。
表1 PLSR模型及评价参数
Figure 1
有益效果:本发明相比现有技术的优势在于:
1、相较于传统经验鉴别以及指标成分含量测定,本发明可实时、快速、无损地评判当归的品质。验证结果表明,本发明提供的方法操作快速、简单,所建立的模型准确可靠,
2、本发明为当归质量控制提供新的质量检测方法,对市场当归的质量监管提供新的科学依据,具有广阔的应用前景。
3、本发明采用傅里叶变换近红外(NIR)分析技术采集当归饮片近红外光谱图,样品预处理方法包括打粉与直接测定,利用化学计量学方法对原始光谱进行预处理,优化主因子数并选择最佳波段,以偏最小二乘回归(PLSR)法建立NIR定量分析模型,可用于当归饮片中阿魏酸和水分含量的定量分析。
附图说明
图1为当归饮片打粉后的近红外光谱图;
图2为当归饮片未打粉的近红外光谱图。
图3 当归对照品(A)和样品(B)测试色谱图(1.阿魏酸)。
具体实施方式
下面通过具体实施例对本发明进行说明,以使本发明技术方案更易于理解、掌握,但本发明并不局限于此。下述实施例中所述实验方法,如无特殊说明,均为常规方法;所述试剂和材料,如无特殊说明,均可从商业途径获得。
实施例1
1. 实验材料
1.1试验药材
当归饮片共100批,全部来自南京海源中药饮片有限公司,具体如表1所示。
表1 100批当归饮片的来源
产地 甘肃 贵州 湖北 宁夏 青海 山西 陕西 四川 云南
数量 17 4 8 11 10 9 4 8 29
1.1实验仪器与试剂
Bruker-Tensor37傅里叶变换中、近红外光谱仪,包括OPUS5.0软件、Pbs检测器(德国Bruker公司);Waters e2695高效液相色谱仪(美国Waters公司)Waters2998紫外检测器;万分之一天平BSA2245-CW(北京赛多利斯科学仪器有限公司);AG-285型十万分之一天平(瑞士METTLER TOLEDO公司);KY-500E型超声波清洗器(昆山市超声仪器有限公司);HH-6数显恒温水浴锅(常州国华电器有限公司);Milli-Q超纯水仪(美国Millipore公司);GeneSpeed X1微量离心机(基因生物技术国际贸易上海有限公司)。
阿魏酸对照品(批号:110773-201614,含量≥99 %)购自中国食品药品检定研究所。磷酸为色谱纯(上海阿拉丁科技股份有限公司),甲醇,乙腈为色谱纯(美国TEDIA有限公司)。
2.实验方法与结果
2.1 近红外光谱的采集
将100批当归饮片全部打粉过5号筛,分别测100批当归饮片和打粉后的近红外光谱图。具体操作为:打粉后的样品取约10 g加入石英样品管中,填实压平样品;未打粉的样品选取平整的样品,使之与近红外漫反射光纤探头能够充分接触。测试环境温度为25 ℃,相对湿度为45 %~60 %。以仪器内置背景为参比,扣除背景。采集方式为积分球漫反射,波数区间12000~4000 cm-1,分辨率为8 cm-1,扫描次数64次,每份样品扫描2次,取其平均光谱作为样品的近红外光谱。当归饮片打粉与未打粉的近红外光谱图分别如图1与图2所示。
2.2 阿魏酸的含量测定
2.2.1 供试品溶液的制备
参照中国药典2020年版一部当归含量测定项下要求进行供试品溶液制备:
取本品粉末(过三号筛)约0.2g,精密称定,置具塞锥形瓶中,精密加入70%甲醇20ml,密塞,称定重量,加热回流30分钟,放冷,再称定重量,用70%甲醇补足减失的重量,摇匀,静置,取上清液滤过,取续滤液,即得。
2.2.2对照品溶液的制备
取阿魏酸对照品适量,精密称定,置棕色量瓶中,加70%甲醇制成每1ml含12μg的溶液,即得
2.2.3色谱条件
色谱条件与系统适用性试验 以十八烷基硅烷键合硅胶为填充剂;以乙腈-0.085%磷酸溶液(17∶83)为流动相;检测波长为316nm;柱温35°C。理论板数按阿魏酸峰计算应不低于5000。进样量10 μL。色谱图见图3。
2.3 当归饮片的水分测定
按照中国药典2020版四部水分测定法(通则0832)第四法甲苯法测定100批当归饮片的水分。
3. 当归近红外光谱定量模型的建立
3.1 加入SPXY算法后的建模结果
PLSR:确定主成分数目与最优预处理方法(采用spxy算法取校正集与验证集,校正集占比80%,验证集占比20%)。求不同主成分数目与不同预处理方法下的预测集R2值、校正集R2值、RMSEP值与RMSEC值。预测集R2值越高,RMSEP值越低模型越好。
3.1.1当归打粉与阿魏酸含量建模
参数取主成分=2,预处理为矢量归一化(SNV),取整个光谱。80%训练, 20%测试。测试集20个样本的误差,相对误差绝对值的平均值为0.208713。预 测集R2值、校正集R2值、RMSEP值与RMSEC值分别为0.16868、0.09190、0.00022 与0.0003。
3.1.2 当归打粉与水分建模
参数取主成分=5,预处理为MSC+SNV,取整个光谱。80%训练,20%测试。测试集20个样本的平均绝对误差为0.004618,相对误差绝对值的平均值为0.099082。预测集R2值、校正集R2值、RMSEP值与RMSEC值分别为-0.40448、0.17346、0.01977与0.03446。
3.1.3 当归未打粉与阿魏酸含量建模
参数取主成分=1,预处理为卷积平滑,取整个光谱。80%训练,20%测试。测试集20个样本的相对误差绝对值的平均值为0.222061。预测集R2值、校正集R2值、RMSEP值与RMSEC值分别为-0.01258、0.00234、0.00022与0.00032。
3.1.3 当归未打粉与当归苷含量建模
参数取主成分=1,预处理为MSC+SNV,取整个光谱。80%训练,20%测试。测试集20个样本的平均绝对误差为0.012811,相对误差绝对值的平均值为0.18058。预测集R2值、校正集R2值、RMSEP值与RMSEC值分别为-2.0023、0.03505、0.0176与0.0346。
3.2 加入SPXY分段算法后的建模结果
PLSR:确定最优波段、最优主成分数目与最优预处理方法(采用spxy算法取校正集与验证集,校正集占比80%,验证集占比20%)。比较不同波段、不同主成分数目与不同预处理方法下的预测集R2值。越接近1,结果越好。
3.2.1 打粉-含量
波段长度为50时的建模结果,当波段为850-899,主成分数目为5,预处理方法为MSC+SNV时,结果最优,预测集R2值为0.2250。
波段长度为100时的建模结果,当波段为1500-1599,主成分数目为4,预处理方法为SG时,结果最优,预测集R2值为0.2079。
波段长度为150时的建模结果,当波段为1350-1499,主成分数目为3,预处理方法为MSC+SNV时,结果最优,预测集R2值为0.2014。
波段长度为200时的建模结果,当波段为1200-1399,主成分数目为4,预处理方法为MSC+SNV时,结果最优,预测集R2值为0.2304。
波段长度为250时的建模结果,当波段为1250-1499,主成分数目为4,预处理方法为MSC+SNV时,结果最优,预测集R2值为0.2170。
波段长度为300时的建模结果,当波段为1200-1499,主成分数目为4,预处理方法为MSC+SNV时,结果最优,预测集R2值为0.1989。
波段长度为350时的建模结果,当波段为1400-1749,主成分数目为5,预处理方法为SNV+SG时,结果最优,预测集R2值为0.1901。
波段长度为400时的建模结果,当波段为1600-1999,主成分数目为6,预处理方法为SG时,结果最优,预测集R2值为0.1905。
波段长度为450时的建模结果,当波段为1350-1799,主成分数目为5,预处理方法为SNV时,结果最优,预测集R2值为0.1953。
波段长度为500时的建模结果,当波段为1000-1499,主成分数目为5,预处理方法为MSC+SG时,结果最优,预测集R2值为0.2285。
波段长度为550时的建模结果,当波段为1100-1649,主成分数目为3,预处理方法为MSC+SG时,结果最优,预测集R2值为0.2262。
波段长度为600时的建模结果,当波段为1200-1799,主成分数目为5,预处理方法为SNV+SG时,结果最优,预测集R2值为0.0194。
综上可见波段长度为450时,筛选1350-1799波段最优,主成分数目为5,预处理方法为SNV时,80%训练,20%测试。测试集20个样本的误差,平均绝对误差为0.0000213,相对误差绝对值的平均值为0.2013。预测集R2值、校正集R2值、RMSEP值与RMSEC值分别为0.19531、0.0002、0.0034与0.0003。
3.2.2 打粉-水分
波段长度为50时的建模结果,当波段为200-249,主成分数目为13,预处理方法为MSC+SNV时,结果最优,预测集R2值为0.11187。
波段长度为100时的建模结果,当波段为300-399,主成分数目为4,预处理方法为MSC+SG时,结果最优,预测集R2值为-0.0970。
波段长度为150时的建模结果,当波段为1250-1399,主成分数目为13,预处理方法为SNV时,结果最优,预测集R2值为-0.1123。
波段长度为200时的建模结果,当波段为1200-1399,主成分数目为3,预处理方法为SNV+SG时,结果最优,预测集R2值为-0.0559。
波段长度为250时的建模结果,当波段为750-999,主成分数目为1,预处理方法为SNV时,结果最优,预测集R2值为-0.1015。
波段长度为300时的建模结果,当波段为1200-1499,主成分数目为1,预处理方法为MSC+SG时,结果最优,预测集R2值为-0.0295。
波段长度为350时的建模结果,当波段为700-1049,主成分数目为1,预处理方法为SNV时,结果最优,预测集R2值为-0.1127。
波段长度为400时的建模结果,当波段为1200-1599,主成分数目为1,预处理方法为MSC+SG时,结果最优,预测集R2值为-0.1067。
波段长度为550时的建模结果,当波段为1100-1649,主成分数目为10,预处理方法为SNV时,结果最优,预测集R2值为-0.1118。
波段长度为600时的建模结果,当波段为1200-1799,主成分数目为1,预处理方法为SNV时,结果最优,预测集R2值为-0.1915。
波段长度为650时的建模结果,当波段为0-649,主成分数目为4,预处理方法为SNV时,结果最优,预测集R2值为-0.3396。
波段长度为700时的建模结果,当波段为0-699,主成分数目为4,预处理方法为SNV时,结果最优,预测集R2值为-0.4204。
波段长度为750时的建模结果,当波段为750-1499,主成分数目为2,预处理方法为SNV时,结果最优,预测集R2值为-0.2665。
波段长度为800时的建模结果,当波段为1600-2074,主成分数目为1,预处理方法为MSC+SG时,结果最优,预测集R2值为-0.2705。
综上可见波段长度为50时,筛选200-249波段最优,主成分数目为13,预处理方法为SNV+MSC时,80%训练,20%测试。测试集20个样本的误差,平均绝对误差为0.001275,相对误差绝对值的平均值为0.0486。预测集R2值、校正集R2值、RMSEP值与RMSEC值分别为0.11187、0.18909、0.01572与0.03649。
3.2.3 未打粉-含量
波段长度为50时的建模结果,当波段为1800-1849,主成分数目为17,预处理方法为SNV+SG时,结果最优,预测集R2值为0.2882。
波段长度为100时的建模结果,当波段为900-999,主成分数目为1,预处理方法为MSC时,结果最优,预测集R2值为0.0697。
波段长度为150时的建模结果,当波段为300-449,主成分数目为4,预处理方法为MSC+SG时,结果最优,预测集R2值为0.2004。
波段长度为200时的建模结果,当波段为1600-1799,主成分数目为8,预处理方法为SG时,结果最优,预测集R2值为0.0287。
波段长度为250时的建模结果,当波段为0-249,主成分数目为3,预处理方法为SNV时,结果最优,预测集R2值为0.0120。
波段长度为300时的建模结果,当波段为1800-2099,主成分数目为4,预处理方法为一阶时,结果最优,预测集R2值为0.2787
波段长度为350时的建模结果,当波段为1750-2099,主成分数目为3,预处理方法为二阶时,结果最优,预测集R2值为0.2316。
波段长度为400时的建模结果,当波段为0-399,主成分数目为2,预处理方法为MSC时,结果最优,预测集R2值为0.0381。
波段长度为450时的建模结果,当波段为1800-2249,主成分数目为4,预处理方法为一阶时,结果最优,预测集R2值为0.2787。
波段长度为500时的建模结果,当波段为0-499,主成分数目为1,预处理方法为MSC时,结果最优,预测集R2值为0.0209。
波段长度为550时的建模结果,当波段为1650-2199,主成分数目为1,预处理方法为二阶时,结果最优,预测集R2值为0.0880。
波段长度为600时的建模结果,当波段为1800-2399,主成分数目为4,预处理方法为一阶时,结果最优,预测集R2值为0.2787。
综上可见波段长度为300时,筛选1800-2099波段最优。主成分数目为4,预处理方法为一阶时,80%训练,20%测试。测试集20个样本的误差,平均绝对误差为0.0000562,相对误差绝对值的平均值为0.2084。预测集R2值、校正集R2值、均方根误差(RMSEP)和校正均方差(RMSEC)值分别为0.27873、0.86357、0.00018与0.00012。
3.2.4 未打粉-水分
波段长度为50时的建模结果,当波段为200-245,主成分数目为4,预处理方法为MSC+SG时,结果最优,预测集R2值为-0.0607。
波段长度为100时的建模结果,当波段为500-599,主成分数目为2,预处理方法为MSC+SG时,结果最优,预测集R2值为0.2186。
波段长度为150时的建模结果,当波段为600-749,主成分数1,预处理方法为MSC+SG时,结果最优,预测集R2值为0.0109。
波段长度为200时的建模结果,当波段为200-399,主成分数目为4,预处理方法为MSC+SG时,结果最优,预测集R2值为0.1410。
波段长度为250时的建模结果,当波段为750-999,主成分数目为1,预处理方法为MSC+SG时,结果最优,预测集R2值为-0.4948。
波段长度为300时的建模结果,当波段为1200-1499,主成分数目为1,预处理方法为MSC+SG时,结果最优,预测集R2值为-0.5328。
波段长度为350时的建模结果,当波段为350-699,主成分数目为1,预处理方法为MSC+SG时,结果最优,预测集R2值为-0.7047。
波段长度为400时的建模结果,当波段为1200-1599,主成分数目为1,预处理方法为MSC+SG时,结果最优,预测集R2值为-0.4037。
波段长度为450时的建模结果,当波段为0-449,主成分数目为2,预处理方法为MSC时,结果最优,预测集R2值为-0.4076。
波段长度为500时的建模结果,当波段为1500-1999,主成分数目为1,预处理方法为MSC+SG时,结果最优,预测集R2值为-0.3362。
波段长度为550时的建模结果,当波段为0-549,主成分数目为4,预处理方法为MSC+SG时,结果最优,预测集R2值为-0.4169。
波段长度为600时的建模结果,当波段为0-599,主成分数目为5,预处理方法为MSC时,结果最优,预测集R2值为-1.0430。
综上可见波段长度为100时,筛选500-599波段最优。主成分数目为2,预处理方法为MSC+SG时,80%训练,20%测试。测试集20个样本的误差,平均绝对误差为0.002122,相对误差绝对值的平均值为0.0390。预测集R2值、校正集R2值、RMSEP值与RMSEC值分别为0.21861、0.0328、0.0090与0.0349。
PLSR模型检验
将未参加建模的测试集样品进行外部验证。将样品输入定量模型中,得到预测值,通过预测值与常规方法所得到的真实值的相对偏差来考察模型的预测能力。检验结果如表2所示。通过当归粉末建立的水分模型预测值和真实值的相对误差绝对值的平均值为4.86%;通过当归饮片建立的水分模型预测值和真实值的相对误差绝对值的平均值3.90%;通过当归粉末建立的阿魏酸含量模型预测值和真实值的相对误差绝对值的平均值为20.1%;通过当归饮片建立的阿魏酸模型预测值和真实值的相对误差绝对值的平均值为20.8%。上述结果表明,水分的预测值与真实值的相对误差小,预测结果准确,模型建立成功。阿魏酸含量的预测值与真实值的相对误差较小,预测结果较为准确。
表2测试集样品预测结果
Figure DEST_PATH_IMAGE004
上述详细说明是针对本发明其中之一可行实施例的具体说明,该实施例并非用以限制本发明的专利范围,凡未脱离本发明所为的等效实施或变更,均应包含于本发明技术方案的范围内。

Claims (5)

1.一种当归的近红外在线质量检测方法,其特征在于,包括以下步骤:
(1)样品制备:取不同产地、不同批次的当归饮片样品;
(2)近红外光谱数据采集:同时采集并记录当归样品的近红外光谱图和当归打粉后的近红外光谱图;
(3)对光谱数据进行预处理:分别采用原始光谱、一阶求导、二阶求导、多元散射校正、矢量归一化、卷积平滑滤波、多元散射校正+矢量归一化、卷积平滑滤波+多元散射校正、卷积平滑滤波+矢量归一化对光谱数据进行预处理;
(4)采用卷积神经网络、偏最小二乘回归方法或分段PLSR进行模型筛选,建立当归定量校正模型。
2.根据权利要求1所述的一种当归的近红外在线质量检测方法,其特征在于,步骤(4)采用卷积神经网络建立当归定量校正模型时,卷积神经网络模型包括一层一维卷积池化层、一层二维卷积池化层和一层全连接层;一维卷积池化层将输入的一维向量转化成二维矩阵;一维卷积池化层包括一维卷积操作、激活操作与池化操作,其中一维卷积操作卷积核的数目为32个,大小为10*1,卷积的步长为6;并由修正线性单元(RectifiedLiner Unit,ReLU)完成激活操作,使神经网络中的神经元具有稀疏激活性;池化操作使用平均池化模型,每次取10*1的池化窗口,步长设为2;之后,将经过一维卷积池化层得到的二维矩阵输入至二维卷积池化层,并经过二维卷积操作、激活操作与二维池化操作,将其转化成多个二维矩阵;二维卷积操作中卷积核数目为64个,大小为10*32;将二维卷积池化层得到的二维矩阵输入至全连接层,输出一维高阶向量;
并采用学习率衰减机制,学习率初始值设为0.03,衰减指数为1/e,在网络训练的过程中随时间逐步衰减学习率进行动态调整,每层权重初始值服从标准差为0.1的零均值高斯分布。
3.根据权利要求1所述的当归的近红外在线质量检测方法,其特征在于,步骤(2)中将100批当归饮片全部打粉过5号筛,分别测100批当归饮片和打粉后当归的近红外光谱图,打粉后的样品取约10 g加入石英样品管中,填实压平样品;未打粉的样品选取平整的样品,使之与近红外漫反射光纤探头能够充分接触;测试环境温度为25 ℃,相对湿度为45 %~60 %,以仪器内置背景为参比,扣除背景,采集方式为积分球漫反射,波数区间12000~4000 cm-1,分辨率为8 cm-1,扫描次数64次,每份样品扫描2次,取其平均光谱作为样品的近红外光谱。
4.根据权利要求1所述的当归的近红外在线质量检测方法,其特征在于,步骤(4)中,采用偏最小二乘回归方法(PLSR)建立当归定量校正模型。
5.根据权利要求4所述的当归的近红外在线质量检测方法,其特征在于,偏最小二乘回归方法(PLSR)建立当归定量校正模型的最佳参数如下:
Figure DEST_PATH_IMAGE002
CN202110221860.8A 2021-02-27 2021-02-27 一种当归的近红外在线质量检测方法 Pending CN113376117A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110221860.8A CN113376117A (zh) 2021-02-27 2021-02-27 一种当归的近红外在线质量检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110221860.8A CN113376117A (zh) 2021-02-27 2021-02-27 一种当归的近红外在线质量检测方法

Publications (1)

Publication Number Publication Date
CN113376117A true CN113376117A (zh) 2021-09-10

Family

ID=77569632

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110221860.8A Pending CN113376117A (zh) 2021-02-27 2021-02-27 一种当归的近红外在线质量检测方法

Country Status (1)

Country Link
CN (1) CN113376117A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114783539A (zh) * 2022-04-28 2022-07-22 山东大学 一种基于光谱聚类的中药成分分析方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112414967A (zh) * 2020-11-17 2021-02-26 南京中医药大学 一种快速实时检测蒲黄炭炮制的近红外质控方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112414967A (zh) * 2020-11-17 2021-02-26 南京中医药大学 一种快速实时检测蒲黄炭炮制的近红外质控方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
白 钢等: "基于质量综合评价指数的药材品质快速评价", 《中草药》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114783539A (zh) * 2022-04-28 2022-07-22 山东大学 一种基于光谱聚类的中药成分分析方法及系统

Similar Documents

Publication Publication Date Title
CN108519348A (zh) 甘草药材近红外定量分析模型及检测方法和标准
CN101231274B (zh) 近红外光谱快速测定山药中尿囊素含量的方法
CN103776777B (zh) 一种用近红外光谱技术识别不同生长方式人参及对人参中组分含量测定的方法
Shao et al. Fast determination of two atractylenolides in Rhizoma Atractylodis Macrocephalae by Fourier transform near-infrared spectroscopy with partial least squares
CN102288572A (zh) 利用近红外光谱技术快速检测中药药材指标性成分含量的方法
CN103487395A (zh) 一种重楼药材多指标快速检测方法
CN109490246A (zh) 一种前胡药材质量的快速检测方法
CN107102015B (zh) 七叶一枝花的鉴定方法
CN107449753A (zh) 近红外光谱快速测定槐花炮制品中芦丁含量的方法
CN108051396B (zh) 一种心可舒片有效成分含量的快速检测方法
CN108663337B (zh) 一种测定丹参酮类成分的方法及其应用
CN113376117A (zh) 一种当归的近红外在线质量检测方法
CN110231305A (zh) 一种测定奇亚籽中dpph自由基清除能力的方法
CN113655027A (zh) 一种近红外快速检测植物中单宁含量的方法
CN113376116A (zh) 一种地黄的近红外在线质量检测方法
CN107271396A (zh) 一种茶叶中总黄酮含量的快速检测方法
CN112834456A (zh) 一种白芍的近红外在线质量检测方法
CN111380832A (zh) 复方甘草片有效成分含量测定校正模型构建、检测方法
CN112684023A (zh) 一种厚朴药材质量的快速检测方法和厚朴药材的筛选方法
CN110320286B (zh) 小柴胡颗粒有效成分的含量测定方法
CN113466169A (zh) 近红外光谱测定黄精皂苷含量的方法
CN108072628A (zh) 一种判别药包材材质的近红外光谱法
CN113376118A (zh) 一种基于偏最小二乘回归法的黄芩近红外在线质量检测方法
Zhong et al. Online quality control of panaxatriol saponins percolation extraction using near-infrared technology
CN113376119A (zh) 一种白术的近红外在线质量检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210910