CN117690510B - 基于色谱分析技术的天然提取物检测方法及系统 - Google Patents

基于色谱分析技术的天然提取物检测方法及系统 Download PDF

Info

Publication number
CN117690510B
CN117690510B CN202410155092.4A CN202410155092A CN117690510B CN 117690510 B CN117690510 B CN 117690510B CN 202410155092 A CN202410155092 A CN 202410155092A CN 117690510 B CN117690510 B CN 117690510B
Authority
CN
China
Prior art keywords
chromatographic peak
chromatographic
sequence
peak sequence
sampling time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410155092.4A
Other languages
English (en)
Other versions
CN117690510A (zh
Inventor
周悦
张琳涵
刘子豪
张胜
舒青列
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yangxian Aladdin Bioengineering Co ltd
Original Assignee
Yangxian Aladdin Bioengineering Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yangxian Aladdin Bioengineering Co ltd filed Critical Yangxian Aladdin Bioengineering Co ltd
Priority to CN202410155092.4A priority Critical patent/CN117690510B/zh
Publication of CN117690510A publication Critical patent/CN117690510A/zh
Application granted granted Critical
Publication of CN117690510B publication Critical patent/CN117690510B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Treatment Of Liquids With Adsorbents In General (AREA)

Abstract

本申请涉及色谱分析技术领域,提出了基于色谱分析技术的天然提取物检测方法及系统,包括:采集色谱数据序列;基于色谱峰序列中相邻采样时刻之间的数据关联性以及色谱峰曲线的平滑程度确定峰形谱线轮廓失真系数;基于峰形谱线轮廓失真系数以及每个采样时刻关于色谱峰的对称关系确定色谱峰形非对称偏移评估系数;基于色谱峰形非对称偏移评估系数以及色谱峰序列中能量的集中程度确定样品峰形干扰显著指数;基于样品峰形干扰显著指数确定每个采样时刻卡尔曼增益的噪声评估系数;采用卡尔曼增益算法基于所述卡尔曼增益的噪声评估系数得到天然提取物待检测样品的检测结果。本申请解决卡尔曼滤波算法中对噪声假设固定的缺陷,提高检测结果的准确性。

Description

基于色谱分析技术的天然提取物检测方法及系统
技术领域
本申请涉及色谱分析技术领域,具体涉及基于色谱分析技术的天然提取物检测方法及系统。
背景技术
天然提取物是指天然来源(如植物、动物或微生物)中提取的化学物质或化合物,天然提取物具备多种功效和用途,在药物、食品和化妆品等领域被广泛应用。天然提取物的浓度和纯净度对其功效起着决定性作用,但是在提取过程中容易受到杂质干扰和共聚物的干扰,因此需要对天然提取物的浓度和纯净度是否达标进行精细化成分检测。色谱分析技术主要利用提取物在色谱柱中固定相与流动相分配系数的差别,由此实现对提取物组分的定性分析。在天然提取物检测的过程中,通常是从天然来源中液态提取得到提取物,因此采用液相谱(Liquid Chromatography, LC)对纯度进行分析。
在液相色谱中,横轴表示时间,纵轴表示信号强度,当天然提取物待检测样品进入色谱柱时,不同组分会以不同的速率通过色谱柱,并在检测器处形成该组分对应的信号强度。根据每个色谱峰的形状、面积比和保留时间与标准品对照,即可确定天然提取物的组分和纯度。但是在实际过程中受到过程噪声、流速、溶剂以及提取物各个组分相互作用的影响,导致液相色谱中存在色谱变异,如峰形变异和峰高变异,需要对待检测提取物的色谱数据滤波。传统卡尔曼滤波中,卡尔曼增益与观测噪声和过程噪声有关,为了简化分析通常将噪声设定为固定值,但是色谱数据的干扰是实时变化的,故在传统的卡尔曼滤波算法中固定的噪声假设会导致滤波后信号过拟合或欠拟合,而无法真实反映提取物中的真实情况。
发明内容
本申请提供基于色谱分析技术的天然提取物检测方法及系统,以解决卡尔曼滤波在分析天然提取物待检测样品的色谱数据时滤波效果差的问题,所采用的技术方案具体如下:
第一方面,本申请一个实施例提供基于色谱分析技术的天然提取物检测方法,该方法包括以下步骤:
利用液相色谱仪采集天然提取物待检测样品每个周期的色谱数据序列;
基于每个周期的色谱数据序列中所提取的单个色谱峰序列中相邻采样时刻之间的数据关联性以及单个色谱峰曲线的平滑程度确定每个色谱峰序列中每个采样时刻的峰形谱线轮廓失真系数;
基于每个色谱峰序列中每个采样时刻的峰形谱线轮廓失真系数以及每个采样时刻关于色谱峰的对称关系确定每个色谱峰序列中每个采样时刻的色谱峰形非对称偏移评估系数;
根据每个色谱峰序列中每个采样时刻采样点距离色谱峰的远近以及每个色谱峰序列中能量的集中程度确定每个色谱峰序列中每个采样时刻的样品峰形干扰显著指数;
基于每个色谱峰序列中每个采样时刻的样品峰形干扰显著指数以及每个色谱峰序列信息量的评估结果确定每个色谱峰序列中每个采样时刻卡尔曼增益的噪声评估系数;
采用卡尔曼增益算法基于所述卡尔曼增益的噪声评估系数得到天然提取物待检测样品的检测结果。
优选的,所述基于每个周期的色谱数据序列中所提取的单个色谱峰序列中相邻采样时刻之间的数据关联性以及单个色谱峰曲线的平滑程度确定每个色谱峰序列中每个采样时刻的峰形谱线轮廓失真系数的方法为:
根据每个周期的色谱数据序列中所提取的单个色谱峰序列拟合所得色谱峰曲线上曲率的平滑程度分别确定每个色谱峰序列中每个采样时刻的局部拟合曲率最大值、最小值;
将每个色谱峰序列中每个采样时刻与每个采样时刻后一采样时刻、每个采样时刻前一采样时刻对应的信号强度之间差值的绝对值分别作为第一差值、第二差值;
将第一差值与第二差值之间的差值与每个色谱峰序列中相邻两个采样时刻之间时间间隔的比值作为每个采样时刻的强度递变差异系数;
基于每个采样时刻的强度递变差异系数、局部拟合曲率最大值和最小值确定每个色谱峰序列中每个采样时刻的峰形谱线轮廓失真系数。
优选的,所述根据每个周期的色谱数据序列中所提取的单个色谱峰序列拟合所得色谱峰曲线上曲率的平滑程度分别确定每个色谱峰序列中每个采样时刻的局部拟合曲率最大值、最小值的方法为:
将任意一个序列长度大于等于长度阈值的色谱数据序列作为一个色谱峰序列;
将每个色谱峰序列作为输入,采用曲线拟合算法获取每个色谱峰序列对应的色谱峰曲线;
将每个色谱峰序列对应的色谱峰曲线中每个采样时刻、每个采样时刻相邻前一个采样时刻和相邻后一个采样时刻对应曲率中的最大值、最小值分别作为每个采样时刻的局部拟合曲率最大值、最小值。
优选的,所述基于每个采样时刻的强度递变差异系数、局部拟合曲率最大值和最小值确定每个色谱峰序列中每个采样时刻的峰形谱线轮廓失真系数的方法为:
将以自然常数为底数,以每个色谱峰序列中每个采样时刻的局部拟合曲率最大值、最小值之间差值为指数的计算结果作为第一组成因子;
每个色谱峰序列中每个采样时刻的峰形谱线轮廓失真系数由每个采样时刻的强度递变差异系数、第一组成因子两部分组成,其中,所述峰形谱线轮廓失真系数分别与强度递变差异系数、第一组成因子成正比关系。
优选的,所述基于每个色谱峰序列中每个采样时刻的峰形谱线轮廓失真系数以及每个采样时刻关于色谱峰的对称关系确定每个色谱峰序列中每个采样时刻的色谱峰形非对称偏移评估系数的方法为:
式中,是第m个色谱峰序列中的第k个采样时刻的色谱峰形非对称偏移评估系数,/>是第m个色谱峰序列中第k个采样时刻的峰形谱线轮廓失真系数,/>是以2为底数的对数函数,/>、/>分别是第m个色谱峰序列中第k个采样时刻、峰值对应的采样时刻,/>是第m个色谱峰序列中的第k个采样时刻与其关于对称轴的对称时刻p之间时间间隔的一半,/>是调参因子。
优选的,所述根据每个色谱峰序列中每个采样时刻采样点距离色谱峰的远近以及每个色谱峰序列中能量的集中程度确定每个色谱峰序列中每个采样时刻的样品峰形干扰显著指数的方法为:
基于每个色谱峰序列中的峰值以及每个色谱峰序列中信号强度的衰减区间确定每个色谱峰序列的能量富集系数;
将每个色谱峰序列的能量富集系数与每个色谱峰序列中每个采样时刻的色谱峰形非对称偏移评估系数的乘积作为分子;
将以自然常数为底数,以每个色谱峰序列中的峰值与每个色谱峰序列中每个采样时刻的信号强度的差值为指数的计算结果为分母;
将分子与分母的比值作为每个色谱峰序列中每个采样时刻的样品峰形干扰显著指数。
优选的,所述基于每个色谱峰序列中的峰值以及每个色谱峰序列中信号强度的衰减区间确定每个色谱峰序列的能量富集系数的方法为:
将每个色谱峰序列中的峰值与0.2的差值作为分子;
将分子与每个色谱峰序列中的峰值对应信号强度衰减一半时对应的时间宽度的比值作为每个色谱峰序列的能量富集系数。
优选的,所述基于每个色谱峰序列中每个采样时刻的样品峰形干扰显著指数以及每个色谱峰序列信息量的评估结果确定每个色谱峰序列中每个采样时刻卡尔曼增益的噪声评估系数的方法为:
式中,是色谱数据中第m个色谱峰序列中第k个采样时刻的归一化噪声干扰系数,/>表示以自然常数为底数的指数函数,/>是第m个色谱峰序列中元素的信息熵,/>是第m个色谱峰序列中的第k个采样时刻的样品峰形干扰显著指数,/>是缩放因子;
是第m个色谱峰序列中第k个采样时刻卡尔曼增益的噪声评估系数,/>是取最大值函数,/>是噪声评估因子。
优选的,所述采用卡尔曼增益算法基于所述卡尔曼增益的噪声评估系数得到天然提取物待检测样品的检测结果的方法为:
将每个色谱峰序列作为输入,采用阈值分割算法得到分割阈值,将每个色谱峰序列中信号强度大于等于、小于分割阈值的元素标记为色谱峰数据、平坦数据;
将每个色谱峰序列、每个色谱峰序列中所有采样时刻卡尔曼增益的噪声评估系数作为输入,采用卡尔曼滤波算法获取每个色谱峰序列对应的增益色谱峰序列,将所述增益色谱峰序列与每个色谱峰序列中所有置为0的平坦数据的重构结果作为每个色谱峰序列对应的降噪色谱峰序列;
从天然提取物对应的现有数据库中获取标准色谱序列,将任意一个与标准色谱序列之间的相似性度量结果大于等于0.8的降噪色谱峰序列对应的天然提取物待检测样品检测结果记为标准样品,将任意一个与标准色谱序列之间的相似性度量结果小于0.8的降噪色谱峰序列对应的天然提取物待检测样品检测结果记为不达标样品。
第二方面,本申请实施例还提供了基于色谱分析技术的天然提取物检测系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一项所述基于色谱分析技术的天然提取物检测方法的步骤。
本申请的有益效果是:本申请根据色谱数据中色谱曲线和信号强度分布得到峰形谱线轮廓失真系数,反映色谱峰的光滑平整情况和色谱峰序列中各个采样点受噪声的干扰情况,并结合色谱峰对称性和高度窄峰的特点构建色谱峰形非对称偏移评估系数和样品峰形干扰显著指数,最终得到每个色谱峰序列中每个采样时刻卡尔曼增益的噪声评估系数,解决了传统卡尔曼滤波算法中对噪声假设固定的缺陷,根据各个采样时刻的受到噪声的干扰程度自适应调整噪声评估系数,提高了卡尔曼增益的准确性,增强卡尔曼滤波的稳定性和滤波精度,使得所得降噪色谱峰序列的色谱数据质量更符合天然提取物待检测样品的真实光谱数据,提高了天然提取物检测结果的准确率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一个实施例所提供的基于色谱分析技术的天然提取物检测方法的流程示意图;
图2为本申请一个实施例所提供的基于色谱分析技术的天然提取物检测方法的实施流程图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参阅图1,其示出了本申请一个实施例提供的基于色谱分析技术的天然提取物检测方法的流程图,该方法包括以下步骤:
步骤S001,利用液相色谱仪采集天然提取物待检测样品每个周期的色谱数据序列。
为了获取天然物提取物中组合及含量,本申请采用高精度液相色谱仪WatersACQUITY UPLC H-Class PLUS作为数据采集设备,将天然提取物的待检测样品放入待检测盘中,在高精度液相色谱仪检测端输出各个采样时刻的组分信号强度,设置采样的时间间隔为1ms,采样周期设定为1h。将采集得到的待检测天然提取物样品的色谱数据序列用表示,具体为/>,其中/>表示所得色谱数据序列中第k个时刻的信号强度,/>表示每个采样周期内采样点的个数。需要说明的是,色谱数据采集过程中的时间间隔、采样周期均可由实施者根据天然提取物的实际情况设置合适的值。
至此,得到每个周期的色谱数据序列,用以后续获取天然提取物待检测样品的检测结果。
步骤S002,基于每个周期的色谱数据序列中所提取的单个色谱峰序列中相邻采样时刻之间的数据关联性以及单个色谱峰曲线的平滑程度确定每个色谱峰序列中每个采样时刻的峰形谱线轮廓失真系数。
通过高精度液相色谱仪获取天然提取物待检测样品的色谱数据时,样品中的杂质、溶解度、色谱柱的流速和环境的温度、湿度都可能导致色谱数据发生色谱变异。上述各种因素对色谱数据结果的影响是动态的过程,但在传统的卡尔曼滤波算法中,通过固定的假设噪声结合观测数据和预测模型得到卡尔曼增益。因此在分析所得色谱数据时可能导致估计误差增加和滤波器性能下降,由此本申请考虑结合色谱数据评估数据干扰情况,优化卡尔曼增益提高滤波器性能,使得天然提取物待检测样品的检测结果更加精准,整个实施流程如图2所示。
具体地,在色谱数据中单个色谱峰往往表示待检测样品中的单个组分,该组分的含量越大色谱峰面积也越大。在待检测样品中往往含有多种杂质,使得得到的色谱数据中存在多个色谱峰。为了提取色谱峰的有效数据,本申请将采集得到的每个色谱数据序列作为大津阈值法的输入,输出为分割阈值/>。将每个色谱数据序列中信号强度大于等于分割阈值/>的元素标记为色谱峰数据,将每个色谱数据序列中信号强度小于分割阈值/>的元素标记为平坦数据,并将任意一个平坦数据对应采样点的信号强度置为零。其中大津阈值法为公知技术,具体过程不再赘述。
进一步地,在每个色谱数据序列中色谱数据平坦数据和色谱峰数据衔接处,可能会因为噪声干扰导致部分原本平坦数据被判定为色谱峰数据,因此,本申请针对每个色谱数据序列设置一个长度阈值,阈值大小取经验值50,将任意一个序列长度大于等于长度阈值的色谱数据序列作为一个色谱峰序列。其次,将每个色谱峰序列作为输入,采用拉普拉斯平滑拟合算法获取每个色谱峰序列对应的色谱峰曲线,将第m个色谱峰序列对应的色谱峰曲线记为,拉普拉斯平滑拟合算法为公知技术,具体过程不再赘述。在另一个实施例中,对于任意一个色谱峰序列,还可以将每个色谱峰序列作为输入,采用最小二乘拟合算法获取每个色谱峰序列对应的色谱峰曲线,最小二乘拟合算法为公知技术,具体过程不再赘述。而在理想情况下色谱峰曲线是一条光滑的曲线,因此在没有受到干扰因素影响时,色谱峰序列中各个采样时刻对应的信号强度在小范围波动。
基于上述分析,此处构建峰形谱线轮廓失真系数,用于表征每个色谱峰序列受到干扰因素的影响程度。计算第m个色谱峰序列中第k个采样时刻的峰形谱线轮廓失真系数:
式中,、/>分别是第m个色谱峰序列中第k个采样时刻的局部拟合曲率最大值、最小值,/>、/>、/>分别是色谱峰曲线/>中第k-1个、第k个、第k+1个采样时刻的曲率,/>、/>分别是取最大值函数、取最小值函数;
是第m个色谱峰序列中第k个采样时刻的强度递变差异系数,/>、/>、/>分别是第m个色谱峰序列中第k-1个、第k个、第k+1个采样时刻的信号强度,/>是每个色谱峰序列中相邻两个采样时刻之间的时间间隔;
是第m个色谱峰序列中第k个采样时刻的峰形谱线轮廓失真系数,/>表示以自然常数为底数的指数函数,/>是/>的绝对值。
其中,在第m个色谱峰序列对应的采样时间段内,采集天然提取物待检测样品的色谱数据时受到的干扰越小,相邻两个采样时刻的信号强度之间的波段程度较小,第一差值、第二差值/>的值较小,/>的值也较小;与此同时,第m个色谱峰序列对应的采样时间段内数据受到的干扰因素影响越轻微,第m个色谱峰序列中的点基本位于色谱峰曲线/>上,相邻采样时刻对应曲率之间的变化较小,/>的值较小,第一组成因子的值较小;即/>的值越小,第m个色谱峰序列中第k个采样时刻受到干扰的影响程度越低。
至此,得到每个色谱峰序列中每个采样时刻的峰形谱线轮廓失真系数,用于后续确定每个色谱峰序列中每个采样时刻卡尔曼增益的噪声评估系数。
步骤S003,基于每个采样时刻的峰形谱线轮廓失真系数以及每个采样时刻关于色谱峰的对称关系确定每个采样时刻的色谱峰形非对称偏移评估系数;基于所述色谱峰形非对称偏移评估系数结合每个色谱峰序列中能量的集中程度确定每个采样时刻的样品峰形干扰显著指数、卡尔曼增益的噪声评估系数。
峰形谱线轮廓失真系数通过衡量单个色谱峰序列的光滑情况反映出在该色谱峰采样时间内背景噪声的干扰情况,但是由于受到液相色谱仪自身稳定性和待检测样品组分流动性的影响会存在一定的色谱峰形变异。在没有受到干扰的理想情况下,在每个色谱峰序列中,色谱峰通常是对称的高度窄峰,色谱峰关于色谱峰序列中的峰值对称。因此,本申请通过分析每个色谱峰序列中的对称性特征进一步评估干扰因素对色谱数据的影响。
对于任意一个色谱峰序列,以第m个色谱峰序列为例,将第m个色谱峰序列作为输入,采用自动多尺度峰值查找算法获取第m个色谱峰序列中的峰值,将所述峰值对应的采样时刻记为/>,自动多尺度峰值查找算法为公知技术,具体过程不再赘述。对于第m个色谱峰序列中的每个采样时刻,以第k个采样时刻为例,将采样时刻/>作为对称轴,获取第m个色谱峰序列中的第k个采样时刻关于对称轴的对称时刻p。
基于第m个色谱峰序列中的第k个采样时刻的峰形谱线轮廓失真系数以及与其对称时刻p之间的时间间隔大小确定第m个色谱峰序列中的第k个采样时刻的色谱峰形非对称偏移评估系数。具体计算公式如下:
式中,是第m个色谱峰序列中的第k个采样时刻的色谱峰形非对称偏移评估系数,/>是第m个色谱峰序列中第k个采样时刻的峰形谱线轮廓失真系数,/>是以2为底数的对数函数,/>、/>分别是第m个色谱峰序列中第k个采样时刻、峰值对应的采样时刻,/>是第m个色谱峰序列中的第k个采样时刻与其关于对称轴的对称时刻p之间时间间隔的一半,/>是调参因子,用于防止分母为0,/>的大小取经验值0.001。
其中,第m个色谱峰序列受到的噪声干扰越大,第k个采样时刻为色谱拖尾等变异点的可能性越高,色谱曲线在第k个采样时刻处的轮廓变化越不平滑,/>的值越大;在第m个色谱峰序列中,第k个采样时刻与其对称轴的对称时刻p之间的时间间隔会小于第k个采样时刻与/>之间时间间隔的2倍,即/>会大于/>,/>的值大于1,对数函数的结算结果同样大于1;而如果第m个色谱峰序列没有受到噪声干扰,第k个采样时刻为正常色谱数据,第k个采样时刻与其对称轴的对称时刻p之间的时间间隔接近于第k个采样时刻与/>之间时间间隔的2倍,/>的值接近1,对数函数/>的值接近0。
通过色谱峰形非对称偏移评估系数能够反映每个采样点位置的对称情况,通常若该采样点越远离色谱峰对称轴表明该采样点越有可能是变异点,相反,若该采样点越靠近色谱峰对称轴表明该采样点越有可能为真实色谱数据点。此外,变异点发生的位置对天然物提取物待检测样品检测结果的影响程度不同,在检测过程中,通常对比色谱峰高、色谱峰形和色谱峰面积等信息。因此在色谱检测时,往往越接近色谱峰值,对色谱的对比结果影响越大,由此根据理想色谱峰高度窄峰的特性,利用单个色谱峰序列的峰值和色谱峰序列确定每个色谱峰序列中每个采样时刻的样品峰形干扰显著指数。计算第m个色谱峰序列中的第k个采样时刻的样品峰形干扰显著指数:
式中,是第m个色谱峰序列的能量富集系数,/>是第m个色谱峰序列中的峰值,是色谱数据中的色谱基线,/>的大小取经验值0.2,/>表示在色谱数据中第m个色谱峰序列内峰值对应信号强度/>衰减一半时对应的时间宽度;
是第m个色谱峰序列中的第k个采样时刻的样品峰形干扰显著指数,/>是第m个色谱峰序列中的第k个采样时刻的色谱峰形非对称偏移评估系数,/>表示以自然常数为底数的指数函数,/>是第m个色谱峰序列中第k个采样时刻的信号强度。
其中,第m个色谱峰序列的能量越集中,即色谱峰曲线呈现出高而瘦的特征时,第m个色谱峰序列中信号强度的峰值越大,/>的值越大,/>的值越大;第m个色谱峰序列中第k个采样时刻越靠近波峰的变异点,第k个采样时刻的变异程度对天然提取物待检测样品的检测结果影响较大,第k个采样时刻的信号强度越接近色谱峰序列的峰值,/>的值越小,/>的值越小;与此同时,/>的值越大,第m个色谱峰序列受到的噪声干扰发生变化的概率越高,即/>的值越大,应当提高第k个采样时刻对应采样点的显著程度。
根据上述步骤,分别获取每个色谱峰序列中所有采样时刻的样品峰形干扰显著指数。并基于所述样品峰形干扰显著指数确定采用卡尔曼滤波算法处理色谱数据时每个色谱峰序列每个采样时刻卡尔曼增益的噪声评估系数。第m个色谱峰序列中第k个采样时刻卡尔曼增益的噪声评估系数的计算公式如下:
式中,是色谱数据中第m个色谱峰序列中第k个采样时刻的归一化噪声干扰系数,/>表示以自然常数为底数的指数函数,/>是第m个色谱峰序列中元素的信息熵,/>是第m个色谱峰序列中的第k个采样时刻的样品峰形干扰显著指数,/>是缩放因子,/>的大小取经验值3;
是第m个色谱峰序列中第k个采样时刻卡尔曼增益的噪声评估系数,/>是取最大值函数,/>是噪声评估因子,/>的大小取经验值0.1。
其中,第m个色谱峰序列受到的噪声干扰发生变化的概率越高,第m个色谱峰序列中第k个采样时刻越靠近峰值对应采样时刻,的值越大,第m个色谱峰序列中第k个采样时刻对样品检测结果的影响程度越显著;第m个色谱峰序列受到噪声干扰越大,各元素之间的分布越紊乱,第m个色谱峰序列中元素的信息熵越大,/>的值越大,比例因子/>的值越大,/>的值越大,则在采用卡尔曼滤波算法处理色谱数据第m个色谱峰序列中第k个采样时刻的数据时,卡尔曼增益时应当更加倾向前一时刻的最优估计值;/>的值越小,则在采用卡尔曼滤波算法处理色谱数据第m个色谱峰序列中第k个采样时刻的数据时,卡尔曼增益时应当更加倾向当前时刻的观测值。
至此,得到每个色谱峰序列中每个采样时刻卡尔曼增益的噪声评估系数,用于后续获取降噪色谱峰序列。
步骤S004,采用卡尔曼增益算法基于所述卡尔曼增益的噪声评估系数得到天然提取物待检测样品的检测结果。
根据上述步骤,分别获取每个色谱峰序列中每个采样时刻卡尔曼增益的噪声评估系数。进一步地,将每个色谱峰序列作为输入,采用卡尔曼滤波算法基于每个色谱峰序列中每个采样时刻卡尔曼增益的噪声评估系数得到每个色谱峰序列对应的增益色谱峰序列,卡尔曼滤波算法为公知技术,具体过程不再赘述。其次,将每个色谱峰序列对应的增益色谱峰序列与每个色谱峰序列中所有置为0的平坦数据进行序列重构,即将所述增益色谱峰序列中每个采样时刻的信号强度、置为0的信号强度按照时间顺序拼接完成序列重构,将重构结果作为每个色谱峰序列对应的降噪色谱峰序列。
进一步地,从天然提取物对应的现有数据库中获取标准色谱序列,分别计算每个色谱峰序列对应的降噪色谱峰序列与标准色谱序列之间的皮尔逊相似系数。将任意一个与标准色谱序列之间的皮尔逊相似系数大于等于0.8的降噪色谱峰序列对应的天然提取物待检测样品检测结果记为标准样品,将任意一个与标准色谱序列之间的皮尔逊相似系数小于0.8的降噪色谱峰序列对应的天然提取物待检测样品检测结果记为不达标样品,完成对天然提取物待检测样品的检测。
基于与上述方法相同的发明构思,本申请实施例还提供了基于色谱分析技术的天然提取物检测系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于色谱分析技术的天然提取物检测方法中任意一项所述方法的步骤。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.基于色谱分析技术的天然提取物检测方法,其特征在于,该方法包括以下步骤:
利用液相色谱仪采集天然提取物待检测样品每个周期的色谱数据序列;
基于每个周期的色谱数据序列中所提取的单个色谱峰序列中相邻采样时刻之间的数据关联性以及单个色谱峰曲线的平滑程度确定每个色谱峰序列中每个采样时刻的峰形谱线轮廓失真系数;
基于每个色谱峰序列中每个采样时刻的峰形谱线轮廓失真系数以及每个采样时刻关于色谱峰的对称关系确定每个色谱峰序列中每个采样时刻的色谱峰形非对称偏移评估系数;
根据每个色谱峰序列中每个采样时刻采样点距离色谱峰的远近以及每个色谱峰序列中能量的集中程度确定每个色谱峰序列中每个采样时刻的样品峰形干扰显著指数;
基于每个色谱峰序列中每个采样时刻的样品峰形干扰显著指数以及每个色谱峰序列信息量的评估结果确定每个色谱峰序列中每个采样时刻卡尔曼增益的噪声评估系数;
采用卡尔曼增益算法基于所述卡尔曼增益的噪声评估系数得到天然提取物待检测样品的检测结果;
所述基于每个周期的色谱数据序列中所提取的单个色谱峰序列中相邻采样时刻之间的数据关联性以及单个色谱峰曲线的平滑程度确定每个色谱峰序列中每个采样时刻的峰形谱线轮廓失真系数的方法为:
根据每个周期的色谱数据序列中所提取的单个色谱峰序列拟合所得色谱峰曲线上曲率的平滑程度分别确定每个色谱峰序列中每个采样时刻的局部拟合曲率最大值、最小值;
将每个色谱峰序列中每个采样时刻与每个采样时刻后一采样时刻、每个采样时刻前一采样时刻对应的信号强度之间差值的绝对值分别作为第一差值、第二差值;
将第一差值与第二差值之间的差值与每个色谱峰序列中相邻两个采样时刻之间时间间隔的比值作为每个采样时刻的强度递变差异系数;
基于每个采样时刻的强度递变差异系数、局部拟合曲率最大值和最小值确定每个色谱峰序列中每个采样时刻的峰形谱线轮廓失真系数;
所述基于每个色谱峰序列中每个采样时刻的峰形谱线轮廓失真系数以及每个采样时刻关于色谱峰的对称关系确定每个色谱峰序列中每个采样时刻的色谱峰形非对称偏移评估系数的方法为:
式中,是第m个色谱峰序列中的第k个采样时刻的色谱峰形非对称偏移评估系数,/>是第m个色谱峰序列中第k个采样时刻的峰形谱线轮廓失真系数,/>是以2为底数的对数函数,/>、/>分别是第m个色谱峰序列中第k个采样时刻、峰值对应的采样时刻,/>是第m个色谱峰序列中的第k个采样时刻与其关于对称轴的对称时刻p之间时间间隔的一半,/>是调参因子;
所述根据每个色谱峰序列中每个采样时刻采样点距离色谱峰的远近以及每个色谱峰序列中能量的集中程度确定每个色谱峰序列中每个采样时刻的样品峰形干扰显著指数的方法为:
基于每个色谱峰序列中的峰值以及每个色谱峰序列中信号强度的衰减区间确定每个色谱峰序列的能量富集系数;
将每个色谱峰序列的能量富集系数与每个色谱峰序列中每个采样时刻的色谱峰形非对称偏移评估系数的乘积作为分子;
将以自然常数为底数,以每个色谱峰序列中的峰值与每个色谱峰序列中每个采样时刻的信号强度的差值为指数的计算结果为分母;
将分子与分母的比值作为每个色谱峰序列中每个采样时刻的样品峰形干扰显著指数;
所述基于每个色谱峰序列中的峰值以及每个色谱峰序列中信号强度的衰减区间确定每个色谱峰序列的能量富集系数的方法为:
将每个色谱峰序列中的峰值与0.2的差值作为分子;
将分子与每个色谱峰序列中的峰值对应信号强度衰减一半时对应的时间宽度的比值作为每个色谱峰序列的能量富集系数;
所述基于每个色谱峰序列中每个采样时刻的样品峰形干扰显著指数以及每个色谱峰序列信息量的评估结果确定每个色谱峰序列中每个采样时刻卡尔曼增益的噪声评估系数的方法为:
式中,是色谱数据中第m个色谱峰序列中第k个采样时刻的归一化噪声干扰系数,表示以自然常数为底数的指数函数,/>是第m个色谱峰序列中元素的信息熵,/>是第m个色谱峰序列中的第k个采样时刻的样品峰形干扰显著指数,/>是缩放因子;
是第m个色谱峰序列中第k个采样时刻卡尔曼增益的噪声评估系数,/>是取最大值函数,/>是噪声评估因子;
所述采用卡尔曼增益算法基于所述卡尔曼增益的噪声评估系数得到天然提取物待检测样品的检测结果的方法为:
将每个色谱峰序列作为输入,采用阈值分割算法得到分割阈值,将每个色谱峰序列中信号强度大于等于、小于分割阈值的元素标记为色谱峰数据、平坦数据;
将每个色谱峰序列、每个色谱峰序列中所有采样时刻卡尔曼增益的噪声评估系数作为输入,采用卡尔曼滤波算法获取每个色谱峰序列对应的增益色谱峰序列,将所述增益色谱峰序列与每个色谱峰序列中所有置为0的平坦数据的重构结果作为每个色谱峰序列对应的降噪色谱峰序列;
从天然提取物对应的现有数据库中获取标准色谱序列,将任意一个与标准色谱序列之间的相似性度量结果大于等于0.8的降噪色谱峰序列对应的天然提取物待检测样品检测结果记为标准样品,将任意一个与标准色谱序列之间的相似性度量结果小于0.8的降噪色谱峰序列对应的天然提取物待检测样品检测结果记为不达标样品。
2.根据权利要求1所述的基于色谱分析技术的天然提取物检测方法,其特征在于,所述根据每个周期的色谱数据序列中所提取的单个色谱峰序列拟合所得色谱峰曲线上曲率的平滑程度分别确定每个色谱峰序列中每个采样时刻的局部拟合曲率最大值、最小值的方法为:
将任意一个序列长度大于等于长度阈值的色谱数据序列作为一个色谱峰序列;
将每个色谱峰序列作为输入,采用曲线拟合算法获取每个色谱峰序列对应的色谱峰曲线;
将每个色谱峰序列对应的色谱峰曲线中每个采样时刻、每个采样时刻相邻前一个采样时刻和相邻后一个采样时刻对应曲率中的最大值、最小值分别作为每个采样时刻的局部拟合曲率最大值、最小值。
3.根据权利要求1所述的基于色谱分析技术的天然提取物检测方法,其特征在于,所述基于每个采样时刻的强度递变差异系数、局部拟合曲率最大值和最小值确定每个色谱峰序列中每个采样时刻的峰形谱线轮廓失真系数的方法为:
将以自然常数为底数,以每个色谱峰序列中每个采样时刻的局部拟合曲率最大值、最小值之间差值为指数的计算结果作为第一组成因子;
每个色谱峰序列中每个采样时刻的峰形谱线轮廓失真系数由每个采样时刻的强度递变差异系数、第一组成因子两部分组成,其中,所述峰形谱线轮廓失真系数分别与强度递变差异系数、第一组成因子成正比关系。
4.基于色谱分析技术的天然提取物检测系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-3任意一项所述基于色谱分析技术的天然提取物检测方法的步骤。
CN202410155092.4A 2024-02-04 2024-02-04 基于色谱分析技术的天然提取物检测方法及系统 Active CN117690510B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410155092.4A CN117690510B (zh) 2024-02-04 2024-02-04 基于色谱分析技术的天然提取物检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410155092.4A CN117690510B (zh) 2024-02-04 2024-02-04 基于色谱分析技术的天然提取物检测方法及系统

Publications (2)

Publication Number Publication Date
CN117690510A CN117690510A (zh) 2024-03-12
CN117690510B true CN117690510B (zh) 2024-05-03

Family

ID=90139492

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410155092.4A Active CN117690510B (zh) 2024-02-04 2024-02-04 基于色谱分析技术的天然提取物检测方法及系统

Country Status (1)

Country Link
CN (1) CN117690510B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110542739A (zh) * 2019-08-20 2019-12-06 无锡创想分析仪器有限公司 一种基于卡尔曼技术的重叠峰分离方法
CN114371232A (zh) * 2021-12-22 2022-04-19 天津国科医工科技发展有限公司 基于卡尔曼滤波算法的色谱滤波方法、装置、介质、系统
CN114662544A (zh) * 2022-04-02 2022-06-24 天津国科医工科技发展有限公司 基于ckf的色谱峰估计方法、系统、存储介质及计算机设备
CN114676732A (zh) * 2022-04-02 2022-06-28 天津国科医工科技发展有限公司 基于改进卡尔曼滤波算法的色谱峰滤波方法及系统
CN115343345A (zh) * 2022-09-15 2022-11-15 南京工业大学 基于自适应卡尔曼滤波算法的葡萄糖酶生物传感器高精度检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9958521B2 (en) * 2015-07-07 2018-05-01 Q Bio, Inc. Field-invariant quantitative magnetic-resonance signatures

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110542739A (zh) * 2019-08-20 2019-12-06 无锡创想分析仪器有限公司 一种基于卡尔曼技术的重叠峰分离方法
CN114371232A (zh) * 2021-12-22 2022-04-19 天津国科医工科技发展有限公司 基于卡尔曼滤波算法的色谱滤波方法、装置、介质、系统
CN114662544A (zh) * 2022-04-02 2022-06-24 天津国科医工科技发展有限公司 基于ckf的色谱峰估计方法、系统、存储介质及计算机设备
CN114676732A (zh) * 2022-04-02 2022-06-28 天津国科医工科技发展有限公司 基于改进卡尔曼滤波算法的色谱峰滤波方法及系统
CN115343345A (zh) * 2022-09-15 2022-11-15 南京工业大学 基于自适应卡尔曼滤波算法的葡萄糖酶生物传感器高精度检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
卡尔曼滤波在高效液相色谱中的应用;吴平, 谭永基, 楼蔓藤;色谱;19910530(第03期);全文 *

Also Published As

Publication number Publication date
CN117690510A (zh) 2024-03-12

Similar Documents

Publication Publication Date Title
CA2740220A1 (en) Methods of automated spectral peak detection and quantification without user input
US20060020401A1 (en) Alignment and autoregressive modeling of analytical sensor data from complex chemical mixtures
CN102645502A (zh) 一种利用快速气相色谱型电子鼻指纹分析系统鉴别黄酒酒龄的方法
CN110531054B (zh) 基于Bootstrap抽样的土壤有机碳预测不确定性估测方法
Fu et al. A simple multi-scale Gaussian smoothing-based strategy for automatic chromatographic peak extraction
CN109374568B (zh) 一种利用太赫兹时域光谱的样品识别方法
CN113138248A (zh) 特征图谱提取方法及料液配制质量稳定性的检测方法
CN109520999A (zh) 一种基于二维相关光谱的香紫苏油稳定性评价方法
CN117690510B (zh) 基于色谱分析技术的天然提取物检测方法及系统
CN110231328B (zh) 一种基于半峰高距离法的拉曼光谱定量分析方法
CN109946246B (zh) 一种苹果可溶性固形物的检测方法及装置
CN111141809B (zh) 一种基于非接触式电导信号的土壤养分离子含量检测方法
CN113686811A (zh) 一种基于双传感器的光谱数据处理方法
CN106596814B (zh) 一种复杂液‑质联用数据中的色谱峰定量分析方法
CN109146003A (zh) 一种基于高光谱成像的分类识别方法、装置及系统
CN109425679A (zh) 一种基于等权相似度分析仿制烟用香精指纹图谱相似度的方法
US20190302070A1 (en) Chromatographic Data System, Processing Apparatus, Chromatographic Data System Processing Method, and Chromatograph
WO2023123329A1 (zh) 近红外光谱的净信号提取方法及其系统
CN116136518A (zh) 色谱仪
CN113610817B (zh) 一种特征峰识别方法及计算设备、存储介质
CN115586159A (zh) 基于中红外光谱检测技术的白酒陈化缔合程度评定方法
CN111426648B (zh) 一种红外谱图的相似度确定方法及系统
CN107250788A (zh) 噪声水平估计方法、测定数据处理装置以及测定数据处理用程序
CN113392834A (zh) 一种基于深度学习的字轮水表读数识别方法及系统
CN113533551B (zh) 一种基于gc-ims的香米共享风味指纹谱的提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant