CN116046968A - 一种液相色谱工作站数据处理方法、系统及可存储介质 - Google Patents

一种液相色谱工作站数据处理方法、系统及可存储介质 Download PDF

Info

Publication number
CN116046968A
CN116046968A CN202310200214.2A CN202310200214A CN116046968A CN 116046968 A CN116046968 A CN 116046968A CN 202310200214 A CN202310200214 A CN 202310200214A CN 116046968 A CN116046968 A CN 116046968A
Authority
CN
China
Prior art keywords
chromatographic data
chromatographic
data
data processing
peak
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310200214.2A
Other languages
English (en)
Inventor
周玉川
于建国
赵建友
李翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Aonuo Technology Co ltd
Original Assignee
Beijing Aonuo Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Aonuo Technology Co ltd filed Critical Beijing Aonuo Technology Co ltd
Priority to CN202310200214.2A priority Critical patent/CN116046968A/zh
Publication of CN116046968A publication Critical patent/CN116046968A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Abstract

本发明公开了一种液相色谱工作站数据处理方法、系统及可存储介质,涉及色谱数据处理领域。本发明包括以下步骤:通过液相色谱工作站获取样本的色谱数据;对色谱数据进行预处理;判别预处理后色谱数据的峰特征点和峰类型;将预处理后的色谱数据、峰特征点和峰类型输入到色谱数据处理模型中,输出样本各组分含量。本发明能够确保本色谱工作站性能和效率的要求,还能够确保本色谱工作站的健壮性和稳定性。

Description

一种液相色谱工作站数据处理方法、系统及可存储介质
技术领域
本发明涉及色谱数据处理领域,更具体的说是涉及一种液相色谱工作站数据处理方法、系统及可存储介质。
背景技术
随着计算机技术的飞速发展,许多重要的电子分析仪器设备越来越离不开与计算机的结合。当然,色谱分析仪作为一种混合物的分离与成分检测的电子设备也毫不例外。色谱技术自从1901年诞生后,经过一个多世纪的不断发展和完善,其硬件技术已经日臻成熟,而配套的软件系统则往往因为客户需求的多样化及系统架构设计的不合理因素造成的不足使得整个色谱系统性能大打折扣。
所谓的色谱工作站,就是一种与计算机技术相结合,对色谱仪器系统进行实时控制,并对检测器输出信号进行实时采集、显示和分析的软件系统。谱工作站的出现和发展,改变了过去依靠积分仪或数据处理器来进行谱图数据处理时出现的功能单一、速度缓慢、计算不精确的状况,在色谱分析领域具有里程碑的意义。它充分利用了现代计算机运算能力强和存储量大的特点,实现了谱图数据采集和分析处理的全程自动化,将色谱工作者从繁杂的谱图数据处理工作中解放出来。
但是,目前的色谱数据处理系统存在诸多缺陷,如分析精度不高,自动化程度不够等。因此,如何解决这些问题是本领域技术人员亟需研究的。
发明内容
有鉴于此,本发明提供了一种液相色谱工作站数据处理方法、系统及可存储介质,能够确保本色谱工作站性能和效率的要求,还能够确保本色谱工作站的健壮性和稳定性。
为了实现上述目的,本发明采用如下技术方案:
一种液相色谱工作站数据处理方法,包括以下步骤:
通过液相色谱工作站获取样本的色谱数据;
对色谱数据进行预处理;
判别预处理后色谱数据的峰特征点和峰类型;
将预处理后的色谱数据、峰特征点和峰类型输入到色谱数据处理模型中,输出样本各组分含量。
可选的,所述色谱数据处理模型的构建过程如下:
获取色谱数据库中的历史色谱数据,分为训练集和测试集;
将训练集输入到BP神经网络模型中,对BP神经网络模型进行多次迭代训练;
利用损失函数对BP神经网络模型进行偏差估计,若小于预设阈值,则完成训练,得到色谱数据处理模型。
可选的,还包括利用测试集对色谱数据处理模型进行测试,根据测试结果确定色谱数据处理模型的精度。
可选的,对色谱数据进行预处理具体包括:
获取色谱数据的噪音阈值,并根据噪音阈值去除色谱数据的噪音离子,得到第一色谱数据;
对第一色谱数据的基线通过线性模型法,高阶模型法和动态模型法进行校正。
可选的,还包括对色谱数据中的重叠峰进行分离,具体如下:
构建多个变量集合,集合中的元素为多维集合;
计算中心点,所述中心点为多个变量集合中的一维平均值;
对多个变量集合中的最大值进行替换,同时变更中心点值;
多次迭代,完成重叠峰的分离。
一种液相色谱工作站数据处理系统,包括:色谱数据获取模块,色谱数据预处理模块,色谱数据判别模块和色谱数据组分含量输出模块:
色谱数据获取模块,用于通过液相色谱工作站获取样本的色谱数据;
色谱数据预处理模块,用于对色谱数据进行预处理;
色谱数据判别模块,用于判别预处理后色谱数据的峰特征点和峰类型;
色谱数据组分含量输出模块,用于将预处理后的色谱数据、峰特征点和峰类型输入到色谱数据处理模型中,输出样本各组分含量。
可选的,还包括重叠峰分离模块,用于对色谱数据中的重叠峰进行分离。
一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现任意一项所述的一种液相色谱工作站数据处理方法的步骤。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种液相色谱工作站数据处理方法、系统及可存储介质,具有以下有益效果:
1、在相同的保留时间内,本发明的方法的分离度更大、理论塔板数更高;
2、本发明的方法基于神经网络对液相色谱工作站中的数据进行分析,解放了人力,并且能避免人的主观意识造成分析失误情况的发生,有效的提高了准确率,提高了液相色谱工作站的自动化水平。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明的流程示意图;
图2为本发明的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
谱图数据的处理分析是色谱工作站软件的核心,也是目前色谱软件的重点研究内容。色谱工作站一般具备的数据处理功能有:噪声去除、色谱峰识别、基线校正、重叠峰解析、计算峰参数、定量计算组分含量。另外,随着色谱仪器的精度越来越高,数据量也越来越大,谱图数据需要在传输前后进行压缩与解压缩。色谱数据处理和谱图分析算法不仅能够提高色谱仪器分析的准确性,而且使色谱分析更加便捷。因此对于色谱工作站,应用一套适用性强、准确度高的谱图处理算法至关重要。
基于此,本发明实施例公开了一种液相色谱工作站数据处理方法,如图1所示,包括以下步骤:
S1:通过液相色谱工作站获取样本的色谱数据;
S2:对色谱数据进行预处理;
S3:判别预处理后色谱数据的峰特征点和峰类型;
S4:将预处理后的色谱数据、峰特征点和峰类型输入到色谱数据处理模型中,输出样本各组分含量。
在S4中,所述色谱数据处理模型的构建过程如下:
S41:获取色谱数据库中的历史色谱数据,分为训练集和测试集;
S42:将训练集输入到BP神经网络模型中,对BP神经网络模型进行多次迭代训练;
S43:利用损失函数对BP神经网络模型进行偏差估计,若小于预设阈值,则完成训练,得到色谱数据处理模型。
在本实施例中还包括利用测试集对色谱数据处理模型进行测试,根据测试结果确定色谱数据处理模型的精度。
在S2中,对色谱数据的预处理,包括数据压缩解压缩与噪声去除。可以采用离散傅里叶变换、离散余弦变换和小波变换进行数据压缩解压缩与噪声去除。其中,对色谱数据进行预处理具体包括:
S21:获取色谱数据的噪音阈值,并根据噪音阈值去除色谱数据的噪音离子,得到第一色谱数据;
S22:对第一色谱数据的基线通过线性模型法,高阶模型法和动态模型法进行校正。
在本实施例中还包括对色谱数据中的重叠峰进行分离,具体如下:
构建变量集合A={α1,α2,…αn+1},集合中的每个元素是一个多维集合,且该集合满足f(α1)≤f(α2)≤…≤f(αn+1);
计算中心点α0,即A中每个元素对应的一维平均值。
由于在之前的集合A中,已经可以知道最末尾的变量对应的函数值是最大的,因此对其进行替换,每一次替换后都要更新一次中心点的值。替换的方法共有四种:
反射,将α0n+1以α0为原点映射到对应的α倍距离位置,其中α>0;
扩散反射,将α0n+1以α0为原点映射到对应的γ倍距离位置,其中γ>0;
缩小距离,将α0n+1以α0为原点映射到对应的ρ倍距离位置,其中0<ρ<0.5;
缩小距离,将α0n+1以α1为原点映射到对应的σ倍距离位置,其中0<σ<0.5。
重复上述过程直到满足容忍条件即可停止。
通过上述的谱峰检测的方法能够区分出落回基线的峰结束点和未落回基线的重叠峰间的谷点,因而可据此划分出峰群。所谓峰群,就是由多个峰重叠而成的,其中第一个峰的起点和最后一个峰的结束点是真正落在基线上的,而中间峰的起点和结束点都是重叠峰间的谷点,并未落在基线上。
与图1所示方法对应的,本发明还公开了示一种液相色谱工作站数据处理系统用于对图1方法的实现,具体结构如图2所,包括:色谱数据获取模块,色谱数据预处理模块,色谱数据判别模块和色谱数据组分含量输出模块:
色谱数据获取模块,用于通过液相色谱工作站获取样本的色谱数据;
色谱数据预处理模块,用于对色谱数据进行预处理;
色谱数据判别模块,用于判别预处理后色谱数据的峰特征点和峰类型;
色谱数据组分含量输出模块,用于将预处理后的色谱数据、峰特征点和峰类型输入到色谱数据处理模型中,输出样本各组分含量。
在本实施例中还包括重叠峰分离模块,用于对色谱数据中的重叠峰进行分离。
本实施例中的一种液相色谱工作站数据处理系统主要包括处理和分析模块,其主要的目的是计算谱峰的面积和位置,最后得到所测组分的含量。谱图数据的处理主要包括数据压缩、数据去噪、谱峰识别、重叠峰分解和定性定量计算这几个部分。
其中,色谱数据获取模块输出信号中由于硬件电路干扰、环境影响等因素不可避免会产生干扰信号,为了数据分析更加准确,必须先对信号进行去噪处理。色谱信号中常用的去噪方法有:
(1)傅里叶滤波法:将原始信号通过傅里叶变换从时域转换为频域,去除频域中的高频噪声部分;
(2)小波变换法:小波变换去噪一般分频率截断法和阈值去噪法,频率截断法是将小波变换后的高频噪声的小波系数删除,所以该方法不适用于包含有用高频分量的信号。阈值去噪法是选取信号中能量集中的少数小波系数;
(3)中值滤波法:中值滤波法是将设定的窗口内的所有数据排序,然后取中值代替窗口中心位置的值;
(4)均值滤波法:均值法即取设定窗口内所有数据的平均值代替窗口中心位置的值;
(5)多项式平滑滤波法:又称为S-G滤波法,方法与均值滤波法相似,不同之处是对窗口内的数据进行加权求和。
最后公开了一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现任意一项所述的一种液相色谱工作站数据处理方法的步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种液相色谱工作站数据处理方法,其特征在于,包括以下步骤:
通过液相色谱工作站获取样本的色谱数据;
对色谱数据进行预处理;
判别预处理后色谱数据的峰特征点和峰类型;
将预处理后的色谱数据、峰特征点和峰类型输入到色谱数据处理模型中,输出样本各组分含量。
2.根据权利要求1所述的一种液相色谱工作站数据处理方法,其特征在于,所述色谱数据处理模型的构建过程如下:
获取色谱数据库中的历史色谱数据,分为训练集和测试集;
将训练集输入到BP神经网络模型中,对BP神经网络模型进行多次迭代训练;
利用损失函数对BP神经网络模型进行偏差估计,若小于预设阈值,则完成训练,得到色谱数据处理模型。
3.根据权利要求2所述的一种液相色谱工作站数据处理方法,其特征在于,还包括利用测试集对色谱数据处理模型进行测试,根据测试结果确定色谱数据处理模型的精度。
4.根据权利要求1所述的一种液相色谱工作站数据处理方法,其特征在于,对色谱数据进行预处理具体包括:
获取色谱数据的噪音阈值,并根据噪音阈值去除色谱数据的噪音离子,得到第一色谱数据;
对第一色谱数据的基线通过线性模型法,高阶模型法和动态模型法进行校正。
5.根据权利要求1所述的一种液相色谱工作站数据处理方法,其特征在于,还包括对色谱数据中的重叠峰进行分离,具体如下:
构建多个变量集合,集合中的元素为多维集合;
计算中心点,所述中心点为多个变量集合中的一维平均值;
对多个变量集合中的最大值进行替换,同时变更中心点值;
多次迭代,完成重叠峰的分离。
6.一种液相色谱工作站数据处理系统,其特征在于,包括:色谱数据获取模块,色谱数据预处理模块,色谱数据判别模块和色谱数据组分含量输出模块:
色谱数据获取模块,用于通过液相色谱工作站获取样本的色谱数据;
色谱数据预处理模块,用于对色谱数据进行预处理;
色谱数据判别模块,用于判别预处理后色谱数据的峰特征点和峰类型;
色谱数据组分含量输出模块,用于将预处理后的色谱数据、峰特征点和峰类型输入到色谱数据处理模型中,输出样本各组分含量。
7.根据权利要求6所述的一种液相色谱工作站数据处理系统,其特征在于,还包括重叠峰分离模块,用于对色谱数据中的重叠峰进行分离。
8.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-5中任意一项所述的一种液相色谱工作站数据处理方法的步骤。
CN202310200214.2A 2023-03-02 2023-03-02 一种液相色谱工作站数据处理方法、系统及可存储介质 Pending CN116046968A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310200214.2A CN116046968A (zh) 2023-03-02 2023-03-02 一种液相色谱工作站数据处理方法、系统及可存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310200214.2A CN116046968A (zh) 2023-03-02 2023-03-02 一种液相色谱工作站数据处理方法、系统及可存储介质

Publications (1)

Publication Number Publication Date
CN116046968A true CN116046968A (zh) 2023-05-02

Family

ID=86118402

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310200214.2A Pending CN116046968A (zh) 2023-03-02 2023-03-02 一种液相色谱工作站数据处理方法、系统及可存储介质

Country Status (1)

Country Link
CN (1) CN116046968A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116973495A (zh) * 2023-09-21 2023-10-31 山东鲁地源天然药物有限公司 基于气相色谱仪的中药饮片检测数据分析管理系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10185873A (ja) * 1996-12-26 1998-07-14 Shimadzu Corp 質量分析装置
JP2011058930A (ja) * 2009-09-09 2011-03-24 Shimadzu Corp クロマトグラフ用データ処理装置
CN104297504A (zh) * 2014-10-22 2015-01-21 上海申腾信息技术有限公司 一种自动化气相色谱控制系统
JP2017187320A (ja) * 2016-04-01 2017-10-12 東ソー株式会社 クロマトグラムにおけるベースラインおよびノイズ補正方法
CN114487245A (zh) * 2022-01-06 2022-05-13 苏州大学 一种色谱质谱分析用数据处理方法
CN114609258A (zh) * 2020-12-09 2022-06-10 中国科学院大连化学物理研究所 基于液相色谱-高分辨质谱的石油分子表征数据处理方法
CN114755357A (zh) * 2022-04-14 2022-07-15 武汉迈特维尔生物科技有限公司 一种色谱质谱自动积分方法、系统、设备、介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10185873A (ja) * 1996-12-26 1998-07-14 Shimadzu Corp 質量分析装置
JP2011058930A (ja) * 2009-09-09 2011-03-24 Shimadzu Corp クロマトグラフ用データ処理装置
CN104297504A (zh) * 2014-10-22 2015-01-21 上海申腾信息技术有限公司 一种自动化气相色谱控制系统
JP2017187320A (ja) * 2016-04-01 2017-10-12 東ソー株式会社 クロマトグラムにおけるベースラインおよびノイズ補正方法
CN114609258A (zh) * 2020-12-09 2022-06-10 中国科学院大连化学物理研究所 基于液相色谱-高分辨质谱的石油分子表征数据处理方法
CN114487245A (zh) * 2022-01-06 2022-05-13 苏州大学 一种色谱质谱分析用数据处理方法
CN114755357A (zh) * 2022-04-14 2022-07-15 武汉迈特维尔生物科技有限公司 一种色谱质谱自动积分方法、系统、设备、介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
道格•罗斯: "《智能系统与技术丛书 认识AI 人工智能如何赋能商业 原书第2版》", 31 October 2021, 机械工业出版社, pages: 149 - 151 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116973495A (zh) * 2023-09-21 2023-10-31 山东鲁地源天然药物有限公司 基于气相色谱仪的中药饮片检测数据分析管理系统
CN116973495B (zh) * 2023-09-21 2023-12-15 山东鲁地源天然药物有限公司 基于气相色谱仪的中药饮片检测数据分析管理系统

Similar Documents

Publication Publication Date Title
Chen et al. Intrinsic chirp component decomposition by using Fourier series representation
US7401008B2 (en) Method, computer program, and system for intrinsic timescale decomposition, filtering, and automated analysis of signals of arbitrary origin or timescale
CN107329932B (zh) 基于非线性调频分量分解的时频域模态参数辨识方法
CN108875170B (zh) 一种基于改进变分模态分解的噪声源识别方法
CN111307438B (zh) 一种基于信息熵的旋转机械振动故障诊断方法及其系统
CN116046968A (zh) 一种液相色谱工作站数据处理方法、系统及可存储介质
Rahim Applications of multitaper spectral analysis to nonstationary data
CN115616266B (zh) 一种波形幅度值测量方法、装置、终端设备以及存储介质
CN111783696A (zh) 一种基于pv关系的低压分支拓扑实时分析的边缘计算方法
CN115618213A (zh) 充电机电压扰动分析方法及系统、设备、存储介质
CN116153329A (zh) 一种基于cwt-lbp的声音信号时频纹理特征提取方法
CN115954017A (zh) 一种基于hht的发动机小样本声音异常故障识别方法及系统
Mei et al. Wavelet packet transform and improved complete ensemble empirical mode decomposition with adaptive noise based power quality disturbance detection
CN117112514B (zh) 基于对氯甲基苯乙烯生产数据的记录存储方法
CN110112757B (zh) 基于sure小波消噪和改进hht的低频振荡分析方法
CN116136518B (zh) 色谱仪
Nannan The application of an improved wavelet threshold function in de-noising of heart sound signal
CN115797318A (zh) 一种光谱数据预处理方法、装置、计算机设备及存储介质
CN114993671A (zh) 一种基于q因子小波变换的振动故障诊断方法及其系统
CN111010193B (zh) 基于压电导纳的数据压缩重构及结构损伤识别方法、设备
CN116028840A (zh) 最大重叠离散小波包变换时频谱的船用转子故障诊断方法
Blair A method for characterizing waveform recorder errors using the power spectral distribution
CN113609207B (zh) 一种边坡形变监测数据的数据预处理方法
Lin et al. Research on Optical Fiber IMU Signal Processing Based on Wavelet Algorithm
CN113358930B (zh) 一种基于信号偏移的谐波测试系统、装置及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination