CN114609319A - 基于噪声估计的谱峰识别方法及系统 - Google Patents

基于噪声估计的谱峰识别方法及系统 Download PDF

Info

Publication number
CN114609319A
CN114609319A CN202210133900.8A CN202210133900A CN114609319A CN 114609319 A CN114609319 A CN 114609319A CN 202210133900 A CN202210133900 A CN 202210133900A CN 114609319 A CN114609319 A CN 114609319A
Authority
CN
China
Prior art keywords
point
data
peak
signal
ins
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210133900.8A
Other languages
English (en)
Other versions
CN114609319B (zh
Inventor
贾明正
程文播
李亮
王晶
凌星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Guoke Medical Technology Development Co ltd
Suzhou Institute of Biomedical Engineering and Technology of CAS
Original Assignee
Suzhou Institute of Biomedical Engineering and Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Institute of Biomedical Engineering and Technology of CAS filed Critical Suzhou Institute of Biomedical Engineering and Technology of CAS
Priority to CN202210133900.8A priority Critical patent/CN114609319B/zh
Publication of CN114609319A publication Critical patent/CN114609319A/zh
Application granted granted Critical
Publication of CN114609319B publication Critical patent/CN114609319B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Abstract

本发明公开了一种基于噪声估计的谱峰识别方法,包括以下步骤:1)输入原始色谱数据R0,预处理后采用S‑G平滑算法进行平滑处理得到数据R2;2)获取峰顶点集合P;3)计算数据R1中的每个点的信噪比估计值;4)寻找峰顶点集合P中每个峰的峰起点:5)寻找每个峰的峰终点:6)根据每个峰顶点pcurrent以及对应的峰起点、峰终点得到数据R1中所有的色谱峰。本发明将基于直方图统计的信噪比估计用到峰识别算法中,并改进了直方图统计,采用中值直方图方式,减少了计算复杂度;本发明采用基于噪声估计算法相比较于传统的小波变换算法,具有算法复杂度低、峰识别速度更快且识别精度相当的优点,但更适用于商业应用。

Description

基于噪声估计的谱峰识别方法及系统
技术领域
本发明涉及数据处理领域,特别涉及一种基于噪声估计的谱峰识别方法及系统。
背景技术
质谱分析作为高端定量检测分析,在检测的灵敏度、特异性、分析速度、多指标同时检测等方面有非常强的优势。发达国家大力发展医用质谱技术,质谱技术在医用实验室已有30年的应用历史,国外某些大型医用实验室拥有多达几十台质谱仪(如美国ARUP实验室),基于质谱的临床检测的项目已达400余项,涉及产前检查、新生儿筛查、滥用药物监测、代谢物检查(氨基酸、脂肪酸)、类固醇激素检测(内分泌)、维生素族检测以及微生物鉴定等领域。国内医用质谱正步入加速发展的快车道,目前已应用于新生儿遗传筛查、维生素D检测、药品检测等检测领域,市场空间预测百亿以上。医用质谱仪中,以液相色谱三重四极杆串联质谱联用仪(LC-MS/MS)应用最为广泛,开展的医学检测项目最多。
谱峰检测是LC-MS/MS数据处理最为核心的部分,直接影响仪器的最终分析结果。对谱峰检测方法的优化能以最小的成本带来仪器性能指标的提升。提升谱峰检测方法对于微弱谱峰和重叠峰的检测能力,能够有效提高仪器的灵敏度和分辨率指标。所以,现在有必要提供一种可靠的谱峰检测方法。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种基于噪声估计的谱峰识别方法及系统。本发明的主要原理是色谱峰信号要远远高于噪声信号,通过比较色谱峰信号与噪声的强度值以及信噪比估计值,来确定峰的顶点以及峰的起始点。
为实现上述目的,本发明采用的技术方案是:一种基于噪声估计的谱峰识别方法,包括以下步骤:
1)输入原始色谱数据R0,R0经预处理后的数据R1再采用S-G平滑算法进行平滑处理得到数据R2
2)针对数据R2,采用寻峰算法识别峰顶点,得到峰顶点集合P;
3)计算预处理后的数据R1中的每个点的信噪比估计值;
4)寻找峰顶点集合P中每个峰的峰起点:
对于峰顶点集合P中的峰顶点pi,在数据R1中寻找与峰顶点pi最近的点,作为数据R1中选择的峰顶点,记为picurrent
遍历数据R1中点picurrent左边所有的点,当某一个点pis同时满足以下条件a1、b1、c1时,则将点pis作为峰顶点pi对应的峰起点:
a1、点pis的信号强度比峰顶点pi右边1/2个峰宽W范围内的所有点的信号强度均低;
b1、点pis到点pcurrent的保留时间的差的绝对值小于预先设定的峰宽W;
c1、点pis的信噪比估计值大于输入的信噪比阈值T1;
遍历峰顶点集合P中所有的峰顶点,按照上述方法寻找得到P中每个峰顶点对应的峰起点;
5)寻找每个峰的峰终点:
遍历数据R1中点pcurrent右边所有的点,当某一个点pid同时满足以下条件a2、b2、c2时,则将点pid作为峰顶点pi对应的峰终点:
a2、点pid的信号强度比峰顶点pi左边所有点的信号强度均低;
b2、点pcurrent到点pid的保留时间的差的绝对值小于预先设定的峰宽W;
c2、点pid的信噪比估计值大于输入的信噪比阈值T1;
遍历峰顶点集合P中所有的峰顶点,按照上述方法寻找得到P中每个峰顶点对应的峰终点;
6)根据每个峰顶点pcurrent以及对应的峰起点、峰终点得到数据R1中所有的色谱峰。
优选的是,所述步骤1)中,对原始色谱数据R0进行预处理的方法为:
对于原始色谱数据R0中的每个数据点,采用每个数据点的前一个和后一个数据点的平均值来代替,处理后的数据即为数据R1,计算公式为:
f[R0(x)]=[R0(x-1)×λ1+R0(x)×λ2+R0(x+1)×λ3]/(λ123);
其中,R0(x)表示原始色谱数据R0中的数据点,f[R0(x)]表示预处理后的数据点,λ1、λ2、λ3均为权重系数。
优选的是,其中,λ1=0.5,λ2=1,λ3=0.5;
优选的是,所述步骤2)中采用的寻峰算法具体包括以下步骤:
2-1)输入数据R1,设定信噪比阈值T2;
2-2)计算预处理后的数据R1中的每个点的信噪比估计值;
2-3)对于数据R1,当其中的一个点同时满足以下条件①-⑤时,则将当前点作为峰顶点:
①当前点的信号强度值同时大于左边第一个点的信号强度值和右边第一个点的信号强度值;
②当前点、当前点左边的第一个点、当前点右边的第一个点的信噪比估计值均大于信噪比阈值T2;
③当前点左边的第二个点的信号强度值小于当前点左边的第一个点的信号强度值;
④当前点右边的第二个点的信号强度值小于当前点右边的第一个点的信号强度值;
⑤当前点左边的第二个点和右边的第二个点的信噪比估计值均大于信噪比阈值T2;
2-4)遍历数据R1中的所有点,按照所述步骤2-3)的方法,找出数据R1中的所有峰顶点,构建得到峰顶点集合P。
优选的是,所述步骤2)和步骤3)中计算信噪比估计值的方法包括以下步骤:
S1、将数据R1分为若干个数据单元,对于每一个数据单元,按照以下方法计算数据单元中的所有数据点的信噪比估计值;
S2、计算数据单元中所有数据点的期望E(X)和标准差STDEV(X),其中X表示构成数据点的向量,记数据选择阈值为INSMAX,INSMAX=E(X)+ηSTDEV(X),η为常数;
将数据R1的直方图的箱数设置为Nbin,则直方图被划分为Nbin段,每一段的范围长度INSSIZE为:
Figure BDA0003503869580000041
从而将数据R1中超过INSMAX的数据去除,将数据R1中小于INSMAX的数据点统计到直方图中,直方图的分段区间为:
[0,INSSIZE),[INSSIZE,2INSSIZE),……,[(Nbin-1)INSSIZE,NbinINSSIZE);
将数据R1中小于INSMAX的所有数据点统计到该分段区间中,计算落入到每个分段区间内的数据点的数量;
S3、对Nbin段分段区间按照落入其中的数据点的数量进行排列,筛选出数据点的数量的中位数对应的分段区间[(Nm-1)INSSIZE,NmINSSIZE),则噪声的估计初始值n0为:
n0=(Nm-0.5)INSSIZE
噪声需大于等于1,所以修正之后的噪声估计值n为:
n=max{1,(Nm-0.5)INSSIZE};
S4、计算该数据单元中每个点的信噪比估计值ynj
ynj=yj/n;
其中,yj表示该数据单元中的点j的信号值;
S4、计算数据R1中的所有数据单元中的数据点的信噪比估计值。
优选的是,其中,η=3。
优选的是,其中,Nbin=30。
本发明还提供一种基于噪声估计的谱峰识别系统,其采用如上所述的方法进行谱峰识别。
本发明还提供一种存储介质,其上存储有计算机程序,该程序被执行时用于实现如上所述的方法。
本发明还提供一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的方法。
本发明的有益效果是:
本发明将基于直方图统计的信噪比估计用到峰识别算法中,并改进了直方图统计,采用中值直方图方式,减少了计算复杂度;
本发明采用基于噪声估计算法相比较于传统的小波变换算法,具有算法复杂度低、峰识别速度更快且识别精度相当的优点,但更适用于商业应用。
附图说明
图1为本发明的实施例中的基于噪声估计的谱峰识别结果。
具体实施方式
下面结合实施例对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
应当理解,本文所使用的诸如“具有”、“包含”以及“包括”术语并不排除一个或多个其它元件或其组合的存在或添加。
实施例1
本实施例的一种基于噪声估计的谱峰识别方法,包括以下步骤:
1)输入原始色谱数据R0,R0经预处理后的数据R1再采用S-G平滑算法进行平滑处理得到数据R2
其中,对原始色谱数据R0进行预处理的方法为:
对于原始色谱数据R0中的每个数据点,采用每个数据点的前一个和后一个数据点的平均值来代替,处理后的数据即为数据R1,计算公式为:
f[R0(x)]=[R0(x-1)×λ1+R0(x)×λ2+R0(x+1)×λ3]/(λ123);
其中,R0(x)表示原始色谱数据R0中的数据点,f[R0(x)]表示预处理后的数据点,λ1、λ2、λ3均为权重系数。本实施例中,λ1=0.5,λ2=1,λ3=0.5;
Savitzky-Golay(S-G)平滑算法是由Abraham Savitzky和Marcel J.E.Golay在1964年提出的,是一种基于多项式最小二乘拟合的时域滤波方法。其基本思想是设置一个滤波窗口,采用多项式拟合窗内的原始谱数据,使拟合后的数据与原始数据的拟合残差最小。本发明中采用S-G平滑算法进行处理,能获得满意的处理结果。
2)针对数据R2,采用寻峰算法识别峰顶点,得到峰顶点集合P;
寻峰算法具体包括以下步骤:
2-1)输入数据R1,设定信噪比阈值T2;
2-2)计算预处理后的数据R1中的每个点的信噪比估计值;
2-3)对于数据R1,当其中的一个点同时满足以下条件①-⑤时,则将当前点作为峰顶点:
①当前点的信号强度值同时大于左边第一个点的信号强度值和右边第一个点的信号强度值;
②当前点、当前点左边的第一个点、当前点右边的第一个点的信噪比估计值均大于信噪比阈值T2;
③当前点左边的第二个点的信号强度值小于当前点左边的第一个点的信号强度值;
④当前点右边的第二个点的信号强度值小于当前点右边的第一个点的信号强度值;
⑤当前点左边的第二个点和右边的第二个点的信噪比估计值均大于信噪比阈值T2;
2-4)遍历数据R1中的所有点,按照所述步骤2-3)的方法,找出数据R1中的所有峰顶点,构建得到峰顶点集合P。
3)计算预处理后的数据R1中的每个点的信噪比估计值;
所述步骤2)和步骤3)中计算信噪比估计值的方法包括以下步骤:
S1、将数据R1分为若干个数据单元,对于每一个数据单元,按照以下方法计算数据单元中的所有数据点的信噪比估计值;
S2、计算数据单元中所有数据点的期望E(X)和标准差STDEV(X),其中X表示构成数据点的向量,记数据选择阈值为INSMAX,INSMAX=E(X)+ηSTDEV(X),η为常数;本实施例中,η=3;
将数据R1的直方图的箱数设置为Nbin,Nbin=30;则直方图被划分为Nbin段,每一段的范围长度INSSIZE为:
Figure BDA0003503869580000061
从而将数据R1中超过INSMAX的数据去除,将数据R1中小于INSMAX的数据点统计到直方图中,直方图的分段区间为:
[0,INSSIZE),[INSSIZE,2INSSIZE),……,[(Nbin-1)INSSIZE,NbinINSSIZE);
将数据R1中小于INSMAX的所有数据点统计到该分段区间中,计算落入到每个分段区间内的数据点的数量;
S3、对Nbin段分段区间按照落入其中的数据点的数量进行排列,筛选出数据点的数量的中位数对应的分段区间[(Nm-1)INSSIZE,NmINSSIZE),则噪声的估计初始值n0为:
n0=(Nm-0.5)INSSIZE
噪声需大于等于1,所以修正之后的噪声估计值n为:
n=max{1,(Nm-0.5)INSSIZE};
S4、计算该数据单元中每个点的信噪比估计值ynj
ynj=yj/n;
其中,yj表示该数据单元中的点j的信号值;
S4、计算数据R1中的所有数据单元中的数据点的信噪比估计值。
4)寻找峰顶点集合P中每个峰的峰起点:
对于峰顶点集合P中的峰顶点pi,在数据R1中寻找与峰顶点pi最近的点,作为数据R1中选择的峰顶点,记为picurrent
遍历数据R1中点picurrent左边所有的点,当某一个点pis同时满足以下条件a1、b1、c1时,则将点pis作为峰顶点pi对应的峰起点:
a1、点pis的信号强度比峰顶点pi右边1/2个峰宽W范围内的所有点的信号强度均低;
b1、点pis到点pcurrent的保留时间的差的绝对值小于预先设定的峰宽W;
c1、点pis的信噪比估计值大于输入的信噪比阈值T1;
遍历峰顶点集合P中所有的峰顶点,按照上述方法寻找得到P中每个峰顶点对应的峰起点;
5)寻找每个峰的峰终点:
遍历数据R1中点pcurrent右边所有的点,当某一个点pid同时满足以下条件a2、b2、c2时,则将点pid作为峰顶点pi对应的峰终点:
a2、点pid的信号强度比峰顶点pi左边所有点的信号强度均低;
b2、点pcurrent到点pid的保留时间的差的绝对值小于预先设定的峰宽W;
c2、点pid的信噪比估计值大于输入的信噪比阈值T1;
遍历峰顶点集合P中所有的峰顶点,按照上述方法寻找得到P中每个峰顶点对应的峰终点;
6)根据每个峰顶点pcurrent以及对应的峰起点、峰终点得到数据R1中所有的色谱峰。
在一种实施例中,T1=T2。
本发明将基于直方图统计的信噪比估计用到峰识别算法中,并改进了直方图统计,采用中值直方图方式,减少了计算复杂度,效果好于最大似然估计算法。
最大似然(ML)估计是经典的基于数据辅助信噪比估计算法,其方法可简要概括为根据噪声的概率密度函数求的联合概率密度函数,求解获得有用信号功率和噪声方差估计值,从而获得信噪比估计值。ML估计需要知道信号信息或其对应的估计值,特点是估计准确,但运算量很大。以本发明所涉及仪器信号的噪声为例,仪器噪声概率密度函数属于未知,对未知量的计算则将增加计算量、降低算法效率。本发明使用中值直方图方式,输入相关参数即可对信号做噪声估计,减少了计算复杂度,在LC-MS/MS谱峰识别的应用上效果好于最大似然估计算法。
本发明采用基于噪声估计算法相比较于传统的小波变换算法,具有算法时间复杂度低、峰识别速度更快且识别精度相当的优点,但更适用于商业应用。
小波变换算法普遍应用于数据的滤波处理,传统的小波变换算法公式为:
Figure BDA0003503869580000081
从变换公式上可发现,小波变换计算的时间复杂度为O(Nlog(N))。本发明使用S-G平滑算法用于数据的滤波处理,S-G平滑算法的时间复杂度为O(N)。从算法时间复杂度上看O(N)<O(Nlog(N)),因此本发明算法时间复杂度与小波变换算法相比较低。
常见小波变换算法在峰识别应用过程中,应提前对目标峰所在频率做设定才能实现峰识别,获取目标峰的频率范围需对数据做频谱分析。本发明采用信噪比估计算法对峰识别筛选的相关信息做简单规定,峰识别过程所使用参数简单,在识别过程中的速度更快。所以说小波变换算法在峰识别应用时速度与本发明相比较低。
本发明基于噪声估计的谱峰识别结果在下图中灰色区域标出,如图1所示:图内识别结果仅包含有效峰信息且未包含无关的噪声信息,说明本发明可对谱峰内无用噪声信息做较好的排除,同时对有效峰信息做保留和识别,本发明谱峰识别精度与小波变换算法相当。
实施例2
本实施例提供一种基于噪声估计的谱峰识别系统,其采用实施例1的方法进行LC-MS/MS谱峰识别。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节。

Claims (10)

1.一种基于噪声估计的谱峰识别方法,其特征在于,包括以下步骤:
1)输入原始色谱数据R0,R0经预处理后的数据R1再采用S-G平滑算法进行平滑处理得到数据R2
2)针对数据R2,采用寻峰算法识别峰顶点,得到峰顶点集合P;
3)计算预处理后的数据R1中的每个点的信噪比估计值;
4)寻找峰顶点集合P中每个峰的峰起点:
对于峰顶点集合P中的峰顶点pi,在数据R1中寻找与峰顶点pi最近的点,作为数据R1中选择的峰顶点,记为picurrent
遍历数据R1中点picurrent左边所有的点,当某一个点pis同时满足以下条件a1、b1、c1时,则将点pis作为峰顶点pi对应的峰起点:
a1、点pis的信号强度比峰顶点pi右边1/2个峰宽W范围内的所有点的信号强度均低;
b1、点pis到点pcurrent的保留时间的差的绝对值小于预先设定的峰宽W;
c1、点pis的信噪比估计值大于输入的信噪比阈值T1;
遍历峰顶点集合P中所有的峰顶点,按照上述方法寻找得到P中每个峰顶点对应的峰起点;
5)寻找每个峰的峰终点:
遍历数据R1中点pcurrent右边所有的点,当某一个点pid同时满足以下条件a2、b2、c2时,则将点pid作为峰顶点pi对应的峰终点:
a2、点pid的信号强度比峰顶点pi左边所有点的信号强度均低;
b2、点pcurrent到点pid的保留时间的差的绝对值小于预先设定的峰宽W;
c2、点pid的信噪比估计值大于输入的信噪比阈值T1;
遍历峰顶点集合P中所有的峰顶点,按照上述方法寻找得到P中每个峰顶点对应的峰终点;
6)根据每个峰顶点pcurrent以及对应的峰起点、峰终点得到数据R1中所有的色谱峰。
2.根据权利要求1所述的基于噪声估计的谱峰识别方法,其特征在于,所述步骤1)中,对原始色谱数据R0进行预处理的方法为:
对于原始色谱数据R0中的每个数据点,采用每个数据点的前一个和后一个数据点的平均值来代替,处理后的数据即为数据R1,计算公式为:
f[R0(x)]=[R0(x-1)×λ1+R0(x)×λ2+R0(x+1)×λ3]/(λ123);
其中,R0(x)表示原始色谱数据R0中的数据点,f[R0(x)]表示预处理后的数据点,λ1、λ2、λ3均为权重系数。
3.根据权利要求1所述的基于噪声估计的谱峰识别方法,其特征在于,其中,λ1=0.5,λ2=1,λ3=0.5。
4.根据权利要求2所述的基于噪声估计的谱峰识别方法,其特征在于,所述步骤2)中采用的寻峰算法具体包括以下步骤:
2-1)输入数据R1,设定信噪比阈值T2;
2-2)计算预处理后的数据R1中的每个点的信噪比估计值;
2-3)对于数据R1,当其中的一个点同时满足以下条件①-⑤时,则将当前点作为峰顶点:
①当前点的信号强度值同时大于左边第一个点的信号强度值和右边第一个点的信号强度值;
②当前点、当前点左边的第一个点、当前点右边的第一个点的信噪比估计值均大于信噪比阈值T2;
③当前点左边的第二个点的信号强度值小于当前点左边的第一个点的信号强度值;
④当前点右边的第二个点的信号强度值小于当前点右边的第一个点的信号强度值;
⑤当前点左边的第二个点和右边的第二个点的信噪比估计值均大于信噪比阈值T2;
2-4)遍历数据R1中的所有点,按照所述步骤2-3)的方法,找出数据R1中的所有峰顶点,构建得到峰顶点集合P。
5.根据权利要求1所述的基于噪声估计的谱峰识别方法,其特征在于,所述步骤2)和步骤3)中计算信噪比估计值的方法包括以下步骤:
S1、将数据R1分为若干个数据单元,对于每一个数据单元,按照以下方法计算数据单元中的所有数据点的信噪比估计值;
S2、计算数据单元中所有数据点的期望E(X)和标准差STDEV(X),其中X表示构成数据点的向量,记数据选择阈值为INSMAX,INSMAX=E(X)+ηSTDEV(X),η为常数;
将数据R1的直方图的箱数设置为Nbin,则直方图被划分为Nbin段,每一段的范围长度INSSIZE为:
Figure FDA0003503869570000031
从而将数据R1中超过INSMAX的数据去除,将数据R1中小于INSMAX的数据点统计到直方图中,直方图的分段区间为:
[0,INSSIZE),[INSSIZE,2INSSIZE),……,[(Nbin-1)INSSIZE,NbinINSSIZE);
将数据R1中小于INSMAX的所有数据点统计到该分段区间中,计算落入到每个分段区间内的数据点的数量;
S3、对Nbin段分段区间按照落入其中的数据点的数量进行排列,筛选出数据点的数量的中位数对应的分段区间[(Nm-1)INSSIZE,NmINSSIZE),则噪声的估计初始值n0为:
n0=(Nm-0.5)INSSIZE
噪声需大于等于1,所以修正之后的噪声估计值n为:
n=max{1,(Nm-0.5)INSSIZE};
S4、计算该数据单元中每个点的信噪比估计值ynj
ynj=yj/n;
其中,yj表示该数据单元中的点j的信号值;
S4、计算数据R1中的所有数据单元中的数据点的信噪比估计值。
6.根据权利要求5所述的基于噪声估计的谱峰识别方法,其特征在于,其中,η=3。
7.根据权利要求5所述的基于噪声估计的谱峰识别方法,其特征在于,其中,Nbin=30。
8.一种基于噪声估计的谱峰识别系统,其特征在于,其采用如权利要求1-7中任意一项所述的方法进行谱峰识别。
9.一种存储介质,其上存储有计算机程序,其特征在于,该程序被执行时用于实现如权利要求1-7中任意一项所述的方法。
10.一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7中任意一项所述的方法。
CN202210133900.8A 2022-02-14 2022-02-14 基于噪声估计的谱峰识别方法及系统 Active CN114609319B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210133900.8A CN114609319B (zh) 2022-02-14 2022-02-14 基于噪声估计的谱峰识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210133900.8A CN114609319B (zh) 2022-02-14 2022-02-14 基于噪声估计的谱峰识别方法及系统

Publications (2)

Publication Number Publication Date
CN114609319A true CN114609319A (zh) 2022-06-10
CN114609319B CN114609319B (zh) 2023-08-22

Family

ID=81858380

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210133900.8A Active CN114609319B (zh) 2022-02-14 2022-02-14 基于噪声估计的谱峰识别方法及系统

Country Status (1)

Country Link
CN (1) CN114609319B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115166120A (zh) * 2022-06-23 2022-10-11 中国科学院苏州生物医学工程技术研究所 一种谱峰识别方法、设备、介质及产品
CN115219618A (zh) * 2022-06-30 2022-10-21 安图实验仪器(郑州)有限公司 一种噪声处理方法、装置、液质联用仪及可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030040123A1 (en) * 2001-08-24 2003-02-27 Surromed, Inc. Peak selection in multidimensional data
JP2011058930A (ja) * 2009-09-09 2011-03-24 Shimadzu Corp クロマトグラフ用データ処理装置
CN111089856A (zh) * 2019-12-26 2020-05-01 厦门大学 一种拉曼光谱弱信号提取的后处理方法
CN111595992A (zh) * 2020-06-30 2020-08-28 浙江三青环保科技有限公司 一种在线气相色谱峰的快速寻峰方法
US20210048417A1 (en) * 2018-03-14 2021-02-18 Hitachi High-Tech Corporation Chromatography mass spectrometry and chromatography mass spectrometer

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030040123A1 (en) * 2001-08-24 2003-02-27 Surromed, Inc. Peak selection in multidimensional data
JP2011058930A (ja) * 2009-09-09 2011-03-24 Shimadzu Corp クロマトグラフ用データ処理装置
US20210048417A1 (en) * 2018-03-14 2021-02-18 Hitachi High-Tech Corporation Chromatography mass spectrometry and chromatography mass spectrometer
CN111089856A (zh) * 2019-12-26 2020-05-01 厦门大学 一种拉曼光谱弱信号提取的后处理方法
CN111595992A (zh) * 2020-06-30 2020-08-28 浙江三青环保科技有限公司 一种在线气相色谱峰的快速寻峰方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
FELIX SCHOLKMANN 等: "An Efficient Algorithm for Automatic Peak Detection in Noisy Periodic and Quasi-Periodic Signals", ALGORITHMS, vol. 5 *
ZHONGQI ZHANG 等: "Optimizing Spectroscopic Signal-to-Noise Ratio in Analysis of Data Collected by a Chromatographic/Spectroscopic System", ANALYTICAL CHEMISTRY, vol. 71 *
李一波 等: "基于导数直方图和神经网络的色谱基线提取算法", 分析试验室, vol. 20 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115166120A (zh) * 2022-06-23 2022-10-11 中国科学院苏州生物医学工程技术研究所 一种谱峰识别方法、设备、介质及产品
CN115219618A (zh) * 2022-06-30 2022-10-21 安图实验仪器(郑州)有限公司 一种噪声处理方法、装置、液质联用仪及可读存储介质
CN115219618B (zh) * 2022-06-30 2023-10-24 安图实验仪器(郑州)有限公司 一种噪声处理方法、装置、液质联用仪及可读存储介质

Also Published As

Publication number Publication date
CN114609319B (zh) 2023-08-22

Similar Documents

Publication Publication Date Title
CN114609319A (zh) 基于噪声估计的谱峰识别方法及系统
US8275185B2 (en) Discover biological features using composite images
Yang et al. Comparison of public peak detection algorithms for MALDI mass spectrometry data analysis
US7899625B2 (en) Method and system for robust classification strategy for cancer detection from mass spectrometry data
US8987662B2 (en) System and method for performing tandem mass spectrometry analysis
US20110282588A1 (en) Method to automatically identify peaks and monoisotopic peaks in mass spectral data for biomolecular applications
US20030078739A1 (en) Feature list extraction from data sets such as spectra
CN110243806B (zh) 拉曼光谱下基于相似度的混合物组分识别方法
JP2007527992A (ja) 液体クロマトグラフィ/質量分析データ中のピークを同定し、スペクトルおよびクロマトグラムを形成するための装置および方法
Zhvansky et al. Unified representation of high-and low-resolution spectra to facilitate application of mass spectrometric techniques in clinical practice
Slawski et al. Isotope pattern deconvolution for peptide mass spectrometry by non-negative least squares/least absolute deviation template matching
Deng et al. An improved peak detection algorithm in mass spectra combining wavelet transform and image segmentation
CN112418072A (zh) 数据处理方法、装置、计算机设备和存储介质
CN114993891A (zh) 基于余弦相似度的颗粒物拉曼检测方法
Lieb et al. Peak detection for MALDI mass spectrometry imaging data using sparse frame multipliers
CA2975812A1 (en) Interference detection and peak of interest deconvolution
Zhou et al. Combination of continuous wavelet transform and genetic algorithm-based Otsu for efficient mass spectrometry peak detection
CN111089856A (zh) 一种拉曼光谱弱信号提取的后处理方法
CN112906740B (zh) 一种针对组织质谱成像结果去除批次间差异的方法
Antoniadis et al. Peaks detection and alignment for mass spectrometry data
CN110264482B (zh) 基于中智集变换矩阵因子分解的活动轮廓分割方法
Wang et al. A dynamic wavelet-based algorithm for pre-processing tandem mass spectrometry data
CN114863291B (zh) 基于mcl和光谱差异度量的高光谱影像波段选择方法
CN115078616A (zh) 基于信噪比的多窗口谱峰识别方法、设备、介质及产品
CN110619366A (zh) 一种基于神经网络的真菌maldi—tof质谱数据识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20221206

Address after: Building 4, No.16 Wujing Road, development zone, Dongli District, Tianjin

Applicant after: Tianjin Guoke Medical Technology Development Co.,Ltd.

Address before: 215163 Suzhou 88 high tech Zone, Jiangsu science and Technology City

Applicant before: Suzhou Institute of Biomedical Engineering and Technology Chinese Academy of Sciences

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240328

Address after: Building 4, No.16 Wujing Road, development zone, Dongli District, Tianjin

Patentee after: Tianjin Guoke Medical Technology Development Co.,Ltd.

Country or region after: China

Patentee after: Suzhou Institute of Biomedical Engineering and Technology Chinese Academy of Sciences

Address before: Building 4, No.16 Wujing Road, development zone, Dongli District, Tianjin

Patentee before: Tianjin Guoke Medical Technology Development Co.,Ltd.

Country or region before: China

TR01 Transfer of patent right