CN109697320B - 拖尾峰处理方法及装置 - Google Patents
拖尾峰处理方法及装置 Download PDFInfo
- Publication number
- CN109697320B CN109697320B CN201811598563.XA CN201811598563A CN109697320B CN 109697320 B CN109697320 B CN 109697320B CN 201811598563 A CN201811598563 A CN 201811598563A CN 109697320 B CN109697320 B CN 109697320B
- Authority
- CN
- China
- Prior art keywords
- chromatographic data
- tailing
- function
- peak
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title abstract description 7
- 238000011208 chromatographic data Methods 0.000 claims abstract description 173
- 238000012937 correction Methods 0.000 claims abstract description 51
- 238000000034 method Methods 0.000 claims abstract description 46
- 238000012545 processing Methods 0.000 claims abstract description 43
- 238000004364 calculation method Methods 0.000 claims description 15
- 230000006835 compression Effects 0.000 claims description 13
- 238000007906 compression Methods 0.000 claims description 13
- 230000008602 contraction Effects 0.000 claims description 10
- 230000000295 complement effect Effects 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000004451 qualitative analysis Methods 0.000 abstract description 3
- 238000004445 quantitative analysis Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 57
- 238000010586 diagram Methods 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 8
- 239000012855 volatile organic compound Substances 0.000 description 7
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 6
- 229930195733 hydrocarbon Natural products 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000004817 gas chromatography Methods 0.000 description 4
- 230000014759 maintenance of location Effects 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 3
- 150000002430 hydrocarbons Chemical class 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000009835 boiling Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- -1 nitrogen hydrocarbons Chemical class 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 229910052736 halogen Inorganic materials 0.000 description 1
- 150000002367 halogens Chemical class 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000001307 laser spectroscopy Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- IJGRMHOSHXDMSA-UHFFFAOYSA-N nitrogen Substances N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 239000013618 particulate matter Substances 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 125000005575 polycyclic aromatic hydrocarbon group Chemical group 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/20—Air quality improvement or preservation, e.g. vehicle emission control or emission reduction by using catalytic converters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Evolutionary Computation (AREA)
- Geometry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Hardware Design (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Treatment Of Liquids With Adsorbents In General (AREA)
Abstract
本发明提供了一种拖尾峰处理方法及装置,通过采集被测样本的色谱数据集,对色谱数据集进行去噪处理;将去除噪声后的色谱数据集分组,得到色谱数据子集;对色谱数据子集进行基线校正;初始化拖尾函数的参数,基于拖尾函数对色谱数据子集进行拟合,计算拟合误差;依据拟合误差更新拖尾函数的参数,直到拟合误差满足迭代终止条件,得到迭代后的拖尾函数并计算拖尾函数的峰面积;本发明通过提供一种拖尾峰处理方法及装置,对色谱数据中的拖尾峰进行迭代拟合,根据拟合误差更新拖尾函数的参数,使得拟合的拖尾函数接近色谱数据子集,计算迭代后的拖尾函数的峰面积,实现了对色谱数据子集的定性定量分析,提高了拖尾峰处理的准确度,减小了误差。
Description
技术领域
本发明涉及环境参数检测处理技术领域,尤其是涉及一种拖尾峰处理方法及装置。
背景技术
近年来,我国很多地区出现持续性大面积的雾霾天气,雾霾是对大气中各种悬浮颗粒物含量超标的笼统表述,严重危害人体健康。雾霾中细颗粒物(PM2.5)被认为是造成雾霾天气的“元凶”,而挥发性有机物(VOCs)作为PM2.5和O3的重要载体,已成为现阶段我国大气环境领域的重点监测对象。VOCs是指沸点在50~260℃之间,室温下饱和蒸汽压超过133.322Pa的易挥发性化合物,其主要成分为烃类、含氧烃类、含卤烃类、氮烃及硫烃类、低沸点的多环芳烃类等,VOCs一般涉及的化合物种类多、数量大,传统的分析方法难以适用于复杂样本组分的定性定量分析。
目前对VOCs的测定技术的研究方法越来越多,如气相色谱、气相色谱-质谱法(GC-MS)、高效液相色谱(HPLC)和激光光谱法等。当前主要的VOCs检测技术是气相色谱技术(GC),利用样品在色谱柱中气相和固定相间分配系数的不同,经过反复多次分配从而实现分离,具有高效能、高选择性、高灵敏度、高分辨率、样品用量少、分析速度快和适用范围广等优点。但是,气相色谱仪器检测得的VOCs色谱数据经常含有噪声污染,形成的谱图中含有各种类型的基线漂移、重叠峰、拖尾峰和干扰峰等现象。
在现有技术中分析处理拖尾峰时通常采用与规则的色谱峰一样的方法,而对规则的色谱峰的峰位、峰高和峰面积的分析方法有高斯拟合和对称零面积法,虽然这些方法能够准确计算标准的高斯峰形,但是当峰形不规则时,尤其对于拖尾严重的峰形,其分析的准确度往往不能令人满意、精确度较低、误差较大。
发明内容
有鉴于此,本发明的目的在于提供一种拖尾峰处理方法及装置,以缓解现有技术中对拖尾峰分析处理过程中存在的精确度低、误差大的技术问题。
第一方面,本发明实施例提供了一种拖尾峰处理方法,该方法用于对色谱图中的拖尾峰进行处理,该方法包括:
采集被测样本的色谱数据集;
对采集的所述色谱数据集进行去噪处理;
将去除噪声后的色谱数据集分组,得到色谱数据子集,每一色谱数据子集至少包含一完整的拖尾峰的色谱数据;
对色谱数据子集进行基线校正;
初始化拖尾函数的参数,基于拖尾函数对基线校正后的色谱数据子集进行拟合,计算拟合误差;
依据计算的拟合误差更新拖尾函数的参数,直到计算的拟合误差满足迭代终止条件,得到迭代后的拖尾函数;
计算迭代后的拖尾函数的峰面积。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,对色谱数据子集进行基线校正,包括:
获取色谱数据子集中每一色谱数据对应的参数值,参数值包括时间值以及时间值对应的峰位值;
将色谱数据子集的基线近似为线性方程,在色谱数据子集的基线上选取多个点,将选取到的点进行拟合,得到线性方程的系数;
将系数输入到线性方程中得到色谱数据子集对应的基线方程;
将色谱数据子集中每一色谱数据的时间值对应的峰位值减去对应的基线方程中时间值对应的基线值,得到基线校正后的时间值对应的色谱数据;
基线校正后的所有时间值对应的色谱数据组成色谱数据子集。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,拖尾函数的公式为:
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中,依据计算的拟合误差更新拖尾函数的参数,包括:
依据计算的拟合误差,选择N-M单纯形法对拖尾函数的参数进行更新。
结合第一方面第三种可能的实施方式,本发明实施例提供了第一方面的第四种可能的实施方式,其中,选择N-M单纯形法对拖尾函数的参数进行更新,包括:
获取色谱数据子集中n+1个时间值对应的电压值k1、k2、……、kn+1;
计算电压值对应的拟合误差f(k1)、f(k2)、f(k3)、…、f(kn+1);
将拟合误差f(k1)、f(k2)、f(k3)、…、f(kn+1)进行从小到大排序,得到单纯形f(x1)≤f(x2)≤…≤f(xn+1),x1、x2、...、xn+1∈{k1、k2、…、kn+1};
计算除去xn+1点之外的所有点构成图形的质心点x0;
计算反射点xr,xr=x0+α(x0-xn+1),α>0,α为反射点系数;
将反射点xr对应的拟合误差f(xr)与拟合误差f(xj)进行比较,j=1、2、…、n+1;
若f(x1)≤f(xr)≤f(xn),则用反射点xr替换最坏点xn+1,得到一个新的单纯形;
若f(xr)<f(x1),则计算膨胀点xε,xe=x0+γ(xr-x0),γ>1,γ为膨胀点系数,如果膨胀点优于反射点,即f(xe)<f(xr),则用膨胀点xε替换最坏点xn+1,得到一个新的单纯形,否则,用反射点xr替换最坏点xn+1,得到一个新的单纯形;
若f(xn)≤f(xr)≤f(xn+1),则计算压缩点xc,xc=x0+ρ(xn+1-x0),0<ρ≤0.5,ρ为压缩点系数,用压缩点xc替换最坏点xn+1,得到一个新的单纯形;
若f(xn+1)≤f(xr),则计算收缩点xz,xz=x1+σ(xj-x1),z=2、3、…、n+1,σ为收缩点系数,用收缩点xz代替除了x1点之外的所有点,继续迭代。
结合第一方面,本发明实施例提供了第一方面的第五种可能的实施方式,其中,迭代终止条件为:
判断迭代次数是否大于等于预设的次数;
若是,则终止迭代;
若否,则判断迭代后的拟合误差值是否小于拟合误差阈值,若是,终止迭代。
结合第一方面,本发明实施例提供了第一方面的第六种可能的实施方式,其中,计算迭代后的拖尾函数的峰面积,包括:
结合第一方面至第一方面第六种可能的实施方式,本发明实施例提供了第一方面的第七种可能的实施方式,其中,对获取到的所述色谱数据集进行去噪处理,包括:
选择Savitzky-Golay滤波器对色谱数据集进行平滑处理,去除色谱数据集中的噪声。
第二方面,本发明实施例还提供一种拖尾峰处理装置,该装置包括:
样本获取模块,用于采集被测样本的色谱数据集;
去噪处理模块,用于对采集的色谱数据集进行去噪处理;
数据集分组模块,用于将去除噪声后的色谱数据集分组,得到色谱数据子集,每一色谱数据子集至少包含一完整的拖尾峰的色谱数据;
基线校正模块,用于对色谱数据子集进行基线校正;
拟合误差计算模块,用于初始化拖尾函数的参数,基于拖尾函数对基线校正后的色谱数据子集进行拟合,计算拟合误差;
迭代模块,用于依据计算的拟合误差更新拖尾函数的参数,直到计算的拟合误差满足迭代终止条件,得到迭代后的拖尾函数;
面积计算模块,用于计算迭代后的拖尾函数的峰面积。
结合第二方面,本发明实施例提供了第二方面的第一种可能的实施方式,其中,基线校正模块包括:
参数值获取单元,用于获取色谱数据子集中每一色谱数据对应的参数值,参数值包括时间值以及时间值对应的峰位值;
拟合单元,用于将色谱数据子集的基线近似为线性方程,在色谱数据子集的基线上选取多个点,将选取到的点进行拟合,得到线性方程的系数;
基线方程确定单元,用于将系数输入到线性方程中得到色谱数据子集对应的基线方程;
校正单元,将色谱数据子集中每一色谱数据的时间值对应的峰位值减去对应的基线方程中时间值对应的基线值,得到基线校正后的时间值对应的色谱数据;
色谱数据子集组成单元,用于将基线校正后的所有时间值对应的色谱数据组成色谱数据子集。
本发明实施例带来了以下有益效果:本发明实施例提供的拖尾峰处理方法及装置,通过采集被测样本的色谱数据集,对采集的色谱数据集进行去噪处理;将去除噪声后的色谱数据集分组,得到色谱数据子集,每一色谱数据子集至少包含一完整的拖尾峰的色谱数据;对色谱数据子集进行基线校正;初始化拖尾函数的参数,基于拖尾函数对基线校正后的色谱数据子集进行拟合,计算拟合误差;依据计算的拟合误差更新拖尾函数的参数,直到计算的拟合误差满足迭代终止条件,得到迭代后的拖尾函数;计算迭代后的拖尾函数的峰面积,本发明实施例中通过对色谱数据中的拖尾峰进行迭代拟合,并通过拟合误差更新拖尾函数的参数,使得拟合的拖尾函数与采集到的色谱数据子集的拟合满足误差阈值或一定的迭代次数,并计算迭代后的拖尾函数的峰面积实现了对色谱数据子集的定性定量计算,进而缓解了现有技术中对拖尾峰分析处理过程中存在的精确度低、误差大的技术问题。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种拖尾峰处理方法的流程图;
图2为本发明实施例提供的一种色谱数据集的部分示意图;
图3为本发明实施例提供的一种基线校正后的色谱数据子集的示意图;
图4为本发明实施例提供的一种拖尾峰处理结果的示意图;
图5为本发明实施例提供的一种拖尾峰处理装置的结构示意图。
图标:201-样本获取模块;202-去噪处理模块;203-数据集分组模块;204-基线校正模块;205-拟合误差计算模块;206-迭代模块;207-面积计算模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,对拖尾峰进行处理的方法有高斯拟合和对称零面积法,这些方法能够准确计算标准的高斯峰形,但是当峰形不规则时,尤其对于拖尾严重的峰形,其分析的准确度往往不能令人满意、精确度较低、误差较大,基于此,本发明实施例提供的一种拖尾峰处理方法及装置,可以缓减现有技术中对拖尾峰进行处理时造成的准确度低、误差大的技术问题,提高了拖尾峰处理的准确度,减小了误差。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种拖尾峰处理方法进行详细介绍。
实施例一:
本发明实施例提供了一种拖尾峰处理方法,该方法用于对色谱图中的拖尾峰进行处理,如图1所示,图中所示出的是一种拖尾峰处理方法的流程图,该方法包括以下步骤:
步骤S101:采集被测样本的色谱数据集;
步骤S102:对采集的色谱数据集进行去噪处理;
在本发明实施例中,作为一可选实施例,可以选择Savitzky-Golay滤波器对色谱数据集进行平滑处理,去除色谱数据集中的噪声。
步骤S103:将去除噪声后的色谱数据集分组,得到色谱数据子集,每一所述色谱数据子集至少包含一完整的拖尾峰的色谱数据;
在本发明实施例中,对色谱数据集进行分组,得到多个色谱数据子集,每个色谱数据子集中要包含一个完整的拖尾峰对应的色谱数据,如图2所示,图中示出的是一种色谱数据集的部分示意图,具体的为一种测定甲烷后得到的部分色谱数据集,如图2所示,可以选取0.2min到0.7min的色谱数据作为一个色谱数据子集。在色谱数据子集中,拖尾峰两端基线应尽量长一些,且两端相对平坦,不平坦基线的应划分到同一色谱数据子集中,分别对各色谱数据子集进行处理。
步骤S104:对色谱数据子集进行基线校正;
在本发明实施例中,如图3所示,图中示出的是一种基线校正后的色谱数据子集的示意图,具体的是在图2的基础上进行基线校正后得到的色谱数据子集的示意图,其中,色谱数据子集中,每一色谱数据包括时间值以及该时间值对应的峰位值即电压值,基线校正时,将色谱数据子集中一色谱数据的时间值对应的峰位值减去基线方程中该时间值对应的基线值即纵坐标值,得到基线校正后的该时间值对应的色谱数据,基线校正后的所有时间值对应的色谱数据组成色谱数据子集,即得到基线校正后的色谱数据子集。
步骤S105:初始化拖尾函数的参数,基于拖尾函数对基线校正后的色谱数据子集进行拟合,计算拟合误差;
本发明实施例中,
在本发明实施例中,拖尾系数l的初始值可以设置为60,w和p的初始值为根据基线校正后的色谱数据子集的图形估计的峰宽值和峰位值,将上述初始值带入到拖尾函数中,初始化拖尾函数的参数,根据拖尾函数对基线校正后的色谱数据子集进行拟合,计算拟合误差。
步骤S106:依据计算的拟合误差更新拖尾函数的参数,直到计算的拟合误差满足迭代终止条件,得到迭代后的拖尾函数;
本发明实施例中,依据计算的拟合误差,可以选择N-M单纯形法对拖尾函数的参数进行更新。
步骤S107:计算迭代后的拖尾函数的峰面积;
将色谱数据子集的x区间[x1,xn]划分成m等分,m为整数,根据公式计算迭代后拖尾函数的峰面积,其中,计算拖尾峰面积的公式为:其中,g(x)为迭代后的拖尾函数,h=(xn-x1)/m,xi=x1+ih,i=0,1,…,m。作为一可选实施例,m的值可以为600,具体的m的值可以根据实际需要进行设置,在此本发明实施例不作具体限定。
具体的,如图2所示测定甲烷后得到的色谱峰存在拖尾现象,对甲烷的色谱峰经过上述步骤进行分析,可得到保留时间、峰高和峰面积,其中,峰高为高斯函数中G(x)的最大值,测定7次后,分别计算7次数据的相对标准偏差(RSD),测试结果如下表所述:
一般的,对于相同浓度的样本气体测量时连续进样保留时间的变化能够满足小于±1%的要求,峰高、峰面积的变化能够满足小于±3%的要求。由上表可知,测定7次数据后测得的保留时间、峰高和峰面积的RSD分别只有0.60%、0.43%和0.60%,所以以保留时间为标准的定性重复性分析满足±1%的要求,同时,以峰高及峰面积为标准的定量重复性分析远小于±3%的要求。
为了验证上述方法的稳定性,计算每一次的拟合误差和相关系数,如图4所示,图中示出的是一种拖尾峰处理结果的示意图,从图中可以看出,上述方法的7次数据迭代分析后拟合误差波动很小,其在1%附近上下微小波动,同时,相关系数在1附近几乎没有波动,表现出很好的稳定性。
本发明实施例提供的拖尾峰处理方法,通过采集被测样本的色谱数据集,对采集的色谱数据集进行去噪处理;将去除噪声后的色谱数据集分组,得到色谱数据子集,每一色谱数据子集至少包含一完整的拖尾峰的色谱数据;对色谱数据子集进行基线校正;初始化拖尾函数的参数,基于拖尾函数对基线校正后的色谱数据子集进行拟合,计算拟合误差;依据计算的拟合误差更新拖尾函数的参数,直到计算的拟合误差满足迭代终止条件,得到迭代后的拖尾函数;计算迭代后的拖尾函数的峰面积,本发明实施例中基于拖尾函数对色谱数据子集进行拟合,并计算拟合误差,设置迭代终止条件,使得拟合的拖尾函数与采集到的色谱数据子集的拟合满足误差阈值或一定的迭代次数,使得拖尾函数能更准确的反应拖尾峰的性能,并计算迭代后的拖尾函数的峰面积,进而通过对拖尾函数的分析实现对拖尾峰的定性定量分析处理,缓解了现有技术中对拖尾峰分析处理过程中存在的精确度低、误差大的技术问题,提高了拖尾峰处理的准确度,减小了误差。
作为一可选实施例,对色谱数据子集进行基线校正,包括:
步骤S1041:获取色谱数据子集中每一色谱数据对应的参数值,参数值包括时间值以及所述时间值对应的峰位值,即电压值;
步骤S1042:将色谱数据子集的基线近似为线性方程,在色谱数据子集的基线上选取多个点,将选取到的点进行拟合,得到线性方程的系数;
在本发明实施例中,可以在色谱数据子集的峰高的两侧基线上各选取10个点,将选取的20个点进行拟合,以时间值为横坐标,以该时间值对应的峰位值为纵坐标,采用最小二乘法进行拟合,得到线性方程的系数,具体的选取的点数可以根据实际需求进行设置,对此本发明实施例不作具体限定。
步骤S1043:将系数输入到线性方程中得到色谱数据子集对应的基线方程;
步骤S1044:将色谱数据子集中每一色谱数据的时间值对应的峰位值减去对应的基线方程中时间值对应的基线值,即纵坐标值,得到基线校正后的时间值对应的色谱数据;
步骤S1045:基线校正后的所有时间值对应的色谱数据组成色谱数据子集。
作为一可选实施例,选择N-M单纯形法对拖尾函数的参数进行更新,包括:
步骤S1061:获取色谱数据子集中n+1个时间值对应的电压值k1、k2、……、kn+1;
步骤S1062:计算电压值对应的拟合误差f(k1)、f(k2)、f(k3)、…、f(kn+1);
步骤S1063:将拟合误差f(k1)、f(k2)、f(k3)、…、f(kn+1)进行从小到大排序,得到排序序列,即单纯形f(x1)≤f(x2)≤…≤f(xn+1),x1、x2、...、xn+1∈{k1、k2、…、kn+1},其中,x1为色谱数据子集中最小拟合误差对应的电压值,x2为色谱数据子集中第二小拟合误差对应的电压值,…,xn+1为色谱数据子集中最大拟合误差对应的电压值;
步骤S1064:计算质心点x0,x0为除去xn+1点之外的所有点构成图形的质心;
步骤S1065:计算反射点xr,xr=x0+α(x0-xn+1),α>0,α为反射点系数;
步骤S1066:将反射点xr对应的拟合误差f(xr)与拟合误差f(xj)进行比较,j=1、2、…、n+1;
步骤S1067:若f(x1)≤f(xr)≤f(xn),即反射点优于第二个最差点f(xn),但比最好点差f(x1),则用反射点xr替换最坏点xn+1,得到一个新的单纯形,并转到步骤S1063;
若f(xr)<f(x1),即反射点比最好点要好,则计算膨胀点xε,xe=x0+γ(xr-x0),γ>1,γ为膨胀点系数,如果膨胀点优于反射点,即f(xe)<f(xr),则用膨胀点xε替换最坏点xn+1,得到一个新的单纯形,否则,用反射点xr替换最坏点xn+1,得到一个新的单纯形,并转到步骤S1063;
若f(xn)≤f(xr)≤f(xn+1),即反射点差于第二个最差点,优于最差点,则计算压缩点xc,xc=x0+ρ(xn+1-x0),0<ρ≤0.5,ρ为压缩点系数,用压缩点xc替换最坏点xn+1,得到一个新的单纯形,并转到步骤S1063;
若f(xn+1)≤f(xr),即反射点差于最差点,则计算收缩点xz,xz=x1+σ(xj-x1),z=2、3、…、n+1,σ为收缩点系数,用收缩点xz代替除了x1点之外的所有点,并转到步骤S1062,继续迭代。
在本发明实施例中,反射点系数、膨胀点系数、压缩点系数以及收缩点系数可以为α=1,γ=1,ρ=1/2,σ=1/2。
作为一可选实施例,具体的,迭代终止条件为:
判断迭代次数是否大于等于预设的次数;
若是,则终止迭代;
若否,则判断迭代后的拟合误差值是否小于拟合误差阈值,若是,终止迭代。
在本发明实施例中,迭代终止条件可以为:判断迭代次数是否大于等于1000次,若是,则终止迭代,若否,则判断迭代后的拟合误差值是否小于拟合误差阈值,若是,终止迭代,若否,则继续迭代,直到拟合误差的值小于拟合误差阈值,具体的,拟合误差的阈值可以为0.0000001,拟合误差的阈值可以根据实际的需要进行设置。
实施例二:
在上述实施例的基础上,本发明实施例还提供了一种拖尾峰处理装置,如图5所示的是一种拖尾峰处理装置的结构示意图,该装置包括如下模块:
样本获取模块201,用于采集被测样本的色谱数据集;
去噪处理模块202,用于对采集的色谱数据集进行去噪处理;
数据集分组模块203,用于将去除噪声后的色谱数据集分组,得到色谱数据子集,每一色谱数据子集至少包含一完整的拖尾峰的色谱数据;
基线校正模块204,用于对色谱数据子集进行基线校正;
拟合误差计算模块205,用于初始化拖尾函数的参数,基于拖尾函数对基线校正后的色谱数据子集进行拟合,计算拟合误差;
迭代模块206,用于依据计算的拟合误差更新拖尾函数的参数,直到计算的拟合误差满足迭代终止条件,得到迭代后的拖尾函数;
面积计算模块207,用于计算迭代后的拖尾函数的峰面积。
进一步的,本发明实施例提供的拖尾峰处理装置中,基线校正模块包括:
参数值获取单元,用于获取色谱数据子集中每一色谱数据对应的参数值,参数值包括时间值以及时间值对应的峰位值;
拟合单元,用于将色谱数据子集的基线近似为线性方程,在色谱数据子集的基线上选取多个点,将选取到的点进行拟合,得到线性方程的系数;
基线方程确定单元,用于将系数输入到线性方程中得到色谱数据子集对应的基线方程;
校正单元,将色谱数据子集中每一色谱数据的时间值对应的峰位值减去对应的基线方程中时间值对应的基线值,得到基线校正后的时间值对应的色谱数据;
色谱数据子集组成单元,用于将基线校正后的所有时间值对应的色谱数据组成色谱数据子集。
进一步的,本发明实施例提供的拖尾峰处理装置中,拟合误差计算模块包括:
N-M单纯形法计算单元,用于依据计算的拟合误差,选择N-M单纯形法对拖尾函数的参数进行更新。
具体的,本发明实施例中,N-M单纯形法计算单元包括:
电压值获取单元,用于获取色谱数据子集中n+1个时间值对应的电压值k1、k2、……、kn+1;
拟合误差计算单元,用于计算电压值对应的拟合误差f(k1)、f(k2)、f(k3)、…、f(kn+1);
排序单元,用于将拟合误差f(k1)、f(k2)、f(k3)、…、f(kn+1)进行从小到大排序,得到单纯形f(x1)≤f(x2)≤…≤f(xn+1),x1、x2、...、xn+1∈{k1、k2、…、kn+1};
质心点计算单元,用于计算质心点x0,x0为除去xn+1点之外的所有点构成图形的质心;
反射点计算单元,用于计算反射点xr,xr=x0+α(x0-xn+1),α>0,α为反射点系数;
比较单元,用于将反射点xr对应的拟合误差f(xr)与拟合误差f(xj)进行比较,j=1、2、…、n+1;
判断替换单元,用于若f(x1)≤f(xr)≤f(xn),即反射点优于第二个最差点f(xn),但比最好点差f(x1),则用反射点xr替换最坏点xn+1,得到一个新的单纯形;
若f(xr)<f(x1),即反射点比最好点要好,则计算膨胀点xε,xe=x0+γ(xr-x0),γ>1,γ为膨胀点系数,如果膨胀点优于反射点,即f(xe)<f(xr),则用膨胀点xε替换最坏点xn+1,得到一个新的单纯形,否则,用反射点xr替换最坏点xn+1,得到一个新的单纯形;
若f(xn)≤f(xr)≤f(xn+1),即反射点差于第二个最差点,优于最差点,则计算压缩点xc,xc=x0+ρ(xn+1-x0),0<ρ≤0.5,ρ为压缩点系数,用压缩点xc替换最坏点xn+1,得到一个新的单纯形;
若f(xn+1)≤f(xr),即反射点差于最差点,则计算收缩点xz,xz=x1+σ(xj-x1),z=2、3、…、n+1,σ为收缩点系数,用收缩点xz代替除了x1点之外的所有点,继续迭代。
进一步的,本发明实施例提供的拖尾峰处理装置中,去噪处理模块包括:
去噪处理单元,用于选择Savitzky-Golay滤波器对色谱数据集进行平滑处理,去除色谱数据集中的噪声。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本发明实施例提供的拖尾峰处理装置,与上述实施例提供的拖尾峰处理方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
本发明实施例所提供的进行拖尾峰处理方法及装置的计算机程序产品,包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (9)
1.一种拖尾峰处理方法,其特征在于,所述方法用于对色谱图中的拖尾峰进行处理,所述方法包括:
采集被测样本的色谱数据集;
对采集的所述色谱数据集进行去噪处理;
将去除噪声后的所述色谱数据集分组,得到色谱数据子集,每一所述色谱数据子集至少包含一完整的拖尾峰的色谱数据;
对所述色谱数据子集进行基线校正;
初始化拖尾函数的参数,基于所述拖尾函数对基线校正后的所述色谱数据子集进行拟合,计算拟合误差;
依据计算的拟合误差更新所述拖尾函数的参数,直到计算的拟合误差满足迭代终止条件,得到迭代后的所述拖尾函数;
计算迭代后的所述拖尾函数的峰面积;
所述拖尾函数的公式为:
其中,mu为所述拖尾函数的峰位,erfc为互补误差函数,l为拖尾系数,w为峰宽;pi为第i个峰位值;
2.根据权利要求1所述的方法,其特征在于,所述对所述色谱数据子集进行基线校正,包括:
获取所述色谱数据子集中每一色谱数据对应的参数值,所述参数值包括时间值以及所述时间值对应的峰位值;
将所述色谱数据子集的基线近似为线性方程,在所述色谱数据子集的基线上选取多个点,将选取到的点进行拟合,得到所述线性方程的系数;
将所述系数输入到所述线性方程中得到所述色谱数据子集对应的基线方程;
将所述色谱数据子集中每一所述色谱数据的时间值对应的峰位值减去对应的所述基线方程中所述时间值对应的基线值,得到基线校正后的所述时间值对应的色谱数据;
将基线校正后的所有时间值对应的色谱数据组成色谱数据子集。
3.根据权利要求1所述的方法,其特征在于,所述依据计算的拟合误差更新所述拖尾函数的参数,包括:
依据计算的拟合误差,选择N-M单纯形法对所述拖尾函数的参数进行更新。
4.根据权利要求3所述的方法,其特征在于,所述选择N-M单纯形法对所述拖尾函数的参数进行更新,包括:
获取所述色谱数据子集中n+1个时间值对应的电压值k1、k2、……、kn+1;
计算所述电压值对应的拟合误差f(k1)、f(k2)、f(k3)、…、f(kn+1);
将所述拟合误差f(k1)、f(k2)、f(k3)、…、f(kn+1)进行从小到大排序,得到单纯形f(x1)≤f(x2)≤…≤f(xn+1),x1、x2、...、xn+1∈{k1、k2、…、kn+1};
计算质心点x0,x0为除去xn+1点之外的所有点构成图形的质心;
计算反射点xr,xr=x0+α(x0-xn+1),α>0,α为反射点系数;
将所述反射点xr对应的拟合误差f(xr)与拟合误差f(xj)进行比较,j=1、2、…、n+1;
若f(x1)≤f(xr)≤f(xn),则用所述反射点xr替换最坏点xn+1,得到一个新的单纯形;
若f(xr)<f(x1),则计算膨胀点xε,xε=x0+γ(xr-x0),γ>1,γ为膨胀点系数,如果f(xi)<f(xr),则用所述膨胀点xε替换最坏点xn+1,得到一个新的单纯形,否则,用所述反射点xr替换最坏点xn+1,得到一个新的单纯形;
若f(xn)≤f(xr)≤f(xn+1),则计算压缩点xc,xc=x0+ρ(xn+1-x0),0<ρ≤0.5,ρ为压缩点系数,用所述压缩点xc替换最坏点xn+1,得到一个新的单纯形;
若f(xn+1)≤f(xr),则计算收缩点xz,xσ=x1+σ(xj-x1),z=2、3、…、n+1,σ为收缩点系数,用所述收缩点xz代替除了x1点之外的所有点,继续迭代。
5.根据权利要求1所述的方法,其特征在于,所述迭代终止条件为:
判断迭代次数是否大于等于预设的次数;
若是,则终止迭代;
若否,则判断迭代后的拟合误差值是否小于拟合误差阈值,若是,终止迭代。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述对采集的所述色谱数据集进行去噪处理,包括:
选择Savitzky-Golay滤波器对所述色谱数据集进行平滑处理,去除所述色谱数据集中的噪声。
8.一种拖尾峰处理装置,其特征在于,所述装置包括:
样本获取模块,用于采集被测样本的色谱数据集;
去噪处理模块,用于对采集的所述色谱数据集进行去噪处理;
数据集分组模块,用于将去除噪声后的所述色谱数据集分组,得到色谱数据子集,每一所述色谱数据子集至少包含一完整的拖尾峰的色谱数据;
基线校正模块,用于对所述色谱数据子集进行基线校正;
拟合误差计算模块,用于初始化拖尾函数的参数,基于所述拖尾函数对基线校正后的所述色谱数据子集进行拟合,计算拟合误差;
迭代模块,用于依据计算的拟合误差更新所述拖尾函数的参数,直到计算的拟合误差满足迭代终止条件,得到迭代后的所述拖尾函数;
面积计算模块,用于计算迭代后的所述拖尾函数的峰面积;
所述拖尾函数的公式为:
其中,mu为所述拖尾函数的峰位,erfc为互补误差函数,l为拖尾系数,w为峰宽;pi为第i个峰位值;
9.根据权利要求8所述的装置,其特征在于,所述基线校正模块包括:
参数值获取单元,用于获取所述色谱数据子集中每一色谱数据对应的参数值,所述参数值包括时间值以及所述时间值对应的峰位值;
拟合单元,用于将所述色谱数据子集的基线近似为线性方程,在色谱数据子集的基线上选取多个点,将选取到的点进行拟合,得到所述线性方程的系数;
基线方程确定单元,用于将所述系数输入到所述线性方程中得到所述色谱数据子集对应的基线方程;
校正单元,将所述色谱数据子集中每一色谱数据的时间值对应的峰位值减去对应的所述基线方程中所述时间值对应的基线值,得到基线校正后的所述时间值对应的色谱数据;
色谱数据子集组成单元,用于将基线校正后的所有时间值对应的色谱数据组成色谱数据子集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811598563.XA CN109697320B (zh) | 2018-12-25 | 2018-12-25 | 拖尾峰处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811598563.XA CN109697320B (zh) | 2018-12-25 | 2018-12-25 | 拖尾峰处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109697320A CN109697320A (zh) | 2019-04-30 |
CN109697320B true CN109697320B (zh) | 2023-04-11 |
Family
ID=66232001
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811598563.XA Active CN109697320B (zh) | 2018-12-25 | 2018-12-25 | 拖尾峰处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109697320B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112730712B (zh) * | 2020-12-31 | 2022-06-07 | 杭州谱育科技发展有限公司 | 提高lc-ms数据信噪比的方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1712955A (zh) * | 2004-06-25 | 2005-12-28 | 中国科学院大连化学物理研究所 | 一种精确测定色谱峰形参数和重叠峰面积的方法 |
CN101776671A (zh) * | 2010-01-05 | 2010-07-14 | 浙江大学 | 一种用于中药复杂成分分析的实时特征提取方法 |
CN106596815A (zh) * | 2016-12-07 | 2017-04-26 | 辽宁科技大学 | 用模拟移动床色谱分离复杂混合物中目标物的优化方法 |
CN106950315A (zh) * | 2017-04-17 | 2017-07-14 | 宁夏医科大学 | 基于uplc‑qtof快速表征样品中化学成分的方法 |
CN107607664A (zh) * | 2017-09-30 | 2018-01-19 | 福建思能电力科技有限公司 | 谱线积分方法、存储介质及计算机 |
-
2018
- 2018-12-25 CN CN201811598563.XA patent/CN109697320B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1712955A (zh) * | 2004-06-25 | 2005-12-28 | 中国科学院大连化学物理研究所 | 一种精确测定色谱峰形参数和重叠峰面积的方法 |
CN101776671A (zh) * | 2010-01-05 | 2010-07-14 | 浙江大学 | 一种用于中药复杂成分分析的实时特征提取方法 |
CN106596815A (zh) * | 2016-12-07 | 2017-04-26 | 辽宁科技大学 | 用模拟移动床色谱分离复杂混合物中目标物的优化方法 |
CN106950315A (zh) * | 2017-04-17 | 2017-07-14 | 宁夏医科大学 | 基于uplc‑qtof快速表征样品中化学成分的方法 |
CN107607664A (zh) * | 2017-09-30 | 2018-01-19 | 福建思能电力科技有限公司 | 谱线积分方法、存储介质及计算机 |
Non-Patent Citations (5)
Title |
---|
Evaluation and prediction of the shape of gas chromatographic peaks;P. Moretti 等;《Journal of Chromatography A》;20041231;全文 * |
Modelling and optimisation of preparative chromatographic purification of europium;Frida Ojala 等;《Journal of Chromatography A》;20111123;全文 * |
便携式气相色谱仪中嵌入式谱峰识别算法设计;罗伟栋 等;《色谱》;20111231;第1217页第1节 * |
基于离散点与小波重构SnO_2信号的新方法;张西咸等;《传感器与微系统》;20070820(第08期);全文 * |
薄层色谱综合分离程度的定量量度;戈早川等;《高等学校化学学报》;19921115(第11期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN109697320A (zh) | 2019-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4941101A (en) | Method for analyzing chromatograms | |
EP2322922B1 (en) | Method of improving the resolution of compounds eluted from a chromatography device | |
Chesler et al. | Iterative curve fitting of chromatographic peaks | |
Katajamaa et al. | Data processing for mass spectrometry-based metabolomics | |
JP4176203B2 (ja) | 信号解析方法とプログラム記録媒体とデータ解析システム | |
CN109738413B (zh) | 基于稀疏非负最小二乘的混合物拉曼光谱定性分析方法 | |
CN109697320B (zh) | 拖尾峰处理方法及装置 | |
CA2740220A1 (en) | Methods of automated spectral peak detection and quantification without user input | |
Yoon et al. | Calibration transfer of near-infrared spectra based on compression of wavelet coefficients | |
CN109271913B (zh) | 一种基于偏微分方程的maldi质谱峰检测方法 | |
US20120089342A1 (en) | Methods of Automated Spectral and Chromatographic Peak Detection and Quantification without User Input | |
Li et al. | Nonlinear diffusion filtering for peak-preserving smoothing of a spectrum signal | |
JP3737257B2 (ja) | 2次元表現によるスペクトルデータの処理方法及び補正方法 | |
CN114923873A (zh) | 一种气体浓度检测方法、装置、电子设备及存储介质 | |
CN109115908B (zh) | 基于层次聚类提取特征的切达奶酪身份的判别标识方法 | |
ITMI20071107A1 (it) | Metodo e sistema per rilevare picchi peptidici in segnali hplc-ms. | |
Diaconu et al. | Simulation study to determine necessary sample sizes for image analysis-based quantitative wood anatomy of vessels of beech (Fagus sylvatica) | |
CN116136518B (zh) | 色谱仪 | |
CN110988232A (zh) | 一种色谱基线降噪方法及其装置 | |
CN111426648B (zh) | 一种红外谱图的相似度确定方法及系统 | |
Mittermayr et al. | Filtering and integration of chromatographic data: a tool to improve calibration? | |
Demir et al. | Calibration of gas chromatography–mass spectrometry of two-component mixtures using univariate regression and two-and three-way partial least squares | |
Zhao et al. | Automatic peak integration and baseline correction for micro-scale gas chromatographs using continuous wavelet transform | |
Stewart et al. | Signal processing methods for capillary electrophoresis | |
Kalambet | Data acquisition and integration |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230329 Address after: 201a, unit 2, floor 2, building 15, courtyard 1, gaolizhang Road, Haidian District, Beijing 100095 Applicant after: HUADIAN INTELLIGENT CONTROL (BEIJING) TECHNOLOGY CO.,LTD. Address before: 101499 room 126, 9 Fengxiang East Street, Yangsong Town, Huairou District, Beijing Applicant before: BEIJING WANWEIYINGCHUANG TECHNOLOGY Co.,Ltd. |