CN117292131A - 质谱峰检测算法 - Google Patents
质谱峰检测算法 Download PDFInfo
- Publication number
- CN117292131A CN117292131A CN202311278680.9A CN202311278680A CN117292131A CN 117292131 A CN117292131 A CN 117292131A CN 202311278680 A CN202311278680 A CN 202311278680A CN 117292131 A CN117292131 A CN 117292131A
- Authority
- CN
- China
- Prior art keywords
- continuous wavelet
- local
- value
- coefficient matrix
- scanning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 43
- 238000001819 mass spectrum Methods 0.000 title claims abstract description 36
- 238000001228 spectrum Methods 0.000 claims abstract description 23
- 230000009466 transformation Effects 0.000 claims abstract description 20
- 230000011218 segmentation Effects 0.000 claims abstract description 14
- 239000011159 matrix material Substances 0.000 claims description 68
- 239000002245 particle Substances 0.000 claims description 40
- 238000000034 method Methods 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 14
- 230000003595 spectral effect Effects 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000013519 translation Methods 0.000 claims description 4
- 238000004949 mass spectrometry Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 2
- 238000012163 sequencing technique Methods 0.000 claims description 2
- 238000000638 solvent extraction Methods 0.000 claims 2
- 230000008859 change Effects 0.000 abstract description 4
- 150000002500 ions Chemical class 0.000 description 16
- 238000010586 diagram Methods 0.000 description 15
- 230000000694 effects Effects 0.000 description 4
- 238000001914 filtration Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 235000009413 Ratibida columnifera Nutrition 0.000 description 1
- 241000510442 Ratibida peduncularis Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/778—Active pattern-learning, e.g. online learning of image or video features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本申请涉及一种质谱峰检测算法,通过加权连续小波变换将频谱信号压缩到小尺度区间,以此获得更明显的峰值信息,使算法可以识别出更多的弱峰和重叠峰,并且减少了对假峰的识别,之后利用自适应变化的权重系数和学习因子优化PSO算法,通过优化后的PSO算法去寻找最佳分割阈值,将最佳分割阈值代入OTSU中,将峰值区域和噪声区域更精确地分割开,在保持较低假峰识别率的同时,实现较高的弱峰和重叠峰识别率。
Description
技术领域
本申请涉及质谱峰识别技术领域,特别是涉及一种质谱峰检测算法。
背景技术
随着科学技术的发展,质谱技术被广泛地应用在化工、食品检测、材料检测、地球化学和农学等领域。然而,在临床的样品检测中,由于复杂的样品基质产生的离子干扰待测化合物的质谱图或仪器产生的噪声,可能会导致出现峰型不规律、噪声峰增多等现象,这增加了待测化学物鉴定的难度,影响了结果的准确性。
到目前为止,大部分的谱峰识别算法主要是根据频谱中一个或多个数据点的提取幅度来检测峰。根据幅度定向原理提出了基于卡尔曼滤波和基于层次密度的噪声应用空间分类等方法来检测质谱图。这种方法虽然有效可行,但是在真正的峰值和噪声之间的区别不是单个或几个数据点的幅度。对于通过幅度定向的峰值检测算法来说,在检测低强度真实质谱特征的同时过滤高强度的噪声是十分困难的,单纯的利用幅度定向会使谱峰检测出现漏峰或错误识别的现象。
除幅度定向外,还有一种办法是基于形状定向的谱峰识别。这种方法以形状定向为判据,通过对脊线的长度和宽度限制来决定候选峰的质量,在提高检测灵敏度、降低假峰识别率的同时,对低强度特征峰的检测有特别好的效果。这种方法虽然可以做到在去除高强度噪声的同时检测到低强度峰,但是这种方法对参数的要求比较敏感,很容易因为参数的设置不恰当而出现错误识别。
综上所述,无论是基于形状定向还是幅度定向,虽然传统峰值检测方法有很多,但是每个方法无法做到面面俱到。当前的峰值检测难以做到在保证弱峰和重叠峰检出率的同时减少假峰识别率。
发明内容
基于此,有必要针对传统的峰值检测难以做到在保证弱峰和重叠峰检出率的同时减少假峰识别率的问题,提供一种质谱峰检测算法。
本申请提供一种质谱峰检测算法,所述质谱峰检测算法包括:
通过加权连续小波变换将频谱信号压缩到小尺度区间,得到加权连续小波系数矩阵;
通过滑动窗口法寻找加权连续小波系数矩阵中的局部极大值和局部最小值,根据局部最大值创建局部最大值的二维矩阵,根据局部最小值创建局部最小值的二维矩阵;
通过阶梯扫描法遍历所有的极大值和极小值,将局部极值连接成初始脊线和初始谷线;
利用连续小波变换得到连续小波系数矩阵,采用逻辑映射对连续小波系数矩阵进行灰度转换;
通过自适应变化的权重系数和学习因子优化PSO算法,利用优化后的PSO算法迭代寻优图像最佳分割阈值;
利用OTSU基于最佳分割阈值对连续小波系数矩阵分割谱峰区域和噪声区域;
对谱峰区域内的脊线设置宽度和长度阈值,得到符合阈值条件的最终脊线与最终谷线,将最终脊线与最终谷线和原始质谱图结合,获得最终的峰识别频谱图。
本申请涉及一种质谱峰检测算法,通过加权连续小波变换将频谱信号压缩到小尺度区间,以此获得更明显的峰值信息,使算法可以识别出更多的弱峰和重叠峰,并且减少了对假峰的识别,之后利用自适应变化的权重系数和学习因子优化PSO算法,通过优化后的PSO算法去寻找最佳分割阈值,将最佳分割阈值代入OTSU中,将峰值区域和噪声区域更精确地分割开,在保持较低假峰识别率的同时,实现较高的弱峰和重叠峰识别率。
附图说明
图1为本申请一实施例提供的一种质谱峰检测算法的方法流程图。
图2(a)为本申请一实施例提供的一种质谱峰检测算法的带有高斯噪声的模拟质谱图。
图2(b)为本申请一实施例提供的一种质谱峰检测算法的WCWT系数矩阵。
图2(c)为本申请一实施例提供的一种质谱峰检测算法的局部极大值示意图。
图2(d)为本申请一实施例提供的一种质谱峰检测算法的局部极小值示意图。
图2(e)为本申请一实施例提供的一种质谱峰检测算法的脊谷线示意图。
图2(f)为本申请一实施例提供的一种质谱峰检测算法的CWT系数矩阵示意图。
图2(g)为本申请一实施例提供的一种质谱峰检测算法的灰度图像示意图。
图2(h)为本申请一实施例提供的一种质谱峰检测算法的灰度直方图。
图2(i)为本申请一实施例提供的一种质谱峰检测算法的PSO迭代寻优示意图。
图2(j)为本申请一实施例提供的一种质谱峰检测算法的分割的峰区域示意图。
图2(k)为本申请一实施例提供的一种质谱峰检测算法的提取的峰脊线示意图。
图2(l)为本申请一实施例提供的一种质谱峰检测算法的峰识别图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
如图1所示,本申请提供一种质谱峰检测算法,包括:
S100,通过加权连续小波变换将频谱信号压缩到小尺度区间,得到加权连续小波系数矩阵。
S200,通过滑动窗口法寻找加权连续小波系数矩阵中的局部极大值和局部最小值,根据局部最大值创建局部最大值的二维矩阵,根据局部最小值创建局部最小值的二维矩阵。
S300,通过阶梯扫描法遍历所有的极大值和极小值,将局部极值连接成初始脊线和初始谷线。
S400,利用连续小波变换得到连续小波系数矩阵,采用逻辑映射对连续小波系数矩阵进行灰度转换。
S500,通过自适应变化的权重系数和学习因子优化PSO算法,利用优化后的PSO算法迭代寻优图像最佳分割阈值;
S600,利用OTSU基于最佳分割阈值对连续小波系数矩阵分割谱峰区域和噪声区域。
S700,对谱峰区域内的脊线设置宽度和长度阈值,得到符合阈值条件的最终脊线与最终谷线,将最终脊线与最终谷线和原始质谱图结合,获得最终的峰识别频谱图。
具体地,质谱图,不同质荷比的离子经质量分析器分开后,到检测器被检测并记录下来,经计算机处理后以质谱图的形式表示出来,在质谱图中,横坐标表示离子的质荷比(m/z)值,从左到右质荷比的值增大,对于带有单电荷的离子,横坐标表示的数值即为离子的质量。纵坐标表示离子流的强度,通常用相对强度来表示,即把最强的离子流强度定为100%,其它离子流的强度以其百分数表示,有时也以所有被记录离子的总离子流强度作为100%,各种离子以其所占的百分数来表示。
本实施例中,通过加权连续小波变换将频谱信号压缩到小尺度区间,以此获得更明显的峰值信息,使算法可以识别出更多的弱峰和重叠峰,并且减少了对假峰的识别,之后利用自适应变化的权重系数和学习因子优化PSO算法,通过优化后的PSO算法去寻找最佳分割阈值,将最佳分割阈值代入OTSU中,将峰值区域和噪声区域更精确地分割开,在保持较低假峰识别率的同时,实现较高的弱峰和重叠峰识别率。
本申请的一实施例中,所述S100包括:
S110,对连续小波进行加权处理,得到加权连续小波,如公式1所示。
其中,f(t)是质谱信号,a是尺度因子,b是时移因子,wa,b(t)是经过平移和缩放后的小波,Ca,b是反应信号和加权连续小波函数之间相似性的二维系数矩阵,g(a)是权重系数,R+是非负实数区间,R是实数区间。
具体地,质谱图是不同质荷比的离子经质量分析器分开后,到检测器被检测并记录下来,经计算机处理后以质谱图的形式表示出来。
本实施例中,图2(b)显示了模拟峰的加权连续小波系数矩阵。选用墨西哥帽小波作为母小波以获得更好的谱峰分辨率,墨西哥帽小波如公式11所示。
其中,是墨西哥帽小波,x是墨西哥帽小波的自变量。
墨西哥帽小波具有对称性和零均值的特性,利用这些特性,墨西哥帽小波可以自动去除峰值支撑区变化缓慢、单调的基线干扰。
连续小波变换虽然可以通过伸缩平移来对信号进行多尺度细化,使质谱图上的峰值信息更加明显,但随着尺度的增大,连续小波变换的强度逐渐降低,分辨率也会随之变差,这对大尺度的频谱信号就难以有较好的变换效果,因此采用加权连续小波变换。
加权连续小波变换通过对连续小波变换添加权重系数,把频谱压缩到小尺度区间,这不仅可以使峰值信号在小尺度区域变得更加清晰,而且还会对噪声有更好地去除作用,进一步避免了假峰的识别。
本申请的一实施例中,所述S200包括:
S210,创建极大值数据库和极小值数据库。
S220,通过公式2在加权连续小波系数矩阵上搜索局部极大值,将搜索到的极大值放入极大值数据库内。
其中,B(a,b)是搜索结果的布尔矩阵,C(a,b)是加权连续小波的二维系数矩阵,a是尺度因子,b是时移因子,True是局部极值点,False是非局部极值点。
S230,根据搜索到的局部极大值创建局部极大值二维矩阵。
S240,通过公式3在加权连续小波系数矩阵上搜索局部极小值,将搜索到的极小值放入极小值数据库内。
其中,其中,B(a,b)是搜索结果的布尔矩阵,C(a,b)是加权连续小波的二维系数矩阵,a是尺度因子,b是时移因子,True是局部极值点,False是非局部极值点。
S250,根据搜索到的局部极小值创建局部极小值二维矩阵。
具体地,将极大值和极小值统称为极值。极值是一个函数的极大值或极小值。如果一个函数在一点的一个邻域内处都有确定的值,而以该点处的值为最大(小),这函数在该点处的值就是一个极大(小)值。如果它比邻域内其他各点处的函数值都大(小),它就是一个严格极大(小)。该点就相应地称为一个极值点或严格极值点。
本实施例中,图2(c)和图2(d)是滑动窗口法对加权连续小波系数矩阵搜索后的结果。本实施例中通过采用滑动窗口法去寻找加权连续小波系数矩阵中的局部极大值和局部极小值。
在加权连续小波系数矩阵的每个尺度因子的3个点内来滑动窗口去搜索局部极大值,滑动窗口被设置为奇数,搜索结果形成了局部极大值的二维矩阵,只有局部极大值处的值被指定为真,只有窗口的中点大于其他点的值才属于局部极大值。
在加权连续小波系数矩阵的每个尺度因子的3个点内来滑动窗口去搜索局部极小值,滑动窗口被设置为奇数,搜索结果形成了局部极小值的二维矩阵,只有局部极小值处的值被指定为真,只有窗口的中点小于其他点的值才属于局部极小值。
本申请的一实施例中,所述S300包括:
S310,将尺度因子根据从小到大排序。
S320,依次选取尺度因子作为扫描尺度。
S330,依据扫描尺度对局部极大值矩阵进行扫描,直至扫描到长度与初始扫描尺度数相等的脊线或谷线时,停止扫描,获得真值的位置。
S340,将本次扫描的真值点与上一条脊线或谷线的最后一个点进行比较,判断本次扫描的真值点与上一条脊线的最后一个点是否相同。
S350,若本次扫描的真值点与上一条脊线或谷线的最后一个点相同,则将每个扫描位置加到最新的脊线或谷线内。
S360,若本次扫描的真值点与上一条脊线或谷线的最后一个点不相同,则将新的极值点作为脊线或谷线的根重新进行连接。
S370,返回S320。
S380,遍历所有扫描尺度,得到所有的脊线或谷线。
具体地,通过S200可知,真值点即为局部极值点。
由局部极大值连接成的线段为脊线,由局部极小值连接成的线段为谷线。
本实施例中,通过阶梯扫描法去连接脊谷线,图2(e)是通过阶梯扫描法连接脊谷线的示意图。
将多个尺度因子排序后得到a1、a2、...、an,n个尺度因子的个数。
选取尺度因子a1作为扫描尺度,尺度因子a1为初始扫描尺度,使用尺度因子a1上的第一个局部极值作为脊线或谷线的初始值,这个初始值即为脊线或谷线的根。
对加权连续小波系数矩阵进行第一次扫描,若a1为5,则当连接到5个局部极大值或局部极小值后,停止扫描,得到多个真值点,多个真值点依次连接得到脊线或谷线。
选取尺度因子a2作为扫描尺度,对加权连续小波系数矩阵进行第二次扫描,若尺度因子a2为6,则当扫描到6个局部极大值或局部极小值后,停止扫描,得到多个真值点。将本次扫描得到的多个真值点与第一次扫描中得到的最后一个真值点进行比较,若本次扫描的真值点与上一条脊线或谷线的最后一个点相同,则将本次扫描到的多个真值点依次连接至第一次扫描中所得到的脊线或谷线内,形成新的脊线或谷线。若本次扫描的真值点与上一条脊线或谷线的最后一个点不相同,则将本次扫描的极值点作为脊线或谷线的根,重新进行连接,形成新的脊线或谷线。
...
遍历a1至an,得到完整的脊线或谷线。
本申请的一实施例中,所述S400包括:
S410,对频谱图通过连续小波变换得到连续小波系数矩阵。
S420,采用公式4对连续小波系数矩阵进行灰度变换。
其中,ci是连续小波变换系数,yi是映射灰度,m是连续小波变换系数的平均值,τ是连续小波变换系数的标准差,e是自然对数的底数。
具体地,本实施例中的使用的母小波依然是墨西哥帽小波。
本实施例中,图2(f)是频谱图转换为灰度图。由于S200中的加权连续小波变换将谱峰区域压缩到小尺度区间,所以在大尺度区间没有谱峰信号,为了又更好的图像分割效果,需要将谱图变换到连续小波空间来进行灰度转换。
连续小波变换可以通过伸缩平移来对信号进行多尺度细化,使质谱图上的峰值信息更加明显。
逻辑映射适合用于最大值和最小值相差较大的情况。因为连续小波系数矩阵中系数差异较大,所以使用逻辑映射会有更好的灰度转换效果。
本申请的一实施例中,所述S500包括:
S510利用公式5、公式6和公式7对PSO算法进行优化。
其中,w是惯性权重,w(q)是对应迭代次数下的惯性权重,q是当前迭代次数,Tmax是最大迭代次数,wstart是初始惯性权重,wend是截止惯性权重。
其中,h1(q)是对应迭代次数下的自我学习因子,h1max是最大自我学习因子,h1min是最小自我学习因子,q是当前迭代次数,Tmax是最大迭代次数。
其中,h2(q)是对应迭代次数下的群体学习因子,h2max是最大群体学习因子,h2min是最小群体学习因子,q是当前迭代次数,Tmax是最大迭代次数。
具体地,惯性权重w的值越大,全局搜索的能力越强,惯性权重w的值越小,局部搜索的能力越强。
在PSO粒子群算法中,粒子寻找适应度值的过程就相当于寻找最大类间方差的过程。
本实施例中,传统的惯性权重w、自我学习因子h1和群体学习因子h2是定值,这样导致PSO算法的搜索结果不够精确。本实施例通过自适应的惯性权重w、自我学习因子h1和群体学习因子h2,能够随着群体迭代次数的变化,惯性权重w、自我学习因子h1和群体学习因子h2也在不断变化,这样有助于兼顾自我和群体,便于跳出局部最优,找到最优值。
令wstart=0.9,wend=0.4,以较大的惯性权重开局,便于实现全局搜索,以较小的惯性权重结束,便于局部搜索,防止错过最优值。
令h1max=2.5,h1min=0.5,以较大的自我学习因子开局,以较小的自我学习因子结束,便于粒子在开始时偏重于自我经验,使粒子过多地在局部搜索。
令h2max=2.25,h2min=1,以较小的群体学习因子开始,以较大的学习因子结束,便于粒子在结束时进行全局搜索,防止粒子过早地收敛到局部最优值。
在算法搜索初期采用较大的h1值和较小的h2值,使粒子尽量发散到搜索空间即强调“个体独立意识”,而较少受到种群内其他粒子即“社会意识部分”的影响,以增加群内粒子的多样性。随着选代次数的增加,使h1线性递减,h2线性递增,从而加强了粒子向全局最优点的收敛能力。
在本申请的一实施例中,所述S600包括:
S610,在求解空间内随机产生N个初始化粒子,每一个初始化粒子有对应的初始速度和初始位置。
S620,将最大类间方差作为适应度函数,把每个粒子的位置代入适应度函数,计算得到适应度值。
S630,跟踪个体的极大值和群体的极大值以更新个体的速度和位置,得到粒子的新的速度和新的位置。
S640,将粒子的新的位置再代入适应度函数,计算得到新的适应度值。
S650,比较新的适应度值和个体极值、群体极值的适应度值,更新个体极值和群体极值。
S660,通过粒子的个体极值和群体极值的更新寻找最优解。最优解即为最佳分割阈值。
S670,通过最佳分割阈值将连续小波系数矩阵分割出谱峰区域。
具体地,本实施例中的求解空间即为灰度级的范围[0.256]。
本实施例中,令N=50,则初始化粒子分别记为z1、z2、...、z50,每一个初始化粒子对应的初始速度为V1d、V2d、...、V50d,每一个初始化粒子对应的初始速度为X1d、X2d、...、X50d。
分别将每一个初始化粒子的初始速度代入公式8中,得到适应度值,分别记为σ1、σ2、...、σ50。
通过公式9追踪每一个初始粒子更新后的速度,分别记为
通过公式10追踪每一个初始粒子更新后的位置,分别记为
将更新后的位置代入公式8中,得到新的适应度值,分别记为σ'1、σ'2、...、σ'50。
将新的适应度值与个体极值、群体极值相比较,选出其中的最大值,作为最终的适应度值。
通过不断迭代,从最终的适应度中找出最优解,最优解就是最佳分割阈值。
在本申请的一实施例中,所述S620包括:
S621,设置阈值TH。
S622,通过公式8计算类间方差。
σ2=P1×P2×(M1-MG)2 公式8。
其中,σ2是类间方差,D1是小于阈值TH的所有像素,P1是像素被分到D1内的概率,M1是D1类像素的均值,D2是大于阈值TH的所有像素,P2是像素被分到D2内的概率,M2是D2类像素的均值,MG是全局像素均值。
本实施例中,阈值TH将连续小波矩阵图像中的所有像素分为两类D1和D2,D1是小于阈值TH的像素,D2是大于阈值TH的像素,将D1的均值记为M1,D2的均值记为M2,全局像素均值为MG,连续小波矩阵图像中的像素被分到D1的概率为P1,连续小波矩阵图像中的像素被分到D2的概率为P2。
则能够得到:P1×M1+P2×M2=MG 公式12。
P1+P2=1 公式13。
其中,P2=1-P1。
其中,k为灰度级,L为灰度级范围,遍历0至256个灰度级可以使公式8最大的k的值就是最佳分割阈值。
根据方差的概念,得到类间方差如公式14。
σ2=P1×(M1-MG)2+P2×(M2-MG)2 公式14。
其中,σ2是类间方差。将公式12和公式13代入公式14中,即可得到公式8。
在本申请的一实施例中,所述S630包括。
S631,通过公式9更新粒子速度。
其中,是更新后的速度,/>是目前的速度,/>是个体极值,/>是群体极值,w是惯性权重,h1是个体学习因子,h2是群体学习因子,r1和r2是0至1之间两个不同的随机数,q是迭代次数,d是维度,i是粒子个数,i∈N。
S632,通过公式10更新粒子位置。
其中,是当前的位置,/>是更新后位置,/>是更新后的速度,d是维度,i是粒子个数,i∈N。
本实施例中,通过公式9和公式10分别获得粒子速度和粒子位置的更新。
在本申请的一实施例中,所述S700包括:
S710,根据谱峰和噪声峰的形状差异,对识别的脊线的宽度和长度分别设置阈值。
S720,筛选符合阈值条件的脊线,筛选出的脊线作为最终脊线。
S730,将最终脊线与原始质谱图结合,得到最终的峰识别频谱图。
本实施例中,利用PSO算法的结果如图2(g)至图2(i)所示。得到最佳分割阈值后,将最佳分割阈值代入OTSU,通过OTSU将灰度图分割,得到峰值区域,如图2(j)所示,将S300中得到的脊谷线与峰值区域结合。
设置宽度阈值和长度阈值,过滤噪声,得到谱峰脊线,如图2(k)所示,将谱峰脊线与原始频谱图结合,得到模拟峰识别图,如图2(l)所示。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种质谱峰检测算法,其特征在于,所述质谱峰检测算法包括:
通过加权连续小波变换将频谱信号压缩到小尺度区间,得到加权连续小波系数矩阵;
通过滑动窗口法寻找加权连续小波系数矩阵中的局部极大值和局部最小值,根据局部最大值创建局部最大值的二维矩阵,根据局部最小值创建局部最小值的二维矩阵;
通过阶梯扫描法遍历所有的极大值和极小值,将局部极值连接成初始脊线和初始谷线;
利用连续小波变换得到连续小波系数矩阵,采用逻辑映射对连续小波系数矩阵进行灰度转换;
通过自适应变化的权重系数和学习因子优化PSO算法,利用优化后的PSO算法迭代寻优图像最佳分割阈值;
利用OTSU基于最佳分割阈值对连续小波系数矩阵分割谱峰区域和噪声区域;
对谱峰区域内的脊线设置宽度和长度阈值,得到符合阈值条件的最终脊线与最终谷线,将最终脊线与最终谷线和原始质谱图结合,获得最终的峰识别频谱图。
2.根据权利要求1所述的质谱峰检测算法,其特征在于,所述通过加权连续小波变换将频谱信号压缩到小尺度区间,得到加权连续小波系数矩阵,包括:
对连续小波进行加权处理,得到加权连续小波,如公式1所示;
其中,f(t)是质谱信号,a是尺度因子,b是时移因子,wa,b(t)是经过平移和缩放后的小波,Ca,b是反应信号和加权连续小波函数之间相似性的二维系数矩阵,g(a)是权重系数,R+是非负实数区间,R是实数区间。
3.根据权利要求2所述的质谱峰检测算法,其特征在于,所述通过滑动窗口法寻找加权连续小波系数矩阵中的局部极大值和局部最小值,根据局部最大值创建局部最大值的二维矩阵,根据局部最小值创建局部最小值的二维矩阵,包括:
创建极大值数据库和极小值数据库;
通过公式2在加权连续小波系数矩阵上搜索局部极大值,将搜索到的极大值放入极大值数据库内;
其中,B(a,b)是搜索结果的布尔矩阵,C(a,b)是加权连续小波的二维系数矩阵,a是尺度因子,b是时移因子,True是局部极值点,False是非局部极值点;
根据搜索到的局部极大值创建局部极大值二维矩阵;
通过公式3在加权连续小波系数矩阵上搜索局部极小值,将搜索到的极小值放入极小值数据库内;
其中,其中,B(a,b)是搜索结果的布尔矩阵,C(a,b)是加权连续小波的二维系数矩阵,a是尺度因子,b是时移因子,True是局部极值点,False是非局部极值点;
根据搜索到的局部极小值创建局部极小值二维矩阵。
4.根据权利要求3所述的质谱峰检测算法,其特征在于,所述通过阶梯扫描法遍历所有的极大值和极小值,将局部极值连接成初始脊线和初始谷线,包括:
将尺度因子根据从小到大排序;
依次选取尺度因子作为扫描尺度;
依据扫描尺度对局部极大值矩阵进行扫描,直至扫描到长度与初始扫描尺度数相等的脊线时,停止扫描,获得真值的位置;
将本次扫描的真值点与上一条脊线的最后一个点进行比较,判断本次扫描的真值点与上一条脊线的最后一个点是否相同;
若本次扫描的真值点与上一条脊线的最后一个点相同,则将每个扫描位置加到最新的脊线内;
若本次扫描的真值点与上一条脊线的最后一个点不相同,则将新的极值点作为脊线或谷线的根重新进行连接;
返回依次选取尺度因子作为扫描尺度;
遍历所有扫描尺度,得到所有的脊线。
5.根据权利要求4所述的质谱峰检测算法,其特征在于,所述利用连续小波变换得到连续小波系数矩阵,采用逻辑映射对连续小波系数矩阵进行灰度转换,包括:
对频谱图通过连续小波变换得到连续小波系数矩阵;
采用公式4对连续小波系数矩阵进行灰度变换;
其中,ci是连续小波变换系数,yi是映射灰度,m是连续小波变换系数的平均值,τ是连续小波变换系数的标准差,e是自然对数的底数。
6.根据权利要求5所述的质谱峰检测算法,其特征在于,所述通过自适应变化的权重系数和学习因子优化PSO算法,利用优化后的PSO算法迭代寻优图像最佳分割阈值,包括:
利用公式5、公式6和公式7对PSO算法进行优化;
其中,w是惯性权重,w(q)是对应迭代次数下的惯性权重,q是当前迭代次数,Tmax是最大迭代次数,wstart是初始惯性权重,wend是截止惯性权重;
其中,h1(q)是对应迭代次数下的自我学习因子,h1max是最大自我学习因子,h1min是最小自我学习因子,q是当前迭代次数,Tmax是最大迭代次数;
其中,h2(q)是对应迭代次数下的群体学习因子,h2max是最大群体学习因子,h2min是最小群体学习因子,q是当前迭代次数,Tmax是最大迭代次数。
7.根据权利要求6所述的质谱峰检测算法,其特征在于,所述利用OTSU基于最佳分割阈值对连续小波系数矩阵分割谱峰区域和噪声区域,包括:
在求解空间内随机产生N个初始化粒子,每一个初始化粒子有对应的初始速度和初始位置;
将最大类间方差作为适应度函数,把每个粒子的位置代入适应度函数,计算得到适应度值;
跟踪个体的极大值和群体的极大值以更新个体的速度和位置,得到粒子的新的速度和新的位置;
将粒子的新的位置再代入适应度函数,计算得到新的适应度值;
比较新的适应度值和个体极值、群体极值的适应度值,更新个体极值和群体极值;
通过粒子的个体极值和群体极值的更新寻找最优解;最优解即为最佳分割阈值;
通过最佳分割阈值将连续小波系数矩阵分割出谱峰区域。
8.根据权利要求7所述的质谱峰检测算法,其特征在于,所述将最大类间方差作为适应度函数,把每个粒子的位置代入适应度函数,计算得到适应度值,包括:
设置阈值TH;
通过公式8计算类间方差;
σ2 =P1×P2×(M1-MG)2 公式8;
其中,D1是小于阈值TH的所有像素,P1是像素被分到D1内的概率,M1是D1类像素的均值,D2是大于阈值TH的所有像素,P2是像素被分到D2内的概率,M2是D2类像素的均值,MG是全局像素均值。
9.根据权利要求8所述的质谱峰检测算法,其特征在于,所述跟踪个体的极大值和群体的极大值以更新个体的速度和位置,得到粒子的新的速度和新的位置,包括:
通过公式9更新粒子速度;
其中,是更新后的速度,/>是目前的速度,/>是个体极值,/>是群体极值,w是惯性权重,h1是个体学习因子,h2是群体学习因子,r1和r2是0至1之间两个不同的随机数,q是迭代次数,d是维度,i是粒子个数,i∈N;
通过公式10更新粒子位置;
其中,是当前的位置,/>是更新后位置,/>是更新后的速度,d是维度,i是粒子个数,i∈N。
10.根据权利要求9所述的质谱峰检测算法,其特征在于,所述对谱峰区域内的脊线设置宽度和长度阈值,得到符合阈值条件的最终脊线与最终谷线,将最终脊线与最终谷线和原始质谱图结合,获得最终的峰识别频谱图,包括:
根据谱峰和噪声峰的形状差异,对识别的脊线的宽度和长度分别设置阈值;
筛选符合阈值条件的脊线,筛选出的脊线作为最终脊线;
将最终脊线与原始质谱图结合,得到最终的峰识别频谱图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311278680.9A CN117292131A (zh) | 2023-09-28 | 2023-09-28 | 质谱峰检测算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311278680.9A CN117292131A (zh) | 2023-09-28 | 2023-09-28 | 质谱峰检测算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117292131A true CN117292131A (zh) | 2023-12-26 |
Family
ID=89247675
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311278680.9A Pending CN117292131A (zh) | 2023-09-28 | 2023-09-28 | 质谱峰检测算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117292131A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118009914A (zh) * | 2024-04-08 | 2024-05-10 | 上海中医药大学附属岳阳中西医结合医院 | 基于红外光谱的智能艾灸机器人部件温度变形监测方法 |
-
2023
- 2023-09-28 CN CN202311278680.9A patent/CN117292131A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118009914A (zh) * | 2024-04-08 | 2024-05-10 | 上海中医药大学附属岳阳中西医结合医院 | 基于红外光谱的智能艾灸机器人部件温度变形监测方法 |
CN118009914B (zh) * | 2024-04-08 | 2024-06-11 | 上海中医药大学附属岳阳中西医结合医院 | 基于红外光谱的智能艾灸机器人部件温度变形监测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106295124B (zh) | 多种图像检测技术综合分析基因子图相似概率量的方法 | |
Ranzato et al. | Automatic recognition of biological particles in microscopic images | |
CN109871902B (zh) | 一种基于超分辨率对抗生成级联网络的sar小样本识别方法 | |
US8611604B2 (en) | Object detection device | |
CN107085708B (zh) | 基于多尺度分割和融合的高分辨率遥感图像变化检测方法 | |
US8230272B2 (en) | Methods and systems for detection of anomalies in digital data streams | |
CN110796667B (zh) | 基于改进小波聚类的彩色图像分割方法 | |
CN105976376B (zh) | 一种基于部件模型的高分辨sar图像目标检测方法 | |
CN109871875B (zh) | 一种基于深度学习的建筑物变化检测方法 | |
CN109801305B (zh) | 基于深度胶囊网络的sar图像变化检测方法 | |
CN114067109B (zh) | 谷物检测方法及检测设备、存储介质 | |
CN109255386B (zh) | 基于毫米波雷达和视觉融合的道路行人快速检测方法 | |
CN117292131A (zh) | 质谱峰检测算法 | |
CN110659374A (zh) | 一种基于神经网络提取车辆特征值及属性的以图搜图方法 | |
CN111833353B (zh) | 一种基于图像分割的高光谱目标检测方法 | |
CN111639697B (zh) | 基于非重复采样与原型网络的高光谱图像分类方法 | |
Wang et al. | Superpixel-level target discrimination for high-resolution SAR images in complex scenes | |
CN117036737A (zh) | 基于信息熵、gms与lc显著检测的特征提取与匹配方法 | |
CN115880501A (zh) | 一种基于红外相机的高压电线红外图像处理方法和系统 | |
CN110097067B (zh) | 一种基于层进式特征变换的弱监督细粒度图像分类方法 | |
CN111709426A (zh) | 一种基于轮廓和纹理的硅藻识别方法 | |
CN113034471B (zh) | 一种基于finch聚类的sar图像变化检测方法 | |
Jamil et al. | A rule-based segmentation method for fruit images under natural illumination | |
CN107895361A (zh) | 一种基于局部密度纯化背景的高光谱异常检测方法 | |
Gamarra et al. | A study of image analysis algorithms for segmentation, feature extraction and classification of cells |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |