CN112711991B - 一种自动提取x射线衍射图谱中特征峰信息的方法 - Google Patents
一种自动提取x射线衍射图谱中特征峰信息的方法 Download PDFInfo
- Publication number
- CN112711991B CN112711991B CN202011501393.6A CN202011501393A CN112711991B CN 112711991 B CN112711991 B CN 112711991B CN 202011501393 A CN202011501393 A CN 202011501393A CN 112711991 B CN112711991 B CN 112711991B
- Authority
- CN
- China
- Prior art keywords
- peak
- loc
- smooth
- data
- ray diffraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000002441 X-ray diffraction Methods 0.000 title claims abstract description 58
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000001228 spectrum Methods 0.000 claims abstract description 15
- 238000010606 normalization Methods 0.000 claims abstract description 10
- 238000012937 correction Methods 0.000 claims abstract description 9
- 238000009499 grossing Methods 0.000 claims abstract description 9
- 238000012545 processing Methods 0.000 claims abstract description 9
- 238000001914 filtration Methods 0.000 claims description 14
- 230000010354 integration Effects 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 4
- 239000002808 molecular sieve Substances 0.000 description 4
- URGAHOPLAPQHLN-UHFFFAOYSA-N sodium aluminosilicate Chemical compound [Na+].[Al+3].[O-][Si]([O-])=O.[O-][Si]([O-])=O URGAHOPLAPQHLN-UHFFFAOYSA-N 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 238000004523 catalytic cracking Methods 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 238000004517 catalytic hydrocracking Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000012988 high-throughput synthesis Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
- G06F2218/10—Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N23/00—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
- G01N23/20—Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by using diffraction of the radiation by the materials, e.g. for investigating crystal structure; by using scattering of the radiation by the materials, e.g. for investigating non-crystalline materials; by using reflection of the radiation by the materials
- G01N23/207—Diffractometry using detectors, e.g. using a probe in a central position and one or more displaceable detectors in circumferential positions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
Landscapes
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Crystallography & Structural Chemistry (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analysing Materials By The Use Of Radiation (AREA)
Abstract
本发明涉及数据科学领域,更具体的说,涉及一种自动提取X射线衍射图谱中特征峰信息的方法。本发明提出的自动提取X射线衍射图谱中特征峰信息的方法,包括以下步骤:S1、对X射线衍射图谱进行归一化处理和平滑操作;S2、遍历整个X射线衍射图谱,采用滑动窗口的形式计算整个窗口的标准差,根据标准差找出其中峰可行区间;S3、对峰可行区间进行遍历,剔除掉不是峰的区间,并将其中相邻的峰区间进行合并;S4、遍历每个峰信号区间进行基线修正;S5、对修正后的峰信号进行拟合,得到峰信号的信息参数。本发明无须手动操作,可以自动化地将XRD图谱中特征峰信息提取出来,大大降低了手动提取峰的人力成本,提升了后续分析的效率。
Description
技术领域
本发明涉及数据科学领域,更具体的说,涉及一种自动提取X射线衍射图谱中特征峰信息的方法。
背景技术
分子筛已广泛用于催化裂化、加氢裂化、汽油和柴油加氢改质等石油化工过程,是石油化工行业中应用最广的催化材料。
合成具有高效的分子筛催化剂能产生巨大的经济效益,而高通量合成系统以其高实验吞吐量被用于分子筛的实验研究和开发。
X射线衍射(XRD)图谱被广泛用于表征分子筛等微观晶体结构的手段。传统的手动峰标注需要操作人员逐个将图谱中的峰标注出来,这耗费了大量的人力资本。
因此,目前亟需一种自动提取X射线衍射图谱中特征峰信息的方法。
发明内容
本发明的目的是提供一种自动提取X射线衍射图谱中特征峰信息的方法,解决现有技术对于X射线衍射图谱中特征峰信息难以进行有效自动提取的问题。
为了实现上述目的,本发明提供了一种自动提取X射线衍射图谱中特征峰信息的方法,包括以下步骤:
S1、对X射线衍射图谱进行归一化处理和平滑操作;
S2、遍历整个X射线衍射图谱,采用滑动窗口的形式计算整个窗口的标准差,根据标准差找出其中峰可行区间;
S3、对峰可行区间进行遍历,剔除掉不是峰的区间,并将其中相邻的峰区间进行合并;
S4、遍历每个峰信号区间进行基线修正;
S5、对修正后的峰信号进行拟合,得到峰信号的信息参数,信息参数包括峰高、峰强度以及峰宽。
在一实施例中,所述步骤S1中,采用高斯滤波对X射线衍射图谱进行平滑操作。
在一实施例中,所述步骤S1,进一步包括以下步骤:
S11、将原始的X射线衍射图谱数据进行归一化处理;
S12、利用高斯滤波对X射线衍射图谱进行滤波操作,得到滤波后的X射线衍射图谱datasmooth。
在一实施例中,所述步骤S2,进一步包括以下步骤:
S21、将衍射角度按序排列,对X射线衍射图谱datasmooth进行遍历,采用滑动窗口的方法计算窗口内的标准差,得到新的标准差图谱datastd;
S22、寻找出标准差图谱datastd中的极大值点,剔除掉小于给定阈值的极大值点,得到极大值点对应位置索引maxstd;
S23、遍历位置索引maxstd中每一个点p,将p位置的左右给定宽度的位置区域设为峰可出现区域,找出X射线衍射图谱datasmooth中的极大值点位置,剔除掉未落在峰可出现区域的极大值点,得到极大值点位置索引maxsmooth;
S24、寻找出标准差图谱datastd中的极小值点,得到极小值点位置索引minstd,以及X射线衍射图谱datasmooth中的极小值点对应的位置索引minsmooth;
S25、遍历极大值点位置索引maxsmooth的每个点p,作为峰位置locpeak,在极小值点位置索引minstd中找出离该极大值点左侧最近位置lstd和右侧最近位置rstd,在minsmooth中找出离该极大值点左侧最近位置lsmooth和右侧最近位置rsmooth;
S26、分别比较X射线衍射图谱datasmooth在左侧最近位置lstd和lsmooth,右侧最近位置rstd和rsmooth处的值,取其中较小值的位置分别作为峰的起始位置locstart和结束位置locend,得到三元组peakinfo,每项三元组包含峰起始位置locstart、峰位置locpeak和峰结束位置locend。
在一实施例中,所述步骤S3,剔除掉不是峰的区间,进一步包括以下步骤:
遍历peakinfo中的每一条,如果datasmooth[locpeak]与datasmooth[locstart]、datasmooth[locend]之差都小于给定强度阈值,则删除这条峰信息,得到新的peakinfo_new,peakinfo_new按locstart从小到大排序;
其中,datasmooth[locpeak]为datasmooth[i]在i=locpeak处的值;
datasmooth[locstart]为datasmooth[i]在i=locstart处的值;
datasmooth[locend]为datasmooth[i]在i=locend处的值;
datasmooth[i]为datasmooth在i处的值。
在一实施例中,所述步骤S3,将其中相邻的峰区间进行合并,进一步包括以下步骤:
对于peakinfo_new中的每条记录peakinfo_new[i],如果peakinfo_new[i+1][locstart]与peakinfo_new[i][locend]相差不超过给定宽度,则两条记录记载的区间合并,新记录的locstart为peakinfo_new[i][locstart],新记录的locend为peakinfo_new[i][locend],新记录的locpeak为两条记录locpeak合在一起的列表,依次遍历所有记录,得到最终的三元组peakinfo_final,每项三元组包含峰起始位置locstart,峰位置locpeak和峰结束位置locend三项;
其中,peakinfo_new[i+1][locstart]代表第i+1条记录peakinfo_new[i+1]中的locstart值。
在一实施例中,所述步骤S4,进一步包括以下步骤:
S41、遍历peakinfo_final中的每条记录,从datasmooth中将locstart到locend之间的数据信号截取出来得到截取信号signal;
S42、遍历每条signal,在左右两端给定宽度的位置寻找最小的强度值包括左侧最小强度值lbkg和右侧最小强度值rbkg,取lbkg和rbkg中较小值填充成和signal长度一致的背景向量bkg;
S43、利用signal减去bkg得到signalmodify,对signalmodify进行离散积分得到p_q;
S44、利用以下公式从左到右更新bkg中的值:
bkgi=lbkg+(rbkg-lbkg)*p_qi/p_q;
其中,p_qi为从起始位置到i位置的离散积分;
S45、重复S43-S44数次得到bkgfinal,最终信号signalfinal为:
signalfinal=signal-bkgfinal。
在一实施例中,所述步骤S5,进一步包括以下步骤:
遍历signalfinal,使用给定比例的高斯、洛伦兹混合函数对信号进行多峰拟合,得到峰强a、峰位置b以及峰宽c。
在一实施例中,所述高斯、洛伦兹混合函数公式如下:
式中,wgauss为高斯函数的混合分量,i为在进行多峰拟合时第i个峰的拟合参数;
多峰拟合函数如下:
f(x)=f1(x)+f2(x)+f3(x)+…+fn(x);
其中,n为需要拟合的信号中的峰数量。
本发明提出的一种自动提取X射线衍射图谱中特征峰信息的方法,无须手动操作,可以自动化地将XRD图谱中特征峰的峰位置,峰强度以及峰宽信息提取出来,从而大大降低了手动提取峰的人力成本,提升了后续分析的效率。
附图说明
本发明上述的以及其他的特征、性质和优势将通过下面结合附图和实施例的描述而变的更加明显,在附图中相同的附图标记始终表示相同的特征,其中:
图1揭示了根据本发明一实施例的自动提取X射线衍射图谱中特征峰信息的方法流程图;
图2揭示了根据本发明一实施例的X射线衍射图谱滤波前后局部对比图;
图3揭示了根据本发明一实施例的X射线衍射图谱标准差与平滑图谱对比图;
图4揭示了根据本发明一实施例的峰可行区域示意图;
图5揭示了根据本发明一实施例的信号基线修正前后对比图;
图6揭示了根据本发明一实施例的信号拟合效果图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释发明,并不用于限定发明。
XRD图谱中的衍射峰表现出较强的特征性和一致性,可以根据其这种性质,合理的设计出自动化提取峰的方法。
图1揭示了根据本发明一实施例的自动提取X射线衍射图谱中特征峰信息的方法流程图,如图1所示的自动提取X射线衍射(XRD)图谱峰中特征峰信息的方法,具体包括以下步骤:
S1、对X射线衍射图谱进行归一化处理和平滑操作;
S2、遍历整个X射线衍射图谱,采用滑动窗口的形式计算整个窗口的标准差,根据标准差找出其中峰可行区间;
S3、对峰可行的区间进行遍历,剔除掉不是峰的区间,并将其中相邻的峰区间进行合并;
S4、遍历每个峰信号区间进行基线修正;
S5、对修正后的峰信号进行拟合,得到峰信号的信息参数,信息参数包括峰高、峰强度以及峰宽。
下面详细对每一步进行说明。
S1、对X射线衍射图谱进行归一化处理和平滑操作。
对XRD图谱进行归一化处理,再利用高斯滤波进行平滑操作,消除掉一些小的峰的噪声干扰。
原始的XRD图谱包含很多细小的噪声,这些噪声会影响峰的提取过程,利用滤波将这些小的噪声预先去除掉。
所述步骤S1,进一步包括以下步骤:
S11、将原始XRD图谱数据进行归一化处理;
归一化处理,是本领域较为常用的处理算法,一般是指将数据的数值空间从最大到最小区间转换到0~1区间,具体操作为对于每个原始数据,减去该特征维度样本集中的最小值后,再除以转换后数据的最大值。
S12、利用高斯滤波对XRD图谱峰进行滤波操作,得到滤波后的图谱datasmooth。
S2、遍历整个X射线衍射图谱,采用滑动窗口的形式计算整个窗口的标准差,根据标准差找出其中峰可行的区间。
峰值预搜索,将峰所在的位置大致框选出来。峰可行的区间即为可能出现峰的区间。
所述步骤S2,进一步包括以下步骤:
S21、将衍射角度按序排列,从衍射低角度到高角度,对滤波后的图谱datasmooth进行遍历,采用滑动窗口的方法计算窗口内的标准差,得到新的标准差图谱datastd;
S22、寻找出新的标准差图谱datastd中的极大值点,并以给定阈值剔除掉比较小的极大值点得到极大值点对应位置索引maxstd;
S23、遍历maxstd中每一个点p,将p位置左右给定宽度的位置设为峰可行区域,然后找出datasmooth中的极大值点位置,剔除掉未落在峰可行区域的极大值点得到maxsmooth;
S24、寻找出datastd中的极小值点对应位置minstd,以及datasmooth中的极小值点对应位置minsmooth;
S25、遍历maxsmooth的每个点p(即峰位置locpeak),在minstd中找出离该极大值点最近的左右两个位置lstd,rstd(lstd为左边最近位置,rstd为右边最近位置),在minsmooth中找出离该极大值点最近的左右两个位置lsmooth,rsmooth(lsmooth为左边最近位置,rsmooth为右边最近位置);
S26、分别比较datasmooth在lstd和lsmooth,rstd和rsmooth处的值,取其中较小值的位置分别作为峰的起始locstart和结束位置locend,得到三元组peakinfo,每项三元组包含峰起始位置locstart、峰位置locpeak和峰结束位置locend三个参数信息。
S3、对峰可行区间进行遍历,剔除掉不是峰的区间,并将其中相邻的峰区间进行合并。
进行峰区间整理,将一些明显不含峰的区间剔除掉,并且相邻的峰应应看成一个整体在后面进行多峰拟合,将其合并。
更进一步的,剔除掉不是峰的区间,进一步包括以下步骤:
遍历peakinfo中的每一条,如果datasmooth[locpeak]与datasmooth[locstart]、datasmooth[locend]之差都小于给定强度阈值,则删除这条峰信息,得到新的peakinfo_new,peakinfo_new按locstart从小到大排序,datasmooth[i]为datasmooth在i处的值;
datasmooth[locpeak]为datasmooth[i]在i=locpeak处的值;
datasmooth[locstart]为datasmooth[i]在i=locstart处的值;
datasmooth[locend]为datasmooth[i]在i=locend处的值。
更进一步的,将其中相邻的峰区间进行合并,进一步包括以下步骤:
对于peakinfo_new中的每条记录peakinfo_new[i],如果peakinfo_new[i+1][locstart]与peakinfo_new[i][locend]相差不超过给定宽度,则两条记录记载的区间合并,新记录的locstart为peakinfo_new[i][locstart],新记录的locend为peakinfo_new[i+1][locend],新记录的locpeak为两条记录locpeak合在一起的列表,依次遍历所有记录,得到最终的三元组peakinfo_final,每项三元组包含峰起始位置locstart、峰位置locpeak和峰结束位置locend三项参数信息;
其中,peakinfo_new[i+1][locstart]代表第i+1条记录peakinfo_new[i+1]中的locstart值。
S4、遍历每个峰信号区间进行基线修正。
XRD图谱会出现基线漂移的现象,需要将其修正。
所述步骤S4,进一步包括以下步骤:
S41、遍历peakinfo_final中的每条记录,从datasmooth中将locstart到locend之间的数据信号截取出来得到截取信号signal;
S42、遍历每条signal,在左右两端给定宽度的位置寻找最小的强度值,包括左侧最小强度值lbkg和右侧最小强度值rbkg,取lbkg和rbkg中较小值填充成和signal长度一致的背景向量bkg;
S43、利用signal减去bkg得到signalmodify,对signalmodify进行离散积分得到p_q;
S44、利用以下公式从左到右更新bkg中的值:
bkgi=lbkg+(rbkg-lbkg)*p_qi/p_q;
其中,p_qi为从起始位置到i位置的离散积分;
S45、重复(3)-(4)5次,得到bkgfinal,最终信号signalfinal为:
signalfinal=signal-bkgfinal。
S5、对修正后的峰信号进行拟合,得到峰高、峰强度以及峰宽信息。
进行多峰拟合,利用具体的峰形函数将峰的具体参数拟合出来。
所述步骤S5,进一步包括以下步骤:
遍历signalfinal,使用给定比例的高斯、洛伦兹混合函数对信号进行多峰拟合,得到峰强a、峰位置b以及峰宽c。
所述高斯、洛伦兹混合函数公式如下:
式中,wgauss代表高斯函数的混合分量,i为在进行多峰拟合时第i个峰的拟合参数。
多峰拟合函数如下:
f(x)=f1(x)+f2(x)+f3(x)+…+fn(x);
其中,n为需要拟合的信号中的峰数量。
本发明提出的自动提取X射线衍射图谱中特征峰信息的方法,在进行XRD峰信息的提取时,首先采用步骤S1对原始图谱进行平滑,然后采用步骤S2进行峰位置的预搜索,得到一系列可能存在峰的区间,然后依据步骤S3对这些可能含有峰的区间进行整理,剔除掉不含峰的区间,并将相邻的峰合并在一个信号区间里。在经过步骤S3找出所有的峰区间后,利用步骤S4消除信号中的基线漂移造成的干扰,最后利用步骤S5进行信号的拟合,得到每个峰的三个参数(峰位置、峰强度、峰宽)。
下面通过实施例对本发明进行具体描述。有必要在此指出的是,以下实施例只用于对本发明作进一步说明,不能理解为对本发明保护范围的限制,该领域的专业技术人员根据本发明的内容做出的一些非本质的改进和调整,仍属于本发明的保护范围。
以下通过一张xrd图谱峰信息提取的实施例来说明本发明,具体步骤包括:
步骤S1、数据平滑。
将数据除以最大强度值得到最大峰强为1的标准化图谱;
利用长度为13,标准差为2的高斯滤波核在整个图谱上进行滤波得到datasmooth,滤波结果如图2所示,图2揭示了根据本发明一实施例的X射线衍射图谱滤波前后的局部对比图。
步骤S2、峰值预搜索。
采用长度为13的滑动窗口划过整个图谱,计算窗口内的标准差,得到标准图谱如图3所示,图3揭示了根据本发明一实施例的X射线衍射图谱标准差与平滑图谱对比图。
找出其中的极大值点,以0.1的阈值筛选掉一部分极大值点。将这些极大值点左右20宽度的区间设为峰可行区间,如图4所示,图4揭示了根据本发明一实施例的峰可行区域示意图。
找出datasmooth中的极大值点,剔除掉未落在峰可行区间的点。
步骤S3、峰区间整理。
剔除掉峰值和左右端值之差小于0.1的区间,并以7的宽度判别相邻区间并将相邻区间合并得到peakinfo_final。
步骤S4、基线修正。
从peakinfo_final中把signal提取出来,在信号左右两端13个长度的区间分别寻找最小值,按步骤四基线消除的公式得到消除后的信号signalfinal,如图5所示,图5揭示了根据本发明一实施例的信号基线修正前后对比图。
步骤S5、多峰拟合。
以wgauss=0.5的混合函数对峰进行拟合,得到拟合结果,拟合结果如图6所示,图6揭示了根据本发明一实施例的信号拟合效果图。
本发明提出的一种自动提取X射线衍射图谱中特征峰信息的方法,无须手动操作,可以自动化地将XRD图谱中特征峰的峰位置,峰强度以及峰宽信息提取出来,从而大大降低了手动提取峰的人力成本,提升了后续分析的效率。
尽管为使解释简单化将上述方法图示并描述为一系列动作,但是应理解并领会,这些方法不受动作的次序所限,因为根据一个或多个实施例,一些动作可按不同次序发生和/或与来自本文中图示和描述或本文中未图示和描述但本领域技术人员可以理解的其他动作并发地发生。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。
上述实施例是提供给熟悉本领域内的人员来实现或使用本发明的,熟悉本领域的人员可在不脱离本发明的发明思想的情况下,对上述实施例做出种种修改或变化,因而本发明的保护范围并不被上述实施例所限,而应该是符合权利要求书提到的创新性特征的最大范围。
Claims (4)
1.一种自动提取X射线衍射图谱中特征峰信息的方法,其特征在于,包括以下步骤:
S1、对X射线衍射图谱进行归一化处理和平滑操作;
S2、遍历整个X射线衍射图谱,采用滑动窗口的形式计算整个窗口的标准差,根据标准差找出其中峰可行区间;
S3、对峰可行区间进行遍历,剔除掉不是峰的区间,并将其中相邻的峰区间进行合并;
S4、遍历每个峰信号区间进行基线修正;
S5、对修正后的峰信号进行拟合,得到峰信号的信息参数,信息参数包括峰高、峰强度以及峰宽;
其中,所述步骤S2,进一步包括以下步骤:
S21、将衍射角度按序排列,对X射线衍射图谱datasmooth进行遍历,采用滑动窗口的方法计算窗口内的标准差,得到新的标准差图谱datastd;
S22、寻找出标准差图谱datasta中的极大值点,剔除掉小于给定阈值的极大值点,得到极大值点对应位置索引maxstd;
S23、遍历位置索引maxstd中每一个点p,将p位置的左右给定宽度的位置区域设为峰可行区域,找出X射线衍射图谱datasmooth中的极大值点位置,剔除掉未落在峰可出现区域的极大值点,得到极大值点位置索引maxsmooth;
S24、寻找出标准差图谱datasta中的极小值点,得到极小值点位置索引minstd,以及X射线衍射图谱datasmooth中的极小值点对应的位置索引minsmooth;
S25、遍历极大值点位置索引maxsmooth的每个点p,作为峰位置locpeak,在极小值点位置索引minstd中找出离该极大值点左侧最近位置lstd和右侧最近位置rstd,在minsmooth中找出离该极大值点左侧最近位置lsmooth和右侧最近位置rsmooth;
S26、分别比较X射线衍射图谱datasmooth在左侧最近位置lstd和lsmooth,右侧最近位置rstd和rsmooth处的值,取其中较小值的位置分别作为峰的起始位置locstart和结束位置locend,得到三元组peakinfo,每项三元组包含峰起始位置locstart、峰位置locpeak和峰结束位置locend;
所述步骤S3,剔除掉不是峰的区间,进一步包括以下步骤:
遍历peakinfo中的每一条,如果datasmooth[locpeak]与datasmooth[locstart]、datasmooth[locend]之差都小于给定强度阈值,则删除这条峰信息,得到新的peakinfo_new,peakinfo_new按locstart从小到大排序;
其中,datasmooth[locpeak]为datasmooth[i]在i=locpeak处的值;
datasmooth[locstart]为datasmooth[i]在i=locstart处的值;
datasmooth[locend]为datasmooth[i]在i=locend处的值;
datasmooth[i]为datasmooth在i处的值;
所述步骤S3,将其中相邻的峰区间进行合并,进一步包括以下步骤:
对于peakinfo_new中的每条记录peakinfo_new[i],如果peakinfo_new[i+1][locstart]与peakinfo_new[i][locend]相差不超过给定宽度,则两条记录记载的区间合并,新记录的locstart为peakinfo_new[i][locstart],新记录的locend为peakinfo_new[i][locend],新记录的locpeak为两条记录locpeak合在一起的列表,依次遍历所有记录,得到最终的三元组peakinfo_final,每项三元组包含峰起始位置locstart,峰位置locpeak和峰结束位置locend三项;
其中,peakinfo_bew[i+1][locstart]代表第i+1条记录peakinfo_new[i+1]中的locstart值;
所述步骤S4,进一步包括以下步骤:
S41、遍历peakinfo_final中的每条记录,从datasmooth中将]ocstart到locend之间的数据信号截取出来得到截取信号signal;
S42、遍历每条signal,在左右两端给定宽度的位置寻找最小的强度值包括左侧最小强度值lbkg和右侧最小强度值rbkg,取lbkg和rbkg中较小值填充成和signal长度一致的背景向量bkg;
S43、利用signal减去bkg得到signalmodify,对signalmodify进行离散积分得到p_q;
S44、利用以下公式从左到右更新bkg中的值:
bkgi=lbkg+(rbkg-lbkg)*p_qi/p_q;
其中,p_qi为从起始位置到i位置的离散积分;
S45、重复S43-S44设定次数得到bkgfinal,最终信号signalfinal为:
signalfinal=signal-bkgfinal;
所述步骤S5,进一步包括以下步骤:
遍历signalfinal,使用给定比例的高斯、洛伦兹混合函数对信号进行多峰拟合,得到峰强a、峰位置b以及峰宽c。
2.根据权利要求1所述的自动提取X射线衍射图谱中特征峰信息的方法,其特征在于,所述步骤S1中,采用高斯滤波对X射线衍射图谱进行平滑操作。
3.根据权利要求1所述的自动提取X射线衍射图谱中特征峰信息的方法,其特征在于,所述步骤S1,进一步包括以下步骤:
S11、将原始的X射线衍射图谱数据进行归一化处理;
S12、利用高斯滤波对X射线衍射图谱进行滤波操作,得到滤波后的X射线衍射图谱datasmooth。
4.根据权利要求1所述的自动提取X射线衍射图谱中特征峰信息的方法,其特征在于,所述高斯、洛伦兹混合函数公式如下:
式中,wgauss为高斯函数的混合分量,i为在进行多峰拟合时第i个峰的拟合参数;
多峰拟合函数如下:
f(x)=f1(x)+f2(x)+f3(x)+…+fn(x);
其中,n为需要拟合的信号中的峰数量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011501393.6A CN112711991B (zh) | 2020-12-17 | 2020-12-17 | 一种自动提取x射线衍射图谱中特征峰信息的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011501393.6A CN112711991B (zh) | 2020-12-17 | 2020-12-17 | 一种自动提取x射线衍射图谱中特征峰信息的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112711991A CN112711991A (zh) | 2021-04-27 |
CN112711991B true CN112711991B (zh) | 2024-03-15 |
Family
ID=75544468
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011501393.6A Active CN112711991B (zh) | 2020-12-17 | 2020-12-17 | 一种自动提取x射线衍射图谱中特征峰信息的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112711991B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105842596A (zh) * | 2016-05-24 | 2016-08-10 | 四川大学 | 一种高灵敏度电力电缆局部缺陷诊断方法 |
CN111398324A (zh) * | 2020-03-31 | 2020-07-10 | 深圳晶泰科技有限公司 | 一种粉末x射线衍射图谱的衍射峰定标方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9524552B2 (en) * | 2011-08-03 | 2016-12-20 | The Regents Of The University Of California | 2D/3D registration of a digital mouse atlas with X-ray projection images and optical camera photos |
CN108241845B (zh) * | 2016-12-26 | 2021-04-02 | 同方威视技术股份有限公司 | 用于扣除谱图本底的方法和通过拉曼谱图识别物质的方法 |
-
2020
- 2020-12-17 CN CN202011501393.6A patent/CN112711991B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105842596A (zh) * | 2016-05-24 | 2016-08-10 | 四川大学 | 一种高灵敏度电力电缆局部缺陷诊断方法 |
CN111398324A (zh) * | 2020-03-31 | 2020-07-10 | 深圳晶泰科技有限公司 | 一种粉末x射线衍射图谱的衍射峰定标方法 |
Non-Patent Citations (2)
Title |
---|
孙蕾 ; 罗建书 ; .高光谱遥感图像微分域三维混合去噪方法.光谱学与光谱分析.2009,(10),全文. * |
王昕 ; 何浩 ; 范贤光 ; 汤明 ; .基于匹配追踪的拉曼光谱信号重构算法.光谱学与光谱分析.2018,(01),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN112711991A (zh) | 2021-04-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10168526B2 (en) | Cell contour formation apparatus and method of the same, and non-transitory computer readable storage medium storing a cell contour formation program | |
KR20070055488A (ko) | 입력 데이터의 자동방식 배경 제거기 | |
Moore et al. | Median filtering for removal of low-frequency background drift | |
CN110243806B (zh) | 拉曼光谱下基于相似度的混合物组分识别方法 | |
Navarro et al. | ECG removal in preterm EEG combining empirical mode decomposition and adaptive filtering | |
CN104809702B (zh) | 基于频率域处理的脉诊曲线图像网格消除方法 | |
CN112711991B (zh) | 一种自动提取x射线衍射图谱中特征峰信息的方法 | |
González‐Vidal et al. | Automatic morphology‐based cubic p‐spline fitting methodology for smoothing and baseline‐removal of Raman spectra | |
CN110503060B (zh) | 一种光谱信号去噪方法及其系统 | |
WO2008116589A1 (de) | Verfahren und vorrichtung zur ermittlung einer zellkontur einer zelle | |
DE112019003587T5 (de) | Lernvorrichtung, Betriebsprogramm von Lernvorrichtung und Betriebsverfahren von Lernvorrichtung | |
CN113592782B (zh) | 一种复合材料碳纤维芯棒x射线图像缺陷提取方法及系统 | |
CN110763913A (zh) | 一种基于信号分段分类的导数谱平滑处理方法 | |
EP2400458A2 (de) | Verfahren und Vorrichtung zur Segmentierung von biologischen Zellen in einer Aufnahme | |
Ko | Fingerprint enhancement by spectral analysis techniques | |
CN110991463A (zh) | 一种超像素图引导下的多尺度引导滤波特征提取方法 | |
US20100161238A1 (en) | Method and System for Detecting Peptide Peaks in HPLC-MS Signals | |
US20230169637A1 (en) | Method for grain size analysis | |
CN115508335A (zh) | 基于傅里叶变换的拉曼光谱曲线数据增强方法 | |
Lukac et al. | cDNA microarray image segmentation using root signals | |
Awang et al. | Performance Evaluation between RGB and YCrCb in TC-SF-CNNLS for Vehicle Type Recognition System | |
KR102096532B1 (ko) | 소나영상의 객체 인식을 위한 커브렛 변환 기반의 윤곽선 향상 방법 및 장치 | |
AU2018304166B2 (en) | Spectral response synthesis on trace data | |
Zeiler et al. | Brain status data analysis by sliding EMD | |
CN108498092B (zh) | 基于脑电特征的错误预警方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |