CN116202980A - 基于红外光谱和去峰匹配的混合物质识别方法及装置 - Google Patents
基于红外光谱和去峰匹配的混合物质识别方法及装置 Download PDFInfo
- Publication number
- CN116202980A CN116202980A CN202310086867.2A CN202310086867A CN116202980A CN 116202980 A CN116202980 A CN 116202980A CN 202310086867 A CN202310086867 A CN 202310086867A CN 116202980 A CN116202980 A CN 116202980A
- Authority
- CN
- China
- Prior art keywords
- peak
- sample
- matching
- detected
- substance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000126 substance Substances 0.000 title claims abstract description 368
- 238000000034 method Methods 0.000 title claims abstract description 92
- 238000002329 infrared spectrum Methods 0.000 title claims abstract description 77
- 238000012545 processing Methods 0.000 claims description 40
- 238000001914 filtration Methods 0.000 claims description 36
- 230000008569 process Effects 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 13
- 230000003595 spectral effect Effects 0.000 claims description 13
- 238000007781 pre-processing Methods 0.000 claims description 12
- 238000001228 spectrum Methods 0.000 claims description 11
- 230000009466 transformation Effects 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 8
- 238000004566 IR spectroscopy Methods 0.000 claims description 7
- 239000000523 sample Substances 0.000 description 342
- 239000011159 matrix material Substances 0.000 description 19
- 230000008030 elimination Effects 0.000 description 14
- 238000003379 elimination reaction Methods 0.000 description 14
- 239000000463 material Substances 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000001514 detection method Methods 0.000 description 10
- 238000009826 distribution Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 8
- 239000000203 mixture Substances 0.000 description 8
- 239000013598 vector Substances 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 238000010521 absorption reaction Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 125000000524 functional group Chemical group 0.000 description 4
- 238000007689 inspection Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- KWKAKUADMBZCLK-UHFFFAOYSA-N 1-octene Chemical compound CCCCCCC=C KWKAKUADMBZCLK-UHFFFAOYSA-N 0.000 description 2
- 238000000862 absorption spectrum Methods 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000000059 patterning Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
Landscapes
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明提供一种基于红外光谱和去峰匹配的混合物质识别方法及装置,该方法包括:根据待测混合物质的待测红外光谱图构建待测特征峰集合,根据多个样本物质的样本红外光谱图构建样本特征峰集合;对待测特征峰集合中的待测特征峰和样本特征峰集合中的样本特征峰迭代进行去峰匹配,以对每次去峰匹配对应的待测特征峰集合和样本特征峰集合中的特征峰进行相似性匹配,以及将每次去峰匹配到的相似性最大的待测特征峰从待测特征峰集合中删除,以及相似性最大的样本特征峰对应的样本物质的所有样本特征峰从样本特征峰集合中删除,得到与待测混合物质匹配的样本物质集合,进而自动识别出待测混合物质的成分结果。本发明实现自动精准地进行混合物质识别。
Description
技术领域
本发明涉及材料检测技术领域,尤其涉及一种基于红外光谱和去峰匹配的混合物质识别方法及装置。
背景技术
物质检验检测是指检验检测机构接受监管机构、生产商或产品用户的委托,通过专业技术手段及仪器设备在相应标准及技术规范等条件下对鉴定的样品质量、安全、性能、环保等方面指标进行检验检测并出具检验检测报告,从而评定是否符合监管机构、行业和用户在质量、安全、性能等方面的标准和要求。因此,如何对物质进行精准识别是保证产品安全和性能的重要环节。
现有技术中,通常依赖于工程师的人工经验进行物质识别。而混合物质的成分复杂,需要人工在多个检测设备间来回切换以一一识别出混合物质中的每一物质成分,识别效率低,需要消耗大量的人力物力;且识别结果受人工经验影响大,导致识别误差大。
发明内容
本发明提供一种基于红外光谱和去峰匹配的混合物质识别方法及装置,用以解决现有技术中依赖人工经验进行物质识别,识别效率低、需要消耗大量的人力物力、识别误差大的缺陷,实现自动精准地进行混合物质识别。
本发明提供一种基于红外光谱和去峰匹配的混合物质识别方法,包括:
获取待测混合物质的待测红外光谱图和多个样本物质的样本红外光谱图;
根据所述待测混合物质的待测红外光谱图,获取待测特征峰集合,根据所述多个样本物质的样本红外光谱图,获取样本特征峰集合;
对所述待测特征峰集合中的待测特征峰和所述样本特征峰集合中的样本特征峰迭代进行去峰匹配;
根据去峰匹配结果,获取与所述待测混合物质匹配的样本物质集合,根据与所述待测混合物质匹配的样本物质集合的成分,获取所述待测混合物质的成分识别结果;
其中,所述去峰匹配包括匹配操作和去峰操作;所述匹配操作用于对每次去峰匹配对应的所述待测特征峰集合中的待测特征峰和每次去峰匹配对应的所述样本特征峰集合中的样本特征峰进行相似性匹配;所述去峰操作用于将每次去峰匹配到的相似性最大的待测特征峰从每次去峰匹配对应的所述待测特征峰集合中删除,得到下一次去峰匹配对应的所述待测特征峰集合,并将每次去峰匹配到的相似性最大的样本特征峰对应的样本物质的所有样本特征峰从每次去峰匹配对应的所述样本特征峰集合中删除,得到所述下一次去峰匹配对应的所述样本特征峰集合。
根据本发明提供的一种基于红外光谱和去峰匹配的混合物质识别方法,所述对所述待测特征峰集合中的待测特征峰和所述样本特征峰集合中的样本特征峰迭代进行去峰匹配,包括:
对于当前次去峰匹配,将所述当前次去峰匹配对应的所述待测特征峰集合中的每一待测特征峰与所述当前次去峰匹配对应的所述样本特征峰集合中的每一样本特征峰进行相似性匹配;
将匹配到的相似性最大的样本特征峰所属的样本物质作为所述当前次去峰匹配中与所述待测混合物质匹配的样本物质;
将所述当前次去峰匹配中与所述待测混合物质匹配的样本物质的样本红外光谱图与上一次去峰匹配对应的组合光谱图进行叠加,得到所述当前次去峰匹配对应的组合光谱图;
计算所述当前次去峰匹配对应的组合光谱图与所述待测红外光谱图之间的相似性,得到所述当前次去峰匹配对应的谱图相似性;
在所述当前次去峰匹配对应的谱图相似性大于所述上一次去峰匹配对应的谱图相似性的情况下,将匹配到的相似性最大的待测特征峰从所述当前次去峰匹配对应的所述待测特征峰集合中删除,得到下一次去峰匹配对应的所述待测特征峰集合;
将匹配到的相似性最大的样本特征峰从所述当前次去峰匹配对应的所述样本特征峰集合中删除,得到所述下一次去峰匹配对应的所述样本特征峰集合;
将所述下一次去峰匹配对应的所述待测特征峰集合中的每一待测特征峰与所述下一次去峰匹配对应的所述样本特征峰集合中的每一样本特征峰进行相似性匹配,迭代执行去峰匹配步骤,直到满足去峰匹配终止条件。
根据本发明提供的一种基于红外光谱和去峰匹配的混合物质识别方法,所述将所述当前次去峰匹配对应的所述待测特征峰集合中的每一待测特征峰与所述当前次去峰匹配对应的所述样本特征峰集合中的每一样本特征峰进行相似性匹配,包括:
基于杰卡德系数,对所述当前次去峰匹配对应的所述待测特征峰集合中的每一待测特征峰与所述当前次去峰匹配对应的所述样本特征峰集合中的每一样本特征峰进行相似性匹配。
根据本发明提供的一种基于红外光谱和去峰匹配的混合物质识别方法,所述将所述当前次去峰匹配中与所述待测混合物质匹配的样本物质的样本红外光谱图与上一次去峰匹配对应的组合光谱图进行叠加,得到所述当前次去峰匹配对应的组合光谱图,包括:
对所述当前次去峰匹配中与所述待测混合物质匹配的样本物质的样本红外光谱图以及所述上一次去峰匹配对应的组合光谱图进行线性插值处理,以使线性插值处理后的样本红外光谱图的数据格式与线性插值处理后的组合光谱图的数据格式一致;
将所述线性插值处理后的样本红外光谱图与所述线性插值处理后的组合光谱图进行线性叠加,得到所述当前次去峰匹配对应的组合光谱图。
根据本发明提供的一种基于红外光谱和去峰匹配的混合物质识别方法,所述根据去峰匹配结果,获取与所述待测混合物质匹配的样本物质集合,包括:
根据所述去峰匹配结果,获取每次去峰匹配中与所述待测混合物质匹配的样本物质;
对所有次去峰匹配中与所述待测混合物质匹配的样本物质进行汇总,得到与所述待测混合物质匹配的样本物质集合。
根据本发明提供的一种基于红外光谱和去峰匹配的混合物质识别方法,所述获取待测混合物质的待测红外光谱图和多个样本物质的样本红外光谱图,包括:
基于红外光谱仪,采集所述待测混合物质的原始待测红外光谱图;
对所述原始待测红外光谱图和数据库中的原始样本红外光谱图进行预处理;
将预处理后的原始待测红外光谱图作为所述待测红外光谱图;
从所述数据库中预处理后的原始样本红外光谱图中,抽取出每一样本物质的样本红外光谱图;
其中,所述预处理包括滤波处理和标准状态变换处理;
所述滤波处理包括低通滤波处理和基于最小二乘的卷积拟合滤波处理。
根据本发明提供的一种基于红外光谱和去峰匹配的混合物质识别方法,所述从所述数据库中预处理后的原始样本红外光谱图中,抽取出每一样本物质的样本红外光谱图,包括:
对所述数据库中预处理后的原始样本红外光谱图进行谱聚类;
根据聚类结果,确定每一样本物质的所有预处理后的原始样本红外光谱图;
分别从每一样本物质的所有预处理后的原始样本红外光谱图中随机抽取一个预处理后的原始样本红外光谱图,作为每一样本物质的样本红外光谱图。
本发明还提供一种基于红外光谱和去峰匹配的混合物质识别装置,包括:
数据采集模块,用于获取待测混合物质的待测红外光谱图和多个样本物质的样本红外光谱图;
数据处理模块,用于根据所述待测混合物质的待测红外光谱图,获取待测特征峰集合,根据所述多个样本物质的样本红外光谱图,获取样本特征峰集合;
物质匹配模块,用于对所述待测特征峰集合中的待测特征峰和所述样本特征峰集合中的样本特征峰迭代进行去峰匹配;
物质识别模块,用于根据去峰匹配结果,获取与所述待测混合物质匹配的样本物质集合,根据与所述待测混合物质匹配的样本物质集合的成分,获取所述待测混合物质的成分识别结果;
其中,所述去峰匹配包括匹配操作和去峰操作;所述匹配操作用于对每次去峰匹配对应的所述待测特征峰集合中的待测特征峰和每次去峰匹配对应的所述样本特征峰集合中的样本特征峰进行相似性匹配;所述去峰操作用于将每次去峰匹配到的相似性最大的待测特征峰从每次去峰匹配对应的所述待测特征峰集合中删除,得到下一次去峰匹配对应的所述待测特征峰集合,并将每次去峰匹配到的相似性最大的样本特征峰对应的样本物质的所有样本特征峰从每次去峰匹配对应的所述样本特征峰集合中删除,得到所述下一次去峰匹配对应的所述样本特征峰集合。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述基于红外光谱和去峰匹配的混合物质识别方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述基于红外光谱和去峰匹配的混合物质识别方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述基于红外光谱和去峰匹配的混合物质识别方法。
本发明提供的基于红外光谱和去峰匹配的混合物质识别方法及装置,通过采集待测混合物质的待测红外光谱图和多个样本物质的样本红外光谱图,并对待测混合物质的待测红外光谱图的特征峰以及多个样本物质的样本红外光谱图的样本特征峰迭代进行去峰匹配,以根据去峰匹配结果自动精准地识别出待测混合物质的成分,有效提高物质识别效率,有效解决现有技术中依赖人工经验进行物质识别,存在的识别效率低、需要消耗大量的人力物力、识别误差大的问题。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的基于红外光谱和去峰匹配的混合物质识别方法的流程示意图;
图2是本发明提供的辛烯的红外吸收图谱的分布示意图;
图3是本发明提供的合成样本的红外光谱与待测混合物质的红外光谱图的对比结果的分布示意图;
图4是本发明提供的线性插值处理结果的分布示意图;
图5是本发明提供的原始样本红外光谱图的分布示意图;
图6是本发明提供的Savitzky Golay滤波处理结果的分布示意图;
图7是本发明提供的低通滤波处理结果的分布示意图;
图8是本发明提供的预处理后的原始样本红外光谱图的分布示意图;
图9是本发明提供的谱聚类结果的分布示意图;
图10是本发明提供的基于红外光谱和去峰匹配的混合物质识别装置的结构示意图;
图11是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
通常,检验检测对技术要求较高,涉及化学、物理、材料、电子、生物学、食品科学等多学科的融合运用。
现有技术中,混合物质识别主要靠工程师的人工经验进行识别,而工程师需经过长达6个月的专业知识培训,然后进行培训考核测试,通过考核后还需要进行长期的训练方可上岗,人员培训周期较长,需要耗费大量的人力,物力。其次,在实际操作中,软件只能实现单一成分的辨识的结果参考。因此,对于混合物质,需要人工进行反复操作以及根据经验的手动确认和调整选择;并且在物质成分差距比较大的情况下,还需要用到多种检测设备,但是不同设备间的数据和软件是不互通的,需要人工在多个系统间来回切换,导致工程师需要花费大量的时间进行图片截取和报告撰写,检测效率不能得到有效提升的同时还易出错。
因此,传统的人工经验进行混合物质识别,不仅识别精度低,效率低下,且需要浪费工程师大量时间。
针对上述问题,本实施例提供一种基于红外光谱和去峰匹配的混合物质识别方法,该方法通过将待测混合物质的待测红外光谱图和多个样本物质的样本红外光谱图迭代进行去峰匹配,以自动精准地识别出组成待测混合物质的原样成分,仅需一个服务器即可实现混合物质的每一原样成分识别,有效解决人工经验进行混合物质识别带来的各种系统之间数据不互通以及识别精度低的问题,提高混合物质识别的可信度,同时还可以自动生成报告,节省大量的人力物力和识别时间,提升识别效率。
下面结合图1-图9描述本发明的基于红外光谱和去峰匹配的混合物质识别方法。该方法的执行主体可以是配置有混合物质识别的电子设备,该电子设备内部建立了一套完整的谱图识别流程,可以实现未知混合物的成分识别的功能。该电子设备可以是终端,如手机、电脑等,也可以是服务器,如边缘服务器或云端服务器等,本实施例对此不做具体地限定。
如图1所示,为本实施例提供的基于红外光谱和去峰匹配的混合物质识别方法的流程示意图之一,该方法包括如下步骤:
步骤101,获取待测混合物质的待测红外光谱图和多个样本物质的样本红外光谱图;
其中,待测混合物质可以是化学、材料、电子、生物和食品等领域的需要进行成分识别的物质,该物质混合有多种不同种物质。
样本物质为预先存储在数据库中标记有成分类别的物质,该样本物质可以是单一物质。
可选地,由于在有机物分子中,组成化学键或官能团的原子处于不断振动的状态,其振动频率与红外光的振动频率相当。因此,采用红外光照射有机物分子时,分子中的化学键或官能团可发生振动吸收,不同的化学键或官能团吸收频率不同,在红外光谱上将处于不同位置,从而可获得分子中含有何种化学键或官能团的信息。因此,对物质进行红外光谱图进行分析,可准确识别出物质的成分。
可选地,在需要对待测混合物质进行成分识别的情况下,采用红外光谱仪对待测混合物质进行红外光谱图采集,可以直接将采集到的红外光谱图直接作为待测混合物质的待测红外光谱图;或者,对采集到的红外光谱图进行滤波处理和/或状态变换等预处理操作之后,再根据预处理结果获取待测混合物质的待测红外光谱图,以提高实现数据前期的清洗工作,以提升后期的识别效率与匹配精度,本实施例对此不做具体地限定。
同理,直接从数据库中随机抽取出多个样本物质的至少一张初始样本红外光谱图作为多个样本物质的样本红外光谱图;或者对从数据库中随机抽取出多个样本物质的初始样本红外光谱图进行预处理之后,再根据预处理结果获取多个样本物质的样本红外光谱图,本实施例对此不做具体地限定。
步骤102,根据所述待测混合物质的待测红外光谱图,获取待测特征峰集合,根据所述多个样本物质的样本红外光谱图,获取样本特征峰集合;
其中,特征峰或特征频率是指用于鉴别化学键或基团存在的吸收峰。化合物的红外光谱是其分子结构的客观反映,谱图中的吸收峰对应于分子中某化学键或基团的振动形式,同一基团的振动频率总是出现在一定区域。
可选地,在获取到待测混合物质的待测红外光谱图以及多个样本物质的样本红外光谱图的情况下,可以对待测混合物质的待测红外光谱图进行特征峰提取,以将提取的特征峰构建形成待测特征峰集合;
并且对多个样本物质的样本红外光谱图进行特征峰提取,以将提取的特征峰构建形成样本特征峰集合。
步骤103对所述待测特征峰集合中的待测特征峰和所述样本特征峰集合中的样本特征峰迭代进行去峰匹配;其中,所述去峰匹配包括匹配操作和去峰操作;所述匹配操作用于对每次去峰匹配对应的所述待测特征峰集合中的待测特征峰和每次去峰匹配对应的所述样本特征峰集合中的样本特征峰进行相似性匹配;所述去峰操作用于将每次去峰匹配到的相似性最大的待测特征峰从每次去峰匹配对应的所述待测特征峰集合中删除,得到下一次去峰匹配对应的所述待测特征峰集合,并将每次去峰匹配到的相似性最大的样本特征峰对应的样本物质的所有样本特征峰从每次去峰匹配对应的所述样本特征峰集合中删除,得到所述下一次去峰匹配对应的所述样本特征峰集合;
由于不同外光谱图的特征峰不同,那么组成混合物的基础样的特征峰均会体现在待测混合物质的待测红外光谱图中。因此,利用同峰原理,可以迭代进行去峰匹配工作,以基于特征峰的识别找到与待测混合物质相似性较高的原样(即样本物质),进而精准识别出待测混合物质的合成成分。
示例性地,如图2所示,为辛烯的红外吸收图谱,其包含四个特征峰分别为3080波数所在的区间的特征峰、1640波数所在区间的特征峰、995波数所在区间的特征峰及915波数所在区间的特征峰,均是辛烯的特征峰。因此,不同物质有不同特征峰,但原样的特征峰在混合物中都会有体现,以此种规律可以通过去峰匹配的方法找到组成混合物的原样成分。
可选地,在获取待测特征峰集合以及样本特征峰集合的情况下,需要对对待测特征峰集合中的待测特征峰和样本特征峰集合中的样本特征峰迭代进行去峰匹配,以利用不同红外光谱图中的特征峰之间的关联性,不断进行去峰匹配操作,以准确找出组成待测样的原样。
可选地,对待测特征峰集合中的待测特征峰和样本特征峰集合中的样本特征峰迭代进行去峰匹配,以采用匹配操作,将每次去峰匹配对应的待测特征峰集合中的待测特征峰和每次去峰匹配对应的样本特征峰集合中的样本特征峰进行相似性匹配,获取每次去峰匹配中每次去峰匹配到的相似性最大的样本特征峰对应的样本物质,作为每次去峰匹配中与待测混合物质匹配的样本物质;并采用去峰操作,将每次去峰匹配到的相似性最大的待测特征峰从每次去峰匹配对应的所述待测特征峰集合中删除,更新待测特征峰集合,并将每次去峰匹配到的相似性最大的样本特征峰对应的样本物质的所有样本特征峰从每次去峰匹配对应的所述样本特征峰集合中删除,更新样本特征峰集合,并根据更新的样本特征峰集合和更新的待测特征峰集合,迭代进行去峰匹配,直到满足去峰匹配终止条件,即可获取到所有与待测混合物质匹配的样本物质组成的集合。
步骤104,根据去峰匹配结果,获取与所述待测混合物质匹配的样本物质集合,根据与所述待测混合物质匹配的样本物质集合的成分,获取所述待测混合物质的成分识别结果;
可选地,每一次去峰匹配结果中包含有每次去峰匹配中与待测混合物质匹配的样本物质,根据所有去峰匹配中与待测混合物质匹配的样本物质,即可构建待测混合物质匹配的样本物质集合,即组成待测混合物质的原样。
由于样本物质集合中每一样本物质的物质成分已知。因此,可以对样本物质集合每一样本物质的成分进行汇总,即可得到待测混合物质的成分识别结果。
本实施例提供的基于红外光谱和去峰匹配的混合物质识别方法,通过采集待测混合物质的待测红外光谱图和多个样本物质的样本红外光谱图,并对待测混合物质的待测红外光谱图的特征峰以及多个样本物质的样本红外光谱图的样本特征峰迭代进行去峰匹配,以根据去峰匹配结果自动精准地识别出待测混合物质的成分,有效提高物质识别效率,有效解决现有技术中依赖人工经验进行物质识别,存在的识别效率低、需要消耗大量的人力物力、识别误差大的问题。
在一些实施例中,步骤102中所述对所述待测特征峰集合中的待测特征峰和所述样本特征峰集合中的样本特征峰迭代进行去峰匹配,包括:
对于当前次去峰匹配,将所述当前次去峰匹配对应的所述待测特征峰集合中的每一待测特征峰与所述当前次去峰匹配对应的所述样本特征峰集合中的每一样本特征峰进行相似性匹配;
将匹配到的相似性最大的样本特征峰所属的样本物质作为所述当前次去峰匹配中与所述待测混合物质匹配的样本物质;
将所述当前次去峰匹配中与所述待测混合物质匹配的样本物质的样本红外光谱图与上一次去峰匹配对应的组合光谱图进行叠加,得到所述当前次去峰匹配对应的组合光谱图;
计算所述当前次去峰匹配对应的组合光谱图与所述待测红外光谱图之间的相似性,得到所述当前次去峰匹配对应的谱图相似性;
在所述当前次去峰匹配对应的谱图相似性大于所述上一次去峰匹配对应的谱图相似性的情况下,将匹配到的相似性最大的待测特征峰从所述当前次去峰匹配对应的所述待测特征峰集合中删除,得到下一次去峰匹配对应的所述待测特征峰集合;
将匹配到的相似性最大的样本特征峰从所述当前次去峰匹配对应的所述样本特征峰集合中删除,得到所述下一次去峰匹配对应的所述样本特征峰集合;
将所述下一次去峰匹配对应的所述待测特征峰集合中的每一待测特征峰与所述下一次去峰匹配对应的所述样本特征峰集合中的每一样本特征峰进行相似性匹配,迭代执行去峰匹配步骤,直到满足去峰匹配终止条件。
其中,去峰匹配终止条件包括当前次去峰匹配对应的谱图相似性小于或等于上一次去峰匹配对应的谱图相似性的条件。
可选地,步骤102中迭代进行去峰匹配的操作包括:
对于当前次去峰匹配,根据各特征峰的分布特征,计算当前次去峰匹配对应的待测特征峰集合中的每一待测特征峰与当前次去峰匹配对应的样本特征峰集合中的每一样本特征峰之间的相似性;其中,分布特征包括但不限于变化趋势以及位置信息,本实施例对此不做具体地限定。
在获取到当前次去峰匹配对应的每一待测特征峰与每一样本特征峰之间的相似度之后,对其进行排序,获取当前次匹配到的相似性最大的样本特征峰和待测特征峰。
将当前次匹配到的相似性最大的样本所属的样本物质作为当前次去峰匹配中与所述待测混合物质匹配的样本物质,即待测混合物质的原样。
然后,将当前次去峰匹配中与待测混合物质匹配的样本物质的样本红外光谱图与上一次去峰匹配对应的组合光谱图(即当前次去峰匹配之前的所有历史去峰匹配中与待测混合物质匹配的样本物质的样本红外光谱图叠加的光谱图)进行叠加,得到当前次去峰匹配对应的组合光谱图。
在当前次去峰匹配对应的组合光谱图与待测红外光谱图之间的相似性与上一次次去峰匹配对应的组合光谱图与待测红外光谱图之间的相似性相比,不再升高,甚至呈下降趋势的情况下,表征已满足去峰匹配终止条件,停止去峰匹配操作。
在当前次去峰匹配对应的组合光谱图与待测红外光谱图之间的相似性与上一次去峰匹配对应的组合光谱图与待测红外光谱图之间的相似性相比,继续升高的情况下,表征不满足去峰匹配终止条件,需要继续迭代执行去峰匹配。此时,需要对当前次去峰匹配对应的所述待测特征峰集合以及当前次去峰匹配对应的所述样本特征峰集合进行去峰操作,即匹配到的相似性最大的样本特征峰从当前次去峰匹配对应的所述样本特征峰集合中删除,以及将匹配到的相似性最大的待测特征峰从当前次去峰匹配对应的所述待测特征峰集合中删除,分别更新得到下一次去峰匹配对应的所述样本特征峰集合,以及下一次去峰匹配对应的所述待测特征峰集合。
并根据下一次去峰匹配对应的所述待测特征峰集合和下一次去峰匹配对应的所述样本特征峰集合继续迭代进行去峰匹配,直到得到的组合光谱图与待测红外光谱图之间的相似性不再升高,则停止去峰匹配,根据去峰匹配结果,识别出待测混合物质的成分。
在所有的去峰匹配完成后,还可以合成通过去峰匹配中的与待测混合物质匹配的样本物质集合的样本红外光谱图,得到待测混合物质的合成样的合成红外光谱图。如图3所示,待测混合物质的合成样的合成红外光谱图的特征峰位置以及特征峰变化趋势,与待测混合物质的待测红外光谱图(即分析样)的特征峰位置以及特征峰变化趋势基本保持一致,且经过多次验证,识别准确率能达到90%以上。
在一些实施例中,所述将所述当前次去峰匹配对应的所述待测特征峰集合中的每一待测特征峰与所述当前次去峰匹配对应的所述样本特征峰集合中的每一样本特征峰进行相似性匹配,包括:
基于杰卡德系数,对所述当前次去峰匹配对应的所述待测特征峰集合中的每一待测特征峰与所述当前次去峰匹配对应的所述样本特征峰集合中的每一样本特征峰进行相似性匹配。
其中,杰卡德系数又称为杰卡德相似系数,其为衡量不同特征峰之间的相似性程度的度量指标。
杰卡德系数用于比较两个特征峰之间的差异性和相似性。杰卡德系数越高,则两个特征峰相似度越高。杰卡德系数的计算公式为:
其中,J(A,B)为待测特征峰A与样本特征峰B之间的杰卡德系数值;|A∩B|为待测特征峰A与样本特征峰B中相同峰值的波数交集;|A∪B|为待测特征峰A与样本特征峰B中所有峰值的波数并集。|A|和|B|分别为待测特征峰A中峰值的波数和样本特征峰B中峰值的波数。需要说明的是,当A,B均空时,J(A,B)=1。
可选地,基于杰卡德系数,计算当前次去峰匹配对应的待测特征峰集合中的每一待测特征峰与当前次去峰匹配对应的所述样本特征峰集合中的每一样本特征峰之间的相似性,根据相似性,精准地进行待测特征峰与样本特征峰之间的匹配,进而实现高效精准进行混合物质识别。
在一些实施例中,所述将所述当前次去峰匹配中与所述待测混合物质匹配的样本物质的样本红外光谱图与上一次去峰匹配对应的组合光谱图进行叠加,得到所述当前次去峰匹配对应的组合光谱图,包括:
对所述当前次去峰匹配中与所述待测混合物质匹配的样本物质的样本红外光谱图以及所述上一次去峰匹配对应的组合光谱图进行线性插值处理,以使线性插值处理后的样本红外光谱图的数据格式与线性插值处理后的组合光谱图的数据格式一致;
将所述线性插值处理后的样本红外光谱图与所述线性插值处理后的组合光谱图进行线性叠加,得到所述当前次去峰匹配对应的组合光谱图。
可选地,由于用于采集不同样本物质的样本红外光谱图的红外光谱仪不同。而不同红外光谱仪的采集策略不同,导致不同样本物质的样本红外光谱图的数据长度不一,因此在对样本红外光谱图进行叠加时,会出现叠加结果不精准,甚至无法叠加的情况,严重制约物质识别进程。
为了解决此问题,本实施例通过线性插值,对当前次去峰匹配中与待测混合物质匹配的样本物质的样本红外光谱图以及上一次去峰匹配对应的组合光谱图进行降采样或过采样,以使线性插值处理后的样本红外光谱图的数据格式与线性插值处理后的组合光谱图的数据格式统一,即数据长度一致,解决数据叠加格式不一致问题。
其中,插值,是根据已知的数据序列(即样本红外光谱图中每一时间窗口内的红外光谱信号组成的数据序列),确定数据序列的变化规律,然后根据数据序列的变化规律,对其中尚未有数据记录的点进行数值估计。主要应用于对数据的缺失进行合理的补偿,以及对数据进行放大和缩小的场景。
实例性地,若样本红外光谱图中某一时间窗口内的红外光谱信号组成的数据序列中的部分红外光谱信号的数值已知,即其坐标(x0,y0)和(x1,y1)已知,而部分红外光谱信号的数值缺失,即其坐标(x,y)未知,具体如图4所示。其中,x为红外光谱信号所在的采样时间点,y为红外光谱信号对应的数值;此时,需要根据线性插值对(x,y)进行数值估计,以实现对缺失数据的合理补偿,进而统一所需叠加的样本红外光谱图的数据格式。
其中,基于线性插值对数值缺失的红外光谱信号的坐标(x,y)进行估计的计算公式为:
由于x为采样时刻,其数值已知。因此,通过对上述公式进行求解,即可获取红外光谱信号对应的数值,即y的值。
其中,线性插值是针对一维数据的插值方法。它根据一维数据序列中需要插值的点(即数值缺失的红外光谱信号)的左右临近两个数据(即数值已知的红外光谱信号)来进行数值估计,具体根据左右临近两个数据点的距离确定比重系数,进而根据比重系数对左右临近两个数据点进行加权相加,得到数值缺失的红外光谱信号的数值,以使线性插值处理后的各样本红外光谱图的数据格式统一,即数据长度一致,解决数据叠加格式不一致问题。
然后,将线性插值处理后的样本红外光谱图与线性插值处理后的上一次去峰匹配对应组合光谱图进行线性叠加,即可精准地得到当前次去峰匹配对应的组合光谱图,以高效精准地实现混合物质识别。
在一些实施例中,步骤104中所述根据去峰匹配结果,获取与所述待测混合物质匹配的样本物质集合的步骤进一步包括:
根据所述去峰匹配结果,获取每次去峰匹配中与所述待测混合物质匹配的样本物质;
对所有次去峰匹配中与所述待测混合物质匹配的样本物质进行汇总,得到与所述待测混合物质匹配的样本物质集合。
可选地,在每次去峰匹配的过程中均会获取到每次去峰匹配中与待测混合物质匹配的样本物质,该样本物质即为组成待测混合物质的原样。
因此,可将所有去峰匹配的过程中获取到的与待测混合物质匹配的样本物质进行汇总,以得到与待测混合物质匹配的样本物质集合,即待测混合物质的合成样;根据样本物质集合对应的物质成分,即可精准地获取到待测混合物质的物质成分。
在一些实施例中,步骤101中所述获取待测混合物质的待测红外光谱图和多个样本物质的样本红外光谱图的步骤进一步包括:
基于红外光谱仪,采集所述待测混合物质的原始待测红外光谱图;
对所述原始待测红外光谱图和数据库中的原始样本红外光谱图进行预处理;
将预处理后的原始待测红外光谱图作为所述待测红外光谱图;
从所述数据库中预处理后的原始样本红外光谱图中,抽取出每一样本物质的样本红外光谱图;
其中,所述预处理包括滤波处理和标准状态变换处理;
所述滤波处理包括低通滤波处理和基于最小二乘的卷积拟合滤波处理。
其中,红外光谱仪可以是安装在电子设备上,也可以是外置于电子设备,且与电子设备通信,本实施例对红外光谱仪的设置位置不做具体地限定。
数据库中的样本物质的原始样本红外光谱图是由红外光谱仪采集,并预先标注成分类别后存储的;
可选地,红外光谱仪以预设采样频率,对待测混合物质进行红外光谱图采集,以得到原始待测红外光谱图;并从数据库中获取原始样本红外光谱图。
由于,红外光谱仪采集的原始红外光谱图(即原始待测红外光谱图和原始样本红外光谱图)因环境,设备等原因产生的噪声,基线偏移等问题,会对后续进行的物质匹配识别检测的精度和效率造成重大影响,因此,在对物质进行匹配识别的前期,需要采用滤波器进行数据预处理实现光谱的去噪,以及标准状态变换来消除基线偏移影响,进而对后期物质识别的效率和精度有较大的提升。
可选地,为了消除噪声对物质识别的影响,可采用滤波处理,对原始待测红外光谱图和原始样本红外光谱图进行预处理,以消除原始待测红外光谱图和原始样本红外光谱图中的噪声。
滤波处理包括但不限于低通滤波处理滤波器的低通滤波处理和基于最小二乘的卷积拟合滤波滤波器(简称Savitzky-Golay滤波器)的基于局域多项式最小二乘法拟合的滤波处理。
如图5所示,原始红外光谱图中会存在很多噪声,干扰去峰匹配效果。因此使用Savitzky-Golay滤波器来解决噪声干扰问题,它被广泛地运用于数据流平滑除噪,是一种在时域内基于局域多项式最小二乘法拟合的滤波方法。这种滤波器最大的特点在于在滤除噪声的同时可以确保信号的形状和宽度不变。
如图6所示,Savitzky-Golay滤波器是一种数字滤波器,可以应用于一组数据,以平滑数据,能够在不改变信号趋势、宽度的情况下提高数据的精度。其通过卷积的过程实现,即通过线性最小二乘法将相邻数据点的连续子集与一个低次多项式拟合。
其中,针对原始红外光谱图中每一时间窗口内的目标红外光谱信号,Savitzky-Golay滤波处理的公式为:
其中,Xk,smooth为时间窗口内,滤波处理后的第k个目标红外光谱信号;[xk-w,…,xk+w]为时间窗口内的所有目标红外光谱信号;hi/H为平滑系数,由最小二乘法拟合多项式求得。
Savitzky-Golay滤波器的优点是,在同一段曲线上,任意位置可以任意选取不同的窗宽,满足不同平滑滤波的需要;尤其是处理时序数据时,对于不同阶段的序列处理优势明显。处理非周期和非线性来源的噪音样本效果也很好。
其中,低通滤波处理就是减弱或者阻隔高频信号,保留低频信号;在光谱分析中部分复杂样本同时采用了低通滤波进行去噪,作为常用的滤波器形式,低通滤波是一种适中的滤波处理方式,如图7所示,使用一阶低通滤波器后的信号波形明显比使用一阶低通滤波器前的信号波形具有更强的变化趋势,可实现有效降噪。相较于卡尔曼滤波算法和滑动平均滤波而言。其计算量适中,同时能拿到一个较为合适的结果。低通滤波算法可以解决这种长期可靠,短期噪声大的传感器,并有效地实现噪声的滤除。
其中,低通滤波处理的计算公式如下:
其中,D0表示通带半径,u和v分别为原始红外光谱图的频率和该频率信号的幅度(振幅),D(u,v)是原始红外光谱图到频谱中心的距离,计算公式如下:
其中,M和N表示频谱图像的横纵坐标,(M/2,N/2)为频谱中心。
并且由于采样设备不同与环境等因素的影响造成的光谱偏移以及光谱偏差等,在滤波处理之后,还可以通过使用标准状态变换((Standard Normal Variation,SNV)来消除基线影响,SNV主要是用来消除固体颗粒大小、表面散射及光程变化对NIR(Near Infrared,现代近红外光谱)的影响,其处理过程是对一条光谱进行处理,即基于光谱矩阵的行。标准正态变量变换的公式如下:
式中,Xi,SNV为第i个红外光谱信号的标准正态变量变换结果;xi为红外光谱信号的平均值,m为波长点数,xk为每个样本的值,K=1,2,3,…,m。
如图8所示,经过预处理过后的光图谱相对于原始光谱图(图5所示的图谱)更加平滑,同时采用SNV有效消除了基线的影响,大大提升了后续的去峰匹配的效率以及物质识别的精准性。
本实施例中基于Savitzky-Golay滤波处理,低通滤波处理以及标准正态变换,对经过红外光谱仪采集到的原始红外光谱图进行预处理,有效消除原始红外光谱图中的噪声和基线偏移,大大提升了后续的去峰匹配的效率以及物质识别的精准性和高效性。
在一些实施例中,步骤101中所述从所述数据库中预处理后的原始样本红外光谱图中,抽取出每一样本物质的样本红外光谱图的步骤进一步还包括:
对所述数据库中预处理后的原始样本红外光谱图进行谱聚类;
根据聚类结果,确定每一样本物质的所有预处理后的原始样本红外光谱图;
分别从每一样本物质的所有预处理后的原始样本红外光谱图中随机抽取一个预处理后的原始样本红外光谱图,作为每一样本物质的样本红外光谱图。
可选地,在对数据库中的原始样本红外光谱图进行数据预处理过后,由于数据库中同一样本物质存在多张样本红外光谱图,在去峰匹配过程中需要重复匹配,增加时间损耗,影响物质识别效率。为了减少去峰匹配过程中的冗余计算,采用谱聚类的方法对所有同类的样本物质的样本红外光谱图进行聚合,以根据聚合结果抽取出每一样本物质的样本红外光谱图,提高物质识别效率。
其中,谱聚类只需要求解样本红外光谱图之间的相似度矩阵,因此对于处理稀疏数据的聚类很有效。这点传统聚类算法比如K均值聚类很难做到,其次是使用了降维,因此在处理高维数据聚类时比传统聚类算法更好。
谱聚类是基于图论的知识所演化出的算法,在聚类中广泛使用。主要思想是将所有的数据看成空间中的点,这些点之间可以用边连接起来,距离较远的两点之间边的权重值较低,距离较近的两点间边的权重值较高,然后通过对所有数据点组成的图进行切图,让切图后不同子图间边的权重之和尽可能低,子图内边的权重之和尽可能高,从而达到聚类的目的。
谱聚类主要分为两步:第一步是构图,将采样点数据构造成一张网图,第二步是切图,即将第一步构造出来的按照一定的切边准则,切分成不同的图,而不同的子图,即我们对应的聚类结果。
在构图过程中我们首先要得到邻接矩阵,现阶段主要有三种:∈-近邻法,K邻近法以及全连接法;全连接法是目前使用最普遍的方法。由于所有点之间的权重都大于0,所以叫全连接法。本实施例使用不同的核函数来定义边权重,常用的有多项式核函数,高斯核函数和Sigmoid核函数,最常用的是高斯核函数,如RBF(Radial Basis Function Kernel,径向基核函数),此时相似度矩阵和邻接矩阵相同,具体可表示如下:
其中,xi,xj为两个向量样本,Wij为重构之后的邻接矩阵,Sij为相似矩阵,σ2为带宽,控制径向作用范围。
然后,计算出拉普拉斯矩阵L,拉普拉斯矩阵的定义是L=D-W。D为度矩阵,是一个对角矩阵,W为邻接矩阵。1)拉普拉斯矩阵是对称矩阵,这可以由D和W都是对称矩阵而得。2)由于拉普拉斯矩阵是对称矩阵,则它的所有的特征值都是实数。3)对于任意的向量f:
其中,f为任意的向量,n为向量样本个数。
构图完成后,进行切图操作,最常用的切图方式是Ncut。Ncut在最小化损失函数外,还考虑了子图之间的权重大小。由于子图样本个数多,并不代表权重就越大,所以切图时基于权重更加符合聚类优化目标,使得聚类结果更加精准。Ncut的目标是极小化各子图连边的和,具体计算公式如下:
vol(Ai)=∑i∈Adi;
其中,di为子图的边权,A为一个子图,
其中,hji为指示向量,其中i表示样本下标,j表示子集下标,表示样本i对子集j的指示,vi为第i个点集合。
相应地,优化目标可进一步表征为:
其中,H为指示矩阵,Tr()为矩阵的迹。
由于HTH≠I,而HTDH=I,因此,优化目标可进一步推导如下:
综上,优化目标最终可简化化为:
minT∈RTr(TTD-1/2LD-1/2T);
约束条件为TYT=I;
在谱聚类过程中,需要求出D-1/2LD-1/2的最小的前K个特征值,然后求出对应的特征向量,并标准化,最后得到特征矩阵,以根据特征矩阵实现聚类。
需要说明的是,在光谱匹配中,可以将所有的样本物质的峰值点精确找出,取每一样本物质的所有峰值点中的前五个大峰作为特征,进行谱聚类。由于同种样本物质的红外光谱图是相同的,因此峰值点也是一样的,经过聚类则可以准确的找出同种样本物质的所有样本红外光谱图。
如图9所示,展示了运用谱聚类进行同类物质进行聚类的效果。可以看出本实施例的物质识别方法可准确的找出同种样本物质的所有样本红外光谱图。
本实施例中通过对数据库中预处理后的原始样本红外光谱图进行谱聚类,以将同种样本物质的所有谱图聚合在一起,进而精准地抽取出每一样本物质的一个样本红外光谱图,避免冗余,有效减少重复对同一物质的样本红外光谱图进行去峰匹配所需耗时,提高物质识别的效率。
下面对本发明提供的基于红外光谱和去峰匹配的混合物质识别装置进行描述,下文描述的基于红外光谱和去峰匹配的混合物质识别装置与上文描述的基于红外光谱和去峰匹配的混合物质识别方法可相互对应参照。
如图10,本实施例提供一种基于红外光谱和去峰匹配的混合物质识别装置,该装置包括数据采集模块1001、数据处理模块1002、物质匹配模块1003和物质识别模块1004,其中:
数据采集模块1001用于获取待测混合物质的待测红外光谱图和多个样本物质的样本红外光谱图;
数据处理模块1002用于根据所述待测混合物质的待测红外光谱图,获取待测特征峰集合,根据所述多个样本物质的样本红外光谱图,获取样本特征峰集合;
物质匹配模块1003用于对所述待测特征峰集合中的待测特征峰和所述样本特征峰集合中的样本特征峰迭代进行去峰匹配;
物质识别模块1004用于根据去峰匹配结果,获取与所述待测混合物质匹配的样本物质集合,根据与所述待测混合物质匹配的样本物质集合的成分,获取所述待测混合物质的成分识别结果;
其中,所述去峰匹配包括匹配操作和去峰操作;所述匹配操作用于对每次去峰匹配对应的所述待测特征峰集合中的待测特征峰和每次去峰匹配对应的所述样本特征峰集合中的样本特征峰进行相似性匹配;所述去峰操作用于将每次去峰匹配到的相似性最大的待测特征峰从每次去峰匹配对应的所述待测特征峰集合中删除,得到下一次去峰匹配对应的所述待测特征峰集合,并将每次去峰匹配到的相似性最大的样本特征峰对应的样本物质的所有样本特征峰从每次去峰匹配对应的所述样本特征峰集合中删除,得到所述下一次去峰匹配对应的所述样本特征峰集合。
本实施例提供的基于红外光谱和去峰匹配的混合物质识别装置,通过采集待测混合物质的待测红外光谱图和多个样本物质的样本红外光谱图,并对待测混合物质的待测红外光谱图的特征峰以及多个样本物质的样本红外光谱图的样本特征峰迭代进行去峰匹配,以根据去峰匹配结果自动精准地识别出待测混合物质的成分,有效提高物质识别效率,有效解决现有技术中依赖人工经验进行物质识别,存在的识别效率低、需要消耗大量的人力物力、识别误差大的问题。
图11示例了一种电子设备的实体结构示意图,如图11所示,该电子设备可以包括:处理器(processor)1101、通信接口(Communications Interface)1102、存储器(memory)1103和通信总线1104,其中,处理器1101,通信接口1102,存储器1103通过通信总线1104完成相互间的通信。处理器1101可以调用存储器1103中的逻辑指令,以执行基于红外光谱和去峰匹配的混合物质识别方法,该方法包括:获取待测混合物质的待测红外光谱图和多个样本物质的样本红外光谱图;根据所述待测混合物质的待测红外光谱图,获取待测特征峰集合,根据所述多个样本物质的样本红外光谱图,获取样本特征峰集合;对所述待测特征峰集合中的待测特征峰和所述样本特征峰集合中的样本特征峰迭代进行去峰匹配;根据去峰匹配结果,获取与所述待测混合物质匹配的样本物质集合,根据与所述待测混合物质匹配的样本物质集合的成分,获取所述待测混合物质的成分识别结果;其中,所述去峰匹配包括匹配操作和去峰操作;所述匹配操作用于对每次去峰匹配对应的所述待测特征峰集合中的待测特征峰和每次去峰匹配对应的所述样本特征峰集合中的样本特征峰进行相似性匹配;所述去峰操作用于将每次去峰匹配到的相似性最大的待测特征峰从每次去峰匹配对应的所述待测特征峰集合中删除,得到下一次去峰匹配对应的所述待测特征峰集合,并将每次去峰匹配到的相似性最大的样本特征峰对应的样本物质的所有样本特征峰从每次去峰匹配对应的所述样本特征峰集合中删除,得到所述下一次去峰匹配对应的所述样本特征峰集合。
此外,上述的存储器1103中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的基于红外光谱和去峰匹配的混合物质识别方法,该方法包括:获取待测混合物质的待测红外光谱图和多个样本物质的样本红外光谱图;根据所述待测混合物质的待测红外光谱图,获取待测特征峰集合,根据所述多个样本物质的样本红外光谱图,获取样本特征峰集合;对所述待测特征峰集合中的待测特征峰和所述样本特征峰集合中的样本特征峰迭代进行去峰匹配;根据去峰匹配结果,获取与所述待测混合物质匹配的样本物质集合,根据与所述待测混合物质匹配的样本物质集合的成分,获取所述待测混合物质的成分识别结果;其中,所述去峰匹配包括匹配操作和去峰操作;所述匹配操作用于对每次去峰匹配对应的所述待测特征峰集合中的待测特征峰和每次去峰匹配对应的所述样本特征峰集合中的样本特征峰进行相似性匹配;所述去峰操作用于将每次去峰匹配到的相似性最大的待测特征峰从每次去峰匹配对应的所述待测特征峰集合中删除,得到下一次去峰匹配对应的所述待测特征峰集合,并将每次去峰匹配到的相似性最大的样本特征峰对应的样本物质的所有样本特征峰从每次去峰匹配对应的所述样本特征峰集合中删除,得到所述下一次去峰匹配对应的所述样本特征峰集合。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的基于红外光谱和去峰匹配的混合物质识别方法,该方法包括:获取待测混合物质的待测红外光谱图和多个样本物质的样本红外光谱图;根据所述待测混合物质的待测红外光谱图,获取待测特征峰集合,根据所述多个样本物质的样本红外光谱图,获取样本特征峰集合;对所述待测特征峰集合中的待测特征峰和所述样本特征峰集合中的样本特征峰迭代进行去峰匹配;根据去峰匹配结果,获取与所述待测混合物质匹配的样本物质集合,根据与所述待测混合物质匹配的样本物质集合的成分,获取所述待测混合物质的成分识别结果;其中,所述去峰匹配包括匹配操作和去峰操作;所述匹配操作用于对每次去峰匹配对应的所述待测特征峰集合中的待测特征峰和每次去峰匹配对应的所述样本特征峰集合中的样本特征峰进行相似性匹配;所述去峰操作用于将每次去峰匹配到的相似性最大的待测特征峰从每次去峰匹配对应的所述待测特征峰集合中删除,得到下一次去峰匹配对应的所述待测特征峰集合,并将每次去峰匹配到的相似性最大的样本特征峰对应的样本物质的所有样本特征峰从每次去峰匹配对应的所述样本特征峰集合中删除,得到所述下一次去峰匹配对应的所述样本特征峰集合。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种基于红外光谱和去峰匹配的混合物质识别方法,其特征在于,包括:
获取待测混合物质的待测红外光谱图和多个样本物质的样本红外光谱图;
根据所述待测混合物质的待测红外光谱图,获取待测特征峰集合,根据所述多个样本物质的样本红外光谱图,获取样本特征峰集合;
对所述待测特征峰集合中的待测特征峰和所述样本特征峰集合中的样本特征峰迭代进行去峰匹配;
根据去峰匹配结果,获取与所述待测混合物质匹配的样本物质集合,根据与所述待测混合物质匹配的样本物质集合的成分,获取所述待测混合物质的成分识别结果;
其中,所述去峰匹配包括匹配操作和去峰操作;所述匹配操作用于对每次去峰匹配对应的所述待测特征峰集合中的待测特征峰和每次去峰匹配对应的所述样本特征峰集合中的样本特征峰进行相似性匹配;所述去峰操作用于将每次去峰匹配到的相似性最大的待测特征峰从每次去峰匹配对应的所述待测特征峰集合中删除,得到下一次去峰匹配对应的所述待测特征峰集合,并将每次去峰匹配到的相似性最大的样本特征峰对应的样本物质的所有样本特征峰从每次去峰匹配对应的所述样本特征峰集合中删除,得到所述下一次去峰匹配对应的所述样本特征峰集合。
2.根据权利要求1所述的基于红外光谱和去峰匹配的混合物质识别方法,其特征在于,所述对所述待测特征峰集合中的待测特征峰和所述样本特征峰集合中的样本特征峰迭代进行去峰匹配,包括:
对于当前次去峰匹配,将所述当前次去峰匹配对应的所述待测特征峰集合中的每一待测特征峰与所述当前次去峰匹配对应的所述样本特征峰集合中的每一样本特征峰进行相似性匹配;
将匹配到的相似性最大的样本特征峰所属的样本物质作为所述当前次去峰匹配中与所述待测混合物质匹配的样本物质;
将所述当前次去峰匹配中与所述待测混合物质匹配的样本物质的样本红外光谱图与上一次去峰匹配对应的组合光谱图进行叠加,得到所述当前次去峰匹配对应的组合光谱图;
计算所述当前次去峰匹配对应的组合光谱图与所述待测红外光谱图之间的相似性,得到所述当前次去峰匹配对应的谱图相似性;
在所述当前次去峰匹配对应的谱图相似性大于所述上一次去峰匹配对应的谱图相似性的情况下,将匹配到的相似性最大的待测特征峰从所述当前次去峰匹配对应的所述待测特征峰集合中删除,得到下一次去峰匹配对应的所述待测特征峰集合;
将匹配到的相似性最大的样本特征峰从所述当前次去峰匹配对应的所述样本特征峰集合中删除,得到所述下一次去峰匹配对应的所述样本特征峰集合;
将所述下一次去峰匹配对应的所述待测特征峰集合中的每一待测特征峰与所述下一次去峰匹配对应的所述样本特征峰集合中的每一样本特征峰进行相似性匹配,迭代执行去峰匹配步骤,直到满足去峰匹配终止条件。
3.根据权利要求2所述的基于红外光谱和去峰匹配的混合物质识别方法,其特征在于,所述将所述当前次去峰匹配对应的所述待测特征峰集合中的每一待测特征峰与所述当前次去峰匹配对应的所述样本特征峰集合中的每一样本特征峰进行相似性匹配,包括:
基于杰卡德系数,对所述当前次去峰匹配对应的所述待测特征峰集合中的每一待测特征峰与所述当前次去峰匹配对应的所述样本特征峰集合中的每一样本特征峰进行相似性匹配。
4.根据权利要求2所述的基于红外光谱和去峰匹配的混合物质识别方法,其特征在于,所述将所述当前次去峰匹配中与所述待测混合物质匹配的样本物质的样本红外光谱图与上一次去峰匹配对应的组合光谱图进行叠加,得到所述当前次去峰匹配对应的组合光谱图,包括:
对所述当前次去峰匹配中与所述待测混合物质匹配的样本物质的样本红外光谱图以及所述上一次去峰匹配对应的组合光谱图进行线性插值处理,以使线性插值处理后的样本红外光谱图的数据格式与线性插值处理后的组合光谱图的数据格式一致;
将所述线性插值处理后的样本红外光谱图与所述线性插值处理后的组合光谱图进行线性叠加,得到所述当前次去峰匹配对应的组合光谱图。
5.根据权利要求2所述的基于红外光谱和去峰匹配的混合物质识别方法,其特征在于,所述根据去峰匹配结果,获取与所述待测混合物质匹配的样本物质集合,包括:
根据所述去峰匹配结果,获取每次去峰匹配中与所述待测混合物质匹配的样本物质;
对所有次去峰匹配中与所述待测混合物质匹配的样本物质进行汇总,得到与所述待测混合物质匹配的样本物质集合。
6.根据权利要求1-5任一所述的基于红外光谱和去峰匹配的混合物质识别方法,其特征在于,所述获取待测混合物质的待测红外光谱图和多个样本物质的样本红外光谱图,包括:
基于红外光谱仪,采集所述待测混合物质的原始待测红外光谱图;
对所述原始待测红外光谱图和数据库中的原始样本红外光谱图进行预处理;
将预处理后的原始待测红外光谱图作为所述待测红外光谱图;
从所述数据库中预处理后的原始样本红外光谱图中,抽取出每一样本物质的样本红外光谱图;
其中,所述预处理包括滤波处理和标准状态变换处理;
所述滤波处理包括低通滤波处理和基于最小二乘的卷积拟合滤波处理。
7.根据权利要求6所述的基于红外光谱和去峰匹配的混合物质识别方法,其特征在于,所述从所述数据库中预处理后的原始样本红外光谱图中,抽取出每一样本物质的样本红外光谱图,包括:
对所述数据库中预处理后的原始样本红外光谱图进行谱聚类;
根据聚类结果,确定每一样本物质的所有预处理后的原始样本红外光谱图;
分别从每一样本物质的所有预处理后的原始样本红外光谱图中随机抽取一个预处理后的原始样本红外光谱图,作为每一样本物质的样本红外光谱图。
8.一种基于红外光谱和去峰匹配的混合物质识别装置,其特征在于,包括:
数据采集模块,用于获取待测混合物质的待测红外光谱图和多个样本物质的样本红外光谱图;
数据处理模块,用于根据所述待测混合物质的待测红外光谱图,获取待测特征峰集合,根据所述多个样本物质的样本红外光谱图,获取样本特征峰集合;
物质匹配模块,用于对所述待测特征峰集合中的待测特征峰和所述样本特征峰集合中的样本特征峰迭代进行去峰匹配;
物质识别模块,用于根据去峰匹配结果,获取与所述待测混合物质匹配的样本物质集合,根据与所述待测混合物质匹配的样本物质集合的成分,获取所述待测混合物质的成分识别结果;
其中,所述去峰匹配包括匹配操作和去峰操作;所述匹配操作用于对每次去峰匹配对应的所述待测特征峰集合中的待测特征峰和每次去峰匹配对应的所述样本特征峰集合中的样本特征峰进行相似性匹配;所述去峰操作用于将每次去峰匹配到的相似性最大的待测特征峰从每次去峰匹配对应的所述待测特征峰集合中删除,得到下一次去峰匹配对应的所述待测特征峰集合,并将每次去峰匹配到的相似性最大的样本特征峰对应的样本物质的所有样本特征峰从每次去峰匹配对应的所述样本特征峰集合中删除,得到所述下一次去峰匹配对应的所述样本特征峰集合。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述基于红外光谱和去峰匹配的混合物质识别方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于红外光谱和去峰匹配的混合物质识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310086867.2A CN116202980A (zh) | 2023-01-29 | 2023-01-29 | 基于红外光谱和去峰匹配的混合物质识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310086867.2A CN116202980A (zh) | 2023-01-29 | 2023-01-29 | 基于红外光谱和去峰匹配的混合物质识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116202980A true CN116202980A (zh) | 2023-06-02 |
Family
ID=86507195
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310086867.2A Pending CN116202980A (zh) | 2023-01-29 | 2023-01-29 | 基于红外光谱和去峰匹配的混合物质识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116202980A (zh) |
-
2023
- 2023-01-29 CN CN202310086867.2A patent/CN116202980A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6091493B2 (ja) | 試料に存在する成分を決定するための分光装置と分光法 | |
Sharma et al. | Improved eigenvalue decomposition-based approach for reducing cross-terms in Wigner–Ville distribution | |
CN110503060B (zh) | 一种光谱信号去噪方法及其系统 | |
CN113008805A (zh) | 基于高光谱成像深度分析的白芷饮片质量预测方法 | |
CN109270045A (zh) | 一种用于拉曼光谱的快速荧光背景抑制方法 | |
CN114002162A (zh) | 土壤有机碳含量估算方法、设备、存储介质及程序产品 | |
CN114167237A (zh) | 一种gis局部放电故障识别方法、系统、计算机设备、存储介质 | |
CN114077852A (zh) | 一种强噪声光谱信号的智能去噪方法 | |
CN109670531A (zh) | 一种基于Hodrick-Prescott滤波器的近红外光谱信号的去噪方法 | |
CN110836878B (zh) | 一种卷积插值耦合高斯混合模型快速三维荧光寻峰方法 | |
CN116202980A (zh) | 基于红外光谱和去峰匹配的混合物质识别方法及装置 | |
CN117434337A (zh) | 一种宽频电压信号测量方法及系统 | |
CN116858785A (zh) | 土壤镍浓度反演方法、装置、存储介质和计算机设备 | |
CN113435115B (zh) | 一种荧光光谱特征波长筛选方法、装置、计算机设备及可读储存介质 | |
Tian et al. | Tunable diode laser spectrometry signal de-noising using discrete wavelet transform for molecular spectroscopy study. | |
CN114264626A (zh) | 一种基于时间序列残差网络的织物无损定量分析方法 | |
EP4022268A1 (en) | Spectroscopic apparatus and methods for determining components present in a sample | |
CN108133203B (zh) | 一种基于稀疏表示的拉曼光谱特征提取方法 | |
CN112666094A (zh) | 一种常见毒素识别系统及方法 | |
CN107250788A (zh) | 噪声水平估计方法、测定数据处理装置以及测定数据处理用程序 | |
CN113884761B (zh) | 一种提高测频精度的方法、装置、设备及介质 | |
CN109030452A (zh) | 一种基于五点三次平滑算法的拉曼光谱数据降噪方法 | |
CN117558361A (zh) | 用于烟叶物质成分分析的光谱分析模型的构建方法及应用 | |
CN111562226B (zh) | 基于吸收光谱特征峰面积的海水总氮总磷分析方法及系统 | |
CN113686821B (zh) | 一种喀斯特植物叶片tn含量无损监测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |