CN109470686A - 一种基于半监督学习的激光诱导击穿光谱分类识别方法 - Google Patents
一种基于半监督学习的激光诱导击穿光谱分类识别方法 Download PDFInfo
- Publication number
- CN109470686A CN109470686A CN201811372838.8A CN201811372838A CN109470686A CN 109470686 A CN109470686 A CN 109470686A CN 201811372838 A CN201811372838 A CN 201811372838A CN 109470686 A CN109470686 A CN 109470686A
- Authority
- CN
- China
- Prior art keywords
- label
- data
- unknown
- spectroscopic data
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/71—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light thermally excited
- G01N21/718—Laser microanalysis, i.e. with formation of sample plasma
Landscapes
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Plasma & Fusion (AREA)
- Optics & Photonics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明涉及一种基于半监督学习的激光诱导击穿光谱分类识别方法,属于光谱检测技术领域,解决难以为传统监督学习提供足够训练样本,非监督学习无法提供分类标签结果的难题。利用激光诱导击穿光谱测量系统分别获取少量带标签类别的光谱数据和大量未知的光谱数据。对数据进行标签扩散,设置标签扩散参数L,将每个已知类别的数据标签扩散给L个未知类别数据,以使部分未知数据获得标签。再对大量无类别数据进行分类,设置分类参数K,每个未知类别数据的标签取决于离它最近的K个已知类别数据的标签中出现频率最高的标签。
Description
技术领域
本发明涉及一种基于半监督学习的激光诱导击穿光谱分类识别方法,属于光谱检测技术领域。
背景技术
激光诱导击穿光谱(Laser-induced breakdown spectroscopy,LIBS)作为一种新兴的物质元素检测技术,目前已经在爆炸物检测、临床医学样本检测、文化遗产鉴定、合金加工过程、太空探索和农业与食品分析等领域得到广泛研究和应用。根据获得的LIBS光谱,可以对物质进行判别分析或分类识别。对于元素组成相似度极高的不同物质,获得的LIBS光谱差异可能较细微。随着近年来机器学习和人工智能算法的发展,LIBS结合机器学习算法为高相似度物质的鉴别分类提供了新方法。由于LIBS技术具有快速实时、便捷准确和可在线原位检测的优势,将在分类识别领域发挥越来越重要的作用。
基于LIBS对物质进行判别分析中,常用的的机器学习算法主要有监督学习分类方法和非监督聚类方法。监督学习是在有先验类别标签知识的情况下,学习从输入到输出的映射关系,然后使用学习到的映射基于贝叶斯统计预测每个测试数据的标签,使得分类识别准确率最大化。虽然监督学习方法已经在相关领域表现出良好预测结果,但其需要足够的已知标签类别的数据进行建模训练,以学习输入到输出间的映射关系,缺乏足够的训练样本可能导致低识别率。在实际应用,往往很难获得涵盖所有情况的训练数据。非监督学习不需要训练数据进行建模,直接对输入数据进行分析,发现输入数据中的规律,进行分类估计。在LIBS光谱分类识别领域应用最为广泛的是非监督聚类方法,发现输入数据的簇或分组,按特征将输入数据分组,如Hierarchical聚类分析、K-means聚类分析和ISODATA方法等。但是在实际应用场合,检测技术的应用往往是为了探测某一类物质或监测某一类物质,非监督聚类只能完成分组,而不能确定每一组分别是哪类物质。
这些都给实际应用场合采用LIBS进行物质识别分类带来了很大的困难,迫切需要一种能够基于少量带标签的训练数据,对大量未知输入光谱数据进行分类识别的方法。
发明内容
本发明的目的是为了解决激光诱导击穿光谱分类识别应用中,难以为传统监督学习提供足够训练样本,非监督学习无法提供分类标签结果的难题,提供一种基于半监督学习的激光诱导击穿光谱分类方法。该方法根据少量已知类别的训练数据,自动区分大量未知光谱数据,解决了激光诱导击穿光谱识别检测的实际应用问题。
本发明的技术方案如下:
一种基于半监督学习的激光诱导击穿光谱分类方法,其特征是该方法包括如下步骤:
1.进行光谱数据采集。
采用激光诱导击穿光谱实验系统,分别获取少量带标签类别的光谱数据和大量待测未知的光谱数据。
2.进行标签扩散。
1)设置标签扩散参数L;
2)计算每个标记已知类别的光谱数据和各个未知类别的光谱数据间距离,采用如下距离计算公式:
其中D为两个光谱数据间的距离,x、y分别为两个光谱数据,n为光谱数据维数,i为从1到n的索引,xi和yi为x、y在当前索引维数下的光谱峰值;
3)对每个已知类别的光谱数据,根据距离值计算结果,从小到大对所有未知类别的光谱数据进行排序;
4)将距离值最小的L个未知类别的光谱数据,标记成与这个已知数据相同的类别标签。
3.对经过标签扩散后的光谱数据进行分类识别。
1)设置分类参数K;
2)计算每个未知类别的光谱数据和各个已知类别的光谱数据间的距离,所采用的计算公式与步骤2中相同;
3)对每个未知类别的光谱数据,根据距离值计算结果,从小到大对所有已知类别的光谱数据进行排序;
4)将距离值最小的K个已知类别的光谱数据中,出现频率最高的类别标签作为该未知数据的标签。
有益效果
激光诱导击穿光谱技术是目前物质识别与检测中具有潜力的分析方法之一,结合机器学习算法对没有显著区别的光谱数据也可达到较好分类识别效果。但是在很多实际应用场合,会面临传统监督学习难以获得足够训练样本,而非监督学习又无法提供分类标签结果的问题。本发明所提出的一种基于半监督学习的激光诱导击穿光谱分类方法,根据少量已知类别的光谱数据,自动区分大量未知光谱数据。相对于传统的监督分析方法,该方法明显提高了分类识别效果,具有较好的稳定性,且不必获取大量训练数据,节省了人力物力,解决了只有少量已知样本情况下激光诱导击穿光谱识别检测的难题,为推广激光诱导击穿光谱识别检测方法的实际应用提供了基础。
附图说明
图1为本发明方法流程示意图;
图2为一种激光诱导击穿光谱测量系统构成示意图;
图3为实施例中的分类结果示意图。
具体实施方式
为了更好地说明本发明的目的和优点,下面结合附图和实施例对本发明内容作进一步说明。
实施例
以反恐防暴检测领域典型危险品炸药RDX、HMX、CL-20,以及化学组成与炸药类似且常作为运输箱等容器材质,可能沾染痕量炸药的四种塑料样品(3240、FR-4、ABS和Nylon)的分类识别为例,说明基于半监督学习的激光诱导击穿光谱分类方法在LIBS光谱对未知物质判别区分中的应用。
1.进行光谱数据采集。
搭建如图2所示的激光诱导击穿光谱实验装置,其中1为激光器,2为反射镜,3为聚焦透镜,4为激光诱导等离子体,5为光电探测器,6为三维样品台,7为光纤,8为延时器,9为光谱仪,10为计算机。
将爆炸物粉末用双面胶粘附于铝板表面,放置于样品台6上,采集LIBS光谱,激光器采用Nd:YAG激光器基频1064nm输出波长,频率1Hz,单脉冲能量70mJ。调整三维样品台,使每发光谱的采集点位于样本上不同位置,以避免表面爆炸物样本烧蚀殆尽,激发铝板的光谱。每10发激光脉冲的激发光谱平均作为一个平均光谱。
对于塑料样本,采用相同系统设置,在样本上每个位置点测量12发激发光谱数据,前两发激光脉冲作用为清除样本表面杂质,后10发激发光谱平均作为一个平均光谱。
对于每一个样本,获得30个平均光谱,对每个平均光谱采用全谱所有波长点峰值强度总和进行归一化。
2.对7类样本中每类取一个数据作为已知类别的监督数据,进行标签扩散。
1)设置标签扩散参数L=15;
2)计算每个标记已知类别的光谱数据和各个未知类别的光谱数据间距离,距离计算公式如下:
其中D为两个光谱数据间的距离,x、y分别为两个光谱数据,n为光谱数据维数,i为从1到n的索引,xi和yi为x、y在当前索引维数下的光谱峰值。
3)对每个已知类别的光谱数据,根据距离值计算结果,从小到大对所有未知类别的光谱数据进行排序;
4)将距离值最小的15个未知类别的光谱数据,标记成与这个已知数据相同的类别标签。
3.对经过标签扩散后的光谱数据进行分类识别。
1)设置分类参数K=3;
2)计算每个标记未知类别的光谱数据和各个已知类别的光谱数据间距离,所采用计算公式与步骤2中相同;
3)对每个未知类别的光谱数据,根据距离值计算结果,从小到大对所有已知类别的光谱数据进行排序;
4)将距离值最小的3个已知类别的光谱数据中,出现频率最高的类别标签作为该未知数据的标签。
分类结果如图3所示,其中,爆炸物RDX、HMX和CL-20被标记为1类,塑料3240、FR-4、ABS和Nylon被标记为0类,两类样本的识别率均达到100%。
K取不同值时,分别采用传统KNN分类模型和本方法,对相同样本进行分类判别的结果见表1。
表1半监督学习方法与传统KNN分类方法对爆炸物和对比物识别结果比较
分类结果表明所提出的半监督学习方法可以在只获得少量已知类别的光谱数据情况下,对大量未知类别光谱数据进行识别分类,分类效果优于传统KNN分类算法。本方法不必获取大量训练数据,节省了人力物力,解决了只有少量已知样本情况下激光诱导击穿光谱识别检测的难题。
Claims (4)
1.一种基于半监督学习的激光诱导击穿光谱分类识别方法,其特征在于:具体步骤如下:
1)进行光谱数据采集;
2)进行标签扩散;
3)对经过标签扩散后的光谱数据进行分类识别。
2.根据权利要求1所述的一种基于半监督学习的激光诱导击穿光谱分类识别方法,其特征在于:步骤1)所描述的进行光谱数据采集包括分别获取少量带标签类别的光谱数据和大量未知标签类别的光谱数据。
3.根据权利要求1所述的一种基于半监督学习的激光诱导击穿光谱分类识别方法,其特征在于:所述的步骤2)中进行标签扩散包括以下具体步骤:
(1)设置标签扩散参数L;
(2)计算每个标记已知类别的光谱数据和各个未知类别的光谱数据间距离,采用如下距离计算公式
其中D为两个光谱数据间的距离,x、y分别为两个光谱数据,n为光谱数据维数,i为从1到n的索引,xi和yi为x、y在当前索引维数下的光谱峰值;
(3)对每个已知类别的光谱数据,根据距离值计算结果,从小到大对所有未知类别的光谱数据进行排序;
(4)将距离值最小的L个未知类别的光谱数据,标记成与这个已知数据相同的类别标签。
4.根据权利要求1所述的一种基于半监督学习的激光诱导击穿光谱分类识别方法,其特征在于:所述的步骤3)中对经过标签扩散后的光谱数据进行分类识别包括以下具体步骤:
(1)设置分类参数K;
(2)计算每个标记未知类别的光谱数据和各个已知类别的光谱数据间距离,所采用计算公式与步骤2)中相同;
(3)对每个未知类别的光谱数据,根据距离值计算结果,从小到大对所有已知类别的光谱数据进行排序;
(4)将距离值最小的K个已知类别的光谱数据中,出现频率最高的类别标签作为该未知数据的标签。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811372838.8A CN109470686A (zh) | 2018-11-19 | 2018-11-19 | 一种基于半监督学习的激光诱导击穿光谱分类识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811372838.8A CN109470686A (zh) | 2018-11-19 | 2018-11-19 | 一种基于半监督学习的激光诱导击穿光谱分类识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109470686A true CN109470686A (zh) | 2019-03-15 |
Family
ID=65672778
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811372838.8A Pending CN109470686A (zh) | 2018-11-19 | 2018-11-19 | 一种基于半监督学习的激光诱导击穿光谱分类识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109470686A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110501674A (zh) * | 2019-08-20 | 2019-11-26 | 长安大学 | 一种基于半监督学习的声信号非视距识别方法 |
CN110781920A (zh) * | 2019-09-24 | 2020-02-11 | 同济大学 | 一种室内场景点云部件语义信息的识别方法 |
CN117556245A (zh) * | 2024-01-04 | 2024-02-13 | 信联电子材料科技股份有限公司 | 一种四甲基氢氧化铵生产过滤杂质检测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104807787A (zh) * | 2015-05-20 | 2015-07-29 | 重庆邮电大学 | 一种基于激光诱导击穿光谱技术的茶叶分类鉴别方法 |
CN105279523A (zh) * | 2015-10-22 | 2016-01-27 | 中国科学院遥感与数字地球研究所 | 一种结合混合象元分解与主动学习的半监督分类方法 |
-
2018
- 2018-11-19 CN CN201811372838.8A patent/CN109470686A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104807787A (zh) * | 2015-05-20 | 2015-07-29 | 重庆邮电大学 | 一种基于激光诱导击穿光谱技术的茶叶分类鉴别方法 |
CN105279523A (zh) * | 2015-10-22 | 2016-01-27 | 中国科学院遥感与数字地球研究所 | 一种结合混合象元分解与主动学习的半监督分类方法 |
Non-Patent Citations (3)
Title |
---|
刘建伟: "半监督学习方法", 《计算机学报》 * |
谭琨: "《高光谱遥感影像半监督分类研究》", 31 January 2014, 中国矿业大学出版社 * |
雷英杰: "《模糊逻辑与智能系统》", 30 May 2016, 西安电子科技大学出版社 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110501674A (zh) * | 2019-08-20 | 2019-11-26 | 长安大学 | 一种基于半监督学习的声信号非视距识别方法 |
CN110781920A (zh) * | 2019-09-24 | 2020-02-11 | 同济大学 | 一种室内场景点云部件语义信息的识别方法 |
CN117556245A (zh) * | 2024-01-04 | 2024-02-13 | 信联电子材料科技股份有限公司 | 一种四甲基氢氧化铵生产过滤杂质检测方法 |
CN117556245B (zh) * | 2024-01-04 | 2024-03-22 | 信联电子材料科技股份有限公司 | 一种四甲基氢氧化铵生产过滤杂质检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109142317B (zh) | 一种基于随机森林模型的拉曼光谱物质识别方法 | |
CN104251846B (zh) | 一种结合判别分析的激光诱导击穿光谱定量分析方法 | |
CN109470686A (zh) | 一种基于半监督学习的激光诱导击穿光谱分类识别方法 | |
WO2018121122A1 (zh) | 用于物品查验的拉曼光谱检测方法和电子设备 | |
Mishra et al. | Identification of citrus greening (HLB) using a VIS-NIR spectroscopy technique | |
CN111707656B (zh) | 一种基于拉曼散射光谱的脑脊液细胞检测方法及系统 | |
CN109508647A (zh) | 一种基于生成对抗网络的光谱数据库扩展方法 | |
CN104730041B (zh) | 一种提高激光探针塑料识别精度的方法及其装置 | |
CN108398416A (zh) | 一种基于激光拉曼光谱的混合物成分测定方法 | |
CN107818298A (zh) | 用于机器学习物质识别算法的通用拉曼光谱特征提取方法 | |
CN104376325A (zh) | 一种近红外定性分析模型的建立方法 | |
CN105300954A (zh) | 一种锑矿浮选非均质泡沫层矿物的拉曼光谱表征方法 | |
CN115905881B (zh) | 黄珍珠分类的方法以及装置、电子设备、存储介质 | |
CN103487422A (zh) | 多波长led荧光光谱的云端中药品质检测系统及方法 | |
CN100449302C (zh) | 瓶装黄酒标注酒龄快速无损鉴别方法和装置 | |
CN104020128A (zh) | 一种快速鉴别蜂胶胶源的方法 | |
CN116030310A (zh) | 一种基于激光诱导击穿光谱技术的样品分类方法及系统 | |
CN104568824A (zh) | 基于可见/近红外光谱的虾类新鲜度等级检测方法及装置 | |
CN116992293B (zh) | 一种用于化学发光仪器的智能化数据处理方法 | |
CN106198481B (zh) | 基于lif技术和朴素贝叶斯分类的假酒识别装置及方法 | |
CN203572772U (zh) | 基于多波长led荧光光谱的云端中药品质检测系统 | |
Andrews et al. | Neural network approach to qualitative identification of fuels and oils from laser induced fluorescence spectra | |
CN105069462A (zh) | 基于光谱特征细分和分类器级联的有机化学品定性判定方法 | |
CN111426657B (zh) | 一种溶解性有机物三维荧光谱图的识别比对方法 | |
CN116809456A (zh) | 一种基于近红外光谱设计的生活垃圾分类装置及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190315 |