CN109543846B - 一种基于mvo改进的dbscan矿井突水光谱识别方法 - Google Patents
一种基于mvo改进的dbscan矿井突水光谱识别方法 Download PDFInfo
- Publication number
- CN109543846B CN109543846B CN201811248403.2A CN201811248403A CN109543846B CN 109543846 B CN109543846 B CN 109543846B CN 201811248403 A CN201811248403 A CN 201811248403A CN 109543846 B CN109543846 B CN 109543846B
- Authority
- CN
- China
- Prior art keywords
- dbscan
- algorithm
- universe
- mvo
- eps
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Measurement Of Radiation (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
Abstract
本发明公开了一种基于MVO改进的DBSCAN矿井突水光谱识别方法,将先进的多元宇宙优化(Multi‑Verse Optimizer,MVO)算法用于改进无监督聚类算法DBSCAN,实现DBSCAN算法的参数Eps自寻优,最后将寻得的最优参数结合DBSCAN算法用于煤矿突水的激光诱导荧光光谱识别;在改进算法的参数寻优过程中,MVO算法的宇宙位置的取值区间依据水样光谱数据的空间距离自设定,最大可能的减少人工输入参数。本发明提供的基于MVO改进的DBSCAN算法,不仅省去繁琐的人工参数寻优过程,并且能输出最优识别率所对应的参数Eps的取值区间;此外,井无监督学习算法用于识别煤矿突水光谱,能最大可能的降低对未知水源的误识别。
Description
技术领域
本发明属于矿井突水的光谱识别领域,具体是一种基于MVO改进的 DBSCAN矿井突水光谱识别方法。
背景技术
我国是能源消耗大国,其中煤炭资源在我国能源中占据着主导地位,并且在短时间内也无法改变这一现状,因此煤炭的安全开采对我国能源保证有着重大意义。在煤矿开采中,矿井突水严重威胁着煤矿的安全生产,随着矿井的开采强度与深度的增加,煤矿面临突水的威胁越来越大。矿井发生突水后,快速准确的识别突水来源以便采取最为适当的应对方式,是降低突水损失的有效办法之一。
激光诱导荧光技术因其检测具有较好的快速性和灵敏性已成功的应用于矿井突水检测,目前用于矿井突水激光诱导荧光光谱识别的方法以监督学习算法为主。在模式识别和机器学习领域,对于有标签的数据,监督学习算法性能总是优于无监督学习算法,但是监督学习算法严重依赖数据的类别信息和标签信息,就突水光谱识别而言,若发生的突水类型不在训练集中,使用监督学习算法容易发生误识别,产生误判。
无监督学习算法DBSCAN在聚类时是基于样本数据的密度,虽不需训练样本的标签和类别信息,将DBSCAN用于矿井突水光谱识别,能有效的降低对未知水源的误识别,但是DBSCAN算法在聚类时需要设置合适的参数,就DBSCAN 算法而言,合适的参数设置,需要进行大量的实验,过程较为繁琐。此外,无监督学习算法DBSCAN聚类时,是基于样本的密度,即样本间的空间距离,这就导致取得最优聚类结果时,参数Eps所对应的可能不是一个具体值,而是一个区间,若通过人工找寻这个区间,其工作量可想而知。
发明内容
本发明的目的是提供一种基于MVO改进的DBSCAN矿井突水光谱识别方法,其目的通过多元宇宙优化(Multi-verse Optimization)改进DBSCAN,实现 DBSCAN在煤矿突水的光谱识别中的参数自寻优,降低对未知水源的误识别,同时省去DBSCAN聚类中人工择优参数的过程。
本发明实现发明目的采用如下技术方案:
一种基于MVO改进的DBSCAN矿井突水光谱识别方法,将先进的多元宇宙算法(MVO)用于改进无监督聚类学习算法DBSCAN,实现其参数最寻优,找出最大聚类准确率下的最优参数取值范围,最后将寻得的最优参数用于用于煤矿突水光谱的识别,其实现步骤如下:
DBSCAN是基于一组邻域来描述样本集的紧密程度的,参数(Eps,MinPt) 用来描述邻域的样本分布紧密程度。其中,Eps描述了某一样本的邻域距离阈值, MinPt描述了某一样本的距离为Eps的邻域中样本个数的阈值。
核心对象:设样本集为P=(p1,p2,p3,…,pn),对于pj∈P,其Eps邻域包含样本集P中与pj的距离不大于Eps的子样本集的个数记为N,若N≥MinPt,则pj是核心对象。
步骤1:设置多元宇宙优化算法的宇宙U数、最大迭代数Max_iteration,设置无监督学习算法DBSCAN的参数MinPts;
步骤2:依据被聚类样本间的距离,自动设置变量距离[xL,xU],初始化多元优化算法的宇宙位置,初始化无监督聚类算法参数核心对象集合ψ,聚类簇数Q,簇划分C,未聚类样本集合Φ;
步骤3:根据宇宙膨胀率排列宇宙并通过轮盘赌机制选择一个白洞,其选择规则如公式1所示;
步骤4:根据式(2)和式(3)更新虫洞存在概率WEP和旅行距离率TDR,并进行边界检查:
式中,α为WEP的最小取值,β为其最大取值,m为当前迭代次数,M为最大迭代次数,R为输入参数,一般取整数值。
步骤5:计算当前宇宙膨胀率,若宇宙膨胀率优于当前宇宙膨胀率,则更新当前宇宙保存膨胀率,否则,保持当前宇宙;
式4中,P为待聚类数据集,MinPts为DBSCAN算法的核心对象数;为第m次迭代的第i个宇宙空间,为其对应的膨胀率,式5中,M_inflation 为第m次迭代中最优膨胀率,Best_inflationm为前m次迭代中,全局最优膨胀率; DBSCAN为无监督聚类算法,实现方式如下:
步骤5.2:找出DBSCAN算法的所有核心对象,令i=1,2,3,…,Q;计算各样本空间距离,找出pi对应的NEps(pi),若|NEps(xi)|≥MinPts,将样本pi加入到核心对象集合,ψ=ψ∪{pi};
步骤5.3:判断核心对象集合是否为空,若为空,转到步骤6;
步骤5.5:当前簇核心对象队列ψ′的一个核心对象pi,找出其NEps(pi)的子集,更新当前簇样本集合Cq=Cq∪(NEps(pi)∩Φ),更新Φ=Φ-NEps(pi)∩Φ,更新ψ′=ψ′-NEps(pi)∩Φ;
步骤5.6:若当前核心对象队列ψ′为空,当前簇Cq的样本寻找完成,更新簇集C={C1,C2,C3,L,Cq}更新核心对象集ψ=ψ-Cq,跳入步骤5.3;
步骤5.7:输出聚类结果:C={C1,C2,C3,…,CQ},计算聚类准确率,结果既是多元优化算法的膨胀率。
步骤6:更新宇宙位置,并根据式(6)最优宇宙中寻找最优个体,其中r2、 r3、r4为随机数,取值在0到1内;
步骤7:终止条件判定,若满足条件(足够好的宇宙或者达到最大迭代次数),则输出对应结果,否则迭代次数加1,返回执行步骤3。
有益效果:
本发明和发明与现有技术相比,其有益效果体现在:本发明研发的一种基于MVO改进的DBSCAN矿井突水光谱识别方法,将改进的无监督学习算法DBSCAN用于矿井突水光谱识别,降低对未知水源的误识别,其改进方法是用MVO优化DBSCAN算法,实现DBSCAN的参数自寻优,找出最优参数的解区间,尽可能的提高对突水光谱的识别率,同时省去人工参数择优的繁琐工作。
附图说明
图1MVO改进DBSCAN算法的结构简图
图2基于MVO改进的DBSCAN突水光谱识别流程
图3WEP和TDR随迭代次数的变化曲线
图4基于MVO的DBSCAN参数寻优过程
具体实施方式
快速准确的识别未知突水水源,在煤矿安全开采中具有重大意义,发明一种基于MVO改进的DBSCAN矿井突水光谱识别方法,下面结合实施方式和附图 2,对本发明作进一步详细描述。
步骤1:设置多元宇宙优化算法的宇宙数U=10、最大迭代数 Max_iteration=300,设置无监督学习算法DBSCAN的参数MinPts=3;
步骤2:预处理水样光谱数据,根据不同样本光谱数据间的距离,自动设置变量距离[xL,xU],初始化多元优化算法的宇宙位置,初始化无监督聚类算法参数核心对象集合ψ,聚类簇数Q=0,簇划分C,未聚类样本集合Φ;
步骤3:根据宇宙膨胀率排列宇宙并通过轮盘赌机制选择一个白洞,其选择规则如公式1所示;
步骤4:根据式(2)和式(3)更新虫洞存在概率WEP和旅行距离率TDR,并进行边界检查:
公式2中,α为WEP的最小取值,设为0.25,β为其最大取值,设为1,m为当前迭代次数,M为最大迭代次数,R设置为5,随着迭代次数的增加,虫洞存在概率WEP和旅行距离率TDR的值得变化如图3所示。
步骤5:计算当前宇宙膨胀率,若宇宙膨胀率优于当前宇宙膨胀率,则更新当前宇宙保存膨胀率,否则,保持当前宇宙;
式中,P为待聚类突水水样的荧光光谱数据集,MinPts为DBSCAN算法的核心对象数;为第m次迭代的第i个宇宙空间,为其对应的膨胀率, M_inflation为第m次迭代中最优膨胀率,Best_inflationm为前m次迭代中,全局最优膨胀率;DBSCAN为无监督聚类算法,实现方式如下:
步骤5.2:找出DBSCAN算法的所有核心对象,令i=1,2,3,…,Q;计算各样本空间距离,找出pi对应的NEps(pi),若|NEps(xi)|≥MinPts,将样本pi加入到核心对象集合,ψ=ψ∪{pi};
步骤5.3:判断核心对象集合是否为空,若为空,转到步骤6;
步骤5.5:当前簇核心对象队列ψ′的一个核心对象pi,找出其NEps(pi)的子集,更新当前簇样本集合Cq=Cq∪(NEps(pi)∩Φ),更新Φ=Φ-NEps(pi)∩Φ,更新ψ′=ψ′-NEps(pi)∩Φ;
步骤5.6:若当前核心对象队列ψ′为空,当前簇Cq的样本寻找完成,更新簇集C={C1,C2,C3,L,Cq}更新核心对象集ψ=ψ-Cq,跳入步骤5.3;
步骤5.7:输出聚类结果:C={C1,C2,C3,…,CQ},计算聚类准确率,结果既是多元优化算法的膨胀率。
步骤6:更新宇宙位置,并根据式(6)最优宇宙中寻找最优个体,其中r2、 r3、r4为随机数,取值在0到1内;
步骤7:终止条件判定,若满足条件(足够好的宇宙或者达到最大迭代次数),则输出寻优获得的Eps的取值,否则迭代次数加1,返回执行步骤3。
实验验证
发明了一种基于MVO改进的DBSCAN矿井突水光谱识别方法,为检验改进算法在煤矿突水识别中的应用效果,在淮南谢桥煤矿的井下水的采集点,采集四个水样,每个水样采集30组LIF光谱数据,将获取的光谱数据用于验证改算法。水样采集点和坐标如表1所示,表中坐标参考点为中国国家坐标原点,水样采集好后密封处理,带回实验室,在实验室采集水样的LIF光谱数据。
表1水样采集地点信息
基于MVO改进的DBSCAN光谱识别中,最大迭代次数设为300次,多元宇宙优化算法的宇宙数设为10,宇宙位置变量区间是根据实验所选水样光谱的数据的空间距离自设定,DBSCAN算法的MinPts设为3。此外,MVO算法的新虫洞存在概率WEP最大值设为1,最小值设为0.25;旅行距离率TDR的R变量设为5,WEP和TDR随迭代次数的取值变化如图3所示。从图3中可知,随着 MVO的迭代次数增加,旅行距离TDR的值逐渐减少,直至趋于0,虫洞存在概率则随着迭代次数的增加而增加,直至增加到最大值1。
基于MVO改进的DBSCAN的突水水样光谱的识别结果如图4所示,寻优共迭代300次,为更清楚的看出MVO寻优前期最优膨胀率和宇宙位置变化情况,图4中只画出其前240次迭代的曲线。图4中(a)为最优宇宙膨胀率所对应的宇宙位置,即寻优获得的DBSCAN算法的Eps。MVO算法的宇宙选为10个,取得最优膨胀率所对应的宇宙位置可能不止一个,所以图(a)中‘Eps min’为当前步取得最优时,所对应的宇宙位置的最小值,‘Eps max’为当前步取得最优时,所对应的宇宙位置的最大值,最后Eps的最优区间即为‘Eps min’和‘Eps max’之间。图4(b)为MVO的最优膨胀率曲线,即为DBSCAN聚类准确率曲线,从图中可知,经历47次寻优迭代,DBSCAN对水样光谱的识别率已达到最大,为97.5%,寻优速度较快。最后,将图(a)结合图(b)找出DBSCAN最高识别率下参数Eps的取值区间,为[0.0237 0.0407]。综上可知,发明的基于MVO改进DBSCAN的突水水样光谱识别方法,不仅能快速的找寻DBSCAN的最优参数,实现水样激光诱导荧光光谱的最高识别率,而且还能自主的找寻最优参数的取值范围,省去繁琐的人工参数寻优过程。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (1)
1.一种基于MVO改进的DBSCAN矿井突水光谱识别方法,其特征在于,包括以下步骤:
步骤1:设置多元宇宙优化算法的宇宙数U=10、最大迭代数Max_iteration=300,设置无监督学习算法DBSCAN的参数MinPts=3;
步骤2:预处理水样光谱数据,根据不同样本光谱数据间的距离,自动设置变量距离[xL,xU],初始化多元优化算法的宇宙位置,初始化无监督聚类算法参数核心对象集合ψ,聚类簇数Q=0,簇划分C,未聚类样本集合Φ;
步骤3:根据宇宙膨胀率排列宇宙并通过轮盘赌机制选择一个白洞,其选择规则如公式1所示;
步骤4:根据式(2)和式(3)更新虫洞存在概率WEP和旅行距离率TDR,并进行边界检查:
公式2中,α为WEP的最小取值,设为0.25,β为其最大取值,设为1,m为当前迭代次数,M为最大迭代次数,R设置为5;
步骤5:计算当前宇宙膨胀率,若宇宙膨胀率优于当前宇宙膨胀率,则更新当前宇宙保存膨胀率,否则,保持当前宇宙;
式中,P为待聚类突水水样的荧光光谱数据集,MinPts为DBSCAN算法的核心对象数;为第m次迭代的第i个宇宙空间,为其对应的膨胀率,M_inflation为第m次迭代中最优膨胀率,Best_inflationm为前m次迭代中,全局最优膨胀率;DBSCAN为无监督聚类算法,实现方式如下:
步骤5.2:找出DBSCAN算法的所有核心对象,令i=1,2,3,L,Q;计算各样本空间距离,找出pi对应的NEps(pi),若|NEps(xi)|≥MinPts,将样本pi加入到核心对象集合,ψ=ψU{pi};
步骤5.3:判断核心对象集合是否为空,若为空,转到步骤6;
步骤5.5:当前簇核心对象队列ψ′的一个核心对象pi,找出其NEps(pi)的子集,更新当前簇样本集合Cq=CqU(NEps(pi)IΦ),更新Φ=Φ-NEps(pi)IΦ,更新ψ′=ψ′-NEps(pi)IΦ;
步骤5.6:若当前核心对象队列ψ′为空,当前簇Cq的样本寻找完成,更新簇集C={C1,C2,C3,L,Cq}更新核心对象集ψ=ψ-Cq,跳入步骤5.3;
步骤5.7:输出聚类结果:C={C1,C2,C3,L,CQ},计算聚类准确率,结果既是多元优化算法的膨胀率;
步骤6:更新宇宙位置,并根据式(6)最优宇宙中寻找最优个体,其中r2、r3、r4为随机数,取值在0到1内;
步骤7:终止条件判定,若满足条件(足够好的宇宙或者达到最大迭代次数),则输出寻优获得的Eps的取值,否则迭代次数加1,返回执行步骤3。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811248403.2A CN109543846B (zh) | 2018-10-25 | 2018-10-25 | 一种基于mvo改进的dbscan矿井突水光谱识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811248403.2A CN109543846B (zh) | 2018-10-25 | 2018-10-25 | 一种基于mvo改进的dbscan矿井突水光谱识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109543846A CN109543846A (zh) | 2019-03-29 |
CN109543846B true CN109543846B (zh) | 2023-02-21 |
Family
ID=65845302
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811248403.2A Active CN109543846B (zh) | 2018-10-25 | 2018-10-25 | 一种基于mvo改进的dbscan矿井突水光谱识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109543846B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111079290B (zh) * | 2019-12-17 | 2022-11-11 | 中国人民解放军海军航空大学 | 一种基于改进多元宇宙算法的发动机模型修正方法 |
CN113191108A (zh) * | 2021-04-20 | 2021-07-30 | 西安理工大学 | 一种光伏组件等效电路模型参数高效辨识方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015059272A1 (en) * | 2013-10-24 | 2015-04-30 | Universite Libre De Bruxelles | Improved non-intrusive appliance load monitoring method and device |
CN105445215A (zh) * | 2015-12-02 | 2016-03-30 | 中北大学 | 基于离散多重宇宙优化算法的红外光谱波长选择方法 |
CN108509993A (zh) * | 2018-04-02 | 2018-09-07 | 安徽理工大学 | 一种矿井突水激光诱导荧光光谱图像识别方法 |
-
2018
- 2018-10-25 CN CN201811248403.2A patent/CN109543846B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015059272A1 (en) * | 2013-10-24 | 2015-04-30 | Universite Libre De Bruxelles | Improved non-intrusive appliance load monitoring method and device |
CN105445215A (zh) * | 2015-12-02 | 2016-03-30 | 中北大学 | 基于离散多重宇宙优化算法的红外光谱波长选择方法 |
CN108509993A (zh) * | 2018-04-02 | 2018-09-07 | 安徽理工大学 | 一种矿井突水激光诱导荧光光谱图像识别方法 |
Non-Patent Citations (1)
Title |
---|
多元宇宙优化算法改进SVM参数;聂颖等;《辽宁工程技术大学学报(自然科学版)》(第12期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN109543846A (zh) | 2019-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109005145B (zh) | 一种基于自动特征抽取的恶意url检测系统及其方法 | |
CN106126235B (zh) | 一种复用代码库构建方法、复用代码快速溯源方法及系统 | |
CN107273294B (zh) | 一种基于神经网络语言模型的重复代码检测方法 | |
CN109543846B (zh) | 一种基于mvo改进的dbscan矿井突水光谱识别方法 | |
CN102346829A (zh) | 基于集成分类的病毒检测方法 | |
CN103617203B (zh) | 基于查询驱动的蛋白质-配体绑定位点预测方法 | |
CN103324632B (zh) | 一种基于协同学习的概念识别方法及装置 | |
CN110472417A (zh) | 基于卷积神经网络的恶意软件操作码分析方法 | |
CN104392459A (zh) | 基于改进的fcm和均值漂移的红外图像分割方法 | |
CN109976806B (zh) | 基于字节码序列匹配的Java语句块克隆检测方法 | |
CN109345007A (zh) | 一种基于XGBoost特征选择的有利储层发育区预测方法 | |
CN101324926A (zh) | 一种面向复杂模式分类的特征选择方法 | |
CN105045715A (zh) | 基于编程模式和模式匹配的漏洞聚类方法 | |
CN104809105A (zh) | 基于最大熵的事件论元及论元角色的识别方法及系统 | |
CN111090859B (zh) | 一种基于图编辑距离的恶意软件检测方法 | |
Wu et al. | Traffic sign detection based on SSD combined with receptive field module and path aggregation network | |
CN109961129A (zh) | 一种基于改进粒子群的海上静止目标搜寻方案生成方法 | |
CN113344243B (zh) | 基于改进哈里斯鹰算法优化elm的风速预测方法及系统 | |
CN103714340A (zh) | 基于图像分块的自适应特征提取方法 | |
CN106874762A (zh) | 基于api依赖关系图的安卓恶意代码检测方法 | |
CN112489689B (zh) | 基于多尺度差异对抗的跨数据库语音情感识别方法及装置 | |
CN110688150B (zh) | 一种基于张量运算的二进制文件代码搜索检测方法及系统 | |
CN110609936A (zh) | 一种模糊地址数据智能分类的方法 | |
CN107133348A (zh) | 大规模图片集中基于语义一致性的近似搜索方法 | |
CN109543700B (zh) | 一种抗遮挡的服饰关键点检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |