CN103729798B - 基于改进的K-Means聚类的煤矿安全评价系统 - Google Patents
基于改进的K-Means聚类的煤矿安全评价系统 Download PDFInfo
- Publication number
- CN103729798B CN103729798B CN201410041849.3A CN201410041849A CN103729798B CN 103729798 B CN103729798 B CN 103729798B CN 201410041849 A CN201410041849 A CN 201410041849A CN 103729798 B CN103729798 B CN 103729798B
- Authority
- CN
- China
- Prior art keywords
- mine
- vector
- value
- density
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提出一种改进的K‑Means聚类的煤矿安全评价系统,包括矿井安全数据输入模块、基于改进的K‑Means聚类的数据分析模块、结果输出模块;矿井安全数据输入模块接收用户提交的矿井安全状态数据,基于改进的K‑Means聚类的数据分析模块根据矿井安全状态数据,采用改进的K‑Means聚类方法进行数据分析,结果输出模块显示数据分析的结果,为煤矿企业的安全管理决策提供辅助依据。采用本发明的煤矿安全评价系统后,可以对煤炭企业所属矿井安全评价的打分结果进行分析,实现煤矿安全评价的全面管理,其评价结果可为煤矿企业的管理决策提供重要的技术依据。
Description
技术领域
本发明属于煤矿安全领域。
背景技术
煤炭生产是一个多工序、多环节的综合性过程,而且煤矿生产过程复杂、环境恶劣,常常受到水、火、瓦斯、煤尘和冒顶等各种灾害事故的威胁。因此,煤矿安全问题一直是产业安全中一个尤为重要的问题。
对矿井的安全状况进行准确、全面评估是煤矿生产过程中非常关键的环节。煤矿矿井的安全状况受多个因素影响,如通风安全监控、瓦斯和粉尘防治、井下爆破安全、矿井防冒顶、矿井防透水等。研究这些因素之间的组合关系对矿井安全状况的影响,就可以采取合理的防范措施以降低生产中的安全风险,确保安全生产。
发明内容
基于上述各因素之间的相关性,本发明提出了一种基于改进K-Means算法的煤矿安全评价系统,对煤炭企业所属矿井安全评价指标结果进行分析。在煤矿安全管理中需要对通风安全监控、运输和提升、瓦斯和粉尘防治等多个因素进行综合考虑,在本系统中,针对煤矿安全管理中的通风安全监控、运输和提升、瓦斯和粉尘防治、矿井防火、井下爆破安全、矿井防冒顶、矿井防透水等7个因素进行综合分析,分析后的评价结论可以为煤矿企业的安全管理决策提供技术依据。
一种基于改进K-Means算法的煤矿安全评价系统,包括矿井安全数据输入模块、基于改进的K-Means聚类的数据分析模块、结果输出模块;矿井安全数据输入模块接收用户提交的矿井安全状态数据,基于改进的K-Means聚类的数据分析模块根据矿井安全状态数据,采用改进的K-Means聚类方法进行数据分析,结果输出模块显示数据分析的结果。
优选地,在基于改进的K-Means聚类的数据分析模块中,模块采用以下方法进行数据分析:
(1)数据准备:将第i个矿井Ki表示为向量形式其中xi1、xi2、xi3、xi4、xi5、xi6、xi7分别表示矿井Ki的通风安全监控数值、运输和提升数值、瓦斯和粉尘防治数值、矿井防火数值、井下爆破安全数值、矿井防冒顶数值、矿井防透水数值,得到N个矿井所对应的向量将其记录为一个矿井向量空间其中1≤i≤N,i为自然数,N为矿井个数。
(2)对数据使用改进的K-Means算法:针对N个矿井向量使用改进的K-Means聚类算法进行聚类,步骤如下:
1)使用余弦定理计算矿井向量空间中两两之间的余弦相似度,即确定任意两个矿井向量之间的相似度,其中1≤i≤N,1≤j≤N,i和j均为自然数。相似度评价标准为:两条矿井向量之间夹角的余弦值越接近于1,则这两个矿井安全评价数值的相似度越高;如果两条矿井向量之间夹角的余弦值越接近于0,则这两个矿井安全评价数值之间的相似度越低。
2)设置密度半径Eps,计算矿井向量空间中各个矿井向量的密度。其中密度半径Eps采用自适应方法产生,步骤如下:
考虑到人们期望样本的最大密度应该等于或者小于一个类中样本点的个数,用N/k得到一个类中的近似平均样本数,乘以一个系数,优选的,该系数为0.8或0.5,使得最大密度控制在0.8×N/k和0.5×N/k之间,其中k为聚类的簇数目。
赋给Eps一个初始值,然后计算矿井向量空间中各个样本的密度,如果最大密度大于0.8×N/k,则将Eps减去一个固定值,优选的,该固定值为0.05,如果最大密度小于0.5×N/k,则将Eps加上一个该固定值,然后再次计算各个样本的密度,直至最大密度控制在0.8×N/k和0.5×N/k之间时结束。此时得到的Eps值为最终的Eps值。以该Eps值为密度半径计算并记录矿井向量空间中各个矿井向量的密度。
3)找出矿井向量空间中密度最大的样本点,记为aq(q=1,2,…,k),并将其加入到数据集合Aq(q=1,2,…,k)中,并将其从矿井向量空间中删除。
4)根据Aq中各个矿井向量与向量空间U中各个矿井向量之间的相似度,将向量空间U中与Aq中样本相似度最高的样本加入到集合Aq中去,同时将该样本从矿井向量空间U中删除,直到Aq中的样本个数不少于某一给定阈值,该阈值用β×N/k表示.其中0<β<1。
5)重复执行3)、4),并且规定,在第二次确定密度最大的样本点a2时,必须与第一次所确定的样本点a1之间相似度大于Eps,同样,在确定第三个密度最大的样本点a3时,必须要与前两次所确定的最大密度样本点a1、a2之间相似度均大于Eps,以此类推确定其余的aq(q=1,2,…,k)。每执行一次步骤3)和4),q值加1,直至q值大于k时结束,最终可得到A1,A2,…,Ak这k个数据集合。
6)分别对A1,A2,…,Ak各个数据集合计算其平均值,计算公式为其中且nm为数据集合Am中的样本个数,可得这k个向量。将这k个数据作为K-Means算法的初始聚类中心。
7)以作为初始聚类中心,分配使用余弦相似度方法计算矿井向量空间中各个矿井向量与这些聚类中心之间的相似度,确定时的则将加入到聚类中心所标明的类簇Sv中,其中1≤v≤k。
8)重新计算聚类中心。使用其中且n'm为数据集合Sm中的样本个数,即将得到的每个类簇中的所有样本点的均值作为新的聚类中心。
同时使用平方误差准则函数作为准则函数。
9)判断准则函数是否收敛,如果收敛则算法结束,否则返回7)继续执行。
最终可以得到k个类簇S1,S2,…,Sk,即完成对矿井向量空间的聚类。在该算法中初始聚类中心从高密度点处出发。
利用本发明的系统最终得到的簇S1,S2,…,Sk,将矿井进行了重新分组,且聚类效果比普通的聚类方法更准确,能够为煤矿企业的安全生产提供更可靠的技术依据。
采用本发明的煤矿安全评价系统后,可以对煤炭企业所属矿井安全评价的打分结果进行分析,实现煤矿安全评价的全面管理,其评价结果可为煤矿企业的管理决策提供重要的技术依据。
附图说明
图1是基于改进的K-Means聚类的煤矿安全评价系统结构图。
具体实施方式
如图1所示,在矿井安全数据输入模块中输入通风安全监控、运输和提升、瓦斯和粉尘防治、矿井防火、井下爆破安全、矿井防冒顶、矿井防透水7个影响因子,基于改进的K-Means聚类的数据分析模块根据本发明提出的聚类方法对这些数据进行聚类分析,并在结果输出模块中输出最终分析结果。
基于改进的K-Means聚类的数据分析模块是该系统的核心部分,具体的数据处理过程如下:
(1)数据准备:将第i个矿井Ki表示为向量形式其中xi1、xi2、xi3、xi4、xi5、xi6、xi7分别表示矿井Ki的通风安全监控数值、运输和提升数值、瓦斯和粉尘防治数值、矿井防火数值、井下爆破安全数值、矿井防冒顶数值、矿井防透水数值,得到N个矿井所对应的向量将其记录为一个矿井向量空间其中1≤i≤N,i为自然数,N为矿井个数。
(2)对数据使用改进的K-Means算法:针对N个矿井向量使用改进的K-Means聚类算法进行聚类,步骤如下:
1)使用余弦定理计算矿井向量空间中两两之间的余弦相似度,即确定任意两个矿井向量之间的相似度,其中1≤i≤N,1≤j≤N,i和j均为自然数。
相似度评价标准为:两条矿井向量之间夹角的余弦值越接近于1,则这两个矿井安全评价数值的相似度越高;如果两条矿井向量之间夹角的余弦值越接近于0,则这两个矿井安全评价数值之间的相似度越低。
2)设置密度半径Eps,计算矿井向量空间中各个矿井向量的密度。其中密度半径Eps采用自适应方法产生,步骤如下:
考虑到人们期望样本的最大密度应该等于或者小于一个类中样本点的个数,用N/k得到一个类中的近似平均样本数,乘以一个系数,优选的,该系数为0.8或0.5,使得最大密度控制在0.8×N/k和0.5×N/k之间,其中k为聚类的簇数目。
赋给Eps一个初始值,然后计算矿井向量空间中各个样本的密度,如果最大密度大于0.8×N/k,则将Eps减去一个固定值,优选的,该固定值为0.05,如果最大密度小于0.5×N/k,则将Eps加上一个该固定值,然后再次计算各个样本的密度,直至最大密度控制在0.8×N/k和0.5×N/k之间时结束。此时得到的Eps值为最终的Eps值。以该Eps值为密度半径计算并记录矿井向量空间中各个矿井向量的密度。
3)找出矿井向量空间中密度最大的样本点,记为aq(q=1,2,…,k),并将其加入到数据集合Aq(q=1,2,…,k)中,并将其从矿井向量空间中删除。
4)根据Aq中各个矿井向量与向量空间U中各个矿井向量之间的相似度,将向量空间U中与Aq中样本相似度最高的样本加入到集合Aq中去,同时将该样本从矿井向量空间U中删除,直到Aq中的样本个数不少于某一给定阈值,该阈值一般用β×N/k表示。
5)重复执行3)、4),并且规定,在第二次确定密度最大的样本点a2时,必须与第一次所确定的样本点a1之间相似度大于Eps,同样,在确定第三个密度最大的样本点a3时,必须要与前两次所确定的最大密度样本点a1、a2之间相似度均大于Eps,以此类推确定其余的aq(q=1,2,…,k)。每执行一次步骤3)和4),q值加1,直至q值大于k时结束,最终可得到A1,A2,…,Ak这k个数据集合。
6)分别对A1,A2,…,Ak各个数据集合计算其平均值,计算公式为其中且nm为数据集合Am中的样本个数,可得这k个向量。将这k个数据作为K-Means算法的初始聚类中心。
7)以作为初始聚类中心,分配使用余弦相似度方法计算矿井向量空间中各个矿井向量与这些聚类中心之间的相似度,确定时的则将加入到聚类中心所标明的类簇Sv中,其中1≤v≤k。
8)重新计算聚类中心。使用其中且n'm为数据集合Sm中的样本个数,即将得到的每个类簇中的所有样本点的均值作为新的聚类中心。
同时使用平方误差准则函数作为准则函数。
9)判断准则函数是否收敛,如果收敛则算法结束,否则返回7)继续执行。
最终可以得到k个类簇S1,S2,…,Sk,即完成对矿井向量空间的聚类。在该算法中对于初始聚类中心的选取着重从高密度点处出发,并且按照一定的顺序进行选取,从而初始聚类中心的选取更为准确。
Claims (3)
1.一种基于改进K-Means聚类的煤矿安全评价系统,包括矿井安全数据输入模块、基于改进的K-Means聚类的数据分析模块、结果输出模块;矿井安全数据输入模块接收用户提交的矿井安全状态数据,基于改进的K-Means聚类的数据分析模块根据矿井安全状态数据,采用改进的K-Means聚类方法进行数据分析,结果输出模块显示数据分析的结果;其特征在于:在基于改进的K-Means聚类的数据分析模块中,采用以下方法进行数据分析:
(1)数据准备:将第i个矿井Ki表示为向量形式其中xi1、xi2、xi3、xi4、xi5、xi6、xi7分别表示矿井Ki的通风安全监控数值、运输和提升数值、瓦斯和粉尘防治数值、矿井防火数值、井下爆破安全数值、矿井防冒顶数值、矿井防透水数值,得到N个矿井所对应的向量将其记录为一个矿井向量空间其中1≤i≤N,i为自然数,N为矿井个数;
(2)对数据使用改进的K-Means聚类:针对N个矿井向量使用改进的K-Means聚类进行聚类,步骤如下:
1)使用余弦定理计算矿井向量空间中两两之间的余弦相似度,即 确定任意两个矿井向量之间的相似度,其中1≤i≤N,1≤j≤N,i和j均为自然数;相似度评价时,两条矿井向量之间夹角的余弦值越接近于1,则这两个矿井安全评价数值的相似度越高;如果两条矿井向量之间夹角的余弦值越接近于0,则这两个矿井安全评价数值之间的相似度越低;
2)设置密度半径Eps,计算矿井向量空间中各个矿井向量的密度,其中密度半径Eps采用自适应方法产生,步骤如下:用N/k得到一个类中的近似平均样本数,乘以一个系数,使得最大密度控制在0.8×N/k和0.5×N/k之间,其中k为聚类的簇数目;
赋给Eps一个初始值,然后计算矿井向量空间中各个样本的密度,如果最大密度大于0.8×N/k,则将Eps减去一个固定值,如果最大密度小于0.5×N/k,则将Eps加上一个该固定值,然后再次计算各个样本的密度,直至最大密度控制在0.8×N/k和0.5×N/k之间时结束,此时得到的Eps值为最终的Eps值,以该Eps值为密度半径计算并记录矿井向量空间中各个矿井向量的密度;
3)找出矿井向量空间中密度最大的样本点,记为aq,并将其加入到数据集合Aq中,并将其从矿井向量空间中删除,其中q=1,2,…,k;
4)根据Aq中各个矿井向量与向量空间U中各个矿井向量之间的相似度,将向量空间U中与Aq中样本相似度最高的样本加入到集合Aq中去,同时将该样本从矿井向量空间U中删除,直到Aq中的样本个数不少于某一给定阈值,该阈值用β×N/k表示,其中0<β<1;
5)重复执行3)、4),在第二次确定密度最大的样本点a2时,必须与第一次所确定的样本 点a1之间相似度大于Eps,同样,在确定第三个密度最大的样本点a3时,必须要与前两次所确定的最大密度样本点a1、a2之间相似度均大于Eps,以此类推确定其余的aq;每执行一次步骤3)和4),q值加1,直至q值大于k时结束,最终可得到A1,A2,…,Ak这k个数据集合;
6)分别对A1,A2,…,Ak各个数据集合计算其平均值,计算公式为其中m=1,2,…,k,且nm为数据集合Am中的样本个数,可得这k个向量;将 这k个数据作为K-Means聚类的初始聚类中心;
7)以作为初始聚类中心,分配使用余弦相似度方法计算矿井向量空间 中各个矿井向量与这些聚类中心之间的相似度,确定 时的则将加入到聚类中心所标明的类簇Sv中,其中1≤v≤k;
8)重新计算聚类中心;使用其中且n′m为数据集合Sm中的样本个数,即将得到的每个类簇中的所有样本点的均值作为新的聚类中心;
同时使用平方误差准则函数作为准则函数;
9)判断准则函数是否收敛,如果收敛则算法结束,否则返回7)继续执行;最终可以得到k个类簇S1,S2,…,Sk,完成对矿井向量空间的聚类。
2.根据权利要求1所述的基于改进K-Means聚类的煤矿安全评价系统,其特征在于:所述系数为0.8或0.5。
3.根据权利要求1所述的基于改进K-Means聚类的煤矿安全评价系统,其特征在于:所述的固定值为0.05。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410041849.3A CN103729798B (zh) | 2014-01-29 | 2014-01-29 | 基于改进的K-Means聚类的煤矿安全评价系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410041849.3A CN103729798B (zh) | 2014-01-29 | 2014-01-29 | 基于改进的K-Means聚类的煤矿安全评价系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103729798A CN103729798A (zh) | 2014-04-16 |
CN103729798B true CN103729798B (zh) | 2017-01-11 |
Family
ID=50453859
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410041849.3A Expired - Fee Related CN103729798B (zh) | 2014-01-29 | 2014-01-29 | 基于改进的K-Means聚类的煤矿安全评价系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103729798B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104850998B (zh) * | 2015-04-15 | 2018-11-02 | 浙江大学 | 一种基于聚类的移动应用下载量预测方法 |
CN110399549A (zh) * | 2018-04-24 | 2019-11-01 | 河南理工大学 | 一种面向用户兴趣调和相似度的协同过滤方法 |
CN110717033A (zh) * | 2018-06-26 | 2020-01-21 | 百度在线网络技术(北京)有限公司 | 文本分类噪声监测方法、装置、设备及计算机可读介质 |
CN109389178A (zh) * | 2018-10-26 | 2019-02-26 | 深圳市元征科技股份有限公司 | 一种维修厂评级方法、系统及电子设备和存储介质 |
CN109885685A (zh) * | 2019-02-01 | 2019-06-14 | 珠海世纪鼎利科技股份有限公司 | 情报数据处理的方法、装置、设备及存储介质 |
CN111163075B (zh) * | 2019-12-25 | 2022-04-12 | 北京科东电力控制系统有限责任公司 | 电力监控系统设备性能指标阈值动态调整方法 |
CN111580500B (zh) * | 2020-05-11 | 2022-04-12 | 吉林大学 | 一种针对自动驾驶汽车安全性的评价方法 |
CN114997742B (zh) * | 2022-07-19 | 2022-11-08 | 煤炭科学研究总院有限公司 | 基于注意力机制和聚类算法的微震事件危险性分析方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103368979A (zh) * | 2013-08-08 | 2013-10-23 | 电子科技大学 | 一种基于改进K-means算法的网络安全性验证装置 |
-
2014
- 2014-01-29 CN CN201410041849.3A patent/CN103729798B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103368979A (zh) * | 2013-08-08 | 2013-10-23 | 电子科技大学 | 一种基于改进K-means算法的网络安全性验证装置 |
Non-Patent Citations (2)
Title |
---|
基于K-means聚类分析的地铁施工风险评价方法;侯寒冰等;《中国房地产业》;20110430(第4期);全文 * |
基于K-Means聚类的瓦斯浓度预测;穆文瑜等;《计算机应用》;20110331;第31卷(第3期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN103729798A (zh) | 2014-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103729798B (zh) | 基于改进的K-Means聚类的煤矿安全评价系统 | |
Yang et al. | Assessment and optimization of provincial CO2 emission reduction scheme in China: an improved ZSG-DEA approach | |
US20210209263A1 (en) | Tunnel tunneling feasibility prediction method and system based on tbm rock-machine parameter dynamic interaction mechanism | |
Faradonbeh et al. | Genetic programming and gene expression programming for flyrock assessment due to mine blasting | |
CN107122861B (zh) | 一种基于pca-pso-elm的瓦斯涌出量预测方法 | |
BR102019022525A2 (pt) | método e sistema de monitoramento e otimização online das operações de mineração e processamento de minérios | |
CN110874744B (zh) | 一种数据异常检测方法及装置 | |
CN110472363B (zh) | 适用于高速铁路隧道的围岩变形等级预测方法及系统 | |
CN102799778B (zh) | 一种优化锅炉负荷分配方法 | |
Majdi et al. | Applying evolutionary optimization algorithms for improving fuzzy C-mean clustering performance to predict the deformation modulus of rock mass | |
CN109934398A (zh) | 一种钻爆法施工隧道瓦斯危险等级预测方法和装置 | |
Zhang et al. | Geological Type Recognition by Machine Learning on In‐Situ Data of EPB Tunnel Boring Machines | |
WO2019091134A1 (zh) | 煤层顶板砂岩富水性等级预测方法 | |
CN106484838A (zh) | 基于数据挖掘的安全检查标准库动态更新方法 | |
CN103198362A (zh) | 一种煤矿安全评估的方法 | |
Jin et al. | Microseismicity-based short-term rockburst prediction using non-linear support vector machine | |
CN106447240A (zh) | 一种基于模糊聚类的矿井安全评价方法 | |
CN102323998A (zh) | 一种校核矿井巷道摩擦风阻值的方法 | |
Lin et al. | A multilevel recognition model of water inrush sources: a case study of the Zhaogezhuang mining area | |
Xu et al. | RETRACTED ARTICLE: Source discrimination of mine water inrush based on Elman neural network globally optimized by genetic algorithm | |
CN117522151A (zh) | 煤矿企业安全风险评估方法及系统 | |
JP2003132296A (ja) | 建物の地震被害予測方法,それに用いる最適条件決定処理方法およびそれらのプログラム | |
CN104463137B (zh) | 基于特征空间分裂的异常人脸图像检测方法及系统 | |
Zhao et al. | Combining Drilling Big data and machine learning method to improve the timeliness of drilling | |
CN103093390A (zh) | 一种基于联合聚类的煤矿安全评价系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170111 Termination date: 20210129 |