一种矿山竖井井筒检测系统及方法
技术领域
本发明涉及数字数据处理技术领域,具体涉及一种矿山竖井井筒检测系统及方法。
背景技术
竖井是煤炭开采中常用的一种重要运输方式,但是竖井容易受到环境的影响,致使竖井产生变形,进而有较大的可能出现卡罐、掉罐等重大安全事故。为了让竖井中的罐笼安全的运行,往往需要对矿山竖井井筒进行实时的监测,当出现异常情况时及时对井筒进行检修,避免影响煤炭开采的进度。
目前,为了全方面监控矿山竖井井筒的环境参数,往往利用传感器技术实时的采集环境参数的相关数据,在线对环境参数的数据进行异常分析,当出现异常情况时做出相应的预警,及时的进行检修。为了检测出环境参数的异常情况,往往利用异常检测算法,比如LOF异常检测算法,能够识别环境的异常情况。但是,由于需要实时的监测井筒环境参数的相关数据并进行异常处理,而井筒环境参数的相关数据往往是大量的,当出现少部分异常数据,LOF异常检测算法无法准确并及时的识别异常数据,进行无法及时识别井筒环境参数的异常情况。
发明内容
本发明提供一种矿山竖井井筒检测系统及方法,以解决异常数据的准确性较低的问题,所采用的技术方案具体如下:
第一方面,本发明一个实施例提供了一种矿山竖井井筒检测方法,该方法包括以下步骤:
获取环境参数数据,利用环境参数数据构建环境参数的时间序列;
根据每个环境参数的时间序列获取每个环境参数的变化率序列及每个环境参数的变化率序列中的趋势序列;根据每个环境参数的变化率序列中的趋势序列获取每个环境参数的每个采集时刻的环境状态稳定度;根据每个环境参数的时间序列获取每个环境参数的环境参数差分序列及异常特征序列,根据每个环境参数的异常特征序列获取每个环境参数的异常特征序列中每个数据点的异变定位距离序列,根据每个环境参数的时间序列获取每个环境参数的每个采集时刻的环境状态序列;根据每个环境参数的异常特征序列中每个数据点的异变定位距离序列获取每个环境参数的每个采集时刻的环境异常变化指数;
利用离散傅里叶变换获取每个环境参数的每个采集时刻的频域数据,根据每个环境参数的每个采集时刻的频域数据获取每个环境参数的每个采集时刻的能量衰减序列;根据每个环境参数的每个采集时刻的能量衰减序列获取每个环境参数的每个采集时刻的信号衰减异常系数;根据每个环境参数的每个采集时刻的信号衰减异常系数及环境异常变化指数获取每个环境参数的收缩因子;
根据每个环境参数的收缩因子获取每个环境参数的聚类结果,将环境参数的聚类结果中差异最大的聚类簇作为异常聚类簇,对异常聚类簇中数据的采集时刻对矿山竖井井筒的环境异常进行报警。
优选的,所述根据每个环境参数的时间序列获取每个环境参数的变化率序列及每个环境参数的变化率序列中的趋势序列的方法为:
对于每个环境参数的时间序列,将环境参数的时间序列中时间序列数据的采集时刻作为自变量,将环境参数的时间序列中时间序列数据作为因变量,利用最小二乘非线性拟合算法获取环境参数的环境参数拟合函数;
对于每个环境参数的环境参数拟合函数,获取环境参数拟合函数在每个采集时刻的一阶导数值,将每个采集时刻的一阶导数值作为每个采集时刻的异常变化率,将环境参数的所有异常变化率按照采集时刻升序的顺序组成的序列作为环境参数的变化率序列;
对于每个环境参数的变化率序列,将变化率序列中每次出现处于相同正负关系的相邻元素组成的窗口作为每个趋势窗口,将每个趋势窗口中的异常变化率按照采集时刻升序组成的序列作为每个趋势序列。
优选的,所述根据每个环境参数的变化率序列中的趋势序列获取每个环境参数的每个采集时刻的环境状态稳定度的计算方法为:
式中,表示第i个环境参数的第j个采集时刻的环境状态稳定度,/>表示第i个环境参数的变化率序列中第j个采集时刻的数据点所属的趋势序列中的数据数目,/>表示第i个环境参数的变化率序列中第j个采集时刻的数据点所属的趋势序列中的第b个数据数值,/>和/>分别表示第i个环境参数的变化率序列中第j个采集时刻的数据点所属的趋势序列中最大数值、最小数值,/>表示第i个环境参数的变化率序列中第j个采集时刻的数据点数值,b表示第i个环境参数的变化率序列中第j个采集时刻的数据点所属的趋势序列中的数据的次序,其中b=1,2,…,m。
优选的,所述根据每个环境参数的时间序列获取每个环境参数的环境参数差分序列及异常特征序列,根据每个环境参数的异常特征序列获取每个环境参数的异常特征序列中每个数据点的异变定位距离序列,根据每个环境参数的时间序列获取每个环境参数的每个采集时刻的环境状态序列的方法为:
对于每个环境参数的时间序列,获取时间序列中相邻两个采集时刻的时间序列数值之间的差值,将所有所述差值按照时间升序的顺序组成的序列作为环境参数的环境参数差分序列;
对于每个环境参数的环境参数差分序列,将预设参数添加作为环境参数差分序列的第一个元素,将环境参数差分序列的添加后的结果作为环境参数的异常特征序列;
对于每个环境参数的异常特征序列,利用pettitt突变点检测算法获取异常特征序列的突变点,将所述异常特征序列的突变点按照数值由小到大的顺序组成的序列作为突变特征序列;
对于每个环境参数的异常特征序列中每个数据点,计算数据点与突变特征序列中每个数据点之间的欧氏距离,将所述欧氏距离按照数值由小到大的顺序组成的序列作为数据点的异变定位距离序列;
对于每个环境参数的时间序列,将时间序列中每个数据点作为每个中心数据点,将每个中心数据点的采集时刻最近的第一预设参数个采集时刻的数据点组成的集合作为每个中心数据点的时间段数据集,将每个中心数据点的时间段数据集内的数据按照采集时刻升序的顺序组成的序列作为每个数据点的时间段数据序列;将每个数据点的时间段数据序列的每个元素替换成每个元素对应采集时刻的环境状态稳定度,将所述替换后的结果作为每个环境参数的每个采集时刻的环境状态序列。
优选的,所述根据每个环境参数的异常特征序列中每个数据点的异变定位距离序列获取每个环境参数的每个采集时刻的环境异常变化指数的方法为:
式中,表示第i个环境参数的时间序列中第j个数据点的时间段数据序列中第s个数据点的环境异常指数,/>表示第i个环境参数的时间序列中第j个数据点的时间段数据序列内数据数目,/>为/>距离函数,/>和/>分别表示第i个环境参数的时间序列中第j个数据点的时间段数据序列中第s、第g个数据点的异常定位距离序列,/>表示第i个环境参数的时间序列中第j个数据点的时间段数据序列中第s、第g个数据点的异常定位距离序列之间的/>距离,/>表示一种判断准则,即当/>时,/>取值为0;当/>时,/>取值为1,/>为以自然常数为底数的指数函数,/>表示第i个环境参数的时间序列中第j个数据点的时间段数据序列中第g个数据点的采集时刻的环境状态稳定度,/>表示第i个环境参数的第j个采集时刻的环境异常变化指数,/>表示第i个环境参数的第j个采集时刻的环境状态序列中数据的变异系数。
优选的,所述利用离散傅里叶变换获取每个环境参数的每个采集时刻的频域数据,根据每个环境参数的每个采集时刻的频域数据获取每个环境参数的每个采集时刻的能量衰减序列的方法为:
对于每个环境参数的每个采集时刻的环境状态序列,利用离散傅里叶变换获取环境状态序列的频域数据;
对于每个环境参数的每个采集时刻的频域数据,将基频分量右侧频域能量高于第一预设阈值的频率分量组成的集合作为频域数据集合,将所述频域数据集合中频域分量的频域能量按照频率分量升序的顺序组成的序列作为能量衰减序列。
优选的,所述根据每个环境参数的每个采集时刻的能量衰减序列获取每个环境参数的每个采集时刻的信号衰减异常系数的方法:
式中,表示第i个环境参数的第j个采集时刻的信号衰减异常系数,/>表示第i个环境参数的第j个采集时刻的环境状态序列的能量衰减序列中数据数目,/>为以自然常数为底数的指数函数,/>和/>分别表示第i个环境参数的第j个采集时刻的环境状态序列的能量衰减序列中第/>、第/>个数据数值。
优选的,所述根据每个环境参数的每个采集时刻的信号衰减异常系数及环境异常变化指数获取每个环境参数的收缩因子的方法:
式中,表示第i个环境参数的第j个采集时刻的环境异变指数,/>为以自然常数为底数的指数函数,/>表示第i个环境参数的第j个采集时刻的环境异常变化指数,/>表示第i个环境参数的第j个采集时刻的信号衰减异常系数,/>表示第i个环境参数的收缩因子,/>表示环境参数的时间序列中采集时刻的数量。
优选的,所述根据每个环境参数的收缩因子获取每个环境参数的聚类结果的方法为:
对于每个环境参数,将环境参数的采集数据作为原始数据集,将原始数据集、预设簇数目、预设代表点个数以及环境参数的收缩因子作为算法的输入,利用CURE层次聚类算法获取环境参数的采集数据的聚类结果。
第二方面,本发明实施例还提供了一种矿山竖井井筒检测系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一项方法的步骤。
本发明的有益效果是:本发明基于矿山竖井井筒的环境状态的稳定特征以及正常特征进行分析,同时结合环境参数异常时频域数据的能量变化,考虑环境参数的时间序列数据异常时对CURE聚类算法的影响,自适应环境参数的收缩因子,利用CURE聚类算法获取聚类结果。其有益效果在于,结合时域以及频域的数据特征自适应收缩因子,使收缩因子的完备性更强,同时考虑异常对数据收缩的影响,使CURE聚类精度更加准确,从而使后续获取的异常数据更加准确。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一个实施例所提供的一种矿山竖井井筒检测方法的流程示意图;
图2为本发明一个实施例所提供的一种矿山竖井井筒检测方法的具体实施流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,其示出了本发明一个实施例提供的一种矿山竖井井筒检测方法流程图,该方法包括以下步骤:
步骤S001,获取环境参数的时间序列。
为了全面的监控矿山竖井井筒的环境参数,本发明通过安装在罐笼顶部的多功能传感器获取相关环境参数的数据,所述多功能传感器为温度传感器、湿度传感器、甲烷传感器以及一氧化碳传感器为一体的多功能传感器,所述相关环境参数包括罐笼所在位置的温度、湿度、甲烷浓度以及一氧化碳浓度。由于需要实时的检测矿山竖井井筒的异常情况,本发明中数据的采集的过程是不间断的,本发明数据采集的时间间隔为t,t的经验取值为5s,实施者可以根据具体情况自行选择。为了实时的监测竖井井筒的环境参数,本发明对每500次相邻时间点采集的环境参数数据进行一次处理。对于每500次相邻采集时刻采集的环境参数数据,为了避免不同环境参数数据之间量纲对分析结果的影响,对每个环境参数的采集数据进行归一化处理,将归一化处理后的环境参数数据按照时间升序的顺序组成的序列作为环境参数的时间序列。
所述每个环境参数的时间序列为:
式中,表示第i个环境参数的时间序列,/>和/>分别表示第i个环境参数的第1、第n的采集时刻的采集数据的归一化结果。
至此,获取每个环境参数的时间序列。
步骤S002,根据环境参数的时间序列获取环境参数的变化率序列,根据环境参数的变化率序列获取环境状态稳定度,根据环境参数的时间序列获取环境参数的环境参数差分序列,根据环境参数的环境参数差分序列中数据变化规律并结合环境状态稳定度获取环境异常变化指数。
由于每个环境参数一定程度上环境变化的异常信息,本发明从每一个参数的时间序列数据出发进行分析,本发明的具体实施流程图如图2所示。
一般情况下,矿山竖井井筒的环境变化较为平缓,这属于正常变化现象。但是,由于环境出现的异常,会导致环境出现相对急剧性的异常变化,此时时间序列中数据的波动变化程度较大。
为了区分矿山竖井井筒环境的正常变化与异常变化特征,根据每个环境参数的时间序列数据,将环境参数的时间序列中的数据的采集时刻作为自变量,将环境参数中时间序列的数据作为因变量,利用最小二乘非线性拟合算法获取每个环境参数的环境参数拟合函数,最小二乘非线性拟合算法为公知技术,不做多余赘述。根据每个环境参数的环境参数拟合函数,对于环境参数拟合函数中的每个采集时刻,求取采集时刻的一阶导数值,将一阶导数值作为对应采集时刻的异常变化率,异常变化率一定程度上能够反映环境参数的异常变化信息。
根据所获异常变化率,将每个环境参数的异常变化率按照采集时刻升序的顺序组成的序列作为每个环境参数的变化率序列。每个环境参数的变化率序列中的异常变化率为矢量,异常变化率的大小反映环境参数异常变化的大小,并且变量率序列中的趋势性变化一定程度上也反映了环境参数异常变化的大小。因此,对于每个环境参数的变化率序列,将变化率序列中每个同一正负的局部数据序列作为每个趋势窗口,将每个趋势窗口内的序列作为每个趋势序列。比如,变化率序列为,将/>作为第1个趋势窗口的趋势序列,将/>作为第2个趋势窗口的趋势序列,以此类推。
计算每个环境参数的每个采集时刻的环境状态稳定度:
式中,表示第i个环境参数的第j个采集时刻的环境状态稳定度,/>表示第i个环境参数的变化率序列中第j个采集时刻的数据点所属的趋势序列中的数据数目,/>表示第i个环境参数的变化率序列中第j个采集时刻的数据点所属的趋势序列中的第b个数据数值,/>和/>分别表示第i个环境参数的变化率序列中第j个采集时刻的数据点所属的趋势序列中最大数值、最小数值,/>表示第i个环境参数的变化率序列中第j个采集时刻的数据点数值,b表示第i个环境参数的变化率序列中第j个采集时刻的数据点所属的趋势序列中的数据的次序,其中b=1,2,…,m。
第i个环境参数的变化率序列中第j个采集时刻的数据点所属的趋势序列中的第b个数据数值的绝对值越小,即累加和越大,说明数据所在的趋势序列中数据的趋势性越弱,环境参数的监控数据越稳定,则环境状态稳定度越大。同时,第i个环境参数的变化率序列中第j个数据所属的趋势序列中最大数值的绝对值与最小数值的绝对值之间的差异/>越小,且第i个环境参数的变化率序列中第j个数据数值的绝对值越小,说明数据所属的趋势序列中数据的变化越小,原时间序列数据的变化程度越小,则环境状态稳定度越大。
进一步地,数据变化出现异常时,局部的数据变化差异较大,为了避免原始时间序列数据大小对异常变化分析的影响,对每个环境参数的时间序列中相邻采集时刻的数据数值做差值获取环境参数差分序列。比如,对于第i个环境参数的时间序列,将时间序列中的第2个数据数值减去第1个数据的差值作为环境参数差分序列中第1个差分数值,将时间序列中的第3个数据数值减去第2个数据的差值作为环境参数差分序列中第2个差分数值,将时间序列中的第4个数据数值减去第3个数据的差值作为环境参数差分序列中第3个差分数值,以此类推;将所述差分数值排序后的序列作为环境参数的环境参数差分序列。
进一步地,根据每个环境参数的环境参数差分序列,由于环境参数差分序列是通过时间序列相邻采集时刻的数据求差值得到的,即环境参数差分序列的长度比时间序列的长度少一个。由于环境参数的时间序列中第1个采集时刻的数据数值,作为时间序列的首个数据,其存在的异常变化的可能性较小,因此本发明将零数定义为环境参数的时间序列中第1个采集时刻的数据数值对应的差分数值,将零数添加到每个环境参数的环境参数差分序列的开头,将环境参数差分序列的添加后的结果作为每个环境参数的异常特征序列。
进一步地,对于每个环境参数的异常特征序列,利用pettitt突变点检测算法获取每个环境参数的异常特征序列中的突变点,pettitt突变点检测算法为公知技术,不做多余赘述。对于每个环境参数的异常特征序列中突变点数据,将突变点数据按照数值由小到大的顺序组成的序列作为环境参数的突变特征序列。对于环境参数的异常特征序列中每个数据点,分别计算数据点与对应环境参数的突变特征序列中所有数据点之间的欧氏距离,将欧氏距离按照由小到大的顺序组成的序列作为数据点的异变定位距离序列。
具体地,为了便于不同采集时刻时的环境参数的异常特征变化,对于每个环境参数的时间序列中每个数据点,将数据点作为中心数据点,将中心数据点的采集时刻的最近的k个采集时刻的数据点的作为中心数据点的时间段数据点,k的经验取值为20,将每个中心数据点的时间段数据点按照时间升序的方式组成的序列作为每个中心数据点的时间段数据序列,将时间段数据序列中每个元素替换成对应的环境状态稳定度的结果作为中心数据点对应采集时刻的环境状态序列。
计算每个环境参数的每个采集时刻的环境异常变化指数:
式中,表示第i个环境参数的时间序列中第j个数据点的时间段数据序列中第s个数据点的环境异常指数,/>表示第i个环境参数的时间序列中第j个数据点的时间段数据序列内数据数目,/>为/>距离函数,/>和/>分别表示第i个环境参数的时间序列中第j个数据点的时间段数据序列中第s、第g个数据点的异常定位距离序列,/>表示第i个环境参数的时间序列中第j个数据点的时间段数据序列中第s、第g个数据点的异常定位距离序列之间的/>距离,/>表示一种判断准则,即当/>时,/>取值为0;当当/>时,/>取值为1,/>为以自然常数为底数的指数函数,/>表示第i个环境参数的时间序列中第j个数据点的时间段数据序列中第g个数据点对应采集时刻的环境状态稳定度,/>表示第i个环境参数的第j个采集时刻的环境异常变化指数,/>表示第i个环境参数的时间序列中第j个数据点的环境状态序列中数据的变异系数,变异系数为公知技术,不做多余赘述。
第i个环境参数的时间序列中第j个数据点的时间段数据序列中第s个数据点与第g个数据点的异常定位距离序列之间的距离/>越大,说明异常定位距离序列之间的相似性越小,即监控参数的异常程度越大,则环境异常变化指数越大。同时,第i个环境参数的时间序列中第j个数据点的时间段数据序列中第g个数据点对应采集时刻的环境状态稳定度/>越小,并且第i个环境参数的时间序列中第j个数据点的环境状态序列中数据的变异系数/>越大,说明环境参数的稳定程度越小,即异常程度越大,局部的异常信息越丰富,则环境异常变化指数越大。
步骤S003,利用离散傅里叶变换获取频域数据,根据频域数据构建能量衰减序列,根据能量衰减序列获取信号衰减异常系数,根据信号衰减异常系数以及环境异常变化指数获取收缩因子。
结合原时间序列数据的频域特征,对于每个环境参数的每个采集时刻的环境状态序列,利用离散傅里叶变换获取环境状态序列的频域数据,离散傅里叶变换为公知技术,不做多余赘述。由于当环境状态序列中数据的正常变化时,即局部采集时刻的数据没有发生异常变化,频域数据在频谱图中的表现结果为从基频分量向两侧频率分量呈现能量逐级衰减的特征。但是,当环境状态序列中数据的出现异常变化时,能量逐级衰减的特征将会被打破。
由于单侧的频率分量的能量变化规律便可以反映数据的异常信息,并且频率分量在频域空间中是无限的,本发明只取基频分量右侧的频域数据,同时以基频分量的频域能量衰减10db时的频域能量为筛选阈值,只分析基频分量的右侧频率分量高于筛选阈值的频域分量数据。根据所述基频分量的右侧频率分量高于筛选阈值的频率分量组成的集合作为频域数据集合,将所述频域数据集合中频域分量的频域能量按照频率分量升序的顺序组成的序列作为能量衰减序列。
计算每个环境参数的每个采集时刻的信号衰减异常系数:
式中,表示第i个环境参数的第j个采集时刻的信号衰减异常系数,/>表示第i个环境参数的第j个采集时刻的环境状态序列的能量衰减序列中数据数目,/>为以自然常数为底数的指数函数,/>和/>分别表示第i个环境参数的第j个采集时刻的环境状态序列的能量衰减序列中第/>、第/>个数据数值。
第i个环境参数的第j个采集时刻的环境状态序列的能量衰减序列中第个数据点的数据数值与第/>个数据数值之间的差值/>越大,说明能量衰减序列中后一个频率分量的频域能量与前一个频率分量的频域能量之间的差值越大,即能量衰减的特征越小,频域数据的异常程度越大,则信号衰减异常系数越大。
进一步地,结合时间序列的时域特征以及频域特征,通过计算每个环境参数时间序列中每个采集时刻的环境异变指数,更进一步获取每个环境参数的收缩因子,进而利用CURE层次聚类算法,使每个环境参数的时间序列数据得到更好的聚类结果。
计算每个环境参数的收缩因子:
式中,表示第i个环境参数的第j个采集时刻的环境异变指数,/>为以自然常数为底数的指数函数,/>表示第i个环境参数的第j个采集时刻的环境异常变化指数,/>表示第i个环境参数的第j个采集时刻的信号衰减异常系数,/>表示第i个环境参数的收缩因子,/>表示环境参数的时间序列中采集时刻的数量。
第i个环境参数的第j个采集时刻的环境异常变化指数越大,第i个环境参数的第j个采集时刻的信号衰减异常系数/>越大,说明时间序列中该数据点出现的异常程度越大,则环境异变指数越大。另外,环境参数中时间序列中所有采集时刻的均值一定程度上反映数据的分布特征,环境异变指数越大,说明环境参数出现异常的程度越大,即数据之间的紧密性越小,则环境参数的收缩因子越趋近于1;环境异变指数越小,由于正常情况下矿山竖井井筒的环境较为稳定,此时出现的异常程度较小,即数据之间的紧密性越大,则环境参数的收缩因子越趋近于0。
至此,得到每个环境参数的收缩因子。
步骤S004,根据收缩因子获取环境参数的聚类结果,根据环境参数的聚类结果获取异常聚类簇,根据异常聚类簇在线对矿山竖井井筒的环境异常进行报警。
对于每个环境参数,将环境参数的采集数据作为原始数据集,簇数目设置为10,代表点个数设置为16,以及自适应环境参数的收缩因子,将原始数据集、簇数目、代表点个数以及自适应的收缩因子作为算法的输入,利用CURE层次聚类算法获取环境参数的采集数据的聚类结果。
对于所获每个环境参数聚类结果中的聚类簇,由于出现异常的聚类簇与正常的聚类簇之间的差异较大,计算每个聚类簇与其他所有聚类簇之间的簇间方差,将簇间方差最大的聚类簇作为异常聚类簇,簇间方差为公知技术,不做多余赘述。
将每个环境参数的异常聚类簇中的异常数据保存到监控系统中,并对异常聚类簇中异常数据对应的采集时刻进行报警。当发现异常情况时及时对矿山竖井井筒进行检修,避免影响煤炭开采的进度。
基于与上述方法相同的发明构思,本发明实施例还提供了一种矿山竖井井筒检测系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述一种矿山竖井井筒检测方法中任意一项所述方法的步骤。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。