CN116910590A

CN116910590A - 基于自适应聚类的瓦斯传感器精度异常识别方法及系统

Info

Publication number: CN116910590A
Application number: CN202310901824.5A
Authority: CN
Inventors: 王自力; 胡代军; 郭宇; 方方; 王东升; 张英杰; 丁宁; 韩柳; 王梓又; 杨吉琦; 黄兰; 彭泽定; 刘权毅; 魏恩容; 陈俊雄; 李柯; 王琴; 唐琴; 凌飞; 郭珂邑
Original assignee: Sichuan Anxin Kechuang Technology Co ltd; Sichuan safety science and technology research institute
Current assignee: Sichuan Anxin Kechuang Technology Co ltd; Sichuan safety science and technology research institute
Priority date: 2023-07-21
Filing date: 2023-07-21
Publication date: 2023-10-20

Abstract

本发明公开了基于自适应聚类的瓦斯传感器精度异常识别方法及系统，该方法包括：获取历史瓦斯浓度检测数据，并对所述历史瓦斯浓度检测数据进行预处理，得到预处理后的历史瓦斯浓度检测数据；构建瓦斯数据自适应聚类模型；采用所述瓦斯数据自适应聚类模型，对预处理后的历史瓦斯浓度检测数据进行聚类处理和异常判断，得到基于自适应聚类的瓦斯传感器精度识别模型；采用所述基于自适应聚类的瓦斯传感器精度识别模型，对待判别瓦斯浓度检测数据进行瓦斯浓度传感器精度异常识别。本发明识别准确性高，使得煤矿企业准确掌握矿井中各个传感器的精度状况，进而避免生产隐患。

Description

基于自适应聚类的瓦斯传感器精度异常识别方法及系统

技术领域

本发明涉及煤矿生产状态监测、数据挖掘技术领域，具体涉及基于自适应聚类的瓦斯传感器精度异常识别方法及系统。

背景技术

煤炭是我国工业化进程中的基础性能源，且以煤为主的能源结构将长期存在，煤矿安全日益受到重视。传统的瓦斯传感器常常存在很多非线性因素，在使用时需调零和校正灵敏度，给安全监测工作带来了很大困难。

然而，现有技术瓦斯传感器精度异常识别方法并没有考虑瓦斯检测数据的平稳性和渐变性等特性，造成识别准确性不高，带来煤炭安全生产隐患。因此，缺乏一种行之有效的煤矿瓦斯传感器精度异常识别方法，使得煤矿企业准确掌握矿井中各个传感器的精度状况，进而避免生产隐患。

发明内容

本发明所要解决的技术问题是现有技术瓦斯传感器精度异常识别方法并没有考虑瓦斯检测数据的平稳性和渐变性等特性，造成识别准确性不高，带来煤炭安全生产隐患。目的在于提供基于自适应聚类的瓦斯传感器精度异常识别方法及系统，本发明考虑了瓦斯检测数据的平稳性和渐变性，且瓦斯浓度数据突变点少等特点，提出一种行之有效的基于自适应聚类的瓦斯传感器精度异常识别方法，识别准确性高，使得煤矿企业准确掌握矿井中各个传感器的精度状况，进而避免生产隐患。

本发明通过下述技术方案实现：

第一方面，本发明提供了基于自适应聚类的瓦斯传感器精度异常识别方法，该方法包括：

获取历史瓦斯浓度检测数据，并对历史瓦斯浓度检测数据进行预处理，得到预处理后的历史瓦斯浓度检测数据；

构建瓦斯数据自适应聚类模型；采用瓦斯数据自适应聚类模型，对预处理后的历史瓦斯浓度检测数据进行聚类处理和异常判断，得到基于自适应聚类的瓦斯传感器精度识别模型；

采用基于自适应聚类的瓦斯传感器精度识别模型，对待判别瓦斯浓度检测数据进行瓦斯浓度传感器精度异常识别。

进一步地，预处理包括：

采用箱线图法，对历史瓦斯浓度检测数据进行异常值查找并剔除；以及

采用多重比较法，对历史瓦斯浓度检测数据进行异常点查找并插值替换。

进一步地，所述的采用瓦斯数据自适应聚类模型，对预处理后的历史瓦斯浓度检测数据进行聚类处理，包括：

记作预处理后的历史瓦斯浓度检测数据为瓦斯数据集X，从瓦斯数据集X中抽取前序数据集X_pre，其中，

采用轮廓系数法则，确定前序数据集X_pre中的聚类中心数量k；其中，聚类中心数量k为轮廓系数最大的类别数；

根据聚类中心数量k，对前序数据集X随机确定k个聚类簇心；根据每个聚类集合中所包含的瓦斯数据，采用簇内点密度方法计算各个簇的吸引密度；

根据各个簇的吸引密度，采用准则函数更新迭代簇心值，直至确定最终聚类结果，得到前序数据子集的最终聚类中心集合。

进一步地，所述的采用轮廓系数法则，确定前序数据集X_pre中的聚类中心数量k，具体步骤为：

分别计算样本i到同簇其他样本的平均距离a_i，样本i到其他某簇C_j的所有样本的平均距离b_ij；

根据平均距离b_ij，采用不相似度计算公式定义样本i的簇间不相似度；不相似度计算公式为b_i＝min(b_i1,b_i2,...,b_ik)，其中，b_i为样本i的簇间不相似度；

根据簇间不相似度和样本i到同簇其他样本的平均距离a_i，计算样本i的轮廓系数s(i)，

根据样本i的轮廓系数，得到整个聚类结果的轮廓系数s，

进一步地，簇内点密度方法的计算公式为：

其中，θ是簇的吸引密度；R_i是簇内各点到簇中心的距离；n是簇内点个数；d_ij是第i个瓦斯检测值和第j个瓦斯检测值的距离，ρ_i是第i个点的质量。

进一步地，准则函数为：

其中，x_i表示待聚类数据，c_i表示第i类聚类中心，var(c_i)表示c_i的评价值。

进一步地，所述的采用基于自适应聚类的瓦斯传感器精度识别模型，对待判别瓦斯浓度检测数据进行瓦斯浓度传感器精度异常识别，包括：

若待判别瓦斯浓度检测数据和其对应的聚类中心的距离大于第一设定阈值，则判断该瓦斯浓度检测数据为离群值；

统计待判别瓦斯浓度检测数据中离群点的比例，根据离群点的比例进行判断：若离群点的比例大于第二设定阈值(比如2％)，则提报传感器精度异常；若离群点的比例小于等于第二设定阈值(比如2％)，则传感器精度正常，不提报。

进一步地，第一设定阈值的确定方法为：对于预处理后的瓦斯浓度检测数据，则认为是没有离群数据标识的数据集，通过计算每个簇的平均距离与2倍标准差之和作为第一设定阈值。

第二方面，本发明又提供了基于自适应聚类的瓦斯传感器精度异常识别系统，该系统用于实现所述的基于自适应聚类的瓦斯传感器精度异常识别方法；该系统包括：

获取单元，用于获取历史瓦斯浓度检测数据及待判别瓦斯浓度检测数据；

预处理单元，用于对历史瓦斯浓度检测数据及待判别瓦斯浓度检测数据进行预处理，得到预处理后的历史瓦斯浓度检测数据和预处理后的待判别瓦斯浓度检测数据；

构建及自适应聚类单元，用于构建瓦斯数据自适应聚类模型，采用瓦斯数据自适应聚类模型，对预处理后的历史瓦斯浓度检测数据进行聚类处理和异常判断，得到基于自适应聚类的瓦斯传感器精度识别模型；

异常识别单元，用于采用基于自适应聚类的瓦斯传感器精度识别模型，对待判别瓦斯浓度检测数据进行瓦斯浓度传感器精度异常识别。

进一步地，构建及自适应聚类单元包括：

抽取子单元，用于记作预处理后的历史瓦斯浓度检测数据为瓦斯数据集X，从瓦斯数据集X中抽取前序数据集X_pre，其中，

轮廓系数计算子单元，用于采用轮廓系数法则，确定前序数据集X_pre中的聚类中心数量k；其中，聚类中心数量k为轮廓系数最大的类别数；

簇吸引密度计算子单元，用于根据聚类中心数量k，对前序数据集X随机确定k个聚类簇心；根据每个聚类集合中所包含的瓦斯数据，采用簇内点密度方法计算各个簇的吸引密度；

迭代更新子单元，用于根据各个簇的吸引密度，采用准则函数更新迭代簇心值，直至确定最终聚类结果，得到前序数据子集的最终聚类中心集合。

本发明与现有技术相比，具有如下的优点和有益效果：

本发明基于自适应聚类的瓦斯传感器精度异常识别方法及系统，本发明考虑了瓦斯检测数据的平稳性和渐变性，且瓦斯浓度数据突变点少等特点，提出一种行之有效的基于自适应聚类的瓦斯传感器精度异常识别方法，识别准确性高，使得煤矿企业准确掌握矿井中各个传感器的精度状况，进而避免生产隐患。另外，本发明聚类结果通过步骤②至步骤④分别设计相应方法消除同时受到簇类数量与初始中心的选择影响的问题。

附图说明

此处所说明的附图用来提供对本发明实施例的进一步理解，构成本申请的一部分，并不构成对本发明实施例的限定。在附图中：

图1为本发明基于自适应聚类的瓦斯传感器精度异常识别方法流程图；

图2为本发明基于自适应聚类的瓦斯传感器精度异常识别方法的详细流程图；

图3为本发明基于自适应聚类的瓦斯传感器精度异常识别系统结构框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，下面结合实施例和附图，对本发明作进一步的详细说明，本发明的示意性实施方式及其说明仅用于解释本发明，并不作为对本发明的限定。

基于现有技术瓦斯传感器精度异常识别方法并没有考虑瓦斯检测数据的平稳性和渐变性等特性，造成识别准确性不高，带来煤炭安全生产隐患。因此，本发明设计了基于自适应聚类的瓦斯传感器精度异常识别方法及系统，本发明考虑了瓦斯检测数据的平稳性和渐变性，且瓦斯浓度数据突变点少等特点，提出一种行之有效的基于自适应聚类的瓦斯传感器精度异常识别方法，识别准确性高，使得煤矿企业准确掌握矿井中各个传感器的精度状况，进而避免生产隐患。

实施例1

如图1和图2所示，本发明基于自适应聚类的瓦斯传感器精度异常识别方法，该方法包括：

步骤1，获取历史瓦斯浓度检测数据，并对历史瓦斯浓度检测数据进行预处理，得到预处理后的历史瓦斯浓度检测数据；

步骤2，构建瓦斯数据自适应聚类模型；采用瓦斯数据自适应聚类模型，对预处理后的历史瓦斯浓度检测数据进行聚类处理和异常判断，得到基于自适应聚类的瓦斯传感器精度识别模型；

步骤3，采用基于自适应聚类的瓦斯传感器精度识别模型，对待判别瓦斯浓度检测数据进行瓦斯浓度传感器精度异常识别。

具体实施主要包括以下几部分：

1、预处理

煤矿企业在长期的生产过程中，积累了大量的井下瓦斯浓度监测时间序列数据，但是由于传感器、环境噪声等因素的影响，这些数据中含有不同程度的异常值。预处理的目的是剔除噪声给瓦斯浓度传感器带来的明显异常值。

预处理包括：采用箱线图法，对历史瓦斯浓度检测数据进行异常值查找并剔除；以及采用多重比较法，对历史瓦斯浓度检测数据进行异常点查找并插值替换。

具体地：首先采用以下流程识别瓦斯浓度检测数据中的明显异常点。

选择一段时间(如一天)的瓦斯浓度监测序列，使用箱线图法进行异常值查找，本方法的优势是不要求数据满足特定的分布，且在数据分布较为集中时，具有良好的异常检测效果，这一点与瓦斯浓度的分布特征吻合。本方法的缺点是对于缓慢变化的箱线图是利用数据中的五个统计量：最小值(min)、第一四分位数(Q1)、中位数(median)、第三四分位数(Q3)与最大值(max)来描述数据的一种方法。其中第一四分位数与第三四分位数为将数据从大到小顺序排序后，处于25％、75％的数字。

参考多重比较法Tukey Method，定义四分位距IQR＝Q3-Q1，则正常值范围为Q1-1.5IQR～Q3+1.5IQR，超出该范围的数据均认定为异常，并将该异常点处的值用前后最近的非异常点线性插值替换。

2、瓦斯数据自适应聚类

瓦斯浓度检测数据经过预处理中异常值检测步骤后，通过K-Means聚类方法进行警示值检测。由于煤矿采掘工作面的生产具有周期性，即采煤机进刀－割煤－装煤－运煤－移架，一日三班循环作业，间或进行检修、钻眼、支护等工序，且每天的生产工序较为固定。因此，前序历史瓦斯浓度检测数据的聚类簇心和后序数据的簇心存在相似性。则利用前序数据子集的聚类簇心来优化所有数据的初始聚类簇心是可行的。

传统聚类方法(如k-means)需要预先指定簇类的数量，其聚类结果同时受到簇类数量与初始中心的选择的影响，本发明方法通过步骤②至步骤④分别设计相应方法消除以上两点问题。

设预处理后的历史瓦斯浓度检测数据为瓦斯数据集X，瓦斯数据集X为n个m维数据X＝{x₁,x₂,...,x_n}，x₁∈R^m(1≤i≤n)，聚类到k个集合，瓦斯数据自适应聚类模型的步骤如下：

①从瓦斯数据集X中抽取前序数据集X_pre，其中，

②采用轮廓系数法则，确定前序数据集X_pre中的聚类中心数量k；其中，聚类中心数量k为轮廓系数最大的类别数；具体步骤为：

根据样本i的轮廓系数，得到整个聚类结果的轮廓系数s，

③根据聚类中心数量k，对前序数据集X随机确定k个聚类簇心；根据每个聚类集合中所包含的瓦斯数据，采用簇内点密度方法计算各个簇的吸引密度；

这是考虑到瓦斯检测数据的平稳性和渐变性，且瓦斯浓度数据突变点少。本发明方法提出使用簇内点密度的方式取代传统欧式距离，用于评价簇的聚类效果。由公式(1)式定义簇的吸引密度：

其中，R_i是簇内各点到簇中心的距离，n是簇内点个数，d_ij是第i个瓦斯检测值和第j个瓦斯检测值的距离，ρ_i是第i个点的质量。由于煤矿传感器每个采样点都是做具有相同的重要性，因此，每个点的质量相同，故簇的吸引密度可由公式(2)表示：

④根据各个簇的吸引密度，采用准则函数更新迭代簇心值，直至确定最终聚类结果，得到前序数据子集的最终聚类中心集合。具体地：

对于前序数据子集X_pre，随机确定k个聚类簇心C_pre＝{c₁,c₂,...,c_k}，然后根据每个聚类集合中所包含的数据，采用公式(2)计算各个簇的吸引密度，采用公式(3)为选取使得聚类中心评价值之和最小的结果，采用公式(4)作为准则函数更新迭代簇心值，直至确定最终聚类结果，得到前序数据子集的最终聚类中心集合C_pre＝{c₁,c₂,...,c_k}。

定义伪簇：簇中仅仅包含一个元素的簇。检查聚类结果，并去除伪簇。本发明方法在聚类过程中不仅考虑了检测数据之间的距离，还考虑了当前簇的形态对煤矿检测数据的作用，结合伪簇的筛选作用，故可以消除初值选取的随机性对结果的影响。

另外，本发明方法还包括：煤矿瓦斯数据的异常值在线检测的更新方法，是通过以上步骤将新采集到数据加入原有的训练数据集合中，并通过前序数据集簇心优化后序数据的初始簇心，然后再进行聚类判断异常值。

3、精度异常告警

在第2部分煤矿瓦斯浓度聚类的基础上，分析传感器检测数据，实现针对传感器精度判别及告警，主要步骤如下：

(1)通过对待判别瓦斯浓度检测数据的离群点进行判断，包括：

若瓦斯浓度检测数据和其对应的聚类中心的距离大于第一设定阈值，则判断该瓦斯浓度检测数据为离群值；其中：

第一设定阈值的确定方法为：对于预处理后的瓦斯浓度检测数据，则认为是没有离群数据标识的数据集，通过计算每个簇的平均距离与2倍标准差之和作为第一设定阈值。

(2)统计待判别瓦斯浓度检测数据中离群点的比例，根据离群点的比例进行判断：

若离群点的比例大于第二设定阈值(比如2％)，则提报传感器精度异常；

若离群点的比例小于等于第二设定阈值(比如2％)，则传感器精度正常，不提报。

本发明具有如下有益效果：

1、创新的设计了煤矿瓦斯传感器精度识别方法，

将自适应聚类应用于煤矿瓦斯传感器精度判定，可实时获取矿井各个传感器服役状态；本发明识别准确性高，使得煤矿企业准确掌握矿井中各个传感器的精度状况，进而避免生产隐患。

2、煤矿应用的普适性和便捷性

本发明方法紧密切合煤矿安全监察业务，同时适用于高浓度、低浓度、突出型矿井的生产状态判别。本发明计算简练，能够快速实现煤矿瓦斯传感器精度异常判别并告警，具有明显的应用价值。

实施例2

如图3所示，本实施例与实施例1的区别在于，本实施例提供了基于自适应聚类的瓦斯传感器精度异常识别系统，该系统用于实现实施例1所述的基于自适应聚类的瓦斯传感器精度异常识别方法；该系统包括：

作为进一步地实施，构建及自适应聚类单元包括：

其中，各个单元的执行过程按照实施例1所述的基于自适应聚类的瓦斯传感器精度异常识别方法流程步骤执行即可，此实施例中不再一一赘述。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.基于自适应聚类的瓦斯传感器精度异常识别方法，其特征在于，该方法包括：

获取历史瓦斯浓度检测数据，并对所述历史瓦斯浓度检测数据进行预处理，得到预处理后的历史瓦斯浓度检测数据；

构建瓦斯数据自适应聚类模型；采用所述瓦斯数据自适应聚类模型，对预处理后的历史瓦斯浓度检测数据进行聚类处理和异常判断，得到基于自适应聚类的瓦斯传感器精度识别模型；

采用所述基于自适应聚类的瓦斯传感器精度识别模型，对待判别瓦斯浓度检测数据进行瓦斯浓度传感器精度异常识别。

2.根据权利要求1所述的基于自适应聚类的瓦斯传感器精度异常识别方法，其特征在于，所述预处理包括：

采用箱线图法，对所述历史瓦斯浓度检测数据进行异常值查找并剔除；以及

采用多重比较法，对所述历史瓦斯浓度检测数据进行异常点查找并插值替换。

3.根据权利要求1所述的基于自适应聚类的瓦斯传感器精度异常识别方法，其特征在于，所述的采用所述瓦斯数据自适应聚类模型，对预处理后的历史瓦斯浓度检测数据进行聚类处理，包括：

采用轮廓系数法则，确定所述前序数据集X_pre中的聚类中心数量k；其中，所述聚类中心数量k为轮廓系数最大的类别数；

根据所述聚类中心数量k，对所述前序数据集X随机确定k个聚类簇心；根据每个聚类集合中所包含的瓦斯数据，采用簇内点密度方法计算各个簇的吸引密度；

4.根据权利要求3所述的基于自适应聚类的瓦斯传感器精度异常识别方法，其特征在于，所述的采用轮廓系数法则，确定所述前序数据集X_pre中的聚类中心数量k，具体步骤为：

根据平均距离b_ij，采用不相似度计算公式定义样本i的簇间不相似度；所述不相似度计算公式为b_i＝min(b_i1,b_i2,...,b_ik)，其中，b_i为样本i的簇间不相似度；

根据样本i的轮廓系数，得到整个聚类结果的轮廓系数s，

5.根据权利要求3所述的基于自适应聚类的瓦斯传感器精度异常识别方法，其特征在于，所述簇内点密度方法的计算公式为：

6.根据权利要求3所述的基于自适应聚类的瓦斯传感器精度异常识别方法，其特征在于，所述准则函数为：

7.根据权利要求1所述的基于自适应聚类的瓦斯传感器精度异常识别方法，其特征在于，所述的采用所述基于自适应聚类的瓦斯传感器精度识别模型，对待判别瓦斯浓度检测数据进行瓦斯浓度传感器精度异常识别，包括：

统计待判别瓦斯浓度检测数据中离群点的比例，根据所述离群点的比例进行判断：若所述离群点的比例大于第二设定阈值，则提报传感器精度异常；若所述离群点的比例小于等于第二设定阈值，则传感器精度正常，不提报。

8.根据权利要求7所述的基于自适应聚类的瓦斯传感器精度异常识别方法，其特征在于，所述第一设定阈值的确定方法为：对于预处理后的瓦斯浓度检测数据，则认为是没有离群数据标识的数据集，通过计算每个簇的平均距离与2倍标准差之和作为第一设定阈值。

9.基于自适应聚类的瓦斯传感器精度异常识别系统，其特征在于，该系统包括：

预处理单元，用于对所述历史瓦斯浓度检测数据及待判别瓦斯浓度检测数据进行预处理，得到预处理后的历史瓦斯浓度检测数据和预处理后的待判别瓦斯浓度检测数据；

构建及自适应聚类单元，用于构建瓦斯数据自适应聚类模型，采用所述瓦斯数据自适应聚类模型，对预处理后的历史瓦斯浓度检测数据进行聚类处理和异常判断，得到基于自适应聚类的瓦斯传感器精度识别模型；

异常识别单元，用于采用所述基于自适应聚类的瓦斯传感器精度识别模型，对待判别瓦斯浓度检测数据进行瓦斯浓度传感器精度异常识别。

10.根据权利要求9所述的基于自适应聚类的瓦斯传感器精度异常识别系统，其特征在于，所述构建及自适应聚类单元包括：

轮廓系数计算子单元，用于采用轮廓系数法则，确定所述前序数据集X_pre中的聚类中心数量k；其中，所述聚类中心数量k为轮廓系数最大的类别数；

簇吸引密度计算子单元，用于根据所述聚类中心数量k，对所述前序数据集X随机确定k个聚类簇心；根据每个聚类集合中所包含的瓦斯数据，采用簇内点密度方法计算各个簇的吸引密度；