CN116910590A - 基于自适应聚类的瓦斯传感器精度异常识别方法及系统 - Google Patents
基于自适应聚类的瓦斯传感器精度异常识别方法及系统 Download PDFInfo
- Publication number
- CN116910590A CN116910590A CN202310901824.5A CN202310901824A CN116910590A CN 116910590 A CN116910590 A CN 116910590A CN 202310901824 A CN202310901824 A CN 202310901824A CN 116910590 A CN116910590 A CN 116910590A
- Authority
- CN
- China
- Prior art keywords
- gas
- cluster
- clustering
- data
- gas concentration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 82
- 238000001514 detection method Methods 0.000 claims abstract description 97
- 230000002159 abnormal effect Effects 0.000 claims abstract description 38
- 230000005856 abnormality Effects 0.000 claims abstract description 10
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 230000003044 adaptive effect Effects 0.000 claims description 23
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000010586 diagram Methods 0.000 claims description 10
- 238000010276 construction Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- 101100533306 Mus musculus Setx gene Proteins 0.000 claims 1
- 239000003245 coal Substances 0.000 abstract description 25
- 238000004519 manufacturing process Methods 0.000 abstract description 15
- 230000006870 function Effects 0.000 description 10
- 230000008859 change Effects 0.000 description 7
- 238000004590 computer program Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010162 Tukey test Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005553 drilling Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Emergency Alarm Devices (AREA)
Abstract
本发明公开了基于自适应聚类的瓦斯传感器精度异常识别方法及系统,该方法包括:获取历史瓦斯浓度检测数据,并对所述历史瓦斯浓度检测数据进行预处理,得到预处理后的历史瓦斯浓度检测数据;构建瓦斯数据自适应聚类模型;采用所述瓦斯数据自适应聚类模型,对预处理后的历史瓦斯浓度检测数据进行聚类处理和异常判断,得到基于自适应聚类的瓦斯传感器精度识别模型;采用所述基于自适应聚类的瓦斯传感器精度识别模型,对待判别瓦斯浓度检测数据进行瓦斯浓度传感器精度异常识别。本发明识别准确性高,使得煤矿企业准确掌握矿井中各个传感器的精度状况,进而避免生产隐患。
Description
技术领域
本发明涉及煤矿生产状态监测、数据挖掘技术领域,具体涉及基于自适应聚类的瓦斯传感器精度异常识别方法及系统。
背景技术
煤炭是我国工业化进程中的基础性能源,且以煤为主的能源结构将长期存在,煤矿安全日益受到重视。传统的瓦斯传感器常常存在很多非线性因素,在使用时需调零和校正灵敏度,给安全监测工作带来了很大困难。
然而,现有技术瓦斯传感器精度异常识别方法并没有考虑瓦斯检测数据的平稳性和渐变性等特性,造成识别准确性不高,带来煤炭安全生产隐患。因此,缺乏一种行之有效的煤矿瓦斯传感器精度异常识别方法,使得煤矿企业准确掌握矿井中各个传感器的精度状况,进而避免生产隐患。
发明内容
本发明所要解决的技术问题是现有技术瓦斯传感器精度异常识别方法并没有考虑瓦斯检测数据的平稳性和渐变性等特性,造成识别准确性不高,带来煤炭安全生产隐患。目的在于提供基于自适应聚类的瓦斯传感器精度异常识别方法及系统,本发明考虑了瓦斯检测数据的平稳性和渐变性,且瓦斯浓度数据突变点少等特点,提出一种行之有效的基于自适应聚类的瓦斯传感器精度异常识别方法,识别准确性高,使得煤矿企业准确掌握矿井中各个传感器的精度状况,进而避免生产隐患。
本发明通过下述技术方案实现:
第一方面,本发明提供了基于自适应聚类的瓦斯传感器精度异常识别方法,该方法包括:
获取历史瓦斯浓度检测数据,并对历史瓦斯浓度检测数据进行预处理,得到预处理后的历史瓦斯浓度检测数据;
构建瓦斯数据自适应聚类模型;采用瓦斯数据自适应聚类模型,对预处理后的历史瓦斯浓度检测数据进行聚类处理和异常判断,得到基于自适应聚类的瓦斯传感器精度识别模型;
采用基于自适应聚类的瓦斯传感器精度识别模型,对待判别瓦斯浓度检测数据进行瓦斯浓度传感器精度异常识别。
进一步地,预处理包括:
采用箱线图法,对历史瓦斯浓度检测数据进行异常值查找并剔除;以及
采用多重比较法,对历史瓦斯浓度检测数据进行异常点查找并插值替换。
进一步地,所述的采用瓦斯数据自适应聚类模型,对预处理后的历史瓦斯浓度检测数据进行聚类处理,包括:
记作预处理后的历史瓦斯浓度检测数据为瓦斯数据集X,从瓦斯数据集X中抽取前序数据集Xpre,其中,
采用轮廓系数法则,确定前序数据集Xpre中的聚类中心数量k;其中,聚类中心数量k为轮廓系数最大的类别数;
根据聚类中心数量k,对前序数据集X随机确定k个聚类簇心;根据每个聚类集合中所包含的瓦斯数据,采用簇内点密度方法计算各个簇的吸引密度;
根据各个簇的吸引密度,采用准则函数更新迭代簇心值,直至确定最终聚类结果,得到前序数据子集的最终聚类中心集合。
进一步地,所述的采用轮廓系数法则,确定前序数据集Xpre中的聚类中心数量k,具体步骤为:
分别计算样本i到同簇其他样本的平均距离ai,样本i到其他某簇Cj的所有样本的平均距离bij;
根据平均距离bij,采用不相似度计算公式定义样本i的簇间不相似度;不相似度计算公式为bi=min(bi1,bi2,...,bik),其中,bi为样本i的簇间不相似度;
根据簇间不相似度和样本i到同簇其他样本的平均距离ai,计算样本i的轮廓系数s(i),
根据样本i的轮廓系数,得到整个聚类结果的轮廓系数s,
进一步地,簇内点密度方法的计算公式为:
其中,θ是簇的吸引密度;Ri是簇内各点到簇中心的距离;n是簇内点个数;dij是第i个瓦斯检测值和第j个瓦斯检测值的距离,ρi是第i个点的质量。
进一步地,准则函数为:
其中,xi表示待聚类数据,ci表示第i类聚类中心,var(ci)表示ci的评价值。
进一步地,所述的采用基于自适应聚类的瓦斯传感器精度识别模型,对待判别瓦斯浓度检测数据进行瓦斯浓度传感器精度异常识别,包括:
若待判别瓦斯浓度检测数据和其对应的聚类中心的距离大于第一设定阈值,则判断该瓦斯浓度检测数据为离群值;
统计待判别瓦斯浓度检测数据中离群点的比例,根据离群点的比例进行判断:若离群点的比例大于第二设定阈值(比如2%),则提报传感器精度异常;若离群点的比例小于等于第二设定阈值(比如2%),则传感器精度正常,不提报。
进一步地,第一设定阈值的确定方法为:对于预处理后的瓦斯浓度检测数据,则认为是没有离群数据标识的数据集,通过计算每个簇的平均距离与2倍标准差之和作为第一设定阈值。
第二方面,本发明又提供了基于自适应聚类的瓦斯传感器精度异常识别系统,该系统用于实现所述的基于自适应聚类的瓦斯传感器精度异常识别方法;该系统包括:
获取单元,用于获取历史瓦斯浓度检测数据及待判别瓦斯浓度检测数据;
预处理单元,用于对历史瓦斯浓度检测数据及待判别瓦斯浓度检测数据进行预处理,得到预处理后的历史瓦斯浓度检测数据和预处理后的待判别瓦斯浓度检测数据;
构建及自适应聚类单元,用于构建瓦斯数据自适应聚类模型,采用瓦斯数据自适应聚类模型,对预处理后的历史瓦斯浓度检测数据进行聚类处理和异常判断,得到基于自适应聚类的瓦斯传感器精度识别模型;
异常识别单元,用于采用基于自适应聚类的瓦斯传感器精度识别模型,对待判别瓦斯浓度检测数据进行瓦斯浓度传感器精度异常识别。
进一步地,构建及自适应聚类单元包括:
抽取子单元,用于记作预处理后的历史瓦斯浓度检测数据为瓦斯数据集X,从瓦斯数据集X中抽取前序数据集Xpre,其中,
轮廓系数计算子单元,用于采用轮廓系数法则,确定前序数据集Xpre中的聚类中心数量k;其中,聚类中心数量k为轮廓系数最大的类别数;
簇吸引密度计算子单元,用于根据聚类中心数量k,对前序数据集X随机确定k个聚类簇心;根据每个聚类集合中所包含的瓦斯数据,采用簇内点密度方法计算各个簇的吸引密度;
迭代更新子单元,用于根据各个簇的吸引密度,采用准则函数更新迭代簇心值,直至确定最终聚类结果,得到前序数据子集的最终聚类中心集合。
本发明与现有技术相比,具有如下的优点和有益效果:
本发明基于自适应聚类的瓦斯传感器精度异常识别方法及系统,本发明考虑了瓦斯检测数据的平稳性和渐变性,且瓦斯浓度数据突变点少等特点,提出一种行之有效的基于自适应聚类的瓦斯传感器精度异常识别方法,识别准确性高,使得煤矿企业准确掌握矿井中各个传感器的精度状况,进而避免生产隐患。另外,本发明聚类结果通过步骤②至步骤④分别设计相应方法消除同时受到簇类数量与初始中心的选择影响的问题。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中:
图1为本发明基于自适应聚类的瓦斯传感器精度异常识别方法流程图;
图2为本发明基于自适应聚类的瓦斯传感器精度异常识别方法的详细流程图;
图3为本发明基于自适应聚类的瓦斯传感器精度异常识别系统结构框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
基于现有技术瓦斯传感器精度异常识别方法并没有考虑瓦斯检测数据的平稳性和渐变性等特性,造成识别准确性不高,带来煤炭安全生产隐患。因此,本发明设计了基于自适应聚类的瓦斯传感器精度异常识别方法及系统,本发明考虑了瓦斯检测数据的平稳性和渐变性,且瓦斯浓度数据突变点少等特点,提出一种行之有效的基于自适应聚类的瓦斯传感器精度异常识别方法,识别准确性高,使得煤矿企业准确掌握矿井中各个传感器的精度状况,进而避免生产隐患。
实施例1
如图1和图2所示,本发明基于自适应聚类的瓦斯传感器精度异常识别方法,该方法包括:
步骤1,获取历史瓦斯浓度检测数据,并对历史瓦斯浓度检测数据进行预处理,得到预处理后的历史瓦斯浓度检测数据;
步骤2,构建瓦斯数据自适应聚类模型;采用瓦斯数据自适应聚类模型,对预处理后的历史瓦斯浓度检测数据进行聚类处理和异常判断,得到基于自适应聚类的瓦斯传感器精度识别模型;
步骤3,采用基于自适应聚类的瓦斯传感器精度识别模型,对待判别瓦斯浓度检测数据进行瓦斯浓度传感器精度异常识别。
具体实施主要包括以下几部分:
1、预处理
煤矿企业在长期的生产过程中,积累了大量的井下瓦斯浓度监测时间序列数据,但是由于传感器、环境噪声等因素的影响,这些数据中含有不同程度的异常值。预处理的目的是剔除噪声给瓦斯浓度传感器带来的明显异常值。
预处理包括:采用箱线图法,对历史瓦斯浓度检测数据进行异常值查找并剔除;以及采用多重比较法,对历史瓦斯浓度检测数据进行异常点查找并插值替换。
具体地:首先采用以下流程识别瓦斯浓度检测数据中的明显异常点。
选择一段时间(如一天)的瓦斯浓度监测序列,使用箱线图法进行异常值查找,本方法的优势是不要求数据满足特定的分布,且在数据分布较为集中时,具有良好的异常检测效果,这一点与瓦斯浓度的分布特征吻合。本方法的缺点是对于缓慢变化的箱线图是利用数据中的五个统计量:最小值(min)、第一四分位数(Q1)、中位数(median)、第三四分位数(Q3)与最大值(max)来描述数据的一种方法。其中第一四分位数与第三四分位数为将数据从大到小顺序排序后,处于25%、75%的数字。
参考多重比较法Tukey Method,定义四分位距IQR=Q3-Q1,则正常值范围为Q1-1.5IQR~Q3+1.5IQR,超出该范围的数据均认定为异常,并将该异常点处的值用前后最近的非异常点线性插值替换。
2、瓦斯数据自适应聚类
瓦斯浓度检测数据经过预处理中异常值检测步骤后,通过K-Means聚类方法进行警示值检测。由于煤矿采掘工作面的生产具有周期性,即采煤机进刀-割煤-装煤-运煤-移架,一日三班循环作业,间或进行检修、钻眼、支护等工序,且每天的生产工序较为固定。因此,前序历史瓦斯浓度检测数据的聚类簇心和后序数据的簇心存在相似性。则利用前序数据子集的聚类簇心来优化所有数据的初始聚类簇心是可行的。
传统聚类方法(如k-means)需要预先指定簇类的数量,其聚类结果同时受到簇类数量与初始中心的选择的影响,本发明方法通过步骤②至步骤④分别设计相应方法消除以上两点问题。
设预处理后的历史瓦斯浓度检测数据为瓦斯数据集X,瓦斯数据集X为n个m维数据X={x1,x2,...,xn},x1∈Rm(1≤i≤n),聚类到k个集合,瓦斯数据自适应聚类模型的步骤如下:
①从瓦斯数据集X中抽取前序数据集Xpre,其中,
②采用轮廓系数法则,确定前序数据集Xpre中的聚类中心数量k;其中,聚类中心数量k为轮廓系数最大的类别数;具体步骤为:
分别计算样本i到同簇其他样本的平均距离ai,样本i到其他某簇Cj的所有样本的平均距离bij;
根据平均距离bij,采用不相似度计算公式定义样本i的簇间不相似度;不相似度计算公式为bi=min(bi1,bi2,...,bik),其中,bi为样本i的簇间不相似度;
根据簇间不相似度和样本i到同簇其他样本的平均距离ai,计算样本i的轮廓系数s(i),
根据样本i的轮廓系数,得到整个聚类结果的轮廓系数s,
③根据聚类中心数量k,对前序数据集X随机确定k个聚类簇心;根据每个聚类集合中所包含的瓦斯数据,采用簇内点密度方法计算各个簇的吸引密度;
这是考虑到瓦斯检测数据的平稳性和渐变性,且瓦斯浓度数据突变点少。本发明方法提出使用簇内点密度的方式取代传统欧式距离,用于评价簇的聚类效果。由公式(1)式定义簇的吸引密度:
其中,Ri是簇内各点到簇中心的距离,n是簇内点个数,dij是第i个瓦斯检测值和第j个瓦斯检测值的距离,ρi是第i个点的质量。由于煤矿传感器每个采样点都是做具有相同的重要性,因此,每个点的质量相同,故簇的吸引密度可由公式(2)表示:
其中,θ是簇的吸引密度;Ri是簇内各点到簇中心的距离;n是簇内点个数;dij是第i个瓦斯检测值和第j个瓦斯检测值的距离,ρi是第i个点的质量。
④根据各个簇的吸引密度,采用准则函数更新迭代簇心值,直至确定最终聚类结果,得到前序数据子集的最终聚类中心集合。具体地:
对于前序数据子集Xpre,随机确定k个聚类簇心Cpre={c1,c2,...,ck},然后根据每个聚类集合中所包含的数据,采用公式(2)计算各个簇的吸引密度,采用公式(3)为选取使得聚类中心评价值之和最小的结果,采用公式(4)作为准则函数更新迭代簇心值,直至确定最终聚类结果,得到前序数据子集的最终聚类中心集合Cpre={c1,c2,...,ck}。
其中,xi表示待聚类数据,ci表示第i类聚类中心,var(ci)表示ci的评价值。
定义伪簇:簇中仅仅包含一个元素的簇。检查聚类结果,并去除伪簇。本发明方法在聚类过程中不仅考虑了检测数据之间的距离,还考虑了当前簇的形态对煤矿检测数据的作用,结合伪簇的筛选作用,故可以消除初值选取的随机性对结果的影响。
另外,本发明方法还包括:煤矿瓦斯数据的异常值在线检测的更新方法,是通过以上步骤将新采集到数据加入原有的训练数据集合中,并通过前序数据集簇心优化后序数据的初始簇心,然后再进行聚类判断异常值。
3、精度异常告警
在第2部分煤矿瓦斯浓度聚类的基础上,分析传感器检测数据,实现针对传感器精度判别及告警,主要步骤如下:
(1)通过对待判别瓦斯浓度检测数据的离群点进行判断,包括:
若瓦斯浓度检测数据和其对应的聚类中心的距离大于第一设定阈值,则判断该瓦斯浓度检测数据为离群值;其中:
第一设定阈值的确定方法为:对于预处理后的瓦斯浓度检测数据,则认为是没有离群数据标识的数据集,通过计算每个簇的平均距离与2倍标准差之和作为第一设定阈值。
(2)统计待判别瓦斯浓度检测数据中离群点的比例,根据离群点的比例进行判断:
若离群点的比例大于第二设定阈值(比如2%),则提报传感器精度异常;
若离群点的比例小于等于第二设定阈值(比如2%),则传感器精度正常,不提报。
本发明具有如下有益效果:
1、创新的设计了煤矿瓦斯传感器精度识别方法,
将自适应聚类应用于煤矿瓦斯传感器精度判定,可实时获取矿井各个传感器服役状态;本发明识别准确性高,使得煤矿企业准确掌握矿井中各个传感器的精度状况,进而避免生产隐患。
2、煤矿应用的普适性和便捷性
本发明方法紧密切合煤矿安全监察业务,同时适用于高浓度、低浓度、突出型矿井的生产状态判别。本发明计算简练,能够快速实现煤矿瓦斯传感器精度异常判别并告警,具有明显的应用价值。
实施例2
如图3所示,本实施例与实施例1的区别在于,本实施例提供了基于自适应聚类的瓦斯传感器精度异常识别系统,该系统用于实现实施例1所述的基于自适应聚类的瓦斯传感器精度异常识别方法;该系统包括:
获取单元,用于获取历史瓦斯浓度检测数据及待判别瓦斯浓度检测数据;
预处理单元,用于对历史瓦斯浓度检测数据及待判别瓦斯浓度检测数据进行预处理,得到预处理后的历史瓦斯浓度检测数据和预处理后的待判别瓦斯浓度检测数据;
构建及自适应聚类单元,用于构建瓦斯数据自适应聚类模型,采用瓦斯数据自适应聚类模型,对预处理后的历史瓦斯浓度检测数据进行聚类处理和异常判断,得到基于自适应聚类的瓦斯传感器精度识别模型;
异常识别单元,用于采用基于自适应聚类的瓦斯传感器精度识别模型,对待判别瓦斯浓度检测数据进行瓦斯浓度传感器精度异常识别。
作为进一步地实施,构建及自适应聚类单元包括:
抽取子单元,用于记作预处理后的历史瓦斯浓度检测数据为瓦斯数据集X,从瓦斯数据集X中抽取前序数据集Xpre,其中,
轮廓系数计算子单元,用于采用轮廓系数法则,确定前序数据集Xpre中的聚类中心数量k;其中,聚类中心数量k为轮廓系数最大的类别数;
簇吸引密度计算子单元,用于根据聚类中心数量k,对前序数据集X随机确定k个聚类簇心;根据每个聚类集合中所包含的瓦斯数据,采用簇内点密度方法计算各个簇的吸引密度;
迭代更新子单元,用于根据各个簇的吸引密度,采用准则函数更新迭代簇心值,直至确定最终聚类结果,得到前序数据子集的最终聚类中心集合。
其中,各个单元的执行过程按照实施例1所述的基于自适应聚类的瓦斯传感器精度异常识别方法流程步骤执行即可,此实施例中不再一一赘述。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.基于自适应聚类的瓦斯传感器精度异常识别方法,其特征在于,该方法包括:
获取历史瓦斯浓度检测数据,并对所述历史瓦斯浓度检测数据进行预处理,得到预处理后的历史瓦斯浓度检测数据;
构建瓦斯数据自适应聚类模型;采用所述瓦斯数据自适应聚类模型,对预处理后的历史瓦斯浓度检测数据进行聚类处理和异常判断,得到基于自适应聚类的瓦斯传感器精度识别模型;
采用所述基于自适应聚类的瓦斯传感器精度识别模型,对待判别瓦斯浓度检测数据进行瓦斯浓度传感器精度异常识别。
2.根据权利要求1所述的基于自适应聚类的瓦斯传感器精度异常识别方法,其特征在于,所述预处理包括:
采用箱线图法,对所述历史瓦斯浓度检测数据进行异常值查找并剔除;以及
采用多重比较法,对所述历史瓦斯浓度检测数据进行异常点查找并插值替换。
3.根据权利要求1所述的基于自适应聚类的瓦斯传感器精度异常识别方法,其特征在于,所述的采用所述瓦斯数据自适应聚类模型,对预处理后的历史瓦斯浓度检测数据进行聚类处理,包括:
记作预处理后的历史瓦斯浓度检测数据为瓦斯数据集X,从瓦斯数据集X中抽取前序数据集Xpre,其中,
采用轮廓系数法则,确定所述前序数据集Xpre中的聚类中心数量k;其中,所述聚类中心数量k为轮廓系数最大的类别数;
根据所述聚类中心数量k,对所述前序数据集X随机确定k个聚类簇心;根据每个聚类集合中所包含的瓦斯数据,采用簇内点密度方法计算各个簇的吸引密度;
根据各个簇的吸引密度,采用准则函数更新迭代簇心值,直至确定最终聚类结果,得到前序数据子集的最终聚类中心集合。
4.根据权利要求3所述的基于自适应聚类的瓦斯传感器精度异常识别方法,其特征在于,所述的采用轮廓系数法则,确定所述前序数据集Xpre中的聚类中心数量k,具体步骤为:
分别计算样本i到同簇其他样本的平均距离ai,样本i到其他某簇Cj的所有样本的平均距离bij;
根据平均距离bij,采用不相似度计算公式定义样本i的簇间不相似度;所述不相似度计算公式为bi=min(bi1,bi2,...,bik),其中,bi为样本i的簇间不相似度;
根据簇间不相似度和样本i到同簇其他样本的平均距离ai,计算样本i的轮廓系数s(i),
根据样本i的轮廓系数,得到整个聚类结果的轮廓系数s,
5.根据权利要求3所述的基于自适应聚类的瓦斯传感器精度异常识别方法,其特征在于,所述簇内点密度方法的计算公式为:
其中,θ是簇的吸引密度;Ri是簇内各点到簇中心的距离;n是簇内点个数;dij是第i个瓦斯检测值和第j个瓦斯检测值的距离,ρi是第i个点的质量。
6.根据权利要求3所述的基于自适应聚类的瓦斯传感器精度异常识别方法,其特征在于,所述准则函数为:
其中,xi表示待聚类数据,ci表示第i类聚类中心,var(ci)表示ci的评价值。
7.根据权利要求1所述的基于自适应聚类的瓦斯传感器精度异常识别方法,其特征在于,所述的采用所述基于自适应聚类的瓦斯传感器精度识别模型,对待判别瓦斯浓度检测数据进行瓦斯浓度传感器精度异常识别,包括:
若待判别瓦斯浓度检测数据和其对应的聚类中心的距离大于第一设定阈值,则判断该瓦斯浓度检测数据为离群值;
统计待判别瓦斯浓度检测数据中离群点的比例,根据所述离群点的比例进行判断:若所述离群点的比例大于第二设定阈值,则提报传感器精度异常;若所述离群点的比例小于等于第二设定阈值,则传感器精度正常,不提报。
8.根据权利要求7所述的基于自适应聚类的瓦斯传感器精度异常识别方法,其特征在于,所述第一设定阈值的确定方法为:对于预处理后的瓦斯浓度检测数据,则认为是没有离群数据标识的数据集,通过计算每个簇的平均距离与2倍标准差之和作为第一设定阈值。
9.基于自适应聚类的瓦斯传感器精度异常识别系统,其特征在于,该系统包括:
获取单元,用于获取历史瓦斯浓度检测数据及待判别瓦斯浓度检测数据;
预处理单元,用于对所述历史瓦斯浓度检测数据及待判别瓦斯浓度检测数据进行预处理,得到预处理后的历史瓦斯浓度检测数据和预处理后的待判别瓦斯浓度检测数据;
构建及自适应聚类单元,用于构建瓦斯数据自适应聚类模型,采用所述瓦斯数据自适应聚类模型,对预处理后的历史瓦斯浓度检测数据进行聚类处理和异常判断,得到基于自适应聚类的瓦斯传感器精度识别模型;
异常识别单元,用于采用所述基于自适应聚类的瓦斯传感器精度识别模型,对待判别瓦斯浓度检测数据进行瓦斯浓度传感器精度异常识别。
10.根据权利要求9所述的基于自适应聚类的瓦斯传感器精度异常识别系统,其特征在于,所述构建及自适应聚类单元包括:
抽取子单元,用于记作预处理后的历史瓦斯浓度检测数据为瓦斯数据集X,从瓦斯数据集X中抽取前序数据集Xpre,其中,
轮廓系数计算子单元,用于采用轮廓系数法则,确定所述前序数据集Xpre中的聚类中心数量k;其中,所述聚类中心数量k为轮廓系数最大的类别数;
簇吸引密度计算子单元,用于根据所述聚类中心数量k,对所述前序数据集X随机确定k个聚类簇心;根据每个聚类集合中所包含的瓦斯数据,采用簇内点密度方法计算各个簇的吸引密度;
迭代更新子单元,用于根据各个簇的吸引密度,采用准则函数更新迭代簇心值,直至确定最终聚类结果,得到前序数据子集的最终聚类中心集合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310901824.5A CN116910590A (zh) | 2023-07-21 | 2023-07-21 | 基于自适应聚类的瓦斯传感器精度异常识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310901824.5A CN116910590A (zh) | 2023-07-21 | 2023-07-21 | 基于自适应聚类的瓦斯传感器精度异常识别方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116910590A true CN116910590A (zh) | 2023-10-20 |
Family
ID=88362622
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310901824.5A Pending CN116910590A (zh) | 2023-07-21 | 2023-07-21 | 基于自适应聚类的瓦斯传感器精度异常识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116910590A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118275630A (zh) * | 2024-05-31 | 2024-07-02 | 启思半导体(杭州)有限责任公司 | 酒类品质监测识别方法、系统及装置 |
-
2023
- 2023-07-21 CN CN202310901824.5A patent/CN116910590A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118275630A (zh) * | 2024-05-31 | 2024-07-02 | 启思半导体(杭州)有限责任公司 | 酒类品质监测识别方法、系统及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111931868B (zh) | 时间序列数据异常检测方法和装置 | |
CN111639497B (zh) | 一种基于大数据机器学习的异常行为发现方法 | |
CN110895526A (zh) | 一种大气监测系统中数据异常的修正方法 | |
CN111027615B (zh) | 基于机器学习的中间件故障预警方法和系统 | |
CN111314329B (zh) | 流量入侵检测系统和方法 | |
CN112987675A (zh) | 一种异常检测的方法、装置、计算机设备和介质 | |
CN108429649B (zh) | 基于多次单类型采集结果的综合异常判断的系统 | |
CN112766429B (zh) | 一种异常检测的方法、装置、计算机设备和介质 | |
CN111782460A (zh) | 大规模日志数据的异常检测方法、装置和存储介质 | |
CN116910590A (zh) | 基于自适应聚类的瓦斯传感器精度异常识别方法及系统 | |
CN110837874A (zh) | 基于时间序列分类的业务数据异常检测方法 | |
CN111949480A (zh) | 一种基于组件感知的日志异常检测方法 | |
CN116841779A (zh) | 异常日志检测方法、装置、电子设备和可读存储介质 | |
CN115905990A (zh) | 一种基于密度聚集算法的变压器油温异常监测方法 | |
CN113485878B (zh) | 一种多数据中心故障检测方法 | |
CN114490235A (zh) | 智能化识别日志数据中的数量关系及其异常的算法模型 | |
CN116365519B (zh) | 一种电力负荷预测方法、系统、存储介质及设备 | |
CN111209158B (zh) | 服务器集群的挖矿监控方法及集群监控系统 | |
CN117411780A (zh) | 一种基于多源数据特征的网络日志异常检测方法 | |
Lai | Fitting power law distributions to data | |
CN116701846A (zh) | 一种基于无监督学习的水电站调度运行数据清洗方法 | |
CN117171655A (zh) | 一种基于频谱分析的煤矿生产状态智能判别方法及装置 | |
CN116629686A (zh) | 一种评估企业能耗数据的方法及装置 | |
CN114553468A (zh) | 一种基于特征交叉与集成学习的三级网络入侵检测方法 | |
Zhou et al. | A new approach for noise data detection based on cluster and information entropy |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |