CN113688863A - 基于机器学习的矿井传感器报警原因分类方法及装置 - Google Patents
基于机器学习的矿井传感器报警原因分类方法及装置 Download PDFInfo
- Publication number
- CN113688863A CN113688863A CN202110794119.0A CN202110794119A CN113688863A CN 113688863 A CN113688863 A CN 113688863A CN 202110794119 A CN202110794119 A CN 202110794119A CN 113688863 A CN113688863 A CN 113688863A
- Authority
- CN
- China
- Prior art keywords
- alarm
- data
- machine learning
- period
- learning model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 69
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000012549 training Methods 0.000 claims abstract description 47
- 238000012544 monitoring process Methods 0.000 claims abstract description 42
- 238000004422 calculation algorithm Methods 0.000 claims description 25
- 238000012360 testing method Methods 0.000 claims description 20
- 238000005422 blasting Methods 0.000 claims description 15
- 230000000694 effects Effects 0.000 claims description 14
- 238000007781 pre-processing Methods 0.000 claims description 12
- 238000011156 evaluation Methods 0.000 claims description 8
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 238000012706 support-vector machine Methods 0.000 claims description 6
- 230000008030 elimination Effects 0.000 claims description 5
- 238000003379 elimination reaction Methods 0.000 claims description 5
- 238000007477 logistic regression Methods 0.000 claims description 5
- 238000007637 random forest analysis Methods 0.000 claims description 5
- 238000003062 neural network model Methods 0.000 claims description 4
- 238000005065 mining Methods 0.000 abstract description 9
- 229910002091 carbon monoxide Inorganic materials 0.000 description 17
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 description 16
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 15
- 230000008569 process Effects 0.000 description 11
- 238000003860 storage Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 239000003245 coal Substances 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000009412 basement excavation Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- -1 feed state Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/0004—Gaseous mixtures, e.g. polluted air
- G01N33/0009—General constructional details of gas analysers, e.g. portable test equipment
- G01N33/0027—General constructional details of gas analysers, e.g. portable test equipment concerning the detector
- G01N33/0036—General constructional details of gas analysers, e.g. portable test equipment concerning the detector specially adapted to detect a particular component
- G01N33/004—CO or CO2
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/0004—Gaseous mixtures, e.g. polluted air
- G01N33/0009—General constructional details of gas analysers, e.g. portable test equipment
- G01N33/0062—General constructional details of gas analysers, e.g. portable test equipment concerning the measuring method or the display, e.g. intermittent measurement or digital display
- G01N33/0063—General constructional details of gas analysers, e.g. portable test equipment concerning the measuring method or the display, e.g. intermittent measurement or digital display using a threshold to release an alarm or displaying means
- G01N33/0065—General constructional details of gas analysers, e.g. portable test equipment concerning the measuring method or the display, e.g. intermittent measurement or digital display using a threshold to release an alarm or displaying means using more than one threshold
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Combustion & Propulsion (AREA)
- Food Science & Technology (AREA)
- Pathology (AREA)
- Immunology (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Medical Informatics (AREA)
- Medicinal Chemistry (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明提供了一种基于机器学习的矿井传感器报警原因分类方法及装置,该方法包括:获取矿井传感器在报警前后预设时间段内的监测数据;将监测数据输入预先训练的机器学习模型,确定监测数据对应的报警原因类型;该机器学习模型由矿井传感器的历史报警数据的数据特征训练得到。本发明可以精准识别传感器真实报警,正确判断井下危险状态,对指导矿井安全开采,协助监控部门提高管理决策水平具有重要意义。
Description
技术领域
本发明涉及煤矿安全生产数据特征识别技术领域,具体而言,涉及一种基于机器学习的矿井传感器报警原因分类方法及装置。
背景技术
为实时监测煤矿井下环境、保障煤矿安全生产,有关规定要求矿井必须装备安全监控系统。该系统用以监测甲烷浓度、一氧化碳浓度、风速、风压、温度、烟雾、馈电状态、风门状态、风筒状态、局部通风机开停、主要通风机开停等,并实现甲烷超限声光报警、断电和甲烷风电闭锁控制等。其中,甲烷传感器的报警浓度一般在0.5%CH4~1.0%CH4范围内,具体报警浓度可根据其安装位置确定,一氧化碳传感器的报警浓度为0.0024%CO。
然而,在井下实际开采过程中,导致甲烷传感器、一氧化碳传感器报警的原因是多种多样的。例如,对甲烷传感器、一氧化碳传感器进行调校,导致传感器监测值超过报警浓度;在井下放炮、汽车尾气排放会导致一氧化碳浓度升高,甚至超过报警浓度等。在这些情况下传感器报警而实际并未出现生产危险状况,使安全监控系统难以正确判断井下危险状态,导致矿井安全管理和决策出现错误。
发明内容
本发明解决的是现有矿井安全监控系统难以正确判断井下危险状态,导致矿井安全管理和决策出现错误的问题。
为解决上述问题,本发明提供一种基于机器学习的矿井传感器报警原因分类方法,所述方法包括:获取矿井传感器在报警前后预设时间段内的监测数据;将所述监测数据输入预先训练的机器学习模型,确定所述监测数据对应的报警原因类型;所述机器学习模型由历史报警数据的数据特征训练得到。
可选地,所述数据特征包括以下至少一项:报警期间内最高值、报警期间内最低值、报警期间的时长、报警当日均值、当日数据波动次数、当日数据在基准值以上的波动次数、当日数据在第一阈值以上的波动次数、当日数据在第二阈值以上的波动次数、报警期间内最高值的时间点和报警结束后第一个记录点的时间间隔、报警期间内最高值的时间点和报警开始前最后一个记录点的时间间隔、报警期间内最高值和报警结束后第一记录点的差值、报警期间内最高值和报警开始前最后一个记录点的差值、报警期间内最低值的时间点和报警结束后第一个记录点的时间间隔、报警期间内最低值的时间点和报警开始前最后一个记录点的时间间隔、报警期间内最低值和报警结束后第一个记录点的差值、报警期间内最低值和报警开始前最后一个记录点的差值、报警期间内第一个记录点和报警开始前最后一个记录点的差值、报警期间内第一个记录点和报警开始前最后一个记录点的时间间隔、报警期间内最后一个记录点和报警结束后第一个记录点的时间间隔、报警期间内最后一个记录点和报警结束后第一个记录点的差值。
可选地,所述报警原因类型包括:传感器调校、车辆尾气排放、爆破、真实报警及其他。
可选地,所述机器学习模型的训练过程如下:获取历史报警数据,及对所述历史报警数据进行预处理;所述预处理包括异常值剔除、报警原因标签添加;根据所述预处理后的历史报警数据构建多个子特征,以及对所述多个子特征进行模型精确度影响筛选,得到对模型精确度影响高的多个目标特征;将预处理后的历史报警数据及所述训练集对应的报警原因标签、目标特征分为训练集和测试集;根据所述训练集训练机器学习模型,以及根据所述测试集测试所述机器学习模型,直至所述机器学习模型的分类效果满足预设评价指标。
可选地,所述报警原因标签添加包括:获取所述历史报警数据中第一报警记录的处置结果,以及将所述处置结果对应的报警原因标签添加至所述第一报警记录;若所述历史报警数据中第二报警记录不存在处置结果,则将与所述第二报警记录的间隔时长小于预设时长的前一条报警记录对应的报警原因标签添加至所述第二报警记录。
可选地,所述模型精确度影响的算法为以下至少一种:互信息算法、F-分数算法、最大相关性与最小冗余度算法、前后向选择算法、随机森林算法。
可选地,所述机器学习模型为以下至少一种:逻辑回归模型、支持向量机、XGBoost、神经网络模型。
本发明提供一种基于机器学习的矿井传感器报警原因分类装置,所述装置包括:数据获取模块,用于获取矿井传感器在报警前后预设时间段内的监测数据;报警原因分类模块,用于将所述监测数据输入预先训练的机器学习模型,确定所述矿监测数据对应的报警原因类型;所述机器学习模型由所述矿井传感器的历史报警数据的数据特征训练得到。
可选地,还包括机器学习模型的训练模块,用于:获取历史报警数据,及对所述历史报警数据进行预处理;所述预处理包括异常值剔除、报警原因标签添加;根据所述预处理后的历史报警数据构建多个子特征,以及对所述多个子特征进行模型精确度影响筛选,得到对模型精确度影响高的多个目标特征;将预处理后的历史报警数据及所述训练集对应的报警原因标签、目标特征分为训练集和测试集;根据所述训练集训练机器学习模型,以及根据所述测试集测试所述机器学习模型,直至所述机器学习模型的分类效果满足预设评价指标。
可选地,所述机器学习模型的训练模块,具体用于:获取所述历史报警数据中第一报警记录的处置结果,以及将所述处置结果对应的报警原因标签添加至所述第一报警记录;若所述历史报警数据中第二报警记录不存在处置结果,则将与所述第二报警记录的间隔时长小于预设时长的前一条报警记录对应的报警原因标签添加至所述第二报警记录。
本发明提供的基于机器学习的矿井传感器报警原因分类方法及装置,机器学习模型的训练时基于矿井传感器的历史报警数据的数据特征进行,以及以矿井传感器的报警前后预设时间段内的监测数据输入模型进行分类,扩大了数据基础,充分挖掘了报警相关数据的特征,提炼得到更多、更明显的数据特点,有利于模型精确度及分类效果的提高,提高了报警原因分类的准确度,精准识别传感器真实报警,正确判断井下危险状态,对指导矿井安全开采,协助监控部门提高管理决策水平具有重要意义。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明的一个实施例中一种基于机器学习的矿井传感器报警原因分类方法的示意性流程图;
图2为本发明的一个实施例中报警数据对应特征的重要程度示意图;
图3为本发明的一个实施例中一种基于机器学习的矿井传感器报警原因分类装置的结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例利用机器学习算法实现传感器报警原因的分类,能够精准识别传感器真实报警,对指导矿井安全开采,协助监控部门提高管理决策水平具有重要意义。
图1是本发明的一个实施例中一种基于机器学习的矿井传感器报警原因分类方法的示意性流程图,该方法包括以下步骤:
S102,获取矿井传感器在报警前后预设时间段内的监测数据。
在监控系统获取到矿井传感器报警后,获取该传感器在报警前后预设时间段内的监测数据。该前后预设时间段可以是报警当日,示例性地,当日的监测数据包括报警前的监测数据(例如自当日0时开始、至报警开始时刻结束)、报警期间内的监测数据(自报警开始时刻开始、至报警结束时刻结束)以及报警结束后的监测数据(例如自报警结束时刻开始、至结束时刻后经过1分钟、10分钟、1小时结束)。
在本实施例中,针对传感器报警原因进行分类时,不仅仅依赖于报警期间内的监测数据进行,而是将报警前后预设时间段内的报警开始前、报警结束后的监测数据一并作为分类的数据基础,通过报警期间数据的特征、报警与非报警期间数据之间的关系特征以及当日数据的整体特征,扩大了数据基础,从而提炼得到更多、更明显的数据特点,结合确定报警原因的类别,从而提高报警原因分类的精确度。
S104,将监测数据输入预先训练的机器学习模型,确定矿井传感器的报警原因类型。
其中,该机器学习模型由矿井传感器的历史报警数据对应的数据特征训练得到。该数据特征可以分为以下三类:报警期间数据的特征、报警当日数据的特征、报警期间数据与报警当日非报警数据的关系特征。该报警期间数据的特征,例如可以是最高值Max、最低值Min、报警持续时间等,表达的是报警数据自身的特点;该报警当日数据的特征,例如可以是全天波动次数、均值等,表达的是报警当日更长时段内数据的整体特点;该报警期间数据与报警当日非报警数据的关系特征,例如可以是Max与报警前最后一个点的差值、Min与报警后第一个点的时间间隔等,表达的是报警数据与非报警数据之间的关系特点。
基于上述数据对机器学习模型进行训练,该机器学习模型为以下至少一种:逻辑回归模型、支持向量机(Support Vector Machines,SVM)、XGBoost、神经网络模型,至机器学习模型的分类效果满足预设的评价指标结束训练。
可选地,本实施例还对上述历史报警数据对应的报警原因进行了精细分类,上述报警原因类型可以包括以下四类:传感器调校、车辆尾气排放、爆破、真实报警及其他。
以一氧化碳传感器为例,其报警的真实原因通常包括以下情况:
(1)调校,指采用空气样和标准气样按产品说明书对一氧化碳传感器进行调校,保证一氧化碳传感器可以准确检测井下环境实际浓度。对传感器进行调校操作时,充入的气体浓度超过一氧化碳传感器报警浓度阈值,导致传感器误报警;
(2)尾气排放,指胶轮车、单轨吊车、铲车等车辆在井下工作时排放尾气,导致一氧化碳浓度升高,导致传感器误报警;
(3)爆破,指井下的炮采工作面和炮掘巷道内进行爆破作业时产生大量一氧化碳,导致传感器误报警;
(4)真实报警及其他,其包含因开采作业导致的真实报警或不属于上述三类情况的误报警,但该类误报警与真实报警的数据特征相似,无法区分。
结合上述三类特征类型对上述报警原因类型的特点进行示例性介绍。以调校为例,其在传感器处注入标准气样呈现突然性,即不存在一氧化碳浓度缓慢上升的过程,而是突变超过报警阈值且最大值达到一个较高浓度水平,持续时间短,可以理解的是井下一氧化碳的增加通常是一个缓慢的过程。以尾气排放为例,车辆排放一氧化碳通常为规律性的,即各时刻一氧化碳的增加量保持在固定的水平,持续时间更长,而井下一氧化碳的增加通常不具有该规律性。
可选地,本实施例提供了各类特征的具体选择参数,如下:
(1)报警期间数据的特征
报警期间内最高值、报警期间内最低值、报警期间的时长。
(2)报警当日数据的特征
报警当日均值、当日数据波动次数、当日数据在基准值以上的波动次数、当日数据在第一阈值以上的波动次数、当日数据在第二阈值以上的波动次数;
(3)报警期间数据与报警当日非报警数据的关系特征
报警期间内最高值的时间点和报警结束后第一个记录点的时间间隔、报警期间内最高值的时间点和报警开始前最后一个记录点的时间间隔、报警期间内最高值和报警结束后第一记录点的差值、报警期间内最高值和报警开始前最后一个记录点的差值、报警期间内最低值的时间点和报警结束后第一个记录点的时间间隔、报警期间内最低值的时间点和报警开始前最后一个记录点的时间间隔、报警期间内最低值和报警结束后第一个记录点的差值、报警期间内最低值和报警开始前最后一个记录点的差值、报警期间内第一个记录点和报警开始前最后一个记录点的差值、报警期间内第一个记录点和报警开始前最后一个记录点的时间间隔、报警期间内最后一个记录点和报警结束后第一个记录点的时间间隔、报警期间内最后一个记录点和报警结束后第一个记录点的差值。
本实施例提供的基于机器学习的矿井传感器报警原因分类方法,机器学习模型的训练时基于矿井传感器的历史报警数据的数据特征进行,以及以矿井传感器的报警前后预设时间段内的监测数据输入模型进行分类,扩大了数据基础,充分挖掘了报警相关数据的特征,提炼得到更多、更明显的数据特点,有利于模型精确度及分类效果的提高,提高了报警原因分类的准确度,精准识别传感器真实报警,正确判断井下危险状态,对指导矿井安全开采,协助监控部门提高管理决策水平具有重要意义。
可选地,上述机器学习模型的训练过程如下:
首先,获取历史报警数据,及对历史报警数据进行预处理。
预处理可以包括异常值剔除、报警原因标签添加。具体地,针对相隔时长较短的多次报警,且其中一条处置而后续其他报警未处理的情况,可以按照以下方式添加标签:获取历史报警数据中第一报警记录的处置结果,以及将处置结果对应的报警原因标签添加至第一报警记录;若历史报警数据中第二报警记录不存在处置结果,则将与第二报警记录的间隔时长小于预设时长的前一条报警记录对应的报警原因标签添加至第二报警记录。即,以该前一条报警记录的处置结果(例如为尾气排放),作为第二报警记录的报警原因标签(尾气排放)。
其次,根据预处理后的历史报警数据构建多个子特征,以及对多个子特征进行模型精确度影响筛选,得到对模型精确度影响高的多个目标特征。
模型精确度影响的算法可以是以下一种或多种:互信息算法、F-分数算法(F-score)、最大相关性与最小冗余度算法(Max-Relevance and Min-Redundancy,MRMR)、前后向选择算法、随机森林算法。
然后,将预处理后的历史报警数据及训练集对应的报警原因标签、目标特征分为训练集和测试集。
最后,根据训练集训练机器学习模型,以及根据测试集测试机器学习模型,直至机器学习模型的分类效果满足预设评价指标。
以下实施例以一氧化碳CO传感器报警数据为例,详细介绍上述方法。
根据实际情况将CO传感器报警原因分为:调校、尾气排放、爆破、其他四类。调校是指采用空气样和标准气样按产品说明书对CO传感器进行调校,保证CO传感器可以准确检测井下环境实际浓度。对传感器进行调校操作时,充入的气体浓度超过CO传感器报警浓度值,导致传感器误报警;尾气排放是指胶轮车、单轨吊车、铲车等车辆在井下工作时排放尾气,导致CO浓度升高,传感器误报警;爆破是指井下在炮采工作面和炮掘巷道内进行爆破作业时产生大量CO,导致传感器误报警;其他包含因开采作业导致的真实报警或不属于上述三类情况的误报警,但与真实报警的数据特征相似,无法区分。
(1)数据预处理
获取近一年内CO传感器所有报警的当日一整天监测数据,剔除数据中的异常值,比如-9999,-9998等超量程值。然后,根据其报警处置结果,进行标记。四类报警原因分别标记为:调校1、尾气排放2、爆破3、其他4,数据集示例如下:
在实际数据中,会出现同一个传感器一天内多次报警,且其中一条报警处置结果为尾气排放,其余未处理。因井下车辆不太可能在报警后马上离开,那么每次发动车辆时,都会使CO浓度过高导致报警。在对类似数据进行打标时可以将当日的多条报警均标记为尾气排放。
(2)特征选择
结合不同报警类型的实际情况与数据特征,按下列三个方面区分不同报警类型:
1.报警时数据特征:最高值Max,最低值Min,报警持续时间等;
2.全天数据特征:全天波动次数,均值等;
3.报警数据与非报警数据之间的关系:Max与报警前最后一个点前的差值,Min与报警后第一个点的持续时间等。
基于以上3大类特征构造了共60余个子特征,采用互信息、F-score、MRMR、前后向选择、随机森林特征重要程度等方法筛选出了20个对模型精确度有重大影响的特征,如下:
1.当日CO报警均值(svg_all_day)
2.当日CO数据波动次数(fluctuationcount)
3.当日CO数据在1以上的波动次数(onecount)
4.当日CO数据在5以上的波动次数(fivecount)
5.当日CO数据在基准值以上的波动次数(eightcount)
6.报警内最高值(max_value)
7.报警内最低值(min_value)
8.报警时长(alarm_duration)
9.报警内最高值的时间点和报警后第一个记录点的时间间隔(max_after_first_duration)
10.报警内最高值的时间点和报警前最后一个记录点的时间间隔(max_pre_last_duration)
11.报警内最高值和报警后第一记录点的差值(max_after_first)
12.报警内最高值和报警前最后一个记录点的差值(max_pre_last)
13.报警内最低值的时间点和报警后第一个记录点的时间间隔(min_after_first_duration)
14.报警内最低值的时间点和报警前最后一个记录点的时间间隔(min_pre_last_duration)
15.报警内最低值和报警后第一个记录点的差值(min_after_first)
16.报警内最低值和报警前最后一个记录点的差值(min_pre_last)
17.报警内第一个记录点和报警前最后一个记录点的差值(start_pre_last)
18.报警内第一个记录点和报警前最后一个记录点的时间间隔(start_pre_last_duration)
19.报警内最后一个记录点和报警后第一个记录点的时间间隔(end_after_first_duration)
20.报警内最后一个记录点和报警后第一个记录点的差值(end_after_first)
参见图2所示的报警数据对应特征的重要程度示意图,示出了上述20个特征的重要程度得分。
(3)构建分类模型
基于上述20个特征,可以采用逻辑回归、SVM、XGBoost、神经网络等多种分类算法,本实施例以采用XGBoost模型为例。
(4)模型训练
将数据集中67%的数据划分为训练集,剩余为测试集。在训练集上通过十折交叉验证方法,训练多种参数组合的模型效果,最终确定参数为:树的深度为10,学习速率为0.8,损失函数为multi:softprob(与softmax原理类似),其余参数为默认值,此时模型分类效果最好。
在2513条测试集上验证模型分类效果,各类评价指标为:准确度:84%,精确度:83%,召回率:86%。混淆矩阵如下表所示:
图3是本发明的一个实施例中一种基于机器学习的矿井传感器报警原因分类装置的结构示意图,该装置包括:
数据获取模块301,用于获取矿井传感器在报警前后预设时间段内的监测数据;
报警原因分类模块302,用于将所述监测数据输入预先训练的机器学习模型,确定所述监测数据对应的报警原因类型;所述机器学习模型由所述矿井传感器的历史报警数据的数据特征训练得到。
本实施例提供的基于机器学习的矿井传感器报警原因分类装置,机器学习模型的训练时基于矿井传感器的历史报警数据的数据特征进行,以及以矿井传感器的报警前后预设时间段内的监测数据输入模型进行分类,扩大了数据基础,充分挖掘了报警相关数据的特征,提炼得到更多、更明显的数据特点,有利于模型精确度及分类效果的提高,提高了报警原因分类的准确度,精准识别传感器真实报警,正确判断井下危险状态,对指导矿井安全开采,协助监控部门提高管理决策水平具有重要意义。
可选地,作为一个实施例,所述数据特征包括以下至少一项:报警期间内最高值、报警期间内最低值、报警期间的时长、报警当日均值、当日数据波动次数、当日数据在基准值以上的波动次数、当日数据在第一阈值以上的波动次数、当日数据在第二阈值以上的波动次数、报警期间内最高值的时间点和报警结束后第一个记录点的时间间隔、报警期间内最高值的时间点和报警开始前最后一个记录点的时间间隔、报警期间内最高值和报警结束后第一记录点的差值、报警期间内最高值和报警开始前最后一个记录点的差值、报警期间内最低值的时间点和报警结束后第一个记录点的时间间隔、报警期间内最低值的时间点和报警开始前最后一个记录点的时间间隔、报警期间内最低值和报警结束后第一个记录点的差值、报警期间内最低值和报警开始前最后一个记录点的差值、报警期间内第一个记录点和报警开始前最后一个记录点的差值、报警期间内第一个记录点和报警开始前最后一个记录点的时间间隔、报警期间内最后一个记录点和报警结束后第一个记录点的时间间隔、报警期间内最后一个记录点和报警结束后第一个记录点的差值。
可选地,作为一个实施例,所述报警原因类型包括:传感器调校、车辆尾气排放、爆破、真实报警及其他。
可选地,作为一个实施例,还包括机器学习模型的训练模块,用于:获取历史报警数据,及对所述历史报警数据进行预处理;所述预处理包括异常值剔除、报警原因标签添加;根据所述预处理后的历史报警数据构建多个子特征,以及对所述多个子特征进行模型精确度影响筛选,得到对模型精确度影响高的多个目标特征;将预处理后的历史报警数据及所述训练集对应的报警原因标签、目标特征分为训练集和测试集;根据所述训练集训练机器学习模型,以及根据所述测试集测试所述机器学习模型,直至所述机器学习模型的分类效果满足预设评价指标。
可选地,作为一个实施例,所述机器学习模型的训练模块,具体用于:获取所述历史报警数据中第一报警记录的处置结果,以及将所述处置结果对应的报警原因标签添加至所述第一报警记录;若所述历史报警数据中第二报警记录不存在处置结果,则将与所述第二报警记录的间隔时长小于预设时长的前一条报警记录对应的报警原因标签添加至所述第二报警记录。
可选地,作为一个实施例,所述模型精确度影响的算法为以下至少一种:互信息算法、F-分数算法、最大相关性与最小冗余度算法、前后向选择算法、随机森林算法。
可选地,作为一个实施例,所述机器学习模型为以下至少一种:逻辑回归模型、支持向量机、XGBoost、神经网络模型。
上述实施例提供的基于机器学习的矿井传感器报警原因分类装置能够实现上述基于机器学习的矿井传感器报警原因分类方法的实施例中的各个过程,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述基于机器学习的矿井传感器报警原因分类方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
当然,本领域技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令控制装置来完成,所述的程序可存储于一计算机可读取的存储介质中,所述程序在执行时可包括如上述各方法实施例的流程,其中所述的存储介质可为存储器、磁盘、光盘等。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种基于机器学习的矿井传感器报警原因分类方法,其特征在于,所述方法包括:
获取矿井传感器在报警前后预设时间段内的监测数据;
将所述监测数据输入预先训练的机器学习模型,确定所述监测数据对应的报警原因类型;所述机器学习模型由所述矿井传感器的历史报警数据的数据特征训练得到。
2.根据权利要求1所述方法,其特征在于,所述数据特征包括以下至少一项:报警期间内最高值、报警期间内最低值、报警期间的时长、报警当日均值、当日数据波动次数、当日数据在基准值以上的波动次数、当日数据在第一阈值以上的波动次数、当日数据在第二阈值以上的波动次数、报警期间内最高值的时间点和报警结束后第一个记录点的时间间隔、报警期间内最高值的时间点和报警开始前最后一个记录点的时间间隔、报警期间内最高值和报警结束后第一记录点的差值、报警期间内最高值和报警开始前最后一个记录点的差值、报警期间内最低值的时间点和报警结束后第一个记录点的时间间隔、报警期间内最低值的时间点和报警开始前最后一个记录点的时间间隔、报警期间内最低值和报警结束后第一个记录点的差值、报警期间内最低值和报警开始前最后一个记录点的差值、报警期间内第一个记录点和报警开始前最后一个记录点的差值、报警期间内第一个记录点和报警开始前最后一个记录点的时间间隔、报警期间内最后一个记录点和报警结束后第一个记录点的时间间隔、报警期间内最后一个记录点和报警结束后第一个记录点的差值。
3.根据权利要求1所述方法,其特征在于,所述报警原因类型包括:传感器调校、车辆尾气排放、爆破、真实报警及其他。
4.根据权利要求1所述方法,其特征在于,所述机器学习模型的训练过程如下:
获取历史报警数据,及对所述历史报警数据进行预处理;所述预处理包括异常值剔除、报警原因标签添加;
根据所述预处理后的历史报警数据构建多个子特征,以及对所述多个子特征进行模型精确度影响筛选,得到对模型精确度影响高的多个目标特征;
将预处理后的历史报警数据及所述训练集对应的报警原因标签、目标特征分为训练集和测试集;
根据所述训练集训练机器学习模型,以及根据所述测试集测试所述机器学习模型,直至所述机器学习模型的分类效果满足预设评价指标。
5.根据权利要求4所述方法,其特征在于,所述报警原因标签添加包括:
获取所述历史报警数据中第一报警记录的处置结果,以及将所述处置结果对应的报警原因标签添加至所述第一报警记录;
若所述历史报警数据中第二报警记录不存在处置结果,则将与所述第二报警记录的间隔时长小于预设时长的前一条报警记录对应的报警原因标签添加至所述第二报警记录。
6.根据权利要求4所述方法,其特征在于,所述模型精确度影响的算法为以下至少一种:互信息算法、F-分数算法、最大相关性与最小冗余度算法、前后向选择算法、随机森林算法。
7.根据权利要求1所述方法,其特征在于,所述机器学习模型为以下至少一种:逻辑回归模型、支持向量机、XGBoost、神经网络模型。
8.一种基于机器学习的矿井传感器报警原因分类装置,其特征在于,所述装置包括:
数据获取模块,用于获取矿井传感器在报警前后预设时间段内的监测数据;
报警原因分类模块,用于将所述监测数据输入预先训练的机器学习模型,确定所述监测数据对应的报警原因类型;所述机器学习模型由所述矿井传感器的历史报警数据的数据特征训练得到。
9.根据权利要求8所述装置,其特征在于,还包括机器学习模型的训练模块,用于:
获取历史报警数据,及对所述历史报警数据进行预处理;所述预处理包括异常值剔除、报警原因标签添加;
根据所述预处理后的历史报警数据构建多个子特征,以及对所述多个子特征进行模型精确度影响筛选,得到对模型精确度影响高的多个目标特征;
将预处理后的历史报警数据及所述训练集对应的报警原因标签、目标特征分为训练集和测试集;
根据所述训练集训练机器学习模型,以及根据所述测试集测试所述机器学习模型,直至所述机器学习模型的分类效果满足预设评价指标。
10.根据权利要求9所述装置,其特征在于,所述机器学习模型的训练模块,具体用于:
获取所述历史报警数据中第一报警记录的处置结果,以及将所述处置结果对应的报警原因标签添加至所述第一报警记录;
若所述历史报警数据中第二报警记录不存在处置结果,则将与所述第二报警记录的间隔时长小于预设时长的前一条报警记录对应的报警原因标签添加至所述第二报警记录。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110794119.0A CN113688863A (zh) | 2021-07-14 | 2021-07-14 | 基于机器学习的矿井传感器报警原因分类方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110794119.0A CN113688863A (zh) | 2021-07-14 | 2021-07-14 | 基于机器学习的矿井传感器报警原因分类方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113688863A true CN113688863A (zh) | 2021-11-23 |
Family
ID=78576994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110794119.0A Pending CN113688863A (zh) | 2021-07-14 | 2021-07-14 | 基于机器学习的矿井传感器报警原因分类方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113688863A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116866520A (zh) * | 2023-07-05 | 2023-10-10 | 上海迪成智能科技有限公司 | 一种基于ai的单轨吊安全运行实时监控管理系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107976992A (zh) * | 2017-11-29 | 2018-05-01 | 东北大学 | 基于图半监督支持向量机的工业过程大数据故障监测方法 |
CN108268893A (zh) * | 2018-01-03 | 2018-07-10 | 浙江图讯科技股份有限公司 | 一种基于机器学习的化工园区预警方法及装置 |
CN110245846A (zh) * | 2019-05-28 | 2019-09-17 | 国网浙江省电力有限公司绍兴供电公司 | 基于XGBoost算法的电流突变原因判别方法 |
CN110319982A (zh) * | 2019-06-03 | 2019-10-11 | 清华大学合肥公共安全研究院 | 基于机器学习的埋地式燃气管线泄漏判断方法 |
CN110347839A (zh) * | 2019-07-18 | 2019-10-18 | 湖南数定智能科技有限公司 | 一种基于生成式多任务学习模型的文本分类方法 |
CN110910615A (zh) * | 2019-11-22 | 2020-03-24 | 华中科技大学 | 一种楼宇火警报警分类方法及系统 |
CN111563424A (zh) * | 2020-04-20 | 2020-08-21 | 清华大学 | 基于半监督学习的行人再识别方法及装置 |
CN111984705A (zh) * | 2020-08-20 | 2020-11-24 | 广东电网有限责任公司电力科学研究院 | 一种电能质量监测装置的精度评估管理方法和装置 |
WO2021063486A1 (en) * | 2019-10-01 | 2021-04-08 | Huawei Technologies Co., Ltd. | Automatic root cause analysis of failures in autonomous vehicle |
-
2021
- 2021-07-14 CN CN202110794119.0A patent/CN113688863A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107976992A (zh) * | 2017-11-29 | 2018-05-01 | 东北大学 | 基于图半监督支持向量机的工业过程大数据故障监测方法 |
CN108268893A (zh) * | 2018-01-03 | 2018-07-10 | 浙江图讯科技股份有限公司 | 一种基于机器学习的化工园区预警方法及装置 |
CN110245846A (zh) * | 2019-05-28 | 2019-09-17 | 国网浙江省电力有限公司绍兴供电公司 | 基于XGBoost算法的电流突变原因判别方法 |
CN110319982A (zh) * | 2019-06-03 | 2019-10-11 | 清华大学合肥公共安全研究院 | 基于机器学习的埋地式燃气管线泄漏判断方法 |
CN110347839A (zh) * | 2019-07-18 | 2019-10-18 | 湖南数定智能科技有限公司 | 一种基于生成式多任务学习模型的文本分类方法 |
WO2021063486A1 (en) * | 2019-10-01 | 2021-04-08 | Huawei Technologies Co., Ltd. | Automatic root cause analysis of failures in autonomous vehicle |
CN110910615A (zh) * | 2019-11-22 | 2020-03-24 | 华中科技大学 | 一种楼宇火警报警分类方法及系统 |
CN111563424A (zh) * | 2020-04-20 | 2020-08-21 | 清华大学 | 基于半监督学习的行人再识别方法及装置 |
CN111984705A (zh) * | 2020-08-20 | 2020-11-24 | 广东电网有限责任公司电力科学研究院 | 一种电能质量监测装置的精度评估管理方法和装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116866520A (zh) * | 2023-07-05 | 2023-10-10 | 上海迪成智能科技有限公司 | 一种基于ai的单轨吊安全运行实时监控管理系统 |
CN116866520B (zh) * | 2023-07-05 | 2024-03-01 | 上海迪成智能科技有限公司 | 一种基于ai的单轨吊安全运行实时监控管理系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109557896B (zh) | 用于飞机故障检测的系统和方法 | |
CN114065613A (zh) | 基于深度迁移学习的多工况流程工业故障检测诊断方法 | |
EP3552067B1 (en) | Methods and systems for discovery of prognostic subsequences in time series | |
Maglaras et al. | Ocsvm model combined with k-means recursive clustering for intrusion detection in scada systems | |
CN108268893B (zh) | 一种基于机器学习的化工园区预警方法及装置 | |
CN108153211A (zh) | 报警参数的趋势分析和自动调谐的方法 | |
US11222202B2 (en) | Targeted testing and machine-learning systems for detecting and identifying machine behavior | |
CN113688863A (zh) | 基于机器学习的矿井传感器报警原因分类方法及装置 | |
CN110588658A (zh) | 一种基于综合模型检测驾驶员风险等级的方法 | |
CN112668873A (zh) | 矿山安全态势分析及预测预警方法 | |
CN117405177B (zh) | 电缆隧道有害气体泄漏预警方法、系统、设备及介质 | |
CN116504016B (zh) | 一种基于人工智能的火电厂安全监测预警方法及系统 | |
CN112116023B (zh) | 基于机器学习的轮胎漏气的实时检测方法及存储介质 | |
CN113760670A (zh) | 电缆接头异常预警方法、装置、电子设备和存储介质 | |
CN118277813B (zh) | 一种基于融合聚类算法的无人机飞行轨迹异常溯源方法 | |
CN114036998A (zh) | 一种基于机器学习对工业硬件进行故障检测的方法及系统 | |
CN113778766A (zh) | 基于多维特征的硬盘故障预测模型建立方法及其应用 | |
CN111724561A (zh) | 一种硫化矿石自燃监控方法及系统 | |
Sharma et al. | Multisensor data-fusion-based gas hazard prediction using DSET and 1DCNN for underground longwall coal mine | |
CN114117632A (zh) | 一种基于数据驱动的船舶动力装置运行状态分析系统 | |
CN117141265A (zh) | 一种智能无线充电桩的运行监测系统及监测方法 | |
CN117668892A (zh) | 一种敏感信息检测反馈方法、装置、设备及介质 | |
CN108275157B (zh) | 一种驾驶行为检测系统及方法 | |
CN114202907B (zh) | 一种火灾报警实时分类方法及系统 | |
CN114047693A (zh) | 面向充电过程的汽车电池火灾自适应防范方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |