CN117951616B - 一种局部通风机智能运维分析方法 - Google Patents
一种局部通风机智能运维分析方法 Download PDFInfo
- Publication number
- CN117951616B CN117951616B CN202410354003.9A CN202410354003A CN117951616B CN 117951616 B CN117951616 B CN 117951616B CN 202410354003 A CN202410354003 A CN 202410354003A CN 117951616 B CN117951616 B CN 117951616B
- Authority
- CN
- China
- Prior art keywords
- data
- rotating speed
- speed data
- abnormal
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 35
- 238000012423 maintenance Methods 0.000 title claims abstract description 33
- 230000002159 abnormal effect Effects 0.000 claims abstract description 166
- 230000011218 segmentation Effects 0.000 claims abstract description 94
- 230000005856 abnormality Effects 0.000 claims abstract description 50
- 238000000034 method Methods 0.000 claims abstract description 42
- 238000011156 evaluation Methods 0.000 claims abstract description 33
- 239000006185 dispersion Substances 0.000 claims description 19
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000007405 data analysis Methods 0.000 abstract description 4
- 230000000694 effects Effects 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 7
- 238000005070 sampling Methods 0.000 description 4
- 238000009423 ventilation Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000005641 tunneling Effects 0.000 description 3
- 238000004880 explosion Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 239000003245 coal Substances 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Testing Of Devices, Machine Parts, Or Other Structures Thereof (AREA)
Abstract
本发明涉及通风机数据分析技术领域,具体涉及一种局部通风机智能运维分析方法。本发明获取转速数据组成的待切分数据集;对电压数据与转速数据进行线性拟合,根据拟合转速数据与转速数据之间的数据异常特征和转速数据之间的数据离散程度,获得每个转速数据的数据异常可能性;将待切分数据集分割为异常数据集与正常数据集;根据异常数据集与正常数据集之间的数据差异程度与数量差异程度获得每个切分值的分割评价指标;获得最佳切分值,并确定待切分数据集中的所有异常转速数据,根据异常转速数据对局部通风机进行运维分析。本发明能够有效地区分正常转速数据与异常转速数据,进而能够准确识别局部通风机的异常运行。
Description
技术领域
本发明涉及通风机数据分析技术领域,具体涉及一种局部通风机智能运维分析方法。
背景技术
在煤矿生产中,为了准备新采区及回采工作面,都必须进行巷道掘进工作,掘金工作面只有一个出口,因此没有进风回风等回路,必须采用导风设施,而局部通风机是掘进通风的主要方法,存在广泛使用。局部通风机是井下局部地点通风所用的通风设备,利用动力用风筒导风把新鲜的分流风流送入到掘进工作面,从而完成通风。掘进工作面经常会因为局部通风机供电不可靠,从而发生瓦斯爆炸的恶性事件,一旦停止运转掘进工作面会很快聚集瓦斯,碰见货源即可能发生爆炸。
现有技术对局部通风机进行异常分析时,常利用通风机转速与电压之间的关系,通过孤立森林算法确定转速的异常转速数据,但是由于传统的孤立森林算法会采用随机的切分值对所有转速数据进行分割,会导致无法有效地区分正常转速数据与异常转速数据,进而无法准确识别局部通风机的异常运行。
发明内容
为了解决传统的孤立森林算法会采用随机的切分值对所有转速数据进行分割,会导致无法有效地区分正常转速数据与异常转速数据,进而无法准确识别局部通风机的异常运行的技术问题,本发明的目的在于提供一种局部通风机智能运维分析方法,所采用的技术方案具体如下:
一种局部通风机智能运维分析方法,所述方法包括:
获取局部通风机的电压数据与对应的转速数据;获取所有转速数据组成的待切分数据集;
在二维坐标系中,对所述电压数据与所述转速数据进行线性拟合,获得拟合转速数据;获得所述拟合转速数据与所述转速数据之间的数据异常特征;获得待切分数据集中每个所述转速数据与其他转速数据之间的数据离散程度;根据所述数据异常特征与所述数据离散程度获得每个转速数据的数据异常可能性;
利用孤立森林算法,依次将转速数据作为切分值,通过切分值将所述待切分数据集进行分割,获得异常数据集与正常数据集;根据所述异常数据集与所述正常数据集之间的转速数据差异与数据异常可能性差异,获得所述异常数据集与所述正常数据集之间的数据差异程度;根据所述异常数据集与所述正常数据集之间的数据差异程度与数量差异程度,获得每个切分值的分割评价指标;
根据所述分割评价指标获得孤立森林算法中的最佳切分值,并确定所述待切分数据集中的所有异常转速数据;
根据异常转速数据的数量对局部通风机的运行状态进行运维分析。
进一步地,所述数据异常特征的获取方法包括:
获取线性拟合时的拟合优度;
计算每个所述拟合转速数据与对应所述转速数据之间的数据值差异;
将所述数据值差异与所述拟合优度的比值作为所述拟合转速数据与所述转速数据之间的数据异常特征。
进一步地,所述数据离散程度的获取方法包括:
获得每个转速数据相对于待切分数据集的第三离散程度;
计算待切分数据集内每个所述转速数据与其他每个转速数据之间的数据值差异并累加求和,获得待切分数据集中每个所述转速数据与其他每个转速数据之间的数据差异性;
将所述第三离散程度与所述数据差异性之间的乘积作为待切分数据集中每个所述转速数据与其他转速数据之间的数据离散程度。
进一步地,所述第三离散程度获取方法包括:
计算每个所述转速数据与所述待切分数据集内所有转速数据值的中位数之间的差异作为第一离散程度;
计算每个所述转速数据与所述待切分数据集内所有转速数据值均值之间的差异作为第二离散程度;
将所述第一离散程度与所述第二离散程度之间的和作为每个所述转速数据相对于待切分数据集的第三离散程度。
进一步地,所述数据异常可能性的获取方法包括:
将所述数据离散程度与所述数据异常特征之间的乘积作为所述数据异常可能性。
进一步地,获得所述异常数据集与所述正常数据集之间的数据差异程度,包括:
计算所述异常数据集内每个所述转速数据的数据异常可能性与所述正常数据集内每个所述转速数据的数据异常可能性之间的差异作为数据异常可能性差异;
计算所述异常数据集内每个转速数据与所述正常数据集内每个转速数据之间的差异作为转速数据差异;
将所述数据异常可能性差异与所述转速数据差异之间的乘积求平均获得所述异常数据集与所述正常数据集之间的数据差异程度。
进一步地,所述数量差异程度的获取方法包括:
将所述异常数据集的数据数量与所述正常数据集的数据数量之间的差值绝对值作为所述数量差异程度。
进一步地,所述分割评价指标的获取方法包括:
将所述数量差异程度与所述数据差异程度的乘积作为所述分割评价指标。
进一步地,所述最佳切分值的获取方法包括:
将待切分数据集中的所有转速数据按照大小顺序进行排序;根据排序结果依次将转速数据作为切分值;计算每个切分值对应的分割评价指标;以分割评价指标最大的切分值作为切分点,以切分点为中心,与左右两侧相邻预设数量个转速数据的数据值均值作为待切分数据集的最佳切分值。
进一步地,根据异常转速数据的数量对局部通风机的运行状态进行运维分析,包括:
获取某个时刻前后共预设数量个转速数据中异常转速数据的数量;
将预设数量个转速数据中,异常转速数据的数量与转速数据数量之间的比值作为当前时刻的设备异常特征;
预设第一阈值与第二阈值,当所述设备异常特征不小于第一阈值时,认为局部通风机在当前时刻存在安全隐患,当所述设备异常特征不小于第二阈值时,认为局部通风机在当前时刻存在严重异常。
本发明具有如下有益效果:
本发明获取局部通风机的电压数据与转速数据,并获取所有转速数据组成的待切分数据集,便于后续利用孤立森林算法对其进行分割;为了对转速数据的数据异常特征进行研究,对电压数据与转速数据进行线性拟合,通过拟合结果的好坏与拟合转速数据和转速数据之间的数据差异来反映转速数据的数据异常特征;为了获得每个转速数据与待切分数据集中所有转速数据之间的转速差异,获得待切分数据集中每个所述转速数据与其他转速数据之间的数据离散程度,反映了每个转速数据与待切分数据集整体的距离与密度;根据数据异常特征与数据离散程度获得每个转速数据的数据异常可能性,反映出转速数据为异常转速数据的可能性,有利于尽早排除异常值对后续数据分析的影响;利用孤立森林算法,通过切分值对待切分数据集进行分割,获得异常数据集与正常数据集;根据异常数据集与正常数据集之间的转速数据差异与数据异常可能性差异获得异常数据集与正常数据集之间的数据差异程度,数据差异程度反映出异常数据集与正常数据集中每个转速数据之间的数据差异;为了研究切分值的切分效果,所以对异常数据集与正常数据集之间的数据差异程度与数量差异程度进行研究,获得分割评价指标,反映出异常数据集与正常数据集之间的数量差异与数据差异,根据差异能够体现出切分结果的好坏,并最终确定最佳切分值。并利用最佳切分值进行孤立森林算法,获得待切分数据集中的所有异常转速数据,根据异常转速数据的数量对局部通风机的运行状态进行运维分析。本发明能够有效地区分正常转速数据与异常转速数据,进而能够准确识别局部通风机的异常运行。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的一种局部通风机智能运维分析方法流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种局部通风机智能运维分析方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种局部通风机智能运维分析方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种局部通风机智能运维分析方法流程图,该方法包括:
步骤S1:获取局部通风机的电压数据与转速数据;获取所有转速数据组成的待切分数据集。
本发明实施例主要提供一种局部通风机智能运维分析方法,针对于局部通风机的运行维护,需要首先获取局部通风机的运行数据进行后续分析。由于电压表示局部通风机的外部输入状态,有效反应局部通风机的工作环境,而通风机的转速能够反映出局部通风机的工作状态,为了后续对电压数据与转速数据进行线性拟合,因此可以将电压数据作为外部参考数据,对局部通风机的转速数据进行监测。故本发明实施例中需要获取局部通风机的电压数据与转速数据。
本发明一个实施例中,在局部通风机稳定工作时,从局部通风机的控制系统的数据库中获取每分钟的转速数据以及计算该时间段内的平均电压,将平均电压作为该时间段的电压数据,由此获得每分钟的电压数据与转速数据。
由于后续要利用孤立森林算法对转速数据进行分析,而孤立森林算法需要选择一个切分值对数据集进行分割,所以本发明实施例中需要获取所有转速数据组成的待切分数据集。
本发明一个实施例中,记录局部通风机一个小时内的所有电压数据与对应转速数据,由此获得60个转速数据组成的初始待切分数据集以及每个转速数据对应的电压数据。接着利用Bagging抽样算法对初始待切分数据集进行抽样,从中选取75%的转速数据组成待切分数据集。
需要说明的是,在本发明其他实施例中,可以通过其他数据采样算法进行转速数据采样,进而获得待切分数据集,且抽样算法的具体步骤为本领域技术人员所熟知的技术手段,在此不做限定及赘述。
步骤S2:在二维坐标系中,对电压数据与转速数据进行线性拟合,获得拟合转速数据;获得拟合转速数据与转速数据之间的数据异常特征;获得待切分数据集中每个转速数据与其他转速数据之间的数据离散程度;根据数据异常特征与数据离散程度获得每个转速数据的数据异常可能性。
在正常情况下,局部通风机在工作时的运行状态应当为随着电压不断增大,局部通风机的转速逐渐增大,此时,局部通风机的转速数据与电压数据之间呈线性关系,所以可以将局部通风机的电压数据与转速数据进行线性拟合,获得拟合转速数据,通过比较拟合转速数据与实际情况的转速数据之间的差异,可以得知拟合转速数据与实际情况的转速数据之间数据异常特征。
优选地,本发明一个实施例中,数据异常特征的获取方法包括:
通过现有技术中的拟合优度计算公式获取线性拟合时的拟合优度,拟合优度越小,线性拟合的效果越差,此时转速数据受异常转速数据的干扰程度越大;计算每个拟合转速数据与对应转速数据之间的数据值差异,数据值差异越大,说明拟合转速数据与转速数据之间的误差情况越大;将数据值差异与拟合优度的比值作为拟合转速数据与转速数据之间的数据异常特征,数据异常特征越大,拟合转速数据与对应转速数据之间的差异越大,转速数据异常的可能性越大。
在局部通风机稳定工作的正常情况下,待切分数据集的转速数据应当保持不变,此时待切分数据集中若存在异常转速数据,则异常转速数据与待切分数据集中每个转速数据之间存在转速差异。在待切分数据集内部,每个转速数据与待切分数据集整体之间应当有较强的集中性。而若是待切分数据集中存在异常转速数据时,异常转速数据与待切分数据集整体之间的离散程度较高,集中性较差。所以本发明实施例中,获得待切分数据集中每个转速数据与其他转速数据之间的数据离散程度。
优选地,本发明一个实施例中,数据离散程度的获取方法包括:
获得每个转速数据相对于待切分数据集的第三离散程度;计算每个转速数据与待切分数据集内所有转速数据之间的数据值差异并累加求和,获得每个转速数据与待切分数据集中所有转速数据之间的数据差异性;其中数据值差异越大,说明该转速数据与待切分数据集中每个转速数据的差异越大,该转速数据异常的可能性越大;将第三离散程度与数据差异性之间的乘积作为待切分数据集中每个转速数据与其他转速数据之间的数据离散程度。
优选地,本发明一个实施例中,第三离散程度获取方法包括:
计算每个转速数据与待切分数据集内所有转速数据值的中位数之间的差异作为第一离散程度;计算每个转速数据与待切分数据集内所有转速数据值均值之间的差异作为第二离散程度;通过每个转速数据与待切分数据集的中位数之间的差异和每个转速数据与待切分数据集的平均值之间的差异,反映出每个转速数据与待切分数据集整体的平均水平之间的差异,差异越大,说明转速数据相对于待切分数据集的离散程度越高;将第一离散程度与第二离散程度之间的和作为每个转速数据相对于待切分数据集的第三离散程度,第三离散程度越高,说明转速数据距离待切分数据集整体的距离越大,转速数据的密度越小,从而表现为异常转速数据的可能性越大。
由于孤立森林算法的目标是将异常转速数据更早分割出来,所以异常转速数据在孤立树中往往具有较短的路径长度。通过对待切分数据集中每个转速数据进行分析,获得转速数据的数据异常可能性可以尽早排除异常转速数据对于后续孤立森林算法的影响,使孤立树结构更加准确,异常检测的能力更加稳定。所以本发明实施例中,根据数据异常特征与数据离散程度获得每个转速数据的数据异常可能性。
优选地,本发明一个实施例中,数据异常可能性的获取方法包括:
将数据离散程度与数据异常特征之间的乘积作为数据异常可能性。本发明一个实施例中,数据异常可能性计算公式如下所示:
式中,表示第/>个转速数据的数据异常可能性;/>表示线性拟合的拟合优度;表示第/>个拟合转速数据;/>表示第/>个转速数据;/>表示待切分数据集所有转速数据值的中位数;/>表示待切分数据集所有转速数据值的均值;/>表示待切分数据集中的转速数据数量;/>表示待切分数据集中的转速数据序号;/>表示待切分数据集中第/>个转速数据;/>表示第/>个拟合转速数据与第/>个转速数据之间的数据差异情况;/>表示第/>个转速数据相对于待切分数据集的第三离散程度;/>表示第/>个转速数据与待切分数据集中所有转速数据之间的数据差异性;/>表示第/>个转速数据与待切分数据集中所有转速数据之间的数据离散程度。
在数据异常可能性计算公式中,第个拟合转速数据与第/>个转速数据之间的数据差异越大,且线性拟合的结果越差,第/>个拟合转速数据与第/>个转速数据之间的数据差异情况越大,此时第/>个转速数据越有可能是异常转速数据;第/>个转速数据距离待切分数据集整体之间的距离越大,第/>个转速数据周围的数据密度越小,说明第/>个转速数据相对于待切分数据集的第三离散程度越大;且第/>个转速数据与待切分数据集中所有转速数据之间的数据差异性越大,说明第/>个转速数据与待切分数据集每个数据都存在较大距离,第/>个转速数据相对于待切分数据集的数据离散程度越大,此时第/>个转速数据为异常转速数据的可能性越高,第/>个转速数据越有可能是异常转速数据。
步骤S3:利用孤立森林算法,依次将转速数据作为切分值,通过切分值将待切分数据集进行分割,获得异常数据集与正常数据集;根据异常数据集与正常数据集之间的转速数据差异与数据异常可能性差异,获得异常数据集与正常数据集之间的数据差异程度;根据异常数据集与正常数据集之间的数据差异程度与数量差异程度,获得每个切分值的分割评价指标。
孤立森林算法的算法目的在于利用较少的步骤将待切分数据集中的异常转速数据分割出来,所以在对待切分数据集进行划分时需要尽可能将少量的异常转速数据切分出来,同时保留所有正常数据,此时分割后的孤立树结构具有较强的不对称性。其中,不同的切分值会导致不同的切分结果,即切分后的孤立树结构对异常转速数据的检测能力不同,为了对待切分数据集的不同切分结果的好坏进行判断,因此本发明实施例中,需要获取对待切分数据集进行分割时的分割评价指标。
若是异常数据集中每个转速数据与正常数据集中每个转速数据之间都存在较大的数据差异,则异常数据集与正常数据集之间的数据差异程度越大,此时待切分数据集的切分效果越好。故本发明实施例中,需要获取异常数据集与正常数据集之间的数据差异程度。
优选地,本发明一个实施例中,获得异常数据集与正常数据集之间的数据差异程度,包括:
计算异常数据集内每个转速数据的数据异常可能性与正常数据集内每个转速数据的数据异常可能性之间的差异作为数据异常可能性差异,数据异常可能性差异越大,说明异常数据集每个转速数据相对于正常数据集中每个转速数据而言,更有可能是异常转速数据点;计算异常数据集内每个转速数据与正常数据集内每个转速数据之间的差异作为转速数据差异,转速数据差异越大,说明异常数据集中每个转速数据与正常数据集中每个转速数据之间的数据差异越大,异常数据集中的转速数据越有可能是异常转速数据;将数据异常可能性差异与转速数据差异之间的乘积求平均获得异常数据集与正常数据集之间的数据差异程度,数据差异程度越大,说明异常数据集内的整体数据为异常转速数据的可能性越高。
由于孤立森林算法对待切分数据集进行切分时,能够切分为数量较少的异常数据集与数量较多的正常数据集,所以异常数据集与正常数据集之间存在较为明显的数量差异,可以通过异常数据集与正常数据集之间的数量差异程度来反映切分值的切分效果。所以本发明实施例中,需要获得异常数据集与正常数据集之间的数量差异程度。
优选地,本发明一个实施例中,数量差异程度的获取方法包括:
将异常数据集的数据数量与正常数据集的数据数量之间的差值绝对值作为数量差异程度。
由于孤立森林算法中对每层孤立树结构进行构建时都需要对所有转速数据进行分割,异常数据集与正常数据集中数据的数量差异能够反映出此时切分值的分割效果,所以本发明实施例中,根据异常数据集与正常数据集之间的数据差异程度与数量差异程度获得每个切分值的分割评价指标。
优选地,本发明一个实施例中,分割评价指标的获取方法包括:
将数量差异程度与数据差异程度的乘积作为分割评价指标。本发明一个实施例中,分割评价指标的计算公式如下所示:
式中,表示第/>个转速数据的数据值作为切分值时的分割评价指标;表示异常数据集的转速数据数量;/>表示正常数据集的转速数据数量;/>表示正常数据集的转速数据序号;/>表示异常数据集的转速数据序号;/>表示异常数据集的第/>个转速数据的数据异常可能性;/>表示正常数据集的第/>个转速数据的数据异常可能性;/>表示异常数据集的第/>个转速数据的数据值;/>表示正常数据集的第/>个转速数据的数据值;表示异常数据集与正常数据集之间的数据差异程度;表示异常数据集与正常数据集之间的数量差异程度。
在分割评价指标计算公式中,数量差异程度越大,说明异常数据集与正常数据集之间不对称性越强,异常数据集与正常数据集之间的数据集差异越大,此时的切分效果越好,切分值的分割评价指标越高;异常数据集与正常数据集之间所有转速数据之间的数据差异越大,说明异常数据集与正常数据集之间的数据差异程度越大,此时异常数据集内异常转速数据的数量越多,此时的切分效果越好,切分值的分割评价指标越高。
至此,获得每个切分值的分割评价指标。
步骤S4:根据分割评价指标获得孤立森林算法中的最佳切分值,并确定待切分数据集中的所有异常转速数据。
在传统孤立森林算法中,孤立树的切分值是从转速数据中的最大值与最小值之间随机选取的,不同的随机选择会导致不同的二叉树结构,意味着每一次训练孤立树时训练的结果差异较大,使得算法的结果不稳定;另外,随机选取切分值可能会导致孤立树对数据的训练出现欠拟合或者过拟合;所以需要选取最佳切分值来构建更好的孤立树结构。所以本发明实施例中,根据分割评价指标获得孤立森林算法中的最佳切分值。
优选地,本发明一个实施例中,最佳切分值的获取方法包括:
将待切分数据集中的所有转速数据按照大小顺序进行排序;根据排序结果依次将转速数据作为切分值;设置步长为1对待切分数据集中的所有转速数据进行遍历;计算每个转速数据的数据值对应的分割评价指标;选取分割评价指标最大的转速数据作为切分点;以切分点为中心,与左右两侧相邻的预设数量个转速数据的数据值均值作为待切分数据集的最佳切分值。本发明一个实施例中,采用以切分点为中心,与左右两侧相邻5个转速数据的数据值均值作为待切分数据集的最佳切分值。
需要说明的是,在本发明其他实施例中,可以采用其他方法获取最佳切分值,具体方法为本领域技术人员所熟知的技术手段,在此不做限定及赘述。
利用最佳切分值能够构建更好的每层孤立树结构,并最终获得孤立森林结构并获得待切分数据集中的所有异常转速数据。
本发明一个实施例中,提供一种待切分数据集中的所有异常转速数据获取方法,包括:
利用最佳切分值对每层孤立树结构进行构建,直至形成完整的孤立森林结构,记录每个转速数据距离根节点的路径长度;根据每个转速数据的路径长度利用异常得分计算公式获取每个转速数据的异常得分;预设异常阈值为0.7,当转速数据的异常得分大于0.7时,认为该转速数据为异常转速数据。需要说明的是,孤立森林算法为本领域技术人员熟知的技术手段,其中涉及到的孤立树结构、孤立森林结构、根节点、路径长度、异常得分均为公知技术,在此不做赘述。
至此,获得待切分数据集中的所有异常转速数据。
步骤S5:根据异常转速数据的数量对局部通风机的运行状态进行运维分析。
获取所有异常转速数据后可以根据异常转速数据在某个时间点附近出现的频繁程度确定局部通风机在该时间点的运行状态。
优选地,本发明一个实施例中,根据异常转速数据的数量对局部通风机的运行状态进行运维分析,包括:
获取某个时刻前后共预设数量个转速数据中异常转速数据的数量;将预设数量个转速数据中,异常转速数据的数量与转速数据数量之间的比值作为当前时刻的设备异常特征;预设第一阈值与第二阈值,当设备异常特征不小于第一阈值时,认为局部通风机在当前时刻存在安全隐患,当设备异常特征不小于第二阈值时,认为局部通风机在当前时刻存在严重异常。本发明一个实施例中,设备异常情况的计算公式如下所示:
式中,表示第/>个时刻的设备异常特征;/>表示第/>个时刻前后/>个数据中异常转速数据的数量;/>表示第/>个时刻前后相邻的转速数据数量。
优选地,本发明一个实施例中,预设第一阈值设置为5%,预设第二阈值设置为20%。
本发明一个实施例中,当,表示局部通风机严重异常;当/>,表示局部通风机可能存在安全隐患;当/>,则表示局部通风机处于正常状态。需要说明的是,局部通风机的异常判定条件可以由实施人员自行设置,在此不做限定。
至此,完成对局部通风机的运行状态进行运维分析。
综上,本发明获取局部通风机的电压数据与转速数据,并获取所有转速数据组成的待切分数据集;对电压数据与转速数据进行线性拟合,通过拟合结果的好坏与拟合转速数据和转速数据之间的数据差异来反映转速数据的数据异常特征;获得每个转速数据与待切分数据集的离散程度;获得待切分数据集中每个所述转速数据与其他转速数据之间的数据离散程度;根据数据异常特征与数据离散程度获得每个转速数据的数据异常可能性;利用孤立森林算法,通过切分值对待切分数据集进行分割,获得异常数据集与正常数据集;根据异常数据集与正常数据集之间的转速数据差异与数据异常可能性差异获得异常数据集与正常数据集之间的数据差异程度;为了研究切分值的切分效果,所以对异常数据集与正常数据集之间的数据差异程度与数量差异程度进行研究,获得分割评价指标,反映出异常数据集与正常数据集之间的数量差异与数据差异,根据差异能够体现出切分结果的好坏,并最终确定最佳切分值。并利用最佳切分值进行孤立森林算法,获得待切分数据集中的所有异常转速数据,根据异常转速数据的数量对局部通风机的运行状态进行运维分析。本发明能够有效地区分正常转速数据与异常转速数据,进而能够准确识别局部通风机的异常运行。
一种局部通风机异常转速数据获取方法实施例:
现有技术对局部通风机进行异常分析时,常利用通风机转速与电压之间的关系,通过孤立森林算法确定转速的异常转速数据,但是由于传统的孤立森林算法会采用随机的切分值对所有转速数据进行分割,会导致无法有效地区分正常转速数据与异常转速数据的技术问题。为了解决该技术问题,提供一种局部通风机异常转速数据获取方法实施例。
步骤S1:获取局部通风机的电压数据与转速数据;获取所有转速数据组成的待切分数据集。
步骤S2:在二维坐标系中,对电压数据与转速数据进行线性拟合,获得拟合转速数据;获得拟合转速数据与转速数据之间的数据异常特征;获得待切分数据集中每个转速数据与其他转速数据之间的数据离散程度;根据数据异常特征与数据离散程度获得每个转速数据的数据异常可能性。
步骤S3:利用孤立森林算法,依次将转速数据作为切分值,通过切分值将待切分数据集进行分割,获得异常数据集与正常数据集;根据异常数据集与正常数据集之间的转速数据差异与数据异常可能性差异,获得异常数据集与正常数据集之间的数据差异程度;根据异常数据集与正常数据集之间的数据差异程度与数量差异程度,获得每个切分值的分割评价指标。
步骤S4:根据分割评价指标获得孤立森林算法中的最佳切分值,并确定待切分数据集中的所有异常转速数据。
由于步骤S1-步骤S4的具体实施方式在上述一种局部通风机智能运维分析方法中已经提及,在此不做赘述。
本实施例的技术效果:本发明获取局部通风机的电压数据与转速数据,并获取所有转速数据组成的待切分数据集,便于后续利用孤立森林算法对其进行分割;为了对转速数据的数据异常特征进行研究,对电压数据与转速数据进行线性拟合,通过拟合结果的好坏与拟合转速数据和转速数据之间的数据差异来反映转速数据的数据异常特征;获得每个转速数据与待切分数据集的离散程度,反映了每个转速数据与待切分数据集整体的距离与密度;为了获得每个转速数据与待切分数据集中所有转速数据之间的转速差异,获得每个转速数据与待切分数据集中所有转速数据之间的数据差异性;根据数据异常特征、离散程度与数据差异性获得每个转速数据的数据异常可能性,反映出转速数据为异常转速数据的可能性,有利于尽早排除异常值对后续数据分析的影响;利用孤立森林算法,通过切分值对待切分数据集进行分割,获得异常数据集与正常数据集,为了研究切分值的切分效果,所以对异常数据集与正常数据集之间的数据差异程度与数量差异程度进行研究,获得分割评价指标,反映出异常数据集与正常数据集之间的数量差异与数据差异,根据差异能够体现出切分结果的好坏,并最终确定最佳切分值。并利用最佳切分值进行孤立森林算法,获得待切分数据集中的所有异常转速数据。本实施例能够通过选取孤立森林算法的最佳切分值,有效地区分正常转速数据与异常转速数据。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
Claims (10)
1.一种局部通风机智能运维分析方法,其特征在于,所述方法包括:
获取局部通风机的电压数据与对应的转速数据;获取所有转速数据组成的待切分数据集;
在二维坐标系中,对所述电压数据与所述转速数据进行线性拟合,获得拟合转速数据;获得所述拟合转速数据与所述转速数据之间的数据异常特征;获得待切分数据集中每个所述转速数据与其他转速数据之间的数据离散程度;根据所述数据异常特征与所述数据离散程度获得每个转速数据的数据异常可能性;
利用孤立森林算法,依次将转速数据作为切分值,通过切分值将所述待切分数据集进行分割,获得异常数据集与正常数据集;根据所述异常数据集与所述正常数据集之间的转速数据差异与数据异常可能性差异,获得所述异常数据集与所述正常数据集之间的数据差异程度;根据所述异常数据集与所述正常数据集之间的数据差异程度与数量差异程度,获得每个切分值的分割评价指标;
根据所述分割评价指标获得孤立森林算法中的最佳切分值,并确定所述待切分数据集中的所有异常转速数据;
根据异常转速数据的数量对局部通风机的运行状态进行运维分析。
2.根据权利要求1所述的一种局部通风机智能运维分析方法,其特征在于,所述数据异常特征的获取方法包括:
获取线性拟合时的拟合优度;
计算每个所述拟合转速数据与对应所述转速数据之间的数据值差异;
将所述数据值差异与所述拟合优度的比值作为所述拟合转速数据与所述转速数据之间的数据异常特征。
3.根据权利要求1所述的一种局部通风机智能运维分析方法,其特征在于,所述数据离散程度的获取方法包括:
获得每个转速数据相对于待切分数据集的第三离散程度;
计算待切分数据集内每个所述转速数据与其他每个转速数据之间的数据值差异并累加求和,获得待切分数据集中每个所述转速数据与其他每个转速数据之间的数据差异性;
将所述第三离散程度与所述数据差异性之间的乘积作为待切分数据集中每个所述转速数据与其他转速数据之间的数据离散程度。
4.根据权利要求3所述的一种局部通风机智能运维分析方法,其特征在于,所述第三离散程度获取方法包括:
计算每个所述转速数据与所述待切分数据集内所有转速数据值的中位数之间的差异作为第一离散程度;
计算每个所述转速数据与所述待切分数据集内所有转速数据值均值之间的差异作为第二离散程度;
将所述第一离散程度与所述第二离散程度之间的和作为每个所述转速数据相对于待切分数据集的第三离散程度。
5.根据权利要求1所述的一种局部通风机智能运维分析方法,其特征在于,所述数据异常可能性的获取方法包括:
将所述数据离散程度与所述数据异常特征之间的乘积作为所述数据异常可能性。
6.根据权利要求1所述的一种局部通风机智能运维分析方法,其特征在于,获得所述异常数据集与所述正常数据集之间的数据差异程度,包括:
计算所述异常数据集内每个所述转速数据的数据异常可能性与所述正常数据集内每个所述转速数据的数据异常可能性之间的差异作为数据异常可能性差异;
计算所述异常数据集内每个转速数据与所述正常数据集内每个转速数据之间的差异作为转速数据差异;
将所述数据异常可能性差异与所述转速数据差异之间的乘积求平均获得所述异常数据集与所述正常数据集之间的数据差异程度。
7.根据权利要求1所述的一种局部通风机智能运维分析方法,其特征在于,所述数量差异程度的获取方法包括:
将所述异常数据集的数据数量与所述正常数据集的数据数量之间的差值绝对值作为所述数量差异程度。
8.根据权利要求1所述的一种局部通风机智能运维分析方法,其特征在于,所述分割评价指标的获取方法包括:
将所述数量差异程度与所述数据差异程度的乘积作为所述分割评价指标。
9.根据权利要求1所述的一种局部通风机智能运维分析方法,其特征在于,所述最佳切分值的获取方法包括:
将待切分数据集中的所有转速数据按照大小顺序进行排序;根据排序结果依次将转速数据作为切分值;计算每个切分值对应的分割评价指标;以分割评价指标最大的切分值作为切分点,以切分点为中心,与左右两侧相邻预设数量个转速数据的数据值均值作为待切分数据集的最佳切分值。
10.根据权利要求1所述的一种局部通风机智能运维分析方法,其特征在于,根据异常转速数据的数量对局部通风机的运行状态进行运维分析,包括:
获取某个时刻前后共预设数量个转速数据中异常转速数据的数量;
将预设数量个转速数据中,异常转速数据的数量与转速数据数量之间的比值作为当前时刻的设备异常特征;
预设第一阈值与第二阈值,当所述设备异常特征不小于第一阈值时,认为局部通风机在当前时刻存在安全隐患,当所述设备异常特征不小于第二阈值时,认为局部通风机在当前时刻存在严重异常。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410354003.9A CN117951616B (zh) | 2024-03-27 | 2024-03-27 | 一种局部通风机智能运维分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410354003.9A CN117951616B (zh) | 2024-03-27 | 2024-03-27 | 一种局部通风机智能运维分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117951616A CN117951616A (zh) | 2024-04-30 |
CN117951616B true CN117951616B (zh) | 2024-05-28 |
Family
ID=90803400
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410354003.9A Active CN117951616B (zh) | 2024-03-27 | 2024-03-27 | 一种局部通风机智能运维分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117951616B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111008662A (zh) * | 2019-12-04 | 2020-04-14 | 贵州电网有限责任公司 | 一种输电线路在线监测数据异常分析方法 |
CN111598438A (zh) * | 2020-05-14 | 2020-08-28 | 哈尔滨工业大学(威海) | 基于分段拟合分析及评估的民航发动机气路异常检测方法 |
CN112434208A (zh) * | 2020-12-03 | 2021-03-02 | 百果园技术(新加坡)有限公司 | 一种孤立森林的训练及其网络爬虫的识别方法与相关装置 |
CN113626502A (zh) * | 2021-08-13 | 2021-11-09 | 南方电网深圳数字电网研究院有限公司 | 基于集成学习的电网数据异常检测方法及装置 |
WO2023000482A1 (zh) * | 2021-07-23 | 2023-01-26 | 广州新科佳都科技有限公司 | 一种基于机理分析的站台门异常检测方法及装置 |
CN116975771A (zh) * | 2023-09-25 | 2023-10-31 | 苏州保邦电气有限公司 | 一种用于电机生产的异常自动识别方法及系统 |
CN117251798A (zh) * | 2023-09-12 | 2023-12-19 | 西北工业大学 | 一种基于两层渐进式的气象设备异常检测方法 |
CN117454283A (zh) * | 2023-12-22 | 2024-01-26 | 深圳前海慧联科技发展有限公司 | 一种用于风电机组运行检测数据的状态评估方法 |
CN117556714A (zh) * | 2024-01-12 | 2024-02-13 | 济南海德热工有限公司 | 一种用于铝金属冶炼的预热管路温度数据异常分析方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11582249B2 (en) * | 2019-11-27 | 2023-02-14 | Telefonaktiebolaget Lm Ericsson (Publ) | Computer-implemented method and arrangement for classifying anomalies |
-
2024
- 2024-03-27 CN CN202410354003.9A patent/CN117951616B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111008662A (zh) * | 2019-12-04 | 2020-04-14 | 贵州电网有限责任公司 | 一种输电线路在线监测数据异常分析方法 |
CN111598438A (zh) * | 2020-05-14 | 2020-08-28 | 哈尔滨工业大学(威海) | 基于分段拟合分析及评估的民航发动机气路异常检测方法 |
CN112434208A (zh) * | 2020-12-03 | 2021-03-02 | 百果园技术(新加坡)有限公司 | 一种孤立森林的训练及其网络爬虫的识别方法与相关装置 |
WO2023000482A1 (zh) * | 2021-07-23 | 2023-01-26 | 广州新科佳都科技有限公司 | 一种基于机理分析的站台门异常检测方法及装置 |
CN113626502A (zh) * | 2021-08-13 | 2021-11-09 | 南方电网深圳数字电网研究院有限公司 | 基于集成学习的电网数据异常检测方法及装置 |
CN117251798A (zh) * | 2023-09-12 | 2023-12-19 | 西北工业大学 | 一种基于两层渐进式的气象设备异常检测方法 |
CN116975771A (zh) * | 2023-09-25 | 2023-10-31 | 苏州保邦电气有限公司 | 一种用于电机生产的异常自动识别方法及系统 |
CN117454283A (zh) * | 2023-12-22 | 2024-01-26 | 深圳前海慧联科技发展有限公司 | 一种用于风电机组运行检测数据的状态评估方法 |
CN117556714A (zh) * | 2024-01-12 | 2024-02-13 | 济南海德热工有限公司 | 一种用于铝金属冶炼的预热管路温度数据异常分析方法 |
Non-Patent Citations (3)
Title |
---|
Anomaly electricity detection method based on entropy weight method and isolated forest algorithm;Wang Jianyuan et al.;Frontiers in Energy Research;20220831;论文全文 * |
基于iForest的容器云平台异常检测;吕祥坤;中国优秀硕士学位论文全文数据库 信息科技辑;20210315(第03期);论文全文 * |
基于改进的孤立森林风电机组数据异常检测;钟秋惠 等;重庆工商大学学报(自然科学版);20231214;论文全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117951616A (zh) | 2024-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Prediction model of rock mass class using classification and regression tree integrated AdaBoost algorithm based on TBM driving data | |
CN111598438B (zh) | 基于分段拟合分析及评估的民航发动机气路异常检测方法 | |
CN110018670B (zh) | 一种基于动态关联规则挖掘的工业过程异常工况预测方法 | |
CN112800686A (zh) | 一种变压器dga在线监测数据异常模式判定方法 | |
CN106779505A (zh) | 一种基于大数据驱动的输电线路故障预警方法及系统 | |
CN115982602B (zh) | 一种光伏变压器电故障检测方法 | |
CN112181706B (zh) | 一种基于对数区间隔离的电力调度数据异常检测方法 | |
CN108074025B (zh) | 基于表面缺陷分布特征的钢卷表面缺陷判定方法 | |
CN116335925B (zh) | 基于数据增强的煤矿井下乳化泵站智能调控系统 | |
CN110242310B (zh) | 基于深度神经网络与关联分析结合的盾构轴线纠偏方法 | |
CN115858894A (zh) | 一种可视化的大数据分析方法 | |
CN115964662A (zh) | 基于改进密度峰值聚类的复杂装备参数异常检测方法 | |
CN117573667B (zh) | 一种煤矿井间数据优化清洗方法及系统 | |
CN112949735A (zh) | 一种基于离群数据挖掘的液态危化品挥发浓度异常发现方法 | |
CN118277813B (zh) | 一种基于融合聚类算法的无人机飞行轨迹异常溯源方法 | |
CN115219067A (zh) | 一种用于大蒜仓储实时状态监测方法 | |
CN108038211A (zh) | 一种基于上下文的无监督关系数据异常检测方法 | |
CN114756420A (zh) | 故障预测方法及相关装置 | |
CN111140244B (zh) | 一种硬岩掘进机支护等级智能推荐方法 | |
CN117951616B (zh) | 一种局部通风机智能运维分析方法 | |
CN109543268A (zh) | 基于kriging模型的TBM推进力主要影响因素的识别方法 | |
CN118171190A (zh) | 复合地层盾构掘进速度智能预测模型的训练方法及装置 | |
CN111370055A (zh) | 内含子保留预测模型建立方法及其预测方法 | |
CN107480647B (zh) | 基于归纳式一致性异常检测的异常行为实时检测方法 | |
CN116307158A (zh) | 一种用于煤矿掘进工作面瓦斯突出预警的智能分析算法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |