CN111461461B - 一种水利工程异常检测方法及系统 - Google Patents
一种水利工程异常检测方法及系统 Download PDFInfo
- Publication number
- CN111461461B CN111461461B CN202010355270.XA CN202010355270A CN111461461B CN 111461461 B CN111461461 B CN 111461461B CN 202010355270 A CN202010355270 A CN 202010355270A CN 111461461 B CN111461461 B CN 111461461B
- Authority
- CN
- China
- Prior art keywords
- time
- data
- working state
- series data
- abnormal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 41
- 230000002159 abnormal effect Effects 0.000 claims abstract description 86
- 230000006870 function Effects 0.000 claims description 111
- 238000001228 spectrum Methods 0.000 claims description 54
- 238000012544 monitoring process Methods 0.000 claims description 44
- 238000000034 method Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims description 8
- 230000035772 mutation Effects 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 230000001052 transient effect Effects 0.000 claims description 4
- 238000010276 construction Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 5
- 230000000875 corresponding effect Effects 0.000 description 19
- 238000013528 artificial neural network Methods 0.000 description 9
- 238000012549 training Methods 0.000 description 8
- 230000005856 abnormality Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 4
- 238000003066 decision tree Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000002262 irrigation Effects 0.000 description 1
- 238000003973 irrigation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000001363 water suppression through gradient tailored excitation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/15—Correlation function computation including computation of convolution operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/30—Assessment of water resources
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- General Business, Economics & Management (AREA)
- Educational Administration (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Biophysics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Pure & Applied Mathematics (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Primary Health Care (AREA)
Abstract
本发明提出了一种水利工程异常检测方法及系统。本发明将希尔伯特黄变换与深度森林模型结合的异常点检测方法,首先希尔伯特黄变换对时间序列数据进行初步的分析,确定异常时间序列数据,然后基于深度森林模型对异常时间序列数据进行监测,减少了深度森林模型处理的数据规模,并提高了异常数据检测的准确性,保障了水利工程的安全。
Description
技术领域
本发明涉及水利工程监测技术领域,特别是涉及一种水利工程异常检测方法及系统。
背景技术
随着新时代社会经济的快速发展,对水利工程安全高效运作的要求也随之提高,传统水利工程已经难以满足新时代经济社会发展所需的专业化、信息化、智能化等要求,尽管现在的水利行业已经覆盖数据采集、查询浏览、统计分析等功能,但在时间序列数据异常检测方面,其精确性和全面性还有待提升。而时间序列数据的异常检测在大河的综合治理、病险水库和水闸的除险加固、灌区的节水改造、防洪工程等方面都有重要的应用,所以时间序列数据异常检测对水利工程的安全性具有重要意义。
传统的异常检测的方法主要有以下五类:基于统计的异常检测方法、基于聚类的异常检测方法、基于偏差的异常检测方法、基于距离的异常检测方法和基于密度的异常检测方法。随着机器学习技术的发展,涌现了一些应用机器学习的异常点检测方法,现有的基于机器学习的异常点检测主要有基于神经网络的异常点检测方法和基于支持向量机的异常点检测方法。
基于神经网络的异常点检测主要是利用人工神经网络在处理小规模问题上应用效果好的特点,但是对于大规模的问题,人工神经网络的构造将会非常复杂。而且因为神经网络“黑箱”的性质,使得隐藏层中的理论解释不够严谨,对隐藏层的输出结果与最终的输出结果之间不能完美控制,因此不能很好地往大规模问题上扩展。
基于支持向量机的异常点检测仅具有相同的处理能力,而且在计算效率上也有很大的提高,但是支持向量机在理论建模方面都相对比较复杂,比如核函数的选取等,因此在实际应用中往往难以取得理想的效果,无法提取出比较全面的异常点。
发明内容
本发明的目的是提供一种水利工程异常检测方法及系统,以实现基于大规模数据的水利工程的有效监测。
为实现上述目的,本发明提供了如下方案:
一种水利工程异常检测方法,所述异常检测方法包括如下步骤:
获取水利工程的传感器监测系统的多个时间序列数据;
对每个所述时间序列数据进行希尔伯特黄变换,将每个所述时间序列数据分解成多个固有模态函数和一个残余序列;
对每个所述时间序列数据的固有模态函数进行Hilbert变换,获得每个时间序列数据的Hilbert谱;
根据每个时间序列数据的Hilbert谱的频率性质确定多个时间序列数据对应的监测时间的水利工程的工作状态;所述工作状态为异常工作状态或正常工作状态;
提取异常工作状态的多个时间序列数据的特征数据;
将所述特征数据输入训练后的森林深度模型,获得监测结果。
可选的,所述对每个所述时间序列数据进行希尔伯特黄变换,将每个所述时间序列数据分解成多个固有模态函数和一个残余序列,具体包括:
计算时间序列数据的极大值点和极小值点;
分别根据所述时间序列数据的极大值点和极小值点,利用三次样条函数差值构造所述时间序列数据的上包络线和下包络线;
计算所述上包络线和所述下包络线的均值函数;
判断均值函数是否满足固有模态函数的条件,得到第一判断结果;
若第一判断结果表示均值函数满足固有模态函数的条件,则将所述均值函数设置为第i个固有模态函数;
若第一判断结果表示均值函数不满足固有模态函数的条件,则将所述均值函数设置为时间序列数据,返回步骤“计算时间序列数据的极大值点和极小值点”;
从第i-1个残余序列中减去第i个固有模态函数,获得第i个残余序列;
判断第i个残余序列是否存在极值点,得到第二判断结果;
若所述第二判断结果表示第i个残余序列存在极值点,则将所述第i个残余序列设置为时间序列数据,令i的数值增加1,返回步骤“计算时间序列数据的极大值点和极小值点”;
若所述第二判断结果表示第i个残余序列不存在极值点,则输出i个固有模态函数和第i个残余序列。
可选的,所述根据每个时间序列数据的Hilbert谱的频率性质确定多个时间序列数据对应的监测时间的水利工程的工作状态,具体包括:
统计Hilbert谱发生瞬时频率突变的时间序列数据的数量值;
判断所述数量值是否大于异常判断数量阈值,得到第三判断结果;
若所述第三判断结果表示所述数量值大于异常判断数量阈值,则多个时间序列数据对应的监测时间的水利工程的工作状态确定为异常工作状态;
若所述第三判断结果表示所述数量值不大于异常判断数量阈值,则多个时间序列数据对应的监测时间的水利工程的工作状态确定为正常工作状态。
可选的,所述提取异常工作状态的多个时间序列数据的特征数据,具体包括:
对异常工作状态的多时间序列数据进行HHT变换,获得异常工作状态的每个时间序列数据的时频谱和边际谱,
根据异常工作状态的每个时间序列数据的时频谱和边际谱,建立每个时间序列数据的时间-频率-能量的三维分布图;
根据所述三维分布图确定能量与频率正相关的频率作为每个时间序列数据的特征数据。
一种水利工程异常检测系统,所述检测系统:
第一数据获取模块,用于获取水利工程的传感器监测系统在历史时间监测的多个时间序列数据;
希尔伯特黄变换模块,用于对每个所述时间序列数据进行希尔伯特黄变换,将每个所述时间序列数据分解成多个固有模态函数和一个残余序列;
Hilbert变换模块,用于对每个所述时间序列数据的固有模态函数进行Hilbert变换,获得每个时间序列数据的Hilbert谱;
工作状态确定模块,用于根据每个时间序列数据的Hilbert谱的频率性质确定多个时间序列数据对应的监测时间的水利工程的工作状态;所述工作状态为异常工作状态或正常工作状态;
特征提取模块,用于提取异常工作状态的多个时间序列数据的特征数据;
监测模块,用于将所述特征数据输入训练后的森林深度模型,获得监测结果。
可选的,所述希尔伯特黄变换模块,具体包括:
极值计算子模块,用于计算时间序列数据的极大值点和极小值点;
包络线构造子模块,用于分别根据所述时间序列数据的极大值点和极小值点,利用三次样条函数差值构造所述时间序列数据的上包络线和下包络线;
均值函数计算子模块,用于计算所述上包络线和所述下包络线的均值函数;
第一判断子模块,用于判断均值函数是否满足固有模态函数的条件,得到第一判断结果;
第i个固有模态函数获取子模块,用于若第一判断结果表示均值函数满足固有模态函数的条件,则将所述均值函数设置为第i个固有模态函数;
第一时间序列数据更新子模块,用于若第一判断结果表示均值函数不满足固有模态函数的条件,则将所述均值函数设置为时间序列数据,返回步骤“计算时间序列数据的极大值点和极小值点”;
残余序列计算子模块,用于从第i-1个残余序列中减去第i个固有模态函数,获得第i个残余序列;
第二判断子模块,用于判断第i个残余序列是否存在极值点,得到第二判断结果;
第二时间序列数据更新子模块,用于若所述第二判断结果表示第i个残余序列存在极值点,则将所述第i个残余序列设置为时间序列数据,令i的数值增加1,返回步骤“计算时间序列数据的极大值点和极小值点”;
希尔伯特黄变换结果输出子模块,用于若所述第二判断结果表示第i个残余序列不存在极值点,则输出i个固有模态函数和第i个残余序列。
可选的,所述工作状态确定模块,具体包括:
异常时间序列数据统计子模块,用于统计Hilbert谱发生瞬时频率突变的时间序列数据的数量值;
第三判断子模块,用于判断所述数量值是否大于异常判断数量阈值,得到第三判断结果;
第一工作状态确定子模块,用于若所述第三判断结果表示所述数量值大于异常判断数量阈值,则多个时间序列数据对应的监测时间的水利工程的工作状态确定为异常工作状态;
第二工作状态确定子模块,用于若所述第三判断结果表示所述数量值不大于异常判断数量阈值,则多个时间序列数据对应的监测时间的水利工程的工作状态确定为正常工作状态。
可选的,所述特征提取模块,具体包括:
HHT变换子模块,用于对异常工作状态的多时间序列数据进行HHT变换,获得异常工作状态的每个时间序列数据的时频谱和边际谱;
三维分布图建立子模块,用于根据异常工作状态的每个时间序列数据的时频谱和边际谱,建立每个时间序列数据的时间-频率-能量的三维分布图;
特征提取子模块,用于根据所述三维分布图确定能量与频率正相关的频率作为每个时间序列数据的特征数据。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提出了一种水利工程异常检测方法及系统。所述异常检测方法:获取水利工程的传感器监测系统的多个时间序列数据;对每个所述时间序列数据进行希尔伯特黄变换,将每个所述时间序列数据分解成多个固有模态函数和一个残余序列;对每个所述时间序列数据的固有模态函数进行Hilbert变换,获得每个时间序列数据的Hilbert谱;根据每个时间序列数据的Hilbert谱的频率性质确定多个时间序列数据对应的监测时间的水利工程的工作状态;所述工作状态为异常工作状态或正常工作状态;提取异常工作状态的多个时间序列数据的特征数据;将所述特征数据输入训练后的森林深度模型,获得监测结果。本发明将希尔伯特黄变换与深度森林模型结合的异常点检测方法,首先希尔伯特黄变换对时间序列数据进行初步的分析,确定异常时间序列数据,然后基于深度森林模型对异常时间序列数据进行监测,减少了深度森林模型处理的数据规模,并提高了异常数据检测的准确性,保障了水利工程的安全。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来将,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种水利工程异常检测方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种旱灾风险预测方法及系统,以实现大面积的干旱风险的预测。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
希尔伯特黄变换(HHT)是主要包括经验模态分解(EMD)和希尔伯特黄变换两部分,该方法对分析非线性和非平稳的数据效果十分显著。
决策树是机器学习中的一种以实例为基础的归纳学习,采用的是自顶向下的归纳方法。决策树算法的最大优点它可以自主学习,并且在学习的过程中不需要使用者了解过多的知识背景,只需要对训练实例进行较好的标注,就能够进行学习,属于有监督学习。而深度森林(多粒度级联森林)是一种决策树集成方法,是由周志华等人提出的,因为采用类似神经网络多层训练的功能,所以它的性能与深度神经网络相比同样有很强的竞争性,无论训练数据集的规模大小,深度森林都能照样正常运转,且它的运行效率相比深度神经网络也可抗衡。而且因为是树的结构,在理论分析方面比神经网络更容易。
深度森林模型是基于树的集成方法,通过由树组成的森林来集成并前后串联起来达到表征学习的效果,也是类似深度网络一层一层的结构。在级联森林结构中,使用了若干个完全随机的树森林和若干个随机森林,每个森林中的树的数目是一个超参数,每个完全随机的树森林包含若干个完全随机树,每棵树通过随机选择一个特征在树的每个节点进行分割实现生成,直到每个叶节点只包含相同类的实例或不超过10个实例。类似地,每个随机森林也包含若干棵树,通过随机选择数量的特征作为候选(d是输入特征的数量),然后选择具有最佳gini值的特征作为分割。给定一个实例,每个森林会通过计算在相关实例落入的叶节点处的不同类的训练样本的百分比,然后对森林中的所有数值平均值,以生成对类的分布的估计。
因此,本发明将希尔伯特黄变换与深度森林模型结合的异常点检测方法。如图1所示,一种水利工程异常检测方法,所述异常检测方法包括如下步骤:
获取水利工程的传感器监测系统的多个时间序列数据。
对每个所述时间序列数据进行希尔伯特黄变换,将每个所述时间序列数据分解成多个固有模态函数和一个残余序列。
先利用经验模态分解(Empirical Mode Decomposition,EMD)将时序数据分解为若干固有模态函数(Intrinsic Mode Function,IMF)。EMD可以筛选信号,将序列根据其特点自适应地把任意一个复杂序列分解为有限数目且具有一定物理意义的IMF,这些IMF是满足一定条件的分量。IMF需要满足如下两个条件:(1)信号极值点的数量与零点数相等或相差;(2)由信号的极大值拟合的上包络线和由极小值拟合的下包络线求得的局部均值为零。筛选过程如下:(1)对输入的序列求极大值点xi,和极小值点xj。(2)对极大值和极小值点采用三次样条函数插值构造信号上包络线Ux(t)、下包络线Lx(t),计算上、下包络的均值函数m1(t),得到第一个分量h1(t)。(3)考察h1(t)是否满足IMF条件,如果满足,则转到下一步,否则返回前两步操作,求h1(t)的上下包络线,得到它的均值线m11(t),求得其分量h11(t),依次下去,直到满足IMF条件,则求得第一个IMFC1,它包含了原始信号中的局部高频信息。(4)从原始序列中减去C1得到残余序列r1(t),对残余序列继续进行如上筛选得到更多IMF,直到最后的IMF被分离出来。(5)最终的残余序列rn(t)可能是一个常数或为单调函数。综上,原始信号分解成n个IMF和一个r(t),即若残余分量r(t)为一个单调函数,则它表示了序列的趋势变化。
具体的,所述对每个所述时间序列数据进行希尔伯特黄变换,将每个所述时间序列数据分解成多个固有模态函数和一个残余序列,具体包括:计算时间序列数据的极大值点和极小值点;分别根据所述时间序列数据的极大值点和极小值点,利用三次样条函数差值构造所述时间序列数据的上包络线和下包络线;计算所述上包络线和所述下包络线的均值函数;判断均值函数是否满足固有模态函数的条件,得到第一判断结果;若第一判断结果表示均值函数满足固有模态函数的条件,则将所述均值函数设置为第i个固有模态函数;若第一判断结果表示均值函数不满足固有模态函数的条件,则将所述均值函数设置为时间序列数据,返回步骤“计算时间序列数据的极大值点和极小值点”;从第i-1个残余序列中减去第i个固有模态函数,获得第i个残余序列;判断第i个残余序列是否存在极值点,得到第二判断结果;若所述第二判断结果表示第i个残余序列存在极值点,则将所述第i个残余序列设置为时间序列数据,令i的数值增加1,返回步骤“计算时间序列数据的极大值点和极小值点”;若所述第二判断结果表示第i个残余序列不存在极值点,则输出i个固有模态函数和第i个残余序列。
对每个所述时间序列数据的固有模态函数进行Hilbert变换,获得每个时间序列数据的Hilbert谱。具体的,对每个IMF进行Hilbert,得到相应的Hilbert谱,将每个IMF表示在联合的时频域中,进行瞬时频率分析,最后汇总所有IMF的Hilbert谱得到时间序列数据的Hilbert谱及相应的瞬时频率与振幅。
根据每个时间序列数据的Hilbert谱的频率性质确定多个时间序列数据对应的监测时间的水利工程的工作状态;所述工作状态为异常工作状态或正常工作状态。
判断多个序列的瞬时频率,若都发生突变,可认定此异常为时间序列数据异常,即为工程安全问题;若只有一个序列的瞬时频率发生突变,可认定此异常为传感器自身问题。
具体的,所述根据每个时间序列数据的Hilbert谱的频率性质确定多个时间序列数据对应的监测时间的水利工程的工作状态,具体包括:统计Hilbert谱发生瞬时频率突变的时间序列数据的数量值;判断所述数量值是否大于异常判断数量阈值,得到第三判断结果;若所述第三判断结果表示所述数量值大于异常判断数量阈值,则多个时间序列数据对应的监测时间的水利工程的工作状态确定为异常工作状态;若所述第三判断结果表示所述数量值不大于异常判断数量阈值,则多个时间序列数据对应的监测时间的水利工程的工作状态确定为正常工作状态。
提取异常工作状态的多个时间序列数据的特征数据。
用频域下的有限频谱数据来近似表示原始序列。将原序列分解为一个时间-频率-能量三维分布图,选择能量与频率正相关的频率作为特征。具体的,所述提取异常工作状态的多个时间序列数据的特征数据,具体包括:对异常工作状态的多时间序列数据进行HHT变换,获得异常工作状态的每个时间序列数据的时频谱和边际谱;根据异常工作状态的每个时间序列数据的时频谱和边际谱,建立每个时间序列数据的时间-频率-能量的三维分布图;根据所述三维分布图确定能量与频率正相关的频率作为每个时间序列数据的特征数据。
将所述特征数据输入训练后的森林深度模型,获得监测结果。
其中,训练森林深度模型的方式为:将历史数据集中所有的时间序列数据做HHT(Hilbert-Huang)变换,通过边际谱确定异常时间序列数据。边际谱从统计意义上表征了整组数据每个频率点的累计赋值分布,如果在时间序列数据只在某一频率的能量出现,而在其他能量没有出现,就表示一定有该频率的振动波出现,可以判断序列异常。根据判断结果为每个时间序列数据加注标签,建立样本集。
将样本集分为测试集与训练集,以序列的特征和对应是否异常标签作为输入,通过训练数据得到判断异常序列的深度森林模型。当模型在测试集上的判断异常序列的准确性达到要求时,此时训练得到的模型即可作为训练后的度森林模型。
本发明还提供一种水利工程异常检测系统,所述检测系统:
第一数据获取模块,用于获取水利工程的传感器监测系统在历史时间监测的多个时间序列数据;
希尔伯特黄变换模块,用于对每个所述时间序列数据进行希尔伯特黄变换,将每个所述时间序列数据分解成多个固有模态函数和一个残余序列。
所述希尔伯特黄变换模块,具体包括:极值计算子模块,用于计算时间序列数据的极大值点和极小值点;包络线构造子模块,用于分别根据所述时间序列数据的极大值点和极小值点,利用三次样条函数差值构造所述时间序列数据的上包络线和下包络线;均值函数计算子模块,用于计算所述上包络线和所述下包络线的均值函数;第一判断子模块,用于判断均值函数是否满足固有模态函数的条件,得到第一判断结果;第i个固有模态函数获取子模块,用于若第一判断结果表示均值函数满足固有模态函数的条件,则将所述均值函数设置为第i个固有模态函数;第一时间序列数据更新子模块,用于若第一判断结果表示均值函数不满足固有模态函数的条件,则将所述均值函数设置为时间序列数据,返回步骤“计算时间序列数据的极大值点和极小值点”;残余序列计算子模块,用于从第i-1个残余序列中减去第i个固有模态函数,获得第i个残余序列;第二判断子模块,用于判断第i个残余序列是否存在极值点,得到第二判断结果;第二时间序列数据更新子模块,用于若所述第二判断结果表示第i个残余序列存在极值点,则将所述第i个残余序列设置为时间序列数据,令i的数值增加1,返回步骤“计算时间序列数据的极大值点和极小值点”;希尔伯特黄变换结果输出子模块,用于若所述第二判断结果表示第i个残余序列不存在极值点,则输出i个固有模态函数和第i个残余序列。
Hilbert变换模块,用于对每个所述时间序列数据的固有模态函数进行Hilbert变换,获得每个时间序列数据的Hilbert谱;
工作状态确定模块,用于根据每个时间序列数据的Hilbert谱的频率性质确定多个时间序列数据对应的监测时间的水利工程的工作状态;所述工作状态为异常工作状态或正常工作状态。
所述工作状态确定模块,具体包括:异常时间序列数据统计子模块,用于统计Hilbert谱发生瞬时频率突变的时间序列数据的数量值;第三判断子模块,用于判断所述数量值是否大于异常判断数量阈值,得到第三判断结果;第一工作状态确定子模块,用于若所述第三判断结果表示所述数量值大于异常判断数量阈值,则多个时间序列数据对应的监测时间的水利工程的工作状态确定为异常工作状态;第二工作状态确定子模块,用于若所述第三判断结果表示所述数量值不大于异常判断数量阈值,则多个时间序列数据对应的监测时间的水利工程的工作状态确定为正常工作状态。
特征提取模块,用于提取异常工作状态的多个时间序列数据的特征数据。
所述特征提取模块,具体包括:HHT变换子模块,用于对异常工作状态的多时间序列数据进行HHT变换,获得异常工作状态的每个时间序列数据的时频谱和边际谱;三维分布图建立子模块,用于根据异常工作状态的每个时间序列数据的时频谱和边际谱,建立每个时间序列数据的时间-频率-能量的三维分布图;特征提取子模块,用于根据所述三维分布图确定能量与频率正相关的频率作为每个时间序列数据的特征数据。
监测模块,用于将所述特征数据输入训练后的森林深度模型,获得监测结果。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提出了一种水利工程异常检测方法及系统。所述异常检测方法:获取水利工程的传感器监测系统的多个时间序列数据;对每个所述时间序列数据进行希尔伯特黄变换,将每个所述时间序列数据分解成多个固有模态函数和一个残余序列;对每个所述时间序列数据的固有模态函数进行Hilbert变换,获得每个时间序列数据的Hilbert谱;根据每个时间序列数据的Hilbert谱的频率性质确定多个时间序列数据对应的监测时间的水利工程的工作状态;所述工作状态为异常工作状态或正常工作状态;提取异常工作状态的多个时间序列数据的特征数据;将所述特征数据输入训练后的森林深度模型,获得监测结果。本发明将希尔伯特黄变换与深度森林模型结合的异常点检测方法,首先希尔伯特黄变换对时间序列数据进行初步的分析,确定异常时间序列数据,然后基于深度森林模型对异常时间序列数据进行监测,减少了深度森林模型处理的数据规模,并提高了异常数据检测的准确性,保障了水利工程的安全。
本说明书中等效实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,等效实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
Claims (4)
1.一种水利工程异常检测方法,其特征在于,所述异常检测方法包括如下步骤:
获取水利工程的传感器监测系统的多个时间序列数据;
对每个所述时间序列数据进行希尔伯特黄变换,将每个所述时间序列数据分解成多个固有模态函数和一个残余序列;
对每个所述时间序列数据的固有模态函数进行Hilbert变换,获得每个时间序列数据的Hilbert谱;
根据每个时间序列数据的Hilbert谱的频率性质确定多个时间序列数据对应的监测时间的水利工程的工作状态;所述工作状态为异常工作状态或正常工作状态;
所述根据每个时间序列数据的Hilbert谱的频率性质确定多个时间序列数据对应的监测时间的水利工程的工作状态,具体包括:
统计Hilbert谱发生瞬时频率突变的时间序列数据的数量值;
判断所述数量值是否大于异常判断数量阈值,得到第三判断结果;
若所述第三判断结果表示所述数量值大于异常判断数量阈值,则多个时间序列数据对应的监测时间的水利工程的工作状态确定为异常工作状态;
若所述第三判断结果表示所述数量值不大于异常判断数量阈值,则多个时间序列数据对应的监测时间的水利工程的工作状态确定为正常工作状态;
提取异常工作状态的多个时间序列数据的特征数据;
所述提取异常工作状态的多个时间序列数据的特征数据,具体包括:
对异常工作状态的多时间序列数据进行HHT变换,获得异常工作状态的每个时间序列数据的时频谱和边际谱,
根据异常工作状态的每个时间序列数据的时频谱和边际谱,建立每个时间序列数据的时间-频率-能量的三维分布图;
根据所述三维分布图确定能量与频率正相关的频率作为每个时间序列数据的特征数据;
将所述特征数据输入训练后的森林深度模型,获得监测结果。
2.根据权利要求1所述的水利工程异常检测方法,其特征在于,所述对每个所述时间序列数据进行希尔伯特黄变换,将每个所述时间序列数据分解成多个固有模态函数和一个残余序列,具体包括:
计算时间序列数据的极大值点和极小值点;
分别根据所述时间序列数据的极大值点和极小值点,利用三次样条函数差值构造所述时间序列数据的上包络线和下包络线;
计算所述上包络线和所述下包络线的均值函数;
判断均值函数是否满足固有模态函数的条件,得到第一判断结果;
若第一判断结果表示均值函数满足固有模态函数的条件,则将所述均值函数设置为第i个固有模态函数;
若第一判断结果表示均值函数不满足固有模态函数的条件,则将所述均值函数设置为时间序列数据,返回步骤“计算时间序列数据的极大值点和极小值点”;
从第i-1个残余序列中减去第i个固有模态函数,获得第i个残余序列;
判断第i个残余序列是否存在极值点,得到第二判断结果;
若所述第二判断结果表示第i个残余序列存在极值点,则将所述第i个残余序列设置为时间序列数据,令i的数值增加1,返回步骤“计算时间序列数据的极大值点和极小值点”;
若所述第二判断结果表示第i个残余序列不存在极值点,则输出i个固有模态函数和第i个残余序列。
3.一种水利工程异常检测系统,其特征在于,所述检测系统:
第一数据获取模块,用于获取水利工程的传感器监测系统在历史时间监测的多个时间序列数据;
希尔伯特黄变换模块,用于对每个所述时间序列数据进行希尔伯特黄变换,将每个所述时间序列数据分解成多个固有模态函数和一个残余序列;
Hilbert变换模块,用于对每个所述时间序列数据的固有模态函数进行Hilbert变换,获得每个时间序列数据的Hilbert谱;
工作状态确定模块,用于根据每个时间序列数据的Hilbert谱的频率性质确定多个时间序列数据对应的监测时间的水利工程的工作状态;所述工作状态为异常工作状态或正常工作状态;
所述工作状态确定模块,具体包括:
异常时间序列数据统计子模块,用于统计Hilbert谱发生瞬时频率突变的时间序列数据的数量值;
第三判断子模块,用于判断所述数量值是否大于异常判断数量阈值,得到第三判断结果;
第一工作状态确定子模块,用于若所述第三判断结果表示所述数量值大于异常判断数量阈值,则多个时间序列数据对应的监测时间的水利工程的工作状态确定为异常工作状态;
第二工作状态确定子模块,用于若所述第三判断结果表示所述数量值不大于异常判断数量阈值,则多个时间序列数据对应的监测时间的水利工程的工作状态确定为正常工作状态;
特征提取模块,用于提取异常工作状态的多个时间序列数据的特征数据;
所述特征提取模块,具体包括:
HHT变换子模块,用于对异常工作状态的多时间序列数据进行HHT变换,获得异常工作状态的每个时间序列数据的时频谱和边际谱;
三维分布图建立子模块,用于根据异常工作状态的每个时间序列数据的时频谱和边际谱,建立每个时间序列数据的时间-频率-能量的三维分布图;
特征提取子模块,用于根据所述三维分布图确定能量与频率正相关的频率作为每个时间序列数据的特征数据;
监测模块,用于将所述特征数据输入训练后的森林深度模型,获得监测结果。
4.根据权利要求3所述的水利工程异常检测系统,其特征在于,所述希尔伯特黄变换模块,具体包括:
极值计算子模块,用于计算时间序列数据的极大值点和极小值点;
包络线构造子模块,用于分别根据所述时间序列数据的极大值点和极小值点,利用三次样条函数差值构造所述时间序列数据的上包络线和下包络线;
均值函数计算子模块,用于计算所述上包络线和所述下包络线的均值函数;
第一判断子模块,用于判断均值函数是否满足固有模态函数的条件,得到第一判断结果;
第i个固有模态函数获取子模块,用于若第一判断结果表示均值函数满足固有模态函数的条件,则将所述均值函数设置为第i个固有模态函数;
第一时间序列数据更新子模块,用于若第一判断结果表示均值函数不满足固有模态函数的条件,则将所述均值函数设置为时间序列数据,返回步骤“计算时间序列数据的极大值点和极小值点”;
残余序列计算子模块,用于从第i-1个残余序列中减去第i个固有模态函数,获得第i个残余序列;
第二判断子模块,用于判断第i个残余序列是否存在极值点,得到第二判断结果;
第二时间序列数据更新子模块,用于若所述第二判断结果表示第i个残余序列存在极值点,则将所述第i个残余序列设置为时间序列数据,令i的数值增加1,返回步骤“计算时间序列数据的极大值点和极小值点”;
希尔伯特黄变换结果输出子模块,用于若所述第二判断结果表示第i个残余序列不存在极值点,则输出i个固有模态函数和第i个残余序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010355270.XA CN111461461B (zh) | 2020-04-29 | 2020-04-29 | 一种水利工程异常检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010355270.XA CN111461461B (zh) | 2020-04-29 | 2020-04-29 | 一种水利工程异常检测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111461461A CN111461461A (zh) | 2020-07-28 |
CN111461461B true CN111461461B (zh) | 2022-06-07 |
Family
ID=71685375
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010355270.XA Active CN111461461B (zh) | 2020-04-29 | 2020-04-29 | 一种水利工程异常检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111461461B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117851907B (zh) * | 2024-01-10 | 2024-06-11 | 山东省水利勘测设计院有限公司 | 一种基于物联网技术的水闸渗流监测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103962888A (zh) * | 2014-05-12 | 2014-08-06 | 西北工业大学 | 一种基于小波去噪和希尔伯特-黄变换的刀具磨损监测方法 |
CN108241850A (zh) * | 2017-12-08 | 2018-07-03 | 浙江工业大学 | 一种基于hht的控制阀气密性故障诊断方法 |
CN110020637A (zh) * | 2019-04-16 | 2019-07-16 | 重庆大学 | 一种基于多粒度级联森林的模拟电路间歇故障诊断方法 |
CN110298485A (zh) * | 2019-05-29 | 2019-10-01 | 国电联合动力技术有限公司 | 基于改进深度随机森林算法的变桨系统故障预测方法 |
CN110375987A (zh) * | 2019-06-24 | 2019-10-25 | 昆明理工大学 | 一种基于深度森林机械轴承故障检测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10621506B2 (en) * | 2015-10-30 | 2020-04-14 | The United States Of America As Represented By The Secretary Of The Army | Apparatus and method for activity detection and classification from sensor data |
-
2020
- 2020-04-29 CN CN202010355270.XA patent/CN111461461B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103962888A (zh) * | 2014-05-12 | 2014-08-06 | 西北工业大学 | 一种基于小波去噪和希尔伯特-黄变换的刀具磨损监测方法 |
CN108241850A (zh) * | 2017-12-08 | 2018-07-03 | 浙江工业大学 | 一种基于hht的控制阀气密性故障诊断方法 |
CN110020637A (zh) * | 2019-04-16 | 2019-07-16 | 重庆大学 | 一种基于多粒度级联森林的模拟电路间歇故障诊断方法 |
CN110298485A (zh) * | 2019-05-29 | 2019-10-01 | 国电联合动力技术有限公司 | 基于改进深度随机森林算法的变桨系统故障预测方法 |
CN110375987A (zh) * | 2019-06-24 | 2019-10-25 | 昆明理工大学 | 一种基于深度森林机械轴承故障检测方法 |
Non-Patent Citations (1)
Title |
---|
希尔伯特黄变换在齿轮故障诊断中的应用;赵国庆 等;《武汉科技大学学报》;20070228;第30卷(第1期);第54-56页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111461461A (zh) | 2020-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110377984B (zh) | 一种工业设备剩余有效寿命预测方法、系统及电子设备 | |
CN110766192B (zh) | 基于深度学习的钻井井漏预测系统及方法 | |
de la Hermosa González | Wind farm monitoring using Mahalanobis distance and fuzzy clustering | |
CN106101121A (zh) | 一种全网络流量异常抽取方法 | |
Mao et al. | Anomaly detection for power consumption data based on isolated forest | |
CN114363195B (zh) | 面向时间和频谱残差卷积网络的网络流量预测预警方法 | |
Nourani et al. | A new hybrid algorithm for rainfall–runoff process modeling based on the wavelet transform and genetic fuzzy system | |
CN106649479A (zh) | 一种基于概率图的变压器状态关联规则挖掘方法 | |
CN106682835A (zh) | 一种数据驱动的复杂机电系统服役质量状态评估方法 | |
Hwang et al. | Detection and correction method of erroneous data using quantile pattern and LSTM | |
Mehr et al. | Wavelet packet-genetic programming: A new model for meteorological drought hindcasting | |
CN110795888A (zh) | 一种石油钻井风险预测方法 | |
CN111461461B (zh) | 一种水利工程异常检测方法及系统 | |
CN114416707A (zh) | 工业时序数据的自动化特征工程方法和装置 | |
CN113742993A (zh) | 干式变压器寿命损失预测方法、装置、设备及存储介质 | |
Song et al. | Intelligent diagnosis method for machinery by sequential auto-reorganization of histogram | |
CN110866840A (zh) | 基于知识图谱的电力负荷特征量训练的数据库建模方法 | |
CN106529816B (zh) | 电力线信道的调整方法和系统 | |
CN103400021A (zh) | 基于重尾分布的kdsne水电机组噪声源检测方法 | |
CN116776245A (zh) | 一种基于机器学习的三相逆变器设备故障诊断方法 | |
CN109635008B (zh) | 一种基于机器学习的设备故障检测方法 | |
CN111273635A (zh) | 一种工控设备未知异常检测方法 | |
CN117033923A (zh) | 一种基于可解释性机器学习的犯罪数量预测方法及系统 | |
CN116318925A (zh) | 一种多cnn融合入侵检测方法、系统、介质、设备及终端 | |
CN113468821B (zh) | 一种基于决策回归算法的坡面产流产沙阈值确定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |