CN116861354A - 电力变压器监测数据的异常识别及模式区分方法及系统 - Google Patents

电力变压器监测数据的异常识别及模式区分方法及系统 Download PDF

Info

Publication number
CN116861354A
CN116861354A CN202310874841.4A CN202310874841A CN116861354A CN 116861354 A CN116861354 A CN 116861354A CN 202310874841 A CN202310874841 A CN 202310874841A CN 116861354 A CN116861354 A CN 116861354A
Authority
CN
China
Prior art keywords
data
sequence
abnormal
monitoring
transformer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310874841.4A
Other languages
English (en)
Inventor
许中阳
张雷
罗亚洲
乔天骄
宿洪智
王春晓
吴双
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China Grid Co Ltd
Original Assignee
North China Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China Grid Co Ltd filed Critical North China Grid Co Ltd
Priority to CN202310874841.4A priority Critical patent/CN116861354A/zh
Publication of CN116861354A publication Critical patent/CN116861354A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0499Feedforward networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Economics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Geometry (AREA)
  • Computer Hardware Design (AREA)
  • Medical Informatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种电力变压器监测数据的异常识别及模式区分方法及系统,属于变压器异常数据监测技术领域,对于缓慢升高超过预警值的异常数据,使用改进K‑means方法对历史数据进行分析,并获得最优聚类中心与聚类结果;针对新数据,计算与聚类中心的距离,并与阈值相对比;若数据不属于任何一个聚类中心,则数据处于异常状态,若属于某一个聚类中心,则将数据加入历史数据中计算新的最优聚类中心以及聚类结果;结合改进多维SAX向量表示法与改进K‑means方法分析结果,判定原始监测序列的异常情况。本发明考虑到变压器状态监测数据的时间变化特征,能够准确且高效地对变压器状态监测数据进行异常检测。

Description

电力变压器监测数据的异常识别及模式区分方法及系统
技术领域
本发明涉及变压器异常数据监测技术领域,具体涉及一种电力变压器监测数据的异常识别及模式区分方法及系统。
背景技术
电力变压器是电力系统的重要枢纽设备,由于生产环节存在缺陷、检修周期迟滞、运行环境复杂等多方面原因,导致其故障情况时有出现。因此,开展电力变压器状态检修,提高其健康管理水平,维护其安全平稳运行,是电网坚强、可靠的重要基础。随着现今各种传感器技术的应用普及,针对变压器可采集的监测数据的数据量和数据维度,都呈现爆发式增长,逐渐显现出多源异构的数据特性,大大增加了对变压器状态监测数据进行异常检测的难度,通过传统的设置阈值的方式来检测变压器状态监测数据已经无法满足要求。
发明内容
本发明的目的在于提供一种电力变压器监测数据的异常识别及模式区分方法及系统,以解决上述背景技术中存在的至少一项技术问题。
为了实现上述目的,本发明采取了如下技术方案:
一方面,本发明提供一种电力变压器监测数据的异常识别及模式区分方法,包括:
获取待处理变压器历史正常状态数据,并运用改进经验小波变换对变压器监测数据进行预处理,将其自适应分解为频率互异的时间序列分量;
运用ARIMA-BP模型对不同的序列分量分别进行时序建模,将各分量预测值进行重构,获得监测序列预测值;
获取新的变压器实时监测数据,通过计算监测序列预测值与新测量数据之间的差值得到残差序列,结合改进孤立森林算法对残差序列进行异常识别,并将异常点作为分段界点对新的变压器实时监测数据序列进行分段;
采用基于改进多维SAX向量表示与时间序列关联性分析的异常模式区分方法区分无效异常数据与有效异常数据;同时使用改进K-means方法对历史正常状态数据进行分析,并获得最优聚类中心与聚类结果;
获取新的变压器实时监测数据,计算数据与聚类中心的距离,并与阈值相对比;若数据不属于任何一个聚类中心,则数据处于异常状态,若属于某一个聚类中心,则将数据加入历史数据中计算新的最优聚类中心以及聚类结果;
结合改进多维SAX向量表示法与改进K-means方法分析结果,判定原始监测序列的异常情况。
可选的,所述运用改进经验小波变换对变压器监测数据进行预处理,包括:做输入信号的单边傅里叶频谱;取每段数据最大值与其横坐标作为节点;对所有节点进行三次样条插值,生成信号频谱的包络曲线,取包络曲线的极小值点作为频谱频率分割边界;以相邻片段间的分割界限构造N个经验小波,然后采用小波变换方法定义原始序列的经验小波变换;对原始信号进行重构,并由此获得经验模态函数;其中,通过搜索频谱的局部极大值来确定其余N-1个分割界限,包括:假定M为极大值个数,当M≥N时,保留前N-1个极大值;当M<N时,保留全部极大值并对N进行修正;通过选取两个局部极大值间的中间频率作为相邻片段间的分割界限ωn,其中n=1,2,…,N-1。
可选的,所述运用ARIMA-BP模型对不同的序列分量分别进行时序建模,将各分量预测值进行重构以获得监测序列预测值,包括:
使用构造检验统计量进行假设检验的单位根检验方法,对输入时间序列进行平稳性检验,确定差分阶数的取值,并对于非平稳时间序列需要反复进行差分处理,直至处理后的时间序列平稳化,建立ARIMA(p,q)模型;
使用ARIMA(p,q)模型进行数据预测后,将预测结果作为BP模型的输入,真实结果数据作为BP模型的标准输出,来训练BP模型,最终测试数据先经过ARIMA(p,q)模型的初步预测,预测结果作为训练完毕的BP模型的输入,最终BP模型输出优化后的预测结果;
其中,所述ARIMA(p,q)模型的构建包括:在采用极大似然法估计模型参数的基础上,以赤池信息准则为依据,通过限定p和q的取值范围,选取使AIC值最小化的阶数组合来进行模型定阶与参数估计;
所述BP模型通过模拟人脑神经突触进行信息传递来建立数学模型,拓扑结构包含输入层、隐藏层和输出层,训练过程首先从输入层输入训练样本数据,把计算后的输出结果作为第一隐含层的输入,第一隐含层根据激活函数进行数据分析处理输出,输出结果作为第二隐含层的输入,循环往复直到满足输出层阈值要求后进行最终结果输出。
可选的,所述结合改进孤立森林算法对残差序列进行异常识别,并将异常点作为分段界点对原始监测序列进行分段,包括:
步骤一:随机选取n个训练数据作为子样本集,放入树的根节点。
步骤二:随机指定一个属性维度,并在该属性维度的最大值与最小值间随机生成一个切割点s,对此节点的区分有效性进行判断,基于孤立森林的基本原理,若二叉树节点能较大程度地将异常点和正常点区分,则此二叉树的节点区分度高,可以判断为优良节点二叉树,并继续往下生长,否则此二叉树节点为拙劣节点,二叉树停止生长,选择下一棵二叉树进行训练。
步骤三:若s为优良节点,以此切割点生成超平面对当前的节点数据空间进行分割,得到两个子样本空间,并将指定维度中小于s的数据放入当前节点的左侧分支,将大于或等于s的数据放入当前节点的右侧分支。
步骤四:重复执行步骤二与步骤三,不断构造新的子空间节点,直至数据本身无法继续分割或达到孤立树的深度限制。
步骤五:选择下一个二叉树重复上述步骤,直到所有二叉树训练完成。
可选的,所述基于改进多维SAX向量表示与时间序列关联性分析的异常模式区分方法,包括:采用改进多维SAX向量表示法对分段子序列进行多维符号化向量表示;通过计算相邻两段符号向量的相似度得分并结合判定阈值区分出无效异常数据与有效异常数据;利用灰关联算法的时间序列关联性分析对模式判定结果进行校验;
可选的,所述改进多维SAX向量表示法对分段子序列进行多维符号化向量表示,包括:时间序列的z-score标准化处理;通过对标准化处理后的时间序列进行等距分段,并从统计特性、形态特性及熵特性三个角度出发构建能够完备表征时间序列特性的特征值向量,其中选用均值来表征时间序列的统计特性,采用最小二乘法对其数据点拟合出一条近似的直线,并计算得到该直线的斜率来表征该段时间序列的形态特性,选用样本熵来表征时间序列的熵特性;在获得时间序列降维后的均值、斜率以及样本熵数值序列的基础上,根据其数值分布情况,对每一类特征值的数值空间进行等概率分割,并使用不同的字符来对分割后的数值子空间区域分别进行表示。
可选的,所述通过计算异常点两侧子序列的多维SAX向量的相似度得分并结合判定阈值,来对其异常模式进行准确的判定,包括:
步骤101:针对某一分段界点,比较其两侧子序列的多维符号化向量的长度;将长序列L的多维符号化向量序列作为待匹配序列,并将短序列Q的多维符号化向量序列/>作为目标模板序列;
步骤102:将目标模板序列在待匹配序列/>上由左至右平移,并在平移过程中计算两者在每个位置时的相似度分值;在获取平移过程中生成的相似度分值集合的基础上,选取其中的最小值作为该分段界点的异常模式判定分值;
步骤103:设定模式判定的阈值T,若此处分值大于T,则判定该异常点属于有效异常模式;若此处分值小于T,则判定该异常点属于无效异常模式;
步骤104:重复步骤101至步骤103,直至判定完监测序列中的全部异常点。
可选的,所述基于灰关联算法的时间序列关联性分析校验,包括:通过对动态过程发展态势的量化分析,完成时间序列有关统计数据几何关系的比较,依据各参量变化曲线几何形状的相似程度,对各参量间关联程度的强弱进行判断,并求出各参量之间的关联度,将灰关联度大于阈值的比较序列作为参考序列的关联序列;当监测序列的某一异常点被判定为无效异常模式时,若该序列存在关联序列,需结合关联序列进行判定结果校验;若在相同或邻近时刻,该监测序列的关联序列未出现异常点,则可以判定该异常点属于无效异常模式;若在相同或邻近时刻,该监测序列的关联序列出现异常点,则将该异常点归类为有效异常模式。
第二方面,本发明提供一种电力变压器监测数据的异常识别及模式区分系统,包括:
预处理模块,用于获取待处理变压器历史正常状态数据,并运用改进经验小波变换对变压器监测数据进行预处理,将其自适应分解为频率互异的时间序列分量;
监测序列预测模块,用于运用ARIMA-BP模型对不同的序列分量分别进行时序建模,将各分量预测值进行重构,获得监测序列预测值;
监测序列分段模块,用于获取新的变压器实时监测数据,通过计算监测序列预测值与新测量数据之间的差值得到残差序列,结合改进孤立森林算法对残差序列进行异常识别,并将异常点作为分段界点对新的变压器实时监测数据序列进行分段;
区分聚类模块,用于采用基于改进多维SAX向量表示与时间序列关联性分析的异常模式区分方法区分无效异常数据与有效异常数据;同时使用改进K-means方法对历史正常状态数据进行分析,并获得最优聚类中心与聚类结果;
对比模块,用于获取新的变压器实时监测数据,计算数据与聚类中心的距离,并与阈值相对比;若数据不属于任何一个聚类中心,则数据处于异常状态,若属于某一个聚类中心,则将数据加入历史数据中计算新的最优聚类中心以及聚类结果;
判定模块,用于结合改进多维SAX向量表示法与改进K-means方法分析结果,判定原始监测序列的异常情况。
第三方面,本发明提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质用于存储计算机指令,所述计算机指令被处理器执行时,实现如上所述的电力变压器监测数据的异常识别及模式区分方法。
第四方面,本发明提供一种计算机程序产品,包括计算机程序,所述计算机程序当在一个或多个处理器上运行时,用于实现如上所述的电力变压器监测数据的异常识别及模式区分方法。
第五方面,本发明提供一种电子设备,包括:处理器、存储器以及计算机程序;其中,处理器与存储器连接,计算机程序被存储在存储器中,当电子设备运行时,所述处理器执行所述存储器存储的计算机程序,以使电子设备执行实现如上所述的电力变压器监测数据的异常识别及模式区分方法的指令。
本发明有益效果:考虑到变压器状态监测数据的时间变化特征,能够准确且高效地对变压器状态监测数据进行异常检测。
本发明附加方面的优点,将在下述的描述部分中更加明显的给出,或通过本发明的实践了解到。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所述的电力变压器监测数据的异常识别及模式区分方法流程图。
图2为本发明实施例所述的BP模型结构示意图。
具体实施方式
下面详细叙述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件和/或它们的组。
为便于理解本发明,下面结合附图以具体实施例对本发明作进一步解释说明,且具体实施例并不构成对本发明实施例的限定。
本领域技术人员应该理解,附图只是实施例的示意图,附图中的部件并不一定是实施本发明所必须的。
实施例1
本实施例1中,首先提供了一种电力变压器监测数据的异常识别及模式区分系统,包括:预处理模块,用于获取待处理变压器历史正常状态数据,并运用改进经验小波变换对变压器监测数据进行预处理,将其自适应分解为频率互异的时间序列分量;监测序列预测模块,用于运用ARIMA-BP模型对不同的序列分量分别进行时序建模,将各分量预测值进行重构,获得监测序列预测值;监测序列分段模块,用于获取新的变压器实时监测数据,通过计算监测序列预测值与新测量数据之间的差值得到残差序列,结合改进孤立森林算法对残差序列进行异常识别,并将异常点作为分段界点对新的变压器实时监测数据序列进行分段;区分聚类模块,用于采用基于改进多维SAX向量表示与时间序列关联性分析的异常模式区分方法区分无效异常数据与有效异常数据;同时使用改进K-means方法对历史正常状态数据进行分析,并获得最优聚类中心与聚类结果;对比模块,用于获取新的变压器实时监测数据,计算数据与聚类中心的距离,并与阈值相对比;若数据不属于任何一个聚类中心,则数据处于异常状态,若属于某一个聚类中心,则将数据加入历史数据中计算新的最优聚类中心以及聚类结果;判定模块,用于结合改进多维SAX向量表示法与改进K-means方法分析结果,判定原始监测序列的异常情况。
本实施例1中,利用上述的系统实现了电力变压器监测数据的异常识别及模式区分方法,包括:获取待处理变压器历史正常状态数据,并运用改进经验小波变换对变压器监测数据进行预处理,将其自适应分解为频率互异的时间序列分量;运用ARIMA-BP模型对不同的序列分量分别进行时序建模,将各分量预测值进行重构,获得监测序列预测值;获取新的变压器实时监测数据,通过计算监测序列预测值与新测量数据之间的差值得到残差序列,结合改进孤立森林算法对残差序列进行异常识别,并将异常点作为分段界点对新的变压器实时监测数据序列)进行分段;采用基于改进多维SAX向量表示与时间序列关联性分析的异常模式区分方法区分无效异常数据与有效异常数据;同时使用改进K-means方法对历史正常状态数据进行分析,并获得最优聚类中心与聚类结果;获取新的变压器实时监测数据,计算数据与聚类中心的距离,并与阈值相对比;若数据不属于任何一个聚类中心,则数据处于异常状态,若属于某一个聚类中心,则将数据加入历史数据中计算新的最优聚类中心以及聚类结果;结合改进多维SAX向量表示法与改进K-means方法分析结果,判定原始监测序列的异常情况。
所述运用改进经验小波变换对变压器监测数据进行预处理,包括:做输入信号的单边傅里叶频谱;取每段数据最大值与其横坐标作为节点;对所有节点进行三次样条插值,生成信号频谱的包络曲线,取包络曲线的极小值点作为频谱频率分割边界;以相邻片段间的分割界限构造N个经验小波,然后采用小波变换方法定义原始序列的经验小波变换;对原始信号进行重构,并由此获得经验模态函数;其中,通过搜索频谱的局部极大值来确定其余N-1个分割界限,包括:假定M为极大值个数,当M≥N时,保留前N-1个极大值;当M<N时,保留全部极大值并对N进行修正;通过选取两个局部极大值间的中间频率作为相邻片段间的分割界限ωn,其中n=1,2,…,N-1。
所述运用ARIMA-BP模型对不同的序列分量分别进行时序建模,将各分量预测值进行重构以获得监测序列预测值,包括:
使用构造检验统计量进行假设检验的单位根检验方法,对输入时间序列进行平稳性检验,确定差分阶数的取值,并对于非平稳时间序列需要反复进行差分处理,直至处理后的时间序列平稳化,建立ARIMA(p,q)模型;
使用ARIMA(p,q)模型进行数据预测后,将预测结果作为BP模型的输入,真实结果数据作为BP模型的标准输出,来训练BP模型,最终测试数据先经过ARIMA(p,q)模型的初步预测,预测结果作为训练完毕的BP模型的输入,最终BP模型输出优化后的预测结果;
其中,所述ARIMA(p,q)模型的构建包括:在采用极大似然法估计模型参数的基础上,以赤池信息准则为依据,通过限定p和q的取值范围,选取使AIC值最小化的阶数组合来进行模型定阶与参数估计;
所述BP模型通过模拟人脑神经突触进行信息传递来建立数学模型,拓扑结构包含输入层、隐藏层和输出层,训练过程首先从输入层输入训练样本数据,把计算后的输出结果作为第一隐含层的输入,第一隐含层根据激活函数进行数据分析处理输出,输出结果作为第二隐含层的输入,循环往复直到满足输出层阈值要求后进行最终结果输出。
所述结合改进孤立森林算法对残差序列进行异常识别,并将异常点作为分段界点对原始监测序列进行分段,包括:
步骤一:随机选取n个训练数据作为子样本集,放入树的根节点。
步骤二:随机指定一个属性维度,并在该属性维度的最大值与最小值间随机生成一个切割点s,对此节点的区分有效性进行判断,基于孤立森林的基本原理,若二叉树节点能较大程度地将异常点和正常点区分,则此二叉树的节点区分度高,可以判断为优良节点二叉树,并继续往下生长,否则此二叉树节点为拙劣节点,二叉树停止生长,选择下一棵二叉树进行训练。
步骤三:若s为优良节点,以此切割点生成超平面对当前的节点数据空间进行分割,得到两个子样本空间,并将指定维度中小于s的数据放入当前节点的左侧分支,将大于或等于s的数据放入当前节点的右侧分支。
步骤四:重复执行步骤二与步骤三,不断构造新的子空间节点,直至数据本身无法继续分割或达到孤立树的深度限制。
步骤五:选择下一个二叉树重复上述步骤,直到所有二叉树训练完成。
所述基于改进多维SAX向量表示与时间序列关联性分析的异常模式区分方法,包括:采用改进多维SAX向量表示法对分段子序列进行多维符号化向量表示;通过计算相邻两段符号向量的相似度得分并结合判定阈值区分出无效异常数据与有效异常数据;利用灰关联算法的时间序列关联性分析对模式判定结果进行校验;
所述改进多维SAX向量表示法对分段子序列进行多维符号化向量表示,包括:时间序列的z-score标准化处理;通过对标准化处理后的时间序列进行等距分段,并从统计特性、形态特性及熵特性三个角度出发构建能够完备表征时间序列特性的特征值向量,其中选用均值来表征时间序列的统计特性,采用最小二乘法对其数据点拟合出一条近似的直线,并计算得到该直线的斜率来表征该段时间序列的形态特性,选用样本熵来表征时间序列的熵特性;在获得时间序列降维后的均值、斜率以及样本熵数值序列的基础上,根据其数值分布情况,对每一类特征值的数值空间进行等概率分割,并使用不同的字符来对分割后的数值子空间区域分别进行表示。
所述通过计算异常点两侧子序列的多维SAX向量的相似度得分并结合判定阈值,来对其异常模式进行准确的判定,包括:
步骤101:针对某一分段界点,比较其两侧子序列的多维符号化向量的长度。将长序列L的多维符号化向量序列作为待匹配序列,并将短序列Q的多维符号化向量序列/>作为目标模板序列;
步骤102:将目标模板序列在待匹配序列/>上由左至右平移,并在平移过程中计算两者在每个位置时的相似度分值;在获取平移过程中生成的相似度分值集合的基础上,选取其中的最小值作为该分段界点的异常模式判定分值;
步骤103:设定模式判定的阈值T,若此处分值大于T,则判定该异常点属于有效异常模式;若此处分值小于T,则判定该异常点属于无效异常模式;
步骤104:重复步骤101至步骤103,直至判定完监测序列中的全部异常点。
所述基于灰关联算法的时间序列关联性分析校验,包括:通过对动态过程发展态势的量化分析,完成时间序列有关统计数据几何关系的比较,依据各参量变化曲线几何形状的相似程度,对各参量间关联程度的强弱进行判断,并求出各参量之间的关联度,将灰关联度大于阈值的比较序列作为参考序列的关联序列;当监测序列的某一异常点被判定为无效异常模式时,若该序列存在关联序列,需结合关联序列进行判定结果校验;若在相同或邻近时刻,该监测序列的关联序列未出现异常点,则可以判定该异常点属于无效异常模式;若在相同或邻近时刻,该监测序列的关联序列出现异常点,则将该异常点归类为有效异常模式。
实施例2
本实施例2中,提出了一种电力变压器监测数据的异常识别及模式区分方法,在考虑到变压器状态监测数据的时间变化特征的同时,准确且高效地对变压器状态监测数据进行异常检测。
为实现上述目的,本实施例2所述的方法采取的技术方案为:获取待处理变压器历史正常状态数据,并运用改进经验小波变换对变压器监测数据进行预处理,将其自适应分解为频率互异的时间序列分量;运用ARIMA-BP模型对不同的序列分量分别进行时序建模,将各分量预测值进行重构以获得监测序列预测值;获取新数据,通过计算监测指标预测值与新测量数据之间的差值得到残差序列,结合改进孤立森林算法对残差序列进行异常识别,并将异常点作为分段界点对原始监测序列进行分段;采用基于改进多维SAX向量表示与时间序列关联性分析的异常模式区分方法区分无效异常数据与有效异常数据。同时使用改进K-means方法对历史正常运行数据进行分析,并获得最优聚类中心与聚类结果;获取新数据,计算与聚类中心的距离,并与阈值相对比;若数据不属于任何一个聚类中心,则数据处于异常状态,若属于某一个聚类中心,则将数据加入历史数据中计算新的最优聚类中心以及聚类结果;结合改进多维SAX向量表示法与改进K-means方法分析结果,判定原始监测序列的异常情况。
所述改进经验小波变换通过以下步骤对变压器监测数据进行预处理:做原始数据序列f(t)的单边傅里叶频谱:F(ω)=|FFT[f(t)]|,然后将F(ω)均分为m段,取每段数据最大值与其横坐标作为节点记作Aj(j=1,2,...,J),J=M/m,M为离散频谱F(ω)的数据长度;对所有节点Aj进行三次样条插值,生成信号频谱的包络曲线,取包络曲线的极小值点作为频谱频率分割边界,得到Ωn=[ωn-1,ωn],n=1,...,N,ω表示相邻片段间的分割界限;随后以ωn构造N个经验小波,采用类似于传统的小波变换方法来定义原始序列的经验小波变换;对原始信号进行重构,并由此获得经验模态函数。
所述ARIMA-BP模型对不同的序列分量分别进行时序建模,将各分量预测值进行重构以获得监测序列预测值,包括:使用构造检验统计量进行假设检验的单位根检验方法,对输入时间序列进行平稳性检验,确定差分阶数的取值,并对于非平稳时间序列需要反复进行差分处理,直至处理后的时间序列平稳化为止;在此基础上,对其建立ARMA(p,q)模型;使用ARIMA模型进行数据预测后,将预测结果作为BP模型的输入,真实结果数据作为BP模型的标准输出,以此种方式来训练BP模型,最终测试数据先经过ARIMA模型的初步预测,预测结果作为训练完毕的BP模型的输入,最终BP模型输出优化后的预测结果。
所述ARMA模型的构建过程,具体如下:在采用极大似然法估计模型参数的基础上,以赤池信息准则为依据,通过限定p和q的取值范围,选取使AIC值最小化的阶数组合来进行模型定阶与参数估计。
所述BP模型的训练过程,包括:首先从输入层输入训练样本数据,把计算后的输出结果作为第一隐含层的输入,第一隐含层根据激活函数进行数据分析处理输出,输出结果作为第二隐含层的输入,循环往复直到满足输出层阈值要求后进行最终结果输出。
所述改进孤立森林算法通过以下步骤对残差序列进行异常识别,并将异常点作为分段界点对原始监测序列进行分段:随机选取n个训练数据作为子样本集,放入树的根节点;随机指定一个属性维度,并在该属性维度的最大值与最小值间随机生成一个切割点s;对此节点的区分有效性进行判断,基于孤立森林的基本原理,若二叉树节点能较大程度地将异常点和正常点区分,则此二叉树的节点区分度高,可以判断为优良节点二叉树,并继续往下生长,否则此二叉树节点为拙劣节点,二叉树停止生长,选择下一棵二叉树进行训练;若s为优良节点,以此切割点生成超平面对当前的节点数据空间进行分割,得到两个子样本空间,并将指定维度中小于s的数据放入当前节点的左侧分支,将大于或等于s的数据放入当前节点的右侧分支;重复切割数据空间,不断构造新的子空间节点,直至数据本身无法继续分割或达到孤立树的深度限制;选择下一个二叉树重复上述步骤,直到所有二叉树训练完成。
所述基于改进多维SAX向量表示与时间序列关联性分析的异常模式区分方法,包括:采用改进多维SAX向量表示法对分段子序列进行多维符号化向量表示;通过计算相邻两段符号向量的相似度得分并结合判定阈值区分出无效异常数据与有效异常数据;进一步利用灰关联算法的时间序列关联性分析对模式判定结果进行校验。
所述改进多维SAX向量表示法对分段子序列进行多维符号化向量表示,包括:时间序列的z-score标准化处理;通过对标准化处理后的时间序列进行等距分段,并从统计特性、形态特性及熵特性三个角度出发构建能够完备表征时间序列特性的特征值向量,其中选用均值来表征时间序列的统计特性,采用最小二乘法对其数据点拟合出一条近似的直线,并计算得到该直线的斜率来表征该段时间序列的形态特性,选用样本熵来表征时间序列的熵特性;在获得时间序列降维后的均值、斜率以及样本熵数值序列的基础上,根据其数值分布情况,对每一类特征值的数值空间进行等概率分割,并使用不同的字符来对分割后的数值子空间区域分别进行表示。
所述计算异常点两侧子序列的多维SAX向量的相似度得分并结合判定阈值,来对其异常模式进行准确的判定,包括以下步骤:针对某一分段界点,比较其两侧子序列的多维符号化向量的长度。将长序列L的多维符号化向量序列作为待匹配序列,并将短序列Q的多维符号化向量序列/>作为目标模板序列;将目标模板序列/>在待匹配序列/>上由左至右平移,并在平移过程中计算两者在每个位置时的相似度分值。在获取平移过程中生成的相似度分值集合的基础上,选取其中的最小值作为该分段界点的异常模式判定分值;设定模式判定的阈值T,若此处分值大于T,则判定该异常点属于有效异常模式;若此处分值小于T,则判定该异常点属于无效异常模式;重复上述步骤,直至判定完监测序列中的全部异常点。
所述基于灰关联算法的时间序列关联性分析校验,包括:通过对动态过程发展态势的量化分析,完成时间序列有关统计数据几何关系的比较,依据各参量变化曲线几何形状的相似程度,对各参量间关联程度的强弱进行判断,并求出各参量之间的关联度,将灰关联度大于阈值的比较序列作为参考序列的关联序列。当监测序列的某一异常点被判定为无效异常模式时,若该序列存在关联序列,需结合关联序列进行判定结果校验。若在相同或邻近时刻,该监测序列的关联序列未出现异常点,则可以判定该异常点属于无效异常模式;若在相同或邻近时刻,该监测序列的关联序列出现异常点,则将该异常点归类为有效异常模式。
所述使用改进K-means方法对历史数据进行分析,并获得最优聚类中心与聚类结果,包括:计算在线监测历史数据集中每个样本点的密度、平均距离和权重,选择最大密度点作为聚类中心,将样本中距离聚类中心小于样本平均距离的点删除;然后选择具有最大参数的点作为第2个聚类中心,然后将数据集中距离第2个聚类中心点小于样本平均距离的点删除,重复同样的步骤,直到数据集为空;经过上述步骤,得到聚类中心点与聚类簇的个数。
所述获取新数据,计算数据与聚类中心的距离,并与阈值相对比,包括:聚类中心为C={c1,c2,…cj,…,ck},样本xi与cj的距离用dij(xi,cj)表示,目标函数J是X中dij(xi,cj)的总和;xi与其相应cj间的相似性指标选择加权欧氏距离。
实施例3
本实施例3中,提供变压器状态监测数据的异常检测方法,如图1所示,该方法包括以下步骤:
S101、输入历史监测正常数据序列。其中,变压器历史监测正常状态数据可以是变压器的油温数据、甲烷数据、乙烯数据以及负荷数据等。
S102、运用改进经验小波变换对变压器监测数据进行预处理,将其自适应分解为频率互异的时间序列分量。
做原始数据序列f(t)的单边傅里叶频谱:F(ω)=|FFT[f(t)]|,然后将F(ω)均分为m段,取每段数据最大值与其横坐标作为节点记作Aj(j=1,2,...,J),J=M/m,M为离散频谱F(ω)的数据长度;对所有节点Aj进行三次样条插值,生成信号频谱的包络曲线,取包络曲线的极小值点作为频谱频率分割边界,得到Ωn=[ωn-1,ωn],n=1,...,N,ω表示相邻片段间的分割界限;随后以ωn构造N个经验小波,经验尺度函数与经验小波函数的计算公式分别如式(1)和式(2)所示,其中,β与γ的取值分别如式(3)与式(4)所示。
在构造完成一组经验小波后,可以采用类似于传统的小波变换方法来定义信号f(t)的经验小波变换。细节相关系数通过经验小波函数与信号内积产生,其计算公式如式(5)所示;近似相关系数通过尺度函数与信号内积产生,其计算公式如式(6)所示。
式中,φ1(t)和ψn(t)分别为尺度函数与经验小波函数;和/>分别为其傅里叶变换;/>和/>分别为其复共轭。
根据式(7)对原始信号进行重构,并由此获得经验模态函数fk(t),其表达式分别如式(8)与式(9)所示。
式中,符号*表示卷积运算,与/>分别为/>与/>的傅里叶变换形式。
经过上述步骤,改进经验小波变换最终将输入信号f(t)分解为若干个模态分量,其中,f0(t)表示经验尺度分量,由近似相关系数与经验尺度函数的卷积构成,其表征原始序列的整体变化趋势部分;fk(t)表示经验小波分量,由细节相关系数与经验小波函数的卷积构成,其表征原始序列中不同频域的特征分量。
S103、运用ARIMA-BP模型对不同的序列分量分别进行时序建模,将各分量预测值进行重构以获得监测序列预测值。
其中,采用构造检验统计量进行假设检验的单位根检验方法对分解后的各分量进行平稳性检验,确定差分阶数的取值。对于非平稳时间序列需要反复进行差分处理,直至处理后的时间序列平稳化为止。针对某非平稳时间序列{xt}的差分处理过程如式(10)所示。
式中,B为延迟算子;为有序差分算子;d表示差分阶数。
通过差分处理将非平稳时间序列{xt}转化为平稳时间序列{yt},在此基础上,对其建立ARMA(p,q)模型,其数学表达式如式(11)所示。
式中,表示t时刻的预测值;p和q为非负整数,分别表示模型中自回归项和移动平均项的阶数;/>表示第i个自回归项的系数;θj表示第j个移动平均项的系数;{εt}表示服从独立正态分布的白噪声序列。
ARMA模型的构建过程包括模型定阶与参数估计,在采用极大似然法估计模型参数的基础上,以赤池信息准则为依据,通过限定p和q的取值范围,选取使AIC值最小化的阶数组合作为模型定阶结果。由于赤池信息准则兼顾了建模复杂度与模型拟合度,所以利用其能够筛选出包含最少自由参数且具有最佳拟合效果的ARMA模型表达形式。
BP模型全称为基于误差反向传播算法的多层前馈型神经网络算法模型,通过模拟人脑神经突触进行信息传递来建立数学模型,拓扑结构包含输入层、隐藏层和输出层,具体结构如图2所示,图中Z1、Z2、Z3、Z4表示神经网络的输入值,Wmp表示输入层第m个神经元与隐藏层第p个神经元之间的权重值,Wp1表示隐藏层第p个神经元与输出层第1个神经元之间的权重值;y1,y2,…,yp表示神经元激活函数;bmp和bp1表示神经元之间的阈值;O1表示神经网络的输出值。
BP模型的训练过程包括:首先从输入层输入训练样本数据,把计算后的输出结果作为第一隐含层的输入,第一隐含层根据激活函数进行数据分析处理输出,输出结果作为第二隐含层的输入,循环往复直到满足输出层阈值要求后进行最终结果输出。误差反向传播的含义是通过比较隐含层的结果与输出层阈值大小得到误差值并反向传播,根据误差值在返回过程中来动态调整隐含层与输出层神经元之间的权值系数,然后逐步修正误差达到理想效果。
通过改进经验小波变换理论对电力变压器监测数据时间序列进行多尺度分解,并针对分解得到的模态分量经过上述步骤构建ARIMA-BP预测模型。为保证模型的预测准确性,本实施例中仅对分量值进行单步预测,通过拟合窗口与预测窗口随时间向右滑动,可得到关于模态分量的完整预测序列。进一步地,通过对各分量的预测结果进行重构,可得到关于监测数据的完整预测序列。
S104、获取新数据,通过计算监测指标预测值与新测量数据之间的差值得到残差序列,结合改进孤立森林算法对残差序列进行异常识别,并将异常点作为分段界点对原始监测序列进行分段。
其中,通过运用改进经验小波变换与ARIMA-BP模型得到每个时刻监测指标的预测值后,将其与实际测量值相减,求得对应时刻的残差项,其表达式如式(12)所示。残差序列由于在数值上消除了原始监测序列在变化过程中的周期性与趋势性的影响,使得残差项在零值附近波动。因此,由各类突发事件所导致的异常数据会以离群点的形式在残差序列中得到更为明显的表现,而不受原始序列中因周期性波动或趋势性发展等因素所造成的对原本异常值的掩盖或干扰。
式中,rest为t时刻的残差项;与xt分别表示在t时刻监测指标的预测值与实际值。
孤立森林由众多孤立树组成。作为一种随机二叉树,孤立树的构造过程包括如下步骤:随机选取n个训练数据作为子样本集,放入树的根节点;随机指定一个属性维度,并在该属性维度的最大值与最小值间随机生成一个切割点s;对此节点的区分有效性进行判断,基于孤立森林的基本原理,若二叉树节点能较大程度地将异常点和正常点区分,则此二叉树的节点区分度高,可以判断为优良节点二叉树,并继续往下生长,否则此二叉树节点为拙劣节点,二叉树停止生长,选择下一棵二叉树进行训练;若s为优良节点,以此切割点生成超平面对当前的节点数据空间进行分割,得到两个子样本空间,并将指定维度中小于s的数据放入当前节点的左侧分支,将大于或等于s的数据放入当前节点的右侧分支;重复切割数据空间,不断构造新的子空间节点,直至数据本身无法继续分割或达到孤立树的深度限制;选择下一个二叉树重复上述步骤,直到所有二叉树训练完成。
其中,有效性参数σ的判别公式如式(13)所示。
通过上述步骤构建包含多棵孤立树的孤立森林,便可基于样本在各孤立树中的路径长度检测出异常数据。其中,路径长度h(x)是指样本点x从根节点到外部节点所经过的二叉树边数,异常数据由于其特殊性,通常可以较早地被分离到达外部节点,路径长度较小;相对应地,正常数据要经过多次二叉树分类后才能被分离出来,路径长度较大。因此,数据异常的程度可以通过异常分值s(x,n)判断,其定义如式(14)及式(15)所示。
式中,H(*)表示调和数,其值可以估计为ln(i)+ξ,其中ξ为欧拉常数;c(n)表示给定样本个数后的平均路径长度,用于标准化样本的路径长度;E(h(x))表示样本点x在孤立森林中所有孤立树的路径长度的平均值。
由式(14)可知,样本点异常分值s(x,n)的取值范围为[0,1],当s(x,n)趋近于1时,表明该样本点为异常数据的可能性愈高;当s(x,n)趋近于0时,表明该样本点为正常数据的可能性愈高;而当所有样本的s(x,n)都在0.5附近时,表明明样本集没有明显的异常值。
S105、采用基于改进多维SAX向量表示与时间序列关联性分析的异常模式区分方法区分无效异常数据与有效异常数据。
其中,改进多维SAX向量表示方法首先对原始监测序列进行z-score标准化处理,以保证数据间的可比性,z-score标准化值的计算公式如式(16)所示。
式中,xt为时间序列在时刻t的取值;μ与σ分别表示该段时间序列的均值与标准差。
通过对标准化处理后的时间序列进行等距分段,并从统计特性、形态特性及熵特性三个角度出发构建能够完备表征时间序列特性的特征值向量,以提高后续相似度检索查询的准确性。本实施例选用均值来表征时间序列的统计特性,针对每个分段时间序列,采用最小二乘法对其数据点拟合出一条近似的直线,并计算得到该直线的斜率来表征该段时间序列的形态特性,选用样本熵来表征时间序列的熵特性。
其中,样本熵的具体计算过程如下:假设输入一段长度为N的时间序列,记作{xt}={x1,x2,…,xN},将序列{xt}按顺序组成m维矢量,即Xi=[xi,xi+1,…,xi+m-1],其中i=1,2,…,N-m+1;定义Xi与Xj之间的距离d(Xi,Xj)为两者对应元素差值最大的一个,其表达式如式(17)所示。
d(Xi,Xj)=max{|xi+k-xj+k|,0≤k≤m-1} (17)
给定相似容限r,对每一个i值统计d(Xi,Xj)<r的数目,然后计算其与距离总数N-m的比值,记作Bi m(r),其表达式如式(18)所示。
计算的平均值,记作Bm(r),其表达式如式(19)所示。
更新维数,增加维数至m+1,重复以上步骤,则可得到的平均值,记作Bm+1(r),其表达式如式(20)所示。
计算样本熵SampEn,其计算公式如式(21)所示。
样本熵反映了时间序列的复杂程度,当样本熵值越小时,时间序列的自相似性就越高;反之,当样本熵值越大时,时间序列就越复杂。
在获得时间序列降维后的均值、斜率以及样本熵数值序列的基础上,根据其数值分布情况,对每一类特征值的数值空间进行等概率分割,并使用不同的字符来对分割后的数值子空间区域分别进行表示,譬如字母集合{A,B,C,D,E,…}。本实施例将字符集合的规模参数记作α,即代表所划分的数值子空间数目。α的取值越大,说明均分数值空间的粒度更细,区分的精度更高。通常情况下,α的取值范围为[3,20]。经过上述步骤,可将表示不同特征值的数值序列转换为字符序列,本实施例将表示均值特征的字符序列记作将表示斜率特征的字符序列记作/>将表示样本熵特征的字符序列记作/>
综合上述,本实施例中,通过改进SAX向量表示方法构造了一个三维实向量空间,空间中的三个维度分别代表均值、斜率及样本熵三个特征指标。因此,时间序列的各子段特性均可用三维空间中的一条符号向量进行表示,即可用来表征时间序列的第i个子段的特性。
在以异常点作为分段界点对原始监测序列进行分割的基础上,通过上述步骤可得到各分段子序列的多维符号化向量表示。当异常点属于有效异常模式时,其左右两侧的子序列特性会存在较大的差异;而当异常点属于无效异常模式时,其左右两侧的子序列会保持较为一致的特性。因此,通过计算异常点两侧子序列的多维SAX向量的相似度值,来对其异常模式进行准确的判定,其具体流程包括:针对某一分段界点,比较其两侧子序列的多维符号化向量的长度,现将长序列L的多维符号化向量序列作为待匹配序列,并将短序列Q的多维符号化向量序列/>作为目标模板序列;将目标模板序列/>在待匹配序列/>上由左至右平移,并在平移过程中计算两者在每个位置时的相似度分值,其计算公式如式(22)与式(23)所示。在获取平移过程中生成的相似度分值集合的基础上,选取其中的最小值作为该分段界点的异常模式判定分值。
式中,w表示目标模板序列的长度;dist()表示字符距离的度量函数,通过查表能够得到任意两个字符间的距离。
设定模式判定的阈值T,若此处分值大于T,则判定该异常点属于有效异常模式;若此处分值小于T,则判定该异常点属于无效异常模式。重复以上步骤,直至判定完监测序列中的全部异常点。
考虑到阈值设定存在一定的局限性,因此,在使用阈值进行异常模式区分的基础上,引入灰关联分析算法来实现对判定结果的进一步校验。将参考序列记作并假设存在m组比较序列,分别记作/>其中,i=1,2,3,…,m。由于各监测指标物理意义的不同,导致其数据的量纲也不一定相同,因此,需要针对上述序列进行无量纲化处理,处理过程如式(24)所示
在完成序列无量纲化处理的基础上,计算每个比较序列与参考序列对应元素的关联系数,其计算公式如式(25)所示。
式中,ζi(t)表示参考序列与第i组比较序列在时刻t的灰关联系数,反映了两组序列在某一时刻的紧密程度;常数ρ表示分辨系数,其取值范围为区间(0,1),为提高关联系数间的差异,通常取ρ值为0.5。通过综合各时间点的灰关联系数,可得到参考序列与第i组比较序列之间的灰关联度,其计算公式如式(26)所示。
ri反映了两组序列间的相关程度,ri值越大,表明二者间的关系越紧密,其发展的趋势和速率越接近。本实施例将关联度阈值rmin设置为0.75,将灰关联度大于0.75的比较序列作为参考序列的关联序列。
S106、获得初始聚类中心与聚类结果。
其中,设数据集D中有h个数据,则D={x1,x2,...,xh},其中每一个样本点为xi={xi1,xi2,...,xig},1≦i≦h,样本的维度为g。首先计算在线监测历史数据集中每个样本点的密度、平均距离和权重,计算公式如式(27-29)所示,其中dw(xi,xj)采用加权欧氏距离,dw(xi,xj)、ωid和ai的取值如式(30-32)所示,si的取值原则是:若样本xi不是密度最大的样本,则si是样本点与类簇之中最小的距离,即si=min(dw(xi,xj));若样本xi是密度最大的样本,则定义si是类簇之中最大的距离,即si=max(dw(xi,xj))。
式中,函数
选择最大密度点作为聚类中心,将样本中距离聚类中心小于样本平均距离的点删除;然后选择具有最大参数的点作为第2个聚类中心,然后将数据集中距离第2个聚类中心点小于样本平均距离的点删除,重复同样的步骤,直到数据集为空;经过上述步骤,得到聚类中心点与聚类簇的个数。
其中,参数的计算公式如式(33)所示。
τi=ωidw(xi,ci-1) (33)
S107、获取新数据,计算与聚类中心的距离,并与阈值相对比。
其中,样本xi与聚类中心cj的距离用dij(xi,cj)表示,选择加权欧氏距离表征,计算公式如式(34)所示。
S108、若数据不属于任何一个聚类中心,则数据处于异常状态,若属于某一个聚类中心,则将数据加入历史数据中计算新的最优聚类中心以及聚类结果。
其中,要获得最优聚类中心以及聚类结果,目标函数J是X中dij(xi,cj)的总和,与聚类效果关系呈现负相关关系,当J越小该聚类效果越好,因此当J到达最小值时,即为最优聚类方案。xi与其相应cj间的相似性指标,则目标函数如式(35)所示。
式中是属于簇j的样本。通过寻找最佳中心cj使J为最小值来确定聚类中心,聚类中心如式(36)所示。
式中nj是簇j的样本数量。
S109、结合改进多维SAX向量表示法与改进K-means方法分析结果,判定原始监测序列的异常情况。
其中,由步骤S102-S105判定是否为突发故障,由步骤S106-S108判定是否为轻微故障。
实施例4
本实施例4提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质用于存储计算机指令,所述计算机指令被处理器执行时,实现如上所述的电力变压器监测数据的异常识别及模式区分方法,该方法包括:
获取待处理变压器历史正常状态数据,并运用改进经验小波变换对变压器监测数据进行预处理,将其自适应分解为频率互异的时间序列分量;
运用ARIMA-BP模型对不同的序列分量分别进行时序建模,将各分量预测值进行重构,获得监测序列预测值;
获取新的变压器实时监测数据,通过计算监测序列预测值与新测量数据之间的差值得到残差序列,结合改进孤立森林算法对残差序列进行异常识别,并将异常点作为分段界点对新的变压器实时监测数据序列进行分段;
采用基于改进多维SAX向量表示与时间序列关联性分析的异常模式区分方法区分无效异常数据与有效异常数据;同时使用改进K-means方法对历史正常状态数据进行分析,并获得最优聚类中心与聚类结果;
获取新的变压器实时监测数据,计算数据与聚类中心的距离,并与阈值相对比;若数据不属于任何一个聚类中心,则数据处于异常状态,若属于某一个聚类中心,则将数据加入历史数据中计算新的最优聚类中心以及聚类结果;
结合改进多维SAX向量表示法与改进K-means方法分析结果,判定原始监测序列的异常情况。
实施例5
本实施例5提供一种计算机程序产品,包括计算机程序,所述计算机程序当在一个或多个处理器上运行时,用于实现如上所述的电力变压器监测数据的异常识别及模式区分方法,该方法包括:
获取待处理变压器历史正常状态数据,并运用改进经验小波变换对变压器监测数据进行预处理,将其自适应分解为频率互异的时间序列分量;
运用ARIMA-BP模型对不同的序列分量分别进行时序建模,将各分量预测值进行重构,获得监测序列预测值;
获取新的变压器实时监测数据,通过计算监测序列预测值与新测量数据之间的差值得到残差序列,结合改进孤立森林算法对残差序列进行异常识别,并将异常点作为分段界点对新的变压器实时监测数据序列进行分段;
采用基于改进多维SAX向量表示与时间序列关联性分析的异常模式区分方法区分无效异常数据与有效异常数据;同时使用改进K-means方法对历史正常状态数据进行分析,并获得最优聚类中心与聚类结果;
获取新的变压器实时监测数据,计算数据与聚类中心的距离,并与阈值相对比;若数据不属于任何一个聚类中心,则数据处于异常状态,若属于某一个聚类中心,则将数据加入历史数据中计算新的最优聚类中心以及聚类结果;
结合改进多维SAX向量表示法与改进K-means方法分析结果,判定原始监测序列的异常情况。
实施例6
本实施例6提供一种电子设备,包括:处理器、存储器以及计算机程序;其中,处理器与存储器连接,计算机程序被存储在存储器中,当电子设备运行时,所述处理器执行所述存储器存储的计算机程序,以使电子设备执行实现如上所述的电力变压器监测数据的异常识别及模式区分方法的指令,该方法包括:
获取待处理变压器历史正常状态数据,并运用改进经验小波变换对变压器监测数据进行预处理,将其自适应分解为频率互异的时间序列分量;
运用ARIMA-BP模型对不同的序列分量分别进行时序建模,将各分量预测值进行重构,获得监测序列预测值;
获取新的变压器实时监测数据,通过计算监测序列预测值与新测量数据之间的差值得到残差序列,结合改进孤立森林算法对残差序列进行异常识别,并将异常点作为分段界点对新的变压器实时监测数据序列进行分段;
采用基于改进多维SAX向量表示与时间序列关联性分析的异常模式区分方法区分无效异常数据与有效异常数据;同时使用改进K-means方法对历史正常状态数据进行分析,并获得最优聚类中心与聚类结果;
获取新的变压器实时监测数据,计算数据与聚类中心的距离,并与阈值相对比;若数据不属于任何一个聚类中心,则数据处于异常状态,若属于某一个聚类中心,则将数据加入历史数据中计算新的最优聚类中心以及聚类结果;
结合改进多维SAX向量表示法与改进K-means方法分析结果,判定原始监测序列的异常情况。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明公开的技术方案的基础上,本领域技术人员在不需要付出创造性劳动即可做出的各种修改或变形,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种电力变压器监测数据的异常识别及模式区分方法,其特征在于,包括:
获取待处理变压器历史正常状态数据,并运用改进经验小波变换对变压器监测数据进行预处理,将其自适应分解为频率互异的时间序列分量;
运用ARIMA-BP模型对不同的序列分量分别进行时序建模,将各分量预测值进行重构,获得监测序列预测值;
获取新的变压器实时监测数据,通过计算监测序列预测值与新测量数据之间的差值得到残差序列,结合改进孤立森林算法对残差序列进行异常识别,并将异常点作为分段界点对新的变压器实时监测数据序列进行分段;
采用基于改进多维SAX向量表示与时间序列关联性分析的异常模式区分方法区分无效异常数据与有效异常数据;同时使用改进K-means方法对历史正常状态数据进行分析,并获得最优聚类中心与聚类结果;
获取新的变压器实时监测数据,计算数据与聚类中心的距离,并与阈值相对比;若数据不属于任何一个聚类中心,则数据处于异常状态,若属于某一个聚类中心,则将数据加入历史数据中计算新的最优聚类中心以及聚类结果;
结合改进多维SAX向量表示法与改进K-means方法分析结果,判定原始监测序列的异常情况。
2.根据权利要求1所述的电力变压器监测数据的异常识别及模式区分方法,其特征在于,所述运用改进经验小波变换对变压器监测数据进行预处理,包括:做输入信号的单边傅里叶频谱;取每段数据最大值与其横坐标作为节点;对所有节点进行三次样条插值,生成信号频谱的包络曲线,取包络曲线的极小值点作为频谱频率分割边界;以相邻片段间的分割界限构造N个经验小波,然后采用小波变换方法定义原始序列的经验小波变换;对原始信号进行重构,并由此获得经验模态函数;其中,通过搜索频谱的局部极大值来确定其余N-1个分割界限,包括:假定M为极大值个数,当M≥N时,保留前N-1个极大值;当M<N时,保留全部极大值并对N进行修正;通过选取两个局部极大值间的中间频率作为相邻片段间的分割界限ωn,其中n=1,2,…,N-1。
3.根据权利要求1所述的电力变压器监测数据的异常识别及模式区分方法,其特征在于,所述运用ARIMA-BP模型对不同的序列分量分别进行时序建模,将各分量预测值进行重构以获得监测序列预测值,包括:
使用构造检验统计量进行假设检验的单位根检验方法,对输入时间序列进行平稳性检验,确定差分阶数的取值,并对于非平稳时间序列需要反复进行差分处理,直至处理后的时间序列平稳化,建立ARIMA(p,q)模型;
使用ARIMA(p,q)模型进行数据预测后,将预测结果作为BP模型的输入,真实结果数据作为BP模型的标准输出,来训练BP模型,最终测试数据先经过ARIMA(p,q)模型的初步预测,预测结果作为训练完毕的BP模型的输入,最终BP模型输出优化后的预测结果。
4.根据权利要求3所述的电力变压器监测数据的异常识别及模式区分方法,其特征在于,所述ARIMA(p,q)模型的构建包括:在采用极大似然法估计模型参数的基础上,以赤池信息准则为依据,通过限定p和q的取值范围,选取使AIC值最小化的阶数组合来进行模型定阶与参数估计;
所述BP模型通过模拟人脑神经突触进行信息传递来建立数学模型,拓扑结构包含输入层、隐藏层和输出层,训练过程首先从输入层输入训练样本数据,把计算后的输出结果作为第一隐含层的输入,第一隐含层根据激活函数进行数据分析处理输出,输出结果作为第二隐含层的输入,循环往复直到满足输出层阈值要求后进行最终结果输出。
5.根据权利要求1所述的电力变压器监测数据的异常识别及模式区分方法,其特征在于,所述结合改进孤立森林算法对残差序列进行异常识别,并将异常点作为分段界点对原始监测序列进行分段,包括:
步骤一:随机选取n个训练数据作为子样本集,放入树的根节点。
步骤二:随机指定一个属性维度,并在该属性维度的最大值与最小值间随机生成一个切割点s,对此节点的区分有效性进行判断,基于孤立森林的基本原理,若二叉树节点能较大程度地将异常点和正常点区分,则此二叉树的节点区分度高,可以判断为优良节点二叉树,并继续往下生长,否则此二叉树节点为拙劣节点,二叉树停止生长,选择下一棵二叉树进行训练。
步骤三:若s为优良节点,以此切割点生成超平面对当前的节点数据空间进行分割,得到两个子样本空间,并将指定维度中小于s的数据放入当前节点的左侧分支,将大于或等于s的数据放入当前节点的右侧分支。
步骤四:重复执行步骤二与步骤三,不断构造新的子空间节点,直至数据本身无法继续分割或达到孤立树的深度限制。
步骤五:选择下一个二叉树重复上述步骤,直到所有二叉树训练完成。
6.根据权利要求1所述的电力变压器监测数据的异常识别及模式区分方法,其特征在于,所述基于改进多维SAX向量表示与时间序列关联性分析的异常模式区分方法,包括:采用改进多维SAX向量表示法对分段子序列进行多维符号化向量表示;通过计算相邻两段符号向量的相似度得分并结合判定阈值区分出无效异常数据与有效异常数据;利用灰关联算法的时间序列关联性分析对模式判定结果进行校验。
7.根据权利要求1所述的电力变压器监测数据的异常识别及模式区分方法,其特征在于,所述改进多维SAX向量表示法对分段子序列进行多维符号化向量表示,包括:时间序列的z-score标准化处理;通过对标准化处理后的时间序列进行等距分段,并从统计特性、形态特性及熵特性三个角度出发构建能够完备表征时间序列特性的特征值向量,其中选用均值来表征时间序列的统计特性,采用最小二乘法对其数据点拟合出一条近似的直线,并计算得到该直线的斜率来表征该段时间序列的形态特性,选用样本熵来表征时间序列的熵特性;在获得时间序列降维后的均值、斜率以及样本熵数值序列的基础上,根据其数值分布情况,对每一类特征值的数值空间进行等概率分割,并使用不同的字符来对分割后的数值子空间区域分别进行表示。
8.根据权利要求7所述的电力变压器监测数据的异常识别及模式区分方法,其特征在于,所述通过计算异常点两侧子序列的多维SAX向量的相似度得分并结合判定阈值,来对其异常模式进行准确的判定,包括:
步骤101:针对某一分段界点,比较其两侧子序列的多维符号化向量的长度;将长序列L的多维符号化向量序列作为待匹配序列,并将短序列Q的多维符号化向量序列/>作为目标模板序列;
步骤102:将目标模板序列在待匹配序列/>上由左至右平移,并在平移过程中计算两者在每个位置时的相似度分值;在获取平移过程中生成的相似度分值集合的基础上,选取其中的最小值作为该分段界点的异常模式判定分值;
步骤103:设定模式判定的阈值T,若此处分值大于T,则判定该异常点属于有效异常模式;若此处分值小于T,则判定该异常点属于无效异常模式;
步骤104:重复步骤101至步骤103,直至判定完监测序列中的全部异常点。
9.根据权利要求6所述的电力变压器监测数据的异常识别及模式区分方法,其特征在于,所述基于灰关联算法的时间序列关联性分析校验,包括:通过对动态过程发展态势的量化分析,完成时间序列有关统计数据几何关系的比较,依据各参量变化曲线几何形状的相似程度,对各参量间关联程度的强弱进行判断,并求出各参量之间的关联度,将灰关联度大于阈值的比较序列作为参考序列的关联序列;当监测序列的某一异常点被判定为无效异常模式时,若该序列存在关联序列,需结合关联序列进行判定结果校验;若在相同或邻近时刻,该监测序列的关联序列未出现异常点,则可以判定该异常点属于无效异常模式;若在相同或邻近时刻,该监测序列的关联序列出现异常点,则将该异常点归类为有效异常模式。
10.一种电力变压器监测数据的异常识别及模式区分系统,其特征在于,包括:
预处理模块,用于获取待处理变压器历史正常状态数据,并运用改进经验小波变换对变压器监测数据进行预处理,将其自适应分解为频率互异的时间序列分量;
监测序列预测模块,用于运用ARIMA-BP模型对不同的序列分量分别进行时序建模,将各分量预测值进行重构,获得监测序列预测值;
监测序列分段模块,用于获取新的变压器实时监测数据,通过计算监测序列预测值与新测量数据之间的差值得到残差序列,结合改进孤立森林算法对残差序列进行异常识别,并将异常点作为分段界点对新的变压器实时监测数据序列进行分段;
区分聚类模块,用于采用基于改进多维SAX向量表示与时间序列关联性分析的异常模式区分方法区分无效异常数据与有效异常数据;同时使用改进K-means方法对历史正常状态数据进行分析,并获得最优聚类中心与聚类结果;
对比模块,用于获取新的变压器实时监测数据,计算数据与聚类中心的距离,并与阈值相对比;若数据不属于任何一个聚类中心,则数据处于异常状态,若属于某一个聚类中心,则将数据加入历史数据中计算新的最优聚类中心以及聚类结果;
判定模块,用于结合改进多维SAX向量表示法与改进K-means方法分析结果,判定原始监测序列的异常情况。
CN202310874841.4A 2023-07-17 2023-07-17 电力变压器监测数据的异常识别及模式区分方法及系统 Pending CN116861354A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310874841.4A CN116861354A (zh) 2023-07-17 2023-07-17 电力变压器监测数据的异常识别及模式区分方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310874841.4A CN116861354A (zh) 2023-07-17 2023-07-17 电力变压器监测数据的异常识别及模式区分方法及系统

Publications (1)

Publication Number Publication Date
CN116861354A true CN116861354A (zh) 2023-10-10

Family

ID=88235665

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310874841.4A Pending CN116861354A (zh) 2023-07-17 2023-07-17 电力变压器监测数据的异常识别及模式区分方法及系统

Country Status (1)

Country Link
CN (1) CN116861354A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117134504A (zh) * 2023-10-25 2023-11-28 陕西禄远电子科技有限公司 基于安全防护的智能能源监测方法及系统
CN117273553A (zh) * 2023-11-22 2023-12-22 青州市华康生物科技有限公司 一种基于糖浆浓度检测的生产异常监测系统
CN117289778A (zh) * 2023-11-27 2023-12-26 惠州市鑫晖源科技有限公司 一种工控主机电源健康状态的实时监测方法
CN117436005A (zh) * 2023-12-21 2024-01-23 山东汇力环保科技有限公司 一种环境空气自动监测过程中异常数据处理方法
CN117517596A (zh) * 2024-01-08 2024-02-06 辽宁中消安全设备有限公司 基于物联网的可燃及有毒有害气体实时监测方法及系统
CN117576823A (zh) * 2023-11-29 2024-02-20 上海徽视科技集团有限公司 一种排队叫号系统终端
CN117851766A (zh) * 2024-03-08 2024-04-09 济宁万生环保材料有限公司 一种dotp粗酯连续蒸馏过程温度数据监测方法
CN117576823B (zh) * 2023-11-29 2024-05-14 上海徽视科技集团有限公司 一种排队叫号系统终端

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117134504B (zh) * 2023-10-25 2024-01-26 陕西禄远电子科技有限公司 基于安全防护的智能能源监测方法及系统
CN117134504A (zh) * 2023-10-25 2023-11-28 陕西禄远电子科技有限公司 基于安全防护的智能能源监测方法及系统
CN117273553A (zh) * 2023-11-22 2023-12-22 青州市华康生物科技有限公司 一种基于糖浆浓度检测的生产异常监测系统
CN117273553B (zh) * 2023-11-22 2024-02-02 青州市华康生物科技有限公司 一种基于糖浆浓度检测的生产异常监测系统
CN117289778B (zh) * 2023-11-27 2024-03-26 惠州市鑫晖源科技有限公司 一种工控主机电源健康状态的实时监测方法
CN117289778A (zh) * 2023-11-27 2023-12-26 惠州市鑫晖源科技有限公司 一种工控主机电源健康状态的实时监测方法
CN117576823A (zh) * 2023-11-29 2024-02-20 上海徽视科技集团有限公司 一种排队叫号系统终端
CN117576823B (zh) * 2023-11-29 2024-05-14 上海徽视科技集团有限公司 一种排队叫号系统终端
CN117436005A (zh) * 2023-12-21 2024-01-23 山东汇力环保科技有限公司 一种环境空气自动监测过程中异常数据处理方法
CN117436005B (zh) * 2023-12-21 2024-03-15 山东汇力环保科技有限公司 一种环境空气自动监测过程中异常数据处理方法
CN117517596A (zh) * 2024-01-08 2024-02-06 辽宁中消安全设备有限公司 基于物联网的可燃及有毒有害气体实时监测方法及系统
CN117517596B (zh) * 2024-01-08 2024-03-15 辽宁中消安全设备有限公司 基于物联网的可燃及有毒有害气体实时监测方法及系统
CN117851766A (zh) * 2024-03-08 2024-04-09 济宁万生环保材料有限公司 一种dotp粗酯连续蒸馏过程温度数据监测方法

Similar Documents

Publication Publication Date Title
CN116861354A (zh) 电力变压器监测数据的异常识别及模式区分方法及系统
Nejad et al. A new enhanced learning approach to automatic image classification based on Salp Swarm Algorithm
CN113139610A (zh) 一种针对变压器监测数据的异常检测方法及装置
KR100795227B1 (ko) 센서 어레이 신호 패턴 분석 방법 및 장치
CN108399434B (zh) 基于特征提取的高维时间序列数据的分析预测方法
CN113255848A (zh) 基于大数据学习的水轮机空化声信号辨识方法
CN116011894B (zh) 一种铝合金棒生产数据管理系统
CN115412455A (zh) 一种基于时间序列的服务器多性能指标异常检测方法及装置
CN113052271B (zh) 基于深度神经网络的生物发酵数据预测方法
CN112529053A (zh) 一种服务器中时序数据短期预测方法及系统
CN114443338A (zh) 面向稀疏负样本的异常检测方法、模型构建方法及装置
CN113344099B (zh) 一种基于变分自编码器的机械设备退化点识别方法和系统
CN116881841A (zh) 一种基于F1-score多级决策分析的混合模型故障诊断方法
CN113066544B (zh) 基于CAA-Net与LightGBM的FVEP特征点检测方法
CN113192629B (zh) 用于自动胎心判读的方法和装置
CN114041801B (zh) 基于psa-ewt和dcgan的心电信号重构方法及重构系统
CN116401561A (zh) 一种基于局部时域特征的设备级运行状态序列的时间关联聚类方法
CN114563671A (zh) 一种基于CNN-LSTM-Attention神经网络的高压电缆局部放电诊断方法
CN115281676A (zh) 基于gru神经网络和ecg信号的疲劳检测方法
Yan et al. Fault Diagnosis of Rolling Bearing with Small Samples Based on Wavelet Packet Theory and Random Forest
CN112617761A (zh) 自适应聚点生成的睡眠阶段分期方法
Wu et al. Review on Classification Algorithm and Evaluation System of Machine Learning
Huang Using Stepwise Method to Find the Most Influencing Feature to the Cell Nuclei of a Breast Mass
Zhuo et al. The evaluation of wind power time series multi-scale modeling methods
Zhao et al. Anomaly detection and pattern differentiation in monitoring data from power transformers

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination