CN109614576B - 基于多维高斯分布与趋势分段的变压器异常检测方法 - Google Patents
基于多维高斯分布与趋势分段的变压器异常检测方法 Download PDFInfo
- Publication number
- CN109614576B CN109614576B CN201811514382.4A CN201811514382A CN109614576B CN 109614576 B CN109614576 B CN 109614576B CN 201811514382 A CN201811514382 A CN 201811514382A CN 109614576 B CN109614576 B CN 109614576B
- Authority
- CN
- China
- Prior art keywords
- value
- data
- trend
- values
- transformer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000009826 distribution Methods 0.000 title claims abstract description 34
- 238000001514 detection method Methods 0.000 title claims abstract description 30
- 230000011218 segmentation Effects 0.000 title claims abstract description 19
- 230000002159 abnormal effect Effects 0.000 claims abstract description 39
- 238000012544 monitoring process Methods 0.000 claims abstract description 22
- 238000012545 processing Methods 0.000 claims abstract description 12
- 238000004458 analytical method Methods 0.000 claims abstract description 10
- 238000004140 cleaning Methods 0.000 claims abstract description 9
- 238000012216 screening Methods 0.000 claims abstract description 9
- 239000007789 gas Substances 0.000 claims description 57
- 238000012795 verification Methods 0.000 claims description 34
- 229910052739 hydrogen Inorganic materials 0.000 claims description 17
- 239000001257 hydrogen Substances 0.000 claims description 17
- 230000000630 rising effect Effects 0.000 claims description 16
- 230000005856 abnormality Effects 0.000 claims description 14
- 230000001174 ascending effect Effects 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 12
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 claims description 10
- 229930195733 hydrocarbon Natural products 0.000 claims description 9
- 150000002430 hydrocarbons Chemical class 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 9
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 claims description 9
- 102100029469 WD repeat and HMG-box DNA-binding protein 1 Human genes 0.000 claims description 6
- 101710097421 WD repeat and HMG-box DNA-binding protein 1 Proteins 0.000 claims description 6
- HSFWRNGVRCDJHI-UHFFFAOYSA-N alpha-acetylene Natural products C#C HSFWRNGVRCDJHI-UHFFFAOYSA-N 0.000 claims description 6
- OTMSDBZUPAUEDD-UHFFFAOYSA-N Ethane Chemical compound CC OTMSDBZUPAUEDD-UHFFFAOYSA-N 0.000 claims description 5
- VGGSQFUCUMXWEO-UHFFFAOYSA-N Ethene Chemical compound C=C VGGSQFUCUMXWEO-UHFFFAOYSA-N 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 5
- 229910002092 carbon dioxide Inorganic materials 0.000 claims description 5
- 239000001569 carbon dioxide Substances 0.000 claims description 5
- 239000005977 Ethylene Substances 0.000 claims description 4
- 125000002534 ethynyl group Chemical group [H]C#C* 0.000 claims description 4
- 238000009499 grossing Methods 0.000 claims description 4
- 230000009466 transformation Effects 0.000 claims description 4
- 238000011282 treatment Methods 0.000 claims description 4
- 230000032683 aging Effects 0.000 claims description 3
- 230000002547 anomalous effect Effects 0.000 claims description 3
- 238000005336 cracking Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000009413 insulation Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 239000007787 solid Substances 0.000 claims description 3
- 230000001502 supplementing effect Effects 0.000 claims description 3
- 238000010200 validation analysis Methods 0.000 claims 2
- 125000004435 hydrogen atom Chemical class [H]* 0.000 claims 1
- 238000000034 method Methods 0.000 description 16
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 14
- 239000004215 Carbon black (E152) Substances 0.000 description 4
- ZHDBTKPXEJDTTQ-UHFFFAOYSA-N dipyrithione Chemical compound [O-][N+]1=CC=CC=C1SSC1=CC=CC=[N+]1[O-] ZHDBTKPXEJDTTQ-UHFFFAOYSA-N 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 150000002431 hydrogen Chemical class 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000009421 internal insulation Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Algebra (AREA)
- Housings And Mounting Of Transformers (AREA)
Abstract
本发明涉及一种基于多维高斯分布与趋势分段的变压器异常检测方法。该方法包括对获取到的变压器在线监测历史数据进行筛选和清理,处理无效数据;分析历史数据中每个点的走势,将每个点与前N个值的指数加权移动平均进行比较,得出偏差;采用多维高斯分布来分析变压器在线监测的各气体历史数据的偏差值,从而找出异常数据;同时辅以趋势分析,采用自底向上(BU)算法对历史监测数据分段,并分析各段趋势,发现趋势异常。本发明能够精确的的实现异常数据的分析检测,还能发现趋势异常,提高了整个变压器在线监测系统的准确性和实用性。
Description
技术领域
本发明涉及一种基于多维高斯分布与趋势分段的变压器异常检测方法,应用于变压器油中气体在线监测数据上,用于分析判断监测数据的异常与否,从而确定设备是否进入危急告警状态。
背景技术
电力设备在线监测系统(OMDS),可以及时掌握变电站内高压设备内部绝缘的真实状况,尽早发现故障隐患,供上级决策是否进行检修及其它处理,以防止发生事故损坏,对于提高电力系统的可靠性具有非常重要的作用。
现有的OMDS主要通过设置气体含量注意值和产气速率注意值来检测异常(电力行业标准(DL/T 722-2014)),注意值是指特征气体的含量或增量需引起关注的值。当超过注意值时,设备将进入危急告警状态,启动后续检测流程,结合设备的运行状况、结构特点、外部环境等因素进行综合判断,来确定设备是否存在故障及故障的严重程度。
现有通过设置注意值、告警值检测异常的方式存在以下缺陷:
1、危急告警注意值和产气速率注意值的确定对异常的第一时间发现起到了关键性的作用,设置过低,系统频繁告警,误报率增高,设置过高,当设备真正发生故障时系统却无法识别。然而,故障的界定无法用一个具体统一的值来决定(不同的设备,不同的环境)这导致了现有的OMDS的误报率和漏报率都很高,进而影响到整个在线监测系统的准确性和实用性。
2、现有OMDS存在监测数据不准确的问题,频繁出现数据失真,而通过注意值的异常检测方法,是一刀切的做法,无法结合不同设备的个体差异,有针对的做出异常判断。
3、采取阈值判断的方式忽略了对设备的历史趋势的分析,变压器油中气体值的走势对异常的检测甚至故障的判断有着极大的参考价值。
发明内容
本发明的目的在于提供一种基于多维高斯分布与趋势分段的变压器异常检测方法,能够精确的的实现变压器在线监测数据的异常检测,提高整个在线监测系统的准确性和实用性。
为实现上述目的,本发明的技术方案是:一种基于多维高斯分布与趋势分段的变压器异常检测方法,包括如下步骤:
步骤S1、数据的筛选与清理:对获取到的变压器在线监测数据的历史数据进行筛选和清理,处理无效数据;
步骤S2、数据预处理:设置滑动窗口,窗口宽度为w,将每个点与该点之前滑动窗口内所有数据的指数加权移动平均进行比较,得出偏差数据集;
获取变压器投入运行或滤油以来的油中检测气体观测历史数据D={(ti,yi),i=1,2,…N},其中ti是以t0为基准的相对时间,时间窗口宽度为w,那么观测值yi之前滑动窗口内的数据点表示为:
Sw(yi)={yi-w,yi-w+1,...,yi-1},i=w,w+1....N
对于时间窗Sw(yi)的指数加权移动平均值vi的计算公式如下:
νi=βyi-1+(1-β)×νi-1 (1)
把vi-w-1初始化为0后,展开该公式变为:
vi=(1-β)(yi-1+βyi-2+...βw-1yi-w) (2)
其中,β代表加权下降的速率,其值越小下降速度越快;在数学运算中,取作为临界值,小于该值的加权系数的值不做考虑,由于所以时间窗的宽度w的取值为:另由于vi-w-1初始化为0会导致初期的数值过小,所以对公式(1)进行修正:
把当前观测值减去yi减去νi,便得出我们要分析的偏差值,公式如下:
Δyi=yi-νi (4)
根据公式(4)获取到第w个数据之后所有数据的偏差值数据集D'={(tw,Δyw),(tw+1,Δyw+1),(tw+2,Δyw+2)),…(tN,ΔyN)},该偏差值数据集服从高斯分布;
步骤S3、基于多维高斯分布的异常检测:
正常运行状态下的变压器,因绝缘油和固体绝缘的老化裂解等会分解出极少量气体,这些气体会相互转换,因此各气体的浓度值之间的关系并不独立,而经步骤S2处理后,各气体的加权移动偏差值数据集D'均服从高斯分布,对此采用多维高斯分布来检测变压器在线监测数据异常;具体实现如下:
其中,μ∈Rm,∑∈Rm×m,Σ为协方差矩阵;
通过以上公式可计算出多维高斯模型的参数;对于新观测到的一气体样本值y*,减去它所在时间窗内移动指数加权平均后得到Δy*,这样m种同时观测到的气体偏差值组合生成检测数据x*,使用以上训练得到的多维高斯分布模型计算概率值,具体公式如下:
将计算出来的概率与阈值ε进行比较,若该概率值小于ε,则认为这个新观测到的样本值异常。
在本发明一实施例中,还包括一步骤S4,具体实现如下:
步骤S41、对步骤S3中观测到的异常样本值,进行去除,并采用其前后值的均值补充;
步骤S42、采用移动平均算法,进行趋势平滑;
步骤S43、采用自底向上BU算法对趋势进行分段,具体如下:
步骤S431、对于每一种气体历史数据采集而言,可看作为时间序列,每次采集的数据,均有x和y两个坐标值;
步骤S432、把时间序列中每个相邻点进行连线,接着把每个相邻的两个线段连接起来;此时每条线段均包含三个原始点,计算每条线段中间点的拟合误差;具体公式如下:
e=|yi-y'|
其中,yi-1,yi,yi+1代表三个相邻时间点的观测数值,y'代表估算出来的中间点的值,e为拟合误差;
计算所有相连的两线段之间的拟合误差,找出最小拟合误差并且小于阈值的线段作为第一条包含三个点的线段;
步骤S433、将包括新生成的线段的所有线段再次相邻连接,同理按照步骤S432的方式找出最小拟合误差并且小于阈值的线段,不断循环,直到最小误差大于阈值,退出循环;
步骤S44、对分段的数据信息进行趋势分析:
步骤S441、经步骤S43进行趋势分段后,根据线段走势分为:1,0,-1,其中,1、0、-1分别代表上升、不变、下降;
步骤S442、分析线段走势:
将同方向的走势合并起来,线段走势为0的可看作线段走势为1或线段走势为-1的同方向;
对于连续上升的情况,计算上升的起点与终点的差值、上升的斜率,若超过各自相应的阈值和斜率,则报警;
对于连续下降的情况,计算上升的起点与终点的差值、下降的斜率,若超过各自相应的阈值和斜率,则报警;
统计在X天内走势变换的次数,即由1变为-1或-1变为+1的次数,若次数超过阈值,计算数据的方差,若超过阈值,则报警。
在本发明一实施例中,所述步骤S2中的气体包括氢气、甲烷、二氧化碳、乙烯、乙炔、乙烷、总烃。
在本发明一实施例中,所述步骤S3中,m取7。
在本发明一实施例中,所述步骤S3中,阈值ε是通过验证集来确定的,该验证集是有着真实标签的历史数据中的气体观测值;阈值ε的获取方式具体如下:
步骤S31、对验证集里的每个样本采用训练模型得到概率值;
步骤S32、循环遍历所有的验证集计算出来的概率值,让阈值等于其中每一个概率值,做如下处理:
a、验证集的所有概率值与阈值进行比较,如果大于阈值则判断为正常,小于阈值,则判断为异常;
b、统计以下几个值:
TP:将标签为正常的验证样本预测为正常的数量;
FN:将标签为正常的验证样本预测为异常的数量;
FP:将标签为异常的验证样本预测为正常的数量;
FN:将标签为异常的验证样本预测为异常的数量;
c、计算F1值,公式如下:
步骤S33、经过步骤S32的遍历,得到最高的F1值,把相应的概率定为最佳阈值。
相较于现有技术,本发明具有以下有益效果:本发明不仅能够精确的的实现异常数据的分析检测,还能发现趋势异常,提高整个变压器在线监测系统的准确性和实用性。
附图说明
图1为本发明方法流程图。
图2为本发明一实例变电站的氢气观测的历史数据的直方图。
图3为本发明一实例变电站的氢气观测值做移动加权偏差处理后的直方图。
图4为本发明一实例变电站的氢气和总烃偏差值样本图,通过本发明检测异常。
图5为本发明一实例变电站的氢气和总烃样本图,通过本发明检测异常。
图6为本发明一实例变电站的氢气和总烃样本图,通过阈值方法来检测异常。
图7为本发明一实例变电站的氢气历史数据分段效果图。
具体实施方式
下面结合附图,对本发明的技术方案进行具体说明。
如图1所示,本发明提供了一种基于多维高斯分布与趋势分段的变压器异常检测方法,包括如下步骤:
步骤S1、数据的筛选与清理:对获取到的变压器在线监测数据的历史数据进行筛选和清理,处理无效数据;
步骤S2、数据预处理:设置滑动窗口,窗口宽度为w,将每个点与该点之前滑动窗口内所有数据的指数加权移动平均进行比较,得出偏差数据集;
获取变压器投入运行或滤油以来的油中检测气体(包括氢气、甲烷、二氧化碳、乙烯、乙炔、乙烷、总烃)观测历史数据D={(ti,yi),i=1,2,…N},其中ti是以t0为基准的相对时间,时间窗口宽度为w,那么观测值yi之前滑动窗口内的数据点表示为:
Sw(yi)={yi-w,yi-w+1,...,yi-1},i=w,w+1....N
对于时间窗Sw(yi)的指数加权移动平均值vi的计算公式如下:
νi=βyi-1+(1-β)×νi-1 (1)
把vi-w-1初始化为0后,展开该公式变为:
vi=(1-β)(yi-1+βyi-2+...βw-1yi-w) (2)
其中,β代表加权下降的速率,其值越小下降速度越快;在数学运算中,取作为临界值,小于该值的加权系数的值不做考虑,由于所以时间窗的宽度w的取值为:另由于vi-w-1初始化为0会导致初期的数值过小,所以对公式(1)进行修正:
把当前观测值减去yi减去νi,便得出我们要分析的偏差值,公式如下:
Δyi=yi-νi (4)
根据公式(4)获取到第w个数据之后所有数据的偏差值数据集D'={(tw,Δyw),(tw+1,Δyw+1),(tw+2,Δyw+2)),…(tN,ΔyN)},如图3所示,该偏差值数据集服从高斯分布;
步骤S3、基于多维高斯分布的异常检测:
正常运行状态下的变压器,因绝缘油和固体绝缘的老化裂解等会分解出极少量气体,这些气体会相互转换,因此各气体的浓度值之间的关系并不独立,而经步骤S2处理后,各气体的加权移动偏差值数据集D'均服从高斯分布,对此采用多维高斯分布来检测变压器在线监测数据异常;具体实现如下:
其中,μ∈Rm,∑∈Rm×m,Σ为协方差矩阵;
通过以上公式可计算出多维高斯模型的参数;对于新观测到的一气体样本值y*,减去它所在时间窗内移动指数加权平均后得到Δy*,这样m种同时观测到的气体偏差值组合生成检测数据x*,使用以上训练得到的多维高斯分布模型计算概率值,具体公式如下:
将计算出来的概率与阈值ε进行比较,若该概率值小于ε,则认为这个新观测到的样本值异常。
还包括一步骤S4,具体实现如下:
步骤S41、对步骤S3中观测到的异常样本值,进行去除,并采用其前后值的均值补充;
步骤S42、采用移动平均算法,进行趋势平滑;
步骤S43、采用自底向上BU算法对趋势进行分段,具体如下:
步骤S431、对于每一种气体历史数据采集而言,可看作为时间序列,每次采集的数据,均有x和y两个坐标值;
步骤S432、把时间序列中每个相邻点进行连线,接着把每个相邻的两个线段连接起来;此时每条线段均包含三个原始点,计算每条线段中间点的拟合误差;具体公式如下:
e=|yi-y'|
其中,yi-1,yi,yi+1代表三个相邻时间点的观测数值,y'代表估算出来的中间点的值,e为拟合误差;
计算所有相连的两线段之间的拟合误差,找出最小拟合误差并且小于阈值的线段作为第一条包含三个点的线段;
步骤S433、将包括新生成的线段的所有线段再次相邻连接,同理按照步骤S432的方式找出最小拟合误差并且小于阈值的线段,不断循环,直到最小误差大于阈值,退出循环;
步骤S44、对分段的数据信息进行趋势分析:
步骤S441、经步骤S43进行趋势分段后,根据线段走势分为:1,0,-1,其中,1、0、-1分别代表上升、不变、下降;
步骤S442、分析线段走势:
将同方向的走势合并起来,线段走势为0的可看作线段走势为1或线段走势为-1的同方向;
对于连续上升的情况,计算上升的起点与终点的差值、上升的斜率,若超过各自相应的阈值和斜率,则报警;
对于连续下降的情况,计算上升的起点与终点的差值、下降的斜率,若超过各自相应的阈值和斜率,则报警;
统计在X天内走势变换的次数,即由1变为-1或-1变为+1的次数,若次数超过阈值,计算数据的方差,若超过阈值,则报警。
所述步骤S3中,阈值ε是通过验证集来确定的,该验证集是有着真实标签的历史数据中的气体观测值;阈值ε的获取方式具体如下:
步骤S31、对验证集里的每个样本采用训练模型得到概率值;
步骤S32、循环遍历所有的验证集计算出来的概率值,让阈值等于其中每一个概率值,做如下处理:
a、验证集的所有概率值与阈值进行比较,如果大于阈值则判断为正常,小于阈值,则判断为异常;
b、统计以下几个值:
TP:将标签为正常的验证样本预测为正常的数量;
FN:将标签为正常的验证样本预测为异常的数量;
FP:将标签为异常的验证样本预测为正常的数量;
FN:将标签为异常的验证样本预测为异常的数量;
c、计算F1值,公式如下:
步骤S33、经过步骤S32的遍历,得到最高的F1值,把相应的概率定为最佳阈值。
以下为本发明的具体实现过程。
本申请提案是针对变压器在线监测数据的检测提出的一套解决方案,主要针对以下变压器油中气体进行分析:氢气(H2)、甲烷(CH4)、二氧化碳(CO2)、乙烯(C2H4)、乙炔(C2H2)、乙烷(C2H6)、总烃。
具体的本发明提供了一种基于多维高斯分布与分段检测的异常数据检测方法,具体如下:
1、数据的筛选与清理
对获取到的变压器在线监测数据的历史数据进行筛选和清理,处理无效数据(数据为空、不是新投入运行或没有滤油的情况下全部为0),如果当前日期是无效数据,设备进入异常状态,不做后期分析。
如果是当前数据为有效数据,对历史数据进行分析。历史数据中如果出现连续的无效数据,则直接去除。如果出现单独的异常值,则以前后的平均值作为值输入。
2、基于高斯模型的对各个气体的异常检测
变压器在线监测在投入运行中积累了大量的监测数据,利用原有的评价标准,无法准确的对数据做出判断,确定数据是否真的异常。所以可以把除了按原有方法标识出来的异常数据视为异常外,其它历史数据看作是无标签样本。通常正常状况的数据占大多数,而异常状况的样本很少,对最终的模型影响很小,所以可以把所有的历史数据用一个模型建模。
由于历史数据横跨的时间很长,甚至长达几年,在这么长的时间跨度里,变压器及其相关设备可能大修,可能滤油等,而观测到的数据会因每次事件而产生大幅的改变,所以用统一的函数去描述所有的数据,用数学的规律去解释数据的走势,而不考虑各种突发的事件,是不可能的(如图2所示,为本实例一变压器的氢气观测的历史数据的直方图,该历史数据无法呈现高斯分布)。对此本申请分析历史数据中每个点的走势,是近距离范围的,即每个点与其所在滑动时间窗内数据指数加权移动平均进行比较,得出的偏差再分析它的高斯分布。
ExponentiallyWeightedMovingAverage(EWMA)指数加权移动平均是一种常用的序列数据处理方式,它是从算术平均(权重相等)、加权平均(权重不等)、加权移动平均(取最近的w次数据计算)演变过来的。它是以指数式递减加权的移动平均,各数值的加权影响力随时间呈指数式递减,时间越靠近当前时刻的数据加权影响力越大,而较远的数据给予较小的权值,以弥补简单移动平均算法的不足。
加权移动平均法的计算公式如下(这里以氢气的观测值来举例):
设置滑动窗口,窗口宽度为w,将每个点与该点之前滑动窗口内所有数据的指数加权移动平均进行比较,得出偏差数据集;
获取变压器投入运行或滤油以来的油中检测氢气的观测历史数据D={(ti,yi),i=1,2,…N},其中ti是以t0为基准的相对时间,时间窗口宽度为w,那么观测值yi之前滑动窗口内的数据点表示为:
Sw(yi)={yi-w,yi-w+1,...,yi-1},i=w,w+1....N
对于时间窗Sw(yi)的指数加权移动平均值vi的计算公式如下:
νi=βyi-1+(1-β)×νi-1 (1)
把vi-w-1初始化为0后,展开该公式变为:
vi=(1-β)(yi-1+βyi-2+...βw-1yi-w) (2)
其中,β代表加权下降的速率,其值越小下降速度越快;在数学运算中,取作为临界值,小于该值的加权系数的值不做考虑,由于所以时间窗的宽度w的取值为:另由于vi-w-1初始化为0会导致初期的数值过小,所以对公式(1)进行修正:
把当前观测值减去yi减去νi,便得出我们要分析的偏差值,公式如下:
Δyi=yi-νi (4)
根据公式(4)获取到第w个数据之后所有数据的偏差值数据集D'={(tw,Δyw),(tw+1,Δyw+1),(tw+2,Δyw+2)),…(tN,ΔyN)},如图3是本实例氢气观测值做移动加权偏差处理后的直方图。通过直方图可以看出,对历史数据进行这样的处理后,基本服从高斯分布。
3、基于多维高斯分布的异常检测
对于在线油色谱监测值,每次观测7种气体组分,而这七种组分会在某些特殊情况下相互转换,所以它们关系并不独立,对此本提案使用多元高斯分布来检测异常。经过公式(2)处理后,每种气体的偏差值都服从高斯分布,各维度之间的关系通过协方差矩阵来描述。对期望向量的估计如下:
其中,μ∈Rm,∑∈Rm×m,Σ为协方差矩阵;
通过以上公式可计算出多维高斯模型的参数;对于新观测到的一气体样本值y*,减去它所在时间窗内移动指数加权平均后得到Δy*,这样m种同时观测到的气体偏差值组合生成检测数据x*,使用以上训练得到的多维高斯分布模型计算概率值,具体公式如下:
将计算出来的概率与阈值ε进行比较,若该概率值小于ε,则认为这个新观测到的样本值异常。阈值ε利用验证集来获取,这里验证集是有着真实标签的历史油中气体观测值,通过验证集来获取最优概率阈值,进而通过该阈值,判断是否为异常点。具体流程如下:
(1)对验证集里的每个样本采用训练模型得到概率值;
(2)循环遍历所有的验证集计算出来的概率值,让阈值等于其中每一个概率值,做如下处理:
a、验证集的所有概率值与阈值进行比较,如果大于阈值则判断为正常,小于阈值,则判断为异常。
b、统计以下几个值:
TP:将标签为正常的验证样本预测为正常的数量;
FN:将标签为正常的验证样本预测为异常的数量;
FP:将标签为异常的验证样本预测为正常的数量;
FN:将标签为异常的验证样本预测为异常的数量;
c、计算F1值,公式如下:
(3)经过步骤(2)的遍历,得到最高的F1值,把相应的概率定为最佳阈值。
由于无法显示具有7维的图片,本文贴出了以氢气和总烃为维度的图。图4的横坐标为氢气偏差值,而纵坐标为总烃偏差值,其中用×来表示分析出来的异常数据。图5是以时间序号和气体值为维度,其中用×来表示分析出来的异常数据。图6是采用传统阈值判断得出的异常点,其中用×来表示分析出来的异常数据。从图6可以看出采用传统阈值法对异常的判断是一种一刀切的方法,无法结合变压器的历史数据进行灵活的判断。
4、基于趋势分析
4.1、为了防止个别异常点影响整个趋势的判断,所以,在第二步骤中发现的异常数据,我们先去除,并用前后值的均值来补充。
4.2、采用移动平均算法,对趋势进行平滑
4.3、采用自底向上BU算法对其进行分段,步骤如下:
(1)对于油色谱每一种气体历史数据采集而言,基本采集间隔周期是统一的,可以看作为时间序列,而每次采集的数据,可看作一个点,有两个坐标值,x和y值。x值为采集的序号,体现了采集的时间、先后顺序。假设间隔周期是一天,则若今天采集的数据x值为t,则明天采集的数据x值为t+1。而y值为当时采集的某种气体具体数值。
(2)把时间序列中每个相邻点进行连线,接着把每个相邻的两个线段连接起来。此时每条线段包含三个原始点,计算中间那个点的拟合误差。具体公式如下:
e=|yi-y'|
其中,yi-1,yi,yi+1代表三个相邻时间点的观测数值,y'代表估算出来的中间点的值,e为拟合误差;
就这样,两两相连,把所有相连的两线段之间的拟合误差都算出来后,找出最小拟合误差并且小于阈值的线段作为第一条包含三个点的线段。
(3)将包括新生成的线段的所有线段再次相邻连接,同理按照步骤S432的方式找出最小拟合误差并且小于阈值的线段,不断循环,直到最小误差大于阈值,退出循环。
图7是本实例一变电站的氢气历史数据分段效果图。
4.4、对分段的数据信息进行趋势分析。
分段后,根据线段走势分为:1(上升,线段终点气体值大于起点气体值),0(不变,线段终点气体值等于起点气体值),-1(下降,线段终点气体值小于起点值)
分析线段走势,把同一方向的走势合并起来,如:1110101,可看作连续上升,-10-100-1-1可看作为连续下降。而对于1-11-11-11-1,可看作状态不够稳定。
对于连续上升的情况,计算上升的起点与终点的差值和上升的斜率,如果超过各自相应的阈值和斜率,则报警
对于连续下降的情况,计算上升的起点与终点的差值和上升的斜率,如果超过各自相应的阈值和斜率,则报警
统计在X天内走势变换(由1变为-1,-1变为+1)的次数,如果次数超过阈值,计算数据的方差,超过阈值,则报警。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。
Claims (5)
1.一种基于多维高斯分布与趋势分段的变压器异常检测方法,其特征在于,包括如下步骤:
步骤S1、数据的筛选与清理:对获取到的变压器在线监测数据的历史数据进行筛选和清理,处理无效数据;
步骤S2、数据预处理:设置滑动窗口,时间窗口宽度为w,将每个点与该点之前滑动窗口内所有数据的指数加权移动平均进行比较,得出偏差数据集;
获取变压器投入运行或滤油以来的油中检测气体观测历史数据D={(ti,yi),i=1,2,…N},其中ti是以t0为基准的相对时间,时间窗口宽度为w,那么观测值yi之前滑动窗口内的数据点表示为:
Sw(yi)={yi-w,yi-w+1,...,yi-1},i=w,w+1....N
对于时间窗Sw(yi)的指数加权移动平均值vi的计算公式如下:
νi=βyi-1+(1-β)×νi-1 (1)
把vi-w-1初始化为0后,展开该公式变为:
vi=(1-β)(yi-1+βyi-2+...βw-1yi-w) (2)
其中,β代表加权下降的速率,其值越小下降速度越快;在数学运算中,取作为临界值,小于该值的加权系数的值不做考虑,所以时间窗口宽度w的取值为:vi-w-1初始化为0会导致初期的数值过小,对公式(1)进行修正:
把当前观测值减去yi减去νi,得出要分析的偏差值,公式如下:
Δyi=yi-νi (4)
根据公式(4)获取到第w个时间窗口宽度之后所有数据的偏差值数据集D'={(tw,Δyw),(tw+1,Δyw+1),(tw+2,Δyw+2)),…(tN,ΔyN)},该偏差值数据集服从高斯分布;
步骤S3、基于多维高斯分布的异常检测:
正常运行状态下的变压器,因绝缘油和固体绝缘的老化裂解等会分解出极少量气体,这些气体会相互转换,因此各气体的浓度值之间的关系并不独立,而经步骤S2处理后,各气体的加权移动偏差值数据集D'均服从高斯分布,对此采用多维高斯分布来检测变压器在线监测数据异常;具体实现如下:
其中,μ∈Rm,∑∈Rm×m,∑为协方差矩阵;
通过以上公式计算出多维高斯模型的参数;对于新观测到的一气体样本值y*,减去它所在时间窗内移动指数加权平均后得到Δy*,这样m种同时观测到的气体偏差值组合生成检测数据x*,使用以上训练得到的多维高斯分布模型计算概率值,具体公式如下:
将计算出来的概率与阈值ε进行比较,若该概率值小于ε,则认为这个新观测到的样本值异常。
2.根据权利要求1所述的基于多维高斯分布与趋势分段的变压器异常检测方法,其特征在于,还包括一步骤S4,具体实现如下:
步骤S41、对步骤S3中观测到的异常样本值,进行去除,并采用其前后值的均值补充;
步骤S42、采用移动平均算法,进行趋势平滑;
步骤S43、采用自底向上BU算法对趋势进行分段,具体如下:
步骤S431、将采集的每一种气体历史数据看作为时间序列,每次采集的数据,均有x和y两个坐标值;
步骤S432、把时间序列中每个相邻点进行连线,接着把每个相邻的两个线段连接起来;此时每条线段均包含三个原始点,计算每条线段中间点的拟合误差;具体公式如下:
e=|yi-y'|
其中,yi-1,yi,yi+1代表三个相邻时间点的观测数值,y'代表估算出来的中间点的值,e为拟合误差;
计算所有相连的两线段之间的拟合误差,找出最小拟合误差并且小于阈值的线段作为第一条包含三个点的线段;
步骤S433、将包括新生成的线段的所有线段再次相邻连接,同理按照步骤S432的方式找出最小拟合误差并且小于阈值的线段,不断循环,直到最小误差大于阈值,退出循环;
步骤S44、对分段的数据信息进行趋势分析:
步骤S441、经步骤S43进行趋势分段后,根据线段走势分为:1,0,-1,其中,1、0、-1分别代表上升、不变、下降;
步骤S442、分析线段走势:
将同方向的走势合并起来,线段走势为0的可看作线段走势为1或线段走势为-1的同方向;
对于连续上升的情况,计算上升的起点与终点的差值、上升的斜率,若超过各自相应的阈值和斜率,则报警;
对于连续下降的情况,计算上升的起点与终点的差值、下降的斜率,若超过各自相应的阈值和斜率,则报警;
统计在X天内走势变换的次数,即由1变为-1或-1变为+1的次数,若次数超过阈值,计算数据的方差,若超过阈值,则报警。
3.根据权利要求1所述的基于多维高斯分布与趋势分段的变压器异常检测方法,其特征在于,所述步骤S2中的气体包括氢气、甲烷、二氧化碳、乙烯、乙炔、乙烷、总烃。
4.根据权利要求1所述的基于多维高斯分布与趋势分段的变压器异常检测方法,其特征在于,所述步骤S3中,m取7。
5.根据权利要求1所述的基于多维高斯分布与趋势分段的变压器异常检测方法,其特征在于,所述步骤S3中,阈值ε是通过验证集来确定的,该验证集是有着真实标签的历史数据中的气体观测值;阈值ε的获取方式具体如下:
步骤S31、对验证集里的每个样本采用训练模型得到概率值;
步骤S32、循环遍历所有的验证集计算出来的概率值,让阈值等于其中每一个概率值,做如下处理:
a、验证集的所有概率值与阈值进行比较,如果大于阈值则判断为正常,小于阈值,则判断为异常;
b、统计以下几个值:
TP:将标签为正常的验证样本预测为正常的数量;
FN:将标签为正常的验证样本预测为异常的数量;
FP:将标签为异常的验证样本预测为正常的数量;
FN:将标签为异常的验证样本预测为异常的数量;
c、计算F1值,公式如下:
步骤S33、经过步骤S32的遍历,得到最高的F1值,把相应的概率定为最佳阈值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811514382.4A CN109614576B (zh) | 2018-12-11 | 2018-12-11 | 基于多维高斯分布与趋势分段的变压器异常检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811514382.4A CN109614576B (zh) | 2018-12-11 | 2018-12-11 | 基于多维高斯分布与趋势分段的变压器异常检测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109614576A CN109614576A (zh) | 2019-04-12 |
CN109614576B true CN109614576B (zh) | 2022-08-30 |
Family
ID=66007868
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811514382.4A Expired - Fee Related CN109614576B (zh) | 2018-12-11 | 2018-12-11 | 基于多维高斯分布与趋势分段的变压器异常检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109614576B (zh) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110472671B (zh) * | 2019-07-24 | 2023-05-12 | 西安工程大学 | 基于多阶段的油浸式变压器故障数据预处理方法 |
CN110634081A (zh) * | 2019-08-02 | 2019-12-31 | 国网四川省电力公司映秀湾水力发电总厂 | 一种水电站异常数据的处理方法及装置 |
CN110765575A (zh) * | 2019-09-19 | 2020-02-07 | 广州供电局有限公司 | 电力系统的应急仿真装置、计算机设备及存储介质 |
CN110929751B (zh) * | 2019-10-16 | 2022-11-22 | 福建和盛高科技产业有限公司 | 一种基于多源数据融合的电流互感器不平衡度告警方法 |
CN110830450A (zh) * | 2019-10-18 | 2020-02-21 | 平安科技(深圳)有限公司 | 基于统计的异常流量监测方法、装置、设备及存储介质 |
CN110672748A (zh) * | 2019-10-24 | 2020-01-10 | 福建工程学院 | 一种油色谱谱峰识别的方法和系统 |
CN110907544B (zh) * | 2019-11-05 | 2022-06-24 | 国网江苏省电力有限公司南通供电分公司 | 一种变压器油中溶解气体含量异常阶跃数据识别方法 |
CN111080651B (zh) * | 2019-12-12 | 2022-07-12 | 西南科技大学 | 基于水流分割的石油钻井污染气体自动监测方法 |
CN111061620B (zh) * | 2019-12-27 | 2022-07-01 | 南京林科斯拉信息技术有限公司 | 一种混合策略的服务器异常智能检测方法及检测系统 |
CN111444471B (zh) * | 2020-02-25 | 2023-01-31 | 国网河南省电力公司电力科学研究院 | 一种基于多元高斯分布的电缆生产质量异常检测方法和系统 |
CN111858712A (zh) * | 2020-07-20 | 2020-10-30 | 上海仪电(集团)有限公司中央研究院 | 原位水质巡检数据时空分析与异常检测方法和系统 |
CN111879349A (zh) * | 2020-08-03 | 2020-11-03 | 泉州装备制造研究所 | 一种传感器数据偏差自适应修正方法 |
CN112633561A (zh) * | 2020-12-09 | 2021-04-09 | 北京名道恒通信息技术有限公司 | 一种基于工业大数据的生产风险智能预测预警方法 |
CN113048807B (zh) * | 2021-03-15 | 2022-07-26 | 太原理工大学 | 一种空冷机组背压异常检测方法 |
CN113504423A (zh) * | 2021-07-13 | 2021-10-15 | 许昌许继软件技术有限公司 | 一种一次设备在线监测数据趋势预测方法及装置 |
CN113761799B (zh) * | 2021-08-31 | 2024-03-26 | 东风商用车有限公司 | 车辆性能曲线趋势拟合方法、装置、设备及存储介质 |
CN113959964B (zh) * | 2021-10-11 | 2022-05-31 | 天津同阳科技发展有限公司 | 基于机动车尾气遥感检测二氧化碳吸收增量的计算方法 |
CN114070747B (zh) * | 2021-11-15 | 2023-04-18 | 四川启睿克科技有限公司 | 基于vi算法的高斯混合模型的物联网设备状态检测方法 |
CN114545294B (zh) * | 2022-01-14 | 2023-06-16 | 国电南瑞科技股份有限公司 | 一种变压器故障诊断方法、系统、存储介质及计算设备 |
CN114693110B (zh) * | 2022-03-29 | 2023-07-04 | 杭州安脉盛智能技术有限公司 | 一种储能系统的异常监测方法、系统及存储介质 |
CN114491383B (zh) * | 2022-04-15 | 2022-09-16 | 江西飞尚科技有限公司 | 桥梁监测的异常数据处理方法及系统 |
CN116631527A (zh) * | 2023-06-20 | 2023-08-22 | 齐丰科技股份有限公司 | 关于变压器油色谱气体组份增量及趋势预测方法 |
CN116520236B (zh) * | 2023-06-30 | 2023-09-22 | 清华大学 | 一种智能电表的异常检测方法和系统 |
CN116519858B (zh) * | 2023-07-03 | 2023-09-05 | 福州德寰流体技术有限公司 | 一种带实时监测的变压器油护理装置 |
CN116704735B (zh) * | 2023-08-08 | 2023-11-03 | 湖南江河能源科技股份有限公司 | 一种水电站智能报警方法、系统、终端及存储介质 |
CN116780658B (zh) * | 2023-08-17 | 2023-11-10 | 国网浙江省电力有限公司金华供电公司 | 考虑源-荷双侧不确定性的多能互补优化调度方法 |
CN117147807B (zh) * | 2023-11-01 | 2024-01-26 | 中海(天津)能源科技有限公司 | 一种用于石油勘探的油质监测系统及方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103006210A (zh) * | 2013-01-11 | 2013-04-03 | 山东师范大学 | 基于分段线性化的窦性心率震荡趋势检测方法 |
WO2015176565A1 (zh) * | 2014-05-22 | 2015-11-26 | 袁志贤 | 一种基于多维时间序列的电气设备故障预测方法 |
CN106446765A (zh) * | 2016-07-26 | 2017-02-22 | 重庆大学 | 一种基于多维生理大数据深度学习的健康状态评价系统 |
CN108763346A (zh) * | 2018-05-15 | 2018-11-06 | 中南大学 | 一种滑窗箱型图中值滤波的异常点处理方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2909775A1 (fr) * | 2006-12-11 | 2008-06-13 | Inst Francais Du Petrole | Methode de construction d'un modele geologique d'une formation du sous-sol contraint par des donnees sismiques |
-
2018
- 2018-12-11 CN CN201811514382.4A patent/CN109614576B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103006210A (zh) * | 2013-01-11 | 2013-04-03 | 山东师范大学 | 基于分段线性化的窦性心率震荡趋势检测方法 |
WO2015176565A1 (zh) * | 2014-05-22 | 2015-11-26 | 袁志贤 | 一种基于多维时间序列的电气设备故障预测方法 |
CN106446765A (zh) * | 2016-07-26 | 2017-02-22 | 重庆大学 | 一种基于多维生理大数据深度学习的健康状态评价系统 |
CN108763346A (zh) * | 2018-05-15 | 2018-11-06 | 中南大学 | 一种滑窗箱型图中值滤波的异常点处理方法 |
Non-Patent Citations (1)
Title |
---|
何尧 等;基于滑动窗口和多元高斯分布的变压器油色谱异常值检测;《高压电器》;20200131;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN109614576A (zh) | 2019-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109614576B (zh) | 基于多维高斯分布与趋势分段的变压器异常检测方法 | |
CN108805202B (zh) | 一种用于电解槽故障预警的机器学习方法及其应用 | |
US20140365179A1 (en) | Method and Apparatus for Detecting and Identifying Faults in a Process | |
CN112232447A (zh) | 一种电力设备状态监测数据的完整样本集的构建方法 | |
CA2931624A1 (en) | Systems and methods for event detection and diagnosis | |
Yan et al. | Fisher’s discriminant ratio based health indicator for locating informative frequency bands for machine performance degradation assessment | |
CN105259895A (zh) | 一种工业过程微小故障的检测和分离方法及其监测系统 | |
CN110704987B (zh) | 基于失效数据挖掘的相似工况的轴承异常状态评估方法 | |
CN112414694A (zh) | 基于多元状态估计技术的设备多级异常状态识别方法及装置 | |
US20220027230A1 (en) | Predicting Equipment Fail Mode from Process Trace | |
CN112949735A (zh) | 一种基于离群数据挖掘的液态危化品挥发浓度异常发现方法 | |
CN116304957A (zh) | 一种供变电设备监测状态突变在线识别方法 | |
CN113269327A (zh) | 一种基于机器学习的流量异常预测方法 | |
CN110308713A (zh) | 一种基于k近邻重构的工业过程故障变量识别方法 | |
CN114509620A (zh) | 一种基于监测数据的变压器故障诊断方法 | |
CN112733446A (zh) | 一种数据驱动的自适应异常检测方法 | |
CN114112390B (zh) | 一种非线性复杂系统早期故障诊断方法 | |
Navajas-Guerrero et al. | A hyper-heuristic inspired approach for automatic failure prediction in the context of industry 4.0 | |
CN111507374A (zh) | 一种基于随机矩阵理论的电网海量数据异常检测方法 | |
Yang et al. | A local Mahalanobis distance analysis based methodology for incipient fault diagnosis | |
CN113483931B (zh) | 弓网接触力区段异常识别方法及装置 | |
CN112104340B (zh) | 一种基于HMM模型和Kalman滤波技术的开关量输入模块BIT降虚警方法 | |
Wani et al. | Data Drift Monitoring for Log Anomaly Detection Pipelines | |
CN113408383A (zh) | 基于有界β(g,h)分布和MWKPCA的可听噪声无效数据判定方法 | |
CN113205146A (zh) | 一种基于片段统计特征比较的时序数据异常波动检测算法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220830 |