CN117591964B - 基于人工智能的电力智能分析方法 - Google Patents

基于人工智能的电力智能分析方法 Download PDF

Info

Publication number
CN117591964B
CN117591964B CN202410045414.XA CN202410045414A CN117591964B CN 117591964 B CN117591964 B CN 117591964B CN 202410045414 A CN202410045414 A CN 202410045414A CN 117591964 B CN117591964 B CN 117591964B
Authority
CN
China
Prior art keywords
data
dimension
power
time
different dimensions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410045414.XA
Other languages
English (en)
Other versions
CN117591964A (zh
Inventor
张冠昌
门国维
张志飞
姚宇青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanxi Siji Technology Co ltd
Original Assignee
Shanxi Siji Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanxi Siji Technology Co ltd filed Critical Shanxi Siji Technology Co ltd
Priority to CN202410045414.XA priority Critical patent/CN117591964B/zh
Publication of CN117591964A publication Critical patent/CN117591964A/zh
Application granted granted Critical
Publication of CN117591964B publication Critical patent/CN117591964B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06312Adjustment or analysis of established resource schedule, e.g. resource or task levelling, or dynamic rescheduling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明涉及电测试分析技术领域,具体涉及基于人工智能的电力智能分析方法。该方法首先获取不同时间段的不同维度的电力数据;分别对不同维度的电力数据进行筛选,得到不同维度的电力筛选数据;分析获取得到每个过渡时间段下不同维度的时间关联性,从电力筛选数据中筛选出时间关联数据;分析不同维度的时间关联数据之间的关联情况得到维度关联性,从时间关联数据中筛选出可容忍数据;结合时间关联性和维度关联性,得到可容忍度;对于可容忍数据,根据可容忍度的大小,确定异常监测时树的数量;基于树的数量,利用孤立森林检测算法对电力数据进行检测。本发明消除在电力智能分析过程中的伪异常检测结果,提高电力数据智能分析的准确性。

Description

基于人工智能的电力智能分析方法
技术领域
本发明涉及电测试分析技术领域,具体涉及基于人工智能的电力智能分析方法。
背景技术
基于人工智能的电力智能分析方法利用数据分析技术,对电力系统中的数据进行智能化处理和分析,以提高电力系统的效率、可靠性和可持续性。其中,电力数据的异常影响着电力设备的可靠性、安全性及经济成本等诸多因素。为了起到及时检测电力数据异常的目的,使用孤立森林算法获取异常数据,并计算相关异常得分,根据得分判断数据的异常程度,进而根据异常程度进行一系列防范措施。
目前常见的对电力系统中的数据进行分析的方法为,使用孤立森林检测不同时间段电力数据的异常值,进而判断异常程度。在这个过程中,会因为不同时间段的电力消耗自身就会存在差异性,进而导致在不同时间段使用同种数量的树检测时,得到的异常值会产生伪异常,即此时间段的异常是正常情况下电力数据的波动范围,但经过同种数量的树进行检测后,结果显示为异常,造成误判。
发明内容
为了解决使用传统孤立森林检测方法判断电力数据的异常值时,由于存在伪异常,会存在误判的技术问题,本发明的目的在于提供基于人工智能的电力智能分析方法,所采用的技术方案具体如下:
获取不同时间段的不同维度的电力数据;
根据不同维度的电力数据之间的波动相关程度,分别对不同维度的电力数据进行筛选,得到不同维度的电力筛选数据;
分别对不同维度的电力筛选数据进行采样,得到每个过渡时间段下不同维度的多个采样点;分析每个过渡时间段下不同维度的多个采样点之间的变化规律,得到每个过渡时间段下不同维度的时间关联性;基于时间关联性,从电力筛选数据中筛选出时间关联数据;
分析不同维度的时间关联数据之间的关联情况,得到维度关联性;基于维度关联性,从时间关联数据中筛选出可容忍数据;
结合时间关联性和维度关联性,得到可容忍度;对于可容忍数据,根据可容忍度的大小,确定异常监测时树的数量;基于树的数量,利用孤立森林检测算法对电力数据进行检测。
优选的,所述根据不同维度的电力数据之间的波动相关程度,分别对不同维度的电力数据进行筛选,得到不同维度的电力筛选数据,包括:
构建,n是维度特征条件的数量,m是维度总次序;/>为满足维度特征条件的数据点数量;其中,/>为第一个维度下满足第一个维度特征条件的数据点数量;/>为第m个维度下满足第n个维度特征条件的数据点数量;
计算不同维度次序下的满足维度特征条件的数据点数量的皮尔逊相关系数;
不断更新各个维度的电力数据,同步的更新皮尔逊相关系数,将皮尔逊相关系数满足判断阈值条件时对应的电力数据作为电力筛选数据,得到不同维度的电力筛选数据。
优选的,所述维度特征条件为:拟合每个维度的电力数据,得到每个维度对应的电力拟合曲线,第一维度特征条件为电力拟合曲线上电力数据对应的一阶导数为0,二阶倒数大于0;第二维度特征条件为电力拟合曲线上电力数据对应的一阶导数属于第一预设范围内;第二维度特征条件为电力拟合曲线上电力数据对应的一阶导数属于第二预设范围内;第三维度特征条件为电力拟合曲线上电力数据对应的一阶导数属于第三预设范围内,以此类推,得到多个维度特征条件;其中,每个预设范围的范围大小相同,且最后一个范围的右侧端点为电力拟合曲线上电力数据的最大切线斜率。
优选的,所述皮尔逊相关系数的计算公式为:
其中,/>为皮尔逊相关系数;n是维度特征条件的数量,m是维度总次序;/>为第m个维度下满足第k个维度特征条件的数据点数量;/>为第k个维度下满足第n个维度特征条件的数据点数量;/>为第m个维度下满足不同维度特征条件的数据点数量的均值;/>为不同维度下满足第n个维度特征条件的数据点数量的均值。
优选的,所述分析每个过渡时间段下不同维度的多个采样点之间的变化规律,得到每个过渡时间段下不同维度的时间关联性,包括:
每个过渡时间段下不同维度的时间关联性的计算公式为:
其中,为过渡时间段下不同维度的时间关联性;ln为自然对数;N是过渡时间段下不同维度的电力筛选数据对应的采样点的总数量;/>为第i+1个采样点对应的电力筛选数据;/>为第i个采样点对应的电力筛选数据;/>为第1个采样点对应的电力筛选数据;/>为最后一个采样点对应的电力筛选数据;T为过渡时间段中采样点电力筛选数据的总时长;exp为以自然常数为底数的指数函数;Var为所有相邻采样点对应的电力筛选数据的差值的方差。
优选的,所述基于时间关联性,从电力筛选数据中筛选出时间关联数据,包括:
当归一化后的时间关联性大于预设第一阈值时,将对应的过渡时间段内的电力筛选数据作为时间关联数据;其中,预设第一阈值小于1。
优选的,所述分析不同维度的时间关联数据之间的关联情况,得到维度关联性,包括:
任意两个维度之间的时间关联数据对应的维度关联性的计算公式为:
其中,为维度关联性;I为不同维度的时间关联数据对应的采样点的总数量;为维度u对应的第i+1个采样点对应的时间关联数据;/>维度u对应的第i个采样点对应的时间关联数据;/>为维度v对应的第i+1个采样点对应的时间关联数据;/>为维度v对应的第i个采样点对应的时间关联数据;ln为自然对数。
优选的,所述结合时间关联性和维度关联性,得到可容忍度,包括:
将不同维度下任意两个维度对应的维度关联性的归一化值的均值,作为分母,将可容忍数据的时间关联性的归一化值作为分子,将比值作为可容忍数据的可容忍度。
优选的,所述对于可容忍数据,根据可容忍度的大小,确定异常监测时树的数量,包括:
当归一化后的可容忍度的大小位于第一预设容忍范围内时,设定树的数量为200;当归一化后的可容忍度的大小位于第二预设容忍范围内时,设定树的数量为300;当归一化后的可容忍度的大小位于第三预设容忍范围内时,设定树的数量为400,依次类推,得到不同可容忍度下对应的树的数量;其中,预设容忍范围的并集为[0,1]。
优选的,所述基于维度关联性,从时间关联数据中筛选出可容忍数据,包括:
当归一化后的维度关联性小于预设第二阈值时,将对应的过渡时间段内的时间关联数据作为可容忍数据;其中,预设第二阈值小于1。
本发明实施例至少具有如下有益效果:
本发明涉及电测试分析技术领域,由于使用孤立森林算法对异常电力数据进行检测分析,在这个过程中,不同时间段电力数据自身就会存在一定正常的波动,但使用同一数量的树进行异常检测时,会产伪异常检测结果。故该方法首先根据不同维度的电力数据之间的波动相关程度,分别对不同维度的电力数据进行筛选,得到不同维度的电力筛选数据,对电力数据进行筛选是为了降低后续分析时的计算量;分析每个过渡时间段下不同维度的多个采样点之间的变化规律,得到每个过渡时间段下不同维度的时间关联性,其为了消除伪异常检检测结果的不良影响,结合不同时间段内电力数据的变化情况,进而得到时间关联性,时间关联性就是指在不同时间段数据量的变化情况,将这种变化情况量化为时间关联性,那么就可以消除在时间上的误差;基于时间关联性,从电力筛选数据中筛选出时间关联数据;分析不同维度的时间关联数据之间的关联情况,得到维度关联性,为了更为客观地得到数据之间的关联,需要结合数据特征,确定不同维度之间的关联性,进而可以消除只从时间上分析产生的主观影响;基于维度关联性,从时间关联数据中筛选出可容忍数据;结合时间关联性和维度关联性,得到可容忍度;对于可容忍数据,根据可容忍度的大小,确定异常监测时树的数量,对于可容忍度较大部分,它对应的树的数量也会越多,因为容忍度越大,数据值看起来越异常,但其实际上是正常数据;最后基于树的数量,利用孤立森林检测算法对电力数据进行检测。本发明通过分析不同时间段同一维度数据的关联性以及同一时间段内不同维度数据之间的关联性,得到可容忍度,依据可容忍度进行树的数量自适应,最终得到无伪异常影响的数据。本发明消除在电力智能分析过程中的伪异常检测结果,提高电力数据智能分析的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的基于人工智能的电力智能分析方法的方法流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的基于人工智能的电力智能分析方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
本发明实施例提供了基于人工智能的电力智能分析方法的具体实施方法,该方法适用于电力分析场景。为了解决使用传统孤立森林检测方法判断电力数据的异常值时,由于存在伪异常,会存在误判的技术问题。本发明通过分析不同时间段同一维度数据的关联性以及同一时间段内不同维度数据之间的关联性,得到可容忍度,依据可容忍度进行树的数量自适应,最终得到无伪异常影响的数据。本发明消除在电力智能分析过程中的伪异常检测结果,提高电力数据智能分析的准确性。
下面结合附图具体的说明本发明所提供的基于人工智能的电力智能分析方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的基于人工智能的电力智能分析方法的步骤流程图,该方法包括以下步骤:
步骤S100,获取不同时间段的不同维度的电力数据。
获取不同时间段的各个维度的电力数据,其中包括:用电量数据、电价数据、电流数据和电压数据。其中,用电量数据和电价数据的获取是为了进一步得到电荷数据的变化量,以及与之对应的电流电压数据变化量。在本发明实施例中对时间段的划分依据经验值划分,分别为:0:00-8:00,8:00-12:00,12:00-14:00,14:00-18:00,18:00-0:00。
步骤S200,根据不同维度的电力数据之间的波动相关程度,分别对不同维度的电力数据进行筛选,得到不同维度的电力筛选数据。
不同维度的电力数据之间具有高度的相关性,并且不同维度的数据变化或者说波动情况也会随着时间改变,而时间段就是步骤S100中按照经验划分的时间段。例如,在0:00-8:00的用电量要比8:00-12:00的用电量小很多,那么这个时候使用孤立森林检测异常值就可能会集中在后者,因为它们的用电量数据比较特殊并值较大。
所以为了消除上述不良影响,需要结合不同时间段内电力数据的变化情况,进而得到时间关联性,时间关联性就是指在不同时间段数据量的变化情况,将这种变化情况量化为时间关联性,那么就可以消除在时间上的误差。同样地,为了更为客观地得到数据之间的关联,需要结合数据特征,确定不同维度之间的关联性,进而可以消除只从时间上分析产生的主观影响。所以,最终得到的可容忍度就是根据不同维度数据在不同时间段的变化情况得到的,那么对于可容忍度较大部分,它对应的树的数量也会越多,因为容忍度越大,数据值看起来越异常,但其实际上是正常数据。
因此本发明对各个维度数据和不同时间段的电力数据进行分析,得到可容忍度,进而得到树的数量的过程为:(1)对不同维度的电力数据进行筛选,得到不同维度的电力筛选数据。(2)根据电力筛选数据在不同时间段的时间关联性和同一时间段内的维度关联性,得到单一时间段数据的可容忍度。(3)获取各个时间段内数据的可容忍度,确定树的数量。
使用孤立森林算法对不同维度电力数据进行分析处理时,如果维度对应的数据较多,不利于异常数据的得出,并且多维度数据在计算维度关联性时会导致较大的计算量。所以需要对电力数据进行特征筛选,进而留下部分重要维度的数据,对其进行后续分析。为了保证特征筛选的准确性,依据不同数据之间的相关性进行降维。维度之间的相关性越高,越有必要进行筛选处理。
故首先,根据不同维度的电力数据之间的波动相关程度,分别对不同维度的电力数据进行筛选,得到不同维度的电力筛选数据。
具体的:获取不同维度的电力数据,对其进行相关性的计算,首先构建,n是维度特征条件的数量,m是维度总次序;/>为满足维度特征条件的数据点数量;其中,/>为第一个维度下满足第一个维度特征条件的数据点数量;/>为第m个维度下满足第n个维度特征条件的数据点数量。
其中,维度特征条件为:拟合每个维度的电力数据,得到每个维度对应的电力拟合曲线,第一维度特征条件为电力拟合曲线上电力数据对应的一阶导数为0,二阶倒数大于0;第二维度特征条件为电力拟合曲线上电力数据对应的一阶导数属于第一预设范围内;第二维度特征条件为电力拟合曲线上电力数据对应的一阶导数属于第二预设范围内;第三维度特征条件为电力拟合曲线上电力数据对应的一阶导数属于第三预设范围内,以此类推,得到多个维度特征条件;其中,每个预设范围的范围大小相同,且最后一个范围的右侧端点为电力拟合曲线上电力数据的最大切线斜率。在本发明实施例中第一预设范围为[0,0.5],第二预设范围为(0.5,1],第三预设范围为(1,1.5],……,直至预设范围的右侧端点为电力拟合曲线上电力数据的最大切线斜率时结束。
然后,在确定完数据点数量后,需要计算不同维度次序下的满足维度特征条件的数据点数量的皮尔逊相关系数。
其中,/>为皮尔逊相关系数;n是维度特征条件的数量,m是维度总次序;/>为第m个维度下满足第k个维度特征条件的数据点数量;/>为第k个维度下满足第n个维度特征条件的数据点数量;/>为第m个维度下满足不同维度特征条件的数据点数量的均值;/>为不同维度下满足第n个维度特征条件的数据点数量的均值。
在得到皮尔逊相关系数后,不断更新各个维度的电力数据,同步的更新皮尔逊相关系数,将皮尔逊相关系数满足判断阈值条件时对应的电力数据作为电力筛选数据,得到不同维度的电力筛选数据。在本发明实施例中判断阈值条件为,在其他实施例中可由实施者根据实际情况调整该取值。
步骤S300,分别对不同维度的电力筛选数据进行采样,得到每个过渡时间段下不同维度的多个采样点;分析每个过渡时间段下不同维度的多个采样点之间的变化规律,得到每个过渡时间段下不同维度的时间关联性;基于时间关联性,从电力筛选数据中筛选出时间关联数据。
为了确定筛选后电力筛选数据之间的关联性,进而可以依据关联性确定树的数量,消除孤立森林的伪异常检测效果,需要确定同一维度下不同时间段内电力筛选数据之间的关联性。在此场景下,对于筛选后的数据,例如用电量在不同时间段的变化曲线,那么就需要计算曲线之间的关联性,进而可以得到时间关联性。而居民用电量的波动可以部分反映电荷数据的波动,因为居民用电量的变化常受到电网整体电荷变化的影响。当电网负荷增加或减少时,居民的用电需求也会相应发生变化。因此,电荷数据的波动往往会在一定程度上表现为居民用电量的波动。所以通过分析用电量可以反应出电荷数据的变化情况。为了得到时间关联性,通常分析数据斜率等因素的变化。
进而获取筛选后的电力筛选数据之后,以用电量数据为例分析,在保证通用性的基础上,其它数据也可以使用相同方法计算得到时间关联性。
计算时间关联性的数据准备过程为,首先分别对不同维度的电力筛选数据进行采样,得到每个过渡时间段下不同维度的多个采样点。具体的:采样方法使用奈奎斯特采样定理,因为需要满足较小周期的变化规律。在本发明实施例中过渡时间设定为每个时间段的交界时间的前一个小时和后一个小时,例如时间段为0:00-8:00,8:00-12:00,那么7:00-9:00作为过渡时间段,该过渡时间段指在在步骤一中划分时间段重叠的部分,其非重叠部分无参考意义,因为它们的数据变化较为平缓,使用孤立森林直接检测异常数据即可。对过渡时间段对应的电力拟合曲线进行采样,得到多个采样点,分析采样点之间的变化规律,得到时间关联性。
每个过渡时间段下不同维度的时间关联性的计算公式为:
其中,为过渡时间段下不同维度的时间关联性;ln为自然对数;N是过渡时间段下不同维度的电力筛选数据对应的采样点的总数量;/>为第i+1个采样点对应的电力筛选数据;/>为第i个采样点对应的电力筛选数据;/>为第1个采样点对应的电力筛选数据;/>为最后一个采样点对应的电力筛选数据;T为过渡时间段中采样点电力筛选数据的总时长;exp为以自然常数为底数的指数函数;Var为所有相邻采样点对应的电力筛选数据的差值的方差。
使用Var方差作为回归调参,用来衡量数据在增流程中的平均程度。使用方差计算局部区域的平均程度,就是确定出用电量在8点之后突然增加的部分,当某一部分的方差突然增加,那么就证明这段开始符合正常的用电量变化范围,所以时间关联性的分母中对方差进行计算,目的是量化这一特征。当该公式的值越大,表示这个数据集在时间范围内升高的越平缓,最后的值变化大,以及在增流程中平均程度越小,也就是时间关联性越大。
不同数据点的数据值存在着一定的联系,比如在一定时间范围内,数据点构成的斜率是缓慢增加的,并且数据的整体分布为,前半段时间内数据值较低,但后半段时间内数据值就变大了,但中间有个缓慢增加的过程,那么这个公式就需要去表征这种变化关系,若满足这种变化关系,则认为这些数据存在时间关联性。所以说在一段固定时间内,斜率增加的越平均,时间关联性越大,并且越符合前半段数据值小,后半段数据值大,时间关联性越大。符合上述数据在时间关联性上的特征。将进行归一化处理,值越接近,那么时间关联性就越高。
基于时间关联性,从电力筛选数据中筛选出时间关联数据,具体的:当归一化后的时间关联性大于预设第一阈值时,将对应的过渡时间段内的电力筛选数据作为时间关联数据;其中,预设第一阈值小于1。在本发明实施例中预设第一阈值的取值为0.8,在其他实施例中由实施者根据实际情况调整该取值。
步骤S400,分析不同维度的时间关联数据之间的关联情况,得到维度关联性;基于维度关联性,从时间关联数据中筛选出时间关联数据。
相较于时间关联性,维度关联性也是在同样的时间内进行分析,并且采样方式相同,但由于不同维度数据的最小正周期不一样,所以使用奈奎斯特采样定理得到的采样步长会不一样,那么整体的数据点的数量也会不一样。现通过分析不同维度采样点数据之间联系,确定出维度关联性。这里只选取符合时间关联性的数据进行维度关联性的分析。例如:a维度和b维度在特定时间内存在时间关联性,当它们也符合维度关联性时,就证明此点的可容忍度高。
任意两个维度之间的时间关联数据对应的维度关联性的计算公式为:
其中,为维度关联性;I为不同维度的时间关联数据对应的采样点的总数量;为维度u对应的第i+1个采样点对应的时间关联数据;/>维度u对应的第i个采样点对应的时间关联数据;/>为维度v对应的第i+1个采样点对应的时间关联数据;/>为维度v对应的第i个采样点对应的时间关联数据;ln为自然对数。
其中,反映了维度u下离散数据的差分结果;/>反映了维度v下离散数据的差分结果;将/>和/>二者相比,确定维度之间的斜率关系。两维度的数据,如果存在维度关联性,那么一定是呈现着正反比的关系。当维度u的数据求差分后,结果为正,维度v的数据差分后,结果为负,那么比值为负,此时,为了使得对数函数内的自变量大于0,从而能够计算出有效结果,需要将前面的符号/>幂设置为奇数,这样结果才能为正。这是两个维度数据负相关的情况下,当它们正相关时,幂设置为偶数,这样,也能得到相应结果,所以此处选择了自然对数函数。当这个值/>越小,我们可以认为两个维度数据之间的变化关系相当,不论是正相关还是负相关,只要变化量相当,那么就证明二者的维度关联性高。
基于维度关联性,从时间关联数据中筛选出可容忍数据,具体的:当归一化后的维度关联性小于预设第二阈值时,将对应的过渡时间段内的时间关联数据作为可容忍数据;其中,预设第二阈值小于1。在本发明实施例中预设第二阈值的取值为0.2。
步骤S500,结合时间关联性和维度关联性,得到可容忍度;对于可容忍数据,根据可容忍度的大小,确定异常监测时树的数量;基于树的数量,利用孤立森林检测算法对电力数据进行检测。
将不同维度下任意两个维度对应的维度关联性的归一化值的均值,作为分母,将可容忍数据的时间关联性的归一化值作为分子,将比值作为可容忍数据的可容忍度。在满足两个关联性的基础上,当可容忍度越高,则对应的树的数量接越多。
获取可容忍度,依据可容忍度确定树的数量。对归一化后的可容忍度Tol每0.1分一个段,不同段具有着不同树的数量。具体为:当归一化后的可容忍度的大小位于第一预设容忍范围内时,设定树的数量为200;当归一化后的可容忍度的大小位于第二预设容忍范围内时,设定树的数量为300;当归一化后的可容忍度的大小位于第三预设容忍范围内时,设定树的数量为400,依次类推,得到不同可容忍度下对应的树的数量;其中,预设容忍范围的并集为[0,1]。在本发明实施例中第一预设容忍范围为[0,0.1],第二预设容忍范围为(0.1,0.2],第三预设容忍范围是为(0.2,0.3]。即对于除可容忍数据之外的数据部分,使用100颗树进行异常检测;对于满足可容忍度的部分,若0≤Tol≤0.1,树的数量增加为200颗,若0.1<Tol≤0.2,树的数量增加为300颗,以此类推,当0.9<Tol≤1时,树的数量为1100颗。至此,通过分析各个时间段内数据的可容忍度,确定了树的数量。
通过对多维度数据的相关性记性分析,对数据进行了筛选,筛选有利于减小后续计算量和增加精准度;通过对筛选后的数据进行时间关联性分析和维度关联性分析,得到可容忍度,可容忍度的获取有利于确定最终树的数量。
获取不同时间段内树的数量,每个时间段内树的数量不一样,那么相应地检测结果也会因为数量的不一致而改变,增加了电力波动范围较大时间段内树的数量,减小了误差的产生,消除在电力智能分析过程中伪异常的检测结果。最后基于树的数量,利用孤立森立检测算法对电力数据进行检测。
综上所述,本发明涉及电测试分析技术领域。该方法首先获取不同时间段的不同维度的电力数据;分别对不同维度的电力数据进行筛选,得到不同维度的电力筛选数据;获取每个过渡时间段下不同维度的电力筛选数据的多个采样点;分析每个过渡时间段下不同维度的多个采样点之间的变化规律,得到每个过渡时间段下不同维度的时间关联性,从电力筛选数据中筛选出时间关联数据;分析不同维度的时间关联数据之间的关联情况,得到维度关联性,从时间关联数据中筛选出可容忍数据;结合时间关联性和维度关联性,得到可容忍度;对于可容忍数据,根据可容忍度的大小,确定异常监测时树的数量;基于树的数量,利用孤立森林检测算法对电力数据进行检测。本发明获取不同时间段树的数量,消除在电力智能分析过程中的伪异常检测结果,提高电力数据智能分析的准确性。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。

Claims (8)

1.一种基于人工智能的电力智能分析方法,其特征在于,该方法包括以下步骤:
获取不同时间段的不同维度的电力数据;
根据不同维度的电力数据之间的波动相关程度,分别对不同维度的电力数据进行筛选,得到不同维度的电力筛选数据;
分别对不同维度的电力筛选数据进行采样,得到每个过渡时间段下不同维度的多个采样点;分析每个过渡时间段下不同维度的多个采样点之间的变化规律,得到每个过渡时间段下不同维度的时间关联性;基于时间关联性,从电力筛选数据中筛选出时间关联数据;
分析不同维度的时间关联数据之间的关联情况,得到维度关联性;基于维度关联性,从时间关联数据中筛选出可容忍数据;
结合时间关联性和维度关联性,得到可容忍度;对于可容忍数据,根据可容忍度的大小,确定异常监测时树的数量;基于树的数量,利用孤立森林检测算法对电力数据进行检测;
其中,所述分析每个过渡时间段下不同维度的多个采样点之间的变化规律,得到每个过渡时间段下不同维度的时间关联性,包括:
每个过渡时间段下不同维度的时间关联性的计算公式为:
其中,为过渡时间段下不同维度的时间关联性;ln为自然对数;N是过渡时间段下不同维度的电力筛选数据对应的采样点的总数量;/>为第i+1个采样点对应的电力筛选数据;/>为第i个采样点对应的电力筛选数据;/>为第1个采样点对应的电力筛选数据;为最后一个采样点对应的电力筛选数据;T为过渡时间段中采样点电力筛选数据的总时长;exp为以自然常数为底数的指数函数;Var为所有相邻采样点对应的电力筛选数据的差值的方差;
其中,所述分析不同维度的时间关联数据之间的关联情况,得到维度关联性,包括:
任意两个维度之间的时间关联数据对应的维度关联性的计算公式为:
其中,为维度关联性;I为不同维度的时间关联数据对应的采样点的总数量;/>为维度u对应的第i+1个采样点对应的时间关联数据;/>维度u对应的第i个采样点对应的时间关联数据;/>为维度v对应的第i+1个采样点对应的时间关联数据;/>为维度v对应的第i个采样点对应的时间关联数据;ln为自然对数。
2.根据权利要求1所述的基于人工智能的电力智能分析方法,其特征在于,所述根据不同维度的电力数据之间的波动相关程度,分别对不同维度的电力数据进行筛选,得到不同维度的电力筛选数据,包括:
构建,n是维度特征条件的数量,m是维度总次序;/>为满足维度特征条件的数据点数量;其中,/>为第一个维度下满足第一个维度特征条件的数据点数量;为第m个维度下满足第n个维度特征条件的数据点数量;
计算不同维度次序下的满足维度特征条件的数据点数量的皮尔逊相关系数;
不断更新各个维度的电力数据,同步的更新皮尔逊相关系数,将皮尔逊相关系数满足判断阈值条件时对应的电力数据作为电力筛选数据,得到不同维度的电力筛选数据。
3.根据权利要求2所述的基于人工智能的电力智能分析方法,其特征在于,所述维度特征条件为:拟合每个维度的电力数据,得到每个维度对应的电力拟合曲线,第一维度特征条件为电力拟合曲线上电力数据对应的一阶导数为0,二阶倒数大于0;第二维度特征条件为电力拟合曲线上电力数据对应的一阶导数属于第一预设范围内;第二维度特征条件为电力拟合曲线上电力数据对应的一阶导数属于第二预设范围内;第三维度特征条件为电力拟合曲线上电力数据对应的一阶导数属于第三预设范围内,以此类推,得到多个维度特征条件;其中,每个预设范围的范围大小相同,且最后一个范围的右侧端点为电力拟合曲线上电力数据的最大切线斜率。
4.根据权利要求2所述的基于人工智能的电力智能分析方法,其特征在于,所述皮尔逊相关系数的计算公式为:
其中,/>为皮尔逊相关系数;n是维度特征条件的数量,m是维度总次序;/>为第m个维度下满足第k个维度特征条件的数据点数量;/>为第k个维度下满足第n个维度特征条件的数据点数量;/>为第m个维度下满足不同维度特征条件的数据点数量的均值;/>为不同维度下满足第n个维度特征条件的数据点数量的均值。
5.根据权利要求1所述的基于人工智能的电力智能分析方法,其特征在于,所述基于时间关联性,从电力筛选数据中筛选出时间关联数据,包括:
当归一化后的时间关联性大于预设第一阈值时,将对应的过渡时间段内的电力筛选数据作为时间关联数据;其中,预设第一阈值小于1。
6.根据权利要求1所述的基于人工智能的电力智能分析方法,其特征在于,所述结合时间关联性和维度关联性,得到可容忍度,包括:
将不同维度下任意两两维度对应的维度关联性的归一化值的均值,作为分母,将可容忍数据的时间关联性的归一化值作为分子,将比值作为可容忍数据的可容忍度。
7.根据权利要求1所述的基于人工智能的电力智能分析方法,其特征在于,所述对于可容忍数据,根据可容忍度的大小,确定异常监测时树的数量,包括:
当归一化后的可容忍度的大小位于第一预设容忍范围内时,设定树的数量为200;当归一化后的可容忍度的大小位于第二预设容忍范围内时,设定树的数量为300;当归一化后的可容忍度的大小位于第三预设容忍范围内时,设定树的数量为400,依次类推,得到不同可容忍度下对应的树的数量;其中,预设容忍范围的并集为[0,1]。
8.根据权利要求1所述的基于人工智能的电力智能分析方法,其特征在于,所述基于维度关联性,从时间关联数据中筛选出可容忍数据,包括:
当归一化后的维度关联性小于预设第二阈值时,将对应的过渡时间段内的时间关联数据作为可容忍数据;其中,预设第二阈值小于1。
CN202410045414.XA 2024-01-12 2024-01-12 基于人工智能的电力智能分析方法 Active CN117591964B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410045414.XA CN117591964B (zh) 2024-01-12 2024-01-12 基于人工智能的电力智能分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410045414.XA CN117591964B (zh) 2024-01-12 2024-01-12 基于人工智能的电力智能分析方法

Publications (2)

Publication Number Publication Date
CN117591964A CN117591964A (zh) 2024-02-23
CN117591964B true CN117591964B (zh) 2024-04-05

Family

ID=89913566

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410045414.XA Active CN117591964B (zh) 2024-01-12 2024-01-12 基于人工智能的电力智能分析方法

Country Status (1)

Country Link
CN (1) CN117591964B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118033300B (zh) * 2024-04-10 2024-06-14 贵州国昱源丰节能科技有限公司 一种动态电压调节器的负载失电异常智能识别方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010095314A1 (ja) * 2009-02-17 2010-08-26 株式会社日立製作所 異常検知方法及び異常検知システム
WO2012032812A1 (ja) * 2010-09-07 2012-03-15 株式会社日立製作所 異常検知方法及びそのシステム
WO2013142853A1 (en) * 2012-03-23 2013-09-26 Picometrix, Llc System and method to detect anomalies
CN107093035A (zh) * 2017-06-09 2017-08-25 深圳市中电电力技术股份有限公司 一种多维度互联的电能质量综合分析系统
CN111176953A (zh) * 2020-01-02 2020-05-19 广州虎牙科技有限公司 一种异常检测及其模型训练方法、计算机设备和存储介质
CN111858245A (zh) * 2020-07-17 2020-10-30 北京奇艺世纪科技有限公司 一种异常数据的分析方法、装置、电子设备及存储介质
CN112084237A (zh) * 2020-09-09 2020-12-15 广东电网有限责任公司中山供电局 一种基于机器学习和大数据分析的电力系统异常预测方法
WO2023093386A1 (zh) * 2021-11-29 2023-06-01 腾讯科技(深圳)有限公司 一种数据检测方法、装置、电子设备、计算机存储介质及计算机程序产品
CN117129790A (zh) * 2023-10-26 2023-11-28 山西思极科技有限公司 一种电力系统故障诊断系统
CN117235548A (zh) * 2023-11-15 2023-12-15 山东济宁运河煤矿有限责任公司 基于激光灼烧的煤质数据处理方法及智能化系统
CN117310309A (zh) * 2018-07-06 2023-12-29 施耐德电气美国股份有限公司 用于表征电气系统中电能质量事件的补充技术

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9961089B1 (en) * 2016-10-20 2018-05-01 Mitsubishi Electric Research Laboratories, Inc. Distributed estimation and detection of anomalies in control systems
US20220200878A1 (en) * 2020-12-23 2022-06-23 Geotab Inc. Anomaly detection

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010095314A1 (ja) * 2009-02-17 2010-08-26 株式会社日立製作所 異常検知方法及び異常検知システム
WO2012032812A1 (ja) * 2010-09-07 2012-03-15 株式会社日立製作所 異常検知方法及びそのシステム
WO2013142853A1 (en) * 2012-03-23 2013-09-26 Picometrix, Llc System and method to detect anomalies
CN107093035A (zh) * 2017-06-09 2017-08-25 深圳市中电电力技术股份有限公司 一种多维度互联的电能质量综合分析系统
CN117310309A (zh) * 2018-07-06 2023-12-29 施耐德电气美国股份有限公司 用于表征电气系统中电能质量事件的补充技术
CN111176953A (zh) * 2020-01-02 2020-05-19 广州虎牙科技有限公司 一种异常检测及其模型训练方法、计算机设备和存储介质
CN111858245A (zh) * 2020-07-17 2020-10-30 北京奇艺世纪科技有限公司 一种异常数据的分析方法、装置、电子设备及存储介质
CN112084237A (zh) * 2020-09-09 2020-12-15 广东电网有限责任公司中山供电局 一种基于机器学习和大数据分析的电力系统异常预测方法
WO2023093386A1 (zh) * 2021-11-29 2023-06-01 腾讯科技(深圳)有限公司 一种数据检测方法、装置、电子设备、计算机存储介质及计算机程序产品
CN117129790A (zh) * 2023-10-26 2023-11-28 山西思极科技有限公司 一种电力系统故障诊断系统
CN117235548A (zh) * 2023-11-15 2023-12-15 山东济宁运河煤矿有限责任公司 基于激光灼烧的煤质数据处理方法及智能化系统

Also Published As

Publication number Publication date
CN117591964A (zh) 2024-02-23

Similar Documents

Publication Publication Date Title
CN117591964B (zh) 基于人工智能的电力智能分析方法
US10852357B2 (en) System and method for UPS battery monitoring and data analysis
CN117407700B (zh) 一种带电作业过程中作业环境的监测方法
CN113435725B (zh) 基于farima-lstm预测的电网主机动态阈值设定方法
CN110333962B (zh) 一种基于数据分析预测的电子元器件故障诊断模型
CN117349781B (zh) 一种变压器故障智能诊断方法及系统
CN115982602B (zh) 一种光伏变压器电故障检测方法
CN117196353B (zh) 基于大数据的环境污染评估与监测方法及系统
CN117556714B (zh) 一种用于铝金属冶炼的预热管路温度数据异常分析方法
CN116400126B (zh) 一种具有数据处理系统的低压电力箱
CN109583679A (zh) 一种多算法融合的窃电疑似度分析方法
CN116992322B (zh) 一种智慧城市数据中心管理系统
CN115664038B (zh) 一种用于电气安全管理的智能配电运维监控系统
CN110175353A (zh) 电梯运行指标趋势分析方法
CN111275295A (zh) 一种基于反距离权重插值的分布式光伏故障诊断方法
CN117349778A (zh) 一种基于物联网的用电设备在线实时监测系统
CN112416661B (zh) 基于压缩感知的多指标时间序列异常检测方法和装置
CN117590268A (zh) 电池储能系统状态评估方法
CN115575880B (zh) 一种电力互感器计量误差状态在线检测方法
CN116128690B (zh) 一种碳排放量成本值计算方法、装置、设备及介质
CN117827593A (zh) 一种基于异常识别结果确定异常原因的方法和系统
CN115453447A (zh) 基于嫌疑电表分步补偿剔除的超差电表在线检测方法
CN114742103A (zh) 基于物联网的城市监测数据处理方法、装置及存储介质
CN117874687B (zh) 一种工业平板电脑的数据交互方法
CN117874544B (zh) 基于时序分析的阀门故障智能诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant