CN116522268B - 一种配电网的线损异常识别方法 - Google Patents

一种配电网的线损异常识别方法 Download PDF

Info

Publication number
CN116522268B
CN116522268B CN202310770008.5A CN202310770008A CN116522268B CN 116522268 B CN116522268 B CN 116522268B CN 202310770008 A CN202310770008 A CN 202310770008A CN 116522268 B CN116522268 B CN 116522268B
Authority
CN
China
Prior art keywords
current
data
line loss
clustering
data set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310770008.5A
Other languages
English (en)
Other versions
CN116522268A (zh
Inventor
陈蔚文
李固
江泽涛
李健
张科
招景明
赵云
陆煜锌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Power Grid Co Ltd
Measurement Center of Guangdong Power Grid Co Ltd
Original Assignee
Guangdong Power Grid Co Ltd
Measurement Center of Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Power Grid Co Ltd, Measurement Center of Guangdong Power Grid Co Ltd filed Critical Guangdong Power Grid Co Ltd
Priority to CN202310770008.5A priority Critical patent/CN116522268B/zh
Publication of CN116522268A publication Critical patent/CN116522268A/zh
Application granted granted Critical
Publication of CN116522268B publication Critical patent/CN116522268B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种配电网的线损异常识别方法,方法包括获取配电网运行量测数据,并将配电网运行量测数据进行状态估计修正处理,得到状态估计数据;其中,配电网运行量测数据包括发电出力数据和日线损率数据;将状态估计数据进行改进Mean‑shift聚类处理,获取线损数据聚类结果;其中,线损数据聚类结果包括不同发电出力数据对应的日线损率聚类中心和不同的日线损率聚类中心对应的聚类结果数据;通过孤立森林线损异常检测算法对线损数据聚类结果进行线损异常识别,得到线损数据异常识别结果。本实施例实现了有效识别配电网的线损异常,提高线损异常识别的准确性。

Description

一种配电网的线损异常识别方法
技术领域
本发明涉及配电网线损识别领域,尤其涉及一种配电网的线损异常识别方法。
背景技术
配电网线损是由于电能在输电、配电、变压等环节中的传输、转换和分配而造成的能量损耗,是电力系统中的重要问题。线损率是衡量电力系统运行效率的重要指标,它对电网运行稳定性、经济性和可靠性都有着重要的影响。因此,准确地识别配电网中的线损异常非常重要,以此帮助电力公司及时采取措施来减少线损率、提高供电质量和降低能源消耗。
传统的配电网线损异常识别方法通常使用基于统计学的方法,如方差分析和回归分析等。然而,这些方法只能适用于线损异常较为明显的情况,并且需要依赖于大量的历史数据。此外,这些传统方法通常只能提供静态的结果,无法实时地检测线损异常。
现有技术中基于K-means聚类算法的配电网线损异常诊断的方法,从电网运行数据中选择与聚类中心距离大于预设阈值的特征数据作为线损异常点,实现配电网线损异常识别,能够实现聚类效果更优的聚类方法,从而使得线损异常识别方法具有更高的精确性和可行性。此方法的主要缺点在于没有充分考虑配电网运行状态中量测坏数据的生成及带来的影响。由于配电网中计量、通信等原因导致的量测不准确,可能导致量测坏数据的产生,相较于传统分析所采用的长时间尺度的配电网评估,配电网的运行状态评估更加容易受到量测误差和坏数据的影响,很可能因为数据质量问题造成评估误差较大,进而给出错误的控制信号。此外,虽然采用了K-means聚类方法来进行多元数据统计,但其结果可能不够准确,受到初始聚类中心的影响,不同的初始值可能导致不同的聚类结果,还需要多次运行算法获得最好的结果,无法保证配电网线损异常识别的准确性和实用性。
发明内容
本发明提供了一种配电网的线损异常识别方法,实现有效识别配电网的线损异常,提高线损异常识别的准确性。
为了解决上述技术问题,本发明实施例提供了一种配电网的线损异常识别方法,包括:
获取配电网运行量测数据,并将配电网运行量测数据进行状态估计修正处理,得到状态估计数据;其中,配电网运行量测数据包括发电出力数据和日线损率数据;
将状态估计数据进行改进Mean-shift聚类处理,获取线损数据聚类结果;其中,线损数据聚类结果包括不同发电出力数据对应的日线损率聚类中心和不同的日线损率聚类中心对应的聚类结果数据;
通过孤立森林线损异常检测算法对线损数据聚类结果进行线损异常识别,得到线损数据异常识别结果。
实施本发明实施例,获取配电网运行量测数据,并将配电网运行量测数据进行状态估计修正处理,得到状态估计数据;其中,配电网运行量测数据包括发电出力数据和日线损率数据;将状态估计数据进行改进Mean-shift聚类处理,获取线损数据聚类结果;其中,线损数据聚类结果包括不同发电出力数据对应的日线损率聚类中心和不同的日线损率聚类中心对应的聚类结果数据;通过孤立森林线损异常检测算法对线损数据聚类结果进行线损异常识别,得到线损数据异常识别结果。提出了以状态估计算法处理聚类数据的方法,将还原预估真实数据,提高数据准确性,以此基础进行聚类,提高聚类效果,改进Mean-shift聚类算法,利用高斯核函数对均值偏移量进行计算,使聚类中心更加合理,聚类结果更加准确,采用改进的Mean-shift的聚类结果利用孤立森林算法进行离群点检测,通过该方法的聚类结果,提高聚类质量,可进一步保障线损异常识别结果的准确性,可实现更节能、高效的配电网运行和优化目标。
作为优选方案,将状态估计数据进行改进Mean-shift聚类处理,获取线损数据聚类结果,具体为:
根据状态估计数据和预设的聚类数量,求解各滑动窗口的最优滑动半径,并根据各滑动窗口的最优滑动半径,获取各样本数据集合;其中,各滑动窗口的数量与预设的聚类数量相同;
根据当前的样本数据集合中当前的圆心,确定当前的圆心偏移量,将当前的圆心偏移量进行高斯核函数指数计算,得到当前的均值偏移量;
判断当前的均值偏移量是否小于预期阈值,若不小于,则根据当前的圆心偏移量,更新当前的圆心,并迭代根据当前的样本数据集合中当前的圆心,确定当前的圆心偏移量,将当前的圆心偏移量进行高斯核函数指数计算,得到当前的均值偏移量,判断当前的均值偏移量是否小于预期阈值,不断更新迭代当前的圆心,直到当前的均值偏移量小于预期阈值,确定当前的样本数据集合的当前的圆心;若小于,则确定当前的样本数据集合的当前的圆心;
根据当前的样本数据集合的当前的圆心,计算当前的样本数据集合的当前的聚类中心;
将各样本数据集合的当前的聚类中心进行距离比较处理,确定各独立的聚类中心,根据各独立的聚类中心,获得线损数据聚类结果。
作为优选方案,根据状态估计数据和预设的聚类数量,求解各滑动窗口的最优滑动半径,并根据各滑动窗口的最优滑动半径,获取各样本数据集合,具体为:
在状态估计数据中选择一个数据点作为当前的圆心,并根据当前的滑动半径和当前的圆心,确定当前的滑动窗口;
根据状态估计数据、预设的聚类数量、当前的滑动窗口和当前的圆心,计算当前的误差平方和,公式为:
其中,为当前的误差平方和;/>为当前的圆心;/>为当前的滑动窗口的每一个数据点;/>为当前的滑动窗口的聚类中心;/>为预设的聚类数量;
选取当前的误差平方和最小时所对应的当前的滑动半径,作为当前的滑动窗口的最优滑动半径;
在状态估计数据中,筛选出离当前的圆心的距离在当前的滑动窗口的最优滑动半径之内的全部数据,获得当前的样本数据集合,公式为:
其中,为当前的样本数据集合,/>为当前的滑动窗口的最优滑动半径,/>为当前的样本数据集合的样本点坐标,/>为当前的圆心的坐标;
统计各滑动窗口的最优滑动半径对应的样本数据集合,得到各样本数据集合。
作为优选方案,将当前的圆心偏移量进行高斯核函数指数计算,得到当前的均值偏移量,具体为:
其中,表示当前的均值偏移量;/>为当前的样本数据集合;/>为当前的滑动窗口的最优滑动半径;/>表示在/>个样本点/>中,有/>个点落入当前的样本数据集合的区域内;/>表示当前的样本数据集合的样本点/>;/>表示当前的圆心的坐标;/>表示当前的圆心偏移量。
作为优选方案,根据当前的圆心偏移量,更新当前的圆心,具体为:
根据当前的圆心偏移量,对当前的圆心进行更新,更新方向与的当前的均值偏移量的方向一致,具体为:
其中,为当前的圆心。
作为优选方案,根据当前的样本数据集合的当前的圆心,计算当前的样本数据集合的当前的聚类中心,具体为:
根据当前的样本数据集合的当前的圆心,选取当前的圆心与当前的样本数据集合中各个样本点距离之和最小的样本点,作为当前的样本数据集合的聚类中心,具体为:
其中,为当前的样本数据集合的当前的聚类中心,/>为当前的样本数据集合的当前的圆心,/>为当前的样本数据集合,/>为当前的样本数据集合的样本点/>
作为优选方案,将配电网运行量测数据进行状态估计修正处理,得到状态估计数据,具体为:
根据配电网运行量测数据和状态变量,建立量测状态关系,公式为:
其中,为配电网运行量测数据,/>为状态变量;/>为量测函数,/>为量测误差;
根据配电网运行量测数据和量测函数,构建目标函数,具体为:
其中,为目标函数,/>为量测权重矩阵;
通过迭代修正方程,求解目标函数的状态变量,获得状态估计数据;其中,迭代修正方程,具体为:
其中,为状态变量的变化量,/>和/>分别为迭代次数,/>为第/>次迭代的状态变量,/>为第/>次迭代的状态变量的变化量、/>为第/>次迭代的状态变量的变化量,/>为量测函数对/>的偏导函数,/>为/>的转置;/>为量测函数对/>的偏导函数,/>为/>的量测函数。
作为优选方案,通过孤立森林线损异常检测算法对线损数据聚类结果进行线损异常识别,得到线损数据异常识别结果,具体为:
将不同的日线损率聚类中心对应的聚类结果数据,作为不同的聚类数据集;
通过孤立森林算法将当前的聚类数据集进行离群点检测,得到当前的聚类数据集中各数据节点的异常分数,并根据当前的聚类数据集中各数据节点的异常分数,判定当前的聚类数据集的线损异常部分;
统计各聚类数据集的线损异常部分,得到线损数据异常识别结果。
作为优选方案,通过孤立森林算法将当前的聚类数据集进行离群点检测,得到当前的聚类数据集中各数据节点的异常分数,具体为:
在当前的聚类数据集中,根据孤立树和二叉搜索树的相似性,对路径进行归一化,计算当前的聚类数据集的当前的数据节点的异常分数,公式为:
其中,为当前的聚类数据集的当前的数据节点/>的异常分数;/>为当前的聚类数据集中数据点的个数;/>为当前的聚类数据集的当前的数据点,表示当前的数据节点/>为当前的数据节点/>在多棵孤立树上的路径的期望值;/>为路径;/>为异常搜索长度;
其中,异常搜索长度根据二叉搜索树的失败查找的平均搜索长度得到,公式为:
通过计算当前的聚类数据集的当前的数据节点的异常分数,获得当前的聚类数据集中各数据节点的异常分数。
作为优选方案,根据当前的聚类数据集中各数据节点的异常分数,判定当前的聚类数据集的线损异常部分,具体为:
若当前的聚类数据集中当前的数据节点的异常分数大于预设异常分数阈值,则判定当前的数据节点为线损异常点;
统计分析当前的聚类数据集的线损异常点,得到当前的聚类数据集的线损异常部分。
附图说明
图1:为本发明提供的一种配电网的线损异常识别方法的一种实施例的流程示意图;
图2:为本发明提供的一种配电网的线损异常识别方法的一种实施例的整体计算流程图;
图3:为本发明提供的一种配电网的线损异常识别方法的一种实施例的三值对比图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
请参照图1,为本发明实施例提供的一种配电网的线损异常识别方法的流程示意图。本实施例的线损异常识别方法适用于配电网,本实施例通过改进Mean-shift聚类算法和孤立森林线损异常检测算法,提高聚类效果,实现有效识别配电网的线损异常,提高线损异常识别的准确性。该线损异常识别方法包括步骤101至步骤103,各步骤具体如下:
步骤101:获取配电网运行量测数据,并将配电网运行量测数据进行状态估计修正处理,得到状态估计数据;其中,配电网运行量测数据包括发电出力数据和日线损率数据。
在本实施例中,准确地对多个台区的发电出力数据和日线损率进行预处理,通过状态估计修正处理对配电网运行量测数据进行处理,减少量测误差和量测坏数据对评估结果的影响,使得数据更加准确。整体计算流程,如图2所示,第一阶段通过量测数据状态估计方法进行配电网发电出力数据、日线损率数据的数据修正,第二阶段采用改进Mean-shift聚类方法获取不同发电出力数据对应的日线损率聚类中心,第三阶段通过孤立森林线损异常检测算法进行线损异常识别。
作为本实施例的一种举例,以某地区电网10kV电压等级配电网的数条配电线路作为样本案例进行分析,对馈线采用开关编号的方式,配电线路首端均含有功功率的量测装置,将发电出力数据的量纲统一为kW,该装置的量测误差标准差为0.02,分别采集发电出力数据和日线损率的量测数据作为样本数据集,即配电网运行量测数据。
需要说明的是,状态估计是指对配电网的运行参数进行估计和计算的过程。其目的是通过对配电网状态的估计,采用加权最小二乘估计法则通过对测量数据进行加权,同时根据加权最小二乘法的极值条件,剔除量测误差较大的量测值,可以更加准确地估计配电网的状态参数,为后续的数据处理提供了方便和保证在进行聚类时收敛加快。
可选的,将配电网运行量测数据进行状态估计修正处理,得到状态估计数据,具体包括步骤S11至步骤S13,各步骤具体如下:
步骤S11:根据配电网运行量测数据和状态变量,建立量测状态关系,即量测量与状态变量的关系,公式为:
其中,为配电网运行量测数据,表示量测量,包括发电出力和日线损率等采集数据,/>为状态变量;/>为量测函数,/>为量测误差。
在本实施例中,首先,建立量测量与状态变量的关系,即量测状态关系,
步骤S12:根据配电网运行量测数据和量测函数,构建目标函数,具体为:
其中,为目标函数,/>为量测权重矩阵。
在本实施例中,采用应用最为广泛的加权最小二乘法求解带等式约束的状态估计问题,构造目标函数,目标函数表达式为:
式中:为量测权重矩阵,采用专家打分的方式进行赋值。
步骤S13:通过迭代修正方程,求解目标函数的状态变量,获得状态估计数据;其中,迭代修正方程,具体为:
其中,为状态变量的变化量,/>和/>分别为迭代次数,/>为第/>次迭代的状态变量,/>为第/>次迭代的状态变量的变化量、/>为第/>次迭代的状态变量的变化量,/>为量测函数对/>的偏导函数,/>为/>的转置;/>为量测函数对/>的偏导函数,/>为/>的量测函数。
在本实施例中,由于量测方程为非线性方程,为使得量测误差能在预期范围内,需要采用迭代法求解其状态变量,通过迭代修正方程,求解目标函数的状态变量,对迭代修正方程不断进行迭代,收敛得到的解即为配电网的状态估计值,以此得到状态估计数据。
实施本发明实施例,通过状态估计修正处理方法可以发现和修正不良的量测数据,滤去各种误差,使得所需结果更加趋向于配电网的合理运行状态,得到统计意义上的最佳估计值。
作为本实施例的一种举例,对样本数据集(配电网运行量测数据)开展基于加权最小二乘法的状态估计分析,通过建立量测量与状态变量的关系,迭代出修正后的状态估计值,并将状态估计值与量测值、真值进行对比,样本数据计算对比结果,三值对比图,如3图所示。通过图3可知,状态估计值与真值的曲线拟合程度较高,量测数据受计量精度、误差及实际采集情况的影响,相比于真值的偏差较大,本发明的状态估计分析方法(状态估计修正处理)能够有效修正量测数据,将量测值与真值的误差修正在±5%的范围内,因此修正后的数据完全可为第二阶段的改进Mean-shift聚类方法提供样本数据集。
步骤102:将状态估计数据进行改进Mean-shift聚类处理,获取线损数据聚类结果;其中,线损数据聚类结果包括不同发电出力数据对应的日线损率聚类中心和不同的日线损率聚类中心对应的聚类结果数据。
在本实施例中,通过改进Mean-shift聚类处理,准确地进行聚类,得到不同发电机出力对应的多个日线损率聚类中心。聚类是提取日线损率特征的重要步骤之一,需要确定多个日线损率聚类中心,以便进一步提取日线损率特征。同时,改进Mean-shift聚类的计算方法,对均值偏移向量(均值偏移量)的计算采用高斯核函数,能够使得偏移量对均值偏移向量(均值偏移量)的贡献随着样本与被偏移点距离的不同而不同,从而确保提取的特征能够反映配电系统的运行和优化情况。
可选的,步骤102具体包括步骤1021至步骤1024,各步骤具体如下:
步骤1021:根据状态估计数据和预设的聚类数量,求解各滑动窗口的最优滑动半径,并根据各滑动窗口的最优滑动半径,获取各样本数据集合;其中,各滑动窗口的数量与预设的聚类数量相同。
可选的,步骤1021具体为:在状态估计数据中选择一个数据点作为当前的圆心,并根据当前的滑动半径和当前的圆心,确定当前的滑动窗口;
根据状态估计数据、预设的聚类数量、当前的滑动窗口和当前的圆心,计算当前的误差平方和,公式为:
其中,为当前的误差平方和;/>为当前的圆心;/>为当前的滑动窗口的每一个数据点;/>为当前的滑动窗口的聚类中心;/>为预设的聚类数量;
选取当前的误差平方和最小时所对应的当前的滑动半径,作为当前的滑动窗口的最优滑动半径;
在状态估计数据中,筛选出离当前的圆心的距离在当前的滑动窗口的最优滑动半径之内的全部数据,获得当前的样本数据集合,公式为:
其中,为当前的样本数据集合,/>为当前的滑动窗口的最优滑动半径,/>为当前的样本数据集合的样本点坐标,/>为当前的圆心的坐标;
统计各滑动窗口的最优滑动半径对应的样本数据集合,得到各样本数据集合。
在本实施例中,根据预设的聚类数量确定滑动窗口的数量,一个滑动窗口对应一类聚类数据。在计算每个滑动窗口时,初步确定最优滑动半径,在状态估计数据(状态估计修正处理后的数据样本)中随机选择一个数据点作为滑动窗口的圆心和滑动半径r。利用误差平方和(SSE)作为滑动窗口半径的评价指标,其计算公式如下:
式中:为第/>类中的每一个数据点,即当前的滑动窗口的每一个数据点;/>的中心点,表示当前的滑动窗口的聚类中心;/>为滑动窗口半径为r时的聚类个数,即预设的聚类数量。
误差平方和越小,每一类的数据点越紧密,聚类效果最好且结果越精确,选取误差平方和最小的滑动半径为最优滑动半径。
筛查离圆心距离在最优滑动半径之内的全部样本数据,形成集合,具体为:
由上可知,集合为一个半径为/>的高维球形区域,/>、/>分别为集合的坐标。
步骤1022:根据当前的样本数据集合中当前的圆心,确定当前的圆心偏移量,将当前的圆心偏移量进行高斯核函数指数计算,得到当前的均值偏移量。
可选的,将当前的圆心偏移量进行高斯核函数指数计算,得到当前的均值偏移量,具体为:
其中,表示当前的均值偏移量;/>为当前的样本数据集合;/>为当前的滑动窗口的最优滑动半径;/>表示在/>个样本点/>中,有/>个点落入当前的样本数据集合的区域内;/>表示当前的样本数据集合的样本点/>;/>表示当前的圆心的坐标;/>表示当前的圆心偏移量。
需要说明的是,采用距离的指数表达式,使得该集合内的偏移量对均值偏移向量(均值偏移量)的贡献随着样本与被偏移点距离的不同而不同,均值偏移向量(均值偏移量)公式为:
式中:、/>分别为样本点i及圆心的坐标;k表示在n个样本点/>中,有k个点落入集合/>区域内,/>为圆心偏移量;
对于落入集合的采样点,无论其离圆心的远近,对最终的线损率计算权重是一样的。但在实际计算中,这一权重应该根据每个点与中心点距离的不同而不同,为了提高聚类质量,对Mean-shift聚类进行改进,使得权值与中心点距离呈现负相关性,本方法中引入高斯核函数,其表达式如下:
因此,将高斯核函数代入均值偏移向量(均值偏移量)计算公式中,可得到高斯核函数指数计算公式,公式如下:
通过高斯核函数指数计算公式,计算得到当前的均值偏移量,改变了权重,高斯核函数对于每个点与中心点的距离采用指数表达式,能够使得圆心偏移量对均值偏移向量的贡献随着样本与被偏移点距离的不同而不同。
步骤1023:判断当前的均值偏移量是否小于预期阈值,若不小于,则根据当前的圆心偏移量,更新当前的圆心,并迭代根据当前的样本数据集合中当前的圆心,确定当前的圆心偏移量,将当前的圆心偏移量进行高斯核函数指数计算,得到当前的均值偏移量,判断当前的均值偏移量是否小于预期阈值,不断更新迭代当前的圆心,直到当前的均值偏移量小于预期阈值,确定当前的样本数据集合的当前的圆心;若小于,则确定当前的样本数据集合的当前的圆心。
可选的,根据当前的圆心偏移量,对当前的圆心进行更新,更新方向与的当前的均值偏移量的方向一致,具体为:
其中,为当前的圆心。
在本实施例中,根据圆心偏移量,对圆心/>的位置进行迭代更新,方向与均值偏移向量的方向一致,圆心迭代更新计算公式为:
每一次圆心进行移动,窗口会向着样本密度更密集的区域移动,不断地靠近区域的中心位置,即聚类中心。不断地迭代更新圆心位置,直到均值偏移向量小于预期阈值。
步骤1024:根据当前的样本数据集合的当前的圆心,计算当前的样本数据集合的当前的聚类中心。
可选的,步骤1024具体为:根据当前的样本数据集合的当前的圆心,选取当前的圆心与当前的样本数据集合中各个样本点距离之和最小的样本点,作为当前的样本数据集合的聚类中心,具体为:
其中,为当前的样本数据集合的当前的聚类中心,/>为当前的样本数据集合的当前的圆心,/>为当前的样本数据集合,/>为当前的样本数据集合的样本点/>
在本实施例中,基于均值偏移量可进一步得出分布在样本密集区域的聚类中心,在全部的聚类中心中,进一步选取与类内各个点距离之和的最小点作为各类的聚类中心,最终选取聚类中心。
步骤1025:将各样本数据集合的当前的聚类中心进行距离比较处理,确定各独立的聚类中心,根据各独立的聚类中心,获得线损数据聚类结果。
在本实施例中,判断当前的聚类中心与其它已经存在的聚类中心的距离是否小于阈值,若小于阈值则合并两个聚类中心,反之,提取各自的聚类中心作为独立的聚类中心。这样提取的聚类中心均为实际物理存在的运行点,保证聚类结果的准确性,得到不同线损率对应的聚类中心结果数据。
作为本实施例的一种举例,将第一阶段的数据形成状态估计数据集,通过改进Mean-shift的聚类计算,以日线损率为基准提取各类聚类中心,对应不同的发电机出力分别按照线损率的大小进行升序排序,共提取出10个聚类中心,该电网的整体线损水平约在0.53%~1.61%之间,得出聚类结果如下表1所示:
表1 聚类结果
步骤103:通过孤立森林线损异常检测算法对线损数据聚类结果进行线损异常识别,得到线损数据异常识别结果。
在本实施例中,采用孤立森林算法对Mean-shift聚类后的数据进行离群点检测,即孤立森林线损异常检测算法,获取线损异常评估分数,通过设定阈值的方式对配电网日线损率进行异常判断,当异常分数大于所设定的异常阈值时,认为存在线损异常。
需要说明的是,孤立森林算法是一种快速的异常检测算法,其基本思想是通过随机构建一些简单的决策树来对数据进行划分,然后利用划分路径的长度来衡量数据点的离群程度。孤立森林算法通过随机划分数据集,构建简单的决策树来识别异常点,其在处理高维数据集时具有更好的效果。
可选的,步骤103具体包括步骤1031至步骤1033,各步骤具体如下:
步骤1031:将不同的日线损率聚类中心对应的聚类结果数据,作为不同的聚类数据集。
在本实施例中,把通过改进Mean-shift聚类方法处理的线损数据聚类结果,根据聚类中心的聚类结果数据当作一个聚类数据集,对每个聚类数据集使用孤立森林算法进行离群点检测,判定线损异常的部分。
步骤1032:通过孤立森林算法将当前的聚类数据集进行离群点检测,得到当前的聚类数据集中各数据节点的异常分数,并根据当前的聚类数据集中各数据节点的异常分数,判定当前的聚类数据集的线损异常部分。
可选的,通过孤立森林算法将当前的聚类数据集进行离群点检测,得到当前的聚类数据集中各数据节点的异常分数,具体为:
在当前的聚类数据集中,根据孤立树和二叉搜索树的相似性,对路径进行归一化,计算当前的聚类数据集的当前的数据节点的异常分数,公式为:
其中,为当前的聚类数据集的当前的数据节点/>的异常分数;/>为当前的聚类数据集中数据点的个数;/>为当前的聚类数据集的当前的数据点,表示当前的数据节点/>;/>为当前的数据节点/>在多棵孤立树上的路径的期望值;/>为路径;/>为异常搜索长度;
其中,异常搜索长度根据二叉搜索树的失败查找的平均搜索长度得到,公式为:
通过计算当前的聚类数据集的当前的数据节点的异常分数,获得当前的聚类数据集中各数据节点的异常分数。
需要说明的是,假定聚类数据集含有个数据点,那么构造孤立数的高度max值为,min值为log(n),路径/>的最大可能高度与数据点成线性正相关趋势,根据数据点到根节点路径的长度从而判断数据点是否离群。异常分数/>是路径/>的单调递减函数,取值范围为[0,1]。异常分数越接近于1,则路径越长,代表节点的离群程度越高,若大部分节点的异常分数都接近0.5,则整个聚类数据集没有明显的异常线损值。
可选的,根据当前的聚类数据集中各数据节点的异常分数,判定当前的聚类数据集的线损异常部分,具体为:
若当前的聚类数据集中当前的数据节点的异常分数大于预设异常分数阈值,则判定当前的数据节点为线损异常点;
统计分析当前的聚类数据集的线损异常点,得到当前的聚类数据集的线损异常部分。
在本实施例中,利用孤立森林算法得到异常分数后,可以设定阈值(预设异常分数阈值)进行线损异常识别,当异常分数大于所设定的异常阈值时,认为存在线损异常,实现配电网线损异常识别。
步骤1033:统计各聚类数据集的线损异常部分,得到线损数据异常识别结果。
作为本实施例的一种举例,针对聚类数据进行孤立森林算法的离群点检测,采样点设为=256,构造含有100棵孤立树的孤立森林,设不同时刻的线损数据为数据节点/>,计算对应的异常分数/>,针对性的得出数据点线损数据异常分数,如下表2所示:
表2 数据点线损数据异常分数
通过表2可知,线损异常的数据点分数大于正常情况下的异常分数,利用孤立森林算法进行线损异常判定的方法有效。在实际应用中可以根据线损异常发生的概率设定阈值,本次的实施案例中阈值取值为0.5,当数据节点的异常分数大于阈值时,判定线损数据为异常,否则为正常。
在本实施例中,基于改进Mean-shift聚类的配电网线损异常识别方法,以实现更节能、高效的配电网运行和优化目标,提高其准确性和实用性。在第一阶段中,采用状态估计的方式修正初始量测数据,使其更加符合配电网运行状态特征,提出了以状态估计算法处理聚类数据的方法,提高聚类效果。采用加权最小二乘估计法则通过对测量数据进行加权,同时根据加权最小二乘法的极值条件,剔除量测误差较大的量测值,可以更加准确地估计配电网的状态参数。在第二阶段中提出一种改进Mean-shift聚类的算法,为了提高聚类质量,对Mean-shift聚类算法进行改进,本方法在计算均值偏移量的过程中引入了高斯核函数,克服了传统聚类算法中权重和聚类中心的距离相关性固定的问题,能够使得偏移量对均值偏移向量的贡献随着样本与被偏移点距离的不同而不同,利用高斯核函数对均值偏移量进行计算,使聚类中心更加合理,聚类结果更加准确。第三阶段中,采用改进的Mean-shift的聚类结果利用孤立森林算法进行离群点检测,通过该方法的聚类结果,可进一步保障线损异常识别结果的准确性。
实施本发明实施例,获取配电网运行量测数据,并将配电网运行量测数据进行状态估计修正处理,得到状态估计数据;其中,配电网运行量测数据包括发电出力数据和日线损率数据;将状态估计数据进行改进Mean-shift聚类处理,获取线损数据聚类结果;其中,线损数据聚类结果包括不同发电出力数据对应的日线损率聚类中心和不同的日线损率聚类中心对应的聚类结果数据;通过孤立森林线损异常检测算法对线损数据聚类结果进行线损异常识别,得到线损数据异常识别结果。提出了以状态估计算法处理聚类数据的方法,将还原预估真实数据,提高数据准确性,以此基础进行聚类,提高聚类效果,改进Mean-shift聚类算法,利用高斯核函数对均值偏移量进行计算,使聚类中心更加合理,聚类结果更加准确,采用改进的Mean-shift的聚类结果利用孤立森林算法进行离群点检测,通过该方法的聚类结果,提高聚类质量,可进一步保障线损异常识别结果的准确性,可实现更节能、高效的配电网运行和优化目标。
以上的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步的详细说明,应当理解,以上仅为本发明的具体实施例而已,并不用于限定本发明的保护范围。特别指出,对于本领域技术人员来说,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种配电网的线损异常识别方法,其特征在于,包括:
获取配电网运行量测数据,并将所述配电网运行量测数据进行状态估计修正处理,得到状态估计数据;其中,所述配电网运行量测数据包括发电出力数据和日线损率数据;
所述将所述配电网运行量测数据进行状态估计修正处理,得到状态估计数据,具体为:
根据所述配电网运行量测数据和状态变量,建立量测状态关系,公式为:
其中,为所述配电网运行量测数据,/>为所述状态变量;/>为量测函数,/>为量测误差;
根据所述配电网运行量测数据和所述量测函数,构建目标函数,具体为:
其中,为所述目标函数,/>为量测权重矩阵;
通过迭代修正方程,求解所述目标函数的状态变量,获得状态估计数据;其中,所述迭代修正方程,具体为:
其中,为所述状态变量的变化量,/>和/>分别为迭代次数,/>为第/>次迭代的状态变量,/>为第/>次迭代的状态变量的变化量、/>为第/>次迭代的状态变量的变化量,/>为所述量测函数对/>的偏导函数,/>为/>的转置;/>为所述量测函数对/>的偏导函数,/>为/>的量测函数;
将所述状态估计数据进行改进Mean-shift聚类处理,获取线损数据聚类结果;其中,所述线损数据聚类结果包括不同发电出力数据对应的日线损率聚类中心和不同的日线损率聚类中心对应的聚类结果数据;
所述将所述状态估计数据进行改进Mean-shift聚类处理,获取线损数据聚类结果,具体为:
根据所述状态估计数据和预设的聚类数量,求解各滑动窗口的最优滑动半径,并根据所述各滑动窗口的最优滑动半径,获取各样本数据集合;其中,所述各滑动窗口的数量与所述预设的聚类数量相同;
根据当前的样本数据集合中当前的圆心,确定当前的圆心偏移量,将所述当前的圆心偏移量进行高斯核函数指数计算,得到当前的均值偏移量;
判断所述当前的均值偏移量是否小于预期阈值,若不小于,则根据所述当前的圆心偏移量,更新所述当前的圆心,并迭代根据当前的样本数据集合中当前的圆心,确定当前的圆心偏移量,将所述当前的圆心偏移量进行高斯核函数指数计算,得到当前的均值偏移量,判断所述当前的均值偏移量是否小于预期阈值,不断更新迭代所述当前的圆心,直到所述当前的均值偏移量小于所述预期阈值,确定所述当前的样本数据集合的当前的圆心;若小于,则确定所述当前的样本数据集合的当前的圆心;
根据所述当前的样本数据集合的当前的圆心,计算所述当前的样本数据集合的当前的聚类中心;
将所述各样本数据集合的当前的聚类中心进行距离比较处理,确定各独立的聚类中心,根据所述各独立的聚类中心,获得线损数据聚类结果;
所述根据所述当前的样本数据集合的当前的圆心,计算所述当前的样本数据集合的当前的聚类中心,具体为:
根据所述当前的样本数据集合的当前的圆心,选取所述当前的圆心与所述当前的样本数据集合中各个样本点距离之和最小的样本点,作为所述当前的样本数据集合的聚类中心,具体为:
其中,为所述当前的样本数据集合的当前的聚类中心,/>为所述当前的样本数据集合的当前的圆心,/>为所述当前的样本数据集合,/>为所述当前的样本数据集合的样本点;
所述根据所述状态估计数据和预设的聚类数量,求解各滑动窗口的最优滑动半径,并根据所述各滑动窗口的最优滑动半径,获取各样本数据集合,具体为:
在所述状态估计数据中选择一个数据点作为所述当前的圆心,并根据当前的滑动半径和所述当前的圆心,确定所述当前的滑动窗口;
根据所述状态估计数据、所述预设的聚类数量、所述当前的滑动窗口和所述当前的圆心,计算当前的误差平方和,公式为:
其中,为所述当前的误差平方和;/>为所述当前的圆心;/>为所述当前的滑动窗口的每一个数据点;/>为所述当前的滑动窗口的聚类中心;/>为所述预设的聚类数量;
选取所述当前的误差平方和最小时所对应的当前的滑动半径,作为所述当前的滑动窗口的最优滑动半径;
在所述状态估计数据中,筛选出离所述当前的圆心的距离在所述当前的滑动窗口的最优滑动半径之内的全部数据,获得所述当前的样本数据集合,公式为:
其中,为所述当前的样本数据集合,/>为所述当前的滑动窗口的最优滑动半径,/>为所述当前的样本数据集合的样本点坐标,/>为所述当前的圆心的坐标;
统计所述各滑动窗口的最优滑动半径对应的样本数据集合,得到所述各样本数据集合;
所述将所述当前的圆心偏移量进行高斯核函数指数计算,得到当前的均值偏移量,具体为:
其中,表示所述当前的均值偏移量;/>为所述当前的样本数据集合;/>为所述当前的滑动窗口的最优滑动半径;/>表示在/>个样本点/>中,有/>个点落入所述当前的样本数据集合的区域内;/>表示所述当前的样本数据集合的样本点/>;/>表示所述当前的圆心的坐标;/>表示所述当前的圆心偏移量;
所述根据所述当前的圆心偏移量,更新所述当前的圆心,具体为:
根据所述当前的圆心偏移量,对所述当前的圆心进行更新,更新方向与所述的当前的均值偏移量的方向一致,具体为:
其中,为所述当前的圆心;
通过孤立森林线损异常检测算法对所述线损数据聚类结果进行线损异常识别,得到线损数据异常识别结果。
2.如权利要求1所述的配电网的线损异常识别方法,其特征在于,所述通过孤立森林线损异常检测算法对所述线损数据聚类结果进行线损异常识别,得到线损数据异常识别结果,具体为:
将所述不同的日线损率聚类中心对应的聚类结果数据,作为不同的聚类数据集;
通过孤立森林算法将当前的聚类数据集进行离群点检测,得到当前的聚类数据集中各数据节点的异常分数,并根据所述当前的聚类数据集中所述各数据节点的异常分数,判定所述当前的聚类数据集的线损异常部分;
统计各所述聚类数据集的线损异常部分,得到所述线损数据异常识别结果。
3.如权利要求2所述的配电网的线损异常识别方法,其特征在于,所述通过孤立森林算法将当前的聚类数据集进行离群点检测,得到当前的聚类数据集中各数据节点的异常分数,具体为:
在所述当前的聚类数据集中,根据孤立树和二叉搜索树的相似性,对路径进行归一化,计算所述当前的聚类数据集的当前的数据节点的异常分数,公式为:
其中,为所述当前的聚类数据集的当前的数据节点/>的异常分数;/>为所述当前的聚类数据集中数据点的个数;/>为所述当前的聚类数据集的当前的数据点,表示所述当前的数据节点/>;/>为所述当前的数据节点/>在多棵孤立树上的路径的期望值;为所述路径;/>为异常搜索长度;
其中,所述异常搜索长度根据所述二叉搜索树的失败查找的平均搜索长度得到,公式为:
通过计算所述当前的聚类数据集的当前的数据节点的异常分数,获得所述当前的聚类数据集中各数据节点的异常分数。
4.如权利要求3所述的配电网的线损异常识别方法,其特征在于,所述根据所述当前的聚类数据集中所述各数据节点的异常分数,判定所述当前的聚类数据集的线损异常部分,具体为:
若所述当前的聚类数据集中所述当前的数据节点的异常分数大于预设异常分数阈值,则判定所述当前的数据节点为线损异常点;
统计分析所述当前的聚类数据集的线损异常点,得到所述当前的聚类数据集的线损异常部分。
CN202310770008.5A 2023-06-28 2023-06-28 一种配电网的线损异常识别方法 Active CN116522268B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310770008.5A CN116522268B (zh) 2023-06-28 2023-06-28 一种配电网的线损异常识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310770008.5A CN116522268B (zh) 2023-06-28 2023-06-28 一种配电网的线损异常识别方法

Publications (2)

Publication Number Publication Date
CN116522268A CN116522268A (zh) 2023-08-01
CN116522268B true CN116522268B (zh) 2024-03-19

Family

ID=87397960

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310770008.5A Active CN116522268B (zh) 2023-06-28 2023-06-28 一种配电网的线损异常识别方法

Country Status (1)

Country Link
CN (1) CN116522268B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117150233B (zh) * 2023-10-30 2024-02-13 广东电网有限责任公司湛江供电局 一种电网异常数据治理方法、系统、设备及介质
CN117235648B (zh) * 2023-11-07 2024-01-26 山东鑫大地控股集团有限公司 基于数据处理的钢丝加工全流程集成化管理系统
CN117216706B (zh) * 2023-11-09 2024-02-09 国网浙江省电力有限公司杭州供电公司 一种配电网数据异常溯源方法、系统、计算机设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111208384A (zh) * 2018-11-19 2020-05-29 中国电力科学研究院有限公司 一种智能电网管理系统
CN111881124A (zh) * 2020-07-24 2020-11-03 贵州电网有限责任公司 一种基于改进算法的状态估计的数据处理方法及系统
CN115344567A (zh) * 2022-10-18 2022-11-15 国网天津市电力公司营销服务中心 一种适用于边缘计算的低压台区数据清洗治理方法及装置
CN115360703A (zh) * 2022-08-29 2022-11-18 广东电网有限责任公司广州供电局 一种实用的配电网状态估计方法
CN115496163A (zh) * 2022-10-14 2022-12-20 浙江理工大学 基于K-Means++、BP神经网络和孤立森林的建筑异常能耗检测方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111208384A (zh) * 2018-11-19 2020-05-29 中国电力科学研究院有限公司 一种智能电网管理系统
CN111881124A (zh) * 2020-07-24 2020-11-03 贵州电网有限责任公司 一种基于改进算法的状态估计的数据处理方法及系统
CN115360703A (zh) * 2022-08-29 2022-11-18 广东电网有限责任公司广州供电局 一种实用的配电网状态估计方法
CN115496163A (zh) * 2022-10-14 2022-12-20 浙江理工大学 基于K-Means++、BP神经网络和孤立森林的建筑异常能耗检测方法
CN115344567A (zh) * 2022-10-18 2022-11-15 国网天津市电力公司营销服务中心 一种适用于边缘计算的低压台区数据清洗治理方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于 Mean-shift 聚类的大规模新能源对电网线损影响评估方法;陈建华等;新能源;第38卷(第2期);第59页摘要-第63页第3节 *
基于孤立森林算法的配电网线损异常判定;徐迪等;电力系统保护与控制;第49卷(第16期);第12页摘要-第17页第4节 *
基于聚类的离群数据挖掘技术在线损自动生成系统数据预处理中的应用;李瑞等;中国科技信息;20080715(第14期);第42页摘要-43页第3节 *

Also Published As

Publication number Publication date
CN116522268A (zh) 2023-08-01

Similar Documents

Publication Publication Date Title
CN116522268B (zh) 一种配电网的线损异常识别方法
WO2022110557A1 (zh) 一种台区户变关系异常诊断方法及装置
CN111475680A (zh) 检测异常高密子图的方法、装置、设备及存储介质
CN111444615B (zh) 一种基于k近邻和iv曲线的光伏阵列故障诊断方法
CN112732748B (zh) 一种基于自适应特征选择的非侵入式家电负荷识别方法
CN108435819B (zh) 一种铝型材挤压机能耗异常检测方法
CN110795690A (zh) 风电场运行异常数据检测方法
CN108334894B (zh) 基于无监督机器学习的变压器油温异常识别方法
CN113225209B (zh) 一种基于时间序列相似检索的网络监控实时预警方法
CN110674120A (zh) 一种风电场数据清洗方法及装置
CN117113235B (zh) 一种云计算数据中心能耗优化方法及系统
CN116780781B (zh) 智能电网接入的功率管理方法
CN113125903A (zh) 线损异常检测方法、装置、设备及计算机可读存储介质
CN115792681A (zh) 一种基于车联网大数据平台的单体电池一致性检测算法
CN115021679A (zh) 一种基于多维离群点检测的光伏设备故障检测方法
CN116148753A (zh) 一种智能电能表运行误差监测系统
CN111144440A (zh) 一种专变用户日电力负荷特征的分析方法及装置
CN116821832A (zh) 针对高压工商业用户用电负荷的异常数据辨识与修正方法
CN112613443A (zh) 一种基于深度学习的鲁棒性通信辐射源智能识别方法
CN114429238A (zh) 一种基于时空特征提取的风电机组故障预警方法
CN109389313B (zh) 一种基于加权近邻决策的故障分类诊断方法
CN113554079B (zh) 一种基于二次检测法的电力负荷异常数据检测方法及系统
CN115659323A (zh) 一种基于信息熵理论结合卷积神经网络的入侵检测方法
CN113792610B (zh) 一种谐波减速器健康评估方法及装置
CN112884167B (zh) 一种基于机器学习的多指标异常检测方法及其应用系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant