CN114943475A - 基于配电网关键要素数据的配电运行风险评估方法、系统 - Google Patents
基于配电网关键要素数据的配电运行风险评估方法、系统 Download PDFInfo
- Publication number
- CN114943475A CN114943475A CN202210695712.4A CN202210695712A CN114943475A CN 114943475 A CN114943475 A CN 114943475A CN 202210695712 A CN202210695712 A CN 202210695712A CN 114943475 A CN114943475 A CN 114943475A
- Authority
- CN
- China
- Prior art keywords
- power distribution
- data
- machine learning
- prediction
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000012502 risk assessment Methods 0.000 title claims abstract description 36
- 238000010801 machine learning Methods 0.000 claims abstract description 59
- 230000002159 abnormal effect Effects 0.000 claims abstract description 25
- 238000012545 processing Methods 0.000 claims abstract description 20
- 238000005516 engineering process Methods 0.000 claims abstract description 15
- 238000012216 screening Methods 0.000 claims abstract description 14
- 238000004458 analytical method Methods 0.000 claims abstract description 12
- 238000000638 solvent extraction Methods 0.000 claims abstract description 8
- 230000007246 mechanism Effects 0.000 claims abstract description 7
- 238000010276 construction Methods 0.000 claims description 7
- 230000005856 abnormality Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 238000003786 synthesis reaction Methods 0.000 claims description 4
- 238000012098 association analyses Methods 0.000 claims description 3
- 150000001875 compounds Chemical class 0.000 claims description 3
- 238000013480 data collection Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 2
- 238000005070 sampling Methods 0.000 claims description 2
- 230000006399 behavior Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000010219 correlation analysis Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 201000004569 Blindness Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 238000010978 in-process monitoring Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- NRNCYVBFPDDJNE-UHFFFAOYSA-N pemoline Chemical compound O1C(N)=NC(=O)C1C1=CC=CC=C1 NRNCYVBFPDDJNE-UHFFFAOYSA-N 0.000 description 1
- 238000013058 risk prediction model Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000033772 system development Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/003—Load forecast, e.g. methods or systems for forecasting future load demand
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/20—Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Marketing (AREA)
- Artificial Intelligence (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Evolutionary Biology (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Power Engineering (AREA)
- Educational Administration (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及供电技术领域,具体为基于配电网关键要素数据的配电运行风险评估方法和系统,包括步骤:收集配电运行风险评估所需要用到的信息数据;对信息数据采用基于孤立划分机制的孤立森林机器学习算法辨识异常数据点,筛选出不含异常数据点的信息数据;采用基于随机少数类过采样算法添加合成样本,对信息数据进行均衡处理;对均衡处理后的数据进行分类,以确定不同类簇的台区样本;对台区风险影响因素进行关联系分析,明确关键风险影响因素;利用信息熵技术构建基于配电网关键要素的台区风险预测机器学习模型,从而判断该台区是否会发生运行风险。本发明提高了台区供电可靠率,解决了配电网运行风险有效预判的问题。
Description
技术领域
本发明涉及供电技术领域,具体为一种基于配电网关键要素数据的配电运行风险评估方法和系统。
背景技术
一般来说,城市地区配电网具有负荷密度大、用电量集中、供电要求高等特点,部分地区的设备运行年限长,配电网络较为薄弱,负荷转供能力面临着重大的挑战,尤其在夏季高温时段的城中村区域,大功率电器的使用导致用电负荷大幅攀升,部分配变容量无法满足客户用电增长需求,台区出现故障停电、电压不稳等问题。
据某些城市地区度夏期间的数据统计,当天气持续高温,连续3天达到35℃时,用电负荷大幅上涨,设备重过载、故障跳闸、客户投诉等问题突出,高峰负荷日低压报障工单和停电类客户投诉工单数量呈爆发式增长,台区运行风险加大。因此,配电网关键要素(包括馈线、配变、低压等)的运行风险评估预警,是配电网运营监控中的重要内容。目前,对于配电网关键要素问题综合治理,通常集中在事中监控和事后处理两个阶段,即通过对配变运行情况的实时监测发现已经重过载、低电压、三相不平衡与频繁跳闸的台区,运维人员接到告警后再采取相应的措施,这种处理方式以事后处理为主,相对被动,缺乏预判性,导致很多情况下无法避免电网和用户的损失。
发明内容
针对现有技术的不足,本发明提供了一种基于配电网关键要素数据的配电运行风险评估方法和系统,通过对配电网相关数据进行预处理,筛选出高价值的数据,对台区风险影响因素的关联度进行分析,构建具有动态自适应能力的预测模型,技术方案在整体上能够提前发现和预测台区配电网络中出现的潜在威胁,提高了低压台区的供电可靠率,解决了对配电网运行风险进行有效预判的问题。
本发明的第一发明目的是提供一种基于配电网关键要素数据的配电运行风险评估方法,包括以下步骤:
收集配电运行风险评估所需要用到的信息数据;
筛选信息数据:对所收集到的信息数据采用基于孤立划分机制的孤立森林机器学习算法辨识异常数据点,筛选出不含异常数据点的信息数据;
采用基于随机少数类过采样算法添加合成样本,对信息数据进行均衡处理;
对均衡处理后的数据进行分类,以确定不同类簇的台区样本;
对台区风险影响因素进行关联系分析,明确台区运行风险的关键风险影响因素;
根据关键风险影响因素和台区负荷预测结果,利用信息熵技术构建基于配电网关键要素的台区风险预测机器学习模型,基于所构建的台区风险预测机器学习模型判断该台区是否会发生运行风险。
在优选的实施例中,利用信息熵技术构建基于配电网关键要素的台区风险预测机器学习模型时,采用虚拟预测技术计算不同机器学习预测模型针对不同预测尺度的相对误差熵值与变异程度系数。
本发明的第二发明目的是提供一种基于配电网关键要素数据的配电运行风险评估系统,包括:
信息数据收集模块,用于收集配电运行风险评估所需要用到的信息数据;
信息数据筛选模块,对所收集到的信息数据采用基于孤立划分机制的孤立森林机器学习算法辨识异常数据点,筛选出不含异常数据点的信息数据;
均衡处理模块,采用基于随机少数类过采样算法添加合成样本,对信息数据进行均衡处理;
数据分类模块,对均衡处理后的数据进行分类,以确定不同类簇的台区样本;
关联分析模块,对台区风险影响因素进行关联系分析,明确台区运行风险的关键风险影响因素;
模型构建模块,根据关键风险影响因素和台区负荷预测结果,利用信息熵技术构建基于配电网关键要素的台区风险预测机器学习模型,基于所构建的台区风险预测机器学习模型判断该台区是否会发生运行风险。
与现有技术相比,本发明提供了一种基于配电网关键要素数据的配电运行风险评估方法和系统,具备以下有益效果:
1、本发明基于配电网关键要素数据的配电运行风险评估方法和系统,通过采用机器学习方法对相关配电网数据进行数据预处理,筛选出高价值的数据,以确保后续数据分析以及评估结果的精准性和价值性,做出更好的预测、分析和决策。
2、本发明基于配电网关键要素数据的配电运行风险评估方法和系统,通过对台区风险影响因素关联度的深入分析,在明确关键风险影响因素后,利用台区负荷预测结果,结合天气预报,建立基于机器学习的台区风险预测模型,从而判断该台区是否会发生低电压重过载等运行风险,并给出相应风险等级。
3、本发明基于配电网关键要素数据的配电运行风险评估方法和系统,通过利用信息熵理论,研究具有动态自适应能力的集合机器学习预测新模型。由于基于信息熵的预测框架能够根据不同机器预测模型在一定时间尺度上的表现,动态辨识出权重系数,大大提高了自适应预测能力;通过构建智能故障诊断和配电网关键要素风险分类等级与评估模型,利用混合机器学习方法解决配电网关键要素风险预测机器学习模型的鲁棒性和动态自适应问题,提升了模型应用中的泛化能力。
4、本发明具备及时通报预警、助力专业部门提升客户用电服务水平、为迎峰度夏、节假日保供电和日常的主动服务和主动检修等提供支撑等优点,能够提前发现和预测台区配电网络中出现的潜在威胁,从而可以具有针对性地对台区范围内设备进行检修和调整,提升电力设备的正常工作,提高低压台区的供电可靠率,解决了对配电网运行风险进行有效预判的问题。
附图说明
图1是本发明实施例中配电运行风险评估方法的流程图;
图2是本发明实施例中配电运行风险评估系统的结构框图。
具体实施方式
下面将结合本发明的实施例和附图,对本发明的技术方案进行清楚、完整的描述;显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
本实施例提供一种基于配电网关键要素数据的配电运行风险评估方法,如图1所示,包括以下步骤:
S1、收集信息数据:从配电网各业务系统中,获取配电网内部数据和外部数据,对内部数据和外部数据进行预处理,形成配电运行风险评估所需要用到的信息数据。
在本实施例中,可以通过电压系统、巡视APP、营配(供电可靠性)、营配(快速复电)、资产一体化系统、电能量平台、计量自动化系统、营销一体化系统、营销运行监控系统、EMS(能量管理系统)、电网运行管理系统、配用电系统、快速复电系统等业务系统,收集、获取配电网的内部数据以及气象、人口、地域、经济、时间节气等外部数据,并对内部数据和外部数据进行数据提取、清洗、整合、存储等预处理,形成配电运行风险评估所需要用到的信息数据,为分析模型的构建提供数据基础。
S2、筛选信息数据:对所收集到的信息数据采用一种基于孤立划分机制的孤立森林机器学习算法辨识异常数据点,筛选出不含异常数据点的信息数据。
对于信息数据的数据集X={x1,...,xN},x∈Rp为数据集内的数据点,即数据集X中含有N个数据点;孤立森林采用集成机器学习策略构建T棵名为iTree的二叉树,每棵二叉树在数据集X中抽取子样本并随机选取特征变量及值域范围内的划分阈值对子样本空间进行递归划分,直至达到叶节点只包含一个数据点无法继续分割时,iTre二叉树构建完成。
在iTree二叉树中,观测数据点x的分割叶节点至根节点之间树的路径长度h(x),路径长度h(x)值越小表示该数据点x越容易被孤立,数据点x的异常程度就越高,反之说明数据点正常。异常的数据点在三次递归划分后被孤立,在对应iTree二叉树中,异常的数据点分割叶节点的路径长度小于其它观测对象(即其它观测数据点),将会被iTree二叉树更早定位和孤立。
本实施例通过数据点的异常分值来衡量数据点的异常程度,并将任一数据点x的异常分值S(x,n)定义为:
式(1)中,E(h(x))为数据点x在T棵iTree二叉树中路径长度h(x)的平均值;c(n)为子样本抽样数量为n时所有数据点在二叉树中路径长度的平均值。由此计算的异常分值越接近1,说明观测点很早就被孤立,异常程度高;异常分值接近0,则表示数据点不容易被孤立,安全性较高。
S3、添加合成样本,对信息数据进行均衡处理。
针对配电网台区风险预测与动态预警中容易出现的样本不平衡问题,本实施例采用一种基于随机少数类过采样SMOTE-NC的算法,用于样本不均衡时添加合成样本,从而使数据集趋于均衡。具体实施如下:
设少数类样本集X={x1,x2,...,xN},其中xi=(xi1,xi2,...,xim,...,xin)T为第i个(i=1,2,...,N)少数类样本实例,xi1,xi2,...,xim为少数类样本实例xi的m个连续数值型特征取值,xi(m+1),xi(m+2),...,xin为少数类样本实例xi的n-m个名义型特征属性。随机少数类过采样算法SMOTE-NC合成新样本的步骤如下:
1)计算中位数。计算少数类样本实例中所有连续数值型特征的标准差的中位数,记为Med:
Med=median(σ1,σ2,...,σm) (3)
式(2)中,μk为少数类样本X中所有少数类样本实例第k个连续数值型特征的平均值。
2)计算最近邻。在原始欧式距离计算方法的基础上,考虑名义特征差异的影响,添加式(3)中标准差的中位数Med作为距离计算的惩罚项,定义任意少数类样本实例xi和xj之间的距离Dij:
式(4)中,n通过少数类样本实例xi和xj名义型特征差异个数d计算得到。值得注意的是,经one-hot编码转换的名义型特征差异个数会增加一倍,这种情况n应取值为d/2。
3)计算合成样本的连续数值型特征部分。设合成样本为xnew、合成样本xnew的连续数值型特征部分为x′new,则合成样本的连续数值型特征部分采用SMOTE算法的随机线性插值方法进行合成:
4)计算合成样本的名义型特征部分。选取少数类样本实例xi的近邻样本集中各名义型特征的众数值,作为合成样本xnew的名义型特征部分x″new,然后将两部分特征合成值x′new和x″new进行合并得到合成样本xnew。
S4、对均衡处理后的数据进行分类,以确定不同类簇的台区样本,从而对台区风险预测的机器学习模型进行训练学习,以降低台区风险预测的机器学习模型难度。
本实施例中,数据分类可以采用以下两种对策方案来实现:
(1)Borderhne-SMOTE方法:有效克服传统SMOTE算法存在的边缘化和盲目性等问题,从而解决生成样本重叠发问题,使新增加的“人造”样本(即所添加的合成样本)更有效。该算法仅使用边界上的少数类样本来合成新样本,从而改善样本的类别分布,采样过程是将少数类样本分为3类,分别为Safe、Danger和Noise。最后,仅对表为Danger的少数类样本过采样。
(2)生成式对抗网络GAN方法:
生成式对抗网络GAN(Generative Adversarial Networks)属于一种深度学习模型,是近年来复杂分布上无监督学习的最具前景的方法之一,可有效解决小数据集的数据量不足的问题。
GAN应用需要有良好的训练方法,否则可能由于传统神经网络模型的自由性而导致输出不理想,为此,本实施例采用深度神经网络建立生成模型G和判别模型D,通过它们之间的互相博弈学习产生预期的“人造”样本输出。在本实施例中,GAN是由一个生成器和一个判别器构成。生成器捕捉真实数据样本的潜在分布,并由潜在分布生成新的数据样本;判别器是一个二分类器,判别输入是真实数据还是生成的样本。
S5、对台区风险影响因素进行关联系分析,明确台区运行风险的关键风险影响因素。
本实施例将台区运行的大量历史相关监测数据与电网内外部各类数据进行融合,通过数据挖掘方法深入分析各类台区风险影响因素之间的关联关系与影响程度,采用高效快速的灰色关联度分析方法对台区风险与其影响因素间的关系进行分析。
灰色关联度分析方法可以高效的寻求系统中各子系统(或各类影响因素)之间的数值关系。因此,灰色关联度分析对于一个系统发展变化态势提供了量化的度量,适合动态过程的分析。灰色关联度分析的过程,具体如下:
(1)确定反映系统行为特征的参考数列和影响系统行为的比较数列。其中,反映系统行为特征的数据序列,称为参考数列;影响系统行为的因素组成的数据序列,称为比较数列。
(2)对参考数列和比较数列进行无量纲化处理。由于系统中各因素的物理意义不同,导致数据的量纲也不一定相同,不便于比较,或在比较时难以得到正确的结论;因此在进行灰色关联度分析时,一般都要进行无量纲化的数据处理。
(3)求参考数列与比较数列的灰色关联系数ξ(Xi)。关联程度实质上是曲线间几何形状的差别程度;因此曲线间差值大小,可作为关联程度的衡量尺度。
在本实施例中,设一个参考数列X0有若干个比较数列X1,X2,…,Xn,各比较数列与参考数列在各个时刻(即曲线中的各点)的关联系数ξ(Xi)可由下列公式算出:
其中ρ为分辨系数,一般在0-1之间,通常取0.5。
如果是第二级最小差,则记为Δmin;如果是两级最大差,记为Δmax。
为各比较数列Xi曲线上的每一个点与参考数列X0曲线上的每一个点的绝对差值,记为Δ0i(k)。
所以关联系数也可简化如下列公式:
(4)求关联度
因为关联系数是比较数列与参考数列在各个时刻(即曲线中的各点)的关联程度值,所以它的数不止一个,而信息过于分散不便于进行整体性比较。因此有必要将各个时刻(即曲线中的各点)的关联系数集中为一个值,即求其平均值,作为比较数列与参考数列间关联程度的数量表示,关联度的公式如下:
关联度的值越接近1,说明相关性越好。
(5)关联度排序
因素间的关联程度,主要是用关联度的大小次序描述,而不仅是关联度的大小。将m个子序列对同一母序列的关联度按大小顺序排列起来,便组成了关联序,记为{x},它反映了对于母序列来说各子序列的“优劣”关系。若r0i>r0j,则称{xi}对于同一母序列{x0}优于{xi},记为{xi}>{xj};r0i表示第i个子序列对母数列特征值。
S6、构建预测模型进行预测评估:通过对台区风险影响因素关联度的深入分析,在明确关键风险影响因素后,再根据台区负荷预测结果,利用信息熵技术构建基于配电网关键要素的台区风险预测机器学习模型,从而基于所构建的台区风险预测机器学习模型判断该台区是否会发生低电压重过载等运行风险,并给出相应风险等级。
在本步骤中,采用虚拟预测技术计算不同机器学习预测模型针对不同预测尺度的相对误差熵值与变异程度系数,从而解决台区风险预测集合机器学习预测权重系数难以确定和动态自适应能力差的问题。主要实施步骤如下:
步骤S61:计算第j个机器学习预测模型在第t时刻的相对误差比重pjt:
步骤S62:计算第j个机器学习预测模型的预测相对误差的熵值Hj:
步骤S63:计算第j个机器学习预测模型的预测相对误差的变异程度系数Dj:
Dj=1-Hj (10)
步骤S64:计算第j个机器学习预测模型的权重系数Wj:
实施例2
本实施例与实施例1基于相同的发明构思,提供的是一种基于配电网关键要素数据的配电运行风险评估系统,如图2所示,包括:
信息数据收集模块,用于收集配电运行风险评估所需要用到的信息数据;
信息数据筛选模块,对所收集到的信息数据采用基于孤立划分机制的孤立森林机器学习算法辨识异常数据点,筛选出不含异常数据点的信息数据;
均衡处理模块,采用基于随机少数类过采样算法添加合成样本,对信息数据进行均衡处理;
数据分类模块,对均衡处理后的数据进行分类,以确定不同类簇的台区样本;
关联分析模块,对台区风险影响因素进行关联系分析,明确台区运行风险的关键风险影响因素;
模型构建模块,根据关键风险影响因素和台区负荷预测结果,利用信息熵技术构建基于配电网关键要素的台区风险预测机器学习模型,基于所构建的台区风险预测机器学习模型判断该台区是否会发生运行风险。
本实施例的各模块分别用于实现实施例1的步骤S1-S6,具体实现过程可参照实施例1所描述的技术内容,在此不赘述。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (10)
1.一种基于配电网关键要素数据的配电运行风险评估方法,其特征在于,包括以下步骤:
收集配电运行风险评估所需要用到的信息数据;
筛选信息数据:对所收集到的信息数据采用基于孤立划分机制的孤立森林机器学习算法辨识异常数据点,筛选出不含异常数据点的信息数据;
采用基于随机少数类过采样算法添加合成样本,对信息数据进行均衡处理;
对均衡处理后的数据进行分类,以确定不同类簇的台区样本;
对台区风险影响因素进行关联系分析,明确台区运行风险的关键风险影响因素;
根据关键风险影响因素和台区负荷预测结果,利用信息熵技术构建基于配电网关键要素的台区风险预测机器学习模型,基于所构建的台区风险预测机器学习模型判断该台区是否会发生运行风险。
2.根据权利要求1所述的配电运行风险评估方法,其特征在于,利用信息熵技术构建基于配电网关键要素的台区风险预测机器学习模型时,采用虚拟预测技术计算不同机器学习预测模型针对不同预测尺度的相对误差熵值与变异程度系数。
4.根据权利要求1所述的配电运行风险评估方法,其特征在于,对均衡处理后的数据进行分类时,采用Borderhne-SMOTE方法或生成式对抗网络GAN方法。
5.根据权利要求1所述的配电运行风险评估方法,其特征在于,从配电网各业务系统中,获取配电网内部数据和外部数据,对内部数据和外部数据进行预处理,形成配电运行风险评估所需要用到的信息数据。
6.根据权利要求1所述的配电运行风险评估方法,其特征在于,筛选信息数据包括以下步骤:
对于信息数据的数据集X={x1,...,xN},x∈Rp为数据集内的数据点,孤立森林采用集成机器学习策略构建T棵二叉树,每棵二叉树在数据集X中抽取子样本并随机选取特征变量及值域范围内的划分阈值对子样本空间进行递归划分,直至达到叶节点只包含一个数据点无法继续分割时,二叉树构建完成;
在二叉树中,观测数据点x的分割叶节点至根节点之间树的路径长度h(x),路径长度h(x)值越小表示该数据点x越容易被孤立,数据点x的异常程度就越高,反之数据点正常;异常的数据点在三次递归划分后被孤立,在对应二叉树中,异常的数据点分割叶节点的路径长度小于其它观测数据点,将被二叉树更早定位和孤立。
8.根据权利要求1所述的配电运行风险评估方法,其特征在于,
设少数类样本集X={x1,x2,...,xN},其中xi=(xi1,xi2,...,xim,...,xin)T为第i个(i=1,2,...,N)少数类样本实例,xi1,xi2,...,xim为少数类样本实例xi的m个连续数值型特征取值,xi(m+1),xi(m+2),...,xin为少数类样本实例xi的n-m个名义型特征属性;
随机少数类过采样算法合成样本的步骤包括:
计算少数类样本实例中所有连续数值型特征的标准差的中位数,记为Med:
Med=median(σ1,σ2,...,σm)
式中,μk为少数类样本X中所有少数类样本实例第k个连续数值型特征的平均值;
计算最近邻,在原始欧式距离计算方法的基础上,考虑名义特征差异的影响,添加标准差的中位数Med作为距离计算的惩罚项,定义任意少数类样本实例xi和xj之间的距离Dij:
其中n通过少数类样本实例xi和xj名义型特征差异个数d计算得到;
计算合成样本的连续数值型特征部分,设合成样本为xnew、合成样本xnew的连续数值型特征部分为x′new,则合成样本的连续数值型特征部分采用SMOTE算法的随机线性插值方法进行合成:
9.一种基于配电网关键要素数据的配电运行风险评估系统,其特征在于,包括:
信息数据收集模块,用于收集配电运行风险评估所需要用到的信息数据;
信息数据筛选模块,对所收集到的信息数据采用基于孤立划分机制的孤立森林机器学习算法辨识异常数据点,筛选出不含异常数据点的信息数据;
均衡处理模块,采用基于随机少数类过采样算法添加合成样本,对信息数据进行均衡处理;
数据分类模块,对均衡处理后的数据进行分类,以确定不同类簇的台区样本;
关联分析模块,对台区风险影响因素进行关联系分析,明确台区运行风险的关键风险影响因素;
模型构建模块,根据关键风险影响因素和台区负荷预测结果,利用信息熵技术构建基于配电网关键要素的台区风险预测机器学习模型,基于所构建的台区风险预测机器学习模型判断该台区是否会发生运行风险。
10.根据权利要求9所述的配电运行风险评估系统,其特征在于,模型构建模块中利用信息熵技术构建基于配电网关键要素的台区风险预测机器学习模型时,采用虚拟预测技术计算不同机器学习预测模型针对不同预测尺度的相对误差熵值与变异程度系数:
计算第j个机器学习预测模型在第t时刻的相对误差比重pjt:
计算第j个机器学习预测模型的预测相对误差的熵值Hj:
计算第j个机器学习预测模型的预测相对误差的变异程度系数Dj:
Dj=1-Hj
计算第j个机器学习预测模型的权重系数Wj:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210695712.4A CN114943475A (zh) | 2022-06-20 | 2022-06-20 | 基于配电网关键要素数据的配电运行风险评估方法、系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210695712.4A CN114943475A (zh) | 2022-06-20 | 2022-06-20 | 基于配电网关键要素数据的配电运行风险评估方法、系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114943475A true CN114943475A (zh) | 2022-08-26 |
Family
ID=82911315
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210695712.4A Pending CN114943475A (zh) | 2022-06-20 | 2022-06-20 | 基于配电网关键要素数据的配电运行风险评估方法、系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114943475A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115473343A (zh) * | 2022-11-02 | 2022-12-13 | 广州思泰信息技术有限公司 | 一种智能网关多主站并行接入测试方法 |
CN116090832A (zh) * | 2023-02-22 | 2023-05-09 | 平顶山学院 | 一种电网营销业务风险数字化管控系统及方法 |
CN116861343A (zh) * | 2023-07-10 | 2023-10-10 | 广东德尔智慧科技股份有限公司 | 一种轴承故障诊断方法 |
CN117670067A (zh) * | 2024-02-01 | 2024-03-08 | 青岛博什兰物联技术有限公司 | 一种基于大数据的质量安全管理方法及平台 |
CN117689214A (zh) * | 2024-01-31 | 2024-03-12 | 天津华凯电气有限公司 | 一种柔性直流牵引供电系统能量路由器动态安全评估方法 |
CN118133211A (zh) * | 2024-05-07 | 2024-06-04 | 山东世纪智慧农业科技有限公司 | 基于多维传感器的黑皮鸡枞菌菌棒污染评估方法 |
-
2022
- 2022-06-20 CN CN202210695712.4A patent/CN114943475A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115473343A (zh) * | 2022-11-02 | 2022-12-13 | 广州思泰信息技术有限公司 | 一种智能网关多主站并行接入测试方法 |
CN116090832A (zh) * | 2023-02-22 | 2023-05-09 | 平顶山学院 | 一种电网营销业务风险数字化管控系统及方法 |
CN116861343A (zh) * | 2023-07-10 | 2023-10-10 | 广东德尔智慧科技股份有限公司 | 一种轴承故障诊断方法 |
CN117689214A (zh) * | 2024-01-31 | 2024-03-12 | 天津华凯电气有限公司 | 一种柔性直流牵引供电系统能量路由器动态安全评估方法 |
CN117689214B (zh) * | 2024-01-31 | 2024-05-14 | 天津华凯电气有限公司 | 一种柔性直流牵引供电系统能量路由器动态安全评估方法 |
CN117670067A (zh) * | 2024-02-01 | 2024-03-08 | 青岛博什兰物联技术有限公司 | 一种基于大数据的质量安全管理方法及平台 |
CN118133211A (zh) * | 2024-05-07 | 2024-06-04 | 山东世纪智慧农业科技有限公司 | 基于多维传感器的黑皮鸡枞菌菌棒污染评估方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114943475A (zh) | 基于配电网关键要素数据的配电运行风险评估方法、系统 | |
CN106850254B (zh) | 一种电力通信网中关键节点识别方法 | |
CN111429027A (zh) | 一种基于大数据的地区输电网运行多维度分析方法 | |
CN117421687B (zh) | 一种数字化电力环网柜运行状态监测方法 | |
CN111722046B (zh) | 一种基于深度森林模型的变压器故障诊断方法 | |
CN111525587B (zh) | 一种基于无功负荷态势的电网无功电压控制方法及系统 | |
CN110766200A (zh) | 一种基于K-means均值聚类的风电机组发电功率预测方法 | |
CN111339491A (zh) | 一种城市配电网改造方案的评估方法 | |
CN111461564A (zh) | 基于云模型和最优组合赋权的风电机组功率特性评估方法 | |
CN107169655A (zh) | 一种优选配电网方案适应性的方法及装置 | |
CN113627735A (zh) | 工程建设项目安全风险的预警方法及系统 | |
CN111585277B (zh) | 一种基于混合集成模型的电力系统动态安全评估方法 | |
CN110837915A (zh) | 一种基于混合集成深度学习的电力系统低压负荷点预测及概率预测方法 | |
CN110705859A (zh) | 基于pca-自组织神经网络的中低压配电网运行状态评估方法 | |
CN113595071A (zh) | 台区用户辨识与电压影响评估方法 | |
El Maghraoui et al. | Smart energy management system: A comparative study of energy consumption prediction algorithms for a hotel building | |
CN115294671A (zh) | 一种空压机出口压力预测方法和预测系统 | |
CN106845711A (zh) | 供电可靠性数据的处理方法及处理装置 | |
CN116308883A (zh) | 一种基于大数据的区域电网数据统筹管理系统 | |
CN117171548B (zh) | 一种基于电网大数据的网络安全态势智能预测方法 | |
CN117113243B (zh) | 一种光伏设备异常检测方法 | |
Li et al. | Short-term load forecasting using support vector regression-based local predictor | |
CN116151799A (zh) | 一种基于bp神经网络的配电线路多工况故障率快速评估方法 | |
CN105139283B (zh) | 一种220kV城市环网分区方案评估方法 | |
Zhao et al. | Operation and Maintenance Management and Decision Analysis in Distribution Network Based on Big Data Mining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |