CN114004457A - 一种配电网规划问题根源精准定位方法及系统 - Google Patents
一种配电网规划问题根源精准定位方法及系统 Download PDFInfo
- Publication number
- CN114004457A CN114004457A CN202111180020.8A CN202111180020A CN114004457A CN 114004457 A CN114004457 A CN 114004457A CN 202111180020 A CN202111180020 A CN 202111180020A CN 114004457 A CN114004457 A CN 114004457A
- Authority
- CN
- China
- Prior art keywords
- item
- data
- association
- algorithm
- association rule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000007418 data mining Methods 0.000 claims abstract description 13
- 238000013138 pruning Methods 0.000 claims description 19
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000005065 mining Methods 0.000 claims description 9
- 238000000546 chi-square test Methods 0.000 claims description 7
- 238000012423 maintenance Methods 0.000 claims description 7
- 238000007689 inspection Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 239000013589 supplement Substances 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 4
- 238000004458 analytical method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000012790 confirmation Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000010998 test method Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06313—Resource planning in a project environment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- Biodiversity & Conservation Biology (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Educational Administration (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供的一种配电网规划问题根源精准定位方法及系统包括收集整理由电力系统获取的数据,形成规范的问题集;将规范的问题集转化为适用于关联算法的项集和事件集的形式;通过上述关联算法从历年的电网收资数据中挖掘个案问题、同源问题与区域乃至涉及整个系统的系统问题之间潜在的关联关系;利用提升度和卡方检验筛选关联规则;将算法得到的强关联规则以简洁美观的形式表达。本申请整理了配电网运行过程中已经出现或可能出现的全体问题,处理形成规范化的问题集,通过机器算法对规范化的问题集进行全面数据挖掘,寻找各问题间可能存在的关联关系,使规划人员能够系统、高效地对配电网规划方面问题进行改造。
Description
技术领域
本申请涉及配电网规划问题技术领域,尤其涉及一种配电网规划问题根源精准定位 方法及系统。
背景技术
配电网规划问题复杂多样,既有已经出现的问题也有在未来一段时间内可能出现的 问题,既有单个配电网设备问题也有一个地区的系统性问题。有些问题之间相互影响,联系紧密,而有些看似无关的问题之间也可能有着千丝万缕的联系。如何对现有的配电 网规划问题进行合理的改造,凭借主观经验,单纯从一个维度进行问题分析和定位往往 会导致结果失去完备性和系统性,因此有必要通过数据挖掘方法,在大数据下开展多维 度的综合分析定位技术研究,综合基于物理网架结构,研究配电网规划问题的相互关联 特性及其系统查找和精准定位技术,实现对配电网规划问题的全面挖掘和精准揭示。
而目前在这方面国内外鲜有相关研究成果,现有技术方案一般根据以往的电网运行 经验,再根据当前实际情况,结合对不同问题的理论分析,人为地关联各问题的关系。该方法凭借专家经验判断,存在过多的人为主观因素,而且过往经验有可能不适用于当 前日新月异的电网情况。此外,通过这种方法分析过程繁琐,效率低下,需消耗大量人 力资源。
发明内容
本申请提供了一种配电网规划问题根源精准定位方法及系统,以解决目前在配电网 规划这方面国内外鲜有相关研究成果,现有技术方案一般根据已有的以往电网运行经验, 再根据当前实际情况,结合对不同问题的理论分析,人为地关联各问题的关系。该方法凭借专家经验判断,存在过多的人为主观因素,而且过往经验有可能不适用于当前日新 月异的电网情况。此外,通过这种方法分析过程繁琐,效率低下,需消耗大量人力资源 的问题。
本申请提供一种配电网规划问题根源精准定位方法,包括:
收集整理由电力系统获取的数据,形成规范的问题集;
将规范的问题集转化为适用于关联算法的项集和事件集的形式;
通过上述关联算法从历年的电网收资数据中挖掘个案问题、同源问题与区域乃至涉 及整个系统的系统问题之间潜在的关联关系;
利用提升度和卡方检验筛选关联规则;
将算法得到的强关联规则以简洁美观的形式表达。
可选的,所述将规范的问题集转化为适用于关联算法的项集和事件集的形式的步骤 包括:
以变压器的容量为基准将无功补偿容量百分比化,其中0到10%的档次设为c0,10% 到20%的档次设为c1,20%到30%的档次设为c2,30%以上的档次设为c3;
以变压器的容量为基准将负载率百分比化,其中负载率在30%以下的档次设为L0, 30%到50%%的档次设为L1,50%到70%%的档次设为L2,70%以上%的档次设为L3。
可选的,所述通过上述关联算法从历年的电网收资数据中挖掘个案问题、同源问题 与区域乃至涉及整个系统的系统问题之间潜在的关联关系的步骤包括:
步骤1,将全体设备的可能数据项集合J={J1,J2,J3,…,Jn}作为项目集;将不同时 间下的所有实测设备收资数据T={T1,T2,T3,…,Tn}作为事务集,如表1,表中第一列为事务名称,第二列为对应事务所含有的项:
表1 事务数据库示例
每个实测收资数据即事务都为J的一个子集,不同事务所对应的项集可能相同;
步骤2,对于某关联规则X->Y而言,定义支持度为在整体事务集中,包含关联规则中全部项集的事务数量与全体事务数量之比,即关联规则中的全部项集同时出现的概率:
并设置最小支持度,例如support_min=0.2;
步骤3,对于关联规则X->Y而言,定义置信度为出现全部前项的条件下,同时出现前后项的概率,即同时包含X、Y的事务集,与只含X的事务集的数量比:
并设置最小置信度,例如confidence_min=0.5;
步骤4,对于n项一组的项组集Cn,定义连接步为找出Cn中所有形如(J1、J2、J3…Jn-1)、(J1、J2、J3…Jn-2)的只有最后一项不同的两个项组,分别对其求并集,得到(n+1)项一组的全体项组集Ln+1;
步骤5,对于n项一组的项组集Ln,定义剪枝步为扫描事件集,计算每个项的支持度,删去支持度低于support_min的项集,得到一个新的项组集Cn;
步骤6,对J进行剪枝步,得到C1={(Ji),i∈[1,n]},存储为1-频繁项集,其中Ji满足:
support(Ji)≥support_min
步骤7,对1-频繁项集执行连接步生成含有2项一组的候选项集L2={(Ji,Jk),i,j∈[1,n]};
步骤8,对L2执行剪枝步,得到2项一组的2-频繁项集C2;
步骤9,重复步骤7和步骤8,对新生成的项集C2依次执行连接步和剪枝步,生成 新的k-频繁项集(k=3,4,…),直至无法找到(k+1)-频繁项集;
步骤10,取频繁项集Ci(i=1,2,…,k)中的一个项组作为后件,以剩余的项组作为前 项,计算置信度,若该关联规则的置信度高于最小置信度,则保留该关联规则并保留该项组;
步骤11,依次取其他项组作为后件,重复步骤10,设所有被保留的项组的集合为S1,对S1执行连接步生成2-项组集S2;
步骤12,重复步骤10和步骤11,以S2中的项组为后项,剩余的项组作为前项,计 算置信度和剪枝,生成Si(i=1,2,…,k),直至没有满足的置信度的组合或前项为空;
步骤13,对所有Ci(i=2,3,…,k)执行步骤10,至步骤12;
步骤14,输出所有被保留的关联规则。
可选的,所述利用提升度和卡方检验筛选关联规则的步骤包括:
对输出的关联规则进行提升度检验和卡方检验,过滤掉无效的强关联规则。
一种基于Apriori算法的配电网规划问题根源精准定位系统,包括数据输入接口、用户数据输入界面、Apriori算法计算模块、数据输出接口和用户界面,其中,
所述数据输入接口将电网运维系统和Apriori算法计算模块连接起来,被配置为从 电网运维系统获得所需要的数据,所述用户数据输入界面将手动数据输入和Apriori算法计算模块连接起来,被配置为允许用户手动补充个别缺失的数据项,所述Apriori算 法计算模块包含数据预处理功能,被配置为将从电网收资得来的各表格整理成规范的问 题项集和事件集的形式,对整理得到的问题项集和事件项集进行数据挖掘,找出其间的 关联关系,所述Apriori算法计算模块通过数据输出接口连接有用户界面,所述用户界 面被配置为将算法得到的强关联规则通过简洁美观的形式向用户展示。
由以上技术方案可知,本申请提供一种配电网规划问题根源精准定位方法及系统, 包括收集整理由电力系统获取的数据,形成规范的问题集;将规范的问题集转化为适用 于关联算法的项集和事件集的形式;通过上述关联算法从历年的电网收资数据中挖掘个 案问题、同源问题与区域乃至涉及整个系统的系统问题之间潜在的关联关系;利用提升度和卡方检验筛选关联规则;将算法得到的强关联规则以简洁美观的形式表达。
本申请整理了配电网运行过程中已经出现或可能出现的全体问题,处理形成规范化 的问题集,通过机器算法对规范化的问题集进行全面数据挖掘,寻找各问题间可能存在的关联关系。本申请能够系统地分析配电网规划现存问题及可能出现的问题间的联系, 使规划人员能够系统、高效地对配电网规划方面问题进行改造。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单 地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的配电网规划问题根源的精准定位方法的实现流程示意图;
图2为本申请提供的Apriori算法流程示意图;
图3为本申请提供的配电网规划问题根源的精准定位系统架构示意图。
具体实施方式
下面将详细地对实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下实施例中描述的实 施方式并不代表与本申请相一致的所有实施方式。仅是与权利要求书中所详述的、本申 请的一些方面相一致的系统和方法的示例。
参见图1,为本申请提供的配电网规划问题根源的精准定位方法的实现流程示意图, 包括:
收集整理由电力系统获取的数据,形成规范的问题集;
将规范的问题集转化为适用于关联算法的项集和事件集的形式;
通过上述关联算法从历年的电网收资数据中挖掘个案问题、同源问题与区域乃至涉 及整个系统的系统问题之间潜在的关联关系;
利用提升度和卡方检验筛选关联规则;
将算法得到的强关联规则以简洁美观的形式表达。
进一步的,所述将规范的问题集转化为适用于关联算法的项集和事件集的形式的步 骤包括:
以变压器的容量为基准将无功补偿容量百分比化,其中0到10%的档次设为c0,10% 到20%的档次设为c1,20%到30%的档次设为c2,30%以上的档次设为c3;
以变压器的容量为基准将负载率百分比化,其中负载率在30%以下的档次设为L0, 30%到50%%的档次设为L1,50%到70%%的档次设为L2,70%以上%的档次设为L3。
进一步的,所述通过上述关联算法从历年的电网收资数据中挖掘个案问题、同源问 题与区域乃至涉及整个系统的系统问题之间潜在的关联关系的步骤包括:
步骤1,将全体设备的可能数据项集合J={J1,J2,J3,…,Jn}作为项目集;将不同时 间下的所有实测设备收资数据T={T1,T2,T3,…,Tn}作为事务集,如表1,表中第一列为事务名称,第二列为对应事务所含有的项:
表1 事务数据库示例
每个实测收资数据即事务都为J的一个子集,不同事务所对应的项集可能相同;
步骤2,对于某关联规则X->Y而言,定义支持度为在整体事务集中,包含关联规则中全部项集的事务数量与全体事务数量之比,即关联规则中的全部项集同时出现的概率:
并设置最小支持度,例如support_min=0.2;
步骤3,对于关联规则X->Y而言,定义置信度为出现全部前项的条件下,同时出现前后项的概率,即同时包含X、Y的事务集,与只含X的事务集的数量比:
并设置最小置信度,例如confidence_min=0.5;
步骤4,对于n项一组的项组集Cn,定义连接步为找出Cn中所有形如(J1、J2、J3…Jn-1)、(J1、J2、J3…Jn-2)的只有最后一项不同的两个项组,分别对其求并集,得到(n+1)项一组的全体项组集Ln+1;
步骤5,对于n项一组的项组集Ln,定义剪枝步为扫描事件集,计算每个项的支持度,删去支持度低于support_min的项集,得到一个新的项组集Cn;
步骤6,对J进行剪枝步,得到C1={(Ji),i∈[1,n]},存储为1-频繁项集,其中Ji满足:
support(Ji)≥support_min
步骤7,对1-频繁项集执行连接步生成含有2项一组的候选项集L2={(Ji,Jk),i,j∈[1,n]};
步骤8,对L2执行剪枝步,得到2项一组的2-频繁项集C2;
步骤9,重复步骤7和步骤8,对新生成的项集C2依次执行连接步和剪枝步,生成 新的k-频繁项集(k=3,4,…),直至无法找到(k+1)-频繁项集;
步骤10,取频繁项集Ci(i=1,2,…,k)中的一个项组作为后件,以剩余的项组作为前 项,计算置信度,若该关联规则的置信度高于最小置信度,则保留该关联规则并保留该项组;
步骤11,依次取其他项组作为后件,重复步骤10,设所有被保留的项组的集合为S1,对S1执行连接步生成2-项组集S2;
步骤12,重复步骤10和步骤11,以S2中的项组为后项,剩余的项组作为前项,计 算置信度和剪枝,生成Si(i=1,2,…,k),直至没有满足的置信度的组合或前项为空;
步骤13,对所有Ci(i=2,3,…,k)执行步骤10,至步骤12;
步骤14,输出所有被保留的关联规则。
参见图2,为本申请提供的Apriori算法流程示意图,所述从历年的电网收资数据中挖掘个案问题、同源问题与区域乃至涉及整个系统的系统问题之间潜在的关联关系的方法原理为:
设J为全体可能的收资数据项的集合,称为项目集;T为不同时间下的所有实测收资数据,称为事务集。则每个实测收资数据,亦即每个事务,都为J的一个子集。表1 为一个事务集示例。表中第一列为事务名称,第二列为对应事务所含有的项。其中,不 同事务所对应的项集允许相同。算法最终会根据支持度,挖掘出频繁项目集,并进一步 根据置信度从中挖掘出项与项之间的联系,表示成J1->J5的形式。其中箭头指明两者的 关联因果性,箭头的左右两边是J的不同子集,左侧称为前件,右侧称为后件,且二者 交集为空,即二者不存在相同的项。
表1 事务数据库示例
其中,频繁项目集的筛选通过支持度来定义划分:对于某关联规则J1->J5而言,支持度定义为在整体事务集中,包含关联规则中全部项集的事务数量与全体事务数量之比,即关联规则中全部项集J1、J5同时出现的概率;在执行频繁项集筛选步骤前,可以人为 设置一个最小支持度support_min,若计算得到关联规则的支持度高于最小支持度,则 认为该规则中所包含的项目的集合为频繁项目集合,并保留该集合,否则删去该集合。
Apriori原理指出如果一个项集是非频繁集,那么它的所有超集也是非频繁的。因为若一个项集的概率P(A)<support_min,则必有该项集与其他项集的交集的概率 P(A*B)<support_min。因此,根据此原理来生成项集可以避免列写项的全部排列组合, 从而大大提高运算时间和减少计算机储存空间。
计算每个项的支持度并剪枝可以得到1-频繁项集。根据1-频繁项集两两求合集可以 生成含有2个项的项集,对新的项集进行剪枝,就可以得到2-频繁项集。找出只有一项不同的2-项集的两两组合,求其并集。就可以得到含3个项的项集。随后再进行剪枝得 到3-频繁项集。如此反复直至k-频繁项集为空或生成了n-频繁项集(n为项目集中项的 总数),就可以得到全部的频繁项集。由于任何n项集Jn={J1、J2、J3…Jn}都必然含有 两个n-1子集{J1、J2、J3…Jn-1}、{J1、J2、J3…Jn-2},其前n-2项都是相同的,他 们的并集就是集合Jn。因此,以上算法能够保证生成所有符合要求的项集组合而不遗漏。
然后,对全体频繁项集生成强关联规则。对于给定的频繁项集,逐个取其中的一个项作为后件,以剩余的项作为前项,计算置信度。若满足要求,保留该项。对所有保留 的项按照生成频繁项集的方法生成2-项集,再计算置信度和剪枝。如此重复直至没有满 足的置信度的组合或前项为空。
置信度计算方法如下:对于某关联规则而言,置信度定义为在所有只含关联规则全 部前者项即只含J1的事务集,与同时包含后者项即同时包含J1、J5的事务集的数量比,即出现全部前项的条件下,同时出现前后项的概率;在执行本步骤前,可以人为设置一 个最小置信度,若关联规则的置信度高于最小置信度,且该规则中所包含的项目的集合 为频繁项目集合,则认为该规则为有效关联规则,并保留该关联规则,否则删去该关联 规则;
提升度(Lift)的含义是,相比于不使用该规则,使用该规则可以提高多少。换言之,如果某一规则有用,则该规则的提升度大于1。提升度(Lift)的表达式为:
根据计算出的提升度的结果(如Lift()),可度量X与Y的相关性:
由于数据样本的抽样会对上述的支持度(Support)、置信度(Confidence)以及提升度(Lift)的值产生不同程度的影响,因此为了进一步评估所有规则的有效性,考虑 从数学统计上过滤掉不重要的规则。为此,本申请使用了统计学中的卡方检验方法。
卡方检验是以卡方分布为基础的常用假设检验方法,属于非参数检验方法。卡方检 验主要应用于两个或两个以上的分类变量的关联性分析之中,其根本思想在于比较数据 的理论分布与实际分布的吻合程度,从而判断是否应该拒绝无用假设H0(通常假设相关变量间没有关联,即相互独立)。卡方检验的基本流程如下:
(1)先假设无用假设H0成立,并由此计算出卡方值x2,即理论值与观测值间的偏离程度大小的表征。
卡方值(Chi-Square)的计算公式如下:
其中,Ei为期望频数(即出现的次数),Ai为实际频数,n为总频数。
(2)依据自由度及卡方分布函数确定在某一显著性水平α下(通常取0.01,0.05,0.1) 计算得到的卡方值x2大于临界值这一小概率事件是否发生。若这一小概率事件发生了, 则说明观测值与实际值偏离程度过大,在1-α这一级别上原独立假设不成立,即不接受原假设,且变量间关联的置信度为1-α。否则,不能拒绝原假设,即在这一尺度上不能 认为变量间相互关联。
进一步的,所述利用提升度和卡方检验筛选关联规则的步骤包括:
对输出的关联规则进行提升度检验和卡方检验,过滤掉无效的强关联规则。
参见图3,为本申请提供的配电网规划问题根源的精准定位系统架构示意图,一种基于Apriori算法的配电网规划问题根源精准定位系统包括数据输入接口、用户数据输 入界面、Apriori算法计算模块、数据输出接口和用户界面,其中,
所述数据输入接口将电网运维系统和Apriori算法计算模块连接起来,被配置为从 电网运维系统获得所需要的数据,所述用户数据输入界面将手动数据输入和Apriori算法计算模块连接起来,被配置为允许用户手动补充个别缺失的数据项,所述Apriori算 法计算模块包含数据预处理功能,被配置为将从电网收资得来的各表格整理成规范的问 题项集和事件集的形式,对整理得到的问题项集和事件项集进行数据挖掘,找出其间的 关联关系,所述Apriori算法计算模块通过数据输出接口连接有用户界面,所述用户界 面被配置为将算法得到的强关联规则通过简洁美观的形式向用户展示。
实施例
基于某市规划的收资数据,该算例应用Apriori算法重点开展重过载问题关联规则 的数据挖掘。
1、数据预处理
对指标类数据,需依据相关规划手册和规划书的标准,对其进行阈值划分,实现数据离散化,使其适用于关联算法之中。
(1)配电网日常运行中,负载率低于20%称为轻载运行,对于满足条件的数据本实施例标记为“轻载”;高于80%且小于100%称为重载运行,而高于100%称为过载运行, 本实施例统一此两个运行状态统一标记为“重过载”;此外,本实施例为方便研究其他相 关内容,将负载率介于60%和80%之间的数据标记为“接近重载”。
(2)依据DL/T 5729《配电网规划设计技术导则》,结合实际数据情况(采集到的 数据里缺少A+等级线路),对供电区域等级采用“A、B、C、D、E”五级标记。
(3)依据《工业与民用配电设备设计手册》要求,城区、近郊中压线路供电半径不宜大于3公里、6公里。在进行关联规则挖掘前,对超出相应供电半径距离的数据,标 记为“供电半径偏大”,其余的标记为“供电半径正常”。
(4)对线路所属网络的性质,分别沿用其原来的“城网”、“农网”标记。
(5)依照一般的配电网规划标准,配电网规划一般以中短期规划(5-15年)为主,对运行年限超过15年规划期限的,本实施例将其划定为“运行年限偏长”,其余的标记 为“运行年限正常”。
(6)对于无功补偿量的大小无具体的划分标准,故对无功补偿量在100Mvar以内的标记为“VC0”;补偿量在100-500Mvar之间的,标记为“VC1”;补偿量大于500Mvar的 标记为“VC2”。以便后续关联规则挖掘。
对以上离散化指标数据进行编号,如表2所示。
表2 离散化指标数据编号表
依据编号表,通过Python编程将对应的每条线路指标数据转化为相应的数组形式, 即事务数组。所有的事务数组形成事务数组集,即可用于关联规则挖掘中。
2、关联规则挖掘
将转化好的事务数组集数据导入编写好的Apriori算法之中,即可进行关联规则挖 掘,得到1~3项频繁项集及其支持度、强关联规则(Big-rules)及其置信度。本次研究使用收集、整理得到的某地区台账表数据共315条。由于重过载问题发生频率在该地区 电网中较低,因而本次研究中将Apriori算法的最小支持度设置为0.05(即5%),最小 置信度设置为0.6(即60%)。
程序输出的部分1~3项频繁项集及其支持度、强关联规则(Big-rules)及其置信度 分别展示与表3至6中。
表3 输出频繁1-项集及其支持度(部分)
表4 输出频繁2-项集及其支持度(部分)
表5 输出频繁3-项集及其支持度(部分)
表6 输出强关联规则及其置信度(重过载部分)
表中,Support、Confidence分别代表对应项集的支持度及置信度,Big Rules为程序生成的强关联规则。
基于上述流程,可以初步得到包括关于该地区配电网重过载情况在内的所有关联规 则。对所获得的的关联规则还需进一步检验其有效性及相关性。
3、关联规则相关性度量
对表6中的关联规则进行提升度(Lift)及卡方值的计算,并且由卡方分布表得到该关联规则成立的可能性(Probability)。计算结果如表7所示。
表7 强关联规则检验(重过载部分)
4、关联规则分析
由表7可知,认为规则1、2中的元素相互关联的概率分别小于5%和15%;另一方面, 根据计算出的提升度(Lift)可知,规则1、2的Lift值非常接近于1,表明这两个规 则包含的元素之间很有可能相互独立,所以剔除这两条无效关联规则。其余规则在0.05 的显著性水平下拒绝原独立假设(即计算得到的关联规则成立的可能性(Probability) 大于95%),即元素间相互关联,规则有效。
由规则3可知,有99.55%的把握认为“4”与“8”存在关联性,这意味着有99.55%的把握认为实验数据来源地区的中压配电网线路重过载情况与运行年限偏长这一因素具有强关联关系。
由规则4可知,有96.65%的把握认为“4”与“6”存在关联性,即有96.65%的把握认为实验数据来源地区的中压配电网线路重过载问题在农网中发生的可能性较大。
由规则5可知,有96.59%的把握认为“4”与“6、7”存在关联性,即有96.59%的 把握认为,在实验数据来源地区的中压配电网线路中,当线路属于农网且供电半径偏大 时,容易出现线路重过载问题。
由规则6可知,有99.77%的把握认为“4”与“6、8”存在关联性,即有99.77%的 把握认为,在实验数据来源地区的中压配电网线路中,当线路属于农网且运行年限偏长 时,容易出现线路重过载问题。
采用该方法,除了可获得该地区中压配电网线路重过载问题的主要关联因素,还可 以为改善该地区的配电网日常运维及未来的配电网规划提供指导性建议。针对规则4,一般认为城网负荷密度更大,更容易出现线路重过载情况,但实际结果恰好相反,这说 明了实际上该地区的城网的配电网规划的要素配置更加完善,降低了发生重过载问题的 可能性。因此,该地区的配电网工作人员可以结合当地情况进一步考虑农网所在地区未 来的经济发展趋势,为该地区农网的规划建设留下一定裕度,可以减少未来重过载情况 的发生。由规则6可知,有99.77%的把握认为“4”与“6、8”存在关联性,即有99.77% 的把握认为,在实验数据来源地区的中压配电网线路中,当线路属于农网且运行年限偏 长时,容易出现线路重过载问题。
本申请提供的一种配电网规划问题根源精准定位方法及系统包括收集整理由电力系 统获取的数据,形成规范的问题集;将规范的问题集转化为适用于关联算法的项集和事 件集的形式;通过上述关联算法从历年的电网收资数据中挖掘个案问题、同源问题与区域乃至涉及整个系统的系统问题之间潜在的关联关系;利用提升度和卡方检验筛选关联规则;将算法得到的强关联规则以简洁美观的形式表达。本申请整理了配电网运行过程 中已经出现或可能出现的全体问题,处理形成规范化的问题集,通过机器算法对规范化 的问题集进行全面数据挖掘,寻找各问题间可能存在的关联关系。本申请能够系统地分 析配电网规划现存问题及可能出现的问题间的联系,使规划人员能够系统、高效地对配 电网规划方面问题进行改造。
以上显示和描述了本申请的基本原理和主要特征以及本申请的优点,对于本领域技 术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看, 均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不 是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括 在本申请内。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应 当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术 人员可以理解的其他实施方式。
本申请提供的实施例之间的相似部分相互参见即可,以上提供的具体实施方式只是 本申请总的构思下的几个示例,并不构成本申请保护范围的限定。对于本领域的技术人员而言,在不付出创造性劳动的前提下依据本申请方案所扩展出的任何其他实施方式都属于本申请的保护范围。
Claims (5)
1.一种配电网规划问题根源精准定位方法,其特征在于,包括:
收集整理由电力系统获取的数据,形成规范的问题集;
将规范的问题集转化为适用于关联算法的项集和事件集的形式;
通过上述关联算法从历年的电网收资数据中挖掘个案问题、同源问题与区域乃至涉及整个系统的系统问题之间潜在的关联关系;
利用提升度和卡方检验筛选关联规则;
将算法得到的强关联规则以简洁美观的形式表达。
2.根据权利要求1所述的一种配电网规划问题根源精准定位方法,其特征在于,所述将规范的问题集转化为适用于关联算法的项集和事件集的形式的步骤包括:
以变压器的容量为基准将无功补偿容量百分比化,其中0到10%的档次设为c0,10%到20%的档次设为c1,20%到30%的档次设为c2,30%以上的档次设为c3;
以变压器的容量为基准将负载率百分比化,其中负载率在30%以下的档次设为L0,30%到50%%的档次设为L1,50%到70%%的档次设为L2,70%以上%的档次设为L3。
3.根据权利要求1所述的一种配电网规划问题根源精准定位方法,其特征在于,所述通过上述关联算法从历年的电网收资数据中挖掘个案问题、同源问题与区域乃至涉及整个系统的系统问题之间潜在的关联关系的步骤包括:
步骤1,将全体设备的可能数据项集合J={J1,J2,J3,…,Jn}作为项目集;将不同时间下的所有实测设备收资数据T={T1,T2,T3,…,Tn}作为事务集,每个实测收资数据即事务都为J的一个子集,不同事务所对应的项集可能相同;
步骤2,对于某关联规则X->Y而言,定义支持度为在整体事务集中,包含关联规则中全部项集的事务数量与全体事务数量之比,即关联规则中的全部项集同时出现的概率:
并设置最小支持度,例如support_min=0.2;
步骤3,对于关联规则X->Y而言,定义置信度为出现全部前项的条件下,同时出现前后项的概率,即同时包含X、Y的事务集,与只含X的事务集的数量比:
并设置最小置信度,例如confidence_min=0.5;
步骤4,对于n项一组的项组集Cn,定义连接步为找出Cn中所有形如(J1、J2、J3…Jn-1)、(J1、J2、J3…Jn-2)的只有最后一项不同的两个项组,分别对其求并集,得到(n+1)项一组的全体项组集Ln+1;
步骤5,对于n项一组的项组集Ln,定义剪枝步为扫描事件集,计算每个项的支持度,删去支持度低于support_min的项集,得到一个新的项组集Cn;
步骤6,对J进行剪枝步,得到C1={(Ji),i∈[1,n]},存储为1-频繁项集,其中Ji满足:
support(Ji)≥support_min
步骤7,对1-频繁项集执行连接步生成含有2项一组的候选项集L2={(Ji,Jk),i,j∈[1,n]};
步骤8,对L2执行剪枝步,得到2项一组的2-频繁项集C2;
步骤9,重复步骤7和步骤8,对新生成的项集C2依次执行连接步和剪枝步,生成新的k-频繁项集(k=3,4,…),直至无法找到(k+1)-频繁项集;
步骤10,取频繁项集Ci(i=1,2,…,k)中的一个项组作为后件,以剩余的项组作为前项,计算置信度,若该关联规则的置信度高于最小置信度,则保留该关联规则并保留该项组;
步骤11,依次取其他项组作为后件,重复步骤10,设所有被保留的项组的集合为S1,对S1执行连接步生成2-项组集S2;
步骤12,重复步骤10和步骤11,以S2中的项组为后项,剩余的项组作为前项,计算置信度和剪枝,生成Si(i=1,2,…,k),直至没有满足的置信度的组合或前项为空;
步骤13,对所有Ci(i=2,3,…,k)执行步骤10,至步骤12;
步骤14,输出所有被保留的关联规则。
4.根据权利要求1所述的一种配电网规划问题根源精准定位方法,其特征在于,所述利用提升度和卡方检验筛选关联规则的步骤包括:
对输出的关联规则进行提升度检验和卡方检验,过滤掉无效的强关联规则。
5.一种基于Apriori算法的配电网规划问题根源精准定位系统,其特征在于,包括数据输入接口、用户数据输入界面、Apriori算法计算模块、数据输出接口和用户界面,其中,
所述数据输入接口将电网运维系统和Apriori算法计算模块连接起来,被配置为从电网运维系统获得所需要的数据,所述用户数据输入界面将手动数据输入和Apriori算法计算模块连接起来,被配置为允许用户手动补充个别缺失的数据项,所述Apriori算法计算模块包含数据预处理功能,被配置为将从电网收资得来的各表格整理成规范的问题项集和事件集的形式,对整理得到的问题项集和事件项集进行数据挖掘,找出其间的关联关系,所述Apriori算法计算模块通过数据输出接口连接有用户界面,所述用户界面被配置为将算法得到的强关联规则通过简洁美观的形式向用户展示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111180020.8A CN114004457B (zh) | 2021-10-11 | 2021-10-11 | 一种配电网规划问题根源精准定位方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111180020.8A CN114004457B (zh) | 2021-10-11 | 2021-10-11 | 一种配电网规划问题根源精准定位方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114004457A true CN114004457A (zh) | 2022-02-01 |
CN114004457B CN114004457B (zh) | 2024-05-24 |
Family
ID=79922439
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111180020.8A Active CN114004457B (zh) | 2021-10-11 | 2021-10-11 | 一种配电网规划问题根源精准定位方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114004457B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103488802A (zh) * | 2013-10-16 | 2014-01-01 | 国家电网公司 | 一种基于粗糙集关联规则的超高压电网故障规则挖掘方法 |
CN104809665A (zh) * | 2015-05-14 | 2015-07-29 | 国家电网公司 | 一种基于改进Apriori算法的配电网预警方法 |
CN106126577A (zh) * | 2016-06-17 | 2016-11-16 | 北京理工大学 | 一种基于数据源划分矩阵的加权关联规则挖掘方法 |
CN107909376A (zh) * | 2017-12-05 | 2018-04-13 | 国网山东省电力公司济南供电公司 | 一种电力系统用户满意度反馈系统 |
-
2021
- 2021-10-11 CN CN202111180020.8A patent/CN114004457B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103488802A (zh) * | 2013-10-16 | 2014-01-01 | 国家电网公司 | 一种基于粗糙集关联规则的超高压电网故障规则挖掘方法 |
CN104809665A (zh) * | 2015-05-14 | 2015-07-29 | 国家电网公司 | 一种基于改进Apriori算法的配电网预警方法 |
CN106126577A (zh) * | 2016-06-17 | 2016-11-16 | 北京理工大学 | 一种基于数据源划分矩阵的加权关联规则挖掘方法 |
CN107909376A (zh) * | 2017-12-05 | 2018-04-13 | 国网山东省电力公司济南供电公司 | 一种电力系统用户满意度反馈系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114004457B (zh) | 2024-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111639237B (zh) | 一种基于聚类和关联规则挖掘的电力通信网风险评估系统 | |
Mirmozaffari | Eco-efficiency evaluation in two-stage network structure: case study: cement companies | |
CN111738462B (zh) | 电力计量装置故障抢修主动服务预警方法 | |
CN106909933A (zh) | 一种三阶段多视角特征融合的窃电分类预测方法 | |
Wu et al. | An investment decision framework for photovoltaic power coupling hydrogen storage project based on a mixed evaluation method under intuitionistic fuzzy environment | |
CN108694470A (zh) | 一种基于人工智能的数据预测方法及装置 | |
CN113282567A (zh) | 作业人员不安全行为数据库分析方法、系统、介质及应用 | |
CN114021425B (zh) | 电力系统运行数据建模与特征选择方法、装置、电子设备和存储介质 | |
CN103942739A (zh) | 建筑项目风险知识库的构建方法 | |
CN109271362A (zh) | 一种基于区块链的数据处理系统 | |
CN111105218A (zh) | 一种基于全息影像技术的配电网运行监视方法 | |
CN113421037A (zh) | 一种多源协同建设规划编制方法和装置 | |
CN114004457A (zh) | 一种配电网规划问题根源精准定位方法及系统 | |
CN112036150A (zh) | 电价政策条款解析方法、存储介质及计算机 | |
CN108108909A (zh) | 面向电力事故、误操作事故与违章操作事故的数据分析方法 | |
CN112329432B (zh) | 一种基于改进Apriori的配电网电压越限问题关联分析方法 | |
CN114693067A (zh) | 一种异常用电用户识别方法 | |
CN113064924A (zh) | 一种核电大数据经验检索与推送方法 | |
CN112052277A (zh) | 一种基于大数据的电压暂降严重度评估方法及设备 | |
CN112418600A (zh) | 一种基于指标集的企业政策评分方法及系统 | |
CN117829435B (zh) | 一种基于大数据的城市数据质量管理方法及系统 | |
Huang et al. | Research on Monitoring and Diagnosis Technology of Data Anomaly in Distribution Network | |
CN112418599B (zh) | 一种基于指标集的企业成长路径规划方法及系统 | |
CN117934209B (zh) | 一种基于知识图谱的区域电力系统碳排放大数据分析方法 | |
Zhou et al. | Construction method of tender document based on case-based reasoning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |