CN108255951A - 基于数据挖掘的中低压配电网状态估计伪量测量确定方法 - Google Patents
基于数据挖掘的中低压配电网状态估计伪量测量确定方法 Download PDFInfo
- Publication number
- CN108255951A CN108255951A CN201711369958.8A CN201711369958A CN108255951A CN 108255951 A CN108255951 A CN 108255951A CN 201711369958 A CN201711369958 A CN 201711369958A CN 108255951 A CN108255951 A CN 108255951A
- Authority
- CN
- China
- Prior art keywords
- power consumer
- user
- data
- power
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000005259 measurement Methods 0.000 title claims abstract description 24
- 238000007418 data mining Methods 0.000 title claims abstract description 17
- 238000004140 cleaning Methods 0.000 claims abstract description 9
- 239000012141 concentrate Substances 0.000 claims description 12
- 238000010276 construction Methods 0.000 claims description 10
- 238000005516 engineering process Methods 0.000 claims description 8
- 239000000203 mixture Substances 0.000 claims description 6
- 238000013461 design Methods 0.000 claims description 5
- 230000005611 electricity Effects 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 abstract description 7
- 238000004364 calculation method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- BBEAQIROQSPTKN-UHFFFAOYSA-N pyrene Chemical compound C1=CC=C2C=CC3=CC=CC4=CC=C1C2=C43 BBEAQIROQSPTKN-UHFFFAOYSA-N 0.000 description 2
- 240000002853 Nelumbo nucifera Species 0.000 description 1
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 1
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 1
- 244000131316 Panax pseudoginseng Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005108 dry cleaning Methods 0.000 description 1
- GVEPBJHOBDJJJI-UHFFFAOYSA-N fluoranthrene Natural products C1=CC(C2=CC=CC=C22)=C3C2=CC=CC3=C1 GVEPBJHOBDJJJI-UHFFFAOYSA-N 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 235000011888 snacks Nutrition 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Water Supply & Treatment (AREA)
- Computational Linguistics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于数据挖掘的中低压配电网状态估计伪量测量确定方法,属于配电网分析控制领域,包括:将城市地图划分为N个供电网格,利用网络数据采集方法收集N个供电网格内的电力用户信息,构成开源电力用户信息集;利用正则表达式对结构化数据和半结构化数据进行清洗,将非结构化数据转化为电力用户建筑信息,对清洗后的数据和电力用户建筑信息进行属性归约,得到电力用户的属性特征;根据电力用户的属性特征,利用正则表达式对电力用户进行集中等值分析,得到集中用户和不可集中用户;进而得到用户负荷功率,根据用户负荷功率得到伪量测数据。本发明有针对性地实现了数据资源的最大利用,准确高效地确定了配电网络中的伪量测量。
Description
技术领域
本发明属于配电网分析控制领域,更具体地,涉及一种基于数据挖掘的中低压配电网状态估计伪量测量确定方法。
背景技术
配电网状态估计是根据可获取的量测数据估算系统运行状态的方法,是配电网调度中心的基本功能。中低压配电网处于电力系统末端,具有地域分布广、电网规模大的特点,网络中的线路及设备数量远大于输电网,且量测设备较少,数据收集困难,因此,量测数据的获取及补充是开展中低压配电网状态估计的重要任务。
量测数据主要分为实时量测和伪量测两种,对有量测装置的节点,可以直接读取量测值,对无量测装置的节点,通常采用负荷预测或对预想事故进行仿真的方法确定其负荷功率,添加伪量测数据,使系统可观测。但以上确定伪量测量的方法需要大量电力系统内部的历史数据,数据来源有局限性。
目前,信息技术的高速发展产生了海量网络信息,催生出大数据,也使得数据来源更加广泛,形式更为多元,为增加量测盲区数据的冗余性,应充分利用快速发展的信息互联网资源,运用数据挖掘技术获取有价值的电力信息,及时补充电力负荷数据。数据挖掘的常用方法有回归分析、聚类、粗糙集和正则表达式等,但由于现代互联网应用呈现出非结构化和半结构化数据大幅度增长的特点,使通过网络获取的开源数据类型繁多,传统数据挖掘方法不再完全适用。
由此可见,现有技术存在配电网中量测数据不完备、测量结果准确率低的技术问题。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种基于数据挖掘的中低压配电网状态估计伪量测量确定方法,由此解决现有技术存在配电网中量测数据不完备、测量结果准确率低的技术问题。
为实现上述目的,本发明提供了一种基于数据挖掘的中低压配电网状态估计伪量测量确定方法,包括:
(1)将城市地图划分为N个供电网格,利用网络数据采集方法收集N个供电网格内的电力用户信息,构成开源电力用户信息集;
(2)利用正则表达式对开源电力用户信息集中的结构化数据和半结构化数据进行清洗,将开源电力用户信息集中的非结构化数据转化为电力用户建筑信息,对清洗后的数据和电力用户建筑信息进行属性归约,得到电力用户的属性特征;
(3)根据电力用户的属性特征,利用正则表达式对电力用户进行集中等值分析,得到集中用户和不可集中用户;
(4)对于集中用户,根据电力用户建筑信息得到集中用户的负荷功率;对于不可集中用户,根据设计标准确定其建筑信息,进而得到不可集中用户的负荷功率,最后根据集中用户和不可集中用户的负荷功率得到伪量测数据。
进一步的,步骤(1)的具体实现方式为:
将城市地图划分为N个供电网格,根据供电网格的顶点经纬度得到能将供电网格包含在内的圆形检索区域的搜索中心和搜索半径,通过网络地图开放平台公开的PlaceAPI在圆形检索区域内收集电力用户基本信息,电力用户基本信息包括:名称、地址、一级行业分类、二级行业分类、经纬度坐标和电话信息,利用网络爬虫技术,根据电力用户名称,收集全国企业信用信息公示系统、国家知识产权局、商标局的电力用户开源关联信息,电力用户开源关联信息包括注册资本、营业期限、经营状态、经营范围、企业类型、注册地址和统一社会信用代码,电力用户基本信息和电力用户开源关联信息组成电力用户信息,N个供电网格内的电力用户信息,构成开源电力用户信息集。
进一步的,非结构化数据为反映电力用户建筑信息的图片。
进一步的,电力用户建筑信息包括长、宽、楼层数和建筑等级。
进一步的,电力用户的属性特征包括名称、时间、空间和经济参数四类属性,所述名称类属性为名称,所述时间类属性包括营业起始年限、营业终止年限,所述空间类属性包括经度、纬度和地址,所述经济参数类属性包括一级行业分类和二级行业分类。
进一步的,步骤(3)包括:
(3a)电力用户的时间存在区间为[营业起始年限,营业终止年限],当被研究的电力用户的年份属于电力用户的时间存在区间时,该电力用户为时间存在用户;
(3b)当时间存在用户在供电网格内,则该电力用户为时空存在用户;
(3c)时空存在用户的集合构成数据集S,根据一级行业分类将S分为n类数据子集,并根据行业类别进行供电等级排序,按照供电等级由高到低排序后的数据子集依次为s1,s2,…,sn;
(3d)对于数据子集s1,基于正则表达式对电力用户的名称进行模糊匹配判断,删除名称重复的电力用户即s1中的非集中用户,得到s1中的集中用户;
(3e)对于数据子集si(i=2,…,n),根据名称类属性、空间类属性和经济参数类属性得到正关键字符和负关键字符,当数据子集si中的电力用户属性与正关键字符匹配或不与负关键字符匹配时,说明该用户为集中用户,由此得到si(i=2,…,n)中的集中用户和si(i=2,…,n)中的非集中用户,si(i=1,2,…,n)中的集中用户构成集中用户集S1;
(3f)si(i=2,…,n)中的非集中用户构成用户集si’(i=2,…,n),用正则表达式对si’(i=2,…,n)中的地址和S1中的名称进行匹配判断,匹配失败时,得到不可集中用户集S2。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
本发明提出了一种基于数据挖掘的中低压配电网状态估计伪量测量确定方法,先用网络数据采集方法获取大量电力用户信息,然后利用正则表达式对开源信息集中的各类结构数据进行预处理,随后基于正则表达式进行电力用户的集中等值分析,基于分析结果,利用由非结构化数据转换和查阅设计标准得到的建筑信息计算用户负荷功率,从而完成配电网状态估计中伪量测量的确定。本发明有效利用互联网开源信息解决配电网中的数据来源难题,根据数据特征制定相应的数据挖掘方法,有针对性地实现了数据资源的最大利用,同时兼顾电力用户的属性特征,准确高效地确定了配电网络中的伪量测量。
附图说明
图1是本发明实施例提供的一种基于数据挖掘的中低压配电网状态估计伪量测量确定方法的流程图;
图2是本发明实施例提供的数据仓库模型的示意图;
图3是本发明实施例1提供的供电网格的地图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
如图1所示,一种基于数据挖掘的中低压配电网状态估计伪量测量确定方法,包括:
(1)将城市地图划分为N个供电网格,根据供电网格的顶点经纬度得到能将供电网格包含在内的圆形检索区域的搜索中心和搜索半径,通过网络地图开放平台公开的PlaceAPI在圆形检索区域内收集电力用户基本信息,电力用户基本信息包括:名称、地址、一级行业分类、二级行业分类、经纬度坐标和电话信息,利用网络爬虫技术,根据电力用户名称,收集全国企业信用信息公示系统、国家知识产权局、商标局的电力用户开源关联信息,电力用户开源关联信息包括注册资本、营业期限、经营状态、经营范围、企业类型、注册地址和统一社会信用代码,电力用户基本信息和电力用户开源关联信息组成电力用户信息,N个供电网格内的电力用户信息,构成开源电力用户信息集。
(2)利用正则表达式对开源电力用户信息集中的结构化数据和半结构化数据进行清洗,将开源电力用户信息集中的非结构化数据转化为电力用户建筑信息,对清洗后的数据和电力用户建筑信息进行属性归约,得到电力用户的属性特征;需要说明的是,非结构化数据为反映电力用户建筑信息的图片,电力用户建筑信息包括长、宽、楼层数和建筑等级。
所述结构化数据和半结构化数据的清洗方法如下:
对于结构化数据和非结构化数据,先通过人工分析确定开源电力用户信息集中的典型数据特征,再用正则表达式的模糊匹配功能对结构化数据和非结构化数据进行特征识别,得到数据特征。以通过特殊字符连接的数据为例,数据特征识别方法具体如下:将特殊字符作为正则表达式要匹配的字符串,通过判断数据是否符合正则表达式模式,完成对数据特征的模糊匹配识别,例如:特殊字符a=“-”,数据b=“公园新村-1栋”,将a作为正则表达式,则b与a匹配成功,说明b具有以字符a连接的数据特征。
清洗为根据数据特征指定清洗策略,如表1所示。
表1 数据清洗策略
如表2所示,属性归约结果为电力用户的属性特征,包括名称、时间、空间和经济参数四种类型,所述时间类属性包括营业起始年限、营业终止年限,所述空间类属性包括经度、纬度和地址,所述经济参数类属性包括一级行业分类和二级行业分类。
表2 属性归约结果
类型 | 具体属性 |
名称 | 名称 |
时间 | 营业起始年限、营业终止年限 |
空间 | 经度、纬度、地址 |
经济参数 | 一级行业分类、二级行业分类 |
将电力用户的属性特征集成到数据仓库中,对应“电力用户负荷”主题,主题用事实表表示,并建立围绕该主题的名称维、时间维、空间维、经济参数维四个维表,每个维表都有自己的属性,如图2所示,事实表包括名称、时间、空间和经济参数,时间维包括营业起始年限和营业终止年限,空间维包括经度、纬度和地址,名称维包括名称,经济参数维包括一级行业分类和二级行业分类。
(3)根据电力用户的属性特征,利用正则表达式对电力用户进行集中等值分析,得到集中用户和不可集中用户;包括:
(3a)电力用户的时间存在区间为[营业起始年限,营业终止年限],当被研究的电力用户的年份属于电力用户的时间存在区间时,该电力用户为时间存在用户;例如,被研究的电力用户的年份为2016年,已知某用户的[营业起始年限,营业终止年限]为[2002,2022],因为2016属于[2002,2022]区间,所以认为该用户为时间存在用户;
(3b)时间存在用户的空间坐标为[经度、纬度],采用射线法判断时间存在用户的空间坐标是否在供电网格范围内,当时间存在用户在供电网格内,则该电力用户为时空存在用户;
(3c)时空存在用户的集合构成数据集S,根据一级行业分类将S分为n类数据子集,并根据行业类别进行供电等级排序,按照供电等级由高到低排序后的数据子集依次为s1,s2,…,sn;
(3d)对于数据子集s1,基于正则表达式对电力用户的名称进行模糊匹配判断,删除名称重复的电力用户即s1中的非集中用户,得到s1中的集中用户;
(3e)对于数据子集si(i=2,…,n),根据名称类属性、空间类属性和经济参数类属性得到正关键字符和负关键字符,与一级行业分类对应的正关键字符如表3所示,负关键字符如表4所示,当数据子集si中的电力用户与正关键字符匹配或不与负关键字符匹配时,说明该用户为集中用户,由此得到si(i=2,…,n)中的集中用户和si(i=2,…,n)中的非集中用户,si(i=1,2,…,n)中的集中用户构成集中用户集S1;
表3 集中用户的正关键字符
序号 | 一级行业分类 | 二级行业分类 | 名称 |
1 | 美食 | 酒店 | |
2 | 购物 | 购物中心 | |
3 | 医疗 | 医院 | |
4 | 金融 | ||
5 | 运动健身 | 体育场馆 |
表4 集中用户的负关键字符
序号 | 一级行业分类 | 二级行业分类 | 名称 | 地址 |
1 | 金融 | 自助、ATM和atm | ||
2 | 交通设施 | 公交车站、桥 | ***路(***表示数字) |
(3f)si(i=2,…,n)中的非集中用户构成用户集si’(i=2,…,n),用正则表达式对si’(i=2,…,n)中的地址和S1中的名称进行匹配判断,匹配失败时,得到不可集中用户集S2。
(4)对于集中用户,根据电力用户建筑信息得到集中用户的负荷功率;对于不可集中用户,根据设计标准确定其建筑信息,进而得到不可集中用户的负荷功率,根据配电网实际接线图、电力用户的地理坐标、集中用户的负荷功率和不可集中用户的负荷功率得到伪量测数据。
将S1中用户作为多个用户的集中等值点,利用步骤(2)得到的电力用户建筑信息,计算建筑面积,具体为:建筑面积=长*宽*楼层数;而S2中用户难以集中等值,通过查阅设计标准确定其建筑面积;通过查阅建筑电气设计规范,得到各类电力用户的单位建筑面积用电功率及需要系数,利用单位面积功率法计算用户负荷功率,用户的计算指标应与其类型相对应;
load=s*p*k
其中,load为用户负荷功率,s为建筑面积,p为单位建筑面积用电功率指标,k为需要系数。
实施例1
如图3所示,为了进一步验证本发明方法的可实现性和有效性,下面以一个商住用地供电网格为例进行说明,利用网络数据采集方法收集到的电力用户信息采集结果如表5所示。
表5 部分开源电力用户信息
通过分析开源信息集中的数据特征,对结构化和半结构化数据进行清洗,部分清洗结果如表6所示;
表6 部分清洗后的结构化和半结构化数据
一级分类 | 二级分类 | 经度 | 纬度 | 名称 | 经营状态 | 营业起始年限 | 营业终止年限 |
美食 | 茶座 | 120.54246 | 31.87469 | 菲芘酒吧 | 在业 | 2009 | 3000 |
美食 | 酒吧 | 120.54240 | 31.87476 | 友约爵士吧 | 在业 | 2000 | 3000 |
美食 | 酒吧 | 120.55229 | 31.87541 | 所以酒吧 | 在业 | 2000 | 3000 |
酒店 | 快捷酒店 | 120.54240 | 31.87476 | 华芳金陵国际酒店 | 在业 | 2002 | 2052 |
购物 | 超市 | 120.55944 | 31.87465 | 顺济超市 | 在业 | 2000 | 3000 |
购物 | 超市 | 120.55902 | 31.87474 | 嘉楠烟店 | 在业 | 2000 | 3000 |
综合利用在线测距和图像识别技术对开源信息集中的非结构化数据进行转换,本实施例中转换后的某大型写字楼的建筑信息如表7所示;
表7 某大型写字楼的建筑信息
序号 | 长度(m) | 宽度(m) | 楼层数 | 建筑等级 | 建筑数目 |
1 | 37 | 19 | 28 | 高级 | 2 |
2 | 29 | 29 | 28 | 高级 | 1 |
3 | 39 | 19 | 5 | 高级 | 1 |
4 | 42 | 13 | 5 | 高级 | 1 |
5 | 30 | 7 | 5 | 高级 | 1 |
对信息集进行属性归约后,利用正则表达式进行电力用户的集中等值分析,本实施例的部分集中等值用户如表8所示;
表8 部分集中用户
名称 | 一级行业分类 | 二级行业分类 | 经度 | 纬度 | 营业起始年限 | 营业终止年限 |
电信大厦 | 房地产 | 写字楼 | 120.5434862 | 31.87841047 | 2014 | 2017 |
国泰大厦 | 房地产 | 写字楼 | 120.5454749 | 31.87807574 | 2000 | 3000 |
华芳国际大厦 | 房地产 | 写字楼 | 120.5439175 | 31.87432437 | 2002 | 2052 |
福基大厦 | 房地产 | 写字楼 | 120.542997 | 31.87414226 | 2000 | 3000 |
范庄花苑 | 房地产 | 住宅区 | 120.552938 | 31.87354413 | 2000 | 3000 |
国泰现代城 | 房地产 | 住宅区 | 120.5493475 | 31.87681682 | 2000 | 3000 |
基于电力用户的集中等值分析结果和建筑信息计算用户负荷功率,本实施例中2016年部分用户的负荷功率值如表9所示;
表9 2016年部分用户负荷计算值
经度(°) | 纬度(°) | 名称 | 一级行业分类 | 2016年负荷值(kW) |
120.543918 | 31.874324 | 华芳国际大厦 | 房地产 | 4421.20 |
120.542997 | 31.874142 | 福基大厦 | 房地产 | 197.57 |
120.552938 | 31.873544 | 范庄花苑 | 房地产 | 9262.05 |
120.549348 | 31.876817 | 国泰现代城 | 房地产 | 974.10 |
120.544719 | 31.878430 | 中国银行(张家港支行) | 金融 | 379.39 |
120.557208 | 31.869390 | 江苏省张家港第二职业高级中学 | 教育培训 | 190.09 |
120.555404 | 31.875010 | 张家港市人民法院诉讼服务中心 | 政府机构 | 463.83 |
120.552728 | 31.871114 | 蓉城小吃店 | 美食 | 7.00 |
120.547114 | 31.876343 | 百仁堂药店公园路店 | 医疗 | 1.60 |
120.556592 | 31.875473 | 电大超市 | 购物 | 2.04 |
120.544878 | 31.874555 | 恒协干洗(国贸弄) | 生活服务 | 1.2 |
120.546957 | 31.876116 | 张家港市金宇安防科技有限公司 | 公司企业 | 1.26 |
120.556236 | 31.869728 | 新世纪车辆维修 | 汽车服务 | 1.2 |
120.545329 | 31.875930 | 搏武健身会所 | 运动健身 | 4.25 |
由表9可知,用户负荷功率与具体坐标点相对应,进一步根据配电网实际接线图和用户负荷的空间分布即可算得配电网络中的节点负荷,即伪量测量。
本发明有针对性地实现了数据资源的最大利用,同时兼顾电力负荷计算的实际指标,准确高效地确定了配电网络中的伪量测量。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种基于数据挖掘的中低压配电网状态估计伪量测量确定方法,其特征在于,包括:
(1)将城市地图划分为N个供电网格,利用网络数据采集方法收集N个供电网格内的电力用户信息,构成开源电力用户信息集;
(2)利用正则表达式对开源电力用户信息集中的结构化数据和半结构化数据进行清洗,将开源电力用户信息集中的非结构化数据转化为电力用户建筑信息,对清洗后的数据和电力用户建筑信息进行属性归约,得到电力用户的属性特征;
(3)根据电力用户的属性特征,利用正则表达式对电力用户进行集中等值分析,得到集中用户和不可集中用户;
(4)对于集中用户,根据电力用户建筑信息得到集中用户的负荷功率;对于不可集中用户,根据设计标准确定其建筑信息,进而得到不可集中用户的负荷功率,最后根据集中用户和不可集中用户的负荷功率得到伪量测数据。
2.如权利要求1所述的一种基于数据挖掘的中低压配电网状态估计伪量测量确定方法,其特征在于,所述步骤(1)的具体实现方式为:
将城市地图划分为N个供电网格,根据供电网格的顶点经纬度得到将供电网格包含在内的圆形检索区域的搜索中心和搜索半径,通过网络地图开放平台公开的Place API在圆形检索区域内收集电力用户基本信息,电力用户基本信息包括:名称、地址、一级行业分类、二级行业分类、经纬度坐标和电话信息,利用网络爬虫技术,根据电力用户名称,收集全国企业信用信息公示系统、国家知识产权局、商标局的电力用户开源关联信息,电力用户开源关联信息包括注册资本、营业期限、经营状态、经营范围、企业类型、注册地址和统一社会信用代码,电力用户基本信息和电力用户开源关联信息组成电力用户信息,N个供电网格内的电力用户信息,构成开源电力用户信息集。
3.如权利要求1或2所述的一种基于数据挖掘的中低压配电网状态估计伪量测量确定方法,其特征在于,所述非结构化数据为反映电力用户建筑信息的图片。
4.如权利要求1或2所述的一种基于数据挖掘的中低压配电网状态估计伪量测量确定方法,其特征在于,所述电力用户建筑信息包括长、宽、楼层数和建筑等级。
5.如权利要求3所述的一种基于数据挖掘的中低压配电网状态估计伪量测量确定方法,其特征在于,所述电力用户的属性特征包括名称类属性、时间类属性、空间类属性和经济参数类属性,所述名称类属性为名称,所述时间类属性包括营业起始年限、营业终止年限,所述空间类属性包括经度、纬度和地址,所述经济参数类属性包括一级行业分类和二级行业分类。
6.如权利要求5所述的一种基于数据挖掘的中低压配电网状态估计伪量测量确定方法,其特征在于,所述步骤(3)包括:
(3a)电力用户的时间存在区间为[营业起始年限,营业终止年限],当被研究的电力用户的年份属于电力用户的时间存在区间时,该电力用户为时间存在用户;
(3b)当时间存在用户在供电网格内,则该电力用户为时空存在用户;
(3c)时空存在用户的集合构成数据集S,根据一级行业分类将S分为n类数据子集,并根据行业类别进行供电等级排序,按照供电等级由高到低排序后的数据子集依次为s1,s2,…,sn;
(3d)对于数据子集s1,基于正则表达式对电力用户的名称进行模糊匹配判断,删除名称重复的电力用户即s1中的非集中用户,得到s1中的集中用户;
(3e)对于数据子集si(i=2,…,n),根据名称类属性、空间类属性和经济参数类属性得到正关键字符和负关键字符,当数据子集si中的电力用户属性与正关键字符匹配或不与负关键字符匹配时,说明该用户为集中用户,由此得到si(i=2,…,n)中的集中用户和si(i=2,…,n)中的非集中用户,si(i=1,2,…,n)中的集中用户构成集中用户集S1;
(3f)si(i=2,…,n)中的非集中用户构成用户集si’(i=2,…,n),用正则表达式对si’(i=2,…,n)中的地址和S1中的名称进行匹配判断,匹配失败时,得到不可集中用户集S2。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711369958.8A CN108255951B (zh) | 2017-12-18 | 2017-12-18 | 基于数据挖掘的中低压配电网状态估计伪量测量确定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711369958.8A CN108255951B (zh) | 2017-12-18 | 2017-12-18 | 基于数据挖掘的中低压配电网状态估计伪量测量确定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108255951A true CN108255951A (zh) | 2018-07-06 |
CN108255951B CN108255951B (zh) | 2021-10-08 |
Family
ID=62723016
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711369958.8A Active CN108255951B (zh) | 2017-12-18 | 2017-12-18 | 基于数据挖掘的中低压配电网状态估计伪量测量确定方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108255951B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101964525A (zh) * | 2010-06-25 | 2011-02-02 | 清华大学 | 一种支持大规模电流量测的配电网状态估计方法 |
CN102969710A (zh) * | 2012-11-07 | 2013-03-13 | 中国电力科学研究院 | 一种不完全信息下的配电网节点负荷虚拟量测方法 |
CN103336891A (zh) * | 2013-06-09 | 2013-10-02 | 广东电网公司佛山供电局 | 一种用于配电网状态估计的伪量测生成方法 |
US20140244189A1 (en) * | 2013-02-27 | 2014-08-28 | Bigwood Technology, Inc. | System For Achieving Real-Time Monitoring and State Estimation in Power Distribution Networks |
CN104537233A (zh) * | 2014-12-23 | 2015-04-22 | 国家电网公司 | 一种基于核密度估计的配电网伪量测生成方法 |
WO2016078477A1 (zh) * | 2014-11-18 | 2016-05-26 | 国电南瑞科技股份有限公司 | 一种变电站三相线性广义状态估计方法 |
CN105633956A (zh) * | 2016-02-19 | 2016-06-01 | 河海大学 | 一种基于Spiking神经网络伪量测建模的配电网三相状态估计方法 |
CN106374497A (zh) * | 2016-10-20 | 2017-02-01 | 天津大学 | 基于ami的中低压混合配电网一体化状态估计方法 |
CN106655152A (zh) * | 2016-10-11 | 2017-05-10 | 天津大学 | 一种基于ami量测特性的配电网状态估计方法 |
CN107169878A (zh) * | 2017-04-12 | 2017-09-15 | 华中科技大学 | 一种基于开源信息自主收集空间负荷基础数据的方法 |
-
2017
- 2017-12-18 CN CN201711369958.8A patent/CN108255951B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101964525A (zh) * | 2010-06-25 | 2011-02-02 | 清华大学 | 一种支持大规模电流量测的配电网状态估计方法 |
CN102969710A (zh) * | 2012-11-07 | 2013-03-13 | 中国电力科学研究院 | 一种不完全信息下的配电网节点负荷虚拟量测方法 |
US20140244189A1 (en) * | 2013-02-27 | 2014-08-28 | Bigwood Technology, Inc. | System For Achieving Real-Time Monitoring and State Estimation in Power Distribution Networks |
CN103336891A (zh) * | 2013-06-09 | 2013-10-02 | 广东电网公司佛山供电局 | 一种用于配电网状态估计的伪量测生成方法 |
WO2016078477A1 (zh) * | 2014-11-18 | 2016-05-26 | 国电南瑞科技股份有限公司 | 一种变电站三相线性广义状态估计方法 |
CN104537233A (zh) * | 2014-12-23 | 2015-04-22 | 国家电网公司 | 一种基于核密度估计的配电网伪量测生成方法 |
CN105633956A (zh) * | 2016-02-19 | 2016-06-01 | 河海大学 | 一种基于Spiking神经网络伪量测建模的配电网三相状态估计方法 |
CN106655152A (zh) * | 2016-10-11 | 2017-05-10 | 天津大学 | 一种基于ami量测特性的配电网状态估计方法 |
CN106374497A (zh) * | 2016-10-20 | 2017-02-01 | 天津大学 | 基于ami的中低压混合配电网一体化状态估计方法 |
CN107169878A (zh) * | 2017-04-12 | 2017-09-15 | 华中科技大学 | 一种基于开源信息自主收集空间负荷基础数据的方法 |
Non-Patent Citations (4)
Title |
---|
EFTHYMIOS MANITSAS 等: "Modelling of pseudo-measurements for distribution system state estimation", 《CIRED SEMINAR 2008: SMARTGRIDS FOR DISTRIBUTION》 * |
F. ADINOLFI 等: "Pseudo-Measurements Modeling Using", 《IEEE PES INNOVATIVE SMART GRID TECHNOLOGIES, EUROPE》 * |
侯雨伸 等: "计及 AMI 的配网分层状态估计及伪量测计算", 《电力系统及其自动化学报》 * |
张勇: "智能电网调度控制系统实时监控与预警功能规范解读", 《中国电力》 * |
Also Published As
Publication number | Publication date |
---|---|
CN108255951B (zh) | 2021-10-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lee et al. | The analytic hierarchy process (AHP) approach for assessment of urban renewal proposals | |
Liu et al. | Approximating betweenness centrality to identify key nodes in a weighted urban complex transportation network | |
CN110135092A (zh) | 基于半局部中心性的复杂加权交通网关键节点识别方法 | |
CN110033048A (zh) | 一种轨道交通关键节点及关键路段识别方法 | |
CN108009972A (zh) | 一种基于多源数据校核的多方式出行o-d需求估计方法 | |
CN109299811A (zh) | 一种基于复杂网络的欺诈团伙识别和风险传播预测的方法 | |
CN108133302A (zh) | 一种基于大数据的公共自行车潜在需求预测方法 | |
CN106097222A (zh) | 顾及用户特征的公共设施空间可达性分析方法及装置 | |
Ding et al. | Accessibility measure of bus transit networks | |
CN107145991A (zh) | 一种考虑路段相关性的时变随机网络动态路径搜索方法 | |
Motieyan et al. | A novel spatial index using spatial analyses and hierarchical fuzzy expert system for obtaining green TOD: a case study in Tehran city | |
Venerandi et al. | City form and well-being: what makes London neighborhoods good places to live? | |
Geng et al. | Geographically Weighted Regression model (GWR) based spatial analysis of house price in Shenzhen | |
Wang et al. | Discovering the evolution of Beijing Rail Network in fifty years | |
CN108255951A (zh) | 基于数据挖掘的中低压配电网状态估计伪量测量确定方法 | |
Peixoto et al. | Mining trajectory data | |
Wei et al. | Improved approach for forecasting extra-peak hourly subway ridership at station-level based on LASSO | |
Zhang et al. | Analysis of multiple network accessibilities and commercial space use in metro station areas: An empirical case study of Shanghai, China | |
Li et al. | Geographically stratified importance sampling for the calibration of aggregated destination choice models for trip distribution | |
Wu et al. | Spatio-temporal analysis of urban spatial interaction in globalizing China—A case study of Beijing-Shanghai corridor | |
Power et al. | Scenario planning case studies using open government data | |
Bansal et al. | Analyzing civic complaints for proactive maintenance in smart city | |
Anzai et al. | Finding" retro" places in Japan: crowd-sourced urban ambience estimation | |
Huang et al. | Short-term traffic flow combined forecasting based on nonparametric regression | |
Venerandi | A Quantitative Method to Study the Relationship between Urban Form and City Liveability Indexes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |