CN109145035A - 一种基于数据挖掘的电网数据处理方法 - Google Patents

一种基于数据挖掘的电网数据处理方法 Download PDF

Info

Publication number
CN109145035A
CN109145035A CN201810863335.4A CN201810863335A CN109145035A CN 109145035 A CN109145035 A CN 109145035A CN 201810863335 A CN201810863335 A CN 201810863335A CN 109145035 A CN109145035 A CN 109145035A
Authority
CN
China
Prior art keywords
data
processing method
data processing
grid
grid data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810863335.4A
Other languages
English (en)
Other versions
CN109145035B (zh
Inventor
王继业
魏晓菁
辛永
曾楠
黄文思
郝悍勇
章剑涛
罗义旺
李金湖
冯涛
徐勋建
许梓明
张毅琦
刘燕秋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Information and Telecommunication Co Ltd
State Grid Hunan Electric Power Co Ltd
Disaster Prevention and Mitigation Center of State Grid Hunan Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Information and Telecommunication Co Ltd
State Grid Hunan Electric Power Co Ltd
Disaster Prevention and Mitigation Center of State Grid Hunan Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Information and Telecommunication Co Ltd, State Grid Hunan Electric Power Co Ltd, Disaster Prevention and Mitigation Center of State Grid Hunan Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201810863335.4A priority Critical patent/CN109145035B/zh
Publication of CN109145035A publication Critical patent/CN109145035A/zh
Application granted granted Critical
Publication of CN109145035B publication Critical patent/CN109145035B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E40/00Technologies for an efficient electrical power generation, transmission or distribution
    • Y02E40/70Smart grids as climate change mitigation technology in the energy generation sector
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于数据挖掘的电网数据处理方法,包括以下步骤:步骤S100,接收输入数据,所述输入数据为描述待处理区域网格中与电网数据关联的m个参数集合;步骤S200,获得N个存储数据;步骤S300,将接收到的输入数据和获得的N个存储数据进行处理;步骤S400,分别计算处理后的输入数据与处理后的N个存储数据之间的相离度;步骤S500,根据计算出的相离度的值,向用户呈现结果。

Description

一种基于数据挖掘的电网数据处理方法
技术领域
本发明属于大数据挖掘及信息检索领域,尤其涉及一种基于数据挖掘的电网数据处理方法。
背景技术
随着电力业务的发展,电力用户规模迅速扩张,电力系统积累了大量的用户用电相关数据,包括用户的基本信息、历史用电信息等数据。利用这些数据,可以估算出中大型用电用户的相似性,从而为电力设施的配置和电力能源的调节提供预测依据。例如,对于一个新的建成区域,可以根据积累的数据,检索与之类似区域的电力设施配置和历史用电量,从而预测新建区域应当给予的电力设施配置和未来可能出现的用电量情况,并为将来的电力调度提供参考依据。申请号为201710820581.7的中国发明专利介绍了一种基于向量相似度的用户信息检索方法,其通过计算相似度来检索与用户信息相近似的已存在的用户信息。
但是,现有的关于用户同一性的估算方法较为粗放,对于累计数据的利用也不是特别全面,利用率较低,导致用户同一性的检索结果不够准确,无法满足电力设施配置和电力调配的精细化要求。
发明内容
为克服上述问题,本发明提供了一种基于数据挖掘的电网数据处理方法,包括以下步骤:步骤S100,接收输入数据,所述输入数据为描述待处理区域网格中与电网数据关联的m个参数集合;步骤S200,获得N个存储数据;步骤S300,将接收到的输入数据和获得的N个存储数据进行处理;步骤S400,分别计算处理后的输入数据与处理后的N个存储数据之间的相离度;步骤S500,根据计算出的相离度的值,向用户呈现结果。
根据本发明的方法,能够有效检索获知与新建地区的各类信息基本相同的已经存在的地区用电信息,从而通过为新建地区配置基本相同的电力设施来提升电力调配的准确性和效率。
附图说明
图1是根据本发明的基于数据挖掘的电网数据处理方法的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,将结合附图对本发明作进一步地详细描述。这种描述是通过示例而非限制的方式介绍了与本发明的原理相一致的具体实施方式,这些实施方式的描述是足够详细的,以使得本领域技术人员能够实践本发明,在不脱离本发明的范围和精神的情况下可以使用其他实施方式并且可以改变和/或替换各要素的结构。因此,不应当从限制性意义上来理解以下的详细描述。为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体图示,进一步阐述本发明。
如图1所示,本发明提供了一种基于数据挖掘的电网数据处理方法,包括以下步骤:
步骤S100,接收输入数据,所述输入数据为描述待处理区域网格中与电网数据关联的m个参数集合F0={F01,F02,...,F0m}。根据本发明的一个方面,待处理区域网格为通过地理坐标围栏形成的区域,其形状可以为规则的矩形,也可以为不规则的多边形。本领域技术人员知晓,区域网格的具体形状并不影响本发明的保护范围。进一步优选的,电网数据关联的参数为区域网格内能够直接或者间接影响电网用电量的参数,本发明并不意图限制参数的来源、存储方式与获取方式,即本领域技术人员能够利用现有技术中的任一方式获得参数,例如根据历史经验获取参数、根据德尔菲法获得参数、根据人工智能算法从历史数据中解析获得参数等。在一个示例性的实施方式中,所述参数包括,网格区域内的人口、网格区域面积、网格区域中的大型工业企业数量、网格区域中的特定设施等各类参数,其中特定设施是指包括医院在内的对供电有特殊需求的场所。对应的,该输入数据的形式可以为F0={30万人,30平方公里,5个,1个......},或F0={F01,F02,...,F0m},其中m为大于等于2的正整数。本领域技术人员应该知晓,上述实施方式中的参数仅在于方便本领域技术人员更好的理解本发明,而并非意味着本发明中使用的参数被限制为上述参数。
步骤S200,获得N个存储数据F1、F2、…、FN,其中Fi={Fi1,Fi2,...,Fim}为第i个存储数据,其描述已存储的第i个区域网格中与电网数据关联的m个参数集合;其中N为大于等于2的正整数,i的取值范围为从1至N。所述N个存储数据可以存储在任一种形式的数据库或服务器中,优选的,存储在云端的分布式数据库中。
步骤S300,将接收到的输入数据和获得的N个存储数据进行处理,形成处理后的输入数据F0'={F'01,F'02,...,F'0m}和处理后的N个存储数据F1’、F2’、…、FN’,其中Fi'={F'i1,F'i2,...,F'im}。具体而言,将数据中的各个不同单位不同大小的参数进行处理,以便在后续步骤中进行相离度的比较。例如,使用如下公式进行这种处理,F'ij=Fij/Fmaxj,此处,当i为0时,即是对输入数据进行处理,当i为1至N时,即是对获得的N个存储数据进行处理,其中,Fmaxj=max(F0j,F1j,...,FNj),j的取值范围是从1到m,即取某类参数中的最大值。需要注意的是,如果某类参数之间的差异过大,上述处理方式将会使得数值过小,从而影响后续的相离度比较的精确性。例如,地区人口的最大值为30万人,而某地区的人口为3000人,则Fij′=0.01。在此情况下,应当依据之前验证过的小规模数据的经验阈值对数据进行另一种方式的处理。例如,当Fmaxj/Fminj>λ时,则表示参数之间差异过大,那么F'ij=2/πarctanFij,其中λ表示经验阈值,其为大于等于20且小于等于40的整数,优选为30;其中Fminj=min(F0j,F1j,...,FNj)是各项数据中的最小值;当Fmaxj/Fminj≤λ时,那么F'ij=Fij/Fmaxj。通过这种方式,可以降低参数差异过大对相离度判断的影响。依然以上面的情况为例,当地区人口最大值为30万人而最小值为3000人时,Fmaxj/Fminj>λ=30,那么,地区人口为5万人的Fij′=2/πarctanFij=2/πarctan50000。本领域技术人员可以了解,经验阈值λ可以随着数据规模的扩大和经验的增加进行动态调整。
步骤S400,分别计算F0’与处理后的N个存储数据F1’、F2’、…、FN’之间的相离度。具体而言,F0’与Fi’之间的相离度
步骤S500,根据计算出的相离度,向用户呈现或推荐计算结果。在该步骤中,可以向用户呈现相离度值θ最小的结果,或者按照相离度值θ呈现用户指定数量的若干结果,或者呈现小于某阈值的所有结果;所述呈现结果包括显示存储数据中的各类信息或参数,例如显示地区名称、电力设施的配置情况等等。
根据本发明,本领域技术人员显然能够理解输入数据和存储数据中的参数不仅仅限定于前述的地区人口、地区面积等若干个参数,而且也可以将现在并不知晓或使用的参数,而在将来知晓或使用的参数也加入其中,以动态更新参数并获得适用于未来的相似度估算以及检索结果。
此外,根据公开的本发明的说明书,本发明的其他实现对于本领域的技术人员是明显的。实施方式和/或实施方式的各个方面可以单独或者以任何组合用于本发明的系统和方法中。说明书和其中的示例应该是仅仅看作示例性,本发明的实际范围和精神由所附权利要求书表示。

Claims (10)

1.一种基于数据挖掘的电网数据处理方法,其特征在于,包括以下步骤:
步骤S100,接收输入数据,所述输入数据为描述待处理区域网格中与电网数据关联的m个参数集合F0={F01,F02,...,F0m},m为大于等于2的正整数;
步骤S200,获得N个存储数据F1、F2、…、FN,其中Fi={Fi1,Fi2,...,Fim}为第i个存储数据,其描述已存储的第i个区域网格中与电网数据关联的m个参数集合;其中N为大于等于2的正整数,i的取值范围为从1至N;
步骤S300,将接收到的输入数据和获得的N个存储数据进行处理,形成处理后的输入数据F0'={F'01,F'02,...,F'0m}和处理后的N个存储数据F1’、F2’、…、FN’,其中Fi'={F'i1,F'i2,...,F'im};
步骤S400,分别计算F0’与处理后的N个存储数据F1’、F2’、…、FN’之间的相离度;
步骤S500,根据计算出的相离度的值,向用户呈现结果。
2.根据权利要求1所述的电网数据处理方法,其特征在于,所述步骤S300中,对接收到的输入数据和获得的N个存储数据进行处理具体包括:
步骤S310,如果Fmaxj/Fminj>λ,那么F'ij=2/πarctanFij
步骤S320,如果Fmaxj/Fminj≤λ,那么F'ij=Fij/Fmaxj
其中,Fmaxj=max(F0j,F1j,...,FNj),Fminj=min(F0j,F1j,...,FNj),λ为预设的第一阈值,j的取值范围为从1至m。
3.根据权利要求2所述的电网数据处理方法,其特征在于,所述步骤S400中,F0'={F'01,F'02,...,F'0m}与Fi'={F'i1,F'i2,...,F'im}之间的相离度为θi;
其中,
4.根据权利要求3所述的电网数据处理方法,其特征在于,所述第一阈值为大于等于20小于等于40的整数(例如,优选30)。
5.根据权利要求4所述的电网数据处理方法,其特征在于,所述第一阈值等于30。
6.根据权利要求3所述的电网数据处理方法,其特征在于,所述第一阈值可以动态调整。
7.根据权利要求6所述的电网数据处理方法,其特征在于,所述步骤S500是向用户呈现相离度的值最小的结果。
8.根据权利要求6所述的电网数据处理方法,其特征在于,所述步骤S500按照相离度值从小到大向用户呈现用户指定数量的结果。
9.根据权利要求6所述的电网数据处理方法,其特征在于,所述步骤S500仅向用户呈现相离度值小于指定阈值的结果。
10.根据权利要求6所述的电网数据处理方法,其特征在于,所述步骤S500中,呈现结果包括显示存储数据中的各类信息或参数。
CN201810863335.4A 2018-08-01 2018-08-01 一种基于数据挖掘的电网数据处理方法 Active CN109145035B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810863335.4A CN109145035B (zh) 2018-08-01 2018-08-01 一种基于数据挖掘的电网数据处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810863335.4A CN109145035B (zh) 2018-08-01 2018-08-01 一种基于数据挖掘的电网数据处理方法

Publications (2)

Publication Number Publication Date
CN109145035A true CN109145035A (zh) 2019-01-04
CN109145035B CN109145035B (zh) 2021-04-13

Family

ID=64799335

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810863335.4A Active CN109145035B (zh) 2018-08-01 2018-08-01 一种基于数据挖掘的电网数据处理方法

Country Status (1)

Country Link
CN (1) CN109145035B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111833207A (zh) * 2020-07-03 2020-10-27 南京上古网络科技有限公司 一种基于多能耦合的综合能源管理系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014204336A1 (en) * 2013-06-18 2014-12-24 Abbyy Development Llс Methods and systems that build a hierarchically organized data structure containing standard feature symbols for conversion of document images to electronic documents
CN105184523A (zh) * 2015-11-05 2015-12-23 国网山西省电力公司大同供电公司 基于cart决策树的电网运行方式数据挖掘方法及系统
CN106383837A (zh) * 2016-08-30 2017-02-08 国网天津市电力公司 一种用能大数据获取关键价值抽取的方法
CN107679105A (zh) * 2017-09-13 2018-02-09 国网信通亿力科技有限责任公司 一种基于向量相似度的用户信息检索方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014204336A1 (en) * 2013-06-18 2014-12-24 Abbyy Development Llс Methods and systems that build a hierarchically organized data structure containing standard feature symbols for conversion of document images to electronic documents
CN105184523A (zh) * 2015-11-05 2015-12-23 国网山西省电力公司大同供电公司 基于cart决策树的电网运行方式数据挖掘方法及系统
CN106383837A (zh) * 2016-08-30 2017-02-08 国网天津市电力公司 一种用能大数据获取关键价值抽取的方法
CN107679105A (zh) * 2017-09-13 2018-02-09 国网信通亿力科技有限责任公司 一种基于向量相似度的用户信息检索方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111833207A (zh) * 2020-07-03 2020-10-27 南京上古网络科技有限公司 一种基于多能耦合的综合能源管理系统及方法
CN111833207B (zh) * 2020-07-03 2024-02-02 南京上古网络科技有限公司 一种基于多能耦合的综合能源管理系统及方法

Also Published As

Publication number Publication date
CN109145035B (zh) 2021-04-13

Similar Documents

Publication Publication Date Title
Geng et al. Hybridization of seasonal chaotic cloud simulated annealing algorithm in a SVR-based load forecasting model
WO2011130348A3 (en) Method and system for facial recognition applications including avatar support
CN113159329B (zh) 模型训练方法、装置、设备及存储介质
CN109063041B (zh) 关系网络图嵌入的方法及装置
EP4276487A2 (en) Generating wireless network access point models using clustering techniques
Nagano et al. High-performing heuristics to minimize flowtime in no-idle permutation flowshop
CN114841364A (zh) 一种满足个性化本地差分隐私需求的联邦学习方法
Andriani et al. The application of differential equation of Verhulst population model on estimation of Bandar Lampung population
JPWO2016001998A1 (ja) 類似度算出システム、類似度算出方法およびプログラム
CN107862416B (zh) 一种基于盒子不确定集的应急物资储备库选址优化方法
CN107818474B (zh) 一种用于动态调整产品价格的方法和装置
CN110598252A (zh) 家具布局的方法、装置、电子设备及存储介质
CN109002928A (zh) 一种基于贝叶斯网络模型的电力负荷峰值预测方法和装置
Saji et al. Discrete bat-inspired algorithm for travelling salesman problem
CN109145035B (zh) 一种基于数据挖掘的电网数据处理方法
CN112257868A (zh) 构建和训练用于预测客流量的集成预测模型的方法及装置
CN114676583A (zh) 用电对象的能耗预测方法、装置、电子设备和存储介质
CN110197078B (zh) 数据处理方法、装置、计算机可读介质及电子设备
US20160274609A1 (en) Classifying utility consumption of consumers
CN113055423B (zh) 策略的推送方法、策略的执行方法、装置、设备及介质
Shao et al. Traffic accident time series prediction model based on combination of arima and bp and svm
CN106777304B (zh) 主题的推送方法及装置
Fan et al. Dynamic textures clustering using a hierarchical pitman-yor process mixture of dirichlet distributions
Jun et al. A new method of group information recommendation based on the user dynamic profile information optimization
Basnayake et al. Enhanced convex hull based clustering for high population density avoidance under d2d enabled network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant