CN109145035A - 一种基于数据挖掘的电网数据处理方法 - Google Patents
一种基于数据挖掘的电网数据处理方法 Download PDFInfo
- Publication number
- CN109145035A CN109145035A CN201810863335.4A CN201810863335A CN109145035A CN 109145035 A CN109145035 A CN 109145035A CN 201810863335 A CN201810863335 A CN 201810863335A CN 109145035 A CN109145035 A CN 109145035A
- Authority
- CN
- China
- Prior art keywords
- data
- processing method
- power grid
- data processing
- degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 17
- 238000007418 data mining Methods 0.000 title claims abstract description 8
- 230000005611 electricity Effects 0.000 description 6
- 238000000034 method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 241001269238 Data Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013278 delphi method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E40/00—Technologies for an efficient electrical power generation, transmission or distribution
- Y02E40/70—Smart grids as climate change mitigation technology in the energy generation sector
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于数据挖掘的电网数据处理方法,包括以下步骤:步骤S100,接收输入数据,所述输入数据为描述待处理区域网格中与电网数据关联的m个参数集合;步骤S200,获得N个存储数据;步骤S300,将接收到的输入数据和获得的N个存储数据进行处理;步骤S400,分别计算处理后的输入数据与处理后的N个存储数据之间的相离度;步骤S500,根据计算出的相离度的值,向用户呈现结果。
Description
技术领域
本发明属于大数据挖掘及信息检索领域,尤其涉及一种基于数据挖掘的电网数据处理方法。
背景技术
随着电力业务的发展,电力用户规模迅速扩张,电力系统积累了大量的用户用电相关数据,包括用户的基本信息、历史用电信息等数据。利用这些数据,可以估算出中大型用电用户的相似性,从而为电力设施的配置和电力能源的调节提供预测依据。例如,对于一个新的建成区域,可以根据积累的数据,检索与之类似区域的电力设施配置和历史用电量,从而预测新建区域应当给予的电力设施配置和未来可能出现的用电量情况,并为将来的电力调度提供参考依据。申请号为201710820581.7的中国发明专利介绍了一种基于向量相似度的用户信息检索方法,其通过计算相似度来检索与用户信息相近似的已存在的用户信息。
但是,现有的关于用户同一性的估算方法较为粗放,对于累计数据的利用也不是特别全面,利用率较低,导致用户同一性的检索结果不够准确,无法满足电力设施配置和电力调配的精细化要求。
发明内容
为克服上述问题,本发明提供了一种基于数据挖掘的电网数据处理方法,包括以下步骤:步骤S100,接收输入数据,所述输入数据为描述待处理区域网格中与电网数据关联的m个参数集合;步骤S200,获得N个存储数据;步骤S300,将接收到的输入数据和获得的N个存储数据进行处理;步骤S400,分别计算处理后的输入数据与处理后的N个存储数据之间的相离度;步骤S500,根据计算出的相离度的值,向用户呈现结果。
根据本发明的方法,能够有效检索获知与新建地区的各类信息基本相同的已经存在的地区用电信息,从而通过为新建地区配置基本相同的电力设施来提升电力调配的准确性和效率。
附图说明
图1是根据本发明的基于数据挖掘的电网数据处理方法的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,将结合附图对本发明作进一步地详细描述。这种描述是通过示例而非限制的方式介绍了与本发明的原理相一致的具体实施方式,这些实施方式的描述是足够详细的,以使得本领域技术人员能够实践本发明,在不脱离本发明的范围和精神的情况下可以使用其他实施方式并且可以改变和/或替换各要素的结构。因此,不应当从限制性意义上来理解以下的详细描述。为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体图示,进一步阐述本发明。
如图1所示,本发明提供了一种基于数据挖掘的电网数据处理方法,包括以下步骤:
步骤S100,接收输入数据,所述输入数据为描述待处理区域网格中与电网数据关联的m个参数集合F0={F01,F02,...,F0m}。根据本发明的一个方面,待处理区域网格为通过地理坐标围栏形成的区域,其形状可以为规则的矩形,也可以为不规则的多边形。本领域技术人员知晓,区域网格的具体形状并不影响本发明的保护范围。进一步优选的,电网数据关联的参数为区域网格内能够直接或者间接影响电网用电量的参数,本发明并不意图限制参数的来源、存储方式与获取方式,即本领域技术人员能够利用现有技术中的任一方式获得参数,例如根据历史经验获取参数、根据德尔菲法获得参数、根据人工智能算法从历史数据中解析获得参数等。在一个示例性的实施方式中,所述参数包括,网格区域内的人口、网格区域面积、网格区域中的大型工业企业数量、网格区域中的特定设施等各类参数,其中特定设施是指包括医院在内的对供电有特殊需求的场所。对应的,该输入数据的形式可以为F0={30万人,30平方公里,5个,1个......},或F0={F01,F02,...,F0m},其中m为大于等于2的正整数。本领域技术人员应该知晓,上述实施方式中的参数仅在于方便本领域技术人员更好的理解本发明,而并非意味着本发明中使用的参数被限制为上述参数。
步骤S200,获得N个存储数据F1、F2、…、FN,其中Fi={Fi1,Fi2,...,Fim}为第i个存储数据,其描述已存储的第i个区域网格中与电网数据关联的m个参数集合;其中N为大于等于2的正整数,i的取值范围为从1至N。所述N个存储数据可以存储在任一种形式的数据库或服务器中,优选的,存储在云端的分布式数据库中。
步骤S300,将接收到的输入数据和获得的N个存储数据进行处理,形成处理后的输入数据F0'={F'01,F'02,...,F'0m}和处理后的N个存储数据F1’、F2’、…、FN’,其中Fi'={F'i1,F'i2,...,F'im}。具体而言,将数据中的各个不同单位不同大小的参数进行处理,以便在后续步骤中进行相离度的比较。例如,使用如下公式进行这种处理,F'ij=Fij/Fmaxj,此处,当i为0时,即是对输入数据进行处理,当i为1至N时,即是对获得的N个存储数据进行处理,其中,Fmaxj=max(F0j,F1j,...,FNj),j的取值范围是从1到m,即取某类参数中的最大值。需要注意的是,如果某类参数之间的差异过大,上述处理方式将会使得数值过小,从而影响后续的相离度比较的精确性。例如,地区人口的最大值为30万人,而某地区的人口为3000人,则Fij′=0.01。在此情况下,应当依据之前验证过的小规模数据的经验阈值对数据进行另一种方式的处理。例如,当Fmaxj/Fminj>λ时,则表示参数之间差异过大,那么F'ij=2/πarctanFij,其中λ表示经验阈值,其为大于等于20且小于等于40的整数,优选为30;其中Fminj=min(F0j,F1j,...,FNj)是各项数据中的最小值;当Fmaxj/Fminj≤λ时,那么F'ij=Fij/Fmaxj。通过这种方式,可以降低参数差异过大对相离度判断的影响。依然以上面的情况为例,当地区人口最大值为30万人而最小值为3000人时,Fmaxj/Fminj>λ=30,那么,地区人口为5万人的Fij′=2/πarctanFij=2/πarctan50000。本领域技术人员可以了解,经验阈值λ可以随着数据规模的扩大和经验的增加进行动态调整。
步骤S400,分别计算F0’与处理后的N个存储数据F1’、F2’、…、FN’之间的相离度。具体而言,F0’与Fi’之间的相离度
步骤S500,根据计算出的相离度,向用户呈现或推荐计算结果。在该步骤中,可以向用户呈现相离度值θ最小的结果,或者按照相离度值θ呈现用户指定数量的若干结果,或者呈现小于某阈值的所有结果;所述呈现结果包括显示存储数据中的各类信息或参数,例如显示地区名称、电力设施的配置情况等等。
根据本发明,本领域技术人员显然能够理解输入数据和存储数据中的参数不仅仅限定于前述的地区人口、地区面积等若干个参数,而且也可以将现在并不知晓或使用的参数,而在将来知晓或使用的参数也加入其中,以动态更新参数并获得适用于未来的相似度估算以及检索结果。
此外,根据公开的本发明的说明书,本发明的其他实现对于本领域的技术人员是明显的。实施方式和/或实施方式的各个方面可以单独或者以任何组合用于本发明的系统和方法中。说明书和其中的示例应该是仅仅看作示例性,本发明的实际范围和精神由所附权利要求书表示。
Claims (10)
1.一种基于数据挖掘的电网数据处理方法,其特征在于,包括以下步骤:
步骤S100,接收输入数据,所述输入数据为描述待处理区域网格中与电网数据关联的m个参数集合F0={F01,F02,...,F0m},m为大于等于2的正整数;
步骤S200,获得N个存储数据F1、F2、…、FN,其中Fi={Fi1,Fi2,...,Fim}为第i个存储数据,其描述已存储的第i个区域网格中与电网数据关联的m个参数集合;其中N为大于等于2的正整数,i的取值范围为从1至N;
步骤S300,将接收到的输入数据和获得的N个存储数据进行处理,形成处理后的输入数据F0'={F'01,F'02,...,F'0m}和处理后的N个存储数据F1’、F2’、…、FN’,其中Fi'={F'i1,F'i2,...,F'im};
步骤S400,分别计算F0’与处理后的N个存储数据F1’、F2’、…、FN’之间的相离度;
步骤S500,根据计算出的相离度的值,向用户呈现结果。
2.根据权利要求1所述的电网数据处理方法,其特征在于,所述步骤S300中,对接收到的输入数据和获得的N个存储数据进行处理具体包括:
步骤S310,如果Fmaxj/Fminj>λ,那么F'ij=2/πarctanFij;
步骤S320,如果Fmaxj/Fminj≤λ,那么F'ij=Fij/Fmaxj;
其中,Fmaxj=max(F0j,F1j,...,FNj),Fminj=min(F0j,F1j,...,FNj),λ为预设的第一阈值,j的取值范围为从1至m。
3.根据权利要求2所述的电网数据处理方法,其特征在于,所述步骤S400中,F0'={F'01,F'02,...,F'0m}与Fi'={F'i1,F'i2,...,F'im}之间的相离度为θi;
其中,
4.根据权利要求3所述的电网数据处理方法,其特征在于,所述第一阈值为大于等于20小于等于40的整数(例如,优选30)。
5.根据权利要求4所述的电网数据处理方法,其特征在于,所述第一阈值等于30。
6.根据权利要求3所述的电网数据处理方法,其特征在于,所述第一阈值可以动态调整。
7.根据权利要求6所述的电网数据处理方法,其特征在于,所述步骤S500是向用户呈现相离度的值最小的结果。
8.根据权利要求6所述的电网数据处理方法,其特征在于,所述步骤S500按照相离度值从小到大向用户呈现用户指定数量的结果。
9.根据权利要求6所述的电网数据处理方法,其特征在于,所述步骤S500仅向用户呈现相离度值小于指定阈值的结果。
10.根据权利要求6所述的电网数据处理方法,其特征在于,所述步骤S500中,呈现结果包括显示存储数据中的各类信息或参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810863335.4A CN109145035B (zh) | 2018-08-01 | 2018-08-01 | 一种基于数据挖掘的电网数据处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810863335.4A CN109145035B (zh) | 2018-08-01 | 2018-08-01 | 一种基于数据挖掘的电网数据处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109145035A true CN109145035A (zh) | 2019-01-04 |
CN109145035B CN109145035B (zh) | 2021-04-13 |
Family
ID=64799335
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810863335.4A Active CN109145035B (zh) | 2018-08-01 | 2018-08-01 | 一种基于数据挖掘的电网数据处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109145035B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111833207A (zh) * | 2020-07-03 | 2020-10-27 | 南京上古网络科技有限公司 | 一种基于多能耦合的综合能源管理系统及方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014204336A1 (en) * | 2013-06-18 | 2014-12-24 | Abbyy Development Llс | Methods and systems that build a hierarchically organized data structure containing standard feature symbols for conversion of document images to electronic documents |
CN105184523A (zh) * | 2015-11-05 | 2015-12-23 | 国网山西省电力公司大同供电公司 | 基于cart决策树的电网运行方式数据挖掘方法及系统 |
CN106383837A (zh) * | 2016-08-30 | 2017-02-08 | 国网天津市电力公司 | 一种用能大数据获取关键价值抽取的方法 |
CN107679105A (zh) * | 2017-09-13 | 2018-02-09 | 国网信通亿力科技有限责任公司 | 一种基于向量相似度的用户信息检索方法 |
-
2018
- 2018-08-01 CN CN201810863335.4A patent/CN109145035B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014204336A1 (en) * | 2013-06-18 | 2014-12-24 | Abbyy Development Llс | Methods and systems that build a hierarchically organized data structure containing standard feature symbols for conversion of document images to electronic documents |
CN105184523A (zh) * | 2015-11-05 | 2015-12-23 | 国网山西省电力公司大同供电公司 | 基于cart决策树的电网运行方式数据挖掘方法及系统 |
CN106383837A (zh) * | 2016-08-30 | 2017-02-08 | 国网天津市电力公司 | 一种用能大数据获取关键价值抽取的方法 |
CN107679105A (zh) * | 2017-09-13 | 2018-02-09 | 国网信通亿力科技有限责任公司 | 一种基于向量相似度的用户信息检索方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111833207A (zh) * | 2020-07-03 | 2020-10-27 | 南京上古网络科技有限公司 | 一种基于多能耦合的综合能源管理系统及方法 |
CN111833207B (zh) * | 2020-07-03 | 2024-02-02 | 南京上古网络科技有限公司 | 一种基于多能耦合的综合能源管理系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109145035B (zh) | 2021-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9354937B2 (en) | System and method for electronic work prediction and dynamically adjusting server resources | |
US20140095415A1 (en) | Apparatus and method for forecasting energy consumption | |
CN104699890B (zh) | 一种城网配变重过载短期预警模型的建模方法 | |
Araman et al. | Revenue management with incomplete demand information | |
CN113348330B (zh) | 空调系统的管理方法、控制方法及存储介质、控制平台 | |
CN105205052B (zh) | 一种数据挖掘方法及装置 | |
CN109583799A (zh) | 区域划分的方法及装置、电子设备 | |
CN108961266A (zh) | 一种区域划分方法和装置 | |
Chen et al. | Many-objective optimal power dispatch strategy incorporating temporal and spatial distribution control of multiple air pollutants | |
CN109145035A (zh) | 一种基于数据挖掘的电网数据处理方法 | |
Petrovic et al. | Fuzzy knowledge-based approach to treating uncertainty in inventory control | |
Gontijo et al. | Performance Evaluation and Dimensioning of GI X/M/c/N Systems through Kernel Estimation. | |
CN108346009A (zh) | 一种基于用户模型自学习的电力生产配置方法和装置 | |
Kamodkar et al. | Optimal multiobjective reservoir operation with fuzzy decision variables and resources: a compromise approach | |
CN117236640A (zh) | 低压配电网设备配置方案优化方法、装置、终端及介质 | |
KR20150114028A (ko) | 단위 산업별 기술 가치 예측 시스템 및 그 시스템의 정보 처리 방법 | |
Anders et al. | Analysis of settlement structures by graph-based clustering | |
Sun et al. | Dynamic worker-and-task assignment on uncertain spatial crowdsourcing | |
Nozhati et al. | An approximate dynamic programming approach to community recovery management | |
US20160274609A1 (en) | Classifying utility consumption of consumers | |
Sharma et al. | Optimal reconciliation of hierarchical wind power forecasts of correlated wind farms | |
CN109711450A (zh) | 一种电网预想故障集预测方法、装置、电子设备及存储介质 | |
Ntardas et al. | Resource leveling optimization in construction projects of high voltage substations using nature-inspired intelligent evolutionary algorithms | |
Chatterjee | Demand side management in smart grid using big data analytics | |
Ravi et al. | Reinforcement learning based service provisioning for a greener cloud |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |