CN115329907B - 基于dbscan聚类的电负荷补全方法和系统 - Google Patents
基于dbscan聚类的电负荷补全方法和系统 Download PDFInfo
- Publication number
- CN115329907B CN115329907B CN202211257687.8A CN202211257687A CN115329907B CN 115329907 B CN115329907 B CN 115329907B CN 202211257687 A CN202211257687 A CN 202211257687A CN 115329907 B CN115329907 B CN 115329907B
- Authority
- CN
- China
- Prior art keywords
- completion
- electric quantity
- target user
- strategy
- users
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 230000005611 electricity Effects 0.000 claims abstract description 71
- 238000004458 analytical method Methods 0.000 claims abstract description 66
- 238000010276 construction Methods 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 8
- 230000000295 complement effect Effects 0.000 claims description 8
- 238000012216 screening Methods 0.000 claims description 8
- 230000002159 abnormal effect Effects 0.000 abstract description 7
- 238000007619 statistical method Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 15
- 238000004590 computer program Methods 0.000 description 12
- 230000008439 repair process Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 239000000047 product Substances 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本申请涉及一种基于DBSCAN聚类的电负荷补全方法和系统,其中,该方法包括:获取历史电力数据,基于历史电力数据建立若干电量补全策略;根据历史电力数据中各个目标用户的历史用电情况,为目标用户匹配对应的电量补全策略,通过对应的电量补全策略得出目标用户在分析日的补全电量,其中,电量补全策略包括DBSCAN密度聚类补全策略。通过本申请,解决了如何精确修复异常电力数据的问题,考虑居民用户用电特性差异性较大,通过描述性统计分析探索不同用户用电数据的分布规律,实现了对不同用户针对性地进行电负荷补全,能够以较高的精度恢复缺失数据,同时多种补全策略的结合具有更强的鲁棒性。
Description
技术领域
本申请涉及电力数据处理技术领域,特别是涉及一种基于DBSCAN聚类的电负荷补全方法和系统。
背景技术
随着电力物联网和电网智能化建设的不断推进,使得配售侧对电量数据的分析与挖掘提出了越来越高的要求。电量数据蕴含着丰富的用电信息,以此为基础,可以实现许多的高级应用,如用电需求预测、电价制定、需求响应政策制定等,为电网的高效运营管理提供强有力的支撑。然而,在电网运行实际中,往往会出现量测数据缺失的情况,这会不可避免地对数据的分析挖掘造成困难。因此,研究缺失电量数据的补全,具有现实的意义。如何对这些数据进行修复成为当前研究的一个重要热点问题。
目前针对相关技术中如何精确修复异常电力数据的问题,尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种基于DBSCAN聚类的电负荷补全方法和系统,以至少解决相关技术中如何精确修复异常电力数据的问题。
第一方面,本申请实施例提供了一种基于DBSCAN聚类的电负荷补全方法,所述方法包括:
获取历史电力数据,基于所述历史电力数据建立若干电量补全策略;
根据所述历史电力数据中各个目标用户的历史用电情况,为目标用户匹配对应的电量补全策略,通过所述对应的电量补全策略得出所述目标用户在分析日的补全电量;
所述电量补全策略包括DBSCAN密度聚类补全策略:
对与所述目标用户具有相同预设属性的若干用户,从中选取历史连续N天且不为空的用户用电量作为聚类特征,进行DBSCAN密度聚类,得到聚类簇和噪音点;
对所述聚类簇中除所述目标用户外的其他用户,将所述其他用户的日用电量相加取均值作为所述目标用户在分析日的补全电量。
在其中一些实施例中,通过所述对应的电量补全策略得出所述目标用户在分析日的补全电量包括:
所述电量补全策略还包括第一补全策略:
对于存在前一天用电数据的目标用户,基于所述目标用户在分析日的时刻点,将所述时刻点对应的正向有功总示值与前一天同时刻点的正向有功总示值作差,将所述作差的差值作为所述目标用户的补全电量。
在其中一些实施例中,通过所述对应的电量补全策略得出所述目标用户在分析日的补全电量包括:
所述电量补全策略还包括第二补全策略:
对于前一天用电量为0的目标用户,将0作为所述目标用户在分析日的补全电量。
在其中一些实施例中,通过所述对应的电量补全策略得出所述目标用户在分析日的补全电量包括:
所述电量补全策略还包括第三补全策略:
对于预设时间段内用电量稳定的目标用户,获取所述预设时间段内用电量的均值,将所述均值作为所述目标用户在分析日的补全电量。
在其中一些实施例中,通过所述对应的电量补全策略得出所述目标用户在分析日的补全电量包括:
所述电量补全策略还包括第四补全策略:
对于用电周期稳定的目标用户,获取上一周期中与当前周期的分析日相同的日期下,所述目标用户的用电量,将所述用电量作为所述目标用户在所述分析日的补全电量。
在其中一些实施例中,通过所述对应的电量补全策略得出所述目标用户在分析日的补全电量包括:
所述电量补全策略还包括第五补全策略:
对与所述目标用户具有相同预设属性的若干用户,从中寻找与所述目标用户之间的用电量差稳定的若干补全用户,再从所述补全用户中筛选出相似用户;
计算所述目标用户与各个所述补全用户之间的用电量差值,并将所述用电量差值相加取均值,将所述相似用户的用电量与所述均值相加,作为所述目标用户在分析日的补全电量。
在其中一些实施例中,通过所述对应的电量补全策略得出所述目标用户在分析日的补全电量包括:
所述电量补全策略还包括第六补全策略:
对于预设时间段内用电趋势稳定的目标用户,获取所述预设时间段内用电变化趋势的均值,将所述均值与分析日前一日的用电量相乘,将所述相乘的乘积作为所述目标用户的补全电量。
在其中一些实施例中,通过所述对应的电量补全策略得出所述目标用户在分析日的补全电量包括:
所述电量补全策略还包括第七补全策略:
对目标用户所在的预设供电范围内所有用户,计算所述所有用户在分析日的用电总量和在前一日的用电总量,并将分析日的用电总量和前一日的用电总量作除法,得到环比电量比率;
将所述环比电量比率与所述目标用户前一日的用电量相乘,将所述相乘的乘积作为所述目标用户的补全电量。
在其中一些实施例中,为每个目标用户匹配对应的电量补全策略包括:
所述电量补全策略包括DBSCAN密度聚类补全策略、第一补全策略、第二补全策略、第三补全策略、第四补全策略、第五补全策略、第六补全策略和第七补全策略;
各个所述电量补全策略对应着不同的优先级,按所述优先级从高到低排序依次为:第一补全策略、第二补全策略、第三补全策略、第四补全策略、第五补全策略、第六补全策略、DBSCAN密度聚类补全策略、第七补全策略;
当目标用户匹配到复数个电量补全策略,则按优先级排序,选择优先级最高的电量补全策略进行电负荷补全。
第二方面,本申请实施例提供了一种基于DBSCAN聚类的电负荷补全系统,所述系统包括策略构建模块、策略匹配模块和策略执行模块;
所述策略构建模块,用于获取历史电力数据,基于所述历史电力数据建立若干电量补全策略;
所述策略匹配模块,用于根据所述历史电力数据中各个目标用户的历史用电情况,为目标用户匹配对应的电量补全策略;
所述策略执行模块,用于通过所述对应的电量补全策略得出所述目标用户在分析日的补全电量;其中,所述电量补全策略包括DBSCAN密度聚类补全策略:
对与所述目标用户具有相同预设属性的若干用户,从中选取历史连续N天且不为空的用户用电量作为聚类特征,进行DBSCAN密度聚类,得到聚类簇和噪音点;对所述聚类簇中除所述目标用户外的其他用户,将所述其他用户的日用电量相加取均值作为所述目标用户在分析日的补全电量。
相比于相关技术,本申请实施例提供的一种基于DBSCAN聚类的电负荷补全方法和系统,该方法通过获取历史电力数据,基于历史电力数据建立若干电量补全策略;根据历史电力数据中各个目标用户的历史用电情况,为目标用户匹配对应的电量补全策略,通过对应的电量补全策略得出目标用户在分析日的补全电量;电量补全策略包括DBSCAN密度聚类补全策略:对与目标用户具有相同预设属性的若干用户,从中选取历史连续N天且不为空的用户用电量作为聚类特征,进行DBSCAN密度聚类,得到聚类簇和噪音点;对聚类簇中除目标用户外的其他用户,将其他用户的日用电量相加取均值作为目标用户在分析日的补全电量,解决了如何精确修复异常电力数据的问题,考虑居民用户用电特性差异性较大,通过描述性统计分析探索不同用户用电数据的分布规律,实现了对不同用户针对性地进行电负荷补全,能够以较高的精度恢复缺失数据,同时多种补全策略的结合具有更强的鲁棒性。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的基于DBSCAN聚类的电负荷补全方法的步骤流程图;
图2是根据本申请实施例的0电量用户的示意图;
图3是根据本申请实施例的用电量稳定用户的示意图;
图4是根据本申请实施例的周期稳定用户的示意图;
图5是根据本申请实施例的趋势稳定用户的示意图;
图6是根据本申请实施例的基于DBSCAN聚类的电负荷补全方法的步骤流程图;
图7是根据本申请实施例的电子设备的内部结构示意图。
附图说明:61、策略构建模块;62、策略匹配模块;63、策略执行模块。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
本发明提出一种基于DBSCAN聚类的电负荷补全方法,鉴于此,先对DBSCAN聚类算法进行相关说明:
DBSCAN密度聚类:是一种基于密度的聚类算法,通过是否紧密相连来判断样本点是否属于一个簇。它是基于一组邻域来描述样本集的紧密程度的,参数(ϵ,MinPts)用来描述邻域的样本分布紧密程度。其中,ϵ描述了某一样本的邻域距离阈值,MinPts描述了某一样本的距离为ϵ的邻域中样本个数的阈值。
核心点:邻域半径ϵ内样本点的数量大于等于MinPts的点叫做核心点。
边界点:不属于核心点但在某个核心点的邻域内的点叫做边界点。
噪声点:既不是核心点也不是边界点的是噪声点。
核心点:邻域半径ϵ内样本点的数量大于等于MinPts的点叫做核心点。
边界点:不属于核心点但在某个核心点的邻域内的点叫做边界点。噪声点:既不是核心点也不是边界点的是噪声点。
密度直达:如果P为核心点,Q在P的R邻域内,那么称P到Q密度直达。任何核9.心点到其自身密度直达,密度直达不具有对称性,如果P到Q密度直达,那么Q到P不一定密度直达。
密度可达:如果存在核心点P2,P3,……,Pn,且P1到P2密度直达,P2到P3密度直达,……,P(n-1)到Pn密度直达,Pn到Q密度直达,则P1到Q密度可达。密度可达也不具有对称性。
密度相连:如果存在核心点S,使得S到P和Q都密度可达,则P和Q密度相连。密度相连具有对称性,如果P和Q密度相连,那么Q和P也一定密度相连。密度相连的两个点属于同一个聚类簇。
非密度相连:如果两个点不属于密度相连关系,则两个点非密度相连。非密度相连的两个点属于不同的聚类簇,或者其中存在噪声点。
本申请实施例提供了一种基于DBSCAN聚类的电负荷补全方法,图1是根据本申请实施例的基于DBSCAN聚类的电负荷补全方法的步骤流程图,如图1所示,该方法包括以下步骤:
步骤S102,获取历史电力数据,基于历史电力数据建立若干电量补全策略;
具体地,获取历史电力数据,形成基础数据库,该历史电力数据包括了用户表计号、用户所属台区、用户所属供电所、用电类型、用户所属县级市、用户所属地级市、正向有功总示值等。
步骤S104,根据历史电力数据中各个目标用户的历史用电情况,为目标用户匹配对应的电量补全策略,通过对应的电量补全策略得出目标用户在分析日的补全电量;
具体地,在步骤S102建立8个不同的电量补全策略之后,根据各个目标用户历史用电表现,为目标用户匹配对应的电量补全策略,电量补全策略包括DBSCAN密度聚类补全策略、第一补全策略、第二补全策略、第三补全策略、第四补全策略、第五补全策略、第六补全策略和第七补全策略;
给每个电量补全策略分配一个优先级,按优先级从高到低排序依次为:第一补全策略、第二补全策略、第三补全策略、第四补全策略、第五补全策略、第六补全策略、DBSCAN密度聚类补全策略、第七补全策略;
若目标用户匹配到复数个电量补全策略,则按优先级排序,选择优先级最高的电量补全策略进行电负荷补全,得出目标用户在分析日的补全电量。
优选地,基于DBSCAN密度聚类补全策略的电负荷补全包括以下步骤:
步骤一,对与目标用户具有相同预设属性的若干用户,从中选取历史连续N天且不为空的用户用电量作为聚类特征,进行DBSCAN密度聚类,得到聚类簇和噪音点;
步骤二,对聚类簇中除目标用户外的其他用户,将其他用户的日用电量相加取均值作为目标用户在分析日的补全电量。
具体为:若目标用户是低压用户,则取同一台区下的所有用户进行聚类(即对低压用户,相同预设属性为同一台区);若目标用户是终端和专变用户,取同一供电所下的所有用户进行聚类(即对终端和专变用户,相同预设属性为同一供电所);
聚类使用的特征包括:取历史连续N天且不为空的用户用电量,作为N维数据点;邻域半径设置为ϵ,邻域内最少用户数为minPts;密度相连的两个点属于同一个聚类簇,取聚类簇内的其他用户的日电量均值作为目标用户在分析日的补全电量,对没有在任何聚类中的噪音点(既不是核心点,也不是边界点)则在这一步策略中不做处理。具体算法过程描述如下:
(1)检测数据库中尚未检查过的对象p,如果p未被处理(未被归为某个簇或者标记为噪音点),则检查其邻域,若包含的对象数不小于minPts,建立新簇C,将其中的所有点加入候选集N;
(2)对候选集N 中所有尚未被处理的对象q,检查其邻域,若至少包含minPts个对象,则将这些对象加入N;如果q 未归入任何一个簇,则将q 加入C;
(3)重复(2),继续检查N 中未处理的对象,当前候选集N为空;
(4)重复(1)至(3),直到所有对象都归入了某个簇或标记为噪音点。
优选地,基于第一补全策略的电负荷补全包括以下步骤:
对于存在前一天用电数据的目标用户,基于目标用户在分析日的时刻点,将时刻点对应的正向有功总示值与前一天同时刻点的正向有功总示值作差,将作差的差值作为目标用户的补全电量。
具体为:筛选有负荷数据的目标用户,选择缺失当日与前一天都有的时刻点,且取最大时刻点,计算当天正向有功总示值-前一天同时刻的正向有功总示值,作为补全电量。
优选地,基于第二补全策略包括以下步骤:
对于前一天用电量为0的目标用户,将0作为目标用户在分析日的补全电量。
具体为:图2是根据本申请实施例的0电量用户的示意图,如图2所示,筛选前一天用电量为0的目标用户,取0作为当天的补全电量。
优选地,基于第三补全策略包括以下步骤:
对于预设时间段内用电量稳定的目标用户,获取预设时间段内用电量的均值,将均值作为目标用户在分析日的补全电量。
具体为:图3是根据本申请实施例的用电量稳定用户的示意图,如图3所示,筛选用电量稳定的目标用户,这批用户取前N天的电量均值作为补全电量。筛选条件:以分析日往前推N天,计算用户N天的用电量标准差(std)和N天用电量均值(avg),进而得出变异系数CV=标准差 (std)/均值(avg),若变异系数CV>0并且<k(一个较小的值),则该用户为用电量稳定的目标用户。
优选地,基于第四补全策略包括以下步骤:
对于用电周期稳定的目标用户,获取上一周期中与当前周期的分析日相同的日期下,目标用户的用电量,将用电量作为目标用户在分析日的补全电量。
具体为:图4是根据本申请实施例的周期稳定用户的示意图,如图4所示,筛选周期稳定的目标用户,这批用户直接取最近一周的同星期几用电量作为分析日的补全电量。筛选条件:取分析日往前推两周的日电量,根据绝对值(最近一周每天用电量-再上一周同星期几(DayOfWeek)的用电量)/最近一周每天用电量,计算出用户的用电量变化率;若电量变化率<k的天数>=m,则为周期稳定用户。
优选地,基于第五补全策略包括以下步骤:
步骤一,对与目标用户具有相同预设属性的若干用户,从中寻找与目标用户之间的用电量差稳定的若干补全用户,再从补全用户中筛选出相似用户;
步骤二,计算目标用户与各个补全用户之间的用电量差值,并将用电量差值相加取均值,将相似用户的用电量与均值相加,作为目标用户在分析日的补全电量。
具体为:寻找跟目标用户差异稳定的另一用户,即给每个需要补全的目标用户A,寻找跟它的电量差稳定的另一个相似用户B,根据该相似用户B的电量+电量差的均值来补全。
若目标用户为低压用户,则在同一台区下寻找补全用户(即对低压用户,相同预设属性为同一台区);若目标用户为终端和专变用户,则在同一个供电所下寻找补全用户(即对终端和专变用户,相同预设属性为同一供电所)。
计算目标用户在同一台区/同一供电所下与其他用户连续N天的电量差,统计标准差(std)和平均值(avg),进而得出变异系数CV=标准差(std)/均值(avg),若存在变异系数CV<k(一个较小的值)的用户,则为补全用户,且变异系数CV最小的用户为相似用户B,则根据相似用户B的用电量+avg电量差当做补全电量。
优选地,基于第六补全策略包括以下步骤:
对于预设时间段内用电趋势稳定的目标用户,获取预设时间段内用电变化趋势的均值,将均值与分析日前一日的用电量相乘,将相乘的乘积作为目标用户的补全电量。
具体为:图5是根据本申请实施例的趋势稳定用户的示意图,如图5所示,筛选趋势稳定的目标用户,这批用户每个都取历史N天变化趋势的均值*分析日前一日的用电量作为补全电量。筛选条件:计算用户历史连续N天的用电量变化趋势trend=第i日用电量/第(i-1)日用电量;计算用电量变化趋势trend的变异系数CV=标准差(std)/平均值(avg); 若变异系数CV>0并且<k(一个较小的值),则该用户为趋势稳定的目标用户。
优选地,基于第七补全策略包括以下步骤:
步骤一,对目标用户所在的预设供电范围内所有用户,计算所有用户在分析日的用电总量和在前一日的用电总量,并将分析日的用电总量和前一日的用电总量作除法,得到环比电量比率;
步骤二,将环比电量比率与目标用户前一日的用电量相乘,将相乘的乘积作为目标用户的补全电量。
具体为:对目标用户,按照供电的区域范围进行分组后,计算每组合计的今天相对于昨天的环比电量比率(标设方法)。区域范围可以选择县级供电公司或营业站,具体根据要补全的用户范围,取下一级的划分粒度。计算环比=该区域所有用户昨日用电量/该区域所有用户今日用电量,将环比*昨日目标用户用电量,当做补全电量。
此外,在其中一些实施例中,针对以上8种电量补全策略均未实现对目标用户的电负荷补全,可以分析日往前推L天,选择目标用户有数据的最近 y天的用电量均值作为分析日的补全电量。
通过本申请实施例中的步骤S102至步骤S104,解决了如何精确修复异常电力数据的问题,解决了现有电量补全方法计量粗放,未考虑用户用能行为特点、泛化能力差、波动性大的问题,考虑居民用户用电特性差异性较大,通过描述性统计分析探索不同用户用电数据的分布规律,实现了对不同用户针对性地进行电负荷补全,能够以较高的精度恢复缺失数据,同时多种补全策略的结合具有更强的鲁棒性。
需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例提供了一种基于DBSCAN聚类的电负荷补全系统,图6是根据本申请实施例的基于DBSCAN聚类的电负荷补全方法的步骤流程图,如图6所示,该系统包括策略构建模块61、策略匹配模块62和策略执行模块63;
策略构建模块61,用于获取历史电力数据,基于历史电力数据建立若干电量补全策略;
策略匹配模块62,用于根据历史电力数据中各个目标用户的历史用电情况,为目标用户匹配对应的电量补全策略;
策略执行模块63,用于通过对应的电量补全策略得出目标用户在分析日的补全电量;其中,电量补全策略包括DBSCAN密度聚类补全策略:
对与目标用户具有相同预设属性的若干用户,从中选取历史连续N天且不为空的用户用电量作为聚类特征,进行DBSCAN密度聚类,得到聚类簇和噪音点;对聚类簇中除目标用户外的其他用户,将其他用户的日用电量相加取均值作为目标用户在分析日的补全电量。
通过本申请实施例中的策略构建模块61、策略匹配模块62和策略执行模块63,解决了如何精确修复异常电力数据的问题,解决了现有电量补全方法计量粗放,未考虑用户用能行为特点、泛化能力差、波动性大的问题,考虑居民用户用电特性差异性较大,通过描述性统计分析探索不同用户用电数据的分布规律,实现了对不同用户针对性地进行电负荷补全,能够以较高的精度恢复缺失数据,同时多种补全策略的结合具有更强的鲁棒性。
需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。
本实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
需要说明的是,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
另外,结合上述实施例中的基于DBSCAN聚类的电负荷补全方法,本申请实施例可提供一种存储介质来实现。该存储介质上存储有计算机程序;该计算机程序被处理器执行时实现上述实施例中的任意一种基于DBSCAN聚类的电负荷补全方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于DBSCAN聚类的电负荷补全方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
在一个实施例中,图7是根据本申请实施例的电子设备的内部结构示意图,如图7所示,提供了一种电子设备,该电子设备可以是服务器,其内部结构图可以如图7所示。该电子设备包括通过内部总线连接的处理器、网络接口、内存储器和非易失性存储器,其中,该非易失性存储器存储有操作系统、计算机程序和数据库。处理器用于提供计算和控制能力,网络接口用于与外部的终端通过网络连接通信,内存储器用于为操作系统和计算机程序的运行提供环境,计算机程序被处理器执行时以实现一种基于DBSCAN聚类的电负荷补全方法,数据库用于存储数据。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
本领域的技术人员应该明白,以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (2)
1.一种基于DBSCAN聚类的电负荷补全方法,其特征在于,所述方法包括:
获取历史电力数据,基于所述历史电力数据建立若干电量补全策略;
根据所述历史电力数据中各个目标用户的历史用电情况,为目标用户匹配对应的电量补全策略,各个所述电量补全策略对应着不同的优先级,按所述优先级从高到低的排序依次为:第一补全策略、第二补全策略、第三补全策略、第四补全策略、第五补全策略、第六补全策略、DBSCAN密度聚类补全策略、第七补全策略;当目标用户匹配到复数个电量补全策略,则按优先级排序,选择优先级最高的电量补全策略进行电负荷补全;
通过所述对应的电量补全策略得出所述目标用户在分析日的补全电量;
所述电量补全策略包括DBSCAN密度聚类补全策略:
对与所述目标用户具有相同预设属性的若干用户,从中选取历史连续N天且不为空的用户用电量作为聚类特征,进行DBSCAN密度聚类,得到聚类簇和噪音点;
对所述聚类簇中除所述目标用户外的其他用户,将所述其他用户的日用电量相加取均值作为所述目标用户在分析日的补全电量;
所述电量补全策略包括第一补全策略:
对于存在前一天用电数据的目标用户,基于所述目标用户在分析日的时刻点,将所述时刻点对应的正向有功总示值与前一天同时刻点的正向有功总示值作差,将所述作差的差值作为所述目标用户的补全电量;
所述电量补全策略包括第二补全策略:
对于前一天用电量为0的目标用户,将0作为所述目标用户在分析日的补全电量;
所述电量补全策略包括第三补全策略:
对于预设时间段内用电量稳定的目标用户,获取所述预设时间段内用电量的均值,将所述均值作为所述目标用户在分析日的补全电量;
所述电量补全策略包括第四补全策略:
对于用电周期稳定的目标用户,获取上一周期中与当前周期的分析日相同的日期下,所述目标用户的用电量,将所述用电量作为所述目标用户在所述分析日的补全电量;
所述电量补全策略包括第五补全策略:
对与所述目标用户具有相同预设属性的若干用户,从中寻找与所述目标用户之间的用电量差稳定的若干补全用户,再从所述补全用户中筛选出相似用户;
计算所述目标用户与各个所述补全用户之间的用电量差值,并将所述用电量差值相加取均值,将所述相似用户的用电量与所述均值相加,作为所述目标用户在分析日的补全电量;
所述电量补全策略包括第六补全策略:
对于预设时间段内用电趋势稳定的目标用户,获取所述预设时间段内用电变化趋势的均值,将所述均值与分析日前一日的用电量相乘,将所述相乘的乘积作为所述目标用户的补全电量;
所述电量补全策略包括第七补全策略:
对目标用户所在的预设供电范围内所有用户,计算所述所有用户在分析日的用电总量和在前一日的用电总量,并将分析日的用电总量和前一日的用电总量作除法,得到环比电量比率;
将所述环比电量比率与所述目标用户前一日的用电量相乘,将所述相乘的乘积作为所述目标用户的补全电量。
2.一种基于DBSCAN聚类的电负荷补全系统,其特征在于,所述系统包括策略构建模块、策略匹配模块和策略执行模块;
所述策略构建模块,用于获取历史电力数据,基于所述历史电力数据建立若干电量补全策略;
所述策略匹配模块,用于根据所述历史电力数据中各个目标用户的历史用电情况,为目标用户匹配对应的电量补全策略,各个所述电量补全策略对应着不同的优先级,按所述优先级从高到低的排序依次为:第一补全策略、第二补全策略、第三补全策略、第四补全策略、第五补全策略、第六补全策略、DBSCAN密度聚类补全策略、第七补全策略;当目标用户匹配到复数个电量补全策略,则按优先级排序,选择优先级最高的电量补全策略进行电负荷补全;
所述策略执行模块,用于通过所述对应的电量补全策略得出所述目标用户在分析日的补全电量;
其中,所述电量补全策略包括DBSCAN密度聚类补全策略:
对与所述目标用户具有相同预设属性的若干用户,从中选取历史连续N天且不为空的用户用电量作为聚类特征,进行DBSCAN密度聚类,得到聚类簇和噪音点;对所述聚类簇中除所述目标用户外的其他用户,将所述其他用户的日用电量相加取均值作为所述目标用户在分析日的补全电量;
所述电量补全策略包括第一补全策略:
对于存在前一天用电数据的目标用户,基于所述目标用户在分析日的时刻点,将所述时刻点对应的正向有功总示值与前一天同时刻点的正向有功总示值作差,将所述作差的差值作为所述目标用户的补全电量;
所述电量补全策略包括第二补全策略:
对于前一天用电量为0的目标用户,将0作为所述目标用户在分析日的补全电量;
所述电量补全策略包括第三补全策略:
对于预设时间段内用电量稳定的目标用户,获取所述预设时间段内用电量的均值,将所述均值作为所述目标用户在分析日的补全电量;
所述电量补全策略包括第四补全策略:
对于用电周期稳定的目标用户,获取上一周期中与当前周期的分析日相同的日期下,所述目标用户的用电量,将所述用电量作为所述目标用户在所述分析日的补全电量;
所述电量补全策略包括第五补全策略:
对与所述目标用户具有相同预设属性的若干用户,从中寻找与所述目标用户之间的用电量差稳定的若干补全用户,再从所述补全用户中筛选出相似用户;
计算所述目标用户与各个所述补全用户之间的用电量差值,并将所述用电量差值相加取均值,将所述相似用户的用电量与所述均值相加,作为所述目标用户在分析日的补全电量;
所述电量补全策略包括第六补全策略:
对于预设时间段内用电趋势稳定的目标用户,获取所述预设时间段内用电变化趋势的均值,将所述均值与分析日前一日的用电量相乘,将所述相乘的乘积作为所述目标用户的补全电量;
所述电量补全策略包括第七补全策略:
对目标用户所在的预设供电范围内所有用户,计算所述所有用户在分析日的用电总量和在前一日的用电总量,并将分析日的用电总量和前一日的用电总量作除法,得到环比电量比率;
将所述环比电量比率与所述目标用户前一日的用电量相乘,将所述相乘的乘积作为所述目标用户的补全电量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211257687.8A CN115329907B (zh) | 2022-10-14 | 2022-10-14 | 基于dbscan聚类的电负荷补全方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211257687.8A CN115329907B (zh) | 2022-10-14 | 2022-10-14 | 基于dbscan聚类的电负荷补全方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115329907A CN115329907A (zh) | 2022-11-11 |
CN115329907B true CN115329907B (zh) | 2023-01-31 |
Family
ID=83913806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211257687.8A Active CN115329907B (zh) | 2022-10-14 | 2022-10-14 | 基于dbscan聚类的电负荷补全方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115329907B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116756528B (zh) * | 2023-08-18 | 2023-11-28 | 杭州鸿晟电力设计咨询有限公司 | 一种用电负荷数据的补全方法、装置、设备及介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102651116A (zh) * | 2012-03-31 | 2012-08-29 | 上海市电力公司 | 一种电力负荷数据精细化处理方法 |
JP2013017272A (ja) * | 2011-07-01 | 2013-01-24 | Mitsubishi Electric Corp | 電力系統の状態推定計算装置、電力系統監視制御システム及び電力系統の状態推定計算方法 |
JP2014096118A (ja) * | 2012-11-12 | 2014-05-22 | Nippon Telegr & Teleph Corp <Ntt> | 欠損値予測装置及び方法及びプログラム及び商品推薦装置及び方法及びプログラム |
CN107958338A (zh) * | 2017-12-08 | 2018-04-24 | 合肥工业大学 | 用电策略推荐方法及装置、存储介质 |
CN110689279A (zh) * | 2019-10-12 | 2020-01-14 | 上海积成能源科技有限公司 | 一种基于电力负荷数据的居民用电安全隐患分析系统及方法 |
CN111831631A (zh) * | 2019-04-22 | 2020-10-27 | 发那科株式会社 | 缺失值补全装置、缺失值补全方法以及计算机可读介质 |
CN114168578A (zh) * | 2021-12-09 | 2022-03-11 | 国网江苏省电力有限公司 | 一种基于聚类和近邻算法的日负荷数据缺失值插补方法 |
CN114611856A (zh) * | 2020-12-03 | 2022-06-10 | 国家电网有限公司大数据中心 | 一种用电量智能补全方法和系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5565193B2 (ja) * | 2010-08-16 | 2014-08-06 | 東京電力株式会社 | 配電区間の負荷予測方法および配電系統制御システム |
CN113568898A (zh) * | 2021-07-30 | 2021-10-29 | 浙江华云信息科技有限公司 | 电力数据漏点补全方法、装置、设备及可读存储介质 |
CN114202231A (zh) * | 2021-12-21 | 2022-03-18 | 瀚云科技有限公司 | 日用电数据缺失的补全方法、装置、电子设备及存储介质 |
-
2022
- 2022-10-14 CN CN202211257687.8A patent/CN115329907B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013017272A (ja) * | 2011-07-01 | 2013-01-24 | Mitsubishi Electric Corp | 電力系統の状態推定計算装置、電力系統監視制御システム及び電力系統の状態推定計算方法 |
CN102651116A (zh) * | 2012-03-31 | 2012-08-29 | 上海市电力公司 | 一种电力负荷数据精细化处理方法 |
JP2014096118A (ja) * | 2012-11-12 | 2014-05-22 | Nippon Telegr & Teleph Corp <Ntt> | 欠損値予測装置及び方法及びプログラム及び商品推薦装置及び方法及びプログラム |
CN107958338A (zh) * | 2017-12-08 | 2018-04-24 | 合肥工业大学 | 用电策略推荐方法及装置、存储介质 |
CN111831631A (zh) * | 2019-04-22 | 2020-10-27 | 发那科株式会社 | 缺失值补全装置、缺失值补全方法以及计算机可读介质 |
CN110689279A (zh) * | 2019-10-12 | 2020-01-14 | 上海积成能源科技有限公司 | 一种基于电力负荷数据的居民用电安全隐患分析系统及方法 |
CN114611856A (zh) * | 2020-12-03 | 2022-06-10 | 国家电网有限公司大数据中心 | 一种用电量智能补全方法和系统 |
CN114168578A (zh) * | 2021-12-09 | 2022-03-11 | 国网江苏省电力有限公司 | 一种基于聚类和近邻算法的日负荷数据缺失值插补方法 |
Non-Patent Citations (2)
Title |
---|
"Missing data imputation using mixture factor analysis for building electric load data";Dongyeon Jeong等;《Applied Energy》;20211215;第304卷;全文 * |
"基于DBSCAN二次聚类的配电网负荷缺失数据修补";蔡文斌等;《电气技术》;20211231;第22卷(第12期);第27-33页 * |
Also Published As
Publication number | Publication date |
---|---|
CN115329907A (zh) | 2022-11-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022267735A1 (zh) | 业务数据处理方法、装置、计算机设备和存储介质 | |
WO2016161296A1 (en) | Multi-cluster management method and device | |
CN115329907B (zh) | 基于dbscan聚类的电负荷补全方法和系统 | |
CN113744089B (zh) | 一种台区户变关系辨识方法及设备 | |
CN111541628A (zh) | 一种电力通信网络业务资源分配方法及相关装置 | |
CN114611845A (zh) | 碳排放量的预测方法、装置、电子设备及介质 | |
CN117394370B (zh) | 一种供电网智能动态节电调度系统及方法 | |
CN112464059B (zh) | 配电网用户分类方法、装置、计算机设备和存储介质 | |
CN117234712A (zh) | 算力资源部署方法、装置、计算机设备以及存储介质 | |
CN112685462A (zh) | 馈线数据分析方法、装置、计算机设备和存储介质 | |
CN112015718A (zh) | HBase集群平衡方法、装置、电子设备和存储介质 | |
Zhang et al. | An outlier detection algorithm for electric power data based on dbscan and lof | |
CN115358476A (zh) | 需求响应潜力预测方法、装置、计算机设备和存储介质 | |
CN112767027B (zh) | 一种基于业务感知的云成本预测方法和系统 | |
CN112601245B (zh) | 长期演进区域容量资源利用情况评价方法及装置 | |
CN115456346A (zh) | 一种电费计价方式确定方法、装置、电子设备及介质 | |
CN114844791A (zh) | 基于大数据的云服务自动管理分配方法、系统及存储介质 | |
CN113792995A (zh) | 电力资源支配程度的确定方法、装置、设备和存储介质 | |
CN114372681A (zh) | 基于流水数据的企业分类方法、装置、设备、介质和产品 | |
CN111598357A (zh) | 基于容量利用小时数和高斯分布的月度用电量预测方法 | |
CN111177131A (zh) | 用电数据检测方法、装置、计算机设备和存储介质 | |
Martinovic et al. | Load balancing of large distribution network model calculations | |
CN113689033B (zh) | 容量发电价核定方法、装置、计算机设备和存储介质 | |
CN113869687A (zh) | 电力负荷成分指数的分析方法、装置、计算机设备和介质 | |
CN118115267A (zh) | 电力交易方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: A Method and System for Electricity Load Compensation Based on DBSCAN Clustering Effective date of registration: 20230802 Granted publication date: 20230131 Pledgee: Hangzhou Gaoxin Financing Guarantee Co.,Ltd. Pledgor: HANGZHOU ZHICHENG ELECTRONIC TECHNOLOGY Co.,Ltd. Registration number: Y2023330001598 |
|
PE01 | Entry into force of the registration of the contract for pledge of patent right |