CN116304763A - 一种电力数据预分析方法、系统、设备及介质 - Google Patents
一种电力数据预分析方法、系统、设备及介质 Download PDFInfo
- Publication number
- CN116304763A CN116304763A CN202310558859.3A CN202310558859A CN116304763A CN 116304763 A CN116304763 A CN 116304763A CN 202310558859 A CN202310558859 A CN 202310558859A CN 116304763 A CN116304763 A CN 116304763A
- Authority
- CN
- China
- Prior art keywords
- power data
- data
- manhattan distance
- state
- calibration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 30
- 230000002159 abnormal effect Effects 0.000 claims abstract description 85
- 238000000034 method Methods 0.000 claims abstract description 27
- 238000012937 correction Methods 0.000 claims description 22
- 230000006399 behavior Effects 0.000 claims description 14
- 238000004891 communication Methods 0.000 claims description 14
- 238000001914 filtration Methods 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 3
- 238000007405 data analysis Methods 0.000 description 6
- 230000007547 defect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本申请公开了一种电力数据预分析方法、系统、设备及介质,主要涉及电力数据预分析技术领域,用以解决现有的方法不能对数据进行优化的问题。包括:获取标记好数据状态的历史电力数据集;对历史电力数据集中异常状态的历史电力数据进行聚类;根据历史电力数据与聚类中心之间的曼哈顿距离,确定标准异常电力数据和各个聚类对应的曼哈顿距离范围;从待分析的电力数据中随机抽取若干数量的校准电力数据,获取校准电力数据与标准异常电力数据之间的曼哈顿距离,进而确定校准电力数据对应的第二数据状态;矫正曼哈顿距离范围,获得最终曼哈顿距离范围;基于先验算法和最终曼哈顿距离范围,从待分析的电力数据中滤除异常电力数据。
Description
技术领域
本申请涉及电力数据分析技术领域,尤其涉及一种电力数据预分析方法、系统、设备及介质。
背景技术
电力公司拥有大量运行电力数据、电力客户数据、个人用电信息等敏感数据,通过对各种不同类型的电力数据进行分析,可以设计出与用电需求相符的生产计划,从而为电力用户提供较为准确和经济的产品和服务,有助于节能减排的实现。
现阶段,为了解决电力数据量多且复杂,在分析过程中往往需要相关人员花费大量时间检索分析所需的电力数据,在获取到对应的电力数据后,由于电力数据量大需要多个服务器的共同参与,存在较高的数据泄露的风险的问题,于是设计了CN202211235760.1一种电力数据分析系统及方法,通过响应数据处理指令以及获取随机密码,获得最终加密电力数据;发送随机密码至电力数据节点;确定累计预测分析时间最少的区块链节点为数据分析节点,并将数据分析指令和电力数据节点IP发送至数据分析节点,以通过数据分析节点计算最终分析结,以完成电力数据的分析。
但是上述方法,仅仅是数据处理过程的优化,当数据本身存在较大缺陷时,并不能对数据进行优化,此时无论对数据处理过程进行何种优化都不能获得有效的分析结果。
发明内容
针对现有技术的上述不足,本发明提供一种电力数据预分析方法、系统、设备及介质,以解决上述技术问题。
第一方面,本申请提供了一种电力数据预分析方法,方法包括:获取标记好数据状态的历史电力数据集;其中,数据状态包含正常状态和异常状态,且异常状态至少分为:通信故障、设备故障、电网波动和用户行为异常;通过先验算法,对历史电力数据集中异常状态的历史电力数据进行聚类;根据历史电力数据与聚类中心之间的曼哈顿距离,确定标准异常电力数据和各个聚类对应的曼哈顿距离范围;从待分析的电力数据中随机抽取若干数量的校准电力数据,并获得校准电力数据对应的第一数据状态;获取校准电力数据与标准异常电力数据之间的曼哈顿距离,进而确定校准电力数据对应的第二数据状态;根据若干数量的校准电力数据对应第一数据状态和第二数据状态的重合率,矫正曼哈顿距离范围,以在重合率大于预设重合率时,获得最终曼哈顿距离范围;基于先验算法和最终曼哈顿距离范围,从待分析的电力数据中滤除异常电力数据。
进一步地,根据历史电力数据与聚类中心之间的曼哈顿距离,确定标准异常电力数据和各个聚类对应的曼哈顿距离范围,具体包括:确定距离聚类中心的曼哈顿距离在预设聚类范围内的历史电力数据为标准异常电力数据;根据聚类中心和历史电力数据之间的曼哈顿距离,获得各个聚类对应的曼哈顿距离范围。
进一步地,获取校准电力数据与标准异常电力数据之间的曼哈顿距离,进而确定校准电力数据对应的第二数据状态,具体包括:获取校准电力数据与各个标准异常电力数据之间的曼哈顿距离,以及确定标准异常电力数据对应聚类的曼哈顿距离范围;当曼哈顿距离落入曼哈顿距离范围时,确定标准异常电力数据对应聚类的数据状态为校准电力数据的第二数据状态。
进一步地,根据若干数量的校准电力数据对应第一数据状态和第二数据状态的重合率,矫正曼哈顿距离范围,以在重合率大于预设重合率时,获得最终曼哈顿距离范围,具体包括:获取第一数据状态与第二数据状态不一致的第一校准电力数据集;获得第一校准电力数据集对应的第一数据状态集合;其中,第一数据状态的实际内容,根据聚类至少分为:通信故障、设备故障、电网波动和用户行为异常;确定第一数据状态集合中各个实际内容对应的数量,确定数量最多的实际内容对应的聚类为矫正聚类;基于数量最多的实际内容对应的校准电力数据,从第一校准电力数据集中抽取第二校准电力数据集合;计算第二校准电力数据集合中各个校准电力数据与矫正聚类对应的标准异常电力数据之间的曼哈顿距离,获得最大曼哈顿距离;进而确定最大曼哈顿距离为矫正聚类对应的曼哈顿距离范围的最大范围值。
第二方面,本申请提供了一种电力数据预分析系统,系统包括:获取模块,用于获取标记好数据状态的历史电力数据集;其中,数据状态包含正常状态和异常状态,且异常状态至少分为:通信故障、设备故障、电网波动和用户行为异常;确定模块,用于通过先验算法,对历史电力数据集中异常状态的历史电力数据进行聚类;根据历史电力数据与聚类中心之间的曼哈顿距离,确定标准异常电力数据和各个聚类对应的曼哈顿距离范围;从待分析的电力数据中随机抽取若干数量的校准电力数据,并获得校准电力数据对应的第一数据状态;获取校准电力数据与标准异常电力数据之间的曼哈顿距离,进而确定校准电力数据对应的第二数据状态;滤除模块,用于根据若干数量的校准电力数据对应第一数据状态和第二数据状态的重合率,矫正曼哈顿距离范围,以在重合率大于预设重合率时,获得最终曼哈顿距离范围;基于先验算法和最终曼哈顿距离范围,从待分析的电力数据中滤除异常电力数据。
进一步地,确定模块包括获得单元,用于确定距离聚类中心的曼哈顿距离在预设聚类范围内的历史电力数据为标准异常电力数据;根据聚类中心和历史电力数据之间的曼哈顿距离,获得各个聚类对应的曼哈顿距离范围。
进一步地,确定模块包含确定单元,用于获取校准电力数据与各个标准异常电力数据之间的曼哈顿距离,以及确定标准异常电力数据对应聚类的曼哈顿距离范围;当曼哈顿距离落入曼哈顿距离范围时,确定标准异常电力数据对应聚类的数据状态为校准电力数据的第二数据状态。
进一步地,滤除模块包括矫正单元,用于获取第一数据状态与第二数据状态不一致的第一校准电力数据集;获得第一校准电力数据集对应的第一数据状态集合;其中,第一数据状态的实际内容,根据聚类至少分为:通信故障、设备故障、电网波动和用户行为异常;确定第一数据状态集合中各个实际内容对应的数量,确定数量最多的实际内容对应的聚类为矫正聚类;基于数量最多的实际内容对应的校准电力数据,从第一校准电力数据集中抽取第二校准电力数据集合;计算第二校准电力数据集合中各个校准电力数据与矫正聚类对应的标准异常电力数据之间的曼哈顿距离,获得最大曼哈顿距离;进而确定最大曼哈顿距离为矫正聚类对应的曼哈顿距离范围的最大范围值。
第三方面,本申请提供了一种电力数据预分析设备,设备包括:处理器;以及存储器,其上存储有可执行代码,当可执行代码被执行时,使得处理器执行如上述任一项的一种电力数据预分析方法。
第四方面,本申请提供了一种非易失性计算机存储介质,其上存储有计算机指令,计算机指令在被执行时实现如上述任一项的一种电力数据预分析方法。
本领域技术人员能够理解的是,本发明至少具有如下有益效果:
当数据本身存在较大缺陷时,本申请能对数据进行优化,滤除异常数据。
且本申请不同于传统的先验算法或后验算法,本申请能够通过待分析的电力数据进行曼哈顿距离范围的矫正。需要说明的是,本申请公开的曼哈顿距离范围矫正方法为选中矫正聚类进行单个聚类的曼哈顿范围矫正,不会影响其他聚类的取值范围(即不会影响其他聚类的精确筛选),最大可能地降低了修改曼哈顿距离范围带来的连锁反应。即使修改错误(扩大了异常区间),也仅仅是单个聚类的取值区间扩大,完全不会影响到其他聚类。
附图说明
下面参照附图来描述本公开的部分实施例,附图中:
图1是本申请实施例提供的一种电力数据预分析方法流程图。
图2是本申请实施例提供的一种电力数据预分析系统内部结构示意图。
图3为本申请实施例提供的一种电力数据预分析设备内部结构示意图。
具体实施方式
本领域技术人员应当理解的是,下文所描述的实施例仅仅是本公开的优选实施例,并不表示本公开仅能通过该优选实施例实现,该优选实施例仅仅是用于解释本公开的技术原理,并非用于限制本公开的保护范围。基于本公开提供的优选实施例,本领域普通技术人员在没有付出创造性劳动的情况下所获得的其它所有实施例,仍应落入到本公开的保护范围之内。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
下面通过附图对本申请实施例提出的技术方案进行详细的说明。
本申请实施例提供了一种电力数据预分析方法,如图1所示,本申请实施例提供的方法,主要包括以下步骤:
步骤110、获取标记好数据状态的历史电力数据集。
需要说明的是,数据状态包含正常状态和异常状态,且异常状态至少分为:通信故障、设备故障、电网波动和用户行为异常。此外,异常状态的具体内容可以根据实际情况做出调整。
步骤120、通过先验算法,对历史电力数据集中异常状态的历史电力数据进行聚类;根据历史电力数据与聚类中心之间的曼哈顿距离,确定标准异常电力数据和各个聚类对应的曼哈顿距离范围。
需要说明的是,先验算法可以为现有的任意可行的先验算法。计算曼哈顿距离的方法为现有方法,本申请不做限定。
其中,根据历史电力数据与聚类中心之间的曼哈顿距离,确定标准异常电力数据和各个聚类对应的曼哈顿距离范围,具体可以为:确定距离聚类中心的曼哈顿距离在预设聚类范围内的历史电力数据为标准异常电力数据;根据聚类中心和历史电力数据之间的曼哈顿距离,获得各个聚类对应的曼哈顿距离范围。需要说明的是,预设聚类范围为任意可行的距离,本领域技术人员可以根据实际情况确定。
步骤130、从待分析的电力数据中随机抽取若干数量的校准电力数据,并获得校准电力数据对应的第一数据状态;获取校准电力数据与标准异常电力数据之间的曼哈顿距离,进而确定校准电力数据对应的第二数据状态。
需要说明的是,这里的第一数据状态和第二数据状态均为步骤110中的数据状态,这里分为第一、第二仅仅是为了区分获取过程。
其中,获取校准电力数据与标准异常电力数据之间的曼哈顿距离,进而确定校准电力数据对应的第二数据状态,具体可以为:获取校准电力数据与各个标准异常电力数据之间的曼哈顿距离,以及确定标准异常电力数据对应聚类的曼哈顿距离范围;当曼哈顿距离落入曼哈顿距离范围时,确定标准异常电力数据对应聚类的数据状态为校准电力数据的第二数据状态。
步骤140、根据若干数量的校准电力数据对应第一数据状态和第二数据状态的重合率,矫正曼哈顿距离范围,以在重合率大于预设重合率时,获得最终曼哈顿距离范围;基于先验算法和最终曼哈顿距离范围,从待分析的电力数据中滤除异常电力数据。
需要说明的是,预设重合率为任意可行的数值,本领域技术人员可以根据实际情况确定。
其中,根据若干数量的校准电力数据对应第一数据状态和第二数据状态的重合率,矫正曼哈顿距离范围,以在重合率大于预设重合率时,获得最终曼哈顿距离范围,具体可以为:获取第一数据状态与第二数据状态不一致的第一校准电力数据集;获得第一校准电力数据集对应的第一数据状态集合;其中,第一数据状态的实际内容(通信故障、设备故障、电网波动和用户行为异常),根据聚类至少分为:通信故障、设备故障、电网波动和用户行为异常;确定第一数据状态集合中各个实际内容对应的数量,确定数量最多的实际内容对应的聚类为矫正聚类;基于数量最多的实际内容对应的校准电力数据,从第一校准电力数据集中抽取第二校准电力数据集合;计算第二校准电力数据集合中各个校准电力数据与矫正聚类对应的标准异常电力数据之间的曼哈顿距离,获得最大曼哈顿距离;进而确定最大曼哈顿距离为矫正聚类对应的曼哈顿距离范围的最大范围值。
除此之外,图2为本申请实施例提供的一种电力数据预分析系统。如图2所示,本申请实施例提供的系统,主要包括:
获取模块210,用于获取标记好数据状态的历史电力数据集;其中,数据状态包含正常状态和异常状态,且异常状态至少分为:通信故障、设备故障、电网波动和用户行为异常;
确定模块220,用于通过先验算法,对历史电力数据集中异常状态的历史电力数据进行聚类;根据历史电力数据与聚类中心之间的曼哈顿距离,确定标准异常电力数据和各个聚类对应的曼哈顿距离范围;从待分析的电力数据中随机抽取若干数量的校准电力数据,并获得校准电力数据对应的第一数据状态;获取校准电力数据与标准异常电力数据之间的曼哈顿距离,进而确定校准电力数据对应的第二数据状态;
具体地,确定模块220包括获得单元221,用于确定距离聚类中心的曼哈顿距离在预设聚类范围内的历史电力数据为标准异常电力数据;根据聚类中心和历史电力数据之间的曼哈顿距离,获得各个聚类对应的曼哈顿距离范围。
具体地,确定模块220包含确定单元222,用于获取校准电力数据与各个标准异常电力数据之间的曼哈顿距离,以及确定标准异常电力数据对应聚类的曼哈顿距离范围;当曼哈顿距离落入曼哈顿距离范围时,确定标准异常电力数据对应聚类的数据状态为校准电力数据的第二数据状态。
滤除模块230,用于根据若干数量的校准电力数据对应第一数据状态和第二数据状态的重合率,矫正曼哈顿距离范围,以在重合率大于预设重合率时,获得最终曼哈顿距离范围;基于先验算法和最终曼哈顿距离范围,从待分析的电力数据中滤除异常电力数据。
具体地,滤除模块230包括矫正单元231,用于获取第一数据状态与第二数据状态不一致的第一校准电力数据集;获得第一校准电力数据集对应的第一数据状态集合;其中,第一数据状态的实际内容,根据聚类至少分为:通信故障、设备故障、电网波动和用户行为异常;确定第一数据状态集合中各个实际内容对应的数量,确定数量最多的实际内容对应的聚类为矫正聚类;基于数量最多的实际内容对应的校准电力数据,从第一校准电力数据集中抽取第二校准电力数据集合;计算第二校准电力数据集合中各个校准电力数据与矫正聚类对应的标准异常电力数据之间的曼哈顿距离,获得最大曼哈顿距离;进而确定最大曼哈顿距离为矫正聚类对应的曼哈顿距离范围的最大范围值。
此外,本申请实施例还提供了一种用于电力数据预分析设备。如图3所示,该设备包括:处理器;以及存储器,其上存储有可执行代码,当可执行代码被执行时,使得处理器执行如上述实施例中的一种用于电力数据预分析方法。
具体地,服务器端获取标记好数据状态的历史电力数据集;其中,数据状态包含正常状态和异常状态,且异常状态至少分为:通信故障、设备故障、电网波动和用户行为异常;通过先验算法,对历史电力数据集中异常状态的历史电力数据进行聚类;根据历史电力数据与聚类中心之间的曼哈顿距离,确定标准异常电力数据和各个聚类对应的曼哈顿距离范围;从待分析的电力数据中随机抽取若干数量的校准电力数据,并获得校准电力数据对应的第一数据状态;获取校准电力数据与标准异常电力数据之间的曼哈顿距离,进而确定校准电力数据对应的第二数据状态;根据若干数量的校准电力数据对应第一数据状态和第二数据状态的重合率,矫正曼哈顿距离范围,以在重合率大于预设重合率时,获得最终曼哈顿距离范围;基于先验算法和最终曼哈顿距离范围,从待分析的电力数据中滤除异常电力数据。
除此之外,本申请实施例还提供了一种非易失性计算机存储介质,其上存储有可执行指令,在该可执行指令被执行时,实现如上述的一种用于电力数据预分析方法。
至此,已经结合前文的多个实施例描述了本公开的技术方案,但是,本领域技术人员容易理解的是,本公开的保护范围并不仅限于这些具体实施例。在不偏离本公开技术原理的前提下,本领域技术人员可以对上述各个实施例中的技术方案进行拆分和组合,也可以对相关技术特征作出等同的更改或替换,凡在本公开的技术构思和/或技术原理之内所做的任何更改、等同替换、改进等都将落入本公开的保护范围之内。
Claims (10)
1.一种电力数据预分析方法,其特征在于,所述方法包括:
获取标记好数据状态的历史电力数据集;其中,数据状态包含正常状态和异常状态,且异常状态至少分为:通信故障、设备故障、电网波动和用户行为异常;
通过先验算法,对历史电力数据集中异常状态的历史电力数据进行聚类;根据历史电力数据与聚类中心之间的曼哈顿距离,确定标准异常电力数据和各个聚类对应的曼哈顿距离范围;
从待分析的电力数据中随机抽取若干数量的校准电力数据,并获得校准电力数据对应的第一数据状态;获取校准电力数据与标准异常电力数据之间的曼哈顿距离,进而确定校准电力数据对应的第二数据状态;
根据若干数量的校准电力数据对应第一数据状态和第二数据状态的重合率,矫正曼哈顿距离范围,以在重合率大于预设重合率时,获得最终曼哈顿距离范围;基于先验算法和最终曼哈顿距离范围,从待分析的电力数据中滤除异常电力数据。
2.根据权利要求1所述的电力数据预分析方法,其特征在于,根据历史电力数据与聚类中心之间的曼哈顿距离,确定标准异常电力数据和各个聚类对应的曼哈顿距离范围,具体包括:
确定距离聚类中心的曼哈顿距离在预设聚类范围内的历史电力数据为标准异常电力数据;
根据聚类中心和历史电力数据之间的曼哈顿距离,获得各个聚类对应的曼哈顿距离范围。
3.根据权利要求1所述的电力数据预分析方法,其特征在于,获取校准电力数据与标准异常电力数据之间的曼哈顿距离,进而确定校准电力数据对应的第二数据状态,具体包括:
获取校准电力数据与各个标准异常电力数据之间的曼哈顿距离,以及确定标准异常电力数据对应聚类的曼哈顿距离范围;当曼哈顿距离落入曼哈顿距离范围时,确定标准异常电力数据对应聚类的数据状态为校准电力数据的第二数据状态。
4.根据权利要求1所述的电力数据预分析方法,其特征在于,根据若干数量的校准电力数据对应第一数据状态和第二数据状态的重合率,矫正曼哈顿距离范围,以在重合率大于预设重合率时,获得最终曼哈顿距离范围,具体包括:
获取第一数据状态与第二数据状态不一致的第一校准电力数据集;获得第一校准电力数据集对应的第一数据状态集合;其中,第一数据状态的实际内容,根据聚类至少分为:通信故障、设备故障、电网波动和用户行为异常;
确定第一数据状态集合中各个实际内容对应的数量,确定数量最多的实际内容对应的聚类为矫正聚类;
基于数量最多的实际内容对应的校准电力数据,从第一校准电力数据集中抽取第二校准电力数据集合;
计算第二校准电力数据集合中各个校准电力数据与矫正聚类对应的标准异常电力数据之间的曼哈顿距离,获得最大曼哈顿距离;进而确定最大曼哈顿距离为矫正聚类对应的曼哈顿距离范围的最大范围值。
5.一种电力数据预分析系统,其特征在于,所述系统包括:
获取模块,用于获取标记好数据状态的历史电力数据集;其中,数据状态包含正常状态和异常状态,且异常状态至少分为:通信故障、设备故障、电网波动和用户行为异常;
确定模块,用于通过先验算法,对历史电力数据集中异常状态的历史电力数据进行聚类;根据历史电力数据与聚类中心之间的曼哈顿距离,确定标准异常电力数据和各个聚类对应的曼哈顿距离范围;从待分析的电力数据中随机抽取若干数量的校准电力数据,并获得校准电力数据对应的第一数据状态;获取校准电力数据与标准异常电力数据之间的曼哈顿距离,进而确定校准电力数据对应的第二数据状态;
滤除模块,用于根据若干数量的校准电力数据对应第一数据状态和第二数据状态的重合率,矫正曼哈顿距离范围,以在重合率大于预设重合率时,获得最终曼哈顿距离范围;基于先验算法和最终曼哈顿距离范围,从待分析的电力数据中滤除异常电力数据。
6.根据权利要求5所述的电力数据预分析系统,其特征在于,确定模块包括获得单元,
用于确定距离聚类中心的曼哈顿距离在预设聚类范围内的历史电力数据为标准异常电力数据;根据聚类中心和历史电力数据之间的曼哈顿距离,获得各个聚类对应的曼哈顿距离范围。
7.根据权利要求5所述的电力数据预分析系统,其特征在于,确定模块包含确定单元,
用于获取校准电力数据与各个标准异常电力数据之间的曼哈顿距离,以及确定标准异常电力数据对应聚类的曼哈顿距离范围;当曼哈顿距离落入曼哈顿距离范围时,确定标准异常电力数据对应聚类的数据状态为校准电力数据的第二数据状态。
8.根据权利要求5所述的电力数据预分析系统,其特征在于,滤除模块包括矫正单元,
用于获取第一数据状态与第二数据状态不一致的第一校准电力数据集;获得第一校准电力数据集对应的第一数据状态集合;其中,第一数据状态的实际内容,根据聚类至少分为:通信故障、设备故障、电网波动和用户行为异常;确定第一数据状态集合中各个实际内容对应的数量,确定数量最多的实际内容对应的聚类为矫正聚类;基于数量最多的实际内容对应的校准电力数据,从第一校准电力数据集中抽取第二校准电力数据集合;计算第二校准电力数据集合中各个校准电力数据与矫正聚类对应的标准异常电力数据之间的曼哈顿距离,获得最大曼哈顿距离;进而确定最大曼哈顿距离为矫正聚类对应的曼哈顿距离范围的最大范围值。
9.一种电力数据预分析设备,其特征在于,所述设备包括:
处理器;
以及存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如权利要求1-4任一项所述的一种电力数据预分析方法。
10.一种非易失性计算机存储介质,其特征在于,其上存储有计算机指令,所述计算机指令在被执行时实现如权利要求1-4任一项所述的一种电力数据预分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310558859.3A CN116304763B (zh) | 2023-05-18 | 2023-05-18 | 一种电力数据预分析方法、系统、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310558859.3A CN116304763B (zh) | 2023-05-18 | 2023-05-18 | 一种电力数据预分析方法、系统、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116304763A true CN116304763A (zh) | 2023-06-23 |
CN116304763B CN116304763B (zh) | 2023-10-24 |
Family
ID=86781899
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310558859.3A Active CN116304763B (zh) | 2023-05-18 | 2023-05-18 | 一种电力数据预分析方法、系统、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116304763B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106780121A (zh) * | 2016-12-06 | 2017-05-31 | 广州供电局有限公司 | 一种基于用电负荷模式分析的用电异常识别方法 |
CN111242487A (zh) * | 2020-01-14 | 2020-06-05 | 北京唐颐惠康生物医学技术有限公司 | 一种基于workflow的动态精准任务分配方法及分配系统 |
CN112101765A (zh) * | 2020-09-08 | 2020-12-18 | 国网山东省电力公司菏泽供电公司 | 一种配电网运行指标数据异常数据处理方法及系统 |
US20210240822A1 (en) * | 2018-05-14 | 2021-08-05 | New H3C Security Technologies Co., Ltd. | Abnormal User Identification |
WO2022088890A1 (zh) * | 2020-10-28 | 2022-05-05 | 中国电力科学研究院有限公司 | 电网中长期检修计划的校核方法、系统、设备及存储介质 |
CN114821140A (zh) * | 2022-04-20 | 2022-07-29 | 咪咕文化科技有限公司 | 基于曼哈顿距离的图像聚类方法、终端设备及存储介质 |
EP4105681A1 (en) * | 2021-06-16 | 2022-12-21 | Easymile | Method and system for filtering out sensor data for a vehicle |
CN115696337A (zh) * | 2022-10-27 | 2023-02-03 | 中电福富信息科技有限公司 | 一种移动终端安全监测分析方法及装置 |
JP7240691B1 (ja) * | 2021-09-08 | 2023-03-16 | 山東大学 | データドライブの能動配電網異常状態検知方法及びシステム |
-
2023
- 2023-05-18 CN CN202310558859.3A patent/CN116304763B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106780121A (zh) * | 2016-12-06 | 2017-05-31 | 广州供电局有限公司 | 一种基于用电负荷模式分析的用电异常识别方法 |
US20210240822A1 (en) * | 2018-05-14 | 2021-08-05 | New H3C Security Technologies Co., Ltd. | Abnormal User Identification |
CN111242487A (zh) * | 2020-01-14 | 2020-06-05 | 北京唐颐惠康生物医学技术有限公司 | 一种基于workflow的动态精准任务分配方法及分配系统 |
CN112101765A (zh) * | 2020-09-08 | 2020-12-18 | 国网山东省电力公司菏泽供电公司 | 一种配电网运行指标数据异常数据处理方法及系统 |
WO2022088890A1 (zh) * | 2020-10-28 | 2022-05-05 | 中国电力科学研究院有限公司 | 电网中长期检修计划的校核方法、系统、设备及存储介质 |
EP4105681A1 (en) * | 2021-06-16 | 2022-12-21 | Easymile | Method and system for filtering out sensor data for a vehicle |
JP7240691B1 (ja) * | 2021-09-08 | 2023-03-16 | 山東大学 | データドライブの能動配電網異常状態検知方法及びシステム |
CN114821140A (zh) * | 2022-04-20 | 2022-07-29 | 咪咕文化科技有限公司 | 基于曼哈顿距离的图像聚类方法、终端设备及存储介质 |
CN115696337A (zh) * | 2022-10-27 | 2023-02-03 | 中电福富信息科技有限公司 | 一种移动终端安全监测分析方法及装置 |
Non-Patent Citations (2)
Title |
---|
DEEPAK SINWAR 等: "Study of Euclidean and Manhattan Distance Metrics using Simple K-Means Clustering", 《INTERNATIONAL JOURNAL FOR RESEARCH IN APPLIED SCIENCE AND ENGINEERING TECHNOLOGY(IJRASET)》, vol. 2, pages 270 - 274 * |
潘磊 等: "基于智能电表大数据的异常用电检测", 《计算技术与自动化》, vol. 39, no. 2, pages 177 - 183 * |
Also Published As
Publication number | Publication date |
---|---|
CN116304763B (zh) | 2023-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112162878B (zh) | 数据库故障发现方法、装置、电子设备及存储介质 | |
CN101470426B (zh) | 一种故障检测的方法和系统 | |
US20100082708A1 (en) | System and Method for Management of Performance Fault Using Statistical Analysis | |
CN115865649B (zh) | 一种智能运维管理控制方法、系统和存储介质 | |
CN111026738A (zh) | 区域人口监控方法、系统、电子设备及存储介质 | |
CN116739829B (zh) | 一种基于大数据的电力数据分析方法、系统及介质 | |
CN115529595A (zh) | 一种日志数据的异常检测方法、装置、设备及介质 | |
CN111586028B (zh) | 一种异常登录的评估方法、装置、服务器和存储介质 | |
CN113723861A (zh) | 异常用电行为检测方法、装置、计算机设备和存储介质 | |
CN117081965B (zh) | 一种内网应用负载在线监测系统 | |
CN116304763B (zh) | 一种电力数据预分析方法、系统、设备及介质 | |
CN115016976B (zh) | 一种根因定位方法、装置、设备及存储介质 | |
CN117827593A (zh) | 一种基于异常识别结果确定异常原因的方法和系统 | |
CN113869373A (zh) | 设备异常检测方法、装置、计算机设备和存储介质 | |
CN116107859B (zh) | 容器故障预测方法、装置、电子设备及存储介质 | |
CN116304776B (zh) | 基于k-Means算法的电网数据值异常检测方法及系统 | |
CN113743532B (zh) | 异常检测方法、装置、设备及计算机存储介质 | |
CN112131083B (zh) | 一种告警事务处理方法及装置 | |
CN116582410B (zh) | 一种基于itsm系统的智能运维服务方法及装置 | |
CN115277453B (zh) | 运维领域异常知识图谱的生成方法、应用方法和装置 | |
CN117808157B (zh) | 基于智能识别的未报备停电行为预测分析系统 | |
WO2024027127A1 (zh) | 故障检测方法、装置、电子设备及可读存储介质 | |
CN117350889B (zh) | 一种输电线路边缘计算与物联代理装置 | |
CN117522220A (zh) | 一种基于仪表日志的仪表管理方法及系统 | |
US20240289209A1 (en) | Method and apparatus for detecting and explaining anomalies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |