CN117910980A - 一种电力档案数据治理方法、系统、设备及介质 - Google Patents
一种电力档案数据治理方法、系统、设备及介质 Download PDFInfo
- Publication number
- CN117910980A CN117910980A CN202410308878.5A CN202410308878A CN117910980A CN 117910980 A CN117910980 A CN 117910980A CN 202410308878 A CN202410308878 A CN 202410308878A CN 117910980 A CN117910980 A CN 117910980A
- Authority
- CN
- China
- Prior art keywords
- data
- archive
- measurement data
- power
- power grid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000005259 measurement Methods 0.000 claims abstract description 150
- 230000000875 corresponding effect Effects 0.000 claims abstract description 37
- 238000013136 deep learning model Methods 0.000 claims abstract description 26
- 238000013523 data management Methods 0.000 claims abstract description 15
- 238000000605 extraction Methods 0.000 claims abstract description 12
- 230000002596 correlated effect Effects 0.000 claims abstract description 8
- 238000012512 characterization method Methods 0.000 claims description 28
- 238000012549 training Methods 0.000 claims description 21
- 230000006870 function Effects 0.000 claims description 16
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000007726 management method Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 4
- 238000013527 convolutional neural network Methods 0.000 claims description 4
- 125000004122 cyclic group Chemical group 0.000 claims description 3
- 230000009977 dual effect Effects 0.000 claims description 2
- 230000005611 electricity Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000010276 construction Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013439 planning Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Supply And Distribution Of Alternating Current (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种电力档案数据治理方法、系统、设备及介质,其属于电力档案数据治理技术领域,所述方案包括:获取待关联的实时电网量测数据及其预先对应的初始电力档案数据;分别对实时电网量测数据和初始电力档案数据进行特征提取,获得量测特征和初始档案特征;以所述量测特征和初始档案特征作为预先训练的深度学习模型的输入,获得量测特征与初始档案特征的关联度得分;根据所述关联度得分与预设阈值的比较结果,获得实时电网量测数据与其预先对应的初始电力档案数据的关联判别结果,并基于关联判别结果进行电力档案数据的治理。
Description
技术领域
本发明属于电力档案数据治理技术领域,尤其涉及一种电力档案数据治理方法、系统、设备及介质。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
电力档案包含了丰富的信息和数据,涵盖供电网络、设备、工程施工等多个领域,包括供电网路拓扑、设备台账、施工记录、电力工程规划、电力设备参数等众多方面的档案数据,档案数据往往是电力实体的静态属性信息记录,如站(供电站)-线(输电线路或馈线)-变(变压器)设备台账档案中,档案数据包含变电站信息、线路信息、变压器信息、变电站线路关系信息、线路变压器关系信息、台区信息、台区变压器关系、线路台区关系信息、台区用户关系信息等实体,各实体分别包含静态属性数据,如变压器信息包含变压器设备标识、变压器设备容量、变压器设备地址、变压器生效日期等;线路信息包含线路管线标志、线路公专标识、线路客户标志等;线路台区关系包含管线标识、配送站标识、线站关系类型等;这些属性数据一部分是通过从特定选项中选择录入、一部分是根据规则自动生成、还有一部分是通过手动录入。
发明人发现,现有的电网量测数据与电力档案的关联,通常是基于电网量测数据所对应量测点与电力档案之间的预设关系直接进行关联,但是,由于电力档案中的部分属性数据需要手动录入,在实际应用中很难避免手动录入错误,同时,还存在计划和最终安装实施不一致等导致的信息录入不匹配问题,如某台区A1、A2主要通过某线路B1进行配电,最终实际线路B1只包含台区A1,而A2通过线路B2进行配电,综上,当前急需一种能够实现电网量测数据与电力档案快速准确关联的方案。
发明内容
为克服上述现有技术的不足,本发明提供了一种电力档案数据治理方法、系统、设备及介质,所述方案基于实时电网量测数据及深度学习模型,实现电力档案数据的治理,避免了电网量测数据与电力档案之间早期关联的错误问题。
根据本发明实施例的第一个方面,提供了一种电力档案数据治理方法,包括:
获取待关联的实时电网量测数据及其预先对应的初始电力档案数据;
分别对实时电网量测数据和初始电力档案数据进行特征提取,获得量测特征和初始档案特征;
以所述量测特征和初始档案特征作为预先训练的深度学习模型的输入,获得量测特征与初始档案特征的关联度得分;
根据所述关联度得分与预设阈值的比较结果,获得实时电网量测数据与其预先对应的初始电力档案数据的关联判别结果,并基于关联判别结果进行电力档案数据的治理。
进一步的,所述深度学习模型采用双塔模型,所述双塔模型包括用于获取量测数据表征的量测塔、用于获取档案数据表征的档案塔以及用于计算量测数据表征和档案数据表征的相似度函数。
进一步的,所述量测塔和档案塔采用的神经网络类型为全连接网络、transform网络、卷积神经网络、循环神经网络或长短时记忆网络。
进一步的,所述深度学习模型的训练,具体为:
基于历史电网量测数据及其正确对应的电力档案数据,形成量测-档案二元组,基于所述二元组构建训练集的正样本集合;
基于正样本集合中任意正样本中的电网量测数据以及正样本集合中非当前正样本中的其它电力档案数据,形成量测-档案二元组,基于所述二元组构建训练集的负样本集合;
基于构建的训练集以及预先确定的损失函数,对所述深度学习模型进行训练,获得训练好的深度学习模型。
进一步的,所述深度学习模型的训练,以最大化正样本相似度,且最小化负样本相似度为目标进行训练,所述深度学习模型采用如下损失函数:
;
其中,C表示损失函数,为正样本得分,/>为负样本得分,/>为量测数据表征,/>为与/>正确关联的档案数据表征,/>为与/>错误关联的档案数据表征。
进一步的,基于关联判别结果进行电力档案数据的治理,具体为:
当关联度得分大于等于预设阈值时,判定实时电网量测数据与其预先对应的初始电力档案数据关联正确,将当前实时电网量测数据录入初始电力档案中即可;
当关联度得分小于预设阈值时,判定实时电网量测数据与其预先对应的初始电力档案数据关联错误,此时执行电力档案数据的治理措施。
进一步的,所述治理措施可以为:
将正确关联的电网量测数据和电力档案数据进行存储,获得正确关联数据集;
当判定实时电网量测数据与其预先对应的初始电力档案数据关联错误时,将实时电网量测数据与正确关联数据集中的电网量测数据进行相似度计算,以正确关联数据集中相似度最高的电网量测数据对应的电力档案数据作为实时电网量测数据对应的关联档案。
根据本发明实施例的第二个方面,提供了一种电力档案数据治理系统,包括:
数据获取单元,其用于获取待关联的实时电网量测数据及其预先对应的初始电力档案数据;
特征提取单元,其用于分别对实时电网量测数据和初始电力档案数据进行特征提取,获得量测特征和初始档案特征;
关联计算单元,其用于以所述量测特征和初始档案特征作为预先训练的深度学习模型的输入,获得量测特征与初始档案特征的关联度得分;
数据治理单元,其用于根据所述关联度得分与预设阈值的比较结果,进行实时电网量测数据与其预先对应的初始电力档案数据的关联判别,并基于关联判别结果进行电力档案数据的治理。
根据本公开实施例的第三个方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上运行的计算机程序,所述处理器执行所述程序时实现所述的一种电力档案数据治理方法。
根据本公开实施例的第四个方面,提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述的一种电力档案数据治理方法。
以上一个或多个技术方案存在以下有益效果:
(1)本发明提供了一种电力档案数据治理方法、系统、设备及介质,所述方案基于实时电网量测数据及深度学习模型,实现电力档案数据的治理,避免了电网量测数据与电力档案之间早期关联的错误问题。
(2)本发明所述方案基于实时电网量测数据,利用双塔模型训练得到的量测塔模型,和档案塔模型,将量测数据和电力档案数据两种差异较大的数据进行统一,通过计算可比较的相似度距离得分,实现量测数据和档案数据的关联比较来判断档案中关联关系是否存在误差,并通过量测数据之间的互相比较确定该量测数据的真正档案归属,可以快速实现电力档案数据治理,避免手工录入带来的档案数据误差。
(3)基于预先充分利用双塔模型线上快速召回排序的推理效果,基于本发明双塔模型的设计,可预先基于训练好的档案塔对所有档案进行特征提取,以构建档案数据表征集合,当具体执行本发明所述方案时,可仅计算实时获取的量测数据表征,基于获得的量测数据表征与档案数据表征集合中预存的档案数据表征直接进行相似度计算,能够有效满足量测实时性要求、以及量测数据的动态变化性。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明实施例中所述的一种电力档案数据治理方法流程图;
图2为本发明实施例中所述的双塔模型结构示意图;
图3为本发明实施例中所述的一种电力档案数据治理系统结构示意图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
术语解释:
双塔模型:该模型为推荐系统中应用非常广泛的经典模型,主要应用在召回阶段,同时也可以排序。双塔模型包含两部分,用户侧编码塔和商品侧编码塔,两塔分别在训练阶段训练用户和商户的embedding表示,即将不同方面的两者用相同维度的embedding表征,并计算两者的embedding相似度,相似度达到一定阈值的即认为两者相关,并且可通过相似度得分大小对相关性进行排序。
量测点:本领域技术人员应当清楚,对于量测数据的获取,需要预先构建量测模型,其主要由”量测对象-量测点-量测值”构成,量测对象包括电网设备、设备资产、用电计量点等,例如:变压器、断路器、隔离开关、线路、智能电表等,量测点则指的是量测对象具体的量测原子项,包括电流、电压、功率、电能量、状态(开或闭)等,比如电流表上的量测点即电流表的读数,可以反映电网中的电流大小;量测值即某测点的时序值,比如具体的电流电压的值。
实施例一
本实施例的目的是提供一种电力档案数据治理方法。
如图1所示,一种电力档案数据治理方法,包括:
获取待关联的实时电网量测数据及其预先对应的初始电力档案数据;
分别对实时电网量测数据和初始电力档案数据进行特征提取,获得量测特征和初始档案特征;
以所述量测特征和初始档案特征作为预先训练的深度学习模型的输入,获得量测特征与初始档案特征的关联度得分;
根据所述关联度得分与预设阈值的比较结果,获得实时电网量测数据与其预先对应的初始电力档案数据的关联判别结果,并基于关联判别结果进行电力档案数据的治理。
需要说明的是,从量测点获取的电网量测数据均预先关联有初始电力档案数据,其中,所述电网量测数据主要包括:主配网电类/非电类接入数据范围(如电压、电流或功率)、数据类型(如离散型、描述型或统计型)、数据频率(如秒级、分钟级)等 ,例如遥测类,户表的电压、电流、有功功率、无功功率(分钟级);配合用电终端上报的告警事件(秒级);上述电网量测数据可基于现有的电网数据采集系统来得到,此处不再赘述;
在一个或多个实施方式中,所述电网量测数据中还可以包括气温、气候、光照等环境信息。
所述电力档案数据(本实施例主要针对站(变电站)-线(输电线路或馈线)-变(变压器)关系和台(台区)-变(变压器)-户(用户)关系档案数据)主要包括:变电站档案数据、线路档案数据、变压器档案数据、台区档案数据以及变电站-线路关系档案数据、线路-变压器关系档案数据、台区-变压器关系档案数据和台区用户关系档案数据等;电网量测数据对应的电力档案数据可从现有的电网PMS(Power Management System:电力管理系统)系统或营销系统中获得,此处不再赘述。
在具体实施中,所述深度学习模型采用双塔模型,所述双塔模型包括用于获取量测数据表征的量测塔、用于获取档案数据表征的档案塔以及用于计算量测数据表征和档案数据表征的相似度函数;如图2所示展示了双塔模型的基本结构。
其中,所述相似度函数可采用余弦相似度。
在具体实施中,所述量测塔和档案塔采用的神经网络类型为全连接网络、transform网络、卷积神经网络、循环神经网络或长短时记忆网络。
在具体实施中,所述深度学习模型的训练,具体为:
基于历史电网量测数据及其正确对应的电力档案数据,形成量测-档案二元组,基于所述二元组构建训练集的正样本集合;
基于正样本集合中任意正样本中的电网量测数据以及正样本集合中非当前正样本中的其它电力档案数据,形成量测-档案二元组,基于所述二元组构建训练集的负样本集合;
基于构建的训练集以及预先确定的损失函数,对所述深度学习模型进行训练,获得训练好的深度学习模型。
在一个或多个实施方式中,用于构建训练集的历史电网量测数据及其正确对应的电力档案数据需要预先进行数据处理和特征构造,具体包括如下处理过程:
电网量测数据:
量测设备ID:量测设备的唯一标识;
统计型特征:考虑采集频率和数据特性,按照秒、分、时、天等时间窗口获得量测统计型特征,如电压,针对各秒级电压数据,形成分维度的统计字段,例如:平均电压、最大电压、最小电压等字段值;如用电量,形成累计用电量、平均用电量等统计字段;
描述型特征:结合量测数据各字段含义,获得量测描述性特征,例如:利用电压方差统计预设时间窗口内的波动、当天用电高峰集中区间、用电总时长等字段;
离散型特征:结合如量测中心事件数据,获取离散特征,如是否发生开关刀闸、是否异常停电或计划停电等特征。
在具体实施中,本实施例所述方案基于量测相关数据(包括量测设备ID、上述的量测统计特征、量测描述特征以及量测离散特征),通过整合形成初始量测特征;其中:
电力档案数据:
以电力档案接入数据整理档案侧特征,分不同维度分别整理,收集不同维度档案的数据记录,获取该记录中的字段并通过加工处理最终形成档案相关数据,形成初始档案特征。
例如:针对变电站-线路-变压器档案,整合变电站特征,如变电站标识、变电站设备容量、变电站详细地址、变电站枢纽站编码、入线标识等;整合线路特征,如管线标识、公专标识、单位长度管线抗、管线规格、承压、有损无损标志、相似地址、客户标识等;以变电站档案信息中的外键如管线标识关联线路档案信息,形成汇总特征,以汇总后的特征作为初始档案特征。
最后,对初始量测特征和初始档案特征分别做数据预处理,比如对于电压、电流、停电时长等连续性特征采用归一化处理;对离散特征如有损无损标志做one-hot编码,one-hot编码比如有损无损标志分别有有损、无损两种取值,可验证为2个特征,是否有损和是否无损,当有损无损标志为有损时,则是否有损为1,是否无损为0;获得最终的量测特征和档案特征。
需要说明的是,对于获取待关联的实时电网量测数据及其预先对应的初始电力档案数据也需要进行上述数据处理和特征构造,获得量测特征和初始档案特征。
在具体实施中,所述深度学习模型的训练,以最大化正样本相似度,且最小化负样本相似度为目标进行训练。
在具体实施中,所述深度学习模型采用如下损失函数:
;
其中,C表示损失函数,为正样本得分,/>为负样本得分,/>为量测数据表征,/>为与/>正确关联的档案数据表征,/>为与/>错误关联的档案数据表征。
在具体实施中,基于关联判别结果进行电力档案数据的治理,具体为:
当关联度得分大于等于预设阈值时,判定实时电网量测数据与其预先对应的初始电力档案数据关联正确,将当前实时电网量测数据录入初始电力档案中即可;
当关联度得分小于预设阈值时,判定实时电网量测数据与其预先对应的初始电力档案数据关联错误,此时执行电力档案数据的治理措施。
在一个或多个实施方式中,所述治理措施可以为:
将正确关联的电网量测数据和电力档案数据进行存储,获得正确关联数据集;
当判定实时电网量测数据与其预先对应的初始电力档案数据关联错误时,将实时电网量测数据与正确关联数据集中的电网量测数据进行相似度计算,以正确关联数据集中相似度最高的电网量测数据对应的电力档案数据作为实时电网量测数据对应的关联档案。
具体的,所述相似度计算,可采用如下策略:
对于实时电网量测数据与正确关联数据集中的电网量测数据,分别基于所述双塔模型中的量测塔获得量测数据表征;
基于实时电网量测数据与正确关联数据集中的电网量测数据对应的量测数据表征,计算两者的余弦相似度。
理论上,双塔模型训练越准,该损失函数C越小,故在本实施例中,训练双塔模型采用梯度下降法,对损失函数进行优化来减小损失,并基于该损失函数,同时训练量测塔和档案塔的embedding模型。
在一个或多个实施方式中,基于本实施例双塔模型的设计,可预先基于训练好的档案塔对所有档案进行特征提取,以构建档案数据表征集合,当具体执行本发明所述方案时,可仅计算实时获取的量测数据表征,基于获得的量测数据表征与档案数据表征集合中预存的档案数据表征直接进行相似度计算,能够有效满足量测实时性要求、以及量测数据的动态变化性。
在一个或多个实施方式中,量测塔和档案塔的embedding模型可以为任意一种神经网络,可以是简单的全连接网络,也可以是复杂的transform网络,还可以为卷积神经网络(CNN)、循环神经网络(RNN)、长短时记忆网络(LSTM)等等其它神经网络模型。
实施例二
本实施例的目的是提供一种电力档案数据治理系统。
如图3所示,一种电力档案数据治理系统,包括:
数据获取单元,其用于获取待关联的实时电网量测数据及其预先对应的初始电力档案数据;
特征提取单元,其用于分别对实时电网量测数据和初始电力档案数据进行特征提取,获得量测特征和初始档案特征;
关联计算单元,其用于以所述量测特征和初始档案特征作为预先训练的深度学习模型的输入,获得量测特征与初始档案特征的关联度得分;
数据治理单元,其用于根据所述关联度得分与预设阈值的比较结果,进行实时电网量测数据与其预先对应的初始电力档案数据的关联判别,并基于关联判别结果进行电力档案数据的治理。
此处需要说明的是,本实施例中的各个模块与实施例一中的各个步骤一一对应,其具体实施过程相同,此处不再累述。
在更多实施例中,还提供:
一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成实施例一中所述的方法。为了简洁,在此不再赘述。
应理解,本实施例中,处理器可以是中央处理单元CPU,处理器还可以是其他通用处理器、数字信号处理器DSP、专用集成电路ASIC,现成可编程门阵列FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据、存储器的一部分还可以包括非易失性随机存储器。例如,存储器还可以存储设备类型的信息。
一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例一中所述的方法。
实施例一中的方法可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器、闪存、只读存储器、可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。为避免重复,这里不再详细描述。
本领域普通技术人员可以意识到,结合本实施例描述的各示例的单元即算法步骤,能够以电子硬件或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (10)
1.一种电力档案数据治理方法,其特征在于,包括:
获取待关联的实时电网量测数据及其预先对应的初始电力档案数据;
分别对实时电网量测数据和初始电力档案数据进行特征提取,获得量测特征和初始档案特征;
以所述量测特征和初始档案特征作为预先训练的深度学习模型的输入,获得量测特征与初始档案特征的关联度得分;
根据所述关联度得分与预设阈值的比较结果,获得实时电网量测数据与其预先对应的初始电力档案数据的关联判别结果,并基于关联判别结果进行电力档案数据的治理。
2.如权利要求1所述的一种电力档案数据治理方法,其特征在于,所述深度学习模型采用双塔模型,所述双塔模型包括用于获取量测数据表征的量测塔、用于获取档案数据表征的档案塔以及用于计算量测数据表征和档案数据表征的相似度函数。
3.如权利要求2所述的一种电力档案数据治理方法,其特征在于,所述量测塔和档案塔采用的神经网络类型为全连接网络、transform网络、卷积神经网络、循环神经网络或长短时记忆网络。
4.如权利要求1所述的一种电力档案数据治理方法,其特征在于,所述深度学习模型的训练,具体为:
基于历史电网量测数据及其正确对应的电力档案数据,形成量测-档案二元组,基于所述二元组构建训练集的正样本集合;
基于正样本集合中任意正样本中的电网量测数据以及正样本集合中非当前正样本中的其它电力档案数据,形成量测-档案二元组,基于所述二元组构建训练集的负样本集合;
基于构建的训练集以及预先确定的损失函数,对所述深度学习模型进行训练,获得训练好的深度学习模型。
5.如权利要求1所述的一种电力档案数据治理方法,其特征在于,所述深度学习模型的训练,以最大化正样本相似度,且最小化负样本相似度为目标进行训练,所述深度学习模型采用如下损失函数:
;
其中,C表示损失函数,为正样本得分,/>为负样本得分,/>为量测数据表征,/>为与/>正确关联的档案数据表征,/>为与/>错误关联的档案数据表征。
6.如权利要求1所述的一种电力档案数据治理方法,其特征在于,基于关联判别结果进行电力档案数据的治理,具体为:
当关联度得分大于等于预设阈值时,判定实时电网量测数据与其预先对应的初始电力档案数据关联正确,将当前实时电网量测数据录入初始电力档案中即可;
当关联度得分小于预设阈值时,判定实时电网量测数据与其预先对应的初始电力档案数据关联错误,此时执行电力档案数据的治理措施。
7.如权利要求6所述的一种电力档案数据治理方法,其特征在于,所述治理措施具体为:
将正确关联的电网量测数据和电力档案数据进行存储,获得正确关联数据集;
当判定实时电网量测数据与其预先对应的初始电力档案数据关联错误时,将实时电网量测数据与正确关联数据集中的电网量测数据进行相似度计算,以正确关联数据集中相似度最高的电网量测数据对应的电力档案数据作为实时电网量测数据对应的关联档案。
8.一种电力档案数据治理系统,其特征在于,包括:
数据获取单元,其用于获取待关联的实时电网量测数据及其预先对应的初始电力档案数据;
特征提取单元,其用于分别对实时电网量测数据和初始电力档案数据进行特征提取,获得量测特征和初始档案特征;
关联计算单元,其用于以所述量测特征和初始档案特征作为预先训练的深度学习模型的输入,获得量测特征与初始档案特征的关联度得分;
数据治理单元,其用于根据所述关联度得分与预设阈值的比较结果,进行实时电网量测数据与其预先对应的初始电力档案数据的关联判别,并基于关联判别结果进行电力档案数据的治理。
9.一种电子设备,包括存储器、处理器及存储在存储器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7任一项所述的一种电力档案数据治理方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7任一项所述的一种电力档案数据治理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410308878.5A CN117910980B (zh) | 2024-03-19 | 2024-03-19 | 一种电力档案数据治理方法、系统、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410308878.5A CN117910980B (zh) | 2024-03-19 | 2024-03-19 | 一种电力档案数据治理方法、系统、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117910980A true CN117910980A (zh) | 2024-04-19 |
CN117910980B CN117910980B (zh) | 2024-06-11 |
Family
ID=90684178
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410308878.5A Active CN117910980B (zh) | 2024-03-19 | 2024-03-19 | 一种电力档案数据治理方法、系统、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117910980B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109472293A (zh) * | 2018-10-12 | 2019-03-15 | 国家电网有限公司 | 一种基于机器学习的电网设备档案数据纠错方法 |
CN113032580A (zh) * | 2021-03-29 | 2021-06-25 | 浙江星汉信息技术股份有限公司 | 关联档案推荐方法、系统及电子设备 |
CN113919427A (zh) * | 2021-10-15 | 2022-01-11 | 国网宁夏电力有限公司 | 一种电力设备档案类数据治理方法及系统 |
CN114511058A (zh) * | 2022-01-27 | 2022-05-17 | 国网江苏省电力有限公司泰州供电分公司 | 一种用于电力用户画像的负荷元件构建方法及装置 |
CN114610865A (zh) * | 2022-03-11 | 2022-06-10 | 平安科技(深圳)有限公司 | 召回文本推荐方法、装置、设备及存储介质 |
WO2022134805A1 (zh) * | 2020-12-21 | 2022-06-30 | 深圳壹账通智能科技有限公司 | 文档分类预测方法、装置、计算机设备及存储介质 |
CN115795018A (zh) * | 2023-02-13 | 2023-03-14 | 广州海昇计算机科技有限公司 | 一种面向电网领域的多策略智能搜索问答方法及系统 |
CN115795131A (zh) * | 2023-02-10 | 2023-03-14 | 山东能源数智云科技有限公司 | 基于人工智能的电子档案分类方法、装置及电子设备 |
CN116662488A (zh) * | 2023-06-12 | 2023-08-29 | 平安科技(深圳)有限公司 | 业务文档检索方法、装置、设备及存储介质 |
CN116680401A (zh) * | 2023-06-16 | 2023-09-01 | 平安科技(深圳)有限公司 | 文档处理方法、文档处理装置、设备及存储介质 |
-
2024
- 2024-03-19 CN CN202410308878.5A patent/CN117910980B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109472293A (zh) * | 2018-10-12 | 2019-03-15 | 国家电网有限公司 | 一种基于机器学习的电网设备档案数据纠错方法 |
WO2022134805A1 (zh) * | 2020-12-21 | 2022-06-30 | 深圳壹账通智能科技有限公司 | 文档分类预测方法、装置、计算机设备及存储介质 |
CN113032580A (zh) * | 2021-03-29 | 2021-06-25 | 浙江星汉信息技术股份有限公司 | 关联档案推荐方法、系统及电子设备 |
CN113919427A (zh) * | 2021-10-15 | 2022-01-11 | 国网宁夏电力有限公司 | 一种电力设备档案类数据治理方法及系统 |
CN114511058A (zh) * | 2022-01-27 | 2022-05-17 | 国网江苏省电力有限公司泰州供电分公司 | 一种用于电力用户画像的负荷元件构建方法及装置 |
CN114610865A (zh) * | 2022-03-11 | 2022-06-10 | 平安科技(深圳)有限公司 | 召回文本推荐方法、装置、设备及存储介质 |
CN115795131A (zh) * | 2023-02-10 | 2023-03-14 | 山东能源数智云科技有限公司 | 基于人工智能的电子档案分类方法、装置及电子设备 |
CN115795018A (zh) * | 2023-02-13 | 2023-03-14 | 广州海昇计算机科技有限公司 | 一种面向电网领域的多策略智能搜索问答方法及系统 |
CN116662488A (zh) * | 2023-06-12 | 2023-08-29 | 平安科技(深圳)有限公司 | 业务文档检索方法、装置、设备及存储介质 |
CN116680401A (zh) * | 2023-06-16 | 2023-09-01 | 平安科技(深圳)有限公司 | 文档处理方法、文档处理装置、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
张丽娜;马喆;周阳;李志强;陈璐;王红宇;杨志斌;: "采用数值风洞模型对热电厂烟塔合一大气污染扩散的研究", 环境污染与防治, no. 04, 15 April 2013 (2013-04-15) * |
Also Published As
Publication number | Publication date |
---|---|
CN117910980B (zh) | 2024-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116628529B (zh) | 一种用于用户侧智能负荷控制系统的数据异常检测方法 | |
CN109101986A (zh) | 基于栈式降噪自编码器的输变电设备状态异常检测方法和系统 | |
CN116304962B (zh) | 一种用于水表计量数据的智能异常监测方法 | |
CN112001644B (zh) | 一种配电网运行可靠性检测方法、装置、终端及存储介质 | |
CN112418687B (zh) | 基于用电特征的用户用电异常识别方法、装置和存储介质 | |
CN110874381B (zh) | 一种基于空间密度聚类的用户侧负荷数据异常值识别方法 | |
CN107942994A (zh) | 一种基于温度曲线特征的卫星温控系统故障诊断方法 | |
Dash et al. | An appliance load disaggregation scheme using automatic state detection enabled enhanced integer programming | |
CN117787572B (zh) | 一种异常用电用户识别方法、装置、存储介质及电子设备 | |
CN115456034A (zh) | 一种电动自行车充电自动识别监测方法及系统 | |
CN115796708A (zh) | 一种工程建设用的大数据智能质检方法、系统和介质 | |
CN116203351A (zh) | 线路阻抗异常的检测方法及系统 | |
CN117910980B (zh) | 一种电力档案数据治理方法、系统、设备及介质 | |
CN117154716B (zh) | 一种分布式电源接入配电网的规划方法及系统 | |
Jain et al. | A clustering framework for residential electric demand profiles | |
CN112990730B (zh) | 一种利用人为采集失败增强电量相关性特征的方法 | |
CN117932501A (zh) | 一种电能表运行状态管理方法和系统 | |
CN107274025B (zh) | 一种实现用电模式智能识别与管理的系统和方法 | |
CN115526275B (zh) | 一种用于用电安全的远程多源数据监测分析方法及系统 | |
CN111060755A (zh) | 一种电磁干扰诊断方法和装置 | |
CN112215420B (zh) | 一种居民用电的客户过户识别方法及系统 | |
CN112732772A (zh) | 一种基于月度居民用电量的住房空置率测算方法 | |
CN112241812A (zh) | 基于单边优化与遗传算法协作的低压配电网拓扑识别方法 | |
CN111080068A (zh) | 一种电能表运行状态评价方法和装置 | |
CN117175568B (zh) | 一种工业园区用电智能规划方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |