CN115130620A - 一种电力设备用电模式识别模型生成方法及装置 - Google Patents
一种电力设备用电模式识别模型生成方法及装置 Download PDFInfo
- Publication number
- CN115130620A CN115130620A CN202211050905.0A CN202211050905A CN115130620A CN 115130620 A CN115130620 A CN 115130620A CN 202211050905 A CN202211050905 A CN 202211050905A CN 115130620 A CN115130620 A CN 115130620A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- labeled
- training set
- labeling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 86
- 238000012549 training Methods 0.000 claims abstract description 156
- 238000002372 labelling Methods 0.000 claims abstract description 96
- 238000003062 neural network model Methods 0.000 claims abstract description 44
- 238000003909 pattern recognition Methods 0.000 claims abstract description 34
- 238000003860 storage Methods 0.000 claims abstract description 14
- 239000013598 vector Substances 0.000 claims description 44
- 238000004590 computer program Methods 0.000 claims description 34
- 238000004422 calculation algorithm Methods 0.000 claims description 18
- 238000012216 screening Methods 0.000 claims description 18
- 230000005611 electricity Effects 0.000 claims description 14
- 238000010276 construction Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 9
- 238000005516 engineering process Methods 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 20
- 238000004364 calculation method Methods 0.000 description 18
- 238000007781 pre-processing Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 230000004913 activation Effects 0.000 description 9
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000005070 sampling Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 206010033307 Overweight Diseases 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012567 pattern recognition method Methods 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Biophysics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Primary Health Care (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开涉及电力数据智能处理技术领域,特别是涉及一种电力设备用电模式识别模型生成方法、装置、计算机设备和存储介质。所述方法包括:获取电力负荷数据以及用电数据,将电力负荷数据与用电数据随机组合并构造为待标注数据对;对预设比例的待标注数据对赋予数据标签,获取已标注数据对,并与剩余待标注数据合并为初始训练集;构建神经网络模型,基于初始训练集将神经网络模型训练至收敛,获取标注模型;通过标注模型对初始训练集中待标注数据对进行伪标注,获取弱监督训练集;基于弱监督训练集将标注模型训练至收敛,获取识别模型。采用本方法能够精确及高效度量电力负荷数据与用电数据相关性。
Description
技术领域
本公开涉及电力数据智能处理技术领域,特别是涉及一种电力设备用电模式识别模型生成方法及装置。
背景技术
电力系统与现代生活、生产中各领域的活动紧密相关,是居民生存与国家发展的关键。工业用电占国家总用电量的大部分,为了提高电力资源的利用效率、优化电力资源分配结构,需要对电力资源的技术指标进行计算。在应用中,存在部分技术指标难以直接通过计算或测量获取,而掌握不同电气设备负荷与用电量之间的相关性可以辅助技术人员从设备侧进行间接推论,从而有助于方便快捷地对相关技术指标进行计算。具体的,可以先对电气设备的重要性进行评估判定,依据其重要性向电气设备分配相应的权重,高权重的电气设备与电力系统相关性更强,因此也具有更高的分析价值。
目前,通常使用的用于电气设备负荷分析的技术大部分都基于神经网络,即在对数据进行预处理后,通过基于神经网络的聚类算法实现对电气设备负荷的用电模式识别工作,例如:通过DBSCAN和K-means算法进行用电模式识别,基于K-means和HAC算法的用电负荷二次聚类等。
然而,目前通过基于神经网络的聚类算法处理电气设备的应用中,通常使用欧氏距离、曼哈顿距离等现有距离公式作为对象间距的度量依据,但欧式距离等公式涉及的距离计算较为片面单一,而电力负荷数据通常涉及复杂的公式计算,因此常规的聚类算法难以良好地适配电力负荷数据,难以保证结果的准确性。
发明内容
基于此,有必要针对上述技术问题,提供一种能够精确及高效度量电力负荷数据与用电数据相关性的一种电力设备用电模式识别模型生成方法、装置、计算机设备和计算机可读存储介质。
第一方面,本公开提供了一种电力设备用电模式识别模型生成方法。所述方法包括:
获取电力负荷数据以及用电数据,将所述电力负荷数据与所述用电数据随机组合为待标注数据对;
对预设比例的所述待标注数据对赋予数据标签,获取已标注数据对,并与剩余所述待标注数据合并为初始训练集;
构建神经网络模型,基于所述初始训练集将所述神经网络模型训练至收敛,获取标注模型;
通过所述标注模型对所述初始训练集中待标注数据对进行伪标注,获取弱监督训练集;
基于所述弱监督训练集将所述标注模型训练至收敛,获取识别模型。
在其中一个实施例中,所述对预设比例的所述待标注数据对赋予数据标签,获取已标注数据对包括:
通过预设的相似度算法计算所述待标注数据的相似度;
筛选出所述相似度高于预设的强相似阈值或低于预设的弱相似阈值的可标注数据对;
以所述相似度作为所述可标注数据对的初始相似性,将所述可标注数据对标注为已标注数据对。
在其中一个实施例中,所述构建神经网络模型包括:
构建神经网络模型,所述神经网络模型包括特征网络模块以及相似网络模块;
所述特征网络模块用于将所述初始训练集中的样本转化为特征向量;
所述相似网络模块用于获取所述特征向量之间的相似度。
在其中一个实施例中,所述基于所述相似网络模块获取所述特征向量之间的相似度之前,还包括:
获取所述特征网络模块输出的特征向量;
对所述特征向量进行预处理,所述预处理至少包括维度转化以及信息筛选。
在其中一个实施例中,所述通过所述标注模型对所述初始训练集中待标注数据对进行伪标注,获取弱监督训练集包括:
通过所述标注模型对所述初始训练集中待标注数据对进行伪标注,获取伪标注数据对;
基于预设的比例将指定数量的所述已标注数据对与所述伪标注数据对拼接为所述弱监督训练集。
在其中一个实施例中,所述基于预设的比例将指定数量的所述已标注数据对与所述伪标注数据对拼接为所述弱监督训练集包括:
按照指定数量将所述伪标注数据对分组;
将所述已标注数据对与分组后伪标注数据对遍历拼接,获取弱监督训练集。
第二方面,本公开还提供一种电力设备用电模式识别方法。所述方法包括:
获取目标设备的目标电力负荷数据以及目标用电数据;
将所述目标电力负荷数据以及目标用电数据输入预先构建的识别模型,获取目标设备的相关性识别结果,所述识别模型包括如第一方面任一所述的方法生成的识别模型。
第三方面,本公开还提供了一种电力设备用电模式识别模型生成装置。所述装置包括:
数据构造模块,用于获取电力负荷数据以及用电数据,将所述电力负荷数据与所述用电数据随机组合为待标注数据对;
数据标注模块,用于对预设比例的所述待标注数据对赋予数据标签,获取已标注数据对,并与剩余所述待标注数据合并为初始训练集;
标注模型模块,用于构建神经网络模型,基于所述初始训练集将所述神经网络模型训练至收敛,获取标注模型;
数据伪标注模块,用于通过所述标注模型对所述初始训练集中待标注数据对进行伪标注,获取弱监督训练集;
识别模型模块,用于基于所述弱监督训练集将所述标注模型训练至收敛,获取识别模型。
在一个实施例中,所述数据标注模块包括:
相似计算模块,用于通过预设的相似度算法计算所述待标注数据的相似度;
标注筛选模块,用于筛选出所述相似度高于预设的强相似阈值或低于预设的弱相似阈值的可标注数据对;
极端标注模块,用于以所述相似度作为所述可标注数据对的初始相似性,将所述可标注数据对标注为已标注数据对。
在一个实施例中,所述标注模型模块包括:
模型构建模块,用于构建神经网络模型,所述神经网络模型包括特征网络模块以及相似网络模块;
特征模型模块,用于通过所述特征网络模块将所述初始训练集中的样本转化为特征向量;
相似模型模块,用于基于所述相似网络模块获取所述特征向量之间的相似度。
在一个实施例中,所述标注模型模块包括:
向量获取模块,用于获取所述特征网络模块输出的特征向量;
向量预处理模块,用于对所述特征向量进行预处理,所述预处理至少包括维度转化以及信息筛选。
在一个实施例中,所述识别模型模块包括:
伪标注模块,用于通过所述标注模型对所述初始训练集中待标注数据对进行伪标注,获取伪标注数据对;
训练集拼接模块,用于基于预设的比例将指定数量的所述已标注数据对与所述伪标注数据对拼接为所述弱监督训练集样本。
在一个实施例中,所述识别模型模块包括:
伪标注数据对分组模块,用于按照指定数量将所述伪标注数据对分组;
遍历拼接模块,用于将所述已标注数据对与分组后伪标注数据对遍历拼接,获取弱监督训练集。
第四方面,本公开还提供了一种电力设备用电模式识别装置。所述装置包括:
数据采集模块,用于获取目标设备的目标电力负荷数据以及目标用电数据;
相关性识别模块,用于将所述目标电力负荷数据以及目标用电数据输入预先构建的识别模型,获取目标设备的相关性识别结果,所述识别模型包括如第一方面任一所述的方法生成的识别模型。
第五方面,本公开还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取电力负荷数据以及用电数据,将所述电力负荷数据与所述用电数据随机组合并构造为待标注数据对;
对预设比例的所述待标注数据对赋予数据标签,获取已标注数据对,并与剩余所述待标注数据合并为初始训练集;
构建神经网络模型,基于所述初始训练集将所述神经网络模型训练至收敛,获取标注模型;
通过所述标注模型对所述初始训练集中待标注数据对进行伪标注,获取弱监督训练集;
基于所述弱监督训练集将所述标注模型训练至收敛,获取识别模型。
第六方面,本公开还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取目标设备的目标电力负荷数据以及目标用电数据;
将所述目标电力负荷数据以及目标用电数据输入预先构建的识别模型,获取目标设备的相关性识别结果,所述识别模型包括如第一方面任一所述的方法生成的识别模型。
第七方面,本公开还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取电力负荷数据以及用电数据,将所述电力负荷数据与所述用电数据随机组合并构造为待标注数据对;
对预设比例的所述待标注数据对赋予数据标签,获取已标注数据对,并与剩余所述待标注数据合并为初始训练集;
构建神经网络模型,基于所述初始训练集将所述神经网络模型训练至收敛,获取标注模型;
通过所述标注模型对所述初始训练集中待标注数据对进行伪标注,获取弱监督训练集;
基于所述弱监督训练集将所述标注模型训练至收敛,获取识别模型。
第八方面,本公开还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取目标设备的目标电力负荷数据以及目标用电数据;
将所述目标电力负荷数据以及目标用电数据输入预先构建的识别模型,获取目标设备的相关性识别结果,所述识别模型包括如第一方面任一所述的方法生成的识别模型。
第九方面,本公开还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取电力负荷数据以及用电数据,将所述电力负荷数据与所述用电数据随机组合并构造为待标注数据对;
对预设比例的所述待标注数据对赋予数据标签,获取已标注数据对,并与剩余所述待标注数据合并为初始训练集;
构建神经网络模型,基于所述初始训练集将所述神经网络模型训练至收敛,获取标注模型;
通过所述标注模型对所述初始训练集中待标注数据对进行伪标注,获取弱监督训练集;
基于所述弱监督训练集将所述标注模型训练至收敛,获取识别模型。
第十方面,本公开还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取目标设备的目标电力负荷数据以及目标用电数据;
将所述目标电力负荷数据以及目标用电数据输入预先构建的识别模型,获取目标设备的相关性识别结果,所述识别模型包括如第一方面任一所述的方法生成的识别模型。
上述一种电力设备用电模式识别模型生成方法、装置、计算机设备、存储介质和计算机程序产品,至少包括以下有益效果:
本公开在计算电力设备的电力负荷数据与用电数据的相关性时,通过对极端的强相似与弱相似样本进行标注,获取了少量的被标注的样本,由于被标注的样本的相似度属于极端情况,因此标注结果的准确度较高,从而在大量数据缺少数据标签的情况下,本公开得以通过少量的、被精确标注的样本训练神经网络模型,以获得初步的、能够计算电力负荷数据的相关性的标注模型。进一步地,本公开运用标注模型对待标注数据对赋予伪标注,并构建出新的训练集以训练模型。此时,弱监督训练集中包括少量被精确标注的已标注数据对以及大量被模糊标注的伪标注数据对,从而构成了弱监督学习的架构。在弱监督学习的架构下,通过低成本的监督信号,本公开得以构建出适配于复杂公式的距离网络,从而获取数据的内在特征、刻画出数据之间的内部相关性,降低了人工干预对电力负荷数据相关性计算带来的不确定性和复杂性,有助于提高电力负荷数据相关性计算的准确度。同时,由于减少了人工干预的工作量,本公开还有助于提高相关性计算的工作效率。
附图说明
图1为一个实施例中一种电力设备用电模式识别模型生成方法的第一流程示意图;
图2为另一个实施例中一种电力设备用电模式识别模型生成方法的第二流程示意图;
图3为另一个实施例中一种电力设备用电模式识别模型生成方法的第三流程示意图;
图4为另一个实施例中一种电力设备用电模式识别模型生成方法的第四流程示意图;
图5为另一个实施例中一种电力设备用电模式识别模型生成方法的第五流程示意图;
图6为另一个实施例中一种电力设备用电模式识别模型生成方法的第六流程示意图;
图7为一个实施例中神经网络模型的结构示意图;
图8为一个实施例中弱监督学习的流程示意图;
图9为一个实施例中一种电力设备用电模式识别方法的流程示意图;
图10为一个实施例中一种电力设备用电模式识别模型生成装置的结构框图;
图11为一个实施例中一种电力设备用电模式识别装置的结构框图;
图12为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本公开的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本公开进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本公开,并不用于限定本公开。
本公开实施例提供的一种电力设备用电模式识别模型生成方法,可以应用于计算机设备中。计算机设备的型号和结构等本公开不做任何限制。计算机设备可以但不限于是各种终端、个人计算机、笔记本电脑和平板电脑等。计算机设备包括存储器和处理器,存储器能够存储数据和计算机程序,处理器能够执行计算机程序以实现本公开实施例提供的一种电力设备用电模式识别模型生成方法。以下实施例以一种电力设备用电模式识别模型生成方法应用于终端为例进行说明。
在一个实施例中,如图1所示,提供了一种电力设备用电模式识别模型生成方法,本实施例以该方法应用于终端为例进行说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤:
步骤101,获取电力负荷数据以及用电数据,将所述电力负荷数据与所述用电数据随机组合并构造为待标注数据对。
其中,电力负荷数据可以指电力设备向电力系统取用的电功率数据,用电数据可以指用电对象消耗有功电能的计量数据,标注可以指通过数据标签等标识出数据之间的差异特征以实现分类等目的的技术手段。
具体地,终端可以在获取到充分授权的前提下,通过发电企业或第三方电力数据平台获取脱敏后的电力负荷数据以及用电数据。电力负荷数据对应的电力设备可以包括多个不同的种类,例如电解工业设备、电子仪器、照明设施以及制冷制热设备等。终端可以根据电力设备的种类不同设定电力负荷数据的采样时间间隔以及每组数据的总时长跨度,采样时间间隔可以设置为0.5小时、1小时等;总时长跨度可以设置为24小时、36小时等。这样,终端可以获取在总时长跨度内、按照预设的采样时间间隔采样的一组电力负荷数据,电力负荷数据可以以一维数组的形式呈现。终端可以随机挑选一组一维的用电数据与一维的电力负荷数据拼接为一组二维数据,两组数据分别在两个不同的维度,生成的二维数据即为一个数据对,也即一个样本。终端通过重复上述步骤即可获取大量的待标注数据对。
步骤102,对预设比例的所述待标注数据对赋予数据标签,获取已标注数据对,并与剩余所述待标注数据合并为初始训练集。
其中,数据标签可以指一种用于描述对象特征的数据形式。
具体地,终端获取待标注数据对后,可以对待标注数据对赋予数据标签,数据标签可以基于预设的聚类算法生成。终端通过预设的聚类算法获取待标注数据对的特征,基于特征将待标注数据对进行分类,由特征确定的类别即为数据标签。当终端检测到在全部的数据对中,已标注数据对占全部数据对的比例达到预设比例时,终端可以停止对待标注数据对的标注,将已标注数据对与待标注数据对合并后,即为初始训练集。这样,终端获取了初始训练集,初始训练集中包括已标注数据对以及待标注数据对,两种标注状态不同的数据对按照预设的比例混合。
步骤103,构建神经网络模型,基于所述初始训练集将所述神经网络模型训练至收敛,获取标注模型。
其中,神经网络模型可以指由大量的处理单元(称为神经元)广泛地互相连接而形成的复杂网络系统,可适用于处理涉及多种因素和条件的信息处理问题。收敛可以指通过训练样本对算法模型的不断迭代训练,使得算法模型的参数不断逼近所终端期望的数值,当参数在两次迭代之间的权值变化小于预设的阈值时,即为模型收敛。
具体地,终端可以构建一个神经网络模型,并运用初始训练集对神经网络模型进行训练。在应用中,模型的输入可以为初始训练集中的已标注数据对,模型的输出可以为已标注数据对的数据标签以及对应的特征。当终端将神经网络模型训练至收敛后,即可获取标注模型。此时,当终端向标注模型输入一组如步骤101中构建的待标注数据对时,标注模型可以输出对待标注数据对的标注结果以及特征。需要强调的,由标注模型输出的标注结果以及特征是由训练得到的距离网络模型生成的,区别于步骤102中通过预设算法得到的数据标签及特征,具有更符合电力负荷数据复杂性的特点。
步骤104,通过所述标注模型对所述初始训练集中待标注数据对进行伪标注,获取弱监督训练集。
具体地,终端获取标注模型后,可以应用标注模型将初始训练集中剩余的待标注数据对赋予数据标签。此时,由于训练标注模型所应用的已标注数据对样本较少,因此标注模型生成的数据标签较为模糊,因此对待标注数据对赋予的数据标签实际上为伪数据标签,进行的是一种伪标注处理。当对待标注数据对的伪标注处理完成后,初始训练集中不再存在待标注数据对,为便于区分,终端可以将此时的训练集命名为弱监督训练集。
步骤105,基于所述弱监督训练集将所述标注模型训练至收敛,获取识别模型 。
具体地,终端在获取弱监督训练集之后,可以基于弱监督训练集对标注模型进行训练直至收敛,最终获取识别模型。显而易见的,在训练的过程中,弱监督训练集中的数据对的标注情况为,精确标注的已标注数据对和模糊标注的伪标注数据对按照预设的比例分布,少量已标注数据对在此过程中成为了模型训练过程中的弱监督信号,从而实现了最终复杂的距离网络模型,也即识别模型的训练。
上述一种电力设备用电模式识别模型生成方法中,终端获取不同类型的电力设备负荷数据后对其进行随机组合以构造出大量的样本数据对,有助于提高训练模型所需的样本充足度以及丰富度。终端通过筛选出大量电力负荷数据中极端的可被标注的样本,从而实现了少量样本的精确标注。终端获取标注模型后通过标注模型对待标注数据对进行伪标注,有助于扩大用于训练最终的识别模型的样本数量。终端在构建弱监督训练集的过程中控制精确标注的样本数量维持在预设的比例下,有助于保证模型训练过程中的监督信号的强度,从而得以实现在弱监督学习架构下的模型训练。在弱监督学习的架构下,终端得以通过识别模型描述的复杂的距离网络充分挖掘并描述出电力负荷数据中的特征,并利用深度神经网络较强的非线性映射能力,学习两个电力设备负荷曲线之间的内在联系,从而实现电力设备相关性的分析。
在一个实施例中,如图2所示,步骤102包括:
步骤201,通过预设的相似度算法计算所述待标注数据的相似度。
其中,相似度算法可以指将两个对象之间抽象的相似度通过数值的形式表示出来的算法。
具体地,终端可以调用预设的相似度算法来计算待标注数据对之间的相似度,预设的相似度算法可以选用欧式相似度公式或余弦相似度公式等。终端通过计算获取的待标注数据对的相似度结果可以为在一个区间内的具体数值,例如选用余弦相似度公式时,相似度结果区间为[0,1]。
步骤202,筛选出所述相似度高于预设的强相似阈值或低于预设的弱相似阈值的可标注数据对。
具体地,终端在获取待标注数据对的相似度后,为了获取可精确标注的数据对,可以对相似度结果进行筛选,以获得极端相似或极端不相似的待标注数据对。终端可以基于选用的相似度算法设置用于筛选极端相似样本的强相似阈值以及用于筛选极端不相似样本的弱相似阈值。例如,终端在选用余弦相似度公式时,可以在靠近极端相似值“0”的一端设置0.05或0.1等作为强相似阈值以筛选极端相似样本;在靠近极端非相似值“1”的一段设置0.95或0.9等作为弱相似阈值以筛选极端非相似样本。通过强相似阈值以及弱相似阈值,终端可以筛选出所需的可被精准标注的样本。
步骤203,以所述相似度作为所述可标注数据对的初始相似性,将所述可标注数据对标注为已标注数据对。
具体地,终端在筛选出可被精确标注的数据对样本并计算出对应的相似度后,可以对这些可标注数据对赋予相似或非相似的数据标签,并以可标注数据对的相似度作为其初始相似性。这样,在大量待标注数据对中,终端得以获得少量已标注数据对及对应的初始相似性。
本实施例中,终端通过相似度算法得以通过具体的数值化的方式,对数据对样本的相似度进行计算,从而得以筛选出部分得以被精确标注的已标注样本,以低算力成本实现了监督信号的建立,有助于提高训练神经网络模型的效率。
在一个实施例中,如图3所示,步骤103包括:
步骤301,构建神经网络模型,所述神经网络模型包括特征网络模块以及相似网络模块。
具体地,终端构建的神经网络模型可以包括特征网络模块和相似网络模块,相似网络模块可以以特征网络模块的输出为输入,并输出相似度计算结果。
步骤302,通过所述特征网络模块将所述初始训练集中的样本转化为特征向量。
其中,特征向量可以指以向量的形式表现的对象属性的集合。
具体地,终端获取初始训练集后,可以通过特征网络模块将初始训练集中的待标注数据对和已标注数据对中的数据对样本转化,并输出为特征向量,从而将数据对样本的属性通过向量的形式呈现出来。
步骤303,基于所述相似网络模块获取所述特征向量之间的相似度。
具体地,终端在获取数据对样本的特征向量之后,可以将特征向量输入相似网络模块,并获取相似网络模块输出的相似度。
在本实施例中,终端在构建的神经网络模块中设置了特征网络模块以及相似网络模块,由特征网络模块将数据对向量化后通过相似网络模块计算向量的相似度,从而有助于提高神经网络模块的训练效率。
在一个实施例中,如图4所示,步骤303之前,还包括:
步骤402,获取所述特征网络模块输出的特征向量;
具体地,终端可以通过神经网络模型中的特征网络模块获取特征向量。
步骤401,对所述特征向量进行预处理,所述预处理至少包括维度转化以及信息筛选。
具体地,终端在获取特征向量后,为了提高模型的收敛速度,可以对特征向量进行预处理,预处理包括但不限于维度转化以及信息筛选。终端可以在相似网络模块中设置维度变化层以对接受到的特征向量进行降维。为了对特征向量进行筛选,终端可以设置一些预设的筛选条件以对无效的特征向量进行筛除,预设的筛选条件可以基于特征向量的向量长度等。
在本实施例中,终端通过预处理步骤可以对神经网络模型训练过程中的数据流程进行优化,从而有助于提高神经网络模型训练的收敛效率以及最终获取的模型质量。
在一个实施例中,如图5所示,步骤104包括:
步骤501,通过所述标注模型对所述初始训练集中待标注数据对进行伪标注,获取伪标注数据对。
具体地,终端在获取标注模型后,可以基于标注模型对初始训练集中的待标注数据对生成数据标签,此时的数据标签可以实现模糊标注的效果,因此被标注的数据对可以被定义为伪标注数据对。
步骤502,基于预设的比例将指定数量的所述已标注数据对与所述伪标注数据对拼接为所述弱监督训练集样本。
具体地,终端在训练识别模型的过程中,需要分批次从弱监督训练集中选取出弱监督训练集样本。为了保证神经网络模型训练过程中的监督信号的强度,终端可以对选取出的弱监督训练集样本中的已标注数据对的比例进行限制,预设的比例可以设置为40%以及50%等。显然的,已标注数据对的比例相对较高时,监督信号越强。
在本实施例中,终端通过对已标注数据对的比例进行限制,得以降低已标注数据对的特征被过于大量的伪标注数据对掩盖的可能性,从而有助于提高网络训练效果。
在一个实施例中,如图6所示,步骤104包括:
步骤601,按照指定数量将所述伪标注数据对分组;
具体地,终端可以根据已标注数据对的样本数量以及所需满足的已标注数据对的比例,来确定每组弱监督训练集样本中伪标注数据对的所需数量。
步骤602,将所述已标注数据对与分组后伪标注数据对遍历拼接,获取弱监督训练集。
其中,遍历可以指按照具体的操作方式循环执行某一步骤。
具体地,终端可以将一组已标注数据对重复地与多组伪标注数据对拼接,每一次拼接即可生成一个弱监督训练集样本。
在本实施例中,终端通过遍历拼接可以重复应用一组已标注数据对来构建多组弱监督训练集样本,从而有助于提高弱监督训练集样本的数量,从而提高模型的训练效果。
在一个最具体的实施例中,终端可以按照设定的采样时间间隔,采集多个不同类型的电力设备负荷数据,不同类型电力设备的采样时间间隔均可以优选地设置为0.5小时,总时长跨度为24小时,这样,终端可以每24小时获取一组电力设备输出的48个数据。终端可以将获取的电力负荷数据与用电量数据进行随机选择,从而将两组一维数据拼接为一组二维数据,两组数据分别在两个不同的维度。在本实施例中终端优选地可以构造8000对随机数据对,此时,所有数据对均为被标注。
进一步的,终端可以对每组数据对计算余弦相似度和欧式距离,通过阈值筛选出在余弦相似度和欧式距离均满足极端强相似和均满足极端弱相似的数据对,并将其对应的余弦距离作为该数据对的初始相似性。本实施例中,终端可以优选地筛选出至少800对相似性强和相似性弱的数据对,作为已标注数据对。在计算余弦相似度时,相似度越接近于1,则表示数据对之间的余弦相似度越大。在计算欧氏距离时,相似度越接近于0,则表示数据对之间的欧氏距离越大。故需要选择余弦相似度更接近于1同时欧氏距离更接近于0的数据对作为相似性强的数据对,选择余弦相似度更接近于0同时欧氏距离更远离于0的数据对作为相似性弱的数据对。本实例优选各构造500对,共生成1000对数据对。
此时,终端获取的8000个待标注数据对中,有1000个被精确标注为已标注数据对,终端可以将这8000个数据对构建为初始训练集。然后,终端可以构建一个神经网络模型来进行训练。优选地,训练过程使用的神经网络可以选用由特征网络模块和相似网络模块构成的孪生网络。孪生网络的结构可以如图7所示,具体包括:特征网络模块和相似性网络模块。
孪生网络的输入是一对数据对,将数据对拆分为两个数据后作为两个输入,输入孪生网络,将两个输入分别在特征网络模块中计算出数据的特征。此处两个特征网络模块的结构相同,共用同一组网络参数。特征网络的输出即为两组数据的特征向量。将两个特征网络模块输出的特征向量经过拼接后输入到相似性网络模块中,经过相似性网络模块处理后计算出数据对的相似度并输出。
其中,特征网络模块结构图包括:第一卷积层、第二卷积层、第三卷积层和全连接层;卷积层包括一个卷积网络,一个激活函数和一个归一化函数,三个卷积层的区别在于卷积网络参数不同;全连接层包括一个全连接网络和一个激活函数。经过特征网络模块的最后一层全连接层输出特征向量。
第一卷积层将1通道的数据经过卷积进行扩展,优选的设定拓展到32通道,因为数据较小,故将卷积核大小优选设置为3,使用ReLU函数进行激活,ReLU函数形式为线性、非饱和,可以克服梯度消失的问题,加快训练速度。激活后再使用BatchNorm函数进行归一化,BN减轻了对参数初始化的依赖,训练更快,可以使用更高的学习率,一定程度上增加了泛化能力。
第二卷积层将32通道的数据经过卷积进行扩展,优选的设定扩展到32通道,通过控制步进stride扩大卷积核的感受野,将感受野扩大2倍,激活函数采用ReLU函数,归一化函数采用BN函数。第三卷积层结构与参数与第二卷积层相同,感受野再次扩大2倍。
最后将32维数据降到一维,经过一个线性层后再经过ReLU函数激活,优选的线性层包含神经元个数为64。将线性层的结果作为特征网络模块的输出,输出为长度为64的特征向量。
其中,相似性模块结构图包括:第一全连接层、第二全连接层;全连接层包括一个全连接网络和一个激活函数。在第一全连接层前还需要进行维度变化和信息筛选。
首先将经过两个特征网络处理后的一维特征拼接成两个维度的特征,将上述二维特征输入相似性网络后首先经过维度变化层进行降维,将二维数据降维到一维。为防止训练过拟合,网络对于接收的信息采用Dropout函数进行筛选,丢弃一部分再交给全连接层处理,优选的筛选率设置为0.5,即在前向传播的时候,让某个神经元的激活值以0.5的概率停止工作,这样,可以使模型不会太依赖某些局部的特征,泛化性更强。
第一全连接层的激活函数为ReLU函数,第二全连接层的激活函数为Sigmoid函数,计算公式如下:
Sigmoid函数的输出结果范围再(0,1)之间,便于求导的平滑函数,适合用于前向传播。
第二全连接层的输出即为相似性网络模块的输出,同时整体孪生网络模块的输出结果,即为输入样本对之间的相似性。
具体地,如图3所示,本发明提供了一种网络训练的流程图,包括:
首先获取训练集数据,将训练数据分成不同的batch作为孪生网络的输入,将孪生网络训练至收敛。
网络所使用的损失函数为MSE损失(均方误差),MSE计算公式如下:
其中,n为数据点数。MSE即为预测数据和原始数据对应点误差的平方和的均值。
网络收敛后,将随机生成的8000对数据对分成不同的批次作为网络的输入,每个批次的大小优选为500,输出的8000个0-1之间的值即为上述8000对数据对之间的相似性,将该值作为上述8000对数据对的伪标签并保存。
此时,终端对初始训练集中样本进行了伪标注,从而获得了弱监督训练集。终端可以使用弱监督训练集继续对模型进行训练。
具体地,如图8所示,终端可以将1000个已标注数据对和8000个伪标注数据对进行拼接作为新的弱监督训练集,实现自回归训练。为保证1000个已标注数据对的特征不被大量伪标注数据对的特征掩盖,故采用数据对1:1拼接。将1000个已标注数据对重复遍历8轮拼接在一起,生成一个8000个已标注数据对。将已标注数据对和伪标注数据对,间隔排列,拼接为16000个数据对。将上述大小为16000的数据对作为新的训练集训练孪生网络,此时的孪生网络结构与初始为无标签数据对赋予伪标签的孪生网络结构一至,但初始化条件不同,需要重新进行初始化。训练时的批次大小优选为1000,将网络训练至MSE损失收敛后,使用该网络为8000个已经具有伪标注数据对赋予新的伪标签。此步骤可循环进行多次,达到更好的网络训练效果。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本公开实施例还提供了一种电力设备用电模式识别方法。
在一个实施例中,如图9所示,提供了一种电力设备用电模式识别模型生成方法,本实施例以该方法应用于终端为例进行说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤:
步骤901,获取目标设备的目标电力负荷数据以及目标用电数据;
具体地,终端可以按照预设的采样频率以及总的时长跨度,采集目标设备的电力负荷数据,从而获取一组目标电力负荷数据,目标电力负荷数据可以为按照时间顺序分布的目标设备的电功率数据。终端还可以按照相同的采样频率以及总的时长跨度,采集待与目标设备比对相似度的用电数据。
步骤902,将所述目标电力负荷数据以及目标用电数据输入预先构建的识别模型,获取目标设备的相关性识别结果,所述识别模型包括如上述任一实施例所述的方法生成的识别模型。
具体地,终端可以将目标设备的目标电力负荷数据以及目标用电数据输入到识别模型中,从而获取由识别模型输出的相似度,这里的相似度即可被标记为目标设备与用电数据的相关性识别结果。
基于同样的发明构思,本公开实施例还提供了一种用于实现上述所涉及的一种电力设备用电模式识别模型生成方法的一种电力设备用电模式识别模型生成装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个装置实施例中的具体限定可以参见上文中对于一种电力设备用电模式识别模型生成方法的限定,在此不再赘述。
在一个实施例中,如图10所示,提供了一种电力设备用电模式识别模型生成装置,包括:数据构造模块、数据标注模块、标注模型模块、数据伪标注模块和识别模型模块,其中:
数据构造模块,用于获取电力负荷数据以及用电数据,将所述电力负荷数据与所述用电数据随机组合并构造为待标注数据对;
数据标注模块,用于对预设比例的所述待标注数据对赋予数据标签,获取已标注数据对,并与剩余所述待标注数据合并为初始训练集;
标注模型模块,用于构建神经网络模型,基于所述初始训练集将所述神经网络模型训练至收敛,获取标注模型;
数据伪标注模块,用于通过所述标注模型对所述初始训练集中待标注数据对进行伪标注,获取弱监督训练集;
识别模型模块,用于基于所述弱监督训练集将所述标注模型训练至收敛,获取识别模型。
在一个实施例中,数据标注模块包括:
相似计算模块,用于通过预设的相似度算法计算所述待标注数据的相似度;
标注筛选模块,用于筛选出所述相似度高于预设的强相似阈值或低于预设的弱相似阈值的可标注数据对;
极端标注模块,用于以所述相似度作为所述可标注数据对的初始相似性,将所述可标注数据对标注为已标注数据对。
在一个实施例中,标注模型模块包括:
模型构建模块,用于构建神经网络模型,所述神经网络模型包括特征网络模块以及相似网络模块;
特征模型模块,用于通过所述特征网络模块将所述初始训练集中的样本转化为特征向量;
相似模型模块,用于基于所述相似网络模块获取所述特征向量之间的相似度。
在一个实施例中,标注模型模块包括:
向量获取模块,用于获取所述特征网络模块输出的特征向量;
向量预处理模块,用于对所述特征向量进行预处理,所述预处理至少包括维度转化以及信息筛选。
在一个实施例中,识别模型模块包括:
伪标注模块,用于通过所述标注模型对所述初始训练集中待标注数据对进行伪标注,获取伪标注数据对;
训练集拼接模块,用于基于预设的比例将指定数量的所述已标注数据对与所述伪标注数据对拼接为所述弱监督训练集样本。
在一个实施例中,识别模型模块包括:
伪标注数据对分组模块,用于按照指定数量将所述伪标注数据对分组;
遍历拼接模块,用于将所述已标注数据对与分组后伪标注数据对遍历拼接,获取弱监督训练集。
基于同样的发明构思,本公开实施例还提供了一种用于实现上述所涉及的一种电力设备用电模式识别模型生成方法的一种电力设备用电模式识别装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个装置实施例中的具体限定可以参见上文中对于一种电力设备用电模式识别方法的限定,在此不再赘述。
在一个实施例中,如图11所示,提供了一种电力设备用电模式识别装置。所述装置包括:
数据采集模块,用于获取目标设备的目标电力负荷数据以及目标用电数据;
相关性识别模块,用于将所述目标电力负荷数据以及目标用电数据输入预先构建的识别模型,获取目标设备的相关性识别结果,所述识别模型包括如第一方面任一所述的方法生成的识别模型。
上述了一种电力设备用电模式识别模型生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图12所示。该计算机设备包括通过系统总线连接的处理器、存储器以及通信接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现了一种电力设备用电模式识别模型生成方法。
本领域技术人员可以理解,图12中示出的结构,仅仅是与本公开方案相关的部分结构的框图,并不构成对本公开方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中一种电力设备用电模式识别模型生成方法的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中一种电力设备用电模式识别模型生成方法的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中一种电力设备用电模式识别模型生成方法的步骤。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中一种电力设备用电模式识别方法的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中一种电力设备用电模式识别方法的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中一种电力设备用电模式识别方法的步骤。
需要说明的是,本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本公开所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本公开所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本公开所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本公开的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本公开专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本公开构思的前提下,还可以做出若干变形和改进,这些都属于本公开的保护范围。因此,本公开的保护范围应以所附权利要求为准。
Claims (10)
1.一种电力设备用电模式识别模型生成方法,其特征在于,所述方法包括:
获取电力负荷数据以及用电数据,将所述电力负荷数据与所述用电数据随机组合为待标注数据对;
对预设比例的所述待标注数据对赋予数据标签,获取已标注数据对,并与剩余所述待标注数据合并为初始训练集;
构建神经网络模型,基于所述初始训练集将所述神经网络模型训练至收敛,获取标注模型;
通过所述标注模型对所述初始训练集中待标注数据对进行伪标注,获取弱监督训练集;
基于所述弱监督训练集将所述标注模型训练至收敛,获取识别模型。
2.根据权利要求1所述的方法,其特征在于,所述对预设比例的所述待标注数据对赋予数据标签,获取已标注数据对包括:
通过预设的相似度算法计算所述待标注数据的相似度;
筛选出所述相似度高于预设的强相似阈值或低于预设的弱相似阈值的可标注数据对;
以所述相似度作为所述可标注数据对的初始相似性,将所述可标注数据对标注为已标注数据对。
3.根据权利要求1所述的方法,其特征在于,所述通过所述标注模型对所述初始训练集中待标注数据对进行伪标注,获取弱监督训练集包括:
通过所述标注模型对所述初始训练集中待标注数据对进行伪标注,获取伪标注数据对;
基于预设的比例将指定数量的所述已标注数据对与所述伪标注数据对拼接为所述弱监督训练集。
4.根据权利要求3所述的方法,其特征在于,所述基于预设的比例将指定数量的所述已标注数据对与所述伪标注数据对拼接为所述弱监督训练集包括:
按照指定数量将所述伪标注数据对分组;
将所述已标注数据对与分组后伪标注数据对遍历拼接,获取弱监督训练集。
5.一种电力设备用电模式识别方法,其特征在于,所述方法包括:
获取目标设备的目标电力负荷数据以及目标用电数据;
将所述目标电力负荷数据以及目标用电数据输入预先构建的识别模型,获取目标设备的相关性识别结果,所述识别模型包括如权利要求1至4任一所述的方法生成的识别模型。
6.一种电力设备用电模式识别模型生成装置,其特征在于,所述装置包括:
数据构造模块,用于获取电力负荷数据以及用电数据,将所述电力负荷数据与所述用电数据随机组合为待标注数据对;
数据标注模块,用于对预设比例的所述待标注数据对赋予数据标签,获取已标注数据对,并与剩余所述待标注数据合并为初始训练集;
标注模型模块,用于构建神经网络模型,基于所述初始训练集将所述神经网络模型训练至收敛,获取标注模型;
数据伪标注模块,用于通过所述标注模型对所述初始训练集中待标注数据对进行伪标注,获取弱监督训练集;
识别模型模块,用于基于所述弱监督训练集将所述标注模型训练至收敛,获取识别模型。
7.根据如权利要求6所述的一种电力设备用电模式识别模型生成装置,其特征在于,所述标注模型模块包括:
模型构建模块,用于构建神经网络模型,所述神经网络模型包括特征网络模块以及相似网络模块;
特征模型模块,用于通过所述特征网络模块将所述初始训练集中的样本转化为特征向量;
相似模型模块,用于基于所述相似网络模块获取所述特征向量之间的相似度。
8.一种电力设备用电模式识别装置,其特征在于,所述装置包括:
数据采集模块,用于获取目标设备的目标电力负荷数据以及目标用电数据;
相关性识别模块,用于将所述目标电力负荷数据以及目标用电数据输入预先构建的识别模型,获取目标设备的相关性识别结果,所述识别模型包括如权利要求1至4任一所述的方法生成的识别模型。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述的方法的步骤或权利要求5中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至4中任一项所述的方法的步骤或权利要求5中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211050905.0A CN115130620B (zh) | 2022-08-31 | 2022-08-31 | 一种电力设备用电模式识别模型生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211050905.0A CN115130620B (zh) | 2022-08-31 | 2022-08-31 | 一种电力设备用电模式识别模型生成方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115130620A true CN115130620A (zh) | 2022-09-30 |
CN115130620B CN115130620B (zh) | 2023-04-28 |
Family
ID=83387611
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211050905.0A Active CN115130620B (zh) | 2022-08-31 | 2022-08-31 | 一种电力设备用电模式识别模型生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115130620B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116227878A (zh) * | 2023-02-28 | 2023-06-06 | 深圳市大数据研究院 | 电力负荷分解分析方法、系统、计算机设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104392253A (zh) * | 2014-12-12 | 2015-03-04 | 南京大学 | 一种草图数据集的交互式类别标注方法 |
CN106650797A (zh) * | 2016-12-07 | 2017-05-10 | 广东电网有限责任公司江门供电局 | 一种基于集成elm的配电网窃电嫌疑用户智能识别方法 |
CN106780121A (zh) * | 2016-12-06 | 2017-05-31 | 广州供电局有限公司 | 一种基于用电负荷模式分析的用电异常识别方法 |
WO2021073152A1 (zh) * | 2019-10-14 | 2021-04-22 | 平安科技(深圳)有限公司 | 基于神经网络的数据标签生成方法、装置、终端及介质 |
CN113313166A (zh) * | 2021-05-28 | 2021-08-27 | 华南理工大学 | 基于特征一致性学习的船舶目标自动标注方法 |
-
2022
- 2022-08-31 CN CN202211050905.0A patent/CN115130620B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104392253A (zh) * | 2014-12-12 | 2015-03-04 | 南京大学 | 一种草图数据集的交互式类别标注方法 |
CN106780121A (zh) * | 2016-12-06 | 2017-05-31 | 广州供电局有限公司 | 一种基于用电负荷模式分析的用电异常识别方法 |
CN106650797A (zh) * | 2016-12-07 | 2017-05-10 | 广东电网有限责任公司江门供电局 | 一种基于集成elm的配电网窃电嫌疑用户智能识别方法 |
WO2021073152A1 (zh) * | 2019-10-14 | 2021-04-22 | 平安科技(深圳)有限公司 | 基于神经网络的数据标签生成方法、装置、终端及介质 |
CN113313166A (zh) * | 2021-05-28 | 2021-08-27 | 华南理工大学 | 基于特征一致性学习的船舶目标自动标注方法 |
Non-Patent Citations (1)
Title |
---|
何昆 等: "基于PCA孤立森林的用电异常识别研究", 《计算技术与自动化》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116227878A (zh) * | 2023-02-28 | 2023-06-06 | 深圳市大数据研究院 | 电力负荷分解分析方法、系统、计算机设备及存储介质 |
CN116227878B (zh) * | 2023-02-28 | 2023-10-20 | 深圳市大数据研究院 | 电力负荷分解分析方法、系统、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115130620B (zh) | 2023-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shen et al. | Wind speed prediction of unmanned sailboat based on CNN and LSTM hybrid neural network | |
Cortez et al. | Using sensitivity analysis and visualization techniques to open black box data mining models | |
US20200167659A1 (en) | Device and method for training neural network | |
CN110674323B (zh) | 基于虚拟标签回归的无监督跨模态哈希检索方法及系统 | |
Yan | Weighted K-nearest neighbor classification algorithm based on Genetic Algorithm | |
Wu et al. | An improved lion swarm optimization for parameters identification of photovoltaic cell models | |
CN115130620B (zh) | 一种电力设备用电模式识别模型生成方法及装置 | |
CN116386899A (zh) | 基于图学习的药物疾病关联关系预测方法及相关设备 | |
Zhou et al. | Expanding the prediction capacity in long sequence time-series forecasting | |
Wu et al. | Structured embedding via pairwise relations and long-range interactions in knowledge base | |
Kalifullah et al. | Retracted: Graph‐based content matching for web of things through heuristic boost algorithm | |
Daneshfar et al. | A survey on semi-supervised graph clustering | |
CN111949530B (zh) | 测试结果的预测方法、装置、计算机设备及存储介质 | |
CN108829846A (zh) | 一种基于用户特征的业务推荐平台数据聚类优化系统及方法 | |
Wei et al. | An instance based multi-source transfer learning strategy for building’s short-term electricity loads prediction under sparse data scenarios | |
Rossi et al. | Relational similarity machines (RSM): A similarity-based learning framework for graphs | |
Zhao et al. | A deep learning approach incorporating attention mechanism and transfer learning for lithium-ion battery lifespan prediction | |
Nagy | Data-driven analysis of fractality and other characteristics of complex networks | |
Hong et al. | Imputation of Missing Values in Training Data using Variational Autoencoder | |
Hu et al. | Distributed supervised discrete hashing with relaxation | |
Liu et al. | Deep amortized relational model with group-wise hierarchical generative process | |
CN114385831B (zh) | 一种基于特征提取的知识图谱关系预测方法 | |
Yin et al. | 4G 5G Cell-level Multi-indicator Forecasting based on Dense-MLP | |
Qian | Research on complex attribute big data classification based on iterative fuzzy clustering algorithm | |
Ma et al. | Application of Hopfield Neural Network Algorithm in Mathematical Modeling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |