CN116522151A - 一种半监督负荷识别及分解方法、系统及存储介质 - Google Patents

一种半监督负荷识别及分解方法、系统及存储介质 Download PDF

Info

Publication number
CN116522151A
CN116522151A CN202310806416.1A CN202310806416A CN116522151A CN 116522151 A CN116522151 A CN 116522151A CN 202310806416 A CN202310806416 A CN 202310806416A CN 116522151 A CN116522151 A CN 116522151A
Authority
CN
China
Prior art keywords
semi
energy consumption
consumption data
learning model
supervised learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310806416.1A
Other languages
English (en)
Inventor
庄蒙蒙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Zhidian Energy Technology Co ltd
Original Assignee
Shenzhen Zhidian Energy Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Zhidian Energy Technology Co ltd filed Critical Shenzhen Zhidian Energy Technology Co ltd
Priority to CN202310806416.1A priority Critical patent/CN116522151A/zh
Publication of CN116522151A publication Critical patent/CN116522151A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • G06F18/15Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2123/00Data types
    • G06F2123/02Data types in the time domain, e.g. time-series data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • G06F2218/10Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种半监督负荷识别及分解方法、系统及存储介质,方法包括步骤:获取监测设备中收集的聚合能源消耗数据;获取一组标记的和未标记的分解能源消耗数据并进行存储;对标记的和未标记的分解能源消耗数据进行预处理,提取相关特征;根据所述相关特征训练半监督学习模型,得到训练好的半监督学习模型;将所述聚合能源消耗数据代入所述训练好的半监督学习模型对所述聚合能源消耗数据进行分解,得到各用电设备的负荷。本发明采用非侵入式负荷识别技术,结合半监督学习算法,具有以下优点:不依赖于样本库,适应性强、可以做到无阈值和无标签地鉴别用电设备动作、计算复杂度低、可以实现针对每个用户连续不断地在线学习、准确率越来越高。

Description

一种半监督负荷识别及分解方法、系统及存储介质
技术领域
本发明涉及电力负荷用电细节监测技术领域,尤其涉及一种半监督负荷识别及分解方法、系统及存储介质。
背景技术
近年来,随着物联网技术的飞速发展和智能传感设备及技术的广泛安装部署与应用,特别是高级量测体系的普及实施,能源大数据监控平台已经成为学术研究和企业发展所关注的热点领域。非侵入式监测常被称作为负荷分解与监测(loaddisaggregationandmonitoring,LDM)。研究表明,基于LDM技术的用电细节监测具有简单、经济、可靠、数据完整性好和易于迅速大范围推广等优势,能够在充分利用现有基础设施(如通信设施)的情况下,通过增加最少的投资(数据信息采集硬件系统升级)来获得优质详细的用电数据信息,进而显著提升智能用电相关应用的水平。基于非侵入式技术的能源监控优势在于只需1个传感器,通过对用户电压电流的分析来实现用户内负荷的辨识和分项计量。
近年来随着人工智能,大数据,云计算以及传感技术的发展,尤其是人们的节能意识不断增强,NILM(非侵入式复核监测)技术已经得到飞速发展,走出实验室,成为能源互联网领域的研究热点,在能源行业发挥着越来越大的作用。未来非侵入式负荷在线将会以居民负荷用电的可视化手段,大规模应用为研究重点,以打造个性化的居民用电体验为目标,从而实现真正的能源互联。
获取用户详细用电数据是理解用户用电行为和能源结构的基础,更是智能用电分析和实现能源互联网的关键。然而目前市场上没有一种提供电力负荷的能耗信息细节的技术产品实现能源需求和供应的实时动态调整。因此开发一种能够获取用户能耗细节数据的系统对于理解用户用电行为,实现能源互联网至关重要。非侵入式电力负荷辨识技术基于功率监测,深入细化到负荷内部,提供不同层面更为详细的电能使用数据。现有的非侵入式电力负荷识别技术方案硬件设备昂贵,软件算法需要大量有标签的样本库进行被动学习,计算效率低,难以满足能源互联网的要求。
因此,现有技术还有待于改进和发展。
发明内容
鉴于上述现有技术的不足,本发明的目的在于提供一种半监督负荷识别及分解方法、系统及存储介质,旨在解决现有的非侵入式电力负荷识别技术方案硬件设备昂贵,软件算法需要大量有标签的样本库进行被动学习,计算效率低,难以满足能源互联网的要求的问题。
本发明为解决上述技术问题所采用的技术方案如下:
一种半监督负荷识别及分解方法,其中,包括步骤:
获取监测设备中收集各个设备的聚合能源消耗数据;
获取一组标记的分解能源消耗数据和一组未标记的分解能源消耗数据并进行存储;
对所述标记的分解能源消耗数据和所述未标记的分解能源消耗数据进行预处理,提取相关特征;
根据所述相关特征训练半监督学习模型,得到训练好的半监督学习模型;
将所述聚合能源消耗数据代入所述训练好的半监督学习模型对所述聚合能源消耗数据进行分解,得到各用电设备的负荷。
所述的半监督负荷识别及分解方法,其中,所述聚合能源消耗数据的特征选择包括基波或谐波有功功率、无功功率、稳态特征、暂态特征、事件的开关状态、电压、电流有效值中的一种或多种。
所述的半监督负荷识别及分解方法,其中,所述预处理选自滤波处理、归一化处理、分段处理、特征提取处理、数据清洗处理中的一种或多种。
所述的半监督负荷识别及分解方法,其中,所述相关特征选自时间域特征、频域特征、统计特征、小波特征、转变点特征中的一种或多种。
所述的半监督负荷识别及分解方法,其中,所述时间域特征包括电流和电压的瞬时值、平均值、最大值、最小值、方差、波形因数、峰值因数、形状因数、脉冲因数中的一种或多种;所述频域特征包括频谱形状、主频率、频谱能量、频谱熵、频谱质心、频谱斜度、频谱峭度中的一种或多种;所述统计特征包括电流和电压的均值、中值、标准差、偏度、峰度、相关性、自相关性中的一种或多种;所述小波特征包括电力信号在不同尺度和不同频率下的能量分布、小波系数;所述转变点特征包括上升边缘、下降边缘、脉冲宽度、脉冲高度、脉冲间隔中的一种或多种。
所述的半监督负荷识别及分解方法,其中,所述半监督学习算法模型选自半监督支持向量机、标签传播算法、标签扩散算法、半监督深度生成模型中的一种。
所述的半监督负荷识别及分解方法,其中,所述根据所述相关特征训练半监督学习模型,得到训练好的半监督学习模型的步骤,具体包括:
提供半监督学习模型;
根据所述标记的分解能源消耗数据的相关特征对所述半监督学习模型进行训练,再根据所述未标记的分解能源消耗数据的相关特征进行无监督学习,得到预训练的半监督学习模型;
根据所述预训练的半监督学习模型对未标记的分解能源消耗数据的标记进行预测并生成新标记,并利用所述新标记对所述预训练的半监督学习模型进行更新,得到更新后的半监督学习模型;
对所述更新后的半监督学习模型的指标进行评估,所述指标大于预设阈值,则得到训练好的半监督学习模型;或,所述指标小于预设阈值,返回对所述更新后的半监督学习模型进行训练,直至所述指标大于预设阈值,得到训练好的半监督学习模型。
所述的半监督负荷识别及分解方法,其中,所述指标包括准确率、精确率、召回率、F1值中的一种或多种。
一种半监督负荷识别及分解系统,其中,包括:
数据采集模块,用于获取监测设备中收集的聚合能源消耗数据;
数据存储模块,用于获取一组标记的分解能源消耗数据和一组未标记的分解能源消耗数据并进行存储;
预处理模块,用于对所述标记的分解能源消耗数据和所述未标记的分解能源消耗数据进行预处理,提取相关特征;
半监督学习模块,用于根据所述相关特征训练半监督学习模型,得到训练好的半监督学习模型;
分解模块,用于将所述聚合能源消耗数据代入所述训练好的半监督学习模型对所述聚合能源消耗数据进行分解,得到各用电设备的负荷。
一种计算机可读存储介质,其中,所述计算机可读存储介质存储有半监督负荷识别及分解程序,所述半监督负荷识别及分解程序被处理器执行时,实现如本发明上述方案所述的半监督负荷识别及分解方法的步骤。
有益效果:本发明公开了一种半监督负荷识别及分解方法、系统及存储介质,本发明采用非侵入式负荷识别技术,相对于侵入式负荷识别技术具有实施难度低、硬件经济成本低(每户只需不到300元)、可靠性高、用户接受程度高、覆盖用户范围大、数据完整性好和商业化大规模推广容易的优点,再结合半监督学习算法,相对于美国的Sense具有以下优点:(1)算法模型不依赖于样本库,适应性强(不用调参数),从根本上减少识别算法的计算代价,降低服务器的运行成本;(2)可以做到无阈值(可识别小至充电的手机)和无标签(不用用户指定电器数目)地鉴别用电设备动作;(3)计算复杂度低(与训练样本数成线性关系);(4)可以实现针对每个用户连续不断地在线学习;(5)算法能够随着样本增长,自适应用电设备的物理特性变化,并且准确率越来越高(负荷识别的准确率可以达到90%以上);采用本发明的方法可以准确且高效地实现能源分配。
附图说明
图1为本发明提供的一种半监督负荷识别及分解方法较佳实施例的流程图。
图2为本发明提供的一种半监督负荷识别及分解方法步骤S40较佳实施例的流程图。
图3为本发明提供的一种半监督负荷识别及分解系统的功能模块示意图。
图4为本发明实施例1中基于VAE的半监督学习算法模型训练流程示意图。
具体实施方式
本发明提供一种半监督负荷识别及分解方法、系统及存储介质,为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
下面结合附图,通过对实施例的描述,对发明内容作进一步说明。
非侵入式负荷辨识技术,是新颖的电力负荷用电细节监测方法,原理是指通过简单的硬件安装和电力负荷特征分析,监测负荷功率变化实现负荷的分解,达到负荷状态监控的目的。其技术原理为:假设每种电气设备都会在总负荷用电曲线或耗电模式中留下自己特有的印记特征,然后从负荷电气总量信息中提取每个电气设备的印记特征,通过机器学习的方法辨识出每个印记特征样本的来源,最终实现负荷分解与监测。用户仅需要在入户配电箱处安装一个传感器,通过采集和分析用户负荷供电总入口处的端电压和/或总电流便可获得总负荷内部每个(类)电气设备的工作状态、用电功率和累计电量、运行时间以至故障预警等用电细节信息。非侵入式负荷识别实现方法为:获得电压电流数据-通过wifi信号将数据传到DAQ-将实时电力信号去噪-发送数据到主机-检测事件-提取电力信号特征-获得对应于用户侧配电箱的每个用电设备的功耗数据和实时状态信息。
电力负荷监测与分解系统主要包括五大模块:数据采集模块,数据预处理模块,数据通信模块,事件检测模块和负荷印记识别模块。其中数据采集模块是基础,事件检测和负荷印记模块是核心。其中,数据采集模块:先利用电压和电流互感器将电压及电流信号转换为模拟弱电压信号,由于电器能够呈现出的负荷特性仅限于监测到的数据信息,因此,为获取期望的负荷印记特征,数据采集模块需要以满足要求的采样频率用数模转换芯片完成模拟弱电压信号的数字化;数据预处理模块:对原始数字信号(电压、总电流和总功率)做预处理,通过对电流或功率信号的去噪和异常值校正或剔除来保证负荷事件检测的可靠性和准确性,通过电流相位校正保证相位信息准确;数据通信模块:将采集到的数字信号通过无线通信的方式发送给服务器,采用可靠连接保证数据的完整性和有效性,拟采用TCP传输协议,C语言和Python语言对接来传输实时数字信号;事件检测模块:在服务器侧对接收到的数字信号进行分析,利用事件检测算法将对应的负荷印记特征提取出来,保存至Mongodb数据库;负荷印记识别模块:通过无监督分类算法对负荷印记特征进行识别,最终将负荷印记特征和电器名称匹配上,并保存至Mongodb数据库。
当前的非侵入式负荷识别系统只需在每个用户总配电箱处安装一个硬件负责数据采集,主要通过软件来识别负荷,其优点是成本低,缺点是准确率偏低,计算代价高,难以大规模推广。目前为止非侵入式负荷识别系统分为两大类:依赖于样本库,自学习;前者的主要代表是美国的Sense(单价约$250)。其准确度和计算复杂度受限于样本库的大小:当样本库小时,准确率低,无法实用;样本库越大,准确率越高,但计算复杂度也越高,难以大规模推广,另外主要一个缺点是无法处理样本库里没有的电器,比如市场上新出现的电器。
基于此,本发明提供了一种半监督负荷识别及分解方法,参见图1,其包括步骤:
S10、获取监测设备中收集各个设备的聚合能源消耗数据;
S20、获取一组标记的分解能源消耗数据和一组未标记的分解能源消耗数据并进行存储;
S30、对所述标记的分解能源消耗数据和所述未标记的分解能源消耗数据进行预处理,提取相关特征;
S40、根据所述相关特征训练半监督学习模型,得到训练好的半监督学习模型;
S50、将所述聚合能源消耗数据代入所述训练好的半监督学习模型对所述聚合能源消耗数据进行分解,得到各用电设备的负荷。
具体地,本发明采用非侵入式负荷识别技术,相对于侵入式负荷识别技术具有实施难度低、硬件经济成本低(每户只需不到300元)、可靠性高、用户接受程度高、覆盖用户范围大、数据完整性好和商业化大规模推广容易的优点,再结合半监督学习算法,相对于美国的Sense具有以下优点:(1)算法模型不依赖于样本库,适应性强(不用调参数),从根本上减少识别算法的计算代价,降低服务器的运行成本;(2)可以做到无阈值(可识别小至充电的手机)和无标签(不用用户指定电器数目)地鉴别用电设备动作;(3)计算复杂度低(与训练样本数成线性关系);(4)可以实现针对每个用户连续不断地在线学习;(5)算法能够随着样本增长,自适应用电设备的物理特性变化,并且准确率越来越高(负荷识别的准确率可以达到90%以上);采用本发明的方法可以准确且高效地实现能源分配。
在一些实施方式中,所述步骤S20中所述标记的分解能源消耗数据指的是打标签进行标注的分解能源消耗数据,所述未标记的分解能源消耗数据指的是没有做任何标注的原始分解能源消耗数据;所述分解能源消耗数据是通过电流互感器进行传感,数据采集器进行采集,数据集中器进行处理上传至服务器中。
在一些实施方式中,所述聚合能源消耗数据为通过配电箱入口处收集到的数据,所述聚合能源消耗数据的特征选择包括基波或谐波有功功率、无功功率、稳态特征、暂态特征、事件的开关状态、电压、电流有效值中的一种或多种。
在一些实施方式中,所述预处理选自滤波处理、归一化处理、分段处理、特征提取处理、数据清洗处理中的一种或多种。
具体地,数据预处理是非常关键的一步,可以提高后续模型的性能和准确度,上述预处理方法可根据具体的应用和数据进行调整和组合,在进行数据预处理时,预处理方法应该能够保留数据中对于负荷识别有用的信息,而不是去除这些信息。
其中,滤波处理:电力数据可能包含噪声,如电气设备的突然开启或关闭,或者电压的瞬间变化,这种噪声可以通过各种滤波器(如低通滤波器)进行消除;归一化处理:由于不同的设备可能有不同的电力消耗范围,所以需要将数据归一化,使得所有的数据都在同一个范围内,通常可以通过将每个数据点减去全局最小值,然后除以全局最大值和最小值的差来实现;分段处理:将连续的电力数据分割成一系列的段,每一段都包含一定数量的连续的数据点,这种方法可以使模型更好地捕捉到电力消耗的短期变化;特征提取处理:电力数据中可能包含许多对于负荷识别有用的特征,如电力的瞬时值、电力的平均值、电力的最大值、电力的方差等,这些特征可以通过各种统计方法从原始数据中提取出来;数据清洗处理:删除那些可能对模型性能产生负面影响的数据,如缺失值、异常值等。
在一些实施方式中,所述步骤S30中提取相关特征为本发明方法中关键的一步,用于从原始电力数据中提取对设备识别有用的信息;所述相关特征选自时间域特征、频域特征、统计特征、小波特征、转变点特征中的一种或多种。
在一些实施方式中,所述时间域特征直接从原始电力信号中提取,包括电流和电压的瞬时值、平均值、最大值、最小值、方差、波形因数、峰值因数、形状因数、脉冲因数中的一种或多种;所述频域特征通过对原始电力信号进行傅里叶变换或短时傅里叶变换得到,包括频谱形状、主频率、频谱能量、频谱熵、频谱质心、频谱斜度、频谱峭度中的一种或多种;所述统计特征通过对原始电力信号的统计分析得到,包括电流和电压的均值、中值、标准差、偏度、峰度、相关性、自相关性中的一种或多种;所述小波特征通过小波变换对电力信号进行多尺度分析,包括电力信号在不同尺度和不同频率下的能量分布、小波系数;所述转变点特征用于描述电力信号的瞬时变化,包括上升边缘、下降边缘、脉冲宽度、脉冲高度、脉冲间隔中的一种或多种。
在一些实施方式中,所述半监督学习模型选自半监督支持向量机、标签传播算法、标签扩散算法、半监督深度生成模型中的一种,优选地,所述半监督学习算法模型为半监督深度生成模型,所述半监督深度生成模型包括但不限于自编码器、生成对抗网络、变分自编码器、受限玻尔兹曼机、自回归模型、规范化流等。
具体地,生成对抗网络 (GANs):GANs 由两个神经网络组成,一个生成器和一个判别器;生成器生成新的数据实例,而判别器则评估它们的真实性。变分自编码器 (VAEs):VAEs 是一种类型的自编码器,它可以生成输入数据的压缩(或编码)表示,然后使用这种表示尽可能地重构输入数据;VAE方法在非侵入式负荷监测(NILM)中的数学模型包括几个组成部分:数据预处理、VAE 公式、聚类和评估。受限玻尔兹曼机 (RBMs):RBMs 是一种可以学习其输入集的概率分布的生成随机人工神经网络。自回归模型:自回归模型基于过去的值来预测未来的值。深度自回归模型的例子包括PixelRNN和PixelCNN。规范化流(Normalizing Flow):规范化流是一种通过将简单的分布通过一系列可逆映射转化为复杂分布的方法。
在一些实施方式中,参见图2,所述根据所述相关特征训练半监督学习模型,得到训练好的半监督学习模型的步骤,具体包括:
S401、提供半监督学习模型;
S402、根据所述标记的分解能源消耗数据的相关特征对所述半监督学习模型进行训练,再根据所述未标记的分解能源消耗数据的相关特征进行无监督学习,得到预训练的半监督学习模型;
S403、根据所述预训练的半监督学习模型对未标记的分解能源消耗数据的标记进行预测并生成新标记,并利用所述新标记对所述预训练的半监督学习模型进行更新,得到更新后的半监督学习模型;
S404、对所述更新后的半监督学习模型的指标进行评估,所述指标大于预设阈值,则得到训练好的半监督学习模型;或,所述指标小于预设阈值,返回对所述更新后的半监督学习模型进行训练,直至所述指标大于预设阈值,得到训练好的半监督学习模型。
在一些实施方式中,所述指标包括准确率、精确率、召回率、F1值中的一种或多种。
具体地,准确率为预测正确的结果占总样本的百分比,表示整体的预测准确程度,其计算公式如式(1):
准确率=(1)。
精确率为在被所有预测为正的样本中实际为正样本的概率,表示对正样本结果中的预测准确程度,其计算公式如式(2):
精确率=(2)。
召回率为在实际为正的样本中被预测为正样本的概率,其计算公式如式(3):
召回率=(3)。
F1值表示精确率和召回率的平衡点,其计算公式如式(4):
(4)。
本发明还提供一种半监督负荷识别及分解系统,参见图3,其包括:
数据采集模块10,用于获取监测设备中收集的聚合能源消耗数据;
数据存储模块20,用于获取一组标记的分解能源消耗数据和一组未标记的分解能源消耗数据并进行存储;
预处理模块30,用于对所述标记的分解能源消耗数据和所述未标记的分解能源消耗数据进行预处理,提取相关特征;
半监督学习模块40,用于根据所述相关特征训练半监督学习模型,得到训练好的半监督学习模型;
分解模块50,用于将所述聚合能源消耗数据代入所述训练好的半监督学习模型对所述聚合能源消耗数据进行分解,得到各用电设备的负荷。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有半监督负荷识别及分解程序,所述半监督负荷识别及分解程序被处理器执行时,实现如本发明上述方案所述的半监督负荷识别及分解方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,仅在于说明本发明而决不限制本发明。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
一种半监督负荷识别及分解方法,包括步骤:
S10、获取监测设备中收集聚合能源消耗数据;
S20、获取一组标记的分解能源消耗数据和一组未标记的分解能源消耗数据并进行存储;
S30、对所述标记的分解能源消耗数据和所述未标记的分解能源消耗数据进行预处理,提取相关特征;
S40、根据所述相关特征训练半监督学习模型,得到训练好的半监督学习模型;
S50、将所述聚合能源消耗数据代入所述训练好的半监督学习模型对所述聚合能源消耗数据进行分解,得到各用电设备的负荷。
具体地,所述半监督学习算法模型为VAE,图4为本发明实施例1中基于VAE的半监督学习算法模型训练流程示意图。VAE 包括一个编码器和一个解码器。编码器将输入数据x 映射到潜在变量 z,而解码器将潜在变量 z 映射回重构输入 x'。
编码器由概率函数 q(z|x) 表示,由神经网络权重和偏差 θ参数化;解码器由概率函数 p(x|z) 表示,由神经网络权重和偏差 φ 参数化。
目标函数:
VAE 的目标函数是证据下界(ELBO),目标是最大化 ELBO,这相当于最小化负ELBO(NELBO)。
NELBO 由两部分组成:重建损失和Kullback-Leibler (KL) 散度。
第一项,,表示重建损失或在近似后验下的数据的预期对数似然。
第二项,,表示近似后验/>和真实先验/>之间的 KL散度,作为正则化项,以鼓励近似后验接近真实先验。
在半监督设置中,我们有带标签的数据(x,y)和无标签数据 x'。目标函数变为有标签数据的监督损失和无标签数据的无监督损失的组合。
其中,监督损失(x, y) 是鉴于其真实标签的带标签数据的负对数似然。这可以使用 VAE 解码器的输出计算,例如,如果标签是分类的,则可以使用交叉熵损失;无监督损失(x') 是无标签数据的负 ELBO,这是重建损失和 KL 散度之和;α 和 β 是控制监督和无监督学习之间平衡的超参数。
通过优化编码器和解码器参数(θ 和 φ)相对于目标函数,VAE 学会将输入数据编码为有意义的潜在表示 z。然后,可以使用聚类算法(如 K-means)对潜在特征进行聚类以执行 NILM。
通过优化编码器和解码器参数(θ 和 φ)相对于目标函数,VAE 学会将输入数据编码为有意义的潜在表示 z。然后,可以使用聚类算法(如 K-means)对潜在特征进行聚类,以执行非侵入式负荷监测。在评估阶段,可以使用诸如调整兰德指数(ARI)和轮廓系数等评估指标来衡量模型性能。
综上所述,本发明公开了一种半监督负荷识别及分解方法、系统及存储介质,方法包括步骤:获取监测设备中收集的聚合能源消耗数据;获取一组标记的分解能源消耗数据和一组未标记的分解能源消耗数据并进行存储;对所述标记的分解能源消耗数据和所述未标记的分解能源消耗数据进行预处理,提取相关特征;根据所述相关特征训练半监督学习模型,得到训练好的半监督学习模型;将所述聚合能源消耗数据代入所述训练好的半监督学习模型对所述聚合能源消耗数据进行分解,得到各用电设备的负荷。本发明采用非侵入式负荷识别技术,相对于侵入式负荷识别技术具有实施难度低、硬件经济成本低(每户只需不到300元)、可靠性高、用户接受程度高、覆盖用户范围大、数据完整性好和商业化大规模推广容易的优点,再结合半监督学习算法,相对于美国的Sense具有以下优点:(1)算法模型不依赖于样本库,适应性强(不用调参数),从根本上减少识别算法的计算代价,降低服务器的运行成本;(2)可以做到无阈值(可识别小至充电的手机)和无标签(不用用户指定电器数目)地鉴别用电设备动作;(3)计算复杂度低(与训练样本数成线性关系);(4)可以实现针对每个用户连续不断地在线学习;(5)算法能够随着样本增长,自适应用电设备的物理特性变化,并且准确率越来越高(负荷识别的准确率可以达到90%以上);采用本发明的方法可以准确且高效地实现能源分配。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种半监督负荷识别及分解方法,其特征在于,包括步骤:
获取监测设备中收集的聚合能源消耗数据;
获取一组标记的分解能源消耗数据和一组未标记的分解能源消耗数据并进行存储;
对所述标记的分解能源消耗数据和所述未标记的分解能源消耗数据进行预处理,提取相关特征;
根据所述相关特征训练半监督学习模型,得到训练好的半监督学习模型;
将所述聚合能源消耗数据代入所述训练好的半监督学习模型对所述聚合能源消耗数据进行分解,得到各用电设备的负荷。
2.根据权利要求1所述的半监督负荷识别及分解方法,其特征在于,所述聚合能源消耗数据的特征选择包括基波或谐波有功功率、无功功率、稳态特征、暂态特征、事件的开关状态、电压、电流有效值中的一种或多种。
3.根据权利要求1所述的半监督负荷识别及分解方法,其特征在于,所述预处理选自滤波处理、归一化处理、分段处理、特征提取处理、数据清洗处理中的一种或多种。
4.根据权利要求1所述的半监督负荷识别及分解方法,其特征在于,所述相关特征选自时间域特征、频域特征、统计特征、小波特征、转变点特征中的一种或多种。
5.根据权利要求4所述的半监督负荷识别及分解方法,其特征在于,所述时间域特征包括电流和电压的瞬时值、平均值、最大值、最小值、方差、波形因数、峰值因数、形状因数、脉冲因数中的一种或多种;所述频域特征包括频谱形状、主频率、频谱能量、频谱熵、频谱质心、频谱斜度、频谱峭度中的一种或多种;所述统计特征包括电流和电压的均值、中值、标准差、偏度、峰度、相关性、自相关性中的一种或多种;所述小波特征包括电力信号在不同尺度和不同频率下的能量分布、小波系数;所述转变点特征包括上升边缘、下降边缘、脉冲宽度、脉冲高度、脉冲间隔中的一种或多种。
6.根据权利要求1所述的半监督负荷识别及分解方法,其特征在于,所述半监督学习模型选自半监督支持向量机、标签传播算法、标签扩散算法、半监督深度生成模型中的一种。
7.根据权利要求1所述的半监督负荷识别及分解方法,其特征在于,所述根据所述相关特征训练半监督学习模型,得到训练好的半监督学习模型的步骤,具体包括:
提供半监督学习模型;
根据所述标记的分解能源消耗数据的相关特征对所述半监督学习模型进行训练,再根据所述未标记的分解能源消耗数据的相关特征进行无监督学习,得到预训练的半监督学习模型;
根据所述预训练的半监督学习模型对未标记的分解能源消耗数据的标记进行预测并生成新标记,并利用所述新标记对所述预训练的半监督学习模型进行更新,得到更新后的半监督学习模型;
对所述更新后的半监督学习模型的指标进行评估,所述指标大于预设阈值,则得到训练好的半监督学习模型;或,所述指标小于预设阈值,返回对所述更新后的半监督学习模型进行训练,直至所述指标大于预设阈值,得到训练好的半监督学习模型。
8.根据权利要求7所述的半监督负荷识别及分解方法,其特征在于,所述指标包括准确率、精确率、召回率、F1值中的一种或多种。
9.一种半监督负荷识别及分解系统,其特征在于,包括:
数据采集模块,用于获取监测设备中收集的聚合能源消耗数据;
数据存储模块,用于获取一组标记的分解能源消耗数据和一组未标记的分解能源消耗数据并进行存储;
预处理模块,用于对所述标记的分解能源消耗数据和所述未标记的分解能源消耗数据进行预处理,提取相关特征;
半监督学习模块,用于根据所述相关特征训练半监督学习模型,得到训练好的半监督学习模型;
分解模块,用于将所述聚合能源消耗数据代入所述训练好的半监督学习模型对所述聚合能源消耗数据进行分解,得到各用电设备的负荷。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有半监督负荷识别及分解程序,所述半监督负荷识别及分解程序被处理器执行时,实现如权利要求1-8任一项所述的半监督负荷识别及分解方法的步骤。
CN202310806416.1A 2023-07-04 2023-07-04 一种半监督负荷识别及分解方法、系统及存储介质 Pending CN116522151A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310806416.1A CN116522151A (zh) 2023-07-04 2023-07-04 一种半监督负荷识别及分解方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310806416.1A CN116522151A (zh) 2023-07-04 2023-07-04 一种半监督负荷识别及分解方法、系统及存储介质

Publications (1)

Publication Number Publication Date
CN116522151A true CN116522151A (zh) 2023-08-01

Family

ID=87392574

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310806416.1A Pending CN116522151A (zh) 2023-07-04 2023-07-04 一种半监督负荷识别及分解方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN116522151A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116961012A (zh) * 2023-09-21 2023-10-27 国网吉林省电力有限公司松原供电公司 基于最短路径搜索越限设备可控负荷开关识别方法及系统
CN117473368A (zh) * 2023-10-30 2024-01-30 湖南大学 一种非侵入式负荷监测的半监督学习方法及系统
CN118033208A (zh) * 2024-04-12 2024-05-14 江苏尚研电力科技有限公司 智能化的空气开关

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112348096A (zh) * 2020-11-11 2021-02-09 合肥工业大学 非侵入式负荷分解方法及系统
CN114722873A (zh) * 2022-04-14 2022-07-08 湘潭大学 一种基于残差卷积和注意力机制的非侵入式负荷分解方法
CN115169382A (zh) * 2022-06-15 2022-10-11 浙江万里学院 一种低频信号非侵入式负荷分解算法
CN115222018A (zh) * 2021-06-22 2022-10-21 中国海洋大学 非侵入式负荷分解方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112348096A (zh) * 2020-11-11 2021-02-09 合肥工业大学 非侵入式负荷分解方法及系统
CN115222018A (zh) * 2021-06-22 2022-10-21 中国海洋大学 非侵入式负荷分解方法及装置
CN114722873A (zh) * 2022-04-14 2022-07-08 湘潭大学 一种基于残差卷积和注意力机制的非侵入式负荷分解方法
CN115169382A (zh) * 2022-06-15 2022-10-11 浙江万里学院 一种低频信号非侵入式负荷分解算法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116961012A (zh) * 2023-09-21 2023-10-27 国网吉林省电力有限公司松原供电公司 基于最短路径搜索越限设备可控负荷开关识别方法及系统
CN116961012B (zh) * 2023-09-21 2024-01-16 国网吉林省电力有限公司松原供电公司 基于最短路径搜索越限设备可控负荷开关识别方法及系统
CN117473368A (zh) * 2023-10-30 2024-01-30 湖南大学 一种非侵入式负荷监测的半监督学习方法及系统
CN118033208A (zh) * 2024-04-12 2024-05-14 江苏尚研电力科技有限公司 智能化的空气开关

Similar Documents

Publication Publication Date Title
Angelis et al. NILM applications: Literature review of learning approaches, recent developments and challenges
Hu et al. A hybrid approach based on the Gaussian process with t-observation model for short-term wind speed forecasts
CN116522151A (zh) 一种半监督负荷识别及分解方法、系统及存储介质
CN110610280B (zh) 一种电力负荷短期预测方法、模型、装置及系统
Hu et al. Short-term wind speed prediction using empirical wavelet transform and Gaussian process regression
Hu et al. A hybrid forecasting approach applied to wind speed time series
CN106022645B (zh) 非侵入式在线实时电力负荷识别方法及识别系统
Kankanala et al. AdaBoost $^{+} $: An ensemble learning approach for estimating weather-related outages in distribution systems
Liu et al. Super resolution perception for smart meter data
CN116933044B (zh) 一种供电数据智能处理方法及系统
CN103996071A (zh) 一种基于马尔科夫理论的风电场风速预测方法
Wang et al. Hybrid deep learning model for short-term wind speed forecasting based on time series decomposition and gated recurrent unit
El Bakali et al. Data-Based Solar Radiation Forecasting with Pre-Processing Using Variational Mode Decomposition
CN111310963A (zh) 电站的发电数据预测方法、装置、计算机设备和存储介质
Rafiq et al. A review of current methods and challenges of advanced deep learning-based non-intrusive load monitoring (NILM) in residential context
Ammar et al. Wind speed forecasting using deep learning and preprocessing techniques
CN117200241A (zh) 一种新能源并网智能调压系统
Liu et al. A Bayesian deep learning-based probabilistic risk assessment and early-warning model for power systems considering meteorological conditions
CN111506636A (zh) 一种基于自回归和近邻算法的居民用电行为分析的系统及方法
Choong et al. Advances in signal processing and artificial intelligence technologies in the classification of power quality events: a survey
Zhao et al. Missing interpolation model for wind power data based on the improved CEEMDAN method and generative adversarial interpolation network
Liu et al. Enhancing short-term wind power forecasting accuracy for reliable and safe integration into power systems: A gray relational analysis and optimized support vector regression machine approach
Qiu et al. Achieving an accurate random process model for PV power using cheap data: Leveraging the SDE and public weather reports
Wang et al. A Multi-View Spatio-Temporal Feature Fusion Approach for Wind Turbine Condition Monitoring Based on SCADA Data
Zhou et al. Long-term cost planning of data-driven wind-storage hybrid systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20230801

RJ01 Rejection of invention patent application after publication