CN116738049A - 基于大数据技术的用电监测系统、方法、装置和存储介质 - Google Patents
基于大数据技术的用电监测系统、方法、装置和存储介质 Download PDFInfo
- Publication number
- CN116738049A CN116738049A CN202310705683.XA CN202310705683A CN116738049A CN 116738049 A CN116738049 A CN 116738049A CN 202310705683 A CN202310705683 A CN 202310705683A CN 116738049 A CN116738049 A CN 116738049A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- instantaneous
- data sequence
- power
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000012544 monitoring process Methods 0.000 title claims abstract description 39
- 238000005516 engineering process Methods 0.000 title claims abstract description 24
- 230000005611 electricity Effects 0.000 claims abstract description 84
- 230000002159 abnormal effect Effects 0.000 claims abstract description 64
- 238000001514 detection method Methods 0.000 claims abstract description 27
- 238000010801 machine learning Methods 0.000 claims description 15
- 238000012806 monitoring device Methods 0.000 claims description 4
- 230000005856 abnormality Effects 0.000 abstract description 13
- 230000000875 corresponding effect Effects 0.000 description 25
- 238000012549 training Methods 0.000 description 22
- 239000013598 vector Substances 0.000 description 17
- 238000009826 distribution Methods 0.000 description 14
- 239000006185 dispersion Substances 0.000 description 9
- 238000012986 modification Methods 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 4
- 230000002596 correlated effect Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000001953 sensory effect Effects 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000000692 Student's t-test Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2219—Large Object storage; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Business, Economics & Management (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Economics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Public Health (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本说明书实施例提供一种基于大数据技术的用电监测系统、方法、装置和存储介质,用电监测系统包括传感部件以及处理器,处理器用于:基于预设间隔,从传感部件中获取瞬时传感数据;通过至少一个数据库、至少一个模型中的至少一个,对多个时刻的瞬时传感数据构成的传感数据序列进行异常检测,确定异常特征;基于异常特征,确定是否发出预警以及是否向用户发送推荐用电方案。
Description
技术领域
本说明书涉及用电监测领域,特别涉及一种基于大数据技术的用电监测系统、方法、装置和存储介质。
背景技术
随着科技的发展用电设备不断增多,用电终端多种多样,近年来,用电问题已经成为影响居民生活安全的重要因素。目前对于此类用电设备的管理以及预警需要耗费大量的人力物力并且也存在一定的安全隐患。如何智能的对用电设备进行用电监测以及对用电异常的情况进行预测是需要解决的问题。
因此提供一种基于大数据技术的用电监测系统、方法、装置和存储介质,有助于对用电数据的监测与用电终端及电路异常风险的预测。
发明内容
本说明书实施例之一提供一种基于大数据技术的用电监测系统,所述系统包括传感部件以及处理器,所述处理器用于:基于预设间隔,从传感部件中获取瞬时传感数据;对多个时刻的瞬时传感数据构成的传感数据序列进行异常检测,确定异常特征;其中,所述异常检测至少包括;通过至少一个数据库、至少一个模型中的至少一个,对传感数据序列进行异常检测以确定异常特征,模型至少包括机器学习模型,数据库和/或模型基于大数据预先构建,构建方法包括:获取至少预设数量的实例数据,实例数据包括正实例数据和负实例数据中的至少一个;基于实例数据构建至少一个数据库、至少一个模型中的至少一个;基于异常特征,确定是否发出预警以及是否向用户发送推荐用电方案。
本说明书实施例之一提供一种基于大数据技术的用电监测方法,所述方法由基于大数据技术的用电监测系统实现,所述系统包括传感部件以及处理器,方法由处理器执行,包括:基于预设间隔,从传感部件中获取瞬时传感数据;对多个时刻的瞬时传感数据构成的传感数据序列进行异常检测,确定异常特征;其中,异常检测至少包括:通过至少一个数据库、至少一个模型中的至少一个,对传感数据序列进行异常检测以确定异常特征,模型至少包括机器学习模型,所述数据库和/或模型基于大数据预先构建,构建方法包括:获取至少预设数量的实例数据,实例数据包括正实例数据和负实例数据中的至少一个;基于实例数据构建至少一个数据库、至少一个模型中的至少一个;基于异常特征,确定是否发出预警以及是否向用户发送推荐用电方案。
本说明书实施例之一提供一种基于大数据技术的用电监测装置;其特征在于,所述装置包括至少一个处理器以及至少一个存储器;所述至少一个存储器用于存储计算机指令;所述至少一个处理器用于执行所述计算机指令中的至少部分指令以实现如上所述的基于大数据技术的用电监测方法。
本说明书实施例之一提供一种计算机可读存储物质,其特征在于,所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机执行如上所述的基于大数据技术的用电监测方法。
附图说明
本说明书将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
图1是根据本说明书一些实施例所示的基于大数据技术的用电监测方法的示例性流程图;
图2是根据本说明书一些实施例所示的基于模型确定异常特征的示例性示意图;
图3是根据本说明书一些实施例所示的基于模型确定用电特征的示例性示意图。
具体实施方式
为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
应当理解,本文使用的“系统”、“装置”、“单元”和/或“模块”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
图1是根据本说明书一些实施例所示的基于大数据技术的用电监测方法的示例性流程图。在一些实施例中,流程100可以由处理器执行。如图1所示,流程100包括下述步骤:
步骤110,基于预设间隔,从传感部件中获取瞬时传感数据。
处理器可以通过多种方式获取预设间隔。例如,预设间隔可以通过用户预先设置获得。在一些实施例中,预设间隔可以相关于分散值。例如,预设间隔可以正相关于分散值。关于分散值的更多说明参见下文。
在一些实施例中,传感部件可以包括电力数据监测器、温度传感器、声音传感器中的至少一种。
瞬时传感数据是指某一时刻下传感部件测量到的数据。在一些实施例中,瞬时传感数据可以包括瞬时电力数据、瞬时温度数据、瞬时声音数据中的至少一种。
处理器可以通过多种方式获取瞬时传感数据。在一些实施例中,处理器可以实时从传感部件中获取瞬时传感数据。
在一些实施例中,处理器可以基于预设间隔,以预设监测精度从传感部件中获取瞬时传感数据。通过以预设监测精度从传感部件中获取瞬时传感数据,可以提高数据采集和处理的精度,减少误差和干扰。
预设监测精度是指预先设定的瞬时传感数据采样的精度。例如,预设监测精度可以包括对瞬时电力数据中电流和电压采样的精度。在一些实施例中,预设监测精度可以通过用户预先设置获得。
在一些实施例中,预设监测精度可以相关于分散值。例如,预设监测精度可以正相关于分散值。
分散值是指相关电力数据序列中用电特征离散程度的度量。相关电力数据序列是指用电特征数据库中与当前的用户特征和场景特征分别匹配的参考用户特征和参考场景特征对应的参考电力数据序列。其中,用电特征数据库中可以包括多个参考用电特征、多个参考场景特征以及多个参考电力数据序列及其对应的参考用电特征,其中一个参考用电特征和一个参考场景特征可以对应一个参考电力数据序列。用电特征数据库可以基于大数据统计生成。示例性的用电特征数据库如下表1所示:
参考用户特征 | 参考场景特征 | 参考电力数据序列 | 参考用电特征 |
… | … | … | … |
表1用电特征数据库
在一些实施例中,处理器可以基于当前的用户特征和场景特征,通过用电特征数据库确定至少一个相关电力数据序列。例如,处理器可以从用电特征数据库中,筛选出与当前的用户特征和场景特征之间向量距离小于距离阈值的参考用户特征和参考场景特征,将参考用户特征和参考场景特征对应的参考电力数据序列确定为相关电力数据序列。
在一些实施例中,分散值可以相关于当前的用户特征和场景特征在用电特征数据库中对应的至少一个相关电力数据序列的用电特征的目标相似度。例如,分散值可以正相关于目标相似度。其中,目标相似度可以用于衡量至少一个相关电力数据序列之间的相似程度。关于用户特征和场景特征的更多说明参见图3。
在一些实施例中,处理器可以基于至少一个相关电力数据序列对应的参考用电特征、参考场景特征以及参考用电特征构成第一子数据库;基于第一子数据库,重复多次计算任意两个相关电力数据序列对应的参考用电特征之间的候选相似度;基于满足预设条件的多个候选相似度,确定目标相似度。其中,计算相似度的方式可以包括余弦相似度、欧式距离等。预设条件可以是两个相关电力数据序列相似度大于相似度阈值。例如,对于参考用户特征u和参考场景特征e,其示例性的第一子数据库如下表2所示:
参考用户特征 | 参考场景特征 | 参考电力数据序列 | 参考用电特征 |
u | e | … | … |
u | e | … | … |
… | … | … | … |
表2第一子数据库
在一些实施例中,处理器可以基于满足预设条件的多个候选相似度进行加权融合,确定目标相似度。候选相似度对应的权重可以是多种形式。例如,可以设置各个候选相似度的权重相同。
作为具体示例,处理器可以从第一子数据库中随机抽样选择两行数据行,计算这两行数据行中参考电力数据序列的候选相似度,若候选相似度大于相似度阈值,将该候选相似度并计入总相似度,否则重新随机抽样,并计算候选相似度;重复多次,最后根据随机抽样的次数和总相似度计算相似度均值。
本说明书一些实施例,通过对相关电路数据序列的用电特征进行相似度分析计算分散值,进而调整预设间隔和预设监测精度,可以更智能地对传感部件的监测进行优化,减少数据采集和处理的负荷。
在一些实施例中,用电特征数据库可以基于预设周期进行更新。处理器可以通过多种方式确定预设周期。例如,预设周期可以通过用户预先设置获得。
在一些实施例中,预设周期可以相关于用户负反馈占比。例如,预设周期可以负相关于用户负反馈占比。
用户负反馈占比是指包含负面用户反馈的推荐用电方案数量占推荐用电方案总量的比例。用户负反馈占比可以基于大数据获取。
负面用户反馈可以包括但不限于用户反馈用电方案有误、不实用等。
本说明书一些实施例,通过根据用户负反馈占比确定预设周期进而更新用电特征数据库,可以更好地衡量推荐用电方案的有效性,使得用电特征数据库始终保持与用户实际用电行为的一致性。
步骤120,对多个时刻的瞬时传感数据构成的传感数据序列进行异常检测,确定异常特征。
传感数据序列是指由多个时刻的瞬时传感数据构成的序列。在一些实施例中,传感数据序列可以包括电力数据序列、温度数据序列和声音数据序列。
异常特征可以反映传感数据序列是否存在整体异常(例如,功率整体较高或较低、功率上下波动较大、功率出现异常波动等)或部分峰值异常等(例如,某个时刻功率突然飙高等)。
异常特征可以包括异常类型和异常度。异常类型可以包括测量误差、设备故障、线路故障等。异常度可以指发生异常的程度。异常度越大,表示异常程度较高。
在一些实施例中,异常检测可以得到多个异常类型及各自的异常度,构成异常特征分布。
异常检测是指从正常的时间序列中识别不正常的事件或行为的过程。
在一些实施例中,异常检测至少包括:通过至少一个数据库、至少一个模型中的至少一个,对传感数据序列进行异常检测以确定异常特征,模型至少包括机器学习模型,数据库和/或模型基于大数据预先构建。
在一些实施例中,处理器可以基于至少一个数据库,通过多种数据分析方式对传感数据序列进行异常检测以确定异常特征。例如,可以基于传感数据序列对应的数据库中,通过t检验,f检验,卡方检验等数据分析方式进行数据分析确定正常数据的范围和特征,通过对比分析传感数据序列和正常数据的特征,再经过人工标记等标记手段标记异常和非异常数据,进而进行异常检测。
在一些实施例中,处理器可以基于至少一个模型,通过多种数据分析方式对传感数据序列进行异常检测以确定异常特征。例如,处理器可以基于AutoEncoder的无监督异常检测算法、基于Transformer掩码重建的时序数据异常检测算法等对传感数据序列进行异常检测。
在一些实施例中,数据库和/或模型可以基于大数据预先构建。处理器可以通过多种方式构建数据库或模型。在一些实施例中,数据库或模型的构建方法包括:获取至少预设数量的实例数据;基于实例数据构建至少一个数据库、至少一个模型中的至少一个。
实例数据是用于构建模型或数据库的样本数据集合。实例数据可以包括正实例数据和负实例数据中的至少一个。
正实例数据包括不存在异常的传感数据序列。负实例数据包括存在异常的传感数据序列。
在一些实施例中,处理器可以对收集到的实例数据进行预处理,针对实例数据进行聚类分析,根据聚类结果和实际应用需求,设计数据库表结构和属性,并将聚类后的实例数据导入数据库结构中,构建数据库。预处理包括但不限于去重、归一化和特征提取等。
在一些实施例中,处理器可以基于预处理后的实例数据确定训练样本及标签,通过多种机器学习算法进行模型训练,构建至少一个模型。
在一些实施例中,处理器还可以通过异常特征确定模型确定异常特征。关于异常特征确定模型的更多说明可以参见图2及其相关描述。
步骤130,基于异常特征,确定是否发出预警以及是否向用户发送推荐用电方案。
预警的内容及方式可以是多种形式。例如,预警内容可以包括“当前电器总功率过大”等,预警方式可以包括但不限于通过语音、文字等方式。
推荐用电方案是指可行的电力使用方案。例如,推荐用电方案可以包括建议用户降低的功率值和基于该降低的功率值建议用户所做的操作(例如,建议用户进行空调功率调节)等。
处理器可以通过多种方式判断是否发出预警以及是否向用户发送推荐用电方案。在一些实施例中,可以根据异常特征,通过预设对照表确定是否发出预警以及是否向用户发送推荐用电方案。在一些实施例中,还可以通过预设对照表确定推荐用电方案。在一些实施例中,预设对照表中可以包括多个参考异常特征,以及每个参考异常特征下是否发出预警、是否向用户发送推荐用电方案的对应关系。在一些实施例中,预设对照表中还可以包括多个参考异常特征各自对应的参考用电方案。
在一些实施例中,预设对照表可以根据先验知识或历史数据构建得到。
本说明书一些实施例,通过传感器实时监测获取瞬时传感数据,并通过大数据技术对传感数据序列进行异常检测及时发出预警,从而实现高效的用电监测,可以及时发现用电异常情况,保证用电安全和稳定。
应当注意的是,上述有关流程的描述仅仅是为了示例和说明,而不限定本说明书的适用范围。对于本领域技术人员来说,在本说明书的指导下可以对流程进行各种修正和改变。然而,这些修正和改变仍在本说明书的范围之内。
图2是根据本说明书一些实施例所示的基于模型确定异常特征的示例性示意图。
在一些实施例中,处理器可以基于电力数据序列、温度数据序列、声音数据序列中至少一种,确定多个时刻的用电特征;基于用电特征和瞬时电力数据,通过异常特征确定模型确定异常特征。
关于电力数据序列、温度数据序列和声音数据序列的更多说明,参见图1及其相关描述。
用电特征是指不同类别的用电设备的使用情况。在一些实施例中,多个时刻的用电特征可以是与电力数据序列的多个时刻对应的用电特征。例如,用电特征可以是制冷制热设备的预估总使用功率、照明设备的预估总使用功率、厨用设备的预估总使用功率等。
处理器可以通过多种方式确定用电特征。在一些实施例中,处理器可以基于电力数据序列、温度数据序列、声音数据序列中至少一种,通过向量数据库确定多个时刻的用电特征。
向量数据库是指用于存储、索引和查询向量的数据库。在一些实施例中,向量数据库中可以包括多个传感数据特征向量及其对应的参考用电特征,传感数据特征向量可以基于某一时刻的电力数据、温度数据、声音数据中至少一种进行构建。在一些实施例中,传感数据特征向量对应的参考用电特征可以基于历史数据确定。
在一些实施例中,处理器可以基于电力数据序列、温度数据序列、声音数据序列中至少一种在同一时刻的瞬时传感数据(包括瞬时电力数据、瞬时温度数据、瞬时声音数据中的至少一种)构建目标特征向量,多个时刻对应多个目标特征向量;通过向量数据库确定符合预设条件的至少一个传感数据特征向量为至少一个关联特征向量;将至少一个关联特征向量对应的参考用电特征确定为多个时刻的用电特征。在一些实施例中,预设条件可以包括目标特征向量与传感数据特征向量的向量距离小于距离阈值。
在一些实施例中,处理器还可以通过用电特征确定模型确定用电特征。关于用电特征确定模型的更多说明参见图3及其相关描述。
异常特征确定模型为确定异常特征的机器学习模型。在一些实施例中,异常特征确定模型可以为下文自定义结构的机器学习模型。异常特征确定模型还可以是其他结构的机器学习模型,例如神经网络模型等。
在一些实施例中,如图3所示,异常特征确定模型220的输入可以为多个时刻的用电特征211和当前时刻的瞬时电力数据210,输出可以包括异常特征230。
在一些实施例中,异常特征确定模型220可以包括异常点确定层221和异常特征确定层223。
在一些实施例中,异常点确定层221的输入可以为多个时刻的用电特征211和当前时刻的瞬时电力数据210,输出可以包括异常点集合222。异常点是指电力数据序列中存在异常的时间点。在一些实施例中,异常点确定层221可以为长短期记忆网络模型或深度神经网络模型等。
在一些实施例中,异常特征确定层223的输入可以为异常点集合222,输出可以包括异常特征230。在一些实施例中,异常特征确定层223可以为长短期记忆网络模型或深度神经网络模型。
在一些实施例中,异常点确定层221和异常特征确定层223可以通过带有第一标签的第一训练样本联合训练得到。在一些实施例中,第一训练样本可以为多个样本时刻的样本用电特征和样本瞬时电力数据,第一标签可以为各个样本时刻对应的实际异常特征。在一些实施例中,第一训练样本可以通过大数据获取,第一标签可以通过人工标注获得。
示例性的联合训练过程包括:将多个样本时刻的样本用电特征和样本瞬时电力数据输入异常点确定层,得到异常点确定层输出的异常点集合,将异常点集合作为样本数据,输入异常特征确定层,得到异常特征确定层输出的异常特征。基于异常特征和样本异常特征构建损失函数,同步更新异常点确定层和异常特征确定层的参数。通过参数更新,得到训练好的异常点确定层和异常特征确定层。
本说明书一些实施例,异常特征确定模型包括异常点确定层和异常特征确定层,同时确定异常点和对应的异常特征,可以提高异常检测的准确性,减少误报率和漏报率;并且通过联合训练得到异常点确定层和异常特征确定层,可以优化模型,减少误差,提高检测准确性。
在一些实施例中,异常特征确定模型还可以与用电特征确定模型联合训练。关于用电特征确定模型及联合训练的更多说明参见图3及其相关描述。
本说明书的一些实施例,基于多种数据序列,通过异常特征确定模型来检测异常,可以减少误报率和漏报率,提高异常检测的效果和效率。
图3是根据本说明书一些实施例所示的基于模型确定用电特征的示例性示意图。
在一些实施例中,处理器可以基于电力数据序列310、温度数据序列330和声音数据序列320中至少一种,通过用电特征确定模型340确定多个时刻的用电特征350。
在一些实施例中,用电特征确定模型340可以为下文中自定义结构的机器学习模型。用电特征确定模型340还可以是其他结构的机器学习模型,例如神经网络模型等。
在一些实施例中,用电特征确定模型340的输入可以包括电力数据序列310、温度数据序列330、声音数据序列320中至少一种,输出可以为多个时刻的用电特征350。
在一些实施例中,用电特征确定模型340的输入还可以包括用户特征360、场景特征370以及用电特征分布390。
用户特征是指用于表示用户本身特性的数据。例如,用户特征可以包括用户的年龄、性别等。
场景特征是指用于表示场景本身特性的数据。例如,场景特征可以包括场景类型(例如,居民楼、写字楼)等。场景特征可根据定位和预设的信息库确定。
用电特征分布是指特定用户特征和特定场景特征下用电数据的统计分布情况。
用电特征分布可以基于用户特征和场景特征从用电特征数据库中获取。在一些实施例中,处理器可以根据当前用电特征对应的用户特征和场景特征,从用电特征数据库中筛选出相关用户特征和相关场景特征的数据行,构成第二子数据库;对至少一个相关用户特征和相关场景特征对应的参考用电特征进行聚类,得到至少一个聚类中心集合;确定至少一个聚类中心集合的统计占比;确定至少一个聚类中心集合中每个聚类中心集合的聚类中心及其对应的电力数据序列;按照预设排序规则和至少一个聚类中心集合的统计占比,对至少一个聚类中心集合进行排序;基于预设数量的排序结果、至少一个聚类中心集合对应的聚类中心及其对应的电力数据序列和至少一个聚类中心集合的统计占比,构建用电特征分布。其中,预设数量的排序结果是指选择排序靠前的预设数量的多个聚类中心集合。相关用户特征和相关场景特征的确定方式与相关电力数据序列的确定方式类似,更多说明参考前文相关描述。
在一些实施例中,处理器可以通过聚类算法对至少一个相关用户特征和相关场景特征对应的参考用电特征进行聚类,确定聚类中心集合。聚类算法可以包括但不限于K-Means(K均值)聚类和/或基于密度的聚类方法(DBSCAN)等。
在一些实施例中,处理器可以将一个聚类中心集合中包含的参考用电特征的数量占全部聚类中心集合中包含的参考用电特征的总数量的比值确定为某一聚类中心集合的统计占比。在一些实施例中,预设排序规则可以为降序排序。在一些实施例中,预设数量可以基于用户需求确定。
示例性的用电特征分布如下表3所示:
表3用电特征分布
在一些实施例中,用电特征分布可以通过矩阵表示。例如,上述表格的用电特征分布可以表示为((a1,X1%,b1),(a2,C2%,b2),……,(an,Xn%,bn))。其中,X1,X2,……,Xn的大小依次递减。
用电特征分布可以通过多种方式输入用电特征确定模型。在一些实施例中,用电特征分布直接输入用电特征确定模型。在一些实施例中,用电特征分布先通过嵌入层处理后再输入用电特征确定模型。
本说明书一些实施例,通过将用户特征、场景特征以及用电特征分布加入用电特征确定模型输入中,可以更好地适应不同时间段的用电习惯变化、电器变化及更新等,通过量化用电习惯形成的用电特征分布,模型可以学习到更上层的信息,更准确地预测多个时刻的用电特征,有效解决仅学习对应关系带来的模型失效问题,避免重新训练模型带来的时间成本浪费问题。
在一些实施例中,用电特征确定模型的输出可以为异常特征确定模型的输入,异常特征确定模型和用电特征确定模型可以通过带有第二标签的第二训练样本联合训练得到。
在一些实施例中,第二训练样本可以包括样本电力数据序列、样本温度数据序列和样本声音数据序列中至少一种与样本瞬时电力数据。在一些实施例中,第二标签可以是第二训练样本对应的实际的异常特征。第二训练样本可以通过历史监测数据获取,第二标签可以通过人工标注获取。
示例性的联合训练过程包括:将样本电力数据序列、样本温度数据序列和样本声音数据序列中至少一种输入用电特征确定模型,得到用电特征确定模型输出的多个时刻的用电特征;将多个时刻的用电特征作为训练样本数据,和样本瞬时电力数据输入异常特征确定模型,得到异常特征确定模型输出的异常特征;基于样本异常特征和异常特征确定模型输出的异常特征构建损失函数,同步更新异常特征确定模型和用电特征确定模型的参数。通过参数更新,得到训练好的异常特征确定模型和用电特征确定模型。
当用电特征确定模型的输入还包括用户特征、场景特征以及用户特征和场景特征对应的用电特征分布时,第二训练样本还可以包括样本用户特征、样本场景特征以及样本用电特征分布。相应的,异常特征确定模型和用电特征确定模型进行联合训练时,还可以将样本用户特征、样本场景特征以及样本用电特征分布与样本电力数据序列、样本温度数据序列和样本声音数据序列中至少一种一并输入用电特征确定模型中,将用电特征确定模型的输出作为训练样本数据,和样本瞬时电力数据输入异常特征确定模型,并进行后续训练。关于后续训练过程的更多说明参考前文。
本说明书一些实施例,通过上述训练方式获得用电特征确定模型340的参数,在一些情况下有利于解决单独训练用电特征确定模型时难以获得标签的问题,还可以使用电特征确定模型能较好地得到反映用电设备使用情况的多个时刻的用电特征。
本说明书的一些实施例,基于电力数据序列、温度数据序列、声音数据序列中至少一种,通过用电特征确定模型确定多个时刻的用电特征,可以更全面、准确地了解用户用电行为,提高用电行为分析和预测的准确性和精度,为用电管理和优化提供更有效的方案和策略。
本说明书一些实施例提供了一种基于大数据技术的用电监测装置,其特征在于,所述装置包括至少一个处理器以及至少一个存储器;所述至少一个存储器用于存储计算机指令;所述至少一个处理器用于执行所述计算机指令中的至少部分指令以实现如上任意一项实施例所述的基于大数据技术的用电监测方法。
本说明书一些实施例提供了一种计算机可读存储介质,所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机执行如上任意一项实施例所述的基于大数据技术的用电监测方法。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本说明书的限定。虽然此处并没有明确说明,本领域技术人员可能会对本说明书进行各种修改、改进和修正。该类修改、改进和修正在本说明书中被建议,所以该类修改、改进、修正仍属于本说明书示范实施例的精神和范围。
同时,本说明书使用了特定词语来描述本说明书的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本说明书至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本说明书的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,除非权利要求中明确说明,本说明书所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本说明书流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本说明书实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本说明书披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本说明书实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本说明书对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有±20%的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本说明书一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
针对本说明书引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本说明书作为参考。与本说明书内容不一致或产生冲突的申请历史文件除外,对本说明书权利要求最广范围有限制的文件(当前或之后附加于本说明书中的)也除外。需要说明的是,如果本说明书附属材料中的描述、定义、和/或术语的使用与本说明书所述内容有不一致或冲突的地方,以本说明书的描述、定义和/或术语的使用为准。
最后,应当理解的是,本说明书中所述实施例仅用以说明本说明书实施例的原则。其他的变形也可能属于本说明书的范围。因此,作为示例而非限制,本说明书实施例的替代配置可视为与本说明书的教导一致。相应地,本说明书的实施例不仅限于本说明书明确介绍和描述的实施例。
Claims (10)
1.一种基于大数据技术的用电监测系统,其特征在于,所述系统包括传感部件以及处理器,所述处理器用于:
基于预设间隔,从所述传感部件中获取瞬时传感数据;
对多个时刻的所述瞬时传感数据构成的传感数据序列进行异常检测,确定异常特征;其中,所述异常检测至少包括:
通过至少一个数据库、至少一个模型中的至少一个,对所述传感数据序列进行所述异常检测以确定所述异常特征,所述模型至少包括机器学习模型,所述数据库和/或所述模型基于大数据预先构建,所述构建方法包括:
获取至少预设数量的实例数据,所述实例数据包括正实例数据和负实例数据中的至少一个;
基于所述实例数据构建所述至少一个数据库、所述至少一个模型中的至少一个;
基于所述异常特征,确定是否发出预警以及是否向用户发送推荐用电方案。
2.根据权利要求1所述的系统,其特征在于,所述传感部件还包括电力数据监测器、温度传感器、声音传感器中至少一种,所述瞬时传感数据包括瞬时电力数据、瞬时温度数据、瞬时声音数据中至少一种,所述异常检测进一步包括:
基于电力数据序列、温度数据序列、声音数据序列中至少一种,确定所述多个时刻的用电特征;
基于所述用电特征和所述瞬时电力数据,通过异常特征确定模型确定异常特征,所述异常特征确定模型为机器学习模型。
3.根据权利要求2所述的系统,其特征在于,所述基于电力数据序列、温度数据序列、声音数据序列中至少一种,确定所述多个时刻的用电特征包括:
基于所述电力数据序列、所述温度数据序列和所述声音数据序列中至少一种,通过用电特征确定模型确定所述多个时刻的用电特征,所述用电特征确定模型为机器学习模型。
4.根据权利要求1所述的系统,其特征在于,所述基于预设间隔,从所述传感部件中获取瞬时传感数据包括:
基于预设间隔,以预设监测精度从所述传感部件中获取瞬时传感数据。
5.一种基于大数据技术的用电监测方法,其特征在于,所述方法由基于大数据技术的用电监测系统实现,所述系统包括传感部件以及所述处理器,所述方法由所述处理器执行,包括:
基于预设间隔,从所述传感部件中获取瞬时传感数据;
对多个时刻的所述瞬时传感数据构成的传感数据序列进行异常检测,确定异常特征;其中,所述异常检测至少包括:
通过至少一个数据库、至少一个模型中的至少一个,对所述传感数据序列进行所述异常检测以确定所述异常特征,所述模型至少包括机器学习模型,所述数据库和/或所述模型基于大数据预先构建,所述构建方法包括:
获取至少预设数量的实例数据,所述实例数据包括正实例数据和负实例数据中的至少一个;
基于所述实例数据构建所述至少一个数据库、所述至少一个模型中的至少一个;
基于所述异常特征,确定是否发出预警以及是否向用户发送推荐用电方案。
6.根据权利要求5所述的方法,其特征在于,所述传感部件还包括电力数据监测器、温度传感器、声音传感器中至少一种,所述瞬时传感数据包括瞬时电力数据、瞬时温度数据、瞬时声音数据中至少一种,所述异常检测进一步包括:
基于电力数据序列、温度数据序列、声音数据序列中至少一种,确定所述多个时刻的用电特征;
基于所述用电特征和所述瞬时电力数据,通过异常特征确定模型确定异常特征,所述异常特征确定模型为机器学习模型。
7.根据权利要求6所述的方法,其特征在于,所述基于所述电力数据序列以及温度数据序列、声音数据序列中至少一种,确定所述多个时刻的用电特征包括:
基于所述电力数据序列、所述温度数据序列和所述声音数据序列中至少一种,通过用电特征确定模型确定所述多个时刻的用电特征,所述用电特征确定模型为机器学习模型。
8.根据权利要求5所述的方法,其特征在于,所述基于预设间隔,从所述传感部件中获取瞬时传感数据包括:
基于预设间隔,以预设监测精度从所述传感部件中获取瞬时传感数据。
9.一种基于大数据技术的用电监测装置,其特征在于,所述装置包括至少一个处理器以及至少一个存储器;
所述至少一个存储器用于存储计算机指令;
所述至少一个处理器用于执行所述计算机指令中的至少部分指令以实现权利要求5至8中任意一项所述的基于大数据技术的用电监测方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机执行如权利要求5至8中任意一项所述的基于大数据技术的用电监测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310705683.XA CN116738049A (zh) | 2023-06-13 | 2023-06-13 | 基于大数据技术的用电监测系统、方法、装置和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310705683.XA CN116738049A (zh) | 2023-06-13 | 2023-06-13 | 基于大数据技术的用电监测系统、方法、装置和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116738049A true CN116738049A (zh) | 2023-09-12 |
Family
ID=87904057
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310705683.XA Pending CN116738049A (zh) | 2023-06-13 | 2023-06-13 | 基于大数据技术的用电监测系统、方法、装置和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116738049A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101930227A (zh) * | 2010-04-21 | 2010-12-29 | 王荣虎 | 用电设备状态检测与节能控制系统及其控制方法 |
CN110363231A (zh) * | 2019-06-27 | 2019-10-22 | 平安科技(深圳)有限公司 | 基于半监督深度学习的异常识别方法、装置及存储介质 |
CN111833583A (zh) * | 2020-07-14 | 2020-10-27 | 南方电网科学研究院有限责任公司 | 电力数据异常检测模型的训练方法、装置、设备和介质 |
CN112633412A (zh) * | 2021-01-05 | 2021-04-09 | 南方电网深圳数字电网研究院有限公司 | 异常用电检测方法、设备及存储介质 |
CN113284002A (zh) * | 2021-04-09 | 2021-08-20 | 南方电网数字电网研究院有限公司 | 用电数据异常检测方法、装置、计算机设备和存储介质 |
CN113935426A (zh) * | 2021-10-22 | 2022-01-14 | 国网信息通信产业集团有限公司 | 一种电力物联网异常数据流量的检测方法及装置 |
CN115694934A (zh) * | 2022-10-19 | 2023-02-03 | 广东电网有限责任公司广州供电局 | 基于联邦学习的电力数据传输异常检测方法、系统及介质 |
CN115776111A (zh) * | 2022-11-15 | 2023-03-10 | 中国电力科学研究院有限公司 | 工业场景下负荷监测与在线辨识方法、装置、设备及介质 |
-
2023
- 2023-06-13 CN CN202310705683.XA patent/CN116738049A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101930227A (zh) * | 2010-04-21 | 2010-12-29 | 王荣虎 | 用电设备状态检测与节能控制系统及其控制方法 |
CN110363231A (zh) * | 2019-06-27 | 2019-10-22 | 平安科技(深圳)有限公司 | 基于半监督深度学习的异常识别方法、装置及存储介质 |
CN111833583A (zh) * | 2020-07-14 | 2020-10-27 | 南方电网科学研究院有限责任公司 | 电力数据异常检测模型的训练方法、装置、设备和介质 |
CN112633412A (zh) * | 2021-01-05 | 2021-04-09 | 南方电网深圳数字电网研究院有限公司 | 异常用电检测方法、设备及存储介质 |
CN113284002A (zh) * | 2021-04-09 | 2021-08-20 | 南方电网数字电网研究院有限公司 | 用电数据异常检测方法、装置、计算机设备和存储介质 |
CN113935426A (zh) * | 2021-10-22 | 2022-01-14 | 国网信息通信产业集团有限公司 | 一种电力物联网异常数据流量的检测方法及装置 |
CN115694934A (zh) * | 2022-10-19 | 2023-02-03 | 广东电网有限责任公司广州供电局 | 基于联邦学习的电力数据传输异常检测方法、系统及介质 |
CN115776111A (zh) * | 2022-11-15 | 2023-03-10 | 中国电力科学研究院有限公司 | 工业场景下负荷监测与在线辨识方法、装置、设备及介质 |
Non-Patent Citations (1)
Title |
---|
温兵兵: "基于预测模型的电力精准营销框架研究", 华东科技, no. 445, pages 105 - 107 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112699913B (zh) | 一种台区户变关系异常诊断方法及装置 | |
CN109377409A (zh) | 一种基于bp神经网络的用户用电异常行为检测方法 | |
CN115512520B (zh) | 基于智慧燃气的用气安全预警方法及物联网系统 | |
CN111367777B (zh) | 告警处理的方法、装置、设备及计算机可读存储介质 | |
US20230144809A1 (en) | Model operation support system and method | |
CN116066343A (zh) | 一种输油泵机组故障模型的智能预警方法及系统 | |
CN113284002A (zh) | 用电数据异常检测方法、装置、计算机设备和存储介质 | |
CN116258281B (zh) | 基于云平台管理的物联网消防监测及调控系统 | |
CN111126820A (zh) | 反窃电方法及系统 | |
CN113344133A (zh) | 一种时序行为异常波动检测方法及系统 | |
CN113723861A (zh) | 异常用电行为检测方法、装置、计算机设备和存储介质 | |
CN111738348A (zh) | 一种电力数据异常检测方法和装置 | |
CN113705688A (zh) | 一种电力用户异常用电行为检测方法和系统 | |
CN113704389A (zh) | 一种数据评估方法、装置、计算机设备及存储介质 | |
CN115664038A (zh) | 一种用于电气安全管理的智能配电运维监控系统 | |
CN116485020B (zh) | 一种基于大数据的供应链风险识别预警方法、系统及介质 | |
CN117368789A (zh) | 一种基于多源异构数据的电源故障协同定位方法及系统 | |
CN101142559A (zh) | 对计算机控制的处理进行监视 | |
CN116738049A (zh) | 基于大数据技术的用电监测系统、方法、装置和存储介质 | |
CN116714469A (zh) | 充电桩健康监测方法、装置、终端及存储介质 | |
CN113591396A (zh) | 一种基于朴素贝叶斯网络的电网元器件故障诊断方法 | |
CN116956089A (zh) | 电器设备温度异常检测模型训练方法以及检测方法 | |
CN114240102A (zh) | 一种线损异常数据识别方法、装置、电子设备及存储介质 | |
CN114936600A (zh) | 单证异常监控方法、装置、设备及存储介质 | |
JP7458183B2 (ja) | エネルギー需要変動パターンの分類方法及びシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |