CN113657475A - 基于分类的用电量预测方法 - Google Patents
基于分类的用电量预测方法 Download PDFInfo
- Publication number
- CN113657475A CN113657475A CN202110906355.7A CN202110906355A CN113657475A CN 113657475 A CN113657475 A CN 113657475A CN 202110906355 A CN202110906355 A CN 202110906355A CN 113657475 A CN113657475 A CN 113657475A
- Authority
- CN
- China
- Prior art keywords
- data
- class
- training
- classification
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000012549 training Methods 0.000 claims abstract description 34
- 238000007781 pre-processing Methods 0.000 claims abstract description 15
- 230000002159 abnormal effect Effects 0.000 claims abstract description 9
- 238000012805 post-processing Methods 0.000 claims abstract description 8
- 230000005611 electricity Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 2
- 238000011161 development Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Human Resources & Organizations (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Evolutionary Biology (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Primary Health Care (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于分类的用电量预测方法,用于复杂环境下用电量预测,特别是在某些具有多种模式环境下的用电量预测。一种基于分类的用电量预测方法,包括以下步骤:收集训练数据;对训练数据进行数据预处理,并构造数据预处理管道,用于推理时数据预处理;构造训练集数据;对训练集数据进行聚类,并获取每类的类中心的特征数据;LSTM模型训练:针对每类数据,训练一个LSTM模型;推理数据分类:将推理时系统获取的时序数据进行分类,分到上述S4获取的某一类中,或者作为异常数据;推理数据预测:基于S6的分类结果,选择所属类的LSTM模型,进行模型预测;预测结果后处理:基于特定场景,进行特定的预测结果后处理。
Description
技术领域
本发明涉及一种用电量预测,具体涉及一种基于分类的用电量预测方法,属于人工智能技术领域。
背景技术
随着新能源行业的快速发展,企业需要精准高效获取用电量需求以及用电负荷变化信息,智能电表可以提供有用的数据,方便理解用户类型以及监测用电量变化,这些数据可以为预测用电量需求提供支撑。另外,随着新能源电动汽车的发展,监测用电负荷有利于对于电池能源的高效管理,监测的用电负荷数据可以用来预测将来的用电负荷,为电池管理等决策提供支撑。由于新能源行业的发展,用电场景也在不断扩展,这给用电量预测带来了一些困难。比如,普通家庭用电和工业用电模式的不同,电动汽车在不同车况下用电负荷的不同。如果采用一个模型来预测不同场景下(如家庭用电和工业用电场景),或者同一场景下不同条件下(如电动汽车在不同车况条件)的用电量,会导致模型的准确性和可靠性降低。
发明内容
本发明目的是提供了一种基于分类的用电量预测方法,用于复杂环境下用电量预测,特别是在某些具有多种模式环境下的用电量预测。
本发明为实现上述目的,通过以下技术方案实现:
一种基于分类的用电量预测方法,包括以下步骤:
S1.收集训练数据;
S2. 对训练数据进行数据预处理, 并构造数据预处理管道,用于推理时数据预处理;
S3.构造训练集数据;
S4.对训练集数据进行聚类,并获取每类的类中心的特征数据;
S5.LSTM模型训练:针对每类数据,训练一个LSTM模型;
S6.推理数据分类:将推理时系统获取的时序数据进行分类,分到上述S4获取的某一类中,或者作为异常数据;
S7.推理数据预测:基于S6的分类结果,选择所属类的LSTM模型,进行模型预测;
S8.预测结果后处理:基于特定场景,进行特定的预测结果后处理。
所述基于分类的用电量预测方法优选方案,构造训练集数据具体过程如下:选择合适的满足预测要求的时间长度T,按照设定的T对训练数据进行切分,使得每条数据长度为T,最后一个时刻的数据为要预测的数据,前面T-1时刻数据是模型输入数据,每条数据构成训练集的一条样本数据。
所述基于分类的用电量预测方法优选方案,使用Snob聚类算法对训练集数据进行聚类,Snob聚类算法使用最小消息长度标准来估计混合模型的结构,并且可以不指定类别数量,自动尝试发现类别数量,并获取每类的类中心的特征数据。
所述基于分类的用电量预测方法优选方案,推理时,对获取的时序数据自动进行数据预处理,利用欧氏距离方法计算时序数据和所有类的类中心特征数据的距离,选择距离最近的类,如果与最近的类的距离小于设定阈值,则将时序数据分到该类,否则,作为异常数据,超出了模型预测范畴。
本发明的优点在于:
本发明首先将数据聚类,确定不同的模式对应的类别,然后对每一个类别,训练一个用电量预测LSTM模型。当获取到新的数据后,将数据分到前面获取的某一类中,然后运行该类对应的预测模型,用于用电量预测。如果新的数据不能分类到任何一类中,作为异常数据处理,如果异常数据较多,则考虑重新聚类,及时更新聚类的类别。这种方式可以有效提高模型预测的准确性和可靠性。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
图1为本发明实施例的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种基于分类的用电量预测方法,包括以下步骤:
S1.收集训练数据,包括各种环境下的用电量数据,以及影响用电量相关因素数据,尽量做到数据多样性;
S2.对训练数据进行数据预处理,包括数据规范化以及异常值、缺失值处理等,并构造数据预处理管道,用于推理时数据预处理;
S3.构造训练集数据,选择合适的满足预测要求的时间长度T,按照设定的T对训练数据进行切分,使得每条数据长度为T,最后一个时刻的数据为要预测的数据,前面T-1时刻数据是模型输入数据,每条数据构成训练集的一条样本数据;
S4.使用Snob聚类算法对训练集数据进行聚类,Snob聚类算法使用最小消息长度标准来估计混合模型的结构,并且可以不指定类别数量,自动尝试发现类别数量,并获取每类的类中心的特征数据;
S5.RNN模型训练,针对每类数据,训练一个RNN模型,这里我们选择使用LSTM模型;
S6.推理数据分类,推理时,对获取的时序数据自动进行数据预处理,利用欧氏距离方法计算时序数据和所有类的类中心特征数据的距离,选择距离最近的类,如果与最近的类的距离小于设定阈值,则将时序数据分到该类,否则,作为异常数据,超出了模型预测范畴;
S7.推理数据预测,推理时,如果找到了最近的类,选择对应类的LSTM模型,进行预测;
S8.预测结果后处理,基于特定场景,进行特定的预测结果后处理。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.一种基于分类的用电量预测方法,其特征在于:包括以下步骤:
S1.收集训练数据;
S2. 对训练数据进行数据预处理, 并构造数据预处理管道,用于推理时数据预处理;
S3.构造训练集数据;
S4.对训练集数据进行聚类,并获取每类的类中心的特征数据;
S5.LSTM模型训练:针对每类数据,训练一个LSTM模型;
S6.推理数据分类:将推理时系统获取的时序数据进行分类,分到上述S4获取的某一类中,或者作为异常数据;
S7.推理数据预测:基于S6的分类结果,选择所属类的LSTM模型,进行模型预测;
S8.预测结果后处理:基于特定场景,进行特定的预测结果后处理。
2.根据权利要求1所述基于分类的用电量预测方法,其特征在于:构造训练集数据具体过程如下:选择合适的满足预测要求的时间长度T,按照设定的T对训练数据进行切分,使得每条数据长度为T,最后一个时刻的数据为要预测的数据,前面T-1时刻数据是模型输入数据,每条数据构成训练集的一条样本数据。
3.根据权利要求1所述基于分类的用电量预测方法,其特征在于:使用Snob聚类算法对训练集数据进行聚类,Snob聚类算法使用最小消息长度标准来估计混合模型的结构,并且可以不指定类别数量,自动尝试发现类别数量,并获取每类的类中心的特征数据。
4.根据权利要求1所述基于分类的用电量预测方法,其特征在于:推理时,对获取的时序数据自动进行数据预处理,利用欧氏距离方法计算时序数据和所有类的类中心特征数据的距离,选择距离最近的类,如果与最近的类的距离小于设定阈值,则将时序数据分到该类,否则,作为异常数据,超出了模型预测范畴。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110906355.7A CN113657475A (zh) | 2021-08-09 | 2021-08-09 | 基于分类的用电量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110906355.7A CN113657475A (zh) | 2021-08-09 | 2021-08-09 | 基于分类的用电量预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113657475A true CN113657475A (zh) | 2021-11-16 |
Family
ID=78490466
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110906355.7A Withdrawn CN113657475A (zh) | 2021-08-09 | 2021-08-09 | 基于分类的用电量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113657475A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114254765A (zh) * | 2022-03-01 | 2022-03-29 | 之江实验室 | 一种面向模拟推演的主动式序列决策方法、装置和介质 |
-
2021
- 2021-08-09 CN CN202110906355.7A patent/CN113657475A/zh not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114254765A (zh) * | 2022-03-01 | 2022-03-29 | 之江实验室 | 一种面向模拟推演的主动式序列决策方法、装置和介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10877863B2 (en) | Automatic prediction system for server failure and method of automatically predicting server failure | |
Zhang et al. | An improved association rule mining-based method for revealing operational problems of building heating, ventilation and air conditioning (HVAC) systems | |
CN116562740B (zh) | 一种基于改进型深度学习算法模型的外贸物流平台 | |
CN110543500A (zh) | 一种基于大数据的输变电设备健康评估平台 | |
US20220414526A1 (en) | Intelligent fault detection system | |
CN113139570A (zh) | 一种基于最优混合估值的大坝安全监测数据补全方法 | |
CN117713221A (zh) | 一种微逆光伏并网优化系统 | |
CN113657475A (zh) | 基于分类的用电量预测方法 | |
Li et al. | A Novel Method for Lithium‐Ion Battery Fault Diagnosis of Electric Vehicle Based on Real‐Time Voltage | |
CN111126449A (zh) | 一种基于聚类分析的电池故障分类诊断方法 | |
CN113569955A (zh) | 一种模型训练方法、用户画像生成方法、装置及设备 | |
Mostafavi et al. | An unsupervised approach in learning load patterns for non-intrusive load monitoring | |
CN110579708B (zh) | 电池容量识别方法、装置、计算设备及计算机存储介质 | |
CN117294019A (zh) | 一种基于物联网的绿色建筑能耗监测方法及系统 | |
Li et al. | Optimizing combination of aircraft maintenance tasks by adaptive genetic algorithm based on cluster search | |
CN116881752A (zh) | 数据的聚类方法和装置、存储介质及电子设备 | |
CN116304835A (zh) | 基于ai的动设备工况监测管理方法、系统、设备及介质 | |
CN111060755A (zh) | 一种电磁干扰诊断方法和装置 | |
CN113191569A (zh) | 一种基于大数据的企业管理方法及系统 | |
El Mabrouk et al. | Proposed Intelligent Pre-Processing Model of Real-Time Flood Forecasting and Warning for Data Classification and Aggregation. | |
CN113326296B (zh) | 一种适用于工商业用户的负荷分解的方法及系统 | |
CN116934126B (zh) | 一种智慧园区应急处理系统智能规划方法、系统及存储介质 | |
Yan et al. | Prediction model of sleep membership in drugstores based on immune danger theory | |
Ho et al. | Anomaly Detection Model of Time Segment Power Usage Behavior Using Unsupervised Learning | |
CN115130784A (zh) | 基于大数据分析的用电行为预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20211116 |