CN112036668B - 用水量预测方法、装置、电子设备以及计算机可读介质 - Google Patents

用水量预测方法、装置、电子设备以及计算机可读介质 Download PDF

Info

Publication number
CN112036668B
CN112036668B CN202011064102.1A CN202011064102A CN112036668B CN 112036668 B CN112036668 B CN 112036668B CN 202011064102 A CN202011064102 A CN 202011064102A CN 112036668 B CN112036668 B CN 112036668B
Authority
CN
China
Prior art keywords
water consumption
data set
historical
prediction model
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011064102.1A
Other languages
English (en)
Other versions
CN112036668A (zh
Inventor
许铭
解鑫
齐月震
刘颖
李瑞锋
白璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202011064102.1A priority Critical patent/CN112036668B/zh
Publication of CN112036668A publication Critical patent/CN112036668A/zh
Application granted granted Critical
Publication of CN112036668B publication Critical patent/CN112036668B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Human Resources & Organizations (AREA)
  • Biophysics (AREA)
  • Strategic Management (AREA)
  • Computational Linguistics (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • Public Health (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Medical Informatics (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种用水量预测方法和装置,涉及深度学习等人工智能技术领域。该方法的一具体实施方式包括:获取预设历史时间段中的历史数据集,其中,历史数据集包括:预设时间段中的节假日数据、工作日数据、温度、湿度、风向、风力、降水量、历史用水量;对历史数据集进行特征构建,以提取时间特征序列、天气特征序列以及历史用水量特征序列;基于构建完成的历史数据集,得到训练数据集和测试数据集;基于训练数据集,对构建的用水量预测模型进行训练,得到训练完成的用水量预测模型;采用测试数据集对训练完成的用水量预测模型进行预测,得到训练完成的用水量预测模型输出的未来时间段中的用水量。该实施方式提升了用水量预测的准确度。

Description

用水量预测方法、装置、电子设备以及计算机可读介质
技术领域
本申请涉及数据处理技术领域,具体涉及深度学习技术领域,尤其涉及一种用水量预测方法、装置、电子设备以及计算机可读介质。
背景技术
水务集团的日常生活中的用水量预测一般使用网络模型,例如ARIMA(Autoregressive Integrated Moving Average Model,自回归移动平均模型)、RNN(Recurrent Neural Network,循环神经网络)等进行用水销售量预测,该网络模型输入的特征包括内部特征和外部特征,内部特征包括门店位置,经纬度等,外部特征包括促销量等,对用户的实际用水量预测准确率不高。
发明内容
提供了一种用水量预测方法、装置、电子设备以及计算机可读介质。
根据第一方面,提供了一种用水量预测方法,上述方法包括:获取预设历史时间段中的历史数据集,其中,历史数据集包括:预设时间段中的节假日数据、工作日数据、温度、湿度、风向、风力、降水量、历史用水量;对历史数据集进行特征构建,以提取时间特征序列、天气特征序列以及历史用水量特征序列;基于构建完成的历史数据集,得到训练数据集和测试数据集;基于训练数据集,对构建的用水量预测模型进行训练,得到训练完成的用水量预测模型;采用测试数据集对训练完成的用水量预测模型进行预测,得到训练完成的用水量预测模型输出的未来时间段中的用水量。
根据第二方面,提供了一种用水量预测装置,该装置包括:获取单元,被配置成获取预设历史时间段中的历史数据集,其中,历史数据集包括:预设时间段中的节假日数据、工作日数据、温度、湿度、风向、风力、降水量、历史用水量;构建单元,被配置成对历史数据集进行特征构建,以提取时间特征序列、天气特征序列以及历史用水量特征序列;得到单元,被配置成基于构建完成的历史数据集,得到训练数据集和测试数据集;训练单元,被配置成基于训练数据集,对构建的用水量预测模型进行训练,得到训练完成的用水量预测模型;预测单元,被配置成采用测试数据集对训练完成的用水量预测模型进行预测,得到训练完成的用水量预测模型输出的未来时间段中的用水量。
根据第三方面,提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器,其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面任一实现方式描述的方法。
根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面任一实现方式描述的方法。
本申请的实施例提供的用水量预测方法和装置,首先获取预设历史时间段中的历史数据集;其次,对历史数据集进行特征构建,以提取时间特征序列、天气特征序列以及历史用水量特征序列;然后,基于构建完成的历史数据集,得到训练数据集和测试数据集;再后,基于训练数据集,对构建的用水量预测模型进行训练,得到训练完成的用水量预测模型;最后,采用测试数据集对训练完成的用水量预测模型进行预测,得到训练完成的用水量预测模型输出的未来时间段中的用水量,由此,基于成序列设置的时间特征、天气特征以及历史用户量训练用水量预测模型,涵盖历史多个时间点的不同的特征,为未来时间段中的用水量预测提供了可靠的基础,提升了用水量预测的准确度。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请用水量预测方法的一个实施例的流程图;
图2是根据本申请用水量预测方法的另一个实施例的流程图;
图3是本申请采用长短期记忆网络构建的用水量预测模型的示意图;
图4是根据本申请用水量预测方法的第三个实施例的流程图;
图5是根据本申请用水量预测装置的实施例的结构示意图;
图6是用来实现本申请实施例的用水量预测方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1示出了根据本申请用水量预测方法的一个实施例的流程100。上述用水量预测方法包括以下步骤:
步骤101,获取预设历史时间段中的历史数据集。
其中,历史数据集包括:预设时间段中的节假日数据、工作日数据、温度、湿度、风向、风力、降水量、历史用水量。
本实施例中,用水量预测方法的执行主体可以通过从内存或者从用户终端设备实时获取等方式得到历史数据集,而预设历史时间段是相对于当前时间过去的一段时间,比如,当前时间为2020年9月21日,预设历史时间段为2019年1月1日至2020年8月31日。该预设历史时间段可以是用户预设的时间段,也可以是执行主体预存的时间段。
本实施例中,节假日数据是指是预设历史时间段中节假日时间,比如,周日的24小时。工作日数据是指是预设历史时间段中工作日时间,比如,周三工作日的24小时。本实施例中,可以从国家水务局网站上获取预设历史时间段中不同地区的降水量以及用水量,还可以在天气网站爬取预设历史时间段中的温度、湿度、风向、风力。
步骤102,对历史数据集进行特征构建,以提取时间特征序列、天气特征序列以及历史用水量特征序列。
本实施例中,在对历史数据集进行特征构建之前,可以先对历史数据集进行预处理,预处理包括:异常值处理、缺失值处理和重复值处理。其中,异常值处理是指历史数据集中各种类数据均预设有数据范围,在各数据超出其所在种类的数据范围之后,直接删除。缺失值处理是指在预设历史时间段中核对不同时刻的各种数据的值,当预设时刻的数据的值有缺失,则以某个默认的值(比如,0)填充。重复值处理是指在预设历史时间段中核对不同时刻的各种数据的值,当某一时刻的数据的值有重复,则直接删除。
本实施例中,构建时间特征序列,统计历史数据集所有节假日数据、工作日数据,对节假日数据和工作日数据按照实际的时间顺序进行排序以及模型数据处理(按将输入的模型的数据要求进行处理,比如浮点数)得到时间特征序列。
构建天气特征序列,统计历史数据集所有温度、湿度、风向、风力、降水量,对各个温度、各个湿度、各个风向、各个风力、各个降水量按照实际的时间顺序进行排序以及模型数据处理(按将输入的模型的数据要求进行处理)得到天气特征序列。
构建历史用水量特征序列,统计历史数据集所有历史用水量,对历史用水量按照实际的时间顺序进行排序以及模型数据处理(按将输入的模型的数据要求进行处理)得到历史用水量特征序列。
需要说明的是,时间特征序列、天气特征序列以及历史用水量特征序列三者参照的实际的时间顺序的相同且特征序列中的特征一一对应,比如,2019年2月5、6、7、8四个月的特征。
步骤103,基于构建完成的历史数据集,得到训练数据集和测试数据集。
本实施例中,针对构建完成的历史数据集,可以选取前70%预设历史时间段中的历史数据集中的数据作为建模的训练样本,选取后30%预设历史时间段中的历史数据集中的数据作为建模的测试样本。比如,预设时间为2019年1月1日至2019年12月31日,则选取2019年1月1日至2019年7月1日中的构建完成的历史数据集中的特征序列作为训练样本,选取2019年7月2日至2019年12月31日中的构建完成的历史数据集中的特征序列作为测试样本。
本实施例中,得到训练数据集的过程如下:
1)确定训练样本,各个训练样本包括天气特征序列、时间特征序列、历史用水量特征序列,如上,可以选取后30%预设历史时间段中的历史数据集中的数据作为建模的训练样本。
2)对各个训练样本进行标注,构建训练数据集,比如,在2019年1月21-28日的训练样本包括天气特征序列、时间特征序列、历史用水量特征序列三种数据,针对这三种数据的标注未来七天(2019年1月29日-2月4日)的预设的用水量。
步骤104,基于训练数据集,对构建的用水量预测模型进行训练,得到训练完成的用水量预测模型。
本实施例中,构建的用水量预测模型为基于时间序列的模型,比如,ARIMA、RNN、LSTM等模型结构。
本实施例中,构建的用水量预测模型练过程可以如下:
采用诸如上述(ARIMA、RNN、LSTM等)模型结构构建用水量预测模型。然后利用构建的训练数据集对用水量预测模型进行训练。在训练过程中,可以根据用水量预测模型对训练数据集中各个样本的用水量的检测结果与标注的未来的预设的用水量之间的差异确定构建的用水量预测模型的误差,利用误差反向传播的方式迭代调整构建的用水量预测模型的参数,使其误差逐步缩小。在构建的用水量预测模型的误差收敛至一定的范围内或迭代的次数达到预设的次数阈值时可以停止调整参数,得到训练完成的用水量预测模型。
步骤105,采用测试数据集对训练完成的用水量预测模型进行预测,得到训练完成的用水量预测模型输出的未来时间段中的用水量。
本实施例中,基于上述确定的测试样本,将测试样本输入训练完成的用水量预测模型,得到由训练完成的用水量预测模型输出的与测试样本对应的未来时间段中的用水量,从而达到采用训练完成的用水量预测模型预测用水量的目的。
本申请的实施例提供的用水量预测方法,首先获取预设历史时间段中的历史数据集;其次,对历史数据集进行特征构建,以提取时间特征序列、天气特征序列以及历史用水量特征序列;然后,基于构建完成的历史数据集,得到训练数据集和测试数据集;再后,基于训练数据集,对构建的用水量预测模型进行训练,得到训练完成的用水量预测模型;最后,采用测试数据集对训练完成的用水量预测模型进行预测,得到训练完成的用水量预测模型输出的未来时间段中的用水量,由此,基于成序列设置的时间特征、天气特征以及历史用户量训练用水量预测模型,涵盖历史多个时间点的不同的特征,为未来时间段中的用水量预测提供了可靠的基础,提升了用水量预测的准确度。
用户用水量具有周期性,用水量的数据也是周期性数据,基于用水量明显的周期性和季节性,本申请提供了采用用水量的周期性数据预测未来时间段中的用水量的一个实施例。如图2,示出了根据本申请用水量预测方法的另一个实施例的流程200。上述用水量预测方法包括以下步骤:
步骤201,获取预设历史时间段中的历史数据集。
其中,历史数据集包括:预设时间段中的节假日数据、工作日数据、温度、湿度、风向、风力、降水量、历史用水量。
步骤202,对预设时间段中的节假日数据、工作日数据以及历史用水量进行周期性分解,得到周期数据。
本实施例中,针对用水量的数据的周期性和季节性,每天的早高峰和晚高峰时用水量增加,凌晨时用水较低,对于一周七天用水量也存在明显的周期性,比如,表1所示的工作日的用水量周期数据中,凌晨4点的用水量数据的值是-1.2,早上十点的用水量数据的值是0.9。
表1
时间(时分秒) 峰值
04:00:00 -1.2
10:00:00 0.9
21:00:00 0.8
因此,对历史时间段中的历史用水量数据进行周期性分解,可以发掘周期特征。
步骤203,将周期数据添加入历史数据集。
本实施例中,将周期数据添加入历史数据集,以便于后续用水量模型训练时可以对各个历史用水量的周期进行分析,得到用水量预测模型的预测时的周期特征,针对具有时序的用水量预测模型提取不同时刻的周期性特征序列。
步骤204,对历史数据集进行特征构建,以提取时间特征序列、天气特征序列、周期性特征序列以及历史用水量特征序列。
步骤205,基于构建完成的历史数据集,得到训练数据集和测试数据集。
步骤206,基于训练数据集,对构建的用水量预测模型进行训练,得到训练完成的用水量预测模型。
本实施例中,构建的用水量预测模型可以采用长短期记忆网络,构建的用水量预测模型包括:依次连接的编码器和解码器,训练数据集输入编码器的输入端,编码器的输出端与解码器的输入端连接。
本可选实现方式中,LSTM(长短期记忆网络,LongShort-Term Memory),是一种时间递归神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。LSTM还是一种特殊的循环神经网络。采用多个LSTM层(例如3个以上)可以组成编码器、采用一个LSTM层可以组成解码器,具体地参见图3所示。
在本实施例的一些可选实现方式中,还包括:对预设时间段中的节假日数据、工作日数据以及历史用水量进行周期性分解,得到周期数据;将周期数据输入到构建的用水量预测模型的解码器的输入端。
本可选实现方式中,对预设时间段中的节假日数据、工作日数据以及历史用水量进行周期性分解,得到周期数据,将周期数据输入到构建的用水量预测模型的解码器的输入端,可以参考未来时间段中的周期性,进一步增加了未来时间段中的用水量预测的可靠性,提升了用水量预测的准确性。
步骤207,采用测试数据集对训练完成的用水量预测模型进行预测,得到训练完成的用水量预测模型输出的未来时间段中的用水量。
应当理解,上述步骤201、步骤204-步骤207中的操作和特征,分别与步骤101-步骤105中的操作和特征相对应,除了因增加的周期性特征,对构建的用水量预测模型进行训练时训练参数有改变之外,上述在步骤101-步骤105中对于操作和特征的描述,同样适用于步骤201、步骤204-步骤207,在此不再赘述。
本申请的实施例提供的用水量预测方法,对预设时间段中的节假日数据、工作日数据以及历史用水量进行周期性分解,得到周期数据,将周期数据添加入历史数据集,以提取周期性特征序列,从而在训练构建的用水量预测模型时,可以参考历史用水量的周期性特征,进一步增加了未来时间段中的用水量预测的可靠性,提升了用水量预测的准确性。
针对历史用水量的时序特征,可以采用多种时序模型构建用水量预测模型,例如,RNN模型,LSTM(Long Short-Term Memory,长短期记忆网络),在采用LSTM构建用水量预测模型,且对构建的用水量预测模型进行训练时,可以在构建的用水量预测模型中增加入未来时间段中的用水量的特征。
本实施例中,如图3所示,构建的用水量预测模型包括:依次连接的编码器和解码器,训练数据集输入编码器的输入端,编码器的输出端与解码器的输入端连接。
在图3中,两个“+”号左半部分为编码器,其中,编码器的上下两个LSTM层(LSTMint、LSTMsyn)分别用于对时间特征序列
Figure BDA0002713236640000081
Figure BDA0002713236640000082
天气特征序列
Figure BDA0002713236640000083
进行编码,之后通过一个LSTMsyn层,将两部分的隐藏层输出和历史用水量特征序列(图中未示出)进行合并,合并为联合特征后,还可以再经过一个LSTM网络(图中未示出),得到联合特征的隐藏层输出。
两个“+”号左半部分为编码器右半部分为解码器,编码器的输出量
Figure BDA0002713236640000084
输入由一个LSTMdec层,得到由LSTMdec层输出的未来时间段的用水量/>
Figure BDA0002713236640000085
基于图3所示构建的用水量预测模型,参见图4,还示出了根据本申请用水量预测方法的第三个实施例的流程400。上述用水量预测方法包括以下步骤:
步骤401,获取预设历史时间段中的历史数据集。
其中,历史数据集包括:预设时间段中的节假日数据、工作日数据、温度、湿度、风向、风力、降水量、历史用水量。
在本实施例的一些可选实现方式中,可以对预设时间段中的节假日数据、工作日数据以及历史用水量进行周期性分解,得到周期性数据;将周期性数据添加入历史数据集,以提取周期性特征序列,从而在训练构建的用水量预测模型时,可以参考历史用水量的周期性特征,进一步增加了未来时间段中的用水量预测的可靠性,提升了用水量预测的准确性。
本可选实现方式中,基于历史用水量的周期性特征,对预设时间段中的节假日数据、工作日数据以及历史用水量进行周期性分解,已在历史集进行特征构建时,提取周期性特征序列,通过具有周期性
步骤402,对历史数据集进行特征构建,以提取时间特征序列、天气特征序列以及历史用水量特征序列。
步骤403,基于构建完成的历史数据集,得到训练数据集和测试数据集。
步骤404,获取未来时间段中的节假日数据和工作日数据。
本实施例中,未来时间段中是指训练完成的用水量预测模型可以预测输出的时间段,未来时间段是有预设历史时间段预测得到的,其可以与预设时间段时长相同,也可以不同。进一步地,未来时间段中的节假日数据和工作日数据可以根据电子日历查找得到。
在本实施例的一些可选实现方式中,还包括:获取未来时间段中的温度、湿度、风向、风力、降水量;将未来时间段中的温度、湿度、风向、风力、降水量输入到构建的用水量预测模型的解码器的输入端。
本可选实现方式中,获取未来时间段中的温度、湿度、风向、风力、降水量,将未来时间段中的温度、湿度、风向、风力、降水量输入到构建的用水量预测模型的解码器的输入端,从而在训练构建的用水量预测模型时,可以参考未来时间段中的温度、湿度、风向、风力,进一步增加了未来时间段中的用水量预测的可靠性,提升了用水量预测的准确性。
步骤405,将未来时间段中的节假日数据和工作日数据输入构建的用水量预测模型的解码器的输入端。
本实施例,参见图3所示,在解码器的输入端时加入了未来时间段中不同时刻的z变量(zT+1…zt…zT+Δ),该z变量为未来时间段中的节假日数据和工作日数据。
步骤406,基于训练数据集,对构建的用水量预测模型进行训练,得到训练完成的用水量预测模型。
步骤407,采用测试数据集对训练完成的用水量预测模型进行预测,得到训练完成的用水量预测模型输出的未来时间段中的用水量。
应当理解,上述步骤401-403、步骤406-步骤407中的操作和特征,分别与步骤101-步骤105中的操作和特征相对应,除了因增加的未来时间段中的节假日数据和工作日数据,对构建的用水量预测模型进行训练时训练参数有改变之外,上述在步骤101-步骤105中对于操作和特征的描述,同样适用于步骤401-403、步骤406-步骤407,在此不再赘述。
本实施例提供的用水量预测方法,获取未来时间段中的节假日数据和工作日数据,将未来时间段中的节假日数据和工作日数据输入到构建的用水量预测模型的解码器的输入端,从而在训练构建的用水量预测模型时,可以参考未来时间段中的节假日和工作日,进一步增加了未来时间段中的用水量预测的可靠性,提升了用水量预测的准确性。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了用水量预测装置的一个实施例,该装置实施例与图1所示的方法实施例相对应,该装置具体可应用于各种电子设备中。
如图5所示,本实施例提供的用水量预测装置500包括:获取单元501,构建单元502,得到单元503,训练单元504,预测单元505。其中,上述获取单元501,可以被配置成获取预设历史时间段中的历史数据集,其中,历史数据集包括:预设时间段中的节假日数据、工作日数据、温度、湿度、风向、风力、降水量、历史用水量。上述构建单元502,可以被配置成对历史数据集进行特征构建,以提取时间特征序列、天气特征序列以及历史用水量特征序列。上述得到单元503,可以被配置成基于构建完成的历史数据集,得到训练数据集和测试数据集。上述训练单元504,可以被配置成基于训练数据集,对构建的用水量预测模型进行训练,得到训练完成的用水量预测模型。上述预测单元505,可以被配置成采用测试数据集对训练完成的用水量预测模型进行预测,得到训练完成的用水量预测模型输出的未来时间段中的用水量。
在本实施例中,用水量预测装置500中:获取单元501,构建单元502,得到单元503,训练单元504,预测单元505的具体处理及其所带来的技术效果可分别参考图1对应实施例中的步骤101、步骤102、步骤103、步骤104、步骤105的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,上述用水量预测装置500还包括:分解单元(图中未示出),添加单元(图中未示出)。其中,上述分解单元,可以被配置成对预设时间段中的节假日数据、工作日数据以及历史用水量进行周期性分解,得到周期数据。上述添加单元,可以被配置成将周期数据添加入历史数据集,以在历史数据集进行特征构建时提取周期性特征序列。
在本实施例的一些可选的实现方式中,上述构建的用水量预测模型采用长短期记忆网络,上述构建的用水量预测模型包括:依次连接的编码器和解码器,训练数据集输入编码器的输入端,编码器的输出端与解码器的输入端连接;上述用水量预测装置500还包括:周期输入单元(图中未示出)。上述周期输入单元,被配置成将周期数据输入到构建的用水量预测模型的解码器的输入端。
在本实施例的一些可选的实现方式中,上述构建的用水量预测模型采用长短期记忆网络,构建的用水量预测模型包括:依次连接的编码器和解码器,训练数据集输入编码器的输入端,编码器的输出端与解码器的输入端连接;上述用水量预测装置500还包括:计时单元(图中未示出),时间输入单元(图中未示出)。其中,上述计时单元,可以被配置成获取未来时间段中的节假日数据和工作日数据。上述时间输入单元,可以被配置成将未来时间段中的节假日数据和工作日数据输入到构建的用水量预测模型的解码器的输入端。
在本实施例的一些可选的实现方式中,上述用水量预测装置500还包括:预报单元(图中未示出),天气输入单元(图中未示出)。其中,上述预报单元,可以被被配置成获取未来时间段中的温度、湿度、风向、风力、降水量。上述天气输入单元,可以被被配置成将未来时间段中的温度、湿度、风向、风力、降水量输入到构建的用水量预测模型的解码器的输入端。
本申请的实施例提供的用水量预测装置,首先获取单元501获取预设历史时间段中的历史数据集;其次,构建单元502对历史数据集进行特征构建,以提取时间特征序列、天气特征序列以及历史用水量特征序列;然后,得到单元503基于构建完成的历史数据集,得到训练数据集和测试数据集;再后,训练单元504基于训练数据集,对构建的用水量预测模型进行训练,得到训练完成的用水量预测模型;最后,预测单元505采用测试数据集对训练完成的用水量预测模型进行预测,得到训练完成的用水量预测模型输出的未来时间段中的用水量,由此,基于成序列设置的时间特征、天气特征以及历史用户量训练用水量预测模型,涵盖历史多个时间点的不同的特征,为未来时间段中的用水量预测提供了可靠的基础,提升了用水量预测的准确度。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图6所示,是根据本申请实施例的用水量预测方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图6所示,该电子设备包括:一个或多个处理器601、存储器602,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图6中以一个处理器601为例。
存储器602即为本申请所提供的非瞬时计算机可读存储介质。其中,存储器存储有可由至少一个处理器执行的指令,以使至少一个处理器执行本申请所提供的用水量预测方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的用水量预测方法。
存储器602作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的用水量预测方法对应的程序指令/模块(例如,附图5所示的获取单元501、构建单元502、得到单元503、训练单元504和预测单元505)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的用水量预测方法。
存储器602可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据用水量预测方法的电子设备的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器602可选包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至用水量预测方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
用水量预测方法的电子设备还可以包括:输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线605或者其他方式连接,图6中以通过总线605连接为例。
输入装置603可接收输入的数字或字符信息,以及产生与用水量预测方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与虚拟专用服务器(VPS,Virtual Private Server)服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (8)

1.一种用水量预测方法,包括:
获取预设历史时间段中的历史数据集,其中,所述历史数据集包括:预设时间段中的节假日数据、工作日数据、温度、湿度、风向、风力、降水量、历史用水量;
对所述历史数据集进行特征构建,以提取时间特征序列、天气特征序列以及历史用水量特征序列;
基于构建完成的历史数据集,得到训练数据集和测试数据集;
基于所述训练数据集,对构建的用水量预测模型进行训练,得到训练完成的用水量预测模型;
采用所述测试数据集对所述训练完成的用水量预测模型进行预测,得到所述训练完成的用水量预测模型输出的未来时间段中的用水量;对所述预设时间段中的节假日数据、工作日数据以及历史用水量进行周期性分解,得到周期数据;
将所述周期数据添加入所述历史数据集,以在所述历史数据集进行特征构建时提取周期性特征序列;所述构建的用水量预测模型采用长短期记忆网络,所述构建的用水量预测模型包括:依次连接的编码器和解码器,所述训练数据集输入所述编码器的输入端,所述编码器的输出端与所述解码器的输入端连接;
所述方法还包括:
将所述周期数据输入到所述构建的用水量预测模型的解码器的输入端。
2.根据权利要求1所述的方法,其中,所述构建的用水量预测模型采用长短期记忆网络,所述构建的用水量预测模型包括:依次连接的编码器和解码器,所述训练数据集输入所述编码器的输入端,所述编码器的输出端与所述解码器的输入端连接;
所述方法还包括:
获取所述未来时间段中的节假日数据和工作日数据;
将所述未来时间段中的节假日数据和工作日数据输入到所述构建的用水量预测模型的解码器的输入端。
3.根据权利要求2所述的方法,还包括:
获取所述未来时间段中的温度、湿度、风向、风力、降水量;
将所述未来时间段中的温度、湿度、风向、风力、降水量输入到所述构建的用水量预测模型的解码器的输入端。
4.一种用水量预测装置,包括:
获取单元,被配置成获取预设历史时间段中的历史数据集,其中,所述历史数据集包括:预设时间段中的节假日数据、工作日数据、温度、湿度、风向、风力、降水量、历史用水量;
构建单元,被配置成对所述历史数据集进行特征构建,以提取时间特征序列、天气特征序列以及历史用水量特征序列;
得到单元,被配置成基于构建完成的历史数据集,得到训练数据集和测试数据集;
训练单元,被配置成基于所述训练数据集,对构建的用水量预测模型进行训练,得到训练完成的用水量预测模型;
预测单元,被配置成采用所述测试数据集对所述训练完成的用水量预测模型进行预测,得到所述训练完成的用水量预测模型输出的未来时间段中的用水量;分解单元,被配置成对所述预设时间段中的节假日数据、工作日数据以及历史用水量进行周期性分解,得到周期数据;
添加单元,还被配置成将所述周期数据添加入所述历史数据集,以在所述历史数据集进行特征构建时提取周期性特征序列;所述构建的用水量预测模型采用长短期记忆网络,所述构建的用水量预测模型包括:依次连接的编码器和解码器,所述训练数据集输入所述编码器的输入端,所述编码器的输出端与所述解码器的输入端连接;
所述装置还包括:
周期输入单元,被配置成将所述周期数据输入到所述构建的用水量预测模型的解码器的输入端。
5.根据权利要求4所述的装置,其中,所述构建的用水量预测模型采用长短期记忆网络,所述构建的用水量预测模型包括:依次连接的编码器和解码器,所述训练数据集输入所述编码器的输入端,所述编码器的输出端与所述解码器的输入端连接;
所述装置还包括:
计时单元,被配置成获取所述未来时间段中的节假日数据和工作日数据;
时间输入单元,被配置成将所述未来时间段中的节假日数据和工作日数据输入到所述构建的用水量预测模型的解码器的输入端。
6.根据权利要求5所述的装置,还包括:
预报单元,被配置成获取所述未来时间段中的温度、湿度、风向、风力、降水量;
天气输入单元,被配置成将所述未来时间段中的温度、湿度、风向、风力、降水量输入到所述构建的用水量预测模型的解码器的输入端。
7. 一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-3中任一项所述的方法。
8.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-3中任一项所述的方法。
CN202011064102.1A 2020-09-30 2020-09-30 用水量预测方法、装置、电子设备以及计算机可读介质 Active CN112036668B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011064102.1A CN112036668B (zh) 2020-09-30 2020-09-30 用水量预测方法、装置、电子设备以及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011064102.1A CN112036668B (zh) 2020-09-30 2020-09-30 用水量预测方法、装置、电子设备以及计算机可读介质

Publications (2)

Publication Number Publication Date
CN112036668A CN112036668A (zh) 2020-12-04
CN112036668B true CN112036668B (zh) 2023-06-16

Family

ID=73572695

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011064102.1A Active CN112036668B (zh) 2020-09-30 2020-09-30 用水量预测方法、装置、电子设备以及计算机可读介质

Country Status (1)

Country Link
CN (1) CN112036668B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113743643B (zh) * 2021-02-05 2023-11-03 北京京东振世信息技术有限公司 一种确定商品数据预测准确率的方法、装置、设备和介质
CN113011673A (zh) * 2021-03-31 2021-06-22 新奥数能科技有限公司 一种冷却塔水位的监测预警方法及装置
CN113284001B (zh) * 2021-04-08 2023-01-20 南方电网数字电网研究院有限公司 用电量预测方法、装置、计算机设备和存储介质
CN113222057A (zh) * 2021-05-28 2021-08-06 中邮信息科技(北京)有限公司 数据预测模型训练、数据预测方法、装置、设备及介质
CN114236068B (zh) * 2021-11-24 2024-03-01 中冶赛迪信息技术(重庆)有限公司 一种基于循环水系统的氯离子浓度分析方法及系统
CN114386332B (zh) * 2022-01-17 2023-08-01 长春师范大学 基于edc-lstm模型的土壤湿度预测方法、装置及存储介质
CN114477329B (zh) * 2022-02-22 2023-01-06 江苏舜维环境工程有限公司 一种水泥厂集成化水处理装置
CN115345355B (zh) * 2022-08-02 2023-09-19 北京百度网讯科技有限公司 能耗预测模型构建方法、短期能耗预测方法及相关装置
CN115423224B (zh) * 2022-11-04 2023-04-18 佛山市电子政务科技有限公司 一种基于大数据的二次供水量预测方法、设备及储存介质
CN115994837B (zh) * 2023-03-23 2023-06-30 河北雄安睿天科技有限公司 一种水务数据的管理系统及方法
CN117726122A (zh) * 2023-12-19 2024-03-19 陕西理工大学 基于ann-lstm-a的热水用水量预测方法
CN117851953A (zh) * 2024-02-22 2024-04-09 深圳拓安信物联股份有限公司 用水异常检测方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107977735A (zh) * 2017-11-15 2018-05-01 河海大学 一种基于深度学习的城市日用水量预测方法
CN109658695A (zh) * 2019-01-02 2019-04-19 华南理工大学 一种多因素的短时交通流预测方法
CN111079989A (zh) * 2019-11-29 2020-04-28 武汉理工大学 一种基于dwt-pca-lstm的供水公司供水量预测装置
CN111210093A (zh) * 2020-03-05 2020-05-29 重庆森鑫炬科技有限公司 基于大数据的日用水量预测方法
CN111626518A (zh) * 2020-05-29 2020-09-04 上海交通大学 基于深度学习神经网络的城市天级需水量在线预测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10747427B2 (en) * 2017-02-01 2020-08-18 Google Llc Keyboard automatic language identification and reconfiguration
CN109214584B (zh) * 2018-09-21 2022-02-08 北京百度网讯科技有限公司 用于预测客流量的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107977735A (zh) * 2017-11-15 2018-05-01 河海大学 一种基于深度学习的城市日用水量预测方法
CN109658695A (zh) * 2019-01-02 2019-04-19 华南理工大学 一种多因素的短时交通流预测方法
CN111079989A (zh) * 2019-11-29 2020-04-28 武汉理工大学 一种基于dwt-pca-lstm的供水公司供水量预测装置
CN111210093A (zh) * 2020-03-05 2020-05-29 重庆森鑫炬科技有限公司 基于大数据的日用水量预测方法
CN111626518A (zh) * 2020-05-29 2020-09-04 上海交通大学 基于深度学习神经网络的城市天级需水量在线预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SWaP: Probabilistic Graphical and Deep Learning Models for Water Consumption Prediction;Gissella Bejarano 等;《 Proceedings of the 6th ACM International Conference on Systems for Energy-Efficient Buildings, Cities, and Transportation》;233–242 *
基于时序分解的用电负荷分析与预测;王旭强;陈艳龙;杨青;刘红昌;;计算机工程与应用(20);全文 *

Also Published As

Publication number Publication date
CN112036668A (zh) 2020-12-04

Similar Documents

Publication Publication Date Title
CN112036668B (zh) 用水量预测方法、装置、电子设备以及计算机可读介质
Qin et al. Simulating and Predicting of Hydrological Time Series Based on TensorFlow Deep Learning.
US11385950B2 (en) Failure mode specific analytics using parametric models
CN108573323B (zh) 能源互联网用户用电量预测方法、系统、设备及存储介质
US11719550B2 (en) Method and apparatus for building route time consumption estimation model, and method and apparatus for estimating route time consumption
CN111666462B (zh) 地理位置的推荐方法、装置、设备和计算机存储介质
CN113627135A (zh) 一种招聘岗位描述文本的生成方法、装置、设备及介质
US20210065086A1 (en) System and method for failure curve analytics
CN112000893B (zh) 常驻区域预测方法、装置、设备及存储介质
CN115390161B (zh) 基于人工智能的降水预测方法及装置
CN113657467B (zh) 模型预训练方法、装置、电子设备和存储介质
US20210239480A1 (en) Method and apparatus for building route time consumption estimation model, and method and apparatus for estimating route time consumption
CN112559721A (zh) 人机对话系统的调整方法、装置、设备、介质和程序产品
CN111986490A (zh) 路况预测方法、装置、电子设备和存储介质
CN113657934A (zh) 客流量预测模型的训练方法和客流量的预测方法和装置
CN114417192B (zh) 更新兴趣点poi状态的方法、装置、设备、介质及产品
Girimurugan et al. Application of Deep Learning to the Prediction of Solar Irradiance through Missing Data
CN110930187A (zh) 店铺到访人群挖掘方法、装置、设备和介质
CN111695680B (zh) 成绩预测方法、成绩预测模型训练方法、装置及电子设备
CN115713044B (zh) 一种多工况切换下的机电设备剩余寿命分析方法和装置
CN116647377A (zh) 一种网站巡检方法、装置、电子设备及存储介质
CN112598136B (zh) 数据的校准方法和装置
CN112989203B (zh) 素材投放方法、装置、设备和介质
CN115438835A (zh) 航班的配餐量预测方法、装置、计算机设备和存储介质
CN114118562A (zh) 流量预测方法、模型训练方法、装置以及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant