CN113222266B - 一种基于水表日用量大数据的预测模型匹配方法 - Google Patents
一种基于水表日用量大数据的预测模型匹配方法 Download PDFInfo
- Publication number
- CN113222266B CN113222266B CN202110561207.6A CN202110561207A CN113222266B CN 113222266 B CN113222266 B CN 113222266B CN 202110561207 A CN202110561207 A CN 202110561207A CN 113222266 B CN113222266 B CN 113222266B
- Authority
- CN
- China
- Prior art keywords
- prediction
- days
- water meter
- prediction model
- daily
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 192
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000002354 daily effect Effects 0.000 claims abstract description 121
- 238000012549 training Methods 0.000 claims abstract description 34
- 238000009825 accumulation Methods 0.000 claims abstract description 16
- 230000003203 everyday effect Effects 0.000 claims abstract description 6
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000001514 detection method Methods 0.000 abstract description 7
- 230000000694 effects Effects 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 5
- 238000012795 verification Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2113/00—Details relating to the application field
- G06F2113/08—Fluids
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Geometry (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Primary Health Care (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请属于智能水表技术的领域,涉及一种基于水表日用量大数据的预测模型匹配方法,包括采集当天的水表日用量值A;记录实际累积水表数据的天数N及水表每天的日用量值A1、A2、A3…AN;若实际累积水表数据的天数N达到预测模型的数据累积天数m时,则根据m天的水表日用量数据训练预设的预测模型;根据训练后预设的预测模型获取m天内的连续预测x天的水表日用量预测值B1、B2、B3…BX;若预测准确次数C与预设预测天数D的百分比值达到预测准确率p时,则确认该预测模型有效。本申请具有在使用预测模型预测下一阶段的用水量之前,便于检测预测模型的预测匹配度的效果。
Description
技术领域
本申请涉及智能水表技术的领域,尤其是涉及一种基于水表日用量大数据的预测模型匹配方法。
背景技术
由于全球水资源的匮乏,许多国家均面临水资源短缺的问题,因此对水资源的管理和规划非常重要,城市用水量预测在城市建设规划、输配水系统的优化调度中具有重要的作用,气候、节假日等因素对中长期用水量的影响也不容忽视,水需求预测对于水资源的分配和储备决策变得尤为重要;现阶段的用水量预测方法主要分为直接推测和模型预测两大类。
其中,直接推测主要基于城市用户长期使用水表生成的大量水表日用量数据,尤其是对于固定用户,而根据长期以往的用水量数据,会形成固定的用水习惯,基于固定用户的长期以往的用水模式,能推定下一阶段的用水数据。本方案推定的用水数据主要适用于固定用户,在用户的流动性相对较大时,基本不具备参考性。而实际应用中,对于一个城市整体而言用户普遍存在流动性,故适用性不佳。
模型预测水资源的方法是通过采集大量的历史真实用水数据(日用量数据不小于10万条/天),然后对大量的用水数据进行分析,利用多种算法训练出合适的预测模型,利用此预测模型来推定下一阶段的用户用水量,从而完成城市用水量的规划和调度。比较常见的预测模型有单算法预测模型和组合算法预测模型;单算法预测主要利用机器学习某一种算法对用水量进行预测,常用的算法有线性回归、灰色系统理论、贝叶斯理论和神经网络等;组合算法预测通常先用多种算法对用水量进行预测,然后按照一定的权重对预测结果进行加权平均,再得到最终结果;单算法预测受限于训练数据量,预测结果不稳定;组合算法预测难以确定每种算法的最优权重,预测结果误差也较大。
针对上述中的相关技术,发明人认为目前的预测模型能由不同的算法训练出,而不同算法训练出的预测模型适用的状况各异,采用单一的预测模型,其预测准确率在不同的阶段也存在差异,因此在预测下一阶段的用水量时容易出现因选择或匹配的预测模型不当而导致预测结果准确度不高的问题。
发明内容
为了获得更高的预测结果,在使用预测模型预测下一阶段的用水量之前,通过对预测模型的匹配度进行检测,筛选出准确率符合要求或适用性最强的预测模型,本申请提供了一种基于水表日用量大数据的预测模型匹配方法。
第一方面,本申请提供的一种基于水表日用量大数据的预测模型匹配方法,采用如下的技术方案:
一种基于水表日用量大数据的预测模型匹配方法,包括:
采集当天的水表日用量值A;
记录实际累积水表数据的天数N及水表每天的日用量值A1、A2、A3…AN;
若实际累积水表数据的天数N达到预测模型的数据累积天数m时,则根据m天的水表日用量数据训练预设的预测模型;
根据训练后预设的预测模型获取m天内的连续预测x天的水表日用量预测值B1、B2、B3…BX;
若当天的水表日用量值A与当天水表日用量预测值B的水表日用量的计算差值落入预设误差范围内时,则预测准确次数C累加为C+1;
若获取的m天内的连续预测天数x达到预设预测天数D时,获取预测准确次数C与预设预测天数D的百分比值;
若预测准确次数C与预设预测天数D的百分比值达到预测准确率p时,则确认该预测模型有效。
通过采用上述技术方案,在测定预测模型的匹配度时,需要先获取大量的历史用水数据来训练出预测模型的参数,通过对该预测模型在一定时间段的预测值进行检测,比如说获取固定用户连续90天的历史用水数据,训练出预测模型之后,需要对此预测模型的预测匹配度进行检测,比如说需要对后续任一阶段D天的预测匹配度时,假如任一阶段为30天的时限,如果实际采集过程中当天的水表日用量值A,即连续采集30天的当天水表日用量值A,然后再基于预测模型预测连续30天的水表日用量预测值B,计算出水表日用量值A与对应的水表日用量预测值B的误差,计算的误差在预设范围内时,则代表此次结果检测准确,并且将预测准确次数C进行累加,根据连续30天的预测准确次数C的占比情况来获取该预测模型的匹配度,从而能便于检测预测模型的预测结果的匹配度,以判断该预测模型的预测准确度。
可选的,所述记录实际累积水表数据的天数N及水表每天的日用量值A1、A2、A3…AN的步骤之后还包括:
若实际累积水表数据的天数N未达到预测模型的数据累积天数m时,则返回上一步骤,继续采集当天的水表日用量值A。
通过采用上述技术方案,通过采用上述技术方案,预测模型能够正常启动的必要条件是需要水表日用量数据累积的天数N要达到m天,则此模型才有效,或者可以理解为,m天累计的数据量才足够对预测模型的参数完成训练,而采集的数据未到达m天时,有可能导致预测模型难以完成训练,或训练的预测模型的参数不够稳定,难以实施预测,故需要继续执行获取水表日用量数据的步骤,直到达到m天,能使预测模型的预测工作正常、有效执行。
可选的,所述根据训练后预设的预测模型获取m天内的连续预测x天的水表日用量预测值B1、B2、B3…BX的步骤之后还包括:
若当天的水表日用量值A与当天水表日用量预测值B的水表日用量差值未落入预设误差范围内时,则预设预测准确次数C不累加。
通过采用上述技术方案,由于本方案是测算预测模型在一定阶段内的准确度,则只需要累加一定阶段内的预测准确次数C,若该阶段天数为30天,则预测准确次数C不高于30次,对于计算的误差超出预设误差范围的情况,则认为预测结果没有达到标准,预测准确的次数即天数则不进行累加,最后用预测准确次数C与该阶段天数D的百分比值作为预测模型的预测准确率,根据预测准确率来检测预测模型的匹配度。此计数方式简洁高效,且能有效反应预测结果的准确性,有利于加速系统的迭代运算过程。
可选的,所述若当天的水表日用量值A与当天水表日用量预测值B的水表日用量差值落入预设误差范围内时,则预测准确次数C累加为C+1的步骤之后或所述若当天的水表日用量值A与当天水表日用量预测值B的水表日用量差值落入预设误差范围内时,则预测准确次数C不累加的步骤之后还包括:
若获取的m天内的连续预测天数x未达到预设预测天数D时,则返回上一步骤,继续采集当天的水表日用量值A。
通过采用上述技术方案,由于当根据需要计算某一阶段的预测匹配度时,需要根据预测模型推算连续D天的水表日用量预测值B,而不只是取一天的数据,能在计算预测模型的预测准确率时减小误差,因此在未采集完D天的数据时,需要继续采集当天的水表日用量值A,直到达到D天的数据,然后分别用D天的水表日用量预测值B与水表日用量值A进行比较并且计算误差,这种方式相对于单独预测某一天的数据,能够降低单次数据呈现的偶然性对预测模型性能带来的不利影响,有利于全面检测并真实反应预测模型的准确性,更为客观有效。
可选的,在获取预测准确次数C与预设预测天数D的百分比值之后的步骤还包括:
若预测准确次数C与预设预测天数D的百分比值未达到预测准确率p时,则确认该预测模型不适用。
通过采用上述技术方案,预测准确率p是作为判断该预测模型的匹配度的基准,可以根据用户的不同需求进行设置或预定,如果要求较高,则p可设置较高值,例如99.999%,如果要求不高,则可放宽至95.999%;当预测准确次数C与预设预测天数D的百分比值位于预测准确率p的范围内时,则确认预测模型的D天的预测天数能适用于预测固定用户的日用水量,反之,则确认预测模型的D天的预测天数不适用于预测固定用户的日用水量。
可选的,所述若实际累积水表数据的天数N达到预测模型的数据积累天数m的步骤包括:所述预测模型包括多个;
所述根据m天的水表日用量数据训练预设的预测模型的步骤包括:根据m天的水表日用量数据分别训练预设的多个预测模型;
所述若预测准确次数C与预设预测天数D的百分比值达到预测准确率p时,则确认该预测模型有效的步骤包括:若预测准确次数C与预设预测天数D的百分比值达到预测准确率p的预测模型存在多个;则选取上述多个预测模型中预测准确率p最高的预测模型作为最优匹配预测模型并输出。
通过采用上述技术方案,对于预测模型能同时并行多个进行匹配,多个不同的模型或者相同的模型同时或随机或设定的次序计算预测准确率,根据预测准确率的大小比较出其中的最优模型,同时计算多个预测模型的预测准确率,便于筛选出最优的预测模型,在实际应用过程中有利于更加准确地推算用户在下一阶段的用水量。
可选的,在所述训练预设的预测模型的步骤之前还包括:
根据需要确定所述预测模型的类型与数量;
所述预测模型包括单算法预测模型和/或组合算法预测模型。
通过采用上述技术方案,可以预想选出认为比较合适的预测模型,例如对于居民等用户的用水,导致用水量变化的因素以及因素之间的关系简单,例如居家人口数量增加或季节性更换等原因,则可选用单算法预测模型,该模型又包括多种不同的算法模型,可以选用多个;对于工业企业等用户,导致用水量变化的因素较多,且多个因素之间的关联关系较为复杂,可选用组合算法预测模型,如果对于有些用户,呈现阶段性变换,则可两者结合;通过预选模型,能够减少类型匹配不合适导致的计算资源浪费,有利于提升运算速度;多种算法设计出的预测模型用于同时推算客户在下一阶段的用水量,同时来测定不同情况下的预测准确率,能减小单一预测模型的预测结果的随机性,有利于选出最优预测模型。
可选的,所述预测模型的数据累积天数m的取值范围为90~120。
通过采用上述技术方案,天数越长,数据样本越多,预测模型越可靠,但为方便实际应用计算及性价比,采用的预测模型的数据累积天数为90~120天,使检测结果更加可靠。
可选的,所述预测准确率p的取值范围为95%~99.99%。
通过采用上述技术方案,预测准确率p的理想值为100%,但实际不可能达到,允许有一定失效,一般按客户期望,取95%-99.99%之间的议定数值,符合实际情况,可操作性强,且成本预期可控。
第二方面,本申请提供一种基于水表日用量大数据的预测装置,采用如下的技术方案:
一种基于水表日用量大数据的预测装置,包括:
存储器,存储有基于水表日用量大数据预测模型的匹配方法程序;
处理器,所述处理器在运行基于水表日用量大数据预测模型的匹配方法程序时执行上述所述预测方法的步骤。
通过采用上述技术方案,在测定预测模型的匹配度时,需要先获取大量的历史用水数据来训练出预设的预测模型,根据预设的预测模型计算出每天的水表日用量值A与对应天数的水表日用量预测值B的误差,误差在预设的误差范围内时,则代表此轮检测结果准确,并且将预测准确次数C进行累加,根据连续D天内的预测准确次数C的占比情况来获取该预测模型的预测准确率,从而能便于检测预测模型的预测结果的匹配度,以判断该预测模型是否适合投入使用推算固定用户的在下一阶段的用水量。
综上所述,本申请包括以下至少一种有益技术效果:
1.在训练出预设的预测模型时,能根据连续D内的预测准确次数C的占比情况来获取预设的预测模型的预测准确率,便于判断该预测模型在预测固定用户下一阶段的用水量的过程中是否匹配;
2.在测量水表的预测准确率时,多种类型的预测模型同时来测定固定用户在同一阶段的预测准确率,能减小推断单一预测模型的预测结果的随机性,有利于选出最优预测模型。
附图说明
图1是本申请实施例一的一种基于水表日用量大数据的预测模型匹配方法的流程图。
图2是本申请实施例一的一种基于水表日用量大数据的预测模型匹配方法的整体流程示意图。
图3是图2中步骤S300的展开流程示意图。
图4是图2中步骤S500的展开流程示意图。
图5是图2中步骤S600的展开流程示意图。
图6是图2中步骤S700的展开流程示意图。
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图1-6及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本申请实施例公开一种基于水表日用量大数据的预测装置。
预测装置包括存储器和处理器:
存储器,存储有基于水表日用量大数据预测模型的匹配方法程序,存储器包括cf闪存卡、sm闪存卡、sd闪存卡、xd闪存卡、mmc闪存卡和微硬盘等具有存储功能的硬件;
处理器,处理器用于运行基于水表日用量大数据预测模型的匹配方法程序,以保证能系统正常检测预测模型的匹配度,处理器包括单片机、MCU、中央处理器以及其他芯片等。
本申请实施例的一种基于水表日用量大数据的预测装置的实施原理为为:
在对预测模型的匹配度进行检测时,需要先采集大量的历史用水数据根据各种算法训练出合适的预测模型,常用的算法有线性回归、灰色系统理论、贝叶斯理论和神经网络等,而需要检测此预测模型的匹配度时,需要将采集的当前水表日用量值A与由预测模型计算出的水表日用量预测值B进行比较,若计算的误差在预设范围内,则代表此次预测结构准确,预测准确次数C进行累积,然后统计连续采样D天内的预测准确次数C,将预测准确次数C与采样天数D的百分比值,若百分比值落入预设范围p内,则可以判定训练出的该预测模型的匹配度符合要求。
本申请实施例还公开一种基于水表日用量大数据的预测模型匹配方法。
实施例一
参照图1,为一种基于水表日用量大数据的预测模型匹配方法的流程图。
参照图2,基于水表日用量大数据的预测模型匹配方法包括步骤S100~S700。
参照图2,步骤S100:采集当天的水表日用量值A;
采集当天的水表日用量值A用于训练出预设的预测模型参数,同时在预测模型训练完成之后,才能够通过预测模型实现对下一天的用水日用量进行预测。需要说明的是,预测模型的训练一般需要数万条数据甚至数十万条数据,通常需要一定的周期,本方案中采用90~120天,每天可采集若干条数据,每天采集的数据条数可通过设置采集频率确定,例如100赫兹、1000赫兹等,可基于具体需求设定。这里当天的采集数据为若干条。
参照图2,步骤S200:记录实际累积水表数据的天数N及水表每天的日用量值A1、A2、A3…AN;
由于在训练预测模型时,一般会需要一定周期内大量的历史用水数据,采集的天数为N,因此需要获取连续N天的每天的实际日用量值A1、A2、A3…AN,在采集完成大量历史用水数据后,预设的预测模型参数才能确定方能被训练成功且能正常投入使用。
参照图2,步骤S300:判断实际累积水表数据的天数N是否达到预测模型的数据累积天数m。
由于启动预测模型的必要条件是,则获取水表日用量值A的天数N要到达m天,则需要连续获取连续m天的实际日用量值A1、A2、A3…Am,能保证预测模型的正常投入使用,采用大量数据来进行模型训练,数据量越多,需要的时间越长,消耗的计算资源越多,模型训练的参数越准确,训练模型的参数误差越小,预测模型的预测的准确性越高,并为后续检测预测模型的匹配度提供必要条件。
参照图3,步骤S300包括步骤S310和S320。
步骤S310:若实际累积水表数据的天数N达到预测模型的数据累积天数m时,则根据m天的水表日用量数据训练预设的预测模型。
预测模型需要大量的历史用水数据训练而成,数据量越大,训练出来的模型是越符合实际的,否则,就可能会降低预测模型的预测准确度,不利于后期检测预测模型的匹配度。
步骤S320:若实际累积水表数据的天数N未达到预测模型的数据累积天数m时,则返回上一步骤,继续采集当天的水表日用量值A。
由于预测模型需要大量的水表日用量数据训练而成,且该预测模型的训练条件是需要m天的水表日用量数据,则需要持续获取N天的水表日用量数据,直至N=m,则代表预测模型能正常启用,预测模型启用成功后,利用获取当前的水表日用量值A与由预测模型计算出的水表日用量预测值B进行比对,来计算误差,根据每一次的计算误差,来判断此次计算误差是否属于误差范围,若属于,则此次的预测模型此次的预测结果是准确的,如此循环多次,连续检测多次,有利于提高检测预测模型的准确度。
参照图2,步骤S400:根据训练后预设的预测模型获取m天内的连续预测x天的水表日用量预测值B1、B2、B3…BX;
在训练出预测模型后,需要检测预测模型的匹配度,则需要利用由预测模型推算出未来的连续若干天的水表日用量预测值B,然后用连续若干天的水表日用量预测值B分别与目前对应采集的连续若干天的水表日用量值A进行比对,计算出误差,由于预测模型是由m天的历史用水数据训练而成,则所需要预测的x天需要小于m天,才符合抽样检测的要求,例如说,该预测模型是选取固定用户在连续90天内的水表日用量值训练而成的,则所训练出的预测模型推算出固定用户的日用水量具有一定的规律性,利用这个规律来推算用户在下一阶段的用水量,而需要预测在某下一阶段的固定用户的用水量时,只需选择其中的某一阶段来预测即可,比如说,选取30天的水表日用量预测值B,与实际的连续30天的当前的水表日用量值A分别进行比较即可,有利于提高预测模型的预测准确性。
参照图2,步骤S500:判断当天的水表日用量值A与当天水表日用量预测值B的水表日用量差值是否落入预设误差范围内。
参照图4,步骤S500包括步骤S510~S520:
步骤S510:若当天的水表日用量值A与当天水表日用量预测值B的水表日用量的计算差值落入预设误差范围内时,则预测准确次数C累加为C+1。
步骤S520:若当天的水表日用量值A与当天水表日用量预测值B的水表日用量的计算差值未落入预设误差范围内时,则预设预测准确次数C不累加。
在需要预测一个预测模型的匹配度时,利用训练好的预测模型预测目前连续x天的预测值B,然后将目前x天的实际水表日用量值A与x天的预测值B进行逐一对应比较,分别计算出误差,然后按照计算出的误差一一与允许误差k进行比较,对于每次比较结果,若属于允许误差k的范围内,则预测准确次数C进行累加,反之,若不属于允许误差k的范围内,则代表此次预测不准确,预测准确次数C无需增加。
注:计算实际水表日用量值A与水表日用量预测值B的误差包括计量误差和客户允许误差,计量误差由该水表技术特性决定,客户允许误差指的是除了水表的计量误差外,客户可允许的计算误差上限,一般取水表的计量误差的10%。
参照图2,步骤S600:判断获取的m天以后的连续预测天数x是否达到预设预测天数D。
参照图5,步骤S600包括步骤S610~S620:
步骤S610:若获取的m天内的连续预测天数x达到预设预测天数D时,获取预测准确次数C与预设预测天数D的百分比值。
步骤S620:若获取的m天内的连续预测天数x未达到预设预测天数D时,则返回上一步骤,继续采集当天的水表日用量值A。
在预测模型正常启动使用时,为了检测预测模型的匹配度,一般会基于预测模型计算出连续x天的水表日用量预测值B,在预测天数x未到达天数D时,则继续下一轮获取水表日用量预测值B,直至预测天数x到达D,举例来说,利用90天的历史用户用水量数据来建立预测模型,则在检验预测模型的匹配度时,需要验证其中某一阶段例如后面30天的连续预测准确率,则可将前60天的采集数据作为训练数据集,训练数据集的数据用于训练预测模型的权重参数;后30天的采集数据作为验证数据集,验证数据集的数据用于计算预测模型的误差;根据预测模型推算连续30天的水表日用量预测值B,然后还需要采集当前30天的水表日用量值A,将当前30天的水表日用量值A与30天的水表日用量预测值B分别进行比较,计算30天水表日用量差值,判断30天水表日用量差值处于预设的误差范围内的预测准确次数C,然后计算预测准确次数C在天数D的占比情况来推断预测模型的匹配度。
需要说明的是,也可以将前面连续30天采集的数据作为验证数据集,将后面60天采集的数据作为训练数据集。或者将中间连续30天采集的数据作为验证数据集,其余时间段采集的数据作为训练数据集;可基于用户的需要灵活设置。
参照图2,步骤S700:判断预测准确次数C与预设预测天数D的百分比值是否达到预测准确率p。
参照图6,步骤S700包括步骤S710~S720:
步骤S710:若预测准确次数C与预设预测天数D的百分比值达到预测准确率p时,则确认该预测模型有效。
步骤S720:若预测准确次数C与预设预测天数D的百分比值未达到预测准确率p时,则确认该预测模型不适用。
在预设的D天内,预测准确次数C越多,代表预测准确次数C的占比越高,会依据预测准确次数C的占比情况来判断预测模型的适用情况,当占比情况达到准确率p的要求时,代表该预测模型有效,能用来投入使用以预测固定用户在下一阶段的用水量。
实施例二
与实施例一的不同之处在于,在若实际累积水表数据的天数N达到预测模型的数据积累天数m的步骤中:预测模型包括多个;
在根据m天的水表日用量数据训练预设的预测模型的步骤中包括:根据m天的水表日用量数据分别训练预设的多个预测模型;
在若预测准确次数C与预设预测天数D的百分比值达到预测准确率p时,则确认该预测模型有效的步骤中包括:若预测准确次数C与预设预测天数D的百分比值达到预测准确率p的预测模型存在多个;选取上述多个预测模型中预测准确率p最高的预测模型作为最优匹配预测模型并输出。
在测定预测模型的匹配度时,由于不同的预测模型的构成算法不同,每种不同算法构成的预测模型对同一阶段的用水量的预测值的推算结果也会存在差异,需要将多个预测模型同时进行匹配度的测定,然后综合选出预测准确率最高的预测模型作为最优模型,有利于在实际使用过程中更加准确地推算固定用户的用水量。
进一步地,根据需要确定预测模型的类型与数量;
预测模型包括单算法预测模型和/或组合算法预测模型。
在测量水表的预测准确率时,每个水表的预测模型不唯一且不固定,需要选出最优的预测模型,预测模型的类型包括单算法预测模型与组合算法预测模型,利用多种预测模型同时推算客户在下一阶段的用水量,同时来测定不同情况下的预测准确率,进行一次各个预测模型横向比较预测准确率,能减小单一预测模型的预测结果的随机性,有利于选出最优预测模型。
实施例三
与实施例一的不同之处在于,预测模型的数据累积天数m的取值范围为90~120。
天数越长,数据样本越多,预测模型越可靠,但为了方便实际应用计算,所以采用的预测模型的数据累积天数为90~120天。
实施例四
与实施例一的不同之处在于,预测准确率p的取值范围为95%~99.99%。
预测准确率p的理想值为100%,但实际不可能达到,允许有一定失效,一般按客户期望,取95%-99.99%之间的议定数值,更加符合实际情况。
以上均为本申请的较佳实施例,并非依此限制本申请的保护范围,本说明书(包括摘要和附图)中公开的任一特征,除非特别叙述,均可被其他等效或者具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。
Claims (8)
1.一种基于水表日用量大数据的预测模型匹配方法,其特征在于:包括:
采集当天的水表日用量值A;
记录实际累积水表数据的天数N及水表每天的水表日用量值A1、A2、A3…AN;
若实际累积水表数据的天数N达到预测模型的数据累积天数m时,则根据m天的水表日用量值A训练预设的预测模型;
根据训练后预设的预测模型获取m天内的连续预测x天的水表日用量预测值B1、B2、B3…BX;
若当天的水表日用量值A与当天水表日用量预测值B的水表日用量的计算差值落入预设误差范围内时,则预测准确次数C累加为C+1;
若获取的m天内的连续预测天数x达到预设预测天数D时,获取预测准确次数C与预设预测天数D的百分比值;
若预测准确次数C与预设预测天数D的百分比值达到预测准确率p时,则确认该预测模型有效;
所述记录实际累积水表数据的天数N及水表每天的日用量值A1、A2、A3…AN的步骤之后还包括:
若实际累积水表数据的天数N未达到预测模型的数据累积天数m时,则返回上一步骤,继续采集当天的水表日用量值A;
所述若实际累积水表数据的天数N达到预测模型的数据累积天数m的步骤包括:所述预测模型包括多个;
所述根据m天的水表日用量值A训练预设的预测模型的步骤包括:根据m天的水表日用量数据分别训练预设的多个预测模型;
所述若预测准确次数C与预设预测天数D的百分比值达到预测准确率p时,则确认该预测模型有效的步骤包括:若预测准确次数C与预设预测天数D的百分比值达到预测准确率p的预测模型存在多个;则选取上述多个预测模型中预测准确率p最高的预测模型作为最优匹配预测模型并输出。
2.根据权利要求1所述的一种基于水表日用量大数据的预测模型匹配方法,其特征在于:所述根据训练后预设的预测模型获取m天内的连续预测x天的水表日用量预测值B1、B2、B3…BX的步骤之后还包括:
若当天的水表日用量值A与当天水表日用量预测值B的水表日用量的计算差值未落入预设误差范围内时,则预测准确次数C不累加。
3.根据权利要求2所述的一种基于水表日用量大数据的预测模型匹配方法,其特征在于:所述若当天的水表日用量值A与当天水表日用量预测值B的水表日用量的计算差值落入预设误差范围内时,则预测准确次数C累加为C+1的步骤之后,或所述若当天的水表日用量值A与当天水表日用量预测值B的水表日用量差值未落入预设误差范围内时,则预测准确次数C不累加的步骤之后还包括:
若获取的m天内的连续预测天数x未达到预设预测天数D时,则返回上一步骤,继续采集当天的水表日用量值A。
4.根据权利要求2所述的一种基于水表日用量大数据的预测模型匹配方法,其特征在于:在获取预测准确次数C与预设预测天数D的百分比值之后的步骤还包括:
若预测准确次数C与预设预测天数D的百分比值未达到预测准确率p时,则确认该预测模型不适用。
5.根据权利要求1所述的一种基于水表日用量大数据的预测模型匹配方法,其特征在于:在所述训练预设的预测模型的步骤之前还包括:
根据需要确定所述预测模型的类型与数量;
所述预测模型包括单算法预测模型和/或组合算法预测模型。
6.根据权利要求1所述的一种基于水表日用量大数据的预测模型匹配方法,其特征在于:所述预测模型的数据累积天数m的取值范围为90~120。
7.根据权利要求1所述的一种基于水表日用量大数据的预测模型匹配方法,其特征在于:所述预测准确率p的取值范围为95%~99.99%。
8.一种基于水表日用量大数据的预测装置,其特征在于:包括:
存储器,存储有基于水表日用量大数据预测模型的匹配方法程序;
处理器,所述处理器在运行基于水表日用量大数据预测模型的匹配方法程序时执行权利要求1~7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110561207.6A CN113222266B (zh) | 2021-05-22 | 2021-05-22 | 一种基于水表日用量大数据的预测模型匹配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110561207.6A CN113222266B (zh) | 2021-05-22 | 2021-05-22 | 一种基于水表日用量大数据的预测模型匹配方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113222266A CN113222266A (zh) | 2021-08-06 |
CN113222266B true CN113222266B (zh) | 2022-11-25 |
Family
ID=77099376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110561207.6A Active CN113222266B (zh) | 2021-05-22 | 2021-05-22 | 一种基于水表日用量大数据的预测模型匹配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113222266B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110443418A (zh) * | 2019-07-31 | 2019-11-12 | 西安科技大学 | 基于ga-bp神经网络的城市用水量预测方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105956690A (zh) * | 2016-04-25 | 2016-09-21 | 广州东芝白云自动化系统有限公司 | 一种供水预测方法及系统 |
CN108875118B (zh) * | 2018-04-12 | 2021-06-25 | 中南大学 | 一种高炉铁水硅含量预测模型准确度评价方法和设备 |
CN109300310B (zh) * | 2018-11-26 | 2021-09-17 | 平安科技(深圳)有限公司 | 一种车流量预测方法及装置 |
CN111832790A (zh) * | 2019-10-28 | 2020-10-27 | 吉林建筑大学 | 一种供水管网预测中长期需水量的方法及系统 |
-
2021
- 2021-05-22 CN CN202110561207.6A patent/CN113222266B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110443418A (zh) * | 2019-07-31 | 2019-11-12 | 西安科技大学 | 基于ga-bp神经网络的城市用水量预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113222266A (zh) | 2021-08-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111445060B (zh) | 一种社区碳排放监测和预测系统及方法 | |
Wang et al. | Multi-criteria building energy performance benchmarking through variable clustering based compromise TOPSIS with objective entropy weighting | |
CN106503840B (zh) | 停车场可用车位预测方法及系统 | |
Zhang et al. | Forecasting residential energy consumption: Single household perspective | |
CN108593990B (zh) | 一种基于电能用户用电行为模式的窃电检测方法和应用 | |
KR101012863B1 (ko) | 고객기준부하 산출을 위한 부하 예측 비교 분석 시스템 | |
US20210056647A1 (en) | Method for multi-dimensional identification of flexible load demand response effect | |
Walter et al. | Uncertainty estimation improves energy measurement and verification procedures | |
CN102402726B (zh) | 一种基于区域负荷分析的大规模配电网电力电量预测方法 | |
EP2595098B1 (en) | Method and system for detecting an appliance based on users' feedback information | |
CN111104981A (zh) | 一种基于机器学习的水文预报精度评价方法及系统 | |
CN109766234A (zh) | 基于时间序列模型的磁盘存储容量预测方法 | |
CN109166034A (zh) | 一种风险预测方法及系统 | |
CN115407259A (zh) | 考虑嫌疑系数的超差电表在线检测方法、装置及存储介质 | |
CN114819530A (zh) | 一种需求侧灵活资源可调潜力预测方法和系统 | |
CN110837933A (zh) | 基于神经网络的漏损识别方法、装置、设备及存储介质 | |
CN110852906B (zh) | 一种基于高维随机矩阵进行窃电嫌疑识别的方法和系统 | |
CN115759393A (zh) | 基于集成学习的累积负荷基线预测方法 | |
CN113222266B (zh) | 一种基于水表日用量大数据的预测模型匹配方法 | |
CN112506982A (zh) | 一种线路和配变的最大负载预测的方法 | |
CN115545240A (zh) | 一种低压配电网台区异常线损诊断方法、系统、设备及介质 | |
Vašak et al. | Water use disaggregation based on classification of feature vectors extracted from smart meter data | |
CN115453447A (zh) | 基于嫌疑电表分步补偿剔除的超差电表在线检测方法 | |
CN115828134A (zh) | 用电数据样本构建、模型训练、账户类别确定方法和装置 | |
Manembu et al. | Multi-grained household load profile analysis using smart meter data: the case of Indonesia |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |