CN116451874B - 一种城市用水量预测方法、装置及设备 - Google Patents
一种城市用水量预测方法、装置及设备 Download PDFInfo
- Publication number
- CN116451874B CN116451874B CN202310698773.0A CN202310698773A CN116451874B CN 116451874 B CN116451874 B CN 116451874B CN 202310698773 A CN202310698773 A CN 202310698773A CN 116451874 B CN116451874 B CN 116451874B
- Authority
- CN
- China
- Prior art keywords
- data
- water consumption
- urban water
- consumption prediction
- feature data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 220
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000012545 processing Methods 0.000 claims abstract description 36
- 230000006870 function Effects 0.000 claims description 59
- 238000003066 decision tree Methods 0.000 claims description 22
- 238000003860 storage Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 7
- 238000009499 grossing Methods 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 description 9
- 230000009467 reduction Effects 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000012417 linear regression Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005265 energy consumption Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000004836 empirical method Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 238000012384 transportation and delivery Methods 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Computational Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Operations Research (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Game Theory and Decision Science (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Development Economics (AREA)
- Quality & Reliability (AREA)
- Algebra (AREA)
- Entrepreneurship & Innovation (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种城市用水量预测方法、装置及设备,所述方法包括:获取城市实时的时间特征数据、天气特征数据和自回归特征数据;将所述时间特征数据、天气特征数据和自回归特征数据,输入确定的城市用水量预测模型中进行处理,得到城市用水量预测数据;所述城市用水量预测模型是根据相关网络模型确定的。本发明的方案能够考虑天气气候、节假日等因素对用水量的影响,适用于各种区域和时间,预测精准,普适性强。
Description
技术领域
本发明涉及计算机信息处理技术领域,特别是指一种城市用水量预测方法、装置及设备。
背景技术
城市在不同时刻由于经济生产和居民生活情况不断变动,用水量会有一定的波动,在短期内,城市用水量的变化具有周期性,如月用水量的年周期性、时用水量的日周期性等。从较长的时间来看,又具有年增长的趋势,这种增长趋势的变化收到城市发展的经济等因素,以及供水系统供水能力发展的制约,城市用水预测就是根据城市历史用水量数据的变化规律,并考虑社会、经济等主观因素和天气状况等客观因素的影响,利用科学的、系统的或经验的方法,对城市未来某时间段内的用水量进行预测。
目前,现有用水量预测至少存在以下问题:
(1)无法同时保证预测模型结果的精度和预测方法的稳健性。现有的用水量预测模型应用在部分城市或部分时段能得到较好的预测结果,但更换城市或者预测时段,预测结果则较差,预测效果并不稳定;
(2)没有考虑天气气候条件、节假日等因素对用水量的明显影响;
(3)没有分清诸多外部影响因素中的主要因素和次要因素;
(4)现有的用水量模式曲线的分类和识别大多数建立在经验方法的基础上,有其主观随意性和局限性。
发明内容
本发明要解决的技术问题是如何提供一种城市用水量预测方法、装置及设备,能够考虑天气气候、节假日等因素对用水量的影响,适用于各种区域和时间,预测精准,普适性强。
为解决上述技术问题,本发明的技术方案如下:
一种城市用水量预测方法,所述方法包括:
获取城市实时的时间特征数据、天气特征数据和自回归特征数据;
将所述时间特征数据、天气特征数据和自回归特征数据,输入确定的城市用水量预测模型中进行处理,得到城市用水量预测数据;所述城市用水量预测模型是根据相关网络模型确定的。
可选的,获取城市实时的自回归特征数据,包括:
获取城市实时时段的城市出水量数据;
对所述城市出水量数据进行分析处理,得到城市实时的自回归特征数据。
可选的,所述相关网络模型的确定过程包括:
获取城市历史的所述时间特征数据、天气特征数据和自回归特征数据;
对历史的所述时间特征数据、天气特征数据和自回归特征数据进行特征识别处理,确定所述时间特征数据、天气特征数据和自回归特征数据对应的数据特征;
根据所述数据特征,确定所述相关网络模型的目标参数;
根据所述目标参数,确定所述相关网络模型。
可选的,根据相关网络模型确定城市用水量预测模型,包括:
获取城市历史的所述时间特征数据、天气特征数据和自回归特征数据;
将历史的所述时间特征数据、天气特征数据和自回归特征数据,输入至所述相关网络模型中进行训练处理,确定所述城市用水量预测模型。
可选的,将所述时间特征数据、天气特征数据和自回归特征数据,输入确定的城市用水量预测模型中进行处理,得到城市用水量预测数据,包括:
将所述时间特征数据、天气特征数据和自回归特征数据,分别输入多个确定的城市用水量预测模型中进行处理,得到多个确定的城市用水量预测模型对应的城市用水量预测数据;
根据多个确定的城市用水量预测模型对应的城市用水量预测数据,确定城市用水量预测数据。
可选的,根据多个确定的城市用水量预测模型对应的城市用水量预测数据,确定城市用水量预测数据,包括:
根据,确定城市用水量预测数据,确定城市用水量预测数据;
其中,为城市用水量预测数据,/>为函数关系,/>为第i个样本的特征值,/>为第k个的城市用水量预测模型的输入输出函数关系,/>,F为回归树的特征空间space,k为第k个城市用水量预测模型,K为城市用水量预测模型的数量。
可选的,所述城市用水量预测方法还包括:
根据预先建立的目标函数对所述城市用水量预测数据进行优化处理,得到优化后的城市用水量预测数据。
本发明还提供一种城市用水量预测装置,所述装置包括:
获取模块,用于获取城市实时的时间特征数据、天气特征数据和自回归特征数据;
处理模块,用于将所述时间特征数据、天气特征数据和自回归特征数据,输入确定的城市用水量预测模型中进行处理,得到城市用水量预测数据;所述城市用水量预测模型是根据相关网络模型确定的。
本发明还提供一种计算设备,包括:处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如上所述的方法的步骤。
本发明还提供一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如上所述的方法的步骤。
本发明的上述方案至少包括以下有益效果:
本发明的上述方案,通过获取城市实时的时间特征数据、天气特征数据和自回归特征数据;将所述时间特征数据、天气特征数据和自回归特征数据,输入确定的城市用水量预测模型中进行处理,得到城市用水量预测数据;所述城市用水量预测模型是根据相关网络模型确定的。能够考虑天气气候、节假日等因素对用水量的影响,适用于各种区域和时间,预测精准,普适性强。
附图说明
图1是本发明实施例提供的城市用水量预测方法流程示意图;
图2是本发明实施例的城市用水量预测装置的模块框示意图。
具体实施方式
下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
如图1所示,本发明的实施例提供一种城市用水量预测方法,所述方法包括:
步骤11,获取城市实时的时间特征数据、天气特征数据和自回归特征数据;
步骤12,将所述时间特征数据、天气特征数据和自回归特征数据,输入确定的城市用水量预测模型中进行处理,得到城市用水量预测数据;所述城市用水量预测模型是根据相关网络模型确定的。
本发明的该实施例中,通过将获取的城市实时的时间特征数据、天气特征数据和自回归特征数据,输入至根据相关网络模型确定的城市用水量预测模型中进行处理,得到下一时刻的城市用水量预测数据。这样能够考虑天气气候、节假日等因素对用水量的影响,适用于各种区域和时间,预测精准,普适性强。
需要说明的是,所述时间特征数据包括但不限于:日期、时间、节假日、节假日类型、工作日、星期几等;具体可以编码表示为:日期:date;embedding编码;是否为节假日:if_holiday;节假日名称:holiday_mane:embedding编码;是否为工作日:if_workday;星期几:weekday;小时:hour;
天气特征数据包括但不限于:温度、湿度等;具体可以编码表示为:当前时刻的温度:temp;当前时刻的湿度:humi;风向:winddirection;风力:windpower;降水:water;
自回归特征数据包括但不限于:多个维度的历史出水量数据。
本发明一可选的实施例中,步骤11中,获取城市实时的自回归特征数据,可以包括:
步骤111,获取城市实时时段的城市出水量数据;
步骤112,对所述城市出水量数据进行分析处理,得到城市实时的自回归特征数据。
本实施例中,可以采用自相关分析法对时间序列的城市出水量数据进行分析处理,即识别时间序列的城市出水量数据的基本特征,包括城市出水量数据的平稳性、趋势、季节性、交变性和随机性等特性。这样能够对数据进行分析,确定数据的基本特征,作为城市用水量预测模型的输入数据,能够提高城市用水量预测模型的预测精度。
本发明又一可选的实施例中,步骤12中,所述相关网络模型的确定过程可以包括:
步骤121,获取城市历史的所述时间特征数据、天气特征数据和自回归特征数据;
步骤122,对历史的所述时间特征数据、天气特征数据和自回归特征数据进行特征识别处理,确定所述时间特征数据、天气特征数据和自回归特征数据对应的数据特征;这里,可以采用自相关分析法对城市历史的所述时间特征数据、天气特征数据和自回归特征数据进行识别处理;
步骤123,根据所述数据特征,确定所述相关网络模型的目标参数;
步骤124,根据所述目标参数,确定所述相关网络模型。
具体实现时,步骤123可以包括:
步骤1231,根据所述数据特征,确定所述相关网络模型的架构;
步骤1232,通过预设算法对所述相关网络模型的架构进行处理,确定所述相关网络模型的目标参数。这里,所述预设算法可以包括但不限于:最小二乘法。采用最小二乘法能够使得总的误差平方和最小均方差MSE(Mean-Square Error)最小,从而确定所述相关网络模型的最佳参数值。
值得注意的是,自相关分析的分析结果是识别城市出水量数据的基本特征,在得到城市出水量数据的特征后,可以根据城市出水量的数据特征确定相关网络模型的架构,所述相关网络模型的架构包括但不限于:指数平滑方法、自回归—移动平均方法、回归分析模型、时间序列模型、灰色预测模型、人工神经网络模型、组合预测模型、分类预测模型等。这样能够针对数据的基本特征,确定合适的相关网络模型,从而提升城市出水量预测模型的预测精度。
需要说明的是,所述目标参数可以包括但不限于:
eta:和GBM(Grandient Boosting Machine,梯度提升机)中的learning rate(用于调整神经网络输入权重)参数类似,默认值为0.3,典型值为0.01-0.2,通过减少每一步的权重,可以相关网络模型的鲁棒性;
min_child_weight:即最小样本权重的和,默认值为1,用于决定最小叶子节点样本权重和,避免过拟合,当该值较大时,可以避免相关网络模型学习到局部的特殊样本,若该值过高,会导致欠拟合;
Subsample:用于控制对于每棵树,随机采样的比例,减小该值,算法会更加保守,避免过拟合,若该值设置的过小,可能会导致欠拟合,默认值为1;
Gamma:和GBM中的learning rate参数类似,默认值为0,典型值为0.01-0.2,通过减少每一步的权重,可以提高模型的鲁棒性。
scale_pos_weight:在各类别样本十分不平衡时,将该参数设定为正值,可以使算法更快收敛,默认值为1;
colsample_bytree:和GBM里面的max_features(每个决策树的随机选择的特征数目)参数类似;用于控制每棵随机采样的列数的占比(每一列是一个特征),默认值为1,典型值为0.5-1;
max_depth:和GBM中的参数相同,该值为树的最大深度,用于避免过拟合,该值越大,相关网络模型会学到更具体更局部的样本,需要使用CV函数来进行调优,默认值为6,典型值为3-10;
Alpha:权重的L1正则化项,(和Lasso regression(套索回归)类似),可以应用在很高维度的情况下,使得算法的速度更快,默认值为1;
Lambda:权重的L2正则化项,(和Ridge regression(脊回归)类似),用于控制城市用水量预测模型的正则化部分,默认值为1;
Seed:随机数的种子,通过设置该值可以复现随机数据的结果,也可以用于调整参数,默认值为0。
本发明一可选的具体实施例中,通过最小二乘法对所述相关网络模型的架构进行处理,确定所述相关网络模型的目标参数,可以包括:
获取一组数据样本:(x,y)、(1,1)、(2,5)、(3,6),经过对数据样本(x,y)进行分析后,确定数据样本(x,y)之间呈线性关系,因此,确定相关网络模型的架构为一元线性回归模型(y=ax+b),即采用一元线性回归模型(y=ax+b)确定数据样本(x,y)之间的函数关系;
将样本数据带入一元线性回归模型中:;
通过对残差平方和的最小化进行估计:;
当S最小时,参数a、b为:;
则样本数据为:;
当S取极值时,S对a和b的偏导均为0,因此:
关于a,b的方程组是一个适定的方程组,这样就可以直接解出参数a,b为:。
其中,y为因变量,x为自变量,a和b均为常数,为第i个因变量预测值,/>为第i个因变量真实值,/>为第i个自变量,S为残差平方和,/>为对a的求导,/>为对b的求导。
本发明又一可选的实施例中,步骤12中,根据相关网络模型确定城市用水量预测模型,可以包括:
步骤125,获取城市历史的所述时间特征数据、天气特征数据和自回归特征数据;
步骤126,将历史的所述时间特征数据、天气特征数据和自回归特征数据,输入至所述相关网络模型中进行训练处理,确定所述城市用水量预测模型。
本实施例中,通过相关网络模型对已知的历史时间特征数据、天气特征数据和自回归特征数据进行拟合,确定城市用水量预测模型,这样能够分析所有的误差项是否具有随机性,进而避免随机性对预测结果的影响,提升城市用水量预测模型的预测精度。
本发明又一可选的实施例中,步骤12可以包括:
步骤127,步骤将所述时间特征数据、天气特征数据和自回归特征数据,分别输入多个确定的城市用水量预测模型中进行处理,得到多个确定的城市用水量预测模型对应的城市用水量预测数据;
步骤128,根据多个确定的城市用水量预测模型对应的城市用水量预测数据,确定城市用水量预测数据。
具体实现时,步骤128,可以包括:
步骤1281,根据,确定城市用水量预测数据,确定城市用水量预测数据;
其中,为城市用水量预测数据,/>为函数关系,/>为第i个样本的特征值,/>为第k个的城市用水量预测模型的输入输出函数关系,/>,F为回归树的特征空间space,k为第k个城市用水量预测模型,K为城市用水量预测模型的数量。
本实施例中,通过城市用水量预测模型能够把大量分类准确率较低的预测模型组合成一个准确率较高的预测模型,城市用水量预测模型能自动利用CPU的多线程进行并行,并对算法加以改进以提高精度。城市用水量预测模型的基学习器既有树(gb-tree)又有线性分类器(gblinear),从而得到带L1+L2惩罚的线性回归或逻辑回归,其损失函数采用二阶泰勒展开,具有高准确度、不易过拟合、可扩展性等特点,能分布式处理高维稀疏特征,处理表格数据的过程不仅高效且具有较好的精确性;对于参数调节更简易且支持并行计算,拥有更快的训练速度,预测的准确率和适用性也有较大提升;其次,城市用水量预测模型考虑了天气气候条件、节假日等因素对用水量的明显影响,使预测结果更加准确;迭代的次数少,支持并行处理,城市用水量预测模型的结构简单,同时降低了主观随意性和局限性;
本发明又一可选的具体实施例中,城市用水量预测数据的确定过程包括:
获取数据集,该数据集中有n个样本,每个样本有m个输入和一个输出,用集合表达为:;
其中,D为第k个特征的每个样本的特征值与其相应的组成的集合,为第i个样本的特征值,/>为有m个元素的向量,/>为第i个样本的预测值,/>为实数集合,i为样本数,为正整数集合;
将K个决策树模型依据输入输出结果,将K个输出结果求和后得到城市用水量预测值包括:/>;
其中,为城市用水量预测数据,/>为函数关系,/>为第i个样本的特征值,/>为第k个的城市用水量预测模型的输入输出函数关系,/>,每个/>与第k个回归树的结构q和叶子节点权重w相对应,F为回归树的特征空间space,k为第k个城市用水量预测模型,K为城市用水量预测模型的数量;
;
其中,q为每一个回归树的结构,T为回归树的叶子数量,为输入输出函数关系,/>为第i个叶子节点的得分,/>为t个元素的向量。
本发明又一可选的实施例中,所述城市用水量预测方法,还可以包括:
步骤13,根据预先建立的目标函数对所述城市用水量预测数据进行优化处理,得到优化后的城市用水量预测数据。
本实施例中,对城市用水量预测数据进行优化后,能够提升城市用水量预测数据的精度。
本发明又一可选的具体实施例中,根据预先建立的目标函数对所述城市用水量预测数据进行优化处理,得到优化后的城市用水量预测数据,包括:
目标函数为:;
其中,为目标函数;/>为可微的凸函数,/>为样本i的实际值,/>为前t棵决策树一起对样本i的预测值,/>为第t棵决策树对样本i的预测值,/>为每一个模型/>的复杂惩罚项,f为若干子集构成的集类,/>为第k棵树的模型复杂度,/>为惩罚项,T为当前子树的深度,/>为特征值,/>为叶子节点的节点值,where为区域。
需要说明的是,可微的凸函数表示预测值与真实值之间的差距;每一个模型/>的复杂惩罚项/>用于平滑模型最终学习到的权重防止过拟合和限制叶子节点总数,不仅包括L2正则化项,还包括对叶子节点数的惩罚。
根据目标函数对进行迭代表示为:
第t次迭代表示为:
其中,为第t次迭代后样本i的预测结果,/>为树模型,/>为第i个样本的特征值,/>为前t-1棵树的预测结果,/>为第t棵树的模型;将第t次迭代的公式带入对目标函数进行迭代的公式中,能够进一步改进目标函数,在第t次迭代的目标函数为:
将损失函数分解为二阶泰勒级数使得目标函数变成了如下形式:
其中,为第t次迭代的目标函数,/>为损失函数,/>为样本i的实际值,为“前t-1棵决策树”对样本i的预测值(将前t-1棵决策树中的每棵决策树的预测值相加所得),/>为“第t棵决策树”对样本i的预测值,/>为第i个样本的特征值,/>为惩罚项,where为区域,/>为叶子的个数,/>为一棵树的叶子节点数量,/>为特征值,/>为叶子节点输出值组成的向量,/>为损失函数的一阶导,/>,/>为损失函数的二阶导,/>,/>为平方损失函数;
为了遍历所有可能结构的决策树,可以采用贪心算法在叶子上迭代式添加分支节点扩展决策树,假设一个叶子结点被分裂出左右两个子节点,这两个子节点的样本集/>,/>和父节点的样本集I满足:/>;
用分裂点的损失减少量Lsplite评价一个分割点的优劣,损失减少量Lsplite的计算公式如下:
把父节点中每一个样本都作为分裂点计算一次,找到使损失减少量最大的那个分裂点就是样本集最佳分裂点;采用贪心算法,就是通过一步步贪心地分裂节点获得完整决策树;
(1)从深度为0的树开始,对每个叶节点枚举所有的可用特征;
(2)针对每个特征,把属于该节点的训练样本根据该特征值升序排列,通过线性扫描的方式来决定该特征的最佳分裂点,用计算每个分裂点的损失减少量,并记录该特征的损失减少量的最大值(采用最佳分裂点时的损失减少量);
其中,为分裂点的损失减少量,i为第i个参数,/>为样本集L,/>为样本集R,
(3)选择损失减少量最大的特征作为分裂特征,用该特征的最佳分裂点作为分裂位置,把该节点生长出左右两个新的叶节点,并为每个新节点关联对应的样本集;
(4)回到第1步,递归执行到满足预设条件为止;其中,所述预设条件包括:达到树的结点数限制,或者迭代刺次数限制,或者迭代损失不再下降。
本发明的上述实施例中,城市供水系统的短期用水量预测可以保证管网用水量,保证用户在生活工作习惯下对水量、水压在不同时段的不同要求,以提高供水系统管理和供水服务质量的保证;
用水量预测作为优化调度的基础,对供水系统调度具有重要指导作用为输配水系统的优化调度提供依据,水厂出水经加压送至用户,需要很大的能耗,通过用水量预测进而对水泵进行优化调度和充分利用系统的储备能力来降低能耗,从而可以使系统在安全范围内能耗最小,确保给水管网安全、稳定优质、经济运行;
合理的分配不同区域的用水量为各个水厂产水量提供依据,最大限度的降低供水成本;为了保证供水水质,生活用水不能储存过久,要求生产、输送、分配调度和用户用水同时进行,因此,通过用水量预测使产水、用水达到供需平衡。如图2所示,本发明的实施例还提供一种城市用水量预测装置20,所述装置20包括:
获取模块21,用于获取城市实时的时间特征数据、天气特征数据和自回归特征数据;
处理模块22,用于将所述时间特征数据、天气特征数据和自回归特征数据,输入确定的城市用水量预测模型中进行处理,得到城市用水量预测数据;所述城市用水量预测模型是根据相关网络模型确定的。
可选的,获取城市实时的自回归特征数据,包括:
获取城市实时时段的城市出水量数据;
对所述城市出水量数据进行分析处理,得到城市实时的自回归特征数据。
可选的,所述相关网络模型的确定过程包括:
获取城市历史的所述时间特征数据、天气特征数据和自回归特征数据;
对历史的所述时间特征数据、天气特征数据和自回归特征数据进行特征识别处理,确定所述时间特征数据、天气特征数据和自回归特征数据对应的数据特征;
根据所述数据特征,确定所述相关网络模型的目标参数;
根据所述目标参数,确定所述相关网络模型。
可选的,根据相关网络模型确定城市用水量预测模型,包括:
获取城市历史的所述时间特征数据、天气特征数据和自回归特征数据;
将历史的所述时间特征数据、天气特征数据和自回归特征数据,输入至所述相关网络模型中进行训练处理,确定所述城市用水量预测模型。
可选的,将所述时间特征数据、天气特征数据和自回归特征数据,输入确定的城市用水量预测模型中进行处理,得到城市用水量预测数据,包括:
将所述时间特征数据、天气特征数据和自回归特征数据,分别输入多个确定的城市用水量预测模型中进行处理,得到多个确定的城市用水量预测模型对应的城市用水量预测数据;
根据多个确定的城市用水量预测模型对应的城市用水量预测数据,确定城市用水量预测数据。
可选的,根据多个确定的城市用水量预测模型对应的城市用水量预测数据,确定城市用水量预测数据,包括:
根据,确定城市用水量预测数据,确定城市用水量预测数据;
其中,为城市用水量预测数据,/>为函数关系,/>为第i个样本的特征值,/>为第k个的城市用水量预测模型的输入输出函数关系,/>,F为回归树的特征空间space,k为第k个城市用水量预测模型,K为城市用水量预测模型的数量。
可选的,所述处理模块22,还可以用于:
根据预先建立的目标函数对所述城市用水量预测数据进行优化处理,得到优化后的城市用水量预测数据。
需要说明的是,该装置是与上述方法对应的装置,上述方法实施例中的所有实现方式均适用于该装置的实施例中,也能达到相同的技术效果。
本发明的实施例还提供一种计算设备,包括:处理器、存储有计算机程序的存储器,所述计算机程序被处理器运行时,执行如上所述的方法。上述方法实施例中的所有实现方式均适用于该实施例中,也能达到相同的技术效果。
本发明的实施例还提供一种计算机可读存储介质,包括指令,当所述指令在计算机上运行时,使得计算机执行如上所述的方法。上述方法实施例中的所有实现方式均适用于该实施例中,也能达到相同的技术效果。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
此外,需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行,某些步骤可以并行或彼此独立地执行。对本领域的普通技术人员而言,能够理解本发明的方法和装置的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能就能实现的。
因此,本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。所述计算装置可以是公知的通用装置。因此,本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产品也构成本发明,并且存储有这样的程序产品的存储介质也构成本发明。显然,所述存储介质可以是任何公知的存储介质或者将来所开发出来的任何存储介质。还需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (5)
1.一种城市用水量预测方法,其特征在于,所述方法包括:
获取城市实时的时间特征数据、天气特征数据和自回归特征数据;
将所述时间特征数据、天气特征数据和自回归特征数据,输入确定的城市用水量预测模型中进行处理,得到城市用水量预测数据;所述城市用水量预测模型是根据相关网络模型确定的;
根据预先建立的目标函数对所述城市用水量预测数据进行优化处理,得到优化后的城市用水量预测数据;
其中,获取城市实时的自回归特征数据,包括:
获取城市实时时段的城市出水量数据;
对所述城市出水量数据进行分析处理,得到城市实时的自回归特征数据;
其中,所述相关网络模型的确定过程包括:
获取城市历史的所述时间特征数据、天气特征数据和自回归特征数据;
对历史的所述时间特征数据、天气特征数据和自回归特征数据进行特征识别处理,确定所述时间特征数据、天气特征数据和自回归特征数据对应的数据特征;
根据所述数据特征,确定所述相关网络模型的目标参数;
根据所述目标参数,确定所述相关网络模型;
其中,根据相关网络模型确定城市用水量预测模型,包括:
获取城市历史的所述时间特征数据、天气特征数据和自回归特征数据;
将历史的所述时间特征数据、天气特征数据和自回归特征数据,输入至所述相关网络模型中进行训练处理,确定所述城市用水量预测模型;
其中,将所述时间特征数据、天气特征数据和自回归特征数据,输入确定的城市用水量预测模型中进行处理,得到城市用水量预测数据,包括:
将所述时间特征数据、天气特征数据和自回归特征数据,分别输入多个确定的城市用水量预测模型中进行处理,得到多个确定的城市用水量预测模型对应的城市用水量预测数据;
根据多个确定的城市用水量预测模型对应的城市用水量预测数据,确定城市用水量预测数据;
其中,根据预先建立的目标函数对所述城市用水量预测数据进行优化处理,得到优化后的城市用水量预测数据,包括:
目标函数为:;
其中,为目标函数;/>为可微的凸函数,/>为样本i的实际值,/>为前t棵决策树一起对样本i的预测值,/>为第t棵决策树对样本i的预测值,/>为每一个模型/>的复杂惩罚项,f为若干子集构成的集类,/>为第k棵树的模型复杂度,/>为惩罚项,T为当前子树的深度,/>为特征值,/>为叶子节点的节点值,where为区域;
其中,可微的凸函数表示预测值与真实值之间的差距;每一个模型/>的复杂惩罚项用于平滑模型最终学习到的权重防止过拟合和限制叶子节点总数,包括L2正则化项和对叶子节点数的惩罚;
根据目标函数对进行迭代表示为:
第t次迭代表示为:
其中,为第t次迭代后样本i的预测结果,/>为树模型,/>为第i个样本的特征值,为前t-1棵树的预测结果,/>为第t棵树的模型;将第t次迭代的公式带入对目标函数进行迭代的公式中,在第t次迭代的目标函数为:
将损失函数分解为二阶泰勒级数使得目标函数变为如下形式:
其中,为第t次迭代的目标函数,/>为损失函数,/>为样本i的实际值,/>为“前t-1棵决策树”对样本i的预测值,是将前t-1棵决策树中的每棵决策树的预测值相加得到的,/>为“第t棵决策树”对样本i的预测值,/>为第i个样本的特征值,/>为惩罚项,where为区域,/>为叶子的个数,/>为一棵树的叶子节点数量,/>为特征值,/>为叶子节点输出值组成的向量,/>为损失函数的一阶导,/>,/>为损失函数的二阶导,/>,/>为平方损失函数。
2.根据权利要求1所述的城市用水量预测方法,其特征在于,根据多个确定的城市用水量预测模型对应的城市用水量预测数据,确定城市用水量预测数据,包括:
根据,确定城市用水量预测数据;
其中,为城市用水量预测数据,/>为函数关系,/>为第i个样本的特征值,/>为第k个城市用水量预测模型的输入输出函数关系,/>,F为回归树的特征空间Space,k为第k个城市用水量预测模型,K为城市用水量预测模型的数量。
3.一种城市用水量预测装置,其特征在于,所述装置包括:
获取模块,用于获取城市实时的时间特征数据、天气特征数据和自回归特征数据;
处理模块,用于将所述时间特征数据、天气特征数据和自回归特征数据,输入确定的城市用水量预测模型中进行处理,得到城市用水量预测数据;所述城市用水量预测模型是根据相关网络模型确定的;
根据预先建立的目标函数对所述城市用水量预测数据进行优化处理,得到优化后的城市用水量预测数据;其中,获取城市实时的自回归特征数据,包括:
获取城市实时时段的城市出水量数据;
对所述城市出水量数据进行分析处理,得到城市实时的自回归特征数据;
其中,所述相关网络模型的确定过程包括:
获取城市历史的所述时间特征数据、天气特征数据和自回归特征数据;
对历史的所述时间特征数据、天气特征数据和自回归特征数据进行特征识别处理,确定所述时间特征数据、天气特征数据和自回归特征数据对应的数据特征;
根据所述数据特征,确定所述相关网络模型的目标参数;
根据所述目标参数,确定所述相关网络模型;其中,根据相关网络模型确定城市用水量预测模型,包括:
获取城市历史的所述时间特征数据、天气特征数据和自回归特征数据;
将历史的所述时间特征数据、天气特征数据和自回归特征数据,输入至所述相关网络模型中进行训练处理,确定所述城市用水量预测模型;
其中,将所述时间特征数据、天气特征数据和自回归特征数据,输入确定的城市用水量预测模型中进行处理,得到城市用水量预测数据,包括:
将所述时间特征数据、天气特征数据和自回归特征数据,分别输入多个确定的城市用水量预测模型中进行处理,得到多个确定的城市用水量预测模型对应的城市用水量预测数据;
根据多个确定的城市用水量预测模型对应的城市用水量预测数据,确定城市用水量预测数据;
其中,根据预先建立的目标函数对所述城市用水量预测数据进行优化处理,得到优化后的城市用水量预测数据,包括:
目标函数为:;
其中,为目标函数;/>为可微的凸函数,/>为样本i的实际值,/>为前t棵决策树一起对样本i的预测值,/>为第t棵决策树对样本i的预测值,/>为每一个模型/>的复杂惩罚项,f为若干子集构成的集类,/>为第k棵树的模型复杂度,/>为惩罚项,T为当前子树的深度,/>为特征值,/>为叶子节点的节点值,where为区域;
其中,可微的凸函数表示预测值与真实值之间的差距;每一个模型/>的复杂惩罚项用于平滑模型最终学习到的权重防止过拟合和限制叶子节点总数,包括L2正则化项和对叶子节点数的惩罚;
根据目标函数对进行迭代表示为:
第t次迭代表示为:
其中,为第t次迭代后样本i的预测结果,/>为树模型,/>为第i个样本的特征值,为前t-1棵树的预测结果,/>为第t棵树的模型;将第t次迭代的公式带入对目标函数进行迭代的公式中,在第t次迭代的目标函数为:
将损失函数分解为二阶泰勒级数使得目标函数变为如下形式:
其中,为第t次迭代的目标函数,/>为损失函数,/>为样本i的实际值,/>为“前t-1棵决策树”对样本i的预测值,是将前t-1棵决策树中的每棵决策树的预测值相加得到的,/>为“第t棵决策树”对样本i的预测值,/>为第i个样本的特征值,/>为惩罚项,where为区域,/>为叶子的个数,/>为一棵树的叶子节点数量,/>为特征值,/>为叶子节点输出值组成的向量,/>为损失函数的一阶导,/>,/>为损失函数的二阶导,/>,/>为平方损失函数。
4.一种计算设备,其特征在于,包括:处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-2任一项所述的方法的步骤。
5.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-2任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310698773.0A CN116451874B (zh) | 2023-06-14 | 2023-06-14 | 一种城市用水量预测方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310698773.0A CN116451874B (zh) | 2023-06-14 | 2023-06-14 | 一种城市用水量预测方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116451874A CN116451874A (zh) | 2023-07-18 |
CN116451874B true CN116451874B (zh) | 2023-09-05 |
Family
ID=87135877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310698773.0A Active CN116451874B (zh) | 2023-06-14 | 2023-06-14 | 一种城市用水量预测方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116451874B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117514733A (zh) * | 2023-11-17 | 2024-02-06 | 嵊州市铭动电子科技有限公司 | 一种水泵控制方法、装置、设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107977735A (zh) * | 2017-11-15 | 2018-05-01 | 河海大学 | 一种基于深度学习的城市日用水量预测方法 |
KR20210049006A (ko) * | 2019-10-24 | 2021-05-04 | 한국전자기술연구원 | 스마트시티 물수요 예측 방법 |
CN113033611A (zh) * | 2021-02-25 | 2021-06-25 | 东北大学 | 一种电机轴承数据采集与故障诊断系统 |
CN114757330A (zh) * | 2022-01-06 | 2022-07-15 | 西安理工大学 | 基于lstm的城市瞬时用水量预测方法 |
CN114792169A (zh) * | 2022-05-13 | 2022-07-26 | 遥相科技发展(北京)有限公司 | 基于MIC-XGBoost算法的居民用水量预测方法 |
CN116151409A (zh) * | 2022-10-12 | 2023-05-23 | 平行数字科技(江苏)有限公司 | 基于神经网络的城市日需水量预测的方法 |
-
2023
- 2023-06-14 CN CN202310698773.0A patent/CN116451874B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107977735A (zh) * | 2017-11-15 | 2018-05-01 | 河海大学 | 一种基于深度学习的城市日用水量预测方法 |
KR20210049006A (ko) * | 2019-10-24 | 2021-05-04 | 한국전자기술연구원 | 스마트시티 물수요 예측 방법 |
CN113033611A (zh) * | 2021-02-25 | 2021-06-25 | 东北大学 | 一种电机轴承数据采集与故障诊断系统 |
CN114757330A (zh) * | 2022-01-06 | 2022-07-15 | 西安理工大学 | 基于lstm的城市瞬时用水量预测方法 |
CN114792169A (zh) * | 2022-05-13 | 2022-07-26 | 遥相科技发展(北京)有限公司 | 基于MIC-XGBoost算法的居民用水量预测方法 |
CN116151409A (zh) * | 2022-10-12 | 2023-05-23 | 平行数字科技(江苏)有限公司 | 基于神经网络的城市日需水量预测的方法 |
Non-Patent Citations (1)
Title |
---|
城市供水系统的优化调度模型研究;崔建国, 王俊岭;太原理工大学学报(第03期);1-5 * |
Also Published As
Publication number | Publication date |
---|---|
CN116451874A (zh) | 2023-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110969290B (zh) | 一种基于深度学习的径流概率预测方法及系统 | |
Yuan et al. | Conditional style-based generative adversarial networks for renewable scenario generation | |
CN101551884B (zh) | 面向大规模样本的cvr电力负荷快速预测方法 | |
CN116451874B (zh) | 一种城市用水量预测方法、装置及设备 | |
Buturache et al. | Wind energy prediction using machine learning | |
Dannecker et al. | Context-aware parameter estimation for forecast models in the energy domain | |
CN112348287A (zh) | 基于lstm分位数回归的电力系统短期负荷概率密度预测方法 | |
CN114580691A (zh) | 燃气使用需求的预测方法、装置、计算机设备及存储介质 | |
CN114362175A (zh) | 基于深度确定性策略梯度算法的风电功率预测方法及系统 | |
CN115034430A (zh) | 碳排放量预测方法、装置、终端及存储介质 | |
Cramer et al. | Validation methods for energy time series scenarios from deep generative models | |
CN111815039A (zh) | 基于天气分类的周尺度风电功率概率预测方法及系统 | |
Zhang et al. | Application of decision trees to the determination of the year-end level of a carryover storage reservoir based on the iterative dichotomizer 3 | |
Vogt et al. | Wind power forecasting based on deep neural networks and transfer learning | |
Li | Energy consumption forecasting with deep learning | |
CN105894138A (zh) | 一种制造业发货量的最优加权组合预测方法 | |
CN117390550A (zh) | 考虑排放训练集的低碳园区碳排放动态预测方法及系统 | |
CN116341753A (zh) | 一种使用机器学习对区域二氧化碳排放预测的方法 | |
Tang et al. | LASSO-based single index model for solar power generation forecasting | |
CN115687955A (zh) | 基于投票表决的居民用户负荷曲线聚类方法及装置 | |
Rebei et al. | FSNet: A hybrid model for seasonal forecasting | |
CN114548212A (zh) | 一种水质评价方法及系统 | |
CN114781685A (zh) | 基于大数据挖掘技术的大用户用电负荷预测方法及系统 | |
CN113011779A (zh) | 一种基于模糊综合评价的能源消费价格补偿方法及装置 | |
CN111079995A (zh) | 电力负荷非线性调和综合预测方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CB03 | Change of inventor or designer information |
Inventor after: Gao Zhenyu Inventor after: Wu Qifeng Inventor after: Wang Yan Inventor before: Lin Weibin Inventor before: Gao Zhenyu Inventor before: Wu Qifeng Inventor before: Wang Yan |
|
CB03 | Change of inventor or designer information |