CN116862071B - 基于混频模型的城市运行指标数据预测方法 - Google Patents

基于混频模型的城市运行指标数据预测方法 Download PDF

Info

Publication number
CN116862071B
CN116862071B CN202310884398.9A CN202310884398A CN116862071B CN 116862071 B CN116862071 B CN 116862071B CN 202310884398 A CN202310884398 A CN 202310884398A CN 116862071 B CN116862071 B CN 116862071B
Authority
CN
China
Prior art keywords
value
index
prediction
variable
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310884398.9A
Other languages
English (en)
Other versions
CN116862071A (zh
Inventor
洪辉阳
杨晓庆
李中英
王邵辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Bosheng Technology Co ltd
Original Assignee
Hangzhou Bosheng Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Bosheng Technology Co ltd filed Critical Hangzhou Bosheng Technology Co ltd
Priority to CN202310884398.9A priority Critical patent/CN116862071B/zh
Publication of CN116862071A publication Critical patent/CN116862071A/zh
Application granted granted Critical
Publication of CN116862071B publication Critical patent/CN116862071B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A30/00Adapting or protecting infrastructure or their operation
    • Y02A30/60Planning or developing urban green infrastructure

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于混频模型的城市运行指标数据预测方法,属于数据分析技术领域。本发明为提高对城市运行数据的预测效率,并兼顾预测准确度,考虑了城市运行数据预测单模型间的共同输入数据与单模型的其他输入数据的相关性,减少了单模型输入数据,缩短了模型预测时间,并通过量化减少共同输入数据后对模型预测结果准确度的影响程度,并根据量化结果对模型预测结果进行校正,在减少模型输入数据的同时确保了模型对于城市运行数据的预测准确率。

Description

基于混频模型的城市运行指标数据预测方法
技术领域
本发明涉及数据预测技术领域,具体涉及一种基于混频模型的城市运行指标数据预测方法。
背景技术
城市运行数据包括机场旅客吞吐量、工业用电量、航班架次、集装箱量、港口吞吐量、机场货邮量等数据,利用预训练的预测模型,以这些数据全部或部分为第一预测模型的输入,可以对城市运行的相关指标进行预测,比如以历史连续n月的工业用电量、居民用电量、A变量等来预测未来月的用电负载,以历史n月的机场旅客吞吐量、航班架次、A变量等来预测未来月的客流负载,以历史n月的的集装箱量、港口吞吐量、机场货邮量、A变量等来预测未来月的货运负载,然后以预测的用电负载、客流负载、货运负载为第二预测模型的输入来预测未来月的城市负载。
上述方案中,用电负载、客流负载、货运负载的预测模型通常并不相同,3个预测模型中的每个模型可能还包括单变量模型和多变量模型,这些模型的输入数据、模型参数、预测过程通常也大有不同。一般而言,模型的输入数据越多,模型预测需要提取的数据特征越多,预测过程越复杂,耗时也越长。但在预测城市运行数据时,不同的单独模型预测不同的变量有时具有相同的模型输入数据,比如在预测用电负载、客流负载和货运负载时,A变量的变量值同时作为3个负载预测的模型输入数据。当3个负载预测具有的共同输入数据为大量时,会出现以下技术问题:
1、现有方法中,当需要预测用电负载、客流负载和货运负载的上级指标比如城市负载时,用电负载、客流负载和货运负载分别对应的3个预测模型会对这些共同输入数据进行单独预测,预测时间会被拉长,3个负载预测的拉长时间综合起来,城市负载的预测时间更为拉长,导致城市负载的预测效率无法达到预期,当单预测模型数量远不止3个时,对于城市运行数据预测的该弊端将更加明显。但通常而言,这些共同输入数据与单独模型的其他输入数据之间具有数据相关性,这个相关性会直接影响模型预测结果的准确性,不同程度的相关性对预测结果的准确性的影响程度通常也不相同,现有方法在预测城市运行数据时没有利用这个相关性来减少模型输入数据量以缩短预测时间,因此如何明确这个相关性以缩短预测时间成为城市运行数据预测技术领域亟待解决的一个技术问题;
2、利用上述的相关性能够减少模型输入的数据量进而缩短预测时间,但减少模型输入数据量后,如何量化减少共同输入数据后对模型预测准确度的影响程度,并根据量化结果对模型预测结果进行校正,以保证模型预测结果的准确性成为城市运行数据预测技术领域亟待解决的第二个技术问题。
发明内容
本发明以考虑城市运行数据预测单模型间的共同输入数据与单模型的其他输入数据的相关性,以减少单模型输入数据,缩短模型预测时间,并通过量化减少共同输入数据后对模型预测结果准确度的影响程度,并根据量化结果对模型预测结果进行校正,以在减少模型输入数据的同时保证模型对于城市运行数据的预测准确率为目的,提供了一种基于混频模型的城市运行指标数据预测方法。
为达此目的,本发明采用以下技术方案:
提供一种基于混频模型的城市运行指标数据预测方法,步骤包括:
S1,获取城市运行数据;
S2,判断用户输入的因变量是否具有子因变量,
若是,则获取历史求解每个所述子因变量对应的自变量集合并转入城市运行数据校正预测流程;
若否,则终止进入城市运行数据校正预测流程;
所述校正预测流程具体包括步骤:
L1,提取历史预测每个所述子因变量时输入的所述自变量集合中的每个共同预测指标;
L2,进一步提取每个所述共同预测指标对应的突变距离值
L3,获取所述突变距离值对应的所述共同预测指标的第一指标值;
L4,从步骤S1获取的所述城市运行数据中获取对应的所述共同预测指标的第二指标值;
L5,判断关联同个所述共同预测指标的所述第二指标值与所述第一指标值的差值绝对值是否小于预设的第一差值阈值,
若是,则判定步骤S1获取的所述城市运行数据中所包含的所述共同预测指标不可被舍弃;
若否,则在预测所述子因变量yx时过滤掉所述共同预测指标并使用校正策略校正所述混频模型预测的所述子因变量yx的变量值。
作为优选,步骤L2中,所述共同预测指标对应的所述突变距离值通过以下方法步骤计算而得:
L21,获取利用yx对应的多变量混频模型计算所需的作为模型输入的定量/>和变量集合/>
L22,将所有定量和变量集合/>中的一个元素组成输入数据组合,将各个组合依次作为所述子因变量yx对应的所述多变量混频模型的输入,模型预测输出每个组合对应的yx值,每个组合中的元素的值不同;
L23,在同一平面坐标系内,绘制和/>曲线;
L24,计算曲线上具有对称关系的数据点p和q之间的距离值/>并将最大/>值作为所述突变距离值/>
作为优选,所述定量和所述变量/>的获取方法包括如下步骤:
L211,获取用于预测所述子因变量yx的变量值的所述混频模型;
L212,判断步骤L211获取的所述混频模型是否包括所述多变量混频模型,
若是,则转入步骤L213;
若否,则终止的计算流程;
L213,从步骤S1获取的所述城市运行数据中提取用于预测所述子因变量yx所需的所述自变量集合中的每个所述自变量对应的指标值,包括记为的所述共同预测指标的指标值和记为/>的除所述共同预测指标外的其他自变量j的指标值;
L214,获取所述共同预测指标在各模型历史预测各所述子因变量时的指标值集合X=1,…,x,…n,n表示子因变量的数量,x表示第x个子因变量。
作为优选,所述混频模型包括单变量混频模型和/或所述多变量混频模型,每个所述单变量混频模型以所述子因变量yx对应的所述自变量集合中的对应的所述自变量为输入,所述多变量混频模型以所述自变量集合中的所有所述自变量为输入。
作为优选,步骤L5中,校正所述子因变量yx的值的所述校正策略具体包括如下步骤:
A1,获取所述子因变量yx对应的校正量;
A2,判断步骤S1获取的所述城市运行数据中除所述共同预测指标外的其他自变量j的指标值是否落入模型针对所述子因变量yx的预测值的单调递增区间,
若是,则计算所述混频模型以过滤掉步骤S1获取的所述城市运行数据中的所述共同预测指标后剩余的其他所述自变量j的指标值为输入得到的预测结果/>与所述校正量的和值作为预测校正结果;
若否,则计算与所述校正量的差值作为预测校正结果。
作为优选,步骤A1中的所述校正量通过如下方法步骤计算而得:
A11,提取历史每次用于预测所述子因变量yx的自变量集合中的每个自变量的变量值,其中,集合/>中的所述共同预测指标的变量值记为/>其他变量的变量值记为i表示历史第i次预测所述子因变量yx
A12,将中的所有所述自变量的变量值输入到用于预测yx的所述混频模型中,模型输出第一预测值/>
并过滤掉中的变量值/>后,将/>中剩余的各所述自变量的变量值/>输入到用于预测yx的所述混频模型中,模型输出第一预测值/>
A13,计算与/>的差值绝对值,记为/>
A14,对于针对所述子因变量yx的历史每次预测数据计算的每个计算/>的平均值/>作为以步骤S1获取的所述城市运行数据为依据预测所述子因变量yx的变量值的所述校正量。
作为优选,步骤A2中,判断步骤S1获取的所述城市运行数据中除所述共同预测指标外的其他自变量j的指标值是否落入模型针对所述子因变量yx的预测值的单调递增区间的方法具体包括如下步骤:
A21,以模型历史预测所述子因变量yx的各所述自变量集合中的为变量,查表得到的/>为定量,利用yx对应的所述混频模型预测输出剩余变量集合/>对应的yx值,所述剩余变量集合/>为当前次预测中历史的所述自变量集合中除所述共同预测指标的指标值/>外的各变量/>的集合;
A22,绘制曲线,并截取该曲线中的每一单调递增区间;
A23,提取每一所述单调递增区间内的最大yx值与最小yx值分别对应的集合中的每个自变量的变量值/>得到/>中的单调递增集合变量值范围;
A24,判断步骤S1获取的所述城市运行数据中的用于预测yx值的除所述共同预测指标外的其他每个自变量j的指标值是否落入所述单调递增集合变量值范围,
若是,则判定步骤S1获取的所述城市运行数据中除所述共同预测指标外的其他自变量j的指标值落入到模型针对所述子因变量yx的预测值的所述单调递增区间内;
若否,则判定未落入所述单调递增区间内。
作为优选,查表得到定量的方法包括步骤:
A211,查表得到步骤S1中获取的所述城市运行数据中的所述共同预测指标的指标值落入的指标值范围;
A212,查表得到所述指标值范围对应的定量
作为优选,所述指标值范围通过以下方法步骤划分:
B1,计算历史每次预测yx值时的所述共同预测指标的指标值与指标值两两之间的第一差值绝对值;
B2,判断步骤B1计算的所有第一差值绝对值是否小于预设的第二差值阈值,
若是,则计算历史预测yx值时的所述共同预测指标的最大指标值与最小指标值的差值,并计算所述差值与历史预测yx值时的所述共同预测指标的指标值的数量的比值作为所述指标值范围的第一划分间距,以对所述最小指标值和所述最大指标值之间的数值范围进行划分;
若否,则对历史每次预测yx值时的所述共同预测指标的指标值由小到大进行排列,并按照排列顺序计算两两指标值间的第二差值绝对值,然后查表得到每个所述第二差值绝对值分别对应的第二划分间距,并以所述第二划分间距对对应的两两指标值间的数值范围进行划分。
本发明具有以下有益效果:
1、根据历史预测数据,预先计算用于预测相应城市运行数据的每个子因变量分别对应的单独模型的共同预测指标(共同输入数据)对应的突变距离值来表征该共同预测指标与对应的单独模型的其他自变量间对于影响该单独模型的预测结果准确性的相关性,/>的计算依据是以共同预测指标的指标值集合/>中的元素为变量,以其他自变量的指标值/>为定量,在同一平面坐标系内绘制的/>和/>曲线上的具有对称关系的数据点p和q,当p和q之间的距离值/>最大时,将最大/>值作为突变距离值/> 表征共同预测指标与输入到预测模型的其他自变量的相关性时,不需要考虑城市运行数据预测模型的类型、不需要考虑各个模型不同且复杂的内部预测算法,值越大,表示在/>对应集合/>中的元素的元素值以及其他自变量的指标值在定量/>下,该共同预测指标在其他自变量的指标值为定量/>时,对于模型预测结果的准确性的影响具有强相关性,此时只要获取到的城市运行数据中的该共同预测指标的指标值落入到/>对应集合/>中的具体元素的元素值区间范围外,其他自变量的指标值又落入到对应的/>值区间范围内,则判定该共同预测指标在模型预测时是可舍弃的,舍弃掉共同预测指标后,减少了模型输入数据,提高了模型预测效率。
2、当舍弃掉共同预测指标后,通过预设的校正策略量化舍弃掉共同预测指标后对模型预测结果准确性的影响程度,并根据量化结果对模型预测结果进行校正,在减少模型输入数据提升模型预测效率的同时保证了模型预测结果的准确度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍。显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的基于混频模型的城市运行指标数据预测方法的实现步骤图;
图2是计算突变距离值的示意图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本专利的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若出现术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
在本发明的描述中,除非另有明确的规定和限定,若出现术语“连接”等指示部件之间的连接关系,该术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个部件内部的连通或两个部件的相互作用关系。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
本发明实施例提供的基于混频模型的城市运行指标数据预测方法,如图1所示,包括步骤:
S1,获取城市运行数据,包括机场旅客吞吐量、工业用电量、航班架次、集装箱量、港口吞吐量、机场货邮量等数据;
S2,判断用户输入的因变量是否具有子因变量,
若是,则获取历史求解每个子因变量对应的自变量集合并转入城市运行数据校正预测流程;
若否,则终止进入城市运行数据预测流程;
比如,对于城市运行数据,具有2级预测指标,第一级指标假设为预测“城市负载”,这个“城市负载”为预测城市运行数据的因变量;第二级指标假设包括“用电负载”“货运负载”和“客流负载”,“用电负载”“货运负载”和“客流负载”为“城市负载”这一因变量的子因变量;预测“用电负载”这一子因变量,比如需要“企业工业用电量”“居民用电量”“A指标”3个自变量作为用电负载预测模型的输入数据,预测“货运负载”这一子因变量,比如需要“集装箱量”“港口吞吐量”“机场货邮量”“A指标”这4个自变量作为货运负载预测模型的输入数据,预测“客流负载”这一子因变量,比如需要“机场旅客吞吐量”“航班架次”“A指标”这3个自变量作为客流负载预测模型的输入数据。则当用户输入的因变量为“城市负载”时,由于该因变量具有“用电负载”“货运负载”和“客流负载”的子因变量,则在步骤S2中转入城市运行数据校正预测流程;而若用户输入的因变量比如为“用电负载”,由于“用电负载”这一因变量不具有子因变量,则步骤S2中终止城市运行数据校正预测流程。
现有方案中,针对城市运行数据的各级指标值的预测通常采用如下方法:
比如需要预测“城市负载”这一因变量的值,则首先预测该因变量下的每一子因变量的值,比如分别通过用电负载预测模型、货运负载预测模型、客流负载预测模型来对应预测用电负载、货运负载和客流负载,然后再综合用电负载、货运负载和客流负载预测结果形成为对城市负载的最终预测结果。
上述的现有方法存在如下几个缺陷:
1、城市运行数据预测的子因变量非常多,在特殊的城市运行数据预测场景下,需要预测的子因变量有时达到几十甚至几百个,而为了提高对每个子因变量的变量值的预测准确性,通常针对每个子因变量构建单独的预测模型,但在预测每个子因变量时,每个预测模型可能存在大量的共同输入数据(共同预测指标),也就是说,每个单独的模型都需要对这些共同输入数据分别进行单独的数据预测,这增加了城市运行数据预测的时间,且当单独模型数量庞大或者共同输入数据大量时,预测时间增加的更为明显。
根据反复实验总结,发现这些共同输入数据与单独模型的其他作为输入数据的自变量间存在数据相关性,当相关性较弱时,舍弃掉共同输入数据对相应模型的预测结果的影响较低,反之影响较高。因此当存在大量的单独模型且存在大量的共同输入数据时,若能舍弃掉相关性较低的共同输入数据,便能够大幅提升城市运行数据预测的效率。但这个相关性怎么表征,相关性高低如何确定成为城市运行数据预测技术领域亟待解决的第一个技术问题。
2、相关性较低的共同输入数据舍弃后,虽对城市运行数据预测结果的准确性影响较低,但不可避免的影响了预测结果的准确性,因此,在舍弃掉相关性较低的共同输入数据提升模型预测效率的同时,如何确保模型预测结果的准确性成为城市运行数据预测技术领域亟待解决的第二个技术问题。
本发明实施例针对城市运行数据,通过以下校正预测流程来解决上述两个技术问题:
城市运行数据校正预测流程具体包括如下步骤:
L1,提取历史预测每个子因变量时输入的自变量集合中的每个共同预测指标,比如当需要预测“城市负载”这一因变量时,提取“用电负载”“货运负载”“客流负载”这3个子因变量分别对应的自变量集合中的共同预测指标——A指标;
L2,进一步提取每个共同预测指标对应的突变距离值
本实施例中,以突变距离值来表征预测子因变量所需的自变量集合中的共同预测指标与其他同时作为模型输入数据的自变量间对于确保预测结果准确性的相关性。通过如下方法步骤计算而得:
L21,获取利用子因变量yx(表示因变量下的第x个子因变量)对应的多变量混频模型计算所需的作为模型输入的定量/>和变量/>定量/>和变量/>的获取方法具体包括如下步骤:
L211,获取用于预测子因变量yx的变量值的混频模型;
L212,判断步骤L211获取的混频模型是否包括多变量混频模型,
若是,则转入步骤L213;
若否,则终止的计算流程;
这里需要说明的,本实施例中,预测城市运行数据采用的是混频模型。为了确保对城市运行数据的预测准确性,更优选地,在预测每个因变量以及因变量下的每个子因变量的变量值时,混频模型包括单变量混频模型和多变量混频模型,比如,预测“用电负载”这一因变量时,优选采用4个混频模型,分别为以工业用电量为单独数据输入的第一单变量混频模型,以居民用电量为单独数据输入的第二单变量混频模型,以A指标为单独数据输入的第三单变量混频模型,以工业用电量、居民用电量、A指标为共同输入的多变量混频模型,最终将第一单变量混频模型、第二单变量混频模型、第三单变量混频模型和多变量混频模型的预测结果进行加权求和得到用电负载的预测结果。因此,当用于预测子因变量yx的变量值的混频模型不包括多变量混频模型时,无法计算共同预测指标与其他自变量对模型预测结果准确度影响的相关性,所以在步骤L212中,需要判断用于预测子因变量yx的变量值的混频模型是否包括多变量混频模型。
L213,从步骤S1获取的城市运行数据中提取用于预测子因变量yx所需的自变量集合中的每个自变量对应的指标值,包括记为的共同预测指标的指标值和记为/>的除共同预测指标外的其他自变量j的指标值;比如子因变量yx为“用电负载”,预测yx所需的自变量集合中的元素包括工业用电量、居民用电量、A指标,其中A指标为预测其他子因变量所需的共同预测指标,步骤S1中获取的城市运行数据中的A指标的指标值记为/>预测yx所需的自变量集合中的工业用电量、居民用电量的指标值记为/> 表示预测子因变量yx所需的除共同预测指标外的第j个自变量的指标值;
L214,获取共同预测指标在各模型历史预测各子因变量时的指标值集合X=1,…,x,…n,n表示子因变量的数量,x表示第x个子因变量。
获取到利用yx对应的多变量混频模型计算所需的作为模型输入的定量/>和变量集合/>后,/>的计算过程转入步骤:
L22,将所有定量和变量集合/>中的一个元素组成输入数据组合,将各个组合依次作为子因变量yx对应的多变量混频模型的输入,模型预测输出每个组合对应的yx值,每个组合中的元素的值不同;
这里需要强调的是,所有定量从步骤S1获取的城市运行数据中提取得到,这些定量/>在预测每个组合对应(等同每个元素对应)对应的yx值时,每次都作为yx对应的多变量混频模型的输入,不同的是,每次预测时,抽取集合/>中的不同元素同时作为模型输入。这里还需要说明的是,集合/>中的元素是预测不同子因变量时不同混频模型的历史输入数据,这些元素的值不是人造的数据,在预测不同的子因变量的值时,构成模型输入数据的自变量集合中的/>值与步骤L22中的/>值通常是不相同的。步骤L22中,以从步骤S1获取的城市运行数据中提取的/>值为定量,以历史预测不同子因变量时的共同预测指标的不同指标值为变量,利用yx对应的多变量混频模型进行多次的yx值预测,扩充了模型输入数据,一定程度上验证了多变量混频模型的有效性,也有利于提升yx对应的多变量混频模型的性能。
L23,在同一平面坐标系内,绘制如图2所示的和/>曲线;曲线以集合/>中的元素为xy轴坐标系的横轴坐标,以模型预测的yx值为纵轴坐标,/>曲线反之,两条曲线的绘制前提是,除共同预测指标外,模型的其他输入数据相同,输入数据的值也相同;
L24,计算和/>曲线上具有对称关系的数据点p和q之间的距离值/>并将最大/>值作为突变距离值/>
以突变距离值来表征/>与/>对模型预测结果准确性的相关程度的理论依据为:对于城市运行数据的预测,我们发现,当模型的所有输入数据的值同时变化时,模型的预测结果变化规律通常不可循且存在较大差异,但当模型的某个输入数据为变量,其他输入数据为定量时,模型的预测结果变化规律在某些区间范围内是相对可循的,比如在某个变量值区间范围内呈现相对平缓的类似线性变化。当模型的预测结果从某一输入数据区间进入另一输入数据区间存在突变时,认为这个输入变量与其他输入定量存在强相关性,此时该输入变量在模型预测时不可被舍弃,否则会严重影响模型预测结果的准确度,且由于预测结果突变值较大,预测结果在该位点的非线性程度越高,舍弃该输入变量后也难以找到有效的校正方法来校正模型预测结果。突变距离值/>的计算采用曲线倒置的方法,/>能够非常理想的表征出共同预测指标与其他输入数据间的强相关性,当步骤S1获取的城市运行数据中提取的共同预测指标的指标值与该/>对应的指标值的差值绝对值小于预设的差值阈值时,即认定该共同预测指标与其他输入数据之间具有强相关关系,不能被舍弃。/>的计算方法非常简单,计算速度很快,相比较不舍弃共同预测指标通过每个单独模型来预测相应的子因变量的变量值的方式,大幅提升了因变量的预测速度。
获取到每个共同预测指标对应的突变距离值后,城市运行数据校正预测流程转入步骤:
L3,获取突变距离值对应的共同预测指标的第一指标值;
L4,从步骤S1获取的城市运行数据中获取对应的共同预测指标的第二指标值;
L5,判断关联同个共同预测指标的第二指标值与第一指标值的差值绝对值是否小于预设的第一差值阈值,
若是,则判定该共同预测指标与用于预测子因变量yx的其他输入数据具有强相关性,不可被舍弃,将第二指标值作为混频模型预测子因变量yx的指标;
若否,则在预测子因变量yx时过滤掉该共同预测指标并使用校正策略校正混频模型预测的子因变量yx的变量值。
步骤L5中,校正子因变量yx的值的校正策略具体包括如下步骤:
A1,获取子因变量yx对应的校正量;
yx对应的校正量通过如下方法步骤计算而得:
A11,提取历史每次用于预测该子因变量yx的自变量集合中的每个自变量的变量值,其中,集合/>中的共同预测指标的变量值记为/>其他变量的变量值记为/>i表示历史第i次预测子因变量yx
A12,将中的所有自变量的变量值输入到用于预测yx的混频模型中,模型输出第一预测值/>
并过滤掉中的变量值/>后,将/>中剩余的各自变量的变量值/>输入到用于预测yx的混频模型中,模型输出第一预测值/>
A13,计算与/>的差值绝对值,记为/>
A14,对于针对子因变量yx的历史每次的预测数据计算的每个计算/>的平均值/>作为以步骤S1获取的城市运行数据为依据预测子因变量yx的变量值的校正量。
获取子因变量yx对应的校正量后,校正子因变量yx的变量值的校正策略转入步骤:
A2,判断步骤S1获取的城市运行数据中除共同预测指标外的其他自变量j的指标值是否落入模型针对子因变量yx的预测值的单调递增区间,
若是,则计算混频模型以过滤掉步骤S1获取的城市运行数据中的共同预测指标后剩余的其他自变量j的指标值为输入得到的预测结果/>与步骤A1获取的校正量的和值作为预测校正结果;
若否,则计算与校正量的差值作为预测校正结果。
步骤A2中,判断步骤S1获取的城市运行数据中除共同预测指标外的其他自变量j的指标值是否落入模型针对子因变量yx的预测值的单调递增区间的方法具体包括如下步骤:
A21,查表得到步骤S1中获取的城市运行数据中的共同预测指标的指标值落入的指标值范围,比如步骤S1中获取的共同预测指标为A指标,A指标的指标值比如为用电量100000度,其落入的指标值范围比如为100000-120000度;
A22,查表得到指标值范围对应的定量比如查表得到指标值范围100000-120000度对应的定量/>为110000度;
A23,以模型历史预测子因变量yx的各自变量集合中的为变量,/>为定量,利用yx对应的混频模型预测输出剩余变量集合/>对应的yx值,剩余变量集合为当前次预测中历史的自变量集合中除共同预测指标的指标值/>外的各变量/>的集合;/>
这里需要说明的是,不直接以步骤S1中获取的城市运行数据中的共同预测指标的指标值作为步骤A23中预测yx值的定量,是因为在历史预测yx值时,该共同预测指标的指标值通常都是不同的,步骤S1获取的城市运行数据中的共同预测指标的指标值与历史预测yx值时的该共同预测指标的各指标值越接近,在步骤A24中绘制的曲线越具代表性,越能反映出在共同预测指标的指标值为定量的条件下,/>与yx值间的关系变化(单调递增或单调递减)特性。但如何表征步骤S1获取的城市运行数据中的共同预测指标的指标值与历史预测yx值时的该共同预测指标的各指标值的接近程度成为城市运行数据预测中需要解决的一个难题。
本实施例中,通过制定共同预测指标的指标值范围表,并赋予表中的每个指标值范围一个相对应的定量当步骤S1获取到的共同预测指标的指标值落入相应的指标值范围时,通过事先构建的相对关系,可以快速找到步骤S1获取到的共同预测指标的指标值所对应的定量/>
能否映射准确与指标值范围的划分是否科学直接相关,本实施例中,指标值范围的划分方法为:
计算历史每次预测yx值时的共同预测指标的指标值与指标值两两之间的第一差值绝对值,比如,历史5次预测yx值,共同预测指标的指标值分别为100、120、160、180、210,则指标值与指标值两两之间的差值绝对值分别为:120-100=20、160-100=60、180-100=80、210-100=110、160-120=40、180-120=60、210-120=90、180-160=20、210-160=50、210-180=30;
判断所计算的所有第一差值绝对值是否小于预设的第二差值阈值,
若是,则计算最大指标值与最小指标值的差值,并计算该差值与历史预测yx值时的共同预测指标的指标值的数量的比值作为指标值范围的第一划分间距,以对最小指标值和最大指标值之间的数值范围进行划分;比如,上述的最小指标值和最大指标值分别为100、210,指标值数量为5个,则划分间距为
若否,则对历史每次预测yx值时的共同预测指标的指标值由小到大进行排列,并按照排列顺序计算两两指标值间的第二差值绝对值,然后查表得到每个第二差值绝对值分别对应的第二划分间距,并以第二划分间距对对应的两两指标值间的数值范围进行划分;比如历史预测yx值时的共同预测指标的指标值分别为100、200、500、900、1500,则200与100的第二差值绝对值为100,1500与900的第二差值绝对值为600,若第二差值绝对值为100时,为其预设的对应的第二划分间距为20,则以20为划分间距对100-200之间的数值范围进行划分;若为第二差值绝对值600预设的第二划分间距为100时,则对900-1500之间的数值范围按照100的划分间距进行划分。
A24,绘制曲线,并截取该曲线中的每一单调递增区间;/>
需要强调的是,曲线的绘制以/>为模型预测yx值的输入定量,以集合/>为输入变量,/>即历史第i次预测yx值时自变量集合中除共同预测指标的指标值/>外的各变量/>的集合。
A25,提取每一单调递增区间内的最大yx值与最小yx值分别对应的集合中的每个自变量的变量值/>得到/>的单调递增集合变量值范围;
这里需要说明的是,单调递增集合变量值范围是一个集合变量值范围的概念,比如曲线上的某一单调递增区间的最大yx值和最小yx值分别为200、100,200的yx值比如对应的输入变量为第一集合/>第一集合/>中的自变量比如包括P1、P2、P3三个自变量,P1、P2、P3变量值分别为V1P1、V1P2、V1P3,100的yx值比如对应的输入变量为第二集合/>第二集合/>中的自变量P1、P2、P3三个自变量的变量值分别为V2P1、V2P2、V2P3,则/>在100-200的yx值的单调递增区间范围内,单调递增集合变量值范围为:(P1(V2P1-V1P1)、P2(V2P2-V1P2)、P3(V2P3-V1P3))
A26,判断步骤S1获取的城市运行数据中的用于预测yx值的除共同预测指标外的其他每个自变量j的指标值是否落入单调递增集合变量值范围,
若是,则判定步骤S1获取的城市运行数据中除共同预测指标外的其他自变量j的指标值落入到模型针对子因变量yx的预测值的单调递增区间内;
若否,则判定未落入单调递增区间内。
具体而言,判定是否落入单调递增区间比如为:步骤S1获取的城市运行数据中,用于预测yx值的3个自变量P1、P2、P3均对应落入到V2P1-V1P1、V2P2-V1P2、V2P3-V1P3区间范围内,则判定落入到的yx值为100-200的单调递增区间范围内。
综上,本发明为提高对城市运行数据的预测效率,并兼顾预测准确度,考虑了城市运行数据预测单模型间的共同输入数据与单模型的其他输入数据的相关性,减少了单模型输入数据,缩短了模型预测时间,并通过量化减少共同输入数据后对模型预测结果准确度的影响程度,并根据量化结果对模型预测结果进行校正,在减少模型输入数据的同时确保了模型对于城市运行数据的预测准确率。
需要声明的是,上述具体实施方式仅仅为本发明的较佳实施例及所运用技术原理。本领域技术人员应该明白,还可以对本发明做各种修改、等同替换、变化等等。但是,这些变换只要未背离本发明的精神,都应在本发明的保护范围之内。另外,本申请说明书和权利要求书所使用的一些术语并不是限制,仅仅是为了便于描述。

Claims (6)

1.一种基于混频模型的城市运行指标数据预测方法,其特征在于,步骤包括:
S1,获取城市运行数据;
S2,判断用户输入的因变量是否具有子因变量,
若是,则获取历史求解每个所述子因变量对应的自变量集合并转入城市运行数据校正预测流程;
若否,则终止进入城市运行数据校正预测流程;
所述校正预测流程具体包括步骤:
L1,提取历史预测每个所述子因变量时输入的所述自变量集合中的每个共同预测指标;
L2,进一步提取每个所述共同预测指标对应的突变距离值
L3,获取所述突变距离值对应的所述共同预测指标的第一指标值;
L4,从步骤S1获取的所述城市运行数据中获取对应的所述共同预测指标的第二指标值;
L5,判断关联同个所述共同预测指标的所述第二指标值与所述第一指标值的差值绝对值是否小于预设的第一差值阈值,
若是,则判定步骤S1获取的所述城市运行数据中所包含的所述共同预测指标不可被舍弃;
若否,则在预测所述子因变量yx时过滤掉所述共同预测指标并使用校正策略校正所述混频模型预测的所述子因变量yx的变量值;
步骤L2中,每个所述共同预测指标对应的所述突变距离值通过以下方法步骤计算而得:
L21,获取yx对应的多变量混频模型的模型输入数据,包括定量的指标值和变量集合中的各元素的指标值;
L22,将所有定量和变量集合/>中的每一个单独元素组成输入数据组合,将各个组合依次作为所述子因变量yx对应的所述多变量混频模型的输入,模型预测输出每个组合对应的yx值,每个组合中的元素的值不同;
L23,在同一平面坐标系内,绘制和/>曲线,/>曲线以集合/>中的元素为xy轴坐标系的横轴坐标,以模型预测的yx值为纵轴坐标,曲线以模型预测的yx值为xy轴坐标系的横轴坐标,以集合/>中的元素为纵轴坐标,两条曲线的绘制前提是,除共同预测指标外,模型的其他输入数据相同,输入数据的值也相同;
L24,计算和/>曲线上具有对称关系的数据点p和q之间的距离值/>并将最大/>值作为所述突变距离值/>
步骤L5中,校正所述子因变量yx的值的所述校正策略具体包括如下步骤:
A1,获取所述子因变量yx对应的校正量;
A2,判断步骤S1获取的所述城市运行数据中除所述共同预测指标外的其他自变量j的指标值是否落入所述混频模型针对所述子因变量yx的预测值的单调递增区间,
若是,则计算所述混频模型以过滤掉步骤S1获取的所述城市运行数据中的所述共同预测指标后剩余的其他所述自变量j的指标值为输入得到的预测结果vyx与所述校正量的和值作为预测校正结果;
若否,则计算与所述校正量的差值作为预测校正结果;
所述定量和所述变量集合/>的获取方法包括如下步骤:
L211,获取用于预测所述子因变量yx的变量值的所述混频模型;
L212,判断步骤L211获取的所述混频模型是否包括所述多变量混频模型,
若是,则转入步骤L213;
若否,则终止的计算流程;
L213,从用于预测所述子因变量yx的所述自变量集合中提取出每个自变量对应的指标值,包括记为的所述共同预测指标的指标值和记为/>的除所述共同预测指标外的其他自变量j的指标值;
L214,获取所述共同预测指标在各模型历史预测各所述子因变量时的指标值集合
2.根据权利要求1所述的基于混频模型的城市运行指标数据预测方法,其特征在于,所述混频模型包括单变量混频模型和/或多变量混频模型,每个所述单变量混频模型以所述子因变量yx对应的所述自变量集合中的一个自变量为单独数据输入,所述多变量混频模型以所述自变量集合中的所有所述自变量为输入。
3.根据权利要求1所述的基于混频模型的城市运行指标数据预测方法,其特征在于,步骤A1中的所述校正量通过如下方法步骤计算而得:
A11,提取历史每次用于预测所述子因变量yx的自变量集合中的每个自变量的变量值,其中,集合/>中的所述共同预测指标的变量值记为/>其他变量的变量值记为/>i表示历史第i次预测所述子因变量yx
A12,将中的所有所述自变量的变量值输入到用于预测yx的所述混频模型中,模型输出第一预测值/>
并过滤掉中的变量值/>后,将/>中剩余的各所述自变量的变量值/>输入到用于预测yx的所述混频模型中,模型输出第一预测值/>
A13,计算与/>的差值绝对值,记为/>
A14,对于针对所述子因变量yx的历史每次预测数据计算的每个计算/>的平均值/>作为以步骤S1获取的所述城市运行数据为依据预测所述子因变量yx的变量值的所述校正量。
4.根据权利要求1所述的基于混频模型的城市运行指标数据预测方法,其特征在于,步骤A2中,判断步骤S1获取的所述城市运行数据中除所述共同预测指标外的其他自变量j的指标值是否落入模型针对所述子因变量yx的预测值的单调递增区间的方法具体包括如下步骤:
A21,以模型历史预测所述子因变量yx的各所述自变量集合中的为变量,查表得到的为定量,利用yx对应的所述混频模型预测输出剩余变量集合/>对应的yx值,所述剩余变量集合/>为当前次预测中历史的所述自变量集合中除所述共同预测指标的指标值/>外的各变量/>的集合;
A22,绘制曲线,并截取该曲线中的每一单调递增区间,所述曲线的绘制方法为:以/>为模型预测yx值的输入定量,以集合为输入变量,/>即历史第i次预测yx值时自变量集合中除共同预测指标的指标值/>外的各变量/>的集合,以/>为xy轴坐标系的横轴坐标,模型以/>为自变量时预测输出的yx为纵轴坐标绘制出/>曲线;
A23,提取每一所述单调递增区间内的最大yx值与最小yx值分别对应的集合中的每个自变量的变量值/>得到/>中的单调递增集合变量值范围;
A24,判断步骤S1获取的所述城市运行数据中的用于预测yx值的除所述共同预测指标外的其他每个自变量j的指标值是否落入所述单调递增集合变量值范围,
若是,则判定步骤S1获取的所述城市运行数据中除所述共同预测指标外的其他自变量j的指标值落入到模型针对所述子因变量yx的预测值的所述单调递增区间内;
若否,则判定未落入所述单调递增区间内。
5.根据权利要求4所述的基于混频模型的城市运行指标数据预测方法,其特征在于,查表得到定量的方法包括步骤:
A211,查表得到步骤S1中获取的所述城市运行数据中的所述共同预测指标的指标值落入的指标值范围;
A212,查表得到所述指标值范围对应的定量
6.根据权利要求5所述的基于混频模型的城市运行指标数据预测方法,其特征在于,所述指标值范围通过以下方法步骤划分:
B1,计算历史每次预测yx值时的所述共同预测指标的指标值与指标值两两之间的第一差值绝对值;
B2,判断步骤B1计算的所有第一差值绝对值是否小于预设的第二差值阈值,
若是,则计算历史预测yx值时的所述共同预测指标的最大指标值与最小指标值的差值,并计算所述差值与历史预测yx值时的所述共同预测指标的指标值的数量的比值作为所述指标值范围的第一划分间距,以对所述最小指标值和所述最大指标值之间的数值范围进行划分;
若否,则对历史每次预测yx值时的所述共同预测指标的指标值由小到大进行排列,并按照排列顺序计算两两指标值间的第二差值绝对值,然后查表得到每个所述第二差值绝对值分别对应的第二划分间距,并以所述第二划分间距对对应的两两指标值间的数值范围进行划分。
CN202310884398.9A 2023-07-18 2023-07-18 基于混频模型的城市运行指标数据预测方法 Active CN116862071B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310884398.9A CN116862071B (zh) 2023-07-18 2023-07-18 基于混频模型的城市运行指标数据预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310884398.9A CN116862071B (zh) 2023-07-18 2023-07-18 基于混频模型的城市运行指标数据预测方法

Publications (2)

Publication Number Publication Date
CN116862071A CN116862071A (zh) 2023-10-10
CN116862071B true CN116862071B (zh) 2024-02-13

Family

ID=88223227

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310884398.9A Active CN116862071B (zh) 2023-07-18 2023-07-18 基于混频模型的城市运行指标数据预测方法

Country Status (1)

Country Link
CN (1) CN116862071B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2065582A1 (de) * 2007-11-27 2009-06-03 Robert Bosch GmbH Verfahren zur Erkennung der Beladung eines Partikelfilters
CN107909182A (zh) * 2017-10-09 2018-04-13 中国电子科技集团公司第二十八研究所 一种基于回归分析的经济指标预测方法和系统
CN108804601A (zh) * 2018-05-29 2018-11-13 国网浙江省电力有限公司 电网运营监测大数据主动式分析方法及装置
CN110298496A (zh) * 2019-06-11 2019-10-01 东南大学 一种基于要素影响分析的城市对外交通量预测方法
CN113191568A (zh) * 2021-05-21 2021-07-30 上海市气象灾害防御技术中心(上海市防雷中心) 基于气象的城市运行管理大数据分析预测方法和系统
CN115049158A (zh) * 2022-08-12 2022-09-13 北京大学 城市系统运行状态的预测方法、系统、存储介质及终端
WO2023056696A1 (zh) * 2021-10-08 2023-04-13 南威软件股份有限公司 基于循环神经网络的城市轨道交通短时客流预测方法
CN116307293A (zh) * 2023-05-22 2023-06-23 北京航空航天大学 一种基于混杂感知与因果去偏的城市时空数据预测方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2065582A1 (de) * 2007-11-27 2009-06-03 Robert Bosch GmbH Verfahren zur Erkennung der Beladung eines Partikelfilters
CN107909182A (zh) * 2017-10-09 2018-04-13 中国电子科技集团公司第二十八研究所 一种基于回归分析的经济指标预测方法和系统
CN108804601A (zh) * 2018-05-29 2018-11-13 国网浙江省电力有限公司 电网运营监测大数据主动式分析方法及装置
CN110298496A (zh) * 2019-06-11 2019-10-01 东南大学 一种基于要素影响分析的城市对外交通量预测方法
CN113191568A (zh) * 2021-05-21 2021-07-30 上海市气象灾害防御技术中心(上海市防雷中心) 基于气象的城市运行管理大数据分析预测方法和系统
WO2023056696A1 (zh) * 2021-10-08 2023-04-13 南威软件股份有限公司 基于循环神经网络的城市轨道交通短时客流预测方法
CN115049158A (zh) * 2022-08-12 2022-09-13 北京大学 城市系统运行状态的预测方法、系统、存储介质及终端
CN116307293A (zh) * 2023-05-22 2023-06-23 北京航空航天大学 一种基于混杂感知与因果去偏的城市时空数据预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Water Benefit-Based Ecological Index for Urban Ecological Environment Quality Assessments;Zhijun Jiao等;《IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing》;第14卷;7557-7569 *

Also Published As

Publication number Publication date
CN116862071A (zh) 2023-10-10

Similar Documents

Publication Publication Date Title
CN105786860B (zh) 一种数据建模中的数据处理方法及装置
CN110135635B (zh) 一种区域电力饱和负荷预测方法及系统
Xu et al. A bi-objective scheduling problem on batch machines via a Pareto-based ant colony system
RU2004126675A (ru) Система анализа проектирования и процессов производства
CN110287332B (zh) 云环境下仿真模型选择方法与装置
CN113822388B (zh) 参数设定方法、装置、电子装置及存储介质
CN108984972B (zh) 一种基于大数据和并行计算的水质数学模型优化方法
CN111738488A (zh) 一种任务调度方法及其装置
CN112418921A (zh) 用电需量预测方法、装置、系统与计算机存储介质
US10719639B2 (en) Massively accelerated Bayesian machine
CN108984830A (zh) 一种基于模糊网络分析的建筑能效评价方法及装置
CN115034519A (zh) 一种用电负荷的预测方法、装置、电子设备以及存储介质
CN114066073A (zh) 电网负荷预测方法
CN109740818A (zh) 一种应用于航路扇区交通的概率密度预测系统
CN113741362A (zh) 液化天然气接收站操作优化方法、系统、介质及计算设备
CN111950706A (zh) 基于人工智能的数据处理方法、装置、计算机设备及介质
CN113130014A (zh) 一种基于多分支神经网络的稀土萃取模拟方法及系统
CN116862071B (zh) 基于混频模型的城市运行指标数据预测方法
Cavalcanti et al. Production system efficiency optimization using sensor data, machine learning-based simulation and genetic algorithms
CN113111588B (zh) 一种燃气轮机nox排放浓度预测方法及装置
CN111274123A (zh) 基于软件基因的安全防护软件测试集自动生成方法、架构
del Castillo et al. Fitting Tails by the Empirical Residual Coefficient of Variation: The ercv Package.
CN114676868A (zh) 物流货量预测方法、装置、计算机设备和存储介质
CN111274682A (zh) 基于蛙跳算法的数字微流控芯片在线测试路径优化方法
Herer et al. Optimal parallel inspection for finding the first nonconforming unit in a batch—an information theoretic approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant