CN115239022A - 客流量预测方法、装置、设备及存储介质 - Google Patents

客流量预测方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115239022A
CN115239022A CN202211034373.1A CN202211034373A CN115239022A CN 115239022 A CN115239022 A CN 115239022A CN 202211034373 A CN202211034373 A CN 202211034373A CN 115239022 A CN115239022 A CN 115239022A
Authority
CN
China
Prior art keywords
passenger flow
prediction
day
time sequence
historical time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211034373.1A
Other languages
English (en)
Inventor
伍广腾
侯桂星
黄践焜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Communication Information System Co Ltd
Original Assignee
Inspur Communication Information System Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Communication Information System Co Ltd filed Critical Inspur Communication Information System Co Ltd
Priority to CN202211034373.1A priority Critical patent/CN115239022A/zh
Publication of CN115239022A publication Critical patent/CN115239022A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Marketing (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Primary Health Care (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种客流量预测方法、装置、设备及存储介质,涉及交通预测技术领域。所述客流量预测方法包括:获取待预测日的日期特征、天气特征和时序数据;将所述日期特征、所述天气特征和所述时序数据输入至客流量预测模型,以利用所述客流量预测模型对所述待预测日的客流量进行预测,得到客流量预测结果;其中,所述客流量预测模型是基于由关联特征和客流量数据构建的历史时序数据集以及所述历史时序数据集对应的客流量标签进行迭代训练得到的。本发明通过加入日期特征和天气特征,利用客流量预测模型对所述待预测日的客流量进行预测,降低了单纯客流量预测的随机波动,解决了客流量预测的准确性较低的技术问题,提高了客流量预测的精确度。

Description

客流量预测方法、装置、设备及存储介质
技术领域
本发明涉及交通预测技术领域,尤其涉及一种客流量预测方法、装置、设备及存储介质。
背景技术
随着公共交通行业的发展,轨道交通、地面公交等交通工具为大家的出行带来了极大的便利,为了动态调整地铁运行系统,降低每个站点的客运压力,对于未来客流量的预测显得尤为重要。
目前,针对客流量预测方法主要是直接将历史客流量数据作为各种机器学习算法得输入,得到客流量预测值,然而,仅仅将历史客流量作为模型输入变量,变量选择过于单一,忽略了其他因素对客流的影响,导致客流量预测的准确性较低。
发明内容
本发明提供一种客流量预测方法、装置、设备及存储介质,旨在提高客流量预测的准确性。
本发明提供一种客流量预测方法,包括:
获取待预测日的日期特征、天气特征和时序数据;
将所述日期特征、所述天气特征和所述时序数据输入至客流量预测模型,以利用所述客流量预测模型对所述待预测日的客流量进行预测,得到客流量预测结果;
其中,所述客流量预测模型是基于由关联特征和客流量数据构建的历史时序数据集以及所述历史时序数据集对应的客流量标签进行迭代训练得到的。
可选地,根据本发明提供的一种客流量预测方法,所述客流量预测模型包括初始预测网络和权重计算网络;所述将所述日期特征、所述天气特征和所述时序数据输入至客流量预测模型,以利用所述客流量预测模型对所述待预测日的客流量进行预测,得到客流量预测结果,包括:
将所述时序数据输入至所述初始预测网络,得到所述初始预测网络输出的初始客流量预测值;以及将所述日期特征和所述天气特征输入至所述权重计算网络,得到所述权重计算网络输出的权重影响系数;
基于所述权重影响系数,对所述初始客流量预测值进行修正,得到所述客流量预测结果。
可选地,根据本发明提供的一种客流量预测方法,所述初始预测网络包括长短期记忆层和全连接层;
所述将所述时序数据输入至所述初始预测网络,得到所述初始预测网络输出的初始客流量预测值,包括:
将所述时序数据输入至所述长短期记忆层,得到所述长短期记忆层输出的时间序列特征;
将所述时间序列特征输入至所述全连接层,得到所述全连接层输出的初始客流量预测值。
可选地,根据本发明提供的一种客流量预测方法,所述客流量预测模型基于如下步骤训练得到:
获取历史时间段内的历史时序数据集,其中,历史时序数据集包括历史时间段内每一天的关联特征和客流量数据;
以预设滑动窗口长度对所述历史时序数据集进行滑动截取,得到每个滑动窗口对应的历史时序数据子集;
分别将每个所述滑动窗口对应的历史时序数据子集与所述滑动窗口下一天的关联特征作为一个训练样本,并将所述滑动窗口下一天的客流量数据作为所述训练样本的客流量标签;
利用多个训练样本以及所述多个训练样本各自对应的客流量标签对待训练预测模型进行迭代训练,得到所述客流量预测模型。
可选地,根据本发明提供的一种客流量预测方法,所述关联特征包括关联日期特征和关联天气特征;所述获取历史时间段内的历史时序数据集,包括:
获取所述历史时间段内每一天的客流量;
基于所述每一天的客流量,确定所述历史时间段内的最大客流量,并基于所述最大客流量,分别将所述每一天的客流量进行归一化处理,得到每一天的客流量数据;
根据日期类型,将所述历史时间段内每一天的日期进行数字化处理,得到关联日期特征,以及根据天气类型,将所述历史时间段内每一天的天气进行数字化处理,得到关联天气特征;
分别将所述历史时间段内每一天的关联日期特征、关联天气特征和客流量数据进行组合,形成所述历史时序数据集。
可选地,根据本发明提供的一种客流量预测方法,所述利用多个训练样本以及所述多个训练样本各自对应的客流量标签对待训练预测模型进行迭代训练,得到所述客流量预测模型,包括:
根据所述训练样本以及所述待训练预测模型,得到预测值;
根据所述预测值和所述训练样本对应的客流量标签,利用预设损失函数计算模型损失值;
基于每一次迭代的模型损失值,对所述待训练预测模型进行参数更新,得到所述客流量预测模型。
可选地,根据本发明提供的一种客流量预测方法,所述待训练预测模型包括初始预测网络和权重计算网络,所述根据所述训练样本以及所述待训练预测模型,得到预测值包括:
将所述训练样本中的历史时序数据子集输入至所述初始预测网络,得到所述初始预测网络输出的初始预测值;以及将所述训练样本中的滑动窗口下一天的关联特征输入至所述权重计算网络,得到所述权重计算网络输出的影响系数;
将所述初始预测值与所述影响系数之间的乘积作为所述预测值。
本发明还提供一种客流量预测装置,包括:
获取模块,用于获取待预测日的日期特征、天气特征和时序数据;
预测模块,用于将所述日期特征、所述天气特征和所述时序数据输入至客流量预测模型,以利用所述客流量预测模型对所述待预测日的客流量进行预测,得到客流量预测结果;
其中,所述客流量预测模型是基于由关联特征和客流量数据构建的历史时序数据集以及所述历史时序数据集对应的客流量标签进行迭代训练得到的。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述客流量预测方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述客流量预测方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述客流量预测方法。
本发明提供的客流量预测方法、装置、设备及存储介质,通过将日期特征、天气特征和客流量作为客流量预测模型的输入数据,可以尽可能挖掘到客流量与日期特征和天气特征之间的关系,从而降低了单纯客流量预测的随机波动,提高了客流量预测的准确性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的客流量预测方法的流程示意图之一;
图2为本发明提供的客流量预测方法的流程示意图之二;
图3为本发明提供的客流量预测方法中客流量预测模型的结构示意图;
图4是本发明提供的客流量预测方法的流程示意图之三;
图5是本发明提供的客流量预测装置的结构示意图;
图6是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明一个或多个实施例。在本发明一个或多个实施例中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本发明一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本发明一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
下面结合图1-图4对本发明示例实施方式进行详细说明。
如图1所示的是本发明实施例的一种客流量预测方法的流程图。
如图1所示,该客流量预测方法包括:
步骤S10,获取待预测日的日期特征、天气特征和时序数据;
需要说明的是,所述日期特征是基于日期类型进行数据化得到,所述日期类型包括节假日、周末和工作日等,例如:清明、端午、中秋节、国庆和元旦等节日设为1,所有周末设为1,12月31日、12月25日、2月14日、5月20日为特殊日期设为1,其它为0,其中,还可根据节假日天数,将节假日第几天除以节假日天数进行归一化。
进一步需要说明的是,所述天气特征是基于天气类型进行数据化获得,例如:晴、多云和阴设为1,雾霾天气设为1;根据降雨的大小进行数字化,大雨和暴雨设为3,中雨设为2,小雨、阵雨等设为1;根据雪的大小进行数字化,大雪、暴雪设为3,中雪设为2,小雪、雨夹雪等设为1;根据当天的最高气温、最高气温以及和前一天的最高气温差进行数字化,最高气温除以30,最低气温除以30,和前一天的最高气温差除以10。
进一步需要说明的是,所述时序数据是在历史时序数据集中选取所述待预测日之前的预设滑动窗口的数据,所述历史时序数据集由历史时间段内每一天的关联日期特征、关联天气特征和客流量数据组成,所述历史时间段可根据实际情况进行设置,在此不做具体限制,所述客流量数据可以是每一天的实际客流量数据,也可是进行归一化后的客流量数据,具体地,将每一天的客流量除以历史时间段内的最大客流量得到归一化后的客流量数据,优选地,选取归一化后的客流量数据。
具体地,针对某一条线路或者站点,将待预测日的日期进行数据化,得到所述日期特征,以及通过天气预报网获取待预测日的天气,并将天气进行数字化,得到天气特征,并在预先收集的历史时序数据集中,选取预先滑动窗口长度的时序数据,优选地,选取距离所述待预测日最近的预先滑动窗口长度的时序数据。
例如,历史时序数据集包括2016年6月28日至2021年6月10日中每一天的关联日期特征、关联天气特征和客流量数据,当待预测日为2021年6月11日,预设滑动窗口为10,选取2021年6月1日至2021年6月10日中每一天的关联日期特征、关联天气特征和客流量数据构建形成所述时序数据,并将2021年6月11日的日期以及天气进行数字化,得到2021年6月11日的日期特征和天气特征。
步骤S20,将所述日期特征、所述天气特征和所述时序数据输入至客流量预测模型,以利用所述客流量预测模型对所述待预测日的客流量进行预测,得到客流量预测结果;
其中,所述客流量预测模型是基于由关联特征和客流量数据构建的历史时序数据集以及所述历史时序数据集对应的客流量标签进行迭代训练得到的。
具体地,在一个实施例中,将日期特征、所述天气特征和所述时序数据输入至客流量预测模型,根据客流量预测模型的输出结果,获得客流量预测结果。其中,所述客流量预测模型是基于由关联特征和客流量数据构建的历史时序数据集以及所述历史时序数据集对应的客流量标签进行迭代训练得到的。可以理解的是,客流量预测模型在通过训练之后能够有效识别待预测日的日期特征、天气特征和时序数据,以获得待预测日对应的客流量预测结果。需要说明的是,若时序数据中的客流量数据是归一化后的数据,则将模型输出的客流量预测结果与历史时间段内的最大客流量之间的乘积作为待预测日的实际客流量。
本发明实施例中,所述客流量预测模型包括初始预测网络和权重计算网络,其中,所述初始预测网络用于基于时序数据进行预测所述待预测日的客流量,所述权重计算网络用于基于待预测日的日期特征和天气特征来预测日期和天气的影响系数,从而根据影响系数修正待预测日的客流量。
本发明实施例通过上述方案,也即,获取待预测日的日期特征、天气特征和时序数据;将所述日期特征、所述天气特征和所述时序数据输入至客流量预测模型,以利用所述客流量预测模型对所述待预测日的客流量进行预测,得到客流量预测结果;其中,所述客流量预测模型是基于由关联特征和客流量数据构建的历史时序数据集以及所述历史时序数据集对应的客流量标签进行迭代训练得到的。本发明通过将一天的日期特征、天气特征和客流量组合为客流量预测模型的输入数据,可以尽可能挖掘到客流量与日期特征和天气特征之间的关系,从而降低了单纯客流量预测的随机波动,提高了客流量预测的准确性。
参照图2,在一个实施例中,上述步骤S20:将所述日期特征、所述天气特征和所述时序数据输入至客流量预测模型,以利用所述客流量预测模型对所述待预测日的客流量进行预测,得到客流量预测结果,包括:
步骤S21,将所述时序数据输入至所述初始预测网络,得到所述初始预测网络输出的初始客流量预测值;以及将所述日期特征和所述天气特征输入至所述权重计算网络,得到所述权重计算网络输出的权重影响系数;
其中,所述将所述时序数据输入至所述初始预测网络,得到所述初始预测网络输出的初始客流量预测值,包括:
步骤S211,将所述时序数据输入至所述长短期记忆层,得到所述长短期记忆层输出的时间序列特征;
步骤S212,将所述时间序列特征输入至所述全连接层,得到所述全连接层输出的初始客流量预测值。
步骤S22,基于所述权重影响系数,对所述初始客流量预测值进行修正,得到所述客流量预测结果。
需要说明的是,参照图3,所述客流量预测模型包括初始预测网络和权重计算网络,所述初始预测网络包括一层的长短期记忆层和两层的全连接层,其中,优选地,第一层的全连接层的输入大小为16,中间层大小为10,输出大小为1,所述权重计算网络包括两层的全连接层,输入为日期特征和天气特征,大小为14,中间层大小为10,输出层大小为1。
具体地,将所述时序数据输入至所述初始预测网络中的长短期记忆层进行特征提取,得到所述长短期记忆层输出的时间序列特征,进一步地,将所述时间序列特征输入至所述全连接层,利用所述初始预测网络中的全连接层将时间序列特征转化为所述初始客流量预测值,另外地,将所述日期特征和所述天气特征组成形成的特征向量输入至权重计算网络中的全连接层,利用权重计算网络中的全连接层将日期特征和所述天气特征转化为权重影响系数,进一步地,将所述权重影响系数和所述初始客流量预测值进行相乘,以将得到的乘积作为所述客流量预测结果。
本发明实施例通过上述方案,也即,将所述时序数据输入至所述初始预测网络,得到所述初始预测网络输出的初始客流量预测值;以及将所述日期特征和所述天气特征输入至所述权重计算网络,得到所述权重计算网络输出的权重影响系数;基于所述权重影响系数,对所述初始客流量预测值进行修正,得到所述客流量预测结果,实现了将时序数据作为初始预测网络的输入,得到待预测日的初始客流量预测值,并且将待预测日的日期特征和天气特征通过权重计算网络计算得到一个权值,以修正初始客流量预测值,降低了单纯客流量预测的随机波动提高了客流量预测的精确度。
参照图4,在本发明的一个实施例中,所述客流量预测模型基于如下步骤训练得到:
步骤A10,获取历史时间段内的历史时序数据集,其中,历史时序数据集包括历史时间段内每一天的关联特征和客流量数据;
所述关联特征包括关联日期特征和关联天气特征;所述获取历史时间段内的历史时序数据集,包括:
步骤A11,获取所述历史时间段内每一天的客流量;
步骤A12,基于所述每一天的客流量,确定所述历史时间段内的最大客流量,并基于所述最大客流量,分别将所述每一天的客流量进行归一化处理,得到每一天的客流量数据;
步骤A13,根据日期类型,将所述历史时间段内每一天的日期进行数字化处理,得到关联日期特征,以及根据天气类型,将所述历史时间段内每一天的天气进行数字化处理,得到关联天气特征;
步骤A14,分别将所述历史时间段内每一天的关联日期特征、关联天气特征和客流量数据进行组合,形成所述历史时序数据集。
步骤A20,以预设滑动窗口长度对所述历史时序数据集进行滑动截取,得到每个滑动窗口对应的历史时序数据子集;
步骤A30,分别将每个所述滑动窗口对应的历史时序数据子集与所述滑动窗口下一天的关联特征作为一个训练样本,并将所述滑动窗口下一天的客流量数据作为所述训练样本的客流量标签;
步骤A40,利用多个训练样本以及所述多个训练样本各自对应的客流量标签对待训练预测模型进行迭代训练,得到所述客流量预测模型。
需要说明的是,所述关联特征包括关联日期特征和天气特征,所述预设滑动窗口长度是在历史时序数据集选取历史时序数据的时间长度,预设滑动窗口长度可根据实际情况设置,在此不做具体赘述。
具体地,首先根据日期类型,将所述历史时间段内每一天的日期进行数字化处理,得到关联日期特征,以及根据天气类型,将所述历史时间段内每一天的天气进行数字化处理,得到关联天气特征,另外地,获取所述历史时间段内每一天的客流量,基于所述每一天的客流量,确定所述历史时间段内的最大客流量,分别将所述每一天的客流量除以所述最大客流量,得到每一天的客流量数据,进而将每一天的关联日期特征、关联天气特征、客流量数据组合为历史时序数据集,例如:所述历史时序数据集可表示为日期[关联日期特征,关联天气特征,客流量数据]。
进一步地,还需要对所述历史时序数据集中的历史时序数据进行筛选,例如,对由于春节的特殊性,将春节前一周和春节后一天相关的数据删除,由于删除数据导致的日期不连续性,将历史时序数据集分割为多个日期连续的分割时序数据集,进而在每一个分割时序数据集中,以预设滑动窗口长度对所述分割时序数据集进行滑动截取,得到每个滑动窗口对应的历史时序数据子集,例如,分割时序数据集为2019年3月1日至2019年1月30日的数据,预设滑动窗口长度为10,则将2019年3月1日至2019年3月10日的数据作为第一个滑动窗口对应的历史时序数据子集,2019年3月2日至2019年3月11日的数据为第二个滑动窗口对应的历史时序数据子集,以此类推。
更进一步地,针对每一个滑动窗口,将所述滑动窗口对应的历史时序数据子集、所述滑动窗口下一天的关联特征作为一个训练样本,并将所述滑动窗口下一天的客流量数据作为训练样本的客流量标签,沿用上述例子,2019年3月1日至2019年3月10日的数据作为第一个滑动窗口对应的历史时序数据子集,所述滑动窗口下一天的关联特征表示2019年3月11日的关联特征,所述滑动窗口下一天的客流量数据表示2019年3月11日的客流量数据,进而在获得多个训练样本之后,基于多个训练样本以及待训练预测模型,得到预测值,根据所述预测值和所述训练样本对应的客流量标签,对待训练预测模型中的模型参数进行调整,从而得到所述客流量预测模型。
本发明通过上述方案,也即,获取所述历史时间段内每一天的客流量;基于所述每一天的客流量,确定所述历史时间段内的最大客流量,并基于所述最大客流量,分别将所述每一天的客流量进行归一化处理,得到每一天的客流量数据;根据日期类型,将所述历史时间段内每一天的日期进行数字化处理,得到关联日期特征,以及根据天气类型,将所述历史时间段内每一天的天气进行数字化处理,得到关联天气特征;分别将所述历史时间段内每一天的关联日期特征、关联天气特征和客流量数据进行组合,形成所述历史时序数据集。实现了基于历史时间段内每一天的日期特征、天气特征和客流量数据进行模型训练,使得模型能够挖掘到客流量与日期和天气之间特征关系,有利于利用训练好的客流量预测模型对客流量进行精准预测。
基于上述任一实施例,上述步骤A40:利用多个训练样本以及所述多个训练样本各自对应的客流量标签对待训练预测模型进行迭代训练,得到所述客流量预测模型,包括:
步骤A41,根据所述训练样本以及所述待训练预测模型,得到预测值;
其中,所述待训练预测模型包括初始预测网络和权重计算网络,所述根据所述训练样本以及所述待训练预测模型,得到预测值包括:
步骤A411,将所述训练样本中的历史时序数据子集输入至所述初始预测网络,得到所述初始预测网络输出的初始预测值;以及将所述训练样本中的滑动窗口下一天的关联特征输入至所述权重计算网络,得到所述权重计算网络输出的影响系数;
步骤A412,将所述初始预测值与所述影响系数之间的乘积作为所述预测值。
步骤A42,根据所述预测值和所述训练样本对应的客流量标签,利用预设损失函数计算模型损失值;
步骤A43,基于每一次迭代的模型损失值,对所述待训练预测模型进行参数更新,得到所述客流量预测模型。
需要说明的是,所述待训练预测模型包括初始预测网络和权重计算网络。
具体地,在获得多个训练样本之后,对于任意一个训练样本,将所述训练样本中的历史时序数据子集输入至初始预测网络中,得到初始预测网络输出该训练样本对应的初始预测值,并将所述训练样本中的滑动窗口下一天的关联特征输入至权重计算网络,得到所述权重计算网络输出的影响系数,进而将所述初始预测值与所述影响系数之间的乘积作为预测值,进而根据训练样本对应的预测值和训练样本对应的客流量标签利用预设损失函数计算模型损失值,其中,模型损失值计算公式如下:
Figure BDA0003818354420000131
其中,outputi表示预测值,labeli表示客流量标签,N表示预设滑动窗口长度,loss表示模型损失值。
在此基础上,在其他实施例中,模型损失值计算方法可以根据实际需求进行设置,此处不做具体限定。在计算获得模型损失值之后,本次训练过程结束,再利用误差反向传播算法更新待训练预测模型中的模型参数,之后再进行下一次训练。在训练的过程中,判断更新后的待训练预测模型是否均满足预设训练结束条件,若满足,则将更新后的待训练预测模型作为客流量预测模型,若不满足,则继续训练模型,其中,所述预设训练结束条件包括损失收敛和达到最大迭代次数阈值等。
本发明实施例通过上述方案,也即,根据所述训练样本以及所述待训练预测模型,得到预测值;根据所述预测值和所述训练样本对应的客流量标签,利用预设损失函数计算模型损失值;基于每一次迭代的模型损失值,对所述待训练预测模型进行参数更新,得到所述客流量预测模型。实现了通过对客流量预测模型进行训练,有利于将客流量预测模型的损失值控制在预设的范围内,从而有利于提高客流量预测模型进行客流量预测的精度。
下面对本发明提供的客流量预测装置进行描述,下文描述的客流量预测装置与上文描述的客流量预测方法可相互对应参照。
如图5所示,本发明实施例的一种客流量预测装置,该装置包括:
获取模块10,用于获取待预测日的日期特征、天气特征和时序数据;
预测模块20,用于将所述日期特征、所述天气特征和所述时序数据输入至客流量预测模型,以利用所述客流量预测模型对所述待预测日的客流量进行预测,得到客流量预测结果;
其中,所述客流量预测模型是基于由关联特征和客流量数据构建的历史时序数据集以及所述历史时序数据集对应的客流量标签进行迭代训练得到的。
可选地,所述预测模块20还用于:
将所述时序数据输入至所述初始预测网络,得到所述初始预测网络输出的初始客流量预测值;以及将所述日期特征和所述天气特征输入至所述权重计算网络,得到所述权重计算网络输出的权重影响系数;
基于所述权重影响系数,对所述初始客流量预测值进行修正,得到所述客流量预测结果。
可选地,所述预测模块20还用于:
将所述时序数据输入至所述长短期记忆层,得到所述长短期记忆层输出的时间序列特征;
将所述时间序列特征输入至所述全连接层,得到所述全连接层输出的初始客流量预测值。
可选地,所述客流量预测装置还包括:
获取历史时间段内的历史时序数据集,其中,历史时序数据集包括历史时间段内每一天的关联特征和客流量数据;
以预设滑动窗口长度对所述历史时序数据集进行滑动截取,得到每个滑动窗口对应的历史时序数据子集;
分别将每个所述滑动窗口对应的历史时序数据子集与所述滑动窗口下一天的关联特征作为一个训练样本,并将所述滑动窗口下一天的客流量数据作为所述训练样本的客流量标签;
利用多个训练样本以及所述多个训练样本各自对应的客流量标签对待训练预测模型进行迭代训练,得到所述客流量预测模型。
可选地,所述客流量预测装置还包括:
获取所述历史时间段内每一天的客流量;
基于所述每一天的客流量,确定所述历史时间段内的最大客流量,并基于所述最大客流量,分别将所述每一天的客流量进行归一化处理,得到每一天的客流量数据;
根据日期类型,将所述历史时间段内每一天的日期进行数字化处理,得到关联日期特征,以及根据天气类型,将所述历史时间段内每一天的天气进行数字化处理,得到关联天气特征;
分别将所述历史时间段内每一天的关联日期特征、关联天气特征和客流量数据进行组合,形成所述历史时序数据集。
可选地,所述客流量预测装置还包括:
根据所述训练样本以及所述待训练预测模型,得到预测值;
根据所述预测值和所述训练样本对应的客流量标签,利用预设损失函数计算模型损失值;
基于每一次迭代的模型损失值,对所述待训练预测模型进行参数更新,得到所述客流量预测模型。
可选地,所述客流量预测装置还包括:
将所述训练样本中的历史时序数据子集输入至所述初始预测网络,得到所述初始预测网络输出的初始预测值;以及将所述训练样本中的滑动窗口下一天的关联特征输入至所述权重计算网络,得到所述权重计算网络输出的影响系数;
将所述初始预测值与所述影响系数之间的乘积作为所述预测值。
在此需要说明的是,本申请实施例提供的上述装置,能够实现上述方法实施例所实现的所有方法步骤,且能够达到相同技术效果,在此不再对本实施例中与方法实施例相同部分及有益效果进行具体赘述。
图6示例了一种电子设备的实体结构示意图,该电子设备可以包括:处理器(processor)610、存储器(memory)620、通信接口(Communications Interface)630和通信总线640,其中,处理器610,存储器620,通信接口630通过通信总线640完成相互间的通信。处理器610可以调用存储器620中的逻辑指令,以执行客流量预测方法,该方法包括:获取待预测日的日期特征、天气特征和时序数据;将所述日期特征、所述天气特征和所述时序数据输入至客流量预测模型,以利用所述客流量预测模型对所述待预测日的客流量进行预测,得到客流量预测结果;其中,所述客流量预测模型是基于由关联特征和客流量数据构建的历史时序数据集以及所述历史时序数据集对应的客流量标签进行迭代训练得到的。
此外,上述的存储器620中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的客流量预测方法,该方法包括:获取待预测日的日期特征、天气特征和时序数据;将所述日期特征、所述天气特征和所述时序数据输入至客流量预测模型,以利用所述客流量预测模型对所述待预测日的客流量进行预测,得到客流量预测结果;其中,所述客流量预测模型是基于由关联特征和客流量数据构建的历史时序数据集以及所述历史时序数据集对应的客流量标签进行迭代训练得到的。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的客流量预测方法,该方法包括:获取待预测日的日期特征、天气特征和时序数据;将所述日期特征、所述天气特征和所述时序数据输入至客流量预测模型,以利用所述客流量预测模型对所述待预测日的客流量进行预测,得到客流量预测结果;其中,所述客流量预测模型是基于由关联特征和客流量数据构建的历史时序数据集以及所述历史时序数据集对应的客流量标签进行迭代训练得到的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种客流量预测方法,其特征在于,包括:
获取待预测日的日期特征、天气特征和时序数据;
将所述日期特征、所述天气特征和所述时序数据输入至客流量预测模型,以利用所述客流量预测模型对所述待预测日的客流量进行预测,得到客流量预测结果;
其中,所述客流量预测模型是基于由关联特征和客流量数据构建的历史时序数据集以及所述历史时序数据集对应的客流量标签进行迭代训练得到的。
2.根据权利要求1所述的客流量预测方法,其特征在于,所述客流量预测模型包括初始预测网络和权重计算网络;
所述将所述日期特征、所述天气特征和所述时序数据输入至客流量预测模型,以利用所述客流量预测模型对所述待预测日的客流量进行预测,得到客流量预测结果,包括:
将所述时序数据输入至所述初始预测网络,得到所述初始预测网络输出的初始客流量预测值;以及将所述日期特征和所述天气特征输入至所述权重计算网络,得到所述权重计算网络输出的权重影响系数;
基于所述权重影响系数,对所述初始客流量预测值进行修正,得到所述客流量预测结果。
3.根据权利要求2所述的客流量预测方法,其特征在于,所述初始预测网络包括长短期记忆层和全连接层;
所述将所述时序数据输入至所述初始预测网络,得到所述初始预测网络输出的初始客流量预测值,包括:
将所述时序数据输入至所述长短期记忆层,得到所述长短期记忆层输出的时间序列特征;
将所述时间序列特征输入至所述全连接层,得到所述全连接层输出的初始客流量预测值。
4.根据权利要求1至3任一项所述的客流量预测方法,其特征在于,所述客流量预测模型基于如下步骤训练得到:
获取历史时间段内的历史时序数据集,其中,历史时序数据集包括历史时间段内每一天的关联特征和客流量数据;
以预设滑动窗口长度对所述历史时序数据集进行滑动截取,得到每个滑动窗口对应的历史时序数据子集;
分别将每个所述滑动窗口对应的历史时序数据子集与所述滑动窗口下一天的关联特征作为一个训练样本,并将所述滑动窗口下一天的客流量数据作为所述训练样本的客流量标签;
利用多个训练样本以及所述多个训练样本各自对应的客流量标签对待训练预测模型进行迭代训练,得到所述客流量预测模型。
5.根据权利要求4所述的客流量预测方法,其特征在于,所述关联特征包括关联日期特征和关联天气特征;所述获取历史时间段内的历史时序数据集,包括:
获取所述历史时间段内每一天的客流量;
基于所述每一天的客流量,确定所述历史时间段内的最大客流量,并基于所述最大客流量,分别将所述每一天的客流量进行归一化处理,得到每一天的客流量数据;
根据日期类型,将所述历史时间段内每一天的日期进行数字化处理,得到关联日期特征,以及根据天气类型,将所述历史时间段内每一天的天气进行数字化处理,得到关联天气特征;
分别将所述历史时间段内每一天的关联日期特征、关联天气特征和客流量数据进行组合,形成所述历史时序数据集。
6.根据权利要求4所述的客流量预测方法,其特征在于,所述利用多个训练样本以及所述多个训练样本各自对应的客流量标签对待训练预测模型进行迭代训练,得到所述客流量预测模型,包括:
对于任意一个训练样本,根据所述训练样本以及所述待训练预测模型,得到预测值;
根据所述预测值和所述训练样本对应的客流量标签,利用预设损失函数计算模型损失值;
基于每一次迭代的模型损失值,对所述待训练预测模型进行参数更新,得到所述客流量预测模型。
7.根据权利要求6所述的客流量预测方法,其特征在于,所述待训练预测模型包括初始预测网络和权重计算网络,所述根据所述训练样本以及所述待训练预测模型,得到预测值包括:
将所述训练样本中的历史时序数据子集输入至所述初始预测网络,得到所述初始预测网络输出的初始预测值;以及将所述训练样本中的滑动窗口下一天的关联特征输入至所述权重计算网络,得到所述权重计算网络输出的影响系数;
将所述初始预测值与所述影响系数之间的乘积作为所述预测值。
8.一种客流量预测装置,其特征在于,包括:
获取模块,用于获取待预测日的日期特征、天气特征和时序数据;
预测模块,用于将所述日期特征、所述天气特征和所述时序数据输入至客流量预测模型,以利用所述客流量预测模型对所述待预测日的客流量进行预测,得到客流量预测结果;
其中,所述客流量预测模型是基于由关联特征和客流量数据构建的历史时序数据集以及所述历史时序数据集对应的客流量标签进行迭代训练得到的。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述客流量预测方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述客流量预测方法。
CN202211034373.1A 2022-08-26 2022-08-26 客流量预测方法、装置、设备及存储介质 Pending CN115239022A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211034373.1A CN115239022A (zh) 2022-08-26 2022-08-26 客流量预测方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211034373.1A CN115239022A (zh) 2022-08-26 2022-08-26 客流量预测方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115239022A true CN115239022A (zh) 2022-10-25

Family

ID=83680505

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211034373.1A Pending CN115239022A (zh) 2022-08-26 2022-08-26 客流量预测方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115239022A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116777507A (zh) * 2023-06-23 2023-09-19 青岛中沃兴牧食品科技有限公司 一种基于lstm模型的猪肉专卖网点各类猪肉销售量的预测方法
CN117407774A (zh) * 2023-12-15 2024-01-16 深圳市地铁集团有限公司 一种基于人工智能的交通数据处理方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116777507A (zh) * 2023-06-23 2023-09-19 青岛中沃兴牧食品科技有限公司 一种基于lstm模型的猪肉专卖网点各类猪肉销售量的预测方法
CN116777507B (zh) * 2023-06-23 2024-05-28 青岛中沃兴牧食品科技有限公司 一种基于lstm模型的猪肉专卖网点各类猪肉销售量的预测方法
CN117407774A (zh) * 2023-12-15 2024-01-16 深圳市地铁集团有限公司 一种基于人工智能的交通数据处理方法及系统
CN117407774B (zh) * 2023-12-15 2024-03-26 深圳市地铁集团有限公司 一种基于人工智能的交通数据处理方法及系统

Similar Documents

Publication Publication Date Title
CN115239022A (zh) 客流量预测方法、装置、设备及存储介质
US20190197404A1 (en) Asychronous training of machine learning model
CN110705592B (zh) 分类模型训练方法、装置、设备及计算机可读存储介质
CN109523013B (zh) 基于浅层卷积神经网络的空气颗粒物污染程度估计方法
CN114330713B (zh) 卷积神经网络模型剪枝方法和装置、电子设备、存储介质
CN111309834B (zh) 一种无线热点与兴趣点的匹配方法及装置
US20230342606A1 (en) Training method and apparatus for graph neural network
CN112634170A (zh) 一种模糊图像修正的方法、装置、计算机设备及存储介质
CN112614125B (zh) 手机玻璃缺陷检测方法、装置、计算机设备及存储介质
CN104035779A (zh) 一种数据流决策树分类中的缺失值处理方法
CN104599002B (zh) 预测订单价值的方法及设备
CN113420727B (zh) 表格检测模型的训练方法、装置及表格检测方法、装置
CN114187459A (zh) 目标检测模型的训练方法、装置、电子设备以及存储介质
CN111191825A (zh) 用户违约预测方法、装置及电子设备
EP4123595A2 (en) Method and apparatus of rectifying text image, training method and apparatus, electronic device, and medium
CN111428191A (zh) 基于知识蒸馏的天线下倾角计算方法、装置和存储介质
CN116701734B (zh) 地址文本的处理方法、设备及计算机可读存储介质
CN112559877A (zh) 基于跨平台异构数据及行为上下文的ctr预估方法及系统
CN115794805B (zh) 一种中低压配网量测数据补齐方法
CN113447013B (zh) 施工道路识别方法、装置、设备、存储介质和程序产品
CN114707638A (zh) 模型训练、对象识别方法及装置、设备、介质和产品
CN113688920A (zh) 模型训练及目标检测方法、装置、电子设备以及路侧设备
CN114241411A (zh) 基于目标检测的计数模型处理方法、装置及计算机设备
CN113723712A (zh) 风电功率预测方法、系统、设备及介质
CN112132228B (zh) 基于决策树分类的辐照度数据插补方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination