CN113361810A

CN113361810A - 一种客流量预测方法、装置、设备和存储介质

Info

Publication number: CN113361810A
Application number: CN202110741661.XA
Authority: CN
Inventors: 曾明; 秦伟
Original assignee: Guangdong Huazhiyuan Information Engineering Co ltd; Guangzhou Huajia Software Co ltd; Guangzhou Xinke Jiadu Technology Co Ltd; PCI Technology Group Co Ltd
Current assignee: Guangdong Huazhiyuan Information Engineering Co ltd; Guangzhou Huajia Software Co ltd; Guangzhou Xinke Jiadu Technology Co Ltd; PCI Technology Group Co Ltd
Priority date: 2021-06-30
Filing date: 2021-06-30
Publication date: 2021-09-07
Anticipated expiration: 2041-06-30
Also published as: CN113361810B

Abstract

本发明实施例公开了一种客流量预测方法、装置、设备和存储介质，在本发明实施例中，首先确定细粒度时间段与粗粒度时间段，之后，获取每个站点每天在每个细粒度时间段的第一历史客流量以及每个站点每天在每个粗粒度时间段的第二历史客流量；根据第一历史客流量计算每个站点每天的平均历史客流量；之后，获取每个粗粒度时间段的粗粒度客流量预测值；最后，基于平均历史客流量、粗粒度客流量预测值、第一历史客流量以及第二历史客流量，对每个站点的细粒度时间段进行分类，根据预设规则计算每个站点不同类别的细粒度时间段的客流量预测值。解决了现有技术在对地铁的客流量进行预测时，存在着预测结果的准确率低的技术问题。

Description

一种客流量预测方法、装置、设备和存储介质

技术领域

本申请实施例涉及轨道交通领域，尤其涉及一种客流量预测方法、装置、设备和存储介质。

背景技术

目前，轨道交通作为一个便捷快速的交通工具，已经成为人们重要的交通出行方式，轨道交通为我们带来便利的同时，也给国家和地区的经济带来了很大的发展和促进作用。随着目前乘坐轨道交通的人越来越多，实现轨道交通的客流预测，在规避交通堵塞，提前部署站点安保措施等方面具有重要的意义。目前，交通行业的客流量预测的技术主要有：1.时间序列方法预测：利用节点的AR(自回归模型)、MA(移动平均模型)、ARMA(自回归滑动平滑模型)等时间序列进行预测。2.机器学习和深度学习方法预测：利用线性回归算法、XGBOOST回归算法以及神经网络算法(RNN循环神经网络、LSTM长短期记忆网络)，在构造建模的特征的基础上，通过训练拟合出客流预测模型。

然而，现有的对客流量进行预测的方式，存在着以下问题：

1.在预测细粒度(比如30分钟)的地铁客流时，没有充分利用粗粒度(比如60分钟)的地铁客流预测结果。由于时间粒度越粗，其预测准确率越高，而粗粒度是由多个细粒度组成的，特别是对于粗粒度预测效果好，而细粒度预测效果差的站点。现有技术在预测细粒度的客流时，没有充分考虑粗粒度的预测结果，虽然乘客的进出站时间会受到很多因素的影响，但是都是集中在一定时间的范围之内，若在粗粒度的基础上预测细粒度的地铁客流，能够提高预测的准确率。

2.由于地铁客流在实际的过程当中很容易受到其他因素的影响(比如屏蔽门故障等)，导致历史每个时段的进出站人数并不是完全一致的，现有技术在利用客流预测模型得到客流的预测结果后，并没有利用实时的客流数据实时对客流预测模型的预测结果进行修正，导致预测结果的准确性较低。

3.现有技术在对客流量进行修正时，没有充分考虑到个体行为。由于地铁客流量是由多个个体组成的，因此每个个体的行为会对真实的客流量造成影响，进而影响预测的客流量和真实的客流量的误差，导致预测结果的准确性降低，同时个体行为的旅游时间，会影响到需要修正的影响时刻范围和对应的每个影响时刻的权重，然而现有技术并没有考虑到这一点。

综上所述，现有技术在对地铁的客流量进行预测时，存在着预测结果的准确率低的技术问题。

发明内容

本发明实施例提供了一种客流量预测方法、装置、设备和存储介质，解决了现有技术在对地铁的客流量进行预测时，存在着预测结果的准确率低的技术问题。

第一方面，本发明实施例提供了一种客流量预测方法，包括以下步骤：

确定细粒度时间段与粗粒度时间段，所述粗粒度时间段的时长为所述细粒度时间段的时长的整数倍；

获取每个站点每天在每个所述细粒度时间段的第一历史客流量以及每个站点每天在每个所述粗粒度时间段的第二历史客流量；

根据所述第一历史客流量计算所述每个站点在每个所述细粒度时间段对应的平均历史客流量；

获取每个站点在每个所述粗粒度时间段的粗粒度客流量预测值；

基于所述平均历史客流量、所述粗粒度客流量预测值、所述第一历史客流量以及所述第二历史客流量，对所述每个站点的细粒度时间段进行分类，根据预设规则计算每个站点不同类别的细粒度时间段的客流量预测值。

优选的，所述获取每个站点每天在每个所述细粒度时间段的第一历史客流量以及每个站点每天在每个所述粗粒度时间段的第二历史客流量的具体过程为：

获取地铁乘客的历史刷卡信息，根据所述历史刷卡信息统计每个站点每天在每个所述细粒度时间段的第一历史客流量；

根据所述第一历史客流量统计所述每个站点每天在每个所述粗粒度时间段的第二历史客流量。

优选的，所述基于所述平均历史客流量、所述粗粒度客流量预测值、所述第一历史客流量以及所述第二历史客流量，对所述每个站点的细粒度时间段进行分类，根据预设规则计算每个站点不同类别的细粒度时间段的客流量预测值的具体过程为：

根据所述平均历史客流量以及所述第一历史客流量，计算第一误差比例；

判断所述第一误差比例是否小于第一误差阈值；

若所述第一误差比例小于第一误差阈值，将该细粒度时间段确定为第一类别细粒度时间段，将所述第一类别细粒度时间段的平均历史客流量作为所述第一类别细粒度时间段的客流量预测值；

若所述第一误差比例大于等于第一误差阈值，计算所述细粒度时间段的第一历史客流量在对应的粗粒度时间段的第二历史客流量中的平均历史占比值，所述细粒度时间段对应的粗粒度时间段为所述细粒度时间段所属的粗粒度时间段；

根据所述平均历史占比值计算占比误差，判断所述占比误差是否小于占比误差阈值；

若所述占比误差小于占比误差阈值，将该细粒度时间段确定为第二类别细粒度时间段，根据所述平均历史占比值以及所述粗粒度客流量预测值计算所述第二类别细粒度时间段的客流量预测值；

若所述占比误差大于等于占比误差阈值，将该细粒度时间段确定为第三类别细粒度时间段，且所述第三类别细粒度时间段的客流量只受前序细粒度时间段的第三历史客流量的影响；

获取所述第三类别细粒度时间段所对应的粗粒度时间段的第一粗粒度客流量预测值，以及获取所述第三类别细粒度时间段的前序细粒度时间段的第三历史客流量；

根据所述第三历史客流量以及所述第一粗粒度客流量预测值计算所述第三类别细粒度时间段的客流量预测值。

优选的，所述根据所述平均历史客流量以及所述第一历史客流量，计算第一误差比例的具体过程为：

计算所述平均历史客流量与所述第一历史客流量的差值的绝对值，根据所述绝对值和所述第一历史客流量，计算第一误差比例。

优选的，所述确定细粒度时间段与粗粒度时间段的具体过程为：

确定粗粒度时间段的时长和细粒度时间段的时长；

根据所粗粒度时间段的时长和所述细粒度时间段的时长，将轨道交通的运营时间划分为n个细粒度时间段以及m个粗粒度时间段，其中n，m均为正整数。

优选的，所述粗粒度时间段的时长为所述细粒度时间段的时长的2倍，对于第i细粒度时间段，在所述粗粒度时间段中存在两个与所述第i细粒度时间段相对应的粗粒度时间段，其中i大于1小于n。

优选的，所述计算所述细粒度时间段的第一历史客流量在对应的粗粒度时间段的第二历史客流量中的平均历史占比值的具体过程为：

判断所述细粒度时间段是否存在两个相对应的粗粒度时间段；

若否，计算所述细粒度时间段的第一历史客流量在对应的粗粒度时间段的第二历史客流量中每天的历史占比值，根据所述历史占比值计算得到所述平均历史占比值；

若是，分别计算所述细粒度时间段的第一历史客流量在两个所述对应的粗粒度时间段的第二历史客流量中每天的历史占比值，得到第一历史占比值和第二历史占比值；

根据所述第一历史占比值和所述第二历史占比值计算得到第一平均历史占比值和第二平均历史占比值；

根据所述第一历史占比值和所述第一平均历史占比值计算第一方差，根据所述第二历史占比值和所述第二平均历史占比值计算第二方差；

根据所述第一方差和第二方差，在两个所述对应的粗粒度时间段确定与所述细粒度时间段所对应的第一粗粒度时间段；

将与所述第一粗粒度时间段相对应的平均历史占比值作为所述平均历史占比值。

优选的，所述获取所述第三类别细粒度时间段所对应的粗粒度时间段的第一粗粒度客流量预测值的具体过程为：

判断所述第三类别细粒度时间段是否存在两个相对应的粗粒度时间段；

若否，获取所述第三类别细粒度时间段所对应的粗粒度时间段的第一粗粒度客流量预测值；

若是，分别获取所述第三类别细粒度时间段两个相对应的粗粒度时间段的第一粗粒度客流量预测值。

优选的，所述根据所述第三历史客流量以及所述第一粗粒度客流量预测值计算所述第三类别细粒度时间段的客流量预测值的具体过程为：

若所述第三类别细粒度时间段对应的粗粒度时间段为一个，将所述对应的粗粒度时间段的第一粗粒度客流量预测值减去上一个细粒度时间段的所述第三历史客流量，得到所述第三类别细粒度时间段的客流量预测值；

若所述第三类别细粒度时间段对应的粗粒度时间段为两个，分别将两个所述对应的粗粒度时间段的第一粗粒度客流量预测值减去上一个细粒度时间段的所述第三历史客流量，得到所述第三类别细粒度时间段每天的第一客流量预测值和所述第三类别细粒度时间段每天的第二客流量预测值；

根据所述第一客流量预测值和所述第二客流量预测值计算第一客流量预测均值和第二客流量预测均值；

根据所述第一客流量预测值和所述第一客流量预测均值计算第三方差，根据所述第二客流量预测值和第二客流量预测均值计算第四方差；

根据所述第三方差和第四方差确定与所述第三类别细粒度时间段相对应的第二粗粒度时间段；

将所述第二粗粒度时间段所对应的客流量预测值作为所述第三类别细粒度时间段的客流量预测值。

优选的，还包括以下步骤：

判断所述客流量预测值是否需要进行修正；

若是，对所述客流量预测值进行修正。

优选的，所述对所述客流量预测值进行修正的具体过程为：

获取所述每个站点的乘客平均旅行时间；

根据所述平均旅行时间和所述细粒度时间段，确定所述客流量预测值中受所述平均旅行时间所影响的第四细粒度时间段；

为每个所述第四细粒度时间段分配权重；

计算当前细粒度时间段的上一个细粒度时间段的客流量误差值，根据所述权重、所述客流量误差值以及所述客流量预测值，对所述客流量预测值进行修正。

优选的，所述为每个所述第四细粒度时间段分配权重的具体过程为：

根据所述第一历史客流量计算所述每个站点的历史真实平均客流量；

计算所述每个站点的每个所述细粒度时间段的第一历史平均客流量，计算所述每个细粒度时间段的第一历史平均客流量在所述历史真实平均客流量中的平均历史比重；

根据所述平均历史比重为所述第四细粒度时间段分配权重。

第二方面，本发明实施例还提供了一种客流量预测装置，包括：

时间确定模块，用于确定细粒度时间段与粗粒度时间段，所述粗粒度时间段的时长为所述细粒度时间段的时长的整数倍；

历史客流量获取模块，用于获取每个站点每天在每个所述细粒度时间段的第一历史客流量以及每个站点每天在每个所述粗粒度时间段的第二历史客流量；

平均客流量计算模块，用于根据所述第一历史客流量计算所述每个站点在每个所述细粒度时间段对应的平均历史客流量；

粗粒度客流量预测值获取模块，用于获取每个所述粗粒度时间段的粗粒度客流量预测值；

客流量预测值计算模块，用于基于所述平均历史客流量、所述粗粒度客流量预测值、所述第一历史客流量以及所述第二历史客流量，对所述每个站点的细粒度时间段进行分类，根据预设规则计算每个站点不同类别的细粒度时间段的客流量预测值。

在上述实施例的基础上，历史客流量获取模块包括：

第一历史客流量计算子单元，用于获取地铁乘客的历史刷卡信息，根据历史刷卡信息统计每个站点每天在每个细粒度时间段的第一历史客流量；

第二历史客流量计算子单元，用于根据第一历史客流量统计每个站点每天在每个粗粒度时间段的第二历史客流量。

在上述实施例的基础上，客流量预测值计算模块包括：

第一误差比例计算子单元，用于根据平均历史客流量以及第一历史客流量，计算第一误差比例；

第一误差阈值判断子单元，用于判断第一误差比例是否小于第一误差阈值；

第一类别细粒度时间段确定子单元，用于若第一误差比例小于第一误差阈值，将该细粒度时间段确定为第一类别细粒度时间段，将第一类别细粒度时间段的平均历史客流量作为第一类别细粒度时间段的客流量预测值；

平均历史占比值计算子单元，用于若第一误差比例大于等于第一误差阈值，计算细粒度时间段的第一历史客流量在对应的粗粒度时间段的第二历史客流量中的平均历史占比值，细粒度时间段对应的粗粒度时间段为细粒度时间段所属的粗粒度时间段；

占比误差阈值判断子单元，用于根据所述平均历史占比值计算占比误差，判断所述占比误差是否小于占比误差阈值；

第二类别细粒度时间段确定子单元，用于若占比误差小于占比误差阈值，将该细粒度时间段确定为第二类别细粒度时间段，根据平均历史占比值以及粗粒度客流量预测值计算第二类别细粒度时间段的客流量预测值；

第三类别细粒度时间段确定子单元，用于若占比误差大于等于占比误差阈值，将该细粒度时间段确定为第三类别细粒度时间段，且第三类别细粒度时间段的客流量只受前序细粒度时间段的第三历史客流量的影响；

数据获取子单元，用于获取第三类别细粒度时间段所对应的粗粒度时间段的第一粗粒度客流量预测值，以及获取第三类别细粒度时间段的前序细粒度时间段的第三历史客流量。

第三类别细粒度时间段客流量计算子单元，用于根据第三历史客流量以及第一粗粒度客流量预测值计算第三类别细粒度时间段的客流量预测值。

在上述实施例的基础上，第一误差比例计算子单元具体用于计算平均历史客流量与第一历史客流量的差值的绝对值，根据绝对值和第一历史客流量，计算第一误差比例。

在上述实施例的基础上，时间确定模块包括：

时长确定子单元，用于确定粗粒度时间段的时长和细粒度时间段的时长。

时间划分子单元，用于根据所粗粒度时间段的时长和细粒度时间段的时长，将轨道交通的运营时间划分为n个细粒度时间段以及m个粗粒度时间段，其中n，m均为正整数。

在上述实施例的基础上，粗粒度时间段的时长为细粒度时间段的时长的2倍，对于第i细粒度时间段，在粗粒度时间段中存在两个与第i细粒度时间段相对应的粗粒度时间段，其中i大于1小于n。

在上述实施例的基础上，平均历史占比值计算子单元，用于计算细粒度时间段的第一历史客流量在对应的粗粒度时间段的第二历史客流量中的平均历史占比值的具体过程为：

用于判断细粒度时间段是否存在两个相对应的粗粒度时间段；若否，计算细粒度时间段的第一历史客流量在对应的粗粒度时间段的第二历史客流量中每天的历史占比值，根据历史占比值计算得到平均历史占比值；若是，分别计算细粒度时间段的第一历史客流量在两个对应的粗粒度时间段的第二历史客流量中每天的历史占比值，得到第一历史占比值和第二历史占比值；根据第一历史占比值和第二历史占比值计算得到第一平均历史占比值和第二平均历史占比值；根据第一历史占比值和第一平均历史占比值计算第一方差，根据第二历史占比值和第二平均历史占比值计算第二方差；根据第一方差和第二方差，在两个对应的粗粒度时间段确定与细粒度时间段所对应的第一粗粒度时间段；将与第一粗粒度时间段相对应的平均历史占比值作为平均历史占比值。

在上述实施例的基础上，数据获取子单元，用于获取第三类别细粒度时间段所对应的粗粒度时间段的第一粗粒度客流量预测值的具体过程为：

用于判断第三类别细粒度时间段是否存在两个相对应的粗粒度时间段；若否，获取第三类别细粒度时间段所对应的粗粒度时间段的第一粗粒度客流量预测值；若是，分别获取第三类别细粒度时间段两个相对应的粗粒度时间段的第一粗粒度客流量预测值。

在上述实施例的基础上，第三类别细粒度时间段客流量计算子单元用于根据第三历史客流量以及第一粗粒度客流量预测值计算第三类别细粒度时间段的客流量预测值的具体过程为：

用于若第三类别细粒度时间段对应的粗粒度时间段为一个，将对应的粗粒度时间段的第一粗粒度客流量预测值减去上一个细粒度时间段的第三历史客流量，得到第三类别细粒度时间段的客流量预测值；若第三类别细粒度时间段对应的粗粒度时间段为两个，分别将两个对应的粗粒度时间段的第一粗粒度客流量预测值减去上一个细粒度时间段的第三历史客流量，得到第三类别细粒度时间段每天的第一客流量预测值和第三类别细粒度时间段每天的第二客流量预测值；根据第一客流量预测值和第二客流量预测值计算第一客流量预测均值和第二客流量预测均值；根据第一客流量预测值和第一客流量预测均值计算第三方差，根据第二客流量预测值和第二客流量预测均值计算第四方差；根据第三方差和第四方差确定与第三类别细粒度时间段相对应的第二粗粒度时间段；将第二粗粒度时间段所对应的客流量预测值作为第三类别细粒度时间段的客流量预测值。

在上述实施例的基础上，客流量预测装置还包括修正判断模块，用于判断客流量预测值是否需要进行修正；若是，对客流量预测值进行修正。

在上述实施例的基础上，修正模块还包括：

平均旅行时间获取子模块，用于获取每个站点的乘客平均旅行时间；

第四细粒度时间段确定子模块，用于根据平均旅行时间和细粒度时间段，确定客流量预测值中受平均旅行时间所影响的第四细粒度时间段；

权重分配子模块，用于为每个第四细粒度时间段分配权重；

修正子模块，用于计算当前细粒度时间段的上一个细粒度时间段的客流量误差值，根据权重、客流量误差值以及客流量预测值，对客流量预测值进行修正。

在上述实施例的基础上，权重分配子模块，用于为每个第四细粒度时间段分配权重的具体过程为：

用于根据第一历史客流量计算每个站点的历史真实平均客流量；计算每个站点的每个细粒度时间段的第一历史平均客流量，计算每个细粒度时间段的第一历史平均客流量在历史真实平均客流量中的平均历史比重；根据平均历史比重为第四细粒度时间段分配权重。

第三方面，本发明实施例提供了一种客流量预测设备，所述设备包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如第一方面所述的客流量预测方法。

第四方面，本发明实施例提供了一种存储计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面所述的客流量预测方法。

上述，首先确定细粒度时间段与粗粒度时间段，粗粒度时间段的时长为细粒度时间段的时长的整数倍；之后，获取每个站点每天在每个细粒度时间段的第一历史客流量以及每个站点每天在每个粗粒度时间段的第二历史客流量；根据第一历史客流量计算每个站点每天的平均历史客流量；之后，获取每个粗粒度时间段的粗粒度客流量预测值；最后，基于平均历史客流量、粗粒度客流量预测值、第一历史客流量以及第二历史客流量，对每个细粒度时间段进行分类，根据预设规则计算每个站点不同类别的细粒度时间段的客流量预测值。本发明实施例在计算客流预测值之前，获取了粗粒度客流量预测值，并根据获取到的平均历史客流量、粗粒度客流量预测值、第一历史客流量以及第二历史客流量对每个细粒度时间段进行分类，之后根据预设规则计算不同类别的细粒度时间段的客流量预测值，在计算细粒度时间段的客流量预测值时利用了粗粒度时间段的粗粒度客流量预测值，提高了客流量预测值的准确性，解决了现有技术在对地铁的客流量进行预测时，存在着预测结果的准确率低的技术问题。

附图说明

图1为本发明实施例提供的一种客流量预测方法的方法流程图。

图2为本发明实施例提供的另一种客流量预测方法的方法流程图。

图3为本发明实施例提供的一种客流量预测装置的结构示意图。

图4为本发明实施例提供的一种客流量预测设备的结构示意图。

具体实施方式

以下描述和附图充分地示出本申请的具体实施方案，以使本领域的技术人员能够实践它们。实施例仅代表可能的变化。除非明确要求，否则单独的部件和功能是可选的，并且操作的顺序可以变化。一些实施方案的部分和特征可以被包括在或替换其他实施方案的部分和特征。本申请的实施方案的范围包括权利要求书的整个范围，以及权利要求书的所有可获得的等同物。在本文中，各实施方案可以被单独地或总地用术语“发明”来表示，这仅仅是为了方便，并且如果事实上公开了超过一个的发明，不是要自动地限制该应用的范围为任何单个发明或发明构思。本文中，诸如第一和第二等之类的关系术语仅仅用于将一个实体或者操作与另一个实体或操作区分开来，而不要求或者暗示这些实体或操作之间存在任何实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素。本文中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的结构、产品等而言，由于其与实施例公开的方法部分相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

本申请实施例中提供的客流量预测方法可以由客流量预测设备执行，该客流量预测设备可以通过软件和/或硬件的方式实现，该客流量预测设备可以是两个或多个物理实体构成，也可以由一个物理实体构成。

实施例一

图1为本发明实施例提供的一种客流量预测方法的流程图，本实施例可适用于对客流量进行预测，该方法可以由计算设备来执行，具体包括如下步骤：

步骤101、确定细粒度时间段与粗粒度时间段，粗粒度时间段的时长为细粒度时间段的时长的整数倍。

在本实施例中，由于对客流量进行预测是针对时间粒度范围进行的，因此，需要首先确定粗粒度时间段的时长和细粒度时间段的时长，之后，根据确定的时长对每一天时间进行划分，得到每天的细粒度时间段与粗粒度时间段，其中，粗粒度时间段的时长是细粒度时间段的时长的整数倍。可理解，粗粒度时间段的时长和细粒度时间段的时长可根据实际需要进行设置。示例性的，将粗粒度时间段的时长设置为60分钟，将细粒度时间段的时长设置为30分钟，或者是，将粗粒度时间段的时长设置为30分钟，将细粒度时间段的时长设置为15分钟，当然也可以将粗粒度时间段的时长设置为60分钟，将细粒度时间段的时长设置为15分钟，在此不作限定。

步骤102、获取每个站点每天在每个细粒度时间段的第一历史客流量以及每个站点每天在每个粗粒度时间段的第二历史客流量。

在确定了每天的细粒度时间段以及粗粒度时间段后，需要获取每个站点每天在每个细粒度时间段的第一历史客流量以及每个站点每天在每个粗粒度时间段的第二历史客流量。在一个实施例中，云端数据库中保存有每个站点每天在每个细粒度时间段的第一历史客流量以及每个站点每天在每个粗粒度时间段的第二历史客流量，通过云端数据库即可获取到第一历史客流量和第二历史客流量。在另一个实施例中，云端数据库中保存有乘客的历史刷卡信息，从云端数据库中获取乘客的历史刷卡信息后，对乘客的历史刷卡信息进行解析，可以得到第一历史客流量和第二历史客流量。

步骤103、根据第一历史客流量计算每个站点在每个细粒度时间段对应的平均历史客流量。

在本实施例中，得到每个站点每天在每个细粒度时间段的第一历史客流量后，即可根据第一历史客流量计算每个站点在每个细粒度时间段对应的平均历史客流量。示例性的，对于某个站点，将该站点每天的每个细粒度时间段的第一历史客流量相加即可得到该站点每个细粒度时间段的历史客流量，在得到该站点每个细粒度时间段的历史客流量后，将该站点每个细粒度时间段的历史客流量除以历史天数，即可得到该站点在每个细粒度时间段对应的平均历史客流量。

步骤104、获取每个站点在每个粗粒度时间段的粗粒度客流量预测值。

在本实施例中，在对细粒度时间段的客流量进行预测之前，还需要获取每个站点在每个粗粒度时间段的粗粒度客流量预测值。获取粗粒度客流量预测值的方式可根据实际需要进行设置，在一个实施例中，获取粗粒度客流量预测值的方式如下：首先，获取影响客流量预测因素对应的关联数据和预测站点标识，预测因素为时间参数、天气参数、属性参数中的至少一种；之后，将关联数据和预测站点标识输入至已训练好的客流量预测模型中，得到预测站点标识对应的预测客流量；之后，根据预测因素确定关联数据是否符合预设条件，当关联数据符合预设条件时，获取已训练的客流量影响因子；最后根据预测客流量和客流量影响因子计算得到预测站点标识对应的目标预测客流量，从而得到每个站点的粗粒度时间段的粗粒度客流量预测值。

步骤105、基于平均历史客流量、粗粒度客流量预测值、第一历史客流量以及第二历史客流量，对每个站点的细粒度时间段进行分类，根据预设规则计算每个站点不同类别的细粒度时间段的客流量预测值。

在本实施例中，在得到平均历史客流量、粗粒度客流量预测值、第一历史客流量以及第二历史客流量后，即可对每个站点的细粒度时间段进行分类，得到不同类别的细粒度时间段，之后，根据预设规则，对每个站点不同类别的细粒度时间段对应的客流量预测值进行计算，可理解，在预设规则中，不同类别的细粒度时间段的客流量预测值具有不同的计算方式。在一个实施例中，对每个站点的细粒度时间段进行分类后，将细粒度时间段分为客流量稳定的第一类别细粒度时间段、客流量不稳定的第二类别细粒度时间段以及客流量受前序细粒度时间段影响的第三类别细粒度时间段，其中，前序细粒度时间段根据粗粒度时间段的时长与细粒度时间段的时长之间的倍数确定，为对应的细粒度时间段前面的倍数减一个细粒度时间段，示例性的，如为2倍关系，则前序细粒度时间段为上一个细粒度时间段，如为4倍关系，则前序细粒度时间为前面的3个细粒度时间段，之后根据预设规则，计算每个站点不同类别的细粒度时间段的客流量预测值，对于第一类别细粒度时间段，由于第一类别细粒度时间段的客流比较稳定，因此可以将第一类别细粒度时间段对应的平均历史客流量作为对应的第一类别细粒度时间段的客流量预测值。对于第二类别细粒度时间段，由于第二类别细粒度时间段的客流不稳定，因此，可以计算第二类别细粒度时间段的第一历史客流量在对应的粗粒度时间段的第二历史客流量中的平均历史占比值，之后，根据平均历史占比值和粗粒度客流量预测值计算第二类别细粒度时间段的客流量预测值。对于第三类别细粒度时间段，由于第三类别细粒度时间段的客流量受前序细粒度时间段影响，因此，可以获取第三类别细粒度时间段所对应的粗粒度时间段的第一粗粒度客流量预测值，以及获取第三类别细粒度时间段的前序细粒度时间段的第三历史客流量，根据第三历史客流量和第一粗粒度客流量预测值来计算第三类别细粒度时间段的客流量预测值。其中，细粒度时间段对应的粗粒度时间段为细粒度时间段所属的粗粒度时间段，示例性的，在一个实施例中，粗粒度时间段的时长为60分钟，细粒度时间段的时长为30分钟，对于一个细粒度时间段[12:00，12:30]，存在相对应的两个粗粒度时间段[11:30，12:30]和[12:00，13:00]。

上述，首先确定细粒度时间段与粗粒度时间段，粗粒度时间段的时长为细粒度时间段的时长的整数倍；之后，获取每个站点每天在每个细粒度时间段的第一历史客流量以及每个站点每天在每个粗粒度时间段的第二历史客流量；根据第一历史客流量计算每个站点每天的平均历史客流量；之后，获取每个粗粒度时间段的粗粒度客流量预测值；最后，基于平均历史客流量、粗粒度客流量预测值、第一历史客流量以及第二历史客流量，对每个站点的细粒度时间段进行分类，根据预设规则计算不同类别的细粒度时间段的客流量预测值。本发明实施例在计算客流预测值之前，获取了粗粒度客流量预测值，并根据获取到的平均历史客流量、粗粒度客流量预测值、第一历史客流量以及第二历史客流量对每个站点的细粒度时间段进行分类，之后根据预设规则计算不同类别的细粒度时间段的客流量预测值，在计算细粒度时间段的客流量预测值时利用了粗粒度时间段的粗粒度客流量预测值，提高了客流量预测值的准确性，解决了现有技术在对地铁的客流量进行预测时，存在着预测结果的准确率低的技术问题。

实施例二

图2为本发明实施例提供的另一种客流量预测方法的流程图，具体包括如下步骤：

步骤201、确定细粒度时间段与粗粒度时间段，粗粒度时间段的时长为细粒度时间段的时长的整数倍。

在一个实施例中，确定细粒度时间段与粗粒度时间段的具体过程为：

步骤2011、确定粗粒度时间段的时长和细粒度时间段的时长。

在本实施例中，确定细粒度时间段与粗粒度时间段之前，需要确定粗粒度时间段的时长和细粒度时间段的时长，可理解，粗粒度时间段的时长和细粒度时间段的时长可根据实际需要进行设置，但需要确保粗粒度时间段的时长为细粒度时间段的时长的整数倍。示例性的，若粗粒度时间段的时长为细粒度时间段的时长的2倍，则当粗粒度时间段的时长为60分钟时，细粒度时间段的时长为30分钟，当粗粒度时间段的时长为30分钟时，细粒度时间段的时长为15分钟。

步骤2012、根据粗粒度时间段的时长和细粒度时间段的时长，将轨道交通的运营时间划分为n个细粒度时间段以及m个粗粒度时间段，其中n，m均为正整数。

确定了粗粒度时间段的时长和细粒度时间段的时长后，即可对轨道交通的运营时间进行划分，将轨道交通的运营时间划分为n个细粒度时间段以及m个粗粒度时间段，可理解，n，m均为正整数。在一个实施例中，粗粒度时间段的时长为60分钟，细粒度时间段的时长为30分钟，轨道交通的运营时间为[6:00,24:00],根据粗粒度时间段的时长和细粒度时间段的时长对轨道交通的运营时间进行划分，从而可以得到粗粒度时间段为[6:00,7:00]，[6:30,7:30]，[7:00,8:00]，[7:30,8:30]，[8:00,9:00]，……，[23:00,24:00]，细粒度时间段为[6:00,6:30]，[6:30,7:00]，[7:30,8:00]，……，[23:30,24:00]。

在一个实施例中，粗粒度时间段的时长为细粒度时间段的时长的2倍，对于第i细粒度时间段，在粗粒度时间段中存在两个与第i细粒度时间段相对应的粗粒度时间段，其中i大于1小于n。其中，需要进一步说明的是，细粒度时间段对应的粗粒度时间段为细粒度时间段所属的粗粒度时间段。示例性的，粗粒度时间段为[6:00,7:00]，[6:30,7:30]，[7:00,8:00]，[7:30,8:30]，[8:00,9:00]，……，[23:00,24:00]，细粒度时间段为[6:00,6:30]，[6:30,7:00]，[7:30,8:00]，……，[23:30,24:00]，对于第一个细粒度时间段[6:00,6:30]，只包含在第一个粗粒度时间段[6:00,7:00]之中，对于最后一个细粒度时间段[23:30,24:00]，只包含在最后一个粗粒度时间段[23:00,24:00]之中，因此，第一个细粒度时间段和最后一个细粒度时间段只有一个对应的粗粒度时间段。而对于其他细粒度时间段，例如[6:30,7:00]，存在两个对应的粗粒度时间段[6:00,7:00]和[6:30,7:30]。

步骤202、获取乘客的历史刷卡信息，根据历史刷卡信息统计每个站点每天在每个细粒度时间段的第一历史客流量。

获取乘客的历史刷卡信息，从而获取到每个乘客的历史出行信息，根据历史出行信息，可以统计每个站点每天在每个细粒度时间段的第一历史客流量。示例性的，乘客的历史刷卡信息所包含的信息如表1所示。

表1

从历史刷卡信息中提取出交通卡id、站点id、交易类型以及交易时间，即可得到每个乘客的历史出行信息，根据历史出行信息，即可确定每个站点每天在每个细粒度时间段的第一历史客流量。

步骤203、根据第一历史客流量统计每个站点每天在每个粗粒度时间段的第二历史客流量。

在统计出每个站点每天在每个细粒度时间段的第一历史客流量后，根据第一客流量，即可统计出每个站点每天在每个粗粒度时间段的第二历史客流量。在一个实施例中，根据细粒度时间段的时长t2和粗粒度时间段的时长t1，将地铁正常运营时间段划分为n个细粒度时间段[t2₀,t2₁],[t2₁,t2₂],[t2₂,t2₃],…,[t2_n-2,t2_n-1],[t2_n-1,t2_n]和m个粗粒度时间段[t1₀,t1₁],[t1₁,t1₂],…,[t1_m-1,t1_m]，每个粗粒度时间段的第二历史客流量为此粗粒度时间段所包含的多个细粒度时间段对应的第一历史客流量之和。以粗粒度时间段的时长t1为细粒度时间段的时长t2的2倍为例，此时m＝n-1，则[t1_m-1,t1_m]＝[t2_n-2,t2_n-1]+[t2_n-1,t2_n]。在统计出每个站点每天在每个细粒度时间段的第一历史客流量后，即可统计出对应的每个粗粒度时间段的第二历史客流量。

步骤204、根据第一历史客流量计算每个站点在每个细粒度时间段对应的平均历史客流量。

步骤205、获取每个站点在每个粗粒度时间段的粗粒度客流量预测值。

步骤206、根据平均历史客流量以及第一历史客流量，计算第一误差比例。

在得到每个站点在每个细粒度时间段对应的平均历史客流量以及第一历史客流量后，即可计算出平均历史客流量和第一历史客流量的差距，并将该差距作为第一误差比例，根据第一误差比例来判断该站点的第一历史客流量是否稳定。

在一个实施例中，根据平均历史客流量以及第一历史客流量，计算第一误差比例的具体过程为：

计算平均历史客流量与第一历史客流量的差值的绝对值，根据差值的绝对值和第一历史客流量，计算第一误差比例。

在本实施例中，将第一历史客流量减去平均历史客流量，得到差值，求取差值的绝对值，之后，将差值的绝对值除以第一历史客流量，即可得到每个站点在每个细粒度时间段的第一误差比例。优选的，采用最近历史日期的第一历史客流量计算第一误差比例。示例性的，若第一历史客流量为300，平均历史客流量为200，将第一历史客流量减去平均历史客流量，得到差值的绝对值为100，之后，将100除以300，得到第一误差比例1/3。

步骤207、判断第一误差比例是否小于第一误差阈值。

在得到第一误差比例后，判断第一误差比例是否小于预先设置的第一误差阈值。可理解，在本实施例中，第一误差阈值的具体数值可根据实际需要进行设置，在本实施例不对第一误差阈值的具体数据进行限制。

步骤208、若第一误差比例小于第一误差阈值，将该细粒度时间段确定为第一类别细粒度时间段，将第一类别细粒度时间段的平均历史客流量作为第一类别细粒度时间段的客流量预测值。

在本实施例中，若一个细粒度时间段的第一误差比例小于第一误差阈值，则说明该站点在这个细粒度时间段的客流量十分稳定，该细粒度时间段的客流量与平均历史客流量十分接近，因此将该细粒度时间段作为第一类别细粒度时间段，并将该细粒度时间段的平均历史客流量作为该细粒度时间段的客流量预测值即可。

步骤209、若第一误差比例大于等于第一误差阈值，计算细粒度时间段的第一历史客流量在对应的粗粒度时间段的第二历史客流量中的平均历史占比值，细粒度时间段对应的粗粒度时间段为细粒度时间段所属的粗粒度时间段。

如果第一误差比例大于等于第一误差阈值，则说明该细粒度时间段的客流量不稳定，可以通过计算出每个细粒度时间段的第一历史客流量在对应的粗粒度时间段的第二历史客流量中的平均历史占比值，根据平均历史占比值来对该细粒度时间段的客流量进行预测。

其中，需要进一步说明的是，细粒度时间段对应的粗粒度时间段为细粒度时间段所属的粗粒度时间段。例如，根据细粒度时间段的时长t2和粗粒度时间段的时长t1，将地铁正常运营时间段进行划分为n个细粒度时间段和m个粗粒度时间段后，在细粒度时间段除了第1个时间段[t2₀,t2₁]和最后1个时间段[t2_n-1,t2_n]只对应一个粗粒度时间段[t1₀,t1₁]和[t1_m-1,t1_m]之外，其他的细粒度时间段都有多个粗粒度时间段对应；以粗粒度时间段的时长t1为细粒度时间段的时长t2的2倍为例，除第一个和最后一个细粒度时间段外，其他的细粒度时间段都有2个粗粒度时间段对应，即细粒度时间段[t2n-i-1,t2ni]对应的粗粒度时间段为[t1_m-i-1,t1_m-i]和[t1_m-i,t1_m-i+1]，其中m＝n-1。

在一个实施例中，计算细粒度时间段的第一历史客流量在对应的粗粒度时间段的第二历史客流量中的平均历史占比值的具体过程为：

步骤2091、判断细粒度时间段是否存在两个相对应的粗粒度时间段。

在本实施例中，由于存在一个细粒度时间段对应两个粗粒度时间段的情况，因此，首先需要判断细粒度时间段是否存在两个相对应的粗粒度时间段。在一个实施例中，可以通过判断细粒度时间段是否为第一个细粒度时间段或最后一个细粒度时间段，若是，则说明细粒度时间段只对应一个粗粒度时间段，若否，则说明细粒度时间段对应有两个粗粒度时间段，可理解，判断细粒度时间段是否存在两个相对应的粗粒度时间段的方式可根据实际需要进行设置。

步骤2092、若否，计算细粒度时间段的第一历史客流量在对应的粗粒度时间段的第二历史客流量中每天的历史占比值，根据历史占比值计算得到平均历史占比值。

若细粒度时间段只对应一个粗粒度时间段，则计算细粒度时间段的第一历史客流量在对应的粗粒度时间段的第二历史客流量中每天的历史占比值，之后，将每天的历史占比值之和除以历史天数，即可得到该细粒度时间段的第一历史客流量在对应的粗粒度时间段的第二历史客流量中的平均历史占比值。

步骤2093、若是，分别计算细粒度时间段的第一历史客流量在两个对应的粗粒度时间段的第二历史客流量中每天的历史占比值，得到第一历史占比值和第二历史占比值。

若细粒度时间段对应有两个粗粒度时间段，则需要分别计算细粒度时间段的第一历史客流量在两个对应的粗粒度时间段的第二历史客流量中每天的历史占比值，得到第一历史占比值和第二历史占比值。示例性的，在一个实施例中，细粒度时间段[6:30,7:00]存在两个对应的粗粒度时间段[6:00,7:00]和[6:30,7:30]，历史上某一天细粒度时间段[6:30,7:00]的第一历史客流量为50，粗粒度时间段[6:00,7:00]的第二历史客流量为120，粗粒度时间段[6:30,7:30]的第二历史客流量为150，分别计算第一历史客流量在两个第二历史客流量中的占比，第一历史占比值为50/120＝5/12，第二历史占比值为50/150＝1/3。

步骤2094、根据第一历史占比值和第二历史占比值计算得到第一平均历史占比值和第二平均历史占比值。

在得到细粒度时间段的第一历史客流量在两个对应的粗粒度时间段的第二历史客流量中每天的第一历史占比值和第二历史占比值后，将每天的第一历史占比值进行相加，之后再除以历史天数，从而得到了第一平均历史占比值。同理，将每天的第二历史占比值进行相加，之后再除以历史天数，可以得到第二平均历史占比值。

步骤2095、根据第一历史占比值和第一平均历史占比值计算第一方差，根据第二历史占比值和第二平均历史占比值计算第二方差。

在得到第一历史占比值和第一平均历史占比值后，即可计算出两个对应的粗粒度时间段中其中一个粗粒度时间段所对应的第一方差；根据第二历史占比值和第二平均历史占比值，可计算出另外一个粗粒度时间段所对应的第二方差。

步骤2096、根据第一方差和第二方差，在两个对应的粗粒度时间段确定与细粒度时间段所对应的第一粗粒度时间段。

在本实施例中，在得到第一方差和第二方差后，从第一方差和第二方差中选取出数值较小的方差，并将数值较小的方差所对应的粗粒度时间段确定为与细粒度时间段相对应的第一粗粒度时间段。示例性的，若根据第一历史占比值和第一平均历史占比值计算出的第一方差为1，根据第二历史占比值和第二平均历史占比值计算第二方差为1.25，则第一方差的值更小，将第一方差所对应的粗粒度时间段作为细粒度时间段所对应的第一粗粒度时间段。

步骤2097、将与第一粗粒度时间段相对应的平均历史占比值作为平均历史占比值。

在确定了与细粒度时间段相对应的第一粗粒度时间段后，由于步骤2094中已经计算出了第一平均历史占比值和第二平均历史占比值，因此，在第一平均历史占比值和第二平均历史占比值中选取出与第一粗粒度时间段相对应的平均历史占比值，并将其作为细粒度时间段的第一历史客流量在对应的粗粒度时间段的第二历史客流量中的平均历史占比值。

步骤210、根据平均历史占比值计算占比误差，判断占比误差是否小于占比误差阈值。

在本实施例中，在得到平均历史占比值后，获取细粒度时间段在相对应的第一粗粒度时间段的历史占比值，根据历史占比值，即可计算出历史占比值与平均历史占比值的差距，并将该差距作为占比误差。

在一个实施例中，计算出历史占比值与平均历史占比值的差距的具体过程为：将历史占比值减去平均历史占比值，得到差值，求取差值的绝对值，之后，将差值的绝对值除以历史占比值，即可得到细粒度时间段的占比误差。优选的，采用最近历史日期的历史占比值计算占比误差。

在确定了占比误差后，需要进一步判断占比误差和预先设置的占比误差阈值的大小，根据大小对细粒度时间段进行分类。可理解，占比误差阈值的具体数值可根据实际需要进行设置，在本实施例中不对占比误差阈值的具体数值进行限定。

步骤211、若占比误差小于占比误差阈值，将该细粒度时间段确定为第二类别细粒度时间段，根据平均历史占比值以及粗粒度客流量预测值计算第二类别细粒度时间段的客流量预测值。

在本实施例中，若细粒度时间段的第一历史客流量在对应的粗粒度时间段的第二历史客流量中的占比误差小于占比误差阈值，则说明该细粒度时间段的客流量在对应的粗粒度时间段的客流量中的占比比较稳定，因此，将该细粒度时间段确定为第二类别细粒度时间段，可以根据粗粒度时间段的粗粒度客流量预测值来对第二类别细粒度时间段的客流量进行预测。获取第二类别细粒度时间段对应的粗粒度时间段的粗粒度客流量预测值，之后，将粗粒度客流量预测值乘以第二类别细粒度时间段的平均历史占比值，得到第二类别细粒度时间段的客流量预测值。

步骤212、若占比误差大于等于占比误差阈值，将该细粒度时间段确定为第三类别细粒度时间段，且第三类别细粒度时间段的客流量只受前序细粒度时间段的第三历史客流量的影响。

在本实施例中，若细粒度时间段的第一历史客流量在对应的粗粒度时间段的第二历史客流量中的占比误差大于等于占比误差阈值，则说明该细粒度时间段的客流量在对应的粗粒度时间段的客流量中的占比不稳定，不能使用粗粒度时间段的粗粒度客流量预测值对细粒度时间段的客流量进行预测。将该细粒度时间段确定为第三类别细粒度时间段，并且假设第三类别细粒度时间段的客流只受前序细粒度时间段的第三历史客流量的影响。

步骤213、获取第三类别细粒度时间段所对应的粗粒度时间段的第一粗粒度客流量预测值，以及获取第三类别细粒度时间段的前序细粒度时间段的第三历史客流量。

在确定了第三类别细粒度时间段之后，从粗粒度客流量预测值中，获取第三类别细粒度时间段所对应的粗粒度时间段的第一粗粒度客流量预测值，以及获取第三类别细粒度时间段的前序细粒度时间段的第三历史客流量。

在一个实施例中，粗粒度时间段的时长为细粒度时间段的时长的2倍，则前序细粒度时间段即为上一个细粒度时间段，获取第三类别细粒度时间段所对应的粗粒度时间段的第一粗粒度客流量预测值的具体过程为：

步骤2131、判断第三类别细粒度时间段是否存在两个相对应的粗粒度时间段。

由于第三类别细粒度时间段可能存在两个相对应的粗粒度时间段，因此，需要首先进行判断第三类别细粒度时间段是否存在两个相对应的粗粒度时间段，具体判断的过程可参考步骤2091，在此步骤中不再赘述。

步骤2132、若否，获取第三类别细粒度时间段所对应的粗粒度时间段的第一粗粒度客流量预测值。

如果第三类别细粒度时间段只对应一个粗粒度时间段，由于粗粒度客流量预测值中包含有每个站点在每个粗粒度时间段的粗粒度客流量预测值，因此，可以从粗粒度客流量预测值中获取第三类别细粒度时间段所对应的粗粒度时间段的第一粗粒度客流量预测值。

步骤2133、若是，分别获取第三类别细粒度时间段两个相对应的粗粒度时间段的第一粗粒度客流量预测值。

如果第三类别细粒度时间段对应有两个粗粒度时间段，则需要分别从粗粒度客流量预测值中获取第三类别细粒度时间段的两个相对应的粗粒度时间段的第一粗粒度客流量预测值。

步骤214、根据第三历史客流量以及第一粗粒度客流量预测值计算第三类别细粒度时间段的客流量预测值。

在本实施例中，在获取到第三类别细粒度时间段的前序细粒度时间段的第三历史客流量和第三类别细粒度时间段对应的粗粒度时间段的第一粗粒度客流量预测值后，由于第三类别细粒度时间段的客流量只受前序细粒度时间段的第三历史客流量的影响，因此，对于第三类别细粒度时间段，将第三类别细粒度时间段所对应的第一粗粒度客流量预测值减去前序细粒度时间段的第三历史客流量，即可得到第三类别细粒度时间段的客流量预测值。

在一个实施例中，粗粒度时间段的时长为细粒度时间段的时长的2倍，则前序细粒度时间段即为上一个细粒度时间段，根据第三历史客流量以及第一粗粒度客流量预测值计算第三类别细粒度时间段的客流量预测值的具体过程为：

步骤2141、若第三类别细粒度时间段对应的粗粒度时间段为一个，将对应的粗粒度时间段的第一粗粒度客流量预测值减去第三历史客流量，得到第三类别细粒度时间段的客流量预测值。

若第三类别细粒度时间段只对应一个粗粒度时间段，则获取对应的粗粒度时间段的第一粗粒度客流量预测值，将第一粗粒度客流量预测值减去第三类别细粒度时间段的上一个细粒度时间段的第三历史客流量，从而得到第三类别细粒度时间段的客流量预测值。

步骤2142、若第三类别细粒度时间段对应的粗粒度时间段为两个，分别将两个对应的粗粒度时间段的第一粗粒度客流量预测值减去第三历史客流量，得到第三类别细粒度时间段每天的第一客流量预测值和第三站点每个细粒度时间段每天的第二客流量预测值。

在本实施例中，若第三类别细粒度时间段对应有两个粗粒度时间段，则需要进一步选择出与第三类别细粒度时间段相对应的粗粒度时间段，分别将两个粗粒度时间段的第一粗粒度客流量预测值减去第三类别细粒度时间段的上一个细粒度时间段的每天的第三历史客流量，从而得到第三类别细粒度时间段每天的第一客流量预测值和第三类别细粒度时间段每天的第二客流量预测值。

步骤2143、根据第一客流量预测值和第二客流量预测值计算第一客流量预测均值和第二客流量预测均值。

在本实施例中，在得到每天的第一客流量预测值后，将每天第一客流量预测值之和除以历史天数，即可得到第一客流量预测均值，同理，将每天的第二客流量预测值之和除以历史天数，即可得到第二客流量预测均值。

步骤2144、根据第一客流量预测值和第一客流量预测均值计算第三方差，根据第二客流量预测值和第二客流量预测均值计算第四方差。

在得到第一客流量预测值和第一客流量预测均值后，即可计算出两个对应的粗粒度时间段中其中一个粗粒度时间段所对应的第三方差，根据第二客流量预测值和第二客流量预测均值后，可计算出另外一个粗粒度时间段所对应的第四方差。

步骤2145、根据第三方差和第四方差确定与第三类别细粒度时间段相对应的第二粗粒度时间段。

在本实施例中，在得到第三方差和第四方差后，从第三方差和第四方差中选取出数值较小的方差，并将数值较小的方差所对应的粗粒度时间段确定为与第三类别细粒度时间段相对应的第二粗粒度时间段。

步骤2146、将第二粗粒度时间段所对应的客流量预测值作为第三类别细粒度时间段的客流量预测值。

在确定了与第三类别细粒度时间段相对应的第二粗粒度时间段后，由于步骤2143中已经计算出了第一客流量预测均值和第二客流量预测均值，因此，在第一客流量预测均值和第二客流量预测均值中选取出与第二粗粒度时间段相对应的客流量预测均值，并将其作为第三类别细粒度时间段的客流量预测值。

步骤215、判断客流量预测值是否需要进行修正。

在得到每个细粒度时间段的客流量预测值后，由于每个细粒度时间段的真实客流量会受到多种因素的影响，导致每个细粒度时间段的真实客流量发生变化，因此需要判断是否根据实时的客流量对客流量预测值进行修正。在一个实施例中，判断客流量预测值是否需要进行修正的具体过程为：截止至目前为止，获取当前细粒度时间段的上一个细粒度时间段的真实客流量forward_true_flow和上一个细粒度的客流量预测值forward_predict_flow，计算真实客流量forward_true_flow和客流量预测值forward_predict_flow的客流量误差值error_rate，客流量误差值error_rate＝|forward_true_flow-forward_predict_flow|/forward_true_flow，如果客流量误差值error_rate大于预先设置的阈值，说明需要对客流量预测结果进行修正。

步骤216、若是，对客流量预测值进行修正。

在一个实施例中，对客流量预测值进行修正的具体过程为：

步骤2161、获取每个站点的乘客平均旅行时间。

在本实施例中，如果实时客流量的增加或者减少如果超过一定的比例，那么增加或者减少的客流量会影响接下来一段时间的客流量。为了衡量实时客流量的变化对后续细粒度时间段的影响，首先需要获取每个站点的乘客平均旅行时间。在一个实施例中，可以通过统计历史一段时间的所有乘客在该站点进出站的时间从而得到平均旅行时间avg_travel_time。

步骤2162、根据平均旅行时间和细粒度时间段，确定客流量预测值中受平均旅行时间所影响的第四细粒度时间段。

在得到平均旅行时间avg_travel_time后，需要在接下来的细粒度时间段中确定受平均旅行时间所影响的第四细粒度时间段的个数。在一个实施例中，首先获取细粒度时间段的时长，之后，将平均旅行时间除以时长，从而得到了第四细粒度时间段的个数，根据第四细粒度时间段的个数，即可在客流量预测值中确定后续受到平均旅行时间所影响的第四细粒度时间段。示例性的，在一个实施例中，若平均旅行时间为30分钟，细粒度时间段的时长为15分钟，则可以确定受平均旅行时间所影响的第四细粒度时间段的个数为30/15＝2个，即当前细粒度时间段的后续2个细粒度时间段会受到平均旅行时间的影响，从而可以确定出第四细粒度时间段，之后，生成影响时刻列表，影响时刻列表中包含有第四细粒度时间段。

步骤2163、为每个第四细粒度时间段分配权重。

在客流量预测值中确定了后续受平均旅行时间所影响的第四细粒度时间段后，为每个第四细粒度时间段分配权重，以便于后续对每个第四细粒度时间段的客流量预测值进行修正。

在一个实施例中，为每个第四细粒度分配权重的具体过程为；

步骤21631、根据第一历史客流量计算每个站点的历史真实平均客流量。

在本实施例中，将每个站点每天的每个细粒度时间段的第一历史客流量进行相加，可以得到每个站点每天的历史真实客流量，之后，将每天的历史真实客流量除以历史天数，可以得到每个站点的历史真实平均客流量。

步骤21632、计算每个站点的每个细粒度时间段的第一历史平均客流量，计算每个细粒度时间段的第一历史平均客流量在历史真实平均客流量中的平均历史比重。

将每个站点每天的每个细粒度时间段的第一历史客流量相加，可以得到每个细粒度时间段的第一历史客流量总量，将第一历史客流量总量除以历史天数，可以得到每个细粒度时间段的第一历史平均客流量。之后，将第一历史平均客流量除以历史真实平均客流量，可以得到每个细粒度时间段的第一历史平均客流量在历史真实平均客流量中的平均历史比重。

步骤21633、根据平均历史比重为第四细粒度时间段分配权重。

在得到每个细粒度时间段的第一历史平均客流量在历史真实平均客流量中的平均历史比重后，根据平均历史比重，即可将与第四细粒度时间段相同的细粒度时间段对应的平均历史比重分配给第四细粒度时间段，从而为每个第四细粒度时间段分配权重。

步骤2164、计算当前细粒度时间段的上一个细粒度时间段的客流量误差值，根据权重、客流量误差值以及客流量预测值，对客流量预测值进行修正。

在本实施例中，首先需要当前细粒度时间段的上一个细粒度时间段的客流量误差值，之后，根据权重、客流量误差值以及客流量预测值，即可对客流量预测值进行修正。在一个实施例中，具体的修正过程如下：

获取当前细粒度时间段的上一个细粒度时间段的真实客流量forward_true_flow和上一个细粒度的客流量预测值forward_predict_flow，计算真实客流量forward_true_flow和客流量预测值forward_predict_flow的客流量误差值error_rate，客流量误差值的计算公式为：

error_rate＝|forward_true_flow-forward_predict_flow|/forward_true_flow

若客流量预测值forward_predict_flow大于真实客流量forward_true_flow，则计算公式为：

flow_error＝forward_predict_flow-forward_true_flow×(1+error_threshold)

其中error_threshold允许对客流量进行预测的误差的范围。

若客流量预测值forward_predict_flow小于真实客流量forward_true_flow，则计算公式为：

flow_error＝forward_true_flow×(1-error_threshold)-forward_predict_flow

修正第四细粒度时间段的客流预测值：

如果若客流量预测值forward_predict_flow大于真实客流量forward_true_flow，则对于每个第四细粒度时间段的修正公式：

new_predict_flow＝old_predict_flow+flow_error×distribution_proportion

若客流量预测值forward_predict_flow小于真实客流量forward_true_flow，则对于每个第四细粒度时间段的修正公式：

new_predict_flow＝old_predict_flow-flow_error×distribution_proportion

其中，new_predict_flow是修正后的客流量预测值，old_predict_flow是修正前的客流量预测值distribution_proportion是每个第四细粒度时间段对应的权重。

上述，首先确定细粒度时间段与粗粒度时间段，粗粒度时间段的时长为细粒度时间段的时长的整数倍；之后，获取每个站点每天在每个细粒度时间段的第一历史客流量以及每个站点每天在每个粗粒度时间段的第二历史客流量；根据第一历史客流量计算每个站点每天的平均历史客流量；之后，获取每个粗粒度时间段的粗粒度客流量预测值；最后，基于平均历史客流量、粗粒度客流量预测值、第一历史客流量以及第二历史客流量，对每个细粒度时间段进行分类，根据预设规则计算每个站点不同类别的细粒度时间段的客流量预测值。本发明实施例在计算客流预测值之前，获取了粗粒度客流量预测值，并根据获取到的平均历史客流量、粗粒度客流量预测值、第一历史客流量以及第二历史客流量对每个细粒度时间段进行分类，之后根据预设规则计算每个站点不同类别的细粒度时间段的客流量预测值，在计算细粒度时间段的客流量预测值时利用了粗粒度时间段的粗粒度客流量预测值，提高了客流量预测值的准确性。并且本发明实施例充分考虑到了在实际的场景中，实际的客流量会受到各种元素的影响，因此利用了实时的客流量来对客流预测结果进行修正，进一步提高了客流预测结果的准确率，预测效果更好。本发明实施例在对客流预测结果进行修正的过程中，将个体行为特征应用到了客流修正过程中，通过计算出每个站点的乘客平均旅行时间，进而确定出需要修正的第四细粒度时间段，同时，根据每个站点的历史真实平均客流量为每个第四细粒度时间段分配权重，使得修正后的客流量值更加符合实际，提高客流预测结果的准确率。解决了现有技术在对地铁的客流量进行预测时，存在着预测结果的准确率低的技术问题。

实施例三

如图3所示，图3为本发明实施例提供的一种客流量预测装置的结构示意图，在本实施例中，客流量预测装置包括：

时间确定模块301，用于确定细粒度时间段与粗粒度时间段，所述粗粒度时间段的时长为所述细粒度时间段的时长的整数倍；

历史客流量获取模块302，用于获取每个站点每天在每个所述细粒度时间段的第一历史客流量以及每个站点每天在每个所述粗粒度时间段的第二历史客流量；

平均客流量计算模块303，用于根据所述第一历史客流量计算所述每个站点在每个所述细粒度时间段对应的平均历史客流量；

粗粒度客流量预测值获取模块304，用于获取每个所述粗粒度时间段的粗粒度客流量预测值；

客流量预测值计算模块305，用于基于所述平均历史客流量、所述粗粒度客流量预测值、所述第一历史客流量以及所述第二历史客流量，对所述每个站点的细粒度时间段进行分类，根据预设规则计算每个站点不同类别的细粒度时间段的客流量预测值。

在上述实施例的基础上，历史客流量获取模块302包括：

在上述实施例的基础上，客流量预测值计算模块305包括：

在上述实施例的基础上，时间确定模块301包括：

在上述实施例的基础上，修正模块还包括：

权重分配子模块，用于为每个第四细粒度时间段分配权重；

实施例四

图4为本发明实施例提供的一种客流量预测设备的结构示意图，如图4所示，该设备包括处理器401、存储器402、输入装置403和输出装置404；设备中处理器401的数量可以是一个或多个，图4中以一个处理器401为例；设备中的处理器401、存储器402、输入装置403和输出装置404可以通过总线或其他方式连接，图4中以通过总线连接为例。存储器402作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块，如本发明实施例中的客流量预测方法对应的程序指令/模块。处理器401通过运行存储在存储器402中的软件程序、指令以及模块，从而执行设备的各种功能应用以及数据处理，即实现上述任一实施例所描述的客流量预测方法。输入装置403可用于接收输入的数字或字符信息，以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置404可包括显示屏等显示设备。

实施例五

本发明实施例还提供一种包含计算机可执行指令的存储介质，计算机可执行指令在由计算机处理器执行时用于执行客流量预测方法，该方法包括：

确定细粒度时间段与粗粒度时间段，粗粒度时间段的时长为细粒度时间段的时长的整数倍；

获取每个站点每天在每个细粒度时间段的第一历史客流量以及每个站点每天在每个粗粒度时间段的第二历史客流量；

根据第一历史客流量计算每个站点在每个细粒度时间段对应的平均历史客流量；

获取每个站点在每个粗粒度时间段的粗粒度客流量预测值；

本发明实施例所提供的客流量预测装置、设备和存储介质，可实现本发明任一实施例所描述的客流量预测方法。

注意，上述仅为本发明实施例的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明实施例不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明实施例的保护范围。因此，虽然通过以上实施例对本发明实施例进行了较为详细的说明，但是本发明实施例不仅仅限于以上实施例，在不脱离本发明实施例构思的情况下，还可以包括更多其他等效实施例，而本发明实施例的范围由所附的权利要求范围决定。

Claims

1.一种客流量预测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种客流量预测方法，其特征在于，所述获取每个站点每天在每个所述细粒度时间段的第一历史客流量以及每个站点每天在每个所述粗粒度时间段的第二历史客流量的具体过程为：

3.根据权利要求1所述的一种客流量预测方法，其特征在于，所述基于所述平均历史客流量、所述粗粒度客流量预测值、所述第一历史客流量以及所述第二历史客流量，对所述每个站点的细粒度时间段进行分类，根据预设规则计算每个站点不同类别的细粒度时间段的客流量预测值的具体过程为：

判断所述第一误差比例是否小于第一误差阈值；

4.根据权利要求3所述的一种客流量预测方法，其特征在于，所述根据所述平均历史客流量以及所述第一历史客流量，计算第一误差比例的具体过程为：

5.根据权利要求3所述的一种客流量预测方法，其特征在于，所述确定细粒度时间段与粗粒度时间段的具体过程为：

确定粗粒度时间段的时长和细粒度时间段的时长；

6.根据权利要求5所述的一种客流量预测方法，其特征在于，所述粗粒度时间段的时长为所述细粒度时间段的时长的2倍，对于第i细粒度时间段，在所述粗粒度时间段中存在两个与所述第i细粒度时间段相对应的粗粒度时间段，其中i大于1小于n。

7.根据权利要求6所述的一种客流量预测方法，其特征在于，所述计算所述细粒度时间段的第一历史客流量在对应的粗粒度时间段的第二历史客流量中的平均历史占比值的具体过程为：

8.根据权利要求6所述的一种客流量预测方法，其特征在于，所述获取所述第三类别细粒度时间段所对应的粗粒度时间段的第一粗粒度客流量预测值的具体过程为：

9.根据权利要求8所述的一种客流量预测方法，其特征在于，所述根据所述第三历史客流量以及所述第一粗粒度客流量预测值计算所述第三类别细粒度时间段的客流量预测值的具体过程为：

10.根据权利要求1所述的一种客流量预测方法，其特征在于，还包括以下步骤：

判断所述客流量预测值是否需要进行修正；

若是，对所述客流量预测值进行修正。

11.根据权利要求10所述的一种客流量预测方法，其特征在于，所述对所述客流量预测值进行修正的具体过程为：

获取所述每个站点的乘客平均旅行时间；

为每个所述第四细粒度时间段分配权重；

12.根据权利要求11所述的一种客流量预测方法，其特征在于，所述为每个所述第四细粒度时间段分配权重的具体过程为：

根据所述平均历史比重为所述第四细粒度时间段分配权重。

13.一种客流量预测装置，其特征在于，包括：

14.一种客流量预测设备，其特征在于，所述设备包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-12中任一项所述的客流量预测方法。

15.一种存储计算机可执行指令的存储介质，其特征在于，所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-12中任一项所述的客流量预测方法。