CN110210656B

CN110210656B - 基于站点行为分析的共享单车流量预测方法及系统

Info

Publication number: CN110210656B
Application number: CN201910424740.0A
Authority: CN
Inventors: 周纤; 沈艳艳; 黄林鹏
Original assignee: Shanghai Jiaotong University
Current assignee: Shanghai Jiaotong University
Priority date: 2019-05-21
Filing date: 2019-05-21
Publication date: 2021-07-13
Anticipated expiration: 2039-05-21
Also published as: CN110210656A

Abstract

本发明提供了一种流量预测技术领域内的基于站点行为分析的共享单车流量预测方法，包括如下步骤：S1，数据预处理：包括数据清洗、计算流量和归一化处理；S2，构建模型：包括站点间流动建模、动态站点内行为建模和外部影响因素建模；S3，训练模型：将训练数据输入步骤S2所构建的模型，使用Adam优化器梯度下降算法来训练模型得到最优参数；S4，流量预测：输入若干历史站点出行流量数据、站点间流通量数据及外部因子数据到经步骤S3训练的模型内，模型输出下一时间段内的站点出行流量包括流入量和流出量。本发明同时对站点间动态流通行为和站点内行为变化建模来估量站点的动态行为变化，能及时捕捉到站点的动态流量变化，达到更高的流量预测准确性。

Description

基于站点行为分析的共享单车流量预测方法及系统

技术领域

本发明流量预测技术领域，具体的，涉及一种基于站点行为分析的共享单车流量预测方法及系统，通过同时对站点间动态流通行为和站点内行为变化建模来提升站点流量预测的准确性。

背景技术

流量预测对于构建智能交通系统具有重要意义，能够帮助政府提前规划、出行公司合理调整资源等。在共享单车方面，现有方法大多利用外部因素数据如天气、时间等特征构建相似性函数或机器学习模型如随机森林等来预测未来站点出行流量。然而这些方法在对站点间流通行为建模时大多采用统计方法，同时它们没有考虑到站点本身的特点，比如相比郊区的站点来说，在市区的交通中心附近的站点会有更多的出行流量，i.e.,流入量check-ins和流出量check-outs。

然而根据实际数据我们发现，站点间的流通量随着时间变化，统计方法无法准确捕捉到动态的流通量变化情况。除此之外，站点本身的行为存在多样性，在预测模型中需要对站点进行特征抽取。

因此，对站点间动态流通行为和站点行为特征建模在共享单车流量预测系统中至关重要。

经现有技术检索，中国发明专利号为CN201810288808.2，发明名称为一种基于近邻传播-趋势迭代聚类的共享单车流量预测方法及装置，包括以下步骤：获取城市的共享单车车站信息、历史行程信息和历史气象信息；基于近邻传播聚类方法和单车迁移趋势，对车站进行聚类；根据历史行程信息，计算每个类簇的历史单车租用情况；根据历史单车租用情况和历史气象信息，进行共享单车租用和归还的预测。该发明不能及时捕捉到站点的动态流量变化，流量预测的准确性不高。

发明内容

针对现有技术中的缺陷，本发明的目的是提供一种基于站点行为分析的共享单车流量预测方法。

根据本发明提供的一种基于站点行为分析的共享单车流量预测方法，包括如下步骤：

S1，数据预处理：包括数据清洗、计算流量和归一化处理；

S2，构建模型：包括站点间流动建模、动态站点内行为建模和外部影响因素建模；

S3，训练模型：将训练数据输入步骤S2所构建的模型，使用Adam优化器梯度下降算法来训练模型获取最优参数；

S4，流量预测：输入若干历史站点出行流量数据、站点间流通量数据及外部因子数据到经步骤S3训练的模型内，模型输出下一时间段内的站点出行流量包括流入量和流出量。

一些实施例中，所述步骤S1中的所述计算流量为根据历史行程信息计算站点内流入流出量与站点间的流通量，所述归一化处理是将所有站点流量通过min-max归一化处理，并减去每个时间段的平均值。

一些实施例中，所述步骤S2中的所述站点间流动建模是将上一时间段的站点间的流通矩阵为基础构建实时动态的门矩阵，获取门矩阵后将上一时间段的站点流量分别经过门矩阵再输入一层全连接神经网络得到站点间流动模块的输出。

一些实施例中，所述步骤S2中的所述动态站点内行为建模包括站点向量表达、站点的动态上下文环境建模和站点的流量序列建模。

一些实施例中，所述站点向量表达基于站点间流通数据，采用自然语言模型Word2Vec的skip-gram模型。

一些实施例中，所述站点的动态上下文环境建模是利用实时的关联站点信息对上下文环境量化，为后续模型构建提供有效的输入。

一些实施例中，所述流量序列建模是基于LSTM的时域特征抽取，采用长短时记忆循环神经网络LSTM对全局时域特征建模。

一些实施例中，所述步骤S3训练模型包括初始化模型参数、使用训练集训练模型以及使用验证集选择模型。

一些实施例中，所述外部影响因素建模首先对所有外部因素数据预处理得到归一化的向量表达，再采用单层神经网络得到外部因素的影响输出。

一种基于站点行为分析的共享单车流量预测系统，采用所述的基于站点行为分析的共享单车流量预测方法，包括数据预处理模块、构建模型模块、训练模型模块、流量预测模块；

所述数据预处理模块进行数据清洗、计算流量和归一化处理；

所述构建模型模块包括站点间流动建模、动态站点内行为建模和外部影响因素建模；

所述训练模型模块是将训练数据输入构建模型模块内所构建的模型，使用Adam优化器梯度下降算法来训练模型获取最优参数；

流量预测模块通过输入若干历史站点出行流量数据、站点间流通量数据及外部因子数据到训练模型模块内的模型内，模型输出下一时间段内的站点出行流量包括流入量和流出量。

与现有技术相比，本发明具有如下的有益效果：

1、本发明同时对站点间动态流通行为和站点内行为变化建模来估量站点的动态行为变化，能够及时捕捉到站点的动态流量变化，达到更高的流量预测准确性。

2、本发明对站点流量的归一化处理能够去除量级比例对模型的影响，同时借鉴机器学习方法GBRT和图像处理ResNet模型中对残差建模的思想，在预处理的过程中减去每个时间段的平均值，提升模型预测的准确性。

3、本发明以上一时间段的站点间的流通矩阵为基础构建实时动态的门矩阵，来过滤不相关的其他站点，只保留实时关联的站点信息，解决了统计学习方法方差大及数据稀疏等不足之处。

4、本发明提出的基于LSTM的时域特征抽取和时域上的预测方法，在考虑到每个站点的自身特点的同时，既加强了模型的鲁棒性，又降低了模型的复杂度。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1是本发明方法流程图；

图2是本发明提出的模型架构图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明，但不以任何形式限制本发明。应当指出的是，对本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变化和改进。这些都属于本发明的保护范围。

实施例1

如图1-2所示，本发明提供了一种基于站点行为分析的共享单车流量预测方法，站点行为分为站点间流通行为和站点内行为变化，具体包括以下步骤：

数据预处理步骤：

根据历史行程信息计算站点内的出行流量包括流入量check-ins和流出量check-outs、计算站点间的流通量flow-ins和flow-outs，并进行归一化；对外部因素数据归一化处理得到实时外部输入，即包括以下三个步骤：

(1a)数据清洗：删除无效数据，其中无效数据指出行时间少于1分钟的数据；

(1b)计算流量：计算每个站点的流入流出量，及站点间的流通量数据。

(1c)归一化：将所有站点流量通过min-max归一化处理，并减去每个时间段的平均值。

本步骤中对站点流量的归一化处理能够去除量级比例对模型的影响，同时借鉴机器学习方法GBRT和图像处理ResNet模型中对残差建模的思想，在预处理的过程中减去每个时间段的平均值，提升模型预测的准确性。

构建模型步骤：

首先是问题定义。给定一段时间内的所有站点流量check-in和check-out数据{I^t,O^t|t＝1,…,B}(I^t/O^t∈R^N为t时间段的所有站点的check-in/check-out向量，N为站点个数，

即为t时间段内站点S_k的check-in流量)，预测下一时间段B+1所有站点的check-in和check-out数量I^B+1/O^B+1。

整个模型可以分为3部分，站点间动态流通行为建模、站点内动态行为建模、外部因素影响建模，接下来详细描述各个部分：

(1)站点间流动建模，即站点间动态流通行为建模。

该部分的输入为上一时间段的所有站点流量和站点间流通量，对下一时间段的站点间行为建模。具体来说，给定上一时间段内的站点流量check-in和check-out向量I^t,O^t及站点间流通矩阵f^t，其中f^t∈R^N×N,

表示t时间段内从站点S_j到站点S_k的流量。首先创建门矩阵

控制实时站点间流通变化，具体公式为：

事实上，其中

是从站点S_j到其他站点的流入量的概率分布，

是从站点S_j到其他站点的流出量的概率分布，M表示站点 S_j到站点S_k间的任一站点；

得到门矩阵后，将上一时间段的站点流量分别经过门矩阵再输入一层全连接神经网络可得到该模块的输出，具体公式如下：

其中°表示按位相乘操作，f(·)是激活函数，W_i,1,W_o,1,b_i,1,b_o,1表示在训练过程待学习的参数，

和

分别表示该模块的check-in和check-out输出。

站点内的流入量和流出量与周边相邻的站点有着紧密联系，然而这种关联状态随时间动态变化，以统计方法为基础来模拟站点间流通行为不能准确估量站点间流通行为对站点流量的影响。因此本发明具体来说，给定上一时间段内的站点间流通矩阵f^t，其中 f^t∈R^N×N,

表示t时间段内从站点S_j到站点S_k的流量。本发明创建的门矩阵

其中

表示为上一时间段内从站点S_j到站点S_k的流量概率，以此来估量当前时间段站点S_j和站点S_k间的流通量变化，解决了统计学习方法方差大及数据稀疏等不足之处。

(2)站点内动态行为建模：

第一，该模块首先通过站点间的流通数据建立向量表达模型Word2Vec，采用skip-gram模型在交通流量中基于连接站点预测当前站点，最终训练得到每个站点的m 维向量表达{e₁,…,e_N}。

不同于一般基于站点自有属性构建的向量表达，本发明提出的基于站点间流通数据的向量表达采用自然语言模型Word2Vec的skip-gram模型，能够表征站点间流通行为，而不仅仅局限于站点固有地理位置、周围建筑信息。具体来说，本发明采用的Word2Vec 中skip-gram模型将利用站点间的流通数据，给定流入站点或流出站点，预测到达站点或始发站点，经多次训练得到每个站点的向量表达。实践证明，该方法得到的站点向量表达在连续域中能够表征站点的流通行为，使经常流通的站点在连续空间中距离更近，相反没有关联的站点距离较远。

第二，对于每个站点，在不同时间段的上下文环境是动态变化的，并且对下一时间段的站点流量会产生重要影响，因此在这一部分将对每个站点的动态上下文环境量化。具体来说，对某个站点S_k和上一时间段的站点间流通矩阵f^t，其流入量check-in的上下文环境表达

为

对所有站点{S₁,…,S_N}，将其上下文环境表达拼接为矩阵表达

然后通过共享作用层，可得到上下文环境影响的输出

具体表示为

其中w_i,2∈R^m×1和b_i,2∈R^m×1是共享作用层中待学习的参数，f(·)为激活函数。同理，对于流出量check-out的上下文环境影响的输出

可由上述操作得到。

本发明在对站点的动态上下文环境建模时，对每个站点的关联站点的向量采用加权和操作来得到上下文环境的动态表达，利用实时的关联站点信息对上下文环境量化，为后续模型构建提供了有效的输入。

第三，站点的流量变化随时间动态变化，需要考虑前几个时间段的流量变化，因此站点内的行为分析还需对所有站点的流量序列建模。这一部分将采用长短时记忆循环神经网络LSTM对全局时域特征建模，具体来说，将上一时间段的所有站点的流入向量I^t和流出向量O^t连接作为LSTM层的输入，LSTM细胞更新操作如下：

i^t＝σ(W_xi[I^t:O^t]+W_hih^t-1+b_i)

f^t＝σ(W_xf[I^t:O^t]+W_hfh^t-1+b_f)

o^t＝σ(W_xo[I^t:O^t]+W_hoh^t-1+b_o)

C^t＝σ((f^t)°(C^t)+(i^t)°tanh(W_xc[I^t:O^t]+W_hch^t-1+b_c))

h^t＝(o^t)°tanh(C^t)

其中[:]表示连接操作；°表示按位相乘；σ(·)和tanh(·)表示sigmoid和双曲正切函数；所有形式的W和b都为训练中待学习的参数；h^t和C^t分别表示LSTM细胞中的隐含状态和细胞状态表示；i^t，f^t，o^t分别表示输入门、遗忘门、输出门，分别用于控制输入传至细胞的量、细胞更新量、细胞输出量。

最后得到的隐含状态表示h^t即为全局时域特征表达，由于每个站点对同一时域状态的行为反应不同，这里将对N个站点采用N个流入量的注解向量{a_i(1),…,a_i(N)}，及N 个流出量的注解向量{a_o(1),…,a_o(N)}，同时采用内积操作得到每个站点的时域输出表达，如下所示：

其中<v₁,v₂>表示向量v₁和向量v₂间的内积操作，所有注解向量均在训练过程中学习得到。

在时域上，站点的流量变化随时间动态变化，因此前几个时间段的流量变化规律对下一时间段的流量预测同样也有着重要作用。本发明在这一部分中采用长短时记忆循环神经网络LSTM对全局时域特征建模，不同于对所有站点分别采用时间序列模型预测，本发明提出的LSTM模型输入为前几个时间段中所有站点的流入量和流出量，经一层神经网络和非线性激活函数后得到当前预测时间段的隐含全局时域表达。

而后由于每个站点对同一时域变化的行为反应不同，本发明对每个站点构建流入和流出的注解向量，并分别采用同当前时间段的隐含全局时域表达向量的内积操作来得到时域上的预测输出。相比于对所有站点分别采用时间序列模型预测，本发明提出的基于LSTM的时域特征抽取和时域上的预测方法，在考虑到每个站点的自身特点的同时，既加强了模型的鲁棒性，又降低了模型的复杂度。

(3)外部因素影响建模。

在对外部因素影响建模时，本发明首先对所有外部因素数据预处理得到归一化的向量表达，再采用单层神经网络得到外部因素的影响输出。

该模块考虑外部因素如环境、时间等特征对站点流量的影响，具体来说，考虑天气条件、温度、风速、工作日/休息日及时间段类别，其中时间段类别分为4个时间间隔 [0,6),[6,12),[12,18),[18,24)并用one-hot编码表示时间段类别信息，将这些外部因素整合成向量表达为u^t，表示t时间段的外部因素。然后采用单层神经网络对外部因素影响建模得到该模块的输出：

其中SLP代表单层神经网络。

(4)最后，将上述所有模块整合得到下一时刻所有站点的流入流出预测量，如下所示：

训练模型步骤：

通过上述，在模型构建完成后，将对所构建模型进行训练，以获取最优参数，提高模型的精准度，具体操作阐述如下：

将训练数据输入所构建的模型，使用Adam优化器梯度下降算法来训练模型得到最优参数，包括以下三个步骤：

(1a)初始化模型参数

使用随机数初始化矩阵乘法中的权值。对于神经元的bias，通常设为0。

(2b)使用训练集训练模型

将训练集以8的batch大小输入神经网络每次迭代后(iteration)保存一次模型，迭代足够的次数至模型基本收敛。

(2c)使用验证集选择模型

使用上一步保存的模型来对验证集数据进行测试，选出验证误差最小的模型作为最终模型。

流量预测步骤：

待最终模型选定后，进行流量预测，具体操作阐述如下；

输入若干历史站点出行流量数据、站点间流通量数据及外部因子数据，模型输出下一时间段内的站点出行流量包括流入量check-ins和流出量check-outs，具体包括以下步骤：

(3a)使用(2c)得到的模型来对测试集进行预测。

(3b)将结果反归一化，得到每个站点在下一时段内的流入流出量。

(3c)由下一时段内的流量预测值，可再次输入到训练好的模型，同时使用已有流通量矩阵及预测的外部因素数据预测未来几个小时后的流入流出量。

实施例2

如图1-2所示，本发明提供一种基于站点行为分析的共享单车流量预测系统，包括数据预处理模块、构建模型模块、训练模型模块、流量预测模块；

上述各模块内的的相应运行与工作原理在实施例1中已详细描述，在此不再赘述。

综上所述，本发明同时对站点间动态流通行为和站点内行为变化建模来估量站点的动态行为变化，能够及时捕捉到站点的动态流量变化，达到更高的流量预测准确性；本发明对站点流量的归一化处理能够去除量级比例对模型的影响，同时借鉴机器学习方法GBRT和图像处理ResNet模型中对残差建模的思想，在预处理的过程中减去每个时间段的平均值，提升模型预测的准确性；本发明以上一时间段的站点间的流通矩阵为基础构建实时动态的门矩阵，来过滤不相关的其他站点，只保留实时关联的站点信息，解决了统计学习方法方差大及数据稀疏等不足之处；本发明提出的基于LSTM的时域特征抽取和时域上的预测方法，在考虑到每个站点的自身特点的同时，既加强了模型的鲁棒性，又降低了模型的复杂度。

本领域技术人员知道，除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外，完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以，本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件，而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构；也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。

Claims

1.一种基于站点行为分析的共享单车流量预测方法，其特征在于，包括如下步骤：

S1，数据预处理：包括数据清洗、计算流量和归一化处理；

S4，流量预测：输入若干历史站点出行流量数据、站点间流通量数据及外部因素数据到经步骤S3训练的模型内，模型输出下一时间段内的站点出行流量包括流入量和流出量；

所述步骤S2中的所述站点间流动建模是将上一时间段的站点间的流通矩阵为基础构建实时动态的门矩阵，获取门矩阵后将上一时间段的站点流量分别经过门矩阵再输入一层全连接神经网络得到站点间流动模块的输出；

所述步骤S2中的所述动态站点内行为建模包括站点向量表达、站点的动态上下文环境建模和站点的流量序列建模；

所述站点向量表达基于站点间流通数据，采用自然语言模型Word2Vec的skip-gram模型，具体为：采用的Word2Vec中skip-gram模型将利用站点间流通数据，给定流入站点或流出站点，预测到达站点或始发站点，经多次训练得到每个站点的向量表达；

所述站点的动态上下文环境建模对每个站点的关联站点的向量采用加权和操作来得到上下文环境的动态表达，利用实时的关联站点信息对上下文环境量化，为后续模型构建提供有效的输入；

所述站点的流量序列建模采用长短时记忆循环神经网络LSTM对全局时域特征建模，输入为前若干时间段中所有站点的流入量和流出量，经一层神经网络和非线性激活函数后得到当前预测时间段的隐含全局时域表达，进而根据每个站点对同一时域变化行为的不同反应，对每个站点构建流入和流出的注解向量，并分别采用同当前时间段的隐含全局时域表达向量的内积操作来得到时域上的预测输出。

2.根据权利要求1所述的基于站点行为分析的共享单车流量预测方法，其特征在于，所述步骤S1中的所述计算流量为根据历史行程信息计算站点内流入流出量与站点间的流通量，所述归一化处理是将所有站点流量通过min-max归一化处理，并减去每个时间段的平均值。

3.根据权利要求1所述的基于站点行为分析的共享单车流量预测方法，其特征在于，所述步骤S3中的训练模型包括初始化模型参数、使用训练集训练模型以及使用验证集选择模型。

4.根据权利要求1所述的基于站点行为分析的共享单车流量预测方法，其特征在于，所述外部影响因素建模首先对所有外部因素数据预处理得到归一化的向量表达，再采用单层神经网络得到外部因素的影响输出。

5.一种基于站点行为分析的共享单车流量预测系统，其特征在于，采用权利要求1-4任一项所述的基于站点行为分析的共享单车流量预测方法，包括数据预处理模块、构建模型模块、训练模型模块、流量预测模块；

所述流量预测模块通过输入若干历史站点出行流量数据、站点间流通量数据及外部因素数据到训练模型模块内的模型内，模型输出下一时间段内的站点出行流量包括流入量和流出量；

所述站点间流动建模是将上一时间段的站点间的流通矩阵为基础构建实时动态的门矩阵，获取门矩阵后将上一时间段的站点流量分别经过门矩阵再输入一层全连接神经网络得到站点间流动模块的输出；

所述动态站点内行为建模包括站点向量表达、站点的动态上下文环境建模和站点的流量序列建模；