CN110210656B - 基于站点行为分析的共享单车流量预测方法及系统 - Google Patents

基于站点行为分析的共享单车流量预测方法及系统 Download PDF

Info

Publication number
CN110210656B
CN110210656B CN201910424740.0A CN201910424740A CN110210656B CN 110210656 B CN110210656 B CN 110210656B CN 201910424740 A CN201910424740 A CN 201910424740A CN 110210656 B CN110210656 B CN 110210656B
Authority
CN
China
Prior art keywords
site
flow
model
sites
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910424740.0A
Other languages
English (en)
Other versions
CN110210656A (zh
Inventor
周纤
沈艳艳
黄林鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201910424740.0A priority Critical patent/CN110210656B/zh
Publication of CN110210656A publication Critical patent/CN110210656A/zh
Application granted granted Critical
Publication of CN110210656B publication Critical patent/CN110210656B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明提供了一种流量预测技术领域内的基于站点行为分析的共享单车流量预测方法,包括如下步骤:S1,数据预处理:包括数据清洗、计算流量和归一化处理;S2,构建模型:包括站点间流动建模、动态站点内行为建模和外部影响因素建模;S3,训练模型:将训练数据输入步骤S2所构建的模型,使用Adam优化器梯度下降算法来训练模型得到最优参数;S4,流量预测:输入若干历史站点出行流量数据、站点间流通量数据及外部因子数据到经步骤S3训练的模型内,模型输出下一时间段内的站点出行流量包括流入量和流出量。本发明同时对站点间动态流通行为和站点内行为变化建模来估量站点的动态行为变化,能及时捕捉到站点的动态流量变化,达到更高的流量预测准确性。

Description

基于站点行为分析的共享单车流量预测方法及系统
技术领域
本发明流量预测技术领域,具体的,涉及一种基于站点行为分析的共享单车流量预测方法及系统,通过同时对站点间动态流通行为和站点内行为变化建模来提升站点流量预测的准确性。
背景技术
流量预测对于构建智能交通系统具有重要意义,能够帮助政府提前规划、出行公司合理调整资源等。在共享单车方面,现有方法大多利用外部因素数据如天气、时间等特征构建相似性函数或机器学习模型如随机森林等来预测未来站点出行流量。然而这些方法在对站点间流通行为建模时大多采用统计方法,同时它们没有考虑到站点本身的特点,比如相比郊区的站点来说,在市区的交通中心附近的站点会有更多的出行流量,i.e.,流入量check-ins和流出量check-outs。
然而根据实际数据我们发现,站点间的流通量随着时间变化,统计方法无法准确捕捉到动态的流通量变化情况。除此之外,站点本身的行为存在多样性,在预测模型中需要对站点进行特征抽取。
因此,对站点间动态流通行为和站点行为特征建模在共享单车流量预测系统中至关重要。
经现有技术检索,中国发明专利号为CN201810288808.2,发明名称为一种基于近邻传播-趋势迭代聚类的共享单车流量预测方法及装置,包括以下步骤:获取城市的共享单车车站信息、历史行程信息和历史气象信息;基于近邻传播聚类方法和单车迁移趋势,对车站进行聚类;根据历史行程信息,计算每个类簇的历史单车租用情况;根据历史单车租用情况和历史气象信息,进行共享单车租用和归还的预测。该发明不能及时捕捉到站点的动态流量变化,流量预测的准确性不高。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于站点行为分析的共享单车流量预测方法。
根据本发明提供的一种基于站点行为分析的共享单车流量预测方法,包括如下步骤:
S1,数据预处理:包括数据清洗、计算流量和归一化处理;
S2,构建模型:包括站点间流动建模、动态站点内行为建模和外部影响因素建模;
S3,训练模型:将训练数据输入步骤S2所构建的模型,使用Adam优化器梯度下降算法来训练模型获取最优参数;
S4,流量预测:输入若干历史站点出行流量数据、站点间流通量数据及外部因子数据到经步骤S3训练的模型内,模型输出下一时间段内的站点出行流量包括流入量和流出量。
一些实施例中,所述步骤S1中的所述计算流量为根据历史行程信息计算站点内流入流出量与站点间的流通量,所述归一化处理是将所有站点流量通过min-max归一化处理,并减去每个时间段的平均值。
一些实施例中,所述步骤S2中的所述站点间流动建模是将上一时间段的站点间的流通矩阵为基础构建实时动态的门矩阵,获取门矩阵后将上一时间段的站点流量分别经过门矩阵再输入一层全连接神经网络得到站点间流动模块的输出。
一些实施例中,所述步骤S2中的所述动态站点内行为建模包括站点向量表达、站点的动态上下文环境建模和站点的流量序列建模。
一些实施例中,所述站点向量表达基于站点间流通数据,采用自然语言模型Word2Vec的skip-gram模型。
一些实施例中,所述站点的动态上下文环境建模是利用实时的关联站点信息对上下文环境量化,为后续模型构建提供有效的输入。
一些实施例中,所述流量序列建模是基于LSTM的时域特征抽取,采用长短时记忆循环神经网络LSTM对全局时域特征建模。
一些实施例中,所述步骤S3训练模型包括初始化模型参数、使用训练集训练模型以及使用验证集选择模型。
一些实施例中,所述外部影响因素建模首先对所有外部因素数据预处理得到归一化的向量表达,再采用单层神经网络得到外部因素的影响输出。
一种基于站点行为分析的共享单车流量预测系统,采用所述的基于站点行为分析的共享单车流量预测方法,包括数据预处理模块、构建模型模块、训练模型模块、流量预测模块;
所述数据预处理模块进行数据清洗、计算流量和归一化处理;
所述构建模型模块包括站点间流动建模、动态站点内行为建模和外部影响因素建模;
所述训练模型模块是将训练数据输入构建模型模块内所构建的模型,使用Adam优化器梯度下降算法来训练模型获取最优参数;
流量预测模块通过输入若干历史站点出行流量数据、站点间流通量数据及外部因子数据到训练模型模块内的模型内,模型输出下一时间段内的站点出行流量包括流入量和流出量。
与现有技术相比,本发明具有如下的有益效果:
1、本发明同时对站点间动态流通行为和站点内行为变化建模来估量站点的动态行为变化,能够及时捕捉到站点的动态流量变化,达到更高的流量预测准确性。
2、本发明对站点流量的归一化处理能够去除量级比例对模型的影响,同时借鉴机器学习方法GBRT和图像处理ResNet模型中对残差建模的思想,在预处理的过程中减去每个时间段的平均值,提升模型预测的准确性。
3、本发明以上一时间段的站点间的流通矩阵为基础构建实时动态的门矩阵,来过滤不相关的其他站点,只保留实时关联的站点信息,解决了统计学习方法方差大及数据稀疏等不足之处。
4、本发明提出的基于LSTM的时域特征抽取和时域上的预测方法,在考虑到每个站点的自身特点的同时,既加强了模型的鲁棒性,又降低了模型的复杂度。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是本发明方法流程图;
图2是本发明提出的模型架构图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
实施例1
如图1-2所示,本发明提供了一种基于站点行为分析的共享单车流量预测方法,站点行为分为站点间流通行为和站点内行为变化,具体包括以下步骤:
数据预处理步骤:
根据历史行程信息计算站点内的出行流量包括流入量check-ins和流出量check-outs、计算站点间的流通量flow-ins和flow-outs,并进行归一化;对外部因素数据归一化处理得到实时外部输入,即包括以下三个步骤:
(1a)数据清洗:删除无效数据,其中无效数据指出行时间少于1分钟的数据;
(1b)计算流量:计算每个站点的流入流出量,及站点间的流通量数据。
(1c)归一化:将所有站点流量通过min-max归一化处理,并减去每个时间段的平均值。
本步骤中对站点流量的归一化处理能够去除量级比例对模型的影响,同时借鉴机器学习方法GBRT和图像处理ResNet模型中对残差建模的思想,在预处理的过程中减去每个时间段的平均值,提升模型预测的准确性。
构建模型步骤:
首先是问题定义。给定一段时间内的所有站点流量check-in和check-out数据{It,Ot|t=1,…,B}(It/Ot∈RN为t时间段的所有站点的check-in/check-out向量,N为站点个数,
Figure BDA0002067133490000041
即为t时间段内站点Sk的check-in流量),预测下一时间段B+1所有站点的check-in和check-out数量IB+1/OB+1
整个模型可以分为3部分,站点间动态流通行为建模、站点内动态行为建模、外部因素影响建模,接下来详细描述各个部分:
(1)站点间流动建模,即站点间动态流通行为建模。
该部分的输入为上一时间段的所有站点流量和站点间流通量,对下一时间段的站点间行为建模。具体来说,给定上一时间段内的站点流量check-in和check-out向量It,Ot及站点间流通矩阵ft,其中ft∈RN×N,
Figure BDA0002067133490000042
表示t时间段内从站点Sj到站点Sk的流量。首先创建门矩阵
Figure BDA0002067133490000043
控制实时站点间流通变化,具体公式为:
Figure BDA0002067133490000044
Figure BDA0002067133490000045
事实上,其中
Figure BDA0002067133490000046
是从站点Sj到其他站点的流入量的概率分布,
Figure BDA0002067133490000051
是从站点Sj到其他站点的流出量的概率分布,M表示站点 Sj到站点Sk间的任一站点;
得到门矩阵后,将上一时间段的站点流量分别经过门矩阵再输入一层全连接神经网络可得到该模块的输出,具体公式如下:
Figure BDA0002067133490000052
Figure BDA0002067133490000053
其中°表示按位相乘操作,f(·)是激活函数,Wi,1,Wo,1,bi,1,bo,1表示在训练过程待学习的参数,
Figure BDA0002067133490000054
Figure BDA0002067133490000055
分别表示该模块的check-in和check-out输出。
站点内的流入量和流出量与周边相邻的站点有着紧密联系,然而这种关联状态随时间动态变化,以统计方法为基础来模拟站点间流通行为不能准确估量站点间流通行为对站点流量的影响。因此本发明具体来说,给定上一时间段内的站点间流通矩阵ft,其中 ft∈RN×N,
Figure BDA0002067133490000056
表示t时间段内从站点Sj到站点Sk的流量。本发明创建的门矩阵
Figure BDA0002067133490000057
Figure BDA0002067133490000058
其中
Figure BDA0002067133490000059
表示为上一时间段内从站点Sj到站点Sk的流量概率,以此来估量当前时间段站点Sj和站点Sk间的流通量变化,解决了统计学习方法方差大及数据稀疏等不足之处。
(2)站点内动态行为建模:
第一,该模块首先通过站点间的流通数据建立向量表达模型Word2Vec,采用skip-gram模型在交通流量中基于连接站点预测当前站点,最终训练得到每个站点的m 维向量表达{e1,…,eN}。
不同于一般基于站点自有属性构建的向量表达,本发明提出的基于站点间流通数据的向量表达采用自然语言模型Word2Vec的skip-gram模型,能够表征站点间流通行为,而不仅仅局限于站点固有地理位置、周围建筑信息。具体来说,本发明采用的Word2Vec 中skip-gram模型将利用站点间的流通数据,给定流入站点或流出站点,预测到达站点或始发站点,经多次训练得到每个站点的向量表达。实践证明,该方法得到的站点向量表达在连续域中能够表征站点的流通行为,使经常流通的站点在连续空间中距离更近,相反没有关联的站点距离较远。
第二,对于每个站点,在不同时间段的上下文环境是动态变化的,并且对下一时间段的站点流量会产生重要影响,因此在这一部分将对每个站点的动态上下文环境量化。具体来说,对某个站点Sk和上一时间段的站点间流通矩阵ft,其流入量check-in的上下文环境表达
Figure BDA0002067133490000061
Figure BDA0002067133490000062
Figure BDA0002067133490000063
对所有站点{S1,…,SN},将其上下文环境表达拼接为矩阵表达
Figure BDA0002067133490000064
然后通过共享作用层,可得到上下文环境影响的输出
Figure BDA0002067133490000065
具体表示为
Figure BDA0002067133490000066
其中wi,2∈Rm×1和bi,2∈Rm×1是共享作用层中待学习的参数,f(·)为激活函数。同理,对于流出量check-out的上下文环境影响的输出
Figure BDA0002067133490000067
可由上述操作得到。
本发明在对站点的动态上下文环境建模时,对每个站点的关联站点的向量采用加权和操作来得到上下文环境的动态表达,利用实时的关联站点信息对上下文环境量化,为后续模型构建提供了有效的输入。
第三,站点的流量变化随时间动态变化,需要考虑前几个时间段的流量变化,因此站点内的行为分析还需对所有站点的流量序列建模。这一部分将采用长短时记忆循环神经网络LSTM对全局时域特征建模,具体来说,将上一时间段的所有站点的流入向量It和流出向量Ot连接作为LSTM层的输入,LSTM细胞更新操作如下:
it=σ(Wxi[It:Ot]+Whiht-1+bi)
ft=σ(Wxf[It:Ot]+Whfht-1+bf)
ot=σ(Wxo[It:Ot]+Whoht-1+bo)
Ct=σ((ft)°(Ct)+(it)°tanh(Wxc[It:Ot]+Whcht-1+bc))
ht=(ot)°tanh(Ct)
其中[:]表示连接操作;°表示按位相乘;σ(·)和tanh(·)表示sigmoid和双曲正切函数;所有形式的W和b都为训练中待学习的参数;ht和Ct分别表示LSTM细胞中的隐含状态和细胞状态表示;it,ft,ot分别表示输入门、遗忘门、输出门,分别用于控制输入传至细胞的量、细胞更新量、细胞输出量。
最后得到的隐含状态表示ht即为全局时域特征表达,由于每个站点对同一时域状态的行为反应不同,这里将对N个站点采用N个流入量的注解向量{ai(1),…,ai(N)},及N 个流出量的注解向量{ao(1),…,ao(N)},同时采用内积操作得到每个站点的时域输出表达,如下所示:
Figure BDA0002067133490000068
Figure BDA0002067133490000071
其中<v1,v2>表示向量v1和向量v2间的内积操作,所有注解向量均在训练过程中学习得到。
在时域上,站点的流量变化随时间动态变化,因此前几个时间段的流量变化规律对下一时间段的流量预测同样也有着重要作用。本发明在这一部分中采用长短时记忆循环神经网络LSTM对全局时域特征建模,不同于对所有站点分别采用时间序列模型预测,本发明提出的LSTM模型输入为前几个时间段中所有站点的流入量和流出量,经一层神经网络和非线性激活函数后得到当前预测时间段的隐含全局时域表达。
而后由于每个站点对同一时域变化的行为反应不同,本发明对每个站点构建流入和流出的注解向量,并分别采用同当前时间段的隐含全局时域表达向量的内积操作来得到时域上的预测输出。相比于对所有站点分别采用时间序列模型预测,本发明提出的基于LSTM的时域特征抽取和时域上的预测方法,在考虑到每个站点的自身特点的同时,既加强了模型的鲁棒性,又降低了模型的复杂度。
(3)外部因素影响建模。
在对外部因素影响建模时,本发明首先对所有外部因素数据预处理得到归一化的向量表达,再采用单层神经网络得到外部因素的影响输出。
该模块考虑外部因素如环境、时间等特征对站点流量的影响,具体来说,考虑天气条件、温度、风速、工作日/休息日及时间段类别,其中时间段类别分为4个时间间隔 [0,6),[6,12),[12,18),[18,24)并用one-hot编码表示时间段类别信息,将这些外部因素整合成向量表达为ut,表示t时间段的外部因素。然后采用单层神经网络对外部因素影响建模得到该模块的输出:
Figure BDA0002067133490000072
Figure BDA0002067133490000073
其中SLP代表单层神经网络。
(4)最后,将上述所有模块整合得到下一时刻所有站点的流入流出预测量,如下所示:
Figure BDA0002067133490000074
Figure BDA0002067133490000075
训练模型步骤:
通过上述,在模型构建完成后,将对所构建模型进行训练,以获取最优参数,提高模型的精准度,具体操作阐述如下:
将训练数据输入所构建的模型,使用Adam优化器梯度下降算法来训练模型得到最优参数,包括以下三个步骤:
(1a)初始化模型参数
使用随机数初始化矩阵乘法中的权值。对于神经元的bias,通常设为0。
(2b)使用训练集训练模型
将训练集以8的batch大小输入神经网络每次迭代后(iteration)保存一次模型,迭代足够的次数至模型基本收敛。
(2c)使用验证集选择模型
使用上一步保存的模型来对验证集数据进行测试,选出验证误差最小的模型作为最终模型。
流量预测步骤:
待最终模型选定后,进行流量预测,具体操作阐述如下;
输入若干历史站点出行流量数据、站点间流通量数据及外部因子数据,模型输出下一时间段内的站点出行流量包括流入量check-ins和流出量check-outs,具体包括以下步骤:
(3a)使用(2c)得到的模型来对测试集进行预测。
(3b)将结果反归一化,得到每个站点在下一时段内的流入流出量。
(3c)由下一时段内的流量预测值,可再次输入到训练好的模型,同时使用已有流通量矩阵及预测的外部因素数据预测未来几个小时后的流入流出量。
实施例2
如图1-2所示,本发明提供一种基于站点行为分析的共享单车流量预测系统,包括数据预处理模块、构建模型模块、训练模型模块、流量预测模块;
所述数据预处理模块进行数据清洗、计算流量和归一化处理;
所述构建模型模块包括站点间流动建模、动态站点内行为建模和外部影响因素建模;
所述训练模型模块是将训练数据输入构建模型模块内所构建的模型,使用Adam优化器梯度下降算法来训练模型获取最优参数;
流量预测模块通过输入若干历史站点出行流量数据、站点间流通量数据及外部因子数据到训练模型模块内的模型内,模型输出下一时间段内的站点出行流量包括流入量和流出量。
上述各模块内的的相应运行与工作原理在实施例1中已详细描述,在此不再赘述。
综上所述,本发明同时对站点间动态流通行为和站点内行为变化建模来估量站点的动态行为变化,能够及时捕捉到站点的动态流量变化,达到更高的流量预测准确性;本发明对站点流量的归一化处理能够去除量级比例对模型的影响,同时借鉴机器学习方法GBRT和图像处理ResNet模型中对残差建模的思想,在预处理的过程中减去每个时间段的平均值,提升模型预测的准确性;本发明以上一时间段的站点间的流通矩阵为基础构建实时动态的门矩阵,来过滤不相关的其他站点,只保留实时关联的站点信息,解决了统计学习方法方差大及数据稀疏等不足之处;本发明提出的基于LSTM的时域特征抽取和时域上的预测方法,在考虑到每个站点的自身特点的同时,既加强了模型的鲁棒性,又降低了模型的复杂度。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。

Claims (5)

1.一种基于站点行为分析的共享单车流量预测方法,其特征在于,包括如下步骤:
S1,数据预处理:包括数据清洗、计算流量和归一化处理;
S2,构建模型:包括站点间流动建模、动态站点内行为建模和外部影响因素建模;
S3,训练模型:将训练数据输入步骤S2所构建的模型,使用Adam优化器梯度下降算法来训练模型获取最优参数;
S4,流量预测:输入若干历史站点出行流量数据、站点间流通量数据及外部因素数据到经步骤S3训练的模型内,模型输出下一时间段内的站点出行流量包括流入量和流出量;
所述步骤S2中的所述站点间流动建模是将上一时间段的站点间的流通矩阵为基础构建实时动态的门矩阵,获取门矩阵后将上一时间段的站点流量分别经过门矩阵再输入一层全连接神经网络得到站点间流动模块的输出;
所述步骤S2中的所述动态站点内行为建模包括站点向量表达、站点的动态上下文环境建模和站点的流量序列建模;
所述站点向量表达基于站点间流通数据,采用自然语言模型Word2Vec的skip-gram模型,具体为:采用的Word2Vec中skip-gram模型将利用站点间流通数据,给定流入站点或流出站点,预测到达站点或始发站点,经多次训练得到每个站点的向量表达;
所述站点的动态上下文环境建模对每个站点的关联站点的向量采用加权和操作来得到上下文环境的动态表达,利用实时的关联站点信息对上下文环境量化,为后续模型构建提供有效的输入;
所述站点的流量序列建模采用长短时记忆循环神经网络LSTM对全局时域特征建模,输入为前若干时间段中所有站点的流入量和流出量,经一层神经网络和非线性激活函数后得到当前预测时间段的隐含全局时域表达,进而根据每个站点对同一时域变化行为的不同反应,对每个站点构建流入和流出的注解向量,并分别采用同当前时间段的隐含全局时域表达向量的内积操作来得到时域上的预测输出。
2.根据权利要求1所述的基于站点行为分析的共享单车流量预测方法,其特征在于,所述步骤S1中的所述计算流量为根据历史行程信息计算站点内流入流出量与站点间的流通量,所述归一化处理是将所有站点流量通过min-max归一化处理,并减去每个时间段的平均值。
3.根据权利要求1所述的基于站点行为分析的共享单车流量预测方法,其特征在于,所述步骤S3中的训练模型包括初始化模型参数、使用训练集训练模型以及使用验证集选择模型。
4.根据权利要求1所述的基于站点行为分析的共享单车流量预测方法,其特征在于,所述外部影响因素建模首先对所有外部因素数据预处理得到归一化的向量表达,再采用单层神经网络得到外部因素的影响输出。
5.一种基于站点行为分析的共享单车流量预测系统,其特征在于,采用权利要求1-4任一项所述的基于站点行为分析的共享单车流量预测方法,包括数据预处理模块、构建模型模块、训练模型模块、流量预测模块;
所述数据预处理模块进行数据清洗、计算流量和归一化处理;
所述构建模型模块包括站点间流动建模、动态站点内行为建模和外部影响因素建模;
所述训练模型模块是将训练数据输入构建模型模块内所构建的模型,使用Adam优化器梯度下降算法来训练模型获取最优参数;
所述流量预测模块通过输入若干历史站点出行流量数据、站点间流通量数据及外部因素数据到训练模型模块内的模型内,模型输出下一时间段内的站点出行流量包括流入量和流出量;
所述站点间流动建模是将上一时间段的站点间的流通矩阵为基础构建实时动态的门矩阵,获取门矩阵后将上一时间段的站点流量分别经过门矩阵再输入一层全连接神经网络得到站点间流动模块的输出;
所述动态站点内行为建模包括站点向量表达、站点的动态上下文环境建模和站点的流量序列建模;
所述站点向量表达基于站点间流通数据,采用自然语言模型Word2Vec的skip-gram模型,具体为:采用的Word2Vec中skip-gram模型将利用站点间流通数据,给定流入站点或流出站点,预测到达站点或始发站点,经多次训练得到每个站点的向量表达;
所述站点的动态上下文环境建模对每个站点的关联站点的向量采用加权和操作来得到上下文环境的动态表达,利用实时的关联站点信息对上下文环境量化,为后续模型构建提供有效的输入;
所述站点的流量序列建模采用长短时记忆循环神经网络LSTM对全局时域特征建模,输入为前若干时间段中所有站点的流入量和流出量,经一层神经网络和非线性激活函数后得到当前预测时间段的隐含全局时域表达,进而根据每个站点对同一时域变化行为的不同反应,对每个站点构建流入和流出的注解向量,并分别采用同当前时间段的隐含全局时域表达向量的内积操作来得到时域上的预测输出。
CN201910424740.0A 2019-05-21 2019-05-21 基于站点行为分析的共享单车流量预测方法及系统 Active CN110210656B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910424740.0A CN110210656B (zh) 2019-05-21 2019-05-21 基于站点行为分析的共享单车流量预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910424740.0A CN110210656B (zh) 2019-05-21 2019-05-21 基于站点行为分析的共享单车流量预测方法及系统

Publications (2)

Publication Number Publication Date
CN110210656A CN110210656A (zh) 2019-09-06
CN110210656B true CN110210656B (zh) 2021-07-13

Family

ID=67788003

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910424740.0A Active CN110210656B (zh) 2019-05-21 2019-05-21 基于站点行为分析的共享单车流量预测方法及系统

Country Status (1)

Country Link
CN (1) CN110210656B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111815937B (zh) * 2019-11-22 2022-01-04 北京嘀嘀无限科技发展有限公司 用于超停车辆调度的控制方法、装置、存储介质和电子设备
CN111461384B (zh) * 2019-12-10 2024-04-05 阿里巴巴集团控股有限公司 对象流量预测方法、装置及设备
CN111429000B (zh) * 2020-03-23 2021-05-28 成都信息工程大学 一种基于站点聚类的共享单车取还站点推荐方法及系统
CN112801424A (zh) * 2020-11-20 2021-05-14 西北工业大学 一种利用层级结构的新站点流量预测方法
CN113098735B (zh) * 2021-03-31 2022-10-11 上海天旦网络科技发展有限公司 面向推理的应用流量和指标向量化方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107967532A (zh) * 2017-10-30 2018-04-27 厦门大学 融合区域活力的城市交通流量预测方法
CN108510741A (zh) * 2018-05-24 2018-09-07 浙江工业大学 一种基于Conv1D-LSTM神经网络结构的交通流预测方法
CN108564227A (zh) * 2018-04-26 2018-09-21 重庆大学 一种基于时空特征的轨道交通客流量预测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10855550B2 (en) * 2016-11-16 2020-12-01 Cisco Technology, Inc. Network traffic prediction using long short term memory neural networks

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107967532A (zh) * 2017-10-30 2018-04-27 厦门大学 融合区域活力的城市交通流量预测方法
CN108564227A (zh) * 2018-04-26 2018-09-21 重庆大学 一种基于时空特征的轨道交通客流量预测方法
CN108510741A (zh) * 2018-05-24 2018-09-07 浙江工业大学 一种基于Conv1D-LSTM神经网络结构的交通流预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Predicting Multi-step Citywide Passenger Demands Using Attention-based Neural Networks;Xian Zhou 等;《WSDM "18: Proceedings of the Eleventh ACM International Conference on Web Search and Data Mining》;20180228;第736-744页 *
基于LSTM的共享单车需求预测;李颖宏 等;《智能城市》;20190314(第05期);第1-4页 *

Also Published As

Publication number Publication date
CN110210656A (zh) 2019-09-06

Similar Documents

Publication Publication Date Title
CN110210656B (zh) 基于站点行为分析的共享单车流量预测方法及系统
Rahman et al. Predicting electricity consumption for commercial and residential buildings using deep recurrent neural networks
van Vliet et al. A review of current calibration and validation practices in land-change modeling
EP3805999A1 (en) Resource-aware automatic machine learning system
CN109583565B (zh) 基于注意力模型长短时记忆网络的洪水预测方法
CN111079931A (zh) 一种基于图神经网络的状态空间概率性多时间序列预测方法
JP6775469B2 (ja) Odトラヒック予測装置、方法、及びプログラム
CN114802296A (zh) 一种基于动态交互图卷积的车辆轨迹预测方法
Csikós et al. Traffic speed prediction method for urban networks—An ANN approach
CN110570035B (zh) 同时建模时空依赖性和每日流量相关性的人流量预测系统
CN111369299A (zh) 识别的方法、装置、设备及计算机可读存储介质
CN113449919B (zh) 一种基于特征和趋势感知的用电量预测方法及系统
CN115545334B (zh) 土地利用类型预测方法、装置、电子设备及存储介质
Massaoudi et al. Performance evaluation of deep recurrent neural networks architectures: Application to PV power forecasting
CN113362637A (zh) 一种区域性多场点空余停车位预测方法及系统
CN114461931A (zh) 一种基于多关系融合分析的用户轨迹预测方法和系统
CN116311880A (zh) 基于局部-全局时空特征融合的交通流量预测方法及设备
CN116227180A (zh) 基于数据驱动的机组组合智能决策方法
Ma et al. Fuzzy hybrid framework with dynamic weights for short‐term traffic flow prediction by mining spatio‐temporal correlations
CN115206092A (zh) 一种基于注意力机制的BiLSTM和LightGBM模型的交通预测方法
CN113537580A (zh) 一种基于自适应图学习的公共交通客流预测方法及系统
JP6665071B2 (ja) 人流量予測装置、人流量予測方法、及び人流量予測プログラム
Anh et al. Effect of gradient descent optimizers and dropout technique on deep learning LSTM performance in rainfall-runoff modeling
Manoj et al. FWS-DL: forecasting wind speed based on deep learning algorithms
CN117543544A (zh) 一种负荷预测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant