CN110210656A - 基于站点行为分析的共享单车流量预测方法及系统 - Google Patents
基于站点行为分析的共享单车流量预测方法及系统 Download PDFInfo
- Publication number
- CN110210656A CN110210656A CN201910424740.0A CN201910424740A CN110210656A CN 110210656 A CN110210656 A CN 110210656A CN 201910424740 A CN201910424740 A CN 201910424740A CN 110210656 A CN110210656 A CN 110210656A
- Authority
- CN
- China
- Prior art keywords
- website
- model
- modeling
- data
- shared bicycle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 230000003542 behavioural effect Effects 0.000 title claims abstract description 29
- 238000004458 analytical method Methods 0.000 title claims abstract description 22
- 238000012549 training Methods 0.000 claims abstract description 43
- 230000004941 influx Effects 0.000 claims abstract description 14
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims abstract description 7
- 241001269238 Data Species 0.000 claims abstract description 7
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 6
- AGVAZMGAQJOSFJ-WZHZPDAFSA-M cobalt(2+);[(2r,3s,4r,5s)-5-(5,6-dimethylbenzimidazol-1-yl)-4-hydroxy-2-(hydroxymethyl)oxolan-3-yl] [(2r)-1-[3-[(1r,2r,3r,4z,7s,9z,12s,13s,14z,17s,18s,19r)-2,13,18-tris(2-amino-2-oxoethyl)-7,12,17-tris(3-amino-3-oxopropyl)-3,5,8,8,13,15,18,19-octamethyl-2 Chemical compound [Co+2].N#[C-].[N-]([C@@H]1[C@H](CC(N)=O)[C@@]2(C)CCC(=O)NC[C@@H](C)OP(O)(=O)O[C@H]3[C@H]([C@H](O[C@@H]3CO)N3C4=CC(C)=C(C)C=C4N=C3)O)\C2=C(C)/C([C@H](C\2(C)C)CCC(N)=O)=N/C/2=C\C([C@H]([C@@]/2(CC(N)=O)C)CCC(N)=O)=N\C\2=C(C)/C2=N[C@]1(C)[C@@](C)(CC(N)=O)[C@@H]2CCC(N)=O AGVAZMGAQJOSFJ-WZHZPDAFSA-M 0.000 claims abstract description 5
- 239000013598 vector Substances 0.000 claims description 25
- 230000006399 behavior Effects 0.000 claims description 23
- 239000011159 matrix material Substances 0.000 claims description 22
- 238000013528 artificial neural network Methods 0.000 claims description 12
- 230000002123 temporal effect Effects 0.000 claims description 9
- 230000007613 environmental effect Effects 0.000 claims description 7
- 239000010410 layer Substances 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000004387 environmental modeling Methods 0.000 claims description 5
- 239000002356 single layer Substances 0.000 claims description 5
- 230000006403 short-term memory Effects 0.000 claims description 4
- 230000000306 recurrent effect Effects 0.000 claims description 2
- 230000008859 change Effects 0.000 abstract description 16
- 238000005516 engineering process Methods 0.000 abstract description 2
- 210000004027 cell Anatomy 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000003822 cell turnover Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 210000005036 nerve Anatomy 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Theoretical Computer Science (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明提供了一种流量预测技术领域内的基于站点行为分析的共享单车流量预测方法,包括如下步骤:S1,数据预处理:包括数据清洗、计算流量和归一化处理;S2,构建模型:包括站点间流动建模、动态站点内行为建模和外部影响因素建模;S3,训练模型:将训练数据输入步骤S2所构建的模型,使用Adam优化器梯度下降算法来训练模型得到最优参数;S4,流量预测:输入若干历史站点出行流量数据、站点间流通量数据及外部因子数据到经步骤S3训练的模型内,模型输出下一时间段内的站点出行流量包括流入量和流出量。本发明同时对站点间动态流通行为和站点内行为变化建模来估量站点的动态行为变化,能及时捕捉到站点的动态流量变化,达到更高的流量预测准确性。
Description
技术领域
本发明流量预测技术领域,具体的,涉及一种基于站点行为分析的共享单车流量预测方法及系统,通过同时对站点间动态流通行为和站点内行为变化建模来提升站点流量预测的准确性。
背景技术
流量预测对于构建智能交通系统具有重要意义,能够帮助政府提前规划、出行公司合理调整资源等。在共享单车方面,现有方法大多利用外部因素数据如天气、时间等特征构建相似性函数或机器学习模型如随机森林等来预测未来站点出行流量。然而这些方法在对站点间流通行为建模时大多采用统计方法,同时它们没有考虑到站点本身的特点,比如相比郊区的站点来说,在市区的交通中心附近的站点会有更多的出行流量,i.e.,流入量check-ins和流出量check-outs。
然而根据实际数据我们发现,站点间的流通量随着时间变化,统计方法无法准确捕捉到动态的流通量变化情况。除此之外,站点本身的行为存在多样性,在预测模型中需要对站点进行特征抽取。
因此,对站点间动态流通行为和站点行为特征建模在共享单车流量预测系统中至关重要。
经现有技术检索,中国发明专利号为CN201810288808.2,发明名称为一种基于近邻传播-趋势迭代聚类的共享单车流量预测方法及装置,包括以下步骤:获取城市的共享单车车站信息、历史行程信息和历史气象信息;基于近邻传播聚类方法和单车迁移趋势,对车站进行聚类;根据历史行程信息,计算每个类簇的历史单车租用情况;根据历史单车租用情况和历史气象信息,进行共享单车租用和归还的预测。该发明不能及时捕捉到站点的动态流量变化,流量预测的准确性不高。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于站点行为分析的共享单车流量预测方法。
根据本发明提供的一种基于站点行为分析的共享单车流量预测方法,包括如下步骤:
S1,数据预处理:包括数据清洗、计算流量和归一化处理;
S2,构建模型:包括站点间流动建模、动态站点内行为建模和外部影响因素建模;
S3,训练模型:将训练数据输入步骤S2所构建的模型,使用Adam优化器梯度下降算法来训练模型获取最优参数;
S4,流量预测:输入若干历史站点出行流量数据、站点间流通量数据及外部因子数据到经步骤S3训练的模型内,模型输出下一时间段内的站点出行流量包括流入量和流出量。
一些实施例中,所述步骤S1中的所述计算流量为根据历史行程信息计算站点内流入流出量与站点间的流通量,所述归一化处理是将所有站点流量通过min-max归一化处理,并减去每个时间段的平均值。
一些实施例中,所述步骤S2中的所述站点间流动建模是将上一时间段的站点间的流通矩阵为基础构建实时动态的门矩阵,获取门矩阵后将上一时间段的站点流量分别经过门矩阵再输入一层全连接神经网络得到站点间流动模块的输出。
一些实施例中,所述步骤S2中的所述动态站点内行为建模包括站点向量表达、站点的动态上下文环境建模和站点的流量序列建模。
一些实施例中,所述站点向量表达基于站点间流通数据,采用自然语言模型Word2Vec的skip-gram模型。
一些实施例中,所述站点的动态上下文环境建模是利用实时的关联站点信息对上下文环境量化,为后续模型构建提供有效的输入。
一些实施例中,所述流量序列建模是基于LSTM的时域特征抽取,采用长短时记忆循环神经网络LSTM对全局时域特征建模。
一些实施例中,所述步骤S3训练模型包括初始化模型参数、使用训练集训练模型以及使用验证集选择模型。
一些实施例中,所述外部影响因素建模首先对所有外部因素数据预处理得到归一化的向量表达,再采用单层神经网络得到外部因素的影响输出。
一种基于站点行为分析的共享单车流量预测系统,采用权利要求1-9任一项所述的基于站点行为分析的共享单车流量预测方法,包括数据预处理模块、构建模型模块、训练模型模块、流量预测模块;
所述数据预处理模块进行数据清洗、计算流量和归一化处理;
所述构建模型模块包括站点间流动建模、动态站点内行为建模和外部影响因素建模;
所述训练模型模块是将训练数据输入构建模型模块内所构建的模型,使用Adam优化器梯度下降算法来训练模型获取最优参数;
流量预测模块通过输入若干历史站点出行流量数据、站点间流通量数据及外部因子数据到训练模型模块内的模型内,模型输出下一时间段内的站点出行流量包括流入量和流出量。
与现有技术相比,本发明具有如下的有益效果:
1、本发明同时对站点间动态流通行为和站点内行为变化建模来估量站点的动态行为变化,能够及时捕捉到站点的动态流量变化,达到更高的流量预测准确性。
2、本发明对站点流量的归一化处理能够去除量级比例对模型的影响,同时借鉴机器学习方法GBRT和图像处理ResNet模型中对残差建模的思想,在预处理的过程中减去每个时间段的平均值,提升模型预测的准确性。
3、本发明以上一时间段的站点间的流通矩阵为基础构建实时动态的门矩阵,来过滤不相关的其他站点,只保留实时关联的站点信息,解决了统计学习方法方差大及数据稀疏等不足之处。
4、本发明提出的基于LSTM的时域特征抽取和时域上的预测方法,在考虑到每个站点的自身特点的同时,既加强了模型的鲁棒性,又降低了模型的复杂度。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1是本发明方法流程图;
图2是本发明提出的模型架构图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
实施例1
如图1-2所示,本发明提供了一种基于站点行为分析的共享单车流量预测方法,站点行为分为站点间流通行为和站点内行为变化,具体包括以下步骤:
数据预处理步骤:
根据历史行程信息计算站点内的出行流量包括流入量check-ins和流出量check-outs、计算站点间的流通量flow-ins和flow-outs,并进行归一化;对外部因素数据归一化处理得到实时外部输入,即包括以下三个步骤:
(1a)数据清洗:删除无效数据,其中无效数据指出行时间少于1分钟的数据;
(1b)计算流量:计算每个站点的流入流出量,及站点间的流通量数据。
(1c)归一化:将所有站点流量通过min-max归一化处理,并减去每个时间段的平均值。
本步骤中对站点流量的归一化处理能够去除量级比例对模型的影响,同时借鉴机器学习方法GBRT和图像处理ResNet模型中对残差建模的思想,在预处理的过程中减去每个时间段的平均值,提升模型预测的准确性。
构建模型步骤:
首先是问题定义。给定一段时间内的所有站点流量check-in和check-out数据{It,Ot|t=1,…,B}(It/Ot∈RN为t时间段的所有站点的check-in/check-out向量,N为站点个数,即为t时间段内站点Sk的check-in流量),预测下一时间段B+1所有站点的check-in和check-out数量IB+1/OB+1。
整个模型可以分为3部分,站点间动态流通行为建模、站点内动态行为建模、外部因素影响建模,接下来详细描述各个部分:
(1)站点间流动建模,即站点间动态流通行为建模。
该部分的输入为上一时间段的所有站点流量和站点间流通量,对下一时间段的站点间行为建模。具体来说,给定上一时间段内的站点流量check-in和check-out向量It,Ot及站点间流通矩阵ft,其中ft∈RN×N,表示t时间段内从站点Sj到站点Sk的流量。首先创建门矩阵控制实时站点间流通变化,具体公式为:
事实上,其中是从站点Sj到其他站点的流入量的概率分布,是从站点Sj到其他站点的流出量的概率分布,M表示站点Sj到站点Sk间的任一站点;
得到门矩阵后,将上一时间段的站点流量分别经过门矩阵再输入一层全连接神经网络可得到该模块的输出,具体公式如下:
其中°表示按位相乘操作,f(·)是激活函数,Wi,1,Wo,1,bi,1,bo,1表示在训练过程待学习的参数,和分别表示该模块的check-in和check-out输出。
站点内的流入量和流出量与周边相邻的站点有着紧密联系,然而这种关联状态随时间动态变化,以统计方法为基础来模拟站点间流通行为不能准确估量站点间流通行为对站点流量的影响。因此本发明具体来说,给定上一时间段内的站点间流通矩阵ft,其中ft∈RN×N,表示t时间段内从站点Sj到站点Sk的流量。本发明创建的门矩阵 其中表示为上一时间段内从站点Sj到站点Sk的流量概率,以此来估量当前时间段站点Sj和站点Sk间的流通量变化,解决了统计学习方法方差大及数据稀疏等不足之处。
(2)站点内动态行为建模:
第一,该模块首先通过站点间的流通数据建立向量表达模型Word2Vec,采用skip-gram模型在交通流量中基于连接站点预测当前站点,最终训练得到每个站点的m维向量表达{e1,…,eN}。
不同于一般基于站点自有属性构建的向量表达,本发明提出的基于站点间流通数据的向量表达采用自然语言模型Word2Vec的skip-gram模型,能够表征站点间流通行为,而不仅仅局限于站点固有地理位置、周围建筑信息。具体来说,本发明采用的Word2Vec中skip-gram模型将利用站点间的流通数据,给定流入站点或流出站点,预测到达站点或始发站点,经多次训练得到每个站点的向量表达。实践证明,该方法得到的站点向量表达在连续域中能够表征站点的流通行为,使经常流通的站点在连续空间中距离更近,相反没有关联的站点距离较远。
第二,对于每个站点,在不同时间段的上下文环境是动态变化的,并且对下一时间段的站点流量会产生重要影响,因此在这一部分将对每个站点的动态上下文环境量化。具体来说,对某个站点Sk和上一时间段的站点间流通矩阵ft,其流入量check-in的上下文环境表达为
对所有站点{S1,…,SN},将其上下文环境表达拼接为矩阵表达然后通过共享作用层,可得到上下文环境影响的输出具体表示为
其中wi,2∈Rm×1和bi,2∈Rm×1是共享作用层中待学习的参数,f(·)为激活函数。同理,对于流出量check-out的上下文环境影响的输出可由上述操作得到。
本发明在对站点的动态上下文环境建模时,对每个站点的关联站点的向量采用加权和操作来得到上下文环境的动态表达,利用实时的关联站点信息对上下文环境量化,为后续模型构建提供了有效的输入。
第三,站点的流量变化随时间动态变化,需要考虑前几个时间段的流量变化,因此站点内的行为分析还需对所有站点的流量序列建模。这一部分将采用长短时记忆循环神经网络LSTM对全局时域特征建模,具体来说,将上一时间段的所有站点的流入向量It和流出向量Ot连接作为LSTM层的输入,LSTM细胞更新操作如下:
it=σ(Wxi[It:Ot]+Whiht-1+bi)
ft=σ(Wxf[It:Ot]+Whfht-1+bf)
ot=σ(Wxo[It:Ot]+Whoht-1+bo)
Ct=σ((ft)°(Ct)+(it)°tanh(Wxc[It:Ot]+Whcht-1+bc))
ht=(ot)°tanh(Ct)
其中[:]表示连接操作;°表示按位相乘;σ(·)和tanh(·)表示sigmoid和双曲正切函数;所有形式的W和b都为训练中待学习的参数;ht和Ct分别表示LSTM细胞中的隐含状态和细胞状态表示;it,ft,ot分别表示输入门、遗忘门、输出门,分别用于控制输入传至细胞的量、细胞更新量、细胞输出量。
最后得到的隐含状态表示ht即为全局时域特征表达,由于每个站点对同一时域状态的行为反应不同,这里将对N个站点采用N个流入量的注解向量{ai(1),…,ai(N)},及N个流出量的注解向量{ao(1),…,ao(N)},同时采用内积操作得到每个站点的时域输出表达,如下所示:
其中<v1,v2>表示向量v1和向量v2间的内积操作,所有注解向量均在训练过程中学习得到。
在时域上,站点的流量变化随时间动态变化,因此前几个时间段的流量变化规律对下一时间段的流量预测同样也有着重要作用。本发明在这一部分中采用长短时记忆循环神经网络LSTM对全局时域特征建模,不同于对所有站点分别采用时间序列模型预测,本发明提出的LSTM模型输入为前几个时间段中所有站点的流入量和流出量,经一层神经网络和非线性激活函数后得到当前预测时间段的隐含全局时域表达。
而后由于每个站点对同一时域变化的行为反应不同,本发明对每个站点构建流入和流出的注解向量,并分别采用同当前时间段的隐含全局时域表达向量的内积操作来得到时域上的预测输出。相比于对所有站点分别采用时间序列模型预测,本发明提出的基于LSTM的时域特征抽取和时域上的预测方法,在考虑到每个站点的自身特点的同时,既加强了模型的鲁棒性,又降低了模型的复杂度。
(3)外部因素影响建模。
在对外部因素影响建模时,本发明首先对所有外部因素数据预处理得到归一化的向量表达,再采用单层神经网络得到外部因素的影响输出。
该模块考虑外部因素如环境、时间等特征对站点流量的影响,具体来说,考虑天气条件、温度、风速、工作日/休息日及时间段类别,其中时间段类别分为4个时间间隔[0,6),[6,12),[12,18),[18,24)并用one-hot编码表示时间段类别信息,将这些外部因素整合成向量表达为ut,表示t时间段的外部因素。然后采用单层神经网络对外部因素影响建模得到该模块的输出:
其中SLP代表单层神经网络。
(4)最后,将上述所有模块整合得到下一时刻所有站点的流入流出预测量,如下所示:
训练模型步骤:
通过上述,在模型构建完成后,将对所构建模型进行训练,以获取最优参数,提高模型的精准度,具体操作阐述如下:
将训练数据输入所构建的模型,使用Adam优化器梯度下降算法来训练模型得到最优参数,包括以下三个步骤:
(1a)初始化模型参数
使用随机数初始化矩阵乘法中的权值。对于神经元的bias,通常设为0。
(2b)使用训练集训练模型
将训练集以8的batch大小输入神经网络每次迭代后(iteration)保存一次模型,迭代足够的次数至模型基本收敛。
(2c)使用验证集选择模型
使用上一步保存的模型来对验证集数据进行测试,选出验证误差最小的模型作为最终模型。
流量预测步骤:
待最终模型选定后,进行流量预测,具体操作阐述如下;
输入若干历史站点出行流量数据、站点间流通量数据及外部因子数据,模型输出下一时间段内的站点出行流量包括流入量check-ins和流出量check-outs,具体包括以下步骤:
(3a)使用(2c)得到的模型来对测试集进行预测。
(3b)将结果反归一化,得到每个站点在下一时段内的流入流出量。
(3c)由下一时段内的流量预测值,可再次输入到训练好的模型,同时使用已有流通量矩阵及预测的外部因素数据预测未来几个小时后的流入流出量。
实施例2
如图1-2所示,本发明提供一种基于站点行为分析的共享单车流量预测系统,包括数据预处理模块、构建模型模块、训练模型模块、流量预测模块;
所述数据预处理模块进行数据清洗、计算流量和归一化处理;
所述构建模型模块包括站点间流动建模、动态站点内行为建模和外部影响因素建模;
所述训练模型模块是将训练数据输入构建模型模块内所构建的模型,使用Adam优化器梯度下降算法来训练模型获取最优参数;
流量预测模块通过输入若干历史站点出行流量数据、站点间流通量数据及外部因子数据到训练模型模块内的模型内,模型输出下一时间段内的站点出行流量包括流入量和流出量。
上述各模块内的的相应运行与工作原理在实施例1中已详细描述,在此不再赘述。
综上所述,本发明同时对站点间动态流通行为和站点内行为变化建模来估量站点的动态行为变化,能够及时捕捉到站点的动态流量变化,达到更高的流量预测准确性;本发明对站点流量的归一化处理能够去除量级比例对模型的影响,同时借鉴机器学习方法GBRT和图像处理ResNet模型中对残差建模的思想,在预处理的过程中减去每个时间段的平均值,提升模型预测的准确性;本发明以上一时间段的站点间的流通矩阵为基础构建实时动态的门矩阵,来过滤不相关的其他站点,只保留实时关联的站点信息,解决了统计学习方法方差大及数据稀疏等不足之处;本发明提出的基于LSTM的时域特征抽取和时域上的预测方法,在考虑到每个站点的自身特点的同时,既加强了模型的鲁棒性,又降低了模型的复杂度。
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。
Claims (10)
1.一种基于站点行为分析的共享单车流量预测方法,其特征在于,包括如下步骤:
S1,数据预处理:包括数据清洗、计算流量和归一化处理;
S2,构建模型:包括站点间流动建模、动态站点内行为建模和外部影响因素建模;
S3,训练模型:将训练数据输入步骤S2所构建的模型,使用Adam优化器梯度下降算法来训练模型获取最优参数;
S4,流量预测:输入若干历史站点出行流量数据、站点间流通量数据及外部因子数据到经步骤S3训练的模型内,模型输出下一时间段内的站点出行流量包括流入量和流出量。
2.根据权利要求1所述的基于站点行为分析的共享单车流量预测方法,其特征在于,所述步骤S1中的所述计算流量为根据历史行程信息计算站点内流入流出量与站点间的流通量,所述归一化处理是将所有站点流量通过min-max归一化处理,并减去每个时间段的平均值。
3.根据权利要求1所述的基于站点行为分析的共享单车流量预测方法,其特征在于,所述步骤S2中的所述站点间流动建模是将上一时间段的站点间的流通矩阵为基础构建实时动态的门矩阵,获取门矩阵后将上一时间段的站点流量分别经过门矩阵再输入一层全连接神经网络得到站点间流动模块的输出。
4.根据权利要求1所述的基于站点行为分析的共享单车流量预测方法,其特征在于,所述步骤S2中的所述动态站点内行为建模包括站点向量表达、站点的动态上下文环境建模和站点的流量序列建模。
5.根据权利要求4所述的基于站点行为分析的共享单车流量预测方法,其特征在于,所述站点向量表达基于站点间流通数据,采用自然语言模型Word2Vec的skip-gram模型。
6.根据权利要求4所述的基于站点行为分析的共享单车流量预测方法,其特征在于,所述站点的动态上下文环境建模是利用实时的关联站点信息对上下文环境量化,为后续模型构建提供有效的输入。
7.根据权利要求4所述的基于站点行为分析的共享单车流量预测方法,其特征在于,所述流量序列建模是基于LSTM的时域特征抽取,采用长短时记忆循环神经网络LSTM对全局时域特征建模。
8.根据权利要求1所述的基于站点行为分析的共享单车流量预测方法,其特征在于,所述步骤S3训练模型包括初始化模型参数、使用训练集训练模型以及使用验证集选择模型。
9.根据权利要求1所述的基于站点行为分析的共享单车流量预测方法,其特征在于,所述外部影响因素建模首先对所有外部因素数据预处理得到归一化的向量表达,再采用单层神经网络得到外部因素的影响输出。
10.一种基于站点行为分析的共享单车流量预测系统,其特征在于,采用权利要求1-9任一项所述的基于站点行为分析的共享单车流量预测方法,包括数据预处理模块、构建模型模块、训练模型模块、流量预测模块;
所述数据预处理模块进行数据清洗、计算流量和归一化处理;
所述构建模型模块包括站点间流动建模、动态站点内行为建模和外部影响因素建模;
所述训练模型模块是将训练数据输入构建模型模块内所构建的模型,使用Adam优化器梯度下降算法来训练模型获取最优参数;
流量预测模块通过输入若干历史站点出行流量数据、站点间流通量数据及外部因子数据到训练模型模块内的模型内,模型输出下一时间段内的站点出行流量包括流入量和流出量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910424740.0A CN110210656B (zh) | 2019-05-21 | 2019-05-21 | 基于站点行为分析的共享单车流量预测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910424740.0A CN110210656B (zh) | 2019-05-21 | 2019-05-21 | 基于站点行为分析的共享单车流量预测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110210656A true CN110210656A (zh) | 2019-09-06 |
CN110210656B CN110210656B (zh) | 2021-07-13 |
Family
ID=67788003
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910424740.0A Active CN110210656B (zh) | 2019-05-21 | 2019-05-21 | 基于站点行为分析的共享单车流量预测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110210656B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111429000A (zh) * | 2020-03-23 | 2020-07-17 | 成都信息工程大学 | 一种基于站点聚类的共享单车取还站点推荐方法及系统 |
CN111461384A (zh) * | 2019-12-10 | 2020-07-28 | 阿里巴巴集团控股有限公司 | 对象流量预测方法、装置及设备 |
CN111815937A (zh) * | 2019-11-22 | 2020-10-23 | 北京嘀嘀无限科技发展有限公司 | 用于超停车辆调度的控制方法、装置、存储介质和电子设备 |
CN112801424A (zh) * | 2020-11-20 | 2021-05-14 | 西北工业大学 | 一种利用层级结构的新站点流量预测方法 |
CN113098735A (zh) * | 2021-03-31 | 2021-07-09 | 上海天旦网络科技发展有限公司 | 面向推理的应用流量和指标向量化方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107967532A (zh) * | 2017-10-30 | 2018-04-27 | 厦门大学 | 融合区域活力的城市交通流量预测方法 |
US20180137412A1 (en) * | 2016-11-16 | 2018-05-17 | Cisco Technology, Inc. | Network traffic prediction using long short term memory neural networks |
CN108510741A (zh) * | 2018-05-24 | 2018-09-07 | 浙江工业大学 | 一种基于Conv1D-LSTM神经网络结构的交通流预测方法 |
CN108564227A (zh) * | 2018-04-26 | 2018-09-21 | 重庆大学 | 一种基于时空特征的轨道交通客流量预测方法 |
-
2019
- 2019-05-21 CN CN201910424740.0A patent/CN110210656B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180137412A1 (en) * | 2016-11-16 | 2018-05-17 | Cisco Technology, Inc. | Network traffic prediction using long short term memory neural networks |
CN107967532A (zh) * | 2017-10-30 | 2018-04-27 | 厦门大学 | 融合区域活力的城市交通流量预测方法 |
CN108564227A (zh) * | 2018-04-26 | 2018-09-21 | 重庆大学 | 一种基于时空特征的轨道交通客流量预测方法 |
CN108510741A (zh) * | 2018-05-24 | 2018-09-07 | 浙江工业大学 | 一种基于Conv1D-LSTM神经网络结构的交通流预测方法 |
Non-Patent Citations (2)
Title |
---|
XIAN ZHOU 等: "Predicting Multi-step Citywide Passenger Demands Using Attention-based Neural Networks", 《WSDM "18: PROCEEDINGS OF THE ELEVENTH ACM INTERNATIONAL CONFERENCE ON WEB SEARCH AND DATA MINING》 * |
李颖宏 等: "基于LSTM的共享单车需求预测", 《智能城市》 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111815937A (zh) * | 2019-11-22 | 2020-10-23 | 北京嘀嘀无限科技发展有限公司 | 用于超停车辆调度的控制方法、装置、存储介质和电子设备 |
CN111461384A (zh) * | 2019-12-10 | 2020-07-28 | 阿里巴巴集团控股有限公司 | 对象流量预测方法、装置及设备 |
CN111461384B (zh) * | 2019-12-10 | 2024-04-05 | 阿里巴巴集团控股有限公司 | 对象流量预测方法、装置及设备 |
CN111429000A (zh) * | 2020-03-23 | 2020-07-17 | 成都信息工程大学 | 一种基于站点聚类的共享单车取还站点推荐方法及系统 |
CN111429000B (zh) * | 2020-03-23 | 2021-05-28 | 成都信息工程大学 | 一种基于站点聚类的共享单车取还站点推荐方法及系统 |
CN112801424A (zh) * | 2020-11-20 | 2021-05-14 | 西北工业大学 | 一种利用层级结构的新站点流量预测方法 |
CN113098735A (zh) * | 2021-03-31 | 2021-07-09 | 上海天旦网络科技发展有限公司 | 面向推理的应用流量和指标向量化方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110210656B (zh) | 2021-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Barak et al. | Forecasting energy consumption using ensemble ARIMA–ANFIS hybrid algorithm | |
Bi et al. | Daily tourism volume forecasting for tourist attractions | |
CN110210656A (zh) | 基于站点行为分析的共享单车流量预测方法及系统 | |
Bi et al. | Tourism demand forecasting with time series imaging: A deep learning model | |
CN111754025B (zh) | 基于cnn+gru的公交短时客流预测方法 | |
Ma et al. | Short-term traffic flow forecasting by selecting appropriate predictions based on pattern matching | |
Huang et al. | A GAN framework-based dynamic multi-graph convolutional network for origin–destination-based ride-hailing demand prediction | |
Zhu et al. | A Novel Traffic Flow Forecasting Method Based on RNN‐GCN and BRB | |
CN106453293A (zh) | 一种基于改进bpnn的网络安全态势预测方法 | |
Lu et al. | Short-term demand forecasting for online car-hailing using ConvLSTM networks | |
CIĞIZOĞLU | Suspended sediment estimation and forecasting using artificial neural networks | |
CN104217258A (zh) | 一种电力负荷条件密度预测方法 | |
CN117116048A (zh) | 基于知识表示模型和图神经网络的知识驱动交通预测方法 | |
Awad et al. | Prediction of water demand using artificial neural networks models and statistical model | |
Xiao et al. | Parking prediction in smart cities: A survey | |
Sun et al. | Joint resource scheduling for UAV-enabled mobile edge computing system in Internet of Vehicles | |
CN117875520B (zh) | 基于动态图时空演化挖掘的公共安全事件预测方法及系统 | |
CN116307152A (zh) | 时空交互式动态图注意力网络的交通预测方法 | |
Xie et al. | Unmanned system safety decision-making support: Analysis and assessment of road traffic accidents | |
Rath et al. | Hierarchical neurofuzzy model for real-time flood forecasting | |
Kaushik et al. | Radial basis function network using intuitionistic fuzzy C means for software cost estimation | |
Xing et al. | RL-GCN: Traffic flow prediction based on graph convolution and reinforcement learning for smart cities | |
CN117217779A (zh) | 预测模型的训练方法、装置及信息预测方法、装置 | |
Xiao et al. | [Retracted] Accident Liability Determination of Autonomous Driving Systems Based on Artificial Intelligence Technology and Its Impact on Public Mental Health | |
CN112766240A (zh) | 基于时空关系的残差多图卷积人群分布预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |