CN114757418A - 共享单车需求量预测模型的训练方法、系统和设备 - Google Patents
共享单车需求量预测模型的训练方法、系统和设备 Download PDFInfo
- Publication number
- CN114757418A CN114757418A CN202210402008.5A CN202210402008A CN114757418A CN 114757418 A CN114757418 A CN 114757418A CN 202210402008 A CN202210402008 A CN 202210402008A CN 114757418 A CN114757418 A CN 114757418A
- Authority
- CN
- China
- Prior art keywords
- model
- shared bicycle
- bicycle demand
- parameter
- demand prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 61
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000004590 computer program Methods 0.000 claims description 17
- 239000011159 matrix material Substances 0.000 description 10
- 230000006872 improvement Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Biophysics (AREA)
- General Business, Economics & Management (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种共享单车需求量预测模型的训练方法、系统和设备,通过分别利用单独的模型对车流量预测和共享单车进行预测,然后再将预测结果统一输入到共享单车需求量预测模型中,使得共享单车需求量预测模型对车流量参数和单车需求量参数建立联系并输出互相影响之后而产生的更新参数,最后再利用这一更新参数去更新两个单独模型的参数,更新完参数后的模型会更加拟合实际情况。本发明根据区域内的交通情况来训练共享单车需求量预测模型,从而训练得到的需求量模型能准确预测当前区域的共享单车需求量,使得每个区域的单车使用情况不会过剩也不会出现供不应求的情况。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种共享单车需求量预测模型的训练方法、系统和设备。
背景技术
当今社会背景下,人们出行的方式多种多样,并且多数都提倡低碳出行,所以很多人在最后一公里或者两公里的时候选择用共享单车代步。那么如何正确地在城市的各个地段投放适量的共享单车就是必须要解决的问题。现有技术中常采用的单车预测系统利用历史单车使用记录和站点分布信息分析影响单车需求量的因素,以此构建需求预测模型对共享单车需求量进行预测。虽然采用上述预测模型能够预测共享单车需求量,但是,上述模型在构建时仅考虑仅考虑了历史单车使用记录和站点分布信息,而现实是很多情况下一个区域内车流量的多少对附近的共享单车的需求量有很大影响,传统模型忽略了对需求量影响还需考虑当前站点的车流量情况,导致模型预测精度不高。
发明内容
本发明实施例的目的是提供一种共享单车需求量预测模型的训练方法、系统和设备,根据区域内的交通情况来训练共享单车需求量预测模型,从而训练得到的需求量模型能准确预测当前区域的共享单车需求量,使得每个区域的单车使用情况不会过剩也不会出现供不应求的情况。
为实现上述目的,本发明实施例提供了一种共享单车需求量的预测模型构建方法,包括:
每间隔预设时间段将预先收集到的预设区域的车流量输入到第一模型中,以使所述第一模型输出车流量预测结果;
每间隔预设时间段将预先收集到的预设区域的共享单车使用记录输入到第二模型中,以使所述第二模型输出共享单车需求量初步预测结果;
将所述车流量预测结果和所述共享单车需求量初步预测结果发送到共享单车需求量预测模型中,以使所述共享单车需求量预测模型对车流量参数和单车需求量参数建立联系并输出第一更新参数和第二更新参数;其中,所述第一更新参数用于更新所述第一模型的参数,所述第二更新参数用于更新所述第二模型的参数;
输出训练完成的共享单车需求量预测模型。
作为上述方案的改进,所述第一模型为LSTM模型,所述第一模型存储在第一服务器,所述第一更新参数为LSTM中各个cell中门控中的参数。
作为上述方案的改进,所述第二模型为GCN模型,所述第二模型存储在第二服务器,所述更新参数为GCN中的卷积层每一个元素的参数。
作为上述方案的改进,所述共享单车需求量预测模型包括搭载在Pysyft框架下的LSTM模型和GCN模型,所述共享单车需求量预测模型存储在第三服务器。
作为上述方案的改进,所述GCN模型搭建有若干个对应不同区域的公路网络的拓扑结构,所述拓扑结构包括若干个节点和连接所述节点的连接线;其中,每一所述节点表示一条公路,所述节点之间的连接线表示两条公路有交接。
为实现上述目的,本发明实施例还提供了一种共享单车需求量预测模型的训练系统,包括:
车流量预测结果生成模块,用于每间隔预设时间段将预先收集到的预设区域的车流量输入到第一模型中,以使所述第一模型输出车流量预测结果;
需求量初步预测结果生成模块,用于每间隔预设时间段将预先收集到的预设区域的共享单车使用记录输入到第二模型中,以使所述第二模型输出共享单车需求量初步预测结果;
更新参数生成模块,用于将所述车流量预测结果和所述共享单车需求量初步预测结果发送到共享单车需求量预测模型中,以使所述共享单车需求量预测模型对车流量参数和单车需求量参数建立联系并输出第一更新参数和第二更新参数;其中,所述第一更新参数用于更新所述第一模型的参数,所述第二更新参数用于更新所述第二模型的参数;
预测模型输出模块,用于输出训练完成的共享单车需求量预测模型。
作为上述方案的改进,所述第一模型为LSTM模型,所述第一模型存储在第一服务器,所述第一更新参数为LSTM中各个cell中门控中的参数;所述第二模型为GCN模型,所述第二模型存储在第二服务器,所述更新参数为GCN中的卷积层每一个元素的参数。
作为上述方案的改进,所述共享单车需求量预测模型包括搭载在Pysyft框架下的LSTM模型和GCN模型,所述共享单车需求量预测模型存储在第三服务器。
作为上述方案的改进,所述GCN模型搭建有若干个对应不同区域的公路网络的拓扑结构,所述拓扑结构包括若干个节点和连接所述节点的连接线;其中,每一所述节点表示一条公路,所述节点之间的连接线表示两条公路有交接。
为实现上述目的,本发明实施例还提供一种共享单车需求量预测模型的训练设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一实施例所述的共享单车需求量预测模型的训练方法。
相比于现有技术,本发明实施例公开的共享单车需求量预测模型的训练方法、系统和设备,通过分别利用单独的模型对车流量预测和共享单车进行预测,然后再将预测结果统一输入到共享单车需求量预测模型中,使得共享单车需求量预测模型对车流量参数和单车需求量参数建立联系并输出互相影响之后而产生的更新参数,最后再利用这一更新参数去更新两个单独模型的参数,更新完参数后的模型会更加拟合实际情况。本发明根据区域内的交通情况来训练共享单车需求量预测模型,从而训练得到的需求量模型能准确预测当前区域的共享单车需求量,使得每个区域的单车使用情况不会过剩也不会出现供不应求的情况。
附图说明
图1是本发明实施例提供的一种共享单车需求量预测模型的训练方法的流程图;
图2是本发明实施例提供的公路网络的拓扑结构图;
图3是本发明实施例提供的一种共享单车需求量预测模型的训练系统的结构框图;
图4是本发明实施例提供的一种共享单车需求量预测模型的训练设备的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,图1是本发明实施例提供的一种共享单车需求量预测模型的训练方法的流程图,所述共享单车需求量预测模型的训练方法包括:
S1、每间隔预设时间段将预先收集到的预设区域的车流量输入到第一模型中,以使所述第一模型输出车流量预测结果;
S2、每间隔预设时间段将预先收集到的预设区域的共享单车使用记录输入到第二模型中,以使所述第二模型输出共享单车需求量初步预测结果;
S3、将所述车流量预测结果和所述共享单车需求量初步预测结果发送到共享单车需求量预测模型中,以使所述共享单车需求量预测模型对车流量参数和单车需求量参数建立联系并输出第一更新参数和第二更新参数;其中,所述第一更新参数用于更新所述第一模型的参数,所述第二更新参数用于更新所述第二模型的参数;
S4、输出训练完成的共享单车需求量预测模型。
具体地,在步骤S1中,所述第一模型为LSTM模型,所述第一模型存储在第一服务器。所述预设时间段可以为12h,所述预设区域可以根据某个人流较为集中的地点进行划分,比如以地铁站为圆心,半径100米内的范围作为一个区域。所述预设时间段的车流量数据可以通过预先通过车联网获取。
示例性的,对于一个城市交通部门来说,他们拥有着庞大的数据集,这些数据集记载着过去几天的交通情况,所以挖掘出这些时间序列中隐藏的时间特性就显得非常重要。使用LSTM模型(这是一种在时间上有很强的处理能力的机器学习方法)来探究那些隐藏在历史数据中的时间关联性。具体地在每一个时间步中,模型会通过各种门的筛选来保留前一时间步中的重要信息。
所述LSTM模型最大的一个特点是LSTM中的每一个cell都指示一个时间步,当一个cell接收了一个时间步的输入后,其不仅仅会带入当前的时间特性并且会分析过去历史中的cell有哪些信息应该要被保留。比如,使用历史的12个小时来预测下一个小时的交通情况,因此本发明实施例中的LSTM的长度为设为12个cell,LSTM会把那些潜在的规律找出来并将它们通过cell中的门,而那些不具有时间相关性的特性将会在遗忘门中被丢弃。接下来,可以用以下非线性的函数来清楚地表示LSTM中各种门的运作过程以及数据的流动方向和产生过程,可参考如下公式:
it=σ(WxiXi t+Whiht-1+Wcict-1+bi) (1);
ft=σ(WxfXi t+Whfht-1+Wcfct-1+bf) (2);
ct=ftct-1+ittanh(WxcXi t+Whcht-1+bc) (3);
ot=σ(WxoXi t+Whoht-1+Wcoct-1+bo) (4);
ht=ot·tanh(ct) (5);
其中,Wxi是指时间点t输入数据在输入门中对应的权重,Whi是指时间点t隐藏状态在输入门中对应的权重,Wci是指时间点t的cell状态在输入门中对应的权重,Wxf是指时间点t输入数据在遗忘门中对应的权重,Whf是指时间点t隐藏状态在遗忘门中对应的权重,Wcf是指时间点t的cell状态在遗忘门中对应的权重,Wxc是指时间点t输入数据在cell更新门中对应的权重,Whc是指时间点t隐藏状态在cell更新门中对应的权重,Wxo是指时间点t输入数据在输出门中对应的权重,Who是指时间点t隐藏状态在输出门中对应的权重,Wco是指时间点t的cell状态在输出门中对应的权重,it是指输入门的更新结果,ft是指遗忘门的更新结果,ct是指cell状态的更新结果,ot是指输出门的更新结果,ht是指隐藏状态的更新结果,Xi t是指对于区域表示i的车流量在t时间点上的车流量值,bi、bf、bc、bo分别对应着一个cell中输入门、遗忘门、cell更新门以及输出门的更新参数偏移量。
值得说明的是,f与i这两个门决定了信息是怎么在LSTM中传输的,以及决定了哪些信息应该被保留,哪些信息应该被遗弃。所以LSTM中的每个cell不但会接收当前时间片的输入,并且会吸收已经被学习过的时间隐藏特性。
具体地,在步骤S2中,所述第二模型为GCN模型,所述第二模型存储在第二服务器。所述预设时间段的共享单车使用记录可以通过共享单车使用软件获取,该使用记录以用户解锁单车为准,每解锁一次则累计加1。
示例性的,GCN为图卷积网络,城市负责共享单车的部门基于需求数据集来工作,目的是为了能够高效率地调度共享单车。而每一个共享单车的站点都高度地与其周围的区域产生联系,所以用GCN模型是为了搞清楚一个区域到底与其相邻的区域有多少联系。不同于传统的卷积操作,图卷积并不会机械式地将所有相邻的区域的特征都学习进来。如果这样做,可能会导致模型不分轻重将那些可能联系性不大的特征也考虑进来,这样就影响了性能。所以GCN得益于图结构的邻接矩阵,该矩阵将体现了真实的空间联系性。GCN只会将那些有空间连通性的区域进行卷积操作以挖掘联系性。具体的公式如下:
Rt=Wt·At·Xt (6);
其中,Wt是t时间点上的权重参数,At是t时间点上的邻接矩阵参数,Xt是t时间点上的输入特征。
可选地,所述GCN模型搭建有若干个对应不同区域的公路网络的拓扑结构,所述拓扑结构包括若干个节点和连接所述节点的连接线;其中,每一所述节点表示一条公路,所述节点之间的连接线表示两条公路有交接。
示例性的,与传统的卷积神经网络不同,图卷积神经网络被设计成一个无向图g=(V,A),这里的V表示所有节点的集合,而A则是表示节点关系的邻接矩阵。邻接矩阵A是根据数据集中的位置字段来构建的,A中的元素除了1就是0,1表示对应的行列节点之间是连通的。比如骑行记录中会包含行车轨迹的起点路口和终点路口以及下一个路口所连接的路段,那么从这些信息就可以认为该记录中的行驶路段与下一个路口所连接的路段是联通的,所以在领接矩阵中应该将对应元素置为1。所述公路网络的拓扑结构图可以参考图2,图2中的R1~R7表示节点,节点之间存在连接线。
具体地,在步骤S3中,所述共享单车需求量预测模型包括搭载在Pysyft框架下的LSTM模型和GCN模型,所述共享单车需求量预测模型存储在第三服务器。所述第一更新参数为LSTM中各个cell中门控中的参数。所述更新参数为GCN中的卷积层每一个元素的参数。
示例性的,所述共享单车需求量预测模型需要将行车情况和单车需求量联系起来,需要用这两个模型的结合(LSTM+GCN)去分别对车流量和单车需求量做预测,进而根据联邦服务器中的数据误差来更新参数,当然这里是先对车流量数据进行学习,然后在保密或卸载车流量数据集的情况下再对单车数据集去学习。所述共享单车需求量预测模型在更新参数后,需要将更新参数发回到第一服务器和第二服务器的目的是:因为被所述共享单车需求量预测模型更新完的参数是由GCN和LSTM互相影响之后而产生的参数,有这些参数构成的模型会更加拟合实际情况。
示例性的,为了所有实验中所涉及的数据集能够安全地进行训练以保护不同部门的数据集。所述共享单车需求量预测模型用到一个联邦学习框架,其核心是服务器能够实时接收到独立模型服务器发来的更新参数,最终的参数让联合服务器来更新出一个更好的学习参数,而联邦学习有很多实现的方式,其中Pysyft可以很好地完成联邦学习的各种过程。
示例性的,各自的数据集在各自的服务器上进行训练(这里假定服务器是可以承受整个训练过程的),基于联邦学习的首要目的就是要将不同部门的数据集分开储存,这样才不会让数据集泄露给不同的部门,3个服务器分别对应着车流量的服务器、单车需求量的服务器和联合训练模型的服务器。其次,第一服务器(车流量的服务器)和第二服务器(单车需求量的服务器)将他们每个训练周期得到的参数发送到第三服务器上,一个训练周期是指机器学习中一次训练的epoch,最后所述第三服务器更新两种不同的参数得到新参数,当然这里的更新是经过两种数据集关联性的权衡,并最终将参数回发给对应的第一服务器和第二服务器。
相比于现有技术,本发明实施例公开的共享单车需求量预测模型的训练方法,通过分别利用单独的模型对车流量预测和共享单车进行预测,然后再将预测结果统一输入到共享单车需求量预测模型中,使得共享单车需求量预测模型对车流量参数和单车需求量参数建立联系并输出互相影响之后而产生的更新参数,最后再利用这一更新参数去更新两个单独模型的参数,更新完参数后的模型会更加拟合实际情况。本发明根据区域内的交通情况来训练共享单车需求量预测模型,从而训练得到的需求量模型能准确预测当前区域的共享单车需求量,使得每个区域的单车使用情况不会过剩也不会出现供不应求的情况。
在本发明实施例中,对于数据保护,通过联邦学习框架将多个服务器联系起来,其中服务器间的通讯则是依靠各个模型在每个周期中训练得出的参数,这样做的目的是将不同部门的数据保存在各自的模型服务器上去训练而不暴露给其他的服务器。而车流量的数据和单车需求量的数据会在联邦学习的云服务器上产生联系,处在云服务器上的结合模型同时接收到不同服务器的参数用于训练。并且两个模型的参数被处在云服务器上的联合模型学习之后是可以提升性能,因为在现实生活中,车流量与共享单车的数量在某种程度上是在区域内成正比的,这体现在机器学习中则是GCN中表示不同区域的参数会随着LSTM不同时间步车流量的更新而有所不同,并且两个模型的参数是相辅相成的。即反过来说也成立,如果发现在GCN中某个地域过去几个小时的参数更新没有太大变化,也可以说明该地域在过去几个小时中车流量没有太大的变化。
在本发明实施例中,通过Pysyft这种实现方案不仅可以用来布置LSTM和GCN两种模型,也可以用来布置其他的机器学习模型甚至是较为复杂的模型。因为在服务器上传输的仅仅是参数,并不用将整个模型结构透漏给其他模型,所以整个模型的传输成本比较低。另外在Pysyft这种联邦学习框架中布置各种模型以及模型的数据集也有固定的操作方法,不用基于不同的模型来写不同的代码,实施简单。
参见图3,图3是本发明实施例提供的一种共享单车需求量预测模型的训练系统100的结构框图,所述共享单车需求量预测模型的训练系统100包括:
车流量预测结果生成模块101,用于每间隔预设时间段将预先收集到的预设区域的车流量输入到第一模型中,以使所述第一模型输出车流量预测结果;
需求量初步预测结果生成模块102,用于每间隔预设时间段将预先收集到的预设区域的共享单车使用记录输入到第二模型中,以使所述第二模型输出共享单车需求量初步预测结果;
更新参数生成模块103,用于将所述车流量预测结果和所述共享单车需求量初步预测结果发送到共享单车需求量预测模型中,以使所述共享单车需求量预测模型对车流量参数和单车需求量参数建立联系并输出第一更新参数和第二更新参数;其中,所述第一更新参数用于更新所述第一模型的参数,所述第二更新参数用于更新所述第二模型的参数;
预测模型输出模块104,用于输出训练完成的共享单车需求量预测模型。
具体地,所述第一模型为LSTM模型,所述第一模型存储在第一服务器。所述预设时间段可以为12h,所述预设区域可以根据某个人流较为集中的地点进行划分,比如以地铁站为圆心,半径100米内的范围作为一个区域。所述预设时间段的车流量数据可以通过预先通过车联网获取。
示例性的,对于一个城市交通部门来说,他们拥有着庞大的数据集,这些数据集记载着过去几天的交通情况,所以挖掘出这些时间序列中隐藏的时间特性就显得非常重要。使用LSTM模型(这是一种在时间上有很强的处理能力的机器学习方法)来探究那些隐藏在历史数据中的时间关联性。具体地在每一个时间步中,模型会通过各种门的筛选来保留前一时间步中的重要信息。
所述LSTM模型最大的一个特点是LSTM中的每一个cell都指示一个时间步,当一个cell接收了一个时间步的输入后,其不仅仅会带入当前的时间特性并且会分析过去历史中的cell有哪些信息应该要被保留。比如,使用历史的12个小时来预测下一个小时的交通情况,因此本发明实施例中的LSTM的长度为设为12个cell,LSTM会把那些潜在的规律找出来并将它们通过cell中的门,而那些不具有时间相关性的特性将会在遗忘门中被丢弃。接下来,可以用以下非线性的函数来清楚地表示LSTM中各种门的运作过程以及数据的流动方向和产生过程,可参考如下公式:
it=σ(WxiXi t+Whiht-1+Wcict-1+bi) (1);
ft=σ(WxfXi t+Whfht-1+Wcfct-1+bf) (2);
ct=ftct-1+ittanh(WxcXi t+Whcht-1+bc) (3);
ot=σ(WxoXi t+Whoht-1+Wcoct-1+bo) (4);
ht=ot·tanh(ct) (5);
其中,Wxi是指时间点t输入数据在输入门中对应的权重,Whi是指时间点t隐藏状态在输入门中对应的权重,Wci是指时间点t的cell状态在输入门中对应的权重,Wxf是指时间点t输入数据在遗忘门中对应的权重,Whf是指时间点t隐藏状态在遗忘门中对应的权重,Wcf是指时间点t的cell状态在遗忘门中对应的权重,Wxc是指时间点t输入数据在cell更新门中对应的权重,Whc是指时间点t隐藏状态在cell更新门中对应的权重,Wxo是指时间点t输入数据在输出门中对应的权重,Who是指时间点t隐藏状态在输出门中对应的权重,Wco是指时间点t的cell状态在输出门中对应的权重,it是指输入门的更新结果,ft是指遗忘门的更新结果,ct是指cell状态的更新结果,ot是指输出门的更新结果,ht是指隐藏状态的更新结果。
值得说明的是,f与i这两个门决定了信息是怎么在LSTM中传输的,以及决定了哪些信息应该被保留,哪些信息应该被遗弃。所以LSTM中的每个cell不但会接收当前时间片的输入,并且会吸收已经被学习过的时间隐藏特性。
具体地,所述第二模型为GCN模型,所述第二模型存储在第二服务器。所述预设时间段的共享单车使用记录可以通过共享单车使用软件获取,该使用记录以用户解锁单车为准,每解锁一次则累计加1。
示例性的,GCN为图卷积网络,城市负责共享单车的部门基于需求数据集来工作,目的是为了能够高效率地调度共享单车。而每一个共享单车的站点都高度地与其周围的区域产生联系,所以用GCN模型是为了搞清楚一个区域到底与其相邻的区域有多少联系。不同于传统的卷积操作,图卷积并不会机械式地将所有相邻的区域的特征都学习进来。如果这样做,可能会导致模型不分轻重将那些可能联系性不大的特征也考虑进来,这样就影响了性能。所以GCN得益于图结构的邻接矩阵,该矩阵将体现了真实的空间联系性。GCN只会将那些有空间连通性的区域进行卷积操作以挖掘联系性。具体的公式如下:
Rt=Wt·At·Xt (6);
其中,Wt是t时间点上的权重参数,At是t时间点上的邻接矩阵参数,Xt是t时间点上的输入特征。
可选地,所述GCN模型搭建有若干个对应不同区域的公路网络的拓扑结构,所述拓扑结构包括若干个节点和连接所述节点的连接线;其中,每一所述节点表示一条公路,所述节点之间的连接线表示两条公路有交接。
示例性的,与传统的卷积神经网络不同,图卷积神经网络被设计成一个无向图g=(V,A),这里的V表示所有节点的集合,而A则是表示节点关系的邻接矩阵。邻接矩阵A是根据数据集中的位置字段来构建的,A中的元素除了1就是0,1表示对应的行列节点之间是连通的。比如骑行记录中会包含行车轨迹的起点路口和终点路口以及下一个路口所连接的路段,那么从这些信息就可以认为该记录中的行驶路段与下一个路口所连接的路段是联通的,所以在领接矩阵中应该将对应元素置为1。
具体地,所述共享单车需求量预测模型包括搭载在Pysyft框架下的LSTM模型和GCN模型,所述共享单车需求量预测模型存储在第三服务器。所述第一更新参数为LSTM中各个cell中门控中的参数。所述更新参数为GCN中的卷积层每一个元素的参数。
示例性的,所述共享单车需求量预测模型需要将行车情况和单车需求量联系起来,需要用这两个模型的结合(LSTM+GCN)去分别对车流量和单车需求量做预测,进而根据联邦服务器中的数据误差来更新参数,当然这里是先对车流量数据进行学习,然后在保密或卸载车流量数据集的情况下再对单车数据集去学习。所述共享单车需求量预测模型在更新参数后,需要将更新参数发回到第一服务器和第二服务器的目的是:因为被所述共享单车需求量预测模型更新完的参数是由GCN和LSTM互相影响之后而产生的参数,有这些参数构成的模型会更加拟合实际情况。
示例性的,为了所有实验中所涉及的数据集能够安全地进行训练以保护不同部门的数据集。所述共享单车需求量预测模型用到一个联邦学习框架,其核心是服务器能够实时接收到独立模型服务器发来的更新参数,最终的参数让联合服务器来更新出一个更好的学习参数,而联邦学习有很多实现的方式,其中Pysyft可以很好地完成联邦学习的各种过程。
示例性的,各自的数据集在各自的服务器上进行训练(这里假定服务器是可以承受整个训练过程的),基于联邦学习的首要目的就是要将不同部门的数据集分开储存,这样才不会让数据集泄露给不同的部门,3个服务器分别对应着车流量的服务器、单车需求量的服务器和联合训练模型的服务器。其次,第一服务器(车流量的服务器)和第二服务器(单车需求量的服务器)将他们每个训练周期得到的参数发送到第三服务器上,一个训练周期是指机器学习中一次训练的epoch,最后所述第三服务器更新两种不同的参数得到新参数,当然这里的更新是经过两种数据集关联性的权衡,并最终将参数回发给对应的第一服务器和第二服务器。
相比于现有技术,本发明实施例公开的共享单车需求量预测模型的训练系统,通过分别利用单独的模型对车流量预测和共享单车进行预测,然后再将预测结果统一输入到共享单车需求量预测模型中,使得共享单车需求量预测模型对车流量参数和单车需求量参数建立联系并输出互相影响之后而产生的更新参数,最后再利用这一更新参数去更新两个单独模型的参数,更新完参数后的模型会更加拟合实际情况。本发明根据区域内的交通情况来训练共享单车需求量预测模型,从而训练得到的需求量模型能准确预测当前区域的共享单车需求量,使得每个区域的单车使用情况不会过剩也不会出现供不应求的情况。
参见图4,图4是本发明实施例提供的一种共享单车需求量预测模型的训练设备200的结构框图,所述共享单车需求量预测模型的训练设备200包括:处理器201、存储器202以及存储在所述存储器202中并可在所述处理器201上运行的计算机程序。所述处理器201执行所述计算机程序时实现上述各个共享单车需求量预测模型的训练方法实施例中的步骤。或者,所述处理器201执行所述计算机程序时实现上述各系统实施例中各模块/单元的功能。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器202中,并由所述处理器201执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述共享单车需求量预测模型的训练设备200中的执行过程。
所述共享单车需求量预测模型的训练设备200可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述共享单车需求量预测模型的训练设备200可包括,但不仅限于,处理器201、存储器202。本领域技术人员可以理解,所述示意图仅仅是共享单车需求量预测模型的训练设备200的示例,并不构成对共享单车需求量预测模型的训练设备200的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述共享单车需求量预测模型的训练设备200还可以包括输入输出设备、网络接入设备、总线等。
所称处理器201可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器201是所述共享单车需求量预测模型的训练设备200的控制中心,利用各种接口和线路连接整个共享单车需求量预测模型的训练设备200的各个部分。
所述存储器202可用于存储所述计算机程序和/或模块,所述处理器201通过运行或执行存储在所述存储器202内的计算机程序和/或模块,以及调用存储在存储器202内的数据,实现所述共享单车需求量预测模型的训练设备200的各种功能。所述存储器202可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器202可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart MediaCard,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,所述共享单车需求量预测模型的训练设备200集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器201执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (10)
1.一种共享单车需求量预测模型的训练方法,其特征在于,包括:
每间隔预设时间段将预先收集到的预设区域的车流量输入到第一模型中,以使所述第一模型输出车流量预测结果;
每间隔预设时间段将预先收集到的预设区域的共享单车使用记录输入到第二模型中,以使所述第二模型输出共享单车需求量初步预测结果;
将所述车流量预测结果和所述共享单车需求量初步预测结果发送到共享单车需求量预测模型中,以使所述共享单车需求量预测模型对车流量参数和单车需求量参数建立联系并输出第一更新参数和第二更新参数;其中,所述第一更新参数用于更新所述第一模型的参数,所述第二更新参数用于更新所述第二模型的参数;
输出训练完成的共享单车需求量预测模型。
2.如权利要求1所述的共享单车需求量预测模型的训练方法,其特征在于,所述第一模型为LSTM模型,所述第一模型存储在第一服务器,所述第一更新参数为LSTM中各个cell中门控中的参数。
3.如权利要求1所述的共享单车需求量预测模型的训练方法,其特征在于,所述第二模型为GCN模型,所述第二模型存储在第二服务器,所述更新参数为GCN中的卷积层每一个元素的参数。
4.如权利要求1所述的共享单车需求量预测模型的训练方法,其特征在于,所述共享单车需求量预测模型包括搭载在Pysyft框架下的LSTM模型和GCN模型,所述共享单车需求量预测模型存储在第三服务器。
5.如权利要求1所述的共享单车需求量预测模型的训练方法,其特征在于,所述GCN模型搭建有若干个对应不同区域的公路网络的拓扑结构,所述拓扑结构包括若干个节点和连接所述节点的连接线;其中,每一所述节点表示一条公路,所述节点之间的连接线表示两条公路有交接。
6.一种共享单车需求量预测模型的训练系统,其特征在于,包括:
车流量预测结果生成模块,用于每间隔预设时间段将预先收集到的预设区域的车流量输入到第一模型中,以使所述第一模型输出车流量预测结果;
需求量初步预测结果生成模块,用于每间隔预设时间段将预先收集到的预设区域的共享单车使用记录输入到第二模型中,以使所述第二模型输出共享单车需求量初步预测结果;
更新参数生成模块,用于将所述车流量预测结果和所述共享单车需求量初步预测结果发送到共享单车需求量预测模型中,以使所述共享单车需求量预测模型对车流量参数和单车需求量参数建立联系并输出第一更新参数和第二更新参数;其中,所述第一更新参数用于更新所述第一模型的参数,所述第二更新参数用于更新所述第二模型的参数;
预测模型输出模块,用于输出训练完成的共享单车需求量预测模型。
7.如权利要求6所述的共享单车需求量预测模型的训练系统,其特征在于,所述第一模型为LSTM模型,所述第一模型存储在第一服务器,所述第一更新参数为LSTM中各个cell中门控中的参数;所述第二模型为GCN模型,所述第二模型存储在第二服务器,所述更新参数为GCN中的卷积层每一个元素的参数。
8.如权利要求6所述的共享单车需求量预测模型的训练系统,其特征在于,所述共享单车需求量预测模型包括搭载在Pysyft框架下的LSTM模型和GCN模型,所述共享单车需求量预测模型存储在第三服务器。
9.如权利要求6所述的共享单车需求量预测模型的训练系统,其特征在于,所述GCN模型搭建有若干个对应不同区域的公路网络的拓扑结构,所述拓扑结构包括若干个节点和连接所述节点的连接线;其中,每一所述节点表示一条公路,所述节点之间的连接线表示两条公路有交接。
10.一种共享单车需求量预测模型的训练设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至5中任意一项所述的共享单车需求量预测模型的训练方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210402008.5A CN114757418A (zh) | 2022-04-18 | 2022-04-18 | 共享单车需求量预测模型的训练方法、系统和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210402008.5A CN114757418A (zh) | 2022-04-18 | 2022-04-18 | 共享单车需求量预测模型的训练方法、系统和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114757418A true CN114757418A (zh) | 2022-07-15 |
Family
ID=82330474
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210402008.5A Pending CN114757418A (zh) | 2022-04-18 | 2022-04-18 | 共享单车需求量预测模型的训练方法、系统和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114757418A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117635216A (zh) * | 2023-12-22 | 2024-03-01 | 华南理工大学 | 基于改进gcn网络的共享单车需求量预测方法 |
-
2022
- 2022-04-18 CN CN202210402008.5A patent/CN114757418A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117635216A (zh) * | 2023-12-22 | 2024-03-01 | 华南理工大学 | 基于改进gcn网络的共享单车需求量预测方法 |
CN117635216B (zh) * | 2023-12-22 | 2024-04-30 | 华南理工大学 | 基于改进gcn网络的共享单车需求量预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Vázquez et al. | A comparison of deep learning methods for urban traffic forecasting using floating car data | |
CN113763700B (zh) | 信息处理方法、装置、计算机设备及存储介质 | |
CN113762595B (zh) | 通行时间预测模型训练方法、通行时间预测方法及设备 | |
CN115062873B (zh) | 交通出行方式预测方法和装置、存储介质及电子设备 | |
Madadi et al. | Optimizing Road Networks for Automated Vehicles with Dedicated Links, Dedicated Lanes, and Mixed‐Traffic Subnetworks | |
CN113326974A (zh) | 一种基于多任务超图卷积网络的多源交通流预测方法 | |
Qiu et al. | Dynamic Electronic Toll Collection via Multi-Agent Deep Reinforcement Learning with Edge-Based Graph Convolutional Networks. | |
Yedavalli et al. | Microsimulation analysis for network traffic assignment (MANTA) at metropolitan-scale for agile transportation planning | |
Pang et al. | Development of people mass movement simulation framework based on reinforcement learning | |
CN113239198A (zh) | 一种地铁客流预测方法、装置及计算机存储介质 | |
CN114757418A (zh) | 共享单车需求量预测模型的训练方法、系统和设备 | |
CN114676911A (zh) | 一种运输车辆行车路线确定方法及装置 | |
WO2023123812A1 (zh) | 轨迹点筛选及轨迹生成方法、装置、电子设备、存储介质、计算机程序产品 | |
WO2023045916A1 (en) | Ensuring proactive availability of vehicles for providing connected vehicle services | |
CN116612633A (zh) | 一种基于车路协同感知下的自适应动态路径规划方法 | |
Hossein Rashidi et al. | A clustering algorithm for bi‐criteria stop location design with elastic demand | |
CN114724414B (zh) | 城市空中交通分担率的确定方法、装置、电子设备及介质 | |
Xia et al. | Deeprailway: a deep learning system for forecasting railway traffic | |
CN110942178B (zh) | 一种基于资源分配指标的链路预测方法的充电桩推荐方法 | |
CN113849947A (zh) | 一种支持增量更新的时态网络模体计算方法及系统 | |
Al-Kuwari et al. | Forensic tracking and mobility prediction in vehicular networks | |
Si et al. | Travel Demand‐Based Assignment Model for Multimodal and Multiuser Transportation System | |
Sudo et al. | Human mobility estimation following massive disaster using filtering approach | |
CN113792907A (zh) | 一种铁路客站的客流预测方法、装置及存储介质 | |
Tian et al. | Crowding prediction of In-Situ metro passengers using smart card data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |