CN111739285A - 交通流量的预测方法、装置、设备及计算机存储介质 - Google Patents

交通流量的预测方法、装置、设备及计算机存储介质 Download PDF

Info

Publication number
CN111739285A
CN111739285A CN202010407367.0A CN202010407367A CN111739285A CN 111739285 A CN111739285 A CN 111739285A CN 202010407367 A CN202010407367 A CN 202010407367A CN 111739285 A CN111739285 A CN 111739285A
Authority
CN
China
Prior art keywords
traffic flow
prediction
training
global
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010407367.0A
Other languages
English (en)
Inventor
余剑峤
刘毅
邹勰鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southern University of Science and Technology
Original Assignee
Southern University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southern University of Science and Technology filed Critical Southern University of Science and Technology
Priority to CN202010407367.0A priority Critical patent/CN111739285A/zh
Publication of CN111739285A publication Critical patent/CN111739285A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • General Business, Economics & Management (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Educational Administration (AREA)
  • Probability & Statistics with Applications (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明公开了交通流量的预测方法,其中,该方法包括:向多个预测终端发送本地初始模型;获取多个预测终端发送的目标共享数据,根据多个预测终端发送的目标共享数据聚类得到多个聚类数据;根据多个聚类数据生成全局参数;利用全局参数更新本地初始模型得到全局更新模型;将全局更新模型发送给预测终端,以使得预测终端利用全局更新模型进行交通流量预测输出的预测结果。本发明可以在不损害隐私保护约束的条件下,降低算法复杂度的同时还能实现精确预测交通流。

Description

交通流量的预测方法、装置、设备及计算机存储介质
技术领域
本发明涉及信息处理技术领域,尤其是涉及交通流量的预测方法、装置、设备及计算机存储介质。
背景技术
交通流量预测(TFP)就是利用历史交通流数据来预测未来的交通流,从而提供人们需要的交通流信息。当代城市居民,出租车司机,商业部门和政府机构都强烈需要准确及时的交通流信息,因为这些道路使用者可以利用这些信息来缓解交通拥堵,适当控制交通灯,提高交通效率,人们还可以使用交通流信息来制定更好的出行计划。
在交通流量预测中,集中式机器学习方法通常是通过训练足够的传感器数据来准确预测交通流,例如来自手机、相机、雷达等的数据。由于不同的运营方(例如公共机构和私营公司)传感器数据可能包含敏感的隐私信息,目前集中式机器学习方法出于数据隐私的考虑无法从不同的运营方(例如公共机构和私营公司)获取交通流量数据,导致无法保障交通流量预测的精确度。且在大规模场景下,参数传递过多可能导致通信开销昂贵,还可能增加算法复杂度,使得算法难以收敛,影响算法的预测精度。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出一种交通流量的预测方法,该方法能够在隐私保护的约束下准确预测交通流,降低算法复杂度的同时还可以保证预测精度。
本发明还提出一种交通流量的预测装置。
本发明还提出一种交通流量的预测控制设备。
本发明还提出一种计算机存储介质。
第一方面,本发明的一个实施例提供了交通流量的预测方法,该方法包括:
向多个预测终端发送本地初始模型;
获取多个所述预测终端发送的目标共享数据,根据所述多个所述预测终端发送的目标共享数据聚类得到多个聚类数据;
根据多个聚类数据生成全局参数;
利用所述全局参数更新所述本地初始模型得到全局更新模型;
将所述全局更新模型发送给所述预测终端,以使得所述预测终端利用所述全局更新模型进行交通流量预测输出的预测结果。
本发明实施例至少具有如下有益效果:首先通过获取多个预测终端发送的目标共享数据,然后根据目标共享数据进行聚类,得到聚类数据,根据聚类数据生成全局参数,可以降低算法复杂度,继而可以利用全局参数更新本地初始模型得到全局更新模型,最后可以将全局更新模型发送至预测终端进行交通流量的预测,可以在不损害隐私保护约束的条件下,降低算法复杂度的同时还可以保证预测精度。
根据本发明的另一些实施例,所述获取多个所述预测终端发送的目标共享数据,包括:所述预测终端获取来自云端的所述本地初始模型;获取源交通流量数据和目标交通流量数据;利用所述源交通流量数据和所述目标交通流量数据训练所述本地初始模型得到目标共享数据。
根据本发明的另一些实施例,所述根据多个所述预测终端发送的目标共享数据聚类得到多个聚类数据,包括:对多个所述预测终端进行聚类得到多个聚类集;将所述聚类集的聚类中心对应的预测终端的所述目标共享数据作为所述聚类数据。
根据本发明的另一些实施例,所述目标共享数据包括:预测终端的模型参数,所述根据所述目标共享数据生成全局参数,包括:对多个所述模型参数进行加权平均得到所述全局参数。
根据本发明的另一些实施例,所述目标共享数据还包括:全局输入数据和全局输出数据;所述方法还包括:根据所述全局输入数据和所述全局输出数据生成对应于多个所述预测终端的全局训练样本对;分别根据多对所述全局训练样本对所述全局更新模型进行训练,得到对应于多个所述预测终端的全局更新模型;选取满足预设选取条件的全局更新模型发送给所述预测终端进行交通流量预测输出的预测结果。
根据本发明的另一些实施例,所述本地初始模型采用以下步骤得到:获取本地训练样本对集合,所述本地训练样本对集合包括多个本地训练样本对,所述本地训练样本对中包括:训练源交通流量数据样本和训练目标交通流量数据样本;分别提取所述训练源交通流量数据样本和所述训练目标交通流量数据样本的参数特征;将所述训练源交通流量数据样本的参数特征、所述训练源交通流量数据样本和所述训练目标交通流量数据样本作为待训练本地初始模型的输入,将所述训练目标交通流量数据样本的参数特征作为期望的输出,对所述待训练本地初始模型进行训练,得到训练好的本地初始模型。
根据本发明的另一些实施例,所述将所述训练源交通流量数据样本的参数特征、所述训练源交通流量数据样本和所述训练目标交通流量数据样本作为待训练本地初始模型的输入,将所述训练目标交通流量数据样本的参数特征作为期望的输出,对所述待训练本地初始模型进行训练,得到训练好的本地初始模型,包括:将所述训练源交通流量数据样本的参数特征、所述训练源交通流量数据样本和所述训练目标交通流量数据样本作为待训练本地初始模型的输入,获取所述待训练本地初始模型输出的实际参数特征;根据所述实际参数特征和所述训练目标交通流量数据样本的参数特征计算得到损失值;根据所述损失值对待训练本地初始模型中的参数、所述源交通流量数据和所述目标交通流量数据进行更新,直到所述损失值达到预设的收敛条件,将最后更新得到的待训练本地初始模型作为所述本地初始模型。
第二方面,本发明的一个实施例提供了交通流量的预测装置,其特征在于,所述装置包括:
传送模块,用于向多个预测终端发送本地初始模型;
聚类模块,用于获取多个所述预测终端发送的目标共享数据,根据所述多个所述预测终端发送的目标共享数据聚类得到多个聚类数据;
获取模块,用于根据所述聚类数据生成全局参数;
更新模型,用于利用所述全局参数更新所述本地初始模型得到全局更新模型;
传输模块,用于将所述全局更新模型发送给所述预测终端,以使得所述预测终端利用所述全局更新模型进行交通流量预测输出的预测结果。
本发明实施例至少具有如下有益效果:通过上述装置,云端可以根据目标共享数据更新本地初始模型为全局更新模型,再将全局更新模型发送至各个预测终端,以使预测终端可以根据全局更新模型预测交通流量,可以在不损害隐私保护约束的情况下,降低算法复杂度的同时还能实现精确预测交通流。
第三方面,本发明的一个实施例提供了交通流量的预测控制设备,存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现:
如本发明第一方面提出的所述的交通流量的预测方法。
本发明实施例至少具有如下有益效果:通过上述控制设备,云端可以根据目标共享数据更新本地初始模型为全局更新模型,再将全局更新模型发送至各个预测终端,以使预测终端可以根据全局更新模型预测交通流量,可以在不损害隐私保护约束的情况下,降低算法复杂度的同时还能实现精确预测交通流。
第四方面,本发明的一个实施例提供了计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令用于:
如本发明第一方面提出的所述的交通流量的预测方法。
本发明实施例至少具有如下有益效果:通过上述存储介质,云端可以根据目标共享数据更新本地初始模型为全局更新模型,再将全局更新模型发送至各个预测终端,以使预测终端可以根据全局更新模型预测交通流量,可以在不损害隐私保护约束的情况下,降低算法复杂度的同时还能实现精确预测交通流。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例的交通流量的预测方法的流程示意图;
图2为本发明一个实施例的获取多个目标共享数据的流程示意图;
图3为本发明一个实施例的聚类得到多个聚类数据的流程示意图;
图4A为本发明实施例的得到本地初始模型的流程示意图;
图4B为本发明实施例的训练待训练本地初始模型的流程示意图;
图5为本发明实施例交通流量的预测装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
参照图1,根据本发明实施例所示图1为交通流量的预测方法的一实施例的流程示意图,该交通流量的预测方法可以用于云端,其中,云端可以是用于预测交通流量的云服务器,该交通流量的预测方法包括:
步骤S100,向多个预测终端发送本地初始模型。
其中,预测终端可以是用于预测交通流量的计算节点,预测终端可以是多个;本地初始模型可以是由云端预先设置的一个初始化模型。多个预测终端的确定,可以是由云端向各个可预测交通流量的终端进行广播,然后获取各个可预测交通流量的终端的签到信息,该签到信息可以表示自愿参与本轮训练的终端信息,而未签到的终端可以代表不愿意参与本轮训练或有其他签到失败原因,则可以根据签到信息将自愿参与本轮训练的终端作为预测终端,由此确定多个预测终端。可以由云端向多个预测终端发送本地初始模型,以使每个预测终端可以根据本地初始模型进行本地的交通流量训练,得到代表该预测终端交通流量的目标共享数据。也可以是由云端根据签到信息随机选择一个固定比例(如10%,20%,····)的终端参加这一轮的训练,从而可以确定多个预测终端。
步骤S110,获取多个预测终端发送的目标共享数据,根据多个预测终端发送的目标共享数据聚类得到多个聚类数据。
其中,聚类数据可以是将目标共享数据进行聚类后所得的数据。由于不同预测终端所得到的目标共享数据不同,所以可以分别获取多个预测终端对应的目标共享数据,得到多个预测终端对应的目标共享数据,从而可以得到多个目标共享数据。可选的,可以将所得多个预测终端的目标共享数据先行聚类,以降低算法复杂度,可以得到聚类后的多个聚类数据。
步骤S120,根据多个聚类数据生成全局参数。
其中,全局参数可以是全局更新模型的模型权重参数。可选的,全局参数可以根据聚类数据得到,例如,可以将多个预测终端对应的目标共享数据先行聚类,得到K个聚类数据,具体的,可以是对多个目标共享数据执行约束算法,得到多个聚类数据,进而可以根据多个聚类数据聚合生成全局参数Ω0
步骤S130,利用全局参数更新所述本地初始模型得到全局更新模型。
为了减少通信开销,可以是对初始生成的本地初始模型进行更新,得到最优的交通流量预测模型,即得到全局更新模型。可选的,由于全局参数可以是全局更新模型的模型权重参数,所以可以根据全局参数对本地初始模型进行更新得到更新后的、最优的训练模型,可以将该最优的模型作为全局更新模型。具体的,假设全局参数为Ω0,可以根据Ω0对本地初始模型进行更新,得到最优的更新模型作为全局更新模型。
步骤S140,将全局更新模型发送给所述预测终端,以使得预测终端利用全局更新模型进行交通流量预测输出的预测结果。
由于所得的全局更新模型可以是最优的交通流量预测模型,所以可以将全局更新模型发送到各个预测终端,以使预测终端可以利用全局更新模型进行交通流量的预测,得到预测结果。可选的,可以将全局更新模型发送至每个预测终端,继而每个预测终端可以利用全局更新模型对本地原始数据进行交通流量的预测,得到每个预测终端的预测结果;也可以是将愿意交换共享本地原始数据的多个预测终端,利用全局更新模型进行统一的交通流量预测,得到全局更新模型输出的某片区域内的交通流量预测结果。
上述交通流量的预测方法,首先通过获取多个预测终端发送的目标共享数据,然后根据目标共享数据进行聚类,可以得到多个聚类数据,根据多个聚类数据生成全局参数,可以降低算法复杂度,减小计算量。继而可以利用全局参数更新本地初始模型得到全局更新模型,最后可以将全局更新模型发送至预测终端进行交通流量的预测,可以在不损害隐私保护约束的条件下,降低算法复杂度的同时实现精确预测交通流。
参照图2,在本发明的一些具体实施例中,获取多个预测终端发送的目标共享数据,包括:
步骤S200,预测终端获取来自云端的本地初始模型。
其中,为得到全局最优的交通流量预测模型,可以是由云端先设置一个初始化模型,该初始化模型可以是本地初始模型,根据初始化模型可以从不同的预测终端中收集加密的目标共享数据,继而可以根据收集的目标共享数据训练得到最优的交通流量预测模型,所以可以由预测终端获取来自云端训练好的本地初始模型。可选的,本地初始模型可以由云端无需考虑隐私问题的公共数据集进行预训练得到。
步骤S210,获取源交通流量数据和目标交通流量数据。
其中,源交通流量数据可以是某个时刻某个终端采集到的交通流数据集;源交通流量数据可以是多个;目标交通流量数据为某个时刻某个终端预设的交通流数据集。上述源交通流量数据和目标交通流量数据可以为预测终端的原始数据。不同终端对应的源交通流量数据和目标交通流量数据不同,所以需要分别获取每个终端对应的源交通流量数据和目标交通流量数据。可选的,源交通流量数据可以是终端a在t时刻车辆数量,源交通流量数据可以通过传感器检测得到;目标交通流量数据可以是终端a在t时刻预测的车辆数量,目标交通流量数据可以是通过人为输入或通过计算机估算得到。
步骤S220,利用源交通流量数据和目标交通流量数据训练本地初始模型得到目标共享数据。
其中,目标共享数据可以为预设的、用于交换共享的交通流量数据,目标共享数据为加密数据,目标共享数据可以是由多个加密数据组成的数据集。为确保用户隐私安全,不同终端之间采集的原始数据可能无法共享,例如,政府、公司和个人之间的交通流数据不能共享,所以可以仅获取每个终端输出的加密数据(即目标共享数据),而无需交换原始数据,可以不损害隐私保护约束。可选的,可以根据本地初始模型训练得到目标共享数据,例如,可以将源交通流量数据、目标交通流量数据作为本地初始模型的输入,通过获取本地初始模型的输出即可得到目标共享数据。通过获取来自云端的本地初始模型,根据本地初始模型、源交通流量数据和目标交通流量数据训练得到加密的目标共享数据,可以将所得的目标共享数据上传至云端,而非与其他预测终端共享本地原始数据,可以不损害隐私保护约束。
参照图3,在本发明的一些具体实施例中,根据多个预测终端发送的目标共享数据聚类得到多个聚类数据,包括:
步骤S300,对多个预测终端进行聚类得到多个聚类集。
其中,聚类集可以是对多个预测终端执行聚类后得到的集合。对于大量预测终端参与联合训练交通流量预测问题的场景,可以在根据目标共享数据对本地初始模型进行更新得到全局更新模型之前,将各个预测终端分组到个集群,从而可以得到多个聚类集。可选的,假设可以利用预测终端的地理位置信息来进行聚类,例如可以根据经纬度信息来进行聚类,可以将多个预测终端分别聚类到K个聚类集中,从而可以得到多个聚类集。
步骤S310,将聚类集的聚类中心对应的预测终端的目标共享数据作为聚类数据。
其中,聚类集的聚类中心可以是采用集成学习方案进行聚类分析后所得的类中心。可选的,假设有K个聚类集,则可以分别得到K个聚类集的聚类中心为
Figure BDA0002491812610000081
可以分别将每个聚类中心对应的预测终端的目标共享数据作为聚类数据。可选的,假设可以执行约束K-Means算法进行聚类,例如:可以是随机初始化聚类中心
Figure BDA0002491812610000082
并执行约束K-Means算法:假设给定Rn中的m个点的集合P(该集合P可以是每个预测终端对应的地理位置信息,例如经纬度信息)和最小聚类成员值kh≥0,h=1,...,k,第t次迭代时的聚类中心
Figure BDA0002491812610000083
计算在第t+1次迭代的
Figure BDA0002491812610000084
步骤如下:
(1)计算欧氏距离平方和:
Figure BDA0002491812610000085
Figure BDA0002491812610000086
其中,SSE为平方误差之和,τi,h
Figure BDA0002491812610000087
取固定值时以下线性方程的解。
(2)集群分配:为了最小化SSE,需要:
Figure BDA0002491812610000091
Figure BDA0002491812610000092
Figure BDA0002491812610000093
subject toτi,h≥0,i=1,2,…,m,h=1,…,k.
(3)集群更新:更新
Figure BDA0002491812610000094
如下所示:
Figure BDA0002491812610000095
当且仅当SSE最小且
Figure BDA0002491812610000096
时,可以获得最佳聚类中心Ck和聚类中心对应的预测终端的目标共享数据为
Figure BDA0002491812610000097
从而可以将该预测终端对应的目标共享数据作为聚类数据。通过可以将多个预测终端进行聚类,可以是根据预测终端的地理位置信息进行聚类,因有时空相似性的预测终端其采集的交通流量数据也具有相似性,所以可以使得相近的预测终端分类到同一个聚类集中,再根据每个聚类集的聚类中心对应的预测终端的目标共享数据作为聚类数据,即得到多个聚类数据,通过聚类能够在针对大规模的预测终端的数据进行预测时,减少通信开销,提高预测效率和准确度。
在本发明的一些具体实施例中,聚类数据包括:预测终端的模型参数,根据目标共享数据生成全局参数,包括:对多个模型参数进行加权平均得到全局参数。
其中,预测终端的模型参数可以为每个预测终端通过本地初始模型对本地原始数据训练后得到的参数、并将所得参数进行聚类后得到的模型参数,预测终端的模型参数为加密参数,不同预测终端对应不同的模型参数。可选的,根据聚类数据生成全局参数,可以是对聚类数据中的预测终端的模型参数进行加权平均得到的。具体的,假设预测终端为Ov={O1,O2,…,ON},假设聚类后得到的聚类数据中的预测终端的模型参数为
Figure BDA0002491812610000098
则可以根据每个预测终端的模型参数,根据如下公式进行加权平均得到全局参数ωt+1
Figure BDA0002491812610000101
根据上述公式可以得到聚合后的全局参数ωt+1。根据每个预测终端上传的目标共享数据进行聚类得到的聚类数据,再根据聚类数据中的预测终端的模型参数,可以根据预测终端的权重参数进行加权平均计算得到全局参数,可以将全局参数用于更新得到全局更新模型,使得更新得到的全局更新模型适用于所有的预测终端的交通流量的预测,得到精确的预测结果。
在本发明的一些实施例中,聚类数据还包括:全局输入数据和全局输出数据。其中,全局输入数据可以是聚类数据中的时间步长,全局输出数据可以是聚类数据中的真实交通流量,全局输入数据与全局输出数据均为加密的数据。交通流量的预测方法还包括:
根据全局输入数据和全局输出数据生成对应于多个预测终端的全局训练样本对。
其中,全局训练样本对可以是由预测终端对应的全局输入数据和全局输出数据所组成的一对训练样本,可以得到多对全局训练样本对。可选的,假设输入的尺寸为m,假设全局输入数据为
Figure BDA0002491812610000102
假设全局输出数据为
Figure BDA0002491812610000103
则可以得到对应于多个预测终端的多对全局训练样本对为
Figure BDA0002491812610000104
分别根据多对全局训练样本对全局更新模型进行训练,得到对应于多个所预测终端的全局更新模型。
可选的,假设全局训练样本对为
Figure BDA0002491812610000105
假设迭代次数为n,假设学习率为α,假设利用SGD优化,假设初始化全局更新模型为J(ω0),ω0,
Figure BDA0002491812610000106
其中,
Figure BDA0002491812610000107
为初始化全局更新模型的参数,则可以将全局训练样本对作为全局更新模型的输入——输出对,并根据下列公式对初始化全局更新模型进行训练:
Figure BDA0002491812610000111
Figure BDA0002491812610000112
上述公式中,gω可以为整合的梯度,
Figure BDA0002491812610000113
可以为更新后的全局参数,即为更新后的全局更新模型,根据上述公式可以实现对初始化全局更新模型的训练,从而可以得到更新后的全局更新模型为J(ω),ω,
Figure BDA0002491812610000114
选取满足预设选取条件的全局更新模型发送给预测终端进行交通流量预测输出的预测结果。
其中,预设选取条件可以是预先设置的用于选择得到所需的全局更新模型的要求,预设选取条件可以根据需求设置。可选的,假设预设选取条件为选择最优的全局更新模型,则可以根据预设选取条件,选择得到最优的全局更新模型,并将最优的全局更新模型发送给预测终端进行交通流量预测。具体的,假设选择得到的最优的全局更新模型为J(ω),ω,
Figure BDA0002491812610000115
则可以将J(ω),ω,
Figure BDA0002491812610000116
发送到预测终端进行交通流量预测输出的预测结果。通过获取全局训练样本对,并分别根据多对全局训练样本对对全局更新模型进行训练,得到对应于多个预测终端的全局更新模型,最后根据预设选取条件选择得到全局更新模型发送至预测终端进行交通流量预测输出的预测结果,可以通过迭代将初始化的全局更新模型更新为全局更新模型,从而可以得到符合需求的全局更新模型进行交通流量预测,得到准确的预测结果。
在本发明的一些具体实施例中,如图4A所示,本地初始模型采用以下步骤得到:
步骤S400,获取本地训练样本对集合,本地训练样本对集合包括多个本地训练样本对,所述本地训练样本对中包括:训练源交通流量数据样本和训练目标交通流量数据样本。
其中,训练源交通流数据样本可以为在某个时刻预测终端需要进行训练的交通流量数据,例如交通流密度;训练目标交通流数据样本可以为预测得到的在某个时刻预测终端对应的交通流量数据;训练源交通流数据样本和训练目标交通流数据样本可以是从无需考虑隐私问题的公共数据集中采集得到的,由于公共数据集不涉及隐私问题,所以可以由云端采集训练源交通流数据样本和训练目标交通流数据样本进行训练得到本地初始模型。本地训练样本对可以为训练源交通流数据样本和训练目标交通流数据样本所组成的训练样本;本地训练样本对集合为用于进行训练的在某个时刻多个预测终端对应的本地训练样本对的集合。可以根据本地训练样本对集合训练得到本地初始模型。可选的,可以采用GRU神经网络模型结合本地交通流量数据,得到本地初始模型。具体的,假设本地训练样本对集合为Gk,可以定义本地训练样本对集合的大小为
Figure BDA0002491812610000121
假设本地训练样本对为
Figure BDA0002491812610000122
其中xi为训练源交通流数据样本,yi为训练目标交通流数据样本,则可以得到本地训练样本对集合为
Figure BDA0002491812610000123
步骤S410,分别提取训练源交通流数据样本和训练目标交通流数据样本的参数特征。
其中,训练源交通流数据样本的参数特征可以是训练源交通流数据对应的特征,例如训练源交通流数据样本对应的交通流量、流速或交通流密度等;训练目标交通流数据样本的参数特征可以为训练目标交通流数据样本对应点特征,例如训练目标交通流数据样本对应的交通流量、流速或交通流密度等。因参数特征能更好地反应训练源交通流数据样本和训练目标交通流数据样本的特性,所以需要分别提取训练源交通流数据样本的参数特征和训练目标交通流数据样本的参数特征,得到一一对应的训练源交通流数据样本的参数特征和训练目标交通流数据样本的参数特征。可选的,假设训练源交通流数据样本的参数特征为交通流量Q1、流速V1、交通流密度ρ1;假设训练目标交通流数据样本的参数特征为交通流量Q2、流速V2、交通流密度ρ2,分别提取Q1、V1、ρ1和Q2、V2、ρ2,得到训练源交通流数据样本的参数特征、训练目标交通流数据样本的参数特征。
步骤S420,将训练源交通流数据样本的参数特征、源交通流数据、目标交通流数据作为待训练本地初始模型的输入,将训练目标交通流数据样本的参数特征作为期望的输出,对待训练本地初始模型进行训练,得到训练好的本地初始模型。
其中,待训练本地初始模型可以是需要进行训练的本地初始模型;训练好的本地初始模型可以为经过训练得到的本地初始模型。可选的,可以是对待训练本地初始模型进行训练,从而得到训练好的本地初始模型。例如,将训练源交通流数据样本的参数特征、源交通流数据、目标交通流数据作为待训练本地初始模型的输入,将训练目标交通流数据样本的参数特征作为期望的输出,对待训练本地初始模型进行训练从而可以得到最优的本地交通流量预测模型,即得到训练好的本地初始模型。根据本地训练样本对集合对待训练本地初始模型进行训练,可以在不损害隐私约束的条件下,得到训练好的本地初始模型。
在本发明的一些具体实施例中,如图4B所示,在步骤S420中,将训练源交通流量数据样本的参数特征、训练源交通流量数据样本和训练目标交通流量数据样本作为待训练本地初始模型的输入,将训练目标交通流量数据样本的参数特征作为期望的输出,对待训练本地初始模型进行训练,得到训练好的本地初始模型,包括:
步骤S421,将训练源交通流量数据样本的参数特征、训练源交通流量数据样本和训练目标交通流量数据样本作为待训练本地初始模型的输入,获取待训练本地初始模型输出的实际参数特征。
其中,实际参数特征可以是待训练本地初始模型实际上输出的参数特征。由于待训练本地初始模型实际上输出的参数特征,不一定就是期望得到的参数特征,所以需要得到待训练本地初始模型实际上输出的参数特征。可选的,可以采用GRU神经网络模型作为待训练本地初始模型,可以是将训练源交通流数据样本的参数特征、源交通流数据、目标交通流数据作为待训练本地初始模型的输入,得到待训练本地初始模型的输出,假设输出所得实际参数特征ω0,可以将实际参数特征ω0用于训练待训练本地初始模型。
步骤S422,根据实际参数特征和训练目标交通流数据样本的参数特征计算得到损失值。
其中,损失值可以为表示训练目标交通流数据样本的参数特征与实际参数特征之间的差异的数值。由于在训练阶段得到的实际参数特征与期望得到的训练目标交通流数据样本的参数特征之间存在较大的差异,为了得到二者之间的差异,可以是根据训练目标交通流数据样本的参数特征和实际参数特征,计算得到损失值,从而可以用损失值来表示二者之间的差异。可选的,假设实际参数特征ω0,假设损失值为fi0),则可以通过下列公式计算得到本地训练样本对的损失值fi0):
Figure BDA0002491812610000141
假设某个预设终端k上的本地训练样本对集合为Gk,该本地训练数据对集合的大小为
Figure BDA0002491812610000142
则可以定义本地训练样本对集合Gk上的损失函数为:
Figure BDA0002491812610000143
其中,本地训练样本对为
Figure BDA0002491812610000144
其中xi为训练源交通流数据样本,yi为训练目标交通流数据样本。其中ω0∈Rd为待训练本地初始模型参数,
Figure BDA0002491812610000145
h(·)是正则化函数。根据上述公式,可以计算得到损失值Jk0),即可得到训练目标交通流数据样本的参数特征和第二实际参数特征之间的差异。可以将用于对待训练本地初始模型中的参数、目标共享数据和目标交通流数据进行更新。
步骤S423,根据所损失值对所述待训练本地初始模型中的参数、源交通流数据和目标交通流数据进行更新,直到损失值达到预设的收敛条件,将最后更新得到的待训练本地初始模型作为本地初始模型。
其中,待训练本地初始模型中的参数可以包括参数矩阵W,预设的收敛条件可以为预先设置的训练收敛条件。由于实际参数特征与目标交通流数据的参数特征之间存在差异,为得到目标交通流数据的参数特征,可以是根据损失值,对待训练本地初始模型中的参数、目标共享数据和目标交通流数据进行更新,直至达到预设的收敛条件,使得训练收敛,最后可以得到更新后的各个参数。通过获取预测终端对应的本地训练样本对集合,对待训练本地初始模型进行梯度下降优化训练,可以得到训练好的本地初始模型,每个预测终端可以根据该本地初始模型训练得到对应的目标共享数据,实现保护隐私的效果。
在本发明的另一些实施例中,交通流量的预测方法,用于预测终端和云端,预测终端与云端通信连接,该方法具体包括:
首先可以是由预测终端获取来自云端的本地初始模型、获取源交通流量数据和目交通流量数据,并将源交通流量数据和目标交通流量数据作为输入——输出对,假设源交通流量数据和目标交通流量数据为{xi,yi},则可以根据{xi,yi}训练从云端获取的本地初始模型得到目标共享数据
Figure BDA0002491812610000151
由预测终端将目标共享数据
Figure BDA0002491812610000152
上传至云端;其次,可以由云端对多个预测终端上传的目标共享数据
Figure BDA0002491812610000153
进行加权平均,聚合得到全局参数ω0,可以根据全局参数ω0更新本地初始模型得到全局更新模型;然后可以获取对应于多个预测终端的全局训练样本对
Figure BDA0002491812610000154
该全局训练样本对可以由全局输入数据
Figure BDA0002491812610000155
和全局输出数据
Figure BDA0002491812610000156
组成,将全局训练样本对
Figure BDA0002491812610000157
作为全局更新模型的输入——输出对,训练得到训练好的全局更新模型;再次,可以根据预设选取条件,例如,可以是选择最优的全局更新模型发送到预测终端;最后,可以由预测终端根据接收到的全局更新模型进行交通流量预测输出的预测结果,可以是每个预测终端进行单独预测,得到单独预测结果,也可以由多个愿意交换共享本地原始数据的预测终端进行统一预测,得到统一预测结果。通过预测终端与云端之间的交互,能够在隐私保护的约束下精确预测交通流。
如图5所示,本发明一个实施例还提供了一种交通流量的预测装置,该装置包括:
传送模块500,用于向多个预测终端发送本地初始模型;
聚类模块510,用于获取多个预测终端发送的目标共享数据,根据多个预测终端发送的目标共享数据聚类得到多个聚类数据;
获取模块520,用于根据聚类数据生成全局参数;
更新模型530,用于利用全局参数更新本地初始模型得到全局更新模型;
传输模块540,用于将全局更新模型发送给预测终端,以使得预测终端利用全局更新模型进行交通流量预测输出的预测结果。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
本发明还提供了一种交通流量的预测控制设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述交通流量的预测方法。
本发明还提供了一种计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行上述交通流量的预测方法。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
上面结合附图对本发明实施例作了详细说明,但是本发明不限于上述实施例,在所述技术领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。此外,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。

Claims (10)

1.交通流量的预测方法,其特征在于,所述方法包括:
向多个预测终端发送本地初始模型;
获取多个所述预测终端发送的目标共享数据,根据多个所述预测终端发送的目标共享数据聚类得到多个聚类数据;
根据所述多个聚类数据生成全局参数;
利用所述全局参数更新所述本地初始模型得到全局更新模型;
将所述全局更新模型发送给所述预测终端,以使得所述预测终端利用所述全局更新模型进行交通流量预测输出预测结果。
2.根据权利要求1所述的方法,其特征在于,所述获取多个所述预测终端发送的目标共享数据,包括:
所述预测终端获取来自云端的所述本地初始模型;
获取源交通流量数据和目标交通流量数据;
利用所述源交通流量数据和所述目标交通流量数据训练所述本地初始模型得到目标共享数据。
3.根据权利要求1所述的方法,其特征在于,所述根据多个所述预测终端发送的目标共享数据聚类得到多个聚类数据,包括:
对多个所述预测终端进行聚类得到多个聚类集;
将所述聚类集的聚类中心对应的预测终端的所述目标共享数据作为所述聚类数据。
4.根据权利要求1所述的方法,其特征在于,所述聚类数据包括:预测终端的模型参数,所述根据所述聚类数据生成全局参数,包括:对多个所述模型参数进行加权平均得到所述全局参数。
5.根据权利要求1所述的方法,其特征在于,所述聚类数据还包括:全局输入数据和全局输出数据;
所述方法还包括:
根据所述全局输入数据和所述全局输出数据生成对应于多个所述预测终端的全局训练样本对;
分别根据多个所述全局训练样本对所述全局更新模型进行训练,得到对应于多个所述预测终端的全局更新模型;
选取满足预设选取条件的全局更新模型发送给所述预测终端进行交通流量预测输出的预测结果。
6.根据权利要求1所述的方法,其特征在于,所述本地初始模型采用以下步骤得到:
获取本地训练样本对集合,所述本地训练样本对集合包括多个本地训练样本对,所述本地训练样本对中包括:训练源交通流量数据样本和训练目标交通流量数据样本;
分别提取所述训练源交通流量数据样本和所述训练目标交通流量数据样本的参数特征;
将所述训练源交通流量数据样本的参数特征、所述训练源交通流量数据样本和所述训练目标交通流量数据样本作为待训练本地初始模型的输入,将所述训练目标交通流量数据样本的参数特征作为期望的输出,对所述待训练本地初始模型进行训练,得到训练好的本地初始模型。
7.根据权利要求6所述的方法,其特征在于,所述将所述训练源交通流量数据样本的参数特征、所述训练源交通流量数据样本和所述训练目标交通流量数据样本作为待训练本地初始模型的输入,将所述训练目标交通流量数据样本的参数特征作为期望的输出,对所述待训练本地初始模型进行训练,得到训练好的本地初始模型,包括:
将所述训练源交通流量数据样本的参数特征、所述训练源交通流量数据样本和所述训练目标交通流量数据样本作为待训练本地初始模型的输入,获取所述待训练本地初始模型输出的实际参数特征;
根据所述实际参数特征和所述训练目标交通流量数据样本的参数特征计算得到损失值;
根据所述损失值对待训练本地初始模型中的参数、所述源交通流量数据和所述目标交通流量数据进行更新,直到所述损失值达到预设的收敛条件,将最后更新得到的待训练本地初始模型作为所述本地初始模型。
8.交通流量的预测装置,其特征在于,所述装置包括:
传送模块,用于向多个预测终端发送本地初始模型;
聚类模块,用于获取多个所述预测终端发送的目标共享数据,根据所述多个所述预测终端发送的目标共享数据聚类得到多个聚类数据;
获取模块,用于根据所述聚类数据生成全局参数;
更新模型,用于利用所述全局参数更新所述本地初始模型得到全局更新模型;
传输模块,用于将所述全局更新模型发送给所述预测终端,以使得所述预测终端利用所述全局更新模型进行交通流量预测输出的预测结果。
9.交通流量的预测控制设备,其特征在于,存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现:
如权利要求1至7中任一项所述的交通流量的预测方法。
10.计算机存储介质,其特征在于,存储有计算机可执行指令,所述计算机可执行指令用于:
执行权利要求1至7中任一项所述的交通流量的预测方法。
CN202010407367.0A 2020-05-14 2020-05-14 交通流量的预测方法、装置、设备及计算机存储介质 Pending CN111739285A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010407367.0A CN111739285A (zh) 2020-05-14 2020-05-14 交通流量的预测方法、装置、设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010407367.0A CN111739285A (zh) 2020-05-14 2020-05-14 交通流量的预测方法、装置、设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN111739285A true CN111739285A (zh) 2020-10-02

Family

ID=72647195

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010407367.0A Pending CN111739285A (zh) 2020-05-14 2020-05-14 交通流量的预测方法、装置、设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN111739285A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112446544A (zh) * 2020-12-01 2021-03-05 平安科技(深圳)有限公司 交通流预测模型训练方法、装置、电子设备及存储介质
CN112801377A (zh) * 2021-01-29 2021-05-14 腾讯大地通途(北京)科技有限公司 一种对象估计方法、装置、设备及存储介质
CN112966182A (zh) * 2021-03-09 2021-06-15 中国民航信息网络股份有限公司 一种项目推荐方法及相关设备
CN112990921A (zh) * 2021-01-29 2021-06-18 腾讯科技(深圳)有限公司 基于区块链的数据处理方法、装置、计算机及存储介质
CN116595384A (zh) * 2023-07-14 2023-08-15 支付宝(杭州)信息技术有限公司 模型训练方法及装置
CN112446544B (zh) * 2020-12-01 2024-09-24 平安科技(深圳)有限公司 交通流预测模型训练方法、装置、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YI LIU,ET AL: "Privacy-preserving Traffic Flow Prediction:A Federated Learning Approach", 《IEEE INTERNET OF THINGS JOURNAL》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112446544A (zh) * 2020-12-01 2021-03-05 平安科技(深圳)有限公司 交通流预测模型训练方法、装置、电子设备及存储介质
CN112446544B (zh) * 2020-12-01 2024-09-24 平安科技(深圳)有限公司 交通流预测模型训练方法、装置、电子设备及存储介质
CN112801377A (zh) * 2021-01-29 2021-05-14 腾讯大地通途(北京)科技有限公司 一种对象估计方法、装置、设备及存储介质
CN112990921A (zh) * 2021-01-29 2021-06-18 腾讯科技(深圳)有限公司 基于区块链的数据处理方法、装置、计算机及存储介质
CN112801377B (zh) * 2021-01-29 2023-08-22 腾讯大地通途(北京)科技有限公司 一种对象估计方法、装置、设备及存储介质
CN112990921B (zh) * 2021-01-29 2024-02-09 腾讯科技(深圳)有限公司 基于区块链的数据处理方法、装置、计算机及存储介质
CN112966182A (zh) * 2021-03-09 2021-06-15 中国民航信息网络股份有限公司 一种项目推荐方法及相关设备
CN112966182B (zh) * 2021-03-09 2024-02-09 中国民航信息网络股份有限公司 一种项目推荐方法及相关设备
CN116595384A (zh) * 2023-07-14 2023-08-15 支付宝(杭州)信息技术有限公司 模型训练方法及装置
CN116595384B (zh) * 2023-07-14 2023-11-24 支付宝(杭州)信息技术有限公司 模型训练方法及装置

Similar Documents

Publication Publication Date Title
CN111739285A (zh) 交通流量的预测方法、装置、设备及计算机存储介质
Chen et al. An edge traffic flow detection scheme based on deep learning in an intelligent transportation system
CN109636049B (zh) 一种结合道路网络拓扑结构与语义关联的拥堵指数预测方法
CN110782042A (zh) 横向联邦和纵向联邦联合方法、装置、设备及介质
CN109635989B (zh) 一种基于多源异构数据融合的社交网络链路预测方法
CN111461410B (zh) 一种基于迁移学习的空气质量的预测方法及装置
WO2023185539A1 (zh) 机器学习模型训练方法、业务数据处理方法、装置及系统
JP2019040475A (ja) 人流予測装置、システムおよびプログラム
CN110414732A (zh) 一种出行未来轨迹预测方法、装置、储存介质及电子设备
CN111710153B (zh) 交通流量的预测方法、装置、设备及计算机存储介质
CN113037783B (zh) 一种异常行为检测方法及系统
CN113763700A (zh) 信息处理方法、装置、计算机设备及存储介质
CN115130711A (zh) 一种数据处理方法、装置、计算机及可读存储介质
CN113326826A (zh) 网络模型的训练方法、装置、电子设备及存储介质
CN115953643A (zh) 基于知识蒸馏的模型训练方法、装置及电子设备
CN115966083A (zh) 一种基于时空解耦的分布式交通流预测方法与系统
CN115762147A (zh) 一种基于自适应图注意神经网络的交通流量预测方法
CN112182431A (zh) 参考地点推荐方法、装置、设备以及存储介质
CN115880538A (zh) 图像处理模型的域泛化、图像处理的方法及设备
CN116259057A (zh) 基于联盟博弈解决联邦学习中数据异质性问题的方法
Akcin et al. Data games: A game-theoretic approach to swarm robotic data collection
CN114861936A (zh) 一种基于特征原型的联邦增量学习方法
Kitagawa et al. Urban traffic control using distributed multi-agent deep reinforcement learning
CN115834580B (zh) 面向海洋大数据的分布式数据处理方法、装置和设备
Li et al. Multi-zone prediction analysis of city-scale travel order demand

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201002