CN113313264B - 车联网场景下的高效联邦学习方法 - Google Patents

车联网场景下的高效联邦学习方法 Download PDF

Info

Publication number
CN113313264B
CN113313264B CN202110616360.4A CN202110616360A CN113313264B CN 113313264 B CN113313264 B CN 113313264B CN 202110616360 A CN202110616360 A CN 202110616360A CN 113313264 B CN113313264 B CN 113313264B
Authority
CN
China
Prior art keywords
vehicle
training
task
side unit
road side
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110616360.4A
Other languages
English (en)
Other versions
CN113313264A (zh
Inventor
何欣
胡霄林
葛莉娜
王光辉
于俊洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan University
Original Assignee
Henan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan University filed Critical Henan University
Priority to CN202110616360.4A priority Critical patent/CN113313264B/zh
Publication of CN113313264A publication Critical patent/CN113313264A/zh
Application granted granted Critical
Publication of CN113313264B publication Critical patent/CN113313264B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioethics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明提供一种车联网场景下的高效联邦学习方法。该方法包括:步骤1:路侧单元得到备选学习任务集合;步骤2:选定训练任务;步骤3:建立初始模型参数,将训练任务和其网络地址发送至覆盖范围内的车辆;步骤4:各车辆解析训练任务的任务信息,然后决定是否参加训练过程;若参加,则通过网络地址与路侧单元建立通信连接;步骤5:将初始模型参数发送至建立各车辆;步骤6:各车辆使用本地数据对当前模型参数进行本地训练,并上传至路侧单元;步骤7:一旦接到某一车辆上传的本地训练模型就实时计算其权值,将其实时加权聚合至全局模型中,并生成当前模型参数并实时返回至各车辆;步骤8:迭代执行步骤6至步骤7,直至满足设定的迭代次数。

Description

车联网场景下的高效联邦学习方法
技术领域
本发明涉及信息安全技术领域,特别是车联网场景下的保护数据隐私技术,尤其涉及一种车联网场景下的高效联邦学习方法。
背景技术
随着车联网技术不断发展,车辆之间流通数据是必不可少的。利用车载设备产生的路况信息数据,结合自身的环境感知能力,车辆用户可以拥有更准确的综合判断。车辆之间流通数据是提升数据利用效率、充分挖掘数据价值的有效手段之一。然而,由于担心个人隐私数据泄露,车主不愿将数据上传数据中心,阻碍了数据的流通,影响了车联网产业的发展。
基于联邦学习数据隐私保护技术具有显著优势。基于联邦学习的车联网技术可以达到数据不出本地的协同训练目的,并且高动态车辆只需将所训练的模型参数传送给路侧单元,不需要共享整个原始数据集,从而避免了隐私泄露风险。因此,基于联邦学习的车联网技术具有重要的实际研究价值。例如,中国专利文献CN 112700639A公开了一种基于联邦学习与数字孪生的智能交通路径规划方法。
车联网对数据传输时延敏感,不允许在模型训练过程中延时。然而,现有的联邦学习方法(如经典的联邦学习算法FedSGD、FedAvg,)因训练所需时间过长和协同训练效果不佳的特点,在其应用于车联网场景中面临着计算效率低的问题。其中,FedSGD算法是通过客户端用本地数据进行本地训练,并将训练结果发送至服务器端,通过等待的方式参与联合平均聚合,这个等待的过程可能会因为部分客户端的网络延时、设备故障等诸多原因而导致长时间的等待。而FedAvg算法是在FedSGD的基础上在客户端将原始数据分成多份,通过在本地进行多次迭代训练增加额外的计算量来降低客户端与服务器端之间的通信次数,最后将训练好的模型更新上传至服务器进行联合平均聚合,会等待更长时间。而训练时高效性要求比较高的场景,如在车辆网领域中,移动车辆行驶在道路上的原始数据可能随时发生变化,所以在车辆对数据共享效率要求较高的情况下,传统联邦学习根本无法进行应用。
事实上,上述专利文献CN 112700639 A公开的方法在进行模型聚合时也同样采用了平均聚合模型,因此一定程度上也存在训练耗时长的问题,并且,该方法对各个本地模型的质量未进行监测,这就导致最终训练的聚合模型的准确性也较低。
发明内容
针对传统的联邦学习方法存在的训练耗时长的技术问题,本发明提供一种车联网场景下的高效联邦学习方法,使其适应于对训练时高效性要求比较高的场景中,满足拥有庞大数据量、使数据不出本地保护隐私、高效共享等特点。
本发明提供一种车联网场景下的高效联邦学习方法,包括:
步骤1:路侧单元收集学习任务,得到备选学习任务集合;
步骤2:路侧单元在所述备选学习任务集合中选定其中一个学习任务作为训练任务;
步骤3:路侧单元建立所述训练任务的初始模型参数,将所述训练任务和路侧单元的网络地址发送至覆盖范围内的车辆;
步骤4:各车辆解析接收到的训练任务的任务信息,然后决定是否参加所述训练任务的训练过程;若参加,则通过路侧单元的网络地址与路侧单元建立通信连接;
步骤5:路侧单元将训练任务的初始模型参数发送至建立有通信连接的各车辆;
步骤6:各车辆使用本地数据对接收到的训练任务的当前模型参数进行本地训练,并将本地训练模型上传至路侧单元;
步骤7:路侧单元一旦接到某一车辆上传的本地训练模型就实时计算该本地训练模型的权值,然后将该车辆上传的本地训练模型实时加权聚合至全局模型中,并生成训练任务的当前模型参数,将其实时返回至各车辆;
步骤8:迭代执行步骤6至步骤7,直至满足设定的迭代次数。
进一步地,步骤4中,在各车辆与路侧单元建立通信连接后,还包括:将本车辆的身份认证信息传递至路侧单元;
对应地,步骤5具体为:路侧单元根据接收到的车辆的身份认证信息对参加训练任务的车辆进行身份认证,将训练任务的初始模型参数发送至通过身份认证的车辆。
进一步地,步骤7中,在路侧单元将该车辆上传的本地训练模型实时加权聚合至全局模型中之前,还包括:路侧单元对该车辆上传的本地车辆训练模型进行质量评估;
对应地,步骤7中的路侧单元将该车辆上传的本地训练模型实时加权聚合至全局模型中,具体为:将通过质量评估的该本地训练模型实时加权聚合至全局模型中。
进一步地,所述备选学习任务集合为Q={Q1,Q2,…,Qk,…,QN},k∈{1,2,…,N};其中,Qk=(Wk,Uk),Qk表示收集到的第k个学习任务,Wk表示第k个学习任务的权重,Uk表示第k个学习任务的任务信息,N表示收集到的学习任务的总数;
对应地,步骤2具体包括:在所述备选学习任务集合中选取权重Wk值最大的学习任务作为训练任务。
进一步地,车辆的身份认证信息包括车辆的认证等级;
对应地,路侧单元根据接收到的车辆的身份认证信息对参加训练任务的车辆进行身份认证,具体包括:
判断车辆的认证等级的数值是否大于等于预设阈值,若大于等于预设阈值,则表示车辆通过身份认证;
其中,第一次参加训练任务的新注册车辆的认证等级的数值大于等于预设阈值。
进一步地,步骤5中,在训练任务的初始模型参数发送至通过身份认证的车辆之前,还包括:
路侧单元为通过身份认证的车辆建立临时索引C={C1,C2,…,Ci,…,CM},Ci表示车辆i的索引值,i∈{1,2,…,M};
对应地,步骤5中的将训练任务的初始模型参数发送至通过身份认证的车辆,具体为:
路侧单元通过广播将训练任务的初始模型参数发送至临时索引中的各车辆。
进一步地,步骤6中的各车辆使用本地数据对接收到的训练任务的当前模型参数进行本地训练,具体包括:
车辆i根据本地数据和全局模型参数计算第t次迭代过程的梯度下降
Figure BDA0003097852750000041
其中,f(ω)=l(ω,D),f(ω)表示预测损失函数,ω表示车辆接收到的全局模型参数,D表示车辆的本地数据,
Figure BDA0003097852750000042
表示梯度算子;
车辆i根据所述梯度下降
Figure BDA0003097852750000043
更新得到第t次迭代过程的本地训练模型
Figure BDA0003097852750000044
其中,ηi为车辆i的学习效率,
Figure BDA0003097852750000045
表示车辆i在进行第t次迭代过程的本地训练之前的本地训练模型参数。
进一步地,步骤6中,所述本地数据包括车辆曾参加过的训练任务的本地历史数据和/或车辆上各传感设备所感知到的传感数据。
进一步地,步骤7中的路侧单元对各车辆上传的本地训练模型进行质量评估,具体包括:
路侧单元获取车辆所在位置的预设区域范围内的与训练任务相关的数据信息,根据获取的数据信息判断采用该车辆上传的本地训练模型进行更新的内容是否可靠,若可靠,则认为该车辆的本地训练模型通过质量评估。
进一步地,步骤7中的路侧单元计算各本地训练模型的权值,然后将各车辆上传的本地训练模型加权聚合至全局模型中,具体包括:
路侧单元按照下式为车辆更新车辆的认证等级:
Figure BDA0003097852750000046
其中,
Figure BDA0003097852750000047
表示车辆i关于训练任务k的第t次迭代过程的认证等级,
Figure BDA0003097852750000048
表示车辆初始认证等级,M表示参与训练任务k的车辆总数;
路侧单元根据车辆的认证等级按照下式更新该车辆的当前本地训练模型的权重:
Figure BDA0003097852750000049
其中,
Figure BDA00030978527500000410
表示车辆i在参与训练任务k时所上传的当前本地训练模型的权重;
路侧单元按照下式将各本地训练模型加权聚合至全局模型:
Figure BDA00030978527500000411
其中,ωj+1表示路侧单元j进行当前轮聚合得到的全局模型参数,ωj表示路侧单元j进行上一轮聚合后得到的全局模型参数;ωi表示车辆i的当前本地训练模型。
本发明的有益效果:
本发明结合车联网特点,根据车辆本地数据进行模型训练产生模型更新内容,仅将更新模型上传至路侧单元,进而在完成训练任务的同时又保护了移动车辆的数据隐私。与已有的移动车辆数据隐私保护方法相比,具有如下优点:
(1)车辆在行驶过程中,道路上的情况瞬息万变,驾驶员对路况信息的实时性要求较高,而路侧单元聚合模型相比于中央服务器聚合模型而言,更具有实时性的特点。采用异步的训练方式可以有效的帮助车辆实时获取到最新路况信息。
(2)在对模型进行聚合时,在路侧单元端通过实时聚合的模型聚合方式来降低模型训练中的等待时长,进而提升数据共享效率,通过采用该高效聚合的方式进行聚合,提升了移动车辆对学习过程中高效性的需求,具体为:首先是让路侧单元发起学习任务并建立初始模型,然后将模型发送给移动的车辆参与模型训练;其次,车辆收到模型后根据本地数据进行学习,并将通过训练得到的模型更新上传至路侧单元;最后路侧单元一接收到某车辆发来的模型更新后,立刻进行聚合,并将聚合后的模型发给车辆,而无需等待所有车辆均发来模型更新后才能进行模型聚合,因此本发明保障了训练过程中的高效性。反复迭代该过程,最终形成理想模型,因此本发明还保障了训练过程中的准确性。
(3)通过身份认证和质量评估可以评估车辆以往是否诚实,进而可以判断该车辆上传的本地训练模型是否能够对全局模型做出贡献,如此可以得到更加准确的全局模型参数,进一步提高了训练结果的准确性。
(4)车辆之间通过路侧单元建立起联合训练的模式,车辆无需将本地数据上传至路侧单元,而是将车辆本地训练后的最小模型更新上传至路侧单元进行模型聚合。数据不出车辆本地的情况下,保护了车辆自身的数据隐私。
(5)车辆感知到的信息是有限的,而多辆汽车将感知到的信息进行模型训练并聚合可以得到更加准确且全面的路况信息。该架构可以使得车辆感知的数据得以充分利用。
附图说明
图1为本发明实施例提供的车联网场景下的高效联邦学习方法的流程示意图之一;
图2为本发明实施例提供的路侧单元与车辆之间的信息交互图;
图3为本发明实施例提供的车联网场景下的高效联邦学习方法的流程示意图之二;
图4为本发明实施例提供的车辆隐私变化图;
图5为本发明实施例提供的本发明方法和现有的两种传统方法的学习效率变化图;
图6为本发明实施例提供的本发明方法和现有的两种传统方法的时间准确率变化图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供一种车联网场景下的高效联邦学习方法,包括以下步骤:
S101:路侧单元收集学习任务,得到备选学习任务集合;
S102:路侧单元在所述备选学习任务集合中选定其中一个学习任务作为训练任务;
S103:路侧单元建立所述训练任务的初始模型参数,将所述训练任务和路侧单元的网络地址发送至覆盖范围内的车辆;
S104:各车辆解析接收到的训练任务的任务信息,然后决定是否参加所述训练任务的训练过程;若参加,则通过路侧单元的网络地址与路侧单元建立通信连接;
S105:路侧单元将训练任务的初始模型参数发送(可以通过广播的形式)至建立有通信连接的各车辆;
S106:各车辆使用本地数据对接收到的训练任务的当前模型参数进行本地训练,并将本地训练模型上传至路侧单元;
S107:路侧单元一旦接到某一车辆上传的本地训练模型就实时计算该本地训练模型的权值,然后将该车辆上传的本地训练模型实时加权聚合至全局模型中,并生成训练任务的当前模型参数,将其实时返回至各车辆;
S108:迭代执行步骤S106至步骤S107,直至满足设定的迭代次数。
本发明实施例提供的车联网场景下的高效联邦学习方法,路侧单元一接收到某车辆发来的模型更新后,就立刻进行聚合(而无需等待所有车辆均发来模型更新后才能进行模型聚合),并将聚合后的模型发给参与训练任务的各车辆,因此本发明保障了训练过程中的高效性、准确性。
在上述实施例的基础上,结合图2和图3所示,本发明实施例提供又一种车联网场景下的高效联邦学习方法,包括以下步骤:
S201:路侧单元收集学习任务,得到备选学习任务集合;
作为一种可实施方式,所述备选学习任务集合为Q={Q1,Q2,…,Qk,…,QN},k∈{1,2,…,N};其中,Qk=(Wk,Uk),Qk表示收集到的第k个学习任务,Wk表示第k个学习任务的权重,Uk表示第k个学习任务的任务信息,N表示收集到的学习任务的总数;
S202:路侧单元在所述备选学习任务集合中选定其中一个学习任务作为训练任务;
作为一种可实施方式,在所述备选学习任务集合中选取权重Wk值最大的学习任务作为训练任务。可以理解,越紧急的学习任务的权重值越大。
S203:路侧单元建立所述训练任务的初始模型参数,将所述训练任务和路侧单元的网络地址发送至覆盖范围内的车辆;
具体地,该初始模型参数为可存储当前训练任务所需要传递参数格式的对象,初始时为null。
S204:各车辆解析接收到的训练任务的任务信息,然后决定是否参加所述训练任务的训练过程;若参加,则通过路侧单元的网络地址与路侧单元建立通信连接,然后将本车辆的身份认证信息传递至路侧单元;
具体地,各车辆可根据本车辆的设备条件和本地数据对接情况以及车主综合考虑最终决定是否参与本次训练任务。若车主没有进行选择,默认为不参与此次任务训练。
作为一种可实施方式,车辆的身份认证信息包括车辆的认证等级。
S205:路侧单元根据接收到的车辆的身份认证信息对参加训练任务的车辆进行身份认证,将训练任务的初始模型参数发送至通过身份认证的车辆;
作为一种可实施方式,判断车辆的认证等级的数值是否大于预设阈值,若大于等于预设阈值,则表示车辆通过身份认证;其中,第一次参加训练任务的新注册车辆的认证等级的数值大于等于预设阈值。
例如,移动车辆可以申请注册在保护本车辆数据隐私的情况下通过集体学习的方式参与任务学习,刚注册过的车辆的认证等级的数值=1。当路侧单元所接收参与任务的移动车辆的认证等级≥1时,认为该移动车辆通过身份认证。
可以理解,车辆在曾参加的训练任务中所做的贡献越大,车辆的认证等级的数值越大。
作为一种可实施方式,本步骤中,在训练任务的初始模型参数发送至通过身份认证的车辆之前,还包括:路侧单元为通过身份认证的车辆建立临时索引C={C1,C2,…,Ci,…,CM},Ci表示车辆i的索引值,i∈{1,2,…,M};对应地,本步骤中的将训练任务的初始模型参数发送至通过身份认证的车辆,具体为:路侧单元通过广播将训练任务的初始模型参数发送至临时索引中的各车辆。
具体地,路侧单元只为参与训练任务并且通过身份认证的移动车辆建立临时索引,该临时索引为动态变化的集合,随着更多移动车辆的加入,该集合会继续扩大。该临时索引通过临时索引表的形式只存储在路侧单元上,其他移动车辆无法根据临时索引找到对应车辆的准确信息。
S206:各车辆使用本地数据对接收到的训练任务的当前模型参数进行本地训练,并将本地训练模型上传至路侧单元;
作为一种可实施方式,以车辆i的本地训练过程为例,具体为:车辆i根据本地数据和全局模型参数计算第t次迭代过程的梯度下降
Figure BDA0003097852750000081
其中,f(ω)=l(ω,D),f(ω)表示预测损失函数,ω表示车辆接收到的全局模型参数,D表示车辆的本地数据,
Figure BDA0003097852750000091
表示梯度算子;
车辆i根据所述梯度下降
Figure BDA0003097852750000092
更新得到第t次迭代过程的本地训练模型
Figure BDA0003097852750000093
其中,ηi为车辆i的学习效率,
Figure BDA0003097852750000094
表示车辆i在进行第t次迭代过程的本地训练之前的本地训练模型参数。
可以理解,首轮模型训练时,训练任务的的当前模型参数为初始模型参数。
作为一种可实施方式,所述本地数据包括车辆曾参加过的训练任务的本地历史数据和/或车辆上各传感设备(例如:摄像头和雷达等)所感知到的传感数据(例如周围物体状态、位置等特征数据)。
具体地,根据不同的任务需要,使用不同特征的数据进行模型训练。如通过本车历史速度信息预测本车未来车速以及该路段未来路况等。
S207:路侧单元一旦接到某一车辆上传的本地训练模型对该车辆上传的本地车辆训练模型进行质量评估;然后计算通过质量评估的各本地训练模型的权值,然后将通过质量评估的该本地训练模型实时加权聚合至全局模型中,并生成训练任务的当前模型参数,将其实时返回至各车辆;
作为一种可实施方式,路侧单元获取车辆所在位置的预设区域范围内的与训练任务相关的数据信息(例如可通过设置在车辆周围的预设区域范围内的固定设备获取相关信息),根据获取的数据信息判断该采用该车辆上传的本地训练模型进行更新的内容是否可靠,若可靠,则认为该车辆的本地训练模型通过质量评估;若不可靠,则该车辆本次上传的本地训练模型将不再被聚合至全局模型,并将质量评估结果反馈给该移动车辆。
例如,路侧单元随机选取车辆能力范围内的特征数据,将该特征数据与车辆上传的本地更新内容进行校对,当内容准确度超过80%,即质量认证通过。否则,即不通过。
作为一种可实施方式,以路侧单元将车辆i的本地训练模型聚合至全局模型的过程为例,具体为:路侧单元按照下式为通过质量评估的车辆更新车辆的认证等级:
Figure BDA0003097852750000095
其中,
Figure BDA0003097852750000101
表示车辆i关于训练任务k的第t次迭代过程的认证等级,
Figure BDA0003097852750000102
表示车辆初始认证等级,M表示参与训练任务k的车辆总数;
可以理解,路侧单元按照下式为未通过质量评估的车辆更新车辆的认证等级:
Figure BDA0003097852750000103
路侧单元根据车辆的认证等级按照下式更新该车辆的当前本地训练模型的权重:
Figure BDA0003097852750000104
其中,
Figure BDA0003097852750000105
表示车辆i在参与训练任务k时所上传的当前本地训练模型的权重;
路侧单元按照下式将各本地训练模型加权聚合至全局模型:
Figure BDA0003097852750000106
其中,ωj+1表示路侧单元j进行当前轮聚合得到的全局模型参数,ωj表示路侧单元j进行上一轮聚合后得到的全局模型参数;ωi表示车辆i的当前本地训练模型。
S208:迭代执行步骤S206至步骤S207,直至满足设定的迭代次数。
为了验证本发明方法的有效性,本发明还提供有以下实验:
本发明选择了一个真实且公开的代理数据集,对车辆速度进行预测,以便于彻底观察本发明方法的可行性。该代理数据集为加利福尼亚两条高速公路上不同交通密度的车辆行驶数据,数据采样时间间隔为1s,车辆轨迹数据包含了时间、车辆ID、经纬度、速度等信息。本发明在Intel Core i5-1035G1 CPU@1.00GHz处理器和16.0GB(15.8GB可用)RAM内存配置的Lenovo笔记本计算机上进行仿真。在模拟中,车辆分别设置为8辆、16辆和24辆完成训练任务用以测试该方案的性能。出版商将计算任务分配到车联网网络中,并选择车辆来完成任务。模拟结果从2800次独立运行中产生。
使用加利福尼亚两条高速公路上中I5-S高速路所收集密度为1的数据,其数据集密度共分为7种,分别是1~7。即密度1是最高密度,而密度7是低密度。采用下午2:14收集的数据,在经过了262秒,路侧单元E1所收集产生E1_0车道连续40s的车辆数据。对比方法选用FedSGD算法和FedAvg算法。
根据本发明方法(图4、图5和图6中的“Fedvehicle”表示本发明方法),车辆在本地进行单次本地训练并将训练所得的模型更新上传至路侧单元进行敏捷聚合。文中报告了单位时间内,三种算法在不同车辆参与下单位时间内学习效率的关系。为了计算这一点,文中考虑了车辆在同等学习能力的条件下进行该实验。在本文中,已知任务结果的准确率相比较传统的联邦学习算法在实时数据训练中有比较大的优势。设置每次迭代需要在本地进行学习的时间t=0.2s,通信基本耗时常数k=0.05。根据以往工作可知FedAvg在本地迭代次数为5次时,效果最佳。故设置m=5。
数据隐私安全在测试中的表现如图4所示,采用联邦学习技术来保护车辆数据的隐私安全可以降低必不可免的数据传输过程中的隐私泄露概率,比较大的保护车辆的数据隐私。同时还可以观察到,随着参与训练的车辆数量不断增多,车辆的数据隐私会被保护的更好。
三种方法的学习效率在图5中进行评估,以显示本发明方法和相关联邦学习算法在时间和学习效率之间的关系,以及不同参与训练的车辆数对时间和学习效率关系的影响。通过仿真可以看出,本发明方法在单位时间内学习效率上的优势明显优于传统的联邦学习算法,体现出对实时性数据学习效率更高。同时可以观察到,参与训练的车辆数量对学习效率的影响微乎其微,尤其是在本发明方法中。可以得出结论,本发明方法更能保证车-边联邦学习场景中,用户对实时数据训练的要求。
根据本车历史速度信息来预测未来速度以及未来路况拥堵情况,其预测的时间和准确率关系如图6所示。FedSGD算法和FedAvg算法根据多个参与方进行的模型训练在服务器端进行模型平均聚合。采用VEFL架构的本发明方法相比于传统的FedSGD和FedAVG算法,能够更好的用于模型的预测训练。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.车联网场景下的高效联邦学习方法,其特征在于,包括:
步骤1:路侧单元收集学习任务,得到备选学习任务集合;
步骤2:路侧单元在所述备选学习任务集合中选定其中一个学习任务作为训练任务;
步骤3:路侧单元建立所述训练任务的初始模型参数,将所述训练任务和路侧单元的网络地址发送至覆盖范围内的车辆;
步骤4:各车辆解析接收到的训练任务的任务信息,然后决定是否参加所述训练任务的训练过程;若参加,则通过路侧单元的网络地址与路侧单元建立通信连接,将本车辆的身份认证信息传递至路侧单元,所述车辆的身份认证信息包括车辆的认证等级;
步骤5:路侧单元根据接收到的车辆的身份认证信息对参加训练任务的车辆进行身份认证,将训练任务的初始模型参数发送至通过身份认证的各车辆;
步骤6:各车辆使用本地数据对接收到的训练任务的当前模型参数进行本地训练,并将本地训练模型上传至路侧单元;所述的各车辆使用本地数据对接收到的训练任务的当前模型参数进行本地训练,具体包括:
车辆i根据本地数据和全局模型参数计算第t次迭代过程的梯度下降
Figure FDA0003725164680000011
其中,
Figure FDA0003725164680000012
f(ω)表示预测损失函数,ω表示车辆接收到的全局模型参数,D表示车辆的本地数据,
Figure FDA0003725164680000013
表示梯度算子;
车辆i根据所述梯度下降
Figure FDA0003725164680000014
更新得到第t次迭代过程的本地训练模型
Figure FDA0003725164680000015
其中,ηi为车辆i的学习效率,
Figure FDA0003725164680000016
表示车辆i在进行第t次迭代过程的本地训练之前的本地训练模型参数;
步骤7:路侧单元一旦接到某一车辆上传的本地训练模型后就为车辆更新车辆的认证等级,根据车辆的认证等级更新车辆的当前本地训练模型的权重,然后将该车辆上传的本地训练模型实时加权聚合至全局模型中,并生成训练任务的当前模型参数,将其实时返回至各车辆;
步骤8:迭代执行步骤6至步骤7,直至满足设定的迭代次数。
2.根据权利要求1所述的高效联邦学习方法,其特征在于,步骤7中,在路侧单元将该车辆上传的本地训练模型实时加权聚合至全局模型中之前,还包括:路侧单元对该车辆上传的本地车辆训练模型进行质量评估;
对应地,步骤7中的路侧单元将该车辆上传的本地训练模型实时加权聚合至全局模型中,具体为:将通过质量评估的该本地训练模型实时加权聚合至全局模型中。
3.根据权利要求1所述的高效联邦学习方法,其特征在于,所述备选学习任务集合为Q={Q1,Q2,…,Qk,…,QN},k∈{1,2,…,N};其中,Qk=(Wk,Uk),Qk表示收集到的第k个学习任务,Wk表示第k个学习任务的权重,Uk表示第k个学习任务的任务信息,N表示收集到的学习任务的总数;
对应地,步骤2具体包括:在所述备选学习任务集合中选取权重Wk值最大的学习任务作为训练任务。
4.根据权利要求1所述的高效联邦学习方法,其特征在于,路侧单元根据接收到的车辆的身份认证信息对参加训练任务的车辆进行身份认证,具体包括:
判断车辆的认证等级的数值是否大于等于预设阈值,若大于等于预设阈值,则表示车辆通过身份认证;
其中,第一次参加训练任务的新注册车辆的认证等级的数值大于等于预设阈值。
5.根据权利要求1所述的高效联邦学习方法,其特征在于,步骤5中,在训练任务的初始模型参数发送至通过身份认证的车辆之前,还包括:
路侧单元为通过身份认证的车辆建立临时索引C={C1,C2,…,Ci,…,CM},Ci表示车辆i的索引值,i∈{1,2,…,M};
对应地,步骤5中的将训练任务的初始模型参数发送至通过身份认证的车辆,具体为:
路侧单元通过广播将训练任务的初始模型参数发送至临时索引中的各车辆。
6.根据权利要求1所述的高效联邦学习方法,其特征在于,步骤6中,所述本地数据包括车辆曾参加过的训练任务的本地历史数据和/或车辆上各传感设备所感知到的传感数据。
7.根据权利要求2所述的高效联邦学习方法,其特征在于,步骤7中的路侧单元对各车辆上传的本地训练模型进行质量评估,具体包括:
路侧单元获取车辆所在位置的预设区域范围内的与训练任务相关的数据信息,根据获取的数据信息判断采用该车辆上传的本地训练模型进行更新的内容是否可靠,若可靠,则认为该车辆的本地训练模型通过质量评估。
8.根据权利要求1所述的高效联邦学习方法,其特征在于,步骤7中,路侧单元按照下式为车辆更新车辆的认证等级:
Figure FDA0003725164680000031
其中,
Figure FDA0003725164680000032
表示车辆i关于训练任务k的第t次迭代过程的认证等级,
Figure FDA0003725164680000033
表示车辆初始认证等级,M表示参与训练任务k的车辆总数;
路侧单元根据车辆的认证等级按照下式更新该车辆的当前本地训练模型的权重:
Figure FDA0003725164680000034
其中,
Figure FDA0003725164680000035
表示车辆i在参与训练任务k时所上传的当前本地训练模型的权重;
路侧单元按照下式将各本地训练模型加权聚合至全局模型:
Figure FDA0003725164680000036
其中,ωj+1表示路侧单元j进行当前轮聚合得到的全局模型参数,ωj表示路侧单元j进行上一轮聚合后得到的全局模型参数;ωi表示车辆i的当前本地训练模型。
CN202110616360.4A 2021-06-02 2021-06-02 车联网场景下的高效联邦学习方法 Active CN113313264B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110616360.4A CN113313264B (zh) 2021-06-02 2021-06-02 车联网场景下的高效联邦学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110616360.4A CN113313264B (zh) 2021-06-02 2021-06-02 车联网场景下的高效联邦学习方法

Publications (2)

Publication Number Publication Date
CN113313264A CN113313264A (zh) 2021-08-27
CN113313264B true CN113313264B (zh) 2022-08-12

Family

ID=77377289

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110616360.4A Active CN113313264B (zh) 2021-06-02 2021-06-02 车联网场景下的高效联邦学习方法

Country Status (1)

Country Link
CN (1) CN113313264B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113920780B (zh) * 2021-09-01 2022-12-16 同济大学 基于联邦学习的云雾协同个性化前向碰撞风险预警方法
CN114051222A (zh) * 2021-11-08 2022-02-15 北京工业大学 一种车联网环境下基于联邦学习的无线资源分配和通信优化方法
CN114627648B (zh) * 2022-03-16 2023-07-18 中山大学·深圳 一种基于联邦学习的城市交通流诱导方法及系统
CN115081002B (zh) * 2022-06-28 2024-05-14 西安电子科技大学 用于去中心化联邦学习的聚合服务器选择方法
CN116546429B (zh) * 2023-06-06 2024-01-16 杭州一诺科创信息技术有限公司 一种车联网联邦学习中的车辆选择方法和系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2020101613A4 (en) * 2020-08-02 2020-09-10 B.P.R.V.S, Priyatham MR Collaborative federative learning approach for internet of vehicles traffic prediction
AU2020102543A4 (en) * 2020-09-30 2020-11-19 Aggarwal, Vibha DR Iot based trust modeling approach for cooperative autonomous driving and intelligent transport systems (its)
CN112052959A (zh) * 2020-09-04 2020-12-08 深圳前海微众银行股份有限公司 基于联邦学习的自动驾驶训练方法、设备及介质
CN112446544A (zh) * 2020-12-01 2021-03-05 平安科技(深圳)有限公司 交通流预测模型训练方法、装置、电子设备及存储介质
CN112540926A (zh) * 2020-12-17 2021-03-23 杭州趣链科技有限公司 一种基于区块链的资源分配公平的联邦学习方法
CN112583575A (zh) * 2020-12-04 2021-03-30 华侨大学 一种车联网中基于同态加密的联邦学习隐私保护方法
CN112700639A (zh) * 2020-12-07 2021-04-23 电子科技大学 一种基于联邦学习与数字孪生的智能交通路径规划方法
CN112770291A (zh) * 2021-01-14 2021-05-07 华东师范大学 基于联邦学习和信任评估的分布式入侵检测方法及系统
CN112764927A (zh) * 2021-01-21 2021-05-07 西安电子科技大学 一种车辆选择和资源联合优化方法、系统、介质及应用
US11017322B1 (en) * 2021-01-28 2021-05-25 Alipay Labs (singapore) Pte. Ltd. Method and system for federated learning

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2020101613A4 (en) * 2020-08-02 2020-09-10 B.P.R.V.S, Priyatham MR Collaborative federative learning approach for internet of vehicles traffic prediction
CN112052959A (zh) * 2020-09-04 2020-12-08 深圳前海微众银行股份有限公司 基于联邦学习的自动驾驶训练方法、设备及介质
AU2020102543A4 (en) * 2020-09-30 2020-11-19 Aggarwal, Vibha DR Iot based trust modeling approach for cooperative autonomous driving and intelligent transport systems (its)
CN112446544A (zh) * 2020-12-01 2021-03-05 平安科技(深圳)有限公司 交通流预测模型训练方法、装置、电子设备及存储介质
CN112583575A (zh) * 2020-12-04 2021-03-30 华侨大学 一种车联网中基于同态加密的联邦学习隐私保护方法
CN112700639A (zh) * 2020-12-07 2021-04-23 电子科技大学 一种基于联邦学习与数字孪生的智能交通路径规划方法
CN112540926A (zh) * 2020-12-17 2021-03-23 杭州趣链科技有限公司 一种基于区块链的资源分配公平的联邦学习方法
CN112770291A (zh) * 2021-01-14 2021-05-07 华东师范大学 基于联邦学习和信任评估的分布式入侵检测方法及系统
CN112764927A (zh) * 2021-01-21 2021-05-07 西安电子科技大学 一种车辆选择和资源联合优化方法、系统、介质及应用
US11017322B1 (en) * 2021-01-28 2021-05-25 Alipay Labs (singapore) Pte. Ltd. Method and system for federated learning

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
"A hierarchical blockchain-enabled federal learning algorithm for knowledge sharing in internet of vehicles";Haoye Chai等;《IEEE Transactions on Intelligent Transportation Systems》;20200629;第3975-3986页 *
"Blockchain empowered asynchronous federal learning for secure data sharing in internet of vehicles";Yunlong Lu等;《IEEE Transactions on Vehicular Technology》;20200213;第4298-4311页 *
"Distributed federal learning for ultra-reliable low-latency vehicular communications";Sumudu Samarakoon等;《IEEE TRANSACTIONS ON COMMUNICATIONS》;20191128;第1146-1159页 *
"federal learning with blockchain for autonomous vehicles:analysis and design challenges";Kang Tan等;《IEEE Transactions on Communications》;20200427;第4734-4746页 *
"FedVCP: A Federated-Learning-Based Cooperative Positioning Scheme for Social Internet of Vehicles";Xiangjie Kong等;《IEEE Transactions on Computational Social Systems》;20210315;第197-206页 *
"区块链赋能6G";代玥玥等;《物联网学报》;20200331;第111-120页 *
"数据隐私安全防护及共享方法研究";卢云龙;《中国博士学位论文全文数据库 信息科技辑》;20210115;I138-33 *

Also Published As

Publication number Publication date
CN113313264A (zh) 2021-08-27

Similar Documents

Publication Publication Date Title
CN113313264B (zh) 车联网场景下的高效联邦学习方法
Du et al. Federated learning for vehicular internet of things: Recent advances and open issues
Jiau et al. Multimedia services in cloud-based vehicular networks
CN112700639B (zh) 一种基于联邦学习与数字孪生的智能交通路径规划方法
CN112770291B (zh) 基于联邦学习和信任评估的分布式入侵检测方法及系统
Liu et al. Blockchain-based secure communication of intelligent transportation digital twins system
WO2018054342A1 (zh) 一种网络数据流分类的方法及系统
CN110933091B (zh) 区块链通信节点验证方法、装置及电子设备
Kim et al. An analytical model to characterize the spatiotemporal propagation of information under vehicle-to-vehicle communications
CN114418109A (zh) 微服务架构下联邦学习的节点选择与聚合优化系统及方法
CN105430615A (zh) 一种连续位置服务请求下基于假位置的位置隐私保护方法
CN115580891B (zh) 基于联邦学习的流量预测模型训练方法、预测方法和装置
da Silva et al. Towards federated learning in edge computing for real-time traffic estimation in smart cities
CN113590571B (zh) 一种私有云资源和公有云资源的共享方法及系统
CN109257724B (zh) 车联网环境中安全可靠车辆雾的构建方法
Ahmed et al. A highly secured QoS aware routing algorithm for software defined vehicle ad-hoc networks using optimal trust management scheme
Li et al. Deep reinforcement learning for intelligent computing and content edge service in ICN-based IoV
Balouchzahi et al. A graph-based model for RSUs deployment in vehicular networks by considering urban and network limitations and QoS requirements of service advertisement and discovery
Shinkuma et al. Data assessment and prioritization in mobile networks for real-time prediction of spatial information using machine learning
Sarangi Malicious Attacks Detection Using Trust Node Centric Weight Management Algorithm in Vehicular Platoon
Xie et al. Soft Actor–Critic-Based Multilevel Cooperative Perception for Connected Autonomous Vehicles
Li et al. An Empirical Study on GAN‐Based Traffic Congestion Attack Analysis: A Visualized Method
Abada et al. Traffic flow modeling for UAV-enabled wireless networks
CN115544870B (zh) 一种道路网络临近检测方法、装置及存储介质
Zhang et al. Macroscopic interval-split free-flow model for vehicular cloud computing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant