CN113268920B - 一种基于联邦学习的无人机群感知数据安全共享方法 - Google Patents
一种基于联邦学习的无人机群感知数据安全共享方法 Download PDFInfo
- Publication number
- CN113268920B CN113268920B CN202110512015.6A CN202110512015A CN113268920B CN 113268920 B CN113268920 B CN 113268920B CN 202110512015 A CN202110512015 A CN 202110512015A CN 113268920 B CN113268920 B CN 113268920B
- Authority
- CN
- China
- Prior art keywords
- model
- unmanned aerial
- aerial vehicle
- contract
- optimal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000012549 training Methods 0.000 claims abstract description 61
- 238000013461 design Methods 0.000 claims abstract description 32
- 230000002776 aggregation Effects 0.000 claims abstract description 28
- 238000004220 aggregation Methods 0.000 claims abstract description 28
- 230000008901 benefit Effects 0.000 claims abstract description 23
- 238000004891 communication Methods 0.000 claims abstract description 17
- 230000008447 perception Effects 0.000 claims abstract description 12
- 238000013441 quality evaluation Methods 0.000 claims abstract description 12
- 238000001303 quality assessment method Methods 0.000 claims abstract description 10
- 238000011156 evaluation Methods 0.000 claims abstract description 7
- 230000006870 function Effects 0.000 claims description 30
- 230000005540 biological transmission Effects 0.000 claims description 24
- 230000006399 behavior Effects 0.000 claims description 11
- 238000010801 machine learning Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000005562 fading Methods 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/04—Constraint-based CAD
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- General Engineering & Computer Science (AREA)
- Geometry (AREA)
- Computer Hardware Design (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于联邦学习的无人机群感知数据安全共享方法,基于契约理论设计针对不同类型无人机的最优契约;无人机根据自身类型选择最优契约进行本地模型训练得到本地模型参数更新,并将本地模型参数更新传输至联邦学习服务器;联邦学习服务器对接收的本地模型参数更新进行本地模型质量评估,根据评估结果设计模型鲁棒聚合规则和模型效益公平分配规则,根据模型鲁棒聚合规则进行模型聚合,根据模型效益公平分配规则进行效益分配;联邦学习服务器根据本地模型质量评估对无人机进行动态声誉管理。本发明能提高无人机在联邦学习中的通信效率,激励无人机用户的参与,抵御搭便车现象和拜占庭攻击,实现高效的和隐私保护的无人机感知数据共享。
Description
技术领域
本发明属于物联网安全领域,具体涉及一种基于联邦学习的无人机群感知数据安全共享方法。
背景技术
随着小型无人机的不断普及,无人机即服务(UAV-as-a-Service)作为新型智慧城市的使能技术,可实现全天候、按需提供的各类感知服务与应用,已广泛用于空气质量检测、城市安保、灾难救援等场景。然而无人机的感知数据会不可避免地记录用户的隐私和敏感数据,传统机器学习模型需要将大量的感知数据迁移到一个中心化存储设备进行数据挖掘与知识提取,因此可能导致严重的隐私泄露和数据滥用。
联邦学习作为一种新型的隐私保护的机器学习范式,获得了学术界和产业界的广泛关注,是实现分散的无人机感知数据的安全高效共享和知识抽取的关键技术。在联邦学习中,无人机只需根据分享由本地数据训练得到的模型参数更新而非原始感知数据从而保护数据隐私。然而,1)当前的联邦学习需要频繁的进行周期性的本地训练和全局更新。由于小型无人机通常具有有限的电池、计算和通信能力,同时传统云计算难以满足大量物联网设备在数据训练中的高带宽与低时延需求,因此当前联邦学习存在节点参与意愿低和模型训练效率低等问题。2)由于无人机数据的异质性、搭便车现象和拜占庭攻击的存在,当前联邦学习缺乏高效精准的激励机制以及鲁棒的模型聚合机制。
发明内容
针对现有技术中存在的问题,本发明提供了一种基于联邦学习的无人机群感知数据安全共享方法,其目的在于提高无人机在联邦学习中的通信效率,激励无人机用户的参与和高质量模型训练,同时抵御搭便车现象和拜占庭攻击,实现高效的和隐私保护的无人机感知数据共享。
为了解决上述技术问题,本发明通过以下技术方案予以实现:
一种基于联邦学习的无人机群感知数据安全共享方法,包括:
基于契约理论设计针对不同类型无人机的最优契约,以激励无人机参与联邦学习;
无人机根据自身类型选择最优契约进行本地模型训练得到本地模型参数更新,并将所述本地模型参数更新传输至联邦学习服务器;
联邦学习服务器对接收的所述本地模型参数更新进行本地模型质量评估,根据评估结果设计模型鲁棒聚合规则和模型效益公平分配规则,根据所述模型鲁棒聚合规则进行模型聚合,根据所述模型效益公平分配规则进行效益分配;
联邦学习服务器根据本地模型质量评估对无人机进行动态声誉管理。
进一步地,所述基于契约理论设计针对不同类型无人机的最优契约,具体为:
根据无人机的不同类型建立契约模型;
根据所述契约模型界定用户效用函数;
根据所述用户效用函数,利用契约理论设计所述最优契约。
进一步地,所述契约模型具体为:
式中,是每个全局训练轮的最大等待时间;ζk是分配给参与的无人机的模型收益的比例;为一系列数据-价格契约菜单,Ωj,k=(sj,k,pj,k)是对类型j的无人机契约项,sj,k为训练数据大小,pj,k为价格奖励;
所述根据所述契约模型界定用户效用函数,具体为:
类型j的无人机选择契约项Ωj,k的效用函数为收益与成本之差:
联邦学习任务k的发布者的效用函数如下:
式中,λs是满意度系数;Ij是类型j的无人机数量;是无人机j的声誉值;qj,k是无人机j的数据质量;求和式内第一项是与训练样本数量成对数函数关系的用户满意度,第二项是支付给所有参与训练的无人机的总费用;二进制变量和分别表示:
所述根据所述用户效用函数,利用契约理论设计所述最优契约,具体为:
最优契约设计问题为最大化联邦学习任务发布者的效用函数,同时对不同类型的无人机满足个人理性约束和激励相容约束;
将所述最优契约设计问题简化得到松弛的最优契约设计问题,求解所述松弛的最优契约设计问题得到数据-价格契约的最优松弛解;
对所述数据-价格契约的最优松弛解进行动态指派,得到最优契约设计问题的最优解,完成所述最优契约的设计。
进一步地,所述数据-价格契约的最优松弛解为:
进一步地,所述动态指派,具体为:
进一步地,所述将所述本地模型参数更新传输至联邦学习服务器,具体为:
在5G异构网络下,无人机i计算与基站的信道信噪比状态,智能选择U2C或U2U通信模式,本地模型参数更新的无线传输时间为:
式中,zi={0,1}表示无人机i的U2C或U2U通信模式选择变量,zi=1表示无人机i处于U2C传输模式,zi=0表示无人机i选择U2U传输模式;是无人机i本地模型参数更新的大小;i′是无人机i附近的运行在U2C模式的协作无人机的索引。
进一步地,所述联邦学习服务器对接收的所述本地模型参数更新进行本地模型质量评估,具体为:
进一步地,所述根据评估结果设计模型鲁棒聚合规则和模型效益公平分配规则,具体如下:
基于本地模型质量评估结果计算轮贡献指数,根据所述轮贡献指数设计模型鲁棒聚合规则;
根据所述轮贡献指数,计算得到综合贡献指数,根据所述综合贡献指数设计模型效益公平分配规则;
所述根据所述轮贡献指数设计模型鲁棒聚合规则,具体为:
所述根据所述综合贡献指数设计模型效益公平分配规则,具体为:
进一步地,所述联邦学习服务器根据本地模型质量评估对无人机进行动态声誉管理,具体为:
根据无人机在联邦学习任务中的轮贡献指数,基于逻辑斯谛函数模型建立得到无人机声誉模型;
基于迭代方法,在每个时隙动态更新所述无人机声誉模型中的声誉参数。
进一步地,所述基于迭代方法,在每个时隙动态更新所述无人机声誉模型中的声誉参数,具体为:
对于参与模型训练的无人机,当其模型贡献高于或等于平均值时,其声誉参数更新为:
对于参与模型训练的无人机,当其模型贡献低于平均值时,其声誉参数更新为:
对于不参与模型训练的无人机,其声誉参数更新为:
式中,μ1和μ2为衰减系数;ΔR0是对自私无人机的非参与行为的声誉惩罚;ΔR1是对模型贡献高于或等于平均值的无人机的声誉奖励;ΔR2是对模型贡献低于平均值的无人机的声誉惩罚。
与现有技术相比,本发明至少具有以下有益效果:
(1)与现有主流的中心化机器学习方式相比,本发明基于联邦学习架构,无人机感知数据保留在本地设备,无人机只需要周期性地发送从本地数据训练得到本地模型参数更新至联邦学习服务器进行全局模型聚合,实现了无人机的分布式感知数据共享与协作式模型训练,解决了现有无人机群感知数据共享方式存在的隐私数据泄露的技术问题。
(2)本发明提出了基于契约理论的无人机最优契约设计方法,针对无人机差异化的数据成本、传输时间和数据质量,提供精准的用户参与激励,在最大化联邦学习任务发布者效用的同时满足个人理性和激励相容性,以激励无人机用户的参与和高质量模型训练。
(3)本发明提出了5G异构网络中基于信道信噪比状态的本地模型参数更新传输模式选择方法,无人机通过在5G异构网络中智能选择U2C或U2U通信模式传输本地模型参数更新,从而降低数据传输延迟和保证网络服务质量,提高了联邦学习中的通信效率。
(4)本发明提出了基于质量评估的全局模型聚合与模型效益分配方法,在存在拜占庭攻击和搭便车攻击的情况下,通过本地模型质量评估结果计算用户贡献,实现模型鲁棒聚合和模型效益公平分配,提高了联邦学习的鲁棒性。
(5)本发明提出了基于迭代的无人机动态声誉参数更新方法,通过历史训练数据动态评估无人机的声誉值,从而激励无人机的诚实行为并抑制其恶意行为,增强了联邦学习中参与者的可靠性。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式中的技术方案,下面将对具体实施方式描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为5G异构网络中基于联邦学习的无人机群感知数据安全共享方法流程图;
图2为5G异构网络中网络通信模型图;
图3为最优数据-价格契约设计图;
图4为5G异构网络中联邦学习流程图;
图5为无人机通信模式选择流程图;
图6为无人机动态声誉管理流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
作为本发明的某一具体实施方式,如图1所示,本发明一种基于联邦学习的无人机群感知数据安全共享方法,具体包括以下步骤:
步骤1、基于契约理论设计针对不同类型无人机的最优契约,以激励无人机参与联邦学习。
作为优选的实施方式,基于契约理论设计针对不同类型无人机的最优契约,具体包括:
步骤1.1、根据无人机的不同类型建立契约模型;
具体地说,契约模型具体为:
式中,是每个全局训练轮的最大等待时间;ζk是分配给参与的无人机的模型收益的比例;为一系列数据-价格契约菜单,Ωj,k=(sj,k,pj,k)是对类型j的无人机契约项,sj,k为类型j的无人机用于联邦学习任务k的训练数据大小(即感知数据样本的数量),pj,k为价格奖励;另外,对无法按规定时间完成本地模型参数更新传输的无人机实行零支付机制,任务k的全局训练轮数为
更为具体地,基于5G异构网络和边缘计算的无人机群感知网络如图2所示,包括一个大基站,M个小基站,I个无人机。小基站和无人机均在大基站的覆盖范围内,其集合分别为和小基站通过高速有线链路与大基站相连接。每个无人机都安装有先进的传感器(如相机、温度计和GPS等)用于环境感知与空中数据采集。在联邦学习中,无人机只需根据下载的全局模型发送从本地数据训练得到本地模型参数更新,联邦学习服务器将所有无人机的本地模型参数更新进行聚合得到全局模型,然后再发送给无人机进行下一轮训练直到模型达到理想的精确度。每个联邦学习任务k可表述为一个五元组其中是初始化的机器学习模型,Tk是任务k的存活时间,为参与任务的无人机的声誉阈值,εk∈(0,1]为所需的模型精确度,(Xk,Yk)为任务k的感知区域。无人机差异化的感知能力和计算能力导致无人机在收集和训练合格的感知数据的成本不一,采用边际数据使用成本ci来刻画无人机在联邦学习中的异质性;基于无人机的边际数据使用成本将无人机分为J个类型,即当无人机的成本cj落入第j个成本类型时,指代其为类型j的无人机;令cmin和cmax分别为成本类型的上下界,因此有0<cmin<c1<…<cJ<cmax。
步骤1.2、根据契约模型界定用户效用函数;
具体地说,本发明中根据契约模型界定用户效用函数,具体为:
类型j的无人机选择契约项Ωj,k的效用函数为收益与成本之差:
联邦学习任务k的发布者的效用函数如下:
式中,λs是满意度系数,Ij是类型j的无人机数量,是无人机j的声誉值,qj,k是无人机j的数据质量;求和式内第一项是与训练样本数量成对数函数关系的用户满意度,第二项是支付给所有参与训练的无人机的总费用;二进制变量和βj,k分别表示:
步骤1.3、根据用户效用函数,利用契约理论设计最优契约;
具体地说,如图3所示,本发明中根据用户效用函数,利用契约理论设计最优契约,具体包括:
步骤1.3.1、最优契约设计问题为最大化联邦学习任务发布者的效用函数,同时对不同类型的无人机满足个人理性约束和激励相容约束;
个人理性约束和激励相容约束定义为:
定义1:个人理性约束,当且仅当每个类型j的无人机真实地选择为其类型制定的契约项Ωj,k=(sj,k,pj,k)时的效用不为负,则满足个人理性约束,即:
定义2:激励相容约束,当且仅当每个类型j的无人机真实地选择为其类型制定的契约项Ωj,k=(sj,k,pj,k)时的效用最大,则满足激励相容约束,即:
最优契约设计问题为如下问题1:
其中C1为训练数据样本量的上下界约束,C2为J个个人理性约束,C3为J(J-1)个激励相容约束。定义为任务k的第n次全局训练轮中参与模型训练的无人机类型的集合,其中另外,集合中无人机类型可重新排列为:
步骤1.3.2、将最优契约设计问题简化得到松弛的最优契约设计问题,求解松弛的最优契约设计问题得到数据-价格契约的最优松弛解;
通过对个人理性约束和激励相容约束进行简化,问题1可以转化为如下问题2:
为求解问题2中的最优契约,首先考虑没有单调性约束C4的问题2的松弛问题,然后再验证所得的松弛的最优解是否满足单调性约束C4;
问题2的松弛问题可转换为如下问题3:
求解问题3,可得数据-价格契约的最优松弛解。
优选的,数据-价格契约的最优松弛解为:
步骤1.3.3、对数据-价格契约的最优松弛解进行动态指派,得到最优契约设计问题的最优解,完成最优契约的设计;
本实施方式中,动态指派具体如下:
步骤2、无人机根据自身类型选择最优契约进行本地模型训练得到本地模型参数更新,并将本地模型参数更新传输至联邦学习服务器。
其次,令l←l+1;
重复上述步骤,直到达到最大本地训练次数,即l=Θk。
作为优选的实施方式,将本地模型参数更新传输至联邦学习服务器,具体为:
如图5所示,在5G异构网络下,在每个时隙t,无人机i计算与基站的信道信噪比状态,智能选择U2C(UAV-to-Cellular)或U2U(UAV-to-UAV)通信模式来与基站传输数据,具体为:
当无人机i的U2C信道的信噪比大于或等于阈值γth时,直接通过U2C通信链路将本地模型参数更新上传到大基站上的联邦学习服务器;
当U2C直连链路的信噪比较低时,很难提供高数据速率来支持U2C链路的及时数据传输。因此,当无人机i的U2C信道的信噪比低于阈值γth时,使用U2U通信方式,将数据传输到运行在U2C通信模型的相邻无人机。然后,通过该中继无人机将数据传送到联邦学习服务器。
本地模型参数更新的无线传输时间为:
式中,zi=(0,1}表示无人机i的U2C或U2U通信模式选择变量,zi=1表示无人机i处于U2C传输模式,zi=0表示无人机i选择U2U传输模式;是无人机i本地模型参数更新的大小;i′是无人机i附近的运行在U2C模式的协作无人机的索引。
U2U信道的统计模型被定义为视距传输主导的衰落信道,无人机i与无人机j在时隙t的数据传输速率为:
步骤3、联邦学习服务器对接收的本地模型参数更新进行本地模型质量评估,根据评估结果设计模型鲁棒聚合规则和模型效益公平分配规则,根据模型鲁棒聚合规则进行模型聚合,根据模型效益公平分配规则进行效益分配。
作为优选的实施方式,联邦学习服务器对接收的本地模型参数更新进行本地模型质量评估,具体为:
作为优选的实施方式,根据评估结果设计模型鲁棒聚合规则和模型效益公平分配规则,具体如下:
基于本地模型质量评估结果计算轮贡献指数,根据轮贡献指数设计模型鲁棒聚合规则;
具体地说,根据轮贡献指数设计模型鲁棒聚合规则,具体为:
根据轮贡献指数,计算得到综合贡献指数,根据综合贡献指数设计模型效益公平分配规则;
具体地说,根据综合贡献指数设计模型效益公平分配规则,具体为:
步骤4、联邦学习服务器根据本地模型质量评估对无人机进行动态声誉管理。
作为优选的实施方式,联邦学习服务器根据本地模型质量评估对无人机进行动态声誉管理,具体为:
根据无人机在联邦学习任务中的轮贡献指数,基于逻辑斯谛函数模型建立得到无人机声誉模型;
基于迭代方法,在每个时隙动态更新无人机声誉模型中的声誉参数。
优选的,根据无人机在联邦学习任务中的轮贡献指数,基于逻辑斯谛函数模型建立得到无人机声誉模型,具体为:
在联邦学习任务中,当观察到无人机做出一系列较高的模型贡献后,它的声誉会缓慢增长。同时,如果无人机提供了如无意义的、冗余的或者错误的模型参数更新,它的声誉将下降相当大的量。基于逻辑斯谛函数模型来描述无人机行为与声誉值的变化关系:
一方面,由于最近的学习记录比过去的记录更为重要,因此在声誉更新中最新的学习记录需要赋以更高的权重。另一方面,由于无人机可以执行不同的行为,因此不同行为模式下无人机声誉增长率与下降率应当不同。根据无人机的参与行为和训练行为可对其进行分类,同时整合历史模型训练记录中的行为效应和时间衰减效应,从而估计无人机的声誉更新:
式中,μ1和μ2为衰减系数;ΔR0是对自私无人机的非参与行为的声誉惩罚;ΔR1是对模型贡献高于或等于平均值的无人机的声誉奖励;ΔR2是对模型贡献低于平均值的无人机的声誉惩罚。
优选的,如图6所示,基于迭代方法,在每个时隙动态更新无人机声誉模型中的声誉参数,具体为:
对于参与模型训练的无人机,当其模型贡献高于或等于平均值时,其声誉参数更新为:
对于参与模型训练的无人机,当其模型贡献低于平均值时,其声誉参数更新为:
对于不参与模型训练的无人机,其声誉参数更新为:
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (8)
1.一种基于联邦学习的无人机群感知数据安全共享方法,其特征在于,包括:
基于契约理论设计针对不同类型无人机的最优契约,以激励无人机参与联邦学习;
无人机根据自身类型选择最优契约进行本地模型训练得到本地模型参数更新,并将所述本地模型参数更新传输至联邦学习服务器;
联邦学习服务器对接收的所述本地模型参数更新进行本地模型质量评估,根据评估结果设计模型鲁棒聚合规则和模型效益公平分配规则,根据所述模型鲁棒聚合规则进行模型聚合,根据所述模型效益公平分配规则进行效益分配;
联邦学习服务器根据本地模型质量评估对无人机进行动态声誉管理;
所述基于契约理论设计针对不同类型无人机的最优契约,具体为:
根据无人机的不同类型建立契约模型;
根据所述契约模型界定用户效用函数;
根据所述用户效用函数,利用契约理论设计所述最优契约;
所述契约模型具体为:
式中,是每个全局训练轮的最大等待时间;ζk是分配给参与的无人机的模型收益的比例;为一系列数据-价格契约菜单,Ωj,k=(sj,k,pj,k)是对类型j的无人机契约项,sj,k为训练数据大小,pj,k为价格奖励;
所述根据所述契约模型界定用户效用函数,具体为:
类型j的无人机选择契约项Ωj,k的效用函数为收益与成本之差:
联邦学习任务k的发布者的效用函数如下:
式中,λs是满意度系数;Ij是类型j的无人机数量;是类型j的无人机的声誉值;qj,k是类型j的无人机的数据质量;求和式内第一项是与训练样本数量成对数函数关系的用户满意度,第二项是支付给所有参与训练的无人机的总费用;二进制变量和βj,k分别表示:
所述根据所述用户效用函数,利用契约理论设计所述最优契约,具体为:
最优契约设计问题为最大化联邦学习任务发布者的效用函数,同时对不同类型的无人机满足个人理性约束和激励相容约束;
将所述最优契约设计问题简化得到松弛的最优契约设计问题,求解所述松弛的最优契约设计问题得到数据-价格契约的最优松弛解;
对所述数据-价格契约的最优松弛解进行动态指派,得到最优契约设计问题的最优解,完成所述最优契约的设计。
6.根据权利要求5所述的一种基于联邦学习的无人机群感知数据安全共享方法,其特征在于,所述根据评估结果设计模型鲁棒聚合规则和模型效益公平分配规则,具体如下:
基于本地模型质量评估结果计算轮贡献指数,根据所述轮贡献指数设计模型鲁棒聚合规则;
根据所述轮贡献指数,计算得到综合贡献指数,根据所述综合贡献指数设计模型效益公平分配规则;
所述根据所述轮贡献指数设计模型鲁棒聚合规则,具体为:
所述根据所述综合贡献指数设计模型效益公平分配规则,具体为:
7.根据权利要求6所述的一种基于联邦学习的无人机群感知数据安全共享方法,其特征在于,所述联邦学习服务器根据本地模型质量评估对无人机进行动态声誉管理,具体为:
根据无人机在联邦学习任务中的轮贡献指数,基于逻辑斯谛函数模型建立得到无人机声誉模型;
基于迭代方法,在每个时隙动态更新所述无人机声誉模型中的声誉参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110512015.6A CN113268920B (zh) | 2021-05-11 | 2021-05-11 | 一种基于联邦学习的无人机群感知数据安全共享方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110512015.6A CN113268920B (zh) | 2021-05-11 | 2021-05-11 | 一种基于联邦学习的无人机群感知数据安全共享方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113268920A CN113268920A (zh) | 2021-08-17 |
CN113268920B true CN113268920B (zh) | 2022-12-09 |
Family
ID=77230401
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110512015.6A Active CN113268920B (zh) | 2021-05-11 | 2021-05-11 | 一种基于联邦学习的无人机群感知数据安全共享方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113268920B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113992692B (zh) * | 2021-10-27 | 2022-09-06 | 天津大学 | 端边云架构和不完全信息下分层联邦学习的方法及系统 |
CN114219094B (zh) * | 2021-11-10 | 2024-03-19 | 华南理工大学 | 基于多任务联邦学习的通信成本和模型鲁棒性优化方法 |
CN114302422B (zh) * | 2021-11-29 | 2024-06-18 | 北京邮电大学 | 利用学习模型进行业务处理的方法以及装置 |
WO2023221059A1 (zh) * | 2022-05-19 | 2023-11-23 | Oppo广东移动通信有限公司 | 无线通信方法、装置、设备、存储介质及程序产品 |
CN114998251B (zh) * | 2022-05-30 | 2024-09-03 | 天津理工大学 | 一种基于联邦学习的空中多视觉平台地面异常检测方法 |
CN115865937A (zh) * | 2022-10-10 | 2023-03-28 | 西北工业大学 | 一种基于分布式激励机制降低空地网络计算能耗的方法及系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107450577A (zh) * | 2017-07-25 | 2017-12-08 | 天津大学 | 基于多传感器的无人机智能感知系统和方法 |
CN110363305B (zh) * | 2019-07-17 | 2023-09-26 | 深圳前海微众银行股份有限公司 | 联邦学习方法、系统、终端设备及存储介质 |
CN112367109B (zh) * | 2020-09-28 | 2022-02-01 | 西北工业大学 | 空地网络中由数字孪生驱动的联邦学习的激励方法 |
CN112132293A (zh) * | 2020-09-30 | 2020-12-25 | 腾讯科技(深圳)有限公司 | 纵向联邦学习中的计算方法、装置、设备及介质 |
CN112668726B (zh) * | 2020-12-25 | 2023-07-11 | 中山大学 | 一种高效通信且保护隐私的个性化联邦学习方法 |
-
2021
- 2021-05-11 CN CN202110512015.6A patent/CN113268920B/zh active Active
Non-Patent Citations (2)
Title |
---|
基于关系契约视角的建设项目激励问题动态博弈分析;笪可宁等;《沈阳建筑大学学报(社会科学版)》;20130715(第03期);全文 * |
声誉效应与经理报酬契约的关系研究;张勇等;《数学的实践与认识》;20041225(第12期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113268920A (zh) | 2021-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113268920B (zh) | 一种基于联邦学习的无人机群感知数据安全共享方法 | |
Zhan et al. | A learning-based incentive mechanism for federated learning | |
CN112367109B (zh) | 空地网络中由数字孪生驱动的联邦学习的激励方法 | |
CN108055119B (zh) | 一种群智感知应用中基于区块链的安全激励方法和系统 | |
Liu et al. | An incentive mechanism for privacy-preserving crowdsensing via deep reinforcement learning | |
Xu et al. | Incentive mechanism for multiple cooperative tasks with compatible users in mobile crowd sensing via online communities | |
Liu et al. | DeePGA: A privacy-preserving data aggregation game in crowdsensing via deep reinforcement learning | |
Asheralieva et al. | Learning-based mobile edge computing resource management to support public blockchain networks | |
Wang et al. | Mobile crowdsourcing task allocation with differential-and-distortion geo-obfuscation | |
CN107301509A (zh) | 一种基于群智感知系统面向随机参与的群智感知激励方法 | |
Chen et al. | An approach of flow compensation incentive based on Q-learning strategy for IoT user privacy protection | |
Jin et al. | Data-driven pricing for sensing effort elicitation in mobile crowd sensing systems | |
Di et al. | Collaborative smartphone sensing using overlapping coalition formation games | |
Xu et al. | Mobile crowd sensing via online communities: Incentive mechanisms for multiple cooperative tasks | |
CN116306910B (zh) | 一种基于联邦节点贡献的公平性隐私计算方法 | |
Sun et al. | Heterogeneous-belief based incentive schemes for crowd sensing in mobile social networks | |
Su et al. | A stackelberg differential game based bandwidth allocation in satellite communication network | |
Xiao et al. | Incentive mechanism design for federated learning: A two-stage stackelberg game approach | |
CN112668877A (zh) | 结合联邦学习和强化学习的事物资源信息分配方法及系统 | |
CN114301935A (zh) | 一种基于声誉的物联网边云协同联邦学习节点选择方法 | |
CN116582568A (zh) | 工业物联网中时效性感知的联邦学习参与设备激励方法 | |
Xu et al. | Basic: Distributed task assignment with auction incentive in uav-enabled crowdsensing system | |
Zhang et al. | A reputation-based and privacy-preserving incentive scheme for mobile crowd sensing: A deep reinforcement learning approach | |
CN117454427A (zh) | 面向隐私保护的去中心化联邦学习激励方法 | |
Ren et al. | Quality utilization aware based data gathering for vehicular communication networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |