CN113379294A - 基于面向联邦学习参与用户拍卖激励机制的任务部署方法 - Google Patents

基于面向联邦学习参与用户拍卖激励机制的任务部署方法 Download PDF

Info

Publication number
CN113379294A
CN113379294A CN202110717552.4A CN202110717552A CN113379294A CN 113379294 A CN113379294 A CN 113379294A CN 202110717552 A CN202110717552 A CN 202110717552A CN 113379294 A CN113379294 A CN 113379294A
Authority
CN
China
Prior art keywords
user
training
communication
bidding
bid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110717552.4A
Other languages
English (en)
Other versions
CN113379294B (zh
Inventor
周睿婷
庞金龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN202110717552.4A priority Critical patent/CN113379294B/zh
Publication of CN113379294A publication Critical patent/CN113379294A/zh
Application granted granted Critical
Publication of CN113379294B publication Critical patent/CN113379294B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/08Auctions

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Software Systems (AREA)
  • Marketing (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于面向联邦学习参与用户拍卖激励机制的任务部署方法,能够在联邦学习任务通信次数未知的情况下,对预参与联邦学习任务训练的用户进行选择和部署,以达到总社会成本最小化目的同时尽可能减小联邦学习任务的通信次数。联邦学习平台运营商根据本发明可以进行挑选出合适的用户并进行部署,以谋得最小化成本。本发明结合了线性规划建模。经典的拍卖理论(Auction)和贪心算法等,从理论上证明了其有效性和合理性。本发明能够在不需要知道单个联邦学习任务的完成通信次数情况下,趋向最优地对用户进行选择和部署,达到让满足联邦学习任务训练地同时最小化总成本。

Description

基于面向联邦学习参与用户拍卖激励机制的任务部署方法
技术领域
本发明涉及联邦学习技术领域,具体涉及一种基于面向联邦学习参与用户拍卖激励机制的任务部署方法。
背景技术
联邦学习需要选取一定数量移动设备(用户)作为计算节点来参与联邦学习任务训练。当下,联邦学习选取移动设备(用户)的方式一般为随机选取,完全是处于一种理想状态下进行对移动设备(用户)的选取。但是这种选择方式不适合于真正的联邦学习用户,原因如下:首先,不同移动设备(用户)参与联邦学习任务训练并非出于自愿。移动设备(用户)参与联邦学习训练需要消耗移动设备电量和占用移动设备一部分的时间。因此,移动设备(用户)会索要一定数量的金钱。其次,移动设备(用户)有自身的时间安排,即不一定能全程参与到联邦学习任务训练当中。这会影响联邦学习任务的训练。
从一个联邦学习平台运营商的角度出发,假设他有一个联邦学习任务需要训练。联邦学习平台运营商首先向所有的平台用户发布任务的信息。用户接收到任务信息并向联邦学习平台运营商提供竞价信息,以及指定的局部联邦学习任务训练精度、可参与的总训练次数和可参与执行任务的时间范围。即使是不考虑用户联邦学习训练精度的前提下,对用户进行选择和部署已经是一个NP-hard问题。如果考虑一个更实际的情况,每个用户指定了联邦学习任务训练精度(现实中这些信息与移动设备相关,一般需要指定),要求联邦学习平台运营商考虑联邦学习任务的通信成本和计算成本的平衡问题,问题将会变得更加复杂。
由此可知,现有技术中联邦学习任务部署的实现较为复杂。
发明内容
有鉴于此,本发明提供了一种基于面向联邦学习参与用户拍卖激励机制的任务部署方法,用以解决或者至少部分解决现有技术中的联邦学习任务部署的实现较为复杂的技术问题。
本发明提供了一种基于面向联邦学习参与用户拍卖激励机制的任务部署方法,包括:
步骤S1:联邦学习平台运营商向所有的平台用户发布任务信息;
步骤S2:接收用户基于任务信息后提交的用户信息,用户信息包括竞价信息、指定的局部联邦学习任务训练精度、可参与的总训练次数以及可参与执行任务的时间范围;
步骤S3:联邦学习平台运营商采用整数规划对联邦学习任务部署进行建模,以最小化竞价价格为目标,并构建约束条件;
步骤S4:根据训练精度和通信次数的关系计算通信次数的范围,根据不同的通信次数,挑选出能满足联邦学习训练条件的竞价信息并将步骤S3中的整数规划问题分解成一系列的决定胜者问题,再依次计算不同固定的通信次数下的决定胜者问题的总社会成本,其中,总社会成本为所有已选择用户竞价的竞价价格的总和,决定胜者问题中满足该问题的约束条件的集合为竞价候选集合;
步骤S5:将上述固定通信次数下的决定胜者问题重新构造,得到对应的松弛整数约束下的对偶问题,对偶问题包括决策变量;
步骤S6:计算每个用户竞价添加之后的有效增加的参与完成训练次数,基于有效增加的参与完成训练次数计算每个用户竞价的有效平均成本,基于经典的贪心算法框架从竞价候选集合选择当前最低有效平均成本的用户竞价,同时更新决策变量,更新已选胜者集合和剩余可选竞价集合,其中,已选胜者集合为记录有当前已选择的用户的竞价集合,剩余可选竞价集合为去除已选择的和不满足条件的用户竞价之后的剩余可以选择的用户竞价集合;
步骤S7:根据有效平均成本计算被选中的用户竞价的报酬;
步骤S8:判断目前已选的用户竞价是否满足联邦学习任务每个阶段的参与用户需求,如果没有满足,则返回步骤S6继续进行用户竞价的选择,如果已经满足,则执行步骤S9;
步骤S9:记录每个已选择的用户竞价的报酬和部署安排,并计算对应的决定胜者问题的总社会成本。
在一种实施方式中,在步骤S9之后,所述方法还包括:
判断通信次数的范围内所有通信次数的总社会成本是否都已获得;
如果不是都已获得,则返回步骤S5,否则对比所有已计算的通信次数下决定胜者问题的总社会成本,选择对应最小总社会成本的通信次数作为最终值,同时告知用户任务部署安排和报酬。
在一种实施方式中,步骤S3具体包括:
采用整数规划对联邦学习任务部署问题进行建模,其中目标函数为:
Figure BDA0003135497180000031
约束条件包括(1a)~(1h):
Figure BDA0003135497180000032
Figure BDA0003135497180000033
Figure BDA0003135497180000034
Figure BDA0003135497180000035
Figure BDA0003135497180000036
Figure BDA0003135497180000037
Figure BDA0003135497180000038
Tg∈{1,2,...,T}. (1h)
其中,约束(1a)用以保证所有需训练的通信阶段的参与训练用户个数不小于K,其中未知变量yi(t)表示被选择的用户是否被安排在第t个通信阶段进行训练,即当yit为真时值为1,当yi(t)为假时值取0,
Figure BDA0003135497180000039
表示{1,2,...,Tg}范围内t的可选集合;约束条件(1b)用以保障所有已选择的用户竞价的训练精度能满足通信次数的要求,其中未知变量xij表示用户竞价是否被选择,即当xij为真时值为1,当xij为假时值取0,
Figure BDA00031354971800000310
表示{1,2,...,I}范围内所有用户i的可选集合,
Figure BDA00031354971800000312
表示{1,2,...,J}范围内所有用户竞价j的可选集合;约束条件(1c)用以保障被选择用户的总安排训练次数等于可执行的总通信次数;约束条件(1d)用以保证当前选择的用户竞价单个通信阶段所需要的总时间不超过单个通信阶段的时隙tmax,其中,
Figure BDA0003135497180000041
表示总计算时间,Tlij)表示训练精度为θij下的局部训练次数且与训练精度有如下关系:Tlij)=η·log(1/θij),
Figure BDA0003135497180000042
表示单个局部训练所需要的计算时间,
Figure BDA0003135497180000043
表示单个通信阶段所需要的通信时间,η表示一个常数型系数;约束条件(1e)表示变量xij和变量yi(t)之间的约束关系,即当且仅当用户竞价被选择时,才能被联邦学习平台运营商在其可执行通信阶段范围内部署训练;约束条件(1f)表示每个用户至多只能有一个竞价被选择;约束条件(1g)用以保障变量xij、变量yi(t)的取值为0和1;(1h)用以保证变量Tg的取值在1和T范围内。
在一种实施方式中,步骤S4具体包括:
S4.1:根据公式(2)计算出通信次数的具体范围,
Figure BDA0003135497180000044
其中,
Figure BDA0003135497180000045
表示固定全局训练精度ε的计算上界,θmax表示所有已选择用户的最大局部训练精度;
S4.2:利用(2)关系公式,通过计算所有用户的提交竞价的最小局部精度θmin计算出通信次数的初始化最小值T0,得到更精准的通信次数范围[T0,T],通过排除一部分不满足对应通信次数
Figure BDA0003135497180000046
下的局部训练精度条件的竞价,从而挑选出合格的满足上述约束(1b)和约束(1d)的竞价候选集合
Figure BDA0003135497180000047
Figure BDA0003135497180000048
其中
Figure BDA0003135497180000049
表示用户i的第j个竞价在单个通信阶段内所需要的总时间;
S4.3:基于挑选出的合格的竞价候选集合
Figure BDA00031354971800000410
得出一系列决定胜者问题,描述如下:
Figure BDA0003135497180000051
subject to:
Figure BDA0003135497180000052
Figure BDA0003135497180000053
Figure BDA0003135497180000054
Figure BDA0003135497180000055
Figure BDA0003135497180000056
在一种实施方式中,步骤S5具体包括:
S5.1:将公式(4)中的两个决策变量xij和yi(t)进行合并并用一个新的决策变量来表示zil来表示,其中下标l表示具体的竞价和其对应的部署方案,重构后的决定胜者问题描述为:
Figure BDA0003135497180000057
subject to:
Figure BDA0003135497180000058
Figure BDA0003135497180000059
Figure BDA00031354971800000510
其中,变量ρil表示用户i的部署方案l所对应的竞价价格
Figure BDA00031354971800000511
约束条件(5a)等同于约束条件(1a),用以保证所有需训练的通信阶段的参与训练用户个数不小于K,约束条件等同于约束条件(1f),用以表示每个用户至多只能有一个竞价被选择;
S5.2:对上述的决定胜者问题(5)进行对偶化,松弛整数约束下的对偶问题描述为:
Figure BDA0003135497180000061
subject to:
Figure BDA0003135497180000062
Figure BDA00031354971800000618
其中g(t),λil,qi分别为约束条件(5a)、(5b)和(5c)所对应的对偶变量,约束条件(6a)和(6b)用于约束对偶变量的取值范围。
在一种实施方式中,步骤S6包括:
S6.1:利用公式(7)计算每个用户竞价添加之后的有效增加的参与完成训练次数:
Figure BDA0003135497180000064
其中,
Figure BDA0003135497180000065
Figure BDA00031354971800000619
Figure BDA0003135497180000067
表示当前所有已选择用户竞价及其对应部署方案的集合;
Figure BDA0003135497180000068
表示当前
Figure BDA0003135497180000069
集合和(i,l)的并集;
Figure BDA00031354971800000610
表示
Figure BDA00031354971800000611
的总有效参与完成训练次数;
Figure BDA00031354971800000612
表示
Figure BDA00031354971800000613
的总有效参与完成训练次数;
Figure BDA00031354971800000614
表示当前
Figure BDA00031354971800000615
集合所有已选择用户被部署在第t个通信阶段训练的总数量;
Figure BDA00031354971800000616
表示当前
Figure BDA00031354971800000617
集合和(i,l)的并集中所有已选择用户被部署在第t个通信阶段训练的总数量;
S6.2:根据上述计算的每个用户竞价添加之后的有效增加的参与完成训练次数,计算出每个用户竞价的有效平均成本,其中,有效平均成为:
Figure BDA0003135497180000071
通过对比得出当前最低有效平均成本对应的部署方案(i*,l*),计算公式描述为:
Figure BDA0003135497180000072
其叶
Figure BDA0003135497180000073
表示当前剩余的可选用户竞价集合,
Figure BDA0003135497180000074
表示用户i的第l个部署所对应第j竞价的价格,
Figure BDA0003135497180000075
代表用户i的第l个部署所对应第j竞价添加之后的有效增加的参与完成训练次数;
S6.3:基于经典的贪心算法框架从竞价候选集合选择当前最低有效平均成本的用户竞价,得到部署方案(i*,l*),更新对应的决策变量
Figure BDA00031354971800000713
为1,同时更新
Figure BDA0003135497180000076
集合为
Figure BDA0003135497180000077
和(i*,l*)的并集,其中,为保证满足约束条件(1f),可选集合
Figure BDA0003135497180000078
将去除当前被选择用户i*的所有竞价。
在一种实施方式中,步骤S7包括:
S7.1:找出次最低有效平均成本的用户竞价(i′,l′),计算公式描述为:
Figure BDA0003135497180000079
S7.2:计算用户i*的报酬,计算公式描述为:
Figure BDA00031354971800000710
其中
Figure BDA00031354971800000711
代表用户竞价(i′,l′)的有效平均成本,
Figure BDA00031354971800000712
表示用户竞价(i*,l*)被拟添加到S集合后可实际增加的参与完成训练次数。
本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:
本发明公开的基于面向联邦学习参与用户拍卖激励机制的任务部署方法,能够在联邦学习任务通信次数未知的情况下,对预参与联邦学习任务训练的用户进行选择和部署,以达到总社会成本最小化目的同时尽可能减小联邦学习任务的通信次数。联邦学习平台运营商根据本发明可以进行挑选出合适的用户并进行部署,以谋得最小化成本。
进一步地,本发明结合了线性规划建模。经典的拍卖理论(Auction)和贪心算法等,从理论上证明了其有效性和合理性。本发明能够在不需要知道单个联邦学习任务的完成通信次数情况下,趋向最优地对用户进行选择和部署,达到让满足联邦学习任务训练地同时最小化总成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的概念流程图。
图2a和图2b是本发明实施例实验结果图。
图3a~3e是本发明实施例和其他现有算法结果的实验结果对比图。
具体实施方式
本发明的目的在于提供一种基于面向联邦学习参与用户拍卖激励机制的任务部署方法,用以改善现有技术中的联邦学习任务部署的实现较为复杂的技术问题。
为了解决上述技术问题,本发明的主要构思如下:
提供一种高效面向联邦学习参与用户的拍卖激励机制。用户接收到联邦学习平台发布的任务信息后,并联邦学习平台运营商提供竞价信息,以及指定的局部联邦学习任务训练精度、可参与的总训练次数和可参与执行任务的时间范围。联邦学习平台运营商通过算法来合理地选择参与用户,并将具体报酬和部署安排告知给用户。首先对问题进行建模(用线性规划来描述该问题),然后基于经典的贪心算法框架来选择和部署移动设备(用户)。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本实施例提供了基于面向联邦学习参与用户拍卖激励机制的任务部署方法,包括:
步骤S1:联邦学习平台运营商向所有的平台用户发布任务信息;
步骤S2:接收用户基于任务信息后提交的用户信息,用户信息包括竞价信息、指定的局部联邦学习任务训练精度、可参与的总训练次数以及可参与执行任务的时间范围;
步骤S3:联邦学习平台运营商采用整数规划对联邦学习任务部署进行建模,以最小化竞价价格为目标,并构建约束条件;
步骤S4:根据训练精度和通信次数的关系计算通信次数的范围,根据不同的通信次数,挑选出能满足联邦学习训练条件的竞价信息并将步骤S3中的整数规划问题分解成一系列的决定胜者问题,再依次计算不同固定的通信次数下的决定胜者问题的总社会成本,其中,总社会成本为所有已选择用户竞价的竞价价格的总和,决定胜者问题中满足该问题的约束条件的集合为竞价候选集合;
步骤S5:将上述固定通信次数下的决定胜者问题重新构造,得到对应的松弛整数约束下的对偶问题,对偶问题包括决策变量;
步骤S6:计算每个用户竞价添加之后的有效增加的参与完成训练次数,基于有效增加的参与完成训练次数计算每个用户竞价的有效平均成本,基于经典的贪心算法框架从竞价候选集合选择当前最低有效平均成本的用户竞价,同时更新决策变量,更新已选胜者集合和剩余可选竞价集合,其中,已选胜者集合为记录有当前已选择的用户的竞价集合,剩余可选竞价集合为去除已选择的和不满足条件的用户竞价之后的剩余可以选择的用户竞价集合;
步骤S7:根据有效平均成本计算被选中的用户竞价的报酬;
步骤S8:判断目前已选的用户竞价是否满足联邦学习任务每个阶段的参与用户需求,如果没有满足,则返回步骤S6继续进行用户竞价的选择,如果已经满足,则执行步骤S9;
步骤S9:记录每个已选择的用户竞价的报酬和部署安排,并计算对应的决定胜者问题的总社会成本。
具体来说,本发明采用的拍卖激励机制以及涉及的信息包括:一个联邦学习平台运营商需要训练一个联邦学习任务,其中任务的训练精度需要达到ε值且训练的通信次数不超过T。同时,每个通信阶段至少需要K个用户参与训练。有I个用户提交了其竞价信息给联邦学习平台运营商,其中每个用户提交了J种竞价方式:竞价价格bij;局部训练精度θij;可参与执行的通信阶段范围[aij,dij],(aij为起始通信阶段,dij为结束通信阶段);可执行的总通信次数cij。记用户i提交的第j种竞价的信息为Bij={bij,θij,[aij,dij],cij}。
联邦学习平台运营商在得到全部用户的竞价信息之后,开始为联邦学习任务选择和部署移动设备(用户),并将最终的拍卖结果、部署安排和报酬告知给用户。移动设备(用户)则依据联邦学习平台的个人部署方案来参与联邦学习任务训练。联邦学习平台运营商通过对用户的激励、选择和部署来平衡计算成本和通信成本,来使得总社会成本最小化。
请参见图1,本发明实施例提供的概念流程图,其中的相关参数包括步骤S6中的决策变量以及已选胜者集合和剩余可选竞价集合。
在一种实施方式中,步骤S3具体包括:
采用整数规划对联邦学习任务部署问题进行建模,其中目标函数为:
Figure BDA0003135497180000101
约束条件包括(1a)~(1h):
Figure BDA0003135497180000102
Figure BDA0003135497180000103
Figure BDA0003135497180000104
Figure BDA0003135497180000105
Figure BDA0003135497180000106
Figure BDA0003135497180000111
Figure BDA0003135497180000112
Tg∈{1,2,...,T}. (1h)
其中,约束(1a)用以保证所有需训练的通信阶段的参与训练用户个数不小于K,其中未知变量yi(t)表示被选择的用户是否被安排在第t个通信阶段进行训练,即当yit为真时值为1,当yi(t)为假时值取0,
Figure BDA0003135497180000113
表示{1,2,...,Tg}范围内t的可选集合;约束条件(1b)用以保障所有已选择的用户竞价的训练精度能满足通信次数的要求,其中未知变量xij表示用户竞价是否被选择,即当xij为真时值为1,当xij为假时值取0,
Figure BDA0003135497180000114
表示{1,2,...,I}范围内所有用户i的可选集合,
Figure BDA0003135497180000115
表示{1,2,...,J}范围内所有用户竞价j的可选集合;约束条件(1c)用以保障被选择用户的总安排训练次数等于可执行的总通信次数;约束条件(1d)用以保证当前选择的用户竞价单个通信阶段所需要的总时间不超过单个通信阶段的时隙tmax,其中,
Figure BDA0003135497180000116
表示总计算时间,Tlij)表示训练精度为θij下的局部训练次数且与训练精度有如下关系:Tlij)=η·log(1/θij),
Figure BDA0003135497180000117
表示单个局部训练所需要的计算时间,
Figure BDA0003135497180000118
表示单个通信阶段所需要的通信时间,η表示一个常数型系数;约束条件(1e)表示变量xij和变量yi(t)之间的约束关系,即当且仅当用户竞价被选择时,才能被联邦学习平台运营商在其可执行通信阶段范围内部署训练;约束条件(1f)表示每个用户至多只能有一个竞价被选择;约束条件(1g)用以保障变量xij、变量yi(t)的取值为0和1;(1h)用以保证变量Tg的取值在1和T范围内。
具体来说,本发明采用的拍卖激励机制的目的是,在满足真实性竞价和条件约束的情况下,对用户提交的竞价进行选择和部署),以最小化总社会成本。
在一种实施方式中,步骤S4具体包括:
S4.1:根据公式(2)计算出通信次数的具体范围,
Figure BDA0003135497180000121
其中,
Figure BDA0003135497180000122
表示固定全局训练精度ε的计算上界,θmax表示所有已选择用户的最大局部训练精度;
S4.2:利用(2)关系公式,通过计算所有用户的提交竞价的最小局部精度θmin计算出通信次数的初始化最小值T0,得到更精准的通信次数范围[T0,T],通过排除一部分不满足对应通信次数
Figure BDA0003135497180000123
下的局部训练精度条件的竞价,从而挑选出合格的满足上述约束(1b)和约束(1d)的竞价候选集合
Figure BDA0003135497180000124
Figure BDA0003135497180000125
其中
Figure BDA0003135497180000126
表示用户i的第j个竞价在单个通信阶段内所需要的总时间;
S4.3:基于挑选出的合格的竞价候选集合
Figure BDA0003135497180000127
得出一系列决定胜者问题,描述如下:
Figure BDA0003135497180000128
subject to:
Figure BDA0003135497180000129
Figure BDA00031354971800001210
Figure BDA00031354971800001211
Figure BDA00031354971800001212
Figure BDA00031354971800001213
具体实施过程中,为了减小计算复杂度,本发明反向利用(2)关系公式,通过计算所有用户的提交竞价的最小局部精度θmin来计算出通信次数的初始化最小值T0,其中
Figure BDA0003135497180000131
值,从而得出更精准的通信次数范围[T0,T]。因为在固定通信次数
Figure BDA0003135497180000132
下局部训练精度θ被限定了取值范围,因此需要排除一部分不满足对应通信次数
Figure BDA0003135497180000133
下的局部训练精度条件的竞价,从而挑选出合格的满足上述约束(1b)和约束(1d)的竞价候选集合
Figure BDA0003135497180000134
在一种实施方式中,步骤S5具体包括:
S5.1:将公式(4)中的两个决策变量xij和yi(t)进行合并并用一个新的决策变量来表示zil来表示,其中下标l表示具体的竞价和其对应的部署方案,重构后的决定胜者问题描述为:
Figure BDA0003135497180000135
subject to:
Figure BDA0003135497180000136
Figure BDA0003135497180000137
Figure BDA0003135497180000138
其中,变量ρil表示用户i的部署方案l所对应的竞价价格
Figure BDA0003135497180000139
约束条件(5a)等同于约束条件(1a),用以保证所有需训练的通信阶段的参与训练用户个数不小于K,约束条件等同于约束条件(1f),用以表示每个用户至多只能有一个竞价被选择;
S5.2:对上述的决定胜者问题(5)进行对偶化,松弛整数约束下的对偶问题描述为:
maximize
Figure BDA00031354971800001310
subject to:
Figure BDA0003135497180000141
Figure BDA0003135497180000142
其中g(t),λil,qi分别为约束条件(5a)、(5b)和(5c)所对应的对偶变量,约束条件(6a)和(6b)用于约束对偶变量的取值范围。
具体来说,步骤S5是将步骤S4中的固定通信次数下的决定胜者问题重新构造,并写出对应的松弛整数约束下的对偶问题。在得出上述的决定胜者的优化问题(4)后,通过将上述两个决策变量xij和yi(t)进行合并,并用一个新的决策变量zil来表示。
在一种实施方式中,步骤S6包括:
S6.1:利用公式(7)计算每个用户竞价添加之后的有效增加的参与完成训练次数:
Figure BDA0003135497180000143
其中,
Figure BDA0003135497180000144
Figure BDA00031354971800001417
Figure BDA00031354971800001418
表示当前所有已选择用户竞价及其对应部署方案的集合;
Figure BDA0003135497180000146
表示当前
Figure BDA0003135497180000147
集合和(i,l)的并集;
Figure BDA0003135497180000148
表示
Figure BDA0003135497180000149
的总有效参与完成训练次数;
Figure BDA00031354971800001410
表示
Figure BDA00031354971800001411
的总有效参与完成训练次数;
Figure BDA00031354971800001412
表示当前
Figure BDA00031354971800001413
集合所有已选择用户被部署在第t个通信阶段训练的总数量;
Figure BDA00031354971800001414
表示当前
Figure BDA00031354971800001415
集合和(i,l)的并集中所有已选择用户被部署在第t个通信阶段训练的总数量;
S6.2:根据上述计算的每个用户竞价添加之后的有效增加的参与完成训练次数,计算出每个用户竞价的有效平均成本,其中,有效平均成为:
Figure BDA00031354971800001416
通过对比得出当前最低有效平均成本对应的部署方案(i*,l*),计算公式描述为:
Figure BDA0003135497180000151
其中
Figure BDA0003135497180000152
表示当前剩余的可选用户竞价集合,
Figure BDA0003135497180000153
表示用户i的第l个部署所对应第j竞价的价格,
Figure BDA0003135497180000154
代表用户i的第l个部署所对应第j竞价添加之后的有效增加的参与完成训练次数;
S6.3:基于经典的贪心算法框架从竞价候选集合选择当前最低有效平均成本的用户竞价,得到部署方案(i*,l*),更新对应的决策变量
Figure BDA0003135497180000155
为1,同时更新
Figure BDA0003135497180000156
集合为
Figure BDA0003135497180000157
和(i*,l*)的并集,其中,为保证满足约束条件(1f),可选集合
Figure BDA0003135497180000158
将去除当前被选择用户i*的所有竞价。
具体来说,当计算初每个用户竞价添加之后的有效增加的参与完成训练次数后,则可以计算出每个用户竞价的有效平均成本,描述为:
Figure BDA00031354971800001513
在一种实施方式中,步骤S7包括:
S7.1:找出次最低有效平均成本的用户竞价(i′,l′),计算公式描述为:
Figure BDA0003135497180000159
S7.2:计算用户i*的报酬,计算公式描述为:
Figure BDA00031354971800001510
其中
Figure BDA00031354971800001511
代表用户竞价(i′,l′)的有效平均成本。
具体来说,为了给当前被选择用户竞价的一定的报酬同时保证报酬不小于用户竞价的价格,本发明以次最低有效平均成本来计算报酬。因此,首先需要找到次最低有效平均成本的用户竞价(i′,l′)。
Figure BDA00031354971800001512
表示用户竞价(i*,l*)被拟添加到S集合后可实际增加的参与完成训练次数。
在计算出被选中的用户竞价的报酬之后,执行步骤S8:判断目前已选的用户竞价是否满足联邦学习任务每个阶段的参与用户需求。若是需求尚未满足,需要继续选择用户的竞价,返回步骤S6。若是已经满足条件,则进入步骤S9。
由于整个联邦学习任务需要保证每个通信阶段都需要有至少K个用户参与训练。因此,需要满足的条件和需求就是
Figure BDA0003135497180000161
如果
Figure BDA0003135497180000162
则表示当前已选择的用户尚不能满足联系学习任务的训练,则需要返回步骤S6继续挑选合适的用户参与到联邦学习的训练中。如果已经满足条件,则可以不用再挑选用户,直接进入步骤S9。
在一种实施方式中,在步骤S9之后,所述方法还包括:
判断通信次数的范围内所有通信次数的总社会成本是否都已获得;
如果不是都已获得,则返回步骤S5,否则对比所有已计算的通信次数下决定胜者问题的总社会成本,选择对应最小总社会成本的通信次数作为最终值,同时告知用户任务部署安排和报酬。
具体实施过程中,记录每个已选择的用户竞价的报酬pi和部署安排l,同时计算该决定胜者问题的总社会成本cost。判断是否所有通信次数的总社会成本都已获得。若是仍有符合上述计算通信次数范围内的通信次数未获得对应的总社会成本,返回步骤S5。根据上述步骤,通过记录胜者集合中每个已选择用户竞价的报酬pi和部署安排l,并将所有已选择用户竞价(即zil=1)的竞价价格
Figure BDA0003135497180000163
进行求和得到当前决定胜者问题的总社会成本cost。从步骤S4中已经计算出了通信次数范围[T0,T]。如果范围内的通信次数尚未遍历完,则返回步骤S5继续完成遍历通信次数,否则对比所有已计算的通信次数下决定胜者问题的总社会成本,选择对应最小总社会成本的通信次数作为最终值,同时告知用户具体的个人部署安排和报酬。在完成对通信次数范围[T0,T]的遍历后,已经得到了所有范围内通信次数下决定胜者问题的总社会成本。然后可以选择出拥有最小总社会成本的通信次数,并依照对应的通信次数和训练的用户竞价来进行联邦学习任务的训练。同时,告知所有被选中的用户具体的个人部署安排和报酬。
本发明研究了联邦学习平台运营商如何激励、选择和部署移动设备用户来参与联邦学习任务训练来平衡联邦学习参与用户的计算成本和通信成本,来使得总社会成本最小化
为了便于本领域普通技术人员理解和实施本发明,下面结合具体示例进行说明,在本示例中,设置了联邦学习平台训练任务的最大通信次数为50,且每个通信阶段需要20个用户参与训练。其中每个通信阶段的时隙为60分钟。联邦学习平台共有1000个移动设备(用户),其中每个用户提交5个竞价。每个用户竞价的竞价价格在[10,50]内随机选取;局部训练精度服从[0.3,0.8]范围的均匀分布;随机选择10个[1,T]范围内的随机数来组成每个用户竞价的可执行通信阶段,且每个用户竞价的可执行的总通信次数在1到对应的可执行通信阶段长度(dij-aij)之间随机生成。同时,每个用户的通信时间在10到15之间随机生成,单个局部迭代计算时间在5到10之间随机生成。
图2a和图2b是本发明实施例实验结果图。图3a~3e是本发明实施例和其他现有算法结果的实验结果对比图。
附图中的相关字符和英文表示的解释如下:
#of Global iterations:表示不同的全局通信次数;
Performance ratio ofAwinner:表示Awinner算法得到的最小总社会成本与最优社会成本的比率;
#of bids per client:表示单个移动设备(用户)的竞价数量;
Number of winners:表示目前已挑选用户的数量;
Payment:表示给当前已选择用户的报酬;
Cost:表示当前已选择用户的竞价价格;
Number of clients:表示移动设备(用户)的数量;
Number of bids per client:表示单个移动设备(用户)的竞价数量;
Performance ratio:表示其中算法得到的最小总社会成本与最优社会成本的比率;
Awinner:表示设计总算法的局部算法;
FCFS:用于衡量设计算法的优劣的对比算法;
Greedy:用于衡量设计算法的优劣的对比算法;
Aonline:用于衡量设计算法的优劣的对比算法;
AFL:表示本发明设计的总算法,其中包括Awinner局部算法;
AFL,J=5:表示AFL在单个移动设备(用户)的竞价数量为5的情况;
AFL,J=10:表示AFL在单个移动设备(用户)的竞价数量为10的情况;
Aonline,J=5:表示Aonline在单个移动设备(用户)的竞价数量为5的情况;
Aonline,J=10:表示Aonline在单个移动设备(用户)的竞价数量为10的情况;
Running time(Seconds):表示算法执行时间,单位为秒。
应当理解的是,本说明未详细阐述的部分均属于现有技术,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (7)

1.基于面向联邦学习参与用户拍卖激励机制的任务部署方法,其特征在于,包括:
步骤S1:联邦学习平台运营商向所有的平台用户发布任务信息;
步骤S2:接收用户基于任务信息后提交的用户信息,用户信息包括竞价信息、指定的局部联邦学习任务训练精度、可参与的总训练次数以及可参与执行任务的时间范围;
步骤S3:联邦学习平台运营商采用整数规划对联邦学习任务部署进行建模,以最小化竞价价格为目标,并构建约束条件;
步骤S4:根据训练精度和通信次数的关系计算通信次数的范围,根据不同的通信次数,挑选出能满足联邦学习训练条件的竞价信息并将步骤S3中的整数规划问题分解成一系列的决定胜者问题,再依次计算不同固定的通信次数下的决定胜者问题的总社会成本,其中,总社会成本为所有已选择用户竞价的竞价价格的总和,决定胜者问题中满足该问题的约束条件的集合为竞价候选集合;
步骤S5:将上述固定通信次数下的决定胜者问题重新构造,得到对应的松弛整数约束下的对偶问题,对偶问题包括决策变量;
步骤S6:计算每个用户竞价添加之后的有效增加的参与完成训练次数,基于有效增加的参与完成训练次数计算每个用户竞价的有效平均成本,基于经典的贪心算法框架从竞价候选集合选择当前最低有效平均成本的用户竞价,同时更新决策变量,更新已选胜者集合和剩余可选竞价集合,其中,已选胜者集合为记录有当前已选择的用户的竞价集合,剩余可选竞价集合为去除已选择的和不满足条件的用户竞价之后的剩余可以选择的用户竞价;
步骤S7:根据有效平均成本计算被选中的用户竞价的报酬;
步骤S8:判断目前已选的用户竞价是否满足联邦学习任务每个阶段的参与用户需求,如果没有满足,则返回步骤S6继续进行用户竞价的选择,如果已经满足,则执行步骤S9;
步骤S9:记录每个已选择的用户竞价的报酬和部署安排,并计算对应的决定胜者问题的总社会成本。
2.如权利要求1所述的方法,其特征在于,在步骤S9之后,所述方法还包括:
判断通信次数的范围内所有通信次数的总社会成本是否都已获得;
如果不是都已获得,则返回步骤S5,否则对比所有已计算的通信次数下决定胜者问题的总社会成本,选择对应最小总社会成本的通信次数作为最终值,同时告知用户任务部署安排和报酬。
3.如权利要求1所述的方法,其特征在于,步骤S3具体包括:
采用整数规划对联邦学习任务部署问题进行建模,其中目标函数为:
Figure FDA0003135497170000021
约束条件包括(1a)~(1h):
Figure FDA0003135497170000022
Figure FDA0003135497170000023
Figure FDA0003135497170000024
Figure FDA0003135497170000025
Figure FDA0003135497170000026
Figure FDA0003135497170000027
Figure FDA0003135497170000028
Tg∈{1,2,...,T}. (1h)
其中,约束(1a)用以保证所有需训练的通信阶段的参与训练用户个数不小于K,其中未知变量yi(t)表示被选择的用户是否被安排在第t个通信阶段进行训练,即当yit为真时值为1,当yi(t)为假时值取0,
Figure FDA0003135497170000029
表示{1,2,...,Tg}范围内t的可选集合;约束条件(1b)用以保障所有已选择的用户竞价的训练精度能满足通信次数的要求,其中未知变量xij表示用户竞价是否被选择,即当xij为真时值为1,当xij为假时值取0,
Figure FDA00031354971700000311
表示{1,2,...,I}范围内所有用户i的可选集合,
Figure FDA0003135497170000031
表示{1,2,...,J}范围内所有用户竞价j的可选集合;约束条件(1c)用以保障被选择用户的总安排训练次数等于可执行的总通信次数;约束条件(1d)用以保证当前选择的用户竞价单个通信阶段所需要的总时间不超过单个通信阶段的时隙tmax,其中,
Figure FDA0003135497170000032
表示总计算时间,Tlij)表示训练精度为θij下的局部训练次数且与训练精度有如下关系:Tlij)=η·log(1/θij),
Figure FDA0003135497170000033
表示单个局部训练所需要的计算时间,
Figure FDA0003135497170000034
表示单个通信阶段所需要的通信时间,η表示一个常数型系数;约束条件(1e)表示变量xij和变量yi(t)之间的约束关系,即当且仅当用户竞价被选择时,才能被联邦学习平台运营商在其可执行通信阶段范围内部署训练;约束条件(1f)表示每个用户至多只能有一个竞价被选择;约束条件(1g)用以保障变量xij、变量yi(t)的取值为0和1;(1h)用以保证变量Tg的取值在1和T范围内。
4.如权利要求3所述的方法,其特征在于,步骤S4具体包括:
S4.1:根据公式(2)计算出通信次数的具体范围,
Figure FDA0003135497170000035
其中,
Figure FDA0003135497170000036
表示固定全局训练精度ε的计算上界,θmax表示所有已选择用户的最大局部训练精度;
S4.2:利用(2)关系公式,通过计算所有用户的提交竞价的最小局部精度θmin计算出通信次数的初始化最小值T0,得到更精准的通信次数范围[T0,T],通过排除一部分不满足对应通信次数
Figure FDA0003135497170000037
下的局部训练精度条件的竞价,从而挑选出合格的满足上述约束(1b)和约束(1d)的竞价候选集合
Figure FDA0003135497170000038
Figure FDA0003135497170000039
其中
Figure FDA00031354971700000310
表示用户i的第j个竞价在单个通信阶段内所需要的总时间;
S4.3:基于挑选出的合格的竞价候选集合
Figure FDA0003135497170000041
得出一系列决定胜者问题,描述如下:
Figure FDA0003135497170000042
subject to:
Figure FDA0003135497170000043
Figure FDA0003135497170000044
Figure FDA0003135497170000045
Figure FDA0003135497170000046
Figure FDA0003135497170000047
5.如权利要求4所述的方法,其特征在于,步骤S5具体包括:
S5.1:将公式(4)中的两个决策变量xij和yi(t)进行合并并用一个新的决策变量来表示zil来表示,其中下标l表示具体的竞价和其对应的部署方案,重构后的决定胜者问题描述为:
Figure FDA0003135497170000048
subject to:
Figure FDA0003135497170000049
Figure FDA00031354971700000410
Figure FDA00031354971700000411
其中,变量ρil表示用户i的部署方案l所对应的竞价价格
Figure FDA00031354971700000412
约束条件(5a)等同于约束条件(1a),用以保证所有需训练的通信阶段的参与训练用户个数不小于K,约束条件等同于约束条件(1f),用以表示每个用户至多只能有一个竞价被选择;
S5.2:对上述的决定胜者问题(5)进行对偶化,松弛整数约束下的对偶问题描述为:
Figure FDA0003135497170000051
subject to:
Figure FDA0003135497170000052
Figure FDA0003135497170000053
其中g(t),λil,qi分别为约束条件(5a)、(5b)和(5c)所对应的对偶变量,约束条件(6a)和(6b)用于约束对偶变量的取值范围。
6.如权利要求1所述的方法,其特征在于,步骤S6包括:
S6.1:利用公式(7)计算每个用户竞价添加之后的有效增加的参与完成训练次数:
Figure FDA0003135497170000054
其中,
Figure FDA0003135497170000055
S={(i1,l1),(i2,l2),...}},
Figure FDA0003135497170000056
Figure FDA0003135497170000057
表示当前所有已选择用户竞价及其对应部署方案的集合;
Figure FDA0003135497170000058
表示当前
Figure FDA0003135497170000059
集合和(i,l)的并集;
Figure FDA00031354971700000510
表示
Figure FDA00031354971700000511
的总有效参与完成训练次数;
Figure FDA00031354971700000512
表示
Figure FDA00031354971700000513
的总有效参与完成训练次数;
Figure FDA00031354971700000514
表示当前
Figure FDA00031354971700000515
集合所有已选择用户被部署在第t个通信阶段训练的总数量;
Figure FDA00031354971700000516
表示当前
Figure FDA00031354971700000517
集合和(i,l)的并集中所有已选择用户被部署在第t个通信阶段训练的总数量;
S6.2:根据上述计算的每个用户竞价添加之后的有效增加的参与完成训练次数,计算出每个用户竞价的有效平均成本,其中,有效平均成为:
Figure FDA0003135497170000061
通过对比得出当前最低有效平均成本对应的部署方案(i*,l*),计算公式描述为:
Figure FDA0003135497170000062
其中
Figure FDA0003135497170000063
表示当前剩余的可选用户竞价集合,
Figure FDA0003135497170000064
表示用户i的第l个部署所对应第j竞价的价格,
Figure FDA0003135497170000065
代表用户i的第l个部署所对应第j竞价添加之后的有效增加的参与完成训练次数;
S6.3:基于经典的贪心算法框架从竞价候选集合选择当前最低有效平均成本的用户竞价,得到部署方案(i*,l*),更新对应的决策变量
Figure FDA00031354971700000613
为1,同时更新
Figure FDA0003135497170000066
集合为
Figure FDA0003135497170000067
和(i*,l*)的并集,其中,为保证满足约束条件(1f),可选集合
Figure FDA0003135497170000068
将去除当前被选择用户i*的所有竞价。
7.如权利要求1所述的方法,其特征在于,步骤S7包括:
S7.1:找出次最低有效平均成本的用户竞价(i′,l′),计算公式描述为:
Figure FDA0003135497170000069
S7.2:计算用户i*的报酬,计算公式描述为:
Figure FDA00031354971700000610
其中
Figure FDA00031354971700000611
代表用户竞价(i′,l′)的有效平均成本,
Figure FDA00031354971700000612
表示用户竞价(i*,l*)被拟添加到S集合后可实际增加的参与完成训练次数。
CN202110717552.4A 2021-06-28 2021-06-28 基于面向联邦学习参与用户拍卖激励机制的任务部署方法 Active CN113379294B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110717552.4A CN113379294B (zh) 2021-06-28 2021-06-28 基于面向联邦学习参与用户拍卖激励机制的任务部署方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110717552.4A CN113379294B (zh) 2021-06-28 2021-06-28 基于面向联邦学习参与用户拍卖激励机制的任务部署方法

Publications (2)

Publication Number Publication Date
CN113379294A true CN113379294A (zh) 2021-09-10
CN113379294B CN113379294B (zh) 2022-07-05

Family

ID=77579572

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110717552.4A Active CN113379294B (zh) 2021-06-28 2021-06-28 基于面向联邦学习参与用户拍卖激励机制的任务部署方法

Country Status (1)

Country Link
CN (1) CN113379294B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109472520A (zh) * 2018-12-21 2019-03-15 南京邮电大学 基于区块链的多无人机任务分配方法
CN111754000A (zh) * 2020-06-24 2020-10-09 清华大学 质量感知的边缘智能联邦学习方法及系统
CN112632013A (zh) * 2020-12-07 2021-04-09 国网辽宁省电力有限公司物资分公司 一种基于联邦学习的数据安全可信共享方法和装置
WO2021118452A1 (en) * 2019-12-10 2021-06-17 Agency For Science, Technology And Research Method and server for federated machine learning

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109472520A (zh) * 2018-12-21 2019-03-15 南京邮电大学 基于区块链的多无人机任务分配方法
WO2021118452A1 (en) * 2019-12-10 2021-06-17 Agency For Science, Technology And Research Method and server for federated machine learning
CN111754000A (zh) * 2020-06-24 2020-10-09 清华大学 质量感知的边缘智能联邦学习方法及系统
CN112632013A (zh) * 2020-12-07 2021-04-09 国网辽宁省电力有限公司物资分公司 一种基于联邦学习的数据安全可信共享方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赵健等: "《群体智能2.0研究综述》", 《计算机工程》 *

Also Published As

Publication number Publication date
CN113379294B (zh) 2022-07-05

Similar Documents

Publication Publication Date Title
Mallard Modelling cognitively bounded rationality: An evaluative taxonomy
Nan et al. A cross-space, multi-interaction-based dynamic incentive mechanism for mobile crowd sensing
CN113050931A (zh) 一种基于图注意力机制的符号网络链路预测方法
CN115358831A (zh) 基于多智能体强化学习算法在联邦学习下的用户竞价方法及装置
CN113191804A (zh) 一种最优竞价策略求解方法
Rossi et al. Combining users and items rankings for group decision support
Travadi et al. Welfare and fairness dynamics in federated learning: A client selection perspective
Huang et al. Discovering valuations and enforcing truthfulness in a deadline-aware scheduler
Bichler et al. Learning equilibria in asymmetric auction games
CN113379294B (zh) 基于面向联邦学习参与用户拍卖激励机制的任务部署方法
Ikonomovska et al. Real-time bid prediction using thompson sampling-based expert selection
Vojnović Contest theory
CN115659054A (zh) 基于强化学习的游戏关卡推荐方法和装置
Hu et al. A dynamic service trading in a dlt-assisted industrial iot marketplace
Oderanti Fuzzy inference game approach to uncertainty in business decisions and market competitions
Gao et al. A long-term quality perception incentive strategy for crowdsourcing environments with budget constraints
Suh et al. Modeling prize‐based open design challenges: General framework and FANG‐1 case study
Kanmaz et al. Using multi-agent reinforcement learning in auction simulations
Branzei et al. Learning and Collusion in Multi-unit Auctions
Nurmi Bayesian game theory in practice: A framework for online reputation systems
Hoefer et al. Computational Social Dynamics (Dagstuhl Seminar 22452)
Chowdhury Autonomous trading strategies for dynamic energy markets
Zhou et al. Automatic knowledge transfer for agent-based bilateral negotiation tasks
Ye Multi-objective Optimization Methods for Allocation and Prediction
Guo Stochastic Optimization for Machine Learning: Methodology and Applications in Sequential Recommendation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant