CN114826917B - 一种基于博弈的网络资源分配方法及装置 - Google Patents
一种基于博弈的网络资源分配方法及装置 Download PDFInfo
- Publication number
- CN114826917B CN114826917B CN202210440651.7A CN202210440651A CN114826917B CN 114826917 B CN114826917 B CN 114826917B CN 202210440651 A CN202210440651 A CN 202210440651A CN 114826917 B CN114826917 B CN 114826917B
- Authority
- CN
- China
- Prior art keywords
- game
- node
- target
- nodes
- community
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000013468 resource allocation Methods 0.000 title claims abstract description 26
- 230000008901 benefit Effects 0.000 claims description 157
- 238000005192 partition Methods 0.000 claims 1
- 238000000638 solvent extraction Methods 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 9
- 238000010586 diagram Methods 0.000 description 7
- 230000009471 action Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0823—Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/145—Network analysis or design involving simulating, designing, planning or modelling of a network
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Pinball Game Machines (AREA)
Abstract
本申请公开了一种基于博弈的网络资源分配方法及装置,先基于网络中处理目标资源的设备的数量确定公共物品博弈模型中包括的博弈节点的数量,再将所述公共物品博弈模型中的博弈节点划分为至少两种类型的博弈节点,在公共物品博弈模型的博弈节点中选择目标节点,进行博弈,并基于调整概率将所述目标节点的状态调整为所述目标邻居节点的状态,重复执行博弈的过程,直到公共物品博弈模型稳定后,基于公共物品博弈模型确定网络中分享目标资源的设备的数量。建立包括多种类型的博弈节点的公共物品博弈模型,能够满足博弈模型中节点的多样性,使得得到的博弈结果更加符合实际场景的情况,从而使得基于博弈结果分配的网络资源满足资源分配的需要。
Description
技术领域
本申请涉及网络管理技术领域,具体涉及一种基于博弈的网络资源分配方法及装置。
背景技术
博弈表示在多决策主体之间行为具有相互作用时,各主体根据所掌握信息及对自身能力的认知,做出有利于自己的决策的一种行为理论。在对网络资源进行分配之前,通常会采用博弈的方法确定网络资源的分配方法。
目前,用于确定网络资源的博弈方法的局限性较大,得到的结论并不能与实际的网络资源场景匹配,基于博弈结论分配的网络资源难以满足资源分配的需要。
发明内容
有鉴于此,本申请提供一种基于博弈的网络资源分配方法及装置,能够基于博弈结论较为合理地分配网络资源,满足网络资源分配的需要。
为解决上述问题,本申请提供的技术方案如下:
第一方面,本申请提供一种基于博弈的网络资源分配方法,所述方法包括:
基于网络中处理目标资源的设备的数量确定公共物品博弈模型中包括的博弈节点的数量,所述处理目标资源的设备包括占用目标资源的设备和分享目标资源的设备;
将所述公共物品博弈模型中的博弈节点划分为至少两种类型的博弈节点,不同类型的博弈节点的投资值不同,所述公共物品博弈模型中的博弈节点处于合作者状态或者处于背叛者状态,所述博弈节点处于合作者状态的概率和处于背叛者状态的概率相同;
在所述公共物品博弈模型的博弈节点中选择目标节点,确定所述目标节点所属的各个博弈团体以及所述各个博弈团体博弈后得到的收益,所述博弈团体的收益是基于所述博弈团体包括的处于合作者状态的博弈节点的投资值确定的;
在以所述目标节点为中心节点的博弈团体中,选择所述目标节点的目标邻居节点;
基于调整概率将所述目标节点的状态调整为所述目标邻居节点的状态,所述调整概率是基于所述目标节点的收益和所述目标邻居节点的收益确定的,所述目标节点的收益和所述目标邻居节点的收益是基于所述目标节点所属的博弈团体的收益确定的;
将所述公共物品博弈模型中的博弈节点的收益清零;
返回执行所述在所述公共物品博弈模型的博弈节点中选择目标节点,确定所述目标节点所属的各个博弈团体以及所述各个博弈团体博弈后得到的收益以及后续步骤,直到所述公共物品博弈模型中处于所述合作者状态的博弈节点在所述公共物品博弈模型的占比不变,获取所述占比;
基于所述占比确定所述网络中分享目标资源的设备的数量。
在一种可能的实现方式中,所述调整概率是采用如下方式确定的:
基于所述目标节点的收益与所述目标邻居节点的收益的差值,得到第一数值;
计算1与所述e的第一数值次方的和,得到第二数值;
计算所述第二数值的倒数,得到所述调整概率。
在一种可能的实现方式中,所述目标节点的收益为采用如下方式确定的:
计算目标博弈团体的收益与收益参数的乘积,得到团体收益值,所述目标博弈团体为所述目标节点所属的博弈团体中的每一个;
将所述团体收益值除以所述目标博弈团体包括的博弈节点的数量,得到第一节点收益;
若所述目标节点为处于合作者状态,计算所述第一节点收益与所述目标节点的投资值的差值,得到第二节点收益,计算每个所述博弈团体的第二节点收益之和,得到所述目标节点的收益;
若所述目标节点为处于背叛者状态,计算每个所述博弈团体的第一节点收益之和,得到所述目标节点的收益。
在一种可能的实现方式中,所述将所述公共物品博弈模型中的博弈节点划分为至少两种类型的节点,包括:
将所述公共物品博弈模型中的博弈节点划分为第一类型的博弈节点和第二类型的博弈节点,所述第一类型的博弈节点的投资值为固定的预设值,所述第二类型的博弈节点的投资值基于所述第二类型的博弈节点所属的博弈团体中处于合作者状态的博弈节点的数量确定。
在一种可能的实现方式中,所述目标节点所属的博弈团体包括所述目标节点作为中心节点的博弈团体和所述目标节点作为中心节点的邻居节点的博弈团体。
第二方面,本申请提供一种基于博弈的网络资源分配装置,所述装置包括:
第一确定单元,用于基于网络中处理目标资源的设备的数量确定公共物品博弈模型中包括的博弈节点的数量,所述处理目标资源的设备包括占用目标资源的设备和分享目标资源的设备;
划分单元,用于将所述公共物品博弈模型中的博弈节点划分为至少两种类型的博弈节点,不同类型的博弈节点的投资值不同,所述公共物品博弈模型中的博弈节点处于合作者状态或者处于背叛者状态,所述博弈节点处于合作者状态的概率和处于背叛者状态的概率相同;
第二确定单元,用于在所述公共物品博弈模型的博弈节点中选择目标节点,确定所述目标节点所属的各个博弈团体以及所述各个博弈团体博弈后得到的收益,所述博弈团体的收益是基于所述博弈团体包括的处于合作者状态的博弈节点的投资值确定的;
选择单元,用于在以所述目标节点为中心节点的博弈团体中,选择所述目标节点的目标邻居节点;
调整单元,用于基于调整概率将所述目标节点的状态调整为所述目标邻居节点的状态,所述调整概率是基于所述目标节点的收益和所述目标邻居节点的收益确定的,所述目标节点的收益和所述目标邻居节点的收益是基于所述目标节点所属的博弈团体的收益确定的;
清零单元,用于将所述公共物品博弈模型中的博弈节点的收益清零;
执行单元,用于返回执行所述在所述公共物品博弈模型的博弈节点中选择目标节点,确定所述目标节点所属的各个博弈团体以及所述各个博弈团体博弈后得到的收益以及后续步骤,直到所述公共物品博弈模型中处于所述合作者状态的博弈节点在所述公共物品博弈模型的占比不变,获取所述占比;
第三确定单元,用于基于所述占比确定所述网络中分享目标资源的设备的数量。
在一种可能的实现方式中,所述调整概率是采用如下方式确定的:
基于所述目标节点的收益与所述目标邻居节点的收益的差值,得到第一数值;
计算1与所述e的第一数值次方的和,得到第二数值;
计算所述第二数值的倒数,得到所述调整概率。
在一种可能的实现方式中,所述目标节点的收益为采用如下方式确定的:
计算目标博弈团体的收益与收益参数的乘积,得到团体收益值,所述目标博弈团体为所述目标节点所属的博弈团体中的每一个;
将所述团体收益值除以所述目标博弈团体包括的博弈节点的数量,得到第一节点收益;
若所述目标节点为处于合作者状态,计算所述第一节点收益与所述目标节点的投资值的差值,得到第二节点收益,计算每个所述博弈团体的第二节点收益之和,得到所述目标节点的收益;
若所述目标节点为处于背叛者状态,计算每个所述博弈团体的第一节点收益之和,得到所述目标节点的收益。
在一种可能的实现方式中,所述划分单元,用于将所述公共物品博弈模型中的博弈节点划分为至少两种类型的节点,包括:
所述划分单元,具体用于将所述公共物品博弈模型中的博弈节点划分为第一类型的博弈节点和第二类型的博弈节点,所述第一类型的博弈节点的投资值为固定的预设值,所述第二类型的博弈节点的投资值基于所述第二类型的博弈节点所属的博弈团体中处于合作者状态的博弈节点的数量确定。
在一种可能的实现方式中,所述目标节点所属的博弈团体包括所述目标节点作为中心节点的博弈团体和所述目标节点作为中心节点的邻居节点的博弈团体
第三方面,一种基于博弈的网络资源分配设备,包括:处理器、存储器、系统总线;
所述处理器以及所述存储器通过所述系统总线相连;
所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行上述第一方面所述的方法。
第四方面,一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行上述第一方面所述的方法。
由此可见,本申请具有如下有益效果:
本申请提供的一种基于博弈的网络资源分配方法及装置,先基于网络中处理目标资源的设备的数量确定公共物品博弈模型中包括的博弈节点的数量,再将所述公共物品博弈模型中的博弈节点划分为至少两种类型的博弈节点,不同类型的博弈节点的投资值不同,所述公共物品博弈模型中的博弈节点处于合作者状态或者处于背叛者状态,所述博弈节点处于合作者状态的概率和处于背叛者状态的概率相同,在公共物品博弈模型的博弈节点中选择目标节点,确定所述目标节点所属的各个博弈团体以及所述各个博弈团体博弈后得到的收益,所述博弈团体的收益是基于所述博弈团体包括的处于合作者状态的博弈节点的投资值确定的;在以所述目标节点为中心节点的博弈团体中,选择所述目标节点的目标邻居节点;基于调整概率将所述目标节点的状态调整为所述目标邻居节点的状态,所述调整概率是基于所述目标节点的收益和所述目标邻居节点的收益确定的,所述目标节点的收益和所述目标邻居节点的收益是基于所述目标节点所属的博弈团体的收益确定的;再将所述公共物品博弈模型中的博弈节点的收益清零;返回执行所述在所述公共物品博弈模型的博弈节点中选择目标节点,确定所述目标节点所属的各个博弈团体以及所述各个博弈团体博弈后得到的收益以及后续步骤,直到所述公共物品博弈模型中处于所述合作者状态的博弈节点在所述公共物品博弈模型的占比不变,获取所述占比;基于所述占比确定网络中分享目标资源的设备的数量。建立包括多种类型的博弈节点的公共物品博弈模型,能够满足博弈模型中节点的多样性,使得得到的博弈结果更加符合实际场景的情况,从而使得基于博弈结果分配的网络资源满足资源分配的需要。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种基于博弈的网络资源分配方法的流程图;
图2为本申请实施例提供的一种公共物品博弈模型中博弈节点的排布的示意图;
图3a为本申请实施例提供的一种博弈团体的结构示意图;
图3b为本申请实施例提供的另一种博弈团体的结构示意图;
图3c为本申请实施例提供的又一种博弈团体的结构示意图;
图4为本申请实施例提供的一种基于博弈的网络资源分配装置的结构示意图。
具体实施方式
为了便于理解和解释本申请实施例提供的技术方案,下面将先对本申请的背景技术进行说明。
在对传统的基于博弈进行网络资源分配的方法进行研究后发现,目前的博弈过程先建立囚徒困境博弈模型,将各个节点初始化为合作者状态或者背叛者状态,对博弈模型中节点的收益清零。将博弈模型中的节点与直接邻居节点进行博弈,使得博弈模型中所有的两两相连的节点博弈一次,基于博弈的结果,得到节点的收益。节点基于多跳范围内的邻居的状态,调整自身的状态。将博弈模型中节点的收益清零,并返回将博弈模型中的节点与直接邻居节点进行博弈以及后续步骤,直到博弈模型稳定为止。目前的博弈方法中,采用节点在多跳范围内学习其他节点状态的方法,学习成本增加,并且局限性较大。而且博弈模型中的节点不存在差异性,和实际场景中网络设备之间存在差异的情况不符。
基于此,本申请实施例提供一种基于博弈的网络资源分配方法及装置,先基于网络中处理目标资源的设备的数量确定公共物品博弈模型中包括的博弈节点的数量,再将所述公共物品博弈模型中的博弈节点划分为至少两种类型的博弈节点,不同类型的博弈节点的投资值不同,所述公共物品博弈模型中的博弈节点处于合作者状态或者处于背叛者状态,所述博弈节点处于合作者状态的概率和处于背叛者状态的概率相同,在公共物品博弈模型的博弈节点中选择目标节点,确定所述目标节点所属的各个博弈团体以及所述各个博弈团体博弈后得到的收益,所述博弈团体的收益是基于所述博弈团体包括的处于合作者状态的博弈节点的投资值确定的;在以所述目标节点为中心节点的博弈团体中,选择所述目标节点的目标邻居节点;基于调整概率将所述目标节点的状态调整为所述目标邻居节点的状态,所述调整概率是基于所述目标节点的收益和所述目标邻居节点的收益确定的,所述目标节点的收益和所述目标邻居节点的收益是基于所述目标节点所属的博弈团体的收益确定的;再将所述公共物品博弈模型中的博弈节点的收益清零;返回执行所述在所述公共物品博弈模型的博弈节点中选择目标节点,确定所述目标节点所属的各个博弈团体以及所述各个博弈团体博弈后得到的收益以及后续步骤,直到所述公共物品博弈模型中处于所述合作者状态的博弈节点在所述公共物品博弈模型的占比不变,获取所述占比;基于所述占比确定网络中分享目标资源的设备的数量。建立包括多种类型的博弈节点的公共物品博弈模型,能够满足博弈模型中节点的多样性,使得得到的博弈结果更加符合实际场景的情况,从而使得基于博弈结果分配的网络资源满足资源分配的需要。
为了便于理解本申请实施例提供的技术方案,下面结合附图对本申请实施例提供的一种基于博弈的网络资源分配方法及装置进行说明。
参见图1所示,该图为本申请实施例提供的一种基于博弈的网络资源分配方法的流程图,该方法包括步骤S101-S108。
S101:基于网络中处理目标资源的设备的数量确定公共物品博弈模型中包括的博弈节点的数量,所述处理目标资源的设备包括占用目标资源的设备和分享目标资源的设备。
网络中包括多种设备,例如,网络包括路由器和交换机等网络设备,以及终端设备。根据网络中处理目标资源的设备的数量,确定公共物品博弈模型中博弈节点的数量。其中,目标资源为网络运行所需要使用的资源。目标资源例如为带宽资源或计算资源。网络中处理目标资源的设备包括占用目标资源的设备和分享目标资源的设备。占用目标资源的设备为利用目标资源执行任务的设备。分享目标资源的设备为将具有的目标资源分享给其他设备的设备。以目标资源为带宽资源为例,网络中的设备在带宽资源充足的情况下能够将剩余的带宽资源分享给其他设备。占用带宽资源的设备能够利用带宽资源传输信息。
获取网络中处理目标资源的设备的数量,并基于网络中处理目标资源的设备数量确定公共物品博弈模型中博弈节点的数量。其中,公共物品博弈模型是基于公共物品博弈理论建立的博弈模型。公共物品博弈是一个多人参与的博弈。建立的公共物品博弈模型中博弈节点的数量与网络中处理目标资源的设备的数量相等。公共物品博弈模型中的博弈节点对应于网络中处理目标资源的设备。
在一种可能的实现方式中,公共物品博弈模型中的博弈节点依据逻辑矩阵模型放置。参见图2所示,该图为本申请实施例提供的一种公共物品博弈模型中博弈节点的排布的示意图。公共物品博弈模型包括35个博弈节点,每个相邻的博弈节点连接。
S102:将所述公共物品博弈模型中的博弈节点划分为至少两种类型的博弈节点,不同类型的博弈节点的投资值不同,所述公共物品博弈模型中的博弈节点处于合作者状态或者处于背叛者状态,所述博弈节点处于合作者状态的概率和处于背叛者状态的概率相同。
将公共物品博弈模型中的博弈节点划分为多种类型。不同类型的博弈节点的投资值不同。投资值是用于确定博弈团体的收益的。
公共物品博弈模型中的博弈节点处于合作者状态或者背叛者状态。其中,处于合作者状态的博弈节点在每次博弈时会向博弈团体提供投资值。博弈团体基于获取的投资值确定博弈团体的收益,并且将博弈团体的收益平均分至博弈团体包括的博弈节点。处于背叛者的博弈节点在每次博弈时不向博弈团体提供投资值,仅获取博弈团体分配的收益。在初始化公共物品博弈模型时,每个博弈节点均有相等的概率处于合作者状态或者处于背叛者状态。
本申请实施例还提供一种将所述公共物品博弈模型中的博弈节点划分为至少两种类型的节点的具体实现方式。
在一种可能的实现方式中,将所述公共物品博弈模型中的博弈节点划分为第一类型的博弈节点和第二类型的博弈节点。其中,第一类型的博弈节点的投资值为固定的预设值。第二类型的博弈节点的投资值基于该博弈节点所属的博弈团体中处于合作者状态的博弈节点的数量确定。
作为一种示例,第一类型的博弈节点的投资值为单位投资值,具体可以用数值1表示。第二类型的博弈节点的投资值如式(1)所示。
其中,Ix(i)为第二类型的博弈节点对所属的博弈团体的投资值。N(i)为第二类型的博弈节点所属的博弈团体包括博弈节点的数量。NC(i)为第二类型的博弈节点所属的博弈团体包括的处于合作者状态的博弈节点的数量。是一个可调参数。/>的取值大于0,具体可以根据博弈团体的合作水平进行调节。
S103:在所述公共物品博弈模型的博弈节点中选择目标节点,确定所述目标节点所属的各个博弈团体以及所述各个博弈团体博弈后得到的收益,所述博弈团体的收益是基于所述博弈团体包括的处于合作者状态的博弈节点的投资值确定的。
在对公共物品博弈模型初始化结束后,开始进行博弈。在公共物品博弈模型的博弈节点中选择目标节点。本申请实施例不限定选择目标节点的具体实现方式。作为一种示例,从公共物品博弈模型中随机选择博弈节点作为目标节点。以上述图2为例,将标号为18的博弈节点作为目标节点。
在确定目标节点后,确定目标节点所属的博弈团体。每个博弈团体是由中心节点和中心节点邻居节点组成。博弈团体所包括的博弈节点的范围可以预先设置。参见图3a、3b和3c所示的博弈团体示意图。其中,黑色的节点为中心节点,灰色的节点为中心节点的邻居节点。其中,在一种可能的实现方式中,如图3a所示,中心节点的邻居节点为与中心节点直接连接的节点。在另一种可能的实现方式中,如图3b所示,中心节点的邻居节点为与中心节点周围一跳和两跳范围内的节点。在又一种可能的实现方式中,如图3c所示,中心节点的邻居节点为与中心节点周围一跳到四跳范围内的节点。
目标节点所属的博弈团体包括目标节点作为中心节点的博弈团体以及目标节点作为中心节点的邻居节点的博弈团体。以博弈团体包括的中心节点的邻居节点为与中心节点直接连接的节点为例,图2所示的标号为18的目标节点属于5个博弈团体。标号为18的目标节点作为中心节点的包括标号11的博弈节点、标号17的博弈节点、标号18的博弈节点、标号19的博弈节点和标号25的博弈节点的博弈团体。标号为18的目标节点作为中心节点的邻居节点的包括标号12的博弈节点、标号18的博弈节点、标号19的博弈节点、标号20的博弈节点和标号26的博弈节点的博弈团体。标号为18的目标节点作为中心节点的邻居节点的包括标号4的博弈节点、标号10的博弈节点、标号11的博弈节点、标号12的博弈节点和标号18的博弈节点的博弈团体。标号为18的目标节点作为中心节点的邻居节点的包括标号10的博弈节点、标号16的博弈节点、标号17的博弈节点、标号18的博弈节点和标号24的博弈节点的博弈团体。标号为18的目标节点作为中心节点的邻居节点的包括标号18的博弈节点、标号24的博弈节点、标号25的博弈节点、标号26的博弈节点和标号32的博弈节点的博弈团体。
在确定目标节点所属的博弈团体后,目标节点所属的博弈团体进行博弈,也就是确定博弈团体的收益。博弈团体中处于合作者状态的博弈节点提供投资值。博弈团体基于获取的投资值确定收益。具体的,博弈团体的收益是将得到处于合作者状态的博弈节点的投资值之和与收益参数相乘得到的。收益参数的数值大于1。
需要说明的是,对于属于多个博弈团体的处于合作者的博弈节点,需要分别向所属的博弈团体提供投资值。以上述图2所示的标号18的目标节点为例,标号18的目标节点需要向5个博弈团体提供对应的投资值。
S104:在以所述目标节点为中心节点的博弈团体中,选择所述目标节点的目标邻居节点。
目标节点所属的博弈团体中包括以目标节点为中心节点的博弈团体。在以目标节点为中心节点的博弈团体的邻居节点中,选择一个邻居节点作为目标节点的目标邻居节点。
以上述将标号18的博弈节点确定为目标节点为例,在包括标号11的博弈节点、标号17的博弈节点、标号18的博弈节点、标号19的博弈节点和标号25的博弈节点的博弈团体中,从标号11的博弈节点、标号17的博弈节点、标号19的博弈节点和标号25的博弈节点中选取一个博弈节点作为目标邻居节点。比如,将标号19的博弈节点作为目标邻居节点。
S105:基于调整概率将所述目标节点的状态调整为所述目标邻居节点的状态,所述调整概率是基于所述目标节点的收益和所述目标邻居节点的收益确定的,所述目标节点的收益和所述目标邻居节点的收益是基于所述目标节点所属的博弈团体的收益确定的。
按照调整概率将目标节点的状态调整为目标邻居节点的状态。这个过程也称为目标节点学习目标邻居节点的过程。
其中,调整概率是基于目标节点的收益和目标邻居节点的收益确定的。目标节点的收益和目标邻居节点的收益是基于博弈团体的收益确定的。
在一种可能的实现方式中,调整概率的表达式如式(2)所示:
其中,P(Sx←Sy)为目标节点的状态调整为目标邻居节点的状态的调整概率。Sx表示目标节点的状态,Sy表示目标邻居节点的状态。PX为目标节点的收益。PY为目标邻居节点的收益。K为参数。
具体的,先基于PX与PY的差值,得到第一数值,也就是(PX-PY)/K。再计算1与e的第一数值次方的和,得到第二数值,也就是1+exp[(PX-PY)/K]。最后再计算第二数值的倒数,得到调整概率。
本申请实施例还提供一种确定目标节点的收益的方法。
先计算目标博弈团体的收益与收益参数的乘积,得到团体收益值。其中,目标博弈团体为目标节点所属的博弈团体中的每一个。
再将得到的团体收益值除以目标博弈团体包括的博弈节点的数量,得到第一节点收益。
如果目标节点为处于合作者状态,则还需要将第一节点收益减去目标节点对目标博弈团体的投资值,得到第二节点收益。计算第二节点收益之和,得到目标节点的收益。
如果目标节点为处于背叛者状态,则计算第一节点收益之和,得到目标节点的收益。
作为一种示例,目标节点针对目标博弈团体的节点收益如式(3)所示:
其中,PX(i)为目标节点在目标博弈团体内的第二节点收益。目标博弈团体为目标节点所属的博弈团体中的第i个。Iy(i)为目标博弈团体中第y个博弈节点的投资值。Ni为目标博弈团体中包括的博弈节点的集合。当第y个博弈节点处于合作者状态时,Iy(i)为该博弈节点的投资值。当第y个博弈节点处于背叛者状态时,Iy(i)为0。r为收益参数,r的数值大于1。G为目标博弈团体中博弈节点的数量。Ix(i)为目标节点对目标博弈团体的投资值。其中,当目标节点处于合作者状态,则Ix(i)为目标节点对应的投资值。当目标节点处于背叛者状态,则Ix(i)为0。
目标节点的收益如式(4)所示:
其中,Nx为目标节点所属的博弈团体的集合。
目标邻居节点的收益的计算方式与上述目标节点的收益的计算方式类似,具体请参见上述描述,在此不再赘述。
S106:将所述公共物品博弈模型中的博弈节点的收益清零。
在进行一次博弈,并且根据调整概率对目标节点的状态进行调整之后,将公共物品博弈模型中全部的博弈节点的收益清零。
S107:返回执行所述在所述公共物品博弈模型的博弈节点中选择目标节点,确定所述目标节点所属的各个博弈团体以及所述各个博弈团体博弈后得到的收益以及后续步骤,直到所述公共物品博弈模型中处于所述合作者状态的博弈节点在所述公共物品博弈模型的占比不变,获取所述占比。
循环执行S103-S106,直到公共物品博弈模型处于稳定状态停止循环。其中,稳定状态是指公共物品博弈模型中处于合作者状态的博弈节点在公共物品博弈模型的占比不变。具体的,也就是式(5)中Rc的数值不变。
其中,Rc为公共物品博弈模型中处于合作者状态的博弈节点在公共物品博弈模型的占比。NC为公共物品博弈模型中处于合作者状态的博弈节点的数量。ND为公共物品博弈模型中处于背叛者状态的博弈节点的数量。
S108:基于所述占比确定所述网络中分享目标资源的设备的数量。
在公共物品博弈模型处于稳定状态后,获取公共物品博弈模型中处于合作者状态的博弈节点在公共物品博弈模型的占比。基于该占比,能够确定网络中分享目标资源的设备的数量。具体的,可以利用该占比和网络中处于目标资源的设备的数量计算得到分享目标资源的设备的数量。
作为一种示例,公共物品博弈模型处于稳定状态后,公共物品博弈模型中处于合作者状态的博弈节点在公共物品博弈模型的占比为75%。网络中处理目标资源的设备的数量为100,则分享目标资源的设备的数量为75。
基于上述S101-S108的相关内容可知,建立包括多种类型的博弈节点的公共物品博弈模型,能够满足博弈模型中节点的多样性,使得得到的博弈结果更加符合实际场景的情况,从而使得基于博弈结果分配的网络资源满足资源分配的需要。
基于上述方法实施例提供的一种基于博弈的网络资源分配方法,本申请实施例还提供了一种基于博弈的网络资源分配装置,下面将结合附图对该基于博弈的网络资源分配装置进行说明。
参见图4所示,该图为本申请实施例提供的一种基于博弈的网络资源分配装置的结构示意图。如图4所示,该基于博弈的网络资源分配装置包括:
第一确定单元401,用于基于网络中处理目标资源的设备的数量确定公共物品博弈模型中包括的博弈节点的数量,所述处理目标资源的设备包括占用目标资源的设备和分享目标资源的设备;
划分单元402,用于将所述公共物品博弈模型中的博弈节点划分为至少两种类型的博弈节点,不同类型的博弈节点的投资值不同,所述公共物品博弈模型中的博弈节点处于合作者状态或者处于背叛者状态,所述博弈节点处于合作者状态的概率和处于背叛者状态的概率相同;
第二确定单元403,用于在所述公共物品博弈模型的博弈节点中选择目标节点,确定所述目标节点所属的各个博弈团体以及所述各个博弈团体博弈后得到的收益,所述博弈团体的收益是基于所述博弈团体包括的处于合作者状态的博弈节点的投资值确定的;
选择单元404,用于在以所述目标节点为中心节点的博弈团体中,选择所述目标节点的目标邻居节点;
调整单元405,用于基于调整概率将所述目标节点的状态调整为所述目标邻居节点的状态,所述调整概率是基于所述目标节点的收益和所述目标邻居节点的收益确定的,所述目标节点的收益和所述目标邻居节点的收益是基于所述目标节点所属的博弈团体的收益确定的;
清零单元406,用于将所述公共物品博弈模型中的博弈节点的收益清零;
执行单元407,用于返回执行所述在所述公共物品博弈模型的博弈节点中选择目标节点,确定所述目标节点所属的各个博弈团体以及所述各个博弈团体博弈后得到的收益以及后续步骤,直到所述公共物品博弈模型中处于所述合作者状态的博弈节点在所述公共物品博弈模型的占比不变,获取所述占比;
第三确定单元408,用于基于所述占比确定所述网络中分享目标资源的设备的数量。
在一种可能的实现方式中,所述调整概率是采用如下方式确定的:
基于所述目标节点的收益与所述目标邻居节点的收益的差值,得到第一数值;
计算1与所述e的第一数值次方的和,得到第二数值;
计算所述第二数值的倒数,得到所述调整概率。
在一种可能的实现方式中,所述目标节点的收益为采用如下方式确定的:
计算目标博弈团体的收益与收益参数的乘积,得到团体收益值,所述目标博弈团体为所述目标节点所属的博弈团体中的每一个;
将所述团体收益值除以所述目标博弈团体包括的博弈节点的数量,得到第一节点收益;
若所述目标节点为处于合作者状态,计算所述第一节点收益与所述目标节点的投资值的差值,得到第二节点收益,计算每个所述博弈团体的第二节点收益之和,得到所述目标节点的收益;
若所述目标节点为处于背叛者状态,计算每个所述博弈团体的第一节点收益之和,得到所述目标节点的收益。
在一种可能的实现方式中,所述划分单元402,用于将所述公共物品博弈模型中的博弈节点划分为至少两种类型的节点,包括:
所述划分单元402,具体用于将所述公共物品博弈模型中的博弈节点划分为第一类型的博弈节点和第二类型的博弈节点,所述第一类型的博弈节点的投资值为固定的预设值,所述第二类型的博弈节点的投资值基于所述第二类型的博弈节点所属的博弈团体中处于合作者状态的博弈节点的数量确定。
在一种可能的实现方式中,所述目标节点所属的博弈团体包括所述目标节点作为中心节点的博弈团体和所述目标节点作为中心节点的邻居节点的博弈团体。
基于上述方法实施例提供的一种基于博弈的网络资源分配方法,本申请提供一种基于博弈的网络资源分配设备,包括:处理器、存储器、系统总线;
所述处理器以及所述存储器通过所述系统总线相连;
所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行上述任一实施例所述的方法。
基于上述方法实施例提供的一种基于博弈的网络资源分配方法,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行上述任一实施例所述的方法。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统或装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种基于博弈的网络资源分配方法,其特征在于,所述方法包括:
基于网络中处理目标资源的设备的数量确定公共物品博弈模型中包括的博弈节点的数量,所述处理目标资源的设备包括占用目标资源的设备和分享目标资源的设备;
将所述公共物品博弈模型中的博弈节点划分为至少两种类型的博弈节点,不同类型的博弈节点的投资值不同,所述公共物品博弈模型中的博弈节点处于合作者状态或者处于背叛者状态,所述博弈节点处于合作者状态的概率和处于背叛者状态的概率相同;
在所述公共物品博弈模型的博弈节点中选择目标节点,确定所述目标节点所属的各个博弈团体以及所述各个博弈团体博弈后得到的收益,所述博弈团体的收益是基于所述博弈团体包括的处于合作者状态的博弈节点的投资值确定的;
在以所述目标节点为中心节点的博弈团体中,选择所述目标节点的目标邻居节点;
基于调整概率将所述目标节点的状态调整为所述目标邻居节点的状态,所述调整概率是基于所述目标节点的收益和所述目标邻居节点的收益确定的,所述目标节点的收益和所述目标邻居节点的收益是基于所述目标节点所属的博弈团体的收益确定的;
将所述公共物品博弈模型中的博弈节点的收益清零;
返回执行所述在所述公共物品博弈模型的博弈节点中选择目标节点,确定所述目标节点所属的各个博弈团体以及所述各个博弈团体博弈后得到的收益以及后续步骤,直到所述公共物品博弈模型中处于所述合作者状态的博弈节点在所述公共物品博弈模型的占比不变,获取所述占比;
基于所述占比确定所述网络中分享目标资源的设备的数量。
2.根据权利要求1所述的方法,其特征在于,所述调整概率是采用如下方式确定的:
基于所述目标节点的收益与所述目标邻居节点的收益的差值,得到第一数值;
计算1与e的第一数值次方的和,得到第二数值;
计算所述第二数值的倒数,得到所述调整概率。
3.根据权利要求1或2所述的方法,其特征在于,所述目标节点的收益为采用如下方式确定的:
计算目标博弈团体的收益与收益参数的乘积,得到团体收益值,所述目标博弈团体为所述目标节点所属的博弈团体中的每一个;
将所述团体收益值除以所述目标博弈团体包括的博弈节点的数量,得到第一节点收益;
若所述目标节点为处于合作者状态,计算所述第一节点收益与所述目标节点的投资值的差值,得到第二节点收益,计算每个所述博弈团体的第二节点收益之和,得到所述目标节点的收益;
若所述目标节点为处于背叛者状态,计算每个所述博弈团体的第一节点收益之和,得到所述目标节点的收益。
4.根据权利要求1所述的方法,其特征在于,所述将所述公共物品博弈模型中的博弈节点划分为至少两种类型的节点,包括:
将所述公共物品博弈模型中的博弈节点划分为第一类型的博弈节点和第二类型的博弈节点,所述第一类型的博弈节点的投资值为固定的预设值,所述第二类型的博弈节点的投资值基于所述第二类型的博弈节点所属的博弈团体中处于合作者状态的博弈节点的数量确定。
5.根据权利要求1所述的方法,其特征在于,所述目标节点所属的博弈团体包括所述目标节点作为中心节点的博弈团体和所述目标节点作为中心节点的邻居节点的博弈团体。
6.一种基于博弈的网络资源分配装置,其特征在于,所述装置包括:
第一确定单元,用于基于网络中处理目标资源的设备的数量确定公共物品博弈模型中包括的博弈节点的数量,所述处理目标资源的设备包括占用目标资源的设备和分享目标资源的设备;
划分单元,用于将所述公共物品博弈模型中的博弈节点划分为至少两种类型的博弈节点,不同类型的博弈节点的投资值不同,所述公共物品博弈模型中的博弈节点处于合作者状态或者处于背叛者状态,所述博弈节点处于合作者状态的概率和处于背叛者状态的概率相同;
第二确定单元,用于在所述公共物品博弈模型的博弈节点中选择目标节点,确定所述目标节点所属的各个博弈团体以及所述各个博弈团体博弈后得到的收益,所述博弈团体的收益是基于所述博弈团体包括的处于合作者状态的博弈节点的投资值确定的;
选择单元,用于在以所述目标节点为中心节点的博弈团体中,选择所述目标节点的目标邻居节点;
调整单元,用于基于调整概率将所述目标节点的状态调整为所述目标邻居节点的状态,所述调整概率是基于所述目标节点的收益和所述目标邻居节点的收益确定的,所述目标节点的收益和所述目标邻居节点的收益是基于所述目标节点所属的博弈团体的收益确定的;
清零单元,用于将所述公共物品博弈模型中的博弈节点的收益清零;
执行单元,用于返回执行所述在所述公共物品博弈模型的博弈节点中选择目标节点,确定所述目标节点所属的各个博弈团体以及所述各个博弈团体博弈后得到的收益以及后续步骤,直到所述公共物品博弈模型中处于所述合作者状态的博弈节点在所述公共物品博弈模型的占比不变,获取所述占比;
第三确定单元,用于基于所述占比确定所述网络中分享目标资源的设备的数量。
7.根据权利要求6所述的装置,其特征在于,所述调整概率是采用如下方式确定的:
基于所述目标节点的收益与所述目标邻居节点的收益的差值,得到第一数值;
计算1与e的第一数值次方的和,得到第二数值;
计算所述第二数值的倒数,得到所述调整概率。
8.根据权利要求6或7所述的装置,其特征在于,所述目标节点的收益为采用如下方式确定的:
计算目标博弈团体的收益与收益参数的乘积,得到团体收益值,所述目标博弈团体为所述目标节点所属的博弈团体中的每一个;
将所述团体收益值除以所述目标博弈团体包括的博弈节点的数量,得到第一节点收益;
若所述目标节点为处于合作者状态,计算所述第一节点收益与所述目标节点的投资值的差值,得到第二节点收益,计算每个所述博弈团体的第二节点收益之和,得到所述目标节点的收益;
若所述目标节点为处于背叛者状态,计算每个所述博弈团体的第一节点收益之和,得到所述目标节点的收益。
9.根据权利要求6所述的装置,其特征在于,所述划分单元,用于将所述公共物品博弈模型中的博弈节点划分为至少两种类型的节点,包括:
所述划分单元,具体用于将所述公共物品博弈模型中的博弈节点划分为第一类型的博弈节点和第二类型的博弈节点,所述第一类型的博弈节点的投资值为固定的预设值,所述第二类型的博弈节点的投资值基于所述第二类型的博弈节点所属的博弈团体中处于合作者状态的博弈节点的数量确定。
10.根据权利要求6所述的装置,其特征在于,所述目标节点所属的博弈团体包括所述目标节点作为中心节点的博弈团体和所述目标节点作为中心节点的邻居节点的博弈团体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210440651.7A CN114826917B (zh) | 2022-04-25 | 2022-04-25 | 一种基于博弈的网络资源分配方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210440651.7A CN114826917B (zh) | 2022-04-25 | 2022-04-25 | 一种基于博弈的网络资源分配方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114826917A CN114826917A (zh) | 2022-07-29 |
CN114826917B true CN114826917B (zh) | 2023-12-08 |
Family
ID=82508126
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210440651.7A Active CN114826917B (zh) | 2022-04-25 | 2022-04-25 | 一种基于博弈的网络资源分配方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114826917B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115473905B (zh) * | 2022-09-29 | 2024-10-01 | 中国农业银行股份有限公司 | 资源配置方法、装置、电子设备、存储介质及程序产品 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102076025A (zh) * | 2011-01-04 | 2011-05-25 | 南京邮电大学 | 基于Stackeberg博弈认知网络资源分配方法 |
CN107733518A (zh) * | 2017-09-30 | 2018-02-23 | 南京理工大学 | 基于合作博弈的leo卫星网络最优收益路由方法 |
CN109919791A (zh) * | 2019-02-25 | 2019-06-21 | 北方工业大学 | 基于介数分析囚徒困境网络博弈中合作水平的方法及系统 |
CN113037876A (zh) * | 2021-05-25 | 2021-06-25 | 中国人民解放军国防科技大学 | 基于合作博弈的云下行任务边缘节点资源分配方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11077362B2 (en) * | 2018-12-03 | 2021-08-03 | Sony Interactive Entertainment LLC | Machine learning driven resource allocation |
-
2022
- 2022-04-25 CN CN202210440651.7A patent/CN114826917B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102076025A (zh) * | 2011-01-04 | 2011-05-25 | 南京邮电大学 | 基于Stackeberg博弈认知网络资源分配方法 |
CN107733518A (zh) * | 2017-09-30 | 2018-02-23 | 南京理工大学 | 基于合作博弈的leo卫星网络最优收益路由方法 |
CN109919791A (zh) * | 2019-02-25 | 2019-06-21 | 北方工业大学 | 基于介数分析囚徒困境网络博弈中合作水平的方法及系统 |
CN113037876A (zh) * | 2021-05-25 | 2021-06-25 | 中国人民解放军国防科技大学 | 基于合作博弈的云下行任务边缘节点资源分配方法 |
Non-Patent Citations (2)
Title |
---|
一种高聚类幂律可调网络异质配置模式下的公共品博弈研究;苗萍;杨洪勇;;复杂系统与复杂性科学(第02期);全文 * |
加权有向社会网络中的准公共物品博弈研究;武胜良;;科技通报(第08期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114826917A (zh) | 2022-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111093203B (zh) | 一种基于环境感知的服务功能链低成本智能部署方法 | |
CN111176820B (zh) | 一种基于深度神经网络的边缘计算任务的分配方法及装置 | |
Bar-On et al. | Individual regret in cooperative nonstochastic multi-armed bandits | |
CN114826917B (zh) | 一种基于博弈的网络资源分配方法及装置 | |
Bistritz et al. | My fair bandit: Distributed learning of max-min fairness with multi-player bandits | |
US6917811B2 (en) | Method for dynamically assigning channel in real time based on genetic algorithm | |
Alabau et al. | New hybrid genetic algorithms for the frequency assignment problem | |
Duarte et al. | A dynamic migration policy to the island model | |
CN113724096A (zh) | 一种基于公共品演化博弈模型的群体知识共享方法 | |
CN114698128A (zh) | 一种认知星地网络的抗干扰信道选择方法和系统 | |
CN112737726A (zh) | 一种静态与动态相融合的tdma时隙分配方法 | |
Jiang et al. | Q-learning for non-cooperative channel access game of cognitive radio networks | |
CN105391490A (zh) | 一种基于认知的卫星通信网络选择算法 | |
CN114173421B (zh) | 基于深度强化学习的LoRa逻辑信道及功率分配方法 | |
CN113141272B (zh) | 基于迭代优化rbf神经网络的网络安全态势分析方法 | |
Brunetti et al. | Minimum weight dynamo and fast opinion spreading | |
Masehian et al. | Solving the n-Queens Problem Using a Tuned Hybrid Imperialist Competitive Algorithm. | |
CN112506644B (zh) | 基于云边端混合计算模式系统的任务调度方法和系统 | |
CN110234167B (zh) | 一种信道分配方法、信道分配装置及电子设备 | |
CN111082983A (zh) | 一种网络模拟演化方法及装置 | |
CN115473905B (zh) | 资源配置方法、装置、电子设备、存储介质及程序产品 | |
CN110620818B (zh) | 一种实现节点分配的方法、装置及相关设备 | |
Huang | Distributed algorithm design for network optimization problems with coupled objectives | |
Gajduk et al. | Energy-efficiency in decentralized wireless networks: A game-theoretic approach inspired by evolutionary biology | |
Raoof et al. | Competitive spectrum sharing in wireless networks: a dynamic non-cooperative game approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |