CN108681921B - 一种基于随机博弈获取群智感知激励策略的方法及装置 - Google Patents

一种基于随机博弈获取群智感知激励策略的方法及装置 Download PDF

Info

Publication number
CN108681921B
CN108681921B CN201810456353.0A CN201810456353A CN108681921B CN 108681921 B CN108681921 B CN 108681921B CN 201810456353 A CN201810456353 A CN 201810456353A CN 108681921 B CN108681921 B CN 108681921B
Authority
CN
China
Prior art keywords
task
participant
acquiring
information
completed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810456353.0A
Other languages
English (en)
Other versions
CN108681921A (zh
Inventor
陈昕
李卓
陈莹
赵禹哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Information Science and Technology University
Original Assignee
Beijing Information Science and Technology University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Information Science and Technology University filed Critical Beijing Information Science and Technology University
Priority to CN201810456353.0A priority Critical patent/CN108681921B/zh
Publication of CN108681921A publication Critical patent/CN108681921A/zh
Application granted granted Critical
Publication of CN108681921B publication Critical patent/CN108681921B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0207Discounts or incentives, e.g. coupons or rebates
    • G06Q30/0236Incentive or reward received by requiring registration or ID from user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0639Item locations

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供一种基于随机博弈获取群智感知激励策略的方法及装置,所述方法包括:获取任务发布者的预算信息、任务参与者当前的位置信息和所述任务参与者已执行的当前任务的所在地信息;根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益;获取与所述所在地信息位置相关的待完成任务,并获取完成所述待完成任务的期望报酬之和;根据所述直接收益和所述期望报酬之和,构建行为概率的博弈矩阵;并分析博弈矩阵的求解结果以获取群智感知激励策略。所述装置执行上述方法。本发明实施例提供的方法及装置,能够合理获取该行为概率,进而给出有效的激励策略。

Description

一种基于随机博弈获取群智感知激励策略的方法及装置
技术领域
本发明实施例涉及博弈技术领域,具体涉及一种基于随机博弈获取群智感知激励策略的方法及装置。
背景技术
近年来,随着无线通信以及科学技术的迅猛发展,智能手机等智能设备越来越普及,其计算感知能力越来越强大。智能设备内嵌摄像头、加速传感器、全球定位系统(GPS)等感知设备,用户可通过感知设备感知周围环境信息,“移动群智感知”即为这样一种新的感知模式,将参与者携带的智能感知设备看成基本感知单元,大量参与者利用其完成大规模复杂的感知任务,帮助专业人士收集和分析数据。
如果所有智能感知设备都参与获取感知数据任务,感知网络将成为最大的网络。因此用户参与度对系统是否能够获取高质量感知数据起至关重要的作用。然而在机会网络中传输数据时会消耗电池、网络流量,上传数据过程中也会暴露用户的位置信息。由于用户的自私性,用户不愿意自愿完成任务,因此为了确保数据的覆盖率以及可靠性,需要采取适当的激励机制提高用户参与积极性。然而目前关于移动群智感知的激励算法,均未考虑到用户的不确定性,即使给出用户很高的报酬,用户可能出于对任务的难度、任务的距离等问题的考虑,不会选择完成该任务。
因此,如何避免上述缺陷,合理获取反映任务参与者执行待完成任务意愿的行为概率,并分析该行为概率,进而给出有效的激励策略,成为亟须解决的问题。
发明内容
针对现有技术存在的问题,本发明实施例提供一种基于随机博弈获取群智感知激励策略的方法及装置。
第一方面,本发明实施例提供一种基于随机博弈获取群智感知激励策略的方法,所述方法包括:
获取任务发布者的预算信息、任务参与者当前的位置信息和所述任务参与者已执行的当前任务的所在地信息;
根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益;
获取与所述所在地信息位置相关的待完成任务,并获取完成所述待完成任务的期望报酬之和;
根据所述直接收益和所述期望报酬之和,构建反映所述任务参与者执行所述待完成任务意愿的行为概率的博弈矩阵;求解所述博弈矩阵的纳什均衡,并将所述纳什均衡作为所述博弈矩阵的求解结果,分析所述求解结果以获取群智感知激励策略。
第二方面,本发明实施例提供一种基于随机博弈获取群智感知激励策略的装置,所述装置包括:
第一获取单元,用于获取任务发布者的预算信息、任务参与者当前的位置信息和所述任务参与者已执行的当前任务的所在地信息;
计算单元,用于根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益;
第二获取单元,用于获取与所述所在地信息位置相关的待完成任务,并获取完成所述待完成任务的期望报酬之和;
构建单元,用于根据所述直接收益和所述期望报酬之和,构建反映所述任务参与者执行所述待完成任务意愿的行为概率的博弈矩阵;求解所述博弈矩阵的纳什均衡,并将所述纳什均衡作为所述博弈矩阵的求解结果,分析所述求解结果以获取群智感知激励策略。
第三方面,本发明实施例提供一种电子设备,包括:处理器、存储器和总线,其中,
所述处理器和所述存储器通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如下方法:
获取任务发布者的预算信息、任务参与者当前的位置信息和所述任务参与者已执行的当前任务的所在地信息;
根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益;
获取与所述所在地信息位置相关的待完成任务,并获取完成所述待完成任务的期望报酬之和;
根据所述直接收益和所述期望报酬之和,构建反映所述任务参与者执行所述待完成任务意愿的行为概率的博弈矩阵;求解所述博弈矩阵的纳什均衡,并将所述纳什均衡作为所述博弈矩阵的求解结果,分析所述求解结果以获取群智感知激励策略。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,包括:
所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如下方法:
获取任务发布者的预算信息、任务参与者当前的位置信息和所述任务参与者已执行的当前任务的所在地信息;
根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益;
获取与所述所在地信息位置相关的待完成任务,并获取完成所述待完成任务的期望报酬之和;
根据所述直接收益和所述期望报酬之和,构建反映所述任务参与者执行所述待完成任务意愿的行为概率的博弈矩阵;求解所述博弈矩阵的纳什均衡,并将所述纳什均衡作为所述博弈矩阵的求解结果,分析所述求解结果以获取群智感知激励策略。
本发明实施例提供的基于随机博弈获取群智感知激励策略的方法及装置,通过构建反映任务参与者执行待完成任务意愿的行为概率的博弈矩阵;并分析博弈矩阵的求解结果获取群智感知激励策略,能够合理获取该行为概率,进而给出有效的激励策略。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例基于随机博弈获取群智感知激励策略的方法流程示意图;
图2为本发明实施例待完成任务的轨迹分布图;
图3为本发明实施例待完成任务的任务转化图;
图4为本发明实施例基于随机博弈获取群智感知激励策略的装置结构示意图;
图5为本发明实施例提供的电子设备实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例基于随机博弈获取群智感知激励策略的方法流程示意图,如图1所示,本发明实施例提供的一种基于随机博弈获取群智感知激励策略的方法,包括以下步骤:
S101:获取任务发布者的预算信息、任务参与者当前的位置信息和所述任务参与者已执行的当前任务的所在地信息。
具体的,装置获取任务发布者的预算信息、任务参与者当前的位置信息和所述任务参与者已执行的当前任务的所在地信息。任务可以包括去某地采集任务发布者所需要的数据,数据类型可以为噪音感知数据、实时公交信息感知数据、空气质量感知数据、交通拥堵情况感知数据和公共基础设施感知数据等。预算信息可以理解为任务发布者让任务参与者完成任务所支付报酬的预算。位置信息和所在地信息可采用地理坐标或经纬度等表示,不作具体限定。
S102:根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益。
具体的,装置根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益。可以根据如下公式计算所述直接收益:
Figure BDA0001659775210000051
其中,Rw为直接收益、α为
Figure BDA0001659775210000052
占Rw的预设比例、β为li×w占Rw的预设比例,且α+β=1;hi为第i个任务完成难易程度的大小、K为任务总数、B为任务发布者的总预算、li为所述位置信息对应的位置与所述所在地信息对应的位置之间的距离、w为预设单位距离对应的报酬。预设的报酬计算函数可以理解为上述的公式。α和β的具体数值可根据实际情况自主设置。需要说明的是:任务完成难易程度的大小可以用自然数数值大小表示,例如1表示任务最简单,10表示任务最困难。预设单位距离对应的报酬可以由任务发布者设置,报酬的类型不作具体限定,可以为虚拟的金币等,举例说明如下:li为4.5公里,预设单位距离对应的报酬为100奖励币/1公里,当任务参与者完成了该任务,就可以获得450个奖励币的奖励。
S103:获取与所述所在地信息位置相关的待完成任务,并获取完成所述待完成任务的期望报酬之和。
具体的,装置获取与所述所在地信息位置相关的待完成任务,并获取完成所述待完成任务的期望报酬之和。可以通过如下步骤实现:
计算所述任务发布者在支付当前任务的报酬为Ti的条件下,所述任务参与者在博弈状态Sl下采取动作Wj的概率
Figure BDA0001659775210000062
其中,动作Wj表示从所述当前任务的所在地k到待完成任务的待去所在地1的概率;
根据如下公式计算所述期望报酬之和:
Figure BDA0001659775210000061
其中,Tl为所述任务参与者从所述当前任务的所在地k到所述待去所在地l,并完成所述待完成任务时,所述任务发布者支付的报酬。图2为本发明实施例待完成任务的轨迹分布图,当前任务在图2中“1”的位置,待完成任务是由图2中“2”~“8”表示。为了进一步简化说明,引入图3,图3为本发明实施例待完成任务的任务转化图,如图3所示,博弈状态Sl是图3中的S1~S8,w1~w8为参与组合的动作。pij(wn)表示从状态i(待完成任务i)到状态j(待完成任务j)采取动作wn的概率。
参照图3,任务参与者集合W={W1,W2,W3,W4};
其中,W1={w2,w3,w4},W2={w5,w6},W3={w7},W4={w8};
任务发布者集合T={T1,T2,T3,T4};
其中,T1={t3,t4,t5},T2={t1,t2,t4},T3={t2,t5},T4={t2,t4},参照上述举例,t1~t5分别表示噪音感知数据、实时公交信息感知数据、空气质量感知数据、交通拥堵情况感知数据和公共基础设施感知数据对应的支付报酬,T1={t3,t4,t5}表示与W1对应的任务发布者要采集的空气质量感知数据、交通拥堵情况感知数据和公共基础设施感知数据,由W1和T1构成的博弈矩阵可以表示如下:
Figure BDA0001659775210000071
其中,R(w2,t3)表示任务参与者采取动作w2,获取t3类型的数据所获得的期望报酬;该博弈矩阵的其他元素的说明不再赘述。
参照图3,并以S2为例,假设任务参与者完成任务2后,可能去任务5和6,计算去任务5完成任务的报酬×去任务5的概率+去任务6完成任务的报酬×去任务6的概率,所求之和即博弈状态S2的期望报酬之和,其他博弈状态的期望报酬之和不再赘述。
需要说明的是:
Figure BDA0001659775210000076
可以采用随机生成的方式获取。
S104:根据所述直接收益和所述期望报酬之和,构建反映所述任务参与者执行所述待完成任务意愿的行为概率的博弈矩阵;求解所述博弈矩阵的纳什均衡,并将所述纳什均衡作为所述博弈矩阵的求解结果,分析所述求解结果以获取群智感知激励策略。
具体的,装置根据所述直接收益和所述期望报酬之和,构建反映所述任务参与者执行所述待完成任务意愿的行为概率的博弈矩阵;求解所述博弈矩阵的纳什均衡,并将所述纳什均衡作为所述博弈矩阵的求解结果,分析所述求解结果以获取群智感知激励策略。可以根据如下公式计算期望总收益,并作为博弈矩阵中的每个元素:
Figure BDA0001659775210000072
其中,
Figure BDA0001659775210000073
是所述期望总收益,作为所述博弈矩阵的第i行、第j列的元素;
Figure BDA0001659775210000074
是对应上述Rw
参照上述举例说明如下:表1为S1状态下的博弈矩阵,如表1所示:
表1
Figure BDA0001659775210000075
Figure BDA0001659775210000081
带有“-”标记的数值为任务发布者支付的报酬、不带有“-”标记的数值为任务参与者得到的报酬。
求解的纳什均衡为
Figure BDA0001659775210000082
表2为S2状态下的博弈矩阵,如表所示:
表2
Figure BDA0001659775210000083
可参照表1的具体说明,同理,求解的纳什均衡为
Figure BDA0001659775210000084
由于S3、S4状态下只有一种任务选择,对应求解的纳什均衡为
Figure BDA0001659775210000085
需要说明的是:
Figure BDA0001659775210000086
表示完成任务1后任务参与者完成任务2的概率为
Figure BDA0001659775210000087
完成任务3的概率为0,完成任务4的概率为
Figure BDA0001659775210000088
Figure BDA0001659775210000089
Figure BDA00016597752100000810
为混合策略;
Figure BDA00016597752100000811
Figure BDA00016597752100000812
为纯策略。任务参与者根据所求结果,在完成任务1后,可从任务2,3,4中选择任务4完成,在完成任务2后,可选择任务5完成。该求解结果可供任务发布者分析,获取群智感知激励策略,即通过分析行为概率的数值大小,如果数值较小,增加报酬;如果数值较大,减少报酬。
本发明实施例提供的基于随机博弈获取群智感知激励策略的方法,通过构建反映任务参与者执行待完成任务意愿的行为概率的博弈矩阵;并分析博弈矩阵的求解结果获取群智感知激励策略,能够合理获取该行为概率,进而给出有效的激励策略。
在上述实施例的基础上,所述根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益,包括:
根据如下公式计算所述直接收益:
Figure BDA0001659775210000091
其中,Rw为直接收益、α为
Figure BDA0001659775210000092
占Rw的预设比例、β为li×w占Rw的预设比例,且α+β=1;hi为第i个任务完成难易程度的大小、K为任务总数、B为任务发布者的总预算、li为所述位置信息对应的位置与所述所在地信息对应的位置之间的距离、w为预设单位距离对应的报酬。
具体的,装置根据如下公式计算所述直接收益:
Figure BDA0001659775210000093
其中,Rw为直接收益、α为
Figure BDA0001659775210000094
占Rw的预设比例、β为li×w占Rw的预设比例,且α+β=1;hi为第i个任务完成难易程度的大小、K为任务总数、B为任务发布者的总预算、li为所述位置信息对应的位置与所述所在地信息对应的位置之间的距离、w为预设单位距离对应的报酬。可参照上述实施例,不再赘述。
本发明实施例提供的基于随机博弈获取群智感知激励策略的方法,通过具体的公式能够准确计算直接收益,保证获取群智感知激励策略的正常进行。
在上述实施例的基础上,所述并获取完成所述待完成任务的期望报酬之和,包括:
计算所述任务发布者在支付当前任务的报酬为Ti的条件下,所述任务参与者在博弈状态Sl下采取动作Wj的概率
Figure BDA0001659775210000101
其中,动作Wj表示从所述当前任务的所在地k到待完成任务的待去所在地l的概率。
具体的,装置计算所述任务发布者在支付当前任务的报酬为Ti的条件下,所述任务参与者在博弈状态Sl下采取动作Wj的概率
Figure BDA0001659775210000102
其中,动作Wj表示从所述当前任务的所在地k到待完成任务的待去所在地l的概率。可参照上述实施例,不再赘述。
根据如下公式计算所述期望报酬之和:
Figure BDA0001659775210000103
其中,Tl为所述任务参与者从所述当前任务的所在地k到所述待去所在地l,并完成所述待完成任务时,所述任务发布者支付的报酬。
具体的,装置根据如下公式计算所述期望报酬之和:
Figure BDA0001659775210000104
其中,Tl为所述任务参与者从所述当前任务的所在地k到所述待去所在地l,并完成所述待完成任务时,所述任务发布者支付的报酬。可参照上述实施例,不再赘述。
本发明实施例提供的基于随机博弈获取群智感知激励策略的方法,通过具体的公式合理计算期望报酬之和,进一步保证获取群智感知激励策略的正常进行。
在上述实施例的基础上,所述根据所述直接收益和所述期望报酬之和,构建反映所述任务参与者执行所述待完成任务意愿的行为概率的博弈矩阵,包括:
根据如下公式计算期望总收益:
Figure BDA0001659775210000111
其中,
Figure BDA0001659775210000112
是所述期望总收益,作为所述博弈矩阵的第i行、第j列的元素;
Figure BDA0001659775210000113
是对应上述Rw
具体的,装置根据如下公式计算期望总收益:
Figure BDA0001659775210000114
其中,
Figure BDA0001659775210000115
是所述期望总收益,作为所述博弈矩阵的第i行、第j列的元素;
Figure BDA0001659775210000116
是对应上述Rw。可参照上述实施例,不再赘述。
本发明实施例提供的基于随机博弈获取群智感知激励策略的方法,通过具体的公式准确计算期望总收益,进一步保证获取群智感知激励策略的正常进行。
在上述实施例的基础上,所述任务包括使所述任务参与者去指定地采集所述任务发布者所需要的数据。
具体的,装置中的,所述任务包括使所述任务参与者去指定地采集所述任务发布者所需要的数据。可参照上述实施例,不再赘述。
本发明实施例提供的基于随机博弈获取群智感知激励策略的方法,通过将任务选为使任务参与者去指定地采集任务发布者所需要的数据,能够合理获取任务参与者去指定地采集任务发布者所需要的数据的行为概率,进而给出有效的激励策略。
在上述实施例的基础上,所述数据的数据类型包括噪音感知数据、实时公交信息感知数据、空气质量感知数据、交通拥堵情况感知数据和公共基础设施感知数据。
具体的,装置中的所述数据的数据类型包括噪音感知数据、实时公交信息感知数据、空气质量感知数据、交通拥堵情况感知数据和公共基础设施感知数据。可参照上述实施例,不再赘述。
本发明实施例提供的基于随机博弈获取群智感知激励策略的方法,通过将数据类型选为噪音感知数据、实时公交信息感知数据、空气质量感知数据、交通拥堵情况感知数据和公共基础设施感知数据,能够有针对性地获取任务中的数据。
在上述实施例的基础上,,所述方法还包括:
存储获取到的所述群智感知激励策略。
具体的,装置存储获取到的所述群智感知激励策略。可参照上述实施例不再赘述。
本发明实施例提供的基于随机博弈获取群智感知激励策略的方法,通过存储获取到的群智感知激励策略,便于对群智感知激励策略进行管理。
图4为本发明实施例基于随机博弈获取群智感知激励策略的装置结构示意图,如图4所示,本发明实施例提供了一种基于随机博弈获取群智感知激励策略的装置,包括第一获取单元401、计算单元402、第二获取单元403和构建单元404,其中:
第一获取单元401用于获取任务发布者的预算信息、任务参与者当前的位置信息和所述任务参与者已执行的当前任务的所在地信息;计算单元402用于根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益;第二获取单元403用于获取与所述所在地信息位置相关的待完成任务,并获取完成所述待完成任务的期望报酬之和;构建单元404用于根据所述直接收益和所述期望报酬之和,构建反映所述任务参与者执行所述待完成任务意愿的行为概率的博弈矩阵;求解所述博弈矩阵的纳什均衡,并将所述纳什均衡作为所述博弈矩阵的求解结果,分析所述求解结果以获取群智感知激励策略。
具体的,第一获取单元401用于获取任务发布者的预算信息、任务参与者当前的位置信息和所述任务参与者已执行的当前任务的所在地信息;计算单元402用于根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益;第二获取单元403用于获取与所述所在地信息位置相关的待完成任务,并获取完成所述待完成任务的期望报酬之和;构建单元404用于根据所述直接收益和所述期望报酬之和,构建反映所述任务参与者执行所述待完成任务意愿的行为概率的博弈矩阵;求解所述博弈矩阵的纳什均衡,并将所述纳什均衡作为所述博弈矩阵的求解结果,分析所述求解结果以获取群智感知激励策略。
本发明实施例提供的基于随机博弈获取群智感知激励策略的装置,通过构建反映任务参与者执行待完成任务意愿的行为概率的博弈矩阵;并分析博弈矩阵的求解结果获取群智感知激励策略,能够合理获取该行为概率,进而给出有效的激励策略。
本发明实施例提供的基于随机博弈获取群智感知激励策略的装置具体可以用于执行上述各方法实施例的处理流程,其功能在此不再赘述,可以参照上述方法实施例的详细描述。
图5为本发明实施例提供的电子设备实体结构示意图,如图5所示,所述电子设备包括:处理器(processor)501、存储器(memory)502和总线503;
其中,所述处理器501、存储器502通过总线503完成相互间的通信;
所述处理器501用于调用所述存储器502中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:获取任务发布者的预算信息、任务参与者当前的位置信息和所述任务参与者已执行的当前任务的所在地信息;根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益;获取与所述所在地信息位置相关的待完成任务,并获取完成所述待完成任务的期望报酬之和;根据所述直接收益和所述期望报酬之和,构建反映所述任务参与者执行所述待完成任务意愿的行为概率的博弈矩阵;求解所述博弈矩阵的纳什均衡,并将所述纳什均衡作为所述博弈矩阵的求解结果,分析所述求解结果以获取群智感知激励策略。
本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:获取任务发布者的预算信息、任务参与者当前的位置信息和所述任务参与者已执行的当前任务的所在地信息;根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益;获取与所述所在地信息位置相关的待完成任务,并获取完成所述待完成任务的期望报酬之和;根据所述直接收益和所述期望报酬之和,构建反映所述任务参与者执行所述待完成任务意愿的行为概率的博弈矩阵;求解所述博弈矩阵的纳什均衡,并将所述纳什均衡作为所述博弈矩阵的求解结果,分析所述求解结果以获取群智感知激励策略。
本实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:获取任务发布者的预算信息、任务参与者当前的位置信息和所述任务参与者已执行的当前任务的所在地信息;根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益;获取与所述所在地信息位置相关的待完成任务,并获取完成所述待完成任务的期望报酬之和;根据所述直接收益和所述期望报酬之和,构建反映所述任务参与者执行所述待完成任务意愿的行为概率的博弈矩阵;求解所述博弈矩阵的纳什均衡,并将所述纳什均衡作为所述博弈矩阵的求解结果,分析所述求解结果以获取群智感知激励策略。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的电子设备等实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上各实施例仅用以说明本发明的实施例的技术方案,而非对其限制;尽管参照前述各实施例对本发明的实施例进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明的实施例各实施例技术方案的范围。

Claims (8)

1.一种基于随机博弈获取群智感知激励策略的方法,其特征在于,包括:
获取任务发布者的预算信息、任务参与者当前的位置信息和所述任务参与者已执行的当前任务的所在地信息;
根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益;
获取与所述所在地信息位置相关的待完成任务,并获取完成所述待完成任务的期望报酬之和;
根据所述直接收益和所述期望报酬之和,构建反映所述任务参与者执行所述待完成任务意愿的行为概率的博弈矩阵;求解所述博弈矩阵的纳什均衡,并将所述纳什均衡作为所述博弈矩阵的求解结果,分析所述求解结果以获取群智感知激励策略;
所述根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益,包括:
根据如下公式计算所述直接收益:
Figure DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE004
为直接收益、
Figure DEST_PATH_IMAGE006
Figure DEST_PATH_IMAGE008
Figure DEST_PATH_IMAGE004A
的预设比例、
Figure DEST_PATH_IMAGE011
Figure DEST_PATH_IMAGE013
Figure DEST_PATH_IMAGE004AA
的预设比例,且
Figure DEST_PATH_IMAGE016
Figure DEST_PATH_IMAGE018
为第i个任务完成难易程度的大小、K为任务总数、
Figure DEST_PATH_IMAGE020
为任务发布者的总预算、
Figure DEST_PATH_IMAGE022
为所述位置信息对应的位置与所述所在地信息对应的位置之间的距离、
Figure DEST_PATH_IMAGE024
为预设单位距离对应的报酬;
所述并获取完成所述待完成任务的期望报酬之和,包括:
计算所述任务发布者在支付当前任务的报酬为
Figure DEST_PATH_IMAGE026
的条件下,所述任务参与者在博弈状态
Figure DEST_PATH_IMAGE028
下采取动作
Figure DEST_PATH_IMAGE030
的概率
Figure DEST_PATH_IMAGE032
;其中,动作
Figure DEST_PATH_IMAGE030A
表示从所述当前任务的所在地k到待完成任务的待去所在地l的概率;
根据如下公式计算所述期望报酬之和:
Figure DEST_PATH_IMAGE035
其中,
Figure DEST_PATH_IMAGE037
为所述任务参与者从所述当前任务的所在地k到所述待去所在地l,并完成所述待完成任务时,所述任务发布者支付的报酬。
2.根据权利要求1所述的方法,其特征在于,所述根据所述直接收益和所述期望报酬之和,构建反映所述任务参与者执行所述待完成任务意愿的行为概率的博弈矩阵,包括:
根据如下公式计算期望总收益:
Figure DEST_PATH_IMAGE039
其中,
Figure DEST_PATH_IMAGE041
是所述期望总收益,作为所述博弈矩阵的第i行、第j列的元素;
Figure DEST_PATH_IMAGE043
是对应上述
Figure DEST_PATH_IMAGE004AAA
3.根据权利要求1所述的方法,其特征在于,所述任务包括使所述任务参与者去指定地采集所述任务发布者所需要的数据。
4.根据权利要求3所述的方法,其特征在于,所述数据的数据类型包括噪音感知数据、实时公交信息感知数据、空气质量感知数据、交通拥堵情况感知数据和公共基础设施感知数据。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
存储获取到的所述群智感知激励策略。
6.一种基于随机博弈获取群智感知激励策略的装置,其特征在于,包括:
第一获取单元,用于获取任务发布者的预算信息、任务参与者当前的位置信息和所述任务参与者已执行的当前任务的所在地信息;
计算单元,用于根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益;
第二获取单元,用于获取与所述所在地信息位置相关的待完成任务,并获取完成所述待完成任务的期望报酬之和;
构建单元,用于根据所述直接收益和所述期望报酬之和,构建反映所述任务参与者执行所述待完成任务意愿的行为概率的博弈矩阵;求解所述博弈矩阵的纳什均衡,并将所述纳什均衡作为所述博弈矩阵的求解结果,分析所述求解结果以获取群智感知激励策略;
所述根据预设的报酬计算函数、所述预算信息、所述位置信息和所述所在地信息,计算所述任务参与者执行完成当前任务所能获得的直接收益,包括:
根据如下公式计算所述直接收益:
Figure DEST_PATH_IMAGE002A
其中,
Figure DEST_PATH_IMAGE004AAAA
为直接收益、
Figure DEST_PATH_IMAGE006A
Figure DEST_PATH_IMAGE008A
Figure DEST_PATH_IMAGE004AAAAA
的预设比例、
Figure DEST_PATH_IMAGE011A
Figure DEST_PATH_IMAGE013A
Figure DEST_PATH_IMAGE004AAAAAA
的预设比例,且
Figure DEST_PATH_IMAGE016A
Figure DEST_PATH_IMAGE018A
为第i个任务完成难易程度的大小、K为任务总数、
Figure DEST_PATH_IMAGE020A
为任务发布者的总预算、
Figure DEST_PATH_IMAGE022A
为所述位置信息对应的位置与所述所在地信息对应的位置之间的距离、
Figure DEST_PATH_IMAGE024A
为预设单位距离对应的报酬;
所述并获取完成所述待完成任务的期望报酬之和,包括:
计算所述任务发布者在支付当前任务的报酬为
Figure DEST_PATH_IMAGE026A
的条件下,所述任务参与者在博弈状态
Figure DEST_PATH_IMAGE028A
下采取动作
Figure DEST_PATH_IMAGE030AA
的概率
Figure DEST_PATH_IMAGE032A
;其中,动作
Figure DEST_PATH_IMAGE030AAA
表示从所述当前任务的所在地k到待完成任务的待去所在地l的概率;
根据如下公式计算所述期望报酬之和:
Figure DEST_PATH_IMAGE035A
其中,
Figure DEST_PATH_IMAGE037A
为所述任务参与者从所述当前任务的所在地k到所述待去所在地l,并完成所述待完成任务时,所述任务发布者支付的报酬。
7.一种电子设备,其特征在于,包括:处理器、存储器和总线,其中,
所述处理器和所述存储器通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至5任一所述的方法。
8.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至5任一所述的方法。
CN201810456353.0A 2018-05-14 2018-05-14 一种基于随机博弈获取群智感知激励策略的方法及装置 Active CN108681921B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810456353.0A CN108681921B (zh) 2018-05-14 2018-05-14 一种基于随机博弈获取群智感知激励策略的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810456353.0A CN108681921B (zh) 2018-05-14 2018-05-14 一种基于随机博弈获取群智感知激励策略的方法及装置

Publications (2)

Publication Number Publication Date
CN108681921A CN108681921A (zh) 2018-10-19
CN108681921B true CN108681921B (zh) 2021-05-04

Family

ID=63806012

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810456353.0A Active CN108681921B (zh) 2018-05-14 2018-05-14 一种基于随机博弈获取群智感知激励策略的方法及装置

Country Status (1)

Country Link
CN (1) CN108681921B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109492887B (zh) * 2018-10-25 2021-10-26 浙江工商大学 基于势博弈理论的移动群智感知激励方法
CN109756371B (zh) * 2018-12-27 2022-04-29 上海无线通信研究中心 一种基于博弈的网络节点资源感知激励方法及系统
CN110580617B (zh) * 2019-07-25 2022-07-26 南京邮电大学 一种基于斯塔克伯格博弈的比特币分组网络系统及其激励方法
CN110991728A (zh) * 2019-11-28 2020-04-10 哈尔滨工程大学 一种打车平台中补偿激励的任务分配方法
CN111432361B (zh) * 2020-03-19 2022-09-13 长春理工大学 一种基于群智感知网络的用户激励策略确定方法及系统
CN111800422B (zh) * 2020-07-06 2022-05-17 中国人民公安大学 扭曲信息的干预方法、装置及电子设备
CN112312357B (zh) * 2020-09-28 2022-10-21 南斗六星系统集成有限公司 一种自动驾驶合作感知场景下在线激励机制的方法
CN113344381A (zh) * 2021-06-04 2021-09-03 哈尔滨商业大学 任务完成质量的激励方法及装置、电子设备和存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105528248B (zh) * 2015-12-04 2019-04-30 北京邮电大学 多任务合作应用下的群智感知激励机制
CN106485415B (zh) * 2016-10-11 2019-09-03 安徽慧达通信网络科技股份有限公司 一种基于供需关系的带预算的移动群智感知激励方法
CN106973392B (zh) * 2017-03-23 2020-12-18 南京邮电大学 群智感知中基于区域覆盖的一种激励方法
CN107463094A (zh) * 2017-07-13 2017-12-12 江西洪都航空工业集团有限责任公司 一种不确定信息下多无人机空战动态博弈方法
CN107784561A (zh) * 2017-11-10 2018-03-09 东南大学 一种移动众包系统中在线激励机制的实现方法

Also Published As

Publication number Publication date
CN108681921A (zh) 2018-10-19

Similar Documents

Publication Publication Date Title
CN108681921B (zh) 一种基于随机博弈获取群智感知激励策略的方法及装置
US20230102462A1 (en) Validating a Player's Real-World Location using Activity Within a Parallel-Reality Game
Alsheikh et al. The accuracy-privacy trade-off of mobile crowdsensing
Gao et al. A survey of incentive mechanisms for participatory sensing
US8388427B2 (en) Promoting exploration
US8206222B2 (en) Entertainment system for performing human intelligence tasks
CN109285075A (zh) 一种理赔风险评估方法、装置及服务器
CN108304440A (zh) 游戏推送的方法、装置、计算机设备及存储介质
Jin et al. Dynamic task pricing in multi-requester mobile crowd sensing with markov correlated equilibrium
CN110324785A (zh) 信息推荐方法、装置、设备及计算机可读存储介质
US10953329B2 (en) Contextual and differentiated augmented-reality worlds
JP6857825B2 (ja) 情報処理装置及びプログラム
Fan et al. Joint scheduling and incentive mechanism for spatio-temporal vehicular crowd sensing
CN113365705B (zh) 游戏内信息平台
Li et al. Enhancing participant selection through caching in mobile crowd sensing
CN109784741A (zh) 一种基于信誉预测的移动群智感知系统奖励分发方法
CN112232854A (zh) 业务处理方法、装置、设备及存储介质
CN110826717A (zh) 基于人工智能的博弈业务执行方法、装置、设备及介质
CN112418903A (zh) 在数字现实范围里的持续的以质量为基础的遥测及跟踪的系统和方法
CN109544261A (zh) 一种基于扩散和数据质量的群智感知激励方法
Watanabe et al. Kl-ucb-based policy for budgeted multi-armed bandits with stochastic action costs
JP2023115165A (ja) 情報処理装置及びプログラム
JP7178792B2 (ja) サーバシステムおよび制御方法
US20210228988A1 (en) Background process for importing real-world activity data into a location-based game
US11007429B2 (en) Background process for importing real-world activity data into a location-based game

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant