CN116681222A - 满足时间限制的多轮不确定的群智感知任务分配方法 - Google Patents
满足时间限制的多轮不确定的群智感知任务分配方法 Download PDFInfo
- Publication number
- CN116681222A CN116681222A CN202310326965.9A CN202310326965A CN116681222A CN 116681222 A CN116681222 A CN 116681222A CN 202310326965 A CN202310326965 A CN 202310326965A CN 116681222 A CN116681222 A CN 116681222A
- Authority
- CN
- China
- Prior art keywords
- task
- user
- time
- quality
- round
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000004590 computer program Methods 0.000 claims description 11
- 230000008447 perception Effects 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000003860 storage Methods 0.000 claims description 5
- 230000001174 ascending effect Effects 0.000 claims description 3
- 238000009826 distribution Methods 0.000 abstract description 9
- 238000004422 calculation algorithm Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000007115 recruitment Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 101150050759 outI gene Proteins 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06311—Scheduling, planning or task assignment for a person or group
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/109—Time management, e.g. calendars, reminders, meetings or time accounting
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Game Theory and Decision Science (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Computational Biology (AREA)
- Algebra (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种满足时间限制的多轮不确定的群智感知任务分配方法,包括收集群智感知任务集合和用户集合;将选择的指定用户的历史任务平均用时作为任务时间长度,确定任务时间长度限制下的感知质量最高的候选用户组合;在候选用户组合中确定任务分配用户;由任务分配用户完成本轮任务,得到本轮的任务完成质量和任务用时;基于任务完成质量和任务用时分别更新任务分配用户的平均质量和任务平均用时;在当前时间是否小于等于群智感知任务的截止时间时,群智感知任务完成,得到群智感知任务的最终完成质量。本发明能够在截止时间的约束下,最大化群智感知任务的总完成质量,从而适用于带有时间限制的群智感知用户选择问题更加复杂的任务。
Description
技术领域
本发明涉及群智感知技术领域,尤其是指一种满足时间限制的多轮不确定的群智感知任务分配方法。
背景技术
“众包”(Crowd Sourcing)是一种利用网络平台和互联网社区来进行任务分配和组织的模式。近年来,众包吸引了学术界和工业界的大量关注,通过众包,请求者可以向普通网络用户发布大规模感知或计算任务。因为这些网络用户的移动性、智能性以及嵌入其智能终端中的传感器的多样性,所以众包可以解决许多问题,例如,图像标签、社会调查等,这些问题可能任务量非常大,对于单个用户或单个软硬件设备来说非常困难,而众包将任务分为许多子任务并分配给大量用户完成,因此众包具有成本低、灵活性高、适用性广等优点,在很多场景中发挥了至关重要的作用。许多提供众包服务的平台由此诞生,例如广受欢迎的Amazon Mechanical Turk就提供了一个众包服务平台,可以帮助任务请求方快速将大量任务发布给用户,同时向用户支付一定费用。
而“群智感知”则是一种新型的数据获取方式,它结合了众包模式的思想,通过让各个用户使用自己不同的感知设备采集到数据,上传服务器,从而让请求者获取数据。近些年来,随着用户持有的智能终端设备性能不断提高,例如智能手机、智能汽车等,他们通常配备了各种各样的传感器,如GPS、温度传感器、气压传感器、摄像头等,这些传感器提供了更多维的数据,并且感知精度随着智能设备的迭代也已经到达了相当高的程度。另一方面个人用户分布范围十分广,且移动灵活,所以群智感知能够以更低的成本覆盖更大的范围,完美解决了安装大量专用传感器的高成本、难维护、数据单一、覆盖范围有限等缺点。然而,群智感知也面临用户质量参差不齐的问题,这正是优化移动群智感知算法的一个重要方向。
一个群智感知系统通常包括三个方面:群智感知平台、任务请求者和普通网络用户。请求者首先将他们的任务和个人需求发送到群智感知平台。随后,平台将任务划分为许多小规模子任务,并选择一些网络用户分配给他们一些子任务。由于群智感知用户通常具有不同的能力、不同的背景知识、不同的终端配置等,它们的完成质量各不相同。因此,如何在一些约束条件下,选择合适的网络用户来执行任务,使得他们完成任务的总质量最大化,是群智感知面临的重要问题。在目前的用户选择和任务分配过程中,通常以质量作为群智感知任务分配问题的评价标准。然而,现有的研究大多假设用户的完成质量是可以事先获得的,基于此进行用户选择和任务分配算法。但是在现实中,群智感知平台其实无法预知用户的完成质量,甚至用户本身也不能预知自己的完成质量,这就是群智感知问题中的不确定性。
现有的很多研究针对了群智感知用户选择问题,例如Karaliopoulos等人[1]研究了延迟零容忍网络的群智感知的用户选择算法,他们将用户作为任务点和服务器间的中间节点,允许用户之间进行数据传递,从而降低了数据运输的成本。还有一些研究考虑到了用户移动轨迹的特性,例如He等人[2]提出利用车载导航等方式,预测车辆的行进路线,从而优化车载的智能感知系统中的用户选择。Cayci等人[3]使用了CMAB(Combinatorial Multi-Armed Bandits)模型,但是他们认为每一轮只能选择一个用户,而在我们的问题中,用户的选择应当是多个。Xiao等人[4]提出了基于CMAB的反向拍卖用户选择算法,他们虽然考虑到了时间成本,但是没有考虑到用户完成时间的不确定性,也没有考虑到每轮长度可能是动态变化的。
[1]M.Karaliopoulos,O.Telelis and I.Koutsopoulos,"User recruitment formobile crowdsensing over opportunistic networks,"IEEE Conference on ComputerCommunications(INFOCOM),2015.
[2]Z.He,J.Cao and X.Liu,"High quality participant recruitment invehicle-based crowdsourcing using predictable mobility,"IEEE Conference onComputer Communications(INFOCOM),2015.
[3]Semih Cayci,Atilla Eryilmaz,and R.Srikant.2019.Learning to ControlRenewal Processes with Bandit Feedback.Proc.ACM Meas.Anal.Comput.Syst.3,2,Article 43(June 2019),32 pages.
综上,目前只有少数研究考虑到了群智感知用户的不确定性,其中有研究使用CMAB模型来解决探索和开发之间的平衡问题,即:是优先选择迄今为止完成质量最高的用户(“利用”),还是尝试一些曾经完成质量不好的用户来发掘潜在的高质量用户(“探索”)。虽然这些研究工作考虑到了用户完成质量是未知的,但他们忽略了用户完成时间的问题,而是假设每一轮的时间长度是固定的,将它建模为一个简单CMAB的问题,无法适用于带有时间限制的群智感知任务。因此,迫切需要提出一种满足时间限制的多轮不确定的群智感知任务分配方法以克服现有技术存在的上述技术缺陷。
发明内容
为此,本发明所要解决的技术问题在于克服现有技术中存在的技术缺陷,而提出一种满足时间限制的多轮不确定的群智感知任务分配方法,其能够在截止时间的约束下,最大化群智感知任务的总完成质量,从而适用于带有时间限制的群智感知用户选择问题更加复杂的任务。
为解决上述技术问题,本发明提供了一种满足时间限制的多轮不确定的群智感知任务分配方法,包括:
S1:收集群智感知任务集合和用户集合,其中所述用户集合中的每一用户均获知其历史任务平均用时和平均质量;
S2:根据所述平均质量计算得到基于UCB探索项附加的感知质量;
S3:选择所述用户集合中的一用户作为指定用户,将该指定用户的历史任务平均用时作为本轮任务的时间长度,确定本轮任务时间长度限制下的感知质量最高的候选用户组合;
S4:改变任务时间长度,按照步骤S3的方法确定其余任务时间长度限制下的感知质量最高的候选用户组合
S5:在所述候选用户组合中确定任务分配用户;
S6:由确定的任务分配用户完成本轮任务,得到任务分配用户在本轮的任务完成质量和任务用时;
S7:基于所述任务完成质量更新任务分配用户的平均质量,以及基于所述任务用时更新任务分配用户的任务平均用时;
S8:判断当前时间是否小于等于所述群智感知任务集合中的所有任务的截止时间,若是,则返回步骤S2:,若否,则群智感知任务完成,得到群智感知任务的最终完成质量。
在本发明的一个实施例中,在步骤S1中,获知所述用户集合中的每一用户的历史任务平均用时和平均质量的方法,包括:
在所述用户集合中选择设定数量的任务分配用户,由任务分配用户完成本轮任务,得到任务分配用户在本轮的任务用时和任务完成质量,其中所述用户集合中的每一用户均被选择了至少一次;
基于所述任务用时计算得到每一用户的任务平均用时,以及基于所述任务完成质量计算得到每一用户的平均质量。
在本发明的一个实施例中,在步骤S2中,根据所述平均质量计算得到基于UCB探索项附加的感知质量的方法,包括:
每一用户的感知质量的计算公式为:
其中,表示用户i基于UCB探索项附加的感知质量,/>表示用户i的平均质量,Qi,t表示附加的UCB探索项部分,ni(t)表示用户i在第t轮及之前被选择的次数。
在本发明的一个实施例中,在步骤S3中,确定本轮任务时间长度限制下的感知质量最高的候选用户组合的方法,包括:
在所述用户集合中确定K个任务分配用户,选择所述用户集合中的一用户作为指定用户,将该指定用户的历史任务平均用时作为本轮任务的时间长度,在历史任务平均用时小于本轮任务时间长度的剩下的用户中选择感知质量排名靠前的K-1个用户,得到时间长度限制下的感知质量最高的候选用户组合。
在本发明的一个实施例中,在步骤S4中,当每次确定候选用户组合后,均需要判断所有可能的任务时间长度是否均被选择了至少一次,若是,则确定候选用户组合结束,若否,则返回步骤S3。
在本发明的一个实施例中,确定可能的任务时间长度的方法,包括:
将所述用户集合中的每一用户按照历史任务平均用时升序排列;
确定历史任务平均用时大于等于第K个用户历史任务平均用时的用户为候选指定用户,候选指定用户对应的历史任务平均用时为可能的任务时间长度。
在本发明的一个实施例中,在步骤S5中,在所述候选用户组合中确定任务分配用户的方法,包括:
计算每一候选用户组合的总感知质量,其中,所述总感知质量为候选用户组合中所有用户感知质量相加的和;
求解总感知质量与任务时间长度的比值;
确定比值最大的候选用户组合中的每一用户为任务分配用户。
在本发明的一个实施例中,在步骤S7中,更新平均质量和任务平均用时的计算公式分别为:
式中,表示用户i在前t轮中的平均完成质量,ni(t)表示用户i在前t轮中被选择的次数,/>表示用户i完成第t轮任务的质量;/>表示用户i在前t轮中的任务平均用时,表示用户i完成第t轮任务的用时。
此外,本发明还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述所述方法的步骤。
还有,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述所述方法的步骤。
本发明的上述技术方案相比现有技术具有以下优点:
本发明所述的一种满足时间限制的多轮不确定的群智感知任务分配方法,其在考虑时间限制后,不仅面对“开发”和“探索”之间的平衡,还处理了完成质量和用户的最大完成时间之间的权衡,能够在截止时间的约束下,最大化群智感知任务的总完成质量,从而适用于带有时间限制的群智感知用户选择问题更加复杂的任务。
附图说明
为了使本发明的内容更容易被清楚的理解,下面根据本发明的具体实施例并结合附图,对本发明作进一步详细的说明,其中
图1是本发明提出的一种满足时间限制的多轮不确定的群智感知任务分配方法的流程示意图。
图2是本发明提出的一种满足时间限制的多轮不确定的群智感知任务分配方法的框图。
图3是本发明提出的一种满足时间限制的多轮不确定的群智感知任务分配方法的问题建模示意图。
图4是本发明与对比算法在T=10000,N=100中不同K下的质量对比图。
图5是本发明与对比算法在T=10000,N=100中不同K下的遗憾值对比图。
图6是本发明与对比算法在T=10000,K=30中的不同用户数量下的质量对比图。
图7是本发明与对比算法在T=10000,K=30中的不同用户数量下的遗憾值对比图。
图8是本发明与对比算法在K=30,N=100中的不同时间限制下的质量对比图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
参照图1所示,本发明实施例提供一种满足时间限制的多轮不确定的群智感知任务分配方法,包括以下步骤:
S1:收集群智感知任务集合和用户集合,其中所述用户集合中的每一用户均获知其历史任务平均用时和平均质量;
S2:根据所述平均质量计算得到基于UCB探索项附加的感知质量;
S3:选择所述用户集合中的一用户作为指定用户,将该指定用户的历史任务平均用时作为本轮任务的时间长度,确定本轮任务时间长度限制下的感知质量最高的候选用户组合;
S4:改变任务时间长度,按照步骤S3的方法确定其余任务时间长度限制下的感知质量最高的候选用户组合
S5:在所述候选用户组合中确定任务分配用户;
S6:由确定的任务分配用户完成本轮任务,得到任务分配用户在本轮的任务完成质量和任务用时;
S7:基于所述任务完成质量更新任务分配用户的平均质量,以及基于所述任务用时更新任务分配用户的任务平均用时;
S8:判断当前时间是否小于等于所述群智感知任务集合中的所有任务的截止时间,若是,则返回步骤S2:,若否,则群智感知任务完成,得到群智感知任务的最终完成质量。
本发明所述的一种满足时间限制的多轮不确定的群智感知任务分配方法,其在考虑时间限制后,不仅面对“开发”和“探索”之间的平衡,还处理了完成质量和用户的最大完成时间之间的权衡,能够在截止时间的约束下,最大化群智感知任务的总完成质量,从而适用于带有时间限制的群智感知用户选择问题更加复杂的任务。
参照图2所示,在本发明提供一种满足时间限制的多轮不确定的群智感知任务分配方法中,任务请求者向群智感知服务平台提出请求任务并限制任务的截止时间,群智感知平台接受任务。为了关注截止时间限制,平台设定任务计时,并生成用户集合,随后对分配策略的参数进行初始化,在这一步中需要至少对用户集合中的每个用户进行一次选择,从而获知其历史任务平均用时和平均质量。然后逐轮选择合适的任务分配用户,消耗时间获得对应的结果,直到最终到达截止期限,任务完成,平台将任务结果返回给任务请求者,最终完成整个群智感知任务。
其中,在步骤S1中,获知所述用户集合中的每一用户的历史任务平均用时和平均质量的方法,包括:
在所述用户集合中选择设定数量的任务分配用户,由任务分配用户完成本轮任务,得到任务分配用户在本轮的任务用时和任务完成质量,其中所述用户集合中的每一用户均被选择了至少一次;
基于所述任务用时计算得到每一用户的任务平均用时,以及基于所述任务完成质量计算得到每一用户的平均质量。
其中,在步骤S2中,根据所述平均质量计算得到基于UCB探索项附加的感知质量的方法,包括:
每一用户的感知质量的计算公式为:
其中,表示用户i基于UCB探索项附加的感知质量,/>表示用户i的平均质量,Qi,t表示附加的UCB探索项部分,ni(t)表示用户i在第t轮及之前被选择的次数。
其中,在步骤S3中,确定本轮任务时间长度限制下的感知质量最高的候选用户组合的方法,包括:
在所述用户集合中确定K个任务分配用户,选择所述用户集合中的一用户作为指定用户,将该指定用户的历史任务平均用时作为本轮任务的时间长度,在历史任务平均用时小于本轮任务时间长度的剩下的用户中选择感知质量排名靠前的K-1个用户,得到时间长度限制下的感知质量最高的候选用户组合。
其中,在步骤S4中,当每次确定候选用户组合后,均需要判断所有可能的任务时间长度是否均被选择了至少一次,若是,则确定候选用户组合结束,若否,则返回步骤S3。上述确定可能的任务时间长度的方法,包括将所述用户集合中的每一用户按照历史任务平均用时升序排列;确定历史任务平均用时大于等于第K个用户历史任务平均用时的用户为候选指定用户,候选指定用户对应的历史任务平均用时为可能的任务时间长度。
其中,在步骤S5中,在所述候选用户组合中确定任务分配用户的方法,包括:
计算每一候选用户组合的总感知质量,其中,所述总感知质量为候选用户组合中所有用户感知质量相加的和;
求解总感知质量与任务时间长度的比值;
确定比值最大的候选用户组合中的每一用户为任务分配用户。
请参照图3所示,本发明研究了质量驱动的群智感知问题下的不确定用户选择问题,其中的“不确定”因素是指:用户的完成质量值和完成时间在他真正完成这个任务之前都是不可预知的。与现有的研究不同,本发明还考虑到了群智感知任务的时间限制问题。群智感知平台从一些请求者那里接收任务(例如对于标记大型图像的任务),通常会将这个任务分为多个轮,在每一轮中,平台将选择一定数量的群智感知用户,并向这些用户分配一个小规模任务(例如为某个特定图像添加标签)。因为不同的用户具有不同的终端配置、技能、知识等,所以每个用户完成自己分配到的任务需要不同的时间,同样的,他们完成的质量也各不相同。只有当本轮所选用户都完成各自任务后,平台才会开启下一轮的任务。所以每一轮的长度是不确定的,应当等于这一轮中所选用户的最长完成时间。任务请求者通常会设置任务的截止时间,这限制了平台不会无限制地开始更多轮的任务。虽然用户的完成时间和完成质量各不相同,但是他们的技能、知识和智能终端配置等不会突然间改变,因此同一个用户的完成质量应当遵循一个特定的未知分布。
假设群智感知系统中总共有N个用户,使用集合表示这些用户,用t(t≥1)表示第t轮。为了尽快完成群智感知任务,平台将一次性(即在一轮中)向K个用户分配任务,由于每个用户一轮只能执行一个小任务,所以一轮中会有K(K≤N)个小任务。只有当本轮所有的K个任务都完成了,平台才能获得相应的完成质量,并继续下一轮用户选择。本发明设置了截止时间限制,需要在有限轮中获得尽可能高的质量。由于这N个用户执行任务的完成时间各不相同,这导致了每一轮的长度不确定,其等于一轮中最长用时的用户消耗的时间。本发明用/>表示用户i完成时间的均值。用户在每一轮中完成任务的质量是不确定的,但是由于用户的专业技能、背景知识、设备配置等不会在短时间内改变,所以用户执行任务的质量遵循独立同分布。本发明使用/>来表示用户i完成质量的均值。同样的用户每次完成时间也是无法预知的,也遵循一个独立同分布。最后,本发明用/>表示用户i执行第t轮任务的真实完成质量,用/>表示用户i执行第t轮任务的真实完成时间。
进一步的,本发明用表示在t轮中选择的K个用户的集合,它的基数为K,即对于/>都有/>本发明考虑到了每一轮完成时间的不同,因此当/>选择好后,这一轮的长度就可以表示为/>同时,第t轮的总质量也可以计算出来,即/>。在这里,被选择的用户集合/>中的用户的完成质量是不确定的,是无法提前预知的,只有在他们执行了第t轮中的所有K个任务后才能获得。我们的优化目标是确定每一轮选择的用户集合/>在有限的时间约束下,使得这些用户的总完成质量可以最大化。本发明可以用下面的式子概括这个优化问题:我们的目标是需要最大化总质量,即/>约束条件是截止时间限制,其中每一轮会选择K个用户,即
为了解决用户完成任务的质量和时间未知的问题,本发明在用户选择过程中引入强化学习算法。将组合多臂老虎机(CMAB)模型集成到特殊的top-K问题中,以解决未知的用户选择问题。在本发明的问题中,每个用户就可以看成是CMAB问题里的每一个摇臂,用户的质量就是摇臂对应的奖励。与每轮长度固定的传统CMAB模型不同的是,由于用户的完成时间不一样,本发明的问题中每一轮的长度是不确定的。本发明认为每个用户i的质量遵循未知的独立同分布,其具有特定的期望值qi。
接续,本发明的任务分配基本思路如下:首先,本发明利用扩展的UCB(UpperConfidence Bound)算法来计算用户的预计完成质量(感知质量),用来平衡经典CMAB模型中的“开发”和“探索”问题。考虑到用户完成时间是各不相同的,本发明预估用户的本轮完成时间为其以往所有任务的平均完成时间并根据这些时间,推测这一轮各个用户可能的完成时间,随后确定一个用户作为本轮时间最长的用户。根据这个时间接下来就需要从比这个时间按更短的用户中选择K-1个用户,在这里本发明利用贪心的思想选择感知质量靠前的K-1个用户,最后加上首先确定好的最长时间用户K,这样就得到了在这个时间长度下最理想的K个用户的组合(候选用户组合)。接下来,改变时间最长的用户,再按照同样的方法,选择出另一种拥有不同时间长度的K个用户的组合,这样每种长度的可能都进行计算得到多种不同的包含K个用户的组合(候选用户组合),最后找出这些候选用户组合中总感知质量和本轮长度的比值中最大的一组,就是本轮最终要选择的用户集合(任务分配用户)。平台开始执行任务。当所有的任务分配用户均完成自己的任务后,平台获得任务分配用户的任务完成质量和任务用时,并同时更新用户的被选次数、任务平均用时和平均质量等,并继续进行下一轮的选择,直到所有的时间都消耗完,群智感知任务结束,最后平台获得总的质量就是这个群智感知任务的最终完成质量。
为了表示用户完成质量的UCB表达式,本发明用ni(t)来表示用户i在第t轮及之前被选择的次数,同时每次完成一轮就会更新用户i的被选择次数:如果i在第t轮被选中,即那么ni(t)=ni(t-1)+1;如果没有被选中,即/>则ni(t)=ni(t-1)。使用/>表示用户i在第t轮及以前的平均完成质量,当用户i在本轮被选中,即/>时,本发明更新这个值,即/>否则/>同样的,本发明用/>表示表示用户i在第t轮及以前的平均完成时间,类似的,本发明按照下面的式子在每一轮完成后更新这个值:
为了选择出完成质量尽可能高的用户,最大化截止时间前的总完成质量,本发明采用UCB表达式来计算用户的感知质量,使用表示用户i的感知质量,感知质量的计算公式如下:
其中,表示用户i基于UCB探索项附加的感知质量,/>表示用户i的平均质量,Qi,t表示附加的UCB探索项部分,ni(t)表示用户i在第t轮及之前被选择的次数。
为了考虑到截止时间限制,本发明采用的任务分配策略如下:对于整个截止时间限制而言,这里的CMAB模型实际上是一个特殊的背包问题,其中K个用户在一轮中基于UCB的完成的总质量可以看作是背包中物品的价值,而这一轮的长度作为该物品的大小。与经典的背包问题不同,本发明的问题中物品的价值是不确定的,应当是服从某种分布的,因此这个用户选择问题比现有的背包和CMAB问题更复杂。
具体地,本发明在一轮选择K个用户,那么这轮的长度就是由本轮用户的最长的时间决定,所以本轮长度至少为而当/>时,即排序后的用户K是具有最长完成时间的用户,这时候只有一种组合,即用户K以及比他时间更短的K-1个用户,这个组合就是本轮在这个时间限制下的唯一的候选用户组合。本发明用/>表示这个候选用户组合,然后计算出这个候选用户组合的总感知质量,即/>如果预计完成时间是用户K+1的时间/>则需要在剩下的比他更短的K个用户中选出K-1个用户,共有K种组合方式,不过本发明不需要对每种组合方式都进行考虑,只需选择感知质量靠前的用户即可,所以找出感知质量靠前的K-1个用户就得到了在这个时间限制下的一种候选用户组合。/>表示前X个用户,先根据/>选出K-1个用户,再加上原来确定时间的用户K+1,这就得到了在时间限制为/>时的候选用户组合。同样的本发明用这个方法找出所有可能的时间长度对应的候选用户组合,并且可以计算出每个候选用户组合对应的总感知质量,比如/>就表示时间长度/>时的总感知质量,其中K≤X≤N,即得到了这些候选用户组合的对应的总感知质量/>最后本发明根据总感知质量与对应本轮长度的比值具有最高比值的候选用户组合就是本发明确定的任务分配用户,即:
这样就能确定这一轮选择哪K个用户了,例如在t轮中本发明确定K用户集为后,平台将向这些用户分配K任务,这K个用户开始执行自己的任务。任务完成后,平台将获得他们的本轮的完成质量,并且得到,即所有/>和/>的值。平台将更新ni(t)、/>和的值。同时,将更新任务的总完成质量和剩余时间。最后当剩余时间小于一轮的最小时间,整个群智感知任务就完成了。
接下来本发明通过一系列仿真实验来模拟本发明的运行效果,并且引入以下三种算法用于对比:
“近似最优”:平台能提前预知用户的完成质量和时间的真实值,并根据这个值来选择。
“ε-first”:在前ε·T的时间内随机选择,在随后的(1-ε)·T的时间中平台会采用在探索阶段得到的最优选择方案,不同之处是,“ε-first”会将用户的已知平均完成质量替代“近似最优”算法中平台提前预知的值,当ε取到不同的值时,“ε-first”通常会有不同的表现,因此我们取ε为0.1,0.3,0.5的三种情况用于对比。
“随机”:平台每轮会随机选则K个用户。
下面介绍具体的实验的参数:让完成质量和时间的期望落在[0.2,0.8]内,使用高斯分布来生成用户的完成质量,这里为了让质量满足(0,1]在之间随机生成高斯分布的标准差,这样99%用户的完成质量就能限制在(0,1]。随后用类似的方法生成用户完成任务需要的时间。先从[50,500]中指定用户数量N,在[10,100]中每轮选择的用户数K,最后从区间[500,106]中指定一个总的时间限制T。
图4至图8是一系列仿真实验效果图,从用户总数N,每轮选择用户数K,时间限制T,三个方面出发,选择了任务完成总质量和遗憾值两个指标来检验本发明在这三个维度影响下的运行效果,其中遗憾值是指每一次任务分配的实际收益和理想情况下的最大收益的差距。
从上面的图可以看出,本发明的算法在不同用户总数N、不同的每轮选择用户数K,不同时间限制T下的表现都明显优于其他几种对比算法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,上述实施例仅仅是为清楚地说明所作的举例,并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
Claims (10)
1.一种满足时间限制的多轮不确定的群智感知任务分配方法,其特征在于:包括:
S1:收集群智感知任务集合和用户集合,其中所述用户集合中的每一用户均获知其历史任务平均用时和平均质量;
S2:根据所述平均质量计算得到基于UCB探索项附加的感知质量;
S3:选择所述用户集合中的一用户作为指定用户,将该指定用户的历史任务平均用时作为本轮任务的时间长度,确定本轮任务时间长度限制下的感知质量最高的候选用户组合;
S4:改变任务时间长度,按照步骤S3的方法确定其余任务时间长度限制下的感知质量最高的候选用户组合;
S5:在所述候选用户组合中确定任务分配用户;
S6:由确定的任务分配用户完成本轮任务,得到任务分配用户在本轮的任务完成质量和任务用时;
S7:基于所述任务完成质量更新任务分配用户的平均质量,以及基于所述任务用时更新任务分配用户的任务平均用时;
S8:判断当前时间是否小于等于所述群智感知任务集合中的所有任务的截止时间,若是,则返回步骤S2:,若否,则群智感知任务完成,得到群智感知任务的最终完成质量。
2.根据权利要求1所述的一种满足时间限制的多轮不确定的群智感知任务分配方法,其特征在于:在步骤S1中,获知所述用户集合中的每一用户的历史任务平均用时和平均质量的方法,包括:
在所述用户集合中选择设定数量的任务分配用户,由任务分配用户完成本轮任务,得到任务分配用户在本轮的任务用时和任务完成质量,其中所述用户集合中的每一用户均被选择了至少一次;
基于所述任务用时计算得到每一用户的任务平均用时,以及基于所述任务完成质量计算得到每一用户的平均质量。
3.根据权利要求1或2所述的一种满足时间限制的多轮不确定的群智感知任务分配方法,其特征在于:在步骤S2中,根据所述平均质量计算得到基于UCB探索项附加的感知质量的方法,包括:
每一用户的感知质量的计算公式为:
其中,表示用户i基于UCB探索项附加的感知质量,/>表示用户i的平均质量,Qi,t表示附加的UCB探索项部分,ni(t)表示用户i在第t轮及之前被选择的次数。
4.根据权利要求3所述的一种满足时间限制的多轮不确定的群智感知任务分配方法,其特征在于:在步骤S3中,确定本轮任务时间长度限制下的感知质量最高的候选用户组合的方法,包括:
在所述用户集合中确定K个任务分配用户,选择所述用户集合中的一用户作为指定用户,将该指定用户的历史任务平均用时作为本轮任务的时间长度,在历史任务平均用时小于本轮任务时间长度的剩下的用户中选择感知质量排名靠前的K-1个用户,得到时间长度限制下的感知质量最高的候选用户组合。
5.根据权利要求4所述的一种满足时间限制的多轮不确定的群智感知任务分配方法,其特征在于:在步骤S4中,当每次确定候选用户组合后,均需要判断所有可能的任务时间长度是否均被选择了至少一次,若是,则确定候选用户组合结束,若否,则返回步骤S3。
6.根据权利要求5所述的一种满足时间限制的多轮不确定的群智感知任务分配方法,其特征在于:确定可能的任务时间长度的方法,包括:
将所述用户集合中的每一用户按照历史任务平均用时升序排列;
确定历史任务平均用时大于等于第K个用户历史任务平均用时的用户为候选指定用户,候选指定用户对应的历史任务平均用时为可能的任务时间长度。
7.根据权利要求1所述的一种满足时间限制的多轮不确定的群智感知任务分配方法,其特征在于:在步骤S5中,在所述候选用户组合中确定任务分配用户的方法,包括:
计算每一候选用户组合的总感知质量,其中,所述总感知质量为候选用户组合中所有用户感知质量相加的和;
求解总感知质量与任务时间长度的比值;
确定比值最大的候选用户组合中的每一用户为任务分配用户。
8.根据权利要求7所述的一种满足时间限制的多轮不确定的群智感知任务分配方法,其特征在于:在步骤S7中,更新平均质量和任务平均用时的计算公式分别为:
式中,表示用户i在前t轮中的平均完成质量,ni(t)表示用户i在前t轮中被选择的次数,/>表示用户i完成第t轮任务的质量;/>表示用户i在前t轮中的任务平均用时,/>表示用户i完成第t轮任务的用时。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于:所述处理器执行所述程序时实现权利要求1至8任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:该程序被处理器执行时实现权利要求1至8任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310326965.9A CN116681222A (zh) | 2023-03-30 | 2023-03-30 | 满足时间限制的多轮不确定的群智感知任务分配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310326965.9A CN116681222A (zh) | 2023-03-30 | 2023-03-30 | 满足时间限制的多轮不确定的群智感知任务分配方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116681222A true CN116681222A (zh) | 2023-09-01 |
Family
ID=87784281
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310326965.9A Pending CN116681222A (zh) | 2023-03-30 | 2023-03-30 | 满足时间限制的多轮不确定的群智感知任务分配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116681222A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109711720A (zh) * | 2018-12-25 | 2019-05-03 | 西安交通大学深圳研究院 | 一种应用于群智感知的数据质量评估方法 |
CN110097262A (zh) * | 2019-04-17 | 2019-08-06 | 华南理工大学 | 一种群智感知中对感知时长敏感的任务分配方法 |
CN110728546A (zh) * | 2019-10-22 | 2020-01-24 | 苏州大学 | 一种群智感知系统中用户类型转换方法 |
CN112463976A (zh) * | 2020-09-29 | 2021-03-09 | 东南大学 | 一种以群智感知任务为中心的知识图谱构建方法 |
CN112907340A (zh) * | 2021-02-03 | 2021-06-04 | 西安电子科技大学 | 一种群智感知中基于双向拍卖模型的激励方法及系统 |
CN113077149A (zh) * | 2021-04-02 | 2021-07-06 | 华南理工大学 | 一种基于ucb算法的群智感知任务分配方法及系统 |
CN113191023A (zh) * | 2021-05-28 | 2021-07-30 | 中国人民解放军国防科技大学 | 群智感知的任务分配和用户招募模型交叉验证方法及系统 |
CN113344464A (zh) * | 2021-07-12 | 2021-09-03 | 哈尔滨理工大学 | 面向移动群智感知系统的任务与用户潜在关系挖掘方法 |
-
2023
- 2023-03-30 CN CN202310326965.9A patent/CN116681222A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109711720A (zh) * | 2018-12-25 | 2019-05-03 | 西安交通大学深圳研究院 | 一种应用于群智感知的数据质量评估方法 |
CN110097262A (zh) * | 2019-04-17 | 2019-08-06 | 华南理工大学 | 一种群智感知中对感知时长敏感的任务分配方法 |
CN110728546A (zh) * | 2019-10-22 | 2020-01-24 | 苏州大学 | 一种群智感知系统中用户类型转换方法 |
CN112463976A (zh) * | 2020-09-29 | 2021-03-09 | 东南大学 | 一种以群智感知任务为中心的知识图谱构建方法 |
CN112907340A (zh) * | 2021-02-03 | 2021-06-04 | 西安电子科技大学 | 一种群智感知中基于双向拍卖模型的激励方法及系统 |
CN113077149A (zh) * | 2021-04-02 | 2021-07-06 | 华南理工大学 | 一种基于ucb算法的群智感知任务分配方法及系统 |
CN113191023A (zh) * | 2021-05-28 | 2021-07-30 | 中国人民解放军国防科技大学 | 群智感知的任务分配和用户招募模型交叉验证方法及系统 |
CN113344464A (zh) * | 2021-07-12 | 2021-09-03 | 哈尔滨理工大学 | 面向移动群智感知系统的任务与用户潜在关系挖掘方法 |
Non-Patent Citations (2)
Title |
---|
蒋伟进等: "基于组合多臂赌博机的移动群智感知用户招募算法", 《电子与信息学报》, vol. 44, no. 03, 15 March 2022 (2022-03-15), pages 1119 - 1128 * |
黄丹镭等: "群智感知任务分配中的用户类型转换问题研究", 《小型微型计算机系统》, vol. 42, no. 03, 12 March 2021 (2021-03-12), pages 478 - 484 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yang et al. | A prediction-based user selection framework for heterogeneous mobile crowdsensing | |
Deng et al. | Task allocation algorithm and optimization model on edge collaboration | |
ul Hassan et al. | Efficient task assignment for spatial crowdsourcing: A combinatorial fractional optimization approach with semi-bandit learning | |
WO2020050873A1 (en) | System and method for ride order dispatching and vehicle repositioning | |
CN108415760B (zh) | 一种基于移动机会网络的群智计算在线任务分配方法 | |
Gao et al. | A learning-based credible participant recruitment strategy for mobile crowd sensing | |
CN103546583B (zh) | 群智感知系统及群智感知方法 | |
CN109934372B (zh) | 一种路径规划方法、装置及设备 | |
Agarwal et al. | Multiprocessor task scheduling using multi-objective hybrid genetic Algorithm in Fog–cloud computing | |
CN112148492A (zh) | 一种考虑多用户移动性的服务部署和资源分配方法 | |
CN113867843A (zh) | 一种基于深度强化学习的移动边缘计算任务卸载方法 | |
Gao et al. | Fast adaptive task offloading and resource allocation via multiagent reinforcement learning in heterogeneous vehicular fog computing | |
CN110147514A (zh) | 一种资源展示方法、装置及其设备 | |
Akter et al. | Time-constrained task allocation and worker routing in mobile crowd-sensing using a decomposition technique and deep Q-learning | |
CN114970334B (zh) | 基于深度强化学习的作战体系设计方法及相关设备 | |
CN114139730B (zh) | 一种面向边缘云网络中机器学习任务的动态定价和部署方法 | |
Gao et al. | Com-DDPG: A multiagent reinforcement learning-based offloading strategy for mobile edge computing | |
Cohen et al. | An adaptive robust optimization model for parallel machine scheduling | |
Wang et al. | Distributed game-theoretical route navigation for vehicular crowdsensing | |
CN114745392A (zh) | 流量调度方法 | |
Chen et al. | A pricing approach toward incentive mechanisms for participant mobile crowdsensing in edge computing | |
Wang et al. | Reinforcement contract design for vehicular-edge computing scheduling and energy trading via deep Q-network with hybrid action space | |
Saranya et al. | An efficient computational offloading framework using HAA optimization-based deep reinforcement learning in edge-based cloud computing architecture | |
Li et al. | Task selection and scheduling for food delivery: A game-theoretic approach | |
CN113190342A (zh) | 用于云-边协同网络的多应用细粒度卸载的方法与系统架构 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |