CN112598176A

CN112598176A - 遗传与贪婪算法融合的众包高效分派方法

Info

Publication number: CN112598176A
Application number: CN202011531220.9A
Authority: CN
Inventors: 李蕊男; 高宏松
Original assignee: Jingmen Huiyijia Information Technology Co ltd
Current assignee: Jingmen Huiyijia Information Technology Co ltd
Priority date: 2020-12-22
Filing date: 2020-12-22
Publication date: 2021-04-02

Abstract

众包作为一种新型的协同工作理念，正逐渐演化成成功的商业模式，众包模式将会融入到我们多样的社会生活和工作中。众包用户在解决任务的同时，也为自己赚取了相应的报酬，这种自由灵活的工作方式受到了更多用户和发布者的喜爱，随着开放式平台聚集了越来越多的任务和解决者，众包面临的最大挑战就是如何将任务准确高效的分派给适合的任务解决者。本发明基于众包模式中的约束条件，提出融合遗传算法与贪婪策略的众包任务分派方法，准确高效的将不同需求的任务分别匹配给适合的任务解决者，利用实验分析和性能比较，验证了本发明的方法完全能达到众包问题中准确高效分派的目标。

Description

遗传与贪婪算法融合的众包高效分派方法

技术领域

本发明涉及一种众包高效分派方法，特别涉及一种遗传与贪婪算法融合的众包高效分派方法，属于众包模式分派方法技术领域。

背景技术

随着互联网的高速发展，越来越多的需求形式和越来越多的交易方式通过无处不在的互联网得以实现，众包就是在这样的环境下被提出，并且受到了越来越多的用户和企业的高度关注。众包可理解为群体智慧，被用来描述一种新的商业模式，指一个公司或者企业把以前由自己员工所进行作业的工作任务以自愿的形式发布到互联网上，换句话说，就是公司通过互联网将所需解决的问题和难题，通过有偿或者无偿的方式发布在互联网上，以期待互联网用户利用他们的创意和能力来完成这些任务和挑战的形式。

利用自己的兴趣爱好和碎片时间对所提供的服务获取一定份额的酬劳，这种新颖的劳动方式在软件业和服务业上得到了越来越多用户的喜爱。众包有很多有趣的好处：第一，发布者可以花费很少的人财物代价，就能够得到超出预期的讨论和分析，虽然有部分讨论内容意义不大，但所获得的收益明显要超出所付出的成本；第二，可以发现和利用到更加广阔的人才，随着互联网的全球覆盖和高速发展，人与人之间的联系变得更加方便快捷，众包充分利用互联网的这些优势，通过简单的交易方式让互联网上优秀的人才的智慧服务所需的人；第三，通过广阔的人群，可以第一手的了解到大众的喜好和需求，无论发布什么样的任务或者需求，用户们的参与度和他们所做出的回答都会在第一时间将自己真实的需求反馈给你，只要留意这些不被注意到的细节，就能把握更多的市场信息。

众包模式实际上就是把公司原本计划承担的工作通过互联网转交给活跃于互联网上的，未知的大众群体来完成的一种商业模式。众包概念自2006年被正式提出以来，引发了诸多大型互联网公司的关注，这些公司意识到大众的智慧可以成为一种新的劳动方式，并且能够通过不同于传统的方式来为企业或者个人提供服务。众包是一种分布式的问题产生和解决方式，当任务发布者有需要解决的问题时，将问题以公开的方式发布到互联网上，以期待未知的群体提供解决方案。用户群体在发现有待解决的难题时，分别利用自己的智慧得出对应的解决方案并提交，当有n个解决方案被提交之后，用户群众还要成为审核者来审查这些方案，发现最优的解决方案，这个方案就会被任务发布者采纳，并给予方案提供者相应的奖励和酬劳。

因为众包自由灵活的特征，任务一旦发布后，其决策的决定权和主动权都由参与者自行掌握，但因为雇员与雇主间的零约束关系，人们开始怀疑众包所能提供的结果质量，为解决这样的忧虑，现有技术提出了各种方案，其目的最终都是为保证众包结果的可靠性，大体上这些解决方案可分成参与者筛选、任务分配、质量评估三大类。参与者筛选是将那些恶意的、态度不端正的工作者筛选出来，以确保众包源头上的可靠性；任务分配是将合适的任务分配给合适的人，做到人力资源的最大利用；质量评估是对众包结果的质量进行评估，选出正确的答案。

鉴于众包所带来的新的工作方式，特别是其自由灵活的特点，使得对于众包的研发和关注也变得越来越多。现有技术对于众包的研究依据其各个阶段的特征，主要分为支付奖励架构、任务分派架构和质量保证架构三大部分。任务分派架构作为众包互联网中的中心环节成为了关注较多的领域，如何利用好众包中众的特点成为研发人员特别关心的问题。

现有技术的众包模式特别是在任务分配方面存在的问题主要包括：

第一，众包作为一种新型的协同工作理念，正逐渐演化成不同的商业模式，众多的众包参与者也都开始变得更为活跃，众包用户在解决任务的同时，也为自己赚取了相应的报酬，大多数的众包任务并不需要消耗太多时间，这种自由灵活的工作方式受到了更多用户和发布者的喜爱，随着开放式平台聚集了越来越多的任务和解决者，众包面临的最大挑战就是如何将任务准确高效的分派给适合的任务解决者；

第二，现实应用中众包平台的任务分派会受制于多种约束条件，需要探求多重属性的影响，及多种情况的组合，是典型的NP-C问题，现有技术采用单纯的数学解析式或者单一算法很难得出众包分派的最优解，缺少采用群体搜索对解决众包模式分派问题非常有效的方法，现有技术覆盖面小，难以寻找全局最优解，容易陷入局部最优的情况；现有技术的搜索方法从单点开始搜索计算，对于多峰值分布的搜索空间时常会局限于某个单峰优解上，几乎没有并行能力，陷入局部最优解的风险很大，在任务全局搜索优化的过程中表现较差；

第三，现有技术的遗传算法在对目标问题生成初始解空间是完全随机的，使得算法很难快速找到最优解，加大了后续迭代选择过程的压力，在对分派问题的求解过程中无法得出局部最优解，遗传算法最优解没有基础保障，同时对遗传算法的后续操作缺少对应处理，解集合的多样性差，解空间的搜索范围小，寻找到全局最优解的可能性较低；

第四，现有技术的众包分派系统无法依据要素属性之间的约束条件实现众包任务的最优分派，无法将最合适的任务分派给最合适的人，无法达到人力资源的最优利用。众包申请者在平台上发布了大量不同类别、不同难度的微任务，每个众包参与者需要浏览这些任务，并选择执行适合自己的任务，但由于大量任务未经过任何的标注处理，使得众包参与者需要耗费大量时间用于寻找适合的任务，寻找适合任务所花费的时间时常比执行时间更多，明显降低了众包参与者们的效率和兴趣，缺少高效精准的任务分派帮助众包参与者快速准确选择适合的任务的方法。

发明内容

众包平台上汇聚了大量的众包任务和闲散的众包参与者，不同的任务有不同的任务需求和难度，同样，大量的众包参与者也各自拥有解决问题的能力和技巧，本发明充分利用众包平台上参与者的智慧与技能，将适合的任务分派给适合的参与者处理解决，从而达到群体智慧成本的利用和节约的目的。通过制定局部竞争策略和最优染色体保证策略，在不破坏当前最优结果的前提下扩大方法的搜索能力和收敛速度，本发明在不同问题规模的模拟情况下，均能得到良好的近似最优解，同时能很好的扩展到多任务分派架构中，适当的提升参与者的多任务数量，能够很好的兼顾众包平台任务的吞吐量和众包任务分派的准确性，具有广阔的市场运用前景。

为达到以上技术效果，本发明所采用的技术方案如下：

遗传与贪婪算法融合的众包高效分派方法，针对于众包模式中众包任务和众包参与者的最优匹配问题，本发明方法的架构为：首先，将问题进行形式化描述，抽象出数学模型矩阵；然后，利用贪婪策略生成原始种群的父体和母体，通过繁殖操作扩大种群规模，形成初代群体；随后，引入和优化遗传算法中的交叉、选取、变异算子，通过制定局部竞争策略和最优染色体保证策略，在不破坏当前最优结果的前提下扩大方法的搜索能力和收敛速度；

融合遗传算法与贪婪策略的任务分派方法是一种混合启发式算法，本发明将贪婪策略和遗传策略两种算法融合并优化，使其在局部最优解的基础上更快的找到众包分派问题的全局最优解或者近似最优解，本发明方法主要分为两部分，在第一部分中使用贪婪算法对原始数据进行前置处理，得到局部最优解以生成原始种群，使得算法最差的情况也能保障一个局部最优解；第二部分基于遗传算法改进流程，依据优化的目标对选取、交叉、变异算子操作进行调整，尽可能找到全局最优解或者近似最优解；

本发明具体包括：第一，贪婪策略的种群繁殖；第二，遗传方法和策略；第三，多任务分派架构，其中第一和第二两点又分为编码操作、贪婪选取和繁殖、评价适宜度、交叉操作、竞争选取、变异操作、迭代过程；

本发明对于众包分派问题两个主体的描述通过相关参数进行定义：

定义一：众包平台已有的任务集合D＝{d_j|j＝1，2，...，n}，任务的总数为n，对于每个任务d_j，其拥有的属性元组为<Bs，Xxms，Dt，Tjs，Jzs>，其中Bs是任务的唯一标示，Xxms表示任务的详细描述，Dt表示任务的难度等级，通过分析众包任务特点使用类似FKGL级别确定，Tjs和Jzs分别表示任务的提交时间和截止时间，以上信息全部由任务发布者提供；

定义二：众包平台上当前可用的参与者集合Y＝{y_i|i＝1，2，...，m}，空闲的参与者数量为m，每个参与者y_i的属性元组表示为<Xh，Kd_i，Ys_i，Cp_i，Ca_i>，Xh为参与者的唯一序号，Kd_i反映参与者的当前状态，用0或1表示，其中Kd_i＝1表示参与者当前已被分派任务，Kd_i＝0表示参与者目前处于空闲状态，可分派任务；Ys_i是参与者的能力等级，决定参与者可接受的任务；Fp_i则表示为参与者完成任务的平均时间，Fa_i表示参与者当前可承受的任务数量，以上信息基于众包平台的历史纪录得到。

遗传与贪婪算法融合的众包高效分派方法，进一步的，众包任务分派和约束：众包平台的所有任务和全部参与者之间形成对应的匹配集合DN_ij，其属性可表示为<y_i，d_j，Z_ij>，任务j被分派给参与者i，参与者对所分派任务的适应度为Z_ij，适应度函数Z_ij即权重值函数，通过式1计算得出：

适应度函数Z_ij∈[0，1]，当Z_ij＝1的时候，则表示参与者i与任务j的适应性为完美匹配，代表在保证任务可被准确执行的前提下，参与者的能力没有任何浪费，人力资源成本得到充分利用；假设每个参与者都可靠，即参与者可以正确的完成所分派的任务，不会出现消极怠工或意外等其它情况；

本发明引入匹配系数H_ij表示任务j和参与者i的匹配关系，H_ij∈{0，1}，匹配系数只用0或者1表示，当H_ij＝0时，表示任务j与参与者i之间没有匹配关系，H_ij＝1时表示当前情况下任务j被分派给了参与者i；

通过对适应度函数Z_ij和匹配系数H_ij的描述，构建出众包平台中全部任务和参与者的对应关系矩阵Z和H，其中Z为适应度函数Z_ij的矩阵集合，Z＝{Z_ij|y_i∈Y，d_j∈D}，H是匹配系数H_ij所构成的矩阵集合，H＝{H_ij∈{0，1}|y_i∈Y，d_j∈D}，众包平台任务优化分派问题转化成对矩阵Z和矩阵H的组合求最优解的问题。

遗传与贪婪算法融合的众包高效分派方法，进一步的，本发明按照批次处理的方式对当前众包平台上的任务和参与者执行优化分派计算，优化问题的任务分派需要满足以下几个约束条件：

条件一：众包平台已分派的任务数量不能超过众包参与者总数；

众包平台已有的任务集合D＝{d_j|j＝1，2，...，n},当前可用的参与者集合Y＝{y_i|i＝1，2，...，m},匹配系数为H_ij；

条件二：众包平台的一个任务最多只会分派给一个参与者解决，设定参与者当前可承受任务的数量Fa_i＝1：

H_ij∩H_xy＝Φ 式3

根据以上问题的描述定义和约束条件，本发明总结出众包任务最优分派问题的数学模型如式6所示：

maxf(x)为众包任务最优分派的数学模型。

遗传与贪婪算法融合的众包高效分派方法，进一步的，编码操作：采用二维矩阵的编码方式构建染色体，对应于一个任务只会被分派给一个参与者的情况，使用单位初等矩阵的方式表示问题的可行解，设众包平台的参与者集合为矩阵行坐标，众包平台的任务集合为矩阵的列坐标，对应于分派问题的一个解表示为如下形式：

假设众包平台有五个众包参与者和五个众包任务，以上的编码染色体表示第一个任务分派给了第三个参与者，第二个任务被分派给了第一个参与者，第三、四、五个任务分别分派给了第二个、第四个、及最后一个参与者，采用二维0-1矩阵的编码方式简洁明表述问题的候选解。

遗传与贪婪算法融合的众包高效分派方法，进一步的，基于贪婪算法的特征，本发明在生成原始种群的步骤中，利用贪婪算法对适应度矩阵Z进行局部优化操作，假设对于众包平台的5个参与者和5个众包任务，其对应的能力等级和难度系数分别为Y_s＝[2，3，4，3，5]，Dt＝[1，2，2，4，5]，依据众包任务分派和约束中提出的适应度函数，得到适应度矩阵：

以众包参与者集合Y作为基础维度，依照约束条件，贪婪选取当前行向量中适应度最高的要素，得到匹配矩阵H1，同时如果以众包任务集合D作为基本维度进行贪婪搜索，得到另一个匹配矩阵H2，

匹配矩阵H1和H2都是满足约束条件的众包分派问题的解，同时H1和H2是通过贪婪算法所求得的局部最优解；

通过随机选取的方式生成原始种群保证染色体的多样性，使所得到的原始解集能尽可能的覆盖整个问题空间，将结果收敛于所找到的最优解或者近似最优解，将通过贪婪算法得到的局部最优解作为原始种群的父体和母体进行扩展操作,基于约束条件和矩阵的特征，对父体和母体进行随机变换操作之后得到不同的子代集合，这些生成的子代同样是原始问题的解之一，将父体、母体及子代所构成的集合确定为初代种群，通过以上操作增加初代种群的多样性，丰富初代种群的规模，以上为本发明生成原始种群的过程。

遗传与贪婪算法融合的众包高效分派方法，进一步的，评价适宜度：适宜度函数是判断本发明解集中染色体性能的指标，适宜度函数的选取直接决定染色体进化的方向和算法性能，鉴于众包分派问题的优化目标，且适宜度函数需要满足单值、非负、取最大值的条件要求，遗传与贪婪算法融合的众包高效分派方法直接将目标函数定义为适宜度函数，直接指明染色体的进化方向，同时可对问题获得直接求解的结果。

遗传与贪婪算法融合的众包高效分派方法，进一步的，交叉操作是将已经配对的染色体按规则相互交换其对应的部分基因，形成两个新的后代个体，同时期望后代个体继承父代的优秀基因，表现出更好的适宜度，交叉操作决定遗传算法的局部搜索能力，内容包括从种群中对个体进行配对，并依照预定概率进行基因的交叉操作；交叉算子主要包含确定交叉点的位置和对交叉区域内的部分基因进行交换两部分内容；

鉴于众包任务分派的约束规则，本发明提出矢量变位法来引导交叉操作，具体规则为：首先假设已经配对的一组编码K1：[z1，z2，z3，z4，z5]，K2：[w1，w2，w3，w4，w5]，随机产生和染色体拥有相同列维数的0、1和矢量t，其中0要素表示改变该列向量的位置，1要素表示固定该列向量的位置。

遗传与贪婪算法融合的众包高效分派方法，进一步的，竞争选取是从解空间的群体中选取出适宜度高的个体，丢弃掉适宜度不足的个体，从而达到种群进步；

选取算子和适宜度函数相结合，式7计算评价出每个个体的相对适宜度：

以q_i作为选取概率，f_i为适宜度函数，采用轮盘赌选取法，为加快染色体的进化速度，使用基于局部竞争的选取策略，不再计算各个体的相对适应性，通过交叉操作得到子代个体和原始种群进行统一计算，分别得到每个个体在群体中的排名情况，然后依据适宜度排名选取最优秀的m个个体作为后代继续发展；

竞争选取操作保证每次进化过程中的优秀基因能够遗传到下一代，避免概率交叉突变和概率选取导致优秀个体被淘汰，无法在种群中得以体现的情况发生，通过竞争策略，在每次循环之后，将当前父代中最优秀的群体传承到子代中，加快算法的搜寻速度。

遗传与贪婪算法融合的众包高效分派方法，进一步的，变异操作是将单个染色体编码中的某些基因位上的基因值作出随机改变，形成一个新的个体，融合遗传算法与贪婪策略的任务分派方法中引入变异算子使个体发生未知变异，从而产生新的遗传信息，使寻优的过程可能指向未探索的候选解空间，达到增大全局最优搜索的能力，当算法在进化过程中因竞争选取操作，使得解空间收敛于局部最优解而无法摆脱时，通过变异操作跳出当前局限性，以维持种群的多样性，防止出现未成熟收敛；

本发明采用对换位变异算子执行变异操作，首先设定变异系数Q_n，随机选取m*Q_n个染色体作为变异个体，其中最优染色体不会被选中，然后分别随机生成两个1至m之间的自然数m1，m2，及两个1至m之间的自然数n1，n2，其中m1，m2对应选中个体中的行向量，n1，n2对应选中个体的列向量，将第m1位和m2位及第n1位和n2位的编码对调，从而得到新的变异个体。

遗传与贪婪算法融合的众包高效分派方法，进一步的，多任务分派架构：当众包平台内的任务不断增多，使得任务数量远远超过众包参与者的人数，并且两者之间的差距在一个数量级以上时，此时为保证众包平台的吞吐量和减缓众包任务压力，融合遗传算法与贪婪策略的任务分派方法将会提升当前可用参与者承受任务的数量，最大程度上将当前平台所积累的任务以最优的方式分派出去，参数Fa取值如式8所示：

其中n为当前众包平台任务的数量，m表示当前参与者的数量，Fa是参与者最大承接任务数量，采用向下取整的方式方便对任务和参与者进行统一处理，此时众包任务分派问题依旧满足本发明众包任务分派和约束中所提出的约束条件，在执行多任务分派策略时，利用贪婪算法对数据进行前置处理的过程不同于单任务分派策略，此时以参与者集合，即矩阵行向量为基础维度，贪婪选取当前行向量中适宜度最高的Fa个要素，依照约束条件，一旦任务被分派之后将不再考虑，此时得到匹配矩阵H，也是遗传种群的父体与母体，通过对匹配矩阵H进行不同的行列变换以得到子代集合，这些子代集合和矩阵H共同构成融合遗传算法与贪婪策略的任务分派方法的原始种群，之后通过本发明的交叉、选取、变异算子操作实现算法对多任务分派问题寻找最优解或者次优解的过程。

与现有技术相比，本发明的贡献和创新点在于：

第一，众包平台上汇聚了大量的众包任务和闲散的众包参与者，不同的任务有不同的任务需求和难度，同样，大量的众包参与者也各自拥有解决问题的能力和技巧，本发明充分利用众包平台上参与者的智慧与技能，将适合的任务分派给适合的参与者处理解决，从而达到群体智慧成本的利用和节约的目的。通过制定局部竞争策略和最优染色体保证策略，在不破坏当前最优结果的前提下扩大方法的搜索能力和收敛速度，本发明在不同问题规模的模拟情况下，均能得到良好的近似最优解，同时能很好的扩展到多任务分派架构中，适当的提升参与者的多任务数量，能够很好的兼顾众包平台任务的吞吐量和众包任务分派的准确性，具有广阔的市场运用前景；

第二，众包作为一种新型的协同工作理念，正逐渐演化成不同的商业模式，众多的众包参与者也都开始变得更为活跃，众包模式将会融入到我们多样的社会生活和工作中。众包用户在解决任务的同时，也为自己赚取了相应的报酬，大多数的众包任务并不需要消耗太多时间，这种自由灵活的工作方式受到了更多用户和发布者的喜爱，随着开放式平台聚集了越来越多的任务和解决者，众包面临的最大挑战就是如何将任务准确高效的分派给适合的任务解决者。本发明基于众包模式中的约束条件，提出融合遗传算法与贪婪策略的众包任务分派方法，准确高效的将不同需求的任务分别匹配给适合的任务解决者，利用MATLAB实验分析和性能比较，验证了本发明提出的方法能有效的达到众包问题中准确高效分派的目标。

第三，本发明借鉴生物进化论中遗传选择和自然淘汰的思想，演化改良的一种计算模型，是一种全新优化的搜索启发式算法，操作便捷且鲁棒性强，适应范围广泛。本发明是并行高效的随机搜索方法，利用群体搜索，对解决众包模式分派问题非常有效，比起传统的分派优化方法，还具有以下二个方面的优点：一是不对问题进行直接处理，而是将处理对象转化成编码后的染色体，通过编码翻译，使得遗传算法可直接对可行解集进行操作，覆盖面大，便于寻找全局最优解，避免了传统算法容易陷入局部最优的情况，在众包分派领域求解问题有极好的适用效果；二是与传统搜索方法从单点开始搜索计算不同，在处理分派问题时，同时对群体中多个个体进行评价，不仅有良好的并行能力，而且大幅减少了陷入局部最优解的风险，在任务全局搜索优化的过程中有良好表现；

第四，本发明提出的众包分派系统依据要素属性之间的约束条件，尽可能的实现众包任务的最优分派，将最合适的任务分派给最合适的人，达到人力资源的最优利用。众包申请者在平台上发布了大量不同类别、不同难度的微任务，每个众包参与者需要浏览这些任务，并选择执行适合自己的任务，但由于大量任务未经过任何的标注处理，使得众包参与者需要耗费大量时间用于寻找适合的任务，寻找适合任务所花费的时间时常比执行时间更多，明显降低了众包参与者们的效率和兴趣，本发明能够帮助众包参与者快速准确选择适合的任务，这种快捷方便的理念更加适合众包参与者。

附图说明

图1是本发明的众包平台工作流程示意图。

图2是本发明的融合遗传算法与贪婪策略的任务分派方法流程图。

具体实施方式

下面融合附图，对本发明提供的遗传与贪婪算法融合的众包高效分派方法的技术方案进行进一步的描述，使本领域的技术人员可以更好的理解本发明并能予以实施。

随着互联网的高速发展，群体智慧逐渐引起人们的关注，由人来执行和完成的复杂问题无论是在效率上还是在准确性上都远远的超过了机器。当前普遍认为社群团体的工作效果可以很好的补充交由计算机执行的任务。虽然人在工作效率和质量等方面都有保证，但始终阻碍集群工作发展的是人力资源成本，随着众包模式的提出，以前所顾虑的人力资源成本问题有了全新的突破口。

众包作为一种新型的协同工作理念，正逐渐演化成不同的商业模式，众多的众包参与者也都开始变得更为活跃，众包模式将会融入到我们多样的社会生活和工作中。如图1所示，众包用户在解决任务的同时，也为自己赚取了相应的报酬，大多数的众包任务并不需要消耗太多时间，这种自由灵活的工作方式受到了更多用户和发布者的喜爱，随着开放式平台聚集了越来越多的任务和解决者，众包面临的最大挑战就是如何将任务准确高效的分派给适合的任务解决者。

众包模式是互联网高速发展下的一种新型工作模式，自由的众包参与者和任务申请者通过众包平台进行互动和交易，众包领域中的任务分派是亟需解决的问题之一。众包平台上汇聚了大量的众包任务和闲散的众包参与者，不同的任务有不同的任务需求和难度，同样，大量的众包参与者也各自拥有解决问题的能力和技巧，如何充分利用众包平台上参与者的智慧与技能，将适合的任务分派给适合的参与者处理解决，从而达到群体智慧成本的利用和节约，是极具挑战性的问题。

本发明针对于众包模式中众包任务和众包参与者的最优匹配问题提出一种融合遗传算法与贪婪策略的众包分派方法架构，本发明首先将问题进行形式化描述，抽象出数学模型矩阵，然后利用贪婪策略生成原始种群的父体和母体，通过繁殖操作扩大种群规模，形成初代群体；随后引入和优化遗传算法中的交叉、选取、变异算子，通过制定局部竞争策略和最优染色体保证策略，在不破坏当前最优结果的前提下扩大方法的搜索能力和收敛速度。

本发明基于众包模式中的约束条件，提出的融合遗传算法与贪婪策略的任务分派方法在不同问题规模的模拟情况下，均能得到良好的近似最优解，准确高效的将不同需求的任务分别匹配给适合的任务解决者，用MATLAB实验分析和性能比较，当众包任务规模大于众包参与者数量时，本发明方法能够获得高达89.3％以上的适宜度，同时在众包任务与参与者数量对等的情况下，方法依旧能得到较好的匹配适宜度，验证了本发明提出的方法能有效的达到众包问题中准确高效分派的目标。同时本发明方法能很好的扩展到多任务分派架构中，适当的提升参与者的多任务数量，能够很好的兼顾众包平台任务的吞吐量和众包任务分派的准确性。

一、众包分派方法理论分析

遗传算法是借鉴生物进化论中遗传选择和自然淘汰的思想，演化改良的一种计算模型，是一种全新优化的搜索启发式算法，操作便捷且鲁棒性强，适应范围广泛。遗传算法对所求问题的可行解个体进行编码，按照优胜劣汰的方式，依据每次进化中个体的适应性程度进行选择，然后借助遗传算子对选中个体进行遗传操作，生成后代个体。对在进化过程中经过多次迭代后产生的优质种群，进行解码操作，依照进化论的理论思想，通过多次迭代得出的最优个体认定为所求问题的最优解。

在现实应用中，众包平台的任务分派会受制于多种约束条件，需要探求多重属性的影响，及多种情况的组合，是典型的NP-C问题，采用单纯的数学解析式或者单一算法很难得出众包分派的最优解，遗传算法是并行高效的随机搜索方法，利用群体搜索，对解决众包模式分派问题非常有效，比起传统的分派优化方法，它还具有以下二个方面的优点：一是遗传算法不对问题进行直接处理，而是将处理对象转化成编码后的染色体，这是遗传算法相比于传统优化方法的最大优势，通过编码翻译，使得遗传算法可直接对可行解集进行操作，覆盖面大，便于寻找全局最优解，避免了传统算法容易陷入局部最优的情况，基于此特点，遗传算法在众包分派领域求解问题有极好的适用效果；二是与传统搜索方法从单点开始搜索计算不同，对于多峰值分布的搜索空间时常会局限于某个单峰优解上，遗传算法在处理分派问题时，同时对群体中多个个体进行评价，不仅有良好的并行能力，而且大幅减少了陷入局部最优解的风险，在任务全局搜索优化的过程中有良好表现。

贪婪算法的核心思想是在对问题的求解过程中，依据当时的情况总是做出当下看来最好的选择方案，实现对整个问题的求解过程。遗传算法在对目标问题生成初始解空间是完全随机的，使得算法很难快速找到最优解，加大了后续迭代选择过程的压力，本发明在对分派问题初期的求解过程中利用贪婪策略得出局部最优解，作为遗传算法最优解的基础保障，同时对遗传算法的后续交叉变异操作进行处理，增加解集合的多样性，扩大解空间的搜索范围，提高寻找到全局最优解的可能性。

二、众包分派问题描述

(一)定义众包要素

本发明提出的众包分派系统依据要素属性之间的约束条件，尽可能的实现众包任务的最优分派，将最合适的任务分派给最合适的人，达到人力资源的最优利用。众包申请者在平台上发布了大量不同类别、不同难度的微任务，每个众包参与者需要浏览这些任务，并选择执行适合自己的任务，但由于大量任务未经过任何的标注处理，使得众包参与者需要耗费大量时间用于寻找适合的任务，寻找适合任务所花费的时间时常比执行时间更多，明显降低了众包参与者们的效率和兴趣，高效精准的任务分派能够帮助众包参与者快速准确选择适合的任务，这种快捷方便的理念更加适合众包参与者。

对于众包分派问题两个主体的描述通过相关参数进行定义：

定义一：众包平台已有的任务集合D＝{d_j|j＝1，2，...，n}，任务的总数为n，对于每个任务d_j，其拥有的属性元组为<Bs，Xxms，Dt，Tjs，Jzs>，其中Bs是任务的唯一标示，Xxms表示任务的详细描述，Dt表示任务的难度等级，通过分析众包任务特点使用类似FKGL级别确定，Tjs和Jzs分别表示任务的提交时间和截止时间，以上信息全部由任务发布者提供。

(二)众包任务分派和约束

在对众包模式的两大主体即众包任务和众包参与者进行定义和属性详解后，众包平台的所有任务和全部参与者之间形成对应的匹配集合DN_ij，其属性可表示为<y_i，d_j，Z_ij>，任务j被分派给参与者i，参与者对所分派任务的适应度为Z_ij，适应度函数Z_ij即权重值函数，通过式1计算得出：

适应度函数Z_ij∈[0，1]，当Z_ij＝1的时候，则表示参与者i与任务j的适应性为完美匹配，代表在保证任务可被准确执行的前提下，参与者的能力没有任何浪费，人力资源成本得到充分利用。假设每个参与者都可靠，即参与者可以正确的完成所分派的任务，不会出现消极怠工或意外等其它情况。

本发明引入匹配系数H_ij表示任务j和参与者i的匹配关系，H_ij∈{0，1}，匹配系数只用0或者1表示，当H_ij＝0时，表示任务j与参与者i之间没有匹配关系，H_ij＝1时表示当前情况下任务j被分派给了参与者i。

众包的任务发布和参与者的数量是动态的，本发明按照批次处理的方式对当前众包平台上的任务和参与者执行优化分派计算。优化问题的任务分派需要满足以下几个约束条件：

H_ij∩H_xy＝Φ 式3

maxf(x)为众包任务最优分派的数学模型。

三、融合贪婪策略和遗传策略的分派方法架构

本发明提出的融合遗传算法与贪婪策略的任务分派方法是一种混合启发式算法，本发明将贪婪策略和遗传策略两种算法融合并优化，使其在局部最优解的基础上更快的找到众包分派问题的全局最优解或者近似最优解。遗传与贪婪算法融合的众包高效分派方法主要分为两部分，在第一部分中使用贪婪算法对原始数据进行前置处理，得到局部最优解以生成原始种群，使得算法最差的情况也能保障一个局部最优解；第二部分基于遗传算法改进流程，依据优化的目标对选取、交叉、变异算子操作进行调整，尽可能找到全局最优解或者近似最优解。以上是本发明的基本架构，具体步骤如下。

(一)贪婪策略的种群繁殖

1.编码操作

遗传算法无法直接对问题的自变量或者因变量进行处理，算法执行之前需要把所求问题的相关参数转换成对应的染色体编码，模仿自然法则中的进化规律实现对问题的求解。合适的编码充分利用遗传算法获得问题的明确结果，对问题的编码需要具备以下二个条件：一是保证问题空间中的所有解集都能够被遗传编码的染色体所表示，二是遗传空间的所有染色体能和原始问题的解集一一对应。

针对以上的编码规范并结合众包分派问题实际，本发明采用二维矩阵的编码方式构建染色体，对应于一个任务只会被分派给一个参与者的情况，使用单位初等矩阵的方式表示问题的可行解，设众包平台的参与者集合为矩阵行坐标，众包平台的任务集合为矩阵的列坐标，对应于分派问题的一个解可表示为如下形式：

假设众包平台有五个众包参与者和五个众包任务，以上的编码染色体表示第一个任务分派给了第三个参与者，第二个任务被分派给了第一个参与者，第三、四、五个任务分别分派给了第二个、第四个、及最后一个参与者，采用二维0-1矩阵的编码方式简洁明表述问题的候选解，同时也为算法后续步骤提供了方便。

2.贪婪选取和繁殖

贪婪算法在问题求解过程中，总是遵循当前最优解原则，时常得到的是问题的局部最优解。不过贪婪算法可快速的收敛于问题的局部最优解上，在某些情况下，这也可能是全局最优解，而且贪婪算法没有回溯的过程，只需一次性的计算便可得到问题的局部最优解。

基于贪婪算法的特征，本发明在生成原始种群的步骤中，不再从问题的解集合中随机选取原始种群，而是利用贪婪算法对适应度矩阵Z进行局部优化操作，假设对于众包平台的5个参与者和5个众包任务，其对应的能力等级和难度系数分别为Y_s＝[2，3，4，3，5]，Dt＝[1，2，2，4，5]，依据众包任务分派和约束中提出的适应度函数，得到适应度矩阵：

匹配矩阵H1和H2都是满足约束条件的众包分派问题的解，同时H1和H2是通过贪婪算法所求得的局部最优解。

通过随机选取的方式生成原始种群保证染色体的多样性，使所得到的原始解集能尽可能的覆盖整个问题空间，将结果收敛于所找到的最优解或者近似最优解。将通过贪婪算法得到的局部最优解作为原始种群的父体和母体进行扩展操作,基于约束条件和矩阵的特征，对父体和母体进行随机变换操作之后得到不同的子代集合，这些生成的子代同样是原始问题的解之一，将父体、母体及子代所构成的集合确定为初代种群，通过以上操作既增加了初代种群的多样性，也丰富了初代种群的规模，以上为本发明生成原始种群的过程。

(二)遗传方法和策略

1.评价适宜度

适宜度评估个体对环境的适应能力，也表示自然环境对该个体的选取概率，适宜度函数是判断本发明解集中染色体性能的指标，因为遗传算法在进化过程中并不需要借助外部信息，所以适宜度函数的选取直接决定染色体进化的方向和算法性能。鉴于众包分派问题的优化目标，且适宜度函数需要满足单值、非负、取最大值的条件要求，遗传与贪婪算法融合的众包高效分派方法直接将目标函数定义为适宜度函数，直接指明染色体的进化方向，同时可对问题获得直接求解的结果。

2.交叉操作

交叉操作是将已经配对的染色体按规则相互交换其对应的部分基因，形成两个新的后代个体，同时期望后代个体继承父代的优秀基因，表现出更好的适宜度。交叉操作决定遗传算法的局部搜索能力，内容包括从种群中对个体进行配对，并依照预定概率进行基因的交叉操作；交叉算子主要包含确定交叉点的位置和对交叉区域内的部分基因进行交换两部分内容。

鉴于众包任务分派的约束规则，本发明提出矢量变位法来引导交叉操作，具体规则为：首先假设已经配对的一组编码K1：[z1，z2，z3，z4，z5]，K2：[w1，w2，w3，w4，w5]，随机产生和染色体拥有相同列维数的0、1和矢量t，其中0要素表示改变该列向量的位置，1要素表示固定该列向量的位置，如t＝(0，1，0，0，1)，那么依据交叉的规则得到新的编码K3：[z3，z2，z4，z1，z5]，同样该流程应用于编码K2，生成新的编码K4，对于父体、母体的交叉结果为：

以上为匹配矩阵的交叉结果。

3.竞争选取

竞争选取是从解空间的群体中选取出适宜度高的个体，丢弃掉适宜度不足的个体，从而达到种群进步。选取算子和适宜度函数相结合，式7计算评价出每个个体的相对适宜度：

以q_i作为选取概率，f_i为适宜度函数，采用轮盘赌选取法，为加快染色体的进化速度，使用基于局部竞争的选取策略，不再计算各个体的相对适应性，通过交叉操作得到子代个体和原始种群进行统一计算，分别得到每个个体在群体中的排名情况，然后依据适宜度排名选取最优秀的m个个体作为后代继续发展。

竞争选取操作保证每次进化过程中的优秀基因能够遗传到下一代，避免概率交叉突变和概率选取导致优秀个体被淘汰，无法在种群中得以体现的情况发生。通过竞争策略，在每次循环之后，都能将当前父代中最优秀的群体传承到子代中，加快算法的搜寻速度。

4.变异操作

变异操作是将单个染色体编码中的某些基因位上的基因值作出随机改变，形成一个新的个体。融合遗传算法与贪婪策略的任务分派方法中引入变异算子使个体发生未知变异，从而产生新的遗传信息，使寻优的过程可能指向未探索的候选解空间，达到增大全局最优搜索的能力，当算法在进化过程中因竞争选取操作，使得解空间收敛于局部最优解而无法摆脱时，通过变异操作跳出当前局限性，以维持种群的多样性，防止出现未成熟收敛。

本发明采用对换位变异算子执行变异操作，首先设定变异系数Q_n，随机选取m*Q_n个染色体作为变异个体，其中最优染色体不会被选中，然后分别随机生成两个1至m之间的自然数m1，m2，及两个1至m之间的自然数n1，n2，其中m1，m2对应选中个体中的行向量，n1，n2对应选中个体的列向量，将第m1位和m2位及第n1位和n2位的编码对调，从而得到新的变异个体。如取m1＝n1＝1，m2＝n2＝4时，染色体H1则变异成为新个体E1：

上式为染色体H1则变异成为新个体E1。

5.迭代过程

融合遗传算法与贪婪策略的任务分派方法每一次的进化步骤都需要经历本发明提出的交叉、评价适宜度、竞争选取和变异操作，每次的进化过程称为迭代，当满足迭代次数已达到最大遗传代数Zdds时，终止计算，输出当前种群中最优的解，否则继续进入下一次迭代过程。

(三)多任务分派架构

因为众包参与者人力因素的不可知性和灵活性，在执行众包任务分派策略时，每次最多给众包参与者分派一个任务，即Fa_i＝1，当参与者将当前的任务完成之后，参与者的当前状态Kd_i转化为0，同时参与者进入到下一批次的分派过程中。

当众包平台内的任务不断增多，使得任务数量远远超过众包参与者的人数，并且两者之间的差距在一个数量级以上时，此时为保证众包平台的吞吐量和减缓众包任务压力，融合遗传算法与贪婪策略的任务分派方法将会提升当前可用参与者承受任务的数量，最大程度上将当前平台所积累的任务以最优的方式分派出去，参数Fa取值如式8所示：

(四)方法流程

针对于众包任务最优分派的目的，在满足各约束条件下将最合适的任务分派给最合适的人，以达到对当前人力资源成本的最大利用，在此问题基础上融合贪婪算法选取初代种群，引入遗传算法中的交叉、选取、变异算子到本发明方法中，提出适合的算子操作，在保证优质解的基础上寻求更优解，结合以上融合遗传算法与贪婪策略的任务分派方法的描述，得到众包任务分派方法的流程如图2所示。

Claims

1.遗传与贪婪算法融合的众包高效分派方法，其特征在于，针对于众包模式中众包任务和众包参与者的最优匹配问题，本发明方法的架构为：首先，将问题进行形式化描述，抽象出数学模型矩阵；然后，利用贪婪策略生成原始种群的父体和母体，通过繁殖操作扩大种群规模，形成初代群体；随后，引入和优化遗传算法中的交叉、选取、变异算子，通过制定局部竞争策略和最优染色体保证策略，在不破坏当前最优结果的前提下扩大方法的搜索能力和收敛速度；

2.根据权利要求1所述的遗传与贪婪算法融合的众包高效分派方法，其特征在于，众包任务分派和约束：众包平台的所有任务和全部参与者之间形成对应的匹配集合DN_ij，其属性可表示为<y_i，d_j，Z_ij>，任务j被分派给参与者i，参与者对所分派任务的适应度为Z_ij，适应度函数Z_ij即权重值函数，通过式1计算得出：

3.根据权利要求2所述的遗传与贪婪算法融合的众包高效分派方法，其特征在于，本发明按照批次处理的方式对当前众包平台上的任务和参与者执行优化分派计算，优化问题的任务分派需要满足以下几个约束条件：

H_ij∩H_xy＝Φ 式3

maxf(x)为众包任务最优分派的数学模型。

4.根据权利要求1所述的遗传与贪婪算法融合的众包高效分派方法，其特征在于，编码操作：采用二维矩阵的编码方式构建染色体，对应于一个任务只会被分派给一个参与者的情况，使用单位初等矩阵的方式表示问题的可行解，设众包平台的参与者集合为矩阵行坐标，众包平台的任务集合为矩阵的列坐标，对应于分派问题的一个解表示为如下形式：

5.根据权利要求1所述的遗传与贪婪算法融合的众包高效分派方法，其特征在于，基于贪婪算法的特征，本发明在生成原始种群的步骤中，利用贪婪算法对适应度矩阵Z进行局部优化操作，假设对于众包平台的5个参与者和5个众包任务，其对应的能力等级和难度系数分别为Y_s＝[2，3，4，3，5]，Dt＝[1，2，2，4，5]，依据众包任务分派和约束中提出的适应度函数，得到适应度矩阵：

6.根据权利要求1所述的遗传与贪婪算法融合的众包高效分派方法，其特征在于，评价适宜度：适宜度函数是判断本发明解集中染色体性能的指标，适宜度函数的选取直接决定染色体进化的方向和算法性能，鉴于众包分派问题的优化目标，且适宜度函数需要满足单值、非负、取最大值的条件要求，遗传与贪婪算法融合的众包高效分派方法直接将目标函数定义为适宜度函数，直接指明染色体的进化方向，同时可对问题获得直接求解的结果。

7.根据权利要求1所述的遗传与贪婪算法融合的众包高效分派方法，其特征在于，交叉操作是将已经配对的染色体按规则相互交换其对应的部分基因，形成两个新的后代个体，同时期望后代个体继承父代的优秀基因，表现出更好的适宜度，交叉操作决定遗传算法的局部搜索能力，内容包括从种群中对个体进行配对，并依照预定概率进行基因的交叉操作；交叉算子主要包含确定交叉点的位置和对交叉区域内的部分基因进行交换两部分内容；

8.根据权利要求1所述的遗传与贪婪算法融合的众包高效分派方法，其特征在于，竞争选取是从解空间的群体中选取出适宜度高的个体，丢弃掉适宜度不足的个体，从而达到种群进步；

9.根据权利要求1所述的遗传与贪婪算法融合的众包高效分派方法，其特征在于，变异操作是将单个染色体编码中的某些基因位上的基因值作出随机改变，形成一个新的个体，融合遗传算法与贪婪策略的任务分派方法中引入变异算子使个体发生未知变异，从而产生新的遗传信息，使寻优的过程可能指向未探索的候选解空间，达到增大全局最优搜索的能力，当算法在进化过程中因竞争选取操作，使得解空间收敛于局部最优解而无法摆脱时，通过变异操作跳出当前局限性，以维持种群的多样性，防止出现未成熟收敛；

10.根据权利要求1所述的遗传与贪婪算法融合的众包高效分派方法，其特征在于，多任务分派架构：当众包平台内的任务不断增多，使得任务数量远远超过众包参与者的人数，并且两者之间的差距在一个数量级以上时，此时为保证众包平台的吞吐量和减缓众包任务压力，融合遗传算法与贪婪策略的任务分派方法将会提升当前可用参与者承受任务的数量，最大程度上将当前平台所积累的任务以最优的方式分派出去，参数Fa取值如式8所示：