CN109409739A - 一种基于部分可观测马尔科夫决策过程的众包平台任务分配方法 - Google Patents

一种基于部分可观测马尔科夫决策过程的众包平台任务分配方法 Download PDF

Info

Publication number
CN109409739A
CN109409739A CN201811254337.XA CN201811254337A CN109409739A CN 109409739 A CN109409739 A CN 109409739A CN 201811254337 A CN201811254337 A CN 201811254337A CN 109409739 A CN109409739 A CN 109409739A
Authority
CN
China
Prior art keywords
state
task
movement
probability
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811254337.XA
Other languages
English (en)
Other versions
CN109409739B (zh
Inventor
刘峰
夏志伟
张弛
曾虎双
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN201811254337.XA priority Critical patent/CN109409739B/zh
Publication of CN109409739A publication Critical patent/CN109409739A/zh
Application granted granted Critical
Publication of CN109409739B publication Critical patent/CN109409739B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06313Resource planning in a project environment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • Educational Administration (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于部分可观测马尔科夫决策过程的众包平台任务分配方法包括如下步骤:1)准备阶段,准备平台运营数据,根据一定格式对数据进行标准化处理,形成标准数据集。2)建模阶段,首先根据平台特性建立POMDP平台初步模型,再根据数据集中的数据进行训练补充完成POMDP平台模型,生成POMDP文件。3)决策阶段,使用POMDP求解程序对POMDP文件进行求解,得到策略,应用于实际任务的决策支持当中。

Description

一种基于部分可观测马尔科夫决策过程的众包平台任务分配 方法
技术领域
本发明涉及众包平台的任务分配,尤其涉及一种基于部分可观察马尔科夫模型的众包平台任务分配方法。
背景技术
众包模式是一种时兴的商业模式,并且在实际应用中获得了广泛的认可。需求方向众包平台委托任务,众包平台将任务分配给提供方(以下称为工人)。并且平台需要负责对工人返回的结果进行评估,认为满意后反馈给需求方。每次分配任务,平台需要向工人支付报酬,而最终平台从需求方获得的酬金决定于任务的完成质量,获得的酬金与多次支付给工人的报酬之差就是众包平台的利润。随着众包平台的规模逐年扩大,用户数和任务数都数以万计,任务的分配不可能完全通过人工完成。因此,如何根据当前的任务状态选择最合适的工人以获得最大的利润,是一个急需解决的问题。
部分可观察马尔科夫决策过程(POMDP)模型是一个数学模型,用于解决不确定环境下的序贯决策问题。本发明提出了一种基于POMDP模型的众包平台任务分配方法,用于实现众包平台任务分配的决策支持。
发明内容
POMDP模型是一种良好的决策模型,适用于不确定环境下的决策支持。本发明提出了一种基于POMDP模型的众包平台任务分配方法。该方法首先根据众包平台记录的历史数据对 POMDP模型的元素按照众包平台特性进行了重定义,使用数据集建模生成标准POMDP文件。POMDP模型一般由八元组(S,A,Z,b0,T,O,R,γ)来表示。本发明中,状态集合S表示任务的状态,动作集合A表示对于任务可以进行的动作,观察集合Z表示每次动作后进行任务评估的结果,初始信念状态b0表示任务刚开始的状态,状态转移函数T,观察函数O,收益函数R都通过数据学习获得,折扣因子γ=0.95。然后求解POMDP模型后产生策略,最后基于策略实现众包平台的自动化智能决策。
一种基于POMDP模型的众包平台任务分配方法,该方法包括如下步骤:
1)准备阶段
a)准备日常的数据,即历史任务信息。
b)确定常数参数,包括工人等级数、任务种类数等。
c)对历史数据进行格式转换,按照特定的数据格式,对数据进行预处理。
2)建模阶段
a)根据应用的数据,确定状态、动作、观察、折扣银子等POMDP模型中的简单元素。
b)根据数据集进行函数学习,完成收益函数、状态转移函数、观察函数等POMDP 模型中的复杂元素。
c)根据需要提供决策支持的任务种类,确定初始信念状态。
d)将2-a)中的初步模型与2-b)中得到的函数以及2-c)中的初始信念状态结合,得到最终的POMDP平台模型。
e)根据标准POMDP模型文件的格式将POMDP平台模型转化为POMDP文件。
3)决策阶段
a)使用POMDP求解程序求解2-e)中得到的POMDP文件,求解得到从信念状态到动作映射的策略。
b)使用得到的决策,根据当前信念状态得到最优动作。
c)执行最优动作,更新信念状态等信息,重复执行b)直至终止。
其中步骤1-c)所述的数据格式说明:
1)数据格式需要满足特定的数据结构,首先定义的是一些集合:
任务种类集合T,工人等级集合L,任务完成质量集合Q={A,B,C,D},评估结果集合B={true,false}。
2)以下是历史信息的结构:
任务记录集合M={m1,m2,...,mk}中的每个元素包含了一次任务的全部信息。每条任务记录mi={P,t,r}有其对应任务执行过程集合P={p1,p2,...,pn}、任务种类t∈T以及任务请求方支付的酬劳对于每次任务执行过程pi=(ti,li,ci,bi),有对应的种类ti,工人等级li,支付的酬劳ci,评估结果bi。其中种类ti∈T,工人等级li∈L,支付酬劳关于评估结果bi,当i<n时,bi=false,当i=n时,bi=true。
其中步骤2-a)所述的模型说明:
1)状态(S):
一共有两种类型的状态,一种是正在执行中的状态(q,t),另一种是终止状态。正在执行的状态有两个元素,完成质量q和任务种类t,因此该种状态是种类和完成质量的笛卡尔积,数量是种类数乘以完成质量数。终止状态表示任务被提交,已经返回给需求方。
2)动作(A):
一共有两种类型的动作:分配(assign)和完成(complete)。
完成动作表示系统将任务终止,并返回给需求方。分配动作表示将任务分配给某一特定的工人群体,工人群体有两个元素,种类t和等级l,因此分配动作的数量为种类数乘以等级数,这里工人的种类与任务种类相同。
3)观察(Z):
一共有两种观察:true和false。
每次进行动作之后,众包平台都会对任务进行质量评估,评估通过则设观察值为true,否则为false。
其中2-b)的收益函数学习过程说明:
1)收益函数的格式为R:设转移前状态为s,动作为a,转移后状态为s’,关于动作a分情况讨论。
2)如果动作a是分配动作,搜索动作a所对应的任务种类的所有任务执行记录组成的集合Ma={m|m∈M,m的种类与a的种类相同},在集合Ma的任务执行过程中获取与动作a对应工人等级相同的任务执行过程组成的集合Pa={p|p∈m.P,m∈M’,p的工人等级与a的工人等级相同},计算Pa平均支付酬劳,取负后为收益,如果Pa是空集,则设R为负无穷,即:
3)如果动作a是结束动作,如果状态s为终止状态,则R=0,否则有状态s=(q,t)检索状态s所对应的任务种类中所有任务执行记录组成的集合Ms={m|m∈M,m的种类与s的种类相同},计算其平均酬劳,如果Ms是空集,则报错,发生数据缺失,即:
其中2-b)的状态转移函数学习过程说明:
τ:设转移前状态为s,动作为a,转移后状态为s’,概率分情况讨论:
1)首先关于动作a分类讨论,如果动作a为完成动作,那么任务必定进入终止状态,即对s’=e,转移概率τ=1,对s’≠e时,概率τ=0。
2)对于a是分配动作,关于转移前状态s分类讨论,如果转移前状态s为终止状态,那么类似情况1),转移后状态s’也一定是终止状态。如果转移前状态s不是终止状态,此时动作a是分配动作,那么转移后状态一定不是终止状态,即对转移后状态为终止状态,转移概率τ=0。
3)最后一种情况是转移前后状态s和s’都不是终止状态,动作a是分配动作。如果转移前后状态s和s’的任务种类不同,概率τ=0。对于转移前后状态s和s’状态任务种类相同,这里使用历史数据进行学习,学习过程如下:
4)以任务种类X为例,从M中取出所有任务种类为X的任务记录的集合MX={m|m ∈M,m的任务种类为X}。关于所有m∈MX,考察执行序列P={p1,p2,...,pn},新设一个对应的跃迁集合U={u1,u2,...,un},其中ui表示pi发生了质量跃迁的概率,即质量发生了提高的概率。初始质量为D,最终质量为A,发生了3次跃迁。故有在执行了pn之后,必然发生了质量由B到A的跃迁,即un=1(*),故ui的值与pi对应的工人等级li相关,不同工人等级对应的ui与工人的平均酬劳线性相关,即uH∶uM∶uL=RH∶RM∶RL,其中RH,RM,RL的计算方法为收益函数中分配动作的计算方法。联立(**)(***)可解得所有ui,然后对于所有的m∈MX中对应uH,uM,uL求均值,得到最终的UH,UM,UL。在状态转移函数中,由动作a对应的工人等级l,得到其对应的质量跃迁概率ul,则对于转移前状态s,如果s的任务质量为A,则转移后状态质量为A的概率为1,其它状态的概率为0。如果任务质量不为A,则状态发生跃迁的概率为ul,保持原状态的概率为1-ul,其它状态的概率为0,即:
其中2-b)的观察函数学习过程说明:
O:记动作为a,转移后状态为s,获得的观察为z。如果动作a是终止动作或状态s是结束状态,则观察值为true的概率为1,为false的概率为0,如果动作a 是分配动作,则状态s是执行中状态,此时观察函数取决于状态的完成质量q,关于q分情况讨论:
当q∈{C,D}时,观察值为true的概率为0,为false的概率是1。当q=B时,观察值为true的概率为0.2,为false的概率是0.8。当q=A时,观察值为true的概率为0.8,为false的概率是0.2。
其中2-c)的信念状态说明:
1)信念状态是信念空间上的一个概率分布,表示系统对当前状态的判断,用来作为决策的依据。
其中2-e)的文件格式说明:
1)POMDP文件有其特定的标准,需要说明POMDP八元组,其中状态、动作、观察的格式相似,其余的函数格式相似。POMDP文件格式并不单一,相同的模型有多种可选格式,在此只选择最简单的格式。
2)状态、动作、观察这三个元素的说明只需要列举元素的名称和个数。
3)初始信念状态需要说明每个状态的概率,由一个2行矩阵说明,第一行说明状态编号,第二行说明对应状态概率。
4)观察函数、状态转移函数、收益函数的函数输入都是三种元素的笛卡尔积,因此使用多个二维矩阵表示,选取一个元素作为矩阵编号,其余两个元素分别作为每个矩阵的行和列,最后矩阵中的每个元素说明特定输入下的函数值。
其中3-a)的求解程序说明:
1)求解程序基于点的值迭代算法(PBVI),PBVI算法是一种近似算法,相较于精确算法效果略差,但是复杂度低得多。
2)求解程序的输入是标准POMDP文件,对文件解析后获得模型,再对模型进行求解。
3)求解得到的结果是信念状态空间到动作的映射,即通过信念状态得到动作,实际上需要根据当前信念状态进行计算确定最优动作,而不是直接的映射关系。
其中3-c)的执行过程说明:
1)每次任务执行过程中,首先将当前信念状态代入策略进行计算,得到最优动作后进行动作执行,获得观察之后,根据观察更新信念状态等信息。
2)重复进行步骤1)的过程,直至最优动作为提交动作,此时结束循环。
附图说明
图1整体流程图。
图2准备阶段流程图。
图3建模阶段流程图。
图4执行阶段流程图。
具体实施方式
下面结合附图对本发明进行详细说明。
图1描述了一种基于POMDP模型的众包平台任务分配方法的总体流程,首先准备平台的数据,对数据进行标准化处理,其次进行POMDP建模,先利用平台特性形成初步模型,在通过数据训练补充完成模型,最后对模型进行求解,根据求解出的策略进行模拟任务,检验实际效果。
图2描述了准备阶段,准备阶段的任务是准备数据,并根据一定格式对数据进行标准化处理,为建模过程的数据训练做准备。
步骤2-1进行初始数据的准备,这一阶段视具体情况设置数据格式;
步骤2-2确定常数参数,包括工人等级数、任务质量数、任务种类数等;
步骤2-3对初始数据进行格式转换,使其满足标准数据格式要求;
步骤2-4生成标准数据集,将2-3中标准化后的数据进行整理,得到数据集。
图3描述了建模阶段,首先根据众包平台特性建立初步模型,再通过数据集的数据训练补充完成模型,同时设置初始信念,最后根据模型生成标准POMDP文件。
步骤3-1建立初步模型,根据步骤2-1中设置的常数确定模型的简单元素;
步骤3-2进行数据训练学习,包括状态转移函数、观察函数、收益函数的学习;
步骤3-3选择初始任务种类,生成初始信念状态;
步骤3-4将建模完成的POMDP模型转化为标准POMDP文件。
图4描述了决策阶段,首先求解POMDP文件,生成策略,之后新建任务,根据任务状态使用策略得到当前最优动作,模拟执行动作,最后得到结果检验实际效果。
步骤4-1使用已有POMDP求解程序求解,得到策略;
步骤4-2使用策略根据当前任务状态选择最优动作;
步骤4-3判断是否是分配动作,是则进行步骤4-4,否则进行步骤4-5;
步骤4-4进行分配动作,根据获得的观察更新信息,转回步骤4-2;
步骤4-5进行结束任务。

Claims (1)

1.一种基于部分可观测马尔科夫决策过程的众包平台任务分配方法,该方法包括如下步骤:
1)准备阶段
a)准备日常的数据,即历史任务信息。
b)确定常数参数,包括工人等级数、任务种类数等。
c)对历史数据进行格式转换,按照特定的数据格式,对数据进行预处理。
2)建模阶段
a)根据应用的数据,确定状态、动作、观察、折扣银子等POMDP模型中的简单元素。
b)根据数据集进行函数学习,完成收益函数、状态转移函数、观察函数等POMDP模型中的复杂元素。
c)根据需要提供决策支持的任务种类,确定初始信念状态。
d)将2-a)中的初步模型与2-b)中得到的函数以及2-c)中的初始信念状态结合,得到最终的POMDP平台模型。
e)根据标准POMDP模型文件的格式将POMDP平台模型转化为POMDP文件。
3)决策阶段
a)使用POMDP求解程序求解2-e)中得到的POMDP文件,求解得到从信念状态到动作映射的策略。
b)使用得到的决策,根据当前信念状态得到最优动作。
c)执行最优动作,更新信念状态等信息,重复执行b)直至终止。
其中步骤1-c)所述的数据格式说明:
1)数据格式需要满足特定的数据结构,首先定义的是一些集合:
任务种类集合T,工人等级集合L,任务完成质量集合Q={A,B,C,D},评估结果集合B={true,false}。
2)以下是历史信息的结构:
任务记录集合M={m1,m2,...,mk}中的每个元素包含了一次任务的全部信息。每条任务记录mi={P,t,r}有其对应任务执行过程集合P={p1,p2,...,pn}、任务种类t∈T以及任务请求方支付的酬劳对于每次任务执行过程pi=(ti,li,ci,bi),有对应的种类ti,工人等级li,支付的酬劳ci,评估结果bi。其中种类ti∈T,工人等级li∈L,支付酬劳关于评估结果bi,当i<n时,bi=false,当i=n时,bi=true。
其中步骤2-a)所述的模型说明:
1)状态(S):
一共有两种类型的状态,一种是正在执行中的状态(q,t),另一种是终止状态。正在执行的状态有两个元素,完成质量q和任务种类t,因此该种状态是种类和完成质量的笛卡尔积,数量是种类数乘以完成质量数。终止状态表示任务被提交,已经返回给需求方。
2)动作(A):
一共有两种类型的动作:分配(assign)和完成(complete)。
完成动作表示系统将任务终止,并返回给需求方。分配动作表示将任务分配给某一特定的工人群体,工人群体有两个元素,种类t和等级l,因此分配动作的数量为种类数乘以等级数,这里工人的种类与任务种类相同。
3)观察(Z):
一共有两种观察:true和false。
每次进行动作之后,众包平台都会对任务进行质量评估,评估通过则设观察值为true,否则为false。
其中2-b)的收益函数学习过程说明:
1)收益函数的格式为设转移前状态为s,动作为a,转移后状态为s’,关于动作a分情况讨论。
2)如果动作a是分配动作,搜索动作a所对应的任务种类的所有任务执行记录组成的集合Ma={m|m∈M,m的种类与a的种类相同},在集合Ma的任务执行过程中获取与动作a对应工人等级相同的任务执行过程组成的集合Pa={p|p∈m.P,m∈M’,p的工人等级与a的工人等级相同},计算Pa平均支付酬劳,取负后为收益,如果Pa是空集,则设R为负无穷,即:
3)如果动作a是结束动作,如果状态s为终止状态,则R=0,否则有状态s=(q,t)检索状态s所对应的任务种类中所有任务执行记录组成的集合Ms={m|m∈M,m的种类与s的种类相同},计算其平均酬劳,如果Ms是空集,则报错,发生数据缺失,即:
其中2-b)的状态转移函数学习过程说明:
设转移前状态为s,动作为a,转移后状态为s’,概率分情况讨论:
1)首先关于动作a分类讨论,如果动作a为完成动作,那么任务必定进入终止状态,即对s’=e,转移概率τ=1,对s’≠e时,概率τ=0。
2)对于a是分配动作,关于转移前状态s分类讨论,如果转移前状态s为终止状态,那么类似情况1),转移后状态s’也一定是终止状态。如果转移前状态s不是终止状态,此时动作a是分配动作,那么转移后状态一定不是终止状态,即对转移后状态为终止状态,转移概率τ=0。
3)最后一种情况是转移前后状态s和s’都不是终止状态,动作a是分配动作。如果转移前后状态s和s’的任务种类不同,概率τ=0。对于转移前后状态s和s’状态任务种类相同,这里使用历史数据进行学习,学习过程如下:
4)以任务种类X为例,从M中取出所有任务种类为X的任务记录的集合MX={m|m∈M,m的任务种类为X}。关于所有m∈MX,考察执行序列P={p1,p2,...,pn},新设一个对应的跃迁集合U={u1,u2,...,un},其中ui表示pi发生了质量跃迁的概率,即质量发生了提高的概率。初始质量为D,最终质量为A,发生了3次跃迁。故有在执行了pn之后,必然发生了质量由B到A的跃迁,即un=1(*),故ui的值与pi对应的工人等级li相关,不同工人等级对应的ui与工人的平均酬劳线性相关,即uH∶uM∶uL=RH∶RM∶RL,其中RH,RM,RL的计算方法为收益函数中分配动作的计算方法。联立(**)(***)可解得所有ui,然后对于所有的m∈MX中对应uH,uM,uL求均值,得到最终的UH,UM,UL。在状态转移函数中,由动作a对应的工人等级l,得到其对应的质量跃迁概率ul,则对于转移前状态s,如果s的任务质量为A,则转移后状态质量为A的概率为1,其它状态的概率为0。如果任务质量不为A,则状态发生跃迁的概率为ul,保持原状态的概率为1-ul,其它状态的概率为0,即:
其中2-b)的观察函数学习过程说明:
记动作为a,转移后状态为s,获得的观察为z。如果动作a是终止动作或状态s是结束状态,则观察值为true的概率为1,为false的概率为0,如果动作a是分配动作,则状态s是执行中状态,此时观察函数取决于状态的完成质量q,关于q分情况讨论:
当q∈{C,D}时,观察值为true的概率为0,为false的概率是1。当q=B时,观察值为true的概率为0.2,为false的概率是0.8。当q=A时,观察值为true的概率为0.8,为false的概率是0.2。
CN201811254337.XA 2018-10-19 2018-10-19 一种基于pomdp模型的众包平台任务分配方法 Active CN109409739B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811254337.XA CN109409739B (zh) 2018-10-19 2018-10-19 一种基于pomdp模型的众包平台任务分配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811254337.XA CN109409739B (zh) 2018-10-19 2018-10-19 一种基于pomdp模型的众包平台任务分配方法

Publications (2)

Publication Number Publication Date
CN109409739A true CN109409739A (zh) 2019-03-01
CN109409739B CN109409739B (zh) 2021-10-26

Family

ID=65469989

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811254337.XA Active CN109409739B (zh) 2018-10-19 2018-10-19 一种基于pomdp模型的众包平台任务分配方法

Country Status (1)

Country Link
CN (1) CN109409739B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110097277A (zh) * 2019-04-28 2019-08-06 北京交通大学 基于时间窗的众包任务的动态分配方法
CN112101663A (zh) * 2020-09-16 2020-12-18 国网辽宁省电力有限公司电力科学研究院 一种电网负荷预测方法
CN112700074A (zh) * 2019-10-22 2021-04-23 北京四维图新科技股份有限公司 快递任务的规划方法及装置
CN112801430A (zh) * 2021-04-13 2021-05-14 贝壳找房(北京)科技有限公司 任务下发方法、装置、电子设备及可读存储介质
CN113377655A (zh) * 2021-06-16 2021-09-10 南京大学 一种基于MAS-Q-Learing的任务分配方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101674482A (zh) * 2009-09-25 2010-03-17 上海大学 部分可观测马尔可夫决策过程中可伸缩视频流的优化调度方法
WO2014093953A2 (en) * 2012-12-14 2014-06-19 Microsoft Corporation Budget optimal crowdsourcing
CN107832882A (zh) * 2017-11-03 2018-03-23 上海交通大学 一种基于马尔科夫决策过程的出租车寻客策略推荐方法
CN108596335A (zh) * 2018-04-20 2018-09-28 浙江大学 一种基于深度强化学习的自适应众包方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101674482A (zh) * 2009-09-25 2010-03-17 上海大学 部分可观测马尔可夫决策过程中可伸缩视频流的优化调度方法
WO2014093953A2 (en) * 2012-12-14 2014-06-19 Microsoft Corporation Budget optimal crowdsourcing
CN107832882A (zh) * 2017-11-03 2018-03-23 上海交通大学 一种基于马尔科夫决策过程的出租车寻客策略推荐方法
CN108596335A (zh) * 2018-04-20 2018-09-28 浙江大学 一种基于深度强化学习的自适应众包方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110097277A (zh) * 2019-04-28 2019-08-06 北京交通大学 基于时间窗的众包任务的动态分配方法
CN110097277B (zh) * 2019-04-28 2021-10-08 北京交通大学 基于时间窗的众包任务的动态分配方法
CN112700074A (zh) * 2019-10-22 2021-04-23 北京四维图新科技股份有限公司 快递任务的规划方法及装置
CN112700074B (zh) * 2019-10-22 2024-05-03 北京四维图新科技股份有限公司 快递任务的规划方法及装置
CN112101663A (zh) * 2020-09-16 2020-12-18 国网辽宁省电力有限公司电力科学研究院 一种电网负荷预测方法
CN112801430A (zh) * 2021-04-13 2021-05-14 贝壳找房(北京)科技有限公司 任务下发方法、装置、电子设备及可读存储介质
CN112801430B (zh) * 2021-04-13 2021-11-12 贝壳找房(北京)科技有限公司 任务下发方法、装置、电子设备及可读存储介质
CN113377655A (zh) * 2021-06-16 2021-09-10 南京大学 一种基于MAS-Q-Learing的任务分配方法
CN113377655B (zh) * 2021-06-16 2023-06-20 南京大学 一种基于MAS-Q-Learing的任务分配方法

Also Published As

Publication number Publication date
CN109409739B (zh) 2021-10-26

Similar Documents

Publication Publication Date Title
CN109409739A (zh) 一种基于部分可观测马尔科夫决策过程的众包平台任务分配方法
Dzwigol Meta-analysis in management and quality sciences
CN108665120A (zh) 打分模型的建立、用户信用的评估方法及装置
Barnaud et al. An evolving simulation/gaming process to facilitate adaptive watershed management in northern mountainous Thailand
CN108805689A (zh) 一种贷款风险评估控制方法及装置
CN109902371A (zh) 一种基于深度强化学习的智能排课方法
Daniati et al. K-Means clustering with Decision Support System using SAW: Determining thesis topic
CN110288878A (zh) 自适应学习方法及装置
Karasev et al. Hybrid logical and probabilistic models for management of socioeconomic safety
Bousquet et al. Using multi-agent systems in a companion modelling approach for agroecosystem management in South-east Asia
CN112541584A (zh) 深度神经网络模型并行模式选择方法
CN108229688A (zh) 一种基于irt的信息处理方法及装置
Spielauer et al. microwelt: A dynamic microsimulation model for the study of welfare transfer flows in ageing societies from a comparative welfare state perspective
CN114969528A (zh) 基于能力评测的用户画像和学习路径推荐方法、装置及设备
Castro-Garcia et al. Developing topographic surveying software to train civil engineers
CN106970994A (zh) 一种自动化的在线实践证据提取方法
Bohner Decision-support systems for sustainable urban planning
CN111553822A (zh) 基于电子模拟沙盘的城市管理演练方法和装置及设备
Kravets et al. Creativity in Intelligent Technologies and Data Science: First Conference, CIT&DS 2015, Volgograd, Russia, September 15-17, 2015. Proceedings
Chen An investigation of the optimal test design for multi-stage test using the generalized partial credit model
Gordon et al. Testing the use of best professional judgment to create biological benchmarks for habitat assessment of wetlands and oak savannas in northwestern Indiana
Fraillon 6WXGHQWVè FRPSXWDWLRQDO WKLQNLQJ
Fraillon et al. Students’ computational thinking
Infanger et al. Applying Time-Inhomogeneous Markov Chains to Math Performance Rating
Mosig Towards a Method to Improve Alignment of Objective and Subjective Information Requirements of Decision Makers--The Potential of System Dynamics for Information Requirements Analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant