CN111353015B - 众包题目推荐方法、装置、设备及存储介质 - Google Patents

众包题目推荐方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111353015B
CN111353015B CN201811583482.2A CN201811583482A CN111353015B CN 111353015 B CN111353015 B CN 111353015B CN 201811583482 A CN201811583482 A CN 201811583482A CN 111353015 B CN111353015 B CN 111353015B
Authority
CN
China
Prior art keywords
question
answer
questions
crowdsourcing
topic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811583482.2A
Other languages
English (en)
Other versions
CN111353015A (zh
Inventor
赵振财
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201811583482.2A priority Critical patent/CN111353015B/zh
Publication of CN111353015A publication Critical patent/CN111353015A/zh
Application granted granted Critical
Publication of CN111353015B publication Critical patent/CN111353015B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种众包题目推荐方法、装置、设备及存储介质。其中,众包题目推荐方法包括:在对第一答题者推荐题目时,基于协同过滤推荐算法获得第一答题者对每个题目的预测打分;计算每个题目的出现概率,其中题目的出现概率与题目已经被回答的次数相关;基于第一答题者对每个题目的预测打分以及每个题目的出现概率,确定对第一答题者推荐的题目。根据本发明实施例,能够对答题者进行众包题目的个性化推荐,以提高答题者对众包任务的完成效率及完成质量。

Description

众包题目推荐方法、装置、设备及存储介质
技术领域
本发明属于数据处理技术领域,尤其涉及一种众包题目推荐方法、装置、设备及存储介质。
背景技术
众包指的是一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式外包给非特定的(而且通常是大型的)大众志愿者的做法。通常,众包任务以众包题目的形式通过众包平台向答题者进行发放。
以往众包平台在向答题者分配众包题目的过程中,通常会将众包题目的特征和属性与答题者的特征和属性进行匹配,并基于匹配结果向答题者分配众包题目,例如,将众包题目发放给与其具有相同特征和属性的答题者。
但是,这种为答题者分配众包题目的方法需要分别对众包题目和答题者进行特征和属性的提取,其过程较繁琐,需要对众包题目和答题者进行大量的特征和属性的分析。另外,在向答题者分配了众包题目后,也无法确定答题者是否能够高效、准确地完成分配的众包题目,并不能很好地提高众包题目的完成效率及完成质量。
发明内容
本发明实施例提供一种众包题目推荐方法、装置、设备及存储介质,能够对答题者进行众包题目的个性化推荐,以提高答题者对众包任务的完成效率及完成质量。
一方面,本发明实施例提供一种众包题目推荐方法,方法包括:
在对第一答题者推荐题目时,基于协同过滤推荐算法获得第一答题者对每个题目的预测打分;
计算每个题目的出现概率,其中题目的出现概率与题目已经被回答的次数相关;
基于第一答题者对每个题目的预测打分以及每个题目的出现概率,确定对第一答题者推荐的题目。
进一步地,题目的出现概率与题目已经被回答的次数成反比。
进一步地,基于第一答题者对每个题目的预测打分以及每个题目的出现概率,确定对第一答题者推荐的题目,包括:
计算第一答题者对每个题目的预测打分与每个题目的出现概率的几何平均数;
根据每个题目对应的几何平均数确定对第一答题者推荐的题目。
进一步地,根据每个题目对应的几何平均数,确定对第一答题者推荐的题目,包括:
按照对应的几何平均数的大小,对各个题目进行排序,从中选择预定数量的题目作为对第一答题者推荐的题目。
进一步地,在对第一答题者推荐题目之前,将第一答题者已经回答过的题目从备选题目中排除出去。
进一步地,在对第一答题者推荐题目之前,方法还包括:
判断第一答题者是否为首次出现的答题者;
如果第一答题者为首次出现的答题者,则根据第一答题者的网络浏览特征参数,利用预定的网络用户模型,得到第一答题者与已存在的答题者所属的相似群组;
将相似群组中答题者回答的部分或全部题目,作为对第一答题者推荐的题目。
进一步地,在对第一答题者推荐题目之前,方法还包括:
判断当前题目是否为首次出现的题目;
如果当前题目为首次出现的题目,则将当前题目分发给部分或全部已存在的答题者进行回答;
收集答题结果,并将答题结果纳入基于协同过滤推荐算法获得第一答题者对每个题目的预测打分的步骤中。
进一步地,题目的出现概率与题目已经被回答的次数为线性的反比关系。
进一步地,在基于协同过滤推荐算法获得第一答题者对每个题目的预测打分时,答题者对题目的打分按照以下方式处理:
未浏览题目为1分;
浏览过题目为1分;
完成答题为2分;
完成答题而答案错误为1分;
完成答题且答案正确为4分。
另一方面,本发明实施例提供了一种众包题目推荐装置,装置包括:
预测打分单元,其配置为在对第一答题者推荐题目时,基于协同过滤推荐算法获得第一答题者对每个题目的预测打分;
概率计算单元,其配置为计算每个题目的出现概率,其中题目的出现概率与题目已经被回答的次数相关;
题目推荐单元,其配置为基于第一答题者对每个题目的预测打分以及每个题目的出现概率,确定对第一答题者推荐的题目。
再一方面,本发明实施例提供了一种众包题目推荐设备,设备包括:处理器以及存储有计算机程序指令的存储器;
处理器执行计算机程序指令时实现上述的众包题目推荐方法。
再一方面,本发明实施例提供了一种存储介质,存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现上述的众包题目推荐方法。
本发明实施例的众包题目推荐方法、装置、设备及存储介质,能够在对答题者推荐题目时,基于协同过滤算法计算出答题者对每个题目的预测打分,并且计算出每个题目的出现概率,然后利用答题者对每个题目的预测打分和每个题目的出现概率,确定对答题者推荐的题目,从而根据答题者对每个题目的兴趣以及每个题目已经被回答的次数,使众包题目的分配更有针对性,以对答题者进行众包题目的个性化推荐,从而提高答题者对众包任务的完成效率及完成质量,降低为答题者分配众包题目时的数据处理量。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的众包题目推荐方法的流程示意图;
图2是本发明一个实施例的确定对答题者推荐的题目的方法的流程示意图;
图3是本发明另一个实施例提供的众包题目推荐方法的流程示意图;
图4是本发明又一个实施例提供的众包题目推荐方法的流程示意图;
图5是本发明一个实施例提供的众包题目推荐装置的结构示意图;
图6是本发明实施例提供的众包题目推荐设备x的硬件结构示意图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
为了解决上述问题,本发明实施例提供了一种众包题目推荐方法、装置、设备及存储介质。
首先对本发明实施例有可能涉及到的技术名词进行简要解释。
个性化推荐:根据不同用户的特征和偏好,为每个用户推送适合他的内容,在众包题目发放的背景下,个性化推荐指的是为每个答题者推送适合他的众包题目。
协同过滤推荐算法:通过分析用户兴趣,根据用户行为筛选出用户最适合的内容,协同过滤可分为基于用户的协同过滤(User-based CF)算法和基于内容的协同过滤(Item-based CF)算法两类。
冷启动:协同过滤是根据用户对内容的行为进行分析,当用户或者内容为新加入的用户或者内容时,并没有该用户或者用户对该内容的行为,此时,即为冷启动问题。
下面首先对本发明实施例所提供的众包题目推荐方法进行介绍。
图1示出了本发明一个实施例提供的众包题目推荐方法的流程示意图。如图1所示,该众包题目推荐方法包括:
S110、在对第一答题者推荐题目时,基于协同过滤推荐算法获得第一答题者对每个题目的预测打分;
S120、计算每个题目的出现概率,其中题目的出现概率与题目已经被回答的次数相关;
S130、基于第一答题者对每个题目的预测打分以及每个题目的出现概率,确定对第一答题者推荐的题目。
在本发明实施例中,第一答题者会首先向众包平台申请任务包,任务包一般包含多个众包任务,每个众包任务均会以众包题目(可以简称为“题目”)的形式发放给第一答题者。
在本发明实施例中,可以设一个任务包中所包含的题目的数量为k,众包平台的题目库中所有的题目总数为n。假设答题者A向众包平台申请任务包,当答题者A发出申请后,众包平台需要从题目库的n个题目中选择k个题目分配给答题者A。
另外,在众包任务中,每个题目都需要被回答一定的次数,才能够保证回收题目的质量,在本发明实施例中,可以设置每个题目需要被回答的次数为c。
因此,在对答题者A进行题目的个性化推荐时,需要综合考虑答题者A的个人兴趣、答题者A对该题目的回答能力和答题者A的技术水平,以及每个题目需要尽可能满足被回答的次数,从而计算出题目的推荐指数,以确定对答题者A推荐的题目。
本发明实施例能够在对答题者推荐题目时,基于协同过滤算法计算出答题者对每个题目的预测打分,并且计算出每个题目的出现概率,然后利用答题者对每个题目的预测打分和每个题目的出现概率,确定对答题者推荐的题目,从而根据答题者对每个题目的兴趣以及每个题目已经被回答的次数,使众包题目的分配更有针对性,以对答题者进行众包题目的个性化推荐,从而提高答题者对众包任务的完成效率及完成质量,降低为答题者分配众包题目时的数据处理量。
这里需要说明,答题者A可以是任意一名答题者,例如可以是已经完成过众包答题任务的非首次出现的答题者,也可以是首次参与众包答题的首次出现的答题者;其中,对于非首次出现以及首次出现,本发明采取不同的处理方式。以下将分别进行详细描述。
在本发明实施例的步骤S110中,可以首先获取答题者A(此处为非首次出现的答题者)对已经回答过的题目的历史行为数据。然后,答题者对已经回答过的题目的打分按照以下方式处理:
未浏览题目为1分;
浏览过题目为1分;
完成答题为2分;
完成答题而答案错误为1分;
完成答题且答案正确为4分。
其中,完成答题而答案错误依然被评为1分是出于答题者的个人兴趣、答题能力和技术水平是随着答题过程不断提升考虑的。
在本发明实施例的步骤S110中,协同过滤推荐算法优选为Item-based CF算法。
在Item-based CF算法中,需要先计算出题目内容的相似度矩阵。因此,需要获取全部的已存在的答题者对各自已经回答过的题目的历史行为数据,并利用上述的打分规则进行打分,得到下述的用户-内容评分矩阵W:
其中,Wij表示答题者i对题目j的打分。
然后,对W进行转置,得到转置矩阵WT。其中,WT的每一行代表该题目的一个向量。通过对所有向量进行两两计算,可以得到每两个向量之间的距离,即为每两个题目之间的相似度。由此,可构成题目相似度矩阵I。在本发明实施例中,优选地采用Jaccard公式计算WT的每两个向量之间的距离(题目相似度)。
在本发明实施例中,除上述的Jaccard公式外,每两个题目之间的相似度的计算方法还可以为Euclidean Distance算法、Cosine Similarity算法、曼哈顿相似度算法、对数似然相似度算法等。
接着,可以将用户-内容评分矩阵W与题目相似度矩阵I相乘,得到用户-内容预测打分矩阵。此时,便得到已存在的答题者对题目库中的每个题目的内容预测打分。但是,内容预测打分的分数范围为0-4。
为了简化后续的计算处理,降低运算量。最后,可以将用户-内容预测打分矩阵做归一化处理,得到用户-内容标准打分矩阵,使用户-内容标准打分矩阵中的数值范围归一化到0-1。其中,对用户-内容预测打分矩阵进行归一化处理的方法可以为Standardization方法、Min-Max normalization方法等。
此时,与答题者A对应的一行内容标准打分数据,即为答题者A对每个题目的预测打分。
在本发明实施例的步骤S120中,题目的出现概率与题目已经被回答的次数成反比。继续以题目库的n个题目中,每个题目需要被回答c次为例,可以设置若任一题目已经被回答的次数越多,则该题目的出现概率应该越低,若该题目已经被回答的次数越少,则该题目的出现概率应该越高。
在本发明实施例中,题目的出现概率可以与题目已经被回答的次数为线性的反比关系。根据题目已经被回答的次数,可以计算出该题目的出现概率。
设题目的出现概率的计算公式为:
其中,x表示题目已经被回答的次数。
则令x=0,f=1;x=c,f=0.01,可解系数得到系数b=1,
由此,可得到每个题目对应的出现概率f的计算公式为:
利用上述公式和题目库中的每个题目的已经被回答的次数,即可以计算得到题目库中的每个题目的出现概率。
图2示出了本发明一个实施例的确定对答题者推荐的题目的方法的流程示意图。如图2所示,步骤S130、基于第一答题者对每个题目的预测打分以及每个题目的出现概率,确定对第一答题者推荐的题目的具体方法可以包括:
S131、计算第一答题者对每个题目的预测打分与每个题目的出现概率的几何平均数;
S132、根据每个题目对应的几何平均数确定对第一答题者推荐的题目。
具体地,可以计算用户-内容标准打分矩阵S(S=W×I)与每个题目的出现概率f的几何平均数。
设用户-内容标准打分矩阵S中的每个元素为f1,每个题目出现的概率为f2,几何平均数F的计算公式为:
当计算出上述的几何平均数F之后,在本发明实施例的步骤S132中,根据每个题目对应的几何平均数,确定对答题者A推荐的题目的具体方法可以包括:
按照对应的几何平均数的大小,对各个题目进行排序,从中选择预定数量的题目作为对答题者A推荐的题目。
即可以按照几何平均数的大小,对各个题目进行降序排列,然后从几何平均数最大的题目开始连续选择预定数量的题目作为对答题者A推荐的题目,从而组成一个任务包。其中,预定数量可以为上述的k个,也可以根据需要,选择少于k个的题目进行推荐。
当答题者A完成上述分配的题目后,可以将其完成结果保存在历史行为数据中,用以后续的题目推荐。
在本发明实施例中,为了防止答题者已经回答过的题目被重复地推荐给答题者,在对答题者推荐题目之前,可以将答题者已经回答过的题目从备选题目中排除出去,使同一个答题者无法对同一个题目进行多次回答。
在本发明实施例中,由于新加入的答题者和新加入的题目都没有历史数据,因此无法利用上述的协同过滤算法为作为新加入的答题者推荐题目,也无法将未被回答过的题目进行分配。
因此,在本发明实施例中,在对第一答题者推荐题目之前还需要考虑第一答题者是否为新加入的答题者,即首次出现的答题者,以按照不同的方法对新加入的答题者和已存在的答题者推荐题目。
图3示出了本发明另一个实施例提供的众包题目推荐方法的流程示意图。
如图3所示,本发明实施例的众包题目推荐方法还包括:
S210、在对第一答题者推荐题目之前,判断第一答题者是否为首次出现的答题者;
S220、如果第一答题者为首次出现的答题者,则根据第一答题者的网络浏览特征参数,利用预定的网络用户模型,得到第一答题者与已存在的答题者所属的相似群组;
S230、将相似群组中答题者回答的部分或全部题目,作为对第一答题者推荐的题目。
在本发明实施例中,可以获取全部相似群组中的答题者对已经回答过的历史行为数据,根据上述历史行为数据利用本发明实施例的评分规则对相似群组中的答题者已经回答过的题目进行评分,并确定相似群组中的答题者对各个题目的平均评分,根据平均评分的大小对相似群组中的答题者已经回答过的题目进行降序排列,并选取预定数量的题目推荐给新加入的答题者。其中,预定数量可以为k个,k个题目可以为相似群组中的答题者已经回答过的题目的全部或部分。
需要说明的是,k也可以大于相似群组中的答题者已经回答过的题目的总数,超出的数量的题目可以在题目库中随机选择。
图4示出了本发明又一个实施例提供的众包题目推荐方法的流程示意图。
如图4所示,本发明实施例的众包题目推荐方法还包括:
S310、在对第一答题者推荐题目之前,判断当前题目是否为首次出现的题目;
S320、如果当前题目为首次出现的题目,则将当前题目分发给部分或全部已存在的答题者进行回答;
S330、收集答题结果,并将答题结果纳入基于协同过滤推荐算法获得第一答题者对每个题目的预测打分的步骤中。
具体地,在本发明实施例中,可以获取全部已存在的答题者的历史行为数据,并根据每个答题者对各个已经回答过的题目的评分,确定每个答题者的答题准确率。然后,可以按照答题准确率的大小对答题者进行将序排列,并从答题准确率最大的答题者开始选择需要推荐的答题者。当然,也可以设置准确率阈值,并选择答题准确率达到准确率阈值的答题者为其直接推荐该当前题目。
在本发明实施例中,可以应用于没有分析题目的特征和属性时,为申请任务包的答题者推荐题目的情况,可以满足用户的个人兴趣、回答能力和技术水平以及题目被回答的次数等多种条件,为答题者进行题目的个性化推荐,同时,针对冷启动问题也能够有效解决,从而提高众包任务的回答质量和回答效率。
图5示出了本发明一个实施例提供的众包题目推荐装置的结构示意图。如图5所示,该众包题目推荐装置包括:
预测打分单元410,其配置为在对第一答题者推荐题目时,基于协同过滤推荐算法获得第一答题者对每个题目的预测打分;
概率计算单元420,其配置为计算每个题目的出现概率,其中题目的出现概率与题目已经被回答的次数相关;
题目推荐单元430,其配置为基于第一答题者对每个题目的预测打分以及每个题目的出现概率,确定对第一答题者推荐的题目。
本发明实施例能够在对答题者推荐题目时,基于协同过滤算法计算出答题者对每个题目的预测打分,并且计算出每个题目的出现概率,然后利用答题者对每个题目的预测打分和每个题目的出现概率,确定对答题者推荐的题目,从而根据答题者对每个题目的兴趣以及每个题目已经被回答的次数,使众包题目的分配更有针对性,以对答题者进行众包题目的个性化推荐,从而提高答题者对众包任务的完成效率及完成质量,降低为答题者分配众包题目时的数据处理量。
图6示出了本发明实施例提供的众包题目推荐设备x的硬件结构示意图。
在众包题目推荐设备可以包括处理器501以及存储有计算机程序指令的存储器502。
具体地,上述处理器501可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本发明实施例的一个或多个集成电路。
存储器502可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器502可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器502可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器502可在综合网关容灾设备的内部或外部。在特定实施例中,存储器502是非易失性固态存储器。在特定实施例中,存储器X02包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器501通过读取并执行存储器502中存储的计算机程序指令,以实现上述实施例中的任意一种众包题目推荐方法。
在一个示例中,众包题目推荐设备还可包括通信接口503和总线510。其中,如图6所示,处理器501、存储器502、通信接口503通过总线510连接并完成相互间的通信。
通信接口503,主要用于实现本发明实施例中各模块、装置、单元和/或设备之间的通信。
总线510包括硬件、软件或两者,将在线数据流量计费设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线510可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
该众包题目推荐设备可以执行本发明实施例中的众包题目推荐方法,从而实现结合上述附图描述的众包题目推荐方法和装置。
另外,结合上述实施例中的众包题目推荐方法,本发明实施例可提供一种存储介质来实现。该存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种众包题目推荐方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

Claims (11)

1.一种众包题目推荐方法,所述方法包括:
在对第一答题者推荐题目时,基于协同过滤推荐算法获得所述第一答题者对每个题目的预测打分;
计算所述每个题目的出现概率,其中题目的出现概率与题目已经被回答的次数相关;
计算所述第一答题者对每个题目的预测打分与所述每个题目的出现概率的几何平均数;
根据每个题目对应的所述几何平均数确定对所述第一答题者推荐的题目。
2.根据权利要求1所述的众包题目推荐方法,其中,所述题目的出现概率与所述题目已经被回答的次数成反比。
3.根据权利要求1所述的众包题目推荐方法,其中,所述根据每个题目对应的所述几何平均数,确定对所述第一答题者推荐的题目,包括:
按照对应的几何平均数的大小,对各个题目进行排序,从中选择预定数量的题目作为对所述第一答题者推荐的题目。
4.根据权利要求1所述的众包题目推荐方法,其中,在对所述第一答题者推荐题目之前,将所述第一答题者已经回答过的题目从备选题目中排除出去。
5.根据权利要求1所述的众包题目推荐方法,其中,在对所述第一答题者推荐题目之前,所述方法还包括:
判断所述第一答题者是否为首次出现的答题者;
如果所述第一答题者为首次出现的答题者,则根据所述第一答题者的网络浏览特征参数,利用预定的网络用户模型,得到所述第一答题者与已存在的答题者所属的相似群组;
将所述相似群组中答题者回答的部分或全部题目,作为对所述第一答题者推荐的题目。
6.根据权利要求1所述的众包题目推荐方法,其中,在对所述第一答题者推荐题目之前,所述方法还包括:
判断当前题目是否为首次出现的题目;
如果所述当前题目为首次出现的题目,则将所述当前题目分发给部分或全部已存在的答题者进行回答;
收集答题结果,并将所述答题结果纳入所述基于协同过滤推荐算法获得所述第一答题者对每个题目的预测打分的步骤中。
7.根据权利要求1所述的众包题目推荐方法,其中,所述题目的出现概率与所述题目已经被回答的次数为线性的反比关系。
8.根据权利要求1所述的众包题目推荐方法,其中,在基于协同过滤推荐算法获得所述第一答题者对每个题目的预测打分时,答题者对题目的打分按照以下方式处理:
未浏览题目为1分;
浏览过题目为1分;
完成答题为2分;
完成答题而答案错误为1分;
完成答题且答案正确为4分。
9.一种众包题目推荐装置,其特征在于,所述装置包括:
预测打分单元,其配置为在对第一答题者推荐题目时,基于协同过滤推荐算法获得所述第一答题者对每个题目的预测打分;
概率计算单元,其配置为计算所述每个题目的出现概率,其中题目的出现概率与题目已经被回答的次数相关;
题目推荐单元,其配置为计算所述第一答题者对每个题目的预测打分与所述每个题目的出现概率的几何平均数;根据每个题目对应的所述几何平均数确定对所述第一答题者推荐的题目。
10.一种众包题目推荐设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;
所述处理器执行所述计算机程序指令时实现如权利要求1-8任意一项所述的众包题目推荐方法。
11.一种存储介质,其特征在于,所述存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-8任意一项所述的众包题目推荐方法。
CN201811583482.2A 2018-12-24 2018-12-24 众包题目推荐方法、装置、设备及存储介质 Active CN111353015B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811583482.2A CN111353015B (zh) 2018-12-24 2018-12-24 众包题目推荐方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811583482.2A CN111353015B (zh) 2018-12-24 2018-12-24 众包题目推荐方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111353015A CN111353015A (zh) 2020-06-30
CN111353015B true CN111353015B (zh) 2024-03-15

Family

ID=71191982

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811583482.2A Active CN111353015B (zh) 2018-12-24 2018-12-24 众包题目推荐方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111353015B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111914176B (zh) * 2020-08-07 2023-10-27 腾讯科技(深圳)有限公司 题目的推荐方法及装置
CN112559821A (zh) * 2020-12-22 2021-03-26 作业帮教育科技(北京)有限公司 高质数据的挖掘方法、生产方法和系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101221583A (zh) * 2008-01-29 2008-07-16 北京百问百答网络技术有限公司 一种问题推荐方法及系统
JP2010205189A (ja) * 2009-03-05 2010-09-16 Nec Corp 検索結果文書のスコアリングシステム、スコア算出装置、スコアリング方法、及びスコアリングプログラム
CN105138653A (zh) * 2015-08-28 2015-12-09 天津大学 一种基于典型度和难度的题目推荐方法及其推荐装置
CN107562769A (zh) * 2017-05-24 2018-01-09 广东工业大学 一种在线答题题目推荐方法及装置
CN107704580A (zh) * 2017-09-30 2018-02-16 百度在线网络技术(北京)有限公司 基于用户时期的问答推送方法、装置、服务器及存储介质
CN108229718A (zh) * 2016-12-22 2018-06-29 上海谦问万答吧云计算科技有限公司 一种信息预测方法及装置
CN108763314A (zh) * 2018-04-26 2018-11-06 深圳市腾讯计算机系统有限公司 一种兴趣推荐方法、装置、服务器及存储介质
CN109063000A (zh) * 2018-07-06 2018-12-21 深圳前海微众银行股份有限公司 问句推荐方法、客服系统以及计算机可读存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101221583A (zh) * 2008-01-29 2008-07-16 北京百问百答网络技术有限公司 一种问题推荐方法及系统
JP2010205189A (ja) * 2009-03-05 2010-09-16 Nec Corp 検索結果文書のスコアリングシステム、スコア算出装置、スコアリング方法、及びスコアリングプログラム
CN105138653A (zh) * 2015-08-28 2015-12-09 天津大学 一种基于典型度和难度的题目推荐方法及其推荐装置
CN108229718A (zh) * 2016-12-22 2018-06-29 上海谦问万答吧云计算科技有限公司 一种信息预测方法及装置
CN107562769A (zh) * 2017-05-24 2018-01-09 广东工业大学 一种在线答题题目推荐方法及装置
CN107704580A (zh) * 2017-09-30 2018-02-16 百度在线网络技术(北京)有限公司 基于用户时期的问答推送方法、装置、服务器及存储介质
CN108763314A (zh) * 2018-04-26 2018-11-06 深圳市腾讯计算机系统有限公司 一种兴趣推荐方法、装置、服务器及存储介质
CN109063000A (zh) * 2018-07-06 2018-12-21 深圳前海微众银行股份有限公司 问句推荐方法、客服系统以及计算机可读存储介质

Also Published As

Publication number Publication date
CN111353015A (zh) 2020-06-30

Similar Documents

Publication Publication Date Title
CN106485562B (zh) 一种基于用户历史行为的商品信息推荐方法及系统
EP3413221A1 (en) Risk assessment method and system
CN109982367B (zh) 移动终端上网用户投诉预测方法、装置、设备及存储介质
CN109685537B (zh) 用户行为的分析方法、装置、介质和电子设备
CN109961311B (zh) 客户推荐方法、装置、计算设备及存储介质
CN110930218B (zh) 一种识别欺诈客户的方法、装置及电子设备
CN112966865B (zh) 携号转网预测方法、装置及设备
CN111353015B (zh) 众包题目推荐方法、装置、设备及存储介质
CN111061948B (zh) 一种用户标签推荐方法、装置、计算机设备及存储介质
CN113791837B (zh) 页面处理方法、装置、设备和存储介质
CN110334936B (zh) 一种信贷资质评分模型的构建方法、装置和设备
CN109145207B (zh) 一种基于分类指标预测的信息个性化推荐方法及装置
CN110880117A (zh) 虚假业务识别方法、装置、设备和存储介质
CN115952468A (zh) 特征处理方法、装置、设备及计算机存储介质
CN116127188A (zh) 目标反馈值确定方法、装置、电子设备及存储介质
CN111899092B (zh) 基于二道模型的业务数据筛选方法及装置
CN115311001A (zh) 一种基于多重投票算法的预测用户换机倾向的方法及系统
CN111382265B (zh) 搜索方法、装置、设备和介质
CN115168700A (zh) 一种基于预训练算法的信息流推荐方法、系统及介质
CN110570301B (zh) 风险识别方法、装置、设备及介质
CN116415063A (zh) 云服务推荐方法及装置
CN113723522B (zh) 异常用户的识别方法、装置、电子设备以及存储介质
CN110580490A (zh) 一种确定人员行为概率的方法、装置及设备
CN113496288B (zh) 用户稳定性确定方法、装置、设备及存储介质
CN115471299A (zh) 产品排序方法、装置、设备、介质及程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant