CN114004667A

CN114004667A - 一种知识众包冷启动任务建模与推荐方法

Info

Publication number: CN114004667A
Application number: CN202111094657.5A
Authority: CN
Inventors: 阳碧玉; 王旭; 张帅; 高旻; 龙梅
Original assignee: Chongqing University
Current assignee: Chongqing University
Priority date: 2021-09-17
Filing date: 2021-09-17
Publication date: 2022-02-01
Anticipated expiration: 2041-09-17
Also published as: CN114004667B

Abstract

本发明公开了一种知识众包冷启动任务建模与推荐方法，涉及知识众包冷启动任务推荐技术领域，包括以下步骤：S1:获取外部数据，构建训练集和测试集；S2:构建交互预测模型，所述交互预测模型包括自注意力机制网络层；S3:将待预测知识众包冷启动任务显式属性输入训练好的交互预测模型。本发明引入冷启动任务、相似历史任务、服务商和历史参与任务的显式属性；采用自注意力机制分别捕捉知识众包冷启动任务及其相似历史任务特征、服务商及其参与历史任务特征之间的耦合关系，分配注意力权重，能有效准确地学习知识众包冷启动任务和服务商融合向量表征，为知识众包解决任务冷启动、缓解信息过载、实现任务‑服务商有效匹配提供了一个新思路。

Description

一种知识众包冷启动任务建模与推荐方法

技术领域

本发明涉及众包推荐技术领域，具体涉及一种知识众包冷启动任务建模与推荐方法。

背景技术

知识众包是以平台为媒介、以服务商专业知识和技能解决雇主商业发展及创新性问题的一种新型知识经济模式。随着互联网和零工经济的兴起，越来越多的组织和个人选择加入知识众包平台。然而，由于任务多样性、服务商个性化和平台网络外部性等，知识众包平台信息过载问题日益突出，雇主与服务商之间越发难以实现有效匹配，一方面，雇主很难雇佣到合适的服务商来完成知识众包任务；另一方面，服务商也很难找到合适的知识众包任务来获取收益。推荐系统是解决信息过载问题，帮助用户快速、准确定位感兴趣内容的有效工具。因此设计知识众包推荐系统有助于服务商和服务商的有效智能匹配，从而缓解信息过载问题，提高平台运作效率和用户满意度。

知识众包场景存在固有的任务冷启动、数据稀疏性和服务商个性化的特点。知识众包任务在发布到平台时，未与任何服务商产生交互，为完全冷启动任务。由于知识众包任务的短生命周期性和不可重复推荐性，导致了知识众包任务和服务商交互矩阵中只有很少部分的非0元素，很难用于交互预测模型计算。并且，知识众包场景中缺乏评分、评价等显式反馈信息，只存在服务商对知识众包任务的浏览、点击、收藏、投标、中标等隐式反馈，这也导致了数据稀疏性。此外，服务商的知识、技能、经验等的异质性导致了其知识众包任务参与偏好的个性化。数据稀疏性和服务商个性化是研究者们在设计知识众包推荐方法时必须考虑的因素。而知识众包任务冷启动是数据稀疏性的极端表现，知识众包任务冷启动场景下的知识众包推荐方法设计更具挑战性。

现有方法的限制：现有研究较少考虑知识众包任务冷启动场景下的知识众包推荐。部分学者通过引入知识众包任务类目这一属性，作为服务商和服务商之间的链接桥梁，并采用概率矩阵分解方法来对知识众包任务-服务商交互矩阵中的缺失值进行预测，一定程度解决了知识众包任务冷启动问题。然而，当矩阵中的交互数据较少时，模型的推荐效果并不好；且当平台引入新的知识众包任务类目时，此类方法无法对属于新知识众包任务类目的服务商进行推荐。此外，还有部分学者基于服务商的显式属性和服务商的历史参与知识众包任务之间的相似度，来进行推荐，服务商历史参与知识众包任务信息的引入能一定程度缓解数据稀疏性问题。然而，现实场景中可能存在知识众包任务属性缺失等问题；且由于知识众包任务的属性多由自然语言来描述，有可能存在描述不准确的情况，据此计算的相似度也有可能不准确。此外，服务商的历史参与知识众包任务对其个性化行为的刻画重要程度并不相同，而此类方法没有考虑这一点。

发明内容

针对现有技术中的缺陷，本发明提供一种知识众包冷启动任务建模与推荐方法，包括以下步骤：

S1:获取外部数据，构建训练集和测试集，其中，所述外部数据包括知识众包冷启动任务-服务商交互记录、知识众包冷启动任务显式属性和服务商显式属性，执行步骤S2；

S2:构建交互预测模型，其中，所述交互预测模型包括自注意力机制网络层，用所述训练集训练所述交互预测模型，用所述测试集测试所述交互预测模型；执行步骤S3；

S3:将待预测知识众包冷启动任务显式属性输入训练好的交互预测模型，得到知识众包冷启动任务-服务商交互预测情况；通过所述知识众包冷启动任务-服务商交互预测情况，为知识众包冷启动任务推荐服务商，完成推荐。

优选的，步骤S2中，所述交互预测模型还包括嵌入层，利用所述嵌入层产生所述外部数据的嵌入向量序列，所述嵌入向量序列包括知识众包冷启动任务向量序列、服务商向量序列。

优选的，利用所述嵌入层产生所述知识众包冷启动任务向量序列的方法为：

S21：基于知识众包冷启动任务显式属性，获取知识众包冷启动任务显式属性嵌入；

S22：基于知识众包冷启动任务显式属性嵌入，通过相似度计算获取相似历史任务及其显式属性嵌入；

S23：随机初始化相似历史任务的隐式特征向量；

S24：将所述知识众包冷启动任务显式属性嵌入、相似历史任务显式属性嵌入、相似历史任务的隐式特征向量进行拼接，得到知识众包冷启动任务向量序列。

优选的，利用所述嵌入层产生所述服务商向量序列的方法为：

S31:基于服务商显式属性，获取服务商显式属性嵌入；

S32:随机初始化服务商的隐式特征向量；

S33:基于所述知识众包冷启动任务-服务商交互记录，获取服务商历史参与任务显式属性嵌入；

S34:随机初始化服务商历史参与任务的隐式特征向量；

S35:将所述服务商显式属性嵌入、服务商的隐式特征向量、服务商历史参与任务显式属性嵌入、服务商历史参与任务的隐式特征向量进行拼接，得到服务商向量序列。

优选的，步骤S21中，基于知识众包冷启动任务显式属性，获取知识众包冷启动任务显式属性嵌入的方法为：

S211:对所述知识众包冷启动任务显式属性进行文本预处理；

S212:采用词向量法对预处理的所述知识众包冷启动任务显式属性进行向量化，得到知识众包冷启动任务所有显式属性嵌入集合；

S213:将知识众包冷启动任务所述所有显式属性嵌入进行拼接，得到知识众包显式冷启动任务属性嵌入。

优选的，获取所述服务商显式属性嵌入、服务商历史参与任务显式属性嵌入的方法与获取知识众包冷启动任务显式属性嵌入的方法相同。

优选的，步骤S2中，所述自注意力机制网络层包括第一自注意力机制网络、第二自注意力机制网络；将知识众包冷启动任务向量序列输入第一自注意力机制网络，得到任务融合向量表示；将服务商向量序列输入第二自注意力机制网络，得到服务商融合向量表示。

优选的，所述交互预测模型还包括输出层，利用输出层对服务商融合向量表示和任务融合向量表示进行内积，输出知识众包冷启动任务-服务商交互预测情况。

优选的，步骤S22中，所述相似历史任务是通过知识众包冷启动任务显式属性嵌入之间的余弦相似度计算得到的。

优选的，步骤S2中，用所述训练集训练所述交互预测模型过程中，采用成对损失函数和Adam算法训练所述交互预测模型。

本发明的有益效果体现在：本发明综合考虑了知识众包任务冷启动、数据高度稀疏性和服务商个性化的特点，引入了知识众包冷启动任务、相似历史任务、服务商和历史参与任务的显式属性；采用自注意力机制分别捕捉知识众包冷启动任务及其相似历史任务特征、服务商及其参与历史任务特征之间的耦合关系，分配注意力权重，能有效准确地学习知识众包冷启动任务和服务商表征，提升了交互预测模型性能，为知识众包解决任务冷启动、缓解信息过载、实现任务-服务商有效匹配提供了一个新思路。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中，类似的元件或部分一般由类似的附图标记标识。附图中，各元件或部分并不一定按照实际的比例绘制。

图1是本发明的流程图；

图2是本发明的模型结构图；

图3是自注意力机制网络层对模型效果改进图；

图4是嵌入维度的影响图；

图5是自注意力机制头数的影响图；

图6是相似历史任务数量的影响图；

图7是历史参与任务数量的影响图；

图8是正则化参数的影响图。

具体实施方式

下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案，因此只作为示例，而不能以此来限制本发明的保护范围。

需要注意的是，除非另有说明，本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。

实施例

如图1所示，一种知识众包冷启动任务建模与推荐方法，包括以下步骤：

值得说明的，设置有数据库，所示数据库中保存有知识众包冷启动任务信息、雇主信息、历史知识众包冷启动任务信息、任务-服务商交互记录、服务商信息，通过这些信息得到外部数据，其中，所述知识众包冷启动任务显式属性包括知识众包冷启动任务本身的显式属性以及雇主的显式属性，如任务标题、任务描述、任务类型、所述任务类目、雇主类型、地域等；所述服务商显式属性包括自我介绍、偏好任务类型、偏好任务类目等；所述相似历史任务是通过知识众包冷启动任务显式属性嵌入之间的余弦相似度计算得到的。

值得说明的，所述交互预测模型还包括嵌入层，利用所述嵌入层产生所述外部数据的嵌入向量序列，所述嵌入向量序列包括知识众包冷启动任务向量序列、服务商向量序列。

值得说明的，利用所述嵌入层产生所述知识众包冷启动任务向量序列的方法为：

S22：基于知识众包冷启动任务显式属性嵌入，通过相似度计算相似历史任务及其显示属性嵌入；

S23：随机初始化相似历史任务的隐式特征向量；

值得说明的，所述相似历史任务是通过知识众包冷启动任务显式属性嵌入之间的余玄相似度计算得到的，从相似度的前k个历史知识众包冷启动任务作为相似历史任务显式属性嵌入。

值得说明的，利用所述嵌入层产生所述服务商向量序列的方法为：

S31:基于服务商显式属性，获取服务商显式属性嵌入；

S32:随机初始化服务商的隐式特征向量；

S33:基于所述服务商历史参与任务显式属性，获取服务商历史参与任务显式属性嵌入；

S34:随机初始化服务商历史参与任务的隐式特征向量；

值得说明的，步骤S21中，基于知识众包冷启动任务显式属性，获取知识众包冷启动任务显式属性嵌入的方法为：

S211:对所述知识众包冷启动任务显式属性进行文本预处理；

S213:将知识众包冷启动任务中所述所有显式属性嵌入进行拼接，得到知识众包冷启动任务显式属性嵌入。

值得说明的，获取所述服务商显式属性嵌入、服务商历史参与任务显式属性嵌入的方法与获取知识众包冷启动任务显式属性嵌入的方法相同。

值得说明的，所述自注意力机制网络层包括第一自注意力机制网络、第二自注意力机制网络；将知识众包冷启动任务向量序列输入第一自注意力机制网络，得到任务融合向量表示；将服务商向量序列输入第二自注意力机制网络，得到服务商融合向量表示。

其中，自注意力机制网络层的的表达式如下所示：

at＝MultiHeadAttention(A)＝Concat(head₁，head₂，...，head_x)

式中，

表示多头自注意力机制的输出，即众包任务的融合向量表示，Concat表示对所有头的注意力计算结果进行拼接操作，

表示在第x个子空间进行自注意力机制计算的输出结果，

为线性转换矩阵，d_k＝d/X，X表示头的数目，d_Q表示向量Q的维度，T表示向量转置。

值得说明的，所述交互预测模型还包括输出层，利用输出层对服务商融合向量表示和任务融合向量表示进行内积，输出知识众包冷启动任务-服务商交互预测结果。

值得说明的，步骤S2中，用所述训练集训练所述交互预测模型过程中，采用成对损失函数和和Adam算法训练所述交互预测模型。

若服务商w参与了任务t，则r_tw＝1；若服务商w未参与任务t，则r_tw＝0；构建成对学习三元组<t，w，w′>，其中服务商w参与了任务t，记为正样本D，服务商w′未参与任务t，记为负样本D；知识众包任务-个性化服务商的交互关系可预测为：

at为任务加权融合表征，aw为服务商加权融合表征；采用成对损失函数和Adam算法训练模型，模型优化目标函数如下：

其中，T为训练集中的所有任务集合，D₊为任务t的所有正样本服务商集合，D_-为任务t的所有负样本服务商集合，

为预测的任务t与正样本中服务商w的交互，

为预测的任务与负样本中服务商w′的交互，σ(·)为sigmoid函数，AW为所有服务商融合表征，

N为所有服务商的数量，AT为所有知识众包冷启动任务融合表征，

M为所有任务的数量。

S3：将待预测知识众包冷启动任务显式属性输入训练好的交互预测模型，得到知识众包冷启动任务-服务商交互预测情况；通过所述知识众包冷启动任务-服务商交互预测情况，按照从大到小的排序得到排序表，为知识众包冷启动任务推荐排序表的前k个服务商，完成推荐。

实验验证:

1.获取外部数据，在实验中，本发明使用了来自知识众包平台的实际交易数据，我们筛选了参与服务商数量大于10个的知识众包交易订单记录，作为实验数据集。共包含5665 个雇主发布的6453个众包任务，3990个服务商，以及49356条交互记录，数据稀疏度为99.81％。众包任务的参与服务商数量最小值为10个，最大值为511个，平均每个任务的参与服务商数量为8个；服务商参与任务数量最小值为1个，最大值761个，平均每个服务商参与任务数量为12个，数据集统计信息如表1所示。我们按照任务发布时间，将80％的众包任务作为训练集，剩下的20％作为测试集。

表1数据集的统计信息

2.评价指标

用了四个常见的推荐系统评价指标来评价推荐方法的准确性：准确率、召回率、NDCG 和命中率。在本实施例中，我们用K＝3,5,10来计算四个指标。对于这四个评价指标，值越高，性能越好。

3.对比方法以及实现细节

对比方法：本实施例对提出的方法与以下几种方法进行对比。

(1)Rand：这是最基本的推荐方法，即随机推荐服务商；

(2)POP：基于服务商流行度(参与任务的次数)的推荐方法；

(3)PMF：一种依赖评分的概率矩阵分解算法，是著名的协同过滤模型；

(4)BTR：一种基于任务属性的成对学习方法，用于将冷启动任务推荐给服务商；本文将其改进，用于向冷启动任务推荐可雇佣服务商；

(5)TaskRec：引入服务商、任务类目和任务之间关系矩阵的改进概率矩阵分解方法，用于解决众包任务冷启动问题。

参数设置：模型默认参数设置如表2所示，我们在最佳参数设置情况下进行试验。

表2模型主要参数默认值

4.推荐性能对比

表2展示了所有模型在实验数据集上的最好推荐性能，评价指标中最好结果被加粗。从表中我们可以观察到：

随机交互预测模型(RAND)由于没有考虑知识众包冷启动任务和服务商的属性信息和历史交互情况，在所有模型中表现最差。PMF和TaskRec由于没有充分利用知识众包冷启动任务和服务商的显式属性特征，难以缓解任务冷启动和数据稀疏问题，推荐性能也较差。对比以上三个模型，流行度交互预测模型(POP)的性能较好，这可能是因为知识众包场景中部分服务商活跃度较高，拥有多种技能，参与了很多知识众包冷启动任务。BTR 由于引入了任务类目作为辅助信息，且采用了成对学习方式，能在一定程度上缓解特征稀疏问题，取得了较好的推荐效果。

根据实验结果可以看到，本发明所提推荐方法的表现效果最好，证明了本发明所提供的交互预测模型的有效性和优越性。

表2模型结果

5.自注意力机制对模型的影响

为了进一步分析自注意力机制在学习知识众包冷启动任务和服务商表征时的效果，揭示其重要性，我们在实验数据集上进行消融实验。我们将所提交互预测模型记为WorkerRec。图3显式了采用自注意力机制的模型相对于完全未采用自注意力机制的模型的改进效果。

我们介绍了变体模型，并分析其改进效果如下：

(1)WorkerRec_t：该模型去除所提模型中知识众包冷启动任务建模模块中的自注意力机制。

(2)WorkerRec_w：该模型去除所提模型中知识众包个性化服务商建模模块中的自注意力机制。

(3)WorkerRec_o：该模型去除所提模型中所有的自注意力机制。

由图3可以看出，总体而言，自注意力机制能够显著地提高WorkerRec、WorkerRec_w、 WorkerRec_t三个模型的推荐效果。其中，WorkerRec相对于其他三个模型取得了最好的推荐表现，并且WorkerRec_w和WorkerRec_t的效果也总要优于WorkerRec_o。这进一步表明了自注意力机制能有效区分序列特征的重要性，为不同特征分配差异化权重，构建知识众包冷启动任务和个性化服务商的有效准确表征。

6.参数对模型效果的影响分析：

重要参数的不同设置会对模型推荐效果产生影响，本部分在探究一个超参数的影响时，将其他超参数固定为同一个数值。

嵌入维度：图4展示了知识众包冷启动任务和服务商的嵌入维度从16变动到128推荐效果的变化，随着维度的增加，模型趋于收敛，较大的嵌入维度并不能学习到更好的知识众包冷启动任务和服务商融合表征，特别是当数据集高度稀疏时，对于所提模型，当嵌入维度为64时，模型性能最优，因此，我们将模型的嵌入维度设置为64。

自注意力机制头数：我们分别设置了{4、8、16、32}个自注意力机制头数。如图5所示，当设置自注意力机制头数为8时，模型表现出最好的性能。

相似历史任务数量：为分析相似历史任务数量对推荐效果的影响，我们设置了{2、4、 6、8、10}个相似历史任务数量来分析模型效果。如图6所示，随着相似历史任务数量增加，模型效果逐渐变优，考虑到计算成本约束，将其设置为10。

历史参与任务数量：如图7所示，当设置{2、4、6、8、10}个历史参与任务数量时，模型推荐效果逐步变优。考虑到计算成本约束，将其设置为10。

正则化参数：我们分析了正则化参数对模型推荐效果的影响，图8显式了正则化参数从1e-5变动到1e-1时的模型推荐效果。可以看出，正则化参数不应设置太大，否则会导致模型过拟合。也不能设置太小，否则不能训练出一个强大的模型。鉴于此，将其设置为1e-3。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围，其均应涵盖在本发明的权利要求和说明书的范围当中。

Claims

1.一种知识众包冷启动任务建模与推荐方法，其特征在于，包括以下步骤：

S3:将待预测知识众包冷启动任务显式属性输入训练好的交互预测模型，得到知识众包冷启动任务-服务商交互预测情况；基于所述知识众包冷启动任务-服务商交互预测情况，为知识众包冷启动任务推荐服务商，完成推荐。

2.根据权利要求1所述的一种知识众包冷启动任务建模与推荐方法，其特征在于，S2中，所述交互预测模型还包括嵌入层，利用所述嵌入层产生所述外部数据的嵌入向量序列，所述嵌入向量序列包括知识众包冷启动任务向量序列、服务商向量序列。

3.根据权利要求2所述的一种知识众包冷启动任务建模与推荐方法，其特征在于，利用所述嵌入层产生所述知识众包冷启动任务向量序列的方法为：

S23：随机初始化相似历史任务的隐式特征向量；

4.根据权利要求3所述的一种知识众包冷启动任务建模与推荐方法，其特征在于，利用所述嵌入层产生所述服务商向量序列的方法为：

S31:基于服务商显式属性，获取服务商显式属性嵌入；

S32:随机初始化服务商的隐式特征向量；

S34:随机初始化服务商历史参与任务的隐式特征向量；

5.根据权利要求4所述的一种知识众包冷启动任务建模与推荐方法，其特征在于，步骤S21中，基于知识众包冷启动任务显式属性，获取知识众包冷启动任务显式属性嵌入的方法为：

S211:对所述知识众包冷启动任务显式属性进行文本预处理；

S212:采用词向量法对预处理的所述知识众包冷启动任务显式属性进行向量化，得到知识众包冷启动任务中所有显式属性嵌入集合；

S213:将知识众包冷启动任务所述所有显式属性嵌入进行拼接，得到知识众包冷启动任务显式属性嵌入。

6.根据权利要求5所述的一种知识众包冷启动任务建模与推荐方法，其特征在于，获取所述服务商显式属性嵌入、服务商历史参与任务显式属性嵌入的方法与获取知识众包冷启动任务显式属性嵌入的方法相同。

7.根据权利要求1所述的一种知识众包冷启动任务建模与推荐方法，其特征在于，步骤S2中，所述自注意力机制网络层包括第一自注意力机制网络、第二自注意力机制网络；将知识众包冷启动任务向量序列输入第一自注意力机制网络，得到任务融合向量表示；将服务商向量序列输入第二自注意力机制网络，得到服务商融合向量表示。

8.根据权利要求1所述的一种知识众包冷启动任务建模与推荐方法，其特征在于，所述交互预测模型还包括输出层，利用输出层对服务商融合向量表示和任务融合向量表示进行内积，输出知识众包冷启动任务-服务商交互预测情况。

9.根据权利要求3所述的一种知识众包冷启动任务建模与推荐方法，其特征在于，步骤S22中，所述相似历史任务是通过知识众包冷启动任务显式属性嵌入之间的余弦相似度计算得到的。

10.根据权利要求1所述的一种知识众包冷启动任务建模与推荐方法，其特征在于，步骤S2中，用所述训练集训练所述交互预测模型过程中，采用成对损失函数和Adam算法训练所述交互预测模型。