CN114004667A - 一种知识众包冷启动任务建模与推荐方法 - Google Patents
一种知识众包冷启动任务建模与推荐方法 Download PDFInfo
- Publication number
- CN114004667A CN114004667A CN202111094657.5A CN202111094657A CN114004667A CN 114004667 A CN114004667 A CN 114004667A CN 202111094657 A CN202111094657 A CN 202111094657A CN 114004667 A CN114004667 A CN 114004667A
- Authority
- CN
- China
- Prior art keywords
- crowdsourcing
- knowledge
- cold start
- task
- service provider
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 239000013598 vector Substances 0.000 claims abstract description 67
- 230000007246 mechanism Effects 0.000 claims abstract description 38
- 230000002452 interceptive effect Effects 0.000 claims abstract description 34
- 230000003993 interaction Effects 0.000 claims abstract description 25
- 230000004927 fusion Effects 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 19
- 238000012360 testing method Methods 0.000 claims abstract description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000012512 characterization method Methods 0.000 abstract description 5
- 230000008878 coupling Effects 0.000 abstract description 4
- 238000010168 coupling process Methods 0.000 abstract description 4
- 238000005859 coupling reaction Methods 0.000 abstract description 4
- 230000008901 benefit Effects 0.000 abstract description 2
- 230000000694 effects Effects 0.000 description 17
- 239000011159 matrix material Substances 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000001976 improved effect Effects 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 4
- 238000000354 decomposition reaction Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000002679 ablation Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012358 sourcing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0605—Supply or demand aggregation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Molecular Biology (AREA)
- General Business, Economics & Management (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Strategic Management (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种知识众包冷启动任务建模与推荐方法,涉及知识众包冷启动任务推荐技术领域,包括以下步骤:S1:获取外部数据,构建训练集和测试集;S2:构建交互预测模型,所述交互预测模型包括自注意力机制网络层;S3:将待预测知识众包冷启动任务显式属性输入训练好的交互预测模型。本发明引入冷启动任务、相似历史任务、服务商和历史参与任务的显式属性;采用自注意力机制分别捕捉知识众包冷启动任务及其相似历史任务特征、服务商及其参与历史任务特征之间的耦合关系,分配注意力权重,能有效准确地学习知识众包冷启动任务和服务商融合向量表征,为知识众包解决任务冷启动、缓解信息过载、实现任务‑服务商有效匹配提供了一个新思路。
Description
技术领域
本发明涉及众包推荐技术领域,具体涉及一种知识众包冷启动任务建模与推荐方法。
背景技术
知识众包是以平台为媒介、以服务商专业知识和技能解决雇主商业发展及创新性问题的一种新型知识经济模式。随着互联网和零工经济的兴起,越来越多的组织和个人选择加入知识众包平台。然而,由于任务多样性、服务商个性化和平台网络外部性等,知识众包平台信息过载问题日益突出,雇主与服务商之间越发难以实现有效匹配,一方面,雇主很难雇佣到合适的服务商来完成知识众包任务;另一方面,服务商也很难找到合适的知识众包任务来获取收益。推荐系统是解决信息过载问题,帮助用户快速、准确定位感兴趣内容的有效工具。因此设计知识众包推荐系统有助于服务商和服务商的有效智能匹配,从而缓解信息过载问题,提高平台运作效率和用户满意度。
知识众包场景存在固有的任务冷启动、数据稀疏性和服务商个性化的特点。知识众包任务在发布到平台时,未与任何服务商产生交互,为完全冷启动任务。由于知识众包任务的短生命周期性和不可重复推荐性,导致了知识众包任务和服务商交互矩阵中只有很少部分的非0元素,很难用于交互预测模型计算。并且,知识众包场景中缺乏评分、评价等显式反馈信息,只存在服务商对知识众包任务的浏览、点击、收藏、投标、中标等隐式反馈,这也导致了数据稀疏性。此外,服务商的知识、技能、经验等的异质性导致了其知识众包任务参与偏好的个性化。数据稀疏性和服务商个性化是研究者们在设计知识众包推荐方法时必须考虑的因素。而知识众包任务冷启动是数据稀疏性的极端表现,知识众包任务冷启动场景下的知识众包推荐方法设计更具挑战性。
现有方法的限制:现有研究较少考虑知识众包任务冷启动场景下的知识众包推荐。部分学者通过引入知识众包任务类目这一属性,作为服务商和服务商之间的链接桥梁,并采用概率矩阵分解方法来对知识众包任务-服务商交互矩阵中的缺失值进行预测,一定程度解决了知识众包任务冷启动问题。然而,当矩阵中的交互数据较少时,模型的推荐效果并不好;且当平台引入新的知识众包任务类目时,此类方法无法对属于新知识众包任务类目的服务商进行推荐。此外,还有部分学者基于服务商的显式属性和服务商的历史参与知识众包任务之间的相似度,来进行推荐,服务商历史参与知识众包任务信息的引入能一定程度缓解数据稀疏性问题。然而,现实场景中可能存在知识众包任务属性缺失等问题;且由于知识众包任务的属性多由自然语言来描述,有可能存在描述不准确的情况,据此计算的相似度也有可能不准确。此外,服务商的历史参与知识众包任务对其个性化行为的刻画重要程度并不相同,而此类方法没有考虑这一点。
发明内容
针对现有技术中的缺陷,本发明提供一种知识众包冷启动任务建模与推荐方法,包括以下步骤:
S1:获取外部数据,构建训练集和测试集,其中,所述外部数据包括知识众包冷启动任务-服务商交互记录、知识众包冷启动任务显式属性和服务商显式属性,执行步骤S2;
S2:构建交互预测模型,其中,所述交互预测模型包括自注意力机制网络层,用所述训练集训练所述交互预测模型,用所述测试集测试所述交互预测模型;执行步骤S3;
S3:将待预测知识众包冷启动任务显式属性输入训练好的交互预测模型,得到知识众包冷启动任务-服务商交互预测情况;通过所述知识众包冷启动任务-服务商交互预测情况,为知识众包冷启动任务推荐服务商,完成推荐。
优选的,步骤S2中,所述交互预测模型还包括嵌入层,利用所述嵌入层产生所述外部数据的嵌入向量序列,所述嵌入向量序列包括知识众包冷启动任务向量序列、服务商向量序列。
优选的,利用所述嵌入层产生所述知识众包冷启动任务向量序列的方法为:
S21:基于知识众包冷启动任务显式属性,获取知识众包冷启动任务显式属性嵌入;
S22:基于知识众包冷启动任务显式属性嵌入,通过相似度计算获取相似历史任务及其显式属性嵌入;
S23:随机初始化相似历史任务的隐式特征向量;
S24:将所述知识众包冷启动任务显式属性嵌入、相似历史任务显式属性嵌入、相似历史任务的隐式特征向量进行拼接,得到知识众包冷启动任务向量序列。
优选的,利用所述嵌入层产生所述服务商向量序列的方法为:
S31:基于服务商显式属性,获取服务商显式属性嵌入;
S32:随机初始化服务商的隐式特征向量;
S33:基于所述知识众包冷启动任务-服务商交互记录,获取服务商历史参与任务显式属性嵌入;
S34:随机初始化服务商历史参与任务的隐式特征向量;
S35:将所述服务商显式属性嵌入、服务商的隐式特征向量、服务商历史参与任务显式属性嵌入、服务商历史参与任务的隐式特征向量进行拼接,得到服务商向量序列。
优选的,步骤S21中,基于知识众包冷启动任务显式属性,获取知识众包冷启动任务显式属性嵌入的方法为:
S211:对所述知识众包冷启动任务显式属性进行文本预处理;
S212:采用词向量法对预处理的所述知识众包冷启动任务显式属性进行向量化,得到知识众包冷启动任务所有显式属性嵌入集合;
S213:将知识众包冷启动任务所述所有显式属性嵌入进行拼接,得到知识众包显式冷启动任务属性嵌入。
优选的,获取所述服务商显式属性嵌入、服务商历史参与任务显式属性嵌入的方法与获取知识众包冷启动任务显式属性嵌入的方法相同。
优选的,步骤S2中,所述自注意力机制网络层包括第一自注意力机制网络、第二自注意力机制网络;将知识众包冷启动任务向量序列输入第一自注意力机制网络,得到任务融合向量表示;将服务商向量序列输入第二自注意力机制网络,得到服务商融合向量表示。
优选的,所述交互预测模型还包括输出层,利用输出层对服务商融合向量表示和任务融合向量表示进行内积,输出知识众包冷启动任务-服务商交互预测情况。
优选的,步骤S22中,所述相似历史任务是通过知识众包冷启动任务显式属性嵌入之间的余弦相似度计算得到的。
优选的,步骤S2中,用所述训练集训练所述交互预测模型过程中,采用成对损失函数和Adam算法训练所述交互预测模型。
本发明的有益效果体现在:本发明综合考虑了知识众包任务冷启动、数据高度稀疏性和服务商个性化的特点,引入了知识众包冷启动任务、相似历史任务、服务商和历史参与任务的显式属性;采用自注意力机制分别捕捉知识众包冷启动任务及其相似历史任务特征、服务商及其参与历史任务特征之间的耦合关系,分配注意力权重,能有效准确地学习知识众包冷启动任务和服务商表征,提升了交互预测模型性能,为知识众包解决任务冷启动、缓解信息过载、实现任务-服务商有效匹配提供了一个新思路。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
图1是本发明的流程图;
图2是本发明的模型结构图;
图3是自注意力机制网络层对模型效果改进图;
图4是嵌入维度的影响图;
图5是自注意力机制头数的影响图;
图6是相似历史任务数量的影响图;
图7是历史参与任务数量的影响图;
图8是正则化参数的影响图。
具体实施方式
下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。
需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。
实施例
如图1所示,一种知识众包冷启动任务建模与推荐方法,包括以下步骤:
S1:获取外部数据,构建训练集和测试集,其中,所述外部数据包括知识众包冷启动任务-服务商交互记录、知识众包冷启动任务显式属性和服务商显式属性,执行步骤S2;
值得说明的,设置有数据库,所示数据库中保存有知识众包冷启动任务信息、雇主信息、历史知识众包冷启动任务信息、任务-服务商交互记录、服务商信息,通过这些信息得到外部数据,其中,所述知识众包冷启动任务显式属性包括知识众包冷启动任务本身的显式属性以及雇主的显式属性,如任务标题、任务描述、任务类型、所述任务类目、雇主类型、地域等;所述服务商显式属性包括自我介绍、偏好任务类型、偏好任务类目等;所述相似历史任务是通过知识众包冷启动任务显式属性嵌入之间的余弦相似度计算得到的。
S2:构建交互预测模型,其中,所述交互预测模型包括自注意力机制网络层,用所述训练集训练所述交互预测模型,用所述测试集测试所述交互预测模型;执行步骤S3;
值得说明的,所述交互预测模型还包括嵌入层,利用所述嵌入层产生所述外部数据的嵌入向量序列,所述嵌入向量序列包括知识众包冷启动任务向量序列、服务商向量序列。
值得说明的,利用所述嵌入层产生所述知识众包冷启动任务向量序列的方法为:
S21:基于知识众包冷启动任务显式属性,获取知识众包冷启动任务显式属性嵌入;
S22:基于知识众包冷启动任务显式属性嵌入,通过相似度计算相似历史任务及其显示属性嵌入;
S23:随机初始化相似历史任务的隐式特征向量;
S24:将所述知识众包冷启动任务显式属性嵌入、相似历史任务显式属性嵌入、相似历史任务的隐式特征向量进行拼接,得到知识众包冷启动任务向量序列。
值得说明的,所述相似历史任务是通过知识众包冷启动任务显式属性嵌入之间的余玄相似度计算得到的,从相似度的前k个历史知识众包冷启动任务作为相似历史任务显式属性嵌入。
值得说明的,利用所述嵌入层产生所述服务商向量序列的方法为:
S31:基于服务商显式属性,获取服务商显式属性嵌入;
S32:随机初始化服务商的隐式特征向量;
S33:基于所述服务商历史参与任务显式属性,获取服务商历史参与任务显式属性嵌入;
S34:随机初始化服务商历史参与任务的隐式特征向量;
S35:将所述服务商显式属性嵌入、服务商的隐式特征向量、服务商历史参与任务显式属性嵌入、服务商历史参与任务的隐式特征向量进行拼接,得到服务商向量序列。
值得说明的,步骤S21中,基于知识众包冷启动任务显式属性,获取知识众包冷启动任务显式属性嵌入的方法为:
S211:对所述知识众包冷启动任务显式属性进行文本预处理;
S212:采用词向量法对预处理的所述知识众包冷启动任务显式属性进行向量化,得到知识众包冷启动任务所有显式属性嵌入集合;
S213:将知识众包冷启动任务中所述所有显式属性嵌入进行拼接,得到知识众包冷启动任务显式属性嵌入。
值得说明的,获取所述服务商显式属性嵌入、服务商历史参与任务显式属性嵌入的方法与获取知识众包冷启动任务显式属性嵌入的方法相同。
值得说明的,所述自注意力机制网络层包括第一自注意力机制网络、第二自注意力机制网络;将知识众包冷启动任务向量序列输入第一自注意力机制网络,得到任务融合向量表示;将服务商向量序列输入第二自注意力机制网络,得到服务商融合向量表示。
其中,自注意力机制网络层的的表达式如下所示:
at=MultiHeadAttention(A)=Concat(head1,head2,...,headx)
式中,表示多头自注意力机制的输出,即众包任务的融合向量表示,Concat表示对所有头的注意力计算结果进行拼接操作,表示在第x个子空间进行自注意力机制计算的输出结果,为线性转换矩阵,dk=d/X,X表示头的数目,dQ表示向量Q的维度,T表示向量转置。
值得说明的,所述交互预测模型还包括输出层,利用输出层对服务商融合向量表示和任务融合向量表示进行内积,输出知识众包冷启动任务-服务商交互预测结果。
值得说明的,步骤S2中,用所述训练集训练所述交互预测模型过程中,采用成对损失函数和和Adam算法训练所述交互预测模型。
若服务商w参与了任务t,则rtw=1;若服务商w未参与任务t,则rtw=0;构建成对学习三元组<t,w,w′>,其中服务商w参与了任务t,记为正样本D,服务商w′未参与任务t,记为负样本D;知识众包任务-个性化服务商的交互关系可预测为:at为任务加权融合表征,aw为服务商加权融合表征;采用成对损失函数和Adam算法训练模型,模型优化目标函数如下:
其中,T为训练集中的所有任务集合,D+为任务t的所有正样本服务商集合,D-为任务t的所有负样本服务商集合,为预测的任务t与正样本中服务商w的交互,为预测的任务与负样本中服务商w′的交互,σ(·)为sigmoid函数,AW为所有服务商融合表征,N为所有服务商的数量,AT为所有知识众包冷启动任务融合表征, M为所有任务的数量。
S3:将待预测知识众包冷启动任务显式属性输入训练好的交互预测模型,得到知识众包冷启动任务-服务商交互预测情况;通过所述知识众包冷启动任务-服务商交互预测情况,按照从大到小的排序得到排序表,为知识众包冷启动任务推荐排序表的前k个服务商,完成推荐。
实验验证:
1.获取外部数据,在实验中,本发明使用了来自知识众包平台的实际交易数据,我们筛选了参与服务商数量大于10个的知识众包交易订单记录,作为实验数据集。共包含5665 个雇主发布的6453个众包任务,3990个服务商,以及49356条交互记录,数据稀疏度为99.81%。众包任务的参与服务商数量最小值为10个,最大值为511个,平均每个任务的参与服务商数量为8个;服务商参与任务数量最小值为1个,最大值761个,平均每个服务商参与任务数量为12个,数据集统计信息如表1所示。我们按照任务发布时间,将80%的众包任务作为训练集,剩下的20%作为测试集。
表1数据集的统计信息
2.评价指标
用了四个常见的推荐系统评价指标来评价推荐方法的准确性:准确率、召回率、NDCG 和命中率。在本实施例中,我们用K=3,5,10来计算四个指标。对于这四个评价指标,值越高,性能越好。
3.对比方法以及实现细节
对比方法:本实施例对提出的方法与以下几种方法进行对比。
(1)Rand:这是最基本的推荐方法,即随机推荐服务商;
(2)POP:基于服务商流行度(参与任务的次数)的推荐方法;
(3)PMF:一种依赖评分的概率矩阵分解算法,是著名的协同过滤模型;
(4)BTR:一种基于任务属性的成对学习方法,用于将冷启动任务推荐给服务商;本文将其改进,用于向冷启动任务推荐可雇佣服务商;
(5)TaskRec:引入服务商、任务类目和任务之间关系矩阵的改进概率矩阵分解方法,用于解决众包任务冷启动问题。
参数设置:模型默认参数设置如表2所示,我们在最佳参数设置情况下进行试验。
表2模型主要参数默认值
4.推荐性能对比
表2展示了所有模型在实验数据集上的最好推荐性能,评价指标中最好结果被加粗。从表中我们可以观察到:
随机交互预测模型(RAND)由于没有考虑知识众包冷启动任务和服务商的属性信息和历史交互情况,在所有模型中表现最差。PMF和TaskRec由于没有充分利用知识众包冷启动任务和服务商的显式属性特征,难以缓解任务冷启动和数据稀疏问题,推荐性能也较差。对比以上三个模型,流行度交互预测模型(POP)的性能较好,这可能是因为知识众包场景中部分服务商活跃度较高,拥有多种技能,参与了很多知识众包冷启动任务。BTR 由于引入了任务类目作为辅助信息,且采用了成对学习方式,能在一定程度上缓解特征稀疏问题,取得了较好的推荐效果。
根据实验结果可以看到,本发明所提推荐方法的表现效果最好,证明了本发明所提供的交互预测模型的有效性和优越性。
表2模型结果
5.自注意力机制对模型的影响
为了进一步分析自注意力机制在学习知识众包冷启动任务和服务商表征时的效果,揭示其重要性,我们在实验数据集上进行消融实验。我们将所提交互预测模型记为WorkerRec。图3显式了采用自注意力机制的模型相对于完全未采用自注意力机制的模型的改进效果。
我们介绍了变体模型,并分析其改进效果如下:
(1)WorkerRec_t:该模型去除所提模型中知识众包冷启动任务建模模块中的自注意力机制。
(2)WorkerRec_w:该模型去除所提模型中知识众包个性化服务商建模模块中的自注意力机制。
(3)WorkerRec_o:该模型去除所提模型中所有的自注意力机制。
由图3可以看出,总体而言,自注意力机制能够显著地提高WorkerRec、WorkerRec_w、 WorkerRec_t三个模型的推荐效果。其中,WorkerRec相对于其他三个模型取得了最好的推荐表现,并且WorkerRec_w和WorkerRec_t的效果也总要优于WorkerRec_o。这进一步表明了自注意力机制能有效区分序列特征的重要性,为不同特征分配差异化权重,构建知识众包冷启动任务和个性化服务商的有效准确表征。
6.参数对模型效果的影响分析:
重要参数的不同设置会对模型推荐效果产生影响,本部分在探究一个超参数的影响时,将其他超参数固定为同一个数值。
嵌入维度:图4展示了知识众包冷启动任务和服务商的嵌入维度从16变动到128推荐效果的变化,随着维度的增加,模型趋于收敛,较大的嵌入维度并不能学习到更好的知识众包冷启动任务和服务商融合表征,特别是当数据集高度稀疏时,对于所提模型,当嵌入维度为64时,模型性能最优,因此,我们将模型的嵌入维度设置为64。
自注意力机制头数:我们分别设置了{4、8、16、32}个自注意力机制头数。如图5所示,当设置自注意力机制头数为8时,模型表现出最好的性能。
相似历史任务数量:为分析相似历史任务数量对推荐效果的影响,我们设置了{2、4、 6、8、10}个相似历史任务数量来分析模型效果。如图6所示,随着相似历史任务数量增加,模型效果逐渐变优,考虑到计算成本约束,将其设置为10。
历史参与任务数量:如图7所示,当设置{2、4、6、8、10}个历史参与任务数量时,模型推荐效果逐步变优。考虑到计算成本约束,将其设置为10。
正则化参数:我们分析了正则化参数对模型推荐效果的影响,图8显式了正则化参数从1e-5变动到1e-1时的模型推荐效果。可以看出,正则化参数不应设置太大,否则会导致模型过拟合。也不能设置太小,否则不能训练出一个强大的模型。鉴于此,将其设置为1e-3。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。
Claims (10)
1.一种知识众包冷启动任务建模与推荐方法,其特征在于,包括以下步骤:
S1:获取外部数据,构建训练集和测试集,其中,所述外部数据包括知识众包冷启动任务-服务商交互记录、知识众包冷启动任务显式属性和服务商显式属性,执行步骤S2;
S2:构建交互预测模型,其中,所述交互预测模型包括自注意力机制网络层,用所述训练集训练所述交互预测模型,用所述测试集测试所述交互预测模型;执行步骤S3;
S3:将待预测知识众包冷启动任务显式属性输入训练好的交互预测模型,得到知识众包冷启动任务-服务商交互预测情况;基于所述知识众包冷启动任务-服务商交互预测情况,为知识众包冷启动任务推荐服务商,完成推荐。
2.根据权利要求1所述的一种知识众包冷启动任务建模与推荐方法,其特征在于,S2中,所述交互预测模型还包括嵌入层,利用所述嵌入层产生所述外部数据的嵌入向量序列,所述嵌入向量序列包括知识众包冷启动任务向量序列、服务商向量序列。
3.根据权利要求2所述的一种知识众包冷启动任务建模与推荐方法,其特征在于,利用所述嵌入层产生所述知识众包冷启动任务向量序列的方法为:
S21:基于知识众包冷启动任务显式属性,获取知识众包冷启动任务显式属性嵌入;
S22:基于知识众包冷启动任务显式属性嵌入,通过相似度计算获取相似历史任务及其显式属性嵌入;
S23:随机初始化相似历史任务的隐式特征向量;
S24:将所述知识众包冷启动任务显式属性嵌入、相似历史任务显式属性嵌入、相似历史任务的隐式特征向量进行拼接,得到知识众包冷启动任务向量序列。
4.根据权利要求3所述的一种知识众包冷启动任务建模与推荐方法,其特征在于,利用所述嵌入层产生所述服务商向量序列的方法为:
S31:基于服务商显式属性,获取服务商显式属性嵌入;
S32:随机初始化服务商的隐式特征向量;
S33:基于所述知识众包冷启动任务-服务商交互记录,获取服务商历史参与任务显式属性嵌入;
S34:随机初始化服务商历史参与任务的隐式特征向量;
S35:将所述服务商显式属性嵌入、服务商的隐式特征向量、服务商历史参与任务显式属性嵌入、服务商历史参与任务的隐式特征向量进行拼接,得到服务商向量序列。
5.根据权利要求4所述的一种知识众包冷启动任务建模与推荐方法,其特征在于,步骤S21中,基于知识众包冷启动任务显式属性,获取知识众包冷启动任务显式属性嵌入的方法为:
S211:对所述知识众包冷启动任务显式属性进行文本预处理;
S212:采用词向量法对预处理的所述知识众包冷启动任务显式属性进行向量化,得到知识众包冷启动任务中所有显式属性嵌入集合;
S213:将知识众包冷启动任务所述所有显式属性嵌入进行拼接,得到知识众包冷启动任务显式属性嵌入。
6.根据权利要求5所述的一种知识众包冷启动任务建模与推荐方法,其特征在于,获取所述服务商显式属性嵌入、服务商历史参与任务显式属性嵌入的方法与获取知识众包冷启动任务显式属性嵌入的方法相同。
7.根据权利要求1所述的一种知识众包冷启动任务建模与推荐方法,其特征在于,步骤S2中,所述自注意力机制网络层包括第一自注意力机制网络、第二自注意力机制网络;将知识众包冷启动任务向量序列输入第一自注意力机制网络,得到任务融合向量表示;将服务商向量序列输入第二自注意力机制网络,得到服务商融合向量表示。
8.根据权利要求1所述的一种知识众包冷启动任务建模与推荐方法,其特征在于,所述交互预测模型还包括输出层,利用输出层对服务商融合向量表示和任务融合向量表示进行内积,输出知识众包冷启动任务-服务商交互预测情况。
9.根据权利要求3所述的一种知识众包冷启动任务建模与推荐方法,其特征在于,步骤S22中,所述相似历史任务是通过知识众包冷启动任务显式属性嵌入之间的余弦相似度计算得到的。
10.根据权利要求1所述的一种知识众包冷启动任务建模与推荐方法,其特征在于,步骤S2中,用所述训练集训练所述交互预测模型过程中,采用成对损失函数和Adam算法训练所述交互预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111094657.5A CN114004667B (zh) | 2021-09-17 | 2021-09-17 | 一种知识众包冷启动任务建模与推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111094657.5A CN114004667B (zh) | 2021-09-17 | 2021-09-17 | 一种知识众包冷启动任务建模与推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114004667A true CN114004667A (zh) | 2022-02-01 |
CN114004667B CN114004667B (zh) | 2024-05-14 |
Family
ID=79921449
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111094657.5A Active CN114004667B (zh) | 2021-09-17 | 2021-09-17 | 一种知识众包冷启动任务建模与推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114004667B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114925165A (zh) * | 2022-05-06 | 2022-08-19 | 重庆大学 | 一种咨询任务分解方法、系统及平台 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110033127A (zh) * | 2019-03-14 | 2019-07-19 | 中国人民解放军国防科技大学 | 一种基于嵌入式特征选择的冷启动项目推荐方法 |
US20190325293A1 (en) * | 2018-04-19 | 2019-10-24 | National University Of Singapore | Tree enhanced embedding model predictive analysis methods and systems |
CN112035745A (zh) * | 2020-09-01 | 2020-12-04 | 重庆大学 | 一种基于对抗学习与双向长短期记忆网络的推荐算法 |
CN112084428A (zh) * | 2020-09-17 | 2020-12-15 | 辽宁工程技术大学 | 一种基于耦合网络嵌入及知识图谱的协同过滤推荐方法 |
CN112417313A (zh) * | 2020-11-24 | 2021-02-26 | 云南大学 | 一种基于知识图卷积网络的模型混合推荐方法 |
CN113361928A (zh) * | 2021-06-07 | 2021-09-07 | 南京大学 | 一种基于异构图注意力网络的众包任务推荐方法 |
US20210286708A1 (en) * | 2020-03-16 | 2021-09-16 | Institute Of Software, Chinese Academy Of Sciences | Method and electronic device for recommending crowdsourced tester and crowdsourced testing |
-
2021
- 2021-09-17 CN CN202111094657.5A patent/CN114004667B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190325293A1 (en) * | 2018-04-19 | 2019-10-24 | National University Of Singapore | Tree enhanced embedding model predictive analysis methods and systems |
CN110033127A (zh) * | 2019-03-14 | 2019-07-19 | 中国人民解放军国防科技大学 | 一种基于嵌入式特征选择的冷启动项目推荐方法 |
US20210286708A1 (en) * | 2020-03-16 | 2021-09-16 | Institute Of Software, Chinese Academy Of Sciences | Method and electronic device for recommending crowdsourced tester and crowdsourced testing |
CN112035745A (zh) * | 2020-09-01 | 2020-12-04 | 重庆大学 | 一种基于对抗学习与双向长短期记忆网络的推荐算法 |
CN112084428A (zh) * | 2020-09-17 | 2020-12-15 | 辽宁工程技术大学 | 一种基于耦合网络嵌入及知识图谱的协同过滤推荐方法 |
CN112417313A (zh) * | 2020-11-24 | 2021-02-26 | 云南大学 | 一种基于知识图卷积网络的模型混合推荐方法 |
CN113361928A (zh) * | 2021-06-07 | 2021-09-07 | 南京大学 | 一种基于异构图注意力网络的众包任务推荐方法 |
Non-Patent Citations (3)
Title |
---|
BIYU YANG: "Joint modelling of task requirements and worker preferences based on heterogeneous features and multiple interactions for knowledge-intensive crowdsourcing recommendation", 《INTERNATIONAL JOURNAL OF BIO-INSPIRED COMPUTATION》, vol. 22, no. 2, 22 November 2023 (2023-11-22), pages 1 - 5 * |
杨宝生: "基于注意力机制增强图卷积神经网络的个性化新闻推荐", 兰州文理学院学报(自然科学版), vol. 34, no. 05, 10 September 2020 (2020-09-10), pages 52 - 57 * |
赵祺雯: "基于注意力机制的众包任务推荐算法", 现代计算机, no. 03, 25 January 2020 (2020-01-25), pages 12 - 15 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114925165A (zh) * | 2022-05-06 | 2022-08-19 | 重庆大学 | 一种咨询任务分解方法、系统及平台 |
Also Published As
Publication number | Publication date |
---|---|
CN114004667B (zh) | 2024-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Huang et al. | Consumer preference elicitation of complex products using fuzzy support vector machine active learning | |
US11636411B2 (en) | Apparatus for determining role fitness while eliminating unwanted bias | |
Cheng et al. | Long-term effect estimation with surrogate representation | |
Zhang et al. | Few-shot link prediction for temporal knowledge graphs based on time-aware translation and attention mechanism | |
Raykar et al. | A fast algorithm for learning a ranking function from large-scale data sets | |
CN117668205B (zh) | 智慧物流客服处理方法、系统、设备及存储介质 | |
Huang et al. | Towards robust knowledge tracing models via k-sparse attention | |
Kanchinadam et al. | Graph neural networks to predict customer satisfaction following interactions with a corporate call center | |
Xu et al. | Netrl: Task-aware network denoising via deep reinforcement learning | |
Meduri et al. | Efficient RAG Framework for Large-Scale Knowledge Bases | |
CN114004667A (zh) | 一种知识众包冷启动任务建模与推荐方法 | |
Salehi et al. | Attribute-based collaborative filtering using genetic algorithm and weighted c-means algorithm | |
CN113256404A (zh) | 数据处理方法及装置 | |
Wotaifi et al. | Modified random forest based graduates earning of higher education mining | |
Kuznietsova et al. | Business intelligence techniques for missing data imputation | |
Ansary | Machine Learning for Predicting the Stock Price Direction with Trading Indicators | |
Liu et al. | A comparison of machine learning algorithms for prediction of past due service in commercial credit | |
Keskin et al. | A deep neural network model for stock investment recommendation by considering the stock market as a time graph | |
CN115309975B (zh) | 基于交互特征的产品推荐方法及系统 | |
Petchhan et al. | Toward Project Success Forecasting in Reward-based Crowdfunding through Wide-and-Deep Computational Learning | |
Chakraborty et al. | FairMixRep: Self-supervised Robust Representation Learning for Heterogeneous Data with Fairness constraints | |
CN117196550B (zh) | 一种人才与企业供需匹配的方法及系统 | |
He et al. | Using Cognitive Interest Graph and Knowledge-activated Attention for Learning Resource Recommendation | |
Hort | Investigating trade-offs for fair machine learning systems | |
Mamgai et al. | Stock prediction & recommendation system using KNN and linear regression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |