CN116401372A

CN116401372A - 知识图谱表示学习方法、装置、电子设备及可读存储介质

Info

Publication number: CN116401372A
Application number: CN202211657135.6A
Authority: CN
Inventors: 杜晨光; 姚开春; 祝恒书; 王德庆; 秦川; 张敬帅
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2022-12-22
Filing date: 2022-12-22
Publication date: 2023-07-07

Abstract

本公开提供了知识图谱表示学习方法、装置、电子设备及可读存储介质，涉及人工智能领域，尤其涉及深度学习、知识图谱或者智能推荐领域。具体实现方案为：获取招聘知识图谱，招聘知识图谱中的节点用于表征至少两种类型的招聘相关实体，招聘知识图谱中的边用于表征招聘相关实体之间的关系，节点具有至少一种类型的属性信息，属性信息用于描述招聘相关实体；确定节点所具有的属性信息对应的属性特征；基于属性特征确定节点的初始节点特征；基于各初始节点特征进行表示学习，得到节点的目标节点特征。基于本方案学习出的目标特征中能够包含属性信息，为更好地进行智能招聘任务的分析处理提供了基础，有助于提升智能招聘任务的处理效果。

Description

知识图谱表示学习方法、装置、电子设备及可读存储介质

技术领域

本公开涉及人工智能技术领域，尤其涉及深度学习、知识图谱或者智能推荐技术领域，具体而言，本公开涉及一种知识图谱表示学习方法、装置、电子设备及可读存储介质。

背景技术

随着知识图谱技术的兴起，知识图谱越来越多的被应用于智能招聘服务中。

相关技术中，一般会构建用于智能招聘的知识图谱，对该知识图谱进行图表示学习，将图表示学习出的特征用于具体的智能招聘任务。

智能招聘相关的实体一般会具有大量的属性信息，这些属性信息对于后续的分析处理有着重要意义，因此，如何在进行图表示学习时有效提取实体的属性信息，成为了一个重要的技术问题。

发明内容

本公开为了解决上述缺陷中的至少一项，提供了一种知识图谱表示学习方法、装置、电子设备及可读存储介质。

根据本公开的第一方面，提供了一种知识图谱表示学习方法，该方法包括：

获取招聘知识图谱，招聘知识图谱中的节点用于表征至少两种类型的招聘相关实体，招聘知识图谱中的边用于表征招聘相关实体之间的关系，节点具有至少一种类型的属性信息，属性信息用于描述招聘相关实体；

确定节点所具有的属性信息对应的属性特征；

基于属性特征确定节点的初始节点特征；

基于各初始节点特征进行表示学习，得到节点的目标节点特征。

根据本公开的第二方面，提供了一种知识图谱表示学习装置，该装置包括：

知识图谱获取模块，用于获取招聘知识图谱，招聘知识图谱中的节点用于表征至少两种类型的招聘相关实体，招聘知识图谱中的边用于表征招聘相关实体之间的关系，节点具有至少一种类型的属性信息，属性信息用于描述招聘相关实体；

属性特征确定模块，用于确定节点所具有的属性信息对应的属性特征；

初始节点特征确定模块，用于基于属性特征确定节点的初始节点特征；

表示学习模块，用于基于各初始节点特征进行表示学习，得到节点的目标节点特征。

根据本公开的第三方面，提供了一种电子设备，该电子设备包括：

至少一个处理器；以及

与上述至少一个处理器通信连接的存储器；其中，

存储器存储有可被上述至少一个处理器执行的指令，指令被上述至少一个处理器执行，以使上述至少一个处理器能够执行上述知识图谱表示学习方法。

根据本公开的第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，该计算机指令用于使计算机执行上述知识图谱表示学习方法。

根据本公开的第五方面，提供了一种计算机程序产品，包括计算机程序，该计算机程序在被处理器执行时实现上述知识图谱表示学习方法。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是一种招聘异构图的示意图；

图2是本公开实施例提供的一种知识图谱表示学习方法的流程示意图；

图3是本公开实施例提供的一种招聘知识图谱的示意图；

图4是本公开实施例提供的知识图谱表示学习方法的一种具体实施方式的流程示意图；

图5是本公开实施例提供的一种知识图谱表示学习装置的结构示意图；

图6是用来实现本公开实施例的知识图谱表示学习方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

首先对本申请涉及的几个名词进行介绍和解释：

异构图(Heterogeneous Graph)，节点的类型或者边的类型不止包括一种的图。定义异构图为有向图G＝(V,E)，其中，V表示边的集合，E表示节点的集合。A和R分别表示顶点类型集合和边类型集合，且|A|+|R|＞2。

关系(Relation)：对于从源节点s链接到目标节点t的边e＝(s,t)，一个异构图可以被认为是由源节点s通过边e链接到目标节点t的三元组的集合。

关系二分图(Relational Bipartite Graph)：给定一个异构图G和一个关系r，二分图G_r被定义为一个由对应类型关系r的所有边组成的图。换句话说，G_r包含所有的三元组<s,e,t>，其中关系φ(e)＝r。

元路径(Metapath)：我们定义元路径P为以下形式的路径：

(简写为A₁A₂…A_l),其中A_i∈A,r_i∈R。元路径描述了节点类型A₁和A_l之间的复合关系，这种关系表达了一种特定的语义。

图表示学习(Graph Representation Learning)：给定一个图G＝(V,E)，图表示学习旨在学习函数G^v→R^d,d＜＜|V|，即将图中的节点映射到低维的向量空间，同时保留图的节点特征和拓扑结构信息。这些表示节点的向量可用于各种下游任务，例如节点分类、节点聚类和关系预测等。

智能招聘相关的实体一般会具有大量的属性信息，例如，求职者实体的属性信息可以包括求职者的个人相关信息等，这些属性信息对于后续的分析处理有着重要意义。因此，如何在进行图表示学习时有效提取实体的属性信息，成为了一个重要的技术问题。

相关技术中，一般会将图中的每个节点表示为单个向量，这使得每个节点所包含的多个属性信息需要被融合到单个向量中。这种融合不仅导致特征信息的丢失，而且降低了特征消息在传递过程的可解释性

另外，相关技术中也存在使用深度神经网络模型表征招聘场景中的文本信息，以解决各种智能招聘问题的方案。这种方案仅能从文本角度进行分析，而忽略了实体的属性信息以及实体之间的关系，影响预测结果的准确定，并且仅从文本角度对预测结果进行解释，而无法从更全面的角度对预测结果进行解释，导致模型的可解释性差。

作为一个示例，图1中示出了一种招聘异构图的示意图。如图1中所示，求职者-A具有教育经历-i，具有公司-a的工作经历，掌握技能1、技能3。求职者-B就职于岗位-I，掌握技能3。求职者-C具有教育经历-i，具有公司-a的工作经历，就职于岗位-I。岗位-I需要就职者掌握技能2、4。

相关技术中在对图1中的求职者-A与岗位-I进行匹配时，一般会集中关注于简历和职位描述中的文本信息，忽略了招聘场景中存在的大量实体属性信息和实体关系。例如，求职者A的简历中描述的所掌握技能与岗位-I所需求的技能之间没有出现相同的技能，相关技术中仅基于文本信息进行分析，容易得到求职者A与岗位-I不匹配的结论。但是实际上，但是由于求职者-A和求职者-C有相似的工作经历和教育经历，且求职者-A和求职者-B掌握相似的技能，由此可以推断，求职者-A和岗位-I是匹配的。

再者，相关技术中一般只关注于智能招聘中较少类型的任务，无法在一个同一框架内解决智能招聘中的多类型任务。

本公开实施例提供的知识图谱表示学习方法、装置、电子设备及可读存储介质，旨在解决现有技术的如上技术问题中的至少一个。

图2示出了本公开实施例提供的一种知识图谱表示学习方法的流程示意图，如图1中所示，该方法主要可以包括：

步骤S210：获取招聘知识图谱，招聘知识图谱中的节点用于表征至少两种类型的招聘相关实体，招聘知识图谱中的边用于表征招聘相关实体之间的关系，节点具有至少一种类型的属性信息，属性信息用于描述招聘相关实体；

步骤S220：确定节点所具有的属性信息对应的属性特征；

步骤S230：基于属性特征确定节点的初始节点特征；

步骤S240：基于各初始节点特征进行表示学习，得到节点的目标节点特征。

其中，招聘知识图谱为智能招聘场景下构建的异构图，该异构图中的节点用于表征招聘相关实体，即智能招聘场景可能出现的实体，包括但是不限于求职者、公司、岗位、技能、教育经历等类型的实体。招聘相关实体具有的属性信息可以作为招聘知识图谱中节点的属性信息。

作为一个示例，图3是本公开实施例提供的一种招聘知识图谱的示意图。

如图3中所示，求职者、公司、岗位、技能、教育(即教育结构)均为招聘相关实体，求职者与教育经历之间的边用于表征求职者曾毕业于教育机构。求职者与技能之间的边用于表征求职者掌握技能。求职者与公司之间的边用于表征求职者曾就职于公司。公司与岗位之间的边用于表征公司发布岗位。岗位与技能之间的边用于保证岗位要求技能。

图3中的求职者节点可以具有多种属性信息，例如，属性信息可以为求职者的个人相关信息等。

作为一个示例，可以预训练一个面向技能的命名实体识别模型从简历、岗位描述等文本中提取技能实体，例如“Java编程”、“数据挖掘”等。

本公开实施例中所构建的招聘知识图谱中可以包含多种类型的实体，以便于描述招聘场景中所涉及的大量信息。

本公开实施例中，通过属性特征对节点所具有的属性信息进行表征，进而基于属性特征确定节点的初始节点特征，并基于初始节点特征进行图表示学习得到目标节点特征，使得目标节点特征也能够反映节点的属性信息，将目标节点特征用于智能招聘任务的处理时，能够基于属性信息进行有效分析处理，有助于提升处理效果。

本公开实施例提供的方法，通过获取招聘知识图谱，招聘知识图谱中的节点用于表征至少两种类型的招聘相关实体，招聘知识图谱中的边用于表征招聘相关实体之间的关系，节点具有至少一种类型的属性信息，属性信息用于描述招聘相关实体；确定节点所具有的属性信息对应的属性特征；基于属性特征确定节点的初始节点特征；基于各初始节点特征进行表示学习，得到节点的目标节点特征。基于本方案学习出的目标特征中能够包含实体的属性信息，为基于目标特征中包含的属性信息进行智能招聘任务的分析处理提供了基础，有助于提升智能招聘任务的处理效果。

本公开的一种可选方式中，确定节点所具有的属性信息对应的属性特征，包括：

基于节点的原始节点特征以及属性类型特征，确定节点所具有的属性信息对应的属性特征，属性类型特征用于表征节点所具有的属性信息所属的属性类型。

本公开实施例中，原始节点特征可以为招聘知识图谱中节点进行初始化得到的。作为一个示例，对于招聘知识图谱中的求职者以及岗位节点，可以训练一个基于MacBERT的Sim-CSE模型来表征简历和职位描述中的文本信息；对于技能节点，我们训练了一个词-向量(word to vector，Word2vec)模型对其进行编码。可以采用元路径-向量(metapath2vec)模型来初始化招聘知识图谱中各个节点的结构特征。

本公开实施例中，属性类型特征可以为与属性类型相对应的变换矩阵，用于对属性类型进行表征，并将节点对应的各属性特征转换至相同空间，以便于后续的拼接处理。

作为一个示例，属性特征可以通过如下的公式一计算得到：

其中，i表示任一节点，τ(i)表示节点i所属的节点类型，f表示节点i所具有的任一种属性类型，

表示节点i在属性类型f下的属性特征。/>

表示属性类型f对应的属性类型特征，/>

表示节点i的原始节点特征，/>

表示偏置向量、

本公开的一种可选方式中，基于属性特征确定节点的初始节点特征，包括：

将节点所具有的各属性信息对应的属性特征进行拼接，得到节点的初始节点特征。

本公开实施例中，在确定出节点所具有的对应于各个属性信息的属性特征后，可以将各属性特征进行拼接，得到初始节点特征。每个节点的初始节点特征中均为由多个属性特征构成的一个向量序列，该向量序列中的每个向量既可以表示元路径信息，也可以表示节点的属性特征。由于采用的属性特征构成的向量序列来表征节点，无需将多种属性信息要融合到单个向量中，避免了因信息融合导致信息的丢失，同时也能够保留消息传递过程的可解释性。

作为一个示例，初始节点特征可以通过如下的公式二计算得到：

其中，i表示任一节点，H⁽⁰⁾[i]表示节点i的初始节点特征，||表示向量的拼接操作，

表示节点i的属性类型的总量，f表示节点i所具有的任一种属性类型，

表示节点i在属性类型f下的属性特征。

本公开实施例中，可以将初始节点特征作为表示学习时的输入，经过表示学习得到最终的目标节点特征。

作为一个示例，可以构建图表示学习模型，将初始节点特征输入图表示学习模型进行学习，得到图表示学习模型输出的目标节点特征。

在实际使用中，图表示学习模型可以由多个图表示学习层依次连接构成。将第l层图表示学习层的输出表示记为H^(l)，它也是第(l+1)层(1≤l≤L)的输入，通过叠加L个MPT层，每个目标节点t都可以接收到高阶邻居信息。

本公开的一种可选方式中，基于各初始节点特征进行表示学习，得到节点的目标节点特征，包括：

将任一类型的节点分别作为目标节点，确定指向目标节点的边；

将同一类型的边、同一类型的边对应的目标节点以及目标节点的邻居节点，确定为二分图；

基于目标节点的初始节点特征以及邻居节点的初始节点特征，确定目标节点针对于二分图的子邻居信息特征；

基于目标节点针对于各二分图的子邻居信息特征，确定目标节点的邻居信息特征；

基于邻居信息特征确定节点的目标节点特征。

本公开实施例中，可以将任一类型的节点作为目标节点，目标节点一般会连接有多种的类型的边，针对其中一种类型的边构建对应的二分图。该二分图包括同一类型的边、目标节点以及邻居节点，邻居节点为二分图中的源节点。该二分图为招聘知识图谱的子图，用于描述两种类型的节点之间的关系。

本公开实施例中，可以针对每种边类型对应的二分图提取目标节点的子邻居信息特征，子邻居信息特征用于保证对应二分图内邻居节点的关系。而后基于目标节点针对各二分图的子邻居信息特征，确定目标节点的邻居信息特征，邻居信息特征用于描述目标节点所对应的所有二分图的中节点的关系的总和。

具体而言，可以将各子邻居信息特征进行拼接，得到邻居信息特征。

本公开实施例中，基于邻居信息特征确定节点的目标节点特征，能够使得目标节点特征包含了邻居节点指向目标节点的关系信息。

本公开的一种可选方式中，基于目标节点的初始节点特征以及邻居节点的初始节点特征，确定目标节点针对于二分图的子邻居信息特征，包括：

基于目标节点的初始节点特征以及邻居节点的初始节点特征，确定邻居节点对目标节点的第一重要程度；

基于第一重要程度以及邻居节点的初始节点特征，确定目标节点针对于二分图的子邻居信息特征。

本公开实施例中，节点在不同的关系中会扮演不同的角色，因此可以分别计算各邻居节点对目标节点的第一重要程度，从而基于第一重要程度以及邻居节点的初始节点特征，确定目标节点针对于二分图的子邻居信息特征。

本公开的一种可选方式中，基于目标节点的初始节点特征以及邻居节点的初始节点特征，确定邻居节点对目标节点的第一重要程度，包括：

基于目标节点的初始节点特征对邻居节点的初始节点特征进行第一注意力处理；

将第一注意力处理对应的第一注意力权重确定为邻居节点对目标节点的第一重要程度。

本公开实施例中，可以基于目标节点的初始节点特征对邻居节点的初始节点特征进行第一注意力处理，将第一注意力权重作为邻居节点对目标节点的第一重要程度。

具体而言，可以由目标节点的初始节点特征进行线性变换得到第一查询特征，由邻居节点的初始节点特征进行线性变换得到第一键值特征以及第一内容特征。基于第一查询向量与第一键值向量确定第一注意力权重，并基于第一注意力权重对确定第一内容特征进行加权，得到子邻居信息特征。

本公开的一种可选方式中，在基于目标节点针对于各二分图的子邻居信息特征，确定目标节点的邻居信息特征之前，上述方法还包括：

将目标节点针对于各二分图的子邻居信息特征与相对应边的边类型特征融合。

本公开实施例中，在根据子邻居信息特征拼接得到邻居信息特征之前，可以将子邻居信息特征与相对应边的边类型特征融合，进行融合处理后的子邻居信息特征能够包含边类型信息，便于后续用于对预测结果的解释。

具体而言，可以针对各边类型分别提供边类型特征，边类型特征为一可学习特征，将其与子邻居信息特征进行相加操作，实现对边类型特征与子邻居信息特征的融合。

本公开的一种可选方式中，基于邻居信息特征确定节点的目标节点特征，包括：

基于目标节点的邻居信息特征以及目标节点的初始节点特征，确定待融合特征；

基于目标节点的初始节点特征对待融合特征进行融合处理，得到目标节点特征。

本公开实施例中，在确定出目标节点的邻居信息特征之后，可以对将目标节点的邻居信息特征以及目标节点的初始节点特征进行拼接，得到待融合特征，该待融合特征即为由初始节点特征更新后得到的节点表征。由于待融合特征是基于初始节点特征拼接得到的，其与初始节点特征在空间上更为接近。

待融合特征是由多个向量拼接组成的，而行智能招聘任务的处理中通常只支持用一个向量表征一个节点的输入形式，因此，可以通过初始节点特征指导待融合特征进行融合处理，得到目标节点特征。

本公开的一种可选方式中，基于目标节点的初始节点特征对待融合特征进行融合处理，得到目标节点特征，包括：

基于目标节点的初始节点特征以及目标节点的待融合特征，确定待融合特征对目标节点的第二重要程度；

基于第二重要程度以及目标节点的初始节点特征，确定节点的目标节点特征。

本公开实施例中，在对待融合特征进行融合处理时，可以确定各二分图中的关系对目标节点的第二重要程度，从而基于第二重要程度以及目标节点的初始节点特征，确定节点的目标节点特征。

本公开的一种可选方式中，基于目标节点的初始节点特征以及目标节点的待融合特征，确定待融合特征对目标节点的第二重要程度，包括：

基于目标节点的初始节点特征对目标节点的待融合特征进行第二注意力处理；

将第二注意力处理对应的第二注意力权重确定为待融合特征对目标节点的第二重要程度。

本公开实施例中，可以基于目标节点的初始节点特征对目标节点的待融合特征进行第二注意力处理，将第二注意力权重作为待融合特征对目标节点的第二重要程度。

具体而言，可以由目标节点的初始节点特征进行线性变换得到第二查询特征，由目标节点的待融合特征进行线性变换得到第二键值特征以及第二内容特征。基于第二查询向量与第二键值向量确定第二注意力权重，并通过第二注意力权重对确定第二内容特征进行加权，得到目标节点特征。

本公开实施例中，通过对节点的属性信息以及邻居节点信息的有效学习，使得学习得到的目标节点特征能够更好的用于招聘任务处理。另外，本方案中还可以将第一重要程度以及第二重要程度进行输出，以实现对招聘异构图中不同路径重要性的评估。

本公开的一种可选方式中，在得到节点的目标节点特征之后，上述方法还包括：

基于目标节点特征进行招聘任务的处理，招聘任务包括以下任一项：

节点分类任务；

节点间关系预测任务。

本公开实施例中，可以基于目标节点特征实现节点分类、节点间关系预测等类型的招聘任务。节点间关系预测任务，即对节点之间链接的预测任务。

对于节点分类任务，可以将目标节点特征输入到单个全连接神经网络层，然后通过最小化交叉熵损失进行优化。

作为一个示例，节点分类任务的损失函数可以通过如下的公式三表示。

其中，

表示节点分类任务的损失，N表示有标签的节点集合，C表示所有节点类别的集合，c表示任一节点类别，y_i,c和/>

分别表示节点i对于类别c的真实标签和模型的预测结果。模型的预测结果可以通过对目标节点特征进行线性变化得到。

对于节点间关系预测任务，可以将目标节点特征进行节点类型感知的线性变换，然后通过计算点积来估计节点之间存在链接的概率。

将目标节点特征进行节点类型感知的线性变换可以通过如下的公式四表示。

其中，V表示节点类型的集合，i表示任一节点类型，H[i]表示节点类型i对应的目标节点特征，L-Linear_τ(i)，表示对节点类型i对应的目标节点特征进行线性变换，

表示线性变化后的目标节点特征。

可以通过如下的公式五计算节点之间存在链接的概率。

其中，

表示线性变换后的节点类型i对应的目标节点特征，/>

表示线性变换后的节点类型j对应的目标节点特征,p_i,j节点类型i的节点与节点类型j的节点存在关系的概率。

在此基础上，可以通过最小化三元组排序损失来优化模型参数，

作为一个示例，节点间关系预测任务的损失函数可以通过如下的公式六表示。

其中，max()表示取最大值函数，u、v表示存在真实关系的两个节点，u′、v′表示存在不真实关系的两个节点，Ω_P和Ω_N分别表示真实关系和不真实关系集合，

表示节点之间存在关系的概率。

作为一个示例，节点分类任务可以包括但是不限于岗位分类、简历分配任务。节点间关系预测任务可以包括但是不限于岗位推荐、简历筛选以及技能推荐。

岗位分类任务是招聘场景中必不可少的一项任务，它不仅可以帮助企业准确发布招聘广告，吸引合格的人才，还可以帮助在线招聘网站实现职业要求的自动化归档。本方案中可以将岗位分类任务转化为招聘异构图中对岗位节点的分类任务。给定图中一个岗位节点，预测其所属行业类别。

简历分配任务多用于将大量建立分配至企业内部的不同部门，本方案中的简历分配任务可以视为招聘异构图中对简历节点的分类任务。给定招聘异构图中一个简历节点，基于本方案可以将其分配到最合适的部门。

岗位推荐任务可以帮助求职者在大量的招聘信息中找到合适的职位。可以该任务看作是异构图中对“简历-岗位”边的链接预测任务。在这个任务中，所有求职者的求职记录都被认为是正样本。负样本可以为随机生成的不存在链接。给定招聘异构图中一个简历节点，基于本方案可以为其推荐适合的职位。

简历筛选任务可以帮助公司从已经投递简历的候选人中挑选出最合适的人才。可以将简历筛选任务视为招聘异构图中对“岗位-简历”边的链接预测任务。其中，成功入职的求职记录被视为正样本，其他被淘汰的求职记录被视为负样本。给定一对简历和候选者节点，简历筛选任务可以对可能被录用的简历进行预测。

技能推荐任务可以帮助求职者提高自身竞争力以找出理想工作和自己之间的差距。可将技能推荐任务视为招聘异构图中对“岗位-技能”边的链接预测任务。基于本方案能够预测每个职位所需的技能。

作为一个示例，图4是本公开实施提供的一种知识图谱表示学习方法的具体实施方式的流程示意图。

如图4中所示，t表示目标节点，s₁、s₂表示不同类型的邻居节点。为便于表述，在之后的描述中将s₁与s₂共同记做s。元路径Transformer(Meta-Path Transformer，MPT)层，即上述的图表示学习层。本方案中可以根据需要设置多个依次连接的MPT层，图4中以第l层为例进行解释说明，第l-1层为第l层的前一层，第l-1层的输出作为第l层的输入。

该流程包括：

(1)基于序列的节点表征

给定节点i，设计与属性类型相关的变换矩阵W^τ(i)。用于将各个节点i的特征xⁱ转换到相同的空间。

接着，拼接

个转换后的表征，从而得到节点i的基于序列的表征H⁽⁰⁾[i]。在消息传递过程中，MPT模型一直将每个节点表示为一个向量序列。序列中的每个向量既可以表示元路径信息，也可以表示节点的特定特征属性。

(2)邻居重要性评估

通过如下的公式七、八将目标节点t和它的邻居(源节点s)的表征分别投射为多个查询向量和关键向量：

其中，

和/>

为线性变换；Q^(l)[t]和K^(l)[t]的维度分别为

为/>

和/>

分别为t和s在(l-1)层的表征序列长度。

将源节点s对目标节点t的第一注意力权重视为s对t的重要性。分别在每个关系二分图中计算邻居的第一关注权重。把二分图G_r中由目标节点t连接的源节点集合表示为N_r(t)，其中r∈R。第一注意力权重可以通过如下的公式九计算。

其中，

源节点s对目标节点t在关系r上的重要性估计，/>

是为关系r设计的转换矩阵

不同于已有的基于注意力的图表征学习方法,第一注意力权重

是一个形状为/>

矩阵而不是一个标量。/>

中的每个元素都代表s的表征序列中的一个项对t的表征序列中的一个项的注意权重。

(3)消息生成

提取源节点的信息，而后根据邻居节点的重要性为目标节点生成邻居信息。与邻居重要性评估模块类似，可以在每个关系二分图G_r上分别提取源节点s的特征(即第一内容特征)，第一内容特征可以通过如下的公式十计算。

其中，ext_r[s]是在关系r下从源节点s抽取到的消息(即第一内容特征),

是为节点类型τ(s)设计的线性转换，/>

是为关系r设计的转换矩阵。

最终，我们可以获得节点t在关系r下的邻居信息(即子邻居信息特征)，子邻居信息特征可以通过如下的公式十一计算。

其中

表示子邻居信息特征，是一个与节点表征H^(l-1)[t]长度相同的序列。N_r(t)为目标节点t在二分图G_r中的邻居节点(源节点)集合。

(4)节点表征更新

在邻居信息生成后，目标节点t可以接收到来自多个关系r∈R的邻居信息消息

基于接收到的邻居信息消息和目标节点t的上层表征H^(l-1)[t]，通过如下步骤更新目标节点t的表征。

首先，将来自不同关系的邻居消息与相应关系类型的关系类型特征拼接处理，该拼接处理的方式可以通过如下的公式十二表示。

其中，

是关系r的关系类型特征，它是一个用于区分不同关系类型的可学习向量；/>

表示相加操作，/>

表示拼接处理后的子邻居信息特征。

将多个子邻居信息特征拼接为邻居信息特征可以通过如下的公式十三计算得到。

其中，R(t)是目标节点类型为τ(t)的关系集合，

表示邻居信息特征。

而后，将目标节点t在上一层的表征(即第l-1层)和编码后的消息拼接以得到目标节点t的新表征(即待融合表征)，待融合表征可以通过如下的公式十四计算得到。

其中，H^(l)[t]是目标节点t更新后的表征(即待融合表征)；

是为节点类型τ(t)设计的线性变化操作。

(5)异构消息融合

经过L层MPT层的计算后，每个目标节点t被表征为一个长度为

的序列(即待融合表征)。由于下游任务通常只支持用一个向量表征一个节点的输入形式，因此，可以利用注意力机制将目标节点t的序列表征融合为一个向量。在表征融合过程中，第二注意力权重可以估计不同消息传递路径的重要性。

将目标节点t的(即待融合表征)融合为目标节点特征的具体方式可以通过如下的公式十五、十六、十七、十八、十九表示

Q^fus[t]＝mean(H⁽⁰⁾[t]W^FQ)……公式十五；

K^fus[t]＝H^(L)[t]W^FK……公式十六；

V^fus[t]＝H^(L)[t]W^FV……公式十七；

H[t]＝A^fus[t]V^fus[t],……公式十九；

其中，mean( )表示求平均值函数，H⁽⁰⁾表示初始节点特征。H[t]是目标节点t融合后的表征；W^FQ，W^FK和W^FV均为维度为d×d的可学习矩阵；Q^fus[t]由目标节点t的原始表征生成；A^fus[t]是序列表征中的每一项对目标节点t的重要性估计,它也代表不同传播路径的权重。

基于与图1中所示的方法相同的原理，图5示出了本公开实施例提供的一种知识图谱表示学习装置的结构示意图，如图5所示，该知识图谱表示学习装置50可以包括：

知识图谱获取模块510，用于获取招聘知识图谱，招聘知识图谱中的节点用于表征至少两种类型的招聘相关实体，招聘知识图谱中的边用于表征招聘相关实体之间的关系，节点具有至少一种类型的属性信息，属性信息用于描述招聘相关实体；

属性特征确定模块520，用于确定节点所具有的属性信息对应的属性特征；

初始节点特征确定模块530，用于基于属性特征确定节点的初始节点特征；

表示学习模块540，用于基于各初始节点特征进行表示学习，得到节点的目标节点特征。

本公开实施例提供的装置，通过获取招聘知识图谱，招聘知识图谱中的节点用于表征至少两种类型的招聘相关实体，招聘知识图谱中的边用于表征招聘相关实体之间的关系，节点具有至少一种类型的属性信息，属性信息用于描述招聘相关实体；确定节点所具有的属性信息对应的属性特征；基于属性特征确定节点的初始节点特征；基于各初始节点特征进行表示学习，得到节点的目标节点特征。基于本方案学习出的目标特征中能够包含实体的属性信息，为基于目标特征中包含的属性信息进行智能招聘任务的分析处理提供了基础，有助于提升智能招聘任务的处理效果。

可选地，属性特征确定模块具体用于：

可选地，属性特征确定模块在基于属性特征确定节点的初始节点特征时，具体用于：

可选地，表示学习模块具体用于：

基于邻居信息特征确定节点的目标节点特征。

可选地，表示学习模块在基于目标节点的初始节点特征以及邻居节点的初始节点特征，确定目标节点针对于二分图的子邻居信息特征时，具体用于：

可选地，表示学习模块在基于目标节点的初始节点特征以及邻居节点的初始节点特征，确定邻居节点对目标节点的第一重要程度时，具体用于：

可选地，上述装置还包括：

边类型融合模块，用于在在基于目标节点针对于各二分图的子邻居信息特征，确定目标节点的邻居信息特征之前，将目标节点针对于各二分图的子邻居信息特征与相对应边的边类型特征融合。

可选地，表示学习模块在于邻居信息特征确定节点的目标节点特征时，具体用于：

可选地，表示学习模块在基于目标节点的初始节点特征对待融合特征进行融合处理，得到目标节点特征时，具体用于：

可选地，表示学习模块在基于目标节点的初始节点特征以及目标节点的待融合特征，确定待融合特征对目标节点的第二重要程度，具体用于：

可选地，上述装置还包括：

招聘任务处理模，用于在在得到节点的目标节点特征之后，基于目标节点特征进行招聘任务的处理，招聘任务包括以下任一项：

节点分类任务；

节点间关系预测任务。

可以理解的是，本公开实施例中的知识图谱表示学习装置的上述各模块具有实现图2中所示的实施例中的知识图谱表示学习方法相应步骤的功能。该功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的模块。上述模块可以是软件和/或硬件，上述各模块可以单独实现，也可以多个模块集成实现。对于上述知识图谱表示学习装置的各模块的功能描述具体可以参见图2中所示实施例中的知识图谱表示学习方法的对应描述，在此不再赘述。

本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

该电子设备包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行如本公开实施例提供的知识图谱表示学习方法。

该电子设备与现有技术相比，通过获取招聘知识图谱，招聘知识图谱中的节点用于表征至少两种类型的招聘相关实体，招聘知识图谱中的边用于表征招聘相关实体之间的关系，节点具有至少一种类型的属性信息，属性信息用于描述招聘相关实体；确定节点所具有的属性信息对应的属性特征；基于属性特征确定节点的初始节点特征；基于各初始节点特征进行表示学习，得到节点的目标节点特征。基于本方案学习出的目标特征中能够包含实体的属性信息，为基于目标特征中包含的属性信息进行智能招聘任务的分析处理提供了基础，有助于提升智能招聘任务的处理效果。

该可读存储介质为存储有计算机指令的非瞬时计算机可读存储介质，其中，计算机指令用于使计算机执行如本公开实施例提供的知识图谱表示学习方法。

该可读存储介质与现有技术相比，通过获取招聘知识图谱，招聘知识图谱中的节点用于表征至少两种类型的招聘相关实体，招聘知识图谱中的边用于表征招聘相关实体之间的关系，节点具有至少一种类型的属性信息，属性信息用于描述招聘相关实体；确定节点所具有的属性信息对应的属性特征；基于属性特征确定节点的初始节点特征；基于各初始节点特征进行表示学习，得到节点的目标节点特征。基于本方案学习出的目标特征中能够包含实体的属性信息，为基于目标特征中包含的属性信息进行智能招聘任务的分析处理提供了基础，有助于提升智能招聘任务的处理效果。

该计算机程序产品，包括计算机程序，计算机程序在被处理器执行时实现如本公开实施例提供的知识图谱表示学习方法。

该计算机程序产品与现有技术相比，通过获取招聘知识图谱，招聘知识图谱中的节点用于表征至少两种类型的招聘相关实体，招聘知识图谱中的边用于表征招聘相关实体之间的关系，节点具有至少一种类型的属性信息，属性信息用于描述招聘相关实体；确定节点所具有的属性信息对应的属性特征；基于属性特征确定节点的初始节点特征；基于各初始节点特征进行表示学习，得到节点的目标节点特征。基于本方案学习出的目标特征中能够包含实体的属性信息，为基于目标特征中包含的属性信息进行智能招聘任务的分析处理提供了基础，有助于提升智能招聘任务的处理效果。

图6示出了可以用来实施本公开的实施例的示例电子设备60的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图6所示，电子设备60包括计算单元610，其可以根据存储在只读存储器(ROM)620中的计算机程序或者从存储单元680加载到随机访问存储器(RAM)630中的计算机程序，来执行各种适当的动作和处理。在RAM630中，还可存储设备60操作所需的各种程序和数据。计算单元610、ROM620以及RAM 630通过总线640彼此相连。输入/输出(I/O)接口650也连接至总线640。

设备60中的多个部件连接至I/O接口650，包括：输入单元660，例如键盘、鼠标等；输出单元670，例如各种类型的显示器、扬声器等；存储单元680，例如磁盘、光盘等；以及通信单元690，例如网卡、调制解调器、无线通信收发机等。通信单元690允许设备60通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元610可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元610的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元610执行本公开实施例中所提供的知识图谱表示学习方法。例如，在一些实施例中，执行本公开实施例中所提供的知识图谱表示学习方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元680。在一些实施例中，计算机程序的部分或者全部可以经由ROM 620和/或通信单元690而被载入和/或安装到设备60上。当计算机程序加载到RAM 630并由计算单元610执行时，可以执行本公开实施例中所提供的知识图谱表示学习方法的一个或多个步骤。备选地，在其他实施例中，计算单元610可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行本公开实施例中所提供的知识图谱表示学习方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种知识图谱表示学习方法，包括：

获取招聘知识图谱，所述招聘知识图谱中的节点用于表征至少两种类型的招聘相关实体，所述招聘知识图谱中的边用于表征所述招聘相关实体之间的关系，所述节点具有至少一种类型的属性信息，所述属性信息用于描述所述招聘相关实体；

确定所述节点所具有的属性信息对应的属性特征；

基于所述属性特征确定所述节点的初始节点特征；

基于各所述初始节点特征进行表示学习，得到所述节点的目标节点特征。

2.根据权利要求1所述的方法，其中，所述确定所述节点所具有的属性信息对应的属性特征，包括：

基于所述节点的原始节点特征以及属性类型特征，确定所述节点所具有的属性信息对应的属性特征，所述属性类型特征用于表征所述节点所具有的属性信息所属的属性类型。

3.根据权利要求1或2所述的方法，其中，所述基于所述属性特征确定所述节点的初始节点特征，包括：

将所述节点所具有的各属性信息对应的属性特征进行拼接，得到所述节点的初始节点特征。

4.根据权利要求1-3中任一项所述的方法，其中，所述基于各所述初始节点特征进行表示学习，得到所述节点的目标节点特征，包括：

将任一类型的所述节点分别作为目标节点，确定指向所述目标节点的边；

将同一类型的边、所述同一类型的边对应的所述目标节点以及所述目标节点的邻居节点，确定为二分图；

基于所述目标节点的初始节点特征以及所述邻居节点的初始节点特征，确定所述目标节点针对于所述二分图的子邻居信息特征；

基于所述目标节点针对于各所述二分图的子邻居信息特征，确定所述目标节点的邻居信息特征；

基于所述邻居信息特征确定所述节点的目标节点特征。

5.根据权利要求4所述的方法，其中，所述基于所述目标节点的初始节点特征以及所述邻居节点的初始节点特征，确定所述目标节点针对于所述二分图的子邻居信息特征，包括：

基于所述目标节点的初始节点特征以及所述邻居节点的初始节点特征，确定所述邻居节点对所述目标节点的第一重要程度；

基于所述第一重要程度以及所述邻居节点的初始节点特征，确定目标节点针对于二分图的子邻居信息特征。

6.根据权利要求5所述的方法，其中，所述基于所述目标节点的初始节点特征以及所述邻居节点的初始节点特征，确定所述邻居节点对所述目标节点的第一重要程度，包括：

基于所述目标节点的初始节点特征对所述邻居节点的初始节点特征进行第一注意力处理；

将所述第一注意力处理对应的第一注意力权重确定为所述邻居节点对所述目标节点的第一重要程度。

7.根据权利要求4-6中任一项所述的方法，其中，在基于所述目标节点针对于各所述二分图的子邻居信息特征，确定所述目标节点的邻居信息特征之前，所述方法还包括：

将所述目标节点针对于各所述二分图的子邻居信息特征与相对应边的边类型特征融合。

8.根据权利要求4-7中任一项所述的方法，其中，所述基于所述邻居信息特征确定所述节点的目标节点特征，包括：

基于目标节点的所述邻居信息特征以及所述目标节点的初始节点特征，确定待融合特征；

基于所述目标节点的初始节点特征对所述待融合特征进行融合处理，得到目标节点特征。

9.根据权利要求8所述的方法，其中，所述基于所述目标节点的初始节点特征对所述待融合特征进行融合处理，得到目标节点特征，包括：

基于所述目标节点的初始节点特征以及所述目标节点的待融合特征，确定所述待融合特征对所述目标节点的第二重要程度；

基于所述第二重要程度以及所述目标节点的初始节点特征，确定所述节点的目标节点特征。

10.根据权利要求9所述的方法，其中，所述基于所述目标节点的初始节点特征以及所述目标节点的待融合特征，确定所述待融合特征对所述目标节点的第二重要程度，包括：

基于目标节点的初始节点特征对所述目标节点的待融合特征进行第二注意力处理；

将所述第二注意力处理对应的第二注意力权重确定为所述待融合特征对所述目标节点的第二重要程度。

11.根据权利要求1-10中任一项所述的方法，其中，在所述得到所述节点的目标节点特征之后，所述方法还包括：

基于所述目标节点特征进行招聘任务的处理，所述招聘任务包括以下任一项：

节点分类任务；

节点间关系预测任务。

12.一种知识图谱表示学习装置，包括：

知识图谱获取模块，用于获取招聘知识图谱，所述招聘知识图谱中的节点用于表征至少两种类型的招聘相关实体，所述招聘知识图谱中的边用于表征所述招聘相关实体之间的关系，所述节点具有至少一种类型的属性信息，所述属性信息用于描述所述招聘相关实体；

属性特征确定模块，用于确定所述节点所具有的属性信息对应的属性特征；

初始节点特征确定模块，用于基于所述属性特征确定所述节点的初始节点特征；

表示学习模块，用于基于各所述初始节点特征进行表示学习，得到所述节点的目标节点特征。

13.根据权利要求12所述的装置，其中，所述属性特征确定模块具体用于：

14.根据权利要求13所述的装置，其中，所述属性特征确定模块在基于所述属性特征确定所述节点的初始节点特征时，具体用于：

15.根据权利要求12-14中任一项所述的装置，其中，所述表示学习模块具体用于：

基于所述邻居信息特征确定所述节点的目标节点特征。

16.根据权利要求15所述的装置，其中，所述表示学习模块在基于所述目标节点的初始节点特征以及所述邻居节点的初始节点特征，确定所述目标节点针对于所述二分图的子邻居信息特征时，具体用于：

17.根据权利要求16所述的装置，其中，所述表示学习模块在基于所述目标节点的初始节点特征以及所述邻居节点的初始节点特征，确定所述邻居节点对所述目标节点的第一重要程度时，具体用于：

18.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-11中任一项所述的方法。

19.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-11中任一项所述的方法。

20.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-11中任一项所述的方法。