CN113869516B - 知识图谱嵌入模型训练方法、装置、电子设备及介质 - Google Patents

知识图谱嵌入模型训练方法、装置、电子设备及介质 Download PDF

Info

Publication number
CN113869516B
CN113869516B CN202111472336.4A CN202111472336A CN113869516B CN 113869516 B CN113869516 B CN 113869516B CN 202111472336 A CN202111472336 A CN 202111472336A CN 113869516 B CN113869516 B CN 113869516B
Authority
CN
China
Prior art keywords
node
vector
current node
nodes
association
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111472336.4A
Other languages
English (en)
Other versions
CN113869516A (zh
Inventor
吴定明
周钰棋
陆克中
詹金颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen University
Original Assignee
Shenzhen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen University filed Critical Shenzhen University
Priority to CN202111472336.4A priority Critical patent/CN113869516B/zh
Publication of CN113869516A publication Critical patent/CN113869516A/zh
Application granted granted Critical
Publication of CN113869516B publication Critical patent/CN113869516B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种知识图谱嵌入表示模型训练方法。该方法包括:获取知识图谱中当前节点的邻接节点,根据当前节点和邻接节点的初始向量表示,确定当前节点和邻接节点之间的第一关联向量;通过聚合函数将所述第一关联向量进行聚合,得到当前节点与所有邻接节点之间的第一关联聚合结果,并将所述第一关联聚合结果作为当前节点的更新向量表示;将所述更新向量表示输入知识图谱嵌入表示模型中,得到各节点的嵌入表示。以上技术方案中从多维度选择节点的邻接节点,并将节点与其邻接节点之间的关联信息进行聚合作为节点的向量表示,使模型在训练时可以学习到更丰富的信息,从而使得到的节点的嵌入式表示具有更优的空间和文本辨别能力。

Description

知识图谱嵌入模型训练方法、装置、电子设备及介质
技术领域
本申请实施例涉及知识图谱嵌入技术领域,尤其涉及一种知识图谱嵌入表示模型训练方法、装置、电子设备及介质。
背景技术
所谓知识图谱(Knowledge Graph,KG),即揭示实体之间关系的语义网络,它利用图结构形式化的描述并存储现实世界复杂的事物及其相互关系。目前,许多大型知识图谱都采用(头实体,关系,尾实体)形式的三元组来描述事物和关系。虽然这种表示方式可以有效地表示结构化数据,而且易于人们理解,但是,随着知识图谱规模的不断扩大,三元组的符号性却使得直接操作知识图谱变得困难。为了能高效地操作和使用知识图谱,研究人员尝试将实体和关系表示为低维连续向量,从而方便计算机理解和计算。
为了得到表达能力更强的嵌入表示,研究人员将知识图谱中的附加信息加入实体的嵌入式表示中。但现有技术依然存在一个不足:目前得到的实体嵌入表示无法同时保留实体的空间信息和文本信息,也就意味着,人们无法利用这些嵌入表示来同时从空间和文本的角度区分不同的实体。
发明内容
本申请实施例提供一种知识图谱嵌入表示模型训练方法、装置、电子设备及介质,可以使模型生成的嵌入表示能同时从空间和文本的角度将知识图谱中不同的实体区分开来。
在一个实施例中,本申请实施例提供了一种知识图谱嵌入表示模型训练方法,所述方法包括:
获取知识图谱中当前节点的邻接节点,根据当前节点和邻接节点的初始向量表示,确定当前节点和邻接节点之间的第一关联向量;其中,所述节点用于表征知识图谱中的实体;
通过聚合函数将所述第一关联向量进行聚合,得到当前节点与所有邻接节点之间的第一关联聚合结果,并将所述第一关联聚合结果作为当前节点的更新向量表示;
将所述更新向量表示输入知识图谱嵌入表示模型中,得到各节点的嵌入表示。
在一个实施例中,本申请实施例提供了一种知识图谱嵌入表示模型训练装置,其特征在于,该装置包括:
第一关联向量确定装置,用于获取知识图谱中当前节点的邻接节点,根据当前节点和邻接节点的初始向量表示,确定当前节点和邻接节点之间的第一关联向量;其中,所述节点用于表征知识图谱中的实体;
第一聚合结果确定模块,用于通过聚合函数将所述第一关联向量进行聚合,得到当前节点与所有邻接节点之间的第一关联聚合结果,并将所述第一关联聚合结果作为当前节点的更新向量表示;
第一模型训练模块,用于将所述更新向量表示输入知识图谱嵌入表示模型中,得到各节点的嵌入表示。
在一个实施例中,本申请实施例提供了一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,所述一个或多个处理器实现如本申请任一实施例所述的知识图谱嵌入表示模型训练方法。
在一个实施例中,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本申请任一实施例所述的知识图谱嵌入表示模型训练方法。
本申请实施例通过以下方法得到了节点的嵌入式表示:获取知识图谱中当前节点的邻接节点,根据当前节点和邻接节点的初始向量表示,确定当前节点和邻接节点之间的第一关联向量;其中,所述节点用于表征知识图谱中的实体; 通过聚合函数将所述第一关联向量进行聚合,得到当前节点与所有邻接节点之间的第一关联聚合结果,并将所述第一关联聚合结果作为当前节点的更新向量表示;将所述更新向量表示输入知识图谱嵌入表示模型中,得到各节点的嵌入表示。以上技术方案中从多维度选择节点的邻接节点,并将节点与其邻接节点之间的关联信息进行聚合作为节点的向量表示,使模型在训练时可以学习到更丰富的信息,从而使得到的节点的嵌入式表示具有更优的空间和文本辨别能力,从而更准确的从空间和文本的角度将不同实体区分开来。
附图说明
图1是本申请实施例提供的实体空间位置示意图;
图2是本申请实施例提供的实体向量表示示意图;
图3是本申请一种实施例提供的知识图谱嵌入表示模型训练方法流程图;
图4是本申请另一种实施例提供的知识图谱嵌入表示模型训练方法流程图;
图5是本申请又一种实施例提供的知识图谱嵌入表示模型训练方法流程图;
图6是本申请一种实施例提供的知识图谱嵌入表示模型训练装置结构框图;
图7是本申请一种实施例提供的电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本申请在实施例中作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。
在描述实施例之前,先对现有技术的缺陷进行说明。以图1和图2为例。图1是本申请实施例提供的实体空间位置示意图。如图1所示,图1中圆圈和方框所示的四个实体的空间相对位置是摘取自DBpedia数据集的实体在地图中的位置。其中实体p1, p2, p3均为学校,属于同类实体,实体 p4则为车站。
图2是本申请实施例提供的实体向量表示示意图。从图2可以看出,p1和p4的向量表示是通过多个方框表示,p2和p3的向量表示是通过多个圆圈表示的,而实际上p1, p2,p3为同一类实体,p4为另一类实体,所以可以看出现有技术得到的向量表示不能有效划分不同类别的实体。正是因为有些实体(如p3和p4)地理(空间)相距较近但文本差异大,有些实体(如p1和p3)文本相似但在地理(空间)上相距相远,想要准确的区分这些实体,就必须要求实体嵌入表示具备空间-文本感知能力。所以本申请实施例提供了一种知识图谱嵌入表示模型用于解决上述问题。
图3是本申请一种实施例提供的知识图谱嵌入表示模型训练方法流程图,本实施例可适用于根据实体的嵌入表示将地理位置相距较远、文本描述不相关的实体区分开,尤其是具备空间坐标的实体。该方法可以由本申请实施例所提供的知识图谱嵌入表示模型训练装置执行,该装置可以由软件和/或硬件的方式来实现,并可集成于电子设备中。
如图3所示,本申请实施例中提供的知识图谱嵌入表示模型训练方法可包括以下步骤:
S310、获取知识图谱中当前节点的邻接节点,根据当前节点和邻接节点的初始向量表示,确定当前节点和邻接节点之间的第一关联向量;其中,所述节点用于表征知识图谱中的实体。
在知识图谱中通常通过节点表征实体,节点与节点之间的连线表征实体与实体之间的关系。所以本申请实施例中用节点来表示知识图谱中的实体。
知识图谱中有多个节点,当前节点可以是从多个节点中随机选出的一个节点,所有节点都遍历一遍。
本申请实施例中,当前节点的邻接节点,可以是知识图谱结构中与当前节点直接相连的邻接节点,也可以是在空间地理位置上与当前节点距离最近的预设数量的邻接节点,也可以是二者的组合。
其中,在空间地理位置上与当前节点距离最近的邻接节点的预设数量可以根据实际需求人为设定,也可以根据算法计算得到。在一个具体的例子中,可以根据当前节点与其他节点的坐标信息,计算当前节点与其他节点之间的欧式距离,设置一个距离阈值,将与当前节点的欧式距离小于距离阈值的其他节点作为当前节点在空间地理位置上的邻接节点。除此之外,还可以根据K-Means算法,按照节点之间的距离大小,将所有节点自动划分为K个簇,使簇内的节点尽量紧密的连在一起,而簇间的距离尽量的大,以此得到当前节点在空间地理位置上的预设数量的邻接节点。需要说明的是,每个节点在知识图谱结构中直接相连的邻接节点,以及在空间地理位置上预设数量的邻接节点的数量可能不相同。
进一步的,节点的初始向量表示是指没有对节点的向量表示进行更新之前,节点的原始向量表示。本申请实施例中可以通过如下方法计算节点的初始向量表示:首先使用Word2Vec模型对节点文本信息的关键字进行编码,得到节点的文本向量。对有坐标的节点使用Space2Vec模型来获得节点的空间向量,若节点没有坐标,则将其空间向量构建为全零向量。然后将节点的文本向量和空间向量进行拼接,拼接后的向量即为该节点的初始向量表示。
本申请实施例将节点的空间信息和文本信息纳入节点的向量表示中,使模型通过学习各个节点的向量表示得到的各个节点的嵌入表示具有更优的空间和文本辨别能力,从而更准确的从空间和文本的角度将不同实体区分开来。
当前节点和邻接节点之间的第一关联向量,是指可以表示当前节点和其邻接节点之间关联信息的向量,其中关联信息包含了当前节点和其邻接节点之间的相对地理位置关系信息以及语义关联性信息。第一关联向量可以根据当前节点和邻接节点的初始向量表示,以及当前节点和邻接节点之间的空间距离和文本相似度运算得到。
S320、通过聚合函数将所述第一关联向量进行聚合,得到当前节点与所有邻接节点之间的第一关联聚合结果,并将所述第一关联聚合结果作为当前节点的更新向量表示。
其中,聚合函数可以根据需求定义。第一关联聚合结果中包含当前节点与其所有邻接节点的关联信息。更新向量表示,是指用第一关联聚合结果替换当前节点的初始向量表示后,当前节点的当前向量表示。节点的更新向量表示中包含了该节点与所有邻接节点的关联信息。
本申请实施例通过用第一关联聚合结果替换当前节点的初始向量表示,将当前节点与其所有邻接节点之间关联信息传递给当前节点,使后续的模型训练中,模型通过学习各个节点的向量表示从而得到的各个节点的嵌入表示具有更优的空间和文本辨别能力,可以更准确的从空间和文本的角度将不同实体区分开来。
本申请实施例中,可以根据如下聚合函数计算当前节点与所有邻接节点之间的第一关联聚合结果:
Figure 916654DEST_PATH_IMAGE001
其中,
Figure 635211DEST_PATH_IMAGE002
表示当前节点与所有邻接节点之间的第一关联聚合结果,
Figure 823747DEST_PATH_IMAGE003
表示按 维度取最大元素操作,
Figure 602347DEST_PATH_IMAGE004
是一个非线性激活函数,
Figure 141913DEST_PATH_IMAGE005
是一个可训练的权重矩阵,
Figure 929741DEST_PATH_IMAGE006
表示当 前节点u和其邻接节点v之间的第一关联向量。
S330、将所述更新向量表示输入知识图谱嵌入表示模型中,得到各节点的嵌入表示。
对知识图谱中的所有节点更新向量表示后,将所有更新向量表示输入嵌入表示模型中,通过随机梯度下降法最小化损失函数调整参数,最后得到节点最优的嵌入式表示。
本申请实施例中可以将空间-文本感知的图神经网络(Spatial-Textual-awareGraph Neural Networks,ST-GNNs)作为嵌入表示模型进行训练。
本申请实施例中,所述根据当前节点和邻接节点的初始向量表示,确定当前节点和邻接节点之间的第一关联向量,包括:
将当前节点和邻接节点的初始向量表示进行拼接,得到第一拼接向量;
根据当前节点和邻接节点之间的空间邻近度和文本相似度,确定当前节点和邻接节点之间的关联信息;
将所述关联信息与所述第一拼接向量相乘,得到当前节点和邻接节点之间的第一关联向量。
可以理解的,当前节点和邻接节点的第一拼接向量是根据当前节点和邻接节点的初始向量表示进行拼接得到的。在一个具体的例子中,若当前节点的初始向量为(1,1),其邻接节点的初始向量为(2,2),则将(1,1)和(2,2)进行拼接,得到向量(1,1,2,2),则(1,1,2,2)即为当前节点和其邻接节点的第一拼接向量。
当前节点和邻接节点之间的空间邻近度表示当前节点和其邻接节点之间的距离的远近,当前节点和邻接节点之间的文本相似度表示当前节点和其邻接节点之间的语义是否相近,当前节点和邻接节点之间的关联信息包含了当前节点和其邻接节点之间的相对地理位置关系信息以及语义关联性信息。
当前节点和邻接节点之间的空间邻近度可以通过如下公式计算得到:
Figure 238362DEST_PATH_IMAGE007
其中
Figure 187864DEST_PATH_IMAGE008
表示当前节点
Figure 949146DEST_PATH_IMAGE009
和其邻接节点
Figure 9506DEST_PATH_IMAGE010
之间归一化后的欧式距离,取值范围为
Figure 172634DEST_PATH_IMAGE011
。如果节点
Figure 558616DEST_PATH_IMAGE009
Figure 807195DEST_PATH_IMAGE010
在空间上距离很近,比如空间距离小于
Figure 671246DEST_PATH_IMAGE012
(本申请实施例中将
Figure 954460DEST_PATH_IMAGE012
设置 为0.1),那么它们之间的空间邻近度就会比较大。若空间距离大于
Figure 386709DEST_PATH_IMAGE012
,则将它们之间的空间 邻近度设置为一个较小的值,比如
Figure 122584DEST_PATH_IMAGE013
。若节点
Figure 790326DEST_PATH_IMAGE009
Figure 928046DEST_PATH_IMAGE010
中至少存在一个节点没有空间坐 标,那么它们之间的空间邻近度也为
Figure 593514DEST_PATH_IMAGE014
当前节点和邻接节点之间的文本相似度可以通过如下公式计算得到:
Figure 816685DEST_PATH_IMAGE015
其中
Figure 22538DEST_PATH_IMAGE016
是节点
Figure 14765DEST_PATH_IMAGE009
Figure 913451DEST_PATH_IMAGE010
的文本向量的余弦相似度。
当前节点和邻接节点之间的关联信息可以通过如下公式计算得到:
Figure 623918DEST_PATH_IMAGE017
其中,
Figure 367883DEST_PATH_IMAGE018
为当前节点和邻接节点之间的空间邻近度,
Figure 745774DEST_PATH_IMAGE019
为当前节点和邻 接节点之间的文本相似度。
则当前节点和邻接节点之间的第一关联向量可以通过如下公式计算得到:
Figure 549782DEST_PATH_IMAGE020
其中,
Figure 685229DEST_PATH_IMAGE021
为当前节点和邻接节点之间的关联信息,
Figure 232885DEST_PATH_IMAGE022
为当前节点 和邻接节点的第一拼接向量。
本申请实施例通过以下方法得到了节点的嵌入式表示:获取知识图谱中当前节点的邻接节点,根据当前节点和邻接节点的初始向量表示,确定当前节点和邻接节点之间的第一关联向量;其中,所述节点用于表征知识图谱中的实体; 通过聚合函数将所述第一关联向量进行聚合,得到当前节点与所有邻接节点之间的第一关联聚合结果,并将所述第一关联聚合结果作为当前节点的更新向量表示;将所述更新向量表示输入知识图谱嵌入表示模型中,得到各节点的嵌入表示。以上技术方案中从多维度选择节点的邻接节点,并将节点与其邻接节点之间的关联信息进行聚合作为节点的向量表示,使模型在训练时可以学习到更丰富的信息,从而使得到的节点的嵌入式表示具有更优的空间和文本辨别能力,从而更准确的从空间和文本的角度将不同节点区分开来。
图4是本申请另一种实施例提供的知识图谱嵌入表示模型训练方法流程图,本实施例以上述实施例为基础进行优化,具体优化如下:
S410、获取知识图谱中当前节点的邻接节点,根据当前节点和邻接节点的初始向量表示,确定当前节点和邻接节点之间的第一关联向量;其中,所述节点用于表征知识图谱中的实体。
S420、通过聚合函数将所述第一关联向量进行聚合,得到当前节点与所有邻接节点之间的第一关联聚合结果,并将所述第一关联聚合结果作为当前节点的更新向量表示。
S430、根据当前节点和邻接节点的更新向量表示,确定当前节点和邻接节点之间的第二关联向量。
S440、通过聚合函数将所述第二关联向量进行聚合,得到当前节点与所有邻接节点之间的第二关联聚合结果,并将所述第二关联聚合结果作为当前节点的最终向量表示。
S450、将所述最终向量表示输入知识图谱嵌入表示模型中,得到各节点的嵌入表示。
由于S420中节点的更新向量表示中包含了该节点与其所有邻接节点的关联信息,那么S430中根据当前节点和邻接节点的更新向量表示,确定的第二关联向量中包含了当前节点与其邻接的邻接节点之间的关联信息。
第二关联向量可以根据当前节点和邻接节点的更新向量表示,以及当前节点和邻接节点之间的空间距离和文本相似度运算得到。
进一步的,第二关联聚合结果中包含当前节点与其所有邻接的邻接节点的关联信息。
本申请实施例中,所述根据当前节点和邻接节点的更新向量表示,确定当前节点和邻接节点之间的第二关联向量,包括:
将当前节点和邻接节点的更新向量表示进行拼接,得到第二拼接向量;
根据当前节点和邻接节点之间的空间邻近度和文本相似度,确定当前节点和邻接节点之间的关联信息;
将所述关联信息与所述第二拼接向量相乘,得到当前节点和邻接节点之间的第二关联向量。
可以理解的,得到第二拼接向量与得到第一拼接向量所使用的拼接方式相同,区别在于第一拼接向量是根据当前节点和邻接节点的初始向量表示得到的,而第二拼接向量是根据当前节点和邻接节点的更新向量表示得到的。
本申请实施例通过以下方法得到节点的嵌入表示:根据当前节点和邻接节点的更新向量表示,确定当前节点和邻接节点之间的第二关联向量;通过聚合函数将所述第二关联向量进行聚合,得到当前节点与所有邻接节点之间的第二关联聚合结果,并将所述第二关联聚合结果作为当前节点的最终向量表示;将所述最终向量表示输入知识图谱嵌入表示模型中,得到各节点的嵌入表示。以上技术方案通过两轮的聚合,将节点两跳以内的邻接节点的信息纳入节点的嵌入表示中,使模型在训练时可以学习到节点与其更多邻接节点之间的关联信息,从而根据这些关联信息得到具有更优的空间和文本辨别能力的节点的嵌入表示,从而更准确的从空间和文本的角度将不同节点区分开来。
图5是本申请又一种实施例提供的知识图谱嵌入表示模型训练方法流程图,本实施例以上述实施例为基础进行优化,具体优化如下:
S510、获取知识图谱中当前节点的邻接节点,根据当前节点和邻接节点的初始向量表示,确定当前节点和邻接节点之间的第一关联向量;其中,所述节点用于表征知识图谱中的实体。
S520、通过聚合函数将所述第一关联向量进行聚合,得到当前节点与所有邻接节点之间的第一关联聚合结果,并将所述第一关联聚合结果作为当前节点的更新向量表示。
S530、根据当前节点和邻接节点的更新向量表示,确定当前节点和邻接节点之间的第二关联向量。
S540、通过聚合函数将所述第二关联向量进行聚合,得到当前节点与所有邻接节点之间的第二关联聚合结果,并将所述第二关联聚合结果作为当前节点的最终向量表示。
S550、确定各节点的正样本集和负样本集。
S560、根据各节点的正样本集和负样本集定义损失函数。
S570、确定使损失函数达到最小值时的最优参数,并根据最优参数构建知识图谱嵌入表示模型,以用于确定各节点的嵌入表示。
知识图谱中的每一个节点都对应一个正样本集和负样本集,嵌入表示模型根据每个节点的正负样本集中各节点的最终向量表示进行训练。嵌入表示模型的训练过程是最小化损失函数的过程,通过以最小化损失函数为目标,利用随机梯度下降法优化损失函数中的参数,并根据最优参数构建知识图谱嵌入表示模型,以用于确定各节点的嵌入表示。
损失函数可以根据实际需求进行定义。本申请实施例中,可以通过以下公式对损失函数进行定义:
Figure 199704DEST_PATH_IMAGE023
其中
Figure 174613DEST_PATH_IMAGE024
表示sigmoid函数,
Figure 594093DEST_PATH_IMAGE025
表示在由节点
Figure 679861DEST_PATH_IMAGE026
的正采样得到的点集
Figure 501186DEST_PATH_IMAGE027
上的正 采样分布,节点
Figure 912576DEST_PATH_IMAGE028
是节点
Figure 84931DEST_PATH_IMAGE026
的正样本集中的样本,
Figure 974390DEST_PATH_IMAGE029
是正样本的个数。
Figure 915801DEST_PATH_IMAGE030
表示负采 样,节点
Figure 498092DEST_PATH_IMAGE031
是节点
Figure 626585DEST_PATH_IMAGE026
的负样本集中的样本,
Figure 319735DEST_PATH_IMAGE032
是每个正样本对应的负样本个数。
该损失函数L的目标是使在空间和文本上相近的节点具有相似的嵌入表示,而空间距离较远或语义不相关的节点的嵌入表示在向量空间中距离较远。
本申请实施例中,确定各节点的正样本集和负样本集,包括:
确定知识图谱中各节点之间连线的归一化权重,通过各节点在知识图谱中带权随机游走预设长度,生成各节点的正样本集;
若节点为地点节点,则根据该节点与其他地点节点的空间邻近度确定该节点的负样本集;
若节点为非地点节点,则从知识图谱中的其他所有节点中随机选取节点构成该节点的负样本集;若节点负样本集中的样本已经在该节点的正样本集中,则在该节点的负样本集中舍弃该样本,并重新进行选取。
将知识图谱表达为
Figure 850073DEST_PATH_IMAGE033
,其中V表示节点集合,E表示边的集合。给定一条边
Figure 614984DEST_PATH_IMAGE034
,赋予它一个权重
Figure 168456DEST_PATH_IMAGE035
,该权重计算如下:
如果节点
Figure 665297DEST_PATH_IMAGE009
Figure 315721DEST_PATH_IMAGE010
都是地点节点,设置空间邻近度阈值
Figure 239815DEST_PATH_IMAGE036
和文本相似度阈值
Figure 342900DEST_PATH_IMAGE037
。若
Figure 377852DEST_PATH_IMAGE009
Figure 148362DEST_PATH_IMAGE010
之间的空间邻近度不小于
Figure 977778DEST_PATH_IMAGE036
,且
Figure 833738DEST_PATH_IMAGE009
Figure 937960DEST_PATH_IMAGE010
之间文本相似度不小于
Figure 297398DEST_PATH_IMAGE037
,则连接节点
Figure 563294DEST_PATH_IMAGE009
Figure 906550DEST_PATH_IMAGE010
的边 的权重
Figure 283305DEST_PATH_IMAGE035
可通过以下公式表达:
Figure 28407DEST_PATH_IMAGE038
否则,通过以下公式进行表达:
Figure 465205DEST_PATH_IMAGE039
其中,
Figure 30178DEST_PATH_IMAGE040
Figure 210624DEST_PATH_IMAGE041
可以根据实验效果进行设置。
如果节点
Figure 544653DEST_PATH_IMAGE009
Figure 417931DEST_PATH_IMAGE010
中至少有一个不是地点节点,则
Figure 470201DEST_PATH_IMAGE042
在所有边的权重按照上述过程计算之后,对于每个节点
Figure 188758DEST_PATH_IMAGE043
,将与它相连的所有 边上的权重归一化为[0, 1]。
将权重归一化后,对于每个节点
Figure 642873DEST_PATH_IMAGE043
,其所对应的正样本集是通过其在知识图谱 结构中进行带权随机游走固定长度后生成。
本申请实施例中,
Figure 421474DEST_PATH_IMAGE036
可以为0.9,
Figure 961039DEST_PATH_IMAGE037
可以为0.6,
Figure 483288DEST_PATH_IMAGE040
可以为100,
Figure 791909DEST_PATH_IMAGE041
可以为10,随机游 走固定长度可以为5。
在得到节点
Figure 741411DEST_PATH_IMAGE009
的正样本集后,其所对应的负样本可以通过以下方式产生:如果
Figure 502693DEST_PATH_IMAGE009
是 一个地点节点,令
Figure 828632DEST_PATH_IMAGE044
表示一个地点节点集合,集合中的地点节点
Figure 460602DEST_PATH_IMAGE045
Figure 581005DEST_PATH_IMAGE009
之间的空间相似度小于
Figure 95163DEST_PATH_IMAGE036
,节点
Figure 959213DEST_PATH_IMAGE009
的负样本可以从该集合
Figure 711269DEST_PATH_IMAGE046
中随机均匀地选择出来。 如果
Figure 268152DEST_PATH_IMAGE009
不是一个地点节点,则可以从知识图谱中的其他所有节点中随机选取节点构成节点
Figure 4027DEST_PATH_IMAGE009
的负样本集。在负采样的过程中,如果节点
Figure 671769DEST_PATH_IMAGE009
生成的负样本存在于其正样本集合中,那么 该负样本就舍弃掉再重新选择。
本申请实施例在构建节点的负样本集时,采用了一种空间距离感知的负样本采样策略,将地点节点之间的空间距离作为负样本采样过程中的重要考虑因素,以此保证负样本不仅在语义上与正样本不同,而且在空间上也区别于正样本,从而使模型学习训练的结果更加符合预期。
需要说明的是,若在模型训练前所述聚合过程只进行一次,即只得到当前节点的更新向量表示, 其后续节点的正负样本集的确定方式与上述所述的节点的正负样本集的确定方式相同,区别仅在于,若在模型训练前所述聚合过程只进行一次,得到各节点的更新向量表示,则嵌入表示模型根据每个节点的正负样本集中各节点的更新向量表示进行训练,若进行两次聚合过程,则在两次聚合得到各节点的最终向量表示之后,嵌入表示模型根据每个节点的正负样本集中各节点的最终向量表示进行训练。
本申请实施例通过以下方法对嵌入表示模型进行训练:确定各节点的正样本集和负样本集;根据各节点的正样本集和负样本集定义损失函数;确定使损失函数达到最小值时的最优参数,并根据最优参数构建知识图谱嵌入表示模型,以用于确定各节点的嵌入表示。模型根据正负样本集学习样本之间空间距离以及语义上的信息,使在空间距离和文本语义上相近的节点具有相似的嵌入表示,而空间距离较远或语义不相关的节点的嵌入表示在向量空间中距离较远,即可以从空间和文本的角度将相差较大的节点区分开。
图6是本申请一种实施例提供的知识图谱嵌入表示模型训练装置结构框图,该装置可执行本申请任意实施例所提供的知识图谱嵌入表示模型训练方法,具备执行方法相应的功能模块和有益效果。如图6所示,该装置可以包括:
第一关联向量确定模块610,用于获取知识图谱中当前节点的邻接节点,根据当前节点和邻接节点的初始向量表示,确定当前节点和邻接节点之间的第一关联向量;其中,所述节点用于表征知识图谱中的实体。
第一聚合结果确定模块620,用于通过聚合函数将所述第一关联向量进行聚合,得到当前节点与所有邻接节点之间的第一关联聚合结果,并将所述第一关联聚合结果作为当前节点的更新向量表示。
第一模型训练模块630,用于将所述更新向量表示输入知识图谱嵌入表示模型中,得到各节点的嵌入表示。
本申请实施例中,所述装置还包括:
第二关联向量确定模块,用于根据当前节点和邻接节点的更新向量表示,确定当前节点和邻接节点之间的第二关联向量。
第二聚合结果确定模块,用于通过聚合函数将所述第二关联向量进行聚合,得到当前节点与所有邻接节点之间的第二关联聚合结果,并将所述第二关联聚合结果作为当前节点的最终向量表示。
第二模型训练模块,用于将所述最终向量表示输入知识图谱嵌入表示模型中,得到各节点的嵌入表示。
本申请实施例中,所述当前节点的邻接节点,包括在知识图谱结构中与当前节点直接相连的邻接节点,和/或,在空间地理位置上与当前节点距离最近的预设数量的邻接节点。
本申请实施例中,所述第一关联向量确定模块610,具体用于:
将当前节点和邻接节点的初始向量表示进行拼接,得到第一拼接向量;
根据当前节点和邻接节点之间的空间邻近度和文本相似度,确定当前节点和邻接节点之间的关联信息;
将所述关联信息与所述第一拼接向量相乘,得到当前节点和邻接节点之间的第一关联向量。
本申请实施例中,所述第二关联向量确定模块,具体用于:
将当前节点和邻接节点的更新向量表示进行拼接,得到第二拼接向量;
根据当前节点和邻接节点之间的空间邻近度和文本相似度,确定当前节点和邻接节点之间的关联信息;
将所述关联信息与所述第二拼接向量相乘,得到当前节点和邻接节点之间的第二关联向量。
本申请实施例中,所述第一模型训练模块630,包括:
样本集确定单元,用于确定各节点的正样本集和负样本集;
损失函数确定单元,用于根据各节点的正样本集和负样本集定义损失函数;
嵌入表示确定单元,用于确定使损失函数达到最小值时的最优参数,并根据最优参数构建知识图谱嵌入表示模型,以用于确定各节点的嵌入表示。
本申请实施例中,所述样本集确定单元,具体用于:
确定知识图谱中各节点之间连线的归一化权重,通过各节点在知识图谱中带权随机游走预设长度,生成各节点的正样本集;
若节点为地点节点,则根据该节点与其他地点节点的空间邻近度确定该节点的负样本集;
若节点为非地点节点,则从知识图谱中的其他所有节点中随机选取节点构成该节点的负样本集;若节点负样本集中的样本已经在该节点的正样本集中,则在该节点的负样本集中舍弃该样本,并重新进行选取。
产品可执行本申请实施例所提供的知识图谱嵌入表示模型训练方法,具备执行方法相应的功能模块和有益效果。
图7是本申请一种实施例提供的电子设备的结构示意图。图7示出了适于用来实现本申请实施例的示例性电子设备712的框图。图7显示的电子设备712仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图7所示,电子设备712可以包括:一个或多个处理器716;存储器728,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器716执行,使得所述一个或多个处理器716实现本申请实施例所提供的知识图谱嵌入表示模型训练方法,包括:
获取知识图谱中当前节点的邻接节点,根据当前节点和邻接节点的初始向量表示,确定当前节点和邻接节点之间的第一关联向量;其中,所述节点用于表征知识图谱中的实体;
通过聚合函数将所述第一关联向量进行聚合,得到当前节点与所有邻接节点之间的第一关联聚合结果,并将所述第一关联聚合结果作为当前节点的更新向量表示;
将所述更新向量表示输入知识图谱嵌入表示模型中,得到各节点的嵌入表示。
电子设备712的组件可以包括但不限于:一个或者多个处理器716,存储器728,连接不同设备组件(包括存储器728和处理器716)的总线718。
总线718表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,处理型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
电子设备712典型地包括多种计算机设备可读存储介质。这些存储介质可以是任何能够被电子设备712访问的可用存储介质,包括易失性和非易失性存储介质,可移动的和不可移动的存储介质。
存储器728可以包括易失性存储器形式的计算机设备可读存储介质,例如随机存取存储器(RAM)730和/或高速缓存存储器732。电子设备712可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机设备存储介质。仅作为举例,存储系统734可以用于读写不可移动的、非易失性磁存储介质(图7未显示,通常称为“硬盘驱动器”)。尽管7中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM, DVD-ROM或者其它光存储介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据存储介质接口与总线718相连。存储器728可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
具有一组(至少一个)程序模块742的程序/实用工具740,可以存储在例如存储器728中,这样的程序模块742包括但不限于操作设备、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块742通常执行本申请所描述的实施例中的功能和/或方法。
电子设备712也可以与一个或多个外部设备714和/或显示器724等通信,还可与一个或者多个使得用户能与该电子设备712交互的设备通信,和/或与使得该电子设备712能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口722进行。并且,电子设备712还可以通过网络适配器720与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图7所示,网络适配器720通过总线718与电子设备712的其它模块通信。应当明白,尽管图7中未示出,可以结合电子设备712使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID设备、磁带驱动器以及数据备份存储设备等。
处理器716通过运行存储在存储器728中的多个程序中其他程序的至少一个,从而执行各种功能应用以及数据处理,例如实现本申请实施例所提供的知识图谱嵌入表示模型训练方法。
本申请一种实施例提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行本申请实施例所提供的知识图谱嵌入表示模型训练方法,包括:
获取知识图谱中当前节点的邻接节点,根据当前节点和邻接节点的初始向量表示,确定当前节点和邻接节点之间的第一关联向量;其中,所述节点用于表征知识图谱中的实体;
通过聚合函数将所述第一关联向量进行聚合,得到当前节点与所有邻接节点之间的第一关联聚合结果,并将所述第一关联聚合结果作为当前节点的更新向量表示;
将所述更新向量表示输入知识图谱嵌入表示模型中,得到各节点的嵌入表示。
本申请实施例的计算机存储介质,可以采用一个或多个计算机可读的存储介质的任意组合。计算机可读存储介质可以是计算机可读信号存储介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的设备、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请实施例中,计算机可读存储介质可以是任何包含或存储程序的有形存储介质,该程序可以被指令执行设备、装置或者器件使用或者与其结合使用。
计算机可读的信号存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号存储介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算机可读存储介质可以发送、传播或者传输用于由指令执行设备、装置或者器件使用或者与其结合使用的程序。
计算机可读存储介质上包含的程序代码可以用任何适当的存储介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或设备上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解,本申请不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请进行了较为详细的说明,但是本申请不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由所附的权利要求范围决定。

Claims (9)

1.一种知识图谱嵌入表示模型训练方法,其特征在于,所述方法包括:
获取知识图谱中当前节点的邻接节点,根据当前节点和邻接节点的初始向量表示,确定当前节点和邻接节点之间的第一关联向量,包括:
将当前节点和邻接节点的初始向量表示进行拼接,得到第一拼接向量;
根据当前节点和邻接节点之间的空间邻近度和文本相似度,确定当前节点和邻接节点之间的关联信息;
将所述关联信息与所述第一拼接向量相乘,得到当前节点和邻接节点之间的第一关联向量;其中,所述节点用于表征知识图谱中的实体;
通过聚合函数将所述第一关联向量进行聚合,得到当前节点与所有邻接节点之间的第一关联聚合结果,并将所述第一关联聚合结果作为当前节点的更新向量表示;
将所述更新向量表示输入知识图谱嵌入表示模型中,得到各节点的嵌入表示。
2.根据权利要求1所述的方法,其特征在于,所述将所述第一关联聚合结果作为当前节点的更新向量表示之后,还包括:
根据当前节点和邻接节点的更新向量表示,确定当前节点和邻接节点之间的第二关联向量;
通过聚合函数将所述第二关联向量进行聚合,得到当前节点与所有邻接节点之间的第二关联聚合结果,并将所述第二关联聚合结果作为当前节点的最终向量表示;
将所述最终向量表示输入知识图谱嵌入表示模型中,得到各节点的嵌入表示。
3.根据权利要求1或2所述的方法,其特征在于,所述当前节点的邻接节点,包括在知识图谱结构中与当前节点直接相连的邻接节点,和/或,在空间地理位置上与当前节点距离最近的预设数量的邻接节点。
4.根据权利要求2所述的方法,其特征在于,所述根据当前节点和邻接节点的更新向量表示,确定当前节点和邻接节点之间的第二关联向量,包括:
将当前节点和邻接节点的更新向量表示进行拼接,得到第二拼接向量;
根据当前节点和邻接节点之间的空间邻近度和文本相似度,确定当前节点和邻接节点之间的关联信息;
将所述关联信息与所述第二拼接向量相乘,得到当前节点和邻接节点之间的第二关联向量。
5.根据权利要求2所述的方法,其特征在于,所述将所述最终向量表示输入知识图谱嵌入表示模型中,得到各节点的嵌入表示,包括:
确定各节点的正样本集和负样本集;
根据各节点的正样本集和负样本集定义损失函数;
确定使损失函数达到最小值时的最优参数,并根据最优参数构建知识图谱嵌入表示模型,以用于确定各节点的嵌入表示。
6.根据权利要求5所述的方法,其特征在于,所述确定各节点的正样本集和负样本集,包括:
确定知识图谱中各节点之间连线的归一化权重,通过各节点在知识图谱中带权随机游走预设长度,生成各节点的正样本集;
若节点为地点节点,则根据该节点与其他地点节点的空间邻近度确定该节点的负样本集;
若节点为非地点节点,则从知识图谱中的其他所有节点中随机选取节点构成该节点的负样本集;若节点负样本集中的样本已经在该节点的正样本集中,则在该节点的负样本集中舍弃该样本,并重新进行选取。
7.一种知识图谱嵌入表示模型训练装置,其特征在于,所述装置包括:
第一关联向量确定模块,用于获取知识图谱中当前节点的邻接节点,根据当前节点和邻接节点的初始向量表示,确定当前节点和邻接节点之间的第一关联向量;其中,所述节点用于表征知识图谱中的实体;
所述第一关联向量确定模块,具体用于:将当前节点和邻接节点的初始向量表示进行拼接,得到第一拼接向量;根据当前节点和邻接节点之间的空间邻近度和文本相似度,确定当前节点和邻接节点之间的关联信息;将所述关联信息与所述第一拼接向量相乘,得到当前节点和邻接节点之间的第一关联向量;
第一聚合结果确定模块,用于通过聚合函数将所述第一关联向量进行聚合,得到当前节点与所有邻接节点之间的第一关联聚合结果,并将所述第一关联聚合结果作为当前节点的更新向量表示;
第一模型训练模块,用于将所述更新向量表示输入知识图谱嵌入表示模型中,得到各节点的嵌入表示。
8.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,所述一个或多个处理器实现如权利要求1-6中任一项所述的知识图谱嵌入表示模型训练方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一项所述的知识图谱嵌入表示模型训练方法。
CN202111472336.4A 2021-12-06 2021-12-06 知识图谱嵌入模型训练方法、装置、电子设备及介质 Active CN113869516B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111472336.4A CN113869516B (zh) 2021-12-06 2021-12-06 知识图谱嵌入模型训练方法、装置、电子设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111472336.4A CN113869516B (zh) 2021-12-06 2021-12-06 知识图谱嵌入模型训练方法、装置、电子设备及介质

Publications (2)

Publication Number Publication Date
CN113869516A CN113869516A (zh) 2021-12-31
CN113869516B true CN113869516B (zh) 2022-05-20

Family

ID=78985930

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111472336.4A Active CN113869516B (zh) 2021-12-06 2021-12-06 知识图谱嵌入模型训练方法、装置、电子设备及介质

Country Status (1)

Country Link
CN (1) CN113869516B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112000689A (zh) * 2020-08-17 2020-11-27 吉林大学 一种基于文本分析的多知识图谱融合方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102016223193A1 (de) * 2016-11-23 2018-05-24 Fujitsu Limited Verfahren und Vorrichtung zum Komplettieren eines Wissensgraphen
CN107590190B (zh) * 2017-08-11 2019-12-03 中南民族大学 一种路网中空间文本发布订阅方法及其组合索引
CN108763237A (zh) * 2018-03-21 2018-11-06 浙江大学 一种基于注意力机制的知识图谱嵌入方法
CN109933674B (zh) * 2019-03-22 2021-06-04 中国电子科技集团公司信息科学研究院 一种基于属性聚合的知识图谱嵌入方法及其存储介质
CN113190654A (zh) * 2021-05-08 2021-07-30 北京工业大学 一种基于实体联合嵌入和概率模型的知识图谱补全方法
CN113505239B (zh) * 2021-07-09 2022-10-28 吉林大学 一种结合图注意力和属性聚类的实体对齐方法
CN113535984B (zh) * 2021-08-11 2023-05-26 华侨大学 一种基于注意力机制的知识图谱关系预测方法及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112000689A (zh) * 2020-08-17 2020-11-27 吉林大学 一种基于文本分析的多知识图谱融合方法

Also Published As

Publication number Publication date
CN113869516A (zh) 2021-12-31

Similar Documents

Publication Publication Date Title
CN111754596B (zh) 编辑模型生成、人脸图像编辑方法、装置、设备及介质
CN111767366B (zh) 问答资源挖掘方法、装置、计算机设备及存储介质
WO2021139247A1 (zh) 医学领域知识图谱的构建方法、装置、设备及存储介质
CN110276023B (zh) Poi变迁事件发现方法、装置、计算设备和介质
CN107609185B (zh) 用于poi的相似度计算的方法、装置、设备和计算机可读存储介质
WO2021062990A1 (zh) 视频分割方法、装置、设备及介质
CN108229287A (zh) 图像识别方法和装置、电子设备和计算机存储介质
CN113537070B (zh) 一种检测方法、装置、电子设备及存储介质
CN115861462B (zh) 图像生成模型的训练方法、装置、电子设备及存储介质
CN112214595A (zh) 类别确定方法、装置、设备及介质
CN114330588A (zh) 一种图片分类方法、图片分类模型训练方法及相关装置
CN107688604A (zh) 数据应答处理方法、装置及服务器
WO2021104274A1 (zh) 图文联合表征的搜索方法、系统、服务器和存储介质
CN116912187A (zh) 图像生成模型训练及图像生成方法、装置、设备和介质
CN113869516B (zh) 知识图谱嵌入模型训练方法、装置、电子设备及介质
CN115527083B (zh) 图像标注方法、装置和电子设备
CN115482436B (zh) 图像筛选模型的训练方法、装置以及图像筛选方法
CN112861474B (zh) 一种信息标注方法、装置、设备及计算机可读存储介质
CN113255819B (zh) 用于识别信息的方法和装置
CN113010687B (zh) 一种习题标签预测方法、装置、存储介质以及计算机设备
CN110059180B (zh) 文章作者身份识别及评估模型训练方法、装置及存储介质
JP2022111020A (ja) 文書類似度学習に基づくディープラーニングモデルの転移学習方法およびコンピュータ装置
CN113742488A (zh) 基于多任务学习的嵌入式知识图谱补全方法和装置
CN111091198A (zh) 一种数据处理方法及装置
CN113762303B (zh) 图像分类方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant