CN117113993B - 实体链接方法、装置、电子设备及存储介质 - Google Patents
实体链接方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN117113993B CN117113993B CN202311375901.4A CN202311375901A CN117113993B CN 117113993 B CN117113993 B CN 117113993B CN 202311375901 A CN202311375901 A CN 202311375901A CN 117113993 B CN117113993 B CN 117113993B
- Authority
- CN
- China
- Prior art keywords
- words
- word
- text
- entity
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 83
- 238000010586 diagram Methods 0.000 claims description 35
- 230000004927 fusion Effects 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 17
- 238000012216 screening Methods 0.000 claims description 13
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 5
- 238000012935 Averaging Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 14
- 238000013473 artificial intelligence Methods 0.000 abstract description 12
- 230000008569 process Effects 0.000 description 15
- 239000013598 vector Substances 0.000 description 14
- 238000012549 training Methods 0.000 description 12
- 238000004590 computer program Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 238000000605 extraction Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000003058 natural language processing Methods 0.000 description 6
- 238000013507 mapping Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 235000002020 sage Nutrition 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Machine Translation (AREA)
Abstract
本申请公开了一种实体链接方法、装置、电子设备及存储介质。本申请的实施例涉及人工智能技术领域。该方法包括:获取第一层次图、多个预置实体词中每个预置实体词对应的图语义特征以及各预置实体词所在第二文本对应的文本特征;根据第一层次图中各节点的节点表示,确定提及词对应的图语义特征;根据提及词对应的图语义特征、第一文本对应的文本特征、每个预置实体词对应的图语义特征以及每个预置实体词所在的第二文本对应的文本特征,在多个预置实体词中确定提及词链接的目标实体词。根据本申请的方法,可以提升实体链接的准确性。
Description
技术领域
本申请涉及人工智能技术领域,更具体地,涉及一种实体链接方法、装置、电子设备及存储介质。
背景技术
实体链接(entity linking)就是将一段文本中的词(也叫提及词)映射到知识库中对应的实体上(也就是实体词)。
相关技术中,可以通过预训练的提及编码器将提及词对应的描述文本映射成向量,得到提及词对应的文本特征,并通过预训练的实体编码器将知识库中所有的实体词各自的描述文本映射成向量,得到各实体词各自的文本特征;之后,根据提及词对应的文本特征以及每个实体词各自的文本特征,从知识库中所有的实体词中筛选出提及词链接的目标实体词。
然而,现有的方法确定实体链接的准确性还有待提高。
发明内容
有鉴于此,本申请实施例提出了一种实体链接方法、装置、电子设备及存储介质。
第一方面,本申请实施例提供了一种实体链接方法,方法包括:根据提及词以及提及词所在的第一文本中多个主干词,构建第一层次图;在第一层次图中同一语句中多个主干词对应的主干节点与提及节点相连接,提及节点代表提及词,一个主干节点代表一个主干词;根据第一层次图中各节点的节点表示,确定提及词对应的图语义特征;获取多个预置实体词中每个预置实体词对应的图语义特征以及各预置实体词所在第二文本对应的文本特征,预置实体词对应的图语义特征是根据预置实体词对应的第二层次图中各节点的节点表示确定的,预置实体词对应的第二层次图是根据预置实体词以及每个预置实体词所在的第二文本中的多个主干词构建的,在预置实体词对应的第二层次图中同一语句中多个主干词对应的主干节点与预置实体词对应的实体节点相连接,实体节点代表预置实体词;根据提及词对应的图语义特征、第一文本对应的文本特征、每个预置实体词对应的图语义特征以及每个预置实体词所在的第二文本对应的文本特征,在多个预置实体词中确定提及词链接的目标实体词。
第二方面,本申请实施例提供了一种实体链接装置,装置包括:构建模块,用于根据提及词以及提及词所在的第一文本中多个主干词,构建第一层次图;在第一层次图中同一语句中多个主干词对应的主干节点与提及节点相连接,提及节点代表提及词,一个主干节点代表一个主干词;确定模块,用于根据第一层次图中各节点的节点表示,确定提及词对应的图语义特征;获取模块,用于获取多个预置实体词中每个预置实体词对应的图语义特征以及各预置实体词所在第二文本对应的文本特征,预置实体词对应的图语义特征是根据预置实体词对应的第二层次图中各节点的节点表示确定的,预置实体词对应的第二层次图是根据预置实体词以及每个预置实体词所在的第二文本中的多个主干词构建的,在预置实体词对应的第二层次图中同一语句中多个主干词对应的主干节点与预置实体词对应的实体节点相连接,实体节点代表预置实体词;词确定模块,用于根据提及词对应的图语义特征、第一文本对应的文本特征、每个预置实体词对应的图语义特征以及每个预置实体词所在的第二文本对应的文本特征,在多个预置实体词中确定提及词链接的目标实体词。
可选地,构建模块,还用于为第一文本中每个主干词构建一个主干节点,并为提及词构建提及节点;根据第一文本中多个主干词构建中继节点;同一语句中多个主干词对应一个中继节点;将第一文本中同一语句对应的中继节点以及主干节点相互连接,以及将第一文本中不同语句对应的中继节点分别与提及节点进行连接,得到第一层次图。
可选地,确定模块,还用于对第一文本进行语义编码,获得第一文本对应的编码特征序列;从第一文本对应的编码特征序列中获取提及词的特征,作为提及节点的节点表示;从第一文本对应的编码特征序列中获取第一文本中各主干词的特征,作为第一层次图中主干词对应的主干节点的节点表示;根据第一层次图中每个中继节点对应的多个主干词的主干节点表示,确定第一层次图中每个中继节点对应的中继节点表示;从第一文本对应的编码特征序列中获取第一文本对应的文本特征。
可选地,确定模块,还用于对第一层次图中每个中继节点所连接多个主干节点的主干节点表示求平均,得到第一层次图中每个中继节点对应的候选节点表示;对第一层次图中每个中继节点对应的候选节点表示进行线性处理,得到第一层次图中每个中继节点对应的中继节点表示。
可选地,词确定模块,还用于对提及词对应的图语义特征以及第一文本对应的文本特征进行融合,得到提及词对应的融合特征;对每个预置实体词对应的图语义特征以及该预置实体词所在的第二文本对应的文本特征进行融合,得到每个预置实体词各自对应的融合特征;将提及词对应的融合特征与每个预置实体词对应的融合特征分别进行融合,得到每个预置实体词各自对应的目标特征;根据多个预置实体词各自对应的目标特征,从多个预置实体词中确定提及词链接的目标实体词。
可选地,词确定模块,还用于根据多个预置实体词各自对应的目标特征,从多个预置实体词中筛选多个候选实体词;将每个候选实体词对应的第二层次图分别与第一层次图进行连接,得到每个候选实体词对应的全局层次图;根据每个候选实体词对应的全局层次图中各节点的节点表示,确定每个候选实体词与提及词之间的第一预测匹配分数;根据每个候选实体词对应的第二文本以及第一文本的联合语义编码结果,确定每个候选实体词与提及词对应的第二预测匹配分数;根据每个候选实体词与提及词对应的第一匹配预测分数以及第二预测匹配分数,从多个候选实体词中确定提及词链接的目标实体词。
可选地,词确定模块,还用于通过线性层分别对多个预置实体词各自对应的目标特征进行预测,得到每个预置实体词与提及词的匹配分数;筛选匹配分数达到分数阈值的预置实体词作为候选实体词,或,按照匹配分数由高到低筛选预设数量个预置实体词作为候选实体词。
可选地,词确定模块,还用于针对每个候选实体词构建全局节点;基于第一层次图中各节点的节点表示和各候选实体词所对应第二层次图中各节点的节点表示,确定全局节点的节点表示;将第一层次图中各中继节点以及候选实体词对应的第二层次图中各中继节点,分别与全局节点连接,并将全局节点对应的节点表示与全局节点进行关联,得到候选实体词对应的全局层次图。
可选地,词确定模块,还用于在每个候选实体词对应的全局层次图中确定通过全局节点的路径,作为候选实体词对应的目标路径;目标路径以候选实体词对应的全局层次图中提及词对应的提及节点为起点,且以候选实体词对应的实体节点为终点;通过图神经网络基于候选实体词对应的目标路径中各节点的节点表示进行评分,得到候选实体词对应的每个目标路径各自的路径分数;从候选实体词对应的目标路径中获取最大路径分数,作为候选实体词与提及词之间的第一预测匹配分数。
可选地,词确定模块,还用于根据每个候选实体词与提及词对应的第一匹配预测分数以及第二预测匹配分数,得到每个候选实体词与提及词对应的目标预测分数;获取目标预测分数最大值所对应的候选实体词作为提及词链接的目标实体词。
可选地,确定模块,还用于通过图注意力网络,基于第一层次图中各节点的节点表示,确定提及词对应的图语义特征。
第三方面,本申请实施例提供了一种电子设备,包括处理器以及存储器;存储器上存储有计算机可读指令,计算机可读指令被处理器执行时,实现上述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读取存储介质中存储有计算机可读指令,当计算机可读指令被处理器执行时,实现上述的方法。
第五方面,本申请实施例提供了一种计算机程序产品或计算机程序,计算机程序产品或计算机程序包括计算机指令,计算机指令被处理器执行时,实现上述的方法。
本申请实施例提供的一种实体链接方法、装置、电子设备及存储介质,在本申请中,根据提及词以及所述提及词所在的第一文本中多个主干词,构建第一层次图,并根据第一层次图中各节点的节点表示,确定所述提及词对应的图语义特征,提及词对应的图语义特征可以准确的表示提及词在第一文本的语境下的语义信息,同时,根据多个预置实体词中每个预置实体词以及每个所述预置实体词所在的第二文本中多个主干词,构建每个所述预置实体词对应的第二层次图,根据每个所述预置实体词对应的第二层次图中各节点的节点表示,确定每个所述预置实体词对应的图语义特征,预置实体词对应的图语义特征可以准确的表示预置实体词在所在的第二文本的语境下的语义信息,因此,在根据所述提及词对应的图语义特征、所述第一文本对应的文本特征、每个所述预置实体词对应的图语义特征以及每个所述预置实体词所在的第二文本对应的文本特征,从所述多个预置实体词中确定所述提及词链接的目标实体词过程中,在所述第一文本对应的文本特征以及每个所述预置实体词所在的第二文本对应的文本特征的基础上,引入了提及词对应的图语义特征以及各预置实体词对应的图语义特征,结合提及词对应的图语义特征以及第一文本对应的文本特征有效的增强提及词的语义信息,结合预置实体词对应的图语义特征以及预置实体词对应的第二文本对应的文本特征有效的增强预置实体词的语义信息,从而使得实体链接的准确性较高。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请实施例适用的应用场景的示意图;
图2示出了本申请一个实施例提出的一种实体链接方法的流程图;
图3示出了本申请实施例中一种提及词对应的第一层次图的示意图;
图4示出了本申请实施例中一种第一文本的编码过程的示意图;
图5示出了本申请又一个实施例提出的一种实体链接方法的流程图;
图6示出了本申请实施例中一种候选实体词对应的全局层次图的示意图;
图7示出了本申请再一个实施例提出的一种实体链接方法的流程图;
图8示出了本申请一个实施例提出的一种实体链接装置的框图;
图9示出了用于执行根据本申请实施例的实体链接方法的电子设备的结构框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。根据本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在以下的描述中,所涉及的术语“第一\第二”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
需要说明的是:在本文中提及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本申请公开了一种实体链接方法、装置、电子设备及存储介质,涉及人工智能技术。
人工智能(Artificial Intelligence, AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
自然语言处理(Nature Language processing, NLP)是计算机科学领域与人工智能领域中的重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。人工智能领域模型训练的重要技术,预训练模型,即是从NLP领域的大语言模型(Large Language Model)发展而来。经过微调,大语言模型可以广泛应用于下游任务。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
随着大数据时代的来临,海量的数据被产生与被处理,这些数据充满了歧义性,这就给自然语言处理任务带来了严峻的挑战———如何准确地理解文本的含义。如在搜索引擎中,用户输入“笔记本不好用”这样的搜索词,后台就需要根据语境来判断出这里的“笔记本”指的是表示便携式电脑的“笔记本”而不是表示纸张构成的用于书写的“笔记本”,并据此返回对应的正确检索结果。解决这一问题的重要技术手段就是实体链接 (EntityLinking)。
然而,并不是所有的场景下都能获得充足的数据进行训练,对于一些数据很少的特殊领域,如小语种场景,此时,我们难以获得足够的数据进行训练。此时,我们需要发展零样本技术。零样本设定的特殊之处在于,训练的时候使用的实体词与测试的时候使用的实体词没有交集。通过在源域数据(领域 A 的数据)上进行训练,获得较好的实体链接能力,并在目标域(领域 B 的数据)中有效地进行实体的链接。训练的数据是来自领域 A,测试数据来自于领域 B。而训练的时候,是希望来自训练集中成对的提及词与实体词相互靠近。
其中,提及词是指任意文本中的词,可以是文本重点描述的实体(其中,重点描述的实体可以是指出现频次最高的实体,或者在文本中的第一个出现的实体)的实体名称。实体可以是人名、角色、电影、电视剧、综艺节目、动漫、少儿、语言、地区、语意标签以及年份等类型的实体,实体名称可以是URL(Uniform Resource Locator,统一资源定位符)的实体名称。实体词是指知识库中预置的实体名称。知识库可以预置大量的实体词,以便于从知识库中索引与提及词关联的实体词。
其中,零样本场景下的实体链接任务分为两个步骤:实体消歧以及实体排序。在实体消歧过程中,使用双向编码器(Bi-Encoder )来实现,在实体排序步骤中使用交叉编码器(Cross-Encoder)实现。
实体消歧阶段:通过对偶的Bi-Encoder(包括提及编码器以及实体编码器)实现。将提及词对应的描述文本使用提及编码器映射成向量得到提及词所在的描述文本对应的文本特征,同时,将所有的实体词对应的描述文本使用实体编码器映射成向量得到实体词所在的描述文本对应的文本特征。然后,对每个实体词所在的描述文本对应的文本特征分别与提及词所在的描述文本对应的文本特征融合,得到每个实体词对应的融合向量,再根据每个实体词对应的融合向量确定每个实体词的预测分数,通过实体词的预测分数召回提及词对应的文本特征附近的实体词对应的文本特征对应的实体词(预测分数较高的实体词),这样就可以获得一些粗召回的预置实体词,实现实体消歧。
实体排序阶段:使用的是Cross-Encoder实现。这里针对实体消歧得到的预置实体词进行二次排序:将每个预置实体词对应的描述文本与提及词对应的描述文本进行拼接,得到每个预置实体词对应的拼接结果,并将每个预置实体词对应的拼接结果分别输入预训练语言模型中,得到每个预置实体词对应的预测分数,根据预测分数对候选实体排序,实现实体排序。
之后,可以选择预测分数最高的预置实体词作为提及词对应的目标实体词,并建立目标实体词与提及词的实体链接。
然而,在实体消歧阶段,确定的实体词所在的描述文本对应的文本特征难以准确的指示实体词在描述文本的语境下的语义信息,同时,提及词所在的描述文本对应的文本特征难以准确的指示提及词在描述文本的语境下的语义信息,导致实体词的预测分数的准确率较低,致使从预置实体词中确定的目标实体词也不准确。
为解决上述问题,发明人提出了本申请的实体链接方法、装置、电子设备及存储介质。根据提及词以及所述提及词所在的第一文本中多个主干词,构建第一层次图,并根据第一层次图中各节点的节点表示,确定所述提及词对应的图语义特征,提及词对应的图语义特征可以准确的表示提及词在第一文本的语境下的语义信息,同时,根据多个预置实体词中每个预置实体词以及每个所述预置实体词所在的第二文本中多个主干词,构建每个所述预置实体词对应的第二层次图,根据每个所述预置实体词对应的第二层次图中各节点的节点表示,确定每个所述预置实体词对应的图语义特征,预置实体词对应的图语义特征可以准确的表示预置实体词在所在的第二文本的语境下的语义信息,因此,在根据所述提及词对应的图语义特征、所述第一文本对应的文本特征、每个所述预置实体词对应的图语义特征以及每个所述预置实体词所在的第二文本对应的文本特征,从所述多个预置实体词中确定所述提及词链接的目标实体词过程中,在所述第一文本对应的文本特征以及每个所述预置实体词所在的第二文本对应的文本特征的基础上,引入了提及词对应的图语义特征以及各预置实体词对应的图语义特征,结合提及词对应的图语义特征以及第一文本对应的文本特征有效的增强提及词的语义信息,结合预置实体词对应的图语义特征以及预置实体词对应的第二文本对应的文本特征有效的增强预置实体词的语义信息,从而使得实体链接的准确性较高。
如图1所示,本申请实施例所适用的应用场景包括终端20和服务端10,终端20和服务端10通过有线网络或者无线网络通信连接。终端20可以是智能手机、平板电脑、笔记本电脑、台式电脑、智能家电、车载终端、飞行器、可穿戴设备终端、虚拟现实设备以及其他可以进行页面展示的终端设备,或者运行其他可以调用页面展示应用的其他应用(例如即时通讯应用、购物应用、搜索应用、游戏应用、论坛应用、地图交通应用等)。
服务端10可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN(Content Delivery Network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。服务端10可以用于为终端20运行的应用提供服务。
其中,终端20可以向服务端10发送提及词以及提及词所在的第一文本,由服务端10根据提及词以及提及词所在的第一文本中多个主干词,构建第一层次图,并根据服务端10中多个预置实体词中每个预置实体词以及每个预置实体词所在的第二文本中多个主干词,构建每个预置实体词对应的第二层次图,之后,服务端10根据第一层次图中各节点的节点表示,确定提及词对应的图语义特征;根据每个预置实体词对应的第二层次图中各节点的节点表示,确定每个预置实体词对应的图语义特征;再之后,服务端10根据提及词对应的图语义特征、第一文本对应的文本特征、每个预置实体词对应的图语义特征以及每个预置实体词所在的第二文本对应的文本特征,在多个预置实体词中确定提及词链接的目标实体词。服务端10还可以对目标实体词进行后续处理其中,后续处理可以基于所确定提及词链接的实体,确定第一文本的语义信息,该第一文本可以是自动问答系统中用户提供的问答文本,进而,后续可以基于第一文本的语义进行确定回复文本。在其他实施例中,若第一文本是搜索文本(即输入的用于搜索内容的文本),还可以基于所确定的目标实体词,确定第一文本的语义信息,进而,根据第一文本的语义信息匹配搜索结果。
在另一实施方式中,终端20可以用于执行本申请的方法,在多个预置实体词中确定提及词链接的目标实体词。
可以理解的是,服务端10可以设置有多个预置实体词以及每个预置实体词对应的第二文本,服务端10可以将多个预置实体词以及每个预置实体词对应的第二文本存储在分布式云存储系统,由终端20从分布式云存储系统中获取多个预置实体词以及每个预置实体词对应的第二文本之后,根据多个预置实体词以及每个预置实体词对应的第二文本,确定出目标实体词。
为了方便表述,下述各个实施例中,以实体链接方法由电子设备执行为例进行说明。
请参阅图2,图2示出了本申请一个实施例提出的一种实体链接方法的流程图,该方法可以应用于电子设备,电子设备可以是图1中的终端20或服务端10,该方法包括:
S110、根据提及词以及提及词所在的第一文本中多个主干词,构建第一层次图。
其中,在第一层次图中同一语句中多个主干词对应的主干节点与提及节点相连接,提及节点代表提及词,一个主干节点代表一个主干词。
第一文本可以是电子设备获取到,任何语言格式的文本,第一文本可以是用户输入的、从网络上或本地存储器获取到的文本。例如,第一文本可以是从用户输入的英文文本“The timely intervention of spock saved the doctor's life. Natira also tolddoctor mecoy that the book was given by the creators . It was subsequentlylearned that the “creators" were the ancient fabrini and that the book wasmerely a technical manualand guidebook.Yonada was, in fact, a multi-generational colony ship and the“oracle”its computer.”。
提及词可以是第一文本中的待进行实体链接的词,可以是第一文本中的主语以及宾语等。例如,在前述英文文本中,提及词可以是“colony ship”。
主干词是指表示语句的主干的词,例如主干词可以是指语句中的主语、谓语以及宾语,又如,主干词可以是指语句中的主语、系动词以及表语。例如,在前述英文文本中的第一个语句中,主语为spock,谓语为saved,宾语为doctor's life。
在本实施例中,可以将第一文本按句子进行划分,得到多个第一文本语句,对于每一个第一文本语句进行主干词的提取,得到该第一文本语句对应的多个主干词,遍历第一文本中全部的第一文本语句,得到全部的主干词。
例如,前述英文文本作为第一文本时,划分为四个第一文本语句,则第一个第一文本语句提取到的主干词为spock、saved以及doctor's life;第二个文本语句提取到的主干词为book、given by以及creators;第三个第一文本语句提取到的主干词为creators、were以及ancient fabrini;第四个第一文本语句提取到的主干词为Yonada、was以及colonyship。
根据第一文本得到提及词以及多个主干词之后,将提及词作为提及节点,将每个主干词作为一个主干节点,将同一语句中的多个主干词对应的主干节点与提及节点相连接,得到图结构的表示,作为第一层次图,该第一层次图为以提及节点为中心的图。
作为一种实施方式,S110还可以包括:为第一文本中每个主干词构建一个主干节点,并为提及词构建提及节点;根据第一文本中多个主干词构建中继节点;同一语句中多个主干词对应一个中继节点;将第一文本中同一语句对应的中继节点以及主干节点相互连接,以及将第一文本中不同语句对应的中继节点分别与提及节点进行连接,得到第一层次图。
将第一文本中每个主干词作为一个节点,构建出第一文本中各主干词各自对应的主干节点,同理,将第一文本中提及词作为节点,构建出第一文本中提及词对应的提及节点。
同时,针对于第一文本中的每个第一文本语句,根据该第一文本语句中的各主干词构建一个节点,作为该第一文本语句对应的中继节点。其中,可以根据同一第一文本语句中的各主干词构建一个节点,该节点用于与该语句中的各个主干词对应的主干节点以及提及词对应的提及节点分别连接,该构建的节点可以作为该第一文本语句对应的中继节点。其中,中继节点可以是空白字符。
得到主干节点、中继节点以及提及节点之后,将第一文本中同一语句对应的中继节点以及主干节点相互连接,以及将第一文本中不同语句对应的中继节点分别与提及节点进行连接,得到第一层次图。其中,在第一层次图中,同一语句的各个主干节点也可以互相连接。
例如,第一文本为“The timely intervention of spock saved the doctor'slife. Natira also told doctor mecoy that the book was given by the creators”,提及词为“spock”,第一文本划分为两个第一文本语句,第一个第一文本语句提取到的主干词为spock(第一个第一文本语句中的主语)、saved(第一个第一文本语句中的谓语)以及doctor's life(第一个第一文本语句中的宾语);第二个文本语句提取到的主干词为book(第二个第一文本语句中的主语)、given by(第二个第一文本语句中的谓语)以及creators(第二个第一文本语句中的宾语);其中,根据spock、saved以及doctor's life构建第一个第一文本语句对应的中继节点Z1,根据book、given by以及creators构建第一个第一文本语句对应的中继节点Z2,此时,得到的第一层次图如图3所示,将表示spock、saved以及doctor's life的主干节点分别与中继节点Z1连接,将表示book、given by以及creators分别与中继节点Z2连接,中继节点Z1与中继节点Z2分别与提及节点spock连接。同时,第一层次图中属于同一语句的book、given by以及creators两两之间互相连接,第一层次图中属于同一语句的spock、saved以及doctor's life两两之间互相连接。
可以理解的是,在图3的示例中,每个中继节点连接的主干节点分别表示主语、无语以及宾语,语句中的主语、无语以及宾语构成了三元组,因此,构建的中继节点又可以叫做三元组节点,也即,在图3中,中继节点Z1为第一个第一文本语句对应的三元组节点,中继节点Z2为第二个第一文本语句对应的三元组节点。
S120、根据第一层次图中各节点的节点表示,确定提及词对应的图语义特征。
得到第一层次图之后,可以确定第一层次图中各节点(包括提及节点、中继节点以及主干节点)的节点表示,然后对第一层次图中各节点的节点表示进行特征提取,得到提及词对应的图语义特征。
作为一种实施方式,S120之前方法还包括对第一文本进行语义编码,获得第一文本对应的编码特征序列;从第一文本对应的编码特征序列中获取提及词的特征,作为提及节点的节点表示;从第一文本对应的编码特征序列中获取第一文本中各主干词的特征,作为第一层次图中主干词对应的主干节点的节点表示;根据第一层次图中每个中继节点对应的多个主干词的主干节点表示,确定第一层次图中每个中继节点对应的中继节点表示;从第一文本对应的编码特征序列中获取第一文本对应的文本特征。
其中,可以通过预训练的文本编码器对第一文本进行语义编码,获得第一文本对应的编码特征序列。其中,预训练的文本编码器可以是预训练的bert模型,预训练的文本编码器可以是通过任意领域的样本训练获得,本申请不做赘述。
通过文本编码器对第一文本中的各个词进行编码,得到第一文本中各个词的特征,第一文本中各个词的特征汇总后得到第一文本对应的编码特征序列。
如图4所示,获取到的第一文本为“The timely intervention of spock savedthe doctor's life”,可以对第一文本的句首添加表示开始位置的“cls”开始标识符,得到处理后的第一文本“[cls] The timely intervention of spock saved the doctor'slife”。然后将处理后的第一文本输入文本编码器,得到第一文本对应的编码特征序列,在第一文本对应的编码特征序列中h0为[cls]对应的特征、h1为The对应的特征、h2为timely对应的特征、h3为intervention对应的特征、h4为of对应的特征、h5为spock对应的特征、h6为saved对应的特征、h7为the对应的特征、h8为doctor's对应的特征以及h9为life对应的特征。
得到第一文本对应的编码特征序列后,直接从第一文本对应的编码特征序列中获取提及词的特征,作为提及节点的节点表示;从第一文本对应的编码特征序列中获取第一文本中各主干词的特征,作为第一层次图中主干词对应的主干节点的节点表示。
可选地,可以对第一层次图中每个中继节点所连接多个主干节点的主干节点表示求平均,得到第一层次图中每个中继节点对应的候选节点表示;通过线性层分别对第一层次图中每个中继节点对应的候选节点表示进行线性处理,得到第一层次图中每个中继节点对应的中继节点表示。
本实施例中,可获取第一文本对应的编码特征序列中第一个特征作为第一文本对应的文本特征。例如,在得到图3所示的第一文本对应的编码特征序列后,可以获取“cls”开始标识符对应的特征作为第一文本对应的文本特征。在其他实施例中,也可以将第一文本对应的编码特征序列作为第一文本对应的文本特征。
作为一种实施方式,S120可以包括:通过图注意力网络,基于第一层次图中各节点的节点表示,确定提及词对应的图语义特征。其中,图注意力网络可以是指graphattention networks(基于注意力机制的图神经网络模型)。
通过图注意力网络,基于第一层次图中各节点的节点表示以及第一层次图中不同节点之间的连接关系,确定第一层次图中各节点各自的注意力运算结果,并获取提及节点对应的注意力运算结果作为提及词的图语义特征。
S130、获取多个预置实体词中每个预置实体词对应的图语义特征以及各预置实体词所在第二文本对应的文本特征。
其中,所述预置实体词对应的图语义特征是根据所述预置实体词对应的第二层次图中各节点的节点表示确定的,预置实体词对应的第二层次图是根据所述预置实体词以及每个所述预置实体词所在的第二文本中的多个主干词构建的,在所述预置实体词对应的第二层次图中同一语句中多个主干词对应的主干节点与所述预置实体词对应的实体节点相连接,所述实体节点代表所述预置实体词。
第二文本可以是电子设备获取到,任何语言格式的文本,第二文本可以是用户输入的、从网络上或本地存储器获取到的文本。
预置实体词可以是第二文本中的主语。一个第二文本对应一个预置实体词,例如,预置实体词包括1000个词,则第二文本包括1000个预置实体词对应的额1000个第二文本。
在本实施例中,可以将第二文本按句子进行划分,得到多个第二文本语句,对于每一个第二文本语句进行主干词的提取,得到该第二文本语句对应的多个主干词,遍历第二文本中全部的第二文本语句,得到全部的主干词。
根据预置实体词对应的第二文本得到预置实体词以及多个主干词之后,将预置实体词作为实体节点,将每个主干词作为一个主干节点,将多个主干词对应的主干节点与实体节点相连接,得到图结构的表示,作为预置实体词对应的第二层次图。如此遍历全部的预置实体词对应的第二文本,得到每个预置实体词各自对应的第二层次图。
作为一种实施方式,确定预置实体词对应的第二层次图的过程可以包括:为预置实体词对应的第二文本中每个主干词构建一个主干节点,并为置实体词对应的第二文本中的预置实体词构建实体节点;根据置实体词对应的第二文本中多个主干词构建中继节点;同一语句中多个主干词对应一个中继节点;将置实体词对应的第二文本中同一语句对应的中继节点以及主干节点相互连接,以及将置实体词对应的第二文本中不同语句对应的中继节点分别与置实体词对应的实体节点进行连接,得到置实体词对应的第二层次图。
将第二文本中每个主干词作为一个节点,构建出第二文本中各主干词各自对应的主干节点,同理,将第二文本中预置实体词作为节点,构建出第二文本中预置实体词对应的实体节点 。
同时,针对于第二文本中的每个第二文本语句,根据该第二文本语句中的各主干词构建一个节点,作为该第二文本语句对应的中继节点。其中,可以根据同一第二文本语句中的各主干词构建一个节点,该节点用于与该语句中的各个主干词对应的主干节点以及该第二文本语句中的预置实体词对应的实体节点分别连接,该构建的节点可以作为该第二文本语句对应的中继节点。
针对每个置实体词对应的第二文本,得到主干节点、中继节点以及实体节点之后,将置实体词对应的第二文本中同一语句对应的中继节点以及主干节点相互连接,以及将置实体词对应的第二文本中不同语句对应的中继节点分别与置实体词对应的实体节点进行连接,得到预置实体词对应的第二层次图。其中,在预置实体词对应的第二层次图中,同一语句的各个主干节点也可以互相连接。
得到每个预置实体词对应的第二层次图之后,可以确定每个预置实体词对应的第二层次图中各节点(包括实体节点、中继节点以及主干节点)的节点表示,然后对每个预置实体词对应的第二层次图中各节点的节点表示进行特征提取,得到每个预置实体词对应的图语义特征。
作为一种实施方式,多个预置实体词中每个预置实体词对应的图语义特征以及各预置实体词所在第二文本对应的文本特征的确定过程可以包括:对预置实体词对应的第二文本进行语义编码,获得预置实体词对应的第二文本对应的编码特征序列;从预置实体词对应的第二文本对应的编码特征序列中获取预置实体词的特征,作为预置实体词对应的实体节点的节点表示;从预置实体词对应的第二文本对应的编码特征序列中获取第二文本中各主干词的特征,作为预置实体词对应的第二层次图中主干词对应的主干节点的节点表示;根据预置实体词对应的第二层次图中每个中继节点对应的多个主干词的主干节点表示,确定预置实体词对应的第二层次图中每个中继节点对应的中继节点表示;从预置实体词对应的第二文本对应的编码特征序列中获取第二文本对应的文本特征。
其中,可以通过预训练的文本编码器预置实体词对应的第二文本进行语义编码,获得第二文本对应的编码特征序列。其中,预训练的文本编码器可以是预训练的bert模型,一个预置实体词可以对应一个文本编码器,所有的预置实体词也可以公用一个文本编码器。其中,此处的文本编码器可以与前述对第一文本处理的文本编码器相同,也可以与前述对第一文本处理的文本编码器不同。
可以通过文本编码器对第二文本中各个词的进行编码,得到第二文本中各个词的特征,第二文本中各个词的特征汇总后得到第二文本对应的编码特征序列。
可选地,获取到的第二文本之后,可以对第二文本的句首添加“cls”字符,得到处理后的第二文本,然后将处理后的第二文本输入文本编码器,得到第二文本对应的编码特征序列。
得到预置实体词对应的第二文本对应的编码特征序列后,直接从预置实体词对应的第二文本对应的编码特征序列中获取预置实体词的特征,作为预置实体词对应的实体节点的节点表示;从预置实体词对应的第二文本对应的编码特征序列中获取第二文本中各主干词的特征,第二层次图中主干词对应的主干节点的节点表示。
可选地,可以对预置实体词对应的第二层次图中每个中继节点所连接的多个主干节点的主干节点表示求平均,得到预置实体词对应的第二层次图中每个中继节点对应的候选节点表示;通过线性层分别对预置实体词对应的第二层次图中每个中继节点对应的候选节点表示进行线性处理,得到预置实体词对应的第二层次图中每个中继节点对应的中继节点表示。
本实施例中,还可获取预置实体词对应的第二文本对应的编码特征序列中第一个特征作为第二文本对应的文本特征。
作为一种实施方式,预置实体词对应的图语义特征的确定过程可以包括:通过图注意力网络,基于预置实体词对应的第二层次图中各节点的节点表示,确定预置实体词对应的图语义特征。
直接通过图注意力网络,基于预置实体词对应的第二层次图中各节点的节点表示以及预置实体词对应的第二层次图中不同节点之间的连接关系,确定预置实体词对应的第二层次图中各节点各自的注意力运算结果,并获取预置实体词对应的实体节点对应的注意力运算结果,作为预置实体词对应的图语义特征。
S140、根据提及词对应的图语义特征、第一文本对应的文本特征、每个预置实体词对应的图语义特征以及每个预置实体词所在的第二文本对应的文本特征,在多个预置实体词中确定提及词链接的目标实体词。
得到提及词对应的图语义特征、第一文本对应的文本特征、每个预置实体词对应的图语义特征以及每个预置实体词所在的第二文本对应的文本特征之后,可以汇总提及词对应的图语义特征以及第一文本对应的文本特征,得到提及词对应的中间特征,同时,汇总每个预置实体词对应的图语义特征以及每个预置实体词所在的第二文本对应的文本特征,得到每个预置实体词对应的中间特征,再根据提及词对应的中间特征以及每个预置实体词对应的中间特征,确定提及词与每个预置实体词之间的匹配度,根据提及词与每个预置实体词之间的匹配度,选择匹配度最高的预置实体词作为提及词链接的目标实体词。
其中,可以是将提及词对应的中间特征以及每个预置实体词对应的中间特征拼接,得到每个预置实体词对应的拼接特征(可以是提及词对应的中间特征拼接在每个预置实体词对应的中间特征之前,也可以是提及词对应的中间特征拼接在每个预置实体词对应的中间特征之后),再将每个预置实体词对应的拼接特征输入线性层,得到提及词与每个预置实体词之间的匹配度。
在一些实施方式中,S140可以包括:对提及词对应的图语义特征以及第一文本对应的文本特征进行融合,得到提及词对应的融合特征;对每个预置实体词对应的图语义特征以及该预置实体词所在的第二文本对应的文本特征进行融合,得到每个预置实体词各自对应的融合特征;将提及词对应的融合特征与每个预置实体词对应的融合特征分别进行融合,得到每个预置实体词各自对应的目标特征;根据多个预置实体词各自对应的目标特征,从多个预置实体词中确定提及词链接的目标实体词。
可以是将提及词对应的图语义特征以及第一文本对应的文本特征进行求和、拼接以及加权求和中的任意一种运算,实现对提及词对应的图语义特征以及第一文本对应的文本特征的融合,得到提及词对应的融合特征。其中,加权求和的权重可以是通过权重网络预测的,权重网络可以是通过样本图语义特征、样本文本特征以及样本图语义特征与样本文本特征的融合结果,对神经网络模型训练得到。
其中,可以任意文本作为样本文本,从样本文本中提取提及词作为样本提及词,根据样本文本中的主干词以及样本提及词,构建层次图,得到样本层次图,再对样本层次图进行特征提取,得到样本图语义特征,并对样本文本进行特征提取,作为样本文本特征,之后可对样本图语义特征与样本文本特征进行融合,得到样本图语义特征与样本文本特征的融合结果。
同理,也可以是对每个预置实体词对应的图语义特征以及该预置实体词所在的第二文本对应的文本特征进行求和、拼接以及加权求和中的任意一种运算,实现对每个预置实体词对应的图语义特征以及该预置实体词所在的第二文本对应的文本特征的融合,得到每个预置实体词各自对应的融合特征。其中,加权求和的权重可以是通过前述权重网络预测的。
在得到每个预置实体词各自对应的融合特征以及提及词对应的融合特征之后,可以直接将提及词对应的融合特征以及每个预置实体词各自对应的融合特征进行拼接,得到每个预置实体词各自对应的目标特征。
最后,可以通过线性层对多个预置实体词各自对应的目标特征进行处理,得到每个预置实体词与提及词之间的预测匹配分数,然后获取预测匹配分数最大值对应的预置实体词作为目标实体词。可以理解的是,预置实体词与提及词之间的预测匹配分数越高,表明该提及词链接到该预置实体词的概率越高。
本实施例的方法可以应用于零样本场景,零样本场景下训练文本编码器的时候使用的实体词与测试的时候使用的实体词没有交集。通过在源域数据(领域 A 的数据)上进行训练,获得特征提取能力较好的文本编码器,并在目标域(与领域A完全不同的领域 B 的数据)中的第一文本以及第二文本进行编码,以进行实体链接,此种情况下,可以基于源域中数据训练的文本编码器,按照本申请的方法,将属于目标域中的第一文本中的提及词进行实体链接。
本实施例中,根据提及词以及所述提及词所在的第一文本中多个主干词,构建第一层次图,并根据第一层次图中各节点的节点表示,确定所述提及词对应的图语义特征,提及词对应的图语义特征可以准确的表示提及词在第一文本的语境下的语义信息,同时,根据多个预置实体词中每个预置实体词以及每个所述预置实体词所在的第二文本中多个主干词,构建每个所述预置实体词对应的第二层次图,根据每个所述预置实体词对应的第二层次图中各节点的节点表示,确定每个所述预置实体词对应的图语义特征,预置实体词对应的图语义特征可以准确的表示预置实体词在所在的第二文本的语境下的语义信息,因此,在根据所述提及词对应的图语义特征、所述第一文本对应的文本特征、每个所述预置实体词对应的图语义特征以及每个所述预置实体词所在的第二文本对应的文本特征,从所述多个预置实体词中确定所述提及词链接的目标实体词过程中,在所述第一文本对应的文本特征以及每个所述预置实体词所在的第二文本对应的文本特征的基础上,引入了提及词对应的图语义特征以及各预置实体词对应的图语义特征,结合提及词对应的图语义特征以及第一文本对应的文本特征有效的增强提及词的语义信息,结合预置实体词对应的图语义特征以及预置实体词对应的第二文本对应的文本特征有效的增强预置实体词的语义信息,从而使得实体链接的准确性较高。
请参阅图5,图5示出了本申请一个实施例提出的一种实体链接方法的流程图,该方法可以应用于电子设备,电子设备可以是图1中的终端20或服务端10,该方法包括:
S210、获取预置实体词各自对应的目标特征。
其中预置实体词各自对应的目标特征的确定过程参照上文S110-S140的描述,此处不再赘述。
S220、根据多个预置实体词各自对应的目标特征,从多个预置实体词中筛选多个候选实体词。
可以根据多个预置实体词各自对应的目标特征,从多个预置实体词中筛选与提及词最接近的多个预置实体词作为候选实体词。
作为一种实施方式,可以通过线性层分别对多个预置实体词各自对应的目标特征进行预测,得到每个预置实体词与提及词的匹配分数;筛选匹配分数达到分数阈值的预置实体词作为候选实体词,或,按照匹配分数由高到低筛选预设数量个预置实体词作为候选实体词。其中,分数阈值以及预设数量均是基于需求设定的值,本申请不做限定。
值得一提的是,在通过线性层分别对多个预置实体词各自对应的目标特征进行预测后,得到多个预置实体词与提及词的匹配分数;还可以继续对多个预置实体词与提及词的匹配分数进行归一化处理,得到多个预置实体词与提及词对应的归一化匹配分数,再之后,可以筛选归一化匹配分数达到分数阈值的预置实体词作为候选实体词,或,按照归一化匹配分数由高到低筛选预设数量个预置实体词作为候选实体词。
S230、将每个候选实体词对应的第二层次图分别与第一层次图进行连接,得到每个候选实体词对应的全局层次图。
针对每个候选实体词,将该候选实体词对应的第二层次图分别与第一层次图进行连接,得到一个层次图,作为该候选实体词对应的全局层次图。
作为一种实施方式,如前述内容,提及词对应的第一层次图包括中继节点,候选实体词对应的第二层次图也包括中继节点;S230可以包括:针对每个候选实体词构建全局节点;基于第一层次图中各节点的节点表示和各候选实体词所对应第二层次图中各节点的节点表示,确定所述全局节点的节点表示;将所述第一层次图中各中继节点以及所述候选实体词对应的第二层次图中各中继节点,分别与所述全局节点连接,并将所述全局节点对应的节点表示与所述全局节点进行关联,得到所述候选实体词对应的全局层次图。其中,全局节点可以是空白字符。
如图6所示,提及词M对应的第一层次图为601,第一层次图601包括主干节点s1、主干节点s2、主干节点p1、主干节点p2、主干节点o1、主干节点o2以及提及节点m1,其中,主干节点s1对应的主干词、主干节点p1对应的主干词和主干节点o1对应的主干词位于第一文本中同一个语句,主干节点s2对应的主干词、主干节点p2对应的主干词和主干节点o2对应的主干词位于第一文本中另一个语句。第一层次图601包括s1、p1以及o1对应的中继节点t1,第一层次图601还包括中s2、p2以及o2对应的中继节点t2。候选实体词E对应的第二层次图为602,第二层次图602包括主干节点s3、主干节点s4主干节点、主干节点p3、主干节点p4、主干节点o3、主干节点o4以及实体节点e1,其中,其中,主干节点s3对应的主干词、主干节点p3对应的主干词和主干节点o3对应的主干词位于第二文本中同一个语句,主干节点s4对应的主干词、主干节点p4对应的主干词和主干节点o4对应的主干词位于第二文本中另一个语句。第二层次图602包括中s3、p3以及o3对应的中继节点t3,第二层次图602还包括中s4、p4以及o4对应的中继节点t4。此时,构建全局节点g,并将t1、t2、t3以及t4分别与全局节点g连接,得到候选实体词E对应的全局层次图。
针对每个候选实体词对应的全局节点,可以直接获取第一层次图中各节点的节点表示和该候选实体词所对应第二层次图中各节点的节点表示,并对第一层次图中各节点的节点表示和该候选实体词所对应第二层次图中各节点的节点表示求平均,得到候选实体词所对应全局层次图中全局节点对应的全局候选表示,然后通过线性层对候选实体词所对应全局层次图中全局节点对应的全局候选表示进行处理,得到候选实体词对应的全局层次图中的全局节点的全局节点表示。
S240、根据每个候选实体词对应的全局层次图中各节点的节点表示,确定每个候选实体词与提及词之间的第一预测匹配分数。
得到每个候选实体词对应的全局层次图,根据每个候选实体词对应的全局层次图所表达的语义信息,确定每个候选实体词与提及词之间的第一预测匹配分数。
作为一种实施方式,S240可以包括:得到每个候选实体词对应的全局层次图之后,可以对每个候选实体词对应的全局层次图进行特征提取,得到每个候选实体词对应的全局特征,在之后可通过线性层对每个候选实体词对应的全局特征分别进行分数预测,得到每个候选实体词与提及词之间的第一预测匹配分数。
作为又一种实施方式,如前述可知,候选实体词对应的全局层次图包括提及词对应的提及节点以及候选实体词对应的实体节点;S240可以包括:在每个候选实体词对应的全局层次图中确定通过所述全局节点的路径,作为所述候选实体词对应的目标路径;所述目标路径以所述候选实体词对应的全局层次图中所述提及词对应的提及节点为起点,且以所述候选实体词对应的实体节点为终点;通过图神经网络基于所述候选实体词对应的目标路径中各节点的节点表示进行评分,得到所述候选实体词对应的每个目标路径各自的路径分数;从所述候选实体词对应的目标路径中获取最大路径分数,作为所述候选实体词与所述提及词之间的第一预测匹配分数。
如前述的全局层次图的结构可知,对于每个候选实体词,构建的目标路径除经过提及词对应的提及节点以及该候选实体词对应的实体节点之外,必然还经过全局节点以及中继节点。可选地,对于每个候选实体词,构建的目标路径除经过提及词对应的提及节点、该候选实体词对应的实体节点以及中继节点外,目标路径还可以经过至少一个主干节点。
例如,图6所示的全局层次图,确定的目标路径经过主干节点时,目标路径可以为m1-t1-g-t4-e1,目标路径也可以为m1-t1-g-t3-e1。确定的目标路径为经过主干节点时,目标路径可以为m1-t1-o1-p1-s1-t1-g-t4-s4-p4-o4-t4-e1,标路径也可以为m1-t1-o1-p1-s1-t1-g- t3-s3-p3-o3-t3-e1。
在一些实施方式中,构建的第一层次图可以不具有中继节点,即,第一层次图中各个主干节点可以直接与提及节点连接,且同一语句中的主干词对应的主干节点可以相互链接。同理,构建的第二层次图也可以不具有中继节点,即,第二层次图中各个主干节点可以直接与实体节点链接,且同一语句中的主干词对应的主干节点可以相互连接。此时,将第一层次图以及候选实体词对应的第二层次图连接后,得到候选实体词对应的全局层次图,根据该候选实体词对应的全局层次图确定出的目标路径此时可以不经过中继节点,也即,候选实体词对应的目标路径以候选实体词对应的第二层次图中提及节点为起点、实体节点为终点、经过全局节点,此时,候选实体词对应的目标路径还可以经过候选实体词对应的第二层次图中的至少一个主干节点。
针对每个候选实体词,可以通过图神经网络(例如可以是指GraphSAGE)基于候选实体词下每个目标路径中各节点的节点表示以及目标路径中各节点之间的连接关系,得到候选实体词下每个目标路径对应的路径特征,在通过线性层对候选实体词下每个目标路径对应的路径特征进行运算,得到候选实体词下每个目标路径对应的初始评分,之后,可以对候选实体词下每个目标路径对应的初始评分进行归一化处理,得到候选实体词下每个目标路径对应的路径分数。
得到候选实体词下每个目标路径对应的路径分数之后,从候选实体词对应的目标路径中获取最大路径分数,作为候选实体词与提及词之间的第一预测匹配分数。如此遍历全部的候选实体词,得到全部候选实体词与提及词之间的第一预测匹配分数。
S250、根据每个候选实体词对应的第二文本以及第一文本的联合语义编码结果,确定每个候选实体词与提及词对应的第二预测匹配分数。
针对每个候选实体词,可以将提及词对应的第一文本与候选实体词对应的第二文本进行拼接,得到每个候选实体词对应的拼接文本,之后可以通过编码器(例如可以是预训练的Cross-Encoder,预训练的Cross-Encoder具有一定的特征提取能力)对候选实体词对应的拼接文本进行处理,得到候选实体词对应的第二文本以及提及词对应的第一文本的联合语义编码结果,再之后,可以通过线性层对候选实体词对应的第二文本以及提及词对应的第一文本的联合语义编码结果进行处理,得到候选实体词与提及词对应的初始预测匹配分数,并对候选实体词与提及词对应的初始预测匹配分数进行归一化处理,得到候选实体词与提及词对应的第二预测匹配分数。
其中,可以直接将提及词对应的第一文本的句首与候选实体词对应的第二文本的句尾进行拼接,得到候选实体词对应的拼接文本,也可以直接将提及词对应的第一文本的句尾与候选实体词对应的第二文本的句首进行拼接,得到候选实体词对应的拼接文本。
S260、根据每个候选实体词与提及词对应的第一匹配预测分数以及第二预测匹配分数,从多个候选实体词中确定提及词链接的目标实体词。
确定每个候选实体词与提及词对应的第一预测分数以及第二预测分数之后,可以对每个候选实体词与提及词对应的第一预测分数以及第二预测分数求和,得到每个候选实体词对应的目标预测分数,并获取目标预测分数最大的候选实体词作为目标实体词。
本实施例中,针对实体消歧阶段(也就是前述确定多个候选实体词的阶段)句向量语义表示不准的问题,通过构建层次图的方式来捕捉更细粒度的特征,得到图语义特征,图语义特征可以准确的表示词(包括提及词以及预置实体词)在所在文本的语境下的语义信息,在基于文本的文本特征的基础上,引入了词的图语义特征,结合词的图语义特征以及词所在文本的文本特征可以准确的表示句向量语义,增强了词的语义信息的,从而使得确定出的候选实体词的准确率提高,进而提高了确定出的目标实体词的准确率。
同时,针对实体排序阶段(也就是确定每个候选实体词与提及词对应的第二预测分数)存在缺乏推理能力的部分,将提及词与候选实体词对应的层次图拼接,构造全局层次图,并通过全局图中的目标路径来确定每个候选实体词与提及词对应的第一预测分数,结合每个候选实体词与提及词对应的第一预测分数以及第二预测分数,对实体排序阶段注入推理能力,即在每个候选实体词对应的全局层次图中确定多条目标路径,并基于多条目标路径来确定该候选实体词与提及词之间的第一匹配预测分数的过程即为对实体排序阶段注入推理能力的过程,使得筛选出的目标实体词的准确率进一步提升。
请参阅图7,图7示出了本申请再一个实施例提出的一种实体链接方法的流程图,该方法可以应用于电子设备,电子设备可以是图1中的终端20或服务端10,该方法包括:
S310、获取预置实体词各自对应的目标特征。
其中预置实体词各自对应的目标特征的确定过程参照上文S110-S140的描述,此处不再赘述。
S320、根据多个预置实体词各自对应的目标特征,从多个预置实体词中筛选多个候选实体词。
S330、将每个候选实体词对应的第二层次图分别与第一层次图进行连接,得到每个候选实体词对应的全局层次图;根据每个候选实体词对应的全局层次图中各节点的节点表示,确定每个候选实体词与提及词之间的第一预测匹配分数。
其中,S320-S330的描述参照上文S230-S240的描述,此处不再赘述。
S340、根据每个候选实体词与提及词对应的第一预测匹配分数,从多个候选实体词中确定提及词链接的目标实体词。
确定每个候选实体词与提及词对应的第一预测分数之后,可以直接获取第一预测分数最大的候选实体词作为目标实体词。
本实施例中,针对实体排序阶段(也就是确定每个候选实体词与提及词对应的第二预测分数)存在缺乏推理能力的部分,将提及词与候选实体词对应的层次图拼接,构造全局层次图,并通过全局图中的目标路径来确定每个候选实体词与提及词对应的第一预测分数,结合每个候选实体词与提及词对应的第一预测分数以及第二预测分数,对实体排序阶段注入推理能力,即在每个候选实体词对应的全局层次图中确定多条目标路径,并基于多条目标路径来确定该候选实体词与提及词之间的第一匹配预测分数的过程即为对实体排序阶段注入推理能力的过程,使得筛选出的目标实体词的准确率提升。
请参阅图8,图8示出了本申请一个实施例提出的一种实体链接装置的框图,装置700包括:
构建模块710,用于根据提及词以及提及词所在的第一文本中多个主干词,构建第一层次图;在第一层次图中同一语句中多个主干词对应的主干节点与提及节点相连接,提及节点代表提及词,一个主干节点代表一个主干词;
确定模块720,用于根据第一层次图中各节点的节点表示,确定提及词对应的图语义特征;
获取模块730,用于获取多个预置实体词中每个预置实体词对应的图语义特征以及各预置实体词所在第二文本对应的文本特征,预置实体词对应的图语义特征是根据预置实体词对应的第二层次图中各节点的节点表示确定的,预置实体词对应的第二层次图是根据预置实体词以及每个预置实体词所在的第二文本中的多个主干词构建的,在预置实体词对应的第二层次图中同一语句中多个主干词对应的主干节点与预置实体词对应的实体节点相连接,实体节点代表预置实体词;
词确定模块740,用于根据提及词对应的图语义特征、第一文本对应的文本特征、每个预置实体词对应的图语义特征以及每个预置实体词所在的第二文本对应的文本特征,在多个预置实体词中确定提及词链接的目标实体词。
可选地,构建模块710,还用于为第一文本中每个主干词构建一个主干节点,并为提及词构建提及节点;根据第一文本中多个主干词构建中继节点;同一语句中多个主干词对应一个中继节点;将第一文本中同一语句对应的中继节点以及主干节点相互连接,以及将第一文本中不同语句对应的中继节点分别与提及节点进行连接,得到第一层次图。
可选地,确定模块720,还用于对第一文本进行语义编码,获得第一文本对应的编码特征序列;从第一文本对应的编码特征序列中获取提及词的特征,作为提及节点的节点表示;从第一文本对应的编码特征序列中获取第一文本中各主干词的特征,作为第一层次图中主干词对应的主干节点的节点表示;根据第一层次图中每个中继节点对应的多个主干词的主干节点表示,确定第一层次图中每个中继节点对应的中继节点表示;从第一文本对应的编码特征序列中获取第一文本对应的文本特征。
可选地,确定模块730,还用于对第一层次图中每个中继节点所连接多个主干节点的主干节点表示求平均,得到第一层次图中每个中继节点对应的候选节点表示;对第一层次图中每个中继节点对应的候选节点表示进行线性处理,得到第一层次图中每个中继节点对应的中继节点表示。
可选地,词确定模块740,还用于对提及词对应的图语义特征以及第一文本对应的文本特征进行融合,得到提及词对应的融合特征;对每个预置实体词对应的图语义特征以及该预置实体词所在的第二文本对应的文本特征进行融合,得到每个预置实体词各自对应的融合特征;将提及词对应的融合特征与每个预置实体词对应的融合特征分别进行融合,得到每个预置实体词各自对应的目标特征;根据多个预置实体词各自对应的目标特征,从多个预置实体词中确定提及词链接的目标实体词。
可选地,词确定模块740,还用于根据多个预置实体词各自对应的目标特征,从多个预置实体词中筛选多个候选实体词;将每个候选实体词对应的第二层次图分别与第一层次图进行连接,得到每个候选实体词对应的全局层次图;根据每个候选实体词对应的全局层次图中各节点的节点表示,确定每个候选实体词与提及词之间的第一预测匹配分数;根据每个候选实体词对应的第二文本以及第一文本的联合语义编码结果,确定每个候选实体词与提及词对应的第二预测匹配分数;根据每个候选实体词与提及词对应的第一匹配预测分数以及第二预测匹配分数,从多个候选实体词中确定提及词链接的目标实体词。
可选地,词确定模块740,还用于通过线性层分别对多个预置实体词各自对应的目标特征进行预测,得到每个预置实体词与提及词的匹配分数;筛选匹配分数达到分数阈值的预置实体词作为候选实体词,或,按照匹配分数由高到低筛选预设数量个预置实体词作为候选实体词。
可选地,词确定模块740,还用于构针对每个候选实体词构建全局节点;基于第一层次图中各节点的节点表示和各候选实体词所对应第二层次图中各节点的节点表示,确定全局节点的节点表示;将第一层次图中各中继节点以及候选实体词对应的第二层次图中各中继节点,分别与全局节点连接,并将全局节点对应的节点表示与全局节点进行关联,得到候选实体词对应的全局层次图。
可选地,词确定模块740,还用于在每个候选实体词对应的全局层次图中确定通过全局节点的路径,作为候选实体词对应的目标路径;目标路径以候选实体词对应的全局层次图中提及词对应的提及节点为起点,且以候选实体词对应的实体节点为终点;通过图神经网络基于候选实体词对应的目标路径中各节点的节点表示进行评分,得到候选实体词对应的每个目标路径各自的路径分数;从候选实体词对应的目标路径中获取最大路径分数,作为候选实体词与提及词之间的第一预测匹配分数。
可选地,词确定模块740,还用于根据每个候选实体词与提及词对应的第一匹配预测分数以及第二预测匹配分数,得到每个候选实体词与提及词对应的目标预测分数;获取目标预测分数最大值所对应的候选实体词作为提及词链接的目标实体词。
可选地,确定模块720,还用于通过图注意力网络,基于第一层次图中各节点的节点表示,确定提及词对应的图语义特征。
需要说明的是,本申请中装置实施例与前述方法实施例是相互对应的,装置实施例中具体的原理可以参见前述方法实施例中的内容,此处不再赘述。
图9示出了用于执行根据本申请实施例的实体链接方法的电子设备的结构框图。该电子设备可以是图1中的终端20或服务端10等,需要说明的是,图9示出的电子设备的计算机系统1200仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图9所示,计算机系统1200包括中央处理单元(Central Processing Unit,CPU)1201,其可以根据存储在只读存储器(Read-Only Memory,ROM)1202中的程序或者从存储部分1208加载到随机访问存储器(Random Access Memory,RAM)1203中的程序而执行各种适当的动作和处理,例如执行上述实施例中的方法。在RAM 1203中,还存储有系统操作所需的各种程序和数据。CPU1201、ROM1202以及RAM 1203通过总线1204彼此相连。输入/输出(Input/Output,I/O)接口1205也连接至总线1204。
以下部件连接至I/O接口1205:包括键盘、鼠标等的输入部分1206;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分1207;包括硬盘等的存储部分1208;以及包括诸如LAN(Local AreaNetwork,局域网)卡、调制解调器等的网络接口卡的通信部分1209。通信部分1209经由诸如因特网的网络执行通信处理。驱动器1210也根据需要连接至I/O接口1205。可拆卸介质1211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1210上,以使于从其上读出的计算机程序根据需要被安装入存储部分1208。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1209从网络上被下载和安装,和/或从可拆卸介质1211被安装。在该计算机程序被中央处理单元(CPU)1201执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读存储介质承载计算机可读指令,当该计算机可读存储指令被处理器执行时,实现上述任一实施例中的方法。
根据本申请实施例的一个方面,提供了计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该电子设备执行上述任一实施例中的方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台电子设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本申请实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的实施方式后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (14)
1.一种实体链接方法,其特征在于,所述方法包括:
根据提及词以及所述提及词所在的第一文本中多个主干词,构建第一层次图;在所述第一层次图中同一语句中多个主干词对应的主干节点与提及节点相连接,所述提及节点代表所述提及词,一个主干节点代表一个主干词;
根据所述第一层次图中各节点的节点表示,确定所述提及词对应的图语义特征;
获取多个预置实体词中每个预置实体词对应的图语义特征以及各预置实体词所在第二文本对应的文本特征,所述预置实体词对应的图语义特征是根据所述预置实体词对应的第二层次图中各节点的节点表示确定的,预置实体词对应的第二层次图是根据所述预置实体词以及每个所述预置实体词所在的第二文本中的多个主干词构建的,在所述预置实体词对应的第二层次图中同一语句中多个主干词对应的主干节点与所述预置实体词对应的实体节点相连接,所述实体节点代表所述预置实体词;
根据所述提及词对应的图语义特征、所述第一文本对应的文本特征、每个所述预置实体词对应的图语义特征以及每个所述预置实体词所在的第二文本对应的文本特征,在所述多个预置实体词中确定所述提及词链接的目标实体词。
2.根据权利要求1所述的方法,其特征在于,所述根据提及词以及所述提及词所在的第一文本中多个主干词,构建第一层次图,包括:
为所述第一文本中每个主干词构建一个主干节点,并为所述提及词构建提及节点;
根据所述第一文本中多个主干词构建中继节点;同一语句中多个主干词对应一个中继节点;
将所述第一文本中同一语句对应的中继节点以及主干节点相互连接,以及将所述第一文本中不同语句对应的中继节点分别与所述提及节点进行连接,得到第一层次图。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一层次图中各节点的节点表示,确定所述提及词对应的图语义特征之前,所述方法还包括:
对所述第一文本进行语义编码,获得所述第一文本对应的编码特征序列;
从所述第一文本对应的编码特征序列中获取所述提及词的特征,作为所述提及节点的节点表示;
从所述第一文本对应的编码特征序列中获取所述第一文本中各主干词的特征,作为所述第一层次图中主干词对应的主干节点的节点表示;
根据所述第一层次图中每个中继节点对应的多个主干词的主干节点表示,确定所述第一层次图中每个中继节点对应的中继节点表示;
从所述第一文本对应的编码特征序列中获取第一文本对应的文本特征。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一层次图中每个中继节点对应的多个主干词的主干节点表示,确定所述第一层次图中每个中继节点对应的中继节点表示,包括:
对所述第一层次图中每个中继节点所连接多个主干节点的主干节点表示求平均,得到所述第一层次图中每个中继节点对应的候选节点表示;
对所述第一层次图中每个中继节点对应的候选节点表示进行线性处理,得到所述第一层次图中每个中继节点对应的中继节点表示。
5.根据权利要求1所述的方法,其特征在于,所述根据所述提及词对应的图语义特征、所述第一文本对应的文本特征、每个所述预置实体词对应的图语义特征以及每个所述预置实体词所在的第二文本对应的文本特征,在所述多个预置实体词中确定所述提及词链接的目标实体词,包括:
对所述提及词对应的图语义特征以及所述第一文本对应的文本特征进行融合,得到所述提及词对应的融合特征;
对每个所述预置实体词对应的图语义特征以及该预置实体词所在的第二文本对应的文本特征进行融合,得到每个所述预置实体词各自对应的融合特征;
将所述提及词对应的融合特征与每个所述预置实体词对应的融合特征分别进行融合,得到每个所述预置实体词各自对应的目标特征;
根据所述多个预置实体词各自对应的目标特征,从所述多个预置实体词中确定所述提及词链接的目标实体词。
6.根据权利要求5所述的方法,其特征在于,所述根据所述多个预置实体词各自对应的目标特征,从所述多个预置实体词中确定所述提及词链接的目标实体词,包括:
根据所述多个预置实体词各自对应的目标特征,从所述多个预置实体词中筛选多个候选实体词;
将每个所述候选实体词对应的第二层次图分别与所述第一层次图进行连接,得到每个所述候选实体词对应的全局层次图;
根据每个所述候选实体词对应的全局层次图中各节点的节点表示,确定每个所述候选实体词与所述提及词之间的第一预测匹配分数;
根据所述每个所述候选实体词对应的第二文本以及所述第一文本的联合语义编码结果,确定每个所述候选实体词与所述提及词对应的第二预测匹配分数;
根据每个所述候选实体词与所述提及词对应的第一匹配预测分数以及第二预测匹配分数,从所述多个候选实体词中确定所述提及词链接的目标实体词。
7.根据权利要求6所述的方法,其特征在于,所述根据所述多个预置实体词各自对应的目标特征,从所述多个预置实体词中筛选多个候选实体词,包括:
通过线性层分别对所述多个预置实体词各自对应的目标特征进行预测,得到每个所述预置实体词与所述提及词的匹配分数;
筛选匹配分数达到分数阈值的预置实体词作为候选实体词,或,按照匹配分数由高到低筛选预设数量个预置实体词作为候选实体词。
8.根据权利要求6所述的方法,其特征在于,所述将每个所述候选实体词对应的第二层次图分别与所述第一层次图进行连接,得到每个所述候选实体词对应的全局层次图,包括:
针对每个候选实体词构建全局节点;
基于第一层次图中各节点的节点表示和各候选实体词所对应第二层次图中各节点的节点表示,确定所述全局节点的节点表示;
将所述第一层次图中各中继节点以及所述候选实体词对应的第二层次图中各中继节点,分别与所述全局节点连接,并将所述全局节点对应的节点表示与所述全局节点进行关联,得到所述候选实体词对应的全局层次图。
9.根据权利要求8所述的方法,其特征在于,所述根据每个所述候选实体词对应的全局层次图,确定每个所述候选实体词与所述提及词之间的第一预测匹配分数,包括:
在每个候选实体词对应的全局层次图中确定通过所述全局节点的路径,作为所述候选实体词对应的目标路径;所述目标路径以所述候选实体词对应的全局层次图中所述提及词对应的提及节点为起点,且以所述候选实体词对应的实体节点为终点;
通过图神经网络基于所述候选实体词对应的目标路径中各节点的节点表示进行评分,得到所述候选实体词对应的每个目标路径各自的路径分数;
从所述候选实体词对应的目标路径中获取最大路径分数,作为所述候选实体词与所述提及词之间的第一预测匹配分数。
10.根据权利要求6所述的方法,其特征在于,所述根据每个所述候选实体词与所述提及词对应的第一匹配预测分数以及第二预测匹配分数,从所述多个候选实体词中确定所述提及词链接的目标实体词,包括:
根据每个所述候选实体词与所述提及词对应的第一匹配预测分数以及第二预测匹配分数,得到每个所述候选实体词与所述提及词对应的目标预测分数;
获取目标预测分数最大值所对应的候选实体词作为所述提及词链接的目标实体词。
11.根据权利要求1所述的方法,其特征在于,所述根据所述第一层次图中各节点的节点表示,确定所述提及词对应的图语义特征,包括:
通过图注意力网络,基于所述第一层次图中各节点的节点表示,确定所述提及词的图语义特征。
12.一种实体链接装置,其特征在于,所述装置包括:
构建模块,用于根据提及词以及所述提及词所在的第一文本中多个主干词,构建第一层次图;在所述第一层次图中同一语句中多个主干词对应的主干节点与提及节点相连接,所述提及节点代表所述提及词,一个主干节点代表一个主干词;
确定模块,用于根据所述第一层次图中各节点的节点表示,确定所述提及词对应的图语义特征;
获取模块,用于获取多个预置实体词中每个预置实体词对应的图语义特征以及各预置实体词所在第二文本对应的文本特征,所述预置实体词对应的图语义特征是根据所述预置实体词对应的第二层次图中各节点的节点表示确定的,预置实体词对应的第二层次图是根据所述预置实体词以及每个所述预置实体词所在的第二文本中的多个主干词构建的,在所述预置实体词对应的第二层次图中同一语句中多个主干词对应的主干节点与所述预置实体词对应的实体节点相连接,所述实体节点代表所述预置实体词;
词确定模块,用于根据所述提及词对应的图语义特征、所述第一文本对应的文本特征、每个所述预置实体词对应的图语义特征以及每个所述预置实体词所在的第二文本对应的文本特征,在所述多个预置实体词中确定所述提及词链接的目标实体词。
13.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器;所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如权利要求1-11中任一项所述的方法。
14.一种计算机可读取存储介质,其特征在于,所述计算机可读取存储介质中存储有计算机可读指令,当所述计算机可读指令被处理器执行时,实现如权利要求1-11中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311375901.4A CN117113993B (zh) | 2023-10-23 | 2023-10-23 | 实体链接方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311375901.4A CN117113993B (zh) | 2023-10-23 | 2023-10-23 | 实体链接方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117113993A CN117113993A (zh) | 2023-11-24 |
CN117113993B true CN117113993B (zh) | 2024-01-09 |
Family
ID=88795090
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311375901.4A Active CN117113993B (zh) | 2023-10-23 | 2023-10-23 | 实体链接方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117113993B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110569496A (zh) * | 2018-06-06 | 2019-12-13 | 腾讯科技(深圳)有限公司 | 实体链接方法、装置及存储介质 |
CN112507715A (zh) * | 2020-11-30 | 2021-03-16 | 北京百度网讯科技有限公司 | 确定实体之间关联关系的方法、装置、设备和存储介质 |
CN113220835A (zh) * | 2021-05-08 | 2021-08-06 | 北京百度网讯科技有限公司 | 文本信息处理方法、装置、电子设备以及存储介质 |
CN113626613A (zh) * | 2021-08-18 | 2021-11-09 | 中山大学附属第一医院 | 基于融入知识图谱子图信息及实体信息的实体链接方法 |
CN116451700A (zh) * | 2023-03-02 | 2023-07-18 | 京东科技信息技术有限公司 | 目标语句生成方法、装置、设备及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111522994B (zh) * | 2020-04-15 | 2023-08-01 | 北京百度网讯科技有限公司 | 用于生成信息的方法和装置 |
US11669680B2 (en) * | 2021-02-02 | 2023-06-06 | International Business Machines Corporation | Automated graph based information extraction |
-
2023
- 2023-10-23 CN CN202311375901.4A patent/CN117113993B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110569496A (zh) * | 2018-06-06 | 2019-12-13 | 腾讯科技(深圳)有限公司 | 实体链接方法、装置及存储介质 |
CN112507715A (zh) * | 2020-11-30 | 2021-03-16 | 北京百度网讯科技有限公司 | 确定实体之间关联关系的方法、装置、设备和存储介质 |
CN113220835A (zh) * | 2021-05-08 | 2021-08-06 | 北京百度网讯科技有限公司 | 文本信息处理方法、装置、电子设备以及存储介质 |
CN113626613A (zh) * | 2021-08-18 | 2021-11-09 | 中山大学附属第一医院 | 基于融入知识图谱子图信息及实体信息的实体链接方法 |
CN116451700A (zh) * | 2023-03-02 | 2023-07-18 | 京东科技信息技术有限公司 | 目标语句生成方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN117113993A (zh) | 2023-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11501182B2 (en) | Method and apparatus for generating model | |
US11748232B2 (en) | System for discovering semantic relationships in computer programs | |
CN111046275B (zh) | 基于人工智能的用户标签确定方法及装置、存储介质 | |
CN110795944A (zh) | 推荐内容处理方法及装置、情感属性确定方法及装置 | |
CN113704460B (zh) | 一种文本分类方法、装置、电子设备和存储介质 | |
CN112100332A (zh) | 词嵌入表示学习方法及装置、文本召回方法及装置 | |
CN113779225B (zh) | 实体链接模型的训练方法、实体链接方法及装置 | |
CN116127080A (zh) | 描述对象的属性值提取方法及相关设备 | |
CN110852066A (zh) | 一种基于对抗训练机制的多语言实体关系抽取方法及系统 | |
CN115186085A (zh) | 回复内容处理方法以及媒体内容互动内容的交互方法 | |
CN118014086A (zh) | 数据处理方法、装置、设备、存储介质及产品 | |
CN114330704A (zh) | 语句生成模型更新方法、装置、计算机设备和存储介质 | |
CN114330483A (zh) | 数据处理方法及模型训练方法、装置、设备、存储介质 | |
CN113705207A (zh) | 语法错误识别方法及装置 | |
CN116644180A (zh) | 文本匹配模型的训练方法、训练系统和文本标签确定方法 | |
CN117113993B (zh) | 实体链接方法、装置、电子设备及存储介质 | |
Cao et al. | Dual‐Channel Reasoning Model for Complex Question Answering | |
CN115688792A (zh) | 基于文档的问题生成方法、装置及服务器 | |
CN115129849A (zh) | 题目表示的获取方法、设备以及计算机可读存储介质 | |
CN113591493B (zh) | 翻译模型的训练方法及翻译模型的装置 | |
CN117034133A (zh) | 一种数据处理方法、装置、设备和介质 | |
CN117235271A (zh) | 信息抽取方法、装置、计算机存储介质及电子设备 | |
CN113869518A (zh) | 视觉常识推理方法、装置、电子设备及存储介质 | |
CN112749553A (zh) | 视频文件的文本信息处理方法、装置和服务器 | |
CN117473038A (zh) | 实体推荐方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |