CN113743104A - 实体链接方法及相关装置、电子设备、存储介质 - Google Patents

实体链接方法及相关装置、电子设备、存储介质 Download PDF

Info

Publication number
CN113743104A
CN113743104A CN202111015856.2A CN202111015856A CN113743104A CN 113743104 A CN113743104 A CN 113743104A CN 202111015856 A CN202111015856 A CN 202111015856A CN 113743104 A CN113743104 A CN 113743104A
Authority
CN
China
Prior art keywords
entity
target
semantic
entities
linked
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111015856.2A
Other languages
English (en)
Other versions
CN113743104B (zh
Inventor
李直旭
支洪平
郑新
邓子恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Intelligent Voice Innovation Development Co ltd
Iflytek Suzhou Technology Co Ltd
Original Assignee
Hefei Intelligent Voice Innovation Development Co ltd
Iflytek Suzhou Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei Intelligent Voice Innovation Development Co ltd, Iflytek Suzhou Technology Co Ltd filed Critical Hefei Intelligent Voice Innovation Development Co ltd
Priority to CN202111015856.2A priority Critical patent/CN113743104B/zh
Publication of CN113743104A publication Critical patent/CN113743104A/zh
Application granted granted Critical
Publication of CN113743104B publication Critical patent/CN113743104B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种实体链接方法及相关装置、电子设备、存储介质,其中,实体链接方法包括:获取若干第一实体各自已链接的目标实体,并获取第二实体待链接的候选实体;其中,第一实体和第二实体来自相同篇章文本;基于目标实体之间的语义关系,提取得到各个目标实体的第一语义表示;基于各个第一语义表示,得到篇章文本的文本语义表示;基于文本语义表示和各个候选实体的第二语义表示,选择候选实体链接为第二实体的目标实体。上述方案,能够提升实体链接的准确性。

Description

实体链接方法及相关装置、电子设备、存储介质
技术领域
本申请涉及自然语言处理技术领域,特别是涉及一种实体链接方法及相关装置、电子设备、存储介质。
背景技术
随着信息技术的发展,海量文本夜以继日地不断产生。通常来说,文本中会包含诸如人名、地名、组织名等命名实体。为了理解文本内涵,需要对文本中命名实体进行有效链接,以辅助理解各个命名实体。
现实场景中,命名实体可能存在多种含义,如苹果既可能指代科技公司,也可能指代水果,由此可见,实体指代的歧义,将直接影响实体链接的准确性。有鉴于此,如何提升实体链接的准确性成为亟待解决的问题。
发明内容
本申请主要解决的技术问题是提供一种实体链接方法及相关装置、电子设备、存储介质,能够提升实体链接的准确性。
为了解决上述技术问题,本申请第一方面提供了一种实体链接方法,包括:获取若干第一实体各自已链接的目标实体,并获取第二实体待链接的候选实体;其中,第一实体和第二实体来自相同篇章文本;基于目标实体之间的语义关系,提取得到各个目标实体的第一语义表示;基于各个第一语义表示,得到篇章文本的文本语义表示;基于文本语义表示和各个候选实体的第二语义表示,选择候选实体链接为第二实体的目标实体。
为了解决上述技术问题,本申请第二方面提供了一种实体链接装置,包括实体获取模块、实体表示模块、文本表示模块和目标选择模块,实体获取模块,用于获取若干第一实体各自已链接的目标实体,并获取第二实体待链接的候选实体;其中,第一实体和第二实体来自相同篇章文本;实体表示模块,用于基于目标实体之间的语义关系,提取得到各个目标实体的第一语义表示;文本表示模块,用于基于各个第一语义表示,得到篇章文本的文本语义表示;目标选择模块,用于基于文本语义和各个候选实体的第二语义表示,选择候选实体链接为第二实体的目标实体。
为了解决上述技术问题,本申请第三方面提供了一种电子设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的实体链接方法。
为了解决上述技术问题,本申请第四方面提供了一种计算机可读存储介质,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面中的实体链接方法。
上述方案,获取若干第一实体各自已链接的目标实体,并获取第二实体待链接的候选实体,且第一实体和第二实体来自于相同篇章文本,再基于目标实体之间的语义关系,提取得到各个目标实体的第一语义表示,并基于各个第一语义表示,得到篇章文本的文本语义表示,在此基础上,再基于文本语义表示和各个候选实体的第二语义表示,选择候选实体链接为第二实体的目标实体,由于各个目标实体是篇章文本中各个第一实体已链接的实体,即各个目标实体不存在歧义,而目标实体的第一语义表示又是基于目标实体之间的语义关系得到的,从而在提取各个目标实体的第一语义表示时能够参考到与其具有语义关系的其他目标实体,进而能够捕获实体间的关联性并引入潜在的主题相关性,以丰富消歧特征,在此基础上再基于各个第一语义表示来得到文本语义表示,有利于提升文本语义表示的准确性,从而能够基于文本语义表示和各个候选实体的第二语义表示准确地选择到第二实体的目标实体,进而能够提升实体链接的准确性。
附图说明
图1是本申请实体链接方法一实施例的流程示意图;
图2是图1中步骤S12一实施例的流程示意图;
图3是提取第一语义表示一实施例的过程示意图;
图4是图1中步骤S13一实施例的流程示意图;
图5是获取文本语义表示一实施例的过程示意图;
图6是本申请实体链接方法另一实施例的流程示意图;
图7是本申请实体链接装置一实施例的框架示意图;
图8是本申请电子设备一实施例的框架示意图;
图9是本申请计算机可读存储介质一实施例的框架示意图。
具体实施方式
下面结合说明书附图,对本申请实施例的方案进行详细说明。
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。
本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
请参阅图1,图1是本申请实体链接方法一实施例的流程示意图。具体而言,可以包括如下步骤:
步骤S11:获取若干第一实体各自已链接的目标实体,并获取第二实体待链接的候选实体。
本公开实施例中,第一实体和第二实体来自相同篇章文本。具体地,篇章文本中可以含有若干待链接实体等待链接到目标实体,也就是说,第一实体表示已经链接到目标实体的待链接实体,而第二实体表示尚未链接到目标实体的待链接实体。以篇章文本“乔布斯等人于1976年在美国加利福尼亚州创立了苹果”为例,其中包含如下待链接实体:“乔布斯”、“美国”、“加利福尼亚州”、“苹果”,待链接实体“乔布斯”已经链接到目标实体(即指代苹果公司联合创始人的“史蒂夫乔布斯”),待链接实体“美国”已经链接到目标实体(即指代国家“美利坚合众国”),且待链接实体“加利福尼亚州”已经链接到目标实体(即指代美国西部行政州“加利福尼亚州”),而待链接实体“苹果”尚在等待链接到目标实体,故可以将上述待链接实体“乔布斯”、待链接实体“美国”、待链接实体“加利福尼亚州”分别作为第一实体,并将上述待链接实体“苹果”作为第二实体。其他情况可以以此类推,在此不再一一举例。
在一个实施场景中,可以先识别篇章文本中若干待链接实体,每次可以指定其中一个待链接实体作为第二实体,并将已链接到目标实体的待链接实体作为第一实体,在此基础上,再执行本申请实体链接方法的实施例,以链接得到第二实体的目标实体,如此循环往复直至所有待链接实体均链接到目标实体为止。
在一个具体的实施场景中,由于在刚开始启动实体链接时,并不存在第一实体已链接的目标实体来进行参考,故为了确保后续实体链接的准确性,并减少实体链接过程中的累积误差,可以选择歧义尽可能少,甚至无歧义的待链接实体作为第二实体。仍以上述篇章文本为例,待链接实体“乔布斯”的候选实体可以包括:指代苹果公司联合创始人的“史蒂夫乔布斯”、指代剧情片“史蒂夫乔布斯”、指代纪录片“史蒂夫乔布斯”,待链接实体“美国”的候选实体可以包括:指代国家“美利坚合众国”,待链接实体“加利福尼亚州”的候选实体可以包括:指代美国西部行政州“加利福尼亚州”、指代歌手Akia的歌曲“加利福尼亚州”,待链接实体“苹果”的候选实体可以包括:指代科技公司“苹果”、指代蔷薇科植物“苹果”。由此可见,待链接实体“美国”的歧义均较小,故在启动实体链式时,可以选择待链接实体“美国”作为第二实体。其他情况可以以此类推,在此不再一一举例。
在另一个具体的实施场景中,在启动实体链接时,如前所述,可以选择歧义尽可能少,甚至无歧义的待链接实体作为第二实体,在此基础上,再确定第二实体的目标实体。具体地,在第二实体对应仅有一个候选实体的情况下,可以直接将该候选实体作为其目标实体;或者,在第二实体对应有多个候选实体的情况下,可以根据各个候选实体的流行度来选择一个候选实体作为第二实体的目标实体。例如,在将待链接实体“加利福尼亚州”作为首次实体链接所选择的第二实体时,由于其候选实体包括:指代美国西部行政州的“加利福尼亚州”、指代歌手Akia的歌曲“加利福尼亚州”,其中,指代美国西部行政州的“加利福尼亚州”的候选实体具有较高的流行度,故可以直接将该候选实体连接为第二实体“加利福尼亚州”的目标实体。其他情况可以以此类推,在此不再一一举例。
步骤S12:基于目标实体之间的语义关系,提取得到各个目标实体的第一语义表示。
在一个实施场景中,如前所述,每次实体链接可以得到其中一个待链接实体的目标实体,即在本次实体链接时,前述已链接的目标实体可以包括第一目标实体和第二目标实体,且第一目标实体是在本次实体链接的前一次实体链接得到的,而第二目标实体是在链接第一目标实体之前的历次实体链接分别得到的。在此基础上,可以基于第一目标实体的预设语义表示和第二目标实体在前一次实体链接过程中提取到的第一语义表示,得到各个已链接的目标实体在本次实体链接过程中的初始语义表示,并基于已链接的目标实体的初始语义表示和语义关系进行第一融合,得到各个已链接的目标实体的第一融合表示,在此基础上,再基于各个第一融合表示,得到已链接的目标实体在本次实体链接过程中的第一语义表示。具体过程可以参阅下述公开实施例中相关描述,在此暂不赘述。
在一个具体的实施场景中,仍以前述篇章文本为例,启动实体链接时可以得到待链接实体“美国”的目标实体(即指代国家“美利坚合众国”),第一次实体链接可以得到待链接实体“加利福尼亚州”的目标实体(即指代美国西部行政州“加利福尼亚州”),则在本次实体链接为第二次实体链接时,可以将指代美国西部行政州的目标实体“加利福尼亚州”视为第一目标实体,并将指代国家的目标实体“美利坚合众国”视为第二目标实体。其他情况可以以此类推,在此不再一一举例。
在另一个具体的实施场景中,具体可以将第一目标实体的预设语义表示作为第一目标实体在本次实体链接过程中的初始语义表示,并将第二目标实体在前一次实体链接过程中提取到的第一语义表示作为第二目标实体在本次实体链接过程中的初始语义表示。
在又一个具体的实施场景中,如前所述,目标实体是在待链接实体的候选实体中选择得到的,且如下述方案所述,在选择过程中可以参考各个候选实体的第二语义表示,在此情况下,第一目标实体的预设语义表示可以是其在前一次实体链接过程中所采用的第二语义表示。仍以前述篇章文本为例,在本次实体链接为第二次实体链接时,可以将指代美国西部行政州的目标实体“加利福尼亚州”视为第一目标实体,则其在本次实体链接过程中所采用的初始语义表示,可以是在第一次实体链接过程中的第二语义表示,其他情况可以以此类推,在此不再一一举例。或者,初始语义表示也可以是基于诸如BERT(BidirectionalEncoder Representations from Transformers,基于Transformer的双向编码表示)等预训练模型得到的,具体可以参阅BERT等预训练语言模型的技术细节,在此不再赘述。
在一个实施场景中,在对实体链接的准确性要求相对宽松的情况下,也可以不区分第一目标实体和第二目标实体,直接将各个已链接的目标实体的预设语义表示,分别作为各个已链接的目标实体的初始语义表示。初始语义表示的获取过程,可以如前所述,在此不再赘述。在此基础上,可以基于已链接的目标实体的初始语义表示和语义关系进行第一融合,得到各个已链接的目标实体的第一融合表示,并基于各个第一融合表示,得到已链接的目标实体在本次实体链接过程中的第一语义表示。上述第一融合以及后续步骤,可以参阅下述公开实施例中相关描述,在此暂不赘述。
在一个实施场景中,语义关系可以是基于初始语义表示的语义相似度得到的,且每两个已链接的目标实体之间均存在语义关系。具体地,已链接的目标实体之间的语义关系可以采用两者之间的语义相似度来表示。仍以前述篇章文本为例,指代国家的目标实体“美利坚合众国”和指代美国西部行政州的目标实体“加利福尼亚州”,两者初始语义表示的语义相似度极高,如为0.95,则可以采用0.95来表示两者之间的语义关系。其他情况可以以此类推,在此不再一一举例。上述方式,将语义关系设置为基于初始语义表示的语义相似度得到,能够简化语义关系的获取过程,且由于每两个已链接的目标实体之间均存在语义关系,故能够在语义融合过程中,充分融合每一已链接的目标实体以及与其具有语义关系的目标实体两者的语义信息,有利于提高第一融合表示的准确性。
在一个实施场景中,如前所述,语义关系可以是基于初始语义表的语义相似度得到的,区别在于,语义相似度低于预设阈值的两个已链接的目标实体之间不存在语义关系。预设阈值可以根据实际应用需要进行设置,例如,在对实体链接的响应速度要求较高的情况下,可以将预设阈值设置地相对较高一些,以此来仅保留相关性较强的语义关系,有利于加快第一融合的速度,而在对实体链接的响应速度要求相对较低且对实体链接的精准要求相对较高的情况下,可以将预设阈值设置地相对低一些,以此来仅排除相关性较弱的语义关系,从而较为充分地融合每一已连接的目标实体以及与其具有较强语义关系的目标实体两者的语义信息,进而有利于提高第一融合表示的准确性。
步骤S13:基于各个第一语义表示,得到篇章文本的文本语义表示。
在一个实施场景中,可以对各个已链接的目标实体的第一语义表示进行最大池化(或平均池化),得到篇章文本的文本语义表示。上述方式,通过直接对各个已链接的目标实体的第一语义表示进行最大池化(或平均池化)来得到文本语义表示,能够提高提取文本语义表示的便利性以及速度。
在另一个实施场景中,为了提高文本语义表示的准确性,可以先获取各个已链接的目标实体的重要分值,并利用各个已链接的目标实体的重要分值分别对各个已链接的目标实体的第一语义表示进行加权,得到篇章文本的文本语义表示。上述方式,通过利用各个已链接的目标实体的重要分值分别对各个已链接的目标实体的第一语义表示进行加权来得到文本语义表示,能够根据各个已链接的目标实体的重要分值,来不同程度地参考各个已链接的目标实体的第一语义表示,以得到文本语义表示,有利于提高文本语义表示的准确性。
在又一个实施场景中,与前述方案类似地,可以先获取各个已链接的目标实体的重要分值,区别在于,在获取到重要分值的基础上,可以基于重要分值,选择至少一个已链接的目标实体,并对所选择的目标实体,利用其重要分值对其第一语义表示进行加权,得到文本语义表示。例如,可以按照重要分值由高到低的顺序进行排序,并选择位于前预设序位(如,前5位)的目标实体。上述方式,通过基于重要分值选择至少一个已链接的目标实体,并对所选择的目标实体,利用其重要分值对其第一语义表示进行加权得到文本语义表示,能够有利于仅参考相对重要的目标实体,并根据目标实体的重要分值,不同程度地参考所选择的目标实体的第一语义表示,以得到文本语义表示,有利于提高文本语义表示的准确性。
步骤S14:基于文本语义表示和各个候选实体的第二语义表示,选择候选实体链接为第二实体的目标实体。
在一个实施场景中,可以基于各个候选实体的第二语义表示分别与文本语义表示之间的相似度,得到各个候选实体的置信度分值,候选实体的置信度分值较高,则表示候选实体能够作为目标实体的可能性较大,反之,候选实体的置信度分值较低,则表示候选实体能够作为目标实体的可能性较小。在此基础上,可以基于各个候选实体的置信度分值,选择候选实体链接为第二实体的目标实体。上述方式,通过获取各个候选实体的置信度分值,并基于各个候选实体的置信度分值来选择候选实体链接为第二实体的目标实体,能够在语义层面选择候选实体链接为目标实体,有利于提升候选实体选择的准确性。
在一个实施场景中,可以基于各个候选实体的第二语义表示分别与文本语义之间的相似度,得到各个候选实体的置信度分值,并利用各个候选实体的置信度分值和流行度分值进行预测,得到各个候选实体的链接分值,在此基础上,基于各个候选实体的链接分值,选择至少一个候选实体链接为第二实体的目标实体。上述方式,通过置信度分值和流行度分值预测得到各个候选实体的链接分值,以基于各个候选实体的链接分值选择候选实体链接为第二实体的目标实体,能够在语义层面和使用层面共同来选择候选实体链接为目标实体,从而在使用层面进一步辅助语义层面进行消歧,提升候选实体选择的准确性。
在一个具体的实施场景中,流行度分值表示候选实体的流行度,候选实体的流行度分值越高,候选实体的流行度也越高,即越为人所知,反之,候选实体的流行度分值越低,候选实体的流行度也越低,即越不为人所知。例如,指代美国西部行政州“加利福尼亚州”、指代歌手Akia的歌曲“加利福尼亚州”这两个候选实体,指代美国西部行政州“加利福尼亚州”较为人所知,而指代歌手Akia的歌曲“加利福尼亚州”这两个候选实体较不为人所知,故前者的流行度分值较高,而后者的流行度分值较低。
在一个具体的实施场景中,为了避免机械地为置信度分值和流行度分值分配权重,可以利用前馈神经网络对置信度分值和流行度分值进行预测,得到链接分值,即可以将置信度分值和流行度分值输入前馈神经网络,得到链接分值,故可以通过神经网络自动地为置信度分值和流行度分值两者分配权重,有利于提高链接分值的准确性。
在一个具体的实施场景中,可以按照链接分值由高到低的顺序,将各个候选实体进行排序,并选择排在首位的候选实体链接为第二实体的目标实体。仍以前述篇章文本为例,对于待链接实体“苹果”的候选实体:指代科技公司“苹果”、指代蔷薇科植物“苹果”,最终可以根据上述两个候选实体的链接分值,选择链接分值最高的候选实体(即指代科技公司“苹果”)链接为篇章文本中待链接实体“苹果”的目标实体。其他情况可以以此类推,在此不再一一举例。
上述方案,获取若干第一实体各自已链接的目标实体,并获取第二实体待链接的候选实体,且第一实体和第二实体来自于相同篇章文本,再基于目标实体之间的语义关系,提取得到各个目标实体的第一语义表示,并基于各个第一语义表示,得到篇章文本的文本语义表示,在此基础上,再基于文本语义表示和各个候选实体的第二语义表示,选择候选实体链接为第二实体的目标实体,由于各个目标实体是篇章文本中各个第一实体已链接的实体,即各个目标实体不存在歧义,而目标实体的第一语义表示又是基于目标实体之间的语义关系得到的,从而在提取各个目标实体的第一语义表示时能够参考到与其具有语义关系的其他目标实体,进而能够捕获实体间的关联性并引入潜在的主题相关性,以丰富消歧特征,在此基础上再基于各个第一语义表示来得到文本语义表示,有利于提升文本语义表示的准确性,从而能够基于文本语义表示和各个候选实体的第二语义表示准确地选择到第二实体的目标实体,进而能够提升实体链接的准确性。
请参阅图2,图2是图1中步骤S12一实施例的流程示意图。本公开实施例中,已链接的目标实体包括第一目标实体和第二目标实体,第一目标实体是在本次实体链接的前一次实体链接得到的,且各个第二目标实体是在链接第一目标实体之前的历次实体链接分别得到的,具体可含义可以参阅前述公开实施例中相关描述,在此不再赘述。本公开实施例具体可以包括如下步骤:
步骤S21:基于第一目标实体的预设语义表示和第二目标实体在前一次实体链接过程中提取到的第一语义表示,得到各个已链接的目标实体在本次实体链接过程中的初始语义表示。
具体地,如前述公开实施例所述,可以将第一目标实体的预设语义表示,作为第一目标实体的初始语义表示,并将第二目标实体在前一次实体链接过程中提取到的第一语义表示,作为本次实体链接过程中的初始语义表示。预设语义表示的具体含义,可以参阅前述公开实施例中相关描述,在此不再赘述。
在一个实施场景中,请结合参阅图3,图3是提取第一语义表示一实施例的过程示意图。如图3所示,在第二次实体链接时,已链接的目标实体包括前一次(即第一次)实体链接得到的第一目标实体(图中网格阴影填充的圆形所示)和之前历次实体链接(即启动实体链接)得到的第二目标实体(图中斜线阴影填充的圆形所示);类似地,在第三次实体链接时,已链接的目标实体包括前一次(即第二次)实体链接得到的第一目标实体(图中点状阴影填充的圆形所示)和之前历次实体链接(即启动实体链接和第一次实体链接)得到的第二目标实体(图中斜线阴影填充的圆形以及网格阴影填充的圆形所示);类似地,在第四次实体链接时,已连接的目标实体包括前一次(即第三次)实体链接得到的第一目标实体(图中横线阴影填充的圆形所示)和之前历次实体链接(即即启动实体链接、第一次实体链接和第二次实体链接)得到的第二目标实体(图中斜线阴影填充的圆形、网格阴影填充的圆形以及点状阴影填充的圆形所示)。其他情况可以以此类推,在此不再一一举例。
步骤S22:基于已链接的目标实体的初始语义表示和语义关系进行第一融合,得到各个已链接的目标实体的第一融合表示。
具体地,如图3所示,每次实体链接过程中的第一融合均是利用图神经网络(GraphConvolutional Network,GCN)执行的,即每次实体链接过程中的第一融合均对应于一个图神经网络,在此基础上,可以基于前一次实体链接过程中图神经网络的网络参数和各个已链接的目标实体在本次实体链接过程中的初始语义表示,确定本次实体链接过程中图神经网络的网络参数。基于此,可以基于本次实体链接过程中图神经网络和语义关系对初始语义表示进行第一融合,得到第一融合表示。上述方式,每次实体链接过程中的第一融合均是利用图神经网络执行的,并基于前一次实体链接过程中图神经网络的网络参数和初始语义表示,确定本次实体链接过程中图神经网络的网络参数,在此基础上,基于本次实体链接过程中图神经网络和语义关系对初始语义表示进行第一融合,得到第一融合表示,能够将各次实体链接过程中图神经网络的网络参数视为一个序列,并引入更新机制学习图神经网络的网络参数变化,有利于提升第一融合表示的准确性。
在一个实施场景中,如图3所示,可以将前一次实体链接过程中图神经网络的网络参数和各个已链接的目标实体在本次实体链接过程中的初始语义表示输入门控循环单元(Gate Recurrent Unit,GRU),得到本次实体连接过程中图神经网络的网络参数。
在一个实施场景中,如图3所示,图神经网络可以包括若干层(如2层)网络层,则对于第i层网络层而言,可以将第一前次实体链接过程中图神经网络中第i层网络层的网络参数和各个已链接的目标实体在本次实体链接过程中经第i-1层网络层处理之后的初始语义表示输入门控循环单元,得到本次实体链接过程中图神经网络中第i层网络层的网络参数,再利用本次实体链接过程中第i层网络层继续处理本次实体链接过程中经第i-1层网络层处理之后的初始语义,得到本次实体链接过程中第i层网络层处理之后的初始语义表示,如此往复在此不再一一举例。需要说明的是,网络层在处理过程中,可以同时参考各个已连接的目标实体之间的语义关系,具体可以参阅GCN相关技术细节,在此不再赘述。
在一个实施场景中,请继续结合参阅图3,在各次实体链接过程中,经GCN执行空间级卷积之后,即可得到各个已链接的目标实体的第一融合表示(如图中GCN处箭头所指向的各个不同阴影填充的圆形)。
步骤S23:基于各个第一融合表示,得到已链接的目标实体在本次实体链接过程中第一语义表示。
在一个实施场景中,为了提高实体链接的速度,在对实体链接的准确性要求相对宽松的情况下,可以直接将已链接的目标实体的第一融合表示,作为其在本次实体链接过程中第一语义表示。
在另一个实施场景中,为了进一步提高实体链接的准确性,如图3所示,可以在时域维度进一步对第一融合表示进行融合。具体可以将第一目标实体的第一融合表示与第二目标实体的第一融合表示进行第二融合,得到第一目标实体的第二融合表示,在此基础上,可以将第一目标实体的第二融合表示作为第一目标实体的第一语义表示,并将第二目标实体的第一融合表示作为第二目标实体的第一语义表示。上述方式,通过在时域层面进一步将将第一目标实体的第一融合表示与第二目标实体的第一融合表示进行第二融合,以得到第一目标实体的第二融合表示,并将第一目标实体的第二融合表示作为第一目标实体的第一语义表示,以及将第二目标实体的第一融合表示作为第二目标实体的第一语义表示,一方面能够确保本次实体链接过程所输出的第一语义表示仅依赖于之前历次实体链接过程,从而能够避免无用信息的干扰,另一方面通过将第一目标实体的第一融合表示与第二目标实体的第一融合表示进行融合,也有助于关注较久之前实体链接的相关信息,从而能够扩大时域感受域,故此能够有利于提高第一语义表示的准确性。
在一个具体的实施场景中,不同于前述第一融合,在时域维度可以采用时序卷积网络(Temporal Convolutional Network,TCN)实现第二融合。时序卷积网络可以包括但不限于:全连接层、因果卷积,具体可以将第一目标实体的第一融合表示与第二目标实体的第一融合表示分别输入全连接层,以进一步抽象深层语义表示,需要说明的是,为了确保在实体连接过程中语义表示维度的一致性,经全连接层处理之后,语义表示的维度不会发生变化。在此基础上,再将第一目标实体和第二目标实体各自的深层语义表示输入因果卷积,以将第二目标实体的深层语义信息融入至第一目标实体的深层语义信息,得到第一目标实体的第二融合表示。因果卷积的具体处理过程,可以参阅因果卷积的技术细节,在此不再赘述。
在另一个具体的实施场景中,为了尽可能地关注到较久之前实体链接得到的目标实体,上述时序卷积网络还可以包括扩展卷积,通过扩张卷积能够扩大时域卷积的感受域,以构建长时序依赖关系。
上述方案,已链接的目标实体包括第一目标实体和第二目标实体,第一目标实体是在本次实体链接的前一次实体链接得到的,且各个第二目标实体是在链接第一目标实体之前的历次实体链接分别得到的,在此基础上,基于第一目标实体的预设语义表示和第二目标实体在前一次实体链接过程中提取到的第一语义表示,得到各个已链接的目标实体在本次实体链接过程中的初始语义表示,并基于已链接的目标实体的初始语义表示和语义关系进行第一融合,得到各个已链接的目标实体的第一融合表示,再基于各个第一融合表示,得到已链接的目标实体在本次实体链接过程中的第一语义表示,一方面由于在本次实体链接过程中加入前一次实体链接得到的第一目标实体以及再之前历次实体链接得到的第二目标实体,故能够在实体链接过程中引入更新机制以捕获实体链接的动态演变,另一方面由于在本次实体链接过程中参考第一目标实体的预设语义表示以及第二目标实体在前一次实体链接过程中提取到的第一语义表示,故能够随着新加入的目标实体在历次实体链接过程中不断优化第一语义表示,即优化第一语义表示有利于提升实体链接的准确性,而实体链接的准确性又可以尽可能地促使动态演变准确无误,故此能够在历次实体链接过程中提升实体链接准确性。
请参阅图4,图4是图1中步骤S13一实施例的流程示意图。具体而言,可以包括如下步骤:
步骤S41:基于各个第一语义表示分别与候选实体的第二语义表示,得到各个已链接的目标实体的重要分值。
具体地,对于每一已链接的目标实体,可以基于已链接的目标实体的第一语义表示分别与各个候选实体的第二语义表示之间相似度,得到已链接的目标实体分别与各个候选实体之间的相关分值,并将最大相关分值作为已链接的目标实体的重要分值。上述方式,通过语义表示之间的相似度来获取相关分值,并选取最大相关分值作为已链接实体的重要分值,能够有利于快速衡量且准确地各个已链接的目标实体对于选择候选实体的重要性,有利于提升实体链接的速度和准确性。
在一个实施场景中,如前所公开实施例所述,候选实体的第二语义表示可以通过诸如BERT等预训练模型得到,具体过程可以参阅BERT等预训练模型的技术细节,在此不再赘述。
在一个实施场景中,请结合参阅图5,图5是获取文本语义表示一实施例的过程示意图。如图5所示,为了便于描述,可以将本次(第t+1次)实体链接所针对的第二实体的J个候选实体的第二语义表示分别记为e1 t+1、e2 t+1、…、eJ t+1,并将之前t次实体连接过程中分别已经链接到的目标实体的第一语义表示记为e1、e2、…、et。此外,为了提高表达能力,可以利用映射矩阵将各个已链接的目标实体的第一语义表示进行映射,得到各个已链接的目标实体的映射语义表示。为了便于描述,可以将第i个已链接的目标实体的映射语义表示记为Xi,并将第j个候选实体的第二语义表示记为Hj,故此通过映射能够将已链接的目标实体和候选实体分别映射到不同向量空间,从而能够大大提升表达能力。在此基础上,由于两者向量空间不同,故在计算相似度时,可以采用一个中间矩阵进行空间转换,为了便于描述,可以将该空间矩阵记为D,则对于第i个已链接的目标实体而言,其映射语义表示Xi与第j个候选实体的第二语义表示Hj之间的相似度可以表示为HT jDXi,其中,T表示矩阵的转置。即图5中以不同灰度填充的矩形分别表示已链接的目标实体和候选实体之间的相关分值,且灰度越深,表示相关分值越大。需要说明的是,每一列表示其中一个已链接的目标实体分别与各个候选实体之间的相关分值。
步骤S42:基于重要分值,选择至少一个已链接的目标实体作为代表实体。
具体地,可以将各个已链接的目标实体按照重要分值由大到小的顺序排序,并选择位于前预设序位的已链接的目标实体,作为代表实体。仍以前述篇章文本为例,在本次实体链接过程中第二实体为待链接实体“苹果”的情况下,已链接目标实体的第一实体为“乔布斯”、“美国”、“加利福尼亚州”,且第一实体“乔布斯”已链接的目标实体为指代苹果公司联合创始人的“史蒂夫乔布斯”,第一实体“美国”已链接的目标实体为指代国家“美利坚合众国”,第一实体“加利福尼亚州”已链接的目标实体为指代美国西部行政州“加利福尼亚州”,且经上述处理,可以确定上述各个已链接的目标实体按照重要分值由大到小的顺序排序,分别为:指代苹果公司联合创始人的目标实体“史蒂夫乔布斯”、指代美国西部行政州的目标实体“加利福尼亚州”、指代国家的目标实体“美利坚合众国”,则若预设序位设置为2时,可以将指代苹果公司联合创始人的目标实体“史蒂夫乔布斯”和指代美国西部行政州的目标实体“加利福尼亚州”两者作为代表实体。其他情况可以以此类推,在此不再一一举例。上述方式,将各个已链接的目标实体按照重要分值由大到小的顺序排序,并选择位于前预设序位的已链接的目标实体,作为代表实体,能够有利于选择出最具代表价值的目标实体,有利于提升实体链接的准确性。
步骤S43:基于代表实体的重要分值和代表实体的第一语义表示,得到文本语义表示。
具体地,可以将各个代表的重要分值进行归一化处理,得到各个代表实体的加权因子,并利用各个代表实体的加权因子分别对各个代表实体的第一语义表示进行加权处理(如,加权求和),得到文本语义表示。上述方式,通过对重要分值进行归一化处理,得到代表实体的加权因子,并利用代表实体的加权因子对代表实体的第一语义表示进行加权处理,得到文本语义表示,能够不同程度地参考各个代表实体的语义信息,有利于提升文本语义表示的准确性。
此外,为了便于描述,可以将文本语义表示记为St,如前述公开实施例所述,在得到篇章文本的文本语义表示之后,可以获取各个候选实体的第二语义表示分别与文本语义之间的相似度,为了便于描述,可以将第j个候选实体的第二语义表示Hj与文本语义表示St之间的相似度表示为Φ(Hj,St),之后即可基于上述相似度来选择候选实体链接为第二实体的目标实体。具体过程可以参阅前述公开实施例中相关描述,在此不再赘述。
上述方案,基于各个第一语义表示分别与候选实体的第二语义表示,得到各个已链接的目标实体的重要分值,再基于重要分值,选择至少一个已链接的目标实体作为代表实体,从而基于代表实体的重要分值和代表实体的第一语义表示,得到文本语义表示,故在实体链接过程中,能够根据各个已链接的目标实体分别与各个候选实体之间的相似度来选择最具代表价值的目标实体作为代表实体,并基于代表实体的第一语义表示来获取在本次实体链接过程中代表篇章文本的文本语义表示,故能够重点参考具有代表价值的目标实体,有利于提升文本语义表示的准确性。
请参阅图6,图6是本申请实体链接方法另一实施例的流程示意图。具体而言,可以包括如下步骤:
步骤S61:获取若干第一实体各自已链接的目标实体,并获取第二实体待链接的候选实体。
本公开实施例中,第一实体和第二实体来自相同篇章文本,具体可以参阅前述公开实施例中相关描述,在此不再赘述。
步骤S62:基于目标实体之间的语义关系,提取得到各个目标实体的第一语义表示。
具体可以参阅前述公开实施例中相关描述,在此不再赘述。
步骤S63:基于各个第一语义表示,得到篇章文本的文本语义表示。
具体可以参阅前述公开实施例中相关描述,在此不再赘述。
步骤S64:基于文本语义表示和各个候选实体的第二语义表示,选择候选实体链接为第二实体的目标实体。
具体可以参阅前述公开实施例中相关描述,在此不再赘述。
步骤S65:判断篇章文本中是否还存在未链接的第二实体,若是则执行步骤S66,否则执行步骤S68。
具体地,在获取到本次实体链接所针对的第二实体的目标实体之后,可以进一步检测篇章文本中是否还存在未链接的第二实体,如果存在,则可以继续对未链接的第二实体再次进行上述实体链接操作,如果不存在,则可以结束实体链接流程。
步骤S66:将第二实体纳入若干第一实体,并在篇章文本选择一个未链接的第二实体。
具体地,在篇章文本中还存在未链接的第二实体的情况下,可以将第二实体纳入到若干第一实体中,即将第二实体视为已链接的实体,并在篇章文本中选择一个未链接的第二实体。如前述公开实施例所述,选择的顺序可以按照所具有的候选实体的多寡,具有候选实体越少的第二实体越先被选择,而具有候选实体越多的第二实体越后被选择,也就是说,在实体链接过程中,可以将篇章文本中待链接实体按照各自具有的候选实体由少到多的顺序进行排序,再在实体链接过程中,依序选择一个待链接实体作为第二实体。
步骤S67:重新执行步骤S61以及后续步骤。
具体地,在选择到新的第二实体之后,即可重新执行上述实体链接的步骤,具体可以参阅前述公开实施例中相关描述,在此不再赘述。
步骤S68:结束。
具体地,如果篇章文本中不存在未链接的第二实体的情况下,则可以结束实体链接流程。
上述方案,在实体链接过程中每次对一个实体进行链接,且每次链接均参考之前历次实体链接过程中第一实体已链接的目标实体,从而能够在对篇章文本中各个实体分别进行实体链接过程中,能够丰富消歧特征,有利于尽可能地提高每次实体链接的准确性,从而有利于大大减少实体链接的整个过程中的累积误差,进而能够提高对篇章文本中各个实体进行实体链接的准确性,有利于提升对篇章文本理解的准确性。
请参阅图7,图7是本申请实体链接装置70一实施例的框架示意图。实体链接装置70包括实体获取模块71、实体表示模块72、文本表示模块73和目标选择模块74,实体获取模块71,用于获取若干第一实体各自已链接的目标实体,并获取第二实体待链接的候选实体;其中,第一实体和第二实体来自相同篇章文本;实体表示模块72,用于基于目标实体之间的语义关系,提取得到各个目标实体的第一语义表示;文本表示模块73,用于基于各个第一语义表示,得到篇章文本的文本语义表示;目标选择模块74,用于基于文本语义和各个候选实体的第二语义表示,选择候选实体链接为第二实体的目标实体。
上述方案,获取若干第一实体各自已链接的目标实体,并获取第二实体待链接的候选实体,且第一实体和第二实体来自于相同篇章文本,再基于目标实体之间的语义关系,提取得到各个目标实体的第一语义表示,并基于各个第一语义表示,得到篇章文本的文本语义表示,在此基础上,再基于文本语义表示和各个候选实体的第二语义表示,选择候选实体链接为第二实体的目标实体,由于各个目标实体是篇章文本中各个第一实体已链接的实体,即各个目标实体不存在歧义,而目标实体的第一语义表示又是基于目标实体之间的语义关系得到的,从而在提取各个目标实体的第一语义表示时能够参考到与其具有语义关系的其他目标实体,进而能够捕获实体间的关联性并引入潜在的主题相关性,以丰富消歧特征,在此基础上再基于各个第一语义表示来得到文本语义表示,有利于提升文本语义表示的准确性,从而能够基于文本语义表示和各个候选实体的第二语义表示准确地选择到第二实体的目标实体,进而能够提升实体链接的准确性。
在一些公开实施例中,已链接的目标实体包括第一目标实体和第二目标实体,第一目标实体是在本次实体链接的前一次实体链接得到的,且各个第二目标实体是在链接第一目标实体之前的历次实体链接分别得到的;实体表示模块72包括初始语义提取子模块,用于基于第一目标实体的预设语义表示和第二目标实体在前一次实体链接过程中提取到的第一语义表示,得到各个已链接的目标实体在本次实体链接过程中的初始语义表示;实体表示模块72包括语义融合子模块,用于基于已链接的目标实体的初始语义表示和语义关系进行第一融合,得到各个已链接的目标实体的第一融合表示;实体表示模块72包括语义表示获取子模块,用于基于各个第一融合表示,得到已链接的目标实体在本次实体链接过程中第一语义表示。
因此,一方面由于在本次实体链接过程中加入前一次实体链接得到的第一目标实体以及再之前历次实体链接得到的第二目标实体,故能够在实体链接过程中引入更新机制以捕获实体链接的动态演变,另一方面由于在本次实体链接过程中参考第一目标实体的预设语义表示以及第二目标实体在前一次实体链接过程中提取到的第一语义表示,故能够随着新加入的目标实体在历次实体链接过程中不断优化第一语义表示,即优化第一语义表示有利于提升实体链接的准确性,而实体链接的准确性又可以尽可能地促使动态演变准确无误,故此能够在历次实体链接过程中提升实体链接准确性。
在一些公开实施例中,语义表示获取子模块包括第二融合单元,用于将第一目标实体的第一融合表示与第二目标实体的第一融合表示进行第二融合,得到第一目标实体的第二融合表示;语义表示获取子模块包括语义获取单元,用于将第一目标实体的第二融合表示作为第一目标实体的第一语义表示,并将第二目标实体的第一融合表示作为第二目标实体的第一语义表示。
因此,一方面能够确保本次实体链接过程所输出的第一语义表示仅依赖于之前历次实体链接过程,从而能够避免无用信息的干扰,另一方面通过将第一目标实体的第一融合表示与第二目标实体的第一融合表示进行融合,也有助于关注较久之前实体链接的相关信息,从而能够扩大时域感受域,故此能够有利于提高第一语义表示的准确性。
在一些公开实施例中,每次实体链接过程中的第一融合均是利用图神经网络执行的;语义融合子模块包括参数确定单元,用于基于前一次实体链接过程中图神经网络的网络参数和初始语义表示,确定本次实体链接过程中图神经网络的网络参数;语义融合子模块包括第一融合单元,用于基于本次实体链接过程中图神经网络和语义关系对初始语义表示进行第一融合,得到第一融合表示。
因此,每次实体链接过程中的第一融合均是利用图神经网络执行的,并基于前一次实体链接过程中图神经网络的网络参数和初始语义表示,确定本次实体链接过程中图神经网络的网络参数,在此基础上,基于本次实体链接过程中图神经网络和语义关系对初始语义表示进行第一融合,得到第一融合表示,能够将各次实体链接过程中图神经网络的网络参数视为一个序列,并引入更新机制学习图神经网络的网络参数变化,有利于提升第一融合表示的准确性。
在一些公开实施例中,语义关系是基于初始语义表示的语义相似度得到的,且每两个已链接的目标实体之间均存在语义关系;或者,语义关系是基于初始语义表示的语义相似度得到的,且语义相似度低于预设阈值的两个已链接的目标实体之间不存在语义关系。
因此,将语义关系设置为基于初始语义表示的语义相似度得到,能够简化语义关系的获取过程,且由于每两个已链接的目标实体之间均存在语义关系,故能够在语义融合过程中,充分融合每一已链接的目标实体以及与其具有语义关系的目标实体两者的语义信息,有利于提高第一融合表示的准确性;而语义相似度低于预设阈值的两个已链接的目标实体之间设置为不存在语义关系,能够较为充分地融合每一已连接的目标实体以及与其具有较强语义关系的目标实体两者的语义信息,进而有利于提高第一融合表示的准确性。
在一些公开实施例中,文本表示模块73包括重要分值获取子模块,用于基于各个第一语义表示分别与候选实体的第二语义表示,得到各个已链接的目标实体的重要分值;文本表示模块73包括代表实体选择子模块,用于基于重要分值,选择至少一个已链接的目标实体作为代表实体;文本表示模块73包括文本语义获取子模块,用于基于代表实体的重要分值和代表实体的第一语义表示,得到文本语义表示。
因此,基于各个第一语义表示分别与候选实体的第二语义表示,得到各个已链接的目标实体的重要分值,再基于重要分值,选择至少一个已链接的目标实体作为代表实体,从而基于代表实体的重要分值和代表实体的第一语义表示,得到文本语义表示,故在实体链接过程中,能够根据各个已链接的目标实体分别与各个候选实体之间的相似度来选择最具代表价值的目标实体作为代表实体,并基于代表实体的第一语义表示来获取在本次实体链接过程中代表篇章文本的文本语义表示,故能够重点参考具有代表价值的目标实体,有利于提升文本语义表示的准确性。
在一些公开实施例中,重要分值获取子模块具体用于对于每一已链接的目标实体,基于已链接的目标实体的第一语义表示分别与各个候选实体的第二语义表示之间的相似度,得到已链接的目标实体分别与各个候选实体之间的相关分值,并将最大相关分值,作为已链接的目标实体的重要分值;代表实体选择子模块具体用于将各个已链接的目标实体按照重要分值由大到小的顺序排序,并选择位于前预设序位的已链接的目标实体作为代表实体。
因此,通过语义表示之间的相似度来获取相关分值,并选取最大相关分值作为已链接实体的重要分值,能够有利于快速衡量且准确地各个已链接的目标实体对于选择候选实体的重要性,有利于提升实体链接的速度和准确性;而将各个已链接的目标实体按照重要分值由大到小的顺序排序,并选择位于前预设序位的已链接的目标实体,作为代表实体,能够有利于选择出最具代表价值的目标实体,有利于提升实体链接的准确性。
在一些公开实施例中,文本语义获取子模块包括加权因子获取单元,用于将各个代表实体的重要分值进行归一化处理,得到各个代表实体的加权因子;文本语义获取子模块包括语义表示加权单元,用于利用各个代表实体的加权因子分别对各个代表实体的第一语义表示进行加权处理,得到文本语义表示。
因此,通过对重要分值进行归一化处理,得到代表实体的加权因子,并利用代表实体的加权因子对代表实体的第一语义表示进行加权处理,得到文本语义表示,能够不同程度地参考各个代表实体的语义信息,有利于提升文本语义表示的准确性。
在一些公开实施例中,目标选择模块74包括置信度分值获取子模块,用于基于各个候选实体的第二语义表示分别与文本语义之间的相似度,得到各个候选实体的置信度分值;目标选择模块74包括链接分值预测子模块,用于利用各个候选实体的置信度分值和流行度分值进行预测,得到各个候选实体的链接分值;目标选择模块74包括候选实体选择子模块,用于基于各个候选实体的链接分值,选择至少一个候选实体链接为第二实体的目标实体。
因此,通过置信度分值和流行度分值预测得到各个候选实体的链接分值,以基于各个候选实体的链接分值选择候选实体链接为第二实体的目标实体,能够在语义层面和使用层面共同来选择候选实体链接为目标实体,从而在使用层面进一步辅助语义层面进行消歧,提升候选实体选择的准确性。
在一些公开实施例中,实体链接装置70还包括篇章检测模块,用于检测到篇章文本中存在未链接的第二实体,将第二实体纳入若干第一实体,并在篇章文本选择一个未链接的第二实体,实体链接装置70还包括循环处理模块,用于结合实体获取模块71、实体表示模块72、文本表示模块73和目标选择模块74重新执行获取若干第一实体各自已链接的目标实体,并获取第二实体待链接的候选实体的步骤以及后续步骤,直至篇章文本中不存在未链接的第二实体为止。
因此,在实体链接过程中每次对一个实体进行链接,且每次链接均参考之前历次实体链接过程中第一实体已链接的目标实体,从而能够在对篇章文本中各个实体分别进行实体链接过程中,能够丰富消歧特征,有利于尽可能地提高每次实体链接的准确性,从而有利于大大减少实体链接的整个过程中的累积误差,进而能够提高对篇章文本中各个实体进行实体链接的准确性,有利于提升对篇章文本理解的准确性。
请参阅图8,图8是本申请电子设备80一实施例的框架示意图。电子设备80包括相互耦接的存储器81和处理器82,存储器81中存储有程序指令,处理器82用于执行程序指令以实现上述任一实体链接方法实施例中的步骤。具体地,电子设备80可以包括但不限于:台式计算机、笔记本电脑、服务器、手机、平板电脑等等,在此不做限定。
具体而言,处理器82用于控制其自身以及存储器81以实现上述任一实体链接方法实施例中的步骤。处理器82还可以称为CPU(Central Processing Unit,中央处理单元)。处理器82可能是一种集成电路芯片,具有信号的处理能力。处理器82还可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器82可以由集成电路芯片共同实现。
上述方案,在提取各个目标实体的第一语义表示时能够参考到与其具有语义关系的其他目标实体,进而能够捕获实体间的关联性并引入潜在的主题相关性,以丰富消歧特征,在此基础上再基于各个第一语义表示来得到文本语义表示,有利于提升文本语义表示的准确性,从而能够基于文本语义表示和各个候选实体的第二语义表示准确地选择到第二实体的目标实体,进而能够提升实体链接的准确性。
请参阅图9,图9是本申请计算机可读存储介质90一实施例的框架示意图。计算机可读存储介质90存储有能够被处理器运行的程序指令91,程序指令91用于实现上述任一实体链接方法实施例中的步骤。
上述方案,在提取各个目标实体的第一语义表示时能够参考到与其具有语义关系的其他目标实体,进而能够捕获实体间的关联性并引入潜在的主题相关性,以丰富消歧特征,在此基础上再基于各个第一语义表示来得到文本语义表示,有利于提升文本语义表示的准确性,从而能够基于文本语义表示和各个候选实体的第二语义表示准确地选择到第二实体的目标实体,进而能够提升实体链接的准确性。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考,为了简洁,本文不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (13)

1.一种实体链接方法,其特征在于,包括:
获取若干第一实体各自已链接的目标实体,并获取第二实体待链接的候选实体;其中,所述第一实体和所述第二实体来自相同篇章文本;
基于所述目标实体之间的语义关系,提取得到各个所述目标实体的第一语义表示;
基于各个所述第一语义表示,得到所述篇章文本的文本语义表示;
基于所述文本语义表示和各个所述候选实体的第二语义表示,选择所述候选实体链接为所述第二实体的目标实体。
2.根据权利要求1所述的方法,其特征在于,所述已链接的目标实体包括第一目标实体和第二目标实体,所述第一目标实体是在本次实体链接的前一次实体链接得到的,且各个所述第二目标实体是在链接所述第一目标实体之前的历次实体链接分别得到的;所述已链接的目标实体在所述本次实体链接过程中所述第一语义表示的获取步骤包括:
基于所述第一目标实体的预设语义表示和所述第二目标实体在所述前一次实体链接过程中提取到的第一语义表示,得到各个所述已链接的目标实体在所述本次实体链接过程中的初始语义表示;
基于所述已链接的目标实体的初始语义表示和所述语义关系进行第一融合,得到各个所述已链接的目标实体的第一融合表示;
基于各个所述第一融合表示,得到所述已链接的目标实体在所述本次实体链接过程中所述第一语义表示。
3.根据权利要求2所述的方法,其特征在于,所述基于各个所述第一融合表示,得到所述已链接的目标实体在所述本次实体链接过程中所述第一语义表示,包括:
将所述第一目标实体的第一融合表示与所述第二目标实体的第一融合表示进行第二融合,得到所述第一目标实体的第二融合表示;
将所述第一目标实体的第二融合表示作为所述第一目标实体的第一语义表示,并将所述第二目标实体的第一融合表示作为所述第二目标实体的第一语义表示。
4.根据权利要求2所述的方法,其特征在于,每次所述实体链接过程中的所述第一融合均是利用图神经网络执行的;所述基于所述已链接的目标实体的初始语义表示和所述语义关系进行第一融合,得到各个所述已链接的目标实体的第一融合表示,包括:
基于所述前一次实体链接过程中所述图神经网络的网络参数和所述初始语义表示,确定所述本次实体链接过程中所述图神经网络的网络参数;
基于所述本次实体链接过程中所述图神经网络和所述语义关系对所述初始语义表示进行第一融合,得到所述第一融合表示。
5.根据权利要求2所述的方法,其特征在于,所述语义关系是基于所述初始语义表示的语义相似度得到的,且每两个所述已链接的目标实体之间均存在所述语义关系;
或者,所述语义关系是基于所述初始语义表示的语义相似度得到的,且所述语义相似度低于预设阈值的两个所述已链接的目标实体之间不存在所述语义关系。
6.根据权利要求1所述的方法,其特征在于,所述基于各个所述第一语义表示,得到所述篇章文本的文本语义表示,包括:
基于各个所述第一语义表示分别与所述候选实体的第二语义表示,得到各个所述已链接的目标实体的重要分值;
基于所述重要分值,选择至少一个所述已链接的目标实体作为代表实体;
基于所述代表实体的重要分值和所述代表实体的第一语义表示,得到所述文本语义表示。
7.根据权利要求6所述的方法,其特征在于,所述基于各个所述第一语义表示分别与所述候选实体的第二语义表示,得到各个所述已链接的目标实体的重要分值,包括:
对于每一所述已链接的目标实体,基于所述已链接的目标实体的第一语义表示分别与各个所述候选实体的第二语义表示之间的相似度,得到所述已链接的目标实体分别与各个所述候选实体之间的相关分值,并将最大所述相关分值,作为所述已链接的目标实体的重要分值;
所述基于所述重要分值,选择至少一个所述已链接的目标实体作为代表实体,包括:
将各个所述已链接的目标实体按照所述重要分值由大到小的顺序排序,并选择位于前预设序位的已链接的目标实体作为所述代表实体。
8.根据权利要求6所述的方法,其特征在于,所述基于所述代表实体的重要分值和所述代表实体的第一语义表示,得到所述文本语义表示,包括:
将各个所述代表实体的重要分值进行归一化处理,得到各个所述代表实体的加权因子;
利用各个所述代表实体的加权因子分别对各个所述代表实体的第一语义表示进行加权处理,得到所述文本语义表示。
9.根据权利要求1所述的方法,其特征在于,所述基于所述文本语义表示和各个所述候选实体的第二语义表示,选择所述候选实体链接为所述第二实体的目标实体,包括:
基于各个所述候选实体的第二语义表示分别与所述文本语义之间的相似度,得到各个所述候选实体的置信度分值;
利用所述各个候选实体的置信度分值和流行度分值进行预测,得到各个所述候选实体的链接分值;
基于各个所述候选实体的链接分值,选择至少一个所述候选实体链接为所述第二实体的目标实体。
10.根据权利要求1至9任一项所述的方法,其特征在于,在所述基于所述文本语义表示和各个所述候选实体的第二语义表示,选择所述候选实体链接为所述第二实体的目标实体之后,所述方法还包括:
检测到所述篇章文本中存在未链接的第二实体,将所述第二实体纳入所述若干第一实体,并在所述篇章文本选择一个未链接的第二实体;
重新执行所述获取若干第一实体各自已链接的目标实体,并获取第二实体待链接的候选实体的步骤以及后续步骤,直至所述篇章文本中不存在未链接的第二实体为止。
11.一种实体链接装置,其特征在于,包括:
实体获取模块,用于获取若干第一实体各自已链接的目标实体,并获取第二实体待链接的候选实体;其中,所述第一实体和所述第二实体来自相同篇章文本;
实体表示模块,用于基于所述目标实体之间的语义关系,提取得到各个所述目标实体的第一语义表示;
文本表示模块,用于基于各个所述第一语义表示,得到所述篇章文本的文本语义表示;
目标选择模块,用于基于所述文本语义和各个所述候选实体的第二语义表示,选择所述候选实体链接为所述第二实体的目标实体。
12.一种电子设备,其特征在于,包括相互耦接的存储器和处理器,所述存储器中存储有程序指令,所述处理器用于执行所述程序指令以实现权利要求1至10任一项所述的实体链接方法。
13.一种计算机可读存储介质,其特征在于,存储有能够被处理器运行的程序指令,所述程序指令用于实现权利要求1至10任一项所述的实体链接方法。
CN202111015856.2A 2021-08-31 2021-08-31 实体链接方法及相关装置、电子设备、存储介质 Active CN113743104B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111015856.2A CN113743104B (zh) 2021-08-31 2021-08-31 实体链接方法及相关装置、电子设备、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111015856.2A CN113743104B (zh) 2021-08-31 2021-08-31 实体链接方法及相关装置、电子设备、存储介质

Publications (2)

Publication Number Publication Date
CN113743104A true CN113743104A (zh) 2021-12-03
CN113743104B CN113743104B (zh) 2024-04-16

Family

ID=78734453

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111015856.2A Active CN113743104B (zh) 2021-08-31 2021-08-31 实体链接方法及相关装置、电子设备、存储介质

Country Status (1)

Country Link
CN (1) CN113743104B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115455981A (zh) * 2022-11-11 2022-12-09 合肥智能语音创新发展有限公司 一种多语种语句的语义理解方法、装置、设备及存储介质
WO2024072453A1 (en) * 2022-09-29 2024-04-04 Visa International Service Association Entity linking using a graph neural network

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462126A (zh) * 2013-09-22 2015-03-25 富士通株式会社 一种实体链接方法及装置
US20150154195A1 (en) * 2013-12-02 2015-06-04 Qbase, LLC Method for entity-driven alerts based on disambiguated features
CN108280061A (zh) * 2018-01-17 2018-07-13 北京百度网讯科技有限公司 基于歧义实体词的文本处理方法和装置
CN110674317A (zh) * 2019-09-30 2020-01-10 北京邮电大学 一种基于图神经网络的实体链接方法及装置
CN111090724A (zh) * 2019-11-21 2020-05-01 新华智云科技有限公司 一种基于深度学习的可评判文本内容与实体相关性的实体抽取方法
CN111506709A (zh) * 2020-06-29 2020-08-07 科大讯飞(苏州)科技有限公司 实体链接方法、装置、电子设备和存储介质
CN112989831A (zh) * 2021-03-29 2021-06-18 华南理工大学 一种应用在网络安全领域的实体抽取方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462126A (zh) * 2013-09-22 2015-03-25 富士通株式会社 一种实体链接方法及装置
US20150154195A1 (en) * 2013-12-02 2015-06-04 Qbase, LLC Method for entity-driven alerts based on disambiguated features
CN108280061A (zh) * 2018-01-17 2018-07-13 北京百度网讯科技有限公司 基于歧义实体词的文本处理方法和装置
CN110674317A (zh) * 2019-09-30 2020-01-10 北京邮电大学 一种基于图神经网络的实体链接方法及装置
CN111090724A (zh) * 2019-11-21 2020-05-01 新华智云科技有限公司 一种基于深度学习的可评判文本内容与实体相关性的实体抽取方法
CN111506709A (zh) * 2020-06-29 2020-08-07 科大讯飞(苏州)科技有限公司 实体链接方法、装置、电子设备和存储介质
CN112989831A (zh) * 2021-03-29 2021-06-18 华南理工大学 一种应用在网络安全领域的实体抽取方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ZIHENG DENG 等: "Improving Entity Linking with Graph Networks", 《WEB INFORMATION SYSTEMS ENGINEERING - WISE 2020》, pages 343 - 354 *
汪沛;线岩团;郭剑毅;文永华;陈玮;王红斌;: "一种结合词向量和图模型的特定领域实体消歧方法", 智能系统学报, no. 03, pages 92 - 101 *
邓子恒: "基于图神经网络和语义表示的实体链接技术研究", 《中国优秀硕士学位论文全文数据库》, no. 01, pages 1 - 69 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024072453A1 (en) * 2022-09-29 2024-04-04 Visa International Service Association Entity linking using a graph neural network
CN115455981A (zh) * 2022-11-11 2022-12-09 合肥智能语音创新发展有限公司 一种多语种语句的语义理解方法、装置、设备及存储介质
CN115455981B (zh) * 2022-11-11 2024-03-19 合肥智能语音创新发展有限公司 一种多语种语句的语义理解方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN113743104B (zh) 2024-04-16

Similar Documents

Publication Publication Date Title
US11322153B2 (en) Conversation interaction method, apparatus and computer readable storage medium
CN110837550B (zh) 基于知识图谱的问答方法、装置、电子设备及存储介质
CN110110062B (zh) 机器智能问答方法、装置与电子设备
US20180276525A1 (en) Method and neural network system for human-computer interaction, and user equipment
CN112100354B (zh) 人机对话方法、装置、设备及存储介质
CN110837738B (zh) 相似问识别方法、装置、计算机设备及存储介质
CN110928994A (zh) 相似案例检索方法、相似案例检索装置和电子设备
CN112287089B (zh) 用于自动问答系统的分类模型训练、自动问答方法及装置
CN111581949B (zh) 学者人名的消歧方法、装置、存储介质及终端
CN110334186B (zh) 数据查询方法、装置、计算机设备及计算机可读存储介质
CN113743104A (zh) 实体链接方法及相关装置、电子设备、存储介质
CN112149386A (zh) 一种事件抽取方法、存储介质及服务器
CN116956835B (zh) 一种基于预训练语言模型的文书生成方法
CN116822651A (zh) 基于增量学习的大模型参数微调方法、装置、设备及介质
CN116304748A (zh) 一种文本相似度计算方法、系统、设备及介质
CN110516240B (zh) 一种基于Transformer的语义相似度计算模型DSSM技术
CN116881470A (zh) 一种生成问答对的方法及装置
CN115408523A (zh) 基于摘要提取和关键字提取的中长文本分类方法和系统
CN115221284A (zh) 文本相似度的计算方法、装置、电子设备及存储介质
CN114490974A (zh) 信息自动回复方法、装置、系统、电子设备及可读介质
CN115512374A (zh) 针对表格文本的深度学习特征提取分类方法及装置
CN110569331A (zh) 一种基于上下文的关联性预测方法、装置及存储设备
CN112925961A (zh) 一种基于企业实体的智能问答方法及装置
CN113282742B (zh) 摘要获取方法以及电子设备、存储装置
US20240086768A1 (en) Learning device, inference device, non-transitory computer-readable medium, learning method, and inference method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant