CN110659351B - 用于挖掘实体上下位关系的方法和装置 - Google Patents

用于挖掘实体上下位关系的方法和装置 Download PDF

Info

Publication number
CN110659351B
CN110659351B CN201910926654.XA CN201910926654A CN110659351B CN 110659351 B CN110659351 B CN 110659351B CN 201910926654 A CN201910926654 A CN 201910926654A CN 110659351 B CN110659351 B CN 110659351B
Authority
CN
China
Prior art keywords
question
entity
text
answer
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910926654.XA
Other languages
English (en)
Other versions
CN110659351A (zh
Inventor
丁宇辰
刘凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910926654.XA priority Critical patent/CN110659351B/zh
Publication of CN110659351A publication Critical patent/CN110659351A/zh
Application granted granted Critical
Publication of CN110659351B publication Critical patent/CN110659351B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了用于挖掘实体上下位关系的方法和装置。所述方法的一实施例包括:获取待挖掘问答文本对,待挖掘问答文本对包括实体问题文本和待从中获取实体问题的答案的候选答案文本,其中,实体问题文本包括问题意图;将所获取的问答文本对输入预先获取的实体问答模型,得到实体问题的答案,其中,实体问答模型用于从候选答案文本中确定出实体问题的答案;将问题意图作为实体问题的答案的上位词。本申请的方案可以从待挖掘问答文本对中确定出问题意图和实体问题的答案词这一对上下位词。进一步地,还可以进一步分别从待挖掘问答文本的实体问题文本挖掘出上位词并从候选答案文本中挖掘出该上位词的下位词。

Description

用于挖掘实体上下位关系的方法和装置
技术领域
本申请实施例涉及计算机领域,具体涉及自然语言处理领域,尤其涉及用于挖掘实体上下位关系的方法和装置。
背景技术
实体的上位词是对具有共同特性的一类实体的概括,例如“红色”、“黄色”、“绿色”的上位词是“颜色”,“轿车”、“卡车”的上位词是“汽车”。
实践中,可以注意到,实体上下位体系对实体问答中的答案识别有重大意义。具体地,有了这种上下位关系作为先验知识,有助于快速地缩小实体答案的范围,并且有助于实体问答算法快速、准确地找出答案。
例如,对于问题“天空是什么颜色的?”,在寻找答案的过程中,通常会先分析出问题的需求(或意图)是“颜色”,之后,从文章中找出所有名词实体。然而,文章中,通常存在大量的名词实体,从中直接定位答案十分困难。借助实体上下位关系,我们可以快速筛除上位词不是“颜色”的实体,将注意力集中在少量候选之上,甚至直接得到答案。
发明内容
本申请实施例提出了用于挖掘实体上下位关系的方法和装置。
第一方面,本申请实施例提供了一种用于挖掘实体上下位关系的方法,包括:获取待挖掘问答文本对,待挖掘问答文本对包括实体问题文本和待从中获取实体问题的答案的候选答案文本,其中,实体问题文本包括问题意图;将所获取的问答文本对输入预先获取的实体问答模型,得到实体问题的答案,其中,实体问答模型用于从候选答案文本中确定出实体问题的答案;将问题意图作为实体问题的答案的上位词。
在一些实施例中,待挖掘问答文本对中的实体问题文本通过如下方式得到:获取初始问答文本对;确定初始问答文本对中的实体问题文本的意图;响应于确定初始问答文本对中的实体问题文本未包括用于指示意图的意图词,将意图词添加至初始问答文本对中的实体问题文本中,得到待挖掘问答文本对中的实体问题文本。
在一些实施例中,实体问答模型基于待挖掘问答文本对的候选答案文本中,与问题意图的关联度确定实体问题的答案。
在一些实施例中,实体问答模型基于如下方式确定实体问题的答案:生成分别指示待挖掘问答文本对中的实体问题文本和候选答案文本的实体问题词向量和候选答案词向量;基于所生成的实体问题词向量和候选答案词向量,利用双向长短记忆算法,生成用于表征实体问题文本的上下文语义关系的实体问题表示矩阵和候选答案表示矩阵;基于实体问题表示矩阵和候选答案表示矩阵,确定实体问题文本中各个词相对于候选答案文本中各实体词的第一注意力分布矩阵,以及候选答案文本中各实体词相对于实体问题文本中各个词的第二注意力分布矩阵;对由第一注意力分布矩阵和第二注意力分布矩阵拼接得到拼接矩阵进行线性映射,并对线性映射后的矩阵进行双向长短记忆算法编码得到联合表示矩阵,其中,联合表示矩阵的各列向量用于表征候选答案文本中的其中一实体词相对于候选答案文本和实体问题文本的上下文信息;基于联合表示矩阵,确定候选答案文本中每个词为实体问题的答案的概率。
在一些实施例中,用于挖掘实体上下位关系的方法还包括:基于第一注意力分布矩阵,确定实体问题文本中的各个词与候选答案文本中各实体词之间的关联度;响应于确定实体问题文本中的词与候选答案文本中的实体词之间的关联度超过预设的关联度阈值,将实体问题文本中的词作为候选答案文本中的实体词的上位词。
第二方面,本申请实施例还提供了一种用于挖掘实体上下位关系的装置,包括:获取单元,被配置成获取待挖掘问答文本对,待挖掘问答文本对包括实体问题文本和待从中获取实体问题的答案的候选答案文本,其中,实体问题文本包括问题意图;答案生成单元,被配置成将所获取的问答文本对输入预先获取的实体问答模型,得到实体问题的答案,其中,实体问答模型用于从候选答案文本中确定出实体问题的答案;确定单元,被配置成将问题意图作为实体问题的答案的上位词。
在一些实施例中,待挖掘问答文本对中的实体问题文本通过如下方式得到:获取初始问答文本对;确定初始问答文本对中的实体问题文本的意图;响应于确定初始问答文本对中的实体问题文本未包括用于指示意图的意图词,将意图词添加至初始问答文本对中的实体问题文本中,得到待挖掘问答文本对中的实体问题文本。
在一些实施例中,实体问答模型基于待挖掘问答文本对的候选答案文本中,与问题意图的关联度确定实体问题的答案。
在一些实施例中,实体问答模型基于如下方式确定实体问题的答案:生成分别指示待挖掘问答文本对中的实体问题文本和候选答案文本的实体问题词向量和候选答案词向量;基于所生成的实体问题词向量和候选答案词向量,利用双向长短记忆算法,生成用于表征实体问题文本的上下文语义关系的实体问题表示矩阵和候选答案表示矩阵;基于实体问题表示矩阵和候选答案表示矩阵,确定实体问题文本中各个词相对于候选答案文本中各实体词的第一注意力分布矩阵,以及候选答案文本中各实体词相对于实体问题文本中各个词的第二注意力分布矩阵;对由第一注意力分布矩阵和第二注意力分布矩阵拼接得到拼接矩阵进行线性映射,并对线性映射后的矩阵进行双向长短记忆算法编码得到联合表示矩阵,其中,联合表示矩阵的各列向量用于表征候选答案文本中的其中一实体词相对于候选答案文本和实体问题文本的上下文信息;基于联合表示矩阵,确定候选答案文本中每个词为实体问题的答案的概率。
在一些实施例中,确定单元进一步被配置成:确定实体问题文本中的各个词与候选答案文本中各实体词之间的关联度;响应于确定实体问题文本中的词与候选答案文本中的实体词之间的关联度超过预设的关联度阈值,将实体问题文本中的词作为候选答案文本中的实体词的上位词。
第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面描述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中,程序被处理器执行时实现如第一方面描述的方法。
本申请实施例提供的用于挖掘实体上下位关系的方案,首先,获取包括实体问题文本和待从中获取实体问题的答案的候选答案文本的待挖掘问答文本对,其中,实体问题文本包括问题意图;接着,将所获取的问答文本对输入预先获取的实体问答模型,得到实体问题的答案,其中,实体问答模型用于从候选答案文本中确定出实体问题的答案;并且将问题意图作为实体问题的答案的上位词。这样一来,可以从待挖掘问答文本对中确定出问题意图和实体问题的答案词这一对上下位词。
进一步地,在一些实施例中,利用问答模型,本申请的用于挖掘实体上下位关系的方案还可以进一步分别从待挖掘问答文本的实体问题文本挖掘出上位词并从候选答案文本中挖掘出该上位词的下位词,进而有利于挖掘上下位关系的效率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请一个实施例的用于挖掘实体上下位关系的方法可以应用于其中的示例性系统架构图;
图2是根据本申请的用于挖掘实体上下位关系的方法的一个实施例的示意性流程图;
图3是根据本申请的用于挖掘实体上下位关系的方法的一个应用场景的示意图;
图4是根据本申请的用于挖掘实体上下位关系的方法的另一个实施例的示意性流程图;
图5是根据本申请的用于挖掘实体上下位关系的装置的一个实施例的示意性结构图;
图6是适于用来实现本申请实施例的用于挖掘实体上下位关系的方法的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的用于挖掘实体上下位关系的方法或用于挖掘实体上下位关系的装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户110可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种客户端应用,例如搜索类应用、问答类应用等。
终端设备101、102、103可以是具有屏幕的各种电子设备,包括但不限于智能手机、平板电脑、智能手表和膝上型便携计算机等等。
服务器105可以是提供各种服务的服务器,例如根据终端设备101、102、103发送的实体问题信息进行处理的后台服务器。后台服务器可以基于接收到的实体问题信息生成相应的答案,并将处理结果(例如,用于指示终端设备发送的实体问题信息的答案的答案信息)反馈给终端设备101、102、103。
需要说明的是,本申请实施例所提供的用于挖掘实体上下位关系的方法一般由服务器105执行。相应地,用于挖掘实体上下位关系的装置一般设置于服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。例如服务器可以为集群式的服务器,包括部署了不同进程的多台服务器。
此外,应该理解,在一些应用场景中,服务器105可以从存储于其本地的数据库中获取待挖掘问答文本对。在这些应用场景中,上述系统架构中可以仅有服务器,而不必有终端设备和网络。
继续参考图2,其示出了根据本申请的用于挖掘实体上下位关系的方法的一个实施例的流程200。
该用于挖掘实体上下位关系的方法,包括以下步骤:
步骤201,获取待挖掘问答文本对,待挖掘问答文本对包括实体问题文本和待从中获取实体问题的答案的候选答案文本,其中,实体问题文本包括问题意图。
本实施例的用于挖掘实体上下位关系的方法的执行主体(例如,图1所示的服务器105)可以从设置于其本地的数据库、或者设置于与执行主体通信连接的其它电子设备上的数据库中获取待挖掘问答文本对。
在这里,待挖掘文本对可以包括实体问题文本和待从中获取实体问题的答案的候选答案文本。并且,实体问题文本中包括问题意图。
所谓实体(Entity),一般是指客观存在并可相互区别的事物。实体可以是具体的人、事、物,也可以是抽象的概念或联系等。相应地,实体问题文本可以是针对某个实体进行提问时的问题文本。
问题意图,可以用于表征提问者期望从候选答案文本中得到的答案所属的实体类别。
例如,可以理解,对于实体问题文本“世界上最高的山峰是什么?”,该问题的提问者期望得到的答案是“最高的山峰”,也即,最高的山峰的实体的实体名称。而“最高的山峰”的实体所属的实体类别即为“山峰”。因而,对于实体问题文本“世界上最高的山峰是什么?”而言,其问题意图为“山峰”。
又例如,对于实体问题文本“北京好玩的景点有哪些?”,该问题的提问者期望得到的答案是“北京好玩的景点”,而“北京好玩的景点”所属的实体类别即为“景点”。因而,对于实体问题文本“北京好玩的景点有哪些?”而言,其问题意图为“景点”。
此外,可以理解的是,候选答案文本可以是期望从中获取与之相应的实体问题文本所指示的实体问题的答案的文本。
例如,与实体问题文本“世界上最高的山峰是什么?”相对应的候选答案文本可以是“众所周知,世界上最高的山峰是珠穆朗玛峰”。又例如,与实体问题文本“北京好玩的景点有哪些?”相对应的候选答案文本可以是“北京好玩的景点有故宫、颐和园、圆明园等等”。
步骤202,将所获取的问答文本对输入预先获取的实体问答模型,得到实体问题的答案,其中,实体问答模型用于从候选答案文本中确定出实体问题的答案。
在这里,实体问答模型例如可以是预先建立的、能够输入其中的问答文本对中提取出实体问题意图所对应的答案的模型。
可选地,实体问答模型例如可以是基于注意力机制的人工神经网络模型。注意力机制(Attention),从字面意思来看和人类的注意力机制类似。人类通过快速扫描全局文本,获得需要重点关注的区域,也就是一般所说的注意力焦点,而后对这一区域投入更多注意力资源,以获取更多所需要关注目标的细节信息,而抑制其他无用信息。深度学习中的注意力机制从本质上讲和人类的选择性机制类似,核心目标也是从众多信息中选择出对当前任务目标更关键的信息。
基于注意力机制的人工神经网络模型例如可以是RNN(Recursive NeuralNetwork,递归神经网络)、LSTM(Long Short-Term Memory,长短期记忆网络)或者GRNN(Gate Recursive Neural Network)模型,也可以是待未来开发的适宜用于从问答文本对中进行实体答案挖掘的模型。
可以理解的是,在使用实体问答模型得到实体问题的答案之前,还可以对实体问答模型进行训练。具体地,可以使用标注了问题意图和实体问题的答案的样本问答文本对作为训练样本,来对基于注意力机制的人工神经网络进行训练,从而使得该人工神经网络的输出中,所标注的实体问题的答案词的得分尽可能地高,而样本问答文本对的样本答案文本中,除答案词之外的其它词的得分尽可能地低。
步骤203,将问题意图作为实体问题的答案的上位词。
正如在对步骤201的描述中提及的,问题意图可以是用于表征提问者期望从候选答案文本中得到的答案所属的实体类别,而显然,实体问题的答案为该类别中的一个成员。因而,通过步骤202得到的实体问题的答案,可以作为待挖掘问答文本对中的问题意图的下位词。
可以理解的是,在得到由问题意图和实体问题的答案构成的上下位关系词对之后,可以将该上下位关系词对进行关联存储,例如,存储于设置在执行主体本地或与执行主体通信连接的电子设备上的数据库中,以便于后续的调用。
现有技术中,挖掘实体上下位关系的方法主要有以下两种。
一种方法通过对高准确的结构化数据进行拓展,得到大量上下位关系。例如,百科数据库等现有知识库中,包含了大量实体词,这些词往往具有准确的类别标签。这样一来,可以直接建立实体词与其类别标签之间的上下位关系。
另一种方法则通过统计问答数据中的共现情况得到。例如当问题中出现实体词“颜色”时,答案中经常出现“红色”和“黄色”,则认为“红色”和“黄色”的上位词是“颜色”。
针对以上第一种基于结构化数据拓展的方法,尽管由于百科数据库中标签的准确率较高,利用其得到的上下位关系也具有较高的准确率。但结构化数据中的实体词仅是全部实体词中很小的一部分,在此基础上扩展出的上下位关系也十分有限。因此,利用该方法得到的上下位关系的覆盖面较小。另外,通过实体词和其类别标签建立的上下位关系,与实体问答中所需的上下位关系并不完全匹配。例如,实体词“苹果”的标签是“水果”,当遇到问题“什么水果好吃”时,问题的意图是“水果”,因此,可以通过上下位关系找到答案“苹果”。然而,对于需求范围更广泛的问题,例如,“感冒吃什么好”,它的需求是“食物”或“药品”。因而,无法通过“苹果”-“水果”这一对上下位关系得到答案。而是需要建立“苹果”与更上位的“食物”这一词之间的上下位关系,从而找到答案。此时,基于结构化数据拓展的方法无法满足需求。
而针对以上第二种通过统计方法抽取的上下位关系,由于其抽取过程中未利用语义信息,导致其泛化能力较弱。例如,问答数据中有很多诸如“日本有哪些有名的景点?”的问题,假设这些问题的答案大多包含“北海道”,可以得到“北海道”的上位词是“景点”。但当遇到此问题的另一种问法,如“日本有哪些好玩的地方”时,由于没有建立“北海道”与“地方”的上下位关系,因而无法召回答案“北海道”。也即是说,通过统计的方法来获得上下位关系,由于缺乏语义信息,很难将上下位关系泛化至上位词和下位词的同义词以及近义词。
本申请实施例提供的用于挖掘实体上下位关系的方案,首先,获取包括实体问题文本和待从中获取实体问题的答案的候选答案文本的待挖掘问答文本对,其中,实体问题文本包括问题意图;接着,将所获取的问答文本对输入预先获取的实体问答模型,得到实体问题的答案,其中,实体问答模型用于从候选答案文本中确定出实体问题的答案;并且将问题意图作为实体问题的答案的上位词。这样一来,可以从待挖掘问答文本对中确定出问题意图和实体问题的答案词这一对上下位词。
继续参见图3,图3是根据本实施例的用于挖掘实体上下位关系的方法的应用场景的一个示意图300。
在图3所示的应用场景中,执行主体302可以从与之通信连接的数据库301中获取待挖掘问答文本对。获取到的待挖掘问答文本对例如可以如附图标记303所示,即包括实体问题文本“Q:世界上最高的山峰是什么?”以及待从中获取实体问题的答案的候选答案文本“A:世界上最高的山峰是珠穆朗玛峰”。
接着,可以将获取到的待挖掘问答文本对303输入实体问答模型304中,从而得到该待挖掘问答文本对303中,针对实体问题的答案“珠穆朗玛峰”。进而,可以得到(山峰,珠穆朗玛峰)这一上下位关系词对,如附图标记305所示。
这样一来,便可以生成由问答文本对中的问题意图和实体答案组成的上下位关系词对。并且,可以理解的是,在该上下位关系词对中,用于表征问题意图的词为用于表征实体答案的词的上位词。
参见图4所示,为本申请的用于挖掘实体上下位关系的方法的另一个实施例的示意性流程400。
该用于挖掘实体上下位关系的方法,包括以下步骤:
步骤401:获取待挖掘问答文本对,所述待挖掘问答文本对包括实体问题文本和待从中获取实体问题的答案的候选答案文本,其中,所述实体问题文本包括问题意图。
在本步骤中,可以按照与图2所示的步骤201类似的方式获取待挖掘问答文本对,例如,从设置于执行主体本地或者与之通信连接的电子设备中的数据库中获取待挖掘文本对。
从图2所示的实施例不难发现,本公开的方案最终可以得到由实体问题文本中的问题意图和实体问题的答案构成的上下位词对。然而,在实践中,人们针对某些实体所提的问题中,并不必然地包含实体问题的问题意图。
例如,在问题文本“日本哪里好玩?”中,用户期望得到的实体答案是某“地方”或者某“景点”,也即是说,问题文本“日本哪里好玩?”的问题意图为“地方”或“景点”。然而,该问题文本中却并未包含“地方”或“景点”。这样一来,该问题文本并未包含问题意图。
为了避免执行主体获取到的待挖掘问答文本对中的实体问题文本未包含问题意图,可以对数据库中的问答文本对进行如下的预处理,从而使得实体问题文本中包括问题意图。
具体地,在步骤401a,获取初始问答文本对。
可以理解,与待挖掘问答文本对类似,初始问答文本对也可以包括实体问题文本和候选答案文本。
与待挖掘问答文本对不同的是,初始问答文本对的实体问题文本中,并非一定包括问题意图。例如,“日本哪里好玩?”可以作为初始问答文本对中的实体问题文本但不能作为待挖掘问答文本对中的实体问题文本。
步骤401b,确定初始问答文本对中的实体问题文本的意图。
在这里,可以采用已有的或者待未来开发的意图识别工具来确定初始问答文本对中的实体问题文本的意图。
在一些应用场景中,可以采用预先训练的模型对初始问答文本对中的实体问题进行意图分类,从而确定该实体问题的意图。
具体地,可以首先对初始问答文本对中的实体问题进行分词,然后得到初始问答文本对中的实体问题的词向量。接着,可以将得到的词向量输入预先训练的意图分类模型中,以确定该初始问答文本对中的实体问题属于预先设置的各个意图的概率,并将概率最高的意图作为该初始问答文本对中的实体问题的意图。
步骤401c,响应于确定所述初始问答文本对中的实体问题文本未包括用于指示实体问题的意图的意图词,将用于指示所确定的意图的意图词添加至初始问答文本对中的实体问题文本中,得到待挖掘问答文本对中的实体问题文本。
在这里,用于指示实体问题的意图的意图词,可以是用于表征由步骤401b确定出的意图的词,或者,还可以是用于表征由步骤401b确定出的意图的词的同义词。
在一些应用场景中,若在步骤401b中采用意图分类模型来确定实体问题文本的意图,可以在执行主体上或者与执行主体通信连接的其它电子设备中维护一针对意图分类模型中预先设置的表征各个意图类别的意图词的同义词的同义词表。该同义词表中可以关联存储表征各个意图类别的意图词及其同义词。例如,“地点”这一词为表征一意图类别的意图词,那么,在同义词表中,关联存储了意图词“景点”以及“景点”的同义词,例如,“景区”等。
在这些应用场景中,执行主体在执行本步骤时,可以判断初始问答文本对中的实体问题文本是否包含了由意图分类模型确定出的表征某意图类别的意图词或该意图词的同义词。若既未包含表征意图类别的意图词,也未包含该意图词的同义词,则可确定该初始问答文本对中的实体问题文本未包含用于指示实体问题的意图的意图词。在此情况下,可以将由意图分类模型所确定的、表征该初始问答文本对中的实体问题文本的意图的意图词添加至初始问答文本对中的实体问题文本中,作为待挖掘问答文本对中的实体问题文本。
此外,可以理解的是,若初始问答文本对中的实体问题文本包含了表征该实体问题文本的意图词,则可以直接将初始问答文本对中的实体问题文本作为待挖掘问答文本对中的实体问题文本。
通过以上的步骤401a~401c的处理,可以使得待挖掘问答文本对中的实体问题文本中存在表征实体问题的问题意图的意图词。
步骤402,将所获取的问答文本对输入预先获取的实体问答模型,得到实体问题的答案,其中,实体问答模型用于从候选答案文本中确定出实体问题的答案。
步骤403,将问题意图作为实体问题的答案的上位词。
本实施例中的上述步骤402和步骤403可以采用与图2所示实施例中的步骤202和步骤203类似的方式,在此不再赘述。
本实施例的用于挖掘实体上下位关系的方法,与图2所示的实施例相比,可以确保待挖掘问答文本对中的实体问题文本包含表征问题意图的意图词,使得挖掘得到的上下位关系词对准确性更高。
在本申请各实施例的用于挖掘实体上下位关系的方法的一些可选的实现方式中,在从候选答案文本中确定问题意图所对应的答案时,实体问答模型可以基于待挖掘问答文本对的候选答案文本中,与问题意图的关联度确定实体问题的答案。
具体地,例如,可以使用阅读理解模型BiDAF(Bi-Directional Attention Flow,双向注意力流)模型作为实体问答模型,从而确定问题意图相对应的答案。
首先,可以将待挖掘问答文本对中的实体问题文本和候选答案文本分别输入词嵌入层中,从而生成分别指示待挖掘问答文本对中的实体问题文本和候选答案文本的实体问题词向量和候选答案词向量。
接着,可以将由词嵌入层输入的实体问题词向量和候选答案词向量输入词表示层中,分别对实体问题词向量和答案词向量使用双向lstm,捕捉各自上下文的语义关系,分别得到实体问题文本和候选答案文本的表示矩阵,也即,实体问题表示矩阵Q和候选答案表示矩阵P。
接着,可以将词表示层输出的实体问题表示矩阵Q和候选答案表示矩阵P输入注意力层中,分别计算实体问题文本中各个词相对于候选答案文本中各实体词的第一注意力分布矩阵U,以及候选答案文本中各实体词相对于实体问题文本中各个词的第二注意力分布矩阵G。
接着,可以将第一注意力分布矩阵U和第二注意力分布矩阵G输入解码层,对由第一注意力分布矩阵U和第二注意力分布矩阵G拼接得到的拼接矩阵进行线性映射,并对线性映射后的矩阵进行双向长短记忆算法编码得到联合表示矩阵M,其中,联合表示矩阵M的每一个列向量都包含候选答案文本中的实体词相对于关于候选答案文本和实体问题文本的上下文信息。
接着,可以将联合表示矩阵M输入预测层中,并基于联合表示矩阵M,来计算候选答案文本中每个词是答案的概率。例如,可以将候选答案文本中,具有最大概率的实体词作为答案。
进一步地,在上述可选的实现方式的一些应用场景中,用于挖掘实体上下位关系的方法还可以进一步包括:
基于第一注意力分布矩阵U,确定实体问题文本中的各个词与候选答案文本中各实体词之间的关联度。
响应于确定实体问题文本中的词与候选答案文本中的实体词之间的关联度超过预设的关联度阈值,将实体问题文本中的词作为候选答案文本中的实体词的上位词。
在上述可选实现方式的描述中可以看出,通过将词表示层输出的实体问题表示矩阵Q和候选答案表示矩阵P输入注意力层,可以得到实体问题文本中各个词相对于候选答案文本中各实体词的第一注意力分布矩阵U,以及候选答案文本中各实体词相对于实体问题文本中各个词的第二注意力分布矩阵G。这样一来,可以通过观测实体问题文本中各个词相对于候选答案文本中各实体词的第一注意力分布矩阵U,来确定确定实体问题文本中的各个词与候选答案文本中各实体词之间的关联度。从而,将实体问题文本中,与候选答案文本中的实体词之间的关联度超过预设的关联度阈值的词,作为该候选答案文本中的实体词的上位词。
这样一来,通过观测注意力层输出的第一注意力分布矩阵U,可以进一步根据第一注意力分布矩阵U,来从待挖掘问答文本的实体问题文本中挖掘出与候选答案文本中的实体词之间的关联度超过预设的关联度阈值的词,并将实体问题文本中的该词作为上位词并将候选答案文本中与之关联度超过关联度阈值的词作为下位词,形成上下位词对,进而有利于挖掘上下位关系的效率。
作为对上述各图所示方法的实现,本申请提供了一种用于挖掘实体上下位关系的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例的用于挖掘实体上下位关系的装置500包括获取单元501、答案生成单元502和确定单元503。
其中,获取单元501可被配置成获取待挖掘问答文本对,待挖掘问答文本对包括实体问题文本和待从中获取实体问题的答案的候选答案文本,其中,实体问题文本包括问题意图。
答案生成单元502可被配置成将所获取的问答文本对输入预先获取的实体问答模型,得到实体问题的答案,其中,实体问答模型用于从候选答案文本中确定出实体问题的答案。
确定单元503可被配置成将问题意图作为实体问题的答案的上位词。
在一些可选的实现方式中,待挖掘问答文本对中的实体问题文本通过如下方式得到:获取初始问答文本对;确定初始问答文本对中的实体问题文本的意图;响应于确定初始问答文本对中的实体问题文本未包括用于指示意图的意图词,将意图词添加至初始问答文本对中的实体问题文本中,得到待挖掘问答文本对中的实体问题文本。
在一些可选的实现方式中,实体问答模型可以基于待挖掘问答文本对的候选答案文本中,与问题意图的关联度确定实体问题的答案。
在一些可选的实现方式中,实体问答模型可以基于如下方式确定实体问题的答案:生成分别指示待挖掘问答文本对中的实体问题文本和候选答案文本的实体问题词向量和候选答案词向量;基于所生成的实体问题词向量和候选答案词向量,利用双向长短记忆算法,生成用于表征实体问题文本的上下文语义关系的实体问题表示矩阵和候选答案表示矩阵;基于实体问题表示矩阵和候选答案表示矩阵,确定实体问题文本中各个词相对于候选答案文本中各实体词的第一注意力分布矩阵,以及候选答案文本中各实体词相对于实体问题文本中各个词的第二注意力分布矩阵;对由第一注意力分布矩阵和第二注意力分布矩阵拼接得到拼接矩阵进行线性映射,并对线性映射后的矩阵进行双向长短记忆算法编码得到联合表示矩阵,其中,联合表示矩阵的各列向量用于表征候选答案文本中的其中一实体词相对于候选答案文本和实体问题文本的上下文信息;基于联合表示矩阵,确定候选答案文本中每个词为实体问题的答案的概率。
在一些可选的实现方式中,确定单元503可进一步被配置成:确定实体问题文本中的各个词与候选答案文本中各实体词之间的关联度;响应于确定实体问题文本中的词与候选答案文本中的实体词之间的关联度超过预设的关联度阈值,将实体问题文本中的词作为候选答案文本中的实体词的上位词。
下面参考图6,其示出了适于用来实现本申请实施例的用于挖掘实体上下位关系的方法的电子设备的计算机系统600的结构示意图。图6示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括一个或多个处理器601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分606加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括硬盘等的存储部分606;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分607。通信部分607经由诸如因特网的网络执行通信处理。驱动器608也根据需要连接至I/O接口605。可拆卸介质609,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器608上,以便于从其上读出的计算机程序根据需要被安装入存储部分606。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分607从网络上被下载和安装,和/或从可拆卸介质609被安装。在该计算机程序被处理器601执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元、答案生成单元以及确定单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取待挖掘问答文本对的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:获取待挖掘问答文本对,待挖掘问答文本对包括实体问题文本和待从中获取实体问题的答案的候选答案文本,其中,实体问题文本包括问题意图;将所获取的问答文本对输入预先获取的实体问答模型,得到实体问题的答案,其中,实体问答模型用于从候选答案文本中确定出实体问题的答案;将问题意图作为实体问题的答案的上位词。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (12)

1.一种用于挖掘实体上下位关系的方法,包括:
获取待挖掘问答文本对,所述待挖掘问答文本对包括实体问题文本和待从中获取实体问题的答案的候选答案文本,其中,所述实体问题文本包括问题意图;
将所获取的问答文本对输入预先获取的实体问答模型,得到所述实体问题的答案,其中,所述实体问答模型用于从所述候选答案文本中确定出所述实体问题的答案;
将所述问题意图作为所述实体问题的答案的上位词。
2.根据权利要求1所述的方法,其中,所述待挖掘问答文本对中的实体问题文本通过如下方式得到:
获取初始问答文本对;
确定所述初始问答文本对中的实体问题文本的意图;
响应于确定所述初始问答文本对中的实体问题文本未包括用于指示所述意图的意图词,将用于指示所述意图的意图词添加至所述初始问答文本对中的实体问题文本中,得到所述待挖掘问答文本对中的实体问题文本。
3.根据权利要求1所述的方法,其中,所述实体问答模型基于所述待挖掘问答文本对的候选答案文本中,与所述问题意图的关联度确定所述实体问题的答案。
4.根据权利要求1或3所述的方法,其中,所述实体问答模型基于如下方式确定所述实体问题的答案:
生成分别指示待挖掘问答文本对中的实体问题文本和候选答案文本的实体问题词向量和候选答案词向量;
基于所生成的实体问题词向量和候选答案词向量,利用双向长短记忆算法,生成用于表征所述实体问题文本的上下文语义关系的实体问题表示矩阵和候选答案表示矩阵;
基于所述实体问题表示矩阵和候选答案表示矩阵,确定所述实体问题文本中各个词相对于所述候选答案文本中各实体词的第一注意力分布矩阵,以及所述候选答案文本中各实体词相对于所述实体问题文本中各个词的第二注意力分布矩阵;
对由所述第一注意力分布矩阵和所述第二注意力分布矩阵拼接得到拼接矩阵进行线性映射,并对线性映射后的矩阵进行双向长短记忆算法编码得到联合表示矩阵,其中,所述联合表示矩阵的各列向量用于表征所述候选答案文本中的其中一实体词相对于所述候选答案文本和实体问题文本的上下文信息;
基于联合表示矩阵,确定候选答案文本中每个词为所述实体问题的答案的概率。
5.根据权利要求4所述的方法,其中,所述方法还包括:
基于所述第一注意力分布矩阵,确定所述实体问题文本中的各个词与所述候选答案文本中各实体词之间的关联度;
响应于确定实体问题文本中的词与所述候选答案文本中的实体词之间的关联度超过预设的关联度阈值,将所述实体问题文本中的词作为所述候选答案文本中的实体词的上位词。
6.一种用于挖掘实体上下位关系的装置,包括:
获取单元,被配置成获取待挖掘问答文本对,所述待挖掘问答文本对包括实体问题文本和待从中获取实体问题的答案的候选答案文本,其中,所述实体问题文本包括问题意图;
答案生成单元,被配置成将所获取的问答文本对输入预先获取的实体问答模型,得到所述实体问题的答案,其中,所述实体问答模型用于从所述候选答案文本中确定出所述实体问题的答案;
确定单元,被配置成将所述问题意图作为所述实体问题的答案的上位词。
7.根据权利要求6所述的装置,其中,所述待挖掘问答文本对中的实体问题文本通过如下方式得到:
获取初始问答文本对;
确定所述初始问答文本对中的实体问题文本的意图;
响应于确定所述初始问答文本对中的实体问题文本未包括用于指示所述意图的意图词,将用于指示所述意图的意图词添加至所述初始问答文本对中的实体问题文本中,得到所述待挖掘问答文本对中的实体问题文本。
8.根据权利要求6所述的装置,其中,所述实体问答模型基于所述待挖掘问答文本对的候选答案文本中,与所述问题意图的关联度确定所述实体问题的答案。
9.根据权利要求6或8所述的装置,其中,所述实体问答模型基于如下方式确定所述实体问题的答案:
生成分别指示待挖掘问答文本对中的实体问题文本和候选答案文本的实体问题词向量和候选答案词向量;
基于所生成的实体问题词向量和候选答案词向量,利用双向长短记忆算法,生成用于表征所述实体问题文本的上下文语义关系的实体问题表示矩阵和候选答案表示矩阵;
基于所述实体问题表示矩阵和候选答案表示矩阵,确定所述实体问题文本中各个词相对于所述候选答案文本中各实体词的第一注意力分布矩阵,以及所述候选答案文本中各实体词相对于所述实体问题文本中各个词的第二注意力分布矩阵;
对由所述第一注意力分布矩阵和所述第二注意力分布矩阵拼接得到拼接矩阵进行线性映射,并对线性映射后的矩阵进行双向长短记忆算法编码得到联合表示矩阵,其中,所述联合表示矩阵的各列向量用于表征所述候选答案文本中的其中一实体词相对于所述候选答案文本和实体问题文本的上下文信息;
基于联合表示矩阵,确定候选答案文本中每个词为所述实体问题的答案的概率。
10.根据权利要求9所述的装置,其中,所述确定单元进一步被配置成:
确定所述实体问题文本中的各个词与所述候选答案文本中各实体词之间的关联度;
响应于确定实体问题文本中的词与所述候选答案文本中的实体词之间的关联度超过预设的关联度阈值,将所述实体问题文本中的词作为所述候选答案文本中的实体词的上位词。
11.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1-5中任一所述的方法。
CN201910926654.XA 2019-09-27 2019-09-27 用于挖掘实体上下位关系的方法和装置 Active CN110659351B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910926654.XA CN110659351B (zh) 2019-09-27 2019-09-27 用于挖掘实体上下位关系的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910926654.XA CN110659351B (zh) 2019-09-27 2019-09-27 用于挖掘实体上下位关系的方法和装置

Publications (2)

Publication Number Publication Date
CN110659351A CN110659351A (zh) 2020-01-07
CN110659351B true CN110659351B (zh) 2021-01-29

Family

ID=69039561

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910926654.XA Active CN110659351B (zh) 2019-09-27 2019-09-27 用于挖掘实体上下位关系的方法和装置

Country Status (1)

Country Link
CN (1) CN110659351B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111583072B (zh) * 2020-04-27 2023-11-07 北京北大软件工程股份有限公司 法条上下位关系判断方法及处理终端
CN111723559B (zh) * 2020-06-19 2023-06-23 思必驰科技股份有限公司 一种实时信息抽取方法及装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914543B (zh) * 2014-04-03 2017-12-26 北京百度网讯科技有限公司 搜索结果的展现方法和装置
US10853396B2 (en) * 2017-12-22 2020-12-01 Sap Se Intelligent natural language query processor
CN109086328B (zh) * 2018-06-29 2021-03-30 北京百度网讯科技有限公司 一种上下位关系的确定方法、装置、服务器及存储介质
CN108932323A (zh) * 2018-06-29 2018-12-04 北京百度网讯科技有限公司 实体答案的确定方法、装置、服务器及存储介质
CN109558477B (zh) * 2018-10-23 2021-03-23 深圳先进技术研究院 一种基于多任务学习的社区问答系统、方法及电子设备
CN110263342A (zh) * 2019-06-20 2019-09-20 北京百度网讯科技有限公司 实体的上下位关系的挖掘方法和装置、电子设备

Also Published As

Publication number Publication date
CN110659351A (zh) 2020-01-07

Similar Documents

Publication Publication Date Title
US11151177B2 (en) Search method and apparatus based on artificial intelligence
CN107679039B (zh) 用于确定语句意图的方法和装置
US11507748B2 (en) Method and apparatus for outputting information
US20200301954A1 (en) Reply information obtaining method and apparatus
CN112164391B (zh) 语句处理方法、装置、电子设备及存储介质
CN109947919B (zh) 用于生成文本匹配模型的方法和装置
CN107832433B (zh) 基于对话交互的信息推荐方法、装置、服务器和存储介质
CN111274815B (zh) 用于挖掘文本中的实体关注点的方法和装置
CN107241260B (zh) 基于人工智能的新闻推送的方法和装置
CN111428010B (zh) 人机智能问答的方法和装置
CN109299320B (zh) 一种信息交互方法、装置、计算机设备和存储介质
CN110837550A (zh) 基于知识图谱的问答方法、装置、电子设备及存储介质
CN109635094B (zh) 用于生成答案的方法和装置
CN109858045B (zh) 机器翻译方法和装置
US10095736B2 (en) Using synthetic events to identify complex relation lookups
CN113157863A (zh) 问答数据处理方法、装置、计算机设备及存储介质
CN111666416A (zh) 用于生成语义匹配模型的方法和装置
CN108228567B (zh) 用于提取组织机构的简称的方法和装置
CN112925898B (zh) 基于人工智能的问答方法、装置、服务器及存储介质
CN110659351B (zh) 用于挖掘实体上下位关系的方法和装置
WO2023124215A1 (zh) 用户问题的标注方法及装置
CN111915086A (zh) 异常用户预测方法和设备
CN109829117B (zh) 用于推送信息的方法和装置
CN109710634B (zh) 用于生成信息的方法及装置
US20210004406A1 (en) Method and apparatus for storing media files and for retrieving media files

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant