CN108932323A - 实体答案的确定方法、装置、服务器及存储介质 - Google Patents

实体答案的确定方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN108932323A
CN108932323A CN201810697741.8A CN201810697741A CN108932323A CN 108932323 A CN108932323 A CN 108932323A CN 201810697741 A CN201810697741 A CN 201810697741A CN 108932323 A CN108932323 A CN 108932323A
Authority
CN
China
Prior art keywords
entity
answer
current entity
sentence
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810697741.8A
Other languages
English (en)
Inventor
丁宇辰
时迎超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810697741.8A priority Critical patent/CN108932323A/zh
Publication of CN108932323A publication Critical patent/CN108932323A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例公开了一种实体答案的确定方法、装置、服务器及存储介质。所述方法包括:获取当前实体问题和所述当前实体问题对应的至少一个实体备选答句;若所述实体备选答句满足所述预先设置的候选条件,则在所述至少一个实体备选答句中提取出所述当前实体问题对应的第一候选答案;根据所述第一候选答案和预先确定的所述当前实体问题对应的第二候选答案确定所述当前实体问题对应的当前实体答案。可以确定出更加全面、准确的实体答案,能够满足用户实体问答的需求。

Description

实体答案的确定方法、装置、服务器及存储介质
技术领域
本发明实施例涉及互联网技术领域,尤其涉及实体答案的确定方法、装置、服务器及存储介质。
背景技术
在实体问答系统中,用户可以在搜索引擎中输入实体问题;然后搜索引擎查找实体问题对应的实体答案;将实体问题对应的实体答案展现给用户。
现有的实体答案的确定方法包括以下两种:第一,基于知识图谱的实体答案的确定方法。这种方法需要首先建立准确的知识图谱库;由现有知识生成<问题、答案>对;根据各个<问题、答案>对确定实体问题对应的实体答案。第二,基于检索的实体答案的确定方法。这种方法首先分析实体问题的问题意图类型;然后根据预先确定的上下位体系查找与问题意图类型匹配的实体词,计算各个实体词为实体问题对应的实体答案的置信度;最后将置信度高于预设阈值的的答案确定为实体问题对应的实体答案。
在实现本发明的过程中,发明人发现现有技术中至少存在如下问题:
现有的第一种实体答案的确定方法,由于现有的知识图谱非常有限,因此采用第一种实体答案的确定方法只能确定出非常有限的实体答案;现有的第二种实体问题的确定方法,由于上下位体系的覆盖范围有限,根据上下位体系进行查找可能会忽略掉与问题意图类型匹配的实体词,因此采用第二种实体答案的确定方法确定出的实体答案也可能是不够全面的。另外,第二种实体答案的确定方法体根据候选答案上下文与问题的字面匹配情况计算答案置信度,无法考虑上下文的语义信息,因此采用第二种实体答案的确定方法确定出的实体答案准确性较低。
发明内容
有鉴于此,本发明实施例提供一种实体答案的确定方法、装置、服务器及存储介质,可以确定出更加全面、准确的实体答案,能够满足用户实体问答的需求。
第一方面,本发明实施例提供了一种实体答案的确定方法,所述方法包括:
获取当前实体问题和所述当前实体问题对应的至少一个实体备选答句;
若所述实体备选答句满足所述预先设置的候选条件,则在所述至少一个实体备选答句中提取出所述当前实体问题对应的第一候选答案;
根据所述第一候选答案和预先确定的所述当前实体问题对应的第二候选答案确定所述当前实体问题对应的当前实体答案。
在上述实施例中,所述若所述实体备选答句满足所述预先设置的候选条件,则在所述至少一个实体备选答句中提取出所述当前实体问题对应的第一候选答案,包括:
确定各个实体备选答句对应的答句意图与所述当前实体问题对应的问题意图;
若各个实体备选答句对应的答句意图与所述当前实体问题对应的问题意图相互匹配,则在各个实体备选答句中提取出实体词作为所属当前实体问题对应的第一候选答案。
在上述实施例中,所述若所述实体备选答句满足所述预先设置的候选条件,则在所述至少一个实体备选答句中提取出所述当前实体问题对应的第一候选答案,包括:
计算各个实体备选答句对应的关键词向量与所述当前实体问题对应的意图词向量;
若各个实体备选答案对应的关键词向量与所述当前实体问题对应的意图词向量相互匹配,则在各个实体备选答句中提取出实体词作为所属当前实体问题对应的第一候选答案。
在上述实施例中,所述根据所述第一候选答案和预先确定的所述当前实体问题对应的第二候选答案确定所述当前实体问题对应的当前实体答案,包括:
使用神经网络算法计算各个第一候选答案为所述当前实体问题对应的当前实体答案的置信度以及各个第二候选答案为所述当前实体问题对应的当前实体答案的置信度;
根据各个第一候选答案为所述当前实体问题对应的当前实体答案的置信度以及各个第二候选答案为所述当前实体问题对应的当前实体答案的置信度确定所述当前实体问题对应的当前实体答案。
在上述实施例中,在所述根据所述第一候选答案和预先确定的所述当前实体问题对应的第二候选答案确定所述当前实体问题对应的当前实体答案之后,所述方法还包括:
获取所述当前实体问题的语句成分和语句元素;
根据所述当前实体问题的语句成分和语句元素生成问题对应的答句,将所述当前实体问题对应的当前实体答案进行展示。
第二方面,本发明实施例提供了一种实体答案的确定装置,所述装置包括:获取模块、提取模块和确定模块;其中,
所述获取模块,用于获取当前实体问题和所述当前实体问题对应的至少一个实体备选答句;
所述提取模块,用于若所述实体备选答句满足所述预先设置的候选条件,则在所述至少一个实体备选答句中提取出实体词作为所述当前实体问题对应的第一候选答案;
所述确定模块,用于根据所述第一候选答案和预先确定的所述当前实体问题对应的第二候选答案确定所述当前实体问题对应的当前实体答案。
在上述实施例中,所述提取模块,具体用于确定各个实体备选答句对应的答句意图与所述当前实体问题对应的问题意图;若各个实体备选答句对应的答句意图与所述当前实体问题对应的问题意图相互匹配,则在各个实体备选答句中提取出实体词作为所述当前实体问题对应的第一候选答案。
在上述实施例中,所述确定模块包括:计算子模块和确定子模块;其中,
所述计算子模块,用于使用神经网络算法计算各个第一候选答案为所述当前实体问题对应的当前实体答案的置信度以及各个第二候选答案为所述当前实体问题对应的当前实体答案的置信度;
所述确定子模块,用于根据各个第一候选答案为所述当前实体问题对应的当前实体答案的置信度以及各个第二候选答案为所述当前实体问题对应的当前实体答案的置信度确定所述当前实体问题对应的当前实体答案。
在上述实施例中,所述装置还包括:展示模块;
所述获取模块,还用于获取所述当前实体问题的语句成分和语句元素;
所述展示模块,用于根据所述当前实体问题的语句成分和语句元素生成所述当前实体问题的答句,将所述当前实体问题对应的当前实体答案进行展示。
第三方面,本发明实施例提供了一种服务器,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所述的实体答案的确定方法。
第四方面,本发明实施例提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所述的实体答案的确定方法。
本发明实施例提出了一种实体答案的确定方法、装置、服务器及存储介质,先获取当前实体问题和当前实体问题对应的至少一个实体备选答句;若实体备选答句满足预先设置的候选条件,则在至少一个实体备选答句中提取出当前实体问题对应的第一候选答案;然后根据第一候选答案和预先确定的当前实体问题对应的第二候选答案确定当前实体问题对应的当前实体答案。也就是说,在本发明的技术方案中,若实体备选答句满足预先设置的候选条件,可以在至少一个实体备选答句中提取出当前实体问题对应的第一候选答案;根据第一候选答案和预先确定的当前实体问题对应的第二候选答案确定当前实体问题对应的当前实体答案。在现有基于知识图谱的实体答案的确定方法中,现有的知识图谱非常有限,采用该方法只能确定出非常有限的实体答案;在现有基于检索的实体答案的确定方法中,根据上下位体系进行查找可能会忽略掉与问题意图类型匹配的实体词,采用该方法确定出的实体答案也是不够全面的;而且,现有方法通过问题与候选答案上下文的字面匹配情况计算候选答案的置信度,缺乏对候选答案上下文的语义理解,准确性不高。因此,和现有技术相比,本发明实施例提出的实体答案的确定方法、装置、服务器及存储介质,可以确定出更加全面、准确的实体答案,能够满足用户实体问答的需求;并且,本发明实施例的技术方案实现简单方便、便于普及,适用范围更广。
附图说明
图1为本发明实施例一提供的实体答案的确定方法的流程示意图;
图2为本发明实施例二提供的实体答案的确定方法的流程示意图;
图3为本发明实施例三提供的实体答案的确定方法的流程示意图;
图4为本发明实施例四提供的实体答案的确定装置的结构示意图;
图5为本发明实施例五提供的服务器的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
实施例一
图1为本发明实施例一提供的实体答案的确定方法的流程示意图。如图1所示,实体答案的确定方法可以包括可以步骤:
S101、获取当前实体问题和当前实体问题对应的至少一个实体备选答句。
在本发明的具体实施例中,服务器可以获取当前实体问题和当前实体问题对应的至少一个实体备选答句。具体地,服务器可以在实体问答系统中根据当前实体问题检索出与其对应的至少一个实体备选答句。
S102、若实体备选答句满足预先设置的候选条件,则在至少一个实体备选答句中提取出当前实体问题对应的第一候选答案。
在本发明的具体实施例中,若实体备选答句满足预先设置的候选条件,服务器可以在至少一个实体备选答句中提取出当前实体问题对应的第一候选答案。具体地,服务器可以先确定各个实体备选答句对应的答句意图与当前实体问题对应的问题意图;若各个实体备选答句对应的答句意图与当前实体问题对应的问题意图相互匹配,则服务器可以在各个实体备选答句中提取出实体词作为当前实体问题对应的第一候选答案;或者,服务器还可以计算各个实体备选答句对应的关键词向量与当前实体问题对应的意图词向量;若各个实体备选答案对应的关键词向量与当前实体问题对应的意图词向量相互匹配,则服务器可以在各个实体备选答句中提取出实体词作为当前实体问题对应的第一候选答案。
S103、根据第一候选答案和预先确定的当前实体问题对应的第二候选答案确定当前实体问题对应的当前实体答案。
在本发明的具体实施例中,服务器可以根据各个第一候选答案和预先确定的当前实体问题对应的第二候选答案确定当前实体问题对应的当前实体答案。具体地,服务器可以使用神经网络算法计算各个第一候选答案为当前实体问题对应的当前实体答案的置信度以及各个第二候选答案为当前实体问题对应的当前实体答案的置信度;然后服务器可以根据各个第一候选答案为当前实体问题对应的当前实体答案的置信度以及各个第二候选答案为当前实体问题对应的当前实体答案的置信度确定当前实体问题对应的当前实体答案。较佳地,服务器可以将置信度最高的第一候选答案或者第二候选答案确定为当前实体问题对应的当前实体答案。
本发明实施例提出的实体答案的确定方法,先获取当前实体问题和当前实体问题对应的至少一个实体备选答句;若实体备选答句满足预先设置的候选条件,则在至少一个实体备选答句中提取出当前实体问题对应的第一候选答案;然后根据第一候选答案和预先确定的当前实体问题对应的第二候选答案确定当前实体问题对应的当前实体答案。也就是说,在本发明的技术方案中,若实体备选答句满足预先设置的候选条件,可以在至少一个实体备选答句中提取出当前实体问题对应的第一候选答案;根据第一候选答案和预先确定的当前实体问题对应的第二候选答案确定当前实体问题对应的当前实体答案。在现有基于知识图谱的实体答案的确定方法中,现有的知识图谱非常有限,采用该方法只能确定出非常有限的实体答案;在现有基于检索的实体答案的确定方法中,根据上下位体系进行查找可能会忽略掉与问题意图类型匹配的实体词,采用该方法确定出的实体答案也是不够全面的;而且,现有方法通过问题与候选答案上下文的字面匹配情况计算候选答案的置信度,缺乏对候选答案上下文的语义理解,准确性不高。因此,和现有技术相比,本发明实施例提出的实体答案的确定方法,可以确定出更加全面、准确的实体答案,能够满足用户实体问答的需求;并且,本发明实施例的技术方案实现简单方便、便于普及,适用范围更广。
实施例二
图2为本发明实施例二提供的实体答案的确定方法的流程示意图。如图2所示,实体答案的确定方法可以包括以下步骤:
S201、获取当前实体问题和当前实体问题对应的至少一个实体备选答句。
在本发明的具体实施例中,服务器可以获取当前实体问题和当前实体问题对应的至少一个实体备选答句。具体地,服务器可以在实体问答系统中根据当前实体问题检索出与其对应的至少一个实体备选答句。
S202、确定各个实体备选答句对应的答句意图与当前实体问题对应的问题意图。
在本发明的具体实施例中,服务器可以在获取到当前实体问题和当前实体问题对应的至少一个实体备选答句之后,服务器可以确定各个实体备选答句对应的答句意图与当前实体问题对应的问题意图。具体地,服务器可以计算各个实体备选答句对应的答句向量;然后根据各个实体备选答句对应的答句向量将各个实体备选答句划分到与其对应的答句类别中;再根据各个实体备选答句对应的答句类别确定各个实体备选答句对应的答句意图。此外,服务器可以根据预先建立的上下位体系确定当前实体问题对应的问题意图。例如,对于当前实体问题“日本有哪些有名的景点?”,它的问题意图是“景点”;再例如,对于当前实体问题“哪个超市能买到费列罗?”,它的问题意图是“超市”,然而类似“711”便利店的结果也能满足用户需求,所以可以将当前实体问题的问题意图识别为“超市”的上一层级“商店”。为了实现问题意图的识别,可以使用序列标注模型和基于循环神经网络的分类器将问题映射到上下位体系中的上位词集合里,从而实现问题意图的识别。
S203、若各个实体备选答句对应的答句意图与当前实体问题对应的问题意图相互匹配,则在各个实体备选答句中提取出实体词作为当前实体问题对应的第一候选答案。
在本发明的具体实施例中,若各个实体备选答句对应的答句意图与当前实体问题对应的问题意图相互匹配,则服务器在各个实体备选答句中提取出实体词作为当前实体问题对应的第一候选答案。具体地,服务器可以计算各个答句意图的意图词向量与问题意图的意图词向量;若各个答句意图的意图词向量与问题意图的意图词向量的夹角在预设范围内,此时服务器可以确定各个实体备选答句对应的答句意图与当前实体问题对应的问题意图相互匹配,然后服务器可以在各个实体备选答句中提取出实体词作为当前实体问题对应的第一候选答案。
S204、根据各个第一候选答案和预先确定的当前实体问题对应的第二候选答案确定当前实体问题对应的当前实体答案。
在本发明的具体实施例中,服务器可以各个第一候选答案和预先确定的当前实体问题对应的第二候选答案确定当前实体问题对应的当前实体答案。具体地,服务器可以使用神经网络算法计算各个第一候选答案为当前实体问题对应的当前实体答案的置信度以及各个第二候选答案为当前实体问题对应的当前实体答案的置信度;然后服务器可以根据各个第一候选答案为当前实体问题对应的当前实体答案的置信度以及各个第二候选答案为当前实体问题对应的当前实体答案的置信度确定当前实体问题对应的当前实体答案。较佳地,服务器可以将置信度最高的第一候选答案或者第二候选答案确定为当前实体问题对应的当前实体答案。
较佳地,在本发明的具体实施例中,服务器还可以获取当前实体问题的语句成分和语句元素;其中,语句成分包括但不限于:主语和定语;语句元素包括但不限于:疑问词和意图词;然后根据当前实体问题的语句成分和语句元素生成当前实体问题的答句,将当前实体问题对应的当前实体答案进行展示。例如,如“五岳有哪五座山”中,“五岳”是主语,“哪”是疑问词,“山”是意图词;以当前问题中的主语、定语等主要成分为基础,使用具有拷贝机制的神经网络序列生成模型生成答句;该模型可以将判断是否采用问题中的词,或添加其它词组成答句,并保证答句的通顺性。
本发明实施例提出的实体答案的确定方法,先获取当前实体问题和当前实体问题对应的至少一个实体备选答句;若实体备选答句满足预先设置的候选条件,则在至少一个实体备选答句中提取出当前实体问题对应的第一候选答案;然后根据第一候选答案和预先确定的当前实体问题对应的第二候选答案确定当前实体问题对应的当前实体答案。也就是说,在本发明的技术方案中,若实体备选答句满足预先设置的候选条件,可以在至少一个实体备选答句中提取出当前实体问题对应的第一候选答案;根据第一候选答案和预先确定的当前实体问题对应的第二候选答案确定当前实体问题对应的当前实体答案。在现有基于知识图谱的实体答案的确定方法中,现有的知识图谱非常有限,采用该方法只能确定出非常有限的实体答案;在现有基于检索的实体答案的确定方法中,根据上下位体系进行查找可能会忽略掉与问题意图类型匹配的实体词,采用该方法确定出的实体答案也是不够全面的;而且,现有方法通过问题与候选答案上下文的字面匹配情况计算候选答案的置信度,缺乏对候选答案上下文的语义理解,准确性不高。因此,和现有技术相比,本发明实施例提出的实体答案的确定方法,可以确定出更加全面、准确的实体答案,能够满足用户实体问答的需求;并且,本发明实施例的技术方案实现简单方便、便于普及,适用范围更广。
实施例三
图3为本发明实施例三提供的实体答案的确定方法的流程示意图。如图3所示,实体答案的确定方法可以包括以下步骤:
S301、获取当前实体问题和当前实体问题对应的至少一个实体备选答句。
在本发明的具体实施例中,服务器可以获取当前实体问题和当前实体问题对应的至少一个实体备选答句。具体地,服务器可以在实体问答系统中根据当前实体问题检索出与其对应的至少一个实体备选答句。
S302、计算各个实体备选答句对应的关键词向量与当前实体问题对应的意图词向量。
在本发明的具体实施例中,服务器可以计算各个实体备选答句对应的关键词向量与当前实体问题对应的意图词向量。具体地,若各个实体备选答句中存在多个关键词,服务器可以计算各个关键词对应的关键词向量;然后将各个关键词向量相加得到各个实体备选答句对应的关键词向量。
S303、若各个实体备选答案对应的关键词向量与当前实体问题对应的意图词向量相互匹配,则在各个实体备选答句中提取出实体词作为当前实体问题对应的第一候选答案。
在本发明的具体实施例中,若各个实体备选答案对应的关键词向量与当前实体问题对应的意图词向量相互匹配,则服务器在各个实体备选答句中提取出实体词作为当前实体问题对应的第一候选答案。具体地,若各个关键词向量与意图词向量的夹角在预设范围内,此时服务器可以确定各个实体备选答案对应的关键词向量与当前实体问题对应的意图词向量相互匹配,然后服务器可以在各个实体备选答句中提取出实体词作为当前实体问题对应的第一候选答案。
S304、根据各个第一候选答案和预先确定的各个第二候选答案确定当前实体问题对应的当前实体答案。
在本发明的具体实施例中,服务器可以各个第一候选答案和预先确定的当前实体问题对应的第二候选答案确定当前实体问题对应的当前实体答案。具体地,服务器可以使用神经网络算法计算各个第一候选答案为当前实体问题对应的当前实体答案的置信度以及各个第二候选答案为当前实体问题对应的当前实体答案的置信度;然后服务器可以根据各个第一候选答案为当前实体问题对应的当前实体答案的置信度以及各个第二候选答案为当前实体问题对应的当前实体答案的置信度确定当前实体问题对应的当前实体答案。较佳地,服务器可以将置信度最高的第一候选答案或者第二候选答案确定为当前实体问题对应的当前实体答案。
较佳地,在本发明的具体实施例中,服务器还可以获取当前实体问题的语句成分和语句元素;其中,语句成分包括但不限于:主语和定语;语句元素包括但不限于:疑问词和意图词;然后根据当前实体问题的语句成分和语句元素生成当前实体问题的答句,将当前实体问题对应的当前实体答案进行展示。例如,如“五岳有哪五座山”中,“五岳”是主语,“哪”是疑问词,“山”是意图词;以当前问题中的主语、定语等主要成分为基础,使用具有拷贝机制的神经网络序列生成模型生成答句;该模型可以将判断是否采用问题中的词,或添加其它词组成答句,并保证答句的通顺性。
本发明实施例提出的实体答案的确定方法,先获取当前实体问题和当前实体问题对应的至少一个实体备选答句;若实体备选答句满足预先设置的候选条件,则在至少一个实体备选答句中提取出当前实体问题对应的第一候选答案;然后根据第一候选答案和预先确定的当前实体问题对应的第二候选答案确定当前实体问题对应的当前实体答案。也就是说,在本发明的技术方案中,若实体备选答句满足预先设置的候选条件,可以在至少一个实体备选答句中提取出当前实体问题对应的第一候选答案;根据第一候选答案和预先确定的当前实体问题对应的第二候选答案确定当前实体问题对应的当前实体答案。在现有基于知识图谱的实体答案的确定方法中,现有的知识图谱非常有限,采用该方法只能确定出非常有限的实体答案;在现有基于检索的实体答案的确定方法中,根据上下位体系进行查找可能会忽略掉与问题意图类型匹配的实体词,采用该方法确定出的实体答案也是不够全面的;而且,现有方法通过问题与候选答案上下文的字面匹配情况计算候选答案的置信度,缺乏对候选答案上下文的语义理解,准确性不高。因此,和现有技术相比,本发明实施例提出的实体答案的确定方法,可以确定出更加全面、准确的实体答案,能够满足用户实体问答的需求;并且,本发明实施例的技术方案实现简单方便、便于普及,适用范围更广。
实施例四
图4为本发明实施例四提供的实体答案的确定装置的结构示意图。如图4所示,实体答案的确定装置可以包括:获取模块401、提取模块402和确定模块403;其中,
所述获取模块401,用于获取当前实体问题和所述当前实体问题对应的至少一个实体备选答句;
所述提取模块402,用于若所述实体备选答句满足所述预先设置的候选条件,则在所述至少一个实体备选答句中提取出所述当前实体问题对应的第一候选答案;
所述确定模块403,用于根据所述第一候选答案和预先确定的所述当前实体问题对应的第二候选答案确定所述当前实体问题对应的当前实体答案。
进一步的,所述提取模块402,具体用于确定各个实体备选答句对应的答句意图与所述当前实体问题对应的问题意图;若各个实体备选答句对应的答句意图与所述当前实体问题对应的问题意图相互匹配,则在各个实体备选答句中提取出实体词作为所述当前实体问题对应的第一候选答案。
进一步的,所述提取模块402,具体用于计算各个实体备选答句对应的关键词向量与所述当前实体问题对应的意图词向量;若各个实体备选答案对应的关键词向量与所述当前实体问题对应的意图词向量相互匹配,则在各个实体备选答句中提取出实体词作为所述当前实体问题对应的第一候选答案。
进一步的,所述确定模块403包括:计算子模块4031(图中未示出)和确定子模块4032(图中未示出);其中,
所述计算子模块4031,用于使用神经网络算法计算各个第一候选答案为所述当前实体问题对应的当前实体答案的置信度以及各个第二候选答案为所述当前实体问题对应的当前实体答案的置信度;
所述确定子模块4032,用于根据各个第一候选答案为所述当前实体问题对应的当前实体答案的置信度以及各个第二候选答案为所述当前实体问题对应的当前实体答案的置信度确定所述当前实体问题对应的当前实体答案。
进一步的,所述装置还包括:展示模块404(图中未示出);
所述获取模块401,还用于获取所述当前实体问题的语句成分和语句元素;其中,所述语句成分包括但不限于:主语和定语;所述语句元素包括但不限于:疑问词和意图词;
所述展示模块404,用于根据所述当前实体问题的语句成分和语句元素生成当实体问题的答句,将所述当前实体问题对应的当前实体答案进行展示。
上述实体答案的确定装置可执行本发明任意实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明任意实施例提供的实体答案的确定方法。
实施例五
图5为本发明实施例五提供的服务器的结构示意图。图5示出了适于用来实现本发明实施方式的示例性服务器的框图。图5显示的服务器12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,服务器12以通用计算设备的形式表现。服务器12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
服务器12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被服务器12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
服务器12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该服务器12交互的设备通信,和/或与使得该服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,服务器12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与服务器12的其它模块通信。应当明白,尽管图中未示出,可以结合服务器12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的实体答案的确定方法。
实施例六
本发明实施例六提供了一种计算机存储介质。
本发明实施例的计算机可读存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (12)

1.一种实体答案的确定方法,其特征在于,所述方法包括:
获取当前实体问题和所述当前实体问题对应的至少一个实体备选答句;
若所述实体备选答句满足所述预先设置的候选条件,则在所述至少一个实体备选答句中提取出所述当前实体问题对应的第一候选答案;
根据所述第一候选答案和预先确定的所述当前实体问题对应的第二候选答案确定所述当前实体问题对应的当前实体答案。
2.根据权利要求1所述的方法,其特征在于,所述若所述实体备选答句满足所述预先设置的候选条件,则在所述至少一个实体备选答句中提取出所述当前实体问题对应的第一候选答案,包括:
确定各个实体备选答句对应的答句意图与所述当前实体问题对应的问题意图;
若各个实体备选答句对应的答句意图与所述当前实体问题对应的问题意图相互匹配,则在各个实体备选答句中提取出实体词作为所述当前实体问题对应的第一候选答案。
3.根据权利要求1所述的方法,其特征在于,所述若所述实体备选答句满足所述预先设置的候选条件,则在所述至少一个实体备选答句中提取出所述当前实体问题对应的第一候选答案,包括:
计算各个实体备选答句对应的关键词向量与所述当前实体问题对应的意图词向量;
若各个实体备选答案对应的关键词向量与所述当前实体问题对应的意图词向量相互匹配,则在各个实体备选答句中提取出实体词作为所述当前实体问题对应的第一候选答案。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第一候选答案和预先确定的所述当前实体问题对应的第二候选答案确定所述当前实体问题对应的当前实体答案,包括:
使用神经网络算法计算各个第一候选答案为所述当前实体问题对应的当前实体答案的置信度以及各个第二候选答案为所述当前实体问题对应的当前实体答案的置信度;
根据各个第一候选答案为所述当前实体问题对应的当前实体答案的置信度以及各个第二候选答案为所述当前实体问题对应的当前实体答案的置信度确定所述当前实体问题对应的当前实体答案。
5.根据权利要求1所述的方法,其特征在于,在所述根据所述第一候选答案和预先确定的所述当前实体问题对应的第二候选答案确定所述当前实体问题对应的当前实体答案之后,所述方法还包括:
获取所述当前实体问题的语句成分和语句元素;
根据所述当前实体问题的语句成分和语句元素生成所述当前实体问题的答句,将所述当前实体问题对应的当前实体答案进行展示。
6.一种实体答案的确定装置,其特征在于,所述装置包括:获取模块、提取模块和确定模块;其中,
所述获取模块,用于获取当前实体问题和所述当前实体问题对应的至少一个实体备选答句;
所述提取模块,用于若所述实体备选答句满足所述预先设置的候选条件,则在所述至少一个实体备选答句中提取出所述当前实体问题对应的第一候选答案;
所述确定模块,用于根据所述第一候选答案和预先确定的所述当前实体问题对应的第二候选答案确定所述当前实体问题对应的当前实体答案。
7.根据权利要求6所述的装置,其特征在于:
所述提取模块,具体用于确定各个实体备选答句对应的答句意图与所述当前实体问题对应的问题意图;若各个实体备选答句对应的答句意图与所述当前实体问题对应的问题意图相互匹配,则在各个实体备选答句中提取出实体词作为所述当前实体问题对应的第一候选答案。
8.根据权利要求6所述的装置,其特征在于:
所述提取模块,具体用于计算各个实体备选答句对应的关键词向量与所述当前实体问题对应的意图词向量;若各个实体备选答案对应的关键词向量与所述当前实体问题对应的意图词向量相互匹配,则在各个实体备选答句中提取出实体词作为所述当前实体问题对应的第一候选答案。
9.根据权利要求6所述的装置,其特征在于,所述确定模块包括:计算子模块和确定子模块;其中,
所述计算子模块,用于使用神经网络算法计算各个第一候选答案为所述当前实体问题对应的当前实体答案的置信度以及各个第二候选答案为所述当前实体问题对应的当前实体答案的置信度;
所述确定子模块,用于根据各个第一候选答案为所述当前实体问题对应的当前实体答案的置信度以及各个第二候选答案为所述当前实体问题对应的当前实体答案的置信度确定所述当前实体问题对应的当前实体答案。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:展示模块;
所述获取模块,还用于获取所述当前实体问题的语句成分和语句元素;
所述展示模块,用于根据所述当前实体问题的语句成分和语句元素生成所述当前实体问题的答句,将所述当前实体问题对应的当前实体答案进行展示。
11.一种服务器,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至5中任一项所述的实体答案的确定方法。
12.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至5中任一项所述的实体答案的确定方法。
CN201810697741.8A 2018-06-29 2018-06-29 实体答案的确定方法、装置、服务器及存储介质 Pending CN108932323A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810697741.8A CN108932323A (zh) 2018-06-29 2018-06-29 实体答案的确定方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810697741.8A CN108932323A (zh) 2018-06-29 2018-06-29 实体答案的确定方法、装置、服务器及存储介质

Publications (1)

Publication Number Publication Date
CN108932323A true CN108932323A (zh) 2018-12-04

Family

ID=64447012

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810697741.8A Pending CN108932323A (zh) 2018-06-29 2018-06-29 实体答案的确定方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN108932323A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109800291A (zh) * 2018-12-12 2019-05-24 平安科技(深圳)有限公司 问题应答方法及装置、电子设备和存储介质
CN109885180A (zh) * 2019-02-21 2019-06-14 北京百度网讯科技有限公司 纠错方法和装置、计算机可读介质
CN110134775A (zh) * 2019-05-10 2019-08-16 中国联合网络通信集团有限公司 问答数据生成方法及装置、存储介质
CN110659351A (zh) * 2019-09-27 2020-01-07 北京百度网讯科技有限公司 用于挖掘实体上下位关系的方法和装置
CN111507827A (zh) * 2020-04-20 2020-08-07 上海商涌网络科技有限公司 一种健康风险评估的方法、终端及计算机存储介质
CN111680133A (zh) * 2019-03-11 2020-09-18 阿里巴巴集团控股有限公司 直播问答方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101872349A (zh) * 2009-04-23 2010-10-27 国际商业机器公司 处理自然语言问题的方法和装置
CN103049433A (zh) * 2012-12-11 2013-04-17 微梦创科网络科技(中国)有限公司 自动问答方法、自动问答系统及构建问答实例库的方法
CN104598445A (zh) * 2013-11-01 2015-05-06 腾讯科技(深圳)有限公司 自动问答系统和方法
CN106649786A (zh) * 2016-12-28 2017-05-10 北京百度网讯科技有限公司 基于深度问答的答案检索方法及装置
CN106874441A (zh) * 2017-02-07 2017-06-20 腾讯科技(上海)有限公司 智能问答方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101872349A (zh) * 2009-04-23 2010-10-27 国际商业机器公司 处理自然语言问题的方法和装置
CN103049433A (zh) * 2012-12-11 2013-04-17 微梦创科网络科技(中国)有限公司 自动问答方法、自动问答系统及构建问答实例库的方法
CN104598445A (zh) * 2013-11-01 2015-05-06 腾讯科技(深圳)有限公司 自动问答系统和方法
CN106649786A (zh) * 2016-12-28 2017-05-10 北京百度网讯科技有限公司 基于深度问答的答案检索方法及装置
CN106874441A (zh) * 2017-02-07 2017-06-20 腾讯科技(上海)有限公司 智能问答方法和装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109800291A (zh) * 2018-12-12 2019-05-24 平安科技(深圳)有限公司 问题应答方法及装置、电子设备和存储介质
CN109800291B (zh) * 2018-12-12 2024-03-15 平安科技(深圳)有限公司 问题应答方法及装置、电子设备和存储介质
CN109885180A (zh) * 2019-02-21 2019-06-14 北京百度网讯科技有限公司 纠错方法和装置、计算机可读介质
CN109885180B (zh) * 2019-02-21 2022-12-06 北京百度网讯科技有限公司 纠错方法和装置、计算机可读介质
US11663269B2 (en) 2019-02-21 2023-05-30 Beijing Baidu Netcom Science And Technology Co., Ltd. Error correction method and apparatus, and computer readable medium
CN111680133A (zh) * 2019-03-11 2020-09-18 阿里巴巴集团控股有限公司 直播问答方法及装置
CN110134775A (zh) * 2019-05-10 2019-08-16 中国联合网络通信集团有限公司 问答数据生成方法及装置、存储介质
CN110659351A (zh) * 2019-09-27 2020-01-07 北京百度网讯科技有限公司 用于挖掘实体上下位关系的方法和装置
CN111507827A (zh) * 2020-04-20 2020-08-07 上海商涌网络科技有限公司 一种健康风险评估的方法、终端及计算机存储介质

Similar Documents

Publication Publication Date Title
CN108932323A (zh) 实体答案的确定方法、装置、服务器及存储介质
US11023682B2 (en) Vector representation based on context
CN109299320B (zh) 一种信息交互方法、装置、计算机设备和存储介质
CN110046965A (zh) 信息推荐方法、装置、设备和介质
CN109325108A (zh) 查询处理方法、装置、服务器及存储介质
CN109582880A (zh) 兴趣点信息处理方法、装置、终端及存储介质
CN109599095A (zh) 一种语音数据的标注方法、装置、设备和计算机存储介质
CN109918513A (zh) 图像处理方法、装置、服务器及存储介质
CN107181879B (zh) 识别来电意图
CN109408829A (zh) 文章可读性确定方法、装置、设备和介质
CN107861948A (zh) 一种标签提取方法、装置、设备和介质
CN109408834A (zh) 辅助机器翻译方法、装置、设备及存储介质
CN110377750A (zh) 评论生成及评论生成模型训练方法、装置及存储介质
CN109933530A (zh) 控件测试方法及装置、设备及存储介质
CN110175128A (zh) 一种相似代码案例获取方法、装置、设备和存储介质
CN109657127A (zh) 一种答案获取方法、装置、服务器及存储介质
US11645323B2 (en) Coarse-to-fine multimodal gallery search system with attention-based neural network models
CN109033456A (zh) 一种条件查询方法、装置、电子设备和存储介质
CN109597881A (zh) 匹配度确定方法、装置、设备和介质
CN108399128A (zh) 一种用户数据的生成方法、装置、服务器及存储介质
CN109635868A (zh) 障碍物类别的确定方法、装置、电子设备及存储介质
CN109346060A (zh) 语音识别方法、装置、设备及存储介质
CN110362688A (zh) 试题标注方法、装置、设备及计算机可读存储介质
CN109446433A (zh) 一种兴趣点失效校验方法、装置、服务器及存储介质
CN108920715A (zh) 客服的智能化辅助方法、装置、服务器和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181204

RJ01 Rejection of invention patent application after publication