CN106682194B

CN106682194B - 基于深度问答的答案定位方法及装置

Info

Publication number: CN106682194B
Application number: CN201611249487.2A
Authority: CN
Inventors: 孙兴武; 李兴建
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2016-12-29
Filing date: 2016-12-29
Publication date: 2020-05-22
Anticipated expiration: 2036-12-29
Also published as: US20180189385A1; US10706090B2; CN106682194A

Abstract

本发明提出了一种基于深度问答的答案定位方法及装置，其中，方法包括：接收输入的查询语句；对查询语句进行解析，以生成查询语句对应的语义解析树；利用预先建立的匹配库，对语义解析树进行匹配，以获取匹配库中候选答案与语义解析树的对齐概率；根据对齐概率确定最终答案。通过本发明能够避免用户点击链接以及在冗长的文本中寻找答案的过程，直观、清晰地展现用户所需答案，深度满足用户的搜索服务需求。

Description

基于深度问答的答案定位方法及装置

技术领域

本发明涉及互联网技术领域，尤其涉及一种基于深度问答的答案定位方法及装置。

背景技术

深度问答(Deep Question and Answer，DeepQA)，是指理解人类的语言，智能识别问题的含义，并从海量的互联网数据中提取问题的答案。

随着互联网的快速发展，搜索引擎的功能日趋强大，用户对搜索引擎的期望也越来越高，开始由基本的相关网页召回向智能问答转变。当用户通过搜索引擎输入所要查询的问题时，希望获得的搜索结果不再是相关的网页，而希望能够直接获得问题的答案。

然而，现有的搜索引擎技术仅能通过信息检索和文档摘要技术，向用户提供相关性较高的网页作为检索结果，用户需要结合网页标题、正文摘要甚至是网页链接等信息确定所要查看的网页，并自行在冗余的文本中查找答案。因此，现有技术无法直观、清晰地向用户展现所需答案。

发明内容

本发明的目的旨在至少在一定程度上解决上述的技术问题之一。

为此，本发明的第一个目的在于提出一种基于深度问答的答案定位方法，该方法能够避免用户点击链接以及在冗长的文本中寻找答案的过程，直观、清晰地展现用户所需答案，深度满足用户的搜索服务需求。

本发明的第二个目的在于提出一种基于深度问答的答案定位装置。

本发明的第三个目的在于提出一种终端。

本发明的第四个目的在于提出一种非临时性计算机可读存储介质。

本发明的第五个目的在于提出一种计算机程序产品。

为了实现上述目的，本发明第一方面实施例提出了一种基于深度问答的答案定位方法，包括：接收输入的查询语句；对查询语句进行解析，以生成查询语句对应的语义解析树；利用预先建立的匹配库，对语义解析树进行匹配，以获取匹配库中候选答案与语义解析树的对齐概率；根据对齐概率确定最终答案。

本发明第一方面实施例提出的基于深度问答的答案定位方法，通过接收输入的查询语句，对查询语句进行解析，以生成查询语句对应的语义解析树，利用预先建立的匹配库对语义解析树进行匹配，以获取匹配库中候选答案与语义解析树的对齐概率，根据对齐概率确定最终答案。由此，能够避免用户点击链接以及在冗长的文本中寻找答案的过程，直观、清晰地展现用户所需答案，深度满足用户的搜索服务需求。

为了实现上述目的，本发明第二方面实施例提出了一种基于深度问答的答案定位装置，包括：接收模块，用于接收输入的查询语句；解析模块，用于对查询语句进行解析，以生成查询语句对应的语义解析树；匹配模块，用于利用预先建立的匹配库，对语义解析树进行匹配，以获取匹配库中候选答案与语义解析树的对齐概率；确定模块，用于根据对齐概率确定最终答案。

本发明第二方面实施例提出的基于深度问答的答案定位装置，通过接收输入的查询语句，对查询语句进行解析，以生成查询语句对应的语义解析树，利用预先建立的匹配库对语义解析树进行匹配，以获取匹配库中候选答案与语义解析树的对齐概率，根据对齐概率确定最终答案。由此，能够避免用户点击链接以及在冗长的文本中寻找答案的过程，直观、清晰地展现用户所需答案，深度满足用户的搜索服务需求。

为了实现上述目的，本发明第三方面实施例提出了一种终端，包括：处理器；用于存储处理器可执行指令的存储器。其中，处理器被配置为执行以下步骤：

接收输入的查询语句；

对查询语句进行解析，以生成查询语句对应的语义解析树；

利用预先建立的匹配库，对语义解析树进行匹配，以获取匹配库中候选答案与语义解析树的对齐概率；

根据对齐概率确定最终答案。

本发明第三方面实施例提出的终端，通过接收输入的查询语句，对查询语句进行解析，以生成查询语句对应的语义解析树，利用预先建立的匹配库对语义解析树进行匹配，以获取匹配库中候选答案与语义解析树的对齐概率，根据对齐概率确定最终答案。由此，能够避免用户点击链接以及在冗长的文本中寻找答案的过程，直观、清晰地展现用户所需答案，深度满足用户的搜索服务需求。

为了实现上述目的，本发明第四方面实施例提出了一种非临时性计算机可读存储介质，用于存储一个或多个程序，当存储介质中的指令由移动终端的处理器执行时，使得移动终端能够执行一种基于深度问答的答案定位方法，方法包括；

接收输入的查询语句；

对查询语句进行解析，以生成查询语句对应的语义解析树；

根据对齐概率确定最终答案。

本发明第四方面实施例提出的非临时性计算机可读存储介质，通过接收输入的查询语句，对查询语句进行解析，以生成查询语句对应的语义解析树，利用预先建立的匹配库对语义解析树进行匹配，以获取匹配库中候选答案与语义解析树的对齐概率，根据对齐概率确定最终答案。由此，能够避免用户点击链接以及在冗长的文本中寻找答案的过程，直观、清晰地展现用户所需答案，深度满足用户的搜索服务需求。

为了实现上述目的，本发明第五方面实施例提出了一种计算机程序产品，当计算机程序产品中的指令被处理器执行时，执行一种基于深度问答的答案定位方法，方法包括：

接收输入的查询语句；

对查询语句进行解析，以生成查询语句对应的语义解析树；

根据对齐概率确定最终答案。

本发明第五方面实施例提出的计算机程序产品，通过接收输入的查询语句，对查询语句进行解析，以生成查询语句对应的语义解析树，利用预先建立的匹配库对语义解析树进行匹配，以获取匹配库中候选答案与语义解析树的对齐概率，根据对齐概率确定最终答案。由此，能够避免用户点击链接以及在冗长的文本中寻找答案的过程，直观、清晰地展现用户所需答案，深度满足用户的搜索服务需求。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1是本发明一实施例提出的基于深度问答的答案定位方法的流程示意图；

图2是获取匹配库中候选答案与语义解析树的对齐概率的示意图；

图3是采用本实施例提出的基于深度问答的答案定位方法的搜索引擎的搜索结果显示界面图；

图4是本发明另一实施例提出的基于深度问答的答案定位方法的流程示意图；

图5是建立匹配库的流程示意图；

图6是问答对统计对齐结果示意图；

图7是本发明一实施例提出的基于深度问答的答案定位装置的结构示意图；

图8是本发明另一实施例提出的基于深度问答的答案定位装置的结构示意图；

图9是本发明又一实施例提出的基于深度问答的答案定位装置的结构示意图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。相反，本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。

随着网络信息技术的发展，用户对搜索引擎的需求已不满足于基本的相关网页召回，开始向智能问答方向转变。比如，当用户通过搜索引擎输入查询语句“海水为什么是咸的”时，希望能够在搜索结果显示界面直接获得海水是咸的的原因。

然而，现有的搜索引擎通过传统的信息检索和文档摘要技术，仅能向用户提供与查询语句有相关性的搜索结果，同时，通过摘要计算，提取网页中能够总结网页内容的文字展现给用户，以辅助用户确定点击的内容。用户需要结合网页标题、正文摘要甚至是网页链接等信息确定所要查看的网页，并从冗长的网页内容中自行提取所需答案。可见，现有的搜索引擎技术无法满足用户通过搜索结果显示界面直接获得所需答案的需求。

因此，为了弥补现有技术的不足，本发明提出了一种基于深度问答的答案定位方法，以在搜索结果显示界面中直观、清晰地展现用户所需的答案。

图1是本发明一实施例提出的基于深度问答的答案定位方法的流程示意图。

如图1所示，本实施例的基于深度问答的答案定位方法，包括：

S11：接收输入的查询语句。

本实施例中，当用户想要查询某一问题的答案时，比如用户想要了解海水是咸的的原因，可以在搜索引擎中输入想要查询的问题，即输入“海水为什么是咸的”。搜索引擎接收用户输入的查询语句，以进行答案搜索。

S12：对查询语句进行解析，以生成查询语句对应的语义解析树。

本实施例中，搜索引擎在接收了用户输入的查询语句之后，进一步对查询语句进行解析，以生成查询语句对应的语义解析树。

S13：利用预先建立的匹配库，对语义解析树进行匹配，以获取匹配库中候选答案与语义解析树的对齐概率。

其中，匹配库中候选答案与语义解析树的对齐概率，包括词对齐概率或短语对齐概率。

本实施例中，在对查询语句进行解析并获得查询语句对应的语义解析树之后，利用预先建立的匹配库，对获得的语义解析树进行匹配，以获取匹配库中候选答案与语义解析树的对齐概率，即获取匹配库中候选答案与语义解析树的词对齐概率或短语对齐概率。

具体地，当获取的对齐概率为词对齐概率时，利用预先建立的匹配库，对语义解析树进行匹配，以获取匹配库中候选答案与语义解析树的对齐概率，包括：获取语义解析树中每种词性的对齐概率；根据每种词性的对齐概率获取词对齐概率。

更具体地，获取语义解析树中每种词性的对齐概率，可以通过如下所示的公式(1)-公式(4)获取：

其中，lat、verb、noun和adj分别表示问题核心词、动词、名词和形容词，对应的Score_lat、Score_verb、Score_noun和Score_adj分别表示问题核心词、动词、名词和形容词的对齐概率。

以计算问题核心词lat的概率为例来说，遍历答案中的所有词，获取问题核心词的正向概率P(word_i|lat)和反向概率P(lat|word_i)，将问题核心词的正反向概率与所匹配词的重要性weight(word_i)相乘，乘积最大的值即为问题核心词的对齐概率。

需要说明的是，在用户输入的查询语句中，通常问题核心词、动词、名词和形容词对匹配过程起着关键作用，因此，本实施例提出的答案定位方法中，获取问题核心词、动词、名词和形容词的对齐概率。

在获取了解析树中每种词性的对齐概率之后，根据每种词性的对齐概率，使用公式(5)即可获得词对齐概率。其中，公式(5)如下所示：

Score＝(αScore_lat*βScore_verb*γScore_noun*δScore_adj)*offset_punish(5)

其中，α、β、γ和δ分别表示问题核心词、动词、名词和形容词的对齐概率的权重，可以通过训练获得；offset_punish表示偏移量的惩罚。

当获取的对齐概率为短语对齐概率时，利用预先建立的匹配库，对语义解析树进行匹配，以获取匹配库中候选答案与语义解析树的对齐概率，包括：计算匹配库中候选答案与语义解析树中所有匹配成功的短语的对齐概率与该短语包含的词的乘积，以获取短语的正向概率和反向概率；获取正向概率和反向概率中的较大值进行加权求和，以获得短语对齐概率。

计算公式如公式(6)所示：

作为一种示例，参见图2，图2是获取匹配库中候选答案与语义解析树的对齐概率的示意图。

如图2所示，用户输入的查询语句是“iPhone6如何截屏”，对查询语句进行解析后，获得对应的语义解析树“iPhone6”、“如何”和“截屏”。利用预先建立的匹配库，对语义解析树进行匹配，获得匹配库中的候选答案“可以同时按住手机HOME键关机键完成截图”，并使用前述公式计算获得候选答案与语义解析树的对齐概率。从图2中可以看出，“iPhone6”与“手机”匹配，对齐概率为0.05；“如何”与“可以”、“完成”匹配，对齐概率分别为0.05、0.001；“截屏”与“截图”匹配，对齐概率为0.22。图2中，虚线框中的部分表示短语，可以看出，短语“如何截屏”与“同时按住”和“关机键”匹配，对齐概率分别为0.45和0.41。

S14：根据对齐概率确定最终答案。

本实施例中，在获取了对齐概率之后，即可根据对齐概率确定最终答案。

具体地，可以根据词对齐概率和/或短语对齐概率，对候选答案进行排序，并将得分最高的候选答案作为最终答案。

本实施例中，在确定了最终答案之后，即可对最终答案进行相应处理，比如加粗、改变字的颜色等，并将处理后的答案显示在搜索结果展现页面上。

作为一种示例，参见图3，图3是采用本实施例提出的答案定位方法的搜索引擎的搜索结果显示界面图。

如图3所示，当用户在搜素框31中输入查询语句“海水为什么是咸的”时，搜索引擎将获得的搜索结果中与查询语句对应的答案进行加粗处理后，将搜索结果展现在显示框32中。当用户查看显示框32中的搜索结果时，能够从被加粗的文字直接获知，海水是咸的是因为“海洋中的盐类物质越积越多，海水也就变得越来越咸”。可见，本实施例提出的答案定位方法能够帮助用户直观、快速地获得所需信息。

本发明实施例提出的基于深度问答的答案定位方法，通过接收输入的查询语句，对查询语句进行解析，以生成查询语句对应的语义解析树，利用预先建立的匹配库对语义解析树进行匹配，以获取匹配库中候选答案与语义解析树的对齐概率，根据对齐概率确定最终答案。由此，能够避免用户点击链接以及在冗长的文本中寻找答案的过程，直观、清晰地展现用户所需答案，深度满足用户的搜索服务需求。

图4是本发明另一实施例提出的基于深度问答的答案定位方法的流程示意图。

如图4所示，基于上述实施例，该基于深度问答的答案定位方法还包括：

S15：建立匹配库。

本实施例中，为了能够对语义解析树进行匹配，在利用匹配库进行匹配之前，需要预先建立匹配库。

具体地，如图5所示，建立匹配库，可以包括以下步骤：

S151：获取问答资源。

其中，问答资源包括查询语句样本及其对应的答案样本。

问答资源可以通过问答社区或问答站点获得，比如，可以通过百度知道、360问答等社区获取大量的问答资源。

举例而言，查询语句样本为“海水为什么是咸的”，通过百度知道获得的答案样本为“海洋是咸的是因为海水中有浓度较高的盐分，这些盐分主要有以下两个来源：一是降水形成径流的过程中对陆地上的土壤、岩石的侵蚀作用将含盐矿物质带入河流，最终汇入海洋；二是海底本身的地质活动(火山喷发、海底热液等)会溶解一部分盐分到海水中”。由此，查询语句样本和该答案样本组成一各问答对。大量问答对的集合即构成了问答资源。

应当理解的是，为了能够训练生成匹配库，需要获取大量的问答对，从而构成问答资源，以保证匹配库的全面性。

S152：对问答资源进行统计对齐。

本实施例中，在获取了问答资源后，将问答资源中的每个问答对进行统计对齐。

具体地，可以采用相关技术中的机器学习方法，计算每个问答对中词匹配的全局最优解，以获取问答对中查询语句样本与对应的答案样本中词与词之间的对齐关系。

作为一种示例，参见图6，图6是问答对统计对齐结果示意图。

如图6所示，仍以上述“海水为什么是咸的”这一问答对为例。从图6中可以看出，该问答对的统计对齐结果为：查询语句样本中的“海水”与答案样本中的“海洋”对齐，“为什么”与“是”和“因为”对齐，“咸”与“咸的”对齐，等等。图6中，“…”表示答案样本中的剩余内容，为避免赘余，此处不一一列举。

S153：获取核心词。

本实施例中，为了提高统计对齐的准确度，还可以获取问答资源中查询语句样本的核心词，以用于对与核心词对齐的词进行过滤、筛选，获得更准确的统计对齐关系。

可选地，可以采用相关技术(比如，机器学习序列标注方法)获取核心词，采用覆盖查询比(Covered Query Ratio，CQR)算法获取查询语句、答案句的命中程度，过滤CQR值较低的对齐词以及与核心词未命中的句子。

举例而言，仍以图6中的示例为例，获取的核心词是“为什么”，利用CQR算法计算与其对齐的词“是”和“因为”的CQR值，能够确定“因为”的CQR值高于“是”的CQR值，因此，将“是”过滤掉，“为什么”的对齐词为“因为”。

S154：根据统计对齐后的问答资源生成词语表。

本实施例中，在通过获取查询语句样本的核心词并对与核心词对齐的词进行过滤、筛选，获得更准确的统计对齐关系之后，根据再次统计对齐后的问答资源生成词语表。

具体地，在统计对齐后的问答资源中，将查询语句样本中能够组成短语的词组成短语，将答案样本中能够组成短语的词组成短语，并根据组成的短语生成词语表。

S155：根据词语表生成问答资源的成对概率。

本实施例中，在获得词语表之后，根据词语表继续生成问答资源的成对概率。

具体地，在获得词语表之后，进一步根据词语表并利用语义依存分析技术对问答资源进行解析并泛化，最后按照约定公式计算获得成对概率。

其中，泛化的主要依据为依存关系、词性、词语表，以及规则限制条件等。

举例而言，将查询语句样本“海水为什么是咸的”泛化为“A为什么B”，将与查询语句对应的答案样本“海洋是咸的是因为海水中有浓度较高的盐分”泛化为“AB是因为”。

对问答资源进行解析并泛化之后，即可使用公式(7)计算获得问答资源的成对概率。其中，公式(7)如下所示：

其中，af表示答案中泛化的片段，qf表示查询语句中泛化的片段，Count(af,qf)表示af、qf的统计共现频次，count(af,qf_i)表示查询语句中泛化的第i个片段与答案中泛化的片段的共现频次。

在获得问答资源的成对概率之后，匹配库建立完成。

需要说明的是，步骤S15建立匹配库的过程可以在步骤S13执行之前的任一时刻执行，本发明对步骤S15的执行时间不作限制。

本发明实施例提出的基于深度问答的答案定位方法，通过获取问答资源，对问答资源进行统计对齐，获取核心词，根据统计对齐后的问答资源生成词语表，进而根据词语表生成问答资源的成对概率，以建立匹配库，能够获得更精准的匹配库，进而保证最终答案的准确度。

为了实现上述实施例，本发明还提出了一种基于深度问答的答案定位装置，图7是本发明一实施例提出的基于深度问答的答案定位装置的结构示意图。

如图7所示，本实施例的基于深度问答的答案定位装置包括：接收模块710、解析模块720、匹配模块730，以及确定模块740。其中，

接收模块710，用于接收输入的查询语句。

解析模块720，用于对查询语句进行解析，以生成查询语句对应的语义解析树。

匹配模块730，用于利用预先建立的匹配库，对语义解析树进行匹配，以获取匹配库中候选答案与语义解析树的对齐概率。

具体地，当对齐概率为词对齐概率时，匹配模块730用于：

获取语义解析树中每种词性的对齐概率；

根据每种词性的对齐概率获取词对齐概率。

当对齐概率为短语对齐概率时，匹配模块730用于：

计算匹配库中候选答案与语义解析树中所有匹配成功的短语的对齐概率与该短语包含的词的乘积，以获取短语的正向概率和反向概率；

获取正向概率和反向概率中的较大值进行加权求和，以获得短语对齐概率。

确定模块740，用于根据对齐概率确定最终答案。

具体地，确定模块740用于：

根据词对齐概率和/或短语对齐概率，对候选答案进行排序，并将得分最高的候选答案作为最终答案。

需要说明的是，前述实施例中对基于深度问答的答案定位方法实施例的解释说明也适用于本实施例的基于深度问答的答案定位装置，其实现原理类似，此处不再赘述。

本发明实施例提出的基于深度问答的答案定位装置，通过接收输入的查询语句，对查询语句进行解析，以生成查询语句对应的语义解析树，利用预先建立的匹配库对语义解析树进行匹配，以获取匹配库中候选答案与语义解析树的对齐概率，根据对齐概率确定最终答案。由此，能够避免用户点击链接以及在冗长的文本中寻找答案的过程，直观、清晰地展现用户所需答案，深度满足用户的搜索服务需求。

图8是本发明另一实施例提出的基于深度问答的答案定位装置的结构示意图。

如图8所示，在如图7所示的基础上，该基于深度问答的答案定位装置还包括：

建立模块750，用于建立匹配库。

具体地，如图9所示，建立模块750包括：

获取单元751，用于获取问答资源。

其中，问答资源包括查询语句样本及其对应的答案样本。

对齐单元752，用于对问答资源进行统计对齐。

第一生成单元753，用于根据统计对齐后的问答资源生成词语表。

第二生成单元754，用于根据词语表生成问答资源的成对概率。

本发明实施例提出的基于深度问答的答案定位装置，通过获取问答资源，对问答资源进行统计对齐，获取核心词，根据统计对齐后的问答资源生成词语表，进而根据词语表生成问答资源的成对概率，以建立匹配库，能够获得更精准的匹配库，进而保证最终答案的准确度。

为了实现上述实施例，本发明还提出了一种终端，包括：处理器，以及用于存储处理器可执行指令的存储器。其中，处理器被配置为执行以下步骤：

S11’：接收输入的查询语句。

S12’：对查询语句进行解析，以生成查询语句对应的语义解析树。

S13’：利用预先建立的匹配库，对语义解析树进行匹配，以获取匹配库中候选答案与语义解析树的对齐概率。

S14’：根据对齐概率确定最终答案。

需要说明的是，前述实施例中对基于深度问答的答案定位方法实施例的解释说明也适用于本实施例的终端，其实现原理类似，此处不再赘述。

本发明实施例提出的终端，通过接收输入的查询语句，对查询语句进行解析，以生成查询语句对应的语义解析树，利用预先建立的匹配库对语义解析树进行匹配，以获取匹配库中候选答案与语义解析树的对齐概率，根据对齐概率确定最终答案。由此，能够避免用户点击链接以及在冗长的文本中寻找答案的过程，直观、清晰地展现用户所需答案，深度满足用户的搜索服务需求。

为了实现上述实施例，本发明还提出了一种非临时性计算机可读存储介质，用于存储一个或多个程序，当存储介质中的指令由移动终端的处理器执行时，使得移动终端能够执行本发明第一方面实施例提出的基于深度问答的答案定位方法。

本发明实施例提出的非临时性计算机可读存储介质，通过接收输入的查询语句，对查询语句进行解析，以生成查询语句对应的语义解析树，利用预先建立的匹配库对语义解析树进行匹配，以获取匹配库中候选答案与语义解析树的对齐概率，根据对齐概率确定最终答案。由此，能够避免用户点击链接以及在冗长的文本中寻找答案的过程，直观、清晰地展现用户所需答案，深度满足用户的搜索服务需求。

为了实现上述实施例，本发明还提出了一种计算机程序产品，当计算机程序产品中的指令被处理器执行时，执行本发明第一方面实施例提出的基于深度问答的答案定位方法。

本发明实施例提出的计算机程序产品，通过接收输入的查询语句，对查询语句进行解析，以生成查询语句对应的语义解析树，利用预先建立的匹配库对语义解析树进行匹配，以获取匹配库中候选答案与语义解析树的对齐概率，根据对齐概率确定最终答案。由此，能够避免用户点击链接以及在冗长的文本中寻找答案的过程，直观、清晰地展现用户所需答案，深度满足用户的搜索服务需求。

需要说明的是，在本发明的描述中，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种基于深度问答的答案定位方法，其特征在于，包括：

接收输入的查询语句；

对所述查询语句进行解析，以生成所述查询语句对应的语义解析树；

利用预先建立的匹配库，对所述语义解析树进行匹配，以获取所述匹配库中候选答案与所述语义解析树的对齐概率，其中，所述对齐概率包括词对齐概率，所述词对齐概率根据所述语义解析树中每种词性的对齐概率确定；

根据所述对齐概率确定最终答案。

2.如权利要求1所述的方法，其特征在于，还包括；

建立所述匹配库。

3.如权利要求2所述的方法，其特征在于，建立所述匹配库，包括：

获取问答资源，所述问答资源包括查询语句样本及其对应的答案样本；

对所述问答资源进行统计对齐；

根据统计对齐后的问答资源生成词语表；

根据所述词语表生成所述问答资源的成对概率。

4.如权利要求1所述的方法，其特征在于，所述匹配库中候选答案与所述语义解析树的对齐概率，还包括：短语对齐概率。

5.如权利要求4所述的方法，其特征在于，当所述对齐概率为短语对齐概率时，利用预先建立的匹配库，对所述语义解析树进行匹配，以获取所述匹配库中候选答案与所述语义解析树的对齐概率，包括：

计算所述匹配库中候选答案与所述语义解析树中所有匹配成功的短语的对齐概率与该短语包含的词的乘积，以获取所述短语的正向概率和反向概率；

获取所述正向概率和所述反向概率中的较大值进行加权求和，以获得短语对齐概率。

6.如权利要求4所述的方法，其特征在于，根据所述对齐概率确定最终答案，包括：

根据所述词对齐概率和/或所述短语对齐概率，对候选答案进行排序，并将得分最高的候选答案作为最终答案。

7.一种基于深度问答的答案定位装置，其特征在于，包括：

接收模块，用于接收输入的查询语句；

解析模块，用于对所述查询语句进行解析，以生成所述查询语句对应的语义解析树；

匹配模块，用于利用预先建立的匹配库，对所述语义解析树进行匹配，以获取所述匹配库中候选答案与所述语义解析树的对齐概率，其中，所述对齐概率包括词对齐概率，所述词对齐概率根据所述语义解析树中每种词性的对齐概率确定；

确定模块，用于根据所述对齐概率确定最终答案。

8.如权利要求7所述的装置，其特征在于，还包括；

建立模块，用于建立所述匹配库。

9.如权利要求8所述的装置，其特征在于，所述建立模块，包括：

获取单元，用于获取问答资源，所述问答资源包括查询语句样本及其对应的答案样本；

对齐单元，用于对所述问答资源进行统计对齐；

第一生成单元，用于根据统计对齐后的问答资源生成词语表；

第二生成单元，用于根据所述词语表生成所述问答资源的成对概率。

10.如权利要求7所述的装置，其特征在于，所述匹配库中候选答案与所述语义解析树的对齐概率，还包括：短语对齐概率。

11.如权利要求10所述的装置，其特征在于，当所述对齐概率为短语对齐概率时，所述匹配模块，用于：

12.如权利要求10所述的装置，其特征在于，所述确定模块，用于：