CN114297351A

CN114297351A - 语句问答方法、装置、设备、存储介质及计算机程序产品

Info

Publication number: CN114297351A
Application number: CN202111205904.4A
Authority: CN
Inventors: 黄予; 赵瑞辉; 刘亚飞; 王硕佳; 叶碧荣; 郑建光
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2021-10-15
Filing date: 2021-10-15
Publication date: 2022-04-08

Abstract

本申请公开一种语句问答方法、装置、设备、存储介质及计算机程序产品，涉及人工智能技术领域。该方法包括：获取目标提问语句，将目标提问语句与关键词匹配树进行匹配，得到关键词匹配树中候选关键词与目标提问语句对应的第一节点属性，基于第一节点属性确定候选关键词与指定逻辑节点对应的第二节点属性，基于第二节点属性确定关键词匹配树中与目标属性要求对应的结果作为应答结果。即，通过将目标提问语句与关键词匹配树进行匹配，确定关键词匹配树中各节点的节点属性，从而得到目标提问语句对应的应答结果，提高了目标提问语句中对应候选关键词的匹配准确度，增强了匹配效率，且基于节点属性确定应答结果能够加快匹配速度。

Description

语句问答方法、装置、设备、存储介质及计算机程序产品

技术领域

本申请实施例涉及人工智能技术领域，特别涉及一种语句问答方法、装置、设备、存储介质及计算机程序产品。

背景技术

智能问答作为人机交互中的一种常见形式，在多个领域都得到了广泛应用，比如医疗领域。在智能问答过程中，用户向智能问答机器人发起提问，智能问答机器人根据用户提问查找匹配的答案并反馈给用户，在问和答中便实现了智能对话。

在智能问答过程中，用户发起的提问可能存在多种形式，但对应的回答为同一个，即一个回答存在多个相似问题集，智能问答机器人需要对问题进行相似度判断，从智能问答库中确定相似问题对应的正确答案。

然而，由于智能问答库中相似问题集有限，一些用户发起的提问没有收录进智能问答库中，智能问答的精度较低，导致用户得到的回答准确度较低。

发明内容

本申请实施例提供了一种语句问答方法、装置、设备、存储介质及计算机程序产品，能够提高获取目标提问语句对应的应答结果的准确率。所述技术方案如下：

一方面，提供了一种语句问答方法，所述方法包括：

获取目标提问语句；

将所述目标提问语句与关键词匹配树进行匹配，得到所述关键词匹配树中的候选关键词与所述目标提问语句对应的第一节点属性，所述第一节点属性用于指示所述目标提问语句与所述候选关键词的匹配关系；

基于所述第一节点属性确定所述关键词匹配树中所述候选关键词与指定逻辑节点对应的第二节点属性，所述第二节点属性用于指示所述候选关键词在所述逻辑节点处的组合逻辑关系；

基于所述第二节点属性确定所述目标提问语句对应的应答结果，所述应答结果为所述关键词匹配树中与目标属性要求对应的结果。

另一方面，提供了一种语句问答装置，所述装置包括：

获取模块，用于获取目标提问语句；

匹配模块，用于将所述目标提问语句与关键词匹配树进行匹配，得到所述关键词匹配树中的候选关键词与所述目标提问语句对应的第一节点属性，所述第一节点属性用于指示所述目标提问语句与所述候选关键词的匹配关系；

确定模块，用于基于所述第一节点属性确定所述关键词匹配树中所述候选关键词与指定逻辑节点对应的第二节点属性，所述第二节点属性用于指示所述候选关键词在所述逻辑节点处的组合逻辑关系；

所述确定模块，还用于基于所述第二节点属性确定所述目标提问语句对应的应答结果，所述应答结果为所述关键词匹配树中与目标属性要求对应的结果。

另一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述本申请实施例中任一所述语句问答方法。

另一方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述本申请实施例中任一所述的语句问答方法。

另一方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述实施例中任一所述的语句问答方法。

本申请实施例提供的技术方案带来的有益效果至少包括：

将目标提问语句与关键词匹配树中的候选关键词进行匹配，得到候选关键词与目标提问语句对应的第一节点属性，第一节点属性用于指示进行匹配后候选关键词与目标提问语句的匹配关系，基于第一节点属性确定第二节点属性，第二节点属性为关键词匹配树中候选关键词与指定逻辑节点对应的属性，且用于指示候选关键词在逻辑节点出的组合逻辑关系，通过第二节点属性确定目标提问语句对应的应答结果，也即，通过将目标提问语句与关键词匹配树进行匹配，确定关键词匹配树中各节点的节点属性，从而得到目标提问语句对应的应答结果，提高了目标提问语句中对应候选关键词的匹配准确度，增强了匹配效率，且基于节点属性确定应答结果能够加快匹配速度。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一个示例性实施例提供的实施环境示意图；

图2是本申请一个示例性实施例提供的语句问答方法的整体过程示意图；

图3是本申请一个示例性实施例提供的语句问答方法的流程图；

图4是本申请另一个示例性实施例提供的语句问答方法的流程图；

图5是本申请一个示例性实施例提供的关键词匹配树的示意图；

图6是本申请另一个示例性实施例提供的语句问答方法的流程图；

图7是本申请一个示例性实施例提供的分类模型训练过程示意图；

图8是本申请另一个示例性实施例提供的语句问答方法的流程图；

图9是本申请一个示例性实施例提供的FAQ问答项目的界面示意图。

图10是本申请一个示例性实施例提供的FAQ问答项目的装置结构图；

图11是本申请另一个示例性实施例提供的FAQ问答项目的装置结构图；

图12是本申请一个示例性实施例提供的服务器的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

首先，针对本申请实施例中涉及的名词进行简单介绍：

人工智能(Artificial Intelligence，AI)：是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

智能交通系统(Intelligent Traffic System，ITS)又称智能运输系统(Intelligent Transportation System)，是将先进的科学技术(信息技术、计算机技术、数据通信技术、传感器技术、电子控制技术、自动控制理论、运筹学、人工智能等)有效地综合运用于交通运输、服务控制和车辆制造，加强车辆、道路、使用者三者之间的联系，从而形成一种保障安全、提高效率、改善环境、节约能源的综合运输系统。

查询请求(query)：目的在于从数据库中寻找某一特定文件、网站或记录等，是搜索引擎或数据库发出的信息。

问答系统：是信息检索系统的一种高级形式，用于采用准确、简介的自然语言回答用户用自然语言提出的问题。

常见问题解答集(Frequently Asked Questions，FAQ)：一般用于智能问答系统中，FAQ智能问答系统中包含问题以及问题对应的答案，FAQ智能问答能够根据用户输入提问语句，在FAQ库中找到与用户输入的提问语句匹配的标准问题及其对应的答案，并将答案反馈给用户。

AC自动机(Aho-Corasick Automaton)是一种多模匹配算法，在给定关键词列表的场景下，能够快速匹配出用户输入文本包含的关键词。构建一个关键词匹配树，树中包含有候选关键词的叶节点将关键词匹配树中包含的候选关键词作为关键词列表，对于一条用户输入的query，用AC自动机进行匹配得到对应的候选关键词，将匹配到候选关键词对应的叶节点的布尔值设为真，未匹配到的候选关键词叶节点设为假。将叶节点的布尔值向上传播到各逻辑关系对应的节点，即可得到各条规则是否被激活，进而返回已激活规则对应的问题类别。

BERT模型(Bidirectional Encoder Representations from Transformers)：是一种一种语言模型，该模型通过联合所有层中的双向转换器来训练深度双向表示。 BERT模型融合了众多自然语言处理模型的优点，在多项自然语言处理任务中均取得较优效果。相关技术中，BERT模型的模型输入向量为字向量(Token Embedding)、位置向量(PositionEmbedding)和句向量(Segment Embedding)的向量之和。其中，字向量为文字的向量化表示，位置向量用于表征字在文本中所处的位置，句向量用于表征句子在文本中的先后顺序。

在相关技术中，FAQ问答库中一般包括标准问题、标准问题对应的答案以及标准问题对应的相似问题集合，FAQ问答系统的核心任务即为目标提问语句的匹配任务，当用户输入目标提问语句后，FAQ问答系统将输入的目标提问语句与FAQ问答库中的标准问题以及相似问题集合进行匹配，如果存在匹配的问题，将该问题对应的答案作为目标提问语句的答案反馈给用户，因此在目标提问语句的匹配任务中，常采用编辑距离算法(Edit Distance)计算用户输入的目标提问语句中的第一字符串与FAQ问答库中的第二字符串之间的相似度，通过对第一字符串进行包括插入、替换和删除等转换方式转换成第二字符串，基于转换方式的复杂度确定第一字符串与第二字符串之间的相似度，当目标提问语句中第一字符串与FAQ问答库中的第二字符串相似度达到相似度阈值，将第二字符串对应的问题(包括标准问题或者相似问题集合中至少一个)对应的答案作为目标提问语句的应答结果，采用计算相似度来完成目标提问语句匹配任务的方法只能计算目标提问语句与问题之间的字符串相似度，无法计算语句之间的深层语义相似度。

此外，在训练样本不够充足的情况下，在语句问答方法中常引入规则引擎辅助模型完成语句问答，规则引擎通常以正则表达式进行表达，用户输入目标提问语句，FAQ问答系统通过遍历所有的正则表达式对FAQ问答系统中标准问题对应的问题类别进行粗筛，再调用模型进行进一步细筛从而得到目标提问语句对应的匹配结果。然而，每进行一次语句问答都需要通过遍历正则表达式，在正则表达式较多时，使得匹配效率较低，且正则表达式无法准确表达目标提问语句中各关键词之间的逻辑关系(包括存在逻辑关系或者为无序关系)。

本申请实施例提供的语句问答方法，将目标提问语句中与关键词匹配树中的候选关键词进行匹配，得到候选关键词与目标提问语句对应的第一节点属性，第一节点属性用于指示进行匹配后候选关键词与目标提问语句的匹配关系，基于第一节点属性确定第二节点属性，第二节点属性为关键词匹配树中候选关键词与指定逻辑节点对应的属性，且用于指示候选关键词在逻辑节点处的组合逻辑关系，通过第二节点属性确定目标提问语句对应的应答结果，也即，通过将目标提问语句与关键词匹配树进行匹配，确定关键词匹配树中各节点的节点属性，从而得到目标提问语句对应的应答结果，提高了目标提问语句中对应关键词的匹配准确度，增强了匹配效率，且基于节点属性确定应答结果能够加快匹配速度。

结合上述名词简介，对本申请实施例的应用场景进行举例说明：

1.用于搜索场景中，用户通过使用搜索引擎或者其他带有搜索功能的程序，以语音或者文本输入的形式输入目标提问语句(目标提问语句可能为一句话或者几句话)，服务器中包含FAQ问答库，服务器将目标提问语句与关键词匹配树进行匹配，得到关键词匹配树中的候选关键词与目标提问语句对应的第一节点属性，基于第一节点属性确定候选关键词与指定逻辑节点对应的第二节点属性，通过第二节点属性确定目标提问语句在FAQ问答库中对应的标准问题或者相似问题，服务器将标准问题或者相似问题对应的答案作为目标提问语句的应答结果反馈给用户。

示意性的，用户通过文本输入的方式输入目标提问语句“新冠疫苗和HPV 疫苗可以一起注射吗”，关键词匹配树中的候选关键词中包括有“新冠疫苗”、“HPV疫苗”、“注射”和“人群”等，将目标提问语句与候选关键词进行匹配，得到候选关键词的第一节点属性(如：候选关键词中“新冠疫苗”、“HPV疫苗”、“注射”与目标提问语句匹配成功，但“人群”与目标提问语句匹配失败)，并基于第一节点属确定候选关键词与指定逻辑节点对应的第二节点属性(如：“新冠疫苗”与“HPV疫苗”和指定逻辑节点对应连接，二者为对比关系)，基于第二节点属性确定目标提问语句对应FAQ问答库中对应的标准问题为“新冠疫苗和其他疫苗可以一起注射吗”，将标准问题对应的答案(答案为“专家不建议同时注射”)作为该目标提问语句对应的答案反馈至用户。

其中，服务器将目标提问语句与候选实体词进行匹配得到第一节点属性以及第二节点属性，该匹配方式在后续实施例中进行详细介绍。

2.车载终端接收语音求助询问场景，车载终端中安装有包含FAQ问答服务功能的应用程序，车载终端接收来自用户的语音询问指令，并将语音询问指令转换为文本形式的目标提问语句，将目标提问语句与关键词匹配树进行匹配，得到关键词匹配树中的候选关键词与目标提问语句对应的第一节点属性，基于第一节点属性确定候选关键词与指定逻辑节点对应的第二节点属性，基于第二节点属性确定目标提问语句在FAQ问答库中对应的标准问题(或者相似问题)，将标准问题对应的答案以文本或语音的形式反馈至用户，如，当用户行驶过程中车辆发生油箱提示灯闪烁问题，用户通过向车载终端已语音或文本形式输入求助内容“行驶途中油箱提示灯闪烁如何解决”车载终端根据将求助内容进行候选关键词匹配，并根据各节点属性确定候选关键词在FAQ问答库中对应的标准问题，将其对应的答案，即对于油箱提示灯闪烁的解决方案反馈给用户。

值得注意的是，本申请实施例提供语句问答方法，可以由终端实现，也可以由服务器实现，还可以由终端和服务器协同实现。

其中，当终端和服务器协同实现本申请实施例提供的方案时，终端和服务器可以通过有线或无线通信方式进行直接或间接连接，本申请实施例对此不加以限定。

示意性的，请参考图1，其示出了本申请一个示例性实施例提供的实施环境示意图，如图1所示，该实施环境中包括终端110、服务器120，终端110和服务器120之间通过通信网络130连接。

本申请实施例中，以查询场景进行实施环境的介绍，终端110中安装有具有搜索功能的应用程序。该提供搜索功能的应用程序可以实现为浏览器、视频播放程序、电子书阅读程序、即时通讯应用程序、工具类应用程序等，本申请实施例对此不加以限定。终端110通过文本输入的形式或者语音输入的形式输入目标提问语句，终端110将目标提问语句发送至服务器120。

服务器120中包括关键词匹配树121，关键词匹配树121中包括候选关键词，此外服务器120中还包括FAQ问答库122和分类模型123，FAQ问答库122中包括标准问题及其相似问题集以及问题对应的答案，分类模型123中包括注意力网络当服务器120接收到终端110通过通信网络130发送的目标提问语句后，将目标提问语句中与关键词匹配树121中的候选关键词进行匹配，得到候选关键词与目标提问语句对应的第一节点属性，基于第一节点属性确定候选关键词与指定逻辑节点对应的第二节点属性，根据第二节点属性确定目标提问语句在FAQ问答库 122中对应的标准问题(或者相似问题)，当对应多个问题时，通过分类模型123 进行进一步的应答分析，获取标准问题对应的答案作为目标提问语句对应的应答结果。

服务器120将应答结果通过通信网络130反馈至终端110，终端110展示应答结果，其中，展示方式包括语音展示或者界面展示中的至少一种。

其中，终端110包括智能手机、平板电脑、便携式膝上笔记本电脑、台式计算机、智能音箱、智能可穿戴设备、智能语音交互设备、智能家电、车载终端等终端中的至少一种，服务器120可应用于在智慧交通、车载终端和物联网等领域中进行指令操作的场景。

值得注意的是，上述通信网络130可以实现为有线网络，也可以实现为无线网络，且通信网络130可以实现为局域网、城域网或广域网中的任意一种，本申请实施例对此不加以限定。

值得注意的是，上述服务器120可以实现为云端的云服务器，其中，云技术(Cloudtechnology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来，实现数据的计算、储存、处理和共享的一种托管技术。云技术基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称，可以组成资源池，按需所用，灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源，如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用，将来每个物品都有可能存在自己的识别标志，都需要传输到后台系统进行逻辑处理，不同程度级别的数据将会分开处理，各类行业数据皆需要强大的系统后盾支撑，只能通过云计算来实现。

在一些实施例中，上述服务器120还可以实现为区块链系统中的节点。区块链(Blockchain)是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。

本申请实施例中，服务器120中提供的语句问答方法及实现为应用服务层中的业务服务。

结合上述介绍内容，对本申请实施例中的实体词识别方法进行介绍。

本申请实施例中，将目标提问语句中与关键词匹配树中的候选关键词进行匹配，并依次获取第一节点属性和第二节点属性，基于第二节点属性确定最终目标提问语句对应的应答结果。示意性的，请参考图2，其示出了本申请一个示例性实施例提供的语句问答方法的整体过程示意图，如图2所示，将目标提问语句210中的字符输入字符匹配模型220中，字符匹配模型220中包括关键词匹配树230，将目标提问语句210中的字符与关键词匹配树230中的候选关键词进行匹配，得到候选关键词与字符对应的第一节点属性240，根据第一节点属性确定候选关键词与指定逻辑节点对应的第二节点属性250，基于第二节点属性250确定目标提问语句210在FAQ问答库260中对应的标准问题(或者相似问题)，并将标准问题对应的答案作为目标提问语句210对应的应答结果270进行输出。

结合上述名词简介以及应用场景，对本申请实施例提供的实体词识别方法进行说明，以由服务器执行以完成该方法为例进行说明，示意性的，请参考图3，其示出了本申请一个示例性实施例提供的语句问答方法的流程图，该方法包括如下步骤：

步骤301，获取目标提问语句。

可选的，目标提问语句包括存在提问词的语句，如“是否”、“何时何地”、“什么情况”等，或者，也可能不包括提问词，目标提问语句包括一句话或多句话，当目标提语句为多句话时，根据标点或句子含义对其进行分割，对分割后的单句进行后续分析，在一些实施例中，目标提问语句的获取方式包括如下方式中的至少一种：

1.目标提问语句为用户通过使用搜索引擎或者带有搜索功能的应用程序输入的query，其中，query的形式包括以文本输入的形式或者以语音输入的形式，当query为语音输入时，需先将其转换为文本形式再进行后续处理；

2.目标提问语句为从公开授权的开放平台中获取的数据集合，包括在开放平台上被浏览或查询次数最多的问题集合，或者开放平台能够提供的解答方案；

3.目标提问语句为根据已搜集到的知识图谱中的知识点进行响应问题的编撰，如：已知“新冠疫苗注射完有一定副作用”，响应的其目标提问语句为“新冠疫苗注射完有什么副作用”。

值得注意的是，上述关于目标提问语句获取方式的说明仅为示意性举例，本实施中对目标提问语句的具体获取方式不做任何限定。

示意性的，目标提问语句包括由用户自主输入的，即目标提问语句由用户本身意志决定，或者，从公开且授权的数据平台中获取用户输入的一些query集合，在此不做限定。

在一些实施例中，目标提问语句的内容包括如下几种形式中至少一种：

1.目标提问语句为判断式语句，在目标提问语句中包括判断词，如“是否”“能否”等，如：“新冠疫苗是否有害”、“新冠疫苗注射前能否吃辛辣食物”等；

2.目标提问语句为内容询问式语句，即目标提问语句为对某一项事物进行内容质疑，如：“肺癌晚期征兆是什么”、“拉肚子吃什么药”等；

3.目标提问语句为陈述式语句，即目标提问语句中不包括任何带有提问或者询问的词语，如：“天花的起源”、“艾滋病的传播方式”等。

值得注意的是，上述关于目标提问语句内容形式的说明仅为示意性举例，本实施中对目标提问语句的具体内容不做任何限定。

可选的，目标提问语句中包含有特定语义的词语，如“肺炎”、“感冒”等，或者，包括一些不存在语义的词语，如“您好”，“再见”等，在此不做限定。

步骤302，将目标提问语句与关键词匹配树进行匹配，得到关键词匹配树中的候选关键词与目标提问语句对应的第一节点属性。

其中，第一节点属性用于指示目标提问语句与候选关键词的匹配关系。

其中，关键词匹配树是通过一些预设的提问语句进行构建的，示意性的，提取预设的提问语句中的关键词作为关键词匹配树中的候选关键词，基于候选关键词在预设的提问语句中存在的逻辑关系，生成候选关键词对应的指定逻辑节点，并将指定逻辑节点与其对应的候选关键词进行连接，从而得到关键词匹配树。

可选的，关键词匹配树中包括多个候选关键词，这些候选关键词为语义完全不同的关键词，或者，存在部分含有相似语义的关键词。

在一些实施例中，关键词匹配树的展现形式包括如下几种形式中至少一种：

1.关键词匹配树中包括关键词节点和逻辑节点，关键词节点为候选关键词对应的节点(存在相近语义或不存在皆可)，逻辑节点为各关键词节点互相存在的逻辑关系对应的节点，如“注射”和“打针”存在可替换关系，即二者为近义词，那么“注射”与“打针”可以用“或”逻辑节点进行连接；

2.关键词匹配树中包括多个关键词节点，每个关键词节点都对应一个候选关键词，每个关键词节点包括存在对应的第一节点属性，其中，存在逻辑关系的关键词节点相互连接，其连接线对应指示候选关键词之间的逻辑关系，如图5 中510：“注射”和“打针”存在可替换关系，即二者为近义词，那么“注射”与“打针”对应的两个关键词节点相互连接(用直线接线表示)，又比如“HPV疫苗”与“新冠疫苗”存在并列关系，则将这两个候选关键词通过双向箭头连线进行相互连接，在此不做限定；

3.关键词匹配树中包括关键词节点和逻辑节点，其中，关键词节点分主字节点和分字节点，由于一个字可与多个字或词组成语义相似的关键词，这些关键词公用的一个字作为主字节点，一个主字节点连接一个或多个分字节点，存在逻辑关系各候选关键词对应的主字节点通过逻辑节点进行连接。

值得注意的是，上述对于关键词匹配树的展现形式仅为示意性举例，本实施例中对关键词匹配树的具体展现形式不做任何限定。

当目标提问语句与关键词匹配树进行匹配时，基于关键词匹配树获取目标提问语句中与候选关键词对应(包括语义相近或者字符相同)的关键词。示意性的，关键词匹配树中的候选关键词获取方式包括如下几种方式中至少一种：

1.候选关键词为从已知的知识图谱中获取的带有语义的词语作为候选关键词，即知识图谱中存在的带有语义的词语都可作为候选关键词；

2.候选关键词为从公开授权的带有搜索功能的平台上获取的访问数据中包含的词语，即，带有搜索功能的平台上公开有用户输入的查询关键词或提问语句，将这些公开数据中的关键词和提问语句中带有语义的词语作为候选关键词；

3.候选关键词从经过授权允许的用户输入的历史query中获取，也即，用户每次输入query后，服务器将该条query进行记录，并选择其中带有语义的词语作为候选关键词存入关键词匹配树中。

值得注意的是，上述关于候选关键词的获取方式仅为示意性的举例，本实施例中对候选关键词的具体获取方式不做任何限定。

可选的，当目标提问语句与关键词匹配树中的候选关键词进行匹配时，匹配形式包括如下几种方式中至少一种：

1.将目标提问语句中的提问字符与候选关键词中的候选字符进行匹配，即，当目标提问语句中包含提问字符“吃”和“药”，将“吃”和“药”与候选关键词中的候选字符进行匹配，值得注意的是，提问字符组成的词语为存在语义的词语，也即提问字符的位置是固定的，匹配条件需为存在同样固定位置的候选字符组成的候选关键词为匹配成功；

2.设定匹配阈值，当目标提问语句与候选关键词的匹配程度达到匹配阈值时，视为匹配成功，也即，将目标提问语句中的提问字符与候选关键词中的候选字符进行匹配，如果候选关键词中存在与提问字符对应的词语个数达到匹配阈值，则该候选关键词为与目标提问语句匹配的关键词；

3.对目标提问语句进行词语分割得到提问词，将得到的提问词将关键词匹配树中与其语义相同或者相似的关键词作为与提问词匹配的候选关键词。

值得注意的是，上述对于匹配的形式仅为示例性举例，本实施例中对匹配的具体形式不做任何限定。

示意性的，将目标提问语句与候选关键词进行匹配后得到的两者匹配关系，其中，匹配关系包括匹配成功或者匹配失败，匹配成功的情况中包括目标提问语句中存在候选关键词，或者存在与候选关键词语义相似或者相同的词语；匹配失败的情况包括目标提问语句中不存在与候选关键词，在此不做限定。基于两者的匹配关系，得到候选关键词对应的第一节点属性，即，候选关键词与目标提问语句是否匹配成功，候选关键词都存在第一节点属性。

可选的，采用“真假”值区分第一节点属性，若候选关键词与目标提问语句存在匹配关系，则该候选关键词的第一节点属性可为“真”，即匹配成功，若候选关键词与目标提问语句不存在匹配关系，即匹配失败，则该候选关键词的第一节点属性可为“假”。

值得注意的是，候选关键词的第一节点属性仅相对于同一个输入的目标提问语句而定，当输入第二个目标提问语句，关键词匹配树中候选关键词的第一节点属性将被重置。

步骤303，基于第一节点属性确定关键词匹配树中候选关键词与指定逻辑节点对应的第二节点属性。

其中，第二节点属性用于指示候选关键词在指定逻辑节点处的组合逻辑关系。

在一些实施例中，关键词匹配树中包括多个逻辑节点，每个逻辑节点对应与至少一个候选关键词连接，指定逻辑节点为关键词匹配树中具有语义关系(或者不存在语义关系)的候选关键词之间连接的逻辑节点，语义关系包括同义词关系，如“吃药”和“服用药品”属于近义关系，或者，对比关系，如“HPV疫苗”和“新冠疫苗”为两种不同类型的疫苗，常被用于进行对比查询，因此二者为对比关系，或者，非存在关系，如“阿司匹林”是一个候选关键词，目标提问语句为“发烧是否该喝热水”，“阿司匹林”不存在该目标提问语句中，也即“阿司匹林”与该目标提问语句对应不存在匹配关系，那么“阿司匹林”对应的语义关系为非存在关系，在此不做限定。

一个指定逻辑节点对应连接至少一个候选关键词，各指定逻辑节点相同或者不同，在此不做限定。

可选的，指定逻辑节点与候选关键词的连接方式包括如下几种方式中的至少一种：

1.将存在相同字符且语义相同或相近的候选关键词与指定逻辑节点进行连接；

2.将存在语义关系的候选关键词与指定逻辑节点进行连接，即将包括对比关系或者近义关系等组合逻辑关系的候选关键词与指定逻辑节点进行连接，也即与指定逻辑节点相连的各候选关键词存在不包含相同字符的情况。

值得注意的是，上述关于指定逻辑节点与候选关键词的连接方式仅为示意性的举例，本实施中对于指定逻辑节点与候选关键词的具体连接方式不做任何限定。

基于第一节点属性确定得到的第二节点属性用于指示候选关键词在逻辑节点处的组合逻辑关系，可选的，不同逻辑关系对应的指定逻辑节点的第二节点属性判断方式相同或者不同，第二节点属性由至少一个候选关键词的第一节点属性决定，第一节点属性与第二节点属性的区分方法可能相同，或者不同，在此不做限定。

在一些实施例中，第二节点属性的确定方式包括如下几种方式中的至少一种：

1.采用“与或非”逻辑关系，也即，使用“与或非”逻辑关系对指定逻辑节点对应候选关键词的第二节点属性进行判断，第一节点属性和第二节点属性通过“真假”值表示，示意性的，，以图5示出的关键词匹配树为例进行说明，关键词匹配树中包含候选关键词“HPV疫苗”和“新冠疫苗”，其中，“HPV疫苗”和“新冠疫苗”通过一个指定逻辑节点进行连接(该指定逻辑节点对应的逻辑关系为“与”逻辑关系)，当输入的目标提问语句为“HPV疫苗和新冠疫苗有什么区别”，通过将目标提问语句和关键词匹配中的候选关键词进行匹配，得到候选关键词“HPV疫苗”和“新冠疫苗”与目标提问语句存在匹配关系，即，这两个候选关键词对应的第一节点属性皆为“真”，因而这两个候选关键词对应连接的指定逻辑节点(其逻辑关系为“与”逻辑关系)的第二节点属性为“真”；

2.当一个指定逻辑节点存在对应的候选关键词对应的第一节点属性为“真”，也即，该候选关键词与目标提问语句具有匹配关系，则该指定逻辑节点的第二节点属性为“真”；

3.设定个数阈值，当一个指定逻辑节点存在对应的满足第一节点属性为“真”的候选关键词，且候选关键词的个数达到个数阈值，则该指定逻辑节点的第二节点属性为“真”。

值得注意的是，上述对第二节点属性的确定方式仅为示意性的举例，本实施例中对第二节点属性的具体确定方式不做任何限定。

步骤304，基于第二节点属性确定目标提问语句对应的应答结果。

其中，应答结果为关键词匹配树中与目标属性要求对应的结果。

可选的，基于第二节点属性得到包括一个或者多个结果，从中确定与目标属性要求对应的结果作为目标提问语句对应的应答结果，其中，目标属性要求包括如下几种方式中的至少一种：

1.在设立相关知识图谱的情况下，知识图谱中存储有可作为应答结果的文本语句，基于第二节点属性，也即候选关键词在指定逻辑节点处的组合逻辑关系，在知识图谱中确定满足组合逻辑关系对应的文本语句作为应答结果；

2.设有问题集合以及问题对应的答案(如FAQ问答库等，不做限定)，基于第二节点属性，在问题集合中确定满足组合逻辑关系对应的问题，将该问题对应的答案作为目标提问语句对应的应答结果；

3.基于第二节点属性，将候选关键词重新进行排列组合，生成一个标准提问语句，根据标准提问语句在知识图谱中确定满足组合逻辑关系对应的文本语句作为应答结果。

值得注意的是，上述对于应答结果的确定方式仅为示意性的举例，本实施中对应答结果的具体确定方式不做任何限定。

上述关于目标属性要求的举例中，还存在基于第二节点属性获取多个文本语句/问题/标准提问语句的情况，基于该情况设定逻辑阈值，当文本语句/问题/ 标准提问语句中满足组合逻辑关系的数量达到或者超过逻辑阈值，选择该文本语句/问题对应的答案/标准提问语句对应的文本语句作为应答结果(当全部达到或者超过逻辑阈值时，选择数量最多的)。

综上所述，本申请实施例提供的语句问答方法，将目标提问语句与关键词匹配树中的候选关键词进行匹配，得到候选关键词与目标提问语句对应的第一节点属性，第一节点属性用于指示进行匹配后候选关键词与目标提问语句的匹配关系，基于第一节点属性确定第二节点属性，第二节点属性为关键词匹配树中候选关键词与指定逻辑节点对应的属性，且用于指示候选关键词在逻辑节点出的组合逻辑关系，通过第二节点属性确定目标提问语句对应的应答结果，也即，通过将目标提问语句与关键词匹配树进行匹配，确定关键词匹配树中各节点的节点属性，从而得到目标提问语句对应的应答结果，提高了目标提问语句中对应候选关键词的匹配准确度，增强了匹配效率，且基于节点属性确定应答结果能够加快匹配速度。

在一些可选的实施例中，第二节点属性由指定逻辑节点的逻辑匹配结果决定，示意性的，请参考图4，其示出了本申请一个示例性实施例提供的语句问答方法的流程图，如图4所示，该方法包括如下步骤：

步骤401，获取目标提问语句。

步骤401中关于目标提问语句的描述已在上述步骤301中进行详细说明，这里不再赘述。

步骤402，将目标提问语句与关键词匹配树进行匹配，得到关键词匹配树中的候选关键词与目标提问语句对应的第一节点属性。

在一些实施例中，将目标提问语句中的字符输入字符匹配模型，字符匹配模型中包括关键词匹配树；通过字符匹配模型对字符和关键词匹配树中的候选关键词进行匹配，确定目标提问语句与候选关键词的匹配结果；基于匹配结果确定候选关键词对应的第一节点属性。

可选的，首先提取关键词匹配树中的候选关键词作为关键词列表，构建基于AC自动机的Trie树结构(也可以通过最大后向匹配、最大前向匹配等方法进行匹配，不做限定，这里以AC自动为例进行说明)，将目标提问语句中的字符输入字符匹配模型，字符匹配模型通过AC自动机遍历关键词匹配树中的候选关键词，确定与候选关键词对应匹配的字符或字符组合，并得到各候选关键词与目标提问语句对应的匹配结果。示意性的，Tire树结构中的每个叶节点为一个候选关键词对应的候选字符，能够组成一个候选关键词的候选字符之间相连， Trie树结构中还包括Fail指针，当输入的字符与当前叶节点无法匹配时，将该叶节点对应的Fail指针指向另一个包含相同候选字符的叶节点，如果再次无法匹配，Fail指针会再次改变指向，直到Fail指针指向根节点(根节点为Trie树中的起始节点，所有叶节点基于根节点出发向外扩散)，本次匹配过程结束。当目标提问语句中的字符输入字符匹配模型，字符匹配模型基于AC自动机将每个字符与Trie树中的候选关键词依次进行匹配，如：目标提问语句为“新冠肺炎的症状”，其中包含7个字符“新”、“冠”、“肺”、“炎”、“的”、“症”和“状”，以字符“新”进行匹配进行说明，从根节点出发，将字符“新”和与根节点相连的第一层叶节点进行匹配，如果存在包含“新”的叶节点，则表明该字符匹配成功，从该叶节点作为起点，将字符“冠”和与该叶节点相连的第二层字符进行匹配，如果存在就依次将剩下的字符层层匹配，如果不存在包含“冠”的叶节点，就跳转到另外一个分支中包含字符“新”对应的叶节点，从该叶节点的下一层叶节点与“冠”进行匹配，如果不存在包含“冠”的分支，即跳转到根节点，本次匹配结束。值得注意的是，当目标提问语句中的字符与Trie树完成全部匹配时，即获取匹配结果，关键词匹配树中的各候选关键词对应的第一节点属性也能确定。其中，以布尔值(即“真假”值)来区分第一节点属性，若候选关键词与目标提问语句中的字符能够完成匹配，则该候选关键词对应的第一节点属性记为“真”，若候选关键词与目标提问语句中的字符无法完成匹配，则该候选关键词对应的第一节点属性记为“假”。

步骤403，获取关键词匹配树中候选关键词对应的指定逻辑节点的逻辑关系。

在一些实施例中，指定逻辑节点的逻辑关系包括与逻辑关系、或逻辑关系和非逻辑关系中的任意一种。

可选的，关键词匹配树由候选关键词与指定逻辑节点构成，示意性的，请参考图5，其示出了本申请一个示例性实施例提供的关键词匹配树的示意图，如图5所示，关键词匹配树中包括候选关键词510和指定逻辑节点520，其中指定逻辑节点对应有与逻辑关系521、或逻辑关系522和非逻辑关系523。以候选关键词510中“接种”、“打针”和“注射”为例进行说明，该三个候选关键词通过一个指定逻辑节点520进行连接，从而获取该指定逻辑节点520对应的逻辑关系为或逻辑关系。

步骤404，基于第一节点属性确定指定逻辑节点的逻辑匹配结果。

在一些实施例中，将第一节点属性与指定逻辑节点的预设逻辑关系进行匹配；响应于第一节点属性符合指定逻辑节点的预设逻辑关系，确定指定逻辑节点的逻辑匹配结果为匹配关系；响应于第一节点属性不符合指定逻辑节点的预设逻辑关系，确定指定逻辑节点的逻辑匹配结果为失配关系。

可选的，预设逻辑关系为指定逻辑节点的布尔值为真(也可以为假，这里以布尔值为真进行说明)，如图5所示，当确定候选关键词510对应的第一节点属性(也即，候选关键词所在叶节点的布尔值)，在该关键词匹配树从下往上以层层递进的方式进行匹配，其中，关键词匹配树中关于指定逻辑节点的布尔值的判断方法如公式一所示：

公式一：

其中vnode表示node对应的布尔值，v_ci表示node的子节点的布尔值(子节点包括候选关键词或者指定逻辑节点)，k表示子节点个数。

示意性的，以图5中候选关键词510中“接种”、“打针”和“注射”为例进行说明，该三个候选关键词通过包括或逻辑关系的指定逻辑节点进行连接，即，该三个候选关键词中只要存在至少一个第一节点属性的布尔值为真的候选关键词，即可符合指定逻辑节点的预设逻辑关系(或逻辑关系对应的布尔值为真)，也即指定逻辑节点的逻辑匹配结果为匹配关系，若该三个候选关键词对应的第一节点属性的布尔值都为假(即不存在与目标提问语句中字符完成匹配的候选关键词)，则与逻辑关系的布尔值为假，也即不符合指定逻辑节点的预设逻辑关系，因此指定逻辑节点的逻辑匹配结果为失配关系。

步骤405，将指定逻辑节点的逻辑匹配结果作为第二节点属性。

在一些实施例中，指定逻辑节点对应的第二节点属性包括匹配关系和失配关系。

步骤405中关于第二节点属性的描述已在上述步骤303和步骤404中进行详细说明，这里不再赘述。

步骤406，基于第二节点属性确定目标提问语句对应的应答结果。

在一些实施例中，服务器中包括FAQ问答库，基于第二节点属性在FAQ问答库中找到目标提问语句对应的标准问题(或者相似问题)，将标准问题对应的答案作为应答结果。

示意性的，如图5所示，关键词匹配树中还包括规则文本530，将规则文本定义为“操作(参数1参数2参数3…)”的函数形式，其中“操作”函数包括与(&)、或(|)、非(^)三种逻辑函数，也即对应指定逻辑节点的逻辑关系，其中，函数的参数包括候选关键词，或者包括另一个函数，即支持函数嵌套。

每个规则文本与FAQ问答库中的标准问题540对应，其中，以规则文本530 中规则文本“&(HPV疫苗新冠疫苗|(接种打针注射))”为例进行说明，其对应的FAQ问答库中的标准问题为“新冠疫苗能否和其他疫苗一起接种”。也即，当第二节点属性确定后，基于第二节点属性将候选关键词与指定逻辑节点对应的逻辑关系组织成规则文本，即可确定该规则文本在FAQ问答库中对应的标准问题，其中，该标准问题中各候选关键词之间的逻辑关系与规则文本中的逻辑函数对应，可选的，在实际应用过程中，还可将规则文本中的函数进行基于同义词的等价变化，如：“两周”、“两星期”与“14天”为同义词，可将规则文本“&(新冠疫苗间隔时间两周)”变换为“&(新冠疫苗间隔时间|(14天两周两星期))”，便于扩大规则文本的覆盖范围，提高规则文本与FAQ问答库中标准问题的匹配率，即，响应于第二节点属性符合目标属性要求，确定与目标属性要求对应的结果作为应答结果。

在本实施例中，假设有K条规则文本，n个候选关键词(平均文本长度L)，输入目标提问语句的平均文本长度为M，将目标提问语句中的字符输入字符匹配模型中，字符匹配模型基于AC自动机对字符和候选关键词进行匹配的时间复杂度为O(M+nL)，假设每条规则文本对应的指定逻辑节点个数，与候选关键词个数的量级相当，则在关键词匹配树中从确定第一节点属性往上递进最终确定规则文本的时间复杂度为O(n)，因此预测一条输入的目标提问语句的时间复杂度为O(M+nL+n)＝O(M+nL)，与目标提问语句的文本长度和候选关键的总长度成线性增长的关系。与相关技术中，基于正则表达式匹配的规则引擎相比，本实施例中的方案在确定第一节点属性的匹配速度上显著提升，具体体现在如下两个方面：

1.基于正则表达式的规则引擎需要遍历所有正则表达式依次判断输入的目标提问语句是否存在候选关键词，而通过关键词匹配树可以同时获取目标提问语句与候选关键词之间所有的匹配关系，计算复杂度与规则文本的数量无关，与候选关键词有关，增强匹配性能；

2.通过基于AC自动机将目标提问语句中的字符与候选关键词进行匹配确定候选关键词对应的第一节点属性，提高了候选关键词与目标提问语句的匹配速度。

一方面是不需要像正则引擎那样，需要遍历所有正则表达式依次判断query 是否符合，而是可以同时得到所有规则的匹配情况，计算复杂度与关键词数量有关，与规则的数量无关；本发明只需要扫描一遍输入文本即可同时得到所有规则的匹配情况；二是采用了多模匹配作为字符串搜索方式，显著提升了关键词的匹配速度。

综上所述，本申请实施例提供的语句问答方法，将目标提问语句与关键词匹配树中的候选关键词进行匹配，得到候选关键词与目标提问语句对应的第一节点属性，第一节点属性用于指示进行匹配后候选关键词与目标提问语句的匹配关系，基于第一节点属性确定第二节点属性，第二节点属性为关键词匹配树中候选关键词与指定逻辑节点对应的属性，且用于指示候选关键词在逻辑节点处的组合逻辑关系，通过第二节点属性确定目标提问语句对应的应答结果，也即，通过将目标提问语句与关键词匹配树进行匹配，确定关键词匹配树中各节点的节点属性，从而得到目标提问语句对应的应答结果，提高了目标提问语句中对应候选关键词的匹配准确度，增强了匹配效率，且基于节点属性确定应答结果能够加快匹配速度。

本实施例中，采用基于AC自动机的方式确定候选关键词对应的第一节点属性，以及借助布尔值确定第二节点属性的方法，在目标提问语句的字符输入字符匹配模型后，可以通过AC自动机快速获取输入字符与各候选关键词对应的所有字符匹配结果，加强了匹配结果的准确度，提高了字符匹配模型的匹配速度。

在一些实施例中，将目标提问语句中与关键词匹配树进行匹配还存在匹配到多个或不存在候选关键词对应FAQ回答库中问题的情况，基于这种情况，通过分类模型对目标提问语句进行进一步应答分析，得到应答结果，也即，响应于第二节点属性不符合目标属性要求，通过分类模型对目标提问语句进行应答分析，得到应答结果，示意性的，请参考图6，其示出了本申请一个示例性实施例提供的语句问答方法的流程图，如图6所示，该方法包括如下步骤：、

步骤601，获取目标提问语句。

步骤601中关于目标提问语句的描述已在上述步骤301中进行详细说明，这里不再赘述。

步骤602，将目标提问语句与关键词匹配树进行匹配，得到关键词匹配树中的候选关键词与目标提问语句对应的第一节点属性。

步骤602中关于关键词匹配树及第一节点属性的描述已在上述步骤302和步骤402中进行详细说明，这里不再赘述。

步骤603，基于第一节点属性确定关键词匹配树中候选关键词与指定逻辑节点对应的第二节点属性。

步骤603中关于指定逻辑节点和第二节点属性的描述已在上述步骤303中进行详细说明，这里不再赘述。

步骤604，响应于第二节点属性不符合目标属性要求，通过分类模型对目标提问语句中的字符进行权重分析，得到权重分析结果。

可选的，基于第二节点属性确定与目标提问语句匹配的候选关键词在FAQ 问答库中对应的标准问题(或者相似问题)，当不存在对应的标准问题或者存在多个对应的标准问题时，需要通过分类模型对目标提问语句中的字符作进一步的权重分析。

在一些实施例中，将目标提问语句中的字符输入分类模型，分类模型中包含的编码器通过对目标提问语句中的字符进行特征提取，得到字符特征，并通过编码器中的向量生成器，得到目标提问语句对应的语句向量和每个字符对应的字符向量。将字符向量输入注意力生成网络，得到每个字符对应的注意力权重，注意力生成网络参考公式二：

公式二：α_i＝σ(Wh_i+b)

其中，α_i为字符的注意力权重，W为向量系数，b为可调参数，h_i为字符向量，σ为权重因子。根据公式三可看出，字符对应的注意力权重与字符向量成正相关关系。根据每个字符对应的注意力权重，对字符向量进行加权和计算，得到加权字符向量，具体公式参考公式三：

公式三：

其中，L_att为加权字符向量。从公式三可以看出，当字符对应的注意力权重越高时，加权字符向量越大。

将获取的文本向量以及加权字符向量输入分类网络，得到目标提问语句与候选关键词对应的匹配概率，分类网络参考公式四：

公式四：p＝softmax(W₁h_[sent]+W₂h_[char]+b)

其中，p为目标提问语句对应的匹配概率，h_[sent]为文本向量，从公式四可以看出，当加权字符向量越大，也即字符对应的注意力权重越高时，目标提问语句中的字符与候选关键词对应的匹配概率越高。

步骤605，基于权重分析结果，确定目标提问语句对应的应答结果。

示意性的，基于目标提问语句与候选关键词对应的匹配概率，选择匹配概率最高的候选关键词，确定该候选关键词在FAQ问答库中对应的标准问题的答案作为目标提问语句对应的应答结果。

综上所述，本申请实施例提供的语句问答方法，将目标提问语句与关键词匹配树中的候选关键词进行匹配，得到候选关键词与目标提问语句对应的第一节点属性，第一节点属性用于指示进行匹配后候选关键词与目标提问语句的匹配关系，基于第一节点属性确定第二节点属性，第二节点属性为关键词匹配树中候选关键词与指定逻辑节点对应的属性，且用于指示候选关键词在逻辑节点出的组合逻辑关系，通过第二节点属性确定目标提问语句对应的应答结果，也即，通过将目标提问语句与关键词匹配树进行匹配，确定关键词匹配树中各节点的节点属性，从而得到目标提问语句对应的应答结果，提高了目标提问语句中对应候选关键词的匹配准确度，增强了匹配效率，且基于节点属性确定应答结果能够加快匹配性能。

本实施例中，通过分类模型中的注意力网络确定目标提问语句中字符对应字符向量的注意力权重，进而获取目标提问语句与候选关键词对应的匹配概率，提高了分类模型的匹配性能，基于注意力权重获取匹配概率可以让分类模型更快更准确的对目标提问语句中的字符进行权重分析，提升了匹配速度。

在一些实施例中，在FAQ问答库建设初期，会存在FAQ问答库中相似问题集较少的情况，目标提问语句与候选关键词的匹配准确率较低，因此在分类模型训练时可以通过注意力向量来引导分类模型，提升分类效果，因此，在训练阶段，分类模型中还包括损失函数，损失函数请参考公式五：

公式五:L＝L_cls+γ×β^s×L_att

其中，L为分类模型的损失函数，L_cls为交叉熵损失，L_att为正则损失，γ为正则损失的系数，β^s为衰减系数，0＜β＜1，s为迭代的训练次数，随着训练次数的增加，分类模型对于输入的目标提问语句中字符的权重分析能力增强，正则损失函数逐渐减小，最终变为0。交叉熵函数对应的公式可参考公式六：

公式六:L_cls＝-∑y_ilo_gp_i

其中，当目标提问语句与候选关键词对应的能够匹配时，y_i为1，否则y_i为 0，p_i为目标提问语句对应的匹配概率。

正则损失对应的公式可参考公式七：

公式七：

g∈R^T表示通过目标提问语句的字符与候选关键词进行匹配得到的标准注意力向量，T为目标提问语句的文本长度，KL表示KL散度，用于衡量分类模型中注意力分布与标准注意力之间距离。

在预测阶段，分类模型仅需考虑交叉熵损失作为损失函数，值得注意的是，当目标提问语句中的目标提问语句与候选关键词无法匹配时，仅考虑交叉熵损失。

其中，标准注意力向量通过训练关键词提取器获取(如TextRank关键词提取器)，通过关键词提取器对FAQ问答库中的标准问题(包括相似问题)进行关键词提取，得到候选关键词集合，输入目标提问语句，通过最大后向匹配算法确定与目标提问语句匹配的候选关键词位于目标提问语句中对应字符的位置，每个字符位置对应生成multi-hot向量g’，g’＝1当且仅当目标提问语句中的第i个字符为候选关键词中的字符，其余字符位置向量g’＝0。如：候选关键词集合包括{禁忌症、接种重点人群、司机、海关、不良反应、新冠疫苗}，目标提问语句为“您好，我是一个货车司机，可以打新冠疫苗吗？”，生成目标提问语句对应的向量g’组合为[000000000110000111100]，“司机”与“新冠疫苗”的字符位置为1，其余字符位置为0。标准注意力向量g通过归一化g’得到，具体可参考公式八：

公式八：

示意性的，请参考图7，其示出了本申请一个示例性实施例提供的分类模型训练过程示意图，如图7所示，将目标提问语句中的字符701输入编码器702 中，生成字符向量703和文本向量(未展示)，将字符向量703输入注意力生成网络得到字符向量703对应的注意力权重704，进而得到加权字符向量(为展示)，将文本向量和加权字向量输入分类网络705中，得到目标提问语句中字符与候选关键词对应的匹配概率706，同时，对FAQ问答库707中的标准问题进行候选关键词提取获取候选关键词708通过目标提问语句中的字符获取multi-hot向量组合709，并将其进行归一化处理得到标准注意力向量，用于辅助训练分类模型700，调整分类模型700的模型参数，提升分类模型权重分析性能。

此外，为了解决训练阶段FAQ问题库中标准问题对应的相似问题集数量过少，可以通过对相似问题集进行数据扩充的方式进行问题扩充，其扩充方式包括如下几种方式中的至少一种：

1.基于同义关系与上下位关系的语料同义变换的方法进行问题扩充，例如：“接种疫苗”与“打疫苗”为同义关系，那么可以将标准问题“哪些特殊情况也可以接种疫苗”变换为相似问题“哪些特殊情况也可以打疫苗”；“发热”与“高热”为上下位关系(发热是上位词，高热是下位词，发热中包含高热情况)，可将标准问题“孩子发热是否可以接种”变换为相似问题“孩子高热是否可以接种”，值得注意的是，同义替换是双向的，而上下位替换是单向的，即只能将标准问题中的上位词替换为其下位词生成相似问题；

2.通过引入语句模板的方法进行问题扩充，语句模板定义为包含槽位标记的目标提问语句，例如：“请问#地点#还没有开放疫苗接吗”、“新冠疫苗#时间#可以开始预约了吗”，#时间#和#地点#即为槽位标记。使用方式有两种，其一在训练阶段，将语句模板的槽位标记替换为槽位词，扩充训练样本，如根据上述模板可增加问题“请问深圳还没有开放疫苗接种么”、“新冠疫苗明天可以开始预约了吗”；其二为在训练阶段将语句模板作为相似问题加入FAQ问答库中对分类模型进行训练，在预测阶段，将用户输入的目标提问语句中的槽位词替换为槽位标记，再进行候选关键词匹配；

3.通过引入答案文本的方式进行问题扩充，在训练阶段，由于FAQ问答库中候选关键词对应的标准问题较为宽泛，如：“接种重点人群”这一候选关键词对应的标准问题通常是“开展新冠疫苗接种的重点人群包括哪些”，而不是“海关边检人员可以优先接种吗”这些更为细节的问题，因此引入答案文本可以辅助分类模型进行训练，提升分类模型的泛化性能；

4.通过对种子语料的训练样本挖掘方式进行问题扩充，种子预料是指在训练阶段FAQ问答库中已存储的标准问题及其相似问题集，基于种子预料可以在一些公开授权使用的语料库中挖掘与种子预料相似的提问语句。具体采用基于关键词、字面相似度和句向量相似度三种方案挖掘语料库中的提问语句，人工校验后将其作为相似问题加入FAQ问答库中。在基于关键词的方案中，采用关键词匹配树，遍历语料库中的提问语句，选择符合匹配规则的提问语句作为相似问题加入FAQ问答库；在基于字面相似度的方案中，基于ElasticSearch检索框架，采用BM25和向量空间模型检索相似问题加入FAQ问答库；在基于句向量相似度的方案中，使用开源预训练词向量矩阵，以词向量的IDF加权平均作为句向量，基于快速近邻搜索获取种子语料的相似表达语句作为相似问题加入 FAQ问答库。

本实施例中，通过生成标准注意力向量的方式辅助训练分类模型可以使分类模型在对目标提问语句中的字符进行权重分析后，最终基于分类网络获取目标提问语句与候选关键词的匹配概率，选择匹配概率最高的候选关键词，确定其在FAQ问答库中对应标准问题的答案，提高了分类模型的匹配分析精度，且在训练阶段对FAQ问答库中的问题进行问题扩充的方式增强了语句问答的准确度。

在一些实施例中，示意性的，请参考图8，其示出了本申请一个示例性实施例提供的语句问答方法的流程图，如图8所示，输入目标提问语句810，将目标提问语句810中与关键词匹配树820中的候选关键词进行匹配，得到候选关键词对应的第一节点属性，基于第一节点属性确定指定逻辑节点对应的第二节点属性，当第二节点属性符合目标属性要求(即与目标提问语句的字符匹配的候选关键词在FAQ问答库中对应有一个问题)，选择该FAQ问答库中的问题830 对应的答案作为应答结果840进行输出，当第二节点属性不符合目标属性要求 (即与目标提问语句的字符匹配的候选关键词在FAQ问答库中对应有多个问题或者不存在对应问题)，将目标提问语句810输入分类模型850中作应答分析，最终获得FAQ问答库中对应的问题830，选择其对应的答案作为应答结果840 进行输出。其中，在训练阶段，对FAQ问答库中的问题进行问题扩充860，从而对分类模型850进行辅助训练，提升模型泛化性能。

基于上述语句问答方法的流程，可用于用户终端上进行问题查询场景，示意性的，请参考图9，其示出了本申请一个示例性实施例提供的FAQ问答项目的界面示意图，如图9所示，显示界面为一个运行FAQ问答项目的程序界面900，界面中包括多个不同类别的FAQ问答服务910，以“新冠疫苗”问答服务为例进行说明，用户通过对“新冠疫苗”的提示框进行点击，进入“新冠疫苗”的运行界面 920，点击其中“咨询助手”提示框930，进入“新冠疫苗”问答服务的问答界面940，界面中包括显示FAQ问答库中一些标准问题950，以及候选关键词960，用户通过在对话框中输入目标提问语句后，终端界面中会自动显示与目标提问语句匹配的应答结果(未示出)。

综上所述，本申请实施例提供的语句问答方法，将目标提问语句与关键词匹配树中的候选关键词进行匹配，得到候选关键词与目标提问语句对应的第一节点属性，第一节点属性用于指示进行匹配后候选关键词与目标提问语句的匹配关系，基于第一节点属性确定第二节点属性，第二节点属性为关键词匹配树中候选关键词与指定逻辑节点对应的属性，且用于指示候选关键词在逻辑节点出的组合逻辑关系，通过第二节点属性确定目标提问语句对应的应答结果，也即，通过将目标提问语句与关键词匹配树进行匹配，确定关键词匹配树中各节点的节点属性，从而得到目标提问语句对应的应答结果，提高了目标语句中对应候选关键词的匹配准确度，增强了匹配效率，且基于节点属性确定应答结果能够加快匹配速度。

本实施例中的语句问答方法可应用于任何需要快速启动的FAQ智能问答服务，能够快速提升回答的准确率，在保证用户体验的前提下实现服务的快速研发与上线，为需要与时间赛跑的产品赛道提供有力的技术支持。

分类模型中用于对目标提问语句进行特征提取生成向量的特征提取器与编码器，可由ALBERT模型替换为其他基于自注意力机制的模型，如：BERT模型、Tiny-BERT模型、ELMO模型等。KL散度可换成其他衡量概率分布的距离 /相似度的方法，例如Wassersteindistance、F-divergence等，在此不做限定。

图10是本申请一个示例性实施例提供的语句问答装置的结构框图，如图10 所示，该装置包括：

获取模块1010，用于获取目标提问语句；

匹配模块1020，用于将所述目标提问语句与关键词匹配树进行匹配，得到所述关键词匹配树中的候选关键词与所述目标提问语句对应的第一节点属性，所述第一节点属性用于指示所述目标提问语句与所述候选关键词的匹配关系；

确定模块1030，用于基于所述第一节点属性确定所述关键词匹配树中所述候选关键词与指定逻辑节点对应的第二节点属性，所述第二节点属性用于指示所述候选关键词在所述逻辑节点处的组合逻辑关系；

所述确定模块1030，还用于基于所述第二节点属性确定所述目标提问语句对应的应答结果，所述应答结果为所述关键词匹配树中与目标属性要求对应的结果。

在一个可选的实施例中，所述确定模块1030，包括：

获取单元1031，用于获取所述关键词匹配树中所述候选关键词对应的指定逻辑节点的逻辑关系；

确定单元1032，用于基于所述第一节点属性确定所述指定逻辑节点的逻辑匹配结果；

所述确定单元1032，还有于将所述指定逻辑节点的逻辑匹配结果作为所述第二节点属性。

在一个可选的实施例中，所述确定单元1032，还用于将所述第一节点属性与所述指定逻辑节点的预设逻辑关系进行匹配；响应于所述第一节点属性符合所述指定逻辑节点的预设逻辑关系，确定所述指定逻辑节点的逻辑匹配结果为匹配关系；响应于所述第一节点属性不符合所述指定逻辑节点的预设逻辑关系，确定所述指定逻辑节点的逻辑匹配结果为失配关系。

在一个可选的实施例中，所述指定逻辑节点的逻辑关系包括与逻辑关系、或逻辑关系和非逻辑关系中的任意一种。

在一个可选的实施例中，所述匹配模块1020，还用于将所述目标提问语句中的字符输入字符匹配模型，所述字符匹配模型中包括所述关键词匹配树；通过所述字符匹配模型对所述字符和所述关键词匹配树中的候选关键词进行匹配，确定所述目标提问语句与所述候选关键词的匹配结果；基于所述匹配结果确定所述候选关键词对应的第一节点属性。

在一个可选的实施例中，所述确定模块1030，还用于响应于所述第二节点属性符合所述目标属性要求，确定与所述目标属性要求对应的结果作为所述应答结果；响应于所述第二节点属性不符合所述目标属性要求，通过分类模型对所述目标提问语句进行应答分析，得到所述应答结果。

在一个可选的实施例中，所述确定模块1030，还用于通过分类模型对所述目标提问语句中的字符进行权重分析，得到权重分析结果；基于所述权重分析结果，确定所述目标提问语句对应的所述应答结果。

综上所述，本申请实施例提供的语句问答装置，将目标提问语句与关键词匹配树中的候选关键词进行匹配，得到候选关键词与目标提问语句对应的第一节点属性，第一节点属性用于指示进行匹配后候选关键词与目标提问语句的匹配关系，基于第一节点属性确定第二节点属性，第二节点属性为关键词匹配树中候选关键词与指定逻辑节点对应的属性，且用于指示候选关键词在逻辑节点出的组合逻辑关系，通过第二节点属性确定目标提问语句对应的应答结果，也即，通过将目标提问语句与关键词匹配树进行匹配，确定关键词匹配树中各节点的节点属性，从而得到目标提问语句对应的应答结果，提高了目标语句中对应候选关键词的匹配准确度，增强了匹配效率，且基于节点属性确定应答结果能够加快匹配速度。

需要说明的是：上述实施例提供的语句问答装置，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的语句问答装置与语句问答方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图12示出了本申请一个示例性实施例提供的服务器的结构示意图。该具体来讲：

服务器1200包括中央处理单元(Central Processing Unit，CPU)1201、包括随机存取存储器(Random Access Memory，RAM)1202和只读存储器(Read Only Memory，ROM)1203的系统存储器1204，以及连接系统存储器1204和中央处理单元1201的系统总线1205。服务器1200还包括用于存储操作系统 1213、应用程序1214和其他程序模块1215的大容量存储设备1206。

大容量存储设备1206通过连接到系统总线1205的大容量存储控制器(未示出)连接到中央处理单元1201。大容量存储设备1206及其相关联的计算机可读介质为服务器1200提供非易失性存储。也就是说，大容量存储设备1206可以包括诸如硬盘或者紧凑型光盘只读存储器(Compact Disc Read Only Memory， CD-ROM)驱动器之类的计算机可读介质(未示出)。

不失一般性，计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、可擦除可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、带电可擦可编程只读存储器 (Electrically Erasable Programmable Read Only Memory，EEPROM)、闪存或其他固态存储其技术，CD-ROM、数字通用光盘(Digital Versatile Disc，DVD)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然，本领域技术人员可知计算机存储介质不局限于上述几种。上述的系统存储器1204和大容量存储设备1206可以统称为存储器。

根据本申请的各种实施例，服务器1200还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器1200可以通过连接在系统总线1205 上的网络接口单元1211连接到网络1212，或者说，也可以使用网络接口单元 1211来连接到其他类型的网络或远程计算机系统(未示出)。

上述存储器还包括一个或者一个以上的程序，一个或者一个以上程序存储于存储器中，被配置由CPU执行。

本申请的实施例还提供了一种计算机设备，该计算机设备包括处理器和存储器，该存储器中存储有至少一条指令、至少一段程序、代码集或指令集，至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述各方法实施例提供的语句问答方法。

本申请的实施例还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有至少一条指令、至少一段程序、代码集或指令集，至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行，以实现上述各方法实施例提供的语句问答方法。

本申请的实施例还提供了一种计算机程序产品，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述实施例中任一所述的语句问答方法。

可选地，该计算机可读存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)、固态硬盘(SSD， Solid State Drives)或光盘等。其中，随机存取记忆体可以包括电阻式随机存取记忆体(ReRAM,ResistanceRandom Access Memory)和动态随机存取存储器 (DRAM，Dynamic Random AccessMemory)。上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种语句问答方法，其特征在于，所述方法包括：

获取目标提问语句；

基于所述第一节点属性确定所述关键词匹配树中所述候选关键词与指定逻辑节点对应的第二节点属性，所述第二节点属性用于指示所述候选关键词在所述指定逻辑节点处的组合逻辑关系；

2.根据权利要求1所述的方法，其特征在于，所述基于所述第一节点属性确定所述关键词匹配树中所述候选关键词与指定逻辑节点对应的第二节点属性，包括：

获取所述关键词匹配树中所述候选关键词对应的指定逻辑节点的逻辑关系；

基于所述第一节点属性确定所述指定逻辑节点的逻辑匹配结果；

将所述指定逻辑节点的逻辑匹配结果作为所述第二节点属性。

3.根据权利要求2所述的方法，其特征在于，所述基于所述第一节点属性确定所述指定逻辑节点的逻辑匹配结果，包括：

将所述第一节点属性与所述指定逻辑节点的预设逻辑关系进行匹配；

响应于所述第一节点属性符合所述指定逻辑节点的预设逻辑关系，确定所述指定逻辑节点的逻辑匹配结果为匹配关系；

响应于所述第一节点属性不符合所述指定逻辑节点的预设逻辑关系，确定所述指定逻辑节点的逻辑匹配结果为失配关系。

4.根据权利要求2所述的方法，其特征在于，

所述指定逻辑节点的逻辑关系包括与逻辑关系、或逻辑关系和非逻辑关系中的任意一种。

5.根据权利要求1至4任一所述的方法，其特征在于，所述将所述目标提问语句与关键词匹配树进行匹配，得到所述关键词匹配树中的候选关键词与所述目标提问语句对应的第一节点属性，包括：

将所述目标提问语句中的字符输入字符匹配模型，所述字符匹配模型中包括所述关键词匹配树；

通过所述字符匹配模型对所述字符和所述关键词匹配树中的候选关键词进行匹配，确定所述目标提问语句与所述候选关键词的匹配结果；

基于所述匹配结果确定所述候选关键词对应的第一节点属性。

6.根据权利要求1至4任一所述的方法，其特征在于，所述基于所述第二节点属性确定所述目标提问语句对应的应答结果，包括：

响应于所述第二节点属性符合所述目标属性要求，确定与所述目标属性要求对应的结果作为所述应答结果；

响应于所述第二节点属性不符合所述目标属性要求，通过分类模型对所述目标提问语句进行应答分析，得到所述应答结果。

7.根据权利要求6所述的方法，其特征在于，所述通过分类模型对所述目标提问语句进行应答分析，得到所述应答结果，包括：

通过分类模型对所述目标提问语句中的字符进行权重分析，得到权重分析结果；

基于所述权重分析结果，确定所述目标提问语句对应的所述应答结果。

8.一种语句问答装置，其特征在于，所述装置包括：

获取模块，用于获取目标提问语句；

9.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至7任一所述的语句问答方法。

10.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至7任一所述的语句问答方法。

11.一种计算机程序产品，其特征在于，包括计算机程序或指令，所述计算机程序或者指令被处理器执行时实现如权利要求1至7任一所述的语句问答方法。