CN113987141A

CN113987141A - 一种基于递归询问的问答系统回答可靠性即时检查方法

Info

Publication number: CN113987141A
Application number: CN202111170353.2A
Authority: CN
Inventors: 谢晓园; 晋硕; 陈崧强
Original assignee: Wuhan University WHU
Current assignee: Wuhan University WHU
Priority date: 2021-10-08
Filing date: 2021-10-08
Publication date: 2022-01-28

Abstract

本发明提出了一种基于递归询问的问答系统回答可靠性即时检查方法。本发明收集用户当前输入的询问和问答系统为其返回的答案并检查询问的问题类型；基于用户询问和返回答案形成一条知识陈述；基于该知识陈述构造一般疑问句式递归询问并检查问答系统对于该一般疑问句式询问的回答是否符合预期要求；基于该知识陈述构造若干特殊疑问句式递归询问依次输入问答系统并检查问答系统对于每个特殊疑问句式询问的回答是否均符合预期要求；总结展示检查结果向用户报告可靠度量情况。若问答系统对于任意递归询问回答不符合预期，说明知识陈述可能出错，即对用户当前输入询问的回答可能出错。该发明可在未知正确回答的情况下即时地检查问答系统回答的可靠性。

Description

一种基于递归询问的问答系统回答可靠性即时检查方法

技术领域

本发明涉及计算机技术领域，具体涉及一种基于递归询问的问答系统回答可靠性即时检查方法。

背景技术

随着近年来自然语言处理、人工智能和深度学习等技术的发展，越来越多的问答系统软件被广泛地应用于人们的日常生活之中，辅助人们从复杂的信息中自动检索相关答案。当使用问答系统时，人们通常向问答系统提出一个问题，问答系统将像人们阅读资料一样自动理解给定的参考文献或从知识库中检索得到的相关材料，分析理解用户输入的问题，从材料中总结相关知识，并随后回答人们输入的问题。由于问答系统能够帮助人们高效地检索所需要的答案从而便利人们的生活与工作，越来越多的问答系统、服务被开发、提供，例如苹果公司发布的Siri语音助手和百度公司发布的DuerOS语音处理系统即提供了自动问答功能。

作为一种基于人工智能和深度学习技术的软件，由于神经网络的不稳定性和黑盒特性，目前的技术尚无法从技术源头保证问答系统软件返回回答的正确性和可靠性。目前，验证问答系统返回答案的方法通常为将软件的返回结果与人们手工检索、分析后预先准备好的标准答案进行对比。然而，预先准备用于评价对比的参考答案费时费力。此外，用户通常使用问答系统对未知答案的问题进行检索，因此并不预先知道目标正确答案，故在日常使用中用户无法通过比对真确结果的方式对使用问答系统过程中所获得的答案的可靠性进行即时的检查。

针对上述情况，一种可行的方案是应用软件测试领域蜕变测试技术，对问答系统在未知正确答案的情况下对其输出进行初步的正确性检查。蜕变测试技术通过检查软件在多个互相有关联的输入上的表现判断软件输出是否有可能出错，例如，当检查对于计算正弦函数sin具体值的程序在输入为1.23°情况下的输出是否正确时，蜕变测试不直接检查程序输出本身是否正确，而是根据设计的蜕变关系，对比程序输出与在输入为1.23°时的输出与(180°-1.23°)、-1.23°等输入下的输出是否满足预期关系，从而初步判断程序输出的可靠性。因此，蜕变测试可在未知标准答案的情况下对问答系统返回的答案进行初步的可靠性检查。

将蜕变测试运用于问答系统回答可靠性的即时检测存在如下具体技术问题：

目前尚无针对问答系统的蜕变关系。目前尚未发现有适用于检查问答系统回答可靠性的蜕变关系，因此需要针对问答系统的输入与输出上的特性，设计适用于问答系统的专用蜕变关系。

目前尚无方法能够基于给定问答系统输入生成相关的多样新输入。问答系统的输入为自然语言文本表示的询问，不同于普通的数字或集合可进行简单的四则、集合运算，对自然语言输入的变化与合成需要更多复杂的工序，例如将问题与答案转化为陈述句，对输入询问的题型进行变化等，均需要复杂的自然语言处理。

目前尚无方法能够衡量问答系统多个输出之间关系。问答系统的输出同样是自然语言文本答案，不同于普通的数字或集合可利用简单的值等价进行评估，对文本输出的评估通常需要从语义等价的角度进行更复杂的计算与度量。

发明内容

有鉴于此，本发明提供了一种为问答系统的回答提供即时的可靠性检查的方法，基于递归询问思想构思合适的新蜕变关系，基于该关系具体实现现有方法尚无法完成的功能，解决现有技术中的方法存在的问题。

本发明提供了一种基于递归询问的问答系统回答可靠性即时检查方法。本方法包括：

步骤1：收集用户当前输入的询问和问答系统为用户当前输入的询问返回的答案，判断用户当前输入的询问的问题类型，基于问答系统为其返回的答案对于一般疑问句或选择疑问句或特殊疑问句形式的询问合成其对应的知识陈述，或对于其他非正式问句提示用户修改输入询问为特殊疑问句、选择疑问句、一般疑问句形式之一并重新运行该方法；

步骤2：基于用户当前输入的询问对应的知识陈述构造一般疑问句作为一般疑问句式递归询问，将该一般疑问句式递归询问输入问答系统并获取对应的新答案，基于语义词向量逐词检查该新答案是否符合预期；

步骤3：基于用户当前输入的询问对应的知识陈述挑选若干可能的特殊疑问句目标答案，使用问题生成模型构造若干新的特殊疑问句，筛选保留符合要求特殊疑问句及其对应目标答案形成特殊疑问句式递归询问集合，将集合中的每一特殊疑问句式递归询问输入问答系统并获取对应该递归询问的新答案构造新答案集合，基于语义词向量逐词检查新答案集合中的每一个答案是否符合预期；

步骤4：总结展示检查结果并向用户报告可靠度量情况。

作为优选，步骤1所述收集用户当前输入的询问和问答系统为用户当前输入的询问返回的答案为：

所述用户当前输入的询问为：qs；

所述问答系统为：QA_SUT；

所述问答系统为用户当前输入的询问返回的答案为：a_s；

步骤1所述判断用户当前输入的询问的问题类型为：

记

为用户当前输入的询问的问题形式；

通过识别q_s中疑问引导词类型的方法判断q_s语句是否为特殊疑问句，若q_s疑问引导词属于特殊疑问词，则q_s为特殊疑问句形式的询问，设置

若q_s非特殊疑问句形式的询问，通过识别q_s语句中选择疑问子句的方法判断q_s是否为选择疑问句式，若q_s语句包含选择疑问子句，则q_s为选择疑问句形式的询问，设置

若q_s非特殊疑问句形式的询问和选择疑问句形式的询问，通过匹配一般疑问句语法规则的方法判断q_s语句是否为选择疑问句，若q_s语句满足一般疑问句形式，则q_s为一般疑问句形式的询问，设置

若q_s无法通过上述过程识别类型，则q_s为其他非正式问句，设置

步骤1所述基于问答系统为其返回的答案对于一般疑问句或选择疑问句或特殊疑问句形式的询问合成其对应的知识陈述为：

所述基于问答系统为其返回的答案对于一般疑问句形式的询问合成其对应的知识陈述句为：

当

时，使用通用文本语法分析工具匹配用户当前输入的询问中的主语、助动词、谓语动词与剩余成分，按照陈述句语法规则调整主语、助动词、谓语动词及剩余成分结构顺序，按照主语和助动词时态语态使用自然语言时态语态转换工具调整谓语动词时态语态，从而将q_s转化为陈述句语序，得到q_s对应的知识陈述f_s。

所述基于问答系统为其返回的答案对于选择疑问句形式的询问合成其对应的知识陈述为：

当

时，使用通用文本语法分析工具匹配用户当前输入的询问为q_s中的特殊疑问词、主语、谓语动词、选择成分与剩余成分，按照陈述句语法规则调整主语、助动词、谓语动词、选择成分与剩余成分结构顺序，按照主语和助动词时态语态使用自然语言时态语态转换工具调整谓语动词时态语态，从而将q_s转化为陈述句语序，得到带有选择成分的陈述句q′_s；

用所述问答系统为用户当前输入的询问返回的答案a_s替换q′_s中的选择成分，得到用户当前输入的询问对应的知识陈述f_s。

所述基于问答系统为其返回的答案对于特殊疑问句形式的询问合成其对应的知识陈述为：

当

时，使用通用文本语法分析工具匹配用户当前输入的询问为q_s中的特殊疑问词、主语、谓语动词与剩余成分，按照陈述句语法规则调整主语、助动词、谓语动词及剩余成分结构顺序，按照主语和助动词时态语态使用自然语言时态语态转换工具调整谓语动词时态语态，从而将q_s转化为陈述句语序，得到带有特殊疑问词的陈述句q″_s；

基于启发式规则用所述问答系统为用户当前输入的询问返回的答案a_s替换q″_s中的特殊疑问词，得到用户当前输入的询问对应的知识陈述f_s。

步骤1所述对于其他非正式问句提示用户修改输入询问为特殊疑问句、选择疑问句、一般疑问句形式之一并重新运行该方法为：

当

时，通过界面交互提示修改输入问题为其余三种标准形式并重新运行，并终止程序。

作为优选，步骤2所述基于用户当前输入的询问对应的知识陈述构造一般疑问句作为一般疑问句式递归询问为：

使用通用文本语法分析工具匹配步骤1得到的用户当前输入的询问对应的知识陈述f_s中的主语、谓语动词，根据谓语动词的时态和语态通过自然语言时态语态转换工具选取对应的助动词插入谓语动词前，得到带有助动词的陈述句f′_s；

将f′_s中助动词提前至f′_s句首，得到一般疑问句式递归询问nq^GEN。

步骤2所述将该一般疑问句式递归询问输入问答系统并获取对应的新答案为：

将所述一般疑问句式递归询问nq^GEN输入问答系统，得到问答系统对一般疑问句式递归询问的回答，定义为na^GEN。

步骤2所述基于语义词向量逐词检查该新答案是否符合预期为：

对问答系统对一般疑问句式递归询问的回答进行分词和去停顿词处理得到该回答的非停顿词集合：

其中，nLEN^GEN为问答系统对一般疑问句式递归询问的回答的非停顿词个数，

i∈[1，nLEN^GEN]为问答系统对一般疑问句式递归询问的回答的第i个非停顿词；

通过从预训练语义词向量库中提取单词的语义词向量的方法，对问答系统对一般疑问句式递归询问的回答中第i个非停顿词

获取语义词向量，记

的语义词向量为

i∈[1，nLEN^GEN]；

通过从预训练语义词向量库中提取单词的语义词向量的方法，获取肯定表达语义词向量为wordvec^yes；

对于i∈[1，nLEN^GEN]依次计算

与wordvec^yes的余弦相似度，取余弦相似度最大值记录为nmaxsim^GEN；

设一般疑问句余弦相似度度量阈值为θ^GEN；

若nmaxsim^GEN＞θ^GEN，则认为na^GEN表达肯定含义，na^GEN符合预期，设置一般疑问句式递归询问检检查结果nPASS^GEN＝TRUE；

否则认为na^GEN未表达肯定含义，na^GEN不符合预期设置一般疑问句式递归询问检查结果nPASS^GEN＝FALSE。

作为优选，步骤3所述基于用户当前输入的询问对应的知识陈述挑选若干可能的特殊疑问句目标答案为：

从步骤1得到的用户当前输入的询问对应的知识陈述f_s中使用通用文本语法分析工具抽取名词性短语和形容词性短语，作为可能的特殊疑问句目标答案，构建可能的特殊疑问句目标答案集合为：

其中，

j∈[1，N]是第j个可能的特殊疑问句目标答案，N为f_s中抽取出的可能的特殊疑问句目标答案的个数；

步骤3所述使用问题生成模型构造若干新的特殊疑问句为：

对于用户当前输入的询问对应的知识陈述f_s和可能的特殊疑问句目标答案集合

使用基于深度学习的问句生成工具依次为每一个可能的特殊疑问句目标答案生成对应的特殊疑问句，构成可能的特殊疑问句集合：

其中，

j∈[1，N]是

中第j个可能的特殊疑问句目标答案

对应的问句；

步骤3所述筛选保留符合要求特殊疑问句及其对应目标答案形成特殊疑问句式递归询问集合为：

对于j∈[1，N]，依次对可能的特殊疑问句目标答案

和对应的可能的特殊疑问句

使用通用文本语法分析工具匹配

中的特殊疑问词、主语、谓语动词、助动词与剩余成分，按照预设的语法规则调整主语、谓语动词、特殊疑问词、助动词与剩余成分顺序，按照主语和助动词时态语态使用自然语言时态语态转换工具调整谓语动词时态语态，将

转化为陈述句语序，得到

对应的带有特殊疑问词的陈述句

基于启发式变化规则用

替换

中的特殊疑问词，得到

对应的知识陈述

计算

与用户当前输入的询问对应的知识陈述f_s的单词级相似度

设特殊疑问句生成单词级相似度度量阈值为

若

则认为

符合要求，加入特殊疑问句式递归询问集合：

其中，对k∈[1，M]，

为第k个特殊疑问句，

为

目标答案，M为从步骤1得到的用户当前输入的询问对应的知识陈述f_s可生成的符合要求的特殊疑问句式递归询问的数量；

步骤3所述将集合中的每一特殊疑问句式递归询问输入问答系统并获取对应该递归询问的新答案构造新答案集合为：

对于特殊疑问句式递归询问集合

中的每一个特殊疑问句

，k∈[1，M]，将

输入问答系统QA_SUT，得到问答系统对第k个特殊疑问句的回答

所述得到的新答案集合为：

其中，

为问答系统对第k个特殊疑问句的回答；

步骤3所述基于语义词向量逐词检查新答案集合中的每一个答案是否符合预期为：

对于k∈[1，M]，依次分析第k个新答案

及第k个新答案对应的特殊疑问句

及第k个新答案对应的目标答案

对

分词和去停顿词得到第k个新答案非停顿词集合：

其中，

为

的非停顿词个数，

为

的第p个非停顿词；

通过从预训练语义词向量库中提取单词的语义词向量的方法，对

中第p个非停顿词

获取语义词向量，记

的语义词向量为

对

分词和去停顿词得到第k个新答案对应的目标答案非停顿词集合：

其中，

为

的非停顿词个数，

为

的第q个非停顿词；

中第q个非停顿词

获取语义词向量，记

的语义词向量为

对于

依次计算

与

的余弦相似度，取余弦相似度最大值记录为

加入第k个特殊疑问句式递归询问回答余弦相似度最大值集合：

其中，

为目标答案

中第q个非停顿词的语义词向量

与

中所有单词的语义词向量

的余弦相似度的最大值；

设特殊疑问句余弦相似度度量阈值为θ^WH；

计算第k个新答案与目标答案相似度均值：

对比

与θ^WH，若

则认为

表达了

的含义，

符合预期，设置第k个特殊疑问句式递归询问检查结果

否则认为

未表达

的含义，

不符合预期，设置第k个特殊疑问句式递归询问检查结果

对于k∈[1，M]，所有特殊疑问句式递归询问检查结果

构成特殊疑问句式递归询问检查结果集合：

其中

为第k个特殊疑问句式递归询问

k∈[1，M]的检查结果。

作为优选，步骤4所述总结展示检查结果并向用户报告可靠度量情况为：

通过交互界面向用户展示生成的一般疑问句式递归询问nq^GEN与问答系统QA_SUT对nq^GEN的回答na^GEN，和生成的M个特殊疑问句式递归询问

k∈[1，M]与k个问答系统QA_SUT对

的回答

统计一般疑问句式递归询问检查结果nPASS^GEN与M个特殊疑问句式递归询问检查结果

k∈[1，M]取值为FALSE的个数记为cnt_fail；

若cnt_fail＞0则提示用户核查报告的生成的一般疑问句式递归询问与特殊疑问句式递归询问及问答系统的相应回复；

否则报告问答系统回答通过检查，回答应当基本可靠。

本发明有益效果为：

本发明以在无需预先获得问答系统参考答案的情况下对系统返回的回答的可靠性进行检查为目的，首先收集用户输入的询问与问答系统的回答，检查输入的询问类型，并结合系统回答构造一条知识陈述句；其次基于该知识陈述句构造一般疑问句式递归询问，使用问答系统获取对应的新答案，并基于语义词向量检查新答案是否符合预期；随后基于该知识陈述句构造若干特殊疑问句式递归询问，使用问答系统获取对应的新答案，并基于语义词向量检查新答案是否符合预期；最后总结展示检查结果并向用户报告可靠度量情况。该方法的思路为：若问答问答系统对于初始询问的回答正确，基于初始询问和系统回答构成的知识陈述为正确事实，基于该事实产生的新询问所获得的答案应当同样符合该事实。若系统对于新询问的回复不符合知识陈述，说明该回答错误，或知识陈述错误即对初始询问回答错误。

本发明提供的方法基于一种新颖的基于递归询问的蜕变关系，即基于用户初始输入的询问与问答系统的初始回答形成知识陈述，并构建若干递归询问，通过检查问答系统对原询问和每个递归询问回答的一致性检查问答系统的回答的可靠性，全过程不需要与原询问的参考答案进行对比，从而解决了现有的基于与参考答案对比的方案费时费力、无法在问答系统使用过程中提供即时检查的问题；设计了一种新颖的基于递归询问的蜕变关系，从而解决了将蜕变测试技术应用于问答系统时无相应的合适关系的难题；设计了可用于三种问句形式及其回答合成知识陈述句并生成两种主流问句形式的自然语言操作步骤与具体实现方案，从而解决了尚无能够基于给定输入询问生成多样新输入的难题；设计了具体的针对于两种主流问句形式的基于语义的回答正确性的度量方法，从而解决了尚无能够基于给定输入询问生成多样新输入的难题。

本发明形成的方法最终可以为用户在问答系统使用过程中等未知输入询问的参考答案的情景下初步核查用户从问答系统获得答案的可靠性，从而达到在无需预先获得问答系统参考答案的情况下对系统返回的回答的可靠性进行检测的目的，实现在未知正确回答的情况下即时地初步核查问答系统回答的可靠性。

附图说明

图1：为本发明方法步骤流程图；

图2：为本发明定义的针对于一般疑问句的陈述句合成方法的一个示例的展示图；

图3：为本发明定义的针对于选择疑问句的陈述句合成方法的示例展示图；

图4：为本发明定义的针对于特殊疑问句的陈述句合成方法的示例展示图；

图5：为本发明定义的一般疑问句生成方法的示例展示图；

图6：为本发明定义的一般疑问句结果正确性度量的示例展示图；

图7：为本发明定义的特殊疑问句生成方法的示例展示图；

图8：为本发明定义的一般疑问句结果正确性度量的示例展示图。

具体实施方式

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

本发明的目的在于在无需预先获得问答系统参考答案的情况下对系统返回回答的可靠性进行检测，以缓解由于缺乏预先获得的参考答案而完全无法对问答系统返回答案的可靠性进行检查，导致用户直接接受错误答案并造成不良影响的情况。本发明基于蜕变测试技术设计了一种新颖的基于递归询问的蜕变关系，并设计了具体的问题生成、答案验证方法对问答系统返回结果进行验证，从而使用户能够在未知正确回答的情况下即时地初步核查问答系统回答的可靠性。

下面结合图1至图8介绍本发明的具体实施方式为：本发明提供了一种基于递归询问的问答系统回答可靠性即时检查方法，请参见图1，包括：

所述用户当前输入的询问为：q_s；

所述问答系统为：QA_SUT；

所述问答系统为用户当前输入的询问返回的答案为：a_s；

步骤1所述判断用户当前输入的询问的问题类型为：

记

为用户当前输入的询问的问题形式；

若q_s非特殊疑问句形式的询问，通过识别q_s语句中选择疑问子句的方法判断q_s是否为选择疑问句式，着q_s语句包含选择疑问子句，则q_s为选择疑问句形式的询问，设置

在具体的实施过程中，以针对使用英语作为交互语言的问答系统为例，实现上述过程的一种方法为：

对于使用英语作为交互语言的问答系统，通过匹配常见特殊疑问词“what”、“why”、“who”、“how”、“whose”和“where”来判断当前输入的询问为q_s是否为特殊疑问句形式的询问；

对于非特殊疑问句形式的询问，通过使用spaCy通用文本语法关系工具分析q_s中的依存关系并识别是否含有疑问关联词“or”引导的子句来判断当前输入的询问q_s是否为选择疑问句形式的询问；

对于非特殊疑问句形式且非选择疑问句的询问，通过使用spaCy通用文本语法关系工具分析q_s中每个单词的词性并判断q_s是否具有完整的主谓成分以及合适的词序来判断当前输入的询问q_s是否为一般疑问句形式的询问；

对于非特殊疑问句且非选择疑问句且非一般疑问句形式的询问，判定为其他非正式问句。

所述基于问答系统为其返回的答案对于一般疑问句形式的询问合成其对应的知识陈述为：

当

使用spaCy通用文本语法关系工具分析q_s中的依存关系与各词词性，确定句中谓语动词与疑问助动词；

若疑问助动词为“do”及其相应不同形式且答系统QA_SUT为用户当前输入的询问q_s返回的答案a_s为肯定，则去除“do”并按照“do”的语态时态修改谓语动词语态时态，即可得到q_s对应的知识陈述f_s；

否则，若问答系统QA_SUT为用户当前输入的询问q_s返回的答案a_s为否定，则将助动词修改为否定形式，即可得到q_s对应的知识陈述f_s；

附图2展示了一种上述两种具体实施的操作效果，当一般疑问句式询问中词性为AUX的助动词为Was，将其移动到谓语动词filmed前，“Yes”为肯定回答，因此即得到对应的知识陈述句当一般疑问句式询问词性为AUX的助动词为Does，“No”为否定回答，因此否定助动词形成“does not”并移动至谓语动词have前得到结果后得到对应的知识陈述。

所述基于问答系统为其返回的答案对于选择疑问句形式的询问合成其对应的知识陈述句为：

当TYPE_qs＝″ALT″时，使用通用文本语法分析工具匹配用户当前输入的询问为q_s中的特殊疑问词、主语、谓语动词、选择成分与剩余成分，按照陈述句语法规则调整主语、助动词、谓语动词、选择成分与剩余成分结构顺序，按照主语和助动词时态语态使用自然语言时态语态转换工具调整谓语动词时态语态，从而将q_s转化为陈述句语序，得到带有选择成分的陈述句q′_s；

若疑问助动词为“do”及其不同语态时态形式，则去除“do”并按照“do”的语态时态修改助动词，否则将该助动词放置谓语动词前，即可得到q_s对应的带有选择成分的陈述句q″_s；

根据q_s中的依存关系定位到由选择关联词“or”引导的选择子句成分；

将定位到的选择子句替换为问答系统QA_SUT为用户当前输入的询问q_s返回的答案a_s，即可得到q_s对应的知识陈述f_s；

附图3展示了一种上述具体实施的操作效果，其中，陈述变化类似针对附图2中的情况，最终将or子句“Scandinavia or Germany”替换为a_s即“Scandinavia”后得到最终知识陈述“Plague spread in Scandinavia first.”。

当

若疑问助动词为“do”及其相应不同形式，则去除“do”并按照“do”的语态时态修改助动词，否则将该助动词放置谓语动词前；

按照如附图4左侧所示的启发式规则将疑问词移动到相应位置，即可得到带有特殊疑问词的陈述句q″_s；

将q″_s中疑问词替换为问答系统QA_SUT为用户当前输入的询问q_s返回的答案a_s，即可得到q_s对应的知识陈述f_s；

附图4右侧展示了使用上述具体实施的部分例子。

当

使用spaCy通用文本语法关系工具分析f_s中的依存关系与各词词性，确定句中谓语动词，若谓语动词前存在助动词can、will、have、be及其各种时态语态变化，则将助动词移至句首，否则根据谓语动词的时态语态，在句首补入助动词“do”符合时态语态的相应形式，即可得到一般疑问句式递归询问nq^GEN；

附图5展示了一种上述具体实施的操作效果，当知识陈述f_s包含词性为AUX的助动词was时，将助动词was提至句首即得到nq^GEN；当知识陈述f_s不包含词性为AUX的助动词时，根据词性为VERB(ROOT)的谓语动词spread的时态语态将对应的助动词do的合适形式did插入句首即得到nq^GEN。

获取语义词向量，记

的语义词向量为

i∈[1，nLEN^GEN]；

对于i∈[1，nLEN^GEN]依次计算

设一般疑问句余弦相似度度量阈值为θ^GEN；

若nmaxsim^GEN＞θ^GEN，则认为na^GEN表达肯定含义，na^GEN符合预期，设置一般疑问句式递归询问检查结果nPASS^GEN＝TRUE；

使用spaCy通用文本分析工具对na^GEN分词和去停顿词得到

从基于Wikipedia语料预训练的Word2Vec语义词向量结果中获取na^GEN中第i个非停顿词

语义词向量

获取肯定基准单词“yes”的语义词向量作为肯定表达语义词向量wordvec^yes；

一般疑问句余弦相似度度量阈值θ^GEN用于度量na^GEN是否表达了肯定的语义。若θ^GEN过低则会漏报部分未表达肯定的na^GEN，若θ^GEN过高则会误报部分相对可认为正确的na^GEN。本领域的技术员可根据实际使用情况优选合适的θ^GEN，当使用基于Wikipedia语料预训练的Word2Vec语义词向量时，θ^GEN典型值为0.6；

附图6展示了一种上述度量过程的具体实施例，其中na^GEN为“yep it is black”，

nmaxsim^GEN＝0.6019，因此na^GEN被认为符合预期，设置nPASS^GEN＝TRUE。

其中，

使用spaCy通用文本语法关系工具分析f_s中的依存关系与各词词性，提取不含代词且不为原问题答案a_s的形容词词组和名词词组构建可能的特殊疑问句目标答案集合

附图7中(a)部分展示了从f_s提取出的可能的特殊疑问句目标答案集合

步骤3所述使用问题生成模型构造若干新的特殊疑问句为：

其中，

j∈[1，N]是

中第j个可能的特殊疑问句目标答案

对应的问句；

使用UniLM等基于深度学习的特殊疑问句问题生成工具，对于可能的特殊疑问句目标答案集合

和知识陈述f_s，构成可能的特殊疑问句集合

附图7中(b)部分展示了一个基于(a)的结果所构成的可能的特殊疑问句集合

的例子。

对于j∈[1，N]，依次对可能的特殊疑问句目标答案

和对应的可能的特殊疑问句

使用通用文本语法分析工具匹配

转化为陈述句语序，得到

对应的带有特殊疑问词的陈述句

基于启发式变化规则用

替换

中的特殊疑问词，得到

对应的知识陈述

计算

与用户当前输入的询问对应的知识陈述f_s的单词级相似度

设特殊疑问句生成单词级相似度度量阈值为

若

则认为

符合要求，加入特殊疑问句式递归询问集合：

其中，对k∈[1，M]，

为第k个特殊疑问句，

为

通过步骤1实施例所述方法实现基于预设的特殊疑问句转陈述句变化规则用，根据第j个目标答案

和对应的可能的特殊疑问句

合成其对应的知识陈述句

基于ROUGE-1单词级相似度度量函数

计算

与步骤1得到的用户当前输入的询问对应的知识陈述f_s的单词级相似度

特殊疑问句生成单词级相似度度量阈值

田于度量

是否符合要求。若

过低则会误将部分错误的问句用作特殊疑问句式递归询问，导致误报错误；若

过高则会过滤去部分正确的表达形式多样的合法问题，导致可测试项减少，降低错误发现能力。本领域的技术员可根据实际使用情况优选合适的

当使用上述ROUGE-1单词级相似度度量函数时，

典型值为0.6；

附图7中(c)部分展示了基于(a)所构成的可能的特殊疑问句集合

与(b)部分特殊疑问句集合

生成对应陈述句并计算

的情况，其中可选问题及答案2与6被去除；最终余下符合要求的两个问题与答案对构成该例子的特殊疑问句式递归询问集合

对于特殊疑问句式递归询问集合

中的每一个特殊疑问句

，k∈[1，M]，将

输入问答系统QA_SUT，得到问答系统对第k个特殊疑问句的回答

所述得到的新答案集合为：

其中，

为问答系统对第k个特殊疑问句的回答；

对于k∈[1，M]，依次分析第k个新答案

及第k个新答案对应的特殊疑问句

及第k个新答案对应的目标答案

对

分词和去停顿词得到第k个新答案非停顿词集合：

其中，

为

的非停顿词个数，

为

的第p个非停顿词；

中第p个非停顿词

获取语义词向量，记

的语义词向量为

对

其中，

为

的非停顿词个数，

为

的第q个非停顿词；

中第q个非停顿词

获取语义词向量，记

的语义词向量为

对于

依次计算

与

的余弦相似度，取余弦相似度最大值记录为

其中，

为目标答案

中第q个非停顿词的语义词向量

与

中所有单词的语义词向量

的余弦相似度的最大值；

设特殊疑问句余弦相似度度量阈值为θ^WH；

计算第k个新答案与目标答案相似度均值：

对比

与θ^WH，若

则认为

表达了

的含义，

符合预期，设置第k个特殊疑问句式递归询问检查结果

否则认为

未表达

的含义，

不符合预期，设置第k个特殊疑问句式递归询问检查结果

对于k∈[1，M]，所有特殊疑问句式递归询问检查结果

构成特殊疑问句式递归询问检查结果集合：

其中

为第k个特殊疑问句式递归询问

k∈[1，M]的检查结果。

使用spaCy通用文本分析工具对

分词和去停顿词得到

从基于Wikipedia语料预训练的Word2Vec语义词向量结果中获取

中第p个非停顿词

语义词向量

使用spaCy通用文本分析工具对

分词和去停顿词得到

从基于Wikipedia语料预训练的Word2Vec语义词向量结果中获取

中第q个非停顿词

语义词向量

特殊疑问句余弦相似度度量阈值θWH度量

是否正确且完整地准确表达了

的语义。若θ^WH过低则会漏报部分未准确表达

的

若θ^WH过高则会误报部分相对可认为止确的

本领域的技术员可根据实际使用情况优选合适的θ^WH，当使用基于Wikipedia语料预训练的Word2Vec语义词向量时，θ^WH典型值为0.6；

附图8展示了一种上述度量过程的具体实施例，假定k＝1，其中

为“egyptianpresident”，

为“the president of egypt”，

因此

被认为符合预期，设置

步骤4：总结展示检查结果并向用户报告可靠度量情况。

k∈[1，M]与k个问答系统QA_SUT对

的回答

k∈[1，M]取值为FALSE的个数记为cnt_fail；

否则报告问答系统回答通过检查，回答应当基本可靠。

本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

以上应用了具体个例对本发明进行阐述，只是用于帮助理解本发明，并不用以限制本发明。对于本发明所属技术领域的技术人员，依据本发明的思想，还可以做出若干简单推演、变形或替换。本领域的技术人员容易理解，以上所述仅为本发明专利的较佳实施例而已，并不用以限制本发明专利，凡在本发明专利的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明专利的保护范围之内。