WO2021082070A1

WO2021082070A1 - 智能对话方法及相关设备

Info

Publication number: WO2021082070A1
Application number: PCT/CN2019/117542
Authority: WO
Inventors: 刘涛; 许开河; 王少军
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-10-29
Filing date: 2019-11-12
Publication date: 2021-05-06
Also published as: CN111008267B; CN111008267A

Abstract

一种智能对话方法及相关设备，涉及语音语义领域，应用于电子设备，所述方法包括：基于用户输入的目标问题语句确定N个第一问题语句（201），每个第一问题语句关联一个第一答案语句；基于预设神经网络模型确定N个第一参数，N个第一参数与所述N个第一问题语句一一对应（202）；将目标答案语句作为目标问题语句的答案语句，目标答案语句为目标参数对应的第一问题语句关联的第一答案语句（203），所述N个第一参数包括所述目标参数；输出目标答案语句（204），可实现可控的回答语料库中未出现的问题。

Description

智能对话方法及相关设备

本申请要求于2019年10月29日提交中国专利局、申请号为2019110344253、申请名称为“智能对话方法及相关设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及电子技术领域，尤其涉及一种智能对话方法及相关设备。

背景技术

智能对话是人工智能领域中的一个重要应用，人类天生具有分析对话状态、主题、语气的能力，在机器上实现智能对话具有重大的意义。目前，智能对话主要基于两种模型实现，生成式模型和规则模型。生成式模型可以回答语料库中未出现的问题，但是回答语句不可控；而规则模型虽回答语句可控，但是无法回答语料中未出现的问题。因此如何实现可控的回答语料库中未出现的问题是一个需要解决的技术问题。

发明内容

本申请实施例提供一种智能对话方法及相关设备，用于实现可控的回答语料库中未出现的问题。

第一方面，本申请实施例提供一种智能对话方法，应用于电子设备，所述方法包括：

基于用户输入的目标问题语句确定N个第一问题语句，每个第一问题语句与所述目标问题语句的相似度均大于或等于第一阈值，所述N为大于1的整数，每个第一问题语句关联一个第一答案语句；

基于预设神经网络模型确定N个第一参数，所述N个第一参数与所述N个第一问题语句一一对应，所述N个第一参数用于评价其对应的第一问题语句与所述目标问题语句的相似度；

将目标答案语句作为所述目标问题语句的答案语句，所述目标答案语句为目标参数对应的第一问题语句关联的第一答案语句，所述目标参数的值大于或等于第二阈值，所述N个第一参数包括所述目标参数；

输出所述目标答案语句。

第二方面，本申请实施例提供一种智能对话装置，应用于电子设备，所述装置包括：

确定单元，用于基于用户输入的目标问题语句确定N个第一问题语句，每个第一问题语句与所述目标问题语句的相似度均大于或等于第一阈值，所述N为大于1的整数，每个第一问题语句关联一个第一答案语句；基于预设神经网络模型确定N个第一参数，所述N个第一参数与所述N个第一问题语句一一对应，所述N个第一参数用于评价其对应的第一问题语句与所述目标问题语句的相似度；将目标答案语句作为所述目标问题语句的答案语句，所述目标答案语句为目标参数对应的第一问题语句关联的第一答案语句，所述目标参数的值大于或等于第二阈值，所述N个第一参数包括所述目标参数；

输出单元，用于输出所述目标答案语句。

第三方面，本申请实施例提供一种电子设备，该电子设备包括处理器、存储器、通信接口，以及一个或多个程序，所述一个或多个程序被存储在所述存储器中，并且被配置由所述处理器执行，所述程序包括用于执行如本申请实施例第一方面所述的方法中所描述的部分或全部步骤的指令。

第四方面，本申请实施例提供了一种计算机可读存储介质，其中，上述计算机可读存储介质用于存储计算机程序，其中，上述计算机程序被处理器执行，以实现如本申请实施例第一方面所述的方法中所描述的部分或全部步骤。

可以看出，在本申请实施例中，先基于用户输入的目标问题语句确定N个第一问题语句，然后基于预设神经网络模型确定N个第一参数，N个第一参数用于评价其对应的第一问题语句与目标问题语句的相似度，然后将大于或等于第二阈值的第一参数对应的第一问题语句关联的第一答案语句作为所述目标问题语句的答案语句，最后输出该答案语句，基于用户输入的目标问题语句确定N个第一问题语句，进行了一个粗略筛选，保证了答案语句的可控性；基于预设神经网络模型确定N个第一参数，实现了灵活回答语料库中未出现的问题。

本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种电子设备的结构示意图；

图2A是本申请实施例提供的一种智能对话方法的流程示意图；

图2B是本申请实施例提供的一种句句相似度的计算过程示意图；

图3是本申请实施例提供的一种智能对话方法的流程示意图；

图4是本申请实施例提供的一种电子设备的结构示意图；

图5是本申请实施例提供的一种智能对话装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

以下分别进行详细说明。

本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

下面结合附图对本申请的实施例进行描述。

电子设备可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备(例如智能手表、智能手环、计步器等)、计算设备或通信连接到无线调制解调器的其他处理设备，以及各种形式的用户设备(User Equipment，UE)，移动台(Mobile Station，MS)，终端设备(terminal device)等等。为方便描述，上面提到的设备统称为电子设备。

如图1所示，图1是本申请实施例提供的一种电子设备的结构示意图。该电子设备包括处理器、存储器、信号处理器、收发器、显示屏、扬声器、麦克风、随机存取存储器(Random Access Memory，RAM)、摄像头和传感器等等。其中，存储器、信号处理器、显示屏、扬声器、麦克风、RAM、摄像头、传感器与处理器连接，收发器与信号处理器连接。

其中，显示屏可以是液晶显示器(Liquid Crystal Display，LCD)、有机或无机发光二极管(Organic Light-Emitting Diode，OLED)、有源矩阵有机发光二极体面板(Active Matrix/Organic Light Emitting Diode，AMOLED)等。

其中，该摄像头可以是普通摄像头、也可以是红外摄像，在此不作限定。该摄像头可以是前置摄像头或后置摄像头，在此不作限定。

其中，传感器包括以下至少一种：光感传感器、陀螺仪、红外接近传感器、指纹传感器、压力传感器等等。其中，光感传感器，也称为环境光传感器，用于检测环境光亮度。光线传感器可以包括光敏元件和模数转换器。其中，光敏元件用于将采集的光信号转换为电信号，模数转换器用于将上述电信号转换为数字信号。可选的，光线传感器还可以包括信号放大器，信号放大器可以将光敏元件转换的电信号进行放大后输出至模数转换器。上述光敏元件可以包括光电二极管、光电三极管、光敏电阻、硅光电池中的至少一种。

其中，处理器是电子设备的控制中心，利用各种接口和线路连接整个电子设备的各个部分，通过运行或执行存储在存储器内的软体程序和/或模块，以及调用存储在存储器内的数据，执行电子设备的各种功能和处理数据，从而对电子设备进行整体监控。

其中，处理器可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器中。

其中，存储器用于存储软体程序和/或模块，处理器通过运行存储在存储器的软件程序和/或模块，从而执行电子设备的各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的软体程序等；存储数据区可存储根据电子设备的使用所创建的数据等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

下面对本申请实施例进行详细介绍。

请参阅图2A，图2A是本申请实施例提供的一种智能对话方法的流程示意图，应用于电子设备，所述方法包括：

步骤201：基于用户输入的目标问题语句确定N个第一问题语句，每个第一问题语句与所述目标问题语句的相似度均大于或等于第一阈值，所述N为大于1的整数，每个第一问题语句关联一个第一答案语句。

其中，用户输入的信息可以是语音、文字或图片，然后解析用户输入的信息得到目标问题语句。

其中，N例如可以为5、10、15、20，或是其他值，在此不作限定。

其中，第一阈值例如可以为80％、85％、90％、95％，或是其他值，在此不作限定。

如表1所示，表1为第一问题语句与第一答案语句一一对应的关系映射表，所述关系映射表可以存储在所述电子设备关联的数据库中。

表1

步骤202：基于预设神经网络模型确定N个第一参数，所述N个第一参数与所述N个第一问题语句一一对应，所述N个第一参数用于评价其对应的第一问题语句与所述目标问题语句的相似度。

步骤203：将目标答案语句作为所述目标问题语句的答案语句，所述目标答案语句为目标参数对应的第一问题语句关联的第一答案语句，所述目标参数的值大于或等于第二阈值，所述N个第一参数包括所述目标参数。

其中，第一阈值和第二阈值均为预先设定的值。

举例说明，例如确定的第一问题语句包括3个，每个的第一参数的值例如分别为80％、85％、90％，那么目标参数则可以为90％，将90％对应的第一问题语句关联的第一答案语句作为目标问题语句的答案语句。

步骤204：输出所述目标答案语句。

其中，可以语音输出所述目标答案语句，也可以文字输出所述目标答案语句，在此不作限定。

在本申请的一实现方式中，所述基于用户输入的目标问题语句确定N个第一问题语句，包括：

获取用户输入的目标问题语句；

基于字面搜索从预设语料库中确定M个第二问题语句，以及基于语义搜索从所述预设语料库中确定W个第三问题语句，所述字面搜索的关键词是基于所述目标问题语句确定的，每个第二问题语句与所述目标问题语句的字面相似度均大于或等于第三阈值，每个第三问题语句与所述目标问题语句的语义相似度均大于或等于第四阈值，所述第一阈值大于或等于所述第三阈值，所述第一阈值大于或等于所述第四阈值，所述M和所述W均为大于0的整数；

基于所述M个第二问题语句和所述W个第三问题语句，确定N个第一问题语句，所述N个第一问题语句包括至少一个第二问题语句和至少一个第三问题语句。

具体地，所述目标问题语句由第一字符集构成，所述第一字符集包括P个第一字符，所述P为大于0的整数；所述基于字面搜索从预设语料库中确定M个第二问题语句的一具体实现方式为：在预设语料库以所述P个第一字符中的至少一个第一字符为关键词进行搜索，得到Q个第五问题语句；从所述Q个第五问题语句中选择M个第五问题语句；将所述M个第五问题语句确定为M个第二问题语句。

其中，所述M个第五问题语句可以是人为选择的任意M个第五问题语句，也可以是搜索之后，排序靠前的M个第五问题语句，还可以是包含关键词最多的M个第五问题语句，在此不做限定。

进一步地，所述M个第二问题语句包括的第一字符的数量大于或等于Q-M个第六问题语句包括的第一字符的数量，所述Q-M个第六问题语句为所述Q个第五问题语句中除所述M个第五问题语句的问题语句。

其中，第三阈值例如可以为60％、70％、80％、90％，或是其他值，在此不作限定；第四阈值例如可以为60％、70％、80％、90％，或是其他值，在此不作限定。

具体地，所述基于所述M个第二问题语句和所述W个第三问题语句，确定N个第一问题语句的一具体方式为：从所述M个第二问题语句中确定n*N个第二问题语句，以及从所述W个第三问题语句中确定(1-n)*N个第三问题语句；将所述n*N个第二问题语句和所述(1-n)*N个第三问题语句作为N个第一问题语句。

其中，n为大于0且小于1的数，例如可以为0.1、0.2、0.3、0.4，或是其他的值，在此不做限定。

其中，所述n*N个第二问题语句与所述目标问题语句的字面相似度大于或等于第五阈值，所述(1-n)*N个第三问题语句所述目标问题语句的语义相似度大于或等于第六阈值，所述第五阈值可以等于所述第六阈值，所述第五阈值也可以不等于所述第六阈值，在此不做限定。

在本申请的一实现方式中，所述基于语义搜索从所述预设语料库中确定W个第三问题语句，包括：

确定所述目标问题语句的语句构成成分；

基于所述语句构成成分对所述目标问题语句进行过滤得到第四问题语句，所述第四问题语句的语句构成成分少于或等于所述目标问题语句的语句构成成分；

从所述预设语料库中确定W个第三问题语句，每个第三问题语句与所述第四问题语句的语义相似度均大于或等于所述第四阈值。

其中，语句构成成分包括以下至少一种：主语、谓语、宾语、定语、状语、补足语、中心语、动语。

举例说明，将目标问题语句中的主语去除，从而获得去除主语后的语句。语句中的主语，例如可以为“他”、“她”、“它”、“他们”、“我”、“你”等词。示例性的，目标问题语句为“给我推荐一个合适的书包”，则去除停用词后的语句为“给推荐一个合适的书包”。

对所述目标问题语句进行分词处理，以得到多个目标词；

基于预设停用词表删除所述多个目标词中的停用词，以得到第七问题语句；

从所述预设语料库中确定W个第三问题语句，每个第三问题语句与所述第七问题语句的语义相似度均大于或等于所述第四阈值。

其中，停用词是对语句无意义的词，比如“啊”、“哦”、“嗯”、“了”、“么”、“的”等词。示例性的，目标问题语句为“明天的天气怎么样啊。”，则去除停用词后的语句为“明天天气怎么样”。

在本申请的一实现方式中，所述基于预设神经网络模型确定N个第一参数，包括：

基于预设神经网络模型确定所述目标问题语句与所述N个第一问题语句的N个句句相似度、N个编辑距离和N个杰卡德相似度，所述N个句句相似度、所述N个编辑距离和所述N个杰卡德相似度均与所述N个第一问题语句一一对应；

基于所述N个句句相似度、所述N个编辑距离和所述N个杰卡德相似度确定N个第一参数，所述N个第一参数与所述N个句句相似度、所述N个编辑距离和所述N个杰卡德相似度均一一对应。

其中，句句相似度指的是目标问题语句与第一问题语句的相似度。

其中，编辑距离是指将第一问题语句通过编辑操作转换成目标问题语句的最少编辑次数。

具体地，所述基于所述N个句句相似度、所述N个编辑距离和所述N个杰卡德相似度确定N个第一参数，包括：

将所述N个编辑距离转化成N个第一相似度；

确定第一权重、第二权重和第三权重，所述第一权重用于表示句句相似度在用于评价第一参数时所占的比重，所述第二权重用于表示第一相似度在用于评价第一参数时所占的比重，所述第三权重用于表示杰卡德相似度在用于评价第一参数时所占的比重，所述第一权重、所述第二权重与所述第三权重之和为1；

基于所述第一权重、所述第二权重、所述第三权重、所述N个句句相似度、所述N个第一相似度、所述N个杰卡德相似度和第一参数公式确定N个第一参数。

举例说明，表2是本申请实施例提供的一种编辑距离与第一相似度的一一对应关系表。

表2

编辑距离	第一相似度
大于或等于0，且小于3	90％
大于或等于3，且小于6	80％
大于或等于6，且小于9	70％
大于或等于9，且小于12	60％
···	···

进一步地，所述第一参数公式为：S＝a*A+b*B+c*C，所述S为第一参数，所述a为所述第一权重，所述b为所述第二权重，所述c为所述第三权重，所述A为句句相似度，所述B为第一相似度，所述C为杰卡德相似度。

举例说明，a为0.3，b为0.5，c为0.2，A为80％，B为90％，C为80％，则计算可得S＝85％。

在本申请的一实现方式中，所述基于预设神经网络模型确定所述目标问题语句与所述N个第一问题语句的N个句句相似度，包括：

将所述目标问题语句转化成第一句向量，以及将所述N个第一问题语句转化成N个第二句向量，所述N个第二句向量与所述N个第一问题语句一一对应；

提取所述第一句向量的特征信息得到第一目标向量，以及提取所述N个第二句向量的特征信息得到N个第二目标向量，所述N个第二目标向量与所述N个第二句向量一一对应；

基于句句相似度计算公式确定所述第一目标向量和每个第二目标向量的句句相似度，得到N个句句相似度。

进一步地，所述目标问题语句由第一字符集构成，所述第一字符集包括P个第一字符，所述将所述目标问题语句转化成第一句向量的一具体实现方式包括：将所述P个第一字符转化成P个词向量；将所述P个词向量组合得到第一句向量。

需要说明的是，将所述P个第一字符转化成P个词向量的方式可以为以下至少一种：双向编码表示(Bidirectional Encoder Representation from Transformers，BERT)模型、语言模型嵌入(Embeddings from Language Models，ELMo)模型、word2vec模型。

其中，句句相似度计算公式为

其中h _a、h _b分别为第一目标向量和第二目标向量。

如图2B所述，图2B是本申请实施例提供的一种句句相似度的计算过程示意图。目标问题语句为“He is smart”，“He”的词向量为x ₁ ^a，“is”的词向量为x ₂ ^a，“smart”的词向量为x ₃ ^a，然后通过LSTMa算法分别提取x ₁ ^a、x ₂ ^a、x ₃ ^a的特征信息，得到h ₁ ^a、h ₂ ^a、h ₃ ^a。同理，第一问题语句为“A truly wise man”，“A”的词向量为x ₁ ^b，“truly”的词向量为x ₂ ^b，“wise”的词向量为x ₃ ^b，“man”的词向量为x ₄ ^b，然后通过LSTMb算法分别提取x ₁ ^b、x ₂ ^b、x ₃ ^b、x ₄ ^b的特征信息，得到h ₁ ^b、h ₂ ^b、h ₃ ^b、h ₄ ^b。最后，通过句句相似度计算公式f(h _a，h _b)即可得到句句相似度A，以及输出句句相似度A。

在本申请的一实现方式中，所述目标问题语句由第一字符集构成，所述N个第一问题语句由N个第二字符集构成，所述N个第二字符集与所述N个第一问题语句一一对应；所述基于预设神经网络模型确定所述目标问题语句与所述N个第一问题语句的N个编辑距离，包括：

确定将所述第一字符集转化成每个第二字符集所需的最少编辑操作次数；

将得到的N个最少编辑操作次数确定为N个编辑距离，所述N个编辑距离与所述N个最少编辑操作次数一一对应。

其中，编辑操作包括以下至少一种：插入、删除、替换。

举例说明，"kitten"和"sitting"这两个单词，由"kitten"转换为"sitting"需要的最少单字符编辑操作有：第一步，kitten→sitten(用"s"替换"k")；第二步，sitten→sittin(用"i"替换"e")；第三步，sittin→sitting(在单词末尾插入"g")。因此，"kitten"和"sitting"这两个单词之间的编辑距离为3。

在本申请的一实现方式中，所述基于预设神经网络模型确定所述目标问题语句与所述N个第一问题语句的N个杰卡德相似度，包括：

确定所述第一字符集与所述N个第二字符集的N个交集和N个并集，所述N个交集和所述N个并集均与所述N个第二字符集一一对应；

基于所述N个交集和所述N个并集确定N个杰卡德相似度，所述N个杰卡德相似度与所述N个交集和所述N个并集均一一对应。

进一步地，第一字符集包括P个第一字符，第二字符集包括Q个第二字符，其中第一字符和第二字符相同的有R个，则第一字符集与第二字符集的交集为R，第一字符集与第二字符集的并集为P+Q-R，杰卡德相似度为R/(P+Q-R)，R和Q均为大于0的整数。

与所述图2A所示的实施例一致的，请参阅图3，图3是本申请实施例提供的一种智能对话方法的流程示意图，应用于电子设备，所述方法包括：

步骤301：获取用户输入的目标问题语句，所述目标问题语句由第一字符集构成。

步骤302：基于字面搜索从预设语料库中确定M个第二问题语句，所述字面搜索的关键词是基于所述目标问题语句确定的，每个第二问题语句与所述目标问题语句的字面相似度均大于或等于第三阈值，所述M为大于0的整数。

步骤303：确定所述目标问题语句的语句构成成分。

步骤304：基于所述语句构成成分对所述目标问题语句进行过滤得到第四问题语句，所述第四问题语句的语句构成成分少于或等于所述目标问题语句的语句构成成分。

步骤305：从所述预设语料库中确定W个第三问题语句，每个第三问题语句与所述第四问题语句的语义相似度均大于或等于所述第四阈值，所述W为大于0的整数。

步骤306：基于所述M个第二问题语句和所述W个第三问题语句，确定N个第一问题语句，所述N个第一问题语句包括至少一个第二问题语句和至少一个第三问题语句，每个第一问题语句与所述目标问题语句的相似度均大于或等于第一阈值，所述第一阈值大于或等于所述第三阈值，所述第一阈值大于或等于所述第四阈值，所述N个第一问题语句由N个第二字符集构成，所述N个第二字符集与所述N个第一问题语句一一对应。

步骤307：将所述目标问题语句转化成第一句向量，以及将所述N个第一问题语句转化成N个第二句向量，所述N个第二句向量与所述N个第一问题语句一一对应。

步骤308：提取所述第一句向量的特征信息得到第一目标向量，以及提取所述N个第二句向量的特征信息得到N个第二目标向量，所述N个第二目标向量与所述N个第二句向量一一对应。

步骤309：基于句句相似度计算公式确定所述第一目标向量和每个第二目标向量的句句相似度，得到N个句句相似度。

步骤310：确定将所述第一字符集转化成每个第二字符集所需的最少编辑操作次数。

步骤311：将得到的N个最少编辑操作次数确定为N个编辑距离，所述N个编辑距离与所述N个最少编辑操作次数一一对应。

步骤312：确定所述第一字符集与所述N个第二字符集的N个交集和N个并集，所述N个交集和所述N个并集均与所述N个第二字符集一一对应。

步骤313：基于所述N个交集和所述N个并集确定N个杰卡德相似度，所述N个杰卡德相似度与所述N个交集和所述N个并集均一一对应。

步骤314：基于所述N个句句相似度、所述N个编辑距离和所述N个杰卡德相似度确定N个第一参数，所述N个第一参数与所述N个句句相似度、所述N个编辑距离和所述N个杰卡德相似度均一一对应。

步骤315：将目标答案语句作为所述目标问题语句的答案语句，所述目标答案语句为目标参数对应的第一问题语句关联的第一答案语句，所述目标参数的值大于或等于第二阈值，所述N个第一参数包括所述目标参数。

步骤316：输出所述目标答案语句。

需要说明的是，步骤302和步骤303-305可以同时执行，也可以先执行步骤302，再执行步骤303-305，还可以先执行步骤303-305，再执行步骤302；步骤307-309、步骤310-311、步骤312-314可以同时执行，也可以先执行步骤307-309，再执行310-311，然后执行步骤312-314，还可以先执行步骤310-311，再执行步骤307-309，然后执行步骤312-314，还可以先执行步骤312-314，再执行步骤307-309，然后再执行步骤310-311，在此均不做限定。本实施例的具体实现过程可参见上述方法实施例所述的具体实现过程，在此不再叙述。

与上述图2A和图3所示的实施例一致的，请参阅图4，图4是本申请实施例提供的一种电子设备的结构示意图，如图所示，该电子设备包括存储器、通信接口以及一个或多个程序，其中，上述一个或多个程序被存储在上述存储器中，并且被配置由上述处理器执行，上述程序包括用于执行以下步骤的指令：

输出所述目标答案语句。

在本申请的一实现方式中，在基于用户输入的目标问题语句确定N个第一问题语句方面，上述程序包括具体用于执行以下步骤的指令：

获取用户输入的目标问题语句；

在本申请的一实现方式中，所述目标问题语句由第一字符集构成，所述第一字符集包括P个第一字符，所述P为大于0的整数；在基于字面搜索从预设语料库中确定M个第二问题语句方面，上述程序包括具体用于执行以下步骤的指令：

在预设语料库以所述P个第一字符中的至少一个第一字符为关键词进行搜索，得到Q个第五问题语句；

从所述Q个第五问题语句中选择M个第五问题语句；

将所述M个第五问题语句确定为M个第二问题语句。

在本申请的一实现方式中，在基于语义搜索从所述预设语料库中确定W个第三问题语句方面，上述程序包括具体用于执行以下步骤的指令：

确定所述目标问题语句的语句构成成分；

在本申请的一实现方式中，在基于预设神经网络模型确定N个第一参数方面，上述程序包括具体用于执行以下步骤的指令：

在本申请的一实现方式中，在基于预设神经网络模型确定所述目标问题语句与所述N个第一问题语句的N个句句相似度方面，上述程序包括具体用于执行以下步骤的指令：

在本申请的一实现方式中，所述目标问题语句由第一字符集构成，所述N个第一问题语句由N个第二字符集构成，所述N个第二字符集与所述N个第一问题语句一一对应；在基于预设神经网络模型确定所述目标问题语句与所述N个第一问题语句的N个编辑距离方面，上述程序包括具体用于执行以下步骤的指令：

在本申请的一实现方式中，在基于预设神经网络模型确定所述目标问题语句与所述N个第一问题语句的N个杰卡德相似度方面，上述程序包括具体用于执行以下步骤的指令：

在本申请的一实现方式中，在基于所述N个句句相似度、所述N个编辑距离和所述N个杰卡德相似度确定N个第一参数方面，上述程序包括具体用于执行以下步骤的指令：

将所述N个编辑距离转化成N个第一相似度；

需要说明的是，本实施例的具体实现过程可参见上述方法实施例所述的具体实现过程，在此不再叙述。

上述实施例主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是，电子设备为了实现上述功能，其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

本申请实施例可以根据所述方法示例对电子设备进行功能单元的划分，例如，可以对应各个功能划分各个功能单元，也可以将两个或两个以上的功能集成在一个处理单元中。所述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。需要说明的是，本申请实施例中对单元的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

下面为本申请装置实施例，本申请装置实施例用于执行本申请方法实施例所实现的方法。请参阅图5，图5是本申请实施例提供的一种智能对话装置的结构示意图，应用于电子设备，所述装置包括：

确定单元501，用于基于用户输入的目标问题语句确定N个第一问题语句，每个第一问题语句与所述目标问题语句的相似度均大于或等于第一阈值，所述N为大于1的整数，每个第一问题语句关联一个第一答案语句；基于预设神经网络模型确定N个第一参数，所述N个第一参数与所述N个第一问题语句一一对应，所述N个第一参数用于评价其对应的第一问题语句与所述目标问题语句的相似度；将目标答案语句作为所述目标问题语句的答案语句，所述目标答案语句为目标参数对应的第一问题语句关联的第一答案语句，所述目标参数的值大于或等于第二阈值，所述N个第一参数包括所述目标参数；

输出单元502，用于输出所述目标答案语句。

在本申请的一实现方式中，在基于用户输入的目标问题语句确定N个第一问题语句方面，所述确定单元501包括获取子单元5011、第一子确定单元5012、第二子确定单元5013和第三子确定单元5014，其中：

所述获取子单元5011，用于获取用户输入的目标问题语句；

所述第一子确定单元5012，用于基于字面搜索从预设语料库中确定M个第二问题语句，所述字面搜索的关键词是基于所述目标问题语句确定的；

所述第二子确定单元5013，用于基于语义搜索从所述预设语料库中确定W个第三问题语句，每个第二问题语句与所述目标问题语句的字面相似度均大于或等于第三阈值，每个第三问题语句与所述目标问题语句的语义相似度均大于或等于第四阈值，所述第一阈值大于或等于所述第三阈值，所述第一阈值大于或等于所述第四阈值，所述M和所述W均为大于0的整数；

所述第三子确定单元5014，用于基于所述M个第二问题语句和所述W个第三问题语句，确定N个第一问题语句，所述N个第一问题语句包括至少一个第二问题语句和至少一个第三问题语句。

在本申请的一实现方式中，所述目标问题语句由第一字符集构成，所述第一字符集包括P个第一字符，所述P为大于0的整数；在基于字面搜索从预设语料库中确定M个第二问题语句方面，所述第一子确定单元5012，具体用于

从所述Q个第五问题语句中选择M个第五问题语句；

将所述M个第五问题语句确定为M个第二问题语句。

在本申请的一实现方式中，在基于语义搜索从所述预设语料库中确定W个第三问题语句方面，所述第二子确定单元5013，具体用于确定所述目标问题语句的语句构成成分；基于所述语句构成成分对所述目标问题语句进行过滤得到第四问题语句，所述第四问题语句的语句构成成分少于或等于所述目标问题语句的语句构成成分；从所述预设语料库中确定W个第三问题语句，每个第三问题语句与所述第四问题语句的语义相似度均大于或等于所述第四阈值。

在本申请的一实现方式中，在基于预设神经网络模型确定N个第一参数方面，所述确定单元501还包括第四子确定单元5015和第五子确定单元5016，其中：

所述第四子确定单元5015，用于基于预设神经网络模型确定所述目标问题语句与所述N个第一问题语句的N个句句相似度、N个编辑距离和N个杰卡德相似度，所述N个句句相似度、所述N个编辑距离和所述N个杰卡德相似度均与所述N个第一问题语句一一对应；

所述第五子确定单元5016，用于基于所述N个句句相似度、所述N个编辑距离和所述N个杰卡德相似度确定N个第一参数，所述N个第一参数与所述N个句句相似度、所述N个编辑距离和所述N个杰卡德相似度均一一对应。

在本申请的一实现方式中，在基于预设神经网络模型确定所述目标问题语句与所述N个第一问题语句的N个句句相似度方面，所述第四子确定单元5015，具体用于：

在本申请的一实现方式中，所述目标问题语句由第一字符集构成，所述N个第一问题语句由N个第二字符集构成，所述N个第二字符集与所述N个第一问题语句一一对应；在基于预设神经网络模型确定所述目标问题语句与所述N个第一问题语句的N个编辑距离方面，所述第四子确定单元5015，具体用于：

在本申请的一实现方式中，在基于预设神经网络模型确定所述目标问题语句与所述N个第一问题语句的N个杰卡德相似度方面，所述第四子确定单元5015，具体用于：

在本申请的一实现方式中，在基于所述N个句句相似度、所述N个编辑距离和所述N个杰卡德相似度确定N个第一参数，所述第五子确定单元5016，具体用于：

将所述N个编辑距离转化成N个第一相似度；

需要说明的是，获取子单元5011、第一子确定单元5012、第二子确定单元5013、第三子确定单元5014、第四子确定单元5015、第五子确定单元5016和输出单元502可通过处理器实现。

本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质可以为计算机非易失性可读存储介质，也可以为计算机易失性可读存储介质，在此不作限定，其中，该计算机可读存储介质存储用于电子数据交换的计算机程序，该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤，上述计算机包括电子设备。

本申请实施例还提供一种计算机程序产品，上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包，上述计算机包括电子设备。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置，可通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如上述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储器中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储器中，存储器可以包括：闪存盘、只读存储器(英文：Read-Only Memory，简称：ROM)、随机存取器(英文：Random Access Memory，简称：RAM)、磁盘或光盘等。

以上对本申请实施例进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

一种智能对话方法，其特征在于，应用于电子设备，所述方法包括：

基于用户输入的目标问题语句确定N个第一问题语句，每个第一问题语句与所述目标问题语句的相似度均大于或等于第一阈值，所述N为大于1的整数，每个第一问题语句关联一个第一答案语句；

基于预设神经网络模型确定N个第一参数，所述N个第一参数与所述N个第一问题语句一一对应，所述N个第一参数用于评价其对应的第一问题语句与所述目标问题语句的相似度；

将目标答案语句作为所述目标问题语句的答案语句，所述目标答案语句为目标参数对应的第一问题语句关联的第一答案语句，所述目标参数的值大于或等于第二阈值，所述N个第一参数包括所述目标参数；

输出所述目标答案语句。
根据权利要求1所述的方法，其特征在于，所述基于用户输入的目标问题语句确定N个第一问题语句，包括：

获取用户输入的目标问题语句；

基于字面搜索从预设语料库中确定M个第二问题语句，以及基于语义搜索从所述预设语料库中确定W个第三问题语句，所述字面搜索的关键词是基于所述目标问题语句确定的，每个第二问题语句与所述目标问题语句的字面相似度均大于或等于第三阈值，每个第三问题语句与所述目标问题语句的语义相似度均大于或等于第四阈值，所述第一阈值大于或等于所述第三阈值，所述第一阈值大于或等于所述第四阈值，所述M和所述W均为大于0的整数；

基于所述M个第二问题语句和所述W个第三问题语句，确定N个第一问题语句，所述N个第一问题语句包括至少一个第二问题语句和至少一个第三问题语句。
根据权利要求2所述的方法，其特征在于，所述目标问题语句由第一字符集构成，所述第一字符集包括P个第一字符，所述P为大于0的整数；所述基于字面搜索从预设语料库中确定M个第二问题语句，包括：

在预设语料库以所述P个第一字符中的至少一个第一字符为关键词进行搜索，得到Q个第五问题语句；

从所述Q个第五问题语句中选择M个第五问题语句；

将所述M个第五问题语句确定为M个第二问题语句。
根据权利要求2或3所述的方法，其特征在于，所述基于语义搜索从所述预设语料库中确定W个第三问题语句，包括：

确定所述目标问题语句的语句构成成分；

基于所述语句构成成分对所述目标问题语句进行过滤得到第四问题语句，所述第四问题语句的语句构成成分少于或等于所述目标问题语句的语句构成成分；

从所述预设语料库中确定W个第三问题语句，每个第三问题语句与所述第四问题语句的语义相似度均大于或等于所述第四阈值。
根据权利要求1-4任一项所述的方法，其特征在于，所述基于预设神经网络模型确定N个第一参数，包括：

基于预设神经网络模型确定所述目标问题语句与所述N个第一问题语句的N个句句相似度、N个编辑距离和N个杰卡德相似度，所述N个句句相似度、所述N个编辑距离和所述N个杰卡德相似度均与所述N个第一问题语句一一对应；

基于所述N个句句相似度、所述N个编辑距离和所述N个杰卡德相似度确定N个第一参数，所述N个第一参数与所述N个句句相似度、所述N个编辑距离和所述N个杰卡德相似度均一一对应。
根据权利要求5所述的方法，其特征在于，所述基于预设神经网络模型确定所述目标问题语句与所述N个第一问题语句的N个句句相似度，包括：

将所述目标问题语句转化成第一句向量，以及将所述N个第一问题语句转化成N个第二句向量，所述N个第二句向量与所述N个第一问题语句一一对应；

提取所述第一句向量的特征信息得到第一目标向量，以及提取所述N个第二句向量的特征信息得到N个第二目标向量，所述N个第二目标向量与所述N个第二句向量一一对应；

基于句句相似度计算公式确定所述第一目标向量和每个第二目标向量的句句相似度，得到N个句句相似度。
根据权利要求5或6所述的方法，其特征在于，所述目标问题语句由第一字符集构成，所述N个第一问题语句由N个第二字符集构成，所述N个第二字符集与所述N个第一问题语句一一对应；所述基于预设神经网络模型确定所述目标问题语句与所述N个第一问题语句的N个编辑距离，包括：

确定将所述第一字符集转化成每个第二字符集所需的最少编辑操作次数；

将得到的N个最少编辑操作次数确定为N个编辑距离，所述N个编辑距离与所述N个最少编辑操作次数一一对应。
根据权利要求5-7任一项所述的方法，其特征在于，所述基于预设神经网络模型确定所述目标问题语句与所述N个第一问题语句的N个杰卡德相似度，包括：

确定所述第一字符集与所述N个第二字符集的N个交集和N个并集，所述N个交集和所述N个并集均与所述N个第二字符集一一对应；

基于所述N个交集和所述N个并集确定N个杰卡德相似度，所述N个杰卡德相似度与所述N个交集和所述N个并集均一一对应。
根据权利要求5-8任一项所述的方法，其特征在于，所述基于所述N个句句相似度、所述N个编辑距离和所述N个杰卡德相似度确定N个第一参数，包括：

将所述N个编辑距离转化成N个第一相似度；

确定第一权重、第二权重和第三权重，所述第一权重用于表示句句相似度在用于评价第一参数时所占的比重，所述第二权重用于表示第一相似度在用于评价第一参数时所占的比重，所述第三权重用于表示杰卡德相似度在用于评价第一参数时所占的比重，所述第一权重、所述第二权重与所述第三权重之和为1；

基于所述第一权重、所述第二权重、所述第三权重、所述N个句句相似度、所述N个第一相似度、所述N个杰卡德相似度和第一参数公式确定N个第一参数。
一种智能对话装置，其特征在于，应用于电子设备，所述装置包括：

确定单元，用于基于用户输入的目标问题语句确定N个第一问题语句，每个第一问题语句与所述目标问题语句的相似度均大于或等于第一阈值，所述N为大于1的整数，每个第一问题语句关联一个第一答案语句；基于预设神经网络模型确定N个第一参数，所述N个第一参数与所述N个第一问题语句一一对应，所述N个第一参数用于评价其对应的第一问题语句与所述目标问题语句的相似度；将目标答案语句作为所述目标问题语句的答案语句，所述目标答案语句为目标参数对应的第一问题语句关联的第一答案语句，所述目标参数的值大于或等于第二阈值，所述N个第一参数包括所述目标参数；

输出单元，用于输出所述目标答案语句。
根据权利要求10所述的装置，其特征在于，所述基于用户输入的目标问题语句确定N个第一问题语句，所述确定单元包括获取子单元、第一子确定单元、第二子确定单元和第三子确定单元，其中：

获取子单元，用于获取用户输入的目标问题语句；

第一子确定单元，用于基于字面搜索从预设语料库中确定M个第二问题语句，所述字面搜索的关键词是基于所述目标问题语句确定的；

第二子确定单元，用于以及基于语义搜索从所述预设语料库中确定W个第三问题语句，每个第二问题语句与所述目标问题语句的字面相似度均大于或等于第三阈值，每个第三问题语句与所述目标问题语句的语义相似度均大于或等于第四阈值，所述第一阈值大于或等于所述第三阈值，所述第一阈值大于或等于所述第四阈值，所述M和所述W均为大于0的整数；

第三子确定单元，用于基于所述M个第二问题语句和所述W个第三问题语句，确定N个第一问题语句，所述N个第一问题语句包括至少一个第二问题语句和至少一个第三问题语句。
根据权利要求11所述的装置，其特征在于，所述目标问题语句由第一字符集构成，所述第一字符集包括P个第一字符，所述P为大于0的整数；所述基于字面搜索从预设语料库中确定M个第二问题语句，所述第一子确定单元，具体用于：

在预设语料库以所述P个第一字符中的至少一个第一字符为关键词进行搜索，得到Q个第五问题语句；

从所述Q个第五问题语句中选择M个第五问题语句；

将所述M个第五问题语句确定为M个第二问题语句。
根据权利要求10或11所述的装置，其特征在于，所述基于语义搜索从所述预设语料库中确定W个第三问题语句，所述第二子确定单元，具体用于：

确定所述目标问题语句的语句构成成分；

基于所述语句构成成分对所述目标问题语句进行过滤得到第四问题语句，所述第四问题语句的语句构成成分少于或等于所述目标问题语句的语句构成成分；

从所述预设语料库中确定W个第三问题语句，每个第三问题语句与所述第四问题语句的语义相似度均大于或等于所述第四阈值。
根据权利要求10-13任一项所述的装置，其特征在于，所述基于预设神经网络模型确定N个第一参数，所述确定单元还包括：

第四子确定单元，用于基于预设神经网络模型确定所述目标问题语句与所述N个第一问题语句的N个句句相似度、N个编辑距离和N个杰卡德相似度，所述N个句句相似度、所述N个编辑距离和所述N个杰卡德相似度均与所述N个第一问题语句一一对应；

所述第五子确定单元，用于基于所述N个句句相似度、所述N个编辑距离和所述N个杰卡德相似度确定N个第一参数，所述N个第一参数与所述N个句句相似度、所述N个编辑距离和所述N个杰卡德相似度均一一对应。
根据权利要求14所述的装置，其特征在于，所述基于预设神经网络模型确定所述目标问题语句与所述N个第一问题语句的N个句句相似度，所述第四子确定单元，具体用于：

将所述目标问题语句转化成第一句向量，以及将所述N个第一问题语句转化成N个第二句向量，所述N个第二句向量与所述N个第一问题语句一一对应；

提取所述第一句向量的特征信息得到第一目标向量，以及提取所述N个第二句向量的特征信息得到N个第二目标向量，所述N个第二目标向量与所述N个第二句向量一一对应；

基于句句相似度计算公式确定所述第一目标向量和每个第二目标向量的句句相似度，得到N个句句相似度。
根据权利要求14或15所述的装置，其特征在于，所述目标问题语句由第一字符集构成，所述N个第一问题语句由N个第二字符集构成，所述N个第二字符集与所述N 个第一问题语句一一对应；所述基于预设神经网络模型确定所述目标问题语句与所述N个第一问题语句的N个编辑距离，所述第四子确定单元，具体用于：

确定将所述第一字符集转化成每个第二字符集所需的最少编辑操作次数；

将得到的N个最少编辑操作次数确定为N个编辑距离，所述N个编辑距离与所述N个最少编辑操作次数一一对应。
根据权利要求14-16任一项所述的装置，其特征在于，所述基于预设神经网络模型确定所述目标问题语句与所述N个第一问题语句的N个杰卡德相似度，所述第四子确定单元，具体用于：

确定所述第一字符集与所述N个第二字符集的N个交集和N个并集，所述N个交集和所述N个并集均与所述N个第二字符集一一对应；

基于所述N个交集和所述N个并集确定N个杰卡德相似度，所述N个杰卡德相似度与所述N个交集和所述N个并集均一一对应。
根据权利要求14-17任一项所述的装置，其特征在于，所述基于所述N个句句相似度、所述N个编辑距离和所述N个杰卡德相似度确定N个第一参数，所述第五子确定单元，具体用于：

将所述N个编辑距离转化成N个第一相似度；

确定第一权重、第二权重和第三权重，所述第一权重用于表示句句相似度在用于评价第一参数时所占的比重，所述第二权重用于表示第一相似度在用于评价第一参数时所占的比重，所述第三权重用于表示杰卡德相似度在用于评价第一参数时所占的比重，所述第一权重、所述第二权重与所述第三权重之和为1；

基于所述第一权重、所述第二权重、所述第三权重、所述N个句句相似度、所述N个第一相似度、所述N个杰卡德相似度和第一参数公式确定N个第一参数。
一种电子设备，其特征在于，包括处理器、存储器、通信接口，以及一个或多个程序，所述一个或多个程序被存储在所述存储器中，并且被配置由所述处理器执行，所述程序包括用于执行如权利要求1-9任一项所述的方法中的步骤的指令。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现权利要求1-9任一项所述的方法。