CN111325034A

CN111325034A - 多轮对话中语义补齐的方法、装置、设备及存储介质

Info

Publication number: CN111325034A
Application number: CN202010088078.9A
Authority: CN
Inventors: 黄孟缘
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2020-02-12
Filing date: 2020-02-12
Publication date: 2020-06-23
Also published as: WO2021159656A1

Abstract

本发明涉及人工智能领域，公开了多轮对话中语义补齐的方法、装置、设备及存储介质，通过预置语料断句函数与预置分析函数对多轮对话进行语法检测，并补齐语义不全的语句，提高了语义分析结果的准确率以及根据语义解析结果搜索对应的应答信息的准确率。本发明方法包括：利用预置语料断句函数与预置分析函数分别对第一语句和第二语句进行语法检测，得到第一语句检测结果以及第二语句检测结果；当第二语句检测结果包括单实体且第二语句为疑问句时，根据第一语句检测结果将第二语句的语义缺失部分补齐，得到第一补齐语句；若第一补齐语句中包括指代不明的词语，则根据第一语句检测结果将第一补齐语句中指代不明的词语替换，得到第二补齐语句。

Description

多轮对话中语义补齐的方法、装置、设备及存储介质

技术领域

本发明涉及人工智能领域，尤其涉及多轮对话中语义补齐的方法、装置、设备及存储介质。

背景技术

人机交互(human-computer interaction，HCI)是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器，也可以是计算机化的系统和软件。通常用户利用可见的人机交互界面与系统交流，并进行操作实现用户与系统之间的信息交换，以完成确定任务。人机交互是人工智能领域中重要的一部分，尤其是在客户服务或咨询获取方面，通过人机交互令用户获得需要的信息。

在客户服务方面，目前通过智能对话机器人与用户进行沟通，并利用智能对话机器人反馈数据来满足用户获取信息的需求。

但是由于智能对话机器人获取到用户的提出要求存在语义不明的情况，如存在用户输入的要求缺少主语或宾语的情况，智能对话机器人无法准确识别出用户的意图，不能准确反馈出依据用户意图作出的应答信息，导致智能对话机器人反馈的准确率不高。

发明内容

本发明的提供一种多轮对话中语义补齐的方法、装置、设备及存储介质，用于解决基于多轮对话下，语句语义不全的问题，提高了语义分析结果的准确率，同时也提高了根据语义解析结果搜索对应的应答信息的准确率。

为本发明实施例的第一方面提供一种多轮对话中语义补齐的方法，包括：利用预置语料断句函数与预置分析函数，对获取到的用户输入的第一语句进行语法检测，得到第一语句检测结果，所述第一语句检测结果为所述第一语句中每个词语之间的目标依存关系；利用所述预置语料断句函数与所述预置分析函数，对获取到的用户新一轮输入的第二语句进行语法检测，得到第二语句检测结果，所述第二语句检测结果为所述第二语句中每个词语之间的目标依存关系；判断所述第二语句检测结果是否仅包括单实体且所述第二语句为疑问句；当所述第二语句检测结果仅包括单实体且所述第二语句为疑问句时，根据所述第一语句检测结果将所述第二语句的语义缺失部分补齐，得到第一补齐语句；判断所述第一补齐语句中是否包括指代不明的词语，所述指代不明的词语包括代词、量词以及冠词；若所述第一补齐语句中包括指代不明的词语，则根据所述第一语句检测结果将所述第一补齐语句中指代不明的词语替换，得到第二补齐语句。

可选的，在本发明实施例第一方面的第一种实现方式中，获取用户输入的第一语句；利用预置语料断句函数将所述第一语句进行语句分割，得到第一输入语句；利用预置分析函数对所述第一输入语句进行语法检测，得到第一语句检测结果，所述第一语句检测结果为所述第一输入语句中每个词语之间的目标依存关系。

可选的，在本发明实施例第一方面的第二种实现方式中，对所述第一语句进行断句，得到分段语句；将所述分段语句中的分段语料与预置语料进行匹配，预置语料是依据业务数据建立在预置意图规则库中的语料；若所述分段语料与所述预置语料相匹配，则在所述分段语料的前后位置对所述分段语句进行分割，得到分割语句，并将所述分割语句作为第一输入语句；若所述分段语料与所述预置语料不相配，则直接将所述分段语料作为第一输入语句。

可选的，在本发明实施例第一方面的第三种实现方式中，对所述第一输入语句中的词语进行词性标注以及实体抽取，得到第一语句标注结果；计算每个所述词语之间的依存概率，所述词语为所述第一语句标注结果中的词语，所述依存概率为预置依存关系出现的频次；确定每个所述词语之间的目标依存关系，所述依存概率权重最大的概率所对应的所述预置依存关系为所述词语之间的所述目标依存关系；获取第一语句检测结果，所述第一语句检测结果为所述第一输入语句中每个所述词语之间的所述目标依存关系。

可选的，在本发明实施例第一方面的第四种实现方式中，当所述第二语句检测结果仅包括单实体且所述第二语句为疑问句时，提取出所述第二语句检测结果中的单实体，并将所述单实体作为第一目标词语；在所述第一语句检测结果中筛选与所述第一目标词语语法结构相同的所述单实体，得到第二目标词语；在所述第一语句中，利用所述第一目标词语替换所述第二目标词语，得到第一补齐语句。

可选的，在本发明实施例第一方面的第五种实现方式中，获取第一补齐语句的检测结果，所述第一补齐语句的检测结果为所述第二语句检测结果与所述第一语句检测结果的结合；判断所述第一补齐语句的检测结果中是否包括代词、量词以及冠词。

可选的，在本发明实施例第一方面的第六种实现方式中，若所述第一补齐语句的检测结果包括指代不明的词语，则提取出所述指代不明的词语，并将所述指代不明的词语作为第三目标词语；在所述第一语句检测结果中筛选与所述第三目标词语语法结构相同的词语，得到第四目标词语；在所述第二语句中，利用所述第四目标词语替换所述第三目标词语，得到第二补齐语句。

本发明实施例的第二方面提供一种多轮对话中语义补齐的装置，包括：第一获取单元，用于利用预置语料断句函数与预置分析函数，对获取到的用户输入的第一语句进行语法检测，得到第一语句检测结果，所述第一语句检测结果为所述第一语句中每个词语之间的目标依存关系；第二获取单元，用于利用所述预置语料断句函数与所述预置分析函数，对获取到的用户新一轮输入的第二语句进行语法检测，得到第二语句检测结果，所述第二语句检测结果为所述第二语句中每个词语之间的目标依存关系；第一判断单元，用于判断所述第二语句检测结果是否仅包括单实体且所述第二语句为疑问句；第一补齐单元，用于当所述第二语句检测结果仅包括单实体且所述第二语句为疑问句时，根据所述第一语句检测结果将所述第二语句的语义语义缺失部分补齐，得到第一补齐语句；第二判断单元，用于判断所述第一补齐语句中是否包括指代不明的词语，所述指代不明的词语包括代词、量词以及冠词；第二补齐单元，用于若所述第一补齐语句中包括指代不明的词语，则根据所述第一语句检测结果将所述第一补齐语句中指代不明的词语替换，得到第二补齐语句。

可选的，在本发明实施例第二方面的第一种实现方式中，第一获取单元包括：获取模块，用于获取用户输入的第一语句；分割模块，用于利用预置语料断句函数将所述第一语句进行语句分割，得到第一输入语句；检测模块，用于利用预置分析函数对所述第一输入语句进行语法检测，得到第一语句检测结果，所述第一语句检测结果为所述第一输入语句中每个词语之间的目标依存关系。

可选的，在本发明实施例第二方面的第二种实现方式中，分割模块具体用于：对所述第一语句进行断句，得到分段语句；将所述分段语句中的分段语料与预置语料进行匹配，预置语料是依据业务数据建立在预置意图规则库中的语料；若所述分段语料与所述预置语料相匹配，则在所述分段语料的前后位置对所述分段语句进行分割，得到分割语句，并将所述分割语句作为第一输入语句；若所述分段语料与所述预置语料不相配，则直接将所述分段语料作为第一输入语句。

可选的，在本发明实施例第二方面的第三种实现方式中，检测模块具体用于：对所述第一输入语句中的词语进行词性标注以及实体抽取，得到第一语句标注结果；计算每个所述词语之间的依存概率，所述词语为所述第一语句标注结果中的词语，所述依存概率为预置依存关系出现的频次；确定每个所述词语之间的目标依存关系，所述依存概率权重最大的概率所对应的所述预置依存关系为所述词语之间的所述目标依存关系；获取第一语句检测结果，所述第一语句检测结果为所述第一输入语句中每个所述词语之间的所述目标依存关系。

可选的，在本发明实施例第二方面的第四种实现方式中，第一补齐单元具体用于：当所述第二语句检测结果仅包括单实体且所述第二语句为疑问句时，提取出所述第二语句检测结果中的单实体，并将所述单实体作为第一目标词语；在所述第一语句检测结果中筛选与所述第一目标词语语法结构相同的所述单实体，得到第二目标词语；在所述第一语句中，利用所述第一目标词语替换所述第二目标词语，得到第一补齐语句。

可选的，在本发明实施例第二方面的第五种实现方式中，第二判断单元具体用于：获取第一补齐语句的检测结果，所述第一补齐语句的检测结果为所述第二语句检测结果与所述第一语句检测结果的结合；判断所述第一补齐语句的检测结果中是否代词、量词以及冠词。

可选的，在本发明实施例第二方面的第六种实现方式中，第二补齐单元具体用于：若所述第一补齐语句的检测结果包括指代不明的词语，则提取出所述指代不明的词语，并将所述指代不明的词语作为第三目标词语；在所述第一语句检测结果中筛选与所述第三目标词语语法结构相同的词语，得到第四目标词语；在所述第二语句中，利用所述第四目标词语替换所述第三目标词语，得到第二补齐语句。

本发明实施例的第三方面提供了一种多轮对话中语义补齐的设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述任一实施方式所述的基于多轮对话中语义补齐的方法。

本发明实施例的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述第一方面所述的方法。

从以上技术方案可以看出，本发明实施例具有以下优点：

本发明实施例，通过利用预置语料断句函数与预置分析函数对用户输入的多轮对话进行语法检测，以及利用多轮对话上下文的语义对语义不全的语句进行补齐，提高了语义分析结果的准确率，同时也提高了根据语义解析结果搜索对应的应答信息的准确率。

附图说明

图1为本发明多轮对话中语义补齐的方法的一个实施例示意图；

图2为本发明多轮对话中语义补齐的方法的另一个实施例示意图；

图3为本发明多轮对话中语义补齐的装置的一个实施例示意图；

图4为本发明多轮对话中语义补齐的装置的另一个实施例示意图；

图5本发明多轮对话中语义补齐的设备的一个实施例示意图。

具体实施方式

本发明的提供一种多轮对话中语义补齐的方法，用于解决基于多轮对话下，语句语义不全的问题，提高了语义分析结果的准确率，同时也提高了根据语义解析结果搜索对应的应答信息的准确率。

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”或“具有”及其任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

请参阅图1，本发明实施例中多轮对话中语义补齐的方法一个实施例包括：

101、利用预置语料断句函数与预置分析函数，对获取到的用户输入的第一语句进行语法检测，得到第一语句检测结果，第一语句检测结果为第一语句中每个词语之间的目标依存关系。

服务器利用预置语料断句函数与预置分析函数，对获取到的用户输入的第一语句进行语法检测，得到第一语句检测结果，第一语句检测结果为第一语句中每个词语之间的目标依存关系。

需要说明的是，服务器利用预置语料断句函数对第一语句进行断句，以及利用预置分析函数对第一输入语句进行语法检测，均为补齐第二语句语义做准备。服务器利用预置语料断句函数对第一语句进行初步断句，断句是自然语言处理的基础，断句的准确度直接决定了服务器后面进行句子的词性标注、句法分析、词向量以及文本分析的质量。对于简单的第一语句可以直接用逗号进行断句，服务器将第一语句中的字，按照在语句中的位置进行标注，举例来说：对句子“我爱深圳因为它很美”进行标注，标注的结果为：“我N爱N深N圳Y因N为N它N很N美N”，其中Y代表断句，N代表非断句，可以视为服务器对第一语句中每个字与字之间的位置做二分类，判断第一语句是否应该断句。

需要说明的是，这里预置分析函数指的是依存分析函数，服务器利用依存分析函数对第一语句进行语法检测，依存分析函数是利用语句中单词之间的依存关系来表达语法，如：一个词语修饰另一个词语，则称该词语依赖于另一个词语，在句子中明确了词语之间的关系，服务器可以准确的判断出语句中每个词语的词性以及词语之间的关系，为对语句进行补齐做充分的准备。服务器在进行依存分析前，需要对语句进行词性标注，服务器将第一语句中的字，按照在词语中的位置进行标注，可以利用BMES标注法，其中，B为一个词语开始的一个字，M为一个词语中间的字，词语中间的字数可能为多个，E为一个词语最后的一个字，S为由一个字组成的词语。举例来说，将“网商银行是蚂蚁金服微贷事业部的最重要产品”进行标注，标注后结果为“BMMESBMMEBMMMESBMEBE”，对应的分词结果为“网商银行/是/蚂蚁金服/微贷事业部/的/最重要/产品”，在预置词语库中查找对应分词的词性，将分词结果进行词性标注，当句子中出现单实体(句子中仅包括主语、谓语或宾语)时，将单实体抽取出来并保存在第一语句检测结果中以备用。

102、利用预置语料断句函数与预置分析函数，对获取到的用户新一轮输入的第二语句进行语法检测，得到第二语句检测结果，第二语句检测结果为第二语句中每个词语之间的目标依存关系。

服务器利用预置语料断句函数与预置分析函数，对获取到的用户新一轮输入的第二语句进行语法检测，得到第二语句检测结果，第二语句检测结果为第二语句中每个词语之间的目标依存关系。

这里的第二语句是第一语句的下文语句，第一语句作为补齐第二语句语义缺失部分的依据。这里对第二语句进行语法检测的方式与对第一语句进行语法检测的方式是相同的，将检测的结果作为第二语句检测结果。

103、判断第二语句检测结果是否仅包括单实体且第二语句为疑问句。

服务器判断第二语句检测结果是否仅包括单实体且第二语句为疑问句。

可以理解的是，用户新一轮输入的第二语句可能出现语句部分省略的情况，比如省略谓语与宾语，这时就需要服务器对新一轮输入的第二语句进行判断，若新一轮输入的第二语句中语义表达不全，则根据多轮对话中的上下文情景将新一轮输入的第二语句补充完整，因此，服务器首先判断第二语句分析结果中是否仅包含单实体且第二语句为疑问句，以此来判断新一轮输入的第二语句是否满足语义不全的条件。

104、当第二语句检测结果仅包括单实体且第二语句为疑问句时，根据第一语句检测结果将第二语句的语义缺失部分补齐，得到第一补齐语句。

当第二语句检测结果仅包括单实体且第二语句为疑问句时，服务器根据第一语句检测结果将第二语句的语义缺失部分补齐，得到第一补齐语句。

若第二语句检测结果中包含单实体且第二语句为疑问句，则服务器不能准确识别第二语句的含义，无法反馈相应的预置回应，因此服务器根据获取到的上下文情景将第二语句补齐，得到一个完整的第二语句的语义，服务器再根据第二语句的语义反馈相应的回答。服务器获取到第一语句检测结果与第二语句检测结果，两个检测结果中均包括对句子的词性分析，提取出第二语句中的单实体，作为第一目标词语，这里的单实体指的是句子中的单个字或单个词组，例如：句子“感冒呢？”，其中“感冒”一词即为该句子中的单实体。待提取出第二语句中的单实体后，在第一语句中筛选与第一目标词语语法结构相同的单实体，作为第二目标词语，这里的语法结构相同指的是第一目标词语与第二目标词语的词性相同，例如：第一目标词语为“感冒”，第二目标词语为“癌症”，第一目标词语与第二目标词语均为名词词性，可以说两者的语法结构相同。待服务器筛选出第二目标词语后，在第一语句中，服务器将第一目标词语替换为第二目标词语，得到第一补齐语句。

105、判断第一补齐语句中是否包括指代不明的词语，指代不明的词语包括代词、量词以及冠词。

服务器判断第一补齐语句中是否包括指代不明的词语，指代不明的词语包括代词、量词以及冠词。

需要说明的是，当服务器补齐新一轮输入的第二语句且得到第一补齐语句时，还要确定第一补齐语句中是否包括指代不明的词语，指代不明的词语会导致第二语句的语义不明，一般来讲，指代不明的词语包括代词、量词以及冠词。举例来说：用户的第一语句为“平安福、福满分都是医疗险么？”服务器回复第一语句为“是的。”用户新一轮输入的第二语句为“第一种能报销什么？”在用户新一轮输入的第二语句中存在指代不明的词语“第一种”，如果服务器不联系多轮对话的上下文来对用户新一轮输入的第二语句进行补充，则会导致语义理解偏差，服务器将不能够给出正确的回答，导致用户不能够继续进行下一步的操作。

106、若第一补齐语句中包括指代不明的词语，则根据第一语句检测结果将第一补齐语句中指代不明的词语替换，得到第二补齐语句。

若第一补齐语句中包括指代不明的词语，则服务器根据第一语句检测结果将第一补齐语句中指代不明的词语替换，得到第二补齐语句。

服务器若确定第一补齐语句中包括指代不明的词语，说明第一补齐语句为语义不明的语句，则服务器需要根据多轮对话中的上下文情景对第一补齐语句进行再次补齐。首先，服务器在将第二语句中提取出指代不明的词语，作为第三目标词语，其次，在第一语句中筛选与第三目标词语词性相同的词语，作为第四目标词语，最后，在第二语句中，将第四目标词替换为第三目标词语。

请参阅图2，本发明实施例中多轮对话中语义补齐的方法另一个实施例包括：

201、获取用户输入的第一语句。

服务器获取用户输入的第一语句。在人机交互中，服务器获取用户输入的语句，并将用户输入的语句作为第一语句，为下文第二语句的补齐做准备。

202、利用预置语料断句函数将第一语句进行语句分割，得到第一输入语句。

服务器利用预置语料断句函数将第一语句进行语句分割，得到第一输入语句。具体的，服务器对第一语句进行断句，得到分段语句；服务器将分段语句中的分段语料与预置语料进行匹配，预置语料是依据业务数据建立在预置意图规则库中的语料；若分段语料与预置语料相匹配，则服务器在分段语料的前后位置对分段语句进行分割，得到分割语句，并将分割语句作为第一输入语句；若分段语料与预置语料不相配，则服务器直接将分段语料作为第一输入语句。

需要说明的是，服务器利用预置语料断句函数对第一语句进行断句，以及利用预置分析函数对第一输入语句进行语法检测，均为补齐第二语句语义做准备。服务器利用预置语料断句函数对第一语句进行初步断句，断句是自然语言处理的基础，断句的准确度直接决定服务器后面进行词性标注、句法分析、词向量以及文本分析的质量。对于简单的第一语句可直接用逗号进行断句，服务器将第一语句中的字，按照在语句中的位置进行标注，举例来说：对句子“我爱深圳因为它很美”进行标注，标注的结果为：“我N爱N深N圳Y因N为N它N很N美N”，其中Y代表断句，N代表非断句，可视为服务器对第一语句中每个字与字之间的位置做二分类，判断是否应该断句。

服务器再将第一语句进行断句后，得到分开的分段语句，再将分段语句中的分段语料与预置语料进行匹配，这里的分段语句是不能够在进行语句断句的语句，因此进一步对分段语句中的分段语料进行匹配，明确相应的语料是否需要进行分割。这里的预置语料是依据业务数据建立在预置意图规则库中的语料，如：预置意图规则库为保险库，预置语料可为保单、被保人身份证号等，是服务器依据相关业务数据构成语料。若分段语料与预置语料相匹配，则服务器在分段语料的前后位置对分段语句进行分割，得到分割语句，并将分割语句作为第一输入语句；若分段语料与预置语料不相配，则服务器直接将分段语料作为第一输入语句。举例来说：对句子“感冒可以投保e生保么？”进行分段语料匹配后分割成“感冒/可以/投保/e生保/么？”，其中“感冒”、“投保”、“e生保”均为预置意图规则库中的预置语料，服务器不用再对匹配到预置语料的分段语料进行分割，直接在匹配到的分段语料的前后位置上进行分割，节省了服务器对语句分割的时间。

203、利用预置分析函数对第一输入语句进行语法检测，得到第一语句检测结果，第一语句检测结果为第一输入语句中每个词语之间的目标依存关系。

服务器利用预置分析函数对第一输入语句进行语法检测，得到第一语句检测结果，第一语句检测结果为第一输入语句中每个词语之间的目标依存关系。具体的，服务器对第一输入语句中的词语进行词性标注以及实体抽取，得到第一语句标注结果；服务器计算每个词语之间的依存概率，词语为第一语句标注结果中的词语，依存概率为预置依存关系出现的频次；服务器确定每个词语之间的目标依存关系，依存概率权重最大的概率所对应的预置依存关系为词语之间的目标依存关系；服务器获取第一语句检测结果，第一语句检测结果为第一输入语句中每个词语之间的目标依存关系。

需要说明的是，这里预置分析函数指的是依存分析函数，服务器利用依存分析函数对第一语句进行语法检测，依存分析函数是利用语句中单词之间的依存关系来表达语法，如：一个词语修饰另一个词语，则称该词语依赖于另一个词语，在句子中明确了词语之间的关系，服务器可以准确的判断出语句中每个词语的词性以及词语之间的关系，为对语句进行补齐做充分的准备。服务器进行依存分析前，需要对语句进行词性标注，服务器将第一语句中的字，按照在词语中的位置进行标注，可以利用BMES标注法，其中，B为一个词语开始的一个字，M为一个词语中间的字，词语中间的字数可能为多个，E为一个词语最后的一个字，S为由一个字组成的词语。举例来说，将“网商银行是蚂蚁金服微贷事业部的最重要产品”进行标注，标注后结果为“BMMESBMMEBMMMESBMEBE”，对应的分词结果为“网商银行/是/蚂蚁金服/微贷事业部/的/最重要/产品”，在预置词语库中查找对应分词的词性，将分词结果进行词性标注，当句子中出现单实体(句子中仅包括主语、谓语或宾语)时，将单实体抽取出来并保存在第一语句检测结果中以备用。

204、利用预置语料断句函数与预置分析函数，对获取到的用户新一轮输入的第二语句进行语法检测，得到第二语句检测结果，第二语句检测结果为第二语句中每个词语之间的目标依存关系。

205、判断第二语句检测结果是否仅包括单实体且第二语句为疑问句。

可以理解的是，用户新一轮输入的第二语句可能出现语句部分省略的情况，比如省略谓语与宾语，这时就需要服务器对新一轮输入的第二语句进行判断，若新一轮输入的第二语句中语义表达不全，则根据多轮对话中的上下文情景将新一轮输入的第二语句补充完整，因此，服务器首先判断第二语句分析结果中是否仅包含单实体且第二语句为疑问句，来判断新一轮输入的第二语句是否满足语义不全的条件。

206、当第二语句检测结果仅包括单实体且第二语句为疑问句时，根据第一语句检测结果将第二语句的语义缺失部分补齐，得到第一补齐语句。

当第二语句检测结果仅包括单实体且第二语句为疑问句时，服务器根据第一语句检测结果将第二语句的语义补全，得到第一补齐语句。具体的，当第二语句检测结果仅包括单实体且第二语句为疑问句时，服务器提取出第二语句检测结果中的单实体，并将单实体作为第一目标词语；服务器在第一语句检测结果中筛选与第一目标词语语法结构相同的单实体，得到第二目标词语；在第一语句中，服务器利用第一目标词语替换第二目标词语，得到第一补齐语句。

若第二语句检测结果中仅包含单实体且第二语句为疑问句，则服务器不能准确识别第二语句的含义，无法反馈相应的预置回应，因此服务器根据获取到的上下文情景将第二语句的语义缺失部分补齐，得到完整的第二语句的语义，服务器再根据第二语句的语义反馈相应的回答。服务器获取到第一语句检测结果与第二语句检测结果，两个检测结果中均包括对句子的词性分析，提取出第二语句中的单实体，作为第一目标词语，并在第一语句检测结果中筛选与第一目标词语语法结构相同的单实体，作为第二目标词语，在第一语句中，服务器将第一目标词语替换为第二目标词语，得到第一补齐语句。

举例来说：用户输入的第一语句为“感冒可以投保e生保么？”，服务器对用户输入的第一语句进行词性标注与依存分析，得到“感冒/nhd可以/c投保/vne生保/nbx么/y？”这里的nhd以及nbx是预置语料的相关词性，例如：预置语料所在的预置意图规则库为保险库，nhd代表保险库中的疾病一类词，nbx则代表保险库中保险名称一类词；c代表助动词；vn代表动名词；y代表语气助词，提取出来的单实体为：感冒/nhd投保/vne生保/nbx。用户输入新一轮的第二语句为“癌症哪？”服务器对这句话进行解析，得到“癌症/nhd哪/y”很明显第二语句检测结果中仅包括单实体且第二语句以反问语气结尾，满足第二语句语义不全的条件，则服务器对第二语句进行语义补充，根据第一语句检测结果以及第二语句检测结果，得到感冒/nhd与癌症/nhd是同一类词语，将两者在第一语句中互换，得到“癌症可以投保e生保么？”将第二语句补齐。

207、判断第一补齐语句中是否包括指代不明的词语，指代不明的词语包括代词、量词以及冠词。

服务器判断第一补齐语句中是否包括指代不明的词语，指代不明的词语包括代词、量词以及冠词。具体的，服务器获取第一补齐语句的检测结果，第一补齐语句的检测结果为第二语句检测结果与第一语句检测结果的结合；服务器判断第一补齐语句的检测结果中是否包括代词、量词以及冠词。

需要说明的是，当服务器补齐新一轮输入的第二语句且得到第一补齐语句时，还要判断第一补齐语句中是否包括指代不明的词语，指代不明的词语会导致第二语句的语义不明，一般来讲，指代不明的词语包括代词、量词以及冠词。举例来说：用户的第一语句为“平安福、福满分都是医疗险么？”服务器回复第一语句为“是的。”用户新一轮输入的第二语句为“第一种能报销什么？”在用户新一轮输入的第二语句中存在指代不明的词语“第一种”，如果服务器不联系多轮对话的上下文来对用户新一轮输入的第二语句进行补充，则会导致语义理解偏差，服务器将不能够给出正确的回答，导致用户不能够继续进行下一步的操作。

208、若第一补齐语句中包括指代不明的词语，则根据第一语句检测结果将第一补齐语句中指代不明的词语替换，得到第二补齐语句。

若第一补齐语句中包括指代不明的词语，则服务器根据第一语句检测结果将第一补齐语句中指代不明的词语替换，得到第二补齐语句。具体的，若第一补齐语句的检测结果包括指代不明的词语，则服务器提取出指代不明的词语，并将指代不明的词语作为第三目标词语；服务器在第一语句检测结果中筛选与第三目标词语语法结构相同的词语，得到第四目标词语；在第二语句中，服务器利用第四目标词语替换第三目标词语，得到第二补齐语句。

服务器若确定第一补齐语句中包括指代不明的词语，说明第一补齐语句为语义不明的语句，则服务器需要根据多轮对话中的上下文情景对第一补齐语句再次补齐。首先，服务器在将第二语句中提取出指代不明的词语，作为第三目标词语，其次，在第一语句中筛选与第三目标词语词性相同的词语，作为第四目标词语，最后，在第二语句中将第四目标词替换为第三目标词语。

举例来说：用户的第一语句为“平安福、福满分，都是医疗险么？”，服务器对用户输入的第一语句进行词性标注与依存分析，得到“平安福/nbx、福满分/nbx，是/v医疗险/nbx么/y？”这里的nbx是预置语料的相关词性，例如：预置语料所在的预置意图规则库为保险库，nbx则代表保险库中保险名称一类词；v代表动词；y代表语气助词。用户新一轮输入的第二语句为“前者能报销什么？”，服务器对用户新一轮输入的第二语句进行词性标注与依存分析，得到“前者/r能/v报销/v什么/y？”这里的r代表代词；v代表动词；y代表语气助词，在用户新一轮输入的第二语句中存在指代不明的词语“前者”，服务器联系多轮对话的上下文来对用户新一轮输入的第二语句进行补充，结合用户第一语句的检测结果，这里的前者指代的是“平安福”，将“平安福”直接带入第二语句中，得到“平安福能报销什么？”得到完整的第二补齐语句，使得服务器能够根据第二补齐语句进行反馈与回答。

上面对本发明实施例中多轮对话中语义补齐的方法进行了描述，下面对本发明实施例中多轮对话中语义补齐的装置进行描述，请参阅图3，本发明实施例中多轮对话中语义补齐的装置一个实施例包括：

第一获取单元301，用于利用预置语料断句函数与预置分析函数，对获取到的用户输入的第一语句进行语法检测，得到第一语句检测结果，第一语句检测结果为第一语句中每个词语之间的目标依存关系；

第二获取单元302，用于利用预置语料断句函数与预置分析函数，对获取到的用户新一轮输入的第二语句进行语法检测，得到第二语句检测结果，第二语句检测结果为第二语句中每个词语之间的目标依存关系；

第一判断单元303，用于判断第二语句检测结果是否仅包括单实体且第二语句为疑问句；

第一补齐单元304，用于当第二语句检测结果仅包括单实体且第二语句为疑问句时，根据第一语句检测结果将第二语句的语义缺失部分补齐，得到第一补齐语句；

第二判断单元305，用于判断第一补齐语句中是否包括指代不明的词语，指代不明的词语包括代词、量词以及冠词；

第二补齐单元306，用于若第一补齐语句中包括指代不明的词语，则根据第一语句检测结果将第一补齐语句中指代不明的词语替换，得到第二补齐语句。

本发明实施例中，第一获取单元301利用预置语料断句函数与预置分析函数，对获取到的用户输入的第一语句进行语法检测，得到第一语句检测结果，第一语句检测结果为第一语句中每个词语之间的目标依存关系；第二获取单元302利用预置语料断句函数与预置分析函数，对获取到的用户新一轮输入的第二语句进行语法检测，得到第二语句检测结果，第二语句检测结果为第二语句中每个词语之间的目标依存关系；第一判断单元303判断第二语句检测结果是否仅包括单实体且第二语句为疑问句；第一补齐单元304当第二语句检测结果仅包括单实体且第二语句为疑问句时，根据第一语句检测结果将第二语句的语义缺失部分补齐，得到第一补齐语句；第二判断单元305判断第一补齐语句中是否包括指代不明的词语，指代不明的词语包括代词、量词以及冠词；第二补齐单元306若第一补齐语句中包括指代不明的词语，则根据第一语句检测结果将第一补齐语句中指代不明的词语替换，得到第二补齐语句。

请参阅图4，本发明实施例中多轮对话中语义补齐的装置另一个实施例包括：

可选的，第一获取单元301包括：

获取模块3011，用于获取用户输入的第一语句；

分割模块3012，用于利用预置语料断句函数将第一语句进行语句分割，得到第一输入语句；

检测模块3013，用于利用预置分析函数对第一输入语句进行语法检测，得到第一语句检测结果，第一语句检测结果为第一输入语句中每个词语之间的目标依存关系。

可选的，分割模块3012具体用于：

对第一语句进行断句，得到分段语句；

将分段语句中的分段语料与预置语料进行匹配，预置语料是依据业务数据建立在预置意图规则库中的语料；

若分段语料与预置语料相匹配，则在分段语料的前后位置对分段语句进行分割，得到分割语句，并将分割语句作为第一输入语句；

若分段语料与预置语料不相配，则直接将分段语料作为第一输入语句。

可选的，检测模块3013具体用于：

对第一输入语句中的词语进行词性标注以及实体抽取，得到第一语句标注结果；

计算每个词语之间的依存概率，词语为第一语句标注结果中的词语，依存概率为预置依存关系出现的频次；

确定每个词语之间的目标依存关系，依存概率权重最大的概率所对应的预置依存关系为词语之间的目标依存关系；

获取第一语句检测结果，第一语句检测结果为第一输入语句中每个词语之间的目标依存关系。

可选的，第一补齐单元304具体用于：

当第二语句检测结果仅包括单实体且第二语句为疑问句时，提取出第二语句检测结果中的单实体，并将单实体作为第一目标词语；

在第一语句检测结果中筛选与第一目标词语语法结构相同的单实体，得到第二目标词语；

在第一语句中，利用第一目标词语替换第二目标词语，得到第一补齐语句。

可选的，第二判断单元305具体用于：

获取第一补齐语句的检测结果，第一补齐语句的检测结果为第二语句检测结果与第一语句检测结果的结合；

判断第一补齐语句的检测结果中是否包括代词、量词以及冠词。

可选的，第二补齐单元306具体用于：

若第一补齐语句的检测结果包括指代不明的词语，则提取出指代不明的词语，并将指代不明的词语作为第三目标词语；

在第一语句检测结果中筛选与第三目标词语语法结构相同的词语，得到第四目标词语；

在第二语句中，利用第四目标词语替换第三目标词语，得到第二补齐语句。

本发明实施例中，第一获取单元301包括：获取模块3011，用于获取用户输入的第一语句；分割模块3012，用于利用预置语料断句函数将第一语句进行语句分割，得到第一输入语句；检测模块3013，用于利用预置分析函数对第一输入语句进行语法检测，得到第一语句检测结果，第一语句检测结果为第一输入语句中每个词语之间的目标依存关系；第二获取单元302利用预置语料断句函数与预置分析函数，对获取到的用户新一轮输入的第二语句进行语法检测，得到第二语句检测结果，第二语句检测结果为第二语句中每个词语之间的目标依存关系；第一判断单元303判断第二语句检测结果是否仅包括单实体且第二语句为疑问句；第一补齐单元304当第二语句检测结果仅包括单实体且第二语句为疑问句时，根据第一语句检测结果将第二语句的语义缺失部分补齐，得到第一补齐语句；第二判断单元305判断第一补齐语句中是否包括指代不明的词语，指代不明的词语包括代词、量词以及冠词；第二补齐单元306若第一补齐语句中包括指代不明的词语，则根据第一语句检测结果将第一补齐语句中指代不明的词语替换，得到第二补齐语句。

上面图3至图4从模块化功能实体的角度对本发明实施例中的多轮对话中语义补齐的装置进行详细描述，下面从硬件处理的角度对本发明实施例中多轮对话中语义补齐的设备进行详细描述。

下面结合图5对多轮对话中语义补齐的设备的各个构成部件进行具体的介绍：

图5是本发明实施例提供的一种多轮对话中语义补齐的设备的结构示意图，该多轮对话中语义补齐的设备500可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(centralprocessingunits，CPU)501(例如，一个或一个以上处理器)和存储器509，一个或一个以上存储应用程序507或数据506的存储介质508(例如一个或一个以上海量存储设备)。其中，存储器509和存储介质508可以是短暂存储或持久存储。存储在存储介质508的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对多轮对话中语义补齐的设备中的一系列指令操作。更进一步地，处理器501可以设置为与存储介质508通信，在多轮对话中语义补齐的设备500上执行存储介质508中的一系列指令操作。

多轮对话中语义补齐的设备500还可以包括一个或一个以上电源502，一个或一个以上有线或无线网络接口503，一个或一个以上输入输出接口504，和/或，一个或一个以上操作系统505，例如Windows Serve，Mac OS X，Unix，Linux，FreeBSD等等。本领域技术人员可以理解，图5中示出的多轮对话中语义补齐的设备结构并不构成对多轮对话中语义补齐的设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

处理器501是多轮对话中语义补齐的设备的控制中心，可以按照多轮对话中语义补齐的方法进行处理。处理器501利用各种接口和线路连接整个多轮对话中语义补齐的设备的各个部分，通过运行或执行存储在存储器509内的软件程序和/或模块，以及调用存储在存储器509内的数据，利用预置语料断句函数与预置分析函数对用户输入的多轮对话进行语法检测，以及利用多轮对话上下文的语义对语义不全的语句进行补齐，提高了语义分析结果的准确率。存储介质508和存储器509都是存储数据的载体，本发明实施例中，存储介质508可以是指储存容量较小，但速度快的内存储器，而存储器509可以是储存容量大，但储存速度慢的外存储器。

存储器509可用于存储软件程序以及模块，处理器501通过运行存储在存储器509的软件程序以及模块，从而执行多轮对话中语义补齐的设备500的各种功能应用以及数据处理。存储器509可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等；存储数据区可存储根据多轮对话中语义补齐的设备的使用所创建的数据等。此外，存储器509可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在本发明实施例中提供的多轮对话中语义补齐的程序和接收到的数据流存储在存储器中，当需要使用时，处理器501从存储器509中调用。

在计算机上加载和执行计算机程序指令时，全部或部分地产生按照本发明实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一计算机可读存储介质传输，例如，计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、双绞线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，光盘)、或者半导体介质(例如固态硬盘(solid state disk，SSD))等。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

以上，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种多轮对话中语义补齐的方法，其特征在于，包括：

利用预置语料断句函数与预置分析函数，对获取到的用户输入的第一语句进行语法检测，得到第一语句检测结果，所述第一语句检测结果为所述第一语句中每个词语之间的目标依存关系；

利用所述预置语料断句函数与所述预置分析函数，对获取到的用户新一轮输入的第二语句进行语法检测，得到第二语句检测结果，所述第二语句检测结果为所述第二语句中每个词语之间的目标依存关系；

判断所述第二语句检测结果是否仅包括单实体且所述第二语句为疑问句；

当所述第二语句检测结果仅包括单实体且所述第二语句为疑问句时，根据所述第一语句检测结果将所述第二语句的语义缺失部分补齐，得到第一补齐语句；

判断所述第一补齐语句中是否包括指代不明的词语，所述指代不明的词语包括代词、量词以及冠词；

若所述第一补齐语句中包括指代不明的词语，则根据所述第一语句检测结果将所述第一补齐语句中指代不明的词语替换，得到第二补齐语句。

2.根据权利要求1所述的方法，其特征在于，所述利用预置语料断句函数与预置分析函数，对获取到的用户输入的第一语句进行语法检测，得到第一语句检测结果，所述第一语句检测结果为所述第一语句中每个词语之间的目标依存关系包括：

获取用户输入的第一语句；

利用预置语料断句函数将所述第一语句进行语句分割，得到第一输入语句；

利用预置分析函数对所述第一输入语句进行语法检测，得到第一语句检测结果，所述第一语句检测结果为所述第一输入语句中每个词语之间的目标依存关系。

3.根据权利要求2所述的方法，其特征在于，所述利用预置语料断句函数将所述第一语句进行语句分割，得到第一输入语句包括：

对所述第一语句进行断句，得到分段语句；

将所述分段语句中的分段语料与预置语料进行匹配，预置语料是依据业务数据建立在预置意图规则库中的语料；

若所述分段语料与所述预置语料相匹配，则在所述分段语料的前后位置对所述分段语句进行分割，得到分割语句，并将所述分割语句作为第一输入语句；

若所述分段语料与所述预置语料不相配，则直接将所述分段语料作为第一输入语句。

4.根据权利要求2所述的方法，其特征在于，所述利用预置分析函数对所述第一输入语句进行语法检测，得到第一语句检测结果，所述第一语句检测结果为所述第一输入语句中每个词语之间的目标依存关系包括：

对所述第一输入语句中的词语进行词性标注以及实体抽取，得到第一语句标注结果；

计算每个所述词语之间的依存概率，所述词语为所述第一语句标注结果中的词语，所述依存概率为预置依存关系出现的频次；

确定每个所述词语之间的目标依存关系，所述依存概率权重最大的概率所对应的所述预置依存关系为所述词语之间的所述目标依存关系；

获取第一语句检测结果，所述第一语句检测结果为所述第一输入语句中每个所述词语之间的所述目标依存关系。

5.根据权利要求1所述的方法，其特征在于，所述当所述第二语句检测结果仅包括单实体且所述第二语句为疑问句时，根据所述第一语句检测结果将所述第二语句的语义缺失部分补齐，得到第一补齐语句包括：

当所述第二语句检测结果仅包括单实体且所述第二语句为疑问句时，提取出所述第二语句检测结果中的单实体，并将所述单实体作为第一目标词语；

在所述第一语句检测结果中筛选与所述第一目标词语语法结构相同的所述单实体，得到第二目标词语；

在所述第一语句中，利用所述第一目标词语替换所述第二目标词语，得到第一补齐语句。

6.根据权利要求1-5所述的方法，其特征在于，所述判断所述第一补齐语句中是否包括指代不明的词语，所述指代不明的词语包括代词、量词以及冠词包括：

获取第一补齐语句的检测结果，所述第一补齐语句的检测结果为所述第二语句检测结果与所述第一语句检测结果的结合；

判断所述第一补齐语句的检测结果中是否包括代词、量词以及冠词。

7.根据权利要求6所述的方法，其特征在于，所述若所述第一补齐语句中包括指代不明的词语，则根据所述第一语句检测结果将所述第一补齐语句中指代不明的词语替换，得到第二补齐语句包括：

若所述第一补齐语句的检测结果包括指代不明的词语，则提取出所述指代不明的词语，并将所述指代不明的词语作为第三目标词语；

在所述第一语句检测结果中筛选与所述第三目标词语语法结构相同的词语，得到第四目标词语；

在所述第二语句中，利用所述第四目标词语替换所述第三目标词语，得到第二补齐语句。

8.一种多轮对话中语义补齐的装置，其特征在于，包括：

第一获取单元，用于利用预置语料断句函数与预置分析函数，对获取到的用户输入的第一语句进行语法检测，得到第一语句检测结果，所述第一语句检测结果为所述第一语句中每个词语之间的目标依存关系；

第二获取单元，用于利用所述预置语料断句函数与所述预置分析函数，对获取到的用户新一轮输入的第二语句进行语法检测，得到第二语句检测结果，所述第二语句检测结果为所述第二语句中每个词语之间的目标依存关系；

第一判断单元，用于判断所述第二语句检测结果是否仅包括单实体且所述第二语句为疑问句；

第一补齐单元，用于当所述第二语句检测结果仅包括单实体且所述第二语句为疑问句时，根据所述第一语句检测结果将所述第二语句的语义缺失部分补齐，得到第一补齐语句；

第二判断单元，用于判断所述第一补齐语句中是否包括指代不明的词语，所述指代不明的词语包括代词、量词以及冠词；

第二补齐单元，用于若所述第一补齐语句中包括指代不明的词语，则根据所述第一语句检测结果将所述第一补齐语句中指代不明的词语替换，得到第二补齐语句。

9.一种多轮对话中语义补齐的设备，其特征在于，包括：

存储器和至少一个处理器，所述存储器中存储有指令，所述存储器和所述至少一个处理器通过线路互联；

所述至少一个处理器调用所述存储器中的所述指令，以使得所述多轮对话中语义补齐的设备执行如权利要求1-7中任意一项所述多轮对话中语义补齐的方法。

10.一种计算机可读存储介质，其特征在于，包括指令，当所述指令在计算机上运行时，使得计算机执行如权利要求1-7中任意一项所述的多轮对话中语义补齐的方法的步骤。