CN114218375B - 基于图谱的对话引导方法、装置、设备及介质 - Google Patents

基于图谱的对话引导方法、装置、设备及介质 Download PDF

Info

Publication number
CN114218375B
CN114218375B CN202111561656.7A CN202111561656A CN114218375B CN 114218375 B CN114218375 B CN 114218375B CN 202111561656 A CN202111561656 A CN 202111561656A CN 114218375 B CN114218375 B CN 114218375B
Authority
CN
China
Prior art keywords
intention
entity
dialogue
word segmentation
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111561656.7A
Other languages
English (en)
Other versions
CN114218375A (zh
Inventor
徐清瑶
詹奕深
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202111561656.7A priority Critical patent/CN114218375B/zh
Publication of CN114218375A publication Critical patent/CN114218375A/zh
Application granted granted Critical
Publication of CN114218375B publication Critical patent/CN114218375B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明涉及数据处理及人工智能领域,公开了一种基于图谱的对话引导方法、装置、设备及存储介质。通过意图识别模型对问答语料进行意图识别,得到意图结果,然后基于对话策略图谱对意图结果进行本体和实体的匹配,并基于本体和实体查询出对应的应答话术和后续的实体,以引导用户进行应答,由于使用了对话策略图谱,并且对话策略图谱中的每个本体和每个实体之间都存在跳转关系,无需重新构建跳转关系,实现了实体热顺便跳转,提高了对话的管理完整度,同时基于跳转关系,可以实现多次跳转后仍可以实现意图的匹配,解决了现有技术中话术跳转机械化、容易出错和费时费力的问题。

Description

基于图谱的对话引导方法、装置、设备及介质
技术领域
本发明涉及数据处理领域,尤其涉及一种对话引导方法、装置、设备及存储介质。
背景技术
电话销售是销售推广中的一种主要方式,主要是通过拨打电话对客户进行相关产品的介绍和销售。随着人工智能技术的普及,越来越多的人工过程被机器人替换,尤其是销售业务中的电话销售。
销售机器人通过对客户的回答来识别客户的意图,并选择相应的话术策略来回答客户的问题。在人机对话的过程中,难点是多轮对话,即机器如何在多轮对话中选择相应话术来正确回答客户的一些多轮次承接问题,这就需要由对话管理策略来执行。目前的对话管理策略主要通过卡片流的形式来满足不同场景的多轮对话。通过意图模型对每轮对话中识别客户的意图,然后对话管理策略再通过意图模型的识别结果选择相应的卡片,其卡片流的正向流转形式是从A卡片跳转到B卡片再跳转到C卡片,而逆向是经过多次跳转之后再跳转到之前的某个环节,这个逆向过程的实现则比较困难,且容易出错。因此,如何解决多次跳转问题成了对话管理策略中的难点。
发明内容
本申请的主要目的是提供一种基于图谱的对话引导方法、装置、设备及存储介质,以解决现有的卡片流人机对话管理中,在多次跳转后意图匹配容易出错的问题。
本发明第一方面提供了一种基于图谱的对话引导方法,所述对话引导方法包括:
获取用户输入的问答语料,并对所述问答语料进行自然语言理解,得到话术文本;
利用预设的意图识别模型,识别所述话术文本的意图,得到意图结果;
基于所述意图结果,调用预先构建的对话策略图谱确定对应的本体和实体,其中所述对话策略图谱为包含本体、实体和两者之间的任意组合跳转关系;
基于所述本体和实体,查询出与所述问答语料相匹配的应答话术和后续的实体;
将所述应答话术返回给用户,并基于所述后续的实体引导用户应答。
可选的,在本发明第一方面的第一种实现方式中,所述获取用户输入的问答语料,并对所述问答语料进行自然语言理解,得到话术文本,包括:
获取用户输入的问答语料,其中所述问答语料包括音频和文本;
若所述问答语料为音频时,利用音频转换模型将所述问答语料转换为文本;
利用标准话术模型,对所述文本中的词语进行槽位划分,并剔除冗余词语,得到话术文本。
可选的,在本发明第一方面的第二种实现方式中,所述利用标准话术模型,对所述文本中的词语进行槽位划分,并剔除冗余词语,得到话术文本,包括:
基于规则的分词方式,识别所述文本中的非词典词和单字字典词,并进行标记;
对所述文本中标记的字或词进行语义识别,并判断语义是否满足当前话术场景;
若不满足,则对不满足的字或词进行重分,得到第一分词集合;
基于双向匹配法,对所述文本进行分词处理,得到第二分词集合;
将所述第一分词集合和第二分词集合中的词语进行匹配,得到匹配结果;
若匹配一致,则利用标准话术模型对所述第一分词集合中的词语进行槽位划分,并剔除冗余词语,得到话术文本;
若匹配不一致,则从所述第一分词集合和第二分词集合选择大颗粒度词多、非词典词和单字词少的分词集合输出,并利用标准话术模型对所述分词集合中的词语进行槽位划分,并剔除冗余词语,得到话术文本。
可选的,在本发明第一方面的第三种实现方式中,所述意图识别模型为隐马尔科夫模型,所述利用预设的意图识别模型,识别所述话术文本的意图,得到意图结果,包括:
利用所述隐马尔科夫模型中的隐含语义识别网络,对所述话术文本的分词集合进行近似语义解析,并对解析到的语义进行规律观察,得到隐含分词集合;
基于所述隐马尔科夫模型中的语义距离计算模块,计算所述分词集合与所述隐含分词集合中的分词之间的距离;
基于所述距离,对所述隐含分词集合中的分词进行清洗,并将清洗后的隐含分词集合与分词集合合并,得到所述话术文本的完整分词集合;
对所述完整分词集合中的各分词的语义进行拼接,得到所述对话文本的意图结果。
可选的,在本发明第一方面的第四种实现方式中,所述意图结果包括意图关键词、对话场景和意图肯定信息,所述基于所述意图结果,调用预先构建的对话策略图谱确定对应的本体和实体,包括:
基于所述对话场景以及对话场景与本体之间的关系,从预先构建的对话策略图谱中确定对应的图谱分支;
将所述图谱分支与所述意图关键词进行匹配,确定对应的实体和起始卡片名;
提取所述实体中的卡片名和卡片名之间的跳转关系;
根据所述意图肯定信息,从与所述起始卡片名相连的跳转关系中选择与所述意图肯定信息匹配的跳转关系;
基于所述跳转关系和与所述跳转关系相连的卡片名确定对应的实际实体,基于所述实体确定对应的实际本体。
可选的,在本发明第一方面的第五种实现方式中,所述对话引导方法还包括基于以下方式构建所述对话策略图谱:
采集对话机器人中的多轮历史对话记录,并解析所述多轮历史对话记录中各话术的本体、卡片名、各卡片名的意图,以及基于所述意图构建各卡片名之间的实体图谱,以及所述本体与所述实体图谱之间的图谱雏形;
将同一实体中的各卡片名进行随机组合,得到卡片名组合序列;
利用所述隐马尔科夫模型中的语义距离计算模块,计算所述卡片名组合序列中各组合与所述意图之间的意图距离;
选择所述意图距离达到预设阈值的组合,并创建所述组合中卡片名之间的跳转关系网,得到对话策略图谱。
可选的,在本发明第一方面的第六种实现方式中,在所述基于所述意图结果,调用预先构建的对话策略图谱确定对应的本体和实体之前,还包括:
获取对话机器人中当前状态下的对话流程,基于所述对话流程确定各流程节点上的实际卡片名和流程框图;
基于所述实际卡片名提取所述对话策略图谱中的卡片名,并基于所述流程框图调整提取到的卡片名之间的跳转关系,得到新的对话策略图谱。
本发明第二方面提供了一种基于图谱的对话引导装置,所述对话引导装置包括:
获取模块,用于获取用户输入的问答语料,并对所述问答语料进行自然语言理解,得到话术文本;
识别模块,用于利用预设的意图识别模型,识别所述话术文本的意图,得到意图结果;
确定模块,用于基于所述意图结果,调用预先构建的对话策略图谱确定对应的本体和实体,其中所述对话策略图谱为包含本体、实体和两者之间的任意组合跳转关系;
查询模块,用于基于所述本体和实体,查询出与所述问答语料相匹配的应答话术和后续的实体;
引导模块,用于将所述应答话术返回给用户,并基于所述后续的实体引导用户应答。
可选的,在本发明第二方面的第一种实现方式中,所述获取模块包括:
获取单元,用于获取用户输入的问答语料,其中所述问答语料包括音频和文本;
转换单元,用于在所述问答语料为音频时,利用音频转换模型将所述问答语料转换为文本;
划分单元,用于利用标准话术模型,对所述文本中的词语进行槽位划分,并剔除冗余词语,得到话术文本。
可选的,在本发明第二方面的第二种实现方式中,所述划分单元具体用于:
基于规则的分词方式,识别所述文本中的非词典词和单字字典词,并进行标记;
对所述文本中标记的字或词进行语义识别,并判断语义是否满足当前话术场景;
若不满足,则对不满足的字或词进行重分,得到第一分词集合;
基于双向匹配法,对所述文本进行分词处理,得到第二分词集合;
将所述第一分词集合和第二分词集合中的词语进行匹配,得到匹配结果;
若匹配一致,则利用标准话术模型对所述第一分词集合中的词语进行槽位划分,并剔除冗余词语,得到话术文本;
若匹配不一致,则从所述第一分词集合和第二分词集合选择大颗粒度词多、非词典词和单字词少的分词集合输出,并利用标准话术模型对所述分词集合中的词语进行槽位划分,并剔除冗余词语,得到话术文本。
可选的,在本发明第二方面的第三种实现方式中,所述意图识别模型为隐马尔科夫模型,所述识别模块包括:
语义解析单元,用于利用所述隐马尔科夫模型中的隐含语义识别网络,对所述话术文本的分词集合进行近似语义解析,并对解析到的语义进行规律观察,得到隐含分词集合;
距离计算单元,用于基于所述隐马尔科夫模型中的语义距离计算模块,计算所述分词集合与所述隐含分词集合中的分词之间的距离;
合并单元,用于基于所述距离,对所述隐含分词集合中的分词进行清洗,并将清洗后的隐含分词集合与分词集合合并,得到所述话术文本的完整分词集合;
拼接单元,用于对所述完整分词集合中的各分词的语义进行拼接,得到所述对话文本的意图结果。
可选的,在本发明第二方面的第四种实现方式中,所述意图结果包括意图关键词、对话场景和意图肯定信息,所述确定模块包括:
查询单元,用于基于所述对话场景以及对话场景与本体之间的关系,从预先构建的对话策略图谱中确定对应的图谱分支;
匹配单元,用于将所述图谱分支与所述意图关键词进行匹配,确定对应的实体和起始卡片名;
提取单元,用于提取所述实体中的卡片名和卡片名之间的跳转关系;
选择单元,用于根据所述意图肯定信息,从与所述起始卡片名相连的跳转关系中选择与所述意图肯定信息匹配的跳转关系;
确定单元,用于基于所述跳转关系和与所述跳转关系相连的卡片名确定对应的实际实体,基于所述实体确定对应的实际本体。
可选的,在本发明第二方面的第五种实现方式中,所述对话引导装置还包括用于基于以下方式构建所述对话策略图谱的训练模块:
采集对话机器人中的多轮历史对话记录,并解析所述多轮历史对话记录中各话术的本体、卡片名、各卡片名的意图,以及基于所述意图构建各卡片名之间的实体图谱,以及所述本体与所述实体图谱之间的图谱雏形;
将同一实体中的各卡片名进行随机组合,得到卡片名组合序列;
利用所述隐马尔科夫模型中的语义距离计算模块,计算所述卡片名组合序列中各组合与所述意图之间的意图距离;
选择所述意图距离达到预设阈值的组合,并创建所述组合中卡片名之间的跳转关系网,得到对话策略图谱。
可选的,在本发明第二方面的第六种实现方式中,所述对话引导装置还包括优化模块,其具体用于:
获取对话机器人中当前状态下的对话流程,基于所述对话流程确定各流程节点上的实际卡片名和流程框图;
基于所述实际卡片名提取所述对话策略图谱中的卡片名,并基于所述流程框图调整提取到的卡片名之间的跳转关系,得到新的对话策略图谱。
本发明第三方面提供了一种计算机设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述计算机设备执行上述的基于图谱的对话引导方法的各个步骤。
本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的基于图谱的对话引导方法的各个步骤。
本发明的技术方案中,该方法具体是通过意图识别模型对问答语料进行意图识别,得到意图结果,然后基于对话策略图谱对意图结果进行本体和实体的匹配,并基于本体和实体查询出对应的应答话术和后续的实体,以引导用户进行应答,由于使用了对话策略图谱,并且对话策略图谱中的每个本体和每个实体之间都存在跳转关系,无需重新构建跳转关系,实现了实体热顺便跳转,提高了对话的管理完整度,同时基于跳转关系,可以实现多次跳转后仍可以实现意图的匹配,解决了现有技术中话术跳转机械化、容易出错和费时费力的问题。
附图说明
图1为本发明实施例中基于图谱的对话引导方法的第一个实施例示意图;
图2为本发明实施例中基于图谱的对话引导方法的第二个实施例示意图;
图3为本发明实施例中基于图谱的对话引导方法的第三个实施例示意图;
图4为本发明实施例中基于图谱的对话引导装置的一个实施例示意图;
图5为本发明实施例中基于图谱的对话引导装置的另一个实施例示意图;
图6为本发明实施例中计算机设备的一个实施例示意图。
具体实施方式
本申请提供了一种基于图谱的对话引导方法,通过意图识别模型对问答语料进行意图识别,得到意图结果,然后基于对话策略图谱对意图结果进行本体和实体的匹配,并基于本体和实体查询出对应的应答话术和后续的实体,以引导用户进行应答,由于使用了对话策略图谱,并且对话策略图谱中的每个本体和每个实体之间都存在跳转关系,无需重新构建跳转关系,实现了实体热顺便跳转,提高了对话的管理完整度,同时基于跳转关系,可以实现多次跳转后仍可以实现意图的匹配,解决了现有技术中话术跳转机械化、容易出错和费时费力的问题。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为便于理解,下面对本发明实施例的具体流程进行描述,请参阅图1,本发明实施例中基于图谱的对话引导方法的第一个实施例,该方法的实现步骤如下:
101、获取用户输入的问答语料,并对问答语料进行自然语言理解,得到话术文本;
该步骤中,可以通过扫描脚本或者爬虫工具来抓取问答语料,具体的在用户授权的前提下抓取数据,该方法主要应用于对话机器人,在用户在对话机器人上触发问答训练或者业务销售时,其他扫描脚本或者爬虫工具或者用户的授权,在授权后,实时采集对话机器人接收到的问答语料,而该问答语料是基于对话机器人上的音频采集单元或者是触控板获取得到。
在获取到问答语料后,确定该问答语料是音频还是文本,若是音频,则调用对话机器人中的音频转文字的模型或者网络对音频的问答语料转换成文本语料,基于文本语料进行自然语言的处理,得到话术文本。
进一步的,该步骤通过获取用户输入的问答语料,其中所述问答语料包括音频和文本;
若所述问答语料为音频时,利用音频转换模型将所述问答语料转换为文本;
利用标准话术模型,对所述文本中的词语进行槽位划分,并剔除冗余词语,得到话术文本。
在本实施例中,所述利用标准话术模型,对所述文本中的词语进行槽位划分,并剔除冗余词语,得到话术文本包括:
基于规则的分词方式,识别所述文本中的非词典词和单字字典词,并进行标记;
对所述文本中标记的字或词进行语义识别,并判断语义是否满足当前话术场景;
若不满足,则对不满足的字或词进行重分,得到第一分词集合;
基于双向匹配法,对所述文本进行分词处理,得到第二分词集合;
将所述第一分词集合和第二分词集合中的词语进行匹配,得到匹配结果;
若匹配一致,则利用标准话术模型对所述第一分词集合中的词语进行槽位划分,并剔除冗余词语,得到话术文本;
若匹配不一致,则从所述第一分词集合和第二分词集合选择大颗粒度词多、非词典词和单字词少的分词集合输出,并利用标准话术模型对所述分词集合中的词语进行槽位划分,并剔除冗余词语,得到话术文本。
在实际应用中,所述规则的分词方式主要包括:颗粒度分词、非词典词识别、单字字典词识别和总体词数调整;
其中,颗粒度越大越好。其主要是用于进行语义分析的文本分词,要求分词结果的颗粒度越大,即单词的字数越多,所能表示的含义越确切。
切分结果中非词典词越少越好,单字字典词数越少越好。这里的“非词典词”就是不包含在词典中的单字,而“单字字典词”指的是可以独立运用的单字。
总体词数越少越好。在相同字数的情况下,总词数越少,说明语义单元越少,那么相对的单个语义单元的权重会越大,因此准确性会越高。
对于双向匹配法包括正向最大匹配法和逆向最大匹配法,其中:
正向最大匹配法
从左到右,逐步去掉右部(底部)的字进行新一轮匹配,具体的实现为:假定分词词典中的最长词有i个汉字字符,则用被处理文档的当前字串中的前i个字作为匹配字段,查找字典。若字典中存在这样的一个i字词,则匹配成功,匹配字段被作为一个词切分出来。如果词典中找不到这样的一个i字词,则匹配失败,将匹配字段中的最后一个字去掉,对剩下的字串重新进行匹配处理……如此进行下去,直到匹配成功,即切分出一个词或剩余字串的长度为零为止。这样就完成了一轮匹配,然后取下一个i字字串进行匹配处理,直到文档被扫描完为止。
其算法描述如下:
step1:从左向右取待切分汉语句的m个字符作为匹配字段,m为大机器词典中最长词条个数。
step2:查找大机器词典并进行匹配。若匹配成功,则将这个匹配字段作为一个词切分出来。若匹配不成功,则将这个匹配字段的最后一个字去掉,剩下的字符串作为新的匹配字段,进行再次匹配,重复以上过程,直到切分出所有词为止。
逆向最大匹配法
从右到左,逐步去掉左部(底部)的字进行新一轮匹配,具体的实现与正向最大匹配法相同,不同的是分词切分的方向与MM法相反,而且使用的分词辞典也不同。逆向最大匹配法从被处理文档的末端开始匹配扫描,每次取最末端的2i个字符(i字字串)作为匹配字段,若匹配失败,则去掉匹配字段最前面的一个字,继续匹配。相应地,它使用的分词词典是逆序词典,其中的每个词条都将按逆序方式存放。在实际处理时,先将文档进行倒排处理,生成逆序文档。然后,根据逆序词典,对逆序文档用正向最大匹配法处理即可。
在分别完成正向和逆向的分词后,将正向最大匹配法与逆向最大匹配法的分词进行组合。先根据标点对文档进行粗切分,把文档分解成若干个句子,然后再对这些句子用正向最大匹配法和逆向最大匹配法进行扫描切分。如果两种分词方法得到的匹配结果相同,则认为分词正确,否则,按最小集处理。
102、利用预设的意图识别模型,识别话术文本的意图,得到意图结果;
该步骤中,所述意图结果包括意图关键词、对话场景和意图肯定信息,通过意图识别模型对话术文本对应的分词集合中的分词进行组合,得到意图话术,基于对话话术从意图知识图谱中进行话术的匹配,得到意图标签以及意图对应的场景标签和话术文本中的肯定词,基于意图标签确定意图关键词,基于场景标签确定对话场景,从而得到意图结果。
103、基于意图结果,调用预先构建的对话策略图谱确定对应的本体和实体;
该步骤中,其中所述对话策略图谱为包含本体、实体和两者之间的任意组合跳转关系;根据意图结果中的意图关键词从对话策略图谱中查询出对应的本体和实体,基于本体和实体之间的连接关系确定跳转关系。
在实际应用中,根据意图结果首先从对话策略图谱中确定本体,这里的本体可以理解为是应用场景(对话场景),提取本体下的所有实体和各实体之间的跳转关系。
104、基于本体和实体,查询出与问答语料相匹配的应答话术和后续的实体;
该步骤中,本体包括多个实体,每个实体包括多个应答话术,基于意图结果确定本体后,首先需要确认的与意图最相关的实体,即是与该问答语料匹配的实体,基于实体确定应答话术以及该实体之后的待跳转实体。
105、将应答话术返回给用户,并基于后续的实体引导用户应答。
该步骤中,将确定的与该问答语料匹配的应答话术返回给用户,以实现引导用户回复,同时在确定用户反馈肯定信息后,跳转至后续的实体继续进行问答引导,而这时的问答引导是基于后续的实体中的话术实现。
通过对上述方法的实施,通过一个全场景话术跳转的对话策略图谱,将各种话术跳转都清晰展现,并且容易追溯多轮拨打结果,解决了现有技术中话术跳转机械化、容易出错和费时费力的问题。
请参阅图2,本发明实施例中基于图谱的对话引导方法的第二个实施例包括:
201、获取用户输入的问答语料,并对问答语料进行自然语言理解,得到话术文本;
202、利用隐马尔科夫模型中的隐含语义识别网络,对话术文本的分词集合进行近似语义解析,并对解析到的语义进行规律观察,得到隐含分词集合;
具体的,所述隐含语义可以理解为表达意图时的一些可有可无的关键词,例如语气词等,通过隐马尔科夫模型中的隐含语义识别网络,对话术文本对应的分词集合中的各分词进行识别,在识别出语义后,还原出原本的分词词组,以得到分词的隐含词语/字。
203、基于隐马尔科夫模型中的语义距离计算模块,计算分词集合与隐含分词集合中的分词之间的距离;
所述距离可以理解为是两个分词之间相隔的词/字数量,在句子中任意两个词语之间的距离,既可以用这个词语之间相隔的字的个数来确定,具体的:
在经过分词的句子中任意来个词语之间间隔的分词数,其计算公式为:
SegDis=|w1-w2|+1
其中,SegDis为分词之间的距离,w1和w2代表两个分词,基于上述的公式可以两个分词之间的最小距离是1,若距离为1时,则说明两个分词是重合的同一个词语。
204、基于距离,对隐含分词集合中的分词进行清洗,并将清洗后的隐含分词集合与分词集合合并,得到话术文本的完整分词集合;
205、对完整分词集合中的各分词的语义进行拼接,得到对话文本的意图结果;
206、基于意图结果,调用预先构建的对话策略图谱确定对应的本体和实体;
具体的,该对话策略图谱为根据历史数据训练得到,其实现步骤包括:
采集对话机器人中的多轮历史对话记录,并解析所述多轮历史对话记录中各话术的本体、卡片名、各卡片名的意图,以及基于所述意图构建各卡片名之间的实体图谱,以及所述本体与所述实体图谱之间的图谱雏形;
将同一实体中的各卡片名进行随机组合,得到卡片名组合序列;
利用所述隐马尔科夫模型中的语义距离计算模块,计算所述卡片名组合序列中各组合与所述意图之间的意图距离;
选择所述意图距离达到预设阈值的组合,并创建所述组合中卡片名之间的跳转关系网,得到对话策略图谱。
207、基于本体和实体,查询出与问答语料相匹配的应答话术和后续的实体;
208、将应答话术返回给用户,并基于后续的实体引导用户应答。
通过对上述提供的方案的实施例,实现了基于业务卡片跳转表生成一个全场景话术跳转的对话策略图谱,将各种话术跳转都清晰展现,并且容易追溯多轮拨打结果。同时,业务人员可以在对话策略图谱平台完成话术的配置以及话术跳转的配置,而不需要由技术人员来配置,省去了繁琐且响应低效的发版过程,简单方便。
请参阅图3,本发明实施例中基于图谱的对话引导方法的第三个实施例包括:
301、获取用户输入的问答语料,并对问答语料进行自然语言理解,得到话术文本;
302、利用马尔科夫模型,识别话术文本的意图,得到意图结果;
具体的,马尔科夫模型包括隐含语义识别网络和语义距离计算模块,基于所述隐马尔科夫模型中的语义距离计算模块,计算所述分词集合与所述隐含分词集合中的分词之间的距离;
基于所述距离,对所述隐含分词集合中的分词进行清洗,并将清洗后的隐含分词集合与分词集合合并,得到所述话术文本的完整分词集合;
对所述完整分词集合中的各分词的语义进行拼接,得到所述对话文本的意图结果。
303、基于对话场景以及对话场景与本体之间的关系,从预先构建的对话策略图谱中确定对应的图谱分支;
304、将图谱分支与意图关键词进行匹配,确定对应的实体和起始卡片名;
在本实施例中,上述对话策略图谱中包括多个场景的话术或者每个话术对应一个实体,对各实体组成一个本体,基于对话场景确定本体的标签,基于本体的标签从对话策略图谱中查询出对应的本体,以本体即为一个完整话术的引导树状图,树状图中包括多个话术,即是包括多个本体,通过在本体的基础上确定实体,在实体的基础上确定卡片名。
305、提取实体中的卡片名和卡片名之间的跳转关系;
306、根据意图肯定信息,从与起始卡片名相连的跳转关系中选择与意图肯定信息匹配的跳转关系;
307、基于跳转关系和与跳转关系相连的卡片名确定对应的实际实体,基于实体确定对应的实际本体;
在实际应用中,所述对话策略图谱是基于历史语料来构建得到,其实现为:
首先,根据业务卡片的跳转卡片表生成一个对话策略图谱,图谱中的本体为各个场景类型,实体为卡片名,关系为跳转条件,跳转条件基于意图结果得来,比如在智能销售的对话管理策略中共涉及三个场景:意愿场景、预约场景、征信出额场景,则意愿场景、预约场景、征信出额场景即为对话策略图谱中的本体类型。在意愿场景中,接洽、回访激活、意愿筛选等卡片名为图谱中的实体,在接洽卡片中,意图结果为肯定,则接洽卡片跳转到回访激活卡片,接洽卡片和回访激活卡片中的关系则为肯定跳转,等等。卡片中的话术内容可以认为是该卡片实体的属性。比如,接洽卡片实体的属性为“您好,请问是XXX先生/女士吗?”,回访激活卡片实体的属性为“这里是xxxx服务热线,本次来电主要是跟您介绍…”。本体、实体、关系和实体属性都确定之后,即可构建一个全场景话术跳转的对话策略图谱。
进一步的,在所述基于所述意图结果,调用预先构建的对话策略图谱确定对应的本体和实体之前,还包括:
获取对话机器人中当前状态下的对话流程,基于对话流程确定各流程节点上的实际卡片名和流程框图;
基于实际卡片名提取对话策略图谱中的卡片名,并基于流程框图调整提取到的卡片名之间的跳转关系,得到新的对话策略图谱。
具体的,对话策略图谱中,业务人员可根据实际需要自行配置业务需要的实体、关系和属性。配置生效后话术跳转即可采用更新的对话策略。
然后,在对话过程中,在接洽环节后,意图模型根据客户的回答进行意图解析,得到意图结果,对话策略图谱将意图结果对应到图谱中的关系,再进入下一节点,进入下一节点后,选择该节点的属性即对应的话术内容即可得到应答话术,依次类推,直至完成整个对话过程。
308、基于本体和实体,查询出与问答语料相匹配的应答话术和后续的实体;
309、将应答话术返回给用户,并基于后续的实体引导用户应答。
通过对上述提供的方案的实施例,实现了基于业务卡片跳转表生成一个全场景话术跳转的对话策略图谱,将各种话术跳转都清晰展现,并且容易追溯多轮拨打结果。同时,业务人员可以在对话策略图谱平台完成话术的配置以及话术跳转的配置,而不需要由技术人员来配置,省去了繁琐且响应低效的发版过程,简单方便。
上面对本发明实施例中的基于图谱的对话引导方法进行了描述,下面对本发明实施例中的基于图谱的对话引导装置进行描述,请参照图4,本发明实施例中的基于图谱的对话引导装置的一个实施例包括:
获取模块401,用于获取用户输入的问答语料,并对所述问答语料进行自然语言理解,得到话术文本;
识别模块402,用于利用预设的意图识别模型,识别所述话术文本的意图,得到意图结果;
确定模块403,用于基于所述意图结果,调用预先构建的对话策略图谱确定对应的本体和实体,其中所述对话策略图谱为包含本体、实体和两者之间的任意组合跳转关系;
查询模块404,用于基于所述本体和实体,查询出与所述问答语料相匹配的应答话术和后续的实体;
引导模块405,用于将所述应答话术返回给用户,并基于所述后续的实体引导用户应答。
通过对上述方法的实施,通过意图识别模型对问答语料进行意图识别,得到意图结果,然后基于对话策略图谱对意图结果进行本体和实体的匹配,并基于本体和实体查询出对应的应答话术和后续的实体,以引导用户进行应答,由于使用了对话策略图谱,并且对话策略图谱中的每个本体和每个实体之间都存在跳转关系,无需重新构建跳转关系,实现了实体热顺便跳转,提高了对话的管理完整度,同时基于跳转关系,可以实现多次跳转后仍可以实现意图的匹配,解决了现有技术中话术跳转机械化、容易出错和费时费力的问题。
请参阅图5,本发明实施例中的基于图谱的对话引导装置的另一个实施例包括:
获取模块401,用于获取用户输入的问答语料,并对所述问答语料进行自然语言理解,得到话术文本;
识别模块402,用于利用预设的意图识别模型,识别所述话术文本的意图,得到意图结果;
确定模块403,用于基于所述意图结果,调用预先构建的对话策略图谱确定对应的本体和实体,其中所述对话策略图谱为包含本体、实体和两者之间的任意组合跳转关系;
查询模块404,用于基于所述本体和实体,查询出与所述问答语料相匹配的应答话术和后续的实体;
引导模块405,用于将所述应答话术返回给用户,并基于所述后续的实体引导用户应答。
其中,所述获取模块401包括:
获取单元4011,用于获取用户输入的问答语料,其中所述问答语料包括音频和文本;
转换单元4012,用于在所述问答语料为音频时,利用音频转换模型将所述问答语料转换为文本;
划分单元4013,用于利用标准话术模型,对所述文本中的词语进行槽位划分,并剔除冗余词语,得到话术文本。
在本实施例中,所述划分单元4013具体用于:
基于规则的分词方式,识别所述文本中的非词典词和单字字典词,并进行标记;
对所述文本中标记的字或词进行语义识别,并判断语义是否满足当前话术场景;
若不满足,则对不满足的字或词进行重分,得到第一分词集合;
基于双向匹配法,对所述文本进行分词处理,得到第二分词集合;
将所述第一分词集合和第二分词集合中的词语进行匹配,得到匹配结果;
若匹配一致,则利用标准话术模型对所述第一分词集合中的词语进行槽位划分,并剔除冗余词语,得到话术文本;
若匹配不一致,则从所述第一分词集合和第二分词集合选择大颗粒度词多、非词典词和单字词少的分词集合输出,并利用标准话术模型对所述分词集合中的词语进行槽位划分,并剔除冗余词语,得到话术文本。
其中,所述意图识别模型为隐马尔科夫模型,所述识别模块402包括:
语义解析单元4021,用于利用所述隐马尔科夫模型中的隐含语义识别网络,对所述话术文本的分词集合进行近似语义解析,并对解析到的语义进行规律观察,得到隐含分词集合;
距离计算单元4022,用于基于所述隐马尔科夫模型中的语义距离计算模块,计算所述分词集合与所述隐含分词集合中的分词之间的距离;
合并单元4023,用于基于所述距离,对所述隐含分词集合中的分词进行清洗,并将清洗后的隐含分词集合与分词集合合并,得到所述话术文本的完整分词集合;
拼接单元4024,用于对所述完整分词集合中的各分词的语义进行拼接,得到所述对话文本的意图结果。
其中,所述意图结果包括意图关键词、对话场景和意图肯定信息,所述确定模块403包括:
查询单元4031,用于基于所述对话场景以及对话场景与本体之间的关系,从预先构建的对话策略图谱中确定对应的图谱分支;
匹配单元4032,用于将所述图谱分支与所述意图关键词进行匹配,确定对应的实体和起始卡片名;
提取单元4033,用于提取所述实体中的卡片名和卡片名之间的跳转关系;
选择单元4034,用于根据所述意图肯定信息,从与所述起始卡片名相连的跳转关系中选择与所述意图肯定信息匹配的跳转关系;
确定单元4035,用于基于所述跳转关系和与所述跳转关系相连的卡片名确定对应的实际实体,基于所述实体确定对应的实际本体。
其中,所述对话引导装置还包括用于基于以下方式构建所述对话策略图谱的训练模块406:
采集对话机器人中的多轮历史对话记录,并解析所述多轮历史对话记录中各话术的本体、卡片名、各卡片名的意图,以及基于所述意图构建各卡片名之间的实体图谱,以及所述本体与所述实体图谱之间的图谱雏形;
将同一实体中的各卡片名进行随机组合,得到卡片名组合序列;
利用所述隐马尔科夫模型中的语义距离计算模块,计算所述卡片名组合序列中各组合与所述意图之间的意图距离;
选择所述意图距离达到预设阈值的组合,并创建所述组合中卡片名之间的跳转关系网,得到对话策略图谱。
其中,所述对话引导装置还包括优化模块407,其具体用于:
获取对话机器人中当前状态下的对话流程,基于所述对话流程确定各流程节点上的实际卡片名和流程框图;
基于所述实际卡片名提取所述对话策略图谱中的卡片名,并基于所述流程框图调整提取到的卡片名之间的跳转关系,得到新的对话策略图谱。
请参阅图6,下面从硬件处理的角度对本发明实施例中的计算机设备的一个实施例进行详细描述。
图6是本发明实施例提供的一种计算机设备的结构示意图,该计算机设备600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessing units,CPU)610(例如,一个或一个以上处理器)和存储器620,一个或一个以上存储应用程序633或数据632的存储介质630(例如一个或一个以上海量存储设备)。其中,存储器620和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对计算机设备600中的一系列指令操作。更进一步地,处理器610可以设置为与存储介质630通信,在计算机设备600上执行存储介质630中的一系列指令操作。
计算机设备600还可以包括一个或一个以上电源640,一个或一个以上有线或无线网络接口650,一个或一个以上输入输出接口660,和/或,一个或一个以上操作系统631,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图6示出的计算机设备结构并不构成对本申请提供的计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行上述基于图谱的对话引导方法的步骤。
在实际应用中,上述提供的方法可以基于人工智能技术来实现,其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。其具体可以是基于服务器来执行,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (7)

1.一种基于图谱的对话引导方法,其特征在于,所述对话引导方法包括:
获取用户输入的问答语料,并对所述问答语料进行自然语言理解,得到话术文本;
利用预设的意图识别模型,识别所述话术文本的意图,得到意图结果,其中,所述意图结果包括意图关键词、对话场景和意图肯定信息;
采集对话机器人中的多轮历史对话记录,并解析所述多轮历史对话记录中各话术的本体、卡片名、各卡片名的意图,以及基于所述意图构建各卡片名之间的实体图谱,以及所述本体与所述实体图谱之间的图谱雏形;将同一实体中的各卡片名进行随机组合,得到卡片名组合序列;利用隐马尔科夫模型中的语义距离计算模块,计算所述卡片名组合序列中各组合与所述意图之间的意图距离;选择所述意图距离达到预设阈值的组合,并创建所述组合中卡片名之间的跳转关系网,得到对话策略图谱;
获取对话机器人中当前状态下的对话流程,基于所述对话流程确定各流程节点上的实际卡片名和流程框图;基于所述实际卡片名提取所述对话策略图谱中的卡片名,并基于所述流程框图调整提取到的卡片名之间的跳转关系,得到新的对话策略图谱;
基于所述意图结果,调用新的对话策略图谱确定对应的本体和实体,其中所述对话策略图谱为包含本体、实体和两者之间的任意组合跳转关系;
基于所述本体和实体,查询出与所述问答语料相匹配的应答话术和后续的实体;
将所述应答话术返回给用户,并基于所述后续的实体引导用户应答;
所述基于所述意图结果,调用新的对话策略图谱确定对应的本体和实体包括:基于所述对话场景以及对话场景与本体之间的关系,从预先构建的对话策略图谱中图谱分支;将所述图谱分支与所述意图关键词进行匹配,确定对应的实体和起始卡片名;提取所述实体中的卡片名和卡片名之间的跳转关系;根据所述意图肯定信息,从与所述起始卡片名相连的跳转关系中选择与所述意图肯定信息匹配的跳转关系;基于所述跳转关系和与所述跳转关系相连的卡片名确定对应的实际实体,基于所述实体确定对应的实际本体。
2.根据权利要求1所述的基于图谱的对话引导方法,其特征在于,所述获取用户输入的问答语料,并对所述问答语料进行自然语言理解,得到话术文本,包括:
获取用户输入的问答语料,其中所述问答语料包括音频和文本;
若所述问答语料为音频时,利用音频转换模型将所述问答语料转换为文本;
利用标准话术模型,对所述文本中的词语进行槽位划分,并剔除冗余词语,得到话术文本。
3.根据权利要求2所述的基于图谱的对话引导方法,其特征在于,所述利用标准话术模型,对所述文本中的词语进行槽位划分,并剔除冗余词语,得到话术文本,包括:
基于规则的分词方式,识别所述文本中的非词典词和单字字典词,并进行标记;
对所述文本中标记的字或词进行语义识别,并判断语义是否满足当前话术场景;
若不满足,则对不满足的字或词进行重分,得到第一分词集合;
基于双向匹配法,对所述文本进行分词处理,得到第二分词集合;
将所述第一分词集合和第二分词集合中的词语进行匹配,得到匹配结果;
若匹配一致,则利用标准话术模型对所述第一分词集合中的词语进行槽位划分,并剔除冗余词语,得到话术文本;
若匹配不一致,则从所述第一分词集合和第二分词集合选择大颗粒度词多、非词典词和单字词少的分词集合输出,并利用标准话术模型对所述分词集合中的词语进行槽位划分,并剔除冗余词语,得到话术文本。
4.根据权利要求3所述的基于图谱的对话引导方法,其特征在于,所述意图识别模型为隐马尔科夫模型,所述利用预设的意图识别模型,识别所述话术文本的意图,得到意图结果,包括:
利用所述隐马尔科夫模型中的隐含语义识别网络,对所述话术文本的分词集合进行近似语义解析,并对解析到的语义进行规律观察,得到隐含分词集合;
基于所述隐马尔科夫模型中的语义距离计算模块,计算所述分词集合与所述隐含分词集合中的分词之间的距离;
基于所述距离,对所述隐含分词集合中的分词进行清洗,并将清洗后的隐含分词集合与分词集合合并,得到所述话术文本的完整分词集合;
对所述完整分词集合中的各分词的语义进行拼接,得到所述对话文本的意图结果。
5.一种基于图谱的对话引导装置,其特征在于,所述对话引导装置包括:
获取模块,用于获取用户输入的问答语料,并对所述问答语料进行自然语言理解,得到话术文本;
识别模块,用于利用预设的意图识别模型,识别所述话术文本的意图,得到意图结果,其中,所述意图结果包括意图关键词、对话场景和意图肯定信息;
训练模块,用于采集对话机器人中的多轮历史对话记录,并解析所述多轮历史对话记录中各话术的本体、卡片名、各卡片名的意图,以及基于所述意图构建各卡片名之间的实体图谱,以及所述本体与所述实体图谱之间的图谱雏形;将同一实体中的各卡片名进行随机组合,得到卡片名组合序列;利用隐马尔科夫模型中的语义距离计算模块,计算所述卡片名组合序列中各组合与所述意图之间的意图距离;选择所述意图距离达到预设阈值的组合,并创建所述组合中卡片名之间的跳转关系网,得到对话策略图谱;
优化模块,用于获取对话机器人中当前状态下的对话流程,基于所述对话流程确定各流程节点上的实际卡片名和流程框图;基于所述实际卡片名提取所述对话策略图谱中的卡片名,并基于所述流程框图调整提取到的卡片名之间的跳转关系,得到新的对话策略图谱;
确定模块,用于基于所述意图结果,调用预先构建的对话策略图谱确定对应的本体和实体,其中所述对话策略图谱为包含本体、实体和两者之间的任意组合跳转关系;
查询模块,用于基于所述本体和实体,查询出与所述问答语料相匹配的应答话术和后续的实体;
引导模块,用于将所述应答话术返回给用户,并基于所述后续的实体引导用户应答;
所述基于所述意图结果,调用新的对话策略图谱确定对应的本体和实体包括:基于所述对话场景以及对话场景与本体之间的关系,从预先构建的对话策略图谱中图谱分支;将所述图谱分支与所述意图关键词进行匹配,确定对应的实体和起始卡片名;提取所述实体中的卡片名和卡片名之间的跳转关系;根据所述意图肯定信息,从与所述起始卡片名相连的跳转关系中选择与所述意图肯定信息匹配的跳转关系;基于所述跳转关系和与所述跳转关系相连的卡片名确定对应的实际实体,基于所述实体确定对应的实际本体。
6.一种计算机设备,其特征在于,所述计算机设备包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述计算机设备执行如权利要求1-4中任一项所述的基于图谱的对话引导方法的各个步骤。
7.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-4中任一项所述的基于图谱的对话引导方法的各个步骤。
CN202111561656.7A 2021-12-20 基于图谱的对话引导方法、装置、设备及介质 Active CN114218375B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111561656.7A CN114218375B (zh) 2021-12-20 基于图谱的对话引导方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111561656.7A CN114218375B (zh) 2021-12-20 基于图谱的对话引导方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN114218375A CN114218375A (zh) 2022-03-22
CN114218375B true CN114218375B (zh) 2024-07-05

Family

ID=

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111026886A (zh) * 2019-12-26 2020-04-17 成都航天科工大数据研究院有限公司 一种针对专业场景的多轮对话处理方法
CN112988985A (zh) * 2019-12-02 2021-06-18 浙江思考者科技有限公司 一种ai智能语音交互-话术一键添加和使用

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112988985A (zh) * 2019-12-02 2021-06-18 浙江思考者科技有限公司 一种ai智能语音交互-话术一键添加和使用
CN111026886A (zh) * 2019-12-26 2020-04-17 成都航天科工大数据研究院有限公司 一种针对专业场景的多轮对话处理方法

Similar Documents

Publication Publication Date Title
CN110162611B (zh) 一种智能客服应答方法及系统
CN109635273B (zh) 文本关键词提取方法、装置、设备及存储介质
CN109522556B (zh) 一种意图识别方法及装置
CN112800170A (zh) 问题的匹配方法及装置、问题的回复方法及装置
CN112035599B (zh) 基于垂直搜索的查询方法、装置、计算机设备及存储介质
CN111259130B (zh) 用于在对话中提供答复语句的方法及装置
CN109829045A (zh) 一种问答方法和装置
US20230394247A1 (en) Human-machine collaborative conversation interaction system and method
CN111858854A (zh) 一种基于历史对话信息的问答匹配方法及相关装置
CN111429157A (zh) 投诉工单的评价处理方法、装置、设备及存储介质
CN114238373A (zh) 一种自然语言问题转换为结构化查询语句的方法及装置
CN114780709A (zh) 文本匹配方法、装置及电子设备
CN113220862A (zh) 标准问识别方法、装置及计算机设备及存储介质
CN113947084A (zh) 基于图嵌入的问答知识检索方法、装置及设备
CN116467417A (zh) 问题答案的生成方法、装置、设备及存储介质
CN109684444A (zh) 一种智能客服方法及系统
CN111898381A (zh) 一种结合rpa与ai的文本信息提取方法、装置、设备及介质
CN112579666A (zh) 智能问答系统和方法及相关设备
CN114218375B (zh) 基于图谱的对话引导方法、装置、设备及介质
CN111813916A (zh) 一种智能问答方法、装置、计算机设备和介质
CN111460114A (zh) 检索方法、装置、设备及计算机可读存储介质
CN111125368A (zh) 基于目标对象的法律意见书生成方法
CN116304046A (zh) 对话数据的处理方法、装置、存储介质及电子设备
CN113468306A (zh) 语音对话方法、装置、电子设备及存储介质
CN114218375A (zh) 基于图谱的对话引导方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant