CN112988994B - 对话处理方法、装置及电子设备 - Google Patents

对话处理方法、装置及电子设备 Download PDF

Info

Publication number
CN112988994B
CN112988994B CN202110242777.9A CN202110242777A CN112988994B CN 112988994 B CN112988994 B CN 112988994B CN 202110242777 A CN202110242777 A CN 202110242777A CN 112988994 B CN112988994 B CN 112988994B
Authority
CN
China
Prior art keywords
topic
entity
path
target
paths
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110242777.9A
Other languages
English (en)
Other versions
CN112988994A (zh
Inventor
张林箭
宋有伟
张聪
范长杰
胡志鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Netease Hangzhou Network Co Ltd
Original Assignee
Netease Hangzhou Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Netease Hangzhou Network Co Ltd filed Critical Netease Hangzhou Network Co Ltd
Priority to CN202110242777.9A priority Critical patent/CN112988994B/zh
Publication of CN112988994A publication Critical patent/CN112988994A/zh
Application granted granted Critical
Publication of CN112988994B publication Critical patent/CN112988994B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)

Abstract

本发明实施例提供了一种对话处理方法、装置及电子设备,其中,能够基于对话输入内容中的对话实体在包括话题实体以及话题实体间有向关系线的知识图谱中查找与对话实体匹配的目标话题实体和目标话题实体对应的多个话题路径,由于上述知识图谱中配置有热度参数,因此,查找到的话题路径上同样携带有热度参数,可基于目标话题实体对应的多个话题路径的热度参数,从多个话题路径中选择对话实体对应的目标话题路径,根据该目标话题路径上的话题实体获取对话输入内容的对话输出内容;本发明实施例基于对话统计数据得到的热度参数为目标话题路径的确定提供了选取依据,且通过目标话题路径上的话题实体主动引导对话内容,增加了对话的趣味性。

Description

对话处理方法、装置及电子设备
技术领域
本发明涉及计算机技术领域,尤其是涉及一种对话处理方法、装置及电子设备。
背景技术
随着人工智能(AI,Artificial Intelligence)技术的迅速发展,智能对话机器人作为AI的一个应用方向,也在各个产品中体现出其重要价值,不管是在问答类或社交聊天类等应用场景中,现有对话机器人是利用预先训练好的对话生成模型来进行答复的,然而这些对话生成模型在处理单轮或者多轮对话时,通常无法控制对话话题的方向,只能根据的对话内容给出常识性的回答内容,比如对话内容“我生病了”,对话生成模型给出的回复可能是“要好好休息,多喝热水”,这样比较常见的应答,对话话题比较单一,进而减少了对话的趣味性。
发明内容
有鉴于此,本发明的目的在于提供一种对话处理方法、装置及电子设备,以主动引导话题,增强对话趣味性。
第一方面,本发明实施例提供了一种对话处理方法,其中,上述方法包括:确定对话输入内容对应的对话实体;在知识图谱中查找与对话实体匹配的目标话题实体和目标话题实体对应的多个话题路径;其中,知识图谱包括话题实体以及话题实体间的有向关系线,有向关系线及其连接的话题实体构成话题路径,话题路径配置有基于对话统计数据确定的热度参数;根据目标话题实体对应的多个话题路径的热度参数,从多个话题路径选择对话实体对应的目标话题路径;根据目标话题路径获取对话输入内容的对话输出内容。
上述热度参数包括话题实体对应的实体热度值和/或有向关系线对应的关系热度权重;上述方法还包括:获取对话语料集;根据对话语料集确定对话统计数据;其中,对话统计数据包括:知识图谱中的话题实体和/或有向关系线对应的统计次数;根据对话统计数据确定知识图谱中的话题路径的热度参数。
上述根据对话语料集确定对话统计数据的步骤,包括:统计对话语料集中各个话题实体对应的第一统计量;统计对话语料集中各个有向关系线对应的话题实体组的第二统计量,其中,有向关系线对应的话题实体组包括该有向关系线的起始端对应的头话题实体和该有向关系线的结束端对应的尾话题实体。
上述根据对话统计数据确定知识图谱中的话题路径的热度参数的步骤,包括:从各个话题实体对应的第一统计量中选择第一最大值和第一最小值;对于知识图谱中的每个话题路径,均根据第一最大值和第一最小值,以及该话题路径对应的话题实体的第一统计量设置该话题实体的热度参数。
上述根据对话统计数据确定知识图谱中的话题路径的热度参数的步骤,包括:从各个有向关系线对应的话题实体组的第二统计量中选择第二最大值和第二最小值;对于知识图谱中的每个话题路径,均根据第二最大值和第二最小值,以及该话题路径对应的有向关系线对应的第二统计量设置该话题实体的热度参数。
上述确定对话输入内容对应的对话实体的步骤,包括:将对话输入内容中包括的话题实体组成第一实体列表;获取对话输入内容的上文对话语料对应的历史话题路径;将历史话题路径对应的话题实体组成第二实体列表;将存在于第一实体列表且不存在于第二实体列表中的话题实体作为新话题实体;根据新话题实体确定对话输入内容对应的对话实体。
上述在知识图谱中查找与对话实体匹配的目标话题实体和目标话题实体对应的多个话题路径的步骤,包括:从知识图谱中查找与对话实体匹配的目标话题实体;基于预设的搜索路径长度从知识图谱中搜索以目标话题实体为起点的多个话题路径。
上述根据目标话题实体对应的多个话题路径的热度参数,从多个话题路径选择对话实体对应的目标话题路径的步骤,包括:根据目标话题实体对应的多个话题路径的热度参数对多个话题路径排序;根据排序结果确定第一候选路径集;基于第一候选路径集确定目标话题路径。
上述基于第一候选路径集确定目标话题路径的步骤,包括以下之一:从第一候选路径集选择热度参数最大的候选路径作为目标话题路径;从第一候选路径集选择与预存话题实体匹配度最高的候选路径作为目标话题路径;从第一候选路径集随机选择一条候选路径作为目标话题路径。
上述基于第一候选路径集确定目标话题路径的步骤,包括:根据第一候选路径集中各个候选路径对应的实体热度值对多个话题实体进行排序;根据排序结果确定候选话题实体集;基于目标话题实体和候选话题实体集确定骨架路径;其中,骨架路径将目标话题实体作为骨架路径中的首话题实体和尾话题实体;在骨架路径相邻的两个骨架话题实体间扩充话题实体;将扩充话题实体后的骨架路径确定为目标话题路径。
上述在骨架路径相邻的两个骨架话题实体间扩充话题实体的步骤,包括:获取骨架路径中相邻的第一骨架话题实体和第二骨架话题实体;其中,第一骨架话题实体通过有向关系线指向第二骨架话题实体;以第一骨架话题实体为搜索起点,以第二骨架话题实体为搜索终点,在知识图谱中搜索包括第一骨架话题和第二骨架话题实体的话题路径,得到第二候选路径集;基于第二候选路径集确定扩充话题路径;将扩充话题路径包括的话题实体扩充到第一骨架话题实体和第二骨架话题实体之间。
上述基于第二候选路径集确定扩充话题路径的步骤,包括以下之一:从第二候选路径集选择热度参数最大的候选路径作为扩充话题路径;从第二候选路径集随机选择一条候选路径作为扩充话题路径。
上述在骨架路径相邻的两个骨架话题实体间扩充话题实体的步骤,还包括:在骨架路径中的任意两个骨架话题实体之间扩充预设数量的指定话题实体。
上述根据目标话题路径获取对话输入内容的对话输出内容的步骤,包括:将目标话题路径和对话输入内容输入对话生成模型,得到对话输入内容的对话输出内容。
上述方法应用于多个机器人之间的对话,方法还包括:将目标话题路径分享给对话中的其它机器人,以使其它机器人根据目标话题路径和当前的对话内容提供下一个对话内容。
第二方面,本发明实施例还提供一种对话处理装置,该装置包括:确定模块,用于确定对话输入内容对应的对话实体;查找模块,用于在知识图谱中查找与对话实体匹配的目标话题实体和目标话题实体对应的多个话题路径;其中,知识图谱包括话题实体以及话题实体间的有向关系线,有向关系线及其连接的话题实体构成话题路径,话题路径配置有基于对话统计数据确定的热度参数;选择模块,用于根据目标话题实体对应的多个话题路径的热度参数,从多个话题路径选择对话实体对应的目标话题路径;获取模块,用于根据目标话题路径获取对话输入内容的对话输出内容。
第三方面,本发明实施例还提供一种电子设备,其中,包括处理器和存储器,存储器存储有能够被处理器执行的计算机可执行指令,处理器执行计算机可执行指令以实现上述的方法。
第四方面,本发明实施例还提供一种计算机可读存储介质,其中,计算机可读存储介质存储有计算机可执行指令,计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现上述的方法。
本发明实施例带来了以下有益效果:
本发明实施例提供了一种对话处理方法、装置及电子设备,其中,能够基于对话输入内容中的对话实体在包括话题实体以及话题实体间有向关系线的知识图谱中查找与对话实体匹配的目标话题实体和目标话题实体对应的多个话题路径,由于上述知识图谱中配置有热度参数,因此,查找到的话题路径上同样携带有热度参数,所以,可基于目标话题实体对应的多个话题路径的热度参数,从多个话题路径中选择对话实体对应的目标话题路径,由于目标话题路径上有话题实体,因此,可根据该目标话题路径上的话题实体获取对话输入内容的对话输出内容,以实现对话;本发明实施例基于对话统计数据得到的热度参数为目标话题路径的确定提供了选取依据,且,能够通过目标话题路径上的话题实体主动引导对话内容,而不仅仅根据对话输入内容给出机械性的应答,致使对话比较生动灵活,增加了对话的趣味性。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种知识图谱的结构示意图;
图2为本发明实施例提供的另一种对话处理方法的流程图;
图3为本发明实施例提供的另一种对话处理方法的流程图;
图4为本发明实施例提供的另一种知识图谱的结构示意图;
图5为本发明实施例提供的另一种知识图谱的结构示意图;
图6为本发明实施例提供的一种对话处理装置的结构示意图;
图7为本发明实施例提供的另一种对话处理装置的结构示意图;
图8为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
随着人机交互技术的发展,对话生成模型应用的场景越来越多,比如,游戏场景中的人机对话,或者某些电商领域中的自助回复等,都是利用对话生成模型来进行答复的,针对现有对话生成模型的答复仅是根据对话内容给出常识性的回答内容,不能主动引导对话话题而带来的机械性应答,本发明实施例提供的一种对话处理方法、装置及电子设备,可以基于对话统计数据得到的热度参数确定出目标话题路径,且,能够通过目标话题路径上的话题实体主动引导对话内容,而不仅仅根据对话输入内容给出机械性的应答,致使对话比较生动灵活,增加了对话的趣味性。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种对话处理方法进行详细介绍。
本发明实施例提供了一种对话处理方法,参见图1所示的一种对话处理方法,该方法包括以下步骤:
步骤S102,确定对话输入内容对应的对话实体;
上述对话输入内容为当前需要进行对话答复的语句,该对话输入内容可通过用户使用的客户端的输入窗口以文字形式或者语音形式输入,客户端可将输入的对话输入内容发送至与其通讯连接的电子设备上,利用该电子设备进行对话输入内容对应的对话实体的确定,也可以利用该客户端进行对话实体的确定,在此不进行限定;其中,对话实体可理解为需回应的实体特征,该实体特征是用来表明句子中的关键词语。
步骤S104,在知识图谱中查找与对话实体匹配的目标话题实体和目标话题实体对应的多个话题路径;其中,知识图谱包括话题实体以及话题实体间的有向关系线,有向关系线及其连接的话题实体构成话题路径,话题路径配置有基于对话统计数据确定的热度参数;
为了便于理解,图2示出了一种知识图谱的结构示意图,图2中的结构形式是由三元组(三元组包括头实体、关系、尾实体)形式的知识转换而成的,比如,三元组形式的知识为[“运动”,“引起”,“健康”],经转换后得到的知识图谱是以“运动”和“健康”作为两个话题实体,“引起”为这两个话题实体的有向关系线的有向图。
如图2所示,图中的圆形区域表示知识图谱中的话题实体,该话题实体与上述实体特征一样均是用来表明句子中的关键词语,圆形区域上的文字则表示话题实体的具体话题是什么,而每两个话题实体间的有向线段则表示两话题实体之间的关联关系,基于有向关系线及其连接的话题实体可构成话题路径,通常,话题路径可根据有向关系线的数量确定路径长度,比如,“爬上—>运动”、“爬上—>睡觉”之间的有向关系线只有一个,则该话题路径的路径长度为1,“爬上—>运动—>健身”之间的有向关系线有两个,则该话题路径的路径长度为2,“爬上—>运动—>减肥—>跑步”之间的有向关系线有三个,则该话题路径的路径长度为3,因此,以爬山为起点的话题路径可根据路径长度的不同,以及有向关系线关联的话题实体的不同确定出多个话题路径。
在本实施例中,话题路径不仅包括话题实体和有向关系线,还配置有基于对话统计数据确定的热度参数,该热度参数可用于表示该话题路径在对话统计数据中被谈论的程度,热度参数越大表示被谈论的越多,热度参数越小则表示被谈论的越少。
步骤S106,根据目标话题实体对应的多个话题路径的热度参数,从多个话题路径选择对话实体对应的目标话题路径;
步骤S108,根据目标话题路径获取对话输入内容的对话输出内容。
在知识图谱中将与对话实体相同的话题实体确定为目标话题实体,并且,在知识图谱中查找以该目标话题实体为起点的多个话题路径,基于每个话题路径的热度参数(即每个话题路径被谈论的程度),在查找到的多个话题路径中选取一个与对话实体对应的目标话题路径,基于目标话题路径上的话题实体获取对话输入内容的对话输出内容,该对话输出内容即为包含目标话题路径上话题实体的完整语句,在实际对话过程中,该对话输出内容需在客户端进行文字显示或语音播报,在此不进行限定。
本发明实施例提供了一种对话处理方法,其中,能够基于对话输入内容中的对话实体在包括话题实体以及话题实体间有向关系线的知识图谱中查找与对话实体匹配的目标话题实体和目标话题实体对应的多个话题路径,由于上述知识图谱中配置有热度参数,因此,查找到的话题路径上同样携带有热度参数,所以,可基于目标话题实体对应的多个话题路径的热度参数,从多个话题路径中选择对话实体对应的目标话题路径,由于目标话题路径上有话题实体,因此,可根据该目标话题路径上的话题实体获取对话输入内容的对话输出内容,以实现对话;本发明实施例基于对话统计数据得到的热度参数为目标话题路径的确定提供了选取依据,且,能够通过目标话题路径上的话题实体主动引导对话内容,而不仅仅根据对话输入内容给出机械性的应答,致使对话比较生动灵活,增加了对话的趣味性。
通常,热度参数包括话题实体对应的实体热度值和/或有向关系线对应的关系热度权重,上述热度参数的确定过程可通过步骤A1至步骤A3实现:
步骤A1,获取对话语料集;
该对话语料集可在微博、微信等网络即时通讯软件的对话数据中获取,该对话语料集中包括多组对话语料,每组对话语料包括询问语料和应答语料,比如,“我今天生病了”,“去看医生了吗?”为一组对话语料,在本实施例中,不对对话语料集包括的对话语料的数量,以及对话内容进行限定。
步骤A2,根据对话语料集确定对话统计数据;其中,对话统计数据包括:知识图谱中的话题实体和/或有向关系线对应的统计次数;
若对话统计数据中包括话题实体的统计次数,则需要统计对话语料集中各个话题实体对应的第一统计量。
该第一统计量即为各个话题实体在对话语料集中出现的次数,继续以“我今天生病了”,“去看医生了吗?”这组对话语料为例进行说明,其中,询问语料中的“生病”为对话头实体,应答语料中“看医生”为对话尾实体,如果在知识图谱中查找到“生病”话题实体,则给“生病”这个话题实体的计数加一,并且,在知识图谱中查找以“生病”为起点的所有话题路径,若“看医生”出现在查找的话题路径上则给“看医生”则一话题实体同样计数加一。对于图1中爬山、睡觉、运动等话题实体的统计过程同上,在此不进行一一赘述。
若对话统计数据中包括有向关系线对应的统计次数,则需要统计对话语料集中各个有向关系线对应的话题实体组的第二统计量。该第二统计量即为各个有向关系线对应的话题实体组包括该有向关系线的起始端对应的头话题实体和该有向关系线的结束端对应的尾话题实体在对话语料集中出现的次数。续接前例,如果在知识图谱中查找到的以“生病”为头话题实体的话题路径中有以“看医生”为尾话题实体的话题路径,则给关联“生病”和“看医生”这两个话题实体的有向关系线计数加一。对于图1中各个有向关系线的统计过程同上,在此不进行一一赘述。
步骤A3,根据对话统计数据确定知识图谱中的话题路径的热度参数。
其中,热度参数的具体过程可通过步骤B1至步骤B2实现:
步骤B1,从各个话题实体对应的第一统计量中选择第一最大值和第一最小值;
步骤B2,对于知识图谱中的每个话题路径,均根据第一最大值和第一最小值,以及该话题路径对应的话题实体的第一统计量设置该话题实体的热度参数。
基于各个话题实体对应的第一统计量中的第一最大值和第一最小值,对每个话题实体对应的第一统计量进行归一化计算,以得到各个话题实体的实体热度值。
假设话题实体w的第一统计量为x,则具体通过下式计算实体热度值:
Sw=(x–xmin)/(xmax–xmin);
其中,Sw表示话题实体w的实体热度值,x表示话题实体w的第一统计量,xmin表示各个话题实体对应的第一统计量中的第一最小值,xmax表示各个话题实体对应的第一统计量中的第一最大值。
上述热度参数的具体过程还可通过步骤C1至步骤C2实现:
步骤C1,从各个有向关系线对应的话题实体组的第二统计量中选择第二最大值和第二最小值;
步骤C2,对于知识图谱中的每个话题路径,均根据第二最大值和第二最小值,以及该话题路径对应的有向关系线对应的第二统计量设置该话题实体的热度参数。
基于各个有向关系线对应的话题实体组的第二统计量(即各个有向关系线对应的第二统计量)中的第一最大值和第一最小值,对每个有向关系线对应的第二统计量进行归一化计算,以得到各个有向关系线对应的关系热度权重,图1中仅示出了经上述计算得到的各个有向关系线对应的关系热度权重,各个话题实体对应的实体热度值未在图中标出。
假设有向关系线p的第二统计量为y,则具体通过下式计算关系热度权重:
Qp=(y–ymin)/(ymax–ymin);
其中,Qp表示有向关系线p的关系热度权重,y表示有向关系线p的第二统计量,ymin表示各个有向关系线对应的第二统计量中的第一最小值,ymax表示各个有向关系线对应的第二统计量中的第一最大值。
实施例提供了另一种对话处理方法,该方法在上述实施例的基础上实现;本实施例重点描述确定对话输入内容对应的对话实体,以及选取目标话题路径的具体实施方式。如图3所示的另一种对话处理方法的流程图,本实施例中的对话处理方法包括如下步骤:
步骤S302,将对话输入内容中包括的话题实体组成第一实体列表;
该第一实体列表中存储的是利用ner(name entity recognition,命名实体识别)技术从对话输入内容中识别出的话题实体,比如,“我肚子饿了,想吃包子”,这里识别到的话题实体为“肚子饿”和“包子”,所以,上述第一实体列表中存储有“肚子饿”和“包子”两个话题实体。
如果步骤S302中得到的第一实体列表为空,则本轮对话无需基于知识图谱产生话题路径,本轮对话可让对话生成模型根据的对话输入内容的内容来进行回复;如果步骤S302中得到的第一实体列表不为空,且存储多个话题实体,为了避免对同一对话实体的重复对话,则可基于历史话题路径从第一实体列表中选取与历史话题路径上的话题实体不匹配的话题实体。下列步骤S304-步骤S310具体给出了基于历史话题路径确定对话实体的过程。
步骤S304,获取对话输入内容的上文对话语料对应的历史话题路径;
上文对话语料为对话输入内容的历史轮对话语料,在本实施例中,历史轮数是一个可调的参数,比如只考虑距离对话输入内容较近的3轮对话语料,在此不进行限定。
步骤S306,将历史话题路径对应的话题实体组成第二实体列表;
步骤S308,将存在于第一实体列表且不存在于第二实体列表中的话题实体作为新话题实体;
步骤S310,根据新话题实体确定对话输入内容对应的对话实体;
将历史话题路径上的所有话题实体存储到第二实体列表中,若第一实体列表中只有一个话题实体未与第二实体列表中的话题实体匹配的成功,则将该话题实体作为新话题实体;如果第一实体列表中存在多个话题实体未与第二实体列表中的话题实体匹配的成功,则可从多个未匹配成功的话题实体中随机选取一个话题实体作为新话题实体,并将新话题实体确定为对话输入内容对应的对话实体。
续接前例,比如对话输入内容为“我肚子饿了,想吃包子”是第二轮对话,第一轮对话对应的历史话题路径为“肚子饿—>吃饭”,则第二实体列表存储有“肚子饿”和“吃饭”两个话题实体,由于第一实体列表中存储的“包子”不在第二实体列表中,因此,可选取“包子”为上述对话输入内容的对话实体。
若上述步骤S302只得到一个话题实体则可将该话题实体确定为对话实体,若步骤S302得到多个话题实体则采用上述方法确定对话实体。
步骤S312,在知识图谱中查找与对话实体匹配的目标话题实体和目标话题实体对应的多个话题路径;
上述步骤S312具体可通过步骤D1至步骤D2实现:
步骤D1,从知识图谱中查找与对话实体匹配的目标话题实体;
步骤D2,基于预设的搜索路径长度从知识图谱中搜索以目标话题实体为起点的多个话题路径。
在本实施例中,可设置搜索路径长度为1和2,若目标话题实体为“爬山”,则在图1的基础上,参照图4示出的另一种知识图谱的结构示意图,如图4所示,实线部分为在搜索路径长度范围内的话题实体和有向关系线,而虚线部分则表示不在搜索路径长度范围内的话题实体和有向关系线,在该知识图谱中基于上述搜索路径长度搜索到的以“爬山”为起点的六个话题路径分别为:“爬山—>运动”、“爬山—>睡觉”、“爬山—>运动—>健身”、“爬山—>运动—>喜欢”、“爬山—>运动—>健康”和“爬山—>运动—>减肥”。搜索路径长度可基于实际情况进行设置,在此不进行限定。
步骤S314,根据目标话题实体对应的多个话题路径的热度参数对多个话题路径排序;
步骤S316,根据排序结果确定第一候选路径集;
具体可根据热度参数中的话题实体对应的实体热度值和/或有向关系线对应的关系热度权重对上述多个话题路径进行排序,得到第一候选路径集。比如,利用有向关系线对应的关系热度权重对多个话题路径进行排序为例进行说明,由图1标出的各个有向关系线对应的关系热度权重可知,其中,“爬山—>运动”的话题路径包括一个有向关系线,该有向关系线对应的关系热度权重为0.3,“爬山—>睡觉”的有向关系线对应的关系热度权重为0.1、“爬山—>运动—>健身”的话题路径包括两个有向关系线,这两个有向关系线对应的关系热度权重之和0.5,同样地,“爬山—>运动—>喜欢”的有向关系线对应的关系热度权重之和为0.4,“爬山—>运动—>健康”的有向关系线对应的关系热度权重之和为0.4,“爬山—>运动—>减肥”的有向关系线对应的关系热度权重之和0.6,基于关系热度权重从大到小的排序规则对上述六个话题路径进行排序得到第一候选路径集。
其中,利用话题实体对应的实体热度值对多个话题路径进行排序的规则同上,将各个话题路径中包括的话题实体对应的实体热度值进行相加,之后,基于实体热度值之和从大到小的排序规则对上述多个话题路径进行排序得到第一候选路径集。
而利用话题实体对应的实体热度值和有向关系线对应的关系热度权重对多个话题路径进行排序的规则同上,将各个话题路径中包括的话题实体对应的实体热度值以及包括的有向关系线对应的关系热度权重进行相加,之后,基于实体热度值和关系热度权重之和从大到小的排序规则对上述多个话题路径进行排序得到第一候选路径集。
在排序中对于话题路径对应的话题实体对应的实体热度值和有向关系线对应的关系热度权重均相同的多个话题路径则可随机顺序排列,或者并列排序,在此不进行限定。
步骤S318,基于第一候选路径集确定目标话题路径;
在本实施例中,可利用以下确定方式从第一候选路径集确定目标话题路径:
确定方式一:从第一候选路径集选择热度参数最大的候选路径作为目标话题路径;其中,该热度参数最大不限于各个候选路径中包括的有向关系线对应的关系热度权重之和最大,或,各个候选路径中包括的话题实体对应的实体热度值之和最大,或,各个候选路径中包括的话题实体对应的实体热度值和有向关系线对应的关系热度权重之和最大。
续接前例,在上述搜索到的六个候选路径中,可将关系热度权重之和最大的候选路径作为目标话题路径,在图4的基础上,图5示出了另一种知识图谱的结构示意图,如图5所示,实线部分的话题实体和有向关系线为最终确定的目标话题路径,而虚线部分的话题实体和有向关系线为非目标话题路径部分,由于“爬山—>运动—>减肥”候选路径的关系热度权重之和最大,所以,将该候选路径作为目标话题路径。
确定方式二:从第一候选路径集选择与预存话题实体匹配度最高的候选路径作为目标话题路径;
如果电子设备中预存了话题实体,则可基于第一候选路径集中各个候选路径与预存话题实体的匹配度来确定目标话题路径,其中,候选路径上包含的话题实体与预存话题实体相匹配的数量越多则匹配度越高,在本实施例中,将匹配度最高的候选路径确定为目标话题路径。
需要说明的是,预存话题实体可以为用户或者机器人的兴趣爱好等话题实体,也可以是任意表征用户或者机器人的身份个性的话题实体,在此不进行限定。基于匹配度选取目标话题路径的目的是聊一些和机器人或者用户更为匹配的话题。
确定方式三:从第一候选路径集随机选择一条候选路径作为目标话题路径。
在确定目标话题路径的过程中还可以统计历史话题路径所涉及到的所有话题实体对第一候选路径集中候选路径进行筛选处理,通常在实施筛选之前,要排除掉各个候选路径的起始节点即目标话题实体,比如,某条候选路径“包子—>吃的—>餐厅”,我们只看其中的第二个和第三个话题实体,只要“吃的”和“餐厅”任何一个词出现在历史话题路径中,则将该候选路径从第一候选路径集中删除。在本实施例中不限于上述方式进行候选路径的筛选与确定,可根据实际需要设置具体筛选方式,在此不进行限定。
如果经上述筛选处理后的第一候选路径集为空,则本轮对话不采用话题路径进行回复,而是利用对话生成模型进行对话回复;如果经上述筛选处理后的第一候选路径集不为空,比如为:“包子—>吃的—>餐厅”,“包子—>吃的—>开心”,则将可在第一候选路径集中随机选取一条候选路径作为目标话题路径。
确定方式四:基于候选路径集中包括的话题实体构建的骨架路径确定目标话题路径,具体可通过步骤E1至步骤E5实现:
步骤E1,根据第一候选路径集中各个候选路径对应的实体热度值对多个话题实体进行排序;
可根据候选路径集中包括的各个不同的话题实体对应的实体热度值,按照实体热度值从大到小的顺序将多个不同的话题实体进行顺序排列。
步骤E2,根据排序结果确定候选话题实体集;
步骤E3,基于目标话题实体和候选话题实体集确定骨架路径;其中,骨架路径将目标话题实体作为骨架路径中的首话题实体和尾话题实体;
为了有效避免对话内容太过发散,在本实施例中,可设置首话题实体和尾话题实体都为目标话题实体骨架路径,使得对话的话题实体可以回到初始给定的话题实体即目标话题实体。
构建骨架路径的过程具体来说就是将目标话题实体和候选话题实体集中的候选话题实体按照闭合环路组和而成,具体地,该骨架路径的首尾话题实体都为目标话题实体,中间的话题实体为候选话题实体集中顺序排列的候选话题实体+倒序排列的候选话题实体,注意清除相邻的相同节点,得到最终的骨架路径,比如,候选话题实体集中包括“肚子饿”,“吃的”,“运动”,“减肥”这四个候选话题实体,“包子”为目标话题实体,则确定出的骨架路径为:“包子—>肚子饿—>吃的—>运动—>减肥—>运动—>吃的—>肚子饿—>包子”。
步骤E4,在骨架路径相邻的两个骨架话题实体间扩充话题实体;
具体扩充话题实体的过程可由步骤F1至步骤F4实现:
步骤F1,获取骨架路径中相邻的第一骨架话题实体和第二骨架话题实体;其中,第一骨架话题实体通过有向关系线指向第二骨架话题实体;
在本实施例中可在任意相邻的两骨架话题实体之间进行话题实体扩充,比如,在上述骨架路径中可在“包子”与“肚子饿”之间扩充话题实体,“肚子饿”和“吃的”之间扩充话题实体,“吃的”和“运动”之间扩充话题实体,具体扩充话题实体的两骨架话题实体可根据需要进行选取,在此不进行限定。
步骤F2,以第一骨架话题实体为搜索起点,以第二骨架话题实体为搜索终点,在知识图谱中搜索包括第一骨架话题和第二骨架话题实体的话题路径,得到第二候选路径集;
比如,以“包子”为搜索起点,“肚子饿”为搜索终点,在知识图谱中搜索包括这两个话题实体的话题路径,得到第二候选路径集。
步骤F3,基于第二候选路径集确定扩充话题路径;
若经步骤F2搜索得到的话题路径仅有一个则将该话题路径确定为扩充话题路径;若经步骤F2搜索得到的话题路径为多个时,则可通过以下方式之一确定扩充话题路径分别为:从第二候选路径集选择热度参数最大的候选路径作为扩充话题路径;从第二候选路径集随机选择一条候选路径作为扩充话题路径。该确定扩充话题路径的过程与上述基于第一候选路径集确定目标话题路径的过程相同,所以,不在进行赘述。
步骤F4,将扩充话题路径包括的话题实体扩充到第一骨架话题实体和第二骨架话题实体之间。
比如,得到的扩充话题路径为:“包子—>吃的—>便利商店—>肚子饿”,则只需将“吃的”和“便利商店”按照上述顺序扩充到“包子”和“肚子饿”之间。
除了上述扩充骨架路径之外,还可以在骨架路径中的任意两个骨架话题实体之间扩充预设数量的指定话题实体。
该指定话题实体可为具体的话题实体,比如“吃的”、“便利商店”;通常,为了增加对话生成模型的发挥空间,而不局限于给定的话题实体,可在某些对话轮数中不基于目标话题路径中话题实体给定话题,从而让对话生成模型只根据待对话预料来产生对话,具体来说,可以固定或者随机地,在骨架路径中的相邻的两骨架话题实体之间扩充预设数量的空话题,假如,骨架路径为:“包子—>吃的—>便利商店—>吃的—>包子”,路径长度为5,在上述相邻的两两骨架话题实体之间均扩充空话题,得到扩充后的骨架路径为:“包子—>None—>吃的—>None—>便利商店—>None—>吃的—>None—>包子”,这里的None表明空话题即该指定话题实体为空,没有任何实质性的含义。其中,空话题扩充的位置以及扩充的数量可以根据实际需要进行设置,在此不进行限定。
步骤E5,将扩充话题实体后的骨架路径确定为目标话题路径。
步骤S320,根据目标话题路径获取对话输入内容的对话输出内容。
通常,上述对话输出内容是由对话生成模型得到的,该对话生成模型是基于对话语料训练集对神经网络模型训练得到,将目标话题路径和对话输入内容输入对话生成模型,得到对话输入内容的对话输出内容。
具体实现时,将对话输入内容以及从目标话题路径中按照路径长度顺序选取一个或多个话题实体输入上述对话生成模型,使得对话生成模型可基于话题实体得到对话输入内容对应的对话输出内容。比如,对话输入内容“医生给我开了感冒药”对应的目标话题路径为:“感冒药—>休息—>别上班—>睡觉”,若路径长度为1,则由对话生成模型得到的对话输出内容为“好好休息”,若路径长度为2,则由对话生成模型得到的对话输出内容为“好好休息,明天就别上班了吧”。具体输入上述对话生成模型的话题实体可根据实际需要进行设置,不对此作出限定。
本发明实施例提供的上述对话处理方法,能够基于历史话题路径从对话输入内容包括的话题实体筛选出对话实体,可有效避免基于对话实体确定出的目标话题路径与上文对话语料出现重复对话的情况,进一步,在确定目标话题实体的过程中应用热度参数进行对多个话题路径进行排序提供了数据依据,使得获取到的目标话题实体更具合理性,且,将目标话题路径和对话输入内容输入对话生成模型,得到对话输入内容的对话输出内容,利用目标话题路径上的话题实体引导对话内容,而使得对话生成模型不仅仅根据对话输入内容给出机械性的应答,致使对话比较生动灵活,增加了对话的趣味性。
本发明实施例提供的上述方法不仅可应用于与单个用户或单个机器人之间的对话,还可以应用于多个机器人之间的对话,将上述确定出的目标话题路径分享给对话中的其它机器人,以使其它机器人根据目标话题路径和当前的对话内容提供下一个对话输出内容。
比如,共有3个对话机器人,目标话题路径为:“包子—>肚子饿—>吃的—>运动—>减肥—>运动—>吃的—>肚子饿—>包子”,对话的路径长度设为1,若机器人1输入的对话输入内容为“肚子饿了,想吃包子”,则机器人2根据机器人1的对话输入内容确定出目前需要基于目标话题路径中的“吃的”这一话题实体进行对话,因此,机器人2的对话输出内容可为“你想吃的就只有包子吗?”,机器人3根据机器人2的对话输入内容确定出目前需要基于目标话题路径中的“运动”这一话题实体进行对话,因此,机器人3的对话输出内容可为“吃完还得运动”,对于后续对话在此不进行一一列举,在本实施例中,多个机器人共享目标话题路径的聊天方式,可以增强多轮对话的话题连贯性。
除了共享目标话题路径实现多机器人聊天之外,还可以将目标话题路径在多个机器人对话时,给每个机器人一个或多个目标话题路径上的话题实体,以实现连贯话题。
对应于上述对话处理方法实施例,本发明实施例提供了一种对话处理装置,图6示出了一种对话处理装置的结构示意图,如图6所示,该装置包括:
确定模块602,确定对话输入内容对应的对话实体;
查找模块604,用于在知识图谱中查找与对话实体匹配的目标话题实体和目标话题实体对应的多个话题路径;其中,知识图谱包括话题实体以及话题实体间的有向关系线,有向关系线及其连接的话题实体构成话题路径,话题路径配置有基于对话统计数据确定的热度参数;
选择模块606,用于根据目标话题实体对应的多个话题路径的热度参数,从多个话题路径选择对话实体对应的目标话题路径;
获取模块608,用于根据目标话题路径获取对话输入内容的对话输出内容。
本发明实施例提供了一种对话处理装置,其中,能够基于对话输入内容中的对话实体在包括话题实体以及话题实体间有向关系线的知识图谱中查找与对话实体匹配的目标话题实体和目标话题实体对应的多个话题路径,由于上述知识图谱中配置有热度参数,因此,查找到的话题路径上同样携带有热度参数,所以,可基于目标话题实体对应的多个话题路径的热度参数,从多个话题路径中选择对话实体对应的目标话题路径,由于目标话题路径上有话题实体,因此,可根据该目标话题路径上的话题实体获取对话输入内容的对话输出内容,以实现对话;本发明基于对话统计数据得到的热度参数为目标话题路径的确定提供了选取依据,且,能够通过目标话题路径上的话题实体主动引导对话内容,而不仅仅根据对话输入内容给出机械性的应答,致使对话比较生动灵活,增加了对话的趣味性。
其中,上述热度参数包括话题实体对应的实体热度值和/或有向关系线对应的关系热度权重;确定热度参数的过程包括:获取对话语料集;根据对话语料集确定对话统计数据;其中,对话统计数据包括:知识图谱中的话题实体和/或有向关系线对应的统计次数;根据对话统计数据确定知识图谱中的话题路径的热度参数。
上述根据对话语料集确定对话统计数据的过程包括:统计对话语料集中各个话题实体对应的第一统计量;统计对话语料集中各个有向关系线对应的话题实体组的第二统计量,其中,有向关系线对应的话题实体组包括该有向关系线的起始端对应的头话题实体和该有向关系线的结束端对应的尾话题实体。
上述根据对话统计数据确定知识图谱中的话题路径的热度参数的过程包括:从各个话题实体对应的第一统计量中选择第一最大值和第一最小值;对于知识图谱中的每个话题路径,均根据第一最大值和第一最小值,以及该话题路径对应的话题实体的第一统计量设置该话题实体的热度参数。
上述根据对话统计数据确定知识图谱中的话题路径的热度参数的过程包括:从各个有向关系线对应的话题实体组的第二统计量中选择第二最大值和第二最小值;对于知识图谱中的每个话题路径,均根据第二最大值和第二最小值,以及该话题路径对应的有向关系线对应的第二统计量设置该话题实体的热度参数。
上述确定模块602还用于,将对话输入内容中包括的话题实体组成第一实体列表;获取对话输入内容的上文对话语料对应的历史话题路径;将历史话题路径对应的话题实体组成第二实体列表;将存在于第一实体列表且不存在于第二实体列表中的话题实体作为新话题实体;根据新话题实体确定对话输入内容对应的对话实体。
上述查找模块604还用于,从知识图谱中查找与对话实体匹配的目标话题实体;基于预设的搜索路径长度从知识图谱中搜索以目标话题实体为起点的多个话题路径。
上述选择模块606还用于,根据目标话题实体对应的多个话题路径的热度参数对多个话题路径排序;根据排序结果确定第一候选路径集;基于第一候选路径集确定目标话题路径。
上述选择模块606还用于,从第一候选路径集选择热度参数最大的候选路径作为目标话题路径;从第一候选路径集选择与预存话题实体匹配度最高的候选路径作为目标话题路径;从第一候选路径集随机选择一条候选路径作为目标话题路径。
上述选择模块606还用于,根据第一候选路径集中各个候选路径对应的实体热度值对多个话题实体进行排序;根据排序结果确定候选话题实体集;基于目标话题实体和候选话题实体集确定骨架路径;其中,骨架路径将目标话题实体作为骨架路径中的首话题实体和尾话题实体;在骨架路径相邻的两个骨架话题实体间扩充话题实体;将扩充话题实体后的骨架路径确定为目标话题路径。
上述选择模块606还用于,获取骨架路径中相邻的第一骨架话题实体和第二骨架话题实体;其中,第一骨架话题实体通过有向关系线指向第二骨架话题实体;以第一骨架话题实体为搜索起点,以第二骨架话题实体为搜索终点,在知识图谱中搜索包括第一骨架话题和第二骨架话题实体的话题路径,得到第二候选路径集;基于第二候选路径集确定扩充话题路径;将扩充话题路径包括的话题实体扩充到第一骨架话题实体和第二骨架话题实体之间。
上述选择模块606还用于,从第二候选路径集选择热度参数最大的候选路径作为扩充话题路径;从第二候选路径集随机选择一条候选路径作为扩充话题路径。
上述选择模块606还用于,在骨架路径中的任意两个骨架话题实体之间扩充预设数量的指定话题实体。
上述获取模块608还用于,将目标话题路径和对话输入内容输入对话生成模型,得到对话输入内容的对话输出内容。
上述装置应用于多个机器人之间的对话,因此,基于上述对话处理装置,本发明实施例还提供了另一种对话处理装置,参见图7所示的对话处理装置的结构示意图,该对话处理装置除了包括图6所示的结构之外,还包括与获取模块608连接的分享模块702,用于将目标话题路径分享给对话中的其它机器人,以使其它机器人根据目标话题路径和当前的对话内容提供下一个对话内容。
本发明实施例提供的对话处理装置,与上述实施例提供的对话处理方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
本发明实施例还提供了一种电子设备,如图8所示,为该电子设备的结构示意图,其中,该电子设备包括处理器121和存储器120,该存储器120存储有能够被该处理器121执行的计算机可执行指令,该处理器121执行该计算机可执行指令以实现上述对话处理方法。
在图8示出的实施方式中,该电子设备还包括总线122和通信接口123,其中,处理器121、通信接口123和存储器120通过总线122连接。
其中,存储器120可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口123(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。总线122可以是ISA(IndustryStandard Architecture,工业标准体系结构)总线、PCI(Peripheral ComponentInterconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线122可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
处理器121可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器121中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器121可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DigitalSignal Processor,简称DSP)、专用集成电路(Application Specific IntegratedCircuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器121读取存储器中的信息,结合其硬件完成前述实施例的对话处理方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令在被处理器调用和执行时,该计算机可执行指令促使处理器实现上述游戏控制方法,具体实现可参见前述对话处理方法实施例,在此不再赘述。
本发明实施例所提供的对话处理方法、装置和电子设备的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对步骤、数字表达式和数值并不限制本发明的范围。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (18)

1.一种对话处理方法,其特征在于,所述方法包括:
确定对话输入内容对应的对话实体;
在知识图谱中查找与所述对话实体匹配的目标话题实体和所述目标话题实体对应的多个话题路径;其中,所述知识图谱包括话题实体以及话题实体间的有向关系线,所述有向关系线及其连接的话题实体构成话题路径,所述话题路径配置有基于对话统计数据确定的热度参数;其中,所述热度参数用于表示该话题路径在对话统计数据中被谈论的程度;
根据所述目标话题实体对应的多个话题路径的热度参数,从所述多个话题路径选择所述对话实体对应的目标话题路径;
根据所述目标话题路径获取所述对话输入内容的对话输出内容。
2.根据权利要求1所述的方法,其特征在于,所述热度参数包括所述话题实体对应的实体热度值和/或所述有向关系线对应的关系热度权重;
所述方法还包括:
获取对话语料集;
根据所述对话语料集确定对话统计数据;其中,所述对话统计数据包括:所述知识图谱中的话题实体和/或有向关系线对应的统计次数;
根据所述对话统计数据确定所述知识图谱中的话题路径的热度参数。
3.根据权利要求2所述的方法,其特征在于,根据所述对话语料集确定对话统计数据的步骤,包括:
统计所述对话语料集中各个话题实体对应的第一统计量;
统计所述对话语料集中各个有向关系线对应的话题实体组的第二统计量,其中,所述有向关系线对应的话题实体组包括该有向关系线的起始端对应的头话题实体和该有向关系线的结束端对应的尾话题实体。
4.根据权利要求3所述的方法,其特征在于,根据所述对话统计数据确定所述知识图谱中的话题路径的热度参数的步骤,包括:
从各个所述话题实体对应的第一统计量中选择第一最大值和第一最小值;
对于所述知识图谱中的每个话题路径,均根据所述第一最大值和所述第一最小值,以及该话题路径对应的话题实体的第一统计量设置该话题实体的热度参数。
5.根据权利要求3所述的方法,其特征在于,根据所述对话统计数据确定所述知识图谱中的话题路径的热度参数的步骤,包括:
从各个所述有向关系线对应的话题实体组的第二统计量中选择第二最大值和第二最小值;
对于所述知识图谱中的每个话题路径,均根据所述第二最大值和所述第二最小值,以及该话题路径对应的有向关系线对应的第二统计量设置该话题实体的热度参数。
6.根据权利要求1所述的方法,其特征在于,确定所述对话输入内容对应的对话实体的步骤,包括:
将所述对话输入内容中包括的话题实体组成第一实体列表;
获取所述对话输入内容的上文对话语料对应的历史话题路径;
将所述历史话题路径对应的话题实体组成第二实体列表;
将存在于所述第一实体列表且不存在于所述第二实体列表中的话题实体作为新话题实体;
根据所述新话题实体确定所述对话输入内容对应的对话实体。
7.根据权利要求1所述的方法,其特征在于,在所述知识图谱中查找与所述对话实体匹配的目标话题实体和所述目标话题实体对应的多个话题路径的步骤,包括:
从所述知识图谱中查找与所述对话实体匹配的目标话题实体;
基于预设的搜索路径长度从所述知识图谱中搜索以所述目标话题实体为起点的多个话题路径。
8.根据权利要求1所述的方法,其特征在于,根据所述目标话题实体对应的多个话题路径的热度参数,从所述多个话题路径选择所述对话实体对应的目标话题路径的步骤,包括:
根据所述目标话题实体对应的多个话题路径的热度参数对多个所述话题路径排序;
根据排序结果确定第一候选路径集;
基于所述第一候选路径集确定目标话题路径。
9.根据权利要求8所述的方法,其特征在于,基于所述第一候选路径集确定目标话题路径的步骤,包括以下之一:
从所述第一候选路径集选择热度参数最大的候选路径作为目标话题路径;
从所述第一候选路径集选择与预存话题实体匹配度最高的候选路径作为目标话题路径;
从所述第一候选路径集随机选择一条候选路径作为目标话题路径。
10.根据权利要求8所述的方法,其特征在于,基于所述第一候选路径集确定目标话题路径的步骤,包括:
根据所述第一候选路径集中各个候选路径对应的实体热度值对多个话题实体进行排序;
根据排序结果确定候选话题实体集;
基于所述目标话题实体和所述候选话题实体集确定骨架路径;其中,所述骨架路径将所述目标话题实体作为所述骨架路径中的首话题实体和尾话题实体;
在所述骨架路径相邻的两个骨架话题实体间扩充话题实体;
将扩充话题实体后的所述骨架路径确定为目标话题路径。
11.根据权利要求10所述的方法,其特征在于,在所述骨架路径相邻的两个骨架话题实体间扩充话题实体的步骤,包括:
获取所述骨架路径中相邻的第一骨架话题实体和第二骨架话题实体;其中,所述第一骨架话题实体通过有向关系线指向所述第二骨架话题实体;
以所述第一骨架话题实体为搜索起点,以所述第二骨架话题实体为搜索终点,在所述知识图谱中搜索包括所述第一骨架话题和所述第二骨架话题实体的话题路径,得到第二候选路径集;
基于所述第二候选路径集确定扩充话题路径;
将所述扩充话题路径包括的话题实体扩充到所述第一骨架话题实体和所述第二骨架话题实体之间。
12.根据权利要求11所述的方法,其特征在于,基于所述第二候选路径集确定扩充话题路径的步骤,包括以下之一:
从所述第二候选路径集选择热度参数最大的候选路径作为扩充话题路径;
从所述第二候选路径集随机选择一条候选路径作为扩充话题路径。
13.根据权利要求10所述的方法,其特征在于,在所述骨架路径相邻的两个骨架话题实体间扩充话题实体的步骤,还包括:
在所述骨架路径中的任意两个骨架话题实体之间扩充预设数量的指定话题实体。
14.根据权利要求1所述的方法,其特征在于,根据所述目标话题路径获取所述对话输入内容的对话输出内容的步骤,包括:
将所述目标话题路径和所述对话输入内容输入对话生成模型,得到所述对话输入内容的对话输出内容。
15.根据权利要求1所述的方法,其特征在于,所述方法应用于多个机器人之间的对话,所述方法还包括:
将所述目标话题路径分享给对话中的其它机器人,以使所述其它机器人根据所述目标话题路径和当前的对话内容提供下一个对话内容。
16.一种对话处理装置,其特征在于,所述装置包括:
确定模块,用于确定对话输入内容对应的对话实体;
查找模块,用于在知识图谱中查找与所述对话实体匹配的目标话题实体和所述目标话题实体对应的多个话题路径;其中,所述知识图谱包括话题实体以及话题实体间的有向关系线,所述有向关系线及其连接的话题实体构成话题路径,所述话题路径配置有基于对话统计数据确定的热度参数;其中,所述热度参数用于表示该话题路径在对话统计数据中被谈论的程度;
选择模块,用于根据所述目标话题实体对应的多个话题路径的热度参数,从所述多个话题路径选择所述对话实体对应的目标话题路径;
获取模块,用于根据所述目标话题路径获取所述对话输入内容的对话输出内容。
17.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现权利要求1至15任一项所述的方法。
18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令在被处理器调用和执行时,计算机可执行指令促使处理器实现权利要求1至15任一项所述的方法。
CN202110242777.9A 2021-03-04 2021-03-04 对话处理方法、装置及电子设备 Active CN112988994B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110242777.9A CN112988994B (zh) 2021-03-04 2021-03-04 对话处理方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110242777.9A CN112988994B (zh) 2021-03-04 2021-03-04 对话处理方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN112988994A CN112988994A (zh) 2021-06-18
CN112988994B true CN112988994B (zh) 2023-03-21

Family

ID=76352755

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110242777.9A Active CN112988994B (zh) 2021-03-04 2021-03-04 对话处理方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN112988994B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113268580B (zh) * 2021-07-15 2021-11-09 中国平安人寿保险股份有限公司 会话主题迁移路径挖掘方法、装置、计算机设备及介质

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050302B (zh) * 2014-07-10 2017-05-24 华东师范大学 一种基于图谱模型的话题探测系统
US11442977B2 (en) * 2015-03-24 2022-09-13 International Business Machines Corporation Augmenting search queries based on personalized association patterns
EP3411811A4 (en) * 2016-02-03 2019-11-13 Global Software Innovation Pty Ltd SYSTEMS AND METHODS FOR USING ENTITY / ASSOCIATION MODEL DATA TO IMPROVE A USER INTERFACE ENGINE
CN105931638B (zh) * 2016-04-26 2019-12-24 北京光年无限科技有限公司 面向智能机器人的对话系统数据处理方法及装置
CN110019722B (zh) * 2017-12-21 2023-11-24 株式会社理光 对话模型的回复排序方法、装置及计算机可读存储介质
CN109065173B (zh) * 2018-07-10 2022-04-19 北京科技大学 知识路径的获取方法
CN111581390B (zh) * 2019-02-19 2023-02-28 北京嘀嘀无限科技发展有限公司 一种知识图谱的构建方法、装置以及电子设备
CN110046238B (zh) * 2019-03-29 2024-03-26 华为技术有限公司 对话交互方法、图形用户界面、终端设备以及网络设备
CN110413886A (zh) * 2019-07-17 2019-11-05 海信集团有限公司 一种兴趣点展示方法及装置
CN110704596B (zh) * 2019-09-29 2023-03-31 北京百度网讯科技有限公司 基于话题的对话方法、装置和电子设备
CN111026932B (zh) * 2019-12-20 2023-05-26 北京百度网讯科技有限公司 人机对话交互方法、装置、电子设备和存储介质
CN111460120A (zh) * 2020-03-31 2020-07-28 河北省讯飞人工智能研究院 一种对话管理方法、装置、设备及存储介质
CN112199473A (zh) * 2020-10-16 2021-01-08 上海明略人工智能(集团)有限公司 一种知识问答系统中的多轮对话方法与装置
CN112182197A (zh) * 2020-11-09 2021-01-05 北京明略软件系统有限公司 话术推荐方法、装置、设备及计算机可读介质

Also Published As

Publication number Publication date
CN112988994A (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
Bosselut et al. Dynamic neuro-symbolic knowledge graph construction for zero-shot commonsense question answering
CN110121706B (zh) 提供会话中的响应
CN107797984B (zh) 智能交互方法、设备及存储介质
CN108319599B (zh) 一种人机对话的方法和装置
CN109643325B (zh) 在自动聊天中推荐朋友
CN108363492B (zh) 一种人机交互方法及交互机器人
WO2019174428A1 (zh) 答复信息的获取方法及装置
CN111831798A (zh) 信息处理方法、装置、电子设备及计算机可读存储介质
CN109215630A (zh) 实时语音识别方法、装置、设备及存储介质
Morris et al. Identifying Sexual Predators by SVM Classification with Lexical and Behavioral Features.
CN111052107A (zh) 对话中的主题引导
CN112988994B (zh) 对话处理方法、装置及电子设备
Blankendaal et al. A temporal-causal modelling approach to integrated contagion and network change in social networks
CN103020416A (zh) 用于多用户联网游戏的好友推荐的方法和设备
CN111967645B (zh) 一种社交网络信息传播范围预测方法及系统
CN109492085A (zh) 基于数据处理的答案确定方法、装置、终端及存储介质
CN112528046B (zh) 新的知识图谱的构建方法、装置和信息检索方法、装置
CN110188123A (zh) 用户匹配方法及设备
CN111767386B (zh) 对话处理方法、装置、电子设备及计算机可读存储介质
CN110209704B (zh) 用户匹配方法及设备
CN112581203A (zh) 在会话中提供解释性产品推荐
Sadler Making a swap: network formation with increasing marginal costs
Brandstetter et al. Robots will dominate the use of our language
CN113836444A (zh) 一种线性时间好友推荐方法、系统、终端以及存储介质
Winters Modelling mutually interactive fictional character conversational agents

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant