CN110879837B - 一种信息处理方法及装置 - Google Patents

一种信息处理方法及装置 Download PDF

Info

Publication number
CN110879837B
CN110879837B CN201811036850.1A CN201811036850A CN110879837B CN 110879837 B CN110879837 B CN 110879837B CN 201811036850 A CN201811036850 A CN 201811036850A CN 110879837 B CN110879837 B CN 110879837B
Authority
CN
China
Prior art keywords
information
historical
user
group
request information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811036850.1A
Other languages
English (en)
Other versions
CN110879837A (zh
Inventor
公张睿
邓一萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201811036850.1A priority Critical patent/CN110879837B/zh
Publication of CN110879837A publication Critical patent/CN110879837A/zh
Application granted granted Critical
Publication of CN110879837B publication Critical patent/CN110879837B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及通信技术领域,公开了一种信息处理方法及装置,其中方法包括:服务器获取用户的对话信息,并确定用户在预设时间段内的至少一组历史对话信息与对话信息的相似程度;若至少一组历史对话信息与对话信息的相似程度大于第一阈值且小于等于第二阈值,则服务器向用户侧客户端设备发送引导信息,引导信息用于引导用户提供请求信息的关联信息。采用上述方法,服务器在获取到用户的请求信息对应的应答信息后,先判断用户的对话信息与历史对话信息的相似程度,若相似程度在上述范围内,则向用户侧客户端设备发送引导信息,从而可基于用户补充的关联信息来进一步理解用户的请求信息,并向用户返回满足用户期望的应答信息,提高用户体验。

Description

一种信息处理方法及装置
技术领域
本申请实施例涉及通信技术领域,尤其涉及一种信息处理方法及装置。
背景技术
对话系统(dialogue system,DS)指能够与人进行连贯对话的计算机系统。依据是否有特定任务,对话系统可分为两大类:(1)非任务导向型对话系统(non task-orientedDS),指与用户进行闲聊的对话系统,比如常见的聊天机器人,没有特定领域或待完成的任务,其对话范围属于开放域;(2)任务导向型对话系统(task-oriented DS),指帮助用户完成某领域内的具体任务的对话系统,其对话范围属于封闭域。依据对话轮次,对话系统也可分为两大类:(1)单轮对话系统(single-turn DS),指根据用户的单次输入,生成匹配相应意图的输出,即一问一答的问答模式;(2)多轮对话系统(multi-turn DS),指系统可以引导用户输入,通过与用户多轮次的问答,生成匹配用户完整意图的输出。
随着互联网的飞速发展,对话系统的应用越来越广泛。以任务导向型对话系统为例,用户的输入可以是询问天气、订购机票、医疗问诊等请求信息,对话系统可根据用户的请求信息,反馈给满足用户需求的应答信息。例如,用户输入的请求信息可以是“北京明天的天气怎么样”,对话系统可以通过搜索预设数据库并反馈给用户的应答信息为“北京明天的天气为晴转多云”。由此可知,对于对话系统来说,准确识别用户的请求信息显得至关重要,若对话系统无法准确理解用户的语义,则可能会从预设数据库中搜索到不合适的应答信息反馈给用户,从而降低了人机对话的质量,导致用户体验不佳。
发明内容
有鉴于此,本申请提供了一种信息处理方法及装置,用于提高对话系统理解用户的请求信息的准确度。
第一方面,本申请实施例提供了一种信息处理方法,所述方法包括:
服务器获取用户的对话信息,并确定所述用户在预设时间段内的至少一组历史对话信息与所述对话信息的相似程度;其中,所述对话信息包括所述用户的请求信息和所述请求信息对应的应答信息;所述至少一组历史对话信息中的任一组历史对话信息包括所述用户的历史请求信息和所述历史请求信息对应的历史应答信息;
若所述至少一组历史对话信息与所述对话信息的相似程度大于第一阈值且小于等于第二阈值,则所述服务器向用户侧客户端设备发送引导信息,所述引导信息用于引导用户提供所述请求信息的关联信息;若所述至少一组历史对话信息与所述对话信息的相似程度小于等于所述第一阈值,则所述服务器向所述用户侧客户端设备发送第一消息,所述第一消息中包括所述应答信息,所述第一消息用于指示所述用户侧客户端设备将所述应答信息呈现给所述用户;若所述至少一组历史对话信息与所述对话信息的相似程度大于所述第二阈值,则所述服务器向人工客服侧客户端设备发送第二消息,所述第二消息用于为所述用户转接人工客服。
如此,服务器在获取到用户的对话信息(可以理解为当前对话信息)后,先判断用户的对话信息与历史对话信息的相似程度,若相似程度较高(比如大于第一阈值小于等于第二阈值),则服务器可向用户侧客户端设备发送引导信息,以引导用户补充请求信息的关联信息,从而使得服务器可以基于用户补充的关联信息来进一步理解用户的请求信息,以便于向用户返回满足用户期望的应答信息。也就是说,本申请实施例中在发现未能准确理解用户的语义的情形时,可以先对用户进行适当的引导,尽可能使在预设数据库中找到正确的应答信息返回给用户,避免直接转接人工客服而导致人工客服侧不必要的资源浪费。若相似程度比较低(比如小于等于第一阈值),则说明当前请求信息不是用户重复性发出的提问,而是一个新的提问,此时服务器可以将请求信息对应的应答信息发送给用户侧客户端设备。若相似程度非常高(比如大于第二阈值),则说明用户可能已经重复提问多次,此时可以为用户转接人工客服,以便于由人工客服为用户提供满足用户期望的答案。
在一种可能的设计中,所述服务器确定所述至少一组历史对话信息与所述对话信息的相似程度,包括:
所述服务器根据所述至少一组历史对话信息中的一组或多组第一历史对话信息包括的历史应答信息和所述应答信息的相似度,得到第一相似程度;所述第一历史对话信息包括的历史请求信息与预设数据库中的预设请求信息的相似度小于等于第三阈值;
所述服务器根据所述至少一组历史对话信息中的一组或多组第二历史对话信息包括的历史请求信息和所述请求信息的相似度,得到第二相似程度;所述第二历史对话信息包括的历史应答信息与所述应答信息的相似度小于等于第四阈值;
所述服务器根据所述第一相似程度和所述第二相似程度得到所述至少一组历史对话信息与所述对话信息的相似程度。
如此,采用上述方法,在具体计算至少一组历史对话信息与所述对话信息的相似程度时,分别将历史应答信息和应答信息进行比较、将历史请求信息和请求信息进行比较,从而从两个角度来进行综合性衡量,使得计算得到的相似程度较为准确合理;在计算第一相似程度时,考虑到若某一历史对话信息中包括的历史请求信息与预设数据库中的预设请求信息相似度较高(大于第三阈值),则说明该历史请求信息被对话准确理解的可能性很大(即被错误理解的可能性较小),因此,在计算第一相似程度时,可排除该历史对话信息,从而提高第一相似程度的准确性;由于在计算第一相似程度时,已充分考虑历史应答信息与应答信息的相似度大于第四阈值的历史对话信息,因此在计算第二相似程度时,可以排除上这些历史对话信息,从而提高第二相似程度的准确性。
在一种可能的设计中,所述服务器确定所述用户在预设时间段内的至少一组历史对话信息与所述对话信息的相似程度之前,还包括:
所述服务器确定所述至少一组历史对话信息中的各历史请求信息与所述请求信息的相似度;以及确定与所述请求信息的相似度大于第五阈值的历史请求信息中存在与所述请求信息不是关联关系的历史请求信息。
如此,服务器可以先根据至少一组历史对话信息中的各历史请求信息与所述请求信息的相似度,判断是否存在与所述请求信息的相似度大于第五阈值的历史请求信息,若存在,则进一步判断与所述请求信息的相似度大于第五阈值的历史请求信息中是否存在与所述请求信息不是关联关系的历史请求信息,若存在,则确定所述用户在预设时间段内的至少一组历史对话信息与所述对话信息的相似程度。采用上述方式,可以有针对性地确定至少一组历史对话信息与所述对话信息的相似程度;针对于不存在与所述请求信息的相似度大于第五阈值的历史请求信息的情形,或者,与所述请求信息的相似度大于第五阈值的历史请求信息中不存在与所述请求信息不是关联关系的历史请求信息的情形,则可以直接向用户侧客户端设备返回应答信息,而无需再确定相似程度,从而提高响应用于的速度。
在一种可能的设计中,所述服务器向所述用户侧客户端设备发送第一消息之后,还包括:
所述服务器将所述对话信息标记为已处理对话信息。
在一种可能的设计中,所述服务器向人工客服侧客户端设备发送第二消息之后,还包括:
所述服务器对所述至少一组历史对话信息进行处理,并将处理后的信息和所述请求信息发送给所述人工客服侧客户端设备;
其中,所述服务器对所述至少一组历史对话信息进行处理,包括以下至少一项:
所述服务器根据所述至少一组历史对话信息中的每组历史对话信息所属的领域,从所述至少一组历史对话信息中筛选出与所述请求信息所属的领域相同的历史对话信息,如此,可以过滤掉与请求信息的领域完全不同的历史对话信息,从而使得人工客服可以有针对性地查看历史对话信息;或者,
所述服务器根据所述至少一组历史对话信息中的每组历史对话信息所属的领域,对所述至少一组历史对话信息进行分类,从而便于人工客服在查看时可根据需要进行选择;或者,
所述服务器将所述至少一组历史对话信息中被标记为已处理对话信息的历史对话信息设置为折叠状态,其中,处于所述折叠状态的历史对话信息经人工客服触发后展开显示;或者,
所述服务器根据所述至少一组历史对话信息中的历史请求信息与所述请求信息的相似度,对所述至少一组历史对话信息中的历史请求信息进行标注,比如,可以根据历史请求细腻与请求信息的相似度,使用不同的颜色对历史请求信息进行标注,从而方便人工客服定位。
在一种可能的设计中,所述引导信息中包括第三历史对话信息;所述第三历史对话信息中的历史请求信息与所述请求信息的相似度大于第六阈值。
第二方面,本申请实施例提供一种装置,该装置可以是服务器,或者也可以是设置在服务器中的半导体芯片。该装置具有实现上述第一方面的各种可能的实现方式的功能。该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的单元或模块。
第三方面,本申请实施例一种装置,包括:处理器和存储器;该存储器用于存储计算机执行指令,当该装置运行时,该处理器执行该存储器存储的该计算机执行指令,以使该装置执行如上述第一方面或第一方面中任一所述的信息处理方法。
第四方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
第五方面,本申请实施例还提供一种包括指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。
附图说明
图1为本申请实施例适用的一种可能的对话系统架构示意图;
图2为本申请实施例提供的一种信息处理方法所对应的流程示意图;
图3为用户的当前对话信息和历史对话信息示意图;
图4a为历史对话信息折叠显示示意图;
图4b为历史对话信息展开显示示意图;
图5为本申请实施例提供的一种装置的示例性框图;
图6为本申请实施例提供的一种装置示意图。
具体实施方式
首先,对本申请中的部分用语进行解释说明,以便使本领域技术人员理解。
对话(dialogue):一问一答,即单轮对话。
会话(conversation):为完成某一任务而产生的一系列对话,可包括多个问、答匹配,即多轮对话。
槽位(slot):是指对于处理某个意图,所必须要知道的关键信息。例如对查询天气这个意图来说,必须知道查询的是“哪天”以及“哪个地方”的天气,否则无法准确给用户返回结果,“哪天”和“哪个地方”这两个信息,即为查询天气这一意图的两个槽位。进一步地,不同槽位之间可以有层次关系,通常可以先判断领域/意图类的槽位,再根据所判断的这些上层槽位,来填充相应的下层槽位。不同领域/意图的下层槽位可能不同,比如对于“查询天气”来说,地点槽位通常只有一个;而对于“订购机票”来说,地点槽位通常有两个,即“出发地”和“目的地”。
领域/意图识别:判定用户请求的是什么领域的事情,以及识别用户请求的目的,比如是告知某个信息,还是确认某个信息。
多个:指两个或两个以上。
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述。
图1为本申请实施例适用的一种可能的对话系统架构示意图。如图1所示,该对话系统架构中可以包括服务器101、一个或一个以上用户侧客户端设备(比如图1中所示意出的客户端设备1021、客户端设备1022)。可选地,该对话系统架构中还可以包括一个或一个以上人工客服侧客户端设备(比如图1中所示意出的客户端设备1023、客户端设备1024)。
其中,用户侧客户端设备或人工客服侧客户端设备可以为终端设备,比如手机、平板电脑或台式电脑等,具体不做限定。本申请实施例中基于客户端设备的操作界面的不同,将客户端设备划分为用户侧客户端设备(供用户操作的客户端设备)和人工客服侧客户端设备(供人工客服操作的客户端设备)。在其它实施例中,用户侧客户端设备也可以称为用户客户端或其它名称,人工客服侧客户端设备也可以称为人工坐席客户端或其它名称,具体不做限定。
用户侧客户端设备可以用于获取用户输入的信息,并将用户输入的信息发送给服务器。比如,若用户在对话框中输入文本信息,则用户侧客户端设备可以获取到该文本信息并发送给服务器;若用户在对话框中输入语音信息,则用户侧客户端设备可以通过语音识别技术,将语音转换为文本信息,进而将文本信息发送给服务器。可选地,用户侧客户端设备还可以与人工客服侧客户端设备进行通信,比如用户侧客户端设备将用户的输入信息发送给人工客服侧客户端设备,并接收人工客服侧客户端设备返回的信息,从而实现人工客服为用户提供服务。
服务器用于处理对话系统所需的各种计算,比如问答匹配,即根据用户的请求信息搜索预设数据库以获得请求信息对应的应答信息。其中,预设数据库可以包括问题库和问题库对应的应答库,问题库中包括多个预设请求信息,应答库中包括多个预设请求信息对应的应答信息,服务器可以将用户的请求信息与多个预设请求信息进行比较,进而将与用户的请求信息之间的相似度最大的预设请求信息在问答库中所对应的应答信息反馈给用户侧客户端设备,进而由用户侧客户端设备呈现给用户,呈现的方式可能有多种,具体不做限定。
以任务型多轮对话系统为例,其应用场景包括虚拟个人助理、智能客服等。通常情况下,智能客服在与用户进行任务型多轮对话时,可以基于用于的请求信息,向用户返回符合用户期望的应答信息。但由于语言表达具有较强的灵活性,而智能客服仅能基于预设规则来理解用户所输入的语句的语义,从而可能会出现智能客服误解用户的语义而将搜素到的不符合用户期望的应答信息返回给用户,比如,用户输入的信息与预设数据库中的信息的语义相似度等分析的结果相似,但实际上从自然人的角度去看,用户所问的问题并非预设数据库中的问题。在这种情形下,用户为了找到所需的应答信息,通常会通过变换表达的方法重复向智能客服提问,但智能客服只能根据用户所提问题中的关键信息机械地检索答案,重复反馈错误的应答信息,无法及时发现反馈的应答信息已偏离用户期望,从而导致用户体验不佳。
基于此,本申请实施例提供一种信息处理方法,用于解决对话系统未准确理解用户的请求信息而重复将错误的应答信息反馈给用户导致用户体验不佳的技术问题。本申请实施例提供的信息处理方法可以适用于多种可能的对话系统,尤其适用于任务型多轮对话系统。
为了便于理解本申请实施例的方案,以下简单介绍一下本申请实施例。
本申请实施例提供的信息处理方法包括:服务器获取用户的对话信息,并确定用户在预设时间段内的至少一组历史对话信息与对话信息的相似程度;若至少一组历史对话信息与所述对话信息的相似程度大于第一阈值且小于等于第二阈值,则服务器向用户侧客户端设备发送引导信息,所述引导信息用于引导用户提供所述请求信息的关联信息。其中,对话信息包括用户的请求信息和请求信息对应的应答信息,任一组历史对话信息包括用户的历史请求信息和所述历史请求信息对应的历史应答信息。第一阈值和第二阈值均可根据实际需要进行设置,且第二阈值可以大于第一阈值。
采用上述方法,服务器在获取到用户的请求信息对应的应答信息后,先判断用户的对话信息与历史对话信息的相似程度,若相似程度较高(比如大于第一阈值小于等于第二阈值),则说明当前请求信息可能是由于用户的语义被误解而导致用户重复性发出的提问,从而可以根据相似程度及时发现未能准确理解用户的语义的情形;且服务器可向用户侧客户端设备发送引导信息,以引导用户补充请求信息的关联信息,从而使得服务器可以基于用户补充的关联信息来进一步理解用户的请求信息,以便于向用户返回满足用户期望的应答信息。也就是说,本申请实施例中在发现未能准确理解用户的语义的情形时,可以先对用户进行适当的引导,尽可能使在预设数据库中找到正确的应答信息返回给用户,避免直接转接人工客服而导致人工客服侧不必要的资源浪费。
进一步地,若相似程度比较低(比如小于等于第一阈值),则说明当前请求信息不是用户重复性发出的提问,而是一个新的提问,此时服务器可以将请求信息对应的应答信息发送给用户侧客户端设备。若相似程度非常高(比如大于第二阈值),则说明用户可能已经重复提问多次,此时可以为用户转接人工客服。考虑到若将用户的历史对话信息直接发送给人工客服,则人工客服很难从大量的文本中直接定位到问题所在,从而不能及时了解用户的意图,为解决这一问题,本申请实施例中在为用户转接人工客服时,可以对用户的历史对话信息进行处理,比如对历史对话信息进行过滤、标注等,从而方便人工客服查找和定位问题,进而准确快速地响应用户。
需要说明的是,为便于和历史对话信息进行区分,本申请实施例中所描述的用户的对话信息也可以称为当前对话信息,对话信息中所包括的请求信息也可以称为当前请求信息,对话信息中所包括的应答信息也可以称为当前应答信息。
以下结合具体实施例,介绍本申请实施例提供的信息处理方法。
图2为本申请实施例提供的一种信息处理方法所对应的流程示意图,如图2所示,包括:
步骤201,服务器获取用户的请求信息,其中,用户的请求信息可以包括用户在当前对话或当前会话中输入的信息。
比如,服务器接收到用户侧客户端设备(即用户侧客户端设备)发送的用户输入的信息为“查询6月份的账单”,可识别出用户输入的信息对应的领域/意图为“账单业务”;在确定用户的领域/意图后,可进行槽位填充,得到的填充结果为:领域=账单业务;意图=查询账单;时间=6月。此种情形下,用户的请求信息包括用户在当前对话中输入的信息,即“查询6月份的账单”。
又比如,服务器接收到用户侧客户端设备发送的用户输入的信息为“查询账单”,可识别出用户输入的信息对应的领域/意图为“账单业务”;在确定用户的领域/意图后,无法补全槽位,因此服务器可返回补全提示信息,比如“请问您希望查询哪一个月的账单?”,若服务器接收到第一客户端发送的用户再次输入的信息“6月”,则可将时间槽位补全为6月。此种情形下,用户的请求信息包括用户在当前会话中输入的信息,即“查询账单”和“6月”。
需要说明的是,在其它可能的实施例中,用户的请求信息也可以包括服务器通过解析用户在当前对话或当前会话中输入的信息得到的关键信息,比如领域/意图以及领域/意图的各个槽位的值。为便于理解,本申请实施例中仅是以用户的请求信息包括用户在当前对话或当前会话中输入的信息为例来示意,具体不做限定。
本申请实施例中,服务可以通过多种方式识别用户输入的信息对应的领域/意图,比如,一种可能的实现方式包括:步骤a,服务器可以将用户输入的信息划分成词。例如,用户的输入信息为“查询上个月的账单”,则可划分成:“查询”“上个月”“的”“账单”,具体实现方式可采用词袋(bag of words,BoW)或逆文档频率(term frequency-inverse documentfrequency,TF-IDF)等方法。若输入的信息为中文语句,则可配合使用基于统计、规则等中文分词方法来划分。以BoW方法为例,假如有如下历史对话“Check my bill for June”以及当前对话“Checkmy account balance and my tariff detail”,基于两个文本构建字典Dictionary={1:‘Check’,2:‘my’,3:‘bill’,4:‘for’,5:‘June’,6:‘account’,7:‘balance’,8:‘and’,9:‘tariff’,10:‘detail’},则当前对话的文本特征可用一个10维向量表示:[1,2,0,0,0,1,1,1,1,1],向量中每个元素表示词典中相关元素在文档中出现的次数。步骤b,将当前对话的文本特征输入分类器中,如支持向量机(support vectormachine,SVM)等分类器。根据预先设定好的规则及训练好的分类器,识别用户的领域/意图。以电信业务为主的对话系统为例,领域/意图可设置为:账单业务,套餐业务,闲聊等。
服务器确定用户的领域/意图后,可以通过多种方式进行槽位填充,比如,利用自然语言理解(deep structured semantic model,NLU)中的槽位填充技术,进行槽位填充。在一个示例中,若用户输入的信息中,所必须的槽位没有全部满足,则可通过多轮对话管理技术进行补全,比如,可以通过搜索相关历史对话中已获得的槽位,来进行补全;若历史对话中没有相关信息,则尝试通过系统环境来补全调整;若仍无法获得所需的槽位信息,则根据预设规则,向用户推送提示补全的信息。举个例子,若用户输入的信息为“查询这个月的账单”,则可根据当前运行系统环境,判断出当前是6月,于是将时间槽位“这个月”记为6月;若用户在之后的对话中输入的信息为“查询上个月的”,则将“上个月”补全为5月,并将业务槽位补全为“账单”;若用户输入的信息为“查询账单”,无相关历史信息可查询且无法通过系统环境等补全,则可向用户推送补全提示信息。
步骤202,服务器判断用户是否主动要求转接人工客服或用户的情绪是否为消极情绪,若是,则执行步骤209,若否,则执行步骤203。
此处,服务器判断用户是否主动要求转接人工客服的一种可能的实现方式为:服务器判断请求信息中是否存在与预设关键字(比如“转接人工”)的相似度大于第七阈值的字段,若是,则确定用户主动要求转接人工。其中,第七阈值可以根据实际需要进行设置。
服务器根据请求信息判定所述用户的情绪是否为消极情绪的一种可能的实现方式为:服务器利用情感分析算法,对用户的请求信息进行分词、特征提取。例如,可对语句进行二值特征提取(即将词频大于1的词统一视为1),并对否定词后、到下一个标点前的每个词前加上否定前缀;然后根据情感词典(sentiment lexicons)以及分类算法(如SVM)判断用户的情绪为积极情绪或消极情绪。
举个例子,假设用户的回答为:I don’t like this answer,则将该语句转换成:Idon't NOT_likeNOT_this NOT_answer;将转换后的语句进行二值特征提取,如转换成:[0,0,1,0,0,1,1,1,0,1],根据情感字典,计算每个词的情感以及权重,并输入到分类算法中进行计算,例如上述语句中NOT_like一词的负面情绪较高,经过分类器判断,可确定用户的情绪为消极情绪。
步骤203,服务器根据请求信息,查询预设数据库,若查询得到请求信息对应的应答信息,则执行步骤204,否则,执行步骤209。
为便于描述,本申请实施例中将用户在一次对话(单轮匹配问答)或一次会话(即多轮匹配问答)中的请求信息和请求信息对应的应答信息称为一组对话信息。在单轮匹配问答中,一组对话信息也可以称为一组话语-回复(utterance-response pair);在多轮匹配问答中,一组对话信息也可以称为一组情景-回复(context-response pair)。
步骤204,服务器确定用户在预设时间段内的至少一组历史对话信息中是否存在与所述请求信息的相似度大于第五阈值的历史请求信息,若是,则执行步骤205,若否,则执行步骤208。其中,至少一组历史对话信息中的任一组历史对话信息包括所述用户的历史请求信息和所述历史请求信息对应的历史应答信息。
此处,预设时间段可由本领域技术人员根据实际需要和经验进行设置,比如,预设时间段可以为30分钟或者1小时,具体不做限定。在一个示例中,预设时间段为30分钟,若当前对话或当前会话的开始时间为22:20:00,则用户在预设时间段内的至少一组历史对话信息可以包括用户在21:49:59-22:19:59这段时间内的历史对话信息。如图3所示,用户在预设时间段内的至少一组历史对话信息包括历史对话信息a和历史对话信息b,其中,历史对话信息a中包括用户的历史请求信息a(即“请查询深圳飞往上海的机票”)和历史请求信息a对应的历史应答信息a(深圳飞往上海的机票有:***),历史对话信息b中包括用户的历史请求信息b(即“深圳的天气怎么样”“明天和后天”)和历史请求信息b对应的历史应答信息b(深圳明天天气晴朗,后天有小雨)。
服务器可以通过多种方式确定至少一组历史对话信息中是否存在与所述请求信息的相似度大于第五阈值的历史请求信息。作为一种实现方式,服务器可以采用深层结构语义模型(deep structured semantic model,DSSM)或相关衍生技术,将用户的请求信息(即“帮我订深圳飞往上海的机票”和“明天”),作为DSSM的当前语句(Query)输入,并将各历史请求信息(包括历史请求信息a:“请查询深圳飞往上海的机票”,以及历史请求信息b:“深圳的天气怎么样”和“明天和后天”)作为DSSM的历史语句(Doc)输入,进行相似度判断。DSSM通过比较,输出当前语句和各历史语句的相似度。例如用户的请求信息(即“帮我订深圳飞往上海的机票”和“明天”)和历史请求信息a(“请查询深圳飞往上海的机票”)的相似度为90%,用户的请求信息(即“帮我订深圳飞往上海的机票”和“明天”)和历史请求信息b(“深圳的天气怎么样”和“明天和后天”)的相似度为5%,设第五阈值为80%,由于用户的请求信息和历史请求信息1的相似度(90%)大于第五阈值(80%),因此,可确定至少一组历史对话信息中存在与所述请求信息的相似度大于第五阈值的历史请求信息。
步骤205,服务器确定至少一组历史对话信息中是否存在所述请求信息的重复信息,若存在,则执行步骤206,若不存在,则执行步骤208。
此处,作为一种实现方式,可以预先设定请求信息的重复信息需要满足的条件(为便于区分,可以简称为第一类型条件),如此,服务器可以判断至少一组历史对话信息中是否存在满足上述第一类型条件的历史请求信息,若存在,则确定至少一组历史对话信息中存在所述请求信息的重复信息,若不存在,则确定至少一组历史对话信息中不存在所述请求信息的重复信息。其中,请求信息的重复信息需要满足的条件可以由本领域技术人员根据实际需要进行设置。
在一个示例中,所述请求信息的重复信息需要满足的条件可以包括:请求信息的重复信息与所述请求信息对应于同一领域/意图,且所述请求信息的重复信息中包含的所述领域/意图的槽位的值与所述请求信息包含中包含的所述领域/意图的槽位的值相同。如此,服务器可以根据至少一组历史对话信息中的各历史请求信息对应的领域/意图以及槽位的值,来确定是否存在满足上述条件的历史请求信息,若存在满足上述条件的历史请求信息,则可以确定至少一组历史对话信息中存在所述请求信息的重复信息。
需要说明的是,上述示例仅是简单列举请求信息的重复信息需要满足的条件,在其它可能的实施例中,也可以设定请求信息的重复信息需要满足的条件包括其它条件,比如,根据多轮对话构建拓扑图,进而基于拓扑图来设定所述请求信息的重复信息需要满足的条件,本申请实施例对此不做限定。
作为又一种实现方式,可以预先设定不属于请求信息的重复信息的历史请求信息需要满足的条件(为便于区分,可以简称为第二类型条件),服务器可以判断与请求信息的相似度大于第五阈值的历史请求信息中是否存在不满足上述第二类型条件的历史请求信息,若存在,则确定至少一组历史对话信息中存在所述请求信息的重复信息,若不存在,则确定至少一组历史对话信息中不存在所述请求信息的重复信息。其中,第二类型条件可以由本领域技术人员根据实际需要进行设置。
在一个示例中,不属于请求信息的重复信息的历史请求信息需要满足的条件可以包括:历史请求信息和请求信息为关联关系,其中,历史请求信息和请求信息为关联关系可以是指历史请求信息和请求信息之间存在关联,比如,关联关系可以是指拓扑图中的继承关系(或者,也可以称为转移关系)。具体来说,可以根据多轮对话构建拓扑图,进而基于拓扑图来判断历史请求信息和请求信息是否为继承关系。举个例子,在多轮对话管理中,请求信息(“帮我订深圳飞往上海的机票”和“明天”)处于历史请求信息a(“请查询深圳飞往上海的机票”)的下游,对话是由历史请求信息a过渡到请求信息的,历史请求信息a和请求信息属于同一类问题的补充,因此,可以认为请求信息和历史请求信息a为继承关系。如此,若服务器确定与请求信息的相似度大于第五阈值的历史请求信息中存在与请求信息不是继承关系的历史请求信息,则说明至少一组历史对话信息中存在所述请求信息的重复信息。
需要说明的是,上述两种实现方式分别从不同的角度来确定至少一组历史对话信息中是否存在所述请求信息的重复信息,具体实施中,可以根据需要来选择所适用的实现方式,且第一类型条件或第二类型条件的具体内容也可以由本领域技术人员根据实际经验和分析进行设置,本申请实施例对此不做具体限定。
步骤206,服务器确定至少一组历史对话信息与所述对话信息的相似程度。
此处,服务器可以通过多种方式确定至少一组历史对话信息与所述对话信息的相似程度。作为一种实现方式:服务器可以根据所述至少一组历史对话信息中的一组或多组第一历史对话信息包括的历史应答信息和所述应答信息的相似度,得到第一相似程度;以及,服务器根据所述至少一组历史对话信息中的一组或多组第二历史对话信息包括的历史请求信息和所述请求信息的相似度,得到第二相似程度;进而,服务器根据所述第一相似程度和所述第二相似程度得到所述至少一组历史对话信息与所述对话信息的相似程度。下面展开介绍。
(1)第一相似程度
在一个示例中,通过如下公式得到第一相似程度:
Figure BDA0001791093290000091
其中,A为第一相似程度,n为至少一组历史对话信息中包括的第一历史对话信息的组数,ai为第i组第一历史对话信息中的历史应答信息的衰减系数,比如历史应答信息的衰减系数可以依据历史应答信息与所述请求信息之间的时间间隔来设置,若历史应答信息与所述请求信息之间的时间间隔较大(说明该历史应答信息距离当前请求信息时间比较久远),则该历史应答信息的衰系数越小;mi的取值为0或1,若第i组第一历史对话信息中的历史应答信息与所述应答信息的相似度大于第八阈值,则mi的取值为1,若第i组第一历史对话信息中的历史应答信息与所述应答信息的相似度小于等于第八阈值,则mi的取值为0。其中,第八阈值可以根据实际需要进行设置。
本申请实施例中,第一历史对话信息包括的历史请求信息与预设数据库中的预设请求信息的相似度小于等于第三阈值,第三阈值可以根据实际需要进行设置。考虑到若某一历史对话信息中包括的历史请求信息与预设数据库中的预设请求信息相似度较高(大于第三阈值),则说明该历史请求信息被对话准确理解的可能性很大(即被错误理解的可能性较小),因此,在计算第一相似程度时,可排除该历史对话信息,从而提高第一相似程度的准确性。
(2)第二相似程度
在一个示例中,通过如下公式得到第二相似程度:
Figure BDA0001791093290000092
其中,Q为第二相似程度,k为至少一组历史对话信息中包括的第二历史对话信息的组数,bj为第j组第二历史对话信息中的历史请求信息的衰减系数,比如历史请求信息的衰减系数可以依据历史请求信息与所述请求信息之间的时间间隔来设置,若历史请求信息与所述请求信息之间的时间间隔较大(说明该历史请求信息距离当前请求信息时间比较久远),则该历史请求信息的衰减系数越小;qj为第j组第二历史对话信息中的历史请求信息与所述请求信息的相似度。
本申请实施例中,第二历史对话信息包括的历史应答信息与所述应答信息的相似度小于等于第四阈值,第四阈值可以根据实际需要进行设置,在一个示例中,第四阈值可以等于第八阈值。由于在上述计算第一相似程度时,已充分考虑历史应答信息与应答信息的相似度大于第四阈值的历史对话信息,因此在计算第二相似程度时,可以排除上这些历史对话信息,从而提高第二相似程度的准确性。
(3)相似程度
在一个示例中,通过如下公式得到至少一组历史对话信息与所述对话信息的相似程度:
R=A+Q
其中,R为至少一组历史对话信息与所述对话信息的相似程度。
需要说明的是,上述步骤204和步骤205为可选的执行步骤,具体实施中,也可以在步骤204之后直接执行步骤206,具体不做限定。
通过上述公式确定出至少一组历史对话信息与所述对话信息的相似程度后,服务器若确定所述相似程度小于等于第一阈值,则可执行208,若确定所述相似程度大于第一阈值且小于等于第二阈值,则可执行步骤207,若确定相似程度大于第二阈值,则可执行步骤209。
步骤207,服务器向用户侧客户端设备发送引导信息,所述引导信息用于引导用户提供所述请求信息的关联信息。采用这种方式,通过引导信息来引导用户提供所述请求信息的关联信息,便于服务器基于请求信息的关联信息在预设数据库查询到符合用户期望的应答信息,从而能够避免不必要的转接人工,提高用户满意度。
在一个示例中,服务器向用户侧客户端设备发送引导信息,可以是指:服务器在用户的多轮对话中搜索与用户的请求信息相关的问题,并将相关的问题发送给用户侧客户端设备,此种情形下,引导信息中可以包括与用户的请求信息相关的问题;或,服务器确定用户的请求信息存在子类问题后,抽取出的子类问题所需要的槽位信息,并向用户侧客户端设备发送引导用户补充所需要的槽位信息的问题,此种情形下,引导信息中可以包括引导用户补充所需要的槽位信息的问题;或,服务器变更相应的槽位,搜索是否有匹配度较高的答案,若有,则向用户侧客户端设备发送提示用户可能错误输入关键字的信息,此种情形下,引导信息中可以包括提示用户可能错误输入关键字的信息。
本申请实施例中,引导信息中还可以包括第三历史对话信息,所述第三历史对话信息中的历史请求信息与所述请求信息的相似度大于第六阈值,也就是说,引导信息中还可以附加与用户的请求信息相似的历史请求信息,从而提醒用户已经提问过相似的问题。
可以理解地,在其它可能的情形下,引导信息中还可以包括其它可能的内容,本领域技术人员可以根据实际经验和需要来设置引导信息中所包括的内容,但凡是为积极寻求符合用户期望的应答信息而向用户发送的起引导、提示和安抚等作用的信息,均在本发明的保护范围之内。
步骤208,服务器向用户侧客户端设备发送第一消息,第一消息中包括所述应答信息,所述第一消息用于指示所述用户侧客户端设备将所述应答信息呈现给所述用户,具体的呈现方式可以有多种,比如以文字的方式呈现或者以声音播放的方式呈现,本申请实施例不做具体限定。
此处,由于服务器通过上述步骤的处理后,将搜索到的应答信息返回给用户,说明用户的请求信息可能是未被错误理解的,因此服务器可以将对话信息标记为已处理对话信息。具体来说,若是由步骤204和步骤205跳转至步骤208,则服务器可以将对话信息标记为已处理对话信息;由于步骤204和步骤205均为可选的执行步骤,若未执行上述步骤204和步骤205,而在步骤204后直接执行步骤206,则由步骤206跳转至步骤208后,服务器也可以将对话信息标记为已处理对话信息;若是执行上述步骤204和步骤205,并由步骤206跳转至步骤208,则此时由于至少一组历史对话信息存在请求信息的重复信息,说明该请求信息虽然未被错误理解但已经出现重复的现象,在这种情形下,服务器可以不再将对话信息标记为已处理对话信息,或者也可以标记,具体实施中可以根据实际需要来选择性设置。
本申请实施例中,具体的标记形式可能有多种,具体不做限定。
步骤209,服务器向人工客服侧客户端设备发送第二消息,所述第二消息用于为所述用户转接人工客服。
进一步地,服务器还可以对所述至少一组历史对话信息进行处理,并将处理后的信息和所述请求信息发送给人工客服侧客户端设备。在一个示例中,服务器对所述至少一组历史对话信息进行处理,可以包括以下至少一项:(1)服务器根据所述至少一组历史对话信息中的每组历史对话信息所属的领域,从所述至少一组历史对话信息中筛选出与所述请求信息所属的领域相同的历史对话信息,如此,可以过滤掉与请求信息的领域完全不同的历史对话信息,从而使得人工客服可以有针对性地查看历史对话信息。(2)服务器根据所述至少一组历史对话信息中的每组历史对话信息所属的领域,对至少一组历史对话信息进行分类,从而便于人工客服在查看时可根据需要进行选择。(3)服务器将所述至少一组历史对话信息中被标记为已处理对话信息的历史对话信息设置为折叠状态,其中,处于所述折叠状态的历史对话信息经人工客服触发后展开显示,如此,人工客服侧客户端设备接收到被设置为所述折叠状态的历史对话信息后,可以将该历史对话信息折叠显示(如图4a所示),进而人工客服可以根据需要决定是否展开查看;若人工客服决定展开查看,则可以触发第一预设按钮,进而该历史对话信息展开显示(如图4b所示),进一步地,人工客服在查看后,还可以触发第二预设按钮,进而该历史对话信息恢复折叠显示。可以理解的,图4a和图4b仅用于简单说明历史对话信息折叠显示或展开显示,具体实施中,人工客服侧客户端设备的显示界面可能不同于图4a和图4b,本申请实施例对人工客服侧客户端设备的显示界面不做具体限定。(4)服务器根据所述至少一组历史对话信息中的历史请求信息与所述请求信息的相似度,对所述至少一组历史对话信息中的历史请求信息进行标注,比如,可以根据历史请求细腻与请求信息的相似度,使用不同的颜色对历史请求信息进行标注,从而方便人工客服定位。
可以理解地,除上述已经所列举的处理方式外,服务器对所述至少一组历史对话信息进行处理还可以为其它方式,本领域技术人员可以根据实际需要进行设置,但凡是为了便于人工客服快速理解用户的请求信息而对至少一组历史对话信息所采取的处理方式,均在本申请实施例的保护范围之内。
本申请实施例中,若是由步骤202或步骤203跳转至步骤209,此种情形下,由于并非是对话系统错误理解用户的请求信息而导致的转接人工客服,因此,为提高响应速度,服务器直接为用户转接人工客服即可,而不再对至少一组历史对话信息进行处理;若是由于相似程度大于第二阈值而跳转至步骤209,此种情形下,说明对话系统错误理解用户的请求信息,因此,服务器可对至少一组历史对话信息进行处理,并将处理后的信息和所述请求信息发送给人工客服侧客户端设备,从而便于人工客服根据历史对话信息快速理解用户的请求信息。
需要说明的是:(1)上述步骤编号仅为本申请实施例执行流程的一种示例,上述各个步骤中相互之间没有时序依赖关系的步骤之间没有严格的执行顺序。比如,本申请实施例对步骤201和步骤202的执行顺序不做限定,服务器可以在每次接收到用户侧客户端设备发送的用户输入的信息后,执行步骤202中的操作。(2)步骤201至步骤209中的各个步骤并非必须执行步骤,具体实施中,可以根据实际需要选择性执行其中的部分步骤。比如,在步骤203中,服务器查询得到请求信息对应的应答信息后,也可以直接执行步骤205或步骤206,而不执行步骤204;又比如,在步骤204中,服务器确定用户在预设时间段内的至少一组历史对话信息中存在与所述请求信息的相似度大于第五阈值的历史请求信息后,也可以直接执行步骤206,而不执行步骤205。
上述主要从各个设备之间交互的角度对本申请提供的方案进行了介绍。可以理解的是,上述实现各设备为了实现上述功能,其包括了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本发明能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在采用集成的单元的情况下,图5示出了本申请实施例中所涉及的装置的可能的示例性框图,该装置500可以以软件的形式存在。装置500可以包括:处理单元502和通信单元503。处理单元502用于对装置500的动作进行控制管理。通信单元503用于支持装置500与其他设备(比如用户侧客户端设备或人工客服侧客户端设备)的通信。装置500还可以包括存储单元501,用于存储装置500的程序代码和数据。
其中,处理单元502可以是处理器或控制器,例如可以是通用中央处理器(centralprocessing unit,CPU),通用处理器,数字信号处理(digital signal processing,DSP),专用集成电路(application specific integrated circuits,ASIC),现场可编程门阵列(field programmable gate array,FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本发明公开内容所描述的各种示例性的逻辑方框,模块和电路。所述处理器也可以是实现计算功能的组合,例如包括一个或多个微处理器组合,DSP和微处理器的组合等等。通信单元503可以是通信接口、收发器或收发电路等,其中,该通信接口是统称,在具体实现中,该通信接口可以包括多个接口。存储单元501可以是存储器。
该装置500可以为上述实施例中的服务器、或者还可以为设置在服务器中的半导体芯片。处理单元502可以支持装置500执行上文中各方法示例中服务器的动作,通信单元503可以支持装置500与用户侧客户端设备或人工客服侧客户端设备之间的通信;例如,处理单元502用于支持装置500执行图2中的步骤201至步骤206,通信单元503用于支持装置500执行图2中的步骤207、步骤208、步骤209。
具体地,在一个实施例中,处理单元502,用于获取用户的对话信息,所述对话信息包括所述用户的请求信息和所述请求信息对应的应答信息;以及,确定所述用户在预设时间段内的至少一组历史对话信息与所述对话信息的相似程度;所述至少一组历史对话信息中的任一组历史对话信息包括所述用户的历史请求信息和所述历史请求信息对应的历史应答信息;通信单元503,用于若所述至少一组历史对话信息与所述对话信息的相似程度大于第一阈值且小于等于第二阈值,则向用户侧客户端设备发送引导信息,所述引导信息用于引导用户提供所述请求信息的关联信息;若所述至少一组历史对话信息与所述对话信息的相似程度小于等于所述第一阈值,则向所述用户侧客户端设备发送第一消息,所述第一消息中包括所述应答信息,所述第一消息用于指示所述用户侧客户端设备将所述应答信息呈现给所述用户;若所述至少一组历史对话信息与所述对话信息的相似程度大于所述第二阈值,则向人工客服侧客户端设备发送第二消息,所述第二消息用于为所述用户转接人工客服。
在一种可能的设计中,所述处理单元502具体用于:
根据所述至少一组历史对话信息中的一组或多组第一历史对话信息包括的历史应答信息和所述应答信息的相似度,得到第一相似程度;所述第一历史对话信息包括的历史请求信息与预设数据库中的预设请求信息的相似度小于等于第三阈值;
根据所述至少一组历史对话信息中的一组或多组第二历史对话信息包括的历史请求信息和所述请求信息的相似度,得到第二相似程度;所述第二历史对话信息包括的历史应答信息与所述应答信息的相似度小于等于第四阈值;
根据所述第一相似程度和所述第二相似程度得到所述至少一组历史对话信息与所述对话信息的相似程度。
在一种可能的设计中,所述处理单元502确定所述用户在预设时间段内的至少一组历史对话信息与所述对话信息的相似程度之前,还用于:确定所述至少一组历史对话信息中的各历史请求信息与所述请求信息的相似度;以及,确定与所述请求信息的相似度大于第五阈值的历史请求信息中存在与所述请求信息不是关联关系的历史请求信息。
在一种可能的设计中,在所述通信单元503向所述用户侧客户端设备发送第一消息之后,所述处理单元502还用于:将所述对话信息标记为已处理对话信息。
在一种可能的设计中,在所述通信单元503向人工客服侧客户端设备发送第二消息之后,所述处理单元502还用于对所述至少一组历史对话信息进行处理,所述通信单元503还用于将处理后的信息和所述请求信息发送给所述人工客服侧客户端设备;
其中,所述处理单元502对所述至少一组历史对话信息进行处理,包括以下至少一项:
根据所述至少一组历史对话信息中的每组历史对话信息所属的领域,从所述至少一组历史对话信息中筛选出与所述请求信息所属的领域相同的历史对话信息;或者,
根据所述至少一组历史对话信息中的每组历史对话信息所属的领域,对所述至少一组历史对话信息进行分类;或者,
将所述至少一组历史对话信息中被标记为已处理对话信息的历史对话信息设置为折叠状态,其中,处于所述折叠状态的历史对话信息经人工客服触发后展开显示;或者,
根据所述至少一组历史对话信息中的历史请求信息与所述请求信息的相似度,对所述至少一组历史对话信息中的历史请求信息进行标注。
在一种可能的设计中,所述引导信息中包括第三历史对话信息;所述第三历史对话信息中的历史请求信息与所述请求信息的相似度大于第六阈值。
参阅图6所示,为本申请提供的一种装置示意图,该装置可以是上述服务器,或者,也可以是设置在服务器中的芯片。该装置600包括:处理器602、通信接口603、存储器601。可选的,装置600还可以包括总线604。其中,通信接口603、处理器602以及存储器601可以通过通信线路604相互连接;通信线路604可以是外设部件互连标准(peripheral componentinterconnect,简称PCI)总线或扩展工业标准结构(extended industry standardarchitecture,简称EISA)总线等。所述通信线路604可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
处理器602可以是一个CPU,微处理器,ASIC,或一个或多个用于控制本申请方案程序执行的集成电路。
通信接口603,使用任何收发器一类的装置,用于与其他设备或通信网络通信,如以太网,无线接入网(radio access network,RAN),无线局域网(wireless local areanetworks,WLAN),有线接入网等。
存储器601可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electricallyer服务器able programmable read-only memory,EEPROM)、只读光盘(compact discread-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过通信线路604与处理器相连接。存储器也可以和处理器集成在一起。
其中,存储器601用于存储执行本申请方案的计算机执行指令,并由处理器602来控制执行。处理器602用于执行存储器601中存储的计算机执行指令,从而实现本申请上述实施例提供的方法。
可选的,本申请实施例中的计算机执行指令也可以称之为应用程序代码,本申请实施例对此不作具体限定。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (14)

1.一种信息处理方法,其特征在于,所述方法包括:
服务器获取用户的对话信息,所述对话信息包括所述用户的请求信息和所述请求信息对应的应答信息;
所述服务器确定所述用户在预设时间段内的至少一组历史对话信息与所述对话信息的相似程度;所述至少一组历史对话信息中的任一组历史对话信息包括所述用户的历史请求信息和所述历史请求信息对应的历史应答信息;
若所述至少一组历史对话信息与所述对话信息的相似程度大于第一阈值且小于等于第二阈值,则所述服务器向用户侧客户端设备发送引导信息,所述引导信息用于引导用户提供所述请求信息的关联信息;
若所述至少一组历史对话信息与所述对话信息的相似程度小于等于所述第一阈值,则所述服务器向所述用户侧客户端设备发送第一消息,所述第一消息中包括所述应答信息,所述第一消息用于指示所述用户侧客户端设备将所述应答信息呈现给所述用户;
若所述至少一组历史对话信息与所述对话信息的相似程度大于所述第二阈值,则所述服务器向人工客服侧客户端设备发送第二消息,所述第二消息用于为所述用户转接人工客服。
2.根据权利要求1所述的方法,其特征在于,所述服务器确定所述至少一组历史对话信息与所述对话信息的相似程度,包括:
所述服务器根据所述至少一组历史对话信息中的一组或多组第一历史对话信息包括的历史应答信息和所述应答信息的相似度,得到第一相似程度;所述第一历史对话信息包括的历史请求信息与预设数据库中的预设请求信息的相似度小于等于第三阈值;
所述服务器根据所述至少一组历史对话信息中的一组或多组第二历史对话信息包括的历史请求信息和所述请求信息的相似度,得到第二相似程度;所述第二历史对话信息包括的历史应答信息与所述应答信息的相似度小于等于第四阈值;
所述服务器根据所述第一相似程度和所述第二相似程度得到所述至少一组历史对话信息与所述对话信息的相似程度。
3.根据权利要求1所述的方法,其特征在于,所述服务器确定所述用户在预设时间段内的至少一组历史对话信息与所述对话信息的相似程度之前,还包括:
所述服务器确定所述至少一组历史对话信息中的各历史请求信息与所述请求信息的相似度;
所述服务器确定与所述请求信息的相似度大于第五阈值的历史请求信息中存在与所述请求信息不是关联关系的历史请求信息。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述服务器向所述用户侧客户端设备发送第一消息之后,还包括:
所述服务器将所述对话信息标记为已处理对话信息。
5.根据权利要求1至3中任一项所述的方法,其特征在于,所述服务器向人工客服侧客户端设备发送第二消息之后,还包括:
所述服务器对所述至少一组历史对话信息进行处理,并将处理后的信息和所述请求信息发送给所述人工客服侧客户端设备;
其中,所述服务器对所述至少一组历史对话信息进行处理,包括以下至少一项:
所述服务器根据所述至少一组历史对话信息中的每组历史对话信息所属的领域,从所述至少一组历史对话信息中筛选出与所述请求信息所属的领域相同的历史对话信息;或者,
所述服务器根据所述至少一组历史对话信息中的每组历史对话信息所属的领域,对所述至少一组历史对话信息进行分类;或者,
所述服务器将所述至少一组历史对话信息中被标记为已处理对话信息的历史对话信息设置为折叠状态,其中,处于所述折叠状态的历史对话信息经人工客服触发后展开显示;或者,
所述服务器根据所述至少一组历史对话信息中的历史请求信息与所述请求信息的相似度,对所述至少一组历史对话信息中的历史请求信息进行标注。
6.根据权利要求1至3中任一项所述的方法,其特征在于,所述引导信息中包括第三历史对话信息;所述第三历史对话信息中的历史请求信息与所述请求信息的相似度大于第六阈值。
7.一种装置,其特征在于,所述装置包括:
处理单元,用于获取用户的对话信息,所述对话信息包括所述用户的请求信息和所述请求信息对应的应答信息;以及,确定所述用户在预设时间段内的至少一组历史对话信息与所述对话信息的相似程度;所述至少一组历史对话信息中的任一组历史对话信息包括所述用户的历史请求信息和所述历史请求信息对应的历史应答信息;
通信单元,用于若所述至少一组历史对话信息与所述对话信息的相似程度大于第一阈值且小于等于第二阈值,则向用户侧客户端设备发送引导信息,所述引导信息用于引导用户提供所述请求信息的关联信息;若所述至少一组历史对话信息与所述对话信息的相似程度小于等于所述第一阈值,则向所述用户侧客户端设备发送第一消息,所述第一消息中包括所述应答信息,所述第一消息用于指示所述用户侧客户端设备将所述应答信息呈现给所述用户;若所述至少一组历史对话信息与所述对话信息的相似程度大于所述第二阈值,则向人工客服侧客户端设备发送第二消息,所述第二消息用于为所述用户转接人工客服。
8.根据权利要求7所述的装置,其特征在于,所述处理单元具体用于:
根据所述至少一组历史对话信息中的一组或多组第一历史对话信息包括的历史应答信息和所述应答信息的相似度,得到第一相似程度;所述第一历史对话信息包括的历史请求信息与预设数据库中的预设请求信息的相似度小于等于第三阈值;
根据所述至少一组历史对话信息中的一组或多组第二历史对话信息包括的历史请求信息和所述请求信息的相似度,得到第二相似程度;所述第二历史对话信息包括的历史应答信息与所述应答信息的相似度小于等于第四阈值;
根据所述第一相似程度和所述第二相似程度得到所述至少一组历史对话信息与所述对话信息的相似程度。
9.根据权利要求7所述的装置,其特征在于,所述处理单元确定所述用户在预设时间段内的至少一组历史对话信息与所述对话信息的相似程度之前,还用于:确定所述至少一组历史对话信息中的各历史请求信息与所述请求信息的相似度;以及,确定与所述请求信息的相似度大于第五阈值的历史请求信息中存在与所述请求信息不是关联关系的历史请求信息。
10.根据权利要求7至9中任一项所述的装置,其特征在于,在所述通信单元向所述用户侧客户端设备发送第一消息之后,所述处理单元还用于:将所述对话信息标记为已处理对话信息。
11.根据权利要求7至9中任一项所述的装置,其特征在于,在所述通信单元向人工客服侧客户端设备发送第二消息之后,所述处理单元还用于对所述至少一组历史对话信息进行处理,所述通信单元还用于将处理后的信息和所述请求信息发送给所述人工客服侧客户端设备;
其中,所述处理单元对所述至少一组历史对话信息进行处理,包括以下至少一项:
根据所述至少一组历史对话信息中的每组历史对话信息所属的领域,从所述至少一组历史对话信息中筛选出与所述请求信息所属的领域相同的历史对话信息;或者,
根据所述至少一组历史对话信息中的每组历史对话信息所属的领域,对所述至少一组历史对话信息进行分类;或者,
将所述至少一组历史对话信息中被标记为已处理对话信息的历史对话信息设置为折叠状态,其中,处于所述折叠状态的历史对话信息经人工客服触发后展开显示;或者,
根据所述至少一组历史对话信息中的历史请求信息与所述请求信息的相似度,对所述至少一组历史对话信息中的历史请求信息进行标注。
12.根据权利要求7至9中任一项所述的装置,其特征在于,所述引导信息中包括第三历史对话信息;所述第三历史对话信息中的历史请求信息与所述请求信息的相似度大于第六阈值。
13.一种装置,其特征在于,所述装置包括处理器、存储器以及存储在存储器上并可在处理器上运行的指令,当所述指令被运行时,使得所述装置执行如权利要求1至6任一项所述的方法。
14.一种计算机可读存储介质,其特征在于,包括指令,当其在计算机上运行时,使得计算机执行如权利要求1至6任一项所述的方法。
CN201811036850.1A 2018-09-06 2018-09-06 一种信息处理方法及装置 Active CN110879837B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811036850.1A CN110879837B (zh) 2018-09-06 2018-09-06 一种信息处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811036850.1A CN110879837B (zh) 2018-09-06 2018-09-06 一种信息处理方法及装置

Publications (2)

Publication Number Publication Date
CN110879837A CN110879837A (zh) 2020-03-13
CN110879837B true CN110879837B (zh) 2022-01-14

Family

ID=69727068

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811036850.1A Active CN110879837B (zh) 2018-09-06 2018-09-06 一种信息处理方法及装置

Country Status (1)

Country Link
CN (1) CN110879837B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111986024A (zh) * 2020-08-25 2020-11-24 北京文思海辉金信软件有限公司 交易处理方法、装置及电子终端
CN112632251B (zh) * 2020-12-24 2023-12-29 北京百度网讯科技有限公司 回复内容的生成方法、装置、设备和存储介质
CN112738207B (zh) * 2020-12-25 2023-06-16 青岛海尔科技有限公司 关键字数据的传输方法及装置、存储介质、电子装置
CN112948108B (zh) * 2021-01-26 2024-03-15 北京字节跳动网络技术有限公司 请求处理方法、装置和电子设备
CN112995415B (zh) * 2021-04-15 2021-08-06 广州格鲁信息技术有限公司 基于大数据分析的智能客服系统及方法
CN116743692B (zh) * 2023-08-16 2023-10-20 杭州星锐网讯科技有限公司 一种历史消息折叠方法和系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004355386A (ja) * 2003-05-29 2004-12-16 Nippon Telegr & Teleph Corp <Ntt> 質問応答システムにおける質問会話中継方法及び装置、質問会話中継プログラム、質問会話中継プログラムを記録した記録媒体
JP2011103018A (ja) * 2009-11-10 2011-05-26 Nippon Telegr & Teleph Corp <Ntt> 質問応答装置、質問応答方法、質問応答プログラム
CN105631022A (zh) * 2015-12-29 2016-06-01 上海智臻智能网络科技股份有限公司 信息处理方法及装置
CN105975511A (zh) * 2016-04-27 2016-09-28 乐视控股(北京)有限公司 智能对话的方法及装置
CN108073600A (zh) * 2016-11-11 2018-05-25 阿里巴巴集团控股有限公司 一种智能问答交互方法、装置以及电子设备
CN108197191A (zh) * 2017-12-27 2018-06-22 神思电子技术股份有限公司 一种多轮对话的场景意图中断方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4679254B2 (ja) * 2004-10-28 2011-04-27 富士通株式会社 対話システム、対話方法、及びコンピュータプログラム
JP4197344B2 (ja) * 2006-02-20 2008-12-17 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声対話システム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004355386A (ja) * 2003-05-29 2004-12-16 Nippon Telegr & Teleph Corp <Ntt> 質問応答システムにおける質問会話中継方法及び装置、質問会話中継プログラム、質問会話中継プログラムを記録した記録媒体
JP2011103018A (ja) * 2009-11-10 2011-05-26 Nippon Telegr & Teleph Corp <Ntt> 質問応答装置、質問応答方法、質問応答プログラム
CN105631022A (zh) * 2015-12-29 2016-06-01 上海智臻智能网络科技股份有限公司 信息处理方法及装置
CN105975511A (zh) * 2016-04-27 2016-09-28 乐视控股(北京)有限公司 智能对话的方法及装置
CN108073600A (zh) * 2016-11-11 2018-05-25 阿里巴巴集团控股有限公司 一种智能问答交互方法、装置以及电子设备
CN108197191A (zh) * 2017-12-27 2018-06-22 神思电子技术股份有限公司 一种多轮对话的场景意图中断方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
中国移动智能客服系统研究及实现;胡珉等;《电信工程技术与标准化》;20171015(第10期);第44-49页 *

Also Published As

Publication number Publication date
CN110879837A (zh) 2020-03-13

Similar Documents

Publication Publication Date Title
CN110879837B (zh) 一种信息处理方法及装置
CN106649825B (zh) 语音交互系统及其创建方法和装置
US10460029B2 (en) Reply information recommendation method and apparatus
US11599729B2 (en) Method and apparatus for intelligent automated chatting
US9767800B2 (en) Communication system
WO2018196684A1 (zh) 对话机器人生成方法及装置
CN109308357B (zh) 一种用于获得答案信息的方法、装置和设备
CN106601237B (zh) 交互式语音应答系统及其语音识别方法
US10326863B2 (en) Speed and accuracy of computers when resolving client queries by using graph database model
Wang et al. Learning domain-independent dialogue policies via ontology parameterisation
CN110187780B (zh) 长文本预测方法、装置、设备和存储介质
CN105354199B (zh) 一种基于场景信息的实体含义识别方法和系统
WO2018098060A1 (en) Enabling virtual agents to handle conversation interactions in complex domains
US11270082B2 (en) Hybrid natural language understanding
CN111191450A (zh) 语料清洗方法、语料录入设备及计算机可读存储介质
EP3620947A1 (en) Dynamic intent classification based on environment variables
CN110287318B (zh) 业务操作的检测方法及装置、存储介质、电子装置
EP2707807A2 (en) Training statistical dialog managers in spoken dialog systems with web data
CN114757176A (zh) 一种获取目标意图识别模型的方法以及意图识别方法
US20190163816A1 (en) Electronic message text classification framework selection
CN111508502A (zh) 使用多标记结构的转录纠正
US11823082B2 (en) Methods for orchestrating an automated conversation in one or more networks and devices thereof
CN112579733A (zh) 规则匹配方法、规则匹配装置、存储介质及电子设备
CN113012687B (zh) 一种信息交互方法、装置及电子设备
CN110874399B (zh) 信息处理方法、装置、计算设备及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant