CN111611358A - 信息交互方法、装置、电子设备及存储介质 - Google Patents

信息交互方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111611358A
CN111611358A CN201910141242.5A CN201910141242A CN111611358A CN 111611358 A CN111611358 A CN 111611358A CN 201910141242 A CN201910141242 A CN 201910141242A CN 111611358 A CN111611358 A CN 111611358A
Authority
CN
China
Prior art keywords
current
intention
historical
user
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910141242.5A
Other languages
English (en)
Inventor
周玉龙
马宝昌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN201910141242.5A priority Critical patent/CN111611358A/zh
Publication of CN111611358A publication Critical patent/CN111611358A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本申请实施例提供一种信息交互方法、装置、电子设备及存储介质,属于智能客服技术领域。该方法通过基于用户的历史意图和当前意图来确定用户的最终意图,然后基于与最终意图匹配的预设答复模式,输出对应的答复内容,从而可以结合历史意图提高获得用户的最终意图的准确性,进而向用户反馈更为准确的答复信息。

Description

信息交互方法、装置、电子设备及存储介质
技术领域
本申请涉及智能客服技术领域,具体而言,涉及一种信息交互方法、装置、电子设备及存储介质。
背景技术
随着智能终端及网络技术的迅速发展,人们越来越习惯地使用智能终端完成各种需求,如使用智能音箱作为人机交互的入口时,用户可以与其进行语音交互以满足用户的不同需求,如查天气、查股票、听音乐等,或者用户在开车时,使用智能车机作为人机交互的入口,用户可以与智能车机进行语音交互以完成导航、电台查询、音乐查询等应用需求。使用智能终端完成用户的各种需求时,用户通过语音、文字等方式和客服完成沟通和交流,但是现有技术中的意图识别模型往往对当前语句的意图识别是基于单句的,即对用户输入的每一语句采用同样的方式进行单独的意图识别,这种识别结果准确性较低,往往很难准确识别出用户真正的意图。
发明内容
本申请实施例的目的在于提供一种信息交互方法、装置、电子设备及存储介质,以提高获取用户意图的准确性,向用户反馈准确的答复信息。
第一方面,本申请实施例提供了一种信息交互方法,应用于服务系统,所述方法包括:基于用户需要从所述服务系统获得一事件的答复时在当前时刻输入的当前信息,获取所述用户的当前意图;基于在所述当前时刻之前所述用户为获得所述事件的答复而输入的历史信息,获得所述用户的历史意图;基于所述历史意图与所述当前意图确定所述用户的最终意图;基于与所述最终意图匹配的预设答复模式,输出与所述事件对应的答复内容。
在上述实现过程中,通过基于用户的历史意图和当前意图来确定用户的最终意图,然后基于与最终意图匹配的预设答复模式,输出对应的答复内容,从而可以结合历史意图提高获得用户的最终意图的准确性,进而向用户反馈更为准确的答复信息。
可选地,基于所述历史意图与所述当前意图确定所述用户的最终意图,包括:判断所述历史意图与所述当前意图之间的相关度是否大于或等于预设相关度;在为是时,基于所述历史意图与所述当前意图确定所述用户的最终意图。
在上述实现过程中,当历史意图与当前意图之间的相关度大于或等于预设相关度时,则基于历史意图与当前意图确定用户的最终意图,从而可以避免当前意图与历史意图差距较大时基于历史意图和当前意图可能会获得错误的最终意图的问题,提高了最终意图获取的准确性。
可选地,基于所述历史意图与所述当前意图确定所述用户的最终意图,包括:判断所述历史意图与所述当前意图之间的相关度是否大于等于预设相关度;在为否时,则将所述当前意图确定为所述用户的最终意图。
在上述实现过程中,当历史意图与当前意图之间的相关度小于预设相关度时,则将当前意图确定为所述用户的最终意图,从而可以避免当前意图与历史意图差距较大时基于历史意图和当前意图可能会获得错误的最终意图的问题,提高了最终意图获取的准确性。
可选地,基于用户需要从所述服务系统获得一事件的答复时在当前时刻输入的当前信息,获取所述用户的当前意图,包括:获取用户需要从所述服务系统获得一事件的答复时在当前时刻输入的当前语音信息,将所述当前语音信息转换为当前文本信息;基于当前文本信息获取所述用户的当前意图。
在上述实现过程中,通过将当前语音信息转换为当前文本信息,在基于当前文本信息获得用户的当前意图,从而可以避免直接对当前语音信息进行识别带来的误差,进而导致当前意图识别错误的问题。
可选地,将所述当前语音信息转换为当前文本信息,包括:对所述当前语音信息进行切分,获得多个语音信息片段;对每个所述语音信息片段进行语音识别,得到每个所述语音信息片段对应的切分文本信息,共获得多个切分文本信息。
在上述实现过程中,由于用户说话的习惯可能导致停顿、断句等情况的发生,所以通过将当前语音信息进行切分,然后将切分后获得的语音信息片段转换为切分文本信息,从而提高了后续利用切分文本信息识别用户的当前意图的准确性。
可选地,基于当前文本信息获取所述用户的当前意图,包括:对多个切分文本信息分别进行意图识别,获得每个所述切分文本信息对应的切分意图,共获得多个切分意图;根据所述多个切分意图获得所述用户的当前意图。
在上述实现过程中,通过对切分文本信息对应的切分意图来获得用户的当前意图,可以对用户输入的当前信息更为准确的分析,进而获得更为准确的当前意图。
可选地,所述历史信息为多条历史文本信息,基于当前文本信息获取所述用户的当前意图,包括:对所述当前文本信息进行分词,获得多个分词;获取每条所述历史文本信息的历史意图,共获得多条历史意图;提取所述多个分词之间的第一预设相关性特征,并提取所述多条历史意图之间的第二预设相关性特征;基于所述第一预设相关性特征和所述第二预设相关性特征获取所述用户的当前意图。
在上述实现过程中,通过获取当前文本信息上文的多条历史文本信息中每条历史文本信息对应的历史意图,而不仅仅是根据当前文本信息提取对应的特征对意图进行识别,由于一组多轮交互过程中,当前文本信息与上文的多条历史文本信息存在相关性,因此,能够有效提升对用户的当前意图的识别效果。
可选地,基于所述第一预设相关性特征和所述第二预设相关性特征对所述当前文本信息进行意图识别,获取所述用户的当前意图,包括:将所述第一预设相关性特征和所述第二预设相关性特征输入Adaboost分类器,通过所述Adaboost分类器确定所述当前文本信息对应的多个初始意图中的置信度最高的意图;将所述置信度最高的意图作为所述用户的当前意图。
在上述实现过程中,由于Adaboost分类器是一种迭代算法,所以使得通过Adaboost分类器来预测用户的当前意图更为准确。
第二方面,本申请实施例提供了一种信息交互装置,运行于服务系统,所述装置包括:
当前意图获取模块,用于基于用户需要从所述服务系统获得一事件的答复时在当前时刻输入的当前信息,获取所述用户的当前意图;
历史意图获取模块,用于基于在所述当前时刻之前所述用户为获得所述事件的答复而输入的历史信息,获得所述用户的历史意图;
最终意图获取模块,用于基于所述历史意图与所述当前意图确定所述用户的最终意图;
答复信息输出模块,用于基于与所述最终意图匹配的预设答复模式,输出与所述事件对应的答复内容。
可选地,所述最终意图获取模块,用于判断所述历史意图与所述当前意图之间的相关度是否大于或等于预设相关度;在为是时,基于所述历史意图与所述当前意图确定所述用户的最终意图。
可选地,所述最终意图获取模块,用于判断所述历史意图与所述当前意图之间的相关度是否大于等于预设相关度;在为否时,则将所述当前意图确定为所述用户的最终意图。
可选地,所述当前意图获取模块,用于获取用户需要从所述服务系统获得一事件的答复时在当前时刻输入的当前语音信息,将所述当前语音信息转换为当前文本信息;基于当前文本信息获取所述用户的当前意图。
可选地,所述当前意图获取模块,还用于对所述当前语音信息进行切分,获得多个语音信息片段;对每个所述语音信息片段进行语音识别,得到每个所述语音信息片段对应的切分文本信息,共获得多个切分文本信息。
可选地,所述当前意图获取模块,还用于对多个切分文本信息分别进行意图识别,获得每个所述切分文本信息对应的切分意图,共获得多个切分意图;根据所述多个切分意图获得所述用户的当前意图。
可选地,所述历史信息为多条历史文本信息,所述当前意图获取模块,还用于对所述当前文本信息进行分词,获得多个分词;获取每条所述历史文本信息的历史意图,共获得多条历史意图;提取所述多个分词之间的第一预设相关性特征,并提取所述多条历史意图之间的第二预设相关性特征;基于所述第一预设相关性特征和所述第二预设相关性特征获取所述用户的当前意图。
可选地,所述当前意图获取模块,还用于将所述第一预设相关性特征和所述第二预设相关性特征输入Adaboost分类器,通过所述Adaboost分类器确定所述当前文本信息对应的多个初始意图中的置信度最高的意图;将所述置信度最高的意图作为所述用户的当前意图。
第三方面,本申请实施例提供一种电子设备,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如上述第一方面提供的所述方法中的步骤。
第四方面,本申请实施例提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时运行如上述第一方面提供的所述方法中的步骤。
本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种信息交互方法的流程图;
图2为本申请实施例提供的一种信息交互装置的结构框图;
图3为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
为了更好地理解本申请,先以一个具体示例对相关技术中的问题进一步进行说明。
例如,用户输入的历史信息为“我想听xxx”、当前信息为“的雪人”,其中,服务系统获取到这两个信息,即两次交互请求,即“我想听xxx”和“的雪人”,对于历史信息,服务系统进行分析后,直接播放xxx的歌曲,但并不一定是“雪人”这首歌,对于当前信息,服务系统进行分析后,播放歌曲“雪人”,该歌曲可能是xxx唱的,也可能是其他人唱的同名歌曲,当前服务系统也可能基于当前信息给出其他的结果,如“冬天到了,我也喜欢堆雪人”的反馈,无法哪种反馈,都基本上无法满足用户的真正需求,然后用户感觉交互的不流畅,用户体验效果较差。
通过对上述示例的分析,造成上述交互结果不准确的原因是对当前意图的识别没有结合历史数据。
另外,本申请实施例中的服务系统是基于基于有限状态机(Finite-StateMachine,FSM)的多轮交互系统,在该系统中可以定义交互状态节点和节点间跳转规则,如用户进行咨询之间的状态可以定义为开始节点,整个交互完成的状态定义为结束节点,交互过程中识别出用户的意图可以定位为某个业务节点,状态节点反应出当前对话的进度,每个状态节点会有相应的处理方案,如在某个业务节点上,系统会执行向用户确认是否某一笔订单操作,用户的输入信息则是驱动状态跳转的条件,如用户确认订单,则交互状态跳转到确认订单的状态上进行接下来的处理。
也就是说,在多轮交互系统中,从开始节点开始,根据语义结果进行状态跳转,直到结束状态为止,完成一次客服业务处理,下面请参照本方案的具体实现过程。
请参照图1,图1为本申请实施例提供的一种信息交互方法的流程图,该方法应用于服务系统,所述方法包括如下步骤:
步骤S110:基于用户需要从所述服务系统获得一事件的答复时在当前时刻输入的当前信息,获取所述用户的当前意图。
本实施例中的服务系统指的是用于提供任何服务的系统,如闲聊服务、查询服务、外卖服务或网约车服务等。以网约车为例,该服务系统为提供网约车服务的系统,用户可以在该服务系统咨询网约车服务相关的事情,如关于网约车订单、某个司机信誉评价、某个司机历史订单数量等事件。
例如,若用户想要咨询发票相关的问题,其输入的当前信息如“我想要咨询发票问题”,所以,事件可能是关于发票相关的,所以可以对用户输入的当前信息进行语义分析,然后获得该用户的当前意图是咨询发票。
步骤S120:基于在所述当前时刻之前所述用户为获得所述事件的答复而输入的历史信息,获得所述用户的历史意图。
以上述历史信息为“我想听xxx”,当前信息为“的雪人”为例,若对历史信息进行语义分析获得历史意图为“想听xxx的歌”,当前意图为“雪人这首歌”,或者“关于雪人的相关闲聊”,则历史信息与当前信息均是用户想要获得“xxx的雪人这首歌”的答复,但是若只对当前信息进行语义分析后获得当前意图,则可能无法得知用户的最终意图是“想听xxx的雪人”,所以,还需结合历史意图对用户的真正意图进行分析。
步骤S130:基于所述历史意图与所述当前意图确定所述用户的最终意图。
在获得用户的当前意图和历史意图后,基于历史意图和当前意图确定该用户的最终意图,如上述示例,可结合历史意图与当前意图得出用户的最终意图为“想听xxx的雪人”。
步骤S140:基于与所述最终意图匹配的预设答复模式,输出与所述事件对应的答复内容。
在上述步骤中可以结合历史意图与当前意图获得用户的最终意图。在服务系统中预先配置有多种预设答复模式,其预设答复模式可以包括:短信模式、人工客服模式、电话模式以及机器人问答模式,且预先设置有多种意图,为每种意图配置了各自的预设答复模式,即每种意图可能配置有多种预设答复模式,所以,在确定用户的最终意图后,可以选择该最终意图对应的预设答复模式向用户发送对应的答复内容,如若用户最终意图是想咨询某个发票的明细,该最终意图对应的预设答复模式为短信模式,则可通过短信模式向用户发送与发票明显相关的答复信息;若用户最终意图是“想听xxx的雪人”,则可通过播放答复模式,通过用户终端的播放器播放xxx的“雪人”这首歌。
所以,本实施例中,通过基于用户的历史意图和当前意图来确定用户的最终意图,然后基于与最终意图匹配的预设答复模式,输出对应的答复内容,从而可以结合历史意图提高获得用户的最终意图的准确性,进而向用户反馈更为准确的答复信息。
在上述实施例中,用户输入的当前信息或历史信息可以是文本信息、语音信息或手势方式输入的信息,如当检测到用户通过交互式输入界面的对话框输入文本信息时,解析该文本信息,获取其对应的意图,或者,启动语音输入模式,通过用户终端的麦克风获取用户的语音信息,然后可将该语音信息解析生成对应的文本信息,然后通过解析该文本信息获取用户的意图,或者启动视频输入模式,通过摄像头采集用户手势信息,或者启动触摸输入模式,通过触摸板或触摸屏采集用户手势信息,对该手势信息进行解析,以确定用户的意图。
在一种可能的实施方式中,获取用户的当前意图的方式可以为:获取用户需要从服务系统获得一事件的答复时在当前时刻输入的当前语音信息,将该语音信息转换为当前文本信息,然后基于当前文本信息获取用户的当前意图。
其中,在全双工的交互模式下,用户可以连续自然地与服务系统进行多轮交互,服务系统在接收到用户输入的当前语音信息后,首先可以对当前语音信息进行切分,获得多个语音信息片段,然后将切分得到的每个语音信息片段作为当前交互的语音信息,然后对每个语音信息片段进行语音识别,得到每个语音信息片段对应的切分文本信息,共获得多个切分文本信息。
其中,对当前语音信息的具体的切分方法不限,可以采用现有技术实现,如提取语音信息的声学特征,如梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)或filterbank,使用预先训练的切分模型根据声学特征对接收的当前语音信息进行切分,所述切分模型为模式识别中常用分类模型,如深度神经网络模型或支持向量机模型。
对语音信息片段识别为切分文本信息的方式本申请实施例不做具体的介绍,其可以采用现有的语音识别算法获得,如基于隐马尔可夫模型(Hidden Markov Model,简称HMM))-基于加权有限状态机(Weighted Finite State Transducer,简称WFST)的语音识别系统,也可以是基于编码-解码(Encode-Docode)框架的语音识别系统。
其中,每个切分文本信息可以是各个词、短语、短句等,如当前语音信息为“我想查询昨天那笔订单为什么没有付款”,获得的多个语音信息片段为“我”、“想”、“查询”、“昨天”、“那笔订单”、“为什么”、“没有付款”,对其各个语音信息片段进行语音识别后获得多个切分文本信息为“我”、“想”、“查询”、“昨天”、“那笔订单”、“为什么”、“没有付款”。
为了获得用户的当前意图,还可以对多个切分文本信息分别进行意图识别,获得每个切分文本信息对应的切分意图,共获得多个切分意图,然后根据多个切分意图获得用户的当前意图。
其中,获得多个切分意图的方式可以为:将每个切分意图输入至意图识别模型,如支持向量机(Support Vector Machine,SVM),SVM是一个有监督的学习模型,可以用来进行分类。
可以预先获得各种训练样本数据输入至SVM进行训练,以获得意图识别模型,训练样本数据可以包括多种类型的数据,如网约车相关的数据、餐饮相关的数据、娱乐相关的数据等,然后将这些数据进行意图标注进行训练,如订单类的数据,其意图为订单交易类型意图,在将每个切分文本信息输入意图识别模型,由于切分文本信息是对当前文本信息进行切分得到的,所以切分文本信息可能是对应了单个字或词组或短句,意图识别模型可以将每个切分文本信息找到各自对应的意图,如上述的切分文本信息为“我”、“想”、“查询”、“昨天”、“那笔订单”、“为什么”、“没有付款”,如“我”对应的切分意图为“姓名”、“想”对应的切分意图为“目的”,“查询”对应的切分意图为“查找”,“昨天”对应的切分意图为“时间”,“那笔订单”对应的切分意图为“订单”,“为什么”对应的切分意图为“疑问”,当然,在训练过程中可将不同的关键词或关键字或短句标注多种意图。当然,由于不同的关键词在不同的语义场景下对应的意图的权重不相同,所以,还可基于语义场景对不同的词标注不同权重(即置信度)的意图进行训练。
例如,服务系统预设的语义场景根据服务系统的应用需求预先设定,如语义场景如网约车、餐饮、娱乐、电影、音乐、餐饮等。
对每个切分文本信息进行初始语义理解时,可以使用如基于句法的语义分析、基于文法规则网络的语义分析来得到各个语义场景下的初始语义理解结果。
以基于文法规则网络的语义分析对每个切分文本信息进行初始语义理解为例,可以预先编写好各语义场景下基于扩展巴克斯范式(Augmented Backus–Naur Form,ABNF)文法规则,然后根据各语义场景下的文法规则编译生成各语义场景下的加权有限状态机(Weighted Finite State Transducer,WFST)网络,根据各语义场景下的WFST网络分别在各语义场景下对每个切分文本信息进行语义理解,得到各语义场景下的初始语义理解结果。可以理解的是,各语义场景下的语义理解过程的具体内容可以参见各种现有技术,在此不再详述。
对应每个语义场景,相应语义场景下的初始语义理解结果为0个、一个或多个。例如,每种语义场景下可以预先确定置信度(静态设置或动态确定),将对应路径的概率值大于置信度的初始语义理解结果作为该语义场景下的候选初始语义理解结果,在获取到候选初始语义理解结果后,可以根据预先确定的规则,将所有的候选初始语义理解结果作为相应语义场景下的初始语义理解结果;或者,对所有的候选初始语义理解结果按照对应路径的概率值进行排序,再按序选择预设个数的候选初始语义理解结果作为相应语义场景下的初始语义理解结果,即nbest结果,n可以根据应用需求确定。
每个初始语义理解结果包含的信息包括:语义场景名、语义场景取值、语义槽及语义槽取值,可以表示为{语义场景名:语义场景取值,语义槽1:语义槽1取值,语义槽2:语义槽2取值,…,语义槽n:语义槽n取值},其中语义槽根据语义场景及应用需求预先设定。
如切分文本信息为“演唱会版”时的1best语义理解结果为{“service”:”music”,“version”:”演唱会版”},其中“service”表示语义场景名,“music”表示语义场景取值(音乐场景),“version”表示语义槽(版本),“演唱会版”表示语义槽取值。
对每个切分文本信息进行语义理解,得到各语义场景下的初始语义理解结果后,该初始语义理解结果作为每个切分文本信息对应的初始切分意图,可以根据各语义场景下的初始语义理解结果得到最终语义理解结果,该最终语义理解结果为每个切分文本信息对应的切分意图。
一些实施例中,可以根据各语义场景下的初始语义理解结果按照相应路径的概率值从高到低的顺序进行排序,从排序后的结果中按序选择预设个数的初始语义理解结果作为最终语义理解结果。
其中,根据多个切分意图获得用户的当前意图的方式可以为:将多个切分意图输入上述的意图识别模型,即确定多个切分意图中置信度最高的意图作为用户的当前意图。
另外,作为一种实施方式,基于当前文本信息获取所述用户的当前意图还可以为:历史信息为多条历史文本信息,对所述当前文本信息进行分词,获得多个分词,再获取每条历史文本信息的历史意图,共获得多条历史意图,然后提取多个分词之间的第一预设相关性特征,并提取所述多条历史意图之间的第二预设相关性特征,基于所述第一预设相关性特征和所述第二预设相关性特征获取所述用户的当前意图。
具体地,第一预设相关性特征和第二预设相关性特征为n-gram特征,或者,也可以为其它能够表征相邻字之间相关性的特征,例如,也可以采用gram关联矩阵对n-gram特征进行统计与合并,并将合并处理后的特征作为第一预设相关性特征或者第二预设相关性特征,对此不作限制。
其中,可以预先对n-gram特征中的n值进行设定,对此不作限制。
本实施例中,通过提取多个分词和多个历史意图之间的n-gram特征,算法实现简便,采用n-gram特征能够表征相邻字之间相关性,不需要做特殊的特征提取,使得该方法有很好的通用性。当n增大时,意图识别的效果会提升,但同时会增加基于多轮交互的意图识别方法的复杂度。因此,可以根据实际使用需求对n-gram特征中的n值进行设定,实现平衡基于多轮交互的意图识别方法的效率与复杂度,由于将多个分词之间或者多个历史意图之间的相关性纳入意图识别考量范畴,更好地识别出多轮交互中的意图变换,从而提升意图识别的准确率和召回率。
例如,参见表1,假设n-gram特征为2-gram特征,则对当前文本信息进行分词获得“肯德基”“到”“家”,提取多个分词之间的2-gram特征,(肯德基,到)、(到,家),提取多个意图之间的2-gram特征:(打招呼,订外卖)。
表1
Figure BDA0001978003720000131
Figure BDA0001978003720000141
可选地,可以基于Adaboost分类器、第一预设相关性特征和第二预设相关性特征对当前文本信息的意图进行识别。
在本申请的实施例中,可以预先确定当前文本信息的多个可能的意图,并基于第一预设相关性特征和第二预设相关性特征训练多个不同的分类器(弱分类器),进而将多个弱分类器集合起来,构成一个更强的最终分类器(强分类器),并对第一预设相关性特征和第二预设相关性特征迭代训练,确定每个可能的意图对应的置信度,通过该置信度对当前文本信息的意图进行识别。
在本申请的实施例中,参见表2,为基于Adaboost分类器、第一预设相关性特征和第二预设相关性特征对当前语句的意图进行识别得到的意图结果。
表2
意图 置信度
订外卖 0.7
叫车 0.2
其他 0.1
由于意图“订外卖”的置信度最高,因此,可以将“订外卖”作为对当前文本信息的意图进行识别的结果,即用户的当前意图为“订外卖”。
另外,本申请实施例中,获得最终意图对应的答复信息的过程包括多轮交互,在用户在历史时刻输入历史信息进行交互时,在保留交互历史记录的情况下进入下一轮交互。可以理解地,在历史交互时,用户为获得所述事件的答复而输入历史信息,服务系统此时可基于该历史信息获得用户的历史意图,然后基于历史意图匹配的预设答复模式,向用户发送对应的答复信息。
对获得用户的历史意图也可采用上述方式进行获取,在此不再做过多介绍。当然,为了提高意图识别的效率,也可直接对当前文本信息或历史文本信息进行上述的语义理解,获得语义理解结果,将当前文本信息对应的语义理解结果作为当前意图或者将历史文本信息对应的语义理解结果作为历史意图。
为了对用户的最终意图更为准确的识别,还可以基于历史意图和当前意图确定用户的最终意图,其可以采用上述的Adaboost分类器获得,即将历史意图和当前意图输入到Adaboost分类器中,根据Adaboost分类器的输出结果获得最终意图,即可根据历史意图和当前意图的置信度来获得最终意图,如将置信度最高的意图作为当前意图。
当然,若历史意图与当前意图的相关度不大,则为了获取用户的最终意图,还可先判断历史意图与当前意图之间的相关度是否大于或等于预设相关度,在为是时,基于历史意图与当前意图确定用户的最终意图,如可以将历史意图和当前意图输入到Adaboost分类器中,根据Adaboost分类器的输出结果获得最终意图,即可根据历史意图和当前意图的置信度来获得最终意图,如将置信度最高的意图作为当前意图。
其中,历史意图与当前意图之间的相关度可以用夹角余弦值来表示,即将历史信息与当前信息转换为特征向量,计算两个特征向量之间的夹角余弦值即可获得历史意图和当前意图之间的相关度,若历史意图与当前意图相关度大于或等于预设相关度时,表明历史意图与当前意图之间相关性比较大,如上述的历史意图为“订外卖”,当前意图为“点餐”,即可能该历史意图与当前意图之间的相关度较大,则可将历史意图与当前意图输入至上述的Adaboost分类器中,根据Adaboost分类器的输出结果获得最终意图。
若基于历史意图与当前意图的置信度均不高时,即无法判断用户的最终意图时,可以向用户发送确认信息,如“请问是否是咨询xx订单的信息”,用户可以回复“是”或“否”,以此来确定用户的最终意图。
当然,若历史意图与当前意图之间的相关度小于预设相关度时,可将当前意图确定为用户的最终意图,例如,历史意图为“订外卖”,当前意图为“打车”,显然两个意图的相关度不大,则当前意图为用户的最终意图。
请参照图2,图2为本申请实施例提供的一种信息交互装置200的结构框图,所述装置包括:
当前意图获取模块210,用于基于用户需要从所述服务系统获得一事件的答复时在当前时刻输入的当前信息,获取所述用户的当前意图;
历史意图获取模块220,用于基于在所述当前时刻之前所述用户为获得所述事件的答复而输入的历史信息,获得所述用户的历史意图;
最终意图获取模块230,用于基于所述历史意图与所述当前意图确定所述用户的最终意图;
答复信息输出模块240,用于基于与所述最终意图匹配的预设答复模式,输出与所述事件对应的答复内容。
可选地,所述最终意图获取模块230,用于判断所述历史意图与所述当前意图之间的相关度是否大于或等于预设相关度;在为是时,基于所述历史意图与所述当前意图确定所述用户的最终意图。
可选地,所述最终意图获取模块230,用于判断所述历史意图与所述当前意图之间的相关度是否大于等于预设相关度;在为否时,则将所述当前意图确定为所述用户的最终意图。
可选地,所述当前意图获取模块210,用于获取用户需要从所述服务系统获得一事件的答复时在当前时刻输入的当前语音信息,将所述当前语音信息转换为当前文本信息;基于当前文本信息获取所述用户的当前意图。
可选地,所述当前意图获取模块210,还用于对所述当前语音信息进行切分,获得多个语音信息片段;对每个所述语音信息片段进行语音识别,得到每个所述语音信息片段对应的切分文本信息,共获得多个切分文本信息。
可选地,所述当前意图获取模块210,还用于对多个切分文本信息分别进行意图识别,获得每个所述切分文本信息对应的切分意图,共获得多个切分意图;根据所述多个切分意图获得所述用户的当前意图。
可选地,所述历史信息为多条历史文本信息,所述当前意图获取模块210,还用于对所述当前文本信息进行分词,获得多个分词;获取每条所述历史文本信息的历史意图,共获得多条历史意图;提取所述多个分词之间的第一预设相关性特征,并提取所述多条历史意图之间的第二预设相关性特征;基于所述第一预设相关性特征和所述第二预设相关性特征获取所述用户的当前意图。
可选地,所述当前意图获取模块210,还用于将所述第一预设相关性特征和所述第二预设相关性特征输入Adaboost分类器,通过所述Adaboost分类器确定所述当前文本信息对应的多个初始意图中的置信度最高的意图;将所述置信度最高的意图作为所述用户的当前意图。
请参照图3,图3为本申请实施例提供的一种电子设备的结构示意图,所述电子设备可以包括:至少一个处理器110,例如CPU,至少一个通信接口120,至少一个存储器130和至少一个通信总线140。其中,通信总线140用于实现这些组件直接的连接通信。其中,本申请实施例中设备的通信接口120用于与其他节点设备进行信令或数据的通信。存储器130可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器130可选的还可以是至少一个位于远离前述处理器的存储装置。存储器130中存储有计算机可读取指令,当所述计算机可读取指令由所述处理器110执行时,电子设备执行上述图1所示方法过程。
本申请实施例提供一种可读存储介质,所述计算机程序被处理器执行时,执行如图1所示方法实施例中电子设备所执行的方法过程。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法中的对应过程,在此不再过多赘述。
综上所述,本申请实施例提供一种信息交互方法、装置、电子设备及存储介质,该方法通过基于用户的历史意图和当前意图来确定用户的最终意图,然后基于与最终意图匹配的预设答复模式,输出对应的答复内容,从而可以结合历史意图提高获得用户的最终意图的准确性,进而向用户反馈更为准确的答复信息。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (18)

1.一种信息交互方法,其特征在于,应用于服务系统,所述方法包括:
基于用户需要从所述服务系统获得一事件的答复时在当前时刻输入的当前信息,获取所述用户的当前意图;
基于在所述当前时刻之前所述用户为获得所述事件的答复而输入的历史信息,获得所述用户的历史意图;
基于所述历史意图与所述当前意图确定所述用户的最终意图;
基于与所述最终意图匹配的预设答复模式,输出与所述事件对应的答复内容。
2.根据权利要求1所述的方法,其特征在于,基于所述历史意图与所述当前意图确定所述用户的最终意图,包括:
判断所述历史意图与所述当前意图之间的相关度是否大于或等于预设相关度;
在为是时,基于所述历史意图与所述当前意图确定所述用户的最终意图。
3.根据权利要求1所述的方法,其特征在于,基于所述历史意图与所述当前意图确定所述用户的最终意图,包括:
判断所述历史意图与所述当前意图之间的相关度是否大于等于预设相关度;
在为否时,则将所述当前意图确定为所述用户的最终意图。
4.根据权利要求1-3中任一权项所述的方法,其特征在于,基于用户需要从所述服务系统获得一事件的答复时在当前时刻输入的当前信息,获取所述用户的当前意图,包括:
获取用户需要从所述服务系统获得一事件的答复时在当前时刻输入的当前语音信息,将所述当前语音信息转换为当前文本信息;
基于当前文本信息获取所述用户的当前意图。
5.根据权利要求4所述的方法,其特征在于,将所述当前语音信息转换为当前文本信息,包括:
对所述当前语音信息进行切分,获得多个语音信息片段;
对每个所述语音信息片段进行语音识别,得到每个所述语音信息片段对应的切分文本信息,共获得多个切分文本信息。
6.根据权利要求5所述的方法,其特征在于,基于当前文本信息获取所述用户的当前意图,包括:
对多个切分文本信息分别进行意图识别,获得每个所述切分文本信息对应的切分意图,共获得多个切分意图;
根据所述多个切分意图获得所述用户的当前意图。
7.根据权利要求4所述的方法,其特征在于,所述历史信息为多条历史文本信息,基于当前文本信息获取所述用户的当前意图,包括:
对所述当前文本信息进行分词,获得多个分词;
获取每条所述历史文本信息的历史意图,共获得多条历史意图;
提取所述多个分词之间的第一预设相关性特征,并提取所述多条历史意图之间的第二预设相关性特征;
基于所述第一预设相关性特征和所述第二预设相关性特征获取所述用户的当前意图。
8.根据权利要求7所述的方法,其特征在于,基于所述第一预设相关性特征和所述第二预设相关性特征对所述当前文本信息进行意图识别,获取所述用户的当前意图,包括:
将所述第一预设相关性特征和所述第二预设相关性特征输入Adaboost分类器,通过所述Adaboost分类器确定所述当前文本信息对应的多个初始意图中的置信度最高的意图;
将所述置信度最高的意图作为所述用户的当前意图。
9.一种信息交互装置,其特征在于,运行于服务系统,所述装置包括:
当前意图获取模块,用于基于用户需要从所述服务系统获得一事件的答复时在当前时刻输入的当前信息,获取所述用户的当前意图;
历史意图获取模块,用于基于在所述当前时刻之前所述用户为获得所述事件的答复而输入的历史信息,获得所述用户的历史意图;
最终意图获取模块,用于基于所述历史意图与所述当前意图确定所述用户的最终意图;
答复信息输出模块,用于基于与所述最终意图匹配的预设答复模式,输出与所述事件对应的答复内容。
10.根据权利要求9所述的装置,其特征在于,所述最终意图获取模块,用于判断所述历史意图与所述当前意图之间的相关度是否大于或等于预设相关度;在为是时,基于所述历史意图与所述当前意图确定所述用户的最终意图。
11.根据权利要求9所述的装置,其特征在于,所述最终意图获取模块,用于判断所述历史意图与所述当前意图之间的相关度是否大于等于预设相关度;在为否时,则将所述当前意图确定为所述用户的最终意图。
12.根据权利要求9-11任一所述的装置,其特征在于,所述当前意图获取模块,用于获取用户需要从所述服务系统获得一事件的答复时在当前时刻输入的当前语音信息,将所述当前语音信息转换为当前文本信息;基于当前文本信息获取所述用户的当前意图。
13.根据权利要求12所述的装置,其特征在于,所述当前意图获取模块,还用于对所述当前语音信息进行切分,获得多个语音信息片段;对每个所述语音信息片段进行语音识别,得到每个所述语音信息片段对应的切分文本信息,共获得多个切分文本信息。
14.根据权利要求13所述的装置,其特征在于,所述当前意图获取模块,还用于对多个切分文本信息分别进行意图识别,获得每个所述切分文本信息对应的切分意图,共获得多个切分意图;根据所述多个切分意图获得所述用户的当前意图。
15.根据权利要求12所述的装置,其特征在于,所述历史信息为多条历史文本信息,所述当前意图获取模块,还用于对所述当前文本信息进行分词,获得多个分词;获取每条所述历史文本信息的历史意图,共获得多条历史意图;提取所述多个分词之间的第一预设相关性特征,并提取所述多条历史意图之间的第二预设相关性特征;基于所述第一预设相关性特征和所述第二预设相关性特征获取所述用户的当前意图。
16.根据权利要求15所述的装置,其特征在于,所述当前意图获取模块,还用于将所述第一预设相关性特征和所述第二预设相关性特征输入Adaboost分类器,通过所述Adaboost分类器确定所述当前文本信息对应的多个初始意图中的置信度最高的意图;将所述置信度最高的意图作为所述用户的当前意图。
17.一种电子设备,其特征在于,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如权利要求1-8任一所述方法中的步骤。
18.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时运行如权利要求1-8任一所述方法中的步骤。
CN201910141242.5A 2019-02-25 2019-02-25 信息交互方法、装置、电子设备及存储介质 Pending CN111611358A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910141242.5A CN111611358A (zh) 2019-02-25 2019-02-25 信息交互方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910141242.5A CN111611358A (zh) 2019-02-25 2019-02-25 信息交互方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN111611358A true CN111611358A (zh) 2020-09-01

Family

ID=72201304

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910141242.5A Pending CN111611358A (zh) 2019-02-25 2019-02-25 信息交互方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111611358A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183098A (zh) * 2020-09-30 2021-01-05 完美世界(北京)软件科技发展有限公司 会话的处理方法和装置、存储介质、电子装置
CN112347770A (zh) * 2020-11-16 2021-02-09 北京京东尚科信息技术有限公司 交互处理方法及装置
CN113126765A (zh) * 2021-04-22 2021-07-16 北京云迹科技有限公司 一种多模态输入交互方法、装置、机器人和存储介质
WO2024065279A1 (zh) * 2022-09-28 2024-04-04 华为技术有限公司 基于用户意图预测的通信控制方法和通信装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104699784A (zh) * 2015-03-13 2015-06-10 苏州思必驰信息科技有限公司 一种基于交互式输入的数据搜索方法及装置
CN106997342A (zh) * 2017-03-27 2017-08-01 上海奔影网络科技有限公司 基于多轮交互的意图识别方法和装置
CN107589826A (zh) * 2016-07-07 2018-01-16 深圳狗尾草智能科技有限公司 基于知识图谱的人机交互方法及系统
CN107785018A (zh) * 2016-08-31 2018-03-09 科大讯飞股份有限公司 多轮交互语义理解方法和装置
CN107799116A (zh) * 2016-08-31 2018-03-13 科大讯飞股份有限公司 多轮交互并行语义理解方法和装置
US20180157959A1 (en) * 2016-12-01 2018-06-07 Shanghai Xiaoi Robot Technology Co., Ltd. Intelligent interaction method and intelligent interaction system
CN108182229A (zh) * 2017-12-27 2018-06-19 上海科大讯飞信息科技有限公司 信息交互方法及装置
CN108197191A (zh) * 2017-12-27 2018-06-22 神思电子技术股份有限公司 一种多轮对话的场景意图中断方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104699784A (zh) * 2015-03-13 2015-06-10 苏州思必驰信息科技有限公司 一种基于交互式输入的数据搜索方法及装置
CN107589826A (zh) * 2016-07-07 2018-01-16 深圳狗尾草智能科技有限公司 基于知识图谱的人机交互方法及系统
CN107785018A (zh) * 2016-08-31 2018-03-09 科大讯飞股份有限公司 多轮交互语义理解方法和装置
CN107799116A (zh) * 2016-08-31 2018-03-13 科大讯飞股份有限公司 多轮交互并行语义理解方法和装置
US20180157959A1 (en) * 2016-12-01 2018-06-07 Shanghai Xiaoi Robot Technology Co., Ltd. Intelligent interaction method and intelligent interaction system
CN106997342A (zh) * 2017-03-27 2017-08-01 上海奔影网络科技有限公司 基于多轮交互的意图识别方法和装置
CN108182229A (zh) * 2017-12-27 2018-06-19 上海科大讯飞信息科技有限公司 信息交互方法及装置
CN108197191A (zh) * 2017-12-27 2018-06-22 神思电子技术股份有限公司 一种多轮对话的场景意图中断方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183098A (zh) * 2020-09-30 2021-01-05 完美世界(北京)软件科技发展有限公司 会话的处理方法和装置、存储介质、电子装置
CN112347770A (zh) * 2020-11-16 2021-02-09 北京京东尚科信息技术有限公司 交互处理方法及装置
CN113126765A (zh) * 2021-04-22 2021-07-16 北京云迹科技有限公司 一种多模态输入交互方法、装置、机器人和存储介质
WO2024065279A1 (zh) * 2022-09-28 2024-04-04 华为技术有限公司 基于用户意图预测的通信控制方法和通信装置

Similar Documents

Publication Publication Date Title
CN109918673B (zh) 语义仲裁方法、装置、电子设备和计算机可读存储介质
EP3611895B1 (en) Method and device for user registration, and electronic device
CN109697282B (zh) 一种语句的用户意图识别方法和装置
CN107481720B (zh) 一种显式声纹识别方法及装置
JP6657124B2 (ja) 会話理解システムのためのセッションコンテキストモデリング
CN110990685B (zh) 基于声纹的语音搜索方法、设备、存储介质及装置
US9230547B2 (en) Metadata extraction of non-transcribed video and audio streams
CN111611358A (zh) 信息交互方法、装置、电子设备及存储介质
CN105956053B (zh) 一种基于网络信息的搜索方法及装置
US20030040907A1 (en) Speech recognition system
CN110415679A (zh) 语音纠错方法、装置、设备和存储介质
CN110399473B (zh) 为用户问题确定答案的方法和装置
US20180068659A1 (en) Voice recognition device and voice recognition method
KR20080024752A (ko) 채팅 에이전트를 위한 대화 관리 장치 및 그 방법
CN110457454A (zh) 一种对话方法、服务器、对话系统及存储介质
CN110581927A (zh) 通话内容的处理及提示方法、装置
CN111291158A (zh) 一种信息查询方法、装置、电子设备及存储介质
CN112347768B (zh) 一种实体识别方法及装置
CN114242047A (zh) 一种语音处理方法、装置、电子设备及存储介质
CN116049411B (zh) 一种信息匹配方法、装置、设备和可读存储介质
CN112581297A (zh) 基于人工智能的信息推送方法、装置及计算机设备
CN109273004B (zh) 基于大数据的预测性语音识别方法及装置
CN113239164B (zh) 多轮对话流程构建方法、装置、计算机设备及存储介质
CN111382265A (zh) 搜索方法、装置、设备和介质
JP2001100787A (ja) 音声対話システム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200901