CN108197189A - 主动交互方法及装置 - Google Patents

主动交互方法及装置 Download PDF

Info

Publication number
CN108197189A
CN108197189A CN201711436415.3A CN201711436415A CN108197189A CN 108197189 A CN108197189 A CN 108197189A CN 201711436415 A CN201711436415 A CN 201711436415A CN 108197189 A CN108197189 A CN 108197189A
Authority
CN
China
Prior art keywords
user
interaction
interactive
sub
interactive subject
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711436415.3A
Other languages
English (en)
Other versions
CN108197189B (zh
Inventor
王兴宝
甘艺萌
马军涛
陈志刚
汪华锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Iflytek Shanghai Mdt Infotech Ltd
Original Assignee
Iflytek Shanghai Mdt Infotech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Iflytek Shanghai Mdt Infotech Ltd filed Critical Iflytek Shanghai Mdt Infotech Ltd
Priority to CN201711436415.3A priority Critical patent/CN108197189B/zh
Publication of CN108197189A publication Critical patent/CN108197189A/zh
Application granted granted Critical
Publication of CN108197189B publication Critical patent/CN108197189B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Information Transfer Between Computers (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明实施例提供一种主动交互方法及装置,属于语音交互技术领域。该方法包括:获取当前交互流程中上一交互子流程所使用的交互主题,并确定用户在上一交互子流程中的反馈消息类型;若反馈消息类型与上一交互子流程所使用的交互主题匹配,则根据上一交互子流程所使用的交互主题、反馈消息类型及用户的用户画像,确定当前交互子流程所使用的交互主题,并基于确定的交互主题发起当前交互子流程。由于在主动交互过程中,可根据用户画像及用户在上一交互子流程中的反馈消息类型,动态确定当前交互子流程所使用的交互主题,并以确定的交互主题发起当前交互子流程,从而交互流程更有针对性,能满足不同用户的个性化交互需求。

Description

主动交互方法及装置
技术领域
本发明实施例涉及语音交互技术领域,更具体地,涉及一种主动交互方法及装置。
背景技术
随着人工智能技术的不断突破和各种智能终端设备的日益普及,人机交互在人们日常工作和生活中出现的频率越来越高。语音交互作为最便捷的交互方式之一,已经成为人机交互的重要手段。在一些应用场景下,人们需要通过人机交互过程完成不同的操作。如在疲劳驾驶场景中,用户可能会需要通过人机交互过程播放音乐。相关技术中人机交互过程通常是由用户发起,或者先确定主动交互的激活条件和固定交互流程,再监控主动激活条件,并在满足主动激活条件时,按照固定流程发起与用户之间的主动交互。由于不同用户可能会有不同的个性化交互需求,而按照固定交互流程进行主动交互时交互方式比较单一,从而不能满足不同用户的个性化交互需求。
发明内容
为了解决上述问题,本发明实施例提供一种克服上述问题或者至少部分地解决上述问题的主动交互方法及装置。
根据本发明实施例的第一方面,提供了一种主动交互方法,该方法包括:
获取当前交互流程中上一交互子流程所使用的交互主题,并确定用户在上一交互子流程中的反馈消息类型;其中,当前交互流程由多个交互子流程构成,每一交互主题对应一个交互子流程;
若反馈消息类型与上一交互子流程所使用的交互主题匹配,则根据上一交互子流程所使用的交互主题、反馈消息类型及用户的用户画像,确定当前交互子流程所使用的交互主题,并基于确定的交互主题发起当前交互子流程。
本发明实施例提供的方法,通过获取当前交互流程中上一交互子流程所使用的交互主题,并确定用户在上一交互子流程中的反馈消息类型。若反馈消息类型与上一交互子流程所使用的交互主题匹配,则根据上一交互子流程所使用的交互主题、反馈消息类型及用户的用户画像,确定当前交互子流程所使用的交互主题,并基于确定的交互主题发起当前交互子流程。由于在主动交互过程中,可根据用户画像及用户在上一交互子流程中的反馈消息类型,动态确定当前交互子流程所使用的交互主题,并以确定的交互主题发起当前交互子流程,从而交互流程更有针对性,能满足不同用户的个性化交互需求。
结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,当前交互流程中所使用的交互主题是从当前交互场景下多种预设交互主题中选取的;相应地,获取当前交互流程中上一交互子流程所使用的交互主题之前,还包括:
获取用户输入的交互场景选择指令,基于交互场景选择指令确定当前交互场景;或者,
基于预设规则,确定预设时间段内监测到的用户操作行为所匹配的交互场景,并作为当前交互场景。
结合第一方面的第二种可能的实现方式,在第三种可能的实现方式中,根据上一交互子流程所使用的交互主题、反馈消息类型及用户的用户画像,确定当前交互子流程所使用的交互主题之前,还包括:
根据用户的用户画像,确定当前交互流程下的交互主题拓扑,交互主题拓扑用于表示当前交互流程中所有可能使用到的交互主题之间的拓扑关系;
相应地,根据上一交互子流程所使用的交互主题、反馈消息类型及用户的用户画像,确定当前交互子流程所使用的交互主题,包括:
在交互主题拓扑中确定上一交互子流程所使用的交互主题在反馈消息类型对应的逻辑分支下的交互主题,并作为当前交互子流程所使用的交互主题。
结合第一方面的第二种可能的实现方式,在第四种可能的实现方式中,根据上一交互子流程所使用的交互主题、反馈消息类型及用户的用户画像,确定当前交互子流程所使用的交互主题,包括:
根据上一交互子流程所使用的交互主题,反馈消息类型及用户的用户画像,计算当前交互场景下每一指定交互主题作为当前交互子流程所使用的交互主题时的适配分值,并确定计算得到的适配分值中的最高适配分值,指定交互主题为当前交互场景下除上一交互子流程所使用的交互主题之外的预设交互主题;
若最高适配分值大于预设阈值,则将最高适配分值对应的指定交互主题作为当前交互子流程所使用的交互主题。
结合第一方面的第四种可能的实现方式,在第五种可能的实现方式中,根据上一交互子流程所使用的交互主题,反馈消息类型及用户的用户画像,计算当前交互场景下每一指定交互主题作为当前交互子流程所使用的交互主题时的适配分值,包括:
将上一交互子流程所使用的交互主题,反馈消息类型及用户的用户画像输入至交互流程生成模型,输出当前交互场景下每一指定交互主题作为当前交互子流程所使用的交互主题时的适配分值;
其中,交互流程生成模型通过如下方式构建:
基于一组影响因子,构建m个训练交互主题拓扑,一组影响因子中包含多个影响因子,每一训练交互主题拓扑对应一组影响因子的不同取值,每个影响因子对应一种用户信息,m为大于0的整数。
基于一组影响因子,确定n组训练用户画像,并从m个训练交互主题拓扑中确定与每组训练用户画像相匹配的训练交互主题拓扑,每组训练用户画像中包含一组影响因子中的多个影响因子,n为大于0的整数;
获取每组训练用户画像对应的用户在基于相匹配的训练交互主题拓扑进行交互后的满意度分值,并确定满意度分值大于满意度分值阈值的训练交互主题拓扑,作为正向训练交互主题拓扑;
基于每一正向交互主题拓扑对应的用户在训练交互流程中所使用的交互主题及反馈消息类型、以及每一正向交互主题拓扑对应的训练用户画像,对初始模型进行训练,得到交互流程生成模型。
结合第一方面的第四种可能的实现方式,在第六种可能的实现方式中,确定计算得到的适配分值中的最高适配分值之后,还包括:
若最高适配分值不大于预设阈值,则确定当前交互流程结束。
结合第一方面的第一种可能的实现方式,在第七种可能的实现方式中,该方法还包括:
若反馈消息类型与上一交互子流程所使用的交互主题不匹配,则将用户在上一交互子流程中的反馈消息输入至意图判别模型,输出用户选择的业务类型;
跳出当前交互流程,并执行用户选择的业务类型所对应的业务流程。
结合第一方面的第一种可能的实现方式,在第八种可能的实现方式中,确定用户在上一交互子流程中的反馈消息类型,包括:
将用户在上一交互子流程中的反馈消息输入至意图判别模型;
若意图判别模型的输出结果不为用户选择的业务类型,则将反馈消息输入至主题输入判别模型,输出反馈消息类型。
根据本发明实施例的第二方面,提供了一种主动交互装置,该装置包括:
第一确定模块,用于获取当前交互流程中上一交互子流程所使用的交互主题,并确定用户在上一交互子流程中的反馈消息类型;其中,当前交互流程由多个交互子流程构成,每一交互主题对应一个交互子流程;
第二确定模块,用于当反馈消息类型与上一交互子流程所使用的交互主题匹配时,则根据上一交互子流程所使用的交互主题、反馈消息类型及用户的用户画像,确定当前交互子流程所使用的交互主题,并基于确定的交互主题发起当前交互子流程。
根据本发明实施例的第三方面,提供了一种主动交互设备,包括:
至少一个处理器;以及
与处理器通信连接的至少一个存储器,其中:
存储器存储有可被处理器执行的程序指令,处理器调用程序指令能够执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的主动交互方法。
根据本发明的第四方面,提供了一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行第一方面的各种可能的实现方式中任一种可能的实现方式所提供的主动交互方法。
应当理解的是,以上的一般描述和后文的细节描述是示例性和解释性的,并不能限制本发明实施例。
附图说明
图1为本发明实施例的一种主动交互方法的流程示意图;
图2为本发明实施例的一种交互主题拓扑的结构示意图;
图3为本发明实施例的另一种交互主题拓扑的结构示意图;
图4为本发明实施例的另一种主动交互方法的流程示意图;
图5为本发明实施例的又一种主动交互方法的流程示意图;
图6为本发明实施例的一种主动交互装置的框图;
图7为本发明实施例的一种主动交互设备的框图。
具体实施方式
下面结合附图和实施例,对本发明实施例的具体实施方式作进一步详细描述。以下实施例用于说明本发明实施例,但不用来限制本发明实施例的范围。
目前人机交互在人们日常工作和生活中出现的频率越来越高。例如,人们在驾驶中可能需要与车载设备进行交互以满足自身的不同需求,如在行车过程中播放音乐或驾驶导航等。其中,人机交互过程可以由用户触发,也可以由终端或设备主动发起。相关技术中的人机交互过程主要是先确定主动交互的触发条件和固定交互流程,若当前达到触发条件,则按照固定交互流程发起与用户之间的主动交互;若当前未达到触发条件,则不与用户进行主动交互。其中,固定交互流程通常是由人工经验确定,固定交互流程的交互内容比较单一,难以满足不同用户的个性化交互需求。
针对上述情形,本发明实施例提供了一种主动交互方法。该方法可适用于不同的交互场景,交互场景可以为驾驶场景、购物场景或导航场景等,本发明实施例对此不作具体限定。另外,该方法的执行主体可以为交互场景中提供交互功能的设备或终端,本发明实施例对此也不作具体限定。参见图1,该方法包括:101、获取当前交互流程中上一交互子流程所使用的交互主题,并确定用户在上一交互子流程中的反馈消息类型;其中,当前交互流程由多个交互子流程构成,每一交互主题对应一个交互子流程;102、若反馈消息类型与上一交互子流程所使用的交互主题匹配,则根据上一交互子流程所使用的交互主题、反馈消息类型及用户的用户画像,确定当前交互子流程所使用的交互主题,并基于确定的交互主题发起当前交互子流程。
在上述步骤101中,当前交互流程可以由设备或终端发起,也可以由用户发起,本发明实施例对此不作具体限定。当前交互流程由多个交互子流程构成,每个交互子流程对应一个交互主题,每个交互子流程也可由设备或终端发起。交互子流程的交互形式可以为语音对话的形式,也可以为界面交互的形式,本发明实施例对此不作具体限定。考虑到语音对话的便捷性及实用性,本发明实施例均以语音对话的形式对交互流程进行说明。以交互子流程的交互形式为语音对话的形式为例,设备或终端可通过语音询问用户当前有什么需求或者是否要执行某项操作,用户可基于设备或终端的询问进行回复。
交互子流程中的交互内容可以由对应的交互主题所确定。具体地,若交互子流程的交互形式是由设备或终端通过语音询问用户当前是否要执行某项操作,再由用户进行回答,则设备或终端在询问用户是否要执行某项操作时,询问的具体操作项(即为交互内容)可由该交互子流程对应的交互主题确定。例如,若交互主题是疲劳主题,则交互子流程的交互内容可以为:设备或终端通过语音询问用户当前是否要休息,由用户回答是否休息。在该交互子流程中,询问用户当前是否需要休息即为询问的具体操作项,且该询问的具体操作项由疲劳主题确定。需要说明的是,交互主题除了为疲劳主题之外,还可以为音乐主题、电话主题或航班主题等,交互主题的种类可根据需求进行设置,本发明实施例对此不作具体限定。
设备或终端在向用户发起上一交互子流程后,可获取用户在上一交互子流程中输入的反馈消息。若交互子流程的交互形式为语音对话的形式,则反馈消息的形式可以为用户回复的语音消息。在获取到用户在上一交互子流程中回复的反馈消息之后,可确定反馈消息类型。以交互子流程的交互形式为由设备或终端通过语音询问用户当前是否要执行某项操作,再由用户进行回答为例,反馈消息类型可预先设置为三种,分别为肯定答复、否定答复及中性答复。其中,肯定答复对应确定执行该项操作,否定答复对应确定不执行该项操作,中性答复对应不确定是否执行该项操作。另外,上述三种反馈消息类型可通过不同的类别标志进行表示,如肯定答复可以用Po进行表示,否定答复可以用Ne进行表示,中性答复可以用In进行表示,本发明实施例对此不作具体限定。
例如,以交互主题为疲劳主题、交互子流程的交互形式为设备或终端通过语音询问用户当前是否要休息,并由用户回答是否休息为例。此时,用户的反馈消息类型可以包括当前需要休息(即对应肯定答复)、当前不需要休息(即对应否定答复)及不对是否需要休息作明确答复(即对应中性答复)。具体地,以发起交互子流程的主体为车载设备为例,若交互主题为疲劳主题,则车载设备在交互子流程中可以发起如下语音对话:“主人,请问您当前是否需要休息”。此时,驾驶者(即用户)可以回答:“嗯,需要休息”(即对应肯定答复)、“我不需要休息”(即对应否定答复)或“还好”(即对应中性答复)。上述示例中反馈消息类型与反馈消息之间的对应关系可如下表1所示:
表1
反馈消息类型 反馈消息示例 备注
Po 嗯,需要休息
Ne 我不需要休息
In 还好
当然,反馈消息类型除了为上述预先设置的三种类型之外,还可以包括其它类型,如肯定答复类型中可按照肯定程度再细划分为多种类型。具体地,以发起交互子流程的主体为车载设备为例,若交互主题为疲劳主题,则车载设备在交互子流程中可以发起如下语音对话:“主人,请问您当前是否需要休息”。此时,驾驶者(即用户)可以回答:“我很需要休息”(对应肯定答复且肯定程度较高)或“我想休息一小会儿”(对应肯定答复但肯定程度较低)。在上述示例中,肯定答复类型还可以细分为肯定程度较高的肯定答复类型及肯定程度较低的肯定答复类型。
需要说明的是,反馈消息类型主要由交互内容确定,在不同交互内容对应的交互子流程中,用户回复的反馈消息可能会对应不同的反馈消息类型。由于交互内容可以由交互主题确定,从而反馈消息类型的划分类型还可间接由交互主题所确定。
在确定用户在上一交互子流程中的反馈消息类型之前,可获取用户在上一交互子流程中的反馈消息。若反馈消息的形式为用户回复的语音消息,则可对用户回复的语音消息进行语音识别得到对应的文本消息,对文本消息进行向量化得到文本向量,将文本向量输入至主题输入判别模型,从而基于输出结果确定反馈消息的反馈消息类型。
其中,主题输入判别模型可以为分类模型,也可以为回归模型,本发明实施例对此不作具体限定。当主题输入判别模型为分类模型时,将文本向量输入至主题输入判别模型后,可直接输出反馈消息对应的反馈消息类型。当主题输入判别模型为回归模型时,将文本向量输入至主题输入判别模型后,可输出用户回复每种预先设置的反馈消息类型时的可能性分值,从所有可能性分值中选择最高可能性分值,并将最高可能性分值对应的预先设置的反馈消息类型,作为反馈消息的反馈消息类型。
需要说明的是,实际实施过程中,可为每一交互主题训练一个主题输入判别模型,也可以所有交互主题共同使用一个通用的主题输入判别模型,本发明实施例对此不作具体限定。当每一交互主题对应一个主题输入判别模型时,对于任一交互主题,可通过如下方式训练该交互主题对应的主题输入判别模型。具体地,可先获取该交互主题对应的训练语料。其中,训练语料为用户与机器进行交流时可能的对话数据。在获取该交互主题对应的训练语料后,可为每一训练语料标注对应的反馈消息类型。将每一训练语料进行向量化后得到对应的训练文本向量。将每一训练文本向量作为初始模型的输入,并基于每一训练文本向量对应的反馈消息类型对初始模型进行训练,从而得到该交互主题的主题输入判别模型。其中,初始模型可采用CNN模型,也可以采用SVM模型、逻辑回归模型或随机森林模型等,本发明实施例对此不作具体限定。
当所有交互主题共同使用一个通用的主题输入判别模型时,对于任一交互主题,可通过如下方式训练通用的主题输入判别模型。具体地,可先获取该交互主题对应的训练语料。在获取该交互主题对应的训练语料后,可为每一训练语料标注对应的反馈消息类型。将每一训练语料进行向量化后得到对应的训练文本向量,将该交互主题也转换成向量,从而将每一训练文本向量及该交互主题对应的向量作为初始模型的输入,并基于每一训练文本向量对应的反馈消息类型对初始模型进行训练,从而得到通用的主题输入判别模型。其中,初始模型可采用CNN模型,也可以采用SVM模型、逻辑回归模型或随机森林模型等,本发明实施例对此不作具体限定。当需要使用通用的主题输入判别模型确定反馈消息类型时,可将反馈消息进行向量化后,将得到的文本向量与交互主题一起作为主题输入判别模型的输入,从而直接输出反馈消息类型或输出用户回复每种预先设置的反馈消息类型时的可能性分值。
由上述内容可知,反馈消息类型的划分类型可间接由交互主题确定,从而对于任一交互主题,可预先设置与该交互主题相匹配的反馈消息类型。在执行完上述步骤101后,可判断用户在上一交互子流程中的反馈消息类型与上一交互子流程所使用的交互主题是否相匹配。具体地,可先确定与上一交互子流程所使用的交互主题相匹配的预设反馈消息类型,再将用户在上一交互子流程中的反馈消息类型与预设反馈消息类型进行比对。若用户在上一交互子流程中的反馈消息类型从属于预设反馈消息类型,则确定用户在上一交互子流程中的反馈消息类型与上一交互子流程所使用的交互主题相匹配。反之,则可确定两者之间不匹配。
例如,若交互主题为疲劳主题,基于上述示例的内容,与疲劳主题相匹配的反馈消息类型可分为肯定答复、否定答复及中性答复。当用户的反馈消息为“嗯,需要休息”时,则通过上述语音识别及语义解析的过程可确定反馈消息类型为肯定答复。当用户的反馈消息为“我不需要休息”时,则通过上述语音识别及语义解析的过程可确定反馈消息类型为否定答复。当用户的反馈消息为“还好”时,则通过上述语音识别及语义解析的过程可确定反馈消息类型为中性答复。
当用户回复上述三种反馈消息、或者回复与上述三种反馈消息含义等同但表达形式不同的其它反馈消息时,则确定的反馈消息类型均为上述三种反馈消息类型中的一种,也即确定的反馈消息类型与疲劳主题相匹配。但当用户回复明显含义不一致的反馈消息时,如用户回复的反馈消息为“我要用导航功能”,则该反馈消息的反馈消息类型并不属于上述三种反馈消息类型,而应属于上述三种反馈消息类型之外的“其它类型”,从而该反馈消息的反馈消息类型与疲劳主题并不匹配。
若用户在上一交互子流程中的反馈消息类型与上一交互子流程所使用的交互主题相匹配,则说明用户是遵照上一交互子流程中的引导进行回复。在上一交互子流程结束后,设备或终端可以继续引导用户,也即根据上一交互子流程所使用的交互主题、用户画像及用户的反馈消息类型,来确定当前交互子流程的交互主题,并基于确定的交互主题发起当前交互子流程。具体地,设备或终端可根据上一交互子流程所使用的交互主题、反馈消息类型及用户的用户画像,确定当前交互子流程所使用的交互主题,并基于确定的交互主题发起当前交互子流程。其中,用户画像可以包括用户信息,用户画像可基于用户输入的信息或用户行为信息所确定,本发明实施例对此不作具体限定。
例如,以上一交互子流程所使用的交互主题为疲劳主题且反馈消息类型为肯定答复(如反馈消息为“我需要休息”)为例。由于听音乐为缓解疲劳的一种方式,而基于用户画像可确定该用户比较喜欢听音乐,从而根据上一交互子流程所使用的疲劳主题、用户画像及反馈消息类型,可确定当前交互子流程所使用的交互主题为音乐主题,并基于音乐主题向用户发起当前交互子流程。其中,发起的形式可参考上述内容,如通过语音询问用户当前是否需要听音乐,本发明实施例对此不作具体限定。
需要说明的是,上述内容主要是上一交互子流程结束后,如何确定当前交互子流程所使用的交互主题的过程。而对于上一交互子流程所使用的交互主题,同样可采用相同的方式进行确定,即根据上上交互子流程所使用的交互主题、上上交互子流程中的反馈消息类型及用户画像来确定。同理,对于当前交互子流程的下一交互子流程,也可根据当前交互子流程所使用的交互主题、当前交互子流程中的反馈消息类型及用户画像来确定下一交互子流程所使用的交互主题。另外,当前交互流程是由多个交互子流程构成的,而这些交互子流程中存在一个起始子流程,也即设备或终端向用户发起的第一个交互子流程。对于第一个交互子流程所使用的交互主题,则不能通过上述方式来确定,从而对于第一个交互子流程所使用的交互主题,可预先指定的交互主题作为起始交互主题,本发明实施例对此不作具体限定。
本发明实施例提供的方法,通过获取当前交互流程中上一交互子流程所使用的交互主题,并确定用户在上一交互子流程中的反馈消息类型。若反馈消息类型与上一交互子流程所使用的交互主题匹配,则根据上一交互子流程所使用的交互主题、反馈消息类型及用户的用户画像,确定当前交互子流程所使用的交互主题,并基于确定的交互主题发起当前交互子流程。由于在主动交互过程中,可根据用户画像及用户在上一交互子流程中的反馈消息类型,动态确定当前交互子流程所使用的交互主题,并以确定的交互主题发起当前交互子流程,从而交互流程更有针对性,能满足不同用户的个性化交互需求。
基于上述实施例的内容,考虑到交互流程通常需要与交互场景相匹配,从而当前交互流程所适用的交互主题一般会受到当前交互场景的限制。基于上述原理,作为一种可选实施例,在执行本发明实施例提供的方法之前,可预先确定多种交互场景。例如,预先确定的交互场景可包括疲劳驾驶场景、广告播报场景、购物场景、音乐播放场景、戏曲播放场景、视频播放场景或导航场景等。另外,还可在每种交互场景下预先设置多种交互主题,以作为每种交互场景下的预设交互主题。在确定当前交互场景后,当前交互流程中所使用的交互主题可从当前交互场景下的多种预设交互主题中选取。例如,若当前交互场景为疲劳驾驶场景,则疲劳驾驶场景下的预设交互主题可如下表2所示:
表2
在上述表2中,疲劳驾驶场景下的预设交互主题包括:疲劳、音乐、相声、笑话、服务区、提醒、道歉、风格及聊天。当然,除了上表2中列举的预设交互主题之外,疲劳驾驶场景下还可以根据需求设置其它预设交互主题,本发明实施例对此不作具体限定。同理,每种交互场景下的预设交互主题也可以根据需求进行配置,本发明实施例不对每种交场景下预设交互主题的类型及数量作具体限定。需要说明的是,不同类型的交互场景下可能会包括相同类型的预设交互主题,如疲劳驾驶场景下用户因需要休息放松,从而疲劳驾驶场景下的预设交互主题可包括音乐主题。而音乐播放场景下的预设交互主题同样可包括音乐主题。也即,一种交互场景可对应多种预设交互主题,而一种预设交互主题同样可对应多种交互场景。
由上述实施例的内容可知,当前交互流程中所使用的交互主题可从当前交互场景下的多种预设交互主题中选取,从而在获取当前交互流程中上一交互子流程所使用的交互主题之前,还可确定当前交互场景。相应地,基于上述实施例的内容,作为一种可选实施例,本发明实施例还提供了一种确定当前交互场景的方法,该方法包括:获取用户输入的交互场景选择指令,基于交互场景选择指令确定当前交互场景;或者,基于预设规则,确定预设时间段内监测到的用户操作行为所匹配的交互场景,并作为当前交互场景。
其中,交互场景选择指令可以为用户输入的语音指令,也可以为用户通过操作界面输入的操作指令,本发明实施例对此不作具体限定。预设规则的内容及预设时间段的长度可以根据需求进行设定,本发明实施例对此也不作具体限定。例如,以预设规则为疲劳驾驶判定规则为例。若监测到用户持续驾驶了2个小时,则可确定当前交互场景为疲劳驾驶场景。其中,预设时间段的长度即为2小时,用户操作行为即为驾驶行为。再例如,以预设规则为广告投放规则为例,若监测到用户在广告界面中停留时间持续了10秒,则可确定当前交互场景为广告播报场景。其中,预设时间段的长度即为10秒,用户操作行为即为在广告界面中停留行为。当然,除了上述示例之外,预设规则的内容及预设时间段的长度还可以根据需求进行其它设定,本发明实施例对此不作具体限定。
在确定当前交互场景后,当前交互流程中所使用的交互主题均可从当前交互场景下的预设交互主题中选取,当前交互流程中每一交互子流程都对应一个交互主题。对于当前交互流程中的起始交互子流程,可从当前交互场景下的预设交互主题中预先选取一个预设交互主题,以作为起始交互子流程所使用的交互主题。
例如,若当前交互场景为疲劳驾驶场景,则当前交互流程中的起始交互主题可以为疲劳主题,当前交互流程中起始交互子流程的交互内容即可由疲劳主题所确定。
由上述实施例的内容可知,反馈消息类型主要由交互内容确定,用户在不同交互内容的交互子流程中,可能会有不同的反馈消息类型。而由于交互内容可以由交互主题确定,从而反馈消息类型的划分类型还可间接由交互主题所确定。而在确定交互场景后,交互流程所使用的交互主题可从该交互场景下的预设交互主题中选取,且交互流程中起始交互子流程所使用的起始交互主题也可以预先确定。另外,若用户在上一交互子流程中的反馈消息类型与上一交互子流程所使用的交互主题匹配,则根据上一交互子流程所使用的交互主题、反馈消息类型及用户的用户画像,可确定当前交互子流程所使用的交互主题。结合上述内容可知,在确定用户画像及当前交互场景之后,若用户在每一交互子流程中的反馈消息类型与每一交互子流程所使用的交互主题都是匹配的,则当前交互场景下该用户所有可能出现的交互流程都是确定的。
为了更形象地描述上述原理,可将交互流程中每一交互子流程所使用的交互主题作为一个节点,每一交互主题所确定的反馈消息类型的划分类型可作为该节点下的不同逻辑分支,不同的逻辑分支连接着不同的下一交互子流程所使用的交互主题,也即连接着不同的下一节点。由于当前交互场景确定后,起始交互主题(即起始节点)也是确定的,若以每一节点代表每一交互子流程,则基于用户画像可构建出该用户在当前交互场景下所有可能出现的交互流程,每种可能出现的交互流程均由一个个节点连接而成,在前的节点代表先发起的交互子流程,在后的节点代表后发起的交互子流程。
基于上述内容,作为一种可选实施例,在根据上一交互子流程所使用的交互主题、反馈消息类型及用户的用户画像,确定当前交互子流程所使用的交互主题之前,还包括:根据用户的用户画像,确定当前交互流程下的交互主题拓扑,交互主题拓扑用于表示当前交互流程中所有可能使用到的交互主题之间的拓扑关系。
例如,基于上表2中的内容,以当前交互场景为疲劳驾驶场景,起始交互主题为疲劳主题为例。由上述实施例内容可知,与疲劳主题相匹配的反馈消息类型可以包括肯定答复、否定答复及中性答复。若用户在起始交互子流程中的反馈消息类型为肯定答复、且根据疲劳主题、用户画像及用户在起始交互子流程中的反馈消息类型(肯定答复),确定起始交互子流程的下一交互子流程所使用的交互主题为音乐主题,则以疲劳主题为起始节点,可确定起始节点在肯定答复对应的逻辑分值下所连接的节点。其中,该节点对应的交互主题即为音乐主题。
同理,若用户在起始交互子流程中的反馈消息类型为否定答复、且根据疲劳主题、用户画像及用户在起始交互子流程中的反馈消息类型(否定答复),确定起始交互子流程的下一交互子流程所使用的交互主题为提醒主题,则以疲劳主题为起始节点,可确定起始节点在否定答复对应的逻辑分值下所连接的节点。其中,该节点对应的交互主题即为提醒主题。
若用户在起始交互子流程中的反馈消息类型为中性答复、且根据疲劳主题、用户画像及用户在起始交互子流程中的反馈消息类型(中性答复),确定起始交互子流程的下一交互子流程所使用的交互主题为道歉主题,则以疲劳主题为起始节点,可确定起始节点在中性答复对应的逻辑分支下所连接的节点。其中,该节点对应的交互主题即为道歉主题。
经过上述处理过程后,可得到两层结构的交互主题拓扑。如图2所示,图2中BEG即表示起始节点。由表2可知,BEG节点对应的交互主题即为疲劳主题。BEG节点在不同的逻辑分支下所连接的节点分别为A节点、E节点及F节点。由表2可知,A节点对应的交互主题即为音乐主题,B节点对应的交互主题即为提醒主题,F节点对应的交互主题即为道歉主题。在图2中,A节点、E节点及F节点在交互主题拓扑中的上一级节点均为BEG节点。
按照上述流程,可继续确定A节点、E节点及F节点在不同的逻辑分支下所连接的节点。如图3所示,A节点在不同的逻辑分支下所连接的节点分别为G节点、H节点及F节点,G节点、H节点及F节点后面连接的节点均为END节点。而对于BEG节点的下一级E节点及F节点,E节点与F节点后面连接的节点均为END节点。由表2可知,G节点对应的交互主题为风格主题,H节点对应的交互主题为聊天主题,F节点对应的交互主题为道歉主题,END节点表示结束节点,即代表交互流程结束。需要说明的是,图3中给出的是在疲劳驾驶场景下,基于用户画像所确定的其中一种交互主题拓扑。不同的用户画像在相同交互场景下所确定交互主题拓扑可能会不同,本发明实施例对此不作具体限定。
在确定当前交互流程下的交互主题拓扑之后,可在交互主题拓扑中确定上一交互子流程所使用的交互主题在反馈消息类型对应的逻辑分支下的交互主题,并作为当前交互子流程所使用的交互主题。例如,以上一交互子流程所使用的交互主题为疲劳主题为例,即上一交互子流程在交互主题拓扑中对应的节点为BEG节点。若用户在上一交互子流程中的反馈消息类型为肯定答复,如图3所示,交互主题拓扑中BEG节点在肯定答复对应的逻辑分支下的节点为A节点,即交互主题拓扑中疲劳主题在肯定答复对应的逻辑分支下的交互主题为音乐主题。
本发明实施例提供的方法,通过根据用户的用户画像,确定当前交互流程下的交互主题拓扑。在交互主题拓扑中确定上一交互子流程所使用的交互主题在反馈消息类型对应的逻辑分支下的交互主题,并作为当前交互子流程所使用的交互主题。由于在确定用户画像及当前交互场景后,即可确定该用户在当前交互场景下所有可能的交互流程,从而后续可直接根据用户在不同交互子流程中的反馈消息类型,执行与该用户交互需求相匹配的交互流程。因此,可提升用户的交互体验。
在上述实施例中,在发起当前交互子流程之前,需要根据上一交互子流程所使用的交互主题、用户在上一交互子流程中的反馈消息类型及用户的用户画像,确定用户在当前交互子流程中所使用的交互主题。另外,在确定交互主题拓扑时,也需要根据上一交互子流程所使用的交互主题、用户在上一交互子流程中的反馈消息类型及用户的用户画像,确定用户在当前交互子流程中所使用的交互主题。
基于上述实施例的内容,作为一种可选实施例,本发明实施例还提供了一种确定用户在当前交互子流程中所使用的交互主题的方法。参加图4,该方法包括:1021、根据上一交互子流程所使用的交互主题,反馈消息类型及用户的用户画像,计算当前交互场景下每一指定交互主题作为当前交互子流程所使用的交互主题时的适配分值,并确定计算得到的适配分值中的最高适配分值;1022、若最高适配分值大于预设阈值,则将最高适配分值对应的指定交互主题作为当前交互子流程所使用的交互主题。
在上述步骤1021中,在计算适配分值时,可通过交互流程生成模型计算。具体地,可将上一交互子流程所使用的交互主题、用户在上一交互子流程中的反馈消息类型及用户的用户画像,输入至交互流程生成模型中,输出当前交互场景下每一指定交互主题作为当前交互子流程所使用的交互主题时的适配分值。其中,指定交互主题指的是当前交互场景下除上一交互子流程所使用的交互主题之外的预设交互主题。
例如,以当前交互场景为疲劳驾驶场景、上一交互子流程所使用的交互主题为疲劳主题、用户在上一交互子流程中的反馈消息类型为肯定回复为例。将疲劳主题(上一交互子流程所使用的交互主题)、肯定回复(用户在上一交互子流程中的反馈消息类型)及用户画像输入至交互流程生成模型,从而可输出疲劳驾驶场景下每一指定交互主题作为当前交互子流程所使用的交互主题时的适配分值。其中,疲劳驾驶场景下的指定交互主题可以包括上表2中除疲劳主题之外的交互主题。在计算得到疲劳驾驶场景下每一指定交互主题对应的适配分值后,可确定计算得到的适配分值中的最高适配分值。
需要说明的是,上述实施例中所使用的当前交互流程下的交互主题拓扑同样可以基于交互流程生成模型确定,本发明实施例对此不作具体限定。具体地,由于在确定交互场景后,交互流程中起始交互子流程所使用的起始交互主题可以预先确定,从而对于起始交互子流程的下一交互子流程,可通过交互流程生成模型,计算当前交互场景下除起始交互主题之外的每一交互主题作为该下一交互子流程所使用的交互主题时的适配分值,选取最高适配分值对应的将交互主题作为该下一交互子流程所使用的交互主题。后面的交互子流程依次类推,从而可确定起始交互主题后面不同逻辑分支下的各个交互主题,即可得到交互主题拓扑。
其中,交互流程生成模型可通过如下方式构建:
基于一组影响因子,构建m个训练交互主题拓扑,一组影响因子中包含多个影响因子,每一训练交互主题拓扑对应一组影响因子的不同取值,每个影响因子对应一种用户信息,m为大于0的整数。
基于一组影响因子,确定n组训练用户画像,并从m个训练交互主题拓扑中确定与每组训练用户画像相匹配的训练交互主题拓扑,每组训练用户画像中包含一组影响因子中的多个影响因子,n为大于0的整数;
获取每组训练用户画像对应的用户在基于相匹配的训练交互主题拓扑进行交互后的满意度分值,并确定满意度分值大于满意度分值阈值的训练交互主题拓扑,作为正向训练交互主题拓扑;
获取每一正向交互主题拓扑对应的用户在交互流程中的反馈消息类型集合,并基于每一正向交互主题拓扑中对应的反馈消息类型集合及每一正向交互主题拓扑对应的训练用户画像训练初始模型,得到交互流程生成模型。
其中,初始模型可以为神经网络模型,如循环神经网络(RNN,Recurrent NeuralNetworks)模型等,本发明实施例对此不作具体限定。具体地,上述构建交互流程生成模型的过程可通过如下示例说明:
(1)基于用户信息,确定当前交互场景下的一组影响因子。例如,疲劳驾驶场景的影响因子可以包括:年龄、性别、爱好、经常驾驶场景、驾驶习惯等。
(2)根据每一影响因子及每一影响因子对应的取值,构建m个训练交互主题拓扑。其中,每一训练交互主题拓扑对应一组影响因子的不同取值,每个影响因子对应一种用户信息。例如,m个训练交互主题拓扑中其中一个训练交互主题拓扑对应的影响因子可以为“30<年龄<40、性别=男性、经常驾驶场景=高速”。
(3)通过n1个用户来使用交互系统,第一次启动系统时用户根据界面提示,选择与自身相匹配的影响因子,从而可确定n1组训练用户画像。其中,每组训练用户画像中包含一组影响因子中的多个影响因子。交互系统自动从m个训练交互主题拓扑中决策出与每组训练用户画像相匹配的训练交互主题拓扑。
(4)n1个用户使用各自对应的训练交互主题拓扑进行交互,记录每一用户每次交互时的反馈消息类型(例如:Po、Ne、In),并获取每一用户在使用各自对应的训练交互主题拓扑进行交互后的满意度分值。(其中,满意度分值的取值范围可以为0-10分)。
(5)根据用户对各自对应的训练交互主题拓扑的满意度分值,确定满意度分值阈值(如为5)。将满意度分值不小于满意度分值阈值的训练交互主题拓扑作为正向交互主题拓扑,将满意度分值小于满意度分值阈值的训练交互主题拓扑作为负向交互主题拓扑。将每一正向交互主题拓扑对应的用户在训练交互流程中所使用的交互主题及反馈消息类型、以及每一正向交互主题拓扑对应的训练用户画像作为正向数据,将每一负向交互主题拓扑对应的用户在训练交互流程中所使用的交互主题及反馈消息类型、以及每一正向交互主题拓扑对应的训练用户画像作为反向数据。正向数据构成的正向数据集合为PD(满意度分值>=5),反向数据构成的反向数据集合QD(满意度分值<5),其中,正向数据集合中正向数据的数量与反向数据集合中反向数据的数量之和为n1。
(6)训练初始模型时的输入特征:当前交互主题、训练反馈消息类型(例如:Po、Ne、In)、用户画像(例如:性别、年龄、爱好、驾驶习惯、经常驾驶环境等)。其中,输入特征是正向数据集合中的正向数据。
(7)根据输入特征先随机生成交互主题拓扑,然后不断迭代更新模型参数,使生成的树状拓扑结构和正向树状拓扑结构相似度越大,与反向树状拓扑结构结构相似度越小,从而可得到交互流程生成模型。
在得到交互流程生成模型后,可通过用户的数据不断更新交互流程生成模型,并更新用户的最佳交互主题拓扑。具体地,可重新确定另外n2个用户,通过交互流程生成模型生成每个用户的训练交互主题拓扑。其中,n2个用户使用各自对应的训练交互主题拓扑,记录每一用户每次交互时的反馈消息类型(如Po、Ne、In)以及最终用户的满意度分值(如0-10分)。根据用户对训练交互主题拓扑打分后的满意度分值,重新设置一个满意度分值阈值(如为5),并按照上述过程将获取到的数据分为新的正向数据集合PD’(满意度分值>=5)和新的反向数据集合QD’(满意度分值<5)。其中,正向数据集合中正向数据的数量与反向数据集合中反向数据的数量之和为n2。
通过新的一批正向和反向数据再次更新模型,可得到新的交互流程生成模型,具体地,将新正向数据特征输入当前交互流程生成模型,依据与新正向数据相似度大的交互主题拓扑,以及与新反向数据相似度小的交互主题拓扑来调整交互流程生成模型的参数,以对交互流程生成模型进行更新。需要说明的是,当使用的用户越来越多后,当用户越来越多之后,该交互流程生成模型的效果就会越好。相应地,用户体验度会提升,整个交互流程生成过程闭环优化。
另外,在计算树状结构的相似度时,本发明实施例采用一种层次遍历的方法。以TreeA和TreeB为例,计算相似度的详细步骤如下:
(1)表示TreeA的层数以及每一层对应的结点集,如层数i表示,每层个数Cai,表示TreeB的层数以及每一层对应的结点集,如层数i表示,每层个数Cbi。
(2)针对每一层都赋予不同的权重,a1/a2/…/an。
(3)计算每一层两棵树相同结点个数S,则两者相似度score(TreeA,TreeB)=ai*(2*S/(CAi+CBi))。
在确定计算得到的适配分值中的最高适配分值之后,可继续判断最高适配分值是否大于预设阈值。若最高适配分值大于预设阈值,则可说明最高适配分值对应的指定交互主题作为当前交互子流程所使用的交互主题是比较合适的,按照该指定交互主题发起当前交互子流程比较符合用户的交互需求。因此,可将最高适配分值对应的指定交互主题作为当前交互子流程所使用的交互主题。
例如,若将疲劳主题(上一交互子流程所使用的交互主题)、肯定回复(用户在上一交互子流程中的反馈消息类型)及用户画像输入至交互流程生成模型后,计算得到的最高适配分值对应的交互主题为音乐主题,且最高适配分值大于预设阈值,则可将音乐主题作为当前交互子流程所使用的交互主题。
若将疲劳主题(上一交互子流程所使用的交互主题)、否定回复(用户在上一交互子流程中的反馈消息类型)及用户画像输入至交互流程生成模型后,计算得到的最高适配分值对应的交互主题为提醒主题,且最高适配分值大于预设阈值,则可将提醒主题作为当前交互子流程所使用的交互主题。
若将疲劳主题(上一交互子流程所使用的交互主题)、中性回复(用户在上一交互子流程中的反馈消息类型)及用户画像输入至交互流程生成模型后,计算得到的最高适配分值对应的交互主题为道歉主题,且最高适配分值大于预设阈值,则可将道歉主题作为当前交互子流程所使用的交互主题。
上述三种情况所确定的交互主题拓扑可参考图2。基于上述三种情况的结果,按照上述流程继续确定后续交互子流程所使用的交互主题,最终得到的交互主题拓扑可参考图3。
考虑到按照上述流程在确定当前交互子流程所使用的交互主题时,确定的交互主题可能不一定能满足当前用户的交互需求,从而作为一种可选实施例,在确定计算得到的适配分值中的最高适配分值之后,若最高适配分值不大于预设阈值,则确定当前交互流程结束。
其中,当最高适配分值不大于预设阈值时,则说明按照每一指定交互主题发起当前交互子流程都不符合用户的交互需求,从而所有指定交互主题作为当前交互子流程所使用的交互主题都不太合适。
例如,若上一交互流程中所使用的交互主题为提醒主题,即对应图3中的E节点。而在计算每一指定交互主题对应的适配分值时,若计算得到的适配分值中最高适配分值也小于预设阈值,则说明没有合适的交互主题作为下一交互子流程所使用的交互主题。此时,可如图3所示跳转至END节点,表示当前交互流程结束。
本发明实施例提供的方法,通过根据上一交互子流程所使用的交互主题,反馈消息类型及用户的用户画像,计算当前交互场景下每一指定交互主题作为当前交互子流程所使用的交互主题时的适配分值,并确定计算得到的适配分值中的最高适配分值。若最高适配分值大于预设阈值,则将最高适配分值对应的指定交互主题作为当前交互子流程所使用的交互主题。若最高适配分值不大于预设阈值,则确定当前交互流程结束。由于可根据用户画像选取与用户交互需求相匹配的交互主题,从而可满足用户个性化的需求,提升用户的交互体验。
考虑到用户在当前交互流程中,可能会回复具有明显意图的反馈消息。例如,设备或终端询问用户“主人,请问您当前是否需要休息”,用户可能不会回复预先设置的反馈消息类型对应的反馈消息,如“嗯,需要休息”(即对应肯定答复)、“我不需要休息”(即对应否定答复)或“还好”(即对应中性答复),而是会回复具有明显意图的反馈消息,如“导航到万达广场”或“打电话给张三”等。此时,继续执行当前交互流程没有意义,而是需要按照用户的明显意图执行用户指定的业务流程。针对上述需求,基于上述实施例的内容,作为一种可选实施例,本发明实施例还提供了一种按照用户明显意图执行业务流程的方法,该方法包括:若反馈消息类型与上一交互子流程所使用的交互主题不匹配,则将用户在上一交互子流程中的反馈消息输入至意图判别模型,输出用户选择的业务类型;跳出当前交互流程,并执行用户选择的业务类型所对应的业务流程。
由上述实施例的内容可知,对于任一交互流程,用户在该交互流程中回复的反馈消息类型可能与预先设置的反馈消息类型(与该交互流程所使用的交互主题相对应)并不一致,也即属于“其它类型”。此时,用户在该交互流程中的反馈消息很有可能是没有按照交互流程的引导所作出的回复,而是带有明确意图的回复。因此,当用户在上一交互子流程中的反馈消息类型与上一交互子流程所使用的交互主题不匹配时,可将用户在上一交互子流程中的反馈消息输入至意图判别模型,输出用户选择的业务类型。
在上述过程中,若反馈消息为语音消息,则可先将反馈消息进行向量化,得到相应的语音向量。再将语音向量输入至意图判别模型中,从而输出用户选择的业务类型。其中,业务类型可通过业务意图ID号进行表示。
与主题输入判别模型相似,意图判别模型可以为分类模型,也可以为回归模型,本发明实施例对此不作具体限定。当意图判别模型为分类模型时,将语音向量输入至意图判别模型后,可直接输出用户选择的业务类型。当意图判别模型为回归模型时,将语音向量输入至意图判别模型后,可输出用户选择每种业务类型时的可能性分值,从所有可能性分值中选择最高可能性分值,并将最高可能性分值对应的业务类型作为用户选择的业务类型。
另外,在执行上述过程之前,还可以训练意图判别模型。具体地,可预先针对每种业务类型获取相应的训练语料,并为每一训练语料标注相应的业务意图ID号。将训练语料作为初始模型的输入,并基于每一训练语料相应的业务意图ID号,对初始模型进行训练,从而得到意图判别模型。其中,初始模型可以为CNN模型,还可以为SVM模型、逻辑回归模型或随机森林模型等,本发明实施例对此不作具体限定。训练语料与业务意图ID号之间对应关系可通过如下示例表示:
训练语料:“我想听流行歌”------------->ID:“3”
训练语料:“导航到万达广场”------------->ID:“4”
训练语料:“我想听广播”------------->ID:“6”
另外,业务类型的划分可如下表3所示:
表3
ID 意图 描述 备注
1 fatigueDrivingTips 疲劳驾驶提醒
2 weatherTips 天气提醒
3 music 听音乐
4 navi 导航
5 telephone 打电话
6 radio 听收音机
7 flight 航班
8 train 火车
9 weather 天气
10 other 其他 无明确意图的反馈消息
在上表3中,业务意图ID号1-9对应不同的业务类型,用户选择的业务类型可以为上表3中1-9种业务类型中的任意一种。当然,实际实施过程中,供用户选择的业务类型除了表3中列举的业务类型之外,还可以包含其它业务类型,本发明实施例对此不作具体限定。需要说明的是,上表3中“Other”表示没有明确意图的反馈消息对应的非业务类型。将用户在上一交互子流程中的反馈消息输入至意图判别模型,输出用户选择的业务类型后,可跳出当前交互流程,并执行用户选择的业务类型所对应的业务流程。
需要说明的是,上述过程中主要是先通过主题输入判别模型,确定用户在上一交互子流程中的反馈消息类型与上一交互子流程中的交互主题是否匹配。若两者不匹配,再通过意图判别模型确定用户通过反馈消息所选择的业务类型。也即,先执行主题输入判别模型对应的判别流程,再执行意图判别模型对应的判别流程。此时,主题输入判别模型所输出的反馈信息类型,可多一种类型,即上述实施例中与交互主题不匹配的“其它类型”。意图判别模型输出的业务类型可以少一种类型,即上表3中的“Other”类型。
实际实施过程中,还可先执行意图判别模型对应的判别流程,再执行主题输入判别模型对应的判别流程。相应地,作为一种可选实施例,本发明实施例还提供了一种确定用户在上一交互子流程中的反馈消息类型的方法。参见图5,该方法包括:1011、将用户在上一交互子流程中的反馈消息输入至意图判别模型;1012、若意图判别模型的输出结果不为用户选择的业务类型,则将反馈消息输入至主题输入判别模型,输出反馈消息类型。
例如,将用户在上一交互子流程中的反馈消息输入至意图判别模型后,若意图判别模型的输出结果为表3中的“other”类,也即代表没有明显意图,则可将反馈消息输入至主题输入判别模型,从而输出反馈消息类型。此时,主题输入判别模型所输出的反馈信息类型,可少一种类型,即上述实施例中与交互主题不匹配的“其它类型”。意图判别模型输出的业务类型可以多一种类型,即上表3中的“Other”类型。
本发明实施例提供的方法,通过在反馈消息类型与上一交互子流程所使用的交互主题不匹配时,则将用户在上一交互子流程中的反馈消息输入至意图判别模型,输出用户选择的业务类型。跳出当前交互流程,并执行用户选择的业务类型所对应的业务流程。由于可根据用户需求随时跳出交互流程,并执行用户选择的业务类型所对应的业务流程,从而可满足用户执行不同业务的需求。
为了便于理解上述交互流程,现以当前交互场景为“疲劳驾驶场景”为例。车载设备与用户之间的交互流程可参考如下表4:
表4
需要说明的是,上述所有可选实施例,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
基于上述实施例的内容,本发明实施例提供了一种主动交互装置,该主动交互装置用于执行上述方法实施例中提供的主动交互方法。参见图6,该装置包括:
第一确定模块601,用于获取当前交互流程中上一交互子流程所使用的交互主题,并确定用户在上一交互子流程中的反馈消息类型;其中,当前交互流程由多个交互子流程构成,每一交互主题对应一个交互子流程;
第二确定模块602,用于当反馈消息类型与上一交互子流程所使用的交互主题匹配时,则根据上一交互子流程所使用的交互主题、反馈消息类型及用户的用户画像,确定当前交互子流程所使用的交互主题,并基于确定的交互主题发起当前交互子流程。
作为一种可选实施例,当前交互流程中所使用的交互主题是从当前交互场景下多种预设交互主题中选取的;相应地,该装置还包括:
获取模块,用于获取用户输入的交互场景选择指令,基于交互场景选择指令确定当前交互场景;或者,
第三确定模块,用于基于预设规则,确定预设时间段内监测到的用户操作行为所匹配的交互场景,并作为当前交互场景。
作为一种可选实施例,该装置还包括:
第四确定模块,用于根据用户的用户画像,确定当前交互流程下的交互主题拓扑,交互主题拓扑用于表示当前交互流程中所有可能使用到的交互主题之间的拓扑关系;
相应地,第二确定模块602,用于在交互主题拓扑中确定上一交互子流程所使用的交互主题在反馈消息类型对应的逻辑分支下的交互主题,并作为当前交互子流程所使用的交互主题。
作为一种可选实施例,第二确定模块602,用于根据上一交互子流程所使用的交互主题,反馈消息类型及用户的用户画像,计算当前交互场景下每一指定交互主题作为当前交互子流程所使用的交互主题时的适配分值,并确定计算得到的适配分值中的最高适配分值,指定交互主题为当前交互场景下除上一交互子流程所使用的交互主题之外的预设交互主题;若最高适配分值大于预设阈值,则将最高适配分值对应的指定交互主题作为当前交互子流程所使用的交互主题。
作为一种可选实施例,,第二确定模块602,用于将上一交互子流程所使用的交互主题,反馈消息类型及用户的用户画像输入至交互流程生成模型,输出当前交互场景下每一指定交互主题作为当前交互子流程所使用的交互主题时的适配分值;
其中,交互流程生成模型通过如下方式构建:
基于一组影响因子,构建m个训练交互主题拓扑,一组影响因子中包含多个影响因子,每一训练交互主题拓扑对应一组影响因子的不同取值,每个影响因子对应一种用户信息,m为大于0的整数。
基于一组影响因子,确定n组训练用户画像,并从m个训练交互主题拓扑中确定与每组训练用户画像相匹配的训练交互主题拓扑,每组训练用户画像中包含一组影响因子中的多个影响因子,n为大于0的整数;
获取每组训练用户画像对应的用户在基于相匹配的训练交互主题拓扑进行交互后的满意度分值,并确定满意度分值大于满意度分值阈值的训练交互主题拓扑,作为正向训练交互主题拓扑;
基于每一正向交互主题拓扑对应的用户在训练交互流程中所使用的交互主题及反馈消息类型、以及每一正向交互主题拓扑对应的训练用户画像,对初始模型进行训练,得到交互流程生成模型。
作为一种可选实施例,该装置还包括:
第五确定模块,用于当最高适配分值不大于预设阈值时,则确定当前交互流程结束。
作为一种可选实施例,该装置还包括:
输出模块,用于当反馈消息类型与上一交互子流程所使用的交互主题不匹配时,则将用户在上一交互子流程中的反馈消息输入至意图判别模型,输出用户选择的业务类型;
跳出模块,用于跳出当前交互流程,并执行用户选择的业务类型所对应的业务流程。
作为一种可选实施例,第一确定模块601,用于将用户在上一交互子流程中的反馈消息输入至意图判别模型;若意图判别模型的输出结果不为用户选择的业务类型,则将反馈消息输入至主题输入判别模型,输出反馈消息类型。
本发明实施例提供的装置,通过获取当前交互流程中上一交互子流程所使用的交互主题,并确定用户在上一交互子流程中的反馈消息类型。若反馈消息类型与上一交互子流程所使用的交互主题匹配,则根据上一交互子流程所使用的交互主题、反馈消息类型及用户的用户画像,确定当前交互子流程所使用的交互主题,并基于确定的交互主题发起当前交互子流程。由于在主动交互过程中,可根据用户画像及用户在上一交互子流程中的反馈消息类型,动态确定当前交互子流程所使用的交互主题,并以确定的交互主题发起当前交互子流程,从而交互流程更有针对性,能满足不同用户的个性化交互需求。
另外,通过根据用户的用户画像,确定当前交互流程下的交互主题拓扑。在交互主题拓扑中确定上一交互子流程所使用的交互主题在反馈消息类型对应的逻辑分支下的交互主题,并作为当前交互子流程所使用的交互主题。由于在确定用户画像及当前交互场景后,即可确定该用户在当前交互场景下所有可能的交互流程,从而后续可直接根据用户在不同交互子流程中的反馈消息类型,执行与该用户交互需求相匹配的交互流程。因此,可提升用户的交互体验。
最后,通过在反馈消息类型与上一交互子流程所使用的交互主题不匹配时,则将用户在上一交互子流程中的反馈消息输入至意图判别模型,输出用户选择的业务类型。跳出当前交互流程,并执行用户选择的业务类型所对应的业务流程。由于可根据用户需求随时跳出交互流程,并执行用户选择的业务类型所对应的业务流程,从而可满足用户执行不同业务的需求。
本发明实施例提供了一种主动交互设备。参见图7,该设备包括:处理器(processor)701、存储器(memory)702和总线703;
其中,处理器701及存储器702分别通过总线703完成相互间的通信;
处理器701用于调用存储器702中的程序指令,以执行上述实施例所提供的主动交互方法,例如包括:获取当前交互流程中上一交互子流程所使用的交互主题,并确定用户在上一交互子流程中的反馈消息类型;其中,当前交互流程由多个交互子流程构成,每一交互主题对应一个交互子流程;若反馈消息类型与上一交互子流程所使用的交互主题匹配,则根据上一交互子流程所使用的交互主题、反馈消息类型及用户的用户画像,确定当前交互子流程所使用的交互主题,并基于确定的交互主题发起当前交互子流程。
本发明实施例提供一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令使计算机执行上述实施例所提供的主动交互方法,例如包括:获取当前交互流程中上一交互子流程所使用的交互主题,并确定用户在上一交互子流程中的反馈消息类型;其中,当前交互流程由多个交互子流程构成,每一交互主题对应一个交互子流程;若反馈消息类型与上一交互子流程所使用的交互主题匹配,则根据上一交互子流程所使用的交互主题、反馈消息类型及用户的用户画像,确定当前交互子流程所使用的交互主题,并基于确定的交互主题发起当前交互子流程。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的主动交互设备等实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分方法。
最后,本申请的方法仅为较佳的实施方案,并非用于限定本发明实施例的保护范围。凡在本发明实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。

Claims (11)

1.一种主动交互方法,其特征在于,包括:
获取当前交互流程中上一交互子流程所使用的交互主题,并确定用户在所述上一交互子流程中的反馈消息类型;其中,所述当前交互流程由多个交互子流程构成,每一交互主题对应一个交互子流程;
若所述反馈消息类型与所述上一交互子流程所使用的交互主题匹配,则根据所述上一交互子流程所使用的交互主题、所述反馈消息类型及所述用户的用户画像,确定当前交互子流程所使用的交互主题,并基于确定的交互主题发起所述当前交互子流程。
2.根据权利要求1所述的方法,其特征在于,所述当前交互流程中所使用的交互主题是从当前交互场景下多种预设交互主题中选取的;相应地,所述获取当前交互流程中上一交互子流程所使用的交互主题之前,还包括:
获取所述用户输入的交互场景选择指令,基于所述交互场景选择指令确定所述当前交互场景;或者,
基于预设规则,确定预设时间段内监测到的用户操作行为所匹配的交互场景,并作为所述当前交互场景。
3.根据权利要求2所述的方法,其特征在于,所述根据所述上一交互子流程所使用的交互主题、所述反馈消息类型及所述用户的用户画像,确定当前交互子流程所使用的交互主题之前,还包括:
根据所述用户的用户画像,确定所述当前交互流程下的交互主题拓扑,所述交互主题拓扑用于表示所述当前交互流程中所有可能使用到的交互主题之间的拓扑关系;
相应地,所述根据所述上一交互子流程所使用的交互主题、所述反馈消息类型及所述用户的用户画像,确定当前交互子流程所使用的交互主题,包括:
在所述交互主题拓扑中确定所述上一交互子流程所使用的交互主题在所述反馈消息类型对应的逻辑分支下的交互主题,并作为当前交互子流程所使用的交互主题。
4.根据权利要求2所述的方法,其特征在于,所述根据所述上一交互子流程所使用的交互主题、所述反馈消息类型及所述用户的用户画像,确定当前交互子流程所使用的交互主题,包括:
根据所述上一交互子流程所使用的交互主题,所述反馈消息类型及所述用户的用户画像,计算所述当前交互场景下每一指定交互主题作为所述当前交互子流程所使用的交互主题时的适配分值,并确定计算得到的适配分值中的最高适配分值,所述指定交互主题为所述当前交互场景下除所述上一交互子流程所使用的交互主题之外的预设交互主题;
若所述最高适配分值大于预设阈值,则将所述最高适配分值对应的指定交互主题作为所述当前交互子流程所使用的交互主题。
5.根据权利要求4所述的方法,其特征在于,所述根据所述上一交互子流程所使用的交互主题,所述反馈消息类型及所述用户的用户画像,计算所述当前交互场景下每一指定交互主题作为所述当前交互子流程所使用的交互主题时的适配分值,包括:
将所述上一交互子流程所使用的交互主题,所述反馈消息类型及所述用户的用户画像输入至交互流程生成模型,输出所述当前交互场景下每一指定交互主题作为所述当前交互子流程所使用的交互主题时的适配分值;
其中,所述交互流程生成模型通过如下方式构建:
基于一组影响因子,构建m个训练交互主题拓扑,所述一组影响因子中包含多个影响因子,每一训练交互主题拓扑对应所述一组影响因子的不同取值,每个影响因子对应一种用户信息,所述m为大于0的整数。
基于所述一组影响因子,确定n组训练用户画像,并从所述m个训练交互主题拓扑中确定与每组训练用户画像相匹配的训练交互主题拓扑,每组训练用户画像中包含所述一组影响因子中的多个影响因子,所述n为大于0的整数;
获取每组训练用户画像对应的用户在基于相匹配的训练交互主题拓扑进行交互后的满意度分值,并确定满意度分值大于满意度分值阈值的训练交互主题拓扑,作为正向训练交互主题拓扑;
基于每一正向交互主题拓扑对应的用户在训练交互流程中所使用的交互主题及反馈消息类型、以及每一正向交互主题拓扑对应的训练用户画像,对初始模型进行训练,得到所述交互流程生成模型。
6.根据权利要求4所述的方法,其特征在于,所述确定计算得到的适配分值中的最高适配分值之后,还包括:
若所述最高适配分值不大于所述预设阈值,则确定所述当前交互流程结束。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述反馈消息类型与所述上一交互子流程所使用的交互主题不匹配,则将所述用户在所述上一交互子流程中的反馈消息输入至意图判别模型,输出所述用户选择的业务类型;
跳出所述当前交互流程,并执行所述用户选择的业务类型所对应的业务流程。
8.根据权利要求1所述的方法,其特征在于,所述确定用户在所述上一交互子流程中的反馈消息类型,包括:
将所述用户在所述上一交互子流程中的反馈消息输入至意图判别模型;
若所述意图判别模型的输出结果不为所述用户选择的业务类型,则将所述反馈消息输入至主题输入判别模型,输出所述反馈消息类型。
9.一种主动交互装置,其特征在于,包括:
第一确定模块,用于获取当前交互流程中上一交互子流程所使用的交互主题,并确定用户在所述上一交互子流程中的反馈消息类型;其中,所述当前交互流程由多个交互子流程构成,每一交互主题对应一个交互子流程;
第二确定模块,用于当所述反馈消息类型与所述上一交互子流程所使用的交互主题匹配时,则根据所述上一交互子流程所使用的交互主题、所述反馈消息类型及所述用户的用户画像,确定当前交互子流程所使用的交互主题,并基于确定的交互主题发起所述当前交互子流程。
10.一种主动交互设备,其特征在于,包括:
至少一个处理器;以及
与所述处理器通信连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至8任一所述的方法。
11.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至8任一所述的方法。
CN201711436415.3A 2017-12-26 2017-12-26 主动交互方法及装置 Active CN108197189B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711436415.3A CN108197189B (zh) 2017-12-26 2017-12-26 主动交互方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711436415.3A CN108197189B (zh) 2017-12-26 2017-12-26 主动交互方法及装置

Publications (2)

Publication Number Publication Date
CN108197189A true CN108197189A (zh) 2018-06-22
CN108197189B CN108197189B (zh) 2020-07-28

Family

ID=62584384

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711436415.3A Active CN108197189B (zh) 2017-12-26 2017-12-26 主动交互方法及装置

Country Status (1)

Country Link
CN (1) CN108197189B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109376682A (zh) * 2018-11-06 2019-02-22 东莞市凯木金电子科技有限公司 一种智能摄像头及疲劳状态识别方法
CN111046160A (zh) * 2019-12-16 2020-04-21 联想(北京)有限公司 交互方法、交互装置以及计算机系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105138671A (zh) * 2015-09-07 2015-12-09 百度在线网络技术(北京)有限公司 基于人工智能的人机交互的交互引导方法和装置
CN105945949A (zh) * 2016-06-01 2016-09-21 北京光年无限科技有限公司 面向智能机器人的信息处理方法及系统
US20160371276A1 (en) * 2015-06-19 2016-12-22 Microsoft Technology Licensing, Llc Answer scheme for information request
CN106354815A (zh) * 2016-08-30 2017-01-25 北京光年无限科技有限公司 一种对话系统中话题处理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160371276A1 (en) * 2015-06-19 2016-12-22 Microsoft Technology Licensing, Llc Answer scheme for information request
CN105138671A (zh) * 2015-09-07 2015-12-09 百度在线网络技术(北京)有限公司 基于人工智能的人机交互的交互引导方法和装置
CN105945949A (zh) * 2016-06-01 2016-09-21 北京光年无限科技有限公司 面向智能机器人的信息处理方法及系统
CN106354815A (zh) * 2016-08-30 2017-01-25 北京光年无限科技有限公司 一种对话系统中话题处理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109376682A (zh) * 2018-11-06 2019-02-22 东莞市凯木金电子科技有限公司 一种智能摄像头及疲劳状态识别方法
CN111046160A (zh) * 2019-12-16 2020-04-21 联想(北京)有限公司 交互方法、交互装置以及计算机系统

Also Published As

Publication number Publication date
CN108197189B (zh) 2020-07-28

Similar Documents

Publication Publication Date Title
CN110442701B (zh) 语音对话处理方法及装置
CN106951468B (zh) 对话生成方法及装置
CN105512228B (zh) 一种基于智能机器人的双向问答数据处理方法和系统
CN108415932B (zh) 人机对话方法及电子设备
CN108763495B (zh) 人机对话方法、系统、电子设备及存储介质
JP2017049427A (ja) 対話制御装置、対話制御方法及びプログラム
CN116521850B (zh) 一种基于强化学习的交互方法及装置
CN108197189A (zh) 主动交互方法及装置
Aljammaz et al. Scheherazade’s Tavern: A prototype for deeper NPC interactions
CN110069606A (zh) 人机会话方法、装置、电子设备及存储介质
CN114550705A (zh) 对话推荐方法、模型的训练方法、装置、设备及介质
CN109545203A (zh) 语音识别方法、装置、设备和存储介质
CN112069830B (zh) 一种智能会话方法及装置
CN115757749A (zh) 一种对话处理方法、装置、电子设备及存储介质
CN113440856A (zh) 游戏中异常账号的识别方法、装置、电子设备及存储介质
Chhabria et al. Evolving Journey of Chatbots: Insights into Business Decisions
CN110349563A (zh) 用于语音对话平台的对话人设配置方法及系统
US20240169984A1 (en) System and method for generating a closed domain conversation
CN115814421B (zh) 虚拟人行为自驱调度生成方法、装置、设备及存储介质
US11954570B2 (en) User interface for construction of artificial intelligence based characters
US12002470B1 (en) Multi-source based knowledge data for artificial intelligence characters
US20230351142A1 (en) Relationship graphs for artificial intelligence character models
Vavrecka et al. Personified Robotic Chatbot Based On Compositional Dialogues
CN117332071B (zh) 人机交互的数据处理方法、服务器及存储介质
US11995755B1 (en) Emotional state models and continuous update of emotional states of artificial intelligence characters

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant