CN113569029A - 对话应答方法、装置及存储介质 - Google Patents

对话应答方法、装置及存储介质 Download PDF

Info

Publication number
CN113569029A
CN113569029A CN202110858124.3A CN202110858124A CN113569029A CN 113569029 A CN113569029 A CN 113569029A CN 202110858124 A CN202110858124 A CN 202110858124A CN 113569029 A CN113569029 A CN 113569029A
Authority
CN
China
Prior art keywords
information
response
dialogue
dialog
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110858124.3A
Other languages
English (en)
Inventor
张嘉益
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Mobile Software Co Ltd
Beijing Xiaomi Pinecone Electronic Co Ltd
Original Assignee
Beijing Xiaomi Mobile Software Co Ltd
Beijing Xiaomi Pinecone Electronic Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Mobile Software Co Ltd, Beijing Xiaomi Pinecone Electronic Co Ltd filed Critical Beijing Xiaomi Mobile Software Co Ltd
Priority to CN202110858124.3A priority Critical patent/CN113569029A/zh
Publication of CN113569029A publication Critical patent/CN113569029A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)

Abstract

本公开涉及一种对话应答方法、装置及存储介质。所述对话应答方法包括:获取对话信息;基于所述对话信息判断是否针对所述对话信息进行对话应答;在确定针对所述对话信息进行对话应答的情况下,根据所述对话信息生成目标应答信息;在到达应答时刻的情况下,发送所述目标应答信息以完成对所述对话信息的应答。采用本公开的这种方法,能够在准确的应答时机准确地应答对话信息。

Description

对话应答方法、装置及存储介质
技术领域
本公开涉及人机对话技术领域,尤其涉及一种对话应答方法、装置及存储介质。
背景技术
随着互联网技术、信息通讯技术以及人工智能技术的发展,人机对话系统(Conversational Systems)与生俱来的自然便捷性,使其成为了新一代的交互范式。人机对话技术已经被工业界应用到各种类型的产品服务中。在日渐发展的人机对话系统的应用中,随着AI智能性逐渐提升,人们也开始逐渐对人机对话系统提出更高级的需求。
发明内容
为克服相关技术中存在的问题,本公开提供一种对话应答方法、装置及存储介质,以解决相关技术中存在的问题。
根据本公开实施例的第一方面,提供一种对话应答方法,所述方法包括:
获取对话信息;
基于所述对话信息判断是否针对所述对话信息进行对话应答;
在确定针对所述对话信息进行对话应答的情况下,根据所述对话信息生成目标应答信息;
在到达应答时刻的情况下,发送所述目标应答信息以完成对所述对话信息的应答。
在一些实施例中,所述基于所述对话信息判断是否针对所述对话信息进行对话应答,包括:
判断所述对话信息中是否存在预设关键词;
在所述对话信息中存在所述预设关键词的情况下,确定针对所述对话信息进行对话应答。
在一些实施例中,所述基于所述对话信息判断是否针对所述对话信息进行对话应答,包括:
将所述对话信息输入训练完成的接话分类器,得到所述接话分类器输出的表征是否针对所述对话信息进行对话应答的输出值;
在所述输出值大于预设阈值的情况下,确定针对所述对话信息进行对话应答。
在一些实施例中,所述根据所述对话信息生成目标应答信息,包括:
确定输出所述对话信息的第一用户的历史人设属性信息;
将所述对话信息、以及所述第一用户的历史人设属性信息输入训练完成的对话模型,得到所述对话模型输出的所述目标应答信息。
在一些实施例中,所述方法还包括:
若在所述应答时刻到达之前,检测到第二用户针对所述对话信息进行应答的第一应答信息,则根据所述对话信息以及所述第一应答信息生成新的目标应答信息,其中,所述新的目标应答信息包括所述第一应答信息中的特征信息;
所述发送所述目标应答信息以完成对所述对话信息的应答,包括:
发送所述新的目标应答信息以完成对所述对话信息的应答。
在一些实施例中,所述根据所述对话信息以及所述第一应答信息生成新的目标应答信息,包括:
获取输出所述第一应答信息的所述第二用户的历史人设属性信息;
将所述对话信息、所述第一用户的历史人设属性信息、所述第一应答信息、以及所述第二用户的历史人设属性信息输入训练完成的所述对话模型,得到所述对话模型输出的所述新的目标应答信息。
在一些实施例中,在所述根据所述对话信息以及所述第一应答信息生成新的目标应答信息之前,所述方法还包括:
检测所述对话模型是否已根据所述对话信息和所述第一用户的历史人设属性信息生成所述目标应答信息;
在检测到所述对话模型未生成所述目标应答信息的情况下,中断所述对话模型根据所述对话信息和所述第一用户的历史人设属性信息生成所述目标应答信息的操作。
在一些实施例中,所述应答时刻是根据所述对话信息的时间戳和所述目标应答信息的文字数量进行确定的。
在一些实施例中,在所述根据所述对话信息生成目标应答信息之前,还包括:
基于预设属性维度,抽取所述对话信息中的人设属性信息;
根据抽取到的所述人设属性信息更新所述第一用户的历史人设属性信息。
根据本公开实施例的第二方面,提供一种对话应答装置,所述装置包括:
获取模块,被配置为获取对话信息;
判断模块,被配置为基于所述对话信息判断是否针对所述对话信息进行对话应答;
第一生成模块,被配置为在确定针对所述对话信息进行对话应答的情况下,根据所述对话信息生成目标应答信息;
应答模块,被配置为在到达应答时刻的情况下,发送所述目标应答信息以完成对所述对话信息的应答。
在一些实施例中,所述判断模块包括:
判断子模块,被配置为判断所述对话信息中是否存在预设关键词;
第一确定子模块,被配置为在所述对话信息中存在所述预设关键词的情况下,确定针对所述对话信息进行对话应答。
在一些实施例中,所述判断模块包括:
第一输入子模块,被配置为将所述对话信息输入训练完成的接话分类器,得到所述接话分类器输出的表征是否针对所述对话信息进行对话应答的输出值;
第二确定子模块,被配置为在所述输出值大于预设阈值的情况下,确定针对所述对话信息进行对话应答。
在一些实施例中,所述第一生成模块,包括:
第一获取子模块,被配置为确定输出所述对话信息的第一用户的历史人设属性信息;
第二输入子模块,被配置为将所述对话信息、以及所述第一用户的历史人设属性信息输入训练完成的对话模型,得到所述对话模型输出的所述目标应答信息。
在一些实施例中,所述装置还包括:
第二生成模块,被配置为若在所述应答时刻到达之前,检测到第二用户针对所述对话信息进行应答的第一应答信息,则根据所述对话信息以及所述第一应答信息生成新的目标应答信息,其中,所述新的目标应答信息包括所述第一应答信息中的特征信息;相应的,所述应答模块还被配置为发送所述新的目标应答信息以完成对所述对话信息的应答。
在一些实施例中,所述第二生成模块包括:
第二获取子模块,被配置为获取输出所述第一应答信息的所述第二用户的历史人设属性信息;
第三输入子模块,被配置为将所述对话信息、所述第一用户的历史人设属性信息、所述第一应答信息、以及所述第二用户的历史人设属性信息输入训练完成的所述对话模型,得到所述对话模型输出的所述新的目标应答信息。
在一些实施例中,所述装置还包括:
中断模块,被配置为在所述根据所述对话信息以及所述第一应答信息生成新的目标应答信息之前,检测所述对话模型是否已根据所述对话信息和所述第一用户的历史人设属性信息生成所述目标应答信息;
在检测到所述对话模型未生成所述目标应答信息的情况下,中断所述对话模型根据所述对话信息和所述第一用户的历史人设属性信息生成所述目标应答信息的操作。
在一些实施例中,所述应答时刻是根据所述对话信息的时间戳和所述目标应答信息的文字数量进行确定的。
在一些实施例中,所述装置还包括:
更新模块,被配置为在所述根据所述对话信息生成目标应答信息之前,基于预设属性维度,抽取所述对话信息中的人设属性信息;并根据抽取到的所述人设属性信息更新所述第一用户的历史人设属性信息。
根据本公开实施例的第三方面,提供一种对话应答装置,所述装置包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取对话信息;
基于所述对话信息判断是否针对所述对话信息进行对话应答;
在确定针对所述对话信息进行对话应答的情况下,根据所述对话信息生成目标应答信息;
在到达应答时刻的情况下,发送所述目标应答信息以完成对所述对话信息的应答。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开第一方面所提供的对话应答方法的步骤。
本公开的实施例提供的技术方案可以包括以下有益效果:
通过获取对话信息,并基于该对话信息判断是否针对该对话信息进行对话应答。这种针对每一对话信息进行接话时机判断的方式,能够提高对话应答的准确性。在确定针对该对话信息进行对话应答的情况下,根据该对话信息生成目标应答信息。在到达应答时刻的情况下,发送该目标应答信息以完成对对话信息的应答,可以增强对话应答效果,提升用户体验。采用本公开的这种方法,能够在准确的应答时机进行准确地应答。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据本公开一示例性实施例示出的一种对话应答方法的流程图。
图2是根据本公开一示例性实施例示出的一种对话模型的结构图。
图3是根据本公开一示例性实施例示出的一种对话应答装置的框图。
图4是根据本公开一示例性实施例示出的另一种对话应答装置的框图。
图5是根据本公开一示例性实施例示出的又一种对话应答装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
随着互联网、信息通讯以及人工智能技术的发展,人机对话系统与生俱来的自然便捷性,使其成为未来的新一代交互范式。人机对话技术已经被工业界应用到各种类型的产品服务中,如苹果公司的Siri、微软的Cortana、谷歌的Allo、百度的度秘、亚马逊的Echo智能家居服务系统、阿里巴巴的小蜜电商智能客服系统、小米手机的智能生活助手小爱同学等应用中。这些人机对话产品给人们的日常生活带来了极大的便利性,影响着数以亿计的消费者用户。
在日渐发展的人机对话系统应用中,随着AI智能性逐渐提升,人们也开始逐渐对智能助手产生闲聊陪伴的需求,希望对话机器人能够像一个真正的人或者朋友一样,对自己进行陪伴、关怀、聊天。除此以外,还希望对话机器人能够参与群聊。群聊场景对聊天机器人提出了新的挑战,闲聊群中闲聊机器人不再是与用户进行一对一的人机交互,而是一对多的同时与多个用户进行交互。
发明人在研究中发现,群聊方式与一对一人机对话方式的一大不同点在于,群聊场景中存在“接话”时机。具体地,群聊场景中,群成员发送的任意一句对话信息可能是针对群里的所有成员,也可能是针对群里的部分成员。举例来说,在对话信息中包括“@all”等关键词的情况下,表明该对话信息可能是针对群里的全部成员。在对话信息中包括“@某名称”关键词的情况下,表明该对话信息可能是针对群里的该某名称对应的成员。在对话信息中既不包括“@all”,也不包括“@某名称”关键词的情况下,该对话信息可能是针对群里的全部或部分成员。由此可见,闲聊群的场景对聊天机器人提出了更高的智能性要求,需要聊天机器人对接话时机进行判断,以在适当的时机针对对话信息进行准确地应答,从而避免针对每一条对话信息都进行强行应答或者不应答而造成的应答准确性低或交互能力差的问题。
有鉴于此,本公开实施例提供一种对话应答方法、装置及存储介质,以解决上述问题。
在对本公开的技术方案进行详细的实施例说明之前,应当声明的是,本公开中所使用的信息,如对话信息、应答信息、历史人设属性信息等均为在得到用户合法授权的情况下获取或使用的。
图1是根据一示例性实施例示出的一种对话应答方法的流程图,该对话应答方法可以应用于电子设备中,例如:移动终端或服务器中,移动终端包括手机、笔记本、平板电脑、台式计算机、POS机、智能可穿戴设备、智能电视、PDA(英文:PersonalDigitalAssistant,中文:个人数字助理)等。服务器包括:本地服务器及云服务器。该对话应答方法也可以应用于该电子设备上预装或安装的应用程序中,该应用程序中用于进行对话应答的人机交互系统可以称为机器人(为了便于后续实施例的说明,将该对话应答方法对应的软件产品称为bot)。bot可具体应用于承载在电子设备上的即时通讯软件中的聊天群组中,用于与群中成员进行聊天交互;bot也可以应用于承载在电子设备上的社交通讯软件,例如贴吧、论坛、博客、微博等软件中,用于对各用户分享的动态进行评论(值得说明的是,对各用户分享的动态进行评论的场景也可认为是群聊场景)。
如图1所示,本公开的对话应答方法具体可以包括以下步骤。
在步骤S11中,获取对话信息。
示例地,该对话信息可以是语音信息,也可以是文本信息。在对话信息是语音信息的情况下,电子设备可以对该对话信息进行语义识别,转换为文本信息,然后根据该文本信息执行以下步骤。或者,在对话信息是文本信息的情况下,电子设备可以对该对话信息进行文字转换,得到语音信息,然后根据该语音信息执行以下步骤。
另外,对话信息可以为问题形式的对话信息,亦可以为非提问形式的对话信息。对此,本公开对话信息的类型不作具体的限制。
在步骤S12中,基于所述对话信息判断是否针对所述对话信息进行对话应答。
在一种可能的实施方式中,所述基于所述对话信息判断是否针对所述对话信息进行对话应答,可以包括以下步骤:
判断所述对话信息中是否存在预设关键词;在所述对话信息中存在所述预设关键词的情况下,确定针对所述对话信息进行对话应答。
其中,预设关键词可以用于指示包含目标用户群体的提示信息。预设关键词表征该对话信息是对目标用户群体进行对话的标识词,或者表征用于提示目标用户群体关注该对话信息的提示词。预设关键词可以包括各类型文字及特殊符号。例如,预设关键词可以包括@all、@某人名、某名词中的至少一个。值得说明的是,@符号可基于软件系统架构的预定义进行替换,如可能替换为#号;相应的,预设关键词可以包括#all、#某人名中的至少一个。即是说,本公开实施例中预设关键词不限于@all、@某人名。
示例地,假设预设关键词包括@all。那么当对话信息为“@all,外面下雨了吗?”的情况下,可确定需要针对该对话信息进行对话应答。
再示例地,假设预设关键词包括@bot。那么当对话信息为“@bot,明天的天气如何?”的情况下,可确定需要针对该对话信息进行对话应答。
在另一种可能的实施方式中,所述基于所述对话信息判断是否针对所述对话信息进行对话应答,可以包括以下步骤:
将所述对话信息输入训练完成的接话分类器,得到所述接话分类器输出的表征是否针对所述对话信息进行对话应答的输出值;在所述输出值大于预设阈值的情况下,确定针对所述对话信息进行对话应答。
该接话分类器可以为二分类器。接话分类器可以通过如下方式训练得到:获取历史群聊信息;将所述历史群聊信息根据聊天主题划分为多轮聊天信息分组;针对每一聊天信息分组,识别该聊天信息分组中的样本对话信息,并标注该聊天信息分组中是否存在样本应答信息。根据每一聊天信息分组中的样本对话信息以及标注结果训练接话分类器,以得到训练完成的接话分类器。
接话分类器可以采用相关技术中BERT编码器的模型框架进行编码。
接话分类器具体用于对输入的对话信息进行编码,并将编码结果输入全连接映射层dense layer,全连接映射层输出表征是否针对该输入的对话信息进行对话应答的输出值,输出值为0到1之间的值。
在预设阈值为0.5的情况下,若输出值小于或等于0.5则表征不对该输入的对话信息进行应答。相应的,若输出值大于0.5则表征需要对该输入的对话信息进行应答。
在一种可能的实施方式中,可同时采用上述两种实施方式来判断是否针对对话信息进行对话应答。示例地,判断是否针对对话信息进行对话应答的方式包括以下步骤:
判断所述对话信息中是否存在预设关键词;在所述对话信息中存在所述预设关键词的情况下,确定针对所述对话信息进行对话应答;在所述对话信息中不存在所述预设关键词的情况下,将所述对话信息输入训练完成的接话分类器,得到所述接话分类器输出的表征是否针对所述对话信息进行对话应答的输出值;在所述输出值大于预设阈值的情况下,确定针对所述对话信息进行对话应答;在所述输出值小于或等于预设阈值的情况下,确定不针对所述对话信息进行对话应答。
在步骤S13中,在确定针对所述对话信息进行对话应答的情况下,根据所述对话信息生成目标应答信息。
在步骤S14中,在到达应答时刻的情况下,发送所述目标应答信息以完成对所述对话信息的应答。
在一种可能的实施方式中,应答时刻可以为生成目标应答信息的时刻,如此可以针对对话信息进行快速应答。
在另一种可能的实施方式中,应答时刻可以为对话信息的时间戳加上预设时长后所对应的时刻,其中,该预设时长根据需求进行适应性设置。
在一种可能的实施方式中,所述应答时刻是根据所述对话信息的时间戳和所述目标应答信息的文字数量进行确定的。
示例地,可设置文字数量与预设时长之间的预设对应关系,如此,可根据目标应答信息的文字数量、文字数量与预设时长之间的预设对应关系确定目标预设时长,根据目标预设时长和对话信息的时间戳计算得到应答时刻。其中,文字数量与预设时长之间的预设对应关系可基于统计得到的用户实际输入各文字的时间进行确定。
采用本公开的这种对话应答方式,通过获取对话信息,并基于该对话信息判断是否针对该对话信息进行对话应答。这种针对每一对话信息进行接话时机判断的方式,能够提高对话应答的准确性。在确定针对该对话信息进行对话应答的情况下,根据该对话信息生成目标应答信息。在到达应答时刻的情况下,发送该目标应答信息以完成对对话信息的应答,可以增强对话应答效果,提升用户体验。采用本公开的这种方法,能够在准确的应答时机进行准确地应答。
在一些实施例中,所述根据所述对话信息生成目标应答信息,可以包括以下步骤:
确定输出所述对话信息的第一用户的历史人设属性信息;将所述对话信息、以及所述第一用户的历史人设属性信息输入训练完成的对话模型,得到所述对话模型输出的所述目标应答信息。
用户的历史人设属性信息可以包括年龄、性别、国籍、学历、专业、职业、爱好、个性、风格、看过的书籍、发表过的观点、发表过的言论等等信息。用户的历史人设属性信息有助于解析该用户的具体人设。在本公开中,将第一用户的历史人设属性信息输入对话模型,有助于该对话模型生成涵盖第一用户的历史人设属性信息的目标应答信息,使得bot能够像一个真实的人或者朋友一样,对第一用户进行陪伴、关怀、以及聊天等互动。
为了提升用户的历史人设属性信息的准确性、丰富性,可在每一次获取到对话信息之后,和/或在所述根据所述对话信息生成目标应答信息之前,基于预设属性维度,抽取所述对话信息中的人设属性信息;根据抽取到的所述人设属性信息更新所述第一用户的历史人设属性信息。
其中,预设属性维度如年龄维度、喜好维度、事件的观点维度、性别维度、国籍维度、学历维度、专业维度、职业维度、个性风格维度、知识贮备维度、发表过的言论维度等。
举例来说,假设对话信息为“我今年七岁半”,基于预设属性维度,抽取得到该对话信息中的人设属性信息“七岁半”;根据抽取到的人设属性信息“七岁半”更新该用户的年龄维度对应的信息。
随着历史人设属性信息的不断更新,历史人设属性信息会越来越丰富。那么,历史人设属性信息对应的文字量就越大。为了将丰富的历史人设属性信息输入对话模型,可先将丰富的历史人设属性信息进行编码,取各人设属性信息的向量平均值作为输入对话模型的历史人设属性信息。
在一种可能的实施方式中,本公开中对话模型可以与说话人感知对话模型Speaker-aware dialog model的架构相类似。
对话模型的输入信息即对话信息、以及第一用户的历史人设属性信息均为向量信息。
如图2所示,可将对话信息看做对话模型的输入序列。每一输入序列的第一个计算机令牌token(每一个token表征一个单位字符)始终是特殊分类嵌入[CLS]符号,之后的每一个token均代表对话信息中的一个汉字(或单词)。在本公开实施例中的CLS符号均表征对话模型的特殊分类嵌入[CLS]符号,与相关技术BERT模型中的分类嵌入[CLS]符号一致。
进一步地,继续参考图2,本公开中对话模块的输入向量input embeddings是单位字符向量token embeddings、分段向量segmentation embeddings、位置向量positionembeddings以及用户历史人设属性向量speaker embedding的总和。其中tokenembeddings、segmentation embeddings、position embeddings是对对话信息进行编码的结果。speaker embedding表征编码后的第一用户的历史人设属性信息。值得解释的是,其中token embeddings是词(字)向量,segment embeddings用来区分对话信息中对应的向量部分以及插入向量input embeddings的内容,或者segment embeddings用于区分多个句子(同一用户的多个句子或者多个用户的多个句子),而position embedding用于承载每个token的位置信息。
此外,还值得说明的是,对话模型可以通过如下方式训练得到:
获取对话信息样本,以及与该对话信息样本对应的应答信息样本,其中,对话信息样本至少包括一个用户的对话信息及对应的历史人设属性信息;根据对话信息样本,以及与该对话信息样本对应的应答信息样本训练对话模型,以得到训练完成的对话模型。
在一种可能的场景中,在应答时刻是根据对话信息的时间戳和目标应答信息的文字数量进行确定的情况下,可能在应答时刻之前,存在第二用户(其他用户)先行应答的场景,此种场景下,为使生成的目标应答信息兼具与第一用户和第二用户同时进行交互的特征,可在应答时刻之前,检测是否存在第二用户先行应答的情况。若在所述应答时刻到达之前,检测到第二用户针对所述对话信息进行应答的第一应答信息,则根据所述对话信息以及所述第一应答信息生成新的目标应答信息,其中,所述新的目标应答信息包括所述第一应答信息中的特征信息;相应地,所述发送所述目标应答信息以完成对所述对话信息的应答,包括:发送所述新的目标应答信息以完成对所述对话信息的应答。
示例地,假设第一用户输入的对话信息为:“大家淋雨了吗?@all”。第二用户先行应答的第一应答信息为:“没呢”。那么采用本公开的上述方式生成的新的目标应答信息可以为“和楼上一样,我也没呢”。
在一些实施例中,如检测到第二用户针对所述对话信息进行应答的第一应答信息,可以继续检测第二用户输入的信息是否为第一应答信息的方式,具体方式可以为检测该第二用户输入的信息与上下文的关联性大小的方式。或者,将该第二用户输入的信息输入接话分类器进行分类,在确定对该第二用户输入的信息进行应答的情况下,再检测该第二用户输入的信息是否与对话信息相关联,在确定与对话信息相关联的情况下,可以确定第二用户输入的信息为第一应答信息。
若在所述应答时刻之前,检测到多个用户针对所述对话信息进行应答的多条第一应答信息,则根据所述对话信息以及所述多条第一应答信息生成新的目标应答信息。
训练对话模型的对话信息样本中可以包括第一用户的对话信息及对应的历史人设属性信息、第二用户的应答信息及对应的历史人设属性信息。
在一些实施方式中,所述根据所述对话信息以及所述第一应答信息生成新的目标应答信息,具体可以包括以下步骤:
获取输出所述第一应答信息的所述第二用户的历史人设属性信息;将所述对话信息、所述第一用户的历史人设属性信息、所述第一应答信息、以及所述第二用户的历史人设属性信息输入训练完成的所述对话模型,得到所述对话模型输出的所述新的目标应答信息。
并且,在执行根据对话信息以及第一应答信息生成新的目标应答信息的步骤之前,若检测到对话模型根据对话信息和第一用户的历史人设属性信息尚未生成目标应答信息,则可以中断对话模型根据对话信息和第一用户的历史人设属性信息生成目标应答信息的操作,然后执行根据对话信息以及第一应答信息生成新的目标应答信息的步骤。
其中,第二用户的历史人设属性信息的更新方式,与前述第一用户的历史人设属性信息更新方式一致,此处不再赘述。
此外,在生成新的目标应答信息之后,可基于第一应答信息的时间戳(或对话信息的时间戳)和新的目标应答信息重新计算应答时刻。或者,将应答时刻直接更新为生成新的目标应答信息的时刻。
在一种可能的实施方式中,将对话信息、第一用户的历史人设属性信息、第一应答信息、以及第二用户的历史人设属性信息输入训练完成的对话模型后,该对话模型可以先基于对话信息的第一用户标签,将第一用户作为目标应答信息的应答对象,并针对该应答对象生成并输出目标应答信息。示例地,该目标应答信息中可以包括“@第一用户”的关键词。
在另一种可能的实施方式中,将对话信息、第一用户的历史人设属性信息、第一应答信息、以及第二用户的历史人设属性信息输入训练完成的对话模型后,对话模型可以先生成目标应答信息。若生成的目标应答信息涵盖赞同或反对第二用户的观点的语义信息,则可将第二用户作为目标应答信息的应答对象,并针对该应答对象输出目标应答信息,此种情况下,该目标应答信息中可以包括“@第二用户”的关键词。若生成的目标应答信息未涵盖赞同或反对第二用户的观点的语义信息,则针对第一用户输出目标应答信息,此种情况下,该目标应答信息中可以包括“@第一用户”的关键词。
在再一种可能的实施方式中,将对话信息、第一用户的历史人设属性信息、第一应答信息、以及第二用户的历史人设属性信息输入训练完成的对话模型后,该对话模型可以先基于对话信息的第一用户标签,将第一用户作为目标应答信息的应答对象,并针对该应答对象生成目标应答信息。判断目标应答信息的语义是否涵盖赞同或反对第二用户的观点,若目标应答信息涵盖赞同或反对第二用户的观点的语义信息,则将第二用户设置为新的应答对象,并针对第二用户输出目标应答信息,此种情况下,该目标应答信息中可以包括“@第二用户”的关键词。若目标应答信息未涵盖赞同或反对第二用户的观点的语义信息,则针对第一用户输出目标应答信息,此种情况下,该目标应答信息中可以包括“@第一用户”的关键词。
图3是根据一示例性实施例示出的一种对话应答装置的框图。参照图3,该对话应答装置300包括获取模块310,判断模块320、第一生成模块330以及应答模块340。
该获取模块310被配置为获取对话信息。
该判断模块320被配置为基于所述对话信息判断是否针对所述对话信息进行对话应答。
该第一生成模块330被配置为在确定针对所述对话信息进行对话应答的情况下,根据所述对话信息生成目标应答信息。
该应答模块340被配置为在到达应答时刻的情况下,发送所述目标应答信息以完成对所述对话信息的应答。
采用本公开的这种装置,通过获取对话信息,并基于该对话信息判断是否针对该对话信息进行对话应答。这种针对每一对话信息进行接话时机判断的方式,能够提高对话应答的准确性。在确定针对该对话信息进行对话应答的情况下,根据该对话信息生成目标应答信息。在到达应答时刻的情况下,发送该目标应答信息以完成对对话信息的应答,可以增强对话应答效果,提升用户体验。采用本公开的这种方法,能够在准确的应答时机进行准确地应答。
在一些实施例中,所述判断模块320包括:
判断子模块,被配置为判断所述对话信息中是否存在预设关键词;
第一确定子模块,被配置为在所述对话信息中存在所述预设关键词的情况下,确定针对所述对话信息进行对话应答。
在一些实施例中,所述判断模块320包括:
第一输入子模块,被配置为将所述对话信息输入训练完成的接话分类器,得到所述接话分类器输出的表征是否针对所述对话信息进行对话应答的输出值;
第二确定子模块,被配置为在所述输出值大于预设阈值的情况下,确定针对所述对话信息进行对话应答。
在一些实施例中,所述第一生成模块330,包括:
第一获取子模块,被配置为确定输出所述对话信息的第一用户的历史人设属性信息;
第二输入子模块,被配置为将所述对话信息、以及所述第一用户的历史人设属性信息输入训练完成的对话模型,得到所述对话模型输出的所述目标应答信息。
在一些实施例中,所述装置300还包括:
第二生成模块,被配置为若在所述应答时刻到达之前,检测到第二用户针对所述对话信息进行应答的第一应答信息,则根据所述对话信息以及所述第一应答信息生成新的目标应答信息,其中,所述新的目标应答信息包括所述第一应答信息中的特征信息;相应的,所述应答模块还被配置为发送所述新的目标应答信息以完成对所述对话信息的应答。
在一些实施例中,所述第二生成模块包括:
第二获取子模块,被配置为获取输出所述第一应答信息的所述第二用户的历史人设属性信息;
第三输入子模块,被配置为将所述对话信息、所述第一用户的历史人设属性信息、所述第一应答信息、以及所述第二用户的历史人设属性信息输入训练完成的所述对话模型,得到所述对话模型输出的所述新的目标应答信息。
在一些实施例中,所述装置300还包括:
中断模块,被配置为在所述根据所述对话信息以及所述第一应答信息生成新的目标应答信息之前,检测所述对话模型是否已根据所述对话信息和所述第一用户的历史人设属性信息生成所述目标应答信息;
在检测到所述对话模型未生成所述目标应答信息的情况下,中断所述对话模型根据所述对话信息和所述第一用户的历史人设属性信息生成所述目标应答信息的操作。
在一些实施例中,所述应答时刻是根据所述对话信息的时间戳和所述目标应答信息的文字数量进行确定的。
在一些实施例中,所述装置300还包括:
更新模块,被配置为在所述根据所述对话信息生成目标应答信息之前,基于预设属性维度,抽取所述对话信息中的人设属性信息;并根据抽取到的所述人设属性信息更新所述第一用户的历史人设属性信息。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本公开还提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开提供的对话应答方法的步骤。
图4是根据一示例性实施例示出的一种用于对话应答的装置800的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图4,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电力组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的对话应答方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在装置800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件806为装置800的各种组件提供电力。电力组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当装置800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到装置800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述对话应答方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述对话应答方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在另一示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包含能够由可编程的装置执行的计算机程序,该计算机程序具有当由该可编程的装置执行时用于执行上述的对话应答方法的代码部分。
图5是根据一示例性实施例示出的一种用于对话应答的装置1900的框图。例如,装置1900可以被提供为一服务器。参照图5,装置1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述对话应答方法的步骤。
装置1900还可以包括一个电源组件1926被配置为执行装置1900的电源管理,一个有线或无线网络接口1950被配置为将装置1900连接到网络,和一个输入输出(I/O)接口1958。装置1900可以操作基于存储在存储器1932的操作系统,例如Windows ServerTM,MacOS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本领域技术人员在考虑说明书及实践本公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (12)

1.一种对话应答方法,其特征在于,所述方法包括:
获取对话信息;
基于所述对话信息判断是否针对所述对话信息进行对话应答;
在确定针对所述对话信息进行对话应答的情况下,根据所述对话信息生成目标应答信息;
在到达应答时刻的情况下,发送所述目标应答信息以完成对所述对话信息的应答。
2.根据权利要求1所述的方法,其特征在于,所述基于所述对话信息判断是否针对所述对话信息进行对话应答,包括:
判断所述对话信息中是否存在预设关键词;
在所述对话信息中存在所述预设关键词的情况下,确定针对所述对话信息进行对话应答。
3.根据权利要求1所述的方法,其特征在于,所述基于所述对话信息判断是否针对所述对话信息进行对话应答,包括:
将所述对话信息输入训练完成的接话分类器,得到所述接话分类器输出的表征是否针对所述对话信息进行对话应答的输出值;
在所述输出值大于预设阈值的情况下,确定针对所述对话信息进行对话应答。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述根据所述对话信息生成目标应答信息,包括:
确定输出所述对话信息的第一用户的历史人设属性信息;
将所述对话信息、以及所述第一用户的历史人设属性信息输入训练完成的对话模型,得到所述对话模型输出的所述目标应答信息。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
若在所述应答时刻到达之前,检测到第二用户针对所述对话信息进行应答的第一应答信息,则根据所述对话信息以及所述第一应答信息生成新的目标应答信息,其中,所述新的目标应答信息包括所述第一应答信息中的特征信息;
所述发送所述目标应答信息以完成对所述对话信息的应答,包括:
发送所述新的目标应答信息以完成对所述对话信息的应答。
6.根据权利要求5所述的方法,其特征在于,所述根据所述对话信息以及所述第一应答信息生成新的目标应答信息,包括:
获取输出所述第一应答信息的所述第二用户的历史人设属性信息;
将所述对话信息、所述第一用户的历史人设属性信息、所述第一应答信息、以及所述第二用户的历史人设属性信息输入训练完成的所述对话模型,得到所述对话模型输出的所述新的目标应答信息。
7.根据权利要求5所述的方法,其特征在于,在所述根据所述对话信息以及所述第一应答信息生成新的目标应答信息之前,所述方法还包括:
检测所述对话模型是否已根据所述对话信息和所述第一用户的历史人设属性信息生成所述目标应答信息;
在检测到所述对话模型未生成所述目标应答信息的情况下,中断所述对话模型根据所述对话信息和所述第一用户的历史人设属性信息生成所述目标应答信息的操作。
8.根据权利要求1所述的方法,其特征在于,所述应答时刻是根据所述对话信息的时间戳和所述目标应答信息的文字数量进行确定的。
9.根据权利要求4所述的方法,其特征在于,在所述根据所述对话信息生成目标应答信息之前,还包括:
基于预设属性维度,抽取所述对话信息中的人设属性信息;
根据抽取到的所述人设属性信息更新所述第一用户的历史人设属性信息。
10.一种对话应答装置,其特征在于,所述装置包括:
获取模块,被配置为获取对话信息;
判断模块,被配置为基于所述对话信息判断是否针对所述对话信息进行对话应答;
第一生成模块,被配置为在确定针对所述对话信息进行对话应答的情况下,根据所述对话信息生成目标应答信息;
应答模块,被配置为在到达应答时刻的情况下,发送所述目标应答信息以完成对所述对话信息的应答。
11.一种对话应答装置,其特征在于,所述装置包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取对话信息;
基于所述对话信息判断是否针对所述对话信息进行对话应答;
在确定针对所述对话信息进行对话应答的情况下,根据所述对话信息生成目标应答信息;
在到达应答时刻的情况下,发送所述目标应答信息以完成对所述对话信息的应答。
12.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,该程序指令被处理器执行时实现权利要求1~9中任一项所述方法的步骤。
CN202110858124.3A 2021-07-28 2021-07-28 对话应答方法、装置及存储介质 Pending CN113569029A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110858124.3A CN113569029A (zh) 2021-07-28 2021-07-28 对话应答方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110858124.3A CN113569029A (zh) 2021-07-28 2021-07-28 对话应答方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN113569029A true CN113569029A (zh) 2021-10-29

Family

ID=78168698

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110858124.3A Pending CN113569029A (zh) 2021-07-28 2021-07-28 对话应答方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN113569029A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108595423A (zh) * 2018-04-16 2018-09-28 苏州英特雷真智能科技有限公司 一种基于属性区间变化的动态本体结构的语义分析方法
CN110457454A (zh) * 2019-07-12 2019-11-15 卓尔智联(武汉)研究院有限公司 一种对话方法、服务器、对话系统及存储介质
CN111597821A (zh) * 2020-05-13 2020-08-28 北京嘀嘀无限科技发展有限公司 一种确定应答概率的方法及装置
WO2021068493A1 (zh) * 2019-10-11 2021-04-15 京东数字科技控股有限公司 用于处理信息的方法和装置
CN112948565A (zh) * 2021-04-16 2021-06-11 北京小米移动软件有限公司 人机对话方法、装置、电子设备及存储介质
US20210200961A1 (en) * 2019-12-25 2021-07-01 Ubtech Robotics Corp Ltd Context-based multi-turn dialogue method and storage medium
CN113160813A (zh) * 2021-02-24 2021-07-23 北京三快在线科技有限公司 输出响应信息的方法、装置、电子设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108595423A (zh) * 2018-04-16 2018-09-28 苏州英特雷真智能科技有限公司 一种基于属性区间变化的动态本体结构的语义分析方法
CN110457454A (zh) * 2019-07-12 2019-11-15 卓尔智联(武汉)研究院有限公司 一种对话方法、服务器、对话系统及存储介质
WO2021068493A1 (zh) * 2019-10-11 2021-04-15 京东数字科技控股有限公司 用于处理信息的方法和装置
US20210200961A1 (en) * 2019-12-25 2021-07-01 Ubtech Robotics Corp Ltd Context-based multi-turn dialogue method and storage medium
CN111597821A (zh) * 2020-05-13 2020-08-28 北京嘀嘀无限科技发展有限公司 一种确定应答概率的方法及装置
CN113160813A (zh) * 2021-02-24 2021-07-23 北京三快在线科技有限公司 输出响应信息的方法、装置、电子设备及存储介质
CN112948565A (zh) * 2021-04-16 2021-06-11 北京小米移动软件有限公司 人机对话方法、装置、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王跟东, 林道发, 杨家源: "特定人主题受限连续汉语人机对话系统的研究", 中文信息学报, no. 01, pages 58 - 64 *

Similar Documents

Publication Publication Date Title
CN109684510B (zh) 视频排序方法、装置、电子设备及存储介质
US20170315681A1 (en) Information display method and device
CN109145213B (zh) 基于历史信息的查询推荐方法及装置
CN107527619B (zh) 语音控制业务的定位方法及装置
CN110874145A (zh) 一种输入方法、装置及电子设备
CN107564526B (zh) 处理方法、装置和机器可读介质
CN111556352B (zh) 多媒体资源分享方法、装置、电子设备及存储介质
CN105975540A (zh) 信息显示方法及装置
US11335348B2 (en) Input method, device, apparatus, and storage medium
CN110781813A (zh) 图像识别方法及装置、电子设备和存储介质
EP3734472A1 (en) Method and device for text processing
CN112508612B (zh) 训练广告创意生成模型、生成广告创意的方法及相关装置
CN106415527A (zh) 消息通信方法及装置
CN112291614A (zh) 一种视频生成方法及装置
CN111831806A (zh) 语义完整性确定方法、装置、电子设备和存储介质
CN106792604B (zh) 在通信过程中进行服务提示的方法及装置
CN113849723A (zh) 搜索方法及搜索装置
CN113656557A (zh) 消息回复方法、装置、存储介质及电子设备
CN111538998B (zh) 文本定密方法和装置、电子设备及计算机可读存储介质
CN111209381B (zh) 对话场景中时间管理方法及装置
CN112631435A (zh) 一种输入方法、装置、设备及存储介质
CN113901832A (zh) 人机对话方法、装置、存储介质及电子设备
CN117882365A (zh) 确定和视觉显示呼叫的口头菜单
CN113569029A (zh) 对话应答方法、装置及存储介质
CN113420553A (zh) 文本生成方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination