CN112667796A - 一种对话回复方法、装置、电子设备及可读存储介质 - Google Patents

一种对话回复方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN112667796A
CN112667796A CN202110008124.4A CN202110008124A CN112667796A CN 112667796 A CN112667796 A CN 112667796A CN 202110008124 A CN202110008124 A CN 202110008124A CN 112667796 A CN112667796 A CN 112667796A
Authority
CN
China
Prior art keywords
corpus
reply
user
query
question
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110008124.4A
Other languages
English (en)
Other versions
CN112667796B (zh
Inventor
汪硕芃
周晓松
张聪
范长杰
胡志鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Netease Hangzhou Network Co Ltd
Original Assignee
Netease Hangzhou Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Netease Hangzhou Network Co Ltd filed Critical Netease Hangzhou Network Co Ltd
Priority to CN202110008124.4A priority Critical patent/CN112667796B/zh
Publication of CN112667796A publication Critical patent/CN112667796A/zh
Application granted granted Critical
Publication of CN112667796B publication Critical patent/CN112667796B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Machine Translation (AREA)

Abstract

本申请提供了一种对话回复方法、装置、电子设备及可读存储介质,其中,该方法包括:获取用户发送的提问语料和向用户进行自动回复的目标语言风格;根据提问语料与候选提问语料的语义相似度,从候选提问语料中筛选出与提问语料的语义相似度大于预设值的目标提问语料;从目标提问语料所对应的第一回复语料中筛选出与目标语言风格相同的第二回复语料;每个第一回复语料中均包含有与该第一回复语料的语言风格相同的流行语;根据第二回复语料回复用户。本申请实施例提高了生成的回复语料的语言风格与向用户进行自动回复的目标语言风格的匹配度。

Description

一种对话回复方法、装置、电子设备及可读存储介质
技术领域
本申请涉及信息技术领域,尤其是涉及一种对话回复方法、装置、电子设备及可读存储介质。
背景技术
随着人工智能技术的发展,自然语言处理被广泛应用于许多领域。对话系统,有时也称为聊天机器人,作为AI和自然语言处理领域中是一项极具挑战性的任务,旨在以自然语言的形式对于对话信息产生流畅的回复。而智能闲聊作为智能问答聊天机器人中非常重要的一个功能,给很多用户带来了心灵的慰藉,对促进人机交互方式的发展有着重要的意义。
在实际过程中,很多用户更愿意选择与可以使用特定风格语言的聊天机器人进行聊天,而目前的聊天机器人在与用户进行聊天时,并不能满足用户的需求,使得用户与机器人的聊天过程缺乏趣味性。
发明内容
有鉴于此,本申请的目的在于提供一种对话回复方法、装置、电子设备及可读存储介质,以实现对话回复时,提高语言风格的匹配度。
第一方面,本申请一种对话回复方法,包括:
获取用户发送的提问语料和向所述用户进行自动回复的目标语言风格;
根据所述提问语料与候选提问语料的语义相似度,从所述候选提问语料中筛选出与所述提问语料的语义相似度大于预设值的目标提问语料;
从所述目标提问语料所对应的第一回复语料中筛选出与所述目标语言风格相同的第二回复语料;每个所述第一回复语料中均包含有与该第一回复语料的语言风格相同的流行语;
根据所述第二回复语料回复所述用户。
结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中,所述候选提问语料是通过以下步骤得到的:
获取提问语料集合和目标语言风格的流行语集合;
从所述提问语料集合中筛选出包含所述目标语言风格的流行语的提问语料作为候选提问语料。
结合第一方面的第一种可能的实施方式,本申请实施例提供了第一方面的第二种可能的实施方式,其中,
所述从所述提问语料集合中筛选出包含流行语的提问语料作为候选提问语料,包括:
利用已训练完成的第一深度神经网络模型从所述提问语料集合中筛选出包含流行语的提问语料作为候选提问语料。
结合第一方面,本申请实施例提供了第一方面的第三种可能的实施方式,其中,所述获取用户发送的提问语料和向所述用户进行自动回复的目标语言风格之后,包括:
将所述提问语料和所述目标语言风格输入至已经训练完成的第二深度神经网络模型,得到与所述目标语言风格相同的第二回复语料。
结合第一方面的第三种可能的实施方式,本申请实施例提供了第一方面的第四种可能的实施方式,其中,所述获取用户发送的提问语料和向所述用户进行自动回复的目标语言风格之后,包括:
将所述提问语料和所述目标语言风格输入至已经训练完成的第二深度神经网络模型,得到与所述目标语言风格相同的第二回复语料。
结合第一方面的第三种可能的实施方式,本申请实施例提供了第一方面的第四种可能的实施方式,其中,所述已经训练完成的第二深度神经网络模型是通过以下步骤训练得到的:
获取样本提问语料和样本回复语料;所述样本回复语料中包含有与该样本回复语料的语言风格相同的流行语;
将具有问答关系的样本提问语料和样本回复语料所形成的语料对作为正样本,以及将不具有问答关系的样本提问语料和样本回复语料所形成的语料对作为负样本;
将所述正样本和所述负样本输入至未训练完成的第二深度神经网络模型中,以对所述未训练完成的第二深度神经网络模型进行训练。
结合第一方面,本申请实施例提供了第一方面的第五种可能的实施方式,其中,向所述用户进行自动回复的目标语言风格是通过以下步骤得到的:
获取用户的历史属性信息;
根据所述用户的历史属性信息,确定所述用户发送的提问语料的语言风格;
根据所述用户发送的提问语料的语言风格,确定向用户进行自动回复的目标语言风格。
结合第一方面的第五种可能的实施方式,本申请实施例提供了第一方面的第六种可能的实施方式,其中,所述历史属性信息包括以下任意一种或多种:年龄、职业、性别和学历。
结合第一方面,本申请实施例提供了第一方面的第七种可能的实施方式,其中,向所述用户进行自动回复的目标语言风格是根据所述用户针对回复对象所下达的进行语言风格选择的触发指令确定的;所述回复对象用于根据所述用户发送的提问语料进行自动回复。
第二方面,本申请实施例还提供一种对话回复装置,包括:
获取模块,用于获取用户发送的提问语料和向所述用户进行自动回复的目标语言风格;
第一筛选模块,用于根据所述提问语料与候选提问语料的语义相似度,从所述候选提问语料中筛选出与所述提问语料的语义相似度大于预设值的目标提问语料;
第二筛选模块,用于从所述目标提问语料所对应的第一回复语料中筛选出与所述目标语言风格相同的第二回复语料;每个所述第一回复语料中均包含有与该第一回复语料的语言风格相同的流行语;
回复模块,用于根据所述第二回复语料回复所述用户。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
本申请实施例提供的一种对话回复方法,包括:获取用户发送的提问语料和向用户进行自动回复的目标语言风格;根据提问语料与候选提问语料的语义相似度,从候选提问语料中筛选出与提问语料的语义相似度大于预设值的目标提问语料;从目标提问语料所对应的第一回复语料中筛选出与目标语言风格相同的第二回复语料;每个第一回复语料中均包含有与该第一回复语料的语言风格相同的流行语;根据第二回复语料回复用户。本申请实施例选择的用于回复用户的第二回复语料,不仅语言风格符合向用户进行自动回复的目标语言风格,而且还包括流行语,并且流行语的语言风格与目标语言风格也是相同的,从而提高了生成的回复语料的语言风格与向用户进行自动回复的目标语言风格的匹配度。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种对话回复方法的流程图;
图2示出了本申请实施例所提供的第二深度神经网络模型的训练流程示意图中;
图3示出了本申请实施例所提供的一种对话回复装置的结构示意图;
图4示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
随着人工智能技术的发展,自然语言处理被广泛应用于许多领域。对话系统,有时也称为聊天机器人,作为AI和自然语言处理领域中是一项极具挑战性的任务,旨在以自然语言的形式对于对话信息产生流畅的回复。而智能闲聊作为智能问答聊天机器人中非常重要的一个功能,给很多用户带来了心灵的慰藉,对促进人机交互方式的发展有着重要的意义。
可以与用户进行问答聊天的智能聊天机器人在与用户进行聊天的过程中,通常先根据语义相似度找到与用户输入的问题相似的目标问题,然后将目标问题对应的回复作为目标回复。而实际过程中,很多用户更期待聊天机器人可以使用符合特定语言风格的语言进行聊天,目前的聊天机器人在与用户聊天的过程中,并没有根据语言风格生成回复,导致聊天机器人的回复的语言风格与用户所期待的特定语言风格的匹配度不高,从而影响用户的聊天体验。
基于此,本申请实施例提供了一种对话回复方法、装置、电子设备及可读存储介质,下面通过实施例进行描述。
为便于对本实施例进行理解,首先对本申请实施例所公开的一种对话方法进行详细介绍。如图1所示的一种对话回复方法的流程图中,包括以下步骤:
S101:获取用户发送的提问语料和向用户进行自动回复的目标语言风格;
S102:根据提问语料与候选提问语料的语义相似度,从候选提问语料中筛选出与提问语料的语义相似度大于预设值的目标提问语料;
S103:从目标提问语料所对应的第一回复语料中筛选出与目标语言风格相同的第二回复语料;每个第一回复语料中均包含有与该第一回复语料的语言风格相同的流行语;
S104:根据第二回复语料回复用户。
在步骤S101中,提问语料指的是用户提出的问题,以使回复对象能够根据用户提出的问题进行自动回复。这里回复对象可以是能够进行自动回复的机器人或者应用程序等。
提问语料可以是字、词、短语或者句子,提问语料可以包括疑问语料、反问语料和设问语料。
用户发送的提问语料可以是音频形式的,例如用户在音频采集设备输入的语音,也可以是文本形式的,例如用户在文本输入区域输入的文字。
在本申请实施例中的回复对象可以使用目标语言风格的语料对用户发送的提问语料进行自动回复。
在具体实施过程中,向用户进行自动回复的目标语言风格可以通过以下至少四种方式确定:
第一种向用户进行自动回复的目标语言风格的获取过程包括以下步骤:
S1011:获取用户的历史属性信息;
S1012:根据用户的历史属性信息,确定用户发送的提问语料的语言风格;
S1013:根据用户发送的提问语料的语言风格,确定向用户进行自动回复的目标语言风格。
在步骤S1011中,历史属性信息可以包括以下任意一种或多种:年龄、职业、性别和学历。在一些可行的实施例中,历史属性信息还可以包括经常居住地、习惯用语和语言类型等信息中的一种或多种。
在具体实施过程中,可以在用户发送提问语料之前,向用户显示用于获取历史属性信息的提示信息,以使得用户根据提示信息输入自己的历史属性信息。在一些可行的实施例中,还可以在用户发送提问语料之前,根据用户的用户名、身份证号等身份信息获取到用户的历史属性信息。
在本申请实施例中,还可以将获取到的历史属性信息保存在数据库中。在一些可行的实施例中,可以根据用户的身份信息判断当前用户是否为新用户,若当前用户为新用户,则可以通过前述方法获取用户的历史属性信息;若当前用户不是新用户,即当前用户为历史用户,则可以根据用户的身份信息从数据库中提取与该用户对应的历史属性信息。
在本申请实施例中,还可以对获取到的历史属性信息进行更新,具体地,针对当前用户为历史用户的情况,首先可以在用户发送提问语料之前,根据向用户展示保存在数据库中的历史属性信息,以使用户确认历史属性是否发生变化,若接收到用户发送的历史属性信息发生变化的确认信息时,则通过前述方法重新获取该用户的历史属性信息,并将重新获取到的用户的历史属性信息对保存在数据库中的历史属性信息进行更新;若接收到用户发送的历史属性信息未发生变化的确认信息时,则直接使用保存的历史属性信息。
在步骤S1012中,用户的历史属性信息,可以影响用户的性格,继而影响用户的用语习惯,例如语言风格和语言种类等,因此可以根据用户的历史属性信息,确定用户发送的提问语料的语言风格。
例如,在一些可行的实施例中,历史属性信息可以为年龄和职业,在实际生活中用户更容易使用跟自己年龄和职业相匹配的语言进行交流,比如大学生,更有可能使用活泼轻松的语言进行交流;再如工程师,更有可能使用严肃谨慎的语言进行交流。
在具体实施过程中,可以根据历史属性信息中的任意一种或多种确定用户发送的提问语料的语言风格。
在步骤S1013中,考虑到用户可能更有意愿跟语言风格与自己相同或相似的回复对象进行对话,因此这里可以根据用户发送的提问语料的语言风格,确定向用户进行自动回复的目标语言风格。
因此,目标语言风格可以是与用户发送的提问语料的语言风格相似的语言风格,也可以是与用户发送的提问语料的语言风格相同的语言风格。
第二种向用户进行自动回复的目标语言风格的获取过程可以为:根据用户发送的提问语料,确定提问语料的语言风格,进而根据用户发送的提问语料的语言风格,确定向用户进行自动回复的目标语言风格。
在根据用户发送的提问语料,确定提问语料的语言风格时,可以根据提问语料中的句子成分、每个句子成分的含义等进行确定。
在一种可行的实施方式中,可以判断提问语料中是否包含流行语;若包含流行语,则根据流行语的语言风格进行确定。
在一些可行的实施方式,当提问语料中未包含流行语时,可以根据提问语料中每个句子成分的含义,确定每个句子成分所属的话题领域;进而根据每个句子成分所属的话题领域进行语言风格的确定。
第三种向用户进行自动回复的目标语言风格的确定过程可以是根据用户针对回复对象所下达的进行语言风格选择的触发指令确定的;回复对象用于根据用户发送的提问语料进行自动回复。
也就是向用户进行自动回复的目标语言风格是用户确定的。用户可以根据自己的兴趣或者自己的语言风格进行选择。用户可以对回复对象下达进行语言风格选择的触发指令。
第四种向用户进行自动回复的目标语言风格还可以是执行主体随机选择的。
在上述获取向用户进行自动回复的目标语言风格的方法中,为了体现对话回复的个性化,可以通过前三种方法进行获取。
在步骤S102中,候选提问语料指的是待选择的提问语料。
候选提问语料可以通过以下步骤得到:
S1021:获取提问语料集合和目标语言风格的流行语集合;
S1022:从提问语料集合中筛选出包含目标语言风格的流行语的提问语料作为候选提问语料。
在步骤S1021中,在获取提问语料集合之前,可以先从社交网络或者即时通讯软件中收集对话语料集合。提问语料集合是对话语料集合中的提问语料的集合。流行语集合可以是从社交网络中收集的预设时间段内的流行词语或者短语,例如“一本正经地胡说八道”、“皮一下很开心”、“工具人”等等。
在获取到流行语集合后,可以通过人工标注的方法对流行语进行语言风格确定的。
目标语言风格可以包括风格温柔派、贱萌派、豪放派等。
在步骤S1022中,步骤S1021中获取的提问语料中可能包含目标语言风格的流行语,也可能未包含目标语言风格的流行语,在该步骤中从提问语料集合中筛选出包含目标语言风格的流行语的提问语料作为候选提问语料。
在具体实施过程中,可以利用已经训练完成的第一深度神经网络模型从提问语料集合中筛选出包含目标语言风格的流行语的提问语料作为候选提问语料。
具体地,这里可以使用Roberta预训练语言模型,Roberta为预训练语言模型的一种,其中该预训练语言模型有12层,嵌入向量维度为768,训练时将对话语料作为输入,得到包含流行语的候选提问语料。
在具体实施过程中,针对未包含提问语料集合中目标语言风格的流行语的提问语料,还可以通过人工检测的方法继续筛选可能存在的流行语的提问语料。
在对第一深度神经网络模型进行训练的过程中,可以将包含流行语的提问语料作为正样本,将未包含流行语但被第一深度神经网络模型识别为包含流行语的提问语料作为负样本,通过利用正样本和负样本对第一深度神经网络模型进行训练,可以提高第一深度神经网络模型的识别精度。
在具体实施过程中,可以根据提问语料与候选提问语料的语义相似度,从候选提问语料中筛选出与提问语料的语义相似度大于预设值的目标提问语料。
在步骤S103中,目标提问语料所对应的第一回复语料中均包含有该第一回复语料的语言风格相同的流行语,也就是第一回复语料的语言风格与该第一回复语料中包含的流行语的语言风格是相同。
不同的第一回复语料的语言风格与目标语言风格可能相同,也可能不相同,这里可以从目标提问语料所对应的第一回复语料中筛选出与目标语言风格相同的第二回复语料。
在步骤S104中,通过上述步骤筛选出来的第二回复语料是包含有与目标语言风格相同的流行语的语料,且第二回复语料的语义与用户发送的提问语料的语义大于预设值,因此根据第二回复语料可以回复用户,并且更符合回复对象的语言风格。
在一种可能的实施方式中,可以在获取用户发送的提问语料和向所述用户进行自动回复的目标语言风格之后,将提问语料和目标语言风格输入至已经训练完成的第二深度神经网络模型,得到与目标语言风格相同的第二回复语料。
也就是利用已经训练完成的第二深度神经网络模型执行步骤S102和S103的过程。
在具体实施过程中,如图2所示的第二深度神经网络模型的训练流程示意图中,已经训练完成的第二深度神经网络模型是通过以下步骤训练得到的:
S201:获取样本提问语料和样本回复语料;样本回复语料中包含有与该样本回复语料的语言风格相同的流行语;
S202:将具有问答关系的样本提问语料和样本回复语料所形成的语料对作为正样本,以及将不具有问答关系的样本提问语料和样本回复语料所形成的语料对作为负样本;
S203:将正样本和负样本输入至未训练完成的第二深度神经网络模型中,以对未训练完成的第二深度神经网络模型进行训练。
在步骤S201中,样本回复语料中包含有与该样本回复语料的语言风格相同的流行语,也就是样本回复语料的语言风格与流行语的语言风格相同。
样本提问语料与样本回复语料可能具有问答关系,可能不具有问答关系。
在步骤S202中,可以将具有问答关系的样本提问语料和样本回复语料所形成的语料对作为正样本,以及将不具有问答关系的样本提问语料和样本回复语料所形成的语料对作为负样本。
通过正样本和负样本对未训练完成的第二深度神经网络模型进行训练,可以提高第二深度神经网络模型的匹配精度。
在步骤S203,训练完成的第二深度神经网络模型可以根据用户发送的提问语料和候选提问语料,找到目标语言风格相同的第二回复语料。
基于相同的技术构思,本申请实施例还提供一种对话回复装置、电子设备、以及计算机可读存储介质等,具体可参见以下实施例。
图3是示出本申请的一些实施例的对话回复装置的框图,该对话回复装置实现的功能对应上述在终端设备上执行对话回复方法的步骤。该装置可以理解为一个包括处理器的服务器的组件,该组件能够实现上述对话回复方法,如图3所示,该对话回复装置可以包括:
第一获取模块301,用于获取用户发送的提问语料和向所述用户进行自动回复的目标语言风格;
第一筛选模块302,用于根据所述提问语料与候选提问语料的语义相似度,从所述候选提问语料中筛选出与所述提问语料的语义相似度大于预设值的目标提问语料;
第二筛选模块303,用于从所述目标提问语料所对应的第一回复语料中筛选出与所述目标语言风格相同的第二回复语料;每个所述第一回复语料中均包含有与该第一回复语料的语言风格相同的流行语;
回复模块,用于根据所述第二回复语料回复所述用户。
在一种可行的实施方式中,还包括:
第二获取模块,用于获取提问语料集合和目标语言风格的流行语集合;
第三筛选模块,用于从所述提问语料集合中筛选出包含所述目标语言风格的流行语的提问语料作为候选提问语料。
在一种可行的实施方式中,所述第三筛选模块,具体用于:利用已训练完成的第一深度神经网络模型从所述提问语料集合中筛选出包含流行语的提问语料作为候选提问语料。
在一种可行的实施方式中,还包括输入模块,具体用于:将所述提问语料和所述目标语言风格输入至已经训练完成的第二深度神经网络模型,得到与所述目标语言风格相同的第二回复语料。
在一种可行的实施方式中,还包括:
第四获取模块,用于获取样本提问语料和样本回复语料;所述样本回复语料中包含有与该样本回复语料的语言风格相同的流行语;
处理模块,用于将具有问答关系的样本提问语料和样本回复语料所形成的语料对作为正样本,以及将不具有问答关系的样本提问语料和样本回复语料所形成的语料对作为负样本;
子输入模块,用于将所述正样本和所述负样本输入至未训练完成的第二深度神经网络模型中,以对所述未训练完成的第二深度神经网络模型进行训练。
在一种可行的实施方式中,还包括:
第五获取模块,用于获取用户的历史属性信息;
第一确定模块,用于根据所述用户的历史属性信息,确定所述用户发送的提问语料的语言风格;
第二确定模块,用于根据所述用户发送的提问语料的语言风格,确定向用户进行自动回复的目标语言风格。
在一种可行的实施方式中,所述历史属性信息包括以下任意一种或多种:年龄、职业、性别和学历。
在一种可行的实施方式中,向所述用户进行自动回复的目标语言风格是根据所述用户针对回复对象所下达的进行语言风格选择的触发指令确定的;所述回复对象用于根据所述用户发送的提问语料进行自动回复。
本申请实施例公开了一种电子设备,如图4所示,包括:处理器401、存储器402和总线403,所述存储器402存储有所述处理器401可执行的机器可读指令,当电子设备运行时,所述处理器401与所述存储器402之间通过总线403通信。
所述机器可读指令被所述处理器401执行时执行前面方法实施例中所述的任一方法,具体实现可参见方法实施例,在此不再赘述。
本申请实施例所提供的进行对话回复方法的计算机程序产品,包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (11)

1.一种对话回复方法,其特征在于,包括:
获取用户发送的提问语料和向所述用户进行自动回复的目标语言风格;
根据所述提问语料与候选提问语料的语义相似度,从所述候选提问语料中筛选出与所述提问语料的语义相似度大于预设值的目标提问语料;
从所述目标提问语料所对应的第一回复语料中筛选出与所述目标语言风格相同的第二回复语料;每个所述第一回复语料中均包含有与该第一回复语料的语言风格相同的流行语;
根据所述第二回复语料回复所述用户。
2.根据权利要求1所述的对话回复方法,其特征在于,所述候选提问语料是通过以下步骤得到的:
获取提问语料集合和目标语言风格的流行语集合;
从所述提问语料集合中筛选出包含所述目标语言风格的流行语的提问语料作为候选提问语料。
3.根据权利要求2所述的对话回复方法,其特征在于,所述从所述提问语料集合中筛选出包含流行语的提问语料作为候选提问语料,包括:
利用已训练完成的第一深度神经网络模型从所述提问语料集合中筛选出包含流行语的提问语料作为候选提问语料。
4.根据权利要求1所述的对话回复方法,其特征在于,所述获取用户发送的提问语料和向所述用户进行自动回复的目标语言风格之后,包括:
将所述提问语料和所述目标语言风格输入至已经训练完成的第二深度神经网络模型,得到与所述目标语言风格相同的第二回复语料。
5.根据权利要求4所述的对话回复方法,其特征在于,所述已经训练完成的第二深度神经网络模型是通过以下步骤训练得到的:
获取样本提问语料和样本回复语料;所述样本回复语料中包含有与该样本回复语料的语言风格相同的流行语;
将具有问答关系的样本提问语料和样本回复语料所形成的语料对作为正样本,以及将不具有问答关系的样本提问语料和样本回复语料所形成的语料对作为负样本;
将所述正样本和所述负样本输入至未训练完成的第二深度神经网络模型中,以对所述未训练完成的第二深度神经网络模型进行训练。
6.根据权利要求1所述的对话回复方法,其特征在于,向所述用户进行自动回复的目标语言风格是通过以下步骤得到的:
获取用户的历史属性信息;
根据所述用户的历史属性信息,确定所述用户发送的提问语料的语言风格;
根据所述用户发送的提问语料的语言风格,确定向用户进行自动回复的目标语言风格。
7.根据权利要求6所述的对话回复方法,其特征在于,所述历史属性信息包括以下任意一种或多种:年龄、职业、性别和学历。
8.根据权利要求1所述的对话回复方法,其特征在于,向所述用户进行自动回复的目标语言风格是根据所述用户针对回复对象所下达的进行语言风格选择的触发指令确定的;所述回复对象用于根据所述用户发送的提问语料进行自动回复。
9.一种对话回复装置,其特征在于,包括:
获取模块,用于获取用户发送的提问语料和向所述用户进行自动回复的目标语言风格;
第一筛选模块,用于根据所述提问语料与候选提问语料的语义相似度,从所述候选提问语料中筛选出与所述提问语料的语义相似度大于预设值的目标提问语料;
第二筛选模块,用于从所述目标提问语料所对应的第一回复语料中筛选出与所述目标语言风格相同的第二回复语料;每个所述第一回复语料中均包含有与该第一回复语料的语言风格相同的流行语;
回复模块,用于根据所述第二回复语料回复所述用户。
10.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至8任一所述的一种对话回复方法的步骤。
11.一种可读存储介质,其特征在于,该可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至8任一所述的一种对话回复方法的步骤。
CN202110008124.4A 2021-01-05 2021-01-05 一种对话回复方法、装置、电子设备及可读存储介质 Active CN112667796B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110008124.4A CN112667796B (zh) 2021-01-05 2021-01-05 一种对话回复方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110008124.4A CN112667796B (zh) 2021-01-05 2021-01-05 一种对话回复方法、装置、电子设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN112667796A true CN112667796A (zh) 2021-04-16
CN112667796B CN112667796B (zh) 2023-08-11

Family

ID=75412966

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110008124.4A Active CN112667796B (zh) 2021-01-05 2021-01-05 一种对话回复方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN112667796B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113051388A (zh) * 2021-04-30 2021-06-29 中国银行股份有限公司 一种智能问答方法、装置、电子设备及存储介质
CN113094490A (zh) * 2021-05-13 2021-07-09 重庆度小满优扬科技有限公司 一种会话交互方法、装置、电子设备及存储介质
CN113378583A (zh) * 2021-07-15 2021-09-10 北京小米移动软件有限公司 对话回复方法及装置、对话模型训练方法及装置、存储介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060113311A (ko) * 2005-05-30 2006-11-02 (주)다음소프트 대화 에이전트를 이용한 개인용 컴퓨터 상의 커뮤니케이션방법 및 시스템
US20110078105A1 (en) * 2009-09-29 2011-03-31 Pandorabots Method for personalizing chat bots
CN105138710A (zh) * 2015-10-12 2015-12-09 金耀星 一种聊天代理系统及方法
US20160140958A1 (en) * 2014-11-19 2016-05-19 Electronics And Telecommunications Research Institute Natural language question answering system and method, and paraphrase module
CN106469212A (zh) * 2016-09-05 2017-03-01 北京百度网讯科技有限公司 基于人工智能的人机交互方法和装置
KR20180001155A (ko) * 2016-06-27 2018-01-04 (주)휴먼웍스 빅 데이터를 이용한 인공지능의 온라인 채팅 대화상대 자동맞춤 방법과 이를 위한 자동맞춤 시스템
WO2018157700A1 (zh) * 2017-03-02 2018-09-07 腾讯科技(深圳)有限公司 对话生成方法、装置及存储介质
CN108711423A (zh) * 2018-03-30 2018-10-26 百度在线网络技术(北京)有限公司 智能语音交互实现方法、装置、计算机设备及存储介质
CN109977207A (zh) * 2019-03-21 2019-07-05 网易(杭州)网络有限公司 对话生成方法、对话生成装置、电子设备及存储介质
CN110265021A (zh) * 2019-07-22 2019-09-20 深圳前海微众银行股份有限公司 个性化语音交互方法、机器人终端、装置及可读存储介质
CN111125360A (zh) * 2019-12-19 2020-05-08 网易(杭州)网络有限公司 游戏领域的情感分析方法、装置及其模型训练方法、装置
CN112036156A (zh) * 2020-09-25 2020-12-04 北京小米松果电子有限公司 文本对话方法、装置及存储介质
CN112100354A (zh) * 2020-09-16 2020-12-18 北京奇艺世纪科技有限公司 人机对话方法、装置、设备及存储介质

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060113311A (ko) * 2005-05-30 2006-11-02 (주)다음소프트 대화 에이전트를 이용한 개인용 컴퓨터 상의 커뮤니케이션방법 및 시스템
US20110078105A1 (en) * 2009-09-29 2011-03-31 Pandorabots Method for personalizing chat bots
US20160140958A1 (en) * 2014-11-19 2016-05-19 Electronics And Telecommunications Research Institute Natural language question answering system and method, and paraphrase module
CN105138710A (zh) * 2015-10-12 2015-12-09 金耀星 一种聊天代理系统及方法
KR20180001155A (ko) * 2016-06-27 2018-01-04 (주)휴먼웍스 빅 데이터를 이용한 인공지능의 온라인 채팅 대화상대 자동맞춤 방법과 이를 위한 자동맞춤 시스템
CN106469212A (zh) * 2016-09-05 2017-03-01 北京百度网讯科技有限公司 基于人工智能的人机交互方法和装置
WO2018157700A1 (zh) * 2017-03-02 2018-09-07 腾讯科技(深圳)有限公司 对话生成方法、装置及存储介质
CN108711423A (zh) * 2018-03-30 2018-10-26 百度在线网络技术(北京)有限公司 智能语音交互实现方法、装置、计算机设备及存储介质
CN109977207A (zh) * 2019-03-21 2019-07-05 网易(杭州)网络有限公司 对话生成方法、对话生成装置、电子设备及存储介质
CN110265021A (zh) * 2019-07-22 2019-09-20 深圳前海微众银行股份有限公司 个性化语音交互方法、机器人终端、装置及可读存储介质
CN111125360A (zh) * 2019-12-19 2020-05-08 网易(杭州)网络有限公司 游戏领域的情感分析方法、装置及其模型训练方法、装置
CN112100354A (zh) * 2020-09-16 2020-12-18 北京奇艺世纪科技有限公司 人机对话方法、装置、设备及存储介质
CN112036156A (zh) * 2020-09-25 2020-12-04 北京小米松果电子有限公司 文本对话方法、装置及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113051388A (zh) * 2021-04-30 2021-06-29 中国银行股份有限公司 一种智能问答方法、装置、电子设备及存储介质
CN113051388B (zh) * 2021-04-30 2024-02-02 中国银行股份有限公司 一种智能问答方法、装置、电子设备及存储介质
CN113094490A (zh) * 2021-05-13 2021-07-09 重庆度小满优扬科技有限公司 一种会话交互方法、装置、电子设备及存储介质
CN113094490B (zh) * 2021-05-13 2022-11-22 度小满科技(北京)有限公司 一种会话交互方法、装置、电子设备及存储介质
CN113378583A (zh) * 2021-07-15 2021-09-10 北京小米移动软件有限公司 对话回复方法及装置、对话模型训练方法及装置、存储介质

Also Published As

Publication number Publication date
CN112667796B (zh) 2023-08-11

Similar Documents

Publication Publication Date Title
CN112667796B (zh) 一种对话回复方法、装置、电子设备及可读存储介质
CN111177359A (zh) 多轮对话方法和装置
CN112487173B (zh) 人机对话方法、设备和存储介质
CN109918494B (zh) 基于图的上下文关联回复生成方法、计算机及介质
CN113360622B (zh) 用户对话信息的处理方法、装置及计算机设备
CN108682420A (zh) 一种音视频通话方言识别方法及终端设备
Qaffas Improvement of Chatbots semantics using wit. ai and word sequence kernel: Education Chatbot as a case study
CN110413753B (zh) 问答样本的扩展方法及装置
CN112632242A (zh) 智能对话方法及装置、电子设备
US20190295199A1 (en) Intelligent legal simulator
CN112287085B (zh) 语义匹配方法、系统、设备及存储介质
CN117149984A (zh) 一种基于大模型思维链的定制化培训方法及装置
CN112199486A (zh) 一种办公场景的任务型多轮对话方法及系统
CN115186080A (zh) 一种智能问答数据处理方法、系统、计算机设备及介质
CN113901837A (zh) 一种意图理解方法、装置、设备及存储介质
CN113934834A (zh) 一种问句匹配的方法、装置、设备和存储介质
CN112579733B (zh) 规则匹配方法、规则匹配装置、存储介质及电子设备
CN112818096A (zh) 对话生成方法及其装置
CN115617974B (zh) 一种对话处理方法、装置、设备及存储介质
CN113569017A (zh) 一种模型处理方法、装置、电子设备及存储介质
CN112100355A (zh) 一种智能交互方法、装置及设备
CN116821290A (zh) 面向多任务对话的大语言模型训练方法和交互方法
CN115114404A (zh) 智能客服的问答方法、装置、电子设备及计算机存储介质
CN115098665A (zh) 一种对话数据扩展方法、装置及设备
CN115129866A (zh) 训练文本生成方法、模型训练方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant