CN112035633B - 数据处理方法、装置、对话设备及存储介质 - Google Patents
数据处理方法、装置、对话设备及存储介质 Download PDFInfo
- Publication number
- CN112035633B CN112035633B CN202010855221.2A CN202010855221A CN112035633B CN 112035633 B CN112035633 B CN 112035633B CN 202010855221 A CN202010855221 A CN 202010855221A CN 112035633 B CN112035633 B CN 112035633B
- Authority
- CN
- China
- Prior art keywords
- dialogue
- data
- topic
- target
- dialog
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
Abstract
本发明实施例公开了一种数据处理方法、装置、对话设备及存储介质,其中方法包括:在与目标用户的对话过程中,获取所述目标用户的历史对话数据,以及所述目标用户的用户信息;确定所述历史对话数据的第一对话主题,并确定从所述第一对话主题转换为至少一个第二对话主题的转移概率;根据所述转移概率从所述至少一个第二对话主题中确定出目标对话主题;根据所述历史对话数据和所述目标用户的用户信息确定对话表征信息,并根据所述目标对话主题引导所述对话表征信息生成所述目标对话主题下的目标对话数据,可实现对对话主题的引导,从而保证对话的流畅度。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种数据处理方法、装置、对话设备及存储介质。
背景技术
当前,随着计算机技术的不断深入发展,为了提升用户的工作效率,或者丰富用户的业余生活,各种类型的对话设备层出不穷,如用于辅助进行点单的对话设备,以及商场中用于辅助进行楼层或者商店查找的对话设备等。当前的对话设备实现和用户之间的对话,大都采用的是接收到用户的对话数据后,对该对话数据进行语义分析,从而基于该语义分析结果,生成相应的目标对话,但当前的对话设备如果接收到的对话数据是简单的问候型数据,如“你好”,“再见”等,该对话设备反馈给用户的目标对话则是较为宽泛的“好的”等数据,也就使得对话设备和用户之间的对话难以延续,所以,如何使得对话设备保持流畅的对话成为了当前的研究热点。
发明内容
本发明实施例提供了一种数据处理方法、装置、对话设备及存储介质,可实现对对话主题的引导,从而保证对话的流畅度。
一方面,本发明实施例提供了一种数据处理方法,包括:
在与目标用户的对话过程中,获取所述目标用户的历史对话数据,以及所述目标用户的用户信息;
确定所述历史对话数据的第一对话主题,并确定从所述第一对话主题转换为至少一个第二对话主题的转移概率;
根据所述转移概率从所述至少一个第二对话主题中确定出目标对话主题;
根据所述历史对话数据和所述目标用户的用户信息确定对话表征信息,并根据所述目标对话主题引导所述对话表征信息生成所述目标对话主题下的目标对话数据。
再一方面,本发明实施例提供了一种数据处理装置,包括:
获取单元,用于在与目标用户的对话过程中,获取所述目标用户的历史对话数据,以及所述目标用户的用户信息;
确定单元,用于确定所述历史对话数据的第一对话主题,并确定从所述第一对话主题转换为至少一个第二对话主题的转移概率;
所述确定单元,还用于根据所述转移概率从所述至少一个第二对话主题中确定出目标对话主题;
所述确定单元,还用于根据所述历史对话数据和所述目标用户的用户信息确定对话表征信息;
生成单元,用于根据所述目标对话主题引导所述对话表征信息生成所述目标对话主题下的目标对话数据。
再一方面,本发明实施例提供了一种对话设备,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储支持终端执行上述方法的计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如下步骤:
在与目标用户的对话过程中,获取所述目标用户的历史对话数据,以及所述目标用户的用户信息;
确定所述历史对话数据的第一对话主题,并确定从所述第一对话主题转换为至少一个第二对话主题的转移概率;
根据所述转移概率从所述至少一个第二对话主题中确定出目标对话主题;
根据所述历史对话数据和所述目标用户的用户信息确定对话表征信息,并根据所述目标对话主题引导所述对话表征信息生成所述目标对话主题下的目标对话数据。
再一方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有第一程序指令和第二程序指令,所述第一程序指令被处理器执行时,用于执行如第一方面所述的数据处理方法,所述第二程序指令被处理器执行时,用于执行如第二方面所述的数据处理方法。
在本发明实施例中,对话设备与目标用户的对话过程中,可先获取该目标用户的历史对话数据,以及该目标用户的用户信息,从而可确定出该历史对话数据的第一对话主题,并进而确定由该第一对话主题转移为至少一个第二对话主题的转移概率,进一步地,该对话设备可根据该转移概率从该至少一个第二对话主题中确定出目标对话主题,从而使得对话设备可在根据该历史对话数据和该目标用户的用户信息确定出对话表征信息后,采用确定出的目标对话主题引导该对话表征信息生成该目标对话主题下的目标对话数据,由于对话设备在确定目标对话主题时,是基于大量语料中话题之间的转移概率,以及历史对话数据的对话主题进行预测的,使得预测得到的目标对话主题和历史对话数据的对话主题之间的关联性较强,从而可提升对话设备确定出的对话主题与历史对话主题之间的衔接度,也就提升了对话设备的流畅性和自然性,使得对话设备达到前后对话衔接自然的效果。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种数据处理系统的示意图;
图2是本发明实施例提供的一种数据处理方法的示意流程图;
图3是本发明实施例提供的一种数据处理方法的示意流程图;
图4a是本发明实施例提供的一种对话生成模型的示意图;
图4b是本发明实施例提供的一种对先验网络模型进行训练的示意图;
图5是本发明实施例提供的一种数据处理装置的示意性框图;
图6是本发明实施例提供的一种对话设备的示意性框图。
具体实施方式
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。人工智能(Artificial Intelligence,AI)技术是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能,其中,人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。本申请实施例提供的方案主要涉及人工智能的自然语言处理(Nature Language processing,NLP)技术,以及机器学习(Machine Learning,ML)技术。
自然语言处理(Nature Language processing,NLP)技术是计算机科学领域与人工智能领域中的一个重要方向,它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学,因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。机器学习(Machine Learning,ML)技术是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。本发明实施例提出的数据处理方法主要涉及上述的文本处理、机器人问答、机器学习以及深度学等技术,通过机器学习和深度学习使得对话设备可具备根据与目标用户之间的历史对话数据,确定出该历史对话数据的第一对话主题的能力,进一步地,对话设备可确定该第一对话主题进行主题转移时的转移概率,并基于该转移概率确定出目标对话主题,进而对话设备可根据与该目标用户之间的历史对话数据,以及该目标用户的用户信息,生成目标对话主题下的目标对话数据,使得对话设备可实现对目标对话主题的选择进行控制,从而基于选择的目标对话主题引导对话内容的生成。
在一个实施例中,该对话设备可在与目标用户的对话过程中,进行目标对话主题的生成,在具体实现中,对话设备可在与目标用户的对话过程中,获取与该目标用户之间的历史对话数据,与该目标用户的对话过程是指对话设备与该目标用户的当前对话过程,在该当前对话过程中,该目标用户可能在启动显示对话界面后,并未通过该对话界面向对话设备发送对话数据,或者,在该当前对话过程中,该目标用户可能在启动该对话界面后,已向该对话设备发送了一条或多条对话数据。在一个实施例中,该历史对话数据则是指在当前对话之前所采集到的对话数据,该对话设备可以是服务器设备,或者,该对话设备也可以是终端设备,在本发明实施例中不做限制。
在对话设备对目标用户的历史对话数据进行获取的同时,还可获取该目标用户的用户信息,其中,对话设备获取的用户信息的数量为多个,不同的用户信息与不同的对话主题相关联,该不同的用户信息通过从不同的对话主题对该目标用户进行描述,使得对话设备可实现对目标用户个人形象的具体展示,在一个实施例中,该不同的对话主题可以是如下的10个对话主题中的一种或多种:文学主题,工作主题,饮食主题,家庭主题,影视主题,运动主题,宠物主题,年龄主题,姓名主题,朋友主题,旅行主题,由于不同用户信息所对应的对话主题的不同,对话设备通过目标用户在不同对话主题下对应的用户信息,可确定出该目标用户的用户形象,如确定出该目标用户的偏好等形象,从而可在生成目标对话数据时,生成与该目标用户的用户形象匹配的对话数据,使得对话设备实现了在与目标用户进行对话的过程中,对话数据前后的自然衔接,提升了对话流畅性。
在一个实施例中,对话设备可在和目标用户进行对话之前,获取该目标用户的用户信息,如该对话设备可通过上述提及的不同对话主题,分别向该目标用户发送与该不同对话主题相关的提问数据,从而可基于目标用户对该提问数据的回复获取得到对应对话主题下的该目标用户的用户信息,其中,若对话设备采用向目标用户发送提问数据的方法未获取到每个对话主题下的用户信息,比如对话设备需要获取上述10对话主题下的用户信息,但仅获取到5个对话主题下的用户信息,则对话设备可从预设的用户信息训练集中随机获取剩余的5个对话主题下的用户信息,从而实现对目标用户在各个对话主题下的用户信息的采集。在一个实施例中,该对话设备在获取到该目标用户的历史对话数据和用户信息后,则可基于该历史对话数据对应的第一对话主题,确定由该第一对话主题转换为不同的第二对话主题的转移概率。
可以理解的是,在对话过程中相邻对话数据对应的对话主题之间的转移概率通常是较为固定的,也就是说,当前一次对话数据所涉及到的对话主题为“文学”主题时,那么,当前继续涉及的对话数据的主题可能继续为“文学”,或者可能转换为“影视”主题的概率比较大,而转换为“姓名”主题的概率就比较小。基于此,该对话设备则可在确定从第一对话主题转换为至少一个第二对话主题的转移概率时,先获取基于该第一对话主题下的对话数据转换为不同第二对话主题的至少一个对话样本,进一步地,对话设备可对获取到的至少一个对话样本进行分类,确定划分到不同第二对话主题下的对话样本的数量,并基于该不同第二对话主题下的对话样本的数量,以及获取的对话样本的总数,确定由第一对话主题转换为第二对话主题的转移概率,举例来说,若该第一对话主题为“文学”主题,不同的第二对话主题分别为“文学”主题,“影视”主题,“运动”主题,以及家“家庭”主题,若获取到的对话样本的总数为1000,且分别划分到“文学”主题的数量为500,划分到“影视”主题的数量为400,划分到“运动”主题的数量为60,划分到“家庭”主题的数量为40,可计算得到由“文学”主题转换为“文学”主题的概率为50%,由“文学”主题转换为“影视”主题的概率为40%,由“文学”主题转换为“运动”主题的概率为6%,由“文学”主题转换为“家庭”主题的概率为4%。在一个实施例中,该多个不同的第二对话主题可包括上述的第一对话主题,也可不包括该第一对话主题,在本发明实施例中,以该多个不同的第二对话主题包括该第一对话主题为例进行详细说明,在该不同的第二对话主题不包括该第一对话主题时,可参见本发明实施例。
在一个实施例中,对话设备在确定出从历史对话数据的第一对话主题转换为不同第二对话主题的转移概率时,可基于确定出的转移概率从该不同第二对话主题中确定出目标对话主题,从而可根据该历史对话数据和该目标用户的用户信息生成目标对话主题下的目标对话数据,其中,对话设备可基于不同第二对话主题分别对应的转移概率,将最大转移概率对应的第二对话主题作为该目标对话主题,可以理解的是,由于该不同第二对话主题是包含该第一对话主题的,所以由第一对话主题转换为第一对话主题的转移概率也必然是该转移概率的最大值,所以,在对话设备希望继续谈论该第一对话主题时,可直接从该多个不同的第二对话主题的转移概率中选取出最大转移概率,从而将该最大转移概率对应的对话主题(即第一对话主题),作为该目标对话主题。或者,若对话设备希望切换对话主题,则该对话设备则在从该多个不同的对话主题的转移概率中选取最大转移概率时,是选取的除该第一对话主题的转移概率之外的最大值,进而使得对话设备可切换到其他对话主题进行后续的对话过程,实现对对话过程的引导。
在一个实施例中,该数据处理方法可应用于如图1所示的数据处理系统中,如图1所示,该数据处理系统包括目标用户对应的客户端10,以及对话设备11,目标用户可通过客户端10触发进行与对话设备11进行对话,在具体实现中,客户端10可在检测到目标用户对对话界面的显示操作后,向对话设备11发送对话请求,对话设备11在接收到客户端10发送的对话请求后,则可获取该客户端10对应目标用户的历史对话数据,以及该目标用户的用户信息,进而对话设备11可基于该历史对话数据的第一对话主题,确定出由该第一对话主题转换到不同的第二对话主题的转移概率,并在基于该转移概率确定出目标对话主题后,根据该历史对话数据和用户信息生成目标对话主题下的目标对话数据,对话设备11在生成该目标对话数据后,可将该目标对话数据发送到客户端10,以在客户端10的对话界面中显示该目标对话数据,从而实现与目标用户的对话交互过程。
请参见图2,是本发明实施例提供的一种数据处理方法的示意流程图,该数据处理方法由上述的对话设备执行,如图2所示,该方法可包括:
S201,在与目标用户的对话过程中,获取所述目标用户的历史对话数据,以及所述目标用户的用户信息。
在一个实施例中,该历史对话数据是目标用户在当前对话之前的历史对话过程中,发送给对话设备的对话数据,而该用户信息则是该对话设备在与目标用户进行当前对话之前获取得到的,其中,对话设备获取的用户信息是分别与不同对话主题相对应的,该对话主题是对话设备中预设的固定主题,如家庭(family)主题,宠物(pet)主题,以及文学(literature)主题等,该对话设备在获取该目标用户的用户信息时,则可从预设的不同的对话主题中,分别获取一个或多个不同的描述性语句作为对应对话主题下的用户信息,如对话设备可获取文学主题下的描述语句作为该目标用户在文学主题下的用户信息,该文学主题下的描述语句可以是:我一年读20本书,即目标用户在文学主题下的用户信息为我一年读20本书。
在一个实施例中,对话设备可从对话数据集中获取该目标用户在不同对话主题下的用户信息,其中,该对话数据集可以是对话设备向目标用户发送询问信息采集到的多个对话数据,进一步地,对话设备可调用第一分类器C1对该对话数据集中的多个对话数据基于对话主题的不同进行分类,从而可将该对话数据集中的对话数据划分到不同的对话主题中,进一步地,可将不同对话主题的描述语句作为该目标用户在对应对话主题下得用户信息。其中,该对话设备对该对话数据集进行对话主题的划分后,各对话主题下的描述语句可如表1所示:
表1
对话主题 | 描述语句 |
文学主题 | 我一年读20本书 |
工作主题 | 我兼职做替身演员 |
饮食主题 | 我吃素食 |
家庭主题 | 我在单亲家庭长大 |
影视主题 | 我最爱的电影类型是英雄主义类 |
基于上述表1可知,对话设备基于对话数据集可确定出该目标对象在如表1所示的5个对话主题下的描述语句,也即该对话设备可基于对话数据集确定出该目标对象在如表1所示的5个对话主题下的用户信息。在一个实施例中,若对话设备设定的需要获取的目标用户的用户信息对应的主题包括10个,该10个对话主题为除上述的文学(literature)主题,工作(job)主题,饮食(eat)主题,家庭(family)主题,以及影视(TV)主题之外的运动(sports)主题,宠物(pet)主题,年龄(age)主题,姓名(name)主题,朋友(friend)主题,以及旅行(travel)主题。在一个实施例中,对话设备为了获取得到剩余5个对话主题下的描述语句,可从训练数据集中进行获取,在一个实施例中,该对话设备同样可调用第一分类器C1对该训练数据集中的训练数据进行分类处理,从而获取得到该剩余5个对话主题下的描述语句,并将该剩余5个对话主题下的描述语句作为该目标用户在该剩余5个对话主题下的用户信息,从而实现对目标用户的用户信息的获取。
在一个实施例中,该训练数据集是对话智能挑战赛(ConversationalIntelligence Challenge,ConvAI)数据集,该ConvAI数据集提供了大量在不同对话主题下的描述语句,对话设备则可从该ConvAI数据集中获取对应描述语句作为该目标用户的用户信息。在一个实施例中,该第一分类器C1是用于分类个人信息的描述语句对应对话主题的分类器,该第一分类器C1的实现方法为:首先,对预设数量(如200句)的描述信息对应的对话主题进行人工标注,进一步的,可采用词向量移动距离(Word Mover’s Embedding)的方法进行描述信息的句子向量表示,再采用邻近算法(K-NearestNeighbor,KNN)基于该句子向量对应的对话主题的不同对该句子向量进行分类训练,从而使得第一分类器C1学习得到对用户信息的主题进行分类的能力。其中,KNN算法是挖掘分类技术中最简单的方法之一,KNN算法是将数据集合中的每个记录进行分类的方法,也可称为K最近邻算法,其中,K最近邻就是K个最近的邻居的意思,即每个样本都可以用它最接近的K个邻近值进行代表。
在一个实施例中,对话设备在获取该目标用户的历史对话数据的同时,获取该目标用户的用户信息,或者,该对话设备也可在获取该历史对话数据之后,再获取该目标用户的用户信息,或者,该对话设备也可在获取该目标用户的用户信息后,再获取该目标用户的历史对话数据,在本发明实施例中,对该对话设备或该历史对话数据和用户信息的先后顺序不做限定。在一个实施例中,对话设备在获取到该目标用户的历史对话数据后,则可进一步确定出该历史对话数据的第一对话主题,即转而执行步骤S202。
S202,确定所述历史对话数据的第一对话主题,并确定从所述第一对话主题转换为至少一个第二对话主题的转移概率。
在一个实施例中,对话设备在基于该历史对话数据,确定该历史对话数据的第一对话主题时,可采用第二分类器C2确定该历史对话数据的第一对话主题,其中,对话设备可将当前对话记为第i次对话,则该历史对话数据则可认为是对话设备在第i-1次对话中获取到的数据,进一步地,对话设备则可调用该第二分类器C2确定该历史对话数据的第一对话主题,其中,对话设备可将该历史对话数据输入该第二分类器C2中,从而得到该历史对话数据属于不同对话主题(该不同对话主题例如可以是上述10个对话主题中的任一个对话主题)的概率分布yi-1,得到的概率分布yi-1例如可以如式1.1所示:
其中,表示该历史对话数据的第一对话主题为编号1的对话主题的概率,表示该第一对话主题为编号2的对话主题的概率,该编号1的对话主题例如可以是上述的文学主题,该编号2的对话主题例如可以是上述的影视主题或者姓名主题等。在一个实施例中,对话设备在调用第二分类器C2确定出该历史对话数据属于不同对话主题的概率分布yi-1后,进一步地,可基于该历史对话数据属于不同对话主题的概率分布yi-1,确定出该历史对话数据的第一对话主题,在具体实现中,该对话设备可先确定出该历史对话数据所对应的主题概率分布yi-1中的最大概率值,从而可将该最大概率值所指示的对话主题作为该历史对话数据的第一对话主题。在一个实施例中,若该历史对话数据为“我爱猫”,其对应于不同对话主题的概率分布为式1.2,
yi-1=(1,0,…0)T 式1.2
对话设备在确定出历史对话数据“我爱猫”对应于不同对话主题的概率分布后,由于最大概率值为1,且其最大概率值对应对话主题为宠物主题,则可确定该历史对话数据“我爱猫”的第一对话主题为宠物主题。在一个实施例中,对话设备在确定出该历史对话主题后,还可进一步确定从第一对话主题转换为至少一个第二对话主题的转移概率,从而基于该转移概率从该至少一个第二对话主题中确定出目标对话主题,即转而执行步骤S203。在一个实施例中,由于在进行对话时,相邻对话的对话主题之间的转移概率是较为固定的,所以对话设备可基于预先对对话样本集中的对话样本基于主题进行分类,确定出第一对话主题转换为至少一个第二对话主题的转移概率,在具体实现中,该对话设备获取的对话样本集可以是基于第一对话主题下的初始对话数据进行主题转换得到的对话样本,对话设备在获取到该对话样本集后,可基于第二对话主题的不同将该对话样本集中的多个对话样本分别划分到不同第二对话主题下,从而可确定出不同第二对话主题下包括的对话样本的数量,从而可基于不同第二对话主题下的对话样本的数量,以及对话样本集总数确定出由该第一对话主题转换为该第二对话主题的转移概率。
在一个实施例中,该对话样本集还可以是基于不同对话主题进行主题转换后得到的对话样本,该对话设备在确定出基于不同对话主题进行转换后的对话样本后,可先选取任一对话主题为基准主题,并确定出基于该基准主题进行对话主题转换的对话样本,从而可确定出由该基准主题转换为其他第二对话主题的转移概率,在对话设备确定出每个对话主题转换为其他第二对话主题的概率后,可选取出该第一对话主题转换为至少一个第二对话主题的转移概率,其中该至少一个第二对话主题中包括该第一对话主题。在一个实施例中,对话设备在对该对话样本集中的对话样本进行主题分类时,也可采用上述的第二分类器C2对该对话样本进行主题分类,其中,该第二分类器C2的实现方法是:先对一定数量的(如1000个或者2000个)对话数据的对话主题进行分类,并基于分类结果对第二分类器C2进行训练,使得第二分类器C2学习得到对话数据的主题分类能力,其中,可采用双向编码(Bidirectional Encoder Representation from Transformer,Bert)模型对该对话数据的对话主题进行分类。
在一个实施例中,若对话设备中预设的对话主题为10个,则该对话设备设备确定出的从第一对话主题转换为至少一个第二对话主题的转移概率可由转移矩阵A标识,其中,该矩阵A为一个10*10的矩阵,可由式1.3表示:
A=(aij)10*10 式1.3
其中,aij表示由i对话主题转换到j对话主题的转移概率。
在一个实施例中,对话设备在基于确定出的历史对话数据的第一对话主题后,并确定出从该第一对话主题转换为至少一个第二对话主题的转移概率后,则可基于该转移概率,从该至少一个第二对话主题中确定出目标对话主题,即转而执行步骤S203。
S203,根据所述转移概率从所述至少一个第二对话主题中确定出目标对话主题。
S204,根据所述历史对话数据和所述目标用户的用户信息确定对话表征信息,并根据所述目标对话主题引导所述对话表征信息生成所述目标对话主题下的目标对话数据。
在步骤S203和步骤S204中,对话设备在确定出从第一对话主题转换为至少一个第二对话主题的转移概率后,对话设备可将该转移概率的最大概率值指示的对话主题作为该目标对话主题,更进一步地,为了使得对话设备实现在对话过程中,对主题进行引导,该对话设备还可在确定出该转移概率的最大概率值后,进一步判断该最大概率值对应的对话主题是否为第一对话主题,若是,为了实现对对话主题的引导,对话设备可进一步从该至少一个第二对话主题中确定出转移概率的次大概率值,并将该次大概率值对应的对话主题作为该目标对话主题,可以理解的是,转移概率的次大概率值仅小于该最大概率值,且大于除该最大概率值以外的其他任何概率值。在一个实施例中,若对话设备确定出第一对话主题为宠物主题,基于该对话转移概率确定出的最大转移概率为0.7,且该最大转移概率0.7对应的对话主题为宠物主题,所以,在对话设备不需要进行对话主题引导的情况下,该对话设备可直接将宠物主题作为该目标对话主题,而如果该对话设备需要进行对话主题的引导,由于该宠物主题就是该第一对话主题,该对话设备需要进行对话主题的转移,则对话设备可进一步确定出转移概率的次大转移概率,若确定出该次大转移概率为0.3,且该次大转移概率0.3对应的对话主题为家庭主题,则该对话设备确定出的目标对话主题为次大转移概率0.3所对应的家庭主题。
在一个实施例中,对话设备在根据该转移概率从该第一对话主题中确定出目标对话时,还可基于该转移概率和该历史对话数据属于不同对话主题的概率分布yi-1,确定出该目标对话主题属于不同对话主题的概率分布yi,从而基于该目标对话主题对应的概率分布yi确定出该目标对话主题。在一个实施例中,对话设备可先基于该历史对话数据对应不同主题的概率分布yi-1,计算概率分布yi的第一中间计算参数ui,其中,ui的计算公式如式1.4和式1.5所示:
在一个实施例中,该对话设备还可基于该历史对话数据对应不同主题的概率分布yi-1,计算概率分布yi的第二中间计算参数vi,其中,vi的计算公式如式1.6所示:
vi=AT*yi-1 式1.6
其中,A对话设备确定出的对话设备从该第一对话主题转换为至少一个对话主题的转移概率对应的转移矩阵,对话设备在计算得到该第一中间计算参数ui,以及该第二中间计算参数vi后,则可计算得到该目标对话主题属于不同对话主题的概率分布yi,其中,yi的计算公式如式1.7所示:
yi=λ1*ui+λ2*vi 式1.7
其中,该λ1和λ2分别为该第一中间计算参数ui以及第二中间计算参数vi的加权系数,其中该λ1的取值例如可以是0.3,λ2的取值例如可以是0.7。
在一个实施例中,若历史对话数据为“我爱猫”,则对话设备则可确定该历史对话数据属于不同对话主题的概率分布yi-1=(1,0,0,…,0)T,该历史对话数据的第一对话主题为宠物主题,进一步地,该对话设备为了实现对对话主题进行引导,以实现引导目标用户谈论未谈及的主题,该对话设备可先基于式1.4和1.5计算ui,其中,计算得到的ui=(0,0,0.111,…,0.111),并可基于转移概率的转移矩阵A,计算得到vi,若该宠物主题转换为宠物主题进行谈论的概率为0.7,由宠物主题转换为家庭主题进行谈论的概率为0.3,而由宠物主题转换为除宠物和家庭主题之外的其他主题的转移概率为0,则vi=(0.7,0.3,0,…,0),进而使得对话设备可采用式1.7计算得到目标对话主题属于不同对话主题的概率分布yi,其中,yi=(0.49,0.21,0.033,…,0.033)。基于该目标对话主题的概率分布yi,对话设备也可采用上述确定概率最值的方法确定目标对话主题。
在对话设备确定出目标对话主题后,则可基于该历史对话数据和该目标用户的用户信息生成该目标对话主题下的目标对话数据,在一个实施例中,该对话设备可调用条件变分自编码器(Conditional Variational Auto Encoder,CVAE),从而可采用该CVAE模型,并基于该历史对话数据和用户信息生成该目标对话主题下的目标对话数据。在一个实施例中,CVAE模型是一种数据生成模型,CVAE模型可基于输入的文本(或图像),以及参考条件,将该输入的文本(或图像)和参考条件编码为隐变量空间中的概率分布,从而从该概率分布中采样得到输出文本(或图像),也就是说,对话设备可在确定出目标对话主题后,将历史对话数据和用户信息输入该CVAE模型,并将确定出的目标对话主题作为参考条件,该CVAE模型则可输出该目标对话主题下的目标对话数据,从而实现对目标对话数据的生成。
在本发明实施例中,对话设备与目标用户的对话过程中,可先获取该目标用户的历史对话数据,以及该目标用户的用户信息,从而可确定出该历史对话数据的第一对话主题,并进而确定由该第一对话主题转移为至少一个第二对话主题的转移概率,进一步地,该对话设备可根据该转移概率从该至少一个第二对话主题中确定出目标对话主题,从而使得对话设备可在根据该历史对话数据和该目标用户的用户信息确定出对话表征信息后,采用确定出的目标对话主题引导该对话表征信息生成该目标对话主题下的目标对话数据,由于对话设备在确定目标对话主题时,是基于大量语料中话题之间的转移概率,以及历史对话数据的对话主题进行预测的,使得预测得到的目标对话主题和历史对话数据的对话主题之间的关联性较强,从而可提升对话设备确定出的对话主题与历史对话主题之间的衔接度,也就提升了对话设备的流畅性和自然性,使得对话设备达到前后对话衔接自然的效果。
在一个实施例中,目标用户在启动对话界面后,对话设备可确定与目标用户开始进行对话,若该目标用户已向对话设备发送了历史对话数据,如“我爱猫”,则该对话设备可确定出该历史对话数据对应的第一对话主题,该第一对话主题为宠物主题,基于不同对话主题进行相互转换的概率,该对话设备可进一步确定出从该第一对话主题转换为至少一个第二对话主题的转移概率。在对话设备确定出该转移概率后,可从该转移概率中确定出最大转移概率,若对话设备确定出的最大转移概率对应的主题为宠物主题,且该对话设备没有进行话题转换的需求,则该对话设备可在根据该历史对话数据和目标用户的用户信息生成对话表征信息后,根据该宠物主题引导对话表征信息生成宠物主题下的目标对话数据,如生成的目标对话数据为你还喜欢什么宠物,或者你喜欢狗吗等。在一个实施例中,若对话设备确定出的对话主题为宠物,在该对话设备需要进行对话主题的转换时,则可获取次大转移概率对应的主题,假设为家庭,从而对话设备可基于家庭主题引导对话表征信息生成家庭主题下的目标对话数据,生成的家庭主题下的目标对话主题例如可以是,你家里有养猫吗,或者你家里有几只猫等,使得对话设备可实现对对话内容的控制,以及引导用户对话,此外,由于对话设备选取出的目标对话主题是和历史对话数据的第一对话主题息息相关的,所以,也可提升对话设备在和目标用户进行对话过程中的流畅性。
在一个实施例中,请参见图3,是本发明实施例提出的一种数据处理方法的示意流程图,如图3所示,该方法可包括:
S301,在与目标用户的对话过程中,获取所述目标用户的历史对话数据,以及所述目标用户的用户信息。
在一个实施例中,步骤S301的具体实施方式可参见上述实施例中步骤S201的具体实施方式,在此不再赘述。
S302,确定所述历史对话数据的第一对话主题,并确定从所述第一对话主题转换为至少一个第二对话主题的转移概率。
在一个实施例中,对话设备在确定出历史对话数据的第一对话主题后,在确定从第一对话主题转换为至少一个第二对话主题的转移概率时,可先获取对话样本集,其中,该对话样本集包括的至少一个对话样本为:基于所述第一对话主题下的初始对话数据进行对话主题的转换,并转换为不同第二对话主题的对话样本;进一步地,对话设备可基于对话主题的不同,对所述对话样本集进行分类,以将该对话样本集包括的至少一个对话样本划分到不同的第二对话主题中,进一步地,对话设备可基于对该对话样本集的分类结果,确定每个第二对话主题下的对话样本的数量,进而可确定所述对话样本集包括的样本总数,并根据所述确定的每个第二对话主题下的对话样本的数量,以及所述样本总数确定从所述第一对话主题转换为不同第二对话主题的转移概率。
在一个实施例中,对话设备在基于第二对话主题的不同,对该对话样本集中的至少一个对话样本进行分类后,在基于每个第二对话主题下的对话样本的数量,以及对话样本集包括的样本总数确定从第一对话主题转换为不同第二对话主题的转移概率时,该对话设备可分别计算每个第二对话主题下的对话样本的数量,从而可计算每个第二对话主题下的对话样本的数量和样本总数的比值,进一步地,对话设备可将计算得到的比值作为从该第一对话主题转换为对应第二对话主题的转移概率。在一个实施例中,该对话样本集是从训练集中获取的大量的对话语料,举例来说,若对话设备基于第二对话主题的不同对该对话样本集进行分类,得到第二对话主题为家庭的对话样本的数量为300,而该对话样本集包括的样本总数为1000,且假设对话设备确定出的第一对话主题为宠物,则基于该对话样本集可确定出从宠物主题转换为家庭主题的转移概率则为300/1000=0.3。
在一个实施例中,对话设备在确定出转移概率后,则可基于该转移概率从该至少一个第二对话主题中确定出目标对话主题,即转而执行步骤S303。
S303,根据所述转移概率从所述至少一个第二对话主题中确定出目标对话主题。
在一个实施例中,对话设备在根据该转移概率,从该至少一个第二对话主题中确定出目标对话主题时,可先根据所述转移概率,确定所述至少一个第二对话主题中的每个第二对话主题被选取为目标对话主题的预测概率,其中,每个第二对话主题被选取为目标对话主题的预测概率,即是上述的目标对话主题对应的概率分布yi指示的目标对话主题属于不同第二对话主题的概率,可以理解的是,对话设备可采用上述的计算目标对话主题的概率分布yi的方法,确定出每个第二对话主题被选取为目标对话主题的预测概率。进一步地,对话设备在确定出每个第二对话主题被选取为目标对话主题的预测概率后,可根据所述每个第二对话主题被选取为目标对话主题的预测概率,从所述至少一个对话主题中确定出目标对话主题,其中,所述目标对话主题包括最大预测概率对应的第二对话主题。
在一个实施例中,对话设备在确定出最大预测概率对应的第二对话主题后,可基于对话设备的对话需求,进一步地将该最大预测概率对应的第二对话主题和第一对话主题进行对比,在该对话设备的对话需求为保持和目标用户之间对话的流畅程度时,该对话设备在将该最大预测概率对应的第二对话主题和第一对话主题进行对比后,无论确定出的该最大预测概率对应的第二对话主题和该第一对话主题是否一致,均可直接将该最大预测概率对应的第二对话主题作为该对话设备当前的目标对话主题;或者,若该对话设备的对话需求为引导和目标对话用户之间的对话主题,则如果该对话设备确定出的最大预测概率对应的第二对话主题和该第一对话主题一致时,则对话设备需要进一步确定出预测概率的次大值,并将该预测概率的次大值对应的第二对话主题作为该目标对话主题,其中,可以理解的是,预测概率的次大值对应的第二对话主题是和第一对话主题不同,但关联性最强的主题,使得对话设备实现了基于主题引导对话数据的生成,在扩展了对话主题的广泛性的同时,也同时保证了前后对话之间的流畅性。
在一个实施例中,对话设备在确定出目标对话数据后,可进一步生成该目标对话主题下的目标对话数据,即转而执行步骤S304和S305。
S304,获取目标编码数据,所述目标编码数据是基于所述历史对话数据的第一编码数据,以及所述用户信息的第二编码数据生成的。
S305,获取所述目标编码数据的采样数据,并将所述采样数据作为对话表征信息。
S306,根据所述目标对话主题引导所述对话表征信息生成所述目标对话主题下的目标对话数据。
在步骤S304~步骤S306中,对话设备在生成目标对话主题下的目标对话数据时,可将该历史对话数据和该目标用户的用户信息输入对话生成模型,对话生成模型则可基于输入的历史对话数据和用户信息,并参考确定出的目标对话主题下的目标对话数据,在具体实现中,对话生成模型是基于历史对话数据和用户信息确定出的对话表征生成的目标对话数据,其中,该对话生成模型可先确定出历史对话数据的第一编码数据和用户信息的第二编码数据,从而可在基于第一编码数据和第二编码数据生成目标编码数据后,对该目标编码数据进行采样,得到该对话表征信息。在一个实施例中,该对话生成模型的模型结构如图4a所示,该对话生成模型在获取到历史对话数据和用户信息后,可先对所述历史对话数据进行编码处理,得到所述历史对话数据的第一编码数据,其中,用于对该历史对话数据进行编码处理的编码器可以是如图4a中由40标记的编码器,该编码器40可采用双向长短期记忆人工神经网络(Bi-directional Long Short-Term Memory,BiLSTM)对该历史对话数据进行编码处理,该BiLSTM是一种双向长短期记忆人工神经网络(Long Short-Term Memory,LSTM)模型,由两个LSTM组成,对话设备在采用BiLSTM模型对历史对话数据进行编码处理后,可取前向层和反向层最后一个隐向量进行拼接,作为该历史对话数据的向量表示,可以理解的是,该历史对话数据的向量表示即是该历史对话数据的第一编码数据,其中,该历史对话数据的向量表示可以如式2.1所示:
其中,T表示编码数据的序列长度,该长度例如可以是128等。
在一个实施例中,该对话设备还可对用户信息进行编码处理,得到所述用户信息的第二编码数据,在具体实现中,该对话设备也可采用如图4a中40标记的编码器对该用户信息进行编码处理,其中,该对话设备在调用编码器40对该用户信息进行编码处理时,也是采用的BiLSTM对各个用户信息分别进行编码,得到每个用户信息的向量表示,其中,该用户信息的数量可以为10或者20等,即如图4a中用户信息k中k的取值可以为10或者20。在一个实施例中,对话设备在采用编码器40对用户信息进行编码处理,得到对应的向量表示,该向量表示如式2.2所示:
其中,p1~p10分别用于指示不同对话主题下的用户信息的向量表示。对话设备在得到用户信息的向量表示后,进一步地,可基于上述确定出的目标对话主题属于不同第二对话主题的概率分布yi,确定对不同对话主题下的用户信息的向量表示进行加权处理的加权系数,在具体实现中,对话设备可先确定不同用户信息对应的对话主题,该用户信息对应的对话主题为至少一个第二对话主题中的任一个,进一步地,对话设备可将所述用户信息对应的对话主题的预测概率,即该用户信息对应的对话主题对应在该概率分布yi中的概率,作为该用户信息的中间编码数据的加权系数,可以理解的是,该用户信息的中间编码数据即是该用户信息的向量表示。在对话设备确定出用户信息的向量表示分别对应的加权系数后,则可采用所述对应加权系数对对应用户信息的向量表示进行加权处理,得到用户信息的目标向量表示,其中,该目标向量表示即是该用户信息的第二编码数据,其中,目标向量表示(或第二编码数据)可如式2.3所示:
其中,对话设备对该用户信息进行编码处理,得到的如式2.2所示的向量表示即是该用户信息的中间编码数据,进一步地,基于目标对话主题属于不同第二对话主题的概率分布yi对该中间编码数据进行加权处理得到的目标向量表示/>则是该用户信息的第二编码数据。在一个实施例中,对话设备在分别确定出历史对话数据的第一编码数据/>以及用户信息的第二编码数据/>后,则可基于第一编码数据/>和第二编码数据/>生成该目标编码数据。
在一个实施例中,对话设备在基于第一编码数据和第二编码数据/>生成该目标编码数据时,可先将所述第一编码数据/>和所述第二编码数据/>进行拼接处理,得到拼接编码数据,得到的拼接编码数据可记为C,进一步地,对话设备可对所述拼接编码数据进行基于隐变量的数据转换处理,得到所述拼接编码数据的隐变量分布,在具体实现中,对话设备可将拼接编码数据C输入到先验网络(Prior Network)模型中,从而得到该拼接数据C的隐变量分布,该隐变量分布是一个高斯分布G(C),进一步地,对话设备则可将得到的隐变量分布,即高斯分布G(C)作为该目标编码数据。
在一个实施例中,该先验网络模型是基于识别网络(Recognition Network)模型进行训练得到的,如图4b所示,识别网络的编码端对历史对话数据,用户信息进行了编码生成了目标编码数据,还给出了针对目标编码数据进行解码得到的目标对话主题下的目标对话数据的标准数据,即401标注的数据,先验网络即可基于该标准数据进行训练,使得先验网络和识别网络生成的目标编码数据尽可能地接近,其中,可由分布差异计算法(Kullback–Leibler divergence,KL散度)计算由先验网络和识别网络分别生成的目标编码数据的差异,其中,KL散度的计算公式如式2.4所示:
其中,对话设备在对先验网络进行训练时,即是通过调整式2.4中的相关参数,朝着缩小L(θ,φ;x,c,y)的取值的方向进行训练的。在一个实施例中,对话设备在得到该目标编码数据后,进一步地,可确定出该目标编码数据的采样数据,确定出的采样数据即是该对话表征信息,在具体实现中,由于该目标编码数据是一个隐变量分布,即可以理解的是对目标编码数据的采样处理,即是对该隐变量分布的采样处理,其中,基于对隐变量分布的采样处理,对话设备可从该隐变量分布中确定出目标隐变量,从而可将该目标隐变量作为采样数据,其中,该目标隐变量可记为z,可以理解的是,该目标隐变量z即是该对话表征信息。在对话设备确定出对话表征信息后,则可采用目标对话主题引导对该对话表征信息进行解码处理,得到目标对话主题下的目标对话数据,其中,对话设备可采用解码器对对话表征信息进行解码处理,具体地,对话设备在对对话表征信息进行解码处理时,可同时输入对话表征信息z,历史对话数据(假设该历史对话数据记为c),目标对话主题(假设目标对话主题记为y),具体地,输入到解码器的数据可以如式2.5所示:
so=Wi[z,c,y]+bi 式2.5
也就是说,解码器对采样数据进行解码处理时,需要同时考虑历史对话数据和目标对话主题,其中bi是对该解码器进行训练时得到的计算常数,其中,该解码器可以是如图4a中由41标记的解码器,该解码器可以是LSTM模型等,在解码器对对话表征信息进行解码时,同时考虑了目标对话数据属于不同对话主题的概率分布yi,以实现引导对话数据的生成。也就是说,对话设备在对对话表征信息进行解码处理,得到目标对话主题下的目标对话数据时,可根据所述目标对话数据引导对所述对话表征信息进行解码处理,得到所述对话表征信息的解码数据,所述解码数据和所述目标对话主题相关联;进一步地,该对话设备可基于所述解码数据生成所述目标对话主题下的目标对话数据。在一个实施例中,对话设备在与目标用户的对话过程中,可将获取到的历史对话数据显示在对话界面中,进一步地,对话设备在确定出该目标对话数据后,可在所述对话界面显示所述目标对话主题下的目标对话数据,其中,该对话界面是指目标用户对应客户端的界面。
在本发明实施例中,对话设备在与目标用户的对话过程中,可基于获取的目标用户的历史对话数据,确定出该历史对话数据的第一对话主题,以及从该第一对话主题转换为至少一个第二对话主题的转移概率,进一步地,该对话设备可根据该转移概率从该至少一个第二对话主题中确定出目标对话主题,从而可对根据历史对话数据的第一编码数据,以及用户信息的第二编码数据生成的目标编码数据进行采样处理,得到该目标编码数据的采样数据,进而可将获取到的采样数据作为对话表征信息,进一步地,对话设备可基于该目标对话主题引导对该对话表征信息进行解码处理,得到该目标对话主题下的目标对话数据,使得对话设备可实现对对话主题的全面覆盖,实现对对话主题的丰富,而且,对话设备还可在确定目标对话主题时,可基于历史对话数据的第一对话主题进行对话主题的转移,使得生成的目标对话数据涉及的主题和第一对话主题不同,提升了对话过程中的对话广泛性,也提升了对话设备对对话过程的主题引导能力,并基于对多方面的对话主题的引导,还可使对话设备达到多方面了解目标用户的能力,可获取更多的目标用户的相关信息。
基于上述数据处理方法实施例的描述,本发明实施例还提出了一种数据处理装置,该数据处理装置可以是运行于上述对话设备中的一个计算机程序(包括程序代码)。该数据处理装置可用于执行如图2和图3所述的数据处理方法,请参见图5,该数据处理装置包括:获取单元501,确定单元502和生成单元503。
获取单元501,用于在与目标用户的对话过程中,获取所述目标用户的历史对话数据,以及所述目标用户的用户信息;
确定单元502,用于确定所述历史对话数据的第一对话主题,并确定从所述第一对话主题转换为至少一个第二对话主题的转移概率;
所述确定单元502,还用于根据所述转移概率从所述至少一个第二对话主题中确定出目标对话主题;
所述确定单元502,还用于根据所述历史对话数据和所述目标用户的用户信息确定对话表征信息;
生成单元503,用于根据所述目标对话主题引导所述对话表征信息生成所述目标对话主题下的目标对话数据。
在一个实施例中,所述确定单元502,具体用于:
根据所述转移概率,确定所述至少一个第二对话主题中的每个第二对话主题被选取为目标对话主题的预测概率;
根据所述每个第二对话主题被选取为目标对话主题的预测概率,从所述至少一个对话主题中确定出目标对话主题;
其中,所述目标对话主题包括最大预测概率对应的第二对话主题。
在一个实施例中,所述确定单元502,具体用于:
获取对话样本集,所述对话样本集包括的至少一个对话样本为:基于所述第一对话主题下的初始对话数据进行对话主题的转换,并转换为不同第二对话主题的对话样本;
按照所述第二对话主题的不同,对所述对话样本集进行分类,并确定每个第二对话主题下的对话样本的数量;
确定所述对话样本集包括的样本总数,并根据所述确定的每个第二对话主题下的对话样本的数量,以及所述样本总数确定从所述第一对话主题转换为不同第二对话主题的转移概率。
在一个实施例中,所述生成单元503,具体用于:
获取目标编码数据,所述目标编码数据是基于所述历史对话数据的第一编码数据,以及所述用户信息的第二编码数据生成的;
获取所述目标编码数据的采样数据,并将所述采样数据作为对话表征信息。
在一个实施例中,所述获取单元501,具体用于:
对所述历史对话数据进行编码处理,得到所述历史对话数据的第一编码数据,并对所述用户信息进行编码处理,得到所述用户信息的中间编码数据;
确定所述中间编码数据的加权系数,并采用所述中间编码数据的加权系数对所述中间编码数据进行加权处理,得到所述用户信息的第二编码数据;
基于所述第一编码数据和所述第二编码数据生成所述目标编码数据。
在一个实施例中,所述确定单元502,具体用于:
确定所述用户信息对应的对话主题,所述用户信息对应的对话主题为所述至少一个第二对话主题中的任一个;
将所述用户信息对应的对话主题的预测概率,作为所述用户信息的中间编码数据的加权系数。
在一个实施例中,所述生成单元503,具体用于:
将所述第一编码数据和所述第二编码数据进行拼接处理,得到拼接编码数据;
对所述拼接编码数据进行基于隐变量的数据转换处理,得到所述拼接编码数据的隐变量分布;
将所述拼接编码数据的隐变量分布作为所述目标编码数据。
在一个实施例中,所述获取单元501,具体用于:
对所述拼接编码数据的隐变量分布进行采样处理,从所述隐变量分布中确定出目标隐变量;
将所述目标隐变量作为采样数据。
在一个实施例中,所述获取单元501,具体用于:
根据所述目标对话数据引导对所述对话表征信息进行解码处理,得到所述对话表征信息的解码数据,所述解码数据和所述目标对话主题相关联;
基于所述解码数据生成所述目标对话主题下的目标对话数据。
在一个实施例中,所述获取单元501,具体用于:将所述历史对话数据显示在对话界面中;
在一个实施例中,所述装置还包括:显示单元504;
所述显示单元504,用于在所述对话界面显示所述目标对话主题下的目标对话数据。
在本发明实施例中,与目标用户的对话过程中,获取单元501可先获取该目标用户的历史对话数据,以及该目标用户的用户信息,从而确定单元502可确定出该历史对话数据的第一对话主题,并进而确定由该第一对话主题转移为至少一个第二对话主题的转移概率,进一步地,确定单元502可根据该转移概率从该至少一个第二对话主题中确定出目标对话主题,在确定单元502根据该历史对话数据和该目标用户的用户信息确定出对话表征信息后,生成单元503采用确定出的目标对话主题引导该对话表征信息生成该目标对话主题下的目标对话数据,由于对话设备在确定目标对话主题时,是基于大量语料中话题之间的转移概率,以及历史对话数据的对话主题进行预测的,使得预测得到的目标对话主题和历史对话数据的对话主题之间的关联性较强,从而可提升确定出的对话主题与历史对话主题之间的衔接度,也就提升了对话的流畅性和自然性,达到前后对话衔接自然的效果。
请参见图6,是本发明实施例提供的一种对话设备的结构示意性框图,。如图6所示的本实施例中的对话设备可包括:一个或多个处理器601;一个或多个输入设备602,一个或多个输出设备603和存储器604。上述处理器601、输入设备602、输出设备603和存储器604通过总线605连接。存储器604用于存储计算机程序,所述计算机程序包括程序指令,处理器601用于执行所述存储器604存储的程序指令。
所述存储器604可以包括易失性存储器(volatile memory),如随机存取存储器(random-access memory,RAM);存储器604也可以包括非易失性存储器(non-volatilememory),如快闪存储器(flash memory),固态硬盘(solid-state drive,SSD)等;存储器604还可以包括上述种类的存储器的组合。
所述处理器601可以是中央处理器(central processing unit,CPU)。所述处理器601还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(application-specific integrated circuit,ASIC),可编程逻辑器件(programmable logic device,PLD)等。该PLD可以是现场可编程逻辑门阵列(field-programmable gate array,FPGA),通用阵列逻辑(generic array logic,GAL)等。所述处理器601也可以为上述结构的组合。
本发明实施例中,所述存储器604用于存储计算机程序,所述计算机程序包括程序指令,处理器601用于执行存储器604存储的程序指令,用来实现上述如图2和图3中相应方法的步骤。
在一个实施例中,所述处理器601被配置调用所述程序指令,用于执行:
在与目标用户的对话过程中,获取所述目标用户的历史对话数据,以及所述目标用户的用户信息;
确定所述历史对话数据的第一对话主题,并确定从所述第一对话主题转换为至少一个第二对话主题的转移概率;
根据所述转移概率从所述至少一个第二对话主题中确定出目标对话主题;
根据所述历史对话数据和所述目标用户的用户信息确定对话表征信息,并根据所述目标对话主题引导所述对话表征信息生成所述目标对话主题下的目标对话数据。
在一个实施例中,所述处理器601被配置调用所述程序指令,用于执行:根据所述转移概率,确定所述至少一个第二对话主题中的每个第二对话主题被选取为目标对话主题的预测概率;
根据所述每个第二对话主题被选取为目标对话主题的预测概率,从所述至少一个对话主题中确定出目标对话主题;
其中,所述目标对话主题包括最大预测概率对应的第二对话主题。
在一个实施例中,所述处理器601被配置调用所述程序指令,用于执行:
获取对话样本集,所述对话样本集包括的至少一个对话样本为:基于所述第一对话主题下的初始对话数据进行对话主题的转换,并转换为不同第二对话主题的对话样本;
按照所述第二对话主题的不同,对所述对话样本集进行分类,并确定每个第二对话主题下的对话样本的数量;
确定所述对话样本集包括的样本总数,并根据所述确定的每个第二对话主题下的对话样本的数量,以及所述样本总数确定从所述第一对话主题转换为不同第二对话主题的转移概率。
在一个实施例中,所述处理器601被配置调用所述程序指令,用于执行:
获取目标编码数据,所述目标编码数据是基于所述历史对话数据的第一编码数据,以及所述用户信息的第二编码数据生成的;
获取所述目标编码数据的采样数据,并将所述采样数据作为对话表征信息。
在一个实施例中,所述处理器601被配置调用所述程序指令,用于执行:
对所述历史对话数据进行编码处理,得到所述历史对话数据的第一编码数据,并对所述用户信息进行编码处理,得到所述用户信息的中间编码数据;
确定所述中间编码数据的加权系数,并采用所述中间编码数据的加权系数对所述中间编码数据进行加权处理,得到所述用户信息的第二编码数据;
基于所述第一编码数据和所述第二编码数据生成所述目标编码数据。
在一个实施例中,所述处理器601被配置调用所述程序指令,用于执行:
确定所述用户信息对应的对话主题,所述用户信息对应的对话主题为所述至少一个第二对话主题中的任一个;
将所述用户信息对应的对话主题的预测概率,作为所述用户信息的中间编码数据的加权系数。
在一个实施例中,所述处理器601被配置调用所述程序指令,用于执行:
将所述第一编码数据和所述第二编码数据进行拼接处理,得到拼接编码数据;
对所述拼接编码数据进行基于隐变量的数据转换处理,得到所述拼接编码数据的隐变量分布;
将所述拼接编码数据的隐变量分布作为所述目标编码数据。
在一个实施例中,所述处理器601被配置调用所述程序指令,用于执行:
对所述拼接编码数据的隐变量分布进行采样处理,从所述隐变量分布中确定出目标隐变量;
将所述目标隐变量作为采样数据。
在一个实施例中,所述处理器601被配置调用所述程序指令,用于执行:
根据所述目标对话数据引导对所述对话表征信息进行解码处理,得到所述对话表征信息的解码数据,所述解码数据和所述目标对话主题相关联;
基于所述解码数据生成所述目标对话主题下的目标对话数据。
在一个实施例中,所述处理器601被配置调用所述程序指令,用于执行:将所述历史对话数据显示在对话界面中;
在一个实施例中,所述处理器601被配置调用所述程序指令,用于执行:在所述对话界面显示所述目标对话主题下的目标对话数据。
本发明实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述如图2或图3所示的方法实施例。其中,所述的计算机可读存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明的局部实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或局部流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。
Claims (13)
1.一种数据处理方法,其特征在于,包括:
在与目标用户的对话过程中,获取所述目标用户的历史对话数据;所述历史对话数据则是指在当前对话之前所采集到的对话数据;
从对话数据集中获取所述目标用户在不同对话主题下的用户信息;所述用户信息包括:与相应的对话主题相关的描述语句;所述用户信息的数量为多个,且通过分类器将不同的用户信息划分到对应的对话主题下;
从预设的不同对话主题中确定所述历史对话数据的第一对话主题,并确定从所述第一对话主题转换为至少一个第二对话主题的转移概率;不同主题之间进行转换的转移概率是根据对话样本集中包括的在不同对话主题之间进行主题转换后得到的对话样本来预先设置的;
根据所述转移概率从所述至少一个第二对话主题中确定出目标对话主题;
根据所述历史对话数据和所述目标用户的用户信息确定对话表征信息,并根据所述目标对话主题引导所述对话表征信息生成所述目标对话主题下的目标对话数据;所述对话表征信息是从目标编码数据中确定出的采样数据,所述目标编码数据是对由所述历史对话数据编码得到的第一编码数据,和所述用户信息编码得到的第二编码数据进行拼接后得到的拼接编码数据进行隐变量的数据转换处理后得到的;其中,所述第一编码数据是对所述历史对话数据进行编码处理后的前向层和反向层的最后一个隐向量进行拼接得到的;所述第二编码数据是根据对每个用户信息分别进行编码后得到的中间编码数据,以及所述目标对话主题对应的概率分布确定出的。
2.根据权利要求1所述的方法,其特征在于,所述根据所述转移概率从所述至少一个第二对话主题中确定出目标对话主题,包括:
根据所述转移概率,确定所述至少一个第二对话主题中的每个第二对话主题被选取为目标对话主题的预测概率;
根据所述每个第二对话主题被选取为目标对话主题的预测概率,从所述至少一个对话主题中确定出目标对话主题;
其中,所述目标对话主题包括最大预测概率对应的第二对话主题。
3.根据权利要求1所述的方法,其特征在于,所述确定从所述第一对话主题转换为至少一个第二对话主题的转移概率,包括:
获取对话样本集,所述对话样本集包括的至少一个对话样本为:基于所述第一对话主题下的初始对话数据进行对话主题的转换,并转换为不同第二对话主题的对话样本;
按照所述第二对话主题的不同,对所述对话样本集进行分类,并确定每个第二对话主题下的对话样本的数量;
确定所述对话样本集包括的样本总数,并根据所述确定的每个第二对话主题下的对话样本的数量,以及所述样本总数确定从所述第一对话主题转换为不同第二对话主题的转移概率。
4.根据权利要求1所述的方法,其特征在于,所述根据所述历史对话数据和所述目标用户的用户信息确定对话表征信息,包括:
获取目标编码数据,所述目标编码数据是基于所述历史对话数据的第一编码数据,以及所述用户信息的第二编码数据生成的;
获取所述目标编码数据的采样数据,并将所述采样数据作为对话表征信息。
5.根据权利要求4所述的方法,其特征在于,所述获取目标编码数据,包括:
对所述历史对话数据进行编码处理,得到所述历史对话数据的第一编码数据,并对所述用户信息进行编码处理,得到所述用户信息的中间编码数据;
确定所述中间编码数据的加权系数,并采用所述中间编码数据的加权系数对所述中间编码数据进行加权处理,得到所述用户信息的第二编码数据;
基于所述第一编码数据和所述第二编码数据生成所述目标编码数据。
6.根据权利要求5所述的方法,其特征在于,所述确定所述中间编码数据的加权系数,包括:
确定所述用户信息对应的对话主题,所述用户信息对应的对话主题为所述至少一个第二对话主题中的任一个;
将所述用户信息对应的对话主题的预测概率,作为所述用户信息的中间编码数据的加权系数。
7.根据权利要求5所述的方法,其特征在于,所述基于所述第一编码数据和所述第二编码数据生成所述目标编码数据,包括:
将所述第一编码数据和所述第二编码数据进行拼接处理,得到拼接编码数据;
对所述拼接编码数据进行基于隐变量的数据转换处理,得到所述拼接编码数据的隐变量分布;
将所述拼接编码数据的隐变量分布作为所述目标编码数据。
8.根据权利要求7所述的方法,其特征在于,所述获取所述目标编码数据的采样数据,包括:
对所述拼接编码数据的隐变量分布进行采样处理,从所述隐变量分布中确定出目标隐变量;
将所述目标隐变量作为采样数据。
9.根据权利要求4所述的方法,其特征在于,所述根据所述目标对话主题引导所述对话表征信息生成所述目标对话主题下的目标对话数据,包括:
根据所述目标对话数据引导对所述对话表征信息进行解码处理,得到所述对话表征信息的解码数据,所述解码数据和所述目标对话主题相关联;
基于所述解码数据生成所述目标对话主题下的目标对话数据。
10.根据权利要求1所述的方法,其特征在于,所述获取所述目标用户的历史对话数据,包括:将所述历史对话数据显示在对话界面中;
所述生成所述目标对话主题下的目标对话数据之后,所述方法还包括:在所述对话界面显示所述目标对话主题下的目标对话数据。
11.一种数据处理装置,其特征在于,包括:
获取单元,用于在与目标用户的对话过程中,获取所述目标用户的历史对话数据;所述历史对话数据则是指在当前对话之前所采集到的对话数据,以及从对话数据集中获取所述目标用户在不同对话主题下的用户信息;所述用户信息包括:与相应的对话主题相关的描述语句;所述用户信息的数量为多个,且通过分类器将不同的用户信息划分到对应的对话主题下;
确定单元,用于从预设的不同对话主题中确定所述历史对话数据的第一对话主题,并确定从所述第一对话主题转换为至少一个第二对话主题的转移概率;不同主题之间进行转换的转移概率是根据对话样本集中包括的在不同对话主题之间进行主题转换后得到的对话样本来预先设置的;
所述确定单元,还用于根据所述转移概率从所述至少一个第二对话主题中确定出目标对话主题;
所述确定单元,还用于根据所述历史对话数据和所述目标用户的用户信息确定对话表征信息;
生成单元,用于根据所述目标对话主题引导所述对话表征信息生成所述目标对话主题下的目标对话数据;所述对话表征信息是从目标编码数据中确定出的采样数据,所述目标编码数据是对由所述历史对话数据编码得到的第一编码数据,和所述用户信息编码得到的第二编码数据进行拼接后得到的拼接编码数据进行隐变量的数据转换处理后得到的;其中,所述第一编码数据是对所述历史对话数据进行编码处理后的前向层和反向层的最后一个隐向量进行拼接得到的;所述第二编码数据是根据对每个用户信息分别进行编码后得到的中间编码数据,以及所述目标对话主题对应的概率分布确定出的。
12.一种对话设备,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、所述输入设备、所述输出设备和所述存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1~10任一项所述的方法。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1~10任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010855221.2A CN112035633B (zh) | 2020-08-21 | 2020-08-21 | 数据处理方法、装置、对话设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010855221.2A CN112035633B (zh) | 2020-08-21 | 2020-08-21 | 数据处理方法、装置、对话设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112035633A CN112035633A (zh) | 2020-12-04 |
CN112035633B true CN112035633B (zh) | 2023-07-25 |
Family
ID=73580637
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010855221.2A Active CN112035633B (zh) | 2020-08-21 | 2020-08-21 | 数据处理方法、装置、对话设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112035633B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113282708B (zh) * | 2021-05-31 | 2023-04-07 | 平安国际智慧城市科技股份有限公司 | 机器人对话回复的方法、装置、计算机设备及存储介质 |
CN114756667A (zh) * | 2022-04-19 | 2022-07-15 | 平安科技(深圳)有限公司 | 基于人工智能的对话生成方法、装置、设备及存储介质 |
CN115186147B (zh) * | 2022-05-31 | 2023-08-25 | 华院计算技术(上海)股份有限公司 | 对话内容的生成方法及装置、存储介质、终端 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101685454A (zh) * | 2008-09-28 | 2010-03-31 | 华为技术有限公司 | 人机交互方法及系统 |
CN108388674A (zh) * | 2018-03-26 | 2018-08-10 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
CN108415932A (zh) * | 2018-01-23 | 2018-08-17 | 苏州思必驰信息科技有限公司 | 人机对话方法及电子设备 |
CN110263131A (zh) * | 2019-03-05 | 2019-09-20 | 腾讯科技(深圳)有限公司 | 回复信息生成方法、装置及存储介质 |
CN110347792A (zh) * | 2019-06-25 | 2019-10-18 | 腾讯科技(深圳)有限公司 | 对话生成方法及装置、存储介质、电子设备 |
WO2020051192A1 (en) * | 2018-09-06 | 2020-03-12 | Google Llc | Dialogue systems |
WO2020091619A1 (ru) * | 2018-10-30 | 2020-05-07 | федеральное государственное автономное образовательное учреждение высшего образования "Московский физико-технический институт (государственный университет)" | Автоматизированная оценка качества диалоговой системы в реальном времени |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9214156B2 (en) * | 2013-08-06 | 2015-12-15 | Nuance Communications, Inc. | Method and apparatus for a multi I/O modality language independent user-interaction platform |
US10929611B2 (en) * | 2017-12-05 | 2021-02-23 | discourse.ai, Inc. | Computer-based interlocutor understanding using classifying conversation segments |
CN108304489B (zh) * | 2018-01-05 | 2021-12-28 | 广东工业大学 | 一种基于强化学习网络的目标引导型个性化对话方法与系统 |
CN110209778A (zh) * | 2018-04-11 | 2019-09-06 | 腾讯科技(深圳)有限公司 | 一种对话生成的方法以及相关装置 |
CN109086329B (zh) * | 2018-06-29 | 2021-01-05 | 出门问问信息科技有限公司 | 基于话题关键词引导的进行多轮对话方法及装置 |
CN111460120A (zh) * | 2020-03-31 | 2020-07-28 | 河北省讯飞人工智能研究院 | 一种对话管理方法、装置、设备及存储介质 |
-
2020
- 2020-08-21 CN CN202010855221.2A patent/CN112035633B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101685454A (zh) * | 2008-09-28 | 2010-03-31 | 华为技术有限公司 | 人机交互方法及系统 |
CN108415932A (zh) * | 2018-01-23 | 2018-08-17 | 苏州思必驰信息科技有限公司 | 人机对话方法及电子设备 |
CN108388674A (zh) * | 2018-03-26 | 2018-08-10 | 百度在线网络技术(北京)有限公司 | 用于推送信息的方法和装置 |
WO2020051192A1 (en) * | 2018-09-06 | 2020-03-12 | Google Llc | Dialogue systems |
WO2020091619A1 (ru) * | 2018-10-30 | 2020-05-07 | федеральное государственное автономное образовательное учреждение высшего образования "Московский физико-технический институт (государственный университет)" | Автоматизированная оценка качества диалоговой системы в реальном времени |
CN110263131A (zh) * | 2019-03-05 | 2019-09-20 | 腾讯科技(深圳)有限公司 | 回复信息生成方法、装置及存储介质 |
CN110347792A (zh) * | 2019-06-25 | 2019-10-18 | 腾讯科技(深圳)有限公司 | 对话生成方法及装置、存储介质、电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112035633A (zh) | 2020-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112035633B (zh) | 数据处理方法、装置、对话设备及存储介质 | |
CN110427617B (zh) | 推送信息的生成方法及装置 | |
KR102477795B1 (ko) | 비디오 캡션 생성 방법, 디바이스 및 장치, 그리고 저장 매체 | |
CN110413746B (zh) | 对用户问题进行意图识别的方法及装置 | |
CN112069302B (zh) | 会话意图识别模型的训练方法、会话意图识别方法及装置 | |
US8204751B1 (en) | Relevance recognition for a human machine dialog system contextual question answering based on a normalization of the length of the user input | |
CN110245221B (zh) | 训练对话状态跟踪分类器的方法和计算机设备 | |
CN111625634A (zh) | 词槽识别方法及装置、计算机可读存储介质、电子设备 | |
CN113705315B (zh) | 视频处理方法、装置、设备及存储介质 | |
Chi et al. | Speaker role contextual modeling for language understanding and dialogue policy learning | |
CN113536801A (zh) | 阅读理解模型的训练方法及装置、阅读理解方法及装置 | |
CN111522936A (zh) | 一种包含情感的智能客服对话回复生成方法、装置及电子设备 | |
WO2023226239A1 (zh) | 对象情绪的分析方法、装置和电子设备 | |
CN111858875B (zh) | 智能交互方法、装置、设备及存储介质 | |
CN113392265A (zh) | 多媒体处理方法、装置及设备 | |
CN115293348A (zh) | 一种多模态特征提取网络的预训练方法及装置 | |
CN110750677A (zh) | 基于人工智能的音视频识别方法、系统及存储介质和服务器 | |
CN116910220A (zh) | 多轮对话交互处理方法、装置、设备和存储介质 | |
CN116975288A (zh) | 文本处理方法及文本处理模型训练方法 | |
CN115186147A (zh) | 对话内容的生成方法及装置、存储介质、终端 | |
Le et al. | Improving open-domain dialogue evaluation with a causal inference model | |
CN112528645A (zh) | 文本处理方法、装置、电子设备和计算机可读存储介质 | |
CN114510561A (zh) | 答案选择方法、装置、设备及存储介质 | |
CN113515935B (zh) | 一种标题生成方法、装置、终端及介质 | |
CN114218439A (zh) | 一种基于自驱动孪生采样和推理的视频问答方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40034956 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |