CN105704013B

CN105704013B - 基于上下文的话题更新数据处理方法及装置

Info

Publication number: CN105704013B
Application number: CN201610158401.9A
Authority: CN
Inventors: 刘佳亮
Original assignee: Beijing Guangnian Wuxian Technology Co Ltd
Current assignee: Beijing Guangnian Wuxian Technology Co Ltd
Priority date: 2016-03-18
Filing date: 2016-03-18
Publication date: 2019-04-19
Anticipated expiration: 2036-03-18
Also published as: CN105704013A

Abstract

本发明提供了一种基于上下文的话题更新数据处理方法，其包括以下步骤：获取对应于当前用户对话请求信息的第一文本信息；计算与之前多轮对话相关的第一话题和第一文本信息之间的第一相关度，以及与前一轮对话中的回答相关的第二话题和第一文本信息之间的第二相关度；根据第一文本信息、之前对话中记录的实体信息、第一话题、第二话题和计算得到的第一相关度和第二相关度对当前用户对话请求进行对话处理，得到回答；分别用第一文本信息和回答抽取出的话题信息来更新第一话题和第二话题。按照本发明的话题更新方法，可以保证当前对话的回答能够结合当前用户的话题和场景分析，从而得到满足用户真实意图的回答。

Description

基于上下文的话题更新数据处理方法及装置

技术领域

本发明涉及智能机器人领域，具体地说，涉及一种基于上下文的话题更新数据处理方法及装置。

背景技术

聊天机器人(chatterbot)是一个用来模拟人类对话或聊天的程序。聊天机器人产生的原因是，研发者把自己感兴趣的回答放到数据库中，当一个问题被抛给聊天机器人时，它通过算法，从数据库中找到最贴切的答案，回复给它的聊伴。

此外，研发者将大量网络流行的俏皮语言加入词库，当你发送的词组和句子被词库识别后，程序将通过算法把预先设定好的回答回复给你。而词库的丰富程度、回复的速度，是一个聊天机器人能不能得到大众喜欢的重要因素。千篇一律的回答不能得到大众青睐，中规中矩的话语也不会引起人们的共鸣。

然而，在当前机器人聊天的场景中，用户仍然占据主导地位。而用户在连续对话中，相关话题的上下文之间存在着承接性和补充性，话题之间的跳转也有随意性的特点。目前的聊天系统大都侧重在单轮对话处理，机器人并不能很好地获取到用户的真实意图，重要信息可能就在之前的对话中。即使在上下文处理上，也只是简单地实现指代消解和补充，而不能结合当前用户的话题和场景分析。由此在返回的答案上会存在偏差，甚至错误回答。

因此，在面向与机器人连续多轮对话的交互场景下，就需要一种能够提取话题关键信息并识别用户谈话的真实意图从而给出贴切答案的智能聊天方法和系统。

发明内容

本发明为解决上述技术问题，提供了一种基于上下文的话题更新数据处理方法，其包括以下步骤：

获取对应于当前用户对话请求信息的第一文本信息S1；

计算与之前多轮对话相关的第一话题T1和所述第一文本信息S1之间的第一相关度y1，以及与前一轮对话中的回答相关的第二话题T2和所述第一文本信息S1之间的第二相关度y2；

根据第一文本信息S1、之前对话中记录的实体信息C、第一话题T1、第二话题T2和计算得到的第一相关度y1和第二相关度y2对当前用户对话请求进行对话处理，得到回答A；

分别用所述第一文本信息S1和所述回答A抽取出的话题信息来更新所述第一话题T1和第二话题T2。

根据本发明的一个实施例，提取第一文本信息S1和回答A中的实体信息来更新或替换之前对话中记录的实体信息C。

根据本发明的一个实施例，所述第一话题中的各个话题成员和所述第二话题中的各个话题成员具有对应的权重因子，所述权重因子满足衰减函数，使得越远离当前对话的话题成员的权重因子越小。

根据本发明的一个实施例，在对话处理之前，判断当前对话是否为首轮对话，如果否，则用之前对话过程中记录的实体信息C对所述第一文本信息S1中出现的指代信息进行替换从而形成第二文本信息S2，如果判断为首轮对话时，则直接使用第一文本信息S1的内容填充第二文本信息S2。

根据本发明的一个实施例，所述第一话题的权重因子的衰减函数选择成使得在更新所述第一话题T1时，能够直接用所述第一文本信息对应的话题信息替换所述第一话题T1。

根据本发明的一个实施例，所述第二话题的权重因子的衰减函数选择成使得在更新第二话题T2时，能够直接用所述回答A对应的话题信息替换所述第二话题T2。

根据本发明的一个实施例，所述第一相关度和第二相关度的取值为0或者1，其中0表示话题不相关，1表示话题相关。

根据本发明的另一个方面，还提供了一种基于上下文的话题更新数据处理装置，该装置包括以下模块：

文本信息获取模块，其用于获取对应于当前用户对话请求信息的第一文本信息S1；

相关度计算模块，其用于计算与之前多轮对话相关的第一话题T1和所述第一文本信息S1之间的第一相关度y1，以及与前一轮对话中的回答相关的第二话题T2和所述第一文本信息S1之间的第二相关度y2；

对话处理模块，其用于根据第一文本信息S1、之前对话中记录的实体信息C、第一话题T1、第二话题T2和计算得到的第一相关度y1和第二相关度y2对当前用户对话请求进行对话处理，得到回答A；

话题更新模块，其用于分别用所述第一文本信息S1和所述回答A抽取出的话题信息来更新所述第一话题T1和第二话题T2。

根据本发明的一个实施例，在对话处理模块中，提取第一文本信息S1和回答A中的实体信息来更新或替换之前对话中记录的实体信息C。

通过实施本发明的基于上下文的话题更新方法，使得在面向与机器人进行连续多轮对话的交互场景下，提取对话的话题分类，并对新一轮对话和历史话题的相关度进行判断，并将其作为判断答案是否优选的评判因子，从而提升对问题的回答质量，满足用户的交谈意图。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例共同用于解释本发明，并不构成对本发明的限制。在附图中：

图1为现有技术中处理对话的框图；

图2显示了根据本发明的一个实施例进行多轮对话处理的流程图；

图3显示了根据本发明的另一个实施例进行多轮对话处理的流程图；以及

图4显示了根据本发明的另一个实施例进行多轮对话处的话题相关性判断的子程序的流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，以下结合附图对本发明实施例作进一步地详细说明。

如何评判一个机器人是否足够智能。旁观者大多认为一个机器人能够回答的问题多，可以视为较智能，而不论是什么数据结构或算法的机器人，只要堆砌足够大的数据，在回答问题方面都能做到较为相近的正确率，显然，能够回答的问题数量只是代表了这个机器人后台的数据库是否足够大。

然而，智能不应是比较谁的数据库足够大，智能是多方面的体现。跟评判一个人的智力一样，智能的机器人应当要有学习能力和数据筛选能力。一个可以自动成长、但数据量很小(能够回答的问题较少)的机器人显然是比一个不能自动成长、但数据量庞大(能够回答的问题较多)实用。在拥有了自学习能力之后，机器人是对知识照单全收，还是有选择的学习较为正确的知识，是进一步评判机器人智能程度的一个标准。如果机器人只能对知识照单全收，这个学习能力是不完整的，机器人还应或多或少拥有筛选能力。

针对聊天机器人，人们可能已经不满足于一问一答的简单模式。有时候机器人也会给出提问。然而，如果它不能从用户发起的几轮对话中找出用户聊天的真实意图，那么机器人就会显得比较机械，有时甚至可能是答非所问。

目前的聊天机器人只回答，很少提问。它基本上基于这样一种原理：只要数据库足够大就可以涵盖所有问题，因此可以给一句话的问题一个相对满意的答案。如图1所示，其中显示了现有技术中按照上述原理进行人机对话的流程图。

当用户提出问题1时，聊天机器人根据该问题1给出回答1。如果用户提出的问题1是用语音来表示的，那么机器人首先需要将该语音通过自动语音识别技术将其转换为文本信息。得到文本信息后在记忆库中寻找与之匹配的问题。记忆库中存储的问题还对应地存储有回答。如果找到了与用户提出问题相匹配的问题，则回答也自然能够找到。

在经过几轮对话之后，问题中某些信息可能会省略。比如，第一轮对话中，用户提出问题1“你昨晚睡得好吗？”机器人回答1“好”。一般情况下，用户在第二轮对话中还会接着问问题2“做梦了？”在第二轮对话中，用户的提问中缺少了“你”。那么，机器人在文本信息处理时，应当将之前记录的指代信息在这里进行填充，从而形成一个完整的问题，然后再进行搜索。搜索到的答案2的文本信息可能是“我做梦了。”然而，为了符合聊天场景，机器人也可以省略这些指代信息接着用语音输出“做了/没做”。上述对语句中缺少指代实体信息进行补充的过程称为指代消解和补充。该步骤在利用寻找匹配的问题从而寻找答案的方法中非常有用。

这样的单轮对话方式在一问一答的简单聊天模式中还是比较理想的。然而，如果用户的多轮对话话题之间相关性比较高，那么机器人就不能采用单轮对话的方式进行回答。例如，当用户接下来提出问题3“我经常做梦，梦里的很多情景醒来就不记得了。你呢？”这时候，如果机器人不记得之前已经回答的内容(睡的好，做梦)以及用户已经问过的问题(睡的好吗？做梦了吗？)，它可能会给出“我很少做梦”这样的回答3，这显然会使对话显得比较机械，不能让聊天很好进行下去。这是因为，单轮对话方式只考虑本轮对话的问题与答案之间的逻辑性，而不考虑之前几轮对话的内容。

为了解决这一问题，机器人需要结合之前的对话中所聊到的话题，对当前问题进行回答。通过提取对话的话题分类，以及新一轮对话与历史话题的相关度判断，作为答案的评判因子，从而提升对话质量。

本发明的实施例提供了一种基于上下文话题相关度的机器人聊天方法，在该聊天方法中，根据上下文的理解对话题内容实时更新，从而保证当前对话与最近对话的话题内容最相关。

需要特别说明的是，本发明的方法描述的是在计算机系统中实现的。该计算机系统例如可以设置在机器人的控制核心处理器中。例如，本文所述的方法可以实现为能以控制逻辑来执行的软件，其由机器人控制系统中的CPU来执行。本文所述的功能可以实现为存储在非暂时性有形计算机可读介质中的程序指令集合。当以这种方式实现时，该计算机程序包括一组指令，当该组指令由计算机运行时其促使计算机执行能实施上述功能的方法。可编程逻辑可以暂时或永久地安装在非暂时性有形计算机可读介质中，例如只读存储器芯片、计算机存储器、磁盘或其他存储介质。除了以软件来实现之外，本文所述的逻辑可利用分立部件、集成电路、与可编程逻辑设备(诸如，现场可编程门阵列(FPGA)或微处理器)结合使用的可编程逻辑，或者包括它们任意组合的任何其他设备来体现。所有此类实施例旨在落入本发明的范围之内。

如图2所示，其中显示了根据本发明的话题更新原理进行的多轮对话流程示意图。

方法开始于步骤S101。系统获取用户的对话请求信息，并利用自动语音识别技术(Automatic Speech Recognition，简称ASR)将用户的音频数据转换为文本信息S1。

接下来在步骤S102中，计算与之前多轮对话相关的第一话题T1和文本信息S1之间的相关度y1。相关度的值可以用一些自然数来表示相关程度的等级。然而为了简化，本发明的实施例将相关度的值设为0和1，其中0表示不相关，1表示相关。

与之前多轮对话相关的第一话题T1通常是在上一轮对话处理时已经更新过的。例如该第一话题T1可包括当前对话之前的五轮对话的话题。这五轮对话的话题分别是根据对话请求信息对应的文本信息抽取得到的。本发明并不对之前对话的轮数进行限制，实际中3轮对话也是可以的。因此，在该实例中，T1相当于一个集合：

T1＝[T₁ ¹，T₁ ²，T₁ ³，T₁ ⁴，T₁ ⁵]；

其中，T₁ ¹相当于根据当前对话前一轮对话中的对话请求信息抽取出的话题内容。其它依此类推，T₁ ⁵相当于根据当前对话前5轮对话中的对话请求信息抽取出的话题内容。

当前对话除了与前几轮对话中的对话请求有关还常常与回答有关。因此，还需要计算与之前多轮对话的回答相关的第二话题T2和文本信息S1之间的相关度y2。与第一话题T1类似，T2也可以表示为：

T2＝[T₂ ¹，T₂ ²，T₂ ³，T₂ ⁴，T₂ ⁵]；

其中，T₂ ¹相当于根据当前对话前一轮对话中的回答信息抽取出的话题内容。其它依此类推，T₂ ⁵相当于根据当前对话前五轮对话中的回答信息抽取出的话题内容。

由此，计算得到的相关度值y1和y2分别如下表示：

y1＝[y₁ ¹，y₁ ²，y₁ ³，y₁ ⁴，y₁ ⁵]

y2＝[y₂ ¹，y₂ ²，y₂ ³，y₂ ⁴，y₂ ⁵]

为了保证话题总是最新的，当前对话之前的那轮对话的回答与本轮对话应该是最相关的，因此可以不用考虑之前几轮对话的回答。因此，这里可以简化为：T2＝T₂ ¹，y2＝y₂ ¹。

然而，本发明在进行相关度计算和话题更新时，并不限于仅考虑前五轮对话的话题内容或者前一轮的回答。事实上，第一话题T1和第二话题T2中各个话题成员的构成可以叠加上权重因子，该权重因子满足一个衰减函数(例如Log对数函数)，使得随着对话轮数的增加，越早轮的对话的话题信息T₁ ⁱ(i表示对话轮数)在T1中的权重越小，从而保证总是能维护最新的话题。

如上所述，衰减函数选择成只考虑了前五轮对话的对话请求信息和前一轮的回答。

继续参照图2，在步骤S103中，根据文本信息S1、之前记录的实体信息C、第一话题、第二话题和计算得到的相关度y1和y2对当前用户对话请求进行对话处理，得到回答A。

这里用到实体信息C是因为需要进行对话请求信息对应的文本信息S1的指代处理。由于对话进行到中间过程时，有些实体信息C比如前面提到过的地点、名称、时间等信息可能在当前对话中省略了。这也是比较符合语言规则的。因此，针对这种情况，就需要机器人具备记忆能力，这与机器人的训练时所需要的记忆能力稍有不同。它仅需要短暂地记住前面对话中提到的一些实体信息如已提到的人物名称等。

为了完善对话信息，系统用之前记录的实体信息来替换当前对话中出现的指代信息如人称代词、指示代词、有定描述、省略、部分-整体指代、普通名词短语等。关于指代信息的详细分类跟语言规则特别相关，因此涉及语言学的内容，为了不模糊对本发明的说明，这里暂对该部分不进行详述。

因此，在此过程中得到的完善的对话信息中对应的文本信息S2相当于文本信息S1加上实体信息C的内容，即：

S2＝S1+C

接下来，在步骤S104中，分别抽取第一文本信息S1中的话题内容和回答A中的话题内容，并用它们来更新第一话题T1和第二话题T2。如上所述，迭代更新后的T1中的T₁ ⁵这一成员在话题数组中不存在了，更新后的T1表示为：

T1＝[S1，T₁ ¹，T₁ ²，T₁ ³，T₁ ⁴]

而针对本发明的实施例，T2一直与回答A中的话题信息有关。

最后，本发明的话题更新方法在步骤S105处结束。在本发明的方法与其他实例结合后，可以直接进行多模态的答案输出作为当前对话的输出，也可以供其它模块如决策模块进行调用，综合判断后再进行输出。这些均不作为对本发明的限制。

本发明还提供了一个话题更新处理方法的实施例，如图3所示。该实施例中，主要考虑对话请求信息的来源是通过语音输入的(S201)，需要通过ASR技术进行音频数据的转换(S202)。与前一实施例类似，需要将之前的5轮对话中的话题信息以及前一轮对话中的回答信息与该文本信息进行相关度计算。

根据对话的文本信息中是否有实体信息的缺省来进行指代处理(S204)，图中用虚线框表示，表明该步骤不一定是必须要执行的。通常在首轮对话中，该步骤是不需要的。

在步骤S205中，根据完善的对话信息S2、第一话题组T1和第二话题组T2来进行对话处理，得到若干回答，并基于上下文的话题相关度来对若干回答进行筛选得到最终的回答A。最后，同时用文本信息S1和回答A中的话题信息更新第一话题组T1和第二话题组T2，从而保证当前话题总与前一轮的对话请求信息和回答最为相关。

为了适应对话请求的音频输入，最后本发明可以通过利用从文本到语音(Text ToSpeech，简称TTS)技术将上面所得到的回答A转换为音频进行播放输出，步骤S206。然而，根据本发明，输出是多模态的，并不限于音频、图像、动作等等的输出形式。事实上，本发明的结果也不一定要输出给用户，它也可以传送到系统的其它模块，以供其调用。

根据本发明的另一个实施例，它在话题相关性计算和后面的更新时，考虑了当前对话的性质，即是否为首轮对话。这是因为首轮对话的话题更新处理与非首轮对话的话题更新处理有点不同。参照图4。

在步骤S401中，开始进行话题相关性判断。计算相关度值之前，首先判断当前对话是否为首轮对话。如果不是，则正常按照前面所述的两个实施例那样执行，将之前的3-5轮对话中抽取出的话题T1与当前对话的文本信息S1进行相关度计算，相关度值y1为1表明相关，为0表明不相关(步骤S402)。同样，将之前的1轮对话中的回答抽取出的话题T2与当前对话的文本信息S1进行相关度计算，相关度值y2为1表明相关，为0表明不相关(步骤S403)。

然后，进行对话请求信息的指代处理，即S2＝S1+C。最后，转到本发明的下一子程序进行对话处理，参见对图3的步骤S205的说明，这里不再进行赘述。

如果当前对话为首轮对话，则话题更新和相关度计算的步骤直接简化为，设置第一话题组T1和第二话题组T2的内容为空，并将它们的相关度值y均设为0(S406)。而信息指代处理步骤直接简化为将实体信息C的内容设置为空，将第二文本信息的内容设置为与第一文本信息S1的内容相同，参见标记S407。

根据本发明的另一个方面，它还提供了一种基于上下文的话题更新数据处理装置，所述装置包括：

在一个优选实施例中，根据本发明的对话处理模块运行时，提取第一文本信息S1和回答A中的实体信息来更新或替换之前对话中记录的实体信息C。

第一话题T1中的各个话题成员和第二话题T2中的各个话题成员具有对应的权重因子，所述权重因子满足衰减函数，使得越远离当前对话的话题成员的权重因子越小。

应该理解的是，本发明所公开的实施例不限于这里所公开的特定结构、处理步骤或材料，而应当延伸到相关领域的普通技术人员所理解的这些特征的等同替代。还应当理解的是，在此使用的术语仅用于描述特定实施例的目的，而并不意味着限制。

说明书中提到的“一个实施例”或“实施例”意指结合实施例描述的特定特征、结构或特性包括在本发明的至少一个实施例中。因此，说明书通篇各个地方出现的短语“一个实施例”或“实施例”并不一定均指同一个实施例。

虽然本发明所公开的实施方式如上，但所述的内容只是为了便于理解本发明而采用的实施方式，并非用以限定本发明。任何本发明所属技术领域内的技术人员，在不脱离本发明所公开的精神和范围的前提下，可以在实施的形式上及细节上作任何的修改与变化，但本发明的专利保护范围，仍须以所附的权利要求书所界定的范围为准。

Claims

1.一种基于上下文的话题更新数据处理方法，其特征在于，该方法包括以下步骤：

获取对应于当前用户对话请求信息的第一文本信息S1；

计算与之前多轮对话中的用户对话请求信息相关的第一话题T1和所述第一文本信息S1之间的第一相关度y1，以及与之前多轮对话中的回答相关的第二话题T2和所述第一文本信息S1之间的第二相关度y2，其中所述第一话题T1和所述第二话题T2为包含了单轮对话中与请求信息相关的各个话题成员以及与回答相关的各个话题成员的话题集合；

2.根据权利要求1所述的话题更新数据处理方法，其特征在于，提取第一文本信息S1和回答A中的实体信息来更新或替换之前对话中记录的实体信息C。

3.根据权利要求1所述的话题更新数据处理方法，其特征在于，所述第一话题中的各个话题成员和所述第二话题中的各个话题成员具有对应的权重因子，所述权重因子满足衰减函数，使得越远离当前对话的话题成员的权重因子越小。

4.根据权利要求1-3中任一项所述的话题更新数据处理方法，其特征在于，在对话处理之前，判断当前对话是否为首轮对话，如果否，则用之前对话过程中记录的实体信息C对所述第一文本信息S1中出现的指代信息进行替换从而形成第二文本信息S2，如果判断为首轮对话时，则直接使用第一文本信息S1的内容填充第二文本信息S2。

5.根据权利要求4所述的话题更新数据处理方法，其特征在于，所述第一话题的权重因子的衰减函数选择成使得在更新所述第一话题T1时，能够直接用所述第一文本信息对应的话题信息替换所述第一话题T1。

6.根据权利要求4所述的话题更新数据处理方法，其特征在于，所述第二话题的权重因子的衰减函数选择成使得在更新第二话题T2时，能够直接用所述回答A对应的话题信息替换所述第二话题T2。

7.根据权利要求1-3中任一项所述的话题更新数据处理方法，其特征在于，所述第一相关度和第二相关度的取值为0或者1，其中0表示话题不相关，1表示话题相关。

8.一种基于上下文的话题更新数据处理装置，其特征在于，所述装置包括：

相关度计算模块，其用于计算与之前多轮对话中的用户对话请求信息相关的第一话题T1和所述第一文本信息S1之间的第一相关度y1，以及与之前多轮对话中的回答相关的第二话题T2和所述第一文本信息S1之间的第二相关度y2，其中所述第一话题T1和所述第二话题T2为包含了单轮对话中与请求信息相关的各个话题成员以及与回答相关的各个话题成员的话题集合；

9.根据权利要求8所述的话题更新数据处理装置，其特征在于，在对话处理模块中，提取第一文本信息S1和回答A中的实体信息来更新或替换之前对话中记录的实体信息C。

10.根据权利要求8所述的话题更新数据处理装置，其特征在于，所述第一话题中的各个话题成员和所述第二话题中的各个话题成员具有对应的权重因子，所述权重因子满足衰减函数，使得越远离当前对话的话题成员的权重因子越小。