CN107480291A

CN107480291A - 基于幽默生成的情感交互方法和机器人系统

Info

Publication number: CN107480291A
Application number: CN201710749276.3A
Authority: CN
Inventors: 朱定局
Original assignee: Great Power Innovative Intelligent Technology (dongguan) Co Ltd
Current assignee: Zhu Dingju
Priority date: 2017-08-28
Filing date: 2017-08-28
Publication date: 2017-12-15
Anticipated expiration: 2037-08-28
Also published as: CN110674270A; CN107480291B; CN110674270B; JP2019040605A

Abstract

本发明公开了一种基于幽默生成的情感交互方法和机器人系统，所述方法应用于机器人中，包括：获取用户的数据；根据用户的数据，生成幽默语段输出；监测用户对输出的幽默语段反馈的情感；当用户反馈的情感识别结果为预设情感时，判断输出的幽默语段具备幽默的特点，且用户反馈的情感识别结果中预设情感程度越大，判断输出的幽默语段的幽默程度越大；当用户反馈的情感识别结果为预设情感以外的情感时，判断输出的幽默语段不具备幽默的特点；将具备幽默特点的幽默语段、该幽默语段对应的环境信息以及该幽默语段的幽默程度存入幽默大数据知识库。本发明可以通过幽默生成触发和改变用户的情感，并可以通过情感识别检验幽默的效果。

Description

基于幽默生成的情感交互方法和机器人系统

技术领域

本发明涉及一种情感交互方法和系统，尤其是一种基于幽默生成的情感交互方法和机器人系统，属于人工智能技术领域。

背景技术

随着机器人技术的快速发展，用户对机器人功能的要求也越来越高，情感和幽默是智慧机器人的最重要内容之一。

现有情感计算的主要功能是识别和表达情感；现有幽默计算的主要功能是认知和生成幽默，但现有情感计算技术和幽默计算技术是分别进行的，并没有进行结合。

此外，现有的机器人还存在以下问题：

1)现有机器人都是通过查询幽默知识库来获取幽默语段或幽默成分，因为幽默知识库中幽默语段或幽默成分数量有限，从而导致幽默程度和幽默水平低。

2)现有机器人能感知、识别、理解、表达情感，但无法预测人的情感，既然无法预测人的情感，那么就不知道如何改变人的情感，即无法取悦用户；机器人无法预测对用户的同一句话的不同回复会使得用户产生什么样的情感，例如哪种回复能让用户预设情感，哪种回复会让用户生气，因此机器人无法选择能让用户产生特定情感的回复。

发明内容

本发明的目的是为了解决上述现有技术的缺陷，提供了一种基于幽默生成的情感交互方法，该方法可以通过幽默生成触发和改变用户的情感，并可以通过情感识别检验幽默的效果，进而选择回复让用户产生特定情感。

本发明的另一目的在于提供一种基于幽默生成的情感交互机器人系统。

本发明的目的可以通过采取如下技术方案达到：

基于幽默生成的情感交互方法，所述方法应用于机器人中，包括：

获取用户的数据；

根据用户的数据，生成幽默语段输出；

监测用户对输出的幽默语段反馈的情感；

当用户反馈的情感识别结果为预设情感时，判断输出的幽默语段具备幽默的特点，且用户反馈的情感识别结果中预设情感程度越大，判断输出的幽默语段的幽默程度越大；

当用户反馈的情感识别结果为预设情感以外的情感时，判断输出的幽默语段不具备幽默的特点；

将具备幽默特点的幽默语段、该幽默语段对应的环境信息、该幽默语段的幽默程度以及用户对该幽默语段的情感反馈存入幽默大数据知识库。

进一步的，所述根据用户的数据，生成幽默语段输出，具体包括：

从用户的数据中提取部分数据作为第一小数据，再提取部分数据作为第二小数据；

获取大数据；

从大数据中获取与第一小数据有关的数据，进行清洗后，作为第一相关数据集；

从第一相关数据集中挖掘与第一小数据的正相关度大于预设正相关度阈值的语段，并将挖掘的语段及其正相关度存入正相关语段集合；

从正相关语段集合中挖掘与第二小数据的负相关度大于预设负相关度阈值的语段，并将挖掘的语段及其对应的正相关度、负相关度存入正负相关语段集合；

根据正负相关语段集合中每个语段对应的正相关度、负相关度，计算该个语段的幽默度，将幽默度大于预设幽默阈值的语段存入幽默语段集合；

从幽默语段集合中选出幽默度最大的幽默语段，并将该幽默语段输出。

获取大数据；

从第一相关数据集中挖掘与第二小数据的负相关度大于预设负相关度阈值的语段，并将挖掘的语段及其负相关度存入负相关语段集合；

从负相关语段集合中挖掘与第一小数据的正相关度大于预设正相关度阈值的语段，并将挖掘的语段及其对应的负相关度、正相关度存入负正相关语段集合；

根据负正相关语段集合中每个语段对应的负相关度、正相关度，计算该个语段的幽默度，将幽默度大于预设幽默阈值的语段存入幽默语段集合；

进一步的，所述方法还包括：

根据幽默大数据知识库中的数据，以及过去每次不同类型的用户对不同答复的预设情感以外的情感反馈，得到过去每次不同类型的用户对不同答复的情感反馈相关信息；其中，所述情感反馈相关信息包括用户信息、答复内容、情感反馈内容和情感反馈类型；

将过去每次不同类型的用户对不同答复的情感反馈相关信息存入情感反馈大数据；

获取待答复的用户信息，并获取对待答复用户的备选答复集合；

获取预期的用户情感反馈；

从情感反馈大数据中检索出所有与待答复的用户信息、对待答复用户的备选答复集合中答复内容最匹配的情感反馈记录；

从情感反馈记录中提取情感反馈，计算情感反馈与预期用户情感反馈的匹配度；

根据情感反馈与预期用户情感反馈的最大匹配度对应的情感反馈记录，获取该情感反馈记录对应的答复内容，将该答复内容作为对待答复用户的答复。

进一步的，所述从情感反馈大数据中检索出所有与用户信息、备选答复集合中答复内容最匹配的情感反馈记录，具体为：

将情感反馈大数据中每个情感反馈记录中的用户信息、答复内容与待答复的用户信息、对待答复用户的备选答复集合中的答复内容进行匹配，得到每个情感反馈记录与待答复的用户信息、对待答复用户的备选答复集合的匹配度，从中选出最大匹配度对应的情感反馈记录作为与待答复的用户信息、对待答复用户的备选答复集合最匹配的情感反馈记录。

本发明的另一目的可以通过采取如下技术方案达到：

基于幽默生成的情感交互机器人系统，所述系统包括：

用户数据获取模块，用于获取用户的数据；

幽默语段生成输出模块，用于根据用户的数据，生成幽默语段输出；

情感反馈监测模块，用于监测用户对输出的幽默语段反馈的情感；

第一判断模块，用于当用户反馈的情感识别结果为预设情感时，判断输出的幽默语段具备幽默的特点，且用户反馈的情感识别结果中预设情感程度越大，判断输出的幽默语段的幽默程度越大；

第二判断模块，用于当用户反馈的情感识别结果为预设情感以外的情感时，判断输出的幽默语段不具备幽默的特点；

幽默大数据知识库获取模块，用于将具备幽默特点的幽默语段、该幽默语段对应的环境信息、该幽默语段的幽默程度以及用户对该幽默语段的情感反馈存入幽默大数据知识库。

进一步的，所述幽默语段生成输出模块，具体包括：

小数据提取单元，用于从用户的数据中提取部分数据作为第一小数据，再提取部分数据作为第二小数据；

大数据获取单元，用于获取大数据；

第一相关数据集获取单元，用于从大数据中获取与第一小数据有关的数据，进行清洗后，作为第一相关数据集；

正相关语段集合获取单元，用于从第一相关数据集中挖掘与第一小数据的正相关度大于预设正相关度阈值的语段，并将挖掘的语段及其正相关度存入正相关语段集合；

正负相关语段集合获取单元，从正相关语段集合中挖掘与第二小数据的负相关度大于预设负相关度阈值的语段，并将挖掘的语段及其对应的正相关度、负相关度存入正负相关语段集合；

幽默语段集合获取单元，根据正负相关语段集合中每个语段对应的正相关度、负相关度，计算该个语段的幽默度，将幽默度大于预设幽默阈值的语段存入幽默语段集合；

幽默语段输出单元，从幽默语段集合中选出幽默度最大的幽默语段，并将该幽默语段输出。

进一步的，所述幽默语段生成输出模块，具体包括：

大数据获取单元，用于获取大数据；

负相关语段集合获取单元，用于从第一相关数据集中挖掘与第二小数据的负相关度大于预设负相关度阈值的语段，并将挖掘的语段及其负相关度存入负相关语段集合；

负正相关语段集合获取单元，用于从负相关语段集合中挖掘与第一小数据的正相关度大于预设正相关度阈值的语段，并将挖掘的语段及其对应的负相关度、正相关度存入负正相关语段集合；

幽默语段集合获取单元，用于根据负正相关语段集合中每个语段对应的负相关度、正相关度，计算该个语段的幽默度，将幽默度大于预设幽默阈值的语段存入幽默语段集合；

进一步的，所述系统还包括：

情感反馈相关信息获取模块，用于根据幽默大数据知识库中的数据，以及过去每次不同类型的用户对不同答复的预设情感以外的情感反馈，得到过去每次不同类型的用户对不同答复的情感反馈相关信息；其中，所述情感反馈相关信息包括用户信息、答复内容、情感反馈内容和情感反馈类型；

情感反馈大数据获取模块，用于将过去每次不同类型的用户对不同答复的情感反馈相关信息存入情感反馈大数据；

备选答复集合获取模块，用于获取待答复的用户信息，并获取对待答复用户的备选答复集合；

预期用户情感反馈获取模块，用于获取预期的用户情感反馈；

情感反馈记录检索模块，用于从情感反馈大数据中检索出所有与待答复的用户信息、对待答复用户的备选答复集合中答复内容最匹配的情感反馈记录；

匹配度计算模块，用于从情感反馈记录中提取情感反馈，计算情感反馈与预期用户情感反馈的匹配度；

答复内容获取模块，用于根据情感反馈与预期用户情感反馈的最大匹配度对应的情感反馈记录，获取该情感反馈记录对应的答复内容，将该答复内容作为对待答复用户的答复。

进一步的，所述情感反馈记录检索模块，具体为：

用于将情感反馈大数据中每个情感反馈记录中的用户信息、答复内容与待答复的用户信息、对待答复用户的备选答复集合中的答复内容进行匹配，得到每个情感反馈记录与待答复的用户信息、对待答复用户的备选答复集合的匹配度，从中选出最大匹配度对应的情感反馈记录作为与待答复的用户信息、对待答复用户的备选答复集合最匹配的情感反馈记录。

本发明相对于现有技术具有如下的有益效果：

1、本发明通过生成幽默语段输出，触发和改变用户的情感，并监测用户对输出的幽默语段反馈的情感，即通过情感识别检验幽默的效果，将用户反馈的情感识别结果为预设情感所对应的幽默语段判断为具备幽默的特点，将具备幽默特点的幽默语段及其相关信息存入幽默大数据知识库，在将来通过幽默大数据知识库可以进行幽默语段的选择，从而提高机器人幽默生成的能力。

2、本发明可以先将大数据与第一小数据进行正相关分析，得到正相关语段集合，从正相关语段集合中挖掘与第二小数据负相关的语段，并将挖掘的语段及其对应的正相关度、负相关度存入正负相关语段集合，根据正负相关语段集合得到幽默语段集合，可以从幽默语段集合中选择幽默度最大的幽默语段，以提高机器人的幽默程度和幽默水平，又因为进行正相关的语段和负相关的语段是同一语段，所以该语段既合理又可笑，从而形成了幽默效果；再通过后续步骤的用户情感识别对输出的幽默语段进行筛选，为幽默大数据知识库提供更好的选择，进一步提高机器人幽默生成的能力。

3、本发明可以先将大数据与第二小数据进行负相关分析，得到负相关语段集合，从负相关语段集合中挖掘与第二小数据正相关的语段，并将挖掘的语段及其对应的负相关度、正相关度存入负正相关语段集合，根据负正相关语段集合得到幽默语段集合，可以从幽默语段集合中选择幽默度最大的幽默语段，以提高机器人的幽默程度和幽默水平，又因为进行负相关的语段和正相关的语段是同一语段，所以该语段既合理又可笑，从而形成了幽默效果；再通过后续步骤的用户情感识别对输出的幽默语段进行筛选，为幽默大数据知识库提供更好的选择，进一步提高机器人幽默生成的能力。

4、本发明可以通过幽默大数据知识库中的数据，以及用户在过去对不同答复的预设情感以外的情感反馈，得到情感反馈大数据，从情感反馈大数据中能够检索出所有与待答复的用户信息、对待答复用户的备选答复中答复内容最匹配的情感反馈记录，以预测对用户的同一句话的不同答复会使得用户产生什么样的情感，进而根据预测的结果来选择能让用户产生特定情感的回复。

附图说明

图1为本发明实施例1的基于幽默生成的情感交互方法流程图。

图2为本发明实施例2的生成幽默语段输出的流程图。

图3为本发明实施例2的正相关语段的挖掘流程图。

图4为本发明实施例2的负相关语段的挖掘流程图。

图5为本发明实施例2的幽默语段集合获取的简易示意图。

图6为本发明实施例2的基于大数据正负相关分析生成幽默语段简易示意图。

图7为本发明实施例3的生成幽默语段输出的流程图。

图8为本发明实施例3的负相关语段的挖掘流程图。

图9为本发明实施例3的正相关语段的挖掘流程图。

图10为本发明实施例3的幽默语段集合获取的简易示意图。

图11为本发明实施例3的基于大数据负正相关分析生成幽默语段简易示意图。

图12为本发明实施例4的基于幽默生成的情感交互方法流程图。

图13为本发明实施例5的基于幽默生成的情感交互机器人系统结构框图。

图14为本发明实施例6的幽默语段生成输出模块结构框图。

图15为本发明实施例7的幽默语段生成输出模块结构框图。

图16为本发明实施例8的基于幽默生成的情感交互机器人系统结构框图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。

实施例1：

机器人输出的幽默语段可以通过幽默计算进行生成，看或听这个幽默语段的用户发笑这种预设情感的情感可以通过情感计算进行识别；此时，识别出看或听这个幽默语段的用户发笑了，说明机器人输出的这个幽默语段是成功的，该成功经验可以用于机器人将来的幽默生成中。

如图1所示，本实施例提供了一种基于幽默生成的情感交互方法，该方法可以应用于机器人中，包括以下步骤：

S101、获取用户的数据。

在本实施例中，机器人是指智能机器人，可以模拟人类行为或思想的机械，其包括一些计算机程序，如聊天程序等；机器人在与用户对话过程中，机器人的感官能够获得多个小数据，如机器人的眼部安装有摄像头，能够获得用户的视频图像数据，机器人的耳部安装有拾音器，能够获得用户的音频数据，其它各种传感器获得传感数据(如用户的体温、心率等)，各种终端获得用户输入的文本数据(如用户属性、话语等)。

S102、根据用户的数据，生成幽默语段输出。

在本实施例中，可以获取用户的输入语段，通过现有的幽默生成方法生成幽默语段输出，输出的方式为文本和/或语音。

S103、监测用户对输出的幽默语段反馈的情感。

监测用户对输出的幽默语段反馈的情感，机器人可以利用摄像头检测用户脸部的表情，或利用麦克风检测用户发出的声音，或利用文字输入检测用户输入的文本，例如监测用户对输出的幽默语段反馈的情感是否为预设情感，可以利用摄像头检测用户脸部的表情是否有笑容，或利用麦克风检测是否有用户发出的声音中是否有笑声，或利用文字输入检测用户输入的文本是否有humor或haha字样；本领域技术人员可以理解，预设情感以外的其它情感也有相应的判断方法。

S104、若用户反馈的情感识别结果为预设情感，判断输出的幽默语段具备幽默的特点，且用户反馈的情感识别结果中预设情感程度越大，判断输出的幽默语段的幽默程度越大；若用户反馈的情感识别结果为预设情感以外的情感时，判断输出的幽默语段不具备幽默的特点。

预设情感的设定方法为：检测人们对真的幽默语段的情感反馈，作为预设情感。例如检测1万个人对100个真的幽默语段的情感反馈，并将其中最多的一种情感反馈作为预设情感，当然，也可以采用其他方式来得到预设情感；甚至，预设情感还可以是多种情感的按比例组合。所谓真的幽默语段，指的是幽默程度大的语段。在预设情感没有进行设定的情况下，预设情感自动设定为“快乐”这种情感，因为人们听到幽默语段，最常见的情感反馈就是发笑，而发笑是一种快乐的情感。

本实施例将预设情感设定为“快乐”，预设情感程度即快乐程度，其可以根据笑容的幅度、笑声的分贝和文本中关于“笑”的字符数的其中之一进行确定，也可以是其中两者或三者结合确定，根据快乐程度，可以将对应的幽默程度划分为高、中、低，或是将幽默程度划分为一级、二级、三级、四级等，或是将幽默程度划分为A级、B级、C级、D级等，或是利用评分的方式划分幽默程度。预设情感以外的情感，可以为沉默、生气、痛苦等。

S105、重新根据用户的输入语段，利用普通答复语段生成方法生成非幽默语段输出，并告诉用户“刚才那是幽默语段，请不要当真。现在这个非幽默语段供您参考”。

该步骤在实验过程中可以省略，但在实际应用时，该步骤非常重要，如果缺少该步骤，会误导用户，因为幽默的话语一般都含有故意让人发笑的错误，通过该步骤，用户能在辨别正误之间获得乐趣和真知，特别是应用在教学辅助机器人中，该步骤更是不可或缺。

S106、将具备幽默特点的幽默语段、该幽默语段对应的环境信息、该幽默语段的幽默程度以及用户对该幽默语段的情感反馈存入幽默大数据知识库。

该步骤中的环境信息，是指用户与机器人交谈的时间、地点、场景、双方属性等，在将来机器人生成幽默时，在将来可以通过幽默大数据知识库中各幽默语段、各幽默语段对应的环境信息、各幽默语段的幽默程度以及以及用户对各幽默语段的情感反馈进行幽默语段的选择，从而提高机器人幽默生成的能力。

实施例2：

本实施例的其它步骤同实施例1，区别之处在于步骤S102采用了基于大数据正负相关分析的方法实现，如图2所示，具体包括以下步骤：

S1021、从用户的数据中提取部分数据作为第一小数据，再提取部分数据作为第二小数据。

将获得的多个小数据(石头)“扔进”大数据(池塘)中，从而生成幽默(一石激起千层浪)，识别或生成幽默的过程是将小数据与大数据之间进行关联数据挖掘，从而产生只由小数据或只由大数据无法识别或生成的幽默，这种幽默就是基于大数据与小数据的机器人幽默识别和生成的结果。

小数据是与用户对话过程中特有的个性化数据，在一次对话过程中，通过不同途径能获得多个小数据，例如用户话语、用户属性、对话场景、对话时间、对话地点、机器人属性等等。

这些小数据中用户话语是核心的小数据，如果机器人的答复完全否定用户的话语(就是与用户话语完全负相关的答复，即“牛头不对马嘴”)，不但不会产生幽默的效果，反而会让用户觉得机器人在胡言乱语、答非所问，因此需要肯定全部或部分用户话语(就是与用户话语全部或部分正相关的答复)，才能使得用户产生共鸣，成为幽默的基础。

本实施例在步骤S101获取的用户数据中提取全部或部分用户话语作为第一小数据。虽然这些小数据是幽默的基础，但又不能对所有已感知的小数据都肯定(就是与所有已感知的小数据都完全正相关的答复)，因为如果都肯定，那么就是一句普通的答复话语，谈不上幽默，所以需要对其中部分小数据进行否定，而这种否定部分又需要与前面的肯定部分进行统一和融合，从而实现对立统一的幽默。

S1022、获取大数据。

大数据是由大量用户长期积累下来的数据，例如互联网大数据就是由无数互联网用户长期积累下来的数据，因此大数据对机器人及对话过程而言，属于外部数据，本实施例的机器人可以通过服务器获取大数据。

S1023、从大数据中获取与第一小数据有关的数据，进行清洗后，作为第一相关数据集。

从大数据中获取与第一小数据有关的数据：从大数据中搜索出与第一小数据匹配度大于预设匹配度阈值的语段；其中，大数据的某语段与小数据的匹配度指的是小数据在该语段中出现的字的个数除以小数据中字的个数。

对数据进行清洗：数据可能是一段话，由多个语句组成，将其中出现小数据中关键词的语句标记出来，如果某语句及其上句或下句都未被标记，则将该语句删去；或将其中出现小数据中关键词的语句标记出来，如果某语句未被标记，则将该语句删去；其中，语句指的是有一个句号或感叹号或问号或其他句子结束标识符结束的语句。

S1024、从第一相关数据集中挖掘与第一小数据的正相关度大于预设正相关度阈值的语段，并将挖掘的语段及其正相关度存入正相关语段集合。

正相关度大于预设正相关度阈值的语段称为正相关语段，正相关语段的挖掘，可以采用现有的对大数据进行相关性分析的技术来实现，也可以通过图3的方式实现，具体包括以下步骤：

S10241、获取第一小数据在大数据中相似语段的数量，作为第一数量，记为m；

S10242、统计第一相关数据集中每个数据在大数据中相似数据的数量，作为该个数据的第二数量，记为n；

S10243、统计该个数据与第一小数据进行合并后得到的数据在大数据中相似数据的数量，作为该个数据的第三数量，记为o；

S10244、根据第一数量m、该个数据的第二数量n和第三数量o，计算该个数据的正相关度，记为pc；

具体地，该个数据的正相关度pc，计算公式如下：

pc＝o/((m×n)^1/2) (1)

S10245、判断第一相关数据集中所有语段与第一小数据的正相关度是否大于预设正相关度阈值；

S10246、将与第一小数据的正相关度大于预设正相关度阈值的语段及其正相关度存入正相关语段集合，记为Z1。

正相关度足够大(即大于预设正相关度阈值)，说明该语段与第一小数据组合属于大部分人的共识，从而使得幽默语段具有合理性。

S1025、从正相关语段集合中挖掘与第二小数据的负相关度大于预设负相关度阈值的语段，并将挖掘的语段及其对应的正相关度、负相关度存入正负相关语段集合。

负相关度大于预设负相关度阈值的语段称为负相关语段，负相关语段的挖掘，可以采用现有的对大数据进行相关性分析的技术来实现，也可以通过图4的方式实现，具体包括以下步骤：

S10251、获取第二小数据在大数据中相似语段的数量，作为第四数量，记为p；

S10252、统计正相关语段集合Z1中每个数据在大数据中相似数据的数量，作为该个数据的第五数量，记为q；

S10253、统计该个数据与第二小数据进行合并后得到的数据在大数据中相似数据的数量，作为该个数据的第六数量，记为r；

S10254、根据第四数量p、该个数据的第五数量q和第六数量r，计算该个数据的负相关度，记为nc；

具体地，该个数据的负相关度nc，计算公式如下：

nc＝1-r/((p×q)^1/2) (2)

S10255、判断正相关语段集合Z1中所有语段与第二小数据的负相关度是否大于预设负相关度阈值；

S10256、将与第二小数据的负相关度大于预设负相关度阈值的语段及其对应的正相关度、负相关度存入正负相关语段集合，记为Z2。

负相关度足够大(即负相关度是否大于预设负相关度阈值)，说明该语段与第二小数据组合后属于大部分人的非共识，从而使得幽默语段具有可笑性。

S1026、根据正负相关语段集合中每个语段对应的正相关度、负相关度，计算该个语段的幽默度，将幽默度大于预设幽默阈值的语段存入幽默语段集合。

本实施例从正负相关语段集合Z2中获取一个语段及其正相关度和负相关度，其中正相关度为80％，负相关度为90％，根据正相关度和负相关度计算该语段的幽默度，将幽默度大于预设幽默阈值的语段及其幽默度存入幽默语段集合，记为Z。

具体地，该语段的幽默度h，计算公式如下：

h＝(pc×nc)^1/2 (3)

步骤S1024和S1025中的数量统计可以采用已有的mapreduce模型，利用hadoop或spark进行面向大数据的快速统计。

图5示出了幽默语段集合获取的简易示意图，从大数据X中挖掘出与第一小数据y1一致性(正相关)的语段集合Z1，采用的大数据分析过程记为Z1＝f(X,y1)，这对应着正相关阶段。从大数据X中挖掘出与第一小数据y1一致(正相关)但与第二小数据y2不一致性(负相关)的语段集合Z，采用的大数据分析过程记为g(X,y2∪f(X,y1))，这对应着对立统一幽默的对立统一阶段，即螺旋式上升为幽默识别和生成的阶段。这两个阶段的过程不是割裂的，而是相互影响、有机构成的。

图6示出了上述步骤S1021～S1026的简易示意图，将大数据X与第一小数据y1进行正相关分析，从大数据中挖掘得到Z1，然后将Z1中大数据X与第二小数据y2进行负相关性分析，从大数据中挖掘得到Z。

S1027、从幽默语段集合中选出幽默度最大的幽默语段，并将该幽默语段输出。

本实施例基于大数据正负相关分析获取能产生幽默感的语段，来提高机器人的幽默程度和幽默水平，又因为进行正相关的语段和负相关的语段是同一语段，所以该语段既合理又可笑，从而形成了幽默效果；再通过实施例1后续步骤的用户情感识别对这些基于大数据正负相关分析生成的幽默语段进行筛选，为幽默大数据知识库提供更好的选择，进一步提高机器人幽默生成的能力。

实施例3：

本实施例的其它步骤同实施例1，区别之处在于步骤S102采用了基于大数据负正相关分析的方法实现，如图7所示，具体包括以下步骤：

S1021、从用户的数据中提取部分数据作为第一小数据，再提取部分数据作为第二小数据，该步骤的具体内容可参见上述实施例2。

S1022、获取大数据，该步骤的具体内容可以参见上述实施例2。

S1023、从大数据中获取与第一小数据有关的数据，进行清洗后，作为第一相关数据集，该步骤的具体内容可以参见上述实施例2。

S1024、从第一相关数据集中挖掘与第二小数据的负相关度大于预设负相关度阈值的语段，并将挖掘的语段及其负相关度存入负相关语段集合。

负相关度大于预设负相关度阈值的语段称为负相关语段，负相关语段的挖掘，可以采用现有的对大数据进行相关性分析的技术来实现，也可以通过图8的方式实现，具体包括以下步骤：

S10241、获取第二小数据在大数据中相似语段的数量，作为第一数量，记为m；

S10243、统计该个数据与第二小数据进行合并后得到的数据在大数据中相似数据的数量，作为该个数据的第三数量，记为o；

S10244、根据第一数量m、该个数据的第二数量n和第三数量o，计算该个数据的负相关度，记为nc；

具体地，该个数据的负相关度nc，计算公式如下：

nc＝1-o/((m×n)^1/2) (4)

S10245、判断第一相关数据集中所有语段与第二小数据的负相关度是否大于预设负相关度阈值；

S10246、将与第二小数据的负相关度大于预设负相关度阈值的语段及其负相关度存入负相关语段集合，记为Z1。

S1025、从负相关语段集合中挖掘与第一小数据的正相关度大于预设正相关度阈值的语段，并将挖掘的语段及其对应的负相关度、正相关度存入负正相关语段集合。

正相关度大于预设正相关度阈值的语段称为正相关语段，正相关语段的挖掘，可以采用现有的对大数据进行相关性分析的技术来实现，也可以通过图9的方式实现，具体包括以下步骤：

S10251、获取第一小数据在大数据中相似语段的数量，作为第四数量，记为p；

S10252、统计负相关语段集合Z1中每个数据在大数据中相似数据的数量，作为该个数据的第五数量，记为q；

S10253、统计该个数据与第一小数据进行合并后得到的数据在大数据中相似数据的数量，作为该个数据的第六数量，记为r；

S10254、根据第四数量p、该个数据的第五数量q和第六数量r，计算该个数据的正相关度，记为pc；

具体地，该个数据的正相关度pc，计算公式如下：

pc＝r/((p×q)^1/2) (5)

S10255、判断负相关语段集合Z1中所有语段与第一小数据的正相关度是否大于预设正相关度阈值；

S10256、将与第一小数据的正相关度大于预设正相关度阈值的语段及其对应的负相关度、正相关度存入负正相关语段集合，记为Z2。

S1026、根据负正相关语段集合中每个语段对应的负相关度、正相关度，计算该个语段的幽默度，将幽默度大于预设幽默阈值的语段存入幽默语段集合。

本实施例从负正相关语段集合Z2中获取一个语段及其对应的负相关度和正相关度，其中负相关度为90％，正相关度为80％，根据负相关度和正相关度计算该语段的幽默度，将幽默度大于预设幽默阈值的语段及其幽默度存入幽默语段集合，记为Z。

具体地，该语段的幽默度h，计算公式如下：

h＝(pc×nc)^1/2 (6)

图10示出了幽默语段集合获取的简易示意图，从大数据X中挖掘出与第二小数据y2不一致性(负相关)的语段集合Z1，采用的大数据分析过程记为Z1＝g(X,y2)，这对应着负相关阶段。从大数据X中挖掘出与第一小数据y1一致(正相关)但与第二小数据y2不一致性(负相关)的语段集合Z，采用的大数据分析过程记为f(X,y1∪g(X,y2))，这对应着对立统一幽默的对立统一阶段，即螺旋式上升为幽默识别和生成的阶段。这两个阶段的过程不是割裂的，而是相互影响、有机构成的。

图11示出了上述步骤S1021～S1026的简易示意图，将大数据X与第二小数据y2进行负相关性分析，从大数据中挖掘得到Z1，然后将Z1中大数据X与第一小数据y1进行正相关性分析，从大数据中挖掘得到幽默语段集合Z。

本实施例基于大数据负正相关分析获取能产生幽默感的语段，来提高机器人的幽默程度和幽默水平，又因为进行负相关的语段和正相关的语段是同一语段，所以该语段既合理又可笑，从而形成了幽默效果；再通过实施例1后续步骤的用户情感识别对这些基于大数据负正相关分析生成的幽默语段进行筛选，为幽默大数据知识库提供更好的选择，进一步提高机器人幽默生成的能力。

实施例4：

如图12所示，本实施例的步骤S101～S106同实施例1、2或3，但本实施例的基于幽默生成的情感交互方法还包括：

S107、根据幽默大数据知识库中的数据，以及过去每次不同类型的用户对不同答复的预设情感以外的情感反馈，得到过去每次不同类型的用户对不同答复的情感反馈相关信息。

所述情感反馈相关信息包括用户信息(含用户类型)、答复内容、情感反馈内容和情感反馈类型。

从上述实施例1中可以知道，幽默大数据知识库中的数据包括幽默语段、幽默语段对应的环境信息、幽默语段的幽默程度以及用户对幽默语段的情感反馈，幽默语段为机器人的答复内容，环境信息包括用户信息，用户对幽默语段的情感反馈包括情感反馈内容和情感反馈类型，情感反馈内容包括用户脸部的表情、用户发出的声音和/或用户输入的文本，情感反馈类型为预设情感(快乐)，可以认为幽默大数据知识库中的数据包含了过去每次不同类型的用户对不同幽默语段答复的预设情感反馈。

虽然幽默大数据知识库中的数据包含了用户对幽默语段答复的预设情感反馈，但仍有用户对其它答复的沉默、生气、痛苦等预设情感以外的情感反馈是没有涉及的，因此除了需要幽默大数据知识库中的数据外，还需要结合过去每次不同类型的用户对不同答复的预设情感以外的情感反馈，这样才能够得到较为全面的情感反馈相关信息。

S108、将过去每次不同类型的用户对不同答复的情感反馈相关信息存入情感反馈大数据。

S109、获取待答复的用户信息，并获取对待答复用户的备选答复集合。

待答复的用户信息记为U，对待答复用户的备选答复集合记为P，备选答复集合P中包括答复内容Pi；其中，i从1到n，n为备选的答复个数。

S110、获取预期的用户情感反馈。

预期的用户情感反馈记为F，获取预期的用户情感反馈，例如：期望用户听了答复之后变得更快乐，则预期的用户情感反馈F为快乐；或期望用户听了答复之后变得更痛苦，则预期的用户情感反馈F为痛苦。

S111、从情感反馈大数据中检索出所有与待答复的用户信息、对待答复用户的备选答复中答复内容最匹配的情感反馈记录。

具体检索过程为：将情感反馈大数据中每个情感反馈记录中的用户信息、答复内容与待答复的用户信息U、对待答复用户的备选答复P中的答复内容Pi进行匹配，得到每个情感反馈记录与待答复的用户信息U、对待答复用户的备选答复P中答复内容Pi的匹配度，从中选出最大匹配度对应的情感反馈记录作为与待答复的用户信息U、对待答复用户的备选答复P中答复内容Pi最匹配的情感反馈记录，记为Ri。

S112、从情感反馈记录中提取情感反馈，计算情感反馈与预期用户情感反馈的匹配度，记为Di。

S113、根据情感反馈与预期用户情感反馈的最大匹配度对应的情感反馈记录，获取该情感反馈记录对应的答复内容，将该答复内容作为对待答复用户的答复。

可以理解，最大匹配度Di对应的情感反馈记录Ri中的情感反馈Fi与预期的用户情感反馈F最为接近，因此最大匹配度Di对应的情感反馈记录Ri，获取该情感反馈记录Ri对应的答复内容Pi，该答复内容Pi必然在所有备选答复中最能产生接近预期的用户情感反馈F。

本实施例通过幽默大数据知识库中的数据，以及用户在过去对不同答复的预设情感以外的情感反馈，来预测对用户的同一句话的不同答复会使得用户产生什么样的情感，进而根据预测的结果来选择能让用户产生特定情感的回复。

本领域普通技术人员可以理解实现上述各实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，相应的程序可以存储于一计算机可读取存储介质中，所述的存储介质，如ROM/RAM、磁盘或光盘等。

实施例5：

如图13所示，本实施例提供了一种基于幽默生成的情感交互机器人系统，该系统包括用户数据获取模块1301、幽默语段生成输出模块1302、情感反馈监测模块1303、第一判断模块1304、第二判断模块1305和幽默大数据知识库获取模块1306，各个模块的具体功能如下：

所述用户数据获取模块1301，用于获取用户的数据；

所述幽默语段生成输出模块1302，用于根据用户的数据，生成幽默语段输出，幽默语段可以通过现有的幽默生成方法生成；

所述情感反馈监测模块1303，用于监测用户对输出的幽默语段反馈的情感；

所述第一判断模块1304，用于当用户反馈的情感识别结果为预设情感时，判断输出的幽默语段具备幽默的特点，且用户反馈的情感识别结果中预设情感程度越大，判断输出的幽默语段的幽默程度越大；

所述第二判断模块1305，用于当用户反馈的情感识别结果为预设情感以外的情感时，判断输出的幽默语段不具备幽默的特点；

所述幽默大数据知识库获取模块1306，用于将具备幽默特点的幽默语段、该幽默语段对应的环境信息、该幽默语段的幽默程度以及用户对该幽默语段的情感反馈存入幽默大数据知识库。

实施例6：

本实施例的其它模块同实施例1，区别之处在于幽默语段生成输出模块1302的实现，如图14所示，所述幽默语段生成输出模块1302包括小数据提取单元13021、大数据获取单元13022、第一相关数据集获取单元13023、正相关语段集合获取单元13024、正负相关语段集合获取单元13025、幽默语段集合获取单元13026和幽默语段输出单元13027，各个单元的具体功能如下：

所述小数据提取单元13021，用于从用户的数据中提取部分数据作为第一小数据，再提取部分数据作为第二小数据。

所述大数据获取单元13022，用于获取大数据。

所述第一相关数据集获取单元13023，用于从大数据中获取与第一小数据有关的数据，进行清洗后，作为第一相关数据集。

所述正相关语段集合获取单元13024，用于从第一相关数据集中挖掘与第一小数据的正相关度大于预设正相关度阈值的语段，并将挖掘的语段及其正相关度存入正相关语段集合，具体过程可参见实施例2。

所述正负相关语段集合获取单元13025，从正相关语段集合中挖掘与第二小数据的负相关度大于预设负相关度阈值的语段，并将挖掘的语段及其对应的正相关度、负相关度存入正负相关语段集合，具体过程可参见实施例2。

所述幽默语段集合获取单元13026，根据正负相关语段集合中每个语段对应的正相关度、负相关度，计算该个语段的幽默度，将幽默度大于预设幽默阈值的语段存入幽默语段集合，具体过程可参见实施例2。

所述幽默语段输出单元13027，从幽默语段集合中选出幽默度最大的幽默语段，并将该幽默语段输出。

实施例7：

本实施例的其它模块同实施例1，区别之处在于幽默语段生成输出模块1302的实现，如图15所示，所述幽默语段生成输出模块1302包括小数据提取单元13021、大数据获取单元13022、第一相关数据集获取单元13023、负相关语段集合获取单元13024、负正相关语段集合获取单元13025、幽默语段集合获取单元13026和幽默语段输出单元13027，各个单元的具体功能如下：

所述大数据获取单元13022，用于获取大数据。

所述负相关语段集合获取单元13024，用于从第一相关数据集中挖掘与第二小数据的负相关度大于预设负相关度阈值的语段，并将挖掘的语段及其负相关度存入负相关语段集合，具体过程可参见实施例3。

所述负正相关语段集合获取单元13025，用于从负相关语段集合中挖掘与第一小数据的正相关度大于预设正相关度阈值的语段，并将挖掘的语段及其对应的负相关度、正相关度存入负正相关语段集合，具体过程可参见实施例3。

所述幽默语段集合获取单元13026，用于根据负正相关语段集合中每个语段对应的负相关度、正相关度，计算该个语段的幽默度，将幽默度大于预设幽默阈值的语段存入幽默语段集合，具体过程可参见实施例3。

实施例8：

如图16所示，本实施例的用户数据获取模块1301、幽默语段生成输出模块1302、情感反馈监测模块1303、第一判断模块1304、第二判断模块1305和幽默大数据知识库获取模块1306同实施例5、6或7，但本实施例的基于幽默生成的情感交互机器人系统还包括情感反馈相关信息获取模块1307、情感反馈大数据获取模块1308、备选答复集合获取模块1309、预期用户情感反馈获取模块1310、情感反馈记录检索模块1311、匹配度计算模块1312和答复内容获取模块1313，这几个模块的具体功能如下：

所述情感反馈相关信息获取模块1307，用于根据幽默大数据知识库中的数据，以及过去每次不同类型的用户对不同答复的预设情感以外的情感反馈，得到过去每次不同类型的用户对不同答复的情感反馈相关信息；其中，所述情感反馈相关信息包括用户信息、答复内容、情感反馈内容和情感反馈类型；

所述情感反馈大数据获取模块1308，用于将过去每次不同类型的用户对不同答复的情感反馈相关信息存入情感反馈大数据；

所述备选答复集合获取模块1309，用于获取待答复的用户信息，并获取对待答复用户的备选答复集合；

所述预期用户情感反馈获取模块1310，用于获取预期的用户情感反馈；

所述情感反馈记录检索模块1311，用于从情感反馈大数据中检索出所有与待答复的用户信息、对待答复用户的备选答复集合中答复内容最匹配的情感反馈记录，具体如下：

所述匹配度计算模块1312，用于从情感反馈记录中提取情感反馈，计算情感反馈与预期用户情感反馈的匹配度。

所述答复内容获取模块1313，用于根据情感反馈与预期用户情感反馈的最大匹配度对应的情感反馈记录，获取该情感反馈记录对应的答复内容，将该答复内容作为对待答复用户的答复。

在此需要说明的是，上述各实施例提供的机器人系统仅以上述各功能模块的划分进行举例说明，在实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。

可以理解，上述各实施例的机器人系统所使用的术语“第一”、“第二”等可用于描述各种模块，但这些模块不受这些术语限制。这些术语仅用于将第一个模块与另一个模块区分。举例来说，在不脱离本发明的范围的情况下，可以将第一判断模块称为第二判断模块，且类似地，可将第二判断模块称为第一判断模块，第一判断模块和第二判断模块两者都是判断模块，但其不是同一判断模块。

以上所述，仅为本发明专利优选的实施例，但本发明专利的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明专利所公开的范围内，根据本发明专利的技术方案及其发明构思加以等同替换或改变，都属于本发明专利的保护范围。

Claims

1.基于幽默生成的情感交互方法，其特征在于：所述方法应用于机器人中，包括：

获取用户的数据；

根据用户的数据，生成幽默语段输出；

监测用户对输出的幽默语段反馈的情感；

2.根据权利要求1所述的基于幽默生成的情感交互方法，其特征在于：所述根据用户的数据，生成幽默语段输出，具体包括：

获取大数据；

3.根据权利要求1所述的基于幽默生成的情感交互方法，其特征在于：所述根据用户的数据，生成幽默语段输出，具体包括：

获取大数据；

4.根据权利要求1-3任一项所述的基于幽默生成的情感交互方法，其特征在于：所述方法还包括：

获取预期的用户情感反馈；

5.根据权利要求4所述的基于幽默生成的情感交互方法，其特征在于：所述从情感反馈大数据中检索出所有与用户信息、备选答复集合中答复内容最匹配的情感反馈记录，具体为：

6.基于幽默生成的情感交互机器人系统，其特征在于：所述系统包括：

用户数据获取模块，用于获取用户的数据；

7.根据权利要求6所述的基于幽默生成的情感交互机器人系统，其特征在于：所述幽默语段生成输出模块，具体包括：

大数据获取单元，用于获取大数据；

8.根据权利要求6所述的基于幽默生成的情感交互机器人系统，其特征在于：所述幽默语段生成输出模块，具体包括：

大数据获取单元，用于获取大数据；

9.根据权利要求6-8任一项所述的基于幽默生成的情感交互机器人系统，其特征在于：所述系统还包括：

10.根据权利要求9所述的基于幽默生成的情感交互机器人系统，其特征在于：所述情感反馈记录检索模块，具体为：