CN107564542A

CN107564542A - 基于幽默识别的情感交互方法和机器人系统

Info

Publication number: CN107564542A
Application number: CN201710783825.9A
Authority: CN
Inventors: 朱定局
Original assignee: Great Power Innovative Intelligent Technology (dongguan) Co Ltd
Current assignee: Great Power Innovative Intelligent Technology (dongguan) Co Ltd
Priority date: 2017-09-04
Filing date: 2017-09-04
Publication date: 2018-01-09
Anticipated expiration: 2037-09-04
Also published as: CN107564542B; JP2019046476A; JP6913848B2

Abstract

本发明公开了一种基于幽默识别的情感交互方法和机器人系统，所述方法包括：机器人获取用户的输入语段，作为用户语段；对用户语段进行识别，得到用户语段的幽默程度；根据用户语段的幽默程度，计算需要反馈的情感程度；根据需要反馈的情感程度，通过情感计算表达情感；幽默检验装置通过对表达的情感进行情感识别，获取反馈的情感程度；根据情感识别的结果中反馈的情感程度，计算识别得到的幽默程度获取用户语段的真实幽默程度；通过比较识别得到的幽默程度和用户语段的真实幽默程度的差异，判断幽默识别的准确度。本发明可以通过幽默识别来识别用户的幽默，以此检验机器人对幽默识别的能力，而且可以通过情感表达来表达识别的结果。

Description

基于幽默识别的情感交互方法和机器人系统

技术领域

本发明涉及一种情感交互方法和系统，尤其是一种基于幽默识别的情感交互方法和机器人系统，属于人工智能技术领域。

背景技术

随着机器人技术的快速发展，用户对机器人功能的要求也越来越高，情感和幽默是智慧机器人的最重要内容之一。

现有情感计算的主要功能是识别和表达情感；现有幽默计算的主要功能是认知和生成幽默，但现有情感计算技术和幽默计算技术是分别进行的，并没有进行结合。

此外，现有机器人都是通过查询幽默知识库来识别幽默语句或幽默成分，因为幽默知识库中幽默语句或幽默成分数量有限，从而导致很多幽默知识库中没有采集到的幽默语句则无法识别，幽默识别水平低。

发明内容

本发明的目的是为了解决上述现有技术的缺陷，提供了一种基于幽默识别的情感交互方法，该方法可以通过幽默识别来识别用户的幽默，以此检验机器人对幽默识别的能力，而且可以通过情感表达来表达识别的结果。

本发明的另一目的在于提供一种基于幽默识别的情感交互机器人系统。

本发明的目的可以通过采取如下技术方案达到：

基于幽默识别的情感交互方法，所述方法通过机器人和幽默检验装置实现，包括：

机器人获取用户的输入语段，作为用户语段；

机器人对用户语段进行识别，得到用户语段的幽默程度；

幽默检验装置获取用户语段的真实幽默程度；

幽默检验装置通过比较识别得到的幽默程度和用户语段的真实幽默程度的差异，判断幽默识别的准确度。

进一步的，所述方法在幽默检验装置获取用户语段的真实幽默程度之前，还包括：

机器人根据用户语段的幽默程度，计算需要反馈的情感程度；

机器人根据需要反馈的情感程度，通过情感计算表达情感；

幽默检验装置通过对表达的情感进行情感识别，获取反馈的情感程度；

幽默检验装置根据情感识别的结果中反馈的情感程度，计算识别得到的幽默程度。

进一步的，所述机器人对用户语段进行识别，得到用户语段的幽默程度，具体包括：

获取用户语段的属性数据；

从用户语段的属性数据中提取各部分数据作为各个小数据，存入小数据集合；

获取大数据；

计算小数据集合的每个小数据与用户语段的相关度；

根据小数据集合中各个小数据与用户语段的相关度，计算小数据集合中各个小数据与用户语段的相关差异度；

将小数据集合中各个小数据与用户语段的相关差异度输入神经网络或深度神经网络，得到用户语段的幽默程度。

进一步的，所述计算小数据集合的每个小数据与用户语段的相关度，具体包括：

统计用户语段在大数据中相似数据的数量，作为第一数量；

统计小数据集合中每个小数据在大数据中相似数据的数量，作为该个小数据的第二数量；

统计该个小数据与用户语段进行合并后得到的数据在大数据中相似数据的数量，作为该个小数据的第三数量；

根据第一数量、该个小数据的第二数量和第三数量，得到该个小数据与用户语段的相关度；其中，所述该个小数据与用户语段的相关度，具体计算公式为：该个小数据的第三数量/((第一数量×该个小数据的第二数量)^1/2)；

所述根据小数据集合中各个小数据与用户语段的相关度，计算小数据集合中各个小数据与用户语段的相关差异度，具体包括：

计算各个小数据与用户语段的相关度的平均值；

根据各个小数据与用户语段的相关度、各个小数据与用户语段的相关度的平均值以及小数据集合中小数据的份数，计算小数据集合中各个小数据与用户语段的相关差异度；其中，所述小数据集合中各个小数据与用户语段的相关差异度，具体计算公式为：(小数据集合中各个小数据与用户语段的相关度-小数据集合中各个小数据与用户语段的相关度的平均值)^(1/小数据集合中小数据的份数)。

根据用户语段进行搜索，获得搜索结果；

筛选搜索结果中与用户语段匹配度从大到小的前m条语句分别作为m条第一语句；其中，m为正整数；

获取用户语段的属性数据；

将属性数据分别与每条第一语句进行合并，得到分别与第一语句对应的m条合并语句；

分别根据每条第一语句以及与每条第一语句对应的合并语句，计算每条第一语句的幽默性参数；

根据匹配度最大的第一语句对应的幽默性参数与最小幽默性参数之间的差值，以及最大幽默性参数与匹配度最大的第一语句对应的幽默性参数之间的差值，得到用户语段的幽默程度。

本发明的另一目的可以通过采取如下技术方案达到：

基于幽默识别的情感交互机器人系统，所述系统包括机器人和幽默检验装置；

所述机器人包括：

用户语段获取模块，用于获取用户的输入语段，作为用户语段；

幽默程度识别模块，用于机器人对用户语段进行识别，得到用户语段的幽默程度；

所述幽默检验装置包括：

真实幽默程度获取模块，用于系统获取用户语段的真实幽默程度；

准确度判断模块，用于系统通过比较机器人识别得到的幽默程度和用户语段的真实幽默程度的差异，判断幽默识别的准确度。

进一步的，所述机器人还包括：

情感程度计算模块，用于机器人根据用户语段的幽默程度，计算需要反馈的情感程度；

情感表达模块，用于机器人根据需要反馈的情感程度，通过情感计算表达情感；

所述所述幽默检验装置还包括：

情感程度获取模块，用于系统通过对机器人表达的情感进行情感识别，获取反馈的情感程度；

幽默程度计算模块，用于系统根据系统情感识别的结果中机器人反馈的情感程度，计算机器人识别得到的幽默程度。

进一步的，所述幽默程度识别模块，具体包括：

第一属性数据获取单元，用于获取用户语段的属性数据；

小数据集合获取单元，用于从用户语段的属性数据中提取各部分数据作为各个小数据，存入小数据集合；

大数据获取单元，用于获取大数据；

相关度计算单元，用于计算小数据集合的每个小数据与用户语段的相关度；

相关差异度计算单元，用于根据小数据集合中各个小数据与用户语段的相关度，计算小数据集合中各个小数据与用户语段的相关差异度；

第一幽默程度获取单元，用于将小数据集合中各个小数据与用户语段的相关差异度输入神经网络或深度神经网络，得到用户语段的幽默程度。

进一步的，所述相关度计算单元，具体包括：

第一统计子单元，用于统计用户语段在大数据中相似数据的数量，作为第一数量；

第二统计子单元，用于统计小数据集合中每个小数据在大数据中相似数据的数量，作为该个小数据的第二数量；

第三统计子单元，用于统计该个小数据与用户语段进行合并后得到的数据在大数据中相似数据的数量，作为该个小数据的第三数量；

相关度计算子单元，用于根据第一数量、该个小数据的第二数量和第三数量，得到该个小数据与用户语段的相关度；其中，所述该个小数据与用户语段的相关度，具体计算公式为：该个小数据的第三数量/((第一数量×该个小数据的第二数量)^1/2)；

所述相关差异度计算单元，具体包括：

相关度平均值计算子单元，用于计算各个小数据与用户语段的相关度的平均值；

相关差异度计算子单元，用于根据各个小数据与用户语段的相关度、各个小数据与用户语段的相关度的平均值以及小数据集合中小数据的份数，计算小数据集合中各个小数据与用户语段的相关差异度；其中，所述小数据集合中各个小数据与用户语段的相关差异度，具体计算公式为：(小数据集合中各个小数据与用户语段的相关度-小数据集合中各个小数据与用户语段的相关度的平均值)^(1/小数据集合中小数据的份数)。

进一步的，所述幽默程度识别模块，具体包括：

搜索单元，用于根据用户语段进行搜索，获得搜索结果；

筛选单元，用于筛选搜索结果中与用户语段匹配度从大到小的前m条语句分别作为m条第一语句；其中，m为正整数；

第二属性数据获取单元，用于获取用户语段的属性数据；

合并单元，用于将属性数据分别与每条第一语句进行合并，得到分别与第一语句对应的m条合并语句；

幽默性参数计算单元，用于分别根据每条第一语句以及与每条第一语句对应的合并语句，计算每条第一语句的幽默性参数；

第二幽默程度获取单元，用于根据匹配度最大的第一语句对应的幽默性参数与最小幽默性参数之间的差值，以及最大幽默性参数与匹配度最大的第一语句对应的幽默性参数之间的差值，得到用户语段的幽默程度。

本发明相对于现有技术具有如下的有益效果：

1、本发明在机器人的幽默程度可以向外输出时，机器人通过对用户语段进行识别，可以直接输出识别得到的用户语段的幽默程度，在机器人的幽默程度不直接向外输出时，机器人先通过情感表达来形象地表达识别的结果，幽默检验装置再根据识别的结果间接估算机器人识别得到的幽默程度；幽默检验装置通过比较识别得到的幽默程度与真实幽默程度之间的差异，判断幽默识别的准确度，通过准确度可以检验机器人对幽默识别的能力，如果准确度达到或超过预期值，说明机器人的幽默识别较强，如果准确度没有达到预期值，可以通过选用其他机器人现有幽默识别的方法，或选用改进后的幽默识别方法，重新进行实验，直至准确度达到预期值，从而使机器人具备较强的幽默识别能力。

2、本发明可以通过从大数据中获取用户语段与用户数据的相关差异度，来识别用户语段的幽默程度，能够有效提高机器人的幽默识别水平，再通过后续步骤对机器人幽默识别能力进行检验，如果准确度没有达到预期值，在训练后的神经网络或深度神经网络的基础上，通过实验使机器人具备较强的幽默识别能力。

3、本发明可以通过大数据搜索来计算用户语段的幽默程度，能够有效提高机器人的幽默识别水平，再通过后续步骤对机器人幽默识别能力进行检验，如果准确度没有达到预期值，可以继续通过大数据搜索引擎实验使机器人具备较强的幽默识别能力。

附图说明

图1为本发明实施例1的基于幽默识别的情感交互方法流程图。

图2为本发明实施例2的用户语段识别的流程图。

图3为本发明实施例2的小数据集合的每个小数据与用户语段的相关度计算流程图。

图4为本发明实施例2的小数据集合中各个小数据与用户语段的相关差异度计算流程图。

图5为本发明实施例3的用户语段识别的流程图。

图6为本发明实施例3的获取用户语段的属性数据流程图。

图7为本发明实施例3的每条第一语句的幽默性参数计算流程图。

图8为本发明实施例5的基于幽默识别的情感交互机器人系统结构框图。

图9为本发明实施例6的幽默程度识别模块结构框图。

图10为本发明实施例6的相关度计算单元结构框图。

图11为本发明实施例6的相关差异度计算单元结构框图。

图12为本发明实施例7的幽默程度识别模块结构框图。

图13为本发明实施例7的第二属性数据获取单元结构框图。

图14为本发明实施例7的幽默性参数获取单元结构框图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。

实施例1：

用户通过文本或声音输入幽默语句，获取这个幽默语句的机器人通过幽默计算进行认知后发笑，机器人发笑这种快乐的情感可以通过情感计算进行表达。此时，获取这个幽默语句的机器人发笑了，说明机器人能够成功地认知这个幽默语句。这个过程可用于对机器人幽默识别能力的检验。

如图1所示，本实施例提供了一种基于幽默识别的情感交互方法，该方法通过机器人和幽默检验装置实现，包括以下步骤：

S101、机器人获取用户的输入语段，作为用户语段。

在本实施例中，机器人是指智能机器人，包括一切模拟人类行为或思想以及模拟其他生物的机械，也包括一些电脑程序，例如，聊天机器人程序等。在用户需要与机器人进行交互时，用户可向机器人用户语段，从而机器人可获取用户的输入语段，其中，用户语段可以是文字和语音，甚至可以是视频，语段包括一条语句或多条语句。

S102、机器人对用户语段进行识别，得到用户语段的幽默程度。

机器人对用户语段进行识别，可以通过现有幽默识别方法识别用户输入的语段，得到用户语段的幽默程度，幽默程度可以定义为0～1之间的数值(可以精确到小数点)，越接近1，则越幽默。

机器人接收到(例如听到)用户语段时，如果机器人向用户输出(例如告诉用户)“您输入的语段不幽默”或“您输入的语段很幽默”或“您输入的语段的幽默程度是0.8”，这显然不够形象，与人类之间的交流习惯不符，所以本实施例的机器人不直接向外输出幽默程度，本实施例的机器人向外输出的是对用户语段的情感反馈，因此还需要通过情感计算来间接估算机器人识别出的幽默程度，幽默程度的估算由以下步骤S103～S106来实现。

S103、机器人根据用户语段的幽默程度，计算需要反馈的情感程度。

机器人需要反馈的情感程度与用户语段的幽默程度成正比，即用户语段越幽默，则机器人需要反馈的情感程度越大，而由于幽默程度为0～1之间的数值，因此根据这些数值，可以利用评分的方式划分需要反馈的情感程度，例如幽默程度为0～1之间的数值时，需要反馈的情感程度也可以为0～1之间的对应数值，最初级的方式就是直接将幽默程度值作为需要反馈的情感程度值。

其中，情感程度中情感的类型可以预设，也可以采用如下方法获取：检测人们听到真的幽默语段时所反馈的情感类型，作为情感程度中情感的类型。例如检测1万个人对100个真的幽默语段的情感反馈，并将其中反馈得最多的一种情感类型作为情感程度中情感的类型，当然，也可以采用其他方式来得到情感程度中的情感类型；甚至，情感程度中的情感类型还可以是多种情感类型的按比例组合。所谓真的幽默语段，指的是幽默程度大的语段。在情感程度中情感的类型没有进行预设或获取的情况下，情感程度中情感的类型自动设定为快乐情感，因为人们听到幽默语段，最常见的情感反馈就是发笑，而发笑是一种快乐的情感。以下实施例中将情感程度中的情感类型默认为快乐情感。

其中，幽默程度与情感程度之间的对应关系可以预设，例如情感程度＝f(幽默程度)，f为正相关函数；幽默程度与情感程度之间的对应关系可以默认为相等的关系，因为一般情况下，幽默程度越大，得到的情感反馈也就越大；幽默程度与情感程度之间的对应关系也可以通过深度学习来获取：检测人们听到不同幽默程度的语段时所反馈的情感程度，将该幽默程度和反馈的情感程度分别作为深度学习的输入和输出对深度学习神经网络进行训练，然后就可以输入幽默程度到该深度学习神经网络通过深度学习得到情感程度。

S104、机器人根据需要反馈的情感程度，通过情感计算表达情感。

根据情感知识库，可以检索出需要反馈的情感程度对应的情感表达方式，机器人可以通过动作、语音和文本的至少一个来表达，当需要反馈的情感程度大于或等于预设情感程度时，判断机器人需要笑，通过动作、语音和文本的至少一个来表达快乐情感，例如机器人露出笑容、发出笑声、文本输出关于“笑”的字样(humor、haha等)，需要反馈的情感程度越大，则机器人笑容的幅度越大、笑声的分贝越高、文本中关于“笑”字样的字符数越多；当需要反馈的情感程度小于预设情感程度时，判断机器人不需要笑，通过动作、语音和文本的至少一个来表达严肃的情感，需要反馈的情感程度越小，严肃程度越大。

S105、幽默检验装置通过对表达的情感进行情感识别，获取反馈的情感程度。

幽默检验装置监测机器人对用户语段的反馈情感，幽默检验装置包括摄像头、麦克风、文本识别模块等，其可以利用摄像头检测机器人脸部的表情，或利用麦克风检测机器人发出的声音，或利用文本检测模块检测机器人输出的文本，通过监测情感，来获取机器人反馈的情感程度，如果监测到的情感为快乐，则摄像头检测机器人脸部有笑容，或麦克风检测机器人发出笑声，或文本识别模块检测机器人输出的文本有humor或haha字样，说明情感程度大于或等于预设情感程度，此时情感程度可以根据笑容的幅度、笑声的分贝、humor或haha的字符数中的其中之一确定，也可以是其中两者或三者结合确定；如果监测到的机器人反馈的情感为快乐以外的情感时，说明情感程度小于预设情感程度，情感程度也可以利用类似的方式确定。

S106、幽默检验装置根据情感识别的结果中反馈的情感程度，计算识别得到的幽默程度。

情感识别的结果中机器人反馈的情感程度越大，那么说明步骤S103中机器人识别得到的幽默程度也就越大；情感识别的结果中机器人反馈的情感程度越小，那么说明步骤S103中机器人识别得到的幽默程度也就越小；如步骤S103所述，情感识别的结果中反馈的情感程度为1时，机器人识别得到的幽默程度为1，情感识别的结果中反馈的情感程度为0时，机器人识别得到的幽默程度也为0，情感识别的结果中反馈的情感程度为其他数值时，也可以计算得到相应的幽默程度。

S107、幽默检验装置获取用户语段的真实幽默程度。

用户语段的真实幽默程度可由用户输入，真实幽默程度可以由用户根据过去的经验得到，或是由用户根据多个听到该输入语段的人的反应得到。

S108、幽默检验装置通过比较识别得到的幽默程度和用户语段的真实幽默程度的差异，判断幽默识别的准确度。

本步骤中识别得到的幽默程度是步骤S106中幽默检验装置识别得到的幽默程度，通过比较识别得到的幽默程度和用户语段的真实幽默程度的差异，即计算两者之间的差异值，差异值即为两者之间的差值的绝对值，差异值与幽默识别的准确度成反比，差异值越大，幽默识别的准确度越低，差异值越小，幽默识别的准确度越高，幽默识别的准确度的计算公式为：1-差异值/真实幽默程度，例如识别得到的幽默程度为7，而真实幽默程度为6，则幽默识别的准确度即为83.33％，假设预期值为80％，说明准确度已经超过预期值，机器人的幽默识别能力较强，如果准确度没有达到预期值，可以通过选用其他机器人现有幽默识别的方法，或选用改进后的幽默识别方法，按照上述步骤S101～S107重新实验，直至准确度达到预期值，从而使机器人具备较强的幽默识别能力。

实施例2：

本实施例的其它步骤同实施例1，区别之处在于步骤S102采用了基于大数据相关性分析的方法实现，如图2所示，具体包括以下步骤：

S1021、获取用户语段的属性数据。

用户语段的属性数据包括用户的属性数据、语段内容的属性数据、对话的时间属性数据、对话的空间属性数据、对话的场景属性数据以及其他相关属性数据。

机器人在与用户对话过程中，机器人的感官能够获得多个小数据，如机器人的眼部安装有摄像头，能够获得用户的视频图像数据，机器人的耳部安装有拾音器，能够获得用户的音频数据，其它各种传感器获得传感数据(如用户的体温、心率等)，各种终端获得用户输入的文本数据(如用户属性、话语等)；将获得的多个小数据(石头)“扔进”大数据(池塘)中，从而识别或生成幽默(一石激起千层浪)，识别或生成幽默的过程是将小数据与大数据之间进行关联数据挖掘，从而产生只由小数据或只由大数据无法识别或生成的幽默，这种幽默就是基于大数据与小数据的机器人幽默识别和生成的结果。

S1022、从用户语段的属性数据中提取各部分数据作为各个小数据，存入小数据集合。

小数据是机器人与用户对话过程中特有的个性化数据，在一次对话过程中，通过不同途径能获得多个小数据，例如用户属性、对话场景、对话时间、对话地点、机器人属性、等等。

S1023、获取大数据。

大数据是由大量用户长期积累下来的数据，例如互联网大数据就是由无数互联网用户长期积累下来的数据，因此大数据对机器人及对话过程而言，属于外部数据，本实施例的机器人可以通过服务器获取大数据。

S1024、计算小数据集合的每个小数据与用户语段的相关度。

小数据集合的每个小数据与用户语段的相关度，可以采用现有的基于大数据进行相关性分析的技术来实现，也可以通过图3的方式实现，具体包括以下步骤：

S10241、统计用户语段在大数据中相似数据的数量，作为第一数量，记为m；

S10242、统计小数据集合中每个小数据在大数据中相似数据的数量，作为该个小数据的第二数量，记为n；

S10243、统计该个小数据与用户语段进行合并后得到的数据在大数据中相似数据的数量，作为该个小数据的第三数量，记为o；

S10244、根据第一数量m、该个小数据的第二数量n和第三数量p，得到该个小数据与用户语段的相关度c；其中，所述该个小数据与用户语段的相关度，具体计算公式为：该个小数据的第三数量/((第一数量×该个小数据的第二数量)^1/2)；

具体地，该个小数据与用户语段的相关度r，计算公式如下：

r＝o/((m×n)^1/2) (1)

上述数量统计可以采用已有的mapreduce模型，利用hadoop或spark进行面向大数据的快速统计。

S1025、根据小数据集合中各个小数据与用户语段的相关度，计算小数据集合中各个小数据与用户语段的相关差异度。

该步骤通过图4的方式实现，具体包括：

S10251、计算各个小数据与用户语段的相关度的平均值，记为ra；

S10252、根据各个小数据与用户语段的相关度、各个小数据与用户语段的相关度的平均值以及小数据集合中小数据的份数，计算小数据集合中各个小数据与用户语段的相关差异度，记为d；

小数据集合中小数据的份数记为c，小数据集合中各个小数据与用户语段的相关差异度，计算公式如下：

d＝(r-ra)^1/c (2)

S1026、将小数据集合中各个小数据与用户语段的相关差异度输入神经网络或深度神经网络，得到用户语段的幽默程度。

本实施例事先通过已知相关差异度及其对应的真实幽默程度的训练数据来训练神经网络或深度神经网络，来得到训练后的神经网络或深度神经网络，训练后的神经网络或深度神经网络即作为本步骤需要输入的神经网络或深度神经网络，小数据集合中各个小数据与用户语段的相关差异度输入后，可以得到用户语段的幽默程度，如同实施例1，幽默程度可以定义为0～1之间的数值(可以精确到小数点)，越接近1，则越幽默。

本实施例通过从大数据中获取用户语段与用户数据的相关差异度，来识别用户语段的幽默程度，以提高机器人的幽默识别能力。

实施例3：

本实施例的其它步骤同实施例1，区别之处在于步骤S102采用了大数据搜索的方法实现，如图5所示，具体包括以下步骤：

S1021、根据用户语段进行搜索，获得搜索结果。

根据用户语段进行搜索，可获得搜索结果；其中，搜索结果中包括多条语句，搜索结果中语句的数量即为搜索结果的数量，搜索出的这些语句与用户语段相关。

S1022、筛选搜索结果中与用户语段匹配度从大到小的前m条语句分别作为m条第一语句。

其中，m为正整数；由于根据用户语段进行搜索时，可能会获得较多的搜索结果，有些搜索结果可能不太合理，对全部的数据进行处理时会浪费较多时间，从而需要对搜索结果进行筛选，筛选出较为合理的语句，一般情况下，与用户语段匹配度较大的语句较合理，从而筛选出搜索结结果中与用户语段匹配度最大的前m条语句分别作为m条第一语句。具体地，可根据预设排序规则对搜索结果进行排序，获得搜索列表，预设排序规则可采用匹配度从大到小规则，也可采用相似度从大到小规则等，从而可从搜索列表获取前m条语句作为第一语句，即与用户语段匹配度最大的前m条语句是指将与用户语段匹配度按从大到小的顺序排序，排在最前的m条语句。大数据搜索引擎自身具有对应的预设排序规则，例如，百度大数据搜索引擎具有对应的预设排序规则，当获取用户语段通过百度大数据搜索引擎进行搜索时，根据其对应的预设排序规则会对搜索结果进行排序获得搜索列表显示在页面上，用户在页面上看到的搜索列表即为根据自身携带的预设排序规则对搜索结果进行排序后的结果

S1023、获取用户语段的属性数据。

用户语段的属性数据，跟语段内容相关的属性，例如语段内容中主语的属性或/和宾语的属性，又例如语段内容中场景的属性。获取用户语段的属性数据，以用户语段的主语属性为例，可以通过图6的方式实现，具体包括以下步骤：

S10231、当用户语段没有主语或其主语为第一人称时，通过用户注册信息或对话框中的属性输入获取用户语段的主语属性；

S10232、当用户语段的主语为第二人称时，通过机器人注册信息或对话框中的属性输入获取用户语段的主语属性；

S10233、当用户语段的主语为第三人称时，通过对话框中的属性输入或将用户语段的主语作为电子词典或搜索引擎的输入进行搜索，获取用户语段的主语属性。

属性数据以用户语段的主语属性为例，例如，当用户语段的主语为“我”时，对应的属性为用户属性，用户在与机器人交互之前，首先需要在机器人中进行用户注册，获得用户注册信息，其中包括用户的属性等信息，例如，一名女子进行注册时，需要获取用户的姓名、年龄和性别属性等信息，比如，年轻女性是该女子注册的性别属性，从而可更具注册信息获得该年轻女性这一信息，从而获得用户语段的主语属性，或者可以通过弹出对话框的形式询问用户，用户在对话框中输入主语属性，从而获得用户语段的主语属性；当用户语段没有主语时，默认主语为“我”；当用户语段的主语为您或你时，对应的是机器人属性，机器人的属性信息是预先在机器人中已注册，即机器人注册信息，可根据机器人的注册信息可获取主语属性，或可通过对话框中的属性输入获取主语属性；当用户语段的主语为第三人称时，可通过对话框中的属性输入获取主语信息，也可通过搜索电子词典或搜索引擎获得主语属性，例如，当用户语段的主语为“他”，主语属性为男性，当用户语段的主语为“她”，主语属性为女性。

S1024、将属性数据分别与每条第一语句进行合并，得到分别与第一语句对应的m条合并语句。

有多少条第一语句，则对应得到相应数量的合并语句，有m条第一语句，从而得到m条合并语句，即当对第一语句进行筛选，更新第一语句后，第一语句的数量发生变化，对应的合并语句的数量也对应发生变化。有m条第一语句，将属性数据分别与每条第一语句进行合并，得到m条合并语句，每条合并语句都对应有一条第一语句，即一条第一语句对应有一条合并语句，例如，有3条第一语句，分别为A、B、C，属性数据为D，将属性数据分别与每条第一语句进行合并，即是将D分别与A、B、C合并，得到3条合并语句分别为AD、BD、CD，这3条合并语句是分别和第一语句对应的，即合并语句AD对应第一语句A，合并语句BD对应第一语句B,合并语句CD对应第一语句C。属性数据以用户语段的主语属性为例，当用户语段的主语为“我”或没有主语，主语属性为用户属性。当用户语段的主语为“您”或“你”，主语属性为机器人属性。当用户语段的主语为“他”，主语属性为男性。当用户语段的主语为“她”，主语属性为男性。用户语段的主语也可以是任何人、任何物或任何事，主语属性则是相应人的属性、相应物的属性或相应事的属性。语句和主语可以是中文，也可以是英文或其他语言。

属性数据以用户语段的主语属性为例，获取用户语段的主语的属性的方式可以是查询用户的注册信息，也可以是弹出对话框询问用户，例如，用户输入青年男性，则主语属性为青年男性，也可以是其他交互方式获取或查询方式获取。用户语段的主语包括但不限于“我”、“你”、“您”“他”、“她”、具体人名以及动物名。如果用户语段没有主语，则用户语段的主语默认为“我”。获取用户语段的主语属性，将主语属性分别与每条第一语句合并得到m条合并语句之后，可分别根据每条合并语句进行搜索，获得与合并语句对应的搜索结果数量。

S1025、分别根据每条第一语句以及与每条第一语句对应的合并语句，计算每条第一语句的幽默性参数。

由于合并语句是通过第一语句和属性数据合并得到的，每条第一语句有其对应的第一语句，从而分别根据每条第一语句以及与每条第一语句对应的合并语句，可计算得到每条第一语句的幽默性参数。第一语句的幽默性参数由第一语句的搜索结果数量以及与第一语句对应的合并语句的搜索结果数量共同决定的，即第一语句的幽默性参数是与第一语句的搜索结果数量以及与第一语句对应的合并语句的搜索结果数量相关。搜索结果数量与合理等级对应，第一语句的搜索结果数量越大，第一语句越合理，合理等级越大，合并语句的搜索结果数量越大，合并语句越合理，合理等级越大，当合并语句的搜索结果数量越小，合并语句越不合理，由于合并语句为第一语句与属性数据合并得到的，合并语句越不合理说明第一语句相对于属性数据越不合理，对应的第一语句则越幽默，即第一语句越合理，合并语句越不合理，第一语句的幽默性参数越大。

可以理解，第一语句的幽默性参数还可由第一语句的搜索结果数量在第一语句的总搜索结果数量中的比重以及与第一语句对应的合并语句的搜索结果数量在合并语句的总搜索数量中的比重共同决定的，即第一语句的幽默性参数是与第一语句的搜索结果数量在第一语句的总搜索结果数量中的比重以及与第一语句对应的合并语句的搜索结果数量在合并语句的总搜索数量中的比重相关。合并语句的搜索结果数量所占比重相对于第一语句的搜索结果数量所占比重越小，或第一语句的搜索结果数量所占比重相对于合并语句的搜索结果数量所占比重越大，则幽默性参数越大。第一语句的总搜索结果数量为每条第一语句的搜索结果数量的总数，合并语句的总搜索结果数量为每条合并语句的搜索结果数量的总数，占的比重越大，合理等级越大。

通过根据待识别的输入语句进行搜索，将搜索结果中与待识别的输入语句匹配度最大的前m条语句作为m条第一语句，从而确保m条语句与待识别的输入语句之间最匹配，确保第一语句的合理性。获取待识别的输入语句的属性数据，将属性数据分别与每条第一语句合并，获得m条合并语句，分别根据每条第一语句以及与每条第一语句对应的合并语句，计算每条第一语句的幽默性参数。

步骤S1025的实现如图7所示，具体包括以下步骤：

S10251、分别根据每条第一语句进行搜索，获得搜索结果数量作为第一语句的搜索结果数量。

第一语句的搜索结果数量越大与人们的认识越正相关，越会被人们认同。获得m条第一语句后，分别根据每条第一语句进行搜索，获得搜索结果数量作为第一语句的搜索结果数量，搜索结果数量是根据第一语句搜索得到的，从而搜索结果数量是和第一语句对应的，即获得与第一语句对应的搜索结果数量，有m条第一语句，搜索m次，获得m个搜索结果数量，每个搜索结果数量对应一条第一语句，即由于有m条第一语句，根据每条第一语句进行搜索，从而可获得m个搜索结果数量分别作为第一语句的搜索结果数量，单个搜索结果数量作为单条第一语句的搜索结果数量。例如，有2条第一语句分别为A和B，根据第一语句A进行搜索，得到搜索结果数量为30，根据第一语句B进行搜索，得到搜索结果数量为10，分别进行了两次搜索，获得两个搜索结果数量分别30和10，将该2个搜索结果数量分别作为第一语句的搜索结果数量，30是对应第一语句A的，10对应第一语句B的。搜索是调用搜索引擎自动完成的或是对预设大数据的搜索，从第一语句对应的搜索结果数量的大小可知人们对第一语句的认同度，搜索结果数量越大表示人们对第一语句的认同度越高，则该第一语句越合理，第一语句的合理等级越大，即第一语句的搜索结果数量与第一语句的合理性是对应的，将第一语句的搜索结果数量作为第一语句的合理性参数，第一语句的搜索结果数量越大，第一语句的合理性参数越大。

S10252、分别根据每条合并语句进行搜索，获得搜索结果数量作为合并语句的搜索结果数量。

合并语句的搜索结果数量越小的语句与人们的认识越负相关，越不会被人们认同。具体地，获取待识别的输入语句的属性数据，将属性数据分别与每条第一语句合并得到m条合并语句，分别根据每条合并语句进行搜索，搜索结果数量作为合并语句的搜索结果数量，即获得与合并语句对应的搜索结果数量。有m条合并语句，搜索m次，获得m个搜索结果数量，每个搜索结果数量对应一条合并语句，即由于有m条合并语句，根据每条合并语句进行搜索，从而可获得m个搜索结果数量分别作为合并语句的搜索结果数量，单个搜索结果数量作为单条合并语句的搜索结果数量。从合并语句对应的搜索结果数量的大小可知人们对合并语句的认同度，数量越小，则表示人们对该合并语句的认同度越低，则该合并语句越不合理，合并语句的合理等级越小，即合并语句的搜索结果数量与合并语句的合理性是对应的，将合并语句的搜索结果数量作为合并语句的合理性参数，合并语句的搜索结果数量越大，合并语句的合理性参数越大。

S10253、分别计算每条第一语句的搜索结果数量和与每条第一语句对应的合并语句的搜索结果数量的比值，以获得每条第一语句的幽默性参数。

通过负相关与正相关比值的途径与人们的认识正相关与负相关的对立统一，最大幽默性参数对应的第一语句最不会被人们认同的同时又被认同，因为幽默性参数越大越不被人们认同，但第一语句又是被人们认同的，说明是幽默的。

每条第一语句有其对应的一条合并语句，例如，两条第一语句分别为A和B，第一语句A对应的合并语句为AD，第一语句B对应的合并语句为BD，计算第一语句A的搜索结果数量和与第一语句A对应的合并语句AD的搜索结果数量的比值，获得第一语句A的幽默性参数，计算第一语句B的搜索结果数量和与第一语句B对应的合并语句BD的搜索结果数量的比值，获得第一语句B的幽默性参数，从而分别计算每条第一语句的搜索结果数量和与每条第一语句对应的合并语句的搜索结果数量的比值，即可获得每条第一语句的幽默性参数。

可以理解，第一语句的搜索结果数代表的是人们对第一语句的认同度，即第一语句的合理性，合并语句对应的搜索结果数量代表的是人们对合并语句的认同度，即合并语句的合理性。第一语句对应的搜索结果数量越大则越合理，合并语句对应的搜索结果数量越小则对应的合并语句越不合理，合并语句越幽默，如果某第一语句的搜索结果数量越大，其对应的合并语句的搜索结果数量越小，则表示该第一语句的搜索结果数量和与该第一语句对应的合并语句的搜索结果数量得到的比值越大，则表明该第一语句的合理性与对应的合并语句的合理性的对比度越大，本质上是表明该第一语句的合理性与对应主语而言的合理性的对比度越大，也就是说该第一语句虽然合理，但不符合对应主语的属性，该第一语句对用户而言也就最幽默，从而，将第一语句的搜索结果数量和与第一语句对应的合并语句的搜索结果数量的比值作为第一语句的幽默性参数，即可将第一语句的合理性参数与对应合并语句的合理性的比值作为幽默性参数，将幽默性参数最大的语句作为输出语句输出，从而，确保输出语句的合理性的同时，也提高了与机器人交互的幽默感，即利于机器人的智慧化和幽默化。即满足回复合理性，又满足幽默感。由于第一语句有m条，对应的合并语句有m条，即每条第一语句有其对应的一条合并语句，从而分别计算每条第一语句的搜索结果数量和与每条第一语句对应的合并语句的搜索结果数量的比值，可获得每条第一语句的幽默性参数。

另外，第一语句的幽默性参数还可通过计算第一语句的搜索结果数在第一语句的总搜索结果数量中的比重与对应合并语句的搜索结果数在合并语句的总搜索结果数量中的比重的比值获得。可将第一语句的搜索结果数在第一语句的总搜索结果数量中的比重作为第一语句的合理性参数，将合并语句的搜索结果数在合并语句的总搜索结果数量中的比重作为合并语句的合理性参数，所占比重越大，越合理，合理性参数越大，将第一语句的合理性参数与合并语句的合理性参数的比值作为第一语句的幽默型参数。

S1026、根据匹配度最大的第一语句对应的幽默性参数与最小幽默性参数之间的差值，以及最大幽默性参数与匹配度最大的第一语句对应的幽默性参数之间的差值，得到用户语段的幽默程度。

将匹配度最大的第一语句对应的幽默性参数与最小幽默性参数进行比较，差值越大，则用户语段的幽默程度越大；差值为0，则用户语段幽默程度最小。

或是将最大幽默性参数与匹配度最大的第一语句对应的幽默性参数进行比较，差值为0，则用户语段的幽默程度最大；差值越大，则用户语段的幽默程度越小。

最小幽默性参数对应的第一语句为用户语段的非幽默含义。

具体地，将(匹配度最大的第一语句对应的幽默性参数与最小幽默性参数的差值)与(最大幽默性参数与最小幽默性参数的差值)的比值作为用户语段的幽默程度，比值越接近1，则用户语段的幽默程度越大，比值越接近0，则待用户语段的幽默程度越小。

针对本实施例的第一个应用实例如下：

首先，接收用户语段，例如“我肚子痛，看来是怀孕了”。

将用户语段“我肚子痛，看来是怀孕了”作为谷歌搜索引擎的输入进行搜索，获得搜索列表，搜索列表是已经根据匹配度从大到小进行排序后的结果，筛选出搜索列表中前50条语句作为50条第一语句，该50条语句中含有输入语句的关键词，并对50条语句中的关键词进行颜色标记。

将50条第一语句作为大数据搜索引擎的50次输入进行50次搜索，得到50条搜索结果数量。

将50条搜索结果数量从大到小进行排序，选出排序后的序列中前9条搜索结果数量对应的9条第一语句，序列中前9条搜索结果数量对应的9条第一语句以及对应的搜索结果数量如下：

我肚子痛是不是怀孕了(搜索结果数量为6280000)。

我肚子痛，每个月月经过后就开始(搜索结果数量为2880000)。

我肚子痛，也胃痛(搜索结果数量为1960000)。

更年期肚子胀痛(搜索结果数量为1940000)。

我肚子痛，拉肚子(搜索结果数量为1380000)。

笑得我肚子痛(搜索结果数量为1170000)。

我肚子痛,想解大手(搜索结果数量为486000)。

我肚子痛，要上厕所大便(搜索结果数量为368000)。

我肚子痛的很厉害，痛的冒汗，是不是肠胃炎(搜索结果数量为27100)。

获取输入语句的主语属性，当用户跟机器人说“我肚子痛，看来是怀孕了”，这里的主语是“我”，所以主语属性是用户属性。机器人可以通过查询用户注册信息来获取用户属性，例如，男性。机器人也可以通过对话框方式向用户询问来获取用户属性，例如，用户在对话框中输入年轻男性，则获取的主语属性为年轻男性。机器人也可以通过“眼睛”即摄像头来识别用户属性，机器人也可以通过其他方式来获取用户属性。若获取的用户属性是“年轻男性”，将输入语句的主语属性“年轻男性”分别与上述9条第一语句合并获得9条合并语句，该9条合并语句分别与上述9条第一语句是一一对应的，9条合并语句如下。

我肚子痛是不是怀孕了+年轻男性。

我肚子痛，每个月月经过后就开始+年轻男性。

我肚子痛，也胃痛+年轻男性。

更年期肚子胀痛+年轻男性。

我肚子痛，拉肚子+年轻男性。

笑得我肚子痛+年轻男性。

我肚子痛,想解大手+年轻男性。

我肚子痛，要上厕所大便+年轻男性。

我肚子痛的很厉害，痛的冒汗，是不是肠胃炎+年轻男性。

将上述9条合并语句作为百度大数据搜索引擎的9次输入进行9次搜索，得到9条合并语句对应的搜索结果数量，9条合并语句以及合并语句对应的搜索结果数量如下：

我肚子痛是不是怀孕了+年轻男性(搜索结果数量为60700)。

我肚子痛，每个月月经过后就开始+年轻男性(搜索结果数量为80700)。

我肚子痛，也胃痛+年轻男性(搜索结果数量为272000)。

更年期肚子胀痛+年轻男性(搜索结果数量为42200)。

我肚子痛，拉肚子+年轻男性(搜索结果数量为526000)。

笑得我肚子痛+年轻男性(搜索结果数量为129000)。

我肚子痛,想解大手+年轻男性(搜索结果数量为180000)。

我肚子痛，要上厕所大便+年轻男性(搜索结果数量为137000)。

我肚子痛的很厉害，痛的冒汗，是不是肠胃炎+年轻男性(搜索结果数量为9630)。

将9条第一语句对应的搜索结果数量分别除以与9条第一语句对应的合并语句的搜索结果数量，得到9个商数，计算结果如下。

我肚子痛是不是怀孕了(搜索结果数量为6280000)。

我肚子痛是不是怀孕了+年轻男性(搜索结果数量为60700)。

6280000/60700＝103.46。

我肚子痛，每个月月经过后就开始(搜索结果数量为2880000)。

2880000/80700＝35.69。

我肚子痛，也胃痛(搜索结果数量为1960000)。

我肚子痛，也胃痛+年轻男性(搜索结果数量为272000)。

1960000/272000＝7.21。

更年期肚子胀痛(搜索结果数量为1940000)。

更年期肚子胀痛+年轻男性(搜索结果数量为42200)。

1940000/42200＝45.97。

我肚子痛，拉肚子(搜索结果数量为1380000)。

我肚子痛，拉肚子+年轻男性(搜索结果数量为526000)。

1380000/526000＝1.90。

笑得我肚子痛(搜索结果数量为1170000)。

笑得我肚子痛+年轻男性(搜索结果数量为129000)。

1170000/129000＝9.07。

我肚子痛，想解大手(搜索结果数量为486000)。

我肚子痛，想解大手+年轻男性(搜索结果数量为180000)。

486000/180000＝2.7。

我肚子痛，要上厕所大便(搜索结果数量为368000)。

我肚子痛，要上厕所大便+年轻男性(搜索结果数量为137000)。

368000/137000＝2.69。

27100/9630＝2.81。

上述9条第一语句中“我肚子痛是不是怀孕了”的搜索结果数量与其对应的合并语句“我肚子痛是不是怀孕了+年轻男性”的搜索结果数量的比值最大，为103.46。

上述9条第一语句中“我肚子痛，拉肚子”的搜索结果数量与其对应的合并语句“我肚子痛，拉肚子+年轻男性”的搜索结果数量的比值最小，为1.90。

上述9条第一语句中与待识别语句“我肚子痛，看来是怀孕了”匹配度最大的第一语句“我肚子痛是不是怀孕了”对应的幽默性参数，为103.46。

在所有的第一语句中，与输入语段匹配度最大的第一语句对应的幽默性参数，必然与输入语段对应的幽默性参数最为接近，所以与匹配度最大的第一语句对应的幽默性参数必然可以近似地作为输入语段对应的幽默性参数。

将最大幽默性参数与匹配度最大的第一语句对应的幽默性参数进行比较，差值为0，说明用户语段的幽默程度最大。最小幽默性参数对应的第一语句“我肚子痛，拉肚子”为用户语段的非幽默含义。

(匹配度最大的第一语句对应的幽默性参数与最小幽默性参数的差值)与(最大幽默性参数与最小幽默性参数的差值)的比值＝1，作为用户语段的幽默程度，比值等于1，说明幽默程度最大。

识别的结果与事实相符，因为男人是绝对不可能怀孕的，所以幽默性非常强。

针对本实施例的第二个应用实例如下：

首先，接收用户语段，例如“我肚子痛是不是拉肚子”。

将用户语段“我肚子痛是不是拉肚子”作为谷歌搜索引擎的输入进行搜索，获得搜索列表，搜索列表是已经根据匹配度从大到小进行排序后的结果，筛选出搜索列表中前50条语句作为50条第一语句，该50条语句中含有输入语句的关键词，并对50条语句中的关键词进行颜色标记。

我肚子痛是不是怀孕了(搜索结果数量为6280000)。

我肚子痛，每个月月经过后就开始(搜索结果数量为2880000)。

我肚子痛，也胃痛(搜索结果数量为1960000)。

更年期肚子胀痛(搜索结果数量为1940000)。

我肚子痛，拉肚子(搜索结果数量为1380000)。

笑得我肚子痛(搜索结果数量为1170000)。

我肚子痛,想解大手(搜索结果数量为486000)。

我肚子痛，要上厕所大便(搜索结果数量为368000)。

获取输入语句的主语属性，当用户跟机器人说“我肚子痛是不是拉肚子”，这里的主语是“我”，所以主语属性是用户属性。机器人可以通过查询用户注册信息来获取用户属性，例如，男性。机器人也可以通过对话框方式向用户询问来获取用户属性，例如，用户在对话框中输入年轻男性，则获取的主语属性为年轻男性。机器人也可以通过“眼睛”即摄像头来识别用户属性，机器人也可以通过其他方式来获取用户属性。若获取的用户属性是“年轻男性”，将输入语句的主语属性“年轻男性”分别与上述9条第一语句合并获得9条合并语句，该9条合并语句分别与上述9条第一语句是一一对应的，9条合并语句如下：

我肚子痛是不是怀孕了+年轻男性。

我肚子痛，每个月月经过后就开始+年轻男性。

我肚子痛，也胃痛+年轻男性。

更年期肚子胀痛+年轻男性。

我肚子痛，拉肚子+年轻男性。

笑得我肚子痛+年轻男性。

我肚子痛,想解大手+年轻男性。

我肚子痛，要上厕所大便+年轻男性。

我肚子痛的很厉害，痛的冒汗，是不是肠胃炎+年轻男性。

将上述9条合并语句作为百度大数据搜索引擎的9次输入进行9次搜索，得到9条合并语句对应的搜索结果数量，9条合并语句以及合并语句对应的搜索结果数量如下。

我肚子痛是不是怀孕了+年轻男性(搜索结果数量为60700)。

我肚子痛，也胃痛+年轻男性(搜索结果数量为272000)。

更年期肚子胀痛+年轻男性(搜索结果数量为42200)。

我肚子痛，拉肚子+年轻男性(搜索结果数量为526000)。

笑得我肚子痛+年轻男性(搜索结果数量为129000)。

我肚子痛,想解大手+年轻男性(搜索结果数量为180000)。

我肚子痛，要上厕所大便+年轻男性(搜索结果数量为137000)。

我肚子痛是不是怀孕了(搜索结果数量为6280000)。

我肚子痛是不是怀孕了+年轻男性(搜索结果数量为60700)。

6280000/60700＝103.46。

我肚子痛，每个月月经过后就开始(搜索结果数量为2880000)。

2880000/80700＝35.69。

我肚子痛，也胃痛(搜索结果数量为1960000)。

我肚子痛，也胃痛+年轻男性(搜索结果数量为272000)。

1960000/272000＝7.21。

更年期肚子胀痛(搜索结果数量为1940000)。

更年期肚子胀痛+年轻男性(搜索结果数量为42200)。

1940000/42200＝45.97。

我肚子痛，拉肚子(搜索结果数量为1380000)。

我肚子痛，拉肚子+年轻男性(搜索结果数量为526000)。

1380000/526000＝1.90。

笑得我肚子痛(搜索结果数量为1170000)。

笑得我肚子痛+年轻男性(搜索结果数量为129000)。

1170000/129000＝9.07。

我肚子痛，想解大手(搜索结果数量为486000)。

我肚子痛，想解大手+年轻男性(搜索结果数量为180000)。

486000/180000＝2.7。

我肚子痛，要上厕所大便(搜索结果数量为368000)。

我肚子痛，要上厕所大便+年轻男性(搜索结果数量为137000)。

368000/137000＝2.69。

27100/9630＝2.81。

上述9条第一语句中与待识别语句“我肚子痛是不是拉肚子”匹配度最大的第一语句“我肚子痛，拉肚子”对应的幽默性参数，为1.90。

将最小幽默性参数与匹配度最大的第一语句“我肚子痛，拉肚子”对应的幽默性参数进行比较，差值为0，说明用户语段“我肚子痛是不是拉肚子”不幽默。

(匹配度最大的第一语句对应的幽默性参数与最小幽默性参数的差值)与(最大幽默性参数与最小幽默性参数的差值)的比值＝0，作为用户语段的幽默程度，比值等于0，则幽默程度为零。

识别的结果与事实相符，因为男人肚子痛，完全可能是因为拉肚子，所以没有幽默性。

针对本实施例的第三个应用实例如下：

首先，接收用户语段，例如“更年期肚子胀痛”。

将用户语段“更年期肚子胀痛”作为搜索引擎谷歌的输入进行搜索，获得搜索列表，搜索列表是已经根据匹配度从大到小进行排序后的结果，筛选出搜索列表中前50条语句作为50条第一语句，该50条语句中含有输入语句的关键词，并对50条语句中的关键词进行颜色标记。

我肚子痛是不是怀孕了(搜索结果数量为6280000)。

我肚子痛，每个月月经过后就开始(搜索结果数量为2880000)。

我肚子痛，也胃痛(搜索结果数量为1960000)。

更年期肚子胀痛(搜索结果数量为1940000)。

我肚子痛，拉肚子(搜索结果数量为1380000)。

笑得我肚子痛(搜索结果数量为1170000)。

我肚子痛,想解大手(搜索结果数量为486000)。

我肚子痛，要上厕所大便(搜索结果数量为368000)。

获取输入语句的主语属性，当用户跟机器人说“更年期肚子胀痛”，这里的主语是“我”，所以主语属性是用户属性。机器人可以通过查询用户注册信息来获取用户属性，例如，男性。机器人也可以通过对话框方式向用户询问来获取用户属性，例如，用户在对话框中输入年轻男性，则获取的主语属性为年轻男性。机器人也可以通过“眼睛”即摄像头来识别用户属性，机器人也可以通过其他方式来获取用户属性。若获取的用户属性是“年轻男性”，将输入语句的主语属性“年轻男性”分别与上述9条第一语句合并获得9条合并语句，该9条合并语句分别与上述9条第一语句是一一对应的，9条合并语句如下。

我肚子痛是不是怀孕了+年轻男性。

我肚子痛，每个月月经过后就开始+年轻男性。

我肚子痛，也胃痛+年轻男性。

更年期肚子胀痛+年轻男性。

我肚子痛，拉肚子+年轻男性。

笑得我肚子痛+年轻男性。

我肚子痛,想解大手+年轻男性。

我肚子痛，要上厕所大便+年轻男性。

我肚子痛的很厉害，痛的冒汗，是不是肠胃炎+年轻男性。

我肚子痛是不是怀孕了+年轻男性(搜索结果数量为60700)。

我肚子痛，也胃痛+年轻男性(搜索结果数量为272000)。

更年期肚子胀痛+年轻男性(搜索结果数量为42200)。

我肚子痛，拉肚子+年轻男性(搜索结果数量为526000)。

笑得我肚子痛+年轻男性(搜索结果数量为129000)。

我肚子痛,想解大手+年轻男性(搜索结果数量为180000)。

我肚子痛，要上厕所大便+年轻男性(搜索结果数量为137000)。

我肚子痛是不是怀孕了(搜索结果数量为6280000)。

我肚子痛是不是怀孕了+年轻男性(搜索结果数量为60700)。

6280000/60700＝103.46。

我肚子痛，每个月月经过后就开始(搜索结果数量为2880000)。

2880000/80700＝35.69。

我肚子痛，也胃痛(搜索结果数量为1960000)。

我肚子痛，也胃痛+年轻男性(搜索结果数量为272000)。

1960000/272000＝7.21。

更年期肚子胀痛(搜索结果数量为1940000)。

更年期肚子胀痛+年轻男性(搜索结果数量为42200)。

1940000/42200＝45.97。

我肚子痛，拉肚子(搜索结果数量为1380000)。

我肚子痛，拉肚子+年轻男性(搜索结果数量为526000)。

1380000/526000＝1.90。

笑得我肚子痛(搜索结果数量为1170000)。

笑得我肚子痛+年轻男性(搜索结果数量为129000)。

1170000/129000＝9.07。

我肚子痛，想解大手(搜索结果数量为486000)。

我肚子痛，想解大手+年轻男性(搜索结果数量为180000)。

486000/180000＝2.7。

我肚子痛，要上厕所大便(搜索结果数量为368000)。

我肚子痛，要上厕所大便+年轻男性(搜索结果数量为137000)。

368000/137000＝2.69。

27100/9630＝2.81。

上述9条第一语句中与待识别语句“更年期肚子胀痛”匹配度最大的第一语句“更年期肚子胀痛+年轻男性”对应的幽默性参数，为45.97。

最小幽默性参数对应的第一语句“我肚子痛，拉肚子”为用户语段“更年期肚子胀痛”的非幽默含义。

(匹配度最大的第一语句对应的幽默性参数与最小幽默性参数的差值)与(最大幽默性参数与最小幽默性参数的差值)的比值＝(45.97-1.90)/(103.46-1.90)约为0.43,作为用户语段的幽默程度，比值越接近1，则幽默程度越大，比值越接近0，则幽默程度越小，可见，用户语段具有一定的幽默性。

识别的结果与事实相符，因为男人也有更年期，肚子会胀痛。但对年轻男人来说又与事实不符，因为年轻男人不可能有更年期。因此这句待识别的话具有一定的幽默性，但幽默性又比“我肚子痛是不是怀孕了”要低，因为男人是绝对不可能怀孕的，所以幽默性更强。

实施例4：

本实施例的机器人可以向外输出幽默程度，因此该机器人不采取情感表达的方式，其与实施例1的区别之处在于直接将步骤S102识别得到的幽默程度应用到步骤S108的准确度判断中，不需要经过步骤S103～S106的处理，其余同实施例1、2或3。

实施例5：

如图8所示，本实施例提供了一种基于幽默识别的情感交互机器人系统，该系统包括机器人801和幽默检验装置802，所述机器人801包括用户语段获取模块8011、幽默程度识别模块8012、情感程度计算模块8013和情感表达模块8014，所述幽默检验装置802包括情感程度获取模块8021、幽默程度计算模块8022、真实幽默程度获取模块8023和准确度判断模块8024；

所述机器人801中各个模块的具体功能如下：

所述用户语段获取模块8011，用于获取用户的输入语段，作为用户语段；

所述幽默程度识别模块8012，用于对用户语段进行识别，得到用户语段的幽默程度，可以通过现有幽默识别方法识别用户输入的语段；

所述情感程度计算模块8013，用于根据用户语段的幽默程度，计算需要反馈的情感程度；

所述情感表达模块8014，用于根据需要反馈的情感程度，通过情感计算表达情感；

所述幽默检验装置802中各个模块的具体功能如下：

所述情感程度获取模块8021，用于通过对机器人表达的情感进行情感识别，获取机器人反馈的情感程度；

所述幽默程度计算模块8022，用于根据情感识别的结果中机器人反馈的情感程度，计算机器人识别得到的幽默程度。

所述真实幽默程度获取模块8023，用于获取用户语段的真实幽默程度；

所述准确度判断模块8024，用于通过比较机器人识别得到的幽默程度和用户语段的真实幽默程度的差异，判断机器人幽默识别的准确度。

实施例6：

本实施例的其它模块同实施例5，区别之处在于幽默程度识别模块802的实现，如图9所示，所述幽默程度识别模块8012包括第一属性数据获取单元80121、小数据集合获取单元80122、大数据获取单元80123、相关度计算单元80124、相关差异度计算单元80125和第一幽默程度获取单元80126，各个单元的具体功能如下：

所述第一属性数据获取单元80121，用于获取用户语段的属性数据；

所述小数据集合获取单元80122，用于从用户语段的属性数据中提取各部分数据作为各个小数据，存入小数据集合；

所述大数据获取单元80123，用于获取大数据；

所述相关度计算单元80124，用于计算小数据集合的每个小数据与用户语段的相关度，该相关度计算单元80124如图10所示，包括：

第一统计子单元801241，用于统计用户语段在大数据中相似数据的数量，作为第一数量；

第二统计子单元801242，用于统计小数据集合中每个小数据在大数据中相似数据的数量，作为该个小数据的第二数量；

第三统计子单元801243，用于统计该个小数据与用户语段进行合并后得到的数据在大数据中相似数据的数量，作为该个小数据的第三数量；

相关度计算子单元801244，用于根据第一数量、该个小数据的第二数量和第三数量，得到该个小数据与用户语段的相关度，具体计算可参见实施例2；

所述相关差异度计算单元80125，用于根据小数据集合中各个小数据与用户语段的相关度，计算小数据集合中各个小数据与用户语段的相关差异度，该相关差异度计算单元80125如图11所示，包括：

相关度平均值计算子单元801251，用于计算各个小数据与用户语段的相关度的平均值；

相关差异度计算子单元801252，用于根据各个小数据与用户语段的相关度、各个小数据与用户语段的相关度的平均值以及小数据集合中小数据的份数，计算小数据集合中各个小数据与用户语段的相关差异度，具体计算可参见实施例2。

所述第一幽默程度获取单元80126，用于将小数据集合中各个小数据与用户语段的相关差异度输入神经网络或深度神经网络，得到用户语段的幽默程度。

实施例7：

本实施例的其它模块同实施例5，区别之处在于幽默程度识别模块8012的实现，如图12所示，所述幽默程度识别模块802包括搜索单元80121、筛选单元80122、第二属性数据获取单元80123、合并单元80124、幽默性参数计算单元80125和第二幽默程度获取单元80126，各个单元的具体功能如下：

所述搜索单元80121，用于根据用户语段进行搜索，获得搜索结果；

所述筛选单元80122，用于筛选搜索结果中与用户语段匹配度从大到小的前m条语句分别作为m条第一语句；其中，m为正整数；

所述第二属性数据获取单元80123，用于获取用户语段的属性数据，该第二属性数据获取单元80123如图13所示，包括：

第一属性数据获取子单元801231，用于当用户语段没有主语或其主语为第一人称时，通过用户注册信息或对话框中的属性输入获取用户语段的属性数据；

第二属性数据获取子单元801232，用于当用户语段的主语为第二人称时，通过机器人注册信息或对话框中的属性输入获取用户语段的属性数据；

第三属性数据获取子单元801233，用于当用户语段的主语为第三人称时，通过对话框中的属性输入或将用户语段的主语作为电子词典或搜索引擎的输入进行搜索，获取用户语段的属性数据；

所述合并单元80124，用于将属性数据分别与每条第一语句进行合并，得到分别与第一语句对应的m条合并语句；

所述幽默性参数计算单元80125，用于分别根据每条第一语句以及与每条第一语句对应的合并语句，计算每条第一语句的幽默性参数，该述幽默性参数计算单元8025如图14所示，包括：

第一搜索结果数量获取子单元801251，用于分别根据每条第一语句进行搜索，获得搜索结果数量作为第一语句的搜索结果数量。

第一搜索结果数量获取子单元801252，用于分别根据每条合并语句进行搜索，获得搜索结果数量作为合并语句的搜索结果数量。

幽默性参数获取子单元801253，用于分别计算每条第一语句的搜索结果数量和与每条第一语句对应的合并语句的搜索结果数量的比值，以获得每条第一语句的幽默性参数。

所述第二幽默程度获取单元80126，用于根据最小幽默性参数与匹配度最大的第一语句对应的幽默性参数之间的差值，得到用户语段的幽默程度。

实施例8：

本实施例的机器人可以向外输出幽默程度，因此该机器人不采取情感表达的方式，其与实施例5的区别之处在于直接将幽默程度识别模块8012识别得到的幽默程度应用到准确度判断模块8024中，不需要情感程度计算模块8013、情感表达模块8014、情感程度获取模块8021、幽默程度计算模块8022这几个模块也可以实现，其余同实施例5、6或7。

在此需要说明的是，上述各实施例提供的机器人系统仅以上述各功能模块的划分进行举例说明，在实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。

可以理解，上述各实施例的机器人系统所使用的术语“第一”、“第二”等可用于描述各种单元，但这些单元不受这些术语限制。这些术语仅用于将第一个单元与另一个单元区分。举例来说，在不脱离本发明的范围的情况下，可以将第一幽默程度获取单元称为第二幽默程度获取单元，且类似地，可将第二幽默程度获取单元称为第一幽默程度获取单元，第一幽默程度获取单元和第二幽默程度获取单元两者都是幽默程度获取单元，但其不是同一幽默程度获取单元，同理，第一属性数据获取单元和第二属性数据获取单元也一样。

以上所述，仅为本发明专利优选的实施例，但本发明专利的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明专利所公开的范围内，根据本发明专利的技术方案及其发明构思加以等同替换或改变，都属于本发明专利的保护范围。

Claims

1.基于幽默识别的情感交互方法，其特征在于：所述方法通过机器人和幽默检验装置实现，包括：

机器人获取用户的输入语段，作为用户语段；

机器人对用户语段进行识别，得到用户语段的幽默程度；

幽默检验装置获取用户语段的真实幽默程度；

2.根据权利要求1所述的基于幽默识别的情感交互方法，其特征在于：所述方法在幽默检验装置获取用户语段的真实幽默程度之前，还包括：

机器人根据需要反馈的情感程度，通过情感计算表达情感；

3.根据权利要求1或2所述的基于幽默识别的情感交互方法，其特征在于：所述机器人对用户语段进行识别，得到用户语段的幽默程度，具体包括：

获取用户语段的属性数据；

获取大数据；

计算小数据集合的每个小数据与用户语段的相关度；

4.根据权利要求3所述的基于幽默识别的情感交互方法，其特征在于：

所述计算小数据集合的每个小数据与用户语段的相关度，具体包括：

统计用户语段在大数据中相似数据的数量，作为第一数量；

根据第一数量、该个小数据的第二数量和第三数量，得到该个小数据与用户语段的相关度；

计算各个小数据与用户语段的相关度的平均值；

根据各个小数据与用户语段的相关度、各个小数据与用户语段的相关度的平均值以及小数据集合中小数据的份数，计算小数据集合中各个小数据与用户语段的相关差异度。

5.根据权利要求1或2所述的基于幽默识别的情感交互方法，其特征在于：所述机器人对用户语段进行识别，得到用户语段的幽默程度，具体包括：

根据用户语段进行搜索，获得搜索结果；

获取用户语段的属性数据；

6.基于幽默识别的情感交互机器人系统，其特征在于：所述系统包括机器人和幽默检验装置；

所述机器人包括：

幽默程度识别模块，用于对用户语段进行识别，得到用户语段的幽默程度；

所述幽默检验装置包括：

真实幽默程度获取模块，用于获取用户语段的真实幽默程度；

准确度判断模块，用于通过比较机器人识别得到的幽默程度和用户语段的真实幽默程度的差异，判断机器人幽默识别的准确度。

7.根据权利要求6所述的基于幽默识别的情感交互机器人系统，其特征在于：

所述机器人还包括：

所述幽默检验装置还包括：

情感程度获取模块，用于通过对机器人表达的情感进行情感识别，获取反馈的情感程度；

幽默程度计算模块，用于根据情感识别的结果中机器人反馈的情感程度，计算机器人识别得到的幽默程度。

8.根据权利要求6或7所述的基于幽默识别的情感交互机器人系统，其特征在于：所述幽默程度识别模块，具体包括：

第一属性数据获取单元，用于获取用户语段的属性数据；

大数据获取单元，用于获取大数据；

9.根据权利要求8所述的基于幽默识别的情感交互机器人系统，其特征在于：

所述相关度计算单元，具体包括：

相关度计算子单元，用于根据第一数量、该个小数据的第二数量和第三数量，得到该个小数据与用户语段的相关度；

所述相关差异度计算单元，具体包括：

相关差异度计算子单元，用于根据各个小数据与用户语段的相关度、各个小数据与用户语段的相关度的平均值以及小数据集合中小数据的份数，计算小数据集合中各个小数据与用户语段的相关差异度。

10.根据权利要求6或7所述的基于幽默识别的情感交互机器人系统，其特征在于：所述幽默程度识别模块，具体包括：

搜索单元，用于根据用户语段进行搜索，获得搜索结果；

第二属性数据获取单元，用于获取用户语段的属性数据；