CN111553171B

CN111553171B - 语料处理方法、装置及存储介质

Info

Publication number: CN111553171B
Application number: CN202010274262.2A
Authority: CN
Inventors: 崔志; 肖克聪; 赵群
Original assignee: Beijing Xiaomi Pinecone Electronic Co Ltd
Current assignee: Beijing Xiaomi Pinecone Electronic Co Ltd
Priority date: 2020-04-09
Filing date: 2020-04-09
Publication date: 2024-02-06
Anticipated expiration: 2040-04-09
Also published as: US11475069B2; US20210319069A1; EP3893143A1; CN111553171A

Abstract

本公开是关于一种语料处理方法、装置及存储介质。语料处理方法包括：获取用户输入的信息；根据所述信息，从多个候选语料中检索与所述信息匹配的回复信息，所述多个候选语料为清除负面情感语料后得到的候选语料；发送与所述信息匹配的回复信息。通过本公开，使得开放域聊天机器人可根据用户输入的信息，输出正面、积极的回复信息，提升开放域聊天机器人与用户交流的紧密度，提升用户体验。

Description

语料处理方法、装置及存储介质

技术领域

本公开涉及人工智能领域，尤其涉及语料处理方法、装置及存储介质。

背景技术

人工智能(Artificial Intelligence，AI)是目前研究和开发用于模拟、延伸以及扩展人类智能的一门新兴科学技术。其中，AI的主要研究目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作，比如时下出现的聊天机器人便是对AI技术的一个实际应用。

目前，针对开放域对话系统，开放域聊天机器人已成为重要的人机交互产品，但是在开放域对话中，开放域聊天机器人需要利用大量的候选语料用于回复。同时，如果开放域聊天机器人回复一些负面情感的回复，如抑郁、愤怒等情绪，会对用户造成严重的困扰，更有甚者会导致用户也染上同样的负面情绪。

故，如何提高开放域聊天机器人候选语料的质量，以树立正面、积极的开放域聊天机器人成为了时下本领域技术人员亟待解决的一个技术问题。

发明内容

为克服相关技术中存在的问题，本公开提供一种语料处理方法、装置及存储介质。根据本公开实施例的第一方面，提供一种语料处理方法，语料处理方法包括：获取用户输入的信息；根据信息，从多个候选语料中检索与信息匹配的回复信息，多个候选语料为清除负面情感语料后得到的候选语料；发送与信息匹配的回复信息。

在一示例中，语料处理方法还包括：获取候选语料集；调用情感识别模型，情感识别模型根据输入的语料，输出语料的情感分数；将候选语料集中的候选语料输入情感识别模型，并依据情感识别模型的输出，以及预设的负面情感分数阈值，确定候选语料集中包含的负面情感候选语料；清除负面情感候选语料，得到多个候选语料。

在一示例中，语料处理方法还包括：获取训练集，训练集中包括多个负面情感训练语料，和多个正面情感训练语料；将多个负面情感训练语料和多个正面情感训练语料输入情感识别模型，通过情感识别模型输出训练语料的情感分数；基于训练语料的情感分数以及损失函数调整情感识别模型的参数，得到满足损失值的情感识别模型。

在一示例中，语料处理方法还包括：获取验证集，验证集中包括多个负面情感验证语料，和多个正面情感验证语料；将多个负面情感验证语料和多个正面情感验证语料输入训练好的情感识别模型，通过训练好的情感识别模型输出验证语料的情感分数；根据输出的验证语料的情感分数，确定负面情感分数阈值。

在一示例中，语料处理方法还包括：以预设的时间间隔为单位，获取更新后的候选语料集，依据情感识别模型的输出，确定更新后的候选语料集中包含的负面情感候选语料，并清除更新后的候选语料集中包含的负面情感候选语料。

根据本公开实施例的第二方面，提供一种语料处理装置，语料处理装置包括：获取单元，被配置为获取用户输入的信息；匹配单元，被配置为根据信息，从多个候选语料中检索与信息匹配的回复信息，多个候选语料为清除负面情感语料后得到的候选语料；发送单元，被配置为发送与信息匹配的回复信息。

在一示例中，语料处理装置还包括：处理单元，被配置为通过如下方式清除负面情感语料，得到多个候选语料：获取候选语料集；调用情感识别模型，情感识别模型根据输入的语料，输出语料的情感分数；将候选语料集中的候选语料输入情感识别模型，并依据情感识别模型的输出，以及预设的负面情感分数阈值，确定候选语料集中包含的负面情感候选语料；清除负面情感候选语料，得到多个候选语料。

在一示例中，语料处理装置还包括：训练单元，被配置为通过如下方式训练情感识别模型：获取训练集，训练集中包括多个负面情感训练语料，和多个正面情感训练语料；将多个负面情感训练语料和多个正面情感训练语料输入情感识别模型，通过情感识别模型输出训练语料的情感分数；基于训练语料的情感分数以及损失函数调整情感识别模型的参数，得到满足损失值的情感识别模型。

在一示例中，语料处理装置还包括：验证单元，被配置为获取验证集，验证集中包括多个负面情感验证语料，和多个正面情感验证语料；将多个负面情感验证语料和多个正面情感验证语料输入训练好的情感识别模型，通过训练好的情感识别模型输出验证语料的情感分数；根据输出的验证语料的情感分数，确定负面情感分数阈值。

在一示例中，语料处理装置还包括：处理单元，被配置为以预设的时间间隔为单位，获取更新后的候选语料集，依据情感识别模型的输出，确定更新后的候选语料集中包含的负面情感候选语料，并清除更新后的候选语料集中包含的负面情感候选语料。

根据本公开的第三方面，提供了一种语料处理装置，语料处理装置包括：存储器，配置用于存储指令。以及处理器，配置用于调用指令执行前述第一方面或者第一方面中任意一示例中的语料处理方法。

根据本公开的第四方面，提供了一种非临时性计算机可读存储介质，非临时性计算机可读存储介质存储有计算机可执行指令，计算机可执行指令在由处理器执行时，执行前述第一方面或者第一方面中任意一示例中的语料处理方法。

本公开的实施例提供的技术方案可以包括以下有益效果：针对开放域聊天机器人，通过对开放域聊天机器人中的负面候选语料执行清除操作，使得开放域聊天机器人可根据用户输入的信息，输出正面、积极的回复信息，提升开放域聊天机器人与用户交流的紧密度，提升用户体验。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的一种语料处理方法的流程图。

图2是根据一示例性实施例示出的一种训练情感识别模型的流程图。

图3是根据一示例性实施例示出的一种语料处理装置的框图。

图4是根据一示例性实施例示出的一种装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

本公开的示例性实施例可应用于针对开放域对话系统中，需要对用户输入的信息回复的场景。在该场景下，开放域对话系统例如可以包括用户终端和人机对话系统。其中，用户终端包括但不限于：智能手机、平板电脑、笔记本电脑、台式电脑、电子书阅读器等固定式或移动式电子设备，人机对话系统为服务器，比如具体形式可为开放域聊天机器人。用户通过在持有的终端上进行对话输入，发起向开放域聊天机器人的对话。而开放域聊天机器人在接收到用户发起的对话后，在候选语料中检索出与发起的对话相匹配的最佳回复内容，并反馈给用户。

图1是根据一示例性实施例示出的一种语料处理方法的流程图，如图1所示，语料处理方法，应用于开放域聊天机器人，包括以下步骤。

在步骤S11中，获取用户输入的信息。

本公开中，用户可基于终端中安装的用于进行人机对话的应用，与开放域聊天机器人进行对话。本公开中，获取的用户输入的信息可以是文字信息，也可以是语音信息。

在步骤S12中，根据用户输入的信息，从多个候选语料中检索与信息匹配的回复信息，多个候选语料为清除负面情感语料后得到的候选语料。

由于开放域对话中，用户可以发起的对话可以涉及多个领域或多个场景，而不是局限于某个特定的领域或场景的对话。例如，用户发起的对话可以涉及家庭陪护、儿童、医疗、教育、政务机关、银行、酒店、餐饮、旅游景区等众多领域。故，在开放域聊天机器人中，会包括巨量的候选语料，且巨量的候选语料中会存在大量的表征负面情绪的语料。例如语料中包括自杀、抑郁、愤怒等负面情绪语料。若使用负面情绪语料回复用户，会对用户造成严重的困扰，甚至会影响用户的情绪。故本公开中，利用开放域聊天机器人中的候选语料回复用户之前，对多个候选语料进行负面情感语料的筛查，并对筛出的负面情感语料进行清除。

本公开中，例如可通过如下方式清除负面情感语料，得到多个候选语料：

获取候选语料集，调用情感识别模型，情感识别模型根据输入的语料，输出语料的情感分数。将候选语料集中的候选语料输入情感识别模型，并依据情感识别模型的输出，以及预设的负面情感分数阈值，确定候选语料集中包含的负面情感候选语料。清除负面情感候选语料，得到多个候选语料。

其中，负面情感分数阈值可以是表征负面情感分数范围的值。例如候选语料输入情感识别模型后，由情感识别模型输出候选语料的情感分数为0.2分，预设的负面情感分数阈值为0.3分，表明候选语料为负面情感候选语料，对负面情感候选语料执行清除操作。

另外，随着开放域聊天机器人的运行，以及逐渐新增的候选语料，可对开放域聊天机器人中的更新后的候选语料进行负面情感识别，以及对识别到的负面情感语料执行清除操作。

例如，可以以预设的时间间隔为单位，获取更新后的候选语料集，依据情感识别模型的输出，确定更新后的候选语料集中包含的负面情感候选语料，并清除更新后的候选语料集中包含的负面情感候选语料。

在步骤S13中，发送与信息匹配的回复信息。

在本公开的示例性实施例中，针对开放域聊天机器人，通过对开放域聊天机器人中的负面候选语料执行清除操作，使得开放域聊天机器人可根据用户输入的信息，输出正面、积极的回复信息，提升开放域聊天机器人与用户交流的紧密度，提升用户体验。

本公开中，利用情感识别模型和预设的负面情感分数阈值得到负面情感语料之前，还可以包括预先训练情感识别模型。

图2是根据一示例性实施例示出的训练情感识别模型的流程图，如图2所示，训练情感识别模型，包括以下步骤。

在步骤S21中，获取训练集，训练集中包括多个负面情感训练语料，和多个正面情感训练语料。

其中，负面情感训练语料例如可包括“我想自杀”“我想跳楼”“我气得要死”等偏负面情感的训练语料。正面情感训练语料例如可包括“我很快乐”“我很开心”“我很幸福”等偏正面情感的训练语料。

本公开可对偏负面情感的训练语料和偏正面情感的训练语料分别进行标记，例如对偏负面情感训练语料标记为D-，分数记为0，对偏正面情感训练语料标记为D+，分数记为1。

在步骤S22中，将多个负面情感训练语料和多个正面情感训练语料输入情感识别模型，通过情感识别模型输出训练语料的情感分数。

本公开中，情感识别模型例如可以是利用卷积神经网络(Convolutional NeuralNetworks，CNN)，递归神经网络(Recurrent Neural Network，RNN)，或Bert模型训练得到。

本公开中，将包括多个负面情感训练语料，和多个正面情感训练语料输入情感识别模型，通过情感识别模型输出训练语料的情感分数。

在步骤S23中，基于训练语料的情感分数以及损失函数调整情感识别模型的参数，得到满足损失值的情感识别模型。

目前，针对语料中负面情感语料主要是通过人工标注的方式进行识别，识别效率低下。尤其针对开放域聊天机器人，面对海量级别的语料，通过人工标注的方式识别语料中的负面情感语料将不可实现。

故，本公开为了提升识别负面情感语料的效率，以及节省人力成本，可通过情感识别模型识别负面情感语料，进而提升识别负面情感语料的效率，以及节省人力成本。

本公开中，将包括多个负面情感训练语料，和多个正面情感训练语料输入情感识别模型，通过感识别模型得到训练语料的情感预测分数。如果情感识别模型给出的分数越趋近于1则代表语料为正面情感训练语料，如果情感识别模型给出的分数趋近趋近于0则代表语料为负面情感训练语料。根据损失函数计算预测分数与训练语料对应的标识之间的误差，调整入情感识别模型的参数，直到通过损失函数计算出的误差低于预设的阈值，得到满足损失值的情感识别模型。

其中，损失函数可以是分类损失函数，例如交叉熵损失函数。

另外，为了保证负面情感语料识别的覆盖率与准确率，本公开在得到训练好的情感识别模型之后，可基于训练好的情感识别模型验证语料中的负面情感语料。

验证语料中的负面情感语料，例如可采用如下方式进行：

获取验证集，验证集中包括多个负面情感验证语料，和多个正面情感验证语料。

将多个负面情感验证语料和多个正面情感验证语料输入训练好的情感识别模型，通过训练好的情感识别模型输出验证语料的情感分数，根据输出的覆盖所有负面情感验证语料的情感分数，确定为负面情感分数阈值。

在本公开的示例性实施例中，通过训练得到情感识别模型，基于训练得到的情感识别模型对候选语料中包括的负面情感语料进行识别，进而根据识别得到的结果，对候选语料中包括的负面情感语料进行清除，保证开放域聊天机器人输出积极、正面的回复信息，提升开放域聊天机器人与用户交流的紧密度，并且利用情感识别模型识别语料中的负面情感语料，提升识别效率。

基于相同的发明构思，本公开还提供一种语料处理装置。

可以理解的是，本公开实施例提供的应用控制装置为了实现上述功能，其包含了执行各个功能相应的硬件结构和/或软件模块。结合本公开实施例中所公开的各示例的单元及算法步骤，本公开实施例能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同的方法来实现所描述的功能，但是这种实现不应认为超出本公开实施例的技术方案的范围。

图3是根据一示例性实施例示出的一种语料处理装置框图。参照图3，语料处理装置包括获取单元101、匹配单元102和发送单元103。

其中，获取单元101，被配置为获取用户输入的信息；匹配单元102，被配置为根据信息，从多个候选语料中检索与信息匹配的回复信息，多个候选语料为清除负面情感语料后得到的候选语料；发送单元103，被配置为发送与信息匹配的回复信息。

在一示例中，语料处理装置还包括：处理单元104，被配置为通过如下方式清除负面情感语料，得到多个候选语料：获取候选语料集；调用情感识别模型，情感识别模型根据输入的语料，输出语料的情感分数；将候选语料集中的候选语料输入情感识别模型，并依据情感识别模型的输出，以及预设的负面情感分数阈值，确定候选语料集中包含的负面情感候选语料；清除负面情感候选语料，得到多个候选语料。

在一示例中，语料处理装置还包括：训练单元105，被配置为通过如下方式训练情感识别模型：获取训练集，训练集中包括多个负面情感训练语料，和多个正面情感训练语料；将多个负面情感训练语料和多个正面情感训练语料输入情感识别模型，通过情感识别模型输出训练语料的情感分数；基于训练语料的情感分数以及损失函数调整情感识别模型的参数，得到满足损失值的情感识别模型。

在一示例中，语料处理装置还包括：验证单元106，被配置为获取验证集，验证集中包括多个负面情感验证语料，和多个正面情感验证语料；将多个负面情感验证语料和多个正面情感验证语料输入训练好的情感识别模型，通过训练好的情感识别模型输出验证语料的情感分数；根据输出的验证语料的情感分数，确定负面情感分数阈值。

在一示例中，语料处理装置还包括：处理单元104，被配置为以预设的时间间隔为单位，获取更新后的候选语料集，依据情感识别模型的输出，确定更新后的候选语料集中包含的负面情感候选语料，并清除更新后的候选语料集中包含的负面情感候选语料。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图4是根据一示例性实施例示出的一种用于语料处理的装置400的框图。例如，装置400可以被提供为一服务器。参照图4，装置400包括处理组件422，其进一步包括一个或多个处理器，以及由存储器432所代表的存储器资源，用于存储可由处理组件422的执行的指令，例如应用程序。存储器432中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件422被配置为执行指令，以执行上述语料处理方法。

装置400还可以包括一个电源组件426被配置为执行装置400的电源管理，一个有线或无线网络接口440被配置为将装置400连接到网络，和一个输入输出(I/O)接口448。装置400可以操作基于存储在存储器432的操作系统，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM或类似。

进一步可以理解的是，本公开中“多个”是指两个或两个以上，其它量词与之类似。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。

进一步可以理解的是，术语“第一”、“第二”等用于描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开，并不表示特定的顺序或者重要程度。实际上，“第一”、“第二”等表述完全可以互换使用。例如，在不脱离本公开范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。

进一步可以理解的是，本公开实施例中尽管在附图中以特定的顺序描述操作，但是不应将其理解为要求按照所示的特定顺序或是串行顺序来执行这些操作，或是要求执行全部所示的操作以得到期望的结果。在特定环境中，多任务和并行处理可能是有利的。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种语料处理方法，其特征在于，应用于开放域聊天机器人，包括：

获取用户输入的信息；

根据所述信息，从多个候选语料中检索与所述信息匹配的回复信息，所述多个候选语料为清除负面情感语料后得到的候选语料；

发送与所述信息匹配的回复信息；

其中，所述候选语料采用如下方式得到：

获取候选语料集；

调用情感识别模型，所述情感识别模型根据输入的语料，输出语料的情感分数；

将所述候选语料集中的候选语料输入情感识别模型，并依据所述情感识别模型的输出，以及预设的负面情感分数阈值，确定所述候选语料集中包含的负面情感候选语料；

清除所述负面情感候选语料，得到多个候选语料。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取训练集，所述训练集中包括多个负面情感训练语料，和多个正面情感训练语料；

将多个负面情感训练语料和多个正面情感训练语料输入情感识别模型，通过所述情感识别模型输出训练语料的情感分数；

基于训练语料的情感分数以及损失函数调整所述情感识别模型的参数，得到满足损失值的所述情感识别模型。

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

获取验证集，所述验证集中包括多个负面情感验证语料，和多个正面情感验证语料；

将多个负面情感验证语料和多个正面情感验证语料输入训练好的所述情感识别模型，通过训练好的所述情感识别模型输出所述验证语料的情感分数；

根据输出的所述验证语料的情感分数，确定负面情感分数阈值。

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

以预设的时间间隔为单位，获取更新后的候选语料集，依据所述情感识别模型的输出，确定所述更新后的候选语料集中包含的负面情感候选语料，并清除所述更新后的候选语料集中包含的负面情感候选语料。

5.一种语料处理装置，其特征在于，包括：

获取单元，被配置为获取用户输入的信息；

匹配单元，被配置为根据所述信息，从多个候选语料中检索与所述信息匹配的回复信息，所述多个候选语料为清除负面情感语料后得到的候选语料；

发送单元，被配置为发送与所述信息匹配的回复信息；

其中，所述候选语料采用如下方式得到：

获取候选语料集；

清除所述负面情感候选语料，得到多个候选语料。

6.根据权利要求5所述的装置，其特征在于，所述装置还包括：

训练单元，被配置为通过如下方式训练所述情感识别模型：

7.根据权利要求6所述的装置，其特征在于，所述装置还包括：

验证单元，被配置为获取验证集，所述验证集中包括多个负面情感验证语料，和多个正面情感验证语料；

8.根据权利要求6所述的装置，其特征在于，所述装置还包括：

所述处理单元，被配置为以预设的时间间隔为单位，获取更新后的候选语料集，依据所述情感识别模型的输出，确定所述更新后的候选语料集中包含的负面情感候选语料，并清除所述更新后的候选语料集中包含的负面情感候选语料。

9.一种语料处理装置，其特征在于，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：执行权利要求1-4中任一项所述的语料处理方法。

10.一种非临时性计算机可读存储介质，其特征在于，所述非临时性计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令在由处理器执行时，执行权利要求1-4中任意一项所述的语料处理方法。