CN112069781A

CN112069781A - 一种评语生成方法、装置、终端设备及存储介质

Info

Publication number: CN112069781A
Application number: CN202010878324.0A
Authority: CN
Inventors: 吴智东
Original assignee: Guangzhou Shiyuan Electronics Thecnology Co Ltd
Current assignee: Guangzhou Shiyuan Electronics Thecnology Co Ltd
Priority date: 2020-08-27
Filing date: 2020-08-27
Publication date: 2020-12-11
Anticipated expiration: 2040-08-27
Also published as: CN112069781B

Abstract

本发明公开了一种评语生成方法、装置、终端设备及存储介质。方法包括：获取待处理行为文本信息和用户输入的场景关键词；将所述待处理行为文本信息和所述场景关键词输入评语生成模型，得到与所述待处理行为文本信息和所述场景关键词对应的评语，其中，所述评语生成模型的模型结构和模型参数是分别根据场景关键词对应的行为文本信息和样本评语训练而确定的。利用该方法能够自主地选择生成不同场景下的评语。

Description

一种评语生成方法、装置、终端设备及存储介质

技术领域

本发明实施例涉及计算机技术领域，尤其涉及一种评语生成方法、装置、终端设备及存储介质。

背景技术

文本生成技术，是自然语言处理领域的一个重要的研究方向。它旨在通过规则和/或算法生成出一段符合人类语言规律且没有句法语法错误的句子。在教育行业，文本生成的应用场景也非常多。如学生在考完试后，老师可以对不同学生，写一段考试评价；学生在提交完作业后，老师可以针对学生作业完成情况，写一段作业评价；学生在上完一节课，或者一天的课后，老师可以对学生的课上表现情况，写一段课堂评价；一个学期结束，教师需要根据每个学生的这个学期的表现，写出一段关于学生表现的一些总结性的评语等。

在关于学生评语生成领域，现有比较成熟的解决方式是，将输入的学生文本信息，与人工构造的评语模板进行相似度计算，选取最相似的模板来生成评语。

上述方法不能自主地控制应该要生成什么场景下的学生评语文本。

发明内容

本发明实施例提供了一种评语生成方法、装置、终端设备及存储介质，能够自主地选择生成不同场景下的评语。

第一方面，本发明实施例提供了一种评语生成方法，包括：

获取待处理行为文本信息和用户输入的场景关键词；

将所述待处理行为文本信息和所述场景关键词输入评语生成模型，得到与所述待处理行为文本信息和所述场景关键词对应的评语，其中，所述评语生成模型的模型结构和模型参数是分别根据场景关键词对应的行为文本信息和样本评语训练而确定的。

进一步的，在将所述待处理行为文本信息和所述场景关键词输入评语生成模型，得到与所述待处理行为文本信息和所述场景关键词对应的评语，其中，所述评语生成模型的模型结构和模型参数是分别根据场景关键词对应的行为文本信息和样本评语训练而确定的之前，还包括：

将所述场景关键词和原始行为文本信息输入行为文本选择模型中，得到与所述场景关键词对应的行为文本信息，其中，所述行为文本选择模型的模型结构和模型参数分别根据样本场景关键词、原始行为文本信息和样本场景关键词对应的行为文本信息进行训练而确定的；

爬取预设类型网站上的评语数据；

将与所述场景关键词对应的行为文本信息的相似度大于预设阈值的评语数据作为样本评语。

进一步的，所述行为文本选择模型的训练方法，包括：

获取样本场景关键词、原始行为文本信息和样本场景关键词对应的行为文本信息；

将所述样本场景关键词和原始行为文本信息输入至待训练的行为文本选择模型中，得到预测场景关键词对应的行为文本信息；

根据所述样本场景关键词对应的行为文本信息和预测场景关键词对应的行为文本信息形成的第一目标函数训练所述待训练的行为文本选择模型的模型结构和模型参数；

返回执行将所述样本场景关键词和原始行为文本信息输入至待训练的行为文本选择模型中，得到预测场景关键词对应的行为文本信息的操作，直至得到行为文本选择模型。

进一步的，所述评语生成模型的训练方法，包括：

将所述场景关键词对应的行为文本信息输入至待训练的评语生成模型中，得到预测评语；

根据所述预测评语和所述样本评语形成的第二目标函数训练所述待训练的评语生成模型的模型结构和模型参数；

返回执行将所述场景关键词对应的行为文本信息输入至待训练的评语生成模型中，得到预测评语的操作，直至得到评语生成模型。

进一步的，所述获取原始行为文本信息包括：

获取学生日常行为数据，其中，所述学生日常行为数据包括：课堂表现、形象表现、情绪表现、社交表现、学业表现、成绩表现以及作业表现中的至少一种；

将所述学生日常行为数据中非文本格式的数据转换为文本格式后，得到原始行为文本信息。

进一步的，爬取预设类型网站上的评语数据之后，还包括：

对所述评语数据添加场景类型标签；

选取包含所述场景关键词的场景类型标签对应的目标评语数据。

进一步的，将与所述场景关键词对应的行为文本信息的相似度大于预设阈值的评语数据作为样本评语包括：

将与所述场景关键词对应的行为文本信息的相似度大于设定阈值的目标评语数据作为所述场景关键词对应的行为文本信息对应的样本评语。

第二方面，本发明实施例还提供了一种评语生成装置，包括：

获取模块，用于获取待处理行为文本信息和用户输入的场景关键词；

生成模块，用于将所述待处理行为文本信息和所述场景关键词输入评语生成模型，得到与所述待处理行为文本信息和所述场景关键词对应的评语，其中，所述评语生成模型的模型结构和模型参数是分别根据场景关键词对应的行为文本信息和样本评语训练而确定的。

进一步的，还包括：

信息获取模块，用于将所述场景关键词和原始行为文本信息输入行为文本选择模型中，得到与所述场景关键词对应的行为文本信息，其中，所述行为文本选择模型的模型结构和模型参数分别根据样本场景关键词、原始行为文本信息和样本场景关键词对应的行为文本信息进行训练而确定的；

爬取模块，用于爬取预设类型网站上的评语数据；

选取模块，用于将与所述场景关键词对应的行为文本信息的相似度大于预设阈值的评语数据作为样本评语。

进一步的，所述信息获取模块具体用于：

进一步的，所述生成模块具体用于：

进一步的，所述信息获取模块具体用于：

对所述评语数据添加场景类型标签；

进一步的，所述信息获取模块具体用于：

第三方面，本发明实施例还提供了一种终端设备，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明实施例提供的评语生成方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本发明实施例提供的评语生成方法。

本发明实施例提供了一种评语生成方法、装置、终端设备及存储介质，获取待处理行为文本信息和用户输入的场景关键词；将所述待处理行为文本信息和所述场景关键词输入评语生成模型，得到与所述待处理行为文本信息和所述场景关键词对应的评语，其中，所述评语生成模型的模型结构和模型参数是分别根据场景关键词对应的行为文本信息和样本评语训练而确定的。利用上述技术方案，能够自主地选择生成不同场景下的学生评语。

附图说明

图1为本发明实施例一提供的一种评语生成方法的流程示意图；

图1a为本发明实施例一提供的整体流程简图；

图1b为本发明实施例一提供的整体流程细节图；

图2为本发明实施例二提供的一种评语生成装置的结构示意图；

图3为本发明实施例三提供的一种终端设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理，但是其中的许多操作可以被并行地、并发地或者同时实施。此外，各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。此外，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

本发明使用的术语“包括”及其变形是开放性包括，即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”。

需要注意，本发明中提及的“第一”、“第二”等概念仅用于对相应内容进行区分，并非用于限定顺序或者相互依存关系。

实施例一

图1为本发明实施例一提供的一种评语生成方法的流程示意图，该方法可适用于评语生成的情况，该方法可以由评语生成装置来执行，其中该评语生成装置可由软件和/或硬件实现，并一般集成在终端设备上，在本实施例中终端设备包括但不限于：电脑。

如图1所示，本发明实施例一提供的一种评语生成方法，包括如下步骤：

S110、获取待处理行为文本信息和用户输入的场景关键词。

其中，所述待处理行为文本信息可以为教师手动输入的学生行为文本信息，也可以为与学生相关的应用推送的学生行为文本信息，或者可以为家长手动输入的学生行为文本信息等，本发明实施例对此不进行限制。

其中，所述场景关键词可以为考试、作业、课堂以及期末等场景关键词，还可以根据需要设定其他场景关键词，本发明实施例对此不进行限制。

其中，所述场景关键词的输入形式可以为手动输入，也可以为通过语音输入，本发明实施例对场景关键词的输入形式不进行限制。

其中，所述待处理行为信息的获取方式可以为接收其他终端设备发送的行为文本信息，还可以为用户手动输入的，本发明实施例对待处理行为信息的获取方式不进行限制。

S120、将所述待处理行为文本信息和所述场景关键词输入评语生成模型，得到与所述待处理行为文本信息和所述场景关键词对应的评语，其中，所述评语生成模型的模型结构和模型参数是分别根据场景关键词对应的行为文本信息和样本评语训练而确定的。

其中，所述场景关键词对应的行为文本信息的获取方式可以为，预先训练一个行为场景的分类器，对不同的行为文本信息进行算法分类；也可以为使用人工分类的方法对行为文本信息进行分组；或者可以为预先训练行为文本选择模型，根据输入的场景关键词和原始行为文本信息，得到场景关键词对应的行为文本信息，所述原始行为文本信息为学生的日常行为数据，包括：学生课堂表现、形象表现、情绪表现、社交表现、学业表现等方面，本发明实施例对此不进行限制。

其中，所述评语生成模型的训练方法可以包括：获取场景关键词对应的行为文本信息，其中，场景关键词对应的行为文本信息，将场景关键词对应的行为文本信息输入至待训练的评语生成模型中，得到预测评语，根据预测评语和样本评语形成的第二目标函数训练待训练的评语生成模型的模型结构和模型参数，其中，所述第二目标函数为损失函数，所述第二目标函数可以为负对数似然损失函数，返回执行将所述场景关键词对应的行为文本信息输入至待训练的评语生成模型中，得到预测评语的操作，直至得到评语生成模型，评语生成模型的训练过程中的训练目标为最小化生成模型的负对数似然损失函数。

具体的，将待处理行为文本信息和场景关键词输入训练好的评语生成模型中，得到与待处理行为文本信息和场景关键词对应的评语，例如可以是，若待处理行为文本信息为“课堂上积极举手”，场景关键词为“课堂”，将“课堂上积极举手”和“课堂”输入评语生成模型，得到评语“你在课堂上积极举手，老师问的问题，你都回答正确”。

在一个实施例中，在将所述待处理行为文本信息和所述场景关键词输入评语生成模型，得到与所述待处理行为文本信息和所述场景关键词对应的评语，其中，所述评语生成模型的模型结构和模型参数是分别根据场景关键词对应的行为文本信息和样本评语训练而确定的之前，还包括：

爬取预设类型网站上的评语数据；

其中，所述原始行为文本信息的获取方式可以为，采集教师日常对学生的行为记录信息，例如：对学生日常行为的表扬、批评或评论信息。其中包括：课堂表现、形象表现、情绪表现、社交表现、学业表现、成绩表现、作业表现等行为数据；也可以为通过校园内和/或教室内的摄像头采集到的视频图像分析得到的学生行为文本信息，本发明实施例对原始行为文本信息的获取方式不进行限制。

具体的，采集教师日常对学生的行为文本信息，行为文本信息是针对不同场景混杂在一起的总数据，通过关键词、主题提取或者分类等方法，找不同场景的行为文本信息，构建训练样本集，训练样本集包括：样本场景关键词、原始行为文本信息和样本场景关键词对应的行为文本信息。

其中，所述预设类型的网站可以为评语类型的网站，还可以为学生点评类型的网址，本发明实施例对此不进行限制。

其中，爬取预设类型网站上的评语数据的方式为，通过爬虫的方法，爬取网上公开的学生评语数据。

其中，将与所述场景关键词对应的行为文本信息的相似度大于预设阈值的评语数据作为样本评语的方式可以为将场景关键词对应的行为文本信息依次与评语数据计算相似度，将与行为文本信息的相似度大于设定阈值的评语数据作为样本评语。

具体的，获取训练样本集，训练样本集包括：场景关键词对应的行为文本信息和样本评语，且场景关键词对应的行为文本信息和样本评语一一对应，将相似度大于设定阈值的评语数据和场景关键词对应的行为文本信息作为一对样本。

通过将所述场景关键词和原始行为文本信息输入行为文本选择模型中，得到与所述场景关键词对应的行为文本信息，只需要输入场景关键词，模型会自主筛选满足场景关键词的行为文本信息，并生成该场景关键词对应的场景下的评语文本，使整个生成过程自动化，免去了人工筛选的操作。

在一个实施例中，所述行为文本选择模型的训练方法，包括：

其中，所述第一目标函数为损失函数，具体的，所述第一目标函数可以为负对数似然损失函数。

其中，所述待训练的行为文本选择模型可以为Bert模型。

具体的，构建行为文本选择模型。使用神经语言模型Bert的网络结构，作为待训练的行为文本选择模型。为了使选择器能按照指定场景关键词输入，筛选并保留与该场景关键词对应的行为文本信息，将场景关键词向量V_K融合到模型Bert，即

V_{ori_input+K}＝SUM(V_{ori_input},V_K)；

其中，V_K为场景关键词向量，SUM为对输入的两个向量加和的函数操作，V_{ori_input}为编码后的原始行为文本信息向量。

行为文本选择模型的输出为：

y_pred＝Bert(V_{ori_input+K})；

其中，V_{ori_input+K}为行为文本选择模型的输入向量，y_pred为行为文本选择模型的输出。

训练目标为最小化生成模型的负对数似然损失函数：

其中，x_i为第i个原始行为输入文本、y_i为要保留的目标行为文本、

为预测输出的文本，

l为输入文本长度，θ是模型参数。

将训练集A{场景关键词、场景关键词对应的行为文本信息，原始行为文本信息}输入到上述模型中，进行训练，待loss收敛或者达到一定的迭代次数后，停止并完成训练。

在一个实施例中，所述评语生成模型的训练方法，包括：

其中，所述第二目标函数为损失函数，具体的，所述第二目标函数可以为负对数似然损失函数。

其中，所述待训练的评语生成模型可以为seq2seq+attention模型，结合Attention机制的编码器encoder编码的上下文向量为：

c_i＝f(h_t,y_t′-1,s_t′-1,c_t′)；

其中，h_t为编码器t时刻的隐含层输出、y_t′-1为解码器t′-1时刻的输出、s_t′-1为解码器t′-1时刻隐含层状态、c_t′为t′时刻的上下文向量。f表示编码函数。

结合Attention机制的解码器decoder输出为：

P(y_t′y₁,…,y_t′-1,c_t′)＝g(y_t′-1,s_t′,c_t′)；

其中，y_t′为t′的输出，y_t′-1为t′-1的输出，s_t′为t′时刻的状态向量，c_t′为t′时刻的上下文向量，g表示解码函数。

训练目标为最小化生成模型的负对数似然损失函数：

其中，x_i为第i个原始行为输入文本、y_i为目标评语文本、

为预测输出的评语文本，

l为输入文本长度，θ是模型参数。

训练目标是令生成出来的文本与原始文本强相关，且最小化文本语法错误。

在一个实施例中，所述获取原始行为文本信息包括：

具体的，获取学生日常行为数据，并将学生日常行为数据中非文本格式的数据转换为文本格式，例如可以是，对于学生日常行为数据，包含了学生课堂表现、形象表现、情绪表现、社交表现以及学业表现等多方面的信息。这些不同场景的数据，是混杂在一起的，通过关键词、主题提取或者分类等方法，找出不同场景对应的行为数据。其中一些行为数据是文本类型的，如“上课认真”、“作业完成质量高”，此类数据可以直接使用。而对于非文本的数据，需要将其转换成文本，如成绩统计表格或者图片，转化成“语文考试97分”、“奥赛全国一等奖”等。构建训练集A{场景关键词，学生行为文本信息，场景相关的行为信息}，如：{“课堂”,“考试成绩不太理想；体育课活跃；课堂积极举手；课上问答全对”,“课堂积极举手；课上问答全对”}。

在现有的技术中，使用匹配方法生成的学生评语，与学生真实的行为表现，会存在较大的差别，甚至会出现某些行为不相符的情况。而本发明实施例提供的方法，是直接使用学生日常行为数据，并据此直接生成评语，更具真实性和个性化。

在一个实施例中，爬取预设类型网站上的评语数据之后，还包括：

对所述评语数据添加场景类型标签；

具体的，对评语数据添加场景类型标签，例如可以是，对于网上爬取的学生评语数据。使用分类和/或主题提取等方法，对评语句子添加场景类型标签，如“课堂”、“作业”、“成绩”、“期末”等。

具体的，根据用户输入的场景关键词选取包含所述场景关键词的场景类型标签对应的目标评语数据，例如可以是，用户输入的场景关键词为课堂，评语“课堂积极举手，课上问答全对”和评语“体育课活跃”的标签中均包含场景，则获取评语“课堂积极举手，课上问答全对”和评语“体育课活跃”。

在一个实施例中，将与所述场景关键词对应的行为文本信息的相似度大于预设阈值的评语数据作为样本评语包括：

具体的，使用语义相似度匹配的方法，计算场景关键词对应的行为文本信息与目标评语数据的相似度，保留相似度超过阈值的匹配结果，并构建对齐语料，即训练集B，数据格式为{场景关键词对应的行为文本信息，评语}，如{“课堂积极举手；课上问答全对”,“你在课堂上积极举手，老师问的问题，你都回答正确。”}。

在一个具体的例子中，如图1a所示，应用于对学生评语生成领域，主干流程包括：采集数据，根据采集到的数据构建并训练学生行为文本选择模型，根据采集到的数据和学生行为文本选择模型的输出结果构建并训练学生评语生成模型，根据采集数据和场景关键词生成相应场景下的学生评语文本。具体的实现过程如下：采集老师对学生的日常行为记录数据。构造针对不同场景下，学生行为文本信息与评语的对应关系，以此作为模型训练数据。构建并训练行为文本选择模型。老师输入指定场景，模型自动选择并保留在指定场景下的行为文本信息。构建并训练学生评语生成模型，将场景关键词和待处理学生行为文本信息，输入学生评语生成模型，输出满足该场景下的学生评语。根据老师反馈的评语数据，优化模型生成的结果。

在另一个具体的例子中，如图1b所示，为整体流程的细节图，采集到的原始数据包括：日常行为数据和评语文本数据，日常行为数据也就是采集教师日常对学生的行为记录信息，作为原始行为文本信息；评语文本数据是通过爬虫的方法，爬取网上公开的学生评语数据，对于输入的原始行为文本信息，使用一个可训练的正态分布随机算法，将其编码为：

V_{ori_input}＝Embedding(x_{ori_input})；

其中，x_{ori_input}为输入的原始行为文本信息，Embedding为一个可训练的正态分布随机算法函数，V_{ori_input}为编码后的原始行为文本信息向量。

对于场景关键词，将其编码为：

V_K＝Embedding(K)；

其中，V_K为场景关键词向量，Embedding为一个可训练的正态分布随机算法函数，K为输入的场景关键词。

构建行为文本选择模型，使用神经语言模型Bert的网络结构，作为基础的网络结构。为了使选择器能按照指定场景关键词输入，筛选并保留与该场景相关的行为信息，将场景关键词向量V_K融合到模型Bert，即

V_{ori_input+K}＝SUM(V_{ori_input},V_K)；

文本选择模型的输出为：

y_pred＝Bert(V_{ori_input+K})；

训练目标为最小化生成模型的负对数似然损失函数：

为预测输出的文本，

l为输入文本长度，θ是模型参数。

将训练集A{场景关键词，场景相关的行为文本信息，原始行为文本信息}输入到上述模型中，进行训练，待loss收敛或达到一定的迭代次数后，停止并完成训练，训练得到的行为文本选择模型用于自动选择并保留指定场景下的行为数据。

对于场景关键词对应的行为文本信息，使用一个可训练的正态分布随机算法，将其编码为：

V_input＝Embedding(x_input)；

其中，x_input为场景关键词对应的行为文本信息，Embedding为一个可训练的正态分布随机算法函数，V_input为场景关键词对应的行为文本信息向量。

对于样本评语，将其编码为：

V_groudtruth＝Embedding(y_groudtruth)；

其中，y_groudtruth为样本评语，Embedding为一个可训练的正态分布随机算法函数，V_groudtruth为样本评语向量。

构建待训练的评语生成模型：seq2seq+attention模型，结合Attention机制的编码器encoder编码的上下文向量为：

c_i＝f(h_t,y_t′-1,s_t′-1,c_t′)c_i＝f(h_t,y_t′-1,s_t′-1,c_t′)；

结合Attention机制的解码器decoder输出为：

P(y_t′y₁,…,y_t′-1,c_t′)＝g(y_t′-1,s_t′,c_t′)；

训练目标为最小化生成模型的负对数似然损失函数：

其中，x_i为第i个原始行为输入文本、y_i为目标评语文本、

为预测输出的评语文本，

l为输入文本长度，θ是模型参数。将训练集B{场景关键词对应的行为文本信息，样本评语}输入到上述模型中，进行训练，待loss收敛或达到一定的迭代次数后，停止并完成训练，得到评语生成模型。

输入场景关键词和待处理行为文本信息，生成满足该场景关键词的评语。

输入数据{场景关键词K_j，原始行为文本信息X}表示为

其中

表示场景类别。那么输入的原始行为文本信息可表征为：

V_input＝Embedding(x_{ori_input})；

其中，x_{ori_input}为输入的原始行为文本信息，V_input为输入的原始行为文本信息向量，Embedding为一个可训练的正态分布随机算法函数。

对于评语，将其编码为：

其中，K_j为指定的第j个场景关键词，

为指定的第j个场景关键词向量，Embedding为一个可训练的正态分布随机算法函数。

选择满足特定场景的学生行为数据。将V_input和V_K输入到模型行为文本选择模型中，得到满足输入的场景关键词的行为文本信息：

其中，V_{ori_input}为编码后的原始行为文本信息向量，

为指定的第j个场景关键词向量。

特定场景的评语生成。将

表征为：

其中，

为满足输入的场景关键词的行为文本信息，V_chioce为满足输入的场景关键词的行为文本信息向量。

输入到评语生成模型，并生成该场景下的评语：

y＝G(V_chioce)；

其中，V_chioce为满足输入的场景关键词的行为文本信息向量，G为评语生成模型，y为场景关键词对应的评语。

根据老师反馈的评语数据，优化模型。老师可以直接对生成的评语文本进行修改，系统会采集老师修改后的评语，并自动与输入的学生行为文本信息关联，构造新的训练数据，添加到训练数据库。待反馈数据达到一定的程度，系统会重新训练模型，实现流程上的自动化。

现有技术中，使用匹配的方法生成的学生评语，老师修改并优化了评语文本后，只能增加匹配库的存量，而没有改善匹配算法的性能。这种方式，没有发挥反馈数据的最大效用。本发明实施例提供的方法，能使用反馈数据，重新训练模型，并优化生成模型的能力，提升了所有场景下生成的评语效果。

本发明通过获取待处理行为文本信息和用户输入的场景关键词；将所述待处理行为文本信息和所述场景关键词输入评语生成模型，得到与所述待处理行为文本信息和所述场景关键词对应的评语，其中，所述评语生成模型的模型结构和模型参数是分别根据场景关键词对应的行为文本信息和样本评语训练而确定的，可以适配不同的场景，可以选择不同的场景，生成满足该场景下的评语。

实施例二

图2为本发明实施例二提供的一种评语生成装置的结构示意图，该装置可适用于评语生成的情况，其中该评语生成装置可由软件和/或硬件实现，并一般集成在终端设备上。

如图2所示，该评语生成装置包括：获取模块21和生成模块22。

获取模块21，用于获取待处理行为文本信息和用户输入的场景关键词；

生成模块22，用于将所述待处理行为文本信息和所述场景关键词输入评语生成模型，得到与所述待处理行为文本信息和所述场景关键词对应的评语，其中，所述评语生成模型的模型结构和模型参数是分别根据场景关键词对应的行为文本信息和样本评语训练而确定的。

可选的，还包括：

爬取模块，用于爬取预设类型网站上的评语数据；

可选的，所述信息获取模块具体用于：

可选的，所述生成模块22具体用于：

可选的，所述信息获取模块具体用于：

对所述评语数据添加场景类型标签；

可选的，所述信息获取模块具体用于：

上述评语生成装置可执行本发明任意实施例所提供的评语生成方法，具备执行方法相应的功能模块和有益效果。

实施例三

图3为本发明实施例三提供的一种终端设备的结构示意图。如图3所示，本发明实施例三提供的终端设备包括：一个或多个处理器31和存储装置32；该终端设备中的处理器31可以是一个或多个，图3中以一个处理器31为例；存储装置32用于存储一个或多个程序；所述一个或多个程序被所述一个或多个处理器31执行，使得所述一个或多个处理器31实现如本发明实施例中任一项所述的评语生成方法。

所述终端设备还可以包括：输入装置33和输出装置34。

终端设备中的处理器31、存储装置32、输入装置33和输出装置34可以通过总线或其他方式连接，图3中以通过总线连接为例。

该终端设备中的存储装置32作为一种计算机可读存储介质，可用于存储一个或多个程序，所述程序可以是软件程序、计算机可执行程序以及模块，如本发明实施例一所提供评语生成方法对应的程序指令/模块(例如，附图2所示的评语生成装置中的模块，包括：获取模块21和生成模块22)。处理器31通过运行存储在存储装置32中的软件程序、指令以及模块，从而执行终端设备的各种功能应用以及数据处理，即实现上述方法实施例中评语生成方法。

存储装置32可包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端设备的使用所创建的数据等。此外，存储装置32可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储装置32可进一步包括相对于处理器31远程设置的存储器，这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置33可用于接收输入的数字或字符信息，以及产生与终端设备的用户设置以及功能控制有关的键信号输入。输出装置34可包括显示屏等显示设备。

并且，当上述终端设备所包括一个或者多个程序被所述一个或者多个处理器31执行时，程序进行如下操作：

获取待处理行为文本信息和用户输入的场景关键词；

实施例四

本发明实施例四提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时用于执行评语生成方法，该方法包括：

获取待处理行为文本信息和用户输入的场景关键词；

可选的，该程序被处理器执行时还可以用于执行本发明任意实施例所提供的评语生成方法。

本发明实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RandomAccessMemory，RAM)、只读存储器(ReadOnlyMemory，ROM)、可擦式可编程只读存储器(ErasableProgrammableReadOnlyMemory，EPROM)、闪存、光纤、便携式CD-ROM、光存储器件、磁存储器件、或者上述的任意合适的组合。计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于：电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、无线电频率(RadioFrequency，RF)等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络包括局域网(LAN)或广域网(WAN)连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种评语生成方法，其特征在于，包括：

获取待处理行为文本信息和用户输入的场景关键词；

2.根据权利要求1所述的方法，其特征在于，在将所述待处理行为文本信息和所述场景关键词输入评语生成模型，得到与所述待处理行为文本信息和所述场景关键词对应的评语，其中，所述评语生成模型的模型结构和模型参数是分别根据场景关键词对应的行为文本信息和样本评语训练而确定的之前，还包括：

爬取预设类型网站上的评语数据；

3.根据权利要求2所述的方法，其特征在于，所述行为文本选择模型的训练方法，包括：

4.根据权利要求3所述的方法，其特征在于，所述评语生成模型的训练方法，包括：

5.根据权利要求3所述的方法，其特征在于，所述获取原始行为文本信息包括：

6.根据权利要求2所述的方法，其特征在于，爬取预设类型网站上的评语数据之后，还包括：

对所述评语数据添加场景类型标签；

7.根据权利要求6所述的方法，其特征在于，将与所述场景关键词对应的行为文本信息的相似度大于预设阈值的评语数据作为样本评语包括：

8.一种评语生成装置，其特征在于，包括：

9.一种终端设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一所述的方法。