CN111914532A

CN111914532A - 一种中文作文评分方法

Info

Publication number: CN111914532A
Application number: CN202010961000.3A
Authority: CN
Inventors: 杨林; 雷思东; 卢杰
Original assignee: Beijing Yueshen Intelligent Technology Co ltd
Current assignee: Beijing Yueshen Intelligent Technology Co ltd
Priority date: 2020-09-14
Filing date: 2020-09-14
Publication date: 2020-11-10
Anticipated expiration: 2040-09-14
Also published as: CN111914532B

Abstract

本发明涉及人工智能领域，具体涉及一种中文作文评分方法，包括：获取待评分中文作文；对待评分中文作文进行分析，得到对应的评分维度表；根据每一个维度下的评分规则，对待评分中文作文进行评分计算，得到作文在各个维度下的评分结果；对评分结果进行加权处理，获得待评分中文作文的最终评分结果。相比于传统的作文评分方法，本发明的方案使用户可以得到更加细粒度的作文打分结果，并且可以通过自定义每个维度对于总分的权重来对总得分进行微调，同时使得打分结果对于用户更加透明，更加有可解释性。

Description

一种中文作文评分方法

技术领域

本发明属于人工智能领域，具体涉及一种中文作文评分方法。

背景技术

随着教育信息化的推动，AI+教育已经成为了现阶段各大厂商的主攻方向，同时英文作文自动批改技术的日益成熟，为中文作文自动批改提供了一定的理论基础和参考。现阶段，自然语言处理相关技术日益强大，并且正在各行各业寻求落地场景，基于上述背景，考虑结合AI+教育的思想，寻求自然语言处理技术在中文作文自动批改领域的落地场景。

现有技术中，早期出现的中文作文自动批改技术借鉴了英文作文自动批改技术的实现方案，提取作文字数，成语数等作文浅层特征之后利用回归模型进行打分。

现有技术主要缺点是基于回归模型的中文作文评分系统对于使用者来说更像是一个黑盒子，用户无法得知分数打出来的依据，并且无法对结果进行干预。

发明内容

有鉴于此，本发明的目的在于克服现有技术的不足，提供一种中文作文评分方法，以解决现有技术中用户无法得知分数打出来的依据，并且无法对结果进行干预的问题。

为实现以上目的，本发明采用如下技术方案：

一种中文作文评分方法，其特征在于，包括：

获取待评分中文作文；

对所述待评分中文作文进行分析，得到对应的评分维度表；

根据每一个维度下的评分规则，对所述待评分中文作文进行评分计算，得到作文在各个维度下的评分结果；

对所述各个维度下的评分结果进行加权处理，获得所述待评分中文作文的最终评分结果。

进一步地，根据每一个维度下的评分规则，对所述待评分中文作文进行评分计算，得到各个维度下的评分结果，包括：

对所述待评分中文作文进行题文符合度分析、中心突出度分析、内容充实度分析、情感分析、语句通顺度分析、文采分析、段落结构分析和文章条理清晰度分析，得到关于题文符合度的评分结果、中心突出度的评分结果、内容充实度的评分结果、文章情感评分结果、语句通顺度评分结果、文采评分结果、段落结构评分结果和文章条理清晰度评分结果；

分别对所述题文符合度的评分结果、中心突出度的评分结果、内容充实度的评分结果、文章情感评分结果、语句通顺度评分结果、文采评分结果、段落结构评分结果、文章条理清晰度评分结果进行划分，进行加权处理，获得所述待评分中文作文的最终评分结果。

进一步地，所述题文符合度分析包括：

获取待评分中文作文标题和待评分中文作文内容，通过文本语义特征提取模型提取作文标题的语义特征和作文内容的语义特征；

将所述作文标题的语义特征和作文内容的语义特征输入预先训练好的模型，得到题文符合度评分结果。

进一步地，所述中心突出度分析包括：

将所述待评分中文作文进行句子分割，得到多个句子；

将所述待评分中文作文进行段落分割，得到多个段落；

通过计算模型计算所述多个句子之间的语义相似度，得到句子语义近似度；

通过计算模型计算所述多个段落之间的语义相似度，得到段落语义近似度；

对所述句子语义近似度和所述段落语义近似度进行加权处理，获得所述待评分中文作文的中心突出度评分结果。

进一步地，所述内容充实度分析包括：

对所述待评分中文作文进行字数统计，根据字数要求标准，得出内容充实度评分结果。

进一步地，所述情感分析包括：

将所述待评分中文作文进行词语分割，得到多个词语；

将所述多个词语输入情感分布模型，得到所述待评分中文作文中词语的情感强烈分布情况，根据所述情感强烈分布情况计算所述待评分中文作文情感评分结果。

进一步地，所述语句通顺度分析：

将所述待评分中文作文进行句子分割，得到多个句子；

将所述多个句子输入至浅层的基于n-gram语言模型，得到语句在浅层语言模型下的PPL值；

将所述多个句子输入至深层的基于bert的语言模型，得到语句在深层语言模型下的PPL值；

将所述的浅层PPL值与深层PPL值进行加权，得到所述语言通顺都评分结果。

进一步地，所述文采分析包括：

对所述待评分中文作文进行句子分割，得到多个句子；

根据优秀句子规则库中预先设定的优秀句子规则，对所述多个句子进行分析，结合文中成语数量得到基于专家知识的文采得分；

根据提前训练好的语句文采评价模型对所述多个句子进行评价，得到基于模型的文采得分；

将所述基于专家知识的文采得分与所述基于模型的文采得分加权得到待评分中文作文的文采评分结果。

进一步地，所述文章条理清晰度分析包括：

从所述待评分中文作文中抽取上下句句对；

将所述上下句句对输入至相关性打分模型，所述相关性打分模型输出0到1之间的得分，得到文章条理清晰度评分结果。

进一步地，所述根据每一个维度，对所述待评分中文作文进行评分计算，得到多个评分结果，还包括：

对所述待评分中文作文进行错别字数量统计得到错别字数量结果，以及对错误标点数量进行统计，得到错误标点数量结果；

通过所述错别字数量结果以及所述错误标点数量结果，得到所述待评分中文作文扣分结果；

对所述多个评分结果与所述扣分结果进行加权处理，获得所述待评分中文作文的最终评分结果。

本发明的上述技术方案的有益效果如下：

本发明所提供的技术方案中，获取待评分中文作文；通过对待评分中文作文进行分析，得到对应的评分维度表；根据每一个维度下的评分规则，对待评分中文作文进行评分计算，得到各个维度下的评分结果；通过对各维度下的评分结果进行加权处理，获得待评分中文作文的最终评分结果。相比于传统的作文评分方法，本发明的方案在使用户可以得到更加细粒度的作文分析结果，并且通过自定义每个维度对于总分的权重来对总得分进行微调，同时使得最终打分对于用户来说更加透明，更加有可解释性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一个实施例提供的一种中文作文评分方法步骤图。

图2为本发明另一个实施例提供的一种中文作文评分方法步骤图。

图3为本发明一个实施例提供的一种题文符合度分析步骤图。

图4为本发明一个实施例提供的一种主题中心突出度分析步骤图。

图5为本发明一个实施例提供的一种情感分析步骤图。

图6为本发明一个实施例提供的一种语句通顺度分析步骤图。

图7为本发明一个实施例提供的一种文采分析步骤图。

图8为本发明一个实施例提供的一种条理清晰度分析步骤图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将对本发明的技术方案进行详细的描述。显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式，都属于本发明所保护的范围。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

现有技术主要缺点是基于回归模型的中文作文评分系统对于使用者来说更像是一个黑盒子，用户无法得知分数打出来的依据，并且无法对结果进行干预。本发明使用户可以得到更加细粒度的作文分析结果，并且通过自定义每个维度对于总分的权重来对总得分进行微调，同时使得最终打分对于用户来说更加透明，更加有可解释性。

如图1所示，为本发明一个实施例提供的一种中文作文评分方法步骤图，

包括：

步骤S101、获取待评分中文作文；

在本实施例中，用户通过在电脑端或手机端提交待评分中文作文。

步骤S102、对待评分中文作文进行分析，得到对应的评分维度表；

其中，评分维度是评分作文的指标数据，如该评分作文的符合主题，中心突出，内容充实，真情实感，语句通顺，描写生动，段落分明，条理清晰，书写无误，标点正确评价维度；

步骤S103、根据每一个维度，对待评分中文作文进行评分计算，得到多个评分结果；

在本实施例中，每一个维度还可以包含多个评分标准，对应多个等级。

步骤S104、对多个评分结果进行加权处理，获得待评分中文作文的最终评分结果。

在一个实施例中，首先结合教研思想制定出分年级分体裁的评分维度表，采用专家知识+深度学习模型+专业词库结合的方法在各个评分标准下制定每个评分维度的打分方法。根据用户上传作文时所选择的年级及体裁找到对应的评分维度表，根据该维度表下不同维度的打分方法对该篇作文该维度进行打分。以小学5年级写人类记叙文为例，制定出多个评分标准，根据多个评分标准得到多个评分结果，对多个评分结果进行加权处理，获得待评分中文作文的最终评分结果。

本发明所提供的实施例，获取待评分中文作文；通过对待评分中文作文进行分析，得到对应的评分维度表；根据每一个维度，对待评分中文作文进行评分计算，得到多个评分结果；通过对多个评分结果进行加权处理，获得待评分中文作文的最终评分结果。相比于传统的作文评分方法，本发明的方案在使中文作文打分结果时，用户可以得到更加细粒度的作文分析结果，并且通过自定义每个维度对于总分的权重来对总得分进行微调，同时使得最终打分对于用户来说更加透明，更加有可解释性。

如图2所示，为本发明另一个实施例提供的一种中文作文评分方法步骤图，包括：

步骤S201、获取待评分中文作文；

步骤S202、对待评分中文作文进行分析，得到对应的评分维度表；

步骤203、对待评分中文作文进行题文符合度分析、中心突出度分析、内容充实度分析、情感分析、语句通顺度分析、文采分析、段落结构分析和文章条理清晰度分析，得到关于题文符合度的评分结果、中心突出度的评分结果、内容充实度的评分结果、文章情感评分结果、语句通顺度评分结果、文采评分结果、段落结构评分结果和文章条理清晰度评分结果；

步骤204、分别对题文符合度的评分结果、中心突出度的评分结果、内容充实度的评分结果、文章情感评分结果、语句通顺度评分结果、文采评分结果、段落结构评分结果、文章条理清晰度评分结果进行划分，进行加权处理，获得待评分中文作文的最终评分结果。

下面对题文符合度分析、中心突出度分析、内容充实度分析、情感分析、语句通顺度分析、文采分析、段落结构分析和文章条理清晰度分析做具体说明，

其中，

题文符合度分析：

如图3所示，为本发明一个实施例提供的一种题文符合度分析步骤图，包括，

步骤S203a1、获取待评分中文作文标题和待评分中文作文内容，通过语义特征提取模型提取作文标题的语义特征和作文内容的语义特征；

步骤S203a2、将作文标题的语义特征和作文内容的语义特征输入预设的训练模型，得到题文符合度评分结果。

在一个实施例中，将作文标题和内容分别经过同一个语义特征提取模型映射到一组高维向量，将两组高维向量合并后经过一个全连接层进行压缩，再接入一个sigmoid函数将最终的计算结果压缩到0到1之间，在训练中，利用从网上搜集到的高分作文作为正样本，标签为1，随机打乱题目之后再经过人工校对所得的数据作为负样本，标签为0，将正负样本作为训练数据进行模型训练。最终训练好的模型接受作文标题和作文内容两个输入，最终输出一个0到1之间的得分，得分越趋近于1，证明题文符合度越高。

主题中心突出度分析：

如图4所示，为本发明一个实施例提供的一种主题中心突出度分析步骤图，包括，

步骤S203b1、将待评分中文作文进行句子分割，得到多个句子；

步骤S203b2、将待评分中文作文进行段落分割，得到多个段落；

步骤S203b3、通过计算模型计算多个句子之间的语义相似度，得到句子语义近似度；

步骤S203b4、通过计算模型计算多个段落之间的语义相似度，得到段落语义近似度；

步骤S203b5、对句子语义近似度和段落语义近似度进行加权处理，获得待评分中文作文的中心突出度评分结果。

在实际使用中，中心突出体现在文章中各部分(各段落，各句子)之间在语义层面的近似程度，以及文章，主题，观点的明确性。在算法层面，通过计算文中各句子，各段落之间的语义相似度来评估文章整体的语义近似度，通过捕捉文中作者感情的表达，观点的表达来衡量文章主题，观点的明确性，最终通过各个部分的加权计算，得到该维度的最终得分。

情感分析：

如图5所示，为本发明一个实施例提供的一种情感分析步骤图，

包括，

步骤S203c1、将待评分中文作文进行词语分割，得到多个词语；

步骤S203c2、将多数多个词语输入情感分布模型，得到待评分中文作文中词语的情感强烈分布情况，根据情感强烈分布情况计算待评分中文作文情感评分结果。

具体地，在一个实施例中，采用了基于情感词库的情感计算方法，利用开源情感词库，将文章分词之后，计算文章中词语的情感强烈分布，根据这个分布情况计算最终的文章情感得分。

语句通顺度分析：

如图6所示，为本发明一个实施例提供的一种语句通顺度分析步骤图，

包括：

步骤S203d1、将待评分中文作文进行句子分割，得到多个句子；

步骤S203d2、将多个句子输入至浅层的基于n-gram语言模型，得到语句在浅层语言模型下的PPL值。

步骤S203d3、将多个句子输入至深层的基于bert的语言模型，得到语句在深层语言模型下的PPL值。

步骤S203d4、将两部分PPL值加权，得到所述语句通顺度评分结果。

在一个实施例中，基于大量的开源的通用型语料库以及收集到的作文语料，训练出浅层的基于n-gram语言模型，微调了google预训练bert-base模型中的maskedlm任务得到深层语言模型，通过大量数据进行测试，设定出该维度最终得分与两个模型ppl值的相关公式。

文采分析：

如图7所示，为本发明一个实施例提供的一种文采分析步骤图，

包括：

步骤S203e1、对待评分中文作文进行句子分割，得到多个句子；

步骤S203e2、根据优秀句子规则库中提前制定的优秀句子规则对所述多个句子进行分析，结合文中成语数量得到基于专家知识的文采得分。

步骤S203e3、根据提前训练好的语句文采评价模型对所述多个句子进行评价，得到基于模型的文采得分。

步骤S203e4、将基于专家知识的文采得分与基于模型的文采得分加权得到待评分中文作文的文采评分结果。

在一个实施例中，文采分析得分与文章中好词好句数量，文中使用词语的难易程度，文中各句子文采得分相关。从网上，书籍中收集到大量优秀句子为正样本，标签为1，再从作文中随机挑选一些非优秀句子作为负样本，标签为0，共同训练一个文本分类模型，训练好的模型接收一个句子作为输出，输出一个0到1之间的值，同样的，值越接近1，证明该句子文采得分越高，将作文分句之后，用该分类模型计算各个语句的文采得分，来衡量整个文章的文采得分；我们基于大量通用语料计算出词语的idf值，集合部编版教材词汇表等文件，经过人工核定，制定出常用词语的难度系数表，用文章中词语的难度系数分布衡量文章用词的难易程度，计算文章词汇难易度得分；再结合文中的好词好句数量共同衡量该维度得分，好词判断主要为成语判断，好句根据教研人员制定的好句的评判标准判断。

条理清晰度分析：

如图8所示，为本发明一个实施例提供的一种条理清晰度分析步骤图，

包括：

步骤S203f1、从待评分中文作文中抽取上下句句对；

步骤S203f2、将上下句句对输入至相关性打分模型，相关性打分模型输出0到1之间的得分，得到文章条理清晰度评分结果。

在一个实施例中，根据文章中上下句联系的紧密程度来衡量文章条理清晰维度得分，我们接近google bert模型中的next sentence prediction思想，利用自己的数据集训练这一任务，形成一个上下句相关性打分模型，数据集方面，我们从作文数据中随机抽取大量真上下句对，作为正样本，标签为1，假上下句对，标签为0，以此为训练集进行模型训练，训练好的模型接收一个句对作为输入，输出一个0到1之间的得分，得分越靠近1证明所输入的上下句相关性越高，最终通过文章中上下句得分的分布衡量该维度得分。

内容充实度分析包括：

对待评分中文作文进行字数统计，根据字数要求标准，得出内容充值度评分结果。

目前，内容充实维度主要跟字数情况挂钩，通过研究相关文件，结合教研经验，制定出各年级的字数要求标准，以及相应的扣分标准。

优选地，根据每一个维度，对待评分中文作文进行评分计算，得到多个评分结果，还包括：

对待评分中文作文进行错别字数量统计得到错别字数量结果，以及对错误标点数量进行统计，得到错误标点数量结果；

通过错别字数量结果以及错误标点数量结果，得到待评分中文作文扣分结果；

对多个评分结果与扣分结果进行加权处理，获得待评分中文作文的最终评分结果。

本发明所提供的实施例，获取待评分中文作文；通过对待评分中文作文进行分析，得到对应的评分维度表；对待评分中文作文进行题文符合度分析、中心突出度分析、内容充实度分析、情感分析、语句通顺度分析、文采分析、段落结构分析和文章条理清晰度分析，得到关于题文符合度的评分结果、中心突出度的评分结果、内容充实度的评分结果、文章情感评分结果、语句通顺度评分结果、文采评分结果、段落结构评分结果和文章条理清晰度评分结果；分别对题文符合度的评分结果、中心突出度的评分结果、内容充实度的评分结果、文章情感评分结果、语句通顺度评分结果、文采评分结果、段落结构评分结果、文章条理清晰度评分结果进行划分，进行加权处理，获得待评分中文作文的最终评分结果。相比于传统的作文评分方法，本发明的方案使用户可以得到更加细粒度的作文分析结果，并且可以通过自定义每个维度对于总分的权重来对总得分进行微调，同时使得最终打分对于用户来说更加透明，更加有可解释性。

可以理解的是，上述各实施例中相同或相似部分可以相互参考，在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。

需要说明的是，在本申请的描述中，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本申请的描述中，除非另有说明，“多个”的含义是指至少两个。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本申请的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本申请的实施例所属技术领域的技术人员所理解。

应当理解，本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本申请各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本申请的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种中文作文评分方法，其特征在于，包括：

获取待评分中文作文；

对所述待评分中文作文进行分析，得到对应的评分维度表；

2.根据权利要求1所述的方法，其特征在于，根据每一个维度下的评分规则，对所述待评分中文作文进行评分计算，得到各个维度下的评分结果，包括：

3.根据权利要求2所述的方法，其特征在于，所述题文符合度分析包括：

4.根据权利要求2所述的方法，其特征在于，所述中心突出度分析包括：

将所述待评分中文作文进行句子分割，得到多个句子；

将所述待评分中文作文进行段落分割，得到多个段落；

5.根据权利要求2所述的方法，其特征在于，所述内容充实度分析包括：

6.根据权利要求2所述的方法，其特征在于，所述情感分析包括：

将所述待评分中文作文进行词语分割，得到多个词语；

7.根据权利要求2所述的方法，其特征在于，所述语句通顺度分析：

将所述待评分中文作文进行句子分割，得到多个句子；

8.根据权利要求2所述的方法，其特征在于，所述文采分析包括：

对所述待评分中文作文进行句子分割，得到多个句子；

9.根据权利要求2所述的方法，其特征在于，所述文章条理清晰度分析包括：

从所述待评分中文作文中抽取上下句句对；

10.根据权利要求1所述的方法，其特征在于，所述根据每一个维度，对所述待评分中文作文进行评分计算，得到多个评分结果，还包括：