CN114265933A

CN114265933A - 处理答题文件的方法、装置、计算设备及存储介质

Info

Publication number: CN114265933A
Application number: CN202111573378.7A
Authority: CN
Inventors: 詹文超; 沙晶; 王士进; 魏思
Original assignee: iFlytek Co Ltd
Current assignee: iFlytek Co Ltd
Priority date: 2021-12-21
Filing date: 2021-12-21
Publication date: 2022-04-01

Abstract

本申请公开了一种处理答题文件的方法、装置、计算设备以及存储介质，包括：获取多个答题文件，并对该多个答题文件进行聚类，得到各个答题文件所属的类别，其中，不同类别下的答题文件的答题特征不同，同一类别下的答题文件的答题特征相同或者等价，然后分别呈现不同类别下的至少一个答题文件中的答题内容。如此，针对每个类别下的多个答题文件，教职人员可以仅批改一份答题文件，而无需逐个批改所有答题文件，从而可以提高教职人员的批改效率、减小教职人员的工作负荷。

Description

处理答题文件的方法、装置、计算设备及存储介质

技术领域

本申请涉及人工智能技术领域，特别是涉及一种处理答题文件的方法、装置、计算设备及存储介质。

背景技术

目前，教师所承担的工作，除了包括日常的教学活动、备课、批改作业之外，还新增了课后服务(如安排学生自由阅读、拓展训练等)、晚托服务(如陪同学生做作业、课后辅导)等。如此，教师所承担的工作内容越来越多，工作负荷越来越大。

因此，如何为教师等教职人员提高工作效率、降低工作负担，成为目前亟需解决的重要问题。

发明内容

本申请实施例提供了一种处理答题文件的方法、装置、计算设备及存储介质，以辅助教师等教师人员提高工作效率、降低教师的工作负担。

第一方面，本申请实施例提供了一种处理答题文件的方法，包括：

获取多个答题文件，不同答题文件包括针对同一数理主观题的答题内容；

对所述多个答题文件进行聚类，得到各个答题文件所属的类别，不同类别下的答题文件的答题特征不同，同一类别下的答题文件的答题特征相同或者等价；

分别呈现不同类别下的至少一个答题文件中的答题内容。

在一种可能的实施方式中，所述答题文件的答题特征包括第一特征以及第二特征，所述对所述多个答题文件进行聚类，得到各个答题文件所属的类别，包括：

获取各个答题文件的第一特征以及第二特征，所述第一特征为所述答题文件包括的答题内容中关键作答步骤的特征，所述第二特征为所述关键作答步骤对应的等价语义步骤的特征；

根据所述各个答题文件的第一特征以及第二特征，对所述多个答题文件进行聚类，得到各个答题文件所属的类别。

在一种可能的实施方式中，所述方法还包括：

获取各个答题文件的第三特征，所述第三特征为所述答题文件包括的答题内容中连续作答步骤对应的推理过程的特征；

则，所述根据所述各个答题文件的第一特征以及第二特征，对所述多个答题文件进行聚类，包括：

根据所述各个答题文件的第一特征、第二特征以及第三特征，对所述多个答题文件进行聚类。

在一种可能的实施方式中，所述根据所述各个答题文件的第一特征、第二特征以及第三特征，对所述多个答题文件进行聚类，包括：

根据所述各个答题文件的第一特征、第二特征，对所述多个答题文件进行聚类，得到初始聚类结果；

根据所述各个答题文件的第三特征，对所述初始聚类结果进行修正。

在一种可能的实施方式中，所述获取各个答题文件的第三特征，包括：

将所述各个答题文件输入至预先完成训练的推理特征模型，得到所述推理特征模型输出的所述各个答题文件的第三特征。

在一种可能的实施方式中，所述获取各个答题文件的第一特征以及第二特征，包括：

将所述各个答题文件输入至预先完成训练的关键步骤提取模型，得到所述关键步骤提取模型输出的所述各个答题文件的第一特征；

将所述各个答题文件输入至预先完成训练的等价语义模型，得到所述等价语义模型输出的所述各个答题文件的第二特征。

在一种可能的实施方式中，所述获取针对同一数理主观题的多个答题文件，包括：

呈现文件导入界面；

响应于用户在所述文件导入界面上的操作，获取用户提供的所述多个答题文件。

在一种可能的实施方式中，所述方法还包括：

响应于针对目标类别下的目标答题文件的评分操作，获取所述目标答题文件对应的评分；

将所述目标答题文件对应的评分，确定为所述目标类别下的其它答题文件的评分。

第二方面，本申请实施例还提供了一种处理答题文件的装置，所述装置包括：

第一获取模块，用于获取多个答题文件，不同答题文件包括针对同一数理主观题的答题内容；

聚类模块，用于对所述多个答题文件进行聚类，得到各个答题文件所属的类别，不同类别下的答题文件的答题特征不同，同一类别下的答题文件的答题特征相同或者等价；

呈现模块，用于分别呈现不同类别下的至少一个答题文件中的答题内容。

在一种可能的实施方式中，所述答题文件的答题特征包括第一特征以及第二特征，所述聚类模块，包括：

第一获取单元，用于获取各个答题文件的第一特征以及第二特征，所述第一特征为所述答题文件包括的答题内容中关键作答步骤的特征，所述第二特征为所述关键作答步骤对应的等价语义步骤的特征；

聚类单元，用于根据所述各个答题文件的第一特征以及第二特征，对所述多个答题文件进行聚类，得到各个答题文件所属的类别。

在一种可能的实施方式中，所述装置还包括：

第二获取模块，用于获取各个答题文件的第三特征，所述第三特征为所述答题文件包括的答题内容中连续作答步骤对应的推理过程的特征；

则，所述聚类单元，具体用于根据所述各个答题文件的第一特征、第二特征以及第三特征，对所述多个答题文件进行聚类。

在一种可能的实施方式中，所述聚类单元，包括：

聚类子单元，用于根据所述各个答题文件的第一特征、第二特征，对所述多个答题文件进行聚类，得到初始聚类结果；

修正子单元，用于根据所述各个答题文件的第三特征，对所述初始聚类结果进行修正。

在一种可能的实施方式中，所述第二获取模块，用于将所述各个答题文件输入至预先完成训练的推理特征模型，得到所述推理特征模型输出的所述各个答题文件的第三特征。

在一种可能的实施方式中，所述第一获取单元，包括：

第一提取子单元，用于将所述各个答题文件输入至预先完成训练的关键步骤提取模型，得到所述关键步骤提取模型输出的所述各个答题文件的第一特征；

第二提取子单元，用于将所述各个答题文件输入至预先完成训练的等价语义模型，得到所述等价语义模型输出的所述各个答题文件的第二特征。

在一种可能的实施方式中，所述第一获取模块，包括：

呈现单元，用于呈现文件导入界面；

第二获取单元，用于响应于用户在所述文件导入界面上的操作，获取用户提供的所述多个答题文件。

在一种可能的实施方式中，所述装置还包括：

第三获取模块，用于响应于针对目标类别下的目标答题文件的评分操作，获取所述目标答题文件对应的评分；

评分模块，用于将所述目标答题文件对应的评分，确定为所述目标类别下的其它答题文件的评分。

第三方面，本申请实施例还提供了一种计算设备，该设备可以包括处理器以及存储器：

所述存储器用于存储计算机程序；

所述处理器用于根据所述计算机程序执行上述第一方面以及第一方面中任一种实施方式所述的方法。

第四方面，本申请实施例还提供了一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储计算机程序，所述计算机程序用于执行上述第一方面以及第一方面中任一种实施方式所述的方法。

在本申请实施例的上述实现方式中，获取多个答题文件，并对该多个答题文件进行聚类，得到各个答题文件所属的类别，其中，不同类别下的答题文件的答题特征不同，同一类别下的答题文件的答题特征相同或者等价，并分别呈现不同类别下的答题文件。

如此，由于每个类别下的多个答题文件中针对同一数理主观题的答题内容，具有相同或者语义上等价的答题特征，因此，每个类别下的多个答题文件的批改内容可以保持一致。这样，教职人员在批改答题文件时，针对呈现的每个类别下的多个答题文件，可以仅批改一份答题文件，而无需逐个批改所有答题文件，从而可以有效减少教职人员批改答题文件的数量，进而可以提高教职人员的批改效率、减小教职人员的工作负荷。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1为本申请实施例中一示例性用于处理答题文件的系统架构示意图；

图2为本申请实施例中一种处理答题文件的方法流程示意图；

图3为一示例性文件导入界面的示意图；

图4为本申请实施例中一种处理答题文件的装置结构示意图；

图5为本申请实施例中一种计算设备的硬件结构示意图。

具体实施方式

参见图1，为本申请实施例提供的用于处理答题文件的系统结构示意图。如图1所示，该系统100包括客户端101以及服务器102。其中，客户端101以及服务器102之间存在通信连接，并可以进行正常的数据通信。

实际应用时，教师逐个批改学生提交的作业(或试卷等)进行的方式，通常会使得教师的批改效率较低、工作负荷较大，如教师可能需要批改几十或者几百个学生提交的作业/试卷等。因此，本实施例中，可以通过系统100辅助教师进行作业、试卷等答题文件的批改，以提高教师等教职人员的批改效率、减小工作负荷。

具体实现时，教职人员(如教师或者其它负责批改作业、试卷的工作人员等)可以向客户端101提供的多个答题文件，其中，不同答复答题文件包括针对同一数理主观题的答题内容。然后，客户端101可以通过与服务器102之间的通信连接，将该多个答题文件转发给服务器102。服务器102在接收到该多个答题文件后，对多个答题文件进行聚类，能够得到各个答题文件所属的类别。其中，不同类别下的答题文件的答题特征不同，同一类别下的答题文件的答题特征相同或者等价(即答题步骤在语义上是等价的)。最后，服务器102可以将各个答题文件所属的类别发送给客户端101，以便通过客户端101向教职人员分别呈现不同类别下的答题文件。

如此，由于每个类别下的多个答题文件中针对同一数理主观题的答题内容，具有相同或者语义上等价的答题特征，因此，每个类别下的多个答题文件的批改内容可以保持一致。这样，教职人员在批改答题文件时，针对客户端101呈现的每个类别下的多个答题文件，可以仅批改一份答题文件，而无需逐个批改所有答题文件，从而可以有效减少教职人员批改答题文件的数量，进而可以提高教职人员的批改效率、减小教职人员的工作负荷。

可以理解的是，图1所示的用于处理答题文件的系统100的架构仅是本申请实施例提供的一个示例，实际应用时，用于处理答题文件的系统架构不局限于图1所示示例。比如，在其它可能的实现方式中，处理答题文件的系统可以包括多个服务器，从而通过多个服务器为教职人员提供处理答题文件的云服务。或者，用于处理答题文件的系统可以仅包括位于本地的用户侧设备(如本地计算机等)，并由该用户设备执行上述服务器102所执行的处理答题文件的过程，此时，用于处理答题文件的系统可以为教职人员提供处理答题文件的本地化服务。总之，本申请实施例可以应用于任何可适用的系统中，而不局限于上述示例。

为使本申请的上述目的、特征和优点能够更加明显易懂，下面将结合附图对本申请实施例中的各种非限定性实施方式进行示例性说明。显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

参阅图2，图2示出了本申请实施例中一种处理答题文件的方法流程示意图，该方法可以应用于图1所示的系统100中，当然，也可以应用于其它可适用的系统。为便于说明与理解，下面以应用于图1所示的系统100并由服务器102执行针对多个答题文件的处理过程为例进行说明。该方法具体可以包括：

S201：获取多个答题文件，其中，不同答题文件包括针对同一数理主观题的答题内容。

本实施例中，答题文件，是指承载学生或者考生针对数理主观题的答题内容的文件，其可以是图片格式的文件，如对包括答题内容的作业或者试卷进行拍照或者扫描后所得到的图片格式的文件，或者可以是文本形式的文件，如学生或者考生在电子文档中输入答题内容所生成的文本等。本实施例中，对于答题文件的具体实现方式并不进行限定。不同答题文件中均包括学生或者考生针对同一数理主观题的答题内容(学生或者考生未答题时可以视为答题内容为空)。实际应用时，一份答题文件中可以包括一个或者多个数理主观题的答题内容，为便于理解与说明，本实施例中以服务器102根据一个数理主观题对应的答题内容执行下述聚类过程为例，而根据其余主观题对应的答题内容进行聚类的过程，可以参照本实施例所提供的聚类过程进行理解与实施。

其中，数理主观题，是指需要利用数学逻辑进行推理计算的主观题，如数学题或者物理题等。通常情况下，针对数理主观题的答题内容，多数涉及公式、定理等数学表达形式的内容，通常难以利用常规的自然语言模型通过语义聚类的方式对多个不同的答题内容进行准确聚类。举例来说，假设答题内容1中包括作答步骤“5y＝3x”，答题内容2中包括作答步骤“y＝0.6x”。可以理解，这两个作答步骤在数学原理上具有相同的语义，但是通过常规的自然语言模型所得到的向量化特征可能存在较大差异。

在一种获取答题文件的示例性实施方式中，服务器102可以通过客户端101呈现文件导入界面，并在该文件导入界面中提示用户将多个答题文件导入至客户端101中，从而服务器102可以响应用户(如教职人员)在文件导入界面上的操作，获取用户提供的多个答题文件。例如，客户端101所呈现的文件导入界面可以如图3所示，其上可以设置有文件导入控件“导入”以及文本输入框，从而用户可以在该文本输入框中输入多个答题文件的存储位置，并通过点击该“导入”控件触发客户端101将该存储位置的多个答题文件导入客户端101中，以便客户端101将该多个答题文件传输给服务器102。

当然，实际应用时，服务器102也可以是通过其他方式获取多个答题文件，本实施例对此并不进行限定。

S202：对多个答题文件进行聚类，得到各个答题文件所属的类别，其中，不同类别下的答题文件的答题特征不同，同一类别下的答题文件的答题特征相同或者等价。

本实施例中，可以根据各个答题文件的答题特征来将多个答题文件划分成多个不同的类别，每个类别下答题特征相同或者等价。其中，答题特征等价是指两个答题特征所各自对应的答题步骤在语义上是等价的。

作为一种实现示例，答题文件的答题特征可以包括第一特征以及第二特征，则在对多个答题文件进行聚类时，可以先获取各个答题文件的第一特征以及第二特征，其中，该第一特征为答题文件包括的答题内容中关键作答步骤的特征，第二特征为关键作答步骤对应的等价语义步骤的特征。

通常情况下，针对数理主观题的答题内容，通常包括一系列具有逻辑推理关系的步骤，旨在通过多个步骤的逐步推理，求解或者验证得到最终结果。其中，关键作答步骤，是指在解答数理主观题时进行演算、推导的多个步骤中的关键步骤，如求解过程中所演算得到的中间结果以及最终结果，通常也是教师批改作业/试卷时决定评分分数的依据。比如，当答题内容中包括所有的关键作答步骤时，该答题内容对应的评分分数为满分，如为15分；而当答题内容中包括部分关键作答步骤时，该答题内容对应的评分分数小于满分分数，如为5分。等价语义步骤，是指与关键作答步骤在语义上等价的步骤，如关键作答步骤为“5y＝3x”时，与其语义等价的步骤例如可以是“y＝0.6x”或者

等。实际应用时，不同学生/考生针对相同语义的作答步骤，可能采用不同的表达形式进行表征。

本实施例中，服务器102可以获取每个答题文件中关键作答步骤的第一特征以及等价语义特征对应的第二特征，以便后续利用该第一特征以及第二特征对多个答题文件进行聚类。示例性地，第一特征以及第二特征，具体可以是基于向量化进行表示的特征。

在一种获取特征的实施方式中，服务器102可以将各个答题文件输入至预先完成训练的关键步骤提取模型，并由该关键步骤提取模型输出各个答题文件的第一特征。同时，服务器102还将各个答题文件输入至预先完成训练的等价语义模型，并由该等价语义模型输出各个答题文件的第二特征。示例性地，等价语义模型可以将表达形式各异的数学文本映射到统一的向量空间，这使得虽然语义等价的不同数学文本(关键作答步骤)在原始空间相差较远，但在统一的向量空间可以距离接近。

其中，关键步骤提取模型，例如可以是基于机器阅读理解模型进行构建，例如可以是基于co-attention模型、Attention-over-attention模型或双向注意流(Bi-Directional Attention Flow，BIDAF)模型等。其中，关键步骤提取模型的训练数据，具体可以是带有关键作答步骤的标签的作答文本数据以及数理主观题的题干信息(该题干信息通常包括所需的求解内容，有助于确定关键作答步骤)。实际应用时，可以预先定义好关键步骤的定义和标注规范，并根据考试、教学大纲内容以及教师经验，对海量数理主观题的学生作答文本数据中的关键作答步骤添加标签，从而得到包括具有标签的作答文本数据以及数理主观题的训练数据，以便后续利用该训练数据可以对构建出的关键步骤提取模型进行相应的训练。

另外，等价语义模型，可以是基于深度学习模型进行构建，如通过encoder-decoder框架模型构建出等价语义模型等。其中，等价语义模型的训练数据，具体可以是具有语义标签的数学表达数据，每个数学表达数据例如可以是一个数学表达式，并且多个不同的数学表达数据可以具有相同的语义标签。比如，假设数学表达数据1为“△ABC”，数学表达数据2为“△BCA”，该数学表达数据1以及数学表达数据2所具有的语义标签相同，用于表示相同的三角形；又比如，数学表达数据3为“x>0”，数学表达数据4为“x∈(0，+∞)”，该数学表达数据3以及数学表达数据4所具有的语义标签相同，均用于表示相同的x取值范围。示例性地，可以通过公式符号计算工具和定义规则转换来构建用于训练等价语义模型的训练数据。其中，公式符号计算工具，例如可以是sympy或者scipy等第三方库，可以将需要计算或者化简才能统一格式的数学文本内容规约成统一的表达形式。定义规则转换，是指人为补充定义的表达形式转换规则。比如，对于“x>0”以及“x∈(0，+∞)”这两种数据表达式，利用公式符号计算工具可能难以将这两种具有相同语义的数据表达式进行统一，因此，可以通过人为定义转换规则的方式，将这两种数据表达式规约成统一的表达形式。

实际应用时，可以是由服务器102执行针对关键步骤提取模型以及等价语义模型的训练过程，或者也可以是由其它设备对这两个模型进行训练，并在训练完成后，将其发送给服务器102等，本实施例对此并不进行限定。其中，利用训练数据分别训练关键步骤提取模型以及等价语义模型的过程，可以参见已有的模型训练方式，本实施例对此不在进行赘述。

服务器102在利用模型获取到各个答题文件的第一特征以及第二特征后，可以对多个答题文件进行聚类，以使得每个类别下的答题文件，具有相同或者等价的关键作答步骤。

示例性地，服务器102可以根据各个答题文件之间的向量化特征，计算不同答题文件之间的向量距离，该向量距离可以表征不同答题文件之间的相似度。通常情况下，两个答题文件之间的向量距离越小，则，则两个答题文件之间的相似度越高；反之，两个答题文件之间的向量距离越大，则这两个答题文件之间的相似度越低。其中，服务器102在计算答题文件1与答题文件2之间的向量特征时，具体可以是分别计算答题文件1的第一特征与答题文件2的第一特征之间的向量距离1、答题文件1的第一特征与答题文件2的第二特征之间的向量距离2、答题文件1的第二特征与答题文件2的第一特征之间的向量距离3、答题文件1的第二特征与答题文件2的第二特征之间的向量距离4，并将向量距离1至向量距离4中数值最小的向量距离，作为这两个答题文件之间的向量距离。

然后，服务器102可以根据不同答题文件之间的向量距离，将向量距离小于预设阈值的答题文件聚集为一类。如此，可以将多个答题文件划分为多个类别。比如，假设答题内容中包括两个关键作答步骤，分别为中间作答步骤以及最终结论步骤。则，服务器102对多个答题文件进行聚类后，可以得到3个类别，其中，类别1下的答题文件中答题内容均包括相同或者语义相近的中间作答步骤，类别2下的答题文件中答题内容均包括相同或者语义相近的最终结论步骤，而类别3下的答题文件中答题内容均包括相同或者语义相近的中间作答步骤以及最终结论步骤。由于每个类别下的答题文件之间的向量距离较小，表征各个类别下的答题文件中答题内容包括的关键作答步骤相同或者语义相近。因此，即使是由教职人员对这些答题文件中的答题内容逐个进行批改，通常也会给予相同的评分分数，或者做出其它相同的批改处理。

进一步地，不同答题文件中的答题内容，即使包括相同的关键作答步骤，但是其对应的答题思路可能不同。比如，实际应用的部分场景中，基于正确的答题思路以及基于错误的答题思路，均可能会得到相同的中间结果以及最终求解结果，但是，教职人员针对正确的答题思路以及错误的答题思路分别对应的答题内容进行评分时，通常所给予的分数并不相同，如基于正确的答题思路对应的评分结果为满分，而基于错误的答题思路对应的评分结果为零分等。

基于此，在进一步可能的实施方式中，服务器102还可以结合答题文件的第三特征对多个答题文件进行聚类，该第三特征为答题文件包括的答题内容中连续作答步骤对应的推理过程的特征。具体实现时，服务器102在获取各个答题文件的第一特征、第二特征的同时，还可以将各个答题文件输入至预先完成训练的推理特征模型，得到该推理特征模型输出的第三特征，从而服务器102可以根据各个答题文件的第一特征、第二特征以及第三特征，对多个答题文件进行聚类。

例如，服务器102可以先根据各个答题文件的第一特征以及第二特征，将多个答题文件进行聚类，得到初始聚类结果，该初始聚类结果即为利用第一特征以及第二特征所确定的各个答题文件分别所属的类别。然后，服务器102再利用各个答题文件的第三特征，对初始聚类结果进行修正。例如，针对每个类别，服务器102可以计算该类别下的不同答题文件的第三特征之间的相似度，例如可以通过计算不同答题文件的第三特征对应的向量距离，确定不同答题文件的第三特征之间的相似度。这样，服务器102可以根据不同答题文件的第三特征之间的相似度(或者向量距离)，将该类别下的不同答题文件进行拆分为多个类别。并且，拆分后所得到的各个类别下的答题文件之间，不仅具有相同或者语义相近的关键作答步骤(即第一特征、第二特征相似)，而且具有相同或者相近的推理过程(即第三特征相似)。

其中，推理特征模型，可以是通过深度学习模型进行构建。例如，可以通过融合已有的自然语言模型以及分类模型，构建出推理模型模型。其中，自然语言模型用于对答题内容中的作答步骤进行识别等处理，分类模型用于确定答题内容中相邻作答步骤之间的推理关系，如并列关系、因果关系，相应的，该答题内容对应的推理过程可以通过作答步骤之间的推理关系进行描述。用于训练推理特征模型的训练数据，例如可以是海量数理主观题的学生作答文本以及对该作答文本中多个作答步骤之间的推理关系的标注，依次完成该推理特征模型的训练。

当然，实际应用时，服务器102也可以是采用其它方式，根据答题文件的特征，对多个答题文件进行聚类，如通过融合第三特征以及第二特征来对初始聚类结果进行调整等，本实施例对此并不进行限定。

S203：分别呈现不同类别下的至少一个答题文件中的答题内容。

服务器102在得到各个答题文件分别所属的类别后，可以通过客户端101呈现不同类别下的答题文件中的答题内容。其中，针对每个类别，客户端101可以仅呈现该类别下的一个答题文件中的答题内容，或者也可以是呈现多个答题文件中的答题内容，本实施例对此并不进行限定。

这样，由于每个类别下的多个答题文件中针对同一数理主观题的答题内容，具有相同或者语义相似的关键作答步骤(以及具有相同或者相似的推理过程)，因此，每个类别下的多个答题文件的批改内容可以保持一致，从而教职人员在批改答题文件时，针对客户端101呈现的每个类别下的多个答题文件，可以仅批改一份答题文件，而无需逐个批改所有答题文件，从而可以有效减少教职人员批改答题文件的数量，进而可以提高教职人员的批改效率、减小教职人员的工作负荷。

其中，教职人员在批改答题文件时，可以是对答题文件中的答题内容进行评分，也可以是对该答题内容添加批改内容，如添加正确的答题步骤等。本实施例中，以教职人员对答题内容进行评分为例，图2所示的处理答题文件的方法还可以进一步包括以下步骤：

S204：响应于针对目标类别下的目标答题文件的评分操作，获取目标答题文件对应的评分。

其中，该目标类别为服务器102聚类得到的多个类别中的任意类别，该目标答题文件，是指目标类别下的任意一个答题文件。

具体实现时，教职人员可以根据客户端101呈现的目标类别下的目标答题文件中的答题内容，在客户端101上的相应位置(如分数输入框等)输入评分分数。相应的，客户端101(或者服务器102)可以根据教职人员所执行的评分操作，确定对于该目标答题文件的评分分数。

针对服务器102聚类得到的每个类别，服务器102(以及客户端101)均可以采用上述方式，获取教职人员针对各个类别下的至少一个答题文件的评分分数。

S205：将目标答题文件对应的评分，确定为目标类别下的其它答题文件的评分。

由于每个类别下的多个答题文件中针对同一数理主观题的答题内容，具有相同或者语义上等价的答题特征(以及具有相同或者相似的推理过程)，因此，服务器102可以将教师人员针对目标答题文件对应的答题内容的评分，确定为该目标类别下的其它答题文件的评分。即，目标类别下的多个答题文件的评分，均可以是相同的评分，这使得教师人员针对该类别下的多个答题文件，仅需执行一次的审核以及评分操作即可，无需对目标类别下的多个答题文件逐个执行评分操作。如此，可以有效减少教职人员所需执行的评分操作，从而可以提高教职人员的评分效率、减小教职人员的工作负荷。同时，教职人员在对各个类别中的答题文件进行评分过程中，也可以通过针对多个答题文件的聚类结果了解学生对于数理主观题的答题情况，从而有助于教职人员分析班级学情。

此外，本申请实施例还提供了一种处理答题文件的装置。参阅图4，图4示出了本申请实施例中一种处理答题文件的装置结构示意图，该装置400包括：

第一获取模块401，用于获取多个答题文件，不同答题文件包括针对同一数理主观题的答题内容；

聚类模块402，用于对所述多个答题文件进行聚类，得到各个答题文件所属的类别，不同类别下的答题文件的答题特征不同，同一类别下的答题文件的答题特征相同或者等价；

呈现模块403，用于分别呈现不同类别下的至少一个答题文件中的答题内容。

在一种可能的实施方式中，所述答题文件的答题特征包括第一特征以及第二特征，所述聚类模块402，包括：

在一种可能的实施方式中，所述装置400还包括：

在一种可能的实施方式中，所述聚类单元，包括：

在一种可能的实施方式中，所述第一获取单元，包括：

在一种可能的实施方式中，所述第一获取模块401，包括：

呈现单元，用于呈现文件导入界面；

在一种可能的实施方式中，所述装置400还包括：

需要说明的是，上述装置各模块、单元之间的信息交互、执行过程等内容，由于与本申请实施例中方法实施例基于同一构思，其带来的技术效果与本申请实施例中方法实施例相同，具体内容可参见本申请实施例前述所示的方法实施例中的叙述，此处不再赘述。

此外，本申请实施例还提供了一种计算设备。参阅图5，图5示出了本申请实施例中一种计算设备的硬件结构示意图，该设备500可以包括处理器501以及存储器502。

其中，所述存储器502，用于存储计算机程序；

所述处理器501，用于根据所述计算机程序执行上述方法实施例中所述的处理答题文件的方法。

另外，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质用于存储计算机程序，所述计算机程序用于执行上述方法实施例中所述的处理答题文件的方法。

本申请实施例中提到的“第一获取模块”、“第一特征”等名称中的“第一”只是用来做名字标识，并不代表顺序上的第一。该规则同样适用于“第二”、“第三”等。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如只读存储器(英文：read-only memory，ROM)/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者诸如路由器等网络通信设备)执行本申请各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述仅是本申请示例性的实施方式，并非用于限定本申请的保护范围。

Claims

1.一种处理答题文件的方法，其特征在于，所述方法包括：

分别呈现不同类别下的至少一个答题文件中的答题内容。

2.根据权利要求1所述的方法，其特征在于，所述答题文件的答题特征包括第一特征以及第二特征，所述对所述多个答题文件进行聚类，得到各个答题文件所属的类别，包括：

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，所述根据所述各个答题文件的第一特征、第二特征以及第三特征，对所述多个答题文件进行聚类，包括：

5.根据权利要求3所述的方法，其特征在于，所述获取各个答题文件的第三特征，包括：

6.根据权利要求2所述的方法，其特征在于，所述获取各个答题文件的第一特征以及第二特征，包括：

7.根据权利要求2所述的方法，其特征在于，所述获取针对同一数理主观题的多个答题文件，包括：

呈现文件导入界面；

8.根据权利要求1至7任一项所述的方法，其特征在于，所述方法还包括：

9.一种处理答题文件的装置，其特征在于，所述装置包括：

10.一种计算设备，其特征在于，所述设备包括处理器以及存储器：

所述存储器用于存储计算机程序；

所述处理器用于根据所述计算机程序执行权利要求1-8中任一项所述的方法。

11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储计算机程序，所述计算机程序用于执行权利要求1-8中任一项所述的方法。