CN111931486A

CN111931486A - 一种人工评分用样卷筛选的方法及装置

Info

Publication number: CN111931486A
Application number: CN202010809385.1A
Authority: CN
Inventors: 胡杰; 汪张龙; 潘泽亮; 徐福乡; 詹重轮
Original assignee: Guangdong Xunfei Qiming Technology Development Co ltd
Current assignee: Guangdong Xunfei Qiming Technology Development Co ltd
Priority date: 2020-08-12
Filing date: 2020-08-12
Publication date: 2020-11-13

Abstract

本申请实施例公开了一种人工评分用样卷筛选的方法及装置。本申请实施例提供的技术方案，通过对大量考生试卷进行手写字体识别以及对文字内容进行智能评分，然后为其匹配对应的分数区间；最后从对应分数区间选择出预设数量的文本内容作为样卷以供打分专家进行进一步的筛选。通过本申请实施例的方案大大降低了人工挑选过程中出现纰漏而导致的挑选出的效果不好的情况，通过采用机器识别辅助人工选择的方式来进行样本选取，提升了样本覆盖面且提升了样本选择的准确性，本申请实施例的方案具有较高的可操作性，较小的系统复杂度和较好的实用性。

Description

一种人工评分用样卷筛选的方法及装置

技术领域

本申请实施例涉及自然语言理解技术领域，尤其涉及一种人工评分用样卷筛选的方法及装置。

背景技术

现有的四级、六级翻译题和作文题评分主要人工网上阅卷的方式。在评卷之前需要对打分员进行打分培训，其中重要的一环是根据样卷进行培训。

样卷是从考生试卷中挑出的每个分数段具有代表性的一份试卷。评分专家组用样卷对每个打分员进行打分培训，让打分员更好的掌握每个分段的试卷应该是什么水平，从而有效的保障评分质量。

目前采用的挑样卷的方式是纯人工挑选：从全集数据中随机抽出一部分样本，然后逐个进行人工挑选，在每个分数段挑选出一篇样本，存在的弊端是样本量太小，不具有代表性，并且需要耗费很大的人力成本。因此设计一种能够进行样卷数量挑选的方案成为本领域技术人员亟待解决的技术问题。

发明内容

本申请实施例提供一种人工评分用样卷筛选的方法及装置，通过采用手写字体识别来对考生试卷内容进行识别，并通过智能评分来对识别得到的内容进行评分，最后综合字数、语义评分以及卷面整洁情况来对考生试卷进行筛选得到用于后续培训样卷。

在第一方面，本申请实施例提供了一种人工评分用样卷筛选的方法，包括：

接收用户输入的考生试卷图像；

通过手写字体识别技术对所述考生试卷图像进行识别得到对应的文本内容；

对所述文本内容进行智能评分以得到与所述文本内容对应的评分结果，并根据所述评分结果为所述文本内容匹配对应的分数区间；

从各个分数区间中筛选出预设数量的文本内容作为样卷，并输出所述样卷。

进一步的，在所述从各个分数区间中筛选出预设数量的文本内容作为样卷，并输出所述样卷之后，还包括：

响应于用户反馈的重新筛选操作；

根据所述重新筛选操作从对应分数区间中筛选出新的文本内容作为新的样卷。

进一步的，在所述根据所述重新筛选信号从对应分数区间中筛选出新的文本内容作为新的样卷之后，还包括：

响应于用户反馈的信息确认操作，输出所述新的样卷。

进一步的，在所述通过手写字体识别技术对所述考生试卷图像进行识别得到对应的文本内容之后，还包括：

根据所述文本内容确定对应的文章字数；

通过图像识别来识别卷面情况。

进一步的，所述从各个分数区间中筛选出预设数量的文本内容作为样卷，包括：

根据预设筛选条件从各个分数区间中筛选出预设数量的文本内容作为样卷，所述预设筛选条件包括文章字数、评分结果和卷面情况。

进一步的，所述接收用户输入的考生试卷图像，包括：

接收用户输入的所有的考生试卷图像。

响应于用户的点选操作，对与所述点选操作对应的样卷进行存储。

在第二方面，本申请实施例提供了一种人工评分用样卷筛选的装置，包括：

接收模块：用于接收用户输入的考生试卷图像；

识别模块：用于通过手写字体识别技术对所述考生试卷图像进行识别得到对应的文本内容；

区间匹配模块：用于对所述文本内容进行智能评分以得到与所述文本内容对应的评分结果，并根据所述评分结果为所述文本内容匹配对应的分数区间；

输出模块：用于从各个分数区间中筛选出预设数量的文本内容作为样卷，并输出所述样卷。

在第三方面，本申请实施例提供了一种电子设备，包括：

存储器以及一个或多个处理器；

所述存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如第一方面所述的人工评分用样卷筛选的方法。

在第四方面，本申请实施例提供了一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面所述的人工评分用样卷筛选的方法。

本申请实施例通过对大量考生试卷进行手写字体识别以及对文字内容进行智能评分，然后为其匹配对应的分数区间；最后从对应分数区间选择出预设数量的文本内容作为样卷以供打分专家进行进一步的筛选。通过本申请实施例的方案大大降低了人工挑选过程中出现纰漏而导致的挑选出的效果不好的情况，通过采用机器识别辅助人工选择的方式来进行样本选取，提升了样本覆盖面且提升了样本选择的准确性，本申请实施例的方案具有较高的可操作性，较小的系统复杂度和较好的实用性。

附图说明

图1是本申请实施例提供的一种人工评分用样卷筛选的方法的流程图；

图2是本申请实施例提供的字数以及卷面情况确定的流程示意图；

图3是本申请实施例提供的样卷重新筛选的流程示意图；

图4是本申请实施例提供的一种人工评分用样卷筛选的装置的结构示意图；

图5是本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚，下面结合附图对本申请具体实施例作进一步的详细描述。可以理解的是，此处所描述的具体实施例仅仅用于解释本申请，而非对本申请的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本申请相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理，但是其中的许多操作可以被并行地、并发地或者同时实施。此外，各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

目前采用的挑样卷的方式是纯人工挑选：从全集数据中随机抽出一部分样本，然后逐个进行人工挑选，在每个分数段挑选出一篇样本，存在的弊端是样本量太小，不具有代表性，并且需要耗费很大的人力成本。基于此，本申请实施例通过对大量考生试卷进行手写字体识别以及对文字内容进行智能评分，然后为其匹配对应的分数区间；最后从对应分数区间选择出预设数量的文本内容作为样卷以供打分专家进行进一步的筛选。通过本申请实施例的方案大大降低了人工挑选过程中出现纰漏而导致的挑选出的效果不好的情况，通过采用机器识别辅助人工选择的方式来进行样本选取，提升了样本覆盖面且提升了样本选择的准确性，本申请实施例的方案具有较高的可操作性，较小的系统复杂度和较好的实用性。

图1给出了本申请实施例提供的一种人工评分用样卷筛选的方法的流程图，本实施例中提供的人工评分用样卷筛选的方法可以由人工评分用样卷筛选的设备执行，该人工评分用样卷筛选的设备可以通过软件和/或硬件的方式实现，该人工评分用样卷筛选的设备可以是两个或多个物理实体构成，也可以是一个物理实体构成。一般而言，该人工评分用样卷筛选的设备可以是电脑，手机，平板或后台服务器等。

下述以后台服务器为执行人工评分用样卷筛选的方法的设备为例，进行描述。参照图1，该人工评分用样卷筛选的方法具体包括：

S101：接收用户输入的考生试卷图像。

本步骤主要是为了获取到对应的考生试卷图像，可以通过拍摄图片或者图像扫描的方式来获取到对应的考生试卷图像。然后截取对应的翻译题部分以及作文题部分内容作为后续内容评判的基础。由于采用图像拍摄或者扫描的方式，进而可以采集到所有考生的试卷图像。更为优选的，所述接收用户输入的考生试卷图像，包括：

接收用户输入的所有的考生试卷图像。

在进行处理时，可以选取一部分考生试卷作为后续数据评判的基准，也可以将所有考生试卷图像作为后续数据识别的基准。在本申请实施例中，将接收所有考生试卷图像作为更为优选的实施方式，直接通过采集全集数据来进行得到的数据更具代表性，避免了现有方案中不能覆盖全集考生数据的缺陷。现有的针对于四、六级考试中的翻译题和作文题都是随机挑选1000份作为样本池，然后基于上述内容进行样卷信息的挑选，由于数量有限，且不能够覆盖所有考生，因此数据存在一定的偏差，并且由于采用的是人工阅读的方式，上述数据量对于人工阅读来说，仍然具备较高的工作量。通过本申请实施例的方式，由于采用机器进行识别评判，大大提高了工作效率，减轻人工负担，且由于采用机器识别的方式可以使得数据挑选范围可以从5000份扩展到10万份甚至是全集，使得样本采集的范围更具代表性。一般的四六级有几百万的考生，具体随机选择十万份来作为输入即可有很高的覆盖面。S102：通过手写字体识别技术对所述考生试卷图像进行识别得到对应的文本内容。

一般的在四、六级考试过程中，采用的是手写答题的方式，因此需要采用手写字体识别技术来对考生的答卷进行识别。通过手写字体识别技术将识别到的文字转换为计算机可读的内容信息，以便于后续进行字数统计、语义识别以及智能打分。

更为优选的，图2是本申请实施例提供的字数以及卷面情况确定的流程示意图，如图2所示，在所述通过手写字体识别技术对所述考生试卷图像进行识别得到对应的文本内容之后，还包括：

S1021：根据所述文本内容确定对应的文章字数；

S1022：通过图像识别来识别所述考生试卷图像的卷面情况。

通过上述识别得到更多维度的数据来与对应的文本内容进行关联，通过多维度的信息关联能够使得后续样卷的挑选更为的全面，可以选择涉及到更多方面的样卷，有利于评分教学的培训。

S103：对所述文本内容进行智能评分以得到与所述文本内容对应的评分结果，并根据所述评分结果为所述文本内容匹配对应的分数区间。

本步骤主要是对文本内容进行评分，通过对文本进行智能评分来得到其文本对应的评分结果，本实施例得到的评分结果更多的是参考性质的评分结果，其作为一个文本评价维度来进行实施。本实施例中智能评分，进行评分时可以依据多个评分特征以及预先构建完成的评分模型来对文本内容进行评分。

示例性的，评分特征包括有如下几方面的特征：词汇特征、文采特征、篇章结构特征、词汇及语义特征等等来进行具体评分判断。并且除了上述特征之外，还可以参考语义理解以及表达是否优美等内容来进行相应的模型构建进而完成最终的作文或者翻译评分。比如，作文分数总共为30分的；18分为基础分，如果满足一些基础的条件则可以判断对应的作文为18分以上；这些基础条件可以是字数、语句是否通顺、语法错误出现的次数等。如果上述条件均处于合格范围，且其文章结构、优美句子等有更多的亮点，则可以匹配更好分数。如果其没有较好的文章结构、优美句子等，且语法错误出现的次数较多，那么可以扣除对应的分数。

在具体实施时，将1-30分成多个区间，具体的，可以以5分为一个区间，也即是将25-30分为一个区间为第一区间，20-25分为一个区间为第二区间，15-20分为一个区间为第三区间，10-15分为一个区间为第四区间，5-10分为一个区间为第五区间，0-5分为一个区间为第六区间；有上述多组区间，当为作文评定得到一个分数时，比如评分结果为22，则将其分配至第二区间内。通过智能评分对所有考生的作文进行一个评估，然后为其匹配对应的区间，从而获得大量经过标记的数据内容。本实施例中以作文来作为示例性说明，在进行具体实施时，可以依照同样的技术内容对翻译题目进行数据处理，故而作文以及翻译等文字理解类型题目均处于本申请所要求保护范围之内。

S104：从各个分数区间中筛选出预设数量的文本内容作为样卷，并输出所述样卷。

通过上述区间匹配，则可以得到大量数据，这些数据都有对应的区间内容，比如可以得到从十万份考生数据，处于第一区间的有5％，处于第二区间的有30％，处于第三区间的有35％，处于第四区间的有15％，处于第五区间的有10％，处于第六区间的有5％这样。因为需要选择的是样卷，故而可以从各个分数区间挑选出预设数量的作为样卷。示例性的，预设数量可以为10份，也即是在第一区间、第二区间、第三区间、第四区间、第五区间以及第六区间中均挑选出10份文本作为样卷；也即是总共选出60份样卷供打分专家进行审阅，10份样卷尽量在各项数据上存在一定的差异，这边便于后续打分专家挑选出更符合需求的样卷内容。上述60份样卷相对于原有的5000份在数量上大大降低，并且具有相当好的代表性。

打分专家从系统挑选出的每个分数区间的10份样本里筛选出最符合条件的两份sample卷最为样本最终结果，并经由打分专家给每个最终样本进行人工打分确定最终的分数。如果没有符合条件的sample卷，则由系统再挑选每个分段10份样卷，交由专家进行最终挑选，如此往复，直至出最终结果。由于系统挑出的样本由机器处理而来，是大批量样本，所以能代表全集数据的特性，专家也只需要从最终的部分数据中挑选，极大地减少了人工的工作量，提升了效率，并且极大降低了出错的可能性。

示例性的，图3是本申请实施例提供的样卷重新筛选的流程示意图，如图3所示，在步骤S104之后，还包括：

S105：响应于用户反馈的重新筛选操作；

S106：根据所述重新筛选操作从对应分数区间中筛选出新的文本内容作为新的样卷。

也即是有可能在实际选择过程中，打分专家从给出的样卷中并不能够选择出来比较具有代表性的内容，因此，打分专家可以点击重新筛选按键来进行样卷的重新筛选。比如，打分专家在阅读完系统提供的处于第一区间的10份样卷之后，发现还是不够满意，认为其并不能够代表第一区间的实力，因此可以点击重新筛选，然后匹配出新的10份或者5份来供打分专家进一步筛选，在进行在再一次的筛选时，可以将打分专家看过的那些样卷进行剔除，以便于再次选择到对应的内容。通过上述不断筛选知道专家满意为止。

更为优选的，在步骤S106之后还包括：

响应于用户反馈的信息确认操作，输出所述新的样卷。

也即是当打分专家看到比较满意的内容之后，输出新的样卷作为对应区间的代表作品以供后续进行培训使用。

更为优选的，在所述从各个分数区间中筛选出预设数量的文本内容作为样卷，并输出所述样卷之后，还包括：

系统提供所有的样卷以供打分专家进行筛选，打分专家可以通过点选来选择不同的文本内容作为最终输出的样卷；本实施例提及的点选可以是通过鼠标点选的方式也可以是通过触摸屏点选的方式来进行操作，当检测到打分专家挑选完所有作品时，则对打分专家选择的样卷信息进行存储。

更为优选的，所述从各个分数区间中筛选出预设数量的文本内容作为样卷，包括：

为了选择出更具有代表性的方案，可以使得机器从多个角度来进行样卷信息的筛选。比如可以从文章字数、评分结果和卷面情况。通过提供文章字数、评分结果和卷面情况这三个维度提供了筛选方式，使得最终选择出的结果更具代表性。在步骤S102中可以得到文本内容对应的文章字数以及卷面情况，在步骤S103中可以得到对应的评分结果，因此，在本步骤进行内容筛选时，可以依据这几个特征来进行选择，处于相同区间的10份样卷，其文章字数、分数以及卷面涂抹情况均不同，这样可以让得到的10份样卷能够覆盖到不同的方面可以尽量让得到的10份样卷更具有代表性，提供的样本具有较高的代表性之后，可以大大提高打分专家的效率，也即是采用机器智能识别的方式提前进行一轮智能筛选，使得人工检查的量很小。

本申请实施例的方案基于这些样本以及智能评分结果，对每个分数区间挑选出10份样本。并且为了确保可选择样本的多样性，让10份样本的字数尽量处于不同区间，以及从语义理解、卷面涂抹情况等角度，让10分样本覆盖到不同区间，让样本更具有代表性，最终提供这些具有代表性的样本作为专家挑选的输入。本申请实施例中，进行样本智能评分并不代表最终选择的结果，由于机器无法完全理解作文的标准，故而机器方面的评分是作为后续筛选的一个维度来进行处理，然后结合字数、语音、卷面等角度进行聚类，筛选出具有代表性且相互不重复的数据，每个分数区间各挑选10份，交由评分专家挑选最终样本结果，这样有较高的可操作性、较小的系统复杂度、较好的实用性。最终由专家确定作文的分数，如果某个分段的10个样本中挑选不出符合条件的样本，可以重复挑选，直到打分专家可以挑出满意的sample卷。用图文识别转写、语义理解以及智能评分技术对四、六级翻译题和作文题sample样卷进行预处理，辅助人工进行样卷的挑选，减少人工工作量、降低人工出错概率。极大地加大了挑选sample样卷的样本覆盖面，提升准确性、样本更具代表性；先用机器智能筛选出一轮sample卷结果，机器效率高，可以从全集数据或者大范围数据中挑选，使样本更具有代表性。

本申请实施例的方案目的也并不是取代专家达到机器评价作文的目的，而是提供一种辅助手段来帮助专家完成相对机械的内容筛选，从全集数据中筛选出合适的样卷信息来供参考使用，最终信息的确认以及作文分数的确定需要由专家来确定，这样使得本申请实施例的方案系统复杂度较小，且具有较高的实用性，能够在降低人工工作量的情况下筛选出符合要求的样卷内容。

在上述实施例的基础上，图4为本申请实施例提供的一种人工评分用样卷筛选的装置的结构示意图。参考图4，本实施例提供的人工评分用样卷筛选的装置具体包括：

接收模块21：用于接收用户输入的考生试卷图像；

识别模块22：用于通过手写字体识别技术对所述考生试卷图像进行识别得到对应的文本内容；

区间匹配模块23：用于对所述文本内容进行智能评分以得到与所述文本内容对应的评分结果，并根据所述评分结果为所述文本内容匹配对应的分数区间；

输出模块24：用于从各个分数区间中筛选出预设数量的文本内容作为样卷，并输出所述样卷。

本申请实施例提供的人工评分用样卷筛选的装置可以用于执行上述实施例提供的人工评分用样卷筛选的方法，具备相应的功能和有益效果。

图5是本申请实施例提供的一种电子设备的结构示意图，参照图5，该电子设备包括：处理器31、存储器32、通信模块33、输入装置34及输出装置35。该电子设备中处理器31的数量可以是一个或者多个，该电子设备中的存储器32的数量可以是一个或者多个。该电子设备的处理器31、存储器32、通信模块33、输入装置34及输出装置35可以通过总线或者其他方式连接。

存储器32作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块，如本申请任意实施例所述的人工评分用样卷筛选的方法对应的程序指令/模块(例如，人工评分用样卷筛选的装置中的接收模块21、识别模块22、区间匹配模块23和输出模块24)。存储器32可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据设备的使用所创建的数据等。此外，存储器32可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储器可进一步包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

通信模块33用于进行数据传输。

处理器31通过运行存储在存储器32中的软件程序、指令以及模块，从而执行设备的各种功能应用以及数据处理，即实现上述的人工评分用样卷筛选的方法。

输入装置34可用于接收输入的数字或字符信息，以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置35可包括显示屏等显示设备。

上述提供的电子设备可用于执行上述实施例提供的人工评分用样卷筛选的方法，具备相应的功能和有益效果。

本申请实施例还提供一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器31执行时用于执行一种人工评分用样卷筛选的方法，该人工评分用样卷筛选的方法包括：

接收用户输入的考生试卷图像；

存储介质——任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括：安装介质，例如CD-ROM、软盘或磁带装置；计算机系统存储器或随机存取存储器，诸如DRAM、DDR RAM、SRAM、EDO RAM，兰巴斯(Rambus)RAM等；非易失性存储器，诸如闪存、磁介质(例如硬盘或光存储)；寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外，存储介质可以位于程序在其中被执行的第一计算机系统中，或者可以位于不同的第二计算机系统中，第二计算机系统通过网络(诸如因特网)连接到第一计算机系统。第二计算机系统可以提供程序指令给第一计算机用于执行。术语“存储介质”可以包括驻留在不同位置中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器31执行的程序指令(例如具体实现为计算机程序)。

当然，本申请实施例所提供的一种包含计算机可执行指令的存储介质，其计算机可执行指令不限于如上所述的人工评分用样卷筛选的方法，还可以执行本申请任意实施例所提供的人工评分用样卷筛选的方法中的相关操作。

上述实施例中提供的人工评分用样卷筛选的装置、存储介质及电子设备可执行本申请任意实施例所提供的人工评分用样卷筛选的方法，未在上述实施例中详尽描述的技术细节，可参见本申请任意实施例所提供的人工评分用样卷筛选的方法。

上述仅为本申请的较佳实施例及所运用的技术原理。本申请不限于这里所述的特定实施例，对本领域技术人员来说能够进行的各种明显变化、重新调整及替代均不会脱离本申请的保护范围。因此，虽然通过以上实施例对本申请进行了较为详细的说明，但是本申请不仅仅限于以上实施例，在不脱离本申请构思的情况下，还可以包括更多其他等效实施例，而本申请的范围由权利要求的范围决定。

Claims

1.一种人工评分用样卷筛选的方法，其特征在于，包括：

接收用户输入的考生试卷图像；

2.根据权利要求1所述的人工评分用样卷筛选的方法，其特征在于，在所述从各个分数区间中筛选出预设数量的文本内容作为样卷，并输出所述样卷之后，还包括：

响应于用户反馈的重新筛选操作；

3.根据权利要求2所述的人工评分用样卷筛选的方法，其特征在于，在所述根据所述重新筛选信号从对应分数区间中筛选出新的文本内容作为新的样卷之后，还包括：

响应于用户反馈的信息确认操作，输出所述新的样卷。

4.根据权利要求1所述的人工评分用样卷筛选的方法，其特征在于，在所述通过手写字体识别技术对所述考生试卷图像进行识别得到对应的文本内容之后，还包括：

根据所述文本内容确定对应的文章字数；

通过图像识别来识别所述考生试卷图像的卷面情况。

5.根据权利要求4所述的人工评分用样卷筛选的方法，其特征在于，所述从各个分数区间中筛选出预设数量的文本内容作为样卷，包括：

6.根据权利要求1所述的人工评分用样卷筛选的方法，其特征在于，所述接收用户输入的考生试卷图像，包括：

接收用户输入的所有的考生试卷图像。

7.根据权利要求1所述的人工评分用样卷筛选的方法，其特征在于，在所述从各个分数区间中筛选出预设数量的文本内容作为样卷，并输出所述样卷之后，还包括：

8.一种人工评分用样卷筛选的装置，其特征在于，包括：

接收模块：用于接收用户输入的考生试卷图像；

9.一种电子设备，其特征在于，包括：

存储器以及一个或多个处理器；

所述存储器，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-7任一所述的人工评分用样卷筛选的方法。

10.一种包含计算机可执行指令的存储介质，其特征在于，所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7任一所述的人工评分用样卷筛选的方法。