CN114639108A - 主观题的判分标记识别方法、系统、存储介质及设备 - Google Patents
主观题的判分标记识别方法、系统、存储介质及设备 Download PDFInfo
- Publication number
- CN114639108A CN114639108A CN202210541453.XA CN202210541453A CN114639108A CN 114639108 A CN114639108 A CN 114639108A CN 202210541453 A CN202210541453 A CN 202210541453A CN 114639108 A CN114639108 A CN 114639108A
- Authority
- CN
- China
- Prior art keywords
- appraising
- frame
- effective
- marks
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000003860 storage Methods 0.000 title claims abstract description 13
- 239000003086 colorant Substances 0.000 claims abstract description 77
- 238000012216 screening Methods 0.000 claims abstract description 27
- 238000004458 analytical method Methods 0.000 claims abstract description 17
- 230000002159 abnormal effect Effects 0.000 claims description 30
- 238000013507 mapping Methods 0.000 claims description 19
- 238000012360 testing method Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 8
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 5
- 238000013136 deep learning model Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 4
- 238000004519 manufacturing process Methods 0.000 claims description 4
- 238000010191 image analysis Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 7
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004140 cleaning Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明提出一种主观题的判分标记识别方法、系统、存储介质及设备,该方法包括:根据判分框的框体结构对判分框进行分割以得到若干个独立的单框;将各个单框对照干扰颜色库进行比对以将各个单框内的噪色筛出并滤除;将滤除了噪色的各个单框对照有效颜色库进行比对以将填充有有效颜色的单框筛出;将目标主观题的所有目标单框的图像输入判分标记识别模型中进行识别分析以得到每个目标单框的类型并筛选出标记有有效判分标记的目标单框,目标单框的类型包括包含有有效判分标记的单框、包含有取消判分标记的单框、包含有无效干扰标记的单框和不包含标记的单框。本发明将图像处理和识别模型的分类识别进行融合以对主观题的判分标记准确识别。
Description
技术领域
本发明涉及计算机领域,特别涉及一种主观题的判分标记识别方法、系统、存储介质及设备。
背景技术
随着计算机技术的不断发展,试卷分数识别系统目前在各种考试中也得到越来越多的使用,然而现有技术中,针对试卷主观题的判分及判分识别方法,仍然存在许多不足,如下:一、有的主观题是由老师对主观题后面附带的判分框中的分值进行填涂来实现判分,再通过计算机系统对填涂的分数进行识别以获取每道主观题的实际分值,这种判分方式虽然识别简单,但填涂起来非常麻烦,需要将填涂色彩覆盖对应分值的整个单框,极大的增加了阅卷老师的工作量,耽误阅卷进度,且该种判分方式不支持判分的更改及删除;二、有的主观题是通过手写分值进行判分,由老师在指定位置书写主观题的得分分值,再通过计算机系统对手写分值进行识别从而获取该主观题的得分,然而由于每个老师的手写风格差异很大,随意性也大,通过手写的方式进行判分容易分值识别出错,准确率不高,容易影响判分的结果,需要后续再对判分结果进行查阅校对。
发明内容
基于此,本发明的目的是提出一种主观题的判分标记识别方法、系统、存储介质及设备,以解决上述提到的问题。
根据本发明提出的主观题的判分标记识别方法,所述方法包括:
获取目标主观题的判分框的图像及所述判分框的信息,所述判分框的信息包括所述判分框的框体结构;
根据所述判分框的框体结构对所述判分框进行分割以得到若干个独立的单框;
将各个所述单框对照干扰颜色库进行比对分析以将各个所述单框内的噪色筛出并滤除,其中,所述噪色为除有效颜色以外的其它所有红色;
将滤除了噪色的各个所述单框对照有效颜色库进行比对分析以将带有有效颜色的单框筛出,其中,所述有效颜色为大部分老师在批阅试卷过程用到的红色;
对带有有效颜色的单框中的有效颜色的像素点总数进行统计并将有效颜色的像素点低于第一像素阈值的单框筛除以得到目标单框;
将所述目标主观题的所有目标单框的图像输入判分标记识别模型中进行识别分析以得到每个所述目标单框的类型并筛选出标记有有效判分标记的目标单框,其中,所述目标单框的类型包括包含有有效判分标记的单框、包含有取消判分标记的单框、包含有无效干扰标记的单框和不包含标记的单框。
综上,根据上述的主观题的判分标记识别方法,获取目标主观题的判分框的图像及所述判分框的信息,所述判分框的信息包括所述判分框的框体结构;根据所述判分框的框体结构对所述判分框进行分割以得到若干个独立的单框;将各个所述单框对照干扰颜色库进行比对分析以将各个所述单框内的噪色筛出并滤除,其中,所述噪色为除有效颜色以外的其它所有红色;将滤除了噪色的各个所述单框对照有效颜色库进行比对分析以将带有有效颜色的单框筛出,其中,所述有效颜色为大部分老师在批阅试卷过程用到的红色;对带有有效颜色的单框中的有效颜色的像素点总数进行统计并将有效颜色的像素点低于第一像素阈值的单框筛除以得到目标单框;将所述目标主观题的所有目标单框的图像输入判分标记识别模型中进行识别分析以得到每个所述目标单框的类型并筛选出标记有有效判分标记的目标单框,其中,所述目标单框的类型包括包含有有效判分标记的单框、包含有取消判分标记的单框、包含有无效干扰标记的单框和不包含标记的单框。本发明将图像处理和识别模型的分类识别进行融合以实现对主观题的判分标记的准确识别,不仅提高线下阅卷的准确率,而且能够通过对判分标记的取消以实现分数的修改或者取消给分,从而进一步提高老师线下阅卷的批阅效率。
进一步地,所述将所述目标主观题的所有目标单框的图像输入判分标记识别模型中进行识别分析以得到每个所述目标单框的类型并筛选出标记有有效判分标记的目标单框的步骤后还包括:
判断标记有有效判分标记的目标单框的数量是否正常;
若标记有有效判分标记的目标单框的数量正常,则将标记有有效判分标记的目标单框定为所述目标主观题的真实分值框。
进一步地,所述判分框的信息还包括所述判分框内分值的位数的文字标记信息和所述判分框内各单框的位置信息,所述判断标记有有效判分标记的目标单框的数量是否正常的步骤包括:
若标记有有效判分标记的目标单框的数量不只一个,则判断所述目标主观题的判分框内是否包含有十位及个位的文字标记信息;
若所述目标主观题的判分框内包含有十位及个位的文字标记信息,则根据所述判分框内各单框的位置信息判断标记有有效判分标记的各目标单框处于十位分值区域还是个位分值区域,并对十位分值区域及个位分值区域内标记有有效判分标记的目标单框的数量进行统计;
若十位分值区域或个位分值区域内标记有有效判分标记的目标单框的数量超过一个,则判定十位分值区域或个位分值区域内标记有有效判分标记的目标单框的数量异常。
进一步地,所述若十位分值区域或个位分值区域内标记有有效判分标记的目标单框的数量超过一个,则判定十位分值区域或个位分值区域内标记有有效判分标记的目标单框的数量异常的步骤后还包括:
若十位分值区域或个位分值区域内标记有有效判分标记的目标单框的数量异常,则将标记有有效判分标记的目标单框数量出现异常的分值区域定为异常分值区域,并对异常分值区域内标记有有效判分标记的目标单框中的有效颜色的像素点进行计算,再提取有效颜色的像素点最大的目标单框作为所述异常分值区域内的真实分值框。
进一步地,所述获取目标主观题的判分框的图像及所述判分框的信息的步骤前还包括:
大量获取标记有有效颜色的单框的图像,并将标记有有效颜色的单框设为第一单框;
对所述第一单框中判分标记的有效颜色的像素点的色调及对比度进行计算;
将所有所述第一单框中判分标记的有效颜色的像素点的色调及对比度通过预设算法映射到二值化图中以得到有效颜色的映射图像,并设为有效颜色库。
进一步地,所述获取目标主观题的判分框的图像及所述判分框的信息的步骤前还包括:
大量获取只带有噪色的空白的单框的图像,并将只带有噪色的空白的单框设为第二单框,其中,噪色为除有效颜色以外的其它所有红色;
对所述第二单框中的噪色的RGB值进行计算;
根据所有所述第二单框中的噪色的RGB值制作包含大部分常见噪色的RGB值的干扰颜色库。
进一步地,所述获取目标主观题的判分框的图像及所述判分框的信息的步骤前还包括:
大量获取已批阅的主观题的判分框的图像并按单框中有无标记的情况及标记的类型对判分框的图像进行分类处理,其中,所述单框中标记的类型包括有效判分标记、取消判分标记和无效干扰标记;
将分类处理后的判分框的图像输入深度学习模型进行训练学习以得到判分标记识别模型。
本发明还提供一种主观题的判分标记识别系统,包括:
获取模块;用于获取目标主观题的判分框的图像及所述判分框的信息,所述判分框的信息包括所述判分框的框体结构;
分割模块:用于根据所述判分框的框体结构对所述判分框进行分割以得到若干个独立的单框;
滤除模块:用于将各个所述单框对照干扰颜色库进行比对分析以将各个所述单框内的噪色筛出并滤除,其中,所述噪色为除有效颜色以外的其它所有红色;
筛选模块:用于将滤除了噪色的各个所述单框对照有效颜色库进行比对分析以将带有有效颜色的单框筛出,其中,所述有效颜色为大部分老师在批阅试卷过程用到的红色;
筛除模块:用于对带有有效颜色的单框中的有效颜色的像素点总数进行统计并将有效颜色的像素点低于第一像素阈值的单框筛除以得到目标单框;
识别模块:用于将所述目标主观题的所有目标单框的图像输入判分标记识别模型中进行识别分析以得到每个所述目标单框的类型并筛选出标记有有效判分标记的目标单框,其中,所述目标单框的类型包括包含有有效判分标记的单框、包含有取消判分标记的单框、包含有无效干扰标记的单框和不包含标记的单框。
本发明还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的主观题的判分标记识别方法。
本发明还提出一种主观题的判分标记识别设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的主观题的判分标记识别方法。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实施例了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明第一实施例主观题的判分标记识别方法的流程图;
图2为本发明第二实施例主观题的判分标记识别系统的系统框图;
图3为本发明第三实施例主观题的判分标记识别设备的结构示意图。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的若干实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容更加透彻全面。
需要说明的是,当元件被称为“固设于”另一个元件,它可以直接在另一个元件上或者也可以存在居中的元件。当一个元件被认为是“连接”另一个元件,它可以是直接连接到另一个元件或者可能同时存在居中元件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
实施例1
请参阅图1,本发明提出一种主观题的判分标记识别方法,该方法包括步骤S101~S106:
S101,获取目标主观题的判分框的图像及所述判分框的信息,所述判分框的信息包括所述判分框的框体结构。
需要说明的是,本发明实施例对主观题的判分方式是由老师通过红笔在答题卡的判分框中对应的分值上进行手动打勾或划线来打上判分标记,这种判分方式非常方便快捷,能够极大的提高老师的阅卷效率,然而这种判分方式在现有技术中还无法准确识别,因为在勾选过程中容易产生一些跨多个单框勾选的情况,且容易与一些无效的干扰标记发生混淆,但本发明实施例能够很好的解决这些问题。
S102,根据所述判分框的框体结构对所述判分框进行分割以得到若干个独立的单框。
S103,将各个所述单框对照干扰颜色库进行比对分析以将各个所述单框内的噪色筛出并滤除,其中,所述噪色为除有效颜色以外的其它所有红色。
具体的,干扰颜色库的制作步骤为:在所述获取目标主观题的判分框的图像及所述判分框的信息的步骤前,大量获取只带有噪色的空白的单框的图像,并将只带有噪色的空白的单框设为第二单框,其中,噪色为除有效颜色以外的其它所有红色;对所述第二单框中的噪色的RGB值进行计算;根据所有所述第二单框中的噪色的RGB值制作包含大部分常见噪色的RGB值的干扰颜色库。
其中, RGB色彩模式是工业界的一种颜色标准,是通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的,RGB即是代表红、绿、蓝三个通道的颜色,这个标准几乎包括了人类视力所能感知的所有颜色,是运用最广的颜色系统之一。在电脑中,RGB所谓的“多少”是指色调,并使用整数来表示。通常情况下,RGB各有256级色调,用数字表示为从0、1、2...直到255。而一个颜色的RGB值为该颜色中红、绿、蓝三原色的相对色调。
需要说明的是,所述将各个所述单框对照干扰颜色库进行比对分析以将各个所述单框内的噪色筛出并滤除的步骤具体包括:将各个所述单框中的颜色的RGB值进行计算并将所述单框中RGB值落入干扰颜色库的RGB值范围的颜色筛出并滤除。
S104,将滤除了噪色的各个所述单框对照有效颜色库进行比对分析以将带有有效颜色的单框筛出,其中,所述有效颜色为大部分老师在批阅试卷过程用到的红色。
具体的,有效颜色库的制作步骤为:在所述获取目标主观题的判分框的图像及所述判分框的信息的步骤前,大量获取标记有有效颜色的单框的图像,并将标记有有效颜色的单框设为第一单框;对所述第一单框中判分标记的有效颜色的像素点的色调及对比度进行计算;将所有所述第一单框中判分标记的有效颜色的像素点的色调及对比度通过预设算法映射到一张256*256的二值化图中以得到有效颜色的映射图像,并设为有效颜色库。
其中,预设算法的计算公式组为:
其中,H为所述第一单框中判分标记的像素点的色调,S为所述第一单框中判分标记的像素点的对比度,x为所述第一单框中的判分标记的颜色在二值化图中的x轴坐标点,y为所述第一单框中的判分标记的颜色在二值化图中的y轴坐标点。
需要说明的是,本发明实施例中的有效颜色为老师通常批阅试卷所用的红色,由于红色的种类很多(有深红、浅红、粉红、偏红等),难以具体界定区分,本发明通过大量采样的方式来获取实际情况下老师惯用的批阅试卷所用的红来定为有效颜色,并将有效颜色的像素点的HSV值映射到一张256*256的二值化图中,从而得到有效颜色的具体映射图像,本发明实施例在二值化图中,用白黑底色来区分有效颜色和非有效颜色,映射图像的白色区域为有效颜色区域,也可以用其他颜色来进行区分,本发明实施例中的噪色为除有效颜色以外的其它所有红色,即为处于有效颜色的红与非红之间的渐变色,一般为在图像扫描过程或试卷制作过程产生的偏色或干扰色。
需要进一步说明的是,所述将滤除了噪色的各个所述单框对照有效颜色库进行比对分析以将带有有效颜色的单框筛出,其中,所述有效颜色为大部分老师在批阅试卷过程用到的红色的步骤具体包括:将滤除了噪色的各个所述单框中的颜色的像素点的色调及对比度进行计算;根据滤除了噪色的各个所述单框中的颜色的像素点的色调及对比度并通过预设算法计算滤除了噪色的各个所述单框中的颜色在二值化图中的映射坐标值;判断滤除了噪色的各个所述单框中的颜色在二值化图中的映射坐标值是否在有效颜色库中(即是否落在有效颜色的映射图像的白色区域中),若所述单框中的颜色在二值化图中的映射坐标值在有效颜色库中,则执行以下步骤S105,对所述单框中的有效颜色的像素点总数进行统计。
S105,对带有有效颜色的单框中的有效颜色的像素点总数进行统计并将有效颜色的像素点低于第一像素阈值的单框筛除以得到目标单框。
需要说明的是,该步骤可作为初筛,以筛除一些明显不符合判分标记要求且带有有效颜色的单框,例如,第一像素阈值可以为30个,若单框中的有效颜色的像素点小于30个,则该有效颜色可能是老师在批阅的时候笔头点触造成的或者一些其他的因素导致。
S106,将所述目标主观题的所有目标单框的图像输入判分标记识别模型中进行识别分析以得到每个所述目标单框的类型并筛选出标记有有效判分标记的目标单框,其中,所述目标单框的类型包括包含有有效判分标记的单框、包含有取消判分标记的单框、包含有无效干扰标记的单框和不包含标记的单框。
需要说明的是,判分标记识别模型还可以对各目标单框的图像用数字进行标记,以表示该目标单框的类型,如标记了数字“1”的图像中的目标单框为包含有有效判分标记的单框,标记了数字“2的图像中的目标单框为包含有取消判分标记的单框,标记了数字“3的图像中的目标单框为包含有无效干扰标记的单框,标记了数字“4的图像中的目标单框为不包含标记的单框。
需要进一步说明的是,有效判分标记具体为红色长线或红色勾线,取消判分标记具体为红色画圈涂抹型、红色长线或勾上带有红色波浪线或红黑交叠线,无效干扰标记具体为红色短线或红点,不包含标记的情况为单框内无任何红色标记,这里的红色均是指本发明实施例的有效颜色。
具体的,判分标记识别模型的训练方法:在所述输入已批阅的包含主观题信息的目标试卷的步骤前,大量获取已批阅的主观题的判分框的图像并对判分框的图像进行清洗及按单框中有无标记的情况及标记的类型进行分类处理,若有些标记类型的样本数量过少或缺失,则找老师大量制作该类标记样本以做数增强并进行分类,其中,所述单框中标记的类型包括有效判分标记、取消判分标记和无效干扰标记;将分类处理后的判分框的图像输入深度学习模型进行训练学习以得到判分标记识别模型。
需要说明的是,单框的类型分为四类:包含有有效判分标记的单框、包含有取消判分标记的单框、包含有无效干扰标记的单框和不包含标记的单框,每个类型均可以用数字来指代,例如:包含有有效判分标记的单框用数字“1”来指代,包含有取消判分标记的单框用数字“2”来指代,包含有无效干扰标记的单框用数字“3”来指代,不包含标记的单框用数字“4”来指代。
其中,所述将所述目标主观题的所有目标单框的图像输入判分标记识别模型中进行识别分析以得到每个所述目标单框的类型并筛选出标记有有效判分标记的目标单框的步骤后还包括:
判断标记有有效判分标记的目标单框的数量是否正常;
若标记有有效判分标记的目标单框的数量正常,则将标记有有效判分标记的目标单框定为所述目标主观题的真实分值框。
进一步的,所述判分框的信息还包括所述判分框内分值的位数的文字标记信息和所述判分框内各单框的位置信息,所述判断标记有有效判分标记的目标单框的数量是否正常的步骤包括:
若标记有有效判分标记的目标单框的数量不只一个,则判断所述目标主观题的判分框内是否包含有十位及个位的文字标记信息;
若所述目标主观题的判分框内包含有十位及个位的文字标记信息,则根据所述判分框内各单框的位置信息判断标记有有效判分标记的各目标单框处于十位分值区域还是个位分值区域,并对十位分值区域及个位分值区域内标记有有效判分标记的目标单框的数量进行统计;
若十位分值区域或个位分值区域内标记有有效判分标记的目标单框的数量超过一个,则判定十位分值区域或个位分值区域内标记有有效判分标记的目标单框的数量异常。
进一步的,所述若十位分值区域或个位分值区域内标记有有效判分标记的目标单框的数量超过一个,则判定十位分值区域或个位分值区域内标记有有效判分标记的目标单框的数量异常的步骤后还包括:
若十位分值区域或个位分值区域内标记有有效判分标记的目标单框的数量异常,则将标记有有效判分标记的目标单框数量出现异常的分值区域定为异常分值区域,并对异常分值区域内标记有有效判分标记的目标单框中的有效颜色的像素点进行计算,再提取有效颜色的像素点最大的目标单框作为所述异常分值区域内的真实分值框。
需要说明的是,由于在实际判分过程中,可能会出现一个红色的判分标记横跨多个单框、比较宽的判分标记,例如,老师的本意是判分在分值5上,但判分标记标记在了5和4的分值单框上,而5的分值单框中的标记要明显大于4的分值单框中的标记,这种情况下,4的分值单框很有可能在经过步骤S105及S106之后就被筛除,若没被筛除,则对5和4的分值单框中的有效颜色的像素点分别进行计算并进行对比,取有效颜色的像素点更大的那个分值单框作为对应主观题的真实分值框。
在对主观题的实际判分及判分识别中,有以下几种情况:一、若该主观题的判分框中不存在个位、十位的文字标记信息及0.5的分值数字,则说明该主观题的实际分值只需通过一个单框的分值来体现,因此,标记有有效判分标记的目标单框不应超过1个,若超过1个,则说明该主观题标记有有效判分标记的目标单框的数量异常,则需要对标记有有效判分标记的目标单框中的有效颜色的像素点进行计算并筛选有效颜色的像素点最大的目标单框作为该主观题的真实分值框。
二、若该主观题的判分框中存在个位及十位的文字标记信息,则说明该主观题的实际分值可能会出现:有一个十位分值及一个个位分值、只有一个个位分值或者一个分值都没有的情况,而无论哪种实际情况,十位分值与个位分值均不会超过1个,因此,对应的十位分值区域内标记有有效判分标记的目标单框不应超过1个,及个位分值区域内标记有有效判分标记的目标单框也不应超过1个,若不符合这种数量要求,则说明该主观题标记有有效判分标记的目标单框的数量异常,若十位分值区域内标记有有效判分标记的目标单框超过了1个,则对十位分值区域内标记有有效判分标记的目标单框中的有效颜色的像素点进行计算并提取有效颜色的像素点最大的目标单框作为该分值区域内的真实分值框,若个位分值区域内标记有有效判分标记的目标单框超过了1个,则对个位分值区域内标记有有效判分标记的目标单框中的有效颜色的像素点进行计算并提取有效颜色的像素点最大的目标单框作为该分值区域内的真实分值框。
三、若该主观题的判分框中存在0.5的分值数字,那么0.5的分值数字一定排在判分框的最后一个单框中,因此,判分标记识别模型对最后一个目标单框的识别结果就可以作为该主观题的0.5分值框的实际判分结果,而在对主观题标记有有效判分标记的目标单框的数量是否正常进行判断时不将最后一个单框计算在内,若数量异常,则需要对标记有有效判分标记的目标单框中的有效颜色的像素点进行计算并筛选有效颜色的像素点最大的目标单框作为该主观题的真实分值框。
综上,根据上述的主观题的判分标记识别方法,获取目标主观题的判分框的图像及所述判分框的信息,所述判分框的信息包括所述判分框的框体结构;根据所述判分框的框体结构对所述判分框进行分割以得到若干个独立的单框;将各个所述单框对照干扰颜色库进行比对分析以将各个所述单框内的噪色筛出并滤除,其中,所述噪色为除有效颜色以外的其它所有红色;将滤除了噪色的各个所述单框对照有效颜色库进行比对分析以将带有有效颜色的单框筛出,其中,所述有效颜色为大部分老师在批阅试卷过程用到的红色;对带有有效颜色的单框中的有效颜色的像素点总数进行统计并将有效颜色的像素点低于第一像素阈值的单框筛除以得到目标单框;将所述目标主观题的所有目标单框的图像输入判分标记识别模型中进行识别分析以得到每个所述目标单框的类型并筛选出标记有有效判分标记的目标单框,其中,所述目标单框的类型包括包含有有效判分标记的单框、包含有取消判分标记的单框、包含有无效干扰标记的单框和不包含标记的单框。本发明将图像处理和识别模型的分类识别进行融合以实现对主观题的判分标记的准确识别,不仅提高线下阅卷的准确率,而且能够通过对判分标记的取消以实现分数的修改或者取消给分,从而进一步提高老师线下阅卷的批阅效率。
实施例2
请参阅图2,本发明还提出一种主观题的判分标记识别系统,该系统包括:
获取模块:用于获取目标主观题的判分框的图像及所述判分框的信息,所述判分框的信息包括所述判分框的框体结构。
分割模块:用于根据所述判分框的框体结构对所述判分框进行分割以得到若干个独立的单框。
滤除模块:用于将各个所述单框对照干扰颜色库进行比对分析以将各个所述单框内的噪色筛出并滤除,其中,所述噪色为除有效颜色以外的其它所有红色。
所述获取模块还用于:大量获取只带有噪色的空白的单框的图像,并将只带有噪色的空白的单框设为第二单框,其中,噪色为除有效颜色以外的其它所有红色;对所述第二单框中的噪色的RGB值进行计算;根据所有所述第二单框中的噪色的RGB值制作包含大部分常见噪色的RGB值的干扰颜色库。
筛选模块:用于将滤除了噪色的各个所述单框对照有效颜色库进行比对分析以将带有有效颜色的单框筛出,其中,所述有效颜色为大部分老师在批阅试卷过程用到的红色。
所述获取模块还用于:在所述获取目标主观题的判分框的图像及所述判分框的信息的步骤前,大量获取标记有有效颜色的单框的图像,并将标记有有效颜色的单框设为第一单框;对所述第一单框中判分标记的有效颜色的像素点的色调及对比度进行计算;将所有所述第一单框中判分标记的有效颜色的像素点的色调及对比度通过预设算法映射到二值化图中以得到有效颜色的映射图像,并设为有效颜色库。
筛除模块:用于对带有有效颜色的单框中的有效颜色的像素点总数进行统计并将有效颜色的像素点低于第一像素阈值的单框筛除以得到目标单框。
识别模块:用于将所述目标主观题的所有目标单框的图像输入判分标记识别模型中进行识别分析以得到每个所述目标单框的类型并筛选出标记有有效判分标记的目标单框,其中,所述目标单框的类型包括包含有有效判分标记的单框、包含有取消判分标记的单框、包含有无效干扰标记的单框和不包含标记的单框。
所述获取模块还用于:大量获取已批阅的主观题的判分框的图像并对判分框的图像进行清洗及按单框中有无标记的情况及标记的类型进行分类处理,若有些标记类型的样本数量过少或缺失,则找老师大量制作该类标记样本以做数增强并进行分类,其中,所述单框中标记的类型包括有效判分标记、取消判分标记和无效干扰标记;将分类处理后的判分框的图像输入深度学习模型进行训练学习以得到判分标记识别模型。
所述识别模块还用于:
判断标记有有效判分标记的目标单框的数量是否正常;
若标记有有效判分标记的目标单框的数量正常,则将标记有有效判分标记的目标单框定为所述目标主观题的真实分值框。
所述识别模块还用于:
若标记有有效判分标记的目标单框的数量不只一个,则判断所述目标主观题的判分框内是否包含有十位及个位的文字标记信息;
若所述目标主观题的判分框内包含有十位及个位的文字标记信息,则根据所述判分框内各单框的位置信息判断标记有有效判分标记的各目标单框处于十位分值区域还是个位分值区域,并对十位分值区域及个位分值区域内标记有有效判分标记的目标单框的数量进行统计;
若十位分值区域或个位分值区域内标记有有效判分标记的目标单框的数量超过一个,则判定十位分值区域或个位分值区域内标记有有效判分标记的目标单框的数量异常。
所述识别模块还用于:
若十位分值区域或个位分值区域内标记有有效判分标记的目标单框的数量异常,则将标记有有效判分标记的目标单框数量出现异常的分值区域定为异常分值区域,并对异常分值区域内标记有有效判分标记的目标单框中的有效颜色的像素点进行计算,再提取有效颜色的像素点最大的目标单框作为所述异常分值区域内的真实分值框。
实施例3
请参考图3,本发明还提出一种主观题的判分标记识别设备,包括存储器20、处理器10以及存储在存储器上并可在处理器上运行的计算机程序30,所述处理器10执行所述计算机程序30时实现如上述的主观题的判分标记识别方法。
其中,所述主观题的判分标记识别设备具体可以为计算机、服务器、上位机等,处理器10在一些实施例中可以是中央处理器(Central Processing Unit, CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器20中存储的程序代码或处理数据,例如执行访问限制程序等。
其中,存储器20至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器20在一些实施例中可以是主观题的判分标记识别设备的内部存储单元,例如该主观题的判分标记识别设备的硬盘。存储器20在另一些实施例中也可以是主观题的判分标记识别设备的外部存储装置,例如主观题的判分标记识别设备上配备的插接式硬盘,智能存储卡(SmartMedia Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)等。进一步地,存储器20还可以既包括主观题的判分标记识别设备的内部存储单元也包括外部存储装置。存储器20不仅可以用于存储安装于主观题的判分标记识别设备的应用软件及各类数据,还可以用于暂时地存储已经输出或者将要输出的数据。
需要指出的是,图3示出的结构并不构成对主观题的判分标记识别设备的限定,在其它实施例当中,该主观题的判分标记识别设备可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
本发明实施例还提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述的主观题的判分标记识别方法。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明的保护范围应以所附权利要求为准。
Claims (10)
1.一种主观题的判分标记识别方法,其特征在于,所述方法包括:
获取目标主观题的判分框的图像及所述判分框的信息,所述判分框的信息包括所述判分框的框体结构;
根据所述判分框的框体结构对所述判分框进行分割以得到若干个独立的单框;
将各个所述单框对照干扰颜色库进行比对分析以将各个所述单框内的噪色筛出并滤除,其中,所述噪色为除有效颜色以外的其它所有红色;
将滤除了噪色的各个所述单框对照有效颜色库进行比对分析以将带有有效颜色的单框筛出,其中,所述有效颜色为大部分老师在批阅试卷过程用到的红色;
对带有有效颜色的单框中的有效颜色的像素点总数进行统计并将有效颜色的像素点低于第一像素阈值的单框筛除以得到目标单框;
将所述目标主观题的所有目标单框的图像输入判分标记识别模型中进行识别分析以得到每个所述目标单框的类型并筛选出标记有有效判分标记的目标单框,其中,所述目标单框的类型包括包含有有效判分标记的单框、包含有取消判分标记的单框、包含有无效干扰标记的单框和不包含标记的单框。
2.根据权利要求1所述的主观题的判分标记识别方法,其特征在于,所述将所述目标主观题的所有目标单框的图像输入判分标记识别模型中进行识别分析以得到每个所述目标单框的类型并筛选出标记有有效判分标记的目标单框的步骤后还包括:
判断标记有有效判分标记的目标单框的数量是否正常;
若标记有有效判分标记的目标单框的数量正常,则将标记有有效判分标记的目标单框定为所述目标主观题的真实分值框。
3.根据权利要求2所述的主观题的判分标记识别方法,其特征在于,所述判分框的信息还包括所述判分框内分值的位数的文字标记信息和所述判分框内各单框的位置信息,所述判断标记有有效判分标记的目标单框的数量是否正常的步骤包括:
若标记有有效判分标记的目标单框的数量不只一个,则判断所述目标主观题的判分框内是否包含有十位及个位的文字标记信息;
若所述目标主观题的判分框内包含有十位及个位的文字标记信息,则根据所述判分框内各单框的位置信息判断标记有有效判分标记的各目标单框处于十位分值区域还是个位分值区域,并对十位分值区域及个位分值区域内标记有有效判分标记的目标单框的数量进行统计;
若十位分值区域或个位分值区域内标记有有效判分标记的目标单框的数量超过一个,则判定十位分值区域或个位分值区域内标记有有效判分标记的目标单框的数量异常。
4.根据权利要求3所述的主观题的判分标记识别方法,其特征在于,所述若十位分值区域或个位分值区域内标记有有效判分标记的目标单框的数量超过一个,则判定十位分值区域或个位分值区域内标记有有效判分标记的目标单框的数量异常的步骤后还包括:
若十位分值区域或个位分值区域内标记有有效判分标记的目标单框的数量异常,则将标记有有效判分标记的目标单框数量出现异常的分值区域定为异常分值区域,并对异常分值区域内标记有有效判分标记的目标单框中的有效颜色的像素点进行计算,再提取有效颜色的像素点最大的目标单框作为所述异常分值区域内的真实分值框。
5.根据权利要求1所述的主观题的判分标记识别方法,其特征在于,所述获取目标主观题的判分框的图像及所述判分框的信息的步骤前还包括:
大量获取标记有有效颜色的单框的图像,并将标记有有效颜色的单框设为第一单框;
对所述第一单框中判分标记的有效颜色的像素点的色调及对比度进行计算;
将所有所述第一单框中判分标记的有效颜色的像素点的色调及对比度通过预设算法映射到二值化图中以得到有效颜色的映射图像,并设为有效颜色库。
6.根据权利要求1所述的主观题的判分标记识别方法,其特征在于,所述获取目标主观题的判分框的图像及所述判分框的信息的步骤前还包括:
大量获取只带有噪色的空白的单框的图像,并将只带有噪色的空白的单框设为第二单框,其中,噪色为除有效颜色以外的其它所有红色;
对所述第二单框中的噪色的RGB值进行计算;
根据所有所述第二单框中的噪色的RGB值制作包含大部分常见噪色的RGB值的干扰颜色库。
7.根据权利要求1所述的主观题的判分标记识别方法,其特征在于,所述获取目标主观题的判分框的图像及所述判分框的信息的步骤前还包括:
大量获取已批阅的主观题的判分框的图像并按单框中有无标记的情况及标记的类型对判分框的图像进行分类处理,其中,所述单框中标记的类型包括有效判分标记、取消判分标记和无效干扰标记;
将分类处理后的判分框的图像输入深度学习模型进行训练学习以得到判分标记识别模型。
8.一种主观题的判分标记识别系统,其特征在于,包括:
获取模块;用于获取目标主观题的判分框的图像及所述判分框的信息,所述判分框的信息包括所述判分框的框体结构;
分割模块:用于根据所述判分框的框体结构对所述判分框进行分割以得到若干个独立的单框;
滤除模块:用于将各个所述单框对照干扰颜色库进行比对分析以将各个所述单框内的噪色筛出并滤除,其中,所述噪色为除有效颜色以外的其它所有红色;
筛选模块:用于将滤除了噪色的各个所述单框对照有效颜色库进行比对分析以将带有有效颜色的单框筛出,其中,所述有效颜色为大部分老师在批阅试卷过程用到的红色;
筛除模块:用于对带有有效颜色的单框中的有效颜色的像素点总数进行统计并将有效颜色的像素点低于第一像素阈值的单框筛除以得到目标单框;
识别模块:用于将所述目标主观题的所有目标单框的图像输入判分标记识别模型中进行识别分析以得到每个所述目标单框的类型并筛选出标记有有效判分标记的目标单框,其中,所述目标单框的类型包括包含有有效判分标记的单框、包含有取消判分标记的单框、包含有无效干扰标记的单框和不包含标记的单框。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7任一项所述的主观题的判分标记识别方法。
10.一种主观题的判分标记识别设备,其特征在于,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1-7任一项所述的主观题的判分标记识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210541453.XA CN114639108B (zh) | 2022-05-19 | 2022-05-19 | 主观题的判分标记识别方法、系统、存储介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210541453.XA CN114639108B (zh) | 2022-05-19 | 2022-05-19 | 主观题的判分标记识别方法、系统、存储介质及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114639108A true CN114639108A (zh) | 2022-06-17 |
CN114639108B CN114639108B (zh) | 2022-08-09 |
Family
ID=81952987
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210541453.XA Active CN114639108B (zh) | 2022-05-19 | 2022-05-19 | 主观题的判分标记识别方法、系统、存储介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114639108B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101894250A (zh) * | 2010-08-05 | 2010-11-24 | 北京商纳科技有限公司 | 一种用光标阅读机统计主观题分数的方法 |
CN105389836A (zh) * | 2014-09-04 | 2016-03-09 | 陕西鸥玛信息科技有限责任公司 | 一种图像涂点聚合编码识别卡 |
CN105844255A (zh) * | 2016-04-07 | 2016-08-10 | 北京华云天科技有限公司 | 主观题阅卷方法及其装置 |
CN107220610A (zh) * | 2017-05-23 | 2017-09-29 | 杭州施强教育科技有限公司 | 一种应用于阅卷系统的主观题分数识别方法 |
CN109460762A (zh) * | 2018-10-19 | 2019-03-12 | 南京理工大学 | 一种基于图像识别的答题卡评分方法 |
CN110321837A (zh) * | 2019-07-02 | 2019-10-11 | 南京怀宇科技有限公司 | 一种试题得分的识别方法、装置、终端及存储介质 |
CN113408520A (zh) * | 2021-07-16 | 2021-09-17 | 北京南昊科技股份有限公司 | 有痕阅卷方法、批阅装置及存储介质 |
CN113762274A (zh) * | 2021-11-10 | 2021-12-07 | 江西风向标教育科技有限公司 | 一种答题卡目标区域检测方法、系统、存储介质及设备 |
CN113822847A (zh) * | 2021-06-03 | 2021-12-21 | 腾讯科技(深圳)有限公司 | 基于人工智能的图像评分方法、装置、设备及存储介质 |
CN113903039A (zh) * | 2021-09-29 | 2022-01-07 | 中教云智数字科技有限公司 | 一种基于颜色的答题卡答案区域采集的方法 |
-
2022
- 2022-05-19 CN CN202210541453.XA patent/CN114639108B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101894250A (zh) * | 2010-08-05 | 2010-11-24 | 北京商纳科技有限公司 | 一种用光标阅读机统计主观题分数的方法 |
CN105389836A (zh) * | 2014-09-04 | 2016-03-09 | 陕西鸥玛信息科技有限责任公司 | 一种图像涂点聚合编码识别卡 |
CN105844255A (zh) * | 2016-04-07 | 2016-08-10 | 北京华云天科技有限公司 | 主观题阅卷方法及其装置 |
CN107220610A (zh) * | 2017-05-23 | 2017-09-29 | 杭州施强教育科技有限公司 | 一种应用于阅卷系统的主观题分数识别方法 |
CN109460762A (zh) * | 2018-10-19 | 2019-03-12 | 南京理工大学 | 一种基于图像识别的答题卡评分方法 |
CN110321837A (zh) * | 2019-07-02 | 2019-10-11 | 南京怀宇科技有限公司 | 一种试题得分的识别方法、装置、终端及存储介质 |
CN113822847A (zh) * | 2021-06-03 | 2021-12-21 | 腾讯科技(深圳)有限公司 | 基于人工智能的图像评分方法、装置、设备及存储介质 |
CN113408520A (zh) * | 2021-07-16 | 2021-09-17 | 北京南昊科技股份有限公司 | 有痕阅卷方法、批阅装置及存储介质 |
CN113903039A (zh) * | 2021-09-29 | 2022-01-07 | 中教云智数字科技有限公司 | 一种基于颜色的答题卡答案区域采集的方法 |
CN113762274A (zh) * | 2021-11-10 | 2021-12-07 | 江西风向标教育科技有限公司 | 一种答题卡目标区域检测方法、系统、存储介质及设备 |
Non-Patent Citations (3)
Title |
---|
G.JAGADAMBA等: "Online Subjective answer verifying system Using Artificial Intelligence", 《2020 FOURTH INTERNATIONAL CONFERENCE ON I-SMAC (IOT IN SOCIAL, MOBILE, ANALYTICS AND CLOUD) (I-SMAC)》 * |
查卫亮: "主观题自动评分算法分析与实现", 《软件导刊》 * |
王逸凡 等: "基于语义相似度及命名实体识别的主观题自动评分方法", 《电子测量技术》 * |
Also Published As
Publication number | Publication date |
---|---|
CN114639108B (zh) | 2022-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108596166B (zh) | 一种基于卷积神经网络分类的集装箱箱号识别方法 | |
CN105913093B (zh) | 一种用于文字识别处理的模板匹配方法 | |
WO2021003824A1 (zh) | 基于图像识别的违章建筑识别方法、装置 | |
Chung et al. | Efficient shadow detection of color aerial images based on successive thresholding scheme | |
CN107491730A (zh) | 一种基于图像处理的化验单识别方法 | |
CN108764358B (zh) | 一种太赫兹图像识别方法、装置、设备及可读存储介质 | |
CN105205489B (zh) | 基于颜色纹理分析器与机器学习的车牌检测方法 | |
CN110648322A (zh) | 一种子宫颈异常细胞检测方法及系统 | |
CN109948566B (zh) | 一种基于权重融合与特征选择的双流人脸反欺诈检测方法 | |
CN111259891B (zh) | 一种自然场景下身份证识别方法、装置、设备和介质 | |
CN111639629B (zh) | 一种基于图像处理的猪只体重测量方法、装置及存储介质 | |
CN109584202A (zh) | 图像处理装置、方法和非暂时性计算机可读存储介质 | |
CN109740572A (zh) | 一种基于局部彩色纹理特征的人脸活体检测方法 | |
CN113283431B (zh) | 一种答题卡选项区域识别方法及系统 | |
CN111860369A (zh) | 一种欺诈识别方法、装置以及存储介质 | |
CN107358184A (zh) | 文档文字的提取方法及提取装置 | |
CN107195069A (zh) | 一种人民币冠字号自动识别方法 | |
CN111784675A (zh) | 物品纹理信息处理的方法、装置、存储介质及电子设备 | |
LU102950B1 (en) | Tobacco plant counting method based on uav remote sensing technology and image processing technology | |
CN108877030B (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
CN112686872B (zh) | 基于深度学习的木材计数方法 | |
CN113392819A (zh) | 一种批量化学术图像自动分割标注装置和方法 | |
CN114639108B (zh) | 主观题的判分标记识别方法、系统、存储介质及设备 | |
TWI498830B (zh) | 不均勻光線下的車牌辨識方法及系統 | |
CN115937085B (zh) | 一种基于神经网络学习的核性白内障图像处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |