CN108764074A - 基于深度学习的主观题智能阅卷方法、系统及存储介质 - Google Patents

基于深度学习的主观题智能阅卷方法、系统及存储介质 Download PDF

Info

Publication number
CN108764074A
CN108764074A CN201810455795.3A CN201810455795A CN108764074A CN 108764074 A CN108764074 A CN 108764074A CN 201810455795 A CN201810455795 A CN 201810455795A CN 108764074 A CN108764074 A CN 108764074A
Authority
CN
China
Prior art keywords
word
character
answer
subjective item
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810455795.3A
Other languages
English (en)
Other versions
CN108764074B (zh
Inventor
吕蕾
胡克军
刘良
刘一良
刘弘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Normal University
Original Assignee
Shandong Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Normal University filed Critical Shandong Normal University
Priority to CN201810455795.3A priority Critical patent/CN108764074B/zh
Publication of CN108764074A publication Critical patent/CN108764074A/zh
Application granted granted Critical
Publication of CN108764074B publication Critical patent/CN108764074B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Character Input (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了基于深度学习的主观题智能阅卷方法、系统及存储介质,包括:获取答题卡的图像;对所获取的图像进行预处理;利用OpenCV的图像分割处理对答题卡图像进行切分,切分为客观题的答题区域和主观题的答题区域;然后,采用OMR方式对客观题的答题区域进行识别;采用OCR方式对主观题的答题区域进行识别;将客观题和主观题的标准答案均录入到数据库中;所述主观题,包括:设有标准答案的主观题和没有标准答案的主观题;依次统计出客观题和主观题的分值。如果在阅卷过程中发现异常分值的试卷,则需要人工评阅干预,实现对异常试卷的纠偏处理。

Description

基于深度学习的主观题智能阅卷方法、系统及存储介质
技术领域
本发明涉及计算机辅助阅卷领域,尤其涉及基于深度学习的主观题智能阅卷方法、系统及存储介质。
背景技术
近年来,答题卡识别系统以及被社会熟知多年,一直在发展进步,随着大数据时代和云计算的到来,网上阅卷也根据需求逐渐改进和完善。目前主要包括传统的光学字符识别OCR(Optical Character Recognition)和光学标记识别OMR(Optical MarkRecognition),它们是目前解决录入数据信息最有效的良好总手段,通过光学成像的方法,将图像中的数据信息输入到计算机中,并对图像中的信息进行有效识的识别过程。
OCR(Optical Character Recognition)方法:首先通过采集工具将待处理的信息或其他文档扫描录入;然后在此基础之上进行一定的图像处理;其次,根据相应的字符特征进行相应的识别;最后,生成计算机系统可以识别和处理的信息。在整个过程中,图像划分是一个关键的技术,文字识别及处理是该技术主要的应用对象。其优点是,在进行数据录入的时候,OCR被当作首选方案,OCR亦随着其应用范围的越来越广和计算机技术的快速发展越来越成熟。但是,虽然其在该领域有着广泛的应用,但其字符特征抽取步骤却很耗时,对于实时性要求高的场景来说,很难满足用户的实时性需求。
OMR(Optical Mark Recognition)方法:标记的识别是通过光学扫描的方式实现的,该技术要求标记必须以一定的形式呈现;然后,通过一系列的模/数转换将其所需表达的数据生成得到计算机系统可识别和处理的信息。在此流程中精确迅速的录入信息是其鲜明的特点。同时,OMR在实际应用中也有一些限制,信息卡上的“涂点”如果与电眼没有完全对齐的话,不能精确的识别,即在倾斜信息卡时不能精确的识别;折皱的信息卡不能识别;低印刷质量的纸张以及纸张本身质量不高的信息卡也不能识别;一定要按照规范填涂标记,否则识别效果会受到很大的影响。故在实际应用环境下,信息卡在扫描仪扫描成像,有倾斜时会出现识别出错的情况。
发明内容
针对现有技术中存在的不足,本发明提供了基于深度学习的主观题智能阅卷方法、系统及存储介质,依托互联网和云计算技术,通过大数据分析,为学校用户提供更加真实的考试分析数据、为学生家庭用户提供更具有参考价值的个性化考试分析报告,最终达到提高学生学业水平、减轻教师负担、提高教师学生教与学效率。
作为本发明的第一方面,提供了基于深度学习的主观题智能阅卷方法;
基于深度学习的主观题智能阅卷方法,包括:
步骤(1):获取答题卡的图像;
步骤(2):对所获取的图像进行预处理;利用OpenCV的图像分割处理对答题卡图像进行切分,切分为客观题的答题区域和主观题的答题区域;然后,采用OMR方式对客观题的答题区域进行识别;采用OCR方式对主观题的答题区域进行识别;
步骤(3):将客观题和主观题的标准答案均录入到数据库中;所述主观题,包括:设有标准答案的主观题和没有标准答案的主观题;
针对客观题,利用客观题的答题内容与客观题标准答案的匹配结果,实现对客观题的评阅,统计出客观题的分值;
针对设有标准答案的主观题,利用OCR文字识别方法对图像中的文字进行识别,利用关键词匹配方式将答题区域的文字与标准答案进行匹配,实现对设有标准答案的主观题的评阅,统计出设有标准答案的主观题的分值;
针对没有标准答案的主观题,先通过人工设置试卷特征,再通过深度学习训练好一个卷积神经网络模型,利用训练好的卷积神经网络模型,实现对没有标准答案的主观题的评阅,统计出没有标准答案的主观题的分值范围;
步骤(4):如果在阅卷过程中发现异常分值的试卷,则需要人工评阅干预,实现对异常试卷的纠偏处理。
作为本发明的进一步改进,所述步骤(1)的答题卡为通用答题卡或自制的统一模板答题卡;获取答题卡的图像的方式为扫描或拍照。
作为本发明的进一步改进,所述步骤(2)的采用OMR方式对客观题的答题区域进行识别,包括:
步骤(201):对客观题的答题区域进行灰度和二值化处理;
步骤(202):对二值化处理的结果,采用双边滤波算法进行平滑处理;
步骤(203):对经过平滑处理的图像,进行图像位置矫正处理。
作为本发明的进一步改进,所述步骤(2)的采用OCR方式对主观题的答题区域进行识别,包括:
步骤(211):对主观题的答题区域进行灰度和二值化处理;
步骤(212):对二值化处理结果进行图像位置矫正处理。
所述图像位置矫正处理:将经过平滑处理的图像进行投影,经过平滑处理的图像的边缘位置标记会在所投影的图像上生成相应的标记,根据标记确定待矫正图像的位置,根据待矫正图像边缘与标准水平方向或标准垂直方向相差的角度,将待矫正图像的位置进行旋转实现图像矫正。
作为本发明的进一步改进,所述步骤(3)的针对设有标准答案的主观题,利用关键词匹配方式将答题区域的内容与标准答案进行匹配,实现对设有标准答案的主观题的评阅,统计出设有标准答案的主观题的分值,是指:
步骤(301):针对主观题标准答案,利用词库生成算法对长字符串进行切分处理,切分成若干个短字符串,然后,再将短字符串进行分割,生成标准词库;所述长字符串是指字符串长度超过设定阈值的字符串;所述短字符串是指字符串长度不超过设定阈值的字符串;
步骤(302):针对答题区域的内容,首先去除空格和去除空行,然后,再以标点符号为依据,实现分句处理;
步骤(303):对步骤(302)得到的分句处理结果,采用正向最大分词算法,将待分析的句子与专业名词库进行匹配,得到第一分词结果;然后再将与专业名词库匹配失败的内容与普通词典库进行匹配,得到第二分词结果;第一分词结果和第二分词结果合并为总的分词结果;
步骤(304):关键词提取:将提取的关键词与标准词库进行匹配;计算匹配相似度;若匹配相似度大于设定阈值,则匹配成功;否则匹配失败,根据匹配结果,计算主观题答题区域的得分。
作为本发明的进一步改进,所述步骤(301)的具体步骤为:
步骤(3011):针对标准答案,把长字符串分解成若干短字符串;
步骤(3012):将标准答案依据单字字典,将得到的短字符串分割为单个的词序列;
步骤(3013):若有新的标准答案录入,则返回步骤(3011),否则,输出标准词库。
作为本发明的进一步改进,所述步骤(302)的具体步骤为:
步骤(3021):判断待处理的字符串是否为空,如果字符串不为空,跳转到步骤(3022);如果为空,直接结束;
步骤(3022):提取字符串里最左边的一个字符,判断其是否为标点符号字符,如果不是跳转到步骤(3023);如果是,跳转到步骤(3024);
步骤(3023):遍历下一个字符是否为标点符号字符,如果是,跳转到步骤(3024);如果不是,重复执行步骤(3023);
步骤(3024):把当前字符串里的标点符号删除,将被删除的标点符号前面的字符串输出到指定数组,索引值加1,然后跳转到步骤(3021)。
作为本发明的进一步改进,所述步骤(303)的具体步骤为:
步骤(3031):获取专业名词库中最长词的长度,设为n;
步骤(3032):从步骤(302)得到的分句处理结果中的第一个字开始,从左到右提取n个字;
步骤(3033):将提取的n个字,在专业名词库中进行匹配,若匹配成功,就将提取的n个字从分句处理结果中分割出来;
步骤(3034):若匹配不成功,就将最后面的一个字去掉,再用余下的字重新在专业名词词库里匹配,若匹配成功,就将提取的字从分句处理结果中分割出来,否则,重复步骤(3034),直到n=0,转入步骤(3035);
步骤(3035):当n=0时,取出没有在专业名词库中匹配成功的词,在普通词库中继续匹配;
步骤(3036):当在普通词库中匹配成功时,将匹配成功的词从文本中分离出来,从文本里的第n+1字开始向后再取n个字,返回步骤(3033);
步骤(3037):当最后剩余字数不足n个时,就将剩余字里的最后面的一个字去除掉,再将剩余的字重新在普通词典库里匹配,重复步骤(3037),直到剩余字数为1,查找结束,输出词串。
所述关键词提取的步骤如下:
步骤(3041):遍历词串中的各个词,如果遍历至词的尾部,就结束;否则进入步骤(3042);
步骤(3042):判断待提取的词是否是实词,如果不是,返回至(3041);如果是,进入步骤(3043);
步骤(3043):把待提取的词提取出来,返回步骤(3041)。
所述计算匹配相似度的步骤如下:
步骤(3044):将考生答案关键词S1分割成单个的字符,分割后的字符为u1,u2,…,un
步骤(3045):查找首字符u1是否在标准答案关键词S2里出现,若没有出现就标记为0;若出现就标记为l,然后将S2中出现的u1去掉,继续判断下一个字符,直到将字符u1,u2,…,un全部判断完;
步骤(3046):计算出u1,u2,…,un在S2里总共出现的次数m,得到的就是S1与S2的贴近度N(S1,S2)=m/n,其中,n表示S1中字符个数。
作为本发明的进一步改进,所述步骤(3)的针对没有标准答案的主观题,先通过人工设置试卷特征,再通过深度学习训练好一个卷积神经网络模型,利用训练好的卷积神经网络模型,实现对没有标准答案的主观题的评阅,统计出没有标准答案的主观题的分值范围。
针对没有标准答案的主观题,设置三个特征:词汇数量、段落数量和涂改区域个数,
从训练试卷样本中提取词汇数量特征、段落数量特征、涂改区域个数特征;
建立词汇数量特征、段落数量特征、涂改区域个数特征与分值范围之间的对应关系;
将每个训练试卷样本的词汇数量特征、段落数量特征、涂改区域个数特征和对应的分值范围均输入到卷积神经网络模型中,对卷积神经网络模型进行训练,输出训练好的卷积神经网络模型;
然后从测试试卷样本中提取词汇数量特征、段落数量特征和涂改区域个数特征;
将所提取的测试试卷样本的词汇数量特征、段落数量特征和涂改区域个数特征输入到训练好的卷积神经网络模型中,输出测试样本的分值范围。
所述词汇数量特征的获取方式为:
利用OCR文字识别方法对图像中的文字进行识别,将识别结果通过分词字典进行分词,然后对分词结果进行数量统计,得到词汇数量特征。
所述段落数量特征的获取方式为:
步骤(a):利用OCR文字识别方法对图像中的字符进行识别,初始段落数量为零;设定指针的位置,指针的位置指向第一个字符;
步骤(b):判断指针指向的当前字符是否为文字;
若不是,则指针的位置加一,返回步骤(b)继续判断;
若是,则指针的位置加一,判断下一个字符是否是空格,如果下一个字符是空格,则表明当前字符与之前的若干个字符构成一个段落,累计段落数量加一;
如果下一个字符不是空格,则指针的位置加一,继续寻找下一个字符,直至找到字符是空格为止,累积段落数量加一;
指针位置加一,返回步骤(b)继续判断,直至所有字符被判断完为止,输出段落数量。
所述涂改区域个数特征的获取方式为:
针对没有标准答案的主观题进行拍照,然后,进行图像灰度化处理;
然后,将图像平均划分为若干个区域,计算每个区域内的灰度平均值,如果灰度平均值超过设定阈值,则认为当前区域为涂改区域,累计涂改区域的个数。
表1词汇数量特征、段落数量特征、涂改区域个数特征与分值范围之间的对应关系
词汇数量(单位:个) 段落数量(单位:个) 涂改区域个数(单位:个) 分值范围
800及其以上 8及其以上 1、2 81到100
601到800 6、7 3、4 61到80
401到600 4、5 5、6 41到60
201到400 3、4 7、8 21到40
0到200 1、2 9及其以上 0到20
模型的每一次训练,阅卷老师都可以进行人工的干预,保证模型的准确度,避免因模型的不成熟出现异常分值。
作为本发明的第二方面,提供了基于深度学习的主观题智能阅卷系统;
基于深度学习的主观题智能阅卷系统,包括:存储器、处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成上述任一方法所述的步骤。
作为本发明的第三方面,提供了一种计算机可读存储介质;
一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令被处理器运行时,完成上述任一方法所述的步骤。
专业名词库与普通词典库解释:专业名词库为某个专业的专用术语或技术术语,除去专用术语的词库为普通词典库。比如“等边三角形的三个角相等”这句话,专业名词库词表为:等边三角形;普通词典库词表为:的、相等。
与现有技术相比,本发明的有益效果是:
深度学习技术在智能阅卷过程中发挥了巨大作用,具体表现在以下四个方面:
1.本发明将OMR识别用于客观题评阅,OCR识别用于主观题,并结合深度学习的神经网络进行模型的训练,达到对客观题和主观题的快速评阅,旨在提升阅卷的数量、质量、效率。
2.随着训练样本和卷积层数的增加,模型性能也在逐渐的提升,评阅的准确度也会越来越高。对于评阅人来说,在阅卷的前期需要干预的程度较高;越是到了后期,人工干预的越少。对于大批量的主观题评阅能在很大程度上减少阅卷人的工作量。
3.对于利用深度学习的CNN卷积神经网络训练的模型进行试卷评判后会有一些异常的试卷,比如某篇写作分值很低,可以通过人工干预修正结果。
4.训练好的模型应用场景广泛。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1为本发明中的方法流程图;
图2为本发明中的名词解释及简答题自动阅卷过程流程图;
图3为本发明中的分句算法流程图;
图4为本发明中的正向最大匹配算法改进的分词算法流程图;
图5为本发明中的关键词提取流程图;
图6为本发明中的相似度计算流程图。
具体实施方式
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
本发明中首先通过专用的高速扫描设备将考生试卷扫描成图片,客观题用OMR识别处理,首先经过灰度处理,然后进行二值化处理,这样图像就剩下两个维度,背景是黑色,前景为白色,其次通过平滑和矫正处理,对扫描成像后有偏差的图像进行一个矫正,方便后期的处理。
对于主观题,我们使用OCR识别。首先将图像进行二值化处理,然后进行倾斜矫正,其次进行特征的提取,再次进行特征数据比对。我们使用线图(Chart)对句子进行分析,保证分割后句子语义的完整性。在分析的过程中我们需要使用本发明中提到的分句算法进行句子的切割处理,然后使用正向最大匹配算法改进分词算法,其次通过关键词的提取以方便后续相似度的计算。最后通过相似度的计算就可以得出本题目考生所得分值。
深度学习模型的训练,将试卷通过专用扫描仪器,把试卷扫面成图片。利用OpenCV的图像分割处理,将整张试卷进行切分;教师设置一套通用的多层次的综合评估一篇作文质量的解决方案;让机器学习这套方案,由阅卷老师进行一定数量的试卷评阅,具体的阅卷份数由此次考试回收的试卷数决定,训练样本过少会导致后期机器自主阅卷出现评分误差,训练样本过多又会增加人工耗时;然后通过深度学习算法,利用CNN卷积神经训练好一个模型,并保存到系统数据库,使机器利用训练好的模型,自动对剩下的试卷进行智能打分;智能评分结束,对于评分异常的试卷,通过人工干预的方法,修改评分。
该方法在大数据背景下通过深度学习的卷积神经网络针对有标准答案的主观题的评阅以及无标准答案的主观题评阅进行了改进和优化,使用该方法可以加快网上阅卷的速度、效率、质量,使人工成本大大降低,减少了人工阅卷的时间,避免因为长时间的阅卷导致阅卷人出现疲劳状态。该方法的在进行试卷批阅的过程中,可以进行批处理,且处理速度快,准确率高。
本发明适用于任何可扫描的标准化试卷,不需要单独印刷标准制式的答题卡。在以下实施例中主要是针对主观题的评阅进行详细的阐述。
实施例:
本实施例的目的是提供一种深度学习的智能阅卷方法。
为了实现上述目的,本发明采用如下一种技术方案:
如图1所示,该方法包括:
基于深度学习的主观题智能阅卷方法,包括:
步骤(1):获取答题卡的图像;
步骤(2):对所获取的图像进行预处理;利用OpenCV的图像分割处理对答题卡图像进行切分,切分为客观题的答题区域和主观题的答题区域;然后,采用OMR方式对客观题的答题区域进行识别;采用OCR方式对主观题的答题区域进行识别;
步骤(3):将客观题和主观题的标准答案均录入到数据库中;所述主观题,包括:设有标准答案的主观题和没有标准答案的主观题;
针对客观题,利用客观题的答题内容与客观题标准答案的匹配结果,实现对客观题的评阅,统计出客观题的分值;
针对设有标准答案的主观题,利用OCR文字识别方法对图像中的文字进行识别,利用关键词匹配方式将答题区域的文字与标准答案进行匹配,实现对设有标准答案的主观题的评阅,统计出设有标准答案的主观题的分值;如图2所示;
针对没有标准答案的主观题,先通过人工设置试卷特征,再通过深度学习训练好一个卷积神经网络模型,利用训练好的卷积神经网络模型,实现对没有标准答案的主观题的评阅,统计出没有标准答案的主观题的分值范围;
步骤(4):如果在阅卷过程中发现异常分值的试卷,则需要人工评阅干预,实现对异常试卷的纠偏处理。
本发明适用于任何可扫描的标准化试卷,不需要单独印刷标准制式的答题卡。在以下实施例中主要是针对主观题的评阅进行详细的阐述。
所述步骤(1)的答题卡为通用答题卡或自制的统一模板答题卡;获取答题卡的图像的方式为扫描或拍照。
作为本发明的进一步改进,所述步骤(2)的采用OMR方式对客观题的答题区域进行识别,包括:
步骤(201):对客观题的答题区域进行灰度和二值化处理;
步骤(202):对二值化处理的结果,采用双边滤波算法进行平滑处理;
步骤(203):对经过平滑处理的图像,进行图像位置矫正处理。
作为本发明的进一步改进,所述步骤(2)的采用OCR方式对主观题的答题区域进行识别,包括:
步骤(211):对主观题的答题区域进行灰度和二值化处理;
步骤(212):对二值化处理结果进行图像位置矫正处理。
所述图像位置矫正处理:将经过平滑处理的图像进行投影,经过平滑处理的图像的边缘位置标记会在所投影的图像上生成相应的标记,根据标记确定待矫正图像的位置,根据待矫正图像边缘与标准水平方向或标准垂直方向相差的角度,将待矫正图像的位置进行旋转实现图像矫正。
在本发明中,使用最大类间方差(Otsu)算法实现图像二值化处理具体步骤为:
步骤(2-1):获取图像包含的像素个数n,其灰度级的范围[0,t-1](0≤t≤255),fi代表灰度级是i的像素点的数量,Pi代表图像里灰度级是i的像素点存在的概率。
步骤(2-2):通过使用阈值T将图像的像素按照灰度值划分为目标类与前景类(G0,G1),所以可以得到G0={0,1,2,...,T},G1={T+1,T+2,...,t-1}。
即G0,G1的概率用W0与W1表示
G0,G1的平均灰度用u0,u1表示
其中
即类间方差为:
通过上述公式决定σ2大小的是T的取值,T的取值范围是[0,t-1],T在该范围内取值,只有σ2最大的时候所带入的T值才是Otsu算法的最佳阈值。
步骤(2-3):只要被检测的像素点的灰度值大于T就将其设置成255,小于等于T就设值成0。
按照此方法处理过的图像只包含黑白两个颜色,这样把灰度级分为目标类与背景类,实现了图像的二值化处理。
所述步骤(3)中将带有标准答案的客观题和主观题录入到系统中,针对客观题,由系统自定判别考生答案正确与否;而对于主观题,我们这里需要用词库生成算法对原始语料进行预处理,用分句算法对答案文本进行分句,最后利用“线图分析法”进行句法分析,保证分割后,句子在语义上保持通顺。
在本实例中,步骤(3)中的词库生成算法步骤(301)的具体步骤为:
步骤(3011):针对标准答案,把长字符串分解成若干短字符串;
步骤(3012):将标准答案依据单字字典,将得到的短字符串分割为单个的词序列;
步骤(3013):若有新的标准答案录入,则返回步骤(3011),否则,输出标准词库。
如图3所示,所述步骤(302)的具体步骤为:
步骤(3021):判断待处理的字符串是否为空,如果字符串不为空,跳转到步骤(3022);如果为空,直接结束;
步骤(3022):提取字符串里最左边的一个字符,判断其是否为标点符号字符,如果不是跳转到步骤(3023);如果是,跳转到步骤(3024);
步骤(3023):遍历下一个字符是否为标点符号字符,如果是,跳转到步骤(3024);如果不是,重复执行步骤(3023);
步骤(3024):把当前字符串里的标点符号删除,将被删除的标点符号前面的字符串输出到指定数组,索引值加1,然后跳转到步骤(3021)。
由于在很多考试中,专有名词占有一定的比例,如果只是通过普通的词库对句子进行分词处理,那么在提取词语时会出现不同程度的分词错误。为了解决这个问题,采用正向最大分词算法,先将待分析的句子与专业名词库进行匹配,然后再与普通词典库重新比对一次,这样,在很大程度上增大了分词的准确度。
如图4所示,所述步骤(303)的具体步骤为:
步骤(3031):获取专业名词库中最长词的长度,设为n;
步骤(3032):从步骤(302)得到的分句处理结果中的第一个字开始,从左到右提取n个字;
步骤(3033):将提取的n个字,在专业名词库中进行匹配,若匹配成功,就将提取的n个字从分句处理结果中分割出来;
步骤(3034):若匹配不成功,就将最后面的一个字去掉,再用余下的字重新在专业名词词库里匹配,若匹配成功,就将提取的字从分句处理结果中分割出来,否则,重复步骤(3034),直到n=0,转入步骤(3035);
步骤(3035):当n=0时,取出没有在专业名词库中匹配成功的词,在普通词库中继续匹配;
步骤(3036):当在普通词库中匹配成功时,将匹配成功的词从文本中分离出来,从文本里的第n+1字开始向后再取n个字,返回步骤(3033);
步骤(3037):当最后剩余字数不足n个时,就将剩余字里的最后面的一个字去除掉,再将剩余的字重新在普通词典库里匹配,重复步骤(3037),直到剩余字数为1,查找结束,输出词串。
句法分析实际是对句子里的词语语法性能实行处理分析,用来确定句子中各组成部分之间的关系,形成关系明确,层次分明的句法结构树。线图分析法在机器翻译、文本自动分析和自动生成中得到了广泛的应用,是自然语言处理中广泛使用的一种方法。
在本实例中,步骤(3)中的提取关键词流程图如图5,所述关键词提取的步骤如下:
步骤(3041):遍历词串中的各个词,如果遍历至词的尾部,就结束;否则进入步骤(3042);
步骤(3042):判断待提取的词是否是实词,如果不是,返回至(3041);如果是,进入步骤(3043);
步骤(3043):把待提取的词提取出来,返回步骤(3041)。
如图6所示,所述计算匹配相似度的步骤如下:
步骤(3044):将考生答案关键词S1分割成单个的字符,分割后的字符为u1,u2,…,un
步骤(3045):查找首字符u1是否在标准答案关键词S2里出现,若没有出现就标记为0;若出现就标记为l,然后将S2中出现的u1去掉,继续判断下一个字符,直到将字符u1,u2,…,un全部判断完;
步骤(3046):计算出u1,u2,…,un在S2里总共出现的次数m,得到的就是S1与S2的贴近度N(S1,S2)=m/n,其中,n表示S1中字符个数。
经过上述几个阶段的处理,接下来计算成绩。
对于没有标准答案的主观题,比如作文的批改,以及一些开放性是试题。通常情况下,我们需要进行人工评阅,人工评阅工作量大,任务繁重,而且经过长时间的阅卷,可能会出现视觉疲劳,以至于会出现错判或者误判的情形。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.基于深度学习的主观题智能阅卷方法,其特征是,包括:
步骤(1):获取答题卡的图像;
步骤(2):对所获取的图像进行预处理;利用OpenCV的图像分割处理对答题卡图像进行切分,切分为客观题的答题区域和主观题的答题区域;然后,采用OMR方式对客观题的答题区域进行识别;采用OCR方式对主观题的答题区域进行识别;
步骤(3):将客观题和主观题的标准答案均录入到数据库中;所述主观题,包括:设有标准答案的主观题和没有标准答案的主观题;
针对客观题,利用客观题的答题内容与客观题标准答案的匹配结果,实现对客观题的评阅,统计出客观题的分值;
针对设有标准答案的主观题,利用OCR文字识别方法对图像中的文字进行识别,利用关键词匹配方式将答题区域的文字与标准答案进行匹配,实现对设有标准答案的主观题的评阅,统计出设有标准答案的主观题的分值;
针对没有标准答案的主观题,先通过人工设置试卷特征,再通过深度学习训练好一个卷积神经网络模型,利用训练好的卷积神经网络模型,实现对没有标准答案的主观题的评阅,统计出没有标准答案的主观题的分值范围;
步骤(4):如果在阅卷过程中发现异常分值的试卷,则需要人工评阅干预,实现对异常试卷的纠偏处理。
2.如权利要求1所述的基于深度学习的主观题智能阅卷方法,其特征是,
所述步骤(3)的针对设有标准答案的主观题,利用关键词匹配方式将答题区域的内容与标准答案进行匹配,实现对设有标准答案的主观题的评阅,统计出设有标准答案的主观题的分值,是指:
步骤(301):针对主观题标准答案,利用词库生成算法对长字符串进行切分处理,切分成若干个短字符串,然后,再将短字符串进行分割,生成标准词库;所述长字符串是指字符串长度超过设定阈值的字符串;所述短字符串是指字符串长度不超过设定阈值的字符串;
步骤(302):针对答题区域的内容,首先去除空格和去除空行,然后,再以标点符号为依据,实现分句处理;
步骤(303):对步骤(302)得到的分句处理结果,采用正向最大分词算法,将待分析的句子与专业名词库进行匹配,得到第一分词结果;然后再将与专业名词库匹配失败的内容与普通词典库进行匹配,得到第二分词结果;第一分词结果和第二分词结果合并为总的分词结果;
步骤(304):关键词提取:将提取的关键词与标准词库进行匹配;计算匹配相似度;若匹配相似度大于设定阈值,则匹配成功;否则匹配失败,根据匹配结果,计算主观题答题区域的得分。
3.如权利要求2所述的基于深度学习的主观题智能阅卷方法,其特征是,
所述步骤(301)的具体步骤为:
步骤(3011):针对标准答案,把长字符串分解成若干短字符串;
步骤(3012):将标准答案依据单字字典,将得到的短字符串分割为单个的词序列;
步骤(3013):若有新的标准答案录入,则返回步骤(3011),否则,输出标准词库。
4.如权利要求2所述的基于深度学习的主观题智能阅卷方法,其特征是,
所述步骤(302)的具体步骤为:
步骤(3021):判断待处理的字符串是否为空,如果字符串不为空,跳转到步骤(3022);如果为空,直接结束;
步骤(3022):提取字符串里最左边的一个字符,判断其是否为标点符号字符,如果不是跳转到步骤(3023);如果是,跳转到步骤(3024);
步骤(3023):遍历下一个字符是否为标点符号字符,如果是,跳转到步骤(3024);如果不是,重复执行步骤(3023);
步骤(3024):把当前字符串里的标点符号删除,将被删除的标点符号前面的字符串输出到指定数组,索引值加1,然后跳转到步骤(3021)。
5.如权利要求2所述的基于深度学习的主观题智能阅卷方法,其特征是,
所述步骤(303)的具体步骤为:
步骤(3031):获取专业名词库中最长词的长度,设为n;
步骤(3032):从步骤(302)得到的分句处理结果中的第一个字开始,从左到右提取n个字;
步骤(3033):将提取的n个字,在专业名词库中进行匹配,若匹配成功,就将提取的n个字从分句处理结果中分割出来;
步骤(3034):若匹配不成功,就将最后面的一个字去掉,再用余下的字重新在专业名词词库里匹配,若匹配成功,就将提取的字从分句处理结果中分割出来,否则,重复步骤(3034),直到n=0,转入步骤(3035);
步骤(3035):当n=0时,取出没有在专业名词库中匹配成功的词,在普通词库中继续匹配;
步骤(3036):当在普通词库中匹配成功时,将匹配成功的词从文本中分离出来,从文本里的第n+1字开始向后再取n个字,返回步骤(3033);
步骤(3037):当最后剩余字数不足n个时,就将剩余字里的最后面的一个字去除掉,再将剩余的字重新在普通词典库里匹配,重复步骤(3037),直到剩余字数为1,查找结束,输出词串。
6.如权利要求2所述的基于深度学习的主观题智能阅卷方法,其特征是,
所述关键词提取的步骤如下:
步骤(3041):遍历词串中的各个词,如果遍历至词的尾部,就结束;否则进入步骤(3042);
步骤(3042):判断待提取的词是否是实词,如果不是,返回至(3041);如果是,进入步骤(3043);
步骤(3043):把待提取的词提取出来,返回步骤(3041);
所述计算匹配相似度的步骤如下:
步骤(3044):将考生答案关键词S1分割成单个的字符,分割后的字符为u1,u2,…,un
步骤(3045):查找首字符u1是否在标准答案关键词S2里出现,若没有出现就标记为0;若出现就标记为l,然后将S2中出现的u1去掉,继续判断下一个字符,直到将字符u1,u2,…,un全部判断完;
步骤(3046):计算出u1,u2,…,un在S2里总共出现的次数m,得到的就是S1与S2的贴近度N(S1,S2)=m/n,其中,n表示S1中字符个数。
7.如权利要求1所述的基于深度学习的主观题智能阅卷方法,其特征是,
针对没有标准答案的主观题,设置三个特征:词汇数量、段落数量和涂改区域个数,
从训练试卷样本中提取词汇数量特征、段落数量特征、涂改区域个数特征;
建立词汇数量特征、段落数量特征、涂改区域个数特征与分值范围之间的对应关系;
将每个训练试卷样本的词汇数量特征、段落数量特征、涂改区域个数特征和对应的分值范围均输入到卷积神经网络模型中,对卷积神经网络模型进行训练,输出训练好的卷积神经网络模型;
然后从测试试卷样本中提取词汇数量特征、段落数量特征和涂改区域个数特征;
将所提取的测试试卷样本的词汇数量特征、段落数量特征和涂改区域个数特征输入到训练好的卷积神经网络模型中,输出测试样本的分值范围。
8.如权利要求7所述的基于深度学习的主观题智能阅卷方法,其特征是,
所述词汇数量特征的获取方式为:
利用OCR文字识别方法对图像中的文字进行识别,将识别结果通过分词字典进行分词,然后对分词结果进行数量统计,得到词汇数量特征;
所述段落数量特征的获取方式为:
步骤(a):利用OCR文字识别方法对图像中的字符进行识别,初始段落数量为零;设定指针的位置,指针的位置指向第一个字符;
步骤(b):判断指针指向的当前字符是否为文字;
若不是,则指针的位置加一,返回步骤(b)继续判断;
若是,则指针的位置加一,判断下一个字符是否是空格,如果下一个字符是空格,则表明当前字符与之前的若干个字符构成一个段落,累计段落数量加一;
如果下一个字符不是空格,则指针的位置加一,继续寻找下一个字符,直至找到字符是空格为止,累积段落数量加一;
指针位置加一,返回步骤(b)继续判断,直至所有字符被判断完为止,输出段落数量;
所述涂改区域个数特征的获取方式为:
针对没有标准答案的主观题进行拍照,然后,进行图像灰度化处理;
然后,将图像平均划分为若干个区域,计算每个区域内的灰度平均值,如果灰度平均值超过设定阈值,则认为当前区域为涂改区域,累计涂改区域的个数。
9.基于深度学习的主观题智能阅卷系统,包括:存储器、处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成上述权利要求1-8任一方法所述的步骤。
10.一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令被处理器运行时,完成上述权利要求1-8任一方法所述的步骤。
CN201810455795.3A 2018-05-14 2018-05-14 基于深度学习的主观题智能阅卷方法、系统及存储介质 Active CN108764074B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810455795.3A CN108764074B (zh) 2018-05-14 2018-05-14 基于深度学习的主观题智能阅卷方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810455795.3A CN108764074B (zh) 2018-05-14 2018-05-14 基于深度学习的主观题智能阅卷方法、系统及存储介质

Publications (2)

Publication Number Publication Date
CN108764074A true CN108764074A (zh) 2018-11-06
CN108764074B CN108764074B (zh) 2019-03-19

Family

ID=64010523

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810455795.3A Active CN108764074B (zh) 2018-05-14 2018-05-14 基于深度学习的主观题智能阅卷方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN108764074B (zh)

Cited By (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109815932A (zh) * 2019-02-02 2019-05-28 杭州大拿科技股份有限公司 一种试卷批改方法、装置、电子设备及存储介质
CN109948473A (zh) * 2019-03-04 2019-06-28 中国计量大学 一种基于神经网络的提升学生应用题解题能力的方法
CN109993153A (zh) * 2019-04-18 2019-07-09 江苏曲速教育科技有限公司 一种基于边缘计算的人工智能阅卷系统
CN110059636A (zh) * 2019-04-20 2019-07-26 广东小天才科技有限公司 一种检查纠正学生的学习作业的方法及系统
CN110084189A (zh) * 2019-04-25 2019-08-02 楚雄医药高等专科学校 一种基于无线网络的答题卡处理系统及处理方法
CN110110581A (zh) * 2019-03-14 2019-08-09 杭州笔声智能科技有限公司 一种基于人工智能的试卷批改方法和系统
CN110110585A (zh) * 2019-03-15 2019-08-09 西安电子科技大学 基于深度学习的智能阅卷实现方法及系统、计算机程序
CN110309703A (zh) * 2019-04-25 2019-10-08 东莞市七宝树教育科技有限公司 一种智能适应识别并切割试卷答案区域的方法及其系统
CN110348400A (zh) * 2019-07-15 2019-10-18 京东方科技集团股份有限公司 一种评分获取方法、装置及电子设备
CN110363194A (zh) * 2019-06-17 2019-10-22 深圳壹账通智能科技有限公司 基于nlp的智能阅卷方法、装置、设备及存储介质
CN110458014A (zh) * 2019-07-05 2019-11-15 深圳中兴网信科技有限公司 答题卡识读方法、装置和计算机可读存储介质
CN110569401A (zh) * 2019-07-26 2019-12-13 平安国际智慧城市科技股份有限公司 阅卷方法、装置、计算机设备和存储介质
CN110677549A (zh) * 2019-10-24 2020-01-10 武汉乐知加教育科技有限公司 基于打印扫描一体机的纸件作业ai批阅系统
CN110689018A (zh) * 2019-09-24 2020-01-14 华南理工大学 一种智能阅卷系统及其处理方法
CN111242131A (zh) * 2020-01-06 2020-06-05 北京十六进制科技有限公司 一种智能阅卷中图像识别的方法、存储介质及装置
CN111639630A (zh) * 2020-06-23 2020-09-08 北京字节跳动网络技术有限公司 一种作业批改方法及装置
CN111784717A (zh) * 2020-06-28 2020-10-16 中国计量大学 一种智慧台灯及基于该台灯的自动阅卷方法
CN111832278A (zh) * 2020-06-15 2020-10-27 北京百度网讯科技有限公司 文档流畅度的检测方法、装置、电子设备及介质
CN111931730A (zh) * 2020-09-24 2020-11-13 北京易真学思教育科技有限公司 判题方法、装置、电子设备及存储介质
CN111950240A (zh) * 2020-08-26 2020-11-17 北京高途云集教育科技有限公司 一种数据批改方法、装置及系统
CN112017263A (zh) * 2020-08-24 2020-12-01 上海松鼠课堂人工智能科技有限公司 基于深度学习的试卷智能生成方法和系统
CN112115736A (zh) * 2019-06-19 2020-12-22 广东小天才科技有限公司 一种基于图像识别的作业批改方法、系统和智能终端
CN112116840A (zh) * 2019-06-19 2020-12-22 广东小天才科技有限公司 一种基于图像识别的作业批改方法、系统和智能终端
CN112164263A (zh) * 2020-11-10 2021-01-01 龙岩烟草工业有限责任公司 用于烟草行业安全知识的答题方法和答题系统
CN112287083A (zh) * 2020-10-29 2021-01-29 北京乐学帮网络技术有限公司 一种评阅方法、装置、计算机设备及存储装置
CN112364601A (zh) * 2020-10-28 2021-02-12 南阳理工学院 基于TF-IDF算法和TextRank算法的智能阅卷方法及装置
CN112613500A (zh) * 2020-12-21 2021-04-06 安徽科迅教育装备集团有限公司 一种基于深度学习的校园动态阅卷系统
CN112699337A (zh) * 2019-10-22 2021-04-23 北京易真学思教育科技有限公司 方程批改方法、电子设备及计算机存储介质
CN112749257A (zh) * 2021-01-11 2021-05-04 徐州金林人工智能科技有限公司 一种基于机器学习算法的智能阅卷系统
CN112990180A (zh) * 2021-04-29 2021-06-18 北京世纪好未来教育科技有限公司 判题方法、装置、设备及存储介质
CN113256252A (zh) * 2021-05-25 2021-08-13 上海金程教育培训有限公司 一种基于b/s架构的考测系统
CN113312909A (zh) * 2021-05-19 2021-08-27 华南理工大学 基于自然语言处理的智能分析试题答案方法与系统
CN113343972A (zh) * 2021-06-29 2021-09-03 北京市商汤科技开发有限公司 一种阅卷方法、装置、电子设备及存储介质
CN113705509A (zh) * 2021-09-02 2021-11-26 北京云蝶智学科技有限公司 试题解析信息的获取方法及装置
CN113762274A (zh) * 2021-11-10 2021-12-07 江西风向标教育科技有限公司 一种答题卡目标区域检测方法、系统、存储介质及设备
CN114064739A (zh) * 2022-01-14 2022-02-18 深圳市明源云科技有限公司 阅卷优化方法、装置、电子设备及可读存储介质
WO2022042181A1 (zh) * 2020-08-25 2022-03-03 杭州大拿科技股份有限公司 对象识别处理方法、处理装置、电子设备和存储介质
CN114140282A (zh) * 2021-11-19 2022-03-04 武汉东信同邦信息技术有限公司 一种基于深度学习的普教课堂答题快速评审方法及装置
CN114444486A (zh) * 2022-01-24 2022-05-06 来也科技(北京)有限公司 结合rpa和ai的数据分析方法、装置、电子设备及存储介质
CN114882504A (zh) * 2022-07-06 2022-08-09 成都西交智汇大数据科技有限公司 一种评分方法、装置、设备及可读存储介质
CN116629270A (zh) * 2023-06-12 2023-08-22 广州市南方人力资源评价中心有限公司 基于考试大数据以及文本语义的主观题评分方法和装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101866415A (zh) * 2009-08-24 2010-10-20 深圳市海云天科技股份有限公司 一种计算机阅卷系统的答题卡识别装置及方法
CN102279844A (zh) * 2011-08-31 2011-12-14 中国科学院自动化研究所 汉语作文自动测试方法及系统
CN104463101A (zh) * 2014-11-06 2015-03-25 科大讯飞股份有限公司 用于文字性试题的答案识别方法及系统
CN105373978A (zh) * 2015-08-12 2016-03-02 高学 基于ocr的人工评判试卷处理装置及方法
CN105844226A (zh) * 2016-03-21 2016-08-10 北京华云天科技有限公司 基于主观题的数据处理方法及其装置
CN106407936A (zh) * 2016-09-22 2017-02-15 福建省百互联网科技有限公司 一种阅卷方法和系统
CN106446882A (zh) * 2016-08-31 2017-02-22 武汉颂大教育科技股份有限公司 一种基于8字码的智能留痕阅卷方法
CN107133211A (zh) * 2017-04-26 2017-09-05 中国人民大学 一种基于注意力机制的作文评分方法
CN107480133A (zh) * 2017-07-25 2017-12-15 广西师范大学 一种基于答案蕴涵与依存关系的主观题自适应阅卷方法
CN107832768A (zh) * 2017-11-23 2018-03-23 盐城线尚天使科技企业孵化器有限公司 基于深度学习的高效阅卷方法和阅卷系统
CN107909066A (zh) * 2017-11-06 2018-04-13 泉州市雄蓝教育科技有限公司 一种移动终端系统的自动阅卡评分方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101866415A (zh) * 2009-08-24 2010-10-20 深圳市海云天科技股份有限公司 一种计算机阅卷系统的答题卡识别装置及方法
CN102279844A (zh) * 2011-08-31 2011-12-14 中国科学院自动化研究所 汉语作文自动测试方法及系统
CN104463101A (zh) * 2014-11-06 2015-03-25 科大讯飞股份有限公司 用于文字性试题的答案识别方法及系统
CN105373978A (zh) * 2015-08-12 2016-03-02 高学 基于ocr的人工评判试卷处理装置及方法
CN105844226A (zh) * 2016-03-21 2016-08-10 北京华云天科技有限公司 基于主观题的数据处理方法及其装置
CN106446882A (zh) * 2016-08-31 2017-02-22 武汉颂大教育科技股份有限公司 一种基于8字码的智能留痕阅卷方法
CN106407936A (zh) * 2016-09-22 2017-02-15 福建省百互联网科技有限公司 一种阅卷方法和系统
CN107133211A (zh) * 2017-04-26 2017-09-05 中国人民大学 一种基于注意力机制的作文评分方法
CN107480133A (zh) * 2017-07-25 2017-12-15 广西师范大学 一种基于答案蕴涵与依存关系的主观题自适应阅卷方法
CN107909066A (zh) * 2017-11-06 2018-04-13 泉州市雄蓝教育科技有限公司 一种移动终端系统的自动阅卡评分方法
CN107832768A (zh) * 2017-11-23 2018-03-23 盐城线尚天使科技企业孵化器有限公司 基于深度学习的高效阅卷方法和阅卷系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李磊: "基于机器学习的中小学数学自动阅卷系统研究与实现", 《中国优秀硕士学位论文全文库 社会科学II辑》 *
邱麒玮: "基于机器学习的自动阅卷系统的设计与实现", 《电子制作》 *

Cited By (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11450081B2 (en) 2019-02-02 2022-09-20 Hangzhou Dana Technology Inc. Examination paper correction method and apparatus, electronic device, and storage medium
CN109815932A (zh) * 2019-02-02 2019-05-28 杭州大拿科技股份有限公司 一种试卷批改方法、装置、电子设备及存储介质
CN109948473A (zh) * 2019-03-04 2019-06-28 中国计量大学 一种基于神经网络的提升学生应用题解题能力的方法
CN110110581A (zh) * 2019-03-14 2019-08-09 杭州笔声智能科技有限公司 一种基于人工智能的试卷批改方法和系统
CN110110581B (zh) * 2019-03-14 2021-06-04 杭州笔声智能科技有限公司 一种基于人工智能的试卷批改方法和系统
CN110110585A (zh) * 2019-03-15 2019-08-09 西安电子科技大学 基于深度学习的智能阅卷实现方法及系统、计算机程序
CN109993153A (zh) * 2019-04-18 2019-07-09 江苏曲速教育科技有限公司 一种基于边缘计算的人工智能阅卷系统
CN110059636A (zh) * 2019-04-20 2019-07-26 广东小天才科技有限公司 一种检查纠正学生的学习作业的方法及系统
CN110309703A (zh) * 2019-04-25 2019-10-08 东莞市七宝树教育科技有限公司 一种智能适应识别并切割试卷答案区域的方法及其系统
CN110084189A (zh) * 2019-04-25 2019-08-02 楚雄医药高等专科学校 一种基于无线网络的答题卡处理系统及处理方法
CN110309703B (zh) * 2019-04-25 2021-07-27 东莞市七宝树教育科技有限公司 一种智能适应识别并切割试卷答案区域的方法及其系统
CN110363194A (zh) * 2019-06-17 2019-10-22 深圳壹账通智能科技有限公司 基于nlp的智能阅卷方法、装置、设备及存储介质
CN112116840A (zh) * 2019-06-19 2020-12-22 广东小天才科技有限公司 一种基于图像识别的作业批改方法、系统和智能终端
CN112115736A (zh) * 2019-06-19 2020-12-22 广东小天才科技有限公司 一种基于图像识别的作业批改方法、系统和智能终端
CN110458014A (zh) * 2019-07-05 2019-11-15 深圳中兴网信科技有限公司 答题卡识读方法、装置和计算机可读存储介质
CN110348400A (zh) * 2019-07-15 2019-10-18 京东方科技集团股份有限公司 一种评分获取方法、装置及电子设备
US11790641B2 (en) 2019-07-15 2023-10-17 Boe Technology Group Co., Ltd. Answer evaluation method, answer evaluation system, electronic device, and medium
CN110569401A (zh) * 2019-07-26 2019-12-13 平安国际智慧城市科技股份有限公司 阅卷方法、装置、计算机设备和存储介质
CN110689018A (zh) * 2019-09-24 2020-01-14 华南理工大学 一种智能阅卷系统及其处理方法
CN112699337A (zh) * 2019-10-22 2021-04-23 北京易真学思教育科技有限公司 方程批改方法、电子设备及计算机存储介质
CN110677549A (zh) * 2019-10-24 2020-01-10 武汉乐知加教育科技有限公司 基于打印扫描一体机的纸件作业ai批阅系统
CN111242131A (zh) * 2020-01-06 2020-06-05 北京十六进制科技有限公司 一种智能阅卷中图像识别的方法、存储介质及装置
CN111242131B (zh) * 2020-01-06 2024-05-10 北京十六进制科技有限公司 一种智能阅卷中图像识别的方法、存储介质及装置
CN111832278B (zh) * 2020-06-15 2024-02-09 北京百度网讯科技有限公司 文档流畅度的检测方法、装置、电子设备及介质
CN111832278A (zh) * 2020-06-15 2020-10-27 北京百度网讯科技有限公司 文档流畅度的检测方法、装置、电子设备及介质
CN111639630B (zh) * 2020-06-23 2023-07-18 北京字节跳动网络技术有限公司 一种作业批改方法及装置
CN111639630A (zh) * 2020-06-23 2020-09-08 北京字节跳动网络技术有限公司 一种作业批改方法及装置
CN111784717B (zh) * 2020-06-28 2024-01-16 中国计量大学 一种智慧台灯及基于该台灯的自动阅卷方法
CN111784717A (zh) * 2020-06-28 2020-10-16 中国计量大学 一种智慧台灯及基于该台灯的自动阅卷方法
CN112017263A (zh) * 2020-08-24 2020-12-01 上海松鼠课堂人工智能科技有限公司 基于深度学习的试卷智能生成方法和系统
CN112017263B (zh) * 2020-08-24 2021-04-30 上海松鼠课堂人工智能科技有限公司 基于深度学习的试卷智能生成方法和系统
WO2022042181A1 (zh) * 2020-08-25 2022-03-03 杭州大拿科技股份有限公司 对象识别处理方法、处理装置、电子设备和存储介质
CN111950240A (zh) * 2020-08-26 2020-11-17 北京高途云集教育科技有限公司 一种数据批改方法、装置及系统
CN111931730A (zh) * 2020-09-24 2020-11-13 北京易真学思教育科技有限公司 判题方法、装置、电子设备及存储介质
CN112364601A (zh) * 2020-10-28 2021-02-12 南阳理工学院 基于TF-IDF算法和TextRank算法的智能阅卷方法及装置
CN112287083A (zh) * 2020-10-29 2021-01-29 北京乐学帮网络技术有限公司 一种评阅方法、装置、计算机设备及存储装置
CN112164263A (zh) * 2020-11-10 2021-01-01 龙岩烟草工业有限责任公司 用于烟草行业安全知识的答题方法和答题系统
CN112613500A (zh) * 2020-12-21 2021-04-06 安徽科迅教育装备集团有限公司 一种基于深度学习的校园动态阅卷系统
CN112749257A (zh) * 2021-01-11 2021-05-04 徐州金林人工智能科技有限公司 一种基于机器学习算法的智能阅卷系统
CN112990180A (zh) * 2021-04-29 2021-06-18 北京世纪好未来教育科技有限公司 判题方法、装置、设备及存储介质
CN113312909A (zh) * 2021-05-19 2021-08-27 华南理工大学 基于自然语言处理的智能分析试题答案方法与系统
CN113256252A (zh) * 2021-05-25 2021-08-13 上海金程教育培训有限公司 一种基于b/s架构的考测系统
CN113343972A (zh) * 2021-06-29 2021-09-03 北京市商汤科技开发有限公司 一种阅卷方法、装置、电子设备及存储介质
CN113705509A (zh) * 2021-09-02 2021-11-26 北京云蝶智学科技有限公司 试题解析信息的获取方法及装置
CN113762274A (zh) * 2021-11-10 2021-12-07 江西风向标教育科技有限公司 一种答题卡目标区域检测方法、系统、存储介质及设备
CN114140282A (zh) * 2021-11-19 2022-03-04 武汉东信同邦信息技术有限公司 一种基于深度学习的普教课堂答题快速评审方法及装置
CN114064739B (zh) * 2022-01-14 2022-04-15 深圳市明源云科技有限公司 阅卷优化方法、装置、电子设备及可读存储介质
CN114064739A (zh) * 2022-01-14 2022-02-18 深圳市明源云科技有限公司 阅卷优化方法、装置、电子设备及可读存储介质
CN114444486A (zh) * 2022-01-24 2022-05-06 来也科技(北京)有限公司 结合rpa和ai的数据分析方法、装置、电子设备及存储介质
CN114882504A (zh) * 2022-07-06 2022-08-09 成都西交智汇大数据科技有限公司 一种评分方法、装置、设备及可读存储介质
CN116629270A (zh) * 2023-06-12 2023-08-22 广州市南方人力资源评价中心有限公司 基于考试大数据以及文本语义的主观题评分方法和装置
CN116629270B (zh) * 2023-06-12 2024-02-02 广州市南方人力资源评价中心有限公司 基于考试大数据以及文本语义的主观题评分方法和装置

Also Published As

Publication number Publication date
CN108764074B (zh) 2019-03-19

Similar Documents

Publication Publication Date Title
CN108764074B (zh) 基于深度学习的主观题智能阅卷方法、系统及存储介质
CN110110585B (zh) 基于深度学习的智能阅卷实现方法及系统、计算机程序
CN104463101B (zh) 用于文字性试题的答案识别方法及系统
US20190019055A1 (en) Word segmentation system, method and device
CN108428229A (zh) 一种基于深度神经网络提取表观和几何特征的肺部纹理识别方法
CN109241894A (zh) 一种基于表格定位和深度学习的针对性票据内容识别系统和方法
CN110210413A (zh) 一种基于深度学习的多学科试卷内容检测与识别系统及方法
CN110751137A (zh) 一种自动求解数学题的方法和系统
CN113537227B (zh) 一种结构化文本识别方法及系统
CN111126240B (zh) 一种三通道特征融合人脸识别方法
CN105046200B (zh) 基于直线检测的电子阅卷方法
CN106610969A (zh) 基于多模态信息的视频内容审查系统及方法
CN106446882A (zh) 一种基于8字码的智能留痕阅卷方法
CN108280389A (zh) 医疗票据icr识别系统及其医疗票据识别方法
Wu et al. Scene text detection using adaptive color reduction, adjacent character model and hybrid verification strategy
CN113159014A (zh) 基于手写题号的客观题批阅方法、装置、设备及存储介质
CN115393861B (zh) 一种手写体文本精准分割方法
CN112347997A (zh) 一种试题检测识别方法、装置、电子设备及介质
CN107194337A (zh) 一种非选择题的智能批阅方法
CN110135225A (zh) 样本标注方法及计算机存储介质
Kesiman et al. ICFHR 2018 competition on document image analysis tasks for southeast asian palm leaf manuscripts
CN109508712A (zh) 一种基于图像的汉语文字识别方法
CN114998905A (zh) 一种复杂结构化文档内容的校验方法、装置与设备
Rahman et al. Bn-htrd: A benchmark dataset for document level offline bangla handwritten text recognition (htr) and line segmentation
KR20100108778A (ko) 영상정보 분류방법 및 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant