CN107798321A - 一种试卷分析方法和计算设备 - Google Patents

一种试卷分析方法和计算设备 Download PDF

Info

Publication number
CN107798321A
CN107798321A CN201711262766.7A CN201711262766A CN107798321A CN 107798321 A CN107798321 A CN 107798321A CN 201711262766 A CN201711262766 A CN 201711262766A CN 107798321 A CN107798321 A CN 107798321A
Authority
CN
China
Prior art keywords
text
line
topic
paper
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711262766.7A
Other languages
English (en)
Other versions
CN107798321B (zh
Inventor
刘宁
张东祥
徐行
刘辉
郭龙
陈李江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hainan Cloud River Technology Co Ltd
Original Assignee
Hainan Cloud River Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hainan Cloud River Technology Co Ltd filed Critical Hainan Cloud River Technology Co Ltd
Priority to CN201711262766.7A priority Critical patent/CN107798321B/zh
Publication of CN107798321A publication Critical patent/CN107798321A/zh
Application granted granted Critical
Publication of CN107798321B publication Critical patent/CN107798321B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines

Abstract

本发明公开了一种试卷分析方法,适于在计算设备中执行,该方法包括:获取待分析的试卷图像,并识别该图像中的各文字连通域;根据所识别出的各文字连通域对该试卷进行文本行的划分,并对各文字连通域进行文字内容的识别;根据所识别出的文字内容,从所划分的文本行中选取以题目编号为起始的文本行作为题目起始文本行,并根据各题目起始文本行的位置确定每道题目的题目区域;从试卷图像中提取教师批改笔迹的颜色分量,并对该颜色分量进行识别,得到教师的批改信息;以及将教师的批改信息与对应的题目区域和题目编号作对应,以确定每道题目的教师批改信息。本发明公开了对应的计算设备。

Description

一种试卷分析方法和计算设备
技术领域
本发明涉及电子教学领域,尤其涉及一种试卷分析方法和计算设备。
背景技术
随着计算机和互联网技术的发展,人们越来越多的使用自动化设备对学生考试试卷进行阅卷。现有技术中的自动阅卷方法通常采用ORC识别系统,且通常要求试卷图像的清晰度达到一定条件,而且其通常只能对固定模板的试卷进行分析,即只能把试卷与系统已经存储的若干种模板进行匹配,用匹配得到的模板进行分析。
但实际操作中,人们有时希望通过手机拍照获取试卷图像,这种情况下可能出现图像分辨率低、光照不均、拍照倾斜和成像抖动模糊等问题。这些复杂的成像条件无疑会增大试卷分析的难度,而且很多真实试卷的版面和类型都不一定与固定模板匹配,因此需要提供一种能够对试卷图像进行准确识别和自动分析的方案,以满足人们日益增长的电子阅卷要求。
发明内容
鉴于上述问题,本发明提出了一种题目去重方法和计算设备,以力图解决或者至少解决上面存在的问题。
根据本发明的一个方面,提供一种试卷分析方法,适于在计算设备中执行,该方法包括:获取待分析的试卷图像,并识别该图像中的各文字连通域;根据所识别出的各文字连通域对该试卷进行文本行的划分,并对各文字连通域进行文字内容的识别;根据所识别出的文字内容,从所划分的文本行中选取以题目编号为起始的文本行作为题目起始文本行,并根据各题目起始文本行的位置确定每道题目的题目区域;从试卷图像中提取教师批改笔迹的颜色分量,并对该颜色分量进行识别,得到教师的批改信息;以及将教师的批改信息与对应的题目区域和题目编号作对应,以确定每道题目的教师批改信息。
可选地,在根据本发明的试卷分析方法中,对该试卷进行文本行的划分的步骤包括:遍历所识别出的所有文字连通域,对于当前待划分的某文字连通域:若该文字连通域的纵坐标范围与现有文本行的纵坐标范围没有重叠,则生成一个新的文本行,并将该文字连通域内的文字放到新的文本行中;若该文字连通域的纵坐标范围与现有文本行中某一行的纵坐标范围有重叠,则将该文字连通域放入该文本行中,并更新该文本行的位置信息;若该文字连通域的纵坐标范围与两行或两行以上的现有文本行的纵坐标范围有重叠,则将该文字连通域放入重叠范围最多的文本行中,并更新该文本行的位置信息。
可选地,在根据本发明的试卷分析方法中,还包括步骤:将每个文本行的文字连通域按其连通域左边界的横坐标值进行排序;对于每个文本行,对其文字连通域进行从左到右的遍历:若相邻两个文字连通域的左右间隔小于预定字符宽度,则将这两个文字连通域保留其在同一文本行;反之,则从这两个文字连通域的中间位置将该文本行拆分为两个不同的文本行,并更新各自的文本行信息。
可选地,在根据本发明的试卷分析方法中,还包括确定试卷版面类型的步骤:计算该试卷图像的横轴方向上每一列所穿越的文本行的个数;若在试卷的中部区域存在一个区间,该区间内每一列所穿越的文本行个数均为0,且该区间的宽度大于等于预定字符宽度,则将该试卷类型标记为双栏试卷;反之,则标记为单栏试卷。
可选地,在根据本发明的试卷分析方法中,还包括步骤:根据各文本行的横坐标来确定该文本行在双栏试卷中的左栏或右栏。
可选地,在根据本发明的试卷分析方法中,从所划分的文本行中选取以题目编号为起始的文本行作为题目起始文本行的步骤包括:根据所识别出的文字内容,从所划分的文本行中选取以阿拉伯数字或汉语数字为起始的文本行作为候选题目起始文本行,并将该阿拉伯数字或汉语数字作为该候选题目起始文本行的候选题号;以及选取相邻候选题号大小相差为1且候选题号的横坐标对齐的候选题号作为题目编号,并将该题目编号所对应的候选题目起始文本行作为最终的题目起始文本行。
可选地,在根据本发明的试卷分析方法中,从所划分的文本行中选取以阿拉伯数字或汉语数字为起始的文本行的步骤包括:将每个文本行中的字符从左到右排序,并选取最左端的预定数目个字符依次进行考察;若某文本行的预定数目个字符中出现有阿拉伯数字或汉语数字,则将该文本行标记为以阿拉伯数字或汉语数字为起始的文本行,并将该预定数目个字符中最先出现的阿拉伯数字或汉语数字标记为该题目的候选题号。
可选地,在根据本发明的试卷分析方法中,每道题目的题目区域在纵轴上的最大值和最小值分别为该题目起始文本行和下一题目起始文本行的上边界。
可选地,在根据本发明的试卷分析方法中,对该颜色分量进行识别的步骤包括:训练教师批改笔记的识别器,并采用该识别器对该颜色分量进行识别,其中,所述识别器适于识别“0-9”这10个数字、以及加号、减号、小数点、对号和错号这5类符号。
可选地,在根据本发明的试卷分析方法中,将教师的批改信息与对应的题目区域和题目编号作对应的步骤包括:确定教师批改信息的位置区域,计算该位置区域和每道题目区域的重叠区域面积,并选取重叠区域最大的题目作为该批改符号对应的题目。
可选地,在根据本发明的试卷分析方法中,在识别该试卷图像中的各文字连通域之前,还包括对该试卷图像进行预处理的步骤:对试卷图像进行图像增强与二值化处理,得到二值图像;对二值图像进行线段检测,得到一条或多条文本线段;检测各线段的倾斜角度,并根据该倾斜角度计算所述二值图像的整体倾斜角度;以及根据整体倾斜角度对该二值图像进行倾斜校正。
可选地,在根据本发明的试卷分析方法中,还包括步骤:根据每道题目的教师批改信息对学生对该试卷的作答情况进行统计分析。
可选地,在根据本发明的试卷分析方法中,对各文字连通域进行文字内容的识别适于采用卷积神经网络的识别方法,该卷积神经网络包括输入层、第一卷积层和第一下采样层、第二卷积层和第二下采样层、全连接层和输出层。
根据本发明的又一个方面,提供一种计算设备,包括:至少一个处理器;和存储有程序指令的存储器,其中,该程序指令被配置为适于由所述至少一个处理器执行,程序指令包括用于执行如上所述的试卷分析方法的指令。
根据本发明的又一个方面,提供一种存储有程序指令的可读存储介质,当该程序指令被计算设备读取并执行时,使得该计算设备执行如上所述的试卷分析方法。
根据本发明的技术方案,首先获取试卷图像方式,并对试卷图像进行二值化处理和图像倾斜度调整等预处理,之后对图像进行OCR处理(Optical Character Recognition,光学字符识别)识别出每行文字,并根据每行文字开头是否为数字等特殊字符,确定每道题目在试卷中的区域和内容。之后,再次从试卷图像中提取红色字体部分,并对该部分进行OCR处理,获得老师的评分区域和评分结果。最后,根据评分部分和之前识别的题目部分的位置关系确定各题目的评分,以便根据各题目的评分对学生的作答情况进行统计分析。
本发明可使用手机对任意排版的试卷图像进行拍照,并对该拍照图像自动进行试卷版面的识别、题目的划分和教师评分汇总的工作,提高了教师的工作效率。其只需用手机即可完成图像获取,不需要额外使用扫描仪获取清楚的试卷图像,降低了使用成本;而且本发明对试卷排版没有要求,其可以完成对任意排版试卷的分析工作,可用性很高。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明一个实施例的计算设备100的结构框图;
图2示出了根据本发明一个实施例的试卷分析方法200的流程图;
图3-图5分别示出了根据本发明一个实施例的试卷图像示意图;以及
图6示出了根据本发明一个实施例的卷积神经网络结构的示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1是示例计算设备100的框图。在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。
取决于期望的配置,处理器104可以是任何类型的处理,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。
取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。在一些实施方式中,应用122可以布置为在操作系统上利用程序数据124进行操作。程序数据124包括指令,在根据本发明的计算设备100中,程序数据124包含用于执行试卷分析方法200的指令。
计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160,其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。
计算设备100可以实现为服务器,例如文件服务器、数据库服务器、应用程序服务器和WEB服务器等,也可以实现为小尺寸便携(或者移动)电子设备的一部分,这些电子设备可以是诸如蜂窝电话、个人数字助理(PDA)、个人媒体播放器设备、无线网络浏览设备、个人头戴设备、应用专用设备、或者可以包括上面任何功能的混合设备。计算设备100还可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。在一些实施例中,计算设备100被配置为执行根据本发明的试卷分析方法200。
图2示出了根据本发明一个实施例的试卷分析方法200,可以在计算设备中执行,如在计算设备100中执行。如图2所示,该方法始于步骤S210。
在步骤S210,获取待分析的试卷图像,并识别该图像中的各文字连通域。
其中,可以通过扫描仪获取高清的试卷图像,也可以通过手机拍照获取试卷图像。现有技术中的试卷自动分析方法中,其OCR识别系统的鲁棒性不强,因此只能对扫描仪获取的清晰的图像进行OCR识别,从而进行试卷分析工作。而本发明的OCR识别引擎可以处理手机拍照带来的图像分辨率低、光照不均、拍照倾斜、成像抖动模糊等问题,即在这些复杂成像的条件下本发明仍然能够得到很好的识别结果。另外,文字联通域的识别可以采用现有的任意联通域识别方法,如采用OCR识别方法,本发明对此不作限制。
根据本发明的一个实施例,在识别该试卷图像中的各文字连通域之前,还可以先对该试卷图像进行图像增强与二值化以及倾斜校正等预处理。具体地,可以对试卷图像进行图像增强与二值化处理,得到二值图像;对二值图像进行线段检测,得到一条或多条文本线段;检测各线段的倾斜角度,并根据该倾斜角度计算所述二值图像的整体倾斜角度;以及根据整体倾斜角度对该二值图像进行倾斜校正。
其中,图像增强与二值化以及线段检测方法可以采用现有任意方法,本发明对此不走限制。根据一个实施例,图像增强与二值化可以采用大津算法(OTSU算法,其是二值化算法中常用的一个基础算法)。线段检测方法可以通过对二值图像进行霍夫变换实现,也就是,对二值化图像通过霍夫变换进行线段检测,检测出文本行的线段,并通过计算这些线段的倾斜角度得到文本图像的整体倾斜角度,进而进行倾斜校正。另外,还可以对预处理后的图像进行文字定位,文字定位指的是字符区域定位,即每个汉字或英语单词的区域坐标,文字区域是通过对二值图像上的连通域进行分析后得到的。
随后,在步骤S220中,根据所识别出的各文字连通域对该试卷进行文本行的划分,并对各文字连通域进行文字内容的识别。
其中,可以根据二值图像上的各文字连通域得到图像中文字的位置信息,再根据文字的位置信息来获取文本行的信息。在划分试卷的文本行时,可先根据纵坐标进行划分,再根据横坐标进行划分,当然也可以互换顺序,本发明对此不作限制。
在根据纵坐标进行划分时,可遍历所识别出的所有文字连通域,对于当前待划分的某文字连通域:若该文字连通域的纵坐标范围与现有文本行的纵坐标范围没有重叠,则生成一个新的文本行,并将该文字连通域内的文字放到新的文本行中;若该文字连通域的纵坐标范围与现有文本行中某一行的纵坐标范围有重叠,则将该文字连通域放入该文本行中,并更新该文本行的位置信息;若该文字连通域的纵坐标范围与两行或两行以上的现有文本行的纵坐标范围有重叠,则将该文字连通域放入重叠范围最多的文本行中,并更新该文本行的位置信息。
例如,某文字连通域的纵坐标范围为(8,10),若该范围与现有的五行文本行的纵坐标范围都不重叠,则将作为生成一个新的文本行,即第6行,并将该文字连通域中的文字放入该第6文本行中。若该范围仅与现有文本行中的第4行纵坐标范围(7,9)重叠,则将该文字连通域放入到第4文本行中。若该范围与现有文本行中的第4行纵坐标范围(7,9)和第5行纵坐标范围(9.5,11)均有重叠,则将该文字连通域中的文字放入到重叠范围最大的一行中,即第4行文本行。
在根据横坐标进行划分时,将每个文本行的文字连通域按其连通域左边界的横坐标值进行排序;对于每个文本行,对其文字连通域进行从左到右的遍历:若相邻两个文字连通域的左右间隔小于预定字符宽度,则将这两个文字连通域保留其在同一文本行;反之,则从这两个文字连通域的中间位置将该文本行拆分为两个不同的文本行,并更新各自的文本行信息。其中。预定字符宽度可以是该试卷整体的平均字符宽度的二倍,当然也可以设置为宽度,本发明对此不作限制。例如,图3所示的单栏试卷页面中,每道选择题有ABCD四个选项,其中AB选项位于同一文本行中,且AB选项所在的两个文本连通域之间的字符间隔明显大于预定字符宽度,则需从AB选项之间的空白部分一分为二,将AB选项拆分为两个不同的文本行。
根据本发明的一个实施例,除了划分文本行外,还可以对试卷版面类型进行识别,其中试卷版面类型包括单栏试卷(如图3所示)和双栏试卷(如图4所示)两种,对其区分的关键在于判断试卷中间是否存在分割区域。具体地,计算该试卷图像的横轴方向上每一列所穿越的文本行的个数;若在试卷的中部区域存在一个区间,该区间内每一列所穿越的文本行个数均为0,且该区间的宽度大于等于预定字符宽度,则将该试卷类型标记为双栏试卷;反之,则标记为单栏试卷。这里,可以认为每一个字符位在纵轴方向上都具有一列,如果是单栏试卷,那在每个字符位上画一条竖直线后,该直线必然会穿过试卷的至少一个文本行。而对于双栏试卷,其左右两栏之间必然存在一个空白区间,在该区间内的每个字符位上画条竖直线,该直线都不会穿过任何文本行。
另外,对于双栏试卷,还可以进一步确定各文本行在试卷中的位置,具体可以根据各文本行的横坐标来确定该文本行在双栏试卷中的左栏或右栏。通常,只需先确定试卷左栏和右栏的横坐标范围,然后看某文本行的某坐标或某坐标范围属于哪一栏的横坐标范围,即可知道该文本行位于哪一栏。这里实际并不需要知道该文本行的完整坐标范围,只需知道其中一个坐标值或一小段文字的坐标范围即可。
此外,对各文字连通域进行文字内容的识别可以采用现有任意文字识别方法,本发明对此不作限制。例如,可以采用采用卷积神经网络来对试卷中定位出的文字区域进行识别,得到每个文本块的文字。对于该卷积神经网络的结构和各层内容,本领域技术人员可以根据需要自行设定,本发明对此不作限制。根据一个实施例,卷积神经网络可以包括输入层、第一卷积层和第一下采样层、第二卷积层和第二下采样层、全连接层和输出层。图6示例性的示出了该卷积神经网络的结构示意图。其中,卷积神经网络使用经典的LeNet-5模型,输入层的输入样本大小可以为32*32,第一卷积层和第一下采样层的特征图个数可以均为6,第二卷积层和第二下采样层的特征图个数可以均为16,全连接层的隐层节点个数为120,最后输出层的个数可以为7401,7401为该卷积神经网络可识别的类别(如中文、数字、字母、常用符号等)个数。当然,关于该卷积神经网络中的各层结构,也可以根据需要设置为其他数值,本发明对此做限制。
随后,在步骤S230中,根据所识别出的文字内容,从所划分的文本行中选取以题目编号为起始的文本行作为题目起始文本行,并根据各题目起始文本行的位置确定每道题目的题目区域。
具体地,对于题目起始文本行的划分,可以根据所识别出的文字内容,从所有划分出的文本行中选取以阿拉伯数字或汉语数字为起始的文本行作为候选题目起始文本行,并将该阿拉伯数字或汉语数字作为该候选题目起始文本行的候选题号。其中,对于候选题目起始文本行的划分,可以将每个文本行中的字符从左到右排序,并选取最左端的预定数目个字符依次进行考察:若某文本行的预定数目个字符中出现有阿拉伯数字或汉语数字,则将该文本行标记为以阿拉伯数字或汉语数字为起始的文本行,并将该预定数目个字符中最先出现的阿拉伯数字或汉语数字标记为该题目的候选题号。根据一个实施例,预定数目个可以设置为5个。
也就是,本发明将每个文本行中的字符进行从左到右的排序,并选取左端前k个元素作为候选题号,例如可以设置k=5,即文本行中左端前5个字符都可能作为题号,当然不限于此。之后,从左到右依次考察,若最左端的一个字符为阿拉伯数字或汉语数字,则选取其为题号;若其不满足,则继续考察左端第二个字符是否满足;直到前k个元素都考察完,若还是没有满足的,则该文本行并不为题目起始的文本行。例如,在图5所示的试卷中,第17题的第一行和第二行都是一个单独的文本行,其中题目第一行最左端即出现阿拉伯数字17,因此可将该文本行作为候选题目起始文本行,而数字17作为该候选文本行的候选题号。而对于该题目的第二行,其左端的前5个字符中均未出现任何阿拉伯数字或汉语数字,因此该第二行并不是候选题目起始文本行。
然而,在试卷图像中采取这种前k个元素的判定方法来寻找候选题目起始文本行,不可避免的会出现以下问题:一些实际上并非真正的题目起始文本行也会满足上述候选题目起始文本行的特征。如图5中的黑色方框(第17题图中的17、第18题中第二行的2.5、第20题中第二行的40)所标出的文本行,这三行文本行的前5个元素中均包含阿拉伯数字,因而均会被标记为候选题目起始文本行。但这三行文本行实际并不是真正的题目起始行,真正的题目起始文本行,是图5所示的第17题、第18题、第19题和第20题的第一行所在的文本行,即以17、18、19和20为候选题号的那些文本行。
因此,需要进一步设置规则以对这些候选题目文本行进行过滤。具体地,可选取相邻候选题号大小相差为1且候选题号的横坐标对齐的候选题号作为题目编号,并将该题目编号所对应的候选题目起始文本行作为最终的题目起始文本行。也就是仅保留相邻题号大小相差为1且题号x轴坐标相差较小的候选题目起始文本行。
真正的题目起始文本行,如图5所示的17、18、19和20开始的文本行,除满足上述前k(k=5)个字符内含阿拉伯数字或汉语数字的特点外,还满足竖直方向对其和相邻元素数值相差为1的特点。因此,本发明以这两个特点为条件进行过滤,仅保留相邻候选题号大小相差为1、且水平坐标竖直对齐或近似对齐的文本行作为最终的题目起始文本行。这里,水平坐标竖直对齐或近似对齐,可以认为这些元素在竖直方向上的同一字符列上,当然考虑到图像文字有时会略微倾斜,因此可将该对齐标准限定为水平坐标相差距离小于2倍的平均字符宽度。当然,也可以限定为其他对齐标准,本发明对齐不作限制。
在确定了各题目起始文本行后,即需要根据这些文本行来确定每道题的区域和其题号,具体可根据各题目起始文本行的位置来确定每道题目的题目区域。根据本发明的一个实施例,遍历每一个题目起始文本行,并为每一个题目起始文本行找到其所在题目的所有文本行,以确定题目区域。其中,其题目所在的所有文本行以下条件:文本行的纵轴坐标大于等于该题目起始文本行的纵轴坐标且小于等于下一个题目起始文本行的纵轴坐标。
也就是,每道题目的题目区域在纵轴上的最大值和最小值分别为该题目起始文本行和下一题目起始文本行的上边界。这里,默认试卷坐标轴是以试卷的左上顶点为原点,以原点向下为纵坐标轴,原点向右为横坐标轴。当然也可以进行其他坐标轴设置,此时只需将上文中的大于等于、小于等于、最大值和最小值改成相应描述即可,即每道题目的题目纵向区域为该题目与下道题目之间的题目起始文本行之间的部分。另外,每道题目的横坐标范围通常可设置为该题目所在试卷栏的整栏横坐标范围。对于单栏试卷即为该试卷的左右两边界范围,对于双栏试卷,即为试卷中线到该题目所在栏的试卷边界的范围。
随后,在步骤S240中,从试卷图像中提取教师批改笔迹的颜色分量,并对该颜色分量进行识别,得到教师的批改信息。
根据本发明的一个实施例,在对颜色分量进行识别时,可以训练教师批改笔记的识别器,并采用该识别器对该颜色分量进行识别,其中,该识别器适于识别“0-9”这10个数字、以及加号、减号、小数点、对号和错号这5类符号。这15类符号被认为是教师批改作业过程中与成绩统计相关的符号,比如该题的对错,该题加多少分或减多少分的信息(如附图3-5中的教师红色批改信息)。对于该识别器的训练,本领域技术人员可以自行设定训练模型实现训练过程,如采用OCR识别方法,本发明对此不作限制。另外,通常教师会用红色笔对试卷进行批改,因此该颜色分量可为红色分量。
随后,在步骤S250中,将教师的批改信息与对应的题目区域和题目编号作对应,以确定每道题目的教师批改信息。
具体地,在批改信息与题目区域和题目编号作对应时,可以先确定教师批改信息的位置区域,之后计算该位置区域和每道题目区域的重叠区域面积,并选取重叠区域最大的题目作为该批改符号对应的题目。这里,通过红色分量的提取和识别可获取老师批改的位置和对错信息,之后根据该教师批改信息的位置与题目区域和题目编号作对应。
根据本发明的一个实施例,设题目i的位置信息分别为[subject_i_x_min,subject_i_x_max,subject_i_y_min,subject_i_y_max],这四个坐标值分别为题目i的题目区域在x轴方向和y轴方向上的起始和结束位置信息。批改对错标记j的位置信息为[tag_j_x_min,tag_j_x_max,tag_j_y_min,tag_j_y_max],这四个坐标值同理代表批改对错标记j的位置区域在x轴方向和y轴方向上的起始和结束位置信息。这样,即可计算得到重叠区域的位置信息,设该重叠区域的四个坐标值分别为[overlap_ij_x_min,overlap_ij_x_max,overlap_ij_y_min,overlap_ij_y_max],重叠区域面积设置为overlap_area,则该面积的计算公式为:
根据本发明的另一个实施例,在确定每道题目的批改信息后,还可以根据每道题目的教师批改信息对学生对该试卷的作答情况进行统计分析。如对教师对各题目的批改结果进行汇总,分别统计各部分的评分,从而得到整个试卷的得分。进一地,还可根据考生对每一部分的作答情况生成该考生的试卷分析报告,设置还可以结合各题目所涉及的知识点生成该考生的知识点掌握报告,以及进一步的试题训练建议。
根据本发明的技术方案,可对任意排版的纸质试卷进行自动阅卷,其事先并不用确定试卷中各个题目的题号和位置等,也不用设定专门的批改区域供教师批改。其通过自动识别的方法即可确定各题目的位置和题号,然后再次通过进行图像识别来获得各题目的得分。而现有技术中通常只能针对那种试卷部分和答题部分分别区别设置的试卷进行自动阅卷,类似现在大型考试中经常使用的答题卡卷,有专门的答题区域和批改区域,也有固定的模式排版。本发明对试卷排版没有任何要求,只要试卷题目以题号为开始就能进行分析阅卷,可处理的试卷类型更多,明显提高了自动阅卷的灵活性和适用性。而且本发明对试卷清晰度也没过高要求,只需用手机拍照即可完成,不需要额外使用扫描仪,从而降低了使用成本。
A9、如A1所述的试卷分析方法,其中,所述对该颜色分量进行识别的步骤包括:训练教师批改笔记的识别器,并采用该识别器对该颜色分量进行识别,其中,所述识别器适于识别“0-9”这10个数字、以及加号、减号、小数点、对号和错号这5类符号。
A10、如A1所述的试卷分析方法,其中,所述将教师的批改信息与对应的题目区域和题目编号作对应的步骤包括:确定教师批改信息的位置区域,计算该位置区域和每道题目区域的重叠区域面积,并选取重叠区域最大的题目作为该批改符号对应的题目。
A11、如A1所述的试卷分析方法,其中,在识别该试卷图像中的各文字连通域之前,还包括对该试卷图像进行预处理的步骤:对所述试卷图像进行图像增强与二值化处理,得到二值图像;对所述二值图像进行线段检测,得到一条或多条文本线段;检测各线段的倾斜角度,并根据该倾斜角度计算所述二值图像的整体倾斜角度;以及根据所述整体倾斜角度对该二值图像进行倾斜校正。
A12、如A1所述的试卷分析方法,其中,还包括步骤:根据每道题目的教师批改信息对学生对该试卷的作答情况进行统计分析。
A13、如A1-A12中任一项所述的试卷分析方法,其中,图像增强与二值化适于采用大津算法,线段检测方法适于通过对二值图像进行霍夫变换实现,所述预定字符宽度为该试卷的平均字符宽度的二倍,所述颜色分量为红色分量。
A14、如A1所述的试卷分析方法,其中,对各文字连通域进行文字内容的识别适于采用卷积神经网络的识别方法,该卷积神经网络包括输入层、第一卷积层和第一下采样层、第二卷积层和第二下采样层、全连接层和输出层。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如软盘、CD-ROM、硬盘驱动器或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。
在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明的试卷分析方法。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。

Claims (10)

1.一种试卷分析方法,适于在计算设备中执行,该方法包括:
获取待分析的试卷图像,并识别该图像中的各文字连通域;
根据所识别出的各文字连通域对该试卷进行文本行的划分,并对各文字连通域进行文字内容的识别;
根据所识别出的文字内容,从所划分的文本行中选取以题目编号为起始的文本行作为题目起始文本行,并根据各题目起始文本行的位置确定每道题目的题目区域;
从所述试卷图像中提取教师批改笔迹的颜色分量,并对该颜色分量进行识别,得到教师的批改信息;以及
将教师的批改信息与对应的题目区域和题目编号作对应,以确定每道题目的教师批改信息。
2.如权利要求1所述的试卷分析方法,其中,所述对该试卷进行文本行的划分的步骤包括:
遍历所识别出的所有文字连通域,对于当前待划分的某文字连通域:
若该文字连通域的纵坐标范围与现有文本行的纵坐标范围没有重叠,则生成一个新的文本行,并将该文字连通域内的文字放到新的文本行中;
若该文字连通域的纵坐标范围与现有文本行中某一行的纵坐标范围有重叠,则将该文字连通域放入该文本行中,并更新该文本行的位置信息;
若该文字连通域的纵坐标范围与两行或两行以上的现有文本行的纵坐标范围有重叠,则将该文字连通域放入重叠范围最多的文本行中,并更新该文本行的位置信息。
3.如权利要求1或2所述的试卷分析方法,其中,还包括步骤:
将每个文本行的文字连通域按其连通域左边界的横坐标值进行排序;
对于每个文本行,对其文字连通域进行从左到右的遍历:
若相邻两个文字连通域的左右间隔小于预定字符宽度,则将这两个文字连通域保留其在同一文本行;反之,则从这两个文字连通域的中间位置将该文本行拆分为两个不同的文本行,并更新各自的文本行信息。
4.如权利要求1-3中任一项所述的试卷分析方法,其中,还包括确定试卷版面类型的步骤:
计算该试卷图像的横轴方向上每一列所穿越的文本行的个数;
若在试卷的中部区域存在一个区间,该区间内每一列所穿越的文本行个数均为0,且该区间的宽度大于等于预定字符宽度,则将该试卷类型标记为双栏试卷;反之,则标记为单栏试卷。
5.如权利要求4所述的试卷分析方法,其中,还包括步骤:
根据各文本行的横坐标来确定该文本行在双栏试卷中的左栏或右栏。
6.如权利要求1所述的试卷分析方法,其中,所述从所划分的文本行中选取以题目编号为起始的文本行作为题目起始文本行的步骤包括:
根据所识别出的文字内容,从所划分的文本行中选取以阿拉伯数字或汉语数字为起始的文本行作为候选题目起始文本行,并将该阿拉伯数字或汉语数字作为该候选题目起始文本行的候选题号;以及
选取相邻候选题号大小相差为1且候选题号的横坐标对齐的候选题号作为题目编号,并将该题目编号所对应的候选题目起始文本行作为最终的题目起始文本行。
7.如权利要求6所述的试卷分析方法,其中,所述从所划分的文本行中选取以阿拉伯数字或汉语数字为起始的文本行的步骤包括:
将每个文本行中的字符从左到右排序,并选取最左端的预定数目个字符依次进行考察;
若某文本行的预定数目个字符中出现有阿拉伯数字或汉语数字,则将该文本行标记为以阿拉伯数字或汉语数字为起始的文本行,并将该预定数目个字符中最先出现的阿拉伯数字或汉语数字标记为该题目的候选题号。
8.如权利要求1所述的试卷分析方法,其中,每道题目的题目区域在纵轴上的最大值和最小值分别为该题目起始文本行和下一题目起始文本行的上边界。
9.一种计算设备,包括:
至少一个处理器;和
存储有程序指令的存储器;
其中,所述处理器被配置为根据所述存储器中存储的程序指令执行如权利要求1-8中任一项所述的方法。
10.一种存储有程序指令的计算机可读存储介质,所述计算机可读存储介质中的程序指令可以被计算设备读取,使得所述计算设备执行如权利要求1-8中任一项所述的方法。
CN201711262766.7A 2017-12-04 2017-12-04 一种试卷分析方法和计算设备 Active CN107798321B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711262766.7A CN107798321B (zh) 2017-12-04 2017-12-04 一种试卷分析方法和计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711262766.7A CN107798321B (zh) 2017-12-04 2017-12-04 一种试卷分析方法和计算设备

Publications (2)

Publication Number Publication Date
CN107798321A true CN107798321A (zh) 2018-03-13
CN107798321B CN107798321B (zh) 2021-03-02

Family

ID=61537419

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711262766.7A Active CN107798321B (zh) 2017-12-04 2017-12-04 一种试卷分析方法和计算设备

Country Status (1)

Country Link
CN (1) CN107798321B (zh)

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241869A (zh) * 2018-08-16 2019-01-18 邯郸职业技术学院 答题卡分数识别方法、装置及终端设备
CN109389061A (zh) * 2018-09-26 2019-02-26 苏州友教习亦教育科技有限公司 试卷识别方法和系统
CN109409356A (zh) * 2018-08-23 2019-03-01 浙江理工大学 一种基于swt的多方向中文印刷体文字检测方法
CN109871743A (zh) * 2018-12-29 2019-06-11 口碑(上海)信息技术有限公司 文本数据的定位方法及装置、存储介质、终端
CN110210467A (zh) * 2019-05-28 2019-09-06 广州华多网络科技有限公司 一种文本图像的公式定位方法、图像处理装置、存储介质
CN110210309A (zh) * 2019-04-30 2019-09-06 宜春宜联科技有限公司 错题识别方法、系统、可读存储介质及设备
CN110321837A (zh) * 2019-07-02 2019-10-11 南京怀宇科技有限公司 一种试题得分的识别方法、装置、终端及存储介质
CN110322379A (zh) * 2019-07-08 2019-10-11 深圳中兴网信科技有限公司 试卷处理方法和试卷处理系统
CN110414563A (zh) * 2019-06-27 2019-11-05 深圳中兴网信科技有限公司 考试成绩统计方法、系统及计算机可读存储介质
CN110414529A (zh) * 2019-06-26 2019-11-05 深圳中兴网信科技有限公司 试卷信息提取方法、系统及计算机可读存储介质
CN110490180A (zh) * 2019-07-05 2019-11-22 平安国际智慧城市科技股份有限公司 基于图像识别的作业批改方法、装置、存储介质及服务器
CN110647885A (zh) * 2019-09-17 2020-01-03 广州光大教育软件科技股份有限公司 基于图片识别的试卷拆分方法、装置、设备以及介质
CN110705534A (zh) * 2019-09-17 2020-01-17 浙江工业大学 一种适用于电子助视器的错题本生成方法
CN110728687A (zh) * 2019-10-15 2020-01-24 卓尔智联(武汉)研究院有限公司 文件图像分割方法、装置、计算机设备和存储介质
CN110738522A (zh) * 2019-10-15 2020-01-31 卓尔智联(武汉)研究院有限公司 用户画像构建方法、装置、计算机设备和存储介质
CN110837793A (zh) * 2019-11-04 2020-02-25 骆研 一种智能识别手写数学公式批阅系统
CN110956173A (zh) * 2020-02-18 2020-04-03 江西软云科技股份有限公司 题目内容识别方法、装置、可读存储介质及计算机设备
CN110969056A (zh) * 2018-09-29 2020-04-07 杭州海康威视数字技术股份有限公司 文档图像的文档版面分析方法、装置及存储介质
CN111062377A (zh) * 2019-12-18 2020-04-24 广东小天才科技有限公司 一种题号检测方法、系统、存储介质及电子设备
CN111104028A (zh) * 2019-11-12 2020-05-05 广东小天才科技有限公司 题目确定方法、装置、设备及存储介质
CN111507251A (zh) * 2020-04-16 2020-08-07 北京世纪好未来教育科技有限公司 试题图像中作答区域的定位方法、装置和电子设备
WO2020177531A1 (zh) * 2019-03-04 2020-09-10 杭州大拿科技股份有限公司 题目辅助方法及系统
CN111652144A (zh) * 2020-06-03 2020-09-11 广东小天才科技有限公司 基于目标区域融合的题目分割方法、装置、设备和介质
CN111666474A (zh) * 2019-03-08 2020-09-15 小船出海教育科技(北京)有限公司 一种整页搜题的方法及终端
CN111754448A (zh) * 2019-03-27 2020-10-09 李超 一种基于图像采集分析的作业试卷信息采集的方法与装置
CN111767883A (zh) * 2020-07-07 2020-10-13 北京猿力未来科技有限公司 一种题目批改方法及装置
CN111931731A (zh) * 2020-09-24 2020-11-13 北京易真学思教育科技有限公司 判题方法、装置、电子设备及存储介质
CN112307152A (zh) * 2019-08-29 2021-02-02 北京字节跳动网络技术有限公司 一种数据解析方法、装置、电子设备及存储介质
CN112364679A (zh) * 2020-09-04 2021-02-12 联想(北京)有限公司 一种图像区域识别方法及电子设备
CN112446259A (zh) * 2019-09-02 2021-03-05 深圳中兴网信科技有限公司 图像处理方法、装置、终端和计算机可读存储介质
CN112699337A (zh) * 2019-10-22 2021-04-23 北京易真学思教育科技有限公司 方程批改方法、电子设备及计算机存储介质
CN113052315A (zh) * 2019-12-26 2021-06-29 北京易真学思教育科技有限公司 组卷模型训练及其组卷方法、装置及计算机存储介质
WO2021143058A1 (zh) * 2020-01-15 2021-07-22 平安国际智慧城市科技股份有限公司 基于图像的信息比对方法、装置、电子设备及计算机可读存储介质
CN113723301A (zh) * 2021-08-31 2021-11-30 广州新丝路信息科技有限公司 一种进口货物报关单ocr识别分行处理方法及装置
CN113793538A (zh) * 2021-09-18 2021-12-14 珠海读书郎软件科技有限公司 一种教辅作业错题收集的方法及系统
CN114550191A (zh) * 2022-02-10 2022-05-27 珠海读书郎软件科技有限公司 一种智能批改的方法及智能台灯

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090111202A (ko) * 2008-04-21 2009-10-26 슬림디스크 주식회사 한글의 기본 구성요소인 수평선, 수직선, 사선, 원의개수와 특성치를 이용한 한글인식 방법 및 장치
CN101630414A (zh) * 2009-08-20 2010-01-20 上海交通大学 实时图像连通域质心确定方法
CN102567300A (zh) * 2011-12-29 2012-07-11 方正国际软件有限公司 图片文档的处理方法及装置
CN102750534A (zh) * 2012-06-26 2012-10-24 北京文通科技有限公司 一种字符切分的方法和装置
US8320629B2 (en) * 2004-07-06 2012-11-27 Hi-Tech Solutions Ltd. Multi-level neural network based characters identification method and system
CN104636742A (zh) * 2015-02-16 2015-05-20 珠海市追梦网络科技有限公司 一种通过摄像自动锁定目标题目并传输的方法及设备
CN105095892A (zh) * 2014-05-16 2015-11-25 上海市上海中学 基于图像处理的学生文档管理系统
CN105844275A (zh) * 2016-03-25 2016-08-10 北京云江科技有限公司 文本图像中文本行的定位方法
CN106326854A (zh) * 2016-08-19 2017-01-11 掌阅科技股份有限公司 一种版式文档段落识别方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8320629B2 (en) * 2004-07-06 2012-11-27 Hi-Tech Solutions Ltd. Multi-level neural network based characters identification method and system
KR20090111202A (ko) * 2008-04-21 2009-10-26 슬림디스크 주식회사 한글의 기본 구성요소인 수평선, 수직선, 사선, 원의개수와 특성치를 이용한 한글인식 방법 및 장치
CN101630414A (zh) * 2009-08-20 2010-01-20 上海交通大学 实时图像连通域质心确定方法
CN102567300A (zh) * 2011-12-29 2012-07-11 方正国际软件有限公司 图片文档的处理方法及装置
CN102750534A (zh) * 2012-06-26 2012-10-24 北京文通科技有限公司 一种字符切分的方法和装置
CN105095892A (zh) * 2014-05-16 2015-11-25 上海市上海中学 基于图像处理的学生文档管理系统
CN104636742A (zh) * 2015-02-16 2015-05-20 珠海市追梦网络科技有限公司 一种通过摄像自动锁定目标题目并传输的方法及设备
CN105844275A (zh) * 2016-03-25 2016-08-10 北京云江科技有限公司 文本图像中文本行的定位方法
CN106326854A (zh) * 2016-08-19 2017-01-11 掌阅科技股份有限公司 一种版式文档段落识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
马希荣,等: "《西夏文字数字化方法及其应用》", 30 June 2002, 甘肃文化出版社 *

Cited By (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241869A (zh) * 2018-08-16 2019-01-18 邯郸职业技术学院 答题卡分数识别方法、装置及终端设备
CN109409356A (zh) * 2018-08-23 2019-03-01 浙江理工大学 一种基于swt的多方向中文印刷体文字检测方法
CN109389061A (zh) * 2018-09-26 2019-02-26 苏州友教习亦教育科技有限公司 试卷识别方法和系统
CN110969056B (zh) * 2018-09-29 2023-08-08 杭州海康威视数字技术股份有限公司 文档图像的文档版面分析方法、装置及存储介质
CN110969056A (zh) * 2018-09-29 2020-04-07 杭州海康威视数字技术股份有限公司 文档图像的文档版面分析方法、装置及存储介质
CN109871743A (zh) * 2018-12-29 2019-06-11 口碑(上海)信息技术有限公司 文本数据的定位方法及装置、存储介质、终端
CN109871743B (zh) * 2018-12-29 2021-01-12 口碑(上海)信息技术有限公司 文本数据的定位方法及装置、存储介质、终端
WO2020177531A1 (zh) * 2019-03-04 2020-09-10 杭州大拿科技股份有限公司 题目辅助方法及系统
CN111666474B (zh) * 2019-03-08 2023-08-25 北京百舸飞驰科技有限公司 一种整页搜题的方法及终端
CN111666474A (zh) * 2019-03-08 2020-09-15 小船出海教育科技(北京)有限公司 一种整页搜题的方法及终端
CN111754448A (zh) * 2019-03-27 2020-10-09 李超 一种基于图像采集分析的作业试卷信息采集的方法与装置
CN110210309A (zh) * 2019-04-30 2019-09-06 宜春宜联科技有限公司 错题识别方法、系统、可读存储介质及设备
CN110210467B (zh) * 2019-05-28 2021-07-30 广州华多网络科技有限公司 一种文本图像的公式定位方法、图像处理装置、存储介质
CN110210467A (zh) * 2019-05-28 2019-09-06 广州华多网络科技有限公司 一种文本图像的公式定位方法、图像处理装置、存储介质
WO2020259060A1 (zh) * 2019-06-26 2020-12-30 深圳中兴网信科技有限公司 试卷信息提取方法、系统及计算机可读存储介质
CN110414529A (zh) * 2019-06-26 2019-11-05 深圳中兴网信科技有限公司 试卷信息提取方法、系统及计算机可读存储介质
CN110414563A (zh) * 2019-06-27 2019-11-05 深圳中兴网信科技有限公司 考试成绩统计方法、系统及计算机可读存储介质
CN110321837A (zh) * 2019-07-02 2019-10-11 南京怀宇科技有限公司 一种试题得分的识别方法、装置、终端及存储介质
CN110321837B (zh) * 2019-07-02 2023-05-30 南京怀宇科技有限公司 一种试题得分的识别方法、装置、终端及存储介质
CN110490180A (zh) * 2019-07-05 2019-11-22 平安国际智慧城市科技股份有限公司 基于图像识别的作业批改方法、装置、存储介质及服务器
CN110490180B (zh) * 2019-07-05 2022-06-17 平安国际智慧城市科技股份有限公司 基于图像识别的作业批改方法、装置、存储介质及服务器
CN110322379A (zh) * 2019-07-08 2019-10-11 深圳中兴网信科技有限公司 试卷处理方法和试卷处理系统
CN112307152A (zh) * 2019-08-29 2021-02-02 北京字节跳动网络技术有限公司 一种数据解析方法、装置、电子设备及存储介质
CN112446259A (zh) * 2019-09-02 2021-03-05 深圳中兴网信科技有限公司 图像处理方法、装置、终端和计算机可读存储介质
CN110705534B (zh) * 2019-09-17 2022-06-14 浙江工业大学 一种适用于电子助视器的错题本生成方法
CN110647885A (zh) * 2019-09-17 2020-01-03 广州光大教育软件科技股份有限公司 基于图片识别的试卷拆分方法、装置、设备以及介质
CN110705534A (zh) * 2019-09-17 2020-01-17 浙江工业大学 一种适用于电子助视器的错题本生成方法
CN110728687A (zh) * 2019-10-15 2020-01-24 卓尔智联(武汉)研究院有限公司 文件图像分割方法、装置、计算机设备和存储介质
CN110738522B (zh) * 2019-10-15 2022-12-09 卓尔智联(武汉)研究院有限公司 用户画像构建方法、装置、计算机设备和存储介质
CN110738522A (zh) * 2019-10-15 2020-01-31 卓尔智联(武汉)研究院有限公司 用户画像构建方法、装置、计算机设备和存储介质
CN110728687B (zh) * 2019-10-15 2022-08-02 卓尔智联(武汉)研究院有限公司 文件图像分割方法、装置、计算机设备和存储介质
CN112699337B (zh) * 2019-10-22 2022-07-29 北京易真学思教育科技有限公司 方程批改方法、电子设备及计算机存储介质
CN112699337A (zh) * 2019-10-22 2021-04-23 北京易真学思教育科技有限公司 方程批改方法、电子设备及计算机存储介质
CN110837793A (zh) * 2019-11-04 2020-02-25 骆研 一种智能识别手写数学公式批阅系统
CN111104028A (zh) * 2019-11-12 2020-05-05 广东小天才科技有限公司 题目确定方法、装置、设备及存储介质
CN111062377B (zh) * 2019-12-18 2024-02-23 广东小天才科技有限公司 一种题号检测方法、系统、存储介质及电子设备
CN111062377A (zh) * 2019-12-18 2020-04-24 广东小天才科技有限公司 一种题号检测方法、系统、存储介质及电子设备
CN113052315A (zh) * 2019-12-26 2021-06-29 北京易真学思教育科技有限公司 组卷模型训练及其组卷方法、装置及计算机存储介质
CN113052315B (zh) * 2019-12-26 2022-05-17 北京易真学思教育科技有限公司 组卷模型训练及其组卷方法、装置及计算机存储介质
WO2021143058A1 (zh) * 2020-01-15 2021-07-22 平安国际智慧城市科技股份有限公司 基于图像的信息比对方法、装置、电子设备及计算机可读存储介质
CN110956173A (zh) * 2020-02-18 2020-04-03 江西软云科技股份有限公司 题目内容识别方法、装置、可读存储介质及计算机设备
CN111507251B (zh) * 2020-04-16 2022-10-21 北京世纪好未来教育科技有限公司 试题图像中作答区域的定位方法、装置、电子设备及计算机存储介质
CN111507251A (zh) * 2020-04-16 2020-08-07 北京世纪好未来教育科技有限公司 试题图像中作答区域的定位方法、装置和电子设备
CN111652144B (zh) * 2020-06-03 2023-09-26 广东小天才科技有限公司 基于目标区域融合的题目分割方法、装置、设备和介质
CN111652144A (zh) * 2020-06-03 2020-09-11 广东小天才科技有限公司 基于目标区域融合的题目分割方法、装置、设备和介质
CN111767883A (zh) * 2020-07-07 2020-10-13 北京猿力未来科技有限公司 一种题目批改方法及装置
CN111767883B (zh) * 2020-07-07 2024-04-12 北京猿力未来科技有限公司 一种题目批改方法及装置
CN112364679A (zh) * 2020-09-04 2021-02-12 联想(北京)有限公司 一种图像区域识别方法及电子设备
CN111931731B (zh) * 2020-09-24 2021-11-02 北京易真学思教育科技有限公司 判题方法、装置、电子设备及存储介质
CN111931731A (zh) * 2020-09-24 2020-11-13 北京易真学思教育科技有限公司 判题方法、装置、电子设备及存储介质
CN113723301A (zh) * 2021-08-31 2021-11-30 广州新丝路信息科技有限公司 一种进口货物报关单ocr识别分行处理方法及装置
CN113793538A (zh) * 2021-09-18 2021-12-14 珠海读书郎软件科技有限公司 一种教辅作业错题收集的方法及系统
CN114550191A (zh) * 2022-02-10 2022-05-27 珠海读书郎软件科技有限公司 一种智能批改的方法及智能台灯

Also Published As

Publication number Publication date
CN107798321B (zh) 2021-03-02

Similar Documents

Publication Publication Date Title
CN107798321A (zh) 一种试卷分析方法和计算设备
US11410407B2 (en) Method and device for generating collection of incorrectly-answered questions
US10846553B2 (en) Recognizing typewritten and handwritten characters using end-to-end deep learning
CN109634961B (zh) 一种试卷样本生成方法、装置、电子设备和存储介质
CN111753767A (zh) 一种作业自动批改的方法、装置、电子设备和存储介质
CN109635805B (zh) 图像文本定位方法及装置、图像文本识别方法及装置
CN107622271B (zh) 手写文本行提取方法及系统
CN110222678B (zh) 一种题目分析方法、系统、可读存储介质及电子设备
CN109214471A (zh) 评价练字字帖中的书写字的方法及系统
CN112949476B (zh) 基于图卷积神经网络的文本关系检测方法、装置及存储介质
CN106846961A (zh) 电子试卷的处理方法和装置
CN112580503A (zh) 一种作业批改方法、装置、设备及存储介质
CN106650720A (zh) 基于文字识别技术的网上评卷方法、装置及系统
CN112446259A (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN113177435A (zh) 试卷分析方法、装置、存储介质及电子设备
CN114881698A (zh) 广告合规审核方法、装置、电子设备及存储介质
Ramirez et al. Automatic recognition of square notation symbols in western plainchant manuscripts
CN113505786A (zh) 试题拍照评判方法、装置及电子设备
CN111027533B (zh) 一种点读坐标的变换方法、系统、终端设备及存储介质
CN107430824B (zh) 用于评价响应的半自动系统和方法
CN110852131A (zh) 一种考试卡的信息采集方法、系统及终端
CN110490157A (zh) 文字评估方法、文字学习方法、装置、设备及存储介质
CN116384344A (zh) 一种文档转换方法、装置及存储介质
CN107209862A (zh) 程序、信息存储介质以及识别装置
CN112560849B (zh) 基于神经网络算法的文理分割方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant