CN112016425B - 一种基于深度学习的手写答案识别方法和系统 - Google Patents

一种基于深度学习的手写答案识别方法和系统 Download PDF

Info

Publication number
CN112016425B
CN112016425B CN202010847022.7A CN202010847022A CN112016425B CN 112016425 B CN112016425 B CN 112016425B CN 202010847022 A CN202010847022 A CN 202010847022A CN 112016425 B CN112016425 B CN 112016425B
Authority
CN
China
Prior art keywords
image
preset
answer image
answer
handwritten
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010847022.7A
Other languages
English (en)
Other versions
CN112016425A (zh
Inventor
王鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Squirrel Classroom Artificial Intelligence Technology Co Ltd
Original Assignee
Shanghai Squirrel Classroom Artificial Intelligence Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Squirrel Classroom Artificial Intelligence Technology Co Ltd filed Critical Shanghai Squirrel Classroom Artificial Intelligence Technology Co Ltd
Priority to CN202010847022.7A priority Critical patent/CN112016425B/zh
Publication of CN112016425A publication Critical patent/CN112016425A/zh
Application granted granted Critical
Publication of CN112016425B publication Critical patent/CN112016425B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/30Writer recognition; Reading and verifying signatures
    • G06V40/33Writer recognition; Reading and verifying signatures based only on signature image, e.g. static signature recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度学习的手写答案识别方法和系统,属于图像识别技术领域。所述方法,包括:获取手写答案图像;计算所述手写答案图像与预设答案图像集中各预设答案图像的对比误差量;所述预设答案图像集包括多个预设答案图像;根据所述对比误差量,计算所述手写答案图像与预设答案图像集中各预设答案图像的相似度;将计算出的最大相似度对应的预设答案图像确定为最终答案图像输出。本发明能够自动识别出手写答案并输出,识别准确性高。

Description

一种基于深度学习的手写答案识别方法和系统
技术领域
本发明涉及图像识别技术领域,特别涉及一种基于深度学习的手写答案识别方法和系统。
背景技术
在学校或者各种考试中,传统的批改作业或阅卷的方式是全人工进行批改的,显然,这些传统的批改答案的方式要耗费大量的人力和物力,不仅耗时长,而且管理也不方便。随着社会的发展,人们的时间观念越来越强,一方面要求答案批阅周期能够缩短,另一方面也希望对批改的文档管理和跟踪更加智能,从而产生了自动化批改手写答案的需求。现有技术中,例如高考等大型考试中,机器只能够实现对固定位置选择题的填涂答题卡的自动阅卷,对于主观题等,虽然采用了电子图像,但还是需要在计算机上进行人工阅卷。因此,需要一种能够对任何形状的手写答案进行识别的技术方案,以弥补现有技术的空白。
发明内容
本发明提供一种基于深度学习的手写答案识别方法,用于解决传统的人工批改答案的方法效率低以及现有的电子阅卷方法能够识别的答案图形有限的问题。本发明提供的基于深度学习的手写答案识别方法,能够自动识别出手写答案并输出,识别准确性高。
本发明提供的一种基于深度学习的手写答案识别方法,包括:
获取手写答案图像;
计算所述手写答案图像与预设答案图像集中各预设答案图像的对比误差量;所述预设答案图像集包括多个预设答案图像;
根据所述对比误差量,计算所述手写答案图像与预设答案图像集中各预设答案图像的相似度;
将计算出的最大相似度对应的预设答案图像确定为最终答案图像输出。
在一可选实施例中,所述预设答案图像集还包括各预设答案图像对应的m个第一图像区域,每个预设答案图像对应的m个第一图像区域由该预设答案图像等分割而成;
所述获取手写答案,还包括:从所述手写答案图像中获取n个预设大小的第二图像区域;其中,n为小于等于m的正整数,所述预设大小为所述第一图像区域的大小;
所述计算所述手写答案图像与预设答案图像集中各预设答案图像的对比误差量,包括:根据以下公式计算所述手写答案图像与预设答案图像集中各预设答案图像的对比误差量:
Figure BDA0002643396690000021
所述计算所述手写答案图像与预设答案图像集中各预设答案图像的相似度,包括:按照以下公式计算所述手写答案图像与各预设答案图像的相似度:
Figure BDA0002643396690000022
其中,γx为所述手写答案图像与所述第x个预设答案图像的的对比误差量,e为预定常数,π为圆周率,n为所述手写答案图像对应的第二图像区域的总数量,yi为所述手写答案图像对应的第i个第二图像区域的灰度值,zix为所述第x个预设答案图像中第i个第一图像区域的灰度值,i=1,2,…,n;simAx为所述手写答案图像与第x个预设答案图像的相似度;m为所述第x个预设答案图像对应的第一图像区域的总数量,zkx为所述第x个预设答案图像中第k个第一图像区域的灰度值,k=1,2,…,m。
在一可选实施例中,所述从所述手写答案图像中获取n个预设大小的第二图像区域,包括:
判断所述手写答案图像是否能够按照所述预设大小等分割;
若所述手写答案图像能够按照所述预设大小等分割,则将所述手写答案图像按照所述预设大小等分割,得到N个第二图像区域;
若所述手写答案图像不能够按照所述预设大小等分割,则将所述手写答案图像按照所述预设大小进行最大化分割,获取分割后大小等于所述预设大小的N个第二图像区域,抛弃大小小于所述预设大小的其他图像区域;
判断N是否小于等于m;
若N小于等于m,则令n=N,得到n个预设大小的第二图像区域;
若N大于m,则从所述N个第二图像区域中选择n个第二图像区域。
在一可选实施例中,所述将所述手写答案图像按照所述预设大小进行最大化分割,包括:
按照所述预设大小,将所述手写答案图像从中心向外分割,直至分割得到的所述手写答案的最外侧的图像区域的大小小于所述预设大小时为止。
在一可选实施例中,所述若N大于m,则从所述N个第二图像区域中选择n个第二图像区域,包括:
若N大于m,则将所述N个第二图像区域按照各自的中心与所述手写答案图像的中心的距离由短到长进行排序,得到排序结果;
从所述排序结果中选择前面的n个第二图像区域。
本发明还提供一种基于深度学习的手写答案识别系统,包括:
获取模块,用于获取手写答案图像;
误差量计算模块,用于计算所述手写答案图像与预设答案图像集中各预设答案图像的对比误差量;所述预设答案图像集包括多个预设答案图像;
相似度计算模块模块,用于计算所述手写答案图像与预设答案图像集中各预设答案图像的相似度;
输出模块,用于将所述相似度计算模块当前计算出的最大相似度对应的预设答案图像确定为最终答案图像输出。
在一可选实施例中,所述预设答案图像集还包括各预设答案图像对应的m个第一图像区域,每个预设答案图像对应的m个第一图像区域由该预设答案图像等分割而成;
所述获取模块,还用于从所述手写答案图像中获取n个预设大小的第二图像区域;其中,n为小于等于m的正整数,所述预设大小为所述第一图像区域的大小;
所述误差量计算模块,具体用于根据以下公式计算所述手写答案图像与预设答案图像集中各预设答案图像的对比误差量:
Figure BDA0002643396690000041
所述相似度计算模块,具体用于按照以下公式计算所述手写答案图像与各预设答案图像的相似度:
Figure BDA0002643396690000042
其中,γx为所述手写答案图像与所述第x个预设答案图像的的对比误差量,e为预定常数,π为圆周率,n为所述手写答案图像对应的第二图像区域的总数量,yi为所述手写答案图像对应的第i个第二图像区域的灰度值,zix为所述第x个预设答案图像中第i个第一图像区域的灰度值,i=1,2,…,n;simAx为所述手写答案图像与第x个预设答案图像的相似度;m为所述第x个预设答案图像对应的第一图像区域的总数量,zkx为所述第x个预设答案图像中第k个第一图像区域的灰度值,k=1,2,…,m。
在一可选实施例中,所述获取模块,包括:
获取单元,用于获取手写答案图像;
第一判断单元,用于判断所述手写答案图像是否能够按照所述预设大小等分割;
第一分割单元,用于在所述第一判断单元的判断结果为是时,将所述手写答案图像按照所述预设大小等分割,得到N个第二图像区域;
第二分割单元,用于在所述第一判断单元的判断结果为否时,将所述手写答案图像按照所述预设大小进行最大化分割,获取分割后大小等于所述预设大小的N个第二图像区域,抛弃大小小于所述预设大小的其他图像区域;
第二判断单元,用于判断N是否小于等于m;
确定单元,用于在所述第二判断单元的判断结果为是时,令n=N,输出所述第一分割单元或第二分割单元得到的n个预设大小的第二图像区域;
选择单元,用于在所述第二判断单元的判断结果为否时,从所述第一分割单元或第二分割单元得到的N个第二图像区域中选择n个第二图像区域。
在一可选实施例中,所述第二分割单元,具体用于按照所述预设大小,将所述手写答案图像从中心向外分割,直至分割得到的所述手写答案的最外侧的图像区域的大小小于所述预设大小时为止,并获取分割后大小等于所述预设大小的N个第二图像区域,抛弃大小小于所述预设大小的其他图像区域。
在一可选实施例中,所述选择单元,包括:
排序模块,用于在所述第二判断单元的判断结果为否时,将所述第一分割单元或第二分割单元得到的N个第二图像区域按照各自的中心与所述手写答案图像的中心的距离由短到长进行排序,得到排序结果;
选择模块,用于从所述排序结果中选择前面的n个第二图像区域。
本发明提供的基于深度学习的手写答案识别方案,获取手写答案图像后,通过计算手写答案图像和预设答案图像的误差量,可以减小手写答案图像与预设答案图像之间的误差,避免了手写答案误识别情况的发生,然后根据不同的误差量计算对应的预设答案图像与手写答案图像的相似度,使得对比更加准确,从而提高了输出的最终答案图像的准确率,进一步使手写答案识别过程更加真实可靠,为后续对电子答案的进一步处理提供保障。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明提供的一种基于深度学习的手写答案识别方法实施例一的流程图;
图2为本发明提供的一种基于深度学习的手写答案识别方法实施例二的流程图;
图3为手写答案图像和预设答案图像的分割示意图;
图4为图3中步骤S202的一种实施方法流程图;
图5为手写答案图像分割的顺序示意图;
图6为本发明实施例提供的基于深度学习的手写答案识别系统实施例一的结构示意图;
图7为本发明实施例提供的基于深度学习的手写答案识别系统实施例二的结构示意图;
图8为选择单元17的结构示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图1为本发明提供的一种基于深度学习的手写答案识别方法实施例一的流程图。如图1所示,该方法包括以下步骤:
S101:获取手写答案图像;
本实施例中,可以通过预先设置的图像采集设备采集用户的手写答案原始图像。优选地,考虑到初次采集的手写答案原始图像中答题区域可能只有一部分,其他地方为空白区域等无关区域,此步骤可以先通过图像采集设备采集手写答案原始图像,然后对所述手写答案原始图像进行图像识别,根据识别结果,以所述手写答案原始图像中答题区域的中心为新的中心点,对所述手写答案原始图像的边缘空白进行裁切,获取包括所述答题区域的新的手写答案图像。
S102:计算所述手写答案图像与预设答案图像集中各预设答案图像的对比误差量;所述预设答案图像集包括多个预设答案图像;
本实施例中,对于每个目标题目,预先设置有多个预设答案,预先采集每个预设答案图像,并将预先采集的多个预设答案图像存储在预设答案图像集中,显然,所述预设答案图像集中可以包括多个题目各自对应的多个预设答案图像集。例如,若有2个目标题目,第一目标题目有两种解题方法,这两种解题方法的答案分别对应第一预设答案图像P1、第二预设答案图像P2,而第二目标题目有一种解题方法,这种解题方法对应第三预设答案图像P3,或者,进一步的若第三预设答案图像P3中的答题文字为中文,第二目标题目还可以对应答题文字为英文的第四预设答案图像P4以及答题文字为日文的第五预设答案图像A5等,则预设答案图像集可以为{P1,P2,P3,P4,P5},显然,预设答案图像集中的预设答案图像可以根据实际情况进行设置和多种内容变形,此处不再赘述。
此步骤中,对于当前需要识别的手写答案图像,将该手写答案图像与预设答案图像集中的每个预设答案图像一一对比计算对比误差量。
S103:根据所述对比误差量,计算所述手写答案图像与预设答案图像集中各预设答案图像的相似度;所述预设答案图像集包括多个预设答案图像;
本实施例中,在计算手写答案图像和预设答案图像的相似度前,计算每个预设答案图像与手写答案图像的误差量,接着根据误差量,计算每个预设答案图像与手写答案图像的相似度,使得对比更加准确,提高了输出的最终答案图像的准确率。
S104:将计算出的最大相似度对应的预设答案图像确定为最终答案图像输出。
本实施例中,对于当前需要识别的手写答案图像,将预设答案图像集中与其相似度最大的预设答案图像确定为当前需要识别的手写答案图像对应的最终答案图像输出。
本实施例提供的方法,获取手写答案图像后,通过计算手写答案图像和预设答案图像的误差量,可以减小手写答案图像与预设答案图像之间的误差,避免了手写答案误识别情况的发生,然后根据不同的误差量计算对应的预设答案图像与手写答案图像的相似度,使得对比更加准确,从而提高了输出的最终答案图像的准确率,进一步使手写答案识别过程更加真实可靠,为后续对电子答案的进一步处理提供保障。
图2为本发明提供的一种基于深度学习的手写答案识别方法实施例二的流程图。如图2所示,该方法包括以下步骤:
S201:获取手写答案图像;
本实施例中,步骤S201的具体实施方式类似于上述步骤S101,此处不再赘述。
S202:从所述手写答案图像中获取n个预设大小的第二图像区域;
本实施例中,所述预设答案图像集还包括各预设答案图像对应的m个第一图像区域,每个预设答案图像对应的m个第一图像区域由该预设答案图像等分割而成。其中,n为小于等于m的正整数,所述预设大小为所述第一图像区域的大小。从同一手写答案图像中获取的任意两个第二图像区域没有重合区域。
优选地,n=m。
例如:预设答案图像集中每个预设答案图像的大小为400*300分辨率,预先将每个预设答案图像等分割为100个40*30的第一图像区域,则步骤S202中从所述手写答案图像中获取100个以内40*30的第二图像区域。
S203:根据公式(1)计算所述手写答案图像与预设答案图像集中各预设答案图像的对比误差量:
Figure BDA0002643396690000091
公式(1)中,γx为所述手写答案图像与所述第x个预设答案图像的的对比误差量,e为预定常数,π为圆周率,n为所述手写答案图像对应的第二图像区域的总数量,yi为所述手写答案图像对应的第i个第二图像区域的灰度值,zix为所述第x个预设答案图像中第i个第一图像区域的灰度值,i=1,2,…,n。
值得说明的是,本步骤中,在计算对比误差量时,选取预设答案图像对应的第一图像区域的顺序与选择手写答案图像对应的第二图像区域的顺序是相同的,如图3中所示,左边是手写答案图像A及其分割后得到的第二图像区域A1~A8,图3中右边是预设答案图像B及其分割后得到的第一图像区域,如果当前根据公式(1)要计算该手写答案图像A与预设答案图像B的对比误差量,则如图3中所示,将该预设答案图像B对应的第一图像区域按照与手写答案图像A对应的第二图像区域类似的编号顺序编号为B1~B8,这样,能够保证手写答案图像对应的第i个第二图像区域与预设答案图像中第i个第一图像区域在位置上基本对应,从而提高对比误差量的计算结果准确度。
S204:根据公式(2)计算所述手写答案图像与各预设答案图像的相似度:
Figure BDA0002643396690000092
公式(2)中,simAx为所述手写答案图像与第x个预设答案图像的相似度,γx为所述手写答案图像与所述第x个预设答案图像的的对比误差量;n为所述手写答案图像对应的第二图像区域的总数量,yi为所述手写答案图像对应的第i个第二图像区域的灰度值,i=1,2,…,n;m为所述第x个预设答案图像对应的第一图像区域的总数量,zkx为所述第x个预设答案图像中第k个第一图像区域的灰度值,k=1,2,…,m。优选地,m∈[1,10]中的正整数。
S205:将计算出的最大相似度对应的预设答案图像确定为最终答案图像输出。
本实施例中,将预设答案图像和手写答案图像都分割为较小的图像区域,通过第一图像区域和第二图像区域来计算手写答案和预设答案的对比误差量和相似度,图像分小区域计算,能够使得计算结果更为准确。
上述实施例二中,考虑到按照预设大小分割手写答案图像时,有可能能够实现等分割,也有可能不能等分割,分割后得到的第二图像的总数有可能不大于预设答案的分割数量m,也有可能大于m,则在一可选实施例中,如图4所示,上述步骤S202可以包括如下步骤:
S2021:判断所述手写答案图像是否能够按照所述预设大小等分割:若是,则执行S2022,否则,执行S2023;
S2022:将所述手写答案图像按照所述预设大小等分割,得到N个第二图像区域,随后执行步骤S2024;
S2023:将所述手写答案图像按照所述预设大小进行最大化分割,获取分割后大小等于所述预设大小的N个第二图像区域,抛弃大小小于所述预设大小的其他图像区域,随后执行步骤S2024;
本步骤中,按照所述预设大小,将所述手写答案图像从中心向外分割,直至分割得到的所述手写答案的最外侧的图像区域的大小小于所述预设大小时为止。例如图5所示:若手写答案图像为150*120分辨率,预设大小为40*40分辨率,则如图5所示将手写答案图像从中心向外分割,能够最多分割得到9个40*40分辨率大小的第二图像区域C1、C2、C3、C4、C5、C6、C7、C8、C9,其中C后面的数字代表分割的顺序,而对于图5中上、下两侧无法再分割得到40*40大小的图像区域,将其舍弃。
S2024:判断N是否小于等于m;若是,则执行S2025,否则,执行S2026;
S2025:令n=N,得到n个预设大小的第二图像区域;
S2026:从所述N个第二图像区域中选择n个第二图像区域。
本实施例中,考虑到手写答案的边缘一般会留有空白,若分割手写答案图像得到的第二图像区域的总数N小于等于m,则直接将这N个第二图像区域用于步骤S203中进行计算,若分割手写答案图像得到的第二图像区域的总数N小于等于m,则从中选取n个第二图像区域。
本实施例提供的基于深度学习的手写答案识别方法,在图2所示实施例的基础上,通过优选选择手写答案图像的中央区域来与预设答案图像进行对比计算,能够进一步提高手写答案识别的准确性。
优选地,若N大于m,则步骤S2026中,先将所述N个第二图像区域按照各自的中心与所述手写答案图像的中心的距离由短到长进行排序,得到排序结果,然后从所述排序结果中选择前面的n个第二图像区域。例如:若m=6,而手写答案图像C的分割结果如图5中所示,N=9,则从这9个第二图像区域中选择n(n不大于6)个第二图像区域,若取n=m,则先对图5中的第二图像区域C1~C9按照各自的中心与所述手写答案图像的中心的距离由短到长进行排序,得到排序结果{C1,C2,C3,C4,C5,C6,C7,C8,C9},根据排序结果,从第二图像区域C1~C9中选择C1~C6输出。显然,排序结果中,第二图像区域C6、C7、C8、C9的中心到手写答案图像的中心的距离相等,因此排序结果中C6、C7、C8、C9的位置也可以互换,此处不再赘述。
对应于本发明实施例提供的基于深度学习的手写答案识别方法,本发明实施例还提供一种基于深度学习的手写答案识别系统,以下进行详细说明。
图6为本发明实施例提供的基于深度学习的手写答案识别系统实施例一的结构示意图,如图6所示,本实施例的系统可以包括:
获取模块1,用于获取手写答案图像;
误差量计算模块2,用于计算所述手写答案图像与预设答案图像集中各预设答案图像的对比误差量;所述预设答案图像集包括多个预设答案图像;
相似度计算模块3,用于计算所述手写答案图像与预设答案图像集中各预设答案图像的相似度;
输出模块4,用于将相似度计算模块3当前计算出的最大相似度对应的预设答案图像确定为最终答案图像输出。
本实施例的系统,可以用于执行图1所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
在一可选实施例中,所述预设答案图像集还包括各预设答案图像对应的m个第一图像区域,每个预设答案图像对应的m个第一图像区域由该预设答案图像等分割而成;则图6中所示获取模块1,还用于从所述手写答案图像中获取n个预设大小的第二图像区域;其中,n为小于等于m的正整数,所述预设大小为所述第一图像区域的大小;误差量计算模块2,具体用于根据以上公式(1)计算所述手写答案图像与预设答案图像集中各预设答案图像的对比误差量;相似度计算模块3,具体用于按照以上公式(2)计算所述手写答案图像与各预设答案图像的相似度。本实施例的系统,可以用于执行图2所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图7为本发明实施例提供的基于深度学习的手写答案识别系统实施例二的结构示意图,如图7所示,本实施例的系统在图6所示系统结构的基础上,进一步地,获取模块1,包括:
获取单元11,用于获取手写答案图像;
第一判断单元12,用于判断所述手写答案图像是否能够按照所述预设大小等分割;
第一分割单元13,用于在第一判断单元12的判断结果为是时,将所述手写答案图像按照所述预设大小等分割,得到N个第二图像区域;
第二分割单元14,用于在第一判断单元12的判断结果为否时,将所述手写答案图像按照所述预设大小进行最大化分割,获取分割后大小等于所述预设大小的N个第二图像区域,抛弃大小小于所述预设大小的其他图像区域;
第二判断单元15,用于判断N是否小于等于m;
确定单元16,用于在第二判断单元15的判断结果为是时,令n=N,输出第一分割单元13或第二分割单元14得到的n个预设大小的第二图像区域;
选择单元17,用于在第二判断单元15的判断结果为否时,从第一分割单元13或第二分割单元14得到的N个第二图像区域中选择n个第二图像区域。
本实施例的系统,可以用于执行图4所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
在一可选实施例中,图7中的第二分割单元14,具体用于按照所述预设大小,将所述手写答案图像从中心向外分割,直至分割得到的所述手写答案的最外侧的图像区域的大小小于所述预设大小时为止,并获取分割后大小等于所述预设大小的N个第二图像区域,抛弃大小小于所述预设大小的其他图像区域。
在一可选实施例中,如图8所示,图7中的选择单元17可以包括:
排序模块171,用于在第二判断单元15的判断结果为否时,将第一分割单元13或第二分割单元14得到的N个第二图像区域按照各自的中心与所述手写答案图像的中心的距离由短到长进行排序,得到排序结果;
选择模块172,用于从所述排序结果中选择前面的n个第二图像区域。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (8)

1.一种基于深度学习的手写答案识别方法,其特征在于,包括:
获取手写答案图像;
计算所述手写答案图像与预设答案图像集中各预设答案图像的对比误差量;所述预设答案图像集包括多个预设答案图像;
根据所述对比误差量,计算所述手写答案图像与预设答案图像集中各预设答案图像的相似度;
将计算出的最大相似度对应的预设答案图像确定为最终答案图像输出;
其中,所述预设答案图像集还包括各预设答案图像对应的m个第一图像区域,每个预设答案图像对应的m个第一图像区域由该预设答案图像等分割而成;
所述获取手写答案,还包括:从所述手写答案图像中获取n个预设大小的第二图像区域;其中,n为小于等于m的正整数,所述预设大小为所述第一图像区域的大小;
所述计算所述手写答案图像与预设答案图像集中各预设答案图像的对比误差量,包括:根据以下公式计算所述手写答案图像与预设答案图像集中各预设答案图像的对比误差量:
Figure FDA0002956993090000011
所述计算所述手写答案图像与预设答案图像集中各预设答案图像的相似度,包括:按照以下公式计算所述手写答案图像与各预设答案图像的相似度:
Figure FDA0002956993090000012
其中,γx为所述手写答案图像与第x个预设答案图像的的对比误差量,e为预定常数,π为圆周率,n为所述手写答案图像对应的第二图像区域的总数量,yi为所述手写答案图像对应的第i个第二图像区域的灰度值,zix为所述第x个预设答案图像中第i个第一图像区域的灰度值,i=1,2,…,n;simAx为所述手写答案图像与第x个预设答案图像的相似度;m为所述第x个预设答案图像对应的第一图像区域的总数量,zkx为所述第x个预设答案图像中第k个第一图像区域的灰度值,k=1,2,…,m。
2.如权利要求1所述的基于深度学习的手写答案识别方法,其特征在于,所述从所述手写答案图像中获取n个预设大小的第二图像区域,包括:
判断所述手写答案图像是否能够按照所述预设大小等分割;
若所述手写答案图像能够按照所述预设大小等分割,则将所述手写答案图像按照所述预设大小等分割,得到N个第二图像区域;
若所述手写答案图像不能够按照所述预设大小等分割,则将所述手写答案图像按照所述预设大小进行最大化分割,获取分割后大小等于所述预设大小的N个第二图像区域,抛弃大小小于所述预设大小的其他图像区域;
判断N是否小于等于m;
若N小于等于m,则令n=N,得到n个预设大小的第二图像区域;
若N大于m,则从所述N个第二图像区域中选择n个第二图像区域。
3.如权利要求2所述的基于深度学习的手写答案识别方法,其特征在于,所述将所述手写答案图像按照所述预设大小进行最大化分割,包括:
按照所述预设大小,将所述手写答案图像从中心向外分割,直至分割得到的所述手写答案的最外侧的图像区域的大小小于所述预设大小时为止。
4.如权利要求2或3所述的基于深度学习的手写答案识别方法,其特征在于,所述若N大于m,则从所述N个第二图像区域中选择n个第二图像区域,包括:
若N大于m,则将所述N个第二图像区域按照各自的中心与所述手写答案图像的中心的距离由短到长进行排序,得到排序结果;
从所述排序结果中选择前面的n个第二图像区域。
5.一种基于深度学习的手写答案识别系统,其特征在于,包括:
获取模块,用于获取手写答案图像;
误差量计算模块,用于计算所述手写答案图像与预设答案图像集中各预设答案图像的对比误差量;所述预设答案图像集包括多个预设答案图像;
相似度计算模块,用于计算所述手写答案图像与预设答案图像集中各预设答案图像的相似度;
输出模块,用于将所述相似度计算模块当前计算出的最大相似度对应的预设答案图像确定为最终答案图像输出;
其中,所述预设答案图像集还包括各预设答案图像对应的m个第一图像区域,每个预设答案图像对应的m个第一图像区域由该预设答案图像等分割而成;
所述获取模块,还用于从所述手写答案图像中获取n个预设大小的第二图像区域;其中,n为小于等于m的正整数,所述预设大小为所述第一图像区域的大小;
所述误差量计算模块,具体用于根据以下公式计算所述手写答案图像与预设答案图像集中各预设答案图像的对比误差量:
Figure FDA0002956993090000031
所述相似度计算模块,具体用于按照以下公式计算所述手写答案图像与各预设答案图像的相似度:
Figure FDA0002956993090000032
其中,γx为所述手写答案图像与第x个预设答案图像的的对比误差量,e为预定常数,π为圆周率,n为所述手写答案图像对应的第二图像区域的总数量,yi为所述手写答案图像对应的第i个第二图像区域的灰度值,zix为所述第x个预设答案图像中第i个第一图像区域的灰度值,i=1,2,…,n;simAx为所述手写答案图像与第x个预设答案图像的相似度;m为所述第x个预设答案图像对应的第一图像区域的总数量,zkx为所述第x个预设答案图像中第k个第一图像区域的灰度值,k=1,2,…,m。
6.如权利要求5所述的基于深度学习的手写答案识别系统,其特征在于,所述获取模块,包括:
获取单元,用于获取手写答案图像;
第一判断单元,用于判断所述手写答案图像是否能够按照所述预设大小等分割;
第一分割单元,用于在所述第一判断单元的判断结果为是时,将所述手写答案图像按照所述预设大小等分割,得到N个第二图像区域;
第二分割单元,用于在所述第一判断单元的判断结果为否时,将所述手写答案图像按照所述预设大小进行最大化分割,获取分割后大小等于所述预设大小的N个第二图像区域,抛弃大小小于所述预设大小的其他图像区域;
第二判断单元,用于判断N是否小于等于m;
确定单元,用于在所述第二判断单元的判断结果为是时,令n=N,输出所述第一分割单元或第二分割单元得到的n个预设大小的第二图像区域;
选择单元,用于在所述第二判断单元的判断结果为否时,从所述第一分割单元或第二分割单元得到的N个第二图像区域中选择n个第二图像区域。
7.如权利要求6所述的基于深度学习的手写答案识别系统,其特征在于,所述第二分割单元,具体用于按照所述预设大小,将所述手写答案图像从中心向外分割,直至分割得到的所述手写答案的最外侧的图像区域的大小小于所述预设大小时为止,并获取分割后大小等于所述预设大小的N个第二图像区域,抛弃大小小于所述预设大小的其他图像区域。
8.如权利要求6或7所述的基于深度学习的手写答案识别系统其特征在于,所述选择单元,包括:
排序模块,用于在所述第二判断单元的判断结果为否时,将所述第一分割单元或第二分割单元得到的N个第二图像区域按照各自的中心与所述手写答案图像的中心的距离由短到长进行排序,得到排序结果;
选择模块,用于从所述排序结果中选择前面的n个第二图像区域。
CN202010847022.7A 2020-08-21 2020-08-21 一种基于深度学习的手写答案识别方法和系统 Active CN112016425B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010847022.7A CN112016425B (zh) 2020-08-21 2020-08-21 一种基于深度学习的手写答案识别方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010847022.7A CN112016425B (zh) 2020-08-21 2020-08-21 一种基于深度学习的手写答案识别方法和系统

Publications (2)

Publication Number Publication Date
CN112016425A CN112016425A (zh) 2020-12-01
CN112016425B true CN112016425B (zh) 2021-04-27

Family

ID=73505382

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010847022.7A Active CN112016425B (zh) 2020-08-21 2020-08-21 一种基于深度学习的手写答案识别方法和系统

Country Status (1)

Country Link
CN (1) CN112016425B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112149095B (zh) * 2020-10-26 2021-06-29 上海松鼠课堂人工智能科技有限公司 学生数据安全治理方法和系统
CN113326815B (zh) * 2021-07-12 2022-05-06 北京世纪好未来教育科技有限公司 一种文档处理方法、装置、电子设备及可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008059418A (ja) * 2006-09-01 2008-03-13 Yamaguchi Univ パターン画像認識システム
US9773428B2 (en) * 2012-12-11 2017-09-26 Fluidity Software, Inc. Computerized system and method for teaching, learning, and assessing step by step solutions to stem problems
CN108959261A (zh) * 2018-07-06 2018-12-07 京工博创(北京)科技有限公司 基于自然语言的试卷主观题判题装置及方法
CN109583423A (zh) * 2018-12-18 2019-04-05 苏州大学 一种手写数字识别的方法、装置及相关组件
CN109670504A (zh) * 2018-12-28 2019-04-23 杭州大拿科技股份有限公司 一种手写答案识别批改方法及装置
CN110287296A (zh) * 2019-05-21 2019-09-27 平安科技(深圳)有限公司 一种问题答案选取方法、装置、计算机设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10423852B1 (en) * 2018-03-20 2019-09-24 Konica Minolta Laboratory U.S.A., Inc. Text image processing using word spacing equalization for ICR system employing artificial neural network
CN109299663A (zh) * 2018-08-27 2019-02-01 刘梅英 手写字体识别方法、系统以及终端设备
CN110674826B (zh) * 2019-10-09 2022-12-20 嘉兴学院 基于量子纠缠的字符识别方法
CN111274762A (zh) * 2020-01-17 2020-06-12 昆明理工大学 一种基于藏经典文献中多样性字体的计算机表达方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008059418A (ja) * 2006-09-01 2008-03-13 Yamaguchi Univ パターン画像認識システム
US9773428B2 (en) * 2012-12-11 2017-09-26 Fluidity Software, Inc. Computerized system and method for teaching, learning, and assessing step by step solutions to stem problems
CN108959261A (zh) * 2018-07-06 2018-12-07 京工博创(北京)科技有限公司 基于自然语言的试卷主观题判题装置及方法
CN109583423A (zh) * 2018-12-18 2019-04-05 苏州大学 一种手写数字识别的方法、装置及相关组件
CN109670504A (zh) * 2018-12-28 2019-04-23 杭州大拿科技股份有限公司 一种手写答案识别批改方法及装置
CN110287296A (zh) * 2019-05-21 2019-09-27 平安科技(深圳)有限公司 一种问题答案选取方法、装置、计算机设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Dissimilarity Gaussian Mixture Models for Efficient Offline Handwritten Text-Independent Identification Using SIFT and RootSIFT Descriptors;Faraz Ahmad Khan 等;《IEEE Transactions on Information Forensics and Security》;20190228;第14卷(第2期);第289-303页 *
面向试卷累分系统的数字图像处理技术;张方舟 等;《计算机与数字工程》;20180821;第46卷(第7期);第1427-1432页 *

Also Published As

Publication number Publication date
CN112016425A (zh) 2020-12-01

Similar Documents

Publication Publication Date Title
WO2019238063A1 (zh) 文本检测分析方法、装置及设备
CN105389593A (zh) 基于surf特征的图像物体识别方法
CN111597908A (zh) 试卷批改方法和试卷批改装置
CN110659584B (zh) 一种基于图像识别的智能留痕阅卷系统
CN112016425B (zh) 一种基于深度学习的手写答案识别方法和系统
CN108537218B (zh) 一种答题卡的识别处理方法及装置
CN106033535B (zh) 电子阅卷方法
EP2275974A2 (en) System and method for classifying connected groups of foreground pixels in scanned document images according to the type of marking
US20220198182A1 (en) Methods and systems of field detection in a document
CN104239850A (zh) 基于图像综合特征的答题卡填涂信息自动识别方法
CN112927776A (zh) 一种面向医学检验报告的人工智能自动解读系统
CN111242899B (zh) 基于图像的瑕疵检测方法及计算机可读存储介质
CN109993201A (zh) 一种图像处理方法、装置和可读存储介质
CN109635805A (zh) 图像文本定位方法及装置、图像文本识别方法及装置
CN112733936A (zh) 一种基于图像识别的可回收垃圾分类方法
CN109213886B (zh) 基于图像分割和模糊模式识别的图像检索方法及系统
CN113762274B (zh) 一种答题卡目标区域检测方法、系统、存储介质及设备
CN113191348B (zh) 一种基于模板的文本结构化提取方法及工具
CN110929746A (zh) 一种基于深度神经网络的电子卷宗标题定位提取与分类方法
CN113159014A (zh) 基于手写题号的客观题批阅方法、装置、设备及存储介质
CN116740723A (zh) 一种基于开源Paddle框架的PDF文档识别方法
CN111242131B (zh) 一种智能阅卷中图像识别的方法、存储介质及装置
KR20100108778A (ko) 영상정보 분류방법 및 장치
CN110728240A (zh) 一种对电子卷宗的标题自动识别的方法及装置
CN115601778A (zh) 基于图像识别的作业批改方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PP01 Preservation of patent right
PP01 Preservation of patent right

Effective date of registration: 20221020

Granted publication date: 20210427