CN110647885B - 基于图片识别的试卷拆分方法、装置、设备以及介质 - Google Patents

基于图片识别的试卷拆分方法、装置、设备以及介质 Download PDF

Info

Publication number
CN110647885B
CN110647885B CN201910876251.9A CN201910876251A CN110647885B CN 110647885 B CN110647885 B CN 110647885B CN 201910876251 A CN201910876251 A CN 201910876251A CN 110647885 B CN110647885 B CN 110647885B
Authority
CN
China
Prior art keywords
test
question
test paper
picture
test question
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910876251.9A
Other languages
English (en)
Other versions
CN110647885A (zh
Inventor
白永睿
徐宋传
钟南林
陈晓宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Everbright Information Technology Co ltd
Original Assignee
Guangzhou Everbright Education Software Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Everbright Education Software Technology Co ltd filed Critical Guangzhou Everbright Education Software Technology Co ltd
Priority to CN201910876251.9A priority Critical patent/CN110647885B/zh
Publication of CN110647885A publication Critical patent/CN110647885A/zh
Application granted granted Critical
Publication of CN110647885B publication Critical patent/CN110647885B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/243Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)

Abstract

本发明涉及计算机技术的技术领域,尤其是涉及一种基于图片识别的试卷拆分方法、装置、设备以及介质,基于图片识别的试卷拆分方法包括:S10:获取待拆分试卷文件,待拆分试卷文件的文件格式为图片格式,待拆分试卷文件中包括待提取试题信息;S20:对待拆分试卷文件进行角度纠正预处理,得到待识别试卷文件;S30:从待识别试卷文件中进行文字探测,得到试题位置信息;S40:根据试题位置信息,逐一对试题位置信息进行文字识别,得到对应的试题文字信息;S50:将试题文字信息进行组装,得到待提取试题信息对应的试题图片。本发明具有能够从照片或等图片格式的试卷中识别出具体题目,提升对试卷拆分的效率的效果。

Description

基于图片识别的试卷拆分方法、装置、设备以及介质
技术领域
本发明涉及计算机技术的技术领域,尤其是涉及一种基于图片识别的试卷拆分方法、装置、设备以及介质。
背景技术
目前,在学校中,尤其是对于高中需要参加高考的学生,为了让学生能够接触到更多的题目,提升学生的学习成绩,学生会参加大量的考试或是做大量的试题。
在出题老师进行出题时,需要从大量的题库中或试卷中选取出对应的题目,进而组成新的试卷或练习卷。在制作题库的时候,通常是从现有的试题中,将试题中的题目进行拆分,进而将拆分出的题目作为题库。然而存在需要被拆分的试卷为照片、扫描件或PDF等格式的试卷,在从这些格式的试卷中获取试题时,难以直接从试卷中获取具体的题目,进而增大了对试卷拆分的工作量,影响了试卷拆分的效率,因此存在改进空间。
发明内容
本发明的目的是提供一种能够从照片、扫描件或PDF等格式的试卷中识别出具体题目,提升对试卷拆分的效率的基于图片识别的试卷拆分方法、装置、设备以及介质。
本发明的上述发明目的一是通过以下技术方案得以实现的:
一种基于图片识别的试卷拆分方法,所述基于图片识别的试卷拆分方法包括:
S10:获取待拆分试卷文件,所述待拆分试卷文件的文件格式为图片格式或pdf格式,所述待拆分试卷文件中包括待提取试题信息;
S20:对所述待拆分试卷文件进行角度纠正预处理,得到待识别试卷文件;
S30:从所述待识别试卷文件中进行文字探测,得到试题位置信息;
S40:根据所述试题位置信息,逐一对所述试题位置信息进行文字识别,得到对应的试题文字信息;
S50:将所述试题文字信息进行组装,得到所述待提取试题信息对应的试题图片。
通过采用上述技术方案,通过对图片或pdf等格式的待拆分试卷文件进行角度纠正预处理,能够使得图片中,试题的内容处于正常的位置,进而能够便于对待拆分试卷文件的识别;对待识别试卷文件进行文字探测,能够去除待拆分试卷文件中的噪点以及探测出试题文字的位置,得到该试题位置信息;从该试题位置信息中识别出试题文字信息,进而组装得到该试题图片,能够实现从该待拆分试卷文件中将具体的试题识别并进行拆分,有利于老师或者出题人员出题以及制作题库,提升了后续老师出题的效率,进而有助于提升学生的学习效果。
本发明进一步设置为:步骤S20包括:
S21:对所述待拆分试卷文件进行双峰法图像二值化处理后,得到所述待拆分试卷文件对应的二值图片;
S22:根据所述二值图片的片像素点的分布,作为纠偏线索区域;
S23:通过傅里叶变换,获取所述纠偏线索区域的最小外接矩形框,并通过所述最小外接矩形框获取图片倾斜角数据;
S24:调整所述图片倾斜角数据至预设的角度阈值内,得到所述待识别试卷文件。
通过采用上述技术方案,通过双峰法图像二值化对该待拆分试卷文件进行处理,能够使得提升获取得到的二值图片的效果;傅里叶变换对待拆分试卷文件进行处理,能够将待产分试卷文件的角度进行纠正;通过将傅里叶变换图进行二值化,能够凸显出待拆分试卷文件中的试题内容,便于对该待拆分试题文件的角度纠正。
本发明进一步设置为:步骤S30包括:
S31:采用文字识别OCR技术,在所述待识别试卷文件中识别出试卷文字,得到试卷文字区域;
S32:获取所述试卷文字区域的坐标数据,并将所述坐标数据作为所述试题位置信息。
通过采用上述技术方案,通过文字识别技术,在该待识别试卷文件中识别出文字内容,以及文字内容的试卷文字区域,能够在待识别试卷文件中,试题内容的位置,有利于进一步试题内容的位置进行文字识别,提升了文字识别的效率。
本发明进一步设置为:步骤S40包括:
S41:将每一试题位置信息中的所述待识别试卷文字输入至CNN网络,得到对应的文字特征图;
S42:按照所述文字特征图的纬度对所述文字特征图进行切分后,输入至RNN网络中,得到对应的文字矩阵图;
S43:对所述文字矩阵图进行解码识别,得到文字识别结果的索引值;
S44:遍历所述文字识别结果的索引值,将每一所述索引值转换成所述试题文字信息。
通过采用上述技术方案,通过采用CNN网络和RNN网络的人工智能的方法,能够从每一试题位置信息中将试题内容的文字识别出文字矩阵图以及对应的索引值,进而能够根据该索引值,转换成对应的试题文字信息,从而能够识别出待识别试卷文件中文字的具体内容,有利于后续得到具体的试题,实现对试卷的拆分。
本发明进一步设置为:步骤S50包括:
S51:逐行从所述试题文字信息中的获取试题文字;
S52:将所述试题文字组成所述试题图片。
通过采用上述技术方案,通过对试题文字进行识别,能够将待拆分试卷文件中的具体试题,组装成对应试题图片,进而实现了将待拆分试卷文件中的每一道试题拆分成对应的试题图片,在对该试题图片进行保存后,能够直接将该试题图片组装成新的试卷,或是有利于老师对历史的试题进行分析,制定新的教学计划。
本发明的上述发明目的二是通过以下技术方案得以实现的:
一种基于图片识别的试卷拆分装置,所述基于图片识别的试卷拆分装置包括:
文件获取模块,用于获取待拆分试卷文件,所述待拆分试卷文件的文件格式为图片格式或pdf格式,所述待拆分试卷文件中包括待提取试题信息;
角度纠正模块,用于对所述待拆分试卷文件进行角度纠正预处理,得到待识别试卷文件;
文字探测模块,用于从所述待识别试卷文件中进行文字探测,得到试题位置信息;
文字识别模块,用于根据所述试题位置信息,逐一对所述试题位置信息进行文字识别,得到对应的试题文字信息;
试题组装模块,用于将所述试题文字信息进行组装,得到所述待提取试题信息对应的试题图片。
通过采用上述技术方案,通过对图片或pdf等格式的待拆分试卷文件进行角度纠正预处理,能够使得图片中,试题的内容处于正常的位置,进而能够便于对待拆分试卷文件的识别;对待识别试卷文件进行文字探测,能够去除待拆分试卷文件中的噪点以及探测出试题文字的位置,得到该试题位置信息;从该试题位置信息中识别出试题文字信息,进而组装得到该试题图片,能够实现从该待拆分试卷文件中将具体的试题识别并进行拆分,有利于老师或者出题人员出题以及制作题库,提升了后续老师出题的效率,进而有助于提升学生的学习效果。
本发明的上述发明目的三是通过以下技术方案得以实现的:
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于图片识别的试卷拆分方法的步骤。
本发明的上述发明目的四是通过以下技术方案得以实现的:
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于图片识别的试卷拆分方法的步骤。
综上所述,本发明的有益技术效果为:
1.通过对图片或pdf等格式的待拆分试卷文件进行角度纠正预处理,能够使得图片中,试题的内容处于正常的位置,进而能够便于对待拆分试卷文件的识别;
2.对待识别试卷文件进行文字探测,能够去除待拆分试卷文件中的噪点以及探测出试题文字的位置,得到该试题位置信息;
3.从该试题位置信息中识别出试题文字信息,进而组装得到该试题图片,能够实现从该待拆分试卷文件中将具体的试题识别并进行拆分,有利于老师或者出题人员出题以及制作题库,提升了后续老师出题的效率,进而有助于提升学生的学习效果。
附图说明
图1是本发明一实施例中基于图片识别的试卷拆分方法的一流程图;
图2是本发明一实施例中基于图片识别的试卷拆分方法中步骤S20的实现流程图;
图3是本发明一实施例中基于图片识别的试卷拆分方法中步骤S30的实现流程图;
图4是本发明一实施例中基于图片识别的试卷拆分方法中步骤S40的实现流程图;
图5是本发明一实施例中基于图片识别的试卷拆分方法中步骤S50的实现流程图;
图6是本发明一实施例中基于图片识别的试卷拆分装置的一原理框图;
图7是本发明一实施例中计算机设备的一示意图。
具体实施方式
以下结合附图对本发明作进一步详细说明。
实施例一:
在一实施例中,如图1所示,本发明公开了一种基于图片识别的试卷拆分方法,具体包括如下步骤:
S10:获取待拆分试卷文件,待拆分试卷文件的文件格式为图片格式,待拆分试卷文件中包括待提取试题信息。
在本实施例中,待拆分试卷文件是指以图片(jpg、png等)或pdf等格式的文件呈现,记载有试卷内容,并且需要根据试卷内容进行拆分的试卷文件。待提取试题信息是指在待拆分试卷文件中,具体需要被提取并拆分的试题内容。
具体地,通过教师,或者相关工作人员,对纸质的试卷内容进行扫描或者拍照后,得到该图片格式或者是pdf格式的待拆分试卷文件。
进一步地,通过教师,或者相关工作人员将记载有待提取试题信息的待拆分试卷文件进行上传后,获取该待拆分试卷文件。
S20:对待拆分试卷文件进行角度纠正预处理,得到待识别试卷文件。
在本实施例中,角度纠正预处理是指对获取得到的待拆分试卷文件中的待提取试题信息的角度进行纠正调整的处理。待识别试卷文件是指对待拆分试卷文件进行角度调整后的试卷文件。
具体地,通过傅里叶变换,将该待拆分试卷文件转化成对应的频域,再通过对待拆分试卷文件对应的频域进行角度的纠正调整,当角度调整至预设的范围内,将对应的频域转换成该待识别试卷文件。
S30:从待识别试卷文件中进行文字探测,得到试题位置信息。
在本实施例中,文字探测是指在待识别试卷中探测出文字的处理。试题位置信息是具体的试题文字在该待识别试卷文件中的位置信息。
具体地,通过文字识别技术,在待识别试卷文件中识别出试题的文字,并在识别出文字后,返回在该待识别试卷文件中包含文字的区域,每个区域用矩形标识,矩形位置使用左上角和右下角坐标确定[x1, y1, x2, y2],其中,x1和y1表示矩形左上角位置、x2和y2表示矩形的右下角位置。
进一步地,在通过坐标表示该矩形的位置后,将该矩形的位置作为试题位置信息。
S40:根据试题位置信息,逐一对试题位置信息进行文字识别,得到对应的试题文字信息。
在本实施例中,文字识别是指在试题位置信息中识别出具体的文字的处理。试题文字信息是指将待提取试题信息识别出具体文字后的信息。
具体地,根据试题位置信息中的坐标信息,按照预定的顺序,例如从上到下,或者从下到上等,逐一对每一试题位置信息进行文字识别。在识别时,通过将该试题位置信息中,文字的矩形区域放入预先训练好的人工智能识别模型中,通过该人工智能识别模型中的CNN网络和RNN网络一次对该文字区域内的试题的文字信息进行识别,得到该试题位置信息中的试题文字信息。
S50:将试题文字信息进行组装,得到待提取试题信息对应的试题图片。
在本实施例中,试题图片是指记载有该待拆分试题信息中具体的试题的图片。可理解的,在获取得到的待拆分试题文件中,仅是通过图片呈现的试题文件,老师或者是相关的工作人员无法从该待拆分试题文件中直接复制得到具体的试题,只能够通过手动对该待拆分试题文件中剪切出对应的试题。而试题图片在从待拆分试题文件中识别出具体的文字后,将该文字组成与原始的待拆分试题文件中具体的试题内容相同的试题图片。该试题图片可以是整份待拆分试题文件,也可以是该待拆分试题文件中的待提取试题信息中的具体的一道试题。
具体地,在通过步骤S40得到的试题文字信息后,由于该试题文字信息只是该待提取试题信息中,每一到试题中的每一个字。进一步地,根据每一道大题已经该道大题中的每一道小题的题目类型,将该试题文字信息组成该试题图片。
在本实施例中,通过对图片或pdf等格式的待拆分试卷文件进行角度纠正预处理,能够使得图片中,试题的内容处于正常的位置,进而能够便于对待拆分试卷文件的识别;对待识别试卷文件进行文字探测,能够去除待拆分试卷文件中的噪点以及探测出试题文字的位置,得到该试题位置信息;从该试题位置信息中识别出试题文字信息,进而组装得到该试题图片,能够实现从该待拆分试卷文件中将具体的试题识别并进行拆分,有利于老师或者出题人员出题以及制作题库,提升了后续老师出题的效率,进而有助于提升学生的学习效果。
在一实施例中,如图2所示,在步骤S20中,即对待拆分试卷文件进行角度纠正预处理,得到待识别试卷文件,具体包括如下步骤:
S21:对待拆分试卷文件进行双峰法图像二值化处理后,得到待拆分试卷文件对应的二值图片。
在本实施例中,双峰法图像二值化是指一种图像分割的方法。二值图片是指待拆分试卷文件经过双峰法图像二值化处理后的待拆分试卷文件。
具体地,通过双峰法图像二值化对该待拆分试卷文件进行双峰法处理后,得到该待拆分试卷文件的直方图即双峰图。在该直方图中,寻找两个山峰状的图像分布,山峰的顶点记为Hmax1和Hmax2,他们对应的灰度值分别为T1和T2,那么双峰法图像分割的思想就是找到图像两个山峰之间的谷地最低值,即在[T1,T2]的灰度范围内寻找阈值T,使其满足对应的像素数目最少,表现在图像上就是高度最低,用T待拆分试卷文件对进行二值化,得到对应的二值图片。
S22:根据二值图片的图片像素点的分布,作为纠偏线索区域。
在本实施例中,纠偏线索区域是指用于对二值图片的角度进行调整的基准区域。
具体地,该二值图片的图片像素点分布中,选取将待提取试题信息中的文字区域的图片像素点,作为该纠偏线索区域,其中,选取该文字区域,可以是选取其中一行文字的区域,例如试卷的标题,或者是某一道大题的题干等。
S23:通过傅里叶变换,获取纠偏线索区域的最小外接矩形框,并通过最小外接矩形框获取图片倾斜角数据。
在本实施例中,最小外接矩形框是指包含该纠偏线索区域中的内容的最小矩形框。
具体地,通过对纠偏线索进行傅里叶变换,计算得到纠偏线索区域的最小外接矩形框。在获取得到该最小外接矩形框后,选取该最小外接矩形框的长边或者宽边,并通过角度获取的算法或者是对应的代码语句,获取该长边或者宽边与水平线的夹角数据,并将该夹角数据作为该图片倾斜角数据。
S24:调整图片倾斜角数据至预设的角度阈值内,得到待识别试卷文件。
具体地,对该图片倾斜角数据的数值进行调整,将该图片倾斜交数据调整至预设的角度阈值内,例如(0,1)后,完成对该对该待拆分试题文件的角度纠正,并将输出的结果作为待识别试卷文件。
在一实施例中,如图3所示,在步骤S30中,即从待识别试卷文件中进行文字探测,得到试题位置信息,具体包括如下步骤:
S31:采用文字识别OCR技术,在待识别试卷文件中识别出试卷文字,得到试卷文字区域。
在本实施例中,文字识别OCR技术是指在待识别试题文件中获取到文字的处理。试卷文字区域在待识别试题文件中,只包含试题文字的区域。
具体地,通过使用现有的OCR工具作为该文字识别OCR技术,并使用文字识别OCR技术的文本探测模型,将该待识别书卷文件输入至该文本探测模型中,通过该文本探测模型探测出该带是被试卷文件中的试卷文字,并将探测出的试卷文字放入矩形框中,将该有试卷文字的矩形框作为试卷文字区域。该试卷文字区域可以为单个文字,或是多个文字组成。
S32:获取试卷文字区域的坐标数据,并将坐标数据作为试题位置信息。
具体地,该试卷文字区域为矩形框,先在该待识别试卷文件建立坐标系后,通过获取该试卷文字区域的矩形框的各个顶点的坐标,通过该试卷文字区域的左上角和右下角坐标确定[x1, y1, x2, y2],其中,x1和y1表示矩形左上角位置、x2和y2表示矩形的右下角位置。在获取到坐标数据后,将带有坐标数据的试卷文字区域作为试题位置信息。
在一实施例中,如图4所示,在步骤S40中,即根据试题位置信息,逐一对试题位置信息进行文字识别,得到对应的试题文字信息,具体包括如下步骤:
S41:将每一试题位置信息中的待识别试卷文字输入至CNN网络,得到对应的文字特征图。
在本实施例中,CNN网络是指卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward NeuralNetworks),是深度学习(deep learning)的代表算法之一 。文字特征图是指记载或显示有待识别试卷文字的特征的图片。
具体地,将该待识别试卷文字进行缩放,高度缩放至64,宽度则根据高度按比例缩放(缩放比为64除以宽度)。如输入的待识别试卷文字的图片的高度和宽度分别为400和284,缩放后的高度和宽度为64和45(小数均下取整)。对于高度小于64的图片,缩放的插值方法为INTER_AREA,高度大于64的则为INTER_CUBIC。
进一步地,将缩放后的图片输入至CNN网络中,输出一个维度为1*25*6587的feature map,并将该feature map作为文字特征图。
S42:按照文字特征图的纬度对文字特征图进行切分后,输入至RNN网络中,得到对应的文字矩阵图。
具体地,将维度为1*25*6587的文字特征图按照纬度切分为25个维度为1*6587的timestep,并按顺序将该timestep输入到RNN网络,输出维度为25*6587的result矩阵,进而将该result矩阵作为文字矩阵图。
S43:对文字矩阵图进行解码识别,得到文字识别结果的索引值。
具体地,采用贪心算法对文字矩阵进行解码,输出文字识别结果的索引值。具体步骤为:
以result矩阵,即文字矩阵图的第一个维度作为遍历依据,在本实施例中为从1至25,置prev_idx = -1,每次循环每个timestep在6587中取出最大值的索引→idx,若prev_idx不等于idx即把idx加入到结果中,并将idx→prev_idx,进而得到该文职识别结果的索引值。
S44:遍历文字识别结果的索引值,将每一索引值转换成试题文字信息。
具体地,遍历识别结果,根据每个文字识别结果的索引值,将该索引值转换为实际识别的字符,作为试题文字信息。
在一实施例中,如图5所示,在步骤S50中,即将试题文字信息进行组装,得到待提取试题信息对应的试题图片,具体包括如下步骤:
S51:逐行从试题文字信息中的获取试题文字。
在本实施例中,试题文字是指待拆分试卷文件或待识别试卷文件中,试题的具体内容。可理解的,该待提取试题信息是由若干试题文字组成具体的试卷。
具体地,通过试题文字信息对应的试题位置信息的坐标数据,将纵坐标相同对应的试题位置信息中的试题文字信息视为同一行。进一步地,逐行从该试题文字信息中获取对应的试题文字。
S52:将试题文字组成试题图片。
具体地,根据每一道题目的类型,例如选择题、判断题、填空题或主观题等,根据每一道题型,将试题文字组成该题型中的每一道小题,并输出该小题的试题图片,将该待拆分试卷文件按照每一道大题以及每一道大题对应的每一道小题的试题图片,并将同一道大题的试题图片分类一类,完成对待拆分试卷文件的拆分。
优选地,通过上述方法,已经将该待拆分试卷文件中的内容识别出具体的试题文字,在进行组装时,还可以将试题文字生成文档格式,例如.doc,或.docx格式的文档。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
实施例二:
在一实施例中,提供一种基于图片识别的试卷拆分装置,该基于图片识别的试卷拆分装置与上述实施例中基于图片识别的试卷拆分方法一一对应。如图6所示,该基于图片识别的试卷拆分装置包括文件获取模块10、角度纠正模块20、文字探测模块30、文字识别模块40和试题组装模块50。各功能模块详细说明如下:
文件获取模块10,用于获取待拆分试卷文件,待拆分试卷文件的文件格式为图片格式或pdf格式,待拆分试卷文件中包括待提取试题信息;
角度纠正模块20,用于对待拆分试卷文件进行角度纠正预处理,得到待识别试卷文件;
文字探测模块30,用于从待识别试卷文件中进行文字探测,得到试题位置信息;
文字识别模块40,用于根据试题位置信息,逐一对试题位置信息进行文字识别,得到对应的试题文字信息;
试题组装模块50,用于将试题文字信息进行组装,得到待提取试题信息对应的试题图片。
优选地,角度纠正模块20包括:
傅里叶变换子模块21,用于获取待拆分试卷文件的傅里叶变换图;
二值化处理子模块22,用于对傅里叶变换图进行二值化后,得到傅里叶变换图对应的二值图片;
霍夫变换子模块23,用于计算二值图片的霍夫直线以及霍夫直线对应的图片倾斜角数据;
角度调整子模块24,用于调整图片倾斜角数据至预设的角度阈值内,得到待识别试卷文件。
优选地,文字探测模块30包括:
文字探测子模块31,用于采用文字识别OCR技术,在待识别试卷文件中识别出试卷文字,得到试卷文字区域;
文字区域获取子模块32,用于获取试卷文字区域的坐标数据,并将坐标数据作为试题位置信息。
优选地,文字识别模块40包括:
CNN网络子模块41, 用于将每一试题位置信息中的待识别试卷文字输入至CNN网络,得到对应的文字特征图;
RNN网络子模块42,用于按照文字特征图的纬度对文字特征图进行切分后,输入至RNN网络中,得到对应的文字矩阵图;
解码子模块43,用于对文字矩阵图进行解码识别,得到文字识别结果的索引值;
文字转换子模块44,用于遍历文字识别结果的索引值,将每一索引值转换成试题文字信息。
优选地,试题组装模块50包括:
文字提取子模块51,用于逐行从试题文字信息中的获取试题文字;
试题组织子模块52,用于将试题文字组成试题图片。
关于基于图片识别的试卷拆分装置的具体限定可以参见上文中对于基于图片识别的试卷拆分方法的限定,在此不再赘述。上述基于图片识别的试卷拆分装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
实施例三:
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储试题图片。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于图片识别的试卷拆分方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
S10:获取待拆分试卷文件,待拆分试卷文件的文件格式为图片格式或pdf格式,待拆分试卷文件中包括待提取试题信息;
S20:对待拆分试卷文件进行角度纠正预处理,得到待识别试卷文件;
S30:从待识别试卷文件中进行文字探测,得到试题位置信息;
S40:根据试题位置信息,逐一对试题位置信息进行文字识别,得到对应的试题文字信息;
S50:将试题文字信息进行组装,得到待提取试题信息对应的试题图片。
实施例四:
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
S10:获取待拆分试卷文件,待拆分试卷文件的文件格式为图片格式或pdf格式,待拆分试卷文件中包括待提取试题信息;
S20:对待拆分试卷文件进行角度纠正预处理,得到待识别试卷文件;
S30:从待识别试卷文件中进行文字探测,得到试题位置信息;
S40:根据试题位置信息,逐一对试题位置信息进行文字识别,得到对应的试题文字信息;
S50:将试题文字信息进行组装,得到待提取试题信息对应的试题图片。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于图片识别的试卷拆分方法,其特征在于,所述基于图片识别的试卷拆分方法包括:
S10:获取待拆分试卷文件,所述待拆分试卷文件的文件格式为图片格式,所述待拆分试卷文件中包括待提取试题信息;
S20:对所述待拆分试卷文件进行角度纠正预处理,得到待识别试卷文件;
S30:从所述待识别试卷文件中进行文字探测,得到试题位置信息;
S40:根据所述试题位置信息,逐一对所述试题位置信息进行文字识别,得到对应的试题文字信息;
S50:将所述试题文字信息进行组装,得到所述待提取试题信息对应的试题图片,骤S50包括步骤:
S51:逐行从所述试题文字信息中的获取试题文字;
S52:将所述试题文字组成所述试题图片;试题图片可以是整份待拆分试题文件,也可以是该待拆分试题文件中的待提取试题信息中的具体的一道试题;
根据每一道大题以及该道大题中的每一道小题的题目类型,将该试题文字信息组成该试题图片;
根据每一道题型,将试题文字组成该题型中的每一道小题,并输出该小题的试题图片,将该待拆分试卷文件按照每一道大题以及每一道大题对应的每一道小题的试题图片,并将同一道大题的试题图片分为一类,完成对待拆分试卷文件的拆分;
步骤S20包括:
S21:对所述待拆分试卷文件进行双峰法图像二值化处理后,得到所述待拆分试卷文件对应的二值图片;
S22:根据所述二值图片的图片像素点的分布,作为纠偏线索区域;
S23:通过傅里叶变换,获取所述纠偏线索区域的最小外接矩形框,并通过所述最小外接矩形框获取图片倾斜角数据;
S24:调整所述图片倾斜角数据至预设的角度阈值内,得到所述待识别试卷文件;
具体的,通过对纠偏线索进行傅里叶变换,计算得到纠偏线索区域的最小外接矩形框;在获取得到该最小外接矩形框后,选取该最小外接矩形框的长边或者宽边,并通过角度获取的算法或者是对应的代码语句,获取该长边或者宽边与水平线的夹角数据,并将该夹角数据作为该图片倾斜角数据。
2.如权利要求1所述的基于图片识别的试卷拆分方法,其特征在于,步骤S30包括:
S31:采用文字识别OCR技术,在所述待识别试卷文件中识别出试卷文字,得到试卷文字区域;
S32:获取所述试卷文字区域的坐标数据,并将所述坐标数据作为所述试题位置信息。
3.如权利要求1所述的基于图片识别的试卷拆分方法,其特征在于,步骤S40包括:
S41:将每一试题位置信息中的所述待识别试卷文件输入至CNN网络,得到对应的文字特征图;
S42:按照所述文字特征图的维度对所述文字特征图进行切分后,输入至RNN网络中,得到对应的文字矩阵图;
S43:对所述文字矩阵图进行解码识别,得到文字识别结果的索引值;
S44:遍历所述文字识别结果的索引值,将每一所述索引值转换成所述试题文字信息。
4.一种基于图片识别的试卷拆分装置,其特征在于,所述基于图片识别的试卷拆分装置包括:
文件获取模块,用于获取待拆分试卷文件,所述待拆分试卷文件的文件格式为图片格式,所述待拆分试卷文件中包括待提取试题信息;
角度纠正模块,用于对所述待拆分试卷文件进行角度纠正预处理,得到待识别试卷文件;角度纠正模块的执行步骤为:
S21:对所述待拆分试卷文件进行双峰法图像二值化处理后,得到所述待拆分试卷文件对应的二值图片;
S22:根据所述二值图片的图片像素点的分布,作为纠偏线索区域;
S23:通过傅里叶变换,获取所述纠偏线索区域的最小外接矩形框,并通过所述最小外接矩形框获取图片倾斜角数据;
S24:调整所述图片倾斜角数据至预设的角度阈值内,得到所述待识别试卷文件;
具体的,通过对纠偏线索进行傅里叶变换,计算得到纠偏线索区域的最小外接矩形框;在获取得到该最小外接矩形框后,选取该最小外接矩形框的长边或者宽边,并通过角度获取的算法或者是对应的代码语句,获取该长边或者宽边与水平线的夹角数据,并将该夹角数据作为该图片倾斜角数据;
文字探测模块,用于从所述待识别试卷文件中进行文字探测,得到试题位置信息;
文字识别模块,用于根据所述试题位置信息,逐一对所述试题位置信息进行文字识别,得到对应的试题文字信息;
试题组装模块,用于将所述试题文字信息进行组装,得到所述待提取试题信息对应的试题图片,试题组装模块包括:
文字提取子模块,用于逐行从试题文字信息中的获取试题文字;
试题组织子模块,用于将试题文字组成试题图片,试题图片可以是整份待拆分试题文件,也可以是该待拆分试题文件中的待提取试题信息中的具体的一道试题;根据每一道大题以及该道大题中的每一道小题的题目类型,将该试题文字信息组成该试题图片;根据每一道题型,将试题文字组成该题型中的每一道小题,并输出该小题的试题图片,将该待拆分试卷文件按照每一道大题以及每一道大题对应的每一道小题的试题图片,并将同一道大题的试题图片分为一类,完成对待拆分试卷文件的拆分。
5.如权利要求4所述的基于图片识别的试卷拆分装置,其特征在于,所述文字探测模块包括:
文字探测子模块,用于采用文字识别OCR技术,在所述待识别试卷文件中识别出试卷文字,得到试卷文字区域;
文字区域获取子模块,用于获取所述试卷文字区域的坐标数据,并将所述坐标数据作为所述试题位置信息。
6.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至3任一项所述基于图片识别的试卷拆分方法的步骤。
7.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至3任一项所述基于图片识别的试卷拆分方法的步骤。
CN201910876251.9A 2019-09-17 2019-09-17 基于图片识别的试卷拆分方法、装置、设备以及介质 Active CN110647885B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910876251.9A CN110647885B (zh) 2019-09-17 2019-09-17 基于图片识别的试卷拆分方法、装置、设备以及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910876251.9A CN110647885B (zh) 2019-09-17 2019-09-17 基于图片识别的试卷拆分方法、装置、设备以及介质

Publications (2)

Publication Number Publication Date
CN110647885A CN110647885A (zh) 2020-01-03
CN110647885B true CN110647885B (zh) 2022-10-28

Family

ID=69010605

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910876251.9A Active CN110647885B (zh) 2019-09-17 2019-09-17 基于图片识别的试卷拆分方法、装置、设备以及介质

Country Status (1)

Country Link
CN (1) CN110647885B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111259888A (zh) * 2020-01-15 2020-06-09 平安国际智慧城市科技股份有限公司 基于图像的信息比对方法、装置及计算机可读存储介质
CN112200058B (zh) * 2020-09-30 2021-07-06 珠海读书郎网络教育有限公司 一种教辅资料智能批改的系统及方法
CN112765307A (zh) * 2021-01-12 2021-05-07 徐州金林人工智能科技有限公司 一种基于机器学习算法的试卷试题拆分工具及其拆分提取方法
CN112766125A (zh) * 2021-01-12 2021-05-07 徐州金林人工智能科技有限公司 一种基于机器学习算法的试题上传工具及其上传方法
CN113610068B (zh) * 2021-10-11 2022-07-08 江西风向标教育科技有限公司 基于试卷图像的试题拆解方法、系统、存储介质及设备

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108121983A (zh) * 2016-11-29 2018-06-05 蓝盾信息安全技术有限公司 一种基于傅里叶变换的文本图像纠偏方法
CN106846961B (zh) * 2017-01-25 2020-03-27 华中师范大学 电子试卷的处理方法和装置
CN107578659A (zh) * 2017-09-27 2018-01-12 广东小天才科技有限公司 电子题目的生成方法、生成装置及终端
CN107798321B (zh) * 2017-12-04 2021-03-02 海南云江科技有限公司 一种试卷分析方法和计算设备
CN109389061A (zh) * 2018-09-26 2019-02-26 苏州友教习亦教育科技有限公司 试卷识别方法和系统
CN109409374B (zh) * 2018-10-11 2022-03-08 东莞市七宝树教育科技有限公司 一种基于联合的同批次试卷答案区域切割方法
CN109634961B (zh) * 2018-12-05 2021-06-04 杭州大拿科技股份有限公司 一种试卷样本生成方法、装置、电子设备和存储介质
CN109800694A (zh) * 2019-01-08 2019-05-24 深圳中兴网信科技有限公司 一种试卷识别批改方法、装置、计算机设备及存储介质
CN110210413B (zh) * 2019-06-04 2022-12-16 哈尔滨工业大学 一种基于深度学习的多学科试卷内容检测与识别系统及方法

Also Published As

Publication number Publication date
CN110647885A (zh) 2020-01-03

Similar Documents

Publication Publication Date Title
CN110647885B (zh) 基于图片识别的试卷拆分方法、装置、设备以及介质
CN109492643B (zh) 基于ocr的证件识别方法、装置、计算机设备及存储介质
CN110334585B (zh) 表格识别方法、装置、计算机设备和存储介质
CN109840519B (zh) 一种自适应的智能单据识别录入装置及其使用方法
CN109815932B (zh) 一种试卷批改方法、装置、电子设备及存储介质
CN109670504B (zh) 一种手写答案识别批改方法及装置
US20190180154A1 (en) Text recognition using artificial intelligence
CN112651289B (zh) 一种增值税普通发票智能识别与校验系统及其方法
CN112052852B (zh) 一种基于深度学习的手写气象档案资料的字符识别方法
CN109583438B (zh) 电子图像的文字的识别方法及图像处理装置
CN110647795A (zh) 一种表格识别方法
CN112307919B (zh) 一种基于改进YOLOv3的单证图像中数字信息区域识别方法
CN110738030A (zh) 表格重建方法、装置、电子设备及存储介质
CN113065396A (zh) 基于深度学习的扫描档案图像的自动化归档处理系统及方法
CN113723252A (zh) 一种表格型文本图片的识别方法和系统
CN111737478A (zh) 文本检测方法、电子设备及计算机可读介质
CN114005126A (zh) 表格重构方法、装置、计算机设备及可读存储介质
CN114092938A (zh) 图像的识别处理方法、装置、电子设备及存储介质
CN111275051A (zh) 字符识别方法、装置、计算机设备和计算机可读存储介质
CN111144270B (zh) 基于神经网络的手写文本工整度的评测方法与评测装置
CN109741273A (zh) 一种手机拍照低质图像的自动处理与评分方法
CN116824608A (zh) 基于目标检测技术的答题卡版面分析方法
RU2633182C1 (ru) Определение направления строк текста
CN111291752A (zh) 一种发票识别方法及设备、介质
CN114330247A (zh) 一种基于图像识别的自动化保险条款解析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: Part 402, No. 7, Caipin Road, Science City, Luogang District, Guangzhou, Guangdong 510000

Patentee after: Guangdong Everbright Information Technology Co.,Ltd.

Address before: Part 402, No. 7, Caipin Road, Science City, Luogang District, Guangzhou, Guangdong 510000

Patentee before: GUANGZHOU EVERBRIGHT EDUCATION SOFTWARE TECHNOLOGY CO.,LTD.