CN110956173A - 题目内容识别方法、装置、可读存储介质及计算机设备 - Google Patents

题目内容识别方法、装置、可读存储介质及计算机设备 Download PDF

Info

Publication number
CN110956173A
CN110956173A CN202010096664.8A CN202010096664A CN110956173A CN 110956173 A CN110956173 A CN 110956173A CN 202010096664 A CN202010096664 A CN 202010096664A CN 110956173 A CN110956173 A CN 110956173A
Authority
CN
China
Prior art keywords
line
picture
current
topic
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010096664.8A
Other languages
English (en)
Other versions
CN110956173B (zh
Inventor
赵聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangxi Soft Cloud Technology Co Ltd
Original Assignee
Jiangxi Soft Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangxi Soft Cloud Technology Co Ltd filed Critical Jiangxi Soft Cloud Technology Co Ltd
Priority to CN202010096664.8A priority Critical patent/CN110956173B/zh
Publication of CN110956173A publication Critical patent/CN110956173A/zh
Application granted granted Critical
Publication of CN110956173B publication Critical patent/CN110956173B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

一种题目内容识别方法、装置、可读存储介质及计算机设备,题目内容识别方法包括:对待识别图片进行识别,以得到所述待识别图片中每一行的文字内容及所述文字内容在所述待识别图片中的位置坐标;根据每一行的所述文字内容和每一行所述文字内容中的起始文字的位置坐标确定所述待识别图片中各个题目的起始行;根据各个所述题目的起始行的位置对所述文字内容进行划分,以得到各个题目的题目内容。本发明通过对待识别图片中各行的文字内容进行识别和分别确定属于各个题目的行文字内容,可保证题目内容识别的完整性。

Description

题目内容识别方法、装置、可读存储介质及计算机设备
技术领域
本发明涉及数据分析处理技术领域,特别是涉及一种题目内容识别方法、装置、可读存储介质及计算机设备。
背景技术
在教育领域,尤其是K12教育阶段,作业和考试试题是以纸质形态呈现,学生通过笔写进行答题。为了掌握学生的学习情况,需要将各个学生的答题信息特别是错题信息进行分析,生成属于学生个人的错题集。
现有技术中,对试卷(或作业)的答题内容收集时,将试卷整页拍照,并通过模板匹配,划分试卷中各个试题的区域。再通过OCR识别技术识别拍照答题卡中的内容。通过对试卷进行题目切割生成错题本将会大大减轻家长和老师整理错题本的工作量。
然而,与普通的文档识别不同,学生的作业或考试的图片包含了大量的手写痕迹,并且图片之间有一定的关联性,例如题目跨页等情况,导致试卷或作业的识别复杂度过高,如果只是利用划分试题区域的方法进行简单的处理,有可能将学生的答题内容和老师的批改痕迹切除,无话获得完整的试题内容,其效果会非常不理想。
发明内容
鉴于上述状况,有必要针对现有技术中无法获取完整的试题内容的问题,提供一种题目内容识别方法、装置、可读存储介质及计算机设备。
一种题目内容识别方法,包括:
获取答题文件的当前图片;
通过边缘检测算法对所述当前图片进行分界线检测;
若检测到分界线,则根据所述分界线对所述当前图片进行切割以得到数个子图片;
按照所述子图片的读取顺序将各个所述子图片合并为一张目标图片,并将所述目标图片作为待识别图片;
对所述待识别图片进行识别,以得到所述待识别图片中每一行的文字内容及每一行所述文字内容的起始文字在所述待识别图片中的位置坐标;
比对预设的多个识别因子,提取识别到的每一行的文字内容中的目标识别因子;
根据提取的当前行中的所述目标识别因子的分值和所述目标识别因子的权重计算所述当前行的得分值;
根据所述当前行的起始文字的位置坐标对所述当前行的得分值进行第一次调整,所述第一次调整的规则为,所述当前行的起始文字的位置相对于行平均位置靠左则加权,靠右则降权,所述行平均位置为所有行中的起始文字的位置坐标的平均值;
根据每一行经过调整后的最终得分值确定所述待识别图片中各个题目的起始行;
根据各个所述题目的起始行的位置对所述文字内容进行划分,以得到各个题目的题目内容。
进一步的,上述题目内容识别方法,其中,所述得分值的计算公式为:
Figure DEST_PATH_IMAGE001
其中, g(l,w)为得分值,lk为第k个目标识别因子的分值,wk为第k个目标识别因子的权重。
进一步的,上述题目内容识别方法,其中,对所述当前行的得分值进行第一次调整的计算公式为:
Figure 824917DEST_PATH_IMAGE002
其中,f(x,a)=100 * (1-Sigmoid(x/a)),x为当前行t的起始文字的位置横坐标值,a为图片中所有行的起始文字的位置横坐标值的平均值, gt(l,w)为t行的得分值。
进一步的,上述题目内容识别方法,其中,所述根据所述当前行的起始文字的位置坐标对所述当前行的得分值进行第一次调整的步骤之后还包括:
根据所述当前行的起始文字与上一行及下一行的起始文字之间的位置关系对所述当前行的得分值进行第二次调整。
进一步的,上述题目内容识别方法,其中,对所述得分值进行第二次调整的公式为:
Figure DEST_PATH_IMAGE003
上式中,
Figure 116965DEST_PATH_IMAGE004
Figure DEST_PATH_IMAGE005
Figure 985695DEST_PATH_IMAGE006
Figure DEST_PATH_IMAGE007
其中,t为当前行数,Xt为t行起始文字的横坐标,Yt为t行起始文字的纵坐标,θ1和θ2单位为弧度,b为行因子值。
进一步的,上述题目内容识别方法,其中,所述根据每一行经过调整后的最终得分值确定所述待识别图片中各个题目的起始行的步骤包括:
获取所述待识别图片中的题目的数量N和题目序号;
根据所述数量N、各行的文字内容,以及各行的最终得分值建立行置信度表;
查询所述行置信度表中所述文字内容中的第一个文字内容为所述题目序号的目标行;
判断查询到的当前目标行的最终得分值是否在所有最终得分值中排名在前N名以内;
若属于,则确定所述当前行为当前题目序号的题目的起始行,并将所述当前题目序号记录在所述行置信度表中;
查询所述行置信度表中是否存在未确定的题目序号;
若存在,在所述行置信度表中根据各行的最终得分值大小进行行缺失题目序号的填充,以确定所述行缺失题目的起始行。
本发明实施例还提供了一种题目内容识别装置,包括:
获取模块,用于获取答题文件的当前图片;
边缘检测模块,用于通过边缘检测算法对所述当前图片进行分界线检测;
切割模块,用于若检测到分界线,则根据所述分界线对所述当前图片进行切割以得到数个子图片;
合并模块,用于按照所述子图片的读取顺序将各个所述子图片合并为一张目标图片,并将所述目标图片作为待识别图片;
识别模块,用于对所述待识别图片进行识别,以得到所述待识别图片中每一行的文字内容及每一行所述文字内容的起始文字在所述待识别图片中的位置坐标;
确定模块,用于比对预设的多个识别因子,提取识别到的每一行的文字内容中的目标识别因子,根据提取的当前行中的所述目标识别因子的分值和所述目标识别因子的权重计算所述当前行的得分值,根据所述当前行的起始文字的位置坐标对所述当前行的得分值进行第一次调整,所述第一次调整的规则为,所述当前行的起始文字的位置相对于行平均位置靠左则加权,靠右则降权,所述行平均位置为所有行中的起始文字的位置坐标的平均值,以及根据每一行经过调整后的最终得分值确定所述待识别图片中各个题目的起始行;
划分模块,用于根据各个所述题目的起始行的位置对所述文字内容进行划分,以得到各个题目的题目内容。
本发明实施例还提供了一种可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述任一所述的方法。
本发明实施例还提供了一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一所述的方法。
本发明实施例中,通过图片识别的方法识别答题文件中的每一行的文字内容和各行文字内容的位置坐标,并根据各行文字内容和各行起始文字的位置坐标确定各个题目的起始行,根据各个题目的起始行所在的位置确定答题文件中的各个题目的文字内容。本发明实施例不同于现有技术中的区域切题的方式,其通过对待识别图片中各行的文字内容进行识别并根据各题目的起始行确定属于各个题目的行文字内容,通过该方法可保证题目内容识别的完整性。
附图说明
图1为本发明第一实施例中的题目内容识别方法的流程图;
图2为本发明第二实施例中的题目内容识别方法的流程图;
图3为本发明第二实施例中答题文件的示意图;
图4为本发明第三实施例中的题目内容识别方法的流程图;
图5为本发明第四实施例中的题目内容识别装置的结构框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
参照下面的描述和附图,将清楚本发明的实施例的各个方面。在这些描述和附图中,具体公开了本发明的实施例中的一些特定实施方式,来表示实施本发明的实施例的原理的一些方式,但是应当理解,本发明的实施例的范围不受此限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
请参阅图1,为本发明第一实施例中的题目内容识别方法,包括步骤S11~S13。
步骤S11,对待识别图片进行识别,以得到所述待识别图片中每一行的文字内容及每一行所述文字内容的起始文字的位置坐标。
其中,该待识别图片为答题文件的图片。本实施例中该答题文件为具有试题或作业题目的纸质文件,例如考试文件、学生作业本等。该答题文件的图片可通过拍照或扫描等方式采集,具体实施时可在题目内容识别装置上设置摄像头和/或扫描仪来获取答题文件的图片,并作为该待识别图片,该题目内容识别装置例如为计算机设备或服务器。
本实施例可以通过文字识别技术(Optical Character Recognition ,简称OCR)对图片中的内容进行识别。通过该OCR识别技术可识别出图片上每一行的文字内容和每一行文字内容的位置坐标。该文字内容包括但不限于数字、汉字、字母、符号等。OCR识别技术可定位每一行文字内容的位置,以及捕捉到每一个文字的位置坐标。各行文字内容的位置坐标根据图片中的坐标系确定,即OCR软件进行图片识别时,需先在图片中建立坐标系,例如以图片的左下角的一位置点为坐标原点,以图片宽度方向为x轴,以图片的长度方向为y轴建立直角坐标系。
步骤S12,根据每一行的所述文字内容和每一行所述文字内容中的起始文字的位置坐标确定所述待识别图片中各个题目的起始行。
答题文件中各个题目的文字内容会包含特定内容,该特定内容可作为各行文字内容是否为题目的起始行的判断依据。例如,行文字内容中是否包含题目序号(该题目序号一般以数字表示);是否包含题目分值内容(如满分10分);是否包含一些特定关键词,如“下列”,“如图”等等;是否包含小题信息,例如“(1)…”。该题目序号、题目分值内容、特定关键词、小题信息即为题目的特定内容。
并且,各题的文字内容中的起始文字在该图片中的位置是有一定规律的,一般来说题目的起始行的起始文字靠左。
因此,根据各行的文字内容和各行文字内容中的起始文字的位置坐标可确定该图片中各个题目的起始行。
步骤S13,根据各个所述题目的起始行的位置对所述文字内容进行划分,以得到各个题目的题目内容。
确定了各个题目的起始行后,根据各个起始行的位置可确定每个题目的文字内容。即将当前题目的起始行与下一题目的起始行的上一行之间的文字内容确定为当前题目的题目内容。例如图片中的第1行、第5行和第7行为题目的起始行(图片中总行数为10行),则第1行至第4行的文字内容为题目T1的内容,第5行至第6行的文字内容为题目T2的内容,第7行至第10行的文字内容为题目T3的内容。
本实施例中,通过图片识别的方法识别答题文件中的每一行的文字内容和各行文字内容的位置坐标,并根据各行文字内容和各行起始文字的位置坐标确定各个题目的起始行,根据各个题目的起始行所在的位置确定答题文件中的各个题目的文字内容。本实施例不同于现有技术中的区域切题的方式,其通过对待识别图片中各行的文字内容进行识别并根据各题目的起始行确定属于各个题目的行文字内容,其可保证题目内容识别的完整性。
请参阅图2,为本发明第二实施例中的题目内容识别方法,包括步骤S21~S29。
步骤S21,获取答题文件的当前图片,并通过边缘检测算法对所述当前图片进行分界线检测。
在实际应用中,很多答题文件中的题目内容都会分栏显示,例如一个页面上分成左右栏显示。每栏内容之间通过分界线进行区分,该分界线例如为一块长条状的空白区域或者一条线(实线或虚线)。因此在进行图片文字内容识别前需要判断答题文件的当前图片中是否存在一块空白区域或竖线。该分界线可通过边缘检测算法进行检测,具体的,例如可利用OpenCV里面的Edge和Contour技术进行分界线查找。
对于以空白区域作为分界线的图片,通过该边缘检测算法检测是否可找到一条宽度大于阈值宽度的空白区域,若是则可确定该图片中分界线的位置。
具体的,通过边缘检测算法对所述当前图片进行分界线检测的步骤包括:
步骤S211,截取当前图片中间高度占总体40~80%的区域,宽度维持不变,得到待检测图片;
步骤S212,对待检测图片进行二值化处理;
步骤S213,对待检测图片进行膨胀处理;
步骤S214,检测待检测图片的中间区域是否存在一条宽度大于阈值宽度的空白区域;
步骤S215,若存在空白区域,则确定检测到的空白区域为该图片的分界线;
步骤S216,若不不存在空白区域,则遍历待检测图片中所有的连通区(Blob),并判断中间区域竖直方向上所有Blob叠加的高度与目标图片总高度的比值是否低于预设值,若是,即可以确定分界线的位置。
由于答题文件的当前图片的顶部和底部涉及大量的留白,因此需要将图片的上下两端去掉,保留中间部分的图片,具体实施时,可保留中间占当前图片总高度的40~80%部分的区域,作为进一步处理的待检测图片。
进一步的,作为优选的实施方式,截取当前图片中间高度占总体40~80%的区域作为待检测图片。
该宽度阈值根据实际情况进行设置,一般答题文件的分界线区域的宽度为不小于3mm,因此,宽度阈值可设置为3mm。
当待检测图片的中间区域能够检测到一条宽度大于阈值宽度的空白区域,则可直接确定该区域为该待检测图片的分界线。若中间空白区域有涂改痕迹,则检测中间区域竖直方向上所有Blob叠加的高度与待检测图片总高度的比值是否低于预设值,若低于预设值,说明中间存在一块长条状空白区域,即可确定当前图片的分界线。
可以理解的,对于以一条竖线作为分界线的图片,可通过该边缘检测算法检测图片中间区域是否可找到一条竖线,若是则可确定该图片中分界线的位置
可以理解的,本发明实施例中的题目内容识别方法不仅限于左右栏排列的答题文件,对于上下栏的排版的答题文件的分界线的检测方法与左右栏排版的类似。并且,本发明实施例中的题目内容识别方法对答题文件的页面数量没有要求。对于含有多页的答题文件,可将各页答题文件的图片按照内容的读取顺序拼接为纵向排列的一张图片后,再进行识别,即可得到该答题文件的所有题目的文字内容。
步骤S22,若检测到分界线,则根据所述分界线对所述当前图片进行切割以得到数个子图片。
当检测到当前图片存在分界线时,则将该当前图片沿着分界线进行分割,得到数个子图片,例如具有一条分界线的图片则得到两个子图片,对于具有两条分界线的图片则得到3个子图片。
步骤S23,按照所述子图片的读取顺序将各个子图片合并为一张目标图片。
步骤S24,对所述目标图片进行识别,以得到该目标图片中每一行的文字内容及每一行起始文字的位置坐标。
为了防止识别到的各个子图片的内容错乱。具体实施时,可先按照各个子图片的读取顺序将各个子图片合并为一张目标图片,然后对该目标图片进行识别,以得到该目标图片中每一行的文字内容及每一行起始文字在该目标图片中的位置坐标。
例如,如图3所示的左右两栏内容答题文件的图片,将该图片以中间的分界线进行分割成左右两部分,将这两部分按照文字读取顺序,即按照上下排列的顺序拼接为一整张图片,即得到目标图片。
进行文字内容识别时,在该目标图片上建立坐标系,确定图片中的文字内容的位置坐标。
步骤S25,比对预设的多个识别因子,提取识别到的每一行的文字内容中的目标识别因子。
步骤S26,根据提取的当前行中的所述目标识别因子的分值和所述目标识别因子的权重计算所述当前行的得分值。
答题文件中的各个题目的起始行的文字内容均具有一定的特点,例如包含有特定的内容,题目起始文字的位置不同于其他行的起始文字的位置。因此,根据该题目内容的特点可确定各个题目的起始行的位置。
具体的,题目内容识别装置的系统中存储有多个识别因子,该识别因子,例如为题目序号(一般为数字)、题目分值内容(如满分10分)、特定关键词(如“下列”,“如图”等)和小题信息(如小题的序号);各个识别因子设置有对应的分值和权重。系统将识别到的每一行文字内容与各个识别因子进行比对,以提取各行文字内容中的目标识别因子。根据提取的各行中的目标识别因子,计算各行的得分值。各行的得分值的计算公式为:
Figure 848347DEST_PATH_IMAGE001
其中, g(l,w)为得分值,lk为第k个目标识别因子的分值,wk为第k个目标识别因子的权重。
步骤S27,根据所述当前行的起始文字的位置坐标对所述当前行的得分值进行第一次调整,所述得分值进行第一次调整的规则为,所述当前行的起始文字的位置相对于行平均位置靠左则加权,靠右则降权,所述行平均位置为所有行中的起始文字的位置坐标的平均值。
各题目的起始文字的位置也是确定各个题目的起始行的重要因素,因此,需要根据当前行的起始文字的位置坐标对当前行的得分值进行第一次调整,以得到第一得分值。该当前行进行第一次调整后的最终得分值的计算公式为:
Figure 647675DEST_PATH_IMAGE002
其中,f(x,a)=100 * (1-sigmoid(x/2a)),x为当前行t的起始文字的位置横坐标值,a为图片中所有行的起始文字的位置横坐标值的平均值, gt(l,w)为t行的得分值。根据sigmoid函数特性,x与a的比值越大,则(1-sigmoid(x/2a))的值则越小。如果一行文字的最左位置越靠右,则此行为题目起始行的可能性越小。
步骤S28,根据每一行经过调整后的最终得分值确定所述目标图片中各个题目的起始行。
将各行第一次调整后的最终得分值按照各行文字内容的读取顺序排列,以生成行置信度表。根据该行置信度表中各行的最终得分值判定各个题目的起始行所对应的行号,最终得分值越高的行代表为题目起始行的可能性则越大。
具体的,一份答题文件的题目数量(如N道题)和各个题目的序号是确定的,根据题目的数量、各行的文字内容,以及各行的最终得分值建立行置信度表。确定各题目的起始行时,可先确定起始行明确的题目,例如在行置信度表中第i行的起始文字为第T题的题目序号T,且该行的最终得分值较高,即按照最终得分值从高至低排名,属于前N名(包含N)以内,则可直接确定第i行为第T题的起始行,因此,可在该行置信度表中在i行对应的位置添加题目序号T。其他题目由于手写痕迹遮挡无法清晰地辨认起始行,则可在行置信度表中根据各行的最终得分值大小进行行缺失题目序号的填充。
例如下表1是一个化学试卷共6题的行置信度表,其中1,4,6题的位置比较清晰,但2,3,5题由于试卷涂改,已经不能轻易地辨识出来,因此,需要查询填充第2题、第3题和第5题。因此,根据各行的最终得分值在第1题至第4题区间进行置信度权值即可标注出第2和第3题的位置。同理,在第4和第6题之间确定出第5题的位置。
表1.某化学试卷对应的行置信度表
行号 最终得分值 内容 题目序列号
1 -50 2019年12月周练
2 237 1.下列叙述正确的是 1
3 -50 A.锥形瓶可用于加热
4 -100 B.室温下,不能将浓硫酸
5 -100 C.配制溶液的时候
6 -100 D.用蒸馏水浸透的试纸
7 110 下列叙述错误的是 2
8 -50 A.
9 -100 B.
10 -100 C.
11 -100 D.
12 90 在溶液的配制过程中会引起浓度偏高的是 3
13 50 请选择
14 -50 A. 恰好中和等体积、等pH
15 -50 B.等体积、等浓度的
16 -50 C NaHS溶液中加入适量
17 -100 D HCOO<sup>-</sup>、CN<sup>-</sup>、HS<sup>-</sup>在溶液中不可以大量共存
18 160 4. NO<sub>x</sub>(主要指NO和NO<sub>2</sub>)是大气主要污染物之一。有 4
19 120 25℃时,有关物质的电离平衡常数如下: 5
20 -100 (1)以上三种电解质由强至弱顺序为____(用化学式表示,下同)。
21 -150 (2)常温下,0.02mol•L<sup>-1</sup>的CH<sub>3</sub>COOH溶液的电离度约为____,体积为10mL
22 220 6. CO用途广泛,工业应用时离不开平衡思想的指导: 6
本实施例中,根据建立的行置信度表和根据各行的最终得分值大小进行行缺失题目序号的填充的方法来确定各个题目的起始行,这种确定方式可靠度高。
需要说明的是,在本发明的其他实施例中,还可直接根据各行的最终得分值的大小来确定各个题目的起始行,具体实施时,需确定最终得分值在排名前N名(含N名)内的目标行,将确定的N个目标行按照文字内容的读取顺序依次确定为N个题目的起始行。
步骤S29,根据各个所述题目的起始行的位置对所述文字内容进行划分,以得到各个题目的题目内容。
确定了各个题目的起始行后,根据各起始行的位置可确定每个题目的文字内容。
本实施例中可实现对分栏的页面进行题目内容的识别,除此之外,通过本实施例中的方法,对于一题目存在跨页或跨栏的情况下,仍可完整的识别到该题目的内容。
如图4所示,为了进一步提高各个题目起始行的确定精度,在本发明的第三实施中,还可对第一次调整后的得分值进行第二次调整。即上述实施例中,所述根据所述当前行的起始文字的位置坐标对所述当前行的得分值进行第一次调整的步骤之后还包括:
步骤S31,根据所述当前行的起始文字与上一行及下一行的起始文字之间的位置关系对所述得分值进行第二次调整。
本实施例中,针对目标图片识别的文字内容的每一行,根据其上一行和下一行的题目起始位置,对各行的得分值进行进一步加权或降权。答题文件中的题目区域是有一定规律的:某一题目的起始行的起始文字一般在该题目的其他行(如第二行和第三行)的起始文字的左侧,而该题目的第二行和第三行的起始文字的位置是对齐的,因此,可根据当前行的起始文字与上一行及下一行的起始文字之间的位置关系对该得分值进行第二次调整,得到最终得分值,通过此次调整,各题目起始行的可信度值得到了进一步的强化,提高题目内容确定的准确率。对该得分值进行第二次调整后的计算式为:
Figure 249689DEST_PATH_IMAGE003
上式中,
Figure 476271DEST_PATH_IMAGE004
Figure 295060DEST_PATH_IMAGE005
Figure 632501DEST_PATH_IMAGE006
Figure 89021DEST_PATH_IMAGE007
其中,t为当前行数,Xt为t行起始文字的横坐标,Yt为t行起始文字的纵坐标,θ1和θ2单位为弧度,b为行因子值。
Wt’为最终得分值,根据各个行对应的Wt’确定目标图片中各个题目的起始行。
请参阅图5,为本发明第四实施例中题目内容识别装置,包括:
获取模块40,用于获取答题文件的当前图片;
边缘检测模块50,用于通过边缘检测算法对所述当前图片进行分界线检测;
切割模块60,用于若检测到分界线,则根据所述分界线对所述当前图片进行切割以得到数个子图片;
合并模块70,用于按照所述子图片的读取顺序将各个所述子图片合并为一张目标图片,并将所述目标图片作为所述待识别图片;
识别模块10,用于对所述待识别图片进行识别,以得到所述待识别图片中每一行的文字内容及每一行所述文字内容的起始文字在所述待识别图片中的位置坐标;
确定模块20,用于比对预设的多个识别因子,提取识别到的每一行的文字内容中的目标识别因子,根据提取的当前行中的所述目标识别因子的分值和所述目标识别因子的权重计算所述当前行的得分值,根据所述当前行的起始文字的位置坐标对所述当前行的得分值进行第一次调整,所述第一次调整的规则为,所述当前行的起始文字的位置相对于行平均位置靠左则加权,靠右则降权,所述行平均位置为所有行中的起始文字的位置坐标的平均值,以及根据每一行经过调整后的最终得分值确定所述待识别图片中各个题目的起始行;
划分模块30,用于根据各个所述题目的起始行的位置对所述文字内容进行划分,以得到各个题目的题目内容。
本发明实施例所提供的题目内容识别装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
本发明实施例还提供了一种可读存储介质,其上存储有计算机程序,其该程序被处理器执行时实现上述实施例中的方法。
本发明实施例还提供了一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述实施例中的方法。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、 “示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (9)

1.一种题目内容识别方法,其特征在于,包括:
获取答题文件的当前图片;
通过边缘检测算法对所述当前图片进行分界线检测;
若检测到分界线,则根据所述分界线对所述当前图片进行切割以得到数个子图片;
按照所述子图片的读取顺序将各个所述子图片合并为一张目标图片,并将所述目标图片作为待识别图片;
对所述待识别图片进行识别,以得到所述待识别图片中每一行的文字内容及每一行所述文字内容的起始文字在所述待识别图片中的位置坐标;
比对预设的多个识别因子,提取识别到的每一行的文字内容中的目标识别因子;
根据提取的当前行中的所述目标识别因子的分值和所述目标识别因子的权重计算所述当前行的得分值;
根据所述当前行的起始文字的位置坐标对所述当前行的得分值进行第一次调整,所述第一次调整的规则为,所述当前行的起始文字的位置相对于行平均位置靠左则加权,靠右则降权,所述行平均位置为所有行中的起始文字的位置坐标的平均值;
根据每一行经过调整后的最终得分值确定所述待识别图片中各个题目的起始行;
根据各个所述题目的起始行的位置对所述文字内容进行划分,以得到各个题目的题目内容。
2.如权利要求1所述的题目内容识别方法,其特征在于,所述得分值的计算公式为:
Figure 15580DEST_PATH_IMAGE001
其中, g(l,w)为得分值,lk为第k个目标识别因子的分值,wk为第k个目标识别因子的权重。
3.如权利要求2所述的题目内容识别方法,其特征在于,对所述当前行的得分值进行第一次调整的计算公式为:
Figure 349085DEST_PATH_IMAGE002
其中,f(x,a)=100 * (1-Sigmoid(x/a)),x为当前行t的起始文字的位置横坐标值,a为图片中所有行的起始文字的位置横坐标值的平均值, gt(l,w)为t行的得分值。
4.如权利要求1所述的题目内容识别方法,其特征在于,所述根据所述当前行的起始文字的位置坐标对所述当前行的得分值进行第一次调整的步骤之后还包括:
根据所述当前行的起始文字与上一行及下一行的起始文字之间的位置关系对所述当前行的得分值进行第二次调整。
5.如权利要求1所述的题目内容识别方法,其特征在于,所述根据每一行经过调整后的最终得分值确定所述待识别图片中各个题目的起始行的步骤包括:
获取所述待识别图片中的题目的数量N和题目序号;
根据所述数量N、各行的文字内容,以及各行的最终得分值建立行置信度表;
查询所述行置信度表中所述文字内容中的第一个文字内容为所述题目序号的目标行;
判断查询到的当前目标行的最终得分值是否在所有最终得分值中排名在前N名以内;
若属于,则确定所述当前行为当前题目序号的题目的起始行,并将所述当前题目序号记录在所述行置信度表中;
查询所述行置信度表中是否存在未确定的题目序号;
若存在,在所述行置信度表中根据各行的最终得分值大小进行行缺失题目序号的填充,以确定所述行缺失题目的起始行。
6.如权利要求4所述的题目内容识别方法,其特征在于,对所述当前行的得分值进行第二次调整的公式为:
Figure 575667DEST_PATH_IMAGE003
上式中,
Figure 427079DEST_PATH_IMAGE004
Figure 515252DEST_PATH_IMAGE005
Figure 424302DEST_PATH_IMAGE006
Figure 821786DEST_PATH_IMAGE007
其中,t为当前行数,Xt为t行起始文字的横坐标,Yt为t行起始文字的纵坐标,θ1和θ2单位为弧度,b为行因子值。
7.一种题目内容识别装置,其特征在于,包括:
获取模块,用于获取答题文件的当前图片;
边缘检测模块,用于通过边缘检测算法对所述当前图片进行分界线检测;
切割模块,用于若检测到分界线,则根据所述分界线对所述当前图片进行切割以得到数个子图片;
合并模块,用于按照所述子图片的读取顺序将各个所述子图片合并为一张目标图片,并将所述目标图片作为待识别图片;
识别模块,用于对所述待识别图片进行识别,以得到所述待识别图片中每一行的文字内容及每一行所述文字内容的起始文字在所述待识别图片中的位置坐标;
确定模块,用于比对预设的多个识别因子,提取识别到的每一行的文字内容中的目标识别因子,根据提取的当前行中的所述目标识别因子的分值和所述目标识别因子的权重计算所述当前行的得分值,根据所述当前行的起始文字的位置坐标对所述当前行的得分值进行第一次调整,所述第一次调整的规则为,所述当前行的起始文字的位置相对于行平均位置靠左则加权,靠右则降权,所述行平均位置为所有行中的起始文字的位置坐标的平均值,以及根据每一行经过调整后的最终得分值确定所述待识别图片中各个题目的起始行;
划分模块,用于根据各个所述题目的起始行的位置对所述文字内容进行划分,以得到各个题目的题目内容。
8.一种可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6任一所述的方法。
9.一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6任一所述的方法。
CN202010096664.8A 2020-02-18 2020-02-18 题目内容识别方法、装置、可读存储介质及计算机设备 Active CN110956173B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010096664.8A CN110956173B (zh) 2020-02-18 2020-02-18 题目内容识别方法、装置、可读存储介质及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010096664.8A CN110956173B (zh) 2020-02-18 2020-02-18 题目内容识别方法、装置、可读存储介质及计算机设备

Publications (2)

Publication Number Publication Date
CN110956173A true CN110956173A (zh) 2020-04-03
CN110956173B CN110956173B (zh) 2020-06-23

Family

ID=69985719

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010096664.8A Active CN110956173B (zh) 2020-02-18 2020-02-18 题目内容识别方法、装置、可读存储介质及计算机设备

Country Status (1)

Country Link
CN (1) CN110956173B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112200167A (zh) * 2020-12-07 2021-01-08 北京易真学思教育科技有限公司 图像识别方法、装置、设备及存储介质
CN112686170A (zh) * 2020-12-31 2021-04-20 北京一起教育科技有限责任公司 一种图像识别方法、装置及电子设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488015A (zh) * 2016-01-22 2016-04-13 吴以凡 一种试题的结构化方法
CN107798321A (zh) * 2017-12-04 2018-03-13 海南云江科技有限公司 一种试卷分析方法和计算设备
CN108197299A (zh) * 2018-01-24 2018-06-22 广东小天才科技有限公司 一种基于手持拍照设备的拍照搜题方法及系统
CN109325401A (zh) * 2018-08-03 2019-02-12 成都准星云学科技有限公司 基于边缘定位对题目区域进行标注、识别的方法及系统
CN109858036A (zh) * 2019-02-26 2019-06-07 科大讯飞股份有限公司 一种文书划分方法及装置
CN110162773A (zh) * 2018-02-15 2019-08-23 柯尼卡美能达美国研究所有限公司 标题推断器
CN110414529A (zh) * 2019-06-26 2019-11-05 深圳中兴网信科技有限公司 试卷信息提取方法、系统及计算机可读存储介质
CN110705534A (zh) * 2019-09-17 2020-01-17 浙江工业大学 一种适用于电子助视器的错题本生成方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488015A (zh) * 2016-01-22 2016-04-13 吴以凡 一种试题的结构化方法
CN107798321A (zh) * 2017-12-04 2018-03-13 海南云江科技有限公司 一种试卷分析方法和计算设备
CN108197299A (zh) * 2018-01-24 2018-06-22 广东小天才科技有限公司 一种基于手持拍照设备的拍照搜题方法及系统
CN110162773A (zh) * 2018-02-15 2019-08-23 柯尼卡美能达美国研究所有限公司 标题推断器
CN109325401A (zh) * 2018-08-03 2019-02-12 成都准星云学科技有限公司 基于边缘定位对题目区域进行标注、识别的方法及系统
CN109858036A (zh) * 2019-02-26 2019-06-07 科大讯飞股份有限公司 一种文书划分方法及装置
CN110414529A (zh) * 2019-06-26 2019-11-05 深圳中兴网信科技有限公司 试卷信息提取方法、系统及计算机可读存储介质
CN110705534A (zh) * 2019-09-17 2020-01-17 浙江工业大学 一种适用于电子助视器的错题本生成方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张再军: "基于图像处理的试题切割方法研究", 《科技视界》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112200167A (zh) * 2020-12-07 2021-01-08 北京易真学思教育科技有限公司 图像识别方法、装置、设备及存储介质
CN112686170A (zh) * 2020-12-31 2021-04-20 北京一起教育科技有限责任公司 一种图像识别方法、装置及电子设备
CN112686170B (zh) * 2020-12-31 2023-10-17 北京一起教育科技有限责任公司 一种图像识别方法、装置及电子设备

Also Published As

Publication number Publication date
CN110956173B (zh) 2020-06-23

Similar Documents

Publication Publication Date Title
US11790641B2 (en) Answer evaluation method, answer evaluation system, electronic device, and medium
CN110008933B (zh) 一种通用智能阅卷系统和方法
CN110766014B (zh) 票据信息定位方法、系统及计算机可读存储介质
CN110569832B (zh) 基于深度学习注意力机制的文本实时定位识别方法
CN110110581B (zh) 一种基于人工智能的试卷批改方法和系统
CN111753767A (zh) 一种作业自动批改的方法、装置、电子设备和存储介质
KR101648756B1 (ko) 시험지 인식 및 채점 시스템
CN106781784A (zh) 一种智能批改系统
CN110956173B (zh) 题目内容识别方法、装置、可读存储介质及计算机设备
CN106599887B (zh) 试卷答题区域识别及试题评阅方法、系统
CN105989366A (zh) 文本图像的倾斜角矫正、版面分析方法和助视装置、系统
CN108388895A (zh) 一种基于机器学习的试卷答题卡自动处理方法
CN111079641B (zh) 作答内容识别方法、相关设备及可读存储介质
CN110458014A (zh) 答题卡识读方法、装置和计算机可读存储介质
CN110135225A (zh) 样本标注方法及计算机存储介质
CN112347997A (zh) 一种试题检测识别方法、装置、电子设备及介质
CN112446259A (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN113159014A (zh) 基于手写题号的客观题批阅方法、装置、设备及存储介质
CN106033534B (zh) 基于直线检测的电子阅卷方法
CN113762274B (zh) 一种答题卡目标区域检测方法、系统、存储介质及设备
CN112163529A (zh) 一种试卷统分的系统及方法
CN111652141A (zh) 基于题号和文本行的题目分割方法、装置、设备和介质
CN109886093A (zh) 一种公式检测方法、设备及计算机可读存储介质
CN109165652A (zh) 基于标记的试卷阅卷方法
CN113065477B (zh) 一种智慧课堂课本内容识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information

Inventor after: Zhao Cong

Inventor after: Fu Yan

Inventor before: Zhao Cong

CB03 Change of inventor or designer information
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Title content identification method, device, readable storage medium and computer device

Effective date of registration: 20220822

Granted publication date: 20200623

Pledgee: Bank of Jiangxi Limited by Share Ltd. Nanchang East Lake branch

Pledgor: Jiangxi soft cloud Technology Co.,Ltd.

Registration number: Y2022980013284

PE01 Entry into force of the registration of the contract for pledge of patent right