CN115174814A - 对焦纸面及作业学情采集方法、装置、设备及存储介质 - Google Patents
对焦纸面及作业学情采集方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN115174814A CN115174814A CN202210908066.5A CN202210908066A CN115174814A CN 115174814 A CN115174814 A CN 115174814A CN 202210908066 A CN202210908066 A CN 202210908066A CN 115174814 A CN115174814 A CN 115174814A
- Authority
- CN
- China
- Prior art keywords
- picture
- handwritten annotation
- annotation content
- target
- focal length
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 230000008569 process Effects 0.000 claims description 20
- 238000001514 detection method Methods 0.000 claims description 10
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 4
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 abstract description 3
- 238000004891 communication Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
Abstract
本申请公开了一种对焦纸面及作业学情采集方法、装置、设备及存储介质,本申请获取到对包含指定用户的手写体批注内容的纸质文档拍摄的图片,从中识别出手写体批注内容对应的目标区域,控制摄像头在不同焦距下对目标区域进行拍摄,分别确定每一焦距对应的目标区域图片中手写体批注内容的清晰度,并选取清晰度最高的焦距作为目标焦距,以便摄像头基于目标焦距进行后续的拍摄。本申请中考虑到对于作业学情采集这一任务,指定用户的手写体批注内容是最重要的信息,以不同焦距下拍摄的手写体批注内容的清晰度作为筛选条件确定目标焦距,保证按照该目标焦距拍摄的图片中指定用户的手写体批注内容是清晰的,提升后续对作业学情的采集的准确度。
Description
技术领域
本申请涉及图像处理技术领域,更具体的说,是涉及一种对焦纸面及作业学情采集方法、装置、设备及存储介质。
背景技术
随着摄像技术及数据处理技术的发展,越来越多的传统人工作业任务可以通过机器作业来实现。示例如,在一些教学场景下,学生可以在纸质文档上进行作答,老师可以针对学生的作答进行手写批注,如通过批注“√”、“×”的方式,标注学生作答内容的正误。其中,同一学生对不同题目作答内容的正误情况,或不同学生对相同题目的作答内容的正误情况,可以称之为作业学情信息,通过统计作业学情信息,可以得到学生在学习方面的特点、成绩等,对于了解学生学习现状、指导老师调整教学方法有很大的意义。
传统的方法一般都是依靠老师自己进行线下的统计,来获取作业学情信息,这种方式耗时、耗力,且单纯依靠人力记忆也容易产生遗漏。为此,可以通过对老师批注后的纸质文档进行拍照,并通过图像分析技术来获取到老师的批注内容,进而得到作业学情信息。显然,得到一份足够清晰的高质量的拍照图片,是分析得到作业学情信息的基础环节,而摄像头能否准确对焦到纸面上又直接影响到拍摄图片清晰度,因此有必要提供一种自动化的对焦纸面的方法,以保证摄像头可以拍摄到清晰的图片,便于后续分析处理。
发明内容
鉴于上述问题,提出了本申请以便提供一种对焦纸面及作业学情采集方法、装置、设备及存储介质,以控制摄像头准确的对焦到纸面,能够拍摄到足够清晰的图片,进而便于后续的作业学情的采集。具体方案如下:
第一方面,提供了一种对焦纸面的方法,包括:
获取摄像头对纸质文档拍摄的图片,所述纸质文档中包含指定用户的手写体批注内容;
从所述图片中识别所述手写体批注内容对应的目标区域;
获取摄像头在设定的各不同焦距下拍摄的所述目标区域的图片,得到与每一焦距对应的目标区域图片;
分别确定每一焦距对应的目标区域图片中所述手写体批注内容的清晰度,并选取清晰度最高的焦距作为目标焦距,以便所述摄像头基于所述目标焦距进行后续的拍摄。
第二方面,提供了一种作业学情采集方法,包括:
控制摄像头按照上述的对焦纸面的方法所确定的目标焦距,对包含作答者的作答内容及审阅者的手写体批注内容的纸质文档进行拍摄,得到拍摄的图片;
从所述图片中识别所述审阅者的手写体批注内容,并基于识别到的所述手写体批注内容,得到所述纸质文档对应的作业学情信息。
第三方面,提供了一种对焦纸面的装置,包括:
图片获取单元,用于获取摄像头对纸质文档拍摄的图片,所述纸质文档中包含指定用户的手写体批注内容;
目标区域识别单元,用于从所述图片中识别所述手写体批注内容对应的目标区域;
各焦距图片获取单元,用于获取摄像头在设定的各不同焦距下拍摄的所述目标区域的图片,得到与每一焦距对应的目标区域图片;
清晰度比对单元,用于分别确定每一焦距对应的目标区域图片中所述手写体批注内容的清晰度,并选取清晰度最高的焦距作为目标焦距,以便所述摄像头基于所述目标焦距进行后续的拍摄。
第四方面,提供了一种作业学情采集装置,包括:
摄像头控制单元,用于控制摄像头按照上述对焦纸面的方法所确定的目标焦距,对包含作答者的作答内容及审阅者的手写体批注内容的纸质文档进行拍摄,得到拍摄的图片;
作业学情信息获取单元,用于从所述图片中识别所述审阅者的手写体批注内容,并基于识别到的所述手写体批注内容,得到所述纸质文档对应的作业学情信息。
第五方面,提供了一种摄像设备,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如上所述的对焦纸面的方法的各个步骤。
第六方面,提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上所述的对焦纸面的方法的各个步骤。
借由上述技术方案,本申请在摄像头对焦的过程中,首先获取到对包含指定用户的手写体批注内容的纸质文档拍摄的图片,从中识别出手写体批注内容对应的目标区域,进而控制摄像头在不同焦距下对目标区域进行拍摄,得到每一焦距对应的目标区域图片,分别确定每一焦距对应的目标区域图片中手写体批注内容的清晰度,并选取清晰度最高的焦距作为目标焦距,以便摄像头基于目标焦距进行后续的拍摄。
本申请中考虑到对于作业学情采集这一任务,纸质文档中包含的指定用户(具体可以是审阅者,如老师)的手写体批注内容是最重要的信息,进而在选取目标焦距时,以不同焦距下拍摄的目标区域中手写体批注内容的清晰度作为筛选条件,选取清晰度最高的焦距作为目标焦距,保证按照该目标焦距拍摄的图片中指定用户的手写体批注内容是清晰的。避免了摄像头错误的对焦到其它地方(如将用户的手掌或纸质文档中除手写体批注内容外的其它内容作为对焦点),导致对有用的手写体批注内容拍摄的图像出现模糊、不清楚,进而影响后续对作业学情的采集的问题。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本申请实施例提供的对焦纸面方法的一流程示意图;
图2示例了一张对老师批注后的试卷所拍摄的图片示意图;
图3示例了一种摄像头拍摄纸质文档的场景示意图;
图4为本申请实施例提供的一种对焦纸面的装置结构示意图;
图5为本申请实施例提供的摄像设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在各行业中都可能存在需要进行作业学情的采集、分析的需求。其中,作业学情是指作答者对题目进行作答后,由审阅者对作答内容进行批注,如批注作答结果的正误等,通过摄像头拍摄纸质文档的图片,进而从图片中采集审阅者的手写体批注内容,可以得到作答者的作业学情信息,如同一作答者对不同题目作答内容的正误情况,或不同作答者对相同题目的作答内容的正误情况等。通过采集作业学情信息,可以得到作答者在学习方面的特点、成绩等,对于了解作答者学习现状、指导老师调整教学方法有很大的意义。
比较典型的场景就是教学场景下,老师对班级内各学生的作答试卷进行批注,通过采集老师批注的内容,来获取学生的作业学情。当然,除此之外其他场景下也可能存在需要进行作业学情采集的需求,如公司应聘过程的笔试场景下,笔试官对应聘者的作答内容进行批注,通过采集笔试官的批注内容,可以得到应聘者的作业学情,等等。
在上述采集作业学情的场景下,如何通过摄像头拍摄得到清晰的纸质文档的图片是至关重要的环节。为了保证拍摄的图片足够清晰,需要摄像头能否准确对焦到纸面上,为此本申请提供了一种对焦纸面的方案。
本申请中考虑到在作业学情采集这一场景下,纸质文档中审阅者的手写体批注内容是最为关键的内容,为了保证拍摄的图片中该手写体批注内容的清晰,本申请在对焦时以该手写体批注内容的清晰度为标准来选取最终的目标焦距,从而能够保证摄像头准确的对焦到纸质文档中手写体批注内容,以保证拍摄的图片中该手写体批注内容是清晰的。
接下来,结合图1所示,对对焦纸面的方法流程进行介绍,可以包括以下步骤:
步骤S100、获取摄像头对纸质文档拍摄的图片。
其中,所述纸质文档中包含指定用户的手写体批注内容。如图2所示例的一张对老师批注后的试卷所拍摄的图片,其中包含了老师的手写体批注内容M1,其可以是对错标记符号、评分等。
当然,纸质文档中除了指定用户的手写体批注内容外,还可以有印刷体内容,如试题题干信息等,以及还可以包括除指定用户外的其它用户的手写体内容,如学生的作答内容,学生的姓名、学号等。
步骤S110、从所述图片中识别指定用户的手写体批注内容对应的目标区域。
具体地,本步骤中从图片中识别指定用户的手写体批注内容对应的目标区域的过程,可以通过OCR识别技术识别指定用户的手写体批注内容所在的文本行,进而得到手写体批注内容对应的目标区域。
当然,除此之外,还可以采用语义分割等神经网络模型对图片进行处理,以识别得到其中指定用户的手写体批注内容对应的目标区域。
步骤S120、获取摄像头在设定的各不同焦距下拍摄的所述目标区域的图片,得到与每一焦距对应的目标区域图片。
具体地,本申请可以预先设定若干不同的焦距,进而控制摄像头在设定的不同焦距下拍摄所述目标区域的图片,得到每一焦距对应的目标区域图片。
其中,摄像头可以按照设定的不同焦距对所述纸质文档进行拍摄,进而从拍摄后的图片中确定出目标区域部分对应的图片。也可以是控制摄像头按照设定的不同焦距对纸质文档中与所述目标区域对应位置进行拍摄,得到目标区域图片。
步骤S130、分别确定每一焦距对应的目标区域图片中所述手写体批注内容的清晰度,并选取清晰度最高的焦距作为目标焦距,以便所述摄像头基于所述目标焦距进行后续的拍摄。
具体地,本实施例中以图片中指定用户的手写体批注内容的清晰度为选取标准,选取清晰度最高的焦距作为目标焦距,以保证摄像头基于该目标焦距拍摄的图片中,指定用户的手写体批注内容足够清楚,为后续的作业学情的采集提供准确的数据基础。
本申请在摄像头对焦的过程中,首先获取到对包含指定用户的手写体批注内容的纸质文档拍摄的图片,从中识别出手写体批注内容对应的目标区域,进而控制摄像头在不同焦距下对目标区域进行拍摄,得到每一焦距对应的目标区域图片,分别确定每一焦距对应的目标区域图片中手写体批注内容的清晰度,并选取清晰度最高的焦距作为目标焦距,以便摄像头基于目标焦距进行后续的拍摄。
本申请中考虑到对于作业学情采集这一任务,纸质文档中包含的指定用户(具体可以是审阅者,如老师)的手写体批注内容是最重要的信息,进而在选取目标焦距时,以不同焦距下拍摄的目标区域中手写体批注内容的清晰度作为筛选条件,选取清晰度最高的焦距作为目标焦距,保证按照该目标焦距拍摄的图片中指定用户的手写体批注内容是清晰的。避免了摄像头错误的对焦到其它地方(如将用户的手掌或纸质文档中除手写体批注内容外的其它内容作为对焦点),导致对有用的手写体批注内容拍摄的图像出现模糊、不清楚,进而影响后续对作业学情的采集的问题。
在本申请的一些实施例中,考虑到实际应用场景下,摄像头对纸质文档拍摄的过程中,桌面上可能同时放置有多个不同的纸质文档。以老师批改作业的过程为例,桌面上可能放置有多个不同学生的作业。在此情况下,摄像头对纸质文档拍摄过程,可能会将非目标的纸质文档的边角拍摄进图片中,影响后续的手写体批注内容的识别。为此,本实施例中提供了一种解决方案,具体地,在上述步骤S110,从所述图片中识别指定用户的手写体批注内容对应的目标区域之前,可以增加如下步骤:
对所述图片进行页面检测,以从所述图片中选出中心区域所在的目标页面,得到所述目标页面的轮廓区域。
在此基础上,步骤S110具体可以按照如下过程实施:
从所述图片中所述轮廓区域内,识别所述手写体批注内容对应的目标区域。
结合图3所示:
摄像头100通过支架设置在桌面上方,对准所要拍摄的纸质文档。但是桌面上可能还存在其它非所要拍摄的纸质文档。如图3中,假设用户想要拍摄的是纸质文档A1,桌面上方和右下方还放置有纸质文档A2和A3。假设摄像头100的拍摄视野为B1,摄像头100按照该视野B1拍摄后得到的图片为B2。由图3可以看出,图片B2中同时存在A1以及部分A2和部分A3。
若直接基于此时拍摄的图片B2进行手写体批注内容的识别定位,可能会错误的定位到A2和A3中所包含的手写体批注内容上。
为此,本实施例中可以对图片B2进行页面检测,此时可以检测到三个页面,分别为页面A1、A2和A3。进一步确定图片B2的中心区域,如中心点坐标O,确定中心区域所在的目标页面为A1,进而得到页面A1的轮廓区域。从图片B2中该页面A1的轮廓区域内部,识别手写体批注内容对应的目标区域,保证不会错误的定位到页面A2和A3中。
进一步地,考虑到摄像头在拍摄纸质文档的过程中,可能会存在肢体遮挡文档的情况,导致摄像头拍照的图片中存在肢体遮挡区域,则可能影响后续手写体批注内容的识别定位。
为此,本实施例中在前述步骤S110,从所述图片中识别指定用户的手写体批注内容对应的目标区域之前,可以增加如下步骤:
从所述图片中识别肢体遮挡区域。
其中,对图片进行肢体遮挡识别的过程,可以采用预训练的肢体识别模型来实现。其中,肢体识别模型可以是采用标记有肢体遮挡区域位置的图像训练数据训练得到。
在此基础上,上述步骤S110具体可以包括:
从所述图片中除所述肢体遮挡区域外的区域中,识别所述手写体批注内容对应的目标区域。
本实施例中通过在图片中进行肢体遮挡区域识别,进而可以在非肢体遮挡区域外进行手写体批注内容的识别,避免由于肢体遮挡影响手写体批注内容识别的准确度。
在本申请的一些实施例中,上述步骤S110,从所述图片中识别指定用户的手写体批注内容对应的目标区域的过程,可以采用目标检测算法,如通过faster-rcnn神经网络模型或其它目标检测模型来识别图片中指定用户的手写体批注内容对应的目标区域。除此之外,还可以采用语义分割算法从所述图片中识别所述手写体批注内容对应的像素集合,由所述像素集合中各像素位置组成的区域作为所述目标区域。
语义分割算法相比于目标检测算法,能够直接定位出手写体批注内容所对应的像素点。
基于此,若上述步骤S110中采用语义分割算法从所述图片中识别所述手写体批注内容对应的像素集合,则对应的上述步骤S130,分别确定每一焦距对应的目标区域图片中所述手写体批注内容的清晰度的过程,可以包括:
对于每一焦距对应的目标区域图片:
将所述目标区域图片中,所述像素集合中各像素位置处的像素的饱和度求平均值,结果作为所述手写体批注内容的清晰度。
具体地,由于步骤S110中已经确定出了手写体批注内容对应的像素点集合了,因此可以直接计算目标区域图片中该像素集合中各像素位置处像素的饱和度的平均值,将结果作为手写体批注内容的清晰度。
另一种情况下,若上述步骤S110中采用目标检测算法从所述图片中识别所述手写体批注内容对应的目标区域,该目标区域中可能除了手写体批注内容外还有其它内容,如纸质文档中空白区域或印书体内容、作答者书写内容等。需要说明的是,本申请中定义指定用户的手写体批注内容为第一颜色的笔记内容,该第一颜色不同于纸质文档中印刷体内容的颜色和其他用户书写内容的颜色。以教师批改学生作业为例,指定用户可以是教师,第一颜色可以是红色,纸质文档上还可以包含有黑色的印刷体内容、学生的蓝色或黑色书写内容。
在此基础上,上述步骤S130,分别确定每一焦距对应的目标区域图片中所述手写体批注内容的清晰度的过程,可以包括:
对于每一焦距对应的目标区域图片:
按照像素的颜色对目标区域图片中各像素进行聚类,得到若干聚类簇;
在所述若干聚类簇中选择所述第一颜色对应的目标聚类簇,并计算所述目标聚类簇中各像素的饱和度的平均值,结果作为所述手写体批注内容的清晰度。
其中,在对目标区域图片中各像素进行聚类时,可以使用K-means等聚类算法。聚类得到的若干聚类簇中包含第一颜色对应的目标聚类簇,其对应着指定用户的手写体批注内容。因此,通过计算该目标聚类簇中各像素的饱和度的平均值,将该结果作为手写体批注内容的清晰度。
进一步地,若该第一颜色为红色,则上述计算所述目标聚类簇中各像素的饱和度的平均值,结果作为所述手写体批注内容的清晰度的过程,可以包括:
计算所述目标聚类簇中各像素的RGB三通道中,R通道数值的平均值,结果作为所述手写体批注内容的清晰度。
在本申请的一些实施例中,进一步提供了一种作业学情采集方法,其包括:
控制摄像头按照前述各实施例的对焦纸面的方法所确定的目标焦距,对包含作答者的作答内容及审阅者的手写体批注内容的纸质文档进行拍摄,得到拍摄的图片;
从所述图片中识别所述审阅者的手写体批注内容,并基于识别到的所述手写体批注内容,得到所述纸质文档对应的作业学情信息。
由于本申请的作业学情采集方法中,摄像头按照目标焦距进行拍摄,能够保证对焦在审阅者的手写体批注内容上,也即保证拍摄到的图片中审阅者的手写体批注内容是清晰的,基于此得到的作业学情信息也更加准确。
下面对本申请实施例提供的对焦纸面的装置进行描述,下文描述的对焦纸面的装置与上文描述的对焦纸面的方法可相互对应参照。
参见图4,图4为本申请实施例公开的一种对焦纸面的装置结构示意图。
如图4所示,该装置可以包括:
图片获取单元11,用于获取摄像头对纸质文档拍摄的图片,所述纸质文档中包含指定用户的手写体批注内容;
目标区域识别单元12,用于从所述图片中识别所述手写体批注内容对应的目标区域;
各焦距图片获取单元13,用于获取摄像头在设定的各不同焦距下拍摄的所述目标区域的图片,得到与每一焦距对应的目标区域图片;
清晰度比对单元14,用于分别确定每一焦距对应的目标区域图片中所述手写体批注内容的清晰度,并选取清晰度最高的焦距作为目标焦距,以便所述摄像头基于所述目标焦距进行后续的拍摄。
可选的,本申请的对焦纸面的装置还可以包括:
目标页面检测单元,用于在所述目标区域识别单元之前,对所述图片进行页面检测,以从所述图片中选出中心区域所在的目标页面,得到所述目标页面的轮廓区域;
则所述目标区域识别单元从所述图片中识别所述手写体批注内容对应的目标区域的过程,可以包括:
从所述图片中所述轮廓区域内,识别所述手写体批注内容对应的目标区域。
可选的,本申请的对焦纸面的装置还可以包括:
肢体遮挡检测单元,用于从所述图片中识别肢体遮挡区域;
则所述目标区域识别单元从所述图片中识别所述手写体批注内容对应的目标区域的过程,可以包括:
从所述图片中除所述肢体遮挡区域外的区域中,识别所述手写体批注内容对应的目标区域。
可选的,上述手写体批注内容可以是第一颜色的笔迹内容;则清晰度比对单元分别确定每一焦距对应的目标区域图片中所述手写体批注内容的清晰度的过程,可以包括:
对于每一焦距对应的目标区域图片:
按照像素的颜色对目标区域图片中各像素进行聚类,得到若干聚类簇;
在所述若干聚类簇中选择所述第一颜色对应的目标聚类簇,并计算所述目标聚类簇中各像素的饱和度的平均值,结果作为所述手写体批注内容的清晰度。
可选的,上述第一颜色可以是红色,则清晰度比对单元计算所述目标聚类簇中各像素的饱和度的平均值,结果作为所述手写体批注内容的清晰度的过程,可以包括:
计算所述目标聚类簇中各像素的RGB三通道中,R通道数值的平均值,结果作为所述手写体批注内容的清晰度。
可选的,上述目标区域识别单元从所述图片中识别所述手写体批注内容对应的目标区域的过程,可以包括:
采用语义分割算法从所述图片中识别所述手写体批注内容对应的像素集合,由所述像素集合中各像素位置组成的区域作为所述目标区域。在此基础上,上述清晰度比对单元分别确定每一焦距对应的目标区域图片中所述手写体批注内容的清晰度的过程,可以包括:
对于每一焦距对应的目标区域图片:
将所述目标区域图片中,所述像素集合中各像素位置处的像素的饱和度求平均值,结果作为所述手写体批注内容的清晰度。
本申请的一些实施例中,还公开了一种作业学情采集装置,可以包括:
摄像头控制单元,用于控制摄像头按照前述对焦纸面的方法所确定的目标焦距,对包含作答者的作答内容及审阅者的手写体批注内容的纸质文档进行拍摄,得到拍摄的图片;
作业学情信息获取单元,用于从所述图片中识别所述审阅者的手写体批注内容,并基于识别到的所述手写体批注内容,得到所述纸质文档对应的作业学情信息。
本申请实施例提供的对焦纸面的装置可应用于摄像设备,如高拍仪、摄像机、手机等。可选的,图5示出了摄像设备的硬件结构框图,参照图5,摄像设备的硬件结构可以包括:至少一个处理器1,至少一个通信接口2,至少一个存储器3和至少一个通信总线4;
在本申请实施例中,处理器1、通信接口2、存储器3、通信总线4的数量为至少一个,且处理器1、通信接口2、存储器3通过通信总线4完成相互间的通信;
处理器1可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路等;
存储器3可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory)等,例如至少一个磁盘存储器;
其中,存储器存储有程序,处理器可调用存储器存储的程序,所述程序用于:
获取摄像头对纸质文档拍摄的图片,所述纸质文档中包含指定用户的手写体批注内容;
从所述图片中识别所述手写体批注内容对应的目标区域;
获取摄像头在设定的各不同焦距下拍摄的所述目标区域的图片,得到与每一焦距对应的目标区域图片;
分别确定每一焦距对应的目标区域图片中所述手写体批注内容的清晰度,并选取清晰度最高的焦距作为目标焦距,以便所述摄像头基于所述目标焦距进行后续的拍摄。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
本申请实施例还提供一种存储介质,该存储介质可存储有适于处理器执行的程序,所述程序用于:
获取摄像头对纸质文档拍摄的图片,所述纸质文档中包含指定用户的手写体批注内容;
从所述图片中识别所述手写体批注内容对应的目标区域;
获取摄像头在设定的各不同焦距下拍摄的所述目标区域的图片,得到与每一焦距对应的目标区域图片;
分别确定每一焦距对应的目标区域图片中所述手写体批注内容的清晰度,并选取清晰度最高的焦距作为目标焦距,以便所述摄像头基于所述目标焦距进行后续的拍摄。
可选的,所述程序的细化功能和扩展功能可参照上文描述。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间可以根据需要进行组合,且相同相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (11)
1.一种对焦纸面的方法,其特征在于,包括:
获取摄像头对纸质文档拍摄的图片,所述纸质文档中包含指定用户的手写体批注内容;
从所述图片中识别所述手写体批注内容对应的目标区域;
获取摄像头在设定的各不同焦距下拍摄的所述目标区域的图片,得到与每一焦距对应的目标区域图片;
分别确定每一焦距对应的目标区域图片中所述手写体批注内容的清晰度,并选取清晰度最高的焦距作为目标焦距,以便所述摄像头基于所述目标焦距进行后续的拍摄。
2.根据权利要求1所述的方法,其特征在于,在从所述图片中识别所述手写体批注内容对应的目标区域之前,该方法还包括:
对所述图片进行页面检测,以从所述图片中选出中心区域所在的目标页面,得到所述目标页面的轮廓区域;
所述从所述图片中识别所述手写体批注内容对应的目标区域,包括:
从所述图片中所述轮廓区域内,识别所述手写体批注内容对应的目标区域。
3.根据权利要求1所述的方法,其特征在于,在从所述图片中识别所述手写体批注内容对应的目标区域之前,该方法还包括:
从所述图片中识别肢体遮挡区域;
所述从所述图片中识别所述手写体批注内容对应的目标区域,包括:
从所述图片中除所述肢体遮挡区域外的区域中,识别所述手写体批注内容对应的目标区域。
4.根据权利要求1所述的方法,其特征在于,所述手写体批注内容为第一颜色的笔迹内容;
所述分别确定每一焦距对应的目标区域图片中所述手写体批注内容的清晰度,包括:
对于每一焦距对应的目标区域图片:
按照像素的颜色对目标区域图片中各像素进行聚类,得到若干聚类簇;
在所述若干聚类簇中选择所述第一颜色对应的目标聚类簇,并计算所述目标聚类簇中各像素的饱和度的平均值,结果作为所述手写体批注内容的清晰度。
5.根据权利要求4所述的方法,其特征在于,所述第一颜色为红色,所述计算所述目标聚类簇中各像素的饱和度的平均值,结果作为所述手写体批注内容的清晰度,包括:
计算所述目标聚类簇中各像素的RGB三通道中,R通道数值的平均值,结果作为所述手写体批注内容的清晰度。
6.根据权利要求1所述的方法,其特征在于,从所述图片中识别所述手写体批注内容对应的目标区域的过程,包括:
采用语义分割算法从所述图片中识别所述手写体批注内容对应的像素集合,由所述像素集合中各像素位置组成的区域作为所述目标区域;
则,所述分别确定每一焦距对应的目标区域图片中所述手写体批注内容的清晰度,包括:
对于每一焦距对应的目标区域图片:
将所述目标区域图片中,所述像素集合中各像素位置处的像素的饱和度求平均值,结果作为所述手写体批注内容的清晰度。
7.一种作业学情采集方法,其特征在于,包括:
控制摄像头按照权利要求1-6任一项的对焦纸面的方法所确定的目标焦距,对包含作答者的作答内容及审阅者的手写体批注内容的纸质文档进行拍摄,得到拍摄的图片;
从所述图片中识别所述审阅者的手写体批注内容,并基于识别到的所述手写体批注内容,得到所述纸质文档对应的作业学情信息。
8.一种对焦纸面的装置,其特征在于,包括:
图片获取单元,用于获取摄像头对纸质文档拍摄的图片,所述纸质文档中包含指定用户的手写体批注内容;
目标区域识别单元,用于从所述图片中识别所述手写体批注内容对应的目标区域;
各焦距图片获取单元,用于获取摄像头在设定的各不同焦距下拍摄的所述目标区域的图片,得到与每一焦距对应的目标区域图片;
清晰度比对单元,用于分别确定每一焦距对应的目标区域图片中所述手写体批注内容的清晰度,并选取清晰度最高的焦距作为目标焦距,以便所述摄像头基于所述目标焦距进行后续的拍摄。
9.一种作业学情采集装置,其特征在于,包括:
摄像头控制单元,用于控制摄像头按照权利要求1-6任一项的对焦纸面的方法所确定的目标焦距,对包含作答者的作答内容及审阅者的手写体批注内容的纸质文档进行拍摄,得到拍摄的图片;
作业学情信息获取单元,用于从所述图片中识别所述审阅者的手写体批注内容,并基于识别到的所述手写体批注内容,得到所述纸质文档对应的作业学情信息。
10.一种摄像设备,其特征在于,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如权利要求1~6中任一项所述的对焦纸面的方法的各个步骤。
11.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1~6中任一项所述的对焦纸面的方法的各个步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210908066.5A CN115174814B (zh) | 2022-07-29 | 2022-07-29 | 对焦纸面及作业学情采集方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210908066.5A CN115174814B (zh) | 2022-07-29 | 2022-07-29 | 对焦纸面及作业学情采集方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115174814A true CN115174814A (zh) | 2022-10-11 |
CN115174814B CN115174814B (zh) | 2024-06-04 |
Family
ID=83478196
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210908066.5A Active CN115174814B (zh) | 2022-07-29 | 2022-07-29 | 对焦纸面及作业学情采集方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115174814B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN2380998Y (zh) * | 1999-07-30 | 2000-05-31 | 费振勇 | 文档采集平台 |
CN104349035A (zh) * | 2013-07-25 | 2015-02-11 | 宏碁股份有限公司 | 图像捕获设备以及其方法 |
CN105572845A (zh) * | 2016-02-18 | 2016-05-11 | 中山市众盈光学有限公司 | 一种手机成像镜头 |
CN109561255A (zh) * | 2018-12-20 | 2019-04-02 | 惠州Tcl移动通信有限公司 | 终端拍照方法、装置及存储介质 |
CN109635800A (zh) * | 2018-12-26 | 2019-04-16 | 深圳市捷顺科技实业股份有限公司 | 一种图像对焦方法及其相关设备 |
CN110348444A (zh) * | 2019-05-31 | 2019-10-18 | 浙江米猪控股有限公司 | 基于深度学习的错题收集方法、装置及设备 |
CN110705534A (zh) * | 2019-09-17 | 2020-01-17 | 浙江工业大学 | 一种适用于电子助视器的错题本生成方法 |
CN111598902A (zh) * | 2020-05-20 | 2020-08-28 | 北京字节跳动网络技术有限公司 | 图像分割方法、装置、电子设备及计算机可读介质 |
CN112672039A (zh) * | 2020-12-07 | 2021-04-16 | 北京集光通达科技股份有限公司 | 一种基于多区域主动变换聚焦方法及设备 |
CN113159014A (zh) * | 2021-04-28 | 2021-07-23 | 深圳市智像科技有限公司 | 基于手写题号的客观题批阅方法、装置、设备及存储介质 |
CN113205046A (zh) * | 2021-04-30 | 2021-08-03 | 作业帮教育科技(北京)有限公司 | 题册识别方法、系统、装置及介质 |
CN113837079A (zh) * | 2021-09-24 | 2021-12-24 | 苏州贝康智能制造有限公司 | 显微镜的自动对焦方法、装置、计算机设备和存储介质 |
CN114430456A (zh) * | 2020-10-29 | 2022-05-03 | 中兴通讯股份有限公司 | 图像拍摄方法、拍摄装置及存储介质 |
CN114495025A (zh) * | 2021-12-30 | 2022-05-13 | 天翼云科技有限公司 | 一种车辆识别方法、装置、电子设备及存储介质 |
-
2022
- 2022-07-29 CN CN202210908066.5A patent/CN115174814B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN2380998Y (zh) * | 1999-07-30 | 2000-05-31 | 费振勇 | 文档采集平台 |
CN104349035A (zh) * | 2013-07-25 | 2015-02-11 | 宏碁股份有限公司 | 图像捕获设备以及其方法 |
CN105572845A (zh) * | 2016-02-18 | 2016-05-11 | 中山市众盈光学有限公司 | 一种手机成像镜头 |
CN109561255A (zh) * | 2018-12-20 | 2019-04-02 | 惠州Tcl移动通信有限公司 | 终端拍照方法、装置及存储介质 |
CN109635800A (zh) * | 2018-12-26 | 2019-04-16 | 深圳市捷顺科技实业股份有限公司 | 一种图像对焦方法及其相关设备 |
CN110348444A (zh) * | 2019-05-31 | 2019-10-18 | 浙江米猪控股有限公司 | 基于深度学习的错题收集方法、装置及设备 |
CN110705534A (zh) * | 2019-09-17 | 2020-01-17 | 浙江工业大学 | 一种适用于电子助视器的错题本生成方法 |
CN111598902A (zh) * | 2020-05-20 | 2020-08-28 | 北京字节跳动网络技术有限公司 | 图像分割方法、装置、电子设备及计算机可读介质 |
CN114430456A (zh) * | 2020-10-29 | 2022-05-03 | 中兴通讯股份有限公司 | 图像拍摄方法、拍摄装置及存储介质 |
CN112672039A (zh) * | 2020-12-07 | 2021-04-16 | 北京集光通达科技股份有限公司 | 一种基于多区域主动变换聚焦方法及设备 |
CN113159014A (zh) * | 2021-04-28 | 2021-07-23 | 深圳市智像科技有限公司 | 基于手写题号的客观题批阅方法、装置、设备及存储介质 |
CN113205046A (zh) * | 2021-04-30 | 2021-08-03 | 作业帮教育科技(北京)有限公司 | 题册识别方法、系统、装置及介质 |
CN113837079A (zh) * | 2021-09-24 | 2021-12-24 | 苏州贝康智能制造有限公司 | 显微镜的自动对焦方法、装置、计算机设备和存储介质 |
CN114495025A (zh) * | 2021-12-30 | 2022-05-13 | 天翼云科技有限公司 | 一种车辆识别方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
郭海: "浅谈Motic数码显微互动系统在组织学实验教学中的应用", 《河南医学高等专科学校学报》, 15 December 2016 (2016-12-15) * |
Also Published As
Publication number | Publication date |
---|---|
CN115174814B (zh) | 2024-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210020059A1 (en) | Answer evaluation method, answer evaluation system, electronic device, and medium | |
CN111507251B (zh) | 试题图像中作答区域的定位方法、装置、电子设备及计算机存储介质 | |
CN110705534B (zh) | 一种适用于电子助视器的错题本生成方法 | |
CN110085068A (zh) | 一种基于图像识别的学习辅导方法及装置 | |
CN110956138B (zh) | 一种基于家教设备的辅助学习方法及家教设备 | |
CN111563512A (zh) | 一种答案自动涂抹的方法、装置、电子设备及存储介质 | |
CN110222678B (zh) | 一种题目分析方法、系统、可读存储介质及电子设备 | |
CN111753120B (zh) | 一种搜题的方法、装置、电子设备和存储介质 | |
KR20190052410A (ko) | 답안 일체형 시험지 및 답안 일체형 교재를 이용하는 자동 채점 시스템 및 그 방법 | |
CN111242045A (zh) | 自动化作业习题对错指示方法及系统 | |
CN113537801B (zh) | 板书处理方法、装置、终端和存储介质 | |
CN111027537A (zh) | 一种搜题方法及电子设备 | |
CN113159014A (zh) | 基于手写题号的客观题批阅方法、装置、设备及存储介质 | |
CN108121987A (zh) | 一种信息处理方法和电子设备 | |
CN111915635A (zh) | 支持自阅卷的试题解析信息生成方法及系统 | |
CN116303871A (zh) | 练习册批阅方法 | |
CN110298236B (zh) | 一种基于深度学习的盲文图像自动识别方法和系统 | |
CN110795918B (zh) | 确定阅读位置的方法、装置及设备 | |
CN111753715B (zh) | 点读场景下试题拍摄的方法、装置、电子设备和存储介质 | |
US20060194187A1 (en) | Material processing apparatus, material processing method, and program product | |
CN112991410A (zh) | 一种文本图像配准方法、电子设备及其存储介质 | |
CN115174814B (zh) | 对焦纸面及作业学情采集方法、装置、设备及存储介质 | |
US8336779B1 (en) | System for automatically reading a response form using a digital camera | |
CN115457585A (zh) | 作业批改的处理方法、装置、计算机设备及可读存储介质 | |
CN115482535A (zh) | 一种试卷自动批改方法、存储介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information |
Inventor after: Wu Jiajia Inventor after: Liu Chenyu Inventor after: Zhang Yintian Inventor after: Chen Mingjun Inventor after: Yang Zhengyan Inventor after: Yin Bing Inventor after: Hu Jinshui Inventor after: Pan Qinghua Inventor after: Liu Cong Inventor before: Wu Jiajia |
|
CB03 | Change of inventor or designer information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |