CN112668468A

CN112668468A - 一种拍照评测的方法及装置

Info

Publication number: CN112668468A
Application number: CN202011576437.1A
Authority: CN
Inventors: 褚衍进
Original assignee: Beijing Hanli Education Technology Co ltd
Current assignee: Beijing Hanli Education Technology Co ltd
Priority date: 2020-12-28
Filing date: 2020-12-28
Publication date: 2021-04-16

Abstract

本发明提供了一种拍照评测的方法，包括以下步骤：插入图片，插入学生作业本图片；检测图片，检测插入图片的矩形框；切割图片，切割、分离、保存、图片中的矩形框；图片处理，处理每个被切割分离的矩形框图片；检测文字，检测并分离每个矩形框图片中的文字；评分，对比、评测书写文字与标准文字。本发明利用Python为后端语言，使用OpenCV机器视觉框架，对文字进行处理和分析。Django是一个由Python写成的Web应用框架。相对现有技术，本发明可节省价格昂贵硬件的设备，适应性强，迭代速度快，为学生和家长提供一种轻量化的汉字学习方案，有效提高语文成绩。

Description

一种拍照评测的方法及装置

技术领域

本发明涉及智能学习领域，具体涉及一种拍照评测的方法及装置。

背景技术

伴随移动互联网、智能手机以及社交网络的发展，5G时代的开启以及移动终端设备的凸显必将为移动互联网的发展注入巨大的能量，图片成为互联网中的主要信息载体，给我们带来了快捷的信息记录和分享方式，图像识别技术可以使计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对象。

文字书写评测以往仅能靠老师线下进行，水平良莠不齐，标准不一，学生付出的成本低，收获较小。现有OCR文字识别技术逐渐成熟，文字识别领域逐渐开始从印刷体转向要求更高的手写体，使用机器视觉技术的手写文字识别也成为可能。

发明内容

一种拍照评测的方法，包括以下步骤：

插入图片，插入学生作业本图片；

检测图片，检测插入图片的矩形框；

切割图片，切割、分离、保存、图片中的矩形框；

图片处理，处理每个被切割分离的矩形框图片；

检测文字，检测并分离每个矩形框图片中的文字；

评分，对比、评测书写文字与标准文字。

上述的拍照评测的方法，所述图片为学生作业本照片；所述作业本为田格本、生字本、米格本、方格本、稿本等带有矩形框的作业本；将插入的图片存入至作业图文件夹。

上述的拍照评测的方法，所述图片可以是相机拍摄的照片，也可以是bmp、jpg、png等图片格式的文件；

上述的拍照评测的方法，将所述图片中的每个矩形框单独的切割分离，并将切割好的每个矩形框保存至切割文件夹；

上述的拍照评测的方法，切割图片中的矩形框采用切割算法，切割算法是基于边缘检测的图像分割算法，边缘检测边缘定位准确、速度快，通过检测包含不同区域的边缘来解决分割问题，不同区域的边界上像素的灰度值变化比较剧烈，将图片从空间域通过傅里叶变换到频率域，边缘对应着高频部分。一阶微分边缘算子，利用图像在边缘处的阶跃性，即图像梯度在边缘取得极大值的特性进行边缘检测。梯度是一个矢量，它具有方向θ和模|ΔΙ|：

θ＝arctan(I_у/I_χ)

梯度的方向提供了边缘的趋势信息，因为梯度方向始终是垂直于边缘方向，梯度的模值大小提供了边缘的强度信息。

上述的拍照评测的方法，处理每个被切割分离的矩形框图片；选择上述切割文件夹中被切割分离的矩形框的图片，对每个被切割分离的图片进行图像预处理，图像预处理包括角度矫正和去噪；优化；再将处理好的图片保存至处理图文件夹。

上述的拍照评测的方法，选择处理图文件夹中的一个矩形框文件，读取文件，查找矩形边框，去除不符合文字特点的矩形边框，将矩形框文件内的书写文字单独提取并保存为书写文字文件，再将书写文字文件保存书写文字文件夹。

上所述的拍照评测的方法，选择处理图文件夹中的一个文件，识别其中的文字，提取标准文字库中与识别出的书写文字对应的标准字体，并将所述标准字体保存至标准文字文件夹。

上述的拍照评测的方法，书写字体与结果图的评分算法为预处理图片，加载buffer，调用cv2.circle、cv2.copyMakeBorder、cv2.rectangle绘制结构线，寻找字体像素坐标；使用cv2.cvtColor解决cv2和PIL颜色的hex码储存顺序不同的问题，然后调用ImageDraw.Draw放置标准对照字体；根据条件检测像素、像素排序；融合ROI，依次使用cv2.cvtColor，cv2.threshold，cv2.morphologyEx，cv2.findContours，cv2.contourArea，cv2.drawContours，cv2.copyTo等方法对图像进行一系列的膨胀腐蚀组合；寻找图片的ROI，调用v2.split，cv2.cvtColor，cv2.threshold，依照评分体系(优秀、优良、及格)处理评分。

一种拍照评测的装置，包括：

图片插入模块，插入学生作业本图片；

图片处理模块，处理学生作业本图片；

文字检测模块，检测并分离每个矩形框图片中的文字；

文字识别模块，识别每个被切割分离的矩形框图片中的文字；

评分模块，对比、评测书写文字与标准文字；

本发明利用Python为后端语言，使用OpenCV机器视觉框架，对文字进行处理和分析。Django是一个由Python写成的Web应用框架。Django的主要目的是简便、快速的开发数据库驱动的网站。它强调代码复用，多个组件可以很方便的以“插件”形式服务于整个框架。OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库，可以运行在Linux、Windows、Android和MacOS操作系统上。它轻量级而且高效——由一系列C函数和少量C++类构成，同时提供了Python、Ruby、MATLAB等语言的接口，实现了图像处理和计算机视觉方面的很多通用算法。相对现有技术，本发明可节省价格昂贵硬件的设备，适应性强，迭代速度快，为学生和家长提供一种轻量化的汉字学习方案，有效提高语文成绩。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的拍照评测的方法的逻辑结构图；

图2为本方面实施例提供的学生作业本图片的示范图；

图3为本发明实施例提供的微信小程序的拍照评测示范图；

图4为本发明实施例提供的微信小程序的拍照评测结果的示范图；

图5为本发明实施例提供的微信小程序的拍照评测单字对比的示范图

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

一种拍照评测的方法，利用微信小程序为用户操作平台、Python为后端语言，使用OpenCV机器视觉框架，对文字进行处理和分析。是借助于微信小程序的应用于书写字体与标准字体的互相比较、评分、修改等。

所述拍照评测的方法包括以下步骤：

步骤一、插入图片，插入学生作业本图片；

在此步骤中，所述图片为学生作业本照片；优选的，作业本为田格本、生字本、米格本、方格本、稿本等带有矩形框的作业本；插入的图片可以是相机拍摄的照片，也可以是bmp、jpg、png等图片格式的文件；并且将插入的图片存入至作业图文件夹。

步骤二、检测图片，检测插入图片的矩形框；

在一个实施例中，如图2所示，插入的图片为带有矩形框的学生作业本照片，通过EAST(Efficient and Accuracy Scene Text detection pipeline)模型识别上述图片中的矩形框；EAST模型中通过使用全卷积网络(FCN)生成多尺度融合的特征图，然后在此基础上直接进行像素级的文本块预测；该模型中，支持旋转矩形框、任意四边形两种文本区域标注形式；对应于四边形标注，模型执行时会对特征图中每个像素预测其到四个顶点的坐标差值；对应于旋转矩形框标注，模型执行时会对特征图中每个像素预测其到矩形框四边的距离以及矩形框的方向角。

在一个更为优选的实施例中，插入的图片为无矩形边框的学生作业本照片，这时通过PixelLink模型识别图片并划分矩形框；无矩形边框的学生作业本照片中一组文字块紧挨在一起，通过语义分割方法很难将它们识别开来，所以PixelLink模型尝试用实例分割方法解决这个问题；该模型的特征提取部分，为VGG16基础上构建的FCN网络；首先，借助于CNN模块执行两个像素级预测：一个文本二分类预测，一个链接二分类预测；接着，用正链接去连接邻居正文本像素，得到文字块实例分割结果；然后，根据分割的结果为无矩形边框的学生作业本照片上的每一个文字块划分矩形框；

步骤三、切割图片，切割、分离、保存、图片中的矩形框；

在此步骤中，将上述图片中的每个矩形框单独的切割分离，并将切割好的每个矩形框保存至切割文件夹；

切割图片中的矩形框采用切割算法，切割算法是基于边缘检测的图像分割算法，边缘检测边缘定位准确、速度快，通过检测包含不同区域的边缘来解决分割问题，不同区域的边界上像素的灰度值变化比较剧烈，将图片从空间域通过傅里叶变换到频率域，边缘对应着高频部分。一阶微分边缘算子，利用图像在边缘处的阶跃性，即图像梯度在边缘取得极大值的特性进行边缘检测。梯度是一个矢量，它具有方向θ和模|ΔΙ|：

θ＝arctan(I_у/I_χ)

梯度的方向提供了边缘的趋势信息，因为梯度方向始终是垂直于边缘方向，梯度的模值大小提供了边缘的强度信息；

在实际使用中，通常利用有限差分进行梯度近似。对于上面的公式，我们有如下的近似：

步骤四、图片处理，处理每个被切割分离的矩形框图片；

在此步骤中，选择上述切割文件夹中被切割分离的矩形框的图片，对每个被切割分离的图片进行图像预处理，图像预处理包括角度矫正和去噪；优化；再将处理好的图片保存至处理图文件夹。

步骤五、检测文字，检测并分离每个矩形框图片中的文字

选择处理图文件夹中的一个矩形框文件，读取文件，并转为灰度图；

将图片二值化，或先降噪后再二值化，以便简化处理；

然后进行膨胀、腐蚀操作，突出轮廓、消除边框线条；“膨胀”就是对图像中的高亮部分进行扩张，让白色区域变多；“腐蚀”就是图像中的高亮部分被蚕食，让黑色区域变多；通过膨胀、腐蚀的一系列操作，可将文字区域的轮廓突出，并消除掉一些边框线条，再通过查找轮廓的方法计算出文字区域的位置出来；

然后查找矩形边框，去除不符合文字特点的矩形边框；

最后将矩形框文件内的书写文字单独提取并保存为书写文字文件，再将书写文字文件保存书写文字文件夹。

步骤六、识别文字，识别每个矩形框图片中的文字

选择处理图文件夹中的一个文件，识别其中的文字，处理图文件夹中的文件是已经被优化好的矩形框图片，利用OCR(Optical Character Recognition，光学字符识别)技术即可快速准确的识别出处理图文件中的书写文字；然后提取标准文字库中与识别出的书写文字对应的标准字体，并将所述标准字体保存至标准文字文件夹。

步骤七、评分，对比、评测书写文字与标准文字；

选择书写字体文件夹中的一个文件和与之相对应的标准文字文件夹中的文件，将两个相对应的文件进行比较并评分；

书写字体与结果图的评分算法如下：

1.预处理图片，加载buffer，调用cv2.circle、cv2.copyMakeBorder、cv2.rectangle绘制结构线，寻找字体像素坐标；

2.使用cv2.cvtColor解决cv2和PIL颜色的hex码储存顺序不同的问题，然后调用ImageDraw.Draw放置标准对照字体；

3.根据条件检测像素、像素排序；

4.融合ROI，依次使用cv2.cvtColor，cv2.threshold，cv2.morphologyEx，cv2.findContours，cv2.contourArea，cv2.drawContours，cv2.copyTo等方法对图像进行一系列的膨胀腐蚀组合；

5.寻找图片的ROI，调用v2.split，cv2.cvtColor，cv2.threshold，依照评分体系(优秀、优良、及格)处理评分。

在此步骤中，将每一组相应的文件即书写字体与对应标准字体相对比并给出评分；进一步的，根据每个单独矩形框的评分给整个插入的图片评分。

一种拍照评测的程序，所述程序可以为安装在手机端、学习工具端的应用软件，也可以是安装在电脑端的应用程序；优选的，所述程序是基于微信为用户操作平台，快捷、迅速地拍照评测的微信小程序。

本发明还提供了一种拍照评测的装置，包括：

图片插入模块，插入学生作业本图片；

所述图片插入模块插入的是学生作业本照片；优选的，作业本为田格本、生字本、米格本、方格本、稿本等带有矩形框的作业本；进一步的，插入的图片可以是相机拍摄的照片，也可以是bmp、jpg、png等图片格式的文件。

图片处理模块，处理学生作业本图片；

所述图片处理模块包括检测或划分矩形框，在一个优选的实施例中，通过EAST模型识别上述图片中的矩形框；在一个更为优选的实施例中，插入的学生作业本图片为无边框作业本图片，通过PixelLink模型识别图片并划分矩形框。

还包括切割、分离矩形框，并将切割、分离的矩形框保存为图片；

在一个优选的实施例中，通过切割算法切割图片中的矩形框；切割算法是基于边缘检测的图像分割算法，边缘检测边缘定位准确、速度快，通过检测包含不同区域的边缘来解决分割问题，不同区域的边界上像素的灰度值变化比较剧烈，将图片从空间域通过傅里叶变换到频率域，边缘对应着高频部分。一阶微分边缘算子，利用图像在边缘处的阶跃性，即图像梯度在边缘取得极大值的特性进行边缘检测。梯度是一个矢量，它具有方向θ和模|ΔΙ|：

θ＝arctan(I_у/I_χ)

还包括处理矩形框图片，对每个被切割分离的矩形框图片，进行图像预处理，图像预处理包括角度矫正和去噪，并将处理好的矩形框图片保存为处理图图片；

文字检测模块，检测并分离每个矩形框图片中的文字；

在一个优选的实施例中，将被切割分离的矩形框图片转为灰度图，然后将图片二值化，或先降噪后再二值化，以便简化处理；随后进行膨胀、腐蚀操作，突出轮廓、消除边框线条；“膨胀”就是对图像中的高亮部分进行扩张，让白色区域变多；“腐蚀”就是图像中的高亮部分被蚕食，让黑色区域变多；通过膨胀、腐蚀的一系列操作，可将文字区域的轮廓突出，并消除掉一些边框线条，再通过查找轮廓的方法计算出文字区域的位置出来。

在一个优选的实施例中，利用OCR(Optical Character Recognition，光学字符识别)技术快速准确的识别出处理图图片中的文字，然后提取标准文字库中与识别出的书写文字对应的标准字体；

评分模块，对比、评测书写文字与标准文字；

在一个优选的实施例中，书写字体与标准文字的评分算法如下：

3.根据条件检测像素、像素排序；

5.寻找图片的ROI，调用v2.split，cv2.cvtColor，cv2.threshold，依照评分体系(优秀、优良、及格)处理评分。在一个更为优先的实施例中，将每一组相应的文件即书写字体与对应标准字体相对比并给出评分与批注；进一步的，根据每个单独矩形框的评分给整个插入的图片评分与批注。

在另一个更为优选的实施例中，如图3所示，提供了一种微信小程序客户端，用户使用微信即可便捷地拍照、评测书写，后台调用智能识别引擎后可自动识别出文字位置，如图4所示，并逐一对文字评测，打分并反馈改进建议，如图5所示智能评测报告包含对字体的整体评价与单字评价。进一步的，相机部分使用小程序的camera标签，待用户点击拍摄时保存图片以及取景框位置，使用小程序网络API的uploadFile上传至服务器。教师可在教师端组建班级学生加入班级后，可向老师提交作业。老师收到作业后，可对学生的作业以多种形式进行评价，包括文字、语音、涂鸦。教师评价完成后，学生可立即收到教师点评并及时作出更改。待收到服务器返回的信息后，使用小程序的image和video等媒体组件进行图片展示与视频播放。

以上只通过说明的方式描述了本发明的某些示范性实施例，毋庸置疑，对于本领域的普通技术人员，在不偏离本发明的精神和范围的情况下，可以用各种不同的方式对所描述的实施例进行修正。因此，上述附图和描述在本质上是说明性的，不应理解为对本发明权利要求保护范围的限制。

Claims

1.一种拍照评测的方法，包括以下步骤：

插入图片，插入学生作业本图片；

检测图片，检测插入图片的矩形框；

切割图片，切割、分离、保存、图片中的矩形框；

图片处理，处理每个被切割分离的矩形框图片；

检测文字，检测并分离每个矩形框图片中的文字；

评分，对比、评测书写文字与标准文字。

2.如权利要求1所述的拍照评测的方法，其特征在于：

所述图片为学生作业本照片；所述作业本为田格本、生字本、米格本、方格本、稿本等带有矩形框的作业本；将插入的图片存入至作业图文件夹。

3.如权利要求2所述的拍照评测的方法，其特征在于：

所述图片可以是相机拍摄的照片，也可以是bmp、jpg、png等图片格式的文件。

4.如权利要求3所述的拍照评测的方法，其特征在于：

将所述图片中的每个矩形框单独的切割分离，并将切割好的每个矩形框保存至切割文件夹。

5.如权利要求4所述的拍照评测的方法，其特征在于：

θ＝arctan(I_у/I_χ)

6.如权利要求5所述的拍照评测的方法，其特征在于：

处理每个被切割分离的矩形框图片；选择上述切割文件夹中被切割分离的矩形框的图片，对每个被切割分离的图片进行图像预处理，图像预处理包括角度矫正和去噪；优化；再将处理好的图片保存至处理图文件夹。

7.如权利要求6所述的拍照评测的方法，其特征在于：

选择处理图文件夹中的一个矩形框文件，读取文件，查找矩形边框，去除不符合文字特点的矩形边框，将矩形框文件内的书写文字单独提取并保存为书写文字文件，再将书写文字文件保存书写文字文件夹。

8.如权利要求7所述的拍照评测的方法，其特征在于：

选择处理图文件夹中的一个文件，识别其中的文字，提取标准文字库中与识别出的书写文字对应的标准字体，并将所述标准字体保存至标准文字文件夹。

9.如权利要求8所述的拍照评测的方法，其特征在于：

书写字体与结果图的评分算法为预处理图片，加载buffer，调用cv2.circle、cv2.copyMakeBorder、cv2.rectangle绘制结构线，寻找字体像素坐标；使用cv2.cvtColor解决cv2和PIL颜色的hex码储存顺序不同的问题，然后调用ImageDraw.Draw放置标准对照字体；根据条件检测像素、像素排序；融合ROI，依次使用cv2.cvtColor，cv2.threshold，cv2.morphologyEx，cv2.findContours，cv2.contourArea，cv2.drawContours，cv2.copyTo等方法对图像进行一系列的膨胀腐蚀组合；寻找图片的ROI，调用v2.split，cv2.cvtColor，cv2.threshold，依照评分体系(优秀、优良、及格)处理评分。

10.一种拍照评测的装置，包括：

图片插入模块，插入学生作业本图片；

图片处理模块，处理学生作业本图片；

文字检测模块，检测并分离每个矩形框图片中的文字；

评分模块，对比、评测书写文字与标准文字。