CN112668468A - 一种拍照评测的方法及装置 - Google Patents

一种拍照评测的方法及装置 Download PDF

Info

Publication number
CN112668468A
CN112668468A CN202011576437.1A CN202011576437A CN112668468A CN 112668468 A CN112668468 A CN 112668468A CN 202011576437 A CN202011576437 A CN 202011576437A CN 112668468 A CN112668468 A CN 112668468A
Authority
CN
China
Prior art keywords
picture
rectangular frame
characters
pictures
detecting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011576437.1A
Other languages
English (en)
Inventor
褚衍进
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Hanli Education Technology Co ltd
Original Assignee
Beijing Hanli Education Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Hanli Education Technology Co ltd filed Critical Beijing Hanli Education Technology Co ltd
Priority to CN202011576437.1A priority Critical patent/CN112668468A/zh
Publication of CN112668468A publication Critical patent/CN112668468A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

本发明提供了一种拍照评测的方法,包括以下步骤:插入图片,插入学生作业本图片;检测图片,检测插入图片的矩形框;切割图片,切割、分离、保存、图片中的矩形框;图片处理,处理每个被切割分离的矩形框图片;检测文字,检测并分离每个矩形框图片中的文字;评分,对比、评测书写文字与标准文字。本发明利用Python为后端语言,使用OpenCV机器视觉框架,对文字进行处理和分析。Django是一个由Python写成的Web应用框架。相对现有技术,本发明可节省价格昂贵硬件的设备,适应性强,迭代速度快,为学生和家长提供一种轻量化的汉字学习方案,有效提高语文成绩。

Description

一种拍照评测的方法及装置
技术领域
本发明涉及智能学习领域,具体涉及一种拍照评测的方法及装置。
背景技术
伴随移动互联网、智能手机以及社交网络的发展,5G时代的开启以及移动终端设备的凸显必将为移动互联网的发展注入巨大的能量,图片成为互联网中的主要信息载体,给我们带来了快捷的信息记录和分享方式,图像识别技术可以使计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象。
文字书写评测以往仅能靠老师线下进行,水平良莠不齐,标准不一,学生付出的成本低,收获较小。现有OCR文字识别技术逐渐成熟,文字识别领域逐渐开始从印刷体转向要求更高的手写体,使用机器视觉技术的手写文字识别也成为可能。
发明内容
一种拍照评测的方法,包括以下步骤:
插入图片,插入学生作业本图片;
检测图片,检测插入图片的矩形框;
切割图片,切割、分离、保存、图片中的矩形框;
图片处理,处理每个被切割分离的矩形框图片;
检测文字,检测并分离每个矩形框图片中的文字;
评分,对比、评测书写文字与标准文字。
上述的拍照评测的方法,所述图片为学生作业本照片;所述作业本为田格本、生字本、米格本、方格本、稿本等带有矩形框的作业本;将插入的图片存入至作业图文件夹。
上述的拍照评测的方法,所述图片可以是相机拍摄的照片,也可以是bmp、jpg、png等图片格式的文件;
上述的拍照评测的方法,将所述图片中的每个矩形框单独的切割分离,并将切割好的每个矩形框保存至切割文件夹;
上述的拍照评测的方法,切割图片中的矩形框采用切割算法,切割算法是基于边缘检测的图像分割算法,边缘检测边缘定位准确、速度快,通过检测包含不同区域的边缘来解决分割问题,不同区域的边界上像素的灰度值变化比较剧烈,将图片从空间域通过傅里叶变换到频率域,边缘对应着高频部分。一阶微分边缘算子,利用图像在边缘处的阶跃性,即图像梯度在边缘取得极大值的特性进行边缘检测。梯度是一个矢量,它具有方向θ和模|ΔΙ|:
Figure BDA0002864188930000021
Figure BDA0002864188930000022
θ=arctan(Iу/Iχ)
梯度的方向提供了边缘的趋势信息,因为梯度方向始终是垂直于边缘方向,梯度的模值大小提供了边缘的强度信息。
上述的拍照评测的方法,处理每个被切割分离的矩形框图片;选择上述切割文件夹中被切割分离的矩形框的图片,对每个被切割分离的图片进行图像预处理,图像预处理包括角度矫正和去噪;优化;再将处理好的图片保存至处理图文件夹。
上述的拍照评测的方法,选择处理图文件夹中的一个矩形框文件,读取文件,查找矩形边框,去除不符合文字特点的矩形边框,将矩形框文件内的书写文字单独提取并保存为书写文字文件,再将书写文字文件保存书写文字文件夹。
上所述的拍照评测的方法,选择处理图文件夹中的一个文件,识别其中的文字,提取标准文字库中与识别出的书写文字对应的标准字体,并将所述标准字体保存至标准文字文件夹。
上述的拍照评测的方法,书写字体与结果图的评分算法为预处理图片,加载buffer,调用cv2.circle、cv2.copyMakeBorder、cv2.rectangle绘制结构线,寻找字体像素坐标;使用cv2.cvtColor解决cv2和PIL颜色的hex码储存顺序不同的问题,然后调用ImageDraw.Draw放置标准对照字体;根据条件检测像素、像素排序;融合ROI,依次使用cv2.cvtColor,cv2.threshold,cv2.morphologyEx,cv2.findContours,cv2.contourArea,cv2.drawContours,cv2.copyTo等方法对图像进行一系列的膨胀腐蚀组合;寻找图片的ROI,调用v2.split,cv2.cvtColor,cv2.threshold,依照评分体系(优秀、优良、及格)处理评分。
一种拍照评测的装置,包括:
图片插入模块,插入学生作业本图片;
图片处理模块,处理学生作业本图片;
文字检测模块,检测并分离每个矩形框图片中的文字;
文字识别模块,识别每个被切割分离的矩形框图片中的文字;
评分模块,对比、评测书写文字与标准文字;
本发明利用Python为后端语言,使用OpenCV机器视觉框架,对文字进行处理和分析。Django是一个由Python写成的Web应用框架。Django的主要目的是简便、快速的开发数据库驱动的网站。它强调代码复用,多个组件可以很方便的以“插件”形式服务于整个框架。OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows、Android和MacOS操作系统上。它轻量级而且高效——由一系列C函数和少量C++类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。相对现有技术,本发明可节省价格昂贵硬件的设备,适应性强,迭代速度快,为学生和家长提供一种轻量化的汉字学习方案,有效提高语文成绩。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的拍照评测的方法的逻辑结构图;
图2为本方面实施例提供的学生作业本图片的示范图;
图3为本发明实施例提供的微信小程序的拍照评测示范图;
图4为本发明实施例提供的微信小程序的拍照评测结果的示范图;
图5为本发明实施例提供的微信小程序的拍照评测单字对比的示范图
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一种拍照评测的方法,利用微信小程序为用户操作平台、Python为后端语言,使用OpenCV机器视觉框架,对文字进行处理和分析。是借助于微信小程序的应用于书写字体与标准字体的互相比较、评分、修改等。
所述拍照评测的方法包括以下步骤:
步骤一、插入图片,插入学生作业本图片;
在此步骤中,所述图片为学生作业本照片;优选的,作业本为田格本、生字本、米格本、方格本、稿本等带有矩形框的作业本;插入的图片可以是相机拍摄的照片,也可以是bmp、jpg、png等图片格式的文件;并且将插入的图片存入至作业图文件夹。
步骤二、检测图片,检测插入图片的矩形框;
在一个实施例中,如图2所示,插入的图片为带有矩形框的学生作业本照片,通过EAST(Efficient and Accuracy Scene Text detection pipeline)模型识别上述图片中的矩形框;EAST模型中通过使用全卷积网络(FCN)生成多尺度融合的特征图,然后在此基础上直接进行像素级的文本块预测;该模型中,支持旋转矩形框、任意四边形两种文本区域标注形式;对应于四边形标注,模型执行时会对特征图中每个像素预测其到四个顶点的坐标差值;对应于旋转矩形框标注,模型执行时会对特征图中每个像素预测其到矩形框四边的距离以及矩形框的方向角。
在一个更为优选的实施例中,插入的图片为无矩形边框的学生作业本照片,这时通过PixelLink模型识别图片并划分矩形框;无矩形边框的学生作业本照片中一组文字块紧挨在一起,通过语义分割方法很难将它们识别开来,所以PixelLink模型尝试用实例分割方法解决这个问题;该模型的特征提取部分,为VGG16基础上构建的FCN网络;首先,借助于CNN模块执行两个像素级预测:一个文本二分类预测,一个链接二分类预测;接着,用正链接去连接邻居正文本像素,得到文字块实例分割结果;然后,根据分割的结果为无矩形边框的学生作业本照片上的每一个文字块划分矩形框;
步骤三、切割图片,切割、分离、保存、图片中的矩形框;
在此步骤中,将上述图片中的每个矩形框单独的切割分离,并将切割好的每个矩形框保存至切割文件夹;
切割图片中的矩形框采用切割算法,切割算法是基于边缘检测的图像分割算法,边缘检测边缘定位准确、速度快,通过检测包含不同区域的边缘来解决分割问题,不同区域的边界上像素的灰度值变化比较剧烈,将图片从空间域通过傅里叶变换到频率域,边缘对应着高频部分。一阶微分边缘算子,利用图像在边缘处的阶跃性,即图像梯度在边缘取得极大值的特性进行边缘检测。梯度是一个矢量,它具有方向θ和模|ΔΙ|:
Figure BDA0002864188930000051
Figure BDA0002864188930000052
θ=arctan(Iу/Iχ)
梯度的方向提供了边缘的趋势信息,因为梯度方向始终是垂直于边缘方向,梯度的模值大小提供了边缘的强度信息;
在实际使用中,通常利用有限差分进行梯度近似。对于上面的公式,我们有如下的近似:
Figure BDA0002864188930000061
Figure BDA0002864188930000062
步骤四、图片处理,处理每个被切割分离的矩形框图片;
在此步骤中,选择上述切割文件夹中被切割分离的矩形框的图片,对每个被切割分离的图片进行图像预处理,图像预处理包括角度矫正和去噪;优化;再将处理好的图片保存至处理图文件夹。
步骤五、检测文字,检测并分离每个矩形框图片中的文字
选择处理图文件夹中的一个矩形框文件,读取文件,并转为灰度图;
将图片二值化,或先降噪后再二值化,以便简化处理;
然后进行膨胀、腐蚀操作,突出轮廓、消除边框线条;“膨胀”就是对图像中的高亮部分进行扩张,让白色区域变多;“腐蚀”就是图像中的高亮部分被蚕食,让黑色区域变多;通过膨胀、腐蚀的一系列操作,可将文字区域的轮廓突出,并消除掉一些边框线条,再通过查找轮廓的方法计算出文字区域的位置出来;
然后查找矩形边框,去除不符合文字特点的矩形边框;
最后将矩形框文件内的书写文字单独提取并保存为书写文字文件,再将书写文字文件保存书写文字文件夹。
步骤六、识别文字,识别每个矩形框图片中的文字
选择处理图文件夹中的一个文件,识别其中的文字,处理图文件夹中的文件是已经被优化好的矩形框图片,利用OCR(Optical Character Recognition,光学字符识别)技术即可快速准确的识别出处理图文件中的书写文字;然后提取标准文字库中与识别出的书写文字对应的标准字体,并将所述标准字体保存至标准文字文件夹。
步骤七、评分,对比、评测书写文字与标准文字;
选择书写字体文件夹中的一个文件和与之相对应的标准文字文件夹中的文件,将两个相对应的文件进行比较并评分;
书写字体与结果图的评分算法如下:
1.预处理图片,加载buffer,调用cv2.circle、cv2.copyMakeBorder、cv2.rectangle绘制结构线,寻找字体像素坐标;
2.使用cv2.cvtColor解决cv2和PIL颜色的hex码储存顺序不同的问题,然后调用ImageDraw.Draw放置标准对照字体;
3.根据条件检测像素、像素排序;
4.融合ROI,依次使用cv2.cvtColor,cv2.threshold,cv2.morphologyEx,cv2.findContours,cv2.contourArea,cv2.drawContours,cv2.copyTo等方法对图像进行一系列的膨胀腐蚀组合;
5.寻找图片的ROI,调用v2.split,cv2.cvtColor,cv2.threshold,依照评分体系(优秀、优良、及格)处理评分。
在此步骤中,将每一组相应的文件即书写字体与对应标准字体相对比并给出评分;进一步的,根据每个单独矩形框的评分给整个插入的图片评分。
一种拍照评测的程序,所述程序可以为安装在手机端、学习工具端的应用软件,也可以是安装在电脑端的应用程序;优选的,所述程序是基于微信为用户操作平台,快捷、迅速地拍照评测的微信小程序。
本发明还提供了一种拍照评测的装置,包括:
图片插入模块,插入学生作业本图片;
所述图片插入模块插入的是学生作业本照片;优选的,作业本为田格本、生字本、米格本、方格本、稿本等带有矩形框的作业本;进一步的,插入的图片可以是相机拍摄的照片,也可以是bmp、jpg、png等图片格式的文件。
图片处理模块,处理学生作业本图片;
所述图片处理模块包括检测或划分矩形框,在一个优选的实施例中,通过EAST模型识别上述图片中的矩形框;在一个更为优选的实施例中,插入的学生作业本图片为无边框作业本图片,通过PixelLink模型识别图片并划分矩形框。
还包括切割、分离矩形框,并将切割、分离的矩形框保存为图片;
在一个优选的实施例中,通过切割算法切割图片中的矩形框;切割算法是基于边缘检测的图像分割算法,边缘检测边缘定位准确、速度快,通过检测包含不同区域的边缘来解决分割问题,不同区域的边界上像素的灰度值变化比较剧烈,将图片从空间域通过傅里叶变换到频率域,边缘对应着高频部分。一阶微分边缘算子,利用图像在边缘处的阶跃性,即图像梯度在边缘取得极大值的特性进行边缘检测。梯度是一个矢量,它具有方向θ和模|ΔΙ|:
Figure BDA0002864188930000081
Figure BDA0002864188930000082
θ=arctan(Iу/Iχ)
梯度的方向提供了边缘的趋势信息,因为梯度方向始终是垂直于边缘方向,梯度的模值大小提供了边缘的强度信息;
在实际使用中,通常利用有限差分进行梯度近似。对于上面的公式,我们有如下的近似:
Figure BDA0002864188930000083
Figure BDA0002864188930000084
还包括处理矩形框图片,对每个被切割分离的矩形框图片,进行图像预处理,图像预处理包括角度矫正和去噪,并将处理好的矩形框图片保存为处理图图片;
文字检测模块,检测并分离每个矩形框图片中的文字;
在一个优选的实施例中,将被切割分离的矩形框图片转为灰度图,然后将图片二值化,或先降噪后再二值化,以便简化处理;随后进行膨胀、腐蚀操作,突出轮廓、消除边框线条;“膨胀”就是对图像中的高亮部分进行扩张,让白色区域变多;“腐蚀”就是图像中的高亮部分被蚕食,让黑色区域变多;通过膨胀、腐蚀的一系列操作,可将文字区域的轮廓突出,并消除掉一些边框线条,再通过查找轮廓的方法计算出文字区域的位置出来。
文字识别模块,识别每个被切割分离的矩形框图片中的文字;
在一个优选的实施例中,利用OCR(Optical Character Recognition,光学字符识别)技术快速准确的识别出处理图图片中的文字,然后提取标准文字库中与识别出的书写文字对应的标准字体;
评分模块,对比、评测书写文字与标准文字;
在一个优选的实施例中,书写字体与标准文字的评分算法如下:
1.预处理图片,加载buffer,调用cv2.circle、cv2.copyMakeBorder、cv2.rectangle绘制结构线,寻找字体像素坐标;
2.使用cv2.cvtColor解决cv2和PIL颜色的hex码储存顺序不同的问题,然后调用ImageDraw.Draw放置标准对照字体;
3.根据条件检测像素、像素排序;
4.融合ROI,依次使用cv2.cvtColor,cv2.threshold,cv2.morphologyEx,cv2.findContours,cv2.contourArea,cv2.drawContours,cv2.copyTo等方法对图像进行一系列的膨胀腐蚀组合;
5.寻找图片的ROI,调用v2.split,cv2.cvtColor,cv2.threshold,依照评分体系(优秀、优良、及格)处理评分。在一个更为优先的实施例中,将每一组相应的文件即书写字体与对应标准字体相对比并给出评分与批注;进一步的,根据每个单独矩形框的评分给整个插入的图片评分与批注。
在另一个更为优选的实施例中,如图3所示,提供了一种微信小程序客户端,用户使用微信即可便捷地拍照、评测书写,后台调用智能识别引擎后可自动识别出文字位置,如图4所示,并逐一对文字评测,打分并反馈改进建议,如图5所示智能评测报告包含对字体的整体评价与单字评价。进一步的,相机部分使用小程序的camera标签,待用户点击拍摄时保存图片以及取景框位置,使用小程序网络API的uploadFile上传至服务器。教师可在教师端组建班级学生加入班级后,可向老师提交作业。老师收到作业后,可对学生的作业以多种形式进行评价,包括文字、语音、涂鸦。教师评价完成后,学生可立即收到教师点评并及时作出更改。待收到服务器返回的信息后,使用小程序的image和video等媒体组件进行图片展示与视频播放。
以上只通过说明的方式描述了本发明的某些示范性实施例,毋庸置疑,对于本领域的普通技术人员,在不偏离本发明的精神和范围的情况下,可以用各种不同的方式对所描述的实施例进行修正。因此,上述附图和描述在本质上是说明性的,不应理解为对本发明权利要求保护范围的限制。

Claims (10)

1.一种拍照评测的方法,包括以下步骤:
插入图片,插入学生作业本图片;
检测图片,检测插入图片的矩形框;
切割图片,切割、分离、保存、图片中的矩形框;
图片处理,处理每个被切割分离的矩形框图片;
检测文字,检测并分离每个矩形框图片中的文字;
评分,对比、评测书写文字与标准文字。
2.如权利要求1所述的拍照评测的方法,其特征在于:
所述图片为学生作业本照片;所述作业本为田格本、生字本、米格本、方格本、稿本等带有矩形框的作业本;将插入的图片存入至作业图文件夹。
3.如权利要求2所述的拍照评测的方法,其特征在于:
所述图片可以是相机拍摄的照片,也可以是bmp、jpg、png等图片格式的文件。
4.如权利要求3所述的拍照评测的方法,其特征在于:
将所述图片中的每个矩形框单独的切割分离,并将切割好的每个矩形框保存至切割文件夹。
5.如权利要求4所述的拍照评测的方法,其特征在于:
切割图片中的矩形框采用切割算法,切割算法是基于边缘检测的图像分割算法,边缘检测边缘定位准确、速度快,通过检测包含不同区域的边缘来解决分割问题,不同区域的边界上像素的灰度值变化比较剧烈,将图片从空间域通过傅里叶变换到频率域,边缘对应着高频部分。一阶微分边缘算子,利用图像在边缘处的阶跃性,即图像梯度在边缘取得极大值的特性进行边缘检测。梯度是一个矢量,它具有方向θ和模|ΔΙ|:
Figure FDA0002864188920000011
Figure FDA0002864188920000012
θ=arctan(Iу/Iχ)
梯度的方向提供了边缘的趋势信息,因为梯度方向始终是垂直于边缘方向,梯度的模值大小提供了边缘的强度信息。
6.如权利要求5所述的拍照评测的方法,其特征在于:
处理每个被切割分离的矩形框图片;选择上述切割文件夹中被切割分离的矩形框的图片,对每个被切割分离的图片进行图像预处理,图像预处理包括角度矫正和去噪;优化;再将处理好的图片保存至处理图文件夹。
7.如权利要求6所述的拍照评测的方法,其特征在于:
选择处理图文件夹中的一个矩形框文件,读取文件,查找矩形边框,去除不符合文字特点的矩形边框,将矩形框文件内的书写文字单独提取并保存为书写文字文件,再将书写文字文件保存书写文字文件夹。
8.如权利要求7所述的拍照评测的方法,其特征在于:
选择处理图文件夹中的一个文件,识别其中的文字,提取标准文字库中与识别出的书写文字对应的标准字体,并将所述标准字体保存至标准文字文件夹。
9.如权利要求8所述的拍照评测的方法,其特征在于:
书写字体与结果图的评分算法为预处理图片,加载buffer,调用cv2.circle、cv2.copyMakeBorder、cv2.rectangle绘制结构线,寻找字体像素坐标;使用cv2.cvtColor解决cv2和PIL颜色的hex码储存顺序不同的问题,然后调用ImageDraw.Draw放置标准对照字体;根据条件检测像素、像素排序;融合ROI,依次使用cv2.cvtColor,cv2.threshold,cv2.morphologyEx,cv2.findContours,cv2.contourArea,cv2.drawContours,cv2.copyTo等方法对图像进行一系列的膨胀腐蚀组合;寻找图片的ROI,调用v2.split,cv2.cvtColor,cv2.threshold,依照评分体系(优秀、优良、及格)处理评分。
10.一种拍照评测的装置,包括:
图片插入模块,插入学生作业本图片;
图片处理模块,处理学生作业本图片;
文字检测模块,检测并分离每个矩形框图片中的文字;
文字识别模块,识别每个被切割分离的矩形框图片中的文字;
评分模块,对比、评测书写文字与标准文字。
CN202011576437.1A 2020-12-28 2020-12-28 一种拍照评测的方法及装置 Pending CN112668468A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011576437.1A CN112668468A (zh) 2020-12-28 2020-12-28 一种拍照评测的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011576437.1A CN112668468A (zh) 2020-12-28 2020-12-28 一种拍照评测的方法及装置

Publications (1)

Publication Number Publication Date
CN112668468A true CN112668468A (zh) 2021-04-16

Family

ID=75410404

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011576437.1A Pending CN112668468A (zh) 2020-12-28 2020-12-28 一种拍照评测的方法及装置

Country Status (1)

Country Link
CN (1) CN112668468A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101599125A (zh) * 2009-06-11 2009-12-09 上海交通大学 复杂背景下图像处理的二值化方法
CN101833664A (zh) * 2010-04-21 2010-09-15 中国科学院自动化研究所 基于稀疏表达的视频图像文字检测方法
CN109446873A (zh) * 2018-08-27 2019-03-08 刘梅英 手写字体识别方法、系统以及终端设备
CN110298250A (zh) * 2019-05-30 2019-10-01 广东爱贝佳科技有限公司 一种书写评分及纠错方法和交互式系统
CN110473189A (zh) * 2019-08-02 2019-11-19 南通使爱智能科技有限公司 一种文本图像清晰度判断方法及系统
CN110796131A (zh) * 2019-10-31 2020-02-14 黑龙江文茁教育科技有限公司 一种汉字书写评价系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101599125A (zh) * 2009-06-11 2009-12-09 上海交通大学 复杂背景下图像处理的二值化方法
CN101833664A (zh) * 2010-04-21 2010-09-15 中国科学院自动化研究所 基于稀疏表达的视频图像文字检测方法
CN109446873A (zh) * 2018-08-27 2019-03-08 刘梅英 手写字体识别方法、系统以及终端设备
CN110298250A (zh) * 2019-05-30 2019-10-01 广东爱贝佳科技有限公司 一种书写评分及纠错方法和交互式系统
CN110473189A (zh) * 2019-08-02 2019-11-19 南通使爱智能科技有限公司 一种文本图像清晰度判断方法及系统
CN110796131A (zh) * 2019-10-31 2020-02-14 黑龙江文茁教育科技有限公司 一种汉字书写评价系统

Similar Documents

Publication Publication Date Title
US11645826B2 (en) Generating searchable text for documents portrayed in a repository of digital images utilizing orientation and text prediction neural networks
US10943105B2 (en) Document field detection and parsing
US11164027B2 (en) Deep learning based license plate identification method, device, equipment, and storage medium
US9053361B2 (en) Identifying regions of text to merge in a natural image or video frame
CN110008956B (zh) 发票关键信息定位方法、装置、计算机设备及存储介质
US11893765B2 (en) Method and apparatus for recognizing imaged information-bearing medium, computer device and medium
CN112434690A (zh) 动态解析文本图像特征现象的元素自动捕获理解方法、系统及存储介质
CN113901952A (zh) 一种基于深度学习的印刷体与手写体分开文字识别方法
CN112686257A (zh) 一种基于ocr的店头文字识别方法及系统
CN113111880A (zh) 证件图像校正方法、装置、电子设备及存储介质
CN113436222A (zh) 图像处理方法、图像处理装置、电子设备及存储介质
CN116189162A (zh) 一种船牌检测与识别方法、装置、电子设备和储存介质
CN111626145A (zh) 一种简捷有效的残缺表格识别及跨页拼接方法
CN109508716B (zh) 一种图像文字的定位方法及装置
Natei et al. Extracting text from image document and displaying its related information
CN114565927A (zh) 表格识别方法、装置、电子设备及存储介质
CN116030472A (zh) 文字坐标确定方法及装置
CN113065559B (zh) 图像比对方法、装置、电子设备及存储介质
CN112861861B (zh) 识别数码管文本的方法、装置及电子设备
CN112668468A (zh) 一种拍照评测的方法及装置
Bhaskar et al. Implementing optical character recognition on the android operating system for business cards
US10185885B2 (en) Tex line detection
CN111680691B (zh) 文字检测方法、装置、电子设备和计算机可读存储介质
CN113807343A (zh) 文字识别方法、装置、计算机设备及存储介质
CN111556251A (zh) 电子书生成方法、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination