CN112634262A - 一种基于互联网的写字质量评价方法 - Google Patents

一种基于互联网的写字质量评价方法 Download PDF

Info

Publication number
CN112634262A
CN112634262A CN202011630705.3A CN202011630705A CN112634262A CN 112634262 A CN112634262 A CN 112634262A CN 202011630705 A CN202011630705 A CN 202011630705A CN 112634262 A CN112634262 A CN 112634262A
Authority
CN
China
Prior art keywords
character
graph
block
angle
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011630705.3A
Other languages
English (en)
Inventor
孙进军
潘勇
于卫星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Rongbo Education Technology Co ltd
Original Assignee
Zhejiang Youxue Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Youxue Intelligent Technology Co ltd filed Critical Zhejiang Youxue Intelligent Technology Co ltd
Priority to CN202011630705.3A priority Critical patent/CN112634262A/zh
Publication of CN112634262A publication Critical patent/CN112634262A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06T5/80
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Abstract

一种基于互联网的写字质量评价方法,所述该方法包括如下步骤:步骤一:将在田字格中的汉字进行提取,其中提取分为三种提取方式,分别为标准测评卷扫描图田字字格块提取、标准测评卷扫描图田字格字块自适应提取、标准测评卷拍照图田字格字块自适应提取,本发明通过互联网传输,通过与相关的算法达到对文字的测评,可以让用户了解自己的字体的真实情况。

Description

一种基于互联网的写字质量评价方法
技术领域
本发明涉及基于互联网的写字质量评价方法,属于互联网学习领域
背景技术
互联网学习越来越被大众知晓,更多的人开始接受互联网的学习,互联网学习的种类非常多,有直播视频学习,有回放视频学习,还有在线互动等等,这些都是比较常规的互联网学习,都是事先把视频和相关学习资料制作好就可以了,但是还有更多的互联网学习方式并未被开发,就好比互联网批改作业,互联网纠正错误,互联网写字质量评估等等。
发明内容
本发明解决了现有技术的不足,针对现有互联网的缺陷,而开发一张可以在家里就知道自己写的字有多规范的一种互联网写字质量评价方法。
本发明的目的是通过如下技术方案来完成的,一种基于互联网的写字质量评价方法,其特征在于所述该方法包括如下步骤:
步骤一:将在田字格中的汉字进行提取,其中提取分为三种提取方式,分别为标准测评卷扫描图田字字格块提取、标准测评卷扫描图田字格字块自适应提取、标准测评卷拍照图田字格字块自适应提取。
步骤二:对提取的汉字进行二值化:针对田字格字块图片,根据字块中的红色边框和虚线的RGB值,来将字块中的红色部分变为白色;其次,将字块周边的指定宽区域变为白色,以清除字块边框,最后,将字块图转为灰度图,然后根据多次实验得到的阈值对字块进行二值化得到其二值图,即去除字块中的背景,提取出汉字,该二值化阈值是固定的,针对特定的图片,得到的经验值。如从测评卷扫描图获得的田字格字块。字块的亮度较统一。
步骤三:对二值化后的汉字进行纯汉字提取:首先,针对田字格字块图片;将字块周边的指定宽区域变为白色,以清除字块边框;然后,将字块转成灰度图;在对字块灰度图进行像素直方图统计,得到像素点最多的像素值,即为字块中背景主要像素值,然后结合字块最小的像素值和按像素大小排列的前200个像素点和对应的像素,来确定提取字块中汉字去除背景的二值化阈值;此二值化阈值是自适应的,不是固定的,书写的汉字默认是黑色的,在灰度图中像素值是偏小的;灰度值为0-255,越大像素越白,越小则越黑根据计算的二值化阈值,对字块进行二值化处理,来去除字块中的背景,提取汉字,最后,清除提取出汉字中的噪点。对提取出的汉字字图,查找轮廓,将轮廓面积较小的轮廓区域视为噪点,然后将该区域的值变为白色。
步骤四;通过卷积神经网络的手写汉字识别:首先,收集手写字图建立字库;其次,确定卷积神经网络结构;然后,训练数据生成模型;测试模型的准确率;最后,使用模型识别手写字。
步骤五:对汉字进行拆分用于评分:该拆分通过轮廓法的汉字笔画拆分和骨架法的汉字笔画拆分两种拆分方法。
步骤六:对拆分后的汉字进行评分:评分标准由结构评分、形态评分、重心评分、手写汉字与标准模版字的相似度评分4种评分标准分别算出各自的分值,并且通过结构评分的80%、形态评分和重心评分各百分之10的标准进行计算总分,用标准模版字的相似度评分作为参考依据.
作为优选:所述步骤一中标准测评卷扫描图田字格字块提取方法为首先,将标准测评卷通过扫描仪设备扫描获得测评卷的图片;其次,校准扫描得到的测评图,因为测评卷放入到扫描仪设置的位置偏了或扫描仪设备本身的精确度,会造成扫描得到的测评卷图有二维旋转变形,通过对角线逼近找到测评卷书写区域的四个角点,然后使用仿射变换,校正测评卷,最后,针对校准过的测评图,根据标准测评卷中的字框区域和字块区域的坐标直接提取出田字格字块。
作为优选:所述步骤一中标准测评卷扫描图田字格字块自适应提取方法为:首先,将标准测评卷通过扫描仪设备扫描获得测评卷的图片;其次,校准扫描得到的测评图,因为测评卷放入到扫描仪设置的位置偏了或扫描仪设备本身的精确度,会造成扫描得到的测评卷图有二维旋转变形,首先将测评卷图转成灰度图,然后再将其二值化,得到测评卷的二值化黑白图,然后通过轮廓检测算法,找到字书写区域的外框,然后获得其相对于水平面的旋转角度,然后将测评卷旋转相应的角度,即完成测评卷校正,然后,针对校准过的测评图,通过轮廓检测算法,获得图片中的矩形轮廓,然后根据字书写区域的外框尺寸,筛选出书写区域的外框,然后提取出书写区域,最后,针对书写区域,将其转成灰度图,然后再将其二值化,得到其二值化黑白图,通过轮廓检测算法,获取书写区域中的所有矩形轮廓,然后根据田字格字块的实际尺寸,筛选出田字格字块的轮廓,然后根据获得的田字格字块的轮廓提取田字格字块。
作为优选:所述步骤一中标准测评卷拍照图田字格字块自适应提取方法为:首先,手机拍摄标准测评卷获得测评卷的图片;其次,校准扫描得到的测评图,因为手机摄像机硬件的不同,拍摄的角度不同,以及拍摄的环境不同,会造成拍摄得到的测评卷图存在三维畸变。必须对其进行校正,方能得到更真实的用户书写内容,首先将测评图转成灰度图,然后使用 Canny边缘检测算法得到测评卷的边缘二值图,然后通过轮廓检测算法,获得测评卷中的所有轮廓,然后根据字书写区域外框的实际尺寸,筛选出字书写区域外框轮廓,然后得到其四点坐标。最后根据得到的书写区域外框的四点坐标和实际的四点坐标,通过透视变换校准测评卷。然后,针对校准过的测评图,根据实际的字书写区域的位置和尺寸,提取出书写区域,最后,针对书写区域图,将其转成灰度图,然后使用Canny边缘检测算法得其边缘二值图,通过轮廓检测算法,获取书写区域中的所有矩形轮廓,然后根据田字格字块的实际尺寸,筛选出田字格字块的轮廓,然后根据获得的田字格字块的轮廓提取田字格字块。
作为优选:步骤五所述轮廓法的汉字笔画拆分方法为:输入的图片为白底黑字的单字图片,经过图像的平滑、去噪等预处理后获取汉字的轮廓点,由角点检测算法在轮廓点中筛选得到角点,然后对得到的角点进一步筛选得到更加精准的角点。根据各个角点的前后切矢量,对角点进行配对,然后进行笔画的拆分。
角点配对结果(三个点配对表示第一个点分别与第二、第三个点配对)如下:
[角点0,角点1,角点11]
[角点1,角点0,角点8]
[角点8,角点1,角点11]
[角点11,角点0,角点8]
[角点2,角点3,角点7]
[角点3,角点2,角点6]
[角点6,角点3,角点7]
[角点7,角点1,角点6]
[角点4,角点5]
[角点9,角点10]
从轮廓起始点开始检索,当遇到角点时需要判断跳转,然后继续检索,最终回到起始点,即:完成该笔画拆分,角点跳转时需要抛出新的点作为起始点,重复上述过程,完成该汉字所有笔画的拆分,从轮廓起始起始点开始检索,当遇到角点0时,根据当前检索方向判断跳转到角点1,然后继续检索遇到角点2,同理判断跳转到角点3,继续检索遇到角点4,直接跳转到角点5,继续检索遇到角点6,同理判断跳转到角点7,继续检索遇到角点8,同理判断跳转到角点11,继续检索遇到轮廓起始点,该笔画拆分结束。
作为优选:步骤五所述架法的汉字笔画拆分方法为:
输入的图片为白底黑字的单字图片,经过图像的平滑、去噪等预处理后,由细化算法获取该汉字的骨架图,将骨架图拆解为骨架段,然后按照笔画规则将骨架段合并得到汉字骨架笔画,然后对骨架笔画还原轮廓。
拆分过程:
1、得到的汉字
2、骨架点分类,得到交叉点和端点,端点、交叉点之间的点构成笔画段,附图中有11个笔画段,
3.笔画段合并
笔画段的合并规则:
a、合并的两个笔画段,连接点的距离小于该汉字的笔画宽度。
b、通过连接点处的局部向量判断,该两个笔画端连接是否平滑连接,
4.骨架笔画还原
骨架笔画外的轮廓点落在以骨架点为圆心、笔画宽度为半径的圆内。端点处的轮廓点闭合,连接点处的轮廓点不闭合,需要根据笔画的方向对不闭合的区域进行插值填充,最终获得该汉字的笔画。
作为优选:步骤六所述结构评分方法为:将手写字图和标准模版字图分别进行二值化处理;
1)将手写字图的有效区域放到标准模版字图中,从左到右,从上到下,一个像素的步长移动,来计算手写字和标准模版字的最大重合像素点数;
2)根据手写字和标准字最大重合像素数和标准模版字的像素点数差值,使用高斯函数计算结构分。
Figure BDA0002874649150000041
其中,x手写字和标准字最大重合像素数和标准模版字的像素点数差值的加权值
作为优选:步骤六所述形态评分方法为:将手写字图和标准模版字图分别进行二值化处理;
1)计算手写字和标准模版字的几何宽高;
2)分别计算手写字和标准模版字宽和高的差值
3)使用高斯函数计算手写字的宽高分。
Figure 4
其中,x为手写字和标准模版字宽或高的差值的加权值
最后根据手写字的宽和高的分数然后取均值,即得手写汉字的形态分。
作为优选:步骤六所述重心评分方法为:
1)将手写字图和标准模版字图分别进行二值化处理;
2)计算手写字和标准模版字的重心;
对于整个汉字的二值化图像而言,设大小为M×N的字形点阵中,黑色像素
点质量为1,白色像素点质量为0,则汉字的质量在平面上的分布表示为:
Figure BDA0002874649150000051
则我们可以求得该汉字点阵的重心坐标(Gx,Gy)为:
Figure BDA0002874649150000052
3)分别计算手写字和标准模版字宽和高的差值
4)使用高斯函数计算手写字的宽高分。
Figure 3
其中,x为手写字和标准模版字宽或高的差值的加权值
5)根据手写字的重心在X和Y方向上的分数,然后取均值,即得手写汉字的重心分。
作为优选:步骤六用标准模版字的相似度评分方法为:
1)将手写字图和标准模版字图分别进行二值化处理;
2)提取手写字图和标准模版字图中的汉字有效区域;
3)将手写字图和标准模版字图的有效区域切成n*n个栅格如附图所示
4)然后计算每个栅格中黑色像素点的数量,然后除以字的总像素点得到该字的n2*1结构特征向量
5)计算手写字和标准模版字的相似度
采用余弦相似度来计算手写汉字和标准模版字的特征向量的相似度
余弦相似度计算公式:
Figure BDA0002874649150000054
其中,x1,x2分别为标准字和手写字的栅格特征向量;
余弦相似度的范围为0到1,值越大,则两字的相似度越高。
本发明基于互联网传输,通过与相关的算法达到对文字的测评,可以让用户了解自己的字体的真实情况。
附图说明
图1为本发明角点示意图。
图2为手写字图和标准模版字图示意图
具体实施方式
下面将结合附图对本发明作详细的介绍:一种基于互联网的写字质量评价方法,所述该方法包括如下步骤:
步骤一:将在田字格中的汉字进行提取,其中提取分为三种提取方式,分别为标准测评卷扫描图田字字格块提取、标准测评卷扫描图田字格字块自适应提取、标准测评卷拍照图田字格字块自适应提取。
步骤二:对提取的汉字进行二值化:针对田字格字块图片,根据字块中的红色边框和虚线的RGB值,来将字块中的红色部分变为白色;其次,将字块周边的指定宽区域变为白色,以清除字块边框,最后,将字块图转为灰度图,然后根据多次实验得到的阈值对字块进行二值化得到其二值图,即去除字块中的背景,提取出汉字,该二值化阈值是固定的,针对特定的图片,得到的经验值。如从测评卷扫描图获得的田字格字块。字块的亮度较统一。
步骤三:对二值化后的汉字进行纯汉字提取:首先,针对田字格字块图片;将字块周边的指定宽区域变为白色,以清除字块边框;然后,将字块转成灰度图;在对字块灰度图进行像素直方图统计,得到像素点最多的像素值,即为字块中背景主要像素值,然后结合字块最小的像素值和按像素大小排列的前200个像素点和对应的像素,来确定提取字块中汉字去除背景的二值化阈值;此二值化阈值是自适应的,不是固定的,书写的汉字默认是黑色的,在灰度图中像素值是偏小的;灰度值为0-255,越大像素越白,越小则越黑根据计算的二值化阈值,对字块进行二值化处理,来去除字块中的背景,提取汉字,最后,清除提取出汉字中的噪点。对提取出的汉字字图,查找轮廓,将轮廓面积较小的轮廓区域视为噪点,然后将该区域的值变为白色。
步骤四;通过卷积神经网络的手写汉字识别:首先,收集手写字图建立字库;其次,确定卷积神经网络结构;然后,训练数据生成模型;测试模型的准确率;最后,使用模型识别手写字。
步骤五:对汉字进行拆分用于评分:该拆分通过轮廓法的汉字笔画拆分和骨架法的汉字笔画拆分两种拆分方法。
步骤六:对拆分后的汉字进行评分:评分标准由结构评分、形态评分、重心评分、手写汉字与标准模版字的相似度评分4种评分标准分别算出各自的分值,并且通过结构评分的80%、形态评分和重心评分各百分之10的标准进行计算总分,用标准模版字的相似度评分作为参考依据.
所述步骤一中标准测评卷扫描图田字格字块提取方法为首先,将标准测评卷通过扫描仪设备扫描获得测评卷的图片;其次,校准扫描得到的测评图,因为测评卷放入到扫描仪设置的位置偏了或扫描仪设备本身的精确度,会造成扫描得到的测评卷图有二维旋转变形,通过对角线逼近找到测评卷书写区域的四个角点,然后使用仿射变换,校正测评卷,最后,针对校准过的测评图,根据标准测评卷中的字框区域和字块区域的坐标直接提取出田字格字块。
所述步骤一中标准测评卷扫描图田字格字块自适应提取方法为:首先,将标准测评卷通过扫描仪设备扫描获得测评卷的图片;其次,校准扫描得到的测评图,因为测评卷放入到扫描仪设置的位置偏了或扫描仪设备本身的精确度,会造成扫描得到的测评卷图有二维旋转变形,首先将测评卷图转成灰度图,然后再将其二值化,得到测评卷的二值化黑白图,然后通过轮廓检测算法,找到字书写区域的外框,然后获得其相对于水平面的旋转角度,然后将测评卷旋转相应的角度,即完成测评卷校正,然后,针对校准过的测评图,通过轮廓检测算法,获得图片中的矩形轮廓,然后根据字书写区域的外框尺寸,筛选出书写区域的外框,然后提取出书写区域,最后,针对书写区域,将其转成灰度图,然后再将其二值化,得到其二值化黑白图,通过轮廓检测算法,获取书写区域中的所有矩形轮廓,然后根据田字格字块的实际尺寸,筛选出田字格字块的轮廓,然后根据获得的田字格字块的轮廓提取田字格字块。
所述步骤一中标准测评卷拍照图田字格字块自适应提取方法为:首先,手机拍摄标准测评卷获得测评卷的图片;其次,校准扫描得到的测评图,因为手机摄像机硬件的不同,拍摄的角度不同,以及拍摄的环境不同,会造成拍摄得到的测评卷图存在三维畸变。必须对其进行校正,方能得到更真实的用户书写内容,首先将测评图转成灰度图,然后使用Canny边缘检测算法得到测评卷的边缘二值图,然后通过轮廓检测算法,获得测评卷中的所有轮廓,然后根据字书写区域外框的实际尺寸,筛选出字书写区域外框轮廓,然后得到其四点坐标。最后根据得到的书写区域外框的四点坐标和实际的四点坐标,通过透视变换校准测评卷。然后,针对校准过的测评图,根据实际的字书写区域的位置和尺寸,提取出书写区域,最后,针对书写区域图,将其转成灰度图,然后使用Canny边缘检测算法得其边缘二值图,通过轮廓检测算法,获取书写区域中的所有矩形轮廓,然后根据田字格字块的实际尺寸,筛选出田字格字块的轮廓,然后根据获得的田字格字块的轮廓提取田字格字块。
所述步骤五轮廓法的汉字笔画拆分方法为:输入的图片为白底黑字的单字图片,经过图像的平滑、去噪等预处理后获取汉字的轮廓点,由角点检测算法在轮廓点中筛选得到角点,然后对得到的角点进一步筛选得到更加精准的角点。根据各个角点的前后切矢量,对角点进行配对,然后进行笔画的拆分。
如图1所示:角点配对结果(三个点配对表示第一个点分别与第二、第三个点配对)如下:
[角点0,角点1,角点11]
[角点1,角点0,角点8]
[角点8,角点1,角点11]
[角点11,角点0,角点8]
[角点2,角点3,角点7]
[角点3,角点2,角点6]
[角点6,角点3,角点7]
[角点7,角点1,角点6]
[角点4,角点5]
[角点9,角点10]
从轮廓起始点开始检索,当遇到角点时需要判断跳转,然后继续检索,最终回到起始点,即:完成该笔画拆分,角点跳转时需要抛出新的点作为起始点,重复上述过程,完成该汉字所有笔画的拆分,从轮廓起始起始点开始检索,当遇到角点0时,根据当前检索方向判断跳转到角点1,然后继续检索遇到角点2,同理判断跳转到角点3,继续检索遇到角点4,直接跳转到角点5,继续检索遇到角点6,同理判断跳转到角点7,继续检索遇到角点8,同理判断跳转到角点11,继续检索遇到轮廓起始点,该笔画拆分结束。
所述步骤五架法的汉字笔画拆分方法为:
输入的图片为白底黑字的单字图片,经过图像的平滑、去噪等预处理后,由细化算法获取该汉字的骨架图,将骨架图拆解为骨架段,然后按照笔画规则将骨架段合并得到汉字骨架笔画,然后对骨架笔画还原轮廓。
拆分过程:
1、得到的汉字
2、骨架点分类,得到交叉点和端点,端点、交叉点之间的点构成笔画段,附图中有11个笔画段,
3.笔画段合并
笔画段的合并规则:
a、合并的两个笔画段,连接点的距离小于该汉字的笔画宽度。
b、通过连接点处的局部向量判断,该两个笔画端连接是否平滑连接,
4.骨架笔画还原
骨架笔画外的轮廓点落在以骨架点为圆心、笔画宽度为半径的圆内。端点处的轮廓点闭合,连接点处的轮廓点不闭合,需要根据笔画的方向对不闭合的区域进行插值填充,最终获得该汉字的笔画。
所述步骤六结构评分方法为:将手写字图和标准模版字图分别进行二值化处理;
1)将手写字图的有效区域放到标准模版字图中,从左到右,从上到下,一个像素的步长移动,来计算手写字和标准模版字的最大重合像素点数;
2)根据手写字和标准字最大重合像素数和标准模版字的像素点数差值,使用高斯函数计算结构分。
Figure BDA0002874649150000091
其中,x手写字和标准字最大重合像素数和标准模版字的像素点数差值的加权值
所述步骤六形态评分方法为:将手写字图和标准模版字图分别进行二值化处理;
1)计算手写字和标准模版字的几何宽高;
2)分别计算手写字和标准模版字宽和高的差值
3)使用高斯函数计算手写字的宽高分。
Figure 100002_2
其中,x为手写字和标准模版字宽或高的差值的加权值
最后根据手写字的宽和高的分数然后取均值,即得手写汉字的形态分。
所述步骤六重心评分方法为:
1)将手写字图和标准模版字图分别进行二值化处理;
2)计算手写字和标准模版字的重心;
对于整个汉字的二值化图像而言,设大小为M×N的字形点阵中,黑色像素
点质量为1,白色像素点质量为0,则汉字的质量在平面上的分布表示为:
Figure BDA0002874649150000093
则我们可以求得该汉字点阵的重心坐标(Gx,Gy)为:
Figure BDA0002874649150000094
3)分别计算手写字和标准模版字宽和高的差值
4)使用高斯函数计算手写字的宽高分。
Figure 100002_1
其中,x为手写字和标准模版字宽或高的差值的加权值
5)根据手写字的重心在X和Y方向上的分数,然后取均值,即得手写汉字的重心分。
所述步骤六用标准模版字的相似度评分方法为:
1)将手写字图和标准模版字图分别进行二值化处理;
2)提取如图2所示手写字图和标准模版字图中的汉字有效区域;
3)将手写字图和标准模版字图的有效区域切成n*n个栅格如附图所示
4)然后计算每个栅格中黑色像素点的数量,然后除以字的总像素点得到该字的n2*1结构特征向量
5)计算手写字和标准模版字的相似度
采用余弦相似度来计算手写汉字和标准模版字的特征向量的相似度
余弦相似度计算公式:
Figure BDA0002874649150000102
其中,x1,x2分别为标准字和手写字的栅格特征向量;
余弦相似度的范围为0到1,值越大,则两字的相似度越高。
本发明采用扫描自己写的文字之后,通过拍照或扫描将字体传送至互联网中,通过服务器中的一套计算方法,计算出相关的数据,最后给用户以个具体的评分以及给出字体公认的模板相似度评分,让用户可以了解自己的不足,虽然字体的评分是一个很抽象的概念,因为每个人的字体均不相同,并且每个人对于审美也并不相同,但是通过本服务器中的卷积神经网络可以将字体通过数字的分数的形式表现出来,在与公认的模板进行比对来达到一个标准数据。

Claims (10)

1.一种基于互联网的写字质量评价方法,其特征在于所述该方法包括如下步骤:
步骤一:将在田字格中的汉字进行提取,其中提取分为三种提取方式,分别为标准测评卷扫描图田字字格块提取、标准测评卷扫描图田字格字块自适应提取、标准测评卷拍照图田字格字块自适应提取。
步骤二:对提取的汉字进行二值化:针对田字格字块图片,根据字块中的红色边框和虚线的RGB值,来将字块中的红色部分变为白色;其次,将字块周边的指定宽区域变为白色,以清除字块边框,最后,将字块图转为灰度图,然后根据多次实验得到的阈值对字块进行二值化得到其二值图,即去除字块中的背景,提取出汉字,该二值化阈值是固定的,针对特定的图片,得到的经验值。如从测评卷扫描图获得的田字格字块。字块的亮度较统一。
步骤三:对二值化后的汉字进行纯汉字提取:首先,针对田字格字块图片;将字块周边的指定宽区域变为白色,以清除字块边框;然后,将字块转成灰度图;在对字块灰度图进行像素直方图统计,得到像素点最多的像素值,即为字块中背景主要像素值,然后结合字块最小的像素值和按像素大小排列的前200个像素点和对应的像素,来确定提取字块中汉字去除背景的二值化阈值;此二值化阈值是自适应的,不是固定的,书写的汉字默认是黑色的,在灰度图中像素值是偏小的;灰度值为0-255,越大像素越白,越小则越黑根据计算的二值化阈值,对字块进行二值化处理,来去除字块中的背景,提取汉字,最后,清除提取出汉字中的噪点。对提取出的汉字字图,查找轮廓,将轮廓面积较小的轮廓区域视为噪点,然后将该区域的值变为白色。
步骤四;通过卷积神经网络的手写汉字识别:首先,收集手写字图建立字库;其次,确定卷积神经网络结构;然后,训练数据生成模型;测试模型的准确率;最后,使用模型识别手写字。
步骤五:对汉字进行拆分用于评分:该拆分通过轮廓法的汉字笔画拆分和骨架法的汉字笔画拆分两种拆分方法。
步骤六:对拆分后的汉字进行评分:评分标准由结构评分、形态评分、重心评分、手写汉字与标准模版字的相似度评分4种评分标准分别算出各自的分值,并且通过结构评分的80%、形态评分和重心评分各百分之10的标准进行计算总分,用标准模版字的相似度评分作为参考依据。
2.根据权利要求1所述的基于互联网的写字质量评价方法,其特征在于所述步骤一中标准测评卷扫描图田字格字块提取方法为首先,将标准测评卷通过扫描仪设备扫描获得测评卷的图片;其次,校准扫描得到的测评图,因为测评卷放入到扫描仪设置的位置偏了或扫描仪设备本身的精确度,会造成扫描得到的测评卷图有二维旋转变形,通过对角线逼近找到测评卷书写区域的四个角点,然后使用仿射变换,校正测评卷,最后,针对校准过的测评图,根据标准测评卷中的字框区域和字块区域的坐标直接提取出田字格字块。
3.根据权利要求1所述的基于互联网的写字质量评价方法,其特征在于所述步骤一中标准测评卷扫描图田字格字块自适应提取方法为:首先,将标准测评卷通过扫描仪设备扫描获得测评卷的图片;其次,校准扫描得到的测评图,因为测评卷放入到扫描仪设置的位置偏了或扫描仪设备本身的精确度,会造成扫描得到的测评卷图有二维旋转变形,首先将测评卷图转成灰度图,然后再将其二值化,得到测评卷的二值化黑白图,然后通过轮廓检测算法,找到字书写区域的外框,然后获得其相对于水平面的旋转角度,然后将测评卷旋转相应的角度,即完成测评卷校正,然后,针对校准过的测评图,通过轮廓检测算法,获得图片中的矩形轮廓,然后根据字书写区域的外框尺寸,筛选出书写区域的外框,然后提取出书写区域,最后,针对书写区域,将其转成灰度图,然后再将其二值化,得到其二值化黑白图,通过轮廓检测算法,获取书写区域中的所有矩形轮廓,然后根据田字格字块的实际尺寸,筛选出田字格字块的轮廓,然后根据获得的田字格字块的轮廓提取田字格字块。
4.根据权利要求1所述的基于互联网的写字质量评价方法,其特征在于所述步骤一中标准测评卷拍照图田字格字块自适应提取方法为:首先,手机拍摄标准测评卷获得测评卷的图片;其次,校准扫描得到的测评图,因为手机摄像机硬件的不同,拍摄的角度不同,以及拍摄的环境不同,会造成拍摄得到的测评卷图存在三维畸变。必须对其进行校正,方能得到更真实的用户书写内容,首先将测评图转成灰度图,然后使用Canny边缘检测算法得到测评卷的边缘二值图,然后通过轮廓检测算法,获得测评卷中的所有轮廓,然后根据字书写区域外框的实际尺寸,筛选出字书写区域外框轮廓,然后得到其四点坐标。最后根据得到的书写区域外框的四点坐标和实际的四点坐标,通过透视变换校准测评卷。然后,针对校准过的测评图,根据实际的字书写区域的位置和尺寸,提取出书写区域,最后,针对书写区域图,将其转成灰度图,然后使用Canny边缘检测算法得其边缘二值图,通过轮廓检测算法,获取书写区域中的所有矩形轮廓,然后根据田字格字块的实际尺寸,筛选出田字格字块的轮廓,然后根据获得的田字格字块的轮廓提取田字格字块。
5.根据权利要求1所述的基于互联网的写字质量评价方法,其特征在于所述步骤五轮廓法的汉字笔画拆分方法为:输入的图片为白底黑字的单字图片,经过图像的平滑、去噪等预处理后获取汉字的轮廓点,由角点检测算法在轮廓点中筛选得到角点,然后对得到的角点进一步筛选得到更加精准的角点。根据各个角点的前后切矢量,对角点进行配对,然后进行笔画的拆分。
角点配对结果(三个点配对表示第一个点分别与第二、第三个点配对)如下:
[角点0,角点1,角点11]
[角点1,角点0,角点8]
[角点8,角点1,角点11]
[角点11,角点0,角点8]
[角点2,角点3,角点7]
[角点3,角点2,角点6]
[角点6,角点3,角点7]
[角点7,角点1,角点6]
[角点4,角点5]
[角点9,角点10]
从轮廓起始点开始检索,当遇到角点时需要判断跳转,然后继续检索,最终回到起始点,即:完成该笔画拆分,角点跳转时需要抛出新的点作为起始点,重复上述过程,完成该汉字所有笔画的拆分,从轮廓起始起始点开始检索,当遇到角点0时,根据当前检索方向判断跳转到角点1,然后继续检索遇到角点2,同理判断跳转到角点3,继续检索遇到角点4,直接跳转到角点5,继续检索遇到角点6,同理判断跳转到角点7,继续检索遇到角点8,同理判断跳转到角点11,继续检索遇到轮廓起始点,该笔画拆分结束。
6.根据权利要求1所述的基于互联网的写字质量评价方法,其特征在于所述步骤五架法的汉字笔画拆分方法为:
输入的图片为白底黑字的单字图片,经过图像的平滑、去噪等预处理后,由细化算法获取该汉字的骨架图,将骨架图拆解为骨架段,然后按照笔画规则将骨架段合并得到汉字骨架笔画,然后对骨架笔画还原轮廓。
拆分过程:
1、得到的汉字
2、骨架点分类,得到交叉点和端点,端点、交叉点之间的点构成笔画段,下图有11个笔画段,
3.笔画段合并
笔画段的合并规则:
a、合并的两个笔画段,连接点的距离小于该汉字的笔画宽度。
b、通过连接点处的局部向量判断,该两个笔画端连接是否平滑连接,
4.骨架笔画还原
骨架笔画外的轮廓点落在以骨架点为圆心、笔画宽度为半径的圆内。端点处的轮廓点闭合,连接点处的轮廓点不闭合,需要根据笔画的方向对不闭合的区域进行插值填充,最终获得该汉字的笔画。
7.根据权利要求1所述的基于互联网的写字质量评价方法,其特征在于所述步骤六结构评分方法为:将手写字图和标准模版字图分别进行二值化处理;
1)将手写字图的有效区域放到标准模版字图中,从左到右,从上到下,一个像素的步长移动,来计算手写字和标准模版字的最大重合像素点数;
2)根据手写字和标准字最大重合像素数和标准模版字的像素点数差值,使用高斯函数计算结构分。
Figure FDA0002874649140000043
其中,x手写字和标准字最大重合像素数和标准模版字的像素点数差值的加权值。
8.根据权利要求1所述的基于互联网的写字质量评价方法,其特征在于所述步骤六形态评分方法为:将手写字图和标准模版字图分别进行二值化处理;
1)计算手写字和标准模版字的几何宽高;
2)分别计算手写字和标准模版字宽和高的差值
3)使用高斯函数计算手写字的宽高分。
Figure 1
其中,x为手写字和标准模版字宽或高的差值的加权值
最后根据手写字的宽和高的分数然后取均值,即得手写汉字的形态分。
9.根据权利要求1所述的基于互联网的写字质量评价方法,其特征在于所述步骤六重心评分方法为:
1)将手写字图和标准模版字图分别进行二值化处理;
2)计算手写字和标准模版字的重心;
对于整个汉字的二值化图像而言,设大小为M×N的字形点阵中,黑色像素点质量为1,白色像素点质量为0,则汉字的质量在平面上的分布表示为:
Figure FDA0002874649140000041
则我们可以求得该汉字点阵的重心坐标(Gx,Gy)为:
Figure FDA0002874649140000042
3)分别计算手写字和标准模版字宽和高的差值
4)使用高斯函数计算手写字的宽高分。
Figure 2
其中,x为手写字和标准模版字宽或高的差值的加权值
5)根据手写字的重心在X和Y方向上的分数,然后取均值,即得手写汉字的重心分。
10.根据权利要求1所述的基于互联网的写字质量评价方法,其特征在于所述步骤六用标准模版字的相似度评分方法为:
1)将手写字图和标准模版字图分别进行二值化处理;
2)提取手写字图和标准模版字图中的汉字有效区域;
3)将手写字图和标准模版字图的有效区域切成n*n个栅格如下图所示
4)然后计算每个栅格中黑色像素点的数量,然后除以字的总像素点得到该字的n2*1结构特征向量
5)计算手写字和标准模版字的相似度
采用余弦相似度来计算手写汉字和标准模版字的特征向量的相似度
余弦相似度计算公式:
Figure FDA0002874649140000051
其中,x1,x2分别为标准字和手写字的栅格特征向量;
余弦相似度的范围为0到1,值越大,则两字的相似度越高。
CN202011630705.3A 2020-12-31 2020-12-31 一种基于互联网的写字质量评价方法 Pending CN112634262A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011630705.3A CN112634262A (zh) 2020-12-31 2020-12-31 一种基于互联网的写字质量评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011630705.3A CN112634262A (zh) 2020-12-31 2020-12-31 一种基于互联网的写字质量评价方法

Publications (1)

Publication Number Publication Date
CN112634262A true CN112634262A (zh) 2021-04-09

Family

ID=75290293

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011630705.3A Pending CN112634262A (zh) 2020-12-31 2020-12-31 一种基于互联网的写字质量评价方法

Country Status (1)

Country Link
CN (1) CN112634262A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113901936A (zh) * 2021-10-19 2022-01-07 中国科学院自动化研究所 硬笔书法田字格切片图像提取方法、系统、设备
CN115909369A (zh) * 2023-02-15 2023-04-04 南京信息工程大学 一种汉字字体二值化切片图像的提取方法及系统
CN116012860A (zh) * 2022-12-29 2023-04-25 华南师范大学 一种基于图像识别的教师板书设计水平诊断方法及装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101295371A (zh) * 2008-04-18 2008-10-29 浙江大学 一种汉字书写形态美观度的计算机评估方法
CN102426649A (zh) * 2011-10-13 2012-04-25 石家庄开发区冀科双实科技有限公司 一种简单的高准确率的钢印数字自动识别方法
CN104966096A (zh) * 2015-06-10 2015-10-07 南京师范大学 一种基于重要书写特征标注的手写汉字工整性评价方法
CN107609558A (zh) * 2017-09-13 2018-01-19 北京元心科技有限公司 文字图像处理方法及装置
KR20180065889A (ko) * 2016-12-07 2018-06-18 삼성전자주식회사 타겟의 검측 방법 및 장치
CN109543777A (zh) * 2018-11-28 2019-03-29 中国科学院自动化研究所 手写汉字书写质量评价方法及系统
WO2019232850A1 (zh) * 2018-06-04 2019-12-12 平安科技(深圳)有限公司 手写汉字图像识别方法、装置、计算机设备及存储介质
CN111340810A (zh) * 2020-05-21 2020-06-26 深圳市儿童医院 一种汉字书写质量智能评价方法
CN111738141A (zh) * 2020-06-19 2020-10-02 首都师范大学 一种硬笔书法作品评判方法
CN111881310A (zh) * 2019-12-07 2020-11-03 杭州华冬人工智能有限公司 一种汉字硬笔书写智能指导和评分方法及指导评分系统

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101295371A (zh) * 2008-04-18 2008-10-29 浙江大学 一种汉字书写形态美观度的计算机评估方法
CN102426649A (zh) * 2011-10-13 2012-04-25 石家庄开发区冀科双实科技有限公司 一种简单的高准确率的钢印数字自动识别方法
CN104966096A (zh) * 2015-06-10 2015-10-07 南京师范大学 一种基于重要书写特征标注的手写汉字工整性评价方法
KR20180065889A (ko) * 2016-12-07 2018-06-18 삼성전자주식회사 타겟의 검측 방법 및 장치
CN107609558A (zh) * 2017-09-13 2018-01-19 北京元心科技有限公司 文字图像处理方法及装置
WO2019232850A1 (zh) * 2018-06-04 2019-12-12 平安科技(深圳)有限公司 手写汉字图像识别方法、装置、计算机设备及存储介质
CN109543777A (zh) * 2018-11-28 2019-03-29 中国科学院自动化研究所 手写汉字书写质量评价方法及系统
CN111881310A (zh) * 2019-12-07 2020-11-03 杭州华冬人工智能有限公司 一种汉字硬笔书写智能指导和评分方法及指导评分系统
CN111340810A (zh) * 2020-05-21 2020-06-26 深圳市儿童医院 一种汉字书写质量智能评价方法
CN111738141A (zh) * 2020-06-19 2020-10-02 首都师范大学 一种硬笔书法作品评判方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王求真, 计算机工程与应用 *
王求真: "汉字书写质量的模糊分析方法", COMPUTER ENGINEERING AND APPLICATIONS, vol. 49, no. 21, pages 3 - 5 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113901936A (zh) * 2021-10-19 2022-01-07 中国科学院自动化研究所 硬笔书法田字格切片图像提取方法、系统、设备
CN116012860A (zh) * 2022-12-29 2023-04-25 华南师范大学 一种基于图像识别的教师板书设计水平诊断方法及装置
CN116012860B (zh) * 2022-12-29 2024-01-16 华南师范大学 一种基于图像识别的教师板书设计水平诊断方法及装置
CN115909369A (zh) * 2023-02-15 2023-04-04 南京信息工程大学 一种汉字字体二值化切片图像的提取方法及系统

Similar Documents

Publication Publication Date Title
CN112634262A (zh) 一种基于互联网的写字质量评价方法
US11830230B2 (en) Living body detection method based on facial recognition, and electronic device and storage medium
CN105678806B (zh) 一种基于Fisher判别的生猪行为轨迹自动跟踪方法
CN110348263B (zh) 一种基于图像识别的二维随机码图像识别与提取方法
CN105335725A (zh) 一种基于特征融合的步态识别身份认证方法
JPH0737103A (ja) 傾き角度検出装置
CN110032983B (zh) 一种基于orb特征提取和flann快速匹配的轨迹识别方法
CN116664559B (zh) 基于机器视觉的内存条损伤快速检测方法
CN114863492B (zh) 一种低质量指纹图像的修复方法及修复装置
CN106682670B (zh) 一种台标识别方法及系统
CN111783773A (zh) 一种面向角度倾斜电线杆标识牌的矫正方法
CN111027637A (zh) 一种文字检测方法及计算机可读存储介质
CN115049689A (zh) 一种基于轮廓检测技术的乒乓球识别方法
CN109344758B (zh) 基于改进局部二值模式的人脸识别方法
CN113688846A (zh) 物体尺寸识别方法、可读存储介质及物体尺寸识别系统
CN112435283A (zh) 图像的配准方法、电子设备以及计算机可读存储介质
CN109063774B (zh) 图像追踪效果评价方法、装置、设备及可读存储介质
CN113643290B (zh) 一种基于图像处理的吸管计数方法、装置及存储介质
CN115222652A (zh) 一种成捆钢筋端面的识别计数及中心定位方法与其存储器
CN115880566A (zh) 一种基于视觉分析的智能阅卷系统
CN113469216B (zh) 零售终端海报识别与完整性判断方法、系统及存储介质
CN112364835B (zh) 视频信息取帧方法、装置、设备及存储介质
CN111445540B (zh) 一种用于rgb有色三维点云的自动配准方法
CN114820707A (zh) 一种用于摄像头目标自动追踪的计算方法
CN112785550A (zh) 图像质量值确定方法、装置、存储介质及电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230103

Address after: 311100 Room 1201, Building A, Zhengyuan Smart Building, No. 359, Shuxin Road, Cangqian Street, Yuhang District, Hangzhou City, Zhejiang Province

Applicant after: Hangzhou Rongbo Education Technology Co.,Ltd.

Address before: 313200 14th floor, chip technology building, building 2, No. 707, Quyuan South Road, Wuyang street, Deqing County, Huzhou City, Zhejiang Province

Applicant before: Zhejiang Youxue Intelligent Technology Co.,Ltd.

TA01 Transfer of patent application right