CN112634262A

CN112634262A - 一种基于互联网的写字质量评价方法

Info

Publication number: CN112634262A
Application number: CN202011630705.3A
Authority: CN
Inventors: 孙进军; 潘勇; 于卫星
Original assignee: Zhejiang Youxue Intelligent Technology Co ltd
Current assignee: Hangzhou Rongbo Education Technology Co ltd
Priority date: 2020-12-31
Filing date: 2020-12-31
Publication date: 2021-04-09

Abstract

一种基于互联网的写字质量评价方法，所述该方法包括如下步骤：步骤一：将在田字格中的汉字进行提取，其中提取分为三种提取方式，分别为标准测评卷扫描图田字字格块提取、标准测评卷扫描图田字格字块自适应提取、标准测评卷拍照图田字格字块自适应提取，本发明通过互联网传输，通过与相关的算法达到对文字的测评，可以让用户了解自己的字体的真实情况。

Description

一种基于互联网的写字质量评价方法

技术领域

本发明涉及基于互联网的写字质量评价方法，属于互联网学习领域

背景技术

互联网学习越来越被大众知晓，更多的人开始接受互联网的学习，互联网学习的种类非常多，有直播视频学习，有回放视频学习，还有在线互动等等，这些都是比较常规的互联网学习，都是事先把视频和相关学习资料制作好就可以了，但是还有更多的互联网学习方式并未被开发，就好比互联网批改作业，互联网纠正错误，互联网写字质量评估等等。

发明内容

本发明解决了现有技术的不足，针对现有互联网的缺陷，而开发一张可以在家里就知道自己写的字有多规范的一种互联网写字质量评价方法。

本发明的目的是通过如下技术方案来完成的，一种基于互联网的写字质量评价方法，其特征在于所述该方法包括如下步骤：

步骤一：将在田字格中的汉字进行提取，其中提取分为三种提取方式，分别为标准测评卷扫描图田字字格块提取、标准测评卷扫描图田字格字块自适应提取、标准测评卷拍照图田字格字块自适应提取。

步骤二：对提取的汉字进行二值化：针对田字格字块图片，根据字块中的红色边框和虚线的RGB值，来将字块中的红色部分变为白色；其次，将字块周边的指定宽区域变为白色，以清除字块边框，最后，将字块图转为灰度图，然后根据多次实验得到的阈值对字块进行二值化得到其二值图，即去除字块中的背景，提取出汉字，该二值化阈值是固定的，针对特定的图片，得到的经验值。如从测评卷扫描图获得的田字格字块。字块的亮度较统一。

步骤三：对二值化后的汉字进行纯汉字提取：首先，针对田字格字块图片；将字块周边的指定宽区域变为白色，以清除字块边框；然后，将字块转成灰度图；在对字块灰度图进行像素直方图统计，得到像素点最多的像素值，即为字块中背景主要像素值，然后结合字块最小的像素值和按像素大小排列的前200个像素点和对应的像素，来确定提取字块中汉字去除背景的二值化阈值；此二值化阈值是自适应的，不是固定的，书写的汉字默认是黑色的，在灰度图中像素值是偏小的；灰度值为0-255，越大像素越白，越小则越黑根据计算的二值化阈值，对字块进行二值化处理，来去除字块中的背景，提取汉字，最后，清除提取出汉字中的噪点。对提取出的汉字字图，查找轮廓，将轮廓面积较小的轮廓区域视为噪点，然后将该区域的值变为白色。

步骤四；通过卷积神经网络的手写汉字识别：首先，收集手写字图建立字库；其次，确定卷积神经网络结构；然后，训练数据生成模型；测试模型的准确率；最后，使用模型识别手写字。

步骤五：对汉字进行拆分用于评分：该拆分通过轮廓法的汉字笔画拆分和骨架法的汉字笔画拆分两种拆分方法。

步骤六：对拆分后的汉字进行评分：评分标准由结构评分、形态评分、重心评分、手写汉字与标准模版字的相似度评分4种评分标准分别算出各自的分值，并且通过结构评分的80％、形态评分和重心评分各百分之10的标准进行计算总分，用标准模版字的相似度评分作为参考依据.

作为优选：所述步骤一中标准测评卷扫描图田字格字块提取方法为首先，将标准测评卷通过扫描仪设备扫描获得测评卷的图片；其次，校准扫描得到的测评图，因为测评卷放入到扫描仪设置的位置偏了或扫描仪设备本身的精确度，会造成扫描得到的测评卷图有二维旋转变形，通过对角线逼近找到测评卷书写区域的四个角点，然后使用仿射变换，校正测评卷，最后，针对校准过的测评图，根据标准测评卷中的字框区域和字块区域的坐标直接提取出田字格字块。

作为优选：所述步骤一中标准测评卷扫描图田字格字块自适应提取方法为：首先，将标准测评卷通过扫描仪设备扫描获得测评卷的图片；其次，校准扫描得到的测评图，因为测评卷放入到扫描仪设置的位置偏了或扫描仪设备本身的精确度，会造成扫描得到的测评卷图有二维旋转变形，首先将测评卷图转成灰度图，然后再将其二值化，得到测评卷的二值化黑白图，然后通过轮廓检测算法，找到字书写区域的外框，然后获得其相对于水平面的旋转角度，然后将测评卷旋转相应的角度，即完成测评卷校正，然后，针对校准过的测评图，通过轮廓检测算法，获得图片中的矩形轮廓，然后根据字书写区域的外框尺寸，筛选出书写区域的外框，然后提取出书写区域，最后，针对书写区域，将其转成灰度图，然后再将其二值化，得到其二值化黑白图，通过轮廓检测算法，获取书写区域中的所有矩形轮廓，然后根据田字格字块的实际尺寸，筛选出田字格字块的轮廓，然后根据获得的田字格字块的轮廓提取田字格字块。

作为优选：所述步骤一中标准测评卷拍照图田字格字块自适应提取方法为：首先，手机拍摄标准测评卷获得测评卷的图片；其次，校准扫描得到的测评图，因为手机摄像机硬件的不同，拍摄的角度不同，以及拍摄的环境不同，会造成拍摄得到的测评卷图存在三维畸变。必须对其进行校正，方能得到更真实的用户书写内容，首先将测评图转成灰度图，然后使用 Canny边缘检测算法得到测评卷的边缘二值图，然后通过轮廓检测算法，获得测评卷中的所有轮廓，然后根据字书写区域外框的实际尺寸，筛选出字书写区域外框轮廓，然后得到其四点坐标。最后根据得到的书写区域外框的四点坐标和实际的四点坐标，通过透视变换校准测评卷。然后，针对校准过的测评图，根据实际的字书写区域的位置和尺寸，提取出书写区域，最后，针对书写区域图，将其转成灰度图，然后使用Canny边缘检测算法得其边缘二值图，通过轮廓检测算法，获取书写区域中的所有矩形轮廓，然后根据田字格字块的实际尺寸，筛选出田字格字块的轮廓，然后根据获得的田字格字块的轮廓提取田字格字块。

作为优选：步骤五所述轮廓法的汉字笔画拆分方法为：输入的图片为白底黑字的单字图片，经过图像的平滑、去噪等预处理后获取汉字的轮廓点，由角点检测算法在轮廓点中筛选得到角点，然后对得到的角点进一步筛选得到更加精准的角点。根据各个角点的前后切矢量，对角点进行配对，然后进行笔画的拆分。

角点配对结果(三个点配对表示第一个点分别与第二、第三个点配对)如下：

[角点0，角点1，角点11]

[角点1，角点0，角点8]

[角点8，角点1，角点11]

[角点11，角点0，角点8]

[角点2，角点3，角点7]

[角点3，角点2，角点6]

[角点6，角点3，角点7]

[角点7，角点1，角点6]

[角点4，角点5]

[角点9，角点10]

从轮廓起始点开始检索，当遇到角点时需要判断跳转，然后继续检索，最终回到起始点，即：完成该笔画拆分，角点跳转时需要抛出新的点作为起始点，重复上述过程，完成该汉字所有笔画的拆分，从轮廓起始起始点开始检索，当遇到角点0时，根据当前检索方向判断跳转到角点1，然后继续检索遇到角点2，同理判断跳转到角点3，继续检索遇到角点4，直接跳转到角点5，继续检索遇到角点6，同理判断跳转到角点7，继续检索遇到角点8，同理判断跳转到角点11，继续检索遇到轮廓起始点，该笔画拆分结束。

作为优选：步骤五所述架法的汉字笔画拆分方法为：

输入的图片为白底黑字的单字图片，经过图像的平滑、去噪等预处理后，由细化算法获取该汉字的骨架图，将骨架图拆解为骨架段，然后按照笔画规则将骨架段合并得到汉字骨架笔画，然后对骨架笔画还原轮廓。

拆分过程：

1、得到的汉字

2、骨架点分类，得到交叉点和端点，端点、交叉点之间的点构成笔画段，附图中有11个笔画段，

3.笔画段合并

笔画段的合并规则：

a、合并的两个笔画段，连接点的距离小于该汉字的笔画宽度。

b、通过连接点处的局部向量判断，该两个笔画端连接是否平滑连接，

4.骨架笔画还原

骨架笔画外的轮廓点落在以骨架点为圆心、笔画宽度为半径的圆内。端点处的轮廓点闭合，连接点处的轮廓点不闭合，需要根据笔画的方向对不闭合的区域进行插值填充，最终获得该汉字的笔画。

作为优选：步骤六所述结构评分方法为：将手写字图和标准模版字图分别进行二值化处理；

1)将手写字图的有效区域放到标准模版字图中，从左到右，从上到下，一个像素的步长移动，来计算手写字和标准模版字的最大重合像素点数；

2)根据手写字和标准字最大重合像素数和标准模版字的像素点数差值，使用高斯函数计算结构分。

其中，x手写字和标准字最大重合像素数和标准模版字的像素点数差值的加权值

作为优选：步骤六所述形态评分方法为：将手写字图和标准模版字图分别进行二值化处理；

1)计算手写字和标准模版字的几何宽高；

2)分别计算手写字和标准模版字宽和高的差值

3)使用高斯函数计算手写字的宽高分。

其中，x为手写字和标准模版字宽或高的差值的加权值

最后根据手写字的宽和高的分数然后取均值，即得手写汉字的形态分。

作为优选：步骤六所述重心评分方法为：

1)将手写字图和标准模版字图分别进行二值化处理；

2)计算手写字和标准模版字的重心；

对于整个汉字的二值化图像而言，设大小为M×N的字形点阵中，黑色像素

点质量为1，白色像素点质量为0，则汉字的质量在平面上的分布表示为：

则我们可以求得该汉字点阵的重心坐标(G_x，G_y)为：

3)分别计算手写字和标准模版字宽和高的差值

4)使用高斯函数计算手写字的宽高分。

其中，x为手写字和标准模版字宽或高的差值的加权值

5)根据手写字的重心在X和Y方向上的分数，然后取均值，即得手写汉字的重心分。

作为优选：步骤六用标准模版字的相似度评分方法为：

1)将手写字图和标准模版字图分别进行二值化处理；

2)提取手写字图和标准模版字图中的汉字有效区域；

3)将手写字图和标准模版字图的有效区域切成n*n个栅格如附图所示

4)然后计算每个栅格中黑色像素点的数量，然后除以字的总像素点得到该字的n²*1结构特征向量

5)计算手写字和标准模版字的相似度

采用余弦相似度来计算手写汉字和标准模版字的特征向量的相似度

余弦相似度计算公式：

其中，x1，x2分别为标准字和手写字的栅格特征向量；

余弦相似度的范围为0到1，值越大，则两字的相似度越高。

本发明基于互联网传输，通过与相关的算法达到对文字的测评，可以让用户了解自己的字体的真实情况。

附图说明

图1为本发明角点示意图。

图2为手写字图和标准模版字图示意图

具体实施方式

下面将结合附图对本发明作详细的介绍：一种基于互联网的写字质量评价方法，所述该方法包括如下步骤：

所述步骤一中标准测评卷扫描图田字格字块提取方法为首先，将标准测评卷通过扫描仪设备扫描获得测评卷的图片；其次，校准扫描得到的测评图，因为测评卷放入到扫描仪设置的位置偏了或扫描仪设备本身的精确度，会造成扫描得到的测评卷图有二维旋转变形，通过对角线逼近找到测评卷书写区域的四个角点，然后使用仿射变换，校正测评卷，最后，针对校准过的测评图，根据标准测评卷中的字框区域和字块区域的坐标直接提取出田字格字块。

所述步骤一中标准测评卷扫描图田字格字块自适应提取方法为：首先，将标准测评卷通过扫描仪设备扫描获得测评卷的图片；其次，校准扫描得到的测评图，因为测评卷放入到扫描仪设置的位置偏了或扫描仪设备本身的精确度，会造成扫描得到的测评卷图有二维旋转变形，首先将测评卷图转成灰度图，然后再将其二值化，得到测评卷的二值化黑白图，然后通过轮廓检测算法，找到字书写区域的外框，然后获得其相对于水平面的旋转角度，然后将测评卷旋转相应的角度，即完成测评卷校正，然后，针对校准过的测评图，通过轮廓检测算法，获得图片中的矩形轮廓，然后根据字书写区域的外框尺寸，筛选出书写区域的外框，然后提取出书写区域，最后，针对书写区域，将其转成灰度图，然后再将其二值化，得到其二值化黑白图，通过轮廓检测算法，获取书写区域中的所有矩形轮廓，然后根据田字格字块的实际尺寸，筛选出田字格字块的轮廓，然后根据获得的田字格字块的轮廓提取田字格字块。

所述步骤一中标准测评卷拍照图田字格字块自适应提取方法为：首先，手机拍摄标准测评卷获得测评卷的图片；其次，校准扫描得到的测评图，因为手机摄像机硬件的不同，拍摄的角度不同，以及拍摄的环境不同，会造成拍摄得到的测评卷图存在三维畸变。必须对其进行校正，方能得到更真实的用户书写内容，首先将测评图转成灰度图，然后使用Canny边缘检测算法得到测评卷的边缘二值图，然后通过轮廓检测算法，获得测评卷中的所有轮廓，然后根据字书写区域外框的实际尺寸，筛选出字书写区域外框轮廓，然后得到其四点坐标。最后根据得到的书写区域外框的四点坐标和实际的四点坐标，通过透视变换校准测评卷。然后，针对校准过的测评图，根据实际的字书写区域的位置和尺寸，提取出书写区域，最后，针对书写区域图，将其转成灰度图，然后使用Canny边缘检测算法得其边缘二值图，通过轮廓检测算法，获取书写区域中的所有矩形轮廓，然后根据田字格字块的实际尺寸，筛选出田字格字块的轮廓，然后根据获得的田字格字块的轮廓提取田字格字块。

所述步骤五轮廓法的汉字笔画拆分方法为：输入的图片为白底黑字的单字图片，经过图像的平滑、去噪等预处理后获取汉字的轮廓点，由角点检测算法在轮廓点中筛选得到角点，然后对得到的角点进一步筛选得到更加精准的角点。根据各个角点的前后切矢量，对角点进行配对，然后进行笔画的拆分。

如图1所示：角点配对结果(三个点配对表示第一个点分别与第二、第三个点配对)如下：

[角点0，角点1，角点11]

[角点1，角点0，角点8]

[角点8，角点1，角点11]

[角点11，角点0，角点8]

[角点2，角点3，角点7]

[角点3，角点2，角点6]

[角点6，角点3，角点7]

[角点7，角点1，角点6]

[角点4，角点5]

[角点9，角点10]

所述步骤五架法的汉字笔画拆分方法为：

拆分过程：

1、得到的汉字

3.笔画段合并

笔画段的合并规则：

4.骨架笔画还原

所述步骤六结构评分方法为：将手写字图和标准模版字图分别进行二值化处理；

所述步骤六形态评分方法为：将手写字图和标准模版字图分别进行二值化处理；

1)计算手写字和标准模版字的几何宽高；

2)分别计算手写字和标准模版字宽和高的差值

3)使用高斯函数计算手写字的宽高分。

其中，x为手写字和标准模版字宽或高的差值的加权值

所述步骤六重心评分方法为：

1)将手写字图和标准模版字图分别进行二值化处理；

2)计算手写字和标准模版字的重心；

则我们可以求得该汉字点阵的重心坐标(G_x，G_y)为：

3)分别计算手写字和标准模版字宽和高的差值

4)使用高斯函数计算手写字的宽高分。

其中，x为手写字和标准模版字宽或高的差值的加权值

所述步骤六用标准模版字的相似度评分方法为：

1)将手写字图和标准模版字图分别进行二值化处理；

2)提取如图2所示手写字图和标准模版字图中的汉字有效区域；

5)计算手写字和标准模版字的相似度

余弦相似度计算公式：

其中，x1,x2分别为标准字和手写字的栅格特征向量；

余弦相似度的范围为0到1，值越大，则两字的相似度越高。

本发明采用扫描自己写的文字之后，通过拍照或扫描将字体传送至互联网中，通过服务器中的一套计算方法，计算出相关的数据，最后给用户以个具体的评分以及给出字体公认的模板相似度评分，让用户可以了解自己的不足，虽然字体的评分是一个很抽象的概念，因为每个人的字体均不相同，并且每个人对于审美也并不相同，但是通过本服务器中的卷积神经网络可以将字体通过数字的分数的形式表现出来，在与公认的模板进行比对来达到一个标准数据。

Claims

1.一种基于互联网的写字质量评价方法，其特征在于所述该方法包括如下步骤：

步骤六：对拆分后的汉字进行评分：评分标准由结构评分、形态评分、重心评分、手写汉字与标准模版字的相似度评分4种评分标准分别算出各自的分值，并且通过结构评分的80％、形态评分和重心评分各百分之10的标准进行计算总分，用标准模版字的相似度评分作为参考依据。

2.根据权利要求1所述的基于互联网的写字质量评价方法，其特征在于所述步骤一中标准测评卷扫描图田字格字块提取方法为首先，将标准测评卷通过扫描仪设备扫描获得测评卷的图片；其次，校准扫描得到的测评图，因为测评卷放入到扫描仪设置的位置偏了或扫描仪设备本身的精确度，会造成扫描得到的测评卷图有二维旋转变形，通过对角线逼近找到测评卷书写区域的四个角点，然后使用仿射变换，校正测评卷，最后，针对校准过的测评图，根据标准测评卷中的字框区域和字块区域的坐标直接提取出田字格字块。

3.根据权利要求1所述的基于互联网的写字质量评价方法，其特征在于所述步骤一中标准测评卷扫描图田字格字块自适应提取方法为：首先，将标准测评卷通过扫描仪设备扫描获得测评卷的图片；其次，校准扫描得到的测评图，因为测评卷放入到扫描仪设置的位置偏了或扫描仪设备本身的精确度，会造成扫描得到的测评卷图有二维旋转变形，首先将测评卷图转成灰度图，然后再将其二值化，得到测评卷的二值化黑白图，然后通过轮廓检测算法，找到字书写区域的外框，然后获得其相对于水平面的旋转角度，然后将测评卷旋转相应的角度，即完成测评卷校正，然后，针对校准过的测评图，通过轮廓检测算法，获得图片中的矩形轮廓，然后根据字书写区域的外框尺寸，筛选出书写区域的外框，然后提取出书写区域，最后，针对书写区域，将其转成灰度图，然后再将其二值化，得到其二值化黑白图，通过轮廓检测算法，获取书写区域中的所有矩形轮廓，然后根据田字格字块的实际尺寸，筛选出田字格字块的轮廓，然后根据获得的田字格字块的轮廓提取田字格字块。

4.根据权利要求1所述的基于互联网的写字质量评价方法，其特征在于所述步骤一中标准测评卷拍照图田字格字块自适应提取方法为：首先，手机拍摄标准测评卷获得测评卷的图片；其次，校准扫描得到的测评图，因为手机摄像机硬件的不同，拍摄的角度不同，以及拍摄的环境不同，会造成拍摄得到的测评卷图存在三维畸变。必须对其进行校正，方能得到更真实的用户书写内容，首先将测评图转成灰度图，然后使用Canny边缘检测算法得到测评卷的边缘二值图，然后通过轮廓检测算法，获得测评卷中的所有轮廓，然后根据字书写区域外框的实际尺寸，筛选出字书写区域外框轮廓，然后得到其四点坐标。最后根据得到的书写区域外框的四点坐标和实际的四点坐标，通过透视变换校准测评卷。然后，针对校准过的测评图，根据实际的字书写区域的位置和尺寸，提取出书写区域，最后，针对书写区域图，将其转成灰度图，然后使用Canny边缘检测算法得其边缘二值图，通过轮廓检测算法，获取书写区域中的所有矩形轮廓，然后根据田字格字块的实际尺寸，筛选出田字格字块的轮廓，然后根据获得的田字格字块的轮廓提取田字格字块。

5.根据权利要求1所述的基于互联网的写字质量评价方法，其特征在于所述步骤五轮廓法的汉字笔画拆分方法为：输入的图片为白底黑字的单字图片，经过图像的平滑、去噪等预处理后获取汉字的轮廓点，由角点检测算法在轮廓点中筛选得到角点，然后对得到的角点进一步筛选得到更加精准的角点。根据各个角点的前后切矢量，对角点进行配对，然后进行笔画的拆分。

[角点0，角点1，角点11]

[角点1，角点0，角点8]

[角点8，角点1，角点11]

[角点11，角点0，角点8]

[角点2，角点3，角点7]

[角点3，角点2，角点6]

[角点6，角点3，角点7]

[角点7，角点1，角点6]

[角点4，角点5]

[角点9，角点10]

6.根据权利要求1所述的基于互联网的写字质量评价方法，其特征在于所述步骤五架法的汉字笔画拆分方法为：

拆分过程：

1、得到的汉字

2、骨架点分类，得到交叉点和端点，端点、交叉点之间的点构成笔画段，下图有11个笔画段，

3.笔画段合并

笔画段的合并规则：

4.骨架笔画还原

7.根据权利要求1所述的基于互联网的写字质量评价方法，其特征在于所述步骤六结构评分方法为：将手写字图和标准模版字图分别进行二值化处理；

其中，x手写字和标准字最大重合像素数和标准模版字的像素点数差值的加权值。

8.根据权利要求1所述的基于互联网的写字质量评价方法，其特征在于所述步骤六形态评分方法为：将手写字图和标准模版字图分别进行二值化处理；

1)计算手写字和标准模版字的几何宽高；

2)分别计算手写字和标准模版字宽和高的差值

3)使用高斯函数计算手写字的宽高分。

其中，x为手写字和标准模版字宽或高的差值的加权值

9.根据权利要求1所述的基于互联网的写字质量评价方法，其特征在于所述步骤六重心评分方法为：

1)将手写字图和标准模版字图分别进行二值化处理；

2)计算手写字和标准模版字的重心；

对于整个汉字的二值化图像而言，设大小为M×N的字形点阵中，黑色像素点质量为1，白色像素点质量为0，则汉字的质量在平面上的分布表示为：

则我们可以求得该汉字点阵的重心坐标(G_x，G_y)为：

3)分别计算手写字和标准模版字宽和高的差值

4)使用高斯函数计算手写字的宽高分。

其中，x为手写字和标准模版字宽或高的差值的加权值

10.根据权利要求1所述的基于互联网的写字质量评价方法，其特征在于所述步骤六用标准模版字的相似度评分方法为：

1)将手写字图和标准模版字图分别进行二值化处理；

2)提取手写字图和标准模版字图中的汉字有效区域；

3)将手写字图和标准模版字图的有效区域切成n*n个栅格如下图所示

5)计算手写字和标准模版字的相似度

余弦相似度计算公式：

其中，x1,x2分别为标准字和手写字的栅格特征向量；

余弦相似度的范围为0到1，值越大，则两字的相似度越高。