CN111461019A

CN111461019A - 一种汉字书写质量的评价方法、系统及设备

Info

Publication number: CN111461019A
Application number: CN202010251942.2A
Authority: CN
Inventors: 米红丹
Original assignee: Heilongjiang Wenzhuo Education Technology Co ltd
Current assignee: Heilongjiang Wenzhuo Education Technology Co ltd
Priority date: 2020-04-01
Filing date: 2020-04-01
Publication date: 2020-07-28
Anticipated expiration: 2040-04-01
Also published as: CN111461019B

Abstract

一种汉字书写质量的评价方法、系统及设备，属于计算机技术领域。为了解决现有的汉字质量评价方法存在缺乏客观性、缺乏可量化的评价标准的问题，以及不能兼顾效率和成本的问题。本发明首先采集书写汉字的图像，然后对图像中的汉字进行识别，然后在确定需要对比的标准书体字形中提取出标准汉字，将识别汉字和标准汉字进行调整和掩模处理，并通过笔画像素和空白像素得到得分系数特征，最后利用得分系数特征对字书写质量进行评价。主要用于书写汉字的质量评价。

Description

一种汉字书写质量的评价方法、系统及设备

技术领域

本发明属于计算机技术领域，具体涉及汉字书写评价的方法、系统。

背景技术

中国书法，能集中体现一个人的精神气质、文化修养等总体素质。无论是单字成幅或多字组合成幅，对于运笔的力度，起、承、转、合、收笔等技术的掌握配合，都必须适宜得当，恰到好处。中国书法以汉字书写形式得以呈现，主要包括楷书、行书等书体。在人们照着某种书体的汉字练字时，基本上都是按照字帖进行练习的。为了明确练习效果或者跟踪人们的进步程度，都需要对书写质量进行质量评价，主要是得分评价。

无论是“硬笔”书法的联系，还是“软笔”书法的练习，目前的汉字书写质量大都是人为进行评价的，即通过认为对书写的质量进行主观评价并打分，虽然能够实现对书写汉字的质量进行评价，但是这些评价都是基于评价者主观对书写的笔画形态、整体形态进行评判打分的，不仅缺乏一定的客观性，也缺乏可量化的评价标准。这样导致不同的评价者对同一个人的书写质量进行评价时，仅能够得到大致的评价一致性，例如都是认为写的比较不错，但是其量化形式的得分结论都不能一致，如甲可能给到80分，但是乙极有可能给出60分，这中质量评价受到评价者自身的水平限制，尤其是评价者的水平不是特别高时，这种评价不一致性越发明显。同时，这种评价方式没有办法稳定评价书写质量的进步属性，例如一个人一直在甲评价下的进步是能够明确的，但是一旦因为某些原因更换为乙进行评价时，其与之前的参照就可能失去一定的参照价值，这种参照并不是由于书写质量在客观性确定的，而是由于乙自身对某些汉字具有的形态上的认知导致的。所以如何对书写质量进行客观的评价，以及如何量化评价标准成为汉字书写评价中的难题。

这种人工评价的方式也存在不能逐字评价的问题或需要花费大量的时间的问题，一般书写人会写一篇汉字然后交给评价者进行评价，这样一般是评价人对字的整体进行质量评价，比如给到80分，其而不是对每个字进行评价，比如A字给了90分(写的很好)，B字给了60分(及格)，……，所以这种整体评价不能给出哪些字(或哪些结构的字)写的好、哪些字(或哪些结构的字)有待于加强的指导，很大程度上失去了书写质量的评价意义。可以要求评价者进行逐字评价，但是这种评价方法不仅会花费大量的时间，导致效率非常低，而且还会花费巨大的人力；不能兼顾效率和成本的问题。

随着人工智能和深度学习技术的发展，也可以利用深度学习的技术来对汉字书写进行评价。即采集大量的书写样本，然后人为进行分值标记，然后训练模型最终将模型用于汉字书写质量的预测，这种方式虽然能够提高效率，降低成本，但是由于其训练过程的样本依然需要人为进行打分，仍然存在上述缺乏客观性、缺乏可量化的评价标准等其他问题。

发明内容

本发明为了解决现有的汉字质量评价方法存在缺乏客观性、缺乏可量化的评价标准的问题，以及不能兼顾效率和成本的问题。

一种汉字书写质量的评价方法，包括以下步骤：

S1、采集书写汉字的图像；

S2、将采集的图像调整到固定大小；

S3、根据预处理后的图像对文字进行定位；

S4、对定位后的汉字进行识别，得到识别汉字；

S5、确定需要对比的标准书体字形；

S6、根据识别汉字对应的每个具体汉字，在确定需要对比的标准书体字形中提取出相应的汉字，得到标准汉字；

S7、确定识别汉字的最小外接矩形框和标准汉字的最小外接矩形框，调整两个最小外接矩形框，使两个最小外接矩形框大小相等，分别得到调整大小后的识别汉字和标准汉字；

S8、将调整大小后的识别汉字作为掩模，利用掩模掩蔽标准汉字，调整掩模掩蔽角度并计算掩模与标准汉字的重叠区域像素的覆盖面积，将覆盖面积最大的掩蔽状态记为最佳相似状态；直接将标准汉字的最小外接矩形框作为最佳相似状态对应的最小外接矩形框；

S9、针对调整大小后的标准汉字对应的图像，计算标准汉字书写笔画所占像素点总数P_s；并计算最小外接矩形框内每行像素点中空白像素的总数

i表示最小外接矩形框内每行像素的序号；

同时，针对最佳相似状态对应的图像，计算最佳相似状态下全部笔画所占像素点总数P_t；并计算最小外接矩形框内每行像素点中空白像素的总数

进而确定得分系数特征

S10、利用得分系数特征对字书写质量进行评价。

一种汉字书写质量的评价系统，包括：

图像采集模块：采集书写汉字的图像；

图像预处理单元：将采集的图像调整到固定大小；

文字定位模块：根据预处理后的图像对文字进行定位；

文字识别模块：对定位后的汉字进行识别，得到识别汉字；

书体字形确定模块：确定需要对比的标准书体字形；

标准汉字选择模块：根据识别汉字对应的每个具体汉字，在确定需要对比的标准书体字形中提取出相应的汉字，得到标准汉字；

汉字调整模块：确定识别汉字的最小外接矩形框和标准汉字的最小外接矩形框，调整两个最小外接矩形框，使两个最小外接矩形框大小相等，分别得到调整大小后的识别汉字和标准汉字；

相似状态确定模块：将调整大小后的识别汉字作为掩模，利用掩模掩蔽标准汉字，调整掩模掩蔽角度并计算掩模与标准汉字的重叠区域像素的覆盖面积，将覆盖面积最大的掩蔽状态记为最佳相似状态；直接将标准汉字的最小外接矩形框作为最佳相似状态对应的最小外接矩形框；

得分系数确定模块：针对调整大小后的标准汉字对应的图像，计算标准汉字书写笔画所占像素点总数P_s；并计算最小外接矩形框内每行像素点中空白像素的总数

i表示最小外接矩形框内每行像素的序号；

进而确定得分系数特征

评价模块：利用得分系数特征对字书写质量进行评价。

本发明的有益效果是：

利用本发明进行汉字质量的评价，完全是按照书写质量与标准字形之间的相似性和差异进行判断，不仅评价客观，完全不依赖于评价者的经验，而且相比其他方式的评价，本发明的评价更加准确。同时，本发明还可以一次性将全部书写的汉字进行评价，效率高，相比人工逐字评价，效率成数百倍的提升，随着单页书写汉字的增多，效率的特征更加明显；而且利用本发明可以评价每个字，使得用户能够知道究竟哪些字/哪些结构的字写的好，或者写的不好，存在较大差距，需要以后有针对性的练习。所以本发明能够兼顾客观性、准确性和效率，并且使用起来方便，相比人工方式，成本也较低。

还有就是利用本发明可以针对于某个用户跟踪学习，每次都能够知道哪些字是有进步的，而且这种情况不依赖于不同评价者而不同，始终具有客观性和唯一标准，更能够体现书写质量的评价意义，这是现有技术完全做不到的。

附图说明

图1为darknet-53网络模型结示意图；

图2为YOLO detection单元结构示意图；

图3为定位前的图像；

图4为定位后的图像；

图5为利用掩模掩蔽标准汉字的示意图。

具体实施方式

具体实施方式一：

本实施方式为一种汉字书写质量的评价方法，包括以下步骤：

S1、采集书写汉字的图像；

S2、将采集的图像调整到固定大小；

S3、根据预处理后的图像对文字进行定位；

S4、对定位后的汉字进行识别，得到识别汉字；

S5、确定需要对比的标准书体字形；

i表示最小外接矩形框内每行像素的序号；

进而确定得分系数特征

S10、利用得分系数特征对字书写质量进行评价。

具体实施方式二：

本实施方式中S5所述确定需要对比的标准书体字形的过程是根据用户选择标准书体字形的方式进行确定的。

其他步骤与具体实施方式一相同。

具体实施方式三：

本实施方式中S10所述利用得分系数特征对字书写质量进行评价的过程是以分值的形式进行评价，得分m＝k×M，其中M为满分制的总分。

其他步骤与具体实施方式一或二相同。

具体实施方式四：

本实施方式为一种汉字书写质量的评价系统，包括：

图像采集模块：采集书写汉字的图像；

图像预处理单元：将采集的图像调整到固定大小；

文字定位模块：根据预处理后的图像对文字进行定位；

文字识别模块：对定位后的汉字进行识别，得到识别汉字；

数据库：存储汉字的标准书体字形；所述的数据库包括各种书体的字形子库，可以是每种书体对应一个字形字库，方便书体字形确定模块的书体调取；

书体字形确定模块：从存储汉字的标准书体字形中确定需要对比的标准书体字形；在一些实施例中采用根据用户选择标准书体字形的方式进行确定，例如用户选择楷体，则对应在数据库中调取楷体的标准书体字形；在另一些实施例中可以通过确定与识别的汉字最接近的标准书体字形，从而确定其为需要对比的标准书体字形；

相似状态确定模块：将调整大小后的识别汉字作为掩模，利用掩模掩蔽标准汉字，调整掩模掩蔽角度并计算掩模与标准汉字的重叠区域像素的覆盖面积，将覆盖面积最大的掩蔽状态记为最佳相似状态；本实施方式采用的是将识别汉字作为掩模进行掩蔽，实际上也可以采用标准汉字进行掩蔽。利用本实施方式的方法进行掩蔽时，可视化状态下更容易直观的观测到书写字体(识别汉字的字体)与标准汉字的差异，如图5所示，所以从可视化角度上更加直接，效果也会更好；更为重要的是可以直接将标准汉字的最小外接矩形框作为最佳相似状态对应的最小外接矩形框，这样操作方便，计算量小，方便后续步骤的处理；

虽然识别汉字可能与掩模相似度很小(此时识别汉字可能书写的比较差)，但是并不影响后续处理，而且在后续处理过程中会得到一个较低的评价分数。

得分系数确定模块：针对调整大小后的标准汉字对应的图像，计算标准汉字书写笔画所占像素点总数P_s；并计算最小外接矩形框内每行像素点中空白像素(没有笔画对应的像素点)的总数

i表示最小外接矩形框内每行像素的序号；

同时，针对最佳相似状态对应的图像，计算最佳相似状态下全部笔画所占像素点总数P_t(重叠区域像素的仅计算一次)；并计算最小外接矩形框内每行像素点中空白像素(没有标准汉字和标准汉字笔画对应的像素点)的总数

进而确定得分系数特征

得分系数特征不仅能够反映二者的相似性，包括笔画位置的特性和吻合程度(偏离程度)特性，而且还能够在一定程度上反映笔锋特性，从而使得本发明在评价上更加具有全面性和客观性。

评价模块：利用得分系数特征对字书写质量进行评价，得到得分m＝k×M，其中M为满分制的总分；以百分制为例，M＝100，如果得到的分系数特征k＝0.85，那么最终的得分为85分。

具体实施方式五：

本实施方式为一种汉字书写质量的评价系统，所述的文字定位模块进行文字定位的过程如下：

采用YOLO v3网络进行文字定位，所述的YOLOv3网络包括一个darknet-53网络模型和YOLO detection单元；

如图1所示，darknet-53网络模型结构如下：

第一单元：DBL结构→DBL结构，第一单元连接第二单元；

第二单元：DBL结构→DBL结构→Residual结构，第二单元连接第三单元；

第三单元：DBL结构，第三单元连接第四单元；

第四单元：DBL结构→DBL结构→Residual结构，第四单元连接第五单元；

第五单元：DBL结构，第五单元连接第六单元；

第六单元：DBL结构→DBL结构→Residual结构，第六单元输出feature map 1，同时第六单元连接第七单元；

第七单元：DBL结构，第七单元连接第八单元；

第八单元：DBL结构→DBL结构→Residual结构，第八单元输出feature map 2，同时第八单元连接第九单元；

第九单元：DBL结构，第九单元连接第十单元；

第十单元：DBL结构→DBL结构→Residual结构，第十单元输出feature map 3；

所述的DBL结构结构：conv layer→BN layer→LeakyReLU layer；所述BN layer(Batch Normalization layer)为批次归一化层，使得数据处于同一分布，避免出现过拟合问题；

所述的Residual结构结构：1*1的DBL结构→3*3的DBL结构；

这里需要说明的是，本发明并没有采用残差网络技术处理损失熵，经过研究和实验发现，这样处理虽然会造成一定时间范围内导致损失熵收敛变慢，但是整体上配合YOLOdetection单元的处理过程并不会导致梯度消失的问题；而且更有利于配合YOLOdetection单元的处理。

如图2所示，YOLO detection单元结构如下：

feature map 3经过DBL*5之后分为两路，一路经过DBL和Conv layer之后作为输出y1，另一路经过DBL后进行上采样，之后与feature map 3进行concat操作之后→DBL*5；经过DBL*5之后再分为两路，一路经过DBL和Conv layer之后作为输出y2，另一路经过DBL后进行上采样，之后与feature map 1进行concat操作之后→DBL*5，然后经过DBL和Convlayer之后作为输出y3。

所述的YOLO v3网络的训练过程如下：

设计损失函数时考虑目标定位损失、目标损失、目标分类损失。YOLOv3的损失函数为

其中λ_coord、λ_obj、λ_cla目标定位损失系数、目标损失系数、目标分类损失系数；x_i、y_i、w_i、h_i、

分别为预设边界框和预测边界框的在特征图上的中心坐标、宽和高；O_i表示预测目标边界框i中是否真实存在目标，0表示不存在，1表示存在；

表示预测目标矩形框i内是否存在目标的Sigmoid概率(将预测值通过sigmoid函数得到)；p_i(c)为目标边界框存在第c类目标的概率。

采集书写的汉字图像，将采集的图像调整到固定大小，固定大小的汉字图像构成文字图像训练集；对书写的汉字图像进行人工标记，构成标记图像训练集；文字图像训练集和标记图像训练集构成训练集利用训练集，最终确定YOLO v3网络的参数，得到训练好的YOLO v3网络，利用训练好的YOLO v3网络进行文字定位，如图3和图4所示，其中图3为定位前的图像，图4为定位后的图像。

其他模块和处理方式与具体实施方式四相同。

具体实施方式六：

本实施方式为一种汉字书写质量的评价系统，所述的文字识别模块对定位后的汉字进行识别的过程如下：

采用识别网络模型对定位后的汉字进行识别出书写的汉字，所述识别网络模型结构如下：

第一单元：(conv layer→conv layer→conv layer→pool layer)*2；

第一单元连接第二单元；

第二单元：[输入分别进入四个支路，支路1：1*1conv layer；支路2：pool layer→1*1conv layer；支路3：1*1conv layer→3*3conv layer；支路4：1*1conv layer→(3*3conv layer)*2；四个支路输出共同进入filter concat layer]*3；

第二单元连接第三单元；

第三单元：输入分别进入三个支路，支路1：1*1conv layer；支路2：1*1conv layer→3*3conv layer；支路3：pool layer；三个支路输出共同进入filter concat layer；

第三单元连接第四单元；

第四单元：[输入分别进入四个支路，支路1：1*1conv layer；支路2：pool layer→1*1conv layer；支路3：经过1*1conv layer→1*7conv layer→7*1conv layer；支路4：经过1*1conv layer→(1*7conv layer→7*1conv layer)*2；四个支路输出共同进入filterconcat layer]*3；

第四单元连接第五单元；

第五单元：输入分别进入三个支路，支路1：1*1conv layer→3*3conv layer；支路2：1*1conv layer→3*3conv layer→1*1conv layer；支路3：pool layer；三个支路输出共同进入filter concat layer；

第五单元分别连接第六单元；

第六单元：[(输入分别进入四个支路，支路1：1*1conv layer；支路2：pool layer→1*1conv layer；支路3：1*1conv layer后分别进入1*3conv layer、3*1conv layer，分别输出；支路4：1*1conv layer→3*3conv layer，之后分别进入1*3conv layer、3*1convlayer，分别输出；四个支路输出共同进入filter concat layer)→1*1conv layer]*2；

第六单元连接第七单元；

第七单元：pool layer→dropout layer→FC layer→softmax分类器。

所述的识别网络模型的训练过程如下：

根据交叉熵设计损失函数。

利用经过文字定位模块定位后的图像和相应的标记图像进行训练，得到训练好的识别网络模型，利用训练好的识别网络模型进行文字识别。

其他模块和处理方式与具体实施方式四或五相同。

具体实施方式七：

本实施方式为一种汉字书写质量的评价设备，所述设备用于存储和/或运行具体实施方式四至六之一所述的一种汉字书写质量的评价系统。

需要注意的是，具体实施方式仅仅是对本发明技术方案的解释和说明，不能以此限定权利保护范围。凡根据本发明权利要求书和说明书所做的仅仅是局部改变的，仍应落入本发明的保护范围内。

Claims

1.一种汉字书写质量的评价方法，其特征在于，包括以下步骤：

S1、采集书写汉字的图像；

S2、将采集的图像调整到固定大小；

S3、根据预处理后的图像对文字进行定位；

S4、对定位后的汉字进行识别，得到识别汉字；

S5、确定需要对比的标准书体字形；

i表示最小外接矩形框内每行像素的序号；

同时，针对最佳相似状态对应的图像，计算最佳相似状态下全部笔画所占像素点总数P；并计算最小外接矩形框内每行像素点中空白像素的总数

进而确定得分系数特征

S10、利用得分系数特征对字书写质量进行评价。

2.根据权利要求1所述的一种汉字书写质量的评价方法，其特征在于，S5所述确定需要对比的标准书体字形的过程是根据用户选择标准书体字形的方式进行确定的。

3.根据权利要求1或2所述的一种汉字书写质量的评价方法，其特征在于，S10所述利用得分系数特征对字书写质量进行评价的过程是以分值的形式进行评价，得分m＝k×M，其中M为满分制的总分。

4.一种汉字书写质量的评价系统，其特征在于，包括：

图像采集模块：采集书写汉字的图像；

图像预处理单元：将采集的图像调整到固定大小；

文字定位模块：根据预处理后的图像对文字进行定位；

文字识别模块：对定位后的汉字进行识别，得到识别汉字；

书体字形确定模块：确定需要对比的标准书体字形；

i表示最小外接矩形框内每行像素的序号；

进而确定得分系数特征

评价模块：利用得分系数特征对字书写质量进行评价。

5.根据权利要求4所述一种汉字书写质量的评价系统，其特征在于，还包括数据库，数据库用于存储汉字的标准书体字形。

6.根据权利要求5所述一种汉字书写质量的评价系统，其特征在于，所述的书体字形确定模块采用根据用户选择标准书体字形的方式确定需要对比的标准书体字形。

7.根据权利要求4、5或6所述一种汉字书写质量的评价系统，其特征在于，所述的文字定位模块进行文字定位的过程如下：

darknet-53网络模型结构如下：

第一单元：DBL结构→DBL结构，第一单元连接第二单元；

第三单元：DBL结构，第三单元连接第四单元；

第五单元：DBL结构，第五单元连接第六单元；

第七单元：DBL结构，第七单元连接第八单元；

第九单元：DBL结构，第九单元连接第十单元；

所述的DBL结构结构：conv layer→BN layer→LeakyReLU layer；所述BN layer(Batch Normalization layer)为批次归一化层；

所述的Residual结构结构：1*1的DBL结构→3*3的DBL结构；

YOLO detection单元结构如下：

feature map 3经过DBL*5之后分为两路，一路经过DBL和Conv layer之后作为输出y1，另一路经过DBL后进行上采样，之后与feature map 3进行concat操作之后→DBL*5；经过DBL*5之后再分为两路，一路经过DBL和Conv layer之后作为输出y2，另一路经过DBL后进行上采样，之后与feature map 1进行concat操作之后→DBL*5，然后经过DBL和Conv layer之后作为输出y3。

8.根据权利要求4、5或6所述一种汉字书写质量的评价系统，其特征在于，所述的文字识别模块对定位后的汉字进行识别的过程如下：

第一单元：(conv layer→conv layer→conv layer→pool layer)*2；

第一单元连接第二单元；

第二单元：[输入分别进入四个支路，支路1：1*1conv layer；支路2：pool layer→1*1conv layer；支路3：1*1conv layer→3*3conv layer；支路4：1*1conv layer→(3*3convlayer)*2；四个支路输出共同进入filter concat layer]*3；

第二单元连接第三单元；

第三单元连接第四单元；

第四单元连接第五单元；

第五单元分别连接第六单元；

第六单元连接第七单元；

第七单元：pool layer→dropout layer→FC layer→softmax分类器。

9.一种汉字书写质量的评价设备，其特征在于，所述设备用于存储和/或运行权利要求4至权利要求8之一所述的一种汉字书写质量的评价系统。