CN113901936B

CN113901936B - 硬笔书法田字格切片图像提取方法、系统、设备

Info

Publication number: CN113901936B
Application number: CN202111216841.2A
Authority: CN
Inventors: 陈艳红; 崔晓光; 张吉祥
Original assignee: Beijing Aishidai Technology Development Co ltd; Institute of Automation of Chinese Academy of Science
Current assignee: Beijing Aishidai Technology Development Co ltd; Institute of Automation of Chinese Academy of Science
Priority date: 2021-10-19
Filing date: 2021-10-19
Publication date: 2022-04-19
Anticipated expiration: 2041-10-19
Also published as: CN113901936A

Abstract

本发明属于图像处理技术领域，具体涉及一种硬笔书法田字格切片图像提取方法、系统、设备，旨在解决目前缺乏不同图像质量下硬笔书法作品中田字格切片图提取的方法，阻碍后续精确指导学生规范书写汉字的问题。本发明方法包括：获取灰度田字格图像；对灰度田字格图像进行局部二值化；对二值化田字格图像进行轮廓提取，并将噪声区域进行剔除；对剔除噪声区域后的二值化田字格图像进行格线标记；提取格线标记图像的轮廓并进行外接多边形的拟合，得到方格，对方格进行聚类，确定方格的位置；基于方格的位置提取田字格切片图像。本发明实现不同图像质量下硬笔书法作品中田字格切片图提取，进而为后续精确指导学生规范书写汉字提供技术基础。

Description

硬笔书法田字格切片图像提取方法、系统、设备

技术领域

本发明属于图像处理技术领域，具体涉及一种硬笔书法田字格切片图像提取方法、系统、设备。

背景技术

通过智能化手段对硬笔书法练习作品进行评价能够及时有效地对学生的书法作业给出针对性的指导意见，可以有效提升硬笔书法“练习-反馈-改进”的练习效率，缓解目前依赖人工方式对学生书法练习作业进行反馈指导任务繁重的现状。

练习硬笔书法一般使用通用的田字格纸，在田字格内书写汉字，然后将手写练习作业拍摄成图片上传，等待反馈意见。通过智能化图像处理的方法评价硬笔书法练习作品，首先要获取每一个田字格汉字图像，我们称之为田字格切片图像。拍摄书法作品图像的设备、拍摄环境不尽相同，每个人的拍照水平也各有差异，硬笔书法纸田字格的颜色、深浅也具有多样性，田字格内有辅助虚线，另外，书写时可能出现汉字出格、涂抹等情况，以上诸多不确定因素导致书法练习作业图像的质量优劣差异很大，给硬笔书法田字格切片图像提取问题带来了挑战。基于此，本发明提出了一种硬笔书法田字格切片图像提取方法。

发明内容

为了解决现有技术中的上述问题，即为了解决目前缺乏不同图像质量下硬笔书法作品中田字格切片图提取的方法，阻碍后续精确指导学生规范书写汉字的问题，本发明提出了一种硬笔书法田字格切片图像提取方法，该方法包括：

S10，获取灰度田字格图像，作为输入图像；所述灰度田字格图像为对拍摄或扫描的硬笔书法纸田字格图像进行灰度转换后的图像；

S20，对所述输入图像进行局部二值化，得到二值化田字格图像；

S30，对所述二值化田字格图像进行轮廓提取，并将尺寸小于设定轮廓尺寸阈值的轮廓对应的区域作为噪声区域进行剔除；

S40，对剔除噪声区域后的二值化田字格图像进行格线标记，得到格线标记图像；

S50，提取所述格线标记图像的轮廓并进行外接多边形的拟合，若拟合的外接多边形的边数等于4且长边与短边的比例小于设定的比例阈值，则将该外接多边形作为方格；对方格进行聚类，并选定聚类后方格数最多的聚类重新进行方格聚类，重新方格聚类后确定每个方格的行坐标索引、列坐标索引，进而得到方格的位置；

S60，基于方格的位置提取田字格切片图像，作为提取结果输出。

在一些优选的实施方式中，“对所述输入图像进行局部二值化”，其方法为：

S21，提取灰度田字格图像中的直线，构建直线标记图像image_line，将所述直线标记图像中直线上的像素标记为白色，其余部分标记为黑色；

S22，构建直线灰度图image_line_gray，并基于直线灰度图计算直线像素灰度积分图；所述直线灰度图与直线标记图像白色像素对应的像素位置，其灰度值为灰度田字格图像中与直线标记图像白色像素对应的像素位置的灰度值，直线灰度图中的其余像素为黑色；

S23，构建标记图像image_label，并基于标记图像计算直线像素数目积分图；所述标记图像中与直线标记图像白色像素对应的像素位置，其灰度值设为1，其余像素设为0；

S24，初始化二值化图像image_bw为黑色，遍历灰度田字格图像的每一个像素p(x，y)，若p(x，y)的邻域内存在直线像素，则计算邻域内所有直线像素的平均灰度值aver_gray，若p(x，y)的灰度值小于aver_gray，则image_bw中对应位置像素标记为白色，得到二值化田字格图像；

其中，像素p(x，y)的邻域为以像素p(x，y)为中心、大小为W×W的局部矩形窗，W为奇数，W的计算方法为：

其中，width_{image_gray}为灰度田字格图像的宽度，numCol为输入的田字格的列数；

判断p(x，y)的邻域内是否存在直线像素，其方法为：

其中，I为直线像素数目积分图，若ncont＞0，则p(x，y)的邻域内存在直线像素，否则，不存在直线像素；

p(x，y)邻域内所有直线像素的平均灰度值aver_gray，其计算方法为：

其中，I′为直线像素灰度积分图。

在一些优选的实施方式中，“对所述二值化田字格图像进行轮廓提取，并将尺寸小于设定轮廓尺寸阈值的轮廓对应的区域作为噪声区域进行剔除”，其方法为：

S31，对二值化田字格图像进行轮廓提取，得到轮廓集合{contor₁，…，contor_n}；

S32，遍历轮廓集合，对于尺寸小于设定的轮廓尺寸阈值的轮廓，在二值化田字格图像中将该轮廓包围的对应区域标记为黑色；

轮廓尺寸的计算方法为：

其中，

为轮廓i的外接矩形的宽和高，len_i表示轮廓i的尺寸；

轮廓尺寸阈值的计算方法为：

其中，width_{image_gray}、height_{image_gray}为灰度田字格图像的宽和高，numCol、numRow为输入的田字格的列数和行数，thresh_len表示轮廓尺寸阈值。

在一些优选的实施方式中，“对剔除噪声区域后的二值化田字格图像进行格线标记，得到格线标记图像”，其方法为：

S41，设置角度范围[-angle，angle]、角度分辨率resolution_angle，对当前角度ang_i，求直线端点endp_i1、endp_i2，将endp_i1、endp_i2之间直线段上的像素标记为白色，其余部分标记为黑色，构建直线图像img_model_i；其中，直线图像的宽度为

高度为

表示直线端点endp_i1、endp_i2的坐标；

其中，直线端点endp_i1、endp_i2的计算方法为：

if ang_i≥0：

endp_i1＝(0，0)，endp_i2＝(ncol-1，(ncol-1)*tan(ang_i))

if ang_i＜0：

endp_i1＝(0，(1-ncol)*tan(ang_i))，endp_i2＝(ncol-1，0)

angle＜atan2(nrow，ncol)

ang_i＝-angle+resolution_angle×i

其中，nrow、ncol为二值化田字格图像的高度和宽度；

S42，遍历直线图像，以直线图像img_model_i为模板，以剔除噪声区域后的二值化田字格图像为匹配图像，统计模板匹配响应最大位置处，img_model_i与剔除噪声区域后的二值化田字格图像白色相交区的像素数目cover_i，若cover_i大于设定的像素数目阈值cover_thresh，则将img_model_i标记为保留，否则标记为删除；

S43，遍历直线图像，若img_model_i标记为保留，则构建旋转图像img_rota_i，并构建全部像素标记为黑色的空图像img_empty_i，img_empty_i与img_rota_i图像大小相同；按行统计img_rota_i中每行像素中标记为白色的像素数cont_row_k，若cont_row_k大于cover_thresh，则将img_empty_i中第k行标记为白色；按照ang_i角度旋转img_empty_i得到的img_model_i对应的标记图像line_label_i；将line_label_i累加得到行直线标记图像；所述img_rota_i为剔除噪声区域后的二值化田字格图像按照-ang_i角度旋转得到的图像；

S44，转置剔除噪声区域后的二值化田字格图像得到image_bw_transpose，将S41-S43中剔除噪声区域后的二值化田字格图像替换为image_bw_transpose，执行S41-S43的方法，得到未转置的列直线标记图像image_square_col_transpose，将image_square_col_transpose转置即得到最终的列直线标记图像image_square_col；

将行直线标记图像与image_square_col进行加和，得到格线标记图像。

在一些优选的实施方式中，“对方格进行聚类”，其方法为：

S521，初始化聚类集合Cluster，遍历方格集合；

S522，对方格square_i，遍历聚类集合，计算square_i的长边与各聚类中心的距离，若该距离与聚类cluster_j的距离dist_ij最小，则判断dist_ij是否小于cluster_j的聚类半径，若是，则将square_i归为cluster_j，若否或者聚类集合Cluster为空，则新建聚类cluster，聚类中心为square_i的长边，聚类半径为square_i的长边的一半；对所有方格重复上述步骤；

S523，遍历聚类集合中的聚类，对聚类cluster_j，更新其聚类中心为类内所有方格长边的均值，更新其聚类半径为聚类中心的一半；若聚类cluster_j内方格数小于2，则将聚类cluster_j从聚类集合中剔除；

S524，重复执行S522-S523 N次，聚类完成后，选择方格数最多的聚类，并计算该聚类内方格的长边的均值aver_len。

在一些优选的实施方式中，“选定聚类后方格数最多的聚类重新进行方格聚类，重新方格聚类后确定每个方格的行坐标索引、列坐标索引，进而得到方格的位置”，其方法为：

S531，初始化聚类集合ClusterR，遍历方格集合；

S532，对方格square_i，遍历聚类集合，计算square_i的左上角y坐标与各聚类中心距离，若与聚类clusterR_j的距离distR_ij最小，则判断distR_ij是否小于clusterR_j的聚类半径，若是，则将square_i归为clusterR_j，若否或者聚类集合ClusterR为空，则新建聚类clusterR，聚类中心为square_i的左上角y坐标，聚类半径为aver_len；对所有方格重复上述步骤；

S533，遍历聚类集合中的聚类，对聚类clusterR_j，更新其聚类中心为类内所有方格左上角y坐标的均值；若聚类clusterR_j内方格数小于2，则将聚类clusterR_j从聚类集合中剔除；

S534，重复执行S532-S533 N次；

S535，按照聚类中心对聚类集合ClusterR从小到大排序，遍历聚类集合，对聚类clusterR_j，计算其聚类中心与前一个聚类的聚类中心的距离distC_j，计算索引增量delta_index＝int(distC_j/aver_len+0.5)，聚类clusterR_j的行索引为其前一个聚类行索引加delta_index，其中int表示取整，聚类集合中第一个聚类的行索引为0；聚类clusterR_j内的所有方格的行索引为聚类clusterR_j的行索引；

S536，对选定聚类后方格数最多的聚类重新进行列聚类，包括：

将S531-S535中的左上角y坐标替换为左上角x坐标、行索引替换为列索引，执行S531-S535，即可得到各方格的列索引；

S537，基于各方格的行索引、列索引，确定方格的位置。

在一些优选的实施方式中，S536与S537之间还包括空缺表格的预测补全步骤：

得到各方格的行索引、列索引后，判断全部方格的数目等于输入的田字格行数与列数的乘积，若是，则完成方格位置的确定，否则，构建标记表格，标记第i行第j列的方格是否存在，表格行数等于方格行坐标索引的最大值加1，表格列数等于方格列坐标索引的最大值加1，初始设置表格每行每列为0；遍历方格，若方格的行坐标索引、列坐标索引分别为i、j，则将表格的第i行第j列标记为1；完成方格遍历后，若标记表格中第i′行、第j′列为0，则根据距离i′最近的前序确定行、距离j′最近的前序确定列、aver_len预测第i′行、第j′列的方格，即空缺方格，空缺方格补全后完成方格位置确定；

其中，根据距离i′最近的前序确定行、距离j′最近的前序确定列、aver_len预测第i′行、第j′列的方格，其方法为

其中，rect_i′j′为预测方格，rect_i′j′.x、rect_i′j′.y为预测方格左上角x、y坐标，rect_i′j′.width、rect_i′j′.height为预测方格的宽、高，

为距离i′最近的前序确定行的聚类中心，

为距离j′最近的前序确定列的聚类中心，deltaR为i′与最近的前序确定行的行索引增量，deltaC为j′与最近的前序确定列的列索引增量。

本发明的第二方面，提出了一种硬笔书法田字格切片图像提取系统，该系统包括：图像获取模块、局部二值化模块、噪声区域剔除模块、格线标记模块、位置获取模块、结果输出模块；

所述图像获取模块，配置为获取灰度田字格图像，作为输入图像；所述灰度田字格图像为对拍摄或扫描的硬笔书法纸田字格图像进行灰度转换后的图像；

所述局部二值化模块，配置为对所述输入图像进行局部二值化，得到二值化田字格图像；

所述噪声区域剔除模块，配置为对所述二值化田字格图像进行轮廓提取，并将尺寸小于设定轮廓尺寸阈值的轮廓对应的区域作为噪声区域进行剔除；

所述格线标记模块，配置为对剔除噪声区域后的二值化田字格图像进行格线标记，得到格线标记图像；

所述位置获取模块，配置为提取所述格线标记图像的轮廓并进行外接多边形的拟合，若拟合的外接多边形的边数等于4且长边与短边的比例小于设定的比例阈值，则将该外接多边形作为方格；对方格进行聚类，并选定聚类后方格数最多的聚类重新进行方格聚类，重新方格聚类后确定每个方格的行坐标索引、列坐标索引，进而得到方格的位置；

所述结果输出模块，配置为基于方格的位置提取田字格切片图像，作为提取结果输出。

本发明的第三方面，提出了一种电子设备，包括：至少一个处理器；以及与至少一个所述处理器通信连接的存储器；其中，所述存储器存储有可被所述处理器执行的指令，所述指令用于被所述处理器执行以实现上述的硬笔书法田字格切片图像提取方法。

本发明的第四方面，提出了一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于被所述计算机执行以实现上述的硬笔书法田字格切片图像提取方法。

本发明的有益效果：

本发明实现不同图像质量下硬笔书法作品中田字格切片图提取，进而为后续精确指导学生规范书写汉字提供技术基础。

1)本发明提出了一种灰度田字格图像局部自适应二值化处理方法，对光照变化、亮度不均匀等多种质量下的田字格图像具有很好的适用性，大大提升了二值化田字格图像的质量；

2)本发明对手写汉字出格、局部涂抹、拍摄歪斜等多种情况下的田字格在提取时，通过局部二值化处理、噪声区域剔除、格线标记、方格聚类以及预测，提升田字格切片图像的鲁棒性，为后续评价田字格内的单个手写汉字是否规范、全篇手写汉字是否整洁提供了技术基础。

附图说明

通过阅读参照以下附图所做的对非限制性实施例所做的详细描述，本申请的其他特征、目的和优点将会变得更明显。

图1是本发明一种实施例的硬笔书法田字格切片图像提取方法的流程示意图；

图2为本发明一种实施例的硬笔书法田字格切片图像提取方法的简略流程示意图；

图3是本发明一种实施例的灰度田字格图像进行局部二值化处理的流程示意图；

图4是本发明一种实施例的二值化田字格图像进行格线标记的流程示意图；

图5是本发明一种实施例的方格位置确定的流程示意图；

图6(a)是本发明一种实施例的局部二值化后的灰度田字格图像；

图6(b)是本发明一种实施例的噪声区域剔除后的灰度田字格图像；

图6(c)是本发明一种实施例的格线标记图像；

图7是本发明一种实施例的适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

本发明第一实施例的一种硬笔书法田字格切片图像提取方法，如图1所示，该方法包括以下步骤：

为了更清晰地对本发明硬笔书法田字格切片图像提取方法进行说明，下面结合附图1、2，对本发明方法一种实施例中各步骤进行展开详述。

在本实施例中，使用成像设备拍摄硬笔书法纸田字格图像，编辑图像去除非田字格外的不必要区，若拍摄图像为彩色图像，则将图像转换为灰度图像，作为灰度田字格图像image_gray输入，输入田字格包含的行数numRow和列数numCol。

在本实施例中，“对所述输入图像进行局部二值化”，如图3所示，具体如下：

S21，提取灰度田字格图像中的直线，构建直线标记图像image_line，将所述直线标记图像中直线上的像素标记为白色，其余部分标记为黑色，如图6(a)所示；其中，本发明中优选采用霍夫直线检测的方法提取田字格图像中的直线。

S22，构建直线灰度图image_line_gray，并基于直线灰度图计算直线像素灰度积分图；所述直线灰度图与直线标记图像白色像素对应的像素位置，其灰度值为灰度田字格图像中与直线标记图像白色像素对应的像素位置的灰度值，直线灰度图中的其余像素为黑色；积分图是数字图像处理中的一种常用方法，此处不再详细阐述。

判断p(x，y)的邻域内是否存在直线像素，其方法为：

其中，I′为直线像素灰度积分图。

在本实施例中，对所述二值化田字格图像进行轮廓提取，并将尺寸小于设定轮廓尺寸阈值的轮廓对应的区域作为噪声区域进行剔除”，其方法为：

轮廓尺寸的计算方法为：

其中，

为轮廓i的外接矩形的宽和高，len_i表示轮廓i的尺寸；

轮廓尺寸阈值的计算方法为：

在本实施例中，格线标记图像image_square为行直线标记图像与列直线标记图像的加和，行直线标记图像与列直线标记图像的大小与剔除噪声区域后的二值化田字格图像相同，初始全部像素为黑色。

其中，“对剔除噪声区域后的二值化田字格图像进行格线标记，得到格线标记图像”，如图4所示，具体如下：

高度为

表示直线端点endp_i1、endp_i2的坐标。

其中，直线端点endp_i1、endp_i2的计算方法为：

if ang_i≥0：

endp_i1＝(0，0)，endp_i2＝(ncol-1，(ncol-1)*tan(ang_i))

if ang_i＜0：

endp_i1＝(0，(1-ncol)*tan(ang_i))，endp_i2＝(ncol-1，0)

angle＜atan2(nrow，ncol)

ang_i＝-angle+resolution_angle×i

其中，nrow、ncol为二值化田字格图像的高度和宽度。另外，本发明中angle优选配置为5，resolution_angle优选配置为0.1；

cover_thresh的计算方法为：

其中，width_{image_gray}为灰度田字格图像的宽度。

将行直线标记图像与image_square_col进行加和，得到格线标记图像，如图6(c)所示。

在本实施例中，先进行格线标记图像的轮廓提取及形状筛选，然后进行方格聚类，最后进行方格确定及预测，如图5所示，具体如下：

S51，对格线标记图像image_square进行轮廓提取，遍历轮廓，求每个轮廓的外接拟合多边形，若拟合的外接多边形的边数等于4，则求该轮廓的外接矩形，若该矩形宽、高的长边与短边的比例小于阈值ratio_thresh，则判定该矩形为方格；得到方格集合{square₁，…，square_n}；其中，ratio_thresh优选配置为1.5。

S52，以方格的长边为对象对方格进行聚类，取类内方格数最多的聚类，计算聚类内方格的长边的均值aver_len；具体为：

S521，初始化聚类集合Cluster，遍历方格集合；

S522，对方格square_i，遍历聚类集合，计算square_i的长边与各聚类中心的距离，若该距离与聚类cluster_i的距离dist_ij最小，则判断dist_ij是否小于cluster_j的聚类半径，若是，则将square_i归为cluster_j，若否或者聚类集合Cluster为空，则新建聚类cluster，聚类中心为square_i的长边，聚类半径为square_i的长边的一半；对所有方格重复上述步骤；

S53，对选定的方格聚类内的方格进行行聚类，确定每个方格的行坐标索引；然后对选定的方格聚类内的方格进行列聚类，确定每个方格的列坐标索引；若全部方格的数目等于输入的田字格行数与列数的乘积，则完成方格位置的确定，否则，构建标记表格，标记第i行第j列的方格是否存在，表格行数等于方格行坐标索引的最大值加1，表格列数等于方格列坐标索引的最大值加1，初始设置表格每行每列为0；遍历方格，若方格的行坐标索引、列坐标索引分别为i、j，则将表格的第i行第j列标记为1；完成方格遍历后，若标记表格中第i′行、第j′列为0，则根据距离i′最近的前序确定行、距离j′最近的前序确定列、aver_len预测第i′行、第j′列的方格；所有空缺方格补全后完成方格位置的确定。具体为：

S531，初始化聚类集合ClusterR，遍历方格集合；

S534，重复执行S532-S533 N次；

S535，按照聚类中心对聚类集合ClusterR从小到大排序，遍历聚类集合，对聚类clusterR_j，计算其聚类中心与前一个聚类的聚类中心的距离distC_j，计算索引增量delta_index＝iht(distC_j/aver_len+0.5)，聚类clusterR_j的行索引为其前一个聚类行索引加delta_index，其中iht表示取整，聚类集合中第一个聚类的行索引为0；聚类clusterR_j内的所有方格的行索引为聚类clusterR_j的行索引；

S537，基于各方格的行索引、列索引，确定方格的位置。

S536与S537之间还包括空缺表格的预测补全步骤：

为距离i′最近的前序确定行的聚类中心，

本发明第二实施例的一种硬笔书法田字格切片图像提取系统，包括：图像获取模块100、局部二值化模块200、噪声区域剔除模块300、格线标记模块400、位置获取模块500、结果输出模块600；

所述图像获取模块100，配置为获取灰度田字格图像，作为输入图像；所述灰度田字格图像为对拍摄或扫描的硬笔书法纸田字格图像进行灰度转换后的图像；

所述局部二值化模块200，配置为对所述输入图像进行局部二值化，得到二值化田字格图像；

所述噪声区域剔除模块300，配置为对所述二值化田字格图像进行轮廓提取，并将尺寸小于设定轮廓尺寸阈值的轮廓对应的区域作为噪声区域进行剔除；

所述格线标记模块400，配置为对剔除噪声区域后的二值化田字格图像进行格线标记，得到格线标记图像；

所述位置获取模块500，配置为提取所述格线标记图像的轮廓并进行外接多边形的拟合，若拟合的外接多边形的边数等于4且长边与短边的比例小于设定的比例阈值，则将该外接多边形作为方格；对方格进行聚类，并选定聚类后方格数最多的聚类重新进行方格聚类，重新方格聚类后确定每个方格的行坐标索引、列坐标索引，进而得到方格的位置；

所述结果输出模块600，配置为基于方格的位置提取田字格切片图像，作为提取结果输出。

所述技术领域的技术人员可以清楚的了解到，为描述的方便和简洁，上述描述的系统的具体的工作过程及有关说明，可以参考前述方法实施例中的对应过程，在此不再赘述。

需要说明的是，上述实施例提供的硬笔书法田字格切片图像提取系统，仅以上述各功能模块的划分进行举例说明，在实际应用中，可以根据需要而将上述功能分配由不同的功能模块来完成，即将本发明实施例中的模块或者步骤再分解或者组合，例如，上述实施例的模块可以合并为一个模块，也可以进一步拆分成多个子模块，以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称，仅仅是为了区分各个模块或者步骤，不视为对本发明的不当限定。

本发明第三实施例的一种硬笔书法田字格切片图像提取装置，该装置包括：采集设备、中央处理设备；

所述采集设备，包括摄像机、照相机、扫描机，用于采集灰度田字格图像，作为输入图像；所述灰度田字格图像为对拍摄或扫描的硬笔书法纸田字格图像进行灰度转换后的图像；

所述中央处理设备，包括GPU，配置为对所述输入图像进行局部二值化，得到二值化田字格图像；对所述二值化田字格图像进行轮廓提取，并将尺寸小于设定轮廓尺寸阈值的轮廓对应的区域作为噪声区域进行剔除；对剔除噪声区域后的二值化田字格图像进行格线标记，得到格线标记图像；提取所述格线标记图像的轮廓并进行外接多边形的拟合，若拟合的外接多边形的边数等于4且长边与短边的比例小于设定的比例阈值，则将该外接多边形作为方格；对方格进行聚类，并选定聚类后方格数最多的聚类重新进行方格聚类，重新方格聚类后确定每个方格的行坐标索引、列坐标索引，进而得到方格的位置；基于方格的位置提取田字格切片图像，作为提取结果输出。

本发明第四实施例的一种电子设备，至少一个处理器；以及与至少一个所述处理器通信连接的存储器；其中，所述存储器存储有可被所述处理器执行的指令，所述指令用于被所述处理器执行以实现上述的硬笔书法田字格切片图像提取方法。

本发明第五实施例的一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于被所述计算机执行以实现上述的硬笔书法田字格切片图像提取方法。

所述技术领域的技术人员可以清楚的了解到，未描述的方便和简洁，上述描述的硬笔书法田字格切片图像提取装置、电子设备、计算机可读存储介质的具体工作过程及有关说明，可以参考前述方法实例中的对应过程，在此不再赘述。

下面参考图7，其示出了适于用来实现本申请系统、方法、设备实施例的服务器的计算机系统的结构示意图。图7示出的服务器仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图7所示，计算机系统包括中央处理单元(CPU，Central Processing Unit)801，其可以根据存储在只读存储器(ROM，Read Only Memory)802中的程序或者从存储部分808加载到随机访问存储器(RAM，Random Access Memory)803中的程序而执行各种适当的动作和处理。在RAM803中，还存储有系统操作所需的各种程序和数据。CPU801、ROM802以及RAM803通过总线804彼此相连。输入/输出(I/O，Input/Output)接口805也连接至总线804。

以下部件连接至I/O接口805：包括键盘、鼠标等的输入部分806；包括诸如阴极射线管、液晶显示器等以及扬声器等的输出部分807；包括硬盘等的存储部分808；以及包括诸如局域网卡、调制解调器等的网络接口卡的通讯部分809。通讯部分809经由诸如因特网的网络执行通讯处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器810上，以便于从其上读出的计算机程序根据需要被安装入存储部分808。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通讯部分809从网络上被下载和安装，和/或从可拆卸介质811被安装。在该计算机程序被CPU801执行时，执行本申请的方法中限定的上述功能。需要说明的是，本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于：电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、RAM、ROM、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码，上述程序设计语言包括面向对象的程序设计语言，如Java、Smalltalk、C++，还包括常规的过程式程序设计语言，如C语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络，包括局域网或广域网连接到用户计算机，或者可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

术语“第一”、“第二”等是用于区别类似的对象，而不是用于描述或表示特定的顺序或先后次序。

术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素，而且还包括没有明确列出的其它要素，或者还包括这些过程、方法、物品或者设备/装置所固有的要素。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征作出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

Claims

1.一种硬笔书法田字格切片图像提取方法，其特征在于，该方法包括：

步骤S10，获取灰度田字格图像，作为输入图像；所述灰度田字格图像为对拍摄或扫描的硬笔书法作品田字格图像进行灰度转换后的图像；

步骤S20，对所述输入图像进行局部二值化，得到二值化田字格图像；

步骤S30，对所述二值化田字格图像进行轮廓提取，并将尺寸小于设定轮廓尺寸阈值的轮廓对应的区域作为噪声区域进行剔除；

步骤S40，对剔除噪声区域后的二值化田字格图像进行格线标记，得到格线标记图像；

步骤S50，提取所述格线标记图像的轮廓并进行外接多边形的拟合，若拟合的外接多边形的边数等于4且长边与短边的比例小于设定的比例阈值，则将该外接多边形作为方格；对方格进行聚类，并选定聚类后方格数最多的聚类重新进行方格聚类，重新方格聚类后确定每个方格的行坐标索引、列坐标索引，进而得到方格的位置；

步骤S60，基于方格的位置提取田字格切片图像，作为提取结果输出；

其中，“对所述输入图像进行局部二值化”，其方法为：

判断p(x，y)的邻域内是否存在直线像素，其方法为：

其中，I′为直线像素灰度积分图。

2.根据权利要求1所述的硬笔书法田字格切片图像提取方法，其特征在于，“对所述二值化田字格图像进行轮廓提取，并将尺寸小于设定轮廓尺寸阈值的轮廓对应的区域作为噪声区域进行剔除”，其方法为：

轮廓尺寸的计算方法为：

其中，

为轮廓i的外接矩形的宽和高，len_i表示轮廓i的尺寸；

轮廓尺寸阈值的计算方法为：

3.根据权利要求1所述的硬笔书法田字格切片图像提取方法，其特征在于，“对剔除噪声区域后的二值化田字格图像进行格线标记，得到格线标记图像”，其方法为：

高度为

表示直线端点endp_i1、endp_i2的坐标；

其中，直线端点endp_i1、endp_i2的计算方法为：

其中，nrow、ncol为二值化田字格图像的高度和宽度；

将行直线标记图像与列直线标记图像image_square_col进行加和，得到格线标记图像。

4.根据权利要求1所述的硬笔书法田字格切片图像提取方法，其特征在于，“对方格进行聚类”，其方法为：

S521，初始化聚类集合Cluster，遍历方格集合；

S523，遍历聚类集合中的聚类，对聚类cluster_j，更新其聚类中心为类内所有方格长边的均值，更新其聚类半径为聚类中心的一半；若聚类cluster_i内方格数小于2，则将聚类cluster_i从聚类集合中剔除；

5.根据权利要求1所述的硬笔书法田字格切片图像提取方法，其特征在于，“选定聚类后方格数最多的聚类重新进行方格聚类，重新方格聚类后确定每个方格的行坐标索引、列坐标索引，进而得到方格的位置”，其方法为：

S531，初始化聚类集合ClusterR，遍历方格集合；

S533，遍历聚类集合中的聚类，对聚类clusterR_i，更新其聚类中心为类内所有方格左上角y坐标的均值；若聚类clusterR_i内方格数小于2，则将聚类clusterR_j从聚类集合中剔除；

S534，重复执行S532-S533 N次；

S537，基于各方格的行索引、列索引，确定方格的位置。

6.根据权利要求5所述的硬笔书法田字格切片图像提取方法，其特征在于，S536与S537之间还包括空缺表格的预测补全步骤：

其中，根据距离i′最近的前序确定行、距离j′最近的前序确定列、aver_len预测第i′行、第j′列的方格，其方法为：

其中，rect_i′j′为预测方格，rect_i′j′.x、

为预测方格左上角x、y坐标，rect_i′j′.width、rect_i′j′.height为预测方格的宽、高，

为距离i′最近的前序确定行的聚类中心，

7.一种硬笔书法田字格切片图像提取系统，其特征在于，该系统包括：图像获取模块、局部二值化模块、噪声区域剔除模块、格线标记模块、位置获取模块、结果输出模块；

所述图像获取模块，配置为获取灰度田字格图像，作为输入图像；所述灰度田字格图像为对拍摄或扫描的硬笔书法作品田字格图像进行灰度转换后的图像；

所述结果输出模块，配置为基于方格的位置提取田字格切片图像，作为提取结果输出；

其中，“对所述输入图像进行局部二值化”，其方法为：

提取灰度田字格图像中的直线，构建直线标记图像image_line，将所述直线标记图像中直线上的像素标记为白色，其余部分标记为黑色；

构建直线灰度图image_line_gray，并基于直线灰度图计算直线像素灰度积分图；所述直线灰度图与直线标记图像白色像素对应的像素位置，其灰度值为灰度田字格图像中与直线标记图像白色像素对应的像素位置的灰度值，直线灰度图中的其余像素为黑色；

构建标记图像image_label，并基于标记图像计算直线像素数目积分图；所述标记图像中与直线标记图像白色像素对应的像素位置，其灰度值设为1，其余像素设为0；

初始化二值化图像image_bw为黑色，遍历灰度田字格图像的每一个像素p(x，y)，若p(x，y)的邻域内存在直线像素，则计算邻域内所有直线像素的平均灰度值aver_gray，若p(x，y)的灰度值小于aver_gray，则image_bw中对应位置像素标记为白色，得到二值化田字格图像；

判断p(x，y)的邻域内是否存在直线像素，其方法为：

其中，I′为直线像素灰度积分图。

8.一种电子设备，其特征在于，包括：

至少一个处理器；以及与至少一个所述处理器通信连接的存储器；

其中，所述存储器存储有可被所述处理器执行的指令，所述指令用于被所述处理器执行以实现权利要求1-6任一项所述的硬笔书法田字格切片图像提取方法。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于被所述计算机执行以实现权利要求1-6任一项所述的硬笔书法田字格切片图像提取方法。