CN111160147A

CN111160147A - 一种书法作品图像的裁剪和识别方法

Info

Publication number: CN111160147A
Application number: CN201911292817.XA
Authority: CN
Inventors: 许勇; 麻斯亮; 谭艳鸿; 李芃
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2019-12-16
Filing date: 2019-12-16
Publication date: 2020-05-15

Abstract

本发明公开了一种书法作品图像的裁剪和识别方法，包括S1用户通过广角摄像头对书法作品进行拍照；S2对拍摄的书法作品图像进行颜色范围过滤，定位到纸张所在区域，并进行二值化得到二值图像；S3、对二值图像进行垂直投影，得到垂直投影直方图；S4、对二值图像进行水平投影，得到水平投影直方图；S5、根据垂直和水平投影直方图和预设像素点个数阈值逐个裁剪出书法作品中的单字并保存至预设文件夹；S6、调用预先训练好的分类模型进行书法单字识别；S7、根据识别结果判断是否进行后续评价。本发明具有灵活、实时、识别准确率高等优点，并解决了传统方法中对拍摄环境光线、干扰物等要求较高的问题。

Description

一种书法作品图像的裁剪和识别方法

技术领域

本发明涉及计算机视觉识别领域，具体涉及一种书法作品图像的裁剪和识别方法。

背景技术

伴随着经济的快速发展和科技的进步，中国传统文化也受到越来越多人的关注，而书法是中国传统文化的重要表达形式和传播载体，对传承和弘扬中国传统文化有着不可替代的重要作用。在实际教学应用场景中，我们发现对书法作品的裁剪和识别是书法评价的重要组成部分，由于用户实际拍摄的书法作品有可能存在其他噪声元素的干扰，需要准确定位图像中宣纸的位置进行裁剪才能进行后续的识别和评分，而目前针对此类应用场景并没有一套相对完善的系统支持。对此，我们希望设计一套适应实际教学场景的书法作品裁剪和识别系统，用户在前端将拍摄的书法作品图片上传至后台服务器，后端会自动定位书法纸张区域并逐个裁剪和识别出用户书写的单字，便于后续进行智能评价。

发明内容

为了解决现有技术中实际教学场景中书法作用的裁剪和识别问题，本发明提供一种书法作品图像的裁剪和识别方法，本发明的裁剪是基于灰度值投影，识别基于分类器对书法字体进行识别，本发明具有灵活性高、识别率高和泛化能力好等优点。

本发明采用如下技术方案：

一种书法作品图像的裁剪和识别方法，包括如下步骤：

S1用户通过广角摄像头对书法作品进行拍照；

S2对拍摄的书法作品图像进行颜色范围过滤，定位到纸张所在区域，并进行二值化得到二值图像；

S3、对二值图像进行垂直投影，得到垂直投影直方图；

S4、对二值图像进行水平投影，得到水平投影直方图；

S5、根据垂直和水平投影直方图和预设像素点个数阈值逐个裁剪出书法作品中的单字并保存至预设文件夹；

S6、调用预先训练好的分类模型进行书法单字识别；

S7、根据识别结果判断是否进行后续评价。

优选的，所述S2中采用颜色范围过滤定位纸张所在区域。

优选的，所述S3及S4中，按列和按行切分是根据该列或行的有效像素点个数直方图得到。

优选的，所述S5、根据垂直和水平投影直方图和预设像素点个数阈值逐个裁剪出书法作品中的单字并保存至预设文件夹，具体为：

S5.1根据步骤S3和S4得出的垂直和水平投影直方图逐行或列对图像的灰度值为255的像素点求和；

S5.2若灰度值为255的像素点个数占比超过该行或列总像素点个数80％，认为该行或列为有效书写区域；

S5.3在有效书写区域内，得到每个字的上下和左右边界，裁剪出书法作品中的单字保存至指定文件夹。

优选的，所述S6、调用预先训练好的分类模型进行书法单字识别；具体方法为：输入已分类的书法字数据集，利用Resnet-50分类网络进行训练，调用训练生成的权重文件计算输入的书法单字特征概率向量，根据训练集字典找到概率最大的元素对应的汉字。

优选的，所述预设像素点个数阈值为0.8*长度或宽度。

优选的，所述S1中的书法作品为9*9米字格书法作品。

优选的，所述S2中采用颜色范围过滤定位纸张所在区域，具体为：

S2.1给定符合书法纸的颜色RGB范围；

S2.2依次遍历书法作品图像，筛选出书法作品图像中符合预设颜色范围的纸张区域并裁剪出来。

本发明的有益效果：

(1)灵活性：本发明采用颜色范围过滤算法，对大多数场景拍摄的书法作品图像都可以准确定位到纸张区域进行裁剪，解决传统方法中根据特殊点或书法纸格线位置进行裁剪，提高了书法作品拍摄的灵活性。

(2)实时性：我们的裁剪方法主要是对n行m列(n、m分别为拍摄图像的高度和宽度)的矩阵进行数据处理，缩减了全局遍历的次数，计算速度快。

(3)识别准确率高：对拍摄的不同风格书法作品图像都具有很高的识别率，批量测试1840张未经训练的书法单字图片识别准确率在95％左右。

附图说明

图1是本发明的工作流程图；

图2是本发明实施例的工作流程图。

具体实施方式

下面结合实施例及附图，对本发明作进一步地详细说明，但本发明的实施方式不限于此。

实施例

如图1及图2所示，一种书法作品图像的裁剪和识别方法，包括如下步骤：

本实施例用于9*9米字格，且书法纸的线条为红色，将广角镜头设置在书法桌子上，桌面在广角镜头的摄像范围内。

S1用户通过广角镜头对9*9米字格书法作品进行拍照，进入步骤S2；

S2、对拍摄的书法作品图像进行颜色范围过滤，定位到纸张所在区域，并进行二值化得到二值图像，进入步骤S3；

S3、对书法作品图像进行垂直投影，得到垂直投影直方图，进入步骤S4；

S4、对书法作品图像进行水平投影，得到水平投影直方图，进入步骤S5；

S5、根据预设像素点个数阈值逐个裁剪出书法作品中的单字并保存至预设文件夹，进入步骤S6；

S6、调用预先训练好的分类模型进行书法单字识别，进入步骤S7；

S7、将书法单字识别结果保存至指定文件，进入步骤S8；

其中所述步骤S6中调用预先训练好的分类模型进行书法单字识别，具体包含以下步骤：

S6.1利用Resnet-50分类网络对3755个字(约278600张图)进行训练；

S6.2生成.h5后缀的书法单字识别模型文件；

S6.3对裁剪出的书法单字调用识别模型进行识别。

所述步骤S2、基于书法纸的特定颜色RGB值范围，对书法作品图像的纸张区域进行定位，得到纸张区域的上下和左右边界位置，具体包含以下步骤：

S2.1、给定书法纸的特定颜色RGB值范围，进入步骤S2.2；

S2.2、依次遍历书法作品图像，筛选出书法作品图像中符合预设颜色范围的纸张区域并裁剪出来；

所述步骤S5、根据预设像素点个数阈值逐个裁剪出书法作品中的单字并保存至预设文件夹，具体包括以下步骤：

S5.1、根据步骤S3和S4得到的垂直和水平投影信息，逐行判断该行灰度值为0的像素点个数，若灰度值为0的像素点个数不足该行总像素点个数的20％，认为该行所在区域为合法书写区域的一行。

S5.2、逐列判断该列灰度值为0的像素点个数，若灰度值为0的像素点个数不足该列总像素点个数的20％，认为该行所在区域为合法书写区域的一列。

S5.3、分别找到每个书法字的上下和左右边界裁剪出来，保存至预设文件夹。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受所述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种书法作品图像的裁剪和识别方法，其特征在于，包括如下步骤：

S1用户通过广角摄像头对书法作品进行拍照；

S3、对二值图像进行垂直投影，得到垂直投影直方图；

S4、对二值图像进行水平投影，得到水平投影直方图；

S6、调用预先训练好的分类模型进行书法单字识别；

S7、根据识别结果判断是否进行后续评价。

2.根据权利要求1所述的裁剪和识别方法，其特征在于，所述S2中采用颜色范围过滤定位纸张所在区域。

3.根据权利要求1所述的裁剪和识别方法，其特征在于，所述S3及S4中，按列和按行切分是根据该列或行的有效像素点个数直方图得到。

4.根据权利要求1所述的裁剪和识别方法，其特征在于，所述S5、根据垂直和水平投影直方图和预设像素点个数阈值逐个裁剪出书法作品中的单字并保存至预设文件夹，具体为：

5.根据权利要求1所述的裁剪和识别方法，其特征在于，所述S6、调用预先训练好的分类模型进行书法单字识别；具体方法为：输入已分类的书法字数据集，利用Resnet-50分类网络进行训练，调用训练生成的权重文件计算输入的书法单字特征概率向量，根据训练集字典找到概率最大的元素对应的汉字。

6.根据权利要求1所述的裁剪和识别方法，其特征在于，所述预设像素点个数阈值为0.8*长度或宽度。

7.根据权利要求1所述的裁剪和识别方法，其特征在于，所述S1中的书法作品为9*9米字格书法作品。

8.根据权利要求2所述的裁剪和识别方法，其特征在于，所述S2中采用颜色范围过滤定位纸张所在区域，具体为：

S2.1给定符合书法纸的颜色RGB范围；