CN111160147A - 一种书法作品图像的裁剪和识别方法 - Google Patents
一种书法作品图像的裁剪和识别方法 Download PDFInfo
- Publication number
- CN111160147A CN111160147A CN201911292817.XA CN201911292817A CN111160147A CN 111160147 A CN111160147 A CN 111160147A CN 201911292817 A CN201911292817 A CN 201911292817A CN 111160147 A CN111160147 A CN 111160147A
- Authority
- CN
- China
- Prior art keywords
- calligraphy
- cutting
- paper
- calligraphy work
- horizontal projection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000013145 classification model Methods 0.000 claims abstract description 7
- 238000011156 evaluation Methods 0.000 claims abstract description 5
- 238000001914 filtration Methods 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Character Input (AREA)
Abstract
本发明公开了一种书法作品图像的裁剪和识别方法,包括S1用户通过广角摄像头对书法作品进行拍照;S2对拍摄的书法作品图像进行颜色范围过滤,定位到纸张所在区域,并进行二值化得到二值图像;S3、对二值图像进行垂直投影,得到垂直投影直方图;S4、对二值图像进行水平投影,得到水平投影直方图;S5、根据垂直和水平投影直方图和预设像素点个数阈值逐个裁剪出书法作品中的单字并保存至预设文件夹;S6、调用预先训练好的分类模型进行书法单字识别;S7、根据识别结果判断是否进行后续评价。本发明具有灵活、实时、识别准确率高等优点,并解决了传统方法中对拍摄环境光线、干扰物等要求较高的问题。
Description
技术领域
本发明涉及计算机视觉识别领域,具体涉及一种书法作品图像的裁剪和识别方法。
背景技术
伴随着经济的快速发展和科技的进步,中国传统文化也受到越来越多人的关注,而书法是中国传统文化的重要表达形式和传播载体,对传承和弘扬中国传统文化有着不可替代的重要作用。在实际教学应用场景中,我们发现对书法作品的裁剪和识别是书法评价的重要组成部分,由于用户实际拍摄的书法作品有可能存在其他噪声元素的干扰,需要准确定位图像中宣纸的位置进行裁剪才能进行后续的识别和评分,而目前针对此类应用场景并没有一套相对完善的系统支持。对此,我们希望设计一套适应实际教学场景的书法作品裁剪和识别系统,用户在前端将拍摄的书法作品图片上传至后台服务器,后端会自动定位书法纸张区域并逐个裁剪和识别出用户书写的单字,便于后续进行智能评价。
发明内容
为了解决现有技术中实际教学场景中书法作用的裁剪和识别问题,本发明提供一种书法作品图像的裁剪和识别方法,本发明的裁剪是基于灰度值投影,识别基于分类器对书法字体进行识别,本发明具有灵活性高、识别率高和泛化能力好等优点。
本发明采用如下技术方案:
一种书法作品图像的裁剪和识别方法,包括如下步骤:
S1用户通过广角摄像头对书法作品进行拍照;
S2对拍摄的书法作品图像进行颜色范围过滤,定位到纸张所在区域,并进行二值化得到二值图像;
S3、对二值图像进行垂直投影,得到垂直投影直方图;
S4、对二值图像进行水平投影,得到水平投影直方图;
S5、根据垂直和水平投影直方图和预设像素点个数阈值逐个裁剪出书法作品中的单字并保存至预设文件夹;
S6、调用预先训练好的分类模型进行书法单字识别;
S7、根据识别结果判断是否进行后续评价。
优选的,所述S2中采用颜色范围过滤定位纸张所在区域。
优选的,所述S3及S4中,按列和按行切分是根据该列或行的有效像素点个数直方图得到。
优选的,所述S5、根据垂直和水平投影直方图和预设像素点个数阈值逐个裁剪出书法作品中的单字并保存至预设文件夹,具体为:
S5.1根据步骤S3和S4得出的垂直和水平投影直方图逐行或列对图像的灰度值为255的像素点求和;
S5.2若灰度值为255的像素点个数占比超过该行或列总像素点个数80%,认为该行或列为有效书写区域;
S5.3在有效书写区域内,得到每个字的上下和左右边界,裁剪出书法作品中的单字保存至指定文件夹。
优选的,所述S6、调用预先训练好的分类模型进行书法单字识别;具体方法为:输入已分类的书法字数据集,利用Resnet-50分类网络进行训练,调用训练生成的权重文件计算输入的书法单字特征概率向量,根据训练集字典找到概率最大的元素对应的汉字。
优选的,所述预设像素点个数阈值为0.8*长度或宽度。
优选的,所述S1中的书法作品为9*9米字格书法作品。
优选的,所述S2中采用颜色范围过滤定位纸张所在区域,具体为:
S2.1给定符合书法纸的颜色RGB范围;
S2.2依次遍历书法作品图像,筛选出书法作品图像中符合预设颜色范围的纸张区域并裁剪出来。
本发明的有益效果:
(1)灵活性:本发明采用颜色范围过滤算法,对大多数场景拍摄的书法作品图像都可以准确定位到纸张区域进行裁剪,解决传统方法中根据特殊点或书法纸格线位置进行裁剪,提高了书法作品拍摄的灵活性。
(2)实时性:我们的裁剪方法主要是对n行m列(n、m分别为拍摄图像的高度和宽度)的矩阵进行数据处理,缩减了全局遍历的次数,计算速度快。
(3)识别准确率高:对拍摄的不同风格书法作品图像都具有很高的识别率,批量测试1840张未经训练的书法单字图片识别准确率在95%左右。
附图说明
图1是本发明的工作流程图;
图2是本发明实施例的工作流程图。
具体实施方式
下面结合实施例及附图,对本发明作进一步地详细说明,但本发明的实施方式不限于此。
实施例
如图1及图2所示,一种书法作品图像的裁剪和识别方法,包括如下步骤:
本实施例用于9*9米字格,且书法纸的线条为红色,将广角镜头设置在书法桌子上,桌面在广角镜头的摄像范围内。
S1用户通过广角镜头对9*9米字格书法作品进行拍照,进入步骤S2;
S2、对拍摄的书法作品图像进行颜色范围过滤,定位到纸张所在区域,并进行二值化得到二值图像,进入步骤S3;
S3、对书法作品图像进行垂直投影,得到垂直投影直方图,进入步骤S4;
S4、对书法作品图像进行水平投影,得到水平投影直方图,进入步骤S5;
S5、根据预设像素点个数阈值逐个裁剪出书法作品中的单字并保存至预设文件夹,进入步骤S6;
S6、调用预先训练好的分类模型进行书法单字识别,进入步骤S7;
S7、将书法单字识别结果保存至指定文件,进入步骤S8;
其中所述步骤S6中调用预先训练好的分类模型进行书法单字识别,具体包含以下步骤:
S6.1利用Resnet-50分类网络对3755个字(约278600张图)进行训练;
S6.2生成.h5后缀的书法单字识别模型文件;
S6.3对裁剪出的书法单字调用识别模型进行识别。
所述步骤S2、基于书法纸的特定颜色RGB值范围,对书法作品图像的纸张区域进行定位,得到纸张区域的上下和左右边界位置,具体包含以下步骤:
S2.1、给定书法纸的特定颜色RGB值范围,进入步骤S2.2;
S2.2、依次遍历书法作品图像,筛选出书法作品图像中符合预设颜色范围的纸张区域并裁剪出来;
所述步骤S5、根据预设像素点个数阈值逐个裁剪出书法作品中的单字并保存至预设文件夹,具体包括以下步骤:
S5.1、根据步骤S3和S4得到的垂直和水平投影信息,逐行判断该行灰度值为0的像素点个数,若灰度值为0的像素点个数不足该行总像素点个数的20%,认为该行所在区域为合法书写区域的一行。
S5.2、逐列判断该列灰度值为0的像素点个数,若灰度值为0的像素点个数不足该列总像素点个数的20%,认为该行所在区域为合法书写区域的一列。
S5.3、分别找到每个书法字的上下和左右边界裁剪出来,保存至预设文件夹。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受所述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (8)
1.一种书法作品图像的裁剪和识别方法,其特征在于,包括如下步骤:
S1用户通过广角摄像头对书法作品进行拍照;
S2对拍摄的书法作品图像进行颜色范围过滤,定位到纸张所在区域,并进行二值化得到二值图像;
S3、对二值图像进行垂直投影,得到垂直投影直方图;
S4、对二值图像进行水平投影,得到水平投影直方图;
S5、根据垂直和水平投影直方图和预设像素点个数阈值逐个裁剪出书法作品中的单字并保存至预设文件夹;
S6、调用预先训练好的分类模型进行书法单字识别;
S7、根据识别结果判断是否进行后续评价。
2.根据权利要求1所述的裁剪和识别方法,其特征在于,所述S2中采用颜色范围过滤定位纸张所在区域。
3.根据权利要求1所述的裁剪和识别方法,其特征在于,所述S3及S4中,按列和按行切分是根据该列或行的有效像素点个数直方图得到。
4.根据权利要求1所述的裁剪和识别方法,其特征在于,所述S5、根据垂直和水平投影直方图和预设像素点个数阈值逐个裁剪出书法作品中的单字并保存至预设文件夹,具体为:
S5.1根据步骤S3和S4得出的垂直和水平投影直方图逐行或列对图像的灰度值为255的像素点求和;
S5.2若灰度值为255的像素点个数占比超过该行或列总像素点个数80%,认为该行或列为有效书写区域;
S5.3在有效书写区域内,得到每个字的上下和左右边界,裁剪出书法作品中的单字保存至指定文件夹。
5.根据权利要求1所述的裁剪和识别方法,其特征在于,所述S6、调用预先训练好的分类模型进行书法单字识别;具体方法为:输入已分类的书法字数据集,利用Resnet-50分类网络进行训练,调用训练生成的权重文件计算输入的书法单字特征概率向量,根据训练集字典找到概率最大的元素对应的汉字。
6.根据权利要求1所述的裁剪和识别方法,其特征在于,所述预设像素点个数阈值为0.8*长度或宽度。
7.根据权利要求1所述的裁剪和识别方法,其特征在于,所述S1中的书法作品为9*9米字格书法作品。
8.根据权利要求2所述的裁剪和识别方法,其特征在于,所述S2中采用颜色范围过滤定位纸张所在区域,具体为:
S2.1给定符合书法纸的颜色RGB范围;
S2.2依次遍历书法作品图像,筛选出书法作品图像中符合预设颜色范围的纸张区域并裁剪出来。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911292817.XA CN111160147A (zh) | 2019-12-16 | 2019-12-16 | 一种书法作品图像的裁剪和识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911292817.XA CN111160147A (zh) | 2019-12-16 | 2019-12-16 | 一种书法作品图像的裁剪和识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111160147A true CN111160147A (zh) | 2020-05-15 |
Family
ID=70557221
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911292817.XA Pending CN111160147A (zh) | 2019-12-16 | 2019-12-16 | 一种书法作品图像的裁剪和识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111160147A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112800936A (zh) * | 2021-01-25 | 2021-05-14 | 中南大学 | 基于计算机视觉的书法临帖智能评价与指导方法 |
CN115049713A (zh) * | 2022-08-11 | 2022-09-13 | 武汉中导光电设备有限公司 | 图像配准方法、装置、设备及可读存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101615244A (zh) * | 2008-06-26 | 2009-12-30 | 上海梅山钢铁股份有限公司 | 手写板坯号自动识别方法及识别装置 |
CN103093240A (zh) * | 2013-01-18 | 2013-05-08 | 浙江大学 | 书法字识别方法 |
CN103324930A (zh) * | 2013-06-28 | 2013-09-25 | 浙江大学苏州工业技术研究院 | 一种基于灰度直方图二值化的车牌字符分割方法 |
CN105069742A (zh) * | 2015-07-24 | 2015-11-18 | 北京航空航天大学 | 一种基于书写特征编辑的软笔汉字变换方法 |
CN105160691A (zh) * | 2015-08-29 | 2015-12-16 | 电子科技大学 | 基于颜色直方图的车身颜色识别方法 |
CN107609575A (zh) * | 2017-08-21 | 2018-01-19 | 北京华文众合科技有限公司 | 书法评价方法、书法评价装置和电子设备 |
CN108446701A (zh) * | 2018-03-12 | 2018-08-24 | 南昌航空大学 | 一种书法字的最佳包围盒方法 |
CN109460722A (zh) * | 2018-10-26 | 2019-03-12 | 华南理工大学 | 一种车牌智能识别方法 |
-
2019
- 2019-12-16 CN CN201911292817.XA patent/CN111160147A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101615244A (zh) * | 2008-06-26 | 2009-12-30 | 上海梅山钢铁股份有限公司 | 手写板坯号自动识别方法及识别装置 |
CN103093240A (zh) * | 2013-01-18 | 2013-05-08 | 浙江大学 | 书法字识别方法 |
CN103324930A (zh) * | 2013-06-28 | 2013-09-25 | 浙江大学苏州工业技术研究院 | 一种基于灰度直方图二值化的车牌字符分割方法 |
CN105069742A (zh) * | 2015-07-24 | 2015-11-18 | 北京航空航天大学 | 一种基于书写特征编辑的软笔汉字变换方法 |
CN105160691A (zh) * | 2015-08-29 | 2015-12-16 | 电子科技大学 | 基于颜色直方图的车身颜色识别方法 |
CN107609575A (zh) * | 2017-08-21 | 2018-01-19 | 北京华文众合科技有限公司 | 书法评价方法、书法评价装置和电子设备 |
CN108446701A (zh) * | 2018-03-12 | 2018-08-24 | 南昌航空大学 | 一种书法字的最佳包围盒方法 |
CN109460722A (zh) * | 2018-10-26 | 2019-03-12 | 华南理工大学 | 一种车牌智能识别方法 |
Non-Patent Citations (1)
Title |
---|
孙水发,董方敏著: "《ImageJ图像处理与实践》", 北京:国防工业出版社 , pages: 103 - 106 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112800936A (zh) * | 2021-01-25 | 2021-05-14 | 中南大学 | 基于计算机视觉的书法临帖智能评价与指导方法 |
CN112800936B (zh) * | 2021-01-25 | 2022-03-08 | 中南大学 | 基于计算机视觉的书法临帖智能评价与指导方法 |
CN115049713A (zh) * | 2022-08-11 | 2022-09-13 | 武汉中导光电设备有限公司 | 图像配准方法、装置、设备及可读存储介质 |
CN115049713B (zh) * | 2022-08-11 | 2022-11-25 | 武汉中导光电设备有限公司 | 图像配准方法、装置、设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111325203B (zh) | 一种基于图像校正的美式车牌识别方法及系统 | |
CN110059694B (zh) | 电力行业复杂场景下的文字数据的智能识别方法 | |
CN109409366B (zh) | 基于角点检测的畸变图像校正方法及装置 | |
WO2018103608A1 (zh) | 一种文字检测方法、装置及存储介质 | |
Xu et al. | Rethinking text segmentation: A novel dataset and a text-specific refinement approach | |
US9449253B2 (en) | Learning painting styles for painterly rendering | |
CN111967313B (zh) | 一种深度学习目标检测算法辅助的无人机图像标注方法 | |
CN108920992A (zh) | 一种基于深度学习的医药标签条码的定位与识别方法 | |
CN109886978B (zh) | 一种基于深度学习的端到端告警信息识别方法 | |
CN111353961B (zh) | 一种文档曲面校正方法及装置 | |
WO2023284502A1 (zh) | 图像处理方法、装置、设备和存储介质 | |
WO2021139197A1 (zh) | 一种图像处理方法及装置 | |
CN107944451B (zh) | 一种藏文古籍文档的行切分方法及系统 | |
CN111160147A (zh) | 一种书法作品图像的裁剪和识别方法 | |
CN111476210A (zh) | 基于图像的文本识别方法、系统、设备及存储介质 | |
CN112446262A (zh) | 文本分析方法、装置、终端和计算机可读存储介质 | |
CN110210484A (zh) | 基于深度学习的视图像不良文本检测识别的系统与方法 | |
CN109409378A (zh) | 一种纳西东巴经书的数字化处理方法 | |
CN111814576A (zh) | 一种基于深度学习的购物小票图片识别方法 | |
CN111507340B (zh) | 一种基于三维点云数据的目标点云数据提取方法 | |
CN114821620A (zh) | 基于行文本框纵向合并的文本内容提取识别方法 | |
WO2022121021A1 (zh) | 一种身份证号码检测方法、装置、可读存储介质和终端 | |
CN110069664B (zh) | 动漫作品封面图提取方法及其系统 | |
CN111274863A (zh) | 一种基于文本山峰概率密度的文本预测方法 | |
CN113850238B (zh) | 文档检测方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200515 |