CN109918991A - 基于深度学习的软笔书法临摹评价方法 - Google Patents
基于深度学习的软笔书法临摹评价方法 Download PDFInfo
- Publication number
- CN109918991A CN109918991A CN201910018528.4A CN201910018528A CN109918991A CN 109918991 A CN109918991 A CN 109918991A CN 201910018528 A CN201910018528 A CN 201910018528A CN 109918991 A CN109918991 A CN 109918991A
- Authority
- CN
- China
- Prior art keywords
- network
- data set
- evaluation
- copies
- deep learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 51
- 238000013135 deep learning Methods 0.000 title claims abstract description 14
- 238000012545 processing Methods 0.000 claims abstract description 7
- 238000012549 training Methods 0.000 claims description 16
- 238000012360 testing method Methods 0.000 claims description 13
- 238000013480 data collection Methods 0.000 claims description 4
- 238000013210 evaluation model Methods 0.000 claims description 4
- 239000006002 Pepper Substances 0.000 claims description 3
- 238000000605 extraction Methods 0.000 abstract description 4
- 238000000034 method Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 6
- 235000013399 edible fruits Nutrition 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Landscapes
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明涉及一种基于深度学习的软笔书法临摹评价方法,步骤如下:行书文字截取;图片处理,扩充数据集;通过AlexNet网络对扩充后的数据集进行训练;对单个行书文字进行评价,通过相似度和阈值的对比得到最终的评价结果。本发明通过深度学习技术将临摹的书法与原帖相似度作为评价标准,大大减少了人工评价的工作量,并且深度学习提取图像特征更加高级,使得对临摹书法的评价更加公平公正。
Description
技术领域
本发明属于计算机视觉技术领域,涉及手写汉字行书字体的评价,尤其是一种基于深度学习的软笔书法临摹评价方法。
背景技术
书法是我国具有几千年历史的传统艺术,是我们中华民族的特色文化代表之一,它不仅记录着我国悠久的历史文化,还是传播信息的重要方式。书法的点画结构、用笔方法和特征展现出它优美的艺术美感。临摹是提高书法水平最重要的途径,需要对着书法的范本进行反复的训练。在临摹的过程中,需要认真的观察,每个字的每个笔画都需要观察到它的精髓之处。为了达到与原帖更加接近,需要知道与原帖的差别,对临摹的字与原帖进行比较,在比较时是基于原贴与临摹习作之间的相似性来研究。
现在所具有的软笔书法临摹评价体系无论是理论成果还是实践成果都是非常缺乏的,没有形成成熟的软笔书法评价系统。这就导致对软笔书法的评价出现很多问题。现在很多书法比赛的评价都是依靠评审人员进行评审,由于参赛人员和书法汉字数目很多,导致评审人员在评价的时候难免会出现评价不公平、耗时久、评价不准确等问题,使得软笔书法评价质量得不到保证。
目前,已经出现的书法临摹评价方法大多采取人工设计的方式来进行特征的提取,通过浅层的学习来获取低层特征,并不能够提取到图像的高级特征,显然这样的评价效果并不理想。深度学习技术可以通过对大量数据集进行自主学习,学习到图像的层级特征,提取到图像的高级特征。由于Alexnet网络模仿的是人的视觉系统处理信息的方式,对信息不断迭代与抽象化,这正符合书法临摹评价中单字形态相似原则,所以采用Alexnet网络进行书法临摹评价工作。通过深度学习技术,可以大大降低传统临摹评价中特征提取的繁琐程度,并有效的降低人工特征提取时所造成的误差。所以说,利用深度学习技术研究软笔书法临摹评价体系,并将其利用到现实社会中进行书法评价,不仅能快速提高使用者书法水平,而且对传承中国文化有重要意义。
发明内容
为了解决传统评价体系特征提取过于繁琐,人工提取造成误差过大的问题,本发明提供了一种基于深度学习的软笔书法临摹评价方法,
实现本发明的技术方案是:
行书文字截取:对500个行书字体的一级汉字进行截取,并通过缩放调整图片大小,从而得到文字在图片上不同的占比,来达到扩充数据集效果。
图片处理:对缩放后的每张图片中的文字进行不同角度的旋转,然后对旋转后的图片进行加噪、二值化处理。
书法评价:将临摹的行书文字保存为图片,并且调用评价模块将临摹的书法与原帖进行对比,从而得到评价结果。
评价文字模块在被调用之前需要进行模型优化训练,将500*500书样本分为测试集和训练集,通过深度卷积神经网络AlexNet网络模型对500类行书文字进行重复训练和评价,从而得到最优的权重参数以及评价模型。
在进行书法评价的时候,分析得到书法临摹评价原则中的单字形态相似原则符合Alexnet网络处理信息的方式,所以通过AlexNet网络模型获得临摹书法与原帖的特征相似度,对比相似度与所设置的阈值,得到评价结果。
在Caffe的网络框架下,通过多GPU训练的网络模型能够模拟人脑处理信息的方式提取图片高级特征,在效率和准确性方面有很大提升。
本发明的优点和有益效果:
本发明和传统的评价方法相比,具有以下优势:
(1)通过深度学习技术自主学习大量数据集,提取图片的高级特征,与浅层学习来获取图像特征相比,评价效果更好;
(2)通过深度学习技术提取图片特征,避免人工提取特征时带来的误差,提高评价水平;
(3)通过深度学习技术将临摹的书法与原帖相似度作为评价标准,大大减少了人工评价的工作量,并且深度学习提取图像特征更加高级,使得对临摹书法的评价更加公平公正。
附图说明
图1为本发明方法的流程图;
图2为行书书法范本;
图3为不同比例缩放后的文字图片;
图4为图片中a为旋转10°后的图片,b为旋转-10°后的图片;
图5为图片a为加噪0.05后的图片,b为为加噪0.08后的图片;
图6为网络迭代次数与网络损失关系图;
图7为网络迭代次数与识别准确率关系图;
图8为书法临摹的评价结果。
具体实施方式
下面结合附图并通过具体实施方法对本发明作详细的讲述。
基于深度学习的软笔书法临摹评价方法,主要包括范例文字的截取、文字的缩放、图片处理、临摹书法的评价等部分,完成临摹书法与原帖得到对比。其中文字旋转与加噪部分通过MATLAB来实现,临摹评价模块采用Caffe开源框架下Alexnet模型来实现。
文字截取:采用的书法数据集为CSAIA-HWDB1.1数据库中500个汉字的行书体,并对每个字进行截取,得到每个字的截取图片。如图2所示,为截取的一个行书文字。
图片处理:为了提高模型的鲁棒性和评价能力,需要获得更多的数据集来进行网络训练,所以对图片进行缩放、旋转、加噪处理来扩充数据集。具体的步骤如下:
步骤一:对每个行书汉字进行五个不同比例的图像缩放处理,图像的比例缩放可以用矩阵变换的形式来表示,如图3所示,为“砾”按五个不同比例进行等比例缩放后的效果;
步骤二:通过MATLAB程序对图片进行-10°到10°的旋转,间隔为1°。在图像的旋转过程中,图像的大小会发生改变,可以在图片旋转时候增大图像的范围来保证图像的所有像素点都能够得到显示。在图像进行旋转后进行插值处理,即将旋转后的空洞像素点进行填充。如图4,a为旋转10°后的“砾”字图像,b为旋转-10°后的“砾”字图像;
步骤三:对数据集加噪来进一步扩充数据集。对数据添加椒盐噪声,并对每个行书汉字的数据集都加入密度分别为0.05与0.08的椒盐噪声,如图5为相同大小且旋转角度相同下的“砾”字图片。
书法临摹评价:在评价临摹书法之前需要用Alexnet对扩充后的数据集进行训练,然后将临摹后的书法文字进行评价,调用评价的模块,得到评价结果如图8所示。模型训练的步骤如下:
步骤一:对每个书法汉字的数据集按4比1的比例分为训练集与测试集,并生成txt文件;
步骤二:将训练集与数据集转化为Caffe可用的lmdb格式的数据集;
步骤三:对网络进行初始配置;
步骤四:对Alexnet网络进行重复监督训练,并在学习的过程中根据学习误差不断调整网络各层之间的连接权重。并通过测试集进行网络测试,获取网络测试的准确率;
步骤五:网络识别的准确率开始趋于稳定,并且准确率在最高左右的时候,记录迭代次数,选择Alexnet网络迭代次数为记录的次数时的模型作为书法临摹的评价模型。
使用Alexnet网络对扩充后的500类行书体汉字数据集进行训练,网络的初始参数设置包括:基础学习率设为0.01,每100次迭代测试一次,且测试迭代次数为100次,最大迭代次数设为10万次,权重衰减为0.0005等。初始参数设置完成后开始对Alexnet网络进行监督训练,最终得到的网络损失值以及识别准确率随着训练迭代次数增加的变化关系分别在图6和图7中给出。
图6中的横坐标代表网络的迭代次数,纵坐标代表网络在训练时的损失值。由图可以看出,网络训练到65000次的时候,其损失值大约为2.89。随着网络迭代次数的不断增加,网络损失值也在不断下降。网络迭代次数为65000次~66000次的时候,其损失值下降最快。当迭代次数达到67600次的时候,网络开始收敛,其损失值也开始趋于稳定,且最终保持在0.08左右。
图7中的横坐标代表网络的迭代次数,纵坐标代表网络对行书体汉字的识别准确率。由图可以看出,网络训练到65000次的时候,其识别准确率大约为26.16%。随着网络迭代次数的不断增加,网络识别准确率也在不断上升。网络迭代次数为65000次~66000次的时候,其识别准确率上升最快。当迭代次数达到67600次的时候,网络开始收敛,网络识别准确率也开始趋于稳定,且最终保持在98.34%左右。
为了避免过多的网络迭代次数导致的过拟合现象,选择Alexnet网络迭代67600次时的模型作为书法临摹的评价模型并利用该模型对书法数据集中汉字“砾”的不同临摹作品作出评价,书法数据集中汉字“砾”的原贴及其临摹作品评价效果在图8中给出。
图8反应了同一个书法汉字“砾”,不同临摹作品的不同相似度,最上面为原贴,中间为临摹作品一,最下面为临摹作品二。其在一定程度上能够反映出书写者的临摹水平。原贴中被圈出的笔画,其笔锋形态为露锋,临摹作品一中同位置的笔锋形态虽然也为露锋,但相较原贴仍然有一定的差异,而临摹作品二的同位置笔锋形态差异则更大,其笔锋形态为藏锋,因此,最终的评价效果中,临摹作品二与原贴的相似度低于临摹作品一与原贴的相似度的。
Claims (6)
1.一种基于深度学习的软笔书法临摹评价方法,步骤如下:
(1)行书文字截取;
(2)图片处理,扩充数据集;
(3)通过AlexNet网络对扩充后的数据集进行训练;
(4)对单个行书文字进行评价,通过相似度和阈值的对比得到最终的评价结果。
2.根据权利要求1所述的基于深度学习的软笔书法临摹评价方法,其特征在于:步骤(1)是截取书法数据集为CSAIA-HWDB1.1数据库中500个汉字的行书字体,并且按照截取顺序命名。
3.根据权利要求1所述的基于深度学习的软笔书法临摹评价方法,其特征在于:所述的图片处理包括依次进行的图片缩放步骤、图片旋转步骤、图片加噪声步骤。
4.根据权利要求3所述的基于深度学习的软笔书法临摹评价方法,其特征在于:所述的图片加噪声步骤是采用加椒盐噪声的方式,对每一个汉字的数据集都加入两种密度的噪声。
5.根据权利要求1所述的基于深度学习的软笔书法临摹评价方法,其特征在于:通过AlexNet网络对扩充后的数据集进行训练的具体步骤为:
(1)将扩充后的数据集按4:1的比例分为训练集与测试集;
(2)在pycharm环境下通过Python程序生成数据集的标签文件,然后在Caffe的框架下将数据集转化为Caffe可用的lmdb格式数据集;
(3)对网络进行初始配置;
(4)对Alexnet网络进行重复监督训练,并在学习的过程中根据学习误差不断调整网络各层之间的连接权重,并通过测试集进行网络测试,获取网络测试的准确率;
(5)在准确率最高的时候,记录迭代次数,选择Alexnet网络迭代次数为记录的次数时的模型作为书法临摹的评价模型。
6.根据权利要求5所述的基于深度学习的软笔书法临摹评价方法,其特征在于:网络初始设置参数为:基础学习率设为0.01,每100次迭代测试一次,且测试迭代次数为100次,最大迭代次数设为10万次,权重衰减为0.0005。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910018528.4A CN109918991A (zh) | 2019-01-09 | 2019-01-09 | 基于深度学习的软笔书法临摹评价方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910018528.4A CN109918991A (zh) | 2019-01-09 | 2019-01-09 | 基于深度学习的软笔书法临摹评价方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109918991A true CN109918991A (zh) | 2019-06-21 |
Family
ID=66960139
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910018528.4A Pending CN109918991A (zh) | 2019-01-09 | 2019-01-09 | 基于深度学习的软笔书法临摹评价方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109918991A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110532864A (zh) * | 2019-07-19 | 2019-12-03 | 中科君胜(深圳)智能数据科技发展有限公司 | 软笔书法临摹相似性评价方法 |
CN111738330A (zh) * | 2020-06-19 | 2020-10-02 | 电子科技大学中山学院 | 一种手绘临摹作品的智能自动化评分方法 |
CN113361282A (zh) * | 2020-03-04 | 2021-09-07 | 北京沃东天骏信息技术有限公司 | 信息处理方法及装置 |
CN113779289A (zh) * | 2021-08-25 | 2021-12-10 | 广东工业大学 | 基于人工智能的绘画步骤还原系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104715256A (zh) * | 2015-03-04 | 2015-06-17 | 南昌大学 | 一种基于图像方法的书法练习辅助系统及评价方法 |
CN106295687A (zh) * | 2016-08-02 | 2017-01-04 | 安徽翰智文化科技有限公司 | 一种智能书法临摹方法及系统 |
CN108764070A (zh) * | 2018-05-11 | 2018-11-06 | 西北大学 | 一种基于书写视频的笔画分割方法及书法临摹指导方法 |
CN108922311A (zh) * | 2018-07-20 | 2018-11-30 | 亳州学院 | 一种汉字书法训练系统 |
CN113128442A (zh) * | 2021-04-28 | 2021-07-16 | 华南师范大学 | 基于卷积神经网络的汉字书法风格识别方法和评分方法 |
-
2019
- 2019-01-09 CN CN201910018528.4A patent/CN109918991A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104715256A (zh) * | 2015-03-04 | 2015-06-17 | 南昌大学 | 一种基于图像方法的书法练习辅助系统及评价方法 |
CN106295687A (zh) * | 2016-08-02 | 2017-01-04 | 安徽翰智文化科技有限公司 | 一种智能书法临摹方法及系统 |
CN108764070A (zh) * | 2018-05-11 | 2018-11-06 | 西北大学 | 一种基于书写视频的笔画分割方法及书法临摹指导方法 |
CN108922311A (zh) * | 2018-07-20 | 2018-11-30 | 亳州学院 | 一种汉字书法训练系统 |
CN113128442A (zh) * | 2021-04-28 | 2021-07-16 | 华南师范大学 | 基于卷积神经网络的汉字书法风格识别方法和评分方法 |
Non-Patent Citations (1)
Title |
---|
ZHANG JIULONG ET AL.: "Detecting Chinese Calligraphy Style Consistency by Deep Learning and One-Class SVM", 《2017 2ND INTERNATIONAL CONFERENCE ON IMAGE, VISION AND COMPUTING》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110532864A (zh) * | 2019-07-19 | 2019-12-03 | 中科君胜(深圳)智能数据科技发展有限公司 | 软笔书法临摹相似性评价方法 |
CN110532864B (zh) * | 2019-07-19 | 2023-01-31 | 中科君胜(深圳)智能数据科技发展有限公司 | 软笔书法临摹相似性评价方法 |
CN113361282A (zh) * | 2020-03-04 | 2021-09-07 | 北京沃东天骏信息技术有限公司 | 信息处理方法及装置 |
CN113361282B (zh) * | 2020-03-04 | 2024-05-24 | 北京沃东天骏信息技术有限公司 | 信息处理方法及装置 |
CN111738330A (zh) * | 2020-06-19 | 2020-10-02 | 电子科技大学中山学院 | 一种手绘临摹作品的智能自动化评分方法 |
CN113779289A (zh) * | 2021-08-25 | 2021-12-10 | 广东工业大学 | 基于人工智能的绘画步骤还原系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109918991A (zh) | 基于深度学习的软笔书法临摹评价方法 | |
CN109871851B (zh) | 一种基于卷积神经网络算法的汉字书写规范性判定方法 | |
CN106650736A (zh) | 一种基于深度学习的汉字识别系统的实现方法 | |
CN104966097B (zh) | 一种基于深度学习的复杂文字识别方法 | |
CN108664996A (zh) | 一种基于深度学习的古文字识别方法及系统 | |
CN105893968B (zh) | 基于深度学习的文本无关的端到端的笔迹识别方法 | |
JP4745758B2 (ja) | テキストおよびグラフィクスの空間認識およびグループ化 | |
Lian et al. | EasyFont: a style learning-based system to easily build your large-scale handwriting fonts | |
CN107330444A (zh) | 一种基于生成对抗网络的图像自动文本标注方法 | |
JPH06243297A (ja) | 静的及び動的パラメータを使用する自動手書き文字認識装置及び方法 | |
CN104331506A (zh) | 一种面向双语微博文本的多类情感分析方法与系统 | |
CN107145514B (zh) | 基于决策树和svm混合模型的中文句型分类方法 | |
CN108664474A (zh) | 一种基于深度学习的简历解析方法 | |
CN111627088A (zh) | 一种用于数学试卷图像识别的样本自动生成方法 | |
CN109657061A (zh) | 一种针对海量多词短文本的集成分类方法 | |
CN103473308B (zh) | 基于最大间隔张量学习的高维多媒体数据分类方法 | |
CN110705459A (zh) | 数理化公式自动识别方法及装置、模型训练方法及装置 | |
CN109977224A (zh) | 基于卷积神经网络和词向量相结合的新闻分类方法 | |
Mozaffari et al. | IfN/Farsi-Database: a database of Farsi handwritten city names | |
Hayashi et al. | A study of data augmentation for handwritten character recognition using deep learning | |
CN103336830B (zh) | 基于结构语义直方图的图像检索方法 | |
CN112580351B (zh) | 一种基于自信息损失补偿的机器生成文本检测方法 | |
CN111523325A (zh) | 一种基于笔画的中文命名实体识别方法 | |
CN112784579B (zh) | 一种基于数据增强的阅读理解选择题答题方法 | |
CN109240549A (zh) | 一种基于外接数位设备和大数据智能分析的书法矫正器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190621 |