CN113065480B

CN113065480B - 书法作品风格的识别方法、装置、电子装置和存储介质

Info

Publication number: CN113065480B
Application number: CN202110382382.9A
Authority: CN
Inventors: 郭洪飞; 李嘉明; 任亚平; 何智慧; 朝宝
Original assignee: Jinan University
Current assignee: Jinan University
Priority date: 2021-04-09
Filing date: 2021-04-09
Publication date: 2023-07-07
Anticipated expiration: 2041-04-09
Also published as: CN113065480A

Abstract

本申请涉及书法作品风格的识别方法、装置、电子装置和存储介质，其中，该书法作品风格的识别方法包括：通过获取待识别的书法作品图像；对书法作品图像进行预处理，并对预处理后的图像进行书法字定位裁剪，得到至少一幅字图像，其中，预处理包括：中值滤波降噪处理、二值化处理、腐蚀膨胀的形态学图像处理；利用胶囊网络模型处理至少一幅字图像，获得每一幅字图像对应的第一分类标签，其中，胶囊网络模型被训练为用于根据字图像得到与该字图像对应的分类标签；根据第一分类标签确定书法作品图像的风格识别结果。通过本申请，解决了相关技术中书法作品风格的识别准确率低、效率不高的问题，实现了书法作品风格的快速准确识别。

Description

书法作品风格的识别方法、装置、电子装置和存储介质

技术领域

本申请涉及书法作品检测识别技术领域，特别是涉及书法作品风格的识别方法、装置、电子装置和存储介质。

背景技术

书法是中华传统文化的瑰宝，是一种修炼身心、陶冶情操、延续中华优秀传统文化的方式，深受中国人民喜爱，甚至很多外国友人也对其有着浓厚的兴趣。人们欣赏书法作品艺术美的同时，也会对书法作品的字体与风格进行探索和研究，以往传统的手工分类书法作品方法已经无法满足现代人们对书法作品研究学习的需求。因此，与时俱进利用计算机技术来指导研究和学习书法，有着极其重要的作用。已经有研究者应用传统的模式识别算法进行书法作品风格的识别，但在面对大量不同的书法作品时，其识别准确率低，成本高，无法满足书法研究工作的需求；同时，有些书法作品较为陈旧，存在较多污垢、斑点、划痕、扭曲等，得到的识别效果很不理想。

相关技术中对书法作品风格进行检测识别，主要是采用卷积神经网络进行识别，而卷积神经网络需要基于大量的图像进行训练，采用卷积神经网络，不能较佳地处理模糊性图像，且池化层中易造成信息的丢失以及降低空间分辨率；同时，当书法作品图像存在翻转、倾斜或任何其它方向性问题时，卷积神经网络的识别准确率低；再者，一种基于旋转不变卷积神经网络的书法字风格分类方法，通过旋转同一图像进行数据增强并训练多个卷积神经网络，虽然在一定程度上缓解了上述书法作品存在方向性动作而造成识别准确率低的问题，但其识别书法字风格的时间增长，成本增加。

目前针对相关技术中对书法作品风格的识别准确率低、效率不高的问题，尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种书法作品风格的识别方法、装置、电子装置和存储介质，以至少解决相关技术中书法作品风格的识别准确率低、效率不高的问题。

第一方面，本申请实施例提供了一种书法作品风格的识别方法，包括：获取待识别的书法作品图像；对所述书法作品图像进行预处理，并对预处理后的图像进行书法字定位裁剪，得到至少一幅字图像，其中，所述预处理包括：中值滤波降噪处理、二值化处理、腐蚀膨胀的形态学图像处理；利用胶囊网络模型处理所述至少一幅字图像，获得每一幅所述字图像对应的第一分类标签，其中，所述胶囊网络模型被训练为用于根据字图像得到与该字图像对应的分类标签，所述分类标签包括该字图像对应各种不同书法风格类别的概率；根据所述第一分类标签确定所述书法作品图像的风格识别结果。

在其中一些实施例中，所述第一分类标签包括第一书法风格类别和第一风格概率，根据所述第一分类标签确定所述书法作品图像的风格识别结果，包括：在所述第一分类标签中检测每一幅所述字图像对应的所述第一书法风格类别和所述第一风格概率；按所述第一书法风格类别分别统计对应的所述第一风格概率，得到多个第二风格概率；从多个所述第二风格概率选取目标风格概率，并将所述目标风格概率对应的所述第一书法风格类别作为所述书法作品图像的识别结果。

在其中一些实施例中，从多个所述第二风格概率中选取目标风格概率包括：检测多个所述第二风格概率的概率值，并将所述概率值最大的所述第二风格概率作为所述目标概率。

在其中一些实施例中，利用胶囊网络模型处理至少一幅所述字图像，获得每一幅所述字图像对应的第一分类标签，包括：利用所述胶囊网络模型从所述字图像中提取第一特征图，并根据预设注意力图和所述第一特征图生成加强特征图；从所述加强特征图中提取特征信息，并将所述特征信息向量化，得到主胶囊层特征向量；通过挤压函数和动态路由算法将所述主胶囊层特征向量处理为数字胶囊层特征向量，其中，所述数字胶囊层特征向量用于表征不同书法风格类别；根据所述数字胶囊层特征向量确定每一幅所述字图像对应的第一分类标签。

在其中一些实施例中，根据所述数字胶囊层特征向量确定每一幅所述字图像对应的第一分类标签包括：计算各个所述数字胶囊层特征向量的L2范数，将各个L2范数中的最大值及其对应的书法风格类别，分别作为所述第一分类标签的第一风格概率和第一书法风格类别。

在其中一些实施例中，对所述书法作品图像进行预处理包括：将所述书法作品图像进行中值滤波降噪处理，生成预设图像分辨率的第一预处理图像；对所述第一预处理图像进行二值化处理，生成第二预处理图像；对所述第二预处理图像进行腐蚀膨胀的形态学图像处理，得到所述预处理后的图像。

在其中一些实施例中，对预处理后的图像进行书法字定位裁剪，得到至少一幅字图像，包括：对所述预处理后的图像进行列方向切割，得到列方向上的投影图；根据所述列方向上的投影图的空白间隙对所述预处理后的图像进行切分处理，生成字符块图像；对所述字符块图像进行行方向切割，得到行方向上的投影图；根据所述行方向上的投影图的空白间隙对所述字符块图像进行切分处理，生成至少一幅字图像；将至少一幅字图像缩放到预设目标尺寸。

第二方面，本申请实施例提供了一种书法作品风格的识别装置，包括：

获取模块，用于获取待识别的书法作品图像。

图像处理模块，用于对所述书法作品图像进行预处理，并对预处理后的图像进行书法字定位裁剪，得到至少一幅字图像，其中，所述预处理包括：中值滤波降噪处理、二值化处理、腐蚀膨胀的形态学图像处理。

分类模块，用于利用胶囊网络模型处理所述至少一幅字图像，获得每一幅所述字图像对应的第一分类标签，其中，所述胶囊网络模型被训练为用于根据字图像得到与该字图像对应的分类标签，所述分类标签包括该字图像对应各种不同书法风格类别的概率。

识别模块，用于根据所述第一分类标签确定所述书法作品图像的风格识别结果。

第三方面，本申请实施例提供了一种电子装置，包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如第一方面所述的书法作品风格的识别方法。

第四方面，本申请实施例提供了一种存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上述第一方面所述的书法作品风格的识别方法。

相比于相关技术，本申请实施例提供的书法作品风格的识别方法、装置、电子装置以及存储介质，通过获取待识别的书法作品图像；对所述书法作品图像进行预处理，并对预处理后的图像进行书法字定位裁剪，得到至少一幅字图像，其中，所述预处理包括：中值滤波降噪处理、二值化处理、腐蚀膨胀的形态学图像处理；利用胶囊网络模型处理所述至少一幅字图像，获得每一幅所述字图像对应的第一分类标签，其中，所述胶囊网络模型被训练为用于根据字图像得到与该字图像对应的分类标签，所述分类标签包括该字图像对应各种不同书法风格类别的概率；根据所述第一分类标签确定所述书法作品图像的风格识别结果。解决了相关技术中书法作品风格的识别准确率低、效率不高的问题，实现了书法作品风格的快速准确识别。

本申请的一个或多个实施例的细节在以下附图和描述中提出，以使本申请的其他特征、目的和优点更加简明易懂。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请实施例的书法作品风格的识别方法的终端的硬件结构框图；

图2是根据本申请实施例的书法作品风格的识别方法的流程图；

图3是根据本申请实施例的胶囊网络模型的构建流程图；

图4是根据本申请优选实施例的书法作品风格的识别方法的流程图；

图5是根据本申请实施例的书法作品风格的识别装置的结构框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行描述和说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。基于本申请提供的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。此外，还可以理解的是，虽然这种开发过程中所作出的努力可能是复杂并且冗长的，然而对于与本申请公开的内容相关的本领域的普通技术人员而言，在本申请揭露的技术内容的基础上进行的一些设计，制造或者生产等变更只是常规的技术手段，不应当理解为本申请公开的内容不充分。

在本申请中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是，本申请所描述的实施例在不冲突的情况下，可以与其它实施例相结合。

除非另作定义，本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制，可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形，意图在于覆盖不排他的包含；例如包含了一系列步骤或模块（单元）的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可以还包括没有列出的步骤或单元，或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接，而是可以包括电气的连接，不管是直接的还是间接的。本申请所涉及的“多个”是指大于或者等于两个。“和/或”描述关联对象的关联关系，表示可以存在三种关系，例如，“A和/或B”可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象，不代表针对对象的特定排序。

本实施例提供的方法实施例可以在终端、计算机或者类似的运算装置中执行。以运行在终端上为例，图1是本申请实施例的书法作品风格的识别方法的终端的硬件结构框图。如图1所示，终端10可以包括一个或多个（图1中仅示出一个）处理器102（处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置）和用于存储数据的存储器104，可选地，上述终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述终端的结构造成限定。例如，终端10还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

存储器104可用于存储计算机程序，例如，应用软件的软件程序以及模块，如本发明实施例中的书法作品风格识别方法对应的计算机程序，处理器102通过运行存储在存储器104内的计算机程序，从而执行各种功能应用以及数据处理，即实现上述的方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括终端10的通信供应商提供的无线网络。在一个实例中，传输设备106包括一个网络适配器（Network Interface Controller，简称为NIC），其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输设备106可以为射频（Radio Frequency，简称为RF）模块，其用于通过无线方式与互联网进行通讯。

本实施例提供了一种运行于上述终端的书法作品风格的识别方法，图2是根据本申请实施例的书法作品风格的识别方法的流程图，如图2所示，该流程包括如下步骤：

步骤S201，获取待识别的书法作品图像。

在本实施例中，通过获取待识别的书法作品图像，将书法作品由纸质文件转换为计算机可处理的图像数据，从而能够进一步利用神经网络对书法作品进行处理与识别，进而提高识别的效率与准确率。

步骤S202，对书法作品图像进行预处理，并对预处理后的图像进行书法字定位裁剪，得到至少一幅字图像，其中，预处理包括：中值滤波降噪处理、二值化处理、腐蚀膨胀的形态学图像处理。

在本实施例中，通过对书法作品图像进行中值滤波降噪处理、二值化处理、腐蚀膨胀的形态学图像处理，去除了书法作品图像中大量的噪声；再对预处理后的图像进行书法字定位裁剪，使得识别分类的准确率更高。由于书法作品大多年代久远，很多书法作品的纸质陈旧，或存在较多污垢、斑点、划痕、扭曲等，所拍摄的书法作品图像存在较大的噪声，可能严重影响对书法家的书法作品的分辨。另外，通常每幅书法作品中含有较多书法字，若直接将每幅书法作品图像作为整体放入到神经网络中处理，难以分辨出不同书法家作品的区别，识别性能极差，因而需先对书法作品进行裁剪处理。

步骤S203，利用胶囊网络模型处理至少一幅字图像，获得每一幅字图像对应的第一分类标签，其中，胶囊网络模型被训练为用于根据字图像得到与该字图像对应的分类标签，分类标签包括该字图像对应各种不同书法风格类别的概率。

在本实施例中，利用胶囊网络模型处理书法作品图像所裁剪得到的字图像，获得每一幅字图像对应的第一分类标签，实现了字图像的自动标记，并得到了该字图像对应书法风格类别及概率。

步骤S204，根据第一分类标签确定书法作品图像的风格识别结果。

上述步骤S201至步骤S204，通过获取待识别的书法作品图像；对书法作品图像进行预处理，并对预处理后的图像进行书法字定位裁剪，得到至少一幅字图像，其中，预处理包括：中值滤波降噪处理、二值化处理、腐蚀膨胀的形态学图像处理；利用胶囊网络模型处理至少一幅字图像，获得每一幅字图像对应的第一分类标签，其中，胶囊网络模型被训练为用于根据字图像得到与该字图像对应的分类标签，分类标签包括该字图像对应各种不同书法风格类别的概率；根据第一分类标签确定书法作品图像的风格识别结果。解决了相关技术中书法作品风格的识别准确率低、效率不高的问题，实现了书法作品风格的快速准确识别。

需要说明的是，在本实施例中，对拍摄或者扫描设备获取的书法作品图像首先进行预处理，去除了书法作品图像中大量的噪声，克服了书法作品陈旧，存在较多污垢、斑点、划痕、扭曲等问题，得到清晰度较高的图像，使得书法作品风格识别更为精准；再对预处理后的图像进行书法字定位裁剪，从而使得通过胶囊网络模型的识别分类的准确率更高；而采用改进胶囊网络进行字图像风格识别，在综合了CNN的优点的同时，考虑了CNN缺失的相对位置、角度等其他信息，详细的姿态信息（如精确的目标位置、旋转、厚度、倾斜、大小等）将在整个网络中被保存，从而使得识别效果有所提升；同时，在胶囊网络中引入注意力机制，更好地学习不同像素和其他位置像素点的关系，从而提升模型的性能，大大提高了识别的准确率。

在其中一些实施例中，第一分类标签包括第一书法风格类别和第一风格概率，根据第一分类标签确定书法作品图像的风格识别结果，包括如下步骤：

步骤1、在第一分类标签中检测每一幅字图像对应的第一书法风格类别和第一风格概率。

步骤2、按第一书法风格类别分别统计对应的第一风格概率，得到多个第二风格概率。

步骤3、从多个第二风格概率选取目标风格概率，并将目标风格概率对应的第一书法风格类别作为书法作品图像的识别结果。

通过上述步骤中的在第一分类标签中检测每一幅字图像对应的第一书法风格类别和第一风格概率；按第一书法风格类别分别统计对应的第一风格概率，得到多个第二风格概率；从多个第二风格概率选取目标风格概率，并将目标风格概率对应的第一书法风格类别作为书法作品图像的识别结果，实现了对整幅书法作品中不同字图像风格识别的结果融合，提高了检测识别的准确率。

在其中一些实施例中，从多个第二风格概率中选取目标风格概率包括：检测多个第二风格概率的概率值，并将概率值最大的第二风格概率作为目标概率。

通过上述步骤中的检测多个第二风格概率的概率值，并将概率值最大的第二风格概率作为目标概率，实现了对整幅书法作品中不同字图像风格识别的结果融合，提高了检测识别的准确率。

在其中一些实施例中，利用胶囊网络模型处理至少一幅字图像，获得每一幅字图像对应的第一分类标签，包括如下步骤：

步骤1、利用胶囊网络模型从字图像中提取第一特征图，并根据预设注意力图和第一特征图生成加强特征图。

步骤2、从加强特征图中提取特征信息，并将特征信息向量化，得到主胶囊层特征向量。

步骤3、通过挤压函数和动态路由算法将主胶囊层特征向量处理为数字胶囊层特征向量，其中，数字胶囊层特征向量用于表征不同书法风格类别。

步骤4、根据数字胶囊层特征向量确定每一幅字图像对应的第一分类标签。

通过上述步骤中的利用胶囊网络模型从字图像中提取第一特征图，并根据预设注意力图和第一特征图生成加强特征图；从加强特征图中提取特征信息，并将特征信息向量化，得到主胶囊层特征向量；通过挤压函数和动态路由算法将主胶囊层特征向量处理为数字胶囊层特征向量，其中，数字胶囊层特征向量用于表征不同书法风格类别；根据数字胶囊层特征向量确定每一幅字图像对应的第一分类标签，实现了注意力机制的特征提取，而胶囊网络，在综合了CNN的优点的同时，考虑了CNN缺失的相对位置、角度等其他信息，关注不同像素和其他位置像素点的关系，大大提高了识别分类的准确率。

在其中一些实施例中，根据数字胶囊层特征向量确定每一幅字图像对应的第一分类标签包括：

计算各个数字胶囊层特征向量的L2范数，将各个L2范数中的最大值及其对应的书法风格类别，分别作为第一分类标签的第一风格概率和第一书法风格类别。

通过上述步骤中的计算各个数字胶囊层特征向量的L2范数，将各个L2范数中的最大值及其对应的书法风格类别，分别作为第一分类标签的第一风格概率和第一书法风格类别；实现了同一书法作品中的各个字图像的书法风格分类的加权统计，从而降低了识别的误差，提升了准确率。

在其中一些实施例中，对书法作品图像进行预处理包括如下步骤：

步骤1、将书法作品图像进行中值滤波降噪处理，生成预设图像分辨率的第一预处理图像。

步骤2、对第一预处理图像进行二值化处理，生成第二预处理图像。

步骤3、对第二预处理图像进行腐蚀膨胀的形态学图像处理，得到预处理后的图像。

通常书法作品图像中存在较多孤立噪声点，首先采用中值滤波对整幅书法作品图像进行去除孤立噪声点处理，得到第一预处理图像；其中，采用中值滤波去噪，原理是把数字图像或数字序列中一点的值用该点的一个邻域中各点值的中值代替，让周围的像素值接近的真实值，从而消除孤立的噪声点。由于大多书法作品的纸页泛黄，因此对第一预处理图像进行二值化处理（将图像上的像素点的灰度值设置为0或255，也就是将整个图像呈现出明显的黑白效果的过程），以白色像素作为背景，黑色像素作为前景，以达到区分书法字（前景）和书法纸（背景）的目的，得到第二预处理图像。此时的第二预处理图像仍存在占像素相对较大的噪声点，例如书法作品的污垢或笔误点等，因而对第二预处理图像进行腐蚀膨胀的形态学图像处理去除这些噪声点（腐蚀算法有着收缩边缘的效果，根据图像中要保留的图像和噪声的对比，选择出合适的结构元，使其能够在保留原图的边缘信息不被腐蚀完全的情况下尽可能地多腐蚀噪声，然后再进行膨胀操作，使图像恢复到接近原图的效果），得到预处理后的图像。实现了书法作品图像中噪声的大量消除，从而使得识别分类的准确率更高。

在其中一些实施例中，对预处理后的图像进行书法字定位裁剪，得到至少一幅字图像，包括如下步骤：

步骤1、对预处理后的图像进行列方向切割，得到列方向上的投影图。

步骤2、根据列方向上的投影图的空白间隙对预处理后的图像进行切分处理，生成字符块图像。

步骤3、对字符块图像进行行方向切割，得到行方向上的投影图。

步骤4、根据行方向上的投影图的空白间隙对字符块图像进行切分处理，生成至少一幅字图像。

步骤5、将至少一幅字图像缩放到预设目标尺寸。

由于书法作品一般从右往左竖行书写，因此先对预处理后的图像进行列方向切割，得到列方向上的投影图，根据列方向上的投影图中的空白间隙对预处理后的图像进行切分，生成列方向的字符块图像；对字符块图像进行行方向切割，得到行方向上的投影图，根据行方向上的投影图中的空白间隙对字符块图像进行切分，生成至少一幅字图像；将至少一幅字图像缩放到预设目标尺寸，由于胶囊网络会通过综合考虑各个像素点之间的位置关系来提高识别准确率，而通常每幅书法作品中含有多个书法字，将书法作品图像裁剪为字图像，不仅避免了不同书法字的笔画像素之间干扰，也实现了输入样本的增加，相较于单字识别，识别分类的准确率更高。

以下将介绍神经网络模型（胶囊网络模型）的构建与训练方法，图3是根据本申请实施例的胶囊网络模型的构建流程图，如图3所示，包括以下步骤：

步骤S301，获取不同书法风格的书法作品图像。不同书法风格的书法作品获取方法可以通过公开数据集获取，或者通过设备拍摄获取。可以采用书法家的名字作为标签。

步骤S302，对获取的不同书法风格的作品图像进行预处理，对预处理后的图像进行书法字定位裁剪，得到的字图像数据集，并对字图像数据集进行标签。预处理包括：中值滤波降噪处理、二值化处理、腐蚀膨胀的形态学图像处理。每一幅字图像仍按照其对应的原始书法作品的标签进行标注。然后还需要对该字图像数据集做随机置乱处理，并进行训练集和验证集划分。

步骤S303，构建胶囊网络模型：

构建第一层输入层，提取输入的字图像的基本特征；

构建第二层特征提取层，将第一层的基本特征转换为第一特征图；

构建第三层注意力机制层，根据预设注意力图和第一特征图生成加强特征图；通过计算图像中任意两个像素点之间的关系，从而学习到某一像素点和其他所有位置（包括较远位置）的像素点之间的关系，这样可以捕获到更大范围内像素间的关系，获取图像的全局几何特征。由于书法字中每一笔画之间有较大联系，例如书法家的起笔和落笔的笔画可以在一定程度上反映书法家的书法风格，因而采用注意力机制层，对不同像素和其他位置像素点的关系进行学习，从而更好地提升模型的性能。

构建第四层空洞卷积层，从第三层得到的加强特征图中提取特征信息。空洞卷积层，加大了感受野，让卷积输出都包含较大范围的信息，提高了模型的性能。

构建第五层主胶囊层，将特征信息向量化并输出主胶囊层特征向量；

构建第六层数字胶囊层，通过挤压函数和动态路由算法将主胶囊层特征向量变换为代表不同书法风格的数字胶囊层特征向量并输出；

构建第七层输出层，输出层计算数字胶囊层中各数字胶囊层特征向量的L2范数，得到不同书法风格对应的L2范数，最后取最大L2范数的书法风格作为识别结果。

步骤S304，将字图像数据集分批次输入到构建的胶囊网络模型中，采用数据迭代器训练方法进行多轮训练，直到模型的损失函数收敛，即损失函数降到最低值后，获得训练好的胶囊网络模型。

下面通过优选实施例对本申请实施例进行描述和说明。

图4是根据本申请优选实施例的书法作品风格的识别方法的流程图。如图4所示，该书法作品风格的识别方法包括如下步骤：

步骤S401，获取不同书法风格的书法作品图像。不同书法风格的书法作品获取方法通过公开数据集获取，其中，包括20位中国著名书法家的风格，每一书法家作品中约有1000-7000个书法字（平均5251个）。采用书法家的名字作为标签。

步骤S402，对获取的不同书法风格的书法作品图像进行预处理，对预处理后的图像进行书法字定位裁剪，得到的字图像数据集。预处理包括：中值滤波降噪处理、二值化处理、腐蚀膨胀的形态学图像处理。每一幅字图像仍按照其对应的原始书法作品的书法家名字进行标签，字图像尺寸统一缩放到 64×64大小。然后还需要对该字图像数据集做随机置乱处理，并按照8:2的比例进行训练集和验证集划分。

步骤S403，构建胶囊网络模型，将字图像数据集中的训练集和验证集数据输入构建的胶囊网络模型，采用数据迭代器训练方法进行多轮训练。

步骤S404，获取待识别的书法作品图像。

步骤S405，对待识别的书法作品图像进行预处理：中值滤波降噪处理、二值化处理、腐蚀膨胀的形态学图像处理，得到预处理后的图像；对预处理后的图像进行书法字定位裁剪，得到至少一幅字图像，其中，字图像缩放尺寸为 64×64大小。

步骤S406，利用胶囊网络模型处理待识别的书法作品对应的字图像，获得每一幅字图像对应的第一分类标签：利用胶囊网络模型从字图像中提取第一特征图，并根据预设注意力图和第一特征图生成加强特征图；从加强特征图中提取特征信息，并将特征信息向量化，得到主胶囊层特征向量；通过挤压函数和动态路由算法将主胶囊层特征向量处理为数字胶囊层特征向量；计算各个数字胶囊层特征向量的L2范数，将各个L2范数中的最大值及其对应的书法风格类别，分别作为第一分类标签的第一风格概率和第一书法风格类别。

步骤S407，检测待识别的书法作品对应的每一幅字图像的第一分类标签，按照第一书法风格类别分别统计概率值，并将最大概率值对应的第一书法风格类别作为书法作品图像的风格识别结果。

需要说明的是，在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。例如，步骤S401与步骤S404、步骤S402与步骤S404、步骤S403与步骤S404。

本实施例还提供了一种书法作品风格的识别装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

图5是根据本申请实施例的书法作品风格的识别装置的结构框图，如图5所示，该装置包括：获取模块51、图像处理模块52、分类模块53、识别模块54。

获取模块51，用于获取待识别的书法作品图像。

图像处理模块52，与获取模块51耦合连接，用于对书法作品图像进行预处理，并对预处理后的图像进行书法字定位裁剪，得到至少一幅字图像，其中，预处理包括：中值滤波降噪处理、二值化处理、腐蚀膨胀的形态学图像处理。

分类模块53，与图像处理模块52耦合连接，用于利用胶囊网络模型处理至少一幅字图像，获得每一幅字图像对应的第一分类标签，其中，胶囊网络模型被训练为用于根据字图像得到与该字图像对应的分类标签，分类标签包括该字图像对应各种不同书法风格类别的概率。

识别模块54，与分类模块53耦合连接，用于根据第一分类标签确定书法作品图像的风格识别结果。

在其中一些实施例中，识别模块54用于在第一分类标签中检测每一幅字图像对应的第一书法风格类别和第一风格概率；按第一书法风格类别分别统计对应的第一风格概率，得到多个第二风格概率；从多个第二风格概率选取目标风格概率，并将目标风格概率对应的第一书法风格类别作为书法作品图像的识别结果。

在其中一些实施例中，识别模块54用于检测多个第二风格概率的概率值，并将概率值最大的第二风格概率作为目标概率。

在其中一些实施例中，分类模块53用于利用胶囊网络模型从字图像中提取第一特征图，并根据预设注意力图和第一特征图生成加强特征图；从加强特征图中提取特征信息，并将特征信息向量化，得到主胶囊层特征向量；通过挤压函数和动态路由算法将主胶囊层特征向量处理为数字胶囊层特征向量，其中，数字胶囊层特征向量用于表征不同书法风格类别；根据数字胶囊层特征向量确定每一幅字图像对应的第一分类标签。

在其中一些实施例中，分类模块53用于计算各个数字胶囊层特征向量的L2范数，将各个L2范数中的最大值及其对应的书法风格类别，分别作为第一分类标签的第一风格概率和第一书法风格类别。

在其中一些实施例中，图像处理模块52用于将书法作品图像进行中值滤波降噪处理，生成预设图像分辨率的第一预处理图像；对第一预处理图像进行二值化处理，生成第二预处理图像；对第二预处理图像进行腐蚀膨胀的形态学图像处理，得到预处理后的图像。

在其中一些实施例中，图像处理模块52用于对预处理后的图像进行列方向切割，得到列方向上的投影图，根据列方向上的投影图的空白间隙对预处理后的图像进行切分处理，生成字符块图像；对字符块图像进行行方向切割，得到行方向上的投影图；根据行方向上的投影图的空白间隙对字符块图像进行切分处理，生成至少一幅字图像；将至少一幅字图像缩放到预设目标尺寸。

需要说明的是，上述各个模块可以是功能模块也可以是程序模块，既可以通过软件来实现，也可以通过硬件来实现。对于通过硬件来实现的模块而言，上述各个模块可以位于同一处理器中；或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。

本实施例还提供了一种电子装置，包括存储器和处理器，该存储器中存储有计算机程序，该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地，上述电子装置还可以包括传输设备以及输入输出设备，其中，该传输设备和上述处理器连接，该输入输出设备和上述处理器连接。

可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

S1，获取待识别的书法作品图像。

S2，对书法作品图像进行预处理，并对预处理后的图像进行书法字定位裁剪，得到至少一幅字图像，其中，预处理包括：中值滤波降噪处理、二值化处理、腐蚀膨胀的形态学图像处理。

S3，利用胶囊网络模型处理至少一幅字图像，获得每一幅字图像对应的第一分类标签，其中，胶囊网络模型被训练为用于根据字图像得到与该字图像对应的分类标签，分类标签包括该字图像对应各种不同书法风格类别的概率。

S4，根据第一分类标签确定书法作品图像的风格识别结果。

需要说明的是，本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例，本实施例在此不再赘述。

另外，结合上述实施例中的书法作品风格的识别方法，本申请实施例可提供一种存储介质来实现。该存储介质上存储有计算机程序；该计算机程序被处理器执行时实现上述实施例中的任意一种书法作品风格的识别方法。

本领域的技术人员应该明白，以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种书法作品风格的识别方法，其特征在于，所述识别方法包括：

获取待识别的书法作品图像；

对所述书法作品图像进行预处理，并对预处理后的图像进行书法字定位裁剪，得到至少一幅字图像，其中，所述预处理包括：中值滤波降噪处理、二值化处理、腐蚀膨胀的形态学图像处理；

利用胶囊网络模型处理所述至少一幅字图像，获得每一幅所述字图像对应的第一分类标签，其中，所述胶囊网络模型被训练为用于根据字图像得到与该字图像对应的分类标签，所述分类标签包括该字图像对应各种不同书法风格类别的概率；

根据所述第一分类标签确定所述书法作品图像的风格识别结果，其中，

所述第一分类标签包括第一书法风格类别和第一风格概率，根据所述第一分类标签确定所述书法作品图像的风格识别结果，包括：

在所述第一分类标签中检测每一幅所述字图像对应的所述第一书法风格类别和所述第一风格概率；

按所述第一书法风格类别分别统计对应的所述第一风格概率，得到多个第二风格概率；

从多个所述第二风格概率选取目标风格概率，并将所述目标风格概率对应的所述第一书法风格类别作为所述书法作品图像的识别结果；

从多个所述第二风格概率中选取目标风格概率包括：检测多个所述第二风格概率的概率值，并将所述概率值最大的所述第二风格概率作为所述目标风格概率；

利用胶囊网络模型处理至少一幅所述字图像，获得每一幅所述字图像对应的第一分类标签，包括：

利用所述胶囊网络模型从所述字图像中提取第一特征图，并根据预设注意力图和所述第一特征图生成加强特征图；

从所述加强特征图中提取特征信息，并将所述特征信息向量化，得到主胶囊层特征向量；

通过挤压函数和动态路由算法将所述主胶囊层特征向量处理为数字胶囊层特征向量，其中，所述数字胶囊层特征向量用于表征不同书法风格类别；

根据所述数字胶囊层特征向量确定每一幅所述字图像对应的第一分类标签；

根据所述数字胶囊层特征向量确定每一幅所述字图像对应的第一分类标签包括：计算各个所述数字胶囊层特征向量的L2范数，将各个L2范数中的最大值及其对应的书法风格类别，分别作为所述第一分类标签的第一风格概率和第一书法风格类别。

2.根据权利要求1所述的书法作品风格的识别方法，其特征在于，对所述书法作品图像进行预处理包括：

将所述书法作品图像进行中值滤波降噪处理，生成预设图像分辨率的第一预处理图像；

对所述第一预处理图像进行二值化处理，生成第二预处理图像；

对所述第二预处理图像进行腐蚀膨胀的形态学图像处理，得到所述预处理后的图像。

3.根据权利要求1所述的书法作品风格的识别方法，其特征在于，对预处理后的图像进行书法字定位裁剪，得到至少一幅字图像，包括：

对所述预处理后的图像进行列方向切割，得到列方向上的投影图；

根据所述列方向上的投影图的空白间隙对所述预处理后的图像进行切分处理，生成字符块图像；

对所述字符块图像进行行方向切割，得到行方向上的投影图；

根据所述行方向上的投影图的空白间隙对所述字符块图像进行切分处理，生成至少一幅字图像；

将至少一幅字图像缩放到预设目标尺寸。

4.一种书法作品风格的识别装置，其特征在于，包括：

获取模块，用于获取待识别的书法作品图像；

图像处理模块，用于对所述书法作品图像进行预处理，并对预处理后的图像进行书法字定位裁剪，得到至少一幅字图像，其中，所述预处理包括：中值滤波降噪处理、二值化处理、腐蚀膨胀的形态学图像处理；

分类模块，用于利用胶囊网络模型处理所述至少一幅字图像，获得每一幅所述字图像对应的第一分类标签，其中，所述胶囊网络模型被训练为用于根据字图像得到与该字图像对应的分类标签，所述分类标签包括该字图像对应各种不同书法风格类别的概率；所述分类模块还用于利用所述胶囊网络模型从所述字图像中提取第一特征图，并根据预设注意力图和所述第一特征图生成加强特征图；从所述加强特征图中提取特征信息，并将所述特征信息向量化，得到主胶囊层特征向量；通过挤压函数和动态路由算法将所述主胶囊层特征向量处理为数字胶囊层特征向量，其中，所述数字胶囊层特征向量用于表征不同书法风格类别；根据所述数字胶囊层特征向量确定每一幅所述字图像对应的第一分类标签；所述分类模块还用于计算各个所述数字胶囊层特征向量的L2范数，将各个L2范数中的最大值及其对应的书法风格类别，分别作为所述第一分类标签的第一风格概率和第一书法风格类别；

识别模块，用于根据所述第一分类标签确定所述书法作品图像的风格识别结果；所述识别模块用于在所述第一分类标签中检测每一幅所述字图像对应的所述第一书法风格类别和所述第一风格概率；按所述第一书法风格类别分别统计对应的所述第一风格概率，得到多个第二风格概率；从多个所述第二风格概率选取目标风格概率，并将所述目标风格概率对应的所述第一书法风格类别作为所述书法作品图像的识别结果；所述识别模块用于检测多个所述第二风格概率的概率值，并将所述概率值最大的所述第二风格概率作为所述目标风格概率。

5.一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行权利要求1至3中任一项所述的书法作品风格的识别方法。

6.一种存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至3中任一项所述的书法作品风格的识别方法。