CN105117741A

CN105117741A - 一种书法字风格的识别方法

Info

Publication number: CN105117741A
Application number: CN201510626566.XA
Authority: CN
Inventors: 章夏芬; 聂玮芳
Original assignee: Shanghai Maritime University
Current assignee: Shanghai Maritime University
Priority date: 2015-09-28
Filing date: 2015-09-28
Publication date: 2015-12-02

Abstract

一种书法字风格的识别方法，首先构造书法字训练样本，对训练样本进行风格标注，计算每种风格字体的风格特征值，然后计算待识别书法字的风格特征值，根据风格特征值计算待识别书法字属于书法字训练样本中每一种风格的条件概率，根据条件概率的大小判断待识别书法字的风格。本发明采用特征值对书法字风格进行量化表达，使原先在艺术领域中主观的书法风格变成客观的、可自动分类的，为书法真伪鉴别奠定了分类基础。

Description

一种书法字风格的识别方法

技术领域

本发明涉及计算机数字图像分析和识别，属于模式识别领域，尤其涉及一种书法字风格的识别方法。

背景技术

在印刷技术发明之前，文字都是依靠手写的。优秀的手写作品称为书法。而中华民族五千年文化中有着大量书法作品。为了文化的传承，数字图书馆将这些书籍和作品用高精度扫描仪扫描后，以数字化方式进行传播。书法作品的数字化是把页面扫描成图像，不是技术难题；但数字化后对书法图像内容的分析和解释存在着问题。特别是书法风格的多样性，即书写线条的多变性，使得书法风格的描述和鉴别都停留在主观上，缺少客观的量化过程。现阶段对中国书法风格的描述和鉴赏是在艺术领域进行的，是主观的，会有下面的问题：

1、书法风格的描述和鉴赏主要采用目测法，比如“望气法”，只需观察一眼便可断定风格，缺乏具体特征说明过程，充满“只可意会而不可言传”的“玄妙”。

2、个人记忆力有限，研究侧重点不同，单个书法家往往只掌握一个或几个方面的特征。

3、主观意识左右风格鉴别结果，譬如启功说的“挟长”、“护短”、“尊贤”、“远害”，这会导致纠纷和争议。

与艺术家对书法风格的主观描述相比，客观的书法风格的识别更有助于书法的学习和鉴赏。而目前尚未见相应的基于图像内容的书法风格分类和风格识别系统。

发明内容

本发明提供一种书法字风格的识别方法，采用风格特征值对书法字风格进行量化表达，使在原先在艺术领域中主观的书法风格变成客观的，可以用计算机进行自动分类，为书法真伪鉴别奠定了分类基础。

为了达到上述目的，本发明提供一种书法字风格的识别方法，包含以下步骤：

步骤S1、构造书法字训练样本，对训练样本进行风格标注，计算每种风格字体的风格特征值；

步骤S2、计算待识别书法字的风格特征值；

步骤S3、根据风格特征值计算待识别书法字属于书法字训练样本中每一种风格的条件概率，根据条件概率的大小判断待识别书法字的风格。

所述的步骤S1包含以下步骤：

步骤S1.1、得到书法作品的单个书法字的图像集合；

对扫描得到的书法作品页面图像进行全局二值化，接着根据作品列间距，利用投影直方图将页面切分成多列，然后利用字间距把每一列切成单个书法字，得到单个书法字的图像集合；

步骤S1.2、对书法字图像进行风格标注；

分为五种书法风格：篆书，隶书，楷书，行书和草书；

步骤S1.3、计算书法字的风格特征值；

步骤S1.4、分别计算书法字训练样本中各类风格书法字的风格特征值的平均值和协方差。

所述的步骤S1.3包含以下步骤：

步骤S1.3.1、对书法字图像进行二值化，提取骨架信息；

步骤S1.3.2、提取书法字图像的风格特征值；

所述的风格特征值包含笔画级风格特征和字级风格特征；

所述的笔画级风格特征包含横笔特征和竖笔特征；

所述的横笔特征包含横笔个数、斜率、横向码比值、左斜码比值、右斜码比值、起笔处斜率、收笔处斜率；

所述的竖笔特征包含竖笔个数、斜率、竖向码比值、左斜码比值、右斜码比值；

所述的字级风格特征包含平均笔宽、笔宽变化率、最大笔宽值、最细笔宽值、黑白二值比、高宽比、重心位置、左右墨点比、字在X轴压力变化、字在Y轴压力变化、字在X轴倾斜平衡、字在Y轴倾斜平衡。

所述的步骤S1.3.1包含以下步骤：

步骤S1.3.1.1、将书法字图像转为二值化图像；

步骤S1.3.1.2、利用中轴转换算法获取书法字的骨架，然后再把有两个像素点宽的骨架点变成一个像素点宽的骨架点；

步骤S1.3.1.3、从骨架的一个端点出发，跟踪一个像素点宽的骨架走势，利用八链码序列表达书法字的横笔和竖笔信息。

所述的步骤S1.3.2中，所述的横笔特征具体如下：

检测到的横笔个数f_{h_count}；

横笔笔画的平均斜率f_{h_slope}，即所有横笔笔画斜率的平均值；

横笔笔画的横向码比值f_{h_ratio}，即计算横笔笔画八链码中0和4的比例；

横笔笔画的左斜码比值f_h2，即计算横笔笔画八链码中1和5所占的比例；

横笔笔画的右斜码比值f_h3，即计算横笔笔画八链码中3和7所占的比例；

横笔的起笔处斜率f_{h_head}；

横笔的收笔处斜率f_{h_end}；

所述的竖笔特征具体如下：

检测到的竖笔个数f_{v_count}；

竖笔笔画的平均斜率f_{v_slope}，即所有竖笔笔画斜率的平均值；

竖笔笔画的竖向码比值f_{v_ratio}，即计算竖笔笔画八链编码中6所占的比例；

竖笔笔画的左斜码比值f_v2，即计算竖笔笔画八链编码中1和5所占的比例；

竖笔笔画的右斜码比值f_v3，即计算竖笔笔画八链编码中3和7所占的比例；

所述的字级风格特征具体如下：

对于每个字，以每个骨架点i为中心，圆内像素点95％以上的点为二值前景色的最大半径d_i，假设骨架信息图上一共有n个像素点，则前4项字级风格特征为：

平均笔宽

f_{a v e_w i d t h} = \frac{1}{n} {Σd}_{i};

笔宽变化率

f_{s i g_w i d t h} = \sqrt{\frac{1}{n} Σ_{i = 1}^{n} {(d_{i} - f_{a v e_w i d t h})}^{2}};

最大笔宽值，即所有点宽度的前五分之一宽的平均宽度f_{max_width}；

最细笔宽值，即所有点宽度的后五分之一宽的平均宽度f_{min_width}；

根据二值化图像为M*N像素点，(x,y)为坐标，P(x,y)表示二值图像像素点：

则另外8项字级风格特征值为：

黑白二值比

高宽比f_{aspect_ratio}＝N/M；

重心位置：

字在横线(X轴)的重心

字在纵向(Y轴)的重心

左右墨点比：

字在X轴压力变化特征

f_{s t r e s s_x} = \frac{Σ_{x = M / 2}^{x = M - 1} Σ_{y = 0}^{y = N - 1} {(x - f_{\overset{&OverBar;}{x}})}^{3} \times P (x, y)}{Σ_{x = M / 2}^{x = M - 1} Σ_{y = 0}^{y = N - 1} {(x - f_{\overset{&OverBar;}{x}})}^{3} \times P (x, y) + Σ_{x = 0}^{x = M / 2 - 1} Σ_{y = 0}^{y = N - 1} {(x - f_{\overset{&OverBar;}{x}})}^{3} \times P (x, y)};

字在Y轴压力变化特征

f_{s t r e s s_y} = \frac{Σ_{x = 0}^{x = M - 1} Σ_{y = N / 2}^{y = N - 1} {(y - f_{\overset{&OverBar;}{y}})}^{3} \times P (x, y)}{Σ_{x = 0}^{x = M - 1} Σ_{y = N / 2}^{y + n - 1} {(y - f_{\overset{&OverBar;}{y}})}^{3} \times P (x, y) + Σ_{x = 0}^{x = M - 1} Σ_{y = 0}^{y = N / 2 - 1} {(y - f_{\overset{&OverBar;}{y}})}^{3} \times P (x, y)};

倾斜率：

字在X轴倾斜平衡f_{slant_x}

f_{s t r e s s_x} = \frac{Σ_{x = M / 2}^{x = M - 1} Σ_{y = 0}^{y = N - 1} {(x - f_{\overset{&OverBar;}{x}})}^{2} \times (y - f_{\overset{&OverBar;}{y}}) \times P (x, y)}{Σ_{x = M / 2}^{x = M - 1} Σ_{y = 0}^{y + n - 1} {(x - f_{\overset{&OverBar;}{x}})}^{2} \times (y - f_{\overset{&OverBar;}{y}}) \times P (x, y) + Σ_{x = 0}^{x = M / 2 - 1} Σ_{y = 0}^{y = N - 1} {(x - f_{\overset{&OverBar;}{x}})}^{2} \times (y - f_{\overset{&OverBar;}{y}}) \times P (x, y)};

字在Y轴倾斜平衡f_{slant_y}

f_{s t r e s s_x} = \frac{Σ_{x = 0}^{x = M - 1} Σ_{y = N / 2}^{y = N - 1} (x - f_{\overset{&OverBar;}{x}}) \times {(y - f_{\overset{&OverBar;}{y}})}^{2} \times P (x, y)}{Σ_{x = 0}^{x = M - 1} Σ_{y = N / 2}^{y + n - 1} (x - f_{\overset{&OverBar;}{x}}) \times {(y - f_{\overset{&OverBar;}{y}})}^{2} \times P (x, y) + Σ_{x = 0}^{x = M - 1} Σ_{y = 0}^{y = N / 2 - 1} (x - f_{\overset{&OverBar;}{x}}) \times {(y - f_{\overset{&OverBar;}{y}})}^{2} \times P (x, y)} .

所述的步骤S1.4中，五种书法风格分别是篆书，隶书，楷书，行书和草书，用ω_k表示，其中下标k＝1,2...5是5种风格的标号，每种风格各有M_k个样本，S_j,k代表数据库存储的一个书法字样本，其中j＝1,2,...,M_k，则书法字S_j,k的24个特征变量为f_l,j,k，其中l＝1,2,..,24，每一个书法字样本的24个特征值f_l,j,k组成的特征值向量F_j,k＝[f_1,j,k,f_2,j,k,...,f_24,j,k]；

计算每种风格的训练样本的风格特征值向量的平均值向量：

μ_{k} = \frac{1}{M_{k}} Σ_{j = 1}^{M_{k}} F_{j, k}

计算每种风格的训练样本的风格特征值向量的协方差矩阵：

C_{k} = Σ_{j}^{M_{k}} (F_{j, k} - μ_{k}) {(F_{j, k} - μ_{k})}^{T} .

所述的步骤S2中，采用与步骤S1.3中计算书法字的风格特征值相同的方法来计算待识别书法字的风格特征值。

所述的步骤S3中，根据基于高斯特征模型的线性分类器，计算待识别书法字属于每一种风格的条件概率p_k，计算出5个条件概率值，根据条件概率的值判断书法字的风格，条件概率值最高的那个风格即是这个待识别书法字的风格；

p_{k} (Q | ω_{k}) = W_{k}^{T} F;

其中，是每种风格的训练样本的风格特征值向量的协方差矩阵的逆矩阵，μ_k是每种风格的训练样本的风格特征值向量的平均值向量，Q是待识别书法字，F是待识别书法字的风格特征值，ω_k是书法风格分类标签。

本发明采用风格特征值对书法字风格进行量化表达，使在原先在艺术领域中主观的书法风格变成客观的，可以用计算机进行自动分类，为书法真伪鉴别奠定了分类基础。

附图说明

图1是本发明的流程图。

图2为页面切分成单字的示意图。

图3为骨架笔画提取示例：原图、二值图像以及骨架提取图像。

图4为8方向链码、对应的图像像素位置及其数组编码。

图5为骨架笔画图、跟踪得到的链码表达序列及8个链码所占比例。

图6为基于每个骨架点的笔画宽度计算示例。

图7展示了测试数据库中距5类风格中心概率值最大的前12个书法字。

图8和图9为实施例中待识别书法字属于五类风格的概率。

具体实施方式

以下根据图1～图9，具体说明本发明的较佳实施例。

如图1所示，本发明提供一种书法字风格的识别方法，包含以下步骤：

步骤S2、计算待识别书法字的风格特征值；

步骤S3、计算待识别书法字属于书法字训练样本中每一种风格的条件概率，根据条件概率的大小判断待识别书法字的风格。

所述的步骤S1包含以下步骤：

步骤S1.1、得到书法作品的单个书法字的图像集合；

如图2所示，对扫描得到的书法作品页面图像进行全局二值化，接着根据作品列间距，利用投影直方图将页面切分成多列，然后利用字间距把每一列切成单个书法字，得到单个书法字的图像集合；

如果有重叠的书法字，则通过手工调整最小包围盒的边框进行手工分割；

步骤S1.2、对书法字图像进行风格标注；

分为五类书法风格：篆书、隶书、楷书、行书和草书；

采用交互式界面进行风格标注，将书法风格信息保存到数据库；

步骤S1.3、计算书法字的风格特征值；

所述的步骤S1.3包含以下步骤：

步骤S1.3.1、对书法字图像进行二值化，提取骨架信息；

步骤S1.3.2、提取书法字图像的风格特征值；

所述的风格特征值包含笔画级风格特征和字级风格特征；

所述的笔画级风格特征包含横笔特征和竖笔特征；

所述的字级风格特征包含平均笔宽、笔宽变化率、最大笔宽值、最细笔宽值、黑白二值比、高宽比、重心位置、左右墨点比、倾斜率；

将提取到的风格特征值存入数据库中。

所述的步骤S1.3.1包含以下步骤：

步骤S1.3.1.1、将书法字图像转为二值化图像；

利用已有的大津二值化算法将书法字图像像素点的灰度值变成1或者0；

步骤S1.3.1.2、如图3所示，利用中轴转换算法获取书法字的骨架，然后再把有两个像素点宽的骨架点变成一个像素点宽的骨架点；

所述的中轴转换算法可采用IEEETransactionsonPatternAnalysisandMachineIntelligence，2002年第24卷第1刊，59-74页：论文名字：用主曲线分段细化法(Piecewiselinearskeletonizationusingprincipalcurves)中提到的算法；

所述的把两个像素点宽的骨架点变成一个像素点具体做法是：一个骨架点的8邻域内，若横向或纵向有两个连续的骨架像素点，则删除其中一个点；

步骤S1.3.1.3、如图4和图5所示，从骨架的一个端点出发，跟踪一个像素点宽的骨架走势，利用八链码(用数字0到7表达下一个骨架点与当前骨架点的方向关系)序列表达书法字的横笔和竖笔信息，将这些信息存入数据库中。

所述的步骤S1.3.2中，所述的横笔特征具体如下：

检测到的横笔个数f_{h_count}；

横笔的起笔处斜率f_{h_head}；

横笔的收笔处斜率f_{h_end}；

所述的竖笔特征具体如下：

检测到的竖笔个数f_{v_count}；

竖笔笔画的竖向码比值f_{v_ratio}，即计算竖笔笔画八链码中6所占的比例；

竖笔笔画的左斜码比值f_v2，即计算竖笔笔画八链码中1和5所占的比例；

竖笔笔画的右斜码比值f_v3，即计算竖笔笔画八链码中3和7所占的比例；

所述的字级风格特征具体如下：

对于每个字，以每个骨架点i为中心，圆内像素点95％以上的点为二值前景色(字的颜色)的最大半径d_i，如图6所示，假设骨架信息图上一共有n个像素的骨架点，则前4项字级风格特征为：

平均笔宽

f_{a v e_w i d t h} = \frac{1}{n} {Σd}_{i};

笔宽变化率

f_{s i g_w i d t h} = \sqrt{\frac{1}{n} Σ_{i = 1}^{n} {(d_{i} - f_{a v e_w i d t h})}^{2}};

最大笔宽值，即前五分之一宽的平均宽度f_{max_width}；

最细笔宽值，即后五分之一宽的平均宽度f_{min_width}；

根据二值化图像为M*N像素点，(x,y)为坐标，P(x,y)表示二值图像：

则另外8项字级风格特征值为：

黑白二值比

高宽比f_{aspect_ratio}＝N/M；

重心位置：

字在横线(X轴)的重心

字在纵向(Y轴)的重心

左右墨点比：

字在X轴压力变化

f_{s t r e s s_x} = \frac{Σ_{x = M / 2}^{x = M - 1} Σ_{y = 0}^{y = N - 1} {(x - f_{\overset{&OverBar;}{x}})}^{3} \times P (x, y)}{Σ_{x = M / 2}^{x = M - 1} Σ_{y = 0}^{y = N - 1} {(x - f_{\overset{&OverBar;}{x}})}^{3} \times P (x, y) + Σ_{x = 0}^{x = M / 2 - 1} Σ_{y = 0}^{y = N - 1} {(x - f_{\overset{&OverBar;}{x}})}^{3} \times P (x, y)};

字在Y轴压力变化

f_{s t r e s s_y} = \frac{Σ_{x = 0}^{x = M - 1} Σ_{y = N / 2}^{y = N - 1} {(y - f_{\overset{&OverBar;}{y}})}^{3} \times P (x, y)}{Σ_{x = 0}^{x = M - 1} Σ_{y = N / 2}^{y + n - 1} {(y - f_{\overset{&OverBar;}{y}})}^{3} \times P (x, y) + Σ_{x = 0}^{x = M - 1} Σ_{y = 0}^{y = N / 2 - 1} {(y - f_{\overset{&OverBar;}{y}})}^{3} \times P (x, y)};

倾斜率：

字在X轴倾斜平衡f_{slant_x}

f_{s t r e s s_x} = \frac{Σ_{x = M / 2}^{x = M - 1} Σ_{y = 0}^{y = N - 1} {(x - f_{\overset{&OverBar;}{x}})}^{2} \times (y - f_{\overset{&OverBar;}{y}}) \times P (x, y)}{Σ_{x = M / 2}^{x = M - 1} Σ_{y = 0}^{y + n - 1} {(x - f_{\overset{&OverBar;}{x}})}^{2} \times (y - f_{\overset{&OverBar;}{y}}) \times P (x, y) + Σ_{x = 0}^{x = M / 2 - 1} Σ_{y = 0}^{y = N - 1} {(x - f_{\overset{&OverBar;}{x}})}^{2} \times (y - f_{\overset{&OverBar;}{y}}) \times P (x, y)};

字在Y轴倾斜平衡f_{slant_y}

f_{s t r e s s_x} = \frac{Σ_{x = 0}^{x = M - 1} Σ_{y = N / 2}^{y = N - 1} (x - f_{\overset{&OverBar;}{x}}) \times {(y - f_{\overset{&OverBar;}{y}})}^{2} \times P (x, y)}{Σ_{x = 0}^{x = M - 1} Σ_{y = N / 2}^{y + n - 1} (x - f_{\overset{&OverBar;}{x}}) \times {(y - f_{\overset{&OverBar;}{y}})}^{2} \times P (x, y) + Σ_{x = 0}^{x = M - 1} Σ_{y = 0}^{y = N / 2 - 1} (x - f_{\overset{&OverBar;}{x}}) \times {(y - f_{\overset{&OverBar;}{y}})}^{2} \times P (x, y)} .

所述的步骤S1.4中，五种书法风格分别是篆书、隶书、楷书、行书和草书，用ω_k表示，其中k＝1,2...5，每种风格各有M_k个样本，S_j,k代表数据库存储的一个书法字样本(其中j＝1,2,...,M_k)，则书法字S_j,k的24个特征变量为f_l,j,k，其中l＝1,2,..,24，每一个书法字样本的24个特征值f_l,j,k组成的特征值向量F_j,k＝[f_1,j,k,f_2,j,k,...,f_24,j,k]。

计算每种风格的训练样本的风格特征值向量的平均值向量：

μ_{k} = \frac{1}{M_{k}} Σ_{j = 1}^{M_{k}} F_{j, k}

计算每种风格的训练样本的风格特征值向量的协方差矩阵：

C_{k} = Σ_{j}^{M_{k}} (F_{j, k} - μ_{k}) {(F_{j, k} - μ_{k})}^{T};

如图7所示，按标注的5类风格，分别计算训练样本24项特征值均值和方差，展示5类中离聚类中心最接近的前12个书法字，第一行为第1类风格(篆书)、第二行为第2类风格(隶书)、第三行为第3类风格(楷书)、第四行为第4类风格(行书)、第五行为第5类风格(草书)。

所述的步骤S3中，根据基于高斯特征模型的线性分类器，计算待识别书法字属于每一种风格的条件概率p_k；

p_{k} (Q | ω_{k}) = W_{k}^{T} F;

其中，是每种风格的训练样本的风格特征值向量的协方差矩阵的逆矩阵，μ_k是每种风格的训练样本的风格特征值向量的平均值向量，Q是待识别书法字，F是待识别书法字的风格特征值，ω_k是书法风格分类标签；

计算出5个条件概率值，根据条件概率的值判断书法字的风格，条件概率值最高的那个风格即是这个待识别书法字的风格。

实施例：下面结合本发明的方法详细说明该实例实施的具体步骤，如下：

1、使用由CADAL(http://www.cadal.zju.edu.cn)扫描中心扫描得到的《中国书法全集》、《中国历代楷书真迹》、《中国历代帝王御藏名帖》、《汉曹全碑》、《柳公权玄秘塔碑》等54卷书法书籍的页面图像。对这些书法作品页面图像进行全局二值化。接着根据作品列间距，利用投影直方图将页面切分成多列，然后利用字间距把每一列被切成单个书法字。如果有重叠的书法字，则通过手工调整最小包围盒的线进行手工分割。得到单个书法字的图像集合。一共得到8279个书法字图像。

2、对8279个书法字图像进行风格标注，构造训练样本。我们分为五种书法风格：篆书、隶书、楷书、行书和草书，采用交互式界面进行风格标注，将书法风格信息保存到数据库。

3、对8279个书法字图像进行二值化，提取骨架信息。采用中轴变换算法获取书法字的骨架信息，接着使每个骨架点宽度都为1，在8邻域内，若横向或纵向有两个连续的骨架像素点，则删除其中一个点，之后利用从骨架的一个端点出发，跟踪一个像素点宽的骨架走势，形成八链码序列表达的所有横笔和竖笔的跟踪信息，将跟踪信息存入数据库。

4、将步骤3处理后的书法字图像进行横笔和竖笔风格特征提取，得到横笔个数、斜率、横向码比值、左斜码比值、右斜码比值、起笔处斜率及收笔处斜率共7项横笔特征，得到竖笔个数、斜率、竖向码比值、左斜码比值、右斜码比值共5项竖笔特征；一共12项笔画级的风格特征。

5、对二值化图像提取字级风格特征12项，集中在平均笔宽、笔宽变化率、最大笔宽值、最细笔宽值、黑白二值比、高宽比、重心位置(2项)、左右墨点比、字在X轴压力变化、字在Y轴压力变化、字在X轴倾斜平衡以及字在Y轴倾斜平衡；加上12项笔画级风格，每个字一共有24项风格特征值，将这些信息存在数据库中。

6、利用存储在数据库中的风格特征值，对数据库中的篆书、隶书、楷书、行书和草书共5类风格，分别计算各自24项风格特征的均值和协方差。

7、当用户提交风格未知、待识别书法字图像时，根据步骤3～5提取该字图像的24项风格特征。

8、根据基于高斯特征模型的线性分类器，分别计算风格未知、待识别书法字的24项特征与5类风格的24项特征的距离，以归一化后的距离为基础形成条件概率。根据条件概率的值判断书法字的风格，条件概率值最高的那个风格即是这个待识别书法字的风格.

本实例的运行结果如图8和图9所示，将两个待识别书法字图像进行处理后提取其风格特征，根据高斯特征模型的线性分类器，计算出其属于不同风格的条件概率，最后识别其书法风格。图8为未知风格属于五类风格的概率，该字属于风格1(篆书)的值最大，说明该字是为是风格1(篆书)的特征占据主导地位。图9为未知风格属于五类风格的概率，该字属于风格4(行书)的概率最大，属于风格5(草书)的值次大，说明该字具有行书风格占据明显地位，但具有小部分草书特征。

本发明采用风格特征值对书法字风格进行量化表达，使原先在艺术领域中主观的书法风格变成客观的，可以用计算机进行自动分类，为书法真伪鉴别奠定了分类基础。

尽管本发明的内容已经通过上述优选实施例作了详细介绍，但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后，对于本发明的多种修改和替代都将是显而易见的。因此，本发明的保护范围应由所附的权利要求来限定。

Claims

1.一种书法字风格的识别方法，其特征在于，包含以下步骤：

步骤S2、计算待识别书法字的风格特征值；

2.如权利要求1所述的书法字风格的识别方法，其特征在于，所述的步骤S1包含以下步骤：

步骤S1.1、得到书法作品的单个书法字的图像集合；

步骤S1.2、对书法字图像进行风格标注；

分为五种书法风格：篆书、隶书、楷书、行书和草书；

步骤S1.3、计算书法字的风格特征值；

3.如权利要求2所述的书法字风格的识别方法，其特征在于，所述的步骤S1.3包含以下步骤：

步骤S1.3.1、对书法字图像进行二值化，提取骨架信息；

步骤S1.3.2、提取书法字图像的风格特征值；

所述的风格特征值包含笔画级风格特征和字级风格特征；

所述的笔画级风格特征包含横笔特征和竖笔特征；

所述的字级风格特征包含平均笔宽、笔宽变化率、最大笔宽值、最细笔宽值、黑白二值比、高宽比、重心位置、左右墨点比、倾斜率、字在X轴压力变化、字在Y轴压力变化、字在X轴倾斜平衡、字在Y轴倾斜平衡。

4.如权利要求3所述的书法字风格的识别方法，其特征在于，所述的步骤S1.3.1包含以下步骤：

步骤S1.3.1.1、将书法字图像转为二值化图像；

5.如权利要求4所述的书法字风格的识别方法，其特征在于，所述的步骤S1.3.2中，所述的横笔特征具体如下：

检测到的横笔个数f_{h_count}；

横笔笔画的横向码比值f_{h_ratio}，即计算横笔笔画八链编码中0和4的比例；

横笔笔画的左斜码比值f_h2，即计算横笔笔画八链编码中1和5所占的比例；

横笔笔画的右斜码比值f_h3，即计算横笔笔画八链编码中3和7所占的比例；

横笔的起笔处斜率f_{h_head}；

横笔的收笔处斜率f_{h_end}；

所述的竖笔特征具体如下：

检测到的竖笔个数f_{v_count}；

所述的字级风格特征具体如下：

平均笔宽

f_{a v e_w i d t h} = \frac{1}{n} {Σd}_{i};

笔宽变化率

f_{s i g_w i d t h} = \sqrt{\frac{1}{n} Σ_{i = 1}^{n} {(d_{i} - f_{a v e_w i d t h})}^{2}};

最大笔宽值，即所有点宽度的前五分之一的平均宽度f_{max_width}；

最细笔宽值，即所有点宽度的后五分之一的平均宽度f_{min_width}；

则字级风格特征值的后8项为：

黑白二值比

高宽比f_{aspect_ratio}＝N/M；

重心位置：

字在横线(X轴)的重心

f_{\overset{&OverBar;}{x}} = \frac{Σ_{x = 0}^{x = M - 1} Σ_{y = 0}^{y = N - 1} x \times P (x, y)}{Σ_{x = 0}^{x = M - 1} Σ_{y = 0}^{y = N - 1} P (x, y)};

字在纵向(Y轴)的重心

f_{\overset{&OverBar;}{y}} = \frac{Σ_{x = 0}^{x = M - 1} Σ_{y = 0}^{y = N - 1} y \times P (x, y)}{Σ_{x = 0}^{x = M - 1} Σ_{y = 0}^{y = N - 1} P (x, y)};

左右墨点比：

字在X轴压力变化特征

f_{s t r e s s_x} = \frac{Σ_{x = M / 2}^{x = M - 1} Σ_{y = 0}^{y = N - 1} {(x - f_{\overset{&OverBar;}{x}})}^{3} \times P (x, y)}{Σ_{x = M / 2}^{x = M - 1} Σ_{y = 0}^{y = N - 1} {(x - f_{\overset{&OverBar;}{x}})}^{3} \times P (x, y) + Σ_{x = 0}^{x = M / 2 - 1} Σ_{y = 0}^{y = N - 1} {(x - f_{\overset{&OverBar;}{x}})}^{3} \times P (x, y)};

字在Y轴压力变化特征

f_{s t r e s s_y} = \frac{Σ_{x = 0}^{x = M - 1} Σ_{y = N / 2}^{y = N - 1} {(y - f_{\overset{&OverBar;}{y}})}^{3} \times P (x, y)}{Σ_{x = 0}^{x = M - 1} Σ_{y = N / 2}^{y + n - 1} {(y - f_{\overset{&OverBar;}{y}})}^{3} \times P (x, y) + Σ_{x = 0}^{x = M - 1} Σ_{y = 0}^{y = N / 2 - 1} {(y - f_{\overset{&OverBar;}{y}})}^{3} \times P (x, y)};

倾斜率：

字在X轴倾斜平衡f_{slant_x}

f_{s t r e s s_x} = \frac{Σ_{x = M / 2}^{x = M - 1} Σ_{y = 0}^{y = N - 1} {(x - f_{\overset{&OverBar;}{x}})}^{2} \times (y - f_{\overset{&OverBar;}{y}}) \times P (x, y)}{Σ_{x = M / 2}^{x = M - 1} Σ_{y = 0}^{y + n - 1} {(x - f_{\overset{&OverBar;}{x}})}^{2} \times (y - f_{\overset{&OverBar;}{y}}) \times P (x, y) + Σ_{x = 0}^{x = M / 2 - 1} Σ_{y = 0}^{y = N - 1} {(x - f_{\overset{&OverBar;}{x}})}^{2} \times (y - f_{\overset{&OverBar;}{y}}) \times P (x, y)};

字在Y轴倾斜平衡f_{slant_y}

f_{s t r e s s_x} = \frac{Σ_{x = 0}^{x = M - 1} Σ_{y = N / 2}^{y = N - 1} (x - f_{\overset{&OverBar;}{x}}) \times {(y - f_{\overset{&OverBar;}{y}})}^{2} \times P (x, y)}{Σ_{x = 0}^{x = M - 1} Σ_{y = N / 2}^{y + n - 1} (x - f_{\overset{&OverBar;}{x}}) \times {(y - f_{\overset{&OverBar;}{y}})}^{2} \times P (x, y) + Σ_{x = 0}^{x = M - 1} Σ_{y = 0}^{y = N / 2 - 1} (x - f_{\overset{&OverBar;}{x}}) \times {(y - f_{\overset{&OverBar;}{y}})}^{2} \times P (x, y)} .

6.如权利要求5所述的书法字风格的识别方法，其特征在于，所述的步骤S1.4中，五种书法风格分别是篆书，隶书，楷书，行书和草书，用ω_k表示，其中下标k＝1,2...5是5种风格的标号，每种风格各有M_k个样本，S_j,k代表数据库存储的一个书法字样本，其中j＝1,2,...,M_k，则书法字S_j,k的24个特征变量为f_l,j,k，其中l＝1,2,..,24，每一个书法字样本的24个特征值f_l,j,k组成特征值向量F_j,k＝[f_1,j,k,f_2,j,k,...,f_24,j,k]；

计算每种风格的训练样本的风格特征值向量的平均值向量：

μ_{k} = \frac{1}{M_{k}} Σ_{j = 1}^{M_{k}} F_{j, k}

计算每种风格的训练样本的风格特征值向量的协方差矩阵：

C_{k} = Σ_{j}^{M_{k}} (F_{j, k} - μ_{k}) {(F_{j, k} - μ_{k})}^{T} .

7.如权利要求5所述的书法字风格的识别方法，其特征在于，所述的步骤S2中，采用与步骤S1.3中计算书法字的风格特征值相同的方法来计算待识别书法字的风格特征值。

8.如权利要求6或7所述的书法字风格的识别方法，其特征在于，所述的步骤S3中，根据基于高斯特征模型的线性分类器，计算待识别书法字属于每一种风格的条件概率p_k，一共有5个条件概率值，根据条件概率的值判断书法字的风格，条件概率值最高的那个风格即是这个待识别书法字的主要风格；

p_{k} (Q | ω_{k}) = W_{k}^{T} F;