CN105117741A - 一种书法字风格的识别方法 - Google Patents

一种书法字风格的识别方法 Download PDF

Info

Publication number
CN105117741A
CN105117741A CN201510626566.XA CN201510626566A CN105117741A CN 105117741 A CN105117741 A CN 105117741A CN 201510626566 A CN201510626566 A CN 201510626566A CN 105117741 A CN105117741 A CN 105117741A
Authority
CN
China
Prior art keywords
style
word
sigma
writing brush
ratio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510626566.XA
Other languages
English (en)
Inventor
章夏芬
聂玮芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Maritime University
Original Assignee
Shanghai Maritime University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Maritime University filed Critical Shanghai Maritime University
Priority to CN201510626566.XA priority Critical patent/CN105117741A/zh
Publication of CN105117741A publication Critical patent/CN105117741A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • G06V30/2455Discrimination between machine-print, hand-print and cursive writing

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

一种书法字风格的识别方法,首先构造书法字训练样本,对训练样本进行风格标注,计算每种风格字体的风格特征值,然后计算待识别书法字的风格特征值,根据风格特征值计算待识别书法字属于书法字训练样本中每一种风格的条件概率,根据条件概率的大小判断待识别书法字的风格。本发明采用特征值对书法字风格进行量化表达,使原先在艺术领域中主观的书法风格变成客观的、可自动分类的,为书法真伪鉴别奠定了分类基础。

Description

一种书法字风格的识别方法
技术领域
本发明涉及计算机数字图像分析和识别,属于模式识别领域,尤其涉及一种书法字风格的识别方法。
背景技术
在印刷技术发明之前,文字都是依靠手写的。优秀的手写作品称为书法。而中华民族五千年文化中有着大量书法作品。为了文化的传承,数字图书馆将这些书籍和作品用高精度扫描仪扫描后,以数字化方式进行传播。书法作品的数字化是把页面扫描成图像,不是技术难题;但数字化后对书法图像内容的分析和解释存在着问题。特别是书法风格的多样性,即书写线条的多变性,使得书法风格的描述和鉴别都停留在主观上,缺少客观的量化过程。现阶段对中国书法风格的描述和鉴赏是在艺术领域进行的,是主观的,会有下面的问题:
1、书法风格的描述和鉴赏主要采用目测法,比如“望气法”,只需观察一眼便可断定风格,缺乏具体特征说明过程,充满“只可意会而不可言传”的“玄妙”。
2、个人记忆力有限,研究侧重点不同,单个书法家往往只掌握一个或几个方面的特征。
3、主观意识左右风格鉴别结果,譬如启功说的“挟长”、“护短”、“尊贤”、“远害”,这会导致纠纷和争议。
与艺术家对书法风格的主观描述相比,客观的书法风格的识别更有助于书法的学习和鉴赏。而目前尚未见相应的基于图像内容的书法风格分类和风格识别系统。
发明内容
本发明提供一种书法字风格的识别方法,采用风格特征值对书法字风格进行量化表达,使在原先在艺术领域中主观的书法风格变成客观的,可以用计算机进行自动分类,为书法真伪鉴别奠定了分类基础。
为了达到上述目的,本发明提供一种书法字风格的识别方法,包含以下步骤:
步骤S1、构造书法字训练样本,对训练样本进行风格标注,计算每种风格字体的风格特征值;
步骤S2、计算待识别书法字的风格特征值;
步骤S3、根据风格特征值计算待识别书法字属于书法字训练样本中每一种风格的条件概率,根据条件概率的大小判断待识别书法字的风格。
所述的步骤S1包含以下步骤:
步骤S1.1、得到书法作品的单个书法字的图像集合;
对扫描得到的书法作品页面图像进行全局二值化,接着根据作品列间距,利用投影直方图将页面切分成多列,然后利用字间距把每一列切成单个书法字,得到单个书法字的图像集合;
步骤S1.2、对书法字图像进行风格标注;
分为五种书法风格:篆书,隶书,楷书,行书和草书;
步骤S1.3、计算书法字的风格特征值;
步骤S1.4、分别计算书法字训练样本中各类风格书法字的风格特征值的平均值和协方差。
所述的步骤S1.3包含以下步骤:
步骤S1.3.1、对书法字图像进行二值化,提取骨架信息;
步骤S1.3.2、提取书法字图像的风格特征值;
所述的风格特征值包含笔画级风格特征和字级风格特征;
所述的笔画级风格特征包含横笔特征和竖笔特征;
所述的横笔特征包含横笔个数、斜率、横向码比值、左斜码比值、右斜码比值、起笔处斜率、收笔处斜率;
所述的竖笔特征包含竖笔个数、斜率、竖向码比值、左斜码比值、右斜码比值;
所述的字级风格特征包含平均笔宽、笔宽变化率、最大笔宽值、最细笔宽值、黑白二值比、高宽比、重心位置、左右墨点比、字在X轴压力变化、字在Y轴压力变化、字在X轴倾斜平衡、字在Y轴倾斜平衡。
所述的步骤S1.3.1包含以下步骤:
步骤S1.3.1.1、将书法字图像转为二值化图像;
步骤S1.3.1.2、利用中轴转换算法获取书法字的骨架,然后再把有两个像素点宽的骨架点变成一个像素点宽的骨架点;
步骤S1.3.1.3、从骨架的一个端点出发,跟踪一个像素点宽的骨架走势,利用八链码序列表达书法字的横笔和竖笔信息。
所述的步骤S1.3.2中,所述的横笔特征具体如下:
检测到的横笔个数fh_count
横笔笔画的平均斜率fh_slope,即所有横笔笔画斜率的平均值;
横笔笔画的横向码比值fh_ratio,即计算横笔笔画八链码中0和4的比例;
横笔笔画的左斜码比值fh2,即计算横笔笔画八链码中1和5所占的比例;
横笔笔画的右斜码比值fh3,即计算横笔笔画八链码中3和7所占的比例;
横笔的起笔处斜率fh_head
横笔的收笔处斜率fh_end
所述的竖笔特征具体如下:
检测到的竖笔个数fv_count
竖笔笔画的平均斜率fv_slope,即所有竖笔笔画斜率的平均值;
竖笔笔画的竖向码比值fv_ratio,即计算竖笔笔画八链编码中6所占的比例;
竖笔笔画的左斜码比值fv2,即计算竖笔笔画八链编码中1和5所占的比例;
竖笔笔画的右斜码比值fv3,即计算竖笔笔画八链编码中3和7所占的比例;
所述的字级风格特征具体如下:
对于每个字,以每个骨架点i为中心,圆内像素点95%以上的点为二值前景色的最大半径di,假设骨架信息图上一共有n个像素点,则前4项字级风格特征为:
平均笔宽 f a v e _ w i d t h = 1 n Σd i ;
笔宽变化率 f s i g _ w i d t h = 1 n Σ i = 1 n ( d i - f a v e _ w i d t h ) 2 ;
最大笔宽值,即所有点宽度的前五分之一宽的平均宽度fmax_width
最细笔宽值,即所有点宽度的后五分之一宽的平均宽度fmin_width
根据二值化图像为M*N像素点,(x,y)为坐标,P(x,y)表示二值图像像素点:
则另外8项字级风格特征值为:
黑白二值比
高宽比faspect_ratio=N/M;
重心位置:
字在横线(X轴)的重心
字在纵向(Y轴)的重心
左右墨点比:
字在X轴压力变化特征
f s t r e s s _ x = Σ x = M / 2 x = M - 1 Σ y = 0 y = N - 1 ( x - f x ‾ ) 3 × P ( x , y ) Σ x = M / 2 x = M - 1 Σ y = 0 y = N - 1 ( x - f x ‾ ) 3 × P ( x , y ) + Σ x = 0 x = M / 2 - 1 Σ y = 0 y = N - 1 ( x - f x ‾ ) 3 × P ( x , y ) ;
字在Y轴压力变化特征
f s t r e s s _ y = Σ x = 0 x = M - 1 Σ y = N / 2 y = N - 1 ( y - f y ‾ ) 3 × P ( x , y ) Σ x = 0 x = M - 1 Σ y = N / 2 y + n - 1 ( y - f y ‾ ) 3 × P ( x , y ) + Σ x = 0 x = M - 1 Σ y = 0 y = N / 2 - 1 ( y - f y ‾ ) 3 × P ( x , y ) ;
倾斜率:
字在X轴倾斜平衡fslant_x
f s t r e s s _ x = Σ x = M / 2 x = M - 1 Σ y = 0 y = N - 1 ( x - f x ‾ ) 2 × ( y - f y ‾ ) × P ( x , y ) Σ x = M / 2 x = M - 1 Σ y = 0 y + n - 1 ( x - f x ‾ ) 2 × ( y - f y ‾ ) × P ( x , y ) + Σ x = 0 x = M / 2 - 1 Σ y = 0 y = N - 1 ( x - f x ‾ ) 2 × ( y - f y ‾ ) × P ( x , y ) ;
字在Y轴倾斜平衡fslant_y
f s t r e s s _ x = Σ x = 0 x = M - 1 Σ y = N / 2 y = N - 1 ( x - f x ‾ ) × ( y - f y ‾ ) 2 × P ( x , y ) Σ x = 0 x = M - 1 Σ y = N / 2 y + n - 1 ( x - f x ‾ ) × ( y - f y ‾ ) 2 × P ( x , y ) + Σ x = 0 x = M - 1 Σ y = 0 y = N / 2 - 1 ( x - f x ‾ ) × ( y - f y ‾ ) 2 × P ( x , y ) .
所述的步骤S1.4中,五种书法风格分别是篆书,隶书,楷书,行书和草书,用ωk表示,其中下标k=1,2...5是5种风格的标号,每种风格各有Mk个样本,Sj,k代表数据库存储的一个书法字样本,其中j=1,2,...,Mk,则书法字Sj,k的24个特征变量为fl,j,k,其中l=1,2,..,24,每一个书法字样本的24个特征值fl,j,k组成的特征值向量Fj,k=[f1,j,k,f2,j,k,...,f24,j,k];
计算每种风格的训练样本的风格特征值向量的平均值向量:
μ k = 1 M k Σ j = 1 M k F j , k
计算每种风格的训练样本的风格特征值向量的协方差矩阵:
C k = Σ j M k ( F j , k - μ k ) ( F j , k - μ k ) T .
所述的步骤S2中,采用与步骤S1.3中计算书法字的风格特征值相同的方法来计算待识别书法字的风格特征值。
所述的步骤S3中,根据基于高斯特征模型的线性分类器,计算待识别书法字属于每一种风格的条件概率pk,计算出5个条件概率值,根据条件概率的值判断书法字的风格,条件概率值最高的那个风格即是这个待识别书法字的风格;
p k ( Q | ω k ) = W k T F ;
其中,是每种风格的训练样本的风格特征值向量的协方差矩阵的逆矩阵,μk是每种风格的训练样本的风格特征值向量的平均值向量,Q是待识别书法字,F是待识别书法字的风格特征值,ωk是书法风格分类标签。
本发明采用风格特征值对书法字风格进行量化表达,使在原先在艺术领域中主观的书法风格变成客观的,可以用计算机进行自动分类,为书法真伪鉴别奠定了分类基础。
附图说明
图1是本发明的流程图。
图2为页面切分成单字的示意图。
图3为骨架笔画提取示例:原图、二值图像以及骨架提取图像。
图4为8方向链码、对应的图像像素位置及其数组编码。
图5为骨架笔画图、跟踪得到的链码表达序列及8个链码所占比例。
图6为基于每个骨架点的笔画宽度计算示例。
图7展示了测试数据库中距5类风格中心概率值最大的前12个书法字。
图8和图9为实施例中待识别书法字属于五类风格的概率。
具体实施方式
以下根据图1~图9,具体说明本发明的较佳实施例。
如图1所示,本发明提供一种书法字风格的识别方法,包含以下步骤:
步骤S1、构造书法字训练样本,对训练样本进行风格标注,计算每种风格字体的风格特征值;
步骤S2、计算待识别书法字的风格特征值;
步骤S3、计算待识别书法字属于书法字训练样本中每一种风格的条件概率,根据条件概率的大小判断待识别书法字的风格。
所述的步骤S1包含以下步骤:
步骤S1.1、得到书法作品的单个书法字的图像集合;
如图2所示,对扫描得到的书法作品页面图像进行全局二值化,接着根据作品列间距,利用投影直方图将页面切分成多列,然后利用字间距把每一列切成单个书法字,得到单个书法字的图像集合;
如果有重叠的书法字,则通过手工调整最小包围盒的边框进行手工分割;
步骤S1.2、对书法字图像进行风格标注;
分为五类书法风格:篆书、隶书、楷书、行书和草书;
采用交互式界面进行风格标注,将书法风格信息保存到数据库;
步骤S1.3、计算书法字的风格特征值;
步骤S1.4、分别计算书法字训练样本中各类风格书法字的风格特征值的平均值和协方差。
所述的步骤S1.3包含以下步骤:
步骤S1.3.1、对书法字图像进行二值化,提取骨架信息;
步骤S1.3.2、提取书法字图像的风格特征值;
所述的风格特征值包含笔画级风格特征和字级风格特征;
所述的笔画级风格特征包含横笔特征和竖笔特征;
所述的横笔特征包含横笔个数、斜率、横向码比值、左斜码比值、右斜码比值、起笔处斜率、收笔处斜率;
所述的竖笔特征包含竖笔个数、斜率、竖向码比值、左斜码比值、右斜码比值;
所述的字级风格特征包含平均笔宽、笔宽变化率、最大笔宽值、最细笔宽值、黑白二值比、高宽比、重心位置、左右墨点比、倾斜率;
将提取到的风格特征值存入数据库中。
所述的步骤S1.3.1包含以下步骤:
步骤S1.3.1.1、将书法字图像转为二值化图像;
利用已有的大津二值化算法将书法字图像像素点的灰度值变成1或者0;
步骤S1.3.1.2、如图3所示,利用中轴转换算法获取书法字的骨架,然后再把有两个像素点宽的骨架点变成一个像素点宽的骨架点;
所述的中轴转换算法可采用IEEETransactionsonPatternAnalysisandMachineIntelligence,2002年第24卷第1刊,59-74页:论文名字:用主曲线分段细化法(Piecewiselinearskeletonizationusingprincipalcurves)中提到的算法;
所述的把两个像素点宽的骨架点变成一个像素点具体做法是:一个骨架点的8邻域内,若横向或纵向有两个连续的骨架像素点,则删除其中一个点;
步骤S1.3.1.3、如图4和图5所示,从骨架的一个端点出发,跟踪一个像素点宽的骨架走势,利用八链码(用数字0到7表达下一个骨架点与当前骨架点的方向关系)序列表达书法字的横笔和竖笔信息,将这些信息存入数据库中。
所述的步骤S1.3.2中,所述的横笔特征具体如下:
检测到的横笔个数fh_count
横笔笔画的平均斜率fh_slope,即所有横笔笔画斜率的平均值;
横笔笔画的横向码比值fh_ratio,即计算横笔笔画八链码中0和4的比例;
横笔笔画的左斜码比值fh2,即计算横笔笔画八链码中1和5所占的比例;
横笔笔画的右斜码比值fh3,即计算横笔笔画八链码中3和7所占的比例;
横笔的起笔处斜率fh_head
横笔的收笔处斜率fh_end
所述的竖笔特征具体如下:
检测到的竖笔个数fv_count
竖笔笔画的平均斜率fv_slope,即所有竖笔笔画斜率的平均值;
竖笔笔画的竖向码比值fv_ratio,即计算竖笔笔画八链码中6所占的比例;
竖笔笔画的左斜码比值fv2,即计算竖笔笔画八链码中1和5所占的比例;
竖笔笔画的右斜码比值fv3,即计算竖笔笔画八链码中3和7所占的比例;
所述的字级风格特征具体如下:
对于每个字,以每个骨架点i为中心,圆内像素点95%以上的点为二值前景色(字的颜色)的最大半径di,如图6所示,假设骨架信息图上一共有n个像素的骨架点,则前4项字级风格特征为:
平均笔宽 f a v e _ w i d t h = 1 n Σd i ;
笔宽变化率 f s i g _ w i d t h = 1 n Σ i = 1 n ( d i - f a v e _ w i d t h ) 2 ;
最大笔宽值,即前五分之一宽的平均宽度fmax_width
最细笔宽值,即后五分之一宽的平均宽度fmin_width
根据二值化图像为M*N像素点,(x,y)为坐标,P(x,y)表示二值图像:
则另外8项字级风格特征值为:
黑白二值比
高宽比faspect_ratio=N/M;
重心位置:
字在横线(X轴)的重心
字在纵向(Y轴)的重心
左右墨点比:
字在X轴压力变化
f s t r e s s _ x = Σ x = M / 2 x = M - 1 Σ y = 0 y = N - 1 ( x - f x ‾ ) 3 × P ( x , y ) Σ x = M / 2 x = M - 1 Σ y = 0 y = N - 1 ( x - f x ‾ ) 3 × P ( x , y ) + Σ x = 0 x = M / 2 - 1 Σ y = 0 y = N - 1 ( x - f x ‾ ) 3 × P ( x , y ) ;
字在Y轴压力变化
f s t r e s s _ y = Σ x = 0 x = M - 1 Σ y = N / 2 y = N - 1 ( y - f y ‾ ) 3 × P ( x , y ) Σ x = 0 x = M - 1 Σ y = N / 2 y + n - 1 ( y - f y ‾ ) 3 × P ( x , y ) + Σ x = 0 x = M - 1 Σ y = 0 y = N / 2 - 1 ( y - f y ‾ ) 3 × P ( x , y ) ;
倾斜率:
字在X轴倾斜平衡fslant_x
f s t r e s s _ x = Σ x = M / 2 x = M - 1 Σ y = 0 y = N - 1 ( x - f x ‾ ) 2 × ( y - f y ‾ ) × P ( x , y ) Σ x = M / 2 x = M - 1 Σ y = 0 y + n - 1 ( x - f x ‾ ) 2 × ( y - f y ‾ ) × P ( x , y ) + Σ x = 0 x = M / 2 - 1 Σ y = 0 y = N - 1 ( x - f x ‾ ) 2 × ( y - f y ‾ ) × P ( x , y ) ;
字在Y轴倾斜平衡fslant_y
f s t r e s s _ x = Σ x = 0 x = M - 1 Σ y = N / 2 y = N - 1 ( x - f x ‾ ) × ( y - f y ‾ ) 2 × P ( x , y ) Σ x = 0 x = M - 1 Σ y = N / 2 y + n - 1 ( x - f x ‾ ) × ( y - f y ‾ ) 2 × P ( x , y ) + Σ x = 0 x = M - 1 Σ y = 0 y = N / 2 - 1 ( x - f x ‾ ) × ( y - f y ‾ ) 2 × P ( x , y ) .
所述的步骤S1.4中,五种书法风格分别是篆书、隶书、楷书、行书和草书,用ωk表示,其中k=1,2...5,每种风格各有Mk个样本,Sj,k代表数据库存储的一个书法字样本(其中j=1,2,...,Mk),则书法字Sj,k的24个特征变量为fl,j,k,其中l=1,2,..,24,每一个书法字样本的24个特征值fl,j,k组成的特征值向量Fj,k=[f1,j,k,f2,j,k,...,f24,j,k]。
计算每种风格的训练样本的风格特征值向量的平均值向量:
μ k = 1 M k Σ j = 1 M k F j , k
计算每种风格的训练样本的风格特征值向量的协方差矩阵:
C k = Σ j M k ( F j , k - μ k ) ( F j , k - μ k ) T ;
如图7所示,按标注的5类风格,分别计算训练样本24项特征值均值和方差,展示5类中离聚类中心最接近的前12个书法字,第一行为第1类风格(篆书)、第二行为第2类风格(隶书)、第三行为第3类风格(楷书)、第四行为第4类风格(行书)、第五行为第5类风格(草书)。
所述的步骤S2中,采用与步骤S1.3中计算书法字的风格特征值相同的方法来计算待识别书法字的风格特征值。
所述的步骤S3中,根据基于高斯特征模型的线性分类器,计算待识别书法字属于每一种风格的条件概率pk
p k ( Q | ω k ) = W k T F ;
其中,是每种风格的训练样本的风格特征值向量的协方差矩阵的逆矩阵,μk是每种风格的训练样本的风格特征值向量的平均值向量,Q是待识别书法字,F是待识别书法字的风格特征值,ωk是书法风格分类标签;
计算出5个条件概率值,根据条件概率的值判断书法字的风格,条件概率值最高的那个风格即是这个待识别书法字的风格。
实施例:下面结合本发明的方法详细说明该实例实施的具体步骤,如下:
1、使用由CADAL(http://www.cadal.zju.edu.cn)扫描中心扫描得到的《中国书法全集》、《中国历代楷书真迹》、《中国历代帝王御藏名帖》、《汉曹全碑》、《柳公权玄秘塔碑》等54卷书法书籍的页面图像。对这些书法作品页面图像进行全局二值化。接着根据作品列间距,利用投影直方图将页面切分成多列,然后利用字间距把每一列被切成单个书法字。如果有重叠的书法字,则通过手工调整最小包围盒的线进行手工分割。得到单个书法字的图像集合。一共得到8279个书法字图像。
2、对8279个书法字图像进行风格标注,构造训练样本。我们分为五种书法风格:篆书、隶书、楷书、行书和草书,采用交互式界面进行风格标注,将书法风格信息保存到数据库。
3、对8279个书法字图像进行二值化,提取骨架信息。采用中轴变换算法获取书法字的骨架信息,接着使每个骨架点宽度都为1,在8邻域内,若横向或纵向有两个连续的骨架像素点,则删除其中一个点,之后利用从骨架的一个端点出发,跟踪一个像素点宽的骨架走势,形成八链码序列表达的所有横笔和竖笔的跟踪信息,将跟踪信息存入数据库。
4、将步骤3处理后的书法字图像进行横笔和竖笔风格特征提取,得到横笔个数、斜率、横向码比值、左斜码比值、右斜码比值、起笔处斜率及收笔处斜率共7项横笔特征,得到竖笔个数、斜率、竖向码比值、左斜码比值、右斜码比值共5项竖笔特征;一共12项笔画级的风格特征。
5、对二值化图像提取字级风格特征12项,集中在平均笔宽、笔宽变化率、最大笔宽值、最细笔宽值、黑白二值比、高宽比、重心位置(2项)、左右墨点比、字在X轴压力变化、字在Y轴压力变化、字在X轴倾斜平衡以及字在Y轴倾斜平衡;加上12项笔画级风格,每个字一共有24项风格特征值,将这些信息存在数据库中。
6、利用存储在数据库中的风格特征值,对数据库中的篆书、隶书、楷书、行书和草书共5类风格,分别计算各自24项风格特征的均值和协方差。
7、当用户提交风格未知、待识别书法字图像时,根据步骤3~5提取该字图像的24项风格特征。
8、根据基于高斯特征模型的线性分类器,分别计算风格未知、待识别书法字的24项特征与5类风格的24项特征的距离,以归一化后的距离为基础形成条件概率。根据条件概率的值判断书法字的风格,条件概率值最高的那个风格即是这个待识别书法字的风格.
本实例的运行结果如图8和图9所示,将两个待识别书法字图像进行处理后提取其风格特征,根据高斯特征模型的线性分类器,计算出其属于不同风格的条件概率,最后识别其书法风格。图8为未知风格属于五类风格的概率,该字属于风格1(篆书)的值最大,说明该字是为是风格1(篆书)的特征占据主导地位。图9为未知风格属于五类风格的概率,该字属于风格4(行书)的概率最大,属于风格5(草书)的值次大,说明该字具有行书风格占据明显地位,但具有小部分草书特征。
本发明采用风格特征值对书法字风格进行量化表达,使原先在艺术领域中主观的书法风格变成客观的,可以用计算机进行自动分类,为书法真伪鉴别奠定了分类基础。
尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。

Claims (8)

1.一种书法字风格的识别方法,其特征在于,包含以下步骤:
步骤S1、构造书法字训练样本,对训练样本进行风格标注,计算每种风格字体的风格特征值;
步骤S2、计算待识别书法字的风格特征值;
步骤S3、根据风格特征值计算待识别书法字属于书法字训练样本中每一种风格的条件概率,根据条件概率的大小判断待识别书法字的风格。
2.如权利要求1所述的书法字风格的识别方法,其特征在于,所述的步骤S1包含以下步骤:
步骤S1.1、得到书法作品的单个书法字的图像集合;
对扫描得到的书法作品页面图像进行全局二值化,接着根据作品列间距,利用投影直方图将页面切分成多列,然后利用字间距把每一列切成单个书法字,得到单个书法字的图像集合;
步骤S1.2、对书法字图像进行风格标注;
分为五种书法风格:篆书、隶书、楷书、行书和草书;
步骤S1.3、计算书法字的风格特征值;
步骤S1.4、分别计算书法字训练样本中各类风格书法字的风格特征值的平均值和协方差。
3.如权利要求2所述的书法字风格的识别方法,其特征在于,所述的步骤S1.3包含以下步骤:
步骤S1.3.1、对书法字图像进行二值化,提取骨架信息;
步骤S1.3.2、提取书法字图像的风格特征值;
所述的风格特征值包含笔画级风格特征和字级风格特征;
所述的笔画级风格特征包含横笔特征和竖笔特征;
所述的横笔特征包含横笔个数、斜率、横向码比值、左斜码比值、右斜码比值、起笔处斜率、收笔处斜率;
所述的竖笔特征包含竖笔个数、斜率、竖向码比值、左斜码比值、右斜码比值;
所述的字级风格特征包含平均笔宽、笔宽变化率、最大笔宽值、最细笔宽值、黑白二值比、高宽比、重心位置、左右墨点比、倾斜率、字在X轴压力变化、字在Y轴压力变化、字在X轴倾斜平衡、字在Y轴倾斜平衡。
4.如权利要求3所述的书法字风格的识别方法,其特征在于,所述的步骤S1.3.1包含以下步骤:
步骤S1.3.1.1、将书法字图像转为二值化图像;
步骤S1.3.1.2、利用中轴转换算法获取书法字的骨架,然后再把有两个像素点宽的骨架点变成一个像素点宽的骨架点;
步骤S1.3.1.3、从骨架的一个端点出发,跟踪一个像素点宽的骨架走势,利用八链码序列表达书法字的横笔和竖笔信息。
5.如权利要求4所述的书法字风格的识别方法,其特征在于,所述的步骤S1.3.2中,所述的横笔特征具体如下:
检测到的横笔个数fh_count
横笔笔画的平均斜率fh_slope,即所有横笔笔画斜率的平均值;
横笔笔画的横向码比值fh_ratio,即计算横笔笔画八链编码中0和4的比例;
横笔笔画的左斜码比值fh2,即计算横笔笔画八链编码中1和5所占的比例;
横笔笔画的右斜码比值fh3,即计算横笔笔画八链编码中3和7所占的比例;
横笔的起笔处斜率fh_head
横笔的收笔处斜率fh_end
所述的竖笔特征具体如下:
检测到的竖笔个数fv_count
竖笔笔画的平均斜率fv_slope,即所有竖笔笔画斜率的平均值;
竖笔笔画的竖向码比值fv_ratio,即计算竖笔笔画八链编码中6所占的比例;
竖笔笔画的左斜码比值fv2,即计算竖笔笔画八链编码中1和5所占的比例;
竖笔笔画的右斜码比值fv3,即计算竖笔笔画八链编码中3和7所占的比例;
所述的字级风格特征具体如下:
对于每个字,以每个骨架点i为中心,圆内像素点95%以上的点为二值前景色的最大半径di,假设骨架信息图上一共有n个像素点,则前4项字级风格特征为:
平均笔宽 f a v e _ w i d t h = 1 n Σd i ;
笔宽变化率 f s i g _ w i d t h = 1 n Σ i = 1 n ( d i - f a v e _ w i d t h ) 2 ;
最大笔宽值,即所有点宽度的前五分之一的平均宽度fmax_width
最细笔宽值,即所有点宽度的后五分之一的平均宽度fmin_width
根据二值化图像为M*N像素点,(x,y)为坐标,P(x,y)表示二值图像像素点:
则字级风格特征值的后8项为:
黑白二值比
高宽比faspect_ratio=N/M;
重心位置:
字在横线(X轴)的重心 f x ‾ = Σ x = 0 x = M - 1 Σ y = 0 y = N - 1 x × P ( x , y ) Σ x = 0 x = M - 1 Σ y = 0 y = N - 1 P ( x , y ) ;
字在纵向(Y轴)的重心 f y ‾ = Σ x = 0 x = M - 1 Σ y = 0 y = N - 1 y × P ( x , y ) Σ x = 0 x = M - 1 Σ y = 0 y = N - 1 P ( x , y ) ;
左右墨点比:
字在X轴压力变化特征
f s t r e s s _ x = Σ x = M / 2 x = M - 1 Σ y = 0 y = N - 1 ( x - f x ‾ ) 3 × P ( x , y ) Σ x = M / 2 x = M - 1 Σ y = 0 y = N - 1 ( x - f x ‾ ) 3 × P ( x , y ) + Σ x = 0 x = M / 2 - 1 Σ y = 0 y = N - 1 ( x - f x ‾ ) 3 × P ( x , y ) ;
字在Y轴压力变化特征
f s t r e s s _ y = Σ x = 0 x = M - 1 Σ y = N / 2 y = N - 1 ( y - f y ‾ ) 3 × P ( x , y ) Σ x = 0 x = M - 1 Σ y = N / 2 y + n - 1 ( y - f y ‾ ) 3 × P ( x , y ) + Σ x = 0 x = M - 1 Σ y = 0 y = N / 2 - 1 ( y - f y ‾ ) 3 × P ( x , y ) ;
倾斜率:
字在X轴倾斜平衡fslant_x
f s t r e s s _ x = Σ x = M / 2 x = M - 1 Σ y = 0 y = N - 1 ( x - f x ‾ ) 2 × ( y - f y ‾ ) × P ( x , y ) Σ x = M / 2 x = M - 1 Σ y = 0 y + n - 1 ( x - f x ‾ ) 2 × ( y - f y ‾ ) × P ( x , y ) + Σ x = 0 x = M / 2 - 1 Σ y = 0 y = N - 1 ( x - f x ‾ ) 2 × ( y - f y ‾ ) × P ( x , y ) ;
字在Y轴倾斜平衡fslant_y
f s t r e s s _ x = Σ x = 0 x = M - 1 Σ y = N / 2 y = N - 1 ( x - f x ‾ ) × ( y - f y ‾ ) 2 × P ( x , y ) Σ x = 0 x = M - 1 Σ y = N / 2 y + n - 1 ( x - f x ‾ ) × ( y - f y ‾ ) 2 × P ( x , y ) + Σ x = 0 x = M - 1 Σ y = 0 y = N / 2 - 1 ( x - f x ‾ ) × ( y - f y ‾ ) 2 × P ( x , y ) .
6.如权利要求5所述的书法字风格的识别方法,其特征在于,所述的步骤S1.4中,五种书法风格分别是篆书,隶书,楷书,行书和草书,用ωk表示,其中下标k=1,2...5是5种风格的标号,每种风格各有Mk个样本,Sj,k代表数据库存储的一个书法字样本,其中j=1,2,...,Mk,则书法字Sj,k的24个特征变量为fl,j,k,其中l=1,2,..,24,每一个书法字样本的24个特征值fl,j,k组成特征值向量Fj,k=[f1,j,k,f2,j,k,...,f24,j,k];
计算每种风格的训练样本的风格特征值向量的平均值向量:
μ k = 1 M k Σ j = 1 M k F j , k
计算每种风格的训练样本的风格特征值向量的协方差矩阵:
C k = Σ j M k ( F j , k - μ k ) ( F j , k - μ k ) T .
7.如权利要求5所述的书法字风格的识别方法,其特征在于,所述的步骤S2中,采用与步骤S1.3中计算书法字的风格特征值相同的方法来计算待识别书法字的风格特征值。
8.如权利要求6或7所述的书法字风格的识别方法,其特征在于,所述的步骤S3中,根据基于高斯特征模型的线性分类器,计算待识别书法字属于每一种风格的条件概率pk,一共有5个条件概率值,根据条件概率的值判断书法字的风格,条件概率值最高的那个风格即是这个待识别书法字的主要风格;
p k ( Q | ω k ) = W k T F ;
其中,是每种风格的训练样本的风格特征值向量的协方差矩阵的逆矩阵,μk是每种风格的训练样本的风格特征值向量的平均值向量,Q是待识别书法字,F是待识别书法字的风格特征值,ωk是书法风格分类标签。
CN201510626566.XA 2015-09-28 2015-09-28 一种书法字风格的识别方法 Pending CN105117741A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510626566.XA CN105117741A (zh) 2015-09-28 2015-09-28 一种书法字风格的识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510626566.XA CN105117741A (zh) 2015-09-28 2015-09-28 一种书法字风格的识别方法

Publications (1)

Publication Number Publication Date
CN105117741A true CN105117741A (zh) 2015-12-02

Family

ID=54665724

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510626566.XA Pending CN105117741A (zh) 2015-09-28 2015-09-28 一种书法字风格的识别方法

Country Status (1)

Country Link
CN (1) CN105117741A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503688A (zh) * 2016-11-17 2017-03-15 西安理工大学 基于小波平滑的书法字最小包围盒提取方法
CN109241750A (zh) * 2018-07-20 2019-01-18 海南大学 个性化英文字母展示风格变换方法
CN109543757A (zh) * 2018-11-27 2019-03-29 陕西文投艺术品光谱科技有限公司 一种基于光谱成像技术与图谱分析的书画画风鉴定方法
CN109664300A (zh) * 2019-01-09 2019-04-23 湘潭大学 一种基于力觉学习的机器人多风格书法临摹方法
CN110070089A (zh) * 2019-04-24 2019-07-30 京东方科技集团股份有限公司 书法指导方法及装置、计算机设备及介质
CN110956860A (zh) * 2019-12-31 2020-04-03 六安中达信息科技有限公司 一种智能批改书写装置
CN111062365A (zh) * 2019-12-30 2020-04-24 上海肇观电子科技有限公司 识别混合排版文字的方法、设备、芯片电路和计算机可读存储介质
CN112818146A (zh) * 2021-01-26 2021-05-18 山西三友和智慧信息技术股份有限公司 一种基于产品图像风格的推荐方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1920856A (zh) * 2006-09-14 2007-02-28 浙江大学 一种计算机辅助书法作品真伪鉴别方法
CN102637078A (zh) * 2012-02-27 2012-08-15 厦门大学 一种结构优化的汉字字形生成方法
CN103093240A (zh) * 2013-01-18 2013-05-08 浙江大学 书法字识别方法
CN103268363A (zh) * 2013-06-06 2013-08-28 哈尔滨工业大学 一种基于弹性hog特征和ddtw匹配的中国书法图像检索方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1920856A (zh) * 2006-09-14 2007-02-28 浙江大学 一种计算机辅助书法作品真伪鉴别方法
CN102637078A (zh) * 2012-02-27 2012-08-15 厦门大学 一种结构优化的汉字字形生成方法
CN103093240A (zh) * 2013-01-18 2013-05-08 浙江大学 书法字识别方法
CN103268363A (zh) * 2013-06-06 2013-08-28 哈尔滨工业大学 一种基于弹性hog特征和ddtw匹配的中国书法图像检索方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XIAFEN ZHANG 等: "Computational method for calligraphic style representation and calssification", 《JOURNAL OF ELECTRONIC IMAGING》 *
刘佳岩 等: "基于书写规则的书法字笔画及笔顺提取", 《微型机与应用》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503688A (zh) * 2016-11-17 2017-03-15 西安理工大学 基于小波平滑的书法字最小包围盒提取方法
CN109241750A (zh) * 2018-07-20 2019-01-18 海南大学 个性化英文字母展示风格变换方法
CN109241750B (zh) * 2018-07-20 2023-04-07 海南大学 个性化英文字母展示风格变换方法
CN109543757A (zh) * 2018-11-27 2019-03-29 陕西文投艺术品光谱科技有限公司 一种基于光谱成像技术与图谱分析的书画画风鉴定方法
CN109664300A (zh) * 2019-01-09 2019-04-23 湘潭大学 一种基于力觉学习的机器人多风格书法临摹方法
CN110070089A (zh) * 2019-04-24 2019-07-30 京东方科技集团股份有限公司 书法指导方法及装置、计算机设备及介质
CN111062365A (zh) * 2019-12-30 2020-04-24 上海肇观电子科技有限公司 识别混合排版文字的方法、设备、芯片电路和计算机可读存储介质
CN111062365B (zh) * 2019-12-30 2023-05-26 上海肇观电子科技有限公司 识别混合排版文字的方法、设备、芯片电路和计算机可读存储介质
CN110956860A (zh) * 2019-12-31 2020-04-03 六安中达信息科技有限公司 一种智能批改书写装置
CN112818146A (zh) * 2021-01-26 2021-05-18 山西三友和智慧信息技术股份有限公司 一种基于产品图像风格的推荐方法

Similar Documents

Publication Publication Date Title
CN105117741A (zh) 一种书法字风格的识别方法
Lawgali et al. HACDB: Handwritten Arabic characters database for automatic character recognition
CN110516208B (zh) 一种针对pdf文档表格提取的系统及方法
CN104156721B (zh) 一种基于模板匹配的脱机汉字笔画提取方法
CN103093240A (zh) 书法字识别方法
Mahmoud Recognition of writer-independent off-line handwritten Arabic (Indian) numerals using hidden Markov models
Jahan et al. Locating tables in scanned documents for reconstructing and republishing
Sagheer et al. A new large Urdu database for off-line handwriting recognition
Vijaya Kumar et al. Classification and recognition of handwritten digits by using mathematical morphology
CN101763516A (zh) 一种基于拟合函数的文字识别方法
CN111523622B (zh) 基于特征图像自学习的机械臂模拟手写笔迹方法
CN111814598A (zh) 一种基于深度学习框架的财务报表自动识别方法
Palakollu et al. Handwritten Hindi text segmentation techniques for lines and characters
CN112241730A (zh) 一种基于机器学习的表格提取方法和系统
Chtourou et al. ALTID: Arabic/Latin text images database for recognition research
Li An effective approach to offline arabic handwriting recognition
Zhang et al. Computational method for calligraphic style representation and classification
CN108062548B (zh) 一种盲文方自适应定位方法及系统
CN104504385B (zh) 手写粘连数字串的识别方法
CN108052936B (zh) 一种盲文图像自动倾斜校正方法及系统
Halder et al. Individuality of isolated Bangla characters
Berriche et al. Seam carving-based Arabic handwritten sub-word segmentation
Singh et al. Number plate recognition through image using morphological algorithm
Damayanti et al. Segmentation of Javanese character in ancient manuscript using connected component labeling
Bhujade et al. A technique for segmentation of handwritten Hindi text

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20151202

RJ01 Rejection of invention patent application after publication