CN105069742A - 一种基于书写特征编辑的软笔汉字变换方法 - Google Patents

一种基于书写特征编辑的软笔汉字变换方法 Download PDF

Info

Publication number
CN105069742A
CN105069742A CN201510441000.XA CN201510441000A CN105069742A CN 105069742 A CN105069742 A CN 105069742A CN 201510441000 A CN201510441000 A CN 201510441000A CN 105069742 A CN105069742 A CN 105069742A
Authority
CN
China
Prior art keywords
chinese character
stroke
soft
character
chinese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510441000.XA
Other languages
English (en)
Other versions
CN105069742B (zh
Inventor
齐越
张石磊
谢招楷
杨光
郝世昱
李巧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN201510441000.XA priority Critical patent/CN105069742B/zh
Publication of CN105069742A publication Critical patent/CN105069742A/zh
Application granted granted Critical
Publication of CN105069742B publication Critical patent/CN105069742B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/04Context-preserving transformations, e.g. by using an importance map

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种基于书写特征编辑的软笔汉字变换方法。该方法可用于碑文或软笔字帖中汉字的书写特征的提取和自定义书写特征软笔汉字的生成。首先选用合适的降噪算法、二值操作、及轮廓平滑方法对原始的碑文图像进行预处理,以增强其相对背景的对比度。并通过切分和归一化操作,实现单个汉字的定位。其次,实现了一种基于轮廓三角化的笔划提取优化算法,在预处理的基础上构造汉字的三角网格,标识笔画段。同时根据书写特点,划分笔划集。最后,提出了一种基于笔划特征的变形汉字生成算法。结合自定义的由笔划中心线、宽度、收缩速度、弯曲度等构成的特征矩阵与输入的变形要求,修改特征矩阵,生成具有不同书写特征的汉字图像。

Description

一种基于书写特征编辑的软笔汉字变换方法
技术领域
本发明属于计算机图像处理、计算机视觉领域。具体地说是一种软笔汉字书写特征编辑方法,可用于碑文、字帖等古代软笔汉字的样式变换。
背景技术
一个国家的文化,很大程度上地可以从其文字展现出来。汉字是我国的伟大发明,不仅在于它作为民族的语言载体,同时也发展形成了汉字本身的艺术价值。我们国家的毛笔书法艺术在历经数千年的积累、沉淀,形成了颜体、隶书、小篆、草书等多种不同样式的书写艺术形式。笔画空间结构、笔墨粗细、运笔走势等客观条件的不同,展示在宣纸上则是完全不一样的美学感受。在现代以前,这种高深的技艺完全是出于人们对书法艺术的理解和训练造就的。
随着计算机技术的发展,图形图像处理技术不断发展成熟,特别是在图像处理方面研究成果的推动,使得人们得以借助计算机来完成文字编排、设计。西方的字母语言的书写研究已经进行得如火如荼,对字母的变形、样式变换方面的研究成果也已经比较成熟。而象形文字由于其结构、形态的复杂,其书写规律和特征一时很难被应用到计算机文字处理上面去,现有的技术研究也未能很好的表示软笔汉字的书写特征。
发明内容
本发明目的为了克服上述不足,解决现有图像处理技术不能有效刻画软笔汉字书写特征的缺点,解决软笔汉字书法特点表述困难的问题,实现软笔汉字的样式变换。
为了实现上述目的,本发明提出了一种基于书写特征编辑的软笔汉字变换方法:
步骤1图像预处理,用滤波、二值化方法对图像进行初步的降噪处理,然后消除笔划边缘的穿刺和孔洞使汉字轮廓变得平滑;
步骤2单字提取,通过水平竖直两个方向上的投影直方图,完成对大段文字的分割,获得单字图像,并单字图像进行归一化操作,得到尺寸一致的文字;
步骤3笔划提取,基于轮廓分析的结果提取汉字笔划,然后对笔划轮廓进行点采样、三角网格化,分析三角网格化后的笔划连续性,确定笔划重组规则;
步骤4建立特征矩阵,抽取笔划的中心线、宽度、收缩速度、弯曲度信息作为汉字的书写特征,每个特征用一个向量来描述,称为特征向量,以上四个特征向量组成一个矩阵,称为特征矩阵;
步骤5编辑特征矩阵,通过编辑中心线的伸缩、笔划粗细、收缩速度、弯曲度实现对汉字书写特征的修改,这些改变将反应在以这些书写特征重组的笔划也即变换后的汉字上;通过一种或者组合几种书写特征的编辑,将输入的汉字图像变换出不同书写样式的汉字图像。
相对于现有的其它技术相比本发明的优点在于:本发明针对的是碑文、毛笔字帖的中汉字的特征描述技术,实现了对图像中汉字的分析,笔划的提取,完成了书写特点的计算机表述,并给出了软笔这些特征的编辑方法,通过对这些特征的编辑实现了对已有软笔汉字的样式变换。
附图说明
图1是本发明基于书写特征编辑的软笔汉字变换方法的过程示意图;
图2是本发明的汉字特征变换结果示意图。
具体实施方式
如图1所示,本发明一种基于书写特征编辑的软笔汉字变换方法采用如下步骤:
步骤一、图像预处理:
(1)中值滤波。对图像中每个像素点,取其邻近区域像素点的值,按有难度等级排序。将该点的有难度值设置为邻近区域的灰度中值。通过中值滤波,可以较好的去除孤立的噪声像素。
(2)二值化。通过对局部区域进行平均值的中点迭代计算局部最佳阈值,若像素值大于此最佳阈值,设置像素颜色为1,否则设置像素颜色为0。
(3)轮廓平滑。这一步主要处理汉字轮廓周转的穿刺和孔洞。用掩膜矩阵判断穿刺和孔洞是否存在。
步骤二、单字提取:
(1)分别在竖直、水平方向上投影得到直方图,得到单字的大概位置。在做竖直投影时,首先计算平均列宽M,当列宽小于0.6M时,则考虑它和相信列之和是否接近M。若接近,则将两列合并为一列。同理适用于水平方向上做投影的情景。
(2)使用线性归一化,对找到的汉字进行适当绽放(比例较小),使所有提取到的单字达到相近的尺寸。
步骤三、笔划提取:
采用基于轮廓分析的方法提取笔画。首先用Canny算法提取笔划轮廓,然后寻找笔划相交区域作为笔划分隔处。对分隔出的笔划分别计算其斜率,两两斜率差小于某个阈值时,则将它们合并为一个笔划。利用Harris方法求出一级采样点,并在一级采样点间做等距点采样,利用Delaunay分割算法将笔划进行三角网格化。最后经连续性分析,最终确定提取到的笔划集。
步骤四、建立特征矩阵:
特征矩阵包含四个特征向量:伸缩、宽度、收缩速度、弯曲度。其中,伸缩特征向量是指笔划在其中心线上的伸缩;粗细是用来描述笔划的粗细;收缩速度描述笔划末端由落笔造成的精细变化;弯曲度则描述了运笔过程中,笔尖的走势力。
对步骤三中提取到的每个笔划,计算其对应的伸缩向量、宽度向量、收缩速度向量、弯曲度向量。保存成特征矩阵。
步骤五、编辑特征矩阵,变换汉字:
根据用户的输入,编辑步骤四中提取到的特征矩阵,根据编辑后的特征矩阵,重新生成笔划,组合成新的样式的汉字,以此达到汉字变换的目标。
如图2所示,是用本发明的基于书写特征编辑的软笔汉字变换方法生成的特征各异的“中”字的变换效果。
本发明未详细阐述部分属于本领域公知技术;以上所述,仅为本发明部分具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本领域的人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

Claims (6)

1.一种基于书写特征编辑的软笔汉字变换方法,其特征包括以下步骤:
步骤1图像预处理,用滤波、二值化方法对图像进行初步的降噪处理,然后消除笔划边缘的穿刺和孔洞使汉字轮廓变得平滑;
步骤2单字提取,通过水平竖直两个方向上的投影直方图,完成对大段文字的分割,获得单字图像,并单字图像进行归一化操作,得到尺寸一致的文字;
步骤3笔划提取,基于轮廓分析的结果提取汉字笔划,然后对笔划轮廓进行点采样、三角网格化,分析三角网格化后的笔划连续性,确定笔划重组规则;
步骤4建立特征矩阵,抽取笔划的中心线、宽度、收缩速度、弯曲度信息作为汉字的书写特征,每个特征用一个向量来描述,称为特征向量,以上四个特征向量组成一个矩阵,称为特征矩阵;
步骤5编辑特征矩阵,通过编辑中心线的伸缩、笔划粗细、收缩速度、弯曲度实现对汉字书写特征的修改,这些改变将反应在以这些书写特征重组的笔划也即变换后的汉字上;通过一种或者组合几种书写特征的编辑,将输入的汉字图像变换出不同书写样式的汉字图像。
2.根据权利要求1所述的基于书写特征编辑的软笔汉字变换方法,其特征在于:所述步骤1中软笔汉字图像预处理的具体过程如下:
(1.1)采用中值滤波方法处理输入图像中的椒盐噪点的颗粒状明暗像素点;
(1.2)二值化操作处理掉输入图像背景中的介于汉字与背景之间的干扰颜色;
(1.3)借助掩膜矩阵检测汉字边缘的穿刺与孔洞并加以消除和修补,使汉字的轮廓平滑,以利于后面的轮廓提取工作。
3.根据权利要求1所述的基于书写特征编辑的软笔汉字变换方法,其特征在于:所述步骤2中单字的分割与归一化具体过程如下:
(2.1)垂直投影的直方图的空白区域对应于字帖中的列间隙,计算平均的列宽值W,若某一列宽度小于0.6W时则需要比较它是否与相邻列是同列,宽度之和近似于W;同理在每列上求水平方向的直方图,分割出单字;
(2.2)通过线性绽放,将分割出的单字归一化为指定的尺寸,由于各字书写时大小变化并不明显,因而绽放比例相对也小,这种简单的线性绽放不会造成过多的结构损失。
4.根据权利要求1所述的基于书写特征编辑的软笔汉字变换方法,其特征在于:所述步骤3笔划的网格化过程具体过程如下:
(3.1)基本轮廓分析的方法提取汉字的笔划,保留汉字的书写特征;
(3.2)采用Harris角点检测算法,确定在轮廓上的采样点;
(3.3)采用Delaunay三角分割算法对笔划轮廓进行三角网格化。
5.根据权利要求1所述的基于书写特征编辑的软笔汉字变换方法,其特征在于:所述步骤4汉字书写特征的建立的具体内容包括:
(4.1)汉字的书写特征用一个包含四个特征向量的特征矩阵描述,即特征矩阵M={L,K,S,B};每个笔划都被一个特征矩阵M来表示:
M = p 1 r 1 0 D v 1 p 2 r 2 s 2 D v 2 . . . . . . . . . . . . p n r n s n D v n
其中,四个特征向量分别是伸缩向量L,分量形式为p1,p2,…,pn、粗细向量K,分量形式为r1,r2,…,rn、收缩速度向量S,分量形式为0,s2,…,sn、弯曲度向量B,分量形式为Dv1,Dv2,…,Dvn,分别用来刻画汉字笔划在中心线拉伸、笔划宽度、末端落笔收缩速度、笔划弯曲程度上的表现。
6.根据权利要求1所述的基于书写特征编辑的软笔汉字变换方法,其特征在于:所述步骤5汉字书写特征的编辑的具体内容包括:
对书写特征的编辑实质是对特征矩阵中特征向量值的修改;一次编辑一个特征向量,或同时编辑多个特征向量实现单一或复合的汉字变换效果;当需要变换笔划粗细时,需提供一个变换算子△K,分量形式为k1,k2,…,kn,变换后的特征矩阵M'为:
M ′ = Δ K · M = p 1 k 1 r 1 0 D v 1 p 2 k 2 r 2 s 2 D v 2 . . . . . . . . . . . . p n k n r n s n D v n .
CN201510441000.XA 2015-07-24 2015-07-24 一种基于书写特征编辑的软笔汉字变换方法 Active CN105069742B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510441000.XA CN105069742B (zh) 2015-07-24 2015-07-24 一种基于书写特征编辑的软笔汉字变换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510441000.XA CN105069742B (zh) 2015-07-24 2015-07-24 一种基于书写特征编辑的软笔汉字变换方法

Publications (2)

Publication Number Publication Date
CN105069742A true CN105069742A (zh) 2015-11-18
CN105069742B CN105069742B (zh) 2018-12-11

Family

ID=54499100

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510441000.XA Active CN105069742B (zh) 2015-07-24 2015-07-24 一种基于书写特征编辑的软笔汉字变换方法

Country Status (1)

Country Link
CN (1) CN105069742B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107578039A (zh) * 2017-10-08 2018-01-12 王奕博 基于数字图像处理技术的字迹轮廓比对方法
CN108305209A (zh) * 2017-01-12 2018-07-20 富士通株式会社 字符变形方法和字符变形设备
CN111160147A (zh) * 2019-12-16 2020-05-15 华南理工大学 一种书法作品图像的裁剪和识别方法
CN112800936A (zh) * 2021-01-25 2021-05-14 中南大学 基于计算机视觉的书法临帖智能评价与指导方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6043087A (en) * 1997-07-25 2000-03-28 The New York Blood Center Monospecific antibody reactive with matrix metalloproteinase cleavage products of fibrin(ogen)
CN102637078A (zh) * 2012-02-27 2012-08-15 厦门大学 一种结构优化的汉字字形生成方法
CN104182748A (zh) * 2014-08-15 2014-12-03 电子科技大学 一种基于拆分匹配的汉字笔画自动提取方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6043087A (en) * 1997-07-25 2000-03-28 The New York Blood Center Monospecific antibody reactive with matrix metalloproteinase cleavage products of fibrin(ogen)
CN102637078A (zh) * 2012-02-27 2012-08-15 厦门大学 一种结构优化的汉字字形生成方法
CN104182748A (zh) * 2014-08-15 2014-12-03 电子科技大学 一种基于拆分匹配的汉字笔画自动提取方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
董军等: "基于统计模型的书法创作模拟", 《计算机学报》 *
赵琪: "书法碑帖文字的笔划提取技术及其实现", 《中国优秀硕士学位论文全文数据库<信息科技辑>》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108305209A (zh) * 2017-01-12 2018-07-20 富士通株式会社 字符变形方法和字符变形设备
CN108305209B (zh) * 2017-01-12 2021-06-04 富士通株式会社 字符变形方法和字符变形设备
CN107578039A (zh) * 2017-10-08 2018-01-12 王奕博 基于数字图像处理技术的字迹轮廓比对方法
CN111160147A (zh) * 2019-12-16 2020-05-15 华南理工大学 一种书法作品图像的裁剪和识别方法
CN112800936A (zh) * 2021-01-25 2021-05-14 中南大学 基于计算机视觉的书法临帖智能评价与指导方法
CN112800936B (zh) * 2021-01-25 2022-03-08 中南大学 基于计算机视觉的书法临帖智能评价与指导方法

Also Published As

Publication number Publication date
CN105069742B (zh) 2018-12-11

Similar Documents

Publication Publication Date Title
Pastor-Pellicer et al. Complete system for text line extraction using convolutional neural networks and watershed transform
CN107516316B (zh) 一种在fcn中引入聚焦机制对静态人体图像进行分割的方法
CN104809446B (zh) 基于校正手掌方向的掌纹感兴趣区域快速提取方法
Xu et al. Page segmentation for historical handwritten documents using fully convolutional networks
Rivest-Hénault et al. A local linear level set method for the binarization of degraded historical document images
CN107944451B (zh) 一种藏文古籍文档的行切分方法及系统
CN103279770B (zh) 基于笔画片段和轮廓特征的笔迹识别方法
CN105069742A (zh) 一种基于书写特征编辑的软笔汉字变换方法
Al Abodi et al. An effective approach to offline Arabic handwriting recognition
CN104392229A (zh) 基于笔画片段方向分布特征的笔迹识别方法
CN107578039A (zh) 基于数字图像处理技术的字迹轮廓比对方法
CN110309830A (zh) 基于数学形态学和区域连通性的甲骨文字自动分割方法
CN108256518B (zh) 文字区域检测方法及装置
CN113673384A (zh) Lm滤波器组引导纹理特征自主学习的甲骨文字检测方法
CN114494306B (zh) 边缘梯度协方差引导的甲骨卜辞文字轮廓修复方法
Aravinda et al. Template matching method for Kannada handwritten recognition based on correlation analysis
Raj et al. Grantha script recognition from ancient palm leaves using histogram of orientation shape context
CN104992176A (zh) 一种面向碑文的汉字提取方法
Al-Shatnawi A skew detection and correction technique for Arabic script text-line based on subwords bounding
Firdaus et al. Arabic letter segmentation using modified connected component labeling
Moghaddam et al. Restoration and segmentation of highly degraded characters using a shape-independent level set approach and multi-level classifiers
Abu-Ain et al. Text normalization framework for handwritten cursive languages by detection and straightness the writing baseline
Assaleh et al. Recognition of handwritten Arabic alphabet via hand motion tracking
CN110298350B (zh) 一种高效的印刷体维吾尔文单词分割算法
Safi et al. Offline Tamil handwritten character recognition using zone based hybrid feature extraction technique

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant