CN105069742B - 一种基于书写特征编辑的软笔汉字变换方法 - Google Patents
一种基于书写特征编辑的软笔汉字变换方法 Download PDFInfo
- Publication number
- CN105069742B CN105069742B CN201510441000.XA CN201510441000A CN105069742B CN 105069742 B CN105069742 B CN 105069742B CN 201510441000 A CN201510441000 A CN 201510441000A CN 105069742 B CN105069742 B CN 105069742B
- Authority
- CN
- China
- Prior art keywords
- chinese character
- stroke
- feature
- writing
- eigenmatrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 206010034719 Personality change Diseases 0.000 title claims abstract description 11
- 230000008602 contraction Effects 0.000 claims abstract description 13
- 238000000605 extraction Methods 0.000 claims abstract description 9
- 230000008569 process Effects 0.000 claims abstract description 5
- 239000013598 vector Substances 0.000 claims description 30
- 239000000284 extract Substances 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 4
- 230000004048 modification Effects 0.000 claims description 4
- 238000012986 modification Methods 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000000638 solvent extraction Methods 0.000 claims description 3
- 238000005452 bending Methods 0.000 claims description 2
- 150000001875 compounds Chemical class 0.000 claims description 2
- 238000011946 reduction process Methods 0.000 claims description 2
- 150000003839 salts Chemical class 0.000 claims description 2
- 238000005070 sampling Methods 0.000 claims description 2
- 230000011218 segmentation Effects 0.000 claims 1
- 238000009499 grossing Methods 0.000 abstract description 2
- 238000010606 normalization Methods 0.000 abstract description 2
- 238000005457 optimization Methods 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000009172 bursting Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000009429 distress Effects 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 230000001376 precipitating effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Abstract
本发明公开了一种基于书写特征编辑的软笔汉字变换方法。该方法可用于碑文或软笔字帖中汉字的书写特征的提取和自定义书写特征软笔汉字的生成。首先选用合适的降噪算法、二值操作、及轮廓平滑方法对原始的碑文图像进行预处理,以增强其相对背景的对比度。并通过切分和归一化操作,实现单个汉字的定位。其次,实现了一种基于轮廓三角化的笔划提取优化算法,在预处理的基础上构造汉字的三角网格,标识笔画段。同时根据书写特点,划分笔划集。最后,提出了一种基于笔划特征的变形汉字生成算法。结合自定义的由笔划中心线、宽度、收缩速度、弯曲度等构成的特征矩阵与输入的变形要求,修改特征矩阵,生成具有不同书写特征的汉字图像。
Description
技术领域
本发明属于计算机图像处理、计算机视觉领域。具体地说是一种软笔汉字书写特征编辑方法,可用于碑文、字帖等古代软笔汉字的样式变换。
背景技术
一个国家的文化,很大程度上地可以从其文字展现出来。汉字是我国的伟大发明,不仅在于它作为民族的语言载体,同时也发展形成了汉字本身的艺术价值。我们国家的毛笔书法艺术在历经数千年的积累、沉淀,形成了颜体、隶书、小篆、草书等多种不同样式的书写艺术形式。笔画空间结构、笔墨粗细、运笔走势等客观条件的不同,展示在宣纸上则是完全不一样的美学感受。在现代以前,这种高深的技艺完全是出于人们对书法艺术的理解和训练造就的。
随着计算机技术的发展,图形图像处理技术不断发展成熟,特别是在图像处理方面研究成果的推动,使得人们得以借助计算机来完成文字编排、设计。西方的字母语言的书写研究已经进行得如火如荼,对字母的变形、样式变换方面的研究成果也已经比较成熟。而象形文字由于其结构、形态的复杂,其书写规律和特征一时很难被应用到计算机文字处理上面去,现有的技术研究也未能很好的表示软笔汉字的书写特征。
发明内容
本发明目的为了克服上述不足,解决现有图像处理技术不能有效刻画软笔汉字书写特征的缺点,解决软笔汉字书法特点表述困难的问题,实现软笔汉字的样式变换。
为了实现上述目的,本发明提出了一种基于书写特征编辑的软笔汉字变换方法:
步骤1图像预处理,用滤波、二值化方法对图像进行初步的降噪处理,然后消除笔划边缘的穿刺和孔洞使汉字轮廓变得平滑;
(1.1)采用中值滤波方法处理输入图像中的椒盐噪点的颗粒状明暗像素点;
(1.2)二值化操作处理掉输入图像背景中的介于汉字与背景之间的干扰颜色;
(1.3)借助掩膜矩阵检测汉字边缘的穿刺与孔洞并加以消除和修补,使汉字的轮廓平滑,以利于后面的轮廓提取工作。
步骤2单字提取,通过水平竖直两个方向上的投影直方图,完成对大段文字的分割,获得单字图像,并单字图像进行归一化操作,得到尺寸一致的文字;
(2.1)垂直投影的直方图的空白区域对应于字帖中的列间隙,计算平均的列宽值W,若某一列宽度小于0.6W时则需要比较它是否与相邻列是同列,宽度之和近似于W;同理在每列上求水平方向的直方图,分割出单字。
(2.2)通过线性绽放,将分割出的单字归一化为指定的尺寸,由于各字书写时大小变化并不明显,因而绽放比例相对也小,这种简单的线性绽放不会造成过多的结构损失。
步骤3笔划提取,基于轮廓分析的结果提取汉字笔划,然后对笔划轮廓进行点采样、三角网格化,分析三角网格化后的笔划连续性,确定笔划重组规则;
(3.1)基本轮廓分析的方法提取汉字的笔划,保留汉字的书写特征;
(3.2)采用Harris角点检测算法,确定在轮廓上的采样点;
(3.3)采用Delaunay三角分割算法对笔划轮廓进行三角网格化。
步骤4建立特征矩阵,抽取笔划的中心线、宽度、收缩速度、弯曲度信息作为汉字的书写特征,每个特征用一个向量来描述,称为特征向量,以上四个特征向量组成一个矩阵,称为特征矩阵;
汉字的书写特征用一个包含四个特征向量的特征矩阵描述,即特征矩阵M={L,K,S,B};每个笔划都被一个特征矩阵M来表示:
其中,四个特征向量分别是伸缩特征向量L,分量形式为p1,p2,…,pn、粗细向量K,分量形式为r1,r2,…,rn、收缩速度向量S,分量形式为0,s2,…,sn、弯曲度向量B,分量形式为Dv1,Dv2,…,Dvn,分别用来刻画汉字笔划在中心线拉伸、笔划宽度、末端落笔收缩速度、笔划弯曲程度上的表现。
步骤5编辑特征矩阵,通过编辑中心线的伸缩、笔划粗细、收缩速度、弯曲度实现对汉字书写特征的修改,这些改变将反应在以这些书写特征重组的笔划也即变换后的汉字上;通过一种或者组合几种书写特征的编辑,将输入的汉字图像变换出不同书写样式的汉字图像。
对书写特征的编辑实质是对特征矩阵中特征向量值的修改;一次编辑一个特征向量,或同时编辑多个特征向量实现单一或复合的汉字变换效果;当需要变换笔划粗细时,需提供一个变换算子ΔK,分量形式为k1,k2,…,kn,变换后的特征矩阵M'为:
相对于现有的其它技术相比本发明的优点在于:本发明针对的是碑文、毛笔字帖的中汉字的特征描述技术,实现了对图像中汉字的分析,笔划的提取,完成了书写特点的计算机表述,并给出了软笔这些特征的编辑方法,通过对这些特征的编辑实现了对已有软笔汉字的样式变换。
附图说明
图1是本发明基于书写特征编辑的软笔汉字变换方法的过程示意图;
图2是本发明的汉字特征变换结果示意图。
具体实施方式
如图1所示,本发明一种基于书写特征编辑的软笔汉字变换方法采用如下步骤:
步骤一、图像预处理:
(1)中值滤波。对图像中每个像素点,取其邻近区域像素点的值,按有难度等级排序。将该点的有难度值设置为邻近区域的灰度中值。通过中值滤波,可以较好的去除孤立的噪声像素。
(2)二值化。通过对局部区域进行平均值的中点迭代计算局部最佳阈值,若像素值大于此最佳阈值,设置像素颜色为1,否则设置像素颜色为0。
(3)轮廓平滑。这一步主要处理汉字轮廓周转的穿刺和孔洞。用掩膜矩阵判断穿刺和孔洞是否存在。
步骤二、单字提取:
(1)分别在竖直、水平方向上投影得到直方图,得到单字的大概位置。在做竖直投影时,首先计算平均列宽M,当列宽小于0.6M时,则考虑它和相信列之和是否接近M。若接近,则将两列合并为一列。同理适用于水平方向上做投影的情景。
(2)使用线性归一化,对找到的汉字进行适当绽放(比例较小),使所有提取到的单字达到相近的尺寸。
步骤三、笔划提取:
采用基于轮廓分析的方法提取笔画。首先用Canny算法提取笔划轮廓,然后寻找笔划相交区域作为笔划分隔处。对分隔出的笔划分别计算其斜率,两两斜率差小于某个阈值时,则将它们合并为一个笔划。利用Harris方法求出一级采样点,并在一级采样点间做等距点采样,利用Delaunay分割算法将笔划进行三角网格化。最后经连续性分析,最终确定提取到的笔划集。
步骤四、建立特征矩阵:
特征矩阵包含四个特征向量:伸缩、宽度、收缩速度、弯曲度。其中,伸缩特征向量是指笔划在其中心线上的伸缩;粗细是用来描述笔划的粗细;收缩速度描述笔划末端由落笔造成的精细变化;弯曲度则描述了运笔过程中,笔尖的走势力。
对步骤三中提取到的每个笔划,计算其对应的伸缩特征向量、宽度向量、收缩速度向量、弯曲度向量。保存成特征矩阵。
步骤五、编辑特征矩阵,变换汉字:
根据用户的输入,编辑步骤四中提取到的特征矩阵,根据编辑后的特征矩阵,重新生成笔划,组合成新的样式的汉字,以此达到汉字变换的目标。
如图2所示,是用本发明的基于书写特征编辑的软笔汉字变换方法生成的特征各异的“中”字的变换效果。
本发明未详细阐述部分属于本领域公知技术;以上所述,仅为本发明部分具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本领域的人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
Claims (4)
1.一种基于书写特征编辑的软笔汉字变换方法,其特征包括以下步骤:
步骤1图像预处理,用滤波、二值化方法对图像进行初步的降噪处理,然后消除笔划边缘的穿刺和孔洞使汉字轮廓变得平滑;
步骤2单字提取,通过水平竖直两个方向上的投影直方图,完成对大段文字的分割,获得单字图像,并单字图像进行归一化操作,得到尺寸一致的文字;
步骤3笔划提取,基于轮廓分析的结果提取汉字笔划,然后对笔划轮廓进行点采样、三角网格化,分析三角网格化后的笔划连续性,确定笔划重组规则;
步骤4建立特征矩阵,抽取笔划的中心线、宽度、收缩速度、弯曲度信息作为汉字的书写特征,每个特征用一个向量来描述,称为特征向量,以上四个特征向量组成一个矩阵,称为特征矩阵;其中,伸缩特征向量是指笔划在其中心线上的伸缩;粗细是用来描述笔划的粗细;收缩速度描述笔划末端由落笔造成的精细变化;弯曲度则描述了运笔过程中,笔尖的走势力;
所述步骤4汉字书写特征的建立的具体内容包括:
(4.1)汉字的书写特征用一个包含四个特征向量的特征矩阵描述,即特征矩阵M={L,K,S,B};每个笔划都被一个特征矩阵M来表示:
其中,四个特征向量分别是伸缩特征向量L,分量形式为p1,p2,…,pn、粗细向量K,分量形式为r1,r2,…,rn、收缩速度向量S,分量形式为0,s2,…,sn、弯曲度向量B,分量形式为Dv1,Dv2,…,Dvn,分别用来刻画汉字笔划在中心线拉伸、笔划宽度、末端落笔收缩速度、笔划弯曲程度上的表现;
步骤5编辑特征矩阵,通过编辑中心线的伸缩、笔划粗细、收缩速度、弯曲度实现对汉字书写特征的修改,这些改变将反应在以这些书写特征重组的笔划也即变换后的汉字上;通过一种或者组合几种书写特征的编辑,将输入的汉字图像变换出不同书写样式的汉字图像。
2.根据权利要求1所述的基于书写特征编辑的软笔汉字变换方法,其特征在于:所述步骤1中软笔汉字图像预处理的具体过程如下:
(1.1)采用中值滤波方法处理输入图像中的椒盐噪点的颗粒状明暗像素点;
(1.2)二值化操作处理掉输入图像背景中的介于汉字与背景之间的干扰颜色;
(1.3)借助掩膜矩阵检测汉字边缘的穿刺与孔洞并加以消除和修补,使汉字的轮廓平滑,以利于后面的轮廓提取工作。
3.根据权利要求1所述的基于书写特征编辑的软笔汉字变换方法,其特征在于:所述步骤3笔划的网格化过程具体过程如下:
(3.1)基本轮廓分析的方法提取汉字的笔划,保留汉字的书写特征;
(3.2)采用Harris角点检测算法,确定在轮廓上的采样点;
(3.3)采用Delaunay三角分割算法对笔划轮廓进行三角网格化。
4.根据权利要求1所述的基于书写特征编辑的软笔汉字变换方法,其特征在于:所述步骤5汉字书写特征的编辑的具体内容包括:
对书写特征的编辑实质是对特征矩阵中特征向量值的修改;一次编辑一个特征向量,或同时编辑多个特征向量实现单一或复合的汉字变换效果;当需要变换笔划粗细时,需提供一个变换算子ΔK,分量形式为k1,k2,…,kn,变换后的特征矩阵M'为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510441000.XA CN105069742B (zh) | 2015-07-24 | 2015-07-24 | 一种基于书写特征编辑的软笔汉字变换方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510441000.XA CN105069742B (zh) | 2015-07-24 | 2015-07-24 | 一种基于书写特征编辑的软笔汉字变换方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105069742A CN105069742A (zh) | 2015-11-18 |
CN105069742B true CN105069742B (zh) | 2018-12-11 |
Family
ID=54499100
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510441000.XA Expired - Fee Related CN105069742B (zh) | 2015-07-24 | 2015-07-24 | 一种基于书写特征编辑的软笔汉字变换方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105069742B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108305209B (zh) * | 2017-01-12 | 2021-06-04 | 富士通株式会社 | 字符变形方法和字符变形设备 |
CN107578039A (zh) * | 2017-10-08 | 2018-01-12 | 王奕博 | 基于数字图像处理技术的字迹轮廓比对方法 |
CN111160147A (zh) * | 2019-12-16 | 2020-05-15 | 华南理工大学 | 一种书法作品图像的裁剪和识别方法 |
CN112800936B (zh) * | 2021-01-25 | 2022-03-08 | 中南大学 | 基于计算机视觉的书法临帖智能评价与指导方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6043087A (en) * | 1997-07-25 | 2000-03-28 | The New York Blood Center | Monospecific antibody reactive with matrix metalloproteinase cleavage products of fibrin(ogen) |
CN102637078A (zh) * | 2012-02-27 | 2012-08-15 | 厦门大学 | 一种结构优化的汉字字形生成方法 |
CN104182748A (zh) * | 2014-08-15 | 2014-12-03 | 电子科技大学 | 一种基于拆分匹配的汉字笔画自动提取方法 |
-
2015
- 2015-07-24 CN CN201510441000.XA patent/CN105069742B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6043087A (en) * | 1997-07-25 | 2000-03-28 | The New York Blood Center | Monospecific antibody reactive with matrix metalloproteinase cleavage products of fibrin(ogen) |
CN102637078A (zh) * | 2012-02-27 | 2012-08-15 | 厦门大学 | 一种结构优化的汉字字形生成方法 |
CN104182748A (zh) * | 2014-08-15 | 2014-12-03 | 电子科技大学 | 一种基于拆分匹配的汉字笔画自动提取方法 |
Non-Patent Citations (2)
Title |
---|
书法碑帖文字的笔划提取技术及其实现;赵琪;《中国优秀硕士学位论文全文数据库<信息科技辑>》;20110315;摘要,第1-57页 * |
基于统计模型的书法创作模拟;董军等;《计算机学报》;20080731;第31卷(第7期);第1276-1282页 * |
Also Published As
Publication number | Publication date |
---|---|
CN105069742A (zh) | 2015-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109376582B (zh) | 一种基于生成对抗网络的交互式人脸卡通方法 | |
CN108805957B (zh) | 一种基于位图图像自适应分割的矢量图生成方法及系统 | |
CN103456010B (zh) | 一种基于特征点定位的人脸卡通画生成方法 | |
CN102567727B (zh) | 一种背景目标替换方法和装置 | |
Magnenat et al. | Live texturing of augmented reality characters from colored drawings | |
CN105069742B (zh) | 一种基于书写特征编辑的软笔汉字变换方法 | |
CN106384094A (zh) | 一种基于书写风格建模的中文字库自动生成方法 | |
CN107945244A (zh) | 一种基于人脸照片的简笔画生成方法 | |
CN111046763B (zh) | 一种人像卡通化的方法和装置 | |
CN105046206B (zh) | 基于视频中运动先验信息的行人检测方法及装置 | |
CN103942794A (zh) | 一种基于置信度的图像协同抠图方法 | |
CN102024156A (zh) | 彩色人脸图像中的唇部区域定位方法 | |
CN107944451B (zh) | 一种藏文古籍文档的行切分方法及系统 | |
CN108564120A (zh) | 基于深度神经网络的特征点提取方法 | |
CN104794693A (zh) | 一种人脸关键区域自动检测蒙版的人像优化方法 | |
CN103049756A (zh) | 基于cema算法和纹理块匹配修复技术的自动提取与去除彩色图像内文字的方法 | |
CN104932683A (zh) | 一种基于视觉信息的游戏体感控制方法 | |
CN107578039A (zh) | 基于数字图像处理技术的字迹轮廓比对方法 | |
Rosin et al. | Non-photorealistic rendering of portraits | |
CN103455816B (zh) | 一种笔画宽度提取方法、装置及一种文字识别方法、系统 | |
CN108256518A (zh) | 文字区域检测方法及装置 | |
CN114494306A (zh) | 边缘梯度协方差引导的甲骨卜辞文字轮廓修复方法 | |
CN104992176B (zh) | 一种面向碑文的汉字提取方法 | |
CN105373798A (zh) | 一种基于k近邻抠图和数学形态学的书法字提取方法 | |
CN103093211A (zh) | 基于深度核信息图像特征的人体运动跟踪方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20181211 |