CN100533478C - 基于最优全局仿射变换的汉字合成实现方法 - Google Patents
基于最优全局仿射变换的汉字合成实现方法 Download PDFInfo
- Publication number
- CN100533478C CN100533478C CNB2007100290790A CN200710029079A CN100533478C CN 100533478 C CN100533478 C CN 100533478C CN B2007100290790 A CNB2007100290790 A CN B2007100290790A CN 200710029079 A CN200710029079 A CN 200710029079A CN 100533478 C CN100533478 C CN 100533478C
- Authority
- CN
- China
- Prior art keywords
- sigma
- affine transformation
- rho
- chinese character
- gat
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Abstract
本发明提供一种基于最优全局仿射变换的汉字合成实现方法,采用基本汉字部件库来存储组成汉字的部件图像,并利用全局仿射变换得到的仿射变换参数来变换基本汉字部件库中的部件,再将变换后的部件组成汉字。本发明设计了55种基本汉字部件图像,给出了全局仿射变换参数的计算方法,并使用以结构相似度评判方法来对合成汉字图像结构质量进行评判。本发明利用55种基本部件图像及相应的仿射变换,可以合成任意汉字,使得汉字存储量大大减少。
Description
技术领域
本发明属于信息技术的汉字合成领域,特别是涉及一种基于最优全局仿射变换的汉字合成实现方法。
技术背景
汉字在信息时代暴露出了存储量大的弱点,这些弱点给汉字字库在各种电子产品中的使用增加了困难。采用分级汉字字库减小汉字图像存储量是一个可行的解决途径。但在汉字图像存储中,每个汉字都由几个部件构成,这些部件包括基本笔画、偏旁部首以及字元,基本笔画如一丨丿丶乚等,偏旁部首如艹钅亻犭纟等,字元如羽鬼仓田免等,许多的部件在不同的字中经常重复出现,所以在基本汉字部件库中只存储常用的部件,而每个汉字都通过这些部件来生成,从而达到减少存储量的目的。但是同一个部件在不同汉字中呈现不同的形态,如“攵”在“敖、悠”中,“木”在“林”,“树”,“枝”,“果”中,如何设计分级汉字字库及如何变换字库中的部件令其产生这些不同的形态至关重要。
现有技术包括将一个汉字分割成几块,再根据块间的比例将部件拼接起来;也包括根据汉字部件之间的结构将各种部件拼接起来,调整部件的比例结构从而达到较好的效果。这些方法都使用了部件的概念,但生成汉字时使用拼接的方法会使生成的汉字比较呆板。
在用部件生成汉字的时候,不仅需要将部件平移、缩放,还要形变,因此现有技术中还出现使用手动选点的仿射变换方法来构建基本汉字部件库,即在汉字和部件上手动地取对应的三点从而求出所需要的仿射变换参数。但是仅“楷体GB_2312”国标一级字库中就有3755个汉字,再加上字库中的五百多个部件,如果手动地选点,不仅人工工作量巨大,而且主观因素影响大,准确率不高,耗时耗力。
发明内容
本发明的目的在于克服现有技术的不足,使用最优全局仿射变换方法来构建基本汉字部件库,能够自动地匹配字库中的部件与汉字中对应部件的几何形状与位置并计算出仿射变换参数,在保证模拟结果的基础上既提高了效率,也提高了计算仿射变换参数的速度。
为了实现上述发明目的,采用的技术方案如下:
设计并采用基本汉字部件库来存储组成汉字的部件图像,并利用全局仿射变换得到的仿射变换参数来变换基本汉字部件库中的部件,再将变换后的部件组成汉字。基本汉字部件库由如下55个基本汉字部件图像组成:
用S表示基本汉字部件库中的部件,即源图像,R表示标准汉字图像相应的部件,即目标图像:
S={s1,s2,...,si,...,sm}
R={ri,r2,...,rj,...,rn} (1)
A,b为仿射变换参数,A为二维矩阵,b为二维列向量,则S经全局仿射变换变换之后的得到的合成汉字图像为
使S*和R的最近邻点距离的加权均值DNN最小化来求解仿射变换参数A和b,数学表示如式(2)所示
(2)
→Minfor A,b
其中,
求解式(2)只需Φ对A和b同时求微分,得式(3)式(4)所示的方程组:
并将公式(3)两边同时求转置得到公式(5):
则由公式(4)和(5)组成公式(6)所示的方程组:
解方程组(6)即得仿射变换参数A,b如公式(7):
其中,公式(7)中的各参数如下所示:
上述述仿射变换参数的计算过程还包括最优的仿射变换参数计算,最优的仿射变换参数计算采用迭代的过程来得出最优的A和b,迭代过程采用S*代替公式(2)中的源图像S,当S*与基本汉字部件库中的目标图像R的距离不再减小时结束。最优的仿射变换参数AGAT和bGAT的具体迭代计算过程如下:
同时,
由公式(8)和(9)可得第n次迭代后总的仿射变换参数为:
当n=1时
为了得到较好的变换效果,计算仿射变换参数之前先对基本汉字部件库中的部件源图像以及目标图像进行预处理,所述预处理包括对齐两幅图像的重心、提取轮廓、骨架或者特征点,所述特征点包括轮廓上的拐点及端点。仿射变换仅仅在特征点上进行,这样有效的降低了计算复杂度。使用重心对齐方法可以改善模拟质量。本发明使用以图像结构作为评判中心的结构相似度评判方法来对组成合成汉字的各部件的结构关系是否合理,以及合成汉字是否美观进行判断。结构相似度评判方法具体实现如下:
分别用X={xi|i=1,2,...,N}和Y={yi|i=1,2,...,N}表示源图像和测试图像,则相似度Q的定义如公式(11)所示:
其中, Q的取值范围为[-1,1],取值越大代表两个图像的结构相似度越高。
对于同一幅图像,不同区域的图像质量是有差异的,因此使用了滑动窗,如果滑动窗的数目是M,每个窗内的结构相似度为Qj,则整幅图像最终的结构相似度为:
本发明基于最优全局仿射变换方法构建的基本汉字部件库与真实汉字的变换关系,利于数量有限的基本部件库及仿射变换参数自动生成汉字,大大减少了字库的存储量,有着广泛的应用价值,如应用于掌上电脑、手机、嵌入式系统或单片机中,可以大大减少存储量需要的成本。
附图说明
图1为本发明以实施例的流程图;
图2为计算相似度的流程图。
具体实施方式
本发明并采用基本汉字部件库来存储组成汉字的部件图像,并利用全局仿射变换得到的仿射变换参数来变换基本汉字部件库中的部件,再将变换后的部件组成汉字。基本汉字部件库由如下55个基本汉字部件图像组成:
用S表示基本汉字部件库中的部件,即源图像,R表示标准汉字图像相应的部件,即目标图像:
S={s1,s2,...,si,...,sm}
R={r1,r2,...,rj,...,rn} (1)
A,b为仿射变换参数,A为二维矩阵,b为二维列向量,则S经全局仿射变换变换之后的得到的合成汉字图像为
使S*和R的最近邻点距离的加权均值DNN最小化来求解仿射变换参数A和b,数学表示如式(2)所示
→Minfor A,b
其中,
求解式(2)只需Φ对A和b同时求微分,得式(3)式(4)所示的方程组:
并将公式(3)两边同时求转置得到公式(5):
则由公式(4)和(5)组成公式(6)所示的方程组:
解方程组(6)即得仿射变换参数A,b如公式(7):
其中,公式(7)中的各参数如下所示:
上述述仿射变换参数的计算过程还包括最优的仿射变换参数计算,最优的仿射变换参数计算采用迭代的过程来得出最优的A和b,迭代过程采用S*代替公式(2)中的源图像S,当S*与基本汉字部件库中的目标图像R的距离不再减小时结束。最优的仿射变换参数AGAT和bGAT的具体迭代计算过程如下:
同时,
由公式(8)和(9)可得第n次迭代后总的仿射变换参数为:
当n=1时
本发明在计算仿射变换参数之前先对基本汉字部件库中的部件源图像以及目标图像进行预处理,所述预处理包括提取轮廓、骨架或者特征点,所述特征点包括轮廓上的拐点及端点。由于GAT变换需要遍历汉字图像上的每个点,实施例中在计算仿射变换参数之前先对源图像以及目标图像进行预处理:提取轮廓、骨架或者特征点(轮廓上的拐点及端点),这些预处理并未改变汉字和部件的基本形状,因此对仿射变换参数影响不大,但却提高了计算参数的速度,此方法称之为SGAT。
采用SGAT合成汉字的结果往往并不理想,特别是SGAT对单笔画基本上没有模拟能力,因此有必要对SGAT做一些改进。本实施例在SGAT迭代过程中,对源图像以及目标图像增加一个处理:对齐两幅图像的重心。即预处理包括提取轮廓、骨架或者特征点、对齐两幅图像的重心,所述特征点包括轮廓上的拐点及端点。本实施例将包括有对齐两幅图像的重心的方法称之为IGAT,通过IGAT对齐图像的重心之后,提高了汉字与部件最近邻点的正确匹配率,因此能够得到更好的仿射变换参数,但是对于汉字本身就是部件的汉字来说,由于重心计算误差,对齐重心的操作有时反而会使合成汉字与标准汉字出现位移上的偏差。因此为了每个汉字取得最优的仿射变换参数,在每次迭代过程中,都在SGAT(不对齐图像重心)和IGAT(对齐图像重心)所得到的参数中选择最优的参数,本文将该方法称之为NGAT,如附图2所示,将原图像及目标图像进行提取轮廓、骨架或者特征点的预处理后,分别通过SGAT和IGAT计算仿射变换参数,然后根据不同的汉字在迭代过程中选择最优的参数。
本实施例还使用结构相似度评判方法来对组成合成汉字的各部件的结构关系是否合理,以及合成汉字是否美观进行判断,结构相似度评判方法以图像结构做为评判中心的。
所述结构相似度评判方法具体实现如下:
分别用X={xi|i=1,2,...,N}和Y={yi|i=1,2,...,N}表示源图像和测试图像,则相似度Q的定义如公式(11)所示:
其中, Q的取值范围为[-1,1],当yi=xi(i=1,2,....N)时,Q=1;当yi=2x-xi时,Q=-1;
为了更加清楚的理解Q的含义,对Q进行了简单的改写:
Q的第一项表示X和Y之间的线性关系,当yi=axi+b(i=1,2,....N,a,b为常数且a>0)时,该项为1;第二项表示X和Y的亮度关系,当x=y时,此项等于1;第三项表示X和Y之间的相似度,当σx=σy时,该项等于1;
对于同一幅图像,不同区域的图像质量是有差异的,因此使用了滑动窗,如果滑动窗的数目是M,每个窗内的结构相似度为Qj,则整幅图像最终的结构相似度为:
Q的定义式(12)中含有分母,对于二值化的汉字当使用滑动窗的时候,Q的分母很可能为0,因此本发明针对Q的计算问题进行了推导:
(1)只要不用“0”表示图像的特征,即可保证式(11)中(x)2+(y)2≠0。
(2)当 时,σx=σy=0,则式(12)中的第三项等于1。根据和的定义可得此时xi=x,yi=y,如果x=y,则xi=yi,所以Q=1;如果x≠y,令a=1,b=y-x,则yi=axi+b,因此式(12)的第一项为1,所以此时Q等于式(12)中的第二项,其流程图如附图2所示。
本实施例比较了各种仿射变换方法和预处理计算仿射变换参数所需要的时间,如表1所示:
表1.(单位ms):各种仿射变换和预处理计算参数所用时间(SPH:手动选点,C:轮廓,s:骨架,F:特征点)
从表1中可以看出:
(1)对于三种不同的预处理(轮廓、骨架和特征点),无论是SGAT还是NGAT,特征点都具有明显的优势。这是因为特征点数远远少于轮廓和骨架的点数,大大降低了计算复杂度,提高了计算速度。
(2)当采用特征点时,SGAT和NGAT所用时间都远远少于手动选点的时间,甚至相差数十倍之多。
(3)当采用特征点时,NGAT具有和SGAT相当的时间性能。但是NGAT的模拟效果是SGAT无法比拟的。
本实施例在计算合成汉字和标准汉字的结构相似度时采用4*4的滑动窗,先对手动选点方法的国标一级字库的3755个“楷体GB_2312”的合成汉字进行评判,并把汉字按模拟效果从好到坏进行排序,为了说明NGAT的有效性,本文从前面模拟效果较好的1900个字中以50个汉字为间隔共取38个汉字,后面模拟效果较差的以25个为间隔共取74个汉字,最后5个最差的全选,最终得到117个汉字作为实验样本,这些样本的各种方法的平均结构相似度如表2所示:
表2:各种方法的平均结构相似度
从表2可看出当采用特征点时,NGAT的平均结构相似度基本等于手动选点的,但是NGAT自动的点匹配以及高计算速度是手动选点方法无法企及的。
本发明利用GAT得到的仿射变换参数变换分级字库中的部件,并将部件组成汉字,并使用以图像结构做为评判中心的结构相似度评判方法,而不是简单的象素点的比对,这更加适应于评判由分级字库组成的合成汉字。本发明利用55种基本部件图像及相应的仿射变换,可以合成任意汉字,实际应用时只需要存储55种基本部件图像及仿射变换参数,而不需要对每个汉字的图像进行存储,使得汉字存储量大大减少。
Claims (8)
1、一种基于最优全局仿射变换的汉字合成实现方法,其特征在于采用基本汉字部件库来存储组成汉字的部件图像,并利用全局仿射变换得到的仿射变换参数来变换基本汉字部件库中的部件,再将变换后的部件组成汉字;
所述全局仿射变换过程如下:
用S表示基本汉字部件库中的部件,即源图像,R表示标准汉字图像相应的部件,即目标图像:
S={s1,s2,...,si,...,sm}
R={r1,r2,...,rj,...,rn}
A,b为仿射变换参数,A为二维矩阵,b为二维列向量,则S经全局仿射变换变换之后的得到的合成汉字图像为
所述全局仿射变换的参数计算过程如下:
使S*和R的最近邻点距离的加权均值DNN最小化来求解仿射变换参数A和b,数学表示如式(2)所示
其中,
求解式(2)只需Φ对A和b同时求微分,得式(3)式(4)所示的方程组:
并将公式(3)两边同时求转置得到公式(5):
则由公式(4)和(5)组成公式(6)所示的方程组:
解方程组(6)即得仿射变换参数A,b如公式(7):
其中,公式(7)中的各参数如下所示:
3、根据权利要求1所述的基于最优全局仿射变换的汉字合成实现方法,其特征在于所述仿射变换参数的计算过程还包括最优的仿射变换参数计算,所述最优的仿射变换参数计算采用迭代的过程来得出最优的A和b,迭代过程采用S*代替公式(2)中的源图像S,当S*与基本汉字部件库中的目标图像R的距离不再减小时结束。
5、根据权利要求4所述的基于最优全局仿射变换的汉字合成实现方法,其特征在于在计算仿射变换参数之前先对基本汉字部件库中的部件源图像以及目标图像进行预处理,所述预处理包括提取轮廓、骨架或者特征点,所述特征点包括轮廓上的拐点及端点。
6、根据权利要求5所述的基于最优全局仿射变换的汉字合成实现方法,其特征在于在计算仿射变换参数的迭代过程中对基本汉字部件库中的部件源图像以及目标图像进行预处理,所述预处理是指对齐两幅图像的重心。
7、根据权利要求5或6所述的基于最优全局仿射变换的汉字合成实现方法,其特征在于还包括使用以图像结构为评判中心的结构相似度评判方法来对组成合成汉字的各部件的结构关系是否合理,以及合成汉字是否美观进行判断。
8、根据权利要求7所述的基于最优全局仿射变换的汉字合成实现方法,其特征在于所述结构相似度评判方法具体实现如下:
分别用X={xi|i=1,2,...,N}和Y={yi|i=1,2,...,N}表示源汉字图像和目标图像,则相似度Q的定义如公式(11)所示:
其中, Q的取值范围为[-1,1];
又使用了滑动窗表示同一幅图像不同区域的图像质量的差异,如果滑动窗的数目是M,每个窗内的结构相似度为Qj,则整幅图像最终的结构相似度为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2007100290790A CN100533478C (zh) | 2007-07-09 | 2007-07-09 | 基于最优全局仿射变换的汉字合成实现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2007100290790A CN100533478C (zh) | 2007-07-09 | 2007-07-09 | 基于最优全局仿射变换的汉字合成实现方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101105858A CN101105858A (zh) | 2008-01-16 |
CN100533478C true CN100533478C (zh) | 2009-08-26 |
Family
ID=38999741
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2007100290790A Expired - Fee Related CN100533478C (zh) | 2007-07-09 | 2007-07-09 | 基于最优全局仿射变换的汉字合成实现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100533478C (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107241100B (zh) * | 2016-03-29 | 2019-11-08 | 北大方正集团有限公司 | 字库部件压缩方法及装置 |
CN107818544B (zh) * | 2016-09-12 | 2020-05-05 | 北京大学 | 一种字符缩放方法 |
CN108305209B (zh) * | 2017-01-12 | 2021-06-04 | 富士通株式会社 | 字符变形方法和字符变形设备 |
CN112434763A (zh) * | 2020-11-24 | 2021-03-02 | 伍曙光 | 一种基于计算机的汉字骨架生成方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1173673A (zh) * | 1996-04-02 | 1998-02-18 | 现代电子产业株式会社 | 利用中心轴变换的字体及其书写体的变形和光栅化的方法 |
CN1181556A (zh) * | 1996-10-24 | 1998-05-13 | 佳能株式会社 | 字符发生方法及设备 |
CN1488120A (zh) * | 2001-01-15 | 2004-04-07 | �¿���˹�����ɷ�����˾ | 用于识别手写字符的方法、装置和计算机程序 |
US6785418B1 (en) * | 1999-09-09 | 2004-08-31 | Sony United Kingdom Limited | Image identification apparatus and method of identifying images |
-
2007
- 2007-07-09 CN CNB2007100290790A patent/CN100533478C/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1173673A (zh) * | 1996-04-02 | 1998-02-18 | 现代电子产业株式会社 | 利用中心轴变换的字体及其书写体的变形和光栅化的方法 |
CN1181556A (zh) * | 1996-10-24 | 1998-05-13 | 佳能株式会社 | 字符发生方法及设备 |
US6785418B1 (en) * | 1999-09-09 | 2004-08-31 | Sony United Kingdom Limited | Image identification apparatus and method of identifying images |
CN1488120A (zh) * | 2001-01-15 | 2004-04-07 | �¿���˹�����ɷ�����˾ | 用于识别手写字符的方法、装置和计算机程序 |
Non-Patent Citations (4)
Title |
---|
变形变换及其在手写体汉字整形中的应用. 金连文,黄建成,尹俊勋,贺前华.中国图象图形学报,第7(A)卷第2期. 2002 |
变形变换及其在手写体汉字整形中的应用. 金连文,黄建成,尹俊勋,贺前华.中国图象图形学报,第7(A)卷第2期. 2002 * |
基于部件复用的分级汉字字库的构想与实现. 冯万仁,金连文.计算机应用,第26卷第3期. 2006 |
基于部件复用的分级汉字字库的构想与实现. 冯万仁,金连文.计算机应用,第26卷第3期. 2006 * |
Also Published As
Publication number | Publication date |
---|---|
CN101105858A (zh) | 2008-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tran et al. | Regressing robust and discriminative 3d morphable models with a very deep neural network | |
Tuan Tran et al. | Regressing robust and discriminative 3D morphable models with a very deep neural network | |
CN106056628B (zh) | 基于深度卷积神经网络特征融合的目标跟踪方法及系统 | |
Zheng et al. | Non-local scan consolidation for 3D urban scenes | |
CN102096934B (zh) | 一种基于机器学习的人脸卡通画生成方法 | |
CN108171133B (zh) | 一种基于特征协方差矩阵的动态手势识别方法 | |
CN107808129A (zh) | 一种基于单个卷积神经网络的面部多特征点定位方法 | |
CN101958000B (zh) | 基于稀疏表示的人脸画像-照片生成方法 | |
CN101271520A (zh) | 一种确定图像中的特征点位置的方法及装置 | |
CN104346824A (zh) | 基于单张人脸图像自动合成三维表情的方法及装置 | |
CN100369064C (zh) | 一种基于视频内容的人体姿态变形方法 | |
CN110827312B (zh) | 一种基于协同视觉注意力神经网络的学习方法 | |
CN105493078A (zh) | 彩色草图图像搜索 | |
CN104835153B (zh) | 基于稀疏表示的非刚性表面对齐方法 | |
CN103020614B (zh) | 基于时空兴趣点检测的人体运动识别方法 | |
CN110378208A (zh) | 一种基于深度残差网络的行为识别方法 | |
Yi et al. | Motion keypoint trajectory and covariance descriptor for human action recognition | |
CN104268526A (zh) | 一种汉字图片匹配与变形方法 | |
CN100533478C (zh) | 基于最优全局仿射变换的汉字合成实现方法 | |
CN111209811A (zh) | 一种实时检测眼球注意力位置的方法及系统 | |
CN106778714A (zh) | 基于非线性特征和模型合并的lda人脸识别方法 | |
CN102231209A (zh) | 基于异构特征降维的二维角色卡通生成方法 | |
Gu et al. | Visual affordance detection using an efficient attention convolutional neural network | |
CN103093211B (zh) | 基于深度核信息图像特征的人体运动跟踪方法 | |
CN103226825A (zh) | 基于低秩稀疏模型的遥感图像变化检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090826 Termination date: 20160709 |
|
CF01 | Termination of patent right due to non-payment of annual fee |