CN101393693A - 一种汉字书写计算机教学方法 - Google Patents

一种汉字书写计算机教学方法 Download PDF

Info

Publication number
CN101393693A
CN101393693A CNA2008101212026A CN200810121202A CN101393693A CN 101393693 A CN101393693 A CN 101393693A CN A2008101212026 A CNA2008101212026 A CN A2008101212026A CN 200810121202 A CN200810121202 A CN 200810121202A CN 101393693 A CN101393693 A CN 101393693A
Authority
CN
China
Prior art keywords
font
stroke
aesthetics
scoring
chinese character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008101212026A
Other languages
English (en)
Other versions
CN101393693B (zh
Inventor
徐颂华
江浩
刘智满
潘云鹤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN2008101212026A priority Critical patent/CN101393693B/zh
Publication of CN101393693A publication Critical patent/CN101393693A/zh
Application granted granted Critical
Publication of CN101393693B publication Critical patent/CN101393693B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Controls And Circuits For Display Device (AREA)

Abstract

本发明公开了一种针对汉字书写的计算机辅助教学方法。采用了一系列计算机图像处理和人工智能的方法,可以实现自动或半自动的计算机汉字书写辅助教学。该方法预先对大量手写体汉字样本的特征和美观度进行人工评分;然后接受习作用户的手写输入,并使用一种汉字书写形态美观度的计算机自动评估方法,对用户的手写字体进行评分;接着将用户的手写字体参数化,转化成以若干标准字体的线性之和来表示;最后使用一个非线性规划的最优化方法,反复调整插值系数从而不断提高新字体的美观度评分,在保留用户字迹特征基础上,指导用户改善自己的手写字体美观度;也可以由用户指定仅仅为字体某一局部或整体结构作出指导。

Description

一种汉字书写计算机教学方法
技术领域
本发明涉及计算机艺术与美学以及人工智能领域,尤其涉及一种针对汉字书写的计算机辅助教学方法。
背景技术
已经有大量的工作来模拟人类的艺术思维,并进一步建立计算机智能系统以解决真实世界里的问题。在中文字方面,1995年的Proceedings of the InternationalConference on Computer Processing of Oriental Languages(ICCPOL)会议论文集(文章标题“Chinese glyph generation using character composition and beautyevaluation metrics”)公布了一个使用启发式的方法来尝试定量评估中文字体美感的问题:他们定义了在汉字写作里的四条规则,并实现到了他们基于规则的美学评分模块中;这一模块简单地对四条规则逐一计算相应的分数,并得到他们的加权和。2005年的IEEE Intelligent Systems杂志(文章标题“Automaticgeneration of artistic Chinese calligraphy”,以下简称文献IS2005)刊登了一个中国艺术书法的自动生成系统。但是,他们的工作主要关注在使用基于约束的推理来生成格式化的中文字体,而几乎没有关注到这些生成结果如何具有美感。
为了获得更好的计算机中文字体生成结果,也为了尝试对美学做定量计算,我们通过学习基本数值关系背后的训练集从而实现了汉字美观度评分。许多在工作中使用过专家系统的人知道,高级的专家规则并不总能正常工作;而有时这并不一定是由于专家系统本身的知识盲点,或者问题根本无法总结。因此我们觉得,我们基于学习技术的数据驱动方法可以提供一种比人类专家的大脑评测更好的机器评价能力。
在绘画方面,计算机图形学领域中同样有一些研究自动绘画创作的工作,但这大都是在给定一幅照片的基础上完成的。其他也有人探索了结合人工智能和人机交互技术来创作绘画风格的动画,如2006年ACM学报ACM Trans.Graph刊登的文章“Animating Chinese paintings through stroke-based decomposition”用笔划分解的方法来实现动态的绘画。在视觉艺术领域之外,计算机音乐是另一个应用人工智能技术来进行或协助创作的成功方向。在2007年的国际人工智能联合大会(IJCAI2007)上,有一个独立的专题叫音乐人工智能(MUSIC-AI2007)来专门研讨这一话题。值得注意的是,对于计算机音乐的研究包括自动音乐创作与音乐评价,这与我们在中文字体上的思路比较相似。此外还有其他大量的研究工作:如故事创作,可信执法官,互动式故事,等等,都旨在捕捉美学的可计算性。
发明内容
本发明的目的是克服现有技术的不足,提供一种针对汉字书写的计算机辅助教学方法。
一种针对汉字书写的计算机辅助教学方法包括以下步骤:
1)预先对每个汉字的手写体样本的特征和美观度进行人工评分;
2)通过计算机输入设备接受习作用户的手写字体输入,并使用图像处理的方法将用户手写字体参数化;
3)使用汉字书写形态美观度的计算机自动评估方法,对用户的手写字体进行评分;
4)将用户的手写字体参数化,将其转化成以若干标准字体的参数向量线性之和来表示,使用一个非线性规划的最优化方法,反复调整插值系数从而不断提高新字体的美观度评分,在保留用户字迹特征基础上,指导用户改善自己的手写字体美观度;也可以由用户指定仅仅为字体某一局部或整体结构作出指导。
所述的预先对每个汉字的手写体样本的特征和美观度进行人工评分步骤:
(1)通过多人调查方式,让多个人各自对来自100个汉字的单笔划图像做评分,评分结果为“好”、“一般”、“差”三种其中之一;综合所有人的评分结果,计算该笔划的分数概率,即:分别统计将笔划评分为“好”、“一般”、“差”的人数,除以总人数,所得三个百分数分别为该笔划美观度为“好”、“一般”、“差”的概率,获得500~2000个单笔划的美观度的人工评价结果;
(2)通过多人调查方式,让多个人分别对汉字的内部结构美观度做评分,评分结果为“好”、“一般”、“差”三种其中之一;综合所有人的评分结果,计算该字体的分数概率,即:分别统计将字体评分为“好”、“一般”、“差”的人数,分别将其除以总人数,所得百分数分别为该字体分数为“好”、“一般”、“差”的概率;通过这样的方式获得500~2000个字体空间结构美观度的人工评价结果;
(3)通过多人调查方式,让多个人分别对多个汉字图像的风格一致性做评分,评分结果为“好”、“一般”、“差”三种其中之一;综合所有人的评分结果,计算该字体的分数概率,即:分别统计将该字评分为“好”、“一般”、“差”的人数,分别将其除以总人数,所得百分数分别为该该字分数为“好”、“一般”、“差”的概率;通过这样的方式获得100~300个汉字字体风格一致性的人工评价结果。
所述的通过计算机输入设备接受习作用户的手写字体输入,并使用图像处理的方法将用户手写字体参数化步骤:
(4)利用计算机输入设备,如鼠标、手写笔,接受用户的手写字体,以数字图像的方式存储;
(5)若用户手写了多个汉字,将用户的手写字体分割成若干个单字体,并将每个单字体图像转化为相同尺寸的点阵二值黑白图像;
(6)对每个汉字图像做细化,笔划分解,提取出其轨迹与书写宽度特征,以参数向量的形式表示每个汉字图像。
所述的对每个汉字图像做细化,笔划分解,提取出其轨迹与书写宽度特征,以参数向量的形式表示每个汉字图像步骤:
a)对汉字图像做细化处理,以获得该字的骨架图像;
b)将该字与其标准楷书字体做笔划匹配,用启发式搜索的方法找出骨架各部分与标准笔划的一一对应关系,完成骨架上的笔划分解;
c)对每笔划上的各骨架点,以其为圆心画椭圆,使该椭圆尽量大而又不包含任何原字体图像上的空白部分,该笔划的所有椭圆区域总和即为笔划分解所得的图像轮廓;
d)将所有椭圆的长短轴、圆心列为一个矩阵,即为该字体的参数向量;
所述的使用一种汉字书写形态美观度的计算机自动评估方法,对用户的手写字体进行评分步骤:
(7)以预先获得的单笔划美观度人工评分结果为训练集,使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体单笔划形态与其美观度评价结果间的映射关系,然后使用训练后的学习器对字体单笔划美观度进行评分;
(8)以预先获得的字体内部结构美观度人工评分结果为训练集,使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体内部结构特征与其美观度评价结果间的映射关系,然后使用训练后的学习器对字体内部结构进行评分,其中,字体内部结构包括字体各内部笔划或偏旁部首元素间的拓扑关系、相对位置关系、面积遮盖关系,以及笔划与笔划、笔划与偏旁部首之间的空间位置关系与该字的标准字体的差异,实现对字体内的各部分空间结构分布的美观度评分;
(9)以预先获得的字体风格一致性人工评分结果为训练集,使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体风格一致性特征与其美观度评价结果间的映射关系,使用训练后的学习器对字体风格一致性进行评分;对字体各个内部笔划或偏旁部首元素计算出与该字多种已知风格字体的相似度,并以此确定该字体的风格一致性评分;
(10)根据对汉字进行的单笔划美观度评分、内部结构美观度评分、风格一致性评分,应用统计学习方法综合各项得分,获得该字体的总体美观度评分。
所述的以预先获得的单笔划美观度人工评分结果为训练集,使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体单笔划形态与其美观度评价结果间的映射关系,然后使用训练后的学习器对字体单笔划美观度进行评分步骤:
e)以预先获得单笔划美观度人工评分的各笔划的楷书体图像作为该笔划的标准笔划;将这些单笔划图像参数化,即提取出它们的轮廓、轨迹、位置信号,转换成向量的形式,对这些向量进行预处理,去除噪音,并进一步抽取特征向量,对获得的特征向量,与该笔划的标准笔划的特征向量作向量减法,从而得到单笔划的形态差异向量;
f)使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得单笔划的形态差异向量中的信号差异与美观度评价结果间的函数映射关系;即以形态差异向量与美观度评价结果分别作为人工神经网络、决策树、模糊逻辑或支持向量机的输入和输出;应用预先获得的人工评价结果,对人工神经网络或决策树或模糊逻辑或支持向量机施行带有反馈的机器学习过程;
g)使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机对单笔划进行评分:即对任意给定的单笔划图像,应用步骤e)得到该笔划与其标准笔划间的形态差异向量,以该向量作为训练后的人工神经网络或决策树或模糊逻辑或支持向量机的输入,获取此时输出的“好”、“一般”、“差”的概率,该汉字笔划的美观度得分为(“好”的概率+“一般”的概率÷2)×100。
所述的以预先获得的字体内部结构美观度人工评分结果为训练集,使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体内部结构特征与其美观度评价结果间的映射关系,然后使用训练后的学习器对字体内部结构进行评分,其中,字体内部结构包括字体各内部笔划或偏旁部首元素间的拓扑关系、相对位置关系、面积遮盖关系,以及笔划与笔划、笔划与偏旁部首之间的空间位置关系与该字的标准字体的差异,实现对字体内的各部分空间结构分布的美观度评分步骤:
h)通过笔划分解结果将该字体参数化,转换成向量的形式;这些向量层次化的表达了字体的轮廓、轨迹与相对位置信息;
i)将预先获得内部风格美观度人工评分的各字体的楷书体图像作为该字体的标准字体;提取出这些字体所对应向量中,各笔划或偏旁部首间的拓扑、几何关系的信号,与其标准字体的拓扑、几何关系的信号做比较,获得其信号差异,即做向量减法;
j)使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得向量信号差异与美观度评价结果间的映射关系;应用预先获得的人工标定的评价结果,对人工神经网络、决策树、模糊逻辑或支持向量机施行带有反馈的迭代学习过程;
k)使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机对字体空间结构美观度进行评分。即对任意给定的字体图像,应用步骤j)-步骤k)得到该字体内部结构与该字的标准字体间的信号差异,以该差异向量作为训练后的人工神经网络或决策树或模糊逻辑或支持向量机的输入,获取此时输出的“好”、“一般”、“差”的概率,该汉字的内部结构美观度得分为(“好”的概率+“一般”的概率÷2)×100;
所述的以预先获得的字体风格一致性人工评分结果为训练集,使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体风格一致性特征与其美观度评价结果间的映射关系,使用训练后的学习器对字体风格一致性进行评分;对字体各个内部笔划或偏旁部首元素计算出与该字多种已知风格字体的相似度,并以此确定该字体的风格一致性评分步骤:
l)对预先获得字体风格一致性人工评分的字体,将其对应的楷书体、行书体及隶书体中的书写形态样本,或更多其他字体,作为已知字体;
m)通过笔划分解结果将以上字体参数化,转换成向量的形式;这些向量层次化的表达了字体的轮廓、轨迹与相对位置信息;
n)对各字体的每个部分,计算出该部分与其各种已知字体该部分的相似程度;单笔划Ai与已知字体Bj的相似度Sij的计算方法可以任选以下两种之一:
(a)以已知字体Bj作为单笔划Ai的标准笔划,使用单笔划美观度评分方法计算出该笔划美观度的三个概率值P1,P2,P3,分别表示该笔划美观度为“好”、“一般”、“差”的概率;在本实施例中,Sij=P1×50%+P2×50%;
(b)求出笔划Ai的范围矩形,即能包含该笔划所有部分的矩形中的最小矩形,并通过不断平移和绕范围矩形中心旋转Ai,使Ai的字迹与其字体Bj相应笔划的字迹的重合面积最大;设Ai的字迹面积为C1,其字体Bj相应笔划的字迹的面积为C2,则Sij=|C1∩C2|/|C1∪C2|,及相似程度为C1、C2交集面积与C1、C2并集面积的比值;
o)将字体每个部分与每种已知字体的相似程度聚合可得到一个矩阵,作为该字体的风格一致性特征;
p)使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得该矩阵与美观度评价结果间的映射关系;应用人工标定的评价结果,对人工神经网络、决策树、模糊逻辑或支持向量机施行带有反馈的迭代学习过程;
q)使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机对字体风格一致性进行评分。即对任意给定的字体图像,应用步骤h)-步骤k)得到该字体与各已知字体间的相似度,以该矩阵作为训练后的人工神经网络或决策树或模糊逻辑或支持向量机的输入,获取此时输出的“好”、“一般”、“差”的概率,该字体的风格一致性得分为(“好”的概率+“一般”的概率÷2)×100;
所述的根据对汉字进行的单笔划美观度评分、内部结构美观度评分、风格一致性评分,应用统计学习方法综合各项得分,获得该字体的总体美观度评分步骤:
r)利用如权利要求6、7、8所述的三个方法,使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机自动获得100~300个汉字的各单笔划美观度得分、内部结构美观度得分和字体风格一致性得分;
s)通过多人调查方式,让多个人分别对步骤r)中所述汉字图像做美观度总体评分,评分结果为“好”、“一般”、“差”三种其中之一;综合所有人的评分结果,计算该字体的分数概率,即:分别统计将字体评分为“好”、“一般”、“差”的人数,分别将其除以总人数,所得百分数分别为该字体分数为“好”、“一般”、“差”的概率;
t)使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得步骤r)中的得分与步骤s)中的美观度总体评分间的映射关系;应用人工标定的评价结果,对人工神经网络、决策树、模糊逻辑或支持向量机施行带有反馈的迭代学习过程;
u)使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机对字体的总体美观度进行评分,即对任意给定的汉字字体图像,应用步骤r)的方法得到该字体的单笔划美观度得分、内部结构美观度得分和字体风格一致性得分,并以这些得分作为训练后的人工神经网络或决策树或模糊逻辑或支持向量机的输入,获取此时输出的“好”、“一般”、“差”的概率,该字体的总体美观度得分为(“好”的概率+“一般”的概率÷2)×100;
所述的将用户的手写字体参数化,将其转化成以若干标准字体的参数向量线性之和来表示,使用一个非线性规划的最优化方法,反复调整插值系数从而不断提高新字体的美观度评分,在保留用户字迹特征基础上,指导用户改善自己的手写字体美观度;也可以由用户指定仅仅为字体某一局部或整体结构作出指导步骤:
(11)对用户的手写字体,从预先获得的同一汉字的样本字体中,随机选出5~10个字体,将它们按如权利要求3所述的参数化方法转化成参数向量的形式;
(12)设预先获得的样本字体的对应参数向量为A1,A2,...,An,用户手写字体对应的参数向量为A’,将A’表示为A1,A2,...,An线性插值之和的形式,即A’=t1×A1+t2×A2+...+tn×An,其中t1,t2,...,tn为0~1之间的实数且t1+t2+...+tn=1,用线性方程组解法求出任一t1,t2,...,tn的近似可行解;
(13)为该字体的各单笔划美观度评分、内部结构美观度评分和字体风格一致性评分各自自动或由用户设定一个分数阈值;若自动设定,通常各单笔划美观度分数阈值均设为30,内部结构美观度和字体风格一致性分数阈值设为60;
(14)对如步骤所述的向量A’做如权利要求5所述的使用一个已有的汉字书写形态美观度的计算机评估方法,对字体进行评分;
(15)若步骤(14)中的各部分美观度评分结果均超过步骤(13)中所设的对应分数阈值,则终止,输出该字体,作为教学指导结果;
(16)调整各样本向量对应的线性插值系数,重新生成如步骤(12)所述的新向量A’;设共有n个样本向量A1,A2,...,An,其对应的线性插值系数为[t1,t2,...,tn]并满足t1+t2+...+tn=1,设函数f(t1,t2,...,tn)为此时字体的总体美观度评分,使用微分法求得该函数在此时的梯度方向L=[t1’,t2’,...,tn’],则将各线性插值系数调整为[t1+k×t1’,t2+k×t2’,...,tn+k×tn’],其中k为步长,通常设定为0.001~0.01;
(17)对新生成的向量A’重复步骤(14);
(18)若步骤(17)的重复次数已超过一个设定的迭代次数上限,则终止,无法对该字体在保留基本书写特征的基础上作出指导意见;否则转步骤(13);通常该迭代次数上限设为50~200。
本发明与现有技术相比具有的有益效果:
1)综合了多种人工智能与图像处理技术,使得计算机对汉字的美观度评价成为可能;
2)利用了一种机器学习的机制,使得计算机对汉字的美观度评价能力可以从人类的审美观学习而来;
3)在对汉字的笔划分解中,引入了用户的交互式输入,大大提高了形变严重的字体尤其是草书体的笔划分解效果;
1)利用了汉字美观度评估方法来改善自动生成的手写体汉字,提高了生成字体的质量,也丰富了生成字体的多样性;
2)在保留个人笔迹特征的前提下为汉字书写习作者提出教学建议,使汉字书写的自动教学成为可能。
附图说明
图1是本发明所述一种针对汉字书写的计算机辅助教学方法实施例系统的流程图;
图2是本发明所述汉字书写形态美观度评估实施例系统的流程图;
图3是本发明所述美观度评分算法的各部分评分算法的示意图;
图4(a)是汉字样本字体;
图4(b)是图4(a)中字体的细化结果;
图4(c)是图4(a)中字体的“几何图”;
图5是本发明所述笔划分解及汉字参数化的流程示例图;
图5(a)为汉字样本字体;
图5(b)为图5(a)的“几何图”;
图5(c)为图5(a)的对应标准字体,即正楷字体;
图5(d)为图5(a)在骨架上的笔划分解结果;
图5(e)为图5(a)的最终笔划分解结果;
图6是本发明所述利用用户交互界面协助笔划分解及汉字参数化的示例图;
图6(a)为汉字样本字体;
图6(b)为图6(a)的“几何图”;
图6(c)为图6(a)的标准字体,即正楷字体;
图6(d)为图6(a)的自动分解结果,彩色笔划表示在自动分解成功的笔划;
图6(e)为用户通过交互界面在字体上勾勒的剩余笔划草图;
图6(f)为根据用户草图得到的骨架上的笔划匹配结果;
图6(g)为综合图5(d)和图5(f)所示结果后的笔划骨架;
图6(h)为图5(a)的最终笔划分解结果;
图7为单笔划评分方法中所用到的笔划特征信号;
图8为汉字书写形态评分的一个示例,该字的五个单笔划如图9(a)-(e)所示;该字的空间结构分布美观度评分为:(82.5%好、17.1%一般、0.4%差),其风格一致性评分为:(26.8%好、51.1%一般、22.1%差),其总体美观度评分为:(35.2%好、49.7%一般、15.1%差);
图9(a)为图8所示汉字的第1笔划,其单笔划美观度评分为:(56.0%好、44.0%一般、0%差);
图9(b)为图8所示汉字的第2笔划;其单笔划美观度评分为:(84.7%好、15.3%一般、0%差);
图9(c)为图8所示汉字的第3笔划;其单笔划美观度评分为:(34.8%好、54.6%一般、10.6%差);
图9(d)为图8所示汉字的第4笔划;其单笔划美观度评分为:(12.7%好、46.9%一般、40.4%差);
图9(e)为图8所示汉字的第5笔划。其单笔划美观度评分为:(9.2%好、37.5%一般、63.3%差);
图10为本发明所述汉字书写计算机教学方法实施例系统的屏幕截图;
图11为本发明所述汉字书写计算机教学方法的单笔划书写教学示例效果图;图11(a)为用户书写笔划,图11(b)为系统对用户书写笔划提出的改善建议;
图12为本发明所述汉字书写计算机教学方法的整字书写教学示例效果图;图12(a)为用户书写字体,图12(b)为系统对用户书写字体提出的改善建议;图12(c)为用户书写的另一字体,而系统无法对此字体在保留基本笔迹的基础上提出改善建议;
图13为本发明所述汉字书写计算机教学方法的另一个整字书写教学示例效果图;图13(a)为用户书写字体,图13(b)为系统对用户书写字体提出的改善建议;图13(c)为用户书写的另一字体,而系统无法对此字体在保留基本笔迹的基础上提出改善建议。
具体实施方式
针对汉字书写的计算机辅助教学方法包括以下步骤:
1)预先对每个汉字的手写体样本的特征和美观度进行人工评分,获得汉字手写体样本库10;
2)通过计算机输入设备接受习作用户的手写字体输入,获得用户手写体图像11;
3)使用汉字美观度评估方法12,对用户手写体图像11进行评分;
4)将用户的手写字体参数化,将其转化成以若干标准字体的参数向量线性之和来表示,使用美观度改善方法13,反复调整插值系数从而不断提高新字体的美观度评分,在保留用户字迹特征基础上,指导用户改善自己的手写字体美观度;也可以由用户指定仅仅为字体某一局部或整体结构作出指导,最后输出教学指导结果14,(见图1)。
汉字美观度的计算机评估方法包括如下步骤:
1)通过多人调查的方式为500~2000个汉字单笔划的笔划样本评分,并使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体单笔划形态与其美观度评价结果间的映射关系,然后使用训练后的学习器对字体单笔划美观度进行评分;
2)通过多人调查的方式为500~2000个汉字样本的内部结构评分,并使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体内部结构特征与其美观度评价结果间的映射关系,然后使用训练后的学习器对字体内部结构进行评分,其中,字体内部结构包括字体各内部笔划或偏旁部首元素间的拓扑关系、相对位置关系、面积遮盖关系,以及笔划与笔划、笔划与偏旁部首之间的空间位置关系与该字的标准字体的差异,实现对字体内的各部分空间结构分布的美观度评分;
3)通过多人调查的方式为100~300个汉字样本的风格一致性评分,并使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体风格一致性特征与其美观度评价结果间的映射关系,使用训练后的学习器对字体风格一致性进行评分;对字体各个内部笔划或偏旁部首元素计算出与该字多种已知风格字体的相似度,并以此确定该字体的风格一致性评分;
4)根据对汉字进行的单笔划美观度评分、内部结构美观度评分、风格一致性评分,应用统计学习方法综合各项得分,获得该字体的总体美观度评分,(见图2)。
所述的一种汉字美观度的计算机评估方法,其特征在于所述的通过多人调查的方式为500~2000个汉字单笔划的笔划样本评分,并使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体单笔划形态与其美观度评价结果间的映射关系,然后使用训练后的学习器对字体单笔划美观度进行评分方法包括如下步骤:
a)事先通过多人调查方式,让六人各自对来自100个汉字的单笔划图像做评分,评分结果为“好”、“一般”、“差”三种其中之一;综合所有人的评分结果,计算该笔划的分数概率,即:分别统计将笔划评分为“好”、“一般”、“差”的人数,将其除以总人数,所得三个百分数分别为该笔划美观度为“好”、“一般”、“差”的概率,获得500~2000个单笔划的美观度的人工评价结果;
b)将步骤a)中所述各笔划的楷书体图像作为该笔划的标准笔划;将这些单笔划图像参数化,即提取出它们的轮廓、轨迹、位置信号,转换成向量的形式,对这些向量进行预处理,去除噪音,并进一步抽取特征向量,对获得的特征向量,与该笔划的标准笔划的特征向量作向量减法,从而得到单笔划的形态差异向量;
c)使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得单笔划的形态差异向量中的信号差异与美观度评价结果间的函数映射关系;即以形态差异向量与美观度评价结果分别作为人工神经网络、决策树、模糊逻辑或支持向量机的输入和输出;应用步骤a)中的人工评价结果,对人工神经网络或决策树或模糊逻辑或支持向量机施行带有反馈的机器学习过程;
d)使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机对单笔划进行评分:即对任意给定的单笔划图像,应用步骤b)得到该笔划与其标准笔划间的形态差异向量,以该向量作为训练后的人工神经网络或决策树或模糊逻辑或支持向量机的输入,获取此时的输出,即为该汉字笔划的美观度得分。
所述的一种汉字美观度的计算机评估方法,其特征在于所述的通过多人调查的方式为500~2000个汉字样本的内部结构评分,并使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体内部结构特征与其美观度评价结果间的映射关系,然后使用训练后的学习器对字体内部结构进行评分,其中,字体内部结构包括字体各内部笔划或偏旁部首元素间的拓扑关系、相对位置关系、面积遮盖关系,以及笔划与笔划、笔划与偏旁部首之间的空间位置关系与该字的标准字体的差异,实现对字体内的各部分空间结构分布的美观度评分方法,包括以下步骤:
e)事先通过多人调查方式,让六人分别对汉字图像做评分,评分结果为“好”、“一般”、“差”三种其中之一;综合所有人的评分结果,计算该字体的分数概率,即:分别统计将字体评分为“好”、“一般”、“差”的人数,分别将其除以总人数,所得百分数分别为该字体分数为“好”、“一般”、“差”的概率;通过这样的方式获得500~2000个字体空间结构美观度的人工评价结果;
f)通过笔划分解结果将该字体参数化,转换成向量的形式;这些向量层次化的表达了字体的轮廓、轨迹与相对位置信息;
g)将步骤e)中所述各字体的楷书体图像作为该字体的标准字体;提取出这些字体所对应向量中,各笔划或偏旁部首间的拓扑、几何关系的信号,与其标准字体的拓扑、几何关系的信号做比较,获得其信号差异,即做向量减法;h)使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得向量信号差异与美观度评价结果间的映射关系;应用步骤e)中人工标定的评价结果,对人工神经网络、决策树、模糊逻辑或支持向量机施行带有反馈的迭代学习过程。
i)使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机对字体空间结构美观度进行评分。即对任意给定的字体图像,应用步骤f)-步骤g)得到该字体内部结构与该字的标准字体间的信号差异,以该差异向量作为训练后的人工神经网络或决策树或模糊逻辑或支持向量机的输入,获取此时的输出,即为该字体的内部结构美观度得分。
所述的一种汉字美观度的计算机评估方法,其特征在于所述的通过多人调查的方式为100~300个汉字样本的风格一致性评分,并使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体风格一致性特征与其美观度评价结果间的映射关系,使用训练后的学习器对字体风格一致性进行评分;对字体各个内部笔划或偏旁部首元素计算出与该字多种已知风格字体的相似度,并以此确定该字体的风格一致性评分的方法包括如下步骤:
j)事先通过多人调查方式,让多个人分别对多个汉字图像的风格一致性做评分,评分结果为“好”、“一般”、“差”三种其中之一;综合所有人的评分结果,计算该字体的分数概率,即:分别统计将该字评分为“好”、“一般”、“差”的人数,分别将其除以总人数,所得百分数分别为该该字分数为“好”、“一般”、“差”的概率;通过这样的方式获得100~300个汉字字体风格一致性的人工评价结果;
k)准备好这些汉字对应的楷书体、行书体及隶书体中的书写形态样本,或更多其他字体,作为已知字体;
l)通过笔划分解结果将以上字体参数化,转换成向量的形式;这些向量层次化的表达了字体的轮廓、轨迹与相对位置信息;
m)对各字体的每个部分,计算出该部分与其各种已知字体该部分的相似程度;单笔划Ai与已知字体Bj的相似度Sij的计算方法可以任选以下两种之一:
(1)以已知字体Bj作为单笔划Ai的标准笔划,使用单笔划美观度评分方法计算出该笔划美观度的三个概率值P1,P2,P3,分别表示该笔划美观度为“好”、“一般”、“差”的概率;在本实施例中,Sij=P1×50%+P2×50%;
(2)求出笔划Ai的范围矩形,即能包含该笔划所有部分的矩形中的最小矩形,并通过不断平移和绕范围矩形中心旋转Ai,使Ai的字迹与其字体Bj相应笔划的字迹的重合面积最大;设Ai的字迹面积为C1,其字体Bj相应笔划的字迹的面积为C2,则Sij=|C1∩C2|/|C1∪C2|,及相似程度为C1、C2交集面积与C1、C2并集面积的比值;
n)将字体每个部分与每种已知字体的相似程度聚合可得到一个矩阵,作为该字体的风格一致性特征;
o)使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得该矩阵与美观度评价结果间的映射关系;应用人工标定的评价结果,对人工神经网络、决策树、模糊逻辑或支持向量机施行带有反馈的迭代学习过程;
p)使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机对字体风格一致性进行评分。即对任意给定的字体图像,应用步骤k)-步骤n)得到该字体与各已知字体间的相似度,以该矩阵作为训练后的人工神经网络或决策树或模糊逻辑或支持向量机的输入,获取此时的输出,即为该字体的风格一致性得分。
所述的一种汉字美观度的计算机评估方法,其特征在于所述的根据对汉字进行的单笔划美观度评分、内部结构美观度评分、风格一致性评分,应用统计学习方法综合各项得分,获得该字体的总体美观度评分的方法包括如下步骤:
q)利用上述三个方法,使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机自动获得100~300个汉字的各单笔划美观度得分、内部结构美观度得分和字体风格一致性得分;
r)通过多人调查方式,让多个人分别对步骤q)中所述汉字图像做美观度总体评分,评分结果为“好”、“一般”、“差”三种其中之一;综合所有人的评分结果,计算该字体的分数概率,即:分别统计将字体评分为“好”、“一般”、“差”的人数,分别将其除以总人数,所得百分数分别为该字体分数为“好”、“一般”、“差”的概率;
s)使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得步骤q)中的得分与步骤r)中的美观度总体评分间的映射关系;应用人工标定的评价结果,对人工神经网络、决策树、模糊逻辑或支持向量机施行带有反馈的迭代学习过程;
t)使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机对字体的总体美观度进行评分,即对任意给定的汉字字体图像,应用步骤q)的方法得到该字体的单笔划美观度得分、内部结构美观度得分和字体风格一致性得分,并以这些得分作为训练后的人工神经网络或决策树或模糊逻辑或支持向量机的输入,获取此时的输出,即为该字体的总体美观度得分。
基于非线性规划的最优化方法来反复调整插值系数从而不断提高新字体的美观度评分的方法,包括以下步骤:
(1)为该字体的各单笔划美观度评分、内部结构美观度评分和字体风格一致性评分自动或人工的各自设定一个分数阈值;若自动设定,通常各单笔划美观度分数阈值均设为30,内部结构美观度和字体风格一致性分数阈值设为60;
(2)对如权利要求3所述的新向量A’做如权利要求4所述的使用一个已有的汉字书写形态美观度的计算机评估方法,对生成的每个新字体进行评分;
(3)若步骤(2)中的各部分美观度评分结果均超过步骤(1)中所设的对应分数阈值,则终止,输出该字体,作为生成结果;
(4)调整各样本向量对应的线性插值系数,重新生成如权利要求3所述的新向量A’;
(5)对新生成的向量A’重复步骤(2);
(6)若步骤(5)的重复次数已超过一个设定的迭代次数上限,则终止,该字体无法在保留基本书写特征的基础上进行美化;否则转步骤(3);通常该迭代次数上限设为50~200;
所述的调整各样本向量对应的线性插值系数,重新生成如权利要求3所述的新向量A’,其特征在于:设共有n个样本向量A1,A2,...,An,其对应的线性插值系数为[t1,t2,...,tn]并满足t1+t2+...+tn=1,设函数f(t1,t2,...,tn)为此时字体的总体美观度评分,使用微分法求得该函数在此时的梯度方向L=[t1’,t2’,...,tn’],则将各线性插值系数调整为[t1+k×t1’,t2+k×t2’,...,tn+k×tn’],其中k为步长,通常设定为0.001~0.01。
如图2所示,本发明所述的汉字美观度评分方法实施例系统的流程包括汉字图像101、笔划分解及汉字参数化102、汉字美观度评分方法103、汉字美观度评分结果104;其中汉字美观度评分方法103的组成包括汉字图像样例201、人类评分202、机器学习过程203;
本发明所述的实施例系统中的汉字美观度评分方法103包括学习和评分两部分:学习部分,即使用一个机器学习过程203,对汉字图像样例201与人类评分202之间的潜在关系进行探测,并得到训练后的学习器;评分部分,即使用经过机器学习过程203训练得到的学习器,对汉字图像101计算其美观度得分,得到汉字美观度评分结果104。
汉字图像101:汉字图像是指包含汉字字体的数字图像;在本实施例中,所有的字体图像都被分离成了一个个的单字,然后将它们归一化成同一尺寸的二值黑白图像(长宽均为300像素点);其示例如图4A所示。笔划分解及汉字参数化102:在本实施例中,该部分包括以下步骤:
(A)从字体图像中提取其结构特征,其步骤详述如下(参见图4A、图4B、图4C):
1)对汉字图像101做细化(Thinning)处理,以获得该字的骨架图像;本实施例应用了ACM学报在1994年所公布的一个图像细化算法(“A noniterativethinning algorithm”ACM Transactions on Mathematical Software,20(1):5-20,1994);其示例如图4B所示;
2)从骨架图像中提取“特征点”(“特征点”的定义参考IEEE学报1999年公布的一篇文章“Identification of fork points on the skeletons of handwritten Chinesecharacters”IEEE Transactions on Pattern Analysis and Machine Intelligence(PAMI)21(10):1095-1100,1999,以下简称文献PAMI99),这些特征点将把整个骨架分割成若干条曲线段;
3)对每条曲线段都用多条首尾相连的直线段来近似,具体步骤如下:对每一条未被直线段取代的曲线段AB,设A、B分别是其两端端点;计算以曲线段AB上的某一点C为顶点的夹角ACB,当角ACB最大时的角度值小于一个预定值(如135度),则将曲线段AB分割成AC,CB两段;否则以直线段连接AB两点,取代原有的曲线段AB;该步骤不断进行直至所有曲线段均被直线段所取代;
4)由一系列直线段及其端点构成的图被称为该字体的“几何图”(geometricgraph);对“几何图”做修正和剪枝;本实施例应用了文献PAMI99中使用的骨架图修正技术;最终得到的“几何图”示例如图4C所示;
(B)在步骤(A)中所述汉字字体与其标准字体间计算出一个最佳的笔划匹配,从而完成笔划分解,其步骤详述如下(参见图5):
1)对步骤(A)所述字体的标准字体重复步骤(A),得到该标准字体的“几何图”;并假设标准字体的笔划分解结果已经预知;
2)在步骤(A)中所述字体的“几何图”与其标准字体的“几何图”间,计算出一个最佳的笔划匹配结果;本实施例应用了《模式识别》杂志于2001年公布的一篇文章(“Model-based stroke extraction and matching for handwritten Chinesecharacter recognition”.Pattern Recognition,34(12):2339-2352,2001)中所述启发式搜索的方法来计算出“几何图”上的笔划间一一对应关系;
3)将“几何图”上以多条直线段表示的各笔划轨迹,转化为在原字体轮廓上的笔划分解结果,其具体方法为:对各笔划上的各直线段上的每一点,以其为圆心画椭圆,使该椭圆尽量大而又不包含任何原字体图像上的空白部分(即在原字体的黑白图像上,该椭圆区域内的所有像素点均为黑色),该笔划的所有椭圆区域总和即为笔划分解所得的图像轮廓;
(C)对与标准字体形态相差较大的字体,对步骤(B)中无法完成匹配的部分笔划,使用一个交互式的用户界面来协助笔划分解,其步骤详述如下(参见图6):
1)用户通过交互式的用户界面来为字体描绘其骨架草图;
2)根据用户草图来修改由标准字体而得的“几何图”;本实施例将步骤(2)中未完成匹配的部分笔划在标准字体“几何图”中均由用户草图的对应部分所替代;
3)重复步骤(B),重新计算笔划间的最佳匹配方案,从而完成笔划分解;
(D)对完成笔划分解的字体,将其参数化,以向量的形式表达;本实施例采用了文献IS2005中的汉字参数化方法,每个字体都等价的用一个矩阵在向量空间中表示。
汉字美观度评分方法103:如前所述,包括汉字图像样例201、人类评分202、机器学习过程203;最终用训练得到的学习器来对笔划分解及汉字参数化102得到的结果做评分,而得到汉字美观度评分结果104。
汉字图像样例201:同汉字图像101,但使用于人类评分后供机器学习过程203来学习;
人类评分202:通过调查的方式让一定数量的人分别对字体图像做评分(单笔划美观度或字体内部结构美观度或字体风格一致性),评分结果为“好”、“一般”、“差”三种其中之一;综合所有人的评分结果,计算该字体的分数概率,即:分别统计将字体评分为“好”、“一般”、“差”的人数,分别将其除以总人数,所得百分数分别为该字体分数为“好”、“一般”、“差”的概率;
机器学习过程203:使用一个学习器(如人工神经网络),其输入为该字体的特征参数,其输出为3个百分数,分别表示该字体分数为“好”、“一般”、“差”的概率;利用汉字图像样例201及其对应的人类评分,对学习器做训练;使用训练后的学习器对字体美观度做出评分。
如图3所示,汉字美观度评分分为四种:单笔划美观度评分301、内部结构美观度评分302、内部风格一致性评分303、总体美观度评分304。
(E)单笔划美观度评分301,包括以下步骤:
1)事先准备一定数量的汉字图像样例201(均为单笔划图像),并对其做人类评分202,获得一定数量的单笔划的美观度人类评分结果;
2)对每个单笔划,使用笔划分解及汉字参数化102中的细化算法得到其骨架,并使用文献IS2005中的参数化方法得到其参数化表示;取骨架上的一条最大路径;所谓最大路径是指一条包含于骨架的离散曲线,并且以该曲线上的点为圆心的覆盖椭圆的面积之和在所有包含于骨架的离散曲线中为最大(覆盖椭圆Covering Ellipse的定义参见文献IS2005);
3)对最大路径上的每个点,做其法向直线,使直线两端刚好位于该笔划字迹边沿并过该点,此即该点处的笔划宽度;
4)将该笔划的最大路径分成三段;分段方法包含以下步骤:【1】枚举分成三段所需的两个分割点的位置;【2】对每种分段方法,计算每段上所有点的笔划宽度的平均值,记其为w1、w2、w3;【3】若max{|w1-w2|,|w2-w3|}超过一个阈值,则转步骤10),否则转步骤5);在本实施例中,该阈值取值为最大路径两端端点间直线距离的1/4;
5)如图7所示,对最大路径上的每个点,提取出它的坐标S=(Sx,Sy),它所对应覆盖椭圆的长轴半径与短轴半径分别组成的两条一维曲线Ma、Mi,以及骨架该点到字体外轮廓边缘的最近距离组成的一维曲线D;所有点的这些特征组成了5条一维曲线;
6)记ω=(Sx,Sy,Ma,Mi,D),求出该笔划的标准字的对应信号ω0=(Sx0,Sy0,Ma0,Mi0,D0),并获得ω与ω0之间的差异,设ω*=ω-ω0;
7)对ω*中每条曲线计算其一阶导数,得到另一曲线集合ω’=(Sx’,Sy’,Ma’,Mi’,D’);
8)对ω*中的每一条一维曲线C,求出曲线C上的最大值Cmax,平均值Cave,中位值Cmed;对ω’中的每一条一维曲线C’,求出曲线C’上的最大值Cmax’,平均值Cave’,中位值Cmed’;
9)将Cmax’/Cmax、Cave’/Cmax、Cmed’/Cmax、Cmax’/Cave、Cave’/Cave、Cmed’/Cave、Cmax’/Cmed、Cave’/Cmed、Cmed’/Cmed作为学习器输入,三个取值在0到100间的实数作为学习器的输出(分别对应该笔划美观度为“好”、“一般”、“差”的概率),使用该学习器对步骤1)中所用的汉字图像样例201并结合其人工评分结果202作为学习样本,对F与单笔划评分结果间的关系进行学习;本实施例使用了反向传播神经网络(Back-Propagating Neural Network)作为学习器;转步骤11);
10)对该笔划三段中的每一段,视为一个单独笔划并对其执行步骤5)-8);将这三段中每一段的Cmax’/Cmax、Cave’/Cmax、Cmed’/Cmax、Cmax’/Cave、Cave’/Cave、Cmed’/Cave、Cmax’/Cmed、Cave’/Cmed、Cmed’/Cmed作为学习器输入,三个取值在0到100间的实数作为学习器的输出(分别对应该笔划美观度为“好”、“一般”、“差”的概率),使用该学习器对步骤1)中所用的汉字图像样例201并结合其人工评分结果202作为学习样本,对F与单笔划评分结果间的关系进行学习;本实施例使用了反向传播神经网络(Back-Propagating NeuralNetwork)作为学习器;
11)使用学习后的学习器,对汉字单笔划进行评分;
(F)内部结构美观度评分302,包括以下步骤:
1)事先准备一定数量的汉字图像样例201,并对其内部结构美观度做人类评分202,获得一定数量的内部结构美观度的人类评分结果;
2)提取出这些字体所对应向量中,各部分(如笔划、部首)间拓扑、几何等关系的信号;本实施例使用的信号包括:对每一对笔划x和y,我们计算出x和y所有点在平面上的相互最大距离Lmax、最小距离Lmin和平均距离Lave;这些值可以描述出这些笔划间的空间关系与拓扑关系。另外,我们在每个笔划上画出它的范围矩形(bounding box,即能包含该笔划所有部分的矩形中的最小矩形);然后对每两个范围矩形计算它们在水平方向、竖直方向以及面积上的重叠部分,分别记为Bh(x,y)、Bv(x,y)、Bp(x,y);
3)假设该字体的笔划共有n个,通过步骤2)可以得到6个n×n矩阵,记为Mmax、Mmin、Mave、Mh、Mv、Mp,其中每个矩阵的第i行第j列元素代表了该字体第i笔划与第j笔划间的相应关系;
4)将步骤3)所述6个矩阵与该字的标准字体所对应的6个矩阵相减,记其运算结果为Qmax、Qmin、Qave、Qh、Qv、Qp;连同其逆矩阵一起共12个矩阵,记为Qi(i=1,...,12);
5)对每个Qi,求得其矩阵元素中的最大值最小值
Figure A200810121202D0025094136QIETU
最大绝对值
Figure A200810121202D0025094141QIETU
平均值
Figure A200810121202D0025094146QIETU
中位值
Figure A200810121202D0025094150QIETU
连同该Qi的前三个矩阵特征值λ1、λ2、λ3一起,作为学习器的输入;
6)三个取值在0到100间的实数作为学习器的输出(分别对应该结构美观度为“好”、“一般”、“差”的概率),使用该学习器对步骤1)中所用的汉字图像样例201并结合其人工评分结果202作为学习样本,对内部结构特征与其美观度评分结果间的关系进行学习;本实施例使用了反向传播神经网络(Back-PropagatingNeural Network)作为学习器;
7)使用学习后的学习器,对内部结构美观度进行评分;
(G)内部风格一致性评分303,包括以下步骤:
1)事先准备一定数量的汉字图像样例201,并对其内部风格一致性做人类评分202,获得一定数量的内部风格一致性的人类评分结果;
2)准备好字体样例所对应的若干种已知字体,如楷书体、行书体、隶书体等,每个字体样例均有m种已知字体,记为{Bj|j=1,2,...,m};对该字体图像内的每个子部分Ai(如对每个单笔划,i=1,2,...,n),计算出它与每种已知字体中对应子部分的相似程度Sij(i=1,2,...,n;j=1,2,...,m),计算结果以一个百分数表示;每个字体图像可得到一个n×m的矩阵F={Sij};
3)将矩阵F作为学习器的输入,三个取值在0到100间的实数作为学习器的输出(分别对应该字体风格一致性为“好”、“一般”、“差”的概率),使用该学习器对步骤1)中所用的汉字图像样例201并结合其人工评分结果202作为学习样本,对F与字体内部风格一致性评分结果间的关系进行学习;本实施例使用了反向传播神经网络(Back-Propagating Neural Network)作为学习器;
4)使用学习后的学习器,对内部风格一致性进行评分;
(H)总体美观度评分304,包含以下步骤:
1)利用上述三个方法301、302、303,使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机自动获得100~300个字体的各单笔划美观度得分、内部结构美观度得分和书写风格一致性得分;
2)通过多人调查方式,让一定数量的人分别对以上字体图像做美观度总体评分,评分结果为“好”、“一般”、“差”三种其中之一;综合所有人的评分结果,计算该字体的分数概率,即:分别统计将字体评分为“好”、“一般”、“差”的人数,分别将其除以总人数,所得百分数分别为该字体分数为“好”、“一般”、“差”的概率;
3)使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得步骤1)中的得分与步骤2)中的美观度总体评分间的映射关系;应用人工标定的评价结果,对人工神经网络、决策树、模糊逻辑或支持向量机施行带有反馈的迭代学习过程;
4)使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机对字体的总体美观度进行评分。即对任意给定的汉字图像,应用步骤(1)的方法得到该字体的单笔划美观度得分、内部结构美观度得分和书写风格一致性得分,并以这些得分作为训练后的人工神经网络或决策树或模糊逻辑或支持向量机的输入,获取此时的输出,即为该字体的总体美观度得分。汉字美观度评分结果104:同人类评分202的结果,以三个百分数来分别表示该字体美观度为“好”、“一般”、“差”的概率。

Claims (10)

1.一种针对汉字书写的计算机辅助教学方法,其特征在于包括以下步骤:
1)预先对每个汉字的手写体样本的特征和美观度进行人工评分;
2)通过计算机输入设备接受习作用户的手写字体输入,并使用图像处理的方法将用户手写字体参数化;
3)使用汉字书写形态美观度的计算机自动评估方法,对用户的手写字体进行评分;
4)将用户的手写字体参数化,将其转化成以若干标准字体的参数向量线性之和来表示,使用一个非线性规划的最优化方法,反复调整插值系数从而不断提高新字体的美观度评分,在保留用户字迹特征基础上,指导用户改善自己的手写字体美观度;也可以由用户指定仅仅为字体某一局部或整体结构作出指导。
2.如权利要求1所述的一种针对汉字书写的计算机辅助教学方法,其特征在于所述的预先对每个汉字的手写体样本的特征和美观度进行人工评分步骤:
(1)通过多人调查方式,让多个人各自对来自100个汉字的单笔划图像做评分,评分结果为“好”、“一般”、“差”三种其中之一;综合所有人的评分结果,计算该笔划的分数概率,即:分别统计将笔划评分为“好”、“一般”、“差”的人数,除以总人数,所得三个百分数分别为该笔划美观度为“好”、“一般”、“差”的概率,获得500~2000个单笔划的美观度的人工评价结果;
(2)通过多人调查方式,让多个人分别对汉字的内部结构美观度做评分,评分结果为“好”、“一般”、“差”三种其中之一;综合所有人的评分结果,计算该字体的分数概率,即:分别统计将字体评分为“好”、“一般”、“差”的人数,分别将其除以总人数,所得百分数分别为该字体分数为“好”、“一般”、“差”的概率;通过这样的方式获得500~2000个字体空间结构美观度的人工评价结果;
(3)通过多人调查方式,让多个人分别对多个汉字图像的风格一致性做评分,评分结果为“好”、“一般”、“差”三种其中之一;综合所有人的评分结果,计算该字体的分数概率,即:分别统计将该字评分为“好”、“一般”、“差”的人数,分别将其除以总人数,所得百分数分别为该该字分数为“好”、“一般”、“差”的概率;通过这样的方式获得100~300个汉字字体风格一致性的人工评价结果。
3.如权利要求1所述的一种针对汉字书写的计算机辅助教学方法,其特征在于所述的通过计算机输入设备接受习作用户的手写字体输入,并使用图像处理的方法将用户手写字体参数化步骤:
(4)利用计算机输入设备,如鼠标、手写笔,接受用户的手写字体,以数字图像的方式存储;
(5)若用户手写了多个汉字,将用户的手写字体分割成若干个单字体,并将每个单字体图像转化为相同尺寸的点阵二值黑白图像;
(6)对每个汉字图像做细化,笔划分解,提取出其轨迹与书写宽度特征,以参数向量的形式表示每个汉字图像。
4.如权利要求3所述的一种针对汉字书写的计算机辅助教学方法,其特征在于所述的对每个汉字图像做细化,笔划分解,提取出其轨迹与书写宽度特征,以参数向量的形式表示每个汉字图像步骤:
a)对汉字图像做细化处理,以获得该字的骨架图像;
b)将该字与其标准楷书字体做笔划匹配,用启发式搜索的方法找出骨架各部分与标准笔划的一一对应关系,完成骨架上的笔划分解;
c)对每笔划上的各骨架点,以其为圆心画椭圆,使该椭圆尽量大而又不包含任何原字体图像上的空白部分,该笔划的所有椭圆区域总和即为笔划分解所得的图像轮廓;
d)将所有椭圆的长短轴、圆心坐标列为一个矩阵,即为该字体的参数向量。
5.如权利要求1所述的一种针对汉字书写的计算机辅助教学方法,其特征在于所述的使用一种汉字书写形态美观度的计算机自动评估方法,对用户的手写字体进行评分步骤:
(7)以预先获得的单笔划美观度人工评分结果为训练集,使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体单笔划形态与其美观度评价结果间的映射关系,然后使用训练后的学习器对字体单笔划美观度进行评分;
(8)以预先获得的字体内部结构美观度人工评分结果为训练集,使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体内部结构特征与其美观度评价结果间的映射关系,然后使用训练后的学习器对字体内部结构进行评分,其中,字体内部结构包括字体各内部笔划或偏旁部首元素间的拓扑关系、相对位置关系、面积遮盖关系,以及笔划与笔划、笔划与偏旁部首之间的空间位置关系与该字的标准字体的差异,实现对字体内的各部分空间结构分布的美观度评分;
(9)以预先获得的字体风格一致性人工评分结果为训练集,使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体风格一致性特征与其美观度评价结果间的映射关系,使用训练后的学习器对字体风格一致性进行评分;对字体各个内部笔划或偏旁部首元素计算出与该字多种已知风格字体的相似度,并以此确定该字体的风格一致性评分;
(10)根据对汉字进行的单笔划美观度评分、内部结构美观度评分、风格一致性评分,应用统计学习方法综合各项得分,获得该字体的总体美观度评分。
6.如权利要求5所述的一种汉字书写形态美观度的计算机自动评估方法,其特征在于所述的以预先获得的单笔划美观度人工评分结果为训练集,使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体单笔划形态与其美观度评价结果间的映射关系,然后使用训练后的学习器对字体单笔划美观度进行评分步骤:
e)以预先获得单笔划美观度人工评分的各笔划的楷书体图像作为该笔划的标准笔划;将这些单笔划图像参数化,即提取出它们的轮廓、轨迹、位置信号,转换成向量的形式,对这些向量进行预处理,去除噪音,并进一步抽取特征向量,对获得的特征向量,与该笔划的标准笔划的特征向量作向量减法,从而得到单笔划的形态差异向量;
f)使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得单笔划的形态差异向量中的信号差异与美观度评价结果间的函数映射关系;即以形态差异向量与美观度评价结果分别作为人工神经网络、决策树、模糊逻辑或支持向量机的输入和输出;应用预先获得的人工评价结果,对人工神经网络或决策树或模糊逻辑或支持向量机施行带有反馈的机器学习过程;
g)使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机对单笔划进行评分:即对任意给定的单笔划图像,应用步骤e)得到该笔划与其标准笔划间的形态差异向量,以该向量作为训练后的人工神经网络或决策树或模糊逻辑或支持向量机的输入,获取此时输出的“好”、“一般”、“差”的概率,该汉字笔划的美观度得分为(“好”的概率+“一般”的概率÷2)×100。
7.如权利要求5所述的一种汉字书写形态美观度的计算机自动评估方法,其特征在于所述的以预先获得的字体内部结构美观度人工评分结果为训练集,使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体内部结构特征与其美观度评价结果间的映射关系,然后使用训练后的学习器对字体内部结构进行评分,其中,字体内部结构包括字体各内部笔划或偏旁部首元素间的拓扑关系、相对位置关系、面积遮盖关系,以及笔划与笔划、笔划与偏旁部首之间的空间位置关系与该字的标准字体的差异,实现对字体内的各部分空间结构分布的美观度评分步骤:
h)通过笔划分解结果将该字体参数化,转换成向量的形式;这些向量层次化的表达了字体的轮廓、轨迹与相对位置信息;
i)将预先获得内部风格美观度人工评分的各字体的楷书体图像作为该字体的标准字体;提取出这些字体所对应向量中,各笔划或偏旁部首间的拓扑、几何关系的信号,与其标准字体的拓扑、几何关系的信号做比较,获得其信号差异,即做向量减法;
j)使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得向量信号差异与美观度评价结果间的映射关系;应用预先获得的人工标定的评价结果,对人工神经网络、决策树、模糊逻辑或支持向量机施行带有反馈的迭代学习过程;
k)使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机对字体空间结构美观度进行评分。即对任意给定的字体图像,应用步骤j)-步骤k)得到该字体内部结构与该字的标准字体间的信号差异,以该差异向量作为训练后的人工神经网络或决策树或模糊逻辑或支持向量机的输入,获取此时输出的“好”、“一般”、“差”的概率,该汉字的内部结构美观度得分为(“好”的概率+“一般”的概率÷2)×100。
8.如权利要求5所述的一种汉字书写形态美观度的计算机自动评估方法,其特征在于所述的以预先获得的字体风格一致性人工评分结果为训练集,使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得字体风格一致性特征与其美观度评价结果间的映射关系,使用训练后的学习器对字体风格一致性进行评分;对字体各个内部笔划或偏旁部首元素计算出与该字多种已知风格字体的相似度,并以此确定该字体的风格一致性评分步骤:
1)对预先获得字体风格一致性人工评分的字体,将其对应的楷书体、行书体及隶书体中的书写形态样本,或更多其他字体,作为已知字体;
m)通过笔划分解结果将以上字体参数化,转换成向量的形式;这些向量层次化的表达了字体的轮廓、轨迹与相对位置信息;
n)对各字体的每个部分,计算出该部分与其各种已知字体该部分的相似程度;单笔划Ai与已知字体Bj的相似度Sij的计算方法可以任选以下两种之一:
(a)以已知字体Bj作为单笔划Ai的标准笔划,使用单笔划美观度评分方法计算出该笔划美观度的三个概率值P1,P2,P3,分别表示该笔划美观度为“好”、“一般”、“差”的概率;在本实施例中,Sij=P1×50%+P2×50%;
(b)求出笔划Ai的范围矩形,即能包含该笔划所有部分的矩形中的最小矩形,并通过不断平移和绕范围矩形中心旋转Ai,使Ai的字迹与其字体Bj相应笔划的字迹的重合面积最大;设Ai的字迹面积为C1,其字体Bj相应笔划的字迹的面积为C2,则Sij=|C1∩C2|/|C1∪C2|,及相似程度为C1、C2交集面积与C1、C2并集面积的比值;
o)将字体每个部分与每种已知字体的相似程度聚合可得到一个矩阵,作为该字体的风格一致性特征;
p)使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得该矩阵与美观度评价结果间的映射关系;应用人工标定的评价结果,对人工神经网络、决策树、模糊逻辑或支持向量机施行带有反馈的迭代学习过程;
q)使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机对字体风格一致性进行评分。即对任意给定的字体图像,应用步骤h)-步骤k)得到该字体与各已知字体间的相似度,以该矩阵作为训练后的人工神经网络或决策树或模糊逻辑或支持向量机的输入,获取此时输出的“好”、“一般”、“差”的概率,该字体的风格一致性得分为(“好”的概率+“一般”的概率÷2)×100。
9.如权利要求5所述的一种汉字书写形态美观度的计算机自动评估方法,其特征在于所述的根据对汉字进行的单笔划美观度评分、内部结构美观度评分、风格一致性评分,应用统计学习方法综合各项得分,获得该字体的总体美观度评分步骤:
r)利用如权利要求6、7、8所述的三个方法,使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机自动获得100~300个汉字的各单笔划美观度得分、内部结构美观度得分和字体风格一致性得分;
s)通过多人调查方式,让多个人分别对步骤r)中所述汉字图像做美观度总体评分,评分结果为“好”、“一般”、“差”三种其中之一;综合所有人的评分结果,计算该字体的分数概率,即:分别统计将字体评分为“好”、“一般”、“差”的人数,分别将其除以总人数,所得百分数分别为该字体分数为“好”、“一般”、“差”的概率;
t)使用人工神经网络、决策树、模糊逻辑或支持向量机来训练并获得步骤r)中的得分与步骤s)中的美观度总体评分间的映射关系;应用人工标定的评价结果,对人工神经网络、决策树、模糊逻辑或支持向量机施行带有反馈的迭代学习过程;
u)使用训练后的人工神经网络、决策树、模糊逻辑或支持向量机对字体的总体美观度进行评分,即对任意给定的汉字字体图像,应用步骤r)的方法得到该字体的单笔划美观度得分、内部结构美观度得分和字体风格一致性得分,并以这些得分作为训练后的人工神经网络或决策树或模糊逻辑或支持向量机的输入,获取此时输出的“好”、“一般”、“差”的概率,该字体的总体美观度得分为(“好”的概率+“一般”的概率÷2)×100。
10.如权利要求1所述的一种针对汉字书写的计算机辅助教学方法,其特征在于所述的将用户的手写字体参数化,将其转化成以若干标准字体的参数向量线性之和来表示,使用一个非线性规划的最优化方法,反复调整插值系数从而不断提高新字体的美观度评分,在保留用户字迹特征基础上,指导用户改善自己的手写字体美观度;也可以由用户指定仅仅为字体某一局部或整体结构作出指导步骤:
(11)对用户的手写字体,从预先获得的同一汉字的样本字体中,随机选出5~10个字体,将它们按如权利要求3所述的参数化方法转化成参数向量的形式;
(12)设预先获得的样本字体的对应参数向量为A1,A2,...,An,用户手写字体对应的参数向量为A’,将A’表示为A1,A2,...,An线性插值之和的形式,即A’=t1×A1+t2×A2+...+tn×An,其中t1,t2,...,tn为0~1之间的实数且t1+t2十...+tn=1,用线性方程组解法求出任一t1,t2,...,tn的近似可行解;
(13)为该字体的各单笔划美观度评分、内部结构美观度评分和字体风格一致性评分各自自动或由用户设定一个分数阈值;若自动设定,通常各单笔划美观度分数阈值均设为30,内部结构美观度和字体风格一致性分数阈值设为60;
(14)对如步骤所述的向量A’做如权利要求5所述的使用一个已有的汉字书写形态美观度的计算机评估方法,对字体进行评分;
(15)若步骤(14)中的各部分美观度评分结果均超过步骤(13)中所设的对应分数阈值,则终止,输出该字体,作为教学指导结果;
(16)调整各样本向量对应的线性插值系数,重新生成如步骤(12)所述的新向量A’;设共有n个样本向量A1,A2,...,An,其对应的线性插值系数为[t1,t2,...,tn]并满足t1+t2+...+tn=1,设函数f(t1,t2,...,tn)为此时字体的总体美观度评分,使用微分法求得该函数在此时的梯度方向L=[t1’,t2’,...,tn’],则将各线性插值系数调整为[t1+k×t1’,t2+k×t2’,...,tn+k×tn’],其中k为步长,通常设定为0.001~0.01;
(17)对新生成的向量A’重复步骤(14);
(18)若步骤(17)的重复次数已超过一个设定的迭代次数上限,则终止,无法对该字体在保留基本书写特征的基础上作出指导意见;否则转步骤(13);通常该迭代次数上限设为50~200。
CN2008101212026A 2008-09-12 2008-09-12 一种汉字书写计算机教学方法 Expired - Fee Related CN101393693B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008101212026A CN101393693B (zh) 2008-09-12 2008-09-12 一种汉字书写计算机教学方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008101212026A CN101393693B (zh) 2008-09-12 2008-09-12 一种汉字书写计算机教学方法

Publications (2)

Publication Number Publication Date
CN101393693A true CN101393693A (zh) 2009-03-25
CN101393693B CN101393693B (zh) 2010-07-28

Family

ID=40493973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008101212026A Expired - Fee Related CN101393693B (zh) 2008-09-12 2008-09-12 一种汉字书写计算机教学方法

Country Status (1)

Country Link
CN (1) CN101393693B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101976354A (zh) * 2010-11-10 2011-02-16 广东开心信息技术有限公司 一种书写汉字规范性评判的方法和装置
CN102479172A (zh) * 2010-11-22 2012-05-30 虞海灿 一种数字化汉字显示装置及其使用方法
CN106096524A (zh) * 2016-06-01 2016-11-09 广东小天才科技有限公司 一种汉字美观度的获取方法及装置
CN106504141A (zh) * 2015-09-08 2017-03-15 迈吉克股份有限公司 一种字迹评分系统与其评分方法
CN109472249A (zh) * 2018-11-22 2019-03-15 京东方科技集团股份有限公司 一种确定书写体优劣等级的方法及装置
CN110189579A (zh) * 2019-06-21 2019-08-30 洪克 一种国学练字教学系统及方法
CN110766138A (zh) * 2019-10-21 2020-02-07 中国科学院自动化研究所 基于脑发育机制的自适应神经网络模型的构建方法及系统
CN110796917A (zh) * 2018-08-02 2020-02-14 义守大学 一种电脑化写字评估与训练方法
CN111176471A (zh) * 2020-03-11 2020-05-19 鲁东大学 一种多媒体教学方法及装置
CN114550179A (zh) * 2022-01-11 2022-05-27 陕西师范大学 对手写汉字黑板板书进行指导的方法、系统及设备

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101976354A (zh) * 2010-11-10 2011-02-16 广东开心信息技术有限公司 一种书写汉字规范性评判的方法和装置
CN102479172A (zh) * 2010-11-22 2012-05-30 虞海灿 一种数字化汉字显示装置及其使用方法
CN102479172B (zh) * 2010-11-22 2014-01-15 虞海灿 一种数字化汉字显示装置及其使用方法
CN106504141A (zh) * 2015-09-08 2017-03-15 迈吉克股份有限公司 一种字迹评分系统与其评分方法
CN106096524A (zh) * 2016-06-01 2016-11-09 广东小天才科技有限公司 一种汉字美观度的获取方法及装置
CN110796917A (zh) * 2018-08-02 2020-02-14 义守大学 一种电脑化写字评估与训练方法
CN109472249A (zh) * 2018-11-22 2019-03-15 京东方科技集团股份有限公司 一种确定书写体优劣等级的方法及装置
US10902283B2 (en) 2018-11-22 2021-01-26 Boe Technology Group Co., Ltd. Method and device for determining handwriting similarity
CN110189579A (zh) * 2019-06-21 2019-08-30 洪克 一种国学练字教学系统及方法
CN110766138A (zh) * 2019-10-21 2020-02-07 中国科学院自动化研究所 基于脑发育机制的自适应神经网络模型的构建方法及系统
CN111176471A (zh) * 2020-03-11 2020-05-19 鲁东大学 一种多媒体教学方法及装置
CN114550179A (zh) * 2022-01-11 2022-05-27 陕西师范大学 对手写汉字黑板板书进行指导的方法、系统及设备
CN114550179B (zh) * 2022-01-11 2024-08-09 陕西师范大学 对手写汉字黑板板书进行指导的方法、系统及设备

Also Published As

Publication number Publication date
CN101393693B (zh) 2010-07-28

Similar Documents

Publication Publication Date Title
CN100583135C (zh) 一种汉字书写形态美观度的计算机评估方法
CN101393693B (zh) 一种汉字书写计算机教学方法
CN101393645A (zh) 一种手写体汉字的计算机生成与美化方法
CN101377854B (zh) 一种计算机模仿汉字手写笔迹的方法
CN101599180B (zh) 基于字迹风格模仿的计算机书法自动生成方法
Lian et al. EasyFont: a style learning-based system to easily build your large-scale handwriting fonts
CN109871851B (zh) 一种基于卷积神经网络算法的汉字书写规范性判定方法
CN102637078B (zh) 一种结构优化的汉字字形生成方法
CN108629338A (zh) 一种基于lbp和卷积神经网络的人脸美丽预测方法
CN105536205A (zh) 一种基于单目视频人体动作感知的上肢训练系统
CN112800936B (zh) 基于计算机视觉的书法临帖智能评价与指导方法
CN111626297A (zh) 文字书写质量评价方法、装置、电子设备和记录介质
CN106611172B (zh) 一种基于风格学习的汉字合成方法
CN102542264A (zh) 基于数字手写设备的汉字书写正误自动评测方法和装置
CN112069900A (zh) 基于卷积神经网络的票据文字识别方法及系统
Liang et al. A robot calligraphy writing method based on style transferring algorithm and similarity evaluation
Wang et al. Evaluation of Chinese calligraphy by using DBSC vectorization and ICP algorithm
CN113779289A (zh) 基于人工智能的绘画步骤还原系统
CN112784531A (zh) 一种基于深度学习和部件拼接的中文字形及字库生成方法
Erdem et al. A deep learning-based pipeline for teaching control theory: transforming feedback control systems on whiteboard into MATLAB
CN111985184A (zh) 基于ai视觉下的书写字体临摹辅助方法、系统、装置
CN116311281A (zh) 一种基于生成对抗网络的手写字体纠正系统
Zhou et al. A computational evaluation system of Chinese calligraphy via extended possibility-probability distribution method
Enikeev et al. Russian Fingerspelling Recognition Using Leap Motion Controller
Liang et al. [Retracted] Application of Art Activities in Colleges and Universities Based on BP Neural Network Algorithm

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100728

Termination date: 20130912