CN103246636A - 一种汉字字形视觉重心的确定方法 - Google Patents
一种汉字字形视觉重心的确定方法 Download PDFInfo
- Publication number
- CN103246636A CN103246636A CN2013101396069A CN201310139606A CN103246636A CN 103246636 A CN103246636 A CN 103246636A CN 2013101396069 A CN2013101396069 A CN 2013101396069A CN 201310139606 A CN201310139606 A CN 201310139606A CN 103246636 A CN103246636 A CN 103246636A
- Authority
- CN
- China
- Prior art keywords
- chinese character
- gravity
- center
- connected region
- barycenter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
本发明涉及一种汉字字形视觉重心的确定方法,步骤如下:1)获取常用汉字样本图像;2)确认汉字样本图像的笔画连通区域;3)计算得出笔画连通区域质心;4)利用笔画连通区域质心和整体汉字视觉重心之间的关系模型,计算得出汉字字形视觉重心。本发明所述的方法先确定汉字图像的笔画连通区域,对笔画连通区域进行质心的计算,然后通过笔画连通区域质心和整体汉字视觉重心之间的关系模型得出重心。所述的关系模型采用与主观视觉重心拟合度较高的多元线性回归模型,进而得出的重心更加符合主观视觉对重心的要求,克服现有技术得出的重心具有的生硬感,得到更舒适的阅读体验。
Description
技术领域
本发明涉及一种汉字字形视觉重心的确定方法,用于量化确定字形视觉重心。
背景技术
在汉字的结体中,“重心平稳”是最基本的要求,大量的书法著作中都有对其进行描述。所谓“重心”是从物理学上借用过来的术语,指重力在物体上的作用点。重心是汉字字形结构的关键,它处于字的心脏部位—中宫,构成了视觉重心,字的构成笔画和部首只有以它为中心,其结构才具有稳定性和均衡感,而又不失板滞。
在字体设计时,视觉重心是字体设计师关注的一个重要方面。因为只有汉字的视觉重心保持一致,读者阅读时才能确保阅读的流畅性和舒适性。因此汉字字形视觉重心的计算方法,在印刷体汉字自动生成,字形美化、字体排版等方面都具有重要的应用价值。
在一些汉字字形处理的工作中,已经有部分工作涉及汉字视觉重心计算。可以总结为以下几种方法:
1)通过计算汉字笔画区域黑色像素点坐标的平均值来表示汉字重心;
2)通过中心投影射线的焦点来刻画汉字重心;
3)分别计算出汉字图像上每一行列黑色像素点个数,然后统计出具有最多黑色像素点的行列,把其交叉点作为汉字重心。
以上这些汉字重心计算方法,大多是基于黑色像素点坐标位置进行局部运算,目前还没有一个有效的计算方法。
计算汉字视觉重心存在以下困难:
1)难以建立客观准确的汉字视觉重心度量与计算方法;
2)汉字重心与字形的许多因素有关,如基本笔画、间架结构、字体形态等,目前基于模式识别和图像处理的方法,还不能自动高效地提取出这些汉字特征。
发明内容
本发明的目的在于克服现有技术的不足,提供一种准确度量与计算汉字视觉重心,高效提取汉字特征的汉字字形视觉重心的确定方法。
本发明的技术方案如下:
一种汉字字形视觉重心的确定方法,步骤如下:
1)获取常用汉字样本图像;
2)确认汉字样本图像的笔画连通区域;
3)计算得出笔画连通区域质心;
4)利用笔画连通区域质心和整体汉字视觉重心之间的关系模型,计算得出汉字字形视觉重心。
作为优选,步骤2)通过对汉字样本图像进行包围盒计算,得到汉字样本图像的笔画连通区域。
作为优选,步骤2)具体为:首先对汉字样本图像尺寸不一的边缘部分进行包围盒计算,并对边缘部分进行剪切,得到汉字样本图像的笔画连通区域。
作为优选,步骤4)中笔画连通区域质心和整体汉字视觉重心之间的关系模型是利用统计分析方法建立得到。
作为优选,所述的关系模型为多元线性回归模型。
作为优选,多元线性回归模型的数学表达式定义为:r=g(x|w0,w1,…wi)+ε=w0+w1x1+w2x2+…+wixi+ε,
其中,w0,w1,…,wi称为回归系数,是i+1个待估参数,ε是随机变量。
作为优选,根据x1,x2,…,xi,r的N组数据(xk1,xk2,…,xki,rk),其中k=1,2,…,N,给出各回归系数wi的估计值w′i使得样本平方误差之和最小。
作为优选,所述的关系模型的输入参数为训练数据,通过将训练数据作为输入,得出关系模块的参数。
作为优选,x方向上的相对位置为:
y方向上的相对位置为:
其中,表示在得到的包围盒中,第i个连通区域中质心的横坐标;表示在得到的包围盒中,第i个连通区域中质心的纵坐标;width表示包围盒的宽度,heigh表示高度;表示具有i个联通区域的第m个汉字各联通区域质心在x方向上相对位置向量,表示具有i个联通区域的第m个汉字各联通区域质心在y方向上相对位置向量。
本发明的有益效果如下:
本发明所述的方法先确定汉字图像的笔画连通区域,对笔画连通区域进行质心的计算,然后通过笔画连通区域质心和整体汉字视觉重心之间的关系模型得出重心。所述的关系模型采用与主观视觉重心拟合度较高的多元线性回归模型,进而得出的重心更加符合主观视觉对重心的要求,克服现有技术得出的重心具有的生硬感,得到更舒适的阅读体验。
附图说明
图1是本发明所述的方法的流程图;
图2是本发明所述的样本汉字图像预处理示意图;
图3是本发明所述的样本汉字视觉重心标注示意图;
图4是本发明所述的确定样本数据噪声范围示意图;
图5是利用本发明所提出的技术方案,计算样本汉字视觉重心结果示意图;
图6是利用本发明所提出的技术方案,计算非样本汉字视觉重心结果示意图;
图中:圆点为质心,方形点为标注所得的视觉重心,三角形点为计算得出的视觉重心。
具体实施方式
以下结合附图及实施例对本发明进行进一步的详细说明。
一种汉字字形视觉重心的确定方法,步骤如下:
1)获取常用汉字样本图像;
2)确认汉字样本图像的笔画连通区域;
3)计算得出笔画连通区域质心;
4)利用笔画连通区域质心和整体汉字视觉重心之间的关系模型,计算得出汉字字形视觉重心。
步骤2)通过对汉字样本图像进行包围盒计算,得到汉字样本图像的笔画连通区域,具体为:首先对汉字样本图像尺寸不一的边缘部分进行包围盒计算,并对边缘部分进行剪切,得到汉字样本图像的笔画连通区域。
x方向上的相对位置y方向上的相对位置其中,表示在得到的包围盒中,第i个连通区域中质心的横坐标;表示在得到的包围盒中,第i个连通区域中质心的纵坐标;width表示包围盒的宽度,,height表示高度;表示具有i个联通区域的第m个汉字各联通区域质心在x方向上相对位置向量,表示具有i个联通区域的第m个汉字各联通区域质心在y方向上相对位置向量。
步骤4)中笔画连通区域质心和整体汉字视觉重心之间的关系模型是利用统计分析方法建立得到,所述的关系模型的输入参数为训练数据,通过将训练数据作为输入,得出关系模块的参数。所述的关系模型为多元线性回归模型。多元线性回归模型的数学表达式定义为:r=g(x|w0,w2,…wi)+ε=w0+w1x1+w2x2+…+wixi+ε,
其中,w0,w1,…,wi称为回归系数,是i+1个待估参数,ε是随机变量。
根据x1,x2,…,xi,r的N组数据(xk1,xk2,…,xki,rk),其中k=1,2,…,N,给出各回归系数wi的估计值w′i,使得样本平方误差之和最小。
本发明中的公式全部是现有公式,其中的参数是通过训练数据推导得出。
实施例
如图1所示,本发明所述的方法包括以下步骤:
步骤A,获取常用汉字样本图像。
原始样本汉字图像从Microsoft office word2010中截图获得,选取380号宋体。基于连通区域个数选取300个常用汉字样本,不同连通区域样本汉字分布情况如下:
表1样本汉字连通区域个数分布情况
连通区域个数 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
样本数目个数 | 10 | 47 | 62 | 51 | 61 | 50 | 19 |
步骤B,如图2所示,对原始汉字样本图像进行预处理,包括包围盒计算,笔画连通区域质心计算和保存。
截取的汉字图像带有尺寸不一的边缘部分,因此首先计算汉字图像包围盒,并对边缘部分进行剪切,得到样本汉字图像。然后对样本汉字图像进行处理,计算出第m个样本汉字各连通区域质心在x方向上的相对位置和y方向上的相对位置作为输入数据。其中i=1,2,…...,7,表示连通区域的个数。
以四连通区域样本汉字“冶”为例,处理后的数据如下表2所示:
表2“冶”字各连通区域质心相对位置
方向 | 连通区域1 | 连通区域2 | 连通区域3 | 连通区域4 |
x方向 | 0.126411 | 0.663657 | 0.180587 | 0.672686 |
y方向 | 0.798673 | 0.756637 | 0.446903 | 0.252212 |
步骤C,提供视觉重心标注界面,让被试对样本汉字进行视觉重心的标注,如图3所示。仅为了进行实现,共邀请被试10人进行标注(此为训练数据,用于在步骤D中推导得出笔画连通区域质心和整体汉字视觉重心之间的关系模型的参数)。然后保存此点坐标位置,分别计算出其在x和y方向上的相对位置,作为输出数据。下式表示被试标注第m个汉字重心的相对位置。
以四连通区域样本汉字“冶”为例,单个被试重心标注数据如表3所示。
表3单个被试对“冶”字重心标注结果数据
方向 | 标注视觉重心相对位置 |
x方向 | 0.487912 |
y方向 | 0.549356 |
通过以上操作,得到原始训练数据。以四连通区域样本汉字“冶”为例,单个标注者产生的训练数据如下表所示。
表4单个标注者对“冶”字标注产生的训练数据
步骤D,利用统计分析方法建立笔画连通区域质心和整体汉字视觉重心之间的关系模型。
考虑到个体差异,在标注数据中会存在一些离群点,这些点不具有统计意义,称之为噪声点,其余为有效标注点。作为一优选方案,本发明根据启功所提出的结字黄金律来确定有效标注点的取值范围。将汉字图像横竖等分13份,四个重点位置如图4中A,B,C,D四点所示,此四点为5-8分割线的交叉点。可以假设汉字的视觉重心位于此四点所围成的区域内。基于此假设,确定有效重心标注点相对位置的取值范围:
x=(0.384615,0.615384),y=(0.384615,0.615384)。
然后去除不在此范围内的重心标注点,得到训练数据。基于训练数据,目的在于建立各连通区域质心和汉字整体视觉重心之间的关系模型,这个问题属于回归分析的范畴。同时,汉字大多由多连通区域组成,为简化起见,本发明采用多元线性回归分析模型。多元线性回归是学习多元输入到输出映射关系的重要模型,通常,多元线性回归模型的数学表达式定义为r=g(x|w0,w1,…wi)+ε=w0+w1x1+w2x2+…+wixi+ε。
其中,w0,w1,…,wi称为回归系数,是i+1个待估参数,ε是随机变量(剩余参数)。多元线性回归分析的主要问题是根据x1,x2,…,xi,r的N组观测数据(xk1,xk2,…,xki,rk。)k=1,2,…,N,给出各回归系数wi的估计值w′i,使得样本平方误差之和最小。
对 对于参数wj(j=1,2,…,i)求导,得到正规方程:
Σtrt=Nw0+w1Σtx1 t+w2Σtx2 t+…+wiΣtxi t
Etx2 trt=w0Σtx1 t+w1Σt(x1 t)2+w2Σtx1 tx2 t+…+wiEtx1 txi t
Σtx2 tyt=w0Σtx2 t+w1Σtx1 tx2 t+w2Σt(x2 t)2+…+wiΣtx2 txi t
Σtxi trt=w0Σtxi t+w1Σtx1 txi t+w2Σtx2 txi t+…+wiΣt(xi t)2。
定义如下向量与矩阵:
于是,正规方程可以写为:XTXw=XTr,可以求解参数w=(XTX)-1XTr。
利用训练数据,对具有i(i=1,2,…,7)个连通区域的样本汉字分别进行x和y方向上的回归分析。其中,t为训练样本个数。
根据上述计算过程,求解参数w0,w2,…wi,即可得到连通区域质心与汉字统计视觉重心在x方向和y方向上的关系模型。
以四连通区域为例,通过本发明所提出方法计算出的模型参数如下表所示。
表5四连通区域样本多元回归参数
参数 | w0 | w1 | w2 | w3 | w4 |
X方向 | 0.541229 | -0.01204 | -0.0370052 | -0.00663138 | -0.0083533 |
Y方向 | 0.421074 | 0.0360183 | 0.0045715 | 0.00100389 | -0.00377216 |
步骤E,利用上述步骤得到的关系模型进行汉字字形视觉重心的计算。
首先对样本汉字进行测试,部分样本汉字测试结果如图5所示,第一行为上下结构样本汉字,第二行为左右结构样本汉字,第三行为半包围结构样本汉字。图5中标注的视觉重心共有十个,部分重叠,从图5可以看出不同被试所标注视觉重心虽有差别,但比较集中,此视觉重心较好地拟合了被试的标注重心。
之后选取非样本数据计算其视觉重心。计算结果如图6所示,其中第一行为上下型结构汉字,第二行左右型结构汉字,第三行为半包围型结构汉字。
本实施例对多元线性回归分析结果进行了检验。在多元线性回归分析中,可以用R2作为评价模型拟合程度的一项指标。
以四连通区域回归模型为例,其在x方向上的R2=0..7392,在y方问上的R2=0.8065。由此可见,模型具有较好的拟合程度。
从实施结果来看,本发明所述方法通过统计模型计算出汉字视觉重心,较好地拟合了标注样本视觉重心。另外,计算出的视觉重心点位于整个汉字图像几何中心偏上位置,与书法领域经验知识相吻合。
上述实施例仅是用来说明本发明,而并非用作对本发明的限定。只要是依据本发明的技术实质,对上述实施例进行变化、变型等都将落在本发明的权利要求的范围内。
Claims (10)
1.一种汉字字形视觉重心的确定方法,其特征在于,步骤如下:
1)获取常用汉字样本图像;
2)确认汉字样本图像的笔画连通区域;
3)计算得出笔画连通区域质心;
4)利用笔画连通区域质心和整体汉字视觉重心之间的关系模型,计算得出汉字字形视觉重心。
2.根据权利要求1所述的汉字字形视觉重心的确定方法,其特征在于,步骤2)通过对汉字样本图像进行包围盒计算,得到汉字样本图像的笔画连通区域。
3.根据权利要求2所述的汉字字形视觉重心的确定方法,其特征在于,步骤2)具体为:首先对汉字样本图像尺寸不一的边缘部分进行包围盒计算,并对边缘部分进行剪切,得到汉字样本图像的笔画连通区域。
4.根据权利要求1所述的汉字字形视觉重心的确定方法,其特征在于,步骤4)中笔画连通区域质心和整体汉字视觉重心之间的关系模型是利用统计分析方法建立得到。
5.根据权利要求4所述的汉字字形视觉重心的确定方法,其特征在于,所述的关系模型为多元线性回归模型。
6.根据权利要求5所述的汉字字形视觉重心的确定方法,其特征在于,多元线性回归模型的数学表达式定义为:r=g(x|w0,w1,…wi)+ε=w0+w1x1+w2x2+…+wixi+ε,
其中,w0,w1,…,wi称为回归系数,是i+1个待估参数,ε是随机变量。
7.根据权利要求6所述的汉字字形视觉重心的确定方法,其特征在于,根据x1,x2,…,xi,r的N组数据(xk1,xk2,…,xki,rk),其中k=1,2,…,N,给出各回归系数wi的估计值wi,使得样本平方误差之和最小。
8.根据权利要求4所述的汉字字形视觉重心的确定方法,其特征在于,所述的关系模型的输入参数为训练数据,通过将训练数据作为输入,得出关系模块的参数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310139606.9A CN103246636B (zh) | 2013-04-19 | 2013-04-19 | 一种汉字字形视觉重心的确定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310139606.9A CN103246636B (zh) | 2013-04-19 | 2013-04-19 | 一种汉字字形视觉重心的确定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103246636A true CN103246636A (zh) | 2013-08-14 |
CN103246636B CN103246636B (zh) | 2016-05-04 |
Family
ID=48926163
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310139606.9A Expired - Fee Related CN103246636B (zh) | 2013-04-19 | 2013-04-19 | 一种汉字字形视觉重心的确定方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103246636B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106846399A (zh) * | 2017-01-16 | 2017-06-13 | 浙江大学 | 一种获取图像的视觉重心的方法及装置 |
CN107437084A (zh) * | 2017-07-24 | 2017-12-05 | 南京晓庄学院 | 一种脱机手写体文本识别的字符重心定位方法 |
CN111027550A (zh) * | 2019-12-17 | 2020-04-17 | 北大方正集团有限公司 | 字库视觉重心调整的方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1011535A (ja) * | 1996-06-20 | 1998-01-16 | Nippon Digital Kenkyusho:Kk | 文字パターンの外接枠決定方式および文字正規化装置 |
JP2000207393A (ja) * | 1999-01-20 | 2000-07-28 | Techno Advance:Kk | 文字配列出力装置 |
CN102496018A (zh) * | 2011-12-08 | 2012-06-13 | 方正国际软件有限公司 | 一种文档倾斜检测方法及系统 |
CN102637078A (zh) * | 2012-02-27 | 2012-08-15 | 厦门大学 | 一种结构优化的汉字字形生成方法 |
-
2013
- 2013-04-19 CN CN201310139606.9A patent/CN103246636B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1011535A (ja) * | 1996-06-20 | 1998-01-16 | Nippon Digital Kenkyusho:Kk | 文字パターンの外接枠決定方式および文字正規化装置 |
JP2000207393A (ja) * | 1999-01-20 | 2000-07-28 | Techno Advance:Kk | 文字配列出力装置 |
CN102496018A (zh) * | 2011-12-08 | 2012-06-13 | 方正国际软件有限公司 | 一种文档倾斜检测方法及系统 |
CN102637078A (zh) * | 2012-02-27 | 2012-08-15 | 厦门大学 | 一种结构优化的汉字字形生成方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106846399A (zh) * | 2017-01-16 | 2017-06-13 | 浙江大学 | 一种获取图像的视觉重心的方法及装置 |
CN107437084A (zh) * | 2017-07-24 | 2017-12-05 | 南京晓庄学院 | 一种脱机手写体文本识别的字符重心定位方法 |
CN107437084B (zh) * | 2017-07-24 | 2020-12-08 | 南京晓庄学院 | 一种脱机手写体文本识别的字符重心定位方法 |
CN111027550A (zh) * | 2019-12-17 | 2020-04-17 | 北大方正集团有限公司 | 字库视觉重心调整的方法和装置 |
CN111027550B (zh) * | 2019-12-17 | 2023-09-08 | 新方正控股发展有限责任公司 | 字库视觉重心调整的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN103246636B (zh) | 2016-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101976354B (zh) | 一种书写汉字规范性评判的方法和装置 | |
WO2020155757A1 (zh) | 柱状图数据转换控制方法、装置、计算机设备及存储介质 | |
CN106095865A (zh) | 一种商标文本相似性评审方法 | |
CN104008375B (zh) | 基于特征融合的集成人脸识别方法 | |
CN104166499B (zh) | 笔迹练习系统及练习笔迹自动评测方法 | |
CN105574527A (zh) | 一种基于局部特征学习的快速物体检测方法 | |
CN109635687B (zh) | 基于时序点集计算的汉字文本行书写质量自动评价方法和系统 | |
CN104182766A (zh) | 基于模板匹配的手写汉字笔画位置关系正确性判断方法 | |
CN106548478B (zh) | 基于局部拟合图像的活动轮廓图像分割方法 | |
CN103246636B (zh) | 一种汉字字形视觉重心的确定方法 | |
CN103093237B (zh) | 一种基于结构化模型的人脸检测方法 | |
CN113191309A (zh) | 一种手写汉字的识别、评分、纠错方法及系统 | |
CN109189314A (zh) | 手写设备的书写引导方法、装置、设备及介质 | |
Widom et al. | Methodological reflections on typologies for numerical notations | |
CN106570882B (zh) | 混合高斯分布模型的活动轮廓图像分割方法 | |
CN103186777A (zh) | 基于非负矩阵分解的人体检测方法 | |
CN103927540B (zh) | 一种基于生物视觉分层模型的不变特征提取方法 | |
CN109389173A (zh) | 一种基于m-cnn的试卷分数自动统计分析方法和装置 | |
CN111079742A (zh) | 一种扫描试卷中作文区域图像文本块精准定位方法 | |
CN106570910A (zh) | 基于自编码特征和近邻模型的图像自动标注方法 | |
CN101430756B (zh) | 一种和书写文字内容无关的汉字笔迹可视化鉴定方法 | |
CN110176074B (zh) | 基于等几何配点法的浅浮雕模型快速建模方法 | |
CN106372647A (zh) | 一种基于韦伯局部二值计数的图像纹理分类方法 | |
CN112200107A (zh) | 一种发票文本检测方法 | |
CN109903349A (zh) | 一种基于最大似然估计的颜色和谐度预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160504 Termination date: 20190419 |