CN103246636A

CN103246636A - 一种汉字字形视觉重心的确定方法

Info

Publication number: CN103246636A
Application number: CN2013101396069A
Authority: CN
Inventors: 张俊松; 李彬
Original assignee: Xiamen University
Current assignee: Xiamen University
Priority date: 2013-04-19
Filing date: 2013-04-19
Publication date: 2013-08-14
Anticipated expiration: 2033-04-19
Also published as: CN103246636B

Abstract

本发明涉及一种汉字字形视觉重心的确定方法，步骤如下：1）获取常用汉字样本图像；2）确认汉字样本图像的笔画连通区域；3）计算得出笔画连通区域质心；4）利用笔画连通区域质心和整体汉字视觉重心之间的关系模型，计算得出汉字字形视觉重心。本发明所述的方法先确定汉字图像的笔画连通区域，对笔画连通区域进行质心的计算，然后通过笔画连通区域质心和整体汉字视觉重心之间的关系模型得出重心。所述的关系模型采用与主观视觉重心拟合度较高的多元线性回归模型，进而得出的重心更加符合主观视觉对重心的要求，克服现有技术得出的重心具有的生硬感，得到更舒适的阅读体验。

Description

一种汉字字形视觉重心的确定方法

技术领域

本发明涉及一种汉字字形视觉重心的确定方法，用于量化确定字形视觉重心。

背景技术

在汉字的结体中，“重心平稳”是最基本的要求，大量的书法著作中都有对其进行描述。所谓“重心”是从物理学上借用过来的术语，指重力在物体上的作用点。重心是汉字字形结构的关键，它处于字的心脏部位—中宫，构成了视觉重心，字的构成笔画和部首只有以它为中心，其结构才具有稳定性和均衡感，而又不失板滞。

在字体设计时，视觉重心是字体设计师关注的一个重要方面。因为只有汉字的视觉重心保持一致，读者阅读时才能确保阅读的流畅性和舒适性。因此汉字字形视觉重心的计算方法，在印刷体汉字自动生成，字形美化、字体排版等方面都具有重要的应用价值。

在一些汉字字形处理的工作中，已经有部分工作涉及汉字视觉重心计算。可以总结为以下几种方法：

1）通过计算汉字笔画区域黑色像素点坐标的平均值来表示汉字重心；

2）通过中心投影射线的焦点来刻画汉字重心；

3）分别计算出汉字图像上每一行列黑色像素点个数，然后统计出具有最多黑色像素点的行列，把其交叉点作为汉字重心。

以上这些汉字重心计算方法，大多是基于黑色像素点坐标位置进行局部运算，目前还没有一个有效的计算方法。

计算汉字视觉重心存在以下困难：

1）难以建立客观准确的汉字视觉重心度量与计算方法；

2）汉字重心与字形的许多因素有关，如基本笔画、间架结构、字体形态等，目前基于模式识别和图像处理的方法，还不能自动高效地提取出这些汉字特征。

发明内容

本发明的目的在于克服现有技术的不足，提供一种准确度量与计算汉字视觉重心，高效提取汉字特征的汉字字形视觉重心的确定方法。

本发明的技术方案如下：

一种汉字字形视觉重心的确定方法，步骤如下：

1）获取常用汉字样本图像；

2）确认汉字样本图像的笔画连通区域；

3）计算得出笔画连通区域质心；

4）利用笔画连通区域质心和整体汉字视觉重心之间的关系模型，计算得出汉字字形视觉重心。

作为优选，步骤2）通过对汉字样本图像进行包围盒计算，得到汉字样本图像的笔画连通区域。

作为优选，步骤2）具体为：首先对汉字样本图像尺寸不一的边缘部分进行包围盒计算，并对边缘部分进行剪切，得到汉字样本图像的笔画连通区域。

作为优选，步骤4）中笔画连通区域质心和整体汉字视觉重心之间的关系模型是利用统计分析方法建立得到。

作为优选，所述的关系模型为多元线性回归模型。

作为优选，多元线性回归模型的数学表达式定义为：r＝g(x|w₀，w₁，…w_i)+ε＝w₀+w₁x₁+w₂x₂+…+w_ix_i+ε，

其中，w₀，w₁，…，w_i称为回归系数，是i+1个待估参数，ε是随机变量。

作为优选，根据x₁，x₂，…，x_i，r的N组数据(x_k1，x_k2，…，x_ki，r_k)，其中k＝1，2，…，N，给出各回归系数w_i的估计值w′_i使得样本平方误差之和最小。

作为优选，所述的关系模型的输入参数为训练数据，通过将训练数据作为输入，得出关系模块的参数。

作为优选，步骤3）中质心的确认步骤为：计算得出汉字样本图像的各个笔画连通区域质心在x方向上的相对位置

和y方向上的相对位置

其中i=1,2,…...,7，表示连通区域的个数。

作为优选，x方向上的相对位置为：

l_{i, x}^{m} = (\frac{c_{1, x}^{m}}{width}, \frac{c_{2, x}^{m}}{width}, . . ., \frac{c_{i, x}^{m}}{width});

y方向上的相对位置为：

l_{i, y}^{m} = (\frac{c_{1, y}^{m}}{height}, \frac{c_{2, y}^{m}}{height}, . . ., \frac{c_{i, y}^{m}}{height});

其中，表示在得到的包围盒中，第i个连通区域中质心的横坐标；

表示在得到的包围盒中，第i个连通区域中质心的纵坐标；width表示包围盒的宽度，heigh表示高度；

表示具有i个联通区域的第m个汉字各联通区域质心在x方向上相对位置向量，

表示具有i个联通区域的第m个汉字各联通区域质心在y方向上相对位置向量。

本发明的有益效果如下：

本发明所述的方法先确定汉字图像的笔画连通区域，对笔画连通区域进行质心的计算，然后通过笔画连通区域质心和整体汉字视觉重心之间的关系模型得出重心。所述的关系模型采用与主观视觉重心拟合度较高的多元线性回归模型，进而得出的重心更加符合主观视觉对重心的要求，克服现有技术得出的重心具有的生硬感，得到更舒适的阅读体验。

附图说明

图1是本发明所述的方法的流程图；

图2是本发明所述的样本汉字图像预处理示意图；

图3是本发明所述的样本汉字视觉重心标注示意图；

图4是本发明所述的确定样本数据噪声范围示意图；

图5是利用本发明所提出的技术方案，计算样本汉字视觉重心结果示意图；

图6是利用本发明所提出的技术方案，计算非样本汉字视觉重心结果示意图；

图中：圆点为质心，方形点为标注所得的视觉重心，三角形点为计算得出的视觉重心。

具体实施方式

以下结合附图及实施例对本发明进行进一步的详细说明。

一种汉字字形视觉重心的确定方法，步骤如下：

1）获取常用汉字样本图像；

2）确认汉字样本图像的笔画连通区域；

3）计算得出笔画连通区域质心；

步骤2）通过对汉字样本图像进行包围盒计算，得到汉字样本图像的笔画连通区域，具体为：首先对汉字样本图像尺寸不一的边缘部分进行包围盒计算，并对边缘部分进行剪切，得到汉字样本图像的笔画连通区域。

步骤3）中质心的确认步骤为：计算得出汉字样本图像的各个笔画连通区域质心在x方向上的相对位置

和y方向上的相对位置

其中i=1,2,…...,7，表示连通区域的个数。

x方向上的相对位置y方向上的相对位置

其中，

表示在得到的包围盒中，第i个连通区域中质心的横坐标；表示在得到的包围盒中，第i个连通区域中质心的纵坐标；width表示包围盒的宽度，,height表示高度；

表示具有i个联通区域的第m个汉字各联通区域质心在x方向上相对位置向量，表示具有i个联通区域的第m个汉字各联通区域质心在y方向上相对位置向量。

步骤4）中笔画连通区域质心和整体汉字视觉重心之间的关系模型是利用统计分析方法建立得到，所述的关系模型的输入参数为训练数据，通过将训练数据作为输入，得出关系模块的参数。所述的关系模型为多元线性回归模型。多元线性回归模型的数学表达式定义为：r＝g(x|w₀，w₂，…w_i)+ε＝w₀+w₁x₁+w₂x₂+…+w_ix_i+ε，

根据x₁，x₂，…，x_i，r的N组数据(x_k1，x_k2，…，x_ki，r_k)，其中k＝1，2，…，N，给出各回归系数w_i的估计值w′_i，使得样本平方误差之和最小。

本发明中的公式全部是现有公式，其中的参数是通过训练数据推导得出。

实施例

如图1所示，本发明所述的方法包括以下步骤：

步骤A，获取常用汉字样本图像。

原始样本汉字图像从Microsoft office word2010中截图获得，选取380号宋体。基于连通区域个数选取300个常用汉字样本，不同连通区域样本汉字分布情况如下：

表1样本汉字连通区域个数分布情况

连通区域个数	1	2	3	4	5	6	7
								样本数目个数	10	47	62	51	61	50	19

步骤B，如图2所示，对原始汉字样本图像进行预处理，包括包围盒计算，笔画连通区域质心计算和保存。

截取的汉字图像带有尺寸不一的边缘部分，因此首先计算汉字图像包围盒，并对边缘部分进行剪切，得到样本汉字图像。然后对样本汉字图像进行处理，计算出第m个样本汉字各连通区域质心在x方向上的相对位置

和y方向上的相对位置

作为输入数据。其中i=1,2,…...,7，表示连通区域的个数。

l_{i, x}^{m} = (\frac{c_{1, x}^{m}}{width}, \frac{c_{2, x}^{m}}{width}, . . ., \frac{c_{i, x}^{m}}{width}),

l_{i, y}^{m} = (\frac{c_{1, y}^{m}}{height}, \frac{c_{2, y}^{m}}{height}, . . ., \frac{c_{i, y}^{m}}{height}),

表示在得到的包围盒中，第i个连通区域中质心的横坐标，同理，

表示纵坐标；width表示包围盒的宽度，height表示高度；表示具有i个联通区域的第m个汉字各联通区域质心在x方向上相对位置向量）。

以四连通区域样本汉字“冶”为例，处理后的数据如下表2所示：

表2“冶”字各连通区域质心相对位置

方向	连通区域1	连通区域2	连通区域3	连通区域4
					x方向	0.126411	0.663657	0.180587	0.672686
y方向	0.798673	0.756637	0.446903	0.252212

步骤C，提供视觉重心标注界面，让被试对样本汉字进行视觉重心的标注，如图3所示。仅为了进行实现，共邀请被试10人进行标注（此为训练数据，用于在步骤D中推导得出笔画连通区域质心和整体汉字视觉重心之间的关系模型的参数）。然后保存此点坐标位置，分别计算出其在x和y方向上的相对位置，作为输出数据。下式表示被试标注第m个汉字重心的相对位置。

（i表示联通区域的个数，表示被试标注第m个汉字重心在x方向上的坐标，同理，表示在y方向上的坐标；width表示包围盒宽度，height表示包围盒高度）。

以四连通区域样本汉字“冶”为例，单个被试重心标注数据如表3所示。

表3单个被试对“冶”字重心标注结果数据

方向	标注视觉重心相对位置
		x方向	0.487912
y方向	0.549356

通过以上操作，得到原始训练数据。以四连通区域样本汉字“冶”为例，单个标注者产生的训练数据如下表所示。

表4单个标注者对“冶”字标注产生的训练数据

步骤D，利用统计分析方法建立笔画连通区域质心和整体汉字视觉重心之间的关系模型。

考虑到个体差异，在标注数据中会存在一些离群点，这些点不具有统计意义，称之为噪声点，其余为有效标注点。作为一优选方案，本发明根据启功所提出的结字黄金律来确定有效标注点的取值范围。将汉字图像横竖等分13份，四个重点位置如图4中A,B,C,D四点所示，此四点为5-8分割线的交叉点。可以假设汉字的视觉重心位于此四点所围成的区域内。基于此假设，确定有效重心标注点相对位置的取值范围：

x=(0.384615，0.615384)，y=(0.384615，0.615384)。

然后去除不在此范围内的重心标注点，得到训练数据。基于训练数据，目的在于建立各连通区域质心和汉字整体视觉重心之间的关系模型，这个问题属于回归分析的范畴。同时，汉字大多由多连通区域组成，为简化起见，本发明采用多元线性回归分析模型。多元线性回归是学习多元输入到输出映射关系的重要模型，通常，多元线性回归模型的数学表达式定义为r＝g(x|w₀，w₁，…w_i)+ε＝w₀+w₁x₁+w₂x₂+…+w_ix_i+ε。

其中，w₀，w₁，…,w_i称为回归系数，是i+1个待估参数，ε是随机变量(剩余参数)。多元线性回归分析的主要问题是根据x₁，x₂，…，x_i，r的N组观测数据(x_k1，x_k2，…，x_ki，r_k。)k=1，2，…，Ｎ，给出各回归系数w_i的估计值w′_i，使得样本平方误差之和最小。

对

E (x | w_{0}, w_{1}, . . . w_{i}) = \frac{1}{2} Σ_{t} {(r^{t} - w_{0} - w_{1} {x_{1}}^{t} - w_{2} {x_{2}}^{t} - . . . w_{i} {x_{i}}^{t})}^{2}

对于参数w_j(j＝1，2，…，i)求导，得到正规方程：

Σ_tr^t＝Nw₀+w₁Σ_tx₁ ^t+w₂Σ_tx₂ ^t+…+w_iΣ_tx_i ^t

E_tx₂ ^tr^t＝w₀Σ_tx₁ ^t+w₁Σ_t(x₁ ^t)²+w₂Σ_tx₁ ^tx₂ ^t+…+w_iE_tx₁ ^tx_i ^t

Σ_tx₂ ^ty^t=w₀Σ_tx₂ ^t+w₁Σ_tx₁ ^tx₂ ^t+w₂Σ_t(x₂ ^t)²+…+w_iΣ_tx₂ ^tx_i ^t

Σ_tx_i ^tr^t＝w₀Σ_tx_i ^t+w₁Σ_tx₁ ^tx_i ^t+w₂Σ_tx₂ ^tx_i ^t+…+w_iΣ_t(x_i ^t)₂。

定义如下向量与矩阵：

[\begin{matrix} 1 & {x_{1}}^{1} {x_{2}}^{1} & {x_{3}}^{1} . . . & {x_{i}}^{1} \\ 1 & {x_{1}}^{2} {x_{2}}^{2} & {x_{3}}^{2} . . . & {x_{i}}^{2} \\ . & \begin{matrix} . & . \end{matrix} & \begin{matrix} . \end{matrix} & . \\ . & \begin{matrix} . & . \end{matrix} & \begin{matrix} . & . . . \end{matrix} & . \\ . & \begin{matrix} . & . \end{matrix} & \begin{matrix} . \end{matrix} & . \\ 1 & {x_{1}}^{N} {x_{2}}^{N} & {x_{2}}^{N} . . . & {x_{i}}^{N} \end{matrix}],

w = [\begin{matrix} w_{0} \\ w_{1} \\ . \\ . \\ . \\ w_{i} \end{matrix}],

r = [\begin{matrix} r^{1} \\ r^{2} \\ . \\ . \\ . \\ r^{N} \end{matrix}],

于是，正规方程可以写为：X^TXw＝X^Tr，可以求解参数w＝(X^TX)^-1X^Tr。

利用训练数据，对具有i（i=1,2,…,7）个连通区域的样本汉字分别进行x和y方向上的回归分析。其中，t为训练样本个数。

（这是回归分析的过程，是解决这个问题的核心，利用样本标注数据，归纳出二者之间的关系，上面的步骤是对这个回归问题的数学解决过程）

根据上述计算过程，求解参数w₀，w₂，…w_i，即可得到连通区域质心与汉字统计视觉重心在x方向和y方向上的关系模型。

以四连通区域为例，通过本发明所提出方法计算出的模型参数如下表所示。

表5四连通区域样本多元回归参数

参数	w₀	w₁	w₂	w₃	w₄
						X方向	0.541229	-0.01204	-0.0370052	-0.00663138	-0.0083533
Y方向	0.421074	0.0360183	0.0045715	0.00100389	-0.00377216

步骤E，利用上述步骤得到的关系模型进行汉字字形视觉重心的计算。

首先对样本汉字进行测试，部分样本汉字测试结果如图5所示，第一行为上下结构样本汉字，第二行为左右结构样本汉字，第三行为半包围结构样本汉字。图5中标注的视觉重心共有十个，部分重叠，从图5可以看出不同被试所标注视觉重心虽有差别，但比较集中，此视觉重心较好地拟合了被试的标注重心。

之后选取非样本数据计算其视觉重心。计算结果如图6所示，其中第一行为上下型结构汉字，第二行左右型结构汉字，第三行为半包围型结构汉字。

本实施例对多元线性回归分析结果进行了检验。在多元线性回归分析中，可以用R²作为评价模型拟合程度的一项指标。

（这个指标叫做拟合优度，主要评价拟合也就是归纳的效果，数值越大说明拟合的效果越好，归纳出的一般结论和个体样本的差异越小）

其中

为残差平方和，E(Y_t-Y)²为总离差平方和，R²的大小取决于残差平方和在总离差平方和中所占的比重。拟合程度越好，R²取值越大，且有R²＜1。

以四连通区域回归模型为例，其在x方向上的R²＝0..7392，在y方问上的R²＝0.8065。由此可见，模型具有较好的拟合程度。

从实施结果来看，本发明所述方法通过统计模型计算出汉字视觉重心，较好地拟合了标注样本视觉重心。另外，计算出的视觉重心点位于整个汉字图像几何中心偏上位置，与书法领域经验知识相吻合。

上述实施例仅是用来说明本发明，而并非用作对本发明的限定。只要是依据本发明的技术实质，对上述实施例进行变化、变型等都将落在本发明的权利要求的范围内。

Claims

1.一种汉字字形视觉重心的确定方法，其特征在于，步骤如下：

1）获取常用汉字样本图像；

2）确认汉字样本图像的笔画连通区域；

3）计算得出笔画连通区域质心；

2.根据权利要求1所述的汉字字形视觉重心的确定方法，其特征在于，步骤2）通过对汉字样本图像进行包围盒计算，得到汉字样本图像的笔画连通区域。

3.根据权利要求2所述的汉字字形视觉重心的确定方法，其特征在于，步骤2）具体为：首先对汉字样本图像尺寸不一的边缘部分进行包围盒计算，并对边缘部分进行剪切，得到汉字样本图像的笔画连通区域。

4.根据权利要求1所述的汉字字形视觉重心的确定方法，其特征在于，步骤4）中笔画连通区域质心和整体汉字视觉重心之间的关系模型是利用统计分析方法建立得到。

5.根据权利要求4所述的汉字字形视觉重心的确定方法，其特征在于，所述的关系模型为多元线性回归模型。

6.根据权利要求5所述的汉字字形视觉重心的确定方法，其特征在于，多元线性回归模型的数学表达式定义为：r=g(x|w₀，w₁，…w_i)+ε＝w₀+w₁x₁+w₂x₂+…+w_ix_i+ε，

7.根据权利要求6所述的汉字字形视觉重心的确定方法，其特征在于，根据x₁，x₂，…，x_i，r的N组数据(x_k1，x_k2，…，x_ki，r_k)，其中k＝1，2，…，N，给出各回归系数w_i的估计值w_i，使得样本平方误差之和最小。

8.根据权利要求4所述的汉字字形视觉重心的确定方法，其特征在于，所述的关系模型的输入参数为训练数据，通过将训练数据作为输入，得出关系模块的参数。

9.根据权利要求1所述的汉字字形视觉重心的确定方法，其特征在于，步骤3）中质心的确认步骤为：计算得出汉字样本图像的各个笔画连通区域质心在x方向上的相对位置

和y方向上的相对位置

其中i=1,2,......,7，表示连通区域的个数。

10.根据权利要求9所述的汉字字形视觉重心的确定方法，其特征在于，x方向上的相对位置为：

l_{i, x}^{m} = (\frac{c_{1, x}^{m}}{width}, \frac{c_{2, x}^{m}}{width}, . . ., \frac{c_{i, x}^{m}}{width});

y方向上的相对位置为：

l_{i, y}^{m} = (\frac{c_{1, y}^{m}}{height}, \frac{c_{2, y}^{m}}{height}, . . ., \frac{c_{i, y}^{m}}{height});

其中，

表示在得到的包围盒中，第i个连通区域中质心的横坐标；

表示在得到的包围盒中，第i个连通区域中质心的纵坐标；width表示包围盒的宽度，height表示高度；