CN104899601A

CN104899601A - 一种手写维吾尔文单词识别方法

Info

Publication number: CN104899601A
Application number: CN201510288179.XA
Authority: CN
Inventors: 卢朝阳; 李静; 瞿萌; 许亚美; 李克; 帕提古丽·艾麦尔尼亚孜; 郝珍珍
Original assignee: XIDIAN-NINGBO INFORMATION TECHNOLOGY INSTITUTE
Current assignee: XIDIAN-NINGBO INFORMATION TECHNOLOGY INSTITUTE
Priority date: 2015-05-29
Filing date: 2015-05-29
Publication date: 2015-09-09

Abstract

本发明涉及手写维吾尔文单词识别方法，该方法首先对手写维文单词预处理，接着分别提取了维文单词的笔画结构特征和梯度特征，笔画结构特征是直接在时间坐标序列上提取的，而梯度特征是把预处理后手写维吾尔文单词的时间坐标序列映射为二维图像，在二维的图像中提取的，然后将两者特征进行串行融合，最后采用欧式距离分类器进行分类识别，得到识别结果。本发明提取了两种维文单词特征，并将串行融合，相比提取单一的特征，提高了识别率。本算法具有算法性能好、实时性强、可靠性高、识别率高等优点，主要应用于移动终端上实现手写维文识别，为维文的信息化处理提供了一种新的方法，开辟了新的应用途径。

Description

一种手写维吾尔文单词识别方法

技术领域

本发明属于模式识别中的文字识别技术领域，主要涉及手写体识别领域，特别是涉及手写维吾尔文单词识别方法，用于在移动终端上实现维吾尔文单词的手写输入。

背景技术

维吾尔文是我国一种重要的少数民族语言，是新疆地区维吾尔族用来交流和工作的主要文字之一，属于阿尔泰语系突厥语族西匈语支，是一种粘连型拼音文字。根据GB12050-89国家标准，现代维吾尔文由32个字母组成，包括8个元音字母，24个辅音字母。维吾尔文字母形体由于独写或在词首、词中、词尾位置不同，每个字母有前连式、后连式、双连式、单立式等2～8种书写形式，演化成124个字符。此外，还有两个复合字符，一个后连前缀符和一个隔音符号，总共有128个维吾尔文单字符。维吾尔文单词是由维吾尔文单字符组成的，一个维吾尔文单词少则有3～4个单字符组成，多则有十几个单字符组成。维吾尔文单词在书写时采用自右向左、自上向下的手写方式，沿着一条水平线即基线相连书写。

研究维吾尔文单词的处理和识别有益于新疆少数民族地区的文化交流、信息交流和科技经济的发展。在市场上，维吾尔文印刷体文字识别系统已经广泛的应用于维吾尔文信息处理的各个领域，但是，对维吾尔文手写单词识别的研究仍处于探索阶段。相比单字符识别，单词识别具有以下的优势：(1)更自然连贯的手写输入：人们在书写文字时，大部分都是以词为单位出现在脑海中，如果将一个单词中的字符逐个书写逐个识别，很容易影响思维的连贯性，因此，单词的输入相对于单个字符的逐个输入更显得自然和人性化；(2)更快速的手写输入和识别：直接对单词进行手写识别，可以不用间断的将一个单词输入，并进行单词的整体识别，更好的体现了人机交互性。

目前，维吾尔文单词识别分为基于切分的识别方法和基于整词的识别方法。

基于切分的识别方法原理是，将单词看作若干个单字符组成的整体，先对单词切分成一系列的候选字符，进而通过分析字符形状特征来识别出单独的字符，然后识别整个单词。此方法的优点是适应性较好，不需要大量的单词训练样本和存储空间，但在实际应用中受到限制较多，对单词切分的准确性要求较高，容易受手写体单词手写者个体差异的影响，而且系统复杂，对系统中每个环节要求都较苛刻。明显地，基于切分的识别方法的研究重点在于单词的字符切分，中国专利号为201010013727.5的发明专利由西安电子科技大学李静、卢朝阳等提出了一种脱机维吾尔文单词的字符切分方法，该专利提出了通过多特征的联合应用引导切分，从而使复杂的手写维吾尔文单词变成清晰、完整的单字符图像，送入字符识别模块实现对整个维吾尔文单词的鲁棒识别。

基于整词的识别方法原理是，从单词的整体特征入手，提取一个全局特征向量，然后按照某种匹配算法，用它来匹配一个己知词典中的候选单词，距离最近的候选单词就是最终识别结果。此方法的优点是识别系统比较简单、识别速度快，也避免了单词切分所遇到的一些问题，而且符合人类阅读时的习惯。但是，单词的整体特征提取较为困难。

由于维文单词粘连的特性以及书写时的随意性，使得单词的全局特征向量的提取困难。如何将维文单词特定的书写规则与特征提取算法有效结合起来，并将不同的特征融合，是手写维吾尔文单词识别一个亟待解决的问题。

发明内容

本发明的目的是克服现有表征维吾尔文单词的全局特征向量提取困难的问题，提供一种识别率较高的手写维吾尔文单词识别方法。

本发明解决上述技术问题所采用的技术方案为：一种手写维吾尔文单词识别方法，其特征在于包括如下处理过程：

步骤1、对采集到的手写维文单词进行预处理；

步骤2、将步骤1预处理后的维文单词图像从对象空间映射到特征空间，得到维文单词图像的笔画结构特征；

步骤3、将预处理后的维文单词的时间坐标序列映射为二维图像，得到维文单词图像的梯度特征；

步骤4、将步骤2得到的笔画结构特征和步骤3的得到的梯度特征进行融合，得到维文单词图像的特征向量；

步骤5、根据训练样本预先得到的特征向量库，使用欧氏距离分类器对步骤4得到维文单词的特征向量在特征向量库中进行分类识别，得到分类识别结果。

作为改进，手写维吾尔文单词预处理过程包括：

(1-1)、裁剪手写维文单词图像，去除手写维文单词图像中不包含文字轨迹点的区域，从而留下包含文字轨迹点的区域；

(1-2)、对(1-1)裁剪后的维文单词进行归一化处理，将大小不同的手写维文单词图像归一化为大小相同的图像；

(1-3)、对(1-2)归一化处理后的手写维文单词图像进行平滑滤波，去除手写维文单词图像中的抖动噪声；

(1-4)、对(1-3)处理后的手写维文单词图像进行倾斜校正；

(1-5)、对(1-4)倾斜校正后的手写维文单词图像进行轨迹点重采样和插值，去除原手写维文单词图像中存在象素点比较紧密而归一化处理后象素点比较稀疏的现象，使处理后的手写维文单词图像与原手写维文单词图像中象素点间距离尽量一致。

再改进，所述步骤2的处理过程为：

(2-1)、根据维吾尔文单词的特点和对维吾尔文单词的字形分析，参照图3，将维吾尔文单词拆分为3类笔画：主体笔画、点笔画和附加笔画，其中，沿着基线书写的笔画称为主体笔画，点笔画为基线上方或下方的点，基线上方的变音符号则为附加笔画；

(2-2)、找出步骤1预处理后的维文单词中的主体笔画：

(2-2-1)、设置主体笔画数阈值，笔画点数超过主体笔画数阈值的笔画为主体笔画；

(2-2-2)、首笔画的提取：经过(2-2-1)阈值滤除后的第一笔画为首笔画，将该首笔画归为主体笔画；

(2-2-3)、普通主体笔画的提取：将与首笔画X坐标不同的剩余主体段的笔画直接判断为普通主体笔画，普通主体笔画也归为主体笔画；

(2-2-4)、将终始点趋于闭合的笔画也归位主体笔画；

(2-3)、找出步骤1预处理后的维文单词中的点笔画和附加笔画：设置点笔画数阈值，将笔画点数小于点笔画数阈值的笔画归为点笔画数，将笔画点数大于等于点笔画数阈值小于等于主体笔画数阈值的笔画归为附加笔画者

(2-4)、提取主体笔画的方向线素特征；

(2-5)、提取附加笔画的旋转方向码特征；

(2-6)、提取点笔画的各类点数目特征；

维文单词的笔画结构特征即包括：(2-4)提取出的主体笔画的方向线素特征，(2-5)提取出的附加笔画的旋转方向码特征，和(2-6)提取出的点笔画的各类点数目特征。

所述(2-5)中提取附加笔画的旋转方向码特征的具体方法为：依书写顺序将附加笔画所有坐标连接起来得到一条曲线，根据曲线的走向提取旋转方向码：将手写区域的横、纵坐标的变化趋势分成四种状态：(1)Δx≥0,Δy≥0；(2)Δx≤0,Δy≥0；(3)Δx≤0,Δy≤0；(4)Δx≥0,Δy≤0，当笔画走向为顺时针时，旋转方向码特征为(1)→(2)→(3)→(4)→(1)；当笔画走向为逆时针时，旋转方向码特征为(1)→(4)→(3)→(2)→(1)；当笔画为直线时，旋转方向码特征为(1)→(1)→(1)→(1)→(1)。

所述(2-6)中提取点笔画的各类点数目特征的具体方法为：定义点笔画的点数目特征为7位：特征前三位表示基线上一点的个数、基线上两点的个数、基线上三点的个数；特征后四位分别表示基线下一点的个数、基线下水平两点的个数、基线下垂直两点的个数、基线下三点的个数，分别统计各类点形式的个数即形成各类点数目特征。

再改进，所述步骤3采用Sobel算法提取维文单词的梯度特征。

再改进，所述步骤4中，设Z是融合后维文单词图像的特征向量，X(x₁,x₂,…,x_n)是步骤2得到的笔画结构特征，Y(y₁,y₂,…,y_n)是步骤3的得到的梯度特征，则Z＝αX||βY；即Z＝(αx₁,αx₂,…,αx_n,βy₁,βy₂,…,βy_n)；α是笔画结构特征的权重系数，β是梯度特征的权重系数，分别代表笔画结构特征和梯度特征对新特征的贡献程度，且α＝10，β＝0.1。

与现有技术相比，本发明的优点在于：本发明复杂度低，实现较简单，具有较好的鲁棒性；本发明笔画结构特征适用于手写体维吾尔单词等草写体文字，能很好地刻画单词笔画的拓扑形状和结构，并且特征维数相对小，距离计算简单；本发明有效利用了不同特征向量的优点，提高了手写维吾尔文单词识别的平均识别率。

附图说明

图1为本发明单词识别方法的整体流程图。

图2为本发明维文单词预处理流程图。

图3为本发明维吾尔文单词笔画模型示意图。

图4为本发明使用的Sobel算子模板。

图5为本发明梯度向量分解示意图。

图6为本发明权值矩阵采样降维过程示意图。

具体实施方式

以下结合附图实施例对本发明作进一步详细描述。

本实施例中提供了一种手写维吾尔文单词识别方法，参见图1所示,其包括如下步骤：

步骤1、对采集到的手写维文单词进行预处理，预处理过程参见图2所示，具体包括：

(1-2)、对(1-1)裁剪后的维文单词进行归一化处理，将大小不同的手写维文单词图像归一化为大小相同的图像，比如归一化后手写维文单词图像大小为256×256；

(1-3)、对(1-2)归一化处理后的手写维文单词图像进行平滑滤波，去除手写维文单词图像中的抖动噪声；具体实现时，可以采用多点加权平均方法进行平滑滤波,该方法建议考虑当前点以及前后2个点；

(1-4)、对(1-3)处理后的手写维文单词图像进行倾斜校正得到手写维文单词图像；倾斜校正可以采用Hough变换法；

(1-5)、对(1-4)倾斜校正后的手写维文单词图像进行轨迹点重采样和插值，去除原手写维文单词图像中存在象素点比较紧密而归一化处理后象素点比较稀疏的现象，使处理后的手写维文单词图像与原手写维文单词图像中象素点间距离尽量一致；本步骤中，可以考虑每隔3个点进行重采样；

步骤2，将步骤1预处理后的维文单词从对象空间映射到特征空间，得到维文单词的笔画结构特征，维文单词的笔画结构特征的提取过程包括：

(2-2)、找出步骤1预处理后的维文单词中的主体笔画，具体步骤为：

(2-2-4)、将终始点趋于闭合的笔画也归位主体笔画；

(2-3)、找出步骤1预处理后的维文单词中的点笔画和附加笔画：设置点笔画数阈值，将笔画点数小于点笔画数阈值的笔画归为点笔画数，将笔画点数大于等于点笔画数阈值小于等于主体笔画数阈值的笔画归为附加笔画；其中点笔画数阈值一般取归一化单词宽度的1/10；

(2-4)、提取主体笔画的方向线素特征；方向线素特征是一种普遍应用于手写文字识别中的特征提取算法，在汉字的识别中取得了较理想的效果。在维文手写词的识别中，我们发现，维文手写词具有大量的方向信息，采用这种方向特征的算法正为合适；而提取主体笔画的方向线素特征的方法采用现有技术中的常规方法，本实施例建议采用8方向线素特征；八方向的方向线素特征提取，具体步骤讲解如下：

(2-4-1)、根据相邻坐标点的关系，计算每一个采样坐标点在标准方向上的方向特征：

对于主体笔画点列中的每一个采样点P_j＝(x_j,y_j)，其方向向量定义为：

对采样点P_i的方向向量做垂直投影，使其映射到最近邻的两个标准方向上，投影分量分别记为其中，的特征值大小表示为的特征值大小表示为

如果P_j＝(x_j,y_j)是中间点，可由式(4-2)计算得出：

a_{j}^{1} = \frac{\max (d_{x}, d_{y})}{s}

a_{j}^{2} = \frac{\sqrt{2}}{2} \cdot \frac{(d_{x} + d_{y})}{s}

在上式中，d_x＝|x_j+1-x_j-1|，d_y＝|y_j+1-y_j-1|，

如若P_j＝(x_j,y_j)不是中间点，只需对d_x,d_y的计算稍作修改；

P_j点投影到哪两个标准方向上是根据x，y坐标的具体数值所决定的，其公式如下：

由此，即可得到每个笔画采样点的方向特征；P_j点的方向特征

f = {a_{j}^{1}, 0,0,0,

0,0,0, a_{j}^{2}};

(2-4-2)、划分网格，统计网格内每个像素点的方向线素特征：

将维文手写词图像划分成8×8的弹性网格，，然后统计每个网格内所有像素点的方向特征，得到网格方向线素特征；

假设某个网格中的像素点为N，那么就可得到了N个8维的方向特征f₁,f₂,…,f_N；然后我们把得到的N个特征向量进行每个分量上的累加如下式，就得出了这个网格的方向线素特征向量F＝(a¹,a²,a³,a⁴,a⁵,a⁶,a⁷,a⁸)。

\{\begin{matrix} F . a^{1} = Σ_{i = 1}^{N} f_{i} \cdot a^{1} \\ F . a^{2} = Σ_{i = 1}^{N} f_{i} . a^{2} \\ . \\ . \\ . \\ F . a^{8} = Σ_{i = 1}^{N} f_{i} . a^{8} \end{matrix}

(2-4-3)、降维处理，得到方向线素特征

网格方向线素特征是8×8×8＝512维的特征向量，在后续的处理中显得维数较高，所以需要降维处理。本文采用的是利用权值矩阵进行采样的降维处理。权值矩阵如式(4-6)所示。

[\begin{matrix} 1 & 2 & 1 \\ 2 & 4 & 2 \\ 1 & 2 & 1 \end{matrix}]

降维步骤是，在采样之前，需要对8×8网格，扩充一行和一列，变成9×9网格，然后再进行降维处理，最终得到的维文单词主体笔画的方向线素特征方向线素特征的维数是4×4×8＝128维；

(2-5)、提取附加笔画的旋转方向码，具体方法为：

根据对维文单词的观察，维吾尔文单词附加部分的旋转方向比较规则，在一个笔画内，旋转方向一般不会超过3种，分别是直线方向、顺时针方向和逆时针方向，依书写顺序将附加笔画所有坐标连接起来得到一条曲线，根据曲线的走向提取旋转方向码：将手写区域的横、纵坐标的变化趋势分成四种状态：(1)Δx≥0,Δy≥0；(2)Δx≤0,Δy≥0；(3)Δx≤0,Δy≤0；(4)Δx≥0,Δy≤0；当笔画走向为顺时针时，旋转方向码特征为 (1)→(2)→(3)→(4)→(1)；当笔画走向为逆时针时，旋转方向码特征为(1)→(4)→(3)→(2)→(1)；当笔画为直线时，旋转方向码特征为(1)→(1)→(1)→(1)→(1)；

(2-6)、提取点笔画的各类点数目特征，具体方法为：

定义点笔画的点数目特征为7位：特征前三位表示基线上一点的个数、基线上两点的个数、基线上三点的个数；特征后四位分别表示基线下一点的个数、基线下水平两点的个数、基线下垂直两点的个数、基线下三点的个数，分别统计各类点形式的个数即形成各类点数目特征。具体步骤为：

a)、笔画分解后，根据点笔画y方向上的最大值、最小值与基线相比较来确定点笔画与基线关系，设点笔画y方向上的最大值为y_max、最小值为y_min，基线位置为y_baseline，若y_max<y_baseline，则点笔画位于基线的上方，若y_min>y_baseline，则点笔画位于基线的下方；

b)、取每个点笔画坐标序列的中间点的x值，比较两个相邻点笔画的x值，当它们小于一定阈值的时候，则认为相邻的点笔画为同一个点类别；

c)统计各类别点的个数形成各类点数目特征；

步骤3，将预处理后的维文单词的时间坐标序列映射为二维图像，得到维文单词的梯度特征；本实施例中采用的是Sobel算法提取维文单词图像的梯度特征，利用Sobel算法提取图像的梯度特征为常规技术，为了便于理解，先将Sobel算法提取图像的梯度特征的详细过程描述如下：

3-1)、划分弹性网格：根据笔画密度函数，将维文单词图像划分8×8弹性网格，笔画密度密集的区域网格密，笔画密度不密集的区域网格疏；

3-2)、提取每个像素的梯度方向矢量；参照图4的Sobel算子对每个像素点提取水平方向梯度值g_x和垂直方向梯度值g_y，并将这两个梯度值看成是一个梯度矢量g的水平和垂直分量，即g＝[g_x,g_y]^T；

3-3)、分解每个像素的梯度方向矢量，参照图5的八个标准方向，每个方向间隔为π/4，梯度矢量g按照平行四边形的法则分解到距离该矢量最近的两个标准方向上，分解后的梯度方向特征值表示为g₁,g₂；只有两个方向上有投影值，其余方向上为0，则8个方向上的值组成的向量就是每个像素的梯度特征；

3-4)、提取梯度特征：统计8×8弹性网格每个网格内的每个像素的梯度向量，这样就得到8×8×8＝512维的梯度特征；

3-5)、降维：由于需要对提取的特征向量进行隔点加权采样，完成降维处理，所以将8×8的网格扩展到9×9，对网格分别补充一行和一列，并将原来网格的最后一行和一列的特征赋给其后面新增加的行和列，使用采样权值矩阵

[\begin{matrix} 1 & 2 & 1 \\ 2 & 4 & 2 \\ 1 & 2 & 1 \end{matrix}]

对9×9网格的特征向量进行加权和，将其变成4×4的网格，并得到4×4网格的特征向量，参见图6所示；

经过上述步骤得到的维文单词图像的梯度特征为4×4×8＝128维；

步骤4，将步骤2得到的笔画结构特征和步骤3的得到的梯度特征进行融合，得到维文单词图像的特征向量；

设Z是融合特征向量，X(x₁,x₂,…,x_n)是步骤2得到的笔画结构特征，Y(y₁,y₂,…,y_n)是步骤3的得到的梯度特征，则Z＝αX||βY，即Z＝(αx₁,αx₂,…,αx_n,βy₁,βy₂,…,βy_n)；α是笔画结构特征的权重系数，β是梯度特征的权重系数，分别代表笔画结构特征和梯度特征对新特征的贡献程度，且α＝10，β＝0.1，得到维文单词的特征向量；

步骤5，根据训练样本预先得到的特征向量库，使用欧氏距离分类器对步骤4得到维文单词的特征向量在特征向量库中进行分类识别，得到分类识别结果。

为了验证本发明提供方法的可行性，先对3套500类维文单词库进行划分，将其2套作为训练样本库，剩余的1套作为识别样本库，3套500类手写维文单词库是基于移动终端即手机平台采集由维吾尔族人无约束性手写的维文单词库；使用2套训练样本库进行训练，得到500类手写体维吾尔单词训练特征库；参照手写体维吾尔单词训练特征库，采用欧式距离分类器，计算识别单词与每个单词模版(500类)的特征距离，以最小距离准则输出识别结果。

本发明所述的手写维吾尔文单词识别方法的效果，可通过如下实验测试进一步说明：

本发明是使用移动终端即手机平台采集的维吾尔族人无约束性手写的单词库，在个人电脑上(Intel酷睿i5处理器2450M，内存4GB，主频2.5GHZ)进行了维文单词识别的实验。实验采用三种算法，第一种算法采用笔画结构特征向量，笔画结构特征向量参考文献(万芳.联机手写维吾尔文字识别技术的研究与实现.新疆大学硕士学位论文(2007):45-49.)；第二种算法采用梯度特征向量，梯度特征参考文献(G.Srikantan,S.W.Lam, S.N.Srihari.Gradient-based contour encoder for character recognition[J].Pattern Recognition,1997,29(7):1147-1160.)；第三种算法采用本发明提出的手写维吾尔文单词识别方法。三种算法均采用欧氏距离分类器。三种算法对所有识别样本的平均识别率为：算法一的平均识别率为75.2％，算法二的平均识别率为62.6％，算法三的平均识别率为80.9％。对比算法一、算法二和算法三的平均识别率可知，本发明所提出的方法平均识别率较高，能够有效地抑制“倒笔画现象”使得识别率降低的问题。

综上所述，本发明的手写维吾尔文单词识别方法，首先通过裁剪、归一化、平滑处理、倾斜校正和插值重采样方法对手写维文单词预处理，接着提取维文单词的联机笔画结构特征和脱机梯度特征，然后将两者特征进行串行融合，最后采用欧式距离分类器进行分类识别，得到识别结果。本方法具有算法性能好、实时性强、可靠性高、识别率高等优点，主要应用于移动终端上实现手写维文识别，为维文的信息化处理提供了一种新的方法，开辟了新的应用途径。

Claims

1.一种手写维吾尔文单词识别方法，其特征在于包括如下处理过程：

步骤1、对采集到的手写维文单词进行预处理；

2.根据权利要求1所述的手写维吾尔文单词识别方法，其特征在于：手写维吾尔文单词预处理过程包括：

(1-4)、对(1-3)处理后的手写维文单词图像进行倾斜校正；

3.根据权利要求1所述的手写维吾尔文单词识别方法，其特征在于：所述步骤2的处理过程为：

(2-1)、根据维吾尔文单词的特点和对维吾尔文单词的字形分析，将维吾尔文单词拆分为3类笔画：主体笔画、点笔画和附加笔画，其中，沿着基线书写的笔画称为主体笔画，点笔画为基线上方或下方的点，基线上方的变音符号则为附加笔画；

(2-2)、找出步骤1预处理后的维文单词中的主体笔画：

(2-2-4)、将终始点趋于闭合的笔画也归位主体笔画；

(2-4)、提取主体笔画的方向线素特征；

(2-5)、提取附加笔画的旋转方向码特征；

(2-6)、提取点笔画的各类点数目特征；

4.根据权利要求3所述的手写维吾尔文单词识别方法，其特征在于：所述(2-5)中提取附加笔画的旋转方向码特征的具体方法为：依书写顺序将附加笔画所有坐标连接起来得到一条曲线，根据曲线的走向提取旋转方向码：将手写区域的横、纵坐标的变化趋势分成四种状态：(1)Δx≥0,Δy≥0；(2)Δx≤0,Δy≥0；(3)Δx≤0,Δy≤0；(4)Δx≥0,Δy≤0，当笔画走向为顺时针时，旋转方向码特征为(1)→(2)→(3)→(4)→(1)；当笔画走向为逆时针时，旋转方向码特征为(1)→(4)→(3)→(2)→(1)；当笔画为直线时，旋转方向码特征为(1)→(1)→(1)→(1)→(1)。

5.根据权利要求3所述的手写维吾尔文单词识别方法，其特征在于：所述(2-6)中提取点笔画的各类点数目特征的具体方法为：定义点笔画的点数目特征为7位：特征前三位表示基线上一点的个数、基线上两点的个数、基线上三点的个数；特征后四位分别表示基线下一点的个数、基线下水平两点的个数、基线下垂直两点的个数、基线下三点的个数，分别统计各类点形式的个数即形成各类点数目特征。

6.根据权利要求1所述的手写维吾尔文单词识别方法，其特征在于：所述步骤3采用Sobel算法提取维文单词的梯度特征。

7.根据权利要求1所述的手写维吾尔文单词识别方法，其特征在于：所述步骤4中，设Z是融合后维文单词图像的特征向量，X(x₁,x₂,…,x_n)是步骤2得到的笔画结构特征，Y(y₁,y₂,…,y_n)是步骤3的得到的梯度特征，则Z＝αX||βY；即Z＝(αx₁,αx₂,…,αx_n,βy₁,βy₂,…,βy_n)；α是笔画结构特征的权重系数，β是梯度特征的权重系数，分别代表笔画结构特征和梯度特征对新特征的贡献程度，且α＝10，β＝0.1。