CN108537216A

CN108537216A - 一种面向复杂纳西东巴象形文字的识别方法

Info

Publication number: CN108537216A
Application number: CN201810289223.2A
Authority: CN
Inventors: 徐小力; 吴国新; 刘秀丽; 丁春艳
Original assignee: Beijing Information Science and Technology University
Current assignee: Beijing Information Science and Technology University
Priority date: 2018-04-03
Filing date: 2018-04-03
Publication date: 2018-09-14

Abstract

本发明涉及一种面向复杂纳西东巴象形文字的识别方法，其步骤：对纳西东巴象形文字进行特征提取；根据纳西东巴象形文字的特点，提取东巴象形文字的5类拓扑特征值：块数a、孔数b、端点个数c、三叉点数d和四叉点数e，将东巴象形文字以拓扑特征码abcde表示。对东巴象形文字进行特征提取后，每个待识别的东巴文样本都形成了数据特征，采用多级识别的方法对东巴文进行智能识别。本发明能有效解决纳西经典古籍因笔画复杂、年代久远、笔迹不清导致的识别困难问题。本发明可以广泛在文字识别领域中应用。

Description

一种面向复杂纳西东巴象形文字的识别方法

技术领域

本发明涉及一种象形文字识别方法，特别是关于一种面向复杂纳西东巴象形文字的识别方法。

背景技术

东巴象形文是由居住于我国云南、四川和西藏文化交界地带丽江的纳西族人民发明使用的一种象形文字。东巴象形文是当今世界唯一活着的象形文字，仍被人们使用。象形文字是一种具有表意和表音双重特点的图画象形文字，90％为通过绘画来进行描述，但与图画之栩栩如生求其美感而有差别，而是根据用单一的笔划来表达物体的轮廓、对象、意义。东巴象形文也是纳西文化特征之一，纳西文化随着纳西族人信奉的宗教——东巴教的盛行而迅速崛起。在东巴教中，东巴祭祀主持各种祭祀活动，并且将东巴象形文字书写成经书记录下来，从此东巴象形文字以经文的形式传承下来。纳西象形文字不仅是中华民族历史文化长河中的一颗明珠，也是世界历史文化中的瑰宝，受到了国内外的专家和学者的广泛关注。

在运用现代化技术手段对纳西东巴象形文字进行保护的过程中，大量的纳西东巴文古籍、文献和资料需用计算机进行保存、处理和利用，其识别存在较大困难，急需一种方法来识别复杂的纳西东巴象形文字，为东巴经典古籍的释读奠定基础。

发明内容

针对上述问题，本发明的目的是提供一种面向复杂纳西东巴象形文字的识别方法，其能有效解决纳西经典古籍因笔画复杂、年代久远、笔迹不清导致的识别困难问题。

为实现上述目的，本发明采取以下技术方案：一种面向复杂纳西东巴象形文字的识别方法，其特征在于包括以下步骤：1)对纳西东巴象形文字进行特征提取；2)对东巴象形文字进行特征提取后，每个待识别的东巴文样本都形成了数据特征，采用多级识别的方法对东巴文进行智能识别。

进一步，所述步骤1)中，根据纳西东巴象形文字的特点，提取东巴象形文字的5类拓扑特征值：块数a、孔数b、端点个数c、三叉点数d和四叉点数e，将东巴象形文字以拓扑特征码abcde表示。

进一步，将所有5类拓扑特征值的特征数大于9的统一标记为9。

进一步，所述步骤1)中，对于具有相同结构特征的东巴象形文字提取其网格特征。

进一步，所述网格特征提取步骤如下：①设东巴象形文字点阵为m×n，将东巴象形文字图像分为m×n个网格；其中，m表示每个东巴象形文字图像网格的总行数，n表示每个东巴象形文字图像网格的总列数；②计算每个网格中的有效像素p_ij，i为行数，j为列数；③计算东巴象形文字总有效像素④计算每个网格中的黑色像素数占整个东巴象形文字有效像素的比例a_ij＝p_ij*100/P，得到特征向量组p：

则特征向量组p即为东巴象形文字的网格特征。

进一步，所述步骤2)中，具体识别步骤如下：2.1)根据拓扑特征码将东巴象形文字进行粗分类，分类后的东巴象形文字与现有东巴象形文字模板库进行匹配，则部分东巴象形文字能进行唯一性识别后输出；2.2)对于粗分类未唯一识别出的东巴文字，根据提取的网格特征，采取模板匹配的方法计算模板东巴文字与待识别东巴文字样本的相似性，得到两者的相关值,并采用遍历的搜索算法得到相关值R，相关值R为最大值时则判定模板东巴文字与待识别东巴文字样本相似程度最高，输出该识别结果；2.3)仍未被识别的东巴象形文字采用BP神经网络进行识别。

进一步，所述步骤2.2)中，相关值R为:

式中，S(i,j)为模板东巴文字的特征向量；T(i,j)为待识别东巴文字样本的特征向量；为模板东巴文字特征向量的平均值，为待识别东巴文字样本特征向量的平均值，

进一步，所述步骤2.3)中，BP神经网络识别步骤为：2.3.1)建立3层BP神经网络，用最小随机数进行权值初始化；2.3.2)将待识别的东巴象形文字作为训练集，从训练集中得到一个训练样本X，令期望输出为D；2.3.3)计算输出层的输出Z：

式中，l为隐层结点数，H_c为隐层输出，ω_ck为隐层到输出层的权重，b_k为隐层到输出层的偏置；2.3.4)计算输出层的输出误差E；2.3.5)更新输入层到隐层的权值：

式中，ω′_hc是更新后输入层到隐层的权值，ω_hc是更新前输入层到隐层的权值，η是学习速率，e_k＝D-Z；2.3.6)更新隐层到输出层权值ω'_ck；2.3.7)在更新完全部权值后对训练样本重新计算输出，并计算其与期望输出的误差，直到该误差小于预先设定的阈值，完成对该BP神经网络的训练，否则返回步骤步骤2.3.2)；2.3.8)将待识别的东巴文字特征向量输入训练好的BP神经网络，输出识别结果。

进一步，所述输出层的输出误差E为：

其中，q为输出层节点个数。

进一步，所述更新隐层到输出层权值ω'_ck为：

ω'_ck＝ω_ck+ηH_ce_k。

本发明由于采取以上技术方案，其具有以下优点：1、本发明采用同时提取纳西东巴象形文字的拓扑特征和网格特征，进而全面提取了文字特征，以提高识别准确度。2、本发明将粗分类法、模板匹配识别法和BP神经网络识别法结合起来，采用多级识别的方法对东巴文进行智能识别，有效提高了识别的准确率，克服现有技术识别困难问题。综上所述，本发明可以广泛在文字识别领域中应用。

附图说明

图1是本发明的整体流程示意图；

图2是本发明的东巴象形文字拓扑结构示意图；

图3是本发明的可根据黑色像素区分的东巴文示意图。

具体实施方式

下面结合附图和实施例对本发明进行详细的描述。

如图1所示，本发明提供一种面向复杂纳西东巴象形文字的识别方法，其包括以下步骤：

1)对纳西东巴象形文字进行特征提取。

1.1)根据纳西东巴象形文字的特点，以方国瑜《纳西象形文字谱》为蓝本，提取东巴象形文字的5类拓扑特征值：块数a(即图论中的连通体个数)、孔数b、端点个数c(度数为1的点数)、三叉点数d(度数为3的点数)和四叉点数e(度数为4的点数)，将东巴象形文字以拓扑特征码abcde表示。

将所有以上五种特征数大于9的统一标记为9。

例如，如图2所示，图中圆圈○表示端点，方框□表示叉点，箭头→表示块，×表示孔。左图是一个代表“晒太阳”意思的东巴象形文字，右图说明了上述拓扑特征的含义。由图中的统计结果可以得出该东巴象形文中共有2个块，7个孔、8个端点、14个三叉点、2个四叉点，此象形文字的特征码为27892。

1.2)由于一些东巴象形文字具有相同的结构特征，只是在某部分区域中黑色像素的填充程度不同，如图3所示。故对于具有相同结构特征的东巴象形文字提取其网格特征，具体步骤如下：

①设东巴象形文字点阵为m×n，将东巴象形文字图像分为m×n个网格；其中，m表示每个东巴象形文字图像网格的总行数，n表示每个东巴象形文字图像网格的总列数。

②计算每个网格中的有效像素p_ij，i为行数，j为列数；

③计算东巴象形文字总有效像素

④计算每个网格中的黑色像素数占整个东巴象形文字有效像素的比例a_ij＝p_ij*100/P，得到特征向量组p：

则特征向量组p即为东巴象形文字的网格特征。

2)对东巴象形文字进行特征提取后，每个待识别的东巴文样本都形成了数据特征，采用多级识别的方法对东巴文进行智能识别。

具体识别步骤如下：

2.1)根据拓扑特征码将东巴象形文字进行粗分类，分类后的东巴象形文字与现有东巴象形文字模板库进行匹配，则近一半的东巴象形文字可以进行唯一性识别，识别出的东巴象形文字输出识别结果。

2.2)对于粗分类未唯一识别出的东巴文字，根据提取的网格特征，采取模板匹配的方法计算模板东巴文字与待识别东巴文字样本的相似性，得到两者的相关值,并采用遍历的搜索算法得到相关值R，相关值R为最大值时则判定模板东巴文字与待识别东巴文字样本相似程度最高，输出该识别结果。其中，相关值R为:

2.3)仍未被识别的东巴象形文字采用BP神经网络进行识别。具体步骤如下：

2.3.1)建立3层BP神经网络，用最小随机数进行权值初始化。

2.3.2)将待识别的东巴象形文字作为训练集，从训练集中得到一个训练样本X，令期望输出为D。

2.3.3)计算输出层的输出Z：

式中，l为隐层结点数，H_c为隐层输出，ω_ck为隐层到输出层的权重，b_k为隐层到输出层的偏置。

2.3.4)计算输出层的输出误差E：

式中，q为输出层节点个数。

2.3.5)更新输入层到隐层的权值：

式中，ω′_hc是更新后输入层到隐层的权值，ω_hc是更新前输入层到隐层的权值，η是学习速率，e_k＝D-Z。

2.3.6)更新隐层到输出层权值ω'_ck：

ω'_ck＝ω_ck+ηH_ce_k。

2.3.7)在更新完全部权值后对训练样本重新计算输出，并计算其与期望输出的误差，直到该误差小于预先设定的阈值，完成对该BP神经网络的训练，否则返回步骤步骤2.3.2)。

2.3.8)将待识别的东巴文字特征向量输入训练好的BP神经网络，输出识别结果。

上述各实施例仅用于说明本发明，各部件的结构、尺寸、设置位置及形状都是可以有所变化的，在本发明技术方案的基础上，凡根据本发明原理对个别部件进行的改进和等同变换，均不应排除在本发明的保护范围之外。

Claims

1.一种面向复杂纳西东巴象形文字的识别方法，其特征在于包括以下步骤：

1)对纳西东巴象形文字进行特征提取；

2.如权利要求1所述识别方法，其特征在于：所述步骤1)中，根据纳西东巴象形文字的特点，提取东巴象形文字的5类拓扑特征值：块数a、孔数b、端点个数c、三叉点数d和四叉点数e，将东巴象形文字以拓扑特征码abcde表示。

3.如权利要求2所述识别方法，其特征在于：将所有5类拓扑特征值的特征数大于9的统一标记为9。

4.如权利要求1至3任一项所述识别方法，其特征在于：所述步骤1)中，对于具有相同结构特征的东巴象形文字提取其网格特征。

5.如权利要求4所述识别方法，其特征在于：所述网格特征提取步骤如下：

①设东巴象形文字点阵为m×n，将东巴象形文字图像分为m×n个网格；其中，m表示每个东巴象形文字图像网格的总行数，n表示每个东巴象形文字图像网格的总列数；

②计算每个网格中的有效像素p_ij，i为行数，j为列数；

③计算东巴象形文字总有效像素

则特征向量组p即为东巴象形文字的网格特征。

6.如权利要求5所述识别方法，其特征在于：所述步骤2)中，具体识别步骤如下：

2.1)根据拓扑特征码将东巴象形文字进行粗分类，分类后的东巴象形文字与现有东巴象形文字模板库进行匹配，则部分东巴象形文字能进行唯一性识别后输出；

2.2)对于粗分类未唯一识别出的东巴文字，根据提取的网格特征，采取模板匹配的方法计算模板东巴文字与待识别东巴文字样本的相似性，得到两者的相关值,并采用遍历的搜索算法得到相关值R，相关值R为最大值时则判定模板东巴文字与待识别东巴文字样本相似程度最高，输出该识别结果；

2.3)仍未被识别的东巴象形文字采用BP神经网络进行识别。

7.如权利要求6所述识别方法，其特征在于：所述步骤2.2)中，相关值R为:

8.如权利要求6所述识别方法，其特征在于：所述步骤2.3)中，BP神经网络识别步骤为：

2.3.1)建立3层BP神经网络，用最小随机数进行权值初始化；

2.3.2)将待识别的东巴象形文字作为训练集，从训练集中得到一个训练样本X，令期望输出为D；

2.3.3)计算输出层的输出Z：

式中，l为隐层结点数，H_c为隐层输出，ω_ck为隐层到输出层的权重，b_k为隐层到输出层的偏置；

2.3.4)计算输出层的输出误差E；

2.3.5)更新输入层到隐层的权值：

式中，ω′_hc是更新后输入层到隐层的权值，ω_hc是更新前输入层到隐层的权值，η是学习速率，e_k＝D-Z；

2.3.6)更新隐层到输出层权值ω'_ck；

2.3.7)在更新完全部权值后对训练样本重新计算输出，并计算其与期望输出的误差，直到该误差小于预先设定的阈值，完成对该BP神经网络的训练，否则返回步骤步骤2.3.2)；

9.如权利要求8所述识别方法，其特征在于：所述输出层的输出误差E为：

其中，q为输出层节点个数。

10.如权利要求8所述识别方法，其特征在于：所述更新隐层到输出层权值ω'_ck为：

ω'_ck＝ω_ck+ηH_ce_k。