CN108537216A - 一种面向复杂纳西东巴象形文字的识别方法 - Google Patents
一种面向复杂纳西东巴象形文字的识别方法 Download PDFInfo
- Publication number
- CN108537216A CN108537216A CN201810289223.2A CN201810289223A CN108537216A CN 108537216 A CN108537216 A CN 108537216A CN 201810289223 A CN201810289223 A CN 201810289223A CN 108537216 A CN108537216 A CN 108537216A
- Authority
- CN
- China
- Prior art keywords
- dongba
- pictograph
- dto
- identified
- recognition methods
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种面向复杂纳西东巴象形文字的识别方法,其步骤:对纳西东巴象形文字进行特征提取;根据纳西东巴象形文字的特点,提取东巴象形文字的5类拓扑特征值:块数a、孔数b、端点个数c、三叉点数d和四叉点数e,将东巴象形文字以拓扑特征码abcde表示。对东巴象形文字进行特征提取后,每个待识别的东巴文样本都形成了数据特征,采用多级识别的方法对东巴文进行智能识别。本发明能有效解决纳西经典古籍因笔画复杂、年代久远、笔迹不清导致的识别困难问题。本发明可以广泛在文字识别领域中应用。
Description
技术领域
本发明涉及一种象形文字识别方法,特别是关于一种面向复杂纳西东巴象形文字的识别方法。
背景技术
东巴象形文是由居住于我国云南、四川和西藏文化交界地带丽江的纳西族人民发明使用的一种象形文字。东巴象形文是当今世界唯一活着的象形文字,仍被人们使用。象形文字是一种具有表意和表音双重特点的图画象形文字,90%为通过绘画来进行描述,但与图画之栩栩如生求其美感而有差别,而是根据用单一的笔划来表达物体的轮廓、对象、意义。东巴象形文也是纳西文化特征之一,纳西文化随着纳西族人信奉的宗教——东巴教的盛行而迅速崛起。在东巴教中,东巴祭祀主持各种祭祀活动,并且将东巴象形文字书写成经书记录下来,从此东巴象形文字以经文的形式传承下来。纳西象形文字不仅是中华民族历史文化长河中的一颗明珠,也是世界历史文化中的瑰宝,受到了国内外的专家和学者的广泛关注。
在运用现代化技术手段对纳西东巴象形文字进行保护的过程中,大量的纳西东巴文古籍、文献和资料需用计算机进行保存、处理和利用,其识别存在较大困难,急需一种方法来识别复杂的纳西东巴象形文字,为东巴经典古籍的释读奠定基础。
发明内容
针对上述问题,本发明的目的是提供一种面向复杂纳西东巴象形文字的识别方法,其能有效解决纳西经典古籍因笔画复杂、年代久远、笔迹不清导致的识别困难问题。
为实现上述目的,本发明采取以下技术方案:一种面向复杂纳西东巴象形文字的识别方法,其特征在于包括以下步骤:1)对纳西东巴象形文字进行特征提取;2)对东巴象形文字进行特征提取后,每个待识别的东巴文样本都形成了数据特征,采用多级识别的方法对东巴文进行智能识别。
进一步,所述步骤1)中,根据纳西东巴象形文字的特点,提取东巴象形文字的5类拓扑特征值:块数a、孔数b、端点个数c、三叉点数d和四叉点数e,将东巴象形文字以拓扑特征码abcde表示。
进一步,将所有5类拓扑特征值的特征数大于9的统一标记为9。
进一步,所述步骤1)中,对于具有相同结构特征的东巴象形文字提取其网格特征。
进一步,所述网格特征提取步骤如下:①设东巴象形文字点阵为m×n,将东巴象形文字图像分为m×n个网格;其中,m表示每个东巴象形文字图像网格的总行数,n表示每个东巴象形文字图像网格的总列数;②计算每个网格中的有效像素pij,i为行数,j为列数;③计算东巴象形文字总有效像素④计算每个网格中的黑色像素数占整个东巴象形文字有效像素的比例aij=pij*100/P,得到特征向量组p:
则特征向量组p即为东巴象形文字的网格特征。
进一步,所述步骤2)中,具体识别步骤如下:2.1)根据拓扑特征码将东巴象形文字进行粗分类,分类后的东巴象形文字与现有东巴象形文字模板库进行匹配,则部分东巴象形文字能进行唯一性识别后输出;2.2)对于粗分类未唯一识别出的东巴文字,根据提取的网格特征,采取模板匹配的方法计算模板东巴文字与待识别东巴文字样本的相似性,得到两者的相关值,并采用遍历的搜索算法得到相关值R,相关值R为最大值时则判定模板东巴文字与待识别东巴文字样本相似程度最高,输出该识别结果;2.3)仍未被识别的东巴象形文字采用BP神经网络进行识别。
进一步,所述步骤2.2)中,相关值R为:
式中,S(i,j)为模板东巴文字的特征向量;T(i,j)为待识别东巴文字样本的特征向量;为模板东巴文字特征向量的平均值, 为待识别东巴文字样本特征向量的平均值,
进一步,所述步骤2.3)中,BP神经网络识别步骤为:2.3.1)建立3层BP神经网络,用最小随机数进行权值初始化;2.3.2)将待识别的东巴象形文字作为训练集,从训练集中得到一个训练样本X,令期望输出为D;2.3.3)计算输出层的输出Z:
式中,l为隐层结点数,Hc为隐层输出,ωck为隐层到输出层的权重,bk为隐层到输出层的偏置;2.3.4)计算输出层的输出误差E;2.3.5)更新输入层到隐层的权值:
式中,ω′hc是更新后输入层到隐层的权值,ωhc是更新前输入层到隐层的权值,η是学习速率,ek=D-Z;2.3.6)更新隐层到输出层权值ω'ck;2.3.7)在更新完全部权值后对训练样本重新计算输出,并计算其与期望输出的误差,直到该误差小于预先设定的阈值,完成对该BP神经网络的训练,否则返回步骤步骤2.3.2);2.3.8)将待识别的东巴文字特征向量输入训练好的BP神经网络,输出识别结果。
进一步,所述输出层的输出误差E为:
其中,q为输出层节点个数。
进一步,所述更新隐层到输出层权值ω'ck为:
ω'ck=ωck+ηHcek。
本发明由于采取以上技术方案,其具有以下优点:1、本发明采用同时提取纳西东巴象形文字的拓扑特征和网格特征,进而全面提取了文字特征,以提高识别准确度。2、本发明将粗分类法、模板匹配识别法和BP神经网络识别法结合起来,采用多级识别的方法对东巴文进行智能识别,有效提高了识别的准确率,克服现有技术识别困难问题。综上所述,本发明可以广泛在文字识别领域中应用。
附图说明
图1是本发明的整体流程示意图;
图2是本发明的东巴象形文字拓扑结构示意图;
图3是本发明的可根据黑色像素区分的东巴文示意图。
具体实施方式
下面结合附图和实施例对本发明进行详细的描述。
如图1所示,本发明提供一种面向复杂纳西东巴象形文字的识别方法,其包括以下步骤:
1)对纳西东巴象形文字进行特征提取。
1.1)根据纳西东巴象形文字的特点,以方国瑜《纳西象形文字谱》为蓝本,提取东巴象形文字的5类拓扑特征值:块数a(即图论中的连通体个数)、孔数b、端点个数c(度数为1的点数)、三叉点数d(度数为3的点数)和四叉点数e(度数为4的点数),将东巴象形文字以拓扑特征码abcde表示。
将所有以上五种特征数大于9的统一标记为9。
例如,如图2所示,图中圆圈○表示端点,方框□表示叉点,箭头→表示块,×表示孔。左图是一个代表“晒太阳”意思的东巴象形文字,右图说明了上述拓扑特征的含义。由图中的统计结果可以得出该东巴象形文中共有2个块,7个孔、8个端点、14个三叉点、2个四叉点,此象形文字的特征码为27892。
1.2)由于一些东巴象形文字具有相同的结构特征,只是在某部分区域中黑色像素的填充程度不同,如图3所示。故对于具有相同结构特征的东巴象形文字提取其网格特征,具体步骤如下:
①设东巴象形文字点阵为m×n,将东巴象形文字图像分为m×n个网格;其中,m表示每个东巴象形文字图像网格的总行数,n表示每个东巴象形文字图像网格的总列数。
②计算每个网格中的有效像素pij,i为行数,j为列数;
③计算东巴象形文字总有效像素
④计算每个网格中的黑色像素数占整个东巴象形文字有效像素的比例aij=pij*100/P,得到特征向量组p:
则特征向量组p即为东巴象形文字的网格特征。
2)对东巴象形文字进行特征提取后,每个待识别的东巴文样本都形成了数据特征,采用多级识别的方法对东巴文进行智能识别。
具体识别步骤如下:
2.1)根据拓扑特征码将东巴象形文字进行粗分类,分类后的东巴象形文字与现有东巴象形文字模板库进行匹配,则近一半的东巴象形文字可以进行唯一性识别,识别出的东巴象形文字输出识别结果。
2.2)对于粗分类未唯一识别出的东巴文字,根据提取的网格特征,采取模板匹配的方法计算模板东巴文字与待识别东巴文字样本的相似性,得到两者的相关值,并采用遍历的搜索算法得到相关值R,相关值R为最大值时则判定模板东巴文字与待识别东巴文字样本相似程度最高,输出该识别结果。其中,相关值R为:
式中,S(i,j)为模板东巴文字的特征向量;T(i,j)为待识别东巴文字样本的特征向量;为模板东巴文字特征向量的平均值, 为待识别东巴文字样本特征向量的平均值,
2.3)仍未被识别的东巴象形文字采用BP神经网络进行识别。具体步骤如下:
2.3.1)建立3层BP神经网络,用最小随机数进行权值初始化。
2.3.2)将待识别的东巴象形文字作为训练集,从训练集中得到一个训练样本X,令期望输出为D。
2.3.3)计算输出层的输出Z:
式中,l为隐层结点数,Hc为隐层输出,ωck为隐层到输出层的权重,bk为隐层到输出层的偏置。
2.3.4)计算输出层的输出误差E:
式中,q为输出层节点个数。
2.3.5)更新输入层到隐层的权值:
式中,ω′hc是更新后输入层到隐层的权值,ωhc是更新前输入层到隐层的权值,η是学习速率,ek=D-Z。
2.3.6)更新隐层到输出层权值ω'ck:
ω'ck=ωck+ηHcek。
2.3.7)在更新完全部权值后对训练样本重新计算输出,并计算其与期望输出的误差,直到该误差小于预先设定的阈值,完成对该BP神经网络的训练,否则返回步骤步骤2.3.2)。
2.3.8)将待识别的东巴文字特征向量输入训练好的BP神经网络,输出识别结果。
上述各实施例仅用于说明本发明,各部件的结构、尺寸、设置位置及形状都是可以有所变化的,在本发明技术方案的基础上,凡根据本发明原理对个别部件进行的改进和等同变换,均不应排除在本发明的保护范围之外。
Claims (10)
1.一种面向复杂纳西东巴象形文字的识别方法,其特征在于包括以下步骤:
1)对纳西东巴象形文字进行特征提取;
2)对东巴象形文字进行特征提取后,每个待识别的东巴文样本都形成了数据特征,采用多级识别的方法对东巴文进行智能识别。
2.如权利要求1所述识别方法,其特征在于:所述步骤1)中,根据纳西东巴象形文字的特点,提取东巴象形文字的5类拓扑特征值:块数a、孔数b、端点个数c、三叉点数d和四叉点数e,将东巴象形文字以拓扑特征码abcde表示。
3.如权利要求2所述识别方法,其特征在于:将所有5类拓扑特征值的特征数大于9的统一标记为9。
4.如权利要求1至3任一项所述识别方法,其特征在于:所述步骤1)中,对于具有相同结构特征的东巴象形文字提取其网格特征。
5.如权利要求4所述识别方法,其特征在于:所述网格特征提取步骤如下:
①设东巴象形文字点阵为m×n,将东巴象形文字图像分为m×n个网格;其中,m表示每个东巴象形文字图像网格的总行数,n表示每个东巴象形文字图像网格的总列数;
②计算每个网格中的有效像素pij,i为行数,j为列数;
③计算东巴象形文字总有效像素
④计算每个网格中的黑色像素数占整个东巴象形文字有效像素的比例aij=pij*100/P,得到特征向量组p:
则特征向量组p即为东巴象形文字的网格特征。
6.如权利要求5所述识别方法,其特征在于:所述步骤2)中,具体识别步骤如下:
2.1)根据拓扑特征码将东巴象形文字进行粗分类,分类后的东巴象形文字与现有东巴象形文字模板库进行匹配,则部分东巴象形文字能进行唯一性识别后输出;
2.2)对于粗分类未唯一识别出的东巴文字,根据提取的网格特征,采取模板匹配的方法计算模板东巴文字与待识别东巴文字样本的相似性,得到两者的相关值,并采用遍历的搜索算法得到相关值R,相关值R为最大值时则判定模板东巴文字与待识别东巴文字样本相似程度最高,输出该识别结果;
2.3)仍未被识别的东巴象形文字采用BP神经网络进行识别。
7.如权利要求6所述识别方法,其特征在于:所述步骤2.2)中,相关值R为:
式中,S(i,j)为模板东巴文字的特征向量;T(i,j)为待识别东巴文字样本的特征向量;为模板东巴文字特征向量的平均值, 为待识别东巴文字样本特征向量的平均值,
8.如权利要求6所述识别方法,其特征在于:所述步骤2.3)中,BP神经网络识别步骤为:
2.3.1)建立3层BP神经网络,用最小随机数进行权值初始化;
2.3.2)将待识别的东巴象形文字作为训练集,从训练集中得到一个训练样本X,令期望输出为D;
2.3.3)计算输出层的输出Z:
式中,l为隐层结点数,Hc为隐层输出,ωck为隐层到输出层的权重,bk为隐层到输出层的偏置;
2.3.4)计算输出层的输出误差E;
2.3.5)更新输入层到隐层的权值:
式中,ω′hc是更新后输入层到隐层的权值,ωhc是更新前输入层到隐层的权值,η是学习速率,ek=D-Z;
2.3.6)更新隐层到输出层权值ω'ck;
2.3.7)在更新完全部权值后对训练样本重新计算输出,并计算其与期望输出的误差,直到该误差小于预先设定的阈值,完成对该BP神经网络的训练,否则返回步骤步骤2.3.2);
2.3.8)将待识别的东巴文字特征向量输入训练好的BP神经网络,输出识别结果。
9.如权利要求8所述识别方法,其特征在于:所述输出层的输出误差E为:
其中,q为输出层节点个数。
10.如权利要求8所述识别方法,其特征在于:所述更新隐层到输出层权值ω'ck为:
ω'ck=ωck+ηHcek。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810289223.2A CN108537216A (zh) | 2018-04-03 | 2018-04-03 | 一种面向复杂纳西东巴象形文字的识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810289223.2A CN108537216A (zh) | 2018-04-03 | 2018-04-03 | 一种面向复杂纳西东巴象形文字的识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108537216A true CN108537216A (zh) | 2018-09-14 |
Family
ID=63482460
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810289223.2A Pending CN108537216A (zh) | 2018-04-03 | 2018-04-03 | 一种面向复杂纳西东巴象形文字的识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108537216A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111325270A (zh) * | 2020-02-19 | 2020-06-23 | 南京大学 | 一种基于模板匹配和bp神经网络的东巴文识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104794455A (zh) * | 2015-05-04 | 2015-07-22 | 北京信息科技大学 | 一种东巴象形文字识别方法 |
CN104809442A (zh) * | 2015-05-04 | 2015-07-29 | 北京信息科技大学 | 一种东巴象形文字字素智能识别方法 |
CN104866117A (zh) * | 2015-06-02 | 2015-08-26 | 北京信息科技大学 | 基于图形拓扑特征进行识别的纳西东巴象形文字输入方法 |
-
2018
- 2018-04-03 CN CN201810289223.2A patent/CN108537216A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104794455A (zh) * | 2015-05-04 | 2015-07-22 | 北京信息科技大学 | 一种东巴象形文字识别方法 |
CN104809442A (zh) * | 2015-05-04 | 2015-07-29 | 北京信息科技大学 | 一种东巴象形文字字素智能识别方法 |
CN104866117A (zh) * | 2015-06-02 | 2015-08-26 | 北京信息科技大学 | 基于图形拓扑特征进行识别的纳西东巴象形文字输入方法 |
Non-Patent Citations (3)
Title |
---|
吴国新 等: "东巴经典古籍象形文字智能识别研究", 《电子测量与仪器学报》 * |
徐小力 等: "基于拓扑特征和投影法的东巴象形文识别方法研究", 《电子测量与仪器学报》 * |
杨萌 等: "东巴象形文字识别方法", 《北京信息科技大学学报》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111325270A (zh) * | 2020-02-19 | 2020-06-23 | 南京大学 | 一种基于模板匹配和bp神经网络的东巴文识别方法 |
CN111325270B (zh) * | 2020-02-19 | 2022-03-25 | 南京大学 | 一种基于模板匹配和bp神经网络的东巴文识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106778604B (zh) | 基于匹配卷积神经网络的行人再识别方法 | |
CN105512289B (zh) | 基于深度学习和哈希的图像检索方法 | |
CN106570456B (zh) | 基于全卷积递归网络的手写汉字文本识别方法 | |
CN105320965B (zh) | 基于深度卷积神经网络的空谱联合的高光谱图像分类方法 | |
CN104850845B (zh) | 一种基于非对称卷积神经网络的交通标志识别方法 | |
CN112308158A (zh) | 一种基于部分特征对齐的多源领域自适应模型及方法 | |
CN108921294A (zh) | 一种用于神经网络加速的渐进式块知识蒸馏方法 | |
CN108717569A (zh) | 一种膨胀全卷积神经网络及其构建方法 | |
CN108876796A (zh) | 一种基于全卷积神经网络和条件随机场的道路分割系统及方法 | |
CN107679462A (zh) | 一种基于小波的深度多特征融合分类方法 | |
CN106203363A (zh) | 人体骨架运动序列行为识别方法 | |
CN105205475A (zh) | 一种动态手势识别方法 | |
CN107122712B (zh) | 基于cnn和双向vlad的掌纹图像识别方法 | |
CN107103326A (zh) | 基于超像素聚类的协同显著性检测方法 | |
CN109002755B (zh) | 基于人脸图像的年龄估计模型构建方法及估计方法 | |
CN107392314A (zh) | 一种基于确定性丢弃连接的深层卷积神经网络方法 | |
CN105740790B (zh) | 基于多核字典学习的彩色人脸识别方法 | |
CN108052884A (zh) | 一种基于改进残差神经网络的手势识别方法 | |
CN104408479B (zh) | 一种基于深度局部特征描述符的海量图像分类方法 | |
CN104834941A (zh) | 基于计算机输入下的稀疏自编码的脱机手写体识别方法 | |
CN106529586A (zh) | 基于补充文本特征的图像分类方法 | |
CN110287952A (zh) | 一种维语图片字符的识别方法及系统 | |
CN104298974A (zh) | 一种基于深度视频序列的人体行为识别方法 | |
CN107491729B (zh) | 基于余弦相似度激活的卷积神经网络的手写数字识别方法 | |
CN110378208A (zh) | 一种基于深度残差网络的行为识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180914 |
|
RJ01 | Rejection of invention patent application after publication |