CN104850870B - 基于稀疏变换的手写体数字识别方法 - Google Patents

基于稀疏变换的手写体数字识别方法 Download PDF

Info

Publication number
CN104850870B
CN104850870B CN201510230301.8A CN201510230301A CN104850870B CN 104850870 B CN104850870 B CN 104850870B CN 201510230301 A CN201510230301 A CN 201510230301A CN 104850870 B CN104850870 B CN 104850870B
Authority
CN
China
Prior art keywords
matrix
transformation
data
transformation matrix
sparse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510230301.8A
Other languages
English (en)
Other versions
CN104850870A (zh
Inventor
梁军利
叶欣
贾薇
李敏
范文
于国阳
柯婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian University of Technology
Original Assignee
Xian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University of Technology filed Critical Xian University of Technology
Priority to CN201510230301.8A priority Critical patent/CN104850870B/zh
Publication of CN104850870A publication Critical patent/CN104850870A/zh
Application granted granted Critical
Publication of CN104850870B publication Critical patent/CN104850870B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于稀疏变换的手写体数字识别方法,首先对读入的训练数据进行预处理,其次将预处理后的训练数据经过目标函数训练得到变换矩阵W,再次待测数据经过稀疏变换得到稀疏表示系数x′,最后基于最近邻准则,将待测数据的稀疏表示系数x′与各类类标签进行比较,找出与待测样本最相似的类标签,并将待测样本归为该类标签所属的类中,完成手写数字的识别。本发明基于稀疏变换的手写体数字识别方法,待测数据经过稀疏变换后具有稀疏性,计算简便,提高了运行效率。

Description

基于稀疏变换的手写体数字识别方法
技术领域
本发明属于模式识别技术领域,具体涉及一种基于稀疏变换的手写体数字识别方法。
背景技术
随着信息网络的推广,有大量的数据要输入计算机网络。而且在现代的信息社会,方方面面都要与数字打交道。手写数字识别作为模式识别的一个重要分支,在邮政、税务、交通、金融等行业的实践活动中有着及其广泛的应用,不仅如此,手写体数字识别在一些大规模数据统计,如行业年检、人口普查等需要耗费大量人力和物力的领域也可以进行应用。
对识别或分类来说,数据表示需要突出显著特征,而实际中,数字采样过程会造成数据信息的冗余,给分析带来很大不便,因此需要简化信号表示。自然信号或图像普遍具有稀疏性,近年来基于稀疏模型的信号表示方法在许多信号和图像的处理与表示中均取得了很好的效果,因此这里利用稀疏变换可以简化信号的特点,将稀疏模型与识别技术相结合,得到基于稀疏变换的识别方法。
发明内容
本发明的目的是提供一种基于稀疏变换的手写体数字识别方法,解决了现有技术中存在的数字采用过程造成的数据信息冗余的问题。
本发明所采用的技术方案是,一种基于稀疏变换的手写体数字识别方法,具体按照以下步骤实施:
步骤1、读入训练数据,然后对读入的数据进行预处理,并且初始化参数λ1、λ2、λ3、C、Y、Q;
步骤2、基于步骤1中的训练数据,经过目标函数训练得到变换矩阵W;
步骤3、将步骤2得到的变换矩阵W与待测数据y′相乘,得到待测数据y′的稀疏表示系数x′;
步骤4、将步骤3中得到的稀疏表示系数x′分别与第i类的类标签qi,i=1,...,C进行比较,并分别计算欧式距离;依据最近邻原理,待测数据y′归入到与其欧式距离最小的类标签所属的类中,完成手写数字的识别。
本发明的特点还在于,
步骤1中对读入数据的预处理及参数初始化,具体步骤为:
将读入的大小为S×N的二维数字图像训练数据转化为SN×1的一维向量,并将转化后的训练数据按列排放成矩阵形式,训练数据中属于同一类的数据排放在一起,训练数据构成矩阵Y=[Y1,Y2,...YC],其中Yi表示第i类的所有数据,i=1,2,...C;
样本类别数C=10;
Q=[Q1,Q2,...Qi,...QC]为类标签矩阵,表示训练数据的类别信息;其中Qi=[qi,...,qi],i=1,...,C,Qi的列数和Yi的列数相等;
λ1、λ2、λ3均初始化为常量。
类标签矩阵Q的形式如下:
类标签矩阵Q中每列的非零元素个数与T0大小相同,类标签矩阵Q的列数与训练数据总个数相同,类标签矩阵Q的行数要大于或等于训练数据维数;
其中T0表示稀疏度,即向量x中非零元素的最大个数。
步骤2中目标函数为:
其中,W=[w1,w2,...wM]T表示变换矩阵;X=[X1,X2,...XC]表示所有训练数据的稀疏系数矩阵,其中Xi表示第i类训练数据的稀疏系数矩阵,i=1,2,...C,向量x表示矩阵X中任意一列;
所述步骤2中训练得到变换矩阵W的具体步骤为:
步骤2.1、将变换矩阵W初始化为M×SN的随机矩阵;
步骤2.2、将变换矩阵W视为已知量,固定变换矩阵W的值,更新稀疏系数X:
去掉式(1)中不含稀疏系数X的项,式(1)简化为如下形式:
然后依次对Xi进行更新,i=1,2...C,式(2)可写为
其中a=1+λ1-(C-1)λ2
Xi的解为保留每列中绝对值最大的T0个元素,其它元素置为0,满足目标函数中稀疏系数X每列的稀疏度为T0,从而满足Xi的稀疏性,得到稀疏系数X;
步骤2.3、将步骤2.2中得到的稀疏系数X视为已知量,固定稀疏系数X的值,更新变换矩阵W:
去掉式(1)中不含变换矩阵W的项,式(1)简化为如下形式:
分别对变换矩阵W的第m行依次进行更新,m=1,2...M,可得下式:
其中Xm表示稀疏系数X的第m行,
式(5)对wm求导,令导数为零可得:
由式(6)可求得wm的解为:
wm间迭代更新直至收敛,m=1,2...M,得到变换矩阵W;
步骤2.4、将步骤2.3得到的变换矩阵W视为已知量,转到步骤2.2,直至稀疏系数X、变换矩阵W均收敛,迭代更新结束,得到收敛的变换矩阵W即为步骤2中经过目标训练得到的变换矩阵W。
本发明的有益效果是:本发明基于稀疏变换的手写体数字识别方法,待测数据经过稀疏变换后具有稀疏性,计算简便,提高了运行效率,同时要求稀疏变换后同类尽可能相似,异类尽可能不同,从而达到良好的识别率。
附图说明
图1是USPS数据库图示;
图2是本发明中识别率随稀疏度T0的变换示意图。
具体实施方式
下面结合附图和具体实施方式对本发明进行详细说明。
本发明基于稀疏变换的手写体数字识别方法,采用USPS数据库,该数据库是从美国邮件信封上提取的手写体邮政编码,共十类。图像大小为16×16,每个像素的灰度值范围是0-255,如图1所示。该数据库包括5000个训练数据和2007个测试数据,训练数据按类别排放,测试数据随机排放,各类所含样本数的分布如表1所示:
表1训练数据和测试数据各类所含样本数的分布
0 1 2 3 4 5 6 7 8 9 Total
Train 500 500 500 500 500 500 500 500 500 500 5000
Test 359 264 198 166 200 160 170 147 166 177 2007
从训练数据中选取2000个数据用于训练(每类200个数据,共10类),测试数据中随机选取1000个数据用于测试。
具体按照以下步骤实施:
步骤1、数据预处理及参数赋初值,具体按以下步骤实施:
读入实验数据,将大小为16×16的二维数字图像数据转化为256×1的一维向量,并将训练数据按列排放成矩阵形式,训练数据中属于同一类的样本排放在一起,构成矩阵Y=[Y1,Y2,...Y10],以便计算;根据训练数据个数及稀疏度T0(即向量x中非零元素的最大个数)决定类标签矩阵Q=[Q1,Q2,...Qi,...QC]的形式:Qi=[qi,...,qi],i=1,...,C,Qi的列数和Yi的列数相等,类标签矩阵Q中每列的非零元素个数与T0大小相同,类标签矩阵Q的列数与训练数据总个数相同,类标签矩阵Q的行数要大于或等于训练数据维数,以训练样本Y包含两类,且每类包含两个样本为例,T0=2,类标签矩阵Q表示为:
λ1、λ2、λ3均初始化为常量。
步骤2、基于步骤1中的训练数据,经过目标函数训练得到变换矩阵W,具体按以下步骤实施:
将实验训练数据Y及类标签矩阵Q代入目标函数,使用该目标函数对稀疏变换矩阵W进行训练更新。
训练变换矩阵W时使用的目标函数为:
其中,W=[w1,w2,...wM]T表示变换矩阵;X=[X1,X2,...XC]表示所有训练数据的稀疏系数矩阵,其中Xi表示第i类训练数据的稀疏系数矩阵,i=1,2,...C,向量x表示矩阵X中任意一列;
该目标函数的物理意义是通过训练求得稀疏变换矩阵W,当待测样本经过稀疏变换后得到稀疏系数X,该稀疏系数具备以下的性质:1)同类样本的稀疏系数尽可能相似,异类样本的稀疏系数尽可能不同;2)任一样本稀疏系数与其所属类的标签Q要尽可能的相似。这里要求变换后稀疏系数满足上述两点有助于提高识别的正确率。目标函数中最后一项的作用是减少变换矩阵W各行间的相关性,增加W行的多样性,以增加W的适应性,从而适应不同样本,该函数求解步骤如下:
求解时需对W与X进行交替迭代更新,即固定其中一个值,更新另一个值,不断交替迭代,直至收敛,具体步骤为:
步骤2.1、将变换矩阵W初始化为M×SN的随机矩阵;
步骤2.2、将变换矩阵W视为已知量,固定变换矩阵W的值,更新稀疏系数X:
去掉式(1)中不含稀疏系数X的项,式(1)简化为如下形式:
然后依次对Xi进行更新,i=1,2...C,式(2)可写为
其中a=1+λ1-(C-1)λ2
Xi的解为保留每列中绝对值最大的T0个元素,其它元素置为0,满足目标函数中稀疏系数X每列的稀疏度为T0,从而满足Xi的稀疏性,得到稀疏系数X;
步骤2.3、将步骤2.2中得到的稀疏系数X视为已知量,固定稀疏系数X的值,更新变换矩阵W:
去掉式(1)中不含变换矩阵W的项,式(1)简化为如下形式:
分别对变换矩阵W的第m行依次进行更新,m=1,2...M,可得下式:
其中Xm表示稀疏系数X的第m行,
式(5)对wm求导,令导数为零可得:
由式(6)可求得wm的解为:
wm间迭代更新直至收敛,m=1,2...M,得到变换矩阵W;
步骤2.4、将步骤2.3得到的变换矩阵W视为已知量,转到步骤2.2,直至稀疏系数X、变换矩阵W均收敛,迭代更新结束,得到收敛的变换矩阵W即为步骤2中经过目标训练得到的变换矩阵W。
步骤3、待测数据y′经过稀疏变换,具体按以下步骤实施:
将步骤2得到的变换矩阵W与待测数据y′相乘,即对待测数据y′进行稀疏变换,得到待测数据y′的稀疏表示系数x′;
步骤4、基于最近邻原理,判断待测数据y′所属类别,具体按以下步骤实施:
将步骤3中得到的稀疏表示系数x′分别与第i类的类标签qi,i=1,...,C进行比较,并分别计算欧式距离;依据最近邻原理,待测数据y′归入到与其欧式距离最小的类标签所属的类中,完成手写数字的识别。
实验结果
实验得到识别率随稀疏度T0的变化如表2所示:
表2识别率随稀疏度T0的变化表
T0 30 32 34 36 38 40 42 44 46 48 50
识别率(%) 93 93 92.9 93 92.8 93 92.9 93 92.9 93 93
为方便与直观的比较,将表2中数据绘为图,如图2所示。
改变训练样本个数,识别率的变化如表3所示:
表3识别率随训练样本个数的变化表
训练样本个数 500 1000 1500 2000
识别率(%) 0.89 0.92 0.926 0.93
由表3可知,随着训练样本数的增加,算法准确率增加。

Claims (1)

1.一种基于稀疏变换的手写体数字识别方法,其特征在于,具体按照以下步骤实施:
步骤1、读入训练数据,然后对读入的数据进行预处理,并且初始化参数λ1、λ2、λ3、C、Y、Q;所述步骤1中对读入数据的预处理及参数初始化,具体步骤为:
将读入的大小为S×N的二维数字图像训练数据转化为SN×1的一维向量,并将转化后的训练数据按列排放成矩阵形式,训练数据中属于同一类的数据排放在一起,训练数据构成矩阵Y=[Y1,Y2,...YC],其中Yi表示第i类的所有数据,i=1,2,...C;
样本类别数C=10;
Q=[Q1,Q2,...Qi,...QC]为类标签矩阵,表示训练数据的类别信息;其中Qi=[qi,...,qi],i=1,...,C,Qi的列数和Yi的列数相等;
λ1、λ2、λ3均初始化为常量;
步骤2、基于步骤1中的训练数据,经过目标函数训练得到变换矩阵W;
所述类标签矩阵Q的形式如下:
类标签矩阵Q中每列的非零元素个数与T0大小相同,类标签矩阵Q的列数与训练数据总个数相同,类标签矩阵Q的行数要大于或等于训练数据维数;
其中T0表示稀疏度,即向量x中非零元素的最大个数;
所述步骤2中目标函数为:
其中,W=[w1,w2,...wM]T表示变换矩阵;X=[X1,X2,...XC]表示所有训练数据的稀疏系数矩阵,其中Xi表示第i类训练数据的稀疏系数矩阵,i=1,2,...C,向量x表示矩阵X中任意一列;
所述步骤2中训练得到变换矩阵W的具体步骤为:
步骤2.1、将变换矩阵W初始化为M×SN的随机矩阵;
步骤2.2、将变换矩阵W视为已知量,固定变换矩阵W的值,更新稀疏系数X:
去掉式(1)中不含稀疏系数X的项,式(1)简化为如下形式:
然后依次对Xi进行更新,i=1,2...C,式(2)可写为
其中a=1+λ1-(C-1)λ2
Xi的解为保留每列中绝对值最大的T0个元素,其它元素置为0,满足目标函数中稀疏系数X每列的稀疏度为T0,从而满足Xi的稀疏性,得到稀疏系数X;
步骤2.3、将步骤2.2中得到的稀疏系数X视为已知量,固定稀疏系数X的值,更新变换矩阵W:
去掉式(1)中不含变换矩阵W的项,式(1)简化为如下形式:
分别对变换矩阵W的第m行依次进行更新,m=1,2...M,可得下式:
其中Xm表示稀疏系数X的第m行,
式(5)对wm求导,令导数为零可得:
由式(6)可求得wm的解为:
wm间迭代更新直至收敛,m=1,2...M,得到变换矩阵W;
步骤2.4、将步骤2.3得到的变换矩阵W视为已知量,转到步骤2.2,直至稀疏系数X、变换矩阵W均收敛,迭代更新结束,得到收敛的变换矩阵W即为步骤2中经过目标训练得到的变换矩阵W;
步骤3、将步骤2得到的变换矩阵W与待测数据y′相乘,得到待测数据y′的稀疏表示系数x′;
步骤4、将步骤3中得到的稀疏表示系数x′分别与第i类的类标签qi,i=1,...,C进行比较,并分别计算欧式距离;依据最近邻原理,待测数据y′归入到与其欧式距离最小的类标签所属的类中,完成手写数字的识别。
CN201510230301.8A 2015-05-07 2015-05-07 基于稀疏变换的手写体数字识别方法 Expired - Fee Related CN104850870B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510230301.8A CN104850870B (zh) 2015-05-07 2015-05-07 基于稀疏变换的手写体数字识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510230301.8A CN104850870B (zh) 2015-05-07 2015-05-07 基于稀疏变换的手写体数字识别方法

Publications (2)

Publication Number Publication Date
CN104850870A CN104850870A (zh) 2015-08-19
CN104850870B true CN104850870B (zh) 2018-07-03

Family

ID=53850505

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510230301.8A Expired - Fee Related CN104850870B (zh) 2015-05-07 2015-05-07 基于稀疏变换的手写体数字识别方法

Country Status (1)

Country Link
CN (1) CN104850870B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107153810A (zh) * 2016-03-04 2017-09-12 中国矿业大学 一种基于深度学习的手写体数字识别方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101826161A (zh) * 2010-04-09 2010-09-08 中国科学院自动化研究所 一种基于局部近邻稀疏表示的目标识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140037199A1 (en) * 2005-04-04 2014-02-06 Michal Aharon System and method for designing of dictionaries for sparse representation

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101826161A (zh) * 2010-04-09 2010-09-08 中国科学院自动化研究所 一种基于局部近邻稀疏表示的目标识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"一种改进的稀疏表示的手写数字识别";王崇阳等;《信息技术》;20150225(第2期);第1-3节,图1 *

Also Published As

Publication number Publication date
CN104850870A (zh) 2015-08-19

Similar Documents

Publication Publication Date Title
Olgun et al. Wheat grain classification by using dense SIFT features with SVM classifier
CN107169504B (zh) 一种基于扩展非线性核残差网络的手写字符识别方法
Rashad et al. Plants images classification based on textural features using combined classifier
CN104616029B (zh) 数据分类方法及装置
CN100595780C (zh) 一种基于模块神经网络的手写体数字自动识别方法
CN103164701B (zh) 手写体数字识别方法及装置
CN103403704A (zh) 用于查找最近邻的方法和设备
CN111143567B (zh) 一种基于改进神经网络的评论情感分析方法
CN103258210A (zh) 一种基于字典学习的高清图像分类方法
Suciati et al. Batik motif classification using color-texture-based feature extraction and backpropagation neural network
Cao et al. Local information-based fast approximate spectral clustering
CN103235947A (zh) 一种手写体数字识别方法及装置
Hernández-Cano et al. A framework for efficient and binary clustering in high-dimensional space
Khalid et al. Tropical wood species recognition system based on multi-feature extractors and classifiers
CN104572930B (zh) 数据分类方法及装置
CN104850870B (zh) 基于稀疏变换的手写体数字识别方法
CN107729918B (zh) 基于代价敏感支持向量机的元胞自动机涌现现象的分类方法
CN103310217B (zh) 基于图像协方差特征的手写体数字识别方法及装置
Zhang et al. A new multi-channels sequence recognition framework using deep convolutional neural network
Enriquez et al. Convolutional neural network vs traditional methods for offline recognition of handwritten digits
CN104484869B (zh) 面向排序测度特征的图像匹配方法及系统
CN109145111B (zh) 一种基于机器学习的多特征文本数据相似度计算方法
CN111461267A (zh) 一种基于rfid技术的手势识别方法
CN105205487A (zh) 一种图片处理方法及装置
CN104573727A (zh) 一种手写体数字图像降维方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20180703

Termination date: 20210507