CN108932454A - 一种基于图片的字体识别方法、装置及电子设备 - Google Patents

一种基于图片的字体识别方法、装置及电子设备 Download PDF

Info

Publication number
CN108932454A
CN108932454A CN201710367878.2A CN201710367878A CN108932454A CN 108932454 A CN108932454 A CN 108932454A CN 201710367878 A CN201710367878 A CN 201710367878A CN 108932454 A CN108932454 A CN 108932454A
Authority
CN
China
Prior art keywords
sample
picture
wavelet
matrix
wavelet transformation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710367878.2A
Other languages
English (en)
Inventor
赵晓伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision Digital Technology Co Ltd
Hangzhou Hikvision System Technology Co Ltd
Original Assignee
Hangzhou Hikvision Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision Digital Technology Co Ltd filed Critical Hangzhou Hikvision Digital Technology Co Ltd
Priority to CN201710367878.2A priority Critical patent/CN108932454A/zh
Publication of CN108932454A publication Critical patent/CN108932454A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2132Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
    • G06F18/21322Rendering the within-class scatter matrix non-singular
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Character Discrimination (AREA)

Abstract

本发明实施例公开一种基于图片的字体识别方法、装置及电子设备,涉及文字识别技术,能够有效提升字体识别准确率。基于图片的字体识别方法包括:依据预先设置的小波变换级数,对待识别图片进行小波变换得到第一小波特征向量;依据预先通过样本计算获得的线性变换矩阵对所述第一小波特征向量进行特征变换得到第一变换特征向量;依据所述第一变换特征向量以及预先通过样本计算获得的样本字体的特征参数计算判决函数值;根据所述判决函数值,确定所述待识别图片中的所述字符的字体。本发明适用于对图片中包含的文字进行字体识别。

Description

一种基于图片的字体识别方法、装置及电子设备
技术领域
本发明涉及文字识别技术,尤其涉及一种基于图片的字体识别方法、装置及电子设备。
背景技术
光学字符识别(OCR,Optical Character Recognition)或归一化识别是利用扫描仪或数码相机等电子设备检查打印的字符,通过检测暗、亮的模式确定字符形状,然后利用字符识别方法将确定的字符形状翻译成计算机文字的技术,属于图型识别(PR,PatternRecognition)领域,主要应用于字符识别。
随着图文能够提供给用户更多以及更精彩的信息,图片中包含文本的应用也越来越普遍,因而,如何从图文中识别出字符以及字符所属的字体,以便于用户确定字符所属的字体,有效设置输入或识别的字符的字体,提升用户体验成为当前研究的热点。但目前应用的光学字符识别或归一化识别,由于主要应用于纯字符识别,对于图片中包含的字符的字体,还不能进行识别或识别的字体与实际字体不符,使得字体识别的准确率较低,导致依据识别的字体设置字符的准确度较低。
发明内容
有鉴于此,本发明实施例提供一种基于图片的字体识别方法、装置及电子设备,能够有效提升字体识别的准确率。
第一方面,本发明实施例提供一种基于图片的字体识别方法,包括:依据预先设置的小波变换级数,对待识别图片进行小波变换,得到第一小波特征向量;依据预先通过样本计算获得的线性变换矩阵对所述第一小波特征向量进行特征变换,得到第一变换特征向量;依据所述第一变换特征向量,以及预先通过样本计算获得的各类样本字体的特征参数,计算判决函数值;根据所述判决函数值,确定所述待识别图片中的字符的字体。
结合第一方面,在第一方面的第一种实施方式中,所述依据预先设置的小波变换级数,对待识别图片进行小波变换,得到第一小波特征向量,包括:依据预先设置的小波变换级数,对待识别图片进行小波变换,得到两个以上的第一小波变换子图片;提取各第一小波变换子图片的特征,并将提取的各第一小波变换子图片的特征进行组合,得到第一小波特征向量。
结合第一方面,在第一方面的第二种实施方式中,在依据预先设置的小波变换级数,对待识别图片中的字符进行小波变换,得到第一小波特征向量之前,所述方法,所述方法,还包括:依据预先设置的小波变换级数,对样本进行小波变换,得到第二小波特征向量;依据所述第二小波特征向量,确定所述线性变换矩阵。
结合第一方面的第二种实施方式,在第一方面的第三种实施方式中,所述依据预先设置的小波变换级数,对样本进行小波变换,得到第二小波特征向量,包括:依据预先设置的小波变换级数,对第j类样本中第i个样本字符进行小波变换,得到所述第i个样本字符的两个以上小波变换子图片;其中,1≤j≤C,C表示样本字体类别数目,1≤i≤Nj,Nj表示第j类样本中的样本数;提取所述第i个样本字符的各小波变换子图片的特征,并将提取的所述第i个样本字符的各小波变换子图片的特征进行组合,得到所述第i个样本的第二小波特征向量。
结合第一方面的第三种实施方式,在第一方面的第四种实施方式中,所述依据所述第二小波特征向量,确定所述线性变换矩阵,包括:计算每类样本中各样本的第二小波特征向量均值以及所有类样本中各样本的第二小波特征向量均值;依据每类样本中各样本的第二小波特征向量均值以及所有类样本中各样本的第二小波特征向量均值,计算类内散度矩阵以及类间散度矩阵;依据类内散度矩阵以及类间散度矩阵,计算得到组合矩阵,对组合矩阵进行特征值和特征向量分解,得到按值的大小降序排列特征向量;提取特征向量中前m个特征向量,得到所述线性变换矩阵,其中,m为预先设置的常数。
结合第一方面的第四种实施方式,在第一方面的第五种实施方式中,所述依据每类样本中各样本的第二小波特征向量均值以及所有类样本中各样本的第二小波特征向量均值,计算类内散度矩阵以及类间散度矩阵,包括:
依据如下公式计算类内散度矩阵以及类间散度矩阵:
式中,Sw表示类内散度矩阵;Sb表示类间散度矩阵;u表示所有类样本中各样本的第二小波特征向量均值;uj表示第j类样本中各样本的第二小波特征向量均值;Vi表示第i个样本的第二小波特征向量;Nj表示第j类样本中的样本数;C表示样本字体类别数目。
结合第一方面的第四种实施方式,在第一方面的第六种实施方式中,所述依据类内散度矩阵以及类间散度矩阵,计算得到组合矩阵包括:获取类内散度矩阵的逆矩阵;将类内散度矩阵与类间散度矩阵相加,得到和矩阵;计算和矩阵与逆矩阵的积,得到组合矩阵。
结合第一方面的第二种或第三种实施方式,在第一方面的第五种实施方式中,在确定所述线性变换矩阵之后,所述方法,还包括:依据所述线性变换矩阵,对各类样本中中各样本的第二小波特征向量进行特征变换,得到各类样本中各样本的第二变换特征向量;计算各类样本中各样本的第二变换特征向量的均值和协方差矩阵;
依据各类样本中各样本的第二变换特征向量的均值和协方差矩阵,计算得到各类样本字体的特征参数并进行存储。
结合第一方面的第七种实施方式,在第一方面的第八种实施方式中,所述依据所述线性变换矩阵,对各类样本中各样本的第二小波特征向量进行特征变换,得到各类样本中各样本的第二变换特征向量,包括:依据如下公式,对第j类样本中第i个样本的第二小波特征向量进行特征变换,得到所述第i个样本的第二变换特征向量Yi (j)
Yi (j)=WTVi (j)
式中,WT为所述线性变换矩阵的转置矩阵;Vi (j)为第j类样本中第i个样本的第二小波特征向量。
结合第一方面的第七种实施方式,在第一方面的第九种实施方式中,所述计算各类样本中各样本的第二变换特征向量的均值和协方差矩阵,包括:依据如下公式,计算各类样本中各样本的第二变换特征向量的均值Uj和协方差矩阵∑j:
式中,Yi (j)表示第j类样本中第i个样本的第二小波特征向量进行特征变换后,得到的第二变换特征向量;Nj表示第j类样本中的样本数。
结合第一方面的第七种实施方式,在第一方面的第十种实施方式中,所述依据各类样本中各样本的第二变换特征向量的均值和协方差矩阵,计算得到各类样本字体的特征参数并进行存储,包括:对各类样本中各样本的第二变换特征向量的协方差矩阵进行特征值和特征向量分解,得到按值大小降序排列的特征值和特征向量;依据所述协方差矩阵的特征值,依据如下公式计算所述协方差矩阵的特征值的替代值β:
式中,C表示样本字体类别数目;表示第j类样本中的第二变换特征向量的协方差矩阵的特征值;k为小于m的正整数,m为所述线性变换矩阵的维数;
将计算得到的所述各类样本中各样本的第二变换特征向量的均值、所述协方差矩阵的特征值、所述协方差矩阵的特征向量、及所述协方差矩阵的特征值的替代值,作为对应字体类别的特征参数进行存储。
结合第一方面或第一方面的第二种实施方式,在第一方面的第十一种实施方式中,所述依据预先设置的小波变换级数,对待识别图片或样本进行小波变换包括:根据预先设定的小波变换级数,利用包含相应小波变换级数的尺度函数和小波函数的离散滤波器,对所述待识别图片或样本进行卷积处理以及亚取样处理。
结合第一方面的第十一种实施方式,在第一方面的第十二种实施方式中,所述根据预先设定的小波变换级数,利用包含相应小波变换级数的尺度函数和小波函数的离散滤波器,对所述待识别图片或样本进行卷积处理以及亚取样处理包括:
在水平方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,分别对所述待识别图片或样本进行卷积,得到第一滤波图片以及第二滤波图片;
在水平方向,分别对第一滤波图片以及第二滤波图片进行亚取样处理,得到第一图片以及第二图片;
在垂直方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,对所述第一图片进行卷积以及亚取样处理,得到第一级小波变换第一图片以及第一级小波变换第二图片;
在垂直方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,对所述第二图片进行卷积以及亚取样处理,得到第一级小波变换第三图片以及第一级小波变换第四图片;
在水平方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,对所述第一级小波变换第一图片进行卷积以及亚取样处理,得到第三图片以及第四图片,再在垂直方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,分别对第三图片以及第四图片进行卷积以及亚取样处理,得到第二级小波变换第一图片至第二级小波变换第四图片;
在水平方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,分别对所述第二级小波变换第一图片进行卷积以及亚取样处理,得到第五图片以及第六图片,再在垂直方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,对第五图片以及第六图片进行卷积以及亚取样处理,得到第三级小波变换第一图片至第三级小波变换第四图片。
结合第一方面的第一种或第三种实施方式,在第一方面的第十三种实施方式中,所述提取各第一小波变换子图片的特征,并将提取的各第一小波变换子图片的特征进行组合,得到第一小波特征向量,或者所述提取第i个样本字符的各小波变换子图片的特征,并将提取的所述第i个样本字符的各小波变换子图片的特征进行组合,得到所述第i个样本的第二小波特征向量,包括:按照预先设置的子块划分策略,对得到的小波变换子图片中的每一级小波变换子图片进行子块划分;统计每一子块中子波系数绝对值的加权和,得到对应子块的一维特征;将所有子块的一维特征进行组合,得到待识别图片的第一小波特征向量或所述第i个样本的第二小波特征向量。
结合第一方面的第十三种实施方式,在第一方面的第十四种实施方式中,所述按照预先设置的子块划分策略,对得到的小波变换子图片中的每一级小波变换子图片进行子块划分包括:对于最后一级小波变换之外的其它各级小波变换,根据如下公式确定将每一小波变换子图片划分成子块的数量:
Qj=2-j-2N×2-j-2N;
对于最后一级小波变换,根据如下公式确定将每一小波变换子图片划分成子块的数量:Qj=2-jN×2-jN;
式中,Qj表示将每一小波变换子图片划分成子块的数量;j表示当前级数;原始待识别图片的分辨率大小为N×N。
结合第一方面的第十三种实施方式,在第一方面的第十五种实施方式中,所述统计每一子块中子波系数绝对值的加权和,得到对应子块的一维特征包括:对于第一级子块以及第二级子块中的每个子块,利用高斯加权函数统计子块的像素绝对值,将统计的像素绝对值相加,得到对应子块的一维特征;对于第三级子块,将子块的每一像素绝对值作为一维特征。
结合第一方面的第十三种实施方式,在第一方面的第十六种实施方式中,在所述得到子块的一维特征之后,所述方法进一步包括:利用Box-Cox变换公式对子块的一维特征进行修整。
结合第一方面,在第一方面的第十七种实施方式中,所述依据预先通过样本计算获得的线性变换矩阵对所述第一小波特征向量进行特征变换,得到第一变换特征向量,包括:获取所述线性变换矩阵的转置矩阵;计算转置矩阵与所述第一小波特征向量的积,得到第一变换特征向量。
结合第一方面,在第一方面的第十八种实施方式中,所述依据所述第一变换特征向量,以及预先通过样本计算获得的样本字体的特征参数,计算判决函数值,包括:依据所述第一变换特征向量,以及预先通过样本计算获得的各类样本字体的特征参数,分别计算各类样本字体的特征参数所对应的判决函数值。
结合第一方面的第十八种实施方式,在第一方面的第十九种实施方式中,所述依据所述第一变换特征向量,以及预先通过样本计算获得的各类样本字体的特征参数,分别计算各类样本字体的特征参数所对应的判决函数值,包括:依据如下公式计算第j类样本字体的特征参数对应的判决函数值
式中,表示第j类样本中各样本的第二变换特征向量的协方差矩阵的特征值;β表示第j类样本中各样本的第二变换特征向量的协方差矩阵的特征值的替代值;表示第j类样本中各样本的第二变换特征向量的协方差矩阵的特征向量;Uj表示第j类样本中各样本的第二变换特征向量的均值;Y表示所述第一变换特征向量;k为小于m的正整数,m为所述线性变换矩阵的维数。
结合第一方面的第十八种实施方式,在第一方面的第二十种实施方式中,所述根据所述判决函数值,确定所述待识别图片中的字符的字体,包括:将计算得到的各判决函数值中最小的判决函数值所对应的一类样本字体,作为所述待识别图片中的字符的字体。
结合第一方面,在第一方面的第二十一种实施方式中,在确定出所述待识别图片中的字符的字体之后,所述方法还包括:将所述待识别图片加入到一类样本中,其中,所述待识别图片中的字符的字体与该类样本中字符的字体相一致。
结合第一方面的第二十一种实施方式,在第一方面的第二十二种实施方式中,所述将所述待识别图片加入到一类样本中,其中,所述待识别图片中的字符的字体与该类样本中字符的字体相一致,包括:判断所述待识别图片所要加入的一类样本中的样本数是否超过阈值,若未超过阈值,则将所述待识别图片加入到该类样本中,否则,则不将所述待识别图片加入到该类样本中。
结合第一方面的第二十一种实施方式,在第一方面的第二十三种实施方式中,在将所述待识别图片加入到一类样本中之后,所述方法还包括:计算新的线性变换矩阵以及新的样本字体的特征参数;利用所述新的线性变换矩阵以及新的样本字体的特征参数,对所述线性变换矩阵以及所述样本字体的特征参数进行更新。
第二方面,本发明实施例提供一种基于图片的字体识别装置,包括:第一小波变换模块、第一特征变换模块、判决值计算模块以及字体识别模块,其中,第一小波变换模块,用于依据预先设置的小波变换级数,对待识别图片进行小波变换,得到第一小波特征向量;第一特征变换模块,用于依据预先通过样本计算获得的线性变换矩阵对所述第一小波特征向量进行特征变换,得到第一变换特征向量;判决值计算模块,用于依据所述第一变换特征向量,以及预先通过样本计算获得的样本字体的特征参数,计算判决函数值;字体识别模块,用于根据所述判决函数值,确定所述待识别图片中的字符的字体。
结合第二方面,在第二方面的第一种实施方式中,所述第一小波变换模块,包括:第一小波变换子模块,用于依据预先设置的小波变换级数,对待识别图片进行小波变换,得到两个以上的第一小波变换子图片;第一特征提取子模块,用于提取各第一小波变换子图片的特征,并将提取的各第一小波变换子图片的特征进行组合,得到第一小波特征向量。
结合第二方面,在第二方面的第二种实施方式中,所述的基于图片的字体识别装置,还包括:第二小波变换模块,用于依据预先设置的小波变换级数,对样本进行小波变换,得到第二小波特征向量;线性变换矩阵确定模块,用于依据所述第二小波特征向量,确定所述线性变换矩阵。
结合第二方面的第二种实施方式,在第二方面的第三种实施方式中,所述第二小波变换模块,包括:第二小波变换子模块,用于依据预先设置的小波变换级数,对第j类样本中第i个样本字符进行小波变换,得到所述第i个样本字符的两个以上小波变换子图片;其中,1≤j≤C,C表示样本字体类别数目,1≤i≤Nj,Nj表示第j类样本中的样本数;第二特征提取子模块,用于提取所述第i个样本字符的各小波变换子图片的特征,并将提取的所述第i个样本字符的各小波变换子图片的特征进行组合,得到所述第i个样本的第二小波特征向量。
结合第二方面的第二种实施方式,在第二方面的第四种实施方式中,所述线性变换矩阵确定模块,包括:均值计算子模块,用于计算每类样本中各样本的第二小波特征向量均值以及所有类样本中各样本的第二小波特征向量均值;散度矩阵计算子模块,用于依据每类样本中各样本的第二小波特征向量均值以及所有类样本中各样本的第二小波特征向量均值,计算类内散度矩阵以及类间散度矩阵;组合矩阵计算子模块,用于依据类内散度矩阵以及类间散度矩阵,计算得到组合矩阵;
第一分解子模块,用于对组合矩阵进行特征值和特征向量分解,得到按值的大小降序排列特征向量;向量提取子模块,用于提取特征向量中前m个特征向量,得到所述线性变换矩阵,其中,m为预先设置的常数。
结合第二方面的第四种实施方式,在第二方面的第五种实施方式中,所述散度矩阵计算子模块,具体用于依据如下公式计算类内散度矩阵以及类间散度矩阵:
式中,Sw表示类内散度矩阵;Sb表示类间散度矩阵;u表示所有类样本中各样本的第二小波特征向量均值;uj表示第j类样本中各样本的第二小波特征向量均值;Vi表示第i个样本的第二小波特征向量;Nj表示第j类样本中的样本数;C表示样本字体类别数目。
结合第二方面的第四种实施方式,在第二方面的第六种实施方式中,所述组合矩阵计算子模块,具体用于:获取类内散度矩阵的逆矩阵;将类内散度矩阵与类间散度矩阵相加,得到和矩阵;计算和矩阵与逆矩阵的积,得到组合矩阵。
结合第二方面的第二种或第三种实施方式,在第二方面的第七种实施方式中,所述的基于图片的字体识别装置,还包括:第二特征变换模块,用于依据所述线性变换矩阵,对各类样本中各样本的第二小波特征向量进行特征变换,得到各类样本中各样本的第二变换特征向量;均值和协方差矩阵计算模块,用于计算各类样本中各样本的第二变换特征向量的均值和协方差矩阵;特征参数获取模块,用于依据各类样本中各样本的第二变换特征向量的均值和协方差矩阵,计算得到各类样本字体的特征参数并进行存储。
结合第二方面的第七种实施方式,在第二方面的第八种实施方式中,所述第二特征变换模块,具体用于依据如下公式,对第j类样本中第i个样本的第二小波特征向量进行特征变换,得到所述第i个样本的第二变换特征向量Yi(j);
Yi(j)=WTVi (j)
式中,WT为所述线性变换矩阵的转置矩阵;Vi (j)为第j类样本中第i个样本的第二小波特征向量。
结合第二方面的第七种实施方式,在第二方面的第九种实施方式中,所述均值和协方差矩阵计算模块,具体用于依据如下公式,计算各类样本中各样本的第二变换特征向量的均值Uj和协方差矩阵∑j:
式中,Yi (j)表示第j类样本中第i个样本的第二小波特征向量进行特征变换后,得到的第二变换特征向量;Nj表示第j类样本中的样本数。
结合第二方面的第七种实施方式,在第二方面的第十种实施方式中,所述特征参数获取模块,包括:第二分解子模块,用于对各类样本中各样本的第二变换特征向量的协方差矩阵进行特征值和特征向量分解,得到按值大小降序排列的特征值和特征向量;替代值计算子模块,用于依据所述协方差矩阵的特征值,依据如下公式计算所述协方差矩阵的特征值的替代值β:
式中,C表示样本字体类别数目;表示第j类样本中的第二变换特征向量的协方差矩阵的特征值;k为小于m的正整数,m为所述线性变换矩阵的维数;
特征参数获取子模块,用于将计算得到的所述各类样本中各样本的第二变换特征向量的均值、所述协方差矩阵的特征值、所述协方差矩阵的特征向量、及所述协方差矩阵的特征值的替代值,作为对应字体类别的特征参数进行存储。
结合第二方面,在第二方面的第十一种实施方式中,所述第一小波变换子模块,具体用于:根据预先设定的小波变换级数,利用包含相应小波变换级数的尺度函数和小波函数的离散滤波器,对所述待识别图片中的字符进行卷积处理以及亚取样处理。
结合第二方面的第三种实施方式,在第二方面的第十二种实施方式中,所述第二小波变换子模块,具体用于:根据预先设定的小波变换级数,利用包含相应小波变换级数的尺度函数和小波函数的离散滤波器,对第j类样本中第i个样本字符进行卷积处理以及亚取样处理。
结合第二方面的第十一种或第十二种实施方式,在第二方面的第十三种实施方式中,所述第一小波变换子模块或所述第二小波变换子模块包括:第一卷积单元、第一亚取样单元、第二卷积及亚取样单元、第三卷积及亚取样单元、第四卷积及亚取样单元、第五卷积及亚取样单元、第六卷积及亚取样单元以及第七卷积及亚取样单元,其中,
第一卷积单元,用于在水平方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,分别对所述待识别图片中的字符或分别对所述第j类样本中第i个样本字符进行卷积,得到第一滤波图片以及第二滤波图片;
第一亚取样单元,用于在水平方向,分别对第一滤波图片以及第二滤波图片进行亚取样处理,得到第一图片以及第二图片;
第二卷积及亚取样单元,用于在垂直方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,对所述第一图片进行卷积以及亚取样处理,得到第一级小波变换第一图片以及第一级小波变换第二图片;
第三卷积及亚取样单元,用于在垂直方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,对所述第二图片进行卷积以及亚取样处理,得到第一级小波变换第三图片以及第一级小波变换第四图片;
第四卷积及亚取样单元,用于在水平方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,对所述第一级小波变换第一图片进行卷积以及亚取样处理,得到第三图片以及第四图片;
第五卷积及亚取样单元,用于在垂直方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,分别对第三图片以及第四图片进行卷积以及亚取样处理,得到第二级小波变换第一图片至第二级小波变换第四图片;
第六卷积及亚取样单元,用于在水平方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,分别对所述第二级小波变换第一图片进行卷积以及亚取样处理,得到第五图片以及第六图片;
第七卷积及亚取样单元,用于在垂直方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,对第五图片以及第六图片进行卷积以及亚取样处理,得到第三级小波变换第一图片至第三级小波变换第四图片。
结合第二方面的第一种或第三种实施方式,在第二方面的第十四种实施方式中,所述第一特征提取子模块或所述第二特征提取子模块包括:子块划分单元、子块特征统计单元以及小波特征获取单元,其中,
子块划分单元,用于按照预先设置的子块划分策略,对得到的小波变换子图片中的每一级小波变换子图片进行子块划分;
子块特征统计单元,用于统计每一子块中子波系数绝对值的加权和,得到对应子块的一维特征;
小波特征获取单元,用于将所有子块的一维特征进行组合,得到待识别图片的第一小波特征向量或所述第i个样本的第二小波特征向量。
结合第二方面的第十四种实施方式,在第二方面的第十五种实施方式中,所述子块划分单元具体用于:对于最后一级小波变换之外的其它各级小波变换,根据如下公式确定将每一小波变换子图片划分成子块的数量:
Qj=2-j-2N×2-j-2N;
对于最后一级小波变换,根据如下公式确定将每一小波变换子图片划分成子块的数量:Qj=2-jN×2-jN;
式中,Qj表示将每一小波变换子图片划分成子块的数量;j表示当前级数;原始待识别图片的分辨率大小为N×N。
结合第二方面的第十四种实施方式,在第二方面的第十六种实施方式中,所述子块特征统计单元包括:子块特征第一统计子单元以及子块特征第二统计子单元,其中,子块特征第一统计子单元,用于对于第一级子块以及第二级子块中的每个子块,利用高斯加权函数统计子块的像素绝对值,将统计的像素绝对值相加,得到对应子块的一维特征;子块特征第二统计子单元,用于对于第三级子块,将子块的每一像素绝对值作为一维特征。
结合第二方面的第十六种实施方式,在第二方面的第十七种实施方式中,所述子块特征统计单元还包括:修整子单元,用于利用Box-Cox变换公式对子块的一维特征进行修整。
结合第二方面,在第二方面的第十八种实施方式中,所述第一特征变换模块,具体用于:获取所述线性变换矩阵的转置矩阵;计算转置矩阵与所述第一小波特征向量的积,得到第一变换特征向量。
结合第二方面,在第二方面的第十九种实施方式中,所述判决值计算模块,具体用于依据所述第一变换特征向量,以及预先通过样本计算获得的各类样本字体的特征参数,分别计算各类样本字体的特征参数所对应的判决函数值。
结合第二方面的第十九种实施方式,在第二方面的第二十种实施方式中,所述判决值计算模块,具体用于依据如下公式计算第j类样本字体的特征参数对应的判决函数值
式中,表示第j类样本中各样本的第二变换特征向量的协方差矩阵的特征值;β表示第j类样本中各样本的第二变换特征向量的协方差矩阵的特征值的替代值;表示第j类样本中各样本的第二变换特征向量的协方差矩阵的特征向量;Uj表示第j类样本中各样本的第二变换特征向量的均值;Y表示所述第一变换特征向量;k为小于m的正整数,m为所述线性变换矩阵的维数。
结合第二方面的第十九种实施方式,在第二方面的第二十一种实施方式中,所述字体识别模块,具体用于将计算得到的各判决函数值中最小的判决函数值所对应的一类样本字体,作为所述待识别图片中的字符的字体。
结合第二方面的第十九种实施方式,在第二方面的第二十二种实施方式中,所述装置还包括;样本增加模块,用于将所述待识别图片加入到一类样本中,其中,所述待识别图片中的字符的字体与该类样本中字符的字体相一致。
结合第二方面的第二十二种实施方式,在第二方面的第二十三种实施方式中,所述样本增加模块,具体用于判断所述待识别图片所要加入的一类样本中的样本数是否超过阈值,若未超过阈值,则将所述待识别图片加入到该类样本中,否则,则不将所述待识别图片加入到该类样本中。
结合第二方面的第二十三种实施方式,在第二方面的第二十四种实施方式中,所述装置还包括;更新模块,用于在所述样本增加模块将所述待识别图片加入到一类样本中之后,计算新的线性变换矩阵以及新的样本字体的特征参数;利用所述新的线性变换矩阵以及新的样本字体的特征参数,对所述线性变换矩阵以及所述样本字体的特征参数进行更新。
第三方面,本发明实施例提供一种电子设备,包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为上述电子设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行前述任一实施方式所述的基于图片的字体识别方法。
本发明实施例提供的一种基于图片的字体识别方法、装置及电子设备,通过对待识别图片中的字符进行小波变换,依据预先通过样本计算获得的线性变换矩阵以及样本字体的特征参数,计算判决函数值,根据所述判决函数值,确定所述待识别图片中的所述字符的字体,能够有效提升字体识别的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明的实施例一基于图片的字体识别方法流程示意图;
图2为本发明的实施例的图片示意图;
图3为本发明的实施例对图片进行第一级小波变换的示意图;
图4为本发明的实施例对第一级小波变换第一图片进行第二级小波变换的示意图;
图5为本发明的实施例对第二级小波变换第一图片进行第三级小波变换的示意图;
图6为本发明的实施例对图片进行一级小波变换的卷积及亚取样处理示意图;
图7为本发明的实施例中提取第一小波特征向量的流程示意图;
图8为本发明的实施例二基于图片的字体识别装置结构示意图;
图9为本发明的实施例三基于图片的字体识别装置结构示意图;
图10为本发明实施例四电子设备的结构示意图。
具体实施方式
下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1为本发明的实施例一基于图片的字体识别方法流程示意图,如图1所示,本实施例的方法可以包括:
步骤101,依据预先设置的小波变换级数,对待识别图片进行小波变换,得到第一小波特征向量。
本实施例中,小波变换(WT,Wavelet Transform)是一种新的变换分析方法,它继承和发展了短时傅立叶变换局部化的思想,同时又克服了窗口大小不随频率变化等缺点,能够提供一个随频率改变的时间-频率窗口,是进行信号时频分析和处理的理想工具。通过伸缩平移运算对信号(函数)逐步进行多尺度细化,最终达到高频处时间细分,低频处频率细分,能自动适应时频信号分析的要求。由于图片可以看作是二维信号,因而,可以应用小波变换对图片进行处理。
本实施例中,作为一可选实施例,图片包括但不限于:jpg、bmp、pcx、gif、tiff等的任意一种。
本实施例中,作为一可选实施例,依据预先设置的小波变换级数,对待识别图片进行小波变换,得到第一小波特征向量(步骤101)包括:
S11、依据预先设置的小波变换级数,对待识别图片进行小波变换,得到两个以上的第一小波变换子图片;
S12、提取各第一小波变换子图片的特征,并将提取的各第一小波变换子图片的特征进行组合,得到第一小波特征向量。
作为一可选实施例,所述依据预先设置的小波变换级数,对待识别图片进行小波变换,得到两个以上的第一小波变换子图片(S11)包括:
根据预先设定的小波变换级数,利用包含相应小波变换级数的尺度函数和小波函数的离散滤波器,对所述待识别图片中的字符进行卷积处理以及亚取样处理。
本实施例中,作为一可选实施例,根据预先设定的小波变换级数,利用包含相应小波变换级数的尺度函数和小波函数的离散滤波器,对所述待识别图片中的字符进行卷积处理以及亚取样处理包括:
A11,在水平方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,分别对所述待识别图片中的字符进行卷积,得到第一滤波图片以及第二滤波图片;
本实施例中,作为一可选实施例,小波为二次样条(Spline2)小波,利用尺度函数得到的第一离散滤波器(H)为:
根据小波函数得到的第二离散滤波器(G)为:
A12,在水平方向,分别对第一滤波图片以及第二滤波图片进行亚取样处理,得到第一图片以及第二图片;
本实施例中,对利用第一离散滤波器进行卷积处理的滤波图片进行亚取样,即每两个样本只保留一个,得到第一图片,对利用第二离散滤波器进行卷积处理的滤波图片进行亚取样,得到第二图片。
A13,在垂直方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,对所述第一图片进行卷积以及亚取样处理,得到第一级小波变换第一图片以及第一级小波变换第二图片;
A14,在垂直方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,对所述第二图片进行卷积以及亚取样处理,得到第一级小波变换第三图片以及第一级小波变换第四图片;
本实施例中,对第一级小波变换第一图片以及第一级小波变换第二图片在垂直方向上,分别用离第一散滤波器(H)和第二散滤波器(G)进行卷枳,并分别对卷积处理得到的滤波图片进行亚取样处理,总共得到四个图片。
本实施例中,得到第一级小波变换第一图片和第一级小波变换第二图片,以及,第一级小波变换第三图片和及第一级小波变换第四图片的处理流程为第一级小波变换。
以包含字符“啊”的图片进行三级小波变换为例,图2为本发明的实施例的图片示意图,图3为本发明的实施例对图片进行第一级小波变换的示意图。参见图2和图3,经过第一级小波变换后,图片被切分为4个部分,即第一级小波变换第一图片至第一级小波变换第四图片,分别为:以及
A15,在水平方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,对所述第一级小波变换第一图片进行卷积以及亚取样处理,得到第三图片以及第四图片,再在垂直方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,分别对第三图片以及第四图片进行卷积以及亚取样处理,得到第二级小波变换第一图片至第二级小波变换第四图片;
图4为本发明的实施例对第一级小波变换第一图片进行第二级小波变换的示意图。参见图4,经过第二级小波变换后,第一级小波变换第一图片被切分为4个部分,即图片总共被切分为7个部分,第一级小波变换第一图片被切分的4个部分为第二级小波变换第一图片至第二级小波变换第四图片,分别为:以及
A16,在水平方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,分别对所述第二级小波变换第一图片进行卷积以及亚取样处理,得到第五图片以及第六图片,再在垂直方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,对第五图片以及第六图片进行卷积以及亚取样处理,得到第三级小波变换第一图片至第三级小波变换第四图片。
图5为本发明的实施例对第二级小波变换第一图片进行第三级小波变换的示意图。参见图5,本实施例中,第二级小波变换第一图片被切分为4个部分,图片总共被切分为10个部分,第二级小波变换第一图片被切分的4个部分为第三级小波变换第一图片至第三级小波变换第四图片,分别为: 以及图片经过第三级小波变换后,总共得到10张小波变换子图片,即图片被划分为10张小波变换子图片。
本实施例中,根据预先设定的层数J,即小波变换级数,利用包含相应的尺度函数和小波函数的离散滤波器,对图片进行卷积处理以及亚取样处理,即对原始图片进行J层小波变换,得到3J+1个小波变换子图片。
设原始图片名称为以像素点表示为f(x,y),小波变换级数设置为J(本实施例中,J=3),对图片进行J层小波变换后,得到3J+1个小波变换子图片,分别表示如下:
如果的大小为NxN,则3J+1个小波变换子图片中,各子图片的大小分别为:
的大小为2-JN×2-JN;
的大小各为2-jN×2-jN。
本实施例中,在所述依据预先设置的小波变换级数,对图片进行小波变换之前,该方法还包括:对所述图片进行二值化以及噪声去除处理。
本实施例中,对输入的包含文本字符的图片,利用二值化、噪声去除等方法进行预处理,将字符(前景)与背景色分离。作为一可选实施例,将背景信息处理为白色,前景信息处理为黑色。
图6为本发明的实施例对图片进行一级小波变换的卷积及亚取样处理示意图。参见图6,图中的G/H表示用G/H在水平或垂直方向进行卷积,2↓1表示在水平或垂直方向进行亚取样,即每两个样本保留一个样本。
图7为本发明的实施例中提取第一小波特征向量的流程示意图。提取的第一小波特征向量即为初始小波特征向量。参看图7,以分辨率大小为48x48的字符图像为例,经过三级Spline2小波变换后得到的10张小波变换子图片中,以及为第一级小波变换后得到的子图片,即第一级小波变换第二图片至第一级小波变换第四图片,大小均为24x24;以及为第二级小波变换后得到的子图片,即第二级小波变换第二图片至第二级小波变换第四图片,大小均为12x12;以及为第三级小波变换后得到的子图片,即第三级小波变换第一图片至第三级小波变换第四图片,大小均为6x6。
本实施例中,作为一可选实施例,所述提取各第一小波变换子图片的特征,并将提取的各第一小波变换子图片的特征进行组合,得到第一小波特征向量(S12)包括:
B11,按照预先设置的子块划分策略,对得到的小波变换子图片中的每一级小波变换子图片进行子块划分;
本实施例中,可按照如下子块划分策略,对得到的小波变换子图片中的每一级小波变换子图片进行子块划分:
对于最后一级小波变换之外的其它各级小波变换,即在2-jN≥8条件下,根据如下公式确定将每一小波变换子图片划分成子块的数量:
Qj=2-j-2N×2-j-2N;
对于最后一级小波变换,即在2-jN<8条件下,根据如下公式确定将每一小波变换子图片划分成子块的数量:Qj=2-jN×2-jN;
式中,Qj表示将每一小波变换子图片划分成子块的数量;j表示当前级数,又可称为当前层数;原始待识别图片的分辨率大小为N×N。
根据上述子块划分策略,最终可得到的其中,J为最大级数,最后一级有4个子图片,其它级各有3个子图片。
作为一可选实施例,原始待识别图片的分辨率大小为48×48时,按照预先设置的子块划分策略,对得到的小波变换子图片中的每一级小波变换子图片进行子块划分包括:对于第一级小波变换第二图片至第一级小波变换第四图片,将每一图片划分为6X6个第一级子块;对于第二级小波变换第二图片至第二级小波变换第四图片,将每一图片划分为3X3个第二级子块;本发明不限于此,为了提高识别的精度,对于第二级小波变换第二图片至第二级小波变换第四图片,也可将每一图片划分为4X4个第二级子块;对于第三级小波变换第一图片至第三级小波变换第四图片,每一图片为一第三级子块。
B12,统计每一子块中子波系数绝对值的加权和,得到对应子块的一维特征;
本实施例中,对于每级或每层子图像,划分子块后,对每个子块中子波系数绝对值的加权和,得到对应该子块的一维特征,所以每个子图像有多少个子块就有多少维子波特征。
本实施例中,作为一可选实施例,统计每一子块中子波系数绝对值的加权和,得到对应子块的一维特征包括:对于第一级子块以及第二级子块中的每个子块,利用高斯加权函数统计子块的像素绝对值,将统计的像素绝对值相加,得到对应子块的一维特征;对于第三级子块,将子块的每一像素绝对值作为一维特征。
B13,将所有子块的一维特征进行组合,得到待识别图片的第一小波特征向量。
参看图7,作为一可选实施例,对于第一级小波变换第二图片至第一级小波变换第四图片,每一图片包含36个第一级子块,每一第一级子块对应一维特征,每一图片对应36维特征,3个图片共有108维特征;
对于第二级小波变换第二图片至第二级小波变换第四图片,每一图片包含16个第二级子块,每一第二级子块对应一维特征,每一图片对应16维特征,3个图片共有48维特征;需要说明的是,对于第二级小波变换第二图片至第二级小波变换第四图片,可将每一图片划分为3X3个第二级子块;为了提高识别的精度,本可选实施例中,对于第二级小波变换第二图片至第二级小波变换第四图片,将每一图片划分为4X4个第二级子块;
对于第三级小波变换第一图片至第三级小波变换第四图片,每一图片包含36个像素点,每一像素点对应一维特征,每一图片对应36维特征,4个图片共有144维特征。
因而,本实施例中,将所有子块的一维特征进行组合,得到第一小波特征向量,其维数为108+48+144=300。
参看图7,本实施例中,作为一可选实施例,在得到子块的一维特征之后,该方法进一步包括:利用Box-Cox变换公式对子块的一维特征进行修整。
本实施例中,Box-Cox变换是统计建模中常用的一种数据变换方法,用于连续的响应变量不满足正态分布的情况,经过Box-Cox变换后,可以一定程度上减小不可观测的误差和预测变量的相关性,使变换后的特征接近高斯分布。其中,Box-Cox变换公式如下:
y=ln(x),@=0;
式中,@为Box-Cox变换参数。
本实施例中,设置@=0.7,对子块的每维特征进行Box-Cox变换,将进行Box-Cox变换后的所有子块的一维特征进行组合,得到第一小波特征向量。
步骤102,依据预先通过样本计算获得的线性变换矩阵对所述第一小波特征向量进行特征变换,得到第一变换特征向量。
本实施例中,所述预先通过样本计算获得是指在当次对待识别图片进行实际识别之前通过样本计算获得。也就是说,这里的“预先”属于一相对概念,是相对于当次实际识别而言的。
本实施例中,在获得第一小波特征向量之后,可利用线性鉴别分析(LDA,LinearDiscriminant Analysis)方法进行特征变换,对所述第一小波特征向量进行特征变换,得到第一变换特征向量,以改善特征分布,提高识别性能。
本实施例中,作为一可选实施例,本步骤102,可包括:获取所述线性变换矩阵的转置矩阵;计算转置矩阵与所述第一小波特征向量的积,得到第一变换特征向量。具体来讲,本实施例中,利用下式得到第一变换特征向量Y:
Y=WTV;
式中,WT表示所述线性变换矩阵的转置矩阵;V表示所述第一小波特征向量。
本实施例中,作为一可选实施例,在依据预先设置的小波变换级数,对待识别图片进行小波变换,得到第一小波特征向量(步骤101)之前,所述方法,还包括确定所述线性变换矩阵的步骤,具体来讲,可包括如下步骤:
C11、依据预先设置的小波变换级数,对样本进行小波变换,得到第二小波特征向量。
作为一可选实施例,本步骤中,所述依据预先设置的小波变换级数,对样本进行小波变换,得到第二小波特征向量,包括:依据预先设置的小波变换级数,对第j类样本中第i个样本字符进行小波变换,得到所述第i个样本字符的两个以上小波变换子图片;其中,1≤j≤C,C表示样本字体类别数目,1≤i≤Nj,Nj表示第j类样本中的样本数;提取所述第i个样本字符的各小波变换子图片的特征,并将提取的所述第i个样本字符的各小波变换子图片的特征进行组合,得到所述第i个样本的第二小波特征向量。
本步骤中,作为一可选实施例,所述依据预先设置的小波变换级数,对第j类样本中第i个样本字符进行小波变换,可包括:根据预先设定的小波变换级数,利用包含相应小波变换级数的尺度函数和小波函数的离散滤波器,对第j类样本中第i个样本字符进行卷积处理以及亚取样处理。
具体来讲,根据预先设定的小波变换级数,利用包含相应小波变换级数的尺度函数和小波函数的离散滤波器,对第j类样本中第i个样本字符进行卷积处理以及亚取样处理的过程和方法,与根据预先设定的小波变换级数,利用包含相应小波变换级数的尺度函数和小波函数的离散滤波器,对所述待识别图片中的字符进行卷积处理以及亚取样处理的过程和方法类似,在此不再赘述。
本步骤中,作为一可选实施例,提取各样本字符的各小波变换子图片的特征,得到各样本的第二小波特征向量的过程和方法,与提取各第一小波变换子图片的特征,得到第一小波特征向量的过程和方法类似,在此不再赘述。
C12、依据所述第二小波特征向量,确定所述线性变换矩阵。
作为一可选实施例,本步骤C12可具体包括:
C121、计算每类样本中各样本的第二小波特征向量均值以及所有类样本中各样本的第二小波特征向量均值;
作为一可选实施例,可分别利用下式计算每类样本中各样本的第二小波特征向量均值以及所有类样本中各样本的第二小波特征向量均值:
式中,uj表示第j类样本中各样本的第二小波特征向量均值;u表示所有类样本中各样本的第二小波特征向量均值;Vi (j)表示第j类样本中第i个样本的第二小波特征向量;Nj表示第j类样本中的样本数;C表示样本字体类别数目。
C122、依据每类样本中各样本的第二小波特征向量均值以及所有类样本中各样本的第二小波特征向量均值,计算类内散度矩阵以及类间散度矩阵;
作为一可选实施方式,本步骤C122可具体包括:依据如下公式计算类内散度矩阵以及类间散度矩阵:
式中,Sw表示类内散度矩阵;Sb表示类间散度矩阵;u表示所有类样本中各样本的第二小波特征向量均值;uj表示第j类样本中各样本的第二小波特征向量均值;Vi表示第i个样本的第二小波特征向量;Nj表示第j类样本中的样本数;C表示样本字体类别数目。
C123、依据类内散度矩阵以及类间散度矩阵,计算得到组合矩阵,对组合矩阵进行特征值和特征向量分解,得到按值的大小降序排列特征向量;
本实施例中,作为一可选实施方式,所述依据类内散度矩阵以及类间散度矩阵,计算得到组合矩阵可包括:获取类内散度矩阵的逆矩阵;将类内散度矩阵与类间散度矩阵相加,得到和矩阵;计算和矩阵与逆矩阵的积,得到组合矩阵。
本实施例中,组合矩阵为对组合矩阵进行特征值和特征向量分解,得到按特征值的大小降序排列的特征值{γi,i=1,2,...}和特征向量{εi,i=1,2,...,n}。
C124、提取特征向量中前m个特征向量,得到所述线性变换矩阵,其中,m为预先设置的常数。
本实施例中,作为一可选实施例,用前m个特征向量组成如下的线性变换矩阵:W=[ε1,ε2,...,εm];本实施例中,作为一可选实施例,预先设置的常数m为256。
本实施例中,作为一可选实施例,在确定所述线性变换矩阵之后,所述方法,还包括确定各类样本字体的特征参数并进行存储的步骤,具体来讲,可包括如下步骤:
D11、依据所述线性变换矩阵,对各类样本中各样本的第二小波特征向量进行特征变换,得到各类样本中各样本的第二变换特征向量。
本实施例中,在获得各类样本中各样本的第二小波特征向量之后,可利用线性鉴别分析(LDA,Linear Discriminant Analysis)方法进行特征变换,对所述第二小波特征向量进行特征变换,得到各类样本中各样本的第二变换特征向量,以改善特征分布,提高识别性能。
作为一可选实施例,本步骤D11可具体包括:依据如下公式,对第j类样本中第i个样本的第二小波特征向量进行特征变换,得到所述第i个样本的第二变换特征向量Yi (j)
Yi (j)=WTVi (j)
式中,WT为所述线性变换矩阵的转置矩阵;Vi(j)为第j类样本中第i个样本的第二小波特征向量。
D12、计算各类样本中各样本的第二变换特征向量的均值和协方差矩阵。
作为一可选实施例,本步骤D12可具体包括:依据如下公式,计算各类样本中各样本的第二变换特征向量的均值Uj和协方差矩阵∑j:
式中,Yi (j)表示第j类样本中第i个样本的第二小波特征向量进行特征变换后,得到的第二变换特征向量;Nj表示第j类样本中的样本数。
D13、依据各类样本中各样本的第二变换特征向量的均值和协方差矩阵,计算得到各类样本字体的特征参数并进行存储。
作为一可选实施例,本步骤D13可具体包括:
D131、对各类样本中各样本的第二变换特征向量的协方差矩阵进行特征值和特征向量分解,得到按值大小降序排列的特征值和特征向量;
本实施例中,对各类样本中各样本的第二变换特征向量的协方差矩阵∑j进行特征值和特征向量分解,得到按值大小降序排列的特征值和特征向量
D132、依据所述协方差矩阵的特征值,依据如下公式计算所述协方差矩阵的特征值的替代值β:
式中,C表示样本字体类别数目;表示第j类样本中的第二变换特征向量的协方差矩阵的特征值;k为小于m的正整数,m为所述线性变换矩阵的维数;本实施例中,可通过实验确定k。作为一可选实施例,m=256,k=224。
D133、将计算得到的所述各类样本中各样本的第二变换特征向量的均值、所述协方差矩阵的特征值、所述协方差矩阵的特征向量、及所述协方差矩阵的特征值的替代值,作为对应字体类别的特征参数进行存储。
本实施例中,存储内容可如下:
本实施例中,可将上述内容存储到识别库文件中,以供后续的识别使用。
步骤103,依据所述第一变换特征向量,以及预先通过样本计算获得的各类样本字体的特征参数,计算判决函数值。
同理,本实施例中,所述预先通过样本计算获得是指在当次对待识别图片进行实际识别之前通过样本计算获得。也就是说,这里的“预先”属于一相对概念,是相对于当次实际识别而言的。
本实施例中,每类样本包含有多个样本字符,并且每类样本对应一种字体。
本实施例中,作为一可选实施例,本步骤103可包括:依据如下公式计算第j类样本字体的特征参数对应的判决函数值
式中,表示第j类样本中各样本的第二变换特征向量的协方差矩阵的特征值;β表示第j类样本中各样本的第二变换特征向量的协方差矩阵的特征值的替代值;表示第j类样本中各样本的第二变换特征向量的协方差矩阵的特征向量;Uj表示第j类样本中各样本的第二变换特征向量的均值;Y表示所述第一变换特征向量;k为小于m的正整数,m为所述线性变换矩阵的维数。
步骤104,根据所述判决函数值,确定所述待识别图片中的字符的字体。
作为一可选实施例,所述根据所述判决函数值,确定所述待识别图片中的字符的字体,包括:将计算得到的各判决函数值中最小的判决函数值所对应的一类样本的字体,作为所述待识别图片中的所述字符的字体。
例如,在一实施例中,预先确定有第1类样本、第2类样本及第3类样本共三类样本,第1类样本中字符的字体为宋体,第2类样本中字符的字体为楷体,第3类样本中字符的字体为隶书。
可预先分别计算获得第1类、第2类及第3类样本中字体的所述特征参数。
依据所述第一变换特征向量,以及预先通过计算获得的第1类样本中字体的特征参数,可计算得到第一判决函数值;依据所述第一变换特征向量,以及预先通过计算获得的第2类样本中字体的特征参数,可计算得到第二判决函数值;依据所述第一变换特征向量,以及预先通过计算获得的第3类样本中字体的特征参数,可计算得到第三判决函数值。
若通过比较上述三个判决函数值的大小,得到第二判决函数值最小,则可确定所述待识别图片中的字符的字体为楷体。
本实施例中,利用判决函数值识别字体,即利用修改后的二次判别函数(MQDF,Modified Quadratic Discriminant Function)分类器进行字体识别,MQDF分类器是用于高斯模型的二次分类器。
以下举一具体例子,对本发明实施例的效果进行详细描述。
测试样本有7类,每类样本对应一种字体,分别为:宋体、仿宋、黑体、楷体、隶书、魏碑、园体。每类样本包含3755个不同的汉字字符(国标一级汉字集)。本实施例中,采用前3000个汉字字符进行训练,后755个汉字字符进行测试。
进行字符字体识别的实验结果如下:
由上述可见,本实施例基于图片的字体识别方法,依据预先设置的小波变换级数,对待识别图片进行小波变换,得到第一小波特征向量;依据预先通过样本计算获得的线性变换矩阵对所述第一小波特征向量进行特征变换,得到第一变换特征向量;依据所述第一变换特征向量,以及预先通过样本计算获得的样本字体的特征参数,计算判决函数值;根据所述判决函数值,确定所述待识别图片中的所述字符的字体。这样,能够有效提升字体识别的准确率。
为了提高字体识别的准确性,可选地,在确定出所述待识别图片中的字符的字体之后,所述方法还包括:将所述待识别图片加入到一类样本中,其中,所述待识别图片中的字符的字体与该类样本中字符的字体相一致,这样能够自动增加该类样本中样本的数量。
为控制某类样本中样本的数量,不至于出现其中样本的数量过多的情况,针对某类样本,可设定该类样本中样本数量的阈值,通过判断该类样本中当前的样本数量是否超过所述阈值,若未超过,则在该类样本中增加样本的数量。具体来讲,所述将所述待识别图片加入到一类样本中,包括:判断所述待识别图片所要加入的一类样本中的样本数是否超过阈值,若未超过阈值,则将所述待识别图片加入到该类样本中,否则,则不将所述待识别图片加入到该类样本中。
作为一可选实施例,在将所述待识别图片加入到一类样本中之后,所述方法还包括:计算新的线性变换矩阵以及新的样本字体的特征参数;利用所述新的线性变换矩阵以及新的样本字体的特征参数,对所述线性变换矩阵以及所述样本字体的特征参数进行更新,这样,能够实现样本的数量、根据样本计算的线性变换矩阵、以及样本字体的特征参数的动态更新,使得识别结果更加准确。
图8为本发明的实施例二基于图片的字体识别装置结构示意图,如图8所示,本实施例的装置可以包括:第一小波变换模块71、第一特征变换模块73、判决值计算模块74以及字体识别模块75,其中,
第一小波变换模块71,用于依据预先设置的小波变换级数,对待识别图片进行小波变换,得到第一小波特征向量;
本实施例中,作为一可选实施例,图片包括但不限于:jpg、bmp、pcx、gif、tiff等的任意一种。
第一特征变换模块73,用于依据预先通过样本计算获得的线性变换矩阵对所述第一小波特征向量进行特征变换,得到第一变换特征向量;
判决值计算模块74,用于依据所述第一变换特征向量,以及预先通过样本计算获得的各类样本字体的特征参数,计算判决函数值;
字体识别模块75,用于根据所述判决函数值,确定所述待识别图片中的所述字符的字体。
本实施例,通过对待识别图片中的字符进行小波变换,依据预先通过样本计算获得的线性变换矩阵以及各类样本字体的特征参数,计算判决函数值,根据所述判决函数值,确定所述待识别图片中的所述字符的字体,能够有效提升字体识别的准确率。
本实施例中,作为一可选实施例,所述第一小波变换模块71,包括:第一小波变换子模块,用于依据预先设置的小波变换级数,对待识别图片进行小波变换,得到两个以上的第一小波变换子图片;第一特征提取子模块,用于提取各第一小波变换子图片的特征,并将提取的各第一小波变换子图片的特征进行组合,得到第一小波特征向量。
本实施例中,作为一可选实施例,所述第一小波变换子模块,具体用于:根据预先设定的小波变换级数,利用包含相应小波变换级数的尺度函数和小波函数的离散滤波器,对所述待识别图片中的字符进行卷积处理以及亚取样处理。
本实施例中,作为一可选实施例,第一小波变换子模块包括:第一卷积单元、第一亚取样单元、第二卷积及亚取样单元、第三卷积及亚取样单元、第四卷积及亚取样单元、第五卷积及亚取样单元、第六卷积及亚取样单元以及第七卷积及亚取样单元(图中未示出),其中,
第一卷积单元,用于在水平方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,分别对所述待识别图片中的字符进行卷积,得到第一滤波图片以及第二滤波图片;
本实施例中,作为一可选实施例,小波为二次样条(Spline2)小波,利用尺度函数得到的第一离散滤波器(H)为:
根据小波函数得到的第二离散滤波器(G)为:
第一亚取样单元,用于在水平方向,分别对第一滤波图片以及第二滤波图片进行亚取样处理,得到第一图片以及第二图片;
第二卷积及亚取样单元,用于在垂直方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,对所述第一图片进行卷积以及亚取样处理,得到第一级小波变换第一图片以及第一级小波变换第二图片;
第三卷积及亚取样单元,用于在垂直方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,对所述第二图片进行卷积以及亚取样处理,得到第一级小波变换第三图片以及第一级小波变换第四图片;
第四卷积及亚取样单元,用于在水平方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,对所述第一级小波变换第一图片进行卷积以及亚取样处理,得到第三图片以及第四图片;
第五卷积及亚取样单元,用于在垂直方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,分别对第三图片以及第四图片进行卷积以及亚取样处理,得到第二级小波变换第一图片至第二级小波变换第四图片;
第六卷积及亚取样单元,用于在水平方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,分别对所述第二级小波变换第一图片进行卷积以及亚取样处理,得到第五图片以及第六图片;
第七卷积及亚取样单元,用于在垂直方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,对第五图片以及第六图片进行卷积以及亚取样处理,得到第三级小波变换第一图片至第三级小波变换第四图片。
本实施例中,作为一可选实施例,该装置还可包括:噪声处理模块(图中未示出),用于在所述依据预先设置的小波变换级数,对所述待识别图片中的字符进行小波变换之前,对所述图片进行二值化以及噪声去除处理。
本实施例中,对输入的包含文本字符的图片,利用二值化、噪声去除等方法进行预处理,将字符(前景)与背景色分离。作为一可选实施例,将背景信息处理为白色,前景信息处理为黑色。
本实施例中,作为一可选实施例,第一特征提取子模块包括:子块划分单元、子块特征统计单元以及小波特征获取单元(图中未示出),其中,子块划分单元,用于按照预先设置的子块划分策略,对得到的小波变换子图片中的每一级小波变换子图片进行子块划分;
本实施例中,作为一可选实施例,子块划分单元具体用于:对于最后一级小波变换之外的其它各级小波变换,根据如下公式确定将每一小波变换子图片划分成子块的数量:
Qj=2-j-2N×2-j-2N;
对于最后一级小波变换,根据如下公式确定将每一小波变换子图片划分成子块的数量:Qj=2-jN×2-jN;
式中,Qj表示将每一小波变换子图片划分成子块的数量;j表示当前级数;原始待识别图片的分辨率大小为N×N。
作为一可选实施例,原始待识别图片的分辨率大小为48×48时,子块划分单元可包括:第一级子块划分子单元、第二级子块划分子单元以及第三级子块划分子单元,其中,
第一级子块划分子单元,用于对于第一级小波变换第二图片至第一级小波变换第四图片,将每一图片划分为6X6个第一级子块;
第二级子块划分子单元,用于对于第二级小波变换第二图片至第二级小波变换第四图片,将每一图片划分为3X3个第二级子块;为了提高识别的精度,所述第二级子块划分子单元,也可用于对于第二级小波变换第二图片至第二级小波变换第四图片,将每一图片划分为4X4个第二级子块;
第三级子块划分子单元,用于对于第三级小波变换第一图片至第三级小波变换第四图片,每一图片为一第三级子块。
子块特征统计单元,用于统计每一子块中子波系数绝对值的加权和,得到对应子块的一维特征;
本实施例中,作为一可选实施例,子块特征统计单元包括:子块特征第一统计子单元以及子块特征第二统计子单元,其中,
子块特征第一统计子单元,用于对于第一级子块以及第二级子块,利用高斯加权函数统计子块的像素绝对值,将统计的像素绝对值相加,得到子块的一维特征;
子块特征第二统计子单元,用于对于第三级子块,将子块的每一像素绝对值作为一维特征。
本实施例中,作为另一可选实施例,子块特征统计单元还包括:修整子单元,用于利用Box-Cox变换公式对子块的一维特征进行修整。
本实施例中,Box-Cox变换公式如下:
y=ln(x),@=0;
式中,@为Box-Cox变换参数。本实施例中,设置@=0.7。
小波特征获取单元,用于将所有子块的一维特征进行组合,得到待识别图片的第一小波特征向量。
本实施例中,对于第一级小波变换第二图片至第一级小波变换第四图片,每一图片包含36个第一级子块,每一第一级子块对应一维特征,每一图片对应36维特征,3个图片共有108维特征;
对于第二级小波变换第二图片至第二级小波变换第四图片,每一图片包含16个第二级子块,每一第二级子块对应一维特征,每一图片对应16维特征,3个图片共有48维特征;
对于第三级小波变换第一图片至第三级小波变换第四图片,每一图片包含36个像素点,每一像素点对应一维特征,每一图片对应36维特征,4个图片共有144维特征。
因而,本实施例中,将所有子块的一维特征进行组合,得到图片的小波特征维数为108+48+144=300。
本实施例中,作为一可选实施例,所述第一特征变换模块73,具体用于:获取所述线性变换矩阵的转置矩阵;计算转置矩阵与所述第一小波特征向量的积,得到第一变换特征向量。具体来讲,本实施例中,利用下式得到第一变换特征向量Y:
Y=WTV;
式中,WT表示所述线性变换矩阵的转置矩阵;V表示所述第一小波特征向量。
作为一可选实施例,所述第一特征变换模块73,具体用于:获取所述线性变换矩阵的转置矩阵;计算转置矩阵与所述第一小波特征向量的积,得到第一变换特征向量。
图9为本发明的实施例三基于图片的字体识别装置结构示意图,如图9所示,为了确定所述线性变换矩阵,本实施例中,作为一可选实施例,所述的基于图片的字体识别装置,还包括:第二小波变换模块76以及线性变换矩阵确定模块78;其中,第二小波变换模块76,用于依据预先设置的小波变换级数,对样本进行小波变换,得到第二小波特征向量;线性变换矩阵确定模块78,用于依据所述第二小波特征向量,确定所述线性变换矩阵。
本实施例中,作为一可选实施例,所述第二小波变换模块76,包括:第二小波变换子模块,用于依据预先设置的小波变换级数,对第j类样本中第i个样本字符进行小波变换,得到所述第i个样本字符的两个以上小波变换子图片;其中,1≤j≤C,C表示样本字体类别数目,1≤i≤Nj,Nj表示第j类样本中的样本数;第二特征提取子模块,用于提取所述第i个样本字符的各小波变换子图片的特征,并将提取的所述第i个样本字符的各小波变换子图片的特征进行组合,得到所述第i个样本的第二小波特征向量。
本实施例中,作为一可选实施例,所述第二小波变换子模块,具体用于:根据预先设定的小波变换级数,利用包含相应小波变换级数的尺度函数和小波函数的离散滤波器,对第j类样本中第i个样本字符进行卷积处理以及亚取样处理。所述第二小波变换子模块的具体工作过程与所述第一小波变换子模块的相似,在此不再赘述。
本实施例中,所述第二特征提取子模块的具体工作过程和方法与第一特征提取子模块相似,在此不再赘述。
本实施例中,作为一可选实施例,所述线性变换矩阵确定模块78,包括:均值计算子模块、散度矩阵计算子模块、组合矩阵计算子模块、第一分解子模块以及向量提取子模块;其中,均值计算子模块,用于计算每类样本的第二小波特征向量均值以及所有类样本的第二小波特征向量均值;散度矩阵计算子模块,用于依据每类样本的第二小波特征向量均值以及所有类样本的第二小波特征向量均值,计算类内散度矩阵以及类间散度矩阵;组合矩阵计算子模块,用于依据类内散度矩阵以及类间散度矩阵,计算得到组合矩阵;第一分解子模块,用于对组合矩阵进行特征值和特征向量分解,得到按值的大小降序排列特征向量;向量提取子模块,用于提取特征向量中前m个特征向量,得到所述线性变换矩阵,其中,m为预先设置的常数。
作为一可选实施例,所述均值计算子模块,可分别利用下式计算每类样本的第二小波特征向量均值以及所有类样本的第二小波特征向量均值:
式中,
uj表示第j类样本的第二小波特征向量均值;u表示所有类样本的第二小波特征向量均值;Vi (j)表示第j类样本中第i个样本的第二小波特征向量;Nj表示第j类样本中的样本数;C表示样本字体类别数目。
本实施例中,作为一可选实施例,所述散度矩阵计算子模块,具体用于依据如下公式计算类内散度矩阵以及类间散度矩阵:
式中,Sw表示类内散度矩阵;Sb表示类间散度矩阵;u表示所有类样本的第二小波特征向量均值;uj表示第j类样本的第二小波特征向量均值;Vi表示第i个样本的第二小波特征向量;Nj表示第j类样本中的样本数;C表示样本字体类别数目。
本实施例中,作为一可选实施例,所述组合矩阵计算子模块,具体用于:获取类内散度矩阵的逆矩阵;将类内散度矩阵与类间散度矩阵相加,得到和矩阵;计算和矩阵与逆矩阵的积,得到组合矩阵。
本实施例中,组合矩阵为对组合矩阵进行特征值和特征向量分解,得到按特征值的大小降序排列的特征值{γi,i=1,2,...}和特征向量{εi,i=1,2,...,n}。
本实施例中,作为一可选实施例,所述向量提取子模块,用前m个特征向量组成如下的线性变换矩阵:W=[ε1,ε2,...,εm];本实施例中,作为一可选实施例,预先设置的常数m为256。
参看图9,在确定所述线性变换矩阵,为了获取各类样本字体的特征参数,本实施例中,作为一可选实施例,所述的基于图片的字体识别装置,还包括:第二特征变换模块79,用于依据所述线性变换矩阵,对各类样本中各样本的第二小波特征向量进行特征变换,得到第二变换特征向量;均值和协方差矩阵计算模块80,用于计算各类样本中各样本的第二变换特征向量的均值和协方差矩阵;特征参数获取模块81,用于依据各类样本中各样本的第二变换特征向量的均值和协方差矩阵,计算得到各类样本字体的特征参数并进行存储。
本实施例中,作为一可选实施例,所述第二特征变换模块79,具体用于依据如下公式,对第j类样本中第i个样本的第二小波特征向量进行特征变换,得到第二变换特征向量Yi (j)
Yi (j)=WTVi (j)
式中,WT为所述线性变换矩阵的转置矩阵;Vi (j)为第j类样本中第i个样本的第二小波特征向量。
本实施例中,作为一可选实施例,所述均值和协方差矩阵计算模块80,具体用于依据如下公式,计算各类样本中各样本的第二变换特征向量的均值Uj和协方差矩阵∑j:
式中,Yi (j)表示第j类样本中第i个样本的第二小波特征向量进行特征变换后,得到的第二变换特征向量;Nj表示第j类样本中的样本数。
本实施例中,作为一可选实施例,所述特征参数获取模块81,包括:第二分解子模块、替代值计算子模块以及特征参数获取子模块;其中,
第二分解子模块,用于对各类样本中各样本的第二变换特征向量的协方差矩阵∑j进行特征值和特征向量分解,得到按值大小降序排列的特征值和特征向量
替代值计算子模块,用于依据所述协方差矩阵的特征值,依据如下公式计算所述协方差矩阵的特征值的替代值β:
式中,C表示样本字体类别数目;表示第j类样本中各样本的第二变换特征向量的协方差矩阵的特征值;k为小于m的正整数,m为所述线性变换矩阵的维数;
特征参数获取子模块,用于将计算得到的所述各类样本中各样本的第二变换特征向量的均值、所述协方差矩阵的特征值、所述协方差矩阵的特征向量、及所述协方差矩阵的特征值的替代值,作为对应字体类别的特征参数进行存储。
本实施例中,作为一可选实施例,所述判决值计算模块74,具体用于依据如下公式计算第j类样本对应的判决函数值
式中,表示第j类样本中各样本的第二变换特征向量的协方差矩阵的特征值;β表示第j类样本中各样本的第二变换特征向量的协方差矩阵的特征值的替代值;表示第j类样本中各样本的第二变换特征向量的协方差矩阵的特征向量;Uj表示第j类样本中各样本的第二变换特征向量的均值;Y表示所述第一变换特征向量;k为小于m的正整数,m为所述线性变换矩阵的维数。
本实施例的装置,可以用于执行图1所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
本实施例中,作为一可选实施例,所述字体识别模块,具体用于将计算得到的各判决函数值中最小的判决函数值所对应的一类样本字体,作为所述待识别图片中的字符的字体。
例如,在一实施例中,预先确定有第1类样本、第2类样本及第3类样本共三类样本,第1类样本中字符的字体为宋体,第2类样本中字符的字体为楷体,第3类样本中字符的字体为隶书。
可预先分别计算获得第1类、第2类及第3类样本中字体的所述特征参数。
依据所述第一变换特征向量,以及预先通过计算获得的第1类样本中字体的特征参数,可计算得到第一判决函数值;依据所述第一变换特征向量,以及预先通过计算获得的第2类样本中字体的特征参数,可计算得到第二判决函数值;依据所述第一变换特征向量,以及预先通过计算获得的第3类样本中字体的特征参数,可计算得到第三判决函数值。
若通过比较上述三个判决函数值的大小,得到第二判决函数值最小,则可确定所述待识别图片中的字符的字体为楷体。
为了提高字体识别的准确性,本实施例中,作为一可选实施例,所述装置还包括;样本增加模块,用于将所述待识别图片加入到一类样本中,其中,所述待识别图片中的字符的字体与该类样本中字符的字体相一致,这样能够自动增加该类样本中样本的数量。
为控制某类样本中样本的数量,不至于出现其中样本的数量过多的情况,针对某类样本,可设定该类样本中样本数量的阈值,通过判断该类样本中当前的样本数量是否超过所述阈值,若未超过,则在该类样本中增加样本的数量。具体来讲,本实施例中,作为一可选实施例,所述样本增加模块,具体用于判断所述待识别图片所要加入的一类样本中的样本数是否超过阈值,若未超过阈值,则将所述待识别图片加入到该类样本中,否则,则不将所述待识别图片加入到该类样本中。
本实施例中,作为一可选实施例,所述装置还包括;更新模块,用于在所述样本增加模块将所述待识别图片加入到一类样本中之后,计算新的线性变换矩阵以及新的样本字体的特征参数;利用所述新的线性变换矩阵以及新的样本字体的特征参数,对所述线性变换矩阵以及所述样本字体的特征参数进行更新。这样,能够实现样本的数量、根据样本计算的线性变换矩阵、以及样本字体的特征参数的动态更新,使得识别结果更加准确。
图10为本发明实施例四电子设备的结构示意图。参看图10,本发明实施例一种电子设备,包括:壳体41、处理器42、存储器43、电路板44和电源电路45,其中,电路板44安置在壳体41围成的空间内部,处理器42和存储器43设置在电路板44上;电源电路45,用于为上述电子设备的各个电路或器件供电;存储器43用于存储可执行程序代码;处理器42通过读取存储器43中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行前述任一实施例所述的基于图片的字体识别方法。
该电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放模块(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)其他具有数据交互功能的电子设备。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
为了描述的方便,描述以上装置是以功能分为各种单元/模块分别描述。当然,在实施本发明时可以把各单元/模块的功能在同一个或多个软件和/或硬件中实现。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (50)

1.一种基于图片的字体识别方法,其特征在于,包括:
依据预先设置的小波变换级数,对待识别图片进行小波变换,得到第一小波特征向量;
依据预先通过样本计算获得的线性变换矩阵对所述第一小波特征向量进行特征变换,得到第一变换特征向量;
依据所述第一变换特征向量,以及预先通过样本计算获得的样本字体的特征参数,计算判决函数值;
根据所述判决函数值,确定所述待识别图片中的字符的字体。
2.根据权利要求1所述的基于图片的字体识别方法,其特征在于,所述依据预先设置的小波变换级数,对待识别图片进行小波变换,得到第一小波特征向量,包括:
依据预先设置的小波变换级数,对待识别图片进行小波变换,得到两个以上的第一小波变换子图片;
提取各第一小波变换子图片的特征,并将提取的各第一小波变换子图片的特征进行组合,得到第一小波特征向量。
3.根据权利要求1所述的基于图片的字体识别方法,其特征在于,
在依据预先设置的小波变换级数,对待识别图片中的字符进行小波变换,得到第一小波特征向量之前,所述方法,还包括:
依据预先设置的小波变换级数,对样本进行小波变换,得到第二小波特征向量;
依据所述第二小波特征向量,确定所述线性变换矩阵。
4.根据权利要求3所述的基于图片的字体识别方法,其特征在于,所述依据预先设置的小波变换级数,对样本进行小波变换,得到第二小波特征向量,包括:
依据预先设置的小波变换级数,对第j类样本中第i个样本字符进行小波变换,得到所述第i个样本字符的两个以上小波变换子图片;其中,1≤j≤C,C表示样本字体类别数目,1≤i≤Nj,Nj表示第j类样本中的样本数;
提取所述第i个样本字符的各小波变换子图片的特征,并将提取的所述第i个样本字符的各小波变换子图片的特征进行组合,得到所述第i个样本的第二小波特征向量。
5.根据权利要求4所述的基于图片的字体识别方法,其特征在于,所述依据所述第二小波特征向量,确定所述线性变换矩阵,包括:
计算每类样本中各样本的第二小波特征向量均值以及所有类样本中各样本的第二小波特征向量均值;
依据每类样本中各样本的第二小波特征向量均值以及所有类样本中各样本的第二小波特征向量均值,计算类内散度矩阵以及类间散度矩阵;
依据类内散度矩阵以及类间散度矩阵,计算得到组合矩阵,对组合矩阵进行特征值和特征向量分解,得到按值的大小降序排列特征向量;
提取特征向量中前m个特征向量,得到所述线性变换矩阵,其中,m为预先设置的常数。
6.根据权利要求5所述的基于图片的字体识别方法,其特征在于,所述依据每类样本中各样本的第二小波特征向量均值以及所有类样本中各样本的第二小波特征向量均值,计算类内散度矩阵以及类间散度矩阵,包括:
依据如下公式计算类内散度矩阵以及类间散度矩阵:
式中,
Sw表示类内散度矩阵;
Sb表示类间散度矩阵;
u表示所有类样本中各样本的第二小波特征向量均值;
uj表示第j类样本中各样本的第二小波特征向量均值;
Vi表示第i个样本的第二小波特征向量;
Nj表示第j类样本中的样本数;
C表示样本字体类别数目。
7.根据权利要求5所述的基于图片的字体识别方法,其特征在于,所述依据类内散度矩阵以及类间散度矩阵,计算得到组合矩阵包括:
获取类内散度矩阵的逆矩阵;
将类内散度矩阵与类间散度矩阵相加,得到和矩阵;
计算和矩阵与逆矩阵的积,得到组合矩阵。
8.根据权利要求3或4所述的基于图片的字体识别方法,其特征在于,在确定所述线性变换矩阵之后,所述方法,还包括:
依据所述线性变换矩阵,对各类样本中各样本的第二小波特征向量进行特征变换,得到各类样本中各样本的第二变换特征向量;
计算各类样本中各样本的第二变换特征向量的均值和协方差矩阵;
依据各类样本中各样本的第二变换特征向量的均值和协方差矩阵,计算得到各类样本字体的特征参数并进行存储。
9.根据权利要求8所述的基于图片的字体识别方法,其特征在于,所述依据所述线性变换矩阵,对各类样本中各样本的第二小波特征向量进行特征变换,得到各类样本中各样本的第二变换特征向量,包括:
依据如下公式,对第j类样本中第i个样本的第二小波特征向量进行特征变换,得到所述第i个样本的第二变换特征向量Yi (j)
Yi (j)=WTVi (j)
式中,
WT为所述线性变换矩阵的转置矩阵;
Vi (j)为第j类样本中第i个样本的第二小波特征向量。
10.根据权利要求8所述的基于图片的字体识别方法,其特征在于,所述计算各类样本中各样本的第二变换特征向量的均值和协方差矩阵,包括:
依据如下公式,计算各类样本中各样本的第二变换特征向量的均值Uj和协方差矩阵∑j:
式中,
Yi (j)表示第j类样本中第i个样本的第二小波特征向量进行特征变换后,得到的第二变换特征向量;
Nj表示第j类样本中的样本数。
11.根据权利要求8所述的基于图片的字体识别方法,其特征在于,所述依据各类样本中各样本的第二变换特征向量的均值和协方差矩阵,计算得到各类样本字体的特征参数并进行存储,包括:
对各类样本中各样本的第二变换特征向量的协方差矩阵进行特征值和特征向量分解,得到按值大小降序排列的特征值和特征向量;
依据所述协方差矩阵的特征值,依据如下公式计算所述协方差矩阵的特征值的替代值β:
式中,C表示样本字体类别数目;表示第j类样本中各样本的第二变换特征向量的协方差矩阵的特征值;k为小于m的正整数,m为所述线性变换矩阵的维数;
将计算得到的所述各类样本中各样本的第二变换特征向量的均值、所述协方差矩阵的特征值、所述协方差矩阵的特征向量、及所述协方差矩阵的特征值的替代值,作为对应字体类别的特征参数进行存储。
12.根据权利要求1或3所述的基于图片的字体识别方法,其特征在于,所述依据预先设置的小波变换级数,对待识别图片或样本进行小波变换包括:
根据预先设定的小波变换级数,利用包含相应小波变换级数的尺度函数和小波函数的离散滤波器,对所述待识别图片或样本进行卷积处理以及亚取样处理。
13.根据权利要求12所述的基于图片的字体识别方法,其特征在于,所述根据预先设定的小波变换级数,利用包含相应小波变换级数的尺度函数和小波函数的离散滤波器,对所述待识别图片或样本进行卷积处理以及亚取样处理包括:
在水平方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,分别对所述待识别图片或样本进行卷积,得到第一滤波图片以及第二滤波图片;
在水平方向,分别对第一滤波图片以及第二滤波图片进行亚取样处理,得到第一图片以及第二图片;
在垂直方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,对所述第一图片进行卷积以及亚取样处理,得到第一级小波变换第一图片以及第一级小波变换第二图片;
在垂直方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,对所述第二图片进行卷积以及亚取样处理,得到第一级小波变换第三图片以及第一级小波变换第四图片;
在水平方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,对所述第一级小波变换第一图片进行卷积以及亚取样处理,得到第三图片以及第四图片,再在垂直方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,分别对第三图片以及第四图片进行卷积以及亚取样处理,得到第二级小波变换第一图片至第二级小波变换第四图片;
在水平方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,分别对所述第二级小波变换第一图片进行卷积以及亚取样处理,得到第五图片以及第六图片,再在垂直方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,对第五图片以及第六图片进行卷积以及亚取样处理,得到第三级小波变换第一图片至第三级小波变换第四图片。
14.根据权利要求2或4所述的基于图片的字体识别方法,其特征在于,所述提取各第一小波变换子图片的特征,并将提取的各第一小波变换子图片的特征进行组合,得到第一小波特征向量,或者所述提取第i个样本字符的各小波变换子图片的特征,并将提取的所述第i个样本字符的各小波变换子图片的特征进行组合,得到所述第i个样本的第二小波特征向量,包括:
按照预先设置的子块划分策略,对得到的小波变换子图片中的每一级小波变换子图片进行子块划分;
统计每一子块中子波系数绝对值的加权和,得到对应子块的一维特征;
将所有子块的一维特征进行组合,得到待识别图片的第一小波特征向量或所述第i个样本的第二小波特征向量。
15.根据权利要求14所述的基于图片的字体识别方法,其特征在于,所述按照预先设置的子块划分策略,对得到的小波变换子图片中的每一级小波变换子图片进行子块划分包括:
对于最后一级小波变换之外的其它各级小波变换,根据如下公式确定将每一小波变换子图片划分成子块的数量:
Qj=2-j-2N×2-j-2N;
对于最后一级小波变换,根据如下公式确定将每一小波变换子图片划分成子块的数量:Qj=2-jN×2-jN;
式中,
Qj表示将每一小波变换子图片划分成子块的数量;
j表示当前级数;
原始待识别图片的分辨率大小为N×N。
16.根据权利要求14所述的基于图片的字体识别方法,其特征在于,所述统计每一子块中子波系数绝对值的加权和,得到对应子块的一维特征包括:
对于第一级子块以及第二级子块中的每个子块,利用高斯加权函数统计子块的像素绝对值,将统计的像素绝对值相加,得到对应子块的一维特征;
对于第三级子块,将子块的每一像素绝对值作为一维特征。
17.根据权利要求14所述的基于图片的字体识别方法,其特征在于,在所述得到子块的一维特征之后,所述方法进一步包括:
利用Box-Cox变换公式对子块的一维特征进行修整。
18.根据权利要求1所述的基于图片的字体识别方法,其特征在于,所述依据预先通过样本计算获得的线性变换矩阵对所述第一小波特征向量进行特征变换,得到第一变换特征向量,包括:
获取所述线性变换矩阵的转置矩阵;
计算转置矩阵与所述第一小波特征向量的积,得到第一变换特征向量。
19.根据权利要求1所述的基于图片的字体识别方法,其特征在于,所述依据所述第一变换特征向量,以及预先通过样本计算获得的样本字体的特征参数,计算判决函数值,包括:
依据所述第一变换特征向量,以及预先通过样本计算获得的各类样本字体的特征参数,分别计算各类样本字体的特征参数所对应的判决函数值。
20.根据权利要求19所述的基于图片的字体识别方法,其特征在于,所述依据所述第一变换特征向量,以及预先通过样本计算获得的各类样本字体的特征参数,分别计算各类样本字体的特征参数所对应的判决函数值,包括:
依据如下公式计算第j类样本字体的特征参数对应的判决函数值
式中,
表示第j类样本中各样本的第二变换特征向量的协方差矩阵的特征值;
β表示第j类样本中各样本的第二变换特征向量的协方差矩阵的特征值的替代值;
表示第j类样本中各样本的第二变换特征向量的协方差矩阵的特征向量;
Uj表示第j类样本中各样本的第二变换特征向量的均值;
Y表示所述第一变换特征向量;
k为小于m的正整数,m为所述线性变换矩阵的维数。
21.根据权利要求19所述的基于图片的字体识别方法,其特征在于,所述根据所述判决函数值,确定所述待识别图片中的字符的字体,包括:
将计算得到的各判决函数值中最小的判决函数值所对应的一类样本字体,作为所述待识别图片中的字符的字体。
22.根据权利要求1所述的基于图片的字体识别方法,其特征在于,在确定出所述待识别图片中的字符的字体之后,所述方法还包括:
将所述待识别图片加入到一类样本中,其中,所述待识别图片中的字符的字体与该类样本中字符的字体相一致。
23.根据权利要求22所述的基于图片的字体识别方法,其特征在于,所述将所述待识别图片加入到一类样本中,包括:
判断所述待识别图片所要加入的一类样本中的样本数是否超过阈值,若未超过阈值,则将所述待识别图片加入到该类样本中,否则,则不将所述待识别图片加入到该类样本中。
24.根据权利要求22所述的基于图片的字体识别方法,其特征在于,在将所述待识别图片加入到一类样本中之后,所述方法还包括:
计算新的线性变换矩阵以及新的样本字体的特征参数;
利用所述新的线性变换矩阵以及新的样本字体的特征参数,对所述线性变换矩阵以及所述样本字体的特征参数进行更新。
25.一种基于图片的字体识别装置,其特征在于,包括:第一小波变换模块、第一特征变换模块、判决值计算模块以及字体识别模块,其中,
第一小波变换模块,用于依据预先设置的小波变换级数,对待识别图片进行小波变换,得到第一小波特征向量;
第一特征变换模块,用于依据预先通过样本计算获得的线性变换矩阵对所述第一小波特征向量进行特征变换,得到第一变换特征向量;
判决值计算模块,用于依据所述第一变换特征向量,以及预先通过样本计算获得的样本字体的特征参数,计算判决函数值;
字体识别模块,用于根据所述判决函数值,确定所述待识别图片中的字符的字体。
26.根据权利要求25所述的基于图片的字体识别装置,其特征在于,所述第一小波变换模块,包括:
第一小波变换子模块,用于依据预先设置的小波变换级数,对待识别图片进行小波变换,得到两个以上的第一小波变换子图片;
第一特征提取子模块,用于提取各第一小波变换子图片的特征,并将提取的各第一小波变换子图片的特征进行组合,得到第一小波特征向量。
27.根据权利要求25所述的基于图片的字体识别装置,其特征在于,还包括:
第二小波变换模块,用于依据预先设置的小波变换级数,对样本进行小波变换,得到第二小波特征向量;
线性变换矩阵确定模块,用于依据所述第二小波特征向量,确定所述线性变换矩阵。
28.根据权利要求27所述的基于图片的字体识别装置,其特征在于,所述第二小波变换模块,包括:
第二小波变换子模块,用于依据预先设置的小波变换级数,对第j类样本中第i个样本字符进行小波变换,得到所述第i个样本字符的两个以上小波变换子图片;其中,1≤j≤C,C表示样本字体类别数目,1≤i≤Nj,Nj表示第j类样本中的样本数;
第二特征提取子模块,用于提取所述第i个样本字符的各小波变换子图片的特征,并将提取的所述第i个样本字符的各小波变换子图片的特征进行组合,得到所述第i个样本的第二小波特征向量。
29.根据权利要求27所述的基于图片的字体识别装置,其特征在于,
所述线性变换矩阵确定模块,包括:
均值计算子模块,用于计算每类样本中各样本的第二小波特征向量均值以及所有类样本中各样本的第二小波特征向量均值;
散度矩阵计算子模块,用于依据每类样本中各样本的第二小波特征向量均值以及所有类样本中各样本的第二小波特征向量均值,计算类内散度矩阵以及类间散度矩阵;
组合矩阵计算子模块,用于依据类内散度矩阵以及类间散度矩阵,计算得到组合矩阵;
第一分解子模块,用于对组合矩阵进行特征值和特征向量分解,得到按值的大小降序排列特征向量;
向量提取子模块,用于提取特征向量中前m个特征向量,得到所述线性变换矩阵,其中,m为预先设置的常数。
30.根据权利要求29所述的基于图片的字体识别装置,其特征在于,所述散度矩阵计算子模块,具体用于依据如下公式计算类内散度矩阵以及类间散度矩阵:
式中,
Sw表示类内散度矩阵;
Sb表示类间散度矩阵;
u表示所有类样本中各样本的第二小波特征向量均值;
uj表示第j类样本中各样本的第二小波特征向量均值;
Vi表示第i个样本的第二小波特征向量;
Nj表示第j类样本中的样本数;
C表示样本字体类别数目。
31.根据权利要求29所述的基于图片的字体识别装置,其特征在于,所述组合矩阵计算子模块,具体用于:
获取类内散度矩阵的逆矩阵;将类内散度矩阵与类间散度矩阵相加,得到和矩阵;计算和矩阵与逆矩阵的积,得到组合矩阵。
32.根据权利要求27或28所述的基于图片的字体识别装置,其特征在于,还包括:
第二特征变换模块,用于依据所述线性变换矩阵,对各类样本中各样本的第二小波特征向量进行特征变换,得到各类样本中各样本的第二变换特征向量;
均值和协方差矩阵计算模块,用于计算各类样本中各样本的第二变换特征向量的均值和协方差矩阵;
特征参数获取模块,用于依据各类样本中各样本的第二变换特征向量的均值和协方差矩阵,计算得到各类样本字体的特征参数并进行存储。
33.根据权利要求32所述的基于图片的字体识别装置,其特征在于,所述第二特征变换模块,具体用于依据如下公式,对第j类样本中第i个样本的第二小波特征向量进行特征变换,得到所述第i个样本的第二变换特征向量Yi (j)
Yi (j)=WTVi (j)
式中,
WT为所述线性变换矩阵的转置矩阵;
Vi (j)为第j类样本中第i个样本的第二小波特征向量。
34.根据权利要求32所述的基于图片的字体识别装置,其特征在于,所述均值和协方差矩阵计算模块,具体用于依据如下公式,计算各类样本中各样本的第二变换特征向量的均值Uj和协方差矩阵∑j:
式中,
Yi (j)表示第j类样本中第i个样本的第二小波特征向量进行特征变换后,得到的第二变换特征向量;
Nj表示第j类样本中的样本数。
35.根据权利要求32所述的基于图片的字体识别装置,其特征在于,所述特征参数获取模块,包括:
第二分解子模块,用于对各类样本中各样本的第二变换特征向量的协方差矩阵进行特征值和特征向量分解,得到按值大小降序排列的特征值和特征向量;
替代值计算子模块,用于依据所述协方差矩阵的特征值,依据如下公式计算所述协方差矩阵的特征值的替代值β:
式中,C表示样本字体类别数目;表示第j类样本中的第二变换特征向量的协方差矩阵的特征值;k为小于m的正整数,m为所述线性变换矩阵的维数;
特征参数获取子模块,用于将计算得到的所述各类样本中各样本的第二变换特征向量的均值、所述协方差矩阵的特征值、所述协方差矩阵的特征向量、及所述协方差矩阵的特征值的替代值,作为对应字体类别的特征参数进行存储。
36.根据权利要求26所述的基于图片的字体识别装置,其特征在于,
所述第一小波变换子模块,具体用于:根据预先设定的小波变换级数,利用包含相应小波变换级数的尺度函数和小波函数的离散滤波器,对所述待识别图片中的字符进行卷积处理以及亚取样处理。
37.根据权利要求28所述的基于图片的字体识别方法,其特征在于,所述第二小波变换子模块,具体用于:根据预先设定的小波变换级数,利用包含相应小波变换级数的尺度函数和小波函数的离散滤波器,对第j类样本中第i个样本字符进行卷积处理以及亚取样处理。
38.根据权利要求36或37所述的基于图片的字体识别装置,其特征在于,所述第一小波变换子模块或所述第二小波变换子模块包括:第一卷积单元、第一亚取样单元、第二卷积及亚取样单元、第三卷积及亚取样单元、第四卷积及亚取样单元、第五卷积及亚取样单元、第六卷积及亚取样单元以及第七卷积及亚取样单元,其中,
第一卷积单元,用于在水平方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,分别对所述待识别图片中的字符或分别对所述第j类样本中第i个样本字符进行卷积,得到第一滤波图片以及第二滤波图片;
第一亚取样单元,用于在水平方向,分别对第一滤波图片以及第二滤波图片进行亚取样处理,得到第一图片以及第二图片;
第二卷积及亚取样单元,用于在垂直方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,对所述第一图片进行卷积以及亚取样处理,得到第一级小波变换第一图片以及第一级小波变换第二图片;
第三卷积及亚取样单元,用于在垂直方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,对所述第二图片进行卷积以及亚取样处理,得到第一级小波变换第三图片以及第一级小波变换第四图片;
第四卷积及亚取样单元,用于在水平方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,对所述第一级小波变换第一图片进行卷积以及亚取样处理,得到第三图片以及第四图片;
第五卷积及亚取样单元,用于在垂直方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,分别对第三图片以及第四图片进行卷积以及亚取样处理,得到第二级小波变换第一图片至第二级小波变换第四图片;
第六卷积及亚取样单元,用于在水平方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,分别对所述第二级小波变换第一图片进行卷积以及亚取样处理,得到第五图片以及第六图片;
第七卷积及亚取样单元,用于在垂直方向上,利用根据尺度函数得到的第一离散滤波器以及根据小波函数得到的第二离散滤波器,对第五图片以及第六图片进行卷积以及亚取样处理,得到第三级小波变换第一图片至第三级小波变换第四图片。
39.根据权利要求26或28所述的基于图片的字体识别装置,其特征在于,所述第一特征提取子模块或所述第二特征提取子模块包括:子块划分单元、子块特征统计单元以及小波特征获取单元,其中,
子块划分单元,用于按照预先设置的子块划分策略,对得到的小波变换子图片中的每一级小波变换子图片进行子块划分;
子块特征统计单元,用于统计每一子块中子波系数绝对值的加权和,得到对应子块的一维特征;
小波特征获取单元,用于将所有子块的一维特征进行组合,得到待识别图片的第一小波特征向量或所述第i个样本的第二小波特征向量。
40.根据权利要求39所述的基于图片的字体识别装置,其特征在于,所述子块划分单元具体用于:
对于最后一级小波变换之外的其它各级小波变换,根据如下公式确定将每一小波变换子图片划分成子块的数量:
Qj=2-j-2N×2-j-2N;
对于最后一级小波变换,根据如下公式确定将每一小波变换子图片划分成子块的数量:Qj=2-jN×2-jN;
式中,
Qj表示将每一小波变换子图片划分成子块的数量;
j表示当前级数;
原始待识别图片的分辨率大小为N×N。
41.根据权利要求39所述的基于图片的字体识别装置,其特征在于,所述子块特征统计单元包括:子块特征第一统计子单元以及子块特征第二统计子单元,其中,
子块特征第一统计子单元,用于对于第一级子块以及第二级子块中的每个子块,利用高斯加权函数统计子块的像素绝对值,将统计的像素绝对值相加,得到对应子块的一维特征;
子块特征第二统计子单元,用于对于第三级子块,将子块的每一像素绝对值作为一维特征。
42.根据权利要求41所述的基于图片的字体识别装置,其特征在于,所述子块特征统计单元还包括:
修整子单元,用于利用Box-Cox变换公式对子块的一维特征进行修整。
43.根据权利要求25所述的基于图片的字体识别装置,其特征在于,所述第一特征变换模块,具体用于:
获取所述线性变换矩阵的转置矩阵;计算转置矩阵与所述第一小波特征向量的积,得到第一变换特征向量。
44.根据权利要求25所述的基于图片的字体识别装置,其特征在于,所述判决值计算模块,具体用于依据所述第一变换特征向量,以及预先通过样本计算获得的各类样本字体的特征参数,分别计算各类样本字体的特征参数所对应的判决函数值。
45.根据权利要求44所述的基于图片的字体识别装置,其特征在于,所述判决值计算模块,具体用于依据如下公式计算第j类样本字体的特征参数对应的判决函数值
式中,
表示第j类样本中各样本的第二变换特征向量的协方差矩阵的特征值;
β表示第j类样本中各样本的第二变换特征向量的协方差矩阵的特征值的替代值;
表示第j类样本中各样本的第二变换特征向量的协方差矩阵的特征向量;
Uj表示第j类样本中各样本的第二变换特征向量的均值;
Y表示所述第一变换特征向量;
k为小于m的正整数,m为所述线性变换矩阵的维数。
46.根据权利要求44所述的基于图片的字体识别装置,其特征在于,所述字体识别模块,具体用于将计算得到的各判决函数值中最小的判决函数值所对应的一类样本字体,作为所述待识别图片中的字符的字体。
47.根据权利要求44所述的基于图片的字体识别装置,其特征在于,所述装置还包括;
样本增加模块,用于将所述待识别图片加入到一类样本中,其中,所述待识别图片中的字符的字体与该类样本中字符的字体相一致。
48.根据权利要求47所述的基于图片的字体识别装置,其特征在于,所述样本增加模块,具体用于判断所述待识别图片所要加入的一类样本中的样本数是否超过阈值,若未超过阈值,则将所述待识别图片加入到该类样本中,否则,则不将所述待识别图片加入到该类样本中。
49.根据权利要求48所述的基于图片的字体识别装置,其特征在于,所述装置还包括;
更新模块,用于在所述样本增加模块将所述待识别图片加入到一类样本中之后,计算新的线性变换矩阵以及新的样本字体的特征参数;利用所述新的线性变换矩阵以及新的样本字体的特征参数,对所述线性变换矩阵以及所述样本字体的特征参数进行更新。
50.一种电子设备,其特征在于,所述电子设备包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为上述电子设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行前述权利要求1-24任一项所述的方法。
CN201710367878.2A 2017-05-23 2017-05-23 一种基于图片的字体识别方法、装置及电子设备 Pending CN108932454A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710367878.2A CN108932454A (zh) 2017-05-23 2017-05-23 一种基于图片的字体识别方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710367878.2A CN108932454A (zh) 2017-05-23 2017-05-23 一种基于图片的字体识别方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN108932454A true CN108932454A (zh) 2018-12-04

Family

ID=64449758

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710367878.2A Pending CN108932454A (zh) 2017-05-23 2017-05-23 一种基于图片的字体识别方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN108932454A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1437162A (zh) * 2003-03-14 2003-08-20 清华大学 基于单个汉字字符的字体识别方法
CN1570958A (zh) * 2004-04-23 2005-01-26 清华大学 多字体多字号印刷体藏文字符识别方法
CN1664846A (zh) * 2005-04-01 2005-09-07 清华大学 基于统计结构特征的联机手写汉字识别方法
CN101017533A (zh) * 2007-03-09 2007-08-15 清华大学 印刷体蒙古文字符识别方法
CN103295007A (zh) * 2013-05-02 2013-09-11 华南理工大学 一种用于汉字识别的特征降维优化方法
CN105913001A (zh) * 2016-04-06 2016-08-31 南京邮电大学盐城大数据研究院有限公司 基于聚类的在线式多人脸图像处理的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1437162A (zh) * 2003-03-14 2003-08-20 清华大学 基于单个汉字字符的字体识别方法
CN1570958A (zh) * 2004-04-23 2005-01-26 清华大学 多字体多字号印刷体藏文字符识别方法
CN1664846A (zh) * 2005-04-01 2005-09-07 清华大学 基于统计结构特征的联机手写汉字识别方法
CN101017533A (zh) * 2007-03-09 2007-08-15 清华大学 印刷体蒙古文字符识别方法
CN103295007A (zh) * 2013-05-02 2013-09-11 华南理工大学 一种用于汉字识别的特征降维优化方法
CN105913001A (zh) * 2016-04-06 2016-08-31 南京邮电大学盐城大数据研究院有限公司 基于聚类的在线式多人脸图像处理的方法

Similar Documents

Publication Publication Date Title
Ma et al. Evaluation and acceleration of high-throughput fixed-point object detection on FPGAs
CN111950723B (zh) 神经网络模型训练方法、图像处理方法、装置及终端设备
US8750573B2 (en) Hand gesture detection
US8792722B2 (en) Hand gesture detection
CN110738207A (zh) 一种融合文字图像中文字区域边缘信息的文字检测方法
Dev et al. Categorization of cloud image patches using an improved texton-based approach
CN111179419A (zh) 三维关键点预测及深度学习模型训练方法、装置及设备
CN105069774B (zh) 基于多示例学习与图割优化的目标分割方法
CN109117480A (zh) 词预测方法、装置、计算机设备及存储介质
CN105654122B (zh) 基于核函数匹配的空间金字塔物体识别方法
CN107704797B (zh) 基于安防视频中行人和车辆的实时检测方法和系统及设备
CN112465801B (zh) 一种分尺度提取掩码特征的实例分割方法
US20160189396A1 (en) Image processing
CN106297755A (zh) 一种用于乐谱图像识别的电子设备及识别方法
CN103336942A (zh) 一种基于Radon BEMD变换的国画鉴定方法
CN108351962A (zh) 具有自适应性通道特征的对象检测
Kam et al. Content based image retrieval through object extraction and querying
CN103839066A (zh) 一种源于生物视觉的特征提取方法
CN109447943B (zh) 一种目标检测方法、系统及终端设备
CN109635755A (zh) 人脸提取方法、装置及存储介质
CN112818774A (zh) 一种活体检测方法及装置
CN112215241A (zh) 一种基于小样本学习的图像特征提取装置
CN108932454A (zh) 一种基于图片的字体识别方法、装置及电子设备
CN108960285B (zh) 一种分类模型生成方法、舌体图像分类方法及装置
CN110909819A (zh) 基于时域的电磁信息泄漏检测方法、终端设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181204

RJ01 Rejection of invention patent application after publication