CN104573683A - 字符串识别方法和装置 - Google Patents
字符串识别方法和装置 Download PDFInfo
- Publication number
- CN104573683A CN104573683A CN201310495142.5A CN201310495142A CN104573683A CN 104573683 A CN104573683 A CN 104573683A CN 201310495142 A CN201310495142 A CN 201310495142A CN 104573683 A CN104573683 A CN 104573683A
- Authority
- CN
- China
- Prior art keywords
- candidate
- characters pattern
- character string
- candidate characters
- path
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
本发明涉及一种字符串识别方法和装置。一种字符串识别方法,包括:将包含字符串的图像切分为多个基本单元,每个基本单元包含一个字符或者一个字符的部件;以一个基本单元或多个相邻基本单元的组合构成候选字符模式,以形成切分候选网格;由多个识别器分别对所述切分候选网格中的每个所述候选字符模式进行识别,以得到切分识别候选网格;根据所述多个识别器对每个所述候选字符模式的识别结果,对所述切分识别候选网格中的候选路径进行过滤;以及在经过过滤的候选路径中搜索最优路径,以得到字符串识别结果。通过本发明,可以简化切分识别候选网格,加速路径搜索过程。
Description
技术领域
本发明涉及字符识别领域,更具体地涉及一种用于识别图像中的字符串的方法和装置。
背景技术
近几十年来,手写体或印刷体的中文字符识别技术在工业界和研究领域得到了广泛的关注并取得了很多进展。然而,目前基于单字的识别技术研究得比较多,而基于整串的汉字识别仅在某些受限的领域有应用。这是因为通用性汉字识别是一项复杂的任务,书写风格,语言字符集,字符内部组件间距与字符间距的混淆,相邻字符粘连等因素直接影响汉字识别精度。
为解决以上问题,本领域的传统方法是将字符切分与识别纳入一个统一的优化框架,首先,生成大量字符切分的候选,然后结合识别置信度与语言模型来评价所有可能的候选,最终得到识别结果。文献【1】将基于字符的N阶语言模型与字符切分结合。文献【2】提出一种融合单字和词级别语言模型的手写汉字识别方法。
从大量字符切分的候选得到最终的识别结果是一个耗时的过程,因此需要一种能够快速对字符串进行识别的方法。
[非专利文献1]Q.-F Wang,F.Yin,C.-L.Liu.Handwritten ChineseText Recognition by Integrating Multiple Contexts.IEEE Trans.PatternAnal.Mach.Intell.,2011。
[非专利文献2]Y.Jiang,X.Q.Ding,Q.Fu,Z.Ren,Context drivenChinese string segmentation and recognition.Structural,Syntactic,andStatistical Pattern Recognition:Joint IAPR Int.Workshops,LNCSVol.4109,pp127-135。
发明内容
在下文中给出关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
本发明的一个主要目的在于,提供一种字符串识别方法,包括:将包含字符串的图像切分为多个基本单元,每个基本单元包含一个字符或者一个字符的部件;以一个基本单元或多个相邻基本单元的组合构成候选字符模式,以形成切分候选网格;由多个识别器分别对所述切分候选网格中的每个所述候选字符模式进行识别,以得到切分识别候选网格;根据所述多个识别器对每个所述候选字符模式的识别结果,对所述切分识别候选网格中的候选路径进行过滤;以及在经过过滤的候选路径中搜索最优路径,以得到字符串识别结果。
根据本发明的一个方面,提供了一种字符串识别装置,包括:图像切分单元,用于将包含字符串的图像切分为多个基本单元,每个基本单元包含一个字符或者一个字符的部件;候选字符模式构成单元,用于将一个基本单元或多个相邻基本单元的组合构成候选字符模式,以形成切分候选网格;切分识别候选网格形成单元,用于通过多个识别器分别对所述切分候选网格中的每个所述候选字符模式进行识别,以得到切分识别候选网格;候选路径过滤单元,用于根据所述多个识别器对每个所述候选字符模式的识别结果,对所述切分识别候选网格中的候选路径进行过滤;以及字符串识别单元,用于在经过过滤的候选路径中搜索最优路径,以得到字符串识别结果。
另外,本发明的实施例还提供了用于实现上述方法的计算机程序。
此外,本发明的实施例还提供了至少计算机可读介质形式的计算机程序产品,其上记录有用于实现上述方法的计算机程序代码。
通过本发明,可以简化候选网格,加速路径搜索过程。
通过以下结合附图对本发明的最佳实施例的详细说明,本发明的这些以及其他优点将更加明显。
附图说明
参照下面结合附图对本发明实施例的说明,会更加容易地理解本发明的以上和其它目的、特点和优点。附图中的部件只是为了示出本发明的原理。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。
图1是示出根据本发明的一个实施例的字符串识别方法100的示例性流程图;
图2A以字符串“铝镁合金外壳”为例,示出了将图像切分为基本单元的图;
图2B示出了切分候选网格的示例图;
图2C示出了切分识别候选网格的示例图;
图3是约简后的切分识别候选网格的示例图;
图4是可靠的切分候选模式和不可靠的切分候选模式的示例图;
图5是示出根据本发明的一个实施例的字符串识别装置500的示例性配置的框图;
图6是示出候选路径过滤单元540的示例性配置的框图;
图7是示出候选路径过滤单元540的又一示例性配置的框图;
图8是示出候选路径过滤单元540的再一示例性配置的框图;
图9是示出可以用于实施本发明的字符串识别方法和装置的计算设备的举例的结构图。
具体实施方式
下面参照附图来说明本发明的实施例。在本发明的一个附图或一种实施方式中描述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。应当注意,为了清楚的目的,附图和说明中省略了与本发明无关的、本领域普通技术人员已知的部件和处理的表示和描述。
图1是示出根据本发明的一个实施例的字符串识别方法100的示例性流程图。
如图1所示,在步骤S110中,将包含字符串的图像切分为多个基本单元,其中每个基本单元包含一个字符或者一个字符的部件。图2A示出了包含字符串“铝镁合金外壳”的图像被过切分为“钅”,“吕”,“钅”,“美”,“合”,“金”,“夕”,“卜”,“壳”多个基本单元。每个基本单元对应一个字符(如“合”)或字符部件(如“钅”)。
在步骤S120中,以一个基本单元或多个相邻基本单元的组合构成候选字符模式,以形成切分候选网格。例如,可以得到如图2B所示的切分候选网格。
在现有技术中,在得到切分候选网格之后,可以利用一个识别器对候选字符模式进行识别得到切分识别候选网格。网格中的每一条路径(字符类别路径)通过融合了识别置信度和语言模型的评判准则来打分。分值最高的最优路径即为最终的字符切分和识别结果。
基于切分候选网格和切分识别候选网格进行字符串识别就是在切分识别候选网格中找到最优的一条路径(组合方式)。一条路径对应于一个候选字符模式序列X=x1…xn和与之对应的字符类别序列C=c1…cn。这条路径的评分可以通过如下公式(1)获得
公式(1)中的函数包含两部分:
logP(C)是语言模型匹配分数。即一串字符序列与语言模型的匹配程度。以二元模型为例,其中,p(c1)是第一个字符为c1的先验概率,p(ci|ci-1)是在语言模型中ci-1和ci两个字连续出现的概率。
P(xi|ci)是将xi识别为ci的置信度,识别器输出的识别分数与识别置信度的log值成正比。
λ1和λ2是预设的权重。
在遍历所有(X,C)组合之后,获得最高分数的路径就是最优切分识别路径。
切分识别候选网格中的路径优化是一个非常耗时的过程,因为从大量候选字符模式中确定字符类别,需要评估每条可能的路径。现有的方法通常采用动态规划(DP)或集束搜索来加速路径评估的过程。
为加快候选路径的评分过程,本发明提出一种对候选路径进行过滤的方法。
在本发明的实施例中,一项字符识别任务可以交由多个不同的分类器处理。
在根据本发明的实施例的字符串识别方法100的步骤S130中,由多个识别器分别对切分候选网格中的每个候选字符模式进行识别,以得到切分识别候选网格。每个候选字符模式在被识别器识别时,可以得到多个候选字符类别。例如,“铝”可能被识别为“铝”、“侣”、“侶”、“吕”等,“镁”可能被识别为“镁”、“媄”、“渼”、“美”等,这样得到一个如图2C所示的切分识别候选网格。
在步骤S140中,根据多个识别器对每个候选字符模式的识别结果,对切分识别候选网格中的候选路径进行过滤。
具体地,根据多个识别器对每个候选字符模式的识别结果对每个候选字符模式进行分类;如果候选字符模式被分类为可靠的,则在候选路径中仅保留将候选字符模式的识别结果中排在第一位的识别结果作为节点的候选路径。
基于多个识别器的识别结果,可以把每个候选字符模式分为两类:1.可靠,2.不可靠。
一种优选的分类准则是:如果超过半数的识别器都输出同样的类别结果,则该候选字符模式是可靠的。反之,该候选字符模式是不可靠的。
除了该分类准则之外,另一优选的分类准则是:为M个识别器中的每一个保留对候选字符模式的前N个候选识别结果,以识别置信度为权值对K(K<=M*N)个候选识别结果进行加权投票得到各自的一个投票分值,对投票分值从大到小进行排序,如果第一候选结果的投票分值比第二候选结果的投票分值大预定阈值,则将该候选字符模式分类为可靠的。反之,该候选字符模式是不可靠的。
如果一个候选字符模式是可靠的,则只保留识别置信度最高的识别结果,该候选字符模式的其他识别结果不再允许出现在一条候选路径中。对于不可靠的候选字符模式,不同识别器的输出结果将被合并为一个识别候选列表。也就是说,如果候选字符模式被分类为可靠的,则在候选路径中仅保留将候选字符模式的识别结果中排在第一位的识别结果作为一个节点的候选路径。
例如,在图3中假定“铝”“镁”“外”是可靠的模式,而“合”“金”“壳”是不可靠的模式,则约简后的切分识别候选网格如图3所示。
候选字符模式可能包含多个相邻的基本单元。在图4示出的切分候选网格中只考虑了相邻两个基本单元组合的情况。在图4中,被判定为可靠的候选字符模式用虚线框表示。如果某个候选字符模式被判定为可靠的,则组成它的所有基本单元不允许单独出现在一条候选路径中。也就是说,从候选路径中去除以构成候选字符模式的多个基本单元中的部分基本单元作为一个节点的路径。例如图4中,候选路径“钅,吕”是非法的。因为“钅”是“铝”的一部分,而“铝”已经被判定为是可靠的候选字符模式,因此以“钅”作为一个节点的路径会被过滤掉。通过这种方法,大量的候选路径可以被过滤掉。
在本发明的实施例中,通过利用多个识别器的输出结果对所有候选路径进行过滤。不同识别器可以具有各自独立的文字特征或者采用各自独立的分类算法。
首先,不同的识别器可以从不同的角度相互独立的提取与文字相关的互补特征。这里所说的互补特征可以包括灰度特征和二值特征。
灰度特征:将切分好的字符图像归一化成指定的尺度(如:10x10像素),则每个像素的亮度值作为特征向量(100维)中的一维。灰度特征擅长描述字符的整体形状,对于模糊的字符表现较好,但受输入字符的长宽比影响较大。
二值特征:提取二值化图像中的字符形状细节特征,如笔画轮廓弯曲度,字符空洞数目,笔画密度等统计特征。二值特征不易受字符长宽比变化影响,但对低分辨率模糊图像,由于缺乏细节,提取的特征会不准确。
融合多个分类器的输出可以获得比依靠单个分类器更高的识别率。对于具有一定基本图像质量的输入字符,不同的分类器通常会给出相同或相近的分类结果。只有当输入字符的图像质量很低的情况下,不同的分类器才会输出分歧较大的分类结果。
如果不同识别器对某个候选字符模式给出大致相同的分类结果,就可以固定相应的识别结果,去除那些不合理的候选路径。
不同识别器采用的各自独立的分类算法可以包括高斯模型、SVM(支持向量机)等。
在步骤S150中,在经过过滤的候选路径中搜索最优路径,以得到字符串识别结果。
通过以上步骤S120-S140,切分识别候选网格中的候选路径数目被大大削减。然后可以利用传统的动态规划方法,并结合识别置信度和语言模型,可以快速搜索到最优路径。
图5是示出根据本发明的一个实施例的字符串识别装置500的示例性配置的框图。
如图5所示,字符串识别装置500包括图像切分单元510、候选字符模式构成单元520、切分识别候选网格形成单元530、候选路径过滤单元540和字符串识别单元550。
图像切分单元510用于将包含字符串的图像切分为多个基本单元,每个基本单元包含一个字符或者一个字符的部件。候选字符模式构成单元520用于将一个基本单元或多个相邻基本单元的组合构成候选字符模式,以形成切分候选网格。切分识别候选网格形成单元530用于通过多个识别器分别对切分候选网格中的每个候选字符模式进行识别,以得到切分识别候选网格。候选路径过滤单元540用于根据多个识别器对每个候选字符模式的识别结果,对切分识别候选网格中的候选路径进行过滤。字符串识别单元550用于在经过过滤的候选路径中搜索最优路径,以得到字符串识别结果。
优选地,如图6所示,候选路径过滤单元540可以包括分类单元610和第一候选路径过滤单元620。分类单元610用于根据多个识别器对每个候选字符模式的识别结果对每个候选字符模式进行分类。如果候选字符模式被分类为可靠的,则第一候选路径过滤单元620用于在候选路径中仅保留将候选字符模式的识别结果中排在第一位的识别结果作为节点的候选路径。
优选地,如图7所示,候选路径过滤单元540还可以包括第二候选路径过滤单元730。如果候选字符模式被分类为可靠的,且候选字符模式由多个基本单元构成,则第二候选路径过滤单元730用于从候选路径中去除包括如下节点的候选路径,该节点由构成候选字符模式的多个基本单元中的部分基本单元构成。
在另一个实施例中,如图8所示,候选路径过滤单元540可以包括分类单元610和第二候选路径过滤单元730。分类单元610用于根据多个识别器对每个候选字符模式的识别结果对每个候选字符模式进行分类。如果候选字符模式被分类为可靠的,且候选字符模式由多个基本单元构成,则第二候选路径过滤单元730用于从候选路径中去除包括如下节点的候选路径,该节点由构成候选字符模式的多个基本单元中的部分基本单元构成。
优选地,分类单元610可以被配置为:如果多个识别器中一半以上的识别器对候选字符模式的识别
优选地,分类单元610还可以被配置为:为M个识别器中的每一个保留对候选字符模式的前N个候选识别结果,以识别置信度为权值对K(K<=M*N)个候选识别结果进行加权投票得到各自的投票分值,对投票分值从大到小进行排序,如果第一候选结果的投票分值比第二候选结果的投票分值大预定阈值,则将候选字符模式分类为可靠的。
优选地,切分识别候选网格形成单元530可以被配置为:多个识别器利用文字的互补特征对每个候选字符模式进行识别。互补特征可以包括灰度特征和二值特征。
优选地,多个识别器可以采用各自独立的分类算法对每个候选字符模式进行识别。分类算法可以包括高斯模型和支持向量机。
优选地,字符串识别单元550可以被配置为:利用语言模型来搜索最优路径,以得到字符串识别结果。字符串可以为中文字符串。
关于字符串识别装置500的各个部分的操作和功能的细节可以参照结合图1至图4描述的本发明的字符串识别方法的实施例,这里不再详细描述。
在此需要说明的是,图5-8所示的字符串识别装置500及其组成单元的结构仅仅是示例性的,本领域技术人员可以根据需要对图5-8所示的结构框图进行修改。
本发明提出了一种利用多个识别器的识别结果,来过滤切分识别候选网格中的候选路径的字符串识别方法。通过将候选字符模式分为可靠或不可靠两类,快速锁定存在歧义的候选字符模式(不可靠),排除无需考虑其他候选的候选字符模式(可靠),从而简化了候选网格,加速了路径搜索过程。
以上结合具体实施例描述了本发明的基本原理,但是,需要指出的是,对本领域的普通技术人员而言,能够理解本发明的方法和装置的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能就能实现的。
因此,本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。所述计算装置可以是公知的通用装置。因此,本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产品也构成本发明,并且存储有这样的程序产品的存储介质也构成本发明。显然,所述存储介质可以是任何公知的存储介质或者将来所开发出来的任何存储介质。
在通过软件和/或固件实现本发明的实施例的情况下,从存储介质或网络向具有专用硬件结构的计算机,例如图9所示的通用计算机900安装构成该软件的程序,该计算机在安装有各种程序时,能够执行各种功能等等。
在图9中,中央处理单元(CPU)901根据只读存储器(ROM)902中存储的程序或从存储部分908加载到随机存取存储器(RAM)903的程序执行各种处理。在RAM903中,也根据需要存储当CPU901执行各种处理等等时所需的数据。CPU901、ROM902和RAM903经由总线904彼此链路。输入/输出接口905也链路到总线904。
下述部件链路到输入/输出接口905:输入部分906(包括键盘、鼠标等等)、输出部分907(包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD)等,和扬声器等)、存储部分908(包括硬盘等)、通信部分909(包括网络接口卡比如LAN卡、调制解调器等)。通信部分909经由网络比如因特网执行通信处理。根据需要,驱动器910也可链路到输入/输出接口905。可拆卸介质911比如磁盘、光盘、磁光盘、半导体存储器等等根据需要被安装在驱动器910上,使得从中读出的计算机程序根据需要被安装到存储部分908中。
在通过软件实现上述系列处理的情况下,从网络比如因特网或存储介质比如可拆卸介质911安装构成软件的程序。
本领域的技术人员应当理解,这种存储介质不局限于图9所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质911。可拆卸介质911的例子包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者,存储介质可以是ROM902、存储部分908中包含的硬盘等等,其中存有程序,并且与包含它们的设备一起被分发给用户。
本发明还提出一种存储有机器可读取的指令代码的程序产品。指令代码由机器读取并执行时,可执行上述根据本发明实施例的方法。
相应地,用于承载上述存储有机器可读取的指令代码的程序产品的存储介质也包括在本发明的公开中。存储介质包括但不限于软盘、光盘、磁光盘、存储卡、存储棒等。
本领域的普通技术人员应理解,在此所例举的是示例性的,本发明并不局限于此。
在本说明书中,“第一”、“第二”以及“第N个”等表述是为了将所描述的特征在文字上区分开,以清楚地描述本发明。因此,不应将其视为具有任何限定性的含义。
作为一个示例,上述方法的各个步骤以及上述设备的各个组成模块和/或单元可以实施为软件、固件、硬件或其组合,并作为相应设备中的一部分。上述装置中各个组成模块、单元通过软件、固件、硬件或其组合的方式进行配置时可使用的具体手段或方式为本领域技术人员所熟知,在此不再赘述。
作为一个示例,在通过软件或固件实现的情况下,可以从存储介质或网络向具有专用硬件结构的计算机(例如图9所示的通用计算机900)安装构成该软件的程序,该计算机在安装有各种程序时,能够执行各种功能等。
在上面对本发明具体实施例的描述中,针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其他实施方式中使用,与其他实施方式中的特征相组合,或替代其他实施方式中的特征。
应该强调,术语“包括/包含”在本文使用时指特征、要素、步骤或组件的存在,但并不排除一个或更多个其他特征、要素、步骤或组件的存在或附加。
此外,本发明的方法不限于按照说明书中描述的时间顺序来执行,也可以按照其他的时间顺序地、并行地或独立地执行。因此,本说明书中描述的方法的执行顺序不对本发明的技术范围构成限制。
本发明及其优点,但是应当理解在不超出由所附的权利要求所限定的本发明的精神和范围的情况下可以进行各种改变、替代和变换。而且,本发明的范围不仅限于说明书所描述的过程、设备、手段、方法和步骤的具体实施例。本领域内的普通技术人员从本发明的公开内容将容易理解,根据本发明可以使用执行与在此的相应实施例基本相同的功能或者获得与其基本相同的结果的、现有和将来要被开发的过程、设备、手段、方法或者步骤。因此,所附的权利要求旨在在它们的范围内包括这样的过程、设备、手段、方法或者步骤。
基于以上的说明,可知公开至少公开了以下技术方案:
附记1.一种字符串识别方法,包括:
将包含字符串的图像切分为多个基本单元,每个基本单元包含一个字符或者一个字符的部件;
以一个基本单元或多个相邻基本单元的组合构成候选字符模式,以形成切分候选网格;
由多个识别器分别对所述切分候选网格中的每个所述候选字符模式进行识别,以得到切分识别候选网格;
根据所述多个识别器对每个所述候选字符模式的识别结果,对所述切分识别候选网格中的候选路径进行过滤;以及
在经过过滤的候选路径中搜索最优路径,以得到字符串识别结果。
附记2.根据附记1所述的字符串识别方法,其中,对所述切分识别候选网格中的候选路径进行过滤包括:
根据所述多个识别器对每个所述候选字符模式的识别结果对每个所述候选字符模式进行分类;以及
如果所述候选字符模式被分类为可靠的,则在所述候选路径中仅保留将所述候选字符模式的识别结果中排在第一位的识别结果作为节点的候选路径。
附记3.根据附记2所述的字符串识别方法,其中,如果所述候选字符模式被分类为可靠的,且所述候选字符模式由多个基本单元构成,则从所述候选路径中去除包括如下节点的候选路径,该节点由构成所述候选字符模式的所述多个基本单元中的部分基本单元构成。
附记4.根据附记1所述的字符串识别方法,其中,对所述切分识别候选网格中的候选路径进行过滤包括:
根据所述多个识别器对每个所述候选字符模式的识别结果对每个所述候选字符模式进行分类;以及
如果所述候选字符模式被分类为可靠的,且所述候选字符模式由多个基本单元构成,则从所述候选路径中去除包括如下节点的候选路径,该节点由构成所述候选字符模式的所述多个基本单元中的部分基本单元构成。
附记5.根据附记2-4中任意一项所述的字符串识别方法,其中,根据所述多个识别器对每个所述候选字符模式的识别结果对每个所述候选字符模式进行分类包括:如果所述多个识别器中一半以上的识别器对所述候选字符模式的识别结果是相同的,则将所述候选字符模式分类为可靠的。
附记6.根据附记2-4中任意一项所述的字符串识别方法,其中,根据所述多个识别器对每个所述候选字符模式的识别结果对每个所述候选字符模式进行分类包括:为M个识别器中的每一个保留对所述候选字符模式的前N个候选识别结果,以识别置信度为权值对K(K<=M*N)个候选识别结果进行加权投票得到各自的投票分值,对所述投票分值从大到小进行排序,如果第一候选结果的投票分值比第二候选结果的投票分值大预定阈值,则将所述候选字符模式分类为可靠的。
附记7.根据附记2-4中任意一项所述的字符串识别方法,其中,所述多个识别器利用文字的互补特征对每个所述候选字符模式进行识别。
附记8.根据附记7所述的字符串识别方法,其中,所述互补特征包括灰度特征和二值特征。
附记9.根据附记2-4中任意一项所述的字符串识别方法,其中,所述多个识别器采用各自独立的分类算法对每个所述候选字符模式进行识别。
附记10.根据附记9所述的字符串识别方法,其中,所述分类算法包括高斯模型和支持向量机。
附记11.根据附记2-4中任意一项所述的字符串识别方法,其中,在经过过滤的候选路径中搜索最优路径,以得到字符串识别结果包括:利用语言模型来搜索最优路径,以得到字符串识别结果。
附记12.根据附记2-4中任意一项所述的字符串识别方法,其中,所述字符串为中文字符串。
附记13.一种字符串识别装置,包括:
图像切分单元,用于将包含字符串的图像切分为多个基本单元,每个基本单元包含一个字符或者一个字符的部件;
候选字符模式构成单元,用于将一个基本单元或多个相邻基本单元的组合构成候选字符模式,以形成切分候选网格;
切分识别候选网格形成单元,用于通过多个识别器分别对所述切分候选网格中的每个所述候选字符模式进行识别,以得到切分识别候选网格;
候选路径过滤单元,用于根据所述多个识别器对每个所述候选字符模式的识别结果,对所述切分识别候选网格中的候选路径进行过滤;以及
字符串识别单元,用于在经过过滤的候选路径中搜索最优路径,以得到字符串识别结果。
附记14.根据附记13所述的字符串识别装置,其中,所述候选路径过滤单元包括:
分类单元,用于根据所述多个识别器对每个所述候选字符模式的识别结果对每个所述候选字符模式进行分类;以及
第一候选路径过滤单元,如果所述候选字符模式被分类为可靠的,则所述第一候选路径过滤单元用于在所述候选路径中仅保留将所述候选字符模式的识别结果中排在第一位的识别结果作为节点的候选路径。
附记15.根据附记14所述的字符串识别装置,其中,所述候选路径过滤单元还包括第二候选路径过滤单元,如果所述候选字符模式被分类为可靠的,且所述候选字符模式由多个基本单元构成,则所述第二候选路径过滤单元用于从所述候选路径中去除包括如下节点的候选路径,该节点由构成所述候选字符模式的所述多个基本单元中的部分基本单元构成。
附记16.根据附记13所述的字符串识别装置,其中,所述候选路径过滤单元包括:
分类单元,用于根据所述多个识别器对每个所述候选字符模式的识别结果对每个所述候选字符模式进行分类;以及
第二候选路径过滤单元,如果所述候选字符模式被分类为可靠的,且所述候选字符模式由多个基本单元构成,则所述第二候选路径过滤单元用于从所述候选路径中去除包括如下节点的候选路径,该节点由构成所述候选字符模式的所述多个基本单元中的部分基本单元构成。
附记17.根据附记14-16中任意一项所述的字符串识别装置,其中,所述分类单元被配置为:如果所述多个识别器中一半以上的识别器对所述候选字符模式的识别结果是相同的,则将所述候选字符模式分类为可靠的。
附记18.根据附记14-16中任意一项所述的字符串识别装置,其中,所述分类单元被配置为:为M个识别器中的每一个保留对所述候选字符模式的前N个候选识别结果,以识别置信度为权值对K(K<=M*N)个候选识别结果进行加权投票得到各自的投票分值,对所述投票分值从大到小进行排序,如果第一候选结果的投票分值比第二候选结果的投票分值大预定阈值,则将所述候选字符模式分类为可靠的。
附记19.根据附记14-16中任意一项所述的字符串识别装置,其中,所述切分识别候选网格形成单元被配置为:所述多个识别器利用文字的互补特征对每个所述候选字符模式进行识别。
附记20.根据附记19所述的字符串识别装置,其中,所述互补特征包括灰度特征和二值特征。
附记21.根据附记14-16中任意一项所述的字符串识别装置,其中,所述多个识别器采用各自独立的分类算法对每个所述候选字符模式进行识别。
附记22.根据附记21所述的字符串识别装置,其中,所述分类算法包括高斯模型和支持向量机。
附记23.根据附记14-16中任意一项所述的字符串识别装置,其中,所述字符串识别单元被配置为:利用语言模型来搜索最优路径,以得到字符串识别结果。
附记24.根据附记14-16中任意一项所述的字符串识别装置,其中,所述字符串为中文字符串。
Claims (10)
1.一种字符串识别方法,包括:
将包含字符串的图像切分为多个基本单元,每个基本单元包含一个字符或者一个字符的部件;
以一个基本单元或多个相邻基本单元的组合构成候选字符模式,以形成切分候选网格;
由多个识别器分别对所述切分候选网格中的每个所述候选字符模式进行识别,以得到切分识别候选网格;
根据所述多个识别器对每个所述候选字符模式的识别结果,对所述切分识别候选网格中的候选路径进行过滤;以及
在经过过滤的候选路径中搜索最优路径,以得到字符串识别结果。
2.根据权利要求1所述的字符串识别方法,其中,对所述切分识别候选网格中的候选路径进行过滤包括:
根据所述多个识别器对每个所述候选字符模式的识别结果对每个所述候选字符模式进行分类;以及
如果所述候选字符模式被分类为可靠的,则在所述候选路径中仅保留将所述候选字符模式的识别结果中排在第一位的识别结果作为节点的候选路径。
3.根据权利要求2所述的字符串识别方法,其中,如果所述候选字符模式被分类为可靠的,且所述候选字符模式由多个基本单元构成,则从所述候选路径中去除包括如下节点的候选路径,该节点由构成所述候选字符模式的所述多个基本单元中的部分基本单元构成。
4.根据权利要求1所述的字符串识别方法,其中,对所述切分识别候选网格中的候选路径进行过滤包括:
根据所述多个识别器对每个所述候选字符模式的识别结果对每个所述候选字符模式进行分类;以及
如果所述候选字符模式被分类为可靠的,且所述候选字符模式由多个基本单元构成,则从所述候选路径中去除包括如下节点的候选路径,该节点由构成所述候选字符模式的所述多个基本单元中的部分基本单元构成。
5.根据权利要求2-4中任意一项所述的字符串识别方法,其中,根据所述多个识别器对每个所述候选字符模式的识别结果对每个所述候选字符模式进行分类包括:如果所述多个识别器中一半以上的识别器对所述候选字符模式的识别结果是相同的,则将所述候选字符模式分类为可靠的。
6.根据权利要求2-4中任意一项所述的字符串识别方法,其中,根据所述多个识别器对每个所述候选字符模式的识别结果对每个所述候选字符模式进行分类包括:为所述多个识别器中的每一个保留对所述候选字符模式的前N个候选识别结果,以识别置信度为权值为所述N个候选识别结果进行加权投票得到各自的投票分值,对所述投票分值从大到小进行排序,如果第一候选结果的投票分值比第二候选结果的投票分值大预定阈值,则将所述候选字符模式分类为可靠的。
7.根据权利要求2-4中任意一项所述的字符串识别方法,其中,所述多个识别器利用文字的互补特征对每个所述候选字符模式进行识别。
8.根据权利要求7所述的字符串识别方法,其中,所述互补特征包括灰度特征和二值特征。
9.根据权利要求2-4中任意一项所述的字符串识别方法,其中,所述多个识别器采用各自独立的分类算法对每个所述候选字符模式进行识别。
10.一种字符串识别装置,包括:
图像切分单元,用于将包含字符串的图像切分为多个基本单元,每个基本单元包含一个字符或者一个字符的部件;
候选字符模式构成单元,用于将一个基本单元或多个相邻基本单元的组合构成候选字符模式,以形成切分候选网格;
切分识别候选网格形成单元,用于通过多个识别器分别对所述切分候选网格中的每个所述候选字符模式进行识别,以得到切分识别候选网格;
候选路径过滤单元,用于根据所述多个识别器对每个所述候选字符模式的识别结果,对所述切分识别候选网格中的候选路径进行过滤;以及
字符串识别单元,用于在经过过滤的候选路径中搜索最优路径,以得到字符串识别结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310495142.5A CN104573683B (zh) | 2013-10-21 | 2013-10-21 | 字符串识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310495142.5A CN104573683B (zh) | 2013-10-21 | 2013-10-21 | 字符串识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104573683A true CN104573683A (zh) | 2015-04-29 |
CN104573683B CN104573683B (zh) | 2018-02-16 |
Family
ID=53089705
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310495142.5A Active CN104573683B (zh) | 2013-10-21 | 2013-10-21 | 字符串识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104573683B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107092902A (zh) * | 2016-02-18 | 2017-08-25 | 富士通株式会社 | 字符串的识别方法和系统 |
CN107665188A (zh) * | 2016-07-27 | 2018-02-06 | 科大讯飞股份有限公司 | 一种语义理解方法及装置 |
CN107861684A (zh) * | 2017-11-23 | 2018-03-30 | 广州视睿电子科技有限公司 | 书写识别方法、装置、存储介质及计算机设备 |
CN108345886A (zh) * | 2017-01-23 | 2018-07-31 | 北京搜狗科技发展有限公司 | 一种视频流文本识别方法和装置 |
CN112036221A (zh) * | 2019-06-04 | 2020-12-04 | 富士通株式会社 | 对字符图像进行处理的装置、方法和介质 |
CN114445819A (zh) * | 2020-10-19 | 2022-05-06 | 武汉斗鱼网络科技有限公司 | 一种字符过滤处理方法、系统、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090202152A1 (en) * | 2008-02-12 | 2009-08-13 | Fujitsu Limited | Area extraction program, character recognition program, and character recognition device |
US20090208107A1 (en) * | 2008-02-19 | 2009-08-20 | Fujitsu Limited | Character recognition apparatus and character recognition method |
CN101853126A (zh) * | 2010-05-12 | 2010-10-06 | 中国科学院自动化研究所 | 一种联机手写句子实时识别方法 |
CN102129560A (zh) * | 2010-01-18 | 2011-07-20 | 富士通株式会社 | 字符识别的方法和设备 |
CN102479332A (zh) * | 2010-11-30 | 2012-05-30 | 富士施乐株式会社 | 图像处理装置和图像处理方法 |
-
2013
- 2013-10-21 CN CN201310495142.5A patent/CN104573683B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090202152A1 (en) * | 2008-02-12 | 2009-08-13 | Fujitsu Limited | Area extraction program, character recognition program, and character recognition device |
US20090208107A1 (en) * | 2008-02-19 | 2009-08-20 | Fujitsu Limited | Character recognition apparatus and character recognition method |
CN102129560A (zh) * | 2010-01-18 | 2011-07-20 | 富士通株式会社 | 字符识别的方法和设备 |
CN101853126A (zh) * | 2010-05-12 | 2010-10-06 | 中国科学院自动化研究所 | 一种联机手写句子实时识别方法 |
CN102479332A (zh) * | 2010-11-30 | 2012-05-30 | 富士施乐株式会社 | 图像处理装置和图像处理方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107092902A (zh) * | 2016-02-18 | 2017-08-25 | 富士通株式会社 | 字符串的识别方法和系统 |
CN107092902B (zh) * | 2016-02-18 | 2021-04-06 | 富士通株式会社 | 字符串的识别方法和系统 |
CN107665188A (zh) * | 2016-07-27 | 2018-02-06 | 科大讯飞股份有限公司 | 一种语义理解方法及装置 |
CN107665188B (zh) * | 2016-07-27 | 2021-01-29 | 科大讯飞股份有限公司 | 一种语义理解方法及装置 |
CN108345886A (zh) * | 2017-01-23 | 2018-07-31 | 北京搜狗科技发展有限公司 | 一种视频流文本识别方法和装置 |
CN107861684A (zh) * | 2017-11-23 | 2018-03-30 | 广州视睿电子科技有限公司 | 书写识别方法、装置、存储介质及计算机设备 |
CN112036221A (zh) * | 2019-06-04 | 2020-12-04 | 富士通株式会社 | 对字符图像进行处理的装置、方法和介质 |
CN114445819A (zh) * | 2020-10-19 | 2022-05-06 | 武汉斗鱼网络科技有限公司 | 一种字符过滤处理方法、系统、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN104573683B (zh) | 2018-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106202032B (zh) | 一种面向微博短文本的情感分析方法及其系统 | |
CN104573683A (zh) | 字符串识别方法和装置 | |
CN106776538A (zh) | 企业非标准格式文档的信息提取方法 | |
CN102722713B (zh) | 一种基于李群结构数据的手写体数字识别方法及系统 | |
CN110287311B (zh) | 文本分类方法及装置、存储介质、计算机设备 | |
WO2010087886A1 (en) | Systems and methods for graph-based pattern recognition technology applied to the automated identification of fingerprints | |
US11769341B2 (en) | System and method to extract information from unstructured image documents | |
CN106255979A (zh) | 行分割方法 | |
CN104834891A (zh) | 一种中文图像型垃圾邮件过滤方法及系统 | |
CN110910175A (zh) | 一种旅游门票产品画像生成方法 | |
CN106203508A (zh) | 一种基于Hadoop平台的图像分类方法 | |
CN102360436B (zh) | 一种基于部件的联机手写藏文字符的识别方法 | |
Lamghari et al. | Template matching for recognition of handwritten Arabic characters using structural characteristics and Freeman code | |
Goyal et al. | Clustering-based hierarchical framework for multiclass classification of leaf images | |
CN111898618B (zh) | 一种识别古代图形文字的方法、装置和程序储存介质 | |
Abbass et al. | Car license plate segmentation and recognition system based on deep learning | |
CN112036176A (zh) | 文本聚类方法及装置 | |
Al Mubarok et al. | Handwritten character recognition using hierarchical graph matching | |
Kaur et al. | Printed text recognition system for multi-script image | |
Niharmine et al. | Tifinagh handwritten character recognition using genetic algorithms | |
Xia et al. | An efficient off-line handwritten Japanese address recognition system | |
Patil et al. | Handwritten English Character Recognition using CNN | |
Huang et al. | Research Article Isolated Handwritten Pashto Character Recognition Using aK-NN Classification Tool based on Zoning and HOG Feature Extraction Techniques | |
JP2017142712A (ja) | コールグラフ差分抽出方法、コールグラフ差分抽出プログラム、および情報処理装置 | |
Nobile et al. | Digit/symbol pruning and verification for Arabic handwritten digit/symbol spotting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |