CN105224939A

CN105224939A - 数字区域的识别方法和识别装置、移动终端

Info

Publication number: CN105224939A
Application number: CN201410234320.3A
Authority: CN
Inventors: 张涛; 陈志军; 张祺深
Original assignee: Xiaomi Inc
Current assignee: Beijing Xiaomi Technology Co Ltd; Xiaomi Inc
Priority date: 2014-05-29
Filing date: 2014-05-29
Publication date: 2016-01-06
Anticipated expiration: 2034-05-29
Also published as: CN105224939B

Abstract

本公开提供一种数字区域的识别方法和识别装置、移动终端，该识别方法包括：获取对象的待识别图像；调用预配置的对应于所述对象的区域分类器，所述区域分类器由对应于所述对象中的数字区域和非数字区域的区域训练样本生成，且所述区域训练样本来自所述对象的样本图像；根据所述区域分类器识别出所述待识别图像中的数字区域，以供对所述数字区域进行光学字符识别。通过本公开的技术方案，可以对对象的待识别图像进行预处理，准确识别出其中包含的数字区域，从而有助于后续的光学字符识别等操作，避免发生误识别。

Description

数字区域的识别方法和识别装置、移动终端

技术领域

本公开涉及图像处理技术领域，尤其涉及数字区域的识别方法、数字区域的识别装置和移动终端。

背景技术

随着科技的不断发展，终端设备能够执行越来越多的功能，尤其是智能手机等移动终端，已经成为人们日常生活中不可或缺的一部分。

举例而言，OCR(OpticalCharacterRecognition，光学字符识别)几乎成为所有终端设备必备的功能，使得很多原本需要用户手动输入的场景下，可以通过OCR技术自动识别和输入信息，比如在使用“充值卡”时，无需用户手动输入账户名和密码，而直接通过OCR技术自动识别即可，有助于提高用户的工作效率。

具体地，终端设备需要首先获取“充值卡”的图像，再从该图像中识别出账户名和密码等数字。然而，该“充值卡”的图像上显然还会包含很多其他信息，从而造成对账户名和密码等数字的干扰和影响，导致误识别或无法识别等情况的发生。

发明内容

为克服相关技术中存在的问题，本公开提供一种数字区域的识别方法、数字区域的识别装置和移动终端。

根据本公开实施例的第一方面，提供一种数字区域的识别方法，包括：

获取对象的待识别图像；

调用预配置的对应于所述对象的区域分类器，所述区域分类器由对应于所述对象中的数字区域和非数字区域的区域训练样本生成，且所述区域训练样本来自所述对象的样本图像；

根据所述区域分类器识别出所述待识别图像中的数字区域，以供对所述数字区域进行光学字符识别。

在该技术方案中，由于区域分类器是预先基于对象的样本图像的样本训练而得到，使得在利用该区域分类器对对象进行分类识别时，其分类依据实际上来源于对象自身的区域设置特点，不仅能够适应于多种环境条件(每个样本图像均可以认为对应于一种环境条件)，而且具有更强的识别能力和更好的识别效果，从而准确识别出待识别图像中的数字区域，便于执行后续的OCR处理。

在一示例性实施例中，所述区域分类器是由每个区域训练样本对应的第一分类器级联得到的第二分类器。在该技术方案中，通过对第一分类器的级联优化，使得到的第二分类器融合了所有区域训练样本的样本特征，从而有助于提升识别的准确度。

在一示例性实施例中，每个所述第一分类器是由相应区域训练样本的方向梯度直方图(HistogramofOrientedGradient，HOG)特征经过线性判别分析(LinearDiscriminantAnalysis，LDA)投影后得到。在该技术方案中，通过采用HOG特征，使得能够根据梯度分布来更好地描述区域训练样本；同时，通过LDA投影对HOG特征进行降维处理，从而有助于降低第二分类器的训练难度，提高训练效率。

在一示例性实施例中，对应于数字区域的每个区域训练样本包括至少两个数字字符。在该技术方案中，通过使每个区域训练样本中包含多个数字字符，从而能够表达出单个字符无法表达出的区域结构特征，有助于提升训练得到的区域分类器的区域识别准确度。其中，区域训练样本中应当包含两位数字字符下的所有情况(如00、01……99)，以避免遗漏而导致后期识别失败；此外，每个区域训练样本中也可以包含其他数量的数字字符，则也应当确保包含相应数量的数字字符下的所有情况(如000、001……999)。

在一示例性实施例中，根据所述区域分类器识别所述待识别图像中的数字区域包括：在所述待识别图像上依次选取预设大小的候选区域；通过所述区域分类器判别每个所述候选区域的类型；将判别结果为数字区域类型的候选区域进行合并。

在该技术方案中，通过依次选取候选区域并识别其类型，从而将判别为数字区域类型的候选区域合并，以得到最终的数字区域。其中，候选区域的大小可以根据实际需求进行预先设置，当候选区域较大时有助于提升识别效率，而当候选区域较小时则有助于提升识别精准度。

在一示例性实施例中，将判别结果为数字类型的候选区域进行合并包括：根据数字区域的形状特征和/或数字区域在所述对象中的分布特征，筛除被判定为数字区域类型的候选区域中与数字区域无关的候选区域，并对剩余的数字类型的候选区域进行合并。

在该技术方案中，数字区域的形状特征包括：数字区域呈矩形、与对象的边沿平行、数字区域内的数字字符排列为一排或多排、数字区域为预设长度等；而数字区域在对象中的分布特征包括：数字区域在对象上的相对设置位置、数字区域与对象之间的相对显示比例等。基于数字区域的形状特征和/或分布特征，即可筛除不符合要求的候选区域，消除误判断的影响；同时，通过合并符合要求的数字区域类型的候选区域，从整体上得到组成待识别图像上的数字区域。

在一示例性实施例中，还包括：按照预设比例对所述待识别图像进行缩放操作，以得到多个显示比例的待识别图像；根据所述区域分类器识别每个显示比例的待识别图像中的数字区域；以及，根据识别出的每个数字区域在相应的待识别图像中的相对位置，合并所有显示比例的待识别图像中识别出的数字区域，以作为所述待识别图像中的数字区域。

在该技术方案中，通过基于图像缩放操作的金字塔扫描，使得在不同显示比例的待识别图像上分别实现区域特征识别，有助于消除显示比例的差异而导致的识别误差。

在一示例性实施例中，在根据所述区域分类器识别出所述待识别图像中的数字区域之后，还包括：将所述区域分类器识别出的数字区域作为候选数字区域，并对每个候选数字区域中的字符进行切分操作；调用预配置的数字判别器，并根据所述数字判别器识别切分得到的每个字符；筛除所述候选数字区域中的非数字字符，并将剩余字符对应的区域作为所述待识别图像中的数字区域。

在该技术方案中，当区域分类器对应的区域训练样本中包含至少两个数字字符时，其更倾向于整体区域特征的识别，从而导致识别出的数字区域中可能包含有非数字字符。因此，将区域分类器得到的数字区域重新作为候选数字区域，并实现基于数字判别器的字符类型识别，能够有效消除候选数字区域中包含的非数字字符，避免影响后续的OCR处理等。

在一示例性实施例中，所述数字判别器由对应于所述对象中的数字区域内的数字字符和非数字区域内的非数字字符的字符训练样本生成，且所述字符训练样本来自所述对象的样本图像。在该技术方案中，由于数字判别器是预先基于对象的样本图像的样本训练而得到，使得在利用该数字判别器对字符类型进行识别时，其分类依据实际上来源于对象自身的字符特点，从而不仅能够适用于多种环境条件(每个样本图像均可以认为对应于一种环境条件)，而且具有更强的识别能力和更好的识别效果，从而准确识别出非数字字符，使最终得到的数字区域更加准确。

在一示例性实施例中，所述数字判别器是由相应训练样本的方向梯度直方图特征经过支持向量机的训练而得到。

根据本公开实施例的第二方面，提供一种数字区域的识别装置，包括：

图像获取单元，用于获取对象的待识别图像；

分类器调用单元，用于调用预配置的对应于所述对象的区域分类器，所述区域分类器由对应于所述对象中的数字区域和非数字区域的区域训练样本生成，且所述区域训练样本来自所述对象的样本图像；

区域识别单元，用于根据所述区域分类器识别出所述待识别图像中的数字区域，以供对所述数字区域进行光学字符识别。

在一示例性实施例中，每个所述第一分类器是由相应区域训练样本的方向梯度直方图特征经过线性判别分析投影后得到。在该技术方案中，通过采用HOG特征，使得能够根据梯度分布来更好地描述区域训练样本；同时，通过LDA投影对HOG特征进行降维处理，从而有助于降低第二分类器的训练难度，提高训练效率。

在一示例性实施例中，所述区域识别单元包括：区域选取子单元，用于在所述待识别图像上依次选取预设大小的候选区域；类型判别子单元，用于通过所述区域分类器判别每个所述候选区域的类型；区域处理子单元，用于将判别结果为数字区域类型的候选区域进行合并。

在一示例性实施例中，所述区域处理子单元用于：根据数字区域的形状特征和/或数字区域在所述对象中的分布特征，筛除被判定为数字区域类型的候选区域中与数字区域无关的候选区域，并对剩余的数字类型的候选区域进行合并。

在一示例性实施例中，还包括：图像缩放单元，用于按照预设比例对所述待识别图像进行缩放操作，以得到多个显示比例的待识别图像；其中，所述区域识别单元根据所述区域分类器识别每个显示比例的待识别图像中的数字区域；区域合并单元，用于根据识别出的每个数字区域在相应的待识别图像中的相对位置，合并所有显示比例的待识别图像中识别出的数字区域，以作为所述待识别图像中的数字区域。

在一示例性实施例中，还包括：字符切分单元，用于所述区域识别单元在根据所述区域分类器识别出所述待识别图像中的数字区域之后，将所述区域分类器识别出的数字区域作为候选数字区域，并对每个候选数字区域中的字符进行切分操作；字符识别单元，用于调用预配置的数字判别器，并根据所述数字判别器识别切分得到的每个字符；字符筛除单元，用于筛除所述候选数字区域中的非数字字符，并将剩余字符对应的区域作为所述待识别图像中的数字区域。

根据本公开实施例的第三方面，提供一种移动终端，包括如上述技术方案中任一项所述的数字区域的识别装置。

由以上技术方案可见，本公开通过预先基于对象的样本图像的样本训练，有助于提升对数字区域的识别准确度，避免非数字区域、尤其是数字区域周围的非数字字符等对数字区域的影响，便于执行后续的OCR处理。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的一种数字区域的识别方法的流程示意图；

图2是根据一示例性实施例示出的对象的样本图像的示意图；

图3A-3C是根据一示例性实施例示出的区域训练样本的示意图；

图4是根据一示例性实施例示出的利用区域分类器进行区域识别的示意流程图；

图5A-5C是根据一示例性实施例示出的利用区域分类器进行区域识别的示意流程图；

图6是根据一示例性实施例示出的基于金字塔扫描的方式实现区域识别的示意图；

图7A-7B是根据一示例性实施例示出的数字训练样本的示意图；

图8A-8B是根据一示例性实施例示出的利用数字判别器进行数字识别的示意图；

图9是根据一示例性实施例示出的一种数字区域的识别装置的示意框图；

图10是根据一示例性实施例示出的一种移动终端的示意框图；

图11是根据一示例性实施例示出的一种用于识别对象中的数字区域的装置的结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种数字区域的识别方法的流程示意图。

如图1所示，根据一示例性实施例示出的一种数字区域的识别方法，包括：

在步骤102中，获取对象的待识别图像。

在步骤104中，调用预配置的对应于所述对象的区域分类器。其中，所述区域分类器由对应于所述对象中的数字区域和非数字区域的区域训练样本生成，且所述区域训练样本来自所述对象的样本图像。

在步骤106中，根据所述区域分类器识别出所述待识别图像中的数字区域，以供对所述数字区域进行光学字符识别。

1、区域分类器

在训练区域分类器时，首先需要获取对象的样本图像。假定对象为手机充值卡，则图2示出了相应的示意图。在如图2所示的手机充值卡上，包括数字区域202和其他的非数字区域(未具体标示)。在使用时，需要将数字区域202内的密码(需要事先刮开涂层，图2所示为刮开后的场景)反馈至服务器，从而完成充值过程。

在获取了如图2所示的样本图像后，需要通过图像切割来进一步得到区域训练样本，包括正样本(对应于数字区域202)和负样本(对应于非数字区域)。

1)正样本：

图3A-3C是根据一示例性实施例示出的区域训练样本的示意图。

如图3A所示，为一示例性实施例的样本图像上的数字区域，可以将一定的字符数量作为切割单位，实现对一串密码的切割操作。比如将“013413460720662020”切割为“01”、“34”、“13”、“46”、“07”、“20”、“66”、“20”和“20”等。通过对不同的样本图像进行切割(比如图3B示出了另一样本图像的数字区域)，就能够得到很多对应于数字区域的正样本。正样本总数可以根据实际情况确定，比如可以选择为5-10万个，或者当正样本数量更多时，显然有助于提高区域分类器在训练后的识别准确度。

需要说明的是：一方面，正样本中可以包含重复的数字组合，比如图3A示出的样本图像中，切割得到了三个包含“20”的正样本，但由于光线、清晰度等外界条件的不同，使得重复样本的存在，有助于在各种环境条件下均保持较高的识别准确度。

另一方面，虽然图3A和图3B中的每个正样本均包含两个字符，但在对样本图像的数字区域进行切割时，切割长度只需要确保包含多个字符即可，从而确保每个正样本都能够体现出整体结构上的特征，以区别于单个数字字符；比如图3C示出了包含三个字符的正样本的情况。但由于字符数量的增多，也导致字符之间的组合数量的增加(比如两个字符时的组合数量为100个，而三个字符时的组合数量为1000个)，很可能使得某种组合的遗漏，从而影响到对相应情况的训练。

此外，为了确保各个正样本之间的一致性，可以对切割得到的所有正样本的图像规格进行归一化，比如归一化为40×20(单位为像素)。

2)负样本：

负样本取自样本图像上的非数字区域，可以按照预设大小进行切割和获取；或者，也可以事后进行统一的归一化处理，比如归一化为20×10(单位为像素)。由于非数字区域的范围较大，且对象的样式可能较多，因而负样本的数量可以比较大，比如采用的数量可以为100万。

3)训练过程：

基于准备好的训练样本(包括1)中的正样本和2)中的负样本)，在一示例性实施例中，对区域分类器进行训练的过程可以包括：

A.获取每个训练样本的HOG特征；

B.利用LDA算法对HOG特征进行线性投影，得到每个训练样本对应的第一分类器，该第一分类器可以为弱分类器；

C.利用Adaboost算法对所有的第一分类器进行级联组合，构成最终的第二分类器，以作为区域分类器，该第二分类器可以为相对于第一分类器的强分类器。

在该训练过程中，利用了Adaboost算法的级联特性，通过对各个训练样本对应的第一分类器的级联，从而极大地提升了区域分类器的识别准确度；同时，通过选用训练样本的HOG特征，使得能够根据梯度分布来更好地描述区域训练样本；进一步地，通过LDA投影对HOG特征进行降维处理，从而有助于降低第二分类器的训练难度，提高训练效率。

其中，区域分类器的训练过程可以预先离线完成，然后通过将其配置于移动终端内，则当移动终端需要识别对象的数字区域时，即可通过调用该区域分类器(即步骤104)，以完成识别操作。

2、识别数字区域

下面结合图4至图6，对步骤106中通过区域分类器来识别数字区域的过程进行详细描述。其中，图4是根据一示例性实施例示出的利用区域分类器进行区域识别的示意流程图；图5A-5C是根据一示例性实施例示出的利用区域分类器进行区域识别的示意流程图；图6是根据一示例性实施例示出的基于金字塔扫描的方式实现区域识别的示意图。

如图4所示，对应于步骤106，根据一示例性实施例示出的利用区域分类器进行区域识别的过程包括：

在步骤402中，在待识别图像上依次选取预设大小的候选区域。

其中，候选区域的大小可以根据实际需求进行预先设置，当候选区域较大时有助于提升识别效率，而当候选区域较小时则有助于提升识别精准度。比如图5A所示，根据预配置信息，在手机充值卡(即对象)的待识别图像上示出了候选区域502。

在步骤404中，通过所述区域分类器判别每个所述候选区域的类型。

针对图5A所示的手机充值卡的待识别图像，通过对每个候选区域的类型识别，假定得到了图5B中的判别结果为数字区域类型的候选区域。

在步骤406中，将判别结果为数字区域类型的候选区域进行合并，包括：根据数字区域的形状特征和/或数字区域在所述对象中的分布特征，即仅根据数字区域的形状特征、或者仅根据数字区域在所述对象中的分布特征、或者同时根据数字区域的形状特征和数字区域在所述对象中的分布特征，从而筛除被判定为数字区域类型的候选区域中与数字区域无关的候选区域，并对剩余的数字类型的候选区域进行合并。

其中，数字区域的形状特征包括：数字区域呈矩形、与对象的边沿平行、数字区域内的数字字符排列为一排或多排、数字区域为预设长度等；而数字区域在对象中的分布特征包括：数字区域在对象上的相对设置位置、数字区域与对象之间的相对显示比例等。通过仅依据数字区域的形状特征、或仅依据数字区域的分布特征、或同时依据数字区域的形状特征和数字区域的分布特征，即可筛除不符合要求的候选区域，消除误判断的影响；同时，通过合并符合要求的数字区域类型的候选区域，从整体上得到组成待识别图像上的数字区域。

参考图5B，对于右侧上部的两个候选区域，由于每个候选区域都独立，即长度较短，且不符合数字区域在手机充值卡上的相对位置(位于下方)，因而需要被筛除；对于左侧竖向排列的7个候选区域，虽然连续排列且长度较长，但由于实际上的数字区域采用横向排列，因而需要被筛除；对于右侧下部的5个候选区域，由于形成两排，且每排的长度都不足，因而需要被筛除；对于中部下方的6个候选区域，由于其横向排列且长度较长，容易与真实的数字区域混淆，因而需要根据如数字区域在手机充值卡上的相对位置进行筛除。

因此，能够确定图5B中，位于中部偏下的9个候选区域对应于最终的数字区域，并且由于9个候选区域连续排列，能够合并得到图5C所示的最终的数字区域506。

此外，在步骤106中，还可以包括：

如图6所示，按照预设比例对所述待识别图像进行缩放操作，以得到多个显示比例的待识别图像。然后，采用类似图5A-5C所示的方式，根据所述区域分类器识别每个显示比例的待识别图像中的数字区域；最终，根据识别出的每个数字区域在相应的待识别图像中的相对位置，合并所有显示比例的待识别图像中识别出的数字区域，以作为所述待识别图像中的数字区域。

3、区域优化

在步骤106中，已经基于区域分类器实现了对数字区域的识别，但由于数字区域中可能既包含数字字符，又包含数字字符周围的非数字字符。因此，为了避免非数字字符对数字字符的识别造成干扰，可以对基于区域分类器识别出的数字区域进一步处理，以期筛除其中包含的非数字字符。

因此，在步骤106之后，还可以包括：将所述区域分类器识别出的数字区域作为候选数字区域，并对每个候选数字区域中的字符进行切分操作；调用预配置的数字判别器，并根据所述数字判别器识别切分得到的每个字符；筛除所述候选数字区域中的非数字字符，并将剩余字符对应的区域作为所述待识别图像中的数字区域。

1)数字判别器：

数字判别器由对应于所述对象中的数字区域内的数字字符和非数字区域内的非数字字符的字符训练样本生成，且所述字符训练样本来自所述对象的样本图像。

如图7A和7B所示，分别对图3A和图3B对应的数字区域内的数字字符进行切分，并得到仅包含单个数字字符的正样本(即字符训练样本中的正样本)。为了便于学习训练，可以对所有正样本进行格式统一，比如归一化为20×20(单位为像素)。同时，还需要对对象上的非数字区域进行切分，从而得到非数字字符的负样本。为了便于学习训练，可以对所有正样本进行格式统一，比如使得负样本和正样本的规格相同，即归一化为20×20(单位为像素)。作为一示例性实施例，正样本和负样本的数量可以分别选为5万个。

2)训练过程：

基于准备好的训练样本(包括上述的正样本和负样本)，在一示例性实施例中，对数字判别器进行训练的过程可以包括：

A.获取每个训练样本的HOG特征；

B.利用SVM(SupportVectorMachine，支持向量机)算法对HOG特征进行训练，以得到数字判别器。当然，本领域技术人员应该理解的是：显然也可以利用其它的模式识别算法来替代SVM算法，均能够实现本公开的目的，其差别仅在于识别模式的不同。

其中，数字判别器的训练过程可以预先离线完成，然后通过将其配置于移动终端内，则当移动终端需要识别候选数字区域中的数字字符时，即可通过调用该数字判别器，以完成识别操作。

3)识别过程：

以图5C中识别出的数字区域506为例，说明对其中的数字字符进行识别的过程。当然，此处应当将该数字区域506作为候选数字区域。

首先，需要对候选数字区域进行切分，比如通过水平/垂直投影算法实现，从而得到如图8A所示的切分结果。通过观察可见，图8A最左侧和最右侧实际上并非数字字符，而是由未刮干净的涂层构成。因此，通过调用预配置的数字判别器，对切分得到的每个字符进行识别，即可识别并筛除最左侧和最右侧的非数字字符，并最终得到图8B所示的数字区域，排除了周围的非数字字符的影响。

由于数字判别器是预先基于对象的样本图像的样本训练而得到，使得在利用该数字判别器对字符类型进行识别时，其分类依据实际上来源于对象自身的字符特点，从而不仅能够适用于多种环境条件(每个样本图像均可以认为对应于一种环境条件)，而且具有更强的识别能力和更好的识别效果，从而准确识别出非数字字符，使最终得到的数字区域更加准确。

图9是根据一示例性实施例示出的一种数字区域的识别装置的示意框图。

如图9所示，根据一示例性实施例示出的一种数字区域的识别装置900，包括：图像获取单元902、分类器调用单元904、区域识别单元906、图像缩放单元908、区域合并单元910、字符切分单元912、字符识别单元914和字符筛除单元916。其中，区域识别单元906包括区域选取子单元906A、类型判别子单元906B和区域处理子单元906C。其中：

图像获取单元902被配置为：获取对象的待识别图像。

分类器调用单元904被配置为：调用预配置的对应于所述对象的区域分类器，所述区域分类器由对应于所述对象中的数字区域和非数字区域的区域训练样本生成，且所述区域训练样本来自所述对象的样本图像。

区域识别单元906被配置为：根据所述区域分类器识别出所述待识别图像中的数字区域，以供对所述数字区域进行光学字符识别。

作为一种示例性实施方式，区域分类器是由每个区域训练样本对应的第一分类器级联得到的第二分类器。以及，每个所述第一分类器是由相应区域训练样本的方向梯度直方图特征经过线性判别分析投影后得到。

作为一种示例性实施方式，对应于数字区域的每个区域训练样本包括至少两个数字字符。

区域选取子单元906A被配置为：在所述待识别图像上依次选取预设大小的候选区域；类型判别子单元906B被配置为：通过所述区域分类器判别每个所述候选区域的类型；区域处理子单元906C被配置为：将判别结果为数字区域类型的候选区域进行合并。

区域处理子单元被配置为：仅根据数字区域的形状特征、或仅根据数字区域在所述对象中的分布特征、或同时根据数字区域的形状特征和数字区域在所述对象中的分布特征，筛除被判定为数字区域类型的候选区域中与数字区域无关的候选区域，并对剩余的数字类型的候选区域进行合并。

图像缩放单元908被配置为：按照预设比例对所述待识别图像进行缩放操作，以得到多个显示比例的待识别图像；其中，所述区域识别单元906根据所述区域分类器识别每个显示比例的待识别图像中的数字区域；区域合并单元910被配置为：根据识别出的每个数字区域在相应的待识别图像中的相对位置，合并所有显示比例的待识别图像中识别出的数字区域，以作为所述待识别图像中的数字区域。

字符切分单元912被配置为：所述区域识别单元在根据所述区域分类器识别出所述待识别图像中的数字区域之后，将所述区域分类器识别出的数字区域作为候选数字区域，并对每个候选数字区域中的字符进行切分操作；字符识别单元914被配置为：调用预配置的数字判别器，并根据所述数字判别器识别切分得到的每个字符；字符筛除单元916被配置为：筛除所述候选数字区域中的非数字字符，并将剩余字符对应的区域作为所述待识别图像中的数字区域。

其中，所述数字判别器由对应于所述对象中的数字区域内的数字字符和非数字区域内的非数字字符的字符训练样本生成，且所述字符训练样本来自所述对象的样本图像。

作为一种示例性实施方式，所述数字判别器是由相应训练样本的方向梯度直方图特征经过支持向量机的训练而得到。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图10是根据一示例性实施例示出的一种移动终端的示意框图。

如图10所示，根据一示例性实施例示出的一种移动终端1000，包括如图9所示的数字区域的识别装置900。

如图11所示，根据一示例性实施例示出的一种用于识别对象中的数字区域的装置1100，该装置1100可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图11，装置1100可以包括以下一个或多个组件：处理组件1102，存储器1104，电源组件1106，多媒体组件1108，音频组件1110，输入/输出(I/O)的接口1112，传感器组件1114，以及通信组件1116。

处理组件1102通常控制装置1100的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理元件1102可以包括一个或多个处理器1120来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件1102可以包括一个或多个模块，便于处理组件1102和其他组件之间的交互。例如，处理部件1102可以包括多媒体模块，以方便多媒体组件1108和处理组件1102之间的交互。

存储器1104被配置为存储各种类型的数据以支持在设备1100的操作。这些数据的示例包括用于在装置1100上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器1104可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件1106为装置1100的各种组件提供电力。电源组件1106可以包括电源管理系统，一个或多个电源，及其他与为装置800生成、管理和分配电力相关联的组件。

多媒体组件1108包括在所述装置1100和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件1108可以包括一个前置摄像头和/或后置摄像头，即仅包括前置摄像头、或仅包括后置摄像头、或同时包括前置摄像头和后置摄像头。当装置1100处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件1110被配置为输出和/或输入音频信号。例如，音频组件1110包括一个麦克风(MIC)，当装置1100处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1104或经由通信组件1116发送。在一些实施例中，音频组件1110还包括一个扬声器，用于输出音频信号。

I/O接口1112为处理组件1102和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件1114包括一个或多个传感器，用于为装置1100提供各个方面的状态评估。例如，传感器组件1114可以检测到装置1100的打开/关闭状态，组件的相对定位，例如所述组件为装置800的显示器和小键盘，传感器组件1114还可以检测装置1100或装置1100一个组件的位置改变，用户与装置1100接触的存在或不存在，装置1100方位或加速/减速和装置1100的温度变化。传感器组件1114可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件1114还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件1114还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件1116被配置为便于装置1100和其他设备之间有线或无线方式的通信。装置1100可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信部件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信部件1116还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置1100可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器1104，上述指令可由装置1100的处理器1120执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

其中，当所述存储介质中的指令由移动终端的处理器执行时，使得移动终端能够执行一种数字区域的识别方法，所述方法包括：

获取对象的待识别图像；

可选地，所述区域分类器是由每个区域训练样本对应的第一分类器级联得到的第二分类器。

可选地，每个所述第一分类器是由相应区域训练样本的方向梯度直方图特征经过线性判别分析投影后得到。

可选地，对应于数字区域的每个区域训练样本包括至少两个数字字符。

可选地，根据所述区域分类器识别所述待识别图像中的数字区域包括：

在所述待识别图像上依次选取预设大小的候选区域；

通过所述区域分类器判别每个所述候选区域的类型；

将判别结果为数字区域类型的候选区域进行合并。

可选地，将判别结果为数字类型的候选区域进行合并包括：根据数字区域的形状特征和/或数字区域在所述对象中的分布特征，即仅根据数字区域的形状特征、或仅根据数字区域在所述对象中的分布特征、或同时根据数字区域的形状特征和数字区域在所述对象中的分布特征，从而筛除被判定为数字区域类型的候选区域中与数字区域无关的候选区域，并对剩余的数字类型的候选区域进行合并。

可选地，还包括：

按照预设比例对所述待识别图像进行缩放操作，以得到多个显示比例的待识别图像；

根据所述区域分类器识别每个显示比例的待识别图像中的数字区域；以及

根据识别出的每个数字区域在相应的待识别图像中的相对位置，合并所有显示比例的待识别图像中识别出的数字区域，以作为所述待识别图像中的数字区域。

可选地，在根据所述区域分类器识别出所述待识别图像中的数字区域之后，还包括：

将所述区域分类器识别出的数字区域作为候选数字区域，并对每个候选数字区域中的字符进行切分操作；

调用预配置的数字判别器，并根据所述数字判别器识别切分得到的每个字符；

筛除所述候选数字区域中的非数字字符，并将剩余字符对应的区域作为所述待识别图像中的数字区域。

可选地，所述数字判别器由对应于所述对象中的数字区域内的数字字符和非数字区域内的非数字字符的字符训练样本生成，且所述字符训练样本来自所述对象的样本图像。

可选地，所述数字判别器是由相应训练样本的方向梯度直方图特征经过支持向量机的训练而得到。

因此，本公开通过预先基于对象的样本图像的样本训练，有助于提升对数字区域的识别准确度，避免非数字区域、尤其是数字区域周围的非数字字符等对数字区域的影响，便于执行后续的OCR处理。

以上所述仅为本公开的较佳实施例而已，并不用以限制本公开，凡在本公开的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本公开保护的范围之内。

Claims

1.一种数字区域的识别方法，其特征在于，包括：

获取对象的待识别图像；

2.根据权利要求1所述的识别方法，其特征在于，所述区域分类器是由每个区域训练样本对应的第一分类器级联得到的第二分类器。

3.根据权利要求2所述的识别方法，其特征在于，每个所述第一分类器是由相应区域训练样本的方向梯度直方图特征经过线性判别分析投影后得到。

4.根据权利要求1所述的识别方法，其特征在于，对应于数字区域的每个区域训练样本包括至少两个数字字符。

5.根据权利要求1所述的识别方法，其特征在于，根据所述区域分类器识别所述待识别图像中的数字区域包括：

在所述待识别图像上依次选取预设大小的候选区域；

通过所述区域分类器判别每个所述候选区域的类型；

将判别结果为数字区域类型的候选区域进行合并。

6.根据权利要求5所述的识别方法，其特征在于，将判别结果为数字类型的候选区域进行合并包括：

根据数字区域的形状特征和/或数字区域在所述对象中的分布特征，筛除被判定为数字区域类型的候选区域中与数字区域无关的候选区域，并对剩余的数字类型的候选区域进行合并。

7.根据权利要求1所述的识别方法，其特征在于，还包括：

8.根据权利要求1所述的识别方法，其特征在于，在根据所述区域分类器识别出所述待识别图像中的数字区域之后，还包括：

9.根据权利要求8所述的识别方法，其特征在于，所述数字判别器由对应于所述对象中的数字区域内的数字字符和非数字区域内的非数字字符的字符训练样本生成，且所述字符训练样本来自所述对象的样本图像。

10.根据权利要求9所述的识别方法，其特征在于，所述数字判别器是由相应训练样本的方向梯度直方图特征经过支持向量机的训练而得到。

11.一种数字区域的识别装置，其特征在于，包括：

图像获取单元，用于获取对象的待识别图像；

12.根据权利要求11所述的识别装置，其特征在于，所述区域分类器是由每个区域训练样本对应的第一分类器级联得到的第二分类器。

13.根据权利要求12所述的识别装置，其特征在于，每个所述第一分类器是由相应区域训练样本的方向梯度直方图特征经过线性判别分析投影后得到。

14.根据权利要求11所述的识别装置，其特征在于，对应于数字区域的每个区域训练样本包括至少两个数字字符。

15.根据权利要求11所述的识别装置，其特征在于，所述区域识别单元包括：

区域选取子单元，用于在所述待识别图像上依次选取预设大小的候选区域；

类型判别子单元，用于通过所述区域分类器判别每个所述候选区域的类型；

区域处理子单元，用于将判别结果为数字区域类型的候选区域进行合并。

16.根据权利要求15所述的识别装置，其特征在于，所述区域处理子单元用于：

17.根据权利要求11所述的识别装置，其特征在于，还包括：

图像缩放单元，用于按照预设比例对所述待识别图像进行缩放操作，以得到多个显示比例的待识别图像；其中，所述区域识别单元根据所述区域分类器识别每个显示比例的待识别图像中的数字区域；

区域合并单元，用于根据识别出的每个数字区域在相应的待识别图像中的相对位置，合并所有显示比例的待识别图像中识别出的数字区域，以作为所述待识别图像中的数字区域。

18.根据权利要求11所述的识别装置，其特征在于，还包括：

字符切分单元，用于所述区域识别单元在根据所述区域分类器识别出所述待识别图像中的数字区域之后，将所述区域分类器识别出的数字区域作为候选数字区域，并对每个候选数字区域中的字符进行切分操作；

字符识别单元，用于调用预配置的数字判别器，并根据所述数字判别器识别切分得到的每个字符；

字符筛除单元，用于筛除所述候选数字区域中的非数字字符，并将剩余字符对应的区域作为所述待识别图像中的数字区域。

19.根据权利要求18所述的识别装置，其特征在于，所述数字判别器由对应于所述对象中的数字区域内的数字字符和非数字区域内的非数字字符的字符训练样本生成，且所述字符训练样本来自所述对象的样本图像。

20.根据权利要求19所述的识别装置，其特征在于，所述数字判别器是由相应训练样本的方向梯度直方图特征经过支持向量机的训练而得到。

21.一种移动终端，其特征在于，包括如权利要求11至20中任一项所述的数字区域的识别装置。