CN103955684A - 字符提取方法、装置及终端 - Google Patents

字符提取方法、装置及终端 Download PDF

Info

Publication number
CN103955684A
CN103955684A CN201410127565.6A CN201410127565A CN103955684A CN 103955684 A CN103955684 A CN 103955684A CN 201410127565 A CN201410127565 A CN 201410127565A CN 103955684 A CN103955684 A CN 103955684A
Authority
CN
China
Prior art keywords
pixel
correlation
gradient
character
symmetrical degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410127565.6A
Other languages
English (en)
Other versions
CN103955684B (zh
Inventor
王百超
王琳
陈志军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Technology Co Ltd
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Priority to CN201410127565.6A priority Critical patent/CN103955684B/zh
Publication of CN103955684A publication Critical patent/CN103955684A/zh
Application granted granted Critical
Publication of CN103955684B publication Critical patent/CN103955684B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

本发明是关于一种字符提取方法、装置及终端,属于图像处理技术领域。方法包括:对于目标图像中的每一个像素点,在预设数目个方向中的一个方向上,以像素点为中心,根据目标图像中字符线条的粗细程度,在目标图像中选择一个区块;根据区块内各个像素点的像素值,计算像素点在方向上的梯度对称相关度;根据各个像素点在预设数目个方向上的梯度对称相关度,在目标图像中进行字符提取。本发明基于目标图像中各个像素点在预设数目个方向上的梯度对称相关度进行字符提取,由于该种字符提取方式对大尺度的光照明暗变化情况鲁棒,所以不但适用于印刷体图像,还可适用于包含凸起区域的银行卡或车牌等非印刷体图像,该种字符提取方式具有较强的普适性。

Description

字符提取方法、装置及终端
技术领域
本公开涉及图像处理技术领域,特别涉及一种字符提取方法、装置及终端。
背景技术
随着社会的不断进步,利用OCR(Optical Character Recognition,光学字符识别)系统进行字符识别已经广泛地应用于各行各业中,如,通行证处理、安全文件处理(支票、财务文件、账单)、邮件追踪处理等。由于OCR系统在进行字符识别时,要求字符区域中的字符清晰、背景单一、分辨率高,所以为了使OCR系统能够对字符进行有效识别,如何进行字符提取,成为了一个关键问题。
相关技术中,基于字符切分和颜色聚类进行字符提取。首先,将每一行包含多个字符的区域图像,切分成只包含单个字符的若干个子区域图像;之后,对于任一个子区域图像来说,根据字符颜色特征对该子区域图像进行颜色聚类,分离出不同的颜色图层;再者,从多个颜色图层中找到包含最多字符信息的颜色图层,并将该颜色图层作为单个字符提取图像;重复执行上面两个步骤,得到多幅单个字符提取图像;最后,将得到的多幅单个字符提取图像进行拼接,得到整个字符提取图像,将整个字符提取图像输入给OCR系统进行识别。
在实现本公开的过程中,发明人发现相关技术至少存在以下问题:
在对银行卡或车牌等表面凹凸不平的目标物进行字符提取时,由于凸起区域可能存在强烈的反光和阴影,所以目标物图像的灰度可能分布不均匀,进而在对由目标图像中提取的字符进行识别时,识别准确率较低,该种字符提取方式不具有普适性。
发明内容
为克服相关技术中存在的问题,本公开提供一种字符提取方法、装置及终端。
根据本公开实施例的第一方面,提供一种字符提取方法,所述方法包括:
对于目标图像中的每一个像素点,在预设数目个方向中的一个方向上,以所述像素点为中心,根据所述目标图像中字符线条的粗细程度,在所述目标图像中选择一个区块;
根据所述区块内各个像素点的像素值,计算所述像素点在所述方向上的梯度对称相关度;
根据各个像素点在预设数目个方向上的梯度对称相关度,在所述目标图像中进行字符提取。
可选地,当所述方向为所述像素点的水平右方向时,所述根据所述区块内各个像素点的像素值,应用如下公式,计算所述像素点在所述方向上的梯度对称相关度,包括:
C ( i , j ) = Σ r = 1 h Σ c = 1 w / 2 [ ( I ( i , j + c ) - I ( i , j ) ) * ( I ( i , j - c ) - I ( i , j ) ) ]
其中,h和w为常数,h为所述区块的高度值,w为所述区块的宽度值,i和j为变量,i∈[0,H],j∈[0,W],H和W分别为所述目标图像的高度值和宽度值,I(i,j)、I(i,j-c)、I(i,j+c)分别为像素点(i,j)、(i,j-c)、(i,j+c)的像素值,C(i,j)为所述像素点在所述方向上的梯度对称相关度。
可选地,所述根据各个像素点在预设数目个方向上的梯度对称相关度,在所述目标图像中进行字符提取,包括:
对于多个像素点中的一个像素点,从所述像素点在预设数目个方向上的梯度对称相关度中,确定小于第一预设阈值的梯度对称相关度;
将所述小于第一预设阈值的梯度对称相关度置0;
确定所述像素点的邻域,根据所述邻域包括的像素点对应的梯度对称相关度,对所述像素点在预设数目个方向上的梯度对称相关度进行归一化处理,得到所述像素点在预设数目个方向上的归一化梯度对称相关度;
根据各个像素点在预设数目个方向上的归一化梯度对称相关度,在所述目标图像中进行字符提取。
可选地,所述根据所述邻域中包括的像素点对应的梯度对称相关度,应用下述公式,对所述像素点在预设数目个方向上的梯度对称相关度进行归一化处理,包括:
C ‾ x ( i , j ) = Σ ( m , n ) ∈ N ( i , j ) ( C x ( m , n ) ) Σ d ∈ D Σ ( m , n ) ∈ N ( i , j ) ( C d ( m , n ) + ∂ ) 2
其中指代所述像素点在x方向上的归一化梯度对称相关度,Cx(m,n)为像素点(m,n)在x方向上的梯度对称相关度,Cd(m,n)为像素点(m,n)在d方向上的梯度对称相关度,为归一化系数,N(i,j)指代所述像素点的邻域,D指代预设数目个方向的集合。
可选地,根据各个像素点在预设数目个方向上的归一化梯度对称相关度,在所述目标图像中进行字符提取,包括:
对于多个像素点中的一个像素点,根据所述像素点在预设数目个方向上的归一化梯度对称相关度,计算所述像素点的字符似然度;
在所述目标图像中确定字符似然度大于第二预设阈值的各个像素点;
在所述字符似然度大于第二预设阈值的各个像素点中,将最多像素点聚集的图像区域确定为字符所在区域。
可选地,所述根据所述像素点在预设数目个方向上的归一化梯度对称相关度,应用下述公式,计算所述像素点的字符似然度,包括:
P ( i , j ) = 1 - e - ( max ( C ‾ d ( i , j ) , d ∈ D ) - min ( C ‾ d ( i , j ) , d ∈ D ) ) 2 / σ 2
其中,P(i,j)为所述像素点的字符似然度,指代所述像素点在预设数目个方向上的归一化梯度对称相关度中的最大者,指代所述像素点在预设数目个方向上的归一化梯度对称相关度中的最小者,σ2指代方差系数。
根据本公开实施例的第二方面,提供一种字符提取装置,所述装置包括:
区块选择模块,用于对于目标图像中的每一个像素点,在预设数目个方向中的一个方向上,以所述像素点为中心,根据所述目标图像中字符线条的粗细程度,在所述目标图像中选择一个区块;
相关度计算模块,用于根据所述区块内各个像素点的像素值,计算所述像素点在所述方向上的梯度对称相关度;
字符提取模块,用于根据各个像素点在预设数目个方向上的梯度对称相关度,在所述目标图像中进行字符提取。
可选地,当所述方向为所述像素点的水平右方向时,所述相关度计算模块,应用如下公式,计算所述像素点在所述方向上的梯度对称相关度:
C ( i , j ) = Σ r = 1 h Σ c = 1 w / 2 [ ( I ( i , j + c ) - I ( i , j ) ) * ( I ( i , j - c ) - I ( i , j ) ) ]
其中,h和w为常数,h为所述区块的高度值,w为所述区块的宽度值,i和j为变量,i∈[0,H],j∈[0,W],H和W分别为所述目标图像的高度值和宽度值,I(i,j)、I(i,j-c)、I(i,j+c)分别为像素点(i,j)、(i,j-c)、(i,j+c)的像素值,C(i,j)为所述像素点在所述方向上的梯度对称相关度。
可选地,所述字符提取模块,包括:
相关度确定单元,用于对于多个像素点中的一个像素点,从所述像素点在预设数目个方向上的梯度对称相关度中,确定小于第一预设阈值的梯度对称相关度;
相关度赋值单元,用于将所述小于第一预设阈值的梯度对称相关度置0;
归一化处理单元,用于确定所述像素点的邻域,根据所述邻域包括的像素点对应的梯度对称相关度,对所述像素点在预设数目个方向上的梯度对称相关度进行归一化处理,得到所述像素点在预设数目个方向上的归一化梯度对称相关度;
字符提取单元,用于根据各个像素点在预设数目个方向上的归一化梯度对称相关度,在所述目标图像中进行字符提取。
可选地,所述归一化处理模块,应用下述公式,对所述像素点在预设数目个方向上的梯度对称相关度进行归一化处理:
C ‾ x ( i , j ) = Σ ( m , n ) ∈ N ( i , j ) ( C x ( m , n ) ) Σ d ∈ D Σ ( m , n ) ∈ N ( i , j ) ( C d ( m , n ) + ∂ ) 2
其中指代所述像素点在x方向上的归一化梯度对称相关度,Cx(m,n)为像素点(m,n)在x方向上的梯度对称相关度,Cd(m,n)为像素点(m,n)在d方向上的梯度对称相关度,为归一化系数,N(i,j)指代所述像素点的邻域,D指代预设数目个方向的集合。
可选地,所述字符提取单元,包括:
字符似然度计算子单元,用于对于多个像素点中的一个像素点,根据所述像素点在预设数目个方向上的归一化梯度对称相关度,计算所述像素点的字符似然度;
像素点确定子单元,用于在所述目标图像中确定字符似然度大于第二预设阈值的各个像素点;
字符区域确定子单元,用于在所述字符似然度大于第二预设阈值的各个像素点中,将最多像素点聚集的图像区域确定为字符所在区域。
可选地,所述字符似然度计算子单元,应用下述公式,计算所述像素点的字符似然度:
P ( i , j ) = 1 - e - ( max ( C ‾ d ( i , j ) , d ∈ D ) - min ( C ‾ d ( i , j ) , d ∈ D ) ) 2 / σ 2
其中,P(i,j)为所述像素点的字符似然度,指代所述像素点在预设数目个方向上的归一化梯度对称相关度中的最大者,指代所述像素点在预设数目个方向上的归一化梯度对称相关度中的最小者,σ2指代方差系数。
根据本公开实施例的第三方面,提供一种终端,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:对于目标图像中的每一个像素点,在预设数目个方向中的一个方向上,以所述像素点为中心,根据所述目标图像中字符线条的粗细程度,在所述目标图像中选择一个区块;根据所述区块内各个像素点的像素值,计算所述像素点在所述方向上的梯度对称相关度;根据各个像素点在预设数目个方向上的梯度对称相关度,在所述目标图像中进行字符提取。
本公开的实施例提供的技术方案可以包括以下有益效果:
基于目标图像中各个像素点在预设数目个方向上的梯度对称相关度进行字符提取,由于该种字符提取方式对大尺度的光照明暗变化情况鲁棒,所以不但适用于印刷体图像,还可适用于包含凸起区域的银行卡或车牌等非印刷体图像,该种字符提取方式具有较强的普适性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种字符灰度示意图。
图2是根据一示例性实施例示出的一种字符提取方法的流程图。
图3是根据一示例性实施例示出的一种字符提取方法的流程图。
图4是根据一示例性实施例示出的一种预设数目个方向的方向示意图。
图5是根据一示例性实施例示出的一种字符提取装置的示意图。
图6是根据一示例性实施例示出的一种终端的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。在对本发明实施例做详细地解释说明之前,先对本发明实施例的应用场景给予说明。在对诸如银行卡或车牌图像等非印刷体图像进行字符提取时,由于银行卡或车牌表面的字符一般为凸起状态,而凸起区域常常存在强烈的反光和阴影,导致图像的灰度不均匀,所以基于现有的字符提取技术进行字符提取,精准率较低。参见图1,右边图是左边图对应行的灰度图,右边图中两虚线间的部分为字符线条区域,可见线条区域不能通过固定的阈值进行分割。线条区域由于凸起的影响,有强烈的灰度变化,表现为比较强的对称极值和峰值。因此,本发明实施例提供了一种基于对称相关性的字符提取技术,可有效地对银行卡或车牌图像等非印刷体图像进行字符提取。具体过程详见下述实施例。
图2是根据一示例性实施例示出的一种字符提取方法的流程图,如图1所示,字符提取方法用于终端中,包括以下步骤。
在步骤201中,对于目标图像中的每一个像素点,在预设数目个方向中的一个方向上,以像素点为中心,根据目标图像中字符线条的粗细程度,在目标图像中选择一个区块。
在步骤202中,根据区块内各个像素点的像素值,计算像素点在方向上的梯度对称相关度。
在步骤203中,根据各个像素点在预设数目个方向上的梯度对称相关度,在目标图像中进行字符提取。
本发明实施例提供的方法,基于目标图像中各个像素点在预设数目个方向上的梯度对称相关度进行字符提取,由于该种字符提取方式对大尺度的光照明暗变化情况鲁棒,所以不但适用于印刷体图像,还可适用于包含凸起区域的银行卡或车牌图像等非印刷体图像,该种字符提取方式具有较强的普适性。
可选地,当该方向为该像素点的水平右方向时,根据区块内各个像素点的像素值,应用如下公式,计算像素点在方向上的梯度对称相关度,包括:
C ( i , j ) = Σ r = 1 h Σ c = 1 w / 2 [ ( I ( i , j + c ) - I ( i , j ) ) * ( I ( i , j - c ) - I ( i , j ) ) ]
其中,h和w为常数,h为区块的高度值,w为区块的宽度值,i和j为变量,i∈[0,H],j∈[0,W],H和W分别为目标图像的高度值和宽度值,I(i,j)、I(i,j-c)、I(i,j+c)分别为像素点(i,j)、(i,j-c)、(i,j+c)的像素值,C(i,j)为像素点在方向上的梯度对称相关度。
可选地,根据各个像素点在预设数目个方向上的梯度对称相关度,在目标图像中进行字符提取,包括:
对于多个像素点中的一个像素点,从像素点在预设数目个方向上的梯度对称相关度中,确定小于第一预设阈值的梯度对称相关度;
将小于第一预设阈值的梯度对称相关度置0;
确定像素点的邻域,根据邻域包括的像素点对应的梯度对称相关度,对像素点在预设数目个方向上的梯度对称相关度进行归一化处理,得到像素点在预设数目个方向上的归一化梯度对称相关度;
根据各个像素点在预设数目个方向上的归一化梯度对称相关度,在目标图像中进行字符提取。
可选地,根据邻域中包括的像素点对应的梯度对称相关度,应用下述公式,对像素点在预设数目个方向上的梯度对称相关度进行归一化处理,包括:
C ‾ x ( i , j ) = Σ ( m , n ) ∈ N ( i , j ) ( C x ( m , n ) ) Σ d ∈ D Σ ( m , n ) ∈ N ( i , j ) ( C d ( m , n ) + ∂ ) 2
其中指代像素点在x方向上的归一化梯度对称相关度,Cx(m,n)为像素点(m,n)在x方向上的梯度对称相关度,Cd(m,n)为像素点(m,n)在d方向上的梯度对称相关度,为归一化系数,N(i,j)指代像素点的邻域,D指代预设数目个方向的集合。
可选地,根据各个像素点在预设数目个方向上的归一化梯度对称相关度,在目标图像中进行字符提取,包括:
对于多个像素点中的一个像素点,根据像素点在预设数目个方向上的归一化梯度对称相关度,计算像素点的字符似然度;
在目标图像中确定字符似然度大于第二预设阈值的各个像素点;
在字符似然度大于第二预设阈值的各个像素点中,将最多像素点聚集的图像区域确定为字符所在区域。
可选地,根据像素点在预设数目个方向上的归一化梯度对称相关度,应用下述公式,计算像素点的字符似然度,包括:
P ( i , j ) = 1 - e - ( max ( C ‾ d ( i , j ) , d ∈ D ) - min ( C ‾ d ( i , j ) , d ∈ D ) ) 2 / σ 2
其中,P(i,j)为像素点的字符似然度,指代像素点在预设数目个方向上的归一化梯度对称相关度中的最大者,指代像素点在预设数目个方向上的归一化梯度对称相关度中的最小者,σ2指代方差系数。
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
图3是根据一示例性实施例示出的一种字符提取方法的流程图。现结合上述实施例的内容对本实施例提供的字符提取方法进行详细地解释说明。如图2所示,字符提取方法用于终端中,包括以下步骤。
在步骤301中,对于目标图像中的每一个像素点,在预设数目个方向中的一个方向上,以该像素点为中心,根据目标图像中字符线条的粗细程度,在目标图像中选择一个区块。
其中,目标图像指代包括一个或多个字符的图像。目标图像既可为数字视频中包括平滑字符区域的视频帧,也可为包括凹凸字符区域的银行卡图像或车牌图像等,本实施例对目标图像的类型不进行具体限定。无论目标图像中是否包含凹凸字符区域,应用本实施例提供的方法均可对目标图像中的字符区域进行有效提取。参见图4,针对一个像素点来说,预设数目个方向可为该像素点的水平右方向(0。)、右上45度方向(45。)、垂直方向(90。)及左上45度方向(135。)等4个方向。当然,预设数目个方向除了包含上述4个方向外,还可包含其他方向,本实施例对此不做具体限定。本实施例仅以预设数目个方向为上述4个方向为例进行举例说明。
在本发明实施例中,针对目标图像中的一个像素点来说,在计算该像素点在预设数目个方向上的梯度对称相关度时,还需以该像素点为中心,确定预设数目个区块。其中,预设数目个区块的确定需依据下述原则:对于预设数目个方向中的一个方向,根据目标图像中字符线条的粗细程度确定该方向上的区块。当字符线条较粗时,以该像素点为中心,确定一个包括较多像素点的图像区域,将该图像区域确定为该方向上的区块;当字符线条较细时,以该像素点为中心,确定一个包括较少像素点的图像区域,将该图像区域确定为该方向上的区块。以区块的大小为h×w为例,则当字符线条较粗时,w取值较大,区块中包括较多的像素点;当字符线条较细时,w取值较小,区块中包括较少的像素点。以图4所示的0。方向为例,若以像素点(i,j)为中心,且在0。方向上确定了一个3×5大小的区块,则该区块中包括如下述表1所示的各个像素点。
表1
(i-1,j-2) (i-1,j-1) (i-1,j) (i-1,j+1) (i-1,j+2)
(i,j-2) (i,j-1) (i,j) (i,j+1) (i,j+2)
(i+1,j-2) (i+1,j-1) (i+1,j) (i+1,j+1) (i+1,j+2)
由表1可以看出,像素点(i,j)位于区块中心。在其他方向上确定区块包含的各个像素点时,确定方式同0。方向一致,此处不再赘述。无论在何种方向上确定区块,区块的中心均为像素点(i,j)。
在步骤302中,根据区块内各个像素点的像素值,计算该像素点在该方向上的梯度对称相关度。
在本发明实施例中,当该方向为0。方向时,根据区块内各个像素点的像素值,应用如下公式(1),计算该像素点在0。方向上的梯度对称相关度:
C ( i , j ) = Σ r = 1 h Σ c = 1 w / 2 [ ( I ( i , j + c ) - I ( i , j ) ) * ( I ( i , j - c ) - I ( i , j ) ) ] - - - ( 1 )
其中,h和w为常数,h为区块的高度值,w为区块的宽度值,i和j为变量,i∈[0,H],j∈[0,W],H和W分别为目标图像的高度值和宽度值,I(i,j)、I(i,j-c)、I(i,j+c)分别为像素点(i,j)、(i,j-c)、(i,j+c)的像素值,C(i,j)为该像素点在0。方向上的梯度对称相关度。若预设数目个方向为步骤301所示的4个方向,则其他三个方向上的梯度对称相关度的计算方式,同上述公式(1)一致,此处不再赘述。区块内各个像素点的像素值,可利用matlab程序或Opencv程序等相关技术进行获取,本实施例对获取区块内各个像素点的像素值的方式不进行具体限定。需要说明的是,r和c的取值为正整数,如果w为基数,则c的取值上限为w-1/2。
此外,对于目标图像中的每一个像素点来说,通过上述步骤301和步骤302提供的方法,可计算出每一个像素点在预设数目个方向上的梯度对称相关度。以预设数目个方向为步骤301所示的4个方向为例,则每个像素点均对应4个梯度对称相关度。在得到目标图像中每一个像素点对应的梯度对称相关度后,便可根据下述步骤303至步骤305进行目标图像中字符区域的提取。具体过程详见下述步骤303至步骤305。
在步骤303中,对于多个像素点中的一个像素点,从该像素点在预设数目个方向上的梯度对称相关度中,确定小于第一预设阈值的梯度对称相关度;将小于第一预设阈值的梯度对称相关度置0。
其中,第一预设阈值的大小可为6或7等数值,本实施例对第一预设阈值的大小不进行具体限定。在本发明实施例中,之所以从该像素点在预设数目个方向上的梯度对称相关度中,确定小于第一预设阈值的梯度对称相关度,是为了后续在基于梯度对称相关度进行字符区域提取时,能够有效且精确地进行提取。由于梯度对称相关度指代的是一个像素点和其邻近像素点中,各个像素点之间的像素值相关程度,而字符区域中各个字符的像素值通常又趋于一致。所以梯度对称相关度趋于一致,且数值较大的图像区域才有可能是字符区域。所以针对每一个像素点来说,小于第一预设阈值的梯度对称相关度对字符区域的提取没有实质意义,甚至还会影响字符区域的提取,所以对小于第一预设阈值的梯度对称相关度进行置0。
需要说明的是,通过上述步骤303的处理,每一个像素点对应的梯度对称相关度中,大于第一预设阈值的梯度对称相关度保持其原来数值不变,而小于第一预设阈值的梯度对称相关度则由原来数值变为0。在经过上述处理后,在对目标图像中的字符区域进行提取之前,为了确保本实施例提供的字符提取方式对大尺度内的光照明暗变化鲁棒,还需对每一个像素点对应的梯度对称相关度进行归一化处理。归一化处理的具体过程详见下述步骤304。
在步骤304中,确定该像素点的邻域,根据邻域包括的像素点对应的梯度对称相关度,对该像素点在预设数目个方向上的梯度对称相关度进行归一化处理,得到该像素点在预设数目个方向上的归一化梯度对称相关度。
其中,对于目标图像中的一个像素点来说,该像素点的邻域指代该像素点邻近像素点所组成的区域。例如,以像素点(i,j)为例,像素点(i,j)的邻域可为以像素点(i,j)为中心的5×5区域,该邻域包含除像素点(i,j)之外的且与像素点(i,j)邻近的其他24个像素点。当然,像素点的邻域的大小除上述数值外,还可为其他数值,本实施例对像素点的邻域的大小不进行具体限制。
在本发明实施例中,由于已根据上述步骤301和步骤302得到各个像素点在预设数目个方向上的梯度对称相关度。所以针对一个像素点来说,在确定该像素点的邻域后,便可根据该邻域包括的像素点对应的梯度对称相关度,对该像素点在预设数目个方向上的梯度对称相关度进行归一化处理,进而得到该像素点在预设数目个方向上的归一化梯度对称相关度。其中,根据该邻域中包括的像素点对应的梯度对称相关度,应用下述公式(2),对该像素点在预设数目个方向上的梯度对称相关度进行归一化处理:
C ‾ x ( i , j ) = Σ ( m , n ) ∈ N ( i , j ) ( C x ( m , n ) ) Σ d ∈ D Σ ( m , n ) ∈ N ( i , j ) ( C d ( m , n ) + ∂ ) 2 - - - ( 2 )
其中指代该像素点在x方向上的归一化梯度对称相关度;Cx(m,n)为像素点(m,n)在x方向上的梯度对称相关度;Cd(m,n)为像素点(m,n)在d方向上的梯度对称相关度;为归一化系数,其取值可视情况或经验值而定;N(i,j)指代该像素点的邻域,邻域大小同样视情况或经验值而定;D指代预设数目个方向的集合,若预设数目个方向为步骤301所示的4个方向,则D={0°,45°,90°,135°}。
在步骤305中,根据各个像素点在预设数目个方向上的归一化梯度对称相关度,在目标图像中进行字符提取。
在本发明实施例中,在根据各个像素点在预设数目个方向上的归一化梯度对称相关度,在目标图像中进行字符提取时,可采取下述方式实现:
对于多个像素点中的一个像素点,根据像素点在预设数目个方向上的归一化梯度对称相关度,计算像素点的字符似然度;在目标图像中确定字符似然度大于第二预设阈值的各个像素点;在字符似然度大于第二预设阈值的各个像素点中,将最多像素点聚集的图像区域确定为字符所在区域。
其中,第二预设阈值的大小可为1或10等数值,本实施例对第二预设阈值的大小不进行具体限定。字符似然度,即字符可能性;每个像素点的字符似然度指代每个像素点的字符可能性,也即每个像素点是字符的可能程度。字符似然度越大,说明与该字符似然度对应的像素点是字符的可能性越大;字符似然度越小,说明与该字符似然度对应的像素点是字符的可能性越小。本步骤基于上述原则在目标图像中进行字符区域的提取。
可选地,根据该像素点在预设数目个方向上的归一化梯度对称相关度,应用下述公式(3),计算该像素点的字符似然度:
P ( i , j ) = 1 - e - ( max ( C ‾ d ( i , j ) , d ∈ D ) - min ( C ‾ d ( i , j ) , d ∈ D ) ) 2 / σ 2 - - - ( 3 )
其中,P(i,j)为像素点的字符似然度;指代像素点在预设数目个方向上的归一化梯度对称相关度中的最大者,以预设数目个方向为步骤301所示的4个方向为例,则 ( max ( C ‾ d ( i , j ) , d ∈ D ) 指代 { C 0 ‾ ( i , j ) , C 45 ‾ ( i , j ) , C 90 ‾ ( i , j ) , C 135 ‾ ( i , j ) } 中的最大者;指代像素点在预设数目个方向上的归一化梯度对称相关度中的最小者,以预设数目个方向为步骤301所示的4个方向为例,则 ( max ( C ‾ d ( i , j ) , d ∈ D ) 指代 { C 0 ‾ ( i , j ) , C 45 ‾ ( i , j ) , C 90 ‾ ( i , j ) , C 135 ‾ ( i , j ) } 中的最小者;σ2指代方差系数,该值可视情况或经验值而定。
可选地,在根据上述公式(3)计算得到目标图像中每个像素点的字符似然度后,便可根据每个像素点的字符似然度的数值在目标图像中进行字符区域提取。在进行字符区域提取时,首先在所有的字符似然度中,确定大于第二预设阈值的字符似然度;之后,确定大于第二预设阈值的字符似然度对应的各个像素点;最后,根据各个像素点的坐标值,在目标图像中确定最多字符似然度大于第二预设阈值的像素点所在区域,将该区域确定为字符区域。举一个例子来说,假设确定字符似然度大于第二预设阈值的像素点总共有200个。其中,有180个像素点聚集在目标图像中的同一区域,各个像素点之间相互靠近。而剩余20个像素点零散地分布在目标图像中。针对该种情况,在目标图像中进行字符提取时,将180个像素点所聚集的区域确定为字符区域。在确定字符区域后,将该字符区域输入给OCR系统,经由OCR系统对字符区域中的字符进行识别。
需要说明的是,在根据上述公式(3)得到目标图像中每个像素点的字符似然度后,在根据每个像素点的字符似然度在目标图像中进行字符提取之前,为提高字符提取的精确度,本实施例提供的方法还包括如下对字符似然度进行后处理的步骤:首先,对目标图像进行高斯模糊,以减少目标图像噪声和降低图像细节层次;然后,将小于第三预设阈值的字符似然度置0,以滤除目标图像噪声;最后,对每个像素点的字符似然度进行归一化,归一化为0□255或0□1,并对目标图像进行连通区域分析,进一步去除目标图像中的噪声区域。
本发明实施例提供的方法,基于目标图像中各个像素点在预设数目个方向上的梯度对称相关度进行字符提取,不但适用于印刷体图像,还可适用于包含凸起区域的银行卡或车牌图像等非印刷体图像,该种字符提取方式具有较强的普适性;且在基于梯度对称相关度进行字符提取过程中,通过调整区块的大小,可对包含各种粗细字符线条的目标图像进行字符提取,所以该种字符提取方式的兼容性较强;另外,在基于梯度对称相关度进行字符提取过程中,对梯度对称相关度进行归一化处理,所以该种字符提取方式对大尺度的光照明暗变化情况鲁棒,字符提取的精准率较高,进而提高了后续字符的识别率。
图5是根据一示例性实施例示出的一种字符提取装置示意图。参照图5,该装置包括区块选择模块501,相关度计算模块502和字符提取模块503。
其中,区块选择模块501,用于对于目标图像中的每一个像素点,在预设数目个方向中的一个方向上,以像素点为中心,根据目标图像中字符线条的粗细程度,在目标图像中选择一个区块;相关度计算模块502与区块选择模块501连接,用于根据区块内各个像素点的像素值,计算像素点在方向上的梯度对称相关度;字符提取模块503与相关度计算模块502连接,用于根据各个像素点在预设数目个方向上的梯度对称相关度,在目标图像中进行字符提取。
可选地,当该方向为该像素点的水平右方向时,相关度计算模块,应用如下公式,计算像素点在方向上的梯度对称相关度:
C ( i , j ) = Σ r = 1 h Σ c = 1 w / 2 [ ( I ( i , j + c ) - I ( i , j ) ) * ( I ( i , j - c ) - I ( i , j ) ) ]
其中,h和w为常数,h为区块的高度值,w为区块的宽度值,i和j为变量,i∈[0,H],j∈[0,W],H和W分别为目标图像的高度值和宽度值,I(i,j)、I(i,j-c)、I(i,j+c)分别为像素点(i,j)、(i,j-c)、(i,j+c)的像素值,C(i,j)为像素点在方向上的梯度对称相关度。
可选地,字符提取模块,包括:
相关度确定单元,用于对于多个像素点中的一个像素点,从像素点在预设数目个方向上的梯度对称相关度中,确定小于第一预设阈值的梯度对称相关度;
相关度赋值单元,用于将小于第一预设阈值的梯度对称相关度置0;
归一化处理单元,用于确定像素点的邻域,根据邻域包括的像素点对应的梯度对称相关度,对像素点在预设数目个方向上的梯度对称相关度进行归一化处理,得到像素点在预设数目个方向上的归一化梯度对称相关度;
字符提取单元,用于根据各个像素点在预设数目个方向上的归一化梯度对称相关度,在目标图像中进行字符提取。
可选地,归一化处理模块,应用下述公式,对像素点在预设数目个方向上的梯度对称相关度进行归一化处理:
C ‾ x ( i , j ) = Σ ( m , n ) ∈ N ( i , j ) ( C x ( m , n ) ) Σ d ∈ D Σ ( m , n ) ∈ N ( i , j ) ( C d ( m , n ) + ∂ ) 2
其中指代像素点在x方向上的归一化梯度对称相关度,Cx(m,n)为像素点(m,n)在x方向上的梯度对称相关度,Cd(m,n)为像素点(m,n)在d方向上的梯度对称相关度,为归一化系数,N(i,j)指代像素点的邻域,D指代预设数目个方向的集合。
可选地,字符提取单元,包括:
字符似然度计算子单元,用于对于多个像素点中的一个像素点,根据像素点在预设数目个方向上的归一化梯度对称相关度,计算像素点的字符似然度;
像素点确定子单元,用于在目标图像中确定字符似然度大于第二预设阈值的各个像素点;
字符区域确定子单元,用于在字符似然度大于第二预设阈值的各个像素点中,将最多像素点聚集的图像区域确定为字符所在区域。
可选地,字符似然度计算子单元,应用下述公式,计算像素点的字符似然度:
P ( i , j ) = 1 - e - ( max ( C ‾ d ( i , j ) , d ∈ D ) - min ( C ‾ d ( i , j ) , d ∈ D ) ) 2 / σ 2
其中,P(i,j)为像素点的字符似然度,指代像素点在预设数目个方向上的归一化梯度对称相关度中的最大者,指代像素点在预设数目个方向上的归一化梯度对称相关度中的最小者,σ2指代方差系数。
本发明实施例提供的装置,基于目标图像中各个像素点在预设数目个方向上的梯度对称相关度进行字符提取,由于该种字符提取方式对大尺度的光照明暗变化情况鲁棒,所以不但适用于印刷体图像,还可适用于包含凸起区域的银行卡或车牌图像等非印刷体图像,该种字符提取方式具有较强的普适性。
图6是根据一示例性实施例示出的一种用于字符提取的终端600的框图。例如,终端600可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图6,终端600可以包括以下一个或多个组件:处理组件602,存储器604,电源组件606,多媒体组件606,音频组件610,输入/输出(I/O)的接口612,传感器组件614,以及通信组件616。
处理组件602通常控制终端600的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件602可以包括一个或多个处理器620来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件602可以包括一个或多个模块,便于处理组件602和其他组件之间的交互。例如,处理部件602可以包括多媒体模块,以方便多媒体组件606和处理组件602之间的交互。
存储器604被配置为存储各种类型的数据以支持在设备600的操作。这些数据的示例包括用于在终端600上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器604可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件606为终端600的各种组件提供电力。电力组件606可以包括电源管理系统,一个或多个电源,及其他与为终端600生成、管理和分配电力相关联的组件。
多媒体组件606包括在终端600和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件606包括一个前置摄像头和/或后置摄像头。当设备600处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件610被配置为输出和/或输入音频信号。例如,音频组件610包括一个麦克风(MIC),当终端600处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器604或经由通信组件616发送。在一些实施例中,音频组件610还包括一个扬声器,用于输出音频信号。
I/O接口612为处理组件602和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件614包括一个或多个传感器,用于为终端600提供各个方面的状态评估。例如,传感器组件614可以检测到设备600的打开/关闭状态,组件的相对定位,例如组件为终端600的显示器和小键盘,传感器组件614还可以检测终端600或终端600一个组件的位置改变,用户与终端600接触的存在或不存在,终端600方位或加速/减速和终端600的温度变化。传感器组件614可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件614还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件614还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件616被配置为便于终端600和其他设备之间有线或无线方式的通信。终端600可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件616经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信部件616还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,终端600可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器604,上述指令可由终端600的处理器620执行以完成上述方法。例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种字符提取方法,方法包括:
对于目标图像中的每一个像素点,在预设数目个方向中的一个方向上,以像素点为中心,根据目标图像中字符线条的粗细程度,在目标图像中选择一个区块;
根据区块内各个像素点的像素值,计算像素点在方向上的梯度对称相关度;
根据各个像素点在预设数目个方向上的梯度对称相关度,在目标图像中进行字符提取。
可选地,当方向为像素点的水平右方向时,根据区块内各个像素点的像素值,应用如下公式,计算像素点在方向上的梯度对称相关度,包括:
C ( i , j ) = Σ r = 1 h Σ c = 1 w / 2 [ ( I ( i , j + c ) - I ( i , j ) ) * ( I ( i , j - c ) - I ( i , j ) ) ]
其中,h和w为常数,h为区块的高度值,w为区块的宽度值,i和j为变量,i∈[0,H],j∈[0,W],H和W分别为目标图像的高度值和宽度值,I(i,j)、I(i,j-c)、I(i,j+c)分别为像素点(i,j)、(i,j-c)、(i,j+c)的像素值,C(i,j)为像素点在方向上的梯度对称相关度。
可选地,根据各个像素点在预设数目个方向上的梯度对称相关度,在目标图像中进行字符提取,包括:
对于多个像素点中的一个像素点,从像素点在预设数目个方向上的梯度对称相关度中,确定小于第一预设阈值的梯度对称相关度;
将小于第一预设阈值的梯度对称相关度置0;
确定像素点的邻域,根据邻域包括的像素点对应的梯度对称相关度,对像素点在预设数目个方向上的梯度对称相关度进行归一化处理,得到像素点在预设数目个方向上的归一化梯度对称相关度;
根据各个像素点在预设数目个方向上的归一化梯度对称相关度,在目标图像中进行字符提取。
可选地,根据邻域中包括的像素点对应的梯度对称相关度,应用下述公式,对像素点在预设数目个方向上的梯度对称相关度进行归一化处理,包括:
C ‾ x ( i , j ) = Σ ( m , n ) ∈ N ( i , j ) ( C x ( m , n ) ) Σ d ∈ D Σ ( m , n ) ∈ N ( i , j ) ( C d ( m , n ) + ∂ ) 2
其中指代像素点在x方向上的归一化梯度对称相关度,Cx(m,n)为像素点(m,n)在x方向上的梯度对称相关度,Cd(m,n)为像素点(m,n)在d方向上的梯度对称相关度,为归一化系数,N(i,j)指代像素点的邻域,D指代预设数目个方向的集合。
可选地,根据各个像素点在预设数目个方向上的归一化梯度对称相关度,在目标图像中进行字符提取,包括:
对于多个像素点中的一个像素点,根据像素点在预设数目个方向上的归一化梯度对称相关度,计算像素点的字符似然度;
在目标图像中确定字符似然度大于第二预设阈值的各个像素点;
在字符似然度大于第二预设阈值的各个像素点中,将最多像素点聚集的图像区域确定为字符所在区域。
可选地,根据像素点在预设数目个方向上的归一化梯度对称相关度,应用下述公式,计算像素点的字符似然度,包括:
P ( i , j ) = 1 - e - ( max ( C ‾ d ( i , j ) , d ∈ D ) - min ( C ‾ d ( i , j ) , d ∈ D ) ) 2 / σ 2
其中,P(i,j)为像素点的字符似然度,指代像素点在预设数目个方向上的归一化梯度对称相关度中的最大者,指代像素点在预设数目个方向上的归一化梯度对称相关度中的最小者,σ2指代方差系数。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (13)

1.一种字符提取方法,其特征在于,所述方法包括:
对于目标图像中的每一个像素点,在预设数目个方向中的一个方向上,以所述像素点为中心,根据所述目标图像中字符线条的粗细程度,在所述目标图像中选择一个区块;
根据所述区块内各个像素点的像素值,计算所述像素点在所述方向上的梯度对称相关度;
根据各个像素点在预设数目个方向上的梯度对称相关度,在所述目标图像中进行字符提取。
2.根据权利要求1所述的方法,其特征在于,当所述方向为所述像素点的水平右方向时,所述根据所述区块内各个像素点的像素值,应用如下公式,计算所述像素点在所述方向上的梯度对称相关度,包括:
C ( i , j ) = Σ r = 1 h Σ c = 1 w / 2 [ ( I ( i , j + c ) - I ( i , j ) ) * ( I ( i , j - c ) - I ( i , j ) ) ]
其中,h和w为常数,h为所述区块的高度值,w为所述区块的宽度值,i和j为变量,i∈[0,H],j∈[0,W],H和W分别为所述目标图像的高度值和宽度值,I(i,j)、I(i,j-c)、I(i,j+c)分别为像素点(i,j)、(i,j-c)、(i,j+c)的像素值,C(i,j)为所述像素点在所述方向上的梯度对称相关度。
3.根据权利要求1所述的方法,其特征在于,所述根据各个像素点在预设数目个方向上的梯度对称相关度,在所述目标图像中进行字符提取,包括:
对于多个像素点中的一个像素点,从所述像素点在预设数目个方向上的梯度对称相关度中,确定小于第一预设阈值的梯度对称相关度;
将所述小于第一预设阈值的梯度对称相关度置0;
确定所述像素点的邻域,根据所述邻域包括的像素点对应的梯度对称相关度,对所述像素点在预设数目个方向上的梯度对称相关度进行归一化处理,得到所述像素点在预设数目个方向上的归一化梯度对称相关度;
根据各个像素点在预设数目个方向上的归一化梯度对称相关度,在所述目标图像中进行字符提取。
4.根据权利要求3所述的方法,其特征在于,所述根据所述邻域中包括的像素点对应的梯度对称相关度,应用下述公式,对所述像素点在预设数目个方向上的梯度对称相关度进行归一化处理,包括:
C ‾ x ( i , j ) = Σ ( m , n ) ∈ N ( i , j ) ( C x ( m , n ) ) Σ d ∈ D Σ ( m , n ) ∈ N ( i , j ) ( C d ( m , n ) + ∂ ) 2
其中指代所述像素点在x方向上的归一化梯度对称相关度,Cx(m,n)为像素点(m,n)在x方向上的梯度对称相关度,Cd(m,n)为像素点(m,n)在d方向上的梯度对称相关度,为归一化系数,N(i,j)指代所述像素点的邻域,D指代预设数目个方向的集合。
5.根据权利要求3所述的方法,其特征在于,根据各个像素点在预设数目个方向上的归一化梯度对称相关度,在所述目标图像中进行字符提取,包括:
对于多个像素点中的一个像素点,根据所述像素点在预设数目个方向上的归一化梯度对称相关度,计算所述像素点的字符似然度;
在所述目标图像中确定字符似然度大于第二预设阈值的各个像素点;
在所述字符似然度大于第二预设阈值的各个像素点中,将最多像素点聚集的图像区域确定为字符所在区域。
6.根据权利要求5所述的方法,其特征在于,所述根据所述像素点在预设数目个方向上的归一化梯度对称相关度,应用下述公式,计算所述像素点的字符似然度,包括:
P ( i , j ) = 1 - e - ( max ( C ‾ d ( i , j ) , d ∈ D ) - min ( C ‾ d ( i , j ) , d ∈ D ) ) 2 / σ 2
其中,P(i,j)为所述像素点的字符似然度,指代所述像素点在预设数目个方向上的归一化梯度对称相关度中的最大者,指代所述像素点在预设数目个方向上的归一化梯度对称相关度中的最小者,σ2指代方差系数。
7.一种字符提取装置,其特征在于,所述装置包括:
区块选择模块,用于对于目标图像中的每一个像素点,在预设数目个方向中的一个方向上,以所述像素点为中心,根据所述目标图像中字符线条的粗细程度,在所述目标图像中选择一个区块;
相关度计算模块,用于根据所述区块内各个像素点的像素值,计算所述像素点在所述方向上的梯度对称相关度;
字符提取模块,用于根据各个像素点在预设数目个方向上的梯度对称相关度,在所述目标图像中进行字符提取。
8.根据权利要求7所述的装置,其特征在于,当所述方向为所述像素点的水平右方向时,所述相关度计算模块,应用如下公式,计算所述像素点在所述方向上的梯度对称相关度:
C ( i , j ) = Σ r = 1 h Σ c = 1 w / 2 [ ( I ( i , j + c ) - I ( i , j ) ) * ( I ( i , j - c ) - I ( i , j ) ) ]
其中,h和w为常数,h为所述区块的高度值,w为所述区块的宽度值,i和j为变量,i∈[0,H],j∈[0,W],H和W分别为所述目标图像的高度值和宽度值,I(i,j)、I(i,j-c)、I(i,j+c)分别为像素点(i,j)、(i,j-c)、(i,j+c)的像素值,C(i,j)为所述像素点在所述方向上的梯度对称相关度。
9.根据权利要求7所述的装置,其特征在于,所述字符提取模块,包括:
相关度确定单元,用于对于多个像素点中的一个像素点,从所述像素点在预设数目个方向上的梯度对称相关度中,确定小于第一预设阈值的梯度对称相关度;
相关度赋值单元,用于将所述小于第一预设阈值的梯度对称相关度置0;
归一化处理单元,用于确定所述像素点的邻域,根据所述邻域包括的像素点对应的梯度对称相关度,对所述像素点在预设数目个方向上的梯度对称相关度进行归一化处理,得到所述像素点在预设数目个方向上的归一化梯度对称相关度;
字符提取单元,用于根据各个像素点在预设数目个方向上的归一化梯度对称相关度,在所述目标图像中进行字符提取。
10.根据权利要求9所述的装置,其特征在于,所述归一化处理模块,应用下述公式,对所述像素点在预设数目个方向上的梯度对称相关度进行归一化处理:
C ‾ x ( i , j ) = Σ ( m , n ) ∈ N ( i , j ) ( C x ( m , n ) ) Σ d ∈ D Σ ( m , n ) ∈ N ( i , j ) ( C d ( m , n ) + ∂ ) 2
其中指代所述像素点在x方向上的归一化梯度对称相关度,Cx(m,n)为像素点(m,n)在x方向上的梯度对称相关度,Cd(m,n)为像素点(m,n)在d方向上的梯度对称相关度,为归一化系数,N(i,j)指代所述像素点的邻域,D指代预设数目个方向的集合。
11.根据权利要求9所述的装置,其特征在于,所述字符提取单元,包括:
字符似然度计算子单元,用于对于多个像素点中的一个像素点,根据所述像素点在预设数目个方向上的归一化梯度对称相关度,计算所述像素点的字符似然度;
像素点确定子单元,用于在所述目标图像中确定字符似然度大于第二预设阈值的各个像素点;
字符区域确定子单元,用于在所述字符似然度大于第二预设阈值的各个像素点中,将最多像素点聚集的图像区域确定为字符所在区域。
12.根据权利要求11所述的装置,其特征在于,所述字符似然度计算子单元,应用下述公式,计算所述像素点的字符似然度:
P ( i , j ) = 1 - e - ( max ( C ‾ d ( i , j ) , d ∈ D ) - min ( C ‾ d ( i , j ) , d ∈ D ) ) 2 / σ 2
其中,P(i,j)为所述像素点的字符似然度,指代所述像素点在预设数目个方向上的归一化梯度对称相关度中的最大者,指代所述像素点在预设数目个方向上的归一化梯度对称相关度中的最小者,σ2指代方差系数。
13.一种终端,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:对于目标图像中的每一个像素点,在预设数目个方向中的一个方向上,以所述像素点为中心,根据所述目标图像中字符线条的粗细程度,在所述目标图像中选择一个区块;根据所述区块内各个像素点的像素值,计算所述像素点在所述方向上的梯度对称相关度;根据各个像素点在预设数目个方向上的梯度对称相关度,在所述目标图像中进行字符提取。
CN201410127565.6A 2014-03-31 2014-03-31 字符提取方法、装置及终端 Active CN103955684B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410127565.6A CN103955684B (zh) 2014-03-31 2014-03-31 字符提取方法、装置及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410127565.6A CN103955684B (zh) 2014-03-31 2014-03-31 字符提取方法、装置及终端

Publications (2)

Publication Number Publication Date
CN103955684A true CN103955684A (zh) 2014-07-30
CN103955684B CN103955684B (zh) 2017-07-28

Family

ID=51332959

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410127565.6A Active CN103955684B (zh) 2014-03-31 2014-03-31 字符提取方法、装置及终端

Country Status (1)

Country Link
CN (1) CN103955684B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109032463A (zh) * 2018-07-19 2018-12-18 掌阅科技股份有限公司 笔记擦除方法、电子设备及计算机存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6366699B1 (en) * 1997-12-04 2002-04-02 Nippon Telegraph And Telephone Corporation Scheme for extractions and recognitions of telop characters from video data
CN1438605A (zh) * 2003-03-14 2003-08-27 西安交通大学 啤酒瓶凸性字符提取与识别硬件系统及处理方法
CN101488224A (zh) * 2008-01-16 2009-07-22 中国科学院自动化研究所 基于相关性度量的特征点匹配方法
CN102354363A (zh) * 2011-09-15 2012-02-15 西北工业大学 高反光柱面金属上的二维条码图像识别方法
CN102822867A (zh) * 2010-03-26 2012-12-12 波音公司 检测透明物体中的光学缺陷

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6366699B1 (en) * 1997-12-04 2002-04-02 Nippon Telegraph And Telephone Corporation Scheme for extractions and recognitions of telop characters from video data
CN1438605A (zh) * 2003-03-14 2003-08-27 西安交通大学 啤酒瓶凸性字符提取与识别硬件系统及处理方法
CN101488224A (zh) * 2008-01-16 2009-07-22 中国科学院自动化研究所 基于相关性度量的特征点匹配方法
CN102822867A (zh) * 2010-03-26 2012-12-12 波音公司 检测透明物体中的光学缺陷
CN102354363A (zh) * 2011-09-15 2012-02-15 西北工业大学 高反光柱面金属上的二维条码图像识别方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109032463A (zh) * 2018-07-19 2018-12-18 掌阅科技股份有限公司 笔记擦除方法、电子设备及计算机存储介质

Also Published As

Publication number Publication date
CN103955684B (zh) 2017-07-28

Similar Documents

Publication Publication Date Title
EP3163504B1 (en) Method, device and computer-readable medium for region extraction
JP6401873B2 (ja) 領域認識方法及び装置
JP6392468B2 (ja) 領域認識方法及び装置
EP3163505A1 (en) Method and apparatus for area identification
US10095949B2 (en) Method, apparatus, and computer-readable storage medium for area identification
CN107977659B (zh) 一种文字识别方法、装置及电子设备
CN106228168B (zh) 卡片图像反光检测方法和装置
CN106375596A (zh) 提示对焦对象的装置及方法
CN105528607A (zh) 区域提取方法、模型训练方法及装置
CN106296665B (zh) 卡片图像模糊检测方法和装置
CN106250831A (zh) 图像检测方法、装置和用于图像检测的装置
CN104918107A (zh) 视频文件的标识处理方法及装置
CN107480665A (zh) 文字检测方法、装置及计算机可读存储介质
CN106228556A (zh) 图像质量分析方法和装置
CN107742120A (zh) 银行卡卡号的识别方法及装置
CN104050645A (zh) 图像处理方法及装置
CN104484871A (zh) 边缘提取方法和装置
CN107563994A (zh) 图像的显著性检测方法及装置
CN107091704A (zh) 压力检测方法和装置
CN105528765A (zh) 处理图像的方法及装置
CN106056117A (zh) 矩形物体的图像处理方法及装置
CN104484867A (zh) 图片处理方法及装置
CN104899588B (zh) 识别图像中的字符的方法及装置
CN105138956A (zh) 人脸检测方法和装置
CN103955684A (zh) 字符提取方法、装置及终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant