CN104281850B - 一种文字区域识别方法和装置 - Google Patents

一种文字区域识别方法和装置 Download PDF

Info

Publication number
CN104281850B
CN104281850B CN201310286487.XA CN201310286487A CN104281850B CN 104281850 B CN104281850 B CN 104281850B CN 201310286487 A CN201310286487 A CN 201310286487A CN 104281850 B CN104281850 B CN 104281850B
Authority
CN
China
Prior art keywords
image
edge
area
region
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310286487.XA
Other languages
English (en)
Other versions
CN104281850A (zh
Inventor
张佳
丁如敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Tencent Cloud Computing Beijing Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201310286487.XA priority Critical patent/CN104281850B/zh
Publication of CN104281850A publication Critical patent/CN104281850A/zh
Application granted granted Critical
Publication of CN104281850B publication Critical patent/CN104281850B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation

Abstract

本发明提供了一种文字区域识别方法和装置,该方法包括:对图像进行边缘检测,使用检测到的图像边缘将图像划分为多个图像区域;提取每个图像区域的文字区域特征信息,根据该图像区域的文字区域特征信息确定特征值,根据该特征值以及预设规则确定该图像区域是否为文字区域。该方法不需要提取图像特征,处理较为简单。

Description

一种文字区域识别方法和装置
技术领域
本申请涉及图像处理技术领域,特别涉及一种文字区域识别方法和装置。
背景技术
从图像中识别文字区域一般有以下两种方式:基于特征的文字区域识别方式、基于连通区域的文字区域识别方式。其中,
基于特征的文字区域识别方式中,根据文字特征,例如文字丰富的边缘信息,以及文字与背景区域的纹理区别等,对图像进行特征提取,根据提取的特征信息定位文字区域。
基于连通区域的文字区域识别方式中,根据文字固有的几何特点,构造规则对连通区域进行几何分析,一步步去除非文字区域,最终定位文字区域。
以上两种文字区域识别方式均需要提取图像特征,批量处理较为复杂。
发明内容
有鉴于此,本发明的目的在于提供一种文字区域识别方法,该方法不需要提取图像特征,处理较为简单。
为实现上述目的,本发明提供的技术方案为:
一种文字区域识别方法,包括:
对图像进行边缘检测,使用检测到的图像边缘将图像划分为多个图像区域;
提取每个图像区域的文字区域特征信息,根据该图像区域的文字区域特征信息确定特征值,根据该特征值以及预设规则确定该图像区域是否为文字区域。
一种文字区域识别装置,包括:边缘检测单元、区域划分单元、特征提取单元、文字区域识别单元;
所述边缘检测单元,用于对图像进行边缘检测;
所述区域划分单元,用于使用边缘检测单元检测到的图像边缘将图像划分为多个图像区域;
所述特征提取单元,用于提取区域划分单元划分的每个图像区域的文字区域特征信息;
所述文字区域识别单元,用于根据特征提取单元提取的每个图像区域的文字区域特征信息确定特征值,根据该特征值以及预设规则确定该图像区域是否为文字区域。
综上所述,本发明通过对图像进行边缘检测,根据检测出的图像边缘划分图像区域,提取出各图像区域的文字区域特征信息并计算对应的特征值,从而根据该特征值和预先设定的规则进行文字区域判断。本发明不需要提取图像特征,只提取图像区域中的文字区域特征信息进行文字区域判断,因而处理较为简单。
附图说明
图1是本发明实施例文字区域识别方法流程图;
图2是本发明实施例图像区域划分结果示意图;
图3是本发明实施例文字区域识别装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本发明所述方案作进一步地详细说明。
参见图1,图1是本发明实施例文字区域识别方法流程图,主要包括以下几个步骤:
步骤101、对图像进行边缘检测,使用检测到的图像边缘将图像划分为多个图像区域。
在实际应用中,彩色图像中每个像素点的颜色值是用R、G、B三个分量表示,灰度图像中每个像素点的颜色值是用灰度值一个分量表示。采用某种算法将彩色图像中每个像素点的由R、G、B三个分量表示的颜色值转变为由灰度值一个分量表示的颜色值,使得彩色图像转变为灰度图像,称为图像灰度化。
由于灰度图像中每个像素点的颜色值只用一个灰度值表示,在对图像进行边缘检测时,相对于彩色图像可以简化计算。因此,本步骤中,在对图像进行边缘检测前,还可以先对图像进行灰度化处理,使图像成为灰度图像,然后对灰度化后的图像进行边缘检测。
本实施例中,对图像进行边缘检测的方法为:对图像中每行中所有像素点的颜色值进行分析,如果该行中所有像素点的颜色值均相同,则若该行的上一行中所有像素点的颜色值不完全相同或该行的下一行中所有像素点的颜色值不完全相同,则确定该行是图像边缘,否则,确定该行不是图像边缘。
具体的边缘检测过程如下:
用以下公式表示将图像的第i行中所有像素点的颜色值集合p(i):
P(i)={f(i,1),f(i,2),...,f(i,j),...,f(i,w)},其中,f(i,j)是图像第i行,第j列像素点的颜色值,w是图像的宽度。
对图像边缘作如下约定:当f(i,1)=f(i,2)=...=f(i,w)时,认为p(i)是一个可能的图像边缘,否则,认为p(i)不是图像边缘。
采用如下方法进行图像边缘判定:当符合规则:p(i-1)不是图像边缘且p(i)是可能的图像边缘,或者p(i+1)不是图像边缘且p(i)是可能的图像边缘时,确定p(i)是图像边缘,否则,确定p(i)不是图像边缘。
可以对图像中的每一行采用以上的边缘检测过程,确定该行是否是图像边缘,这样,在确定出图像区域中的所有图像边缘后,可以利用确定的图像边缘将图像划分为多个图像区域,例如图2所示的图像区域划分结果示意图,在进行边缘检测后将图像划分为三个图像区域,其中,图像区域1和图像区域2不是文字区域(内容未具体给出),图像区域3为图像区域(内容未具体给出)。
在实际实现中,除了上述给出的边缘检测方法为,也可以采用现有技术中已有的边缘检测方法对图像进行边缘检测,不再赘述。
步骤102、提取每个图像区域的文字区域特征信息,根据该图像区域的文字区域特征信息确定特征值,根据该特征值以及预设规则确定该图像区域是否为文字区域。
在实际应用中,如果图像区域为文字区域,则其文字区域的背景色通常为相同的颜色且会占用相对较多的图像区域。
根据文字区域的上述特点,可以将图像区域中每种颜色值对应的像素点个数作为该图像区域的文字区域特征信息。通过提取图像区域中的文字区域特征信息,根据该图像区域的文字区域特征信息计算出图像区域中文字区域背景色所占比例,将该比例作为该图像区域的一个特征值。当该特征值位于某个取值范围内时,该图像区域为文字区域的可能性较大,这里所述的某个取值范围可以由开发人员根据经验总结或实际统计结果确定。
所述根据该图像区域的文字区域特征信息确定特征值的方法具体可以如下:确定该图像区域的文字区域特征信息中具有最多像素点个数的颜色值,将该颜色值对应的像素点个数与该图像区域中的像素点总数的比值确定为该特征值。
根据该图像区域的文字区域特征信息确定特征值的具体实现过程如下:
用如下公式表示划分的第k个图像区域中所有像素点的颜色值集合L(k):
L(k)={f(1),f(2),...,f(i),...,f(n)},其中,n表示划分的第k个图像区域中的像素点总数,f(i)表示第k个图像区域中的第i个像素点的颜色值。
对L(k)中的各像素点的颜色值进行统计,确定每种颜色值对应的像素点个数(该颜色值出现的次数),将统计结果作为划分的第k个图像区域的文字区域特征信息。
假设Nk为具有最多像素点的颜色值对应的像素点个数(也即出现次数最多的颜色值个数),则Nk与n的比值即为要计算得到的特征值。
计算得到上述特征值之后,就可以该特征值以及预设规则确定该图像区域是否为文字区域,具体地,当该特征值(Nk与n的比值)符合如下预设规则:Nk小于预设第一阈值(例如,0.5)且大于预设第二阈值(例如,0.2)时,则确定该图像区域为文字区域,否则,确定该图像区域不是文字区域。
本实施例中,给出了将图像区域中每种颜色值对应的像素点个数作为该图像区域的文字区域特征信息情况下,根据该图像区域的文字区域特征信息确定特征值以及根据该特征值以及预设规则确定该图像区域是否为文字区域的具体实现过程。在实际应用中,也可以根据文字区域的特点将图像区域中的其它信息作为该图像区域的文字区域特征信息,例如,文字区域中颜色比较单一,通常只会包括背景色和文字颜色等较少集中颜色值,而非文字区域中,图片通常会有丰富的颜色,可以基于文字区域和非文字区域的上述区别特征,将图片区域中的颜色值总数以及各颜色值占用比例座位该图像区域的文字区域特征信息,并利用加权的方法计算特征值,利用该特征值及相应的预设规则确定该图像区域是否为文字区域。
图1所示本发明实施例中,还可以进一步包括:将图像中确定为文字区域的所有图像区域染色,并输出染色后的图像,以便于进一步进行人工审查染色图像区域是否为文字区域,以确定文字区域识别结果的正确性。
以上对本发明实施例文字区域识别方法进行了详细说明,本发明还提供了一种文字区域识别装置,下面结合图3进行说明。
参见图3,图3是本发明实施例文字区域识别装置的结构示意图,具体包括:边缘检测单元301、区域划分单元302、特征提取单元303、文字区域识别单元304;其中,
边缘检测单元301,用于对图像进行边缘检测;
区域划分单元302,用于使用边缘检测单元301检测到的图像边缘将图像划分为多个图像区域;
特征提取单元303,用于提取区域划分单元302划分的每个图像区域的文字区域特征信息;
文字区域识别单元304,用于根据特征提取单元303提取的每个图像区域的文字区域特征信息确定特征值,根据该特征值以及预设规则确定该图像区域是否为文字区域。
上述装置还包括图像处理单元305;
所述图像处理单元305,用于在边缘检测单元301对图像进行边缘检测之前,对图像进行灰度化处理,以使图像成为灰度图像。
上述装置还包括输出单元306;
所述输出单元306,用于将图像中被文字区域识别单元304确定为文字区域的所有图像区域染色,并输出染色后的图像。
上述装置中,所述边缘检测单元301在对图像进行边缘检测时,用于:对图像中每行中所有像素点的颜色值进行分析,如果该行中所有像素点的颜色值均相同,则若该行的上一行中所有像素点的颜色值不完全相同或该行的下一行中所有像素点的颜色值不完全相同,则确定该行是图像边缘,否则,确定该行不是图像边缘。
上述装置中,所述图像区域的文字区域特征信息是指该图像区域中每种颜色值对应的像素点个数;
所述文字区域识别单元304在根据特征提取单元提取的每个图像区域的文字区域特征信息确定特征值时,用于:确定该图像区域的文字区域特征信息中具有最多像素点个数的颜色值,将该颜色值对应的像素点个数与该图像区域中的像素点总数的比值确定为该特征值;
所述文字区域识别单元304在根据该特征值以及预设规则确定该图像区域是否为文字区域时,用于:判断该特征值是否小于预设第一阈值且大于预设第二阈值,如果是,则确定该图像区域是文字区域,否则,确定该图像区域不是文字区域。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种文字区域识别方法,其特征在于,该方法包括:
对图像进行灰度化处理,以使图像成为灰度图像;
对图像进行边缘检测,使用检测到的图像边缘将图像划分为多个图像区域;
获取划分的第k个图像区域中所有像素点的颜色值集合L(k):
L(k)={f(1),f(2),...,f(i),...,f(n)},其中,n表示划分的第k个图像区域中的像素点总数,f(i)表示第k个图像区域中的第i个像素点的颜色值;
对L(k)中的各像素点的颜色值进行统计,确定每种颜色值对应的像素点个数将统计结果作为所述第k个图像区域的文字区域特征信息;
确定所述第k个图像区域的文字区域特征信息中具有最多像素点个数的颜色值,将该颜色值对应的像素点个数Nk与所述第k个图像区域中的像素点总数n的比值确定为特征值;
根据所述特征值以及预设规则确定所述第k个图像区域是否为文字区域,所述文字区域包括背景色和文字颜色;
所述对图像进行边缘检测包括:
获取图像的第i行中所有像素点的颜色值集合p(i),p(i)={f(i,1),f(i,2),...,f(i,j),...,f(i,w)},其中,f(i,j)是图像第i行,第j列像素点的颜色值,w是图像的宽度;
获取疑似图像边缘,所述疑似图像边缘满足下述条件:当f(i,1)=f(i,2)=...=f(i,w)时,则p(i)是疑似图像边缘;
判断所述疑似图像边缘是否为图像边缘:获取所述疑似图像边缘上一行或下一行的颜色值集合p(i-1)和p(i+1);当p(i-1)为非图像边缘且p(i)为疑似图像边缘,或者p(i+1)为非图像边缘且p(i)为疑似图像边缘时,判定p(i)是图像边缘。
2.根据权利要求1所述的文字区域识别方法,其特征在于,该方法进一步包括:
将图像中确定为文字区域的所有图像区域染色,并输出染色后的图像。
3.根据权利要求1或2所述的文字区域识别方法,其特征在于,
所述根据所述特征值以及预设规则确定所述第k个图像区域是否为文字区域的方法为:判断所述特征值是否小于预设第一阈值且大于预设第二阈值,如果是,则确定所述第k个图像区域是文字区域,否则,确定所述第k个图像区域不是文字区域。
4.一种文字区域识别装置,其特征在于,该装置包括:边缘检测单元、区域划分单元、特征提取单元、文字区域识别单元;
该装置还包括图像处理单元;
所述图像处理单元,用于对图像进行灰度化处理,以使图像成为灰度图像;
所述边缘检测单元,用于对图像进行边缘检测;
所述区域划分单元,用于使用边缘检测单元检测到的图像边缘将图像划分为多个图像区域;
所述特征提取单元,用于获取划分的第k个图像区域中所有像素点的颜色值集合L(k):L(k)={f(1),f(2),...,f(i),...,f(n)},其中,n表示划分的第k个图像区域中的像素点总数,f(i)表示第k个图像区域中的第i个像素点的颜色值;对L(k)中的各像素点的颜色值进行统计,确定每种颜色值对应的像素点个数将统计结果作为所述第k个图像区域的文字区域特征信息;
所述文字区域识别单元,用于确定所述第k个图像区域的文字区域特征信息中具有最多像素点个数的颜色值,将该颜色值对应的像素点个数Nk与所述第k个图像区域中的像素点总数n的比值确定为特征值;根据所述特征值以及预设规则确定所述第k个图像区域是否为文字区域,所述文字区域包括背景色和文字颜色;
所述边缘检测单元包括:
颜色值集合获取子单元,用于获取图像的第i行中所有像素点的颜色值集合p(i),p(i)={f(i,1),f(i,2),...,f(i,j),...,f(i,w)},其中,f(i,j)是图像第i行,第j列像素点的颜色值,w是图像的宽度;
疑似图像边缘获取子单元,用于获取疑似图像边缘,所述疑似图像边缘满足下述条件:当f(i,1)=f(i,2)=...=f(i,w)时,则p(i)是疑似图像边缘;
判断子单元,用于判断所述疑似图像边缘是否为图像边缘:获取所述疑似图像边缘上一行或下一行的颜色值集合p(i-1)和p(i+1);当p(i-1)为非图像边缘且p(i)为疑似图像边缘,或者p(i+1)为非图像边缘且p(i)为疑似图像边缘时,判定p(i)是图像边缘。
5.根据权利要求4所述的文字区域识别装置,其特征在于,该装置还包括输出单元;
所述输出单元,用于将图像中所有确定为文字区域的图像区域染色,并输出染色后的图像。
6.根据权利要求4或5所述的文字区域识别装置,其特征在于,所述文字区域识别单元在根据所述特征值以及预设规则确定所述第k个图像区域是否为文字区域时,用于:判断所述特征值是否小于预设第一阈值且大于预设第二阈值,如果是,则确定所述第k个图像区域是文字区域,否则,确定所述第k个图像区域不是文字区域。
CN201310286487.XA 2013-07-09 2013-07-09 一种文字区域识别方法和装置 Active CN104281850B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310286487.XA CN104281850B (zh) 2013-07-09 2013-07-09 一种文字区域识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310286487.XA CN104281850B (zh) 2013-07-09 2013-07-09 一种文字区域识别方法和装置

Publications (2)

Publication Number Publication Date
CN104281850A CN104281850A (zh) 2015-01-14
CN104281850B true CN104281850B (zh) 2020-01-31

Family

ID=52256710

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310286487.XA Active CN104281850B (zh) 2013-07-09 2013-07-09 一种文字区域识别方法和装置

Country Status (1)

Country Link
CN (1) CN104281850B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106157284B (zh) * 2015-04-01 2019-10-11 阿里巴巴集团控股有限公司 图像中文字区域的定位方法及装置
CN107229932B (zh) * 2016-03-25 2021-05-28 阿里巴巴集团控股有限公司 一种图像文本的识别方法和装置
CN108171104B (zh) * 2016-12-08 2022-05-10 腾讯科技(深圳)有限公司 一种文字检测方法及装置
CN110399867B (zh) * 2018-04-24 2023-05-12 深信服科技股份有限公司 一种文本类图像区域的识别方法、系统及相关装置
CN109299682A (zh) * 2018-09-13 2019-02-01 北京字节跳动网络技术有限公司 视频文字检测方法、装置和计算机可读存储介质
CN109961447B (zh) * 2019-03-29 2021-02-19 京东方科技集团股份有限公司 价签检测方法及装置、电子设备、存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102750530A (zh) * 2012-05-31 2012-10-24 信帧电子技术(北京)有限公司 一种字符识别方法及装置
CN103034855A (zh) * 2012-12-05 2013-04-10 曙光信息产业(北京)有限公司 在图像中识别字符区域的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4960897B2 (ja) * 2008-01-30 2012-06-27 株式会社リコー 画像処理装置、画像処理方法、プログラム、記憶媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102750530A (zh) * 2012-05-31 2012-10-24 信帧电子技术(北京)有限公司 一种字符识别方法及装置
CN103034855A (zh) * 2012-12-05 2013-04-10 曙光信息产业(北京)有限公司 在图像中识别字符区域的方法

Also Published As

Publication number Publication date
CN104281850A (zh) 2015-01-14

Similar Documents

Publication Publication Date Title
CN104281850B (zh) 一种文字区域识别方法和装置
US10817741B2 (en) Word segmentation system, method and device
CN107967475B (zh) 一种基于窗口滑动和卷积神经网络的验证码识别方法
CN111401372B (zh) 一种扫描文档图文信息提取与鉴别的方法
CN108052980B (zh) 基于图像的空气质量等级检测方法
CN103824091B (zh) 一种用于智能交通系统的车牌识别方法
CN105590319A (zh) 一种深度学习的图像显著性区域检测方法
CN109919002B (zh) 黄色禁停线识别方法、装置、计算机设备及存储介质
CN110879963B (zh) 一种敏感表情包检测方法、装置与电子设备
CN105117740B (zh) 字体识别方法及装置
CA2658249A1 (en) Method and system for document comparison using cross plane comparison
CN112001362A (zh) 一种图像分析方法、图像分析装置及图像分析系统
CN106780428B (zh) 一种基于颜色识别的芯片数量检测方法及系统
CN111126162A (zh) 一种识别图像中炎症细胞的方法、装置及存储介质
CN112784835A (zh) 圆形印章的真实性识别方法、装置、电子设备及存储介质
CN116311214A (zh) 车牌识别方法和装置
KR20080079798A (ko) 얼굴 검출 및 인식을 위한 방법
CN113011345B (zh) 图像质量检测方法、装置、电子设备、可读存储介质
CN107609482B (zh) 一种基于汉字笔画特征的中文文本图像倒置判别方法
CN109815946A (zh) 基于密集连接网络的多线程营业执照定位识别方法
CN103186777B (zh) 基于非负矩阵分解的人体检测方法
CN111445402B (zh) 一种图像去噪方法及装置
CN105095838A (zh) 一种目标检测方法及装置
CN106845498A (zh) 结合高程的单幅山脉遥感图像滑坡泥石流检测方法
CN104504385A (zh) 手写粘连数字串的识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20231227

Address after: 518057 Tencent Building, No. 1 High-tech Zone, Nanshan District, Shenzhen City, Guangdong Province, 35 floors

Patentee after: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.

Patentee after: TENCENT CLOUD COMPUTING (BEIJING) Co.,Ltd.

Address before: 2, 518044, East 403 room, SEG science and Technology Park, Zhenxing Road, Shenzhen, Guangdong, Futian District

Patentee before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.

TR01 Transfer of patent right