CN104281850A - 一种文字区域识别方法和装置 - Google Patents
一种文字区域识别方法和装置 Download PDFInfo
- Publication number
- CN104281850A CN104281850A CN201310286487.XA CN201310286487A CN104281850A CN 104281850 A CN104281850 A CN 104281850A CN 201310286487 A CN201310286487 A CN 201310286487A CN 104281850 A CN104281850 A CN 104281850A
- Authority
- CN
- China
- Prior art keywords
- image
- character area
- region
- color value
- eigenwert
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000003708 edge detection Methods 0.000 claims abstract description 17
- 238000001514 detection method Methods 0.000 claims description 17
- 238000000605 extraction Methods 0.000 claims description 12
- 238000004043 dyeing Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Abstract
本发明提供了一种文字区域识别方法和装置,该方法包括:对图像进行边缘检测,使用检测到的图像边缘将图像划分为多个图像区域;提取每个图像区域的文字区域特征信息,根据该图像区域的文字区域特征信息确定特征值,根据该特征值以及预设规则确定该图像区域是否为文字区域。该方法不需要提取图像特征,处理较为简单。
Description
技术领域
本申请涉及图像处理技术领域,特别涉及一种文字区域识别方法和装置。
背景技术
从图像中识别文字区域一般有以下两种方式:基于特征的文字区域识别方式、基于连通区域的文字区域识别方式。其中,
基于特征的文字区域识别方式中,根据文字特征,例如文字丰富的边缘信息,以及文字与背景区域的纹理区别等,对图像进行特征提取,根据提取的特征信息定位文字区域。
基于连通区域的文字区域识别方式中,根据文字固有的几何特点,构造规则对连通区域进行几何分析,一步步去除非文字区域,最终定位文字区域。
以上两种文字区域识别方式均需要提取图像特征,批量处理较为复杂。
发明内容
有鉴于此,本发明的目的在于提供一种文字区域识别方法,该方法不需要提取图像特征,处理较为简单。
为实现上述目的,本发明提供的技术方案为:
一种文字区域识别方法,包括:
对图像进行边缘检测,使用检测到的图像边缘将图像划分为多个图像区域;
提取每个图像区域的文字区域特征信息,根据该图像区域的文字区域特征信息确定特征值,根据该特征值以及预设规则确定该图像区域是否为文字区域。
一种文字区域识别装置,包括:边缘检测单元、区域划分单元、特征提取单元、文字区域识别单元;
所述边缘检测单元,用于对图像进行边缘检测;
所述区域划分单元,用于使用边缘检测单元检测到的图像边缘将图像划分为多个图像区域;
所述特征提取单元,用于提取区域划分单元划分的每个图像区域的文字区域特征信息;
所述文字区域识别单元,用于根据特征提取单元提取的每个图像区域的文字区域特征信息确定特征值,根据该特征值以及预设规则确定该图像区域是否为文字区域。
综上所述,本发明通过对图像进行边缘检测,根据检测出的图像边缘划分图像区域,提取出各图像区域的文字区域特征信息并计算对应的特征值,从而根据该特征值和预先设定的规则进行文字区域判断。本发明不需要提取图像特征,只提取图像区域中的文字区域特征信息进行文字区域判断,因而处理较为简单。
附图说明
图1是本发明实施例文字区域识别方法流程图;
图2是本发明实施例图像区域划分结果示意图;
图3是本发明实施例文字区域识别装置的结构示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本发明所述方案作进一步地详细说明。
参见图1,图1是本发明实施例文字区域识别方法流程图,主要包括以下几个步骤:
步骤101、对图像进行边缘检测,使用检测到的图像边缘将图像划分为多个图像区域。
在实际应用中,彩色图像中每个像素点的颜色值是用R、G、B三个分量表示,灰度图像中每个像素点的颜色值是用灰度值一个分量表示。采用某种算法将彩色图像中每个像素点的由R、G、B三个分量表示的颜色值转变为由灰度值一个分量表示的颜色值,使得彩色图像转变为灰度图像,称为图像灰度化。
由于灰度图像中每个像素点的颜色值只用一个灰度值表示,在对图像进行边缘检测时,相对于彩色图像可以简化计算。因此,本步骤中,在对图像进行边缘检测前,还可以先对图像进行灰度化处理,使图像成为灰度图像,然后对灰度化后的图像进行边缘检测。
本实施例中,对图像进行边缘检测的方法为:对图像中每行中所有像素点的颜色值进行分析,如果该行中所有像素点的颜色值均相同,则若该行的上一行中所有像素点的颜色值不完全相同或该行的下一行中所有像素点的颜色值不完全相同,则确定该行是图像边缘,否则,确定该行不是图像边缘。
具体的边缘检测过程如下:
用以下公式表示将图像的第i行中所有像素点的颜色值集合p(i):
P(i)={f(i,1),f(i,2),...,f(i,j),...,f(i,w)},其中,f(i,j)是图像第i行,第j列像素点的颜色值,w是图像的宽度。
对图像边缘作如下约定:当f(i,1)=f(i,2)=...=f(i,w)时,认为p(i)是一个可能的图像边缘,否则,认为p(i)不是图像边缘。
采用如下方法进行图像边缘判定:当符合规则:p(i-1)不是图像边缘且p(i)是可能的图像边缘,或者p(i+1)不是图像边缘且p(i)是可能的图像边缘时,确定p(i)是图像边缘,否则,确定p(i)不是图像边缘。
可以对图像中的每一行采用以上的边缘检测过程,确定该行是否是图像边缘,这样,在确定出图像区域中的所有图像边缘后,可以利用确定的图像边缘将图像划分为多个图像区域,例如图2所示的图像区域划分结果示意图,在进行边缘检测后将图像划分为三个图像区域,其中,图像区域1和图像区域2不是文字区域(内容未具体给出),图像区域3为图像区域(内容未具体给出)。
在实际实现中,除了上述给出的边缘检测方法为,也可以采用现有技术中已有的边缘检测方法对图像进行边缘检测,不再赘述。
步骤102、提取每个图像区域的文字区域特征信息,根据该图像区域的文字区域特征信息确定特征值,根据该特征值以及预设规则确定该图像区域是否为文字区域。
在实际应用中,如果图像区域为文字区域,则其文字区域的背景色通常为相同的颜色且会占用相对较多的图像区域。
根据文字区域的上述特点,可以将图像区域中每种颜色值对应的像素点个数作为该图像区域的文字区域特征信息。通过提取图像区域中的文字区域特征信息,根据该图像区域的文字区域特征信息计算出图像区域中文字区域背景色所占比例,将该比例作为该图像区域的一个特征值。当该特征值位于某个取值范围内时,该图像区域为文字区域的可能性较大,这里所述的某个取值范围可以由开发人员根据经验总结或实际统计结果确定。
所述根据该图像区域的文字区域特征信息确定特征值的方法具体可以如下:确定该图像区域的文字区域特征信息中具有最多像素点个数的颜色值,将该颜色值对应的像素点个数与该图像区域中的像素点总数的比值确定为该特征值。
根据该图像区域的文字区域特征信息确定特征值的具体实现过程如下:
用如下公式表示划分的第k个图像区域中所有像素点的颜色值集合L(k):
L(k)={f(1),f(2),...,f(i),...,f(n)},其中,n表示划分的第k个图像区域中的像素点总数,f(i)表示第k个图像区域中的第i个像素点的颜色值。
对L(k)中的各像素点的颜色值进行统计,确定每种颜色值对应的像素点个数(该颜色值出现的次数),将统计结果作为划分的第k个图像区域的文字区域特征信息。
假设Nk为具有最多像素点的颜色值对应的像素点个数(也即出现次数最多的颜色值个数),则Nk与n的比值即为要计算得到的特征值。
计算得到上述特征值之后,就可以该特征值以及预设规则确定该图像区域是否为文字区域,具体地,当该特征值(Nk与n的比值)符合如下预设规则:Nk小于预设第一阈值(例如,0.5)且大于预设第二阈值(例如,0.2)时,则确定该图像区域为文字区域,否则,确定该图像区域不是文字区域。
本实施例中,给出了将图像区域中每种颜色值对应的像素点个数作为该图像区域的文字区域特征信息情况下,根据该图像区域的文字区域特征信息确定特征值以及根据该特征值以及预设规则确定该图像区域是否为文字区域的具体实现过程。在实际应用中,也可以根据文字区域的特点将图像区域中的其它信息作为该图像区域的文字区域特征信息,例如,文字区域中颜色比较单一,通常只会包括背景色和文字颜色等较少集中颜色值,而非文字区域中,图片通常会有丰富的颜色,可以基于文字区域和非文字区域的上述区别特征,将图片区域中的颜色值总数以及各颜色值占用比例座位该图像区域的文字区域特征信息,并利用加权的方法计算特征值,利用该特征值及相应的预设规则确定该图像区域是否为文字区域。
图1所示本发明实施例中,还可以进一步包括:将图像中确定为文字区域的所有图像区域染色,并输出染色后的图像,以便于进一步进行人工审查染色图像区域是否为文字区域,以确定文字区域识别结果的正确性。
以上对本发明实施例文字区域识别方法进行了详细说明,本发明还提供了一种文字区域识别装置,下面结合图3进行说明。
参见图3,图3是本发明实施例文字区域识别装置的结构示意图,具体包括:边缘检测单元301、区域划分单元302、特征提取单元303、文字区域识别单元304;其中,
边缘检测单元301,用于对图像进行边缘检测;
区域划分单元302,用于使用边缘检测单元301检测到的图像边缘将图像划分为多个图像区域;
特征提取单元303,用于提取区域划分单元302划分的每个图像区域的文字区域特征信息;
文字区域识别单元304,用于根据特征提取单元303提取的每个图像区域的文字区域特征信息确定特征值,根据该特征值以及预设规则确定该图像区域是否为文字区域。
上述装置还包括图像处理单元305;
所述图像处理单元305,用于在边缘检测单元301对图像进行边缘检测之前,对图像进行灰度化处理,以使图像成为灰度图像。
上述装置还包括输出单元306;
所述输出单元306,用于将图像中被文字区域识别单元304确定为文字区域的所有图像区域染色,并输出染色后的图像。
上述装置中,所述边缘检测单元301在对图像进行边缘检测时,用于:对图像中每行中所有像素点的颜色值进行分析,如果该行中所有像素点的颜色值均相同,则若该行的上一行中所有像素点的颜色值不完全相同或该行的下一行中所有像素点的颜色值不完全相同,则确定该行是图像边缘,否则,确定该行不是图像边缘。
上述装置中,所述图像区域的文字区域特征信息是指该图像区域中每种颜色值对应的像素点个数;
所述文字区域识别单元304在根据特征提取单元提取的每个图像区域的文字区域特征信息确定特征值时,用于:确定该图像区域的文字区域特征信息中具有最多像素点个数的颜色值,将该颜色值对应的像素点个数与该图像区域中的像素点总数的比值确定为该特征值;
所述文字区域识别单元304在根据该特征值以及预设规则确定该图像区域是否为文字区域时,用于:判断该特征值是否小于预设第一阈值且大于预设第二阈值,如果是,则确定该图像区域是文字区域,否则,确定该图像区域不是文字区域。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种文字区域识别方法,其特征在于,该方法包括:
对图像进行边缘检测,使用检测到的图像边缘将图像划分为多个图像区域;
提取每个图像区域的文字区域特征信息,根据该图像区域的文字区域特征信息确定特征值,根据该特征值以及预设规则确定该图像区域是否为文字区域。
2.根据权利要求1所述的文字区域识别方法,其特征在于,
对图像进行边缘检测之前,进一步包括:对图像进行灰度化处理,以使图像成为灰度图像。
3.根据权利要求1所述的文字区域识别方法,其特征在于,该方法进一步包括:
将图像中确定为文字区域的所有图像区域染色,并输出染色后的图像。
4.根据权利要求1、2、或3所述的文字区域识别方法,其特征在于,
对图像进行边缘识别的方法为:对图像中每行中所有像素点的颜色值进行分析,如果该行中所有像素点的颜色值均相同,则若该行的上一行中所有像素点的颜色值不完全相同或该行的下一行中所有像素点的颜色值不完全相同,则确定该行是图像边缘,否则,确定该行不是图像边缘。
5.根据权利要求1、2、或3所述的文字区域识别方法,其特征在于,
所述图像区域的文字区域特征信息是指该图像区域中每种颜色值对应的像素点个数;
根据该图像区域的文字区域特征信息确定特征值的方法为:确定该图像区域的文字区域特征信息中具有最多像素点个数的颜色值,将该颜色值对应的像素点个数与该图像区域中的像素点总数的比值确定为该特征值;
根据该特征值以及预设规则确定该图像区域是否为文字区域的方法为:判断该特征值是否小于预设第一阈值且大于预设第二阈值,如果是,则确定该图像区域是文字区域,否则,确定该图像区域不是文字区域。
6.一种文字区域识别装置,其特征在于,该装置包括:边缘检测单元、区域划分单元、特征提取单元、文字区域识别单元;
所述边缘检测单元,用于对图像进行边缘检测;
所述区域划分单元,用于使用边缘检测单元检测到的图像边缘将图像划分为多个图像区域;
所述特征提取单元,用于提取区域划分单元划分的每个图像区域的文字区域特征信息;
所述文字区域识别单元,用于根据特征提取单元提取的每个图像区域的文字区域特征信息确定特征值,根据该特征值以及预设规则确定该图像区域是否为文字区域。
7.根据权利要求6所述的文字区域识别装置,其特征在于,该装置还包括图像处理单元;
所述图像处理单元,用于在边缘检测单元对图像进行边缘检测之前,对图像进行灰度化处理,以使图像成为灰度图像。
8.根据权利要求6所述的文字区域识别装置,其特征在于,该装置还包括输出单元;
所述输出单元,用于将图像中所有确定为文字区域的图像区域染色,并输出染色后的图像。
9.根据权利要求6、7、或8所述的文字区域识别装置,其特征在于,
所述边缘设备单元在对图像进行边缘识别时,用于:对图像中每行中所有像素点的颜色值进行分析,如果该行中所有像素点的颜色值均相同,则若该行的上一行中所有像素点的颜色值不完全相同或该行的下一行中所有像素点的颜色值不完全相同,则确定该行是图像边缘,否则,确定该行不是图像边缘。
10.根据权利要求6、7、或8所述的文字区域识别装置,其特征在于,
所述图像区域的文字区域特征信息是指该图像区域中每种颜色值对应的像素点个数;
所述文字区域识别单元在根据特征提取单元提取的每个图像区域的文字区域特征信息确定特征值时,用于:确定该图像区域的文字区域特征信息中具有最多像素点个数的颜色值,将该颜色值对应的像素点个数与该图像区域中的像素点总数的比值确定为该特征值;
所述文字区域识别单元在根据该特征值以及预设规则确定该图像区域是否为文字区域时,用于:判断该特征值是否小于预设第一阈值且大于预设第二阈值,如果是,则确定该图像区域是文字区域,否则,确定该图像区域不是文字区域。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310286487.XA CN104281850B (zh) | 2013-07-09 | 2013-07-09 | 一种文字区域识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310286487.XA CN104281850B (zh) | 2013-07-09 | 2013-07-09 | 一种文字区域识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104281850A true CN104281850A (zh) | 2015-01-14 |
CN104281850B CN104281850B (zh) | 2020-01-31 |
Family
ID=52256710
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310286487.XA Active CN104281850B (zh) | 2013-07-09 | 2013-07-09 | 一种文字区域识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104281850B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106157284A (zh) * | 2015-04-01 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 图像中文字区域的定位方法及装置 |
WO2017162069A1 (zh) * | 2016-03-25 | 2017-09-28 | 阿里巴巴集团控股有限公司 | 一种图像文本的识别方法和装置 |
CN108171104A (zh) * | 2016-12-08 | 2018-06-15 | 腾讯科技(深圳)有限公司 | 一种文字检测方法及装置 |
CN110399867A (zh) * | 2018-04-24 | 2019-11-01 | 深信服科技股份有限公司 | 一种文本类图像区域的识别方法、系统及相关装置 |
WO2020052085A1 (zh) * | 2018-09-13 | 2020-03-19 | 北京字节跳动网络技术有限公司 | 视频文字检测方法、装置和计算机可读存储介质 |
WO2020199777A1 (zh) * | 2019-03-29 | 2020-10-08 | 京东方科技集团股份有限公司 | 价签检测方法及装置、存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090190830A1 (en) * | 2008-01-30 | 2009-07-30 | Ricoh Company, Ltd. | Image Processing Apparatus, Image Processing Method and Image Processing Means |
CN102750530A (zh) * | 2012-05-31 | 2012-10-24 | 信帧电子技术(北京)有限公司 | 一种字符识别方法及装置 |
CN103034855A (zh) * | 2012-12-05 | 2013-04-10 | 曙光信息产业(北京)有限公司 | 在图像中识别字符区域的方法 |
-
2013
- 2013-07-09 CN CN201310286487.XA patent/CN104281850B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090190830A1 (en) * | 2008-01-30 | 2009-07-30 | Ricoh Company, Ltd. | Image Processing Apparatus, Image Processing Method and Image Processing Means |
CN102750530A (zh) * | 2012-05-31 | 2012-10-24 | 信帧电子技术(北京)有限公司 | 一种字符识别方法及装置 |
CN103034855A (zh) * | 2012-12-05 | 2013-04-10 | 曙光信息产业(北京)有限公司 | 在图像中识别字符区域的方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106157284A (zh) * | 2015-04-01 | 2016-11-23 | 阿里巴巴集团控股有限公司 | 图像中文字区域的定位方法及装置 |
CN106157284B (zh) * | 2015-04-01 | 2019-10-11 | 阿里巴巴集团控股有限公司 | 图像中文字区域的定位方法及装置 |
WO2017162069A1 (zh) * | 2016-03-25 | 2017-09-28 | 阿里巴巴集团控股有限公司 | 一种图像文本的识别方法和装置 |
CN107229932A (zh) * | 2016-03-25 | 2017-10-03 | 阿里巴巴集团控股有限公司 | 一种图像文本的识别方法和装置 |
CN108171104A (zh) * | 2016-12-08 | 2018-06-15 | 腾讯科技(深圳)有限公司 | 一种文字检测方法及装置 |
CN108171104B (zh) * | 2016-12-08 | 2022-05-10 | 腾讯科技(深圳)有限公司 | 一种文字检测方法及装置 |
CN110399867A (zh) * | 2018-04-24 | 2019-11-01 | 深信服科技股份有限公司 | 一种文本类图像区域的识别方法、系统及相关装置 |
WO2020052085A1 (zh) * | 2018-09-13 | 2020-03-19 | 北京字节跳动网络技术有限公司 | 视频文字检测方法、装置和计算机可读存储介质 |
WO2020199777A1 (zh) * | 2019-03-29 | 2020-10-08 | 京东方科技集团股份有限公司 | 价签检测方法及装置、存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN104281850B (zh) | 2020-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102750535B (zh) | 自动提取图像前景的方法和系统 | |
CN104281850A (zh) | 一种文字区域识别方法和装置 | |
CN110517246B (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
CN104239909B (zh) | 一种图像的识别方法和装置 | |
CN105913093A (zh) | 一种用于文字识别处理的模板匹配方法 | |
CN110488368B (zh) | 一种基于双能x光安检机的违禁品识别方法及装置 | |
CN110232379A (zh) | 一种车辆姿态检测方法及系统 | |
CN103425984B (zh) | 一种检测票据中正多边形印章的方法和装置 | |
CN103198319B (zh) | 用于矿山井筒环境下的模糊图像角点提取方法 | |
CN109344864B (zh) | 用于密集物体的图像处理方法及装置 | |
CN104408711A (zh) | 一种基于多尺度区域融合的显著区域检测方法 | |
CN104966285A (zh) | 一种显著性区域的检测方法 | |
CN102184404B (zh) | 掌纹图像中手掌区域的获取方法及装置 | |
CN104794479A (zh) | 基于局部笔画宽度变换的自然场景图片中文本检测方法 | |
CN110751606B (zh) | 一种基于神经网络算法的泡沫图像处理方法及系统 | |
CN106447673A (zh) | 一种非均匀光照条件下的芯片引脚提取方法 | |
CN106485710A (zh) | 一种元件错件检测方法和装置 | |
CN103336961A (zh) | 一种交互式的自然场景文本检测方法 | |
CN104463138A (zh) | 基于视觉结构属性的文本定位方法及系统 | |
CN111862143A (zh) | 一种河堤坍塌自动监测方法 | |
CN111259891A (zh) | 一种自然场景下身份证识别方法、装置、设备和介质 | |
CN106910195A (zh) | 一种网页页面布局监测方法及装置 | |
CN105678301A (zh) | 一种自动识别并分割文本图像的方法、系统及装置 | |
CN106682669A (zh) | 一种图像处理方法及移动终端 | |
CN106503740A (zh) | 图片分类方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20231227 Address after: 518057 Tencent Building, No. 1 High-tech Zone, Nanshan District, Shenzhen City, Guangdong Province, 35 floors Patentee after: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd. Patentee after: TENCENT CLOUD COMPUTING (BEIJING) Co.,Ltd. Address before: 2, 518044, East 403 room, SEG science and Technology Park, Zhenxing Road, Shenzhen, Guangdong, Futian District Patentee before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd. |
|
TR01 | Transfer of patent right |