CN1728159A - 文件图像的文字区域识别方法及计算机存储媒体以及系统 - Google Patents

文件图像的文字区域识别方法及计算机存储媒体以及系统 Download PDF

Info

Publication number
CN1728159A
CN1728159A CN 200410058651 CN200410058651A CN1728159A CN 1728159 A CN1728159 A CN 1728159A CN 200410058651 CN200410058651 CN 200410058651 CN 200410058651 A CN200410058651 A CN 200410058651A CN 1728159 A CN1728159 A CN 1728159A
Authority
CN
China
Prior art keywords
key element
connection key
character area
document image
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200410058651
Other languages
English (en)
Inventor
张皓崴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BenQ Corp
Original Assignee
BenQ Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BenQ Corp filed Critical BenQ Corp
Priority to CN 200410058651 priority Critical patent/CN1728159A/zh
Publication of CN1728159A publication Critical patent/CN1728159A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

一种文件图像的文字区域识别方法,用以输入文件图像,产生标记出多个文字区域的文件图像,其方法被计算机系统执行,包括以下步骤:(1)取得相应于文件图像的二元值图像中的多个连接要素,每一连接要素拥有一图案属性;(2)统计所有图案属性以决定一阈值;(3)根据阈值产生一筛选规则;以及(4)根据所述筛选规则决定每一连接要素是否为文字。

Description

文件图像的文字区域识别方法及计算机存储媒体以及系统
技术领域
本发明是一种图像处理技术,特别是一种文件图像的文字区域识别系统及方法。
背景技术
文件图像(document image)可经由光学扫描(optical scanning)或光栅扫描数字化(raster digitalizing)印刷文件等方式所取得,其通常包含文字(text)与图形(graphic)。通常用来取得文件图像的设备包括复印机(photocopier)、传真机(facsimile machine)以及数字扫描器(digitalscanners)。从一文件图像(特别是图文混合的文件图像)提取出文字区域的技术,有助于光学字符识别(optical character recognition;OCR)以及信息检索(information retrieval)。
从文件图像中提取文字区域的技术可概分为两大类:由下而上(bottom-up)以及由上而下(top-down)。由下而上的技术通常依序由一像素(pixel)开始,然后结合其他邻近像素,形成一连接单元(connectedcomponent),之后,再识别该连接单元为文字或图形。由上而下的技术通常先将文件图像切割成许多区块,然后依序对每个区块进行分类或再切割,直到找到足够的文字或图形为止。
目前,虽然已有许多方法可以从图像中提取文字,但是,仍存在许多影响准确性的因素,诸如字型大小、文字颜色、文件图像背景、文字语言或图像歪斜等。在美国第6519362号专利文件中公开五种转换方法,对文件图像进行切割。但因该方法只考虑颜色,当图形与文字的颜色相近时,并无法精确地识别出文字或图形。美国第6574375号专利文件中公开的方法中,在不同分辨率的文件图像中,定义数个参数,用以区分出文字或图形区块。但由于分辨率大小与文字大小并不一定有正向的关联,例如,分辨率小的文件图像亦可拥有较大字型的文字,所以,该方法会在该情况下产生较差的识别结果。除此之外,有些方法会使用语言文法或利用同一行文在会水平轴上形成一直线的特性进行识别,但其分别不适用于非特定语言文字或图像歪斜的文件图像字符识别。
因此,需要一文件图像的文字区域识别系统及方法,用以克服字型大小不一、字颜色不同、复杂背景、语言以及图像歪斜等限制。
发明内容
本发明为一种文件图像的文字区域识别系统及方法,依据检测文件图像中连接要素(connected component)的图案属性以及多个连接要素所形成的文字丛集数目,进行文字区域识别,可克服字型大小不一、字颜色不同、复杂背景、语言以及图像歪斜等限制。
依据所述目的,本发明公开一文件图像的文字区域识别方法,用以输入文件图像(document image),产生标记出多个文字区域的所述文件图像,其方法被一计算机系统执行,可包括以下步骤:(1)取得相应于文件图像的二元值图像中的多个连接要素(connected component),每一连接要素拥有一要素标记;(2)计算图案属性的阈值;(3)产生包含图案属性的阈值的筛选规则;(4)依序检查二元值图像中的每一连接要素,移除不符合筛选规则的连接要素的要素标记,使文字区域包含未被移除所述要素标记的所述连接要素;(5)将邻近的连接要素合并为多个文字区块,每一文字区块拥有一区块标记;(6)依序检查每一文字区块,移除文字区块中的连接要素数目小于第五预设值的区块标记;以及(9)将文字区域取代为包含未被移除区块标记的文字区块。
在取得相应于文件图像的二元值图像中的多个连接要素步骤中,还包含以下步骤:(1)使用设定阈值(thresholding)方法,将文件图像转换成二元值图像(binary image);(2)使用区域生长(region growing)方法,丛集所述二元值图像中的像素(pixel),取得存在于二元值图像中的连接要素(connectedcomponent)。
在取得图案属性的阈值步骤中,还包含以下步骤:(1)累计二元值图像中的所有连接要素的像素宽度,取得最常出现的像素宽度为标准宽度值;(2)将所述标准宽度值乘或加第一设定值,得到像素宽度上限值,将标准宽度值减或除第二设定值,得到像素宽度下限值;(3)累计二元值图像中的所有连接要素的像素高度,取得最常出现的像素高度为标准高度值;(4)将标准高度值乘或加第三设定值,得到像素高度上限值,将标准高度值减或除第四设定值,得到像素高度下限值;以及(5)取得像素密度上限值以及像素密度下限值。
依据所述目的,本发明还公开一计算机可读取存储媒体,用以存储计算机程序,该计算机程序用以载入至计算机系统中并且使得计算机系统执行如上的方法。
依据所述目的,本发明还公开一文件图像的文字区域识别系统,用以输入文件图像(document image),产生标记出文字区域的文件图像,其系统由一处理单元执行,包括数个单元。二值化图像产生单元,使用设定阈值方法,将文件图像转换成二元值图像。连接要素取得单元,接收相应于文件图像的二元值图像中的连接要素,每一连接要素拥有一要素标记。图案属性阈值产生单元,用以取得图案属性的阈值。筛选规则产生单元,用以产生包含图案属性的阈值的筛选规则。连接要素移除单元,用以依序检查二元值图像中的每一连接要素,移除不符合筛选规则的连接要素的要素标记,使文字区域包含未被移除要素标记的连接要素。文字区块取得单元,用以将邻近的连接要素合并为多个文字区块,每一文字区块拥有一区块标记。文字区块移除单元,用以依序检查每一文字区块,移除文字区块中的连接要素数目小于第五预设值的区块标记,将文字区域取代为包含未被移除区块标记的文字区域。
连接要素取得单元还可使用区域生长方法,丛集二元值图像中的像素,取得存在于二元值图像中的连接要素。图案阈值产生单元,还可累计二元值图像中的所有连接要素的像素宽度,取得最常出现的像素宽度为标准宽度值,将标准宽度值乘或加第一设定值,得到像素宽度上限值,将标准宽度值减或除第二设定值,得到像素宽度下限值,累计二元值图像中的所有连接要素的像素高度,取得最常出现的像素高度为标准高度值,将标准高度值乘或加第三设定值,得到像素高度上限值,将标准高度值减或除第四设定值,得到像素高度下限值,以及取得像素密度上限值以及像素密度下限值。
设定阈值(thresholding)方法可包含最小错误设定阈值法(minimumerror thresholding)或Otsu设定阈值(Otsu thresholding)。区域生长方法将邻近于一区域且具有相同属性的像素合并至所述区域中,形成连接要素。图案属性包括像素宽度、像素高度或像素密度。
筛选规则可包含以下规则,(1)若所述连接要素的像素高度小于所述像素高度下限值以及所述连接要素的像素宽度小于所述像素宽度下限值,则所述连接要素不是文字区域;(2)若所述连接要素的像素高度大于所述像素高度上限值或所述连接要素的像素宽度大于所述像素宽度上限值,则所述连接要素不是文字区域;以及(3)若所述连接要素的像素密度小于所述像素密度下限值或所述连接要素的像素密度大于所述像素密度上限值,则所述连接要素不是文字区域。
附图说明
为使本发明的所述目的、特征和优点能更明显易懂,下文特举实施例,并配合附图,进行详细说明如下:
图1表示依据本发明实施例的文件图像的文字区域识别系统的系统结构图;
图2表示依据本发明实施例的文件图像的文字区域识别方法的方法流程图;
图3表示依据本发明实施例的范例文件图像;
图4表示依据本发明实施例的范例连接要素;
图5表示依据本发明实施例的文件图像的文字区域识别系统的系统执行方块图;
图6表示依据本发明实施例的文件图像的文字区域识别方法的计算机可读取存储媒体示意图。
符号说明
10-文字区域识别系统;11-处理单元;12-存储器;13-存储装置;14-显示装置;15-输入装置;16-通信装置;17-总线;S211、S212、…、S241、S242-方法步骤;31、32、33-连接要素;34、…、39-文字区域;521-图像接收单元;522-二值化图像产生单元;523-连接要素取得单元;524-图案属性阈值产生单元;525-筛选规则产生单元;526-连接要素移除单元;527-文字区块取得单元;528-文字区块移除单元;60-存储媒体;620-计算机程序;621-接收图像逻辑部件;622-产生二值化图像逻辑部件;623-取得连接要素逻辑部件;624-产生图案属性阈值逻辑部件;625-产生筛选规则逻辑部件;626-移除连接要素逻辑部件;627-取得文字区块逻辑部件;628-移除文字区块逻辑部件。
具体实施方式
本发明为提供一种文件图像的文字区域识别系统及方法,依据检测文件图像中连接要素(connected component)的图案属性以及多个连接要素所形成的文字丛集数目,进行文字区域识别,可克服字型大小不一、字颜色不同、复杂背景、语言以及图像歪斜等限制。
图1表示依据本发明实施例的文字区域识别系统的系统结构图。依据本发明实施例的文字区域识别系统10包括一处理单元11、一存储器12、一存储装置13、显示装置14、输入装置15、通信装置16,并使用总线17将其连接在一起。除此之外,本领域技术人员也可将本发明实施于其他计算机系统配置(configuration)上,例如,手持式设备(hand-held devices)、多处理器系统、以微处理器为基础或可程序化的消费性电子产品(microprocessor-based or programmable consumer electronics)、网络计算机、小型计算机、大型主机以及类似的设备。处理单元11可包含一单一中央处理单元(central-processing unit;CPU)或者是关连在并行运算环境(parallel processing environment)的多个并行处理单元。存储器12包含只读存储器(read only memory;ROM)、快闪存储器(flash ROM)以及/或动态存取存储器(random access memory;RAM),用以存储可供处理单元11执行的程序模块。一般而言,程序模块包含例行程序(routines)、程序(program)、物件(object)、元件(component)等,用以执行文字区域识别功能。本发明亦可以实施于分散式运算环境,其运算工作被一连接在通信网络的远端处理设备所执行。在分散式环境中,文字区域识别功能的执行也许由本地以及多部远端计算机系统共同完成。存储装置13包含硬盘装置、软盘装置、光盘装置或随身盘装置,用以读取硬盘、软盘、光盘、随身盘中存储的程序模块以及/或图像文件。
依据所述目的,本发明提出文件图像的文字区域识别方法,本方法由处理单元11所执行。图2表示依据本发明实施例的文件图像的文字区域识别方法的方法流程图。
该方法流程始于步骤S211,接收一文件图像。该文件图像可经由光学扫描(optical scanning)或光栅扫描数字化(raster digitalizing)印刷文件等方式所取得,其通常包含文字(text)与图形(graphic)。图3表示依据本发明实施例的范例文件图像,包含多个文字以及图形。如步骤S212,使用设定阈值(thresholding)方法,例如,最小错误设定阈值(minimum errorthresholding)、Otsu设定阈值(Otsu thresholding)、或其他方法,将灰度(gray level)或三原色(RGB)文件图像转换成二元值图像(binary image)。设定阈值方法为本领域技术人员所公知,不再赘述。其中须注意的是,文件图像中的每一像素相应于二元值图像中的每一像素。
如步骤S221,使用区域生长(region growing)方法,丛集二元值图像中的像素(pixel),取得存在于二元值图像中的多个连接要素(connectedcomponent)。详细地说,区域生长方法将邻近于一区域且具有相同属性的像素合并至该区域中,形成一连接要素。二元值图像中的每个像素拥有一要素标记,若多个像素属于相同连接要素则拥有相同的要素标记。请参考图3,连接要素如图案31、32以及33所示。区域生长方法为本领域技术人员所公知,不再赘述。图4表示依据本发明实施例的范例连接要素。范例连接要素的高度为5,宽度为4以及密度为10/20=0.5。
如步骤231,计算图案属性(诸如像素宽度、像素高度或像素密度)的阈值(诸如上限值或下限值)。在一实施例中,首先累计二元值图像中的所有连接要素的像素宽度,取得最常出现的像素宽度为标准宽度值,将标准宽度值乘/加第一设定值,得到像素宽度的上限值,将标准宽度值减/除第二设定值,得到像素宽度的下限值。在较佳的情况下,像素宽度上限值为标准宽度值乘以5,像素宽度下限值为标准宽度值除以3。在另一实施例中,首先累计二元值图像中的所有连接要素的像素高度,取得最常出现的像素高度为标准高度值,将标准高度值乘/加第三设定值,得到像素高度的上限值,将标准高度值减/除第四设定值,得到像素高度的下限值。在较佳的情况下,像素高度上限值为标准高度值乘以5,像素高度下限值为标准高度值除以3。在其他实施例中,得到预设的像素密度上限值以及像素密度下限值。在较佳的情况下,像素密度上限值为0.9,像素密度下限值为0.1。
如步骤232,产生包含图案属性阈值的筛选规则。在一实施例中,筛选规则如下所示,若连接要素的像素高度小于像素高度下限值,以及连接要素的像素宽度小于像素宽度下限值,则该连接要素不是文字区域。在另一实施例中,筛选规则如下所示,若连接要素的像素高度大于像素高度上限值,或连接要素的像素宽度大于像素宽度上限值,则该连接要素不是文字区域。在其他实施例中,筛选规则如下所示,若连接要素的像素密度小于像素密度下限值,或连接要素的像素密度大于像素密度上限值,则该连接要素不是文字区域。
如步骤233,依序检查二元值图像中的每一连接要素,移除不符合筛选规则的连接要素。详细地说,删除不符合筛选规则的连接要素的要素标记。
如步骤241,从二元值图像中,取得多个包含相邻的连接要素的文字区块。详细地说,将邻近的连接要素合并为文字区块。二元值图像中的每个连接要素拥有一区块标记,若多个连接要素属于相同文字区块则拥有相同的区块标记。判别两连接要素是否相邻,可利用判别两连接要素间的最小画素直径或画素数目来实现。
如步骤242,依序检查二元值图像中的每一文字区块,若文字区块中的连接要素数目小于第五预设值,则取消文字区块的区块标记。最后,可得到标记出文字区块的二元值图像以及文件图像。参考图3,图案34至39代表结果的文字区域。
依据所述目的,本发明还提出文件图像的文字区域识别系统。图5表示依据本发明实施例的文件图像的文字区域识别系统的系统执行方块图。该系统包含由处理单元11所执行的图像接收单元521、二值化图像产生单元522、连接要素取得单元523、图案属性阈值产生单元524、筛选规则产生单元525、连接要素移除单元526、文字区块取得单元527以及文字区块移除单元528。
图像接收单元521由输入装置15接收一文件图像。该文件图像可经由光学扫描(optical scanning)或光栅扫描数字化(raster digitalizing)印刷文件等方式所取得,其通常包含文字(text)与图形(graphic)。
二值化图像产生单元522使用设定阈值(thresholding)方法,例如,最小错误设定阈值(minimum error thresholding)、Otsu设定阈值(Otsuthresholding)、或其他方法,将灰度(gray level)或三原色(RGB)文件图像转换成二元值图像(binary image)。设定阈值方法为本领域技术人员所公知,仅在此简单说明。其中须注意的是,文件图像中的每一像素相应于二元值图像中的每一像素。
连接要素取得单元523使用区域生长(region growing)方法,丛集二元值图像中的像素(pixel),取得存在于二元值图像中的多个连接要素(connected component)。详细地说,区域生长方法将邻近于一区域且具有相同属性的像素合并至该区域中,形成一连接要素。二元值图像中的每个像素拥有一要素标记,若多个像素属于相同连接要素则拥有相同的要素标记。区域生长方法为本领域技术人员所公知,仅在此简单说明。
图案属性阈值产生单元524计算图案属性(诸如像素宽度、像素高度或像素密度)的阈值(诸如上限值或下限值)。在一实施例中,首先累计二元值图像中的所有连接要素的像素宽度,取得最常出现的像素宽度为标准宽度值,将标准宽度值乘/加第一设定值,得到像素宽度的上限值,将标准宽度值减/除第二设定值,得到像素宽度的下限值。在较佳的情况下,像素宽度上限值为标准宽度值乘以5,像素宽度下限值为标准宽度值除以3。在另一实施例中,首先累计二元值图像中的所有连接要素的像素高度,取得最常出现的像素高度为标准高度值,将标准高度值乘/加第三设定值,得到像素高度的上限值,将标准高度值减/除第四设定值,得到像素高度的下限值。在较佳的情况下,像素高度上限值为标准高度值乘以5,像素高度下限值为标准高度值除以3。在其他实施例中,得到预设的像素密度上限值以及像素密度下限值。在较佳的情况下,像素密度上限值为0.9,像素密度下限值为0.1。
筛选规则产生单元525产生包含图案属性阈值的筛选规则。在一实施例中,筛选规则如下所示,若连接要素的像素高度小于像素高度下限值,以及连接要素的像素宽度小于像素宽度下限值,则该连接要素不是文字区域。在另一实施例中,筛选规则如下所示,若连接要素的像素高度大于像素高度上限值,或连接要素的像素宽度大于像素宽度上限值,则该连接要素不是文字区域。在其他实施例中,筛选规则如下所示,若连接要素的像素密度小于像素密度下限值,或连接要素的像素密度大于像素密度上限值,则该连接要素不是文字区域。
连接要素移除单元526依序检查二元值图像中的每一连接要素,移除不符合筛选规则的连接要素。详细地说,删除不符合筛选规则的连接要素的要素标记。
文字区块取得单元527从二元值图像中,取得多个包含相邻的连接要素的文字区块。详细地说,将相邻近的连接要素合并为文字区块。二元值图像中的每个连接要素拥有一区块标记,若多个连接要素属于相同文字区块则拥有相同的区块标记。判别两连接要素是否相邻,可利用判别两连接要素间的最小画素直径或画素数目来实现。
文字区块移除单元528依序检查二元值图像中的每一文字区块,若文字区块中的连接要素数目小于第五预设值,则取消文字区块的区块标记。最后,可得到标记出文字区块的二元值图像以及文件图像。
再者,本发明提出一种计算机可读取存储媒体,用以存储所述程序模块,所述程序模块用以实现文件图像的文字区域识别方法,该方法会执行如上所述的步骤。
图6表示依据本发明实施例的文件图像的文字区域识别方法的计算机可读取存储媒体示意图。该存储媒体60,用以存储一计算机程序620,用以实现文件图像的文字区域识别方法。其计算机程序包含八个逻辑部件,分别为接收图像逻辑部件621、产生二值化图像逻辑部件622、取得连接要素逻辑部件623、产生图案属性阈值逻辑部件624、产生筛选规则逻辑部件625、移除连接要素逻辑部件626、取得文字区块逻辑部件627、以及移除文字区块逻辑部件628。
虽然本发明已以一较佳实施例公开如上,然其并非用以限定本发明,任何本领域技术人员,在不脱离本发明的精神和范围的情况下,可进行各种更动与修改,因此本发明的保护范围当视所提出的权利要求限定的范围为准。

Claims (19)

1.一种文件图像的文字区域识别方法,用以输入一文件图像,产生标记出多个文字区域的所述文件图像,其方法被一计算机系统执行,包括下列步骤:
取得相应于所述文件图像的一二元值图像中的多个连接要素,每一连接要素拥有一图案属性;
统计所述图案属性以决定一阈值;
根据所述阈值产生一筛选规则;以及
根据所述筛选规则决定每一所述连接要素是否为文字。
2.如权利要求1所述的文件图像的文字区域识别方法,在取得相应于文件图像的二元值图像中的连接要素步骤中,还包括使用设定阈值方法,将所述文件图像转换成所述二元值图像。
3.如权利要求2所述的文件图像的文字区域识别方法,其中所述设定阈值方法包含最小错误设定阈值法或Otsu设定阈值。
4.如权利要求2所述的文件图像的文字区域识别方法,在取得相应于文件图像的二元值图像中的连接要素步骤中,还包括使用一区域生长方法,丛集所述二元值图像中的像素,取得存在于所述二元值图像中的所述连接要素。
5.如权利要求4所述的文件图像的文字区域识别方法,其中所述区域生长方法将邻近于一区域且具有相同属性的像素合并至所述区域中,形成所述连接要素。
6.如权利要求1所述的文件图像的文字区域识别方法,其中所述图案属性包括像素宽度、像素高度或像素密度。
7.如权利要求5所述的文件图像的文字区域识别方法,在统计图案属性以决定阈值步骤中,还包含下列步骤:
累计所述二元值图像中的所有所述连接要素的像素宽度,取得最常出现的像素宽度为一标准宽度值;
将所述标准宽度值乘或加一第一设定值,得到一像素宽度上限值,将所述标准宽度值减或除一第二设定值,得到一像素宽度下限值;
累计所述二元值图像中的所有所述连接要素的像素高度,取得最常出现的像素高度为一标准高度值;
将所述标准高度值乘或加一第三设定值,得到一像素高度上限值,将所述标准高度值减或除一第四设定值,得到一像素高度下限值;以及
取得一像素密度上限值以及一像素密度下限值。
8.如权利要求7所述的文件图像的文字区域识别方法,其中所述筛选规则包含若所述连接要素的像素高度小于所述像素高度下限值以及所述连接要素的像素宽度小于所述像素宽度下限值,则所述连接要素不是文字区域,若所述连接要素的像素高度大于所述像素高度上限值或所述连接要素的像素宽度大于所述像素宽度上限值,则所述连接要素不是文字区域,以及若所述连接要素的像素密度小于所述像素密度下限值或所述连接要素的像素密度大于所述像素密度上限值,则所述连接要素不是文字区域。
9.如权利要求1所述的文件图像的文字区域识别方法,还包含下列步骤:
将邻近的所述连接要素合并为多个文字区块;以及
依序检测所述文字区块,若所述文字区块中的连接要素数目小于一第五预设值则所述文字区块中的所述连接要素不是文字区域。
10.一种计算机可读取存储媒体,用以存储一计算机程序,所述计算机程序用以载入至一计算机系统中并且使得所述计算机系统执行如权利要求1至9中之一所述的方法。
11.一种文件图像的文字区域识别系统,用以输入一文件图像,产生标记出多个文字区域的所述文件图像,其系统由一处理单元执行,包括:
一连接要素取得单元,用以取得相应于所述文件图像的一二元值图像中的多个连接要素,每一连接要素拥有一图案属性;
一图案属性阈值产生单元,用以统计所述图案属性以决定一阈值;
一筛选规则产生单元,用以根据所述阈值产生一筛选规则;以及
一连接要素移除单元,用以根据所述筛选规则决定每一所述连接要素是否为文字。
12.如权利要求11所述的文件图像的文字区域识别系统,在连接要素取得单元中,还包括使用设定阈值方法,将所述文件图像转换成所述二元值图像。
13.如权利要求12所述的文件图像的文字区域识别系统,其中所述设定阈值方法包含最小错误设定阈值法或Otsu设定阈值。
14.如权利要求12所述的文件图像的文字区域识别系统,在连接要素取得单元中,还包括使用一区域生长方法,丛集所述二元值图像中的像素,取得存在于所述二元值图像中的所述连接要素。
15.如权利要求14所述的文件图像的文字区域识别系统,其中所述区域生长方法将邻近于一区域且具有相同属性的像素合并至上数区域中,形成所述连接要素。
16.如权利要求11所述的文件图像的文字区域识别系统,其中所述图案属性包括像素宽度、像素高度或像素密度。
17.如权利要求15所述的文件图像的文字区域识别系统,在所述图案阈值产生单元,累计所述二元值图像中的所有所述连接要素的像素宽度,取得最常出现的像素宽度为一标准宽度值,将所述标准宽度值乘或加一第一设定值,得到一像素宽度上限值,将所述标准宽度值减或除一第二设定值,得到一像素宽度下限值,累计所述二元值图像中的所有所述连接要素的像素高度,取得最常出现的像素高度为一标准高度值,将所述标准高度值乘或加一第三设定值,得到一像素高度上限值,将所述标准高度值减或除一第四设定值,得到一像素高度下限值,以及取得一像素密度上限值以及一像素密度下限值。
18.如权利要求17所述的文件图像的文字区域识别系统,其中所述筛选规则包含若所述连接要素的像素高度小于所述像素高度下限值以及所述连接要素的像素宽度小于所述像素宽度下限值,则所述连接要素不是文字区域,若所述连接要素的像素高度大于所述像素高度上限值或所述连接要素的像素宽度大于所述像素宽度上限值,则所述连接要素不是文字区域,以及若所述连接要素的像素密度小于所述像素密度下限值或所述连接要素的像素密度大于所述像素密度上限值,则所述连接要素不是文字区域。
19.如权利要求11所述的文件图像的文字区域识别系统,还包含:
一文字区块取得单元,用以将邻近的所述连接要素合并为多个文字区块;以及
一文字区块移除单元,用以依序检测所述文字区块,若所述文字区块中的连接要素数目小于一第五预设值则所述文字区块中的所述连接要素不是文字区域。
CN 200410058651 2004-07-27 2004-07-27 文件图像的文字区域识别方法及计算机存储媒体以及系统 Pending CN1728159A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200410058651 CN1728159A (zh) 2004-07-27 2004-07-27 文件图像的文字区域识别方法及计算机存储媒体以及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200410058651 CN1728159A (zh) 2004-07-27 2004-07-27 文件图像的文字区域识别方法及计算机存储媒体以及系统

Publications (1)

Publication Number Publication Date
CN1728159A true CN1728159A (zh) 2006-02-01

Family

ID=35927420

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200410058651 Pending CN1728159A (zh) 2004-07-27 2004-07-27 文件图像的文字区域识别方法及计算机存储媒体以及系统

Country Status (1)

Country Link
CN (1) CN1728159A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102779196A (zh) * 2011-05-13 2012-11-14 比亚迪股份有限公司 一种处理重叠铜箔的方法及系统
CN107766014A (zh) * 2017-11-06 2018-03-06 珠海奔图电子有限公司 文字增强方法及装置
CN113610866A (zh) * 2021-07-28 2021-11-05 上海墨说科教设备有限公司 练字图像的裁剪方法、装置、设备和存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102779196A (zh) * 2011-05-13 2012-11-14 比亚迪股份有限公司 一种处理重叠铜箔的方法及系统
CN102779196B (zh) * 2011-05-13 2016-03-09 比亚迪股份有限公司 一种处理重叠铜箔的方法及系统
CN107766014A (zh) * 2017-11-06 2018-03-06 珠海奔图电子有限公司 文字增强方法及装置
CN113610866A (zh) * 2021-07-28 2021-11-05 上海墨说科教设备有限公司 练字图像的裁剪方法、装置、设备和存储介质
CN113610866B (zh) * 2021-07-28 2024-04-23 上海墨说科教设备有限公司 练字图像的裁剪方法、装置、设备和存储介质

Similar Documents

Publication Publication Date Title
CN1122243C (zh) 用于多种语言光字符识别的自动语言识别系统
CN110008809B (zh) 表格数据的获取方法、装置和服务器
US8306325B2 (en) Text character identification system and method thereof
JP3359095B2 (ja) 画像処理方法及び装置
US6009196A (en) Method for classifying non-running text in an image
US7813554B2 (en) Method and apparatus of extracting text from document image with complex background, computer program and storage medium thereof
US6909805B2 (en) Detecting and utilizing add-on information from a scanned document image
CA2116600C (en) Methods and apparatus for inferring orientation of lines of text
US6173073B1 (en) System for analyzing table images
US8059896B2 (en) Character recognition processing system and computer readable medium storing program for character recognition processing
US8947736B2 (en) Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern
US6711292B2 (en) Block selection of table features
US8538154B2 (en) Image processing method and image processing apparatus for extracting heading region from image of document
US8229232B2 (en) Computer vision-based methods for enhanced JBIG2 and generic bitonal compression
JP2001109844A (ja) 文字列抽出方法、手書き文字列抽出方法、文字列抽出装置、および画像処理装置
US20100238474A1 (en) Document image processing apparatus, document image processing method, and computer-readable recording medium having recorded document image processing program
CN112445926A (zh) 一种图像检索方法以及装置
Kim et al. Word segmentation of printed text lines based on gap clustering and special symbol detection
Padma et al. I DENTIFICATION OF T ELUGU, D EVANAGARI AND E NGLISH S CRIPTS U SING D ISCRIMINATING
CN1728159A (zh) 文件图像的文字区域识别方法及计算机存储媒体以及系统
CN100456317C (zh) 行方向判定方法以及装置
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
US7016535B2 (en) Pattern identification apparatus, pattern identification method, and pattern identification program
Kumar et al. Line based robust script identification for indianlanguages
US20030123730A1 (en) Document recognition system and method using vertical line adjacency graphs

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication