CN101322154A - 用于从数字图像中去除噪声的方法和装置 - Google Patents
用于从数字图像中去除噪声的方法和装置 Download PDFInfo
- Publication number
- CN101322154A CN101322154A CNA2006800450420A CN200680045042A CN101322154A CN 101322154 A CN101322154 A CN 101322154A CN A2006800450420 A CNA2006800450420 A CN A2006800450420A CN 200680045042 A CN200680045042 A CN 200680045042A CN 101322154 A CN101322154 A CN 101322154A
- Authority
- CN
- China
- Prior art keywords
- spot
- noise
- noise threshold
- image
- threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 64
- 230000007246 mechanism Effects 0.000 claims description 10
- 239000003086 colorant Substances 0.000 claims description 5
- 230000007423 decrease Effects 0.000 claims description 4
- 238000011084 recovery Methods 0.000 claims description 4
- 238000003384 imaging method Methods 0.000 description 11
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 230000003287 optical effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000003252 repetitive effect Effects 0.000 description 4
- 230000009897 systematic effect Effects 0.000 description 4
- 239000000725 suspension Substances 0.000 description 2
- 206010034719 Personality change Diseases 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/164—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Character Input (AREA)
Abstract
本发明的一个实施例提供了一种从图像中去除噪声的系统。在操作期间,系统首先识别图像中的斑点,其中斑点是可能表示图像中的字符或者字符一部分的邻近像素的集合。继而,系统分析斑点以动态地确定用于斑点的“噪声阈值”。然后,系统从图像去除低于噪声阈值的斑点。
Description
技术领域
本发明涉及图像处理。更具体地,本发明涉及用于促进从数字图像去除噪声的方法和装置。
背景技术
随着企业和其他组织进一步的计算机化,在计算机系统上存储和维护纸质文档的电子版本变得越来越普遍。在计算机系统上存储纸质文档的处理通常包括“文档成像”处理,所述处理将纸质文档的副本转换成为电子文档。此文档成像处理通常开始于成像步骤,其中使用扫描仪、复印机、照相机或者其他成像设备来生成文档的页面图像。在集合到诸如便携文档格式(PDF)文件的文档容器中之前,通常使用程序处理程序来分析和增强这些页面图像。
通常,应用需要从所扫描的页面图像识别文本以促进后续的文档处理操作。这通常通过光学字符识别(OCR)处理来完成。
遗憾的是,在所扫描图像中,噪声的出现将使得OCR处理的性能显著降级,这是非常普遍的。从打印和成像处理中,将产生各种类型的噪声以及类噪声伪像(artifact)。噪声以及类噪声伪像可以包括来自成像光传感器的量化噪声、成像设备光学器件上的污物、飞溅的墨迹以及着色剂污迹。
由于此问题,通常在OCR处理之前对图像应用噪声去除操作。例如,普通的噪声去除操作去除小于像素数阈值的所有斑点(blob)。然而,这可能导致去除诸如“句号”的小字符,或者可能导致残留下相当大的噪声伪像。几乎不存在针对所有字符尺寸都是最优的固定阈值。因此,在噪声去除处理时,或者是遗留下太多的噪声,或者是不适当地去除了所扫描图像的部分。
由此,需要一种不存在上述问题的用于从图像去除噪声的方法和装置。
发明内容
本发明的一个实施例提供了一种从图像去除噪声的系统。在操作期间,系统首先识别出图像中的斑点,其中斑点是可能表示图像中的字符或者字符一部分的邻近像素的集合。接着,系统分析所述斑点以便针对斑点来动态地确定“噪声阈值”。然后,系统从图像去除低于噪声阈值的斑点。
在此实施例的变型中,分析斑点包括分析以下内容:斑点的尺寸分布、斑点的数量、斑点的位置、图像或者图像区域的斑点密度、以及斑点的颜色。
在此实施例的变型中,系统通过首先识别图像中的文本区域、以及然后识别文本区域中的“关键字符”来确定噪声阈值,其中关键字符是小字符或者字符的一部分,诸如句号、字符“i”上的点或者逗号。接着,系统计算所识别的关键字符的平均尺寸,并将噪声阈值计算为平均尺寸的一个分数(fraction)。
在此实施例的一个变型中,在分析斑点之前,系统通过从图像去除低于初始噪声阈值的斑点来执行初始噪声去除操作。
在此实施例的一个变型中,如果所确定的噪声阈值不同于先前的噪声阈值,则系统重复噪声去除处理。此外,如果所确定的噪声阈值由先前的噪声阈值有所降低,则系统恢复小于先前的噪声阈值但是大于所确定的噪声阈值的先前已去除斑点。
在此实施例的一个变型中,针对每个识别的文本区域来独立地确定噪声阈值。
附图说明
图1示出了根据本发明的一个实施例的样本文档;
图2示出了根据本发明的一个实施例的样本文档中的数个兴趣点;
图3示出了根据本发明的一个实施例的噪声去除处理;
图4示出了根据本发明的一个实施例的计算环境;
图5示出了根据本发明的一个实施例的噪声去除系统;
图6示出了根据本发明的一个实施例的光学字符识别(OCR)系统;
图7呈现了示出根据本发明的一个实施例的噪声去除处理的流程图;以及
图8呈现了根据本发明的一个实施例的OCR处理的流程图,该OCR处理包括对噪声去除处理的优化。
具体实施方式
呈现以下描述以便使得本领域技术人员能够制造和使用本发明,并且在特定应用及其需求的上下文中提供了下文的描述。对所公开的实施例的各种变型,其对于本领域技术人员是易见的,并且在此定义的通用原理可以应用于其他实施例和应用,而并不脱离本发明的精神和范围。由此,本发明并非旨在于局限于所示出的实施例,而是旨在于符合与在此公开的原理和特征的相一致的最为宽广的范围。
在此详细说明书中描述的数据结构和代码通常存储在计算机可读存储介质上,所述计算机可读介质可以是用于由计算机系统使用的能够存储代码和/或数据的任何设备或者介质。这包括但不限于:磁和光的存储设备,诸如,磁盘驱动器、磁带、CD(压缩盘)以及DVD(数字通用盘或者数字视频盘)。
概要
本发明提供了一种用于从图像去除噪声的技术,并且该技术可以应用于任何文档,所述文档可以包含不希望作为原始文档的部分的噪声或者任何其他的无关伪像。尽管在下文中结合光学字符识别(OCR)系统来描述了本发明的实施例,但本发明可以容易地修改为与用于数字图像的任何噪声去除系统相结合地工作,所述噪声去除系统包括与光学字符识别不相关的噪声去除系统。例如,本发明的实施例可以应用于数字摄影术。
在操作期间,本发明的一个实施例接收数字形式的图像,其中该图像中可以包含文本和图像两者。为了改进OCR处理,有益的是,从图像中去除尽可能多的噪声。去除此噪声的第一步骤是,识别图像中的“斑点”。“斑点”定义为邻近像素的聚集,其可以表示字符、字符一部分、图像内的对象或者噪声伪像。识别图像中的斑点之后,系统分析所述斑点以针对斑点确定“噪声阈值”。 (例如,噪声阈值可指定斑点中的最小像素数。)接着,系统去除小于确定噪声阈值的所有斑点。注意,较大的噪声阈值将去除更多的小伪像,但是也可以去除字符(或者字符的部分),诸如,句号或者i-点(例如,小写“ i”字符中的点部分)。作为对比,较小噪声阈值不会去除字符(或者字符的部分),但是也去除不了那么多的噪声伪像。最后,在去除斑点之后,系统执行OCR处理以便识别剩余斑点内的字符。
在本发明的一个实施例中,从斑点分析收集的信息可以包括:斑点尺寸(斑点中的像素数)、斑点分布(数字图像或者数字图像的分块(section)中的斑点数)、以及斑点间隔(在斑点之间的像素数)。此信息可用于估计文本尺寸。另外,可以通过识别图像中的关键字符来估计文本尺寸,然后确定这些关键字符的尺寸。关键字符是小字符(或者字符的部分),诸如,句号、i-点、逗号和省略号。在建立噪声去除阈值时,关键字符很有用,这是因为通常关键字符是一种字体中的最小字符(或者字符的部分),并且由此可以用以在字符(或者字符的部分)和噪声之间有所区分。关键字符还可以包括选择用以辅助估计文本尺寸的字母和数字。通常,在斑点和斑点高度分布之间的基线间隔是文本尺寸的良好指示符,可以对其进行确定而不必经历整个OCR处理。
在本发明的一个实施例中,通过首先识别图像中的“文本区域”,然后识别该文本区域内的关键字符,来使系统确定噪声阈值。接着,系统计算所识别的关键字符的平均尺寸,并且将噪声阈值计算为此平均尺寸的一个分数。注意,可通过用户或者系统管理员来预定义关键字符的列表。另外,注意,关键字符可用以识别字体,继而在后续的OCR操作期间可以有助于区分字符和噪声斑点。
在本发明的一个实施例中,上述处理是迭代的。在此实施例中,系统开始于“初始噪声阈值”。此噪声阈值用以执行初始噪声去除处理,其中从图像中去除小于初始噪声阈值的斑点。(注意,期望的是,将此初始噪声阈值设置得小于最小感兴趣字体中的任何关键字符。)接着,系统分析如上所述的关键字符以确定新的噪声阈值。如果新的噪声阈值不同于先前的噪声阈值,则系统重复噪声去除处理。当重复此处理时,如果确定噪声阈值从先前的噪声阈值有所降低,则系统恢复小于先前噪声阈值但是大于所确定的阈值的先前已去除斑点。
在本发明的一个实施例中,上述迭代处理继续直到达到“满意的”阈值水平。注意,如果出现以下情况则可以认为阈值是“满意的”:(1)在迭代之间阈值没有变化;(2)阈值小于预定的噪声容限水平;(3)阈值中的变化在预定范围内;或者(4)噪声去除系统已经执行了预先指定的时间量。
在本发明的一个实施例中,噪声去除处理应用于整个成像文档。
在本发明的另一实施例中,以逐页为基础来应用噪声去除处理。在此实施例中,可以独立地对每页应用处理,或者可替换地,可以将统计信息传承(carry over)至每个后续页面,以辅助针对每个后续页面来设置初始噪声阈值。
在本发明的一个实施例中,将成像文档中的页面划分成为分块,并且独立地处理每个分块或者与其他分块相结合进行处理。此实施例提供了最大的灵活性,并且在大多数情况下可产生最佳结果,但是将需要较长的处理时间。
在本发明的一个实施例中,无论噪声去除阈值如何变化,在噪声去除处理的后续迭代期间不恢复斑点。这有可能降低噪声去除处理的准确度,这是因为可能去除了作为字符(或者字符的部分)的某些斑点。然而,还有可能增加噪声去除处理的速度。
样本文档
图1示出了根据本发明的一个实施例的样本文档。此样本文档包含:头部101、主体102以及脚注103。样本文档的主体102包括文本分块以及包含文本的图像两者。另外,在整个文档中可以看到多个伪像104。注意,此图像100是通过扫描已经包含噪声的文档而创建的。然而,还可能是,在扫描处理期间引入了噪声。另外,注意,本发明可应用于任何数字图像,并且并不局限于扫描文档。
兴趣点
图2示出了根据本发明的一个实施例的样本文档中的数个兴趣点。更具体地,图2A示出了来自图1中所示的样本文档的头部101的分块。图2A中的三个兴趣点是噪声伪像202、句号204以及i-点206。
选择初始噪声阈值导致多种可能性中的一种。如果噪声阈值太精细,则将去除噪声伪像202、句号204以及i-点206。如果噪声阈值太粗糙,则将保留噪声伪像202、句号204以及i-点206。因为噪声伪像202大于某些合理的斑点(诸如,句号204和i-点206),因此不存在这样的初始阈值设置,其去除噪声伪像202但是并不去除句号204和i-点206。此示例示出了其他噪声去除方案具有的问题,并且其中本发明的实施例通过在OCR处理期间调整噪声阈值来解决这些问题,如下文中进一步详细描述的。
图2B示出了来自图1所示的样本文档的脚注103的分块。两个兴趣点是噪声伪像208和句号210。选择处于噪声伪像208和句号210之间某处的噪声阈值水平来去除噪声伪像208。这在单一迭代中很容易实现,并且在该(OCR)处理期间不必进行优化。在此情况下,噪声去除处理结束而不必对噪声阈值进行进一步的优化,并且OCR系统能够将其余的斑点识别为字体中的有效字符,所述有效字符对OCR系统是可识别的。
图2C示出了在图1中示出的样本文档的一个分块。此分块包括噪声伪像212、图像214以及文本216。根据文件格式以及分块的格式,分块可以不经历噪声去除处理。以下描述假定在噪声去除处理中包括在图2C中所示出的分块。如果将初始噪声阈值设置为去除噪声伪像212的水平,则在初始噪声去除处理期间也将去除作为图像214的部分的许多斑点。另一方面,如果初始噪声阈值处于不改变图像214的水平,则在初始噪声去除阶段之后将保留噪声伪像212。本发明的一个实施例选择这样的初始噪声阈值,该初始噪声阈值导致去除噪声伪像212而不会影响图像214,或者可替换地,选择既不去除噪声伪像212也不影响图像214的阈值。在后一情况下,将在OCR处理的后续迭代期间去除噪声伪像212。
本发明的一个实施例可以或者独立地或者一并地处理多页面文档的每个页面。注意,如果独立地处理每个页面,则本发明可将来自先前处理的页面的统计信息传承以便促进形成用于后续页面的初始阈值。
在本发明的另一实施例中,一并处理在图2A、图2B和图2C中出现的项目。因为许多噪声伪像的尺寸类似于合理的斑点,在初始噪声去除处理期间将保留大多数的噪声伪像。在后续迭代操作期间,将通过调整噪声阈值来去除剩余的噪声伪像。
处理概要
图3示出了根据本发明的一个实施例的噪声去除处理。在此处理期间,接收成像文档304、305和306作为对噪声去除处理316的输入。然后,噪声去除处理316分别生成输出文档324、325和326。注意,通过噪声去除处理316来将包含具有噪声的文本309、310、311和312的区域转换成为包含不具有噪声的文本307、329、330和331的区域。噪声去除处理316没有处理在成像文档304以及305中的非文本区域307和308,并且将其分别保持作为输出文档324和325中的非文本区域307和308。
计算环境
图4示出了根据本发明的一个实施例的计算环境400。计算环境400包括客户端410和膝上型计算机420。客户端410和膝上型计算机420两者都耦接至网络440。另外,客户端410和膝上型计算机420有能力与数个设备通信,包括打印机430、扫描仪450、蜂窝照相电话460以及数码相机470。
客户端410以及膝上型计算机420通常包括网络上的任意如下节点,该节点包括计算能力以及包括用于跨网络440进行通信的机制。
客户端410以及膝上型计算机420通常可包括任何类型的计算机系统,包括但不限于,基于微处理器的计算机系统、大型机计算机、数字信号处理器、便携计算设备、个人组织器、设备控制器以及应用设备中的计算引擎。
打印机430通常可以包括任何类型的打印机,包括但不限于,个人打印机、网络打印机以及多功能打印机,所述多功能打印机可以包括复印机、扫描仪以及传真机。
扫描仪450通常可以包括任何类型的数字扫描仪,包括但不限于,单独的扫描仪以及多功能扫描仪,所述多功能扫描仪可以包括复印机、打印机以及传真机。
诸如打印机430、扫描仪450、蜂窝照相电话460以及数码相机470的设备能够捕捉文档的图像,或者创建可以包括文本的图像。这些设备的每个能够将图像传送至客户端410或者膝上型计算机420。在本发明的一个实施例中,使用在此描述的去除处理,客户端410或者膝上型计算机420两者都能够去除在成像处理期间出现的噪声伪像。
噪声去除系统
图5示出了根据本发明的一个实施例的噪声去除系统500。噪声去除系统500包括斑点识别器502、斑点分析器504、噪声去除器506、噪声恢复器508、OCR系统510和存储器520。存储器520包括文档存储器522(其存储图像文件的副本)、噪声存储器524、统计存储器526以及系统设置528。
斑点识别器502用以识别成像文档内的斑点。一旦识别出斑点,则斑点分析器504分析所述斑点以确定噪声阈值。斑点分析器504基于多个因素来确定噪声阈值,包括但不限于:斑点数、斑点的分布、在不同区域中的斑点的密度、在不同区域中各种尺寸的斑点的密度、斑点的位置、斑点的排列以及斑点的颜色。一旦完成斑点分析,则将所得到的统计信息存储在统计存储器526中。继而,可以使用统计信息来:进一步优化系统设置;优化噪声阈值;以及优化噪声去除处理用于成像文档的其他区域以及其他成像文档。
基于由斑点分析器504所确定的噪声阈值,噪声去除器506可以去除任何被认为是噪声伪像的斑点。将已去除斑点存储在噪声存储器524中,以便在调整了噪声阈值,使得需要恢复某些已去除斑点的情况下使用。如果出现此情况,则噪声恢复器508恢复已去除斑点的某些或者全部。系统可以通过考虑斑点的尺寸或者斑点的位置来确定将要恢复哪些斑点。
在已经完成初始噪声去除处理之后,OCR系统510执行OCR处理。在此OCR处理期间,通过精确调整噪声阈值来进一步优化噪声去除,如在下文中更详细地描述。
系统设置528包含用于噪声去除处理的系统设置。在本发明的一个实施例中,这些设置包括但不限于:将要分析的信息的描述;噪声去除处理的质量值;定义何时终止噪声去除处理的指示符;指示是否将任何信息传承至下一噪声去除任务的标志;用于关键字符的标识符;以及确定是否对文件、页面或者页面区域执行处理的指示符。注意,噪声去除处理的质量与噪声去除处理的速度反向相关。另外,噪声去除处理的质量直接相关于对噪声去除处理可用的存储器的数量。
OCR系统
图6示出了根据本发明的一个实施例的光学字符识别(OCR)系统600。OCR系统600包括:文本查找器602、文本分析器604以及噪声阈值校准器606。文本查找器602识别成像文档内的文本区域。用于识别文档内的文本区域的技术对本领域技术人员是公知的,在此不做进一步的描述。
一旦已经识别了文本区域,则文本分析器604分析文本区域以便确定文本的尺寸以及识别文本内的关键字符。
然后,由文本分析器604来分析关键字符以确定其尺寸(例如,以像素数的形式)。如上所述,关键字符是用以区分字符和噪声的小字符(或者字符的部分)。关键字符随着字体的变化而变化,但是这些关键字符通常包括句号、i-点、逗号、省略号以及小于该字体的其他字符的其他字符(或者字符的部分)。从文本分析器604所明确的信息(包括例如噪声阈值)存储在统计存储器526中。在后续的迭代或者用于其他噪声去除任务期间,可使用此信息。如上所述,文本分析器604的输出用以优化噪声阈值。
噪声阈值校准器606调整噪声阈值。如果确定噪声阈值已改变得超出了系统设置528中所指定的容限,则执行附加的噪声去除操作。此附加的噪声去除操作可以包括,如果噪声阈值已经降低则恢复某些或者全部先前已去除斑点。
噪声去除处理
图7呈现了示出根据本发明的一个实施例的噪声去除处理的流程图。处理由识别图像中的斑点(步骤702)开始。接着,系统分析斑点(步骤704)以及将所得到的信息存储在统计存储器526中。此所得到的信息可以包括:平均斑点尺寸、斑点密度信息、斑点颜色以及用以设置噪声去除阈值的任何其他信息。
使用步骤704的结果,系统确定噪声阈值(步骤706)。在本发明的一个实施例中,噪声阈值是图像中的关键字符的平均斑点尺寸的一个分数。噪声阈值在给定页面的不同分块上可以有所变化。例如,在一个实施例中,如果页面的上部33%具有15像素的平均关键字符斑点尺寸,则可以将页面的上部33%的噪声阈值设置为5像素。然而,如果页面的下部66%具有45像素的平均关键字符斑点尺寸,则可以将页面的下部66%的噪声阈值设置为15像素。可以使用斑点尺寸以外的其他因素来确定噪声阈值。例如,如果系统设置528指示图像是严格单色的,但是在成像处理期间在文档中引入了红色伪像,则系统可以将该红色伪像识别为噪声并且将其从图像中去除。
在已经建立噪声阈值之后,系统去除包含少于噪声阈值的像素的所有斑点(步骤708)。最后,系统启动OCR处理(步骤710)。
OCR处理
先前的部分描述了可以调整以便与用户需要相匹配的快速而灵活的噪声去除处理。在本发明的一个实施例中,处理在步骤712处完成。
在本发明的一个实施例中,在OCR处理期间优化噪声去除处理。此优化过程产生比先前所描述的实施例更高质量的结果。
图8呈现了示出根据本发明的一个实施例的OCR处理的流程图,该OCR处理包括对噪声去除处理的优化。在此操作期间,系统首先识别成像文档内的文本区域(步骤802)。注意,在一个实施例中,在此步骤以及OCR的所有后续步骤中,通常忽略作为图片或者图像一部分的文本。
一旦识别了文本区域,则分析文本区域(步骤804)。此分析可以包括例如:估计文本尺寸、识别关键字符、以及识别用于文本的字体。接着,系统根据所述分析结果来重新评估用于图像的噪声阈值(806)。
然后,系统确定噪声阈值是否已经变化(步骤808)。如果没有变化,则系统完成OCR处理(步骤820)。如果噪声阈值已经变化,则系统确定新的噪声阈值是否小于先前的噪声阈值(步骤810)。如果小于,则恢复大于新噪声阈值但小于初始噪声阈值的先前已去除斑点。
在本发明的一个实施例中,先前指定的“容限水平”还用以确定是否将要恢复已去除斑点。例如,给定两个像素的容限水平,如果旧的噪声阈值是十二个像素而新的噪声阈值是八个像素,则不需要恢复九个像素的斑点。可以通过系统设置528来指示容限水平。
在已经恢复已去除斑点(或者如果新的噪声阈值不低于步骤810中的先前的噪声阈值)之后,则系统使用新的噪声阈值来重复噪声去除处理(步骤814)。
接着,系统确定新的噪声阈值是否为满意的(步骤816)。可以基于以下因素来进行此确定:是否已经去除任何斑点;已经去除了多少斑点;已经对噪声阈值进行了多少次调整;或者沿哪个方向来调整噪声阈值。如果新的噪声阈值是满意的,则系统完成OCR处理(步骤820)。另一方面,如果新的噪声阈值不是满意的,则通过返回步骤802来重复噪声去除处理。
在本发明的一个实施例中,在返回步骤802之前系统通过调整系统设置528来优化噪声去除处理。这可以包括调整以下内容:将要分析的信息;噪声去除处理的质量;何时终止噪声去除处理;是否将任何信息传承至下一噪声去除任务;哪些字符是关键字符;以及是否在文档、页面、或者页面区域上执行处理。
已经呈现的本发明的上述描述仅仅出于示意和描述的目的。上述描述并非旨在于穷尽本发明或者将本发明限制于所公开的形式。相应地,对于本领域技术人员来说,许多修改和变型都是显而易见的。另外,上述公开并非旨在于限制本发明。通过所附权利要求书来限定本发明的范围。
Claims (21)
1.一种用于从图像中去除噪声的方法,包括:
接收所述图像;
识别所述图像中的斑点,其中斑点是可能表示所述图像中的字符或者字符一部分的邻近像素的集合;
分析所述斑点以确定噪声阈值,其中小于所述噪声阈值的斑点很可能是噪声;以及
从所述图像去除小于所述噪声阈值的斑点。
2.根据权利要求1所述的方法,其中确定所述噪声阈值包括:
识别所述图像中的文本区域;
识别所述文本区域内的关键字符;
计算所述识别的关键字符的平均尺寸;以及
将所述噪声阈值计算为所述平均关键字符尺寸的一个分数。
3.根据权利要求2所述的方法,其中如果所述确定的噪声阈值不同于先前的噪声阈值,则重复用于从所述图像去除噪声的所述方法。
4.根据权利要求3所述的方法,其中如果所确定的噪声阈值从所述先前的噪声阈值有所降低,则所述方法进一步包括恢复小于所述先前噪声阈值而大于所确定的噪声阈值的先前已去除斑点。
5.根据权利要求1所述的方法,其中在分析所述斑点之前,所述方法进一步包括通过从所述图像中去除低于初始噪声阈值的斑点来执行初始噪声去除操作。
6.根据权利要求1所述的方法,其中分析所述斑点包括分析以下的一个或者多个:
所述斑点的尺寸分布;
斑点数;
所述斑点的位置;
在所述图像内的或者图像区域内的斑点密度;以及
斑点颜色。
7.根据权利要求1所述的方法,其中针对多个所识别的文本区域的每个来独立地确定噪声阈值。
8.一种存储指令的计算机可读存储介质,当由计算机执行所述指令时,致使所述计算机执行用于从图像中去除噪声的方法,所述方法包括:
接收所述图像;
识别所述图像中的斑点,其中斑点是可能表示所述图像中的字符或者字符一部分的邻近像素的集合;
分析所述斑点以确定噪声阈值,其中小于所述噪声阈值的斑点很可能是噪声;以及
从所述图像去除小于所述噪声阈值的斑点。
9.根据权利要求8所述的计算机可读存储介质,其中确定所述噪声阈值包括:
识别所述图像中的文本区域;
识别所述文本区域内的关键字符;
计算所述识别的关键字符的平均尺寸;以及
将所述噪声阈值计算为所述平均关键字符尺寸的一个分数。
10.根据权利要求9所述的计算机可读存储介质,其中如果所述确定的噪声阈值不同于先前的噪声阈值,则重复用于从所述图像去除噪声的所述方法。
11.根据权利要求10所述的计算机可读存储介质,其中如果所确定的噪声阈值从所述先前的噪声阈值有所降低,则所述方法进一步包括恢复小于所述先前噪声阈值而大于所述确定的噪声阈值的先前已去除斑点。
12.根据权利要求8所述的计算机可读存储介质,其中在分析所述斑点之前,所述方法进一步包括通过从所述图像中去除低于初始噪声阈值的斑点来执行初始噪声去除操作。
13.根据权利要求8所述的计算机可读存储介质,其中分析所述斑点包括分析以下的一个或者多个:
所述斑点的尺寸分布;
斑点数;
所述斑点的位置;
在所述图像内的或者图像区域内的斑点密度;以及
斑点颜色。
14.根据权利要求1所述的计算机可读存储介质,其中针对多个所识别的文本区域的每个来独立地确定噪声阈值。
15.一种用于从图像中去除噪声的装置,包括:
斑点识别机制,配置以识别所述图像中的斑点,其中斑点是可能表示所述图像中的字符或者字符一部分的邻近像素的集合;
阈值确定机制,配置以分析所述斑点来确定噪声阈值,其中小于所述噪声阈值的斑点很可能是噪声;以及
斑点去除机制,配置以从所述图像去除小于所述噪声阈值的斑点。
16.根据权利要求15所述的装置,其中所述阈值确定机制配置以:
识别所述图像中的文本区域;
识别所述文本区域内的关键字符;
计算所述识别的关键字符的平均尺寸;以及
将所述噪声阈值计算为所述平均关键字符尺寸的一个分数。
17.根据权利要求16所述的装置,其中所述装置配置以便如果所述确定的噪声阈值不同于先前的噪声阈值,则重复所述噪声去除处理。
18.根据权利要求17所述的装置,进一步包括斑点恢复机制,其中如果所确定的噪声阈值从所述先前的噪声阈值有所降低,则所述斑点恢复机制进一步配置以恢复小于所述先前噪声阈值而大于所述确定的噪声阈值的先前已去除斑点。
19.根据权利要求15所述的装置,进一步包括初始噪声去除机制,配置以通过从所述图像去除低于初始噪声阈值的斑点以执行初始噪声去除操作。
20.根据权利要求15所述的装置,其中当分析所述斑点时,所述阈值确定机制配置以分析以下的一个或者多个:
所述斑点的尺寸分布;
斑点数;
所述斑点的位置;
在所述图像内的或者图像区域内的斑点密度;以及
斑点颜色。
21.根据权利要求15所述的装置,其中所述阈值确定机制配置以针对多个已识别文本区域的每个来独立地确定噪声阈值。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/291,552 | 2005-11-30 | ||
US11/291,552 US7660483B2 (en) | 2005-11-30 | 2005-11-30 | Method and apparatus for removing noise from a digital image |
PCT/US2006/061294 WO2007065087A1 (en) | 2005-11-30 | 2006-11-28 | Method and apparatus for removing noise from a digital image |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101322154A true CN101322154A (zh) | 2008-12-10 |
CN101322154B CN101322154B (zh) | 2011-02-16 |
Family
ID=37891666
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2006800450420A Active CN101322154B (zh) | 2005-11-30 | 2006-11-28 | 用于从数字图像中去除噪声的方法和装置 |
Country Status (4)
Country | Link |
---|---|
US (2) | US7660483B2 (zh) |
CN (1) | CN101322154B (zh) |
DE (1) | DE112006003272B4 (zh) |
WO (1) | WO2007065087A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102413338A (zh) * | 2011-11-21 | 2012-04-11 | 苏州希图视鼎微电子有限公司 | 点状噪声的图像处理方法及装置 |
CN111209912A (zh) * | 2020-01-13 | 2020-05-29 | 昆明理工大学 | 一种中文文字图片长干扰线去除方法 |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090086275A1 (en) * | 2007-09-28 | 2009-04-02 | Jian Liang | Processing a digital image of content |
US8548267B1 (en) * | 2007-09-28 | 2013-10-01 | Amazon Technologies, Inc. | Processing a digital image of content using content aware despeckling |
US8731297B1 (en) | 2007-09-28 | 2014-05-20 | Amazon Technologies, Inc. | Processing a digital image of content to remove border artifacts |
US8838489B2 (en) | 2007-12-27 | 2014-09-16 | Amazon Technologies, Inc. | On-demand generating E-book content with advertising |
US9672550B2 (en) | 2010-09-24 | 2017-06-06 | Amazon Technologies, Inc. | Fulfillment of orders for items using 3D manufacturing on demand |
US8412588B1 (en) | 2010-09-24 | 2013-04-02 | Amazon Technologies, Inc. | Systems and methods for fabricating products on demand |
US9898776B2 (en) | 2010-09-24 | 2018-02-20 | Amazon Technologies, Inc. | Providing services related to item delivery via 3D manufacturing on demand |
US9858604B2 (en) | 2010-09-24 | 2018-01-02 | Amazon Technologies, Inc. | Vendor interface for item delivery via 3D manufacturing on demand |
US9684919B2 (en) | 2010-09-24 | 2017-06-20 | Amazon Technologies, Inc. | Item delivery using 3D manufacturing on demand |
CN103454282A (zh) * | 2013-08-30 | 2013-12-18 | 陕西科技大学 | 一种基于图像灰度梯度的印刷品墨斑测量方法 |
US9986387B2 (en) * | 2015-11-24 | 2018-05-29 | Fortinet, Inc. | Associating position information collected by a mobile device with a managed network appliance |
RU2634195C1 (ru) * | 2016-12-06 | 2017-10-24 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способ и устройство для определения пригодности документа для оптического распознавания символов (ocr) |
US10949957B2 (en) | 2018-01-04 | 2021-03-16 | Gingy Technology Inc. | Biometric image processing method and electronic device thereof |
US10832046B1 (en) * | 2018-10-23 | 2020-11-10 | Architecture Technology Corporation | Systems and methods for processing document images |
US10997463B2 (en) * | 2018-11-08 | 2021-05-04 | Adobe Inc. | Training text recognition systems |
US11330145B1 (en) * | 2021-06-10 | 2022-05-10 | Bank Of America Corporation | Image processing edge device for document noise removal |
JP2023030811A (ja) * | 2021-08-24 | 2023-03-08 | キヤノン株式会社 | 情報処理装置、抽出処理装置、画像処理システム、情報処理装置の制御方法、及びプログラム |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63250787A (ja) | 1987-04-08 | 1988-10-18 | Fuji Electric Co Ltd | 文字切出し方法 |
US4888812A (en) * | 1987-12-18 | 1989-12-19 | International Business Machines Corporation | Document image processing system |
US5195147A (en) * | 1989-05-02 | 1993-03-16 | Ricoh Company, Ltd. | Image forming apparatus |
US5457754A (en) | 1990-08-02 | 1995-10-10 | University Of Cincinnati | Method for automatic contour extraction of a cardiac image |
US5337373A (en) * | 1991-10-24 | 1994-08-09 | International Business Machines Corporation | Automatic threshold generation technique |
US5542006A (en) * | 1994-06-21 | 1996-07-30 | Eastman Kodak Company | Neural network based character position detector for use in optical character recognition |
JP3027321B2 (ja) * | 1994-09-27 | 2000-04-04 | 財団法人工業技術研究院 | 拘束のない手書き英数字のオンライン認識の方法及び装置 |
US5471434A (en) * | 1994-10-18 | 1995-11-28 | The United States Of America As Represented By The Secretary Of The Navy | System and method for rapidly tracking vehicles of special utility in low signal-to-noise environments |
DE19517178C1 (de) | 1995-05-09 | 1996-11-21 | Ibm | Hintergrundbereinigung bei elektronisch abgetasteten Bildern |
DE19536170A1 (de) | 1995-09-29 | 1997-04-03 | Ibm | Ermittlung von Schwellwerten bei der Digitalisierung von Bildern durch eine Verteilungsanalyse der Informationen |
EP1056038A3 (de) | 1999-05-28 | 2002-05-08 | Computer Gesellschaft Konstanz Mbh | Verfahren zur Aufbereitung von aus Zeichen und Zeichenfolgen generierten Bitmustern für die optische Zeichenerkennung |
US7225082B1 (en) | 1999-10-01 | 2007-05-29 | Oxonica, Inc. | Colloidal rod particles as nanobar codes |
US6728401B1 (en) | 2000-08-17 | 2004-04-27 | Viewahead Technology | Red-eye removal using color image processing |
WO2002059835A1 (en) * | 2001-01-26 | 2002-08-01 | Koninklijke Philips Electronics N.V. | Spatio-temporal filter unit and image display apparatus comprising such a spatio-temporal filter unit |
US7031548B2 (en) * | 2001-10-04 | 2006-04-18 | Hewlett-Packard Development Company, L.P. | Method and apparatus for filtering noise from a digital image |
DE10329339B4 (de) | 2003-06-30 | 2007-04-26 | OCé PRINTING SYSTEMS GMBH | Verfahren und Vorrichtung zum Aufbereiten einer Bildpunktdatei |
US7668376B2 (en) | 2004-06-30 | 2010-02-23 | National Instruments Corporation | Shape feature extraction and classification |
US20070040062A1 (en) | 2005-05-25 | 2007-02-22 | Lau Daniel L | Projectile tracking system |
US7689016B2 (en) | 2005-05-27 | 2010-03-30 | Stoecker & Associates, A Subsidiary Of The Dermatology Center, Llc | Automatic detection of critical dermoscopy features for malignant melanoma diagnosis |
US20070083114A1 (en) * | 2005-08-26 | 2007-04-12 | The University Of Connecticut | Systems and methods for image resolution enhancement |
KR100647402B1 (ko) * | 2005-11-01 | 2006-11-23 | 매그나칩 반도체 유한회사 | 이미지 센서의 화질개선장치 및 그 방법 |
-
2005
- 2005-11-30 US US11/291,552 patent/US7660483B2/en active Active
-
2006
- 2006-11-28 WO PCT/US2006/061294 patent/WO2007065087A1/en active Application Filing
- 2006-11-28 DE DE112006003272.0T patent/DE112006003272B4/de active Active
- 2006-11-28 CN CN2006800450420A patent/CN101322154B/zh active Active
-
2009
- 2009-12-28 US US12/648,250 patent/US8064721B2/en active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102413338A (zh) * | 2011-11-21 | 2012-04-11 | 苏州希图视鼎微电子有限公司 | 点状噪声的图像处理方法及装置 |
CN111209912A (zh) * | 2020-01-13 | 2020-05-29 | 昆明理工大学 | 一种中文文字图片长干扰线去除方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2007065087A1 (en) | 2007-06-07 |
US7660483B2 (en) | 2010-02-09 |
US8064721B2 (en) | 2011-11-22 |
US20090022397A1 (en) | 2009-01-22 |
DE112006003272T5 (de) | 2008-10-23 |
DE112006003272B4 (de) | 2022-08-18 |
CN101322154B (zh) | 2011-02-16 |
US20100166307A1 (en) | 2010-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101322154B (zh) | 用于从数字图像中去除噪声的方法和装置 | |
US8494304B2 (en) | Punched hole detection and removal | |
US7324711B2 (en) | Method for automated image indexing and retrieval | |
US8488181B2 (en) | Preserving user applied markings made to a hardcopy original document | |
JP4405831B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
US8126270B2 (en) | Image processing apparatus and image processing method for performing region segmentation processing | |
US20070070473A1 (en) | Image display device, image display method, computer program product, and image display system | |
US7466873B2 (en) | Artifact removal and quality assurance system and method for scanned images | |
US8180164B2 (en) | OCR-guided text tokenization of digital images | |
JP2009224958A (ja) | 業務手順推定システム及びプログラム | |
US8391607B2 (en) | Image processor and computer readable medium | |
US20150304521A1 (en) | Dynamically generating table of contents for printable or scanned content | |
JP6665498B2 (ja) | 情報処理装置、画像処理システム及びプログラム | |
US7313340B2 (en) | Paper control of document processing | |
US8175377B2 (en) | Method and system for training classification and extraction engine in an imaging solution | |
US7817292B2 (en) | Print time management, program, print management apparatus, print time management apparatus and print time management method | |
US8339622B2 (en) | Image processing apparatus and integrated document generating method | |
US20080050016A1 (en) | Image processing apparatus, image processing method, computer readable medium, and computer data signal | |
JP2006023944A (ja) | 画像処理システム及び画像処理方法 | |
JP2007312225A (ja) | データ処理装置、並びに当該装置で実行されるデータ処理方法及びデータ処理プログラム | |
JP2006093917A (ja) | 画像読取装置および画像処理装置、画像形成装置 | |
JP2007066286A6 (ja) | 画像検索装置、画像処理装置、及びそれらの方法 | |
JP2007066286A (ja) | 画像検索装置、画像処理装置、及びそれらの方法 | |
JP2009223390A (ja) | 画像処理監視システム及びプログラム | |
US20230102476A1 (en) | Information processing apparatus, non-transitory computer readable medium storing program, and information processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |