CN1525733A - 图像数据中具有不同特征的区域之间的边界检测方法 - Google Patents

图像数据中具有不同特征的区域之间的边界检测方法 Download PDF

Info

Publication number
CN1525733A
CN1525733A CNA2003101239613A CN200310123961A CN1525733A CN 1525733 A CN1525733 A CN 1525733A CN A2003101239613 A CNA2003101239613 A CN A2003101239613A CN 200310123961 A CN200310123961 A CN 200310123961A CN 1525733 A CN1525733 A CN 1525733A
Authority
CN
China
Prior art keywords
unit area
border
area
unit
original paper
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2003101239613A
Other languages
English (en)
Other versions
CN1324873C (zh
Inventor
����һ
江口真一
铃木直子
胜又裕
金元浩一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Ltd
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, Fujitsu Frontech Ltd filed Critical Fujitsu Ltd
Publication of CN1525733A publication Critical patent/CN1525733A/zh
Application granted granted Critical
Publication of CN1324873C publication Critical patent/CN1324873C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/168Segmentation; Edge detection involving transform domain methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20048Transform domain processing
    • G06T2207/20056Discrete and fast Fourier transform, [DFT, FFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

一种图像处理设备,包括:特征强调单元,用于从图像数据为每个第一单位区域提取第一图像频率信息;边界临时确定单元,用于:将通过向第一图像频率信息添加预定的权重所获得的值定义为代表性特征信息,并且将满足如下条件的第一单位区域临时确定为边界,即,所述第一单位区域与相邻第一单位区域的代表性特征信息之间的偏差等于或高于预定水平;以及边界确定单元,用于:在临时确定为边界的第一单位区域以及所述第一单位区域的相邻区域的范围中,为每个小于所述第一单位区域的第二单位区域提取第二图像频率信息,并且通过将满足如下条件的第二单位区域用作边界来产生边界信息,即,对于所述第二单位区域,其基于与相邻区域的第二图像频率信息之间偏差的值等于或高于预定水平。

Description

图像数据中具有不同特征的区域之间的边界检测方法
技术领域
本发明涉及一种图像处理技术,更具体地说,本发明涉及一种对图像数据中区域特征发生变化的位置进行检测的图像处理技术。
背景技术
作为一种能以光学方式读取原件(例如纸件等)并将其转换成数据的设备,诸如扫描仪、复印机等用于以光学方式读取数据的图像读取器都是公知的。在图像读取器中,通常将原件正面(从中读取数据的表面)放置成面朝图像读取器的读取表面,并且使用一个用于覆盖原件的原件盖(original cover)来覆盖原件背面,由此执行原件的读取。实际上,在从原件中读取图像的时候,将光线从读取表面照射到如上所述设定为面朝读取表面的原件正面,由读取表面上所形成的光学读取器器件(例如,CCD(电荷耦合器件)等)来逐行读取原件正面反射的光,并且把从原件正面读取的信息转换成电信号,由此最终形成原件的图像数据。
当原件小于读取表面的读取范围时,原件盖的背面(即原件盖的读取表面,它可以是原件的背景,因此称为背景板(background board))将会出现在从读取表面所观察到的原件的周围。这样一来,在读取图像时不但读取了原件正面,而且读取了背景板。因此,这种情况下形成的图像数据将会显示原件周围的背景板。
举例来说,通过对图像数据中的字符区域进行OCR处理后,将由此形成的图像数据打印到纸上,以便用于每种用途,其中所述OCR处理是通过如下操作来进行的:局部剪切图像数据,在旋转图像数据之后对其进行校正,将图像数据按照原样保存在数据库等中。
通常,在执行OCR处理的时候,对所要处理的原件而言,较为便利的是采用一个与在列表中一样在其中预先确定了打印位置的标准文档。
当在OCR处理中使用标准文档时,所述标准文档将会转换成图像数据,并且,标准文档的图像数据(下文也称为标准文档图像)将在诸如旋转修正这样的校正处理中得到恰当处理。如果在标准文档图像上将打印位置预先设定为标准文档图像上的参考位置的基础,则可以从经过修正的标准文档图像中估计出所述打印位置。然后,借助于在估计到的打印位置上执行的OCR处理,对所估计的打印位置执行字符识别处理,由此得到希望的字符信息。
然而在很多情况中,对于诸如上述列表等的标准文档而言,其原件画面具有白色页边。如果使用与页边具有相同或相似颜色的背景板来读取小于图像读取器读取范围的标准文档原件,那么,所获得和形成的图像数据将会指示:在标准文档原件与背景板之间并不存在边界。即,应该出现的边界则实际上显示为相同颜色的边界部分和包围部分。此外,在每次放置原件的时候,面朝图像读取器读取表面放置的标准文档原件读取表面的排列也不相同,因此,在图像数据中,在所形成的图像数据中捕获的标准文档原件的角度和排列也不相同。这样一来,为了对图像数据执行OCR处理,需要执行一个新的步骤,即规定在图像数据中捕获的标准文档原件的状态(角度和排列)。
通常,图像读取器是用于特殊用途的昂贵设备,并且将其设计成通过预先设置黑色背景板来检测在图像数据中所捕获的标准文档原件的状态。
因此,通过使用背景板来读取标准文档的每个原件,指定了基于边界的标准文档原件的状态,其中所述边界指示了在标准文档原件的读取图像数据中所指示的背景板的黑色与标准文档原件画面的白色之间的灰度级差异。
将与上述技术相似的技术应用于复印机。它不同于在原件画面与背景板之间使用不同颜色的技术,而是设计为允许图像读取器识别预先设置为任意重排的背景板RGB排列,由此指定一个与背景板在RGB排列方面存在差异的原件区域。
发明内容
本发明旨在提供从图像数据中检测原件边沿的技术,所述图像数据包含了原件以及在原件周围捕获的背景板,并且所述图像数据是从原件与背景板的一种任意组合中读取的,其中所述原件和背景板是从若干类型的原件和背景板中选出的。所述技术被提供为:边界检测方法、存储其程序的计算机可读的易用存储介质、图像处理设备以及复印机,这些都基于在图像数据中对任意相邻区域之中具有不同特征的区域之间的边界进行检测,并且通过如下操作来实现所述技术:为图像数据中的每个单位区域提取依赖于单位区域中的所有象素的特征信息,为任意单位区域获得相邻单位区域之间的特征信息中的差别,以及将其差别等于或高于预定水平的单位区域确定为边界。
附图说明
图1是根据本发明实施例的图像处理设备的框图;
图2示出显示加框原件图像的示例;
图3示出由打印区域排除单元100执行的操作流程的示例;
图4A和4B示出由打印区域排除单元100所指定的打印区域与原件图像之间的对比;
图5示出由特征强调单元102执行的操作的示例;
图6示出在将加框原件图像A分为单位象素区域之后对其进行扫描的情况的示例;
图7示出在图2所示矩形区域210中获得的特征量(feature amount)的测量数据;
图8是基于图7所示测量数据的高频分量的曲线图;
图9是基于图7所示测量数据的低频分量的曲线图;
图10是基于图7所示测量数据的直流分量的曲线图;
图11示出由临时边沿确定单元104所执行的操作流程的示例;
图12示出要获得其特征量平均值的目标的象素区域的排列;
图13示出为加框原件图像A临时确定的边沿的布局;
图14示出权重确定处理中的操作流程;
图15示出峰值检测处理中的操作流程;
图16示出预定行的水平分布;
图17示出由边沿确定单元106执行的操作流程;
图18A、18B和18C示出由边沿确定单元106对加框原件图像A所执行的处理的范围;
图19示出鲁棒性(robustness)校正处理的流程;
图20示出用于指定原件边沿的整个处理流程的示例;
图21是复印机的框图;
图22示出使用了所述图像处理技术的硬件的示例(1);
图23示出使用了所述图像处理技术的硬件的示例(2);
图24示出图23所示硬件中的操作流程的示例(1);
图25示出图23所示硬件中的操作流程的示例(2);
图26示出根据本发明的图像处理技术的应用示例;以及
图27示出产生黑色背景板图像的流程。
具体实施方式
根据本发明实施例的边界检测方法的一个方面基于:在图像数据中对任意相邻区域之中具有不同特征的区域之间的边界进行检测,所述方面是通过如下操作来实现的:为图像数据中的每个单位区域提取依赖于单位区域中的所有象素的特征信息,为任意单位区域获得相邻单位区域之间的特征信息中的差别,以及将其差别等于或高于预定水平的单位区域确定为边界。
根据本发明实施例的边界检测方法的另一个方面基于:在图像数据中对任意相邻区域之中具有不同象素排列的区域之间的边界进行检测,所述方面是通过如下操作来实现的:为图像数据的每个单位区域提取图像频率信息,根据所提取的图像频率信息来确定代表性特征信息,为任意单位区域获得相邻单位区域之间的代表性特征信息中的差别,以及将其差别等于或高于预定水平的单位区域确定为边界。
根据本发明实施例的边界检测方法的另一个方面基于:在图像数据中对任意相邻区域之中具有不同象素排列的区域之间的边界进行检测,所述方面是通过以下操作来实现的:为图像数据的每个第一单位区域提取多个预定类型的第一图像频率信息;通过向每种所提取的第一图像频率信息中添加预定的权重来获得一值,并将该值定义为代表性特征信息;将任意第一单位区域中满足如下条件的第一单位区域临时确定为边界,即,所述第一单位区域与相邻第一单位区域的代表性特征信息之间的偏差等于或高于预定水平;在临时确定为边界的第一单位区域以及所述第一单位区域的相邻区域中,为每个小于第一单位区域的第二单位区域提取第二图像频率信息;以及,将任意第二单位区域中满足如下条件的第二单位区域确定为边界,即,所述第二单位区域的基于与相邻第二单位区域的第二图像频率信息之间的偏差的值等于或高于预定水平。
根据本发明实施例的边界检测方法的另一个方面基于:在原件正面图像与作为该原件背景的背景板一起输入的所述原件的输入图像数据中,为以相同颜色输入的部分背景板和原件边沿图像的输入图像数据检测背景板与原件之间的边界,所述方面是通过以下操作来实现的:对输入图像数据的每个第一单位区域执行傅立叶变换;提取由傅立叶变换处理所获得的多个预定类型的第一图像频率信息;通过向每种所提取的第一图像频率信息添加预定的权重来获得一值,并将该值定义为每个第一单位区域的代表性特征信息;对任意第一单位区域中满足如下条件的第一单位区域执行直线近似(line approximation),即,所述第一单位区域与相邻第一单位区域的代表性特征信息之间的偏差处于或超过预定水平,并将由此获得的近似直线上的对应区域临时确定为边界;在临时确定为边界的第一单位区域以及所述第一单位区域的相邻区域中,为每个小于所述第一单位区域的第二单位区域执行傅立叶变换;提取通过傅立叶变换所获得多个的预定类型的第二图像频率信息;通过向每种所提取的第二图像频率信息添加预定的权重来为每个第二单位区域获得一值,并将该值定义为代表性特征信息;对所述代表性特征信息执行小波变换;对满足如下条件的第二单位区域执行直线近似,即,对于所述第二单位区域,其通过小波变换为每个第二单位区域所获得的值等于或高于预定水平;以及,把通过直线近似所获得的近似直线上的位置确定为边界。
在边界检测方法的上述每个方面中,希望为图像数据或输入图像数据指定打印区域,并且在后续步骤中,希望使用排除了打印区域的图像数据或输入图像数据。
同样希望的是,特征信息或图像频率信息是高频分量、低频分量、直流分量以及频率分布,这些都包含在从中提取了特征信息或图像频率信息的单位区域中。
根据本发明实施例的程序的一个方面基于:允许计算机在图像数据中对任意相邻区域之中具有不同特征的区域之间的边界进行检测,所述方面是通过如下功能来实现的:为图像数据的每个单位区域提取多个依赖于单位区域中的所有象素的特征信息,为任意单位区域获得相邻单位区域之间的特征信息中的差别,以及将其差别等于或高于预定水平的单位区域确定为边界。
根据本发明实施例的程序的另一个方面基于:允许计算机在图像数据中对任意相邻区域之中具有不同象素排列的区域之间的边界进行检测,所述方面是通过如下功能来实现的:为图像数据的每个单位区域提取图像频率信息,根据所提取的图像频率信息来确定代表性特征信息,为任意单位区域获得相邻单位区域之间的代表性特征信息中的差别,以及将其差别等于或高于预定水平的单位区域确定为边界。
根据本发明实施例的程序的另一个方面基于:允许计算机在图像数据中对任意相邻单位区域之中具有不同象素排列的区域之间的边界进行检测,所述方面是通过以下功能来实现的:为图像数据中的每个第一单位区域提取预定类型的第一图像频率信息;通过向每种所提取的第一图像频率信息中添加预定的权重来获得一值,并将该值定义为代表性特征信息;将任意第一单位区域中满足如下条件的第一单位区域临时确定为边界,即,所述第一单位区域与相邻第一单位区域的代表性特征信息之间的偏差等于或高于预定水平;在临时确定为边界的第一单位区域以及所述第一单位区域的相邻区域中,为每个小于第一单位区域的第二单位区域提取第二图像频率信息;以及,将任意第二单位区域中满足如下条件的第二单位区域确定为边界,即,所述第二单位区域的基于与相邻第二单位区域的第二图像频率信息的偏差的值等于或高于预定水平。
根据本发明实施例的程序的另一个方面基于:允许计算机在原件正面图像与作为该原件背景的背景板一起输入的所述原件的输入图像数据中,为以相同颜色输入的部分背景板和原件边沿图像的输入图像数据检测背景板与原件之间的边界,所述方面是通过以下功能来实现的:对输入图像数据中的每个第一单位区域执行傅立叶变换;提取由傅立叶变换所获得的多个预定类型的第一图像频率信息;通过向每种所提取的第一图像频率信息添加预定的权重来获得一值,并将该值定义为每个第一单位区域的代表性特征信息;对任意第一单位区域中满足如下条件的第一单位区域执行直线近似,即,所述第一单位区域与相邻第一单位区域的代表性特征信息之间的偏差等于或高于预定水平,并将由此获得的近似直线上的对应区域临时确定为边界;在临时确定为边界的第一单位区域以及所述第一单位区域的相邻区域中,为每个小于第一单位区域的第二单位区域执行傅立叶变换;提取通过傅立叶变换所获得的多个预定类型的第二图像频率信息;通过向每种所提取的第二图像频率信息添加预定的权重来为每个第二单位区域获得一值,将这值定义为代表性特征信息;对所述代表性特征信息执行小波变换;对满足如下条件的第二单位区域执行直线近似,即,所述第二单位区域的通过小波变换为每个第二单位区域所获得的值等于或高于预定水平;以及,把通过直线近似所获得的近似直线上的位置确定为边界。
在程序的上述每个方面中,希望实现为图像数据或输入图像数据指定打印区域,然后使用排除了打印区域的图像数据或输入图像数据的功能。
同样希望的是,特征信息或图像频率信息是高频分量、低频分量、直流分量以及频率分布,这些包含在从中提取了特征信息或图像频率信息的单位区域中。
根据本发明实施例的图像处理设备的一个方面基于:在图像数据中对任意相邻区域之中具有不同特征的区域之间的边界进行检测,所述方面包括:特征强调单元,用于为图像数据中的每个单位区域提取依赖于单位区域中的所有象素的特征信息;以及边界确定单元,用于为任意单位区域获得相邻单位区域之间的特征信息中的差别,以及将其差别等于或高于预定水平的单位区域确定为边界。
根据本发明实施例的图像处理设备的另一个方面基于:在图像数据中对任意相邻区域之中具有不同象素排列的区域之间的边界进行检测,所述方面包括:特征强调单元,用于为图像数据的每个单位区域提取图像频率信息;以及边界确定单元,用于:根据所提取的图像频率信息来确定代表性特征信息,为任意单位区域获得相邻单位区域之间的代表性特征信息中的差别,以及将其差别等于或高于预定水平的单位区域确定为边界。
根据本发明实施例的图像处理设备的另一个方面基于:在图像数据中对任意相邻单位区域之中具有不同象素排列的区域之间的边界进行检测,所述方面包括:特征强调单元,用于为图像数据中的每个第一单位区域提取多个预定类型的第一图像频率信息;边界临时确定单元,用于通过向每种所提取的第一图像频率信息中添加预定的权重来获得一值,并将该值定义为代表性特征信息,并且将任意第一单位区域中满足如下条件的第一单位区域临时确定为边界,即,所述第一单位区域与相邻第一单位区域的代表性特征信息之间的偏差等于或高于预定水平;以及边界确定单元,用于在临时确定为边界的第一单位区域以及所述第一单位区域的相邻区域中为每个小于第一单位区域的第二单位区域提取第二图像频率信息,并且将任意第二单位区域中满足如下条件的第二单位区域确定为边界,即,所述第二单位区域的基于与相邻第二单位区域的第二图像频率信息之间的偏差的值等于或高于预定水平。
根据本发明实施例的图像处理设备的另一个方面是基于:在原件正面图像与作为该原件背景的背景板一起输入的所述原件输入图像数据中,为以相同颜色输入的部分背景板和原件边沿图像的输入图像数据检测背景板与原件之间的边界,所述方面包括:特征强调单元,用于对输入图像数据中的每个第一单位区域执行傅立叶变换,并且提取由傅立叶变换所获得的多个预定类型的第一图像频率信息;边界临时确定单元,用于通过向每种所提取的第一图像频率信息添加预定的权重来获得一值,并将该值定义为每个第一单位区域的代表性特征信息,对任意第一单位区域中满足如下条件的第一单位区域执行直线近似,即,所述第一单位区域与相邻第一单位区域的代表性特征信息之间的偏差等于或高于预定水平,并将由此获得的近似直线上的对应区域临时确定为边界;以及边界确定单元,用于在临时确定为边界的第一单位区域以及所述第一单位区域的相邻区域中,为每个小于第一单位区域的第二单位区域执行傅立叶变换,提取通过傅立叶变换所获得的多个预定类型的第二图像频率信息,通过向每种所提取的第二图像频率信息添加预定的权重来为每个第二单位区域获得一值,并将该值定义为代表性特征信息,对所述代表性特征信息执行小波变换,对满足如下条件的第二单位区域执行直线近似,即,所述第二单位区域的通过小波变换为每个第二单位区域所获得的值等于或高于预定水平,以及把通过直线近似所获得的近似直线上的位置确定为边界。
在图像处理设备的上述每个方面中,希望进一步包括打印区域排除单元,用于排除图像数据中的打印区域。
另外希望的是,特征信息或图像频率信息是高频分量、低频分量、直流分量以及频率分布,这些都包含在从中提取了所述特征信息或图像频率信息的单位区域中。
图像处理设备还可以包含图像读取单元,用于以光学方式读取原件并且产生原件的图像数据。
根据本发明的实施例,为图像数据的每个单位区域提取了诸如图像频率等为全部单位象素所确定的特征信息。因此,如果在图像数据中捕获到两张具有不同表面状态的纸,即使这两张纸具有相同颜色,也可以将这两张纸视为具有不同特征信息来对其状态进行提取。
然后,如果根据所提取的特征信息来获得相邻区域之间的偏差,那么所述偏差会在这两张具有不同表面状态的纸之间的边界上增加。因此,可以将图像偏差增加的位置指定为这两张纸之间的边界。
此外,如果图像数据中捕获到带有黑色打印字符的白色原件以及邻近该白色原件的另一相同颜色的原件,则有可能首先排除一个更暗的打印区域。由此很容易指定二者之间的边界位置。
以下参照附图来对本发明实施例进行详细说明。
根据本发明实施例的图像处理设备是为扫描仪、复印机等提供的用于读取原件图像的图像读取器,其中所述图像读取器具有背景板(它是一个合并到原件盖中的构件,用于在将原件设置为正面接触光学读取表面,然后将其设置为接触原件盖背面的时候,使原件保持离开原件背面)。
根据本发明的实施例,原件图像与背景板图像之间的边界是在加框原件图像中检测的(在下文中将原件图像与原件图像周围形成的背景板图像共同称之为加框原件图像),所述加框原件图像具有原件图像以及使用图像读取器在原件图像周围读取的背景板图像(下文中称为背景板图像)。
假设图像读取器读取的原件周围具有白色页边区域,并且背景板颜色也是白色,也就是说,背景板的颜色与页边区域相同。
为了方便起见,假设所述原件是矩形纸张,而印有字符和格线的打印区域整体(例如,列表等)则不包括原件的页边区域。
图1是根据本发明实施例的图像处理设备的框图。
如图1所示,图像处理设备包括:打印区域排除单元100,特征强调单元102,临时边沿确定单元104,以及边沿确定单元106。打印区域排除单元100接收作为输入信息的加框原件图像A,而边沿确定单元106则响应该输入信息来输出作为输出信息的边沿信息B。
通过使用附图中并未示出的公知图像读取器单元以象素为单位来读取原件的正面,然后将其以电方式转换成读取信息,由此产生了图1所示的加框原件图像。生成的加框原件图像A具有关于每个象素的R(红)、G(绿)、B(蓝)的灰度级信息,或者具有基于查找表管理的图像信息。
在对每个上述单元进行说明之前,首先通过参考图2来说明加框原件图像的特征。
图2示出了显示屏(下文称为X-Y坐标平面或图像平面)上的如上产生并如图1所示的加框原件图像A的示例,其中,在附图并未示出的显示设备上,水平方向由X轴表示,垂直方向则由Y轴表示。
为了便于理解,图2所示的加框原件图像A在虚线右边指示了原件图像,在虚线左边则指示了因为超出原件区域而从部分背景板中读取的背景板图像。图2所示虚线则是为了进行说明而显示的原件边沿。实践中并不存在这条作为原件图像与背景板图像之间边界的虚线。
在图2中,包含字符、格线、符号等的区域称为打印区域200,打印区域200周围的原件图像的页边部分称为边沿区域202,包含背景板的区域称为背景板区域204。图2所示的打印区域200包含日文字符。然而,在了解本发明实施例的过程中,没有必要了解这些字符。因此,通过使用其他语言的字符和符号来替换这些字符,可以充分理解本发明的实施例。这一点同样适用于在稍后提及的图4A和18A中所示的日语文字和字符。
当指定了原件图像边沿时,可以在一个捕获到边沿阴影的部分206中明确检测到灰度级值中的差别,由此可以在这个位置指定原件图像的边沿。
然而,在图2所示的加框原件图像A中,在并未捕获到边沿阴影的边沿位置(在图2中从捕获到边沿阴影的部分206开始向下延伸的虚线部分)处,如图2中清楚显示的那样,背景板颜色与页边颜色相似,并且有一连串数据处于边界上的相邻象素之间不存在色差的地方。因此,无法基于灰度级值而在所述位置指明一个边沿。
然而,背景板状态(例如,表面粗糙、表面光滑、材料类型不同等)通常不同于原件页边状态(例如,表面粗糙、表面光滑、材料类型不同等)。
因此,通过提取状态中的差别作为某些特征量,可以如下所述来指定一个边沿位置。
图2所示放大视图208是在使用色度显示矩阵区域210及其周围区域时的矩阵区域210及其周围区域的局部放大视图,在这个视图中强调了所述色度,以便清楚指明上述状态之间的差别,其中,矩阵区域210包括加框原件图像A的背景板区域204以及包含二者之间边界的页边区域202。
通过强调加框原件图像A的色度,就强调了依赖于页边区域202与背景板区域204之间的上述状态差别的RGB排列差别,并且可以根据图2所示区域中的差别来从视觉上判定边界。
因此,通过利用上述特征,图像处理设备能够指定加框原件图像的原件区域与背景板区域之间的边界,以下通过参考图2所示的加框原件图像A来描述图像处理设备的每个单元。
图1所示的打印区域排除单元100对加框原件图像A的每个象素进行扫描,并且将那些通过扫描所获得的RGB灰度级值中灰度级值为200或者更小的象素确定为打印区域,由此指定图2所示的打印区域200,此外还从构成边沿的可能象素中排除上述象素。
根据指定的范围(也称为块),图1所示的特征强调单元102从加框原件图像A中提取一特征量(例如,象素区域中包含的图像频率(或频谱)、频率分布等)。例如,以长为32个象素、宽为4个象素的单元执行二维快速傅立叶变换,获得每个区域的频谱,接着可将所获得频谱的高频分量、低频分量和直流分量中每个分量的平均值以及频谱的频率分布定义为区域的特征量。
例如,所述预定范围可以是长为l个象素、宽为m个象素(l和m都是整数)等。
为图像平面上的加框原件图像的预定范围所指定的每个象素的单位区域被称为象素区域。
特征强调单元102也可以提取每个象素区域的特征量,其中排除了由打印区域排除单元100所指定并在图2中显示的打印区域200。
临时边沿确定单元104基于由特征强调单元102为每个象素区域所提取的特征量来暂时确定与加框原件图像上的原件边沿相对应的位置(例如,使用预定的权重来合计象素区域的特征量,将由此得到的值定义为差别值,将所述差别末端的峰值定义为边沿,在直线近似中使用所获得的边沿,并且将所获得的线临时确定为边沿)。
图1所示的边沿确定单元106以一象素区域为单位提取不同的特征量,其中所述象素区域的范围要窄于如下的象素区域,所述象素区域定义为特征强调单元102从临时边沿确定单元104临时确定的边沿位置及其在图像平面上相邻区域提取特征量的单位,最终,边沿确定单元106根据特征量来确定加框原件图像上的原件边沿位置(例如,在临时确定的边界位置及相邻区域的长为32个象素、宽为1个象素的单元中执行一维快速傅立叶变换,对上述变换中提取的特征量执行小波变换,基于在上述变换中获得的值来对峰值位置进一步执行直线近似,并且将近似直线上的位置定义为边沿位置等)。
这样,就输出了图1所示的边沿信息B。
以下描述的是根据本发明实施例的图像处理设备的每个单元的操作流程的示例。
在本示例中,对处理图像所使用的扫描方法而言,除非另作说明,否则都在同一象素串上水平向右地扫描图2所示的加框原件图像A的每个象素。在处理象素串的时候,在长为32个象素的单元中的相同象素串上类似地处理下方的行,并且类似处理将会一直继续,直到处理过加框原件图像A中的最下方的行。
为了能够理解操作流程,通过参考显示测量结果等的图表来给出所述说明。
图3显示的是图1所示由打印区域排除单元100所执行的操作流程的示例。
在图3所示的操作流程中,将图2所示加框原件图像A的图像平面上最先读出数据的起始行位置设定为图2所示图像A的上限位置(S300)。
然后,将处于图2所示设定行最左边的象素设为读取目标(S302)。
对所设定象素的RGB灰度级值进行读取,并且确定是否存在未超出基准RGB灰度级值200的读取值,以便排除打印区域(S304)。
根据原件,可以恰当设定用于进行确定的基准RGB灰度级值。
在步骤S304,如果读取象素的RGB灰度级值超出200,则确定所述象素并不涉及打印区域,并且将同一行上的右侧象素设定为下一个读取目标(S306)。
另一方面,在步骤S304,如果读取象素的RGB灰度级值等于或小于200,则临时确定所述区域存在打印区域,并且将控制权传递到步骤S308中的噪声确定处理。
在步骤S308,对在步骤S304中临时设置为包含打印区域的象素做出判定,确定其中是否存在连续地处于临时确定为打印区域的图像平面上的象素。
如果在步骤S308中确定没有连续象素,则将控制权传递到步骤S306,并且将同一行中紧跟在当前处理目标象素之后的象素设定为读取目标,然后执行上述步骤中的处理。
对于那些不把两个连续像素临时设定为打印区域的情况,存在一种可能性,即所述象素是指那些因为尘土等而产生的噪声,这些象素与打印区域毫无关系。此外,可以恰当地设定用于判定基准的连续象素的数目。
在步骤S308,如果确定存在连续象素,则将对应象素设定为最先从图2所示图像A的最左边的象素中检测到的打印区域200(S310)。
然后,在步骤S312,确定当前行中是否仍然存在未曾处理的象素。
如果在步骤S312中确定当前行中仍然存在要处理的象素,则将控制权传递到步骤S306,并且对剩余象素执行类似处理。
如果在步骤S312确定当前行中不存在要处理的象素,则确定当前行是否为图2所示图像A中最低部分的最后一行(S314)。
如果在步骤S314确定当前行不是最后一行,则在图像平面上紧靠当前行下方的位置设定一行(S316),并且,从该设定行最左边开始重复执行步骤S302的处理以及步骤S302之后的处理。
在扫描至完成图2所示图像A上扫描操作的最后一行时,在步骤S314,确定该当前行即为最后一行,由此终止所述处理。
图4A与4B显示了上述操作流程指示的打印区域与原件图像之间的对比。
图4A显示了执行上述操作流程之前的图2所示的加框原件图像A。图4B则用黑色显示了上述操作流程指示的打印区域。
如图4B所示,将打印区域200与捕获图2所示边沿阴影的部分206标为打印区域400。
因此,在输入到图1所示打印区域排除单元100的加框原件图像A中,将打印区域200与捕获边沿阴影的部分206标为本示例中的打印区域。
在后续处理中,可以排除图4B所示的指定打印区域400。
图5显示了图1所示的特征强调单元102所进行的操作流程的示例。
这个操作流程是在图像A上进行的,其中图1所示的打印区域排除单元100指定了打印区域。
此外,在本操作流程中,除非另作说明,否则以图6所示范围600的区域为单位(在本示例中,是长32个象素、宽4个象素的块)对图像平面上指示的加框原件图像A进行划分,并将由此获的的每个象素区域用作处理单元。
在图5所示的操作流程中,在图6所示加框原件图像A的左上角,将由范围600指示的象素区域602设定为所要处理的起始块(S500)。
然后,根据关于由图1所示打印区域排除单元100所指示象素的图4B所示打印区域400的信息,来确定所述象素区域(在当前阶段以及后续阶段中的象素区域602)是否包含图4B所示的打印区域400(S502)。
在步骤S502,如果确定图4B所示打印区域400包含在所述象素区域之中,则再次将沿图6所示图像A的象素区域扫描方向与所述象素区域相邻的一象素区域设定为所要处理的区域(S504)。
在步骤S502中,如果确定图4B所示打印区域400并不包含在所述象素区域之中,则对每个象素区域执行公知的二维快速傅立叶变换(以下简称为2DFFT),并且获得所述象素区域的频谱(S506)。
然后获得在所述象素区域中得到的频谱的高频分量(在本示例中,1/2π≤ω<3/4π,其中ω是一个表征频率的变量)的平均值(S508)。
获得在所述象素区域中得到的频谱的低频分量(在本示例中,0≤ω<1/2π)的平均值(S510)。
然后,还获得在所述象素区域中得到的频谱的直流分量(在本示例中,ω=0)的平均值(S512)。
图7是为矩形区域210(长32个象素、宽144个象素)中每个以长32个象素、宽4个象素为单位的象素区域所获得的不同分量平均值的测量数据。所述测量数据是为每个RGB数据所计算的,并且很容易检查每个RGB数据的偏差。
图7所示x坐标对应于图2所示图像A的x轴方向,并且显示了朝右计算的象素数的值,其中将图2所示矩形区域210中最左边的点定义为x坐标的原点。
在图7中,与由表示从图2所示矩形区域210最左端开始的象素数位置的x坐标所指定的位置相对应,灰度级值表示每个RGB数据的直流分量(直流分量R,直流分量G,直流分量B),频谱值表示每个RGB数据的低频分量(低频分量R,低频分量G,低频分量B),频谱值还表示每个RGB数据的高频分量(高频分量R,高频分量G,高频分量B)。
当把每个分量的值显示在一个线图中时,可以得到图8~10所示的曲线图。
图8是涉及高频分量的曲线图,其中横轴表示像素数的位置(每个象素区域最左边的象素数的位置),纵轴则表示频谱值,并且显示了每个RGB数据的频谱偏差。
图9是涉及低频分量的曲线图,其中与涉及高频分量的曲线图一样,横轴表示象素数的位置(每个象素区域最左边的象素数的位置),纵轴表示频谱值,并且显示了每个RGB数据的频谱偏差。
图10是涉及直流分量的曲线图,其中横轴表示象素数的位置(每个象素区域最左边的象素数的位置),纵轴表示灰度级值,并且显示了每个RGB数据的灰度级值偏差。
如图8到10中显示的线图所示,x坐标位置136显示了最陡的波动。并且在图7到10中,如x坐标位置136的实线所示,可以预期原件边沿在这个位置。
现在将控制权返回到关于图5所示的操作流程的说明中。
在上述步骤中得到了3种分量的平均值。此外,从这个象素区域的频谱中得到了半功率宽度,并且将所获得的半功率宽度设为所述象素区域的频率分布(S514)。
半功率宽度表示的是靠近峰值周期的两个周期的间隔,在横轴表示周期而纵轴表示频谱强度时所获得的频率分布图中,所述峰值周期指示了值为二分之一峰值的强度。
然后,将步骤S508到S512中得到的每个分量的平均值以及在步骤S514中设定的频率分布设为所述象素区域的特征量(S516)。
确定是否对图6所示加框原件图像A的所有象素区域执行上述处理(S518)。
在步骤S518中,如果确定存在接下来要扫描的象素区域,则将控制权传递到步骤S504,并且将这个接下来要扫描的象素区域设为要处理的区域,执行上述步骤中的处理。
然后,如果在步骤S518中确定不存在接下来要扫描的后续象素区域,那么,由于对图像A中的全部象素区域都执行了上述处理,所以将终止所述处理。
在这个操作流程中,获得了四个特征量,但是特征量并不局限于这些,也可以增加其他特征量。
因此,图1所示的特征强调单元102能够以预定大小的象素区域为单位而从打印区域排除单元100已经执行过处理的加框原件图像A中提取每种特征量。
图11显示了图1所示的临时边沿确定单元104的操作流程的示例。
所述操作流程是基于由特征强调单元102提取的每种特征量而进行的。
在这个操作流程中,加框原件图像的处理目标范围以图6中所示范围600所指定的象素区域为单位来确定,其中所述范围600通过划分图2所示加框原件图像A的区域来指示,并且还设定了对应的处理范围(S1100)。
在本实施例中,通过限定一从图像A的打印区域400的最左端开始的范围来将所述处理范围确定为目标处理范围,其中所述打印区域400是通过如图4B所示将打印区域涂为黑色来表示的。
通过如上所述来确定处理范围,就将图6所示加框原件图像A的上限行设定为读取象素区域的起始行(S1102)。
随后对每个特征量执行稍后将要详细描述的权重确定处理(S1104)。
位于所述设定行最左端的象素区域被设为最先读取的象素区域(S1106)。
然后,基于为与图5所示操作流程(步骤S508到S514)中的象素区域相邻的象素区域(本示例中,至多两个象素区域邻近所述象素区域左侧)所获得的每个特征量的平均值,为每个特征量计算这两个象素区域的平均值(S1108)。
图12显示了用于所要处理象素区域中的平均值的所要处理象素区域排列。
图12显示了作为图6所示加框原件图像A中所要处理的象素区域而被指定为处理目标的象素区域604,在这种情况下,对与象素区域604左侧相邻的象素区域1202以及更邻近左侧的象素区域1204来说,这两个象素区域将被指定为一个象素区域,用于为指定要处理的象素区域604计算相邻象素区域每个特征量的平均值。
在图11所示的连续处理(步骤S1110)中使用了如上获得的每个特征量的平均值。
在图11中所示的步骤S1110,获得所要处理象素区域每个特征量之间的每个特征量偏差,并且还获得在步骤S1108中得到的每个特征量的平均值。
将如上所述获得的每种特征量的偏差添加到步骤S1104的权重确定处理中得到的每种特征量的权重或是预先统计得到的权重(优选地,高频分量是1,低频分量是2,直流分量是1,频率分布是1)之中,并且将所述值设为象素区域中的特征偏差(S1112)。
然后执行如下处理:获得步骤S1112中为每个象素区域所设的特征偏差的峰值(S1114)。
稍后将会详细说明获得峰值的处理(峰值检测处理)。
然后基于峰值处理来为所述象素区域的特征偏差确定峰值(S1116)。
如果在步骤S1116中确定没有峰值,则确定接下来将要扫描的象素区域(图12中的象素区域1206)是不是打印区域(S1118)。
如果在步骤S1118确定接下来将要扫描的象素区域不是打印区域,则确定所述象素区域(图12中的象素区域1206)是不是在扫描方向上与中央象素区域相隔一个象素区域的象素区域(S1120)。
如果在步骤S1120中确定所述象素区域是在扫描方向上与中央象素区域相隔一个象素区域的象素区域,则确定所要处理的象素区域是否处于最后一行(S1122)。
如果在步骤S1116的处理中得到相反判定,则执行以下处理。
如果在步骤S1116中确定存在一个峰值,则确定所要处理的象素区域是对应于边沿的象素区域,并且暂时确定所述象素区域是原件图像最左边的边沿(S1124)。然后将控制权传递到步骤S1122中的处理。
如果在步骤S1188中确定所要处理的象素区域是打印区域,则将控制权传递到步骤S1122的处理。
如果在步骤S1120中确定所述象素区域(图12中的象素区域1206)不是在扫描方向上与中央象素区域相距一个象素区域的象素区域,则将控制权传递到步骤S1126中的处理,而接下来将要扫描的象素区域即为所要处理的象素区域,并且以上述顺序重复执行从步骤S1108开始的处理。
如果在步骤S1122中确定所要处理的象素区域并不位于最后一行,则将控制权传递到步骤S1126,并且以上述步骤顺序来执行所述处理。
如果在步骤S1122中确定所要处理的象素区域位于最后一行,则将控制权传递到步骤S1128中的处理。
在步骤S1128,在图像平面上对与步骤S1124中检测到的边沿相对应的所有象素区域执行直线近似,并且把所获得的近似直线上的象素暂时确定为原件图像最左部分的边沿部分,由此终止所述处理。
上述操作流程(图11)可以只为那些在每个RGB颜色的频谱值最明确强调了特征的颜色来进行,也可以为通过任意组合RGB颜色所获得的两种或更多种颜色来进行。
图13显示了关于图2所示加框原件图像A在上述处理中临时确定的边沿排列。
为图13中的图像A所显示的行1300是在步骤S1128中得到的近似直线,而与行1300相对应的象素则临时确定为原件图像的最左边沿。
在图13中,所述行稍微偏离图2所示页边区域202与背景板区域204之间的实际边界,但是可以在接近边界的位置设定原件图像的边沿。
因此,图1所示的临时边沿确定单元104可以通过临时将边沿确定在与实际边沿位置更为接近的所述位置来大致确定边沿位置。
以下按顺序讨论的是图11显示的权重确定处理(步骤S1104)和峰值检测处理(步骤S1114)。
图14显示了权重确定处理的操作流程。
在权重确定处理中,关于左边和右边的象素区域,通过使用简单的平均来对步骤S506中得到的每个象素区域的每种频谱分量(高频分量,低频分量,和直流分量)以及示出图1所示特征强调单元102所执行的操作流程的图5所示每个步骤中的频率分布进行归范化(S1400)。
在归范化中,可以吸收那些因为细微波动而产生的每个频谱分量以及频率分布的误差。
然后获得了在图11所示步骤S1100中确定的处理范围(从加框原件图像最左端到打印区域的起始位置)中的每个分量以及频率分布的平均值,并且基于所获得的平均值,可以计算上述预定范围内的每个分量和频率分布的偏差(S1402)。
为每个分量和频率分布单独确定计算出的偏差是否等于或大于预定阈值(S1404)。
例如,上述阈值是设为偏差平均值的0.2倍的值。
在步骤S1404,如果确定存在等于或大于预定阈值的偏差值,则获得所述分量和频率分布的偏差的最大值,并且将所述值设为所述分量以及频率分布的偏差(S1406)。
在步骤S1404,如果确定所述偏差并不等于或大于预定阈值,则确定没有偏差(S1408)。
最后,获得了所述分量与频率分布的设定偏差比值的倒数,并将所述值定义为所述分量与频率分布的权重(S1410),由此终止处理。
图15显示了峰值检测处理的操作流程。
在峰值检测处理中,指定将要处理的象素区域(S1500)。
然后,在同一行上沿与从指定象素区域开始的扫描方向相反方向为所有象素区域获得水平平均值(S1502)。
图16显示了一行的水平分布图,其中横轴表示图12所示的加框原件图像A的x轴,纵轴则表示上述水平。
白圈1600表示预定象素区域单元中的代表性值。
假定图16中突出的白圈1602是在峰值检测处理中要处理的象素区域的水平,并且将对其左边所有象素区域的水平1604进行平均。
由水平平均值所表示的水平是指图11所示临时边沿确定处理中的特征偏差。
峰值检测处理还被用于图1所示的边沿确定单元106的下述操作流程。由于在步骤S1502的处理中并未使用特征偏差,所以为了方便起见,在说明峰值检测处理的过程中使用了水平平均值。
在步骤S1502,当得到水平平均值时,将会为所要处理的象素区域确定峰值(S1504)。
所述确定是按如下进行的:将上述水平平均值乘以预先统计地计算出的恒定值α(在本示例的水平扫描中,最优选的是使用α=2.5,当在以长为4象素、宽为32象素的单位垂直扫描象素区域过程中执行不同处理时,最优选的是使用α=2.0),并且检查所要处理的象素区域的水平(图11所示的临时边沿确定处理中的特征偏差)是否为超出与上述α相乘而得到的水平平均值的峰值。
如果在步骤S1504中确定所要处理的水平不是峰值,则再次设定接下来将要处理的象素区域(S1506),并且顺序重复从步骤S1502开始的处理。
如果确定所要处理的水平是峰值,则终止所述峰值检测处理。
下面来说明由图1所示边沿确定单元106执行的处理,该边沿确定单元106根据由图1所示的临时边沿确定单元104临时确定的边沿来确定边沿的正确位置。
为了更易于说明,假设图1所示临时边沿确定单元104临时确定的边沿位置是由以32个象素长为单位的相同象素串排列的象素来指示的。
图17是边沿确定单元106的操作流程。
在这个操作流程中,在扫描方向上,将位于临时设为图13所示加框原件图像A最上行边沿位置的象素串(长为32象素、宽为1个象素)之前和之后的每个16象素范围设为所述处理的目标(S1700)。
然后,在这个处理中,将象素区域单元定义为范围是32个象素×1个象素的象素串,并且对该象素串单元中的上述范围执行一维快速傅立叶变换,由此得到每个象素串的频谱(S1702)。
图18A显示了用于一行的处理目标的范围。
图18A显示了包含图13所示近似直线1300的象素串的一行的处理目标范围。
尽管图18A中显示的矩形区域1800处于由虚线所示的行1802上的将要处理的范围中并且未在附图中显示,但同样为其他的行设定了处理目标范围。
图18B是矩形区域1800的放大视图,显示了作为边沿位置的临时确定位置与所要处理范围之间的相对位置。
在图18B中,在由图18B中心处的行所示的临时边沿1804周围,将图18C中指示水平方向箭头所示扫描方向上的在前或在后的16个象素中的一个象素的每个象素串1806(长32个象素、宽1个象素)定义为处理目标的范围。
当在步骤S1702中获得频谱时,以上述象素串1806为单位来获得所述频谱的每个分量(高频分量,低频分量,直流分量)以及频率分布的平均值(S1704)。
通过使用图11所示步骤S1104中获得的或者预先统计获得的权重,为每个象素串1806累计所述分量和频率分布,并且将所获得的值定义为该象素串的特征值(S1706)。
这时,对所述特征值执行公知的小波变换(S1708)。
在以上参照图15和16而说明的峰值检测处理中,以行为单位使用通过小波变换所获得的值。
下面参照图15来描述步骤S1710中执行的峰值检测处理。
在步骤S1710的峰值检测处理流程中,将所述行内将要处理的象素串的起始象素串指定为图18B所示示例中的最左端的象素串(S1500)。
然后,在同一行中沿指定象素串的扫描方向相反的方向为所有象素串获得平均值(本示例中即为小波变换平均值)(S1502)。
根据小波变换的平均值,对所要处理的象素串执行峰值确定(S1504)。
所述确定是按如下执行的:将小波变换平均值乘以预先通过统计计算得到的恒定值α,然后确定是否所要处理的象素串的小波变换结果是超出小波变换结果与α相乘所得到的平均值的峰值。
如果在步骤S1504中确定目标小波变换结果不是峰值,则再次设定接下来将要扫描的象素串(S1506),并且按顺序重复从步骤S1502开始的处理。
如果确定目标小波变换结果是峰值,则终止峰值检测处理。
如果在步骤S1710终止峰值检测处理,则确定所要处理的行是不是指定为临时边沿的最后行(S1712)。
如果不是最后行,则对接下来将要扫描的行进行设定(S1714),并且重复进行从步骤S1702开始的处理。
如果在步骤S1712确定所述行是最后行,则在图像平面上对所有已在步骤S1710中按与图11所述步骤S1128中的处理相同的方式检测到其峰值的象素串执行直线近似,并且将所获得的近似直线上的象素定义为原件图像最左边的边沿部分(S1716)。
最后执行鲁棒性校正,由此终止处理(S1718)。
鲁棒性校正是根据下述流程来执行的。
图19显示了鲁棒性校正的处理流程。
如图19所示,通过在图像平面的x轴上对确定为边沿的象素串之间差别(Δx)进行计算,可以获得一个边沿倾斜(S1900)。
然后,为每个所获得的倾斜值计算平均值和偏差(S1902)。
并且排除那些在步骤S1900中获得的差别(Δx)超出上述平均值和偏差的象素串(S1904)。
此外,还会排除那些差别(Δx)指示负方向的象素串(S1906)。
然后,使用最小二乘法来执行直线近似(S1908)。
在下一个步骤S1910,确定已完成当前处理的次数。除非当前处理已经完成三次了,否则将会把控制权传递到步骤S1912,并且计算步骤S1908中得到的近似直线与行计算中所用象素串之间的距离。如果存在其值超出预定阈值的象素串,则排除该超出所述阈值的象素串(S1912)。
在后续处理中,改变了阈值(S1914),并且顺序执行上述步骤中的处理。
如果最终在步骤S1910中确定当前处理已执行了三次,则将迄今为止获得的最新近似直线上的象素确定为原件图像最左边的边沿部分,由此终止全部处理。
上述操作流程(图17)可以只为那些在每个RGB颜色频谱值中最清楚表示了特征的颜色执行,但也可以为通过任意组合RGB颜色所获得的两种或更多种颜色执行所述操作流程。
因此,图1所示的边沿确定单元106只对由图1所示临时边沿确定单元104临时获得的边沿位置及其附近范围执行边沿指定处理。
由于只有那些被预测为边沿的部分的附近区域可以作为处理目标来进行处理,所以,尽管应用了对图像区域中与边沿毫无关系的噪声(其它图像信息)敏感的小波变换,但可以使用不包含边沿的其他图像区域的窄范围在具有很少噪声的目标区域中更准确地检测边沿位置。
为了易于理解所述说明,所有上述处理都是在原件左边沿执行的,但是也可以在从各点开始在相反方向上进行扫描来确定每个其他边沿(原件的上边沿,右边沿,下边沿),并且可以结合处理结果,以便确定原件周围所有边沿以及原件大小等。
图20显示了通过检测四个边沿(左边沿,右边沿,上边沿,下边沿)来指定原件周围边沿的整个处理流程的示例。
图20的左侧显示了每个处理,图20的右侧显示了与每个处理相对应的加框原件图像的处理图像(表示成一个带有阴影的原件区域)。
在这个处理中,假设通过执行字符区域排除处理来排除加框原件图像A中所包含的打印区域,并且首先对垂直边沿进行检测,然后则检测水平边沿。
首先,为了检测垂直边沿,在这个示例中,以加框原件图像中的水平线所显示的长为32个象素的行为单位,从加框原件图像A中为每个长为32个象素且宽为4个象素的象素区域提取特征量(例如所述区域中包含的图像频率(或频谱),频率分布等)(S2000)。
然后,基于从图20最左侧向右进行的用于检测左边沿的扫描,根据所提取的特征量临时确定对应于左边沿的位置,提取左边沿的临时确定位置与邻近区域(邻近所述象素区域的象素区域)中的特征量,并且把基于该特征量检测到的边沿位置确定为左边沿位置(S2002)。
然后,基于从图20右侧向左转进行的用于检测右边沿的扫描,根据所提取的特征量临时确定对应于右边沿的位置,提取右边沿的临时确定位置与邻近区域(邻近所述象素区域的象素区域)中的特征量,并且把基于该特征量检测到的边沿位置确定为右边沿位置(S2004)。
然后对水平边沿进行检测。
首先,为了检测水平边沿,在这个示例中,以加框原件图像中的垂直线所显示的长为32个象素的行为单位,从加框原件图像A中为每个长为4个象素、宽为32个象素的象素区域提取特征量(例如所述区域中包含的图像频率(或频谱),频率分布等)(S2006)。
然后,基于从图20的最上侧向最下侧进行的用于检测上边沿的扫描,根据所提取的特征量临时确定对应于上边沿的位置,提取上边沿的临时确定位置与邻近区域(邻近所述象素区域的象素区域)中的特征量,并且把基于该特征量检测到的边沿位置确定为上边沿位置(S2008)。
然后,基于从图20的最下侧向最上侧进行的用于检测下边沿的扫描,根据所提取的特征量临时确定对应于下边沿的位置,提取下边沿的临时确定位置与邻近区域(邻近所述象素区域的象素区域)中的特征量,并且把基于该特征量检测到的边沿位置确定为下边沿位置(S2010)。
当执行垂直扫描来检测上边沿或下边沿的时候,希望互换上述行的象素设定以及在水平扫描中具有垂直和水平象素设定的象素区域范围。
因此,通过在四个方向执行所述处理,可以指定原件的四个边沿。
在上述说明中,假设原件具有包围的页边区域,并且背景板颜色与页边区域都是白色。然而,本发明并不局限于这种应用,也可以应用任何其他颜色。
此外,为了方便起见,在上述说明中,与原件页边区域不同的部分由填充了字符和格线的打印区域所占用。然而,对那些不包含打印区域的原件而言,则可以省略上述字符区域排除处理。
包含在操作流程中的每种功能都作为可以由CPU(中央处理器)读取的程序代码而存储在图像处理设备中配置的存储器中,例如RAM(随机存取存储器)和ROM(只读存储器)等,并且可以由通过总线与所述存储器相连的CPU来实现这些功能。
配置了上述图像处理设备的一个示例是复印机。
图21是复印机的框图。
图21中显示的复印机2100将原件C的表面(读取目标表面)放在形成在图像读取单元2102上的读取表面2104上,并且可以使用原件盖2106来从原件背面覆盖原件,由此读取图像。
图像读取单元2102通过从读取表面2104发射光来读取图像,在图像读取单元中配置的光学读取器器件2108(CCD)逐行读取反射光,将关于原件表面的读取信息转换成电信号,并且将该转换图像信息发送到一个图像处理单元2110,以便执行上述边沿检测处理。
如上所述,由于图像处理单元2110可以检测背景图像与同色原件页边之间的边界,所以可以把检测处理获得的边沿信息发送到原件大小检测单元2112以指定原件大小,由此可以将具有指定原件大小的原件C的副本从打印单元2114打印到复印机的出纸台(discharge table)2116中。
图22显示了用于上述图像处理技术的硬件的示例。
在图22中,扫描仪2200和用于图像处理的个人计算机(PC)2202通过电缆2204相互连接。
利用上述结构,诸如RAM(随机存取存储器)、ROM(只读存储器)等并未在附图中示出的PC 2202中的存储器将存储上述程序,通过总线与存储器相连的CPU执行所述程序,由此从读取自扫描仪2200的图像数据中提取原件边沿信息,并且通过电缆2204将其发送到PC 2202。
图23显示了用于上述图像处理技术的硬件的示例。
在图23中,除了扫描仪2200和个人计算机(PC)2202之外,还通过电缆2204连接了用于累积已编辑图像数据的图像数据累积单元2300以及文件编排PC(filing PC),由此形成图像文件编排系统。
利用这种结构,通过驱动PC 2202的扫描仪驱动器2304而将由扫描仪2200读取的图像数据取到PC 2202,对所取到的图像数据执行原件边沿的原件边沿检测处理2306,基于所获得的边沿信息来分割背景板图像,以最佳化图像大小,并且根据所获得的信息来旋转图像,由此执行图像编辑处理2308来校正倾斜,然后在图像数据累积单元2300中累积那些经过编辑的图像数据。
这时,允许文件编排PC 2302使用累积在图像数据累积单元2300中的图像数据的有关信息来管理图像数据,其中图像数据累积单元2300与用于每个图像数据的文件编排PC 2302的管理表格相关联,而在附图中并未示出所述管理表格。
图24显示了利用图23所示硬件结构的操作流程的示例。
首先,将通过驱动扫描仪驱动器2304而由扫描仪2200读取的图像数据取到PC 2202中(S2400)。
然后,对所述图像数据执行上面详细说明的边沿检测处理(S2402),由此得到关于原件的边沿信息(S2404)。
在编辑图像数据的过程中,确定它是不是由四个边沿包围的图像区域(S2406),并且只提取由四个边沿所包围的图像区域(原件图像)(S2408)。
然后,将经过优化的原件图像记录在图像数据累积单元2300中(S2410)。
图25显示了利用图23所示硬件结构的操作流程的示例。
首先驱动扫描仪驱动器2304,以将从打印区域200中读取的图像数据取到PC 2202中(S2500)。
然后,对所述图像数据执行上面详细说明的边沿检测处理(S2502),由此获得原件边沿信息(S2504)。
然后,举例来说,在编辑图像数据的过程中,检测所获得边沿相对图像平面上轴线(X轴或Y轴)的最小倾斜,并且旋转图像数据,以便通过校正倾斜来去除所述倾斜(S2508)。
由此将经过校正的图像原件记录在图像数据累积单元2300中(S2510)。
还可以将图24和25所示的操作流程相结合。举例来说,可以在图24所示步骤S2404与S2406中的处理之间执行步骤S2506与S2508中的处理。
因此,通过校正所述倾斜,很容易就可以执行后处理。
另外,还可以通过删除背景图像数据来去除冗余数据,并且只需要更少量的数据,从而在以更高速率执行处理的过程中只需进行数量更少的数据存储。
图26显示了利用上述两种配置由PC 2202执行的扩展处理的示例。
在图26中,所述处理是由具有“Windows”(视窗)(注册商标)环境的PC 2202来执行的,在这种环境下,通过驱动扫描仪驱动器2304从扫描仪2200中读取加框原件图像A,并且将其送至PC 2202,对图像A执行原件边沿检测处理2306,基于所获得的边沿信息,利用所获得的着色为黑色的边沿外部的背景板图像来产生黑色背景板图像E,对图像E所执行的图像识别处理2308的结果被发送到应用程序2310,并且可以从应用程序2310中检索字符识别信息(编码数据等)。
图27是产生上述黑色背景板图像E的流程图。
首先,将通过驱动扫描仪驱动器2304而由扫描仪2200读取的图像数据A送至PC 2202(S2700)。
然后,对所述图像数据执行上面详细说明的边沿检测处理(S2702),由此获得关于原件的边沿信息(S2704)。
根据图像数据来确定除了由四个边沿所包围的图像区域之外的图像区域(S2706),并且改变该除了由四个边沿所包围的图像区域(原件图像)之外的图像区域,使其灰度级表示黑色(S2708)。
最后,指定原件图像起始点(例如,图像平面上的原件图像左上角的位置),并且,例如,在从起始点开始的预定位置分割来自打印位置的图像并对所述图像进行分析,此外还基于模式识别处理等来提取所述图像中包含的字符,由此执行字符识别处理。(S2710)。
本处理的流程也可以与图25所示操作流程相结合。举例来说,可以在图27所示步骤S2704与S2706的处理之间执行步骤S2506和S2508中的处理。
这样一来,通过将背景板着色成黑色,可以产生那些与常规图像具有相同规格的图像数据,其中所述常规图像在其原件图像边沿周围具有通过具有黑色背景板的扫描仪而产生的黑色背景板图像,因此,可以允许那些用于编辑具有常规黑色背景的图像数据的设备(例如OCR处理单元)使用由本发明的图像处理设备所获得的图像数据。
上述处理中的每个(显然包括边沿检测处理)都可作为程序来分发。
在这种情况下,在将上述程序记录到记录介质上之后,可以对其进行分发,其中所述记录介质可以是软盘(注册商标)、CD-ROM、DVD等(例如,插入图22所示CD-ROM插入单元2206的CD-ROM),或者所有或部分所述程序也可以通过在公共网络等中所用的传输介质来进行分发。
获得上述分发的程序的用户可以使用读取单元和通信单元等将程序读入诸如RAM、ROM等通过总线连接的存储器,并且由通过总线与存储器相连的CPU(中央处理器)来提取程序,由此在用户的数据处理设备中实现上述图像处理,其中,所述读取单元用于读取记录在诸如计算机等的数据处理设备的记录介质中的信息,所述通信单元用于与外部设备传递数据。
如上所述,根据本发明实施例,由于在首先排除了打印区域的情况下来粗略预测处理目标,所以可以高速执行后续处理。
此外,由于可以忽略与打印区域相对应的相邻区域的特征信息偏差,所以可以容易地指定背景板与原件之间的边界。
另外,根据本发明实施例,可以将图像的单位区域设置得宽一些,并且可以基于二维快速傅立叶变换(2DFFT)中得到的特征量来临时确定原件与图像背景板之间的边界位置,以比上述单位区域更小的区域为单位来执行一维快速傅立叶变换(1DFFT),然后则执行小波变换,从而高速执行所述处理直至检测到边界,并且精确地检测边界的位置。
此外,由于上述图像处理可以通过自由地组合背景板和原件材料来加以实施,所以本发明可应用于从具有任何类型背景板的扫描仪中读取的任何原件图像。
如上所述,根据本发明实施例,可以从读取自原件与背景板的任何组合的图像数据中检测到原件边沿。
另外,可以在保持用于读取白色背景的读取设备的优点的情况下执行OCR处理,所述优点是:强反差特征,成功地读取薄纸上的数据的特征,以及没有出现背面复制的特征。
在不脱离本发明实质和主要特征的情况下,可以采用实施例的任何上述组合和不同的方面来具体实现本发明。因此,上述实施例只是本发明的示例,但本发明并不局限于这些。本发明的范围在涉及专利的权利要求中加以描述,并且不受说明书主体的限制。此外,属于涉及专利的权利要求的范围之中的任何变型和改变都包含在本发明的范围以内。

Claims (47)

1.一种边界检测方法,用于在图像数据中对任意相邻区域之中具有不同特征的区域之间的边界进行检测,该方法包括:
为图像数据的每个单位区域提取依赖于单位区域中的所有象素的特征信息;
为任意单位区域获得相邻单位区域之间的特征信息中的差别;以及
将其差别等于或高于预定水平的单位区域确定为边界。
2.一种边界检测方法,用于在图像数据中对任意相邻区域之中具有不同象素排列的区域之间的边界进行检测,该方法包括:
为图像数据的每个单位区域提取图像频率信息;
根据所提取的图像频率信息来确定代表性特征信息;
为任意单位区域获得相邻单位区域之间的代表性特征信息中的差别;以及
将其差别等于或高于预定水平的单位区域确定为边界。
3.一种边界检测方法,用于在图像数据中对任意相邻区域之中具有不同象素排列的区域之间的边界进行检测,该方法包括:
为图像数据中的每个第一单位区域提取多个预定类型的第一图像频率信息;
通过向每种所提取的第一图像频率信息添加预定的权重来获得一值,并将该值定义为代表性特征信息;
将任意第一单位区域中满足如下条件的第一单位区域临时确定为边界,即,所述第一单位区域与相邻第一单位区域的代表性特征信息之间的偏差等于或高于预定水平;
在临时确定为边界的第一单位区域以及所述第一单位区域的相邻区域中,为每个小于第一单位区域的第二单位区域提取第二图像频率信息;以及
将任意第二单位区域中满足如下条件的第二单位区域确定为边界,即,对于所述第二单位区域而言,其基于与相邻第二单位区域的第二图像频率信息之间偏差的值等于或高于预定水平。
4.一种边界检测方法,用于:在原件的正面图像与作为该原件背景的背景板一起输入的所述原件的输入图像数据中,为以相同颜色输入的部分背景板和原件边沿图像的输入图像数据检测背景板与原件之间的边界;所述方法包括:
对输入图像数据的每个第一单位区域执行傅立叶变换;
提取由傅立叶变换处理所获得的多个预定类型的第一图像频率信息;
通过向每种所提取的第一图像频率信息添加预定的权重来获得一值,并将该值定义为每个第一单位区域的代表性特征信息;
对任意第一单位区域中满足如下条件的第一单位区域执行直线近似,即,所述第一单位区域与相邻第一单位区域的代表性特征信息之间的偏差等于或高于预定水平,并且将由此获得的近似直线上的对应区域临时确定为边界;
在临时确定为边界的第一单位区域以及所述第一单位区域的相邻区域中,为每个小于第一单位区域的第二单位区域执行傅立叶变换;
提取通过傅立叶变换所获得的多个预定类型的第二图像频率信息;
通过向每种所提取的第二图像频率信息添加预定的权重来为每个第二单位区域获得一值,并将该值定义为代表性特征信息;
对所述代表性特征信息执行小波变换;
对满足如下条件的第二单位区域执行直线近似,即,对所述第二单位区域而言,其通过小波变换为每个第二单位区域所获得的值等于或高于预定水平;以及
把通过直线近似所获得的近似直线上的位置确定为边界。
5.根据权利要求4的方法,其中
在原件由背景板所包围的图像数据中,从图像数据上相互平行或正交的四个不同方向来检测边界。
6.根据权利要求1的方法,其中
首先为图像数据指定打印区域,并且将排除了打印区域的图像数据定义为用于检测边界的目标。
7.根据权利要求2的方法,其中
首先为图像数据指定打印区域,并且将排除了打印区域的图像数据定义为用于检测边界的目标。
8.根据权利要求3的方法,其中
首先为图像数据指定打印区域,并且将排除了打印区域的图像数据定义为用于检测边界的目标。
9.根据权利要求4的方法,其中
首先为输入图像数据指定打印区域,并且将排除了打印区域的输入图像数据定义为用于检测边界的目标。
10.根据权利要求1的方法,其中
所述特征信息包括高频分量、低频分量、直流分量和频率分布。
11.根据权利要求5的方法,其中
当所确定的边界形成矩形时,根据边界对该矩形中所包含的区域执行倾斜校正。
12.根据权利要求5的方法,其中
基于所确定的边界,保留邻近边界的一个区域或图像数据的原件部分,并且删除图像数据中的其他区域或背景板。
13.根据权利要求11的方法,其中
基于所确定的边界,保留邻近边界的一个区域或图像数据的原件部分,并且删除图像数据的其他区域或背景板。
14.根据权利要求5的方法,其中
基于所确定的边界,将邻近边界的一个区域或图像数据的背景板部分着色为黑色;以及
对邻近边界且不同于着色成黑色的区域的其它区域中所包含的字符进行识别。
15.根据权利要求11的方法,其中
基于所确定的边界,将邻近边界的一个区域或图像数据的背景板部分着色为黑色;以及
对邻近边界且不同于着色成黑色的区域的区域中所包含的字符进行识别。
16.一种计算机可读的便利存储介质,其存储了用于导引计算机的程序,使计算机执行在图像数据中对任意相邻区域之中具有不同特征的区域之间的边界进行检测的处理,所述程序包括如下功能:
为图像数据的每个单位区域提取依赖于单位区域中的所有象素的特征信息;
为任意单位区域获得相邻单位区域之间的特征信息中的差别;以及
将其差别等于或高于预定水平的单位区域确定为边界。
17.一种计算机可读的易用存储介质,其存储了用于导引计算机的程序,使计算机执行在图像数据中对任意相邻区域之中具有不同像素排列的区域之间的边界进行检测的处理,所述程序包括如下功能:
为图像数据的每个单位区域提取图像频率信息;
根据所提取的图像频率信息来确定代表性特征信息;
为任意单位区域获得相邻单位区域之间的代表性特征信息中的差别;以及
将其差别等于或高于预定水平的单位区域确定为边界。
18.一种计算机可读的易用存储介质,其存储了用于导引计算机的程序,使计算机执行在图像数据中对任意相邻单位区域之中具有不同象素排列的区域之间的边界进行检测的处理,所述程序包括如下功能:
为图像数据的每个第一单位区域提取多个预定类型的第一图像频率信息;
通过向每种所提取的第一图像频率信息添加预定的权重来获得一值,并将该值定义为代表性特征信息;
将任意第一单位区域中满足如下条件的第一单位区域临时确定为边界,即,所述第一单位区域与相邻第一单位区域的代表性特征信息之间的偏差等于或高于预定水平;
在临时确定为边界的第一单位区域以及所述第一单位区域的相邻区域中,为每个小于所述第一单位区域的第二单位区域提取第二图像频率信息;以及
将任意第二单位区域中满足如下条件的第二单位区域确定为边界,即,对所述第二单位区域而言,其基于与相邻第二单位区域的第二图像频率信息之间偏差的值等于或高于预定水平。
19.一种计算机可读的易用存储介质,其存储了用于导引计算机的程序,使计算机执行如下处理:在原件正面图像与作为该原件背景的背景板一起输入的所述原件的输入图像数据中,为以相同颜色输入的部分背景板和原件边沿图像的输入图像数据检测背景板与原件之间的边界;所述程序包括如下功能:
对输入图像数据的每个第一单位区域执行傅立叶变换;
提取由傅立叶变换处理所获得的多个预定类型的第一图像频率信息;
通过向每种所提取的第一图像频率信息添加预定的权重来获得一值,并将该值定义为每个第一单位区域的代表性特征信息;
对任意第一单位区域中满足如下条件的第一单位区域执行直线近似,即,所述第一单位区域与相邻第一单位区域的代表性特征信息之间的偏差等于或高于预定水平,并且将由此获得的近似直线上的对应区域临时确定为边界;
在临时确定为边界的第一单位区域以及所述第一单位区域的相邻区域中,为每个小于第一单位区域的第二单位区域执行傅立叶变换;
提取通过傅立叶变换所获得的多个预定类型的第二图像频率信息;
通过向每种所提取的第二图像频率信息添加预定的权重来为每个第二单位区域获得一值,并将该值定义为代表性特征信息;
对所述代表性特征信息执行小波变换;
对满足如下条件的第二单位区域执行直线近似,即,对所述第二单位区域而言,其通过小波变换为每个第二单位区域所获得的值等于或高于预定水平,以及
把通过直线近似所获得的近似直线上的位置确定为边界。
20.根据权利要求19的存储介质,其中
所述程序还导引计算机实现如下功能:在原件被背景板包围的图像数据中,从图像数据上相互平行或正交的四个不同方向检测边界。
21.根据权利要求16的存储介质,其中
所述程序还导引计算机实现如下功能:首先为图像数据指定打印区域,然后将排除了打印区域的图像数据定义为用于检测边界的目标。
22.根据权利要求17的存储介质,其中
所述程序还导引计算机实现如下功能:首先为图像数据指定打印区域,然后将排除了打印区域的图像数据定义为用于检测边界的目标。
23.根据权利要求18的存储介质,其中
所述程序还导引计算机实现如下功能:首先为图像数据指定打印区域,然后将排除了打印区域的图像数据定义为用于检测边界的目标。
24.根据权利要求19的存储介质,其中
所述程序还导引计算机实现如下功能:首先为输入图像数据指定打印区域,然后将排除了打印区域的输入图像数据定义为用于检测边界的目标。
25.根据权利要求16的存储介质,其中
所述特征信息包括高频分量、低频分量、直流分量和频率分布。
26.根据权利要求20的存储介质,其中
所述程序还导引计算机执行如下处理:当所确定的边界形成矩形时,根据边界对该矩形所包含的区域执行倾斜校正。
27.根据权利要求19的存储介质,其中
所述程序还导引计算机执行如下处理:基于所确定的边界,保留邻近边界的一个区域或图像数据的原件部分,并且删除图像数据的其他区域或背景板。
28.根据权利要求19的存储介质,其中
所述程序还导引计算机执行以下功能:
基于所确定的边界,将邻近边界的一个区域或是图像数据的背景板部分着色为黑色;以及
对邻近边界且不同于着色成黑色的区域的其他区域中所包含的字符进行识别。
29.一种图像处理设备,用于对图像数据中任意相邻区域之中具有不同特征的区域之间的边界进行检测,所述图像处理设备包括:
特征强调单元,用于为图像数据的每个单位区域提取依赖于单位区域中的所有象素的特征信息,以及
边界确定单元,用于为任意单位区域获得相邻单位区域之间的特征信息中的差别,以及将其差别等于或高于预定水平的单位区域确定为边界。
30.一种图像处理设备,用于对图像数据中任意相邻区域之中具有不同象素排列的区域之间的边界进行检测,所述图像处理设备包括:
特征强调单元,用于为图像数据的每个单位区域提取图像频率信息;以及
边界确定单元,用于:根据所提取的图像频率信息来确定代表性特征信息,为任意单位区域获得相邻单位区域之间的代表性特征信息中的差别,以及将其差别等于或高于预定水平的单位区域确定为边界。
31.一种图象处理设备,用于对图像数据中任意相邻区域之中具有不同象素排列的区域之间的边界进行检测,所述图像处理设备包括:
特征强调单元,用于为图像数据的每个第一单位区域提取多个预定类型的第一图像频率信息;
边界临时确定单元,用于:通过向每种所提取的第一图像频率信息添加预定的权重来获得一值,并将该值定义为代表性特征信息,并且将任意第一单位区域中满足如下条件的第一单位区域临时确定为边界,即,所述第一单位区域与相邻第一单位区域的代表性特征信息之间的偏差等于或高于预定水平;以及
边界确定单元,用于:在临时确定为边界的第一单位区域以及所述第一单位区域的相邻区域中,为每个小于第一单位区域的第二单位区域提取第二图像频率信息,并且将任意第二单位区域中满足如下条件的第二单位区域确定为边界,即,对所述第二单位区域而言,其基于与相邻第二单位区域的第二图像频率信息之间偏差的值等于或高于预定水平。
32.一种图像处理设备,用于:在原件正面图像与作为该原件背景的背景板一起输入的所述原件的输入图像数据中,为以相同颜色输入的部分背景板和原件边沿图像的输入图像数据检测背景板与原件之间的边界,所述图像处理设备包括:
特征强调单元,用于:对输入图像数据的每个第一单位区域执行傅立叶变换,并且提取由傅立叶变换处理所获得的多个预定类型的第一图像频率信息;
边界临时确定单元,用于:通过向每种所提取的第一图像频率信息添加预定的权重来为每个第一单位区域获得一值,并将该值定义为代表性特征信息;对任意第一单位区域中满足如下条件的第一单位区域执行直线近似,即,所述第一单位区域与相邻第一单位区域的代表性特征信息之间的偏差等于或高于预定水平,并将由此获得的近似直线上的对应区域临时确定为边界;以及
边界确定单元,用于:在临时确定为边界的第一单位区域以及所述第一单位区域的相邻区域中,为每个小于该第一单位区域的第二单位区域执行傅立叶变换;提取通过傅立叶变换所获得的多个预定类型的第二图像频率信息;通过向每种所提取的第二图像频率信息添加预定的权重来为每个第二单位区域获得一值,并将该值定义为代表性特征信息;对所述代表性特征信息执行小波变换;对满足如下条件的第二单位区域执行直线近似,即,对所述第二单位区域而言,其由小波变换为每个第二单位区域所获得的值等于或高于预定水平;以及,把通过直线近似所获得的近似直线上的位置确定为边界。
33.根据权利要求32的设备,其中
每个所述单元在图像数据上相互平行或正交的四个不同方向进行操作,在所述图像数据中,原件由背景板包围。
34.根据权利要求29的设备,其中
打印区域排除单元从目标中排除了图像数据的打印区域,其中在所述目标中检测到了具有不同特征的区域之间的边界。
35.根据权利要求29的设备,其中
所述特征信息包括高频分量、低频分量、直流分量和频率分布。
36.根据权利要求32的设备,还包括
图像读取单元,用于以光学方式读取原件并且产生所述原件的图像数据。
37.根据权利要求33的设备,还包括
倾斜校正单元,用于当所确定的边界形成矩形时对矩形中所包含区域的倾斜进行校正。
38.根据权利要求32的设备,还包括
图像排除单元,用于:基于所确定的边界,保留邻近边界的一个区域或图像数据的原件部分,并且删除图像数据的其他区域或背景板。
39.根据权利要求32的设备,还包括
图像着色单元,用于基于所确定的边界将邻近边界的一个区域或图像数据的背景板部分着色为黑色;以及
字符识别单元,用于对邻近边界且不同于着色成黑色的区域的其他区域中所包含的字符进行识别。
40.一种复印机,所述复印机在原件背面提供了背景板,读取关于元件的图像信息,并且输出原件副本,原件大小根据对背景板与原件之间的边界进行的检测而指定,所述复印机包括:
打印区域排除单元,用于排除图像信息的打印区域;
特征强调单元,用于为图像信息中的每个单位区域提取依赖于单位区域中的所有图像信息的特征信息;以及
边界确定单元,用于:为任意单位区域获得相邻单位区域之间的特征信息中的差别,并将其差别等于或高于预定水平且不同于打印区域的单位区域确定为边界。
41.一种复印机,所述复印机在原件背面提供了背景板,读取关于原件的图像信息,并且输出原件的副本,原件大小根据对背景板与原件之间的边界进行的检测而指定,所述复印机包括:
打印区域排除单元,用于排除图像信息的打印区域;
特征强调单元,用于为图像信息的每个单位区域提取图像频率信息;以及
边界确定单元,用于:根据所提取的图像频率信息来确定代表性特征信息,为任意单位区域获得相邻单位区域之间的代表性特征信息中的差别,以及将其差别等于或高于预定水平且不同于打印区域的单位区域确定为边界。
42.一种复印机,所述复印机在原件背面提供了背景板,读取关于原件的图像信息,并且输出原件的副本,原件大小根据对背景板与原件之间的边界进行的检测而指定,所述复印机包括:
打印区域排除单元,用于排除图像信息的打印区域;
特征强调单元,用于为图像信息的每个第一单位区域提取多个预定类型的第一图像频率信息;
边界临时确定单元,用于:通过向每种所提取的第一图像频率信息添加预定的权重来获得一值,并将该值定义为代表性特征信息;将任意第一单位区域中满足如下条件的第一单位区域临时确定为边界,即,所述第一单位区域与相邻第一单位区域的代表性特征信息之间的偏差等于或高于预定水平;以及
边界确定单元,用于:在临时确定为边界的第一单位区域以及所述第一单位区域的相邻区域中,为每个小于所述第一单位区域的第二单位区域提取第二图像频率信息;和将任意第二单位区域中满足如下条件的第二单位区域确定为边界,即,对所述第二单位区域而言,其基于与相邻第二单位区域的第二图像频率信息之间偏差的值等于或高于预定水平。
43.一种复印机,所述复印机在原件背面提供了背景板,读取关于原件的图像信息,并且输出原件的副本,原件大小根据对背景板与原件之间的边界进行的检测而指定,所述复印机包括:
打印区域排除单元,用于排除图像信息的打印区域;
特征强调单元,用于:对输入图像信息的每个第一单位区域执行傅立叶变换,并且提取由傅立叶变换处理所获得的多个预定类型的第一图像频率信息;
边界临时确定单元,用于:通过向每种所提取的第一图像频率信息添加预定的权重来为每个第一单位区域获得一值,并将该值定义为代表性特征信息;对任意第一单位区域中除去打印区域之外的并且满足如下条件的第一单位区域执行直线近似,即,所述第一单位区域与相邻第一单位区域的代表性特征信息之间的偏差等于或高于预定水平,并将由此获得的近似直线上的对应区域临时确定为边界;以及
边界确定单元,用于:在临时确定为边界的第一单位区域以及所述第一单位区域的相邻区域中,对每个小于所述第一单位区域的第二单位区域执行傅立叶变换;提取通过傅立叶变换所获得的多个预定类型的第二图像频率信息;通过向每种所提取的第二图像频率信息添加预定的权重来为每个第二单位区域获得一值,并将该值定义为代表性特征信息;对所述代表性特征信息执行小波变换;对满足如下条件的第二单位区域执行直线近似,即,对所述第二单位区域而言,其通过小波变换为每个第二单位区域所获得的值等于或高于预定水平,并且把由此获得的近似直线上的位置确定为边界。
44.根据权利要求43的复印机,其中
每个所述单元在图像信息上相互平行或正交的四个不同方向进行操作,在所述图像信息中,原件由背景板包围。
45.根据权利要求40的复印机,其中
基于灰度级值来排除图像信息的打印区域。
46.一种图像处理设备,用于对图像数据中任意相邻区域之中具有不同特征的区域之间的边界进行检测,所述图像设备包括
特征强调装置,用于为图像数据的每个单位区域提取依赖于单位区域中的所有像素的特征信息;以及
边界确定装置,用于:为任意单位区域获得相邻单位区域之间的特征信息中的差别,以及将其差别等于或高于预定水平的单位区域确定为边界。
47.一种复印机,其在原件背面提供了背景板,读取关于原件的图像信息,并且输出原件的副本,原件大小根据对背景板与原件之间的边界进行的检测而指定,所述复印机包括:
打印区域排除装置,用于排除图像信息的打印区域;
特征强调装置,用于为图像信息的每个单位区域提取依赖于单位区域中的所有图像信息的特征信息,以及
边界确定装置,用于:为任意单位区域获得相邻单位区域之间的特征信息中的差别,以及将其差别等于或高于预定水平且不同于打印区域的单位区域确定为边界。
CNB2003101239613A 2002-12-20 2003-12-19 边界检测方法、图像处理设备和复印机 Expired - Fee Related CN1324873C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP370596/2002 2002-12-20
JP2002370596A JP4067957B2 (ja) 2002-12-20 2002-12-20 境界検出方法、プログラム、及び画像処理装置

Publications (2)

Publication Number Publication Date
CN1525733A true CN1525733A (zh) 2004-09-01
CN1324873C CN1324873C (zh) 2007-07-04

Family

ID=32376342

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2003101239613A Expired - Fee Related CN1324873C (zh) 2002-12-20 2003-12-19 边界检测方法、图像处理设备和复印机

Country Status (7)

Country Link
US (1) US7539344B2 (zh)
EP (1) EP1431913B1 (zh)
JP (1) JP4067957B2 (zh)
KR (1) KR101011865B1 (zh)
CN (1) CN1324873C (zh)
DE (1) DE60311748T2 (zh)
TW (1) TWI295137B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100454312C (zh) * 2006-03-27 2009-01-21 索尼株式会社 信息处理设备、方法和程序产品
CN104575441B (zh) * 2013-10-18 2017-09-08 安纳帕斯股份有限公司 检测过渡区域的方法和利用该方法处理图像的装置
CN107181886A (zh) * 2016-03-11 2017-09-19 柯尼卡美能达株式会社 原稿读取装置、图像处理装置、原稿读取方法以及程序
CN107368829A (zh) * 2016-05-11 2017-11-21 富士通株式会社 确定输入图像中的矩形目标区域的方法和设备
CN112489129A (zh) * 2020-12-18 2021-03-12 深圳市优必选科技股份有限公司 位姿识别模型训练方法、装置、位姿识别方法和终端设备

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4598426B2 (ja) * 2004-03-30 2010-12-15 富士通株式会社 境界抽出方法、プログラムおよびこれを用いた装置
JP4885789B2 (ja) * 2007-05-14 2012-02-29 富士通株式会社 画像処理方法、画像領域検出方法、画像処理プログラム、画像領域検出プログラム、画像処理装置、および、画像領域検出装置
US8174737B2 (en) 2007-12-28 2012-05-08 Brother Kogyo Kabushiki Kaisha Image reading apparatus
US8284463B2 (en) 2007-12-28 2012-10-09 Brother Kogyo Kabushiki Kaisha Image reading apparatus
JP2009246620A (ja) * 2008-03-31 2009-10-22 Brother Ind Ltd イメージデータ作成装置
JP2009303164A (ja) 2008-06-17 2009-12-24 Canon Inc 画像読取装置及び画像読取装置の制御方法
JP5507962B2 (ja) 2009-11-05 2014-05-28 キヤノン株式会社 情報処理装置及びその制御方法、プログラム
JP5723809B2 (ja) * 2011-06-20 2015-05-27 京セラドキュメントソリューションズ株式会社 画像形成装置及び画像形成方法
TWI492166B (zh) 2012-01-12 2015-07-11 Kofax Inc 行動影像擷取和處理的系統和方法
US11321772B2 (en) 2012-01-12 2022-05-03 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
EP2810427A4 (en) * 2012-01-31 2015-10-14 Hewlett Packard Development Co CHARACTER SET FOR PRINTING PATTERNS
US10783615B2 (en) 2013-03-13 2020-09-22 Kofax, Inc. Content-based object detection, 3D reconstruction, and data extraction from digital images
US10127636B2 (en) 2013-09-27 2018-11-13 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
US11620733B2 (en) 2013-03-13 2023-04-04 Kofax, Inc. Content-based object detection, 3D reconstruction, and data extraction from digital images
US10009510B2 (en) 2014-04-29 2018-06-26 Hewlett-Packard Development Company, L.P. Scanner with a background
US10467465B2 (en) 2015-07-20 2019-11-05 Kofax, Inc. Range and/or polarity-based thresholding for improved data extraction
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
CN105868751B (zh) * 2016-03-28 2019-02-05 山东东港彩意网络科技有限公司 即开票兑奖区定位方法
WO2017208368A1 (ja) 2016-05-31 2017-12-07 株式会社Pfu 画像処理装置、画像処理方法、および、プログラム
JP6869076B2 (ja) 2017-03-30 2021-05-12 キヤノン株式会社 画像読取装置
JP2018198386A (ja) * 2017-05-24 2018-12-13 セイコーエプソン株式会社 読取装置および画像生成方法
US10803350B2 (en) * 2017-11-30 2020-10-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
CN110502205B (zh) * 2019-08-29 2023-08-01 百度在线网络技术(北京)有限公司 图片显示边缘处理方法、装置、电子设备和可读存储介质
CN111008969B (zh) * 2019-12-06 2023-07-18 浙江蓝鸽科技有限公司 黑板板书提取与智能识别方法及系统
JP2021124843A (ja) * 2020-02-03 2021-08-30 富士フイルムビジネスイノベーション株式会社 文書処理装置およびプログラム
CN113393387A (zh) * 2021-05-26 2021-09-14 房超 一种数学形态学自适应结构元素构造方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03170924A (ja) 1989-11-29 1991-07-24 Mita Ind Co Ltd 原稿サイズ検知装置
US5173788A (en) * 1990-02-07 1992-12-22 Brother Kogyo Kabushiki Kaisha Image reading device having moire depressing unit
JP2564959B2 (ja) * 1990-03-07 1996-12-18 富士ゼロックス株式会社 画像処理装置の絵文字領域識別方式
JPH06121161A (ja) 1991-05-14 1994-04-28 Fuji Xerox Co Ltd カラー画像処理装置の文字処理方式
JPH0760462B2 (ja) 1991-07-08 1995-06-28 株式会社エイ・ティ・アール通信システム研究所 画像領域分割装置
JPH05110779A (ja) 1991-10-16 1993-04-30 Fuji Xerox Co Ltd 原稿認識装置
JPH0637987A (ja) 1992-07-20 1994-02-10 Canon Inc 原稿検知装置
JPH0660182A (ja) * 1992-08-04 1994-03-04 Komatsu Ltd テクスチャ解析を用いた領域分割方法及び装置
JP3353968B2 (ja) 1992-09-25 2002-12-09 オリンパス光学工業株式会社 画像処理装置
EP0627693B1 (fr) 1993-05-05 2004-11-17 Koninklijke Philips Electronics N.V. Dispositif de segmentation d'images composées de textures
JPH07115514A (ja) 1993-10-18 1995-05-02 Canon Inc 画像読取装置
JP3147278B2 (ja) * 1994-11-09 2001-03-19 キヤノン株式会社 原稿検知方法及び装置
JP3006466B2 (ja) * 1995-09-28 2000-02-07 日本電気株式会社 文字入力装置
JPH1023191A (ja) 1996-07-08 1998-01-23 Ricoh Co Ltd 画像評価方法および画像評価装置
US5889559A (en) * 1997-01-14 1999-03-30 Intel Coproration Method and apparatus for minimally-shifted wavelet decomposition and recomposition
US5767978A (en) 1997-01-21 1998-06-16 Xerox Corporation Image segmentation system

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100454312C (zh) * 2006-03-27 2009-01-21 索尼株式会社 信息处理设备、方法和程序产品
CN104575441B (zh) * 2013-10-18 2017-09-08 安纳帕斯股份有限公司 检测过渡区域的方法和利用该方法处理图像的装置
CN107181886A (zh) * 2016-03-11 2017-09-19 柯尼卡美能达株式会社 原稿读取装置、图像处理装置、原稿读取方法以及程序
CN107368829A (zh) * 2016-05-11 2017-11-21 富士通株式会社 确定输入图像中的矩形目标区域的方法和设备
CN112489129A (zh) * 2020-12-18 2021-03-12 深圳市优必选科技股份有限公司 位姿识别模型训练方法、装置、位姿识别方法和终端设备

Also Published As

Publication number Publication date
KR20040055686A (ko) 2004-06-26
KR101011865B1 (ko) 2011-01-31
US20040170324A1 (en) 2004-09-02
EP1431913B1 (en) 2007-02-14
TW200414750A (en) 2004-08-01
JP2004201240A (ja) 2004-07-15
DE60311748T2 (de) 2007-06-14
EP1431913A1 (en) 2004-06-23
US7539344B2 (en) 2009-05-26
TWI295137B (en) 2008-03-21
CN1324873C (zh) 2007-07-04
DE60311748D1 (de) 2007-03-29
JP4067957B2 (ja) 2008-03-26

Similar Documents

Publication Publication Date Title
CN1324873C (zh) 边界检测方法、图像处理设备和复印机
CN1184796C (zh) 图象处理方法和设备以及图象处理系统
CN1136516C (zh) 图案抽取装置和方法
CN1213592C (zh) 采用自适应二值化的图象处理方法和设备
CN1168010C (zh) 信息处理设备和方法
CN1620094A (zh) 用于将图像转换为预定格式的图像处理设备及方法
CN1926575A (zh) 图像相似度计算系统、图像搜索系统、图像相似度计算方法和图像相似度计算程序
CN1167043C (zh) 图像显示设备
CN1201266C (zh) 图像处理装置和图像处理方法
CN1119767C (zh) 字符提取设备及方法,模式提取设备及方法和模式识别设备
CN1969314A (zh) 图像处理设备和方法、存储介质及其程序
CN1264121C (zh) 数字图象锐化系统
CN1675919A (zh) 摄像系统及图像处理程序
CN1993707A (zh) 图像处理方法和设备、摄像设备以及程序
CN1684492A (zh) 图像词典作成装置、编码装置、图像词典作成方法
CN1809116A (zh) 图像处理装置、方法、图像形成装置、图像读取处理装置
CN1774031A (zh) 图像处理装置及图像处理方法、以及计算机程序
CN1764228A (zh) 图像处理装置、图像形成装置、图像处理方法
CN1846232A (zh) 使用加权信息的对象姿态估计和匹配系统
CN1526115A (zh) 降低图象处理装置的更新频率的方法和系统
CN1881234A (zh) 图像处理设备、图像处理方法、计算机程序和存储介质
CN1592915A (zh) 用户可定义的图像基准点
CN1588431A (zh) 基于游程邻接图的复杂背景彩色图像中字符提取方法
CN1809117A (zh) 图像处理装置及方法、图像形成装置、图像读取处理装置
CN1805499A (zh) 图像处理装置、图像形成装置、图像读取处理装置及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070704

Termination date: 20201219

CF01 Termination of patent right due to non-payment of annual fee