CN100428271C - 图像判定方法、图像处理装置以及图像输出装置 - Google Patents

图像判定方法、图像处理装置以及图像输出装置 Download PDF

Info

Publication number
CN100428271C
CN100428271C CNB200610138833XA CN200610138833A CN100428271C CN 100428271 C CN100428271 C CN 100428271C CN B200610138833X A CNB200610138833X A CN B200610138833XA CN 200610138833 A CN200610138833 A CN 200610138833A CN 100428271 C CN100428271 C CN 100428271C
Authority
CN
China
Prior art keywords
image
character
written
hand
edge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB200610138833XA
Other languages
English (en)
Other versions
CN1936927A (zh
Inventor
木村健二
后藤牧生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of CN1936927A publication Critical patent/CN1936927A/zh
Application granted granted Critical
Publication of CN100428271C publication Critical patent/CN100428271C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18086Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

本发明提供了一种图像处理装置,其捕获包括字符或图形的图像,判定包括在所捕获的图像中的字符或图形是否是手写的,并根据判定结果向图像应用处理,该装置包括:提取关于诸如字符或图形的要判定的对象的边缘特征的部件,以及基于所提取的特征判定所述字符或图形是否是手写的部件。

Description

图像判定方法、图像处理装置以及图像输出装置
技术领域
本发明涉及一种图像判定方法,一种图像处理装置、以及一种图像输出装置,该图像判定方法判定包括在图像中的字符或图形是否是手写的,该图像处理装置根据判定对图像应用处理,而该图像输出装置输出这样处理的图像。
背景技术
存在一种公知的方法,其中对原稿图像(original image)进行光学读取,并且判定和提取包括在这样读取的图像中的手写字符和打印字符。例如,在日本专利公开特许公报No.10-162102中,通过提取笔划厚度(thickness ofstroke)、直线性、和角度来判定字符是否是手写的。而且,在日本专利公开特许公报No.11-265424和公开特许公报No.5-189604中,利用二进制化数据的形状和尺寸、以及线性来判定字符是否是手写的。而且,在日本专利公开特许公报No.7-93466中,利用二进制化数据的线性来判定字符是否是手写的。此外,在日本专利公开特许公报No.4-190473中,通过二进制化图像数据并利用它的图案来判定字符是否是手写的。
但是,在日本专利公开特许公报No.10-162102中公开的方法中,需要提取字符的笔划、线性、和角度,因此要进行判定的诸如字符的对象需要一定的大小。即,当要进行判定的字符很小时,就会有判定精度降低的问题。另外,在近些年,用来打印字符的字体也变得多样化,并且也有一种类似手写体的字符(handwriting like character)。当使用这种类型的字体时,根据传统方法,很可能会将该字符判定为手写的字符,使得出现导致判定精度减低的问题。
另外,根据在诸如日本专利公开特许公报No.11-265424的传统文档中公开的方法,无论如何需要进行二进制化,这导致了处理时间增加的问题。此外,由于二进制化还需要添加硬件,这又导致了制造成本增加的问题。
发明内容
考虑到上述情况提供了本发明,并且本发明的目的是提供一种图像判定方法,该方法能够快速判定手写字符而不需依靠诸如字符的要判定对象的种类和大小,并通过基于作为要判定对象的字符或图形的边缘特性,来判定字符或图形是否是手写的(prepared by handwriting),以及提供一种图像处理装置和一种图像输出装置。
本发明的图像判定方法的特征在于,提取包括在图像中的字符或图形的边缘浓度梯度,并基于这样提取的浓度梯度判定该字符或图形是否是手写的。
根据本发明,基于从要判定的字符或图形提取的边缘特性来判定该字符或图形是否是手写的。当提取了边缘特性时,不需要执行传统上执行的二进制化,因而缩短了处理时间。
本发明的图像判定方法的特征在于,要提取的边缘浓度梯度是在与边缘交叉(crossing the edge)的方向上浓度梯度(density gradient)的大小。
根据本发明,提取在与边缘交叉的方向上的浓度梯度的大小作为边缘浓度梯度。因而,通过顺序地获取在相邻像素之间的浓度差,获取边缘部分的浓度梯度的大小,并通过简单的计算来提取边缘浓度梯度。
本发明的图像判定方法累计(summarize)具有所提取的边缘的相同浓度梯度的边缘的出现次数(incidence),并基于累计结果来判定要判定的字符或图形是否是手写的。
根据本发明,累计具有相同浓度梯度的边缘的出现次数,并基于这样计算的出现次数来判定要判定的字符或图形是否是手写的。从而,可以根据所捕获的图像的种类来判定字符或图形。
本发明的图像判定方法的特征在于,当设定浓度梯度的大小的阈值并且所提取的浓度梯度的大小小于该阈值时,判定要判定的对象是否是手写的。
根据本发明,当所提取的浓度梯度的大小小于所设定的阈值时,就判定要判定的字符或图形是手写的。这使得可以通过简单的计算来判定手写字符或图形。
本发明的图像处理装置包括用于获取图像的获取部分和控制器,该控制器被设计来提取包括在所获取的图像中的字符或图形的边缘浓度梯度、基于所提取的浓度梯度判定字符或图形是否是手写的、以及根据判定结果对图像应用处理。
根据本发明,基于从要判定的字符或图形中提取的边缘浓度梯度来判定字符或图形是否是手写的。从而,当提取了边缘浓度梯度时,不需像传统上进行的那样执行二进制化,从而能够简化硬件结构并缩短处理时间。
本发明的图像处理装置的特征在于,要提取的边缘浓度梯度是在与边缘交叉的方向上的浓度梯度的大小(magnitude)。
根据本发明,提取在与边缘交叉的方向上的浓度梯度的大小作为边缘浓度梯度。因此,通过顺序地获取在相邻像素之间的浓度差,获取边缘部分的浓度梯度的大小,并通过简单的计算来提取边缘浓度梯度。
根据本发明的图像处理装置的特征在于,控制器从所提取的边缘累计相同浓度梯度的边缘的出现次数,并基于累计结果来判定要判定的字符或图形是否是手写的。
根据本发明,累计具有相同浓度梯度的边缘的出现次数,并基于累计结果来判定要判定的字符或图形是否是手写的。所以,使得能够根据所获取的图像的种类来进行判定。
根据本发明的图像处理装置包括存储对于浓度梯度的大小设定的阈值的存储部分,其特征在于比较所提取的浓度梯度的大小与所述阈值,并且当浓度梯度的大小小于所述阈值时,就判定要判定的对象是手写的。
根据本发明,当所提取的浓度梯度的大小小于设定的阈值时,判定要判定的字符或图形是手写的。因此,可以通过简单的计算来判定字符或图形。
本发明的图型处理装置的特征在于,当所述控制器判定字符或图形不是手写的时,向这样判定的字符或图形应用边缘增强处理。
根据本发明,当判定字符或图形不是手写的时,应用边缘增强处理。因此,诸如活字字符(typed character)的打印字符的部分变得容易阅读。
本发明的图像处理装置的特征在于,当所述控制器判定字符或图形是手写的时,就改变这样判定的字符或图形的像素值。
根据本发明,当判定字符或图形是手写的时,就改变这样判定的字符或图形的像素值。因此,例如,通过将所述像素值改变为与该图像背景部分相同颜色的像素值,可以删除手写部分。此外,通过将所述像素值改变为与所述背景部分完全不同颜色的像素值,可以增强手写部分。
本发明的图像处理装置的特征在于,当所述控制器判定要判定的对象是手写的时,就对要判定的对象执行字符识别(character recognition),并且用字符识别部件识别的字符取代要判定的对象。
根据本发明,当判定要判定的对象是手写的时,就执行字符识别,并且用这样识别的字符取代要判定的对象。因此,用活字字符取代了手写的字符。
根据本发明的图像输出装置包括根据任何一个前述发明的图像处理装置,并且所述图像输出装置输出由所述图像处理装置处理的图像。
根据本发明,提供了一种输出处理图像的输出装置,从而本发明可以应用于扫描仪、打印机以及数字多功能机。
在本发明中,基于从要判定的字符或图形提取的边缘浓度梯度来判定该字符或图形是否是手写的。因此,当提取了边缘浓度梯度时,不需要执行传统上执行的二进制化,从而缩短了处理时间。此外,还能够简化硬件结构,因此可以在压低设备制造成本的同时来判定手写。
在本发明中,提取在与边缘交叉的方向上的浓度梯度的大小作为边缘浓度梯度。因而,通过顺序地获取在相邻像素之间的浓度差,获取边缘部分的浓度梯度的大小,并通过简单的计算来提取边缘浓度梯度。而且,根据其中使用边缘的浓度梯度的本发明,即使对于具有比手写字符还稀(thinner)的浓度的打印字符的原稿图像也能够进行判定。并且,与提取诸如笔划厚度、线性以及角度的字符的浓度梯度量(feature amount)的传统方法不同,也可以对相对较小的字符进行判定,并且能够提高判定精度。
在本发明中,从所提取的边缘中累计具有相同浓度梯度的边缘的出现次数,并且基于累计结果来判定要判定的字符或图形是否是手写的。因此,能够根据获取图像的种类进行判定。例如,当用户通过手写在主要由活字字符形成的原稿上涂写(scribble),则增加对活字字符部分的边缘的提取次数,并且减少对手写字符部分的边缘的提取次数。将这种信息并入判定条件中,可以改善判定精度。
在本发明中,当所提取的浓度梯度的大小小于设定阈值时,就判定要判定的字符或图形是手写的。因此,可以通过简单的计算来判定字符或图形,并能够缩短处理时间。
在本发明中,当判定字符或图形不是手写的时,应用边缘增强处理。因此,诸如活字字符的打印字符的部分变得容易阅读。
在本发明中,当判定字符或图形是手写的时,就改变所判定的字符或图形的像素值。例如,通过将所述像素值改变为与图像背景部分相同颜色的像素值,可以删除手写部分。而且,通过将所述像素值改变为与背景部分完全不同颜色的像素值,可以增强手写部分。
在本发明中,当判定要判定的对象是手写的时,就执行字符识别,并且用所识别的字符取代要判定的对象。因此,可以用活字字符来取代手写字符等。
在本发明中,提供了输出处理图像的输出装置。因此,本发明可以应用于扫描仪、打印机以及数字多功能机。
通过下面参考附图进行的详细描述,并发明的上述和其它目的和特征将变得更加完全清楚。
附图说明
图1是解释根据本发明的图像输出装置的内部结构的框图;
图2是示出由图像处理装置处理的图像的示例的示意图;
图3A和3B是解释在非手写图像和手写图像中看到的边缘的说明图;
图4是解释浓度梯度的定义的说明图;
图5是解释锐度(acutance)的定义的说明图;
图6是示出图像处理装置的内部结构的框图;
图7是解释由图像输出装置执行的处理过程的流程图;
图8是解释边缘分析处理的处理过程的流程图;
图9A和9B是解释浓度梯度的计算示例的说明图;
图10A和10B是解释浓度梯度的计算示例的说明图;
图11是示出做成(prepare)柱形图的示例的示意图;
图12A到12D是示意地示出边缘的提取结果的说明图;
图13是通过从图2中所示的图像中提取边缘而获取的图像的示意图;
图14是基于判定结果进行图像处理的图像的示意图;
图15是解释根据这个实施例的由图像输出装置执行的处理过程的流程图;以及
图16是解释根据这个实施例的由图像输出装置执行的处理过程的流程图。
具体实施方式
以下将根据示出本发明的实施例的附图对本发明进行具体解释。
实施例1
图1是解释根据本发明的图像输出装置的内部结构的框图。本发明的图像输出装置包括诸如控制器1、图像输入部分2、图像处理部分3、图像输出部分4、存储部分5、以及操作部分6的硬件。控制器1由控制前述硬件的CPU和临时保存控制所需的数据等的RAM组成。存储部分5是例如非易失性半导体存储器,并且在先存储用于控制每个硬件部分的控制程序和用于实现本发明的图像判定方法的判定程序。控制器1通过所需从存储部分5装载控制程序和判定程序等,并执行这样装载的控制程序和判定程序,使得整个装置作为根据本发明的图像输出装置来操作。此外,操作部分6包括用于从用户接收操作命令的每种类型的操作按钮。
图像输入部分2是光学读取原稿图像的读取装置,并且包括向用于读取的原稿发射光的光源和诸如CCD(电荷耦合器件)的图像传感器。在图像输入部分2中,来自设定在指定读取位置中的原稿的反射的光图像形成在前述图像传感器上,并输出RGB(R:红、G:绿、B:蓝)的模拟电信号。由图像输入部分2输出的模拟电信号输入到图线处理部分3。
图像处理部分3基于通过图像输入部分2输入的模拟电信号来生成数字格式的图像数据,并在根据图像种类执行处理之后,生成用于输出的图像数据。这样生成的图像数据被输出到图像输出部分4。在这个实施例中,图像处理部分3判定包括在所输入的图像中的字符或图形是否是手写的,并根据判定结果执行图像处理。
例如,当判定字符或图形是手写的时,能够通过删除该字符或图形而删除涂写(scribble)等,并且只剩下包括活字字符的区域。而且,当判定字符或图形是手写的时,通过改变组成该字符和图形的像素值可以增强手写部分。并且,当判定字符或图形是手写的时,通过执行字符识别并用所识别的字符取代要判定的对象,可以用活字字符取代手写字符。同时,当判定字符或图形不是手写的时,对该字符或图形应用边缘增强处理,从而更容易观看输出图像。
应当注意到手写的字符或图形通常被称为手写图像,而诸如活字字符和矢量图像(vector image)的不是手写的字符或图形通常被称为非手写图像。
图像输出部分4基于从图像处理部分3输出的图像数据在诸如纸张或OHP胶片的薄片上形成图像。因此,图像输出部分4包括:感光鼓(photoreceptor drum);充电器,用于将所述感光鼓充电到预定电位;激光写入装置,用于根据从外部接收的图像数据、通过发射激光束在感光辊上生成静电潜像;显影单元,向在感光鼓的表面上形成的静电潜像提供调色剂以便对其进行显像(visualize);以及转印单元(未示出),其将形成在感光鼓的表面上的调色剂图像转印到纸张上,并且通过电子照相系统(electrophotographicsystem)在薄片上形成用户希望的图像。应当注意到除了由其中使用了激光写入装置的电子照相系统形成图像以外,还可以由喷墨打印系统、热转印系统、以及升华(sublimation)系统等来形成图像。
在这个实施例中,图像输入部分2被构成为对原稿图像进行光学读取的读取部件,而图像输出部分4被构成为在纸张上形成图像的成像部件。但是,图像输入部分2也可以被构成为从外部接收图像数据的接收器,而图像输出部分4也可以被构成为将由图像处理部分3处理之后的图像数据传送到外部的传送器。
此后将具体解释在图像处理部分3中执行的处理。
图2是示出要由图像处理装置3处理的图像的示例的示意图。图2中所示的图像包括被表示为“らくがき”(涂鸦)的手写字符作为手写图像,并且包括形成多行的活字字符作为非手写图像。因此,当手写字符被添加到主要由活字字符组成的原稿中时,在整个图像中由手写图像占据的比率与由非手写图像占据的比率之间产生了很大的差别。从而,这样的特征可以是用于判定和提取手写图像和非手写图像的一个判定基准。
此外,当比较手写图像和非手写图像时,在边缘的浓度梯度上可以看到很大差别。这里,边缘的浓度梯度表示在与边缘交叉的方向上扫描图像时浓度程度的变化。图3A和3B是解释在非手写图像和手写图像中看到的边缘的说明图。图3A是非手写图像的说明图,并且形成活字字符“2”作为非手写图像的一个示例。当通过按照图中箭头所示方向扫描图像来检查浓度变化时,就获得了如右侧所示的表示浓度变化的图形。即,当用横坐标轴表示图像上的距离,用纵坐标轴表示浓度时,浓度变化表现为在扫描起点由于处于活字字符部分之外而浓度较低,而在到达(closer to)活字字符的边缘部分的点,浓度突然变得较高。浓度在活字字符部分保持在较高状态,而在到达边缘的另一侧的部分时突然变得较低。这样,对于浓度而言,诸如活字字符的非手写图像具有陡峭的边缘。
同时,图3B是手写图像的说明图,而字符“ら”被表示为手写图像的示例。当通过按照箭头所示方向扫描图像来检查浓度变化时,获得了示出了如在非手写图像的情况下相同的浓度变化的图形。类似于非手写图像的情况,在手写图像的边缘部分可以看到浓度变化。但是,与非手写图像的情况相比,浓度的变化变得相对缓和。
在这个实施例中,引入了将在下文中解释的浓度梯度,用于在数量上处置边缘部分的浓度变化的程度。图4是解释浓度梯度的定义的说明图。当将边缘起点的坐标(像素值)定为xa、将边缘终点的坐标定为xb、以及在这两点之间的浓度差定为fD时,浓度梯度G被定义为fD/|xa-xb|。虽然稍后将详细描述浓度梯度G的计算方法,但是通过检测边缘起点和起点的浓度、以及边缘终点和终点的浓度,可以计算浓度梯度G。因此,通过相当简单的计算可以提取边缘特征。
此外,可以引入以下将解释的锐度。图5是解释锐度定义的说明图。锐度是通过按边缘的灰度级对浓度平均的均方值进行归一化而获得的值,并且由图5中的公式定义。这里,n是组成边缘的坐标(像素)的数量,Δx表示相邻坐标的距离,Δfi表示在相邻坐标之间的浓度差。当与前述浓度梯度G的计算方法相比较时,过程变得稍微复杂,但是判定也可以基于这样的锐度来执行。
图6是示出图像处理部分3的内部结构的框图。图像处理部分3包括输入缓冲器31、边缘分析处理部分32、区域判定部分33、手写图像处理部分34、非手写图像处理部分35、图像合成部分36以及输出缓冲器37。
输入缓冲器31临时保存从图像输入部分2输出的图像数据。由输入缓冲器31保存的图像数据被发送到边缘分析处理部分32和图像合成部分36。边缘分析处理部分32执行输入图像数据的边缘分析。具体来讲,边缘分析处理部分32基于这样输入的图像数据扫描整个图像,并顺序提取包括在该图像中的字符或图形的边缘的浓度梯度。
区域判定部分33判断基于边缘分析处理部分32的分析结果由提取的边缘所围绕的区域是否是手写的或非手写的。手写图像处理部分34向手写图像应用适当的处理,并将其发送到图像合成部分36。而非手写图像处理部分35向非手写图像应用适当的处理,并将其发送到图像合成部分36。图像合成部分36通过利用手写图像处理部分34处理和非手写图像处理部分35处理的图像来合成图像为原始图像。通过图像合成获得的图像数据被发送到输出缓冲器37,并由该输出缓冲器27保存。
以下,将解释图像输出装置执行的处理过程。
图7是解释由图像输出装置执行的处理过程的流程图。图像输出装置首先使图像输入部分2读取原稿(original)(步骤S11)。读取原稿获得的图像被输出到图像处理部分3,并存储在图象处理部分3的输入缓冲器31(步骤S12)。
接下来,图像处理部分3设定用于扫描存储在输入缓冲器31中的整个图像的起点(步骤S13)。例如,图像左上角的像素可以被设定为起点。然后,从设定的起点开始顺序扫描相邻像素,并且执行边缘分析处理(步骤S14)。
图8是解释边缘分析处理的处理过程的流程图。在执行边缘分析处理时,首先图像处理部分3将该图中未示出的计数器的值设定在i=1(步骤S21),并计算在两个相邻像素之间的浓度差Δfi=|f(xi+1)-f(xi)|(步骤S22)。这里,xi和xi+1分别表示第i个和第i+1个像素,f(xi)和f(xi+1)分别表示像素xi和xi+1的浓度。
接下来,图像处理部分3判定浓度差Δfi是否满足条件Δfi>ε1(步骤S23)。这里,ε1是常数,并且设定为适当的值,用于检测边缘上升(或下降)的起点。通过设定ε1合适的值,能够防止图像的检测噪声等。当判定这样计算的浓度差Δfi的值等于或小于ε1时(S23:否),图像处理部分3增加计数器的值i(步骤S24),并判定分析中的像素是否是终点(步骤S25)。例如,通过判定分析中的像素是否对应于图像右端的像素来判定其是否是终点。当判定为终点时(S25:是),则这个流程的处理结束,并且处理返回图7所示的流程。当判定不是终点时(S25:否),图像处理部分3将处理返回步骤S22。
当判定在步骤S22中计算的浓度差Δfi大于ε1时(S23:是),则判定其是边缘上升(或下降)的起点,并且将像素值xi和浓度值f(xi)分别被xa和fa代替,并保存在其中(步骤S26)。
接下来,图像处理部分3增加计数器的值i(步骤S27),并计算在相邻像素之间的浓度差Δfi=|f(xi+1)-f(xi)|(步骤S28)。然后,图像处理部分3判定所计算的浓度差Δfi是否满足条件Δfi<ε2(步骤S29),以判定其是否是边缘上升(或下降)的终点(步骤S29)。这里,ε2是常数,并且设定为适当的值,用于检测边缘上升(或下降)的终点。
当判定所计算的浓度差值Δfi小于ε2时(S29:是),就判定边缘上升(或下降)的终点,并且将像素值xi和浓度值f(xi)分别被xb和fb代替,并保存(步骤S35)。然后,图像处理部分3利用在步骤S35中保存的值xb和fb计算浓度梯度G=|(fb-fa)/(xb-xa)|(步骤S36),并存储所计算的浓度梯度G的值(步骤S37)。
接下来,图像处理部分3判定分析中的像素是否是终点(步骤S38)。例如,通过判定分析中的像素是否对应图像右端的像素来判定其是否是终点。当判定为终点时(S38:是),则这个流程的处理结束,并且处理返回图7所示的流程。而且,当判定不是终点时(S38:否),图像处理部分3增加计数器的值i(S38:否),并将处理返回步骤S22。
同时,当判定在步骤S28中计算的浓度差Δfi大于2时(S29:否),增加计数器的值i(步骤S30),并且图像处理部分3判定分析中的像素是否是终点(步骤S31)。例如,通过判定分析中的像素是否对应图像右端的像素来判定其是否是终点。当判定不是终点时(S31:否),即,当分析中的像素位于边缘上升(或下降)的中途时,并且当判定分析应当继续时,图像处理部分3将处理返回步骤S28。当判定为终点时(S31:是),即,当边缘上升(或下降)的中途变为终点时,像素值xi和浓度值f(xi)被分别被xb和fb代替,并由图像处理部分3保存(步骤S32)。然后,在步骤S26中保存的值xa和fa以及在步骤S32中保存的值xb和fb被用来计算浓度梯度G=|(fb-fa)/(xb-xa)|(步骤S33),并存储这样计算的浓度梯度G的值(步骤S34)。在存储浓度梯度G的值之后,图像处理部分3将处理返回图7所示流程。
图9A和9B以及图10A和10B是浓度梯度G的计算示例的说明图。当扫描图像时,获得如图9A所示的浓度分布,并且对于每个像素xi的浓度f(xi)变为如图9B所示的值的情况给出了解释。如前所述,当关系被设定为ε1=ε2=5时,在这个区域中xi=10为边缘的起点,而xi=14为边缘的终点。由于起点像素xa的浓度为20,而终点像素xb的浓度为118,所以,浓度梯度G的大小为(118-20)/(14-10)~25。
类似地,当扫描图像时,获得如图10A所示的浓度分布,并且对于每个像素xi的浓度f(xi)变为如图10B所示的值的情况给出了解释。如前所述,当关系被设定为ε1=ε2=5时,在这个区域中xi=11为边缘的起点,而xi=15为边缘的终点。因此,由于起点像素xa的浓度为24,而终点像素xb的浓度为203,浓度梯度G的大小为(203-24)/(15-11)~45。
在如图7所示的流程图的步骤S14中执行边缘分析处理之后,图像处理部分3判定对于整个图像边缘分析是否结束(步骤S15)。当通过将图像左上角设定为起点执行分析时,图像右下角可以是分析的终点,并且通过判定分析中的像素是否对应图像的右下角,可以判定整个图像的分析是否结束。当判定分析没有结束时(S15:否),处理返回步骤S13,并且起点被设定为下一个分析位置,以继续边缘分析处理(S14)。
当判定整个图像的分析结束时(S15:是),图像处理部分3做成关于由边缘分析处理提取的浓度梯度的大小的柱形图(步骤S16)。图11是示出要做成的柱形图的示例的示意图。用横坐标轴表示浓度梯度的大小,用纵坐标轴表示对于每个浓度梯度的大小的出现频率。当柱形图是通过捕获部分涂写原稿的图像并执行边缘分析而做成的时,则获得图11所示的由第一分布和第二分布形成的柱形图。第一分布在浓度梯度的大小相对较小的地方具有出现频率的高峰(peak),而第二分布在浓度梯度的大小相对较大的地方具有出现频率的高峰。具体来讲,当考虑以下两点时,即在诸如涂写的手写部分和活字字符之间可以看到在边缘的浓度梯度的大小中的差别的点,以及当涂写出现在原稿的一部分中时形成所述涂写的边缘的比率变得更小的点,则可以判定前述第一分布是通过检测手写部分的边缘而获得的分布,而第二分布是通过检测活字字符的边缘而获得的分布。
因此,通过基于这样做成的柱形图设定浓度梯度的范围(步骤S17),以及提取具有在这样设定的范围中的浓度梯度的边缘(步骤S18),变得能够区别和提取手写图像的边缘和非手写图像的边缘。根据如图11所示的示例,例如,通过在浓度梯度的大小从35到60的范围内提取边缘,可以提取非手写图像的边缘,并且通过提取在浓度梯度的大小从10到32的边缘,可以提取手写图像的边缘。图12A到12D是示意地示出边缘的提取结果的说明图。作为如图12A所示的图形的边缘的分析结果,当提取具有如图12B所示的浓度梯度的大小的边缘时,这个边缘可以被判定为非手写图像的边缘。同时,作为如图12C所示的图形的边缘的分析结果,当提取具有如图12D所示的浓度梯度的大小的边缘时,这个边缘可以被判定为手写图像的边缘。
接下来,图像处理部分3向由所提取的边缘围绕的区域应用预定处理(步骤S19)。例如,关于判定为手写图像的区域,通过将在该区域中的像素的像素值改变为对应于背景颜色的像素值,可以删除手写图像。而且,关于判定为非手写图像的区域,通过执行边缘增强处理,可以使输出图像容易被观看。图13示出通过从如图2所示的图像提取边缘而获得的图像的示意图,而图14示出基于判定结果应用图像处理的图像的示意图。
应当注意到在判定要判定的对象是否是手写之后由图像处理部分3执行的处理可以被预先定义在装置中或由用户通过操作部分6选择。
控制器1从输出缓冲器38取出由图像处理部分3处理的图像数据,将其传送到图像输出部分4,并执行输出处理(步骤S20)。
实施例2
实施例1被构建成通过分析整个图像并做成关于边缘浓度梯度的大小的柱形图来分离和提取手写图像和非手写图像。但是,也可以构建成预先设为浓度梯度的大小的阈值,而将具有比这个阈值小的浓度梯度的边缘判定为手写图像的边缘,并将具有大于该阈值的浓度梯度的边缘判定为非手写图像的边缘。应当注意到根据这个实施例的图像输出装置的硬件结构与实施例1中所示的图像输出装置的结构相同。
图15是解释由根据这个实施例的图像输出装置执行的处理过程的流程图。图像输出装置首先由图像输入部分2读取原稿(步骤S41)。通过读取原稿而捕获的图像被输出到图像处理部分3,并存储在图像处理部分3的输入缓冲器31(步骤S42)。
接下来,图像处理部分3设定判定区域(步骤S43)。这里,判定区域是指判定包括在该区域中的字符、图形或它们的一部分是否是手写的区域。可以选择M×N个像素(M和N是1或大于1的整数,但是M=N≠1)的区域作为判定区域。这里,可以使用给定值作为M和N的值,或者可以根据已经读取的原稿来设定适当的值。
接下来,图像处理部分3对于所设定的判定区域执行边缘分析处理(步骤S44)。边缘分析处理的过程与在实施例1中解释的完全相同。在执行边缘分析处理之后,图像处理部分3判定所设定的判定区域是否是手写区域(步骤S45)。如下执行所述判定。在边缘分析处理中,提取包括在判定区域中的字符或图形的边缘,并且计算这样提取的边缘的浓度梯度。手写的字符和图形具有浓度梯度相对缓和的性质,而活字字符具有浓度梯度相对陡峭的性质。从而,通过对浓度梯度提供阈值可以对它们进行判定。即,作为边缘分析处理的分析结果,当判定具有大于该阈值的浓度梯度的边缘包括在该判定区域中时,就可以判定该判定区域是非手写区域。而当通过边缘分析处理提取边缘时,并且当不包括具有大于该阈值的浓度梯度的边缘时,就可以判定该判定区域是手写区域。
当判定该判定区域是手写区域时(S45:是),图像处理部分3删除包括在手写区域中的字符和图形(步骤S46)。例如,通过将构成包括在手写区域中的字符和图形的像素的像素值改变为对应于背景的像素值,可以将它们删除。
当包括在手写区域中字符和图形被删除时(S46),或者当在步骤S45中判定所述判定区域不是手写区域时(S45:否),图像处理部分3判定对于整个图像判定是否结束(步骤S47)。当所述判定从图像的左上角顺序执行并最终执行到右下角时,通过判定图像右下角的像素是否包括在步骤S43设定的判定区域中,可以判定对整个图像的判定是否结束。当判定对整个图像的判定没有结束时(S47:否),图像处理部分3将处理返回步骤S43。而当判定对整个图像的判定结束时(S47:是),图像处理部分3将处理的图像数据输出到图像输出部分4。图像输出部分4基于从图像处理部分3输出的图像数据执行输出处理(步骤S48)。
实施例3
实施例2被构建成删除包括在手写区域中的字符和图形,并且不处理包括在非手写区域中的字符和图形。但是,也可以构建成由用户选择对每个区域要执行的处理。注意根据这个实施例的图像输出装置的硬件结构与实施例1中所示的图像输出装置的结构相同。
图16解释根据这个实施例由图像输出装置执行的过程的流程图。图像输出装置首先通过操作部分6接收处理内容的设定(步骤S51)。例如,应当构建成在操作部分6中提供对应于处理内容的操作按钮,并且当按下和操作这个操作按钮时,就接收到处理内容的设定。还可以构建成当以预定次序按下和操作提供在操作部分6中的操作按钮时,就设定特殊的处理内容。或者,可以构建成在操作部分6上装有触摸面板的液晶显示器,以便在接收到处理内容的设定、并且通过触摸面板接收到选择时,显示可以被设定的处理内容。
接下来,图像输出装置使图像输入部分2读取原稿(步骤S52),并在图像处理部分3的输入缓冲器31中存储捕获的图像(步骤S53)。
接下来,图像处理部分3设定判定区域(步骤S54),并对这样设定的判定区域执行边缘分析处理(步骤S55)。该判定区域是由M×N个像素(M和N是1或大于1的整数,但是M=N≠1)组成的区域,并且还是用于判定包括在该区域中的字符、图形、或它们的一部分是否是手写的区域。该边缘分析处理与在实施例1中解释的完全一样。在执行边缘分析处理之后,图像处理部分3判定这样设定的判定区域是否是手写区域(步骤S56)。所述判定可以用实施例2中的相同方式执行。
当判定该判定区域是手写区域时(S56:是),图像处理部分3执行对包括在手写区域中的字符和图形设定的处理(步骤S57)。例如,当在步骤S51中设定删除字符和图形时,就通过将组成包括在手写区域中的字符和图形的像素值改变为对应于背景的像素值来删除它们。
同时,当判定该判定区域不是手写区域时(S56:否),图像处理部分3执行对包括在非手写区域中的字符和图形设定的处理(步骤S58)。例如,当在步骤S51中设定活字字符部分的边缘增强处理时,此时就将边缘增强处理应用到该判定区域。
在向每个区域应用处理之后,图像处理部分3判定对整个图像的判定是否结束(步骤S59)。当从图像的左上角顺序判定该图像、并最终判定到图像的右下角时,通过判定图像右下角的图像是否包括在步骤S54设定的判定区域中,可以判定对整个图像的判定是否结束。当判定对整个图像的判定没有结束时(S59:否),图像处理部分3将处理返回到步骤S54。而当判定对整个图像的判定结束时(S59:是),图像处理部分3将处理图像输出到图像输出部分4。图像输出部分4基于从图像处理部分3输出的图像数据执行输出处理(步骤S60)。

Claims (10)

1.一种图像判定方法,该方法包括以下步骤:
提取包括在图像中的字符或图形的边缘浓度梯度;和
基于这样提取的浓度梯度来判定所述字符或图形是否是手写的。
2.根据权利要求1的图像判定方法,还包括以下步骤:
从提取的边缘中累积具有相同浓度梯度的边缘的出现次数;和
基于累积结果来判定要判定的字符或图形是否是手写的。
3.根据权利要求1的图像判定方法,其中,
对所述浓度梯度的大小设定一个阈值,并且当这样提取的浓度梯度的大小小于该阈值时,就判定要判定的对象是手写的。
4.一种图像处理装置,其包括:
用于获取图像的部件;
用于提取包括在所获取的图像中的字符或图形的边缘浓度梯度的部件;
用于基于所提取的浓度梯度来判定所述字符或图形是否是手写的部件;以及
用于根据判定的结果向图像施加处理的部件。
5.根据权利要求4的图像处理装置,还包括用于从提取的边缘中累积具有相同浓度梯度的边缘的出现次数的部件;其中,
基于累积的结果来判定要判定的字符或图形是否是手写的。
6.根据权利要求4的图像处理装置,还包括用于存储浓度梯度的大小的阈值的部件;其中,
当所提取的浓度梯度的大小小于该阈值时,就判定要判定的对象是手写的。
7.根据权利要求4的图像处理装置,还包括用于当判定所述字符或图形不是手写的时,将边缘增强处理应用到所判定的字符或图形的部件。
8.根据权利要求4的图像处理装置,还包括用于当判定所述字符或图形不是手写的时,改变所判定的字符或图形的像素值的部件。
9.根据权利要求4的图像处理装置,还包括用于当判定要判定的对象是手写的时,对要判定的对象执行字符识别的部件;以及
用于用所识别的字符取代要判定的对象的部件。
10.一种图像输出装置,其包括:
根据权利要求4的图像处理装置;和
用于输出由图像处理装置处理的图像的部件。
CNB200610138833XA 2005-09-22 2006-09-19 图像判定方法、图像处理装置以及图像输出装置 Expired - Fee Related CN100428271C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP276334/05 2005-09-22
JP2005276334A JP4420877B2 (ja) 2005-09-22 2005-09-22 画像処理方法、画像処理装置、及び画像出力装置

Publications (2)

Publication Number Publication Date
CN1936927A CN1936927A (zh) 2007-03-28
CN100428271C true CN100428271C (zh) 2008-10-22

Family

ID=37954422

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB200610138833XA Expired - Fee Related CN100428271C (zh) 2005-09-22 2006-09-19 图像判定方法、图像处理装置以及图像输出装置

Country Status (3)

Country Link
US (1) US7991231B2 (zh)
JP (1) JP4420877B2 (zh)
CN (1) CN100428271C (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102810155B (zh) * 2011-05-31 2015-04-15 富士通株式会社 用于从图像中提取文本笔划图像的方法和装置
DE102011111786A1 (de) 2011-09-01 2013-03-07 Ovd Kinegram Ag Verfahren und Vorrichtung zum Verbinden von Transfer- oder Laminierfolienbahnen
KR101905426B1 (ko) * 2012-01-11 2018-10-10 한국전자통신연구원 자연영상에서 추출된 문자 정보의 순서화 방법 및 시스템
JP2016015115A (ja) * 2014-06-09 2016-01-28 株式会社リコー 情報処理装置、情報処理方法、及び記録媒体
JP7282314B2 (ja) * 2019-08-29 2023-05-29 京セラドキュメントソリューションズ株式会社 画像処理装置、画像処理方法及び画像処理プログラム
JP7414554B2 (ja) * 2020-01-27 2024-01-16 シャープ株式会社 情報処理装置、制御方法及びプログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05189604A (ja) * 1992-01-14 1993-07-30 Toshiba Corp 光学的文字読取装置
JPH0793466A (ja) * 1993-09-22 1995-04-07 Toshiba Corp 文字種判別装置およびその判別方法
JPH10162102A (ja) * 1996-12-03 1998-06-19 Ricoh Co Ltd 文字認識装置
JPH11265424A (ja) * 1998-03-16 1999-09-28 Ricoh Co Ltd 文字認識方法、装置および記録媒体
CN1372226A (zh) * 2001-02-21 2002-10-02 西北工业大学 一种检测图象边缘的独立边界自增强方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3038344B2 (ja) * 1987-02-24 2000-05-08 株式会社東芝 郵便物読取処理装置
JP2713911B2 (ja) * 1987-07-08 1998-02-16 株式会社東芝 郵便物処理装置
US5872864A (en) 1992-09-25 1999-02-16 Olympus Optical Co., Ltd. Image processing apparatus for performing adaptive data processing in accordance with kind of image
JP3353968B2 (ja) 1992-09-25 2002-12-09 オリンパス光学工業株式会社 画像処理装置
JPH0766977A (ja) * 1993-08-24 1995-03-10 Minolta Co Ltd 画像処理装置
US5682439A (en) * 1995-08-07 1997-10-28 Apple Computer, Inc. Boxed input correction system and method for pen based computer systems
US6445831B1 (en) * 1998-02-10 2002-09-03 Fuji Photo Film Co., Ltd. Image processing method and apparatus
US20020176619A1 (en) * 1998-06-29 2002-11-28 Love Patrick B. Systems and methods for analyzing two-dimensional images
US6757424B2 (en) * 1998-06-29 2004-06-29 Lumeniq, Inc. Method for conducting analysis of two-dimensional images
JP2000181993A (ja) * 1998-12-16 2000-06-30 Fujitsu Ltd 文字認識方法および装置
JP2001061061A (ja) 1999-08-23 2001-03-06 Minolta Co Ltd 画像処理装置
EP1336159A4 (en) * 2000-08-25 2009-06-03 Limbic Systems Inc METHOD FOR CARRYING OUT THE ANALYSIS OF TWO-DIMENSIONAL IMAGES
US6940617B2 (en) * 2001-02-09 2005-09-06 Matsushita Electric Industrial Co., Ltd. Printing control interface system and method with handwriting discrimination capability
US6778700B2 (en) * 2001-03-14 2004-08-17 Electronics For Imaging, Inc. Method and apparatus for text detection
JP2003110854A (ja) 2001-10-01 2003-04-11 Murata Mach Ltd 画像読取装置
US6904170B2 (en) * 2002-05-17 2005-06-07 Hewlett-Packard Development Company, L.P. Method and system for document segmentation

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05189604A (ja) * 1992-01-14 1993-07-30 Toshiba Corp 光学的文字読取装置
JPH0793466A (ja) * 1993-09-22 1995-04-07 Toshiba Corp 文字種判別装置およびその判別方法
JPH10162102A (ja) * 1996-12-03 1998-06-19 Ricoh Co Ltd 文字認識装置
JPH11265424A (ja) * 1998-03-16 1999-09-28 Ricoh Co Ltd 文字認識方法、装置および記録媒体
CN1372226A (zh) * 2001-02-21 2002-10-02 西北工业大学 一种检测图象边缘的独立边界自增强方法

Also Published As

Publication number Publication date
US20070211946A1 (en) 2007-09-13
JP4420877B2 (ja) 2010-02-24
CN1936927A (zh) 2007-03-28
JP2007087196A (ja) 2007-04-05
US7991231B2 (en) 2011-08-02

Similar Documents

Publication Publication Date Title
CN100428271C (zh) 图像判定方法、图像处理装置以及图像输出装置
US8532374B2 (en) Colour document layout analysis with multi-level decomposition
US7272269B2 (en) Image processing apparatus and method therefor
US9183434B2 (en) Inspection apparatus, inspection method, and computer-readable storage medium
US8351707B2 (en) Image processing apparatus, image forming apparatus, image processing system, and image processing method
US8238614B2 (en) Image data output processing apparatus and image data output processing method excelling in similarity determination of duplex document
US7602999B2 (en) Image searching device, image forming device, image searching method, image searching program, and computer-readable storage medium
KR20030011632A (ko) 자기 적응형 2치화를 이용한 이미지 처리 방법 및 장치
JP4834531B2 (ja) 画像処理装置及び画像処理装置の制御方法及びプログラム
US11508058B2 (en) System and method for evaluating impacts of defects in printed images
CN101277371B (zh) 图像的处理方法、处理装置、形成装置及读取装置
CN103369173B (zh) 电子化装置
CN101369314B (zh) 图像处理装置、图像形成装置、图像处理系统和方法
JP7077631B2 (ja) 画像検査装置および画像形成システム
Fernández-Caballero et al. Display text segmentation after learning best-fitted OCR binarization parameters
JP5887242B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP2022051444A (ja) 検査装置、画像形成装置、及び検査プログラム
US20230062113A1 (en) Information processing apparatus, information processing method and non-transitory storage medium
CN101246326B (zh) 图像处理方法与装置、图像形成装置、和图像读取装置
US7508986B2 (en) Document recognition device, document recognition method and program, and storage medium
US11611680B2 (en) Inspection device, image forming apparatus, and non-transitory computer readable medium storing inspection program
US20050152616A1 (en) Method and apparatus for automatic scanner defect detection
KR102361444B1 (ko) 다각형 기반의 객체 인식 성능 보정 장치 및 방법
US20210227086A1 (en) Information processing device, information processing system and computer readable medium
JP2020047138A (ja) 情報処理装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20081022

Termination date: 20210919