CN100481869C

CN100481869C - 自动检测图文的半色调处理方法

Info

Publication number: CN100481869C
Application number: CNB031274390A
Authority: CN
Inventors: 李骏宏; 林卓徵
Original assignee: Yudong Optical Co Ltd
Current assignee: Hongyou Science & Technology Co., Ltd.
Priority date: 2003-08-07
Filing date: 2003-08-07
Publication date: 2009-04-22
Anticipated expiration: 2023-08-07
Also published as: CN1581926A

Abstract

本发明的自动检测图文的半色调处理方法用于复制文件或传真文件时使图片保存色阶，并使得文字部分清晰，本发明的方法其步骤包含选取一原稿图像的底色、将该原稿图像以该底色为基准进行图文分离、将分离的图片部分以半色调处理、将分离的文字部分以二值法处理、以及将处理完成的该图片部分与该文字部分合并输出。

Description

自动检测图文的半色调处理方法

技术领域

本发明涉及一种自动检测图文并加以分别处理的方法，特别是涉及将文件进行影印或传真时，提高转换为黑白文件稿或彩色文件稿的细密度。

背景技术

目前处理彩色文件(或具有灰阶特性的文件)的影印复制或传真时，通常为求复制稿的细密程度，减少复制稿的失真程度，但因为文字部分与图片部分的特性不同，而必须将文件内所含的文字与图形分开处理。

举例而言，具有灰阶特性的文件在传真时，经常转换为黑白文稿模式，在转换时，因为文件中的资料通常包含文字与图片两大部分，如果转换中不进行半色调处理(Halftone，半色调处理包含针对像素做抖动Dithering或扩散Diffusion)，则图片部分无法将原来的图像细腻度及渐层部分不失真的呈现出来，但如果将整份文件全部使用半色调处理，则文字的部分会呈现破碎状，因此传统上都采取将图片与文字分开处理的作法。

但在公知图片与文字的分离方法上，常常为了顾及复制或传真的高拟真度与品质，而忽略分离与图片文字处理时的速度过慢的问题，依现有的图文检测方法而言，主要是由硬件电路实现，其将原有的图片先进行图像加工(如涂抹与模糊化)后，再实施图片及文字识别分离作业；在使用硬件装置达成图像加工的作法上，较耗费成本，且因为加工的程序，无形中增加了整体图文检测的处理时间，而现有的半色调处理方法，其取样参考点较多，采样区域也较大，需耗费较长的转换时间。

发明内容

鉴于上述的发明背景中，因目前已知技术的不足，所以本发明的目的在于，提出一种切割文字及图片区块的方式，可根据图像色阶的分布特性而快速分离文字及图片，如此将需做半色调处理的区域缩小。

本发明的另一目的是配合较少的半色调处理取样点，以减少处理时间。

根据以上所述的目的，本发明提供了一种自动检测图文的半色调处理方法，其步骤包含选取一原稿图像的底色、将该原稿图像用该底色为基准进行图文分离、将分离的图片部分用半色调处理、将分离的文字部分用二值法处理、以及将处理完成的该图片部分与该文字部分合并输出。

上述的本发明光学装置中，该半色调处理为一抖动，且该抖动的取样公式为图5示的取样点模式(标号50)乘以六十八分之一。

上述的本发明光学装置中，一优选的实施例的步骤有：选取一原稿图像的一第一底色；将该原稿图像用该第一底色为基准进行图文分离；将该原稿图像用该第一底色进行去除边缘空白区域；将去除边缘空白区域的该原稿图像用该第一底色进行横向分割；将横向分割的该原稿图像用该第一底色进行纵向分割，将形成复数个独立图像区块；将该独立图像区块再选取一第二底色；用该第二底色，进行图形与文字的识别；如果该独立图像区块为图形，则记录该图片部分；如果该独立图像区块为文字，则记录该文字部分；当无法识别为文字或图形时，用该第二底色对该独立区块进行去除边缘空白区域并用第二底色取代第一底色，则自前述去除边缘空白区域的部分开始重复为之；将分离的该图片部分用半色调处理；将分离的该文字部分用二值法处理；以及将处理完成的该图片部分与该文字部分合并输出。

附图说明

图1显示本发明方法的整体示意图；

图2显示本发明的自动检测图文方法与细部步骤；

图3为本发明的图1的一个实施示意图

图4为本发明的图2的实施示意图；以及

图5为本发明的图像半色调的抖动取样点模式及其计算公式。

附图中的主要部分的代表符号解释如下：

标号11：原稿底色

标号12：图文分离

标号13：半色调处理

标号14：二值法处理

标号15：图文合并

步骤21：选取底色

步骤22：去除边缘空白区域

步骤23：横向分割

步骤24：纵向分割

步骤25：形成个别区块

步骤26：选取底色

步骤27：分辨文字或图形

步骤28：记录文字区块

步骤29：记录图形区块

标号50：抖动取样点模式

具体实施方式

本发明的实施例将详细描述如下。然而，除了详细描述外，本发明还可以广泛地在其他的实施例施行，且本发明的范围不受限定，其以所附的权利要求为准。

再者，为提供更清楚的描述及更易理解本发明，附图内各部分并没有依照其相对尺寸绘图，某些尺寸与其他相关尺度相比已经被夸张；不相关的细节部分也未完全绘出，以求附图的简洁。

本发明的示意图如图1所示，首先，先检测原稿图像11中所包含的文字及图片区块，然后实施图文分离12作业(图文分离步骤将于图2中说明)，接着，对分离出的图片做半色调处理13(Halftone Processing，本发明实施例用半色调中的抖动Dithering Processing做说明)，以求得最佳的图片灰阶表现，而对分离出的文字区块做二值法处理15(Line Art Processing)，将处理完成的图片与文字部分完成图文合并14，达成复制或传真的需求，且可以清楚的显示文字与图片的灰阶。

然而，半色调的处理方法有不同的作法，诸如抖动(Dithering)、顺序抖动(Ordered Dithering)及误差扩散(Error Diffusion)等等，本发明中的半色调处理方法是以抖动为实施例，在图片的抖动中，如图3所示，将具有图文混和的文稿检测出图片与文字部分后，分别对不同区块的图片作图像打散处理，如此，在图片区块中具有灰阶时(一般可以呈现0(最黑)到255(最白)的灰度)，可以有效展现图片的灰阶程度，当然，也可以1024个灰阶程度展现图片，这些灰阶程度的设定，是取决于设计者对图片的要求；接着，对文字作二值法处理，如此文字区块仅具有0(最黑)或255(最白)的两种值，因此可以呈现出最清晰的文字部分；最后，图片与文字于处理完成后合并，使得完成的文稿具有清晰的文字与高吻合度的图片。

而前述的图像抖动中的取样点，本发明所提出的作法如图5所示，是将邻近像素按图5所显式的取样点模式(标号50)乘以六十八分之一的公式为之。

本发明提出的自动检测图文并分离的作法如图2所示意，在欲检测图文的区块中取得底色设定(步骤21)，以该底色为准，将该区块的边幅去除边缘空白区域(步骤22)，并用该底色对已去除边缘空白区域的区块尝试横向分割(步骤23)，之后，实施纵向分割(步骤24)，此时，原来的区块可呈现数个个别区块(步骤25)，于是针对个别区块取的一个底色(步骤26)，用该底色分辨是否为文字或图形(步骤27)，如果不能分辨，则可能该个别区块仍然包含较小范围的图片与文字，所以依照所取的底色为基准或于该个别区块内再选取另一底色，回到步骤22，再度实施一次自动检测图文程序，而如果可以分辨是图片时，即记录该图形区块(步骤29)，如果区块判别处理为文字区块时，即记录该文字区块(步骤28)。

当然，在步骤23中，如果该区块无法进行横向分割时，则亦进入步骤24中实施纵向分割；相对的，如果在步骤24中，无法进行纵向分割时，则仍进入步骤26；在特别的时候，如果在步骤23中无法实施横向分割且在步骤24中无法实施纵向分割，又在步骤27中无法分辨文字或图形时，则记录为图形区块(此步骤在图2中未示)。

关于图2所述的自动检测图文方法，还可参考图4的示意，而得一个优选的理解，该图中，一个文稿区块先用选取的底色去除边缘空白区域，以去除不包含任何文字或图片的区域，如此可以减少后续半色调或是二值法处理的时间，因为对底色的图像处理将增加整体处理时间；完成第一阶段的去除边缘空白区域后，对该去除边缘空白区域的区块实施横向分割与纵向分割，如此将行成许多的个别独立区块，每一独立区块可以利用软件或硬件设备进行是否为文字或图片的判断，如果不能分辨是文字或是图片，则可针对个别独立的区块重复前述去除边缘空白区域、横向分割、纵向分割及判读程序。

按照本发明的自动检测图文的半色调处理方法，克服了公知图片与文字的分离方法中速度过慢的问题，而且降低了成本。此外，本发明的自动检测图文的半色调处理方法取样参考点较少，采样区域也不大，从而转换时间较短。

以上所述仅为本发明的优选实施例而已，并非用来限定本发明的申请专利范围；凡其他为脱离本发明所揭示的精神下所完成的等效改变或修饰，均应包含在所附的权利要求中。

Claims

1、一种自动检测图文的半色调处理方法，其步骤包含：

选取一原稿图像的底色；

将该原稿图像用该底色进行去除边缘空白区域；

将去除边缘空白区域的该原稿图像用该底色进行横向分割；

将横向分割的该原稿图像用该底色进行纵向分割，将形成复数个独立图像区块；

将该独立图像区块再选取一第二底色；

用该第二底色，进行图形与文字的识别；

如果该独立图像区块为图形，则记录该图片部分；

如果该独立图像区块为文字，则记录该文字部分；

当无法识别为文字或图形时，用该第二底色对该独立区块进行去除边缘空白区域，重复前述自横向分割开始的各步骤；

将分离的图片部分用半色调处理；

将分离的文字部分用二值法处理；以及

将处理完成的该图片部分与该文字部分合并输出。

2、如权利要求1所述的自动检测图文的半色调处理方法，该半色调处理为一抖动。

3、如权利要求2所述的自动检测图文的半色调处理方法，该抖动的取样公式为下列取样点模式乘以六十八分之一

9 16 A 9 16 9 9

4、一种检测原稿中的图像和文本的方法，该方法包含：

从原稿中选取第一底色，其中所述原稿包括至少一个第一独立区块，且其中每个第一独立区块包括图像部分和文本部分中的至少一个；

至少部分地基于该第一底色对该原稿进行缩减；

将整个缩减后的原稿横向分割成额外的第一独立区块；

将整个原稿纵向分割成额外的第一独立区块；

对于每个第一独立区块——

从所述第一独立区块中选取第二底色；

至少部分地基于所述第二底色确定所述第一独立区块是否包括图像部分或文本部分；

如果所述第一独立区块包括图像部分，将所述第一独立区块标记为图像区块；

如果所述第一独立区块包括文本部分，将所述第一独立区块标记为文本区块；以及

如果所述第一独立区块既不包括图像部分也不包括文本部分，则——

用所述第二底色代替所述第一底色；

至少部分地基于该第二底色对该第一独立区块进行缩减；

将第一独立区块横向分割成第二独立区块；

将第一独立区块纵向分割成第二独立区块；且

对于每个第二独立区块——

至少部分地基于所述第二底色确定所述第二独立区块是否包括图像部分或文本部分；

如果所述第二独立区块包括图像部分，将所述第二独立区块标记为图像区块；以及

如果所述第二独立区块包括文本部分，将所述第二独立区块标记为文本区块；

将图片区块用半色调处理来处理；

将文本区块用二值法处理来处理；以及

将处理后的图像与处理后的文本整体输出。

5.如权利要求4所述的检测原稿中的图像和文本的方法，该半色调处理为一抖动。

6.如权利要求5所述的检测原稿中的图像和文本的方法，该抖动的取样公式为下列取样点模式乘以六十八分之一

9 16 A 9 16 9 9