CN102473278B - 图像处理装置、图像处理方法和存储介质 - Google Patents
图像处理装置、图像处理方法和存储介质 Download PDFInfo
- Publication number
- CN102473278B CN102473278B CN201080029816.7A CN201080029816A CN102473278B CN 102473278 B CN102473278 B CN 102473278B CN 201080029816 A CN201080029816 A CN 201080029816A CN 102473278 B CN102473278 B CN 102473278B
- Authority
- CN
- China
- Prior art keywords
- marked region
- region
- trooping
- marked
- another
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/46—Colour picture communication systems
- H04N1/56—Processing of colour picture signals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/40062—Discrimination between different image types, e.g. two-tone, continuous tone
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
- G06T2207/10008—Still image; Photographic image from scanner, fax or copier
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
- Color Image Communication Systems (AREA)
Abstract
在通过聚类处理分类的多个群集之中指定背景的群集,并将尺寸小于第一阈值的标记区域与通过标记处理被给予相同标记编号的标记区域之中的不是背景的群集的邻接的另一个标记区域组合。然后,基于从标记区域获得的特征量确定是否将所述标记区域与所述邻接的另一个标记区域组合,在当确定所述标记区域要被组合时组合所述标记区域之后,基于所述标记区域产生矢量数据。
Description
技术领域
本发明涉及用于图像处理的方法、装置和存储介质,该方法、装置和存储介质通过在执行标记处理之后以标记为单位组合由一致颜色区域构成的图像(比如,图表(illustration)图像)中所包括的扫描噪声来有效地移除扫描噪声,以便适合于矢量化处理。
背景技术
最近几年,随着信息的计算机化发展,如下系统得到普及,该系统不是原样存储纸质文档、而是在通过扫描仪等读取纸质文档之后将纸质文档存储为电子数据或者将该电子数据发送到其它装置。为了降低电子数据的发送成本,对于电子文档要求高压缩比。另一方面,为了方便用户,要求可重用性和高质量图片性能,所述可重用性使得电子数据中的对象能够被部分编辑,在所述高质量图片性能下,即使当电子数据被缩放时,图像质量也不劣化。
为了使扫描图像矢量化,虽然必需降低输入图像中所包括的扫描噪声并且提取原始图像的轮廓,但是需要将颜色减少处理作为预处理。例如,已选择如下方法:在首先通过聚类将颜色数量提取到某一程度之后,在后处理中通过组合类似颜色的群集来执行更准确的颜色分离。
例如,专利文献1公开了对于已聚类为扫描图像的结果删除尺寸比预定阈值小的群集的方法。
【引文列表】
【专利文献】
【PTL 1】日本专利公开No.2006-344069
【PTL 2】日本专利公开No.2004-126648
【PTL 3】日本专利公开No.2008-146496
【非专利文献】
【NPL 1】Agui和Nagao,ed,“Guide to Image Processing byC Language”,第一版,ISBN4-7856-3124-4,Shokodo Co.,Ltd.,发行于2000年11月20日,第106到115页
发明内容
根据上述专利文献1,由于仅参照尺寸,所以尺寸比阈值大的群集保留,而不组合。具体地讲,由扫描噪声引起的每个过分割的群集数据占有一定数量的尺寸,以使得用于该群集数据的处理不能被很好地执行。
根据本发明的图像处理装置包括:聚类部件,其被配置为基于图像中所包括的每个像素的颜色将所述图像分类为多个群集;背景群集指定部件,其被配置为在由所述聚类部件分类的所述多个群集之中指定背景群集;标记部件,其被配置为将相同的标记编号给予被所述聚类部件分类为相同群集的每一个链接像素组;第一组合部件,其被配置为将被所述标记部件给予相同标记编号的标记区域之中的尺寸小于第一阈值的标记区域与邻接的不是所述背景群集的另一个标记区域组合;第二组合部件,其被配置为:在所述第一组合部件执行所述组合处理之后,基于从所述标记区域获得的特征量来确定是否将所述标记区域与邻接的另一个标记区域组合,并且当确定所述标记区域要被组合时,组合所述标记区域;和产生部件,其被配置为基于由所述第二组合部件执行了所述组合处理的标记区域来产生矢量数据。
根据本发明,能够在不发生断线的情况下以更充分的准确性移除通过对扫描图像进行聚类而出现的噪声分量。
从以下(参照附图)对示例性实施例的描述,本发明的进一步的特征将变得明白。
附图说明
图1是根据本发明实施例的图像处理装置的配置框图;
图2是显示在根据本发明实施例的图像处理装置中执行的主要处理的流程图;
图3是显示聚类结果和对于聚类结果的标记结果的示图;
图4是显示聚类结果和标记结果的转换表的示图;
图5是显示用于确定线外形(profile)的目标的标记和提取信息的示例的示图;
图6是显示具有标记的形状信息的转换表的示图;
图7是显示主要处理中的噪声组合确定处理的流程图;
图8是显示通过组合微小尺寸的标记而获得的处理结果的示例的示图;和
图9是显示组合微小尺寸的标记之后的转换表的示图。
具体实施方式
(示例1)
将参照图1中所示的框图对根据本实施例的图像处理装置的配置示例进行说明。
中央处理单元(CPU)7控制该整个装置。只读存储器(ROM)6存储不需要改变的程序和参数。随机存取存储器(RAM)5临时存储从外部装置等提供的程序和数据。扫描仪1以光电形式扫描文档等,并获得电子图像数据。图像输入/输出(I/O)3将该装置与扫描仪1连接。图像存储器2保存由扫描仪1读取的图像数据等。外部储存器12是借助以下介质的存储设备:固定安装的硬盘和存储卡的介质;和/或软盘(FD)、光盘(诸如高密度盘(CD))、磁卡、光学卡、IC卡、存储卡等的可移动介质。
输入/输出接口13是外部储存器12与该装置之间的接口。输入接口15是与用于从用户接受操作和输入数据的定点设备10的输入设备的接口,定点设备10诸如鼠标或键盘9等。视频输出接口14是与用于显示该装置保存的数据和提供给该装置的数据的显示监视器8的接口。通信接口4是用于连接诸如互联网的网络的网络接口。系统总 线11连接每个单元1-15,以使得可以进行通信。
以下,将参照图2中所示的流程图对通过从外部储存器12装载到RAM 5并且在CPU 7上执行的程序来实现本发明的过程进行描述。
在所述处理开始时,在步骤S100输入包括处理对象的图像区域的图像数据。关于图像数据的输入,经由图像输入/输出(I/O)3将扫描仪1读取的图像数据输入到图像存储器2中。可替换地,可从所述装置的外部经由通信I/F 4输入包括作为处理对象的图像区域的图像,和/或还可经由输入/输出I/F 13读出预先存储在外部储存器12中的图像数据。所获得的图像数据保存在图像存储器2上。
在步骤S200,执行区域分割,以从输入图像数据提取包括例证的图形区域。虽然存在用于执行区域分割的一些方法,但是可通过应用例如专利文献2中所公开的方法来将它分割为具有不同属性的部分区域,所述属性诸如字符、图表、照片和表格,还考虑反向字符。
在步骤S300的颜色区域分割处理(S301和S302)中,产生与提取的图形区域对应的颜色分离图像。首先,在步骤S301,对图形区域中的图像执行聚类处理,对于被确定为相同颜色的像素添加相同的群集编号,并创建使用该群集编号的索引图像。此时,将其距离在预定阈值范围内类似的颜色确定为相同颜色,并将相同颜色分类为相同群集(相同颜色区域)。因此,在紧接着扫描之后的阶段中的数万种的颜色数量可减少到例如几种颜色到数十种颜色。
虽然存在一些聚类方法,但是例如可使用公知的最近邻(NN)方法(非专利文献1)。在NN方法中,当从输入P1聚类Pn时,首先创建将P1用作代表模式的群集C1。接着,以Pi(其中,i>=2)为目标,比较离Cj(其中,j是群集编号)的距离。当所述距离小于预先定义的阈值时,使Pi属于最短距离的群集。当没有发现距离小于阈值的群集时,创建新的群集。通过对于所有输入P执行上述处理来实现聚类处理。
当应用上述方法作为颜色减少处理时,必需的可以是将输入应用 于像素值(RGB值或照度值等)和将所述距离应用于颜色距离,诸如曼哈顿距离(Manhattan distance)(城区距离)和欧几里德距离(Euclidean distance)。在这种情况下,如果使颜色距离的阈值小,则其趋势是处理之后的群集的数量(颜色数量)增多并且颜色减少效果减弱。
在上述聚类处理之后,在步骤S302,从聚类结果指定构成背景区域的群集编号。可通过从矢量化处理的目标移除背景群集,而不输出移除的群集的部分的矢量数据,来产生通过背景区域的矢量数据。可通过选择例如在处理区域的最外围中的比例最高的群集编号来唯一地确定背景群集编号。
虽然通过上述颜色区域分割处理使扫描噪声从数万种颜色减少到几种颜色或数十种颜色,但是仍存在相当数量的颜色,并且扫描噪声没有被移除得足以应用矢量化处理。由于扫描噪声(比如,由扫描产生的错误颜色)保留,所以用于原样执行矢量化的数据尺寸大,从而可编辑性劣化。因此,为了通过组合噪声区域来创建适合于矢量化处理的颜色分离图像,在步骤S400,执行适合于矢量化的噪声组合处理(用于矢量化的噪声组合(S410-S470))。
首先,在步骤S410,对于在步骤S300创建的聚类处理结果的图像(索引图像)执行标记处理。标记处理是用于将相同编号给予具有相同值的链接像素组的处理,很好地用作用于获得关于每个区域的信息(尺寸、形状)的预处理。图3显示其聚类结果被编号替换的索引图像和通过对于前述索引图像执行标记处理而获得的结果的示例。也就是说,在图3的聚类结果中,对于被确定为相同颜色的每一个像素,给予相同的群集编号(A-E)。而且,在图3的标记结果中,将相同的标记编号(1-10)给予被分类为相同群集编号并且在垂直方向、水平方向和对角线方向中的任何一个上链接的每一个像素组(也就是说,由具有相同颜色并且被链接的像素构成的标记区域)。然而,图3显示输入图像30的放大部分31和32,并预先假定字母B的群集在图的范围外也有链接。
而且,需要准备如图4所示的用于将标记结果与群集编号相关联的转换表,以在执行标记处理时使用该转换表。
在上述标记处理之后,在步骤S420,为了检测不适合于矢量化的区域,执行对于标记区域的形状(被给予相同标记编号的区域的形状)的分析处理。具体地讲,在对于标记区域的形状的分析处理中,所述装置执行用以确定标记区域的形状的特性(诸如每个标记区域的尺寸)和标记区域的形状是否是线外形的处理。作为聚类处理的结果,不适合于矢量化的标记(诸如其尺寸非常小的标记区域和线外形的标记区域)主要是由于扫描噪声的影响而产生的。这些区域引起数据量的增加和可编辑性的劣化。因此,即使作为聚类处理的结果,确定这些区域为不同的颜色区域,也确定该区域是否能够与其它标记区域组合,并将能够被组合的区域组合以变为适合于矢量化的处理单元。
通过准备具有标记编号和与该编号对应的标记的尺寸的汇总表,可通过对于整个图像进行一次光栅扫描来获得标记区域的尺寸。通过在光栅扫描之后将每个标记区域的像素数量与第一阈值进行比较,可确定作为目标的标记区域是否是微小尺寸。假定输入扫描图像的分辨率是300dpi,则对于小于5个像素的标记区域,难以在视觉上确认,因此,罕见的是,即使当与其它区域组合时也发生视觉劣化。因此,在此后的处理中,将第一阈值设置为5,并将少于5个像素的像素数量的标记区域确定为微小尺寸。对于与输入分辨率或输入图像尺寸对应的第一阈值,可使用替代值。例如,由于当输入分辨率和输入图像尺寸大时,不会检测到视觉劣化的像素数量的上限变大,所以更有效的是使用更大的值。
以下,将参照图5中作为示例所示的标记对确定标记区域是否是线外形的方法进行说明。关于该标记区域的外接矩形尺寸,横向宽度是100个像素,纵向宽度是15个像素,像素数量是150个,位于黑色标记区域与白色标记区域之间的边界中的像素的数量(边界线的长度)是200个。
对于第一种方法,使用外接矩形的长宽比。计算长边与短边的长度之间的比率。如果计算的长宽比是大于预定长宽比阈值的值,则由于外接矩形是长而细的形状,所以确定标记区域是线外形。如果长宽比阈值被设置为5,则由于在图5中所示的标记区域的情况下通过以下公式获得大于阈值5的长宽比,所以可确定它是线外形的标记区域。
100(外接矩形的长边长度)/15(外接矩形的短边长度)=6.67
对于第二种方法,使用外接矩形的尺寸与标记区域的像素数量之间的比率。计算外接矩形的尺寸与实际标记区域的尺寸之间的比率。如果计算的面积比不大于预定的外接矩形阈值,则由于标记区域在外接矩形之中占据的尺寸小,所以可将它确定为线外形的标记区域。如果外接矩形阈值被设置为7,则由于在图5中所示的标记区域的情况下通过以下公式计算出大于阈值7的比率,则将它确定为线外形的标记区域。
100×15(外接矩形的尺寸)/150(标记区域的尺寸)=10
对于第三种方法,使用位于标记的边界中的像素数量(边界线的长度)与标记区域的尺寸之间的比率。计算与标记区域接触的边界线的长度与标记区域的尺寸之间的比率,并且由于如果计算的比率大于预定边界阈值,则边界线长,所以确定作为目标的标记区域是线外形。如果边界阈值被设置为1.0,则由于在图5中所示的标记区域的情况下通过以下公式计算大于阈值1.0的比率,所以可将它确定为线外形的标记区域。
200(其它标记区域之间的边界线的数量)/150(标记区域的像素数量)=1.33
图6显示通过将以上标记形状的确定方法组合到图4的转换表来添加检查的每个标记的形状信息的示例。
在上述标记形状的分析处理之后的步骤S430,优先将在步骤S420确定为微小尺寸的标记区域与不具有背景群集编号的邻接的标记区域组合。当微小尺寸的标记区域是构成线的一部分的像素组并且 密集时,如果前述标记区域没有正确地与背景标记区域组合,则所述线可能断开。因此,通过预先将微小尺寸的标记区域与除了背景之外的其它标记区域组合来防止线断开。虽然还可能的是扫描噪声中出现的微小尺寸的标记区域变为背景图像之中的孤立点,但是由于可通过此后的处理将微小尺寸的标记区域与具有背景群集编号的标记区域组合,所以它没有变为问题。
在上述微小标记组合处理之后的步骤S440,选择组合源标记。从图像的左上朝向右下执行光栅扫描,依次选择组合源标记,从而确认不同的标记区域是否是向右和向下邻接。如果向右和向下这二者都具有相同的标记编号,则将下一个像素选择为作为目标的点。如果向右的标记和向下的标记中的至少一个与所述不同的标记邻接,则在步骤S450将这样的不同标记选择为组合目的标记。
在步骤S460中,根据图7的流程图中所示的噪声组合确定处理的过程确定是否组合在步骤S440和S450中选择的两个标记区域。使用前述两个标记的色调差和颜色距离作为确定标准。
在图7中所示的噪声组合确定处理中,使用从标记区域获得的特征量(标记区域的尺寸、形状、色调和颜色距离)和多个阈值来确定是否组合每个标记区域。首先,在步骤S461中,确定至少一侧的标记区域的尺寸是否不大于第一阈值。作为确定的结果,如果至少一侧的标记区域的尺寸不大于第一阈值(也就是说,它是微小尺寸),则在步骤S466将易于组合的阈值设置为第三阈值。由于考虑在目前阶段作为微小尺寸标记而剩下的标记区域是由于扫描噪声而出现的并且周边被背景群集包围的孤立点,所以可通过将阈值设置为低水平来移除扫描噪声。因此,当在步骤S461,至少一侧的标记区域的尺寸不大于第一阈值时,在步骤S467,将两个标记区域之间的颜色距离与第三阈值进行比较,而不考虑色调差。
当两个标记区域的尺寸都大于第一阈值时,该处理进入步骤S462,然后确认至少一侧的标记区域是否是线外形。当两个标记区域都不是线外形时,该处理进入步骤S463。
在步骤S463,检查至少一侧的标记区域的尺寸是否不大于第四阈值。这是为了防止尺寸大的标记区域之间的组合。当两个标记区域的尺寸都大于第四阈值时,完成噪声组合确定处理,而不执行标记的组合处理。当至少一侧的尺寸不大于第四阈值时,该处理进入步骤S465。
顺便提一下,当一侧的标记区域在步骤S462的确定中是线外形时,该处理进入步骤S464。在步骤S464,确定至少一侧的标记区域的宽度是否不大于根据输出矢量格式的类型而指定的第二阈值。如果当至少一侧的标记区域不大于第二阈值时通过绘制器显示矢量化的数据,则作为目标的标记区域不以准确的宽度显示,并且图像质量的劣化可能发生。因此,当至少一侧的标记不大于第二阈值时,省略步骤S465的色调差确认,然后该处理进入步骤S466。然后,在步骤S466,通过将用于在标记区域之间进行组合的颜色距离的阈值(第三阈值)设置为低水平来使作为目标的标记区域易于组合。另外,还可与输入图像的尺寸和/或分辨率对应地确定第二阈值。
当使用1或2作为第二阈值时,可使用如示例1中所述的标记区域的像素数量与标记区域的边界线之间的比率来进行检测。由于第二阈值表示标记区域宽度的下限,所以必需的仅仅是能够检测其标记区域宽度是1或2的标记。当计算标记区域的像素数量与标记区域的边界线之间的比率时,这样的标记区域具有这样的特性,即,不小于标记区域的像素数量的标记区域的边界线存在。此外,当第二阈值大于3时,通过使用本申请人提议的线宽检测方法来获得每个标记的线宽度,从而所获得的线宽度可用于在步骤S440进行确定。
在步骤S463的肯定确定的情况下或者在步骤S464的否定确定的情况下,在步骤S465检查两个作为目标的标记区域之间的色调差。通过将作为目标的像素的标记区域的颜色空间变到HSV中并且参照H的值来获得色调差。当该色调差不大于第五阈值时,该处理进入用于确定颜色距离的步骤S467。另一方面,当色调差大于第五阈值时,完成噪声组合确定处理,而不执行标记的组合处理。而且, 在步骤S466,当通过参照H的值,两个标记区域都是接近黑色的颜色时,可将用于在步骤S467执行的颜色距离确定的第三阈值设置为更低水平。这是因为,黑色图像的颜色距离趋向于表现为远,并且黑色图像需要将阈值设置为用于组合相似的其它颜色的低水平。可通过检查两个标记区域的H的值是否不大于第六阈值来执行两个标记区域是否接近黑色的确定。
在步骤S467,检查两个作为目标的标记区域之间的颜色距离。RGB的曼哈顿距离(城区距离)和欧几里德距离可用于颜色距离。当该颜色距离不大于第三阈值时,在步骤S468设置噪声组合标志。当该颜色距离大于第三阈值时,完成噪声组合确定处理,而不组合两个标记。
作为以上噪声组合确定处理的结果,当确定执行噪声组合时,在图2中所示的流程图的步骤S470,组合两个所选标记区域。在组合处理中,用尺寸较大的标记编号重写尺寸较小的标记编号,并更新关于标记区域的形状信息。
图8显示对于图3的标记结果执行上述组合处理的结果。如所示,首先,在图3中,标记编号4的标记区域300(微小尺寸)与右上标记区域305组合,并被更新为标记编号3(微小尺寸)。接着,在图3中,标记编号5的标记区域310(微小尺寸)与更新的右上标记区域300组合,并被更新为标记编号3(微小尺寸)。类似地,标记区域320与更新的上标记区域300组合。结果,聚类结果和标记结果的组合处理之后的转换表显示在图9中。
当没有必要进行组合处理时和当组合处理完成时,在步骤S500中通过使用公知的矢量化方法(例如,专利文献3)执行到矢量数据的转换处理。提取组合处理之后的标记区域(每一种颜色的图像)的轮廓,并执行每个轮廓的函数的逼近,从而变为矢量数据并按照输出格式输出。在这种情况下,可逐个执行每个标记区域的轮廓的函数的逼近,并且可在对于每一边界线分割轮廓之后将相同函数逼近的结果应用于共享边界的标记。
(示例2)
示例1公开这样的示例,该示例显示当在图2中所示的流程图的步骤S450选择标记区域的组合目的的情况下首先找到满足条件的标记区域时执行组合。然而,本发明的范围不限于该示例。例如,可关于所有组合确认与标记区域邻接的区域是否可组合,并可组合具有最近颜色距离的标记区域。根据该方法,虽然与示例1中所述的方法相比处理时间变长,但是可产生更准确的标记区域(颜色分离图像)。
此外,当作为目标的标记区域是线外形时,作为目标的标记区域的端点在许多情况下适当地与将被组合的其它标记区域接触。因此,可将作为目标的标记区域组合到与作为目标的标记区域的端点接触的其它标记区域之中的具有最近颜色距离的其它标记区域。
(示例3)
示例1公开这样的示例,该示例显示在图2中所示的流程图的步骤S430将微小尺寸的标记区域与除背景群集之外的邻接的标记区域组合。然而,本发明的范围不限于该示例。当在步骤S430邻接微小尺寸的标记区域时,可成批地组合邻接的微小标记区域,并在此后的处理中将组合的标记区域当作作为整体的一个标记区域。在这种情况下,可通过组合微小尺寸的标记区域来防止微小尺寸的标记区域不正确地与具有背景群集编号的标记区域组合,因此,线断开的问题不发生。
(其它实施例)
本发明的方面还可通过系统或装置的计算机(或者诸如CPU或MPU的设备)和方法来实现,所述计算机读出并执行记录在存储设备上的程序用以执行上述实施例的功能,所述方法的步骤通过系统或装置的计算机例如读出并执行记录在存储设备上的用以执行上述实施例的功能的程序来执行。为了这个目的,例如经由网络或者从用作存储设备的各种类型的存储介质(比如,计算机可读介质)将所述程序提供给所述计算机。
尽管已参照示例性实施例对本发明进行了描述,但是应该理解,本发明不限于所公开的示例性实施例。应该给予以下权利要求的范围以最广泛的解释,以涵盖所有这样的修改以及等同结构和功能。
[0070]
Claims (11)
1.一种图像处理装置,包括:
聚类部件,其被配置为基于图像中所包括的每个像素的颜色将所述图像分类为多个群集,其中每个群集编号被给予所分类的群集中的每个群集;
背景群集指定部件,其被配置为在由所述聚类部件分类的所述多个群集之中指定背景群集;
标记部件,其被配置为通过将每个标记编号给予被所述聚类部件分类为相同群集的每一个链接像素组来获得多个标记区域,其中由所述标记部件给予的每个标记编号与被给予所述多个群集中的相应一个群集的群集编号之一相关联;
第一组合部件,其被配置为将由所述标记部件获得的所述多个标记区域之中的尺寸小于第一阈值的标记区域与邻接的不与被给予所述背景群集的群集编号相关联的另一个标记区域组合;
第二组合部件,其被配置为:基于从由所述第一组合部件组合的标记区域获得的特征量来确定是否将由所述第一组合部件组合的所述标记区域进一步与邻接的另一个标记区域组合,并且当确定所述标记区域要被进一步组合时,进一步组合所述标记区域与另一个标记区域;和
产生部件,其被配置为基于由所述第二组合部件进一步组合的标记区域来产生矢量数据。
2.根据权利要求1所述的图像处理装置,还包括区域提取部件,其被配置为从所述图像提取图形区域,其中,
所述聚类部件被配置为基于被所述区域提取部件作为处理对象提取的图形区域中的图像中所包括的每个像素的颜色,来将所述图形区域中的所述图像分类为多个群集。
3.根据权利要求1所述的图像处理装置,其中,所述第二组合部件通过将所述标记区域的尺寸、形状、色调和颜色距离中的至少一个用作从所述标记区域获得的特征量来确定所述标记区域是否与邻接的另一个标记区域组合,并且当确定所述标记区域要被组合时,组合所述标记区域。
4.根据权利要求3所述的图像处理装置,其中,当确定所述标记区域的尺寸小于第一阈值时,所述第二组合部件基于关于所述标记区域与所述邻接的另一个标记区域之间的颜色距离是否不大于第三阈值的信息来确定是否将所述标记区域与所述另一个标记区域组合,并且当确定所述标记区域要被组合时,将所述标记区域和所述另一个标记区域组合。
5.根据权利要求4所述的图像处理装置,其中,当确定所述标记区域的尺寸不小于第一阈值时,所述第二组合部件确定所述标记区域的形状是否是线外形,并且当确定所述标记区域的形状是线外形时,还确定所述标记区域的宽度是否不大于第二阈值,
当确定所述标记区域的宽度不大于第二阈值时,基于关于所述标记区域与所述邻接的另一个标记区域之间的颜色距离是否不大于第三阈值的信息来确定是否组合所述标记区域和所述另一个标记区域,并且
当确定所述标记区域要被组合时,组合所述标记区域和所述另一个标记区域。
6.根据权利要求5所述的图像处理装置,其中,当确定所述标记区域的形状不是线外形时,所述第二组合部件还确定所述标记区域的尺寸是否不大于第四阈值,
当确定所述标记区域的尺寸大于第四阈值时,不组合所述标记区域,
当确定所述标记区域的尺寸不大于第四阈值时,还确定所述标记区域与所述另一个标记区域之间的色调差是否不大于第五阈值,
当确定所述色调差不大于第五阈值时,不组合所述标记区域,
当确定所述色调差不大于第五阈值时,基于关于所述标记区域与所述邻接的另一个标记区域之间的颜色距离是否不大于第三阈值的信息来确定是否组合所述标记区域和所述另一个标记区域,并且
当确定所述标记区域要被组合时,组合所述标记区域和所述另一个标记区域。
7.根据权利要求4所述的图像处理装置,其中,所述第二组合部件组合所述标记区域和首先被确定为到所述标记区域的颜色距离小于第三阈值的另一个标记区域。
8.根据权利要求4所述的图像处理装置,其中,所述第二组合部件组合所述标记区域和与所述标记区域邻接的其它标记区域之中的颜色距离最近的另一个标记区域,从所述其它标记区域到所述标记区域的颜色距离小于第三阈值。
9.根据权利要求4所述的图像处理装置,其中,所述第二组合部件优先组合到线外形的标记区域的颜色距离小于第三阈值的其它标记区域之中的、在所述线外形的标记区域的端点处接触的标记区域。
10.根据权利要求1所述的图像处理装置,其中,当与尺寸小于第一阈值的标记区域邻接地存在尺寸小于第一阈值的另一个标记区域时,所述第一组合部件组合所述标记区域和所述另一个标记区域。
11.一种在图像处理装置中执行的方法,所述方法包括以下步骤:
聚类步骤,基于图像中所包括的每个像素的颜色将所述图像分类为多个群集,其中每个群集编号被给予所分类的群集中的每个群集;
背景群集指定步骤,在所述聚类步骤分类的所述多个群集之中指定背景群集;
标记步骤,通过将每个标记编号给予在所述聚类步骤被分类为相同群集的每一个链接像素组来获得多个标记区域,其中由所述标记步骤给予的每个标记编号与被给予所述多个群集中的相应一个群集的群集编号之一相关联;
第一组合步骤,将在所述标记步骤获得的所述多个标记区域之中的尺寸小于第一阈值的标记区域与邻接的不与被给予所述背景群集的群集编号相关联的另一个标记区域组合;
第二组合步骤,基于从在所述第一组合步骤组合的标记区域获得的特征量来确定是否将由所述第一组合步骤组合的所述标记区域进一步与所述邻接的另一个标记区域组合,并且当确定所述标记区域要被进一步组合时,进一步组合所述标记区域与另一个标记区域;和
基于在所述第二组合步骤进一步组合的标记区域来产生矢量数据。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009156972A JP2011013898A (ja) | 2009-07-01 | 2009-07-01 | 画像処理装置、画像処理方法、及び、プログラム |
JP2009-156972 | 2009-07-01 | ||
PCT/JP2010/004295 WO2011001669A1 (en) | 2009-07-01 | 2010-06-29 | Image processing apparatus, image processing method, and storage medium |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102473278A CN102473278A (zh) | 2012-05-23 |
CN102473278B true CN102473278B (zh) | 2014-04-16 |
Family
ID=43410756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201080029816.7A Expired - Fee Related CN102473278B (zh) | 2009-07-01 | 2010-06-29 | 图像处理装置、图像处理方法和存储介质 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8675256B2 (zh) |
EP (1) | EP2449523A4 (zh) |
JP (1) | JP2011013898A (zh) |
CN (1) | CN102473278B (zh) |
WO (1) | WO2011001669A1 (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5600524B2 (ja) | 2010-08-27 | 2014-10-01 | キヤノン株式会社 | 画像処理装置、画像処理方法、プログラム、および記憶媒体 |
JP5843474B2 (ja) * | 2011-05-09 | 2016-01-13 | キヤノン株式会社 | 画像処理装置、画像処理方法、及び、プログラム |
CN105430218B (zh) * | 2015-11-27 | 2018-07-24 | 优渊商贸(上海)有限公司 | 图像色彩识别方法及装置 |
US10762635B2 (en) * | 2017-06-14 | 2020-09-01 | Tusimple, Inc. | System and method for actively selecting and labeling images for semantic segmentation |
US20210271719A1 (en) * | 2018-09-28 | 2021-09-02 | Hewlett-Packard Development Company, L.P. | Consolidated document generation |
CN110378218A (zh) * | 2019-06-13 | 2019-10-25 | 大亚湾核电运营管理有限责任公司 | 一种图像处理方法、装置及终端设备 |
US11341383B2 (en) * | 2019-08-18 | 2022-05-24 | Kyocera Document Solutions Inc. | Methods and apparatus to detect effective tiling area and fill tiles efficiently |
CN111507407B (zh) * | 2020-04-17 | 2024-01-12 | 腾讯科技(深圳)有限公司 | 图像分类模型的训练方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006344069A (ja) * | 2005-06-09 | 2006-12-21 | Canon Inc | 画像処理方法及び画像処理装置 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06103371A (ja) * | 1992-09-18 | 1994-04-15 | Daikin Ind Ltd | カラー画像処理方法およびその装置 |
JP3748164B2 (ja) * | 1998-02-06 | 2006-02-22 | 富士通株式会社 | パターン抽出装置 |
JP3748172B2 (ja) | 1998-12-09 | 2006-02-22 | 富士通株式会社 | 画像処理装置 |
JP4275866B2 (ja) * | 2000-01-27 | 2009-06-10 | 富士通株式会社 | カラー画像から文字列パターンを抽出する装置および方法 |
US7110596B2 (en) | 2002-04-25 | 2006-09-19 | Microsoft Corporation | System and method facilitating document image compression utilizing a mask |
US7164797B2 (en) * | 2002-04-25 | 2007-01-16 | Microsoft Corporation | Clustering |
KR100477656B1 (ko) | 2002-07-27 | 2005-03-22 | 삼성전자주식회사 | 디지털 화질 개선 방법 및 장치 |
JP3950777B2 (ja) | 2002-09-30 | 2007-08-01 | キヤノン株式会社 | 画像処理方法、画像処理装置および画像処理プログラム |
US7343046B2 (en) | 2004-02-12 | 2008-03-11 | Xerox Corporation | Systems and methods for organizing image data into regions |
US7623712B2 (en) * | 2005-06-09 | 2009-11-24 | Canon Kabushiki Kaisha | Image processing method and apparatus |
JP2007089136A (ja) * | 2005-08-23 | 2007-04-05 | Ricoh Co Ltd | 画像処理方法、画像処理プログラム、記録媒体及び複合装置 |
JP4799246B2 (ja) | 2006-03-30 | 2011-10-26 | キヤノン株式会社 | 画像処理方法及び画像処理装置 |
JP4829835B2 (ja) | 2006-06-12 | 2011-12-07 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム、及びコンピュータ読み取り可能な記憶媒体 |
JP5058575B2 (ja) | 2006-12-12 | 2012-10-24 | キヤノン株式会社 | 画像処理装置及びその制御方法、プログラム |
US7809189B2 (en) | 2007-01-12 | 2010-10-05 | Arcsoft, Inc. | Method for image separating |
JP5173898B2 (ja) | 2009-03-11 | 2013-04-03 | キヤノン株式会社 | 画像処理方法、画像処理装置、及びプログラム |
-
2009
- 2009-07-01 JP JP2009156972A patent/JP2011013898A/ja active Pending
-
2010
- 2010-06-29 CN CN201080029816.7A patent/CN102473278B/zh not_active Expired - Fee Related
- 2010-06-29 US US12/933,368 patent/US8675256B2/en active Active
- 2010-06-29 WO PCT/JP2010/004295 patent/WO2011001669A1/en active Application Filing
- 2010-06-29 EP EP10793842.5A patent/EP2449523A4/en not_active Withdrawn
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006344069A (ja) * | 2005-06-09 | 2006-12-21 | Canon Inc | 画像処理方法及び画像処理装置 |
Also Published As
Publication number | Publication date |
---|---|
EP2449523A1 (en) | 2012-05-09 |
CN102473278A (zh) | 2012-05-23 |
US8675256B2 (en) | 2014-03-18 |
JP2011013898A (ja) | 2011-01-20 |
US20110128586A1 (en) | 2011-06-02 |
EP2449523A4 (en) | 2013-08-14 |
WO2011001669A1 (en) | 2011-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102473278B (zh) | 图像处理装置、图像处理方法和存储介质 | |
US7623712B2 (en) | Image processing method and apparatus | |
KR100625755B1 (ko) | 문자 인식 장치, 문자 인식 방법, 매체 처리 방법 및 문자 인식 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체 | |
US8059896B2 (en) | Character recognition processing system and computer readable medium storing program for character recognition processing | |
JP5455038B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP6139396B2 (ja) | 文書を表す二値画像を圧縮する方法及びプログラム | |
US7630544B1 (en) | System and method for locating a character set in a digital image | |
EP2645332B1 (en) | Image processing device that separates image into plural regions | |
JP2001297303A (ja) | 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体 | |
JP2003228712A (ja) | イメージからテキスト状のピクセルを識別する方法 | |
JP2006246435A (ja) | 画像処理装置及びその制御方法、プログラム | |
JP4077919B2 (ja) | 画像処理方法及び装置及びその記憶媒体 | |
JP2008262424A (ja) | 画像処理装置及びその制御方法、並びにコンピュータプログラム | |
US6360006B1 (en) | Color block selection | |
JP5335581B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP5767549B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP2006072839A (ja) | 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体 | |
JP2002236921A (ja) | 文書画像認識方法、文書画像認識装置及び記録媒体 | |
AU2007249098B2 (en) | Method of multi-level decomposition for colour document layout analysis | |
JP4854398B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP4587167B2 (ja) | 画像処理装置及び画像処理方法 | |
JP4650958B2 (ja) | 画像処理装置、方法およびプログラム | |
JP5012551B2 (ja) | 情報処理装置およびプログラム | |
JP2020136878A (ja) | ドロップアウトカラー処理装置及びドロップアウトカラー処理方法 | |
JP2004240500A (ja) | 画像処理装置、画像処理プログラムおよび記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140416 Termination date: 20210629 |
|
CF01 | Termination of patent right due to non-payment of annual fee |