CN102473278A - 图像处理装置、图像处理方法和存储介质 - Google Patents

图像处理装置、图像处理方法和存储介质 Download PDF

Info

Publication number
CN102473278A
CN102473278A CN2010800298167A CN201080029816A CN102473278A CN 102473278 A CN102473278 A CN 102473278A CN 2010800298167 A CN2010800298167 A CN 2010800298167A CN 201080029816 A CN201080029816 A CN 201080029816A CN 102473278 A CN102473278 A CN 102473278A
Authority
CN
China
Prior art keywords
marked region
region
marked
threshold value
another
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010800298167A
Other languages
English (en)
Other versions
CN102473278B (zh
Inventor
常松祐一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of CN102473278A publication Critical patent/CN102473278A/zh
Application granted granted Critical
Publication of CN102473278B publication Critical patent/CN102473278B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier

Abstract

在通过聚类处理分类的多个群集之中指定背景的群集,并将尺寸小于第一阈值的标记区域与通过标记处理被给予相同标记编号的标记区域之中的不是背景的群集的邻接的另一个标记区域组合。然后,基于从标记区域获得的特征量确定是否将所述标记区域与所述邻接的另一个标记区域组合,在当确定所述标记区域要被组合时组合所述标记区域之后,基于所述标记区域产生矢量数据。

Description

图像处理装置、图像处理方法和存储介质
技术领域
本发明涉及用于图像处理的方法、装置和存储介质,该方法、装置和存储介质通过在执行标记处理之后以标记为单位组合由一致颜色区域构成的图像(比如,图表(illustration)图像)中所包括的扫描噪声来有效地移除扫描噪声,以便适合于矢量化处理。
背景技术
最近几年,随着信息的计算机化发展,如下系统得到普及,该系统不是原样存储纸质文档、而是在通过扫描仪等读取纸质文档之后将纸质文档存储为电子数据或者将该电子数据发送到其它装置。为了降低电子数据的发送成本,对于电子文档要求高压缩比。另一方面,为了方便用户,要求可重用性和高质量图片性能,所述可重用性使得电子数据中的对象能够被部分编辑,在所述高质量图片性能下,即使当电子数据被缩放时,图像质量也不劣化。
为了使扫描图像矢量化,虽然必需降低输入图像中所包括的扫描噪声并且提取原始图像的轮廓,但是需要将颜色减少处理作为预处理。例如,已选择如下方法:在首先通过聚类将颜色数量提取到某一程度之后,在后处理中通过组合类似颜色的群集来执行更准确的颜色分离。
例如,专利文献1公开了对于已聚类为扫描图像的结果删除尺寸比预定阈值小的群集的方法。
【引文列表】
【专利文献】
【PTL 1】日本专利公开No.2006-344069
【PTL 2】日本专利公开No.2004-126648
【PTL 3】日本专利公开No.2008-146496
【非专利文献】
【NPL 1】Agui和Nagao,ed,“Guide to Image Processing byC Language”,第一版,ISBN4-7856-3124-4,Shokodo Co.,Ltd.,发行于2000年11月20日,第106到115页
发明内容
根据上述专利文献1,由于仅参照尺寸,所以尺寸比阈值大的群集保留,而不组合。具体地讲,由扫描噪声引起的每个过分割的群集数据占有一定数量的尺寸,以使得用于该群集数据的处理不能被很好地执行。
根据本发明的图像处理装置包括:聚类部件,其被配置为基于图像中所包括的每个像素的颜色将所述图像分类为多个群集;背景群集指定部件,其被配置为在由所述聚类部件分类的所述多个群集之中指定背景群集;标记部件,其被配置为将相同的标记编号给予被所述聚类部件分类为相同群集的每一个链接像素组;第一组合部件,其被配置为将被所述标记部件给予相同标记编号的标记区域之中的尺寸小于第一阈值的标记区域与邻接的不是所述背景群集的另一个标记区域组合;第二组合部件,其被配置为:在所述第一组合部件执行所述组合处理之后,基于从所述标记区域获得的特征量来确定是否将所述标记区域与邻接的另一个标记区域组合,并且当确定所述标记区域要被组合时,组合所述标记区域;和产生部件,其被配置为基于由所述第二组合部件执行了所述组合处理的标记区域来产生矢量数据。
根据本发明,能够在不发生断线的情况下以更充分的准确性移除通过对扫描图像进行聚类而出现的噪声分量。
从以下(参照附图)对示例性实施例的描述,本发明的进一步的特征将变得明白。
附图说明
图1是根据本发明实施例的图像处理装置的配置框图;
图2是显示在根据本发明实施例的图像处理装置中执行的主要处理的流程图;
图3是显示聚类结果和对于聚类结果的标记结果的示图;
图4是显示聚类结果和标记结果的转换表的示图;
图5是显示用于确定线外形(profile)的目标的标记和提取信息的示例的示图;
图6是显示具有标记的形状信息的转换表的示图;
图7是显示主要处理中的噪声组合确定处理的流程图;
图8是显示通过组合微小尺寸的标记而获得的处理结果的示例的示图;和
图9是显示组合微小尺寸的标记之后的转换表的示图。
具体实施方式
(示例1)
将参照图1中所示的框图对根据本实施例的图像处理装置的配置示例进行说明。
中央处理单元(CPU)7控制该整个装置。只读存储器(ROM)6存储不需要改变的程序和参数。随机存取存储器(RAM)5临时存储从外部装置等提供的程序和数据。扫描仪1以光电形式扫描文档等,并获得电子图像数据。图像输入/输出(I/O)3将该装置与扫描仪1连接。图像存储器2保存由扫描仪1读取的图像数据等。外部储存器12是借助以下介质的存储设备:固定安装的硬盘和存储卡的介质;和/或软盘(FD)、光盘(诸如高密度盘(CD))、磁卡、光学卡、IC卡、存储卡等的可移动介质。
输入/输出接口13是外部储存器12与该装置之间的接口。输入接口15是与用于从用户接受操作和输入数据的定点设备10的输入设备的接口,定点设备10诸如鼠标或键盘9等。视频输出接口14是与用于显示该装置保存的数据和提供给该装置的数据的显示监视器8的接口。通信接口4是用于连接诸如互联网的网络的网络接口。系统总线11连接每个单元1-15,以使得可以进行通信。
以下,将参照图2中所示的流程图对通过从外部储存器12装载到RAM 5并且在CPU 7上执行的程序来实现本发明的过程进行描述。
在所述处理开始时,在步骤S100输入包括处理对象的图像区域的图像数据。关于图像数据的输入,经由图像输入/输出(I/O)3将扫描仪1读取的图像数据输入到图像存储器2中。可替换地,可从所述装置的外部经由通信I/F 4输入包括作为处理对象的图像区域的图像,和/或还可经由输入/输出I/F 13读出预先存储在外部储存器12中的图像数据。所获得的图像数据保存在图像存储器2上。
在步骤S200,执行区域分割,以从输入图像数据提取包括例证的图形区域。虽然存在用于执行区域分割的一些方法,但是可通过应用例如专利文献2中所公开的方法来将它分割为具有不同属性的部分区域,所述属性诸如字符、图表、照片和表格,还考虑反向字符。
在步骤S300的颜色区域分割处理(S301和S302)中,产生与提取的图形区域对应的颜色分离图像。首先,在步骤S301,对图形区域中的图像执行聚类处理,对于被确定为相同颜色的像素添加相同的群集编号,并创建使用该群集编号的索引图像。此时,将其距离在预定阈值范围内类似的颜色确定为相同颜色,并将相同颜色分类为相同群集(相同颜色区域)。因此,在紧接着扫描之后的阶段中的数万种的颜色数量可减少到例如几种颜色到数十种颜色。
虽然存在一些聚类方法,但是例如可使用公知的最近邻(NN)方法(非专利文献1)。在NN方法中,当从输入P1聚类Pn时,首先创建将P1用作代表模式的群集C1。接着,以Pi(其中,i>=2)为目标,比较离Cj(其中,j是群集编号)的距离。当所述距离小于预先定义的阈值时,使Pi属于最短距离的群集。当没有发现距离小于阈值的群集时,创建新的群集。通过对于所有输入P执行上述处理来实现聚类处理。
当应用上述方法作为颜色减少处理时,必需的可以是将输入应用于像素值(RGB值或照度值等)和将所述距离应用于颜色距离,诸如曼哈顿距离(Manhattan distance)(城区距离)和欧几里德距离(Euclidean distance)。在这种情况下,如果使颜色距离的阈值小,则其趋势是处理之后的群集的数量(颜色数量)增多并且颜色减少效果减弱。
在上述聚类处理之后,在步骤S302,从聚类结果指定构成背景区域的群集编号。可通过从矢量化处理的目标移除背景群集,而不输出移除的群集的部分的矢量数据,来产生通过背景区域的矢量数据。可通过选择例如在处理区域的最外围中的比例最高的群集编号来唯一地确定背景群集编号。
虽然通过上述颜色区域分割处理使扫描噪声从数万种颜色减少到几种颜色或数十种颜色,但是仍存在相当数量的颜色,并且扫描噪声没有被移除得足以应用矢量化处理。由于扫描噪声(比如,由扫描产生的错误颜色)保留,所以用于原样执行矢量化的数据尺寸大,从而可编辑性劣化。因此,为了通过组合噪声区域来创建适合于矢量化处理的颜色分离图像,在步骤S400,执行适合于矢量化的噪声组合处理(用于矢量化的噪声组合(S410-S470))。
首先,在步骤S410,对于在步骤S300创建的聚类处理结果的图像(索引图像)执行标记处理。标记处理是用于将相同编号给予具有相同值的链接像素组的处理,很好地用作用于获得关于每个区域的信息(尺寸、形状)的预处理。图3显示其聚类结果被编号替换的索引图像和通过对于前述索引图像执行标记处理而获得的结果的示例。也就是说,在图3的聚类结果中,对于被确定为相同颜色的每一个像素,给予相同的群集编号(A-E)。而且,在图3的标记结果中,将相同的标记编号(1-10)给予被分类为相同群集编号并且在垂直方向、水平方向和对角线方向中的任何一个上链接的每一个像素组(也就是说,由具有相同颜色并且被链接的像素构成的标记区域)。然而,图3显示输入图像30的放大部分31和32,并预先假定字母B的群集在图的范围外也有链接。
而且,需要准备如图4所示的用于将标记结果与群集编号相关联的转换表,以在执行标记处理时使用该转换表。
在上述标记处理之后,在步骤S420,为了检测不适合于矢量化的区域,执行对于标记区域的形状(被给予相同标记编号的区域的形状)的分析处理。具体地讲,在对于标记区域的形状的分析处理中,所述装置执行用以确定标记区域的形状的特性(诸如每个标记区域的尺寸)和标记区域的形状是否是线外形的处理。作为聚类处理的结果,不适合于矢量化的标记(诸如其尺寸非常小的标记区域和线外形的标记区域)主要是由于扫描噪声的影响而产生的。这些区域引起数据量的增加和可编辑性的劣化。因此,即使作为聚类处理的结果,确定这些区域为不同的颜色区域,也确定该区域是否能够与其它标记区域组合,并将能够被组合的区域组合以变为适合于矢量化的处理单元。
通过准备具有标记编号和与该编号对应的标记的尺寸的汇总表,可通过对于整个图像进行一次光栅扫描来获得标记区域的尺寸。通过在光栅扫描之后将每个标记区域的像素数量与第一阈值进行比较,可确定作为目标的标记区域是否是微小尺寸。假定输入扫描图像的分辨率是300dpi,则对于小于5个像素的标记区域,难以在视觉上确认,因此,罕见的是,即使当与其它区域组合时也发生视觉劣化。因此,在此后的处理中,将第一阈值设置为5,并将少于5个像素的像素数量的标记区域确定为微小尺寸。对于与输入分辨率或输入图像尺寸对应的第一阈值,可使用替代值。例如,由于当输入分辨率和输入图像尺寸大时,不会检测到视觉劣化的像素数量的上限变大,所以更有效的是使用更大的值。
以下,将参照图5中作为示例所示的标记对确定标记区域是否是线外形的方法进行说明。关于该标记区域的外接矩形尺寸,横向宽度是100个像素,纵向宽度是15个像素,像素数量是150个,位于黑色标记区域与白色标记区域之间的边界中的像素的数量(边界线的长度)是200个。
对于第一种方法,使用外接矩形的长宽比。计算长边与短边的长度之间的比率。如果计算的长宽比是大于预定长宽比阈值的值,则由于外接矩形是长而细的形状,所以确定标记区域是线外形。如果长宽比阈值被设置为5,则由于在图5中所示的标记区域的情况下通过以下公式获得大于阈值5的长宽比,所以可确定它是线外形的标记区域。
100(外接矩形的长边长度)/15(外接矩形的短边长度)=6.67
对于第二种方法,使用外接矩形的尺寸与标记区域的像素数量之间的比率。计算外接矩形的尺寸与实际标记区域的尺寸之间的比率。如果计算的面积比不大于预定的外接矩形阈值,则由于标记区域在外接矩形之中占据的尺寸小,所以可将它确定为线外形的标记区域。如果外接矩形阈值被设置为7,则由于在图5中所示的标记区域的情况下通过以下公式计算出大于阈值7的比率,则将它确定为线外形的标记区域。
100×15(外接矩形的尺寸)/150(标记区域的尺寸)=10
对于第三种方法,使用位于标记的边界中的像素数量(边界线的长度)与标记区域的尺寸之间的比率。计算与标记区域接触的边界线的长度与标记区域的尺寸之间的比率,并且由于如果计算的比率大于预定边界阈值,则边界线长,所以确定作为目标的标记区域是线外形。如果边界阈值被设置为1.0,则由于在图5中所示的标记区域的情况下通过以下公式计算大于阈值1.0的比率,所以可将它确定为线外形的标记区域。
200(其它标记区域之间的边界线的数量)/150(标记区域的像素数量)=1.33
图6显示通过将以上标记形状的确定方法组合到图4的转换表来添加检查的每个标记的形状信息的示例。
在上述标记形状的分析处理之后的步骤S430,优先将在步骤S420确定为微小尺寸的标记区域与不具有背景群集编号的邻接的标记区域组合。当微小尺寸的标记区域是构成线的一部分的像素组并且密集时,如果前述标记区域没有正确地与背景标记区域组合,则所述线可能断开。因此,通过预先将微小尺寸的标记区域与除了背景之外的其它标记区域组合来防止线断开。虽然还可能的是扫描噪声中出现的微小尺寸的标记区域变为背景图像之中的孤立点,但是由于可通过此后的处理将微小尺寸的标记区域与具有背景群集编号的标记区域组合,所以它没有变为问题。
在上述微小标记组合处理之后的步骤S440,选择组合源标记。从图像的左上朝向右下执行光栅扫描,依次选择组合源标记,从而确认不同的标记区域是否是向右和向下邻接。如果向右和向下这二者都具有相同的标记编号,则将下一个像素选择为作为目标的点。如果向右的标记和向下的标记中的至少一个与所述不同的标记邻接,则在步骤S450将这样的不同标记选择为组合目的标记。
在步骤S460中,根据图7的流程图中所示的噪声组合确定处理的过程确定是否组合在步骤S440和S450中选择的两个标记区域。使用前述两个标记的色调差和颜色距离作为确定标准。
在图7中所示的噪声组合确定处理中,使用从标记区域获得的特征量(标记区域的尺寸、形状、色调和颜色距离)和多个阈值来确定是否组合每个标记区域。首先,在步骤S461中,确定至少一侧的标记区域的尺寸是否不大于第一阈值。作为确定的结果,如果至少一侧的标记区域的尺寸不大于第一阈值(也就是说,它是微小尺寸),则在步骤S466将易于组合的阈值设置为第三阈值。由于考虑在目前阶段作为微小尺寸标记而剩下的标记区域是由于扫描噪声而出现的并且周边被背景群集包围的孤立点,所以可通过将阈值设置为低水平来移除扫描噪声。因此,当在步骤S461,至少一侧的标记区域的尺寸不大于第一阈值时,在步骤S467,将两个标记区域之间的颜色距离与第三阈值进行比较,而不考虑色调差。
当两个标记区域的尺寸都大于第一阈值时,该处理进入步骤S462,然后确认至少一侧的标记区域是否是线外形。当两个标记区域都不是线外形时,该处理进入步骤S463。
在步骤S463,检查至少一侧的标记区域的尺寸是否不大于第四阈值。这是为了防止尺寸大的标记区域之间的组合。当两个标记区域的尺寸都大于第四阈值时,完成噪声组合确定处理,而不执行标记的组合处理。当至少一侧的尺寸不大于第四阈值时,该处理进入步骤S465。
顺便提一下,当一侧的标记区域在步骤S462的确定中是线外形时,该处理进入步骤S464。在步骤S464,确定至少一侧的标记区域的宽度是否不大于根据输出矢量格式的类型而指定的第二阈值。如果当至少一侧的标记区域不大于第二阈值时通过绘制器显示矢量化的数据,则作为目标的标记区域不以准确的宽度显示,并且图像质量的劣化可能发生。因此,当至少一侧的标记不大于第二阈值时,省略步骤S465的色调差确认,然后该处理进入步骤S466。然后,在步骤S466,通过将用于在标记区域之间进行组合的颜色距离的阈值(第三阈值)设置为低水平来使作为目标的标记区域易于组合。另外,还可与输入图像的尺寸和/或分辨率对应地确定第二阈值。
当使用1或2作为第二阈值时,可使用如示例1中所述的标记区域的像素数量与标记区域的边界线之间的比率来进行检测。由于第二阈值表示标记区域宽度的下限,所以必需的仅仅是能够检测其标记区域宽度是1或2的标记。当计算标记区域的像素数量与标记区域的边界线之间的比率时,这样的标记区域具有这样的特性,即,不小于标记区域的像素数量的标记区域的边界线存在。此外,当第二阈值大于3时,通过使用本申请人提议的线宽检测方法来获得每个标记的线宽度,从而所获得的线宽度可用于在步骤S440进行确定。
在步骤S463的肯定确定的情况下或者在步骤S464的否定确定的情况下,在步骤S465检查两个作为目标的标记区域之间的色调差。通过将作为目标的像素的标记区域的颜色空间变到HSV中并且参照H的值来获得色调差。当该色调差不大于第五阈值时,该处理进入用于确定颜色距离的步骤S467。另一方面,当色调差大于第五阈值时,完成噪声组合确定处理,而不执行标记的组合处理。而且,在步骤S466,当通过参照H的值,两个标记区域都是接近黑色的颜色时,可将用于在步骤S467执行的颜色距离确定的第三阈值设置为更低水平。这是因为,黑色图像的颜色距离趋向于表现为远,并且黑色图像需要将阈值设置为用于组合相似的其它颜色的低水平。可通过检查两个标记区域的H的值是否不大于第六阈值来执行两个标记区域是否接近黑色的确定。
在步骤S467,检查两个作为目标的标记区域之间的颜色距离。RGB的曼哈顿距离(城区距离)和欧几里德距离可用于颜色距离。当该颜色距离不大于第三阈值时,在步骤S468设置噪声组合标志。当该颜色距离大于第三阈值时,完成噪声组合确定处理,而不组合两个标记。
作为以上噪声组合确定处理的结果,当确定执行噪声组合时,在图2中所示的流程图的步骤S470,组合两个所选标记区域。在组合处理中,用尺寸较大的标记编号重写尺寸较小的标记编号,并更新关于标记区域的形状信息。
图8显示对于图3的标记结果执行上述组合处理的结果。如所示,首先,在图3中,标记编号4的标记区域300(微小尺寸)与右上标记区域305组合,并被更新为标记编号3(微小尺寸)。接着,在图3中,标记编号5的标记区域310(微小尺寸)与更新的右上标记区域300组合,并被更新为标记编号3(微小尺寸)。类似地,标记区域320与更新的上标记区域300组合。结果,聚类结果和标记结果的组合处理之后的转换表显示在图9中。
当没有必要进行组合处理时和当组合处理完成时,在步骤S500中通过使用公知的矢量化方法(例如,专利文献3)执行到矢量数据的转换处理。提取组合处理之后的标记区域(每一种颜色的图像)的轮廓,并执行每个轮廓的函数的逼近,从而变为矢量数据并按照输出格式输出。在这种情况下,可逐个执行每个标记区域的轮廓的函数的逼近,并且可在对于每一边界线分割轮廓之后将相同函数逼近的结果应用于共享边界的标记。
(示例2)
示例1公开这样的示例,该示例显示当在图2中所示的流程图的步骤S450选择标记区域的组合目的的情况下首先找到满足条件的标记区域时执行组合。然而,本发明的范围不限于该示例。例如,可关于所有组合确认与标记区域邻接的区域是否可组合,并可组合具有最近颜色距离的标记区域。根据该方法,虽然与示例1中所述的方法相比处理时间变长,但是可产生更准确的标记区域(颜色分离图像)。
此外,当作为目标的标记区域是线外形时,作为目标的标记区域的端点在许多情况下适当地与将被组合的其它标记区域接触。因此,可将作为目标的标记区域组合到与作为目标的标记区域的端点接触的其它标记区域之中的具有最近颜色距离的其它标记区域。
(示例3)
示例1公开这样的示例,该示例显示在图2中所示的流程图的步骤S430将微小尺寸的标记区域与除背景群集之外的邻接的标记区域组合。然而,本发明的范围不限于该示例。当在步骤S430邻接微小尺寸的标记区域时,可成批地组合邻接的微小标记区域,并在此后的处理中将组合的标记区域当作作为整体的一个标记区域。在这种情况下,可通过组合微小尺寸的标记区域来防止微小尺寸的标记区域不正确地与具有背景群集编号的标记区域组合,因此,线断开的问题不发生。
(其它实施例)
本发明的方面还可通过系统或装置的计算机(或者诸如CPU或MPU的设备)和方法来实现,所述计算机读出并执行记录在存储设备上的程序用以执行上述实施例的功能,所述方法的步骤通过系统或装置的计算机例如读出并执行记录在存储设备上的用以执行上述实施例的功能的程序来执行。为了这个目的,例如经由网络或者从用作存储设备的各种类型的存储介质(比如,计算机可读介质)将所述程序提供给所述计算机。
尽管已参照示例性实施例对本发明进行了描述,但是应该理解,本发明不限于所公开的示例性实施例。应该给予以下权利要求的范围以最广泛的解释,以涵盖所有这样的修改以及等同结构和功能。
本申请要求于2009年7月1日提交的日本专利申请No.2009-156972的权益,本文特此通过引用并入该专利申请的全部内容。

Claims (12)

1.一种图像处理装置,包括:
聚类部件,其被配置为基于图像中所包括的每个像素的颜色将所述图像分类为多个群集;
背景群集指定部件,其被配置为在由所述聚类部件分类的所述多个群集之中指定背景群集;
标记部件,其被配置为将相同的标记编号给予被所述聚类部件分类为相同群集的每一个链接像素组;
第一组合部件,其被配置为将被所述标记部件给予相同标记编号的标记区域之中的尺寸小于第一阈值的标记区域与邻接的不是所述背景群集的另一个标记区域组合;
第二组合部件,其被配置为:在所述第一组合部件执行所述组合处理之后,基于从所述标记区域获得的特征量来确定是否将所述标记区域与邻接的另一个标记区域组合,并且当确定所述标记区域要被组合时,组合所述标记区域;和
产生部件,其被配置为基于由所述第二组合部件执行了所述组合处理的标记区域来产生矢量数据。
2.根据权利要求1所述的图像处理装置,还包括区域提取部件,其被配置为从所述输入图像提取图形区域,其中,
所述聚类部件被配置为基于被所述区域提取部件作为处理对象提取的图形区域中的图像中所包括的每个像素的颜色,来将所述图形区域中的所述图像分类为多个群集。
3.根据权利要求1所述的图像处理装置,其中,所述第二组合部件通过将所述标记区域的尺寸、形状、色调和颜色距离中的至少一个用作从所述标记区域获得的特征量来确定所述标记区域是否与邻接的另一个标记区域组合,并且当确定所述标记区域要被组合时,组合所述标记区域。
4.根据权利要求3所述的图像处理装置,其中,当确定所述标记区域的尺寸小于第一阈值时,所述第二组合部件基于关于所述标记区域与所述邻接的另一个标记区域之间的颜色距离是否不大于第三阈值的信息来确定是否将所述标记区域与所述另一个标记区域组合,并且当确定所述标记区域要被组合时,将所述标记区域和所述另一个标记区域组合。
5.根据权利要求4所述的图像处理装置,其中,当确定所述标记区域的尺寸不小于第一阈值时,所述第二组合部件确定所述标记区域的形状是否是线外形,并且当确定所述标记区域的形状是线外形时,还确定所述标记区域的宽度是否不大于第二阈值,
当确定所述标记区域的宽度不大于第二阈值时,基于关于所述标记区域与所述邻接的另一个标记区域之间的颜色距离是否不大于第三阈值的信息来确定是否组合所述标记区域和所述另一个标记区域,并且
当确定所述标记区域要被组合时,组合所述标记区域和所述另一个标记区域。
6.根据权利要求5所述的图像处理装置,其中,当确定所述标记区域的形状不是线外形时,所述第二组合部件还确定所述标记区域的尺寸是否不大于第四阈值,
当确定所述标记区域的尺寸大于第四阈值时,不组合所述标记区域,
当确定所述标记区域的尺寸不大于第四阈值时,还确定所述标记区域与所述另一个标记区域之间的色调差是否不大于第五阈值,
当确定所述色调差不大于第五阈值时,不组合所述标记区域,
当确定所述色调差不大于第五阈值时,基于关于所述标记区域与所述邻接的另一个标记区域之间的颜色距离是否不大于第三阈值的信息来确定是否组合所述标记区域和所述另一个标记区域,并且
当确定所述标记区域要被组合时,组合所述标记区域和所述另一个标记区域。
7.根据权利要求4所述的图像处理装置,其中,所述第二组合部件组合所述标记区域和首先被确定为到所述标记区域的颜色距离小于第三阈值的另一个标记区域。
8.根据权利要求4所述的图像处理装置,其中,所述第二组合部件组合所述标记区域和与所述标记区域邻接的其它标记区域之中的颜色距离最近的另一个标记区域,从所述其它标记区域到所述标记区域的颜色距离小于第三阈值。
9.根据权利要求4所述的图像处理装置,其中,所述第二组合部件优先组合到线外形的标记区域的颜色距离小于第三阈值的其它标记区域之中的、在所述线外形的标记区域的端点处接触的标记区域。
10.根据权利要求1所述的图像处理装置,其中,当与尺寸小于第一阈值的标记区域邻接地存在尺寸小于第一阈值的另一个标记区域时,所述第一组合部件组合所述标记区域和所述另一个标记区域。
11.一种在图像处理装置中执行的方法,所述方法包括以下步骤:
聚类步骤,基于图像中所包括的每个像素的颜色将所述图像分类为多个群集;
背景群集指定步骤,在所述聚类步骤分类的所述多个群集之中指定背景群集;
标记步骤,将相同的标记编号给予在所述聚类步骤被分类为相同群集的每一个链接像素组;
第一组合步骤,将在所述标记步骤被给予相同标记编号的标记区域之中的尺寸小于第一阈值的标记区域与邻接的不是所述背景群集的另一个标记区域组合;
第二组合步骤,在所述第一组合步骤执行所述组合处理之后,基于从所述标记区域获得的特征量来确定是否将所述标记区域与所述邻接的另一个标记区域组合,并且当确定所述标记区域要被组合时,组合所述标记区域;和
基于在所述第二组合步骤执行了所述组合处理的标记区域来产生矢量数据。
12.一种具有用于执行在图像处理装置中执行的方法的计算机可执行指令的计算机可读存储介质,所述方法包括以下步骤:
聚类步骤,基于图像中所包括的每个像素的颜色将所述图像分类为多个群集;
背景群集指定步骤,在所述聚类步骤分类的所述多个群集之中指定背景群集;
标记步骤,将相同的标记编号给予在所述聚类步骤被分类为相同群集的每一个链接像素组;
第一组合步骤,将在所述标记步骤被给予相同标记编号的标记区域之中的尺寸小于第一阈值的标记区域与邻接的不是所述背景群集的另一个标记区域组合;
第二组合步骤,在所述第一组合步骤执行所述组合处理之后,基于从所述标记区域获得的特征量来确定是否将所述标记区域与所述邻接的另一个标记区域组合,并且当确定所述标记区域要被组合时,组合所述标记区域;和
基于在所述第二组合步骤执行了所述组合处理的标记区域来产生矢量数据。
CN201080029816.7A 2009-07-01 2010-06-29 图像处理装置、图像处理方法和存储介质 Expired - Fee Related CN102473278B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2009-156972 2009-07-01
JP2009156972A JP2011013898A (ja) 2009-07-01 2009-07-01 画像処理装置、画像処理方法、及び、プログラム
PCT/JP2010/004295 WO2011001669A1 (en) 2009-07-01 2010-06-29 Image processing apparatus, image processing method, and storage medium

Publications (2)

Publication Number Publication Date
CN102473278A true CN102473278A (zh) 2012-05-23
CN102473278B CN102473278B (zh) 2014-04-16

Family

ID=43410756

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080029816.7A Expired - Fee Related CN102473278B (zh) 2009-07-01 2010-06-29 图像处理装置、图像处理方法和存储介质

Country Status (5)

Country Link
US (1) US8675256B2 (zh)
EP (1) EP2449523A4 (zh)
JP (1) JP2011013898A (zh)
CN (1) CN102473278B (zh)
WO (1) WO2011001669A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105430218A (zh) * 2015-11-27 2016-03-23 优渊商贸(上海)有限公司 图像色彩识别方法及装置
CN110753934A (zh) * 2017-06-14 2020-02-04 图森有限公司 主动选择和标记图像以进行语义分割的系统和方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5600524B2 (ja) 2010-08-27 2014-10-01 キヤノン株式会社 画像処理装置、画像処理方法、プログラム、および記憶媒体
JP5843474B2 (ja) * 2011-05-09 2016-01-13 キヤノン株式会社 画像処理装置、画像処理方法、及び、プログラム
WO2020068106A1 (en) * 2018-09-28 2020-04-02 Hewlett-Packard Development Company, L.P. Consolidated document generation
CN110378218A (zh) * 2019-06-13 2019-10-25 大亚湾核电运营管理有限责任公司 一种图像处理方法、装置及终端设备
US11341383B2 (en) * 2019-08-18 2022-05-24 Kyocera Document Solutions Inc. Methods and apparatus to detect effective tiling area and fill tiles efficiently
CN111507407B (zh) * 2020-04-17 2024-01-12 腾讯科技(深圳)有限公司 图像分类模型的训练方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06103371A (ja) * 1992-09-18 1994-04-15 Daikin Ind Ltd カラー画像処理方法およびその装置
JPH11288465A (ja) * 1998-02-06 1999-10-19 Fujitsu Ltd カラー画像処理装置及びパターン抽出装置
JP2006344069A (ja) * 2005-06-09 2006-12-21 Canon Inc 画像処理方法及び画像処理装置
US20080219553A1 (en) * 2005-08-23 2008-09-11 Toshio Akiyama Controlling format of a compound image

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3748172B2 (ja) 1998-12-09 2006-02-22 富士通株式会社 画像処理装置
JP4275866B2 (ja) * 2000-01-27 2009-06-10 富士通株式会社 カラー画像から文字列パターンを抽出する装置および方法
US7164797B2 (en) * 2002-04-25 2007-01-16 Microsoft Corporation Clustering
US7110596B2 (en) 2002-04-25 2006-09-19 Microsoft Corporation System and method facilitating document image compression utilizing a mask
KR100477656B1 (ko) 2002-07-27 2005-03-22 삼성전자주식회사 디지털 화질 개선 방법 및 장치
JP3950777B2 (ja) 2002-09-30 2007-08-01 キヤノン株式会社 画像処理方法、画像処理装置および画像処理プログラム
US7343046B2 (en) 2004-02-12 2008-03-11 Xerox Corporation Systems and methods for organizing image data into regions
US7623712B2 (en) * 2005-06-09 2009-11-24 Canon Kabushiki Kaisha Image processing method and apparatus
JP4799246B2 (ja) * 2006-03-30 2011-10-26 キヤノン株式会社 画像処理方法及び画像処理装置
JP4829835B2 (ja) 2006-06-12 2011-12-07 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム、及びコンピュータ読み取り可能な記憶媒体
JP5058575B2 (ja) 2006-12-12 2012-10-24 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
US7809189B2 (en) * 2007-01-12 2010-10-05 Arcsoft, Inc. Method for image separating
JP5173898B2 (ja) 2009-03-11 2013-04-03 キヤノン株式会社 画像処理方法、画像処理装置、及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06103371A (ja) * 1992-09-18 1994-04-15 Daikin Ind Ltd カラー画像処理方法およびその装置
JPH11288465A (ja) * 1998-02-06 1999-10-19 Fujitsu Ltd カラー画像処理装置及びパターン抽出装置
JP2006344069A (ja) * 2005-06-09 2006-12-21 Canon Inc 画像処理方法及び画像処理装置
US20080219553A1 (en) * 2005-08-23 2008-09-11 Toshio Akiyama Controlling format of a compound image

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105430218A (zh) * 2015-11-27 2016-03-23 优渊商贸(上海)有限公司 图像色彩识别方法及装置
CN105430218B (zh) * 2015-11-27 2018-07-24 优渊商贸(上海)有限公司 图像色彩识别方法及装置
CN110753934A (zh) * 2017-06-14 2020-02-04 图森有限公司 主动选择和标记图像以进行语义分割的系统和方法
CN110753934B (zh) * 2017-06-14 2023-10-03 图森有限公司 主动选择和标记图像以进行语义分割的系统和方法

Also Published As

Publication number Publication date
WO2011001669A1 (en) 2011-01-06
CN102473278B (zh) 2014-04-16
US8675256B2 (en) 2014-03-18
US20110128586A1 (en) 2011-06-02
JP2011013898A (ja) 2011-01-20
EP2449523A1 (en) 2012-05-09
EP2449523A4 (en) 2013-08-14

Similar Documents

Publication Publication Date Title
CN102473278B (zh) 图像处理装置、图像处理方法和存储介质
JP4646797B2 (ja) 画像処理装置及びその制御方法、プログラム
US8532374B2 (en) Colour document layout analysis with multi-level decomposition
KR100625755B1 (ko) 문자 인식 장치, 문자 인식 방법, 매체 처리 방법 및 문자 인식 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체
US8059896B2 (en) Character recognition processing system and computer readable medium storing program for character recognition processing
US7623712B2 (en) Image processing method and apparatus
US8488181B2 (en) Preserving user applied markings made to a hardcopy original document
JP5455038B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
US20110222776A1 (en) Form template definition method and form template definition apparatus
JP5669957B2 (ja) 西洋語の透かし処理をするための透かし画像の分割方法と装置
US7680339B2 (en) Image processing method and apparatus for edge detection in an image
JP4898531B2 (ja) 画像処理装置及びその制御方法、並びにコンピュータプログラム
US11568623B2 (en) Image processing apparatus, image processing method, and storage medium
JP4077919B2 (ja) 画像処理方法及び装置及びその記憶媒体
US6360006B1 (en) Color block selection
US8351102B2 (en) Image-processing device, image-reading device, image-forming device, image-processing program, and image-processing method
JP5767549B2 (ja) 画像処理装置、画像処理方法、およびプログラム
AU2007237365B2 (en) Colour reproduction in a colour document image
JP5012551B2 (ja) 情報処理装置およびプログラム
JP4854398B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2010033464A (ja) 画像検索装置、画像検索方法、情報処理プログラム及び記録媒体
JP6676955B2 (ja) 画像処理装置及び画像処理プログラム
JP2001043312A (ja) 文書画像処理装置
JP2007228418A (ja) 情報処理装置及びその制御方法、画像処理システム、コンピュータプログラム、記憶媒体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140416

Termination date: 20210629