CN1620094A - 用于将图像转换为预定格式的图像处理设备及方法 - Google Patents

用于将图像转换为预定格式的图像处理设备及方法 Download PDF

Info

Publication number
CN1620094A
CN1620094A CNA2004100952241A CN200410095224A CN1620094A CN 1620094 A CN1620094 A CN 1620094A CN A2004100952241 A CNA2004100952241 A CN A2004100952241A CN 200410095224 A CN200410095224 A CN 200410095224A CN 1620094 A CN1620094 A CN 1620094A
Authority
CN
China
Prior art keywords
image
attribute
vector
data
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2004100952241A
Other languages
English (en)
Other versions
CN100379239C (zh
Inventor
加藤进一
松久保勇志
矢口博之
西川英一
辻博之
木虎正和
关口贤三
吉田广义
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of CN1620094A publication Critical patent/CN1620094A/zh
Application granted granted Critical
Publication of CN100379239C publication Critical patent/CN100379239C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/40Software arrangements specially adapted for pattern recognition, e.g. user interfaces or toolboxes therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • G06V10/945User interactive design; Environments; Toolboxes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/248Aligning, centring, orientation detection or correction of the image by interactive preprocessing or interactive shape modelling, e.g. feature points assigned by a user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/987Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns with the intervention of an operator

Abstract

本发明涉及用于将图像转换为预定格式的图像处理设备及方法。根据本发明,一种图像处理设备包括:读取装置,用于读取图像,生成代表该图像的图像数据;分割装置,用于将读取装置读取的图像数据分割为与属性相应的多个对象;选择装置,用于选择所述图像的预定属性;向量化装置,用于根据所述选择装置所选择的预定属性,对所述分割装置分割的图像数据进行向量转换处理;以及输出装置,用于输出经过所述向量化装置处理的图像数据。

Description

用于将图像转换为预定格式 的图像处理设备及方法
技术领域
本发明涉及图像处理设备和图像处理方法。具体地,本发明涉及能够在对输入的图像数据进行向量转换之后将图像数据输出的图像转换设备和图像转换方法。
背景技术
随着环境问题引起注意,无纸化办公已经越来越多地广泛传播。为了实现无纸化办公,已经提出了以可移植文档格式(下面称为PDF,Portable Document Format)在图像存储设备中存储图像,并管理所存储的图像的文档管理系统,或者将图像传输到远程低点的图像通信系统(例如见提本专利公开No.2001-358857)。在这些系统中,已经存在于案卷中的纸件文档或者类似文档可以用扫描仪读取,将读取的图像转化为PDF格式。
尽管纸件文件可以被存储为PDF文件,并且在上述文档管理系统中每一个PDF的信息量较小,但是难以重新使用对应于纸件文档中的PDF文件中的具有各种属性的对象(例如图形和表格),因为文件本身是图像信息。因此,为了重新使用对应于纸件文档的PDF文件中的所需的对象,需要使用用于编辑图形或者表格的应用软件重新生成对应于所述所需对象的内容。
发明内容
本发明提供了一种能够解决上述问题的图像处理设备和图像处理方法。
本发明提供了一种图像处理设备和图像处理方法,能够根据应用或者目的生成具有合适的数据结构的数据文件。本发明还提供了一种图像处理设备和图像处理方法,能够将被包括在输入图像数据中的多个对象中的指定对象转换为所需的格式。本发明还提供一种图像处理设备和图像处理方法,其中,被包括在通过读取文档图像获得的图像数据中的具有所需属性的对象能够获得向量化数据。
根据本发明的一个方面,一种图像处理设备包括:读取装置,用于读取图像,生成代表该图像的图像数据;分割装置,用于将读取装置读取的图像数据分割为与属性相应的多个对象;选择装置,用于选择所述图像的预定属性;向量化装置,用于根据所述选择装置所选择的预定属性,对所述分割装置分割的图像数据进行向量转换处理;以及输出装置,用于输出经过所述向量化装置处理的图像数据。
根据本发明的另一方面,一种图像处理方法包括下列步骤:获取表示图像的图像数据;将所述图像数据分割为与属性相应的多个对象;选择所述图像的预定属性;根据所选择的预定属性,对所述经过分割的图像数据进行向量转换处理;以及输出经过所述向量转换处理的图像数据。根据本发明的又一方面,存储在存储介质中的计算机可读程序包括可由计算机执行的用于执行上述方法的指令。
从结合附图对实施例的详细说明可以更加清楚本发明的上述以及其它特征。
附图说明
图1是本发明第一实施例的图像处理系统的框图;
图2是本发明第一实施例的多功能外设(MFP,multifunctionperipheral)的框图;
图3是由本发明第一实施例的图像处理系统执行的整体处理的总体流程图;
图4A到4C图解了根据本发明第一实施例的操作屏幕的例子;
图5A和5B图解了根据本发明第一实施例的块选择的概念;
图6包括一些表格,用于图示根据本发明第一实施例的块信息的例子;
图7图示了根据本发明第一实施例的向量转换;
图8图解了本发明第一实施例的向量转换;
图9是流程图,用于图示根据本发明第一实施例进行的对向量数据分组的处理;
图10的流程图详细图示了根据本发明第一实施例检测图形元素的处理;
图11图解了根据本发明第一实施例,文档分析输出格式(document analysis output format,DAOF)中的数据结构;
图12的流程图图示了根据本发明第一实施例的应用数据转换处理;
图13的流程图详细图示了根据本发明第一实施例生成文档结构树的处理;
图14A到14B图解了根据本发明第一实施例的文档结构树;
图15是本发明第二实施例的图像处理系统的框图;
图16是本发明第二实施例的MFP的框图;
图17是由本发明第二实施例的图像处理系统执行的整体处理的总体流程图;
图18图解了根据本发明第三实施例的操作屏幕的例子;
图19A到19C图解了根据本发明第三实施例的操作屏幕的例子;
图20A到20D图解了根据本发明第三实施例的操作屏幕的例子。
具体实施方式
下面结合附图描述本发明的实施例。
第一实施例
图1是本发明第一实施例的图像处理系统的框图。
参见图1,多个能外设(MFP)100、客户计算机101以及大力服务器103被连接到设置在办公室A中的局域网(LAN)102。MFP 100是执行多种功能的复杂机器,所述多种功能包括复印功能、打印功能、文件传输功能以及传真功能等。客户计算机101接收从MFP 100传输的数据,或者利用MFP 100执行的功能,LAN 102通过代理服务器103连接到网络104。
MFP 100可以根据例如从客户计算机101传输的打印数据打印印刷材料。示于图1的结构只是一个例子,分别具有类似于办公室A的部件的多个办公室可以连接到网络104。
网络104一般是所谓的通信网络比如因特网、LAN、广域网(WAN)、电话线、专用数字线、异步传输模式线路、帧中继线、通信卫星线路、有线电视线路、用于数据广播的无线通信线路,或者这些线路的组合。网络104可以是任何网络,只要其能够传输和/或接收数据即可。
各种客户计算机101终端和代理服务器103各包括在通用计算机中提供的标准部件(例如中央处理器(CPU)、随机存取存储器(RAM)、只读存储器(ROM)、硬盘、外部存储器、网络接口、显示器、键盘以及鼠标等)。
下面结合图2详细说明MFP 100的结构。
图是本发明第一实施例的MFP 100的框图。
见图2,用光源(未图示)照射一批文档或者一个文档上的图像,从透镜反射的图像(未图示)会聚到固态图像感测器件(未图示)上,包括自动文档喂送器(ADF,automatic document feeder)的图像读取单元110从所述固态图像感测器件读出光栅图像信号,作为具有预定密度(例如600点每英寸(dpi))的图像信息(光栅图像)。
MFP 100具有在打印单元112中将对应于读取的图像信号的图像打印到记录介质上的复印功能。当复印一个文档图像时,在数据处理单元115中处理读取的图像信号以生成要在打印单元中打印到记录介质上的记录信号。相反,当复印多个文档图像时,对应于一页的记录信号被临时存储在一个存储单元111中,所存储的记录信号被顺序输出到所述大于等于112,在该大于等于112中,输出的记录信号被打印到记录介质上。在数据处理单元115(包括CPU、ROM和RAM)中,RAM载入存储在ROM中的程序,CPU执行该程序以执行如下所述的流程图中的处理。
在通过网络接口(I/F)114进行传输时,从图像读取单元110提供的图像信号被转化为具有图像压缩文件格式的图像文件,所述格式比如是标签图像文件格式(tag image file format(TIFF))或者联合图像专家组(Joint Photographic Experts Group(JPEG))格式,或者为向量数据文件格式,比如PDF,所转换的图像文件通过网络接口114被输出。输出的图像文件通过LAN 102被传输到客户计算机101,或者通过网络104被传输到外部终端(例如另一个MFP或者另一个客户计算机)。
在打印机单元112中进行打印时,例如,从客户计算机101输出的打印数据通过网络接口114被提供到数据处理单元115。数据处理单元115使得打印单元112将打印数据转换为能够被打印的光栅数据,并在打印介质上形成图像。
操作者通过操作单元113比如被包括在MFP 100中的按键操作单元和显示单元116比如触控板向MFP 100输入指令。由数据处理单元115中的CPU控制操作序列。在显示单元116上显示操作者的输入状态以及在处理中的图像数据。
存储单元111例如是高容量硬盘。存储单元111具有存储和管理图像读取单元110读取的图像数据和从客户计算机101传输来的图像数据的数据库。
具体地,根据本发明,可以结合通过对图像数据向量化而获得的向量数据文件管理图像数据。取决于应用或者目的,MFP 100的结构可以被配置为管理图像数据和向量数据文件中的至少一种。
处理的概要
下面结合图3描述第一实施例的图像处理系统执行的整个处理的概要。
图3的流程图图示了本发明第一实施例的图像处理系统执行的整个处理的总体情况。
在步骤S121,在将文档设置到MFP 100中的图像读取单元110中后,过程根据通过使用在操作单元113中提供的向量扫描选择键进行的操作来选择向量扫描。
向量扫描的意思是:在读入的文档图像中对输入的图像数据(光栅图像数据)进行向量转换的一系列处理。将输入的图像数据中的字符区域转换为文本(Text)代码,将输入的图像数据中的细线和图形区域用函数进行编码。换句话说,扫描文档和将扫描的输入文档数据转换为向量数据的处理被定义为向量扫描。下面结合图5A和图5B及其后面的附图详细描述在向量扫描中执行的向量转换步骤。
回到图3。在步骤S122,过程基于通过操作单元113进行的操作通过使用向量模式选择键来选择所需的向量模式。
在后面将结合图4A到图4C详细描述通过使用操作单元113执行的与向量扫描相关的操作。
在操作了开始键以启动向量扫描之后,在步骤S123,过程读取设置在图像读取单元110中的文档上的图像,并在指定的向量模式激活向量扫描。
在向量扫描中,首先,扫描一个文档,并读入一个光栅图案,以获得例如60dpi和8位的图像信号。在步骤S124,过程在数据处理单元115中对图像信号进行预处理,并将处理后的图像信号在存储单元111中保存,作为对应于一页的图像数据。
数据处理单元115中的CPU在步骤125和126对存储在存储单元111中的图形数据进行用于向量转换的预处理,然后在步骤S127对处理后的数据进行向量转换。
在步骤S125,过程在数据处理单元115中执行块选择(BS)。
具体地,过程将存储在存储单元111中的待处理图像信号分割为字符/艺术线条(line-art)区域和半色调图像区域。字符/艺术线条(line-art)区域被进一步分为每一段的块,或者用线条画出的表格或者图形。
半色调图像区域被进一步分为对象(块),比如方形块的图像子区域和北京子区域。
在这种情况下,要被分割的对象的属性是根据在步骤S122所选择的向量模式所确定。
例如,当将文本/图形/表格/图像(Text/Graphic/Table/Image)模式指定为向量模式时,图像信号被分割为具有文本(Text)(字符)、图形(Graphic)(细线和图形)、表格(Table)、图像(Image)和背景(BackGround)属性的对象(块)。当指定Text模式为向量模式时,图像信号被分为具有Text(字符)和BackGround(背景)属性的对象(块)。
在BackGround(背景)属性方面,例如,当指定Text模式时,由于除了具有Text(字符)属性的对象之外的区域具有BackGround(背景)属性,BackGround(背景)就不被包括在向量模式的选择中。文本模式可以用文本/背景(Text/BackGround)表示。
下面描述向量模式的例子。
1)文本/图形/表格/图像(Text/Graphic/Table/Image)模式
图像被分割为具有文本(Text)(字符)、图形(Graphic)(细线和图形)、表格(Table)、图像(Image)和背景(BackGround)属性的对象(块)。
2)文本/图形/图像(Text/Graphic/Image)模式
图像被分割为具有文本(Text)(字符)、图形(Graphic)(细线、图形和表格)、图像(Image)和背景(BackGround)属性的对象(块)。
3)文本/图像(Text/Image)模式
图像被分割为具有文本(Text)(字符)、图像(Image)(细线、图形、表格和图像)和背景(BackGround)属性的对象(块)。
4)文本(Text)模式
图像被分割为具有文本(Text)(字符)和背景(BackGround)(细线、图形、表格、图像和背景)属性的对象(块)。
5)图像(Image)模式
图像被分割为具有图像(Image)(字符、细线、图形、表格和图像)和背景(BackGround)属性的对象(块)。尽管此模式中的数据不被转换为所谓的向量数据,数据量仍然可以保持较小,同时保持一定水平的图像质量,因为对具有Image属性的数据和具有BackGround属性的数据进行不同的处理,如下所述。
如上所述,相邻模式定义被块选择所分割的对象的属性,还定义要应用向量转换的对象的属性。换句话说,在确定了对象的属性之后,改变随后的分割方法以对具有所需属性的对象进行向量转换。
尽管在第一实施例中距离说明了文本(Text)(字符)、图形(Graphic)(细线和图形)、表格(Table)、图像(Image)和背景(BackGround)属性,但是不限于这些属性。取决于应用或者目的,可以指定其它属性。所有属性都不一定非指定不可。
作为向量模式,尽管在第一实施例中举例说明了文本/图形/表格/图像(Text/Graphic/Table/Image)模式、文本/图形/图像(Text/Graphic/Image)模式、文本/图像(Text/Image)模式、文本(Text)模式和图像(Image)模式,但是不限于这些向量模式。取决于应用或者目的,可以指定其它相邻模式。所有向量模式都不一定非指定不可。
对于整个输入图像信息,在对每一个属性分割的每一个对象(块)中进行向量转换,以将图像数据转换为向量数据文件。
回到图3。在步骤S126,过程对在步骤S125由块选择获得的字符块进行光学字符识别(OCR)。
在步骤S127,过程识别经过了OCR处理的字符块中的字符的字号、字体(style)和字型(font),并将字符块中被识别的数据转换为在视觉上接近扫描文档获得的字符的字形数据(font data)。相反,该过程对于线条画出的表格和图形块进行轮廓描述/函数近似。该过程将图像块转换为单独的JPEG文件作为图像数据。
例如,当在步骤S122指定文本/图形/表格/图像(Text/Graphic/Table/Image)模式时,具有文本(Text)(字符)属性的对象在步骤S127被转化为字形数据。具有图形(Graphic)(细线和图形)属性的对象被向量转换为轮廓描述以及功能近似函数(function-approximated function)。在具有表格(Table)属性的对象中,表格中的数值信息被转换为字形数据,表格则被向量转换为轮廓描述和功能近似函数(function-approximated function)。所述数值信息相互关联起来作为单元格信息,并被编码为表格对象。
具有图像(Image)属性的对象则经过轻度压缩(例如轻度JPEG压缩),同时保持图像读取单元110中的读取分辨率600dpi,并被保存。具有背景(BackGround)属性的对象则在将读入的分辨率600dpi改变为低分辨率(例如300dpi的分辨率)后经过高度压缩(例如高度JPEG压缩),并被存储。
所述轻度压缩被定义为压缩率低于预定压缩率(例如50%)的压缩,所述高度压缩被定义为压缩率高于预定压缩率的压缩。
当在步骤S122指定文本(Text)模式时,具有文本(Text)(字符)属性的对象在步骤S127被转换为字形数据,具有图形(Graphic)(细线和图形)、表格(Table)和图像(Image)属性的剩余对象按照与具有背景(BackGround)属性的对象相同的方式被处理。也就是,这些对象在将分辨率改变为300dpi后经过高度压缩,并存储为JPEG格式。
如上所述,在指定向量模式的向量转换中改变(控制)要处理的属性允许根据应用或者目的任意改变所产生的向量数据文件的容量或者图像质量。
在完成步骤S127的向量转换后,在步骤S128,过程在存储单元111中存储每一个对象(块)的布局信息,作为向量数据文件。
在步骤S129,取决于向量扫描的目的,对存储单元111中存储的向量数据文件进行后期处理。
在例如用于复印的后期处理中,进行对于每一对象最适合的图像处理,不可色彩处理和空间频率校正,然后在打印单元12中将处理后的数据打印出来。在用于文件存储的后期处理中,将文件保存到存储单元111中。在用于文件传输的后期处理中,将文件转换为作为能够在目标设备中重新使用的格式的通用文件格式,比如多信息文本格式(rich text format(RTF))或者可缩放向量图形(scalable vectorgraphic(SVG))格式,并通过网络接口114传输到目标设备(例如客户计算机101)。
通过上述处理获得的向量数据文件包括在视觉上更接近读入的文档图形的、可编辑格式的所有向量信息。这样的向量信息能够被直接处理或者重新使用,或者可以被存储、传输或者重新打印。
由于在上述处理所生成的向量数据文件中,是用描述代码表示字符和细线,与简单地直接处理图像数据(光栅位图数据)的情况相比,信息量减少了,提高了存储效率,节约了传输时间。另外,向量数据文件中的数据的很大的优点是记录和显示的高质量。
下面说明根据向量模式改变要应用向量转换的属性的图像处理系统的优点。
例如,当指定文本/图形/表格/图像(Text/Graphic/Table/Image)模式作为对图像进行向量化的相邻模式以仅仅对图像中具有文本(Text)属性的部分进行向量化并重复使用它时,在向量转换之后,具有Text属性的部分之外的部分也被向量化,从而,提取和是用具有Text属性的部分的操作变得复杂。因此,在这种情况下,如果指定Text模式作为向量模式,则会自动生成只将具有Text属性的部分向量化了的向量数据文件,从而容易仅仅提取具有Text属性的部分并执行后期处理。
在不使用向量模式的向量转换中,例如当图像的形状在向量转换后与原始光栅图像的形状有很大的变化时,正常地执行将数据分割为对应于该图像中可识别的所有属性的对象的向量转换(根据第一实施例,对应于文本/图形/表格/图像(Text/Graphic/Table/Image)模式)。当这样的向量转换改变具有Graphic和/或Table属性的对象的形状时,需要手工调整具有Graphic和/或Table属性的对象在向量转换后的形状。
相反,根据第一实施例,提供了Text/Image(文本/图像)模式作为向量模式。从而,当指定Text/Image(文本/图像)模式时,具有Graphic或者Table属性的对象被当作具有Image属性的对象处理,具有Graphic或者Table属性的对象的光栅图像可以作为JPEG数据存储而不执行向量转换。换句话说,当训练数据的形状不同于光栅数据时,如上所述,只指定Text/Image(文本/图像)模式作为向量模式可以防止原始光栅图像和向量数据之间出现形状的差异,从而对于与光栅数据的匹配而言提高了方便性,改善了图像质量。
改变向量模式允许对于步骤S129中的每一个后期处理,对对象应用最优的向量属性。
例如,在复印时指定Text/Image(文本/图像)模式。在Text/Image(文本/图像)模式下,只有字符被向量化,以改进字符质量,而对于其它的对象不进行向量转换,以便相对于原始文档有高的保真度。在文件传输时,考虑到每一个向量化对象在例如客户计算机101中的可重复使用性,指定文本/图形/表格/图像(Text/Graphic/Table/Image)模式。这样,取决于每一个后期处理的应用或者目的,可以选择最优的向量模式。
操作单元113和显示单元116的描述
图4A到图4C图解了本发明第一实施例的操作屏幕的例子。
具体地,这些操作屏幕是对应于操作单元113和显示单元116的操作屏幕的例子。
图中所示的,例如图4A到4C所示的举例的屏幕的结构被设计为将操作单元113和显示单元116与之集成起来。尽管在这里的例子中操作单元113和显示单元116和触控板和液晶显示器(LCD),但是操作单元113可以是单独的硬键或者鼠标指点设备,显示单元116可以是单独的阴极射线管(CRT)显示器或者类似设备。
图4A所示的操作屏幕10000是第一实施例的MFP 100的基本操作屏幕。是用操作屏幕10000上的应用模式键100000进行第一实施例中向量扫描功能的选择。
应用模式键100000的按下将操作屏幕10000切换到图4B所示的应用模式屏幕10001,其具有在MFP 100中提供的作为应用模式的各种模式。
示于图4B的应用模式屏幕10001包括向量化(Vectorize)键100010,该键是一个激活上述向量扫描功能(图3中的步骤S121)的选择键。向量化(Vectorize)键100010的按下会显示如图4C所示的操作屏幕10002。
在操作屏幕10002上,开始读取(Start reading)键100020是用于指示开始读取文档的扫描的键。开始读取(Start reading)键100020的按下使得图像处理系统读取文档。一个向量模式选择键100021是用于选择上述向量模式的键。在选择了向量模式(图3的步骤S122)后,按下开始读取(Start reading)键100020开始扫描操作。
示于图4C的操作屏幕10002还包括一个向量模式选择键100021,后者在每当按下向量模式选择键100021时切换内容(向量模式)。尽管如上所述可以在该操作屏幕上选择任何模式,例如文本/图形/表格/图像(Text/Graphic/Table/Image)模式、文本/图形/图像(Text/Graphic/Image)模式、Text/Image(文本/图像)模式、文本(Text)模式和图像(Image)模式,但是选择向量模式的方法不限于此。
例如,可以有针对每一种可用属性(文本(Text)、图形(Graphic)、表格(Table)和图像(Image))的复选框,可以优操作者以任何组合加以选择。在这种情况下,当操作者选择了Text和Image时,就执行类似于Text/Image(文本/图像)模式的模式。或者,可以设计包括各种向量模式的下拉菜单,操作者可以从该下拉菜单选择所需的向量模式。
下面详细描述图3中的步骤S125的块选择。
块选择是例如将光栅图像比如图5A所示的图像识别为有意义的块(如图5B所示),确定每一个快的属性(文本/图形/图像/表格或者其它属性),并将光栅图形分割为具有不同属性的块的过程。
下面描述块选择的一个实施例。
首先,将输入的图形二值化为白像素和黑像素,跟踪黑像素轮廓以提取被黑像素轮廓保卫的像素块。在大的黑像素块中,跟踪白像素轮廓以提取被白像素轮廓包围的像素块。另外,从面积大于预定面积的白像素块递归地(嵌套地)提取黑像素块。
将这样获得的黑像素块根据其大小和形状分类为子块,以获得具有不同属性的块。例如,长宽比接近1且大小在预定范围内的快被分类为对应于一个字符的像素块;相邻字符线状排列并可以聚为组的部分被分类为字符块;扁平的像素块被分类为直线块;被大小大于预定尺寸的黑色素块占据、其中线状排列了矩形白像素块的部分被分类为表格块;其中散布了无法确定的像素块的区域被分类为图像块;其它具有任意形状的像素块被分类为图形块。
在块选择中,给出标识每一个块的块ID,每一个块与属性(图像、字符等)、大小和在每一个块的原始文档中的位置(坐标)相关联,所有关联数据被作为块信息存储在存储单元111中。所述块信息在下面结合图6详细描述的步骤S127中用于向量转换。
图6包括表示本发明第一实施例的块信息的例子的表格。
如图6所示,所述块信息包括表示每一个块的属性的块属性(1:TEXT,2:GRAPHIC,3:TABLE,4:IMAGE)、块的位置坐标(X,Y)、块的宽度W和高度H,以及是否存在有关该块的OCR信息(文本数据)。
块的位置坐标(X,Y)是将文档图像的左上角设置为原点(0,0)时的位置坐标,宽度W和高度H例如用像素数表示。在块选择中,除了所述块信息之外,还生成输入文件信息,表示在文档图像(输入文件)中存在的块数N。在图6所示的例子中,输入文件信息N等于6。
下面详细描述图3中的步骤S126中的OCR。
这里使用已知的OCR技术进行字符识别处理。
字符识别处理
在字符识别处理中,对从字符块中切出的字符图像以字符为单位使用模式匹配方法进行字符识别,获得相应的字符代码。具体地,字符识别处理比较观察到的特征向量和为每一个字符类型提供的词典特征向量,产生最接近词典字符向量的字符类型作为识别结果,所述观察到的特征向量是通过将从字符图像获得的特征转换为具有几十个维数的数字串而得到的。
可以用各种已知的方法提取特征向量。在一种方法中,将字符分割为网格图案,通过一个维数对应于网格数的向量作为特征向量,该向量是通过对作为线元素的每一个方向计数每一个网格块中的字符线数而得到的。
为了对字符块执行字符识别处理,首先,判断字符块是水平书写的还是数值书写的。在相应的方向切分字符串,然后将字符从字符串中切出以获得字符图像。
在判断水平书写或者竖直书写时,在字符块中获得对像素值的水平或者竖直投影。当水平投影变化较大时,可以判断相应的字符块是水平书写的。当竖直投影变化较大时,可以判断相应的字符块是竖直书写的。在分割为字符串和字符时,当字符块水平书写时,使用水平投影来切分行,对于切出的行,用竖直投影切分字符。相反,当字符块竖直书写时,执行与水平书写相反的处理。
在字符识别处理中还探测字符的大小。
下面详细说明图3中的S127中的向量转换。
首先,在步骤S126用OCR获得的字符块中,对于每一个字符进行字型识别处理。
字型(font)识别处理
对于每一种字符形状,也就是对于每一种字型形状,提供用于字符识别处理的、对应于字符类型数量的词典特征向量。在识别字符字型的匹配过程中与字符代码一起输出字型类型。
字符的向量转换
根据预先准备的轮廓数据,使用字符识别处理获得字符代码和字型识别处理获得的字型信息,将有关字符的信息转换为向量数据。当文档图像上彩色图像时,与向量数据一起记录从彩色图像提取的每一个字符的颜色。
通过上述处理,可以将有关字符块的图像信息转换为具有大致忠实于文档图像的形状、大小和颜色的向量数据。
字符之外的部分的向量转换
对于字符块之外的图形、线条或者表格块,将从对应的块提取的像素块的轮廓转换为向量数据。
具体地,在被视为角部的点限定形成轮廓的像素的点的序列,将所限定的线段近似为局部的直线或者曲线。所述角部是指具有最大曲率的点。如图7所示,如果在分别与任意点Pi相隔k段弧的点Pi-k和Pi+k之间画一条弦,则在该弦和该点Pi之间的距离最大的点是具有最大曲率的点。
如果点Pi-k和点Pi+k之间的弦长除以弧的总长得到的结果为R,则R小于阈值的点被视为一个角部。在用角部分割线段之后,可以通过对点的序列使用计算表达比如最小二乘法来对直线向量化,可以使用三次仿样函数(cubic spline function)或者类似函数对曲线进行向量化。
如果一个对象具有内部轮廓,则使用用所述块选择提取的白像素轮廓的点的序列将线段近似为局部直线或者曲线。
如上所述,可以用轮廓的线段近似来对具有任意形状的图形的轮廓进行向量化。如果文档图像是彩色图像,则与所述向量数据一起记录从所述彩色图像提取的每一个图形的颜色。
如果在一个线段中,一个外部轮廓与一个内部轮廓或者另一个轮廓相邻,则,如图8所示,可以通过将这两条线放在一起来将这两个轮廓表示为具有一定宽度的线。
具体地,如果从一个轮廓上的点Pi-1、Pi、Pi+1和Pi+2分别向另一个轮廓上的与点Pi-1、Pi、Pi+1和Pi+2之间分别具有最短距离的点Qi-1、Qi、Qi+1和Qi+2画线,并且所述距离PQi的平均值小于一个预定的长度,则所述距离PQi的中值被近似为直线或者曲线,作为目标线段中的点的序列,并将所述线的宽度设定为所述距离PQi的平均值。表格中的格线是多个线或者多个线的集合,可以用向量有效地表示为具有一定宽度的线的集合。
在对字符块进行字符识别处理的向量转换中,将最接近词典特征向量的字符用作识别结果。但是,当与词典特征向量的距离大于预定值时,该字符不一定与原始字符一致,常见的情况是被错误地识别为具有类似形状的特征。
因此,根据第一实施例,将这样的字符块按照与一般的艺术线条(line art)相同的方式进行处理,提取字符块的轮廓。换句话说,在已知的字符识别处理中可能导致识别错误的字符不被向量化为错误的字符,因此可以使用轮廓提取处理(outlining process)来进行向量转换,产生在视觉上忠实于图像数据的向量数据。
图像块被作为图像数据处理,对图像块不执行向量转换。
下面结合图9描述分组处理,其中,对于每一图形块,对向量转换所获得的向量数据进行分组。
图9的流程图图示了本发明第二实施例的向量数据分组处理。
在步骤S700,过程计算每一向量数据的起始和结束点,过程使用有关每一向量数据的起始和结束点的信息检测图形元素。
这里,检测图形元素的意思是检测由线段形成的闭合图形。对于所述检测,应用的原则是:形成闭合形状的每一个向量在其相对两端具有连通的向量。
在步骤S702,过程对在检测到的图形元素中存在的其它图形元素或者线段分组,以形成一个图形对象。如果爱检测到的图形元素中不存在其它图形元素或者线段,则将该图形元素作为一个图形对象处理。
下面结合图10详细描述图9中的步骤S701中对图形元素的检测。
图10为一个流程图,详细图示了本发明第一实施例中步骤S701中检测图形元素的处理。
在步骤S710中,所述处理从向量数据中删除在相对两端不具有连通向量的非必要的向量,以提取闭合图形结构化向量。
在步骤S711,所述处理顺序从开始点按照顺时针方向顺序跟踪所述闭合图形结构化向量(closed-graphic structuring vectors),所述开始点被设置为相应向量的初始点。所述跟踪一直持续到返回开始点,所经过的所有向量被分组到一个闭合图形中,形成一个图形元素。另外,对该闭合图形中的所有闭合图形结构化向量进行分组。从被设置到没有被分组的向量的初始点的开始点开始重复同样的步骤。
在步骤S712,从在步骤S710中删除的不必要的向量当中,所述处理检测与在步骤S711中被分组为闭合图形的向量相连通的向量(闭合图形连通向量,closed-graphic connected vectors),以将检测到的向量分组到一个图形元素中。
上述处理允许将图形块当作可以单独重复使用的单独的图像对象加以处理。
通过示于图3的步骤S125中的块选择、步骤S126中的OCR和步骤S127中的向量转换获得的数据被转换为具有图11所示的中间数据格式的文件。这样的数据格式被称为文档分析输出格式(documentanalysis output format(DAOF))。
下面结合图11描述DAOF的数据结构。
图11图解了本发明第一实施例的DAOF的数据结构。
见图11,标题791存储有关要处理的文档图像的信息。布局描述数据区792存储对于文档图像中的每一个属性识别的每一个块的属性信息,以及所述块的矩形地址信息。所述属性包括文本(Text)(字符)、标题(Title)、字幕(Caption)、艺术线条(Lineart)、图像(Picture)(自然图像)、框(Frame)和表格(Table)。
字符识别描述数据区793存储通过识别具有Text、Title、Caption等属性的文本(Text)块而获得的字符识别结果。
表格描述数据区794存储表格(Table)块的详细结构。图像描述数据区795存储图形(Graphic)、图像(Image)和其它块的切出的图像数据。
DAOF不仅被作为中间数据加以存储,而且被转换为用于存储的文件。在文件状态下,在通常的文档准备应用中,单独的对象(块)不能被重新使用。
因此,根据第一实施例,在图3的步骤S128的向量转换之后,或者作为图3中步骤S129的后期处理的一部分,执行应用数据转换处理:将DAOF转换为能够在文档准备应用中使用的应用数据。
下面结合图12详细描述所述应用数据转换处理。
图12的流程图图示了本发明第一实施例的应用数据转换处理。
在步骤S8000,所述处理输入DAOF数据。在步骤S8002,所述处理产生作为所述应用数据的基础的文档结构树。在步骤S8004,所述处理根据所述文档结构树提供DAOF中的真实数据,产生实际应用数据。
下面结合图13详细描述图12的步骤S8002中的产生文档结构树的处理。
图13的流程图详细图示了本发明第一实施例中步骤S8002的生成文档结构树的处理。图14的示意图图解了本发明第一实施例的文档结构树。
在图13所示的处理中,作为整个控制的基本规则,所述处理流程从一个微块(单个块)移动到一个宏块(块的集合)。
这里所述的块包括微块和宏块。
见图13,在步骤S8000,所述处理根据以块为单位的竖直相关性进行分组。在开始该处理之后,以宏块为单位进行判断。
这里,所述相关性被定义为,例如,相互接近,或者大致具有相同的宽度(在水平方向,则是大致相同的块高度)。根据DAOF提取有关距离、宽度、高度等的信息。
例如,图14A图示了实际文档图像的页面结构,图14B图示了图14A的页面结构的文档结构树。在步骤S8100,块T3、T4和T5形成一个组V1,块T6和T7形成一个组V2,组V2具有与组V1具有相同的等级。
在步骤S8102,所述处理检查是否存在竖直分隔符。分隔符在物理上的含义是指在文档准备应用中,明确分割块的元素。当检测到分隔符时,在同一级别将块重新分割。
在步骤S8104,所述过程判断是否根据组的竖直长度执行另外的竖直分割。具体地,所述处理判断组的竖直长度是否等于文档图像的页面高度。如果组的竖直长度等于页面高度(步骤S8104的判断是肯定的),结束处理。如果组的竖直长度不等于页面高度(步骤S8104的判断是否定的),则前进到步骤S8106。
由于图14A中的文档图像没有竖直分隔符,并且组的竖直长度不等于页面高度,过程前进到步骤S8106。
在步骤S8106,所述处理根据以块为单位的水平相关性进行重分组。在开始该过程之后,象步骤S8100一样,以宏块为单位进行判断。相关性的定义和判断信息与竖直方向的判断一样。
在图14A所示的文档图像中,块T1和T2形成一个组H1,块V1和V2形成一个组H2。块H1和H2在同一级别,该级别高于组V1和V2的级别。
在步骤S8108,所述处理检查是否存在水平分隔符。由于在图14A中S1表示一个水平分隔符,该水平分隔符S1被登记在文档结构树中,形成包括H1、S1和H2的一级。
在步骤S8110,所述处理判断是否根据组的水平长度进行另外的水平分割。具体地,所述处理判断组的水平长度是否等于文档图像的页面宽度。
如果组的水平长度等于页面宽度(步骤S8110的判断是肯定的),结束处理。如果组的水平长度不等于页面宽度(步骤S8110的判断是否定的),则返回到步骤S8100,在上一等级重复从步骤S8100开始的处理。
由于在图14A中组的水平长度等于页面宽度,处理在步骤S8110完成。最后,表示整个页面的最高等级V0被添加到文件结构树中。
在完成了文档结构树之后,在图12的步骤S8004中根据文档结构树生成应用数据。
在图14A和14B的情况下,具体地以下述方式生成应用数据。
由于块H1在水平方向包括两个块T1和T2,将块T1和T2作为两列输出。输出块T1内部的信息(见DAOF;作为字符识别的结果的句子、图像等)。接下来,改变列,输出块T2内部的信息。然后,输出水平分隔符S1。
由于块H2在水平方向包括两个块V1和V2,将块V1和V2作为两列输出。对于块V1,顺序输出块T3、T4和T5内部的信息。接下来,改变列,输出块V2中的块T6和T7中的信息。
按照上述方式进行将DAOF转化为应用数据的处理。
取决于在操作单元113中指定的向量模式,将具有所需属性的块作为向量数据进行后期处理,对剩余的块作为图像或者背景进行后期处理。
如上所述,根据第一实施例,当要对读入的文档图像进行向量化时,取决于应用或者目的,可以适当地改变向量转换中的处理的内容。因此,当要根据文档图像执行各种处理(打印、传输、存储等)时,可以使用具有对于处理的内容来说合适的结构的向量数据文件来实现所述处理。
第二实施例
在第一实施例的图像处理系统的结构中,在图1的MFP 100中安装了将输入的光栅图像数据转换为向量数据文件的向量转换功能。在MFP 100的操作单元113和显示单元116中选择用于执行向量转换功能的向量模式,并对所选择的向量模式所指定的每一种属性生成向量数据文件。
相反,在图15所示的第二实施例的图像处理系统的结构中,在MFP 100中包括了能够控制MFP 100的管理PC105。在该管理PC105的操作单元中选择和操作向量模式。输入到MFP 100中的光栅图像数据被转移到管理PC105,以对所转移的图像数据按照在管理PC105中所选择的向量模式执行向量转换。
下面结合图15描述第二实施例的图像处理系统的结构。
图15是本发明第二实施例的图像处理系统的框图。
使用与图15所使用的附图标记相同的附图标记来标识与图1所示的本发明第一实施例的图像处理系统中的部件相同的部件,并省略了这些部件的详细说明。
图15中的MFP 100包括用于读入文档的图像读取单元,以及用于对图像读取单元所读取的图像信号进行部分图像处理的图像处理单元。当提供了用于将MFP 100连接到管理PC105的专用LAN 106时,在MFP 100中生成的图像信号通过LAN 106被提供给管理PC105。相反,当不提供LAN 106时,在MFP 100中产生的图像信号被通过LAN 102提供给管理PC105。
管理PC105包括图像存储单元、图像处理单元、显示单元、操作单元等,这些部件与通用计算机中的部件类似,其中某些部件与MFP 100集成在一起。
与客户计算机101一样,管理PC105包括设置在通用计算机中的标准部件(例如中央处理器(CPU)、随机存取存储器(RAM)、只读存储器(ROM)、硬盘、外部存储器、网络接口、显示器、键盘以及鼠标等)。
下面结合图16详细说明MFP 100的结构。
图16是本发明第二实施例的MFP 100的框图。
在图16中使用轩昂通的附图标记来标识与图2所示的第一实施例的MFP相同的部件,并省略了这些部件的详细说明。
见图16,与第一实施例一样,操作者可以通过MFP 100中的操作单元113和显示单元116向MFP 100输入指令。或者,操作者可以在管理PC105中设置的操作单元(例如键盘或者鼠标)中输入指令,并可以在管理PC105中所设置的显示单元中显示操作者的指令和处理中的图像数据的状态。
所述存储单元111可以用作管理PC105的外部存储单元。在这种情况下,存储单元111也被管理PC105控制。
当提供了LAN 106时,通过网络接口117实现MFP 100和管理PC105之间的直接数据通信和数据控制。当没有提供LAN 106时,通过网络接口114的LAN 102实现它们之间的数据通信和数据控制。
处理的概要
下面结合图17描述第二实施例的图像处理系统执行的整个处理的概要。
图17的流程图图示了本发明第二实施例的图像处理系统执行的整个处理的总体情况。
在步骤S1701,在将文档设置到MFP 100中的图像读取单元110中后,过程根据通过使用在管理PC105中的操作单元中提供的向量扫描选择键进行的操作来选择向量扫描。
在步骤S1702,过程使用管理PC105中的操作单元中的使用向量模式选择键来选择所需的向量模式。
管理PC105中的操作单元和显示单元的结构被实现与图4A到4C相同的功能。
在步骤S1703,MFP 100读取设置在图像读取单元110中的文档上的文档图像,并按照通过操作管理PC105中的操作单元中的一个用于激活向量扫描的开始键激活由管理PC105指定的向量模式的向量扫描。
在向量扫描中,首先,按照光栅模式扫描一个文档,并读入而获得例如60dpi和8位的图像信号。在步骤S1704,过程在数据处理单元115中对图像信号进行预处理,并将预处理后的图像信号在存储单元111中保存,作为对应于一页的图像数据。
在步骤S1705,通过LAN102或者LAN 106,过程将存储在存储单元111中的图像数据传输到管理PC105。
管理PC105激活按安装在管理PC105中的向量转换应用,以执行对应于图3中的步骤S125到S127的步骤S1706到S1708(块选择,OCR以及向量转换)。
在完成步骤S1708的向量转换后,在步骤S1709,在管理PC105的存储单元中存储每一个对象(块)的布局信息,作为向量数据文件。
在步骤S1710,取决于向量扫描的目的,对管理PC105中的存储单元中存储的向量数据文件进行后期处理。
如上所述,在第二实施例的图像处理系统的结构中,通过管理PC105中的操作单元和显示单元,提供对MFP 100中的向量扫描的各种指令,将在MFP 100中读取的图像数据转移到管理PC105,在管理PC105中进行向量转换。因此,即使MFP 100不具有向量转换功能或者与向量扫描相关的各种设置(例如向量模式选择功能),通过连接到管理PC105也可以容易地按照所需的向量模式进行向量扫描。
第三实施例
在第一和第二实施例中已经描述了用操作单元和显示单元实现示于图4A到4C的操作屏幕的结构。具体地,在这些操作屏幕中,操作向量扫描选择键、向量模式选择键、向量化(Vectorize)键等激活一系列向量扫描处理以自动生成包括被分割为所需的属性的对象的向量数据文件。
相反,根据第三实施例的图像处理系统除了第一和第二实施例的结构之外还包括一种结构(操作屏幕),其中,在读入文档图像之后预览文档图像,并在生成对应于文档图像的向量数据文件之前确认块选择的结果。
下面结合图18描述第三实施例的操作屏幕。
基本操作的说明
图18图示了本发明第三实施例的操作屏幕的一个例子。
示于图4A到4C的操作屏幕在第三实施例的操作屏幕中被共同采用。根据第三实施例,按下图4C中的操作屏幕10002中的“开始读取”(Start reading)键100020导致向量扫描操作的开始。在完成文档的读入之后,显示被切换到图18中的操作屏幕10003。
图18中的操作屏幕10003是在图4C的操作屏幕10002中通过使用向量模式选择键100021选择了文本/图形/表格/图像(Text/Graphic/Table/Image)模式时操作屏幕的一个例子。
在执行了图3中的步骤S121到S125中的块选择步骤(或者图17中从步骤S1701到S1706的块选择步骤)之后,显示读入的图像数据以及作为块选择的结果的图像100029。以在块选择中处理的属性为单位显示图像100029中的对象。块被矩形框环绕。
对于在图3的步骤S125(或者图17的步骤S1706)中的块选择中自动识别的每一个属性,在具有不同颜色的矩形框内显示对象。
按照不同的颜色显示围绕对象的矩形框,例如用红色标识文本(Text)(字符),用黄色标识图像(Image),使得容易识别在块选择中分割的每一种属性的对象,从而改善操作者的可视性。矩形框的显示也可以按照其它显示模式,包括不同的线条宽度,不同的线型(例如实线、点线、短划线等),来代替不同颜色的显示。可以用不同的方式来对对象过滤以进行显示。
尽管图像100029最初显示为读入存储单元111的图像,通过使用放大缩小键100036,可以按照需要放大或者缩小图像100029。当放大使得图像100029的显示内容不能适应显示区域时,可以使用滚动键100035来水平和竖直移动图像100029从而看见看不见的部分。
图18图示了选择了图像100029中央部分的字符对象100030(字符串“We are always waiting YOU!”)的状态。具体地,图18中,所选择的对象用实线的矩形框环绕,该框的颜色(在此例中是红色)表示相应的属性,而其余的未被选择的对象则被虚线矩形框环绕,框的颜色表示相应的属性。将选中的矩形框与未被选中的矩形框显示得不同,允许容易地判断每一个对象的被选中状态和未被选中状态。
在图18所示的例子中,字符对象100030被红色实线矩形框环绕,图形对象100037被蓝色虚线矩形框环绕,图像对象100038用黄色虚线矩形框环绕,表格对象100039被绿色虚线矩形框环绕。剩余的部分是背景对象。
由于背景对象是在提取了图像100029中的对象之后剩余的图像部分,没有用矩形环绕它们。但是,与其它对象一样,在指定背景的意义上,可以用矩形框环绕背景图像的轮廓。
选择对象以便例如编辑字符对象中的字符串或者对图形对象进行颜色控制的一种方法是直接接触字符对象100030内部的区域来指定该字符对象100030。另一种方法是使用对象选择键100032指定字符对象100030。在任何方法中,用实线状态的矩形框环绕选中的对象而用虚线矩形框环绕未选中的对象。
同时,选择对应于所选中的对象的属性的对象属性键100031(尽管在此例子中选择的是Text键,但是可以选择Graphic、Table、Image和BackGround键中的任何键)。在这种情况下,对相应的对象属性键加网纹以指示被选中的状态。也可以使用其它显示模式,比如阴影线或者闪烁,只要能够根据显示模式区分选中状态和未选中状态就行。
当用ADF读取包括多页的文档时,在屏幕10003的初始状态下,显示所述多页中的第一页的图像。可以使用一个页面指定键100033来切换到所要的页以显示该页的图像。
按下确认(OK)键100034会保存对应于所显示的图像100029的向量数据文件。相反,按下取消(Cancel)键100040会废弃在该操作屏幕10003中进行的各种设置而返回图4A所示的操作屏幕10000,也就是用于复印的基本屏幕。
传输/传真操作的说明
下面结合图19A到19C描述用于文件传输/传真的操作屏幕。
图19A到19C图示了根据本发明第三实施例用于文件传输/传真的操作屏幕的例子。
图19A的操作屏幕10010是用于文件传输/传真的基本屏幕。为了执行操作屏幕10010上的操作,需要使用读入设置下拉菜单100100设置在向MFP 100中读入要处理的文档图像时的读入设置。读入设置下拉菜单100100的按下会显示一个下拉菜单,如图19B中的操作屏10011所示。使用该下拉菜单,例如,可以选择200×200dpi或者300×300dpi作为读入设置。
接下来,按下操作屏幕10011中的详细设置键100110会显示图19C所示的操作屏幕10012(读入设置屏幕)。按下操作屏幕10012中的应用模式键100120会显示图18中的操作屏幕10003。随后就可以实现与上述基本操作相同的操作。
盒子操作(Box Operation)的说明
下面结合图20A到20D描述用于在MFP 100的存储单元111中存储读入到MFP 100中的图像数据(盒子功能)的操作屏幕。
图20A到20D图示了根据本发明第三实施例用户盒子功能的操作屏幕的例子。
图20A的操作屏幕是用于存储图像数据(盒子功能)的基本屏幕。按下当前由MFP 100管理的盒子组(存储单元)中表示盒子00的盒子键100200会显示如图20B所示的操作屏幕10021。
按下操作屏幕10021中的读入文档键100211会显示一个读入/设置文档屏幕,该读入/设置文档屏幕与传输/传真操作中说明的读入/设置文档屏幕一样。在此例中,显示图19C中的操作屏幕10012。
在图20B所示的例子中,显示了在盒子00中存储了一个数据文件的状态。按下数据文件行100210会选择能够被处理的对应数据文件。
示于图20C的操作屏幕10022显示了选择了数据文件的状态。在操作屏幕10022中,将选中的行高亮显示(或者加阴影线)。选择数据文件可以允许确认数据文件的内容。在此例中,按下显示图像键100222显示图18中的操作屏幕10003。接着就可以实现与上述基本操作的说明相同的操作。
类似地,在图20C中的操作屏幕10022中按下打印键100221会显示一个如图20D所示的操作屏幕10023。使用该操作屏幕10023可以设置打印设置。按下应用模式键100230会显示图18中的操作屏幕10003。接着就可以实现与上述基本操作的说明中相同的操作。
如上所述,根据第三实施例,除了实现第一和第二实施例的上述效果之外,还可以在读入文档图像之后显示包括在指定向量模式下的块选择的结果的图像,作为图像的预览显示,从而,可以预先确认通过实际执行向量扫描获得的块选择的结果。基于该结果,可以判断是否要执行后期处理。
第四实施例
根据第三实施例,通过在读入文档图像后预览包括文档图像的块选择结果的图像,可以在最终生成向量数据文件之前预先确认块选择的结果。
相反,根据第四实施例,描述了这样一种结构:如果预览显示的块选择结果不是想要的结果,可以改变块选择结果。
具体地,如果,在显示在图18的操作屏幕10003中的对象中,如果一个对象没有作为具有所需属性的对象出现,则可以使用操作屏幕10003改变属性。
例如,当字符对象100030的属性要从Text属性变为Graphic属性时,在按下了操作屏幕10003上的属性改变按钮(未图示)之后,接触字符对象100030以进行选择。从对象属性键100031中选择Graphic键会将Text属性改变为Graphic属性。
在此例中,在改变属性之后,字符对象100030的矩形框的颜色可以变为表示Graphic属性的蓝色,或者,字符对象100030可以用一个由双线构成的矩形框环绕,所述双线包括表示Text属性的红线和表示Graphic属性的蓝线,以确认改变前后的属性。
如上所述,根据第四实施例,处理实现上述第三实施例的效果之外,还可以任意改变显示在预览中的对象的属性。这样,即使在预览中存在不具有所需属性的对象,也可以将该对象的属性适当地改变为所需的属性。
第五实施例
根据第三和第四实施例,描述了能够在图18的操作屏幕10003中进行预览显示的结构。
相反,根据第五实施例,根据使用图4C中的操作屏幕10002上的向量模式选择键100021选择的向量模式,可以改变图18的操作屏幕10003上的对象属性键100031的显示内容。
例如,当用向量模式选择键100021选择了文本(Text)模式时,在图18的对象属性键100031中只包括Text。或者,可以在对象属性键100031中包括可以用向量模式选择键100021选择的模式的列表。在这种情况下,用向量模式选择键100021实际选择的向量模式所指定的属性被显示,而其它属性以灰色显示为不可选的属性。
如上所述,根据第五实施例,除了实现上述第三、第四实施例的效果之外,在预览显示中,在对象属性键中只包括可选的属性。因此,可以容易地确认可选的属性,从而改善基于属性的操作的响应性。
第六实施例
根据第四实施例,可以改变图18的操作屏幕10003上的预览显示中显示的对象的属性。相反,根据第六实施例,除了第四实施例的结构之外,可以提供一个开关(ON/OFF)键,用于指定对于具有所需属性的对象是否最终执行向量转换。
如上所述,根据第六实施例,除了实现第四实施例的上述效果之外,还能够在在图18的操作屏幕10003上的预览显示中确认了块选择的结果之后,对于具有所需属性的对象,判断是否最终执行向量转换。
第七实施例
根据第三到第五实施例,在图18的操作屏幕上预览块选择的结果。相反,根据第七实施例,预览包括向量转换的结果的图像,在该预览显示中可以改变对象的属性,或者可以开关向量转换。
在这种情况下,当光栅图像数据要被转换为向量数据文件时,光栅图像数据被单独存储。在进行重新指定(re-specification)后,可以再次执行向量转换,或者可以对从向量数据文件传换来的光栅图像数据进行向量转换。
第八实施例
根据上述第一到第七实施例,对从MFP 100读入的要处理的图像执行图3的处理。相反,根据第八实施例,可以对例如从客户计算机101接收到的打印数据或者通过网络104接收到的图像数据(例如数字照相机拍摄的图像数据)进行图3的处理。
第九实施例
尽管在上述第一到第八实施例中是在图1的办公室A中实现所述图像处理系统,但是,所述图像处理系统可以实现在网络104上的另一个办公室的MPF中,或者网络104上的MPF中。
第十实施例
尽管所述图像处理系统的结构被设计为使用MFP或者管理PC实现其功能,但是图像处理系统的功能也可以通过使用任何能够处理图像数据的设备(例如,数字照相机,或者便携式终端,比如个人数字助理(PDA)或者蜂窝电话)来实现。
第十一实施例
当对应于输入的图像数据的原始图像已经在MFP 100或者网络上的服务器中的存储单元中被管理时,可以对所述原始图像执行图3的处理。
第十二实施例
在上述实施例中,尽管是操作MFP或者管理PC来指定向量模式,但是本发明不限于这种结构,而可以作出各种修改。例如,被用标记笔画在文档上的闭合区域包围的对象可以根据所需的向量模式被向量化。
除了上面详细说明的本发明的实施例之外,本发明可以提供多个方面包括系统、设备、方法、程序和存储介质。具体地,本发明可以应用于包括多个装置的系统,或者应用于包括单个装置的设备。
本发明的处理可以由系统中的计算机实现,或者由被直接地或者远程地提供了用于实现上述实施例的功能的软件程序(在上述实施例中,是对应于所述流程图的程序)的设备来实现。读取和执行所提供的程序代码的所述计算机能够实现上述实施例的功能。
在安装到计算机上之后由计算机实现本发明的功能的程序代码本身构成本发明。
在这种情况下,计算机程序可以是具有计算机程序的功能的目标代码、由解释器执行的程序、被提供给操作系统的脚本数据等。
用于提供所述程序的存储介质包括,例如,软盘,硬盘,光盘,磁光盘(MO),光盘只读存储器(CD-ROM),可记录光盘(CD-R),可重写光盘(CD-RW),磁带,非易失性存储卡,ROM,以及数字通用盘(DVD)比如DVD-ROM和DVD-R。
程序的获取可以是通过使用客户计算机上的浏览器访问因特网上的网页,以将根据本发明的程序本身或者具有自动安装功能的压缩文件从网页下载到存储介质比如硬盘中。或者,所述程序可以这样获得:构成本发明的程序的程序代码被分散到多个文件中,从不同的网页下载这些文件。换句话说,这样的万维网(WWW)也在本发明的范围之内:从它向多个用户下载用于用计算机实现本发明的功能的程序文件。
可以使用密钥对加密的程序解码,所述密钥用于对要安装到计算机上的代码解密。当本发明的程序被编码和存储在存储介质比如CD-ROM中并被交付给用户时,所述密钥从网页通过因特网被下载到满足预定条件的用户。
计算机能够执行读出的程序以实现上述实施例的功能。或者,运行在计算机上的操作系统或者类似程序能够根据程序中的指令执行部分或者全部实际处理,以实现上述实施例的功能。
或者,从存储介质读出的程序被写入在计算机所包括的功能扩展板中或者在连接到计算机的功能扩展单元中提供的存储器中之后,所述功能扩展板或者功能扩展单元中的CPU或者类似装置能够根据所述程序中的指令执行部分或者全部实际处理,以实现上述实施例中的功能。
上述处理(块选择和向向量数据的转换)可以由硬件中的电路执行。在这种情况下,MFP中的数据处理单元中的CPU控制到硬件的数据路径,以在所述硬件中执行所述处理,接收处理的结果。每一个处理都可以由硬件和软件的合适的组合来执行。
根据上述实施例,根据应用或者目的生成具有合适的结构的数据文件,使得能够基于读入的文档图像有效率地执行所述处理的图像处理设备或者信息处理设备可以被实现为各种结构,并允许提供用于控制所述图像处理设备或者信息处理设备的方法或者程序。
尽管上面对本发明的说明针对的是当前认为最优优选的实施例,但是应当理解,本发明不限于所公开的实施例。相反,本发明应覆盖被包括在所附权利要求的是指范围之内的各种修改和等效方案。所附权利要求的范围应被赋予最宽的解释,以包括所有这样的修改和等效结构与功能。

Claims (7)

1.图像处理设备,包括:
读取装置,用于读取图像,生成代表该图像的图像数据;
分割装置,用于将读取装置读取的图像数据分割为与属性相应的多个对象;
选择装置,用于选择所述图像的预定属性;
向量化装置,用于根据所述选择装置所选择的预定属性,对所述分割装置分割的图像数据进行向量转换处理;以及
输出装置,用于输出经过所述向量化装置处理的图像数据。
2.如权利要求1所述的设备,还包括显示装置,用于显示所述图像和与每一个所述对象相应的属性。
3.如权利要求2所述的设备,还包括改变装置,用于改变所显示的对象属性。
4.如权利要求2所述的设备,还包括判断装置,用于判断是否要对所述每一个对象进行向量转换处理。
5.如权利要求1到4之一所述的设备,其中,所述属性包括“文本”,所述向量化装置对具有文本属性的图像数据进行字符识别。
6.如权利要求1到4之一所述的设备,其中,所述属性包括“图形”,所述向量化装置对具有图形属性的图形数据进行函数逼近。
7.一种图像处理方法,包括下列步骤:
获取表示图像的图像数据;
将所述图像数据分割为与属性相应的多个对象;
选择所述图像的预定属性;
根据所选择的预定属性,对所述经过分割的图像数据进行向量转换处理;以及
输出经过所述向量转换处理的图像数据。
CNB2004100952241A 2003-11-20 2004-11-19 用于将图像转换为预定格式的图像处理设备及方法 Expired - Fee Related CN100379239C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003390749 2003-11-20
JP2003390749A JP4012140B2 (ja) 2003-11-20 2003-11-20 画像処理装置、情報処理装置及びそれらの制御方法、プログラム

Publications (2)

Publication Number Publication Date
CN1620094A true CN1620094A (zh) 2005-05-25
CN100379239C CN100379239C (zh) 2008-04-02

Family

ID=34431596

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100952241A Expired - Fee Related CN100379239C (zh) 2003-11-20 2004-11-19 用于将图像转换为预定格式的图像处理设备及方法

Country Status (4)

Country Link
US (1) US7433517B2 (zh)
EP (1) EP1533746A3 (zh)
JP (1) JP4012140B2 (zh)
CN (1) CN100379239C (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101175131B (zh) * 2006-10-31 2010-06-09 佳能株式会社 图像处理设备和图像处理设备的控制方法
CN101944179A (zh) * 2009-07-01 2011-01-12 佳能株式会社 图像处理装置和图像处理方法
CN102404472A (zh) * 2010-09-09 2012-04-04 富士施乐株式会社 图像处理装置和图像处理方法
CN103258197A (zh) * 2012-02-17 2013-08-21 柯尼卡美能达商用科技株式会社 图像处理装置及其控制方法
CN104238974A (zh) * 2013-06-21 2014-12-24 佳能株式会社 信息处理装置及方法
CN104838391A (zh) * 2012-10-31 2015-08-12 恩图鲁斯特咨询卡有限公司 机器视觉验证
CN105159869A (zh) * 2011-05-23 2015-12-16 成都科创知识产权研究所 图片编辑方法及系统
CN105763764A (zh) * 2015-01-06 2016-07-13 虹光精密工业股份有限公司 用以产生一式多份文件的打印装置
TWI602212B (zh) * 2012-10-01 2017-10-11 克萊譚克公司 用於在一電子束微影系統中之壓縮資料傳輸之系統及方法及用於具有資料壓縮及傳輸能力之電子束微影的系統
CN109710783A (zh) * 2018-12-10 2019-05-03 珠海格力电器股份有限公司 一种图片加载方法、装置、存储介质及服务器

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4541770B2 (ja) * 2004-06-10 2010-09-08 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
US7734636B2 (en) * 2005-03-31 2010-06-08 Xerox Corporation Systems and methods for electronic document genre classification using document grammars
US7474928B2 (en) * 2005-04-15 2009-01-06 Autodesk Canada Co. Hybrid vector/raster based paint
JP4408836B2 (ja) * 2005-05-30 2010-02-03 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP2007299321A (ja) * 2006-05-02 2007-11-15 Ricoh Co Ltd 情報処理装置、情報処理方法、情報処理プログラム、及び、情報記憶媒体
JP4757120B2 (ja) 2006-07-06 2011-08-24 キヤノン株式会社 画像処理装置及びその制御方法
JP4873554B2 (ja) * 2006-12-25 2012-02-08 株式会社リコー 画像配信装置および画像配信方法
US20080304113A1 (en) * 2007-06-06 2008-12-11 Xerox Corporation Space font: using glyphless font for searchable text documents
JP5132347B2 (ja) * 2008-02-13 2013-01-30 キヤノン株式会社 画像処理システム
US8352855B2 (en) * 2009-01-02 2013-01-08 Apple Inc. Selection of text in an unstructured document
JP2010282611A (ja) * 2009-05-07 2010-12-16 Canon Inc 情報処理装置、情報処理方法及びプログラム
CN101930593B (zh) * 2009-06-26 2012-11-21 鸿富锦精密工业(深圳)有限公司 单一物体影像萃取系统及方法
US8743424B2 (en) * 2010-06-18 2014-06-03 Hewlett-Packard Development Company, L.P. Pre-print enhancement of a raster image
US8963959B2 (en) 2011-01-18 2015-02-24 Apple Inc. Adaptive graphic objects
US8380753B2 (en) 2011-01-18 2013-02-19 Apple Inc. Reconstruction of lists in a document
US8543911B2 (en) 2011-01-18 2013-09-24 Apple Inc. Ordering document content based on reading flow
US8442998B2 (en) 2011-01-18 2013-05-14 Apple Inc. Storage of a document using multiple representations
CN102567947A (zh) * 2012-01-12 2012-07-11 惠州Tcl移动通信有限公司 一种移动终端中图像处理方法及移动终端
JP2013164745A (ja) * 2012-02-10 2013-08-22 Sharp Corp 通信端末装置
DK2945668T3 (en) 2013-01-15 2018-09-03 Sanofi Aventis Deutschland ASSEMBLY ASSEMBLY FOR A MEDICAL INJECTION DEVICE FOR GENERATION OF USE REPORTS ON THE USE OF THE DIGITAL IMAGE INJECTION DEVICE
US9769365B1 (en) 2013-02-15 2017-09-19 Red.Com, Inc. Dense field imaging
JP6958395B2 (ja) * 2018-01-31 2021-11-02 富士通株式会社 記憶制御プログラム、記憶制御方法および記憶制御装置
CN109189524A (zh) * 2018-08-09 2019-01-11 北京金山安全软件有限公司 一种图像资源的生成方法和装置
TWI776215B (zh) * 2020-08-24 2022-09-01 奇蹟行動科技有限公司 產生使用者介面的描述碼之方法、系統及非暫態電腦可讀取儲存媒體

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06348830A (ja) 1993-06-02 1994-12-22 Matsushita Electric Ind Co Ltd 情報処理装置
US5588072A (en) * 1993-12-22 1996-12-24 Canon Kabushiki Kaisha Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
US6504540B1 (en) * 1995-06-19 2003-01-07 Canon Kabushiki Kaisha Method and apparatus for altering one or more attributes of one or more blocks of image data in a document
US5774579A (en) * 1995-08-11 1998-06-30 Canon Kabushiki Kaisha Block selection system in which overlapping blocks are decomposed
KR100209350B1 (ko) * 1996-05-27 1999-07-15 이계철 유사도 함수를 이용한 전자지도 정밀도 검증방법
JP4071328B2 (ja) * 1997-11-18 2008-04-02 富士通株式会社 文書画像処理装置および方法
JP2000013596A (ja) 1998-06-18 2000-01-14 Minolta Co Ltd 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体
JP3794171B2 (ja) 1998-08-11 2006-07-05 富士ゼロックス株式会社 画像処理装置および画像処理方法
JP4497733B2 (ja) 2000-02-22 2010-07-07 キヤノン株式会社 データ処理装置及びデータ処理方法
JP3733310B2 (ja) * 2000-10-31 2006-01-11 キヤノン株式会社 文書書式識別装置および識別方法
US7013309B2 (en) * 2000-12-18 2006-03-14 Siemens Corporate Research Method and apparatus for extracting anchorable information units from complex PDF documents
JP2003263301A (ja) 2002-03-07 2003-09-19 Fuji Xerox Co Ltd 画像処理装置及び印刷処理システム

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101175131B (zh) * 2006-10-31 2010-06-09 佳能株式会社 图像处理设备和图像处理设备的控制方法
CN101944179A (zh) * 2009-07-01 2011-01-12 佳能株式会社 图像处理装置和图像处理方法
CN101944179B (zh) * 2009-07-01 2013-07-17 佳能株式会社 图像处理装置和图像处理方法
CN102404472B (zh) * 2010-09-09 2015-08-19 富士施乐株式会社 图像处理装置和图像处理方法
CN102404472A (zh) * 2010-09-09 2012-04-04 富士施乐株式会社 图像处理装置和图像处理方法
CN105159869A (zh) * 2011-05-23 2015-12-16 成都科创知识产权研究所 图片编辑方法及系统
CN103258197A (zh) * 2012-02-17 2013-08-21 柯尼卡美能达商用科技株式会社 图像处理装置及其控制方法
CN103258197B (zh) * 2012-02-17 2017-10-13 柯尼卡美能达商用科技株式会社 图像处理装置及其控制方法
TWI602212B (zh) * 2012-10-01 2017-10-11 克萊譚克公司 用於在一電子束微影系統中之壓縮資料傳輸之系統及方法及用於具有資料壓縮及傳輸能力之電子束微影的系統
CN104838391A (zh) * 2012-10-31 2015-08-12 恩图鲁斯特咨询卡有限公司 机器视觉验证
CN104838391B (zh) * 2012-10-31 2019-04-09 恩图鲁斯特咨询卡有限公司 机器视觉验证
CN104238974A (zh) * 2013-06-21 2014-12-24 佳能株式会社 信息处理装置及方法
CN104238974B (zh) * 2013-06-21 2017-10-13 佳能株式会社 信息处理装置及方法
CN105763764A (zh) * 2015-01-06 2016-07-13 虹光精密工业股份有限公司 用以产生一式多份文件的打印装置
CN105763764B (zh) * 2015-01-06 2019-03-22 虹光精密工业股份有限公司 用以产生一式多份文件的打印装置
CN109710783A (zh) * 2018-12-10 2019-05-03 珠海格力电器股份有限公司 一种图片加载方法、装置、存储介质及服务器

Also Published As

Publication number Publication date
US20050111745A1 (en) 2005-05-26
JP4012140B2 (ja) 2007-11-21
JP2005157449A (ja) 2005-06-16
US7433517B2 (en) 2008-10-07
EP1533746A2 (en) 2005-05-25
EP1533746A3 (en) 2014-06-18
CN100379239C (zh) 2008-04-02

Similar Documents

Publication Publication Date Title
CN1620094A (zh) 用于将图像转换为预定格式的图像处理设备及方法
CN1271505C (zh) 用于进行图像检索的图像处理装置及方法
CN1214614C (zh) 图像处理方法、图像处理装置及记录媒体
CN1236379C (zh) 来自可移动型存储媒体的图像输出装置
CN1292381C (zh) 图象处理系统
CN1291352C (zh) 彩色图象处理装置及方法、图案抽取装置及方法
CN1168010C (zh) 信息处理设备和方法
CN1167265C (zh) 图像通信系统及其方法
CN1213592C (zh) 采用自适应二值化的图象处理方法和设备
CN1324873C (zh) 边界检测方法、图像处理设备和复印机
CN1619438A (zh) 图像处理装置及其控制方法、程序
CN1913573A (zh) 用于图像检索的图像处理设备及其控制方法
CN1123198C (zh) 处理图象的方法和设备
CN1167043C (zh) 图像显示设备
CN1526116A (zh) 改进图象质量的方法和系统
CN1893535A (zh) 浓度确定方法、成像设备和图像处理系统
CN1744657A (zh) 多分辨率分割和填充
CN1400807A (zh) 图象处理方法和设备,图象处理系统以及存储介质
CN1684492A (zh) 图像词典作成装置、编码装置、图像词典作成方法
CN1859541A (zh) 图像处理设备及其控制方法
CN1719864A (zh) 图像处理系统及图像处理方法
CN1220434A (zh) 字符串提取设备和模式提取设备
CN1625206A (zh) 图像处理装置及其控制方法
CN1607807A (zh) 图象输出控制装置
CN1885899A (zh) 图像合成装置及其控制方法和程序

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080402

Termination date: 20181119

CF01 Termination of patent right due to non-payment of annual fee