CN102710882B - 图像处理设备和图像处理方法 - Google Patents

图像处理设备和图像处理方法 Download PDF

Info

Publication number
CN102710882B
CN102710882B CN201110409989.8A CN201110409989A CN102710882B CN 102710882 B CN102710882 B CN 102710882B CN 201110409989 A CN201110409989 A CN 201110409989A CN 102710882 B CN102710882 B CN 102710882B
Authority
CN
China
Prior art keywords
list
information
view data
image processing
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201110409989.8A
Other languages
English (en)
Other versions
CN102710882A (zh
Inventor
山田俊之
土渊清隆
清水淳一
新名博
胁山彻也
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2011069575A external-priority patent/JP2012203784A/ja
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Publication of CN102710882A publication Critical patent/CN102710882A/zh
Application granted granted Critical
Publication of CN102710882B publication Critical patent/CN102710882B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提供了图像处理设备和图像处理方法。图像处理设备包括:结构信息获取部分,其从包含在以预定顺序排列的多个图像数据的每一个中、并且由多行和多列形成的列表获取包含行信息和列信息的结构信息,所述行信息至少包括列表的行数以及各行的高度,所述列信息至少包括列数以及各列的宽度;列表连接确定部分,其根据所获取的列表信息确定分别包含于所述多个图像数据中的列表中的一组连接列表、以及连接列表的连接方向;以及列表连接部分,其按照所确定的连接方向以所述多个图像数据被列出的顺序来连接所确定的该组列表。

Description

图像处理设备和图像处理方法
技术领域
本发明涉及图像处理设备和图像处理方法。
背景技术
例如,JP-A-04-023185(专利文献1)公开了一种列表读取装置,该列表读取装置通过适当定位由多个页所形成的打印文档中包含的诸如图片和列表之类的浮动元素,来产生诸如XML文档或HTML文档之类的结构化文档。
例如,JP-A-05-342408(专利文献2)公开了一种文档图像归档装置,该文档图像归档装置对输入文档图像进行归档,以便根据每个属性对每个区域(句子、照片、以及图形)应用原始属性。
例如,JP-A-2002-073598(专利文献3)公开了一种文档处理装置,该文档处理装置从电子文档中提取诸如“文本”、“图片”和“列表”之类的内容(组成部分),从而集中地处理它们或者再次使用它们。
例如,JP-A-09-128480(专利文献4)公开了一种图案提取装置,该图案提取装置即使在构成框(其代表字符、图像和符号的图案区域)的线模糊的情况下也能提取图案区域。
例如,JP-A-08-044827(专利文献5)公开了一种数字复印机,当在数字复印机中根据原件的类型而将它们分成多个区域时,该数字复印机也使得原件能够被再次使用。
例如,JP-A-2005-128925(专利文献6)公开了一种文档编辑系统,该文档编辑系统通过再次使用绝佳的设计以及现有文档的内容来产生新文档。
发明内容
本发明的一个目的是提供一种图像处理设备和程序,在电子文档中的列表部分被分割成多个纸质文档并打印在该多个纸质文档上时,其能够根据多个纸质文档重新产生电子文档,从而恢复与原始电子文档具有相同结构的列表。
根据本发明的第一方面,提供了一种图像处理设备,包括:结构信息获取部分,其从包含在以预定顺序排列的多个图像数据的每一个中的、并且由多行和多列形成的列表获取包含行信息和列信息的结构信息,所述行信息至少包括列表的行数以及各行的高度,所述列信息至少包括列数以及各列的宽度;列表连接确定部分,其根据所获取的结构信息确定在分别包含于所述多个图像数据中的列表当中的一组连接列表、以及所述连接列表的连接方向;以及列表连接部分,其按照所确定的连接方向以所述多个图像数据被列出的顺序来连接所确定的该组列表。
根据本发明的第二方面,在第一方面中,所述列表连接确定部分确定分别包含在所述多个图像数据中的多个列表的列信息是否彼此一致,将列信息被确定为彼此一致、并且以所述多图像数据被列出的顺序彼此邻接的多个列表确定为所述一组连接列表,以及将所述连接方向确定为列表的向下方向。
根据本发明的第三方面,在第二方面中,每个列信息还包括对构成了每个列表并且唯一地由行和列指定的单元的属性进行表示的属性信息。
根据本发明的第四方面,在第三方面中,所述属性信息包括构成列表的各个单元的颜色信息,以及所述列表连接确定部分确定所述多个图像数据中包含的各个列表的相同列中的各单元的颜色信息是否彼此一致。
根据本发明的第五方面,在第三方面中,所述属性信息包括构成列表的各个单元的基本信息,并且所述列表连接确定部分确定所述多个图像数据中包含的各个列表的相同列中的各单元的基本信息是否彼此一致。
根据本发明的第六方面,在第四方面中,所述属性信息包括构成列表的各个单元的基本信息,以及所述列表连接确定部分确定所述多个图像数据中包含的各个列表的相同列中的各单元的基本信息是否彼此一致。
根据本发明的第七方面,在第三方面中,所述属性信息包括表示构成列表的各单元的纵向格线的属性的列线信息,以及所述列表连接确定部分确定所述多个图像数据中包含的各个列表的相同列中的各单元的列线信息是否彼此一致。
根据本发明的第八方面,在第四方面中,所述属性信息包括表示构成列表的各单元的纵向格线的属性的列线信息,以及所述列表连接确定部分确定所述多个图像数据中包含的各个列表的相同列中的各单元的列线信息是否彼此一致。
根据本发明的第九方面,在第五方面中,所述属性信息包括表示构成列表的各单元的纵向格线的属性的列线信息,以及所述列表连接确定部分确定所述多个图像数据中包含的各个列表的相同列中的各单元的列线信息是否彼此一致。
根据本发明的第十方面,在第六方面中,所述属性信息包括表示构成列表的单元的纵向格线的属性的列线信息,以及所述列表连接确定部分确定所述多个图像数据中包含的各个列表的相同列中的各单元的列线信息是否彼此一致。
根据本发明的第十一方面,在第一方面中,所述列表连接确定部分确定分别包含在所述多个图像数据中的多个列表的行信息是否彼此一致,将行信息被确定为彼此一致并且以所述多个图像数据被列出的顺序彼此邻接的多个列表确定为所述一组连接列表,以及将所述连接方向确定为列表的向右方向。
根据本发明的第十二方面,在第十一方面中,每个行信息还包括对构成每个列表并且唯一地由行和列指定的单元的属性进行表示的属性信息。
根据本发明的第十三方面,在第十二方面中,所述属性信息包括构成列表的各个单元的颜色信息,以及所述列表连接确定部分确定所述多个图像数据中包含的各个列表的相同行中的各单元的颜色信息是否彼此一致。
根据本发明的第十四方面,在第十二方面中,所述属性信息包括构成列表的各个单元的基本信息,以及所述列表连接确定部分确定所述多个图像数据中包含的各个列表的相同行中的各单元的基本信息是否彼此一致。
根据本发明的第十五方面,在第十三方面中,所述属性信息包括构成列表的各个单元的基本信息,以及所述列表连接确定部分确定所述多个图像数据中包含的各个列表的相同行中的各单元的基本信息是否彼此一致。
根据本发明的第十六方面,在第十二方面中,所述属性信息包括表示构成列表的各个单元的横向格线的属性的行线信息,以及所述列表连接确定部分确定所述多个图像数据中包含的各个列表的相同行中的各单元的行线信息是否彼此一致。
根据本发明的第十七方面,在第十三方面中,所述属性信息包括表示构成列表的各个单元的横向格线的属性的行线信息,以及所述列表连接确定部分确定所述多个图像数据中包含的各个列表的相同行中的各单元的行线信息是否彼此一致。
根据本发明的第十八方面,在第十四方面中,所述属性信息包括表示构成列表的各个单元的横向格线的属性的行线信息,以及所述列表连接确定部分确定所述多个图像数据中包含的各个列表的相同行中的各单元的行线信息是否彼此一致。
根据本发明的第十九方面,在第十五方面中,所述属性信息包括表示构成列表的各个单元的横向格线的属性的行线信息,以及所述列表连接确定部分确定所述多个图像数据中包含的各个列表的相同行中的各单元的行线信息是否彼此一致。
根据本发明的第二十方面,在第一方面至第十九方面中的任一方面中,通过从纸质文档读出图像来产生所述多个图像数据。
根据本发明的第二十一方面,在第二十方面中,所述预定顺序表示读出所述纸质文档的顺序。
根据本发明的第二十二方面,在第一方面至第十九方面中的任一方面中,所述多个图像数据包括指定排列顺序的顺序信息,以及所述预定顺序表示由所述顺序信息指定的顺序。
根据本发明的第二十三方面,在第二十方面中,所述多个图像数据包括指定排列顺序的顺序信息,以及所述预定顺序表示由所述顺序信息指定的顺序。
根据本发明的第二十四方面,提供了一种图像处理方法,包括:从包含在以预定顺序排列的多个图像数据的每一个中的并且由行和列构成的列表获取包含行信息和列信息的结构信息,所述行信息至少包括列表的行数以及各行的高度,所述列信息至少包括列数以及各列的宽度;根据所获取的结构信息确定在分别包含于所述多个图像数据中的多个列表当中的一组连接列表、以及所述连接列表的连接方向;以及将所确定的所述一组连接列表按照所确定的连接方向以所述多个图像数据被列出的顺序进行连接。
根据本发明的第一方面,可以提供一种图像处理设备,其根据由电子文档中的列表部分所分割成的多个图像数据来重新产生电子文档,从而恢复与原始电子文档的列表具有相同结构的列表。
根据本发明的第二方面,除了根据第一方面的本发明的优点之外,可以提供一种图像处理设备,其根据与组成包含在多个图像数据中的每个列表的各列有关的信息,在没有用户指定的情况下,指定将要纵向连接的列表。
根据本发明的第三方面,除了根据第二方面的本发明的优点之外,可以提供一种图像处理设备,其根据与组成包含在多个图像数据中的每个列表的各列有关的详细信息,在没有用户指定的情况下,进一步精确地指定将要纵向连接的列表。
根据本发明的第四方面,除了根据第三方面的本发明的优点之外,可以提供一种图像处理设备,其根据组成包含在多个图像数据中的每个列表的各列的进一步的具体特征,进一步精确地指定将要纵向连接的列表部分。
根据本发明的第五方面,除了根据第三方面的本发明的优点之外,可以提供一种图像处理设备,其根据组成包含在多个图像数据中的每个列表的各列的进一步的具体特征,进一步精确地指定将要纵向连接的列表部分。
根据本发明的第六方面,除了根据第四方面的本发明的优点之外,可以提供一种图像处理设备,其根据组成包含在多个图像数据中的每个列表的各列的进一步的具体特征,进一步精确地指定将要纵向连接的列表部分。
根据本发明的第七方面,除了根据第三方面的本发明的优点之外,可以提供一种图像处理设备,其根据组成包含在多个图像数据中的每个列表的各列的进一步的具体特征,进一步精确地指定将要纵向连接的列表部分。
根据本发明的第八方面,除了根据第四方面的本发明的优点之外,可以提供一种图像处理设备,其根据组成包含在多个图像数据中的每个列表的各列的进一步的具体特征,进一步精确地指定将要纵向连接的列表部分。
根据本发明的第九方面,除了根据第五方面的本发明的优点之外,可以提供一种图像处理设备,其根据组成包含在多个图像数据中的每个列表的各列的进一步的具体特征,进一步精确地指定将要纵向连接的列表部分。
根据本发明的第十方面,除了根据第六方面的本发明的优点之外,可以提供一种图像处理设备,其根据组成包含在多个图像数据中的每个列表的个列的进一步的具体特征,进一步精确地指定将要纵向连接的列表部分。
根据本发明的第十一方面,除了根据第一方面的本发明的优点之外,可以提供一种图像处理设备,其根据与组成包含在多个图像数据中的每个列表的各行有关的信息,在没有用户指定的情况下,指定将要横向连接的列表部分。
根据本发明的第十二方面,除了根据第十一方面的本发明的优点之外,可以提供一种图像处理设备,其根据与组成包含在多个图像数据中的每个列表的各行有关的具体信息,在没有用户指定的情况下,进一步精确地指定将要横向连接的列表部分。
根据本发明的第十三方面,除了根据第十二方面的本发明的优点之外,可以提供一种图像处理设备,其根据组成包含在多个图像数据中的每个列表的各行的进一步的具体特征,进一步精确地指定将要横向连接的列表部分。
根据本发明的第十四方面,除了根据第十二方面的本发明的优点之外,可以提供一种图像处理设备,其根据组成包含在多个图像数据中的每个列表的各行的进一步的具体特征,进一步精确地指定将要横向连接的列表部分。
根据本发明的第十五方面,除了根据第十三方面的本发明的优点之外,可以提供一种图像处理设备,其根据组成包含在多个图像数据中的每个列表的各行的进一步的具体特征,进一步精确地指定将要横向连接的列表部分。
根据本发明的第十六方面,除了根据第十二方面的本发明的优点之外,可以提供一种图像处理设备,其根据组成包含在多个图像数据中的每个列表的各行的进一步的具体特征,进一步精确地指定将要横向连接的列表部分。
根据本发明的第十七方面,除了根据第十三方面的本发明的优点之外,可以提供一种图像处理设备,其根据组成包含在多个图像数据中的每个列表的各行的进一步的具体特征,进一步精确地指定将要横向连接的列表部分。
根据本发明的第十八方面,除了根据第十四方面的本发明的优点之外,可以提供一种图像处理设备,其根据组成包含在多个图像数据中的每个列表的各行的进一步的具体特征,进一步精确地指定将要横向连接的列表部分。
根据本发明的第十九方面,除了根据第十五方面的本发明的优点之外,可以提供一种图像处理设备,其根据组成包含在多个图像数据中的每个列表的各行的进一步的具体特征,进一步精确地指定将要横向连接的列表部分。
根据本发明的第二十方面,除了根据第一方面至第十九方面中的任意一个方面的本发明的优点之外,可以提供一种图像处理设备,其根据由通过打印包含在电子文档中的列表部分而输出的多个纸质文档来重新产生电子文档,从而恢复与原始电子文档的列表具有相同结构的列表。
根据本发明的第二十一方面,除了根据第二十方面的本发明的优点之外,可以提供一种图像处理设备,其通过容易地识别分割出的各列表部分的顺序而进一步精确地重新产生电子文档。
根据本发明的第二十二方面,除了根据第一方面至第十九方面中的任意一个方面的本发明的优点之外,可以提供一种图像处理设备,其通过容易地识别分割出的各列表部分的顺序而进一步精确地重新产生电子文档。
根据本发明的第二十三方面,除了根据第二十方面的本发明的优点之外,可以提供一种图像处理设备,其通过容易地识别分割出的各列表部分的顺序而进一步精确地重新产生电子文档。
根据本发明的第二十四方面,可以提供一种图像处理方法,其根据由电子文档中的列表部分所分割成的多个图像数据来重新产生电子文档,从而恢复与原始电子文档的列表具有相同结构的列表。
附图说明
将根据附图详细描述本发明的示例性实施例,其中:
图1A是图示了包括字符、列表、CG(计算机图形)、照片等的电子文档的示意图;
图1B是图示了通过打印图1A所示的电子文档而输出的纸质文档的示意图;
图2A是图示了图1A所示的电子文档中的列表部分的示意图;
图2B是图示了通过打印图2A所示的列表部分而输出的多个纸质文档的示意图;
图2C是图示了现有图像处理设备通过图2B所示的多个纸质文档重新产生的电子文档的示意图;
图3A是图示了电子文档中的列表部分的示意图;
图3B是图示了通过打印图3A所示的列表部分而输出的多个纸质文档的示意图;
图3C是图示了根据本发明第一示例实施例的图像处理设备根据图3B所示的多个纸质文档重新产生的电子文档的示意图;
图4是图示了根据示例实施例的图像处理设备的硬件构造的示意图;
图5是图示了在图4所示的图像处理设备中执行的第一电子文档产生程序的构造的示意图;
图6是图示了图5中的第一电子文档产生程序的第一列表图像形成处理程序的构造的示意图;
图7是图示了图6中所示的第一列表信息存储器中存储的第一列表信息表格的示意图;
图8是图示了列表连接确定处理的流程图,其中,图6中所示的第一列表连接确定部分确定是否纵向连接各列表对象;
图9是图示了列表连接确定处理的流程图,其中,图6中所示的第一列表连接确定部分确定是否横向连接各列表对象;
图10A是图示了电子文档中的加上标题的列表部分的示意图;
图10B是图示了通过将图10A所示的列表部分加上标题并打印而输出的多个纸质文档的示意图;
图10C是图示了利用现有图像处理设备而根据图10B所示的多个纸质文档重新产生的电子文档的示意图;
图11A是图示了通过将电子文档中的列表部分加上标题并打印而输出的多个纸质文档的示意图;
图11B是图示了重新产生电子文档之前删除了标题行的列表的示意图;
图11C是图示了利用根据本发明第二示例实施例的图像处理设备重新产生的电子文档的示意图;
图12是图示了第二电子文档产生程序的第二列表图像形成处理程序的构造的示意图,第二电子文档产生程序的第二列表图像形成处理程序可用于代替图5中所示的第一电子文档产生程序的第一列表图像形成处理程序;
图13是图示了图12所示的第二列表信息存储器中存储的第二列表信息表格的示意图;
图14是图示了列表连接确定处理的流程图,其中,图12中所示的第二列表连接确定部分确定是否连接各列表对象;
图15是图示了列表连接处理的流程图,其中,图12中所示的第二列表连接部分连接各列表对象;以及
图16是图示了第三电子文档产生程序的第三列表图像形成处理程序的构造的示意图,第三电子文档产生程序的第三列表图像形成处理程序可代替图5中所示的第一电子文档产生程序的第一列表图像形成处理程序。
具体实施方式
与如何做出示例实施例有关的背景
下文中,在描述示例实施例之前,为了便于理解,将描述如何做出示例实施例。
图1A是图示了包括字符、列表(它例如由行和列组成)、CG(计算机图形)、照片等的电子文档的示意图。图1B是图示了通过打印图1A所示的电子文档而输出的纸质文档的示意图。
例如,当一张纸不足以打印图1A上所示的电子文档时,如图1B所示,打印装置根据打印纸尺寸来分割电子文档,并在多个纸质文档上打印并输出分割的各电子文档。
图像处理设备根据由与图像处理设备相连的图像读取装置所读出的纸质文档的图像数据重新产生电子文档。
图2A是图示了图1A所示的电子文档中的列表部分的示意图。图2B是图示了通过打印图2A所示的列表部分而输出的多个纸质文档的示意图。图2C是图示了利用现有图像处理设备根据图2B所示的多个纸质文档重新产生的电子文档的示意图。
在利用前面提到的打印装置和图像处理设备的情况下,对图2A所示的电子文档中的列表部分进行分割,并将其打印在图2B所示的多个纸质文档上。随后,图像处理设备重新产生电子文档,以使得打印在多个纸质文档上的列表分别表现为图2C所示的各个单独的列表。
为此,重新产生的电子文档(图2C)不同于原始电子文档(2A)。因此,用户应该以某种方法重构该重新产生的电子文档,以使得重新产生的电子文档与原始电子文档一样。
图3A是图示了电子文档中的各列表部分的示意图。图3B是图示了通过打印图3A所示的列表部分而输出的多个纸质文档的示意图。图3C是图示了根据本发明第一示例实施例的图像处理设备1(下文将对其进行描述)根据图3B所示的多个纸质文档重新产生的电子文档的示意图。
考虑到上述背景而做出根据本发明示例实施例的图像处理设备1(下文将对其进行描述)。由此,当电子文档中的列表部分(图3A)被分割、并且被打印在多个纸质文档(图3B)上时,图像处理设备1根据多个纸质文档重新产生电子文档,以使得电子文档的列表具有与原始电子文档的列表相同的结构(图3C)。
第一示例实施例
下文将描述本发明的第一示例实施例。
图像处理设备1
图4是图示了图像处理设备1的硬件构造的示意图。
如图4所示,图像处理设备1包括:控制装置100,其包括CPU102和存储器104;图像读取装置106,其通过读出纸质文档来产生图像数据;输入/输出装置108,其包括键盘、触摸板、显示装置等;打印装置110,其打印并输出电子文档;通信装置112,其执行与其它装置的数据通信;记录装置114,其将数据记录到记录介质116(例如CD装置和HDD装置)上以及从记录介质116再现数据等。
下文中,在各个附图中,相同的组成部分和处理基本上以相同的参考数字及标号表示。
图像处理设备1通过图像读取装置106、记录介质116等接收其上打印了电子文档的多个纸质文档的图像数据,通过处理所接收的图像数据重新产生电子文档(下文将参考图5和图6对此进行描述),并且将该文档输出至打印装置110和通信装置112。
电子文档产生程序20
图5是图示了在图像处理设备1(图4)中执行的第一电子文档产生程序的结构的示意图。
如图5所示,电子文档产生程序20包括:JPEG(JointPhotographic ExpertsGroup,联合图像专家组)解码部分200;预处理部分202;对象分离部分204;CG图像形成处理部分206;照片图像形成处理部分208;字符图像形成处理部分210;OCR(OpticalCharacterRecognition,光学字符识别)部分212;格线校正处理部分214;第一列表图像形成处理部分30;图像形成数据组合部分218;以及电子文档产生部分220。
电子文档产生程序20通过例如记录介质(图4)载入图像处理设备1的存储器104,并且在图像处理设备1中运行的OS(图中未示出)下通过具体地使用图像处理设备1的硬件资源来执行该程序。
电子文档产生程序20根据通过图像读取装置106、记录介质116(图4)等接收到的其上打印了电子文档的多个纸质文档的图像数据,重新产生具有构成图像数据的各个组成部分的属性(字符、列表、CG、照片等)的电子文档。
JPEG解码部分200将通过图像读取装置106、记录介质116(图4)等接收并压缩的图像数据解码成解压缩图像数据,并且将图像数据输出给预处理部分202。
在对象分离部分204对从JPEG解码部分200输入的图像数据执行处理之前,预处理部分202对该数据执行预处理,并且将图像数据输出给对象分离部分204。
具体地说,预处理部分202执行:从输入图像数据去除噪声的处理;协助将图像数据分离成诸如字符、列表、CG、照片之类的组成部分(对象)的滤波处理;等等。
此外,图像数据的各个组成部分在下文中被称为“字符对象”、“列表对象”、“CG对象”、“照片对象”等。
对象分离部分204从自预处理部分202输入的图像数据中分离出各个对象,并且将分离出的CG对象输出至CG图像形成处理部分206,将照片对象输出至照片图像形成处理部分208,将字符对象输出至字符图像形成处理部分210,将列表部分输出至格线校正处理部分214。
CG图像形成处理部分206根据从对象分离部分204输入的CG对象产生用于产生电子文档的CG图像形成数据(例如,矢量图像形成数据),并且将该数据输出至图像形成数据组合部分218。
照片图像形成处理部分208根据从对象分离部分204输入的照片对象产生用于产生电子文档的照片图像形成数据(例如,图像数据),并且将该数据输出至图像形成数据组合部分218。
字符图像形成处理部分210根据从对象分离部分204输入的字符对象产生用于产生电子文档的字符图像形成数据(例如,文本数据和字体数据),并且将该数据输出至图像形成数据组合部分218和OCR部分212。
OCR部分212通过针对从字符图像形成处理部分210输入的图像形成数据进行的OCR处理,指定图像数据中的字符和字符位置。
并且,OCR部分212将指定的字符和位置作为字符数据输出至第一列表图像形成处理部分30和电子文档产生部分220。
格线校正处理部分214对从对象分离部分204输入的列表对象的格线的褪色和倾斜执行校正处理,并且将其输出至第一列表图像形成处理部分30。
第一列表图像形成处理部分30根据列表对象产生用于产生电子文档的列表图像形成数据(例如,具有列表格式的数据),在该列表对象中,对从OCR部分212输入的字符数据和从格线校正处理部分214输入的格线进行了校正(将参考图6等对其进行详细描述)。
此外,第一列表图像形成处理部分30将所产生的列表的图像形成数据输出至图像形成数据组合部分218、打印装置110、以及通信装置112(图4),或者它们中的任一个。
图像形成数据组合部分218组合从CG图像形成处理部分206、照片图像形成处理部分208、字符图像形成处理部分210、以及第一列表图像形成处理部分30输入的图像形成数据,并且将该数据输出至电子文档产生部分220。
电子文档产生部分220产生电子文档,其中在从图像形成数据组合部分218输入的图像形成数据的组合数据中,在与图像读取装置106读出的图像数据的相同位置处嵌入了从OCR部分212输入的字符数据(图4),并且电子文档产生部分220将该数据输出至打印装置110、通信装置112(图4)等。
第一列表图像形成处理程序30
图6是图示了图5中的第一电子文档产生程序20的第一列表图像形成处理程序30的构造的示意图。
如图6所示,列表图像形成处理程序30包括:第一列表信息存储器300、第一控制器302、第一字符数据存储器304、第一列表扫描部分306、列表结构获取部分308、第一列表连接确定部分310、第一列表连接部分312以及列表图像形成部分314。
列表图像形成处理程序30根据其中电子文档中的列表部分被分割和打印的多个纸质文档的图像数据来产生列表图像形成数据,从而产生与原始电子文档的列表具有相同结构的列表。
图7是图示了列表信息存储器300中存储的第一列表信息表格的示意图。
列表信息存储器300存储通过控制器302被图6所示的各个组成部分更新和引用的第一列表信息表格。
第一列表信息表格表示了电子文档中分割出的各个列表对象的列表信息的列表。
如图7所示,列表信息例如包括:用于唯一地标识列表对象的列表ID;列表对象的存储位置(例如,存储器中数据存储区的地址);表示列表对象结构的列表结构信息;用于标识纵向连接的多组列表对象的纵向连接ID;以及用于标识横向连接的多组列表对象的横向连接ID。
列表结构信息例如包括:列表对象的列数和行数,各列的宽度(列宽)以及各行的高度(行高),各个单元的底纹图案(shadingpattern),各个单元的颜色,以及每个单元的格线信息(颜色、类型、厚度等)。
例如,如图7所示,列表ID为“1”的列表对象存储在地址“p1”处,列表的列数为4,其从左边列开始的列宽依次为8.5、7.5、6和10(cm),每行从左侧开始的各个单元的底纹图案依次是2、0、0和0,其纵向连接ID是“1”,其横向连接ID是“1”。
控制器302(图6)控制各个部件。
字符数据存储器304接收从OCR部分212(图5)输入的字符数据,并且存储该数据以使得列表图像形成部分314能够参考该数据。
列表扫描部分306扫描从格线校正处理部分214(图5)输入的列表对象,从而获取各列表对象的存储位置,并分别为各列表对象分配列表ID(此外,下文中,作为特定示例,给出了下述情况:列表扫描部分306按照包含这些列表对象的图像数据被读出的顺序,将具有新值的列表ID分配给各图像数据中包含的列表对象)。
并且,列表扫描部分306通过控制器将所分配的列表ID以及所获取的存储位置添加至存储在列表信息存储器300中的第一列表信息表格。
列表结构获取部分308经由控制器302的控制而参考存储在列表信息存储器300中的第一列表信息表格来访问各列表对象的存储位置(图7),从而获取每个列表对象的列表结构信息。
并且,列表结构获取部分308通过控制器302将获取的列表结构信息添加至存储在列表信息存储器300中的第一列表信息表格。
列表连接确定部分310参考存储在列表信息存储器300中的第一列表信息表格的各列表ID的升序,基于与每个列表ID相对应的列表结构信息(图7)经由控制器302的控制来确定多组连接列表(将参考图8和图9对此进行描述)。
此外,基于上述确定结果,列表连接确定部分310通过控制器302的控制将各列表的纵向连接ID和横向连接ID添加至存储在列表信息存储器300中的第一列表信息表格(将参考图8和图9对此进行描述)。
列表连接部分312经由控制器302的控制而参考存储在列表信息存储器300中的第一列表信息表格来纵向或横向连接各个列表对象。
具体地说,例如,首先,列表连接部分312通过访问列表对象的存储位置(图7)而获取第一列表信息表格中具有相同的纵向连接ID值的列表对象,并且按照列表ID的升序纵向连接列表对象(连接至前一列表对象的末端)。
接下来,例如,列表连接部分312通过访问列表对象的存储位置而获取未纵向连接的列表对象中具有相同横向连接ID值的列表对象,并且按照列表ID的升序横向连接各列表对象(连接至前一列表对象的右端)。
并且,列表连接部分312将连接在一起的列表对象输出给列表图像形成部分314。
此外,在示例实施例中,为纵向连接赋予了优先级,但是本发明并不限于此,而是还可以将优先级赋予横向连接。
并且,可以根据用户指定、预定设置等来适当改变是将优先级赋予纵向连接还是赋予横向连接。
此外,列表连接确定部分310可仅仅确定纵向列表连接和横向列表连接中的任一种。
列表图像形成部分314参考存储在字符数据存储器304中的字符数据将字符数据嵌入到从列表连接部分312输入的列表对象中,从而产生列表图像形成数据。
并且,列表图像形成部分314将所产生的列表图像形成数据输出给图像形成数据组合部分218(图5)、打印装置110、和通信装置112(图4),或者它们中的任意一个或多个。
例如,当列表图像形成数据被输出给打印装置110和通信装置112时,从图1所示的还包括其它对象(字符、CG、照片等)的图像数据中输出仅仅包括各列表对象的图像形成数据。
并且,根据通过输入/输出装置108(图4)执行的预定设置以及用户指定来确定列表图像形成数据输出给哪个装置。
列表连接确定部分310的处理(纵向连接)
图8是图示了列表连接确定处理的流程图,其中,列表连接确定部分310(图6)确定是否纵向连接各列表对象。
下文中将进一步描述其中列表连接确定部分310确定是否纵向连接各列表对象的列表连接确定处理。
在步骤320(S320)中,列表连接确定部分310获取第一列表信息表格的第一行的列表信息(例如,图7的第一列表信息表格中列表ID为“1”的列表信息)作为第一列表信息。
在步骤322(S322)中,列表连接确定部分310确定第一列表信息表格中是否存在下一个列表信息(例如,图7的第一列表信息表格中列表ID为“2”的列表信息)。
如果列表连接确定部分310确定存在下一个列表信息,则进程进入S324的处理,否则处理结束。
在步骤324(S324)中,列表连接确定部分310获取下一个列表信息作为第二列表信息。
在步骤326(S326)中,列表连接确定部分310确定在S320中获取的第一列表信息的列数和各列的宽度是否与在S324中获取的第二列表信息的列数和各列的宽度一致。
如果列表连接确定部分310确定了第一列表信息和第二列表信息的列数和各列的宽度一致,则进程进入S328的处理,否则进程进入S332的处理。
此外,列表连接确定部分310不仅可以在第一列表信息和第二列表信息的列宽彼此完全一致的情况下确定它们彼此一致,而且还可以在它们的列宽之间的差异处于预定范围内的情况下确定它们彼此一致。
在步骤328(S328)中,列表连接确定部分310确定在S320中获取的第一列表信息的列数和各个列宽以外的其它列表结构信息(下文中称为“其它列信息”)是否与在S324中获取的第二列表信息的其它列信息一致。
具体地说,例如,列表连接确定部分310确定在第一列表信息和第二列表信息之间,相同列中的单元的平均颜色的色差是否处于预定范围内。
并且,例如,列表连接确定部分310确定在第一列表信息和第二列表信息之间,相同列中的单元的底纹图案是否彼此一致。
例如,在图3所示的纸质文档的第一至第三页中,第一列中的所有单元通过利用点图案而形成底纹,并且其它列中的单元未形成底纹。因此,列表连接确定部分310确定底纹图案彼此一致。
并且,列表连接确定部分310可确定:如果形成底纹的点中位于主扫描方向和子扫描方向上的中心的中心点的位置关系(浓度峰值)、以及各中心点的平均浓度中的差异处于预定范围内,则底纹图案彼此一致。
此外,例如,列表连接确定部分310确定第一列表信息和第二列表信息之间相同列的纵向格线的颜色的差异、以及它们的厚度差异是否处于预定范围内,并且确定格线的类型是否相同。
如果列表连接确定部分310确定其它列信息彼此一致,则进程进入S330的处理,否则进程进入S332的处理。
在步骤330(S330)中,列表连接确定部分310将相同的纵向连接ID分配给第一列表信息和第二列表信息。
在步骤332(S332)中,列表连接确定部分310将在S324中获取的第二列表信息设置为新的第一列表信息,并且为其分配一个新的纵向连接ID(例如,通过使当前纵向连接ID加1而获得的值),并且进程进入S322。
在步骤334(S334)中,列表连接确定部分310确定第一列表信息表格中是否存在还未执行列表连接确定处理的列表信息。
如果列表连接确定部分310确定存在还未执行列表连接确定处理的列表信息,则进程进入S324的处理,否则处理结束。
此外,在图8所示的流程图中,可以在S326中确定列数以及各列宽彼此一致,并且可以在S328中确定其它列信息彼此一致。在该情况下,确定连接第一列表信息和第二列表信息,并且不要求S328的确定。
在这种情况下,如果列表连接确定部分310在S326中确定列数以及各列宽彼此一致,则进程进入S330的处理,否则进程进入S332的处理。
列表连接确定部分310的处理(横向连接)
图9是图示了列表连接确定处理的流程图,其中,列表连接确定部分310(图7)确定是否横向连接各列表对象。
下文中,将进一步描述列表连接确定处理,其中,列表连接确定部分310确定是否横向连接列表对象。
在步骤320(S320)至324(S324)中,列表连接确定部分310执行与图8所示的S320至S324相同的处理。
在步骤340(S340)中,列表连接确定部分310确定在S320中获取的第一列表信息的行数和各行的高度是否与在S324中获取的第二列表信息的行数和各行的高度一致。
如果列表连接确定部分310确定它们的行数和各行的高度一致,则进程进入S342的处理,否则进程进入S346的处理。
此外,列表连接确定部分310不仅可以在行高彼此完全一致的情况下将行高确定为彼此一致,而且还可以在行高之间的差异处于预定范围内的情况下将行高确定为彼此一致。
在步骤342(S342)中,列表连接确定部分310确定在S320中获取的第一列表信息的行数和各行的高度之外的其它列表结构信息(下文中称为“其它行信息”)是否与在S324中获取的第二列表信息的其它行信息一致。
具体地说,例如,类似于S328(图8),列表连接确定部分310确定第一列表信息和第二列表信息之间相同行中的各单元的平均颜色的色差是否处于预定范围内。
并且,例如,类似于S328(图8),列表连接确定部分310确定第一列表信息和第二列表信息之间相同行中的所有列的底纹图案是否彼此一致。
例如,在图3所示的纸质文档中,在每页的各个行中,第一列中的各单元利用点图案而形成底纹,并且其它列中的各单元未形成底纹。因此,列表连接确定部分310确定底纹图案彼此不一致。
此外,例如,类似于S328(图8),列表连接确定部分310确定第一列表信息和第二列表信息之间相同行的横向格线的颜色的差异、以及它们的厚度差异是否处于预定范围内,并且确定格线的类型是否相同。
如果列表连接确定部分310确定其它行信息彼此一致,则进程进入S344的处理,否则进程进入S346的处理。
在步骤344(S344)中,列表连接确定部分310将相同的横向连接ID分配给第一列表信息和第二列表信息。
在步骤346(S346)中,列表连接确定部分310将在S324中获取的第二列表信息设置为新的第一列表信息,并且为其分配一个新的横向连接ID(例如,通过使当前横向连接ID加1而获得的值),并且进程进入S322。
在步骤332(S332)中,列表连接确定部分310执行与图8所示的S332相同的处理。
此外,在图9所示的流程图中,可以在S340中确定行数和各个行高彼此一致,并且可以在S342中确定其它行信息彼此一致。在该情况下,确定连接第一列表信息和第二列表信息,并且不需要S342的确定。
在这种情况下,类似于纵向列表连接的情况,如果列表连接确定部分310在S340中确定行数和各个行高彼此一致,则进程进入S344的处理,否则进程进入S346的处理。
图像处理设备1的第一操作示例
下文中将描述图像处理设备1(图4)的第一操作示例。
在本操作示例中,将描述这样一个处理,其中图像处理设备1根据其上打印了电子文档的多个列表部分(图3A)的多个纸质文档(图3B)来重新产生电子文档,如图3C所示。
在图像处理设备1中,从通过图像读取装置106读出的多个纸质文档的图像数据来扫描分割的各列表对象,并且向第一列表信息表格添加列表ID和存储位置(列表扫描部分306(图6))。
即,在本操作示例的图像处理设备1中,如图7所示,添加了5个列表ID和存储位置。
在图像处理设备1中,获取与这5个列表ID相对应的各个列表对象的结构信息,并将其添加到第一列表信息表格(图7)(列表结构获取部分308(图6))。
在图像处理设备1中,根据第一列表信息表格确定纵向或横向连接的多组列表,并且将纵向连接ID和横向连接ID添加至第一列表信息表格(列表连接确定部分310(图6、8和9))。
即,在本操作示例的图像处理设备1中,其列数、各个列宽以及相同行的底纹图案彼此一致并且其列表ID对应于“1”至“3”的列表对象的纵向连接ID被设置为“1”,并且列表ID对应于“4”和“5”的列表对象的纵向连接ID被设置为“2”。
并且,在本操作示例的图像处理设备1中,由于每个列表对象的各行中的各单元的底纹图案不同,所以纵向连接ID被设置成彼此不同的值(图7)。
在图像处理设备1中,根据第一列表信息表格的纵向连接ID和横向连接ID来连接各列表对象(列表连接部分312(图6))。
即,在本操作示例的图像处理设备1中,其纵向连接ID为“1”并且列表ID为“1”至“3”的各列表对象被纵向连接,并且其纵向连接ID为“2”并且列表ID为“4”和“5”的各列表对象被纵向连接(图3C)。
在图像处理设备1中,字符数据被嵌入到连接在一起的列表对象中,列表图像形成数据被产生并被输出至图像形成数据组合部分218(图5)、打印装置110、以及通信装置112(图4),或者它们中的任意一个或多个(列表图像形成部分314(图6))。
第二示例实施例
下文将描述本发明的第二实施例。
图10A是图示了电子文档中的加上标题的列表部分的示意图,其表示了电子文档中的各行或各列的每个项目的含义。图10B是图示了通过将图10A所示的列表部分加上标题并打印而输出的多个纸质文档的示意图。图10C是图示了利用现有图像处理设备根据图10B所示的多个纸质文档重新产生的电子文档的示意图。
图10A所示的电子文档中的加上标题的列表部分被分割并被打印在多个纸质文档上,从而标题被添加到各个纸质文档,如图10B所示。在这种情况下,在过去使用的图像处理设备中,如图10C所示,以使得打印在多个纸质文档上的各个列表作为被分别加上标题的独立列表的方式来重新产生电子文档。
图11A是图示了通过将电子文档中的各列表部分加上标题并打印而输出的多个纸质文档的示意图。图11B是图示了重新产生电子文档之前删除了标题行的各列表的示意图。图11C是图示了根据本发明示例实施例的图像处理设备1重新产生的电子文档的示意图。
在前面提到的背景下做出下文将要描述的根据本发明示例实施例的图像处理设备1。在本发明的第二示例实施例中,作为一个具体示例,给出了下述情况:重新产生如图11C所示的电子文档使其具有与原始电子文档相同结构的加上标题的各列表(图11A)。
第二列表图像形成处理程序40
图12是图示了替代图5中所示的根据本发明第一示例实施例的第一电子文档产生程序20的第一列表图像形成处理程序30的第二电子文档产生程序24的第二列表图像形成处理程序40的构造的示意图。
如图12所示,列表图像形成处理程序40包括:第二列表信息存储器400、第二控制器402、第二字符数据存储器404、第二列表扫描部分406、标题获取部分408、第二列表连接确定部分410、第二列表连接部分412、以及列表图像形成部分314。
列表图像形成处理程序40根据其中电子文档中的加上标题的列表部分被分割并被打印的多个纸质文档的图像数据来产生列表图像形成数据,从而创建与原始电子文档具有相同结构的加上标题的列表。
此外,下文中,在该示例实施例中,在列表的第一行处示出了标题,并且作为特定示例,将描述纵向连接各分割列表的情况。
图13是图示了列表信息存储器400中存储的第二列表信息表格的示意图。
列表信息存储器400存储通过控制器402更新并被图12所示的各个组成部分参考的第二列表信息表格。
如图13所示,例如类似于图7所示的第一列表信息表格,第二列表信息表格的各个列表信息包括:各列表对象的列表ID和存储位置。此外,该信息还包括:表示标题行的各个单元的内容的标题行信息;以及用于标识连接在一起的多组列表对象的连接ID。
例如,如图13所示,列表ID为“1”的列表对象存储在地址“p1”处,该标题行的各个单元的内容从左边单元开始依次为“No.”、“AAA”、“BBB”、“CCC”和“DDD”,并且其连接ID为“1”。
控制器402(图12)控制各个组成部分。
类似于图6所示的字符数据存储器304,字符数据存储器404接收从OCR部分212(图5)输入的字符数据,并且存储该数据以使得标题获取部分408和列表图像形成部分314能够参考该数据。
类似于图6所示的列表扫描部分306,列表扫描部分406扫描从格线校正处理部分214(图5)输入的各列表对象,从而获取各列表对象的存储位置,并分别为各列表对象分配列表ID。
并且,列表扫描部分406通过控制器402向存储在列表信息存储器400中的第二列表信息表格添加所分配的列表ID以及所获取的存储位置。
标题获取部分408通过控制器402的控制而参照存储在列表信息存储器400中的第二列表信息表格来访问各列表对象的存储位置(图13),从而获取各列表对象。
并且,标题获取部分408参照存储在字符数据存储器404中的字符数据来获取与所获取的各列表对象的第一行中的各个单元相对应的位置处的字符。
并且,标题获取部分408通过控制器402将所获取的字符添加至存储在列表信息存储器400中的第二列表信息表格。
第二列表连接确定部分410通过控制器402的控制,参考存储在列表信息存储器400中的第二列表信息表格的列表ID的升序,根据与每个列表ID相对应的标题行信息,来确定连接在一起的多组列表(下文将参考图14对此进行描述)。
并且,根据确定结果,第二列表连接确定部分410通过控制器402将各个列表的连接ID添加至存储在列表信息存储器400中的第二列表信息表格(下文将参考图14对此进行描述)。
列表连接部分412通过控制器402的控制,参考存储在列表信息存储器400中的第二列表信息表格的连接ID(图13)来连接各个列表对象,并且将连接在一起的列表对象输出至列表图像形成部分314(下文将参考图15对此进行描述)。
列表连接确定部分410的处理
图14是图示了列表连接确定处理的流程图,其中,列表连接确定部分410(图12)确定是否连接各列表对象。
下文中将进一步描述列表连接确定处理,其中,列表连接确定部分410确定是否连接各列表对象。
在步骤420(S420)中,列表连接确定部分410获取第二列表信息表格的第一行的列表信息(例如,图13的第二列表信息表格中列表ID为“1”的列表信息)作为第一列表信息。
在步骤422(S422)中,列表连接确定部分410确定第二列表信息表格中是否存在下一个列表信息(例如,图13的第二列表信息表格中列表ID为“2”的列表信息)。
如果列表连接确定部分410确定存在下一个列表信息,则进程进入S424的处理,否则处理结束。
在步骤424(S424)中,列表连接确定部分410获取下一个列表信息作为第二列表信息。
在步骤426(S426)中,列表连接确定部分410确定在S420中获取的第一列表信息的标题行信息是否与在S424中获取的第二列表信息的标题行信息一致。
如果列表连接确定部分410确定它们的标题行信息彼此一致,则进程进入S428的处理,否则进程进入S430的处理。
此外,如果第一列表信息和第二列表信息的标题行信息的相同列中存在至少一个相同的标题,则列表连接确定部分410可确定标题行信息彼此一致。
并且,如果第一列表信息和第二列表信息的相同列中存在至少一个相同的标题、以及如果第一列表信息和第二列表信息的列数或者列数及各列宽度彼此一致,则列表连接确定部分410可确定标题行信息彼此一致。
在步骤428(S428)中,列表连接确定部分410将相同的连接ID分配给第一列表信息和第二列表信息。
在步骤430(S430)中,列表连接确定部分410将在S424中获取的第二列表信息设置为新的第一列表信息,并且为其分配一个新的连接ID(例如,通过使当前连接ID加1而获得的值),并且进程进入S422。
在步骤432(S432)中,列表连接确定部分410确定第二列表信息表格中是否存在还未执行列表连接确定处理的列表信息。
如果第二列表连接确定部分410确定存在还未执行列表连接确定处理的列表信息,则进程进入S424的处理,否则处理结束。
列表连接部分412的处理
图15是图示了列表连接处理的流程图,其中,列表连接部分412(图12)连接各列表对象。
下文中,将进一步描述列表连接确定处理,其中,列表连接部分412连接各列表对象。
在步骤420(S420)至424(S424)中,列表连接部分412执行与图14所示的S420至S424相同的处理。
在步骤440(S440)中,列表连接部分412确定在S420中获取的第一列表信息的连接ID是否与在S424中获取的第二列表信息的连接ID一致。
如果列表连接部分412确定了它们的连接ID一致,则进程进入S442的处理,否则进程进入S444的处理。
在步骤442(S442)中,列表连接部分412访问在S424中获取的第二列表信息的存储位置,获取各列表对象(第二列表对象),并且删除与所获取的各第二列表对象的标题行相对应的第一行。
在步骤444(S444)中,列表连接部分412将第二列表信息设置为第一列表信息,并且进程进入S422的处理。
在步骤446(S446)中,列表连接部分412获取在S420中获取的第一列表信息的存储位置,获取列表对象(第一列表对象),并且将删除了标题行的第二列表对象连接至所获取的第一列表对象的尾端。
在步骤448(S448)中,列表连接部分412确定第二列表信息表格中是否存在未执行列表连接处理的列表对象。
如果列表连接部分412确定存在未执行列表连接处理的列表对象,则进程进入S424的处理,否则处理结束。
图像形成设备1的第二操作示例
下文中将描述图像处理设备1(图4)的第二操作示例。
在本操作示例中,将描述这样一个处理,其中图像处理设备1根据其上打印了电子文档各列表部分的多个纸质文档(图11A)来重新产生电子文档,如图11C所示。
在图像处理设备1中,从通过图像读取装置106读出的多个纸质文档的图像数据来扫描分割的各列表对象,并且向第二列表信息表格添加列表ID和存储位置(列表扫描部分406(图12))。
即,在本操作示例的图像处理设备1中,如图13所示,添加了5个列表ID和存储位置。
在图像处理设备1中,获取与这5个列表ID相对应的各个列表对象的标题行信息,并将其添加到第二列表信息表格(图13)(标题获取部分408(图12))。
在图像处理设备1中,根据第二列表信息表格确定连接的多组列表,并且将连接ID添加至第二列表信息表格(列表连接确定部分410(图12和图14))。
即,在本操作示例的图像处理设备1中,标题行信息彼此一致并且列表ID对应于“1”至“3”的列表对象的连接ID被设置为“1”,并且列表ID对应于“4”及“5”的列表对象的连接ID被设置为“2”(图13)。
在图像处理设备1中,根据第二列表信息表格的连接ID,连接各列表对象(列表连接部分412(图12和图15)。
即,在本操作示例的图像处理设备1中,在连接ID为“1”并且列表ID为“1”至“3”的列表对象当中,对列表ID为“2”和“3”的列表对象删除标题行(图11B),随后将列表ID为“2”和“3”的列表对象依次纵向连接至列表ID为“1”的列表对象的末端(图11C)。
并且,在图像处理设备1中,在连接ID为“2”并且列表ID为“4”及“5”的列表对象当中,对列表ID为“5”的列表对象删除标题行(图11B),随后将列表ID为“5”的列表对象纵向连接至列表ID为“4”的列表对象的末端(图11C)。
在图像处理设备1中,将字符数据嵌入到连接在一起的列表对象中,产生列表图像形成数据,并且将列表图像形成数据输出至图像形成数据组合部分218(图5)、打印装置110和通信装置(图4),或者它们中任意一个或多个(列表图像形成部分314(图12))。
第二示例实施例的修改示例
以其中在列表第一行示出了标题并且纵向连接各分割列表的特定示例来描述了示例实施例,但是本发明并不限于此。例如,在示例实施例中,标题可显示在列表的第一列中,并且可横向连接各分割列表。
在这种情况下,标题获取部分408参照存储在字符数据存储器404中的字符数据来获取与每个列表对象的第一列中的各个单元相对应的位置处的字符。
并且,标题获取部分408通过控制器402将所获取的字符作为标题列信息添加至存储在列表信息存储器404中的第二列表信息表格。
而且,类似于图14中的列表连接确定处理,列表连接确定部分410根据标题列信息确定连接的多组列表,并且通过控制器402,将其连接ID添加至存储在列表信息存储器400中的第二列表信息表格。
类似于图15中的列表连接处理,列表连部分412根据连接ID横向连接各个列表对象。
并且,两个示例实施例如下组合:如果提取了列表的标题位置并且标题位置为列表的第一行,则执行纵向列表连接处理;如果标题位置为列表第一列,则执行横向列表连接处理。
此外,该示例实施例适用于标题出现在列表的最后一行或列表的最后一列的情况。
第三示例实施例
下文将描述本发明的第三示例实施例。
在本发明的第三示例实施例中,作为特定示例,给出下述情况:根据电子文档中的各列表部分的每个标题的存在与否来选择第一示例实施例和第二实施例中的一个,并且根据多个纸质文档的图像数据产生列表图像来形成数据以使得该数据的列表具有与原始电子文档的列表相同的结构。
第三列表图像形成处理程序50
图16是图示了第三电子文档产生程序26的第三列表图像形成处理程序50的构造的示意图,第三电子文档产生程序26可代替图5中所示的根据本发明第一示例实施例的第一电子文档产生程序20的第一列表图像形成处理程序30。
如图16所示,第三列表图像形成处理程序50包括:第三列表信息存储器500、第三控制器502、第三列表扫描部分504、选择部分506、列表结构获取部分308、第一列表连接确定部分310、第一列表连接部分312、列表图像形成部分314、第二字符存储器404、标题获取部分408、第二列表连接确定部分410、以及第二列表连接部分412。
列表图像形成处理程序50根据电子文档中各列表部分的每个标题的存在与否来选择第一示例实施例和第二示例实施例之一,并且产生列表图像形成数据。
列表信息存储器500通过控制器502存储被图16所示的各个部件更新及参考的第三列表信息表格。
例如,类似于图7所示的第一列表信息表格,第三列表信息表格的各个列表信息包括:列表ID和列表对象的存储位置。此外,列表信息还包括表示每个列表对象的标题存在与否的标题存在信息。
此外,列表信息存储器500根据在选择部分506中进行的第一示例实施例和第二示例实施例之间的选择来存储图7所示的第一列表信息表格以及图13所示的第二列表信息表格。
控制器502控制各个部件。
类似于图6所示的列表扫描部分306,列表扫描部分504扫描从格校正处理部分214(图5)输入的各列表对象,从而获取各列表对象的存储位置,并且分别为各列表对象分配列表ID。
此外,列表扫描部分504通过访问各列表对象的存储位置来获取各列表对象。例如,如果列表对象的第一行或第一列的格式设置不同于其它行或列的格式设置,则确定存在标题,否则确定不存在标题,由此产生标题存在信息。
而且,列表扫描部分504通过控制器502将所分配的列表ID、所获取的存储位置以及所产生的标题存在信息添加至存储在列表信息存储器500中的第三列表信息表格。
选择部分506通过控制器502的控制根据存储在列表信息存储器500中的第三列表信息表格的标题存在信息来选择列表连接方法。
具体地说,例如,当第三列表信息表格的列表信息中的标题存在信息表示存在标题时,选择部分506通过控制器502,将具有连续值的列表ID的各列表对象的列表信息,作为一个第二列表信息表格,输出至列表信息存储器500。
而且,例如,当第三列表信息表格的列表信息中的标题存在信息表示不存在标题时,选择部分506通过控制器502,将具有连续值的列表ID的各列表对象的列表信息,作为一个第一列表信息表格,输出至列表信息存储器500。
修改示例1
在本发明的第一至第三示例实施例中,第一至第三列表图像形成处理程序30、40和50对作为处理对象的所有的列表对象执行列表连接处理,随后连接各列表对象,从而产生列表图像形成数据。但是,可以针对每个列表对象依次执行列表连接处理。
修改示例2
在本发明的第一至第三示例实施例中,各列表对象的列表连接确定和列表连接处理是按照读出包括各列表对象的图像数据的顺序执行的。但是,例如,如图3B和图11A所示,在分别打印了多个纸质文档的页码的情况下,通过从读出的图像数据识别页码,针对列表对象的每个处理可按照页码的顺序来执行。
修改示例3
在本发明的第一至第三示例实施例中,根据通过第一和第二列表连接确定部分310和410而添加至列表信息表格的连接ID,第一和第二列表连接部分308和408可执行各列表对象的列表连接处理(图8、图9和图14)。但是在执行列表连接处理之前,例如,通过向用户显示列表连接确定处理的结果,可响应于从用户接收列表连接指令来执行列表连接处理。
修改示例4
在本发明的第一至第三示例实施例中,第一和第二列表连接确定部分310和410对由对象分离部分204(图5)分割出的各列表对象执行列表连接确定处理。但是,第一和第二列表连接确定部分310和410可以不仅参考各列表对象,而且参考对象分割之前获取的图像数据,来执行列表连接确定处理。
具体地说,例如,第一和第二列表连接确定部分310和410可确定第一列表对象和第二列表对象之间包括的其它对象(字符、CG、照片等)。在这种情况下,即使第一和第二列表对象的列表结构和标题信息彼此一致,第一和第二列表连接确定部分310和410也不连接两个列表对象。
出于示例和说明的目的提供了本发明的示例性实施例的上述说明。其意图不在于穷举或将本发明限制为所公开的确切形式。显然,对于本领域的技术人员而言许多修改和变型是显而易见的。选择和说明实施例是为了最佳地解释本发明的原理及其实际应用,从而使得本领域的其他人员能够理解各种实施例的发明和适合于特定预期应用的各种修改。其目的在于用所附权利要求书及其等同内容来限定本发明的范围。

Claims (24)

1.一种图像处理设备,包括:
字符图像形成处理部分,其根据多个图像数据产生用于生成电子文档的字符图像形成数据;
OCR部分,其针对从所述字符图像形成处理部分输入的字符图像形成数据来指定所述图像数据中的字符和字符位置;
格线校正处理部分,其对来自所述多个图像数据的列表对象的格线的褪色和倾斜执行校正处理;以及
列表图像形成处理部分,其根据所述列表对象产生列表图像形成数据,在所述列表图像形成数据中,对从所述OCR部分输入的字符数据和从所述格线校正处理部分输入的格线进行了校正,
其中,所述列表图像形成处理部分包括:
结构信息获取部分,其从包含在以预定顺序排列的多个图像数据的每一个中的、并且由多行和多列形成的列表获取包含行信息和列信息的结构信息,所述行信息至少包括列表的行数以及各行的高度,所述列信息至少包括列数以及各列的宽度;
列表连接确定部分,其根据所获取的结构信息来确定在分别包含于所述多个图像数据中的列表当中的一组连接列表、以及所述连接列表的连接方向;以及
列表连接部分,其按照所确定的连接方向以所述多个图像数据被列出的顺序来连接所确定的所述一组连接列表。
2.根据权利要求1所述的图像处理设备,
其中,所述列表连接确定部分用于:
确定分别包含在所述多个图像数据中的多个列表的列信息是否彼此一致,
将列信息被确定为彼此一致、并且以所述多个图像数据被列出的顺序彼此邻接的多个列表确定为所述一组连接列表,以及
将所述连接方向确定为列表的向下方向。
3.根据权利要求2所述的图像处理设备,其中每个列信息还包括:对构成每个列表并且唯一地由行和列指定的单元的属性进行表示的属性信息。
4.根据权利要求3所述的图像处理设备,
其中,所述属性信息包括构成列表的各个单元的颜色信息,以及
其中,所述列表连接确定部分确定所述多个图像数据中包含的各个列表相同列中的各单元的颜色信息是否彼此一致。
5.根据权利要求3所述的图像处理设备,
其中,所述属性信息至少包括构成列表的各个单元的底纹图案,以及
其中,所述列表连接确定部分确定所述多个图像数据中包含的各个列表相同列中的各单元的底纹图案是否彼此一致。
6.根据权利要求4所述的图像处理设备,
其中,所述属性信息至少包括构成列表的各个单元的底纹图案,以及
其中,所述列表连接确定部分确定所述多个图像数据中包含的各个列表相同列中的各单元的底纹图案是否彼此一致。
7.根据权利要求3所述的图像处理设备,
其中,所述属性信息包括表示构成列表的各单元的纵向格线的属性的列线信息,以及
其中所述列表连接确定部分确定所述多个图像数据中包含的各个列表相同列中的各单元的列线信息是否彼此一致。
8.根据权利要求4所述的图像处理设备,
其中,所述属性信息包括表示构成列表的各单元的纵向格线的属性的列线信息,以及
其中所述列表连接确定部分确定所述多个图像数据中包含的各个列表相同列中的各单元的列线信息是否彼此一致。
9.根据权利要求5所述的图像处理设备,
其中,所述属性信息包括表示构成列表的各单元的纵向格线的属性的列线信息,以及
其中所述列表连接确定部分确定所述多个图像数据中包含的各个列表相同列中的各单元的列线信息是否彼此一致。
10.根据权利要求6所述的图像处理设备,
其中,所述属性信息包括表示构成列表的各单元的纵向格线的属性的列线信息,以及
所述列表连接确定部分确定所述多个图像数据中包含的各个列表相同列中的各单元的列线信息是否彼此一致。
11.根据权利要求1所述的图像处理设备,
其中,所述列表连接确定部分用于:
确定分别包含在所述多个图像数据中的多个列表的行信息是否彼此一致,
将行信息被确定为彼此一致、并且以所述多个图像数据被列出的顺序彼此邻接的多个列表确定为所述一组连接列表,以及
将所述连接方向确定为列表的向右方向。
12.根据权利要求11所述的图像处理设备,其中,每个行信息还包括:对构成每个列表并且唯一地由行和列指定的单元的属性进行表示的属性信息。
13.根据权利要求12所述的图像处理设备,
其中,所述属性信息包括构成列表的各个单元的颜色信息,以及
其中,所述列表连接确定部分确定所述多个图像数据中包含的各个列表相同行中的各单元的颜色信息是否彼此一致。
14.根据权利要求12所述的图像处理设备,
其中,所述属性信息至少包括构成列表的各个单元的底纹图案,以及
其中,所述列表连接确定部分确定所述多个图像数据中包含的各个列表相同行中的各单元的底纹图案是否彼此一致。
15.根据权利要求13所述的图像处理设备,
其中,所述属性信息至少包括构成列表的各个单元的底纹图案,以及
其中,所述列表连接确定部分确定所述多个图像数据中包含的各个列表相同行中的各单元的底纹图案是否彼此一致。
16.根据权利要求12所述的图像处理设备,
其中,所述属性信息包括表示构成列表的各个单元的横向格线的属性的行线信息,以及
其中,所述列表连接确定部分确定所述多个图像数据中包含的各个列表的相同行中的各单元的行线信息是否彼此一致。
17.根据权利要求13所述的图像处理设备,
其中,所述属性信息包括表示构成列表的各个单元的横向格线的属性的行线信息,以及
其中,所述列表连接确定部分确定所述多个图像数据中包含的各个列表相同行中的各单元的行线信息是否彼此一致。
18.根据权利要求14所述的图像处理设备,
其中,所述属性信息包括表示构成列表的各个单元的横向格线的属性的行线信息,以及
其中,所述列表连接确定部分确定所述多个图像数据中包含的各个列表相同行中的各单元的行线信息是否彼此一致。
19.根据权利要求15所述的图像处理设备,
其中,所述属性信息包括表示构成列表的各个单元的横向格线的属性的行线信息,以及
其中,所述列表连接确定部分确定所述多个图像数据中包含的各个列表相同行中的各单元的行线信息是否彼此一致。
20.根据权利要求1至19中任一项所述的图像处理设备,其中,通过从纸质文档读出图像来产生所述多个图像数据。
21.根据权利要求20所述的图像处理设备,其中,所述预定顺序表示所述纸质文档被读出的顺序。
22.根据权利要求1至19中任一项所述的图像处理设备,
其中,所述多个图像数据包括对排列顺序进行指定的顺序信息,以及
其中,所述预定顺序表示由所述顺序信息指定的顺序。
23.根据权利要求20所述的图像处理设备,
其中,所述多个图像数据包括对排列顺序进行指定的顺序信息,以及
其中,所述预定顺序表示由所述顺序信息指定的顺序。
24.一种图像处理方法,包括:
根据多个图像数据产生用于生成电子文档的字符图像形成数据;
针对所述字符图像形成数据来指定所述图像数据中的字符和字符位置;
对来自所述多个图像数据的列表对象的格线的褪色和倾斜执行校正处理;以及
根据所述列表对象产生列表图像形成数据,在所述列表图像形成数据中,字符数据和所述列表对象的格线已被校正,
其中,根据所述列表对象产生列表图像形成数据的步骤包括:
从包含在以预定顺序排列的多个图像数据的每一个中的、并且由行和列构成的列表获取包含行信息和列信息的结构信息,所述行信息至少包括列表的行数以及各行的高度,所述列信息至少包括列数以及各列的宽度;
根据所获取的结构信息确定在分别包含于所述多个图像数据中的列表当中的一组连接列表、以及所述连接列表的连接方向;以及
按照所确定的连接方向以所述多个图像数据被列出的顺序来连接所确定的所述一组连接列表。
CN201110409989.8A 2011-03-28 2011-12-09 图像处理设备和图像处理方法 Expired - Fee Related CN102710882B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011069575A JP2012203784A (ja) 2011-03-28 2011-03-28 画像処理装置およびプログラム
JP2011-069575 2011-03-28

Publications (2)

Publication Number Publication Date
CN102710882A CN102710882A (zh) 2012-10-03
CN102710882B true CN102710882B (zh) 2016-12-14

Family

ID=

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1598810A (zh) * 2003-09-12 2005-03-23 精工爱普生株式会社 印刷系统、印刷系统的数据处理方法、程序及存储媒体

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1598810A (zh) * 2003-09-12 2005-03-23 精工爱普生株式会社 印刷系统、印刷系统的数据处理方法、程序及存储媒体

Similar Documents

Publication Publication Date Title
DE69326364T2 (de) Informationsverarbeitungsapparat und -verfahren unter Verwendung eines zusätzlichen zweckmässigen Informationspakets
DE69933404T2 (de) System und Verfahren zum gemeinsamen Benutzen von Fonts und Speichermedium für das Programm zum Ausführen des Verfahrens
EP0753833B1 (en) Apparatus and method for extracting articles from a document
JP2579397B2 (ja) 文書画像のレイアウトモデルを作成する方法及び装置
US8289562B2 (en) Image processing apparatus, method and recording medium
CN102708580A (zh) 图像处理设备和图像处理方法
US20110164813A1 (en) Apparatus and method for digitizing documents
CN108595402A (zh) 一种提取pdf表格信息的系统
US20090204888A1 (en) Document processing apparatus, document processing method, and storage medium
JP2008236468A (ja) 画像ファイル管理装置及びプログラム
JP2002091944A (ja) 画像処理装置および画像処理方法並びにコンピュータ読み取り可能な記録媒体
US20110258546A1 (en) Edited information provision device, edited information provision method, program, and recording medium
CN103258197B (zh) 图像处理装置及其控制方法
JP5526874B2 (ja) 画像処理装置及び画像処理プログラム
CN102710882B (zh) 图像处理设备和图像处理方法
JPH08331362A (ja) 画像形成装置
CN110489735A (zh) 一种演示文稿生成方法、装置及设备
JP6701268B2 (ja) 情報処理装置、制御方法およびプログラム
JP5407700B2 (ja) 画像処理システム、情報処理装置、画像処理装置、及びプログラム
CN102710882A (zh) 图像处理设备和图像处理方法
JP2006235954A (ja) 合成印刷システム
JP4257588B2 (ja) 写真プリント装置
JP5574272B2 (ja) 画像読取装置、画像処理装置およびプログラム
JP2614339B2 (ja) 帳票出力編集装置
JP3726864B2 (ja) デザインサンプル解析方法および装置、デザイン評価方法および装置

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20161214

Termination date: 20211209