CN1684494A - 图像形成装置、图像形成方法及其程序以及存储介质 - Google Patents

图像形成装置、图像形成方法及其程序以及存储介质 Download PDF

Info

Publication number
CN1684494A
CN1684494A CNA2005100563182A CN200510056318A CN1684494A CN 1684494 A CN1684494 A CN 1684494A CN A2005100563182 A CNA2005100563182 A CN A2005100563182A CN 200510056318 A CN200510056318 A CN 200510056318A CN 1684494 A CN1684494 A CN 1684494A
Authority
CN
China
Prior art keywords
page
image
image data
vertical
pages
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2005100563182A
Other languages
English (en)
Other versions
CN100349454C (zh
Inventor
加藤雅弘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Publication of CN1684494A publication Critical patent/CN1684494A/zh
Application granted granted Critical
Publication of CN100349454C publication Critical patent/CN100349454C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00684Object of the detection
    • H04N1/00721Orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00729Detection means
    • H04N1/00734Optical detectors
    • H04N1/00737Optical detectors using the scanning elements as detectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00742Detection methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00681Detecting the presence, position or size of a sheet or correcting its position before scanning
    • H04N1/00763Action taken as a result of detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32358Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device using picture signal storage, e.g. at transmitter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32358Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device using picture signal storage, e.g. at transmitter
    • H04N1/32459Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device using picture signal storage, e.g. at transmitter for changing the arrangement of the stored data
    • H04N1/32464Changing the arrangement of pages or documents, e.g. for producing pages to be bound
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3872Repositioning or masking
    • H04N1/3873Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3285Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device using picture signal storage, e.g. at transmitter
    • H04N2201/3288Storage of two or more complete document pages or image frames

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Geometry (AREA)
  • Computer Graphics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Record Information Processing For Printing (AREA)
  • Control Or Security For Electrophotography (AREA)
  • Processing Or Creating Images (AREA)

Abstract

图像形成装置、图像形成方法及其程序以及存储介质。一种图像形成装置,其包括用于读取原稿并生成原稿图像数据的图像读取装置,以及用于输入命令的命令输入装置。提供版面分析装置,用于对由原稿图像数据表示的图像的版面进行分析。提供控制器,当通过该命令输入装置输入命令时,该控制器根据版面分析装置的分析结果,确定水平或垂直并列页面的页面顺序。图像分割装置生成分割图像数据,并根据由该控制器确定的页面顺序输出该分割图像数据,该分割图像数据表示原稿图像数据的两个水平或垂直分割图像。

Description

图像形成装置、图像形成方法及其程序以及存储介质
技术领域
本发明涉及图像形成装置、图像形成方法、程序,以及存储介质,用于单独地形成双联页原稿(spread manuscript)的水平或垂直并列页面的图像。
背景技术
已知一些传统的复印机具有所谓的“连续页面复印”功能,该功能使得可以提供对双联页原稿的各个水平或垂直并列页面的图像的复印,或者可以生成并存储(以下称为“扫描”)各个页面的图像数据。在该连续页面复印功能中,复印机对所获取的双联页原稿的图像进行水平或垂直分割,然后将所分割的图像打印在各个单独的纸张上。或者如果复印机具备扫描功能,则其生成并存储分别表示所分割图像的图像数据。
已经提出了下述技术,该技术按照页面顺序,对使用连续页面复印功能所获得的图像进行重新排列。例如,已知提供了一种电子文件归档系统,在此通过引用并入其内容,当从尾页到首页读取该原稿时,以降序为所获得的装订原稿的各个图像分配页码,并且与所分配的对应页码一起存储该原稿的图像。因此,即使在读取顺序与该原稿的页面顺序不同时,也可以按照页面顺序正确地存储该原稿的图像。
然而,在上述技术中,用户必须根据原稿的装订方式输入表示该原稿图像的存储顺序的命令。
发明内容
鉴于上述背景提出了本发明,并且本发明提供了一种用于图像形成装置的技术,该图像形成装置具由连续页面复印功能,该图像形成装置单独地形成双联页原稿的各个水平或垂直并列页面的图像,以判断原稿页面顺序,并根据该原稿页面顺序来形成图像或存储图像数据。
根据本发明的图像形成装置具有:图像读取装置,用于读取原稿并生成原稿图像数据;命令输入装置,用于输入命令;版面分析装置,用于对由该原稿图像数据表示的图像的版面进行分析;控制器,当通过命令输入装置输入命令,以形成双联页原稿的各个水平或垂直并列页面的单独图像时,根据版面分析装置的分析结果来确定这些水平或垂直并列页面的页面顺序;以及图像分割装置,用于生成分割图像数据,并根据由控制器确定的顺序来输出该分割图像数据,该分割图像数据表示由原稿图像数据表示的图像的两个水平或垂直分割图像。
附图说明
下面将根据附图来详细说明本发明的实施例,附图中:
图1表示根据本发明的图像形成装置的结构;
图2示意性地表示了根据本发明的图像处理装置的结构;
图3表示根据本发明的由CPU执行的处理的流程图;
图4示意性地表示了通过根据本发明的装置进行了处理的双联页原稿的示例;
图5示意性地表示了通过根据本发明的装置进行了处理的垂直双联页原稿的示例;以及
图6示意性地表示了通过根据本发明的装置进行了处理的水平双联页原稿的示例。
具体实施方式
将参照附图来说明本发明的实施例。
图1表示根据本发明的图像形成装置10的结构。ROM(只读存储器)102中安装有用于控制该图像形成装置10的程序或数据,并且提供CPU(中央处理单元)101,用于通过以下操作来控制图像形成装置10的各个部分的性能:读出存储在ROM 102中的程序,将该程序设置在RAM(随机存取存储器)103中,并且执行该程序。图像存储装置117例如包括用于在其中存储图像数据等的硬盘驱动器。下文中将对图像处理装置118的结构进行说明。CPU 101、RAM 103、图像存储装置117以及图像处理装置118分别与使得能够进行高速数据传输的总线115相连。
多种外围设备与另一总线116相连。显示装置105例如包括液晶板、CRT(阴极射线管)等,并且显示操作菜单等。命令输入装置107包括键盘、鼠标、数字化仪(digitizer)等,用于输入操作图像形成装置10的命令。提供扫描仪或图像读取装置109,用于读取原稿并生成表示多灰度级图像的多值图像数据。打印机(处理装置)111根据该图像数据,使用电子照相印刷或喷墨技术,在记录纸的表面上形成图像。显示装置105、命令输入装置107、扫描仪109以及打印机111通过各自的接口106、108、110、112与总线116相连。总线116也通过接口114与网络113相连,以使图像形成装置10可以向外部系统发送数据以及从外部系统接收数据。这些总线105、106通过总线桥接器104彼此相连。
图2表示图像处理装置118的结构。以下描述的装置实际上是由CPU101在执行程序时生成的模块。
分辨率转换装置201用于接收由扫描仪109生成的原稿图像数据,并将该原稿图像数据的分辨率降低为最小分辨率级别,以在后续阶段中,保持在版面分析装置203中执行版面分析所需的信息量。通过执行该分辨率降低处理,可以以较高的速度执行后续阶段的处理。
线段提取装置202用于从该图像数据中提取构成线段的像素,并生成线段图像数据。更具体地,线段提取装置202接收由分辨率转换装置201降低了分辨率的原稿图像数据,并从该原稿图像数据中提取构成线段的像素。下面将示意性地说明该提取处理。
首先,执行多值图像的二值化。在该二值化处理中,首先计算包含在目标像素周围的预定区域范围内的像素的平均像素值。然后,如果该目标像素的像素值与所计算的平均像素值之间的差值等于或大于预定的阈值,则将该目标像素的像素值设置为“1”,而如果该差值小于该阈值,则将该目标像素的像素值设置为“0”。由于线段构成了诸如字符、线条画或表格的组成部分,所以在大多数情况下,构成这些组成部分的像素的像素值与构成背景组成部分的像素明显不同。同时,照片或图片由具有各种灰度级的像素构成,从而目标像素和周围像素之间的像素值差异较小。因此,通过设定适当的阈值,可以区分线段与诸如照片或图片的其它组成部分。
对所有像素执行了该处理之后,使用公知的标记处理来执行相连像素的提取。在相连像素的提取中,对构成二值化图像数据的像素依次进行扫描,并且如果找到像素值为“1”的像素,则检查在目标像素的附近是否存在像素值为“1”的另一像素,并且对像素值为“1”的相邻像素赋予相同的标记值。
然后,限定赋予了相同标记值的像素组的矩形。并且如果该限定矩形的尺寸等于或小于预定阈值,则将构成该像素组的像素的像素值改变为“0”。这种处理消除了噪声。
在本实施例中,将通过上述方式赋予了相同标记值的像素组视为线段,并且将由这些线段构成的图像称为线段图像。并且将表示线段图像的图像数据称为线段图像数据。
日本特开专利公报2002-175532中详细说明了用于提取线段的上述方法,在此通过引用并入其内容。
版面分析装置203用于对由线段图像数据表示的线段图像的版面进行分析,并且将该线段图像的组成部分分类为:包含字符串的文本区域;包含线条画的线条画区域;以及包含表格的表格区域。在本实施例中,采用了公知的版面分析方法。在版面分析过程中,对特征量(例如,构成线段图像并如上所述提取的相连像素的位置、尺寸、构成、密度或者投影分布)进行测量,并且在由预定的阈值等规定的规则下对这些相连像素进行分类。例如,在日本特开专利公报H09-91450中详细说明了版面分析的技术,在此通过引用并入其内容。
版面分析装置203包括用于判断原稿的构成(erected)状态的构成装置。更具体地,使用公知的字符识别装置204对由版面分析装置203沿各个方向提取的文本区域进行字符识别。并且根据表现出最高识别率的方向来确定该原稿图像的构成方向。
版面分析装置203还包括双联方向判断装置,用于判断原稿进行双联的方向。由于双联页原稿的页面之间的边界区域比其它区域接收较少的从扫描仪109发出的光量,所以在原稿图像的这种边界区域中形成深色的带状或线状区域。该双联方向判断装置从已经对其构成方向进行了识别的原稿中提取该深色区域,并且根据该深色区域的延伸方向来确定双联方向。这种处理可以判断原稿是水平双联还是垂直双联。
版面分析装置203还包括页码提取装置,用于从文本区域中提取页码。更具体地,从分类为文本区域的区域中提取字符串,作为可能的页码。页码通常位于未装订侧的顶角或底角处,或者大致位于底部的中央,从而提取这些区域中的字符串作为该可能的页码。由字符识别装置204对这些字符串进行识别,并判断它们是否表示页码。通过进行质询(例如,该字符串是否为数字,或者水平或垂直相邻的数字是否连续等)来进行该判断。
上述线段提取装置202和版面分析装置203构成组成部分提取装置。
自然语言分析装置205用于使用诸如语素分析或语法分析的公知方法来判断这些文本区域之间是否存在上下文关系,并且提取具有这种关系的多对文本区域。例如,如果分割文本以构成位于不同页面中的两个文本区域,则该文本的前一部分被设置在前一页,而后一部分被设置在后一页。或者,包含在标题中的章编号或者添加在图表标题中的表编号对于判断该上下文关系也是有帮助的。在本实施例中,使用这些上下文关系来判断双联页原稿的两页的页面顺序。
连续复印顺序确定装置206用于根据上述版面分析装置203、字符识别装置204、以及自然语言分析装置205的分析结果来判断该双联页原稿的两页的页面顺序,并且用于生成表示该页面顺序的数据。将在以下对于操作的说明中描述用于判断页面顺序的处理步骤的细节。
图像分割装置207用于生成分割图像数据,并将该分割图像数据提供给打印机111,该分割图像数据表示原稿图像的水平或垂直分割图像。
以下将说明如上构造的图像形成装置10的操作。由于CPU 101通过执行程序来进行以下操作,所以将这些操作解释为CPU 101的动作。
图3是由CPU 101执行的处理的流程图。这里,假定用户已经通过命令输入装置107输入了用于执行连续页面复印的命令,并且扫描仪109已经对双联页原稿进行了扫描,并生成了原稿图像数据。
首先,在步骤S01中,CPU 101使用分辨率转换装置201对由扫描仪109生成的源图像数据的分辨率进行转换。CPU 101接收由扫描仪109生成的原稿图像数据,并将该原稿图像数据的分辨率降低为最小分辨率,在后续阶段中,该最小分辨率足够保持在版面分析装置203中进行版面分析所需的信息量。通过进行该处理,可以以较高的速度执行以下处理。
图4(a)表示双联页原稿的图像的示例。在该示例中,照片被设置在左侧页面的上部区域中,线条画被设置在下部区域中,并跨越左侧页面和右侧页面,而表格被设置在右侧页面的右下方区域中。在这些页面的其它区域中,设置了多组文本。
在步骤S02中,CPU 101接收已经由分辨率转换装置201降低了分辨率的原稿图像数据,并且使用线段提取装置202从该原稿图像数据中提取构成线段的像素,并生成线段图像数据。图4(b)是通过上述线段提取处理提取的线段图像的示例。如该图所示,在线段图像中,去除了设置在右侧页面的上部区域中的照片。
然后,在步骤S03中,CPU 101使用版面分析装置203对由该线段图像数据表示的线段图像的版面进行分析,并将该线段图像的组成部分分类为:包含字符串的文本区域、包含线条画的线条画区域,以及包含表格的表格区域。
图4(c)表示对该线段图像进行版面分析的结果。图中,“段1”、“段2”、“段3”、“段4”、“段5”和“段6”都是文本区域。其中,“段3”、“段4”和“段6”是照片或图形的标题,并且这些标题也被分类为文本区域。“图1”是包含线条画的线条画区域。“表1”是包含表格的表格区域。
在步骤S04中,CPU 101使用该构成装置来判断该双联页原稿的构成方向,并将该原稿图像旋转为使文件可读的方向(构成方向)。在步骤S05中,CPU 101使用双联方向判断装置来确定原稿进行双联的双联方向。由此判断该原稿是水平双联还是垂直双联。
如果该原稿为水平双联(步骤S05:是),则CPU 101前进到步骤S06。如果该原稿为垂直双联(步骤S05:否),则CPU 101前进到步骤S13。在步骤S13中,CPU 101生成表示页面顺序的数据。如果该原稿为垂直双联,如图5中所示,则无论原稿是水平书写的还是垂直书写的,或者使用了什么语言(例如日文或英文),上侧页面都成为前一页。因此,在这种情况下,将上侧页确定为前一页。
在步骤S06中,CPU 101使用页码提取装置来判断是否存在可以作为可能页码的字符串。如果存在可能页码(步骤S06:是),则CPU 101前进到步骤S07,而如果不存在可能页码(步骤S06:否),则CPU 101前进到步骤S09。在步骤S07中,CPU 101使用字符识别装置204来识别该可能页码字符串。然后在步骤S08中,CPU 101判断所识别的字符串是否为页码。如果是页码(步骤S08:是),则CPU 101前进到步骤S13,以根据所识别的页码来生成表示页码的数据。如果不是页码,则CPU 101前进到步骤S09。
在步骤S09中,CPU 101通过版面分析装置203来判断在所提取的文本区域中是否存在垂直书写的文本区域。如果存在,则意味着仅存在垂直书写的文本区域,或者存在包含垂直书写的文本区域以及水平书写的文本区域的混合文本区域。如果仅存在垂直书写的文本区域,则右侧页始终为前一页。如果如图6所示存在混合文本区域,则右侧页通常为前一页。因此,当存在垂直书写的文本区域(步骤S09:是)时,CPU 101前进到步骤S13,以通过将右侧页确定为前一页来生成表示页面顺序的数据。如果不存在垂直书写的文本区域(步骤S09:否),则CPU 101前进到步骤S10。然而,当同时存在垂直和水平书写的文本区域时,可能出现上述情况以外的不同情况,从而用户可以根据待存储在图像形成装置10中的实际文档的页面顺序来提供预定的顺序。
在步骤S10中,CPU 101使用自然语言分析装置205来判断各个文本区域之间的上下文关系。在步骤S11中,CPU 101根据文本区域之间的上下文关系来判断页面顺序。当不同的两个页面上分别存在具有相互上下文关系的文本区域(步骤S11:是)时,CPU 101前进到步骤S13,以根据文本区域的上下文关系来生成表示页面顺序的数据。当无法判断页面顺序时,CPU 101前进到步骤S12。
在步骤S12中,CPU 101根据预定规则来确定页面顺序,并且前进到步骤S13,以生成表示页面顺序的数据。该预定规则可以例如包括规定右侧页在左侧页之前的规则。用户可以根据文档类型来制定这些规则,并且将其预先存储在图像形成装置10中。
在步骤S14中,CPU 101将步骤S14中生成的表示页面顺序的数据,与原稿图像数据一起,提供给图像分割装置207。图像分割装置207根据该页面顺序数据来生成分割图像数据,并将该分割图像提供给打印机111,该分割图像数据表示经水平或垂直分割的原稿图像的分割图像。打印机111根据该分割图像数据来形成图像。
如上所述,根据本发明,当执行所谓的连续页面复印以形成双联页原稿的水平并列页的单独图像时,可以按照已确定的页面顺序来形成图像或存储图像数据。
在页面顺序的判断中,以分级的方式使用各种判断参数,例如双联方向、页码、垂直或水平书写方向、以及文本区域之间的上下文关系,因此,可以进行准确的判断,而不会导致不必要的判断处理。
如以下示例性所示,可以通过多种改进来实施本发明。
尽管在上述实施例中,使用字符识别处理来判断原稿图像的构成,但是还可以使用版面分析结果。例如,可以使用诸如标题的位置、图表及其标题之间的位置关系的特性值来判断原稿图像的构成。
尽管在上述实施例中,使用打印机111根据由连续复印顺序确定装置206确定的连续复印顺序来形成图像,但是也可以对该图像进行处理,以将其作为表示该图像的图像数据存储在图像存储装置117中。另外,可以将图像存储装置117形成为通过网络113与图像形成装置10相连的存储装置。
尽管在上述实施例中,CPU 101执行程序来进行处理,但是可以由具有等效功能的硬件装置来构成图像形成装置10。
在上述图像形成装置中,图像读取装置首先读取原稿并生成原稿图像数据。当通过命令输入装置输入命令,以形成该双联页原稿的水平或垂直并列页面的单独图像时,版面分析装置对该原稿图像数据的版面进行分析。然后,控制器根据该版面分析装置的分析结果来确定水平或垂直并列页面的页面顺序。随后,图像分割装置生成分割图像数据,并根据由控制器确定的顺序输出该分割图像数据,该分割图像数据表示原稿图像的两个水平或垂直分割图像。
在本发明的另一实施例中,一种图像形成方法包括:读取原稿以生成原稿图像数据;当输入命令,以形成双联页原稿的水平或垂直并列页面的单独图像时,对该原稿图像的版面进行分析,以确定水平或垂直并列页面的页面顺序;以及生成分割图像数据,并根据该页面顺序输出该分割图像数据,该分割图像数据表示由该原稿图像数据表示的图像的两个水平或垂直分割图像。
在本发明的另一实施例中,提供了用于使计算机执行下述功能的程序,该功能包括:读取原稿以生成原稿图像数据;当输入命令,以形成双联页原稿的水平或垂直并列页面的单独图像时,对该原稿图像的版面进行分析,以确定水平或垂直并列页面的页面顺序;以及生成分割图像数据,并根据该页面顺序输出该分割图像数据,该分割图像数据表示由该原稿图像数据表示的图像的两个水平或垂直分割图像。
根据该实施例,在具有连续页面复印功能以形成双联页原稿的各个页面的单独图像的图像形成装置中,可以判断页面顺序并根据该页面顺序来形成这些页面的图像或者存储这些页面的图像数据。
为了示例和说明的目的,提供了对本发明实施例的前述说明。其目的并不在于穷举本发明或者将本发明限制为所公开的确切形式。显然,对于本领域的技术人员,许多修改和变化都是显而易见的。为了最好地说明本发明的原理及其实际应用而选择并描述了这些实施例,因此,使得本领域的技术人员能够理解本发明,同时为了适用于预期的特定应用,可以具有多种实施例和多种变型例。以下权利要求及其等价物旨在限定本发明的范围。
通过引用并入于2004年4月15日提交的日本专利申请NO.2004-120207的全部公开内容,包括说明书、权利要求、附图和摘要。

Claims (8)

1、一种图像形成装置,其包括:
图像读取装置,用于读取原稿并生成原稿图像数据;
命令输入装置,用于输入命令;
版面分析装置,用于对由所述原稿图像数据表示的图像的版面进行分析;
控制器,当通过所述命令输入装置输入命令,以形成双联页原稿的水平或垂直并列页面的单独图像时,该控制器根据所述版面分析装置的分析结果来确定这些水平或垂直并列页面的页面顺序;以及
图像分割装置,用于生成分割图像数据,并根据由所述控制器确定的顺序来输出该分割图像数据,该分割图像数据表示由所述原稿图像数据表示的图像的两个水平或垂直分割图像。
2、根据权利要求1所述的图像形成装置,还包括:
构成方向判断装置,用于判断所述原稿图像的构成方向;以及
双联方向判断装置,用于通过识别所述原稿图像的页面之间的边界区域,来判断该原稿的双联方向,其中,
当通过所述命令输入装置输入命令,以形成双联页原稿的水平或垂直并列页面的单独图像时,如果根据所述构成方向判断装置和所述双联方向判断装置的判断结果,判定该原稿为垂直双联,则所述控制器将上侧页确定为前一页。
3、根据权利要求2所述的图像形成装置,还包括页码提取装置,用于提取字符串作为可能页码,并判断该字符串是否为页码,其中
如果所述双联页原稿为水平双联,并且提取了所述页码,则所述控制器根据所提取的页码来确定页面顺序。
4、根据权利要求3所述的图像形成装置,其中,如果没有提取到所述页码,则所述控制器判断是否存在任何垂直书写的文本区域,并且如果存在,则将右侧页确定为前一页。
5、根据权利要求4所述的图像形成装置,其中,如果仅存在水平书写的文本区域,则所述控制器判断分别位于两个水平并列页面中的文本区域之间的上下文关系,并且根据该判断结果来确定页面顺序。
6、根据权利要求5所述的图像形成装置,其中,如果判定分别位于两个水平并列页面中的文本区域之间没有上下文关系,则所述控制器根据预定的规则来确定页面顺序。
7、一种图像形成方法,包括:
读取原稿以生成原稿图像数据;
当输入命令,以形成双联页原稿的水平或垂直并列页面的单独图像时,对所述原稿图像的版面进行分析,以确定水平或垂直并列页面的页面顺序;以及
生成分割图像数据,并根据所述页面顺序输出该分割图像数据,该分割图像数据表示由所述原稿图像数据表示的图像的两个水平或垂直分割图像。
8、一种计算机可读存储介质,该存储介质存储有可以由计算机执行的指令的程序,以实现下述功能,该功能包括:
读取原稿以生成原稿图像数据;
当输入命令,以形成双联页原稿的水平或垂直并列页面的单独图像时,对所述原稿图像的版面进行分析,以确定水平或垂直并列页面的页面顺序;以及
生成分割图像数据,并根据所述页面顺序输出该分割图像数据,该分割图像数据表示由所述原稿图像数据表示的图像的两个水平或垂直分割图像。
CNB2005100563182A 2004-04-15 2005-03-17 图像形成装置、图像形成方法及其程序以及存储介质 Expired - Fee Related CN100349454C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004120207 2004-04-15
JP2004120207A JP4232679B2 (ja) 2004-04-15 2004-04-15 画像形成装置およびプログラム

Publications (2)

Publication Number Publication Date
CN1684494A true CN1684494A (zh) 2005-10-19
CN100349454C CN100349454C (zh) 2007-11-14

Family

ID=35095959

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005100563182A Expired - Fee Related CN100349454C (zh) 2004-04-15 2005-03-17 图像形成装置、图像形成方法及其程序以及存储介质

Country Status (3)

Country Link
US (1) US7528986B2 (zh)
JP (1) JP4232679B2 (zh)
CN (1) CN100349454C (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101931731B (zh) * 2009-06-26 2012-09-26 北京大学 一种文稿方向的检测方法和装置
CN104219410A (zh) * 2013-05-30 2014-12-17 夏普株式会社 设定装置、图像形成装置、以及透明涂层设定方法
CN106488074A (zh) * 2015-08-24 2017-03-08 柯尼卡美能达株式会社 图像处理装置以及电子文件生成方法
CN110248035A (zh) * 2018-03-09 2019-09-17 株式会社理光 信息处理装置、图像形成装置、图像处理系统、图像处理方法和程序

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006252048A (ja) * 2005-03-09 2006-09-21 Fuji Xerox Co Ltd 翻訳装置、翻訳プログラムおよび翻訳方法
US8861015B2 (en) * 2007-12-21 2014-10-14 Schlumberger Technology Corporation Preparing an electronic document of continuous information for document exchange that supports continuous and page-by-page printing
JP5005005B2 (ja) 2009-07-30 2012-08-22 インターナショナル・ビジネス・マシーンズ・コーポレーション コンテンツ読み上げ順序を視覚化するための視覚化プログラム、視覚化方法、及び視覚化装置
JP2011151492A (ja) * 2010-01-19 2011-08-04 Ricoh Co Ltd 画像処理システム、画像処理装置、画像分割プログラム、及び記録媒体
JP4954316B2 (ja) * 2010-06-17 2012-06-13 シャープ株式会社 ドキュメント作成装置、ドキュメント作成方法、ドキュメント作成プログラム及び記録媒体
JP2012133659A (ja) 2010-12-22 2012-07-12 Fujifilm Corp ファイルフォーマット、サーバ、電子コミックのビューワ装置および電子コミック生成装置
US9588675B2 (en) 2013-03-15 2017-03-07 Google Inc. Document scale and position optimization
JP5928902B2 (ja) * 2013-03-21 2016-06-01 カシオ計算機株式会社 画像処理装置、及びプログラム
US9881003B2 (en) * 2015-09-23 2018-01-30 Google Llc Automatic translation of digital graphic novels
JP2017199103A (ja) * 2016-04-26 2017-11-02 京セラドキュメントソリューションズ株式会社 画像処理システム、画像処理装置、画像処理方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02257212A (ja) * 1989-03-29 1990-10-18 Matsushita Graphic Commun Syst Inc 印刷処理装置
US5369716A (en) * 1989-08-31 1994-11-29 Kabushiki Kaisha Toshiba Document reader and reading processing method therefor
JPH0822535A (ja) 1994-07-11 1996-01-23 Canon Inc 画像電子ファイリング装置
US5940583A (en) * 1994-11-15 1999-08-17 Canon Kabushiki Kaisha Image forming apparatus
JP3504054B2 (ja) * 1995-07-17 2004-03-08 株式会社東芝 文書処理装置および文書処理方法
JPH1166231A (ja) * 1997-08-08 1999-03-09 Nec Corp 文字認識装置及びその文字認識方法
JPH11164102A (ja) * 1997-11-27 1999-06-18 Ricoh Co Ltd 画像読み取り装置
JP4261732B2 (ja) * 2000-04-27 2009-04-30 キヤノン株式会社 画像処理装置および方法、並びにプログラム
JP2002112010A (ja) 2000-10-02 2002-04-12 Ricoh Co Ltd デジタル複写装置
JP2002300408A (ja) * 2001-03-30 2002-10-11 Toshiba Corp 画像ファイリング装置及び方法、並びに画像復元装置及び方法
JP2003162406A (ja) * 2001-11-28 2003-06-06 Fuji Xerox Co Ltd データ処理装置
JP3791409B2 (ja) 2001-12-20 2006-06-28 富士ゼロックス株式会社 複写装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101931731B (zh) * 2009-06-26 2012-09-26 北京大学 一种文稿方向的检测方法和装置
CN104219410A (zh) * 2013-05-30 2014-12-17 夏普株式会社 设定装置、图像形成装置、以及透明涂层设定方法
CN106488074A (zh) * 2015-08-24 2017-03-08 柯尼卡美能达株式会社 图像处理装置以及电子文件生成方法
CN106488074B (zh) * 2015-08-24 2019-03-05 柯尼卡美能达株式会社 图像处理装置以及电子文件生成方法
CN110248035A (zh) * 2018-03-09 2019-09-17 株式会社理光 信息处理装置、图像形成装置、图像处理系统、图像处理方法和程序
CN110248035B (zh) * 2018-03-09 2021-07-09 株式会社理光 信息处理装置、图像形成装置、图像处理系统、图像处理方法和程序

Also Published As

Publication number Publication date
JP4232679B2 (ja) 2009-03-04
US7528986B2 (en) 2009-05-05
CN100349454C (zh) 2007-11-14
US20050231766A1 (en) 2005-10-20
JP2005303880A (ja) 2005-10-27

Similar Documents

Publication Publication Date Title
CN1684494A (zh) 图像形成装置、图像形成方法及其程序以及存储介质
US5856877A (en) Apparatus and method for processing and reproducing image information
US6839459B2 (en) Method and apparatus for three-dimensional shadow lightening
US8369623B2 (en) Image forming apparatus that automatically creates an index and a method thereof
US8995768B2 (en) Methods and devices for processing scanned book's data
CN100559387C (zh) 图像处理装置和方法,图像形成装置
CN1684493B (zh) 图像形成装置及图像形成方法
US8201084B2 (en) Image processing apparatus and computer readable medium
DK176835B1 (da) Fremgangsmåde til skanning, medium indeholdende et program til udövelse af fremgangsmåden samt system til udövelse af fremgangsmåden
EP0621541A2 (en) Method and apparatus for automatic language determination
US8538154B2 (en) Image processing method and image processing apparatus for extracting heading region from image of document
DK176834B1 (da) Fremgangsmåde til skanning
KR101248449B1 (ko) 정보 처리 장치, 정보 처리 방법 및 컴퓨터 판독 가능한 기억 매체
EP0780782A2 (en) Separation of touching characters in optical character recognition
US20010043742A1 (en) Communication document detector
US8126193B2 (en) Image forming apparatus and method of image forming
US20050117803A1 (en) Document recognition device, document recognition method and program, and storage medium
US20060023236A1 (en) Method and arrangement for copying documents
EP0450013A1 (en) OPERATION OF REPRODUCING APPARATUS DURING RETURN TO NORMAL OPERATION.
JP2006333248A (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
US8280271B2 (en) Printing system and order-sheet-based batch printing method
EP0692768A2 (en) Full text storage and retrieval in image at OCR and code speed
CN117649670A (zh) 文档版面分析模型训练方法、应用方法、计算机装置及计算机可读存储介质
JPH06259524A (ja) ドキュメントイメージ処理方法およびドキュメントイメージ処理装置
JP2000148735A (ja) 画像処理装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20071114

Termination date: 20170317

CF01 Termination of patent right due to non-payment of annual fee