CN103258197A - 图像处理装置及其控制方法 - Google Patents

图像处理装置及其控制方法 Download PDF

Info

Publication number
CN103258197A
CN103258197A CN2013100500417A CN201310050041A CN103258197A CN 103258197 A CN103258197 A CN 103258197A CN 2013100500417 A CN2013100500417 A CN 2013100500417A CN 201310050041 A CN201310050041 A CN 201310050041A CN 103258197 A CN103258197 A CN 103258197A
Authority
CN
China
Prior art keywords
image
file
processing apparatus
character
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013100500417A
Other languages
English (en)
Other versions
CN103258197B (zh
Inventor
桥本英幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Publication of CN103258197A publication Critical patent/CN103258197A/zh
Application granted granted Critical
Publication of CN103258197B publication Critical patent/CN103258197B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/134Hyperlinking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/333Mode signalling or mode changing; Handshaking therefor
    • H04N1/3333Mode signalling or mode changing; Handshaking therefor during transmission, input or output of the picture signal; within a single document or page
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/333Mode signalling or mode changing; Handshaking therefor
    • H04N2201/33307Mode signalling or mode changing; Handshaking therefor of a particular mode
    • H04N2201/33378Type or format of data, e.g. colour or B/W, halftone or binary, computer image file or facsimile data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明提供一种图像处理装置及其控制方法。图像处理装置(100)包括取得部(52)、解析部(53)、生成部(54)。取得部(52)适合于取得图像。解析部(53)适合于通过对取得部(52)所取得的图像的特征进行分析从而选择与图像对应的文件的形式。生成部(54)适合于按照解析部(53)所选择的形式针对每个特征生成图像的文件。

Description

图像处理装置及其控制方法
本申请基于2012年2月17日向日本专利局递交的日本专利申请第2012-032672号,该申请的全部内容在此通过引用被并入。
技术领域
本发明涉及一种图像处理装置,特别是涉及一种取得图像并生成与所取得的图像对应的文件的图像处理装置。
背景技术
以往,公开了各种用于处理通过扫描仪等而取得的图像的技术。例如在日本特开2005-157905号公报中公开了在图像处理装置中将所读取的图像数据变换为矢量数据的技术。在向该矢量数据进行变换时,按照由用户指定的文件形式、例如字处理形式、表格形式、演示文稿形式等而进行变换。
然而,根据以往的技术,在变换时需要由用户指定文件形式,因此用户有时感到复杂。
发明内容
本发明是鉴于这样的实际情况而作出的,其目的在于提供一种使用于生成与图像对应的文件的操作变得容易的图像处理装置。
根据一个方面,图像处理装置具备:取得部,适合于取得图像;解析部,适合于通过对取得部所取得的图像的特征进行分析从而选择与图像对应的文件的形式;以及生成部,适合于按照解析部所选择的形式针对每个特征生成图像的文件。
优选为,解析部根据取得部所取得的图像的特征,从该图像抽取图形、分格线、缩进或者字符,根据它们的数量或者位置关系来选择与该图像对应的文件的形式。
优选为,在取得部所取得的图像中,在字符、图形收敛于由分格线构成的框内的情况下,解析部选择表格形式作为与该图像对应的文件的形式,
在取得部所取得的图像中,在图形、字符以及表格混合存在的情况下,进而在字符部分通过缩进而使开头位置一致时或者在字符部分中开头有1个字符量的空格时,解析部选择文档形式作为与该图像对应的文件的形式,
在取得部所取得的图像中,在所有的页面的相同的位置包括相同的图形或者相同的字符的情况下,解析部选择演示文稿形式作为与该图像对应的文件的形式,
在取得部所取得的图像中,在仅包括图形的情况下,解析部选择图形形式作为与该图像对应的文件的形式。
优选为,在取得部所取得的图像中,在所有页面的相同的位置有相同的图形或者相同的字符这样的第1条件成立的情况下,解析部选择演示文稿形式作为与该图像对应的文件的形式,
在取得部所取得的图像中,在第1条件不成立的情况下、且该图像中包含的所有的字符、图形全部收敛于由分格线构成的框内这样的第2条件成立的情况下,解析部选择表格形式作为与该图像对应的文件的形式,
在取得部所取得的图像中,在第1条件以及第2条件不成立的情况下、且图像仅由字符构成且被缩进这样的第3条件成立的情况下,解析部选择文档形式作为与该图像对应的文件的形式,
在取得部所取得的图像中,在第1条件、第2条件以及第3条件中的任一个都不成立的情况下,解析部选择预先确定的形式作为与该图像对应的文件的形式。
优选为,图像处理装置还具备存储部,该存储部用于存储与文件形式有关的设定内容。在由生成部生成的文件存储在存储部中的情况下,并非选择由解析部所选择的形式,而是选择与存储在存储部中的设定内容对应的形式作为该文件的形式。
优选为,生成部对于取得部所取得的图像,针对每个页面生成与各页面对应的形式的文件。
优选为,生成部对于取得部所取得的图像,针对具有特征的每个部分生成与各部分对应的形式的文件。
优选为,解析部从取得部所取得的图像中抽取分格线,
解析部判断取得部所取得的图像中包含的字符、图形是否收敛于由所抽取的分格线包围的区域内,
解析部判断图章的图像是否位于由分格线包围的区域内或者分格线附近,
解析部在判断为在由分格线包围的区域内或者分格线附近有图章的图像的情况下,从是否收敛于由分格线包围的区域内的判断对象中排除该图章图像。
优选为,生成部将针对每个特征生成的文件的链接信息嵌入到生成的文件的图像中。
优选为,生成部生成取得的图像的各页面的缩略图图像,生成将缩略图图像与所取得的图像关联起来的信息。
根据其它方面,提供一种用于控制图像处理装置的方法。该方法包括:
图像处理装置取得图像的步骤;
图像处理装置通过对所取得的图像的特征进行分析从而选择与图像对应的文件的形式的步骤;以及
图像处理装置按照所选择的形式生成图像的每个特征的文件的步骤。
优选为,选择的步骤包括如下步骤:根据所取得的图像的特征,从该图像抽取图形、分格线、缩进或者字符,根据它们的数量或者位置关系来选择与该图像对应的文件的形式。
优选为,选择的步骤包括:
在所取得的图像中,在字符、图形收敛于由分格线构成的框内的情况下,选择表格形式作为与该图像对应的文件的形式的步骤;
在所取得的图像中,在图形、字符以及表格混合存在的情况下,进而在字符部分通过缩进而使开头位置一致时或者在字符部分中开头有1个字符量的空格时,选择文档形式作为与该图像对应的文件的形式的步骤;
在所取得的图像中,在所有的页面的相同的位置包括相同的图形或者相同的字符的情况下,选择演示文稿形式作为与该图像对应的文件的形式的步骤;以及
在所取得的图像中,在仅包括图形的情况下,选择图形形式作为与该图像对应的文件的形式的步骤。
优选为,选择的步骤包括:
在所取得的图像中,在所有页面的相同的位置有相同的图形或者相同的字符这样的第1条件成立的情况下,选择演示文稿形式作为与该图像对应的文件的形式的步骤;
在所取得的图像中,在第1条件不成立的情况下、且该图像中包含的所有的字符、图形全部收敛于由分格线构成的框内这样的第2条件成立的情况下,选择表格形式作为与该图像对应的文件的形式的步骤;
在所取得的图像中,在第1条件以及第2条件不成立的情况下、且图像仅包括字符且被缩进这样的第3条件成立的情况下,选择文档形式作为与该图像对应的文件的形式的步骤;以及
在所取得的图像中,在第1条件、第2条件以及第3条件中的任一个都不成立的情况下,选择预先确定的形式作为与该图像对应的文件的形式的步骤。
优选为,图像处理装置包括存储装置。上述方法还包括:图像处理装置在存储装置中储存与文件的形式有关的设定内容的步骤;以及图像处理装置将所生成的文件储存到存储装置中的步骤。选择的步骤包括如下步骤:并非选择所选择的形式,而是选择与储存在存储装置中的设定内容对应的形式作为储存在存储装置中的文件的形式。
优选为,生成文件的步骤包括如下步骤:对于所取得的图像,针对每个页面生成与各页面对应的形式的文件。
优选为,选择形式的步骤包括:针对所取得的图像的每个部分取得特征的步骤;以及针对每个部分选择与该部分对应的形式的步骤。生成文件的步骤包括:针对每个部分生成与该部分的特征对应的形式的文件的步骤。
优选为,选择形式的步骤包括:从所取得的图像中抽取分格线的步骤;判断所取得的图像中包含的字符、图形是否收敛于由所抽取的分格线包围的区域内的步骤;以及判断图章的图像是否位于由所抽取的分格线包围的区域或者该分格线的附近的步骤。判断字符、图形是否收敛于由分格线包围的区域内的步骤包括将位于由所抽取的分格线包围的区域或者该分格线的附近的图章的图像从该判断的对象中排除的步骤。
优选为,生成文件的步骤包括将针对每个特征生成的文件的链接信息嵌入到生成的文件的图像中的步骤。
优选为,生成文件的步骤包括:生成所取得的图像的各页面的缩略图图像的步骤;以及生成将缩略图图像与所取得的图像关联起来的信息的步骤。
从结合附图对本发明进行的以下详细的描述,本发明的上述及其他的目的、特征、方面和优点将变得更加清楚。
附图说明
图1是示意性地示出包括本实施方式的图像处理装置的图像处理系统的结构的图。
图2是示意性地示出图像处理装置的硬件结构的一个例子的图。
图3是示意性地示出图像处理装置的功能结构的一个例子的图。
图4是示意性地示出在图像处理装置中取得的图像的一个例子的图。
图5是示出分割图4的各页面的图像而得到的结果的一个例子的图。
图6A~图6C是示出在图像处理装置中通过图像的扫描而生成的文件的一个例子的图。
图7是示出关于扫描数据针对每个特征所生成的文件的一个例子的图。
图8是用于说明在扫描数据中嵌入的链接信息的数据的内容的图。
图9是在图像处理装置中执行的文件生成处理的流程图。
图10是图9的一部分处理的子流程的流程图。
图11是示出扫描数据的一个例子的图。
图12是示出针对图11所示的分析结果的其它分析结果的例子的图。
图13是示出针对图11所示的分析结果的另外其它分析结果的例子的图。
图14A~图14B是用于说明图像处理装置中的处理内容的图。
图15是示出关于与各特征对应的格式为了选择优先利用的应用程序而在显示部中显示的画面的一个例子的图。
图16A以及图16B是用于说明图像处理装置中的处理内容的图。
图17是用于说明图像处理装置中的处理内容的图。
图18是示出在图像处理装置的显示部中显示的接受对图像进行编辑的信息的输入的画面的一个例子的图。
图19是用于说明在图像处理装置中生成的数据的内容的图。
图20是在图1的图像处理装置的变形例中执行的处理的流程图。
图21是在图1的图像处理装置的变形例中执行的处理的流程图。
具体实施方式
下面,参照附图来说明本发明的实施方式的图像处理装置。此外,在各图中对起到相同功能的要素附加相同的参考符号,不重复其说明。
[图像处理系统的结构]
图1是示意性地示出包括本实施方式的图像处理装置的图像处理系统的结构的图。
在图像处理系统中,图像处理装置100通过扫描原稿而生成扫描数据900。扫描数据900是指PDF(Portable Document Format:便携式文档格式)数据等使原稿原样地成为图像的数据。另外,图像处理装置100根据该原稿中的图像的特征来选择文件的形式,对于该图像,生成所选择的形式的文件(电子数据910)。电子数据910相当于对扫描数据900的文件形式进行变换得到的数据。
然后,图像处理装置100将电子数据910与扫描数据900一起提供给用户。
[图像处理装置的硬件结构]
图2是示意性地示出图像处理装置100的硬件结构的一个例子的图。
参照图2,图像处理装置100包括:CPU(Central ProcessingUnit:中央处理单元)20,是用于对该装置整体地进行控制的运算装置;ROM(Read Only Memory:只读存储器)21,用于存储由CPU20执行的程序;RAM(Random Access Memory:随机存取存储器)22,用于作为由CPU20执行程序时的工作区域而发挥功能;非易失性存储器26和存储部42,存储图像数据等各种数据;传真控制部29,用于利用公用线路向外部的终端发送图像数据;操作面板25,接受用于输入信息的操作;显示部41,用于显示信息;以及网络连接部28,由作为与外部装置之间进行通信的接口的网卡等构成。
由CPU20执行的程序也可以存储在存储部42中。存储部42能够由针对图像处理装置100的主体可安装和拆卸的存储介质构成。作为存储介质,可举出CD-ROM(Compact Disc-Read Only Memory:光盘只读存储器)、DVD-ROM(Digital Versatile Disk-Read OnlyMemory:数字多功能盘只读存储器)、USB(Universal Serial Bus:通用串行总线)存储器、存储卡、FD(Flexible Disk:软盘)、硬盘、磁带、盒式磁带、MO(Magnetic Optical Disc:磁光盘)、MD(MiniDisc:迷你盘)、IC(Integrated Circuit:集成电路)卡(存储卡除外)、光卡、掩模ROM、EPROM、EEPROM(Electronically ErasableProgrammable Read-Only Memory:电可擦除可编程只读存储器)等非易失性地储存程序的介质。
CPU20作为其功能而包括判别部31、删除部32、控制部33、以及通知部34。
如后所述,判别部31在图像中对其每个部分的特征进行分类。
如后所述,在图像中,图章的图形从由分格线构成的框露出的情况下,删除部32从规定的判断的对象中排除该图形的部分。此外,在本说明书中,有时将由分格线构成的框简单称为“分格线”。
控制部33执行图像读取部23、图像形成部24等的动作的控制。
通知部34在指定了外部的存储装置作为在图像读取部23中生成的扫描数据的储存场所时,在扫描数据以及与其对应的文件的生成完成了的情况下,对该存储装置通知发送这些数据。
图像处理装置100还具备:图像处理部40,用于执行针对图像的压缩、解析等;图像形成部24,用于执行向纸张印刷图像的图像形成动作;图像读取部23,用于读取原稿而生成图像数据;以及图像输出部27,用于将在图像读取部23中生成的图像数据发送给外部装置。
在图像处理装置100中处理的图像既可以是在图像读取部23中生成了数据的图像,也可以是在传真控制部29的接收部中接收了数据的图像,还可以是在网络连接部28中接收了数据的图像。
[图像处理装置的功能结构]
图3是示意性地示出图像处理装置100的功能结构的一个例子的图。
图像处理装置100作为其功能而包括用于接受来自用户的信息的输入操作的操作部50。操作部50例如通过构成操作面板25的操作按钮等来实现。
另外,图像处理装置100包括数据储存部51、图像读取部52、图像解析部53、数据变换部54、数据保存部55、数据发送部56、以及数据接收部57。
数据储存部51存储上述的图像数据(图像文件)。另外,在数据储存部51中,除了图像文件等的文件数据以外,还储存对进行了文件变换的页面数进行计数的计数器值、表示作为通过文件变换而生成的文件的发送目的地来指定的目的地的目的地数据、以及以逻辑单元(在存储部42中定义的多个存储区域)为单位来表示变换优先顺序的数据。计数器51A储存上述计数器值。目的地储存部51B储存上述目的地数据。变换优先顺序储存部51C储存表示上述优先顺序的数据。数据储存部51通过存储部42来实现。
图像读取部52对应于图像读取部23,例如通过扫描仪来实现。
图像解析部53例如通过CPU20执行适当的程序来实现,执行参照图9等进行后述的图像的特征的分析。另外,图像解析部53包括:图章图像判断部53A,执行关于图章的图像的判断;以及图表有无判断部53B,判断图像中的图表的有无。
数据变换部54包括:格式变换部54A,根据在图像读取部52(图像读取部23)等中取得的图像,生成规定的形式的文件;以及缩略图生成部54B,用于生成该图像的缩略图图像。
[文件生成处理的概要]
图4是示意性地示出在图像处理装置100中取得的图像的一个例子的图。这里,“取得的图像”相当于图1的扫描数据900。
参照图4,在本实施方式中,扫描数据900如页面901~904中所示那样包括多个页面。此外,扫描数据900有时也由1个页面构成。
图像解析部53通过解析页面901~904各自的图像的特征,将各页面的图像针对其每个特征进行分割。图5是示出分割了图4的各页面的图像的结果的一个例子的图。
图像解析部53根据1)字符、2)表格、3)图形、4)模板这4种特征,对图像进行分类。在图5中,图4的页面901~904分别针对每个特征被分割并示出。
页面901包括模板801以及字符802。
页面902包括模板811、字符812、814、以及表格813。
页面903包括模板821、表格822、824、以及字符823、825。
页面904包括模板831、图形832、以及字符833、834。
模板是指在扫描数据900的所有页面中在相同的位置配置的字符、图形(或者仅包括这样的字符、图形的页面)。模板811、模板821、以及模板831都由与模板801共同的字符和图像构成。
此外,在后面叙述针对图像(扫描数据900)的各特征的分析的方法。
如上所述,图像处理装置100在根据特征对图像的各页面进行了分割之后,根据该图像的特征来选择文件形式,通过将图像变换为该形式而生成新的文件。这样生成的文件是后述的变换数据750。
进而,图像处理装置100生成图像的各页面的缩略图图像。更具体地说,图像处理装置100在生成了图像的扫描数据900之后,生成使扫描数据900全体变换为规定的形式的文件,进而生成扫描数据900的各页面的缩略图图像。图6A~图6C是示出在图像处理装置100中通过图像的扫描而生成的文件的一个例子的图。在图像处理装置100中,通过图像的扫描,生成图6A的扫描数据900、图6B的变换数据750、以及图6C的缩略图数据700。
此外,图像处理装置100有时也针对在扫描数据900中检测出特征的每个部分生成文件。
如上所述,图像处理装置100根据1)字符、2)表格、3)图形、4)模板这4种特征,对扫描数据900的图像进行分类。之后,图像处理装置100对于扫描数据900,与变换数据750不同地,针对每个特征生成文件。图7是示出关于扫描数据900针对每个特征所生成的文件的一个例子的图。
在图7中示出了文件710、720、730、740。文件710是与作为特征而检测出“字符”的部分对应的文件,包括图5的字符802、812、814、823、825、833、834。此外,在图7中,由于作图的原因,作为文件710仅示出字符802部分。
文件720是与作为特征而检测出“表格”的部分对应的文件,包括图5的表格813、822、824。
文件730是与作为特征而检测出“图形”的部分对应的文件,包括图5的图形832。
文件740是与作为特征而检测出“模板”的部分对应的文件,包括与图5的模板801对应的图像。模板801、811、821、831由共同的字符和图形的组合构成,因此仅对于它们中的一个,制作成文件。
文件710、720、730、740是分别与其特征对应的形式的文件。即,文件710的形式是与“字符”这样的特征对应的例如微软公司的Microsoft Word(注册商标)等的文档制作形式。文件720的形式是与“表格”这样的特征对应的例如微软公司的Microsoft Excel(注册商标)等的表格制作形式。文件730的形式是与“图形”这样的特征对应的例如微软公司的Microsoft Visio(注册商标)等的绘图制作形式。文件740的形式是与“模板”这样的特征对应的例如微软公司的Microsoft PowerPoint(注册商标)等的演示文稿形式。
即,在图像处理装置100中,通过对图像进行扫描,有时除了该图像的扫描数据900之外,如图7所示那样还生成变换数据750、缩略图数据700、以及上述的文件710、720、730、740。
在文件710、720、730、740中,构成各自的部分优选按照扫描数据900中的页面顺序进行排列。即,例如关于“表格”这样的特征,如图5所示那样在扫描数据900中按照页面901、902、903、904的顺序排列了页面的情况下,会按照表格813、822、824的顺序出现。因而,在文件720中也优选按照表格813、822、824的顺序排列各部分。
另外,图8是用于说明在扫描数据900中嵌入的链接信息的数据的内容的图。
参照图8,对于扫描数据900的各页面,优选将与缩略图数据700的各页面对应的缩略图数据关联起来。在图8所示的例子中,针对缩略图数据700的每个页面,附加“Thumb-1.jpeg”、“Thumb-2.jpeg”、“Thumb-3.jpeg”、“Thumb-4.jpeg”这样的文件名。并且,在图8中示出了针对扫描数据900的各页面将所对应的缩略图数据700的页面的文件名关联起来的状态。此外,关联起来是指,例如对扫描数据900的各页面的数据,作为标签信息或者以在印刷了的情况下也看不到这样的颜色来记述那样地编入。
当然,也可以并非编入到扫描数据900,而是另行地制作将扫描数据900和缩略图数据700关联起来的信息并存储到存储部42中。另外,在此关联起来的数据不仅是文件名,有时也包括保存各缩略图图像的保存场所。
CPU20也可以在印刷扫描数据900的各页面时,如上述那样生成将扫描数据900和缩略图数据700关联起来的信息(链接信息)。并且,CPU20也可以结合该链接信息来印刷扫描数据900的各页面。在这种情况下,链接信息既可以与扫描数据900的各页面的图像一起以与印刷纸张同类的颜色或者与印刷纸张接近的颜色被印刷成不显眼,或者也可以印刷在与扫描数据900的各页面的图像被印刷的面不同的面(背面)。
如上所述,文件710、720、730、740是通过将扫描数据900针对每个特征进行分割而生成的文件。对于扫描数据900的各页面,优选进一步将关于文件710、720、730、740各自的链接信息关联起来。在图8中示出了在扫描数据900的各页面中对于检测出特征的各区域将“Word1.doc”、“Table2.xls”等的文件名作为链接信息而关联起来的状态。
此外,在本实施方式中,也可以关于在扫描数据900中针对每个特征检测出的部分(图5的字符802、表格813、图形832等),针对每个部分生成文件。即,例如也可以关于字符802、812、814、823、825、833、834中的每一个,逐个地以字符制作形式来生成文件。另外,也可以关于图5的表格813、822、824中的每一个,逐个地以表格形成形式的形式来生成文件。在这种情况下,在图8中,关于“Table2.xls”、“Table3-1.xls”、“Table3-2.xls”,它们被综合起来而被记载为表示一个文件,但是表示相互独立的文件。并且,在扫描数据900中,对于各文件,存储有与在扫描数据900中所对应的部分关联起来的链接信息。
[文件生成处理的内容]
图9是CPU20所执行的文件生成处理的流程图。CPU20例如根据对操作面板25中的文件变换按钮等规定的操作部进行了操作的事件、预先确定的时刻到来的事件、或者经由网络连接部28从外部装置接收到使文件生成处理开始的指示的事件等而开始工作。
参照图9,CPU20首先在步骤S10中使图像读取部23(图像读取部52、即扫描仪)生成扫描数据900之后,执行区域判别。之后,CPU20使处理进入步骤S20。区域判别是指,按照预先确定的条件,如图5所示那样将扫描数据900的各页面的图像针对认为包含特征的每个区域进行分割的处理。
在步骤S20中,CPU20对于在步骤S10中分割了的各区域,分析特征。之后,CPU20使处理进入步骤S30。由此,各区域被分类为字符、表格、图形中的某一个。关于从图像中抽取字符、表格、图形、模板各自的部分来进行分类的方法,能够采用公知的技术,因此这里不重复详细的说明。
在步骤S30中,CPU20变换扫描数据900的格式,使处理进入步骤S40。这里,格式的变换是指生成文件形式不同的数据,相当于生成上述变换数据750的数据。
图10是步骤S30的子流程的流程图。下面,参照图10来说明步骤S30的处理的内容。
参照图10,首先在步骤S301中,CPU20读入扫描数据900和步骤S20中的分析结果。之后,CPU20使处理进入步骤S302。
在步骤S302中,CPU20判断在多个页面的相同的位置是否存在相同的图形或者相同的字符,如果判断为存在则使处理进入步骤S303,如果判断为不存在则使处理进入步骤S304。
例如在图5所示的页面901~904中,在各页面的右上配置有用椭圆来包围“ABC”这样的字符而成的图形。另外,在各页面的右上配置有“ABC”这样的字符。在这种情况下,处理从步骤S302进入步骤S303。
在步骤S303中,CPU20将对扫描数据900进行变换的格式(文件形式)决定为演示文稿(在图10中简记为“演稿”)形式,作为变换数据750而生成该形式的文件,使处理返回图9。
在步骤S304中,CPU20判断扫描数据900中包含的全部字符是否被分格线包围,如果判断为全部被分格线包围则使处理进入步骤S305,如果判断为并非全部被分格线包围则使处理进入步骤S306。这里,“字符被分格线包围”意味着字符位于由分格线构成的框中。
例如,在扫描数据仅包括图5的表格813那样的表格的情况下,处理从步骤S304进入步骤S305。
在步骤S305中,CPU20将对扫描数据900进行变换的格式(文件形式)决定为表格制作形式,作为变换数据750而生成该形式的文件。之后,CPU20使处理返回图9。
在步骤S306中,CPU20判断扫描数据900是否仅由图形构成。然后,CPU20在判断为仅由图形构成时使处理进入步骤S307,当判断为并非仅由图形构成时使处理进入步骤S308。
例如,在扫描数据仅包括图5的图形832那样的图形的情况下,处理从步骤S306进入步骤S307。
在步骤S307中,CPU20将对扫描数据900进行变换的格式(文件形式)决定为绘图制作形式,作为变换数据750而生成该形式的文件,使处理返回图9。
在步骤S308中,CPU20判断在扫描数据900中多个字符区域的开头位置是否位于相同的位置,当判断为位于相同的位置时使处理进入步骤S309,当判断为并非位于相同的位置时使处理进入步骤S310。
图11表示扫描数据的一个例子。图11的扫描数据510包括8个字符区域(字符区域511~514、516~519)、以及表格505。
位置501表示字符区域513和字符区域514的开头位置。即,这些字符区域的开头位置(在扫描数据中字符直立的状态下的各字符区域的左端的左右方向的位置)是共同的。因而,在这种情况下,处理从步骤S308进入步骤S309。此外,在图11中,位置502表示字符区域512和字符区域516的开头位置。即,这些字符区域的开头位置也相同。另外,位置503表示字符区域517、字符区域518以及字符区域519的开头位置。即,这些字符区域的开头位置也相同。
返回到图10,在步骤S309中,CPU20将对扫描数据900进行变换的格式(文件形式)决定为文档制作形式,作为变换数据750而生成该形式的文件,使处理返回图9。
在步骤S310中,CPU20将对扫描数据900进行变换的格式(文件形式)决定为预先确定的(用户默认的)形式,作为变换数据750而生成该形式的文件,使处理返回图9。
返回到图9,CPU20在步骤S30中进行了扫描数据的格式变换之后,在步骤S40中生成关于扫描数据的针对每个区域的文件,使处理进入步骤S50。在步骤S40中,具体地说CPU20将在步骤S10中检测出的各区域分为与各区域的特征对应的形式的文件而进行保存。由此,生成如参照图7进行说明那样的文件710、720、730、740。
在步骤S50中,CPU20生成扫描数据900的各页面的缩略图图像,使处理进入步骤S60。
在步骤S60中,CPU20对于在步骤S40中生成那样的文件,生成如参照图8进行说明那样的链接信息,并以与扫描数据900的各部分关联起来的方式保存,使处理进入步骤S70。
在步骤S70中,CPU20对于在步骤S50中生成的缩略图图像的文件,生成如参照图8进行说明那样的链接信息,并以与扫描数据900的各部分关联起来的方式保存,使处理进入步骤S80。
在步骤S80中,CPU20将扫描数据900、在步骤S30中生成的变换数据750、在步骤S40中针对每个特征所生成的文件(例如文件710、720、730、740)、以及在步骤S50中生成的缩略图数据700进行合并,结束图9所示的处理。
在以上说明的本实施方式中,对于扫描数据900,基于根据该数据而确定的图像的特征的分析结果,选择对扫描数据900进行变换的格式(文件形式)。此外,分析的对象不限于通过图像读取部23所生成的数据,也可以是从其它装置接收到的图像文件。
另外,在本实施方式中,作为文件形式的选择的基准的例子,如参照图11进行说明那样,可举出关于图形、分格线、缩进(字符区域的行首位置)的数量(或仅包括数量等)或者位置关系。
在参照图9进行说明的处理中,对扫描数据900等的处理对象的图像进行分析,并根据其结果来分割该图像或选择要变换的格式。
此外,在步骤S20中,除了区域的分类以外,也可以检测关于针对处理对象的图像的一定的项目的分析结果。这里,示出这样的分析的结果的例子。
关于图11所示的扫描数据510,作为其分析结果,示出了行的开头相同的地方有3处的情形。另外,作为假设段落的最初的行相对于其它的行使行首的1个字符缩进而示出从而进行了分析的情况下的结果,示出了2处行的开头相同的地方。
另外,作为进一步的分析结果,关于字符,判断为行间相同的行有8行,判定为字符的行有8行,判定为表格的地方有1处,判定为图或者图表的地方有0处,关于在图像中包含的多个页面间在相同的位置是否有图形(或者字符),可举出“无”这样的结果。
图12是示出其它的分析结果的例子的图。在图12中示出了扫描数据550。并且,在图12中,作为步骤S10中的区域判别的结果,示出了在扫描数据550中检测出表格551、字符552、表格553、以及字符554的状态。
并且,在针对扫描数据550的检测结果中,行的开头相同的地方有0处。另外,作为假设段落的最初的行相对于其它的行使行首的1个字符缩进而示出从而进行了分析的情况下的结果,关于行的开头相同的地方,示出了2处。而且,关于字符,判断为行间相同的行是0行,判定为字符的行有2行,判定为表格的地方是0处,判定为图或者图表的地方是2处,关于在图像中包含的多个页面间在相同的位置是否有图形(或者字符),可举出“无”这样的结果。
图13是示出另外其它的分析结果的例子的图。图13中例示的图像由页面520、530、540这3个页面构成。
作为区域判别的结果,页面520包括字符521和图形522。页面530包括字符531和图形532。页面540包括字符541和图形542。
在针对图13所示的图像(页面520、530、540)的检测结果中,行的开头相同的地方有2处。它们的行首位置作为字符531中的位置533和字符541中的位置543而被示出。另外,作为假设段落的最初的行相对于其它的行使行首的1个字符缩进而示出从而进行了分析的情况下的结果,关于行的开头相同的地方,示出了2处。这基于在字符531中第2行(字符531中的最上段的下1段的部分)比第1行(字符531中的最上段的部分)缩进1个字符量程度(位于右侧)、以及在字符541中第2行(字符541中的最上段的下1段的部分)比第1行(字符541中的最上段部分)缩进1个字符量程度(位于右侧)。
另外,在图13中,关于字符,判断为行间相同的行为3行。这基于在页面540中包含在区域544中的字符的行间(在上下方向上字符排列的间隔)相等。另外,在图13中,判定为字符的行有8行,判定为表格的地方是0处,判定为图或者图表的地方为3处。而且,在图13中,关于在图像中包含的多个页面间在相同的位置是否存在图形(或者字符),可举出“有”这样的结果。这基于在页面520、530、540的各自中包含形状共同的图形522、532、542。即,图形522、532、542是模板。
而且,在本实施方式中,在处理对象的图像(扫描数据)中检测出图表的情况下,关于该图表,不仅是其图形,而且也可以被数据化而保存。
例如,在作为图表而检测出圆形图(circle graph)、条线图(bargraph)的情况下,也可以对圆形图、条线图中的各区域,以区域内记载的字符串为项目,生成将与各区域的面积的比例相应的数值作为值的表格,并与图表的图像关联起来进行保存。据此,根据如图14A所示那样的圆形图的图像,生成如图14B所示那样的表格。
在图14B所示的表格中,图14A所示的圆形图的各区域中记载的“A”、“B”、“C”、“D”、“E”这样的字符分别作为项目而被举出。并且,对于各项目,将与把全体设为100的情况下的角度相应的值关联起来。此外,在图表的各区域中记载有数值的情况下(在通过字符识别来识别出数值的情况下),该数值也可以设为在所生成的表格中与各项目关联起来的值。
此外,CPU20例如根据在图像中检测出圆、进而在该圆内检测出从圆的中心向外周延伸的一条以上的直线的情形,来判断图像是否包括圆形图。
另外,用户还能够对与各特征对应的格式进行设定。图15是示出关于与各特征对应的格式为了选择优先利用的应用程序而在显示部41中显示的画面的一个例子的图。
在图15所示的画面中,作为关于文档制作的应用程序,示出了“文档制作1”、“文档制作2”、“文档制作3”这样的3个应用程序的名称。另外,在该画面中,作为关于表格制作的应用程序而示出了“表格制作1”、“表格制作2”、“表格制作3”这样的3个应用程序的名称。另外,在该画面中,作为关于图制作(绘图)的应用程序而示出了“图制作1”、“图制作2”、“图制作3”这样的3个应用程序的名称。
然后,CPU20在该画面中,接受关于文档制作、表格制作、图制作各自的应用程序的选择。然后,在步骤S309、步骤S305、步骤S307中分别生成所选择的应用程序的文件。
另外,在上述的说明中,在判断扫描数据900中包含的全部字符是否被分格线包围的情况下,关于特定的种类的图形,也可以进行特别的处理。更具体地说,特定的种类的图形即使从由分格线构成的框露出,也可以当作收敛于框内而进行处理。或者,关于特定的种类的图形,也可以进行从步骤S304中的判断的对象中排除这样的例外的处理。
作为上述的特定的种类的图形的一个例子,可举出如图16A所示那样的图章(用印章的戳按压的形状)。此外,例如根据扫描数据900是否包括以红色的闭环为轮廓的部分,来判断扫描数据900中包含的图像是否包括图章的图形。在该部分的轮廓为红色的闭环的图形的情况下,该部分作为图章的图形而被处理,在不是红色的闭环的图形的情况下,该部分当作不是图章的图形而被处理。图16A的中心561以及图16B的中心562分别表示被判断为是图章的图形的图形的中心。
图章的图形在如图16A所示那样收敛于分格线560内的情况下,成为步骤S304等中的判断的对象,但是在如图16B所示那样处于从分格线560露出的状态的情况下,从上述的判断的对象中排除。
在以上说明的本实施方式中,按照图像的特征,来选择生成变换数据750的格式。格式的选择方式能够表示为例如图17所示那样的表格。
参照图17,如果有页面共同的图形、字符,则作为格式而选择演稿(演示文稿)形式。
在没有页面共同的图形、字符的情况下,如果仅在分格线内有字符,则作为格式而选择表格形式。
在没有页面共同的图形、字符、且没有分格线或者在分格线内以外也有字符的情况下,如果仅包括图形,则作为格式而选择图形(绘图)形式。
在没有页面共同的图形、字符、且没有分格线或者在分格线内以外也有字符且还包括图形以外的要素的情况下,如果包括字符的开头位置一致的部分,则作为格式而选择文档形式。
[第1变形例]
图像处理装置100在如上述那样针对每个格式生成了文件的情况下,能够接受对被扫描等的图像进行编辑的信息的输入。
图18是示出显示在显示部41中的接受对图像进行编辑的信息的输入的画面的一个例子的图。
参照图18,画面400包括对图像中包含的各页面的缩略图图像进行显示的显示栏420、以及用于对编辑对象的页面进行显示的显示栏410。在显示栏410中显示有编辑对象的页面450。
用户从显示在显示栏420中的缩略图图像中选择1个页面。由此,扫描数据900中的被选择的页面显示在显示栏410中。
在显示栏410中显示有按钮411~414。按钮411~414是用于选择特征的按钮。在本实施方式中,以1)字符、2)表格、3)图形、4)模板这4种特征,对图像(扫描数据)中包含的要素进行分类。按钮411、412、413、414分别对应于字符、表格、图形、模板。
如参照图8所说明那样,在扫描数据900中,针对每个区域,将特征关联起来。
在画面400中,当选择按钮411~414中的一个按钮等而选择了特征时,CPU20使显示在显示栏410中的页面中的与所选择的特征相关联的部分显示为相对于其以外的部分显眼。
在图18中,通过操作按钮412来选择表格形式,由此使页面450中的判定为表格的部分显示为相对于其它的部分显眼。具体地说,在图18中,在页面450中表格以外的部分呈灰色地被显示。
[第2变形例]
在以上说明的本实施方式中,针对检测出的每个特征,从扫描数据中抽取与该特征对应的部分,生成如文件710、720、730、740所示那样的文件。
此外,各形式的文件也可以以扫描数据全体为对象而生成。即,例如如图19所示,在生成了关于扫描数据所有页面的演稿形式的变换数据750的情况下,对于其它形式(文档制作形式、表格形式、以及绘图形式)也生成与扫描数据的所有页面对应的文件711、721、731。在这种情况下,扫描数据900、变换数据750、文件711、721、731、以及缩略图数据700分别被关联起来而保存到存储部42等中。
[第3变形例]
在图像处理装置100中,当通过扫描仪(图像读取部23)的图像读取而生成了扫描数据时,也可以按照作为该扫描数据的储存场所而指定的内容,来决定所生成的文件的形式。图20以及图21是在本变形例的图像处理装置100中执行的处理的流程图。
参照图20,在本变形例中,CPU20与参照图9所说明的处理同样地执行步骤S10~步骤S80之后,进一步在步骤S90中进行强制性的格式(文件形式)的变换。在图21中示出步骤S90的子流程。
参照图21,CPU20在步骤S901中判断作为扫描数据的储存场所是否指定了逻辑单元(在存储部42中定义的存储区域),如果判断为那样进行了指定则使处理进入步骤S902,在判断为将其以外(例如图像处理装置100以外的存储装置)指定为储存场所的情况下,使处理进入步骤S906。
在步骤S906中,CPU20对于该指定了的储存场所,判断是否指定了与扫描数据对应地生成的文件的形式,如果判断为有这种形式的指定则使处理进入步骤S907,如果判断为没有指定则使处理返回图20。在图像处理装置100中,例如在存储部42中储存有将外部的存储装置与文件的形式关联起来的表格等信息。在步骤S906中,CPU20通过检索该信息,判断上述指定了的储存场所是否与文件的形式相关联。
在步骤S907中,CPU20对于扫描数据的所有页面,生成在上述信息中指定的形式的文件,使处理返回图20。
在步骤S902中,CPU20对于所指定的逻辑单元,判断是否指定了与扫描数据对应地生成的文件的形式,如果判断为有这种形式的指定则使处理进入步骤S904,如果判断为没有指定则使处理进入步骤S903。在图像处理装置100中,例如在存储部42中储存有将图像处理装置100内的多个逻辑单元的至少一部分与文件的形式关联起来的表格等信息。在步骤S902中,CPU20通过检索该信息,判断作为扫描数据的储存场所而指定的逻辑单元是否与文件的形式相关联。
在步骤S904中,CPU20对于扫描数据的所有页面,生成在步骤S902中判断为指定的形式的文件,使处理返回图20。
在步骤S903中,CPU20对于所指定的逻辑单元,判断是否进行了该逻辑单元固有的文件形式的保持设定。具体地说,例如在所指定的逻辑单元是允许多个用户进行文件的保存、删除等的所谓的共享文件夹的情况下,考虑对在图像处理装置100中可生成的所有形式的文件进行保持的设定而作为逻辑单元固有的文件形式的保持设定。然后,如果判断为进行了上述那样的设定则使处理进入步骤S905,如果判断为没有指定则使处理直接进入图20。
在步骤S905中,CPU20对于扫描数据的所有页面,生成在图像处理装置100中可生成的所有形式的文件,使处理返回图20。在这种情况下,例如对于扫描数据,如参照图19所说明那样,生成与扫描数据的所有页面对应的文件,且该文件是演示文稿形式、文档形式、表格制作形式以及绘图形式的文件。
[实施方式的总结]
根据以上说明的本实施方式,用户只是通过使图像处理装置100读入原稿,就能够变换为该原稿的数据、编辑(参照图18)那样的可再利用的文件形式。另外,用户对于从其它的装置向图像处理装置100发送了数据的图像,也能够同样地进行上述文件形式的变换。
而且,如参照图19等所说明那样,关于上述图像,还能够同时持有多个文件形式的数据。由此,用户能够容易地划分需要的文件形式和其以外的文件形式,容易地编辑需要的文件形式的数据。
虽然已描述和详细例示了本发明,但是清楚地理解:对本发明进行的描述和详细例示仅仅是通过举例和示例的方式进行的,而不是通过限制的方式进行的,本发明的范围通过所附权利要求的术语来解释。

Claims (20)

1.一种图像处理装置(100),具备:
取得部(52),适合于取得图像;
解析部(53),适合于通过对所述取得部(52)所取得的图像的特征进行分析从而选择与所述图像对应的文件的形式;以及
生成部(54),适合于按照所述解析部(53)所选择的形式针对每个所述特征生成所述图像的文件。
2.根据权利要求1所述的图像处理装置(100),其特征在于,
所述解析部(53)根据所述取得部(52)所取得的图像的特征,从该图像抽取图形、分格线、缩进或者字符,根据它们的数量或者位置关系来选择与该图像对应的文件的形式。
3.根据权利要求1或者2所述的图像处理装置(100),其特征在于,
在所述取得部(52)所取得的图像中,在字符、图形收敛于由分格线构成的框内的情况下,所述解析部(53)选择表格形式作为与该图像对应的文件的形式,
在所述取得部(52)所取得的图像中,在图形、字符以及表格混合存在的情况下,进而在字符部分通过缩进而使开头位置一致时或者在字符部分中开头有1个字符量的空格时,所述解析部(53)选择文档形式作为与该图像对应的文件的形式,
在所述取得部(52)所取得的图像中,在所有的页面的相同的位置包括相同的图形或者相同的字符的情况下,所述解析部(53)选择演示文稿形式作为与该图像对应的文件的形式,
在所述取得部(52)所取得的图像中,在仅包括图形的情况下,所述解析部(53)选择图形形式作为与该图像对应的文件的形式。
4.根据权利要求1或者2所述的图像处理装置(100),其特征在于,
在所述取得部(52)所取得的图像中,在所有页面的相同的位置有相同的图形或者相同的字符这样的第1条件成立的情况下,所述解析部(53)选择演示文稿形式作为与该图像对应的文件的形式,
在所述取得部(52)所取得的图像中,在所述第1条件不成立的情况下、且该图像中包含的所有字符、所有图形收敛于由分格线构成的框内这样的第2条件成立的情况下,所述解析部(53)选择表格形式作为与该图像对应的文件的形式,
在所述取得部(52)所取得的图像中,在所述第1条件以及所述第2条件不成立的情况下、且所述图像仅由字符构成且被缩进这样的第3条件成立的情况下,所述解析部(53)选择文档形式作为与该图像对应的文件的形式,
在所述取得部(52)所取得的图像中,在所述第1条件、所述第2条件以及所述第3条件中的任一个都不成立的情况下,所述解析部(53)选择预先确定的形式作为与该图像对应的文件的形式。
5.根据权利要求1或者2所述的图像处理装置(100),其特征在于,
还具备存储部,该存储部用于存储与文件形式有关的设定内容,
在由所述生成部(54)生成的文件存储在所述存储部中的情况下,并非选择由所述解析部(53)所选择的所述形式,而是选择与存储在所述存储部中的所述设定内容对应的所述形式作为该文件的形式。
6.根据权利要求1或者2所述的图像处理装置(100),其特征在于,
所述生成部(54)对于所述取得部(52)所取得的图像,针对每个页面生成与各页面对应的形式的文件。
7.根据权利要求6所述的图像处理装置(100),其特征在于,
所述生成部(54)对于所述取得部(52)所取得的图像,针对具有特征的每个部分生成与各部分对应的形式的文件。
8.根据权利要求1或者2所述的图像处理装置(100),其特征在于,
所述解析部(53)从所述取得部(52)所取得的图像中抽取分格线,
所述解析部(53)判断所述取得部(52)所取得的图像中包含的字符、图形是否收敛于由所抽取的所述分格线包围的区域内,
所述解析部(53)判断图章的图像是否位于由所述分格线包围的区域内或者所述分格线附近,
所述解析部(53)在判断为在由所述分格线包围的区域内或者所述分格线附近有图章的图像的情况下,从是否收敛于由所述分格线包围的区域内的判断对象中排除该图章图像。
9.根据权利要求1或者2所述的图像处理装置(100),其特征在于,
所述生成部(54)将针对每个所述特征生成的所述文件的链接信息嵌入到所述生成的文件的图像中。
10.根据权利要求1或者2所述的图像处理装置(100),其特征在于,
所述生成部(54)生成所述取得的图像的各页面的缩略图图像,生成将所述缩略图图像与所述取得的图像关联起来的信息。
11.一种图像处理装置的控制方法,用于控制图像处理装置,包括:
所述图像处理装置取得图像的步骤;
所述图像处理装置通过对所取得的所述图像的特征进行分析从而选择与所述图像对应的文件的形式的步骤;以及
所述图像处理装置按照所选择的所述形式生成所述图像的每个特征的文件的步骤。
12.根据权利要求11所述的图像处理装置的控制方法,其特征在于,
所述选择的步骤包括如下步骤:根据所取得的所述图像的特征,从该图像抽取图形、分格线、缩进或者字符,根据它们的数量或者位置关系来选择与该图像对应的文件的形式。
13.根据权利要求11或者12所述的图像处理装置的控制方法,其特征在于,
所述选择的步骤包括:
在所取得的所述图像中,在字符、图形收敛于由分格线构成的框内的情况下,选择表格形式作为与该图像对应的文件的形式的步骤;
在所取得的所述图像中,在图形、字符以及表格混合存在的情况下,进而在字符部分通过缩进而使开头位置一致时或者在字符部分中开头有1个字符量的空格时,选择文档形式作为与该图像对应的文件的形式的步骤;
在所取得的所述图像中,在所有的页面的相同的位置包括相同的图形或者相同的字符的情况下,选择演示文稿形式作为与该图像对应的文件的形式的步骤;以及
在所取得的所述图像中,在仅包括图形的情况下,选择图形形式作为与该图像对应的文件的形式的步骤。
14.根据权利要求11或者12所述的图像处理装置的控制方法,其特征在于,
所述选择的步骤包括:
在所取得的所述图像中,在所有页面的相同的位置有相同的图形或者相同的字符这样的第1条件成立的情况下,选择演示文稿形式作为与该图像对应的文件的形式的步骤;
在所取得的所述图像中,在所述第1条件不成立的情况下、且该图像中包含的所有字符、所有图形收敛于由分格线构成的框内这样的第2条件成立的情况下,选择表格形式作为与该图像对应的文件的形式的步骤;
在所取得的所述图像中,在所述第1条件以及所述第2条件不成立的情况下、且所述图像仅包括字符且被缩进这样的第3条件成立的情况下,选择文档形式作为与该图像对应的文件的形式的步骤;以及
在所取得的所述图像中,在所述第1条件、所述第2条件以及所述第3条件中的任一个都不成立的情况下,选择预先确定的形式作为与该图像对应的文件的形式的步骤。
15.根据权利要求11或者12所述的图像处理装置的控制方法,其特征在于,
所述图像处理装置包括存储装置,
所述控制方法还包括:
所述图像处理装置在所述存储装置中储存与文件的形式有关的设定内容的步骤;以及
所述图像处理装置将所生成的所述文件储存到所述存储装置中的步骤,
所述选择的步骤包括如下步骤:并非选择所选择的所述形式,而是选择与储存在所述存储装置中的所述设定内容对应的所述形式作为储存在所述存储装置中的文件的形式。
16.根据权利要求11或者12所述的图像处理装置的控制方法,其特征在于,
生成所述文件的步骤包括如下步骤:对于所取得的所述图像,针对每个页面生成与各页面对应的形式的文件。
17.根据权利要求16所述的图像处理装置的控制方法,其特征在于,
选择所述形式的步骤包括:
针对所取得的所述图像的每个部分取得特征的步骤;以及
针对每个所述部分选择与该部分对应的形式的步骤,
生成所述文件的步骤包括:
针对每个所述部分生成与该部分的特征对应的形式的文件的步骤。
18.根据权利要求11或者12所述的图像处理装置的控制方法,其特征在于,
选择所述形式的步骤包括:
从所取得的所述图像中抽取分格线的步骤;
判断所取得的所述图像中包含的字符、图形是否收敛于由所抽取的所述分格线包围的区域内的步骤;以及
判断图章的图像是否位于由所抽取的所述分格线包围的区域或者该分格线的附近的步骤,
判断所述字符、图形是否收敛于由所抽取的所述分格线包围的区域内的步骤包括将位于由所抽取的所述分格线包围的区域或者该分格线的附近的图章的图像从该判断的对象中排除的步骤。
19.根据权利要求11或者12所述的图像处理装置的控制方法,其特征在于,
生成所述文件的步骤包括将针对每个所述特征生成的所述文件的链接信息嵌入到所述生成的文件的图像中的步骤。
20.根据权利要求11或者12所述的图像处理装置的控制方法,其特征在于,
生成所述文件的步骤包括:
生成所取得的所述图像的各页面的缩略图图像的步骤;以及
生成将所述缩略图图像与所取得的所述图像关联起来的信息的步骤。
CN201310050041.7A 2012-02-17 2013-02-08 图像处理装置及其控制方法 Active CN103258197B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2012032672A JP5578188B2 (ja) 2012-02-17 2012-02-17 画像処理装置、画像処理装置の制御方法、および、プログラム
JP2012-032672 2012-02-17

Publications (2)

Publication Number Publication Date
CN103258197A true CN103258197A (zh) 2013-08-21
CN103258197B CN103258197B (zh) 2017-10-13

Family

ID=48962101

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310050041.7A Active CN103258197B (zh) 2012-02-17 2013-02-08 图像处理装置及其控制方法

Country Status (3)

Country Link
US (1) US9277094B2 (zh)
JP (1) JP5578188B2 (zh)
CN (1) CN103258197B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104754160A (zh) * 2013-12-27 2015-07-01 京瓷办公信息系统株式会社 图像处理装置
CN107577327A (zh) * 2016-07-05 2018-01-12 柯尼卡美能达株式会社 图像形成装置、启动方法以及记录介质
CN108334800A (zh) * 2017-01-20 2018-07-27 富士通株式会社 印章图像的处理装置、方法以及电子设备
CN109493401A (zh) * 2018-10-23 2019-03-19 天津字节跳动科技有限公司 演示文稿生成方法、装置以及电子设备

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5765364B2 (ja) * 2013-04-17 2015-08-19 コニカミノルタ株式会社 画像処理装置、プレビュー画像を表示する方法、およびプログラム
JP6561547B2 (ja) * 2015-04-08 2019-08-21 大日本印刷株式会社 コンピュータプログラム及び画像処理装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1620094A (zh) * 2003-11-20 2005-05-25 佳能株式会社 用于将图像转换为预定格式的图像处理设备及方法
CN1248138C (zh) * 2003-02-21 2006-03-29 佳能株式会社 图像处理方法与图像处理系统
JP2007025815A (ja) * 2005-07-12 2007-02-01 Canon Inc 画像処理方法、画像処理装置、デジタルカメラ及びコンピュータプログラム
CN102222079A (zh) * 2010-04-07 2011-10-19 佳能株式会社 图像处理设备及图像处理方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4266784B2 (ja) * 2003-11-14 2009-05-20 キヤノン株式会社 画像処理システム及び画像処理方法
JP4310176B2 (ja) 2003-11-27 2009-08-05 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
JP2006023945A (ja) * 2004-07-07 2006-01-26 Canon Inc 画像処理システム及び画像処理方法
JP5249387B2 (ja) * 2010-07-06 2013-07-31 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
US20120053992A1 (en) * 2010-08-30 2012-03-01 Ricoh Company, Ltd. Techniques for pricing a task

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1248138C (zh) * 2003-02-21 2006-03-29 佳能株式会社 图像处理方法与图像处理系统
CN1620094A (zh) * 2003-11-20 2005-05-25 佳能株式会社 用于将图像转换为预定格式的图像处理设备及方法
JP2007025815A (ja) * 2005-07-12 2007-02-01 Canon Inc 画像処理方法、画像処理装置、デジタルカメラ及びコンピュータプログラム
CN102222079A (zh) * 2010-04-07 2011-10-19 佳能株式会社 图像处理设备及图像处理方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104754160A (zh) * 2013-12-27 2015-07-01 京瓷办公信息系统株式会社 图像处理装置
CN107577327A (zh) * 2016-07-05 2018-01-12 柯尼卡美能达株式会社 图像形成装置、启动方法以及记录介质
CN107577327B (zh) * 2016-07-05 2020-06-19 柯尼卡美能达株式会社 图像形成装置、启动方法以及记录介质
CN108334800A (zh) * 2017-01-20 2018-07-27 富士通株式会社 印章图像的处理装置、方法以及电子设备
CN108334800B (zh) * 2017-01-20 2021-09-24 富士通株式会社 印章图像的处理装置、方法以及电子设备
CN109493401A (zh) * 2018-10-23 2019-03-19 天津字节跳动科技有限公司 演示文稿生成方法、装置以及电子设备
CN109493401B (zh) * 2018-10-23 2019-11-22 北京字节跳动网络技术有限公司 演示文稿生成方法、装置以及电子设备

Also Published As

Publication number Publication date
CN103258197B (zh) 2017-10-13
US9277094B2 (en) 2016-03-01
US20130215476A1 (en) 2013-08-22
JP2013171294A (ja) 2013-09-02
JP5578188B2 (ja) 2014-08-27

Similar Documents

Publication Publication Date Title
US9514103B2 (en) Effective system and method for visual document comparison using localized two-dimensional visual fingerprints
CN103258197A (zh) 图像处理装置及其控制方法
JP3962721B2 (ja) 文書処理装置及び文書処理方法
CN101558425B (zh) 图像处理设备和图像处理方法
JP5480462B2 (ja) 文書処理プログラム、文書処理装置及び文書処理システム
US8634100B2 (en) Image forming apparatus for detecting index data of document data, and control method and program product for the same
EP2343670A2 (en) Apparatus and method for digitizing documents
CN101370072A (zh) 多功能设备以及其控制方法
CN100454293C (zh) 文档编辑方法和文档编辑设备
US5950213A (en) Input sheet creating and processing system
JP2006229670A (ja) 画像形成装置およびプログラム
US20070234204A1 (en) Information processing apparatus and method
US10452944B2 (en) Multifunction peripheral assisted optical mark recognition using dynamic model and template identification
US20060290999A1 (en) Image processing apparatus and network system
JP4811133B2 (ja) 画像形成装置及び画像処理装置
CN101930546B (zh) 图像处理装置和图像处理方法
JP2006119712A (ja) 情報管理端末装置、情報管理プログラム及び電子ペン用帳票
JP5340689B2 (ja) データベース生成装置、データベース生成方法及びコンピュータプログラム
DE102004016693A1 (de) Verfahren und Vorrichtung zum Verarbeiten von Bilddaten
US20130104014A1 (en) Viewer unit, server unit, display control method, digital comic editing method and non-transitory computer-readable medium
US20110157658A1 (en) Imaging processing apparatus, method for controlling the same, and program
CN101727042B (zh) 信息处理设备和信息处理设备的控制方法
JP2010092141A (ja) 画像処理システム、画像読取装置、画像処理装置および画像処理プログラム
JP2001291085A (ja) 電子ファイルの登録方法及び電子ファイルの登録方式
CN118964288A (zh) 一种自动分析方法及其分析装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant