CN109479081A - 原稿读取装置 - Google Patents

原稿读取装置 Download PDF

Info

Publication number
CN109479081A
CN109479081A CN201880001969.7A CN201880001969A CN109479081A CN 109479081 A CN109479081 A CN 109479081A CN 201880001969 A CN201880001969 A CN 201880001969A CN 109479081 A CN109479081 A CN 109479081A
Authority
CN
China
Prior art keywords
character string
original
page
image
identification part
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201880001969.7A
Other languages
English (en)
Other versions
CN109479081B (zh
Inventor
森田恵子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Publication of CN109479081A publication Critical patent/CN109479081A/zh
Application granted granted Critical
Publication of CN109479081B publication Critical patent/CN109479081B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00026Methods therefor
    • H04N1/00039Analysis, i.e. separating and studying components of a greater whole
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/21Intermediate information storage
    • H04N1/2166Intermediate information storage for mass storage, e.g. in document filing systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3872Repositioning or masking
    • H04N1/3873Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3877Image rotation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/21Intermediate information storage
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals

Abstract

原稿读取装置(20)具备:原稿读取部(5),其用于光学地读取原稿的图像;字符串识别部(102),其用于识别在通过所述原稿读取部(5)读取的原稿图像中被指定的区域中包含的字符串;图像保存控制部(103),其用于使通过所述原稿读取部(5)读取的原稿图像保存在存储装置中;在原稿的前页的原稿图像中通过所述字符串识别部(102)识别的字符串和在当页的原稿图像中通过字符串识别部(102)识别的字符串不同的情况下,所述图像保存控制部(103)将到前页为止的原稿图像作为一个文件而保存到存储装置(92)中。

Description

原稿读取装置
技术领域
本发明涉及对纸媒体的原稿进行电子化的一种原稿读取装置。
背景技术
在利用复合机对页数多的原稿进行扫描并文件化时,在文件大小变大的情况下,存在尝试通过分割为多个文件来抑制文件大小的情况。此时,当将分割的单位指定为文件大小或一定的页数时,存在根据原稿而在对于用户来说不希望的原稿页位置被分割的情况。另外,用户利用手动来指定分割的页位置非常麻烦。因此,要求自动指定分割的页位置。
在以下专利文献1中,公开了在能够读取由多页构成的原稿并制作电子文书的图像形成装置中,基于从用户给予的条件,从对读取的原稿图像进行字符识别并提取的行单位的字符串,提取章节分割部位的候补行并对该候补行的图像附上临时标记,并显示包括所述附上了临时标记的候补行的页的图像,基于来自用户的指令来确定所述候补行是章节分割部位,对所述被确定的章节分割部位附上标记并修正原稿图像,并且生成概要数据,所述概要数据包括将从该章节分割部位的行提取的字符串和所述章节分割部位相关联的链接信息,从全部的原稿图像和该概要数据来生成带有链接信息的电子文书。
现有技术文献
专利文献
专利文献1:日本特开2010-109420号公报
发明内容(Summary)
在上述专利文献1中,章节分割基准被定义为字符大小等。然而,存在以下问题:以字符大小等规则为基准进行判断时,仅对于事先考虑该规则而制作的原稿有效。
本发明是为了解决上述问题而作出的发明,其目的在于,在对由多页构成的原稿进行扫描并文件化时,即使用户不指定分割的页位置,也在对于用户来说被认为是合适的页位置处将原稿分割为多个文件并保存。
用于解决问题的方案
本发明的一个方面的原稿读取装置具备:原稿读取部,其用于光学地读取原稿的图像;指定接受部,其用于接受利用由所述原稿读取部进行的原稿的读取而获得的原稿图像中的任意位置的区域的指定;字符串识别部,其用于识别在由所述原稿读取部进行的原稿的读取而获得的原稿图像中通过由所述指定接受部进行的指定的接受而指定的区域中包含的字符串;存储装置,其用于存储通过所述原稿读取部读取的原稿图像;图像保存控制部,其使通过所述原稿读取部读取的原稿图像存储在所述存储装置中;在所述原稿的前页的原稿图像中通过所述字符串识别部识别的字符串和在当页的原稿图像中通过所述字符串识别部识别的字符串不同的情况下,所述图像保存控制部进行将到所述前页为止的原稿图像作为一个文件并将当页以后的页作为其他文件而保存到所述存储装置中的文件分割处理。
发明效果
根据本发明,在对由多页构成的原稿进行扫描并文件化时,即使用户不指定分割的页位置,也能够在对于用户来说被认为是合适的页位置处将原稿分割为多个文件并保存。
附图说明
图1是示出具备本发明的一个实施方式所涉及的原稿读取装置的图像形成装置的构造的正视剖视图。
图2是概要地表示图像形成装置的主要内部结构的功能框图。
图3A是示出字符串识别指定区域的设定例的图。
图3B是示出字符串识别指定区域的其他设定例的图。
图4是示出图像形成装置进行的文件分割处理的流程图。
图5是示出将扫描的原稿图像进行页分割并作为不同文件而保存的例子的图。
图6是示出将上下反转的原稿图像的方向改正且页分割并作为不同文件而保存的例子的图。
图7是示出将指定区域为空白的页作为与前页不同的文件而保存的例子的图。
图8是示出将指定区域为空白的页作为与前页相同的文件而保存的例子的图。
具体实施方式
以下,参照附图对本发明的一个实施方式所涉及的原稿读取装置进行说明。图1是示出具备本发明的一个实施方式所涉及的原稿读取装置的图像形成装置的构造的正视剖视图。图像形成装置1例如为同时具备复印功能、打印机功能、扫描仪功能、以及传真功能等的多功能复合机。
图像形成装置1大致由装置本体11、在所述装置本体11的上方相对配置的原稿读取装置20、以及在所述原稿读取装置20与装置本体11之间设置的连结部30构成。
所述原稿读取装置20支承于连结部30的上端部。所述原稿读取装置20通过具备原稿读取部5、原稿传输部6等而构成。
所述原稿读取部5具备安装在原稿读取部框体的上表面开口的、用于载置原稿的承片玻璃161。在承片玻璃161中,存在读取载置的原稿的原稿固定读取部(省略图示)和读取被原稿传输部6传输的原稿的原稿传输读取部(省略图示)。所述原稿读取部5还具备:开闭自如的原稿按压盖162,其按压载置于承片玻璃161的原稿;原稿,其载置于所述承片玻璃161的原稿固定读取部;以及读取单元163,其读取向承片玻璃161的原稿传输读取部传输的原稿的各图像。读取单元163使用CCD((电荷耦合器件)Charge Coupled Device)、CMOS((互补性氧化金属半导体)Complementary Metal Oxide Semiconductor)等图像传感器光学地读取原稿的图像,并生成图像数据。
所述原稿传输部6具备供原稿载置的原稿载置台61、供图像已读取的原稿排出的原稿排出部66、原稿传输机构65。所述原稿传输机构65具备省略图示的供纸辊、传输辊、以及用纸反转机构。所述原稿传输机构65通过供纸辊以及传输辊的驱动,将载置在所述原稿载置台61上的原稿一张一张地送出并传输到承片玻璃161的原稿传输读取部,以使得由所述读取单元163进行的读取成为可能,之后向原稿排出部66排出。另外,所述原稿传输机构65通过用纸反转机构使原稿正反反转并再次传输到所述承片玻璃161的原稿传送读取部,从而使通过所述读取单元163读取该原稿的两面的图像成为可能。
进一步地,所述原稿传输部6以其前表面侧能够向上方移动的方式相对于原稿读取部5转动自如地设置。通过使所述原稿传输部6的前表面侧向上方移动来开放作为原稿台的承片玻璃161上表面,从而使用户能够将读取原稿、例如双页打开状态的书籍等载置于承片玻璃161的上表面。
在所述原稿读取装置20的前表面上,配置有操作部47。所述操作部47关于图像形成装置1能够执行的各种操作及处理,从用户处接受图像形成动作执行指令、原稿读取动作执行指令等指令。所述操作部47具备显示部473,该显示部473显示对用户的操作引导等。
所述装置本体11通过具备图像形成部12、定影部13、送纸部14、用纸排出部15等而构成。
在所述图像形成装置1进行原稿读取动作的情况下,图像读取部5用于光学地读取通过所述原稿传输部6传输而来的原稿、或者载置于所述承片玻璃161的原稿的图像,并生成图像数据。由所述原稿读取装置5生成的图像数据存储在内置HDD或者有网络连接的计算机等中。
在所述图像形成装置1进行图像形成动作的情况下,基于上述通过原稿读取动作生成的图像数据、从被网络连接的计算机或者智能手机等用户终端装置接收到的图像数据、或者存储在内置HDD中的图像数据等,所述图像形成部12在从送纸部14送纸的作为记录介质的用纸P上形成色粉图像。所述图像形成部12的图像形成单元12M、12C、12Y以及12B各自具备感光鼓、向感光鼓供给色粉的显影装置、收容色粉的色粉盒、带电装置、曝光装置、一次转印辊126。
被转印到所述中间转印带125上的各个色彩的色粉图像,通过调整转印时机而在中间转印带125上重合,以形成彩色的色粉像。二次转印辊210使在中间转印带125的表面上形成的彩色的色粉像,隔着所述中间转印带125在与驱动辊125A的压送(nip)部N中,转印到从送纸部14通过传输辊对而由传输路径190传输来的用纸P上。在此之后,所述定影部13使用纸P上的色粉像通过热压接而定影在用纸P上。完成了定影处理的彩色图像形成完毕的用纸P被排出到排出托盘151。
接下来,对所述图像形成装置1的结构进行说明。图2是表示图像形成装置1的主要内部结构的功能框图。
所述原稿读取部5具备在控制单元10进行的控制之下,具有光照射部以及CCD传感器等的上述读取机构163。所述原稿读取部5通过光照射部来照射原稿,并利用CCD传感器来对其反射光进行受光,从而从原稿读取图像。
所述图像存储器32指的是用于暂时存储利用原稿读取部5的读取而获得的原稿图像的数据,或者暂时保存成为图像形成部12的打印对象的数据的区域。
所述图像处理部31对从图像存储器32利用原稿读取部5读取的图像进行图像处理。例如,所述图像处理部31为了提高利用原稿读取部5读取的图像被通过图像形成部12进行了图像形成之后的品质,进行黑斑校正等预定的图像处理。
所述图像形成部12进行利用原稿读取部5读取的印刷数据、从网络连接的计算机接收的印刷数据等的图像形成。
所述操作部47关于图像形成装置1能够执行的各种动作及处理,接受来自用户的指令。所述操作部47具备利用液晶显示器实现的触屏式显示部473。所述操作部47从用户处接受利用原稿读取部5进行的原稿的读取而获得的原稿图像中的任意的位置的区域的指定。所述操作部47是权利要求书中的指定接受部的一个例子。
所述显示部473在图像形成装置1处于通常动作模式时,进行操作画面、预览画面、印刷任务状况的确认画面等各种显示。另一方面,所述显示部473在图像形成装置1处于睡眠模式时熄灭。
HDD(硬盘驱动器)92是对通过原稿读取部5读取的原稿图像等进行存储的大容量的存储装置。
所述驱动马达70是用于对图像形成部12的各旋转部件以及传输辊对等赋予旋转驱动力的驱动源。
所述控制单元10由处理器、RAM、ROM以及专用的硬件回路等构成。所述处理器例如为CPU、MPU、ASIC等。所述控制单元10具备控制部100、字符串识别部102、以及图像保存控制部103。此外,在HDD92或上述ROM中存储有原稿读取程序,所述控制单元10通过遵循该原稿读取程序而动作,从而作为控制部100、字符串识别部102、以及图像保存控制部103来进行在本实施方式中所示的下述原稿读取处理的执行所需要的动作。此外,所述控制单元10也可以不依赖于该原稿读取程序,而具备作为硬件回路的控制部100、字符串识别部102、以及图像保存控制部103。
所述控制部100是管理图像形成装置1的整体动作的部分,其与原稿读取部5、原稿给送部6、图像存储器32、图像处理部31、图像形成部12、操作部47、以及HDD92等相连接,以进行这些各个部分的驱动控制。
所述字符串识别部102识别在通过原稿读取部5读取的原稿图像中被指定的区域中包含的字符串。更详细地,字符串识别部102使用OCR((光学字符识别)OpticalCharacter Recognition)技术,识别在原稿图像中被指定的区域中包含的字符串。
图3A是示出字符串识别指定区域的设定例的图。例如,在原稿类型“单面原稿”的原稿的情况下,存在在各页的页眉中记载章节号、标题等。因此,用户通过所述操作部47的操作(例如对于触摸屏的滑动操作)来指定在各页的页眉中记载章节号、标题等区域的起点以及终点的XY坐标,所述操作部47通过接受该指定,从而设定字符串识别指定区域110。
图3B是示出字符串识别指定区域的其他设定例的图。例如,在原稿类型“双页打开原稿”的原稿的情况下,存在在奇数页和偶数页中页眉的左右对称的位置处记载章节号、标题等。因此,用户通过操作部47的操作来指定在奇数页的页眉中记载章节号、标题等区域的起点以及终点的XY坐标并设定字符串识别指定区域110A,在偶数页中在与奇数页成为左右对称的位置处设定字符串识别指定区域110B。
进一步地,所述字符串识别部102用于在原稿图像中被指定的区域识别为空白的情况下,识别在将该原稿图像180度翻转的图像中被指定的区域中包含的字符串。由此,在原稿中混有上下反转的页的情况下,用户不修正页的方向就能够改正原稿图像的方向,从而能够使用户的便利性提高。此外,用户能够任意地设定是否使原稿图像180度旋转。
所述图像保存控制部103将通过所述原稿读取部5读取的原稿图像分割为多个文件并保存到HDD92、被网络连接的计算机所具有的省略图示的存储装置等存储装置。特别是,在原稿的前页的原稿图像中通过字符串识别部102识别的字符串和在当页的原稿图像中通过字符串识别部102识别的字符串不同的情况下,所述图像保存控制部103进行将到前页为止的原稿图像作为一个文件而保存到存储装置的文件分割处理。所述图像保存控制部103进一步地将当页以后的页作为其他文件保存到存储装置。此外,所述图像保存控制部103从通过所述字符串识别部102识别的字符串生成原稿图像的文件名。由此,省去了用户利用手动来设定文件名的功夫,从而能够使用户的便利性提高。
接下来,对所述图像形成装置1进行的文件分割处理进行说明。图4是示出图像形成装置1进行的文件分割处理的流程图。
首先,所述原稿读取部5扫描从原稿给送部6一张一张地传输的原稿并光学地读取该原稿的图像(步骤S1)。通过所述原稿读取部5读取的原稿图像暂时地保存到所述图像存储器32中。
当原稿的一页的扫描完成时,开始文件分割处理,所述字符串识别部102读出暂时地保存到图像存储器32中的原稿图像,并识别在被指定的区域中包含的字符串(在步骤S2中)。
所述字符串识别部102在无法识别原稿图像中被指定的区域中的字符串的情况下,即在该被指定的区域判断为空白的情况下(在步骤S3中为是),该页存在上下反转的可能性。因此,在用户允许原稿图像的180旋转的情况下(在步骤S4中为是),所述字符串识别部102将原稿图像180度旋转(在步骤S5中)并识别在该旋转的图像中被指定的区域中包含的字符串(在步骤S6中)。
如果所述字符串识别部102能够识别字符串,即被指定的区域不是空白(在步骤S3中为否或在步骤S7中为否),则所述图像保存控制部103比较在原稿的前页的原稿图像中通过所述字符串识别部102识别的字符串、和在当页的原稿图像中通过所述字符串识别部102识别的字符串(在步骤S8中)。然后,在判断为前页和当页的字符串不同的情况下(在步骤S8中为是),在步骤图像保存控制部103将到前页为止的原稿图像作为一个文件而保存到存储装置中(在步骤S9中)。由此,利用前页和当页将文件分割,包含到前页为止的原稿图像的文件被保存在存储装置中。
该情况下,在步骤图像保存控制部103在原则上,不将作为比较对象的上述两字符串的大小、字体作为上述是否不同的判断的要素,而是通过构成该两字符串的各字符彼此作为字符代码(文本)是否一致来进行上述是否不同的判断。但是,也可以是,在步骤图像保存控制部103关于作为上述比较对象的上述两字符串,判定字符串的大小或字体的不同是否超过预定的字符数(例如,构成该字符例的字符总数的1/2的字符数以千计),在判定为字符串的大小或字体的不同超过该预定的字符数的情况下,判断作为比较对象的上述两字符串不同。
通过在步骤图像保存控制部103,在判断为前页和当页中字符数相同(在步骤S8中为否),或者在步骤S9中包含到前页为止的原稿图像的文件的保存完成之后,判断原稿存在下页的话(在步骤S10中为是),则返回步骤S1并使所述原稿读取部5读取原稿的下页。另一方面,在判断为原稿没有下页时(在步骤S10中为否),所述图像保存控制部103将包含当页的原稿图像的未保存的原稿图像作为一个文件而保存到存储装置中(在步骤S11中),并结束原稿读取处理。
图5是示出将扫描的原稿图像进行页分割并作为不同文件而保存的例子的图。例如,在原稿的第一页以及第二页的页眉中记载有字符串“4-19xxx”,且第三页以及第四页的页眉中记载有字符串“4-20yyy”的情况下,当进行上述的原稿读取处理时,通过所述字符串识别部102以及图像保存控制部103,原稿的第一页以及第二页的原稿图像以文件名“4-19xxx.pdf”被保存,第三页以及第四页的原稿图像以文件名“4-20yyy.pdf”被保存。
图6是示出将上下反转的原稿图像的方向改正且页分割并作为不同文件而保存的例子的图。例如,在与图5相同的原稿中第三页的上下反转的情况下,通过所述字符串识别部102,将该页的原稿图像180度旋转并识别出字符串“4-20yyy.pdf”,通过所述图像保存控制部103,原稿的第一页以及第二页的原稿图像以文件名“4-19xxx.pdf”被保存,第三页以及第四页的原稿图像以文件名“4-20yyy.pdf”被保存。
然后,原稿的全部页中在指定区域中不一定都记载有字符,存在仅在奇数页或偶数页的任意一方的页的页眉中记载有章节号、标题等。该情况下,在另一方的页的原稿图像中被指定的区域中没有记载字符,为空白。关于这样的页的原稿图像,用户通过所述操作部47输入指令,任意地设定是视为前页的后续并保存为与前页的原稿图像相同的文件,还是保存为与前页不同的文件。所述操作部47接受该指令。图像保存控制部103按照该指令,设定划分文件的页位置,并制作各文件。
回到图4,在通过所述字符串识别部102判断为指定区域为空白的情况下(在步骤S3中为是),且在没有将原稿图像以180度旋转的方式设定的情况下(在步骤S4中为否),或者即使是在将原稿图像180度旋转的图像中但在指定区域中没有识别到字符串,即指定区域为空白的情况下(在步骤S7中为是),当没有设定成将指定区域为空白的页作为前页的后续时(在步骤S12中为否),所述图像保存控制部103还用于将到前页为止的原稿图像作为一个文件而保存到存储装置中(S9)。由此,指定区域为空白的当页与前页分离,包含到前页为止的原稿图像的文件被保存在存储装置中。
图7是示出将指定区域为空白的页作为与前页不同的文件而保存的例子的图。例如,在原稿的第三页的指定区域为空白的情况下,通过所述图像保存控制部103,到第二页为止的原稿图像以文件名“4-19xxx.pdf”被保存。另一方面,第三页以后的原稿图像基于在第四页的原稿图像的指定区域中被识别出的字符串“4-20yyy”,通过所述图像保存控制部103,以文件名“4-20yyy.pdf”被保存。
另一方面,在设定成将指定区域为空白的页作为前页的后续的情况下(在步骤S12中为是),不进行通过图像保存控制部103来保存到前页为止的原稿图像,如果原稿存在下页的话(在步骤S10中为是),返回步骤S1并使所述原稿读取部5读取原稿的下页。
图8是示出将指定区域为空白的页作为与前页相同的文件而保存的例子的图。例如,在原稿的第三页的指定区域为空白的情况下,第三页作为第二页的后续被处理,通过所述图像保存控制部103,到第三页为止的原稿图像以文件名“4-19xxx.pdf”被保存在存储装置中,第四页的原稿图像以文件名“4-20yyy.pdf”被保存在存储装置中。
根据该本实施方式,在对由多页构成的原稿进行扫描并文件化时,即使用户不指定分割的页位置,也能够在对于用户来说被认为是合适的页位置处将原稿分割为多个文件并保存。由此,省去了用户利用手动来指定分割的页位置的功夫,从而能够使用户的便利性提高。
此外,根据本实施方式,每次原稿的一页的扫描完成时,都进行被指定的区域的字符串识别以及页分割处理。即,每次所述原稿读取部5进行的原稿的一页的读取完成时,所述字符串识别部102都进行被指定的区域的字符串识别,所述图像保存控制部103进行所述文件分割处理。与此相对,也可以是,扫描原稿的全部页并将全部页的原稿图像数据蓄积在图像存储器32中,再进行各页的指定区域的字符串识别以及页分割处理。即,也可以是,在所述原稿读取部5进行的读取原稿的全部页并将全部页的原稿图像数据蓄积到存储器32(存储装置)之后,所述字符串识别部102进行各页的所述被指定的区域的字符串识别,所述图像保存控制部103进行所述文件分割处理。
以上,对本发明的实施方式进行了说明,但本发明不限定于上述实施方式的结构,能够进行各种变形。例如,另外,用户通过所述操作部47的操作,不仅限于页眉的区域,也可以指定页脚、边缘侧的区域来作为在原稿图像中应该读取字符串的区域。该情况下,所述字符串识别部102在该被指定的区域中识别字符串。
另外,在上述实施方式中,也可以是,在上述的步骤S1中通过原稿读取部5读取的原稿图像的数据量超过预定的数据量的情况下,所述图像保存控制部103进行步骤S2至步骤S11中所示的文件分割处理。
另外,在上述实施方式中,对将本发明涉及的原稿读取装置搭载于复合机的例子进行了说明,但是这不过是一个例子,本发明涉及的原稿读取装置也可以搭载于例如打印机、传真装置、扫描装置。
另外,使用图1至图8通过上述实施方式表示的结构以及处理,不过是本发明的一种实施方式,并不意味着将本发明限定于该结构以及处理。

Claims (11)

1.一种原稿读取装置,其特征在于,具备:
原稿读取部,其用于光学地读取原稿的图像;
指定接受部,其用于接受利用由所述原稿读取部进行的原稿的读取而获得的原稿图像中的任意位置的区域的指定;
字符串识别部,其用于识别在由所述原稿读取部进行的原稿的读取而获得的原稿图像中通过由所述指定接受部进行的指定的接受而指定的区域中包含的字符串;
存储装置,其用于存储通过所述原稿读取部读取的原稿图像;
图像保存控制部,其用于使通过所述原稿读取部读取的原稿图像存储在所述存储装置中;
在所述原稿的前页的原稿图像中通过所述字符串识别部识别的字符串和在当页的原稿图像中通过所述字符串识别部识别的字符串不同的情况下,所述图像保存控制部还用于进行将到所述前页为止的原稿图像作为一个文件并将当页以后的页作为其他文件而保存到所述存储装置中的文件分割处理。
2.根据权利要求1所述的原稿读取装置,其特征在于,在通过所述原稿读取部读取的原稿图像的数据量超过预定的数据量的情况下,所述图像保存控制部还用于进行所述文件分割处理。
3.根据权利要求1所述的原稿读取装置,其特征在于,所述图像保存控制部还用于从通过所述字符串识别部识别的字符串生成所述原稿图像的文件名。
4.根据权利要求1所述的原稿读取装置,其特征在于,所述字符串识别部还用于在所述原稿的奇数页以及偶数页中使所述被指定的区域左右对称并识别字符串。
5.根据权利要求1所述的原稿读取装置,其特征在于,所述字符串识别部还用于在所述被指定的区域识别为空白的情况下,识别在将所述原稿图像180度旋转的图像中所述被指定的区域中包含的字符串。
6.根据权利要求1所述的原稿读取装置,其特征在于,在所述原稿的当页的原稿图像中所述被指定的区域通过所述字符串识别部识别为空白的情况下,所述图像保存控制部还用于将当页的原稿图像与到前页为止的原稿图像一起作为一个文件,并将当页的下页以后的页作为其他文件,进行所述文件分割处理。
7.根据权利要求1所述的原稿读取装置,其特征在于,在所述原稿的当页的原稿图像中所述被指定的区域通过所述字符串识别部识别为空白的情况下,所述图像保存控制部还用于将当页的原稿图像与次页以后的原稿图像一起作为一个文件,并将当页的前页之前的页作为另一文件,进行所述文件分割处理。
8.根据权利要求1所述的原稿读取装置,其特征在于,在所述字符串识别部中不进行所述两字符串的大小、字体是否不同的判断,而是构成该两字符串的各字符彼此作为字符代码被识别为不同的情况下,所述图像保存控制部还用于将在所述原稿的前页的原稿图像中通过所述字符串识别部识别的字符串和在当页的原稿图像中通过所述字符串识别部识别的字符串作为不同的字符串,进行所述文件分割处理。
9.根据权利要求1所述的原稿读取装置,其特征在于,在字符串的大小或字体通过所述字符串识别部被识别为预定的字符数以上不同的情况下,所述图像保存控制部还用于将在所述原稿的前页的原稿图像中通过所述字符串识别部识别的字符串和在当页的原稿图像中通过所述字符串识别部识别的字符串作为不同的字符串,进行所述文件分割处理。
10.根据权利要求1所述的原稿读取装置,其特征在于,每次所述原稿读取部进行的原稿的一页的读取完成时,所述字符串识别部都进行所述被指定的区域的字符串识别,所述图像保存控制部进行所述文件分割处理。
11.根据权利要求1所述的原稿读取装置,其特征在于,在所述原稿读取部进行的读取原稿的全部页并将全部页的原稿图像数据蓄积到所述存储装置之后,所述字符串识别部还用于进行各页的所述被指定的区域的字符串识别,所述图像保存控制部进行所述文件分割处理。
CN201880001969.7A 2017-07-03 2018-05-17 原稿读取装置 Active CN109479081B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017130707 2017-07-03
JP2017-130707 2017-07-03
PCT/JP2018/019076 WO2019008919A1 (ja) 2017-07-03 2018-05-17 原稿読取装置

Publications (2)

Publication Number Publication Date
CN109479081A true CN109479081A (zh) 2019-03-15
CN109479081B CN109479081B (zh) 2019-12-17

Family

ID=64950818

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880001969.7A Active CN109479081B (zh) 2017-07-03 2018-05-17 原稿读取装置

Country Status (4)

Country Link
US (1) US10397416B2 (zh)
JP (1) JP6638830B2 (zh)
CN (1) CN109479081B (zh)
WO (1) WO2019008919A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115297215A (zh) * 2021-08-05 2022-11-04 京瓷办公信息系统株式会社 图像处理装置以及图像形成装置
CN115297215B (zh) * 2021-08-05 2024-05-14 京瓷办公信息系统株式会社 图像处理装置以及图像形成装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6983675B2 (ja) * 2018-01-23 2021-12-17 キヤノン株式会社 スキャン画像に関連する情報を設定するための装置、方法、プログラム、およびシステム
US11544664B2 (en) * 2018-03-21 2023-01-03 Walmart Apollo, Llc System and methods for tracking an item in a distributed environment
US11873485B2 (en) 2021-01-26 2024-01-16 California Institute Of Technology Allosteric conditional guide RNAs for cell-selective regulation of CRISPR/Cas

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1722134A (zh) * 2004-07-12 2006-01-18 三星电子株式会社 以运动图像连续拍摄文档来产生电子文档的方法和设备
JP2008165386A (ja) * 2006-12-27 2008-07-17 Canon It Solutions Inc 文書管理装置、文書管理方法、文書管理プログラム
JP2008301282A (ja) * 2007-05-31 2008-12-11 Canon Inc 画像処理装置およびその制御方法
JP2010109420A (ja) * 2008-10-28 2010-05-13 Sharp Corp 画像形成装置
CN103098074A (zh) * 2010-03-10 2013-05-08 微软公司 光学字符识别中的文档页分割
CN103186911A (zh) * 2011-12-28 2013-07-03 北大方正集团有限公司 一种处理扫描书数据的方法及装置
JP5582151B2 (ja) * 2012-01-12 2014-09-03 コニカミノルタ株式会社 画像形成装置及び同装置における文書データのプレビュー表示方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5860075A (en) * 1993-06-30 1999-01-12 Matsushita Electric Industrial Co., Ltd. Document data filing apparatus for generating visual attribute values of document data to be filed
JPH11282849A (ja) * 1998-03-27 1999-10-15 Canon Inc 画像検査装置及び方法
JP5040201B2 (ja) * 2006-07-18 2012-10-03 富士ゼロックス株式会社 文書ファイル処理プログラム、方法、及び装置
US20140115436A1 (en) * 2012-10-22 2014-04-24 Apple Inc. Annotation migration
JP5835381B2 (ja) * 2014-03-17 2015-12-24 富士ゼロックス株式会社 画像処理装置及びプログラム
JP6545573B2 (ja) * 2015-08-25 2019-07-17 シャープ株式会社 画像処理装置、画像形成装置及び章分け処理方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1722134A (zh) * 2004-07-12 2006-01-18 三星电子株式会社 以运动图像连续拍摄文档来产生电子文档的方法和设备
JP2008165386A (ja) * 2006-12-27 2008-07-17 Canon It Solutions Inc 文書管理装置、文書管理方法、文書管理プログラム
JP2008301282A (ja) * 2007-05-31 2008-12-11 Canon Inc 画像処理装置およびその制御方法
JP2010109420A (ja) * 2008-10-28 2010-05-13 Sharp Corp 画像形成装置
CN103098074A (zh) * 2010-03-10 2013-05-08 微软公司 光学字符识别中的文档页分割
CN103186911A (zh) * 2011-12-28 2013-07-03 北大方正集团有限公司 一种处理扫描书数据的方法及装置
JP5582151B2 (ja) * 2012-01-12 2014-09-03 コニカミノルタ株式会社 画像形成装置及び同装置における文書データのプレビュー表示方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115297215A (zh) * 2021-08-05 2022-11-04 京瓷办公信息系统株式会社 图像处理装置以及图像形成装置
CN115297215B (zh) * 2021-08-05 2024-05-14 京瓷办公信息系统株式会社 图像处理装置以及图像形成装置

Also Published As

Publication number Publication date
US20190141203A1 (en) 2019-05-09
JP6638830B2 (ja) 2020-01-29
WO2019008919A1 (ja) 2019-01-10
US10397416B2 (en) 2019-08-27
JPWO2019008919A1 (ja) 2019-07-04
CN109479081B (zh) 2019-12-17

Similar Documents

Publication Publication Date Title
EP2879366B1 (en) Document reading device and image forming apparatus
CN109479081A (zh) 原稿读取装置
JP2013041539A (ja) 情報抽出装置
JP6991072B2 (ja) 画像読取装置、画像形成装置および制御方法
JP6579077B2 (ja) 画像読取装置及び画像形成装置
US10356261B2 (en) Image-forming apparatus with document reading unit that automatically feeds and reads documents
JP3473996B2 (ja) 画像形成装置
JP2008011303A (ja) 画像処理装置
JP6138079B2 (ja) 画像処理装置及び画像処理方法
JP5168084B2 (ja) 画像処理装置、プログラムおよび画像処理方法
US20200162630A1 (en) Image reading device, image forming device, and control method
JP2021142715A (ja) 画像形成装置
JP3629969B2 (ja) 画像認識装置
JP6354705B2 (ja) 画像処理装置
JP4801616B2 (ja) 画像処理装置、プログラムおよび画像加工方法
JP4859385B2 (ja) 画像形成装置、画像形成システム、画像形成方法
US20170315758A1 (en) Information display system
US11212419B1 (en) Image reading system, image forming system, and image reading method that perform image processing for each area
JP2014030080A (ja) 画像処理装置及び画像処理方法
JP5460136B2 (ja) 画像処理装置及びその制御方法、並びにプログラム
JP2013030916A (ja) 画像処理装置及びこれを備えた画像形成装置
JP6794716B2 (ja) 表示制御装置及び表示制御プログラム
JP2009171165A (ja) 原稿読取装置
JP2004207819A (ja) 画像処理装置および画像形成装置
JP5879286B2 (ja) 検索システム利用装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant