CN105320933A - 电子文档生成系统以及电子文档生成装置 - Google Patents

电子文档生成系统以及电子文档生成装置 Download PDF

Info

Publication number
CN105320933A
CN105320933A CN201510404336.9A CN201510404336A CN105320933A CN 105320933 A CN105320933 A CN 105320933A CN 201510404336 A CN201510404336 A CN 201510404336A CN 105320933 A CN105320933 A CN 105320933A
Authority
CN
China
Prior art keywords
character
region
electronic document
orientation
character size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510404336.9A
Other languages
English (en)
Other versions
CN105320933B (zh
Inventor
坂匡晃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Konica Minolta Opto Inc
Original Assignee
Konica Minolta Opto Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Opto Inc filed Critical Konica Minolta Opto Inc
Publication of CN105320933A publication Critical patent/CN105320933A/zh
Application granted granted Critical
Publication of CN105320933B publication Critical patent/CN105320933B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3872Repositioning or masking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • G06V10/95Hardware or software architectures specially adapted for image or video understanding structured as a network, e.g. client-server architectures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/147Determination of region of interest
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • H04N1/00244Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server with a server, e.g. an internet server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3871Composing, repositioning or otherwise geometrically modifying originals the composed originals being of different kinds, e.g. low- and high-resolution originals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Character Input (AREA)
  • Document Processing Apparatus (AREA)
  • Character Discrimination (AREA)

Abstract

本发明涉及电子文档生成系统以及电子文档生成装置,提供在从某装置对于其它的装置(云服务器等)委托OCR处理,使用其处理结果来生成电子文档的技术中,能够将OCR处理结果涉及的字符串配置在其排列方向上比较正确的位置的技术。外部终端(通信装置)从该扫描图像提取包括行区域(扫描图像内的1行的字符串的全部或者一部分的范围的区域)的处理对象区域(步骤S12)。处理对象区域的图像数据与OCR处理指示一起被发送至云服务器,OCR处理结果被回信(步骤S14、S15)。另外,外部终端基于行区域的大小决定处理对象区域内的字符的字符宽度(排列方向字符尺寸)(步骤S16)。外部终端基于排列方向字符尺寸将从云服务器接受到的OCR处理结果的字符串配置在电子文档内(步骤S17)。

Description

电子文档生成系统以及电子文档生成装置
技术领域
本发明涉及生成电子文档的电子文档生成系统以及与此相关的技术。
背景技术
在MFP(多功能一体机(Multi-FunctionalPeripheral))等的图像形成装置中,存在扫描原稿来制作电子文档的技术。
在这样的技术中,除了直接读入原稿的扫描图像来生成电子文档的技术以外,还存在生成带文本数据电子文档(下述)的技术(参照专利文献1等)。具体而言,对于原稿的扫描图像(特别是表示字符的图像)实施了光学字符识别处理(以下,也称为OCR(OpticalCharacterRecognition)处理),该扫描图像内的字符的文本数据被自动识别,该文本数据以非显示状态重叠地嵌入该扫描图像。这样一来,例如,生成了被称为带透明文本PDF(PortableDocumentFormat:可移植文档格式)(或者可检索的PDF)等的规定形式的电子文档(带文本数据电子文档)。
专利文献1:日本特开2012-73749号公报
然而,存在使用云服务器来提供各种应用程序软件的服务的技术。另外,也存在提供通用OCR处理服务作为这样的云服务(应用程序服务)的技术。但是,在通用OCR处理服务中,仅提供了基本功能(OCR处理),带文本数据电子文档未被生成。因此,带文本数据电子文档的最终生成处理需要在委托源装置侧进行。
在利用了通用OCR处理服务的情况下,例如,首先,从委托源装置(详细而言,在委托源装置执行中的某应用程序)向云服务器(详细而言,在云服务器执行中的其它应用程序)发送了扫描图像。然后,关于整个该扫描图像的OCR处理由云服务器执行,其处理结果从云服务器向委托源装置回信。该委托源装置将从云服务器接收到的OCR处理结果嵌入到原始的扫描图像,生成带文本数据电子文档(可检索的PDF(带透明文本PDF)等)。此外,通过利用通用OCR处理服务,能够利用与OCR处理的委托源装置(例如,图像形成装置(扫描图像的生成装置))不同的装置进行OCR处理,所以能够减少该委托源装置的处理负荷。
然而,在例如从委托源装置对于其它装置(云服务器)赋予关于扫描图像的OCR处理指示,使用其OCR处理结果,生成上述那样的带文本数据电子文档的情况下,可能产生扫描图像内的字符图像和文本数据偏移地配置这样的问题。例如,在OCR处理结果(文本数据)涉及的字符串和扫描图像内的字符串(作为字符图像的字符串)以其各字符的大小相互不同的状态配置于相同的页内的情况下,OCR处理结果涉及的字符串在其排列方向上配置在与作为扫描图像内的字符图像的字符串大不相同的位置。详细而言,即使两字符串的最初的位置一致,尤其在字符串的排列方向后端侧其位置偏移也变得显著。
这样的问题由于仅OCR处理结果(字符串识别结果)从云服务器向委托源装置返回,识别出的字符的尺寸未被返回等而产生。尤其在云服务器侧的应用程序中的处理结果的输出形态几乎固定的情况(委托源的电子文档生成应用程序无法自由地决定该输出形态的情况等)下这样的问题可能显著地产生。
发明内容
因此,该发明的课题在于,提供在从某装置对于其它的装置委托OCR处理,使用其处理结果生成电子文档的技术中,能够将OCR处理结果涉及的字符串配置在其排列方向上比较正确的位置的技术。
为了解决上述课题,第一方面的发明是电子文档生成系统,其特征在于,具备:第一装置,其根据原稿的扫描图像生成电子文档;以及第二装置,其基于来自上述第一装置的委托执行针对上述扫描图像的光学字符识别处理,并将该光学字符识别处理的处理结果送出到上述第一装置,上述第一装置具有:提取单元,其从上述扫描图像提取包括行区域的处理对象区域,其中,上述行区域是在上述扫描图像内沿某方向排列的1行字符串的全部或者一部分的范围的区域;检测单元,其检测上述行区域的大小;决定单元,其基于上述行区域的大小决定排列方向字符尺寸,其中,上述排列方向字符尺寸是上述处理对象区域内的字符的字符尺寸,且是上述1行的字符串的排列方向上的字符尺寸;指示送出单元,其将应该对于上述处理对象区域进行上述光学字符识别处理的主旨的指示和上述处理对象区域的图像数据向上述第二装置送出;接受单元,其从上述第二装置接受关于上述处理对象区域的上述光学字符识别处理的处理结果;以及生成单元,其基于由上述决定单元决定的上述排列方向字符尺寸将上述处理结果的字符串配置在上述电子文档内,生成上述电子文档。
第二方面的发明的特征在于,在第一方面的发明的电子文档生成系统中,上述决定单元基于上述行区域的上述排列方向上的长度除以上述行区域内的字符数得到的值,决定上述排列方向字符尺寸。
第三方面的发明的特征在于,在第二方面的发明的电子文档生成系统中,上述提取单元提取包括多行的字符串的区域作为上述处理对象区域,上述决定单元基于是关于上述多行的字符串中的任意1行的字符串的区域的上述行区域的上述排列方向上的长度除以上述行区域内的字符数得到的值,决定上述排列方向字符尺寸。
第四方面的发明的特征在于,在第二方面的发明的电子文档生成系统中,上述提取单元提取单一行的字符串的区域作为上述处理对象区域,上述决定单元基于是关于上述单一行的字符串的区域的上述行区域的上述排列方向上的长度除以上述行区域内的字符数得到的值,决定上述排列方向字符尺寸。
第五方面的发明的特征在于,在第二方面的发明的电子文档生成系统中,上述提取单元提取上述1行的字符串的上述排列方向上的全范围中的一部分的范围的区域作为上述处理对象区域,上述决定单元基于上述一部分的范围的区域的上述排列方向上的长度除以上述一部分的范围的区域内的字符数得到的值,决定上述排列方向字符尺寸。
第六方面的发明的特征在于,在第一方面的发明的电子文档生成系统中,上述决定单元基于上述行区域的正交方向上的长度决定正交方向字符尺寸,并且,基于上述正交方向字符尺寸决定上述排列方向字符尺寸,其中,上述正交方向是与上述1行的字符串的排列方向正交的方向,上述正交方向字符尺寸是上述处理对象区域内的字符的字符尺寸,且是上述正交方向的字符尺寸。
第七方面的发明的特征在于,在第六方面的发明的电子文档生成系统中,上述提取单元提取包括多行的字符串的区域作为上述处理对象区域,上述决定单元基于上述处理对象区域的上述正交方向上的长度和上述处理对象区域所包含的字符串的行数检测上述行区域的上述正交方向上的长度,基于上述行区域的上述正交方向上的该长度决定上述正交方向字符尺寸,并且,基于该正交方向字符尺寸决定上述排列方向字符尺寸。
第八方面的发明的特征在于,在第六方面的发明的电子文档生成系统中,上述提取单元提取单一行的字符串的区域作为上述处理对象区域,上述决定单元基于上述单一行的字符串的区域的上述正交方向上的长度计算上述正交方向字符尺寸,并且,基于该正交方向字符尺寸决定上述排列方向字符尺寸。
第九方面的发明的特征在于,在第六方面的发明的电子文档生成系统中,上述提取单元提取上述1行的字符串的上述排列方向上的全部范围中的一部分的范围的区域作为上述处理对象区域,上述决定单元基于上述一部分的范围的区域的上述正交方向上的长度计算上述正交方向字符尺寸,并且,基于该正交方向字符尺寸决定上述排列方向字符尺寸。
第十方面的发明的特征在于,在第一方面的发明的电子文档生成系统中,上述决定单元基于上述行区域的上述排列方向上的长度除以上述行区域内的字符数得到的值,决定关于上述处理对象区域的上述排列方向字符尺寸,并且,基于上述行区域的正交方向上的长度决定正交方向字符尺寸,其中,上述正交方向是与上述1行的字符串的排列方向正交的方向,上述正交方向字符尺寸是上述处理对象区域内的字符的字符尺寸,且是上述正交方向的字符尺寸,上述生成单元基于由上述决定单元决定的上述排列方向字符尺寸和上述正交方向字符尺寸将上述处理结果的字符串配置在上述电子文档内,来生成上述电子文档。
第十一方面的发明的特征在于,在第一方面至第十方面中的任意一个发明的电子文档生成系统中,上述检测单元也检测上述扫描图像内的上述处理对象区域的位置,上述生成单元也基于上述处理对象区域的上述位置将上述处理结果的字符串配置在上述电子文档内。
第十二方面的发明的特征在于,在第一方面至第十一方面中的任意一个发明的电子文档生成系统中,上述第一装置是图像形成装置,上述第二装置是云服务器。
第十三方面的发明的特征在于,在第一方面至第十一方面中的任意一个发明的电子文档生成系统中,上述第一装置是图像形成装置,上述第二装置是通信终端。
第十四方面的发明的特征在于,在第一方面至第十一方面中的任意一个发明的电子文档生成系统中,上述第一装置是通信终端,上述第二装置是云服务器。
第十五方面的发明是根据原稿的扫描图像生成电子文档的电子文档生成装置,其特征在于,具备:提取单元,其从上述扫描图像提取包括行区域的处理对象区域,其中,上述行区域是在上述扫描图像内沿某方向排列的1行字符串的全部或者一部分的范围的区域;检测单元,其检测上述行区域的大小;决定单元,其基于上述行区域的大小决定排列方向字符尺寸,其中,上述排列方向字符尺寸是上述处理对象区域内的字符的字符尺寸,且是上述1行的字符串的排列方向上的字符尺寸;指示送出单元,其将应该对于上述处理对象区域进行光学字符识别处理的主旨的指示和上述处理对象区域的图像数据向外部装置送出;接受单元,其从上述外部装置接受对于上述处理对象区域由上述外部装置执行的上述光学字符识别处理的处理结果;以及生成单元,其基于由上述决定单元决定的上述排列方向字符尺寸将上述处理结果的字符串配置在上述电子文档内,生成上述电子文档。
第十六方面的发明的特征在于,在第十五方面的发明的电子文档生成装置中,上述决定单元基于上述行区域的上述排列方向上的长度除以上述行区域内的字符数得到的值,决定上述排列方向字符尺寸。
第十七方面的发明的特征在于,在第十六方面的发明的电子文档生成装置中,上述提取单元提取包括多行的字符串的区域作为上述处理对象区域,上述决定单元基于是关于上述多行的字符串中的任意1行的字符串的区域的上述行区域的上述排列方向上的长度除以上述行区域内的字符数得到的值,决定上述排列方向字符尺寸。
第十八方面的发明的特征在于,在第十六方面的发明的电子文档生成装置中,上述提取单元提取单一行的字符串的区域作为上述处理对象区域,上述决定单元基于是关于上述单一行的字符串的区域的上述行区域的上述排列方向上的长度除以上述行区域内的字符数得到的值,决定上述排列方向字符尺寸。
第十九方面的发明的特征在于,在第十六方面的发明的电子文档生成装置中,上述提取单元提取上述1行的字符串的上述排列方向上的全部范围中的一部分的范围的区域作为上述处理对象区域,上述决定单元基于上述一部分的范围的区域的上述排列方向上的长度除以上述一部分的范围的区域内的字符数得到的值,决定上述排列方向字符尺寸。
第二十方面发明的特征在于,在第十五方面的发明的电子文档生成装置中,上述决定单元基于上述行区域的正交方向上的长度决定正交方向字符尺寸,并且,基于上述正交方向字符尺寸决定上述排列方向字符尺寸,其中,上述正交方向是与上述1行的字符串的排列方向正交的方向,上述正交方向字符尺寸是上述处理对象区域内的字符的字符尺寸,且是上述正交方向的字符尺寸。
第二十一方面的发明的特征在于,在第二十方面的发明的电子文档生成装置中,上述提取单元提取包括多行的字符串的区域作为上述处理对象区域,上述决定单元基于上述处理对象区域的上述正交方向上的长度和上述处理对象区域所包含的字符串的行数计算上述行区域的上述正交方向上的长度,基于上述行区域的上述正交方向上的该长度决定上述正交方向字符尺寸,并且,基于该正交方向字符尺寸决定上述排列方向字符尺寸。
第二十二方面的发明的特征在于,在第二十方面的发明的电子文档生成装置中,上述提取单元提取单一行的字符串的区域作为上述处理对象区域,上述决定单元基于上述单一行的字符串的区域的上述正交方向上的长度计算上述正交方向字符尺寸,并且,基于该正交方向字符尺寸决定上述排列方向字符尺寸。
第二十三方面的发明的特征在于,在第二十方面的发明的电子文档生成装置中,上述提取单元提取上述1行的字符串的上述排列方向上的全部范围中的一部分的范围的区域作为上述处理对象区域,上述决定单元基于上述一部分的范围的区域的上述正交方向上的长度计算上述正交方向字符尺寸,并且,基于该正交方向字符尺寸决定上述排列方向字符尺寸。
第二十四方面的发明的特征在于,在第十五方面的发明的电子文档生成装置中,上述决定单元基于上述行区域的上述排列方向上的长度除以上述行区域内的字符数得到的值,决定关于上述处理对象区域的上述排列方向字符尺寸,并且,基于上述行区域的正交方向上的长度决定正交方向字符尺寸,其中,上述正交方向是与上述1行的字符串的排列方向正交的方向,上述正交方向字符尺寸是上述处理对象区域内的字符的字符尺寸,且是上述正交方向的字符尺寸,上述生成单元基于由上述决定单元决定的上述排列方向字符尺寸和上述正交方向字符尺寸将上述处理结果的字符串配置在上述电子文档内,生成上述电子文档。
第二十五方面的发明的特征在于,在第十五方面至第二十四方面中的任意一个发明的电子文档生成装置中,上述检测单元也检测在上述扫描图像内的上述处理对象区域的位置,上述生成单元也基于上述处理对象区域的上述位置将上述处理结果的字符串配置在上述电子文档内,生成上述电子文档。
第二十六方面的发明的特征在于,在第十五方面至第二十五方面中的任意一个发明的电子文档生成装置中,上述电子文档生成装置是图像形成装置。
第二十七方面的发明的特征在于,在第十五方面至第二十五方面中的任意一个发明的电子文档生成装置中,上述电子文档生成装置是与生成上述扫描图像的图像形成装置不同的通信装置,也是与上述外部装置不同的通信装置。
第二十八方面的发明是根据原稿的扫描图像生成电子文档的电子文档生成装置,其特征在于,具备:提取单元,其从上述扫描图像提取包括多行的字符串的处理对象区域;检测单元,其检测上述处理对象区域的大小;决定单元,其基于上述处理对象区域的大小决定排列方向字符尺寸,其中,上述排列方向字符尺寸是上述处理对象区域内的字符的字符尺寸,且是上述处理对象区域内的字符串的排列方向上的字符尺寸;指示送出单元,其将应该对于上述处理对象区域进行光学字符识别处理的主旨的指示和上述处理对象区域的图像数据向外部装置送出,接受单元,其从上述外部装置接受对于上述处理对象区域由上述外部装置执行的上述光学字符识别处理的处理结果;以及生成单元,其基于由上述决定单元决定的上述排列方向字符尺寸将上述处理结果的字符串配置在上述电子文档内,生成上述电子文档,上述决定单元基于上述处理对象区域的正交方向上的长度和上述处理对象区域所包含的字符串的行数决定正交方向字符尺寸,并且,基于上述正交方向字符尺寸决定上述排列方向字符尺寸,其中,上述正交方向是与上述排列方向正交的方向,上述正交方向字符尺寸是上述处理对象区域内的字符的字符尺寸,且是正交方向的字符尺寸。
根据本发明,能够在从某装置对于其它的装置委托光学字符识别处理(OCR处理),并使用该处理结果来生成电子文档时,将OCR处理结果涉及的字符串配置在其排列方向上比较正确的位置。
附图说明
图1是表示图像形成系统(电子文档生成系统)的图。
图2是表示图像形成装置的功能模块的图。
图3是表示外部终端的概略结构的功能框图。
图4是表示电子文档生成系统中的动作的概略的图。
图5是表示外部终端的动作的流程图。
图6是表示扫描图像的图。
图7是表示提取出3个部分区域(处理对象区域)的情况的图。
图8是表示各部分区域的位置信息等的图。
图9是对处理对象区域的提取处理等进行说明的图。
图10是表示通过OCR处理生成的文本数据等的图。
图11是表示第一实施方式的字符配置结果的图。
图12是表示比较例的字符配置结果的图。
图13是表示提取出2个部分区域的情况的图(第四实施方式)。
图14是表示部分区域内的行区域的图。
图15是表示其它的扫描图像的图。
图16是表示提取出4个部分区域(处理对象区域)的情况的图。
图17是表示第五实施方式的字符配置结果的图。
图18是表示其它的比较例的字符配置结果的图。
图19是表示变形例的系统构成的图。
图20是表示其它的变形例的系统构成的图。
具体实施方式
以下,基于附图对本发明的实施方式进行说明。
<1.第一实施方式>
<1-1.构成概要>
图1是表示本发明的图像形成系统1的图。如图1所示,图像形成系统1具备图像形成装置10、外部终端50、以及云服务器90。
图像形成装置10、外部终端50、以及云服务器90经由网络(通信网络)108相互连接。网络108由LAN(LocalAreaNetwork:局域网)以及因特网等构成。另外,针对网络108的连接方式既可以是有线连接,或者也可以是无线连接。例如,图像形成装置10以及云服务器90对于网络108有线连接,外部终端50对于网络108无线连接。
云服务器90是与图像形成装置10和外部终端50均不同的外部装置(外部服务器)。在云服务器90安装有应用程序120(这里是通用OCR(OpticalCharacterRecognition:光学字符识别)应用程序)。云服务器90是使用应用程序120来提供通用OCR处理服务的服务器。但是,该云服务器90(应用程序120)不提供可检索的PDF(PortableDocumentFormat)的生成处理服务。可检索的PDF如后述那样通过外部终端50以及云服务器90等协作来生成。
在该图像形成系统1中,原稿的扫描图像200(参照图4等)由图像形成装置10生成,扫描图像200从图像形成装置10发送至外部终端50。外部终端50根据从图像形成装置10接收到的扫描图像200,生成电子文档500(参照图4等)。该电子文档500的生成动作通过执行安装于外部终端50的电子文档生成应用程序110(参照图4)等而实现。
在电子文档生成应用程序110中,从扫描图像200提取出多个部分区域230。然后,利用由云服务器90的应用程序120提供的OCR处理服务,来进行了针对该各部分区域230的OCR处理。各部分区域230是OCR处理的处理对象的区域,也称为处理对象区域。另外,服务器90中的OCR处理从外部终端50按照每个部分区域230进行委托。换言之,该各部分区域230分别是构成服务器中的OCR处理的委托单位(处理单位)的区域,也称为处理单位区域。
电子文档生成应用程序110从通用应用程序120接受针对各部分区域230的各处理结果(文本数据),基于该各处理结果生成电子文档500。该电子文档500作为带文本数据电子文档(这里,可检索的PDF)而被生成。
此外,图像形成系统1是生成电子文档的系统,所以也表现为电子文档生成系统等。相同地,外部终端50也表现为电子文档生成装置。
<1-2.图像形成装置的构成>
图2是表示图像形成装置10的功能模块的图。这里,例示MFP(多功能一体机(Multi-FunctionalPeripheral))作为图像形成装置10。在图2中,示出了MFP10的功能模块。
MFP10是具备扫描功能、复印功能、传真功能以及框储存功能等的装置(也称为复合机)。具体而言,如图2的功能框图所示,MFP10具备图像读取部2、打印输出部3、通信部4、储存部5、操作部6以及控制器9等,通过使这些各部复合动作,从而实现各种功能。
图像读取部2是光学读取(即,扫描)载置于MFP10的规定的位置的原稿,并生成该原稿的图像数据(也称为原稿图像或扫描图像)的处理部。该图像读取部2也称为扫描部。
打印输出部3是基于关于打印对象的数据向纸等的各种介质打印输出图像的输出部。
通信部4是能够进行经由公用线路等的传真通信的处理部。并且,通信部4也能够进行经由网络108的网络通信。在该网络通信中,例如,利用了TCP/IP(TransmissionControlProtocol/InternetProtocol:传输控制协议/互联网协议)等各种协议。通过利用该网络通信,MFP10能够在与所希望的对象(例如,外部终端50)之间授受各种数据。通信部4具有发送各种数据的发送部4a和接收各种数据的接收部4b。
储存部5由硬盘驱动器(HDD)等的存储装置构成。
操作部6具备接受针对MFP10的操作输入的操作输入部6a、和进行各种信息的显示输出的显示部6b。
在该MFP10中,设置有大致板状的操作面板部6c(参照图1)。另外,操作面板部6c在其正面侧具有触摸面板25(参照图1)。触摸面板25也作为操作输入部6a的一部分发挥作用,并且,也作为显示部6b的一部分发挥作用。触摸面板25构成为在液晶显示面板嵌入有各种传感器等,能够显示各种信息,并且接受来自操作者的各种操作输入。
例如,在触摸面板25中,显示有各种操作画面(菜单画面等)(包括按钮图像等)。通过操作者按下虚拟配置于触摸面板25的操作画面内的按钮,能够设定MFP10的各种动作内容,并且赋予动作指示。
控制器9是内置于MFP10,且统一控制MFP10的控制装置。控制器9构成为具备CPU以及各种半导体存储器(RAM以及ROM)等的计算机系统。控制器9通过在CPU中执行储存于ROM(例如,EEPROM)内的规定的软件程序(以下,也仅称为程序),来实现各种处理部。此外,该程序(详细而言,程序模块组)也可以安装于USB存储器等的便携式的记录介质,或者经由网络108等安装于MFP10。
具体而言,如图2所示,控制器9通过该程序的执行,实现包括通信控制部11、输入控制部12、显示控制部13、以及区域辨别部15的各种处理部。
通信控制部11是与通信部4等协作控制与其他的装置(外部终端50等)之间的通信动作的处理部。例如,通信控制部11将扫描图像等发送至外部终端50。
输入控制部12是控制针对操作输入部6a(触摸面板25等)的操作输入动作的控制部。例如,输入控制部12控制接受针对显示于触摸面板25的操作画面的操作输入的动作。
显示控制部13是控制显示部6b(触摸面板25等)中的显示动作的处理部。显示控制部13例如使用于操作MFP10的操作画面显示于触摸面板25。
区域辨别部15是辨别扫描图像200(参照图4)的区域(区域种类)的处理部。例如,区域辨别部15区别扫描图像200内的字符区域210和非字符区域(图形区域等)220来进行辨别。
<1-3.外部终端的构成>
接下来,对外部终端50的构成进行说明。
外部终端50是能够进行与MFP10以及云服务器90之间的网络通信的信息输入输出终端装置(也称为通信装置)。这里,例示平板型终端作为外部终端50。但是,并不局限于此,外部终端50也可以是智能手机或者个人计算机等。另外,外部终端既可以是便携式的装置(便携信息终端等)(便携终端),或者,也可以是固定型的装置。
图3是表示外部终端50的概略结构的功能框图。
如图3的功能框图所示,外部终端50具备通信部54、储存部55、操作部56以及控制器59等,通过使这些各部复合动作,来实现各种功能。
通信部54能够进行经由网络108的网络通信。在该网络通信中,例如利用了TCP/IP(TransmissionControlProtocol/InternetProtocol)等各种协议。通过利用该网络通信,外部终端50能够在与所希望的对象(MFP10以及云服务器90等)之间授受各种数据。通信部54具有发送各种数据的发送部54a和接收各种数据的接收部54b。例如,接收部54b从图像形成装置10接收扫描图像200,发送部54a将扫描图像200中的多个部分区域230(参照图4)的图像数据发送至云服务器90。另外,接收部54b从云服务器90接收关于多个部分区域230的OCR处理结果等。
储存部55由非易失性的半导体存储器等的存储装置构成,储存各种信息。
操作部56具备接受针对外部终端50的操作输入的操作输入部56a、和进行各种信息的显示输出的显示部56b。在该外部终端50中,设置有在液晶显示面板嵌入有各种传感器等而构成的触摸面板75(参照图1)。具体而言,如图1所示,在大致板状的外部终端50的正面侧中,遍及除去其周边部(框部)的几乎整面设置有触摸面板75。该触摸面板75作为用户界面部发挥作用。换言之,触摸面板75也作为操作输入部56a的一部分发挥作用,并且,也作为显示部56b的一部分发挥作用。
图3的控制器59是内置于外部终端50,且统一控制外部终端50的控制装置。控制器59构成为具备CPU以及各种的半导体存储器(RAM以及ROM)等的计算机系统。控制器59通过在CPU中执行储存于存储部(半导体存储器等)内的规定的软件程序(以下,也仅称为程序),来实现各种处理部。此外,该程序(详细而言,程序模块组)也可以安装于USB存储器等的便携式的记录介质,或者经由网络108等安装于外部终端50。
在外部终端50安装有控制与图像形成装置10的协作处理的应用程序(也仅称为应用程序)110。该应用程序110由外部终端50执行,从而外部终端50从图像形成装置10接收由图像形成装置10生成的扫描图像,并且,执行利用该扫描图像来生成电子文档的处理。
具体而言,控制器59通过该应用程序110等的执行,实现包括通信控制部61、输入控制部62、显示控制部63、获取部64、提取部65、检测部66、指示送出部67、接受部68、决定部69、以及生成部70的各种处理部。
通信控制部61是与通信部54等协作控制与MFP10以及云服务器90等的通信动作的处理部。
输入控制部62是控制针对操作输入部56a(触摸面板75等)的操作输入动作的控制部。例如,输入控制部62控制接受针对显示于触摸面板75的操作画面的触摸操作输入的动作。
显示控制部63是控制显示部56b(触摸面板75等)中的显示动作的处理部。显示控制部63例如将用于进行与MFP10的协作处理的操作画面显示在触摸面板75。
此外,输入控制部62以及显示控制部63也统称为用户界面控制部。
获取部64是获取由MFP10生成的扫描图像200(参照图4)等的处理部。获取部64与通信部54以及通信控制部61等协作来从MFP10接收获取该扫描图像200等。
提取部65是从扫描图像200的字符区域提取一个或者多个部分区域230(参照图4)的处理部。各部分区域230被作为包括是1行的字符串的区域的字符串区域的区域提取。该字符串区域是沿行方向伸延的字符串区域,也称为“行区域”。在该实施方式中,各部分区域230被作为包括是单一行的字符串的区域的字符串区域(也称为单一的行区域)的区域提取。此外,并不局限于此,如后述那样,各部分区域230也可以被作为包括多行的字符串的区域提取。换言之,各部分区域230也可以被作为包括多个行区域(多行的字符串区域)的区域提取。
检测部66是分别检测扫描图像200内的多个部分区域230的位置以及大小的处理部。另外,检测部66也是执行检测各部分区域230内所包含的1行字符串的区域(行区域)的大小的处理的处理部。此外,在各部分区域230分别构成为单一行的字符串的区域(单一的行区域)的情况下求出各部分区域230的大小的处理,也相当于求出该行区域的大小的处理。并且,检测部66也检测行区域(部分区域230)内的字符数。
决定部69是决定各部分区域(处理对象区域)230内的字符的字符尺寸(排列方向字符尺寸(下述)以及/或者正交方向字符尺寸(下述))的处理部。例如,决定部69如后述那样基于行区域的大小决定“排列方向字符尺寸”。
“排列方向字符尺寸”是(各部分区域(处理对象区域)230内的)字符的字符尺寸,且是排列方向(详细而言,各部分区域内的行区域上的字符串的排列方向)的字符尺寸。在横写的字符串的情况下,字符串的排列方向是左右方向(字符的宽度方向),“字符宽度”相当于排列方向字符尺寸(排列方向上的字符尺寸)。在纵写的字符串的情况下,字符串的排列方向是上下方向(字符的高度方向),“高度”(字符高度)相当于排列方向字符尺寸。
另外,“正交方向字符尺寸”是(各部分区域(处理对象区域)230内的)字符的字符尺寸,且是正交方向(详细而言,与各部分区域内的行区域中的字符串的排列方向正交的方向)的字符尺寸。在横写的字符串的情况下,“字符高度”相当于“正交方向字符尺寸”,在纵写的字符串的情况下,“字符宽度”相当于“正交方向字符尺寸”。
以下,主要以横写的字符串为前提进行说明。
指示送出部67是从应用程序110朝向其它的应用程序120(后述)送出规定的处理执行指示等的处理部。例如,指示送出部67朝向云服务器90送出应该对于扫描图像200中的多个部分区域230的各个进行OCR处理(光学字符识别处理)的主旨的指示。该指示与关于多个部分区域230的各个的图像数据一起被送出。
接受部68是从云服务器90(应用程序120)接受关于各部分区域230的各处理结果(OCR处理结果)的处理部。
生成部70是生成电子文档500(参照图4)的处理部。生成部70将关于多个部分区域230的各个的各OCR处理结果(文本信息(字符代码组))的字符串配置在扫描图像200中的该多个部分区域230的各个的检测位置,来生成电子文档500(可检索的PDF等)。特别是,如后述那样,各处理结果涉及的字符串基于由决定部69按照每个部分区域230决定的排列方向字符尺寸(字符宽度)配置于电子文档500内。
<1-4.动作>
在该实施方式中,外部终端50按照每一行从扫描图像提取字符串区域(行区域)作为OCR处理的处理对象区域(部分区域)并发送至云服务器90,从云服务器90接收关于各处理对象区域的OCR处理结果。然后,外部终端50生成嵌入了关于该各处理对象区域的OCR处理结果的电子文档500。此时,基于各行区域的宽度(1行的字符串的排列方向(宽度方向)的长度)等,决定了上述的排列方向字符尺寸(字符宽度),各OCR处理结果的字符串以反映该排列方向字符尺寸的方式配置于电子文档500。
以下,参照图4以及图5等对这样的方式进行说明。图4是表示电子文档生成系统1中的动作的概略的图,图5是表示外部终端50(更详细而言,电子文档生成应用程序110)的动作的流程图。以下,参照这些图对电子文档生成系统1的动作进行说明。
<扫描图像生成等>
首先,用户将扫描对象的原稿载置在MFP10的原稿台(例如,自动给纸装置(ADF:AutoDocumentFeeder)或者原稿载置用玻璃面等)。
之后,用户通过操作外部终端50来对外部终端50以及MFP10赋予电子文档500的生成指示。
具体而言,首先,在安装于外部终端50的应用程序(电子文档生成应用程序)110的操作画面(未图示)中,指定了应该执行扫描处理的装置,并且,指定了通过扫描处理最终生成的电子文档500的形式。这里,为指定了MFP10作为应该执行扫描处理的装置,指定了可检索的PDF(带透明文本PDF)作为该电子文档500的形式。然后,通过用户按下显示于电子文档生成应用程序110的操作画面内的执行开始按钮(电子文档500的生成处理的执行开始按钮),来对于外部终端50以及MFP10赋予电子文档(这里是可检索的PDF)500的生成指示。此外,可检索的PDF(带透明文本PDF)是具备具有字符图像的图像层和针对该字符图像的字符识别结果被以非显示状态嵌入的文本层的PDF形式的电子文档。
外部终端50接受该生成指示,并且,将该生成指示(详细而言,基于该生成指示的扫描图像生成指示等)转送到MFP10。
若MFP10从外部终端50接收该生成指示(扫描图像生成指示等)则开始扫描动作,生成载置于MFP10的原稿台(ADF等)的原稿的扫描图像200(参照图4的左上)。
并且,MFP10进行辨别扫描图像200内的各种区域的区域辨别处理。具体而言,MFP10的区域辨别部15辨别扫描图像200内的字符区域210和非字符区域(图形区域等)220,确定出扫描图像200中的字符区域210的范围(详细而言,该位置以及大小)和非字符区域220的范围。另外,区域辨别部15对于该字符区域210赋予表示该区域是“字符区域”的特定代码(例如“1”)。相同地,区域辨别部15对于非字符区域220赋予表示该区域是“非字符区域”的区域种类代码(例如“2”、“3”等)。更详细而言,例如,对于是非字符区域的“图形区域”赋予了“2”,对于是非字符区域的“照片区域”赋予了“3”。
然后,区域辨别部15基于这些信息生成属性指定数据300。属性指定数据300作为对于扫描图像200内的各像素位置分配有上述的区域种类代码的数据(按照扫描图像200的各像素赋予了区域种类代码的数据)而被生成。换言之,属性指定数据300作为包括关于扫描图像200中的字符区域210以及非字符区域220的各个的范围信息(详细而言,关于其位置以及大小的信息)及区域种类代码等的信息的数据而被生成。
而且,MFP10(通信部4以及通信控制部11等)将扫描图像(详细而言,其图像数据)200和属性指定数据300发送至外部终端50。
<OCR处理以及电子文档生成处理等>
之后,外部终端50通过执行电子文档生成应用程序110来执行图5所示的处理。
首先,在步骤S11中,外部终端50(详细而言,获取部64等)从MFP10接收并获取由MFP10生成的扫描图像200以及属性指定数据300。另外,外部终端50(详细而言,生成部70等)将读入了扫描图像200的PDF文档临时生成为电子文档500。在该PDF文档中还未嵌入OCR结果涉及的文本数据。
接着,在步骤S12中,外部终端50(提取部65等)基于在步骤S11中获取到的扫描图像200以及属性指定数据300,从该扫描图像200的字符区域210提取规定单位的部分区域230。在该实施方式中,提取部65提取字符区域210中的单一行的字符串涉及的区域作为规定单位的部分区域230。即,提取部65从字符区域210提取1行单位的部分区域230。换言之,提取出将字符区域210中的单一行的字符串涉及的区域作为单位划分的多个部分区域230(这里,其中最初的部分区域230)。
具体而言,根据扫描图像200和属性指定数据300,确定出扫描图像200中的字符区域210。然后,进行了针对字符区域210的图像处理,识别出字符区域210内的1行区域(沿横方向排列的1行的字符串的区域)。在图6中,例示了由3行构成的字符区域210(211),对于该字符区域210,首先,第一行的“ABCDEWirelessDigitalRadiography”的字符串涉及的区域(行区域)231被作为部分区域230而提取出(参照图7)。
另外,在步骤S13中,外部终端50(检测部66等)检测在步骤S12中提取出的部分区域230的(扫描图像200内的)位置(详细而言,其基准位置(X,Y)(前端位置等))以及大小(X方向尺寸(宽度W)以及Y方向尺寸(高度H))。另外,在步骤S13中,检测部66也检测各部分区域(行区域)230内的字符数(详细而言,各行区域所包含的字符的数)。检测出的各种信息(关于部分区域230的位置以及大小、及部分区域230内的字符数的信息)(参照图8)储存于储存部55。
在图8的上段示出了记录有这些各种信息(关于各部分区域230的识别编号、位置(以及大小)的信息、以及字符数)的情况。此外,这里,作为关于位置的信息,记录有关于部分区域230的4个信息,具体而言,部分区域230(矩形区域)的上边的Y方向位置(TOP)、下边的Y方向位置(BOTTOM)、左边的X方向位置(LEFT)、右边的X方向位置(RIGHT)。这4个信息例如能够转换为该矩形区域的代表位置(例如左上的点的位置(TOP,LEFT))和该矩形区域的大小(高度H以及宽度W)(参照图8的下段),也表现为是关于部分区域230的位置以及大小的信息。
上述的各部分区域230的提取处理以及各种检测处理等(步骤S12、S13)如以下那样进行。以下,参照图9等更详细地进行说明。此外,图9是用于对这样的处理等进行说明的图。
具体而言,首先,一边在Y方向(副扫描方向)(垂直方向)上移动一边反复进行按照水平线检测沿X方向(主扫描方向)(也称为水平方向或左右方向)延伸的每1线(水平线)(水平方向像素列)的黑像素的数量的动作,获取各水平线的黑像素数。
在配置于图9内的左侧的曲线图中,示出了示意性地表示Y方向的各位置中的黑像素数的曲线L0。此外,在该曲线图中,为了简单化,规定量以上的黑像素数一律以相同的像素数表示。因此,该曲线图具有方形波形状。
在字符存在的位置的水平线中,存在相对较多的黑像素。另一方面,在行与行之间的水平线(不存在字符的行间区域的水平线)中,黑像素几乎不存在。
利用这样的特质,提取部65将具有规定量以上的黑像素数的水平线存在的范围V(Y方向的范围)识别为1行字符串的范围(字符串的高度方向上的范围)。例如,从字符串“ABC...”的上端到下端的范围被识别为1行字符串的范围V。相同地,从字符串“Sys...”的上端到下端的范围等也被识别为1行字符串的范围V。
而且,在垂直方向(Y方向)上,遍及该范围V的矩形区域被识别为扫描图像200中的1行字符串的存在区域(行区域)。另外,在水平方向(X方向)上,包括从1行字符串中的前端的字符(这里是左端的字符)到最后尾的字符(右端的字符)的范围被识别为该1行字符串的存在区域。水平方向上的字符串的存在范围的识别处理使用后述的字符数的识别处理的处理结果进行即可。
此外,并不局限于此,在水平方向(X方向)上,例如,字符区域210的(该水平方向的)全范围(与扫描图像的全宽度相同的范围)也可以被识别为该1行字符串的存在区域。
这样被识别出的行区域(扫描图像200中的1行字符串的存在区域)被作为部分区域230提取(步骤S12)。例如,最初的1行字符串“ABCDEWirelessDigitalRadiography”(参照图7)的行区域(矩形区域)231被作为部分区域230提取。
另外,该部分区域(矩形区域)230的左上(或者左下等)的点的位置被识别为该矩形区域(1行字符串的存在区域)的位置(代表位置)(步骤S13)。例如,包括1行字符串“ABCDEWirelessDigitalRadiography”的矩形区域231的左上的点的位置被识别为该1行的字符串的存在区域的位置(前端位置)。
并且,该矩形区域230的大小(X方向尺寸(宽度W)以及Y方向尺寸(高度H))被识别且被检测。例如,矩形区域231的大小(宽度W1以及高度H1)基于左上的点P1的坐标值(LEFT,TOP)和左下的点P2的坐标值(RIGHT,BOTTOM)被识别出。更具体而言,宽度W1作为两点P1、P2的X坐标值的差值被计算出(W1=RIGHT-LEFT),高度H1作为两点P1、P2的Y坐标值的差值被计算出(H1=BOTTOM-TOP)。
另外,提取部65将不具有规定量以上的黑像素数的水平线存在的范围(Y方向的范围)识别为行间区域的范围(高度方向上的范围)。例如,字符串“ABC...”的下端与字符串“Sys...”的上端之间的空白区域被识别为第一行与第二行之间的行间区域的范围。通过这样的处理,提取部65将某行与其下一行的间隔(行间区域的Y方向的大小)计算为行间间隔y(相邻行间间隔)。此外,这里,不具有规定量以上的黑像素数的水平线立即被判定为是行间区域,但并不局限于此。例如,在“不具有规定量以上的黑像素数的水平线”连续存在规定的阈值TH1(例如,数根(相当于1mm~2mm程度的量))(参照图7)以上的情况下,也可以识别为该水平线(组)的存在区域是行间区域。由此,能够良好地区别与字符串的高度方向相邻的多个行区域并提取。
另外,在步骤S13中,检测部66也检测各部分区域230(行区域)内的字符数。
具体而言,一边在X方向上移动一边反复进行检测在与1行字符串的Y方向上的存在范围V对应的区域(沿X方向延伸的带状区域(矩形区域))中沿Y方向延伸的每1线(垂直线(纵线))的黑像素的数量的动作,获取按照各垂直线的黑像素数。由此,能够求出该带状区域内的各字符的存在区域(各字符的宽度方向上的存在范围w)。
在配置于图9内的第一行的字符串的上侧的曲线图中,示出示意性地表示第一行的字符串的X方向的各位置中的黑像素数的曲线L1。此外,在该曲线图中,为了简单化,规定量以上的黑像素数一律以相同的像素数表示。
在字符存在的位置的垂直线中,存在相对较多的黑像素。另一方面,在字符与字符之间的垂直线(字符不存在的字间区域的垂直线)中,黑像素几乎不存在。
利用这样的特质,提取部65将具有规定量以上的黑像素数的垂直线存在的范围(X方向的范围)识别为1字符的宽度的范围(宽度方向上的范围)w。例如,从字符“A”的左端到右端的范围被识别为1字符的范围w。接着“A”的各字符“B”、“C”、“D”、“E”...也相同。而且,在1行字符串的存在范围(行区域)中被识别为字符的存在区域的区域的数被检测为该行区域内的字符数(该行区域所包含的字符的数)。
此外,通过这样的动作,识别该带状区域(行区域)内的前端的字符的位置和最后尾的字符的位置,由此,包括行区域所包含的1行字符串中从前端的字符(这里,左端的字符)到最后尾的字符(右端的字符)的范围被识别为该1行字符串的存在区域。
另外,该字符与其右侧的字符的间隔(空隙),详细而言,该字符的右端与该字符的右侧的字符的左端的间隔(空隙)被作为字间间隔(相邻字符间间隔)x计算出。
如上所述,在步骤S13中,部分区域230的位置以及大小通过图像处理检测出,并且,部分区域230内的字符数也通过图像处理检测。
在接下来的步骤S14(图5)中,外部终端50(指示送出部67等)朝向云服务器90送出(发送)关于部分区域230的处理指示(应该进行OCR处理的主旨的指示)和关于该部分区域230的图像数据。换言之,OCR处理委托被从电子文档生成应用程序110向应用程序120送出。这里,发送了从扫描图像200提取出与该部分区域230对应的部分的图像(部分图像)的图像数据(也称为部分区域230的图像数据)作为关于部分区域230的图像数据。
此外,应用程序120(这里是进行OCR处理的OCR处理应用程序)是与电子文档生成应用程序110不同的应用程序。这里,应用程序120是安装于云服务器90并且由云服务器90执行的应用程序。
若由云服务器90执行中的应用程序120接受(接收)上述的处理指示和关于部分区域230的图像数据,则云服务器90(应用程序120)基于该处理指示以及图像数据执行OCR处理。
应用程序120对于从电子文档生成应用程序110接受到的关于该部分区域230的图像数据实施OCR处理,识别该图像数据所包含的字符串(例如“ABCDEWirelessDigitalRadiography”),来生成该字符串涉及的文本数据(字符代码组)250(参照图10)。然后,应用程序120将该字符串的文本数据(文本信息)250作为OCR处理的处理结果朝向电子文档生成应用程序110输出。换言之,该处理结果从云服务器90(应用程序120)朝向外部终端50(电子文档生成应用程序110)送出(发送)。
在步骤S15中,外部终端50(接受部68等)接受来自应用程序120的该处理结果(关于部分区域230的OCR处理结果)。此外,虽然该处理结果包含有文本数据250,但是未包含有位置信息以及字体信息。
另外,在步骤S16中,外部终端50(决定部69等)基于部分区域230的大小决定部分区域230内的字符的排列方向尺寸(排列方向字符尺寸(这里是字符宽度))。具体而言,基于左右方向(横方向)上的部分区域230(这里是单一行的字符串的区域)的长度W除以该部分区域230内的字符数N得到的值Q(=W/N)决定关于部分区域230的字符宽度。
例如,与值Q对应的字体尺寸(字体点(pt)尺寸)被决定为表示部分区域230的字符的字符宽度的值。更详细而言,基于预先规定有值Q与各字体点尺寸(点数)的对应关系的数据表(分别规定有与各字体点尺寸对应的值Q的范围的数据表)决定了与值Q对应的字体尺寸。
此外,并不局限于此,值Q本身(例如,mm(毫米)单位的值)也可以被决定为表示部分区域230的字符的字符宽度的值。
另外,值Q也可以考虑字符串所包含的空白区域(空白字符等)来调整并计算。更详细而言,也可以使原始的值Q乘以规定的调整系数(例如0.9)得到的值作为调整后的新的值Q使用。
然后,在步骤S17中,外部终端50(生成部70等)将关于部分区域230的处理结果亦即文本数据250(步骤S15中接收到的数据)配置在电子文档500内部分区域230的检测位置(步骤S13中的检测位置)(也参照图4)。该文本数据250在电子文档500(PDF文档)内所读入的扫描图像200中,配置于部分区域230的(扫描图像200中的)检测位置(步骤S13中的检测位置)。具体而言,生成部70将关于部分区域230的处理结果(OCR处理结果)涉及的文本数据以“非显示状态”嵌入到部分区域230的检测位置。换言之,关于部分区域230的OCR结果的文本数据在可检索的PDF的文本层(非显示)中配置于部分区域230的检测位置。由此,电子文档(可检索的PDF)500的内容被更新。
此时,部分区域230的各字符以具有在步骤S16中决定的字符宽度(排列方向字符尺寸)的状态被嵌入。
由此,如图11所示,OCR处理结果涉及的各字符相对于作为图像显示于扫描图像200内的各字符的位置配置于比较近的位置。图11是表示本实施方式的字符配置结果的图。在图11中,重叠显示有两种类的字符串(OCR处理前后的字符串)。OCR处理结果涉及的各字符(OCR处理后的字符串)用淡色表示,作为图像显示于扫描图像200内的各字符(OCR处理前的字符串)用通常颜色表示。
此外,图12是表示比较例的字符配置结果的图。在图12中,也与图11相同地,重叠显示有两种类的字符串(OCR处理前后的字符串)。图12示出在处理结果涉及的各字符的尺寸与作为图像显示于扫描图像200内的各字符的尺寸大不相同的情况下,处理结果涉及的各字符配置于与作为图像显示于扫描图像200内的各字符的位置大不相同的位置的状况。在图12中,特别是字符串的后端侧(右端侧)的字符在左右方向上从本来的位置偏移较大地配置。
与此相对,根据上述实施方式,能够避免或者抑制图12那样的状况的产生,如图11所示,将处理结果涉及的各字符相对于作为图像显示于扫描图像200内的各字符的位置配置在左右方向上比较近的位置。
另外,这里,视为OCR处理结果涉及的各字符分别具有标准的纵横比。而且,正交方向字符尺寸被决定为具有与排列方向字符尺寸相同的字体点尺寸(例如26pt(点))的尺寸。更详细而言,通过共通的一个字符尺寸(例如字体点尺寸(26pt(点)),排列方向字符尺寸与正交方向字符尺寸被共通地指定,基于该共通的指定字符尺寸(字体点尺寸),OCR处理结果的各字符配置于电子文档500。其结果,OCR处理结果涉及的各字符以具有该字体点尺寸的排列方向字符尺寸和该字体点尺寸的正交方向字符尺寸的状态配置于电子文档500内。
但是,本发明并不局限于此,也可以通过上述值Q乘以规定的系数(关于纵横比的转换系数),来使具有标准的纵横比的字符的正交方向字符尺寸(字符高度)基于排列方向字符尺寸(字符宽度)决定。
在步骤S18中,判定了扫描图像200的字符区域210的整面(这里是字符区域210的全部的行(全部的行区域))处理是否结束。详细而言,检测(判定)字符区域210中的下一“行”(这里是第二行)的存在与否。在检测到下一行(未处理的行)存在的主旨的情况下,判定出字符区域210的整面的处理还未结束的主旨。另一方面,在检测到下一行(未处理的行)不存在的主旨的情况下,判定出该处理结束的主旨。
在对于扫描图像200的整面判定为处理还未结束的情况下,经由步骤S19返回到步骤S12,对于下一部分区域230(这里是下一行的图像区域),步骤S12~S17的动作被相同地执行。
另一方面,在对于扫描图像200的整面判定为处理结束的情况下,结束图5的流程图的处理。通过对于扫描图像200的字符区域210内的多个部分区域230的各个执行了步骤S12~S17的处理,从而生成电子文档500(更详细而言,可检索的PDF)。此外,该电子文档500储存于外部终端50的储存部55。此外,如上述的处理的结果,如图4所示,扫描图像200的字符区域210配置于电子文档500内的对应区域510。另外,扫描图像200的非字符区域220不经过OCR处理,就照原样配置于电子文档500内的对应区域520。
如以上所述,在该第一实施方式中,外部终端50在该外部终端50上执行的电子文档生成应用程序110中,获取由图像形成装置10生成的扫描图像200等。电子文档生成应用程序110从扫描图像200提取多个部分区域230,并且获取该多个部分区域230的各个的(扫描图像200内的)位置信息并储存。然后,电子文档生成应用程序110将按照多个部分区域230的每个应该进行OCR处理的主旨的指示向应用程序120(这里是通用OCR处理应用程序)送出。应用程序120将OCR处理结果向电子文档生成应用程序110返回。电子文档生成应用程序110生成将返回来的OCR处理结果(多个部分区域230的各个的OCR结果)配置在扫描图像200中多个部分区域的各个的位置的电子文档(可检索的PDF)。
由此,在从某电子文档生成应用程序110对于其它的应用程序120委托OCR处理的情况下,也能够生成将OCR结果(文本数据)配置在扫描图像200内的适当的位置的电子文档。
另外,外部终端50从扫描图像200提取1行字符串的区域(行区域)作为处理对象区域,基于该行区域的大小决定处理对象区域内的字符的排列方向字符尺寸(横写时“字符宽度”)。而且,OCR处理结果涉及的字符串基于该排列方向字符尺寸配置于电子文档内(参照图11)。更详细而言,OCR处理结果涉及的字符串以该排列方向字符尺寸配置于电子文档内。因此,能够避免或者抑制上述的图12那样的状况的产生,将OCR处理结果涉及的各字符相对于作为图像显示于扫描图像200内的各字符的位置,配置在字符串的排列方向上比较近的位置。即,能够将OCR处理结果涉及的字符串配置在其排列方向上比较正确的位置。
另外,在上述实施方式中,利用了由MFP10的外部装置(云服务器90)提供的OCR处理服务。由此,能够利用与OCR处理的委托源装置(例如外部终端50)不同的装置(云服务器)进行OCR处理,所以能够减少该委托源装置的处理负荷。
并且,在上述实施方式中,利用与扫描图像200的生成装置亦即MFP10不同的装置(外部终端50)进行了电子文档500的生成处理(各部分区域230的提取处理以及位置检测处理等),所以能够减少MFP10的处理负荷。换言之,能够在MFP10与外部终端50之间适当地分散处理负荷。
此外,在上述实施方式中,属性指定数据300在MFP10中生成并被发送至外部终端50,但并不局限于此,属性指定数据300也可以在外部终端50中生成。
<2.第二实施方式>
第二实施方式是第一实施方式的变形例。以下,以与第一实施方式的不同点为中心进行说明。
在上述第一实施方式中,基于1行字符串的排列方向的长度,决定了排列方向字符尺寸(字符串的排列方向上的每1字符的大小(字符宽度))。
另一方面,在该第二实施方式中,基于与1行字符串的排列方向正交的方向(正交方向)上的该1行字符串的存在区域(“行区域”)的大小(这里是“高度”)决定了正交方向字符尺寸(“字符高度”),并且,基于该正交方向字符尺寸决定(推断)了排列方向字符尺寸(字符串的排列方向上的每1字符的大小(字符宽度))。简单来说,基于字符串的高度间接地决定了字符串中的各字符的字符宽度。
在该第二实施方式中,首先,不进行在图5的步骤S13中检测行区域内的字符数的处理的点与第一实施方式不同。
并且,在该第二实施方式中,在图5的步骤S16中,进行了与第一实施方式不同的处理。
具体而言,首先,基于部分区域230的高度(步骤S13中检测出的值)决定了关于处理对象区域(部分区域230)所包含的1行字符串的“正交方向字符尺寸”(与该1行字符串的排列方向正交的正交方向(这里是高度方向)的字符尺寸)。即,决定了关于该1行字符串的“字符高度”。然后,基于该正交方向字符尺寸(字符高度)决定(更详细而言,推断并决定)了处理对象区域内的字符的排列方向字符尺寸(这里是“字符宽度”)。
例如,在判定为部分区域231(图7)的高度H1是值h1(mm(毫米))时,判定为关于部分区域231所包含的1行字符串的“字符高度”是该值h1本身(或者值h1乘以规定的系数(例如0.9)得到的值等)。接着,与该“字符高度”对应的字体点尺寸(例如26点)被求出。然后,推断决定为部分区域230内的字符的“字符宽度”是相当于该字体点尺寸的大小。可以说,推断决定了与“字符高度”对应的标准的“字符宽度”。
此外,部分区域230内的字符的“字符宽度”既可以用字体点尺寸(例如26点)指定,或者,也可以用与该字体点尺寸对应的mm(毫米)单位的字符宽度指定。
然后,在步骤S17中,基于在步骤S16中决定的排列方向字符尺寸,OCR处理结果的字符串(文本信息)被嵌入。具体而言,构成处理对象区域内的字符串的各字符在其排列方向上以具有被决定为上述的排列方向字符尺寸(字符宽度)的大小的状态配置。这样一来,OCR处理结果涉及的字符串基于排列方向字符尺寸配置于电子文档500内,生成了该电子文档500。
此外,OCR处理结果涉及的各字符的“正交方向字符尺寸”被指定为是上述的值h1即可。而且,OCR处理结果的各字符也基于被指定的正交方向字符尺寸配置于电子文档500内即可。或者,OCR处理结果涉及的各字符的正交方向字符尺寸也可以被指定为具有与其排列方向字符尺寸相同的字体点尺寸的尺寸。换言之,OCR处理结果涉及的各字符也可以基于共通的指定字符尺寸(字体点尺寸)配置于电子文档500。
<3.第三实施方式>
在上述各实施方式中,决定了关于各部分区域(处理对象区域)230的排列方向字符尺寸(“字符宽度”等),并且,关于该各部分区域230的正交方向字符尺寸(“字符高度”等)与该排列方向字符尺寸相关联地被决定。更详细而言,作为OCR处理结果的各字符具有标准的纵横比的尺寸,决定了排列方向字符尺寸和正交方向字符尺寸。
然而,本发明并不局限于此。例如,关于该各部分区域230的正交方向字符尺寸(“字符高度”等)也可以与该排列方向字符尺寸(“字符宽度”等)独立地决定。
此外,在上述第二实施方式中,未进行步骤S13的处理中关于行区域的字符数的检测处理,但在该第三实施方式中,在步骤S13中,也进行了关于行区域的字符数的检测处理。
具体而言,在步骤S13中,也检测各部分区域230内的某1行的行区域的字符数。例如,检测出关于部分区域236的最初的1行的行区域231的字符数。但是,并不局限于此,检测关于任意1行的行区域的字符数即可。例如,也可以检测关于多个行中横宽度最大的行的行区域的字符数。
而且,在步骤S14、S15的处理之后,在步骤S16中进行了如下的处理。
具体而言,首先,关于处理对象区域的排列方向字符尺寸(例如“字符宽度”)与第一实施方式相同地决定。具体而言,基于行区域的排列方向上的长度除以行区域内的字符数得到的值,决定了关于处理对象区域的排列方向字符尺寸(例如“字符宽度”)(步骤S16等)。
另外,关于处理对象区域的正交方向字符尺寸(例如“字符高度”)与第二实施方式相同地决定。具体而言,基于是关于处理对象区域所包含的1行字符串的字符尺寸且是与字符串的排列方向正交的正交方向的字符尺寸的正交方向字符尺寸,决定了关于处理对象区域的正交方向字符尺寸(步骤S16)。
然后,在步骤S17中,基于在步骤S16中决定的两种尺寸(排列方向字符尺寸以及正交方向字符尺寸),OCR处理结果的字符串(文本信息)以在2个方向上独立的字符尺寸嵌入。具体而言,构成处理对象区域内的字符串的各字符被配置为,在该字符串的排列方向上具有作为上述的排列方向字符尺寸(字符宽度)被决定的大小(例如,26点宽度),并且,在该字符串的正交方向上具有作为上述的正交方向字符尺寸(字符高度)被决定的大小(例如,28点宽度)。这样一来,OCR处理结果涉及的字符串基于在2方向上独立的尺寸(排列方向字符尺寸以及正交方向字符尺寸)配置于电子文档500内,生成了该电子文档500。
此外,排列方向字符尺寸以及正交方向字符尺寸可以分别以各尺寸的实际的值本身(例如“mm(毫米)”单位)表现,也可以以“字体点数”表现。或者,也可以一方的尺寸用相对于另一方的尺寸的比率等相对地表现。例如,排列方向字符尺寸也可以表现为是正交方向字符尺寸(字体点尺寸等)的“150%”。或者,相反,正交方向字符尺寸也可以表现为是排列方向字符尺寸(字体点尺寸等)的“66%”。在其他的实施方式中也相同。
<4.第四实施方式>
在上述各实施方式中,例示了在字符区域210中以1行单位提取出多个部分区域230并发送的方式(换言之,各部分区域230由单一行的字符串的区域(单一的行区域)构成的方式),但并不局限于此。例如,也可以以跨多行的区域单位提取出多个部分区域230并发送。即,也可以以字符区域210中的多行的字符串的区域为单位提取出多个部分区域230并发送。更详细而言,也可以(以段落单位)提取出按照每个字符区域的段落划分出的多个部分区域并发送。由此,与第一实施方式相比,处理对象区域变大,从扫描图像提取出的处理对象区域的数量减少。因此,由于每一个OCR处理委托的图像数据量(数据转送量)增大,并且OCR处理的委托次数减少,通信的开销减少等,能够进行高效的通信。即,能够实现处理的效率化。
在该第四实施方式中,对对于第二实施方式进行这样的改变的方式进行说明。以下,以与第二实施方式的不同点为中心进行说明。
具体而言,在步骤S11之后的步骤S12(参照图5)中,以段落单位从扫描图像200的字符区域210提取出处理对象区域(部分区域230)。即,包括1行或者多行的字符串的区域(换言之,包括1个或者多个行区域的区域)被作为部分区域230提取。
更详细而言,与第一实施方式相同地,提取出作为1行字符串的区域的行区域之后计算行间间隔y。根据某行与下一行的行间间隔y是否比规定的阈值TH2小,来判断该某行与该下一行是否属于相同的段落。这里,阈值TH2是比上述的阈值TH1大的值(TH2>TH1),例如是数毫米~十数毫米。
在上述的各实施方式中,从图6的扫描图像提取出图7那样的3个部分区域230(231、232、233)分别作为处理对象区域(处理单位区域)。
另一方面,在该第四实施方式中,从图6的扫描图像提取出图13那样的2个部分区域230(236、237)分别作为处理对象区域(处理单位区域)。判定为图7中的2个行区域231、232的相互间的行间间隔y比上述的阈值TH2小,判定出行区域231、232属于相同的段落的主旨。另一方面,判定为行区域232与该行区域232的下一行区域233的行间间隔y(H21)比上述的阈值TH2大(H21>TH2),判定出行区域233属于与行区域232不同的段落的主旨。
其结果,如图13所示,集中2个行区域231、232的部分区域236被作为一个处理对象区域提取。另外,被判定为其它段落的部分区域237与部分区域236分离,被作为其它的处理对象区域提取。
另外,在该第四实施方式中,在步骤S12中,也分别提取出在各部分区域230内存在的1个或者多个“行区域(1行字符串的区域)”。具体而言,如上述那样,进行了基于阈值TH1的行区域的识别处理。由此,例如,部分区域236所包含的2个行区域231、232也被提取。
在步骤S13以后,对于各部分区域(包括1个或者多个行区域的区域)执行了与第二实施方式相同的处理。
例如,在步骤S13中,检测了部分区域230(236、237)的位置以及大小。
另外,在部分区域包括多行字符串的情况下,也检测出关于该多行的各个的行区域(字符串区域)的位置以及大小。例如,也检测出多行的部分区域236所包含的各行区域231、232的位置以及大小(参照图14)。
并且,在步骤S13中,也检测出各部分区域230内的行区域的个数(换言之,各处理对象区域230所包含的字符串的行数)。例如,部分区域236的行区域的个数是“2”,部分区域237的行区域的个数是“1”。
之后,执行了步骤S14~S15的各处理,在其接下来的步骤S16中,决定了排列方向字符尺寸。
具体而言,基于处理对象区域(例如,部分区域236)的Y方向(上下方向)上的长度(高度)和该处理对象区域所包含的字符串的行数,检测出该处理对象区域所包含的“行区域”的正交方向(Y方向)上的长度(高度)。例如,部分区域236的Y方向上的长度(高度)H10(参照图14)除以该部分区域236所包含的字符串的行数M(“2”)得到的值(=H10/M)被作为行区域的Y方向长度(正交方向上的长度)而计算出。在该实施方式中,关于部分区域236内的多个行区域的“字符高度”的平均值作为“行区域”的正交方向(Y方向)上的长度(高度)被检测出,并且,作为该部分区域236(处理对象区域)的字符的字符高度被决定。
然后,基于行区域的正交方向上的该长度,决定了关于包括该行区域的部分区域236(处理对象区域)的正交方向字符尺寸(字符高度)。例如,行区域的正交方向上的该长度照原样被作为关于部分区域236(处理对象区域)的正交方向字符尺寸(字符高度)而决定。
接着,求出与该“字符高度”(H10/M)对应的字体点尺寸(例如26点)。然后,推断决定为部分区域230内的字符的“字符宽度”是相当于该字体点尺寸的大小。可以说,与“字符高度”对应的标准的“字符宽度”被推断决定。
以后,与第二实施方式相同地,基于关于处理对象区域的正交方向字符尺寸(字符高度)决定关于该处理对象区域内的排列方向字符尺寸(字符宽度)即可。
另外,步骤S17以后的处理也被相同地进行。
例如,在步骤S17中,OCR处理结果涉及的字符串(文本信息)基于在步骤S16中决定的排列方向字符尺寸被嵌入。具体而言,构成处理对象区域内的字符串的各字符以在其排列方向上具有作为上述的排列方向字符尺寸(字符宽度)被决定的大小的状态配置。此外,在部分区域包含有多行字符串的情况下,例如,该部分区域内的全部的行的字符串的各字符被视为具有相互相同的大小的字符来配置即可。
如上所述,OCR处理结果的字符串基于排列方向字符尺寸配置于电子文档500内,生成了该电子文档500。
此外,在上述第四实施方式中,对对于第二实施方式进行如上述那样的改变的方式进行了说明。然而,本发明并不局限于此。例如,也可以对于第一实施方式进行相同的改变。或者,也可以对于第三实施方式进行相同的改变。
在这些情况下,在部分区域230内包含有多个行区域时,在决定“排列方向字符尺寸”时,也不一定需要对于多个行区域的全部(全部的行的字符串)计算字符数,也可以对于该多个行区域中的任意1行的行区域计算字符数。
例如,计算出关于多行中的最初的1行的行区域的“字符数”,基于该行区域的宽度除以该行区域的字符数得到的值决定“排列方向字符尺寸”即可。
而且,该排列方向字符尺寸被视为关于(不仅该行区域)包括该行区域的部分区域230内的全部的字符的“排列方向字符尺寸”,部分区域230内的字符串配置于电子文档500内即可。由此,字符数的计算动作仅对于多个行的字符串中的一部分的行的字符串进行即可,所以能够实现处理的高速化。相同段落所包含的多行的字符串的各字符的大小分别相互相同的情况较多,所以能够将OCR处理结果涉及的多行的字符串的各个配置在排列方向上比较正确的位置。
另外,在上述第四实施方式中,例示了基于处理对象区域(例如部分区域236)的高度和该处理对象区域所包含的字符串的行数,检测出该处理对象区域所包含的“行区域”的高度,基于该行区域的“高度”决定了“排列方向字符尺寸”的方式,但并不局限于此。
例如,关于多个行中的最初的1行的行区域的“高度”通过图像处理检测,基于该行区域的“高度”决定“排列方向字符尺寸”即可。
<5.第五实施方式>
另外,在上述第一实施方式~上述第三实施方式中,包括单一行的字符串(详细而言,单一行的字符串的全范围)的区域被作为处理对象区域(部分区域)提取并发送,但并不局限于此。例如,也可以考虑在单一行的字符串内存在比较大的空隙的情况等,利用该空隙划分该单一行的字符串而得到的小区域分别被作为处理对象区域(部分区域)提取并发送。换言之,也可以1行的字符串的一部分的范围的区域亦即行区域(1行内的小区域)被作为处理对象区域(部分区域)提取并发送。
在该第五实施方式中,对对于第一实施方式进行这样的改变的方式进行说明。以下,以与第一实施方式的不同点为中心进行说明。
这里,在步骤S12(图5)中,对于图15的字符区域210(212)中的最下行的字符串,字符串“14×17inch”的区域234和字符串“17×17inch”的区域235被分别作为相互不同的部分区域230提取(也参照图16)。
更详细而言,提取部65对于目标行计算目标行内的目标字符与该目标字符之前的字符的间隔亦即前间隔p和该目标字符与该目标字符之后的字符的间隔亦即后间隔q。此外,相邻字符间间隔p、q与上述的字间间隔(相邻字符间间隔)x相同地计算即可。
在判定为后间隔q比前间隔p大超过规定程度的情况下,提取部65判定为在该目标字符与该目标字符之后的字符之间有显著的空白区域,提取该空白区域的两侧的2个小区域作为相互不同的部分区域。换言之,判定为该目标字符和该目标字符之后的字符属于相互不同的部分区域。由此,包括目标字符和该目标字符之前的字符的小区域和包括该目标字符之后的字符的小区域被作为相互不同的部分区域提取。
更具体而言,在值q相对于值p的比值(q/p)比规定的阈值TH2(例如500%)大的情况下,判定为在目标字符与该目标字符之后的字符之间有显著的空白区域。相反,在该比值(q/p)比规定的阈值TH2小的情况下,判定为在目标字符与该目标字符之后的字符之间不存在显著的空白区域,该目标字符与该目标字符之后的字符的两字符属于相同的部分区域。这样的处理对于第一行内的多个字符,按照从一方侧(例如左侧)向另一方侧(例如右侧)的顺序依次执行。其结果,在存在显著的空白区域的情况下,提取出被该空白区域划分的两侧的小区域。
由此,例如,如图16所示,字符串“14×17inch”的区域234和字符串“17×17inch”的区域235被分别作为相互不同的部分区域提取。
如上所述,1行内的各小区域也可以被显著的空白部分相互分离,作为部分区域230提取。换言之,也可以1行字符串的排列方向上的全范围中的一部分的范围的区域(小区域)被作为处理对象区域提取。
在步骤S13以后,对于各部分区域(小区域)执行与第一实施方式相同的处理。例如,在步骤S13中,进行了各部分区域(小区域)的位置以及大小的检测处理等,在步骤S14、S15中,OCR处理等按照每个该各部分区域(小区域)执行。另外,在步骤S16中,基于上述各小区域(1行字符串的排列方向上的全范围中的一部分的范围的区域)的正交方向上的长度计算出正交方向字符尺寸,基于该正交方向字符尺寸决定关于处理对象区域内的字符的排列方向字符尺寸。在步骤S17中,各小区域内的字符串基于按照每个部分区域(小区域)决定的该排列方向字符尺寸配置于电子文档500内。
也可以利用以上的方式生成电子文档500。
图17是表示第五实施方式的字符配置结果的图。在图17中,也与图11等相同地,重叠显示有两种类的字符串(OCR处理前后的字符串)。
根据该第五实施方式,如图17所示,OCR处理结果涉及的各字符相对于作为图像显示于扫描图像200内的各字符的位置,配置在左右方向上比较近的位置。例如,与表示上述的比较例的字符配置结果的图12比较可知,各部分区域231、232、234(图16)的OCR处理结果的字符串分别配置在其排列方向上比较正确的位置。
此外,图18是表示其它的比较例的字符配置结果的图。在图18中,也与图17相同地,重叠显示有两种类的字符串(OCR处理前后的字符串)。在图18中,假定了包括域234和区域235的双方的区域被决定为一个处理对象区域(部分区域),进行了与第一实施方式相同的处理的状况。在图18中,由于行内存在的比较大的宽度的空白区域的影响,多个部分区域中区域235的字符从本来的位置偏移较大地配置。
与此相对,在图17中,(不仅部分区域231、232、234)部分区域235涉及的OCR处理结果的字符串也在其排列方向上配置在更正确的位置。这样,根据以1行字符串的区域亦即行区域(但是,这里是作为1行字符串的“一部分的范围的区域”的行区域)为单位提取处理对象区域,能够抑制或者减少在1行字符串内存在的比较大的空白区域的影响。
此外,在该第五实施方式中,对对于第一实施方式进行上述的改变的方式进行了说明。然而,本发明并不局限于此,也可以对于第二实施方式以及第三实施方式进行相同的改变。例如,也可以提取1行字符串的排列方向上的全范围中的一部分的范围的区域作为处理对象区域,基于该一部分的范围的区域的正交方向上的长度计算出正交方向字符尺寸。然后,进行基于该正交方向字符尺寸决定关于处理对象区域内的字符的排列方向字符尺寸等的处理即可。
<6.变形例等>
以上,对该发明的实施方式进行了说明,但该发明并不局限于上述说明的内容。
例如,在上述各实施方式中,“字符宽度”的决定处理(步骤S16)在步骤S15之后执行,但并不局限于此。该决定处理也可以在步骤S14之前(具体而言,步骤S13中)执行。或者,该决定处理也可以在步骤S14的处理开始之后(或者开始之前)开始其执行,与云服务器90的OCR处理并行执行。
在上述各实施方式中,例示了从扫描图像200的字符区域210提取出多个部分区域230,以各部分区域230作为单位实施了OCR处理的方式,但并不局限于此。例如,也可以扫描图像200的字符区域210的整体被决定为一个处理对象区域,将该字符区域210的整体作为一个单位实施OCR处理。而且,也可以针对字符区域210整体的OCR处理的处理结果从云服务器90被外部终端50接收,基于该处理结果生成电子文档。
另外,在上述各实施方式中,主要对横写的字符串进行了说明,但并不局限于此,也能够将上述的思想应用于纵写的字符串。此外,如上所述,在纵写的字符串的情况下,字符串的排列方向是上下方向(字符的高度方向),“字符高度”相当于排列方向字符尺寸(字符的排列方向尺寸),“字符宽度”相当于正交方向字符尺寸。
另外,在上述各实施方式中,例示了扫描图像的部分区域被作为OCR处理的处理对象区域提取的方式,但本发明并不局限于此。例如,也可以不是扫描图像的部分区域,而是扫描图像的整体区域作为OCR处理的处理对象区域被提取(设定)。
另外,在上述各实施方式中,例示了由MFP10生成的扫描图像被发送至外部终端50,该外部终端50作为根据该扫描图像生成电子文档的电子文档生成装置发挥作用,并且,云服务器90作为执行OCR处理的OCR处理装置发挥作用的方式,但并不局限于此。
例如,在图19所示的系统构成等中,也可以使生成了扫描图像的MFP10自身作为执行与上述的外部终端50(电子文档生成应用程序110)相同的动作的电子文档生成装置发挥作用,并且,云服务器90作为执行OCR处理(通用OCR应用程序120)的OCR处理装置发挥作用。更详细而言,也可以云服务器90基于来自MFP10的委托执行针对该扫描图像的OCR处理,将该OCR处理的处理结果发送至MFP10。而且,也可以MFP10基于该OCR处理的处理结果和在MFP10内决定的排列方向字符尺寸(例如,“字符宽度”等)将OCR处理结果的字符串配置在电子文档内,生成电子文档。
或者,在图20所示的系统构成等中,生成了扫描图像的MFP10自身作为执行与上述各实施方式中的外部终端50(电子文档生成应用程序110)相同的动作的电子文档生成装置发挥作用,并且,这次外部终端50也可以作为执行与上述的云服务器90相同的OCR处理(通用OCR应用程序120)的OCR处理装置发挥作用。更详细而言,也可以外部终端50基于来自MFP10的委托执行针对该扫描图像的OCR处理,将该OCR处理的处理结果发送至MFP10。而且,也可以MFP10基于该OCR处理的处理结果和在MFP10内决定的排列方向字符尺寸(例如,“字符宽度”等),将各OCR处理结果的字符串配置在电子文档内,生成电子文档。
另外,在上述各实施方式等中,带透明文本PDF(与原始的字符图像重叠,OCR结果的字符串以非显示状态嵌入的PDF形式的文件)(可检索的PDF等)作为电子文档500而被生成,但本发明并不局限于此,也可以生成如下的电子文档500。
具体而言,在最终的电子文档500中,也可以删除原始的字符图像(字符区域210的图像),并且,OCR结果的文本数据以可视化的状态代替该原始的字符图像显示。
更详细而言,也可以删除扫描图像200中的字符区域210的各部分区域230的图像,代替该各部分区域230的图像,对于各部分区域230的处理结果的字符串以“显示状态”嵌入(配置)于该各部分区域230的各个的检测位置,从而生成电子文档500。即,也可以生成不具有字符图像而具有文本字符串的电子文档500。
另外,在上述各实施方式等中,例示了PDF形式的电子文档,但本发明并不局限于此,也可以生成其他的各种形式(XPS形式等)的电子文档。
符号说明
1...图像形成系统(电子文档生成系统);10...MFP(图像形成装置);25...触摸面板;50...外部终端;90...云服务器;110...电子文档生成应用程序;120...通用OCR应用程序;200...扫描图像;210...字符区域;220...非字符区域;230...部分区域(处理对象区域);231~233...行区域;250...文本数据;300...属性指定数据;500...电子文档。

Claims (28)

1.一种电子文档生成系统,该电子文档生成系统的特征在于,具备:
第一装置,其根据原稿的扫描图像生成电子文档;以及
第二装置,其基于来自所述第一装置的委托执行针对所述扫描图像的光学字符识别处理,并将该光学字符识别处理的处理结果送出到所述第一装置,
所述第一装置具有:
提取单元,其从所述扫描图像提取包括行区域的处理对象区域,其中,所述行区域是在所述扫描图像内沿某方向排列的1行字符串的全部或者一部分范围的区域;
检测单元,其检测所述行区域的大小;
决定单元,其基于所述行区域的大小,决定排列方向字符尺寸,其中,所述排列方向字符尺寸是所述处理对象区域内的字符的字符尺寸,且是所述1行字符串的排列方向上的字符尺寸;
指示送出单元,其将应该对于所述处理对象区域进行所述光学字符识别处理的主旨的指示和所述处理对象区域的图像数据向所述第二装置送出;
接受单元,其从所述第二装置接受关于所述处理对象区域的所述光学字符识别处理的处理结果;以及
生成单元,其基于由所述决定单元决定的所述排列方向字符尺寸,将所述处理结果涉及的字符串配置在所述电子文档内,生成所述电子文档。
2.根据权利要求1所述的电子文档生成系统,其特征在于,
所述决定单元基于用所述行区域的所述排列方向上的长度除以所述行区域内的字符数得到的值,决定所述排列方向字符尺寸。
3.根据权利要求2所述的电子文档生成系统,其特征在于,
所述提取单元提取包括多行的字符串的区域作为所述处理对象区域,
所述决定单元基于用是与所述多行的字符串中的任意1行的字符串相关的区域的所述行区域的所述排列方向上的长度除以所述行区域内的字符数得到的值,决定所述排列方向字符尺寸。
4.根据权利要求2所述的电子文档生成系统,其特征在于,
所述提取单元提取单一行的字符串涉及的区域作为所述处理对象区域,
所述决定单元基于用是与所述单一行的字符串相关的区域的所述行区域的所述排列方向上的长度除以所述行区域内的字符数得到的值,决定所述排列方向字符尺寸。
5.根据权利要求2所述的电子文档生成系统,其特征在于,
所述提取单元提取所述1行字符串的所述排列方向上的全部范围中的一部分范围的区域作为所述处理对象区域,
所述决定单元基于用所述一部分范围的区域的所述排列方向上的长度除以所述一部分范围的区域内的字符数得到的值,决定所述排列方向字符尺寸。
6.根据权利要求1所述的电子文档生成系统,其特征在于,
所述决定单元基于所述行区域的正交方向上的长度决定正交方向字符尺寸,并且基于所述正交方向字符尺寸决定所述排列方向字符尺寸,其中,所述正交方向是与所述1行字符串的排列方向正交的方向,所述正交方向字符尺寸是所述处理对象区域内的字符的字符尺寸,且是所述正交方向的字符尺寸。
7.根据权利要求6所述的电子文档生成系统,其特征在于,
所述提取单元提取包括多行字符串的区域作为所述处理对象区域,
所述决定单元基于所述处理对象区域的所述正交方向上的长度和所述处理对象区域所包含的字符串的行数来检测所述行区域的所述正交方向上的长度,基于所述行区域的所述正交方向上的该长度决定所述正交方向字符尺寸,并且,基于该正交方向字符尺寸决定所述排列方向字符尺寸。
8.根据权利要求6所述的电子文档生成系统,其特征在于,
所述提取单元提取单一行的字符串涉及的区域作为所述处理对象区域,
所述决定单元基于所述单一行的字符串涉及的区域的所述正交方向上的长度计算所述正交方向字符尺寸,并且,基于该正交方向字符尺寸决定所述排列方向字符尺寸。
9.根据权利要求6所述的电子文档生成系统,其特征在于,
所述提取单元提取所述1行字符串的所述排列方向上的全部范围中的一部分范围的区域作为所述处理对象区域,
所述决定单元基于所述一部分范围的区域的所述正交方向上的长度计算所述正交方向字符尺寸,并且,基于该正交方向字符尺寸决定所述排列方向字符尺寸。
10.根据权利要求1所述的电子文档生成系统,其特征在于,
所述决定单元基于用所述行区域的所述排列方向上的长度除以所述行区域内的字符数得到的值,决定关于所述处理对象区域的所述排列方向字符尺寸,并且,
基于所述行区域的正交方向上的长度决定正交方向字符尺寸,其中,所述正交方向是与所述1行字符串的排列方向正交的方向,所述正交方向字符尺寸是所述处理对象区域内的字符的字符尺寸,且是所述正交方向的字符尺寸,
所述生成单元基于由所述决定单元决定的所述排列方向字符尺寸和所述正交方向字符尺寸,将所述处理结果涉及的字符串配置在所述电子文档内,来生成所述电子文档。
11.根据权利要求1~10中任一项所述的电子文档生成系统,其特征在于,
所述检测单元也检测所述扫描图像内的所述处理对象区域的位置,
所述生成单元也基于所述处理对象区域的所述位置,将所述处理结果涉及的字符串配置在所述电子文档内。
12.根据权利要求1~11中任一项所述的电子文档生成系统,其特征在于,
所述第一装置是图像形成装置,
所述第二装置是云服务器。
13.根据权利要求1~11中任一项所述的电子文档生成系统,其特征在于,
所述第一装置是图像形成装置,
所述第二装置是通信终端。
14.根据权利要求1~11中任一项所述的电子文档生成系统,其特征在于,
所述第一装置是通信终端,
所述第二装置是云服务器。
15.一种电子文档生成装置,是根据原稿的扫描图像生成电子文档的电子文档生成装置,其特征在于,具备:
提取单元,其从所述扫描图像提取包括行区域的处理对象区域,其中,所述行区域是在所述扫描图像内沿某方向排列的1行字符串的全部或者一部分范围的区域,
检测单元,其检测所述行区域的大小;
决定单元,其基于所述行区域的大小,决定排列方向字符尺寸,其中,所述排列方向字符尺寸是所述处理对象区域内的字符的字符尺寸,且是所述1行字符串的排列方向上的字符尺寸;
指示送出单元,其将应该对于所述处理对象区域进行光学字符识别处理的主旨的指示和所述处理对象区域的图像数据向外部装置送出;
接受单元,其从所述外部装置接受对于所述处理对象区域由所述外部装置执行的所述光学字符识别处理的处理结果;以及
生成单元,其基于由所述决定单元决定的所述排列方向字符尺寸,将所述处理结果涉及的字符串配置在所述电子文档内,生成所述电子文档。
16.根据权利要求15所述的电子文档生成装置,其特征在于,
所述决定单元基于用所述行区域的所述排列方向上的长度除以所述行区域内的字符数得到的值,决定所述排列方向字符尺寸。
17.根据权利要求16所述的电子文档生成装置,其特征在于,
所述提取单元提取包括多行字符串的区域作为所述处理对象区域,
所述决定单元基于用是与所述多行字符串中的任意1行的字符串相关的区域的所述行区域的所述排列方向上的长度除以所述行区域内的字符数得到的值,决定所述排列方向字符尺寸。
18.根据权利要求16所述的电子文档生成装置,其特征在于,
所述提取单元提取单一行的字符串涉及的区域作为所述处理对象区域,
所述决定单元基于用是与所述单一行的字符串相关的区域的所述行区域的所述排列方向上的长度除以所述行区域内的字符数得到的值,决定所述排列方向字符尺寸。
19.根据权利要求16所述的电子文档生成装置,其特征在于,
所述提取单元提取所述1行字符串的所述排列方向上的全部范围中的一部分范围的区域作为所述处理对象区域,
所述决定单元基于用所述一部分范围的区域的所述排列方向上的长度除以所述一部分范围的区域内的字符数得到的值,决定所述排列方向字符尺寸。
20.根据权利要求15所述的电子文档生成装置,其特征在于,
所述决定单元基于所述行区域的正交方向上的长度决定正交方向字符尺寸,并且基于所述正交方向字符尺寸决定所述排列方向字符尺寸,其中,所述正交方向是与所述1行字符串的排列方向正交的方向,所述正交方向字符尺寸是所述处理对象区域内的字符的字符尺寸,且是所述正交方向的字符尺寸。
21.根据权利要求20所述的电子文档生成装置,其特征在于,
所述提取单元提取包括多行字符串的区域作为所述处理对象区域,
所述决定单元基于所述处理对象区域的所述正交方向上的长度和所述处理对象区域所包含的字符串的行数来计算所述行区域的所述正交方向上的长度,基于所述行区域的所述正交方向上的该长度决定所述正交方向字符尺寸,并且,基于该正交方向字符尺寸决定所述排列方向字符尺寸。
22.根据权利要求20所述的电子文档生成装置,其特征在于,
所述提取单元提取单一行的字符串涉及的区域作为所述处理对象区域,
所述决定单元基于所述单一行的字符串涉及的区域的所述正交方向上的长度计算所述正交方向字符尺寸,并且,基于该正交方向字符尺寸决定所述排列方向字符尺寸。
23.根据权利要求20所述的电子文档生成装置,其特征在于,
所述提取单元提取所述1行字符串的所述排列方向上的全部范围中的一部分范围的区域作为所述处理对象区域,
所述决定单元基于所述一部分范围的区域的所述正交方向上的长度计算所述正交方向字符尺寸,并且,基于该正交方向字符尺寸决定所述排列方向字符尺寸。
24.根据权利要求15所述的电子文档生成装置,其特征在于,
所述决定单元基于用所述行区域的所述排列方向上的长度除以所述行区域内的字符数得到的值,决定关于所述处理对象区域的所述排列方向字符尺寸,并且,
基于所述行区域的正交方向上的长度决定正交方向字符尺寸,其中,所述正交方向是与所述1行字符串的排列方向正交的方向,所述正交方向字符尺寸是所述处理对象区域内的字符的字符尺寸,且是所述正交方向的字符尺寸,
所述生成单元基于由所述决定单元决定的所述排列方向字符尺寸和所述正交方向字符尺寸,将所述处理结果涉及的字符串配置在所述电子文档内,来生成所述电子文档。
25.根据权利要求15~24中任一项所述的电子文档生成装置,其特征在于,
所述检测单元也检测所述扫描图像内的所述处理对象区域的位置,
所述生成单元也基于所述处理对象区域的所述位置,将所述处理结果涉及的字符串配置在所述电子文档内,生成所述电子文档。
26.根据权利要求15~25中任一项所述的电子文档生成装置,其特征在于,
所述电子文档生成装置是图像形成装置。
27.根据权利要求15~25中任一项所述的电子文档生成装置,其特征在于,
所述电子文档生成装置是与生成所述扫描图像的图像形成装置不同的通信装置且是与所述外部装置也不同的通信装置。
28.一种电子文档生成装置,是根据原稿的扫描图像生成电子文档的电子文档生成装置,其特征在于,具备:
提取单元,其从所述扫描图像提取包括多行字符串的处理对象区域;
检测单元,其检测所述处理对象区域的大小;
决定单元,其基于所述处理对象区域的大小,决定排列方向字符尺寸,其中,所述排列方向字符尺寸是所述处理对象区域内的字符的字符尺寸,且是所述处理对象区域内的字符串的排列方向上的字符尺寸;
指示送出单元,其将应该对于所述处理对象区域进行光学字符识别处理的主旨的指示和所述处理对象区域的图像数据向外部装置送出,
接受单元,其从所述外部装置接受对于所述处理对象区域由所述外部装置执行的所述光学字符识别处理的处理结果;以及
生成单元,其基于由所述决定单元决定的所述排列方向字符尺寸,将所述处理结果涉及的字符串配置在所述电子文档内,生成所述电子文档,
所述决定单元基于所述处理对象区域的正交方向上的长度和所述处理对象区域所包含的字符串的行数来决定正交方向字符尺寸,并且,基于所述正交方向字符尺寸决定所述排列方向字符尺寸,其中,所述正交方向是与所述排列方向正交的方向,所述正交方向字符尺寸是所述处理对象区域内的字符的字符尺寸,且是所述正交方向的字符尺寸。
CN201510404336.9A 2014-07-11 2015-07-10 电子文档生成系统以及电子文档生成装置 Active CN105320933B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014143600A JP6119689B2 (ja) 2014-07-11 2014-07-11 電子文書生成システム、電子文書生成装置およびプログラム
JP2014-143600 2014-07-11

Publications (2)

Publication Number Publication Date
CN105320933A true CN105320933A (zh) 2016-02-10
CN105320933B CN105320933B (zh) 2019-01-25

Family

ID=55068499

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510404336.9A Active CN105320933B (zh) 2014-07-11 2015-07-10 电子文档生成系统以及电子文档生成装置

Country Status (3)

Country Link
US (1) US9398191B2 (zh)
JP (1) JP6119689B2 (zh)
CN (1) CN105320933B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108038093A (zh) * 2017-11-10 2018-05-15 万兴科技股份有限公司 Pdf文字提取方法和装置
CN111222314A (zh) * 2020-01-03 2020-06-02 北大方正集团有限公司 版式文档的比对方法、装置、设备及存储介质
CN111914597A (zh) * 2019-05-09 2020-11-10 杭州睿琪软件有限公司 一种文档对照识别方法、装置、电子设备和可读存储介质

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6798309B2 (ja) * 2016-03-18 2020-12-09 株式会社リコー 画像処理装置、画像処理方法及びプログラム
US10084939B2 (en) * 2016-03-18 2018-09-25 Ricoh Company, Ltd. Image processing apparatus, image processing method, and non-transitory computer-readable storage medium
JP6531738B2 (ja) * 2016-08-08 2019-06-19 京セラドキュメントソリューションズ株式会社 画像処理装置
EP3522038A4 (en) * 2016-09-28 2020-06-03 Systran International Co. Ltd. METHOD FOR TRANSLATING CHARACTERS AND DEVICE THEREFOR
JP6968647B2 (ja) * 2017-10-03 2021-11-17 キヤノン株式会社 スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム
KR102138748B1 (ko) * 2019-02-08 2020-07-28 네이버 주식회사 라인 단위의 문자열을 검출 및 정렬하기 위한 방법 및 시스템
US12056331B1 (en) 2019-11-08 2024-08-06 Instabase, Inc. Systems and methods for providing a user interface that facilitates provenance tracking for information extracted from electronic source documents
US11409981B1 (en) * 2021-03-31 2022-08-09 Intuit, Inc. Document classification using signal processing
US11315353B1 (en) * 2021-06-10 2022-04-26 Instabase, Inc. Systems and methods for spatial-aware information extraction from electronic source documents
US12067039B1 (en) 2023-06-01 2024-08-20 Instabase, Inc. Systems and methods for providing user interfaces for configuration of a flow for extracting information from documents via a large language model

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02255996A (ja) * 1988-12-09 1990-10-16 Ricoh Co Ltd 文字切出し方法
EP0461760B1 (en) * 1990-05-15 1999-08-04 Canon Kabushiki Kaisha Image processing apparatus and method
US9143638B2 (en) * 2004-04-01 2015-09-22 Google Inc. Data capture from rendered documents using handheld device
JP4924990B2 (ja) * 2008-03-13 2012-04-25 富士ゼロックス株式会社 文書処理装置および文書処理プログラム
JP2012009005A (ja) * 2010-05-24 2012-01-12 Pfu Ltd 帳票処理システム、ocr装置、ocr処理プログラム、帳票作成装置、帳票作成プログラム、および帳票処理方法
JP2012022571A (ja) 2010-07-15 2012-02-02 Toshiba Tec Corp 翻訳制御装置および翻訳制御方法
JP2012073749A (ja) 2010-09-28 2012-04-12 Kyocera Mita Corp 画像形成装置及び画像形成プログラム
JP5372110B2 (ja) * 2011-10-28 2013-12-18 シャープ株式会社 情報出力装置、情報出力方法、及びコンピュータプログラム
JP5622290B2 (ja) * 2012-03-30 2014-11-12 京セラドキュメントソリューションズ株式会社 電子化装置
JP2013236234A (ja) * 2012-05-08 2013-11-21 Ricoh Co Ltd 画像処理装置、画像処理システム及びプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108038093A (zh) * 2017-11-10 2018-05-15 万兴科技股份有限公司 Pdf文字提取方法和装置
CN108038093B (zh) * 2017-11-10 2021-06-15 深圳市亿图软件有限公司 Pdf文字提取方法和装置
CN111914597A (zh) * 2019-05-09 2020-11-10 杭州睿琪软件有限公司 一种文档对照识别方法、装置、电子设备和可读存储介质
CN111914597B (zh) * 2019-05-09 2024-03-15 杭州睿琪软件有限公司 一种文档对照识别方法、装置、电子设备和可读存储介质
CN111222314A (zh) * 2020-01-03 2020-06-02 北大方正集团有限公司 版式文档的比对方法、装置、设备及存储介质
CN111222314B (zh) * 2020-01-03 2021-12-21 北大方正集团有限公司 版式文档的比对方法、装置、设备及存储介质

Also Published As

Publication number Publication date
JP6119689B2 (ja) 2017-04-26
JP2016021086A (ja) 2016-02-04
US9398191B2 (en) 2016-07-19
CN105320933B (zh) 2019-01-25
US20160014299A1 (en) 2016-01-14

Similar Documents

Publication Publication Date Title
CN105320933A (zh) 电子文档生成系统以及电子文档生成装置
JP5712487B2 (ja) 画像処理装置、画像処理システム、画像処理方法、及びプログラム
JP4801177B2 (ja) 画像処理装置、及び画像処理方法
JP4903034B2 (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
US8675260B2 (en) Image processing method and apparatus, and document management server, performing character recognition on a difference image
CN107133615B (zh) 信息处理设备和信息处理方法
US9614984B2 (en) Electronic document generation system and recording medium
US20210056336A1 (en) Image processing apparatus, image processing method, and storage medium
US9858513B2 (en) Document file output apparatus, document file output method, and computer readable medium
US9085191B2 (en) Background pattern image combining apparatus, background pattern image combining method, and computer-readable storage medium for computer program
US9471841B2 (en) Electronic document generation system, image forming apparatus and program
CN109413294A (zh) 图像处理装置及其控制方法
US10802767B2 (en) Printer and non-transitory computer readable storage medium with shared review function
JP2012198597A (ja) 制御装置及びコンピュータプログラム
JP5696394B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
US10789715B2 (en) Image processing device, image processing method, and information storage medium
JP4208520B2 (ja) 画像処理装置および画像処理方法、プログラムおよび記憶媒体
JP6365894B2 (ja) 画像読取装置
JP6458351B2 (ja) 電子文書生成システム、画像形成装置、通信端末およびプログラム
CN110390323B (zh) 信息处理装置以及计算机可读介质
JP2014199507A (ja) 画像処理装置およびコンピュータプログラム
US20240193975A1 (en) Image processing apparatus, image processing method, and storage medium
JP2013157968A (ja) 画像処理装置
JP5935376B2 (ja) 複写装置
JP5416176B2 (ja) 端末装置及びプリンタ装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant