CN110942068B - 信息处理装置、存储介质及信息处理方法 - Google Patents

信息处理装置、存储介质及信息处理方法 Download PDF

Info

Publication number
CN110942068B
CN110942068B CN201910163315.0A CN201910163315A CN110942068B CN 110942068 B CN110942068 B CN 110942068B CN 201910163315 A CN201910163315 A CN 201910163315A CN 110942068 B CN110942068 B CN 110942068B
Authority
CN
China
Prior art keywords
confirmation
confirmation operation
information processing
unit
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910163315.0A
Other languages
English (en)
Other versions
CN110942068A (zh
Inventor
西冈晋太郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Business Innovation Corp filed Critical Fujifilm Business Innovation Corp
Publication of CN110942068A publication Critical patent/CN110942068A/zh
Application granted granted Critical
Publication of CN110942068B publication Critical patent/CN110942068B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19167Active pattern learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • H04N1/00244Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server with a server, e.g. an internet server

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Computer Graphics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Geometry (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

一种信息处理装置、存储介质及信息处理方法,能够按区域使用不同的判断基准来适当地确定确认工作的方式。信息处理装置具备:获取部,获取将在一个文件内包含多个区域的文件电子化而得到的数据即图像数据;设定部,根据所述图像数据的所述区域内所包含的字符或图的确认工作的必要程度,对每个所述区域设定判断基准;及确定部,根据所述判断基准,对每个所述区域确定所述确认工作的方式。

Description

信息处理装置、存储介质及信息处理方法
技术领域
本发明涉及一种信息处理装置、存储介质及信息处理方法。
背景技术
例如,专利文献1中公开有决定确认工作的方式的技术,该确认工作为根据表示将文件电子化而得到的图像数据中所包含的字符的识别结果的可靠性的值即确信度和预先规定的确信度的阈值,确认或修正所述图像数据内所包含的字符的识别结果的工作及确认所述图像数据内所包含的图的工作。
专利文献1:日本特开2016-212812号公报
然而,当在一个文件内混合存在确认工作的必要性的程度(以下,设为“必要程度”。)不同的多个区域时,若使用同一判断基准对所有区域确定确认工作的方式,则根据上述判断基准的设定,有可能对确认工作的必要性比较高的区域不实施确认工作或者对确认工作的必要性比较低的区域实施确认工作。
发明内容
本发明提供一种尽管在一个文件内混合存在确认工作的必要性的程度不同的多个区域,但是与使用同一判断基准对所有区域确定确认工作的方式的情况相比,能够按区域使用不同的判断基准来适当地确定确认工作的方式的信息处理装置、存储介质及信息处理方法。
为了实现上述目的,方案1所述的信息处理装置具备:获取部,获取将在一个文件内包含多个区域的文件电子化而得到的数据即图像数据;设定部,根据所述图像数据的所述区域内所包含的字符或图的确认工作的必要程度,对每个所述区域设定判断基准;及确定部,根据所述判断基准,对每个所述区域确定所述确认工作的方式。
并且,根据方案1所述的发明,在方案2所述的信息处理装置中,所述必要程度根据对所述一个文件内的每个所述区域预先规定的属性信息来确定。
并且,根据方案1所述的发明,方案3所述的信息处理装置还具备识别所述区域内所包含的字符或图的识别部,所述必要程度根据由所述识别部识别出的识别结果来确定。
并且,根据方案3所述的发明,在方案4所述的信息处理装置中,根据所述识别结果判定为所述字符或图的形态重要时,较高地确定所述必要程度。
并且,根据方案3所述的发明,在方案5所述的信息处理装置中,根据所述识别结果判定为所述字符的属性重要时,较高地确定所述必要程度。
并且,根据方案3~5中任一项所述的发明,方案6所述的信息处理装置还具备进行显示进行所述确认工作的画面的控制的显示控制部,所述显示控制部进行如下控制,即,按照所述必要程度对由所述识别部识别出的识别结果进行分类并示出。
并且,根据方案1~6中任一项所述的发明,在方案7所述的信息处理装置中,所述判断基准通过比较表示所述图像数据中所包含的字符的识别结果的可靠性的值即确信度与阈值来规定,所述设定部根据所述必要程度,对每个所述区域设定不同的所述阈值。
另外,为了实现上述目的,方案8所述的存储介质存储有使计算机作为方案1~7中任一项所述的信息处理装置所具备的各部发挥功能的程序。
另外,为了实现上述目的,方案9所述的信息处理方法包括如下步骤:
获取步骤,获取将在一个文件内包含多个区域的文件进行电子化而得到的数据即图像数据;
设定步骤,根据所述图像数据的所述区域内所包含的字符或图的确认工作的必要程度,对每个所述区域设定判断基准;及
确认步骤,根据所述判断基准,对每个所述区域确定所述确认工作的方式。
发明效果
根据本发明的第1、第8及第9方案,尽管在一个文件内混合存在确认工作的必要性的程度不同的多个区域,但是与使用同一判断基准对所有区域确定确认工作的方式的情况相比,能够按区域使用判断基准来适当地确定确认工作的方式。
根据本发明的第2方案,与未考虑将属性信息作为必要程度的情况相比,能够以更适当的方式实施确认工作。
根据本发明的第3方案,与未考虑将识别结果作为必要程度的情况相比,能够以更适当的方式实施确认工作。
根据本发明的第4方案,与未考虑字符或图的形态是否重要的情况相比,能够适当地确定必要程度。
根据本发明的第5方案,与未考虑字符的属性是否重要的情况相比,能够适当地确定必要程度。
根据本发明的第6方案,与未按照必要程度对识别结果进行分类并示出的情况相比,一看就能够掌握识别结果。
根据本发明的第7方案,与对每个区域将确信度的阈值设为相同的情况相比,能够适当地设定判断基准。
附图说明
根据以下附图,对本发明的实施方式进行详细叙述。
图1是表示实施方式所涉及的信息处理系统的结构的一例的图;
图2是表示实施方式所涉及的服务器装置的电结构的一例的块图;
图3是表示实施方式所涉及的服务器装置的功能性结构一例的块图;
图4是供于说明与实施方式所涉及的项目、框及字符的关系的图;
图5是表示实施方式所涉及的服务器装置的具体结构的一例的块图;
图6是表示实施方式所涉及的表单定义画面的一例的主视图;
图7是表示实施方式所涉及的表单定义画面的另一例的主视图;
图8是表示实施方式所涉及的必要程度表的一例的图;
图9是表示基于实施方式所涉及的确认处理程序的确认判定处理的流程的一例的流程图;
图10是表示实施方式所涉及的确认工作画面的一例的主视图;
图11是表示实施方式所涉及的确认工作画面的另一例的局部图;
图12是表示基于实施方式所涉及的确认处理程序的识别设定处理的流程的一例的流程图。
符号说明
10-服务器装置,12-控制部,12A-CPU,12B-ROM,12C-RAM,12D-I/O,14-存储部,14A-确认处理程序,14B-必要程度表,14C-识别框信息,16-显示部,18-操作部,20-通信部,30-确认控制部,40、40A、40B-确认者用终端装置,50-图像读取装置,60-管理者用终端装置,90-信息处理系统,210-识别设定部,220-识别处理部,230-确认处理实施判定部,240-确认处理部,250-最终确认处理部,260-识别结果输出部。
具体实施方式
以下,参考附图对用于实施本发明的方式的一例进行详细说明。
图1是表示本实施方式所涉及的信息处理系统90的结构的一例的图。
如图1所示,本实施方式所涉及的信息处理系统90具备服务器装置10、确认者用终端装置40A、40B、……、图像读取装置50及管理者用终端装置60。另外,服务器装置10为信息处理装置的一例。
服务器装置10经由网络N连接成能够分别与确认者用终端装置40A、40B、……、图像读取装置50及管理者用终端装置60进行通信。作为一例,该服务器装置10中适用服务器计算机或个人计算机(PC:Personal Computer)等通用的计算机。并且,作为一例,该网络N中适用因特网或LAN(局域网(Local Area Network))、WAN(广域网(Wide Area Network))等。
图像读取装置50具备光学地读取纸介质的表单等来获取图像数据并将所获取的图像数据(以下,称为“表单图像”。)发送到服务器装置10的功能。另外,作为在此所说的表单,例如使用包含地址栏或姓名栏等多个项目的各种表单。该表单中,对这些多个项目分别记入有手写字符或打印字符等。另外,表单为文件的一例,项目为区域的一例。具体而言,如后述,服务器装置10对从图像读取装置50接收到的表单图像进行作为光学字符识别处理的一例的OCR(光学字符识别(Optical Character Recognition))处理,并获取对与多个项目的每一个相对应的图像的识别结果。另外,作为一例,该识别结果中包含表示1个字符以上的字符串的字符列等。以下,将利用服务器装置10光学地读取手写字符或打印字符等而得到的图像也称为“识别对象图像”。另外,本实施方式所涉及的识别结果并不限定于基于OCR处理的识别结果,如后述,包含字符或图形态的识别结果或字符的属性的识别结果。并且,在此所说的图是指表单图像中不是字符识别的对象的全体要素,作为一例,包含线或盖章、标志、照片等。
确认者用终端装置40A为由进行确认工作的确认者(用户)U1操作的终端装置,确认者用终端装置40B为由进行确认工作的确认者U2操作的终端装置。无需将这些多个确认者用终端装置40A、40B、……区分说明时,将确认者用终端装置40A、40B、……也统称为确认者用终端装置40。并且,当无需将这些多个确认者U1、U2、……区分说明时,将确认者U1、U2、……也统称为确认者U。作为一例,该确认者用终端装置40中适用个人计算机(PC)等通用的计算机、或智能手机、平板电脑终端等能够携带的终端装置等。另外,确认者用终端装置40中安装有用于由确认者U进行确认工作的确认工作应用程序(以下,也称为“确认工作应用appli”。),其生成确认工作用的UI(用户界面(User Interface))画面并示出。
另外,上述确认工作是指确认或修正表单图像内所包含的字符的识别结果的工作或确认表单图像内所包含的图的工作等。具体而言,作为一例,确认字符的识别结果的工作是指对使用OCR的识别结果进行批准的工作。修正字符的识别结果是指对后述的确认工作画面中的修正输入栏进行输入的工作。作为一例,确认图的工作是指确认有无盖章等的工作。
管理者用终端装置60为由系统管理者SE操作的终端装置,由系统管理者SE输入后述的确认方式信息等。作为一例,该管理者用终端装置60中适用个人计算机(PC)等通用的计算机或智能手机、平板电脑终端等能够携带的终端装置等。
图2是表示本实施方式所涉及的服务器装置10的电结构的一例的块图。
如图2所示,本实施方式所涉及的服务器装置10具备控制部12、存储部14、显示部16、操作部18及通信部20。
控制部12具备CPU(中央处理器(Central Processing Unit))12A、ROM(只读存储器(Read Only Memory))12B、RAM(随机存取存储器(Random Access Memory))12C及输入输出接口(I/O)12D,这些各部经由总线分别连接。
I/O12D上连接有包含存储部14、显示部16、操作部18及通信部20的各功能部。这些各功能部经由I/O12D连接成能够与CPU12A相互通信。
控制部12可以构成为控制服务器装置10的一部分的动作的副控制部,也可以构成为控制服务器装置10的整体的动作的主控制部的一部分。在控制部12的各块的一部分或全部例如使用LSI(大规模集成(Large Scale Integration))等集成电路或IC(集成电路(Integrated Circuit))芯片组。上述各块中可以使用单独的电路,也可以使用将一部分或全部集成而成的电路。上述各块彼此可以设置成一体,也可以是一部分块单独地设置。并且,也可以在上述各块的每一个中,其一部分单独地设置。在控制部12的集成化中,也可以使用专用电路或通用处理器,而并不限于LSI。
作为存储部14,例如使用HDD(硬盘驱动器(Hard Disk Drive))、SSD(固态驱动器(Solid State Drive))、闪存等。存储部14中存储有用于进行本实施方式所涉及的确认处理的确认处理程序14A。另外,该确认处理程序14A也可以存储于ROM12B。并且,存储部14中存储有确认处理中所使用的重要度表14B及识别框信息14C。
确认处理程序14A例如可以预先安装于服务器装置10。确认处理程序14A也可以通过存储于非易失性的存储介质或者经由网络N发布并适当安装于服务器装置10来实现。另外,作为非易失性的存储介质的例子,可以想到CD-ROM(压缩式光盘只读存储器(CompactDisc Read Only Memory))、光磁盘、HDD、DVD-ROM(数字化通用光盘只读存储器(DigitalVersatile Disc Read Only Memory))、闪存、存储卡等。
显示部16中例如使用液晶显示器(LCD:Liquid Crystal Display)或有机EL(电致发光(Electro Luminescence))显示器等。显示部16可以一体地具有触摸面板。操作部18中例如设置有键盘或鼠标等操作输入用的装置。显示部16及操作部18从服务器装置10的用户接收各种指示。显示部16显示根据从用户接收到的指示执行的处理的结果或对处理的通知等各种信息。
通信部20连接于因特网或LAN、WAN等网络N,在与图像读取装置50或确认者用终端装置40、管理者用终端装置60之间能够经由网络N进行通信。
然而,如上所述,当在一个表单内混合存在确认工作的必要性的程度不同的多个项目时,例如优选能够对每个项目实施适当的方式的确认工作。
因此,本实施方式所涉及的服务器装置10的CPU12A通过将存储于存储部14的确认处理程序14A读入RAM12C中并执行来作为图3所示的确认控制部30发挥功能。
图3是表示本实施方式所涉及的服务器装置10的功能性结构的一例的块图。
如图3所示,本实施方式所涉及的服务器装置10的CPU12A作为确认控制部30发挥功能。另外,确认控制部30为获取部、设定部、确定部、识别部及显示控制部各自的一例。并且,在本实施方式中,对作为文件的一例而适用表单,进而作为文件的区域的一例而适用表单的项目的情况进行说明。
本实施方式所涉及的确认控制部30获取将在一个表单内包含多个项目的表单电子化而得到的数据即表单图像。确认控制部30根据所获取的表单图像的项目内所包含的字符或图的确认工作的必要程度,对每个项目设定判断基准。确认控制部30进行如下控制,即,根据所设定的判断基准,对每个项目确定确认工作的方式(以下,也称为“确认方式”。)。作为一例,该必要程度根据对一个表单内的每个项目预先规定的属性信息来确定。该属性信息例如包含于识别框信息14C中,作为一例,表示为上述确认方式信息。在该情况下,确认控制部30进行如下控制,即,根据该识别框信息14C中所包含的确认方式信息确定确认方式。另外,识别框信息14C是指将与框有关的信息与对表单图像内的各项目建立对应关联的信息,如后述,作为一例,包含框的种类、框的名称、框的坐标、字符种类、确信度的阈值及确认方式等。
具体而言,确认控制部30获取与每个项目的框有关的识别框信息14C。该识别框信息14C包含上述确认方式信息作为项目的属性信息。该确认方式信息为用于对每个项目将确认方式设定为判断基准的信息。作为一例,确认方式中包含由1个确认者进行确认工作的方式(以下,也称为“单式方式”。)及由多个确认者进行确认工作的方式(以下,也称为“复式方式”。)。另外,作为确认方式,也可以包含必须由1个以上的确认者进行确认工作的方式(以下,也称为“必需方式”。)及不需要由确认者进行确认工作的方式(以下,也称为“不需要方式”。)。在该必需方式中,作为一例,可以在后述的确信度为阈值以上时选择单式方式,在确信度小于阈值时选择复式方式。并且,在不需要方式中,直接采用基于OCR处理的识别结果作为最终结果。
并且,上述确认方式信息中,可以与框的属性(作为一例,姓名栏、地址栏等。)无关地,确认方式与每个项目的框的位置(本实施方式中,以坐标表示。)建立有对应关联。在该情况下,作为一例,对于某一重要的项目的框的位置,预先将复式方式建立对应关联等即可。
并且,当上述识别框信息14C中未预先设定确认方式时,可以利用项目内所包含的字符或图的识别结果。在该情况下,上述必要程度根据该字符或图的识别结果来确定。如上所述,本实施方式所涉及的识别结果包含基于OCR处理的识别结果、字符或图的形态的识别结果及字符的属性的识别结果。例如,当“地址”项目与包含通过OCR处理识别出的“神奈川县”字符的框的位置建立有对应关联时,该“神奈川县”判定为属于“地址”项目。另外,框的位置从识别框信息14C中获取。在该情况下,“地址”项目判定为重要,必要程度设定为较高。在此所说的“较高”是指与判定为字符或图的识别结果不重要时的必要程度相比较高。在该情况下,作为判断基准的一例,设定上述单式方式、复式方式及必需方式中的任一种。
图4是供于说明与本实施方式所涉及的项目、框及字符的关系的图。
如图4所示,本实施方式所涉及的表单图像中所包含的项目中包含框线的图像和字符或图的图像。另外,在此所说的框线也为图的一例。
在该情况下,根据识别结果,判定为字符或图的形态重要时,较高地确定上述必要程度。在此所说的“较高”是指与判定为字符或图的形态不重要时的必要程度相比较高。作为字符的形态,作为一例适用字符的颜色或字符的粗细等,作为图的形态,作为一例适用图的颜色等。例如,当字符的颜色为红色时或者作为图的一例的框的颜色为红色时,该项目判定为重要的项目,必要程度设定为较高。在该情况下,作为判断基准的一例,设定上述单式方式、复式方式及必需方式中的任一种。
另一方面,也可以根据识别结果判定为字符的属性重要时,较高地确定上述必要程度。在此所说的“较高”是指与判定为字符的属性不重要时的必要程度相比较高。作为字符的属性,作为一例适用姓名属性或地址属性等。例如,当识别出的字符的属性为姓名属性时,该项目判定为重要的项目,必要程度设定为较高。在该情况下,作为判断基准的一例,设定上述单式方式、复式方式及必需方式中的任一种。
并且,作为一例,如后述的图10、图11所示,确认控制部30可以进行显示进行确认工作的画面的控制。在该情况下,作为一例,如后述的图11所示,可以进行按照必要程度对识别结果进行分类并示出的控制。
并且,也可以将上述判断基准通过比较表单图像中所包含的字符的确信度与阈值来确定,而不是通过确认方式其本身来确认。作为一例,若确信度为阈值以上,则判定为不需要进行确认工作,当确信度小于阈值,则判定为需要进行确认工作。在该情况下,确认控制部30根据上述必要程度,对每个项目设定不同的阈值。作为一例,当必要程度为一定值以上即较高时,提高(严格要求)确信度的阈值,当必要程度小于一定值即较低时,降低(宽容要求)确信度的阈值。
并且,确认控制部30也可以进行当判定为对项目的字符的属性重要时显示对项目的确认方式为需要进行确认的方式的控制。具体而言,可以考虑对每个项目预先设定表示是否重要的标示(flag)的方法。例如,若对“地址”属性设定了表示重要的标示,则“神奈川县”字符的属性即“地址”判定为重要。另外,作为一例,在此所说的“需要进行确认的方式”中包含上述单式方式、复式方式及必需方式。
并且,确认控制部30也可以进行当对项目的确信度小于阈值时显示对项目的确认方式为需要进行确认的方式的控制。关于这些显示的具体方式,将进行后述。
接着,参考图5对本实施方式所涉及的服务器装置10的具体结构进行说明。
图5是表示本实施方式所涉及的服务器装置10的具体结构的一例的块图。
如图5所示,本实施方式所涉及的服务器装置10具备识别设定部210、识别处理部220、确认处理实施判定部230、确认处理部240、最终确认处理部250及识别结果输出部260。这些各部具体地表示图3所示的确认控制部30。
本实施方式所涉及的识别设定部210将未记入表单的表单图像作为输入而进行识别设定。识别设定部210例如将图6所示的表单定义画面62显示于管理者用终端装置60并进行确认方式信息的设定。
图6是表示本实施方式所涉及的表单定义画面62的一例的主视图。
图6所示的表单定义画面62显示于管理者用终端装置60,是用于由系统管理者SE接收确认方式信息的输入的画面。
图6所示的表单定义画面62包含未记入表单的预览图像62A和识别框信息62C。作为一例,该识别框信息62C包含框的种类、框的名称、框的坐标、字符种类、确信度的阈值及确认方式,其作为识别框信息14C的一部分而存储于存储部14。在图6所示的例子中,显示有与“18岁以下的抚养儿童的姓名”有关的识别框信息62C。该确认方式中,高亮显示有选择状态的设定内容(在图6所示的例子中,选择了“单式”、“复式”、“必需”、“不需要”、“无设定”中的“单式”。)。并且,这些设定内容以能够在下拉式菜单中选择的方式显示,所选择的设定内容作为确认方式信息而被输入。
在图6所示的例子中,“单式”、“复式”及“必需”为需要进行确认的方式的一例。另外,“单式”表示单式方式,“复式”表示复式方式。并且,“必需”表示必需方式,“不需要”表示不需要方式。
图7是表示本实施方式所涉及的表单定义画面62的另一例的主视图。
与上述图6相同,图7所示的表单定义画面62显示于管理者用终端装置60,是用于由系统管理者SE接收确认方式信息的输入的画面。
图7所示的表单定义画面62包含未记入表单的预览图像62A和识别框信息62D。作为一例,该识别框信息62D包含框的种类、框的名称、框的坐标、字符种类、确信度的阈值及确认方式,其作为识别框信息14C的一部分而存储于存储部14。在图7所示的例子中,显示有与“领取者姓名”有关的识别框信息62D。该确认方式中,显示有选择状态的设定内容(在图7所示的例子中,选择了“单式”、“复式”、“必需”、“不需要”、“无设定”中的“无设定”。)。并且,这些设定内容以能够在下拉式菜单中选择的方式显示,所选择的设定内容作为确认方式信息而被输入。
另外,该“无设定”为根据确信度与其阈值的比较结果选择“不需要”、“单式”及“复式”中的任一种的方式。在该“无设定”中,作为一例,当确信度小于阈值时选择“单式”,当确信度为阈值以上时选择“不需要”。或者,也可以当确信度小于阈值时选择“复式”,当确信度为阈值以上时选择“不需要”。或者,也可以当确信度小于阈值时选择“复式”,当确信度为阈值以上时选择“单式”。
即,识别设定部210进行如下控制,即,作为识别框信息14C的一部分,将用于选择性地接收对项目的确认工作的确认方式的输入画面的一例即表单定义画面62显示于管理者用终端装置60。作为一例,识别设定部210将通过表单定义画面62接收到输入的确认方式信息作为识别框信息14C的一部分而存储于存储部14。
接着,本实施方式所涉及的识别处理部220将已记入表单的表单图像作为输入而接收识别对象图像,并输出识别对象图像的识别结果及其确信度。识别处理部220根据由识别设定部210设定的设定内容,对接收到的识别对象图像进行OCR处理,获得字符列等识别结果。另外,作为字符列等的识别方法,使用输出字符列等识别结果及其确信度的公知的技术即可。如上所述,该确信度是表示字符列等的可靠性的指标,确信度的值越高,表示识别对象图像与该字符列等一致的几率越高。作为该确信度的导出方法,例如使用日本特开2016-212812号公报(专利文献1)等中所记载的公知的技术即可。另外,在这些之中有的使用对各字符的确信度,但是作为将每个字符的确信度转换为字符列的确信度的方法,从下述所示的各种方法中选择适当的方法即可。
·将对字符列内的各字符的确信度的最大值作为字符列的确信度。
·将对字符列内的各字符的确信度的最小值作为字符列的确信度。
·将对字符列内的各字符的确信度的平均值(最频值、代表值等)作为字符列的确信度。
另外,识别处理部220除了基于上述OCR处理的识别处理以外,还执行字符或图的形态的识别处理及字符的属性的识别处理。
本实施方式所涉及的确认处理实施判定部230使用识别框信息14C中所包含的确认方式信息,对从识别处理部220输出的识别结果及其确信度判定识别结果的确认方式。即,当作为对与识别结果相对应的项目的确认方式而设定了单式方式时,与识别结果的确信度无关地,确认处理实施判定部230将识别结果的确认方式判定为单式方式。并且,当作为对与识别结果相对应的项目的确认方式而设定了复式方式时,与识别结果的确信度无关地,确认处理实施判定部230将识别结果的确认方式判定为复式方式。并且,当对与识别结果相对应的项目的确认方式为无设定时,确认处理实施判定部230根据识别结果的确信度来判定识别结果的确认方式。在该情况下,作为一例,当确信度小于阈值时,确认处理实施判定部230将识别结果的确认方式判定为单式方式或复式方式,当确信度为阈值以上时,将识别结果的确认方式判定为不需要方式。另外,判定中所使用的阈值从识别框信息14C中获取。而且,确认处理实施判定部230将判定结果输出到确认处理部240。
在此,上述中,对使用识别框信息14C中所包含的确认方式信息进行确认方式的判定的情况进行了说明,但是也可以根据对项目的确认工作的必要程度来进行确认方式的判定。另外,在此所说的必要程度是指根据由于未确认识别结果而发生的风险的大小,对每个项目规定的值。
图8是表示本实施方式所涉及的必要程度表14B的一例的图。
在图8所示的必要程度表14B中,以与多个项目的每一个建立对应关联的方式登记有由系统管理者SE等用户预先规定的必要程度。
在该情况下,确认处理实施判定部230从必要程度表14B读出对项目的必要程度,若读出的必要程度为阈值以上,则将识别结果的确认方式判定为必需,即判定为由1个以上的确认者进行确认工作的方式。另一方面,若必要程度小于阈值,则将识别结果的确认方式判定为不需要,即判定为不由确认者进行确认工作的方式。另外,关于必要程度,越是因不确认识别结果而发生的风险大的项目,登记越大的值。例如,在图8所示的例子的情况下,包含“姓名”、“地址”及“认证号”,若错误识别“认证号”,则有可能在修正中需要很多的工时或者发生很大的损失。因此,提高必要程度(在图8所示的例子中为“30”。)。另一方面,“地址”仅在进行某些核对时才会参考,因此认为即使错误识别,发生的风险也小。因此,降低必要程度(在图8所示的例子中为“10”。)。
并且,如上所述,确认处理实施判定部230也可以从必要程度表14B读出对项目的必要程度,根据读出的必要程度来改变确信度的判定中所使用的阈值,并使用改变的阈值来判定识别结果的确认方式。
本实施方式所涉及的确认处理部240根据从确认处理实施判定部230接收到的判定结果,对每个项目切换确认方式,并向确认者U反馈识别对象图像及识别结果,让确认者U进行确认工作。具体而言,当识别结果的确认方式判定为单式方式时,确认处理部240将用于进行确认工作的确认画面显示于1台确认者用终端装置40,并在确认画面上强调显示作为确认工作的对象的表单的项目。作为一例,在此所说的强调中包含使项目的图像的颜色不同、对项目的图像赋予背景色,以及对项目的图像赋予下线或边框线等装饰等。关于该确认画面的具体例,将进行后述。并且,当识别结果的确认方式判定为复式方式时,确认处理部240将用于进行确认工作的确认画面显示于多台确认者用终端装置40,并在各确认画面上强调显示作为确认工作的对象的表单的项目。即,确认处理部240对每个确认方式显示用于进行确认工作的确认画面,让确认者U进行确认工作。而且,确认处理部240将识别对象图像、识别结果及由确认者U确认的确认结果输出到最终确认处理部250。
本实施方式所涉及的最终确认处理部250根据从确认处理部240接收到的识别对象图像、识别结果及由确认者U确认的确认结果,让与确认者U不同的确认者U进行最终的确认工作。具体而言,最终确认处理部250将用于进行最终的确认工作的确认画面显示于由其他确认者U使用的确认者用终端装置40,从其他确认者U获得最终确认结果。最终确认处理部250根据来自其他确认者U的最终确认结果,在确认者U的确认结果存在错误时,退回确认处理部240,在所输入的已记入表单不齐全(作为一例,页码不足等)时,退回识别处理部220。而且,最终确认处理部250将最终的识别结果输出到识别结果输出部260。
本实施方式所涉及的识别结果输出部260输出从最终确认处理部250接收到的最终的识别结果。最终的识别结果的输出目的地并没有特别限定,可以将显示部16、确认者用终端装置40及管理者用终端装置60中的至少1个作为输出目的地。
接着,参考图9对本实施方式所涉及的服务器装置10的作用进行说明。
图9是表示基于本实施方式所涉及的确认处理程序14A的确认判定处理的流程的一例的流程图。
首先,若指示服务器装置10开始进行对已记入表单的确认判定处理,则确认处理程序14A被启动,执行以下各步骤。
在图9的步骤100中,识别处理部220接收已记入表单的输入。
在步骤102中,识别处理部220通过对已记入表单的每个项目的图像进行OCR处理来进行字符识别,从每个项目获得识别结果及其确信度。
在步骤104中,作为一例,确认处理实施判定部230按照预先规定的顺序确定项目。
在步骤106中,确认处理实施判定部230获取对在步骤104中确定的项目的识别框信息14C。
在步骤108中,确认处理实施判定部230参考在步骤106中获取的识别框信息14C的“确认方式”。
在步骤110中,确认处理实施判定部230判定在步骤108中参考的设定为“确认方式”的设定内容。当“确认方式”中设定了“单式”时(“单式”时)转移到步骤112,当“确认方式”中设定了“复式”时(“不需要”时)转移到步骤114,当“确认方式”中设定了“无设定”时(“无”时)转移到步骤116。
在步骤112中,确认处理实施判定部230将与上述项目相对应的图像的识别结果的确认工作的方式判定为单式方式,并将判定结果输出到确认处理部240。
另一方面,在步骤114中,确认处理实施判定部230将与上述项目相对应的图像的识别结果的确认工作的方式判定为复式方式,并将判定结果输出到确认处理部240。
另一方面,在步骤116中,确认处理实施判定部230使用确信度来判定与上述项目相对应的图像的识别结果的确认工作的方式,并将判定结果输出到确认处理部240。在该情况下,作为一例,当确信度小于阈值时,确认处理实施判定部230将识别结果的确认工作的方式判定为单式方式或复式方式,当确信度为阈值以上时,将识别结果的确认工作的方式判定为不需要方式。
在步骤118中,确认处理实施判定部230判定是否为最后的项目。当判定为是最后的项目时(肯定判定时),结束基于本确认处理程序14A的确认判定处理,当判定为不是最后的项目时(否定判定时),返回到步骤104,反复进行处理。
接着,参考图10及图11对由确认者U进行的确认工作进行说明。
图10是表示本实施方式所涉及的确认工作画面42的一例的主视图。
另外,确认工作画面42是指在进行确认或修正作为电子化文件的一例的表单内所包含的字符的识别结果的工作及确认表单内所包含的图的工作时,对确认者显示的画面。
图10所示的确认工作画面42显示于确认者用终端装置40,是用于由确认者U进行识别结果的确认工作的画面。图10所示的确认工作画面42为进行确认工作的画面的一例。
图10所示的确认工作画面42包含已记入表单的预览图像42A和判定结果一览42B。判定结果一览42B中,对于表示为预览图像42A的已记入表单,一览显示有确认方式判定为单式方式的项目、确认方式判定为不需要方式的项目及使用确信度判定了确认方式的项目。
在图10所示的例子中,作为项目的一例显示有“领取者姓名”、“领取者印章”及“18岁以下的抚养儿童的姓名1”。“领取者姓名”中,“确认方式”设定为“无设定”且确信度比较大,所以省略确认工作。因此,仅显示有相对应的识别对象图像(在图10所示的例子中为“富士太郎”。)。“领取者印章”中,“确认方式”设定为“不需要”,所以省略确认工作。因此,仅显示有相对应的识别对象图像(在图10所示的例子中为“富士”。)。“18岁以下的抚养儿童的姓名1”中,“确认方式”设定为“单式”,所以以单式方式实施确认工作。因此,显示有相对应的识别对象图像(在图10所示的例子中为“富士みなと”。)、基于OCR处理的识别结果及识别结果的修正输入栏。另外,“18岁以下的抚养儿童的姓名1”成为确认工作的对象,所以使项目的颜色不同来强调显示。
在此,如上所述,当对项目的字符的形态为表示重要的形态时,可以显示对项目的确认方式为需要进行确认的方式。对此,参考图10进行说明。例如,设想对作为项目的一例的“地址”的字符的形态预先设定为重要的形态的情况。作为一例,在此所说的“字符”为“神奈川县”。在该情况下,自动显示对“地址”的确认方式为需要进行确认的方式(作为一例,上述“单式”、“复式”及“必需”中的任一种方式。)。
并且,如上所述,也可以进行当对项目的确信度小于阈值时显示对项目的确认方式为需要进行确认的方式的控制。
另一方面,如图11所示,也可以按确认方式显示上述确认工作画面42。
图11是表示本实施方式所涉及的确认工作画面42的另一例的局部图。
图11所示的确认工作画面42包含每个确认方式的判定结果一览42C。另外,在图11所示的例子中,省略了预览图像42A的图示。
图11所示的判定结果一览42C通过选择标签而按确认方式显示。如上所述,通过标签能够选择的确认方式设为单式方式、复式方式、必需方式及不需要方式。另外,在图11所示的例子中示出选择了单式方式的标签的状态,在该情况下,一览显示判定为单式方式的项目。
接着,参考图12对本实施方式所涉及的服务器装置10的另一作用进行说明。
图12是表示基于本实施方式所涉及的确认处理程序14A的识别设定处理的流程的一例的流程图。
首先,若指示服务器装置10开始进行对未记入表单的识别设定处理,则确认处理程序14A被启动,执行以下各步骤。
在图12的步骤120中,识别设定部210接收未记入表单的输入。
在步骤122中,作为一例,识别设定部210按照预先规定的顺序确定项目。
在步骤124中,识别设定部210以与在步骤122中确定的项目建立对应关联的方式设定确认方式。在本实施方式中,作为一例,根据上述图6及图7所示的表单定义画面62进行确认方式的设定。
在步骤126中,识别设定部210判定是否为最后的项目。当判定为是最后的项目时(肯定判定时),结束基于本确认处理程序14A的识别设定处理,当判定为不是最后的项目时(否定判定时),返回到步骤122,反复进行处理。
如此,根据本实施方式,尽管在表单内混合存在必要性的程度不同的多个项目,但是与使用同一条件对所有项目切换确认工作的方式的情况相比,可对每个项目实施适当的方式的确认工作。
以上,作为实施方式所涉及的信息处理装置的一例,例示出服务器装置进行了说明。实施方式也可以设为用于使计算机执行服务器装置所具备的各部的功能的程序的方式。实施方式也可以设为存储有该程序的计算机能够读取的存储介质的方式。
此外,在上述实施方式中说明的服务器装置的结构为一例,在不脱离宗旨的范围内可以根据状况进行变更。
并且,在上述实施方式中说明的程序的处理的流程也为一例,在不脱离宗旨的范围内可以删除不需要的步骤或者追加新的步骤或者调换处理顺序。
并且,在上述实施方式中,对通过执行程序,利用计算机以软件构成实现实施方式所涉及的处理的情况进行了说明,但是并不限于此。实施方式例如也可以通过硬件构成或硬件构成与软件构成的组合来实现。
上述本发明的实施方式是以例示及说明为目的而提供的。另外,本发明的实施方式并不全面详尽地包括本发明,并且并不将本发明限定于所公开的方式。很显然,对本发明所属的领域中的技术人员而言,各种变形及变更是自知之明的。本实施方式是为了最容易理解地说明本发明的原理及其应用而选择并说明的。由此,本技术领域中的其他技术人员能够通过对假定为各种实施方式的特定使用最优化的各种变形例来理解本发明。本发明的范围由以上的权利要求书及其等同物来定义。

Claims (8)

1.一种信息处理装置,其具备:
获取部,获取将在一个文件内包含多个区域的文件进行电子化而得到的数据即图像数据;
设定部,根据所述图像数据的所述区域内所包含的字符或图的确认工作的必要程度,对每个所述区域将由1个确认者进行确认工作的方式及由多个确认者进行确认工作的方式设定为判断基准;及
确定部,根据所述判断基准,对每个所述区域确定所述由1个确认者进行确认工作的方式及所述由多个确认者进行确认工作的方式中的任一种方式。
2.根据权利要求1所述的信息处理装置,其中,
所述必要程度根据对所述一个文件内的每个所述区域预先规定的属性信息来确定。
3.根据权利要求1所述的信息处理装置,其还具备对所述区域内所包含的字符或图进行识别的识别部,
所述必要程度根据由所述识别部识别出的识别结果来确定。
4.根据权利要求3所述的信息处理装置,其中,
根据所述识别结果判定为所述字符或图的形态重要时,较高地确定所述必要程度。
5.根据权利要求3所述的信息处理装置,其中,
根据所述识别结果判定为所述字符的属性重要时,较高地确定所述必要程度。
6.根据权利要求3至5中任一项所述的信息处理装置,其还具备进行显示进行所述确认工作的画面的控制的显示控制部,
所述显示控制部进行如下控制,即,按照所述必要程度对由所述识别部识别出的识别结果进行分类并示出。
7.一种存储介质,其存储有使计算机作为权利要求1至6中任一项所述的信息处理装置所具备的各部发挥功能的程序。
8.一种信息处理方法,其包括如下步骤:
获取步骤,获取将在一个文件内包含多个区域的文件进行电子化而得到的数据即图像数据;
设定步骤,根据所述图像数据的所述区域内所包含的字符或图的确认工作的必要程度,对每个所述区域将由1个确认者进行确认工作的方式及由多个确认者进行确认工作的方式设定为判断基准;及
确定步骤,根据所述判断基准,对每个所述区域确定所述由1个确认者进行确认工作的方式及所述由多个确认者进行确认工作的方式中的任一种方式。
CN201910163315.0A 2018-09-25 2019-03-05 信息处理装置、存储介质及信息处理方法 Active CN110942068B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018-179373 2018-09-25
JP2018179373A JP7263721B2 (ja) 2018-09-25 2018-09-25 情報処理装置及びプログラム

Publications (2)

Publication Number Publication Date
CN110942068A CN110942068A (zh) 2020-03-31
CN110942068B true CN110942068B (zh) 2024-01-23

Family

ID=69884923

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910163315.0A Active CN110942068B (zh) 2018-09-25 2019-03-05 信息处理装置、存储介质及信息处理方法

Country Status (3)

Country Link
US (1) US10867168B2 (zh)
JP (1) JP7263721B2 (zh)
CN (1) CN110942068B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7243409B2 (ja) * 2019-04-17 2023-03-22 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001101340A (ja) * 1999-10-04 2001-04-13 Oki Electric Ind Co Ltd 文字読取装置および文字認識方法
CN101316309A (zh) * 2007-05-30 2008-12-03 富士施乐株式会社 信息处理方法和信息处理系统
CN101515325A (zh) * 2009-04-08 2009-08-26 北京邮电大学 基于字符切分和颜色聚类的数字视频中的字符提取方法
WO2010143392A1 (en) * 2009-06-09 2010-12-16 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium
CN102262615A (zh) * 2010-05-24 2011-11-30 株式会社Pfu 表单制作装置以及表单制作方法
JP2012064195A (ja) * 2010-08-16 2012-03-29 Canon Software Inc 情報処理装置、情報処理方法、プログラム及び記録媒体。
CN102708365A (zh) * 2011-03-17 2012-10-03 株式会社Pfu 信息处理装置、信息处理方法以及程序
CN102810182A (zh) * 2011-05-30 2012-12-05 冲电气工业株式会社 服务器、信息处理方法及信息处理系统
JP2013045396A (ja) * 2011-08-26 2013-03-04 Kyocera Document Solutions Inc マーク検出装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2991779B2 (ja) * 1990-06-11 1999-12-20 株式会社リコー 文字認識方法及び装置
JP3427692B2 (ja) * 1996-11-20 2003-07-22 松下電器産業株式会社 文字認識方法および文字認識装置
JP4655335B2 (ja) * 2000-06-20 2011-03-23 コニカミノルタビジネステクノロジーズ株式会社 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
DE50009493D1 (de) * 2000-10-26 2005-03-17 Mathias Wettstein Verfahren zur Erfassung des vollständigen Datensatzes mit Schriftzeichen versehener Formulare
WO2002041170A2 (en) * 2000-11-16 2002-05-23 Interlegis, Inc. System and method of managing documents
WO2002046988A1 (fr) 2000-12-08 2002-06-13 Fujitsu Limited Dispositif de transaction automatique et systeme de transaction automatique
JP2006276911A (ja) * 2005-03-25 2006-10-12 Fuji Xerox Co Ltd 電子機器およびプログラム
JP2016162211A (ja) 2015-03-02 2016-09-05 大日本印刷株式会社 情報処理装置、制御方法及びプログラム
JP6575132B2 (ja) 2015-05-14 2019-09-18 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP6903966B2 (ja) * 2017-03-16 2021-07-14 富士フイルムビジネスイノベーション株式会社 情報処理装置、情報処理システム及びプログラム
US11373388B2 (en) * 2017-07-24 2022-06-28 United States Postal Service Persistent feature based image rotation and candidate region of interest
JP7225548B2 (ja) * 2018-03-22 2023-02-21 セイコーエプソン株式会社 画像処理装置、画像処理方法および画像処理プログラム

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001101340A (ja) * 1999-10-04 2001-04-13 Oki Electric Ind Co Ltd 文字読取装置および文字認識方法
CN101316309A (zh) * 2007-05-30 2008-12-03 富士施乐株式会社 信息处理方法和信息处理系统
CN101515325A (zh) * 2009-04-08 2009-08-26 北京邮电大学 基于字符切分和颜色聚类的数字视频中的字符提取方法
WO2010143392A1 (en) * 2009-06-09 2010-12-16 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium
CN102262615A (zh) * 2010-05-24 2011-11-30 株式会社Pfu 表单制作装置以及表单制作方法
JP2012064195A (ja) * 2010-08-16 2012-03-29 Canon Software Inc 情報処理装置、情報処理方法、プログラム及び記録媒体。
CN102708365A (zh) * 2011-03-17 2012-10-03 株式会社Pfu 信息处理装置、信息处理方法以及程序
CN102810182A (zh) * 2011-05-30 2012-12-05 冲电气工业株式会社 服务器、信息处理方法及信息处理系统
JP2013045396A (ja) * 2011-08-26 2013-03-04 Kyocera Document Solutions Inc マーク検出装置

Also Published As

Publication number Publication date
CN110942068A (zh) 2020-03-31
US10867168B2 (en) 2020-12-15
JP2020052571A (ja) 2020-04-02
US20200097712A1 (en) 2020-03-26
JP7263721B2 (ja) 2023-04-25

Similar Documents

Publication Publication Date Title
JP4829920B2 (ja) フォーム自動埋込方法及び装置、グラフィカルユーザインターフェース装置
US11113556B2 (en) Information processing apparatus, program, and method that display correction candidate character for selected character based on found character string from master data
US11042733B2 (en) Information processing apparatus for text recognition, non-transitory computer readable medium for text recognition process and information processing method for text recognition
US10395131B2 (en) Apparatus, method and non-transitory storage medium for changing position coordinates of a character area stored in association with a character recognition result
US8577826B2 (en) Automated document separation
JP7243409B2 (ja) 情報処理装置及びプログラム
CN110942068B (zh) 信息处理装置、存储介质及信息处理方法
JP7263720B2 (ja) 情報処理装置及びプログラム
US11042695B2 (en) Information processing apparatus and non-transitory computer readable medium for generating input screen information
US10706581B2 (en) Image processing apparatus for clipping and sorting images from read image according to cards and control method therefor
KR101846342B1 (ko) 전자문서 관리방법을 컴퓨터에서 실행시키기 위한 프로그램을 저장한 기록매체 및 전자문서 관리 시스템
JP7268316B2 (ja) 情報処理装置及びプログラム
CN112396046A (zh) 信息处理装置及记录媒体
JP7226136B2 (ja) 情報処理装置及びプログラム
US20220198190A1 (en) Information processing apparatus and non-transitory computer readable medium
JP7268311B2 (ja) 情報処理装置及びプログラム
CN110909723B (zh) 信息处理装置及计算机可读存储介质
JP7338265B2 (ja) 情報処理装置及びプログラム
US10609246B1 (en) System and method for ascertaining and printing supplemental forms identified from content of a scanned base form
US20210064815A1 (en) Information processing apparatus and non-transitory computer readable medium
JP2021033855A (ja) 情報処理装置及び情報処理プログラム
CN114663692A (zh) 信息处理系统、信息处理方法以及计算机可读介质
CN112417936A (zh) 信息处理装置及记录媒体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
CB02 Change of applicant information
CB02 Change of applicant information

Address after: No. 3, chiban 9, Dingmu 7, Tokyo port, Japan

Applicant after: Fuji film business innovation Co.,Ltd.

Address before: No. 3, chiban 9, Dingmu 7, Tokyo port, Japan

Applicant before: Fuji Xerox Co.,Ltd.

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant