CN115050038A - 信息处理装置、信息处理方法和存储介质 - Google Patents

信息处理装置、信息处理方法和存储介质 Download PDF

Info

Publication number
CN115050038A
CN115050038A CN202210219972.4A CN202210219972A CN115050038A CN 115050038 A CN115050038 A CN 115050038A CN 202210219972 A CN202210219972 A CN 202210219972A CN 115050038 A CN115050038 A CN 115050038A
Authority
CN
China
Prior art keywords
area
character recognition
displayed
setting item
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210219972.4A
Other languages
English (en)
Inventor
白石宪一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of CN115050038A publication Critical patent/CN115050038A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/451Execution arrangements for user interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/106Display of layout of documents; Previewing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04847Interaction techniques to control parameter settings, e.g. interaction with sliders or dials
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing
    • G06Q30/0635Processing of requisition or of purchase orders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1448Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2203/00Indexing scheme relating to G06F3/00 - G06F3/048
    • G06F2203/048Indexing scheme relating to G06F3/048
    • G06F2203/04803Split screen, i.e. subdividing the display area or the window area into separate subareas

Abstract

本发明涉及信息处理装置、信息处理方法和存储介质。获得对文档的扫描图像进行字符识别处理的结果和设置为附加到文档的扫描图像的属性的设置项目。在具有显示文档扫描图像的预览区域和编辑设置项目中输入的信息的编辑区域的画面上显示,即在预览区域中显示文档的扫描图像和在编辑区域中显示设置项目和信息是受控制的。检测对在编辑区域中显示的设置项目的选择。获得设置到检测的设置项目的验证规则。从字符识别处理的结果中提取满足验证规则的字符识别区域。突出显示在预览区域上显示并被提取的字符识别区域。

Description

信息处理装置、信息处理方法和存储介质
技术领域
本公开涉及一种用于将属性设置到文档文件的技术。
背景技术
传统上,存在这样的系统,在该系统中,对诸如纸质业务表单的文档扫描并归档,通过对文档的扫描图像进行字符识别处理来提取字符信息,并将从获得的字符信息中选择的字符串设置为属性(设置信息),诸如文档的文件名和元数据。
作为进行这样的处理的系统,存在向用户呈现画面的系统,该画面具有预览区域和编辑区域,在预览区域显示文档的扫描图像,在编辑区域显示/编辑在属性的设置项目中输入的信息。
此外,还有如下的系统,该系统通过为属性的设置项目提供诸如正则表达式的验证规则,来验证适当的字符串是否被设置为属性的设置项目。日本特开2014-174923号公报公开了一种从文档图像数据中获得文本数据并基于正则表达式来验证所获得的文本数据是否合适的技术。
日本特开2014-174923号公报的技术验证由用户操作指定的文本数据是否合适。在文档图像中,存在多个可作为指定目标的文本数据,因此,用户很难指定合适的文本数据。
本公开是鉴于上述问题而做出的,其目的是将作为指定目标的字符识别区域以易于看到的方式呈现给用户。
发明内容
根据本公开的方面的信息处理装置包括:第一获得单元,其被构造为获得设置项目和对文档的扫描图像的字符识别处理的结果,所述设置项目被设置为附加到文档的扫描图像的属性;显示控制单元,其被构造为控制在具有用于显示文档的扫描图像的预览区域和用于编辑在设置项目中输入的信息的编辑区域的画面上的显示,使得在预览区域中显示文档的扫描图像,在编辑区域中显示设置项目和信息;检测单元,其被构造为检测对在编辑区域中显示的设置项目的选择;第二获得单元,其被构造为获得对由检测单元检测的设置项目设置的验证规则;以及提取单元,其被构造为从字符识别处理的结果中提取满足验证规则的字符识别区域,其中显示控制单元突出显示在预览区域上显示并由提取单元提取的字符识别区域。
本发明的进一步特征将通过以下参照附图对示例性实施例的描述而变得明显。
附图说明
图1是示出系统的构造示例的图。
图2是示出信息处理装置的硬件构造示例的图。
图3是示出系统的各个装置的软件构造示例的图。
图4A和图4B是示出由客户端应用提供的UI画面的示例的图。
图5A和图5B是示出由客户端应用提供的UI画面的示例的图。
图6是示出UI画面的控制处理流程的流程图。
图7是解释验证规则的设置示例的图。
图8是示出验证规则的设置处理流程的流程图。
图9是示出由客户端应用提供的UI画面的示例的图。
图10是示出UI画面的控制处理流程的流程图。
图11A至图11C各个是示出可选择OCR区域的突出显示的示例的图。
图12A和图12B各个是示出不可选择的OCR区域的突出显示的示例的图。
图13是示出由客户端应用提供的UI画面的示例的图;以及
图14是示出UI画面的控制处理流程的流程图。
具体实施方式
在下文中,将参照附图对本发明的实施例进行解释。以下实施例并不是为了限制与权利要求范围相关的本公开,本实施例中解释的所有特征的组合不一定是本公开的解决方案所不可或缺的。通过将相同的附图标记附加到相同的部件上,并省略对其的解释。
[第一实施例]
<系统构造>
图1是示出包括根据本实施例的信息处理装置的系统的构造示例的图。如图1所示,本实施例的系统具有扫描文档处理服务器111、客户终端121和业务服务器131,并且这些通过网络101连接,以便能够相互发送/接收数据。
扫描文档处理服务器111是如下的服务器,其进行文档处理,以设置通过扫描文档而获得的扫描图像的属性(诸如文件名和元数据等),稍后将描述细节。客户终端121例如可以是个人电脑、笔记本电脑、平板电脑、智能手机等,或其他形式/类型的电脑,稍后将描述细节。业务服务器131是进行与业务相关的处理的服务器,诸如文件管理、文档管理、订单接收和会计,稍后将描述细节。
<信息处理装置的硬件构造>
图2是示出扫描文档处理服务器111、客户终端121和业务服务器131的信息处理装置的硬件构造示例的图。信息处理装置具有用户接口201、网络接口202、CPU 203、ROM 204、RAM 205和二级存储设备206,并且各个单元经由输入/输出接口207相互连接,以便能够进行数据的发送和接收。
用户接口201具有显示器、键盘、鼠标、按钮、触摸板等,并输入和输出信息和信号。也可以将其他计算机通过远程桌面、远程外壳等连接到不包含诸如此的硬件的计算机上并进行操作。
网络接口202连接到诸如局域网的网络,并与其他计算机和网络设备进行通信。该通信方式可以是有线或无线。
CPU(中央处理单元)203读取并执行存储在ROM 204、RAM 205、二级存储设备206等中的程序,并发出指令以进行对信息处理装置的各种控制。
ROM(只读存储器)204存储合并的程序、数据等。RAM(随机存取存储器)205用作CPU203的临时存储区,诸如主存储器和工作区。二级存储设备206是存储程序的存储器,例如,可以使用HDD(硬盘驱动器)、闪存等。
<整个系统的软件构造>
图3是示出系统的软件构造示例的图。安装在各硬件中的各软件由信息处理装置的CPU 203执行,并被构造为能够如由网络连接的箭头示意性地示出的那样相互通信。
<扫描文档处理服务器111的构造>
扫描文档处理服务器111具有扫描文档处理应用311、后端应用331和数据存储器321。在本实施例中,尽管在假设扫描文档处理服务器111作为Web应用服务器运行的情况下给出了解释,但可以接受在其中安装了其他应用的其他方面。
扫描文档处理应用311是安装在扫描文档处理服务器111中的应用,并且具有API312和Web UI 313。换句话说,也可以说API(应用编程接口)312和Web UI(用户接口)313由扫描文档处理应用311提供。
数据存储器321被实现为扫描文档处理服务器111的二级存储设备206内的存储区域,并且具有扫描文档存储单元322、扫描文档作业队列323、设置信息管理单元324和扫描文档处理结果存储单元325。数据存储器321保存/储存由扫描文档处理应用311或后端应用331使用的数据,将在后面描述。数据存储器321的各个功能单元都存储各种数据,将在下文中解释。扫描文档存储单元322将扫描文档本身的文件保存为诸如JPEG的图像文件,或保存为诸如PDF(便携式文档格式)的文档文件。扫描文档作业队列323存储管理等待设置信息输入处理的作业的队列,将在后面描述。设置信息管理单元324管理需要添加到各个扫描文档的设置项目的列表、各个设置项目的名称、被设置为各个设置项目的值的格式(字符串、数字等)(将在后面描述),以及验证规则(检测规则)。扫描文档处理结果存储单元325存储字符识别(OCR(光学字符识别))处理结果和业务表单确定结果。进一步地,扫描文档处理结果存储单元325存储与各个扫描文档的设置项目相关的OCR区域信息、输入设置项目的值等。
后端应用331是安装在扫描文档处理服务器111中的应用,并且具有OCR处理单元332、业务表单处理单元333和外部系统通信单元334。
后端应用331是用于进行后台处理的应用。后端应用331负责在后台依次进行的处理,如下所示。OCR处理单元332从扫描文档存储单元322获得输入图像(扫描图像),并对获得的输入图像进行OCR处理。在OCR处理中,获得关于被识别为字符串的区域的起点坐标、宽度和高度的信息,并提取字符串,这是OCR处理的识别结果。业务表单处理单元333通过使用关于输入图像、OCR处理结果的区域模式、OCR结果的字符串等的信息来确定业务表单的类型。该确定处理可以是诸如模式识别和机器学习的任何方法。
外部系统通信单元334进行处理以将扫描文档及其处理结果发送到外部的业务服务器131。在不需要向外部发送扫描文档及其处理结果的情况下,可以省略外部系统通信单元334。
<客户终端121的构造>
客户终端121具有客户端应用351。客户端应用351是安装在客户终端121中的应用。在本实施例中,客户端应用351执行扫描文档处理应用311的Web应用。作为提供客户端应用351的一个方面,存在如下的方法,其中Web UI 313由浏览器显示,并且Web应用通过经由API 312发送和接收必要的数据来执行。或者,客户端应用351可以是计算机、智能手机等的应用,其被创建以经由API 312发送和接收必要的数据。
<业务服务器131的构造>
业务服务器131具有业务应用361和业务数据存储器362。业务应用361是安装在业务服务器131中并由业务服务器131执行的应用。业务应用361例如可以是用于文件管理、文档管理、订单接收和会计之一的业务应用。在接收由扫描文档处理服务器111处理的结果,对结果进行业务处理,并保存结果的情况下,业务应用361是必要的。在其他情况下,可以省略业务应用361。业务数据存储器362保存业务应用361所使用的数据。
<UI画面的构造示例>
这里,通过使用图来解释如下的场景,其中,在执行客户端应用351的情况下提供的UI画面上,根据预览页图像中的字符识别区域(OCR区域)将文件名和元数据设置到文档。该UI画面显示在客户终端121的用户接口201的显示器上等。
图4A和图4B是示出由客户端应用351提供的UI画面和坐标系的示例的图。图4A示出如下的场景,其中在由客户端应用351提供的UI画面上从预览页图像中的OCR区域向文档设置文件名和元数据。
UI画面400具有预览窗格401和设置信息编辑窗格410。预览窗格401具有预览区域,在该预览区域中通过扫描文档获得的扫描图像被显示为预览页图像402。预览窗格401接收诸如滚动和缩放的用户操作,并在根据所接收的用户操作的内容的状态下显示预览页图像402。设置信息编辑窗格410具有如下的编辑区域,其用于显示要附加到各种业务表单的设置项目的列表(该列表作为对扫描文档的确定结果),并用于编辑输入到设置项目中的信息。设置信息编辑窗格410具有与“文件名”相关的设置信息411和与“元数据”相关的设置信息415。
在图4A的示例中,扫描图像的业务表单的类型被确定为“采购订单”,并且在设置信息编辑窗格410中,显示根据业务表单确定结果的项目作为必要的设置项目。与“文件名”相关的设置信息411具有作为必要设置项目的设置有客户名称的设置项目“客户名称”412以及设置有日期的设置项目“日期”413,并且这些设置项目被显示以可以编辑。此外,与“元数据”相关的设置信息415具有作为必要的设置项目的设置有公司名称的设置项目“公司名称”416以及设置有公司的地址的设置项目“地址”417,并且这些设置项目都被显示以便可以编辑。设置项目412、413、416和417分别具有显示区域4121、4131、4161和4171,分别具有输入控件4122、4132、4162和4172以及分别具有前景颜色显示部分4123、4133、4163和4173。显示区域4121、4131、4161和4171分别是显示所选择的OCR区域的切出图像的区域。输入控件4122、4132、4162和4172各个是如下的区域,该区域用于显示和编辑所选择的OCR区域中的所提取的字符串。前景颜色显示部分4123、4133、4163和4173各个是如下的区域,在该区域中,显示作为突出显示部分附加到OCR区域的前景的颜色。
图4B是解释指示预览页图像402与OCR区域之间关系的正交坐标系统的图。作为通过OCR处理的字符识别结果,存在四个OCR区域421、422、423和424。OCR区域421对应于围绕字符串“采购订单”的矩形区域。OCR区域422对应于围绕字符串“11/27/2019”的矩形区域。OCR区域423对应于围绕字符串“公司名称:”的矩形区域。OCR区域424对应于围绕字符串“XYZ公司”的矩形区域。在预览页图像402中,虽然存在五个或更多个OCR区域,但在此通过省略这些区域而给予解释。在OCR区域中,起点坐标、宽度和高度中的各个均被识别。例如,以像素为单位将OCR区域421表示为:作为OCR区域421中左上角的坐标的起点坐标为(1,200,700),宽度(在X轴方向)的大小为720,高度(在Y轴方向)的大小为120。
<在指定OCR区域的情况下的UI画面示例>
在此,通过用图来解释指定OCR区域的情况下的UI画面示例。图5A和图5B是示出在由客户端应用351提供的UI画面400上通过用户操作指定(选择)OCR区域的场景的图。图5A示出指定的OCR区域适应验证规则的情况,图5B示出指定的OCR区域不适应验证规则的情况。
在选择设置项目的状态下在预览页图像中指定设置了验证规则的OCR区域的情况下,与指定的OCR区域相关的信息被显示在选择的设置项目的各个区域中。在图5A的示例中,在显示作为正被选择的设置项目511的设置项目“公司名称”的状态下选择了在预览页图像402上的OCR区域501的情况下,进行下面所示的对UI画面的控制。即,在对应于正被选择的设置项目511的显示区域512中,显示“XYZ公司”,这是在预览页图像402上选择的OCR区域501的切出图像。此外,在对应于正被选择的设置项目511的输入控件(输入区域)513中,显示“XYZ公司”,这是在显示区域512中显示的切出图像的文本数据。在对输入控件513进行诸如双击的用户操作的情况下,在输入控件513中显示的字符串进入可以通过例如使用键盘的输入操作来编辑的状态。在尚未指定与OCR区域的关联的情况下,显示“+”按钮。
另一方面,在选择设置项目的状态下在预览页图像中指定没有设置验证规则的OCR区域的情况下,在选择的设置项目的特定区域中,显示指示输入无效的信息。在图5B的示例中,在设置项目“公司名称”被选择并显示为正被选择的设置项目521的状态下,在预览页图像上选择未设置与设置项目对应的验证规则的OCR区域的情况下,进行如下所示的显示控制。即,在对应于正被选择的设置项目521的显示区域522中,仅显示“+”,并且在对应于正被选择的设置项目521的输入控件523中,显示指示不满足验证规则的消息“*无效输入。”。
被构造为显示图5A中所示的UI画面500和图5B中所示的设置项目“公司名称”的单元,可以是被构造为通过由客户端应用351提供的UI画面上的对话框或弹出窗口发出通知的其他任意单元。
<UI画面的控制处理>
接下来,通过使用图来说明,在使用图4A和图4B以及图5A和图5B中所示的由客户端应用提供的UI画面来将选择的OCR区域中的字符串设置为在文件名或元数据的设置项目中输入的信息时,UI画面的控制处理。图6是示出UI画面的控制处理流程的流程图。
扫描文档处理应用311从扫描文档作业队列323获得处理等待队列并将获得的处理等待队列提供给客户端应用351。然后,在用户选择用户希望开始处理的扫描文档作业的情况下,扫描文档处理应用311基于选择的扫描文档作业从扫描文档存储单元322获得图像文件。此外,扫描文档处理应用311从扫描文档处理结果存储单元325获得选择的扫描文档的OCR处理结果和业务表单确定结果。此外,扫描文档处理应用311从设置信息管理单元324获得各种类型的业务表单的设置项目的列表和存储在各个设置项目中的信息。扫描文档处理应用311将获得的数据提供给客户端应用351。
在S601,客户端应用351读取预览图像和OCR处理结果。在S602,客户端应用351读取设置项目的列表和存储在各个设置项目中的信息。然后,在S603,客户端应用351在预览窗格上显示预览图像。在S604,客户端应用351在设置信息编辑窗格中按各个项目的项目名称显示设置项目的列表。
通过进行上述S601至S604的处理,在客户终端121的用户接口201的显示器上,显示图4A所示的UI画面400。
在S605,客户端应用351确定设置项目[n]的UI元素是否被选择。即,客户端应用351基于对设置项目[n]的UI元素的点击事件的检测结果,确定是否对设置信息编辑窗格410中的设置项目之一的“+”按钮区域进行了诸如点击的用户操作。
在获得检测到对设置项目[n]的UI元素的点击事件并且对设置信息编辑窗格410中的设置项目之一的“+”按钮区域进行了诸如点击的用户操作的确定结果的情况下(在S605处为“是”),处理移动到S606。另一方面,在获得未检测到对设置项目[n]的UI元素的点击事件以及对设置信息编辑窗格410中的任何设置项目未进行诸如点击的用户操作的确定结果的情况下(在S605处为“否”),终止图6所示的流程。
在S606,客户端应用351显示检测到点击事件的设置项目[n]的UI元素,即,在UI元素被填充背景颜色的状态下通过用户操作选择的设置项目[n]的UI元素。填充单元可以是被构造为改变UI元素的框架线部分的颜色的单元或其他任意单元。由于这一点,用户可以识别出,接收到选择设置项目[n]的UI元素的用户操作,并且设置项目[n]的选择的UI元素被设置为处理目标。
在S607,客户端应用351检测在预览窗格中的预览页图像上通过用户操作而选择的OCR区域。具体而言,在S606处以UI元素被填充背景颜色的方式显示设置项目[n]的UI元素的状态下,在通过用户操作(例如点击)从预览窗格中的预览页图像上的多个OCR区域当中选择所需OCR区域的情况下,进行以下处理。即,客户端应用351检测对选择的OCR区域501的点击事件。
在S608,客户端应用351获得与在S607检测的OCR区域501相关的OCR区域信息。即,客户端应用351获得与OCR区域501的起点坐标、宽度和高度以及OCR结果的识别字符串相关的信息。
在S609,客户端应用351基于从设置信息管理单元324接收到的数据,来确定是否对设置项目[n]设置了验证规则。在获得设置了验证规则的确定结果的情况下(在S609为“是”),处理移动到S610。另一方面,在获得没有设置验证规则的确定结果的情况下(在S609为“否”),处理移动到S612。
在S610,客户端应用351获得对设置项目[n]设置的验证规则的内容。
在S611,客户端应用351确定选择的OCR区域中的字符串是否满足在S610获得的设置项目[n]的验证规则。在获得选择的OCR区域中的字符串满足验证规则的确定结果的情况下(在S611为“是”),处理移动到S612。另一方面,在获得选择的OCR区域中的字符串不满足验证规则的确定结果的情况下(在S611为“否”),处理移动到S613。
在S612,客户端应用351在输入控件513中显示从在S607处选择的OCR区域501中提取的字符串,并且基于在S608处获得的信息提供可以编辑的状态。在显示区域512中,显示从OCR区域501切出的图像。
通过进行上述S605至S612的处理,在客户终端121的用户接口201的显示器上,显示图5A所示的UI画面500。
在S613,客户端应用351在客户终端121的用户接口201的显示器上显示包括指示输入无效的消息的设置项目。例如,在用户接口201的显示器上,如图5B所示,在与正被选择的设置项目521相对应的输入控件523中显示指示不满足验证规则的消息“*无效输入。”。通过显示这样的消息,向用户通知与用户操作的内容相关的确定结果。
<验证规则的设置方法>
通过使用图来解释为各个扫描文档(业务表单类型)设置验证规则的方法。图7是解释对各个扫描文档(业务表单类型)设置验证规则的UI画面示例的图。UI画面(在下文中,也被称为设置UI)700可以是作为客户端应用351的设置功能而提供的UI画面。或者,UI画面700可以是由安装在客户终端121中并且不同于客户应用351的独立应用提供的UI画面。
UI画面700具有三个区域:登记文档显示区701、设置项目显示区711和详细信息显示区721。登记文档显示区域701是如下的区域,在该区域中,显示在扫描文档处理结果存储单元325中登记的文档类型的列表。图7示出了如下的示例,其中登记了三种类型的文档(业务表单),即“采购订单”、“发票”和“合同”,并且通过用户操作来选择登记文档“采购订单”702。
设置项目显示区域711是如下的区域,在该区域中,显示与选择的登记文档“采购订单”702相关联地登记的设置项目的列表。图7示出如下的示例,其中登记了四个设置项目,即“客户姓名”、“日期”、“公司名称”和“地址”,并且通过用户操作来选择登记的设置项目“公司名称”712。
详细信息显示区域721是如下的区域,在该区域中,显示与选择的设置项目相关联地设置的设置信息细节的列表。图7示出了如下的示例,在该示例中,与选择的设置项目“公司名称”712相关联地将“公司名称”设置为显示名称,并且将“文本”设置为数据类型。此外,在图7中,“/.+?公司$/”被设置为数据的验证规则。显示“/.+?公司$/”的验证规则输入栏722是通过用户操作输入任意验证规则的栏。在验证规则输入栏中输入验证规则的状态下检测到用户对保存按钮731进行诸如点击的操作的情况下,相关的设置项目被反映在业务表单中,针对该业务表单,选择在验证规则输入栏722中输入的验证规则。如图7所示,也可以通过用户操作在验证规则输入栏722中直接输入任意规则,作为验证规则的输入方法。此外,作为验证规则的输入方法,也可以在下拉列表中显示事先准备好的验证规则候选,并通过用户操作来从下拉列表中选择。
<验证规则的设置处理>
通过使用图来解释对各个扫描文档(业务表单的类型)设置验证规则的处理。图8是示出对各个扫描文档(业务表单类型)设置验证规则的处理的流程的流程图。
在S801,设置UI从扫描文档处理结果存储单元325获得业务表单的类型。
继上述之后,在S802,设置UI从设置信息管理单元324获得与业务表单类型相关的设置信息。在S803,设置UI创建在扫描文档处理结果存储单元325中登记的文档类型的列表,并且向用户显示该列表。
在S804,设置UI检测由用户进行的对业务表单类型的选择操作。对业务表单类型的选择操作是由用户从显示的文档类型当中选择用户希望设置验证规则的文档的操作。
在S805,设置UI获得在选择的业务表单类型中登记的设置项目的列表,并且显示获得的设置项目的列表。
在S806,设置UI检测由用户进行的对设置项目的选择操作。对设置项目的选择操作是由用户从显示的设置项目当中选择任意项目的操作。
在S807,设置UI获得关于选择的设置项目的设置信息列表,并且显示获得的关于设置项目的设置信息列表。
在S808,设置UI确定是否由用户对验证规则输入栏进行输入(改变操作)。在获得对验证规则输入栏进行输入(改变操作)的确定结果的情况下(在S808为“是”),处理移动到S809。另一方面,在获得没有对验证规则输入栏进行输入(改变操作)的确定结果的情况下(在S808为“否”),终止图8中所示的流程。
在S809,设置UI获得在验证规则输入栏中输入的内容。验证规则可以是进行关于输入内容的验证的任何规则,诸如正则表达式、按字符编码的限制、字符数的上限以及是否包括任意字符。
为了简化解释,通过使用通过设置正则表达式的规则进行验证的示例来做出解释。在验证规则输入栏722中,设置只能输入诸如“/.+?公司$/”的字符串的验证规则,该字符串包括字符串顶部的一个或多个字符,其末端为“公司”。进一步地,可以通过检查作为将正则表达式应用于获得的OCR区域中的字符串的结果可提取的字符串是否与OCR区域中的字符串相匹配来检查是否满足设置的正则表达式。
在S810,设置UI确定是否如上所述在验证规则输入栏中输入了正确的验证规则。在获得没有以正确格式输入验证规则的确定结果的情况下(在S810为“否”),处理移动到S811。另一方面,在获得以正确格式输入验证规则的确定结果的情况下(在S810为“是”),处理移动到S812。
在S811,设置UI要求用户在验证规则输入栏中再次输入验证规则。例如,进行处理以显示等提示用户在验证规则输入栏中再次输入验证规则的消息。
在S812,设置UI检测到用户的保存操作。
在S813,设置UI将保存时改变的设置信息发送到设置信息管理单元324,将改变的设置信息反映在相应的设置信息中,并且更新登记的设置信息。
通过进行上述处理,对设置项目设置验证规则。
<适用验证规则的UI画面的构造示例>
通过使用图来说明应用了验证规则的UI画面的构造示例。图9是解释在由客户端应用351提供的UI画面上选择根据验证规则的元数据的设置项目的场景的图。
通过到目前为止的处理,解释了在设置验证规则和将设置预览页图像中的OCR区域的字符串设置在设置了验证规则的设置项目中时的UI画面的控制处理。注意,在这种情况下,需要用户从整个预览页图像中找到在预览窗格中预览页图像中哪个地方存在对设置了验证规则的项目有效的字符串,因此,对于设置操作需要花费时间和精力。
因此,在本实施例中,通过突出显示满足对设置项目设置的验证规则的OCR区域,使得可以在进行用户操作之前容易地呈现可以输入的OCR区域。
在预览窗格401中显示的预览页图像402中,通过以下方式进行显示控制:在满足验证规则的OCR区域中以交叠的方式显示其前景变成红色的突出显示部分901。此外,对于设置信息编辑窗格410中与“元数据”相关的设置信息415,进行显示控制,通过该显示控制,在目标设置项目“公司名称”的框架线部分,以交叠的方式显示突出显示部分911,其颜色为红色等,与突出显示部分901的颜色相同。虽然解释了突出显示部分901和突出显示部分911都是红色的情况,但突出显示部分901和突出显示部分911的颜色不限于红色,突出显示部分901的颜色可以与突出显示部分911的颜色不同,并且可以使用任何颜色,只要能通知用户目标地点即可。通过进行显示控制,以按如上所述的交叠方式显示突出显示部分901和突出显示部分911,在通过用户操作选择设置项目的情况下,可以通知用户与设置项目相对应的OCR区域并满足验证规则。
<突出显示处理>
这里,通过使用图来解释对满足验证规则的OCR区域进行突出显示的处理流程。图10是示出突出显示处理的流程的流程图。假设选择了由用户设置了任意验证规则的设置项目[n]。即,假定已经完成了利用图8解释的验证规则的设置以及到图6所示的任意设置项目[n](606)的选择为止的处理。
在S1001,客户端应用351获得对选择的设置项目[n]设置的验证规则。
在S1002,对所有OCR区域重复进行S1003和S1004的处理。
即,从未处理的OCR区域中选择处理目标OCR区域,并且在针对选择的OCR区域进行S1003和S1004处的处理。在针对处理目标OCR区域的处理完成的情况下,再次从未处理的OCR区域中选择处理目标OCR区域。在没有未处理的OCR区域的情况下,图10中所示的流程被终止。
在S1003,客户端应用351确定(检查)在处理目标OCR区域中提取的字符串是否满足验证规则。在获得满足验证规则的确定结果的情况下(在S1003处为“是”),处理移动到S1004。在获得不满足验证规则的判断结果的情况下(在S1003处为“否”),跳过S1004,终止对处理目标OCR的处理。因为这样,不对处理目标OCR区域进行突出显示。
在S1004,进行对处理目标OCR区域进行突出显示的处理。即,对于满足验证规则的OCR区域,进行显示以改变前景颜色。被构造为进行突出显示的单元不限于被构造为改变前景颜色的单元,并且例如可以是诸如被构造为改变围绕OCR区域的框架线的单元的其他单元。
这里,通过使用图9所示的扫描图像示例来解释图10中所示的流程。
假定对图9中的设置项目“公司名称”设置验证“○○公司”(○○为任意字符)的字符串是否为诸如“/.+?公司$/”的正则表达式的规则。指定存在“XYZ公司”的区域,作为满足该验证规则的OCR区域。然后,对于“XYZ公司”,进行突出显示,并进行显示控制,通过该显示控制,包括“XYZ公司”的OCR区域的前景颜色被显示为红色,作为突出显示部分901。在进行突出显示时的前景颜色不限于红色。只要求该颜色与OCR区域中提取的字符串的颜色和外围的背景颜色不同,并且能够通知OCR区域的用户。
这里,通过使用图来解释上述突出显示部分的另一示例。图11A至图11C分别是示出图9中所示的突出显示部分的另一示例的图。
如图11A所示,在预览页面图像402中,也可以使用气球状对话框1101作为突出显示部分,该气球状对话框是如下的显示,该显示与满足验证规则的OCR区域相邻、在OCR区域的上侧、以交叠的方式显示,并且在该显示中可以输入(设置)文本等。此外,还可以将指示可以从目标OCR区域获得满足验证规则的字符串的消息,诸如“○可以输入”,添加到在气球状对话框1101内显示的文本。此外,也可以使用提示框来代替气球状对话框1101。
进一步,如图11B所示,预览页图像402中,也可以使用图标1102作为突出显示部分,该图标以交叠的方式显示在满足验证规则的OCR区域在突出显示处理之前存在的地方,并且OCR区域从该地方向下移动。图标1102可以是双圆的图形(标记)或其他形状的图形。
此外,作为突出显示部分,如图11C所示,在预览页图像402中,也可以通过将满足验证规则的OCR区域以外的区域(字符识别区域以外的区域)变灰等,使该区域的颜色与白色不同。也就是说,也可以将矩形区域1103以与矩形区域1103以外的区域的颜色不同的颜色来显示。
即使在图6中S611处选择的OCR区域中的字符串不满足验证规则的情况下,也可以在能够输入的OCR区域中检测到诸如悬停和点击的选择操作时,在预览页图像402中以交叠的方式显示图11A至图11C所示的突出部分。
另一方面,也可以在不能选择的OCR区域中检测到诸如悬停和点击的选择操作时,在预览页图像402中以交叠的方式显示指示不能选择的突出显示部分。
通过使用图来解释示例,其中,在检测到对不同于可以选择的字符识别区域的字符识别区域的选择操作的情况下,突出显示不能选择的字符串,这是对应于该操作的字符识别区域。图12A和图12B分别是示出不能选择(不能设置)的字符串的突出显示的示例的图。
如图12A所示,在预览页面图像402中,也可以使用如下的气球状对话框1201,作为指示不能选择的突出显示部分,该气球状对话框是如下的显示,该显示与不满足验证规则的OCR区域相邻、在OCR区域的上侧、以交叠的方式显示,并且在该显示中不能输入(设置)文本等。此外,还可以将指示不能从目标OCR区域获得不满足验证规则的字符串的消息,诸如“×不能输入”,添加到在气球状对话框1201内显示的文本。此外,也可以使用提示框来代替气球状对话框1201。
进一步,如图12B所示,在预览页图像402中,也可以使用图标1202,作为指示选择是不可能的突出显示部分,该图标以交叠的方式显示在不满足验证规则的OCR区域在突出显示处理之前存在的地方,并且OCR区域从该地方向下移动。图标1202可以是x的图形(“错误”标记)或其他形状的图形。
如上所述,使得可以以容易看到的方式向用户呈现OCR区域,该OCR区域可以被输入到设置了验证规则的设置项目中。此外,还可以将OCR区域以容易看到的方式呈现给用户,该OCR区域不能被输入到设置了验证规则的设置项目中,也不能被选择。
图13是示出在处理包括满足正则表达式且被唯一确定的OCR区域的扫描图像时显示的UI画面的示例的图。在预览页图像402中存在满足正则表达式并被唯一确定的OCR区域的情况下,在包括OCR区域的区域中,以交叠的方式显示进行突出显示的显示部分,并显示与相应的设置信息编辑窗格中的设置项目对应的字符串。此外,在设置信息编辑窗格中,显示与相应显示部分的颜色相同的颜色。在图13中,在预览页图像402中对应于“日期:”的OCR区域中的“11/27/2019”上,显示突出显示部分1301,在对应于“公司名称:”的OCR区域中的“XYZ公司”上,显示突出显示部分1302。在突出显示部分1301中,蓝色前景在OCR区域中以交叠的方式显示,在突出显示部分1302中,红色前景在OCR区域中以交叠的方式显示。进一步地,在设置信息编辑窗格410中,在预览窗格401中与突出显示部分对应的设置项目中,自动显示相应的信息。
即,关于设置项目“日期”,在显示区域中,自动显示“11/27/2019”的图像,在输入控件中,自动显示“11/27/2019”的文本数据,在前景颜色显示部分,自动显示与突出显示部分1301的颜色相同的蓝色。关于设置项目“公司名称”,在显示区域中,显示“XYZ公司”的图像,在输入控件中,显示文本数据“XYZ公司”,在前景颜色显示部分,显示与突出显示部分1302相同颜色的红色。
<UI画面的控制处理>
在此,用图解释自动地将满足正则表达式且唯一地确定的OCR区域中的字符串设置在设置项目中时的UI画面的控制处理流程。图14是示出UI画面的控制处理流程的流程图。
假定已经完成由用户对任意设置项目的任意验证规则的设置、对OCR区域的提取、在预览窗格中对预览图像的显示以及对在设置信息编辑窗格中设置项目列表的显示。也就是说,假定已经完成通过使用图8解释的验证规则的设置和直到显示图6中的各个设置项目(S604)为止的处理。
在S1401,客户端应用351对所有设置项目重复进行S1402至S1408的处理。即,从未处理的设置项目当中选择处理目标设置项目,并且对于选择的设置项目,进行S1402至S1408的处理。在对处理目标设置项目的处理完成的情况下,从未处理的设置项目当中再次选择处理目标设置项目。在没有未处理的设置项目的情况下,终止图14所示的流程。
在S1402处,客户端应用351确定(检查)是否对选择的设置项目设置验证规则。在获得选择的设置项目没有验证规则且没有对选择的设置项目设置验证规则的确定结果的情况下(在S1402为“否”),处理移动到下一个设置项目的处理。在获得选择的设置项目具有验证规则并且对选择的设置项目设置了验证规则的确定结果的情况下(在S1402为“是”),处理移动到S1403。
在S1403处,客户端应用351获得对选择的设置项目设置的验证规则。
在S1404,对所有OCR区域重复进行S1405至S1406的处理。
即,从未处理的OCR区域当中选择处理目标OCR区域,并且对于选择的OCR区域,进行S1405至S1406的处理。在完成对处理目标OCR区域的处理的情况下,再次从未处理的OCR区域当中选择处理目标OCR区域。在不存在未处理的OCR区域的情况下,处理移动到S1407。
在S1405处,对于在S1404处选择的OCR区域,确定(检查)是否存在满足所获得的验证规则的OCR。在获得满足所获得的验证规则的OCR区域不存在的确定结果的情况下(在S1405为“否”),跳过S1406。然后,处理返回到S1404,并且在S1404,选择未处理的OCR区域作为处理目标。另一方面,在获得满足所获得的验证规则的OCR区域存在的确定结果的情况下(在S1405为“是”),处理移动到S1406。
在S1406处,存储选择的OCR区域并计算满足验证规则的OCR区域的数量。
在对所有OCR区域完成了是否满足验证规则的检查的情况下,处理移动到S1407。
在S1407,确定是否仅一个OCR区域满足验证规则。在获得仅一个OCR区域满足验证规则的确定结果的情况下(在S1407为“是”),处理移动到S1408。另一方面,在获得存在两个或更多个OCR区域满足验证规则的确定结果的情况下(在S1407为“否”),跳过S1408。
在存在未处理的设置项目的情况下,处理返回到S1401。
在S1408处,客户端应用351在输入控件中显示满足验证规则的OCR区域中的字符串。
对所有设置项目进行上述处理。
这里,通过使用图13来解释在应用图14所示流程的情况下的UI画面的示例。假设对设置项目“日期”413的显示区域1311设置,用于验证“□□/□□/□□□□”形式的字符串(□是0到9的任意字符)是诸如“//d{2}\/(\d{2})\/(\d{4})$/”的正则表达式的规则。假设对设置项目“公司名称”416的显示区域1312设置,用于验证“○○公司”(○○为任意字符)形式的字符串是否为诸如“/.+?公司$/”的正则表达式的规则。假设没有对其他设置项目设置验证规则。
此时,关于“文件名”,首先,检查是否对设置项目“客户名称”412设置了验证规则,并且没有对该设置项目设置验证规则,因此,处理移动到对下一个设置项目“日期”413的处理。对设置项目“日期”413,设置了上述验证规则,因此,进行处理以从所有OCR区域中提取满足该验证规则的OCR区域。在所有OCR区域中满足该验证规则的OCR区域仅一个,即在添加了突出显示部分1301的OCR区域中的“11/27/2019”,因此,该OCR区域被自动设置到设置项目“日期”413的显示区域1311。也就是说,OCR区域的切出图像被自动输入显示区域1311中。进一步地,在“日期”413的输入控件中,自动输入作为从OCR区域提取的字符串的“11/27/2019”。
接下来,关于“元数据”,处理转移到对设置项目“公司名称”416的处理。对于设置项目“公司名称”416,设置了上述验证规则,因此,在所有OCR区域中,提取了满足该验证规则的OCR区域。在所有OCR区域中,满足该验证规则的OCR区域只有一个,即在添加了突出显示部分1302的OCR区域中的“XYZ公司”,因此,该OCR区域被自动设置到设置项目“公司名称”的显示区域1312。也就是说,OCR区域的切出图像被自动输入显示区域1312中。进一步,在“公司名称”416的输入控件中,自动输入作为从OCR区域提取的字符串的“XYZ公司”。
最后,处理移动到对设置项目“地址”417的处理。检查是否对设置项目“地址”417设置了验证规则,并且没有对该设置项目设置验证规则,因此,完成对所有设置项目的检查并终止处理。
通过进行如上所述的处理,显示图13所示的状态的UI画面,因此,使得与设置项目的验证规则相关联的OCR区域更容易呈现给用户。
其他实施例
本发明的实施例还可以由系统或装置的计算机实现,该计算机读出并执行记录在存储介质(也可以更完整地称为“非暂时性计算机可读存储介质”)上的计算机可执行指令(例如,一个或多个程序)以执行上述一个或多个实施例的功能和/或该计算机包括一个或多个电路(例如,应用特定集成电路(ASIC))以执行上述一个或多个实施例的功能,以及由该系统或装置的计算机执行的方法实现,例如,通过从存储介质读出并执行计算机可执行指令以执行上述一个或更多个实施例的功能和/或控制一个或更多个电路以执行上述一个或更多个实施例的功能。计算机可包括一个或更多个处理器(例如,中央处理单元(CPU)、微处理单元(MPU)),并可包括独立的计算机网络或独立的处理器,以读出和执行计算机可执行指令。计算机可执行指令可以例如从网络或存储介质提供给计算机。存储介质例如可以包括:硬盘、随机存取存储器(RAM)、只读存储器(ROM)、分布式计算系统的存储器、光盘(如光盘(CD)、数字多功能光盘(DVD)或蓝光光盘(BD)TM)、闪存设备、存储卡等中的一个或多个。
其它实施例
本发明的实施例还可以通过如下的方法来实现,即,通过网络或各种存储介质将执行上述实施例的功能的软件(程序)提供给系统或装置,该系统或装置的计算机或是中央处理单元(CPU)、微处理单元(MPU)读出并执行程序的方法。
虽然本发明已经参照示例性实施例进行了描述,但应当理解,本发明并不限于所公开的示例性实施例。所附权利要求的范围应给予最广泛的解释,以便包括所有此类修改和等同的结构和功能。
根据本公开,可以以容易看到的方式向用户呈现作为指定目标的字符识别区域。

Claims (10)

1.一种信息处理装置,其包括:
第一获得单元,其被构造为获得设置项目和对文档的扫描图像的字符识别处理的结果,所述设置项目被设置为附加到文档的扫描图像的属性;
显示控制单元,其被构造为控制在具有用于显示文档的扫描图像的预览区域和用于编辑在设置项目中输入的信息的编辑区域的画面上的显示,使得在预览区域中显示文档的扫描图像,并且在编辑区域中显示设置项目和信息;
检测单元,其被构造为检测对在编辑区域中显示的设置项目的选择;
第二获得单元,其被构造为获得对由检测单元检测的设置项目设置的验证规则;以及
提取单元,其被构造为从字符识别处理的结果中提取满足验证规则的字符识别区域,其中
显示控制单元将在预览区域上显示并由提取单元提取的字符识别区域突出显示。
2.根据权利要求1所述的信息处理装置,其中
检测单元还检测对画面上的预览区域的操作,并且
在检测单元在预览区域中显示的扫描图像上检测到对由提取单元提取的字符识别区域的操作的情况下,显示控制单元通过显示与所提取的字符识别区域相邻的消息或标记来将所提取的字符识别区域突出显示,或通过将所提取的字符识别区域以外的区域变灰,来将所提取的字符识别区域突出显示。
3.根据权利要求2所述的信息处理装置,其中
在检测单元检测到对与在预览区域上显示并由提取单元提取的字符识别区域不同的字符识别区域的操作的情况下,显示控制单元通过使用与检测到的操作相对应的字符识别区域相邻的并指示是不能在设置项目中输入的信息的消息或标记来进行突出显示。
4.根据权利要求1所述的信息处理装置,其中
在仅有由提取单元提取的一个字符识别区域情况下,显示控制单元自动地在编辑区域中显示包括在提取的字符识别区域中的字符串,作为在相应的设置项目中输入的信息。
5.根据权利要求1所述的信息处理装置,其中
显示控制单元通过将颜色附加到提取的字符识别区域的前景来进行突出显示。
6.根据权利要求5所述的信息处理装置,其中
画面具有前景颜色显示部分,所述前景颜色显示部分显示附加到提取的字符识别区域的前景的颜色,并且
在通过将颜色附加到提取的字符识别区域的前景来进行突出显示的情况下,显示控制单元在前景颜色显示部分中显示附加到提取的字符识别区域的前景的颜色。
7.根据权利要求1所述的信息处理装置,其中
在检测单元检测到对设置项目的选择的情况下,显示控制单元将相应的设置项目突出显示。
8.根据权利要求1所述的信息处理装置,其中
属性包括文档的扫描图像的文件名和文档的扫描图像的元数据。
9.一种信息处理方法,其包括以下步骤:
第一获得步骤,获得设置项目和对文档的扫描图像的字符识别处理的结果,所述设置项目被设置为附加到文档的扫描图像的属性;
显示控制步骤,控制在具有用于显示文档的扫描图像的预览区域和用于编辑在设置项目中输入的信息的编辑区域的画面上的显示,使得在预览区域中显示文档的扫描图像,并且在编辑区域中显示设置项目和信息;
检测步骤,检测对在编辑区域中显示的设置项目的选择;
第二获得步骤,获得对在检测步骤中检测到的设置项目设置的验证规则;以及
提取步骤,从字符识别处理的结果中提取满足验证规则的字符识别区域,其中
在显示控制步骤,将在预览区域上显示并在提取步骤提取的字符识别区域突出显示。
10.一种非临时性计算机可读存储介质,其存储有用于使计算机执行以下步骤的程序:
第一获得步骤,获得设置项目和对文档的扫描图像的字符识别处理的结果,所述设置项目被设置为附加到文档的扫描图像的属性;
显示控制步骤,控制在具有用于显示文档的扫描图像的预览区域和用于编辑在设置项目中输入的信息的编辑区域的画面上的显示,使得在预览区域中显示文档的扫描图像,并且在编辑区域中显示设置项目和信息;
检测步骤,检测对在编辑区域中显示的设置项目的选择;
第二获得步骤,获得对在检测步骤中检测到的设置项目设置的验证规则;以及
提取步骤,从字符识别处理的结果中提取满足验证规则的字符识别区域,其中
在显示控制步骤,将在预览区域上显示并在提取步骤提取的字符识别区域突出显示。
CN202210219972.4A 2021-03-09 2022-03-08 信息处理装置、信息处理方法和存储介质 Pending CN115050038A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2021-037164 2021-03-09
JP2021037164A JP2022137608A (ja) 2021-03-09 2021-03-09 情報処理装置、情報処理方法およびプログラム

Publications (1)

Publication Number Publication Date
CN115050038A true CN115050038A (zh) 2022-09-13

Family

ID=83156836

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210219972.4A Pending CN115050038A (zh) 2021-03-09 2022-03-08 信息处理装置、信息处理方法和存储介质

Country Status (3)

Country Link
US (1) US11620434B2 (zh)
JP (1) JP2022137608A (zh)
CN (1) CN115050038A (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022091530A (ja) * 2020-12-09 2022-06-21 キヤノン株式会社 情報処理装置、画像処理システム、制御方法、並びにプログラム

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040044958A1 (en) * 2002-08-27 2004-03-04 Wolf John P. Systems and methods for inserting a metadata tag in a document
US20060044605A1 (en) * 2004-08-24 2006-03-02 Schneider Charles R Systems, methods and computer program products for labeled forms processing
US7689037B2 (en) * 2004-10-22 2010-03-30 Xerox Corporation System and method for identifying and labeling fields of text associated with scanned business documents
US8171394B2 (en) * 2005-06-24 2012-05-01 Microsoft Corporation Methods and systems for providing a customized user interface for viewing and editing meta-data
US20080162603A1 (en) * 2006-12-28 2008-07-03 Google Inc. Document archiving system
EP2015554B1 (en) * 2007-07-13 2012-05-16 Ricoh Company, Ltd. User interface generating method, image forming apparatus, and computer program product
US8650221B2 (en) * 2007-09-10 2014-02-11 International Business Machines Corporation Systems and methods to associate invoice data with a corresponding original invoice copy in a stack of invoices
US20090089315A1 (en) * 2007-09-28 2009-04-02 Tractmanager, Inc. System and method for associating metadata with electronic documents
JP2010072842A (ja) * 2008-09-17 2010-04-02 Konica Minolta Business Technologies Inc 画像処理装置および画像処理方法
US20100289757A1 (en) * 2009-05-14 2010-11-18 Budelli Joey G Scanner with gesture-based text selection capability
US8793574B2 (en) * 2011-03-16 2014-07-29 Ancestry.Com Operations Inc. Methods and systems for identification and transcription of individual ancestral records and family
US8996981B2 (en) * 2011-09-06 2015-03-31 Onevizion, Inc. Managing forms in electronic documents
US10769357B1 (en) * 2012-12-19 2020-09-08 Open Text Corporation Minimizing eye strain and increasing targeting speed in manual indexing operations
US9317484B1 (en) * 2012-12-19 2016-04-19 Emc Corporation Page-independent multi-field validation in document capture
US9430453B1 (en) * 2012-12-19 2016-08-30 Emc Corporation Multi-page document recognition in document capture
US9032545B1 (en) * 2012-12-19 2015-05-12 Emc Corporation Securing visual information on images for document capture
US20140258828A1 (en) * 2013-03-11 2014-09-11 Brent Lymer Pick-and-place webform autofill
JP2014174923A (ja) 2013-03-12 2014-09-22 Ricoh Co Ltd 文書処理装置、文書処理方法、および文書処理プログラム
US9652445B2 (en) * 2013-05-29 2017-05-16 Xerox Corporation Methods and systems for creating tasks of digitizing electronic document
US9323447B2 (en) * 2013-10-15 2016-04-26 Sharp Laboratories Of America, Inc. Electronic whiteboard and touch screen method for configuring and applying metadata tags thereon
US10176159B2 (en) * 2014-05-05 2019-01-08 Adobe Systems Incorporated Identify data types and locations of form fields entered by different previous users on different copies of a scanned document to generate an interactive form field
WO2018109601A1 (en) * 2016-11-29 2018-06-21 Y Soft Scanning Solutions s.r.o. System for distributing image scanning tasks to networked devices
JP6953230B2 (ja) * 2017-08-22 2021-10-27 キヤノン株式会社 スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム
US10452904B2 (en) * 2017-12-01 2019-10-22 International Business Machines Corporation Blockwise extraction of document metadata
JP6983675B2 (ja) * 2018-01-23 2021-12-17 キヤノン株式会社 スキャン画像に関連する情報を設定するための装置、方法、プログラム、およびシステム
US10511730B1 (en) * 2018-06-07 2019-12-17 Kyocera Document Solutions Inc. Method to create a secure distributed data validation system using a distributed storage system and artificial intelligence
JP7225017B2 (ja) * 2019-04-19 2023-02-20 キヤノン株式会社 タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム
JP7317561B2 (ja) * 2019-04-19 2023-07-31 キヤノン株式会社 タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム
JP7434001B2 (ja) * 2020-03-13 2024-02-20 キヤノン株式会社 情報処理装置、プログラム、情報処理方法

Also Published As

Publication number Publication date
US11620434B2 (en) 2023-04-04
US20220292251A1 (en) 2022-09-15
JP2022137608A (ja) 2022-09-22

Similar Documents

Publication Publication Date Title
US20100309512A1 (en) Display control apparatus and information processing system
US20090021530A1 (en) Display control apparatus and display control method
US10180849B2 (en) Apparatus, information processing system, information processing method, and computer program product
US11836442B2 (en) Information processing apparatus, method, and storage medium for associating metadata with image data
US11303769B2 (en) Image processing system that computerizes documents with notification of labeled items, control method thereof, and storage medium
CN101729713B (zh) 显示控制装置、图像形成装置以及显示器控制方法
EP3598340A1 (en) Information processing apparatus, method of processing information and carrier means
CN105912315A (zh) 信息处理装置、信息处理系统、信息处理方法和计算机程序产品
US20140068454A1 (en) Printing system including a server that generates user interfaces for a control panel of the printing system
CN109976681B (zh) 信息处理装置、图像形成装置和计算机可读取的记录介质
CN115050038A (zh) 信息处理装置、信息处理方法和存储介质
US11887390B2 (en) Information processing apparatus, information processing system, information processing method, and non-transitory recording medium
US20210166284A1 (en) Information processing system, information processing method, and non-transitory recording medium
KR20210040260A (ko) 메타데이터를 설정하기 위한 화면의 표시를 제어하는 방법, 비일시적 저장 매체 및 장치
US11588945B2 (en) Data input support apparatus that displays a window with an item value display area, an overview image display area, and an enlarged image display area
CN100588218C (zh) 图像形成装置和电子邮件传送服务器
JP7035474B2 (ja) 文書処理装置およびプログラム
US20190141206A1 (en) Image processing system, information processing device, image processing device and non-transitory recording medium
US11632479B2 (en) Display apparatus, image processing apparatus, and non-transitory computer readable medium for displaying images to accept and confirm settings
JP2020177355A (ja) 情報処理装置およびプログラム
JP7404943B2 (ja) 情報処理装置及び情報処理プログラム
US11606469B2 (en) Image processing system that computerizes document, control method thereof, and storage medium
JP2019074875A (ja) 情報処理装置、制御方法、およびプログラム
US20230141058A1 (en) Display apparatus and method for controlling display apparatus
US20220021774A1 (en) Information processing apparatus and non-transitory computer readable medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination