CN114611475A - 信息处理装置、信息处理方法和计算机可读介质 - Google Patents

信息处理装置、信息处理方法和计算机可读介质 Download PDF

Info

Publication number
CN114611475A
CN114611475A CN202110755840.9A CN202110755840A CN114611475A CN 114611475 A CN114611475 A CN 114611475A CN 202110755840 A CN202110755840 A CN 202110755840A CN 114611475 A CN114611475 A CN 114611475A
Authority
CN
China
Prior art keywords
image
information processing
user
form image
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110755840.9A
Other languages
English (en)
Inventor
金谷凌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Business Innovation Corp filed Critical Fujifilm Business Innovation Corp
Publication of CN114611475A publication Critical patent/CN114611475A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0482Interaction with lists of selectable items, e.g. menus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/0485Scrolling or panning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/0485Scrolling or panning
    • G06F3/04855Interaction with scrollbars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines
    • G06F40/18Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/194Calculation of difference between files

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Facsimiles In General (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

提供信息处理装置、信息处理方法和计算机可读介质。信息处理装置具有处理器,所述处理器在同一画面中显示作为表单的类别的设定对象的表单图像、按照表单的类别预先登记的多个登记图像和针对所述表单图像设定表单的类别的设定操作键,参照了所述多个登记图像的用户针对所述表单图像设定与所述设定操作键对应的表单的类别。

Description

信息处理装置、信息处理方法和计算机可读介质
技术领域
本发明涉及信息处理装置、信息处理方法和计算机可读介质。
背景技术
在日本特开2002-334333号公报中公开了一种信息处理装置,该信息处理装置进行被读入的文档图像的格式判别,按照每个文档格式进行分类,其中,所述信息处理装置具有:判别单元,其根据希望进行格式判别的文档图像与文档格式已知的登记文档图像之间的相似度,判别希望进行格式判别的文档图像的格式;保持单元,其将用于判定是否需要由用户确认所述判别单元的判别结果的判定信息与被进行了所述格式判别后的文档图像对应着保持;以及用户界面单元,其提示根据所述保持单元中所保持的判定信息而被判定为需要由用户确认的文档图像,促使进行分类的确认、修正。
公知有由于即使保存文件本身也很难活用文件中记载的信息,因此对文件的图像数据进行OCR(Optical Character Recognition:光学字符辨识)处理、使文件的信息电子化而进行处理的信息处理装置。
在文件的图像数据是具有预定的形式的表单的图像数据即表单图像的情况下,信息处理装置有时要将表单图像与按照表单的每个类别预先登记的多个登记图像进行比较,以判别表单图像的类别。
该情况下,有时在信息处理装置中会产生无法判别类别的类别不明的表单图像、或判别成错误类别的表单图像,因此,需要人一边参照登记图像,一边改正信息处理装置对表单图像的类别进行判别的判别结果。
但是,在现有的针对表单图像的类别改正作业中,用户例如要从多个登记图像中的、与表单图像之间的相似度高的登记图像中逐张地将登记图像依次显示在画面中,并对表单图像和画面中显示的登记图像通过视觉进行对比,设定表单图像的类别。因此,用户需要进行对显示有登记图像的画面进行切换的操作,直到示出如下画面为止,该画面显示有被认为是与表单图像的类别相同类别的登记图像。
发明内容
本发明的目的在于,提供如下的信息处理装置和信息处理方法、以及计算机可读介质:与一边切换画面一边参照多个登记图像来设定表单图像的类别的情况相比,能够削减对表单图像设定类别时的用户的操作量。
根据本发明的第1方案,提供一种信息处理装置,其具有处理器,所述处理器在同一画面中显示作为表单的类别的设定对象的表单图像、按照表单的类别预先登记的多个登记图像和针对所述表单图像设定表单的类别的设定操作键,参照了所述多个登记图像的用户针对所述表单图像设定与所述设定操作键对应的表单的类别。
根据本发明的第2方案,所述处理器使所述多个登记图像中的被用户选择出来的登记图像所表示的表单的类别与所述设定操作键对应。
根据本发明的第3方案,所述处理器按照用户的指示,使所述多个登记图像一边滚动一边在所述画面中依次显示,使在所述画面中显示的登记图像所表示的表单的类别与所述设定操作键对应。
根据本发明的第4方案,所述处理器还将用于供用户对所述表单图像进行选择的选择操作键显示在所述画面中,在存在多个所述表单图像的情况下,将通过用户对所述选择操作键的操作而选择出的所述表单图像显示在所述画面中。
根据本发明的第5方案,所述处理器将多个所述表单图像中的未被设定任何表单的类别的所述表单图像显示在所述画面中。
根据本发明的第6方案,提供一种计算机可读介质,其存储有使计算机执行处理的程序,其中,在所述处理中,在同一画面中显示作为表单的类别的设定对象的表单图像、按照表单的类别预先登记的多个登记图像和针对所述表单图像设定表单的类别的设定操作键,参照了所述多个登记图像的用户针对所述表单图像设定与所述设定操作键对应的表单的类别。
根据本发明的第7方案,提供一种信息处理方法,其中,在同一画面中显示作为表单的类别的设定对象的表单图像、按照表单的类别预先登记的多个登记图像和针对所述表单图像设定表单的类别的设定操作键,参照了所述多个登记图像的用户针对所述表单图像设定与所述设定操作键对应的表单的类别。
(效果)
根据所述第1、6、7的各方案,具有如下效果:与一边切换画面一边参照多个登记图像来设定表单图像的类别的情况相比,能够削减对表单图像设定类别时的用户的操作量。
根据所述第2方案,具有如下效果:用户不用对设定操作键进行操作,就能够将表单图像的类别与设定操作键对应起来。
根据所述第3方案,具有如下效果:仅对登记图像进行滚动显示,就能够将表单图像的类别与设定操作键对应起来。
根据所述第4方案,具有如下效果:能够在不从显示登记图像的画面转变为其他画面的情况下,在画面中显示不同的表单图像。
根据所述第5方案,具有如下效果:能够在不从显示登记图像的画面转变为其他画面的情况下,在画面中仅显示类别不明的表单图像。
附图说明
图1是示出表单系统的概略结构的图。
图2是示出确认改正画面的一例的图。
图3是示出构成信息处理装置的计算机中的电气系统的主要部分结构例的图。
图4是示出由信息处理装置执行的类别的设定处理的一例的流程图。
图5是示出设定画面的一例的图。
图6是示出设定按钮的显示例的图。
图7是示出对各个表单图像设定了类别的确认改正画面的一例的图。
图8是示出各个表单图像按照记录被分类的确认改正画面的一例的图。
具体实施方式
下面,参照附图对本实施方式进行说明。另外,在全部附图中对相同的结构要素和相同的处理标注相同的标号并省略重复的说明。
图1是示出本实施方式的表单系统10的概略结构的图。
如图1所示,表单系统10包含信息处理装置20、客户终端40和输入装置60。这些装置与未图示的通信线路连接,能够经由通信线路彼此通信。作为一例,该通信线路应用互联网、LAN(Local Area Network:局域网)、WAN(Wide Area Network:广域网)等。
信息处理装置20对如下的一连串处理流程进行管理:对通过输入装置60输入的包含多张表单的文件的图像数据进行OCR(Optical Character Recognition:光学字符辨识)处理,将OCR处理的结果输出到预定的输出目的地。信息处理装置20的具体结构和作用在后面叙述。
客户终端40对信息处理装置20发送与OCR处理有关的各种指示。作为一例,在该各种指示中包含有开始读取图像数据的信息的指示和显示读取图像数据的信息的结果的指示等。此外,客户终端40显示信息处理装置20响应于受理的各种指示进行OCR处理的结果和与OCR处理有关的通知等各种信息。作为一例,客户终端40应用服务器计算机或个人计算机(PC:Personal Computer)等通用计算机装置。在图1中,仅图示了一台客户终端40,但是不限于此,也可以准备多台客户终端40,作为一例,也可以按照不同处理而区分使用客户终端40。
输入装置60将作为OCR处理对象的图像数据输入到信息处理装置20。作为一例,输入装置60应用服务器计算机或PC等通用计算机装置、以及具有扫描功能、打印功能和FAX(传真)功能等的图像形成装置等。另外,除了输入装置60以外,还能够从客户终端40向信息处理装置20输入图像数据。
接着,对表单系统10的概要进行说明。
表单系统10是如下的系统:信息处理装置20对通过输入装置60输入的图像数据进行OCR处理,将OCR处理的结果输出到预定的输出目的地。
信息处理装置20在OCR处理中对(1)业务设计和运用验证、(2)数据输入、(3)数据读取、(4)表单判别确认改正、(5)读取结果确认改正、(6)业务检查、(7)数据输出和(8)退回的各种处理进行管理。在本实施方式中,不仅是从图像数据读取字符和记号等的处理,还将包含字符的修正等后续处理的处理称为OCR处理。
作为各种处理的管理的一例,(1)业务设计和运用验证、(2)数据输入、(3)数据读取、(6)业务检查和(7)数据输出的处理分别由信息处理装置20自动执行。此外,作为各种处理的管理的一例,(4)表单判别确认改正和(5)读取结果确认改正的处理分别通过用户经由客户终端40进行的输入来受理。此外,作为各种处理的管理的一例,(8)退回的处理包括由信息处理装置20自动执行的情况和通过用户经由客户终端40进行的输入来受理的情况。
在(1)业务设计和运用验证的处理中,生成包含读取定义设定、输出设定和业务检查设定的任务规则。在读取定义设定中,作为一例,设定在“(3)数据读取”的处理中对图像数据的信息进行读取的范围即读取范围。更具体而言,作为一例,能够设定从作为关键字提取的项目的右侧附近读取值即项目值这样的定义。在输出设定中,作为一例,设定在“(7)数据输出”的处理中输出的输出数据的文件形式和输出目的地。在业务检查设定中,作为一例,设定在“(6)业务检查”的处理中被设为检测对象的表单中的必须的输入项目和可输入的字符数等格式等。
在(2)数据输入的处理中,受理来自输入装置60的图像数据的输入。通过受理输入而得到的图像数据作为“(3)数据读取”的处理的执行单位即任务而被登记。
在(3)数据读取的处理中,使用由用户从在“(1)业务设计和运用验证”的处理中生成的任务规则中选择出的用于要执行的任务的任务规则,进行该任务内的图像数据的信息的读取。作为一例,在该处理中,对该任务内的图像数据中所包含的表单进行判别(以下设为“表单判别”)以及对读取范围内的字符和记号进行读取。
在(4)表单判别确认改正的处理中,根据在“(3)数据读取”的处理中进行的表单判别的结果,任务内的图像数据被按照表示任务内所包含的表单的记录进行分类。然后,在该处理中,显示分类后的记录,受理用户对表单判别的确认改正。
在(5)读取结果确认改正的处理中,显示在“(3)数据读取”的处理中进行的读取的范围内的字符和记号的读取结果,受理用户对读取结果的确认改正。
在(6)业务检查的处理中,通过由用户从在“(1)业务设计和运用验证”的处理中生成的任务规则中选择出的用于该任务的任务规则中所包含的业务检查设定,检测各在先处理中的错误。检测结果可以提示给用户。
在(7)数据输出的处理中,使用由用户从在“(1)业务设计和运用验证”的处理中生成的任务规则中选择出的用于该任务的任务规则中所包含的输出设定而生成输出数据,生成的输出数据被输出到预定的输出目的地。
在(8)退回的处理中,从在OCR处理中执行的处理返回到一个阶段或多个阶段前的处理。作为一例,在“(4)表单判别确认改正”和“(5)读取结果确认改正”等各种处理的执行过程中,由用户从客户终端40指示退回。此外,作为一例,根据在“(6)业务检查”与“(7)数据输出”的处理之间由管理者进行检查的结果,从管理者的客户终端40指示退回。
在上述OCR处理中,在进行“(3)数据读取”以后的处理之前、即表单系统10的运用之前执行“(1)业务设计和运用验证”的处理。并且,也可以在进行了“(3)数据读取”以后的处理的表单系统10的运用过程中执行“(1)业务设计和运用验证”的处理。作为一例,能够根据在表单系统10的运用过程中进行的“(5)读取结果确认改正”的处理的结果,对在表单系统10的运用前在“(1)业务设计和运用验证”的处理中生成的任务规则进行适当修正。
下面,将与表单对应的各个图像数据称为“表单图像1”。此外,“任务规则”是针对在图1中的“(3)数据读取”的处理中读取一次信息所读取的、作为表单图像1的读取单位的任务,定义其处理内容的数据。另外,信息处理装置20将从输入装置60受理的表单图像1分别设为在图1中的“(3)数据读取”的处理中读取一次信息所读取到的读取对象,因此,任务还是作为信息处理装置20的处理对象而从输入装置60一次所受理的表单图像1的集合体。
关于图1中的“(3)数据读取”的处理中的表单判别,对表单图像1和按照表单的每个类别预先登记的样本图像(以后称为“登记图像3”)进行比较,判别出多个登记图像3中的与表单图像1最相似的登记图像3的类别作为表单图像1的类别。在表单图像1与登记图像3的相似度的计算中,例如应用使用了特征向量或模板的图案匹配的方法、以及使用以将作为比较对象的图像彼此作为输入而输出其相似度的方式进行机器学习而得到的神经网络的方法等公知算法。
本实施方式的任务可以是仅将相同类别的表单的多个表单图像1汇总而得到的表单图像1的集合体,但是这里,作为一例,设为对如下的表单图像1的集合体进行说明,该表单图像1的集合体汇总了多组如“表单A-1”和“表单A-2”那样将多个类别的表单作为1组的申请书的表单图像1。即,在任务中包含多个类别的表单图像1。将1组中包含的多个类别的表单图像1的集合体称为“记录”。
接着,对信息处理装置20中的“(4)表单判别确认改正”的处理进行详细说明。
在上述内容中说明了,信息处理装置20根据在“(3)数据读取”的处理中进行的表单判别的结果,以记录单位对任务内的表单图像1进行分类并显示,受理用户对表单判别的确认改正。
图2是示出用于受理用户进行的表单判别的确认改正的确认改正画面2的一例的图。信息处理装置20在进行了OCR处理的用户所使用的客户终端40中显示确认改正画面2。
在图2的例子中,“申请书D2-001”这样的任务中包含的各个表单图像1与在图1的“(3)数据读取”的处理中进行的表单判别的结果一起显示在显示区域2A中。并且,在各个表单图像1中沿着任务内的表单图像1的排列顺序显示页码2N。
在表单图像1中,有时存在不清晰(在“(3)数据读取”的处理中无法正确读取框的配置和字符等的程度)的表单图像1、未预先登记对应的登记图像3的未知形式的表单图像1。该情况下,显示“不明”作为表单图像1的类别。即,表单图像1的类别为“不明”表示未对该表单图像1设定任何类别的状态。
此外,在确认改正画面2中,利用框线2M按照记录单位包围表单图像1进行显示,以显示哪个表单图像1与哪个表单图像1组合而成为1组。在图2所示的确认改正画面2的例子中,“表单A-1”和“表单A-2”的表单图像1的组合作为1个记录而被显示。另外,在类别不明的表单图像1的情况下、和类别为“表单A-1”和“表单A-2”的表单图像1没有按顺序排列的情况下,很难进行记录分类。因此,关于这样的表单图像1,不利用框线2M进行记录的分类显示,而是直接显示在确认改正画面2中。
另一方面,在任务中包含的所有表单图像1未全部显示在显示区域2A中的情况下,用户操作滚动条2B,在确认改正画面2中显示没有被全部显示的其余的表单图像1。
用户尤其需要确认确认改正画面2中显示的表单图像1中的、类别不明的表单图像1、未按照记录被分类的表单图像1(以后称为“要确认的表单图像1”)。因此,有时希望从所显示的多个表单图像1中优先找出要确认的表单图像1。
但是,随着确认改正画面2的显示区域2A中显示的表单图像1的张数增多,用户一边操作滚动条2B一边目视显示区域2A而从多个表单图像1中找出要确认的表单图像1的作业随着滚动条2B的操作量增加会成为麻烦的作业。因此,在确认改正画面2中显示检索按钮2C、2D。
当用户按下检索按钮2C时,信息处理装置20从多个表单图像1中检索比当前利用鼠标等选择的表单图像1靠前的要确认的表单图像1、即标注了比被选择的表单图像1的页码2N小的页码2N的要确认的表单图像1并将其显示在显示区域2A中,上述的标注了比被选择的表单图像1的页码2N小的页码2N的要确认的表单图像1是被标注了与被选择的表单图像1的页码2N之间的差最小的页码2N的要确认的表单图像1。
当用户按下检索按钮2D时,信息处理装置20从多个表单图像1中检索比当前利用鼠标等选择的表单图像1靠后的要确认的表单图像1、即被标注了比被选择的表单图像1的页码2N大的页码2N的要确认的表单图像1,并将其显示在显示区域2A中,上述的被标注了比被选择的表单图像1的页码2N大的页码2N的要确认的表单图像1是被标注了与被选择的表单图像1的页码2N之间的差最小的页码2N的要确认的表单图像1。
如果任务中包含的要确认的表单图像1仅为1张,则即使用户在选择了要确认的表单图像1的状态下按下检索按钮2C、2D,显示区域2A中的表单图像1的显示也没有变化。
另外,关于用户选择表单图像1的行为,除了包含用户利用鼠标等有意地选择表单图像1的行为以外,例如还包含用户操作滚动条2B而在显示区域2A中显示表单图像1的行为。即,显示区域2A中显示的表单图像1也是由用户选择出的表单图像1的一例。
用户在确认了类别不明的表单图像1的情况下,一边在后面详细说明的设定画面4中参照登记图像3,一边对类别不明的表单图像1设定类别。
在任务规则中定义了信息处理装置20的各处理中的处理内容,因此,针对“(4)表单判别确认改正”的处理,定义了信息处理装置20为了判别任务中所包含的表单图像1的类别而参照的多个登记图像3。因此,当用户按下确认改正画面2的比较按钮2F时,在后面详细说明的设定画面4中显示信息处理装置20在表单图像1的类别的判别中使用的多个登记图像3。
此外,用户在确认了在记录的分类中存在错误的表单图像1的情况下,对表单图像1进行拖放操作来变更表单图像1的排列顺序,以使表单图像1相对于与该表单图像1一起构成为1组表单图像1的其他表单图像1按照正确的排列顺序排列。在表单图像1的排列顺序被变更的情况下,信息处理装置20按照变更后的新的表单图像1的排列顺序对表单图像1的页码2N进行更新。
然后,在用户按下了再次分类按钮2E的情况下,信息处理装置20按照确认改正画面2上的新的表单图像1的排列顺序,以记录单位对任务中所包含的表单图像1进行再次分类。信息处理装置20通过利用框线2M按照每个记录包围以记录单位再次分类后的表单图像1,而在确认改正画面2中显示新的分类结果。
当然,由于类别不明的表单图像1无法按照记录分类,因此,在记录的分类中也会出现错误。因此,用户在对类别不明的表单图像1设定了正确的类别的情况下也要按下再次分类按钮2E,以记录单位对任务中所包含的表单图像1进行再次分类。
另外,存在如下情况:作为类别的判别对象而预先登记为登记图像3的表单以外的文件的图像有时会被当作表单图像1而错误地混入任务中。这样的表单图像1的类别被设定为不明,并且无法以记录单位进行分类,因此,用户只要在从任务中删除不需要的表单图像1后按下再次分类按钮2E即可。
信息处理装置20在信息区域2K中显示这样的与要确认的表单图像1的确认改正有关的信息。
在任务中包含类别不明的表单图像1的情况下,信息处理装置20在信息区域2K中显示例如“存在无法判别的页。请进行不明页的确认、修正。”这样的促使用户进行表单图像1的类别的确认和改正的信息。该情况下,信息处理装置20例如也可以在信息区域2K中显示“不明页:1页”这样的任务内的类别不明的表单图像1的张数的信息,每当用户对类别不明的表单图像1设定类别时,以使类别不明的表单图像1的张数减少的方式在信息区域2K中进行显示。
在用户对类别不明的表单图像1设定了类别的情况下,信息处理装置20在信息区域2K中显示例如“类别不明的页的确认已结束,因此请按下“再次分类”按钮。以记录单位对表单进行再次分类”这样的告知用户接下来应该进行哪种操作的操作指导。
此外,在任务中包含没有按照记录被分类的表单图像1的情况下,信息处理装置20在信息区域2K中显示例如“存在没能以记录单位进行分类的页。请进行任意一种应对。(1)删除页并进行再次分类、(2)移动页并进行再次分类。”这样的促使用户进行表单图像1中的记录的确认和改正的信息。
该情况下,信息处理装置20例如也可以在信息区域2K中显示“没有被记录化的页:1页”这样的任务内的记录的分类存在错误的表单图像1的张数的信息。此外,每当按下再次分类按钮2E时,信息处理装置20可以对记录的分类存在错误的表单图像1的张数进行更新并显示在信息区域2K中。另外,在用户进行拖放操作而进行已经被记录化的表单图像1的重新排列的情况下,包含进行了重新排列的表单图像1的记录会被暂时解除。因此,信息处理装置20可以在每次由用户进行操作而解除现有的记录分类时,增加记录的分类存在错误的表单图像1的张数并显示在信息区域2K中。
用户在确认了针对任务中包含的全部表单图像1而正确地进行了类别的设定和记录的分类的情况下,按下确定按钮2G,确定针对任务中包含的各个表单图像1的表单判别和记录分类。针对该操作,在任务中没有类别不明的表单图像1、且以记录单位对全部表单图像1进行了分类的情况下,信息处理装置20也可以在信息区域2K中显示例如“完成了表单判别的确认作业。请按下OK按钮。”,告知用户接下来进行的操作。
用户在没有确定任务中包含的各个表单图像1的表单判别和记录分类而欲关闭确认改正画面2的情况下,按下取消按钮2H。此外,用户在暂时中断“(4)表单判别确认改正”的处理并在此后再次开始该处理的情况下,按下暂时保存按钮2J,将按下暂时保存按钮2J时针对表单图像1设定的类别和记录分类的状态保存在存储装置中。
另一方面,在用户按下了操作按钮2L的情况下,与表单图像1的确认改正有关的操作菜单显示在下拉列表中。在下拉列表中显示例如包含“复位”和“再执行”的操作菜单。
操作菜单中的复位是指,将对表单图像1设定的类别和记录的分类全部解除,返回到信息处理装置20进行表单判别之前的状态。
操作菜单中的再执行是指,例如选择当前选择的任务规则以外的其他任务规则,根据新选择出的任务规则再次执行表单判别。使用的任务规则由用户指定。
在变更任务规则时,伴随着任务规则的变更,例如信息处理装置20为了判别任务中包含的表单图像1的类别而参照的登记图像3被变更,因此,与任务规则变更前相比,表单判别的精度有时会提高。因此,例如在进行了复位后进行再执行而使信息处理装置20按照其他任务规则进行表单判别的情况下,会利用操作按钮2L。
执行这样的表单判别的信息处理装置20例如使用计算机30构成。
图3是示出构成信息处理装置20的计算机30中的电气系统的主要部分结构例的图。
计算机30具有负责图1所示的各处理的处理器的一例即CPU(Central ProcessingUnit:中央处理单元)31、存储使计算机30作为信息处理装置20而发挥功能的信息处理程序的ROM(Read Only Memory:只读存储器)32、用作CPU31的暂时作业区域的RAM(RandomAccess Memory:随机存取存储器)33、非易失性存储器34和输入输出接口(I/O)35。CPU31、ROM32、RAM33、非易失性存储器34和I/O35分别经由总线36被连接起来。
非易失性存储器34是即使向非易失性存储器34供给的电力被切断也会保存所存储的信息的存储装置的一例,例如使用半导体存储器,但是也可以使用硬盘。如登记图像3那样的、即使信息处理装置20的电源被切断也需要持续存储的信息被存储在非易失性存储器34中。
在I/O35例如连接有通信单元37、输入单元38和显示单元39。
通信单元37与通信线路连接,具有与和通信线路连接的例如包含输入装置60或客户终端40的外部装置之间进行数据通信的通信协议。
输入单元38是受理用户的指示并将其通知给CPU31的装置,例如使用按钮、触摸面板、键盘和鼠标等。
显示单元39是在视觉上显示由CPU31处理后的信息的装置的一例,例如使用液晶显示器或有机EL(Electro Luminescence:电致发光)显示器等。
在信息处理装置20经由通信单元37从客户终端40受理用户的指示、并且经由通信单元37在客户终端40显示由信息处理装置20处理后的信息的情况下,不一定需要输入单元38和显示单元39。
另外,非易失性存储器34不需要内置于计算机30,例如也可以是能够相对于计算机30进行拆装的移动型的存储装置。此外,也可以不将非易失性存储器34设置于计算机30,而将其设置于外部装置。该情况下,计算机30经由通信单元37读入外部装置的非易失性存储器34中存储的信息,并且经由通信单元37在外部装置的非易失性存储器34中写入信息。
接着,说明针对在信息处理装置20的表单判别中被判别为类别不明的表单图像1进行的类别的设定处理。
图4是示出在用户在确认改正画面2中选择类别不明的任意1张表单图像1并按下比较按钮2F的情况下、由信息处理装置20的CPU31执行的类别的设定处理的一例的流程图。对类别的设定处理进行规定的信息处理程序例如预先存储在信息处理装置20的ROM32中。信息处理装置20的CPU31读入ROM32中存储的信息处理程序,执行类别的设定处理。
首先,在步骤S10中,CPU31在客户终端40的显示装置中显示用于供用户对类别不明的表单图像1设定类别的画面即设定画面4。
图5是示出设定画面4的一例的图。在设定画面4中显示类别不明的表单图像1和在任务规则中定义的多个登记图像3。在图5的设定画面4的例子中,无法一次性地在设定画面4中全部显示任务规则中定义的多个登记图像3,因此,CPU31显示滚动条4B,用户能够在设定画面4中参照多个登记图像3。
另外,在设定画面4中显示多个登记图像3的显示形式没有制约,CPU31也可以使登记图像3成为缩略图,一次性地在设定画面4中显示全部登记图像3。在利用缩略图显示登记图像3时,有时很难得知登记图像3的内容。因此,CPU31也可以放大显示由用户指定的登记图像3的缩略图。当然,在用户对图5的设定画面4中显示的未利用缩略图显示的登记图像3进行了放大指示的情况下,CPU31也可以放大显示由用户指定的登记图像3。
此外,CPU31也可以以相同大小来显示表单图像1和登记图像3,在用户对表单图像1进行了拖动操作的情况下,透视显示表单图像1,以使得能够以透视方式观察与移动的表单图像1重合的位置的后面的图像。该情况下,如果表单图像1和登记图像3均表示相同类别的表单,则表单图像1和登记图像3中的各个表单的框线等的位置一致,因此,用户能够根据使表单图像1和登记图像3重合的结果来确认表单图像1与登记图像3的相似度,设定表单图像1的类别。
并且,CPU31也可以对在图1的“(3)数据读取”的处理中的表单判别中计算出的、设定画面4中所显示的表单图像1与各个登记图像3之间的相似度进行数值化,而显示在设定画面4中。
除了作为类别的设定对象的表单图像1和多个登记图像3以外,CPU31还在同一设定画面4中显示设定按钮4A、检索按钮4C、检索按钮4D、确定按钮4E和取消按钮4F。
设定按钮4A是对设定画面4中所显示的表单图像1设定类别的设定操作键的一例,当用户按下设定按钮4A时,CPU31显示下拉列表,该下拉列表显示为了在图1的“(3)数据读取”的处理中进行表单判别而使用的各个登记图像3的类别。
图6是示出在用户按下了设定按钮4A的情况下显示的下拉列表的一例的图。
下拉列表的“表单A-1”、“表单A-2”、“表单A-3”、“表单B-1”和“表单B-2”是表示任务规则中定义的登记图像3的类别的字符串。
用户对设定画面4中显示的表单图像1和各个登记图像3进行比较,从设定按钮4A的下拉列表中选择被认为是设定画面4中显示的表单图像1的类别的字符串。
另外,位于设定按钮4A的下拉列表中的“附加”意味着,表单图像1不是由登记图像3表示的表单的图像,例如是如驾驶证或护照那样作为本人确认资料而附加到表单中的附加文件的图像。如果表单图像1是附加文件的图像,则用户从设定按钮4A的下拉列表中选择“附加”。由此,CPU31忽略设定由“附加”的表单图像1来进行记录分类。
此外,位于设定按钮4A的下拉列表中的“删除”是用于删除与表单无关的文件的图像的设定。CPU31从任务中删除设定有“删除”的表单图像1来进行记录分类。
位于设定按钮4A的下拉列表中的“不明”是仅用于在设定按钮4A的下拉列表中显示表单图像1的类别不明的情况的显示用的类别,用户无法进行选择。
当用户从设定按钮4A的下拉列表中选择了表单图像1的类别时,在图4的步骤S20中,CPU31中止设定按钮4A的下拉列表的显示,将用户从下拉列表中选择出的类别与设定按钮4A对应起来。例如,在用户从下拉列表中选择了“表单A-1”的类别的情况下,如图5所示,在设定按钮4A处显示“表单A-1”。即,在设定按钮4A处显示与设定按钮4A对应的类别。
然后,用户按下确定按钮4E,以将表单图像1的类别确定为选择出的类别。
因此,在步骤S30中,CPU31判定用户是否按下了确定按钮4E。在用户按下了确定按钮4E的情况下,转移到步骤S40。
在步骤S40中,CPU31对表单图像1设定用户选择出的类别即与设定按钮4A对应的类别,来作为被判别为类别不明的表单图像1的类别。
另一方面,在步骤S30的判定处理中判定为用户未按下确定按钮4E的情况下,转移到步骤S50。
用户能够随时变更所选择的类别,因此,在步骤S50中,CPU31判定用户是否再次按下设定按钮4A而从设定按钮4A的下拉列表中选择了与此前选择出的类别不同的其他类别。
在用户未选择新的类别的情况下,转移到步骤S30,CPU31继续监视用户对确定按钮4E的按下状况。
另一方面,在用户选择了新的类别的情况下,转移到步骤S20。由此,用户选择出的新的类别与设定按钮4A被对应起来,在设定按钮4A处显示用户选择出的新的类别。在该状态下,当用户按下确定按钮4E时,CPU31对表单图像1设定与设定按钮4A对应的新的类别,来作为被判别为类别不明的表单图像1的类别。
至此,结束图4所示的类别的设定处理。
另外,在用户按下了取消按钮4F的情况下,CPU31不对表单图像1设定类别,关闭设定画面4,显示确认改正画面2。
上述说明了用户从设定按钮4A的下拉列表中选择表单图像1的类别的例子,但是,用户也可以通过选择登记图像3来选择表单图像1的类别。具体而言,CPU31也可以将与设定画面4中显示的多个登记图像3中的由用户选择出的登记图像3的类别相同的类别与设定按钮4A对应起来。该情况下,用户按下设定按钮4A,即使没有从下拉列表中选择表单图像1的类别,而仅仅是选择设定画面4中显示的登记图像3,选择出的登记图像3的类别也会与设定按钮4A对应起来。
此外,在用户选择登记图像3的情况下,例如可以利用鼠标等按下登记图像3来进行选择,但是,只要是能够确定用户选择了哪个登记图像3的方法即可,登记图像3的选择方法没有制约。
例如如图5所示的设定画面4那样,在CPU31按照用户对滚动条4B的操作而在设定画面4中依次滚动显示各个登记图像3的情况下,CPU31也可以将设定画面4中显示的登记图像3视为用户选择出的登记图像3。因此,伴随着设定画面4的显示,选择最初显示的登记图像3的类别作为初始值。用户选择出的登记图像3的类别与设定按钮4A是对应的,因此,当用户操作设定画面4的滚动条4B来滚动显示登记图像3时,与登记图像3的显示联动地,与设定按钮4A对应的类别也变化。其结果,与登记图像3的显示联动地,在设定按钮4A处显示的类别也会变化。由此,用户仅仅是操作滚动条4B,就能够选择表单图像1的类别。
另外,在通过滚动操作在设定画面4中显示多个登记图像3的情况下,CPU31例如可以将在进行滚动显示的区域的中央部那样的预定的范围内显示的登记图像3视为由用户选择出的登记图像3。
另一方面,在用户按下了检索按钮4C的情况下,与图2所示的确认改正画面2的检索按钮2C同样,从任务内的表单图像1中检索比设定画面4中正在显示的表单图像1靠前的类别不明的表单图像1,并将其显示在设定画面4中。此外,在用户按下了检索按钮4D的情况下,与图2所示的确认改正画面2的检索按钮2D同样,从任务内的表单图像1中检索比设定画面4中正在显示的表单图像1靠后的类别不明的表单图像1,并将其显示在设定画面4中。
即,检索按钮4C、4D是用于供用户选择表单图像1的选择操作键的一例,用户不用在确认改正画面2上切换画面,而是仅通过在设定画面4上进行操作,就能够选择出类别不明的表单图像1并将其依次显示在设定画面4中。
另外,用户按下了检索按钮4C、4D时的动作是一例。即使是被设定了类别的表单图像1,也不一定设定了正确的类别,因此,在用户按下了检索按钮4C、4D的情况下,CPU31也可以选择与设定画面4中所显示的表单图像1的页码2N相邻的之前的或之后的表单图像1,并将其显示在设定画面4中。
图7是示出对图2所示的类别不明的表单图像1(页码2N为第3页的表单图像1)执行图4所示的类别的设定处理、且在设定画面4中对表单图像1设定“表单A-1”的类别后的确认改正画面2的一例的图。
通过对类别不明的表单图像1设定类别,如图7所示,在信息区域2K中显示不明页成为0页的情况。
通过以上的处理,虽然对页码2N为第3页的表单图像1设定了“表单A-1”的类别,但是还未进行记录的再次分类。因此,用户按下确认改正画面2的再次分类按钮2E,以记录单位对任务中包含的表单图像1进行再次分类。
图8是示出在图7所示的确认改正画面2中、用户按下了再次分类按钮2E后的确认改正画面2的一例的图。
在图8所示的确认改正画面2的例子中,显示类别被设定为“表单A-1”的第3页的表单图像1和第4页的表单图像1被分类为1个记录的情况。与此相伴,在信息区域2K中显示没有被记录化的页成为0页的情况。
另外,CPU31也可以使确定按钮2G无效,以使得在对全部表单图像1设定类别、且进行记录分类之前,用户无法按下确定按钮2G。
以上,使用实施方式说明了信息处理装置20的一个方式,但是,公开的信息处理装置20的方式是一例,信息处理装置20的方式不限于实施方式所记载的范围。能够在不脱离本发明的主旨的范围内对实施方式施加多种变更或改良,施加了该变更或改良后的方式也包含在公开的技术范围内。例如,也可以在不脱离本发明的主旨的范围内对图4所示的类别的设定处理的顺序进行变更。
此外,在上述实施方式中,作为一例,说明了利用软件实现类别的设定处理的方式。但是,也可以利用硬件来处理与图4所示的流程图相同的处理。该情况下,与利用软件实现类别的设定处理的情况相比,可实现处理的高速化。
在上述实施方式中,处理器是指广义的处理器,包含通用的处理器(例如CPU31)、专用的处理器(例如GPU:Graphics Processing Unit(图形处理单元)、ASIC:ApplicationSpecific Integrated Circuit(面向特定用途的集成电路)、FPGA:Field ProgrammableGate Array(现场可编程门阵列)、可编程逻辑器件等)。
此外,上述实施方式中的处理器的动作不仅可以通过1个处理器完成,还可以由存在于物理上分离的位置的多个处理器协作完成。此外,处理器的各动作的顺序不仅限于上述实施方式中记载的顺序,也可以适当变更。
在上述实施方式中,说明了在ROM32中存储信息处理程序的例子,但是,信息处理程序的存储位置不限于ROM32。还能够以记录于计算机30可读取的存储介质中的形式提供本发明的信息处理程序。例如,也可以以记录于CD-ROM(Compact Disk Read Only Memory:光盘只读存储器)和DVD-ROM(Digital Versatile Disk Read Only Memory:数字通用光盘只读存储器)这样的光盘中的形式提供信息处理程序。此外,也可以以记录于USB(Universal Serial Bus:通用串行总线)存储器和存储卡这样的移动型的半导体存储器中的形式提供信息处理程序。ROM32、非易失性存储器34、CD-ROM、DVD-ROM、USB、和存储卡是非暂时性(non-transitory)存储介质的一例。
进而,信息处理装置20也可以通过通信单元37从与通信线路连接的外部装置下载信息处理程序,将下载的信息处理程序存储在存储装置中。该情况下,信息处理装置20的CPU31从存储装置读入从外部装置下载的信息处理程序,执行类别的设定处理。

Claims (7)

1.一种信息处理装置,其具有处理器,
所述处理器使得在同一画面中显示作为表单的类别的设定对象的表单图像、按照表单的类别预先登记的多个登记图像、和针对所述表单图像设定表单的类别的设定操作键,
其中,参照了所述多个登记图像的用户针对所述表单图像设定与所述设定操作键对应的表单的类别。
2.根据权利要求1所述的信息处理装置,其中,
所述处理器使所述多个登记图像中的被用户选择出的登记图像所表示的表单的类别与所述设定操作键对应起来。
3.根据权利要求2所述的信息处理装置,其中,
所述处理器按照用户的指示,使所述多个登记图像一边滚动一边在所述画面中依次显示,使在所述画面中显示的登记图像所表示的表单的类别与所述设定操作键对应起来。
4.根据权利要求1~3中的任意一项所述的信息处理装置,其中,
所述处理器还将用于供用户对所述表单图像进行选择的选择操作键显示在所述画面中,
在存在多个所述表单图像的情况下,将通过用户对所述选择操作键的操作而选择出的所述表单图像显示在所述画面中。
5.根据权利要求4所述的信息处理装置,其中,
所述处理器将多个所述表单图像中的未被设定任何表单的类别的所述表单图像显示在所述画面中。
6.一种计算机可读介质,其存储有使计算机执行处理的程序,其中,
在所述处理中,
在同一画面中显示作为表单的类别的设定对象的表单图像、按照表单的类别预先登记的多个登记图像、和针对所述表单图像设定表单的类别的设定操作键,
其中,参照了所述多个登记图像的用户针对所述表单图像设定与所述设定操作键对应的表单的类别。
7.一种信息处理方法,其中,
在同一画面中显示作为表单的类别的设定对象的表单图像、按照表单的类别预先登记的多个登记图像、和针对所述表单图像设定表单的类别的设定操作键,
其中,参照了所述多个登记图像的用户针对所述表单图像设定与所述设定操作键对应的表单的类别。
CN202110755840.9A 2020-12-03 2021-07-05 信息处理装置、信息处理方法和计算机可读介质 Pending CN114611475A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020201326A JP2022089087A (ja) 2020-12-03 2020-12-03 情報処理装置、及び情報処理プログラム
JP2020-201326 2020-12-03

Publications (1)

Publication Number Publication Date
CN114611475A true CN114611475A (zh) 2022-06-10

Family

ID=81847982

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110755840.9A Pending CN114611475A (zh) 2020-12-03 2021-07-05 信息处理装置、信息处理方法和计算机可读介质

Country Status (3)

Country Link
US (1) US20220179524A1 (zh)
JP (1) JP2022089087A (zh)
CN (1) CN114611475A (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USD1027972S1 (en) * 2020-09-30 2024-05-21 Neptune Benson, Inc. Regenerative media filter display panel with graphical user interface

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006209261A (ja) * 2005-01-25 2006-08-10 Canon Inc 受信帳票ジョブ表示方法及び装置、並びにプログラム
US8861005B2 (en) * 2012-09-28 2014-10-14 Interactive Memories, Inc. Methods for real time discovery, selection, and engagement of most economically feasible printing service vendors among multiple known vendors

Also Published As

Publication number Publication date
JP2022089087A (ja) 2022-06-15
US20220179524A1 (en) 2022-06-09

Similar Documents

Publication Publication Date Title
CN101178725B (zh) 用于信息检索的设备和方法
CN109961069B (zh) 图像处理装置以及存储介质
JP7255121B2 (ja) レシート処理装置及びレポートの生産方法
JP6826293B2 (ja) 情報処理システムと、その処理方法及びプログラム
US11418658B2 (en) Image processing apparatus, image processing system, image processing method, and storage medium
JP2019168857A (ja) 画像処理装置、画像処理方法および画像処理プログラム
US11303769B2 (en) Image processing system that computerizes documents with notification of labeled items, control method thereof, and storage medium
US20150169510A1 (en) Method and system of extracting structured data from a document
CN114611475A (zh) 信息处理装置、信息处理方法和计算机可读介质
US20230306767A1 (en) Information processing apparatus, non-transitory computer readable medium, and method for processing information
JP2008176625A (ja) 文字認識結果の管理装置およびその方法並びにコンピュータプログラム
CN112396046A (zh) 信息处理装置及记录媒体
JP2001318941A (ja) 情報処理装置および情報処理方法
US20220201142A1 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
US11574490B2 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
US20220180121A1 (en) Information processing apparatus, information processing system, and non-transitory computer readable medium
US20220198190A1 (en) Information processing apparatus and non-transitory computer readable medium
US20220198183A1 (en) Information processing apparatus and non-transitory computer readable medium
US20220197445A1 (en) Information processing apparatus and non-transitory computer readable medium
US20220198184A1 (en) Information processing apparatus and non-transitory computer readable medium
JP2006134079A (ja) 画像処理装置及びプログラム
WO2023062799A1 (ja) 情報処理システム、原稿種識別方法、モデル生成方法及びプログラム
JP2008186256A (ja) 文書処理装置、文書処理方法、コンピュータプログラム
JP2009223391A (ja) 画像処理装置及び画像処理プログラム
JP4645349B2 (ja) 情報処理装置およびプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination