CN113767397B - 处理装置和处理方法 - Google Patents

处理装置和处理方法 Download PDF

Info

Publication number
CN113767397B
CN113767397B CN202080030860.3A CN202080030860A CN113767397B CN 113767397 B CN113767397 B CN 113767397B CN 202080030860 A CN202080030860 A CN 202080030860A CN 113767397 B CN113767397 B CN 113767397B
Authority
CN
China
Prior art keywords
filled
filling
fields
field
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202080030860.3A
Other languages
English (en)
Other versions
CN113767397A (zh
Inventor
马场英一
千叶博司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xinjin Information Service Co ltd
NEC Corp
Original Assignee
Xinjin Information Service Co ltd
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xinjin Information Service Co ltd, NEC Corp filed Critical Xinjin Information Service Co ltd
Publication of CN113767397A publication Critical patent/CN113767397A/zh
Application granted granted Critical
Publication of CN113767397B publication Critical patent/CN113767397B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/42Document-oriented image-based pattern recognition based on the type of document
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Character Discrimination (AREA)

Abstract

本发明提供了一种处理装置(10),包括:获取单元(11),用于获取填入表单的图像,填入表单具有填入数值的多个第一填入字段和填入在多个第一填入字段中被填入的数值的合计的第二填入字段;分析单元(12),用于分析所述图像,并识别已被填入在多个第一填入字段中的值和已被填入在第二填入字段中的值;确定单元(13),确定已被填入在多个第一填入字段中的值的识别结果的合计与已被填入在第二填入字段中的值的识别结果是否彼此匹配;以及处理单元(14),如果已被填入在多个第一填入字段中的值的识别结果的合计与已被填入在第二填入字段中的值的识别结果彼此不匹配时,执行错误处理。

Description

处理装置和处理方法
技术领域
本发明涉及一种处理装置、处理方法和程序。
背景技术
专利文献1公开了一种系统,当客户填入金额和操作员重复记入金额的识别结果不匹配时,该系统将校正屏幕上的字符的显示区域留为空白,并且使确认者输入字符。
专利文献2公开了通过将由操作员操作的终端装置网络连接到进行数据处理的服务器而形成的金融系统。在该金融系统中,对于多个单据中的每一个,生成至少包括指示在每个单据中处理的金额的合计以及处理的优先程度的数据的合计单据,并且将合计单据的数据存储在服务器中。然后,服务器至少接收来自由合计单据编译的每个单据的金额的数据的输入、算出合计,并且通过对存储的合计单据的数据进行检查来进行金额的确定。此外,服务器从合计单据的数据确定处理的优先程度,并将处理分配给终端装置。
[相关文献]
[专利文献]
[专利文献1]日本专利申请公开No.2001-76093
[专利文献2]日本专利申请公开No.H11-328285
发明内容
[技术问题]
实践中通过利用光学字符识别(OCR)来识别填入在转账表单中的内容。然而,OCR的识别精度不是100%,存在错误识别的可能性,因此,在执行转账处理之前需要人工确认工作。期望减少人工确认工作的负担。本发明挑战提供用于通过OCR检测错误识别的技术。
[技术解决方案]
本发明提供了一种处理装置,包括:
获取装置,用于获取填入表单的图像,该填入表单包括填入数值的多个第一填入字段和填入在多个第一填入字段中被填入的数值的合计的第二填入字段;
分析装置,用于分析图像,并且识别填入在多个第一填入字段中的值和填入在第二填入字段中的值;
确定装置,用于确定被填入在多个第一填入字段中的值的识别结果的合计与被填入在第二填入字段中的值的识别结果是否彼此匹配;以及
处理装置,用于当被填入在多个第一填入字段中的值的识别结果的合计与被填入在第二填入字段中的值的识别结果彼此不匹配时,执行错误处理。
此外,本发明提供了一种处理装置,包括:
获取装置,用于获取包括多个填入字段的转账请求表单的图像;
分析装置,用于利用多个图像分析引擎,识别转账请求表单中包括的多个填入字段中的值;
搜索装置,用于利用被填入在多个图像分析引擎的每一个的关键字填入字段中的值的识别结果作为关键字来搜索存储单元;
确定装置,用于确定在多个图像分析引擎对多个填入字段中的值的识别结果中是否存在满足错误条件的值;以及
处理装置,用于当多个图像分析引擎的识别结果相互不匹配时、当在存储单元中不能找到由多个图像分析引擎的每一个产生的关键字时,或者当在多个图像分析引擎对多个填入字段中的值的识别结果中存在满足错误条件的值时,执行错误处理。
此外,本发明提供了一种处理方法,包括:
通过计算机,
获取填入表单的图像,填入表单包括填入数值的多个第一填入字段和填入在多个第一填入字段中被填入的数值的合计的第二填入字段;
分析图像,并且识别被填入在多个第一填入字段中的值和被填入在第二填入字段中的值;
确定被填入在多个第一填入字段中的值的识别结果的合计与被填入在第二填入字段中的值的识别结果是否彼此匹配;以及
当被填入在多个第一填入字段中的值的识别结果的合计与被填入在第二填入字段中的值的识别结果彼此不匹配时,执行错误处理。
此外,本发明提供了一种程序,该程序使计算机用作:
获取装置,用于获取填入表单的图像,填入表单包括填入数值的多个第一填入字段和填入在多个第一填入字段中被填入的数值的合计的第二填入字段;
分析装置,用于分析图像,并且识别被填入在多个第一填入字段中的值和被填入在第二填入字段中的值;
确定装置,用于确定被填入在多个第一填入字段中的值的识别结果的合计与被填入在第二填入字段中的值的识别结果是否彼此匹配;以及
处理装置,用于当被填入在多个第一填入字段中的值的识别结果的合计与被填入在第二填入字段中的值的识别结果彼此不匹配时,执行错误处理。
[本发明的作用]
本发明实现了一种用于通过OCR检测错误识别的技术。
附图说明
从下文所述的优选示例性实施例和下述附图,上述目的、其他目的、特征和有益效果将变得更加显而易见。
图1是图示根据本示例性实施例的处理装置的概述的图。
图2是图示根据本示例性实施例的处理装置的概述的图。
图3是图示根据本示例性实施例的处理装置的硬件配置的一个示例的图。
图4是根据本示例性实施例的处理装置的功能框图的一个示例。
图5是图示根据本示例性实施例的处理装置中的处理流程的一个示例的流程图。
图6是图示根据本示例性实施例的填入表单的一个示例的图。
图7是示意性地图示由根据本示例性实施例的处理装置处理的信息的一个示例的图。
图8是根据本示例性实施例的处理装置的功能框图的一个示例。
图9是图示根据本示例性实施例的处理装置中的处理流程的一个示例的流程图。
图10是示意性地图示由根据本示例性实施例的处理装置处理的信息的一个示例的图。
具体实施方式
<第一示例性实施例>
首先,描述根据本示例性实施例的处理装置的概述。根据本示例性实施例的处理装置用在诸如银行的金融机构中。
如图1所示,处理装置10与执行转账处理的结算主机20协作。首先,在执行结算主机20的转账处理之前,将由图像扫描仪等生成的转账请求表单(填入表单)的图像(图像数据)输入到处理装置10。图2中图示了处理装置10的处理流程的概述。
首先,处理装置10识别由OCR读取输入的转账请求表单(图像)中填入的内容,并将内容转换为数字字符代码。接下来,处理装置10确定识别结果是否满足预定错误条件。
当不满足错误条件时,处理装置10将识别结果(转账请求内容)输入到结算主机20。结算主机20基于输入的识别结果来执行转账处理。另一方面,当满足错误条件时,处理装置10执行错误处理。错误处理是用于进行人工确认工作的任何处理。此后,由人工确认工作对其进行校正等的识别结果(转账请求内容)被输入到结算主机20。结算主机20基于输入内容来执行转帐处理。根据本示例性实施例的处理装置10通过确定是否满足字符错误条件来准确地检测OCR的错误识别。稍后描述细节。
现在,详细地描述处理装置10的配置。首先,描述处理装置10的硬件配置的一个示例。包括在处理装置10中的每个功能通过硬件和软件的任何组合来实现,任意组合主要包括任何计算机的中央处理单元(CPU)、存储器、加载到存储器上的程序、存储程序的诸如硬盘的存储单元(其不仅可以存储从运输装置的阶段预先存储的程序,还可以存储从诸如光盘(CD)或因特网上的服务器等的存储介质下载的程序)以及用于网络连接的接口。然后,本领域技术人员应当意识到,存在用于实现的方法和装置的各种变型示例。
图3是示出处理装置10的硬件配置的框图。如图3所示,处理装置10包括处理器1A、存储器2A、输入/输出接口3A、外围电路4A和总线5A。外围电路4A包括各种模块。处理装置10可以不包括外围电路4A。注意,处理装置10可以由一个物理和/或逻辑集成的装置配置,或者可以由多个物理和/或逻辑分离的装置配置。当处理装置10由多个物理和/或逻辑上分离的装置配置时,多个装置中的每一个可以包括上述硬件配置。
总线5A是用于处理器1A、存储器2A、外围电路4A和输入/输出接口3A以相互发送和接收数据的数据发送路径。处理器1A例如是诸如CPU和图形处理单元(GPU)的算术处理装置。存储器2A例如是诸如随机存取存储器(RAM)和只读存储器(ROM)的存储器。输入/输出接口3A包括用于从输入装置、外部装置、外部服务器、外部传感器、相机等获取信息的接口,用于向输出装置、外部装置、外部服务器等输出信息的接口等。输入装置例如是键盘、鼠标、麦克风、触摸面板、物理按钮、相机等。输出装置例如是显示器、扬声器、打印机、邮寄器等。处理器1A可以向每个模块给出指令,并且基于每个模块的算术结果来来进行算术运算。
现在,通过使用图4中的功能框图和图5中的流程图详细地描述处理装置10的功能配置。图4中图示了处理装置10的功能框图的一个示例。如图所示,处理装置10包括获取单元11、分析单元12、确定单元13和处理单元14。
首先,在S10中,获取单元11获取由图像扫描器等生成的填入表单的图像。在本示例性实施例中,填入表单是转账请求表单。转账请求表单的一个示例在图6中示出。注意,所示的转账请求表单仅是一个示例,并且本发明不限于转账请求表单。
所示的转账请求表单包括以下填入字段等。
“填入标识转账请求者的信息(客户号码和转账请求者的姓名)的字段”
“填入接受日期的字段”
“填入指定转账日期的字段”
“填入指定转账日期的星期几的字段”
“填入项目的字段”
“填入单据序列号的字段”
“针对每个转账请求(八种情况)填入转账目的地信息(金融机构名称和分支名称)、收款人信息(项目、账号和名称)和转账内容(转账金额)的字段”
“填入转账金额的小计的字段”
“填入多个转账请求表单的小计的合计的字段”
“小计复记字段”
以这种方式,转账请求表单包括填入数值的多个第一填入字段(图6中所示的“金额”字段)和填入在多个第一填入字段中被填入的数值的合计的第二填入字段(图6中所示的“小计字段”)。
注意,在本说明书中,“获取”至少包括以下中的任何一个:“由本地装置提取存储在另一装置或存储介质中的数据(主动获取)的数据”,例如,通过请求或询问另一装置来接收,基于用户输入或基于程序的指令访问另一装置或存储介质并读取等;“将从另一装置输出的数据输入到本地设备中(被动获取)”,例如,在可以接收从外部设备发送的数据的状态下等待,并且基于用户输入或基于程序的指令,接收从外部装置发送的数据,通过分发(或发送、推送通知等)接收从外部装置给出的数据,从接收的数据或信息中选择和获取;以及“通过编辑数据生成新数据(转换为文本、重新布置数据、提取部分数据、改变文件格式等)等,并且获取新数据”。
返回图4和图5,在S11中,分析单元12分析在S10中由获取单元11获取的转账请求表单的图像,并且识别转账请求表单中包括的多个填入字段中的每一个填入的值。分析单元12通过OCR读取识别在转账请求表单(图像)中填入的内容,并且将内容转换为数字字符代码。
例如,分析单元12识别填入在填入转账金额的多个第一填入字段(图6中所示的“金额”字段)中的数值,以及被填入在其中填入在多个第一填入字段中被填入的数值的合计的第二填入字段(图6中所示的“小计字段”)中的数值。注意,分析单元12还可以识别图6所示的其他填入字段中的每个值(包括数字、字符、符号等)。
返回图4和图5,在S12中,确定单元13确定S11中的分析单元12的识别结果是否满足错误条件。根据本示例性实施例的错误条件包括“填入在多个第一填入字段中的值的识别结果的合计与填入在第二填入字段中的值的识别结果彼此不匹配”。确定单元13计算填入在多个第一填入字段中的数值的识别结果的合计。然后,确定单元13确定计算结果(填入在多个第一填入字段中的数值的识别结果的合计)和填入在第二填入字段中的数值的识别结果是否彼此匹配。注意,可以进一步设置另一错误条件。
当分析单元12的识别结果满足至少一个错误条件时(S13为是),处理单元14执行错误处理(S15)。例如,当被填入在多个第一填入字段中的数值的识别结果的合计与被填入在第二填入字段中的数值的识别结果彼此不匹配时,处理单元14执行错误处理。
错误处理是用于进行人工确认工作的任何处理。例如,处理单元14在预定数据库(满足错误条件的转账请求信息的数据库)中相互相关联地登记在S10中由获取单元11获取的图像、在S11中分析单元12的识别结果、在S12中标识被确定为满足错误条件的信息等。例如,操作员通过操作终端装置以预定顺序取出在数据库上登记的转账请求信息,并在显示器上显示转账请求信息。然后,在经由终端装置进行识别结果的确认工作、校正工作等之后,操作员将校正之后的识别结果(转账请求内容)输入到结算主机20。
另一方面,当分析单元12的识别结果不满足任何错误条件时(S13为否),处理单元14将分析单元12的识别结果(转账请求内容)输入到结算主机20(S14)。
结算主机20基于输入的转账请求内容来执行转账处理。
根据上述本示例性实施例的处理装置10通过确定被填入在其中填入数值的多个第一填入字段中的值的识别结果的合计与被填入在其中填入在多个第一填入字段中被填入的数值的合计的第二填入字段中的值的识别结果是否彼此匹配来检测OCR的错误识别。通过各种特征处理,检测OCR的错误识别提高了检测准确性,并且可以减少人工确认工作。
<第二示例性实施例>
根据本示例性实施例的处理装置10在错误条件的细节上与根据第一示例性实施例的处理装置不同。下面详细地给出描述。
根据本示例性实施例的转账表单包括其中填入相同的值的多个第三填入字段。在图6所示的示例的情况下,小计字段和小计复记字段对应于第三填入字段。小计字段是转账请求者填入值的字段,而小计复记字段是工作人员(金融机构的工作人员)填入值的字段。
分析单元12通过OCR读取识别被填入在转账请求表单(图像)中的内容,并且识别被填入在多个第三填入字段中的值(图5中的S11)。注意,分析单元12还可以识别图6所示的其他填入字段中的每个值(包括数字、字符、符号等)。
然后,根据本示例性实施例的错误条件包括“被填入在多个第三填入字段中的值的识别结果相互不匹配”。确定单元13确定在S11中分析单元12的识别结果是否满足错误条件(图5中的S12)。注意,可以进一步设置另一错误条件(例如,第一示例性实施例中描述的错误条件)。
当分析单元12的识别结果满足至少一个错误条件时(图5中的S13为是),处理单元14执行错误处理(图5中的S15)。例如,当被填入在多个第三填入字段中的值的识别结果相互不匹配时,处理单元14执行错误处理。错误处理的细节类似于根据第一示例性实施例的那些。
注意,处理装置10的其他组件类似于根据第一示例性实施例的那些组件。
根据上述本示例性实施例的处理装置10通过确定被填入在其中填入相同值的多个第三填入字段中的值的识别结果是否相互匹配来检测OCR的错误识别。通过各种特征处理,检测OCR的错误识别提高了检测准确性,并且可以减少人工确认工作。例如,通过设置第一和第二示例性实施例中描述的错误条件,进一步提高了OCR的错误识别的检测精度。
<第三示例性实施例>
根据本示例性实施例的处理装置10在错误条件的细节上与根据第一和第二示例性实施例中的每一个的处理装置不同。下面详细给出描述。
如在图6所示的示例中所示,根据本示例性实施例的转账表单包括其中填入项目的项目填入字段,以及其中填入指定转账日期的指定转账日期填入字段。
分析单元12通过OCR读取识别在转账请求表单(图像)中填入的内容,并且识别在项目填入字段中被填入的值和在指定转账日期填入字段中被填入的值(图5的S11)。注意,分析单元12还可以识别图6所示的其他填入字段中的每个值(包括数字、字符、符号等)。
然后,根据本示例性实施例的错误条件包括“在项目填入字段和指定转账日期填入字段中被填入的值的识别结果不满足为每个项目确定的可指定的指定转账日期的条件(指定日期条件)”。
确定单元13基于如图7所示的指示指定日期条件的条件信息,确定在项目填入字段中填入的值的识别结果和在指定转账日期填入字段中填入的值的识别结果是否满足指定日期条件(图5中的S12)。
注意,可以进一步设置另一错误条件(例如,在第一和/或第二示例性实施例中描述的错误条件)。此外,本文例示的一种项目和指定日期条件的细节仅是一个示例,并且本发明不限于此。
当分析单元12的识别结果满足至少一个错误条件时(图5中的S13为是),处理单元14执行错误处理(图5中的S15)。例如,当在项目填入字段中被填入的值的识别结果和在指定转账日期填入字段中被填入的值的识别结果不满足指定日期条件时,处理单元14执行错误处理。错误处理的细节类似于根据第一示例性实施例的细节。
注意,处理装置10的其他组件类似于根据第一或第二示例性实施例的那些组件。
根据上述本示例性实施例的处理装置10通过确定在项目填入字段中被填入的值的识别结果和在指定转账日期填入字段中被填入的值的识别结果是否满足为每个项目确定的可指定的指定转账日期的条件(指定日期条件)来检测OCR的错误识别。通过各种特征处理,检测OCR的错误识别提高了检测准确性,并可以减少人工确认工作。例如,通过设置在第一、第二和第三示例性实施例中描述的多个错误条件,进一步提高了OCR的错误识别的检测精度。
<第四示例性实施例>
根据本示例性实施例的处理装置10在错误条件的细节上与根据第一、第二和第三示例性实施例中的每一个的处理装置不同。下面详细给出描述。
如在图6所示的示例中,根据本示例性实施例的转账表单包括其中填入日期(指定转账日期)的日期填入字段(指定转账日期填入字段),以及填入指定转账日期的星期几的星期几填入字段。
分析单元12通过OCR读取识别被填入在转账请求表单(图像)中的内容,并且识别被填入在日期填入字段中的值和被填入在星期几填入字段中的值(图5中的S11)。注意,分析单元12还可以识别图6所示的其他填入字段中的每个值(包括数字、字符、符号等)。
然后,根据本示例性实施例的错误条件包括“被填入在日期填入字段中的值的识别结果和被填入在星期几填入字段中的值的识别结果相矛盾”。
确定单元13基于指示日期和星期几的日历信息来确定在日期填入字段中被填入的值的识别结果与在星期几填入字段中被填入的值的识别结果是否矛盾(图5中的S12)。本文的“矛盾”是指不匹配由日历信息所指示的日期和星期几之间的关联关系。
注意,可以进一步设置另一错误条件(例如,在第一、第二和第三示例性实施例中描述的错误条件中的至少一个)。
当分析单元12的识别结果满足至少一个错误条件时(图5中的S13为是),处理单元14执行错误处理(图5中的S15)。例如,当被填入在日期填入字段中的值的识别结果与被填入在星期几填入字段中的值的识别结果相矛盾时,处理单元14执行错误处理。错误处理的细节类似于根据第一示例性实施例中的那些。
注意,处理装置10的其他组件类似于根据第一、第二或第三示例性实施例的那些组件。
根据上述本示例性实施例的处理装置10通过确定被填入在日期填入字段中的值的识别结果与被填入在星期几填入字段中的值的识别结果是否矛盾来检测OCR的错误识别。通过各种特征处理,检测OCR的错误识别提高了检测准确性,并可以减少人工确认工作。例如,通过设置在第一、第二、第三和第四示例性实施例中描述的多个错误条件,进一步提高了OCR的错误识别的检测精度。
<第五示例性实施例>
根据本示例性实施例的处理装置10在错误条件的细节上与根据第一、第二、第三和第四示例性实施例中的每一个的处理装置不同。下面详细给出描述。
分析单元12利用多个图像分析引擎分析图像,并且识别在转账表单(填入表单)中包括的多个填入字段中被填入的值(图5中的S11)。多个图像分析引擎在图像分析的算法、设置等方面彼此不同。
然后,根据本示例性实施例的错误条件包括“多个图像分析引擎的识别结果相互不匹配”。确定单元13确定多个图像分析引擎的识别结果是否相互匹配(图5中的S12)。注意,可以进一步设置另一错误条件(例如,在第一、第二、第三和第四示例性实施例中描述的错误条件中的至少一个)。
当分析单元12的识别结果满足至少一个错误条件时(图5中的S13为是),处理单元14执行错误处理(图5中的S15)。例如,当多个图像分析引擎的识别结果相互不匹配时,处理单元14执行错误处理。错误处理的细节类似于根据第一示例性实施例中的那些。
注意,处理装置10的其他组件类似于根据第一、第二、第三或第四示例性实施例的那些组件。
根据上述本示例性实施例的处理装置10通过确定多个图像分析引擎的识别结果是否相互匹配来检测OCR的错误识别。通过各种特征处理,检测OCR的错误识别提高了检测准确性,并可以减少人工确认工作。例如,通过设置在第一、第二、第三、第四和第五示例性实施例中描述的多个错误条件,进一步提高了OCR的错误识别的检测精度。
<第六示例性实施例>
图8中图示了根据本示例性实施例的处理装置10的功能框图的一个示例。如图所示,处理装置10包括获取单元11、分析单元12、确定单元13、处理单元14、搜索单元15和存储单元16。图9中的流程图示出了根据本示例性实施例的处理装置10中的处理流程的一个示例。
首先,在S20中,获取单元11获取由图像扫描器等生成的转账表单(填入表单)的图像。分析单元12利用两个图像分析引擎(可以是三个或更多个图像分析引擎)分析在S20中由获取单元11获取的转账请求表单的图像,并识别转账请求表单中包括的多个填入字段中的每一个填入的值(S21和S23)。
接下来,搜索单元15使用被填入在两个图像分析引擎中的每一个的关键字填入字段中的值的识别结果作为关键字来搜索存储单元16(S22和S24)。
如图10所示,存储单元16将值(登记信息)与客户标识信息(所示的“客户号码”)相关联地存储在转账请求表单的填入字段中。例如,定期向同一方进行转账的转账请求者等将该方的信息与他/她自己的客户标识信息相关联登记。作为要登记的信息,例示了金融机构名称、分支名称、项目、账号和名称等中的至少一些。
在图6所示的示例的情况下,关键字填入字段是其中填入客户号码的字段。换句话说,搜索单元15利用其中填入客户号码的字段的识别结果作为关键字来搜索存储单元16。然后,当在存储单元16中发现关键字时,搜索单元15取出与关键字相关联的注册信息,并更新分析单元12的识别结果。具体地,将转账请求表单中包括的多个填入字段(金融机构名称、分支名称、项目、账号和名称等中的至少一些)的识别结果中的一些更新为先前注册的信息。
接下来,当在存储单元16中不能发现分别被填入在两个图像分析引擎中的每一个的关键字填入字段中的值的识别结果中的至少任一个时(S25为否),处理单元14执行错误处理(S32)。
另一方面,当在存储单元16中发现分别被填入在两个图像分析引擎中的每一个的关键字填入字段中的值的识别结果中的每一个时(S25为是),确定单元13确定两个图像分析引擎中的每一个的识别结果是否满足错误条件(S26和S27)。在本文中,确定是否满足第一至第四示例性实施例中描述的错误条件中的至少一个。
当满足错误条件中的任一个时(S28为否),处理单元14执行错误处理(S32)。
另一方面,当不满足任一错误条件时(S28为是),确定单元13核对两个图像分析引擎对多个填入字段的值的识别结果,并确定识别结果是否彼此匹配(S29)。
当识别结果不匹配时(S30为否),处理单元14执行错误处理(S32)。
另一方面,当识别结果匹配时(S30为是),处理单元14将基于分析单元12的识别结果和由搜索单元15从存储单元16获取的登记信息而生成的转账请求输入到结算主机20(S31)。
注意,处理装置10的其他组件类似于根据第一、第二、第三、第四或第五示例性实施例的那些组件。
根据上述本示例性实施例的处理装置10通过各种特征处理检测OCR的错误识别来提高检测准确度。这使得结算主机20能够在没有人工确认工作的情况下执行转账处理。
<变型例>
在本文中,描述了适用于所有示例性实施例的变型示例。尽管到目前为止已经假设填入表单是转账请求表单,但是填入表单可以是另一种表单。然后,可以在金融机构之外利用处理装置10。
上述示例性实施例中的一些或全部也可以被描述为但不限于以下补充说明。
1.一种处理装置,包括:
获取装置,用于获取填入表单的图像,填入表单包括填入数值的多个第一填入字段和填入在多个第一填入字段中被填入的数值的合计的第二填入字段;
分析装置,用于分析图像,并且识别被填入在多个第一填入字段中的值和被填入在第二填入字段中的值;
确定装置,用于确定被填入在多个第一填入字段中的值的识别结果的合计与被填入在第二填入字段中的值的识别结果是否彼此匹配;以及
处理装置,用于当被填入在多个第一填入字段中的值的识别结果的合计与被填入在第二填入字段中的值的识别结果彼此不匹配时,执行错误处理。
2.根据补充说明1所述的处理装置,其中,
填入表单是转账请求表单,以及
第一填入字段是填入转账金额的填入字段。
3.根据补充说明1或2所述的处理装置,其中,
填入表单包括填入相同值的多个第三填入字段,
分析装置分析图像,并且识别在多个第三填入字段的每一个中被填入的值,
确定装置确定被填入在多个第三填入字段中的值的识别结果是否相互匹配,以及
当被填入在多个第三填入字段中的值的识别结果相互不匹配时,处理装置执行错误处理。
4.根据补充说明3所述的处理装置,其中,
填入表单是转账请求表单,以及
多个第三填入字段包括转账请求者填入值的填入字段和工作人员填入值的填入字段。
5.根据补充说明1至4中的任一项所述的处理装置,其中,
填入表单是转账请求表单,并且包括填入项目的项目填入字段和填入指定转账日期的指定转账日期填入字段,
分析装置分析图像,并且识别在项目填入字段中被填入的值以及在指定转账日期被填入字段中填入的值,
确定装置基于确定用于项目的每一个的可指定的指定转账日期的条件的条件信息来确定在项目填入字段中被填入的值的识别结果与在指定转账日期填入字段中被填入的值的识别结果是否满足条件,以及
当在项目填入字段中被填入的值的识别结果与在指定转账日期填入字段中被填入的值的识别结果不满足条件时,处理装置执行错误处理。
6.根据补充说明1至5中的任一项所述的处理装置,其中,
填入表单包括填入日期的日期填入字段和填入星期几的星期几填入字段,
分析装置分析图像,并且识别在日期填入字段中被填入的值和在星期几填入字段中被填入的值,
确定装置基于指示日期和星期几的日历信息来确定在日期填入字段中填入的值的识别结果与在星期几填入字段中填入的值的识别结果是否矛盾,以及
当在日期填入字段中被填入的值的识别结果与在星期几填入字段中被填入的值的识别结果相矛盾时,处理装置执行错误处理。
7.根据补充说明6所述的处理装置,其中,
填入表单是转账请求表单,以及
日期填入字段是填入指定转账日期的填入字段。
8.根据补充说明1至7中的任一项所述的处理装置,其中,
分析装置利用多个图像分析引擎分析图像,并且识别在填入表单中包括的多个填入字段中被填入的值,以及
当多个图像分析引擎的识别结果相互不匹配时,处理装置执行错误处理。
9.一种处理装置,包括:
获取装置,用于获取包括多个填入字段的转账请求表单的图像;
分析装置,用于利用多个图像分析引擎,识别转账请求表单中包括的多个填入字段中的值;
搜索装置,用于利用填入在多个图像分析引擎的每一个的关键字填入字段中的值的识别结果作为关键字来搜索存储单元;
确定装置,用于确定在多个图像分析引擎对多个填入字段中的值的识别结果中是否存在满足错误条件的值;以及
处理装置,用于当多个图像分析引擎的识别结果相互不匹配时、当在存储单元中不能找到由多个图像分析引擎的任一个产生的关键字时,或者当多个图像分析引擎对多个填入字段中的值的识别结果中存在满足错误条件的值时,执行错误处理。
10.一种处理方法,包括:
通过计算机,
获取填入表单的图像,填入表单包括填入数值的多个第一填入字段和填入在多个第一填入字段中被填入的数值的合计的第二填入字段;
分析图像,并且识别被填入在多个第一填入字段中的值和被填入在第二填入字段中的值;
确定被填入在多个第一填入字段中的值的识别结果的合计与被填入在第二填入字段中的值的识别结果是否彼此匹配;以及
当被填入在多个第一填入字段中的值的识别结果的合计与被填入在第二填入字段中的值的识别结果彼此不匹配时,执行错误处理。
11.一种程序,所述程序使计算机用作:
获取装置,用于获取填入表单的图像,填入表单包括填入数值的多个第一填入字段和填入在多个第一填入字段中被填入的数值的合计的第二填入字段;
分析装置,用于分析图像,并且识别填入在多个第一填入字段中的值和填入在第二填入字段中的值;
确定装置,用于确定被填入在多个第一填入字段中的值的识别结果的合计与被填入在第二填入字段中的值的识别结果是否彼此匹配;以及
处理装置,用于当被填入在多个第一填入字段中的值的识别结果的合计与被填入在第二填入字段中的值的识别结果彼此不匹配时,执行错误处理。
虽然上文已经参考示例性实施例(和示例)描述了本申请的发明,但是本申请的发明不限于上述示例性实施例(和示例)。在本申请的发明的范围内,可以对本申请的发明的配置和细节进行本领域技术人员可理解的各种修改。
本申请基于2019年4月24日提交的日本专利申请No.2019-082587并要求其优先权,其公开内容通过引用整体并入本文。

Claims (9)

1.一种处理装置,包括:
获取单元,所述获取单元用于获取包括多个填入字段的转账请求表单的图像;
分析单元,所述分析单元用于利用多个图像分析引擎,识别所述转账请求表单中包括的所述多个填入字段中的值;
搜索单元,所述搜索单元用于利用被填入在多个所述图像分析引擎的每一个的关键字填入字段中的值的识别结果作为关键字来搜索存储单元;
确定单元,所述确定单元用于确定在多个所述图像分析引擎对多个填入字段中的值的识别结果中是否存在满足错误条件的值;以及
处理单元,所述处理单元用于当多个所述图像分析引擎的识别结果相互不匹配时、当在所述存储单元中不能找到由多个所述图像分析引擎的任一个产生的所述关键字时,或者当在多个所述图像分析引擎对多个填入字段中的值的识别结果中存在满足所述错误条件的值时,执行错误处理。
2.根据权利要求1所述的处理装置,其中:
所述获取单元获取所述转账请求表单的图像,所述转账请求表单包括填入数值的多个第一填入字段和填入在多个所述第一填入字段中被填入的所述数值的合计的第二填入字段;
所述分析单元分析所述图像,并且识别被填入在多个所述第一填入字段中的值和被填入在所述第二填入字段中的值;
所述确定单元确定被填入在多个所述第一填入字段中的值的识别结果的合计与被填入在所述第二填入字段中的值的识别结果是否彼此匹配;以及
所述处理单元当被填入在多个所述第一填入字段中的值的识别结果的合计与被填入在所述第二填入字段中的值的识别结果彼此不匹配时,执行错误处理。
3.根据权利要求2所述的处理装置,其中,
多个所述第一填入字段是填入转账金额的填入字段。
4.根据权利要求2或3所述的处理装置,其中,
所述转账请求表单包括填入相同值的多个第三填入字段,
所述分析单元分析所述图像,并且识别被填入在多个所述第三填入字段的每一个中的值,
所述确定单元确定被填入在多个所述第三填入字段中的值的识别结果是否相互匹配,以及
当被填入在多个所述第三填入字段中的值的识别结果相互不匹配时,所述处理单元执行错误处理。
5.根据权利要求4所述的处理装置,其中,
多个所述第三填入字段包括转账请求者填入值的填入字段和工作人员填入值的填入字段。
6.根据权利要求2所述的处理装置,其中,
所述转账请求表单包括填入项目的项目填入字段和填入指定转账日期的指定转账日期填入字段,
所述分析单元分析所述图像,并且识别被填入在所述项目填入字段中的值和被填入在所述指定转账日期填入字段中的值,
所述确定单元基于确定用于所述项目中的每一个的可指定的指定转账日期的条件的条件信息,来确定被填入在所述项目填入字段中的值的识别结果与被填入在所述指定转账日期填入字段中的值的识别结果是否满足所述条件,以及
当被填入在所述项目填入字段中的值的识别结果与被填入在所述指定转账日期填入字段中的值的识别结果不满足所述条件时,所述处理单元执行错误处理。
7.根据权利要求2所述的处理装置,其中,
所述转账请求表单包括填入日期的日期填入字段和填入星期几的星期几填入字段,
所述分析单元分析所述图像,并且识别被填入在所述日期填入字段中的值和被填入在所述星期几填入字段中的值,
所述确定单元基于指示日期和星期几的日历信息,来确定被填入在所述日期填入字段中的值的识别结果与被填入在所述星期几填入字段中的值的识别结果是否相矛盾,以及
当被填入在所述日期填入字段中的值的识别结果与被填入在所述星期几填入字段中的值的识别结果相矛盾时,所述处理单元执行错误处理。
8.根据权利要求7所述的处理装置,其中,
所述日期填入字段是填入指定转账日期的填入字段。
9.一种处理方法,包括:
通过计算机,
获取包括多个填入字段的转账请求表单的图像;
利用多个图像分析引擎,识别所述转账请求表单中包括的所述多个填入字段中的值;
利用被填入在多个所述图像分析引擎的每一个的关键字填入字段中的值的识别结果作为关键字来搜索存储单元;
确定在多个所述图像分析引擎对多个填入字段中的值的识别结果中是否存在满足错误条件的值;以及
当多个所述图像分析引擎的识别结果相互不匹配时、当在所述存储单元中不能找到由多个所述图像分析引擎的任一个产生的所述关键字时,或者当在多个所述图像分析引擎对多个填入字段中的值的识别结果中存在满足所述错误条件的值时,执行错误处理。
CN202080030860.3A 2019-04-24 2020-04-24 处理装置和处理方法 Active CN113767397B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2019082587 2019-04-24
JP2019-082587 2019-04-24
PCT/JP2020/017608 WO2020218471A1 (ja) 2019-04-24 2020-04-24 処理装置、処理方法及びプログラム

Publications (2)

Publication Number Publication Date
CN113767397A CN113767397A (zh) 2021-12-07
CN113767397B true CN113767397B (zh) 2024-06-11

Family

ID=72942188

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080030860.3A Active CN113767397B (zh) 2019-04-24 2020-04-24 处理装置和处理方法

Country Status (4)

Country Link
US (1) US20220165076A1 (zh)
JP (1) JP7319011B2 (zh)
CN (1) CN113767397B (zh)
WO (1) WO2020218471A1 (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000163491A (ja) * 1998-11-26 2000-06-16 Fujitsu Ltd 仕向けデ−タ処理方法ならびにそのための仕向けデ−タ処理装置およびコンピュ−タ読み取り可能な記録媒体
JP2000276541A (ja) * 1999-03-26 2000-10-06 Fujitsu Ltd 為替処理端末装置及び記録媒体
JP2001022883A (ja) * 1999-07-12 2001-01-26 Ricoh Co Ltd 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体
JP2001076093A (ja) * 1999-09-03 2001-03-23 Oki Software Kk 為替集中処理システム
JP2002092546A (ja) * 2000-09-20 2002-03-29 Oki Software Kk 文字認識方法
JP2005100385A (ja) * 2003-08-28 2005-04-14 Daiwa Securities Group Inc 証券決済管理システム、証券決済管理方法、及びプログラム
JP2005352529A (ja) * 2004-06-08 2005-12-22 Hitachi Ltd 日付曜日チェック装置
JP2006004263A (ja) * 2004-06-18 2006-01-05 Tokyo Tomin Bank Ltd 給与前払システム、給与前払方法及びプログラム
JP2009129097A (ja) * 2007-11-21 2009-06-11 Ntt Data Corp 口座振替受付システム、受付装置、端末装置、及び、コンピュータプログラム
CN101573725A (zh) * 2007-07-24 2009-11-04 查查检索有限公司 用于实质上立即支付搜索相关的任务的系统
KR20100027655A (ko) * 2008-09-03 2010-03-11 주식회사 신한은행 지로 납부 검색 처리 방법 및 시스템과 이를 위한 기록매체
JP2012185672A (ja) * 2011-03-04 2012-09-27 Japan Research Institute Ltd 自然言語バンキング処理サーバ及び自然言語バンキング処理方法
JP2013134543A (ja) * 2011-12-26 2013-07-08 Mizuho Corporate Bank Ltd 情報処理装置、情報処理方法及び情報処理プログラム
JP2018022230A (ja) * 2016-08-01 2018-02-08 株式会社ミロク情報サービス 支払管理装置及び支払管理方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090317003A1 (en) * 2008-06-22 2009-12-24 Andre Heilper Correcting segmentation errors in ocr
AU2012202173B2 (en) * 2011-04-18 2013-09-05 Castle Bookkeeping Wizard Pty Ltd System and method for processing a transaction document including one or more financial transaction entries
JP6253354B2 (ja) * 2013-11-06 2017-12-27 株式会社東芝 帳票読取装置、プログラムおよび帳票読取システム
JP6350048B2 (ja) 2014-07-08 2018-07-04 富士通株式会社 情報処理装置、情報処理方法及びプログラム
JP6711523B2 (ja) * 2018-05-25 2020-06-17 株式会社ふくおかフィナンシャルグループ 帳票認識システム

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000163491A (ja) * 1998-11-26 2000-06-16 Fujitsu Ltd 仕向けデ−タ処理方法ならびにそのための仕向けデ−タ処理装置およびコンピュ−タ読み取り可能な記録媒体
JP2000276541A (ja) * 1999-03-26 2000-10-06 Fujitsu Ltd 為替処理端末装置及び記録媒体
JP2001022883A (ja) * 1999-07-12 2001-01-26 Ricoh Co Ltd 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体
JP2001076093A (ja) * 1999-09-03 2001-03-23 Oki Software Kk 為替集中処理システム
JP2002092546A (ja) * 2000-09-20 2002-03-29 Oki Software Kk 文字認識方法
JP2005100385A (ja) * 2003-08-28 2005-04-14 Daiwa Securities Group Inc 証券決済管理システム、証券決済管理方法、及びプログラム
JP2005352529A (ja) * 2004-06-08 2005-12-22 Hitachi Ltd 日付曜日チェック装置
JP2006004263A (ja) * 2004-06-18 2006-01-05 Tokyo Tomin Bank Ltd 給与前払システム、給与前払方法及びプログラム
CN101573725A (zh) * 2007-07-24 2009-11-04 查查检索有限公司 用于实质上立即支付搜索相关的任务的系统
JP2009129097A (ja) * 2007-11-21 2009-06-11 Ntt Data Corp 口座振替受付システム、受付装置、端末装置、及び、コンピュータプログラム
KR20100027655A (ko) * 2008-09-03 2010-03-11 주식회사 신한은행 지로 납부 검색 처리 방법 및 시스템과 이를 위한 기록매체
JP2012185672A (ja) * 2011-03-04 2012-09-27 Japan Research Institute Ltd 自然言語バンキング処理サーバ及び自然言語バンキング処理方法
JP2013134543A (ja) * 2011-12-26 2013-07-08 Mizuho Corporate Bank Ltd 情報処理装置、情報処理方法及び情報処理プログラム
JP2018022230A (ja) * 2016-08-01 2018-02-08 株式会社ミロク情報サービス 支払管理装置及び支払管理方法

Also Published As

Publication number Publication date
WO2020218471A1 (ja) 2020-10-29
JP7319011B2 (ja) 2023-08-01
US20220165076A1 (en) 2022-05-26
CN113767397A (zh) 2021-12-07
JPWO2020218471A1 (zh) 2020-10-29

Similar Documents

Publication Publication Date Title
US11868717B2 (en) Multi-page document recognition in document capture
US10402163B2 (en) Intelligent data extraction
US8150156B2 (en) Automated processing of paper forms using remotely-stored templates
EP3779782A1 (en) Image processing device, image processing method, and storage medium for storing program
CN110276236B (zh) 计算机及模板管理方法
CN110785773A (zh) 票据识别系统
EP3779783A1 (en) Image processing device, image processing method, and storage medium storing program
EP3779784A1 (en) Image processing device, image processing method, and storage medium storing program
JP7408313B2 (ja) 画像処理装置、その制御方法及びプログラム
US20240257132A1 (en) Processing system, processing method, and non-transitory storage medium
CN113168527A (zh) 用于从实体文档提取信息的系统和方法
CN113767397B (zh) 处理装置和处理方法
CN116681801A (zh) 海报生成方法、装置、服务器以及存储介质
CN113302617A (zh) 一种文章生成装置,文章生成方法,以及文章生成程序
JP6993032B2 (ja) 会計処理装置、会計処理システム、会計処理方法及びプログラム
JP4259889B2 (ja) データベース管理システム、データベース管理装置、データベース管理方法、及びデータベース管理プログラム
US12125088B2 (en) Processing apparatus, processing method, and non-transitory storage medium
US20080267512A1 (en) Automatic review of variable imaging jobs
JP7491022B2 (ja) 書類識別装置、書類識別方法及びコンピュータプログラム
US11698763B2 (en) Information processing apparatus for registered files and issuing identification information for tracking an evaluation of a user using the files
JP2009230450A (ja) 文書属性情報登録装置及びプログラム
US20230177859A1 (en) Document Processing Method, and Information Processing Device
WO2023062798A1 (ja) 情報処理システム、項目値抽出方法、モデル生成方法及びプログラム
JP2023057446A (ja) 文書認識装置および文書認識方法
WO2014203749A1 (ja) 処方箋入力装置及び方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant