CN111104853A - 图像信息录入方法、装置、电子设备及存储介质 - Google Patents

图像信息录入方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111104853A
CN111104853A CN201911092887.0A CN201911092887A CN111104853A CN 111104853 A CN111104853 A CN 111104853A CN 201911092887 A CN201911092887 A CN 201911092887A CN 111104853 A CN111104853 A CN 111104853A
Authority
CN
China
Prior art keywords
image
entry
input
image information
slices
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911092887.0A
Other languages
English (en)
Inventor
唐业祎
张小彪
熊兰君
方礼蓉
程力
谭硕
王超
汪维
张曦
方红涛
杨锐
王斯雅
杨永
刘聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
CCB Finetech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp, CCB Finetech Co Ltd filed Critical China Construction Bank Corp
Priority to CN201911092887.0A priority Critical patent/CN111104853A/zh
Publication of CN111104853A publication Critical patent/CN111104853A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/002Specific input/output arrangements not covered by G06F3/01 - G06F3/16
    • G06F3/005Input arrangements through a video camera
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种图像信息录入方法、装置、电子设备及存储介质,其中,该方法包括:获取票据图像;根据预先设置的图像切片规则对票据图像进行切片处理,以生成多个图像切片;对多个图像切片进行预处理,并根据预先设置的图像录入规则对预处理后的多个图像切片分别进行录入操作,录入操作的类型包括:智能识别录入、移动终端录入、人为录入;当对同一图像切片进行至少两种类型的录入操作时,对至少两种类型的录入操作结果进行一致性验证,并记录验证成功的录入操作结果。通过本发明,可以提高图像信息录入的准确性和高效性,以及降低成本。

Description

图像信息录入方法、装置、电子设备及存储介质
技术领域
本发明涉及图像处理领域,具体涉及一种图像信息录入方法、装置、电子设备及存储介质。
背景技术
目前在金融行业,有大量包含凭证票据类影像的业务需要处理,这涉及到了海量图像数据的系统录入工作,该工作需要重点关注如下问题:
一、安全保密问题,银行等金融行业本身具有较高的保密要求,需要防止客户的身份信息、财产信息、交易信息等敏感数据的泄露。通过对凭证切片的精准定位以及对切片内容的细切分割,确保录入人员无法识别出票据凭证的完整信息,从而确保录入数据的安全保密性。
二、可靠性与低成本,目前很多金融机构都采用人工录入方式处理凭证数据的录入,这需要大量的人力资源,另外也有些机构利用图像识别等技术对某些特定凭证票据进行自动识别录入,但其识别存在一定的误差,准确性无法得到保证,一旦对金额、账号等高风险要素识别错误将会带来较高的业务风险。
目前,在金融行业已有了采用密集型外包人员进行票据数据录入的方案,首先对凭证票据扫描入库,然后生成图像切片,通过自动化的任务分配系统,由外包人员在系统终端进行图片数据录入,该方案的准确度虽然较高,但其人工成本较高,同时在长期高强度的录入作业中录入质量难免会受影响。
由以上分析可知,现有金融行业的图像数据录入的有关技术方案存在成本高、保密性差、可靠性差等问题。
发明内容
有鉴于此,本发明提供一种图像信息录入方法、装置、电子设备及存储介质,以解决上述提及的至少一个问题。
根据本发明的第一方面,提供一种图像信息录入方法,所述方法包括:获取票据图像;根据预先设置的图像切片规则对所述票据图像进行切片处理,以生成多个图像切片;对所述多个图像切片进行预处理,并根据预先设置的图像录入规则对预处理后的多个图像切片分别进行录入操作,所述录入操作的类型包括:智能识别录入、移动终端录入、人为录入;当对同一图像切片进行至少两种类型的录入操作时,对所述至少两种类型的录入操作结果进行一致性验证,并记录验证成功的录入操作结果。
根据本发明的第二方面,提供一种图像信息录入装置,所述装置包括:图像获取单元,用于获取票据图像;图像切片单元,用于根据预先设置的图像切片规则对所述票据图像进行切片处理,以生成多个图像切片;预处理单元,用于对所述多个图像切片进行预处理;录入操作单元,用于根据预先设置的图像录入规则对预处理后的多个图像切片分别进行录入操作,所述录入操作的类型包括:智能识别录入、移动终端录入、人为录入;验证单元,用于当对同一图像切片进行至少两种类型的录入操作时,对所述至少两种类型的录入操作结果进行一致性验证;记录单元,用于记录一致性验证成功的录入操作结果。
根据本发明的第三方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述图像信息录入方法的步骤。
根据本发明的第四方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述图像信息录入方法的步骤。
由上述技术方案可知,通过对获取的票据图像进行切片处理得到多个图像切片,并对图像切片预处理后进行不同类型的录入操作,当对同一图像切片执行至少两种类型的录入操作、且录入操作结果一致时,记录录入操作结果,相比于现有技术,由于可以结合至少两种类型的录入操作对票据图像进行录入,因而可以提高图像信息录入的准确性和高效性,且相比于传统的外包录入方式,可以降低成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的图像信息录入方法的流程图;
图2是根据本发明实施例的图像信息录入方法的详细流程图;
图3是根据本发明实施例的图像信息录入装置的结构框图;
图4是根据本发明实施例的预处理单元33的结构框图;
图5是根据本发明实施例的图像信息录入装置的详细结构框图;
图6是根据本发明实施例的电子设备的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
由于现有金融行业的图像数据录入方案存在成本高、保密性差、可靠性差等问题,基于此,本发明实施例提供了一种图像信息录入方案,该方案将基于深度学习的图像识别录入、移动终端(例如,手机)录入、传统外包录入这三种方式相结合,对票据图像进行交叉验证录入,该方案可以保证图像录入的高效性和准确性,并且相比于传统的外包录入方式,本发明实施例的成本较低。以下结合附图来详细描述本发明实施例。
图1是根据本发明实施例的图像信息录入方法的流程图,如图1所示,该方法包括步骤101-步骤104:
步骤101,获取票据图像。
步骤102,根据预先设置的图像切片规则对所述票据图像进行切片处理,以生成多个图像切片。
步骤103,对所述多个图像切片进行预处理,并根据预先设置的图像录入规则对预处理后的多个图像切片分别进行录入操作,所述录入操作的类型包括:智能识别录入、移动终端录入(或称为云录入)、人为录入。其中,图像录入规则主要用于指示图像切片的录入方式,例如,对于特定图像切片,指定其录入方式为智能识别录入和移动终端录入。
优选地,这里的智能识别录入可以是ICR(Intelligent Character Recognition,智能字符识别)录入。
上述对多个图像切片进行预处理具体包括:对所述多个图像切片分别进行图像优化处理和/或去敏感信息处理。
具体而言,由于图像切片的来源是多样化的,图像的质量、范围、背景纹理等具有较大差异,为了保证后续录入的可靠性和高效性,因而需要对图像切片进行预处理。一方面,可以对图像切片进行优化处理,如边缘锐化、对比度调整、强化或过滤色彩、大小调整等,以保证图像切片可以统一处理,易于进行人工核对或智能识别;另一方面,进行图像业务上的处理,如去除红章、去底纹、去分隔栏、去羊角符号等,以防止录入过程中识别出原始票据内容,导致敏感信息泄露,如此,可以提高录入操作的可靠性。
步骤104,当对同一图像切片进行至少两种类型的录入操作时,对所述至少两种类型的录入操作结果进行一致性验证,并记录验证成功的录入操作结果。
而当一致性验证失败时,对所述同一图像切片进行人为录入操作,将人为录入操作结果作为准确结果,并记录人为录入操作结果。
通过对获取的票据图像进行切片处理得到多个图像切片,并对图像切片预处理后进行不同类型的录入操作,当对同一图像切片执行至少两种类型的录入操作、且录入操作结果一致时,记录录入操作结果,相比于现有技术,由于可以结合至少两种类型的录入操作对票据图像进行录入,因而可以提高图像信息录入的准确性和高效性,且相比于传统的外包录入方式,本发明实施例可以降低成本。
在实际操作中,需要预先对智能识别录入进行训练学习操作,例如,可以根据历史票据图像的录入操作结果对智能识别录入进行训练学习操作。
优选地,当至少两种类型的录入操作包括智能识别录入时,可以将这至少两种类型的录入操作结果作为新的训练数据对智能识别录入进行训练学习操作。
具体而言,ICR识别是指在OCR(Optical Character Recognition,光学字符识别)识别的基础上结合人工智能技术进行的智能识别。ICR需要在存量图像数据的基础上进行学习生成知识库以提高识别准确率。一般而言,可以采用语义推理和语义分析,对于OCR未识别的字符,可根据该字符上下文语句结合已知图像数据录入的存量知识库,进行未识别部分的字符信息补全。
当上述录入操作包括移动终端录入时,还可以根据图像录入规则将预定类型的图像切片发送到至少一个特定移动终端进行录入操作,这里的特定移动终端可以是录入准确率较高的移动终端,如此,可以保证录入准确率。
图像切片录入任务的智能推送,可以根据不同的图片类型推送特定数量的图像录入任务,确保资源的合理利用和数据的准确判断。
以下以金融系统中的凭证票据(如汇款申请书、汇率交易申请书、支款凭证、信用卡申请书、投保单等)为例,来详细描述本发明实施例的图像信息录入流程,如图2所示,录入流程具体包括如下步骤:
步骤201:定义模板。
预先设置图像录入模版和图像切片模版:用户在浏览器界面可以通过图像录入模版上传原始票据图像;以及,可以利用系统画图工具进行图像切片定义来设置图形切片模版,图像切片模版可以精确标识票据图像中需要进行数据录入或识别的切片栏位,通过图像切片模块可以识别图像切片的类型,以便于后续图像录入规则根据图像切片类型指示其录入方式。
步骤202:扫描票据图像。
通过外联扫描仪等设备,对票据进行扫描或拍照等操作通过图形录入模版将图像上传至系统。
步骤203:拆分要素及预处理。
根据步骤1中的图像切片模板对扫描图像进行自动匹配识别,对图像进行切割以拆分要素,生成可用于录入的图像切片。
由于图像切片的来源是多样化的,图像的质量、范围、背景纹理等具有较大差异,需要对图像切分进行两方面预处理:一方面进行图像本身的优化处理,如边缘锐化、对比度调整、强化或过滤色彩、大小调整等,以保证图像可以统一处理,易于进行人工核对或智能识别;另一方面进行图像业务上的处理,如去除红章、去底纹、去分隔栏、去羊角符号等,以防止录入用户识别出原始票据内容,导致敏感信息泄露。如此,可以保证图像录入的可靠性和高效性。
步骤204:图像切片识别录入综合处理。
根据预先设置的图像录入规则对图像切分进行录入操作。在本实例中,图像录入规则可以以如表1所示的配置表示出,根据该配置表选择录入流程,如表1所示,可以为每个图像切片设置切片编号、切片名称(或者称为切片类型),并根据切片名称设置录入类型(例如,一次录入或者二次录入,以及具体录入方式)。按照智能识别(ICR)录入、云录入、外包录入的优先顺序,对图像切片中的要素进行识别和录入,根据配置表,对识别的不同要素选择对应的录入流程进行录入,当录入类型为二次录入时,对两次录入结果进行交叉验证后得到最终值。
切片编号 切片名称 录入类型 是否ICR 是否云录入
000801 收款人账号 二次录入
000701 小写金额 二次录入
004201 住宅电话 一次录入
007001 住宅邮编 一次录入
表1
上述一次录入方式是指仅采用单一单次的识别录入方式来录入图像数据,针对非关键的图像切片,即对录入的正确性没有非常严格的要求,通常为票据上的一些辅助信息。
上述二次录入是采用两次复合式的录入方式,进行交叉验证,主要针对关键图像切片,如账号、户名、证件号码等,这种都需要尽可能的保证完全正确,对录入准确性要求较高。
ICR识别需要在存量图像数据的基础上进行学习生成知识库以提高识别准确率,并且随着录入操作的进行,新录入的图像数据可以作为新的训练数据对ICR识别进行进一步的学习训练,以增加ICR识别的准确性。
云录入是指基于移动终端(例如,手机)录入的社会化图像录入方式。本发明实施例提供手机客户端接入的录入操作,在预定的手机终端上,将需要云录入的图像切片加载到图像处理任务队列中,对每个图像切片根据图像录入规则(例如,上述配置表)进行智能推送,分发图像录入任务供手机用户录入。
在一个实例中,可以将“二次录入”、且需要云录入的图像切片推送给高等级的移动终端进行录入,高等级表示录入准确率较高,该等级可以通过历史录入情况评估。
录入操作具体可以支持日期、金额、文本、列表选项等多种类型,采用不同的展现形式,例如,对日期以YYYYMMDD的下划线格式留空填充;对金额采用留两位小数的固定格式;性别、证件类型等根据配置的对应标准数据进行列表下拉选择。
在另一个实例中,对云录入结果可以定义准确判断规则,该规则定义对同一图像切片的多次相同录入数大于最低正确数时,得到其有效云录入数据。例如,定义准确判断规则为7选4时,将同一图像切片同时发送给7个不同移动终端进行录入,若满足有4个移动终端录入内容相同,则以该相同值为云录入值,然后进行后续比对判断其他移动终端是否录入准确。
步骤205:图像录入数据终值判断。
在二次录入中会将ICR录入、云录入或外包录入数据(根据配置表按需组合)进行比对,当二次录入的结果一致时,则表示录入成功,若两者录入结果不一致,则将ICR录入结果、云录入结果分别与人工录入结果进行比较确认,以人工录入结果为准。对于这些交叉验证或人工比较后的结果,可以作为新的训练数据提供给ICR算法进行学习,以提高ICR识别准确率。
以下以对图像切片为“收款人账号”录入为例来详细描述本发明实施例。
首先,识别该图像切片,由于该图像切片涉及敏感账号信息且不允许有错误,因而该类图像切片属于“关键要素”,在配置表中被预先配置为二次录入(ICR识别+云录入)。在对“收款人账号”图像切片进行ICR录入和云录入之后,将两者的录入值进行交叉比对,当两者录入值不同时,会以人工录入值作为录入值。当两者录入值一致时,表示两者录入成功。后续,该图像切片的录入过程数据可以作为新的训练数据提供给ICR算法进行学习。
本发明实施例基于智能图像识别录入、移动终端的社会化图像录入、传统外包录入这三者相结合的交叉验证录入方式,可以充分发挥人工智能的智能识别优势和成本优势,云录入的成本优势和传统人工录入的准确率优势,三者结合,既可以最大化降低录入成本,又可以提升录入准确率和高效性,可以满足银行业务要求。
基于相似的发明构思,本发明实施例还提供一种图像信息录入装置,优选地,该装置用于实现上述的方法。
图3是图像信息录入装置的结构框图,如图3所示,该装置包括:图像获取单元31、图像切片单元32、预处理单元33、录入操作单元34、验证单元35和记录单元36,其中:
图像获取单元31,用于获取票据图像;
图像切片单元32,用于根据预先设置的图像切片规则对所述票据图像进行切片处理,以生成多个图像切片;
预处理单元33,用于对所述多个图像切片进行预处理;
录入操作单元34,用于根据预先设置的图像录入规则对预处理后的多个图像切片分别进行录入操作,所述录入操作的类型包括:智能识别录入、移动终端录入、人为录入;
验证单元35,用于当对同一图像切片进行至少两种类型的录入操作时,对所述至少两种类型的录入操作结果进行一致性验证;
记录单元36,用于记录一致性验证成功的录入操作结果,以及当所述一致性验证失败时,记录单元36用于记录对同一图像切片进行人为录入操作的结果。
通过图像切片单元32对图像获取单元31获取的票据图像进行切片处理得到多个图像切片,预处理单元33对图像切片预处理后录入操作单元34进行不同类型的录入操作,当录入操作单元34对同一图像切片执行至少两种类型的录入操作、且验证单元35验证录入操作结果一致时,记录单元36记录录入操作结果,相比于现有技术,由于可以结合至少两种类型的录入操作对票据图像进行录入,因而可以提高图像信息录入的准确性和高效性,且相比于传统的外包录入方式,本发明实施例可以降低成本。
如图4所示,上述预处理单元33包括:图像优化处理模块331和去敏感信息处理模块332,其中:
图像优化处理模块331,用于对所述多个图像切片分别进行图像优化处理,例如边缘锐化、对比度调整、强化或过滤色彩、大小调整等,可以保证图像切片可以统一处理,易于进行人工核对或智能识别。
去敏感信息处理模块332,用于对所述多个图像切片分别进行去敏感信息处理,例如去除红章、去底纹、去分隔栏、去羊角符号等,以防止录入过程中识别出原始票据内容,导致敏感信息泄露,如此,可以提高录入操作的可靠性。
如图5所示,上述装置还包括:学习单元37,用于根据历史票据图像的录入操作结果对所述智能识别录入进行训练学习操作。
在实际操作中,当录入操作包括智能识别录入时,学习单元37还用于:将录入操作结果作为新的训练数据对所述智能识别录入进行训练学习操作,以提高智能识别录入的准确性。
上述装置还包括:图像切片发送单元38,用于当所述录入操作包括移动终端录入时,根据所述图像录入规则将预定类型的图像切片发送到至少一个特定移动终端进行录入操作,例如,将准确性要求较高的图像切片发送至高等级的移动终端进行录入,以保证准确率。
上述各单元、各模块的具体实施过程,可以参见上述方法实施例的描述,此处不再赘述。
在实际操作中,上述各单元、各模块可以组合设置、也可以单一设置,本发明不限于此。
图6是根据本发明实施例的电子设备的示意图。图6所示的电子设备为通用数据处理装置,其包括通用的计算机硬件结构,其至少包括处理器601和存储器602。处理器601和存储器602通过总线603连接。存储器602适于存储处理器601可执行的一条或多条指令或程序。该一条或多条指令或程序被处理器601执行以实现上述图像信息录入方法中的步骤。
上述处理器601可以是独立的微处理器,也可以是一个或者多个微处理器集合。由此,处理器601通过执行存储器602所存储的命令,从而执行如上所述的本发明实施例的方法流程实现对于数据的处理和对于其他装置的控制。总线603将上述多个组件连接在一起,同时将上述组件连接到显示控制器604和显示装置以及输入/输出(I/O)装置605。输入/输出(I/O)装置605可以是鼠标、键盘、调制解调器、网络接口、触控输入装置、体感输入装置、打印机以及本领域公知的其他装置。典型地,输入/输出(I/O)装置605通过输入/输出(I/O)控制器606与系统相连。
其中,存储器602可以存储软件组件,例如操作系统、通信模块、交互模块以及应用程序。以上所述的每个模块和应用程序都对应于完成一个或多个功能和在发明实施例中描述的方法的一组可执行程序指令。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时以实现上述图像信息录入方法的步骤。
综上所述,本发明实施例采用基于人工智能的图像识别技术,可以快速识别出凭证的要素内容;采用云录入方式,能够节约成本的基础上实现人工录入;采用传统外包录入,能够实现要素的准确录入,这三种录入方式通过预定流程配置进行有效结合,能够在安全保密的条件下,实现高效、可靠、低成本的录入。目前ICR的识别率最高可以达到86%,准确率可以达到99.88%,云录入的成功率最高可以达到85%,正确率达70%。结合ICR识别、云录入、人工外包录入的整体录入方案相比现有的纯人工处理,准确率可以提高0.43%,处理效率可以提高97.5%,并且成本可以节约32%,具有明显优势。
以上参照附图描述了本发明的优选实施方式。这些实施方式的许多特征和优点根据该详细的说明书是清楚的,因此权利要求旨在覆盖这些实施方式的落入其真实精神和范围内的所有这些特征和优点。此外,由于本领域的技术人员容易想到很多修改和改变,因此不是要将本发明的实施方式限于所例示和描述的精确结构和操作,而是可以涵盖落入其范围内的所有合适修改和等同物。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (14)

1.一种图像信息录入方法,其特征在于,所述方法包括:
获取票据图像;
根据预先设置的图像切片规则对所述票据图像进行切片处理,以生成多个图像切片;
对所述多个图像切片进行预处理,并根据预先设置的图像录入规则对预处理后的多个图像切片分别进行录入操作,所述录入操作的类型包括:智能识别录入、移动终端录入、人为录入;
当对同一图像切片进行至少两种类型的录入操作时,对所述至少两种类型的录入操作结果进行一致性验证,并记录验证成功的录入操作结果。
2.根据权利要求1所述的图像信息录入方法,其特征在于,对所述多个图像切片进行预处理包括:
对所述多个图像切片分别进行图像优化处理和/或去敏感信息处理。
3.根据权利要求1所述的图像信息录入方法,其特征在于,所述方法还包括:
当所述一致性验证失败时,对所述同一图像切片进行人为录入操作,并记录人为录入操作结果。
4.根据权利要求1所述的图像信息录入方法,其特征在于,所述方法还包括:
根据历史票据图像的录入操作结果对所述智能识别录入进行训练学习操作。
5.根据权利要求4所述的图像信息录入方法,其特征在于,对所述智能识别录入进行训练学习操作还包括:
当所述至少两种类型的录入操作包括所述智能识别录入时,将所述至少两种类型的录入操作结果作为新的训练数据对所述智能识别录入进行训练学习操作。
6.根据权利要求1所述的图像信息录入方法,其特征在于,当所述录入操作包括移动终端录入时,所述方法还包括:
根据所述图像录入规则将预定类型的图像切片发送到至少一个特定移动终端进行录入操作。
7.一种图像信息录入装置,其特征在于,所述装置包括:
图像获取单元,用于获取票据图像;
图像切片单元,用于根据预先设置的图像切片规则对所述票据图像进行切片处理,以生成多个图像切片;
预处理单元,用于对所述多个图像切片进行预处理;
录入操作单元,用于根据预先设置的图像录入规则对预处理后的多个图像切片分别进行录入操作,所述录入操作的类型包括:智能识别录入、移动终端录入、人为录入;
验证单元,用于当对同一图像切片进行至少两种类型的录入操作时,对所述至少两种类型的录入操作结果进行一致性验证;
记录单元,用于记录一致性验证成功的录入操作结果。
8.根据权利要求7所述的图像信息录入装置,其特征在于,所述预处理单元包括:
图像优化处理模块,用于对所述多个图像切片分别进行图像优化处理;
去敏感信息处理模块,用于对所述多个图像切片分别进行去敏感信息处理。
9.根据权利要求7所述的图像信息录入装置,其特征在于,所述记录单元还用于:
当所述一致性验证失败时,记录对所述同一图像切片进行人为录入操作的结果。
10.根据权利要求7所述的图像信息录入装置,其特征在于,所述装置还包括:
学习单元,用于根据历史票据图像的录入操作结果对所述智能识别录入进行训练学习操作。
11.根据权利要求10所述的图像信息录入装置,其特征在于,所述学习单元还用于:
当所述至少两种类型的录入操作包括所述智能识别录入时,将所述至少两种类型的录入操作结果作为新的训练数据对所述智能识别录入进行训练学习操作。
12.根据权利要求7所述的图像信息录入装置,其特征在于,所述装置还包括:
图像切片发送单元,用于当所述录入操作包括移动终端录入时,根据所述图像录入规则将预定类型的图像切片发送到至少一个特定移动终端进行录入操作。
13.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至6中任一项所述图像信息录入方法的步骤。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述图像信息录入方法的步骤。
CN201911092887.0A 2019-11-11 2019-11-11 图像信息录入方法、装置、电子设备及存储介质 Pending CN111104853A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911092887.0A CN111104853A (zh) 2019-11-11 2019-11-11 图像信息录入方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911092887.0A CN111104853A (zh) 2019-11-11 2019-11-11 图像信息录入方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN111104853A true CN111104853A (zh) 2020-05-05

Family

ID=70420543

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911092887.0A Pending CN111104853A (zh) 2019-11-11 2019-11-11 图像信息录入方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111104853A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111731960A (zh) * 2020-06-22 2020-10-02 浙江新再灵科技股份有限公司 电梯门开关状态检测方法
CN111881881A (zh) * 2020-08-10 2020-11-03 晶璞(上海)人工智能科技有限公司 一种基于多维度的机器智能文本识别可信度判别方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739441A (zh) * 2009-12-01 2010-06-16 中国建设银行股份有限公司 一种图像信息录入的方法以及系统
CN102567764A (zh) * 2012-01-13 2012-07-11 中国工商银行股份有限公司 一种提高电子影像识别效率的票据凭证及系统
CN102750794A (zh) * 2012-07-10 2012-10-24 陕西海基业高科技实业有限公司 一种票据自动录入系统及其应用方法
CN105373791A (zh) * 2015-11-12 2016-03-02 中国建设银行股份有限公司 信息处理方法及信息处理装置
CN105608452A (zh) * 2014-11-11 2016-05-25 金蝶软件(中国)有限公司 单据录入的方法和系统
CN106446901A (zh) * 2016-10-31 2017-02-22 中国银行股份有限公司 一种银行票据录入方法、装置及系统
CN108090488A (zh) * 2017-12-18 2018-05-29 广东广业开元科技有限公司 一种基于大数据ocr物联网的人工智能工会信息录入系统
CN108717545A (zh) * 2018-05-18 2018-10-30 北京大账房网络科技股份有限公司 一种基于手机拍照的票据识别方法及系统
CN109784342A (zh) * 2019-01-24 2019-05-21 厦门商集网络科技有限责任公司 一种基于深度学习模型的ocr识别方法及终端
CN110363097A (zh) * 2019-06-21 2019-10-22 深圳壹账通智能科技有限公司 基于财务报表的企业画像生成方法和装置
CN110378343A (zh) * 2019-07-26 2019-10-25 中国工商银行股份有限公司 一种财务报销数据处理方法、装置及系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739441A (zh) * 2009-12-01 2010-06-16 中国建设银行股份有限公司 一种图像信息录入的方法以及系统
CN102567764A (zh) * 2012-01-13 2012-07-11 中国工商银行股份有限公司 一种提高电子影像识别效率的票据凭证及系统
CN102750794A (zh) * 2012-07-10 2012-10-24 陕西海基业高科技实业有限公司 一种票据自动录入系统及其应用方法
CN105608452A (zh) * 2014-11-11 2016-05-25 金蝶软件(中国)有限公司 单据录入的方法和系统
CN105373791A (zh) * 2015-11-12 2016-03-02 中国建设银行股份有限公司 信息处理方法及信息处理装置
CN106446901A (zh) * 2016-10-31 2017-02-22 中国银行股份有限公司 一种银行票据录入方法、装置及系统
CN108090488A (zh) * 2017-12-18 2018-05-29 广东广业开元科技有限公司 一种基于大数据ocr物联网的人工智能工会信息录入系统
CN108717545A (zh) * 2018-05-18 2018-10-30 北京大账房网络科技股份有限公司 一种基于手机拍照的票据识别方法及系统
CN109784342A (zh) * 2019-01-24 2019-05-21 厦门商集网络科技有限责任公司 一种基于深度学习模型的ocr识别方法及终端
CN110363097A (zh) * 2019-06-21 2019-10-22 深圳壹账通智能科技有限公司 基于财务报表的企业画像生成方法和装置
CN110378343A (zh) * 2019-07-26 2019-10-25 中国工商银行股份有限公司 一种财务报销数据处理方法、装置及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111731960A (zh) * 2020-06-22 2020-10-02 浙江新再灵科技股份有限公司 电梯门开关状态检测方法
CN111731960B (zh) * 2020-06-22 2022-02-15 浙江新再灵科技股份有限公司 电梯门开关状态检测方法
CN111881881A (zh) * 2020-08-10 2020-11-03 晶璞(上海)人工智能科技有限公司 一种基于多维度的机器智能文本识别可信度判别方法

Similar Documents

Publication Publication Date Title
WO2021042747A1 (zh) 发票图片识别及验真方法、系统、设备及可读存储介质
CN109887153A (zh) 一种财税处理方法和处理系统
CN103914907A (zh) 纸质票据信息识别与核校系统及应用方法
CN103488923B (zh) 一种电子签名方法、装置及系统
CN110516664A (zh) 票据识别方法、装置、电子设备及存储介质
CN104915668A (zh) 医学影像中的文字信息识别方法及装置
CN109271951A (zh) 一种提升记账审核效率的方法及系统
CN111104853A (zh) 图像信息录入方法、装置、电子设备及存储介质
CN112232336A (zh) 一种证件识别方法、装置、设备及存储介质
CN114511866A (zh) 数据稽核方法、装置、系统、处理器及机器可读存储介质
CN113313114B (zh) 证件信息获取方法、装置、设备以及存储介质
CN117807967A (zh) 一种基于ocr智能填单的财务报账方法、装置及电子设备
CN116992847A (zh) 一种财报处理方法、装置、系统和介质
JP4809637B2 (ja) 文字認識システム及び文字認識方法
CN112348022B (zh) 一种基于深度学习的自由格式文档识别方法
CN113344510A (zh) 一种智能税务材料在线审核方法、装置、终端及存储介质
CN115294593A (zh) 一种图像信息抽取方法、装置、计算机设备及存储介质
CN114549177A (zh) 保函审查方法、装置、系统与计算机可读存储介质
TWM626292U (zh) 業務導向要項鍵值辨識系統
CN113947510A (zh) 一种基于文件格式自适应的不动产电子证照管理系统
CN107092903A (zh) 信息识别方法及装置
CN114820211B (zh) 理赔资料质检核验方法、装置、计算机设备及存储介质
CN117854095A (zh) 业务凭证审核方法及装置
CN117975466B (zh) 一种基于版面分析的通用场景卡证识别系统
CN110348804A (zh) 基于ai的订单录入方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220914

Address after: 25 Financial Street, Xicheng District, Beijing 100033

Applicant after: CHINA CONSTRUCTION BANK Corp.

Address before: 25 Financial Street, Xicheng District, Beijing 100033

Applicant before: CHINA CONSTRUCTION BANK Corp.

Applicant before: Jianxin Financial Science and Technology Co.,Ltd.