CN115019325A - 一种基于图像识别的业务处理方法及装置、存储介质 - Google Patents

一种基于图像识别的业务处理方法及装置、存储介质 Download PDF

Info

Publication number
CN115019325A
CN115019325A CN202210821064.2A CN202210821064A CN115019325A CN 115019325 A CN115019325 A CN 115019325A CN 202210821064 A CN202210821064 A CN 202210821064A CN 115019325 A CN115019325 A CN 115019325A
Authority
CN
China
Prior art keywords
verified
image
authenticated
document
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210821064.2A
Other languages
English (en)
Inventor
彭波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Qianhai Huanrong Lianyi Information Technology Service Co Ltd
Original Assignee
Shenzhen Qianhai Huanrong Lianyi Information Technology Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Qianhai Huanrong Lianyi Information Technology Service Co Ltd filed Critical Shenzhen Qianhai Huanrong Lianyi Information Technology Service Co Ltd
Priority to CN202210821064.2A priority Critical patent/CN115019325A/zh
Publication of CN115019325A publication Critical patent/CN115019325A/zh
Priority to PCT/CN2023/103596 priority patent/WO2024012209A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种基于图像识别的业务处理方法及装置、存储介质、计算机设备,该方法包括:获取至少一个待验证图像,对所述至少一个待验证图像进行文字识别,得到每个所述待验证图像对应的文字信息,其中,每个所述待验证图像包括至少一个待验证单据;从所述文字信息中确定与每个所述待验证单据对应的目标查询信息,并基于所述目标查询信息,确定所述待验证单据是否通过验证;当任一所述待验证单据通过验证后,基于所述至少一个待验证图像,确定与所述任一所述待验证单据对应的目标存档图像,并基于所述目标存档图像,生成所述业务的存档信息。本申请可以简化待验证单据的验证过程,能够大大提升验证以及存档的效率,有利于提高用户的体验感。

Description

一种基于图像识别的业务处理方法及装置、存储介质
技术领域
本申请涉及计算机技术领域,尤其是涉及到一种基于图像识别的业务处理方法及装置、存储介质、计算机设备。
背景技术
当前,很多业务在办理过程中都需要对单据进行验证,例如,利用发票这种单据进行融资时,需要对发票进行验证,当通过验证表明该发票没有被用于过融资之后,才可以利用该发票办理本次融资业务。然而,现有技术中,在融资前对发票进行验证时,通常需要用户线下登录中登系统等发票验证系统,多次输入发票相关信息进行验证,验证过程繁琐。当发票通过验证后,将通过验证的发票相关信息手动上传到融资系统办理融资业务,并且需要用户从众多发票中找出用于办理融资业务的发票上传以进行存档,整个过程非常工作量大、效率低,用户体验较差。
发明内容
有鉴于此,本申请提供了一种基于图像识别的业务处理方法及装置、存储介质、计算机设备,可以简化待验证单据的验证过程,能够大大提升验证以及存档的效率,有利于提高用户的体验感。
根据本申请的一个方面,提供了一种基于图像识别的业务处理方法,包括:
获取至少一个待验证图像,对所述至少一个待验证图像进行文字识别,得到每个所述待验证图像对应的文字信息,其中,每个所述待验证图像包括至少一个待验证单据;
从所述文字信息中确定与每个所述待验证单据对应的目标查询信息,并基于所述目标查询信息,确定所述待验证单据是否通过验证;
当任一所述待验证单据通过验证后,基于所述至少一个待验证图像,确定与所述任一所述待验证单据对应的目标存档图像,并基于所述目标存档图像,生成所述业务的存档信息。
根据本申请的另一方面,提供了一种基于图像识别的业务处理装置,包括:
文字识别模块,用于获取至少一个待验证图像,对所述至少一个待验证图像进行文字识别,得到每个所述待验证图像对应的文字信息,其中,每个所述待验证图像包括至少一个待验证单据;
验证模块,用于从所述文字信息中确定与每个所述待验证单据对应的目标查询信息,并基于所述目标查询信息,确定所述待验证单据是否通过验证;
存档模块,用于当任一所述待验证单据通过验证后,基于所述至少一个待验证图像,确定与所述任一所述待验证单据对应的目标存档图像,并基于所述目标存档图像,生成所述业务的存档信息。
依据本申请又一个方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述基于图像识别的业务处理方法。
依据本申请再一个方面,提供了一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述基于图像识别的业务处理方法。
借由上述技术方案,本申请提供的一种基于图像识别的业务处理方法及装置、存储介质、计算机设备,首先,可以获取一个或者多个待验证图像,每个待验证图像中可以包含一个或者多个待验证单据。获取到一个或者多个待验证图像之后,可以对每个待验证图像进行文字识别,进而可以得到每个待验证图像对应的文字信息。得到每个待验证图像对应的文字信息之后,当待验证图像中包含一个待验证单据时,可以直接从该待验证图像对应的文字信息中确定该待验证单据对应的目标查询信息;当待验证图像中包含多个待验证单据时,可以从待验证图像对应的文字信息中分别确定每个待验证单据对应的目标查询信息。确定目标查询信息之后,可以根据每个待验证单据对应的目标查询信息对该待验证单据进行验证,确定该待验证单据是否能够通过验证。如果存在通过验证的待验证单据,那么后续可以利用该通过验证的待验证单据进行相关业务的办理。在业务办理过程中,为了完善业务的相关信息,还可以将待验证单据进行存档处理。具体地,可以从获取的待验证图像中找到该通过验证的待验证单据对应的目标存档图像,之后,可以以该目标存档图像为基础,生成该业务的存档信息。本申请实施例可以简化待验证单据的验证过程,能够大大提升验证以及存档的效率,有利于提高用户的体验感。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了本申请实施例提供的一种基于图像识别的业务处理方法的流程示意图;
图2示出了本申请实施例提供的另一种基于图像识别的业务处理方法的流程示意图;
图3示出了本申请实施例提供的一种基于图像识别的业务处理装置的结构示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
在本实施例中提供了一种基于图像识别的业务处理方法,如图1所示,该方法包括:
步骤101,获取至少一个待验证图像,对所述至少一个待验证图像进行文字识别,得到每个所述待验证图像对应的文字信息,其中,每个所述待验证图像包括至少一个待验证单据。
本申请实施例提供的基于图像识别的业务处理方法,可以应用于发票融资业务场景中。首先,可以获取一个或者多个待验证图像,每个待验证图像中可以包含一个或者多个待验证单据。在这里,待验证单据可以是发票,待验证图像可以是一个发票组成的图片或者pdf,当多个发票被贴在一个pdf文件中,或者是多个发票在同一图片中时,待验证图像可以是多个发票组成的图片或者pdf。当待验证图像是图片时,待验证图像可以是通过相机拍摄纸质版发票得到的;当待验证图像是pdf时,待验证图像可以是通过扫描仪扫描得到的,也可以是直接从电子发票网站上下载得到的。获取到一个或者多个待验证图像之后,可以对每个待验证图像进行文字识别,进而可以得到每个待验证图像对应的文字信息。具体地,可以利用OCR技术加以实现。OCR技术是光学字符识别的缩写(Optical CharacterRecognition),是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。
步骤102,从所述文字信息中确定与每个所述待验证单据对应的目标查询信息,并基于所述目标查询信息,确定所述待验证单据是否通过验证。
在该实施例中,得到每个待验证图像对应的文字信息之后,当待验证图像中包含一个待验证单据时,可以直接从该待验证图像对应的文字信息中确定该待验证单据对应的目标查询信息;当待验证图像中包含多个待验证单据时,可以从待验证图像对应的文字信息中分别确定每个待验证单据对应的目标查询信息。确定目标查询信息之后,可以根据每个待验证单据对应的目标查询信息对该待验证单据进行验证,确定该待验证单据是否能够通过验证。在这里,当待验证单据为发票时,目标查询信息可以是发票名称、企业名称、贸易合同名称、发票号码、发票金额、发票日期、含税金额、不含税金额、专票、普票、销方名称、购方名称等,具体可以根据实际情况进行选择。当想要精确匹配时,可以将目标查询信息确定为上述中的多个。本申请可以直接根据获取的待验证图像得到每个待验证单据对应的目标查询信息,并将目标查询信息自动输入到单据验证系统中,无需用户线下登录单据验证系统,并多次手动输入目标查询信息进行验证,大大简化了验证过程。
步骤103,当任一所述待验证单据通过验证后,基于所述至少一个待验证图像,确定与所述任一所述待验证单据对应的目标存档图像,并基于所述目标存档图像,生成所述业务的存档信息。
在该实施例中,如果存在通过验证的待验证单据,那么后续可以利用该通过验证的待验证单据进行相关业务的办理。在业务办理过程中,为了完善业务的相关信息,还可以将待验证单据进行存档处理。具体地,可以从获取的待验证图像中找到该通过验证的待验证单据对应的目标存档图像,之后,可以以该目标存档图像为基础,生成该业务的存档信息。当待验证图像中包括多个待验证单据,且并非所有待验证单据全部通过验证,即并非所有待验证单据均可用于业务办理时,如果人工从多个待验证图像中找到通过验证的待验证单据,并将该通过验证的待验证单据从待验证图像中截取出来,再上传进行存档,需要花费大量的时间,效率较低,且用户体验较差,本申请实施例可以直接自动从多个待验证图像中确定用于业务办理的待验证单据,简单方便、效率高,有利于提升用户体验感。例如,在发票融资场景中,通常需要用户从众多待验证图像中找到通过验证的待验证单据(也即发票),之后手动上传,而本申请这一系列过程可以自动实现,大大提升了存档效率和准确性。
通过应用本实施例的技术方案,首先,可以获取一个或者多个待验证图像,每个待验证图像中可以包含一个或者多个待验证单据。获取到一个或者多个待验证图像之后,可以对每个待验证图像进行文字识别,进而可以得到每个待验证图像对应的文字信息。得到每个待验证图像对应的文字信息之后,当待验证图像中包含一个待验证单据时,可以直接从该待验证图像对应的文字信息中确定该待验证单据对应的目标查询信息;当待验证图像中包含多个待验证单据时,可以从待验证图像对应的文字信息中分别确定每个待验证单据对应的目标查询信息。确定目标查询信息之后,可以根据每个待验证单据对应的目标查询信息对该待验证单据进行验证,确定该待验证单据是否能够通过验证。如果存在通过验证的待验证单据,那么后续可以利用该通过验证的待验证单据进行相关业务的办理。在业务办理过程中,为了完善业务的相关信息,还可以将待验证单据进行存档处理。具体地,可以从获取的待验证图像中找到该通过验证的待验证单据对应的目标存档图像,之后,可以以该目标存档图像为基础,生成该业务的存档信息。本申请实施例可以简化待验证单据的验证过程,能够大大提升验证以及存档的效率,有利于提高用户的体验感。
进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例的具体实施过程,提供了另一种基于图像识别的业务处理方法,如图2所示,该方法包括:
步骤201,获取至少一个待验证图像,对所述至少一个待验证图像进行文字识别,得到每个所述待验证图像对应的文字信息,其中,每个所述待验证图像包括至少一个待验证单据。
在该实施例中,首先,可以获取一个或者多个待验证图像,每个待验证图像中可以包含一个或者多个待验证单据。在这里,待验证单据可以是发票,待验证图像可以是一个发票组成的图片或者pdf,当多个发票被贴在一个pdf文件中,或者是多个发票在同一图片中时,待验证图像可以是多个发票组成的图片或者pdf。当待验证图像是图片时,待验证图像可以是通过相机拍摄纸质版发票得到的;当待验证图像是pdf时,待验证图像可以是通过扫描仪扫描得到的,也可以是直接从电子发票网站上下载得到的。获取到一个或者多个待验证图像之后,可以对每个待验证图像进行文字识别,进而可以得到每个待验证图像对应的文字信息。
步骤202,基于所述文字信息,确定所述待验证图像中包含的待验证单据的个数。
在本申请实施例中,可选地,步骤202包括:从所述文字信息中识别出第一文字组合的出现次数,并将所述出现次数作为所述待验证图像中包含的待验证单据的个数,其中,所述第一文字组合为每个所述待验证单据中存在的,且仅出现一次的文字组合。
在该实施例中,得到每个待验证图像对应的文字信息后,如果待验证图像中包括多个待验证单据,那么文字信息中可以包括多个重复信息,具体地,如果某一待验证图像对应的文字信息中包含一个第一文字组合,那么可以确定该待验证图像中包含一个待验证单据;如果某一待验证图像对应的文字信息中包含多个第一文字组合,那么可以确定该待验证图像中包含第一文字组合出现次数个待验证单据。在这里,第一文字组合可以是每个待验证单据都出现的、且仅出现一次的文字组合,例如,当待验证单据是发票时,第一文字组合可以是“增值税专用发票”、“密码区”等文字组合。
步骤203,当包含一个所述待验证单据时,从所述文字信息中确定唯一标识,通过所述唯一标识标记所述待验证图像,并将标记后的待验证图像作为目标验证图像。
在该实施例中,如果待验证图像中仅包含一个待验证单据时,此时从该待验证图像对应的文字信息中找出待验证单据对应的唯一标识,之后,可以利用该唯一标识对待验证图像进行标记处理,并且可以将进行标记处理后的待验证图像作为目标验证图像。其中,唯一标识可以是与待验证单据一一对应的标识,当待验证单据是发票时,唯一标识可以是发票号码等。
步骤204,当包含多个所述待验证单据时,将所述待验证图像进行裁剪处理,得到与每个所述待验证单据对应的待验证子图像,从所述文字信息中分别确定与每个所述待验证子图像对应的唯一标识,通过所述唯一标识标记所述待验证子图像,并将每个标记后的待验证子图像作为所述目标验证图像。
在该实施例中,如果待验证图像中包含多个待验证单据,此时可以对待验证图像进行裁剪,得到多个待验证子图像,其中每个待验证子图像与一个待验证单据相对应。此外,还可以从待验证图像对应的文字信息中分别确定每个待验证子图像对应的唯一标识。之后,可以利用得到的唯一标识对对应的待验证子图像进行标记处理,并可以将标记之后的待验证子图像作为目标验证图像。
步骤205,从所述文字信息中确定与每个所述待验证单据对应的目标查询信息。
在本申请实施例中,可选地,当所述待验证图像中包含多个所述待验证单据时,步骤205包括:将所述文字信息分割为与每个所述目标验证图像对应的子文字信息,分别从每个子文字信息中提取出与所述待验证单据对应的目标查询信息。
在该实施例中,当待验证图像中仅包含一个待验证单据时,可以直接从该待验证图像对应的文字信息确定包含的待验证单据的目标查询信息。当待验证图像中包含多个待验证单据时,此时可以将文字信息分割成和每个目标验证图像对应的子文字信息,进一步从每个子文字信息中提取出待验证单据对应的目标查询信息。例如,待验证图像中包含4个待验证单据,那么可以将该待验证图像对应的文字信息分割成4个子文字信息,接着分别从每个子文字信息中提取出每个待验证单据对应的目标查询信息。
步骤206,调用预设单据验证接口,将所述目标查询信息输入至所述预设单据验证接口,并接收所述预设单据验证接口返回的单据状态信息,其中,所述单据状态信息包括已登记状态和未登记状态;当所述单据状态信息为已登记状态时,确定所述待验证单据未通过验证;当所述单据状态信息为未登记状态时,确定所述待验证单据通过验证。
在该实施例中,确定每个待验证单据对应的目标查询信息之后,进一步可以调用预设单据验证接口,通过调用该预设单据验证接口,可以对待验证单据进行验证。调用预设单据验证接口之后,可以将每个待验证单据对应的目标查询信息输入到预设单据验证接口中,还可以接收预设单据验证接口返回的单据状态信息。例如,当待验证单据为发票时,预设单据验证接口可以是中登查询系统调用接口。本申请将发票融资业务需要使用的中登查询系统直接通过第三方接口调用的方式进行调用,可以避免用户跨系统手动查询,查询后再将验证信息手动输入到融资系统办理融资业务,可以大大提升验证的效率。经过验证返回的单据状态信息中可以包括已登记状态以及未登记状态。如果单据状态信息是已登记状态,那么说明该待验证单据已经用于办理过该业务,不能再用于办理该业务,此时可以确定待验证单据未通过验证;如果单据状态信息是未登记状态,那么说明该待验证单据没有用于办理过该业务,可以用于办理该业务,此时可以确定待验证单据通过验证。例如,对于发票融资场景,此时待验证单据可以是发票,业务可以是融资业务,如果单据状态信息是已登记状态,那么说明该发票已经用于办理过融资业务,不能再次利用该发票进行融资,如果单据状态信息是未登记状态,那么说明该发票没有用于办理过融资业务,可以利用该发票进行融资。
步骤207,当任一所述待验证单据通过验证后,从所述至少一个待验证图像对应的所述目标验证图像中,基于所述唯一标识确定与所述任一所述待验证单据对应的目标验证图像,作为所述目标存档图像,并基于所述目标存档图像,生成所述业务的存档信息。
在该实施例中,如果存在待验证单据通过验证,那么可以利用该待验证单据进行业务的办理,在办理业务后还可以利用待验证单据对应的目标存档图像进行存档。在这里,目标存档图像即为需要存档的待验证单据对应的图像。具体地,由于每个目标验证图像被标记有唯一标识,因此可以从一个或者多个待验证图像对应的目标验证图像中,找到与通过验证的待验证单据的唯一标识对应的目标验证图像,并将该目标验证图像作为目标存档图像。接着,可以以目标存档图像为基础,生成本次业务办理对应的存档信息。在业务办理时,对待验证单据对应的图像进行存档是有必要的,例如对于发票融资的场景中,对发票对应的图像进行存档,可以使得业务办理资料更加完善,有利于应对外部金融监管机构不定期抽查。
在本申请实施例中,可选地,步骤204中所述“将所述待验证图像进行裁剪处理,得到与每个所述待验证单据对应的待验证子图像”,包括:从所述待验证图像中依次确定第二文字组合以及第三文字组合对应的位置,其中,所述第二文字组合为所述待验证单据的通用结束文字组合,所述第三文字组合为所述待验证单据的通用起始文字组合;基于每组所述第二文字组合对应的位置、所述第三文字组合对应的位置,以及预设分割比例,确定目标裁剪位置;基于所述目标裁剪位置对所述待验证图像进行裁剪处理,得到与每个所述待验证单据对应的待验证子图像。
在该实施例中,在对待验证图像进行裁剪时,可以按照第二文字组合-第三文字组合的顺序分别从待验证图像中确定第二文字组合所处的位置和第三文字组合所处的位置。在这里,第二文字组合可以是待验证单据的通用结束文字组合,例如当待验证单据是发票时,每个发票的通用结束文字组合可以是“收款人”、“复核”、“开票人”、“销售方”等,这些文字组合通常在发票的最后一行;第三文字组合可以是待验证单据的通用起始文字组合,例如当待验证单据是发票时,每个发票的通用起始文字组合可以是“发票代码”、“增值税专用发票”、“增值税普通发票”等,这些文字组合通常在发票的第一行。确定完第二文字组合对应的位置和第三文字组合对应的位置之后,可以利用第二文字组合对应的位置、第三文字组合对应的位置,以及预设分割比例,即可确定出两个待验证单据之间的目标裁剪位置。在这里,预设分割比例可以是预先经过计算得到的,例如第二文字组合位于待验证单据的最后一行,第三文字组合位于待验证单据的第一行,那么可以在两个待验证单据之间的距离不同时,分别计算出最佳分割比例,并根据多个最佳分割比例确定预设分割比例,保证按照该预设分割比例对两个连续的待验证单据进行分割时,可以使得两个待验证单据完整。确定目标裁剪位置之后,可以按照目标裁剪位置对待验证图像进行裁剪处理,进而可以得到与每个待验证单据对应的待验证子图像。本申请通过确定第二文字组合在待验证图像中所处的位置、第三文字组合在待验证图像中所处的位置,以及预设分割比例,进而对包含多个待验证单据的待验证图像进行裁剪,可以简单、方便地确定每个待验证单据对应的待验证子图像,方便后续准确地找到用于存档的图像。
如果待验证图像中包含两个待验证单据,那么只要在待验证图像中确定一组第二文字组合-第三文字组合分别所处的位置即可进行分割,如果待验证图像中包含三个待验证单据,那么只要在待验证图像中确定两组第二文字组合-第三文字组合分别所处的位置即可进行分割,以此类推。因此,确定每个待验证图像对应的待验证单据的个数后,可以根据此个数从待验证图像的文字信息中确定第二文字组合-第三文字组合分别所处的位置,当确定上述个数个第二文字组合-第三文字组合所处的位置后,即可不再进行第二文字组合-第三文字组合位置的确定。本申请实施例利用待验证单据的个数,当确定的第二文字组合-第三文字组合的位置的组数与待验证单据的个数相等时,即可停止,可以有效减少位置确定的时间,提升位置确定的效率。
在本申请实施例中,可选地,步骤201中所述“获取至少一个待验证图像”之前,所述方法还包括:获取单据号列表,其中,所述单据号列表中包括每个所述待验证单据对应的单据号;相应地,所述目标查询信息中包括目标单据号;步骤205之后,所述方法还包括:识别所述目标查询信息中的所述目标单据号,并将所述目标单据号从所述单据号列表中剔除,得到遗漏单据列表。
在该实施例中,在获取一个或者多个待验证图像之前,首先可以获取单据号列表。在这里,单据号列表中可以包括每个待验证单据对应的单据号,其中,单据号和待验证单据也是一一对应的。当待验证单据是发票时,单据号可以是发票号码。当目标查询信息中包括目标单据号时,如果已经从文字信息中确定了每个待验证单据对应的目标查询信息之后,可以从目标查询信息中确定目标单据号,并将目标单据号从单据号列表中剔除出去,使得单据号列表中不再包含该目标单据号,这样当每个待验证单据对应的目标查询信息中包含的目标单据号均从单据号列表中剔除之后,即可得到遗漏单据列表,遗漏单据列表中包含的单据号可以是那些文字信息识别失败的待验证单据对应的单据号。后续可以根据遗漏单据列表直接确定哪些待验证单据没有被识别,进而可以找出这些待验证单据重新进行识别,相比于人工从众多待验证单据中找出被遗漏的待验证单据,进而再对这些被遗漏的待验证单据重新进行识别,本申请可以大大减少人工工作量。本申请实施例在进行待验证图像文字识别之前,先获取包含所有待验证单据对应的单据号的单据号列表,之后将识别通过的待验证单据对应的单据号从单据号列表中剔除,最后单据号列表中剩余的单据号即为OCR过程中无法识别到或者识别不准的待验证单据对应的单据号,特别是在待验证单据的数据量特别大时,可以快速、准确地定位出哪些待验证单据被遗漏掉,提升遗漏的待验证单据的确定效率。
进一步的,作为图1方法的具体实现,本申请实施例提供了一种基于图像识别的业务处理装置,如图3所示,该装置包括:
文字识别模块,用于获取至少一个待验证图像,对所述至少一个待验证图像进行文字识别,得到每个所述待验证图像对应的文字信息,其中,每个所述待验证图像包括至少一个待验证单据;
验证模块,用于从所述文字信息中确定与每个所述待验证单据对应的目标查询信息,并基于所述目标查询信息,确定所述待验证单据是否通过验证;
存档模块,用于当任一所述待验证单据通过验证后,基于所述至少一个待验证图像,确定与所述任一所述待验证单据对应的目标存档图像,并基于所述目标存档图像,生成所述业务的存档信息。
可选地,所述装置还包括:
数量确定模块,用于所述得到每个所述待验证图像对应的文字信息之后,基于所述文字信息,确定所述待验证图像中包含的待验证单据的个数;
标记模块,用于当包含一个所述待验证单据时,从所述文字信息中确定唯一标识,通过所述唯一标识标记所述待验证图像,并将标记后的待验证图像作为目标验证图像;当包含多个所述待验证单据时,将所述待验证图像进行裁剪处理,得到与每个所述待验证单据对应的待验证子图像,从所述文字信息中分别确定与每个所述待验证子图像对应的唯一标识,通过所述唯一标识标记所述待验证子图像,并将每个标记后的待验证子图像作为所述目标验证图像;
相应地,所述存档模块,用于:从所述至少一个待验证图像对应的所述目标验证图像中,基于所述唯一标识确定与所述任一所述待验证单据对应的目标验证图像,作为所述目标存档图像。
可选地,所述数量确定模块,用于:从所述文字信息中识别出第一文字组合的出现次数,并将所述出现次数作为所述待验证图像中包含的待验证单据的个数,其中,所述第一文字组合为每个所述待验证单据中存在的,且仅出现一次的文字组合。
可选地,所述标记模块,包括:
第一位置确定单元,用于从所述待验证图像中依次确定第二文字组合以及第三文字组合对应的位置,其中,所述第二文字组合为所述待验证单据的通用结束文字组合,所述第三文字组合为所述待验证单据的通用起始文字组合;
第二位置确定单元,用于基于每组所述第二文字组合对应的位置、所述第三文字组合对应的位置,以及预设分割比例,确定目标裁剪位置;
裁剪单元,用于基于所述目标裁剪位置对所述待验证图像进行裁剪处理,得到与每个所述待验证单据对应的待验证子图像。
可选地,当所述待验证图像中包含多个所述待验证单据时,所述验证模块,用于:将所述文字信息分割为与每个所述目标验证图像对应的子文字信息,分别从每个子文字信息中提取出与所述待验证单据对应的目标查询信息。
可选地,所述验证模块,包括:
接口调用单元,用于调用预设单据验证接口,将所述目标查询信息输入至所述预设单据验证接口,并接收所述预设单据验证接口返回的单据状态信息,其中,所述单据状态信息包括已登记状态和未登记状态;
判断单元,用于当所述单据状态信息为已登记状态时,确定所述待验证单据未通过验证;当所述单据状态信息为未登记状态时,确定所述待验证单据通过验证。
可选地,所述装置还包括:
列表获取模块,用于所述获取至少一个待验证图像之前,获取单据号列表,其中,所述单据号列表中包括每个所述待验证单据对应的单据号;
相应地,所述目标查询信息中包括目标单据号;所述装置还包括:
剔除模块,用于所述从所述文字信息中确定与每个所述待验证单据对应的目标查询信息之后,识别所述目标查询信息中的所述目标单据号,并将所述目标单据号从所述单据号列表中剔除,得到遗漏单据列表。
需要说明的是,本申请实施例提供的一种基于图像识别的业务处理装置所涉及各功能单元的其他相应描述,可以参考图1至图2方法中的对应描述,在此不再赘述。
基于上述如图1至图2所示方法,相应的,本申请实施例还提供了一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述如图1至图2所示的基于图像识别的业务处理方法。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
基于上述如图1至图2所示的方法,以及图3所示的虚拟装置实施例,为了实现上述目的,本申请实施例还提供了一种计算机设备,具体可以为个人计算机、服务器、网络设备等,该计算机设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1至图2所示的基于图像识别的业务处理方法。
可选地,该计算机设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如蓝牙接口、WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的一种计算机设备结构并不构成对该计算机设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理和保存计算机设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与该实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。首先,可以获取一个或者多个待验证图像,每个待验证图像中可以包含一个或者多个待验证单据。获取到一个或者多个待验证图像之后,可以对每个待验证图像进行文字识别,进而可以得到每个待验证图像对应的文字信息。得到每个待验证图像对应的文字信息之后,当待验证图像中包含一个待验证单据时,可以直接从该待验证图像对应的文字信息中确定该待验证单据对应的目标查询信息;当待验证图像中包含多个待验证单据时,可以从待验证图像对应的文字信息中分别确定每个待验证单据对应的目标查询信息。确定目标查询信息之后,可以根据每个待验证单据对应的目标查询信息对该待验证单据进行验证,确定该待验证单据是否能够通过验证。如果存在通过验证的待验证单据,那么后续可以利用该通过验证的待验证单据进行相关业务的办理。在业务办理过程中,为了完善业务的相关信息,还可以将待验证单据进行存档处理。具体地,可以从获取的待验证图像中找到该通过验证的待验证单据对应的目标存档图像,之后,可以以该目标存档图像为基础,生成该业务的存档信息。本申请实施例可以简化待验证单据的验证过程,能够大大提升验证以及存档的效率,有利于提高用户的体验感。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims (10)

1.一种基于图像识别的业务处理方法,其特征在于,包括:
获取至少一个待验证图像,对所述至少一个待验证图像进行文字识别,得到每个所述待验证图像对应的文字信息,其中,每个所述待验证图像包括至少一个待验证单据;
从所述文字信息中确定与每个所述待验证单据对应的目标查询信息,并基于所述目标查询信息,确定所述待验证单据是否通过验证;
当任一所述待验证单据通过验证后,基于所述至少一个待验证图像,确定与所述任一所述待验证单据对应的目标存档图像,并基于所述目标存档图像,生成所述业务的存档信息。
2.根据权利要求1所述的方法,其特征在于,所述得到每个所述待验证图像对应的文字信息之后,所述方法还包括:
基于所述文字信息,确定所述待验证图像中包含的待验证单据的个数;
当包含一个所述待验证单据时,从所述文字信息中确定唯一标识,通过所述唯一标识标记所述待验证图像,并将标记后的待验证图像作为目标验证图像;
当包含多个所述待验证单据时,将所述待验证图像进行裁剪处理,得到与每个所述待验证单据对应的待验证子图像,从所述文字信息中分别确定与每个所述待验证子图像对应的唯一标识,通过所述唯一标识标记所述待验证子图像,并将每个标记后的待验证子图像作为所述目标验证图像;
相应地,所述基于所述至少一个待验证图像,确定与所述任一所述待验证单据对应的目标存档图像,包括:
从所述至少一个待验证图像对应的所述目标验证图像中,基于所述唯一标识确定与所述任一所述待验证单据对应的目标验证图像,作为所述目标存档图像。
3.根据权利要求2所述的方法,其特征在于,所述基于所述文字信息,确定所述待验证图像中包含的待验证单据的个数,包括:
从所述文字信息中识别出第一文字组合的出现次数,并将所述出现次数作为所述待验证图像中包含的待验证单据的个数,其中,所述第一文字组合为每个所述待验证单据中存在的,且仅出现一次的文字组合。
4.根据权利要求2所述的方法,其特征在于,所述将所述待验证图像进行裁剪处理,得到与每个所述待验证单据对应的待验证子图像,包括:
从所述待验证图像中依次确定第二文字组合以及第三文字组合对应的位置,其中,所述第二文字组合为所述待验证单据的通用结束文字组合,所述第三文字组合为所述待验证单据的通用起始文字组合;
基于每组所述第二文字组合对应的位置、所述第三文字组合对应的位置,以及预设分割比例,确定目标裁剪位置;
基于所述目标裁剪位置对所述待验证图像进行裁剪处理,得到与每个所述待验证单据对应的待验证子图像。
5.根据权利要求2所述的方法,其特征在于,当所述待验证图像中包含多个所述待验证单据时,所述从所述文字信息中确定与每个所述待验证单据对应的目标查询信息,包括:
将所述文字信息分割为与每个所述目标验证图像对应的子文字信息,分别从每个子文字信息中提取出与所述待验证单据对应的目标查询信息。
6.根据权利要求1所述的方法,其特征在于,所述基于所述目标查询信息,确定所述待验证单据是否通过验证,包括:
调用预设单据验证接口,将所述目标查询信息输入至所述预设单据验证接口,并接收所述预设单据验证接口返回的单据状态信息,其中,所述单据状态信息包括已登记状态和未登记状态;
当所述单据状态信息为已登记状态时,确定所述待验证单据未通过验证;
当所述单据状态信息为未登记状态时,确定所述待验证单据通过验证。
7.根据权利要求1所述的方法,其特征在于,所述获取至少一个待验证图像之前,所述方法还包括:
获取单据号列表,其中,所述单据号列表中包括每个所述待验证单据对应的单据号;
相应地,所述目标查询信息中包括目标单据号;所述从所述文字信息中确定与每个所述待验证单据对应的目标查询信息之后,所述方法还包括:
识别所述目标查询信息中的所述目标单据号,并将所述目标单据号从所述单据号列表中剔除,得到遗漏单据列表。
8.一种基于图像识别的业务处理装置,其特征在于,包括:
文字识别模块,用于获取至少一个待验证图像,对所述至少一个待验证图像进行文字识别,得到每个所述待验证图像对应的文字信息,其中,每个所述待验证图像包括至少一个待验证单据;
验证模块,用于从所述文字信息中确定与每个所述待验证单据对应的目标查询信息,并基于所述目标查询信息,确定所述待验证单据是否通过验证;
存档模块,用于当任一所述待验证单据通过验证后,基于所述至少一个待验证图像,确定与所述任一所述待验证单据对应的目标存档图像,并基于所述目标存档图像,生成所述业务的存档信息。
9.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法。
10.一种计算机设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法。
CN202210821064.2A 2022-07-13 2022-07-13 一种基于图像识别的业务处理方法及装置、存储介质 Pending CN115019325A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202210821064.2A CN115019325A (zh) 2022-07-13 2022-07-13 一种基于图像识别的业务处理方法及装置、存储介质
PCT/CN2023/103596 WO2024012209A1 (zh) 2022-07-13 2023-06-29 一种基于图像识别的业务处理方法及装置、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210821064.2A CN115019325A (zh) 2022-07-13 2022-07-13 一种基于图像识别的业务处理方法及装置、存储介质

Publications (1)

Publication Number Publication Date
CN115019325A true CN115019325A (zh) 2022-09-06

Family

ID=83082657

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210821064.2A Pending CN115019325A (zh) 2022-07-13 2022-07-13 一种基于图像识别的业务处理方法及装置、存储介质

Country Status (2)

Country Link
CN (1) CN115019325A (zh)
WO (1) WO2024012209A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024012209A1 (zh) * 2022-07-13 2024-01-18 深圳前海环融联易信息科技服务有限公司 一种基于图像识别的业务处理方法及装置、存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8799158B2 (en) * 2007-02-23 2014-08-05 Kyocera Corporation Automated bill validation for electronic and telephonic transactions
CN109472918A (zh) * 2018-10-12 2019-03-15 深圳壹账通智能科技有限公司 发票验证方法、融资审核方法、装置、设备及介质
CN109461247A (zh) * 2018-10-29 2019-03-12 北京慧流科技有限公司 票据验证方法及装置、电子设备及存储介质
CN113191448A (zh) * 2021-05-17 2021-07-30 广东电网有限责任公司 基于图片识别的审计方法、装置、设备及存储介质
CN115019325A (zh) * 2022-07-13 2022-09-06 深圳前海环融联易信息科技服务有限公司 一种基于图像识别的业务处理方法及装置、存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024012209A1 (zh) * 2022-07-13 2024-01-18 深圳前海环融联易信息科技服务有限公司 一种基于图像识别的业务处理方法及装置、存储介质

Also Published As

Publication number Publication date
WO2024012209A1 (zh) 2024-01-18

Similar Documents

Publication Publication Date Title
CN110490721B (zh) 财务凭证生成方法及相关产品
CN108256591B (zh) 用于输出信息的方法和装置
US8838657B1 (en) Document fingerprints using block encoding of text
CN112052749A (zh) 档案的归档方法、装置、电子设备及计算机可读存储介质
US10339373B1 (en) Optical character recognition utilizing hashed templates
CN107728892B (zh) 图片展示方法、装置、终端和存储介质
US11501344B2 (en) Partial perceptual image hashing for invoice deconstruction
CN108304815B (zh) 一种数据获取方法、装置、服务器及存储介质
CN111178836A (zh) 电子单据的批量归档方法、装置、设备及存储介质
US20150063653A1 (en) Method and system for providing efficient feedback regarding captured optical image quality
CN105094975A (zh) 一种调用应用程序的方法及装置
WO2024012209A1 (zh) 一种基于图像识别的业务处理方法及装置、存储介质
CN111145143B (zh) 问题图像确定方法及装置、电子设备和存储介质
CN111259882B (zh) 票据识别的方法、装置及计算机设备
CN110059184B (zh) 一种作业错题收集分析方法及系统
CN111047657A (zh) 图片压缩方法、装置、介质及电子设备
CN111178365A (zh) 图片文字的识别方法、装置、电子设备及存储介质
CN109672710B (zh) 文件上传方法、系统及设备
CN114626341A (zh) 文档转换方法、装置及存储介质
CN111046864A (zh) 一种合同扫描件五要素自动提取方法及系统
CN111767818A (zh) 一种业务智能受理的方法和装置
WO2015012820A1 (en) Method and system for data identification and extraction using pictorial representations in a source document
CN118051896B (zh) 合同签章智能管理方法、装置、设备及介质
CN110991270B (zh) 文本识别的方法、装置、电子设备和存储介质
CN115034877A (zh) 贷款抵押信息处理方法、装置及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination