CN111814799B - 结合rpa和ai的影像归位方法及装置、计算设备、存储介质 - Google Patents

结合rpa和ai的影像归位方法及装置、计算设备、存储介质 Download PDF

Info

Publication number
CN111814799B
CN111814799B CN202010707998.4A CN202010707998A CN111814799B CN 111814799 B CN111814799 B CN 111814799B CN 202010707998 A CN202010707998 A CN 202010707998A CN 111814799 B CN111814799 B CN 111814799B
Authority
CN
China
Prior art keywords
scanner
bill
image
document
receipt
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010707998.4A
Other languages
English (en)
Other versions
CN111814799A (zh
Inventor
汪冠春
胡一川
潘庚生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Laiye Network Technology Co Ltd
Laiye Technology Beijing Co Ltd
Original Assignee
Beijing Laiye Network Technology Co Ltd
Laiye Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Laiye Network Technology Co Ltd, Laiye Technology Beijing Co Ltd filed Critical Beijing Laiye Network Technology Co Ltd
Priority to CN202010707998.4A priority Critical patent/CN111814799B/zh
Publication of CN111814799A publication Critical patent/CN111814799A/zh
Application granted granted Critical
Publication of CN111814799B publication Critical patent/CN111814799B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/107Computer-aided management of electronic mailing [e-mailing]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00071Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for characterised by the action taken
    • H04N1/00082Adjusting or controlling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00071Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for characterised by the action taken
    • H04N1/0009Storage
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00567Handling of original or reproduction media, e.g. cutting, separating, stacking
    • H04N1/00649Control or synchronising different handling operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00912Arrangements for controlling a still picture apparatus or components thereof not otherwise provided for
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/04Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Marketing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Economics (AREA)
  • Computer Hardware Design (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Image Input (AREA)

Abstract

本说明书实施例公开一种结合RPA和AI的影像归位方法及装置、计算设备、存储介质。该方法包括:S1:获取扫描仪扫描到的单据影像,并将所述单据影像存储至影像库;S2:当扫描仪卡纸时,通过控制所述扫描仪的进出装置将卡纸单据退档并加载下一张单据,使得所述扫描仪继续扫描剩下的单据;S3:在所有单据都完成扫描后,获取所述卡纸单据的页码,并将所述卡纸单据的页码发送给扫描员;S4:获取重新放入所述扫描仪的所述卡纸单据的单据影像,并将所述卡纸单据的单据影像存储至所述影像库中对应的存储位置。

Description

结合RPA和AI的影像归位方法及装置、计算设备、存储介质
技术领域
本说明书涉及RPA领域,具体而言,涉及一种结合RPA和AI的影像归位方法及装置、计算设备、存储介质。
背景技术
机器人流程自动化(Robotic Process Automation)简称RPA,是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
AI(Artificial Intelligence)是人工智能的英文缩写,它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
RPA的具有独特的优势:低代码、非侵入。低代码是说,RPA不需要很高的IT水平就能操作,不懂编程的业务人员也能开发流程;非侵入是说,RPA可以模拟人的操作,不用软件系统开放接口。但是传统的RPA具有一定的局限性:只能基于固定的规则,并且应用场景受限。随着AI(Artificial Intelligence)技术的不断发展,RPA与AI深度融合克服了传统RPA的局限,RPA+AI=Hand work+Head work,正在极大的改变劳动力的价值。
目前市面上很多的高速扫描仪,作业在国内的财务共享中心,财务共享中心进行面临大批量的财务单据需要扫描到影像系统中。扫描过程中,由于单据问题,经常出现卡纸情况,每次卡纸后,机器自动停止。扫描仪停止后,财务人员无法定位到纸张和影像序号。财务人员需要重新查找对应单据号对应到影像中,非常的不便利。
因此,为避免在自动高速扫描仪卡纸后,财务人员多次查找混乱的单据,浪费时间精力,将RPA引入单据扫描系统,开发一种可以避免单据混乱的方法。
发明内容
本说明书实施例提供一种结合RPA和AI的影像归位方法及装置、计算设备、存储介质,用以克服现有技术中存在的至少一个技术问题。
根据本说明书实施例的第一方面,提供一种结合RPA和AI的影像归位方法,包括:
S1:获取扫描仪扫描到的单据影像,并将所述单据影像存储至影像库;
S2:当扫描仪卡纸时,通过控制所述扫描仪的进出装置将卡纸单据退档并加载下一张单据,使得所述扫描仪继续扫描剩下的单据;
S3:在所有单据都完成扫描后,获取所述卡纸单据的页码,并将所述卡纸单据的页码发送给扫描员
S4:获取重新放入所述扫描仪的所述卡纸单据的单据影像,并将所述卡纸单据的单据影像存储至所述影像库中对应的存储位置。
可选地,所述S1的具体步骤为:
S11:通过RPA机器人连接所述扫描仪的驱动,从而控制所述扫描仪的进出装置;
S12:启动所述扫描仪,通过RPA机器人控制所述扫描仪的进出装置,使得待扫描单据进入所述扫描仪的扫描区域,并记录进入扫描仪的单据的页码;
S13:获取所述扫描仪扫描到的单据影像,并将所述单据影像存储至影像库,记录存储至所述影像库的单据影像的页码。
可选地,所述S3的具体步骤为:
S31:在所有单据都完成扫描后,获取进入扫描仪的单据的页码以及存储至所述影像库的单据影像的页码,将两者进行比较,得到所述卡纸单据的页码;
S32:根据所述卡纸单据的页码生成补扫信息,并通过邮件将所述补扫信息下发给扫描员。
可选地,在所述S3之后还包括:
S5:通过OCR识别技术,获取所述影像库中所有单据影像的单据内容,并通过NLP解析所述单据内容,根据NLP解析后的单据内容,将所述影像库中所有单据影像进行归类,形成归类目录。
可选地,所述S4的具体步骤为:
S41:获取重新放入所述扫描仪的所述卡纸单据的单据影像;
S42:通过所述OCR识别技术,获取所述卡纸单据的单据内容,并通过所述NLP解析所述卡纸单据的单据内容;
S43:将NLP解析后的卡纸单据的单据内容与NLP解析后的所述影像库中所有单据影像的单据内容进行比较,从而确认所述卡纸单据在所有单据中的具体位置,并将所述卡纸单据的单据影像存储至所述影像库中对应的存储位置。
根据本说明书实施例的第二方面,提供一种结合RPA和AI的影像归位装置,包括:获取模块,被配置为获取扫描仪扫描到的单据影像,并将所述单据影像存储至影像库;
卡纸模块,被配置为当扫描仪卡纸时,通过控制所述扫描仪的进出装置将卡纸单据退档并加载下一张单据,使得所述扫描仪继续扫描剩下的单据;
发送模块,被配置为在所有单据都完成扫描后,获取所述卡纸单据的页码,并将所述卡纸单据的页码发送给扫描员;
归位模块,被配置为获取重新放入所述扫描仪的所述卡纸单据的单据影像,并将所述卡纸单据的单据影像存储至所述影像库中对应的存储位置。
可选地,所述获取装置包括:
连接单元,被配置为通过RPA机器人连接所述扫描仪的驱动,从而控制所述扫描仪的进出装置;
启动单元,被配置为启动所述扫描仪,通过RPA机器人控制所述扫描仪的进出装置,使得待扫描单据进入所述扫描仪的扫描区域,并记录进入扫描仪的单据的页码;
获取单元,被配置为获取所述扫描仪扫描到的单据影像,并将所述单据影像存储至影像库,记录存储至所述影像库的单据影像的页码。
可选地,所述发送装置包括:
页码获取单元,被配置为在所有单据都完成扫描后,获取进入扫描仪的单据的页码以及存储至所述影像库的单据影像的页码,将两者进行比较,得到所述卡纸单据的页码;
发送单元,被配置为根据所述卡纸单据的页码生成补扫信息,并通过邮件将所述补扫信息下发给扫描员。
可选地,所述装置还包括分类模块,所述分类模块被配置为通过OCR识别技术,获取所述影像库中所有单据影像的单据内容,并通过NLP解析所述单据内容,根据NLP解析后的单据内容,将所述影像库中所有单据影像进行归类,形成归类目录。
可选地,所述归位模块包括:
卡纸单据获取单元,被配置为获取重新放入所述扫描仪的所述卡纸单据的单据影像;
识别单元,被配置为通过所述OCR识别技术,获取所述卡纸单据的单据内容,并通过所述NLP解析所述卡纸单据的单据内容;
归位单元,被配置为将NLP解析后的卡纸单据的单据内容与NLP解析后的所述影像库中所有单据影像的单据内容进行比较,从而确认所述卡纸单据在所有单据中的具体位置,并将所述卡纸单据的单据影像存储至所述影像库中对应的存储位置。
根据本说明书实施例的第三方面,提供一种计算设备,包括存储设备以及处理器,所述存储设备用于存储计算机程序,所述处理器运行所述计算机程序以使所述计算设备执行时实现所述影像归位方法的步骤。
根据本说明书实施例的第四方面,提供一种存储介质,其存储有上述计算设备中所使用的计算机程序,该计算机程序被处理器执行时实现所述影像归位方法的步骤。
本说明书实施例的有益效果如下:
在获取到单据影像后,将单据影像存储至影像库。若出现扫描仪卡纸现象,则控制扫描仪的进出装置将卡纸单据退档并加载下一张单据。在所有单据都完成扫描后,获取卡纸单据的页码,并将卡纸单据的页码发送给扫描员,使得扫描员将对应的卡纸单据重新放入扫描仪进行扫描。在获取到卡纸单据的单据影像后,并将卡纸单据的单据影像存储至影像库中对应的存储位置。本方法通过RPA机器人连接扫描仪的驱动,在扫描仪出现卡纸现象时,通过RPA机器人控制扫描仪的驱动,从而控制扫描仪的进出装置将卡纸单据并加载下一张单据,避免卡纸导致扫描仪工作停止的问题。在单据进入扫描仪后,记录该单据的页码,在将该单据的单据影像存入影像库后,记录该单据影像的页码。当出现卡纸现象时,会记录卡纸单据的页码,但由于该卡纸单据的单据影像无法获取也无法存入影像库,因此单据影像的页码会缺少。将所有的单据页码和所有的单据影像页码进行比较,即可推断出卡纸单据的页码。扫描员可根据卡纸单据的页码在单据中查找对应的卡纸单据,操作简单,方便快捷,解决了现有技术中扫描员无法定位到卡纸单据,需从大量的单据中一一查询的问题,降低了扫描员的操作难度,提高了扫描员的工作效率。在获取到卡纸单据的单据影像后,通过OCR识别技术获取卡纸单据的单据内容,并通过NLP解析该单据内容,将NLP解析后的卡纸单据的单据内容与NLP解析后的所述影像库中所有单据影像的单据内容进行比较,从而可以确认所述卡纸单据在所有单据中的具体位置,并将所述卡纸单据的单据影像存储至所述影像库中对应的存储位置。解决了现有技术中扫描员需将卡纸单据的一一与所有单据进比对,才能对应到影像库中的具体位置的问题,大大降低了扫描员的工作量,提高了扫描员的工作效率。本方法引入RPA机器人、OCR识别技术以及NLP技术,除需要扫描员查找卡纸单据以及将卡纸单据放入扫描仪的工作环节以外,剩下的需要工作人员进行操作的环节全部由RPA机器人代替,实现单据扫描过程的高度自自动化,使用便利,且工作效率高。
本说明书实施例的创新点包括:
1、本方法通过RPA机器人连接扫描仪的驱动,在扫描仪出现卡纸现象时,通过RPA机器人控制扫描仪的驱动,从而控制扫描仪的进出装置将卡纸单据并加载下一张单据,避免卡纸导致扫描仪工作停止的问题。在单据进入扫描仪后,记录该单据的页码,在将该单据的单据影像存入影像库后,记录该单据影像的页码。当出现卡纸现象时,会记录卡纸单据的页码,但由于该卡纸单据的单据影像无法获取也无法存入影像库,因此单据影像的页码会缺少。将所有的单据页码和所有的单据影像页码进行比较,即可推断出卡纸单据的页码。扫描员可根据卡纸单据的页码在单据中查找对应的卡纸单据,操作简单,方便快捷,解决了现有技术中扫描员无法定位到卡纸单据,需从大量的单据中一一查询的问题,降低了扫描员的操作难度,提高了扫描员的工作效率。在获取到卡纸单据的单据影像后,通过OCR识别技术获取卡纸单据的单据内容,并通过NLP解析该单据内容,将NLP解析后的卡纸单据的单据内容与NLP解析后的所述影像库中所有单据影像的单据内容进行比较,从而可以确认所述卡纸单据在所有单据中的具体位置,并将所述卡纸单据的单据影像存储至所述影像库中对应的存储位置。解决了现有技术中扫描员需将卡纸单据的一一与所有单据进比对,才能对应到影像库中的具体位置的问题,大大降低了扫描员的工作量,提高了扫描员的工作效率。本方法引入RPA机器人、OCR识别技术以及NLP技术,除需要扫描员查找卡纸单据以及将卡纸单据放入扫描仪的工作环节以外,剩下的需要工作人员进行操作的环节全部由RPA机器人代替,实现单据扫描过程的高度自自动化,使用便利,且工作效率高,是本说明书实施例的创新点之一。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是示出了根据本说明书实施例提供的一种结合RPA和AI的影像归位方法的应用场景图;
图2是示出了根据本说明书实施例提供的一种结合RPA和AI的影像归位方法的流程示意图;
图3是示出了根据本说明书实施例提供的一种结合RPA和AI的影像归位装置的模块示意图;
图4是示出了根据本说明书实施例提供的一种计算设备的结构示意图。
具体实施方式
下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
需要说明的是,本说明书实施例及附图中的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
本说明书实施例公开了一种结合RPA和AI的影像归位方法及装置、计算设备、存储介质。以下分别进行详细说明。
机器人流程自动化(Robotic Process Automation)简称RPA,是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
AI(Artificial Intelligence)是人工智能的英文缩写,它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
自然语言处理(Natural Language Processing,NLP),是计算机科学领域以及人工智能领域的一个重要的研究方向,它研究用计算机来处理、理解以及运用人类语言(如中文、英文等),达到人与计算机之间进行有效通讯。
图1是示出了根据本说明书实施例提供的一种结合RPA和AI的影像归位方法的应用场景图。其中,影像归位是指在出现单据卡纸现象时,根据卡纸单据所在单据文件中的位置,将卡纸单据的单据影像存储在对应的所有单据影像中的位置,即单据影像的存储顺序与实际的单据文件顺序相同。如图1所示,先用RPA机器人自动单击扫描仪,控制扫描仪的进出装置;RPA机器人自动将当前的卡纸单据退档,退档后继续执行扫描单据的操作;其中,卡纸单据退档是指通过控制扫描仪的进出装置,将卡在扫描仪里的单据退出扫描仪;每张单据在扫描后生成的单据影像都存入影像库中;通过存入影像库的单据影像的页码与扫描的单据的页码进行对比,判断卡纸单据的页码;通过邮件将卡纸单据的页码发送给扫描员,通知扫描员补扫该卡纸单据;在扫描员重新将该卡纸单据放入扫描仪后,获取卡纸单据的单据影像,并将卡纸单据的单据影像存入影像库中;影像入库后,OCR识别单据影像,NLP自动理解其内容,根据其理解的内容,确认卡纸单据在影像库中具体的存储位置;完成入库操作,通知用户。本实施例引入RPA机器人、OCR识别技术以及NLP技术,除需要扫描员查找卡纸单据以及将卡纸单据放入扫描仪的工作环节以外,剩下的需要工作人员进行操作的环节全部由RPA机器人代替,实现单据扫描过程的高度自自动化,使用便利,且工作效率高。
图2是示出了根据本说明书实施例提供的一种结合RPA和AI的影像归位方法的流程示意图。如图2所示,该方法具体包括以下步骤:
S210:获取扫描仪扫描到的单据影像,并将所述单据影像存储至影像库;
在一个具体实施例中,通过RPA机器人连接所述扫描仪的驱动,从而控制所述扫描仪的进出装置;启动所述扫描仪,通过RPA机器人控制所述扫描仪的进出装置,使得待扫描单据进入所述扫描仪的扫描区域,并记录进入扫描仪的单据的页码;获取所述扫描仪扫描到的单据影像,并将所述单据影像存储至影像库,记录存储至所述影像库的单据影像的页码。本实施例在单据进入扫描仪后,记录该单据的页码,在将该单据的单据影像存入影像库后,记录该单据影像的页码。当出现卡纸现象时,会记录卡纸单据的页码,但由于该卡纸单据的单据影像无法获取也无法存入影像库,因此单据影像的页码会缺少。将所有的单据页码和所有的单据影像页码进行比较,即可推断出卡纸单据的页码。
S220:当扫描仪卡纸时,通过控制所述扫描仪的进出装置将卡纸单据退档并加载下一张单据,使得所述扫描仪继续扫描剩下的单据;
在一个具体实施例中,通过RPA机器人连接扫描仪的驱动,在扫描仪出现卡纸现象时,通过RPA机器人控制扫描仪的驱动,从而控制扫描仪的进出装置将卡纸单据并加载下一张单据,避免卡纸导致扫描仪工作停止的问题。
S230:在所有单据都完成扫描后,获取所述卡纸单据的页码,并将所述卡纸单据的页码发送给扫描员;
在一个具体实施例中,在所有单据都完成扫描后,获取进入扫描仪的单据的页码以及存储至所述影像库的单据影像的页码,将两者进行比较,得到所述卡纸单据的页码;根据所述卡纸单据的页码生成补扫信息,并通过邮件将所述补扫信息下发给扫描员。在单据进入扫描仪后,记录该单据的页码,在将该单据的单据影像存入影像库后,记录该单据影像的页码。当出现卡纸现象时,会记录卡纸单据的页码,但由于该卡纸单据的单据影像无法获取也无法存入影像库,因此单据影像的页码会缺少。本实施例通过将所有的单据页码和所有的单据影像页码进行比较,即可推断出卡纸单据的页码。扫描员可根据卡纸单据的页码在单据中查找对应的卡纸单据,操作简单,方便快捷,解决了现有技术中扫描员无法定位到卡纸单据,需从大量的单据中一一查询的问题,降低了扫描员的操作难度,提高了扫描员的工作效率。
S240:获取重新放入所述扫描仪的所述卡纸单据的单据影像,并将所述卡纸单据的单据影像存储至所述影像库中对应的存储位置。
在一个具体实施例中,通过OCR识别技术,获取所述影像库中所有单据影像的单据内容,并通过NLP解析所述单据内容,根据NLP解析后的单据内容,将所述影像库中所有单据影像进行归类,形成归类目录。本实施例通过将单据影像进行分类,更便于后续工作人员查找相关的单据影像。
在一个具体实施例中,在扫描员将所述卡纸单据放入所述扫描仪后,获取重新放入所述扫描仪的所述卡纸单据的单据影像;通过所述OCR识别技术,获取所述卡纸单据的单据内容,并通过所述NLP解析所述卡纸单据的单据内容;将NLP解析后的卡纸单据的单据内容与NLP解析后的所述影像库中所有单据影像的单据内容进行比较,从而确认所述卡纸单据在所有单据中的具体位置,并将所述卡纸单据的单据影像存储至所述影像库中对应的存储位置。本实施例在获取到卡纸单据的单据影像后,通过OCR识别技术获取卡纸单据的单据内容,并通过NLP解析该单据内容,将NLP解析后的卡纸单据的单据内容与NLP解析后的所述影像库中所有单据影像的单据内容进行比较,从而可以确认所述卡纸单据在所有单据中的具体位置,并将所述卡纸单据的单据影像存储至所述影像库中对应的存储位置。解决了现有技术中扫描员需将卡纸单据的一一与所有单据进比对,才能对应到影像库中的具体位置的问题,大大降低了扫描员的工作量,提高了扫描员的工作效率。
在总的实施例中,在获取到单据影像后,将单据影像存储至影像库。若出现扫描仪卡纸现象,则控制扫描仪的进出装置将卡纸单据退档并加载下一张单据。在所有单据都完成扫描后,获取卡纸单据的页码,并将卡纸单据的页码发送给扫描员,使得扫描员将对应的卡纸单据重新放入扫描仪进行扫描。在获取到卡纸单据的单据影像后,并将卡纸单据的单据影像存储至影像库中对应的存储位置。该方法通过RPA机器人连接扫描仪的驱动,在扫描仪出现卡纸现象时,通过RPA机器人控制扫描仪的驱动,从而控制扫描仪的进出装置将卡纸单据并加载下一张单据,避免卡纸导致扫描仪工作停止的问题。在单据进入扫描仪后,记录该单据的页码,在将该单据的单据影像存入影像库后,记录该单据影像的页码。当出现卡纸现象时,会记录卡纸单据的页码,但由于该卡纸单据的单据影像无法获取也无法存入影像库,因此单据影像的页码会缺少。将所有的单据页码和所有的单据影像页码进行比较,即可推断出卡纸单据的页码。扫描员可根据卡纸单据的页码在单据中查找对应的卡纸单据,操作简单,方便快捷,解决了现有技术中扫描员无法定位到卡纸单据,需从大量的单据中一一查询的问题,降低了扫描员的操作难度,提高了扫描员的工作效率。在获取到卡纸单据的单据影像后,通过OCR识别技术获取卡纸单据的单据内容,并通过NLP解析该单据内容,将NLP解析后的卡纸单据的单据内容与NLP解析后的所述影像库中所有单据影像的单据内容进行比较,从而可以确认所述卡纸单据在所有单据中的具体位置,并将所述卡纸单据的单据影像存储至所述影像库中对应的存储位置。解决了现有技术中扫描员需将卡纸单据的一一与所有单据进比对,才能对应到影像库中的具体位置的问题,大大降低了扫描员的工作量,提高了扫描员的工作效率。该方法引入RPA机器人、OCR识别技术以及NLP技术,除需要扫描员查找卡纸单据以及将卡纸单据放入扫描仪的工作环节以外,剩下的需要工作人员进行操作的环节全部由RPA机器人代替,实现单据扫描过程的高度自自动化,使用便利,且工作效率高。除此之外,本方法根据NLP解析后的所述影像库中所有单据影像的单据内容,将所述影像库中所有单据影像进行归类,形成归类目录。通过将单据影像进行分类,更便于后续工作人员查找相关的单据影像。
图3是示出了根据本说明书实施例提供的一种结合RPA和AI的影像归位装置的模块示意图。如图3所示,本说明书实施例提供的一种结合RPA和AI的影像归位装置,可以包括:
获取模块310,被配置为获取扫描仪扫描到的单据影像,并将所述单据影像存储至影像库;
在一个具体实施例中,所述获取装置包括:连接单元,被配置为通过RPA机器人连接所述扫描仪的驱动,从而控制所述扫描仪的进出装置;启动单元,被配置为启动所述扫描仪,通过RPA机器人控制所述扫描仪的进出装置,使得待扫描单据进入所述扫描仪的扫描区域,并记录进入扫描仪的单据的页码;获取单元,被配置为获取所述扫描仪扫描到的单据影像,并将所述单据影像存储至影像库,记录存储至所述影像库的单据影像的页码。
卡纸模块320,被配置为当扫描仪卡纸时,通过控制所述扫描仪的进出装置将卡纸单据退档并加载下一张单据,使得所述扫描仪继续扫描剩下的单据;
发送模块330,被配置为在所有单据都完成扫描后,获取所述卡纸单据的页码,并将所述卡纸单据的页码发送给扫描员;
在一个具体实施例中,所述发送装置包括:页码获取单元,被配置为在所有单据都完成扫描后,获取进入扫描仪的单据的页码以及存储至所述影像库的单据影像的页码,将两者进行比较,得到所述卡纸单据的页码;发送单元,被配置为根据所述卡纸单据的页码生成补扫信息,并通过邮件将所述补扫信息下发给扫描员。
归位模块340,被配置为获取重新放入所述扫描仪的所述卡纸单据的单据影像,并将所述卡纸单据的单据影像存储至所述影像库中对应的存储位置。
在一个具体实施例中,所述装置还包括分类模块,所述分类模块被配置为通过OCR识别技术,获取所述影像库中所有单据影像的单据内容,并通过NLP解析所述单据内容,根据NLP解析后的单据内容,将所述影像库中所有单据影像进行归类,形成归类目录。
在一个具体实施例中,所述归位模块包括:卡纸单据获取单元,被配置为在扫描员将所述卡纸单据放入所述扫描仪后,获取所述卡纸单据的单据影像;识别单元,被配置为通过所述OCR识别技术,获取所述卡纸单据的单据内容,并通过所述NLP解析所述卡纸单据的单据内容;归位单元,被配置为将NLP解析后的卡纸单据的单据内容与NLP解析后的所述影像库中所有单据影像的单据内容进行比较,从而确认所述卡纸单据在所有单据中的具体位置,并将所述卡纸单据的单据影像存储至所述影像库中对应的存储位置。
由上述内容可知,在获取到单据影像后,将单据影像存储至影像库。若出现扫描仪卡纸现象,则控制扫描仪的进出装置将卡纸单据退档并加载下一张单据。在所有单据都完成扫描后,获取卡纸单据的页码,并将卡纸单据的页码发送给扫描员,使得扫描员将对应的卡纸单据重新放入扫描仪进行扫描。在获取到卡纸单据的单据影像后,并将卡纸单据的单据影像存储至影像库中对应的存储位置。例如,当卡纸单据的单据内容为签约合同,NLP解析出影像库中单据影像的单据内容为该签约合同的下文,则确定该卡纸单据的单据影像应存储至对应的单据影像的上一存储空间。该装置通过RPA机器人连接扫描仪的驱动,在扫描仪出现卡纸现象时,通过RPA机器人控制扫描仪的驱动,从而控制扫描仪的进出装置将卡纸单据并加载下一张单据,避免卡纸导致扫描仪工作停止的问题。在单据进入扫描仪后,记录该单据的页码,在将该单据的单据影像存入影像库后,记录该单据影像的页码。当出现卡纸现象时,会记录卡纸单据的页码,但由于该卡纸单据的单据影像无法获取也无法存入影像库,因此单据影像的页码会缺少。将所有的单据页码和所有的单据影像页码进行比较,即可推断出卡纸单据的页码。扫描员可根据卡纸单据的页码在单据中查找对应的卡纸单据,操作简单,方便快捷,解决了现有技术中扫描员无法定位到卡纸单据,需从大量的单据中一一查询的问题,降低了扫描员的操作难度,提高了扫描员的工作效率。在获取到卡纸单据的单据影像后,通过OCR识别技术获取卡纸单据的单据内容,并通过NLP解析该单据内容,将NLP解析后的卡纸单据的单据内容与NLP解析后的所述影像库中所有单据影像的单据内容进行比较,从而可以确认所述卡纸单据在所有单据中的具体位置,并将所述卡纸单据的单据影像存储至所述影像库中对应的存储位置。解决了现有技术中扫描员需将卡纸单据的一一与所有单据进比对,才能对应到影像库中的具体位置的问题,大大降低了扫描员的工作量,提高了扫描员的工作效率。该装置引入RPA机器人、OCR识别技术以及NLP技术,除需要扫描员查找卡纸单据以及将卡纸单据放入扫描仪的工作环节以外,剩下的需要工作人员进行操作的环节全部由RPA机器人代替,实现单据扫描过程的高度自自动化,使用便利,且工作效率高。除此之外,该装置根据NLP解析后的所述影像库中所有单据影像的单据内容,将所述影像库中所有单据影像进行归类,形成归类目录。通过将单据影像进行分类,更便于后续工作人员查找相关的单据影像。
图4是示出了根据本说明书实施例提供的一种计算设备的结构示意图。
如图4所示,提供计算设备400,包括存储设备410以及处理器420,所述存储设备410用于存储计算机程序,所述处理器420运行所述计算机程序以使所述计算设备400执行所述影像归位方法的步骤。
本说明书实施例,提供一种存储介质,其存储有上述计算设备400中所使用的计算机程序,该计算机程序被处理器执行时实现所述影像归位方法的步骤。
综上所述,本说明书实施例提供一种结合RPA和AI的影像归位方法及装置、计算设备、存储介质,引入RPA机器人、OCR识别技术以及NLP技术,除需要扫描员查找卡纸单据以及将卡纸单据放入扫描仪的工作环节以外,剩下的需要工作人员进行操作的环节全部由RPA机器人代替,实现单据扫描过程的高度自自动化,使用便利,且工作效率高。
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本说明书所必须的。
本领域普通技术人员可以理解:实施例中的装置中的模块可以按照实施例描述分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
最后应说明的是:以上实施例仅用以说明本说明书的技术方案,而非对其限制;尽管参照前述实施例对本说明书进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本说明书实施例技术方案的精神和范围。

Claims (6)

1.一种结合RPA和AI的影像归位方法,其特征在于,包括:
S1:通过RPA机器人连接扫描仪的驱动,从而控制所述扫描仪的进出装置;启动所述扫描仪,通过RPA机器人控制所述扫描仪的进出装置,使得待扫描单据进入所述扫描仪的扫描区域,并记录进入扫描仪的单据的页码;获取所述扫描仪扫描到的单据影像,并将所述单据影像存储至影像库,记录存储至所述影像库的单据影像的页码;
S2:当扫描仪卡纸时,通过控制所述扫描仪的进出装置将卡纸单据退档并加载下一张单据,使得所述扫描仪继续扫描剩下的单据;
S3:在所有单据都完成扫描后,获取所述卡纸单据的页码,并将所述卡纸单据的页码发送给扫描员;
S4:获取重新放入所述扫描仪的所述卡纸单据的单据影像;通过OCR识别技术,获取所述卡纸单据的单据内容,并通过NLP解析所述卡纸单据的单据内容;将NLP解析后的卡纸单据的单据内容与NLP解析后的所述影像库中所有单据影像的单据内容进行比较,从而确认所述卡纸单据在所有单据中的具体位置,并将所述卡纸单据的单据影像存储至所述影像库中对应的存储位置;
S5:通过OCR识别技术,获取所述影像库中所有单据影像的单据内容,并通过NLP解析所述单据内容,根据NLP解析后的单据内容,将所述影像库中所有单据影像进行归类,形成归类目录。
2.根据权利要求1所述的方法,其特征在于,所述S3的具体步骤为:
S31:在所有单据都完成扫描后,获取进入扫描仪的单据的页码以及存储至所述影像库的单据影像的页码,将两者进行比较,得到所述卡纸单据的页码;
S32:根据所述卡纸单据的页码生成补扫信息,并通过邮件将所述补扫信息下发给扫描员。
3.一种结合RPA和AI的影像归位装置,其特征在于,所述装置包括:
获取模块,被配置为通过RPA机器人连接扫描仪的驱动,从而控制所述扫描仪的进出装置;启动所述扫描仪,通过RPA机器人控制所述扫描仪的进出装置,使得待扫描单据进入所述扫描仪的扫描区域,并记录进入扫描仪的单据的页码;获取所述扫描仪扫描到的单据影像,并将所述单据影像存储至影像库,记录存储至所述影像库的单据影像的页码;
卡纸模块,被配置为当扫描仪卡纸时,通过控制所述扫描仪的进出装置将卡纸单据退档并加载下一张单据,使得所述扫描仪继续扫描剩下的单据;
发送模块,被配置为在所有单据都完成扫描后,获取所述卡纸单据的页码,并将所述卡纸单据的页码发送给扫描员;
归位模块,被配置为获取重新放入所述扫描仪的所述卡纸单据的单据影像;通过OCR识别技术,获取所述卡纸单据的单据内容,并通过NLP解析所述卡纸单据的单据内容;将NLP解析后的卡纸单据的单据内容与NLP解析后的所述影像库中所有单据影像的单据内容进行比较,从而确认所述卡纸单据在所有单据中的具体位置,并将所述卡纸单据的单据影像存储至所述影像库中对应的存储位置;
分类模块,被配置为通过OCR识别技术,获取所述影像库中所有单据影像的单据内容,并通过NLP解析所述单据内容,根据NLP解析后的单据内容,将所述影像库中所有单据影像进行归类,形成归类目录。
4.根据权利要求3所述的装置,其特征在于,所述发送模块包括:
页码获取单元,被配置为在所有单据都完成扫描后,获取进入扫描仪的单据的页码以及存储至所述影像库的单据影像的页码,将两者进行比较,得到所述卡纸单据的页码;
发送单元,被配置为根据所述卡纸单据的页码生成补扫信息,并通过邮件将所述补扫信息下发给扫描员。
5.一种计算设备,其特征在于,包括存储设备以及处理器,所述存储设备用于存储计算机程序,所述处理器运行所述计算机程序以使所述计算设备执行根据权利要求1-2中任一项所述的方法的步骤。
6.一种存储介质,其特征在于,其存储有权利要求5所述的计算设备中所使用的计算机程序,该计算机程序被处理器执行时实现权利要求1-2中任一项所述的方法的步骤。
CN202010707998.4A 2020-07-21 2020-07-21 结合rpa和ai的影像归位方法及装置、计算设备、存储介质 Active CN111814799B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010707998.4A CN111814799B (zh) 2020-07-21 2020-07-21 结合rpa和ai的影像归位方法及装置、计算设备、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010707998.4A CN111814799B (zh) 2020-07-21 2020-07-21 结合rpa和ai的影像归位方法及装置、计算设备、存储介质

Publications (2)

Publication Number Publication Date
CN111814799A CN111814799A (zh) 2020-10-23
CN111814799B true CN111814799B (zh) 2024-05-14

Family

ID=72861602

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010707998.4A Active CN111814799B (zh) 2020-07-21 2020-07-21 结合rpa和ai的影像归位方法及装置、计算设备、存储介质

Country Status (1)

Country Link
CN (1) CN111814799B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140092673A (ko) * 2013-01-16 2014-07-24 엘지전자 주식회사 문서 출력 장치 및 문서 출력 방법
CN104639791A (zh) * 2013-11-12 2015-05-20 国家电网公司 一种可识别页码的扫描仪及其使用方法
JP2018006929A (ja) * 2016-06-29 2018-01-11 京セラドキュメントソリューションズ株式会社 画像読取装置及び画像形成装置
CN107908745A (zh) * 2017-11-16 2018-04-13 理光图像技术(上海)有限公司 批量文档扫描整理装置、方法、介质及设备
CN207645482U (zh) * 2017-11-14 2018-07-24 深圳市泓毅天承科技有限公司 一种便于处理卡纸的打印机
CN110428233A (zh) * 2019-08-08 2019-11-08 中国工商银行股份有限公司 基于rpa机器人技术的退税方法及系统
CN110648054A (zh) * 2019-09-04 2020-01-03 中国建设银行股份有限公司 机器人流程自动化的任务并行处理方法及装置
US10654166B1 (en) * 2020-02-18 2020-05-19 UiPath, Inc. Automation windows for robotic process automation

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140092673A (ko) * 2013-01-16 2014-07-24 엘지전자 주식회사 문서 출력 장치 및 문서 출력 방법
CN104639791A (zh) * 2013-11-12 2015-05-20 国家电网公司 一种可识别页码的扫描仪及其使用方法
JP2018006929A (ja) * 2016-06-29 2018-01-11 京セラドキュメントソリューションズ株式会社 画像読取装置及び画像形成装置
CN207645482U (zh) * 2017-11-14 2018-07-24 深圳市泓毅天承科技有限公司 一种便于处理卡纸的打印机
CN107908745A (zh) * 2017-11-16 2018-04-13 理光图像技术(上海)有限公司 批量文档扫描整理装置、方法、介质及设备
CN110428233A (zh) * 2019-08-08 2019-11-08 中国工商银行股份有限公司 基于rpa机器人技术的退税方法及系统
CN110648054A (zh) * 2019-09-04 2020-01-03 中国建设银行股份有限公司 机器人流程自动化的任务并行处理方法及装置
US10654166B1 (en) * 2020-02-18 2020-05-19 UiPath, Inc. Automation windows for robotic process automation

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
人工智能对会计行业的影响探析;孙智利;黄孝章;;北京印刷学院学报(第09期);全文 *
用机器人流程自动化和人工智能驱动服务型经济;机器人产业;20180125(第1期);正文第55-56页 *

Also Published As

Publication number Publication date
CN111814799A (zh) 2020-10-23

Similar Documents

Publication Publication Date Title
US11373423B2 (en) Automated classification and interpretation of life science documents
US10225521B2 (en) System and method for receipt acquisition
US10970534B2 (en) Document processing system capture flow compiler
William et al. Evolutionary Survey on Robotic Process Automation and Artificial Intelligence: Industry 4.0
US20230177267A1 (en) Automated classification and interpretation of life science documents
Dieu et al. Parsing digitized Vietnamese paper documents
CN111814799B (zh) 结合rpa和ai的影像归位方法及装置、计算设备、存储介质
US20100329545A1 (en) Method and system for training classification and extraction engine in an imaging solution
Dzhusupova et al. Pattern recognition method for detecting engineering errors on technical drawings
Klein et al. smartFIX: An adaptive system for document analysis and understanding
US20230072084A1 (en) User action generated process discovery
Khramov Robotic and machine learning: how to help support to process customer tickets more effectively
KR20210004505A (ko) 경영 표준 규격 자동 매핑 시스템
US11714813B2 (en) System and method for proposing annotations
JPH06231139A (ja) 文書変換システムおよび方法
CN113424245B (zh) 生产系统中的实况自适应训练
Klein et al. Problem-adaptable document analysis and understanding for high-volume applications
van der Aa et al. 10 Supporting RPA through natural language processing
CN112597275A (zh) 内容搜索方法及装置
Visalli et al. Building a Platform for Intelligent Document Processing: Opportunities and Challenges.
KR102555809B1 (ko) 문서 양식을 웹폼으로 변환하는 방법 및 시스템
KR101624781B1 (ko) 원전 운전성 개선을 위한 협업지원 시스템 및 그 방법
US20220277242A1 (en) Method and system for using robotic process automation to provide real-time case assistance to client support professionals
Kovalova Deep Learning-based Table Detection in Documents
Bangdiwala et al. Automated Library Management System using Face Recognition and OCR

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Country or region after: China

Address after: 1902, 19 / F, China Electronics Building, 3 Danling Road, Haidian District, Beijing 100080

Applicant after: BEIJING LAIYE NETWORK TECHNOLOGY Co.,Ltd.

Applicant after: Laiye Technology (Beijing) Co.,Ltd.

Address before: 1902, 19 / F, China Electronics Building, 3 Danling Road, Haidian District, Beijing 100080

Applicant before: BEIJING LAIYE NETWORK TECHNOLOGY Co.,Ltd.

Country or region before: China

Applicant before: BEIJING BENYING NETWORK TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant