CN113836091A

CN113836091A - 结合rpa和ai的数据识别方法、装置、电子设备和存储介质

Info

Publication number: CN113836091A
Application number: CN202111022436.7A
Authority: CN
Inventors: 陈愫恺; 汪冠春; 胡一川; 褚瑞; 李玮
Original assignee: Beijing Laiye Network Technology Co Ltd; Laiye Technology Beijing Co Ltd
Current assignee: Beijing Laiye Network Technology Co Ltd; Laiye Technology Beijing Co Ltd
Priority date: 2021-09-01
Filing date: 2021-09-01
Publication date: 2021-12-24

Abstract

本申请提出了一种结合RPA和AI的数据识别方法、装置、电子设备和存储介质，其中，该数据识别方法包括：控制RPA机器人从目标文件夹下获取待识别文件；控制RPA机器人调用文件识别平台对待识别文件进行识别，以生成识别结果；控制RPA机器人将识别结果写入目标文件；控制RPA机器人将目标文件提供给用户。由此，能够实现待识别文件的自动化识别，从而节省了人力成本，同时提高了数据识别的准确率和效率。

Description

结合RPA和AI的数据识别方法、装置、电子设备和存储介质

技术领域

本申请涉及RPA、AI技术领域，涉及一种结合RPA和AI的数据识别方法、装置、电子设备和存储介质。

背景技术

机器人流程自动化(Robotic Process Automation，RPA)是通过特定的“机器人软件”，模拟人在计算机上的操作，按规则自动执行流程任务。

人工智能(Artificial Intelligence，AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。

目前，在一些企业中每月月初，相关的业务人员需要整理营运信息数据，其中，营运信息数据可全部来自于PDF(Portable Document Format，便携式文件格式)和图片。

相关技术中，对于营运信息数据的整理(处理)可为，人工将营运信息数据通过肉眼识别后一个一个抄写到Excel中。为了加快抄写速度，业务人员可上网找免费的OCR(Optical Character Recognition，光学字符识别)，通过文字识别对营运信息数据进行识别。但是该识别需要业务人员手工截取PDF中的每一页图片，分别识别出每张图片的文字。文字识别后，再拷贝到本地Excel文件中，再人工复核识别结果，对于识别错误的，进行人工更正。

发明内容

本申请旨在至少在一定程度上解决上述技术中的技术问题之一。

为此，本申请的第一个目的在于提出一种结合RPA和AI的数据识别方法，能够实现待识别文件的自动化识别，从而节省了人力成本，同时提高了数据识别的准确率和效率。

本申请的第二个目的在于提出一种结合RPA和AI的数据识别装置。

本申请的第三个目的在于提出一种电子设备。

本申请的第四个目的在于提出一种计算机可读存储介质。

本申请的第五个目的在于提出一种计算机程序产品。

为达到上述目的，本申请第一方面实施例提出了一种结合RPA和AI的数据识别方法，包括：控制RPA机器人从目标文件夹下获取待识别文件；控制所述RPA机器人调用文件识别平台对所述待识别文件进行识别，以生成识别结果；控制所述RPA机器人将所述识别结果写入目标文件；控制所述RPA机器人将所述目标文件提供给用户。

根据本申请实施例的结合RPA和AI的数据识别方法，首先控制RPA机器人从目标文件夹下获取待识别文件，并控制RPA机器人调用文件识别平台对待识别文件进行识别，以生成识别结果，而后控制RPA机器人将识别结果写入目标文件，并控制RPA机器人将目标文件提供给用户。由此，能够实现待识别文件的自动化识别，从而节省了人力成本，同时提高了数据识别的准确率和效率。

另外，根据本申请上述实施例提出的结合RPA和AI的数据识别方法还可以具有如下附加的技术特征：

在本申请的一个实施例中，所述控制RPA机器人从目标文件夹下获取待识别文件之前，包括：控制所述RPA机器人通过OA邮件平台获取未读邮件的邮件标题；若所述邮件标题满足识别条件，则控制所述RPA机器人获取所述未读邮件中的附件；控制所述RPA机器人将所述附件作为所述待识别文件，并将所述待识别文件放入所述目标文件夹下。

在本申请的一个实施例中，所述文件识别平台通过以下步骤对所述待识别文件进行识别，以生成所述识别结果：若所述待识别文件的文件类型不为目标类型，则对所述待识别文件进行文件类型转换，以生成所述目标类型的目标待识别文件，其中，所述目标类型为图片类型；对所述目标待识别文件进行识别，以获取所述目标待识别文件中的文字信息和/或结构信息；根据所述文字信息和/或所述结构信息生成所述识别结果。

在本申请的一个实施例中，所述控制所述RPA机器人将所述识别结果写入目标文件，包括：控制所述RPA机器人获取所述待识别文件的文件名称；控制所述RPA机器人将所述文件名称作为所述目标文件的文件名称；控制所述RPA机器人将所述文字信息和/或所述结构信息写入所述目标文件。

在本申请的一个实施例中，所述控制所述RPA机器人将所述目标文件提供给用户，包括：控制所述RPA机器人通过所述OA邮件平台将所述目标文件发送给所述用户，或者将所述目标文件发送至所述用户的通讯客户端。

在本申请的一个实施例中，所述文件识别平台为Mage平台，所述Mage平台包括光学字符识别OCR，所述目标文件包括Excel文件、Word文件和TXT文件中的一种。

为达到上述目的，本申请第二方面实施例提出了一种结合RPA和AI的数据识别装置，包括：第一获取模块，用于控制RPA机器人从目标文件夹下获取待识别文件；识别模块，用于控制所述RPA机器人调用文件识别平台对所述待识别文件进行识别，以生成识别结果；写入模块，用于控制所述RPA机器人将所述识别结果写入目标文件；提供模块，用于控制所述RPA机器人将所述目标文件提供给用户。

本申请实施例的结合RPA和AI的数据识别装置，首先通过第一获取模块控制RPA机器人从目标文件夹下获取待识别文件，然后通过识别模块控制RPA机器人调用文件识别平台对待识别文件进行识别，以生成识别结果，并通过写入模块控制RPA机器人将识别结果写入目标文件，最后通过提供模块控制RPA机器人将目标文件提供给用户。由此，能够实现待识别文件的自动化识别，从而节省了人力成本，同时提高了数据识别的准确率和效率。

另外，根据本申请上述实施例提出的结合RPA和AI的数据识别装置还可以具有如下附加的技术特征：

在本申请的一个实施例中，所述结合RPA和AI的数据识别装置，还包括：第二获取模块，用于控制所述RPA机器人通过OA邮件平台获取未读邮件的邮件标题；第三获取模块，用于若所述邮件标题满足识别条件，则控制所述RPA机器人获取所述未读邮件中的附件；放入模块，用于控制所述RPA机器人将所述附件作为所述待识别文件，并将所述待识别文件放入所述目标文件夹下。

在本申请的一个实施例中，所述识别模块，具体用于：若所述待识别文件的文件类型不为目标类型，则对所述待识别文件进行文件类型转换，以生成所述目标类型的目标待识别文件，其中，所述目标类型为图片类型；对所述目标待识别文件进行识别，以获取所述目标待识别文件中的文字信息和/或结构信息；根据所述文字信息和/或所述结构信息生成所述识别结果。

在本申请的一个实施例中，所述写入模块，具体用于：控制所述RPA机器人获取所述待识别文件的文件名称；控制所述RPA机器人将所述文件名称作为所述目标文件的文件名称；控制所述RPA机器人将所述文字信息和/或所述结构信息写入所述目标文件。

在本申请的一个实施例中，所述提供模块，具体用于：控制所述RPA机器人通过所述OA邮件平台将所述目标文件发送给所述用户，或者将所述目标文件发送至所述用户的通讯客户端。

为达到上述目的，本申请第三方面实施例提出了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如本申请第一方面实施例所述的结合RPA和AI的数据识别方法。

本申请实施例的电子设备，通过处理器执行存储在存储器上的指令，控制RPA机器人从目标文件夹下获取待识别文件；控制RPA机器人调用文件识别平台对待识别文件进行识别，以生成识别结果；控制RPA机器人将识别结果写入目标文件；控制RPA机器人将目标文件提供给用户。由此，能够实现待识别文件的自动化识别，从而节省了人力成本，同时提高了数据识别的准确率和效率。

为达到上述目的，本申请第四方面实施例提出了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本申请第一方面实施例所述的结合RPA和AI的数据识别方法。

本申请实施例的计算机可读存储介质，通过存储计算机程序并被处理器执行，控制RPA机器人从目标文件夹下获取待识别文件，并控制RPA机器人调用文件识别平台对待识别文件进行识别，以生成识别结果，以及控制RPA机器人将识别结果写入目标文件，而后控制RPA机器人将目标文件提供给用户。由此，能够实现待识别文件的自动化识别，从而节省了人力成本，同时提高了数据识别的准确率和效率。

为达到上述目的，本申请第五方面实施例提出了一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如本申请第一方面实施例所述的结合RPA和AI的数据识别方法。

本申请附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为根据本申请一个实施例的结合RPA和AI的数据识别方法的流程示意图；

图2为根据本申请一个实施例的结合RPA和AI的数据识别方法的流程示意图；

图3为根据本申请一个实施例的结合RPA和AI的数据识别方法的流程示意图；

图4为根据本申请一个实施例的结合RPA和AI的数据识别方法的流程示意图；

图5为根据本申请一个实施例的控制RPA机器人进行数据识别的具体示例流程图；

图6为根据本申请一个实施例的具体示例流程图；

图7为根据本申请一个实施例的结合RPA和AI的数据识别装置的框图。

具体实施方式

下面详细描述本申请的实施例，实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本申请，而不能理解为对本申请的限制。

下面结合附图来描述本申请实施例的结合RPA和AI的数据识别方法、装置、电子设备和存储介质。

本申请实施例提供的结合RPA和AI的数据识别方法，可以由电子设备来执行，该电子设备可为PC(Personal Computer，个人计算机)电脑、平板电脑、掌上电脑或手机等，此处不做任何限定。

在本申请实施例中，电子设备中可以设置有处理组件、存储组件和驱动组件。可选的，该驱动组件和处理组件可以集成设置，该存储组件可以存储操作系统、应用程序或其他程序模块，该处理组件通过执行存储组件中存储的应用程序来实现本申请实施例提供的结合RPA和AI的数据识别方法。

图1为根据本申请一个实施例的结合RPA和AI的数据识别方法的流程示意图。

本申请实施例的结合RPA和AI的数据识别方法，还可由本申请实施例提供的结合RPA和AI的数据识别装置执行，该装置可配置于电子设备中，以实现控制RPA机器人从目标文件夹下获取待识别文件，并控制RPA机器人调用文件识别平台对待识别文件进行识别，以生成识别结果，以及控制RPA机器人将识别结果写入目标文件，而后控制RPA机器人将目标文件提供给用户，从而能够实现待识别文件的自动化识别，进而节省了人力成本，同时提高了数据识别的准确率和效率。

作为一种可能的情况，本申请实施例的结合RPA和AI的数据识别方法还可以在服务器端执行，服务器可以为云服务器，可以在云端执行该结合RPA和AI的数据识别方法。

如图1所示，该结合RPA和AI的数据识别方法，可包括：

S101，控制RPA机器人从目标文件夹下获取待识别文件。

需要说明的是，该实施例中所描述的待识别文件可为营运信息数据文件，且该营运信息数据文件的类型可包括PDF文件类型和图片文件类型。

在本申请实施例中，在电子设备控制RPA机器进行数据识别之前，相关工作人员(业务人员)可先根据相关需求在电子设备的存储空间中预先建立上述目标文件夹。其中，该目标文件夹下可预先放入待识别文件(例如，营运信息数据文件)，例如，由相关工作人员放入，或者由RPA机器人放入，此处不做任何限定。应说明的是，该实施例中所描述的目标文件夹可为上述的RPA机器人知晓的文件夹。

具体地，电子设备在启动RPA机器人之后，可控制该RPA机器人从上述的目标文件夹下获取待识别文件。

S102，控制RPA机器人调用文件识别平台对待识别文件进行识别，以生成识别结果。其中，文件识别平台可为Mage平台，Mage平台可包光学字符识别OCR(OpticalCharacter Recognition，光学字符识别)。应说明的是，该实施例中所描述的光学字符识别OCR可支持通用表格的识别。

具体地，电子设备在获取到上述待识别文件后，可控制RPA机器人调用Mage平台通过通用该Mage平台中的光学字符识别OCR对该待识别文件进行识别，并生成相应的识别结果。

需要说明的是，该实施例中所描述的Mage平台可安装在电子设备中，也可安装在可与该电子设备进行通信的服务器上，且该服务器可为云服务器。其中，RPA机器人可通过相关的API(Application Programming Interface，应用程序接口)调用该Mage平台，以使用该Mage平台中的光学字符识别OCR对该待识别文件进行识别，并生成相应的识别结果。

另外，该实施例中所描述的识别结果可为JSON(JavaScript Object Notation,JS对象简谱)格式的数据。

S103，控制RPA机器人将识别结果写入目标文件。

其中，目标文件可包括Excel文件、Word文件和TXT文件中的一种。

在本申请实施例中，相关人员可根据实际需求建立文件格式为Excel文件、Word文件或TXT文件的目标文件，并可将该目标文件放入指定文件夹(例如，结果文件夹)中。应说明的是，该实施例中所描述的指定文件夹可为上述RPA机器人知晓的文件夹。

作为一种可能的情况，电子设备可在控制RPA机器人生成上述识别结果之后，控制RPA机器人根据预设的文件生成算法生成上述的目标文件。其中，预设的文件生成算法可根据实际情况进行标定。

在本申请实施例中，可控制RPA机器人根据预设的写入策略将识别结果写入目标文件，其中，预设的写入策略可根据实际情况进行标定。

具体地，电子设备可在控制RPA机器人生成上述识别结果之后，可先根据预设的文件生成算法生成上述的目标文件，然后根据预设的写入策略将识别结果写入目标文件。

S104，控制RPA机器人将目标文件提供给用户。

具体地，在将识别结果写入上述目标文件后，电子设备可控制RPA机器人将该目标文件以设定方式发送给用户。例如，可通过邮件的方式将该目标文件发送给用户，或者直接将该目标文件发送到用户的通讯客户端。

在本申请实施例中，首先控制RPA机器人从目标文件夹下获取待识别文件，并控制RPA机器人调用文件识别平台对待识别文件进行识别，以生成识别结果，然后控制RPA机器人将识别结果写入目标文件，最后控制RPA机器人将目标文件提供给用户。由此，能够实现待识别文件的自动化识别，从而节省了人力成本，同时提高了数据识别的准确率和效率。

为了清楚上述上一实施例，在本申请的一个实施例中，如图2所示，控制RPA机器人从目标文件夹下获取待识别文件之前，可包括：

S201，控制RPA机器人通过OA邮件平台获取未读邮件的邮件标题。

在本申请实施例中，可设定RPA机器人定时(例如，每天上午8点)启动，在启动后，电子设备可控制RPA机器人按照预设的时间间隔(例如，一小时)通过OA(OfficeAutomation，办公自动化)邮件平台获取未读邮件的邮件标题。

具体地，RPA机器人启动后，电子设备可控制RPA机器人启动(调用)OA邮件平台，并输入账号和密码登录该OA邮件平台，然后在该OA邮件平台获取未读邮件的邮件标题。

需要说明的是，该实施例中所描述的账号和密码可以是相关人员预先存储在RPA机器人中的，以便于需要时调取使用。

S202，若邮件标题满足识别条件，则控制RPA机器人获取未读邮件中的附件。

在本申请实施例中，在控制RPA机器人获取到上述的邮件标题后，可通过判断该邮件标题中是否包含关键词(例如，OCR识别文件、待识别文件、请进行文件识别或RPA_运营数据等)以判断该邮件标题对应的邮件是否为光学字符识别OCR识别请求的邮件，若是，则该邮件标题满足识别条件，电子设备可控制RPA机器人下载该邮件标题对应的邮件(即，上述的未读邮件)中的附件。应说明的是，该实施例中的所描述关键词可为上述RPA机器人知晓的关键词，并可根据实际情况和需求进行标定，此处不做任何限定。

S203，控制RPA机器人将附件作为待识别文件，并将待识别文件放入目标文件夹下。

具体地，电子设备在控制RPA机器人获取到上述的邮件标题后，可通过上述实施例中的判断方式判断该邮件标题是否满足识别条件，若是，则可控制RPA机器人下载上述未读邮件中的附件，并可控制RPA机器人将该附件作为待识别文件，并将该待识别文件放入目标文件夹下。

作为一种可能的情况，上述的附件可为压缩文件(例如，压缩包)，电子设备在控制RPA机器人下载到该附件之后，可调用相关的解压工具对该附件进行解压，并将解压后的文件作为待识别文件，以及将该待识别文件放入目标文件夹下。

需要说明的是，该实施例中所描述的解压工具可以相关工作人员预先安装在电子设备中的，以便于需要时调取使用。

由此，能够实现自动化获取待识别文件，提高获取待识别文件的效率，并能够将待识别文件存储在本地无需上传网络，从而保障数据安全。

在本申请的一个实施例中，如图3所示，文件识别平台可通过以下步骤对待识别文件进行识别，以生成识别结果：

S301，若待识别文件的文件类型不为目标类型，则对待识别文件进行文件类型转换，以生成目标类型的目标待识别文件，其中，目标类型为图片类型。

在本申请实施例中，电子设备在控制RPA机器人调用文件识别平台之后，该文件识别平台可先判断该待识别文件的文件类型是否为图片类型，若否，则可通过文件格式转换工具将该待识别文件的文件类型转换成图片类型，以生成目标待识别文件，用于后续识别。

需要说明的是，该实施例中所描述的文件格式转换工具可以是相关人员预先安装在上述文件识别平台中的插件，以便于需要时调取使用，其中，该文件格式转换工具可为一种截图工具。

具体地，当判断待识别文件的文件类型为非图片类型时，文件识别平台可调用文件格式转换工具将该待识别文件的文件类型转换图片类型，以生成目标待识别文件。

举例而言，假设待识别文件的文件类型为PDF文件类型，则文件识别平台调用文件格式转换工具将该PDF文件按照页数进行内容截图，以生成对应PDF文件页数的多张图片，即生成目标待识别文件。

S302，对目标待识别文件进行识别，以获取目标待识别文件中的文字信息和/或结构信息。

需要说明的是，该实施例中所描述的结构信息可为表格结构信息，其中，该表格结构信息包括行和列。

S303，根据文字信息和/或结构信息生成识别结果。

具体地，文件识别平台在生成上述目标待识别文件后，可调用自身的光学字符识别OCR识别该目标待识别文件，并获取该目标识别文件中的文字信息，然后根据该文字信息生成相应的识别结果。

作为一种可能的情况，文件识别平台调用自身的光学字符识别OCR识别该目标待识别文件，并获取该目标识别文件中的结构信息，然后根据该结构信息生成相应的识别结果。

作为另一种可能的情况，文件识别平台可调用自身的光学字符识别OCR识别该目标待识别文件，并获取该目标识别文件中的文字信息和结构信息，然后根据该文字信息和结构信息生成相应的识别结果。

需要说明的是，当上述的目标待识别文件中仅包含文字信息时，则识别结果中仅包含文字信息；当上述的目标待识别文件中仅包含结构信息时，则识别结果中仅包含结构信息；当上述的目标待识别文件中包含文字信息和结构信息时，则识别结果中包含文字信息和结构信息。

由此，能够实现将非目标类型的待识别文件转换为图片后进行识别，从而规范数据识别流程，提高数据识别效率。

在本申请的一个实施例中，如图4所示，控制RPA机器人将识别结果写入目标文件，可包括：

S401，控制RPA机器人获取待识别文件的文件名称。

S402，控制RPA机器人将文件名称作为目标文件的文件名称。

S403，控制RPA机器人将文字信息和/或结构信息写入目标文件。

具体地，电子设备在控制RPA机器人调用文件识别平台得到上述的识别结果之后，可先控制RPA机器人获取待识别文件的文件名称，并以该文件名称对目标文件进行命名，以及根据上述预设的写入策略将文字信息和/或结构信息写入该目标文件。由此，能够实现对目标文件的自动命名以及识别结果的自动写入，从而提高数据整理效率，优化数据整理效果。

在本申请一个实施中，控制RPA机器人将目标文件提供给用户，可包括：控制RPA机器人通过OA邮件平台将目标文件发送给用户，或者将目标文件发送至用户的通讯客户端。

具体地，在将识别结果写入上述目标文件之后，电子设备可控制RPA机器人调用文件压缩工具将该目标文件进行压缩打包，生成该目标文件的压缩包，然后可控制RPA机器人在OA邮件平台输入用户的邮件地址，并将上述压缩包添加到附件中，通过邮件发送至用户。

需要说明的是，该实施例中所描述的邮件地址可为上述下载的附件对应的邮件的发件人地址。其中，RPA机器人在下载上述附件的同时获取该发件人地址，并存储在RPA机器人中，以便于需要时调出使用。

作为一种可能的情况，电子设备还可控制RPA机器人登录通讯客户端，例如，xx信，并查找用户账号，在查找到用户账号后，将上述目标文件的压缩包通过该通讯客户端提供给用户。

需要说明的是，该实施例中所描述的用户账号可以是相关人员预先存储在RPA机器人中的，以便于需要时调出使用。

由此，能够自动将目标文件发送给用户，在提高效率的同时提高了用户体验。

在本申请实施例中，在电子设备控制RPA机器人对待识别文件进行识别的整个过程中，电子设备可通过相关API实时监测RPA机器人是否出现异常，若是，则可控制RPA机器人进行初始化，并控制初始化后的RPA机器人重新开始对待识别文件进行识别；若否，则说明对待识别文件的识别过程正常，能得到正常的识别结果，控制RPA机器人进行继续工作。由此，能够避免RPA机器人出现异常时识别工作停止的情况，从而能够实现不间断地识别待识别文件，进而提高识别效率。

为使本领域技术人员更清楚地了解本申请，图5使根据本申请的一个控制RPA机器人进行数据识别的具体示例流程图。如图5所示，控制RPA机器人进行数据识别可包括以下步骤：

S501，打开OA邮件平台。

S502，输入账号密码。

S503，登录。

S504，判断是否登录成功。如果是，执行步骤S505；如果否，执行步骤S501。

S505，进入未读邮件，并判断未读邮件的标题是否满足识别条件。

S506，下载标题满足识别条件的未读邮件的附件。

S507，解压。

S508，判断文件类型是否为图片类型。如果是，执行步骤S510；如果否，执行步骤S509。

S509，转换为图片类型。

S510，识别并生成识别结果。

S511，写入目标文件。

S512，将目标文件压缩。

S513，将压缩包发送至用户。

S514，判断是否出现异常。如果是，重新开始；如果否，结束。

进一步地，可参考图6的具体示例图理解本申请，如图6所示，对于运营数据的识别，自动化前的流程是首先由业务人员查看运营数据文件，并上传至云端，通过云端OCR进行识别，然后由业务人员搬运识别结果，最后对识别结果进行复核修改；自动化后的流程是首先由业务人员通过OA邮件将运营数据文件发送给自动化机器人(RPA机器人)，然后由自动化机器人下载附件，并通过本地Mage平台调用OCR进行识别，然后将识别结果写入目标文件，并通过邮件或其他方式将该目标文件返回，最后由业务人员进行复核修改。

本申请实施例的结合RPA和AI的数据识别方法可应用于数据信息识别场景，例如对营运数据信息的识别，用户可通过PC电脑、平板电脑、掌上电脑或手机等电子设备，控制RPA机器人基于该结合RPA和AI的数据识别方法自动获取并识别营运信息数据，并将识别结果发送给用户。

本申请实施例的结合RPA和AI的数据识别装置，可配置于电子设备中，以实现本申请实施例的结合RPA和AI的数据识别方法，还可由本申请实施例提供的结合RPA和AI的数据识别装置执行，该装置可配置于电子设备中，以实现控制RPA机器人从目标文件夹下获取待识别文件，并控制RPA机器人调用文件识别平台对待识别文件进行识别，以生成识别结果，以及控制RPA机器人将识别结果写入目标文件，而后控制RPA机器人将目标文件提供给用户，从而能够实现待识别文件的自动化识别，从而节省了人力成本，同时提高了数据识别的准确率和效率。

如图7所示，本申请实施例的结合RPA和AI的数据识别装置700，可包括：第一获取模块710、识别模块720、写入模块730和提供模块740。

其中，第一获取模块710，用于控制RPA机器人从目标文件夹下获取待识别文件。

识别模块720用于控制RPA机器人调用文件识别平台对待识别文件进行识别，以生成识别结果。

写入模块730用于控制RPA机器人将识别结果写入目标文件。

提供模块740用于控制RPA机器人将目标文件提供给用户。

在本申请的一个实施例中，如图7所示，本申请实施例的结合RPA和AI的数据识别装置700，还可包括：第二获取模块750、第三获取模块760和放入模块770。

其中，第二获取模块750，用于控制RPA机器人通过OA邮件平台获取未读邮件的邮件标题。

第三获取模块760，用于若邮件标题满足识别条件，则控制RPA机器人获取未读邮件中的附件。

放入模块770，用于控制RPA机器人将附件作为待识别文件，并将待识别文件放入目标文件夹下。

在本申请的一个实施例中，识别模块720，具体用于：若待识别文件的文件类型不为目标类型，则对待识别文件进行文件类型转换，以生成目标类型的目标待识别文件，其中，目标类型为图片类型；对目标待识别文件进行识别，以获取目标待识别文件中的文字信息和/或结构信息；根据文字信息和/或结构信息生成识别结果。

在本申请的一个实施例中，写入模块730，具体用于：控制RPA机器人获取待识别文件的文件名称；控制RPA机器人将文件名称作为目标文件的文件名称；控制RPA机器人将文字信息和/或结构信息写入目标文件。

在本申请的一个实施例中，提供模块740，具体用于：控制RPA机器人通过OA邮件平台将目标文件发送给用户，或者将目标文件发送至用户的通讯客户端。

在本申请的一个实施例中，文件识别平台为Mage平台，Mage平台包括光学字符识别OCR，目标文件包括Excel文件、Word文件和TXT文件中的一种。

需要说明的是，本申请实施例的结合RPA和AI的数据识别装置中未披露的细节，请参照本发明上述实施例中的结合RPA和AI的数据识别方法所披露的细节，这里不再赘述。

综上，本申请实施例的结合RPA和AI的数据识别装置，首先通过第一获取模块控制RPA机器人从目标文件夹下获取待识别文件，然后通过识别模块控制RPA机器人调用文件识别平台对待识别文件进行识别，以生成识别结果，并通过写入模块控制RPA机器人将识别结果写入目标文件，最后通过提供模块控制RPA机器人将目标文件提供给用户。由此，能够实现待识别文件的自动化识别，从而节省了人力成本，同时提高了数据识别的准确率和效率。

为了实现上述实施例，本申请还提出一种电子设备，包括至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行上述结合RPA和AI的数据识别方法。

本申请实施例的电子设备，通过处理器执行存储在存储器上的指令，控制RPA机器人从目标文件夹下获取待识别文件；控制RPA机器人调用文件识别平台对待识别文件进行识别，以生成识别结果；控制RPA机器人将识别结果写入目标文件；以及控制RPA机器人将目标文件提供给用户。由此，能够实现待识别文件的自动化识别，从而节省了人力成本，同时提高了数据识别的准确率和效率。

为了实现上述实施例，本申请还提出一种计算机可读存储介质，其存储有计算机程序，该程序被处理器执行时实现上述结合RPA和AI的数据识别方法。

本申请实施例的计算机可读存储介质，通过存储计算机程序并被处理器执行，控制RPA机器人从目标文件夹下获取待识别文件；控制RPA机器人调用文件识别平台对待识别文件进行识别，以生成识别结果；控制RPA机器人将识别结果写入目标文件；以及控制RPA机器人将目标文件提供给用户。由此，能够实现待识别文件的自动化识别，从而节省了人力成本，同时提高了数据识别的准确率和效率。

为了实现上述实施例，本申请还提出一种计算机程序产品，包括计算机程序，计算机程序被处理器执行时实现上述结合RPA和AI的数据识别方法。

在本申请的各种实施例中，应理解，上述各过程的序号的大小并不意味着执行顺序的必然先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

在本申请所提供的实施例中，应理解，“与A相应的B”表示B与A相关联，根据A可以确定B。但还应理解，根据A确定B并不意味着仅仅根据A确定B，还可以根据A和/或其他信息确定B。

另外，在本申请各实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

上述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可获取的存储器中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分，可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等，具体可以是计算机设备中的处理器)执行本申请的各个实施例上述方法的部分或全部步骤。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质包括只读存储器(Read-Only Memory，ROM)、随机存储器(Random Access Memory，RAM)、可编程只读存储器(Programmable Read-only Memory，PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory，OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(CompactDisc Read-Only Memory，CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

以上对本申请实施例公开的一种结合RPA和AI的数据识别方法、装置及电子设备进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种结合RPA和AI的数据识别方法，其特征在于，包括：

控制RPA机器人从目标文件夹下获取待识别文件；

控制所述RPA机器人调用文件识别平台对所述待识别文件进行识别，以生成识别结果；

控制所述RPA机器人将所述识别结果写入目标文件；

控制所述RPA机器人将所述目标文件提供给用户。

2.根据权利要求1所述的方法，其特征在于，所述控制RPA机器人从目标文件夹下获取待识别文件之前，包括：

控制所述RPA机器人通过OA邮件平台获取未读邮件的邮件标题；

若所述邮件标题满足识别条件，则控制所述RPA机器人获取所述未读邮件中的附件；

控制所述RPA机器人将所述附件作为所述待识别文件，并将所述待识别文件放入所述目标文件夹下。

3.根据权利要求1所述的方法，其特征在于，所述文件识别平台通过以下步骤对所述待识别文件进行识别，以生成所述识别结果：

若所述待识别文件的文件类型不为目标类型，则对所述待识别文件进行文件类型转换，以生成所述目标类型的目标待识别文件，其中，所述目标类型为图片类型；

对所述目标待识别文件进行识别，以获取所述目标待识别文件中的文字信息和/或结构信息；

根据所述文字信息和/或所述结构信息生成所述识别结果。

4.根据权利要求3所述的方法，其特征在于，所述控制所述RPA机器人将所述识别结果写入目标文件，包括：

控制所述RPA机器人获取所述待识别文件的文件名称；

控制所述RPA机器人将所述文件名称作为所述目标文件的文件名称；

控制所述RPA机器人将所述文字信息和/或所述结构信息写入所述目标文件。

5.根据权利要求2所述的方法，其特征在于，所述控制所述RPA机器人将所述目标文件提供给用户，包括：

控制所述RPA机器人通过所述OA邮件平台将所述目标文件发送给所述用户，或者将所述目标文件发送至所述用户的通讯客户端。

6.根据权利要求1-5中任一项所述的方法，其特征在于，其中，所述文件识别平台为Mage平台，所述Mage平台包括光学字符识别OCR，所述目标文件包括Excel文件、Word文件和TXT文件中的一种。

7.一种结合RPA和AI的数据识别装置，其特征在于，包括：

第一获取模块，用于控制RPA机器人从目标文件夹下获取待识别文件；

识别模块，用于控制所述RPA机器人调用文件识别平台对所述待识别文件进行识别，以生成识别结果；

写入模块，用于控制所述RPA机器人将所述识别结果写入目标文件；

提供模块，用于控制所述RPA机器人将所述目标文件提供给用户。

8.根据权利要求7所述的装置，其特征在于，还包括：

第二获取模块，用于控制所述RPA机器人通过OA邮件平台获取未读邮件的邮件标题；

第三获取模块，用于若所述邮件标题满足识别条件，则控制所述RPA机器人获取所述未读邮件中的附件；

放入模块，用于控制所述RPA机器人将所述附件作为所述待识别文件，并将所述待识别文件放入所述目标文件夹下。

9.根据权利要求7所述的装置，其特征在于，所述识别模块，具体用于：

根据所述文字信息和/或所述结构信息生成所述识别结果。

10.根据权利要求9所述的装置，其特征在于，所述写入模块，具体用于：

控制所述RPA机器人获取所述待识别文件的文件名称；

11.根据权利要求8所述的装置，其特征在于，所述提供模块，具体用于：

12.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-6中任一项所述的结合RPA和AI的数据识别方法。

13.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-6中任一项所述的结合RPA和AI的数据识别方法。

14.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-6中任一项所述的结合RPA和AI的数据识别方法。