CN114331316A - 基于ai和rpa的订单信息录入方法、装置、设备和介质 - Google Patents

基于ai和rpa的订单信息录入方法、装置、设备和介质 Download PDF

Info

Publication number
CN114331316A
CN114331316A CN202111423850.9A CN202111423850A CN114331316A CN 114331316 A CN114331316 A CN 114331316A CN 202111423850 A CN202111423850 A CN 202111423850A CN 114331316 A CN114331316 A CN 114331316A
Authority
CN
China
Prior art keywords
target
attribute field
controlling
extraction rule
rpa robot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111423850.9A
Other languages
English (en)
Inventor
陈愫恺
汪冠春
胡一川
褚瑞
李玮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Laiye Network Technology Co Ltd
Laiye Technology Beijing Co Ltd
Original Assignee
Beijing Laiye Network Technology Co Ltd
Laiye Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Laiye Network Technology Co Ltd, Laiye Technology Beijing Co Ltd filed Critical Beijing Laiye Network Technology Co Ltd
Priority to CN202111423850.9A priority Critical patent/CN114331316A/zh
Publication of CN114331316A publication Critical patent/CN114331316A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Manipulator (AREA)

Abstract

本公开提出一种基于AI和RPA的订单信息录入方法、装置、设备和介质,涉及AI和RPA领域,其中,方法包括:获取电子订单,并控制RPA机器人基于OCR技术,识别并提取电子订单中的各目标属性字段;控制RPA机器人获取与各目标属性字段匹配的第一目标提取规则;控制RPA机器人根据各目标属性字段匹配的第一目标提取规则,从电子订单中提取各目标属性字段对应的目标属性值;控制RPA机器人将各目标属性字段与各目标属性字段对应的目标属性值,对应录入至目标文件中。由此,通过RPA机器人将电子订单中的字段信息,自动录入至目标文件中,不仅可以释放人力,节省人工成本,还可以提升信息录入效率。

Description

基于AI和RPA的订单信息录入方法、装置、设备和介质
技术领域
本公开涉及人工智能(Artificial Intelligence,简称AI)和机器人流程自动化(Robotic Process Automation,简称RPA)领域,尤其涉及一种基于AI和RPA的订单信息录入方法、装置、设备和介质。
背景技术
RPA是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
AI是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。
智能文档处理(Intelligent Document Processing,简称IDP)是指从文档中自动抽取信息,将用户想要的字段信息从文档内容中抽取出来。IDP平台可以提供丰富的预训练模型及自学习功能,对多类复杂的文档进行处理,实现端到端的自动化处理文档,例如,IDP平台可以基于光学字符识别(Optical Character Recognition,简称OCR)、自然语言处理(Natural Language Processing,简称NLP)等前沿算法,对文档进行处理,得到用户所需的字段信息。
对于企业而言,可能接收或生成大量的采购订单,这些采购订单可能对应于不同的供应商,因此不同采购订单的表格格式可能不同。对于不同表格格式的采购订单,可以通过人工录入的方式,将上述采购订单录入至订单系统中。然而上述方式,需要业务人员花费大量时间投入至重复录入工作中,不仅录入效率较低,还易录入出错。
发明内容
本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本公开提出一种基于AI和RPA的订单信息录入方法、装置、设备和介质,以实现通过RPA机器人将电子订单中的字段信息,自动录入至目标文件中,一方面,可以释放人力,节省人工成本,另一方面,还可以提升信息录入效率,并且,还可以避免人工录入易出错的情况,提升目标文件中订单信息录入的准确性。
本公开第一方面实施例提出了一种基于AI和RPA的订单信息录入方法,包括:
获取电子订单,并控制RPA机器人基于光学字符识别OCR技术,识别并提取所述电子订单中的各目标属性字段;
控制所述RPA机器人获取与各所述目标属性字段匹配的第一目标提取规则;
控制所述RPA机器人根据各所述目标属性字段匹配的第一目标提取规则,从所述电子订单中提取各所述目标属性字段对应的目标属性值;
控制所述RPA机器人将各所述目标属性字段与所述各目标属性字段对应的目标属性值,对应录入至目标文件中。
本公开第二方面实施例提出了一种基于AI和RPA的订单信息录入装置,包括:
处理模块,用于获取电子订单,并控制RPA机器人基于光学字符识别OCR技术,识别并提取所述电子订单中的各目标属性字段;
获取模块,用于控制所述RPA机器人获取与各所述目标属性字段匹配的第一目标提取规则;
提取模块,用于控制所述RPA机器人根据各所述目标属性字段匹配的第一目标提取规则,从所述电子订单中提取各所述目标属性字段对应的目标属性值;
录入模块,用于控制所述RPA机器人将各所述目标属性字段与所述各目标属性字段对应的目标属性值,对应录入至目标文件中。
本公开第三方面实施例提出了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如本公开上述第一方面实施例所述的方法。
本公开第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如本公开上述第一方面实施例所述的方法。
本公开第五方面实施例提出了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如本公开上述第一方面实施例所述的方法。
本公开实施例所提供的技术方案包含如下的有益效果:
通过获取电子订单,并控制RPA机器人基于OCR技术,识别并提取电子订单中的各目标属性字段;控制RPA机器人获取与各目标属性字段匹配的第一目标提取规则;控制RPA机器人根据各目标属性字段匹配的第一目标提取规则,从电子订单中提取各目标属性字段对应的目标属性值;控制RPA机器人将各目标属性字段与各目标属性字段对应的目标属性值,对应录入至目标文件中。本公开中,通过RPA机器人将电子订单中的字段信息,自动录入至目标文件中,一方面,可以释放人力,节省人工成本,另一方面,还可以提升信息录入效率,并且,还可以避免人工录入易出错的情况,提升目标文件中订单信息录入的准确性。
本公开附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本公开的实践了解到。
附图说明
本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本公开实施例所提供的一种基于AI和RPA的订单信息录入方法的流程示意图;
图2为本公开实施例所提供的另一种基于AI和RPA的订单信息录入方法的流程示意图;
图3为本公开实施例所提供的一种电子订单示意图;
图4为本公开实施例所提供的一种规则示意图;
图5为本公开实施例所提供的另一种电子订单示意图;
图6为本公开实施例所提供的另一种规则示意图;
图7为本公开实施例所提供的又一种电子订单示意图;
图8为本公开实施例所提供的又一种规则示意图;
图9为本公开实施例所提供的另一种基于AI和RPA的订单信息录入方法的流程示意图;
图10为本公开实施例所提供的另一种基于AI和RPA的订单信息录入方法的流程示意图;
图11为本公开实施例所提供的另一种基于AI和RPA的订单信息录入方法的流程示意图;
图12为本公开实施例所提供的附加文本示意图;
图13为本公开实施例所提供的另一种基于AI和RPA的订单信息录入方法的流程示意图;
图14为本公开实施例所提供的录入订单信息的流程示意图;
图15为本公开实施例所提供的用于提取属性字段对应的属性值的模板示意图;
图16为本公开实施例提供的一种基于AI和RPA的订单信息录入装置的结构示意图;
图17示出了适于用来实现本公开实施方式的示例性电子设备的框图。
具体实施方式
下面详细描述本公开的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本公开,而不能理解为对本公开的限制。
目前,对于不同格式的采购订单,可以通过人工录入的方式,将上述采购订单录入至订单系统中。然而上述方式,需要业务人员花费大量时间投入至重复的订单录入工作中,不仅录入效率较低,还易出错。
如果使用传统的通用表格识别技术,比如光学字符识别(Optical CharacterRecongnition,简称OCR)技术,识别采购订单的订单信息,可能存在以下问题:
第一,由于不同采购订单的表格格式可能不同,需要针对每种表格格式,专门编写对应的提取逻辑,来提取该表格格式的订单信息,得到OCR识别结果。然而上述方式,实施周期较长,投入成本较高。
第二,由于采购订单的表格行数不确定,有时可能为一行,有时可能为多行,增加了后续提取逻辑的复杂度。
第三,需要从备注信息中提取一些有用数据,然而备注信息的提取规则较多,目前均是由人工提取,如果采用机器自动提取的方式,则会提高提取逻辑的复杂度。
此外,即使能够解决上述问题,也仅仅是解决从纸质的采购订单中读取信息,还需要人工进行二次确认,重复录入仍然由人工进行,严重浪费了人力成本。因此,目前仍采用人工录入方式,将纸质的采购订单录入至订单系统中。
针对上述存在的至少一种问题,本公开提出了一种基于AI和RPA的订单信息录入方法、装置、设备和介质。
下面参考附图描述本公开实施例的基于AI和RPA的订单信息录入方法、装置、设备和介质。在具体描述本公开实施例之前,为了便于理解,首先对常用技术词进行介绍:
机器人流程自动化(Robotic Process Automation,简称RPA),是为企业和个人提供专业全面的流程自动化解决方案。RPA是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。即RPA机器人可通过模拟用户的鼠标键盘操作,快速、准确的收集用户操作界面的数据,基于清晰的逻辑规则处理这些数据,再快速而准确地录入到另外一个系统或界面。由此,可以大幅降低人力成本的投入,有效提高现有办公效率,准确、稳定、快捷地完成工作。
人工智能(Artificial Intelligence,简称AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。AI是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。AI硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;AI软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理(Natural Language Processing,简称NLP)技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
OCR技术,是指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
智能文档处理(Intelligent Document Processing,简称IDP),是指从文档中自动抽取信息,将用户想要的字段信息从文档内容中抽取出来。IDP平台可以提供丰富的预训练模型及自学习功能,对多类复杂的文档进行处理,实现端到端的自动化处理文档,例如,IDP平台可以基于OCR、NLP等前沿算法,对文档进行处理,得到用户所需的字段信息。
图1为本公开实施例所提供的一种基于AI和RPA的订单信息录入方法的流程示意图。
本公开实施例提供的基于AI和RPA的订单信息录入方法,可应用于本公开实施例的基于AI和RPA的订单信息录入装置,该装置可被配置于电子设备中。其中,该电子设备可以是个人电脑、移动终端等,移动终端例如为手机、平板电脑、个人数字助理等具有各种操作系统的硬件设备。
如图1所示,该基于AI和RPA的订单信息录入方法可以包括以下步骤:
步骤101,获取电子订单,并控制RPA机器人基于OCR技术,识别并提取电子订单中的各目标属性字段。
在本公开实施例中,术语“电子订单”是指电子数据形式的订单。
作为一种示例,可以对纸质的采购订单进行扫描,得到设定格式(比如PDF格式)的电子订单。
在本公开实施例中,术语“目标属性字段”是指电子订单中的属性词(比如名称、颜色等)对应的字段。
例如,“目标属性字段”可以包括与电子订单中的代采购对象(比如待采购商品)相关的属性词,比如包括待采购对象对应的名称、编号、尺寸(比如高度、宽度)、数量、面积(比如单件面积、总面积)、工艺规格、订购单价等属性词,此外,“目标属性字段”还可以包括下单时间、下单人、收货人、收货人联系方式、订单号、送货地址等与电子订单相关的属性词。
在本公开实施例中,可以控制RPA机器人基于OCR技术,识别并提取电子订单中的各目标属性字段。
作为一种示例,可以对不同的电子订单进行统计分析,确定电子订单中的常见的属性词或属性字段,并将统计的属性词或属性字段整理至属性词表中。从而RPA机器人在基于OCR技术,识别得到电子订单中的各字段后,可以将识别得到的各字段与属性词表中的各属性词或属性字段进行匹配,将识别得到的各字段中,与属性词表中的各属性词或属性字段匹配的字段,作为目标属性字段。
步骤102,控制RPA机器人获取与各目标属性字段匹配的第一目标提取规则。
在本公开实施例中,术语“提取规则”是指用于提取属性字段或属性词对应的属性值的规则,即“第一目标提取规则”是指与目标属性字段匹配的,用于提取目标属性字段对应的目标属性值的规则。
其中,术语“目标属性值”是指“目标属性字段”对应的属性值,即目标属性字段可以为Key,目标属性值可以为Value。例如,当“目标属性字段”为单件面积时,“目标属性值”可以为XX(m2),再例如,当“目标属性字段”为颜色或色号时,“目标属性值”可以为红色、绿色等,又例如,当“目标属性字段”为下单人时,“目标属性值”可以为张三、李四等。
在本公开实施例中,可以预先设置多个提取规则,每个提取规则用于提取一个属性字段或属性词对应的属性值。
在本公开实施例中,可以控制RPA机器人获取与各目标属性字段匹配的第一目标提取规则。
步骤103,控制RPA机器人根据各目标属性字段匹配的第一目标提取规则,从电子订单中提取各目标属性字段对应的目标属性值。
在本公开实施例中,针对每个目标属性字段,RPA机器人可以根据与该目标属性字段匹配的第一目标提取规则,从电子订单中提取该目标属性字段对应的目标属性值。
步骤104,控制RPA机器人将各目标属性字段与各目标属性字段对应的目标属性值,对应录入至目标文件中。
在本公开实施例中,术语“目标文件”是指用于目标属性字段和目标属性值的任一文件,比如,目标文件可以为Word、Excel等文档格式的文件。
在本公开实施例中,可以控制RPA机器人将各目标属性字段与各目标属性字段对应的目标属性值,对应录入至目标文件中。
本公开实施例的基于AI和RPA的订单信息录入方法,通过获取电子订单,并控制RPA机器人基于OCR技术,识别并提取电子订单中的各目标属性字段;控制RPA机器人获取与各目标属性字段匹配的第一目标提取规则;控制RPA机器人根据各目标属性字段匹配的第一目标提取规则,从电子订单中提取各目标属性字段对应的目标属性值;控制RPA机器人将各目标属性字段与各目标属性字段对应的目标属性值,对应录入至目标文件中。本公开中,通过RPA机器人将电子订单中的字段信息,自动录入至目标文件中,一方面,可以释放人力,节省人工成本,另一方面,还可以提升信息录入效率,并且,还可以避免人工录入易出错的情况,提升目标文件中订单信息录入的准确性。
为了清楚说明上述实施例中RPA机器人是如何确定各目标属性字段匹配的第一目标提取规则的,本公开还提出一种基于AI和RPA的订单信息录入方法。
图2为本公开实施例所提供的另一种基于AI和RPA的订单信息录入方法的流程示意图。
如图2所示,该基于AI和RPA的订单信息录入方法可以包括以下步骤:
步骤201,获取电子订单,并控制RPA机器人基于OCR技术,识别并提取电子订单中的各目标属性字段。
步骤201的执行过程可以参见上述实施例,在此不做赘述。
步骤202,确定电子订单的内容排版格式。
在本公开实施例中,可以确定电子订单中的内容排版格式。其中,内容排版格式可以为电子订单中内容的排版格式。
作为一种示例,RPA机器人可以基于OCR技术,对电子订单中的各字段进行识别,并根据识别得到的各字段的排布方式,确定电子订单的内容排版格式。或者,可以基于表格识别技术,确定电子订单的内容排版格式。
举例而言,假设电子订单中,“收货人”这一目标属性字段位于电子订单的上半部分,则内容排版格式可以为格式1,假设电子订单中,“收货人”这一目标属性字段位于电子订单的下半部分,则内容排版格式可以为格式2。
再例如,在电子订单中具有某一属性字段的情况下,内容排版格式可以为格式3,而在电子订单中不具有该属性字段的情况下,内容排版格式可以为格式4。
又例如,针对某一属性字段,如果电子订单中的该属性字段对应的属性值与该属性字段位于同一行时,内容排版格式可以为格式5,电子订单中该属性字段对应的属性值与该属性字段位于同一列时,内容排版格式可以为格式6。
作为另一种示例,也可以通过人工指定的方式,确定电子订单的内容排版格式。
步骤203,控制RPA机器人获取与内容排版格式匹配的目标配置模板;其中,目标配置模板中配置有属性字段与提取规则之间的对应关系。
在本公开实施例中,术语“配置模板”是指预先配置的规则模板,配置模板可以配置有不同属性字段与提取规则之间的对应关系。术语“目标配置模板”是指与电子订单的内容排版格式匹配的配置模板。
作为一种可能的实现方式,可以预先设置有不同格式与配置模板之间的对应关系,从而本公开中,可以根据电子订单的内容排版格式,查询上述对应关系,以从各配置模板中确定与内容排版格式匹配的目标配置模板。
步骤204,控制RPA机器人从目标配置模板中,确定与各目标属性字段匹配的第一目标提取规则。
在本公开实施例中,针对每个目标属性字段,RPA机器人可以从目标配置模板中,确定与该目标属性字段匹配的第一目标提取规则。即可以根据该目标属性字段,查询目标配置模板中配置的属性字段与提取规则之间的对应关系,以确定与目标属性字段匹配的第一目标提取规则。
步骤205,控制RPA机器人根据各目标属性字段匹配的第一目标提取规则,从电子订单中提取各目标属性字段对应的目标属性值。
在本公开实施例中,针对每个目标属性字段,可以根据该目标属性字段匹配的第一目标提取规则,从电子订单中提取该目标属性字段对应的目标属性值。
作为一种示例,以电子订单为图3所示的订单进行示例,针对电子订单中的目标属性字段“工艺规格”,对应的第一目标提取规则可以如图4中的规则1所示,可以指定该第一目标提取规则对应的起始关键词(例如为目标属性字段)和提取方向(即图4中的匹配方向,例如为向下),从而可以控制RPA机器人从起始关键词开始,向下提取信息,得到“工艺规格”对应的目标属性值为“6+1.14PVB+6双银半钢化+12A+6三超白”。
作为另一种示例,以电子订单为图5所示的订单进行示例,针对电子订单中的目标属性字段“配置”,对应的第一目标提取规则可以如图6中的规则2所示,可以指定该第一目标提取规则对应的起始关键词(例如为目标属性字段)和提取方向(即图6中的匹配方向,例如为向下),从而可以控制RPA机器人从起始关键词开始,向下提取信息,得到“配置”对应的目标属性值为“CLR-8-T+1.52PVB国产+CLR-8-XX”。
作为又一种示例,以电子订单为图7所示的订单进行示例,针对电子订单中的目标属性字段“玻璃品种”,对应的第一目标提取规则可以如图8中的规则3所示,可以指定该第一目标提取规则对应的起始关键词(例如为目标属性字段)和提取方向(即图8中的匹配方法,例如为向右),从而可以控制RPA机器人从起始关键词开始,向右提取信息,得到“玻璃品种”对应的目标属性值为“IL(CLR-6-PLE58D-T+12A国结+CLR-6-T)-FE”。
步骤206,控制RPA机器人将各目标属性字段与各目标属性字段对应的目标属性值,对应录入至目标文件中。
步骤206的执行过程可以参见本公开任一实施例的执行过程,在此不做赘述。
本公开实施例的基于AI和RPA的订单信息录入方法,可以通过用户生成自定义的配置模板,该配置模板中配置有不同属性字段与提取规则之间的对应关系,从而可以根据配置模板中的提取规则,提取电子订单中的各目标属性字段对应的目标属性值,可以满足用户的实际需求,并且,通过用户生成配置模板的方式,可以实现对任一格式的电子订单进行属性值提取,可以提升该方法的灵活性和适用性。
为了清楚说明上述实施例中RPA机器人是如何确定各目标属性字段匹配的第一目标提取规则的,本公开还提出一种基于AI和RPA的订单信息录入方法。
图9为本公开实施例所提供的另一种基于AI和RPA的订单信息录入方法的流程示意图。
如图9所示,该基于AI和RPA的订单信息录入方法可以包括以下步骤:
步骤301,获取电子订单,并控制RPA机器人基于OCR技术,识别并提取电子订单中的各目标属性字段。
步骤301的执行过程可以参见上述实施例,在此不做赘述。
步骤302,控制RPA机器人查询设定配置模板,其中,设定配置模板中配置有至少一个提取规则,其中,每个提取规则包括起始关键词、截止关键词和提取方向,提取规则用于按照提取方向,提取起始关键词和截止关键词之间的属性值,并作为起始关键词对应的属性值。
在本公开实施例中,术语“设定配置模板”是指预先设定的配置有提取规则的模板。其中,设定配置模板中可以配置有至少一个提取规则,每个提取规则可以包括起始关键词、截止关键词和提取方向,提取规则用于按照提取方向,提取起始关键词和截止关键词之间的属性值,并将提取的属性值,作为起始关键词对应的属性值。
步骤303,针对每个目标属性字段,控制RPA机器人从至少一个提取规则中,确定与目标属性字段匹配的第一目标提取规则,其中,第一目标提取规则中的起始关键词与目标属性字段匹配。
在本公开实施例中,针对每个目标属性字段,可以控制RPA机器人从设定配置模板中的至少一个提取规则中,确定与目标属性字段匹配的第一目标提取规则,其中,第一目标提取规则中的起始关键词与目标属性字段匹配。
作为一种示例,以电子订单为图3所示的订单进行示例,针对电子订单中的目标属性字段“下单人”,对应的第一目标提取规则可以类似于图8中的规则3,此时,规则3中对应的起始关键词可以为“下单人”,截止关键词可以为“下单时间”,提取方向(即图8中的匹配方向)仍然为向右。
步骤304,控制RPA机器人根据各目标属性字段匹配的第一目标提取规则,从电子订单中提取各目标属性字段对应的目标属性值。
在本公开实施例中,针对每个目标属性字段,可以根据该目标属性字段匹配的第一目标提取规则,从电子订单中提取该目标属性字段对应的目标属性值。即可以按照与目标属性字段匹配的第一目标提取规则中的提取方向,从电子订单中,提取该目标属性字段与第一目标提取规则中的截止关键词之间的属性值,作为该目标属性字段对应的目标属性值。
仍以上述例子示例,可以控制RPA机器人按照提取方向(向右),从“下单人”和“下单时间”这两个属性字段之间提取属性值,得到“下单人”对应的目标属性值为:魏某某。
步骤305,控制RPA机器人将各目标属性字段与各目标属性字段对应的目标属性值,对应录入至目标文件中。
步骤305的执行过程可以参见本公开任一实施例的执行过程,在此不做赘述。
本公开实施例的基于AI和RPA的订单信息录入方法,通过设定配置模板中的提取规则,提取电子订单中的各目标属性字段对应的目标属性值,可以实现属性值的有效提取。
为了清楚说明上述实施例中RPA机器人是如何确定各目标属性字段匹配的第一目标提取规则的,本公开还提出一种基于AI和RPA的订单信息录入方法。
图10为本公开实施例所提供的另一种基于AI和RPA的订单信息录入方法的流程示意图。
如图10所示,该基于AI和RPA的订单信息录入方法可以包括以下步骤:
步骤401,获取电子订单,并控制RPA机器人基于OCR技术,识别并提取电子订单中的各目标属性字段。
步骤401的执行过程可以参见上述实施例,在此不做赘述。
步骤402,控制RPA机器人查询设定配置模板,其中,设定配置模板中配置有至少一个提取规则,其中,每个提取规则包括设定关键词和提取方向,提取规则用于按照提取方向,提取设定关键词对应的属性值。
可以理解的是,图9中的提取规则包括起始关键词和截止关键词,是针对电子订单的表格中的同一行或同一列存在多个属性字段的情况,对于同一行或同一列中的非最后一个属性字段,可以控制RPA机器人从相邻的两个属性字段中提取属性值,作为前一个属性字段(即起始关键词)对应的属性值,然而,对于同一行或同一列中的最后一个属性字段,或者,对于同一行或同一列中只存在一个属性字段的情况,由于并没有下一个属性字段作为参考,此时,提取规则中可以无需包含截止关键词,只需包含一个关键词即可,即提取规则中只需包含一个设定关键词(或称为起始关键词)即可。
因此,本公开中,设定配置模板中的每个提取规则可以包括设定关键词和提取方向,提取规则用于按照提取方向,以设定关键词为起始位置,识别提取设定关键词对应的属性值。
步骤403,针对每个目标属性字段,控制RPA机器人从至少一个提取规则中,确定与目标属性字段匹配的第一目标提取规则,其中,第一目标提取规则中的设定关键词与目标属性字段匹配。
在本公开实施例中,针对每个目标属性字段,可以控制RPA机器人从设定配置模板中的至少一个提取规则中,确定与目标属性字段匹配的第一目标提取规则,其中,第一目标提取规则中的设定关键词与目标属性字段匹配。
作为一种示例,以电子订单为图3所示的订单进行示例,针对电子订单中的目标属性字段“使用位置”,对应的第一目标提取规则可以类似于图8中的规则3,此时,规则3中对应的起始关键词(即设定关键词)可以为“使用位置”,提取方向(即图8中的匹配方向)仍然为向右。
步骤404,控制RPA机器人根据各目标属性字段匹配的第一目标提取规则,从电子订单中提取各目标属性字段对应的目标属性值。
在本公开实施例中,针对每个目标属性字段,可以根据该目标属性字段匹配的第一目标提取规则,从电子订单中提取该目标属性字段对应的目标属性值。即可以按照与该目标属性字段匹配的第一目标提取规则中的提取方向,从电子订单中,以目标属性字段为起始位置,查找并提取该目标属性字段对应的目标属性值。
仍以上述例子示例,可以控制RPA机器人按照提取方向(向右),以“使用位置”为起始位置,从电子订单中提取属性值,得到“使用位置”对应的目标属性值为:2#4#7#楼顶上。
步骤405,控制RPA机器人将各目标属性字段与各目标属性字段对应的目标属性值,对应录入至目标文件中。
步骤405的执行过程可以参见本公开任一实施例的执行过程,在此不做赘述。
本公开实施例的基于AI和RPA的订单信息录入方法,通过设定配置模板中的提取规则,提取电子订单中的各目标属性字段对应的目标属性值,可以实现属性值的有效提取。
需要说明的是,本公开中仅以图2、图9和图10中的第一目标提取规则的确定方式为并列执行进行示例,实际应用时,为了提升订单信息录入的全面性和可靠性,还可以结合这三种确定方式中的多种。例如,在电子订单的表格中的同一行或者同一列具有多个属性字段的情况下,可以结合图9和图10,来确定每个目标属性字段对应的第一目标提取规则。
进一步地,如图4、图6和图8所示,针对每个规则,还可以设置对应的提取区域大小(比如设置提取区域的上边界、下边界、左边界、右边界),从而可以控制RPA机器人在相应的提取区域中,提取属性字段对应的属性值。
即第一目标提取规则中还可以包括目标属性字段对应的提取区域,可以控制RPA机器人在该目标属性字段对应的提取区域内,提取目标属性字段对应的目标属性值。
需要说明的是,电子订单可能包括备注信息,备注信息中同样可能存在属性字段和对应的属性值,因此,为了提升目标文件中订单信息录入的全面性和可靠性,还可以对电子订单中的附加文本信息(比如备注信息)进行属性字段和属性值提取。下面结合图11,对上述过程进行详细说明。
图11为本公开实施例所提供的另一种基于AI和RPA的订单信息录入方法的流程示意图。
如图11所示,在上述任一实施例的基础上,该基于AI和RPA的订单信息录入方法还可以包括以下步骤:
步骤501,控制RPA机器人基于OCR技术,识别电子订单中的附加文本信息。
需要说明的是,上述实施例中的目标属性字段可以为电子订单中除了附加文本信息之外的各个属性字段,比如目标属性字段可以为表格中独立的属性字段,其中,附加文本信息例如可以为备注信息。
在本公开实施例中,可以基于OCR技术,识别电子订单中的附加文本信息。
步骤502,控制RPA机器人从附加文本信息提取附加属性字段以及附加属性字段对应的附加属性值。
在本公开实施例中,术语“附加属性字段”是指附加文本信息中的属性字段,相应的,术语“附加属性值”是指附加文本信息中,与附加属性字段对应的属性值。
在本公开实施例中,可以控制RPA机器人从附加文本信息提取附加属性字段以及附加属性字段对应的附加属性值。其中,附加属性字段的个数可以为至少一个。
作为一种示例,可以从附加文本信息中提取代采购对象(比如待采购商品)的规格数据等信息。以附加文本信息为图12中区域1201所示的文本信息进行示例,可以从附加文本信息中提取距离、位置、间隙、高度、长度等附加属性字段,以及提取各属性字段对应的附加属性值,比如,提取得到的信息可以如区域1202所示,即距离对应的附加属性值为188mm,位置对应的附加属性值为188mm,间隙对应的附加属性值为0.3mm,间距对应的附加属性值为0.5mm。
步骤503,控制RPA机器人将附加属性字段和附加属性字段对应的附加属性值,对应录入至目标文件中。
在本公开实施例中,可以控制RPA机器人将附加属性字段和附加属性字段对应的附加属性值,对应录入至目标文件中。
本公开实施例的基于AI和RPA的订单信息录入方法,通过从电子订单中识别附加文本信息,并从附加文本信息提取附加属性字段以及附加属性字段对应的附加属性值,并将附加属性字段和附加属性字段对应的附加属性值,对应录入至目标文件中。由此,可以实现提升目标文件中订单信息录入的全面性和可靠性。
作为一种可能的实现方式中,同样可以根据预先配置的提取规则,来从附加文本信息中提取附加属性字段对应的附加属性值。下面结合图13,对上述过程进行详细说明。
图13为本公开实施例所提供的另一种基于AI和RPA的订单信息录入方法的流程示意图。
如图13所示,在图11所示实施例的基础上,步骤502可以包括以下步骤:
步骤601,控制RPA机器人从附加文本信息提取附加属性字段。
在本公开实施例中,可以控制RPA机器人从附加文本信息中提取属性字段,得到附加属性字段。其中,附加属性字段的提取方式与目标属性字段类似,在此不做赘述。
步骤602,控制RPA机器人获取与附加属性字段匹配的第二目标提取规则。
在本公开实施例中,术语“第二目标提取规则”是指与附加属性字段匹配的,用于提取附加属性字段对应的属性值的规则。
在本公开实施例中,可以预先设置不同属性字段对应的提取规则,并建立属性字段与提取规则之间的匹配关系,从而本公开中,可以根据附加属性字段,查询上述匹配关系,确定与附加属性字段匹配的第二目标提取规则。
步骤603,控制RPA机器人根据第二目标提取规则,从附加文本信息中提取附加属性字段对应的附加属性值。
在本公开实施例中,可以控制RPA机器人根据第二目标提取规则,从附加文本信息中提取附加属性字段对应的附加属性值。
作为一种示例,第二目标提取规则可以包括自定义词表、预设词表、正则表达式等预先设定的用于提取属性值的规则。
其中,自定义词表是指由<词表名称(即属性字段)、词表值(即属性值)、词表值的多种说法>构成的信息结构体。该自定义词表可以为用户配置的个性化词表。举例而言,对于“口红色号”这一词表名称或属性字段,对应的自定义词表可以如表1所示。
表1
Figure BDA0003378335420000131
其他属性字段,也可以通过表1的方式,设置对应的自定义词表。
从而本公开中,针对附加属性字段,可以通过将附加文本信息与该附加属性字段对应的自定义词表中的词表值或词表值的多种说法进行匹配,来实现从附加文本信息中提取该附加属性字段对应的附加属性值。
举例而言,假设附加文本信息中具有“口红色号”这一附加属性字段,且附加文本信息中存在“口红色号”对应的自定义词表中的词表值“烈焰蓝金666”,则可以确定“口红色号”对应的附加属性值为“烈焰蓝金666”。
其中,预设词表和自定义词表的用法相同,不同之处在于,预设词表可以为系统预置的词表。预设词表可以用于提取货币、人物名称、公司名称、日期、时间、地点等实体词。
其中,正则表达式是对字符串操作的一种逻辑公式,可以将正则表达式与附加文本信息进行匹配,以从附加文本信息中提取附加属性字段对应的附加属性值。
为了更好地利用正则表达式,可以对正则表达式规定一些更细致的规则,比如:
全局匹配:一个正则表达式可以匹配附加文本信息的多个片段,匹配到的均输出;
匹配顺序:默认为从左到右,当然也可以为从右往左;
区分或不区分大小写,即匹配时是否对英文字母的大小写敏感。
可以理解的是,针对表1,不同说法的词表值可能对应了同一属性值,比如复古蓝调红和复古红,与烈焰蓝金666为同一属性值,因此,为了实现规范化第二目标提取规则所提取的附加属性值,可以将附加属性值进行归一化,从而可以控制RPA机器人将归一化后的附加属性值和附加属性字段,对应录入至目标文件中。
举例而言,假设附加文本信息中具有“口红色号”这一附加属性字段,且附加文本信息中存在“口红色号”对应的附加属性值为“复古蓝调红”,则可以将“复古蓝调红”进行归一化为“烈焰蓝金666”。
在本公开的任意一个实施例之中,在RPA机器人完成对电子订单中的各属性字段和属性值进行提取后,可以控制RPA机器人登录订单系统,并控制RPA机器人将目标文件中的各属性字段和对应的属性值,对应录入至订单系统中。
其中,术语“订单系统”是指用于存储订单信息的系统。
比如,可以控制RPA机器人在登录页面输入登录信息,以根据登录信息执行登录,在RPA机器人登录订单系统后,可以控制RPA机器人将目标文件中的各属性字段和对应的属性值,对应录入至订单系统中。
在本公开实施例中,术语“登录信息”是指用于登录认证管理系统的信息,该登录信息可以至少包括账户信息,账户信息可以包括手机号、邮箱号等,可以理解的是,登录信息还可以包括其他信息,比如还可以包括密码信息、图片验证码等信息,本公开对此并不做限制。
作为一种应用场景,可以基于智能文档处理(Intelligent DocumentProcessing,简称IDP)平台和RPA机器人,实现从电子订单中提取订单信息,并录入至订单系统中。
如图14所示,主要包括以下两部分:
第一部分,纸质订单的读取与提取。
1、IDP平台可以提供用户自定义配置模板的功能,其中,配置模板中可以包括多个提取规则,每个提取规则用于从扫描得到的电子订单的表格中,提取一个属性字段对应的属性值,从而可以基于配置模板,来实现对电子订单中的表格进行订单信息的有效提取。
举例而言,对于不同格式的电子表格而言,比如图3、图5和图7,属性字段“工艺规格”、“配置”、“玻璃品种”均是代采购对象的品种名称(即品名),属于同一属性词,如果采用一种提取规则,来实现提取品种名称对应的属性词,则可能造成属性字段和属性值遗漏提取的情况。
因此本公开中,针对不同内容排版格式的电子订单,可以设置不同的提取规则,来实现从电子订单中提取各属性字段对应的属性值。
2、IDP平台还可以提供信息提取功能,用于从附加文本信息(比如备注信息)中提取规则数据等信息。例如,IDP平台可以提供抽取规则或提取规则,该规则用于从附加文本信息中提取属性值。
其中,对信息提取进行简单介绍:信息提取,又称为信息抽取,是指从非结构化的文本信息中提取结构化数据。
举例而言,假设具有如下三段上市公司的披露公告。
公告一
持有本公司股份300,000股(占本公司总股本0.0284%)的高级管理人员肖某某拟自本公告起十五个交易日后的六个月内,以集中竞价方式减持本公司股份不超过75,000股(占公司总股本的0.0071%),已跟监事进行确认。
公告二
持有本公司股份158,858股(占本公司总股本0.0150%)的监事赵某某拟自本公告起十五个交易日后的六个月内,以集中竞价或大宗交易方式减持本公司股份不超过39,715股(占公司总股本的0.0038%)。
公告三
持有本公司股份1,208,035股(占本公司总股本0.1144%)的高级管理人员张某某拟自本公告起十五个交易日后的六个月内,以集中竞价或大宗交易方式减持本公司股份不超过250,000股(占公司总股本的0.0237%)。
可以通过IDP平台提供的抽取规则或提取规则,从上述文本信息中,提取如表2所示的结构化数据:
表2
人名 方式 增持/减持 股数
肖某某 集中竞价 减持 75,000
赵某某 集中竞价或大宗交易 减持 39,715
张某某 集中竞价或大宗交易 减持 250,000
例如,研发人员可以向IDP平台提供自定义的模板,该模板可以如图15所示,利用该模板对应的文本表达式,来匹配附加文本信息中的文本片段,从而实现提取各属性字段对应的属性值。
图15中的模板中的中括号“[]”代表严格匹配,匹配的内容可以是预先定义好的“词表”、“正则表达式”,也可以是需要匹配的短语。
如果匹配的内容为属性字段,则会将匹配的结果(即属性值)进行归一化,例如,不论匹配到的是“复古蓝调红”还是“复古红”等多种说法中的哪一个,返回的属性值均为“烈焰蓝金666”。
多个需要匹配的内容(即属性字段)可以用|(半角竖线)进行分割。
“尖括号”<>代表模糊匹配。
其中,模糊匹配是与严格匹配相对应的概念。严格匹配要求待匹配的文本与指定的匹配内容必须完全一致。模糊匹配则只要两者语义接近即可。例如,严格匹配不会认为“新闻发布会”与“记者招待会”匹配,但模糊匹配可以认为“新闻发布会”与“记者招待会”匹配。
尖括号内可以指定的内容包括自定义词表和研发人员输入的“短语”,但是尖括号内不可以指定正则表达式。
尖括号里引用的属性字段不会进行归一化,即仅对属性值进行归一化,而无需对属性字段进行归一化。
符号<*>代表匹配任意长度的文本片段。
模板中需要匹配{,},[,],<,>,|,{,},*时,使用“\”转义。
进一步地,对于提取的属性值,还可以通过预设词表、自定义词表或正则表达式进行过滤,以过滤属性值中的无效字符或无用字符。举例而言,需要提取数字类的属性值时,可以通过正则表达式,只提取属性值中的数字,而去除汉字、字母等其他字符。
在从电子订单中识别得到各属性字段和各属性字段对应的属性值后,可以将各属性字段和各属性字段对应的属性值,对应录入至目标文件(比如Excel文件)中。
进一步地,还可以将该目标文件提供给相关人员进行人工复核。
需要说明的是,上述步骤可以由IDP平台执行,或者,也可以通过RPA机器人执行,本公开对此并不做限制。
第二部分,RAP机器人自动录入订单。
RPA机器人读取指定文件夹下的目标文件(人工复核后的);
RPA机器人自动登陆订单系统;
RPA机器人进行订单创建与自动录入;
RPA机器人每录一行,将结果写入目标文件的录入结果列,如果某一行录入有问题,则记录异常信息并跳过这一行录入下一行;
全部录入完毕后,通过邮件通知相关人员,以由相关人员确认目标文件的录入结果列,针对录入结果列中录入失败的行数进行人工确认或者人工录入。
由此,通过RPA机器人提取并录入订单信息,效率较高且速度较快,并且,可以释放人力,降低信息录入的出错率。
与上述图1至图13实施例提供的基于AI和RPA的订单信息录入方法相对应,本公开还提供一种基于AI和RPA的订单信息录入装置,由于本公开实施例提供的基于AI和RPA的订单信息录入装置与上述图1至图13实施例提供的基于AI和RPA的订单信息录入方法相对应,因此在基于AI和RPA的订单信息录入方法的实施方式也适用于本公开实施例提供的基于AI和RPA的订单信息录入装置,在本公开实施例中不再详细描述。
图16为本公开实施例提供的一种基于AI和RPA的订单信息录入装置的结构示意图。
如图16所示,该基于AI和RPA的订单信息录入方法装置1600可以包括:处理模块1601、获取模块1602、提取模块1603以及录入模块1604。
其中,处理模块1601,用于获取电子订单,并控制RPA机器人基于OCR技术,识别并提取电子订单中的各目标属性字段。
获取模块1602,用于控制RPA机器人获取与各目标属性字段匹配的第一目标提取规则。
提取模块1603,用于控制RPA机器人根据各目标属性字段匹配的第一目标提取规则,从电子订单中提取各目标属性字段对应的目标属性值。
录入模块1604,用于控制RPA机器人将各目标属性字段与各目标属性字段对应的目标属性值,对应录入至目标文件中。
在本公开实施例的一种可能的实现方式中,获取模块1602,用于:确定电子订单的内容排版格式;控制RPA机器人获取与内容排版格式匹配的目标配置模板;其中,目标配置模板中配置有属性字段与提取规则之间的对应关系;控制RPA机器人从目标配置模板中,确定与各目标属性字段匹配的第一目标提取规则。
在本公开实施例的一种可能的实现方式中,获取模块1602,用于:控制RPA机器人查询设定配置模板,其中,设定配置模板中配置有至少一个提取规则,其中,每个提取规则包括起始关键词、截止关键词和提取方向,提取规则用于按照提取方向,提取起始关键词和截止关键词之间的属性值,并作为起始关键词对应的属性值;针对每个目标属性字段,控制RPA机器人从至少一个提取规则中,确定与目标属性字段匹配的第一目标提取规则,其中,第一目标提取规则中的起始关键词与目标属性字段匹配。
在本公开实施例的一种可能的实现方式中,获取模块1602,用于:控制RPA机器人查询设定配置模板,其中,设定配置模板中配置有至少一个提取规则,其中,每个提取规则包括设定关键词和提取方向,提取规则用于按照提取方向,提取设定关键词对应的属性值;针对每个目标属性字段,控制RPA机器人从至少一个提取规则中,确定与目标属性字段匹配的第一目标提取规则,其中,第一目标提取规则中的设定关键词与目标属性字段匹配。
在本公开实施例的一种可能的实现方式中,该基于AI和RPA的订单信息录入方法装置1600还可以包括:
识别模块,用于控制RPA机器人基于OCR技术,识别电子订单中的附加文本信息。
提取模块1603,还用于控制RPA机器人从附加文本信息提取附加属性字段以及附加属性字段对应的附加属性值。
录入模块1604,还用于控制RPA机器人将附加属性字段和附加属性字段对应的附加属性值,对应录入至目标文件中。
在本公开实施例的一种可能的实现方式中,提取模块,用于:控制RPA机器人从附加文本信息提取附加属性字段;控制RPA机器人获取与附加属性字段匹配的第二目标提取规则;控制RPA机器人根据第二目标提取规则,从附加文本信息中提取附加属性字段对应的附加属性值。
在本公开实施例的一种可能的实现方式中,录入模块1604,用于:将附加属性值进行归一化;控制RPA机器人将归一化后的附加属性值和附加属性字段,对应录入至目标文件中。
在本公开实施例的一种可能的实现方式中,该基于AI和RPA的订单信息录入方法装置1600还可以包括:
登录模块,用于控制RPA机器人登录订单系统。
录入模块1604,还用于控制RPA机器人将目标文件中的各属性字段和对应的属性值,对应录入至订单系统中。
本公开实施例的基于AI和RPA的订单信息录入装置,通过获取电子订单,并控制RPA机器人基于OCR技术,识别并提取电子订单中的各目标属性字段;控制RPA机器人获取与各目标属性字段匹配的第一目标提取规则;控制RPA机器人根据各目标属性字段匹配的第一目标提取规则,从电子订单中提取各目标属性字段对应的目标属性值;控制RPA机器人将各目标属性字段与各目标属性字段对应的目标属性值,对应录入至目标文件中。本公开中,通过RPA机器人将电子订单中的字段信息,自动录入至目标文件中,一方面,可以释放人力,节省人工成本,另一方面,还可以提升信息录入效率,并且,还可以避免人工录入易出错的情况,提升目标文件中订单信息录入的准确性。
为了实现上述实施例,本公开实施例还提出一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如前述任一方法实施例所述的基于AI和RPA的订单信息录入方法。
为了实现上述实施例,本公开实施例还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如前述任一方法实施例所述的基于AI和RPA的订单信息录入方法。
为了实现上述实施例,本公开实施例还提出一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,实现如前述任一方法实施例所述的基于AI和RPA的订单信息录入方法。
图17示出了适于用来实现本公开实施方式的示例性电子设备的框图。图17显示的电子设备12仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图17所示,电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation;以下简称:VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection;以下简称:PCI)总线。
电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图17未显示,通常称为“硬盘驱动器”)。尽管图17中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read OnlyMemory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本公开各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本公开所描述的实施例中的功能和/或方法。
电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该电子设备12交互的设备通信,和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与电子设备12的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本公开的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本公开的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本公开的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本公开各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本公开的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本公开的限制,本领域的普通技术人员在本公开的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (15)

1.一种基于人工智能AI和机器人流程自动化RPA的订单信息录入方法,包括:
获取电子订单,并控制RPA机器人基于光学字符识别OCR技术,识别并提取所述电子订单中的各目标属性字段;
控制所述RPA机器人获取与各所述目标属性字段匹配的第一目标提取规则;
控制所述RPA机器人根据各所述目标属性字段匹配的第一目标提取规则,从所述电子订单中提取各所述目标属性字段对应的目标属性值;
控制所述RPA机器人将各所述目标属性字段与所述各目标属性字段对应的目标属性值,对应录入至目标文件中。
2.根据权利要求1所述的方法,其特征在于,所述控制所述RPA机器人获取与各所述目标属性字段匹配的第一目标提取规则,包括:
确定所述电子订单的内容排版格式;
控制所述RPA机器人获取与所述内容排版格式匹配的目标配置模板;其中,所述目标配置模板中配置有属性字段与提取规则之间的对应关系;
控制所述RPA机器人从所述目标配置模板中,确定与各所述目标属性字段匹配的第一目标提取规则。
3.根据权利要求1所述的方法,其特征在于,所述控制所述RPA机器人获取与各所述目标属性字段匹配的第一目标提取规则,包括:
控制所述RPA机器人查询设定配置模板,其中,所述设定配置模板中配置有至少一个提取规则,其中,每个所述提取规则包括起始关键词、截止关键词和提取方向,所述提取规则用于按照所述提取方向,提取所述起始关键词和所述截止关键词之间的属性值,并作为所述起始关键词对应的属性值;
针对每个所述目标属性字段,控制所述RPA机器人从至少一个提取规则中,确定与所述目标属性字段匹配的第一目标提取规则,其中,所述第一目标提取规则中的起始关键词与所述目标属性字段匹配。
4.根据权利要求1所述的方法,其特征在于,所述控制所述RPA机器人获取与各所述目标属性字段匹配的第一目标提取规则,包括:
控制所述RPA机器人查询设定配置模板,其中,所述设定配置模板中配置有至少一个提取规则,其中,每个所述提取规则包括设定关键词和提取方向,所述提取规则用于按照所述提取方向,提取所述设定关键词对应的属性值;
针对每个目标属性字段,控制所述RPA机器人从至少一个提取规则中,确定与所述目标属性字段匹配的第一目标提取规则,其中,所述第一目标提取规则中的设定关键词与所述目标属性字段匹配。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
控制所述RPA机器人基于所述OCR技术,识别所述电子订单中的附加文本信息;
控制所述RPA机器人从所述附加文本信息提取附加属性字段以及所述附加属性字段对应的附加属性值;
控制所述RPA机器人将所述附加属性字段和所述附加属性字段对应的附加属性值,对应录入至所述目标文件中。
6.根据权利要求5所述的方法,其特征在于,所述控制所述RPA机器人从所述附加文本信息提取附加属性字段以及所述附加属性字段对应的附加属性值,包括:
控制所述RPA机器人从所述附加文本信息提取附加属性字段;
控制所述RPA机器人获取与所述附加属性字段匹配的第二目标提取规则;
控制所述RPA机器人根据所述第二目标提取规则,从所述附加文本信息中提取所述附加属性字段对应的附加属性值。
7.根据权利要求5所述的方法,其特征在于,所述控制所述RPA机器人将所述附加属性字段和所述附加属性字段对应的附加属性值,对应录入至所述目标文件中,包括:
将所述附加属性值进行归一化;
控制所述RPA机器人将归一化后的所述附加属性值和所述附加属性字段,对应录入至所述目标文件中。
8.根据权利要求1-7中任一项所述的方法,其特征在于,所述方法还包括:
控制所述RPA机器人登录订单系统;
控制所述RPA机器人将所述目标文件中的各属性字段和对应的属性值,对应录入至所述订单系统中。
9.一种基于人工智能AI和机器人流程自动化RPA的订单信息录入装置,包括:
处理模块,用于获取电子订单,并控制RPA机器人基于光学字符识别OCR技术,识别并提取所述电子订单中的各目标属性字段;
获取模块,用于控制所述RPA机器人获取与各所述目标属性字段匹配的第一目标提取规则;
提取模块,用于控制所述RPA机器人根据各所述目标属性字段匹配的第一目标提取规则,从所述电子订单中提取各所述目标属性字段对应的目标属性值;
录入模块,用于控制所述RPA机器人将各所述目标属性字段与所述各目标属性字段对应的目标属性值,对应录入至目标文件中。
10.根据权利要求9所述的装置,其特征在于,所述获取模块,用于:
确定所述电子订单的内容排版格式;
控制所述RPA机器人获取与所述内容排版格式匹配的目标配置模板;其中,所述目标配置模板中配置有属性字段与提取规则之间的对应关系;
控制所述RPA机器人从所述目标配置模板中,确定与各所述目标属性字段匹配的第一目标提取规则。
11.根据权利要求9所述的装置,其特征在于,所述获取模块,用于:
控制所述RPA机器人查询设定配置模板,其中,所述设定配置模板中配置有至少一个提取规则,其中,每个所述提取规则包括起始关键词、截止关键词和提取方向,所述提取规则用于按照所述提取方向,提取所述起始关键词和所述截止关键词之间的属性值,并作为所述起始关键词对应的属性值;
针对每个所述目标属性字段,控制所述RPA机器人从至少一个提取规则中,确定与所述目标属性字段匹配的第一目标提取规则,其中,所述第一目标提取规则中的起始关键词与所述目标属性字段匹配。
12.根据权利要求9所述的装置,其特征在于,所述获取模块,用于:
控制所述RPA机器人查询设定配置模板,其中,所述设定配置模板中配置有至少一个提取规则,其中,每个所述提取规则包括设定关键词和提取方向,所述提取规则用于按照所述提取方向,提取所述设定关键词对应的属性值;
针对每个目标属性字段,控制所述RPA机器人从至少一个提取规则中,确定与所述目标属性字段匹配的第一目标提取规则,其中,所述第一目标提取规则中的设定关键词与所述目标属性字段匹配。
13.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-8中任一所述的方法。
14.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-8中任一所述的方法。
15.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-8中任一项所述的方法。
CN202111423850.9A 2021-11-26 2021-11-26 基于ai和rpa的订单信息录入方法、装置、设备和介质 Pending CN114331316A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111423850.9A CN114331316A (zh) 2021-11-26 2021-11-26 基于ai和rpa的订单信息录入方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111423850.9A CN114331316A (zh) 2021-11-26 2021-11-26 基于ai和rpa的订单信息录入方法、装置、设备和介质

Publications (1)

Publication Number Publication Date
CN114331316A true CN114331316A (zh) 2022-04-12

Family

ID=81046602

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111423850.9A Pending CN114331316A (zh) 2021-11-26 2021-11-26 基于ai和rpa的订单信息录入方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN114331316A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115081417A (zh) * 2022-06-14 2022-09-20 通号城市轨道交通技术有限公司 工程数据表生成方法及装置
WO2023159771A1 (zh) * 2022-02-25 2023-08-31 来也科技(北京)有限公司 基于rpa和ai的发票处理方法、装置、设备和介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023159771A1 (zh) * 2022-02-25 2023-08-31 来也科技(北京)有限公司 基于rpa和ai的发票处理方法、装置、设备和介质
CN115081417A (zh) * 2022-06-14 2022-09-20 通号城市轨道交通技术有限公司 工程数据表生成方法及装置

Similar Documents

Publication Publication Date Title
KR102289935B1 (ko) 인공지능 기반의 법률 문서 분석 시스템 및 방법
US6874002B1 (en) System and method for normalizing a resume
US6816630B1 (en) System and method for creating and processing data forms
US11055327B2 (en) Unstructured data parsing for structured information
US20040193520A1 (en) Automated understanding and decomposition of table-structured electronic documents
CN110705952A (zh) 一种合同审核方法及装置
CN114331316A (zh) 基于ai和rpa的订单信息录入方法、装置、设备和介质
CN108305050B (zh) 报案信息及服务需求信息的提取方法、装置、设备及介质
CN110084289B (zh) 图像标注方法、装置、电子设备及存储介质
CN110909123B (zh) 一种数据提取方法、装置、终端设备及存储介质
CN112667805B (zh) 一种工单类别确定方法、装置、设备及介质
CN112926299B (zh) 一种文本比对方法、合同审阅方法、审核系统
US11341319B2 (en) Visual data mapping
CN111914729A (zh) 凭证关联方法、装置、计算机设备及存储介质
CN112364145A (zh) 一种工单处理方法、装置、电子设备及存储介质
CN115391322A (zh) 数据检核方法、装置、设备、存储介质及程序产品
JP2018063600A (ja) 情報処理装置、情報処理方法およびプログラム
CN109670183B (zh) 一种文本重要性的计算方法、装置、设备和存储介质
CN111177387A (zh) 用户名单信息处理方法、电子装置及计算机可读存储介质
WO2023159771A1 (zh) 基于rpa和ai的发票处理方法、装置、设备和介质
JP4356908B2 (ja) 財務諸表自動入力装置
CN115146064A (zh) 意图识别模型优化方法、装置、设备及存储介质
CN114049686A (zh) 签名识别模型训练方法、装置及电子设备
CN110738054B (zh) 识别邮件中酒店信息的方法、系统、电子设备及存储介质
CN114511858A (zh) 基于ai和rpa的公文文件处理方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination