CN115063122A - 用于rpa连接ai算法平台的方法及系统 - Google Patents

用于rpa连接ai算法平台的方法及系统 Download PDF

Info

Publication number
CN115063122A
CN115063122A CN202210944439.4A CN202210944439A CN115063122A CN 115063122 A CN115063122 A CN 115063122A CN 202210944439 A CN202210944439 A CN 202210944439A CN 115063122 A CN115063122 A CN 115063122A
Authority
CN
China
Prior art keywords
data
rpa
model
algorithm
annotation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210944439.4A
Other languages
English (en)
Other versions
CN115063122B (zh
Inventor
王天才
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Real Intelligence Technology Co ltd
Original Assignee
Hangzhou Real Intelligence Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Real Intelligence Technology Co ltd filed Critical Hangzhou Real Intelligence Technology Co ltd
Priority to CN202210944439.4A priority Critical patent/CN115063122B/zh
Publication of CN115063122A publication Critical patent/CN115063122A/zh
Application granted granted Critical
Publication of CN115063122B publication Critical patent/CN115063122B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/0486Drag-and-drop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/04Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
    • H04L63/0428Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Human Computer Interaction (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于RPA产品技术领域,具体涉及用于RPA连接AI算法平台的方法及系统。方法包括S1,RPA将数据根据租户ID分别存储到后端数据库中;S2,AI算法平台读取数据,并发送数据服务请求,拉取对应租户在RPA采集或上传的数据,并分类保存;S3,AI算法平台完成数据标注、RPA算法模型训练;AI算法平台加载RPA算法模型文件和启动参数,同时将服务信息存储到后端数据库并注册;S4,租户获取已发布的模型服务信息,对RPA算法模型组件进行渲染;S5,生成AI模型,并进行参数化配置;同时远程调用AI模型并输出结果。本发明具有能够实现RPA和算法平台联动,实现权限、数据和模型打通的特点。

Description

用于RPA连接AI算法平台的方法及系统
技术领域
本发明属于RPA产品技术领域,具体涉及用于RPA连接AI算法平台的方法及系统。
背景技术
随着机器学习和大数据技术的快速发展,使得其在不同的场景下得到了不同程度的应用。但是机器学习背后,涉及到了统计学、系统辨识、逼近理论、神经网络、优化理论、计算机科学、脑科学等不同领域和学科的知识,其主要通过研究计算机如何模拟或者实现人类的学习行为,以获取新的知识或则技能,重新组织已有的知识结构使之不断改善自身的性能,也是当前人工智能的核心技术。而大数据技术也涉及到数据的采集、数据预处理、分布式存储、NoSQL数据库、数据仓库、机器学习、并行计算、可视化等各种技术范畴和不同的技术层面。对于很多公司和个人来说,想在实际的业务场景中发挥出人工智能技术的价值,是一件有门槛的事情。而算法平台技术的出现正是为了解决这一问题。
算法平台的核心是模型和快速上线,用户可以根据实际的业务情景选择对应的模型类别,然后进行自定义模型训练。一般来说AI算法平台包含几个模块:数据标注、模型设计、模型训练、模型部署、模型推理等。算法平台融合了大数据和机器学习技术,将一些基础的大数据和机器学习技术进行了相关的封装,使得使用人员不需要过多的关心算法的底层实现,只需要关心具体的业务场景下如何让不同的算法可以发挥出更好的效果。
机器人流程自动化(Robotic Process Automation, 后简称RPA)是一类流程自动化的软件工具,使用者基于某个业务场景的实施逻辑将该流程操作自动化。RPA技术提供了可视化的流程编辑器,开发人员可以在流程编辑器上设计和配置出能够在企业业务系统中自动执行的流程脚本;在脚本执行过程中,则通过模拟键盘、鼠标操作、调用操作系统接口、分析网页结构等手段,来模拟人类的按钮点击、键盘输入、文件创建、网页跳转、逻辑判断等动作。目前RPA已广泛应用于金融、电商、政务、运营商、制造、医药、物流等行业领域,协助企业和工作者从枯燥重复性的劳动中解放出来。
上述两种技术平台相互结合,可以更好地赋能RPA在更多场景下的实施和流程执行,比如商品推荐需要应用AI能力。但是RPA上并没有针对此场景的定制化模型,或者需要对接第三方的商品推荐能力,或者需要单独完成模型定制开发后再整合进来,无论哪种都游离于RPA工具的能力边界之外,而且系统对接和集成也大大增加了开发的工作和成本,借助AI算法平台可以根据这部分数据进行定制化模型训练,并将其注册并发布为RPA中的一个组件,整个RPA流程能够更灵活、更直接地完成自定义模型的训练、发布和使用,自动化能力和智能化能在此无缝打通。然而据了解目前业界还没有将这两种平台结合的案例,而且少部分有的只是RPA与仅含少数预训练模型的算法平台结合,不支持对新场景定制化建模,现实业务场景复杂多样,很多需求是现有模型满足不了的,或者随着业务和数据的变化,已有的模型的准确率也会逐渐衰减,需要根据新数据不断优化模型。
现有RPA结合AI的技术,存在以下问题:
1.现有的算法平台是单纯的建模工具,不能和自动化流程工具结合起来,数据来源只能是数据库、本地文件或远端服务器资源,未能和RPA结合,对算法平台来说数据来源较为局限,没有RPA采集的数据来作为来源之一。
2.现有RPA结合AI能力大部分是基于开发者已训练好的模型,单向地调用模型去应用,缺乏对新场景自定义建模的能力和批量数据打标处理的系统。
2.1局限于预训练模型的直接调用
业界RPA现有常见的AI模型有:票据识别、卡证识别、表格识别等。用户在使用RPA组件时,可以直接调用相应的AI模型,但是这些现有模型都是基于开发者设定好的特定场景去使用的。实际生活中用户面对的场景复杂多样,现有的模型仅仅可以迎合现有场景,对于新的问题并不能提供有效的解决方案(新模型)。比如,某电商工作者需要对服装类商品评论进行分析,将RPA收集到的每一条评论数据进行定制化分类,哪些评论是反映尺寸大小不合适的,哪些评论是反映服装质量的(如爱掉毛、易褪色等),哪些评论是反映服务质量的(售前、售后服务等),哪些是反映物流(配送速度、物流服务商等)的等等。如果RPA产品的现有组件功能不支持,就需要定制化开发,像这种新的具体场景,需要用户根据RPA收集到的数据重新建立模型来解决,然而目前业界并没有一种将RPA和支持用户定制化建模的AI算法平台连接的系统和方法论。
2.2缺乏对批量数据的系统性处理平台
2.3算法平台和RPA还是相对割裂的两个系统,权限和数据之间并没有完全打通
因此,设计一种能够实现RPA和算法平台联动,实现权限、数据和模型打通的用于RPA连接AI算法平台的方法及系统,就显得十分重要。
例如,申请号为CN202111036764.2的中国专利文献描述的结合RPA和AI的低代码开发方法、装置及计算设备,方法包括:基于已登录的目标账号与AI平台建立通信连接,其中,目标账号为同时用于登录RPA平台以及AI平台的账号,AI平台内配置有印章识别模板;调用印章识别模板对带印章的待识别图像进行识别操作,显示识别操作对应的识别指令,其中,待识别图像为RPA平台的当前处理对象;接收针对识别指令发出的开发指令,并根据开发指令执行识别指令,得到印章识别结果。虽然RPA平台根据用户针对显示的识别指令发出的开发指令执行识别指令得到印章识别结果,无需用户采用源代码进行开发,减少了工作量,且未掌握源代码的人员也可进行开发,实现了低代码开发,降低了开发门槛,但是其缺点在于,其只涵盖了常见的一些CV和NLP模型(如票据识别、卡证识别、表格识别等),却无法满足用户对于一些新场景的模型需求(如商品评论分析等),不支持用户个性化建模,此外未考虑RPA中获取的数据如何反馈给模型进行迭代优化的问题。
发明内容
本发明是为了克服现有技术中,现有RPA结合AI的技术,存在无法满足用户对于一些新场景的模型需求,不支持用户个性化建模以及不支持更复杂的数据标注和系统性的模型迭代、部署和使用的问题,提供了一种能够实现RPA和算法平台联动,实现权限、数据和模型打通的用于RPA连接AI算法平台的方法及系统。
为了达到上述发明目的,本发明采用以下技术方案:
用于RPA连接AI算法平台的方法,包括如下步骤;
S1,RPA将采集到的数据或者租户上传的数据根据租户ID分别存储到后端数据库中;
S2,AI算法平台读取数据,主动向RPA后端数据库发送数据服务请求,拉取对应租户在RPA采集或上传的数据,不同数据格式以不同的方式拉取,并分类保存;
S3,AI算法平台获取到数据后,依次完成数据标注、RPA算法模型训练;租户发布RPA算法模型后,AI算法平台在模型预测服务器上加载RPA算法模型文件和启动参数,同时将服务信息存储到后端数据库并注册;
S4,租户使用RPA算法模型组件,并获取已发布的模型服务信息,根据模型服务信息中的模型地址、请求参数、返回值内容,生成Json Schema对RPA算法模型组件进行渲染;
S5,租户通过拖拽RPA算法模型组件的方式,在AI算法平台定制化生成AI模型,并利用已渲染解析好的RPA算法模型组件信息,进行参数化配置;RPA将数据传输给云脑服务,同时远程调用AI模型并输出结果。
作为优选,步骤S1中,所述数据为图片类数据或者文本类数据。
作为优选,步骤S2中,所述拉取采用批量传输的方式,且提前设定好每次拉取的最大数据量;所述传输方式采用https通信协议,用于数据加密传输。
作为优选,步骤S3中,所述数据标注包括提供图像、文本类型数据的标注服务;所述数据标注内置图像分类标注、图像框选标注、文本分类标注、实体标注和三元组标注共5种标注模版。
作为优选,所述步骤S3中的标注服务包括:
a.标注模版管理:
提供标注模板的查看和试用功能;所述标注模板对常见的AI模型所需要的训练数据的样式进行归类,针对特定的任务选择对应的标注模板进行数据的快速标注;
b.标签组管理:
提供标签组管理的功能;租户根据业务需要创建并管理一组标签;
c.标注任务管理:
提供标注任务的创建和管理功能;租户通过关联原始数据集管理中的图像和文本类型的数据创建标注任务,并对标注人员进行分配,实时查看标注情况;
d.标注任务中心管理:
使数据标注人员对被分配的标注任务进行管理和标注工作。
作为优选,步骤S5中,RPA通过Engine通讯的方式将数据传输给云脑服务,同时远程调用AI模型并输出结果。
本发明还提供了用于RPA连接AI算法平台的系统,包括;
数据存储模块,用于RPA将采集到的数据或者租户上传的数据根据租户ID分别存储到后端数据库中;
数据拉取模块,用于AI算法平台读取数据,主动向RPA后端数据库发送数据服务请求,拉取对应租户在RPA采集或上传的数据,不同数据格式以不同的方式拉取,并分类保存;
数据标注和模型训练模块,用于AI算法平台获取到数据后,依次完成数据标注、RPA算法模型训练,并在租户发布RPA算法模型后,在模型预测服务器上加载RPA算法模型文件和启动参数,同时将服务信息存储到后端数据库并注册;
模型渲染模块,用于租户使用RPA算法模型组件,并获取已发布的模型服务信息,根据模型服务信息中的模型地址、请求参数、返回值内容,生成Json Schema对RPA算法模型组件进行渲染;
AI模型生成模块,用于租户通过拖拽RPA算法模型组件的方式,在AI算法平台定制化生成AI模型,并利用已渲染解析好的RPA算法模型组件信息,进行参数化配置;
模型输出模块,用于RPA将数据传输给云脑服务,同时远程调用AI模型并输出结果。
作为优选,所述数据标注和模型训练模块包括标注服务模块;所述标注服务模块具体如下:
a.标注模版管理:
提供标注模板的查看和试用功能;所述标注模板对常见的AI模型所需要的训练数据的样式进行归类,针对特定的任务选择对应的标注模板进行数据的快速标注;
b.标签组管理:
提供标签组管理的功能;租户根据业务需要创建并管理一组标签;
c.标注任务管理:
提供标注任务的创建和管理功能;租户通过关联原始数据集管理中的图像和文本类型的数据创建标注任务,并对标注人员进行分配,实时查看标注情况;
d.标注任务中心管理:
使数据标注人员对被分配的标注任务进行管理和标注工作。
本发明与现有技术相比,有益效果是:(1)本发明给AI算法平台和AI模型提供了更丰富的数据来源,不仅可以利用本地上传的数据,也可以使用RPA采集到的数据进行AI建模,RPA实时从业务流程中采集到的数据可以在线地优化和迭代模型,从而避免模型在线上环境运行时的准确率衰减问题;(2)本发明为算法平台AI模型的落地提供了其他更便捷的方式,用户可以一键发布部署到RPA作为组件来直接调用;(3)本发明丰富了RPA的组件内容,除现有模型外,为RPA提供了更丰富的个性化模型用来使用,降低RPA的AI落地成本,并且可以利用RPA采集的数据不断自动迭代优化模型。
附图说明
图1为本发明中用于RPA连接AI算法平台的系统的一种系统功能构架图;
图2为本发明中标注模版管理的一种界面示意图;
图3为本发明中标签组管理的一种界面示意图;
图4为本发明中标注任务管理的一种界面示意图;
图5为本发明中标注任务中心管理的一种界面示意图;
图6为本发明实施例所提供的用于RPA连接AI算法平台的方法的一种流程图;
图7为本发明实施例所提供的创建标注任务的一种界面示意图;
图8为本发明实施例所提供的创建训练任务的一种界面示意图;
图9为本发明实施例所提供的模型训练时RPA前端界面的一种界面示意图。
具体实施方式
为了更清楚地说明本发明实施例,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
实施例:
如图1所示的用于RPA连接AI算法平台的方法,包括如下步骤;
S1,RPA将采集到的数据或者租户上传的数据根据租户ID分别存储到后端数据库中;
所述数据为图片类数据或者文本类数据;以图片数据为例,可以是jpg/png/bmp/jpeg格式文件,也支持格式为.zip格式的压缩包上传,压缩包内文件类型支持jpg/png/bmp/jpeg,压缩包大小限制在规定大小(如20G)以内;文本类型数据支持xls,csv,xlsx格式文件。
S2,AI算法平台读取数据,主动向RPA后端数据库发送数据服务请求,拉取对应租户在RPA采集或上传的数据,不同数据格式以不同的方式拉取,并分类保存;
拉取过程采用批量传输的方式,提前设定好每次拉取的最大数据量,避免一次拉取的数据量太大而造成传输过载。https通信协议用于数据加密传输,确保传输过程中数据不被篡改。
S3,AI算法平台获取到数据后,依次完成数据标注、RPA算法模型训练;租户发布RPA算法模型后,AI算法平台在模型预测服务器上加载RPA算法模型文件和启动参数,同时将服务信息存储到后端数据库并注册;
其中,所述数据标注包括提供图像、文本类型数据的标注服务;所述数据标注内置图像分类标注、图像框选标注、文本分类标注、实体标注和三元组标注共5种标注模版。
标注服务包括:
如图2所示,a.标注模版管理:
提供标注模板的查看和试用功能,便于租户上手体验每个标注模版下标注相关的操作;所述标注模板对常见的AI模型所需要的训练数据的样式进行归类,针对特定的任务选择对应的标注模板进行数据的快速标注;
如图3所示,b.标签组管理:
提供标签组管理的功能;租户根据业务需要创建并管理一组标签。标签组管理实现一组标签的管理功能,针对某一特定的任务或者问题创建一组标签,便于后面标注任务的统一调用。
图3中,为保护具体技术隐私,标签组名称和更新时间作马赛克处理。
如图4所示,c.标注任务管理:
提供标注任务的创建和管理功能;租户通过关联原始数据集管理中的图像和文本类型的数据创建标注任务,并对标注人员进行分配,实时查看标注情况。标注任务管理面向的是分配标注任务的人员,比如管理者可以将标注任务分派给指定人员(或群组),也可结合人员画像如技能、空闲情况等进行自动分派标注任务。
图4中,为保护具体技术隐私,标注任务名称和创建时间作马赛克处理。
如图5所示,d.标注任务中心管理:
使数据标注人员对被分配的标注任务进行管理和标注工作。标注操作的主要模块,标注中心面向的租户是数据标注人员。
该算法平台提供依据租户拖拽算法组件形成的模型训练体系,自动解析并执行对应的操作任务。依次完成数据标注、模型训练等系列操作后,租户一键发布模型后,算法平台在模型预测服务器上加载模型文件和启动参数,并通过flask生成常驻的http服务以便后面调用,并将服务信息存储到数据库,将服务元信息如服务地址,请求参数,返回值等注册到sop。比如在文本分类任务,输入是文本内容(如服装商品评论文本),输出是对应的标签(如尺寸不合适),都是以json的方式进行传输。
S4,租户使用RPA算法模型组件,首先从sop并获取已发布的模型服务信息,根据模型服务信息中的模型地址、请求参数、返回值内容,生成Json Schema对RPA算法模型组件进行渲染,即解析到RPA可视化架构组成中;
S5,租户通过拖拽RPA算法模型组件的方式,在AI算法平台定制化生成AI模型,并利用已渲染解析好的RPA算法模型组件信息,进行参数化配置;RPA通过Engine通讯的方式将数据传输给云脑服务,同时远程调用AI模型并输出结果。
对于同一个租户账号,在RPA和AI算法平台上的“数据”达到了互通效果,这里的数据不仅包含结构化数据、非结构化数据等数据信息,还包含了标注结果、模型文件等结果文件。
图5中,为保护具体技术隐私,标注任务名称和创建时间作马赛克处理。
本发明还提供了用于RPA连接AI算法平台的系统,包括;
数据存储模块,用于RPA将采集到的数据或者租户上传的数据根据租户ID分别存储到后端数据库中;
数据拉取模块,用于AI算法平台读取数据,主动向RPA后端数据库发送数据服务请求,拉取对应租户在RPA采集或上传的数据,不同数据格式以不同的方式拉取,并分类保存;
数据标注和模型训练模块,用于AI算法平台获取到数据后,依次完成数据标注、RPA算法模型训练,并在租户发布RPA算法模型后,在模型预测服务器上加载RPA算法模型文件和启动参数,同时将服务信息存储到后端数据库并注册;
模型渲染模块,用于租户使用RPA算法模型组件,并获取已发布的模型服务信息,根据模型服务信息中的模型地址、请求参数、返回值内容,生成Json Schema对RPA算法模型组件进行渲染;
AI模型生成模块,用于租户通过拖拽RPA算法模型组件的方式,在AI算法平台定制化生成AI模型,并利用已渲染解析好的RPA算法模型组件信息,进行参数化配置;
模型输出模块,用于RPA将数据传输给云脑服务,同时远程调用AI模型并输出结果。
进一步的,所述数据标注和模型训练模块包括标注服务模块;所述标注服务模块具体如下:
a.标注模版管理:
提供标注模板的查看和试用功能;所述标注模板对常见的AI模型所需要的训练数据的样式进行归类,针对特定的任务选择对应的标注模板进行数据的快速标注;
b.标签组管理:
提供标签组管理的功能;租户根据业务需要创建并管理一组标签;
c.标注任务管理:
提供标注任务的创建和管理功能;租户通过关联原始数据集管理中的图像和文本类型的数据创建标注任务,并对标注人员进行分配,实时查看标注情况;
d.标注任务中心管理:
使数据标注人员对被分配的标注任务进行管理和标注工作。
基于本发明的技术方案,以如下RPA将客户留言文本内容传输到算法平台,联动算法平台训练部署一个客户满意度评判模型为例,该过程涉及到的主要页面以及具体的实施流程如下所示,其中具体流程如图6所示:
1.租户从RPA中进入到算法平台web页面。此时算法平台是可以获取到训练数据,并从RPA后端数据系统拉取数据,此次任务涉及到的数据是RPA抓取到的批量数据文件(用户留言文本内容)。
2.创建标注任务,对拉取到的数据选择需要的标注方式进行标注。用户的留言内容属于文本类数据,并且是分类任务,故建立标注任务并选择“文本分类标注”,执行后续标注作业,具体如图7所示。
3.创建训练任务,拖拽所需的算法组件并配置训练信息,最终形成模型训练流程。传统的机器学习需要用户逐步完成数据处理与清洗、特征工程、模型训练、推理预测等步骤的相关代码,而本算法平台只需将需要的算法组件通过简单的拖拽动作组合在一起,形成自定义建模流程结构,算法平台会通过解析代码自动解析该自定义结构,将其处理成便于在计算机内部能够存储、传输、读取的json结构。其中,每个组件对应一个节点,每个节点对应一个动作,运行到某一个节点时将会执行其对应的脚本,并将数据储存在相应数据库。当一个组件节点执行完毕后会执行下一个节点,直到节点执行结束,具体如图8所示。
4.训练开始时,训练模块将会前面标注好的数据读取过来,其中文本类的数据可以是xls/csv/xlsx格式文件,如果训练过程中报错了会显示训练错误并终止训练任务,用户可以根据提示信息对过程进行修正。训练结束后模型文件存储在算法平台数据库,平台预测服务器加载模型文件和配置参数通过flask形成常驻的http服务,并将服务信息列表注册到sop,RPA从sop获取这些服务信息生成Json Schema,将模型服务信息反馈到RPA,在RPA中进行模型服务信息的解析和渲染,目的是构造成RPA组件所需要的格式,形成RPA组件。模型组件在执行时通过Engine通讯的方式将数据传输给云脑服务,从而远程调用模型。RPA前端界面如图9所示。
其中,Json Schema为JSON模式,是描述JSON数据格式,用于实例验证。
图9中,为保护具体技术隐私,对需要处理的文件的具体名称作马赛克处理。
本发明提出了一种用于RPA连接AI算法平台的方法及系统,根据租户ID将数据存储到RPA后端数据库,算法平台通过发送请求从数据系统获取数据,经过自动化解析训练流程后建模、保存数据信息,并注册到sop,RPA获取服务信息列表后,最后解析封装成RPA组件在RPA设计器平台呈现,这时租户即可通过拖拽RPA组件的方式运用其在算法平台定制化生成的AI模型。这种快速部署自定义AI模型到自己的RPA业务当中的方式,可以降本增效,满足租户更广泛的需求。
本发明的创新点如下:
1.本发明创新性地提出一种RPA软件连接AI算法平台的方法和系统,通过WebComponents技术使得AI算法平台可以无缝集成到RPA中,实现权限、数据和模型的打通;RPA采集到的数据可以通过RPA后端数据平台以Https网络传输的方式被算法平台调用,并且模型的训练、推理、部署过程可视化、拖拉拽实现;
2.本发明算法平台产生的模型可以通过页面点击一键部署并发布算法平台,并将模型服务信息注册到sop,在RPA平台中封装成组件,省去了运维部署和编写服务请求代码的步骤并支持模型迭代优化及热更新。
以上所述仅是对本发明的优选实施例及原理进行了详细说明,对本领域的普通技术人员而言,依据本发明提供的思想,在具体实施方式上会有改变之处,而这些改变也应视为本发明的保护范围。

Claims (8)

1.用于RPA连接AI算法平台的方法,其特征在于,包括如下步骤;
S1,RPA将采集到的数据或者租户上传的数据根据租户ID分别存储到后端数据库中;
S2,AI算法平台读取数据,主动向RPA后端数据库发送数据服务请求,拉取对应租户在RPA采集或上传的数据,不同数据格式以不同的方式拉取,并分类保存;
S3,AI算法平台获取到数据后,依次完成数据标注、RPA算法模型训练;租户发布RPA算法模型后,AI算法平台在模型预测服务器上加载RPA算法模型文件和启动参数,同时将服务信息存储到后端数据库并注册;
S4,租户使用RPA算法模型组件,并获取已发布的模型服务信息,根据模型服务信息中的模型地址、请求参数、返回值内容,生成Json Schema对RPA算法模型组件进行渲染;
S5,租户通过拖拽RPA算法模型组件的方式,在AI算法平台定制化生成AI模型,并利用已渲染解析好的RPA算法模型组件信息,进行参数化配置;RPA将数据传输给云脑服务,同时远程调用AI模型并输出结果。
2.根据权利要求1所述的用于RPA连接AI算法平台的方法,其特征在于,步骤S1中,所述数据为图片类数据或者文本类数据。
3.根据权利要求1所述的用于RPA连接AI算法平台的方法,其特征在于,步骤S2中,所述拉取采用批量传输的方式,且提前设定好每次拉取的最大数据量;所述传输方式采用https通信协议,用于数据加密传输。
4.根据权利要求1所述的用于RPA连接AI算法平台的方法,其特征在于,步骤S3中,所述数据标注包括提供图像、文本类型数据的标注服务;所述数据标注内置图像分类标注、图像框选标注、文本分类标注、实体标注和三元组标注共5种标注模版。
5.根据权利要求4所述的用于RPA连接AI算法平台的方法,其特征在于,所述步骤S3中的标注服务包括:
a.标注模版管理:
提供标注模板的查看和试用功能;所述标注模板对常见的AI模型所需要的训练数据的样式进行归类,针对特定的任务选择对应的标注模板进行数据的快速标注;
b.标签组管理:
提供标签组管理的功能;租户根据业务需要创建并管理一组标签;
c.标注任务管理:
提供标注任务的创建和管理功能;租户通过关联原始数据集管理中的图像和文本类型的数据创建标注任务,并对标注人员进行分配,实时查看标注情况;
d.标注任务中心管理:
使数据标注人员对被分配的标注任务进行管理和标注工作。
6.根据权利要求1所述的用于RPA连接AI算法平台的方法,其特征在于,步骤S5中,RPA通过Engine通讯的方式将数据传输给云脑服务,同时远程调用AI模型并输出结果。
7.用于RPA连接AI算法平台的系统,其特征在于,包括;
数据存储模块,用于RPA将采集到的数据或者租户上传的数据根据租户ID分别存储到后端数据库中;
数据拉取模块,用于AI算法平台读取数据,主动向RPA后端数据库发送数据服务请求,拉取对应租户在RPA采集或上传的数据,不同数据格式以不同的方式拉取,并分类保存;
数据标注和模型训练模块,用于AI算法平台获取到数据后,依次完成数据标注、RPA算法模型训练,并在租户发布RPA算法模型后,在模型预测服务器上加载RPA算法模型文件和启动参数,同时将服务信息存储到后端数据库并注册;
模型渲染模块,用于租户使用RPA算法模型组件,并获取已发布的模型服务信息,根据模型服务信息中的模型地址、请求参数、返回值内容,生成Json Schema对RPA算法模型组件进行渲染;
AI模型生成模块,用于租户通过拖拽RPA算法模型组件的方式,在AI算法平台定制化生成AI模型,并利用已渲染解析好的RPA算法模型组件信息,进行参数化配置;
模型输出模块,用于RPA将数据传输给云脑服务,同时远程调用AI模型并输出结果。
8.根据权利要求7所述的用于RPA连接AI算法平台的系统,其特征在于,所述数据标注和模型训练模块包括标注服务模块;所述标注服务模块具体如下:
a.标注模版管理:
提供标注模板的查看和试用功能;所述标注模板对常见的AI模型所需要的训练数据的样式进行归类,针对特定的任务选择对应的标注模板进行数据的快速标注;
b.标签组管理:
提供标签组管理的功能;租户根据业务需要创建并管理一组标签;
c.标注任务管理:
提供标注任务的创建和管理功能;租户通过关联原始数据集管理中的图像和文本类型的数据创建标注任务,并对标注人员进行分配,实时查看标注情况;
d.标注任务中心管理:
使数据标注人员对被分配的标注任务进行管理和标注工作。
CN202210944439.4A 2022-08-08 2022-08-08 用于rpa连接ai算法平台的方法及系统 Active CN115063122B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210944439.4A CN115063122B (zh) 2022-08-08 2022-08-08 用于rpa连接ai算法平台的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210944439.4A CN115063122B (zh) 2022-08-08 2022-08-08 用于rpa连接ai算法平台的方法及系统

Publications (2)

Publication Number Publication Date
CN115063122A true CN115063122A (zh) 2022-09-16
CN115063122B CN115063122B (zh) 2022-11-11

Family

ID=83207908

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210944439.4A Active CN115063122B (zh) 2022-08-08 2022-08-08 用于rpa连接ai算法平台的方法及系统

Country Status (1)

Country Link
CN (1) CN115063122B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200074329A1 (en) * 2018-08-29 2020-03-05 Accenture Global Solutions Limited Intelligent adaptor service in unified automation platforms for robotic process automation
US20200134374A1 (en) * 2019-12-20 2020-04-30 UiPath, Inc. Dynamic artificial intelligence / machine learning model update, or retrain and update, in digital processes at runtime
CN112260877A (zh) * 2020-06-30 2021-01-22 北京来也网络科技有限公司 基于ai的rpa机器人管理方法、平台及存储介质
US20210107141A1 (en) * 2019-10-15 2021-04-15 UiPath, Inc. Integration of heterogeneous models into robotic process automation workflows
CN113626024A (zh) * 2021-09-06 2021-11-09 北京来也网络科技有限公司 结合rpa和ai的低代码开发方法、装置及计算设备
CN113706099A (zh) * 2021-08-23 2021-11-26 中国电子科技集团公司第二十八研究所 一种数据标注、深度学习模型训练和服务发布系统
CN113760464A (zh) * 2021-09-14 2021-12-07 中化现代农业有限公司 一种基于深度学习的人工智能模型开发平台
US20220114044A1 (en) * 2020-10-14 2022-04-14 UiPath, Inc. Anomaly detection and self-healing for robotic process automation via artifical intelligence / machine learning

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200074329A1 (en) * 2018-08-29 2020-03-05 Accenture Global Solutions Limited Intelligent adaptor service in unified automation platforms for robotic process automation
US20210107141A1 (en) * 2019-10-15 2021-04-15 UiPath, Inc. Integration of heterogeneous models into robotic process automation workflows
US20200134374A1 (en) * 2019-12-20 2020-04-30 UiPath, Inc. Dynamic artificial intelligence / machine learning model update, or retrain and update, in digital processes at runtime
CN112260877A (zh) * 2020-06-30 2021-01-22 北京来也网络科技有限公司 基于ai的rpa机器人管理方法、平台及存储介质
US20220114044A1 (en) * 2020-10-14 2022-04-14 UiPath, Inc. Anomaly detection and self-healing for robotic process automation via artifical intelligence / machine learning
CN113706099A (zh) * 2021-08-23 2021-11-26 中国电子科技集团公司第二十八研究所 一种数据标注、深度学习模型训练和服务发布系统
CN113626024A (zh) * 2021-09-06 2021-11-09 北京来也网络科技有限公司 结合rpa和ai的低代码开发方法、装置及计算设备
CN113760464A (zh) * 2021-09-14 2021-12-07 中化现代农业有限公司 一种基于深度学习的人工智能模型开发平台

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
葛巍等: "RPA技术在电网企业财务管理数字化转型中的应用实践", 《管理会计研究》 *

Also Published As

Publication number Publication date
CN115063122B (zh) 2022-11-11

Similar Documents

Publication Publication Date Title
US20210004642A1 (en) Ai capability research and development platform and data processing method
US11645548B1 (en) Automated cloud data and technology solution delivery using machine learning and artificial intelligence modeling
CN109344170B (zh) 流数据处理方法、系统、电子设备及可读存储介质
CN113760464A (zh) 一种基于深度学习的人工智能模型开发平台
CN114331512B (zh) 一种可视化数据建模及大数据画像的方法
Lendermann et al. Distributed supply chain simulation as a decision support tool for the semiconductor industry
de Gea et al. Requirements engineering tools: An evaluation
CN111695443A (zh) 智能交通人工智能开放平台、方法、介质及电子设备
CN112085078A (zh) 图像分类模型生成系统、方法、装置和计算机设备
CN114594927A (zh) 低代码开发方法、装置、系统、服务器及存储介质
CN114218052A (zh) 一种业务交互图生成方法、装置、设备及存储介质
Kovacs et al. A process model for enhancing digital assistance in knowledge-based maintenance
Seitz et al. Augmenting the industrial internet of things with emojis
CN115202639A (zh) 基于自定义模块的代码生成方法、装置、设备及存储介质
CN112085019A (zh) 字符识别模型生成系统、方法、装置和计算机设备
CN115063122B (zh) 用于rpa连接ai算法平台的方法及系统
CN117407705A (zh) 模型训练方法及一站式模型训练平台
CN117171471A (zh) 基于Ray和Spark的可视化大数据机器学习系统及方法
CN111506305A (zh) 工具包生成方法、装置、计算机设备及可读存储介质
US20230117893A1 (en) Machine learning techniques for environmental discovery, environmental validation, and automated knowledge repository generation
Duda et al. Concept of PLM application integration with VR and AR techniques
CN115330200A (zh) 用于运营人工智能模型的装置、系统及方法
KR102355787B1 (ko) 화면 요구사항 수집 및 절차 관리 방법
CN115035044A (zh) 一种应用于工业质检的智能ai平台
CN110766163A (zh) 用于实施机器学习过程的系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant