CN113672427A - 基于rpa及ai的异常处理方法、装置、设备及介质 - Google Patents

基于rpa及ai的异常处理方法、装置、设备及介质 Download PDF

Info

Publication number
CN113672427A
CN113672427A CN202110985919.0A CN202110985919A CN113672427A CN 113672427 A CN113672427 A CN 113672427A CN 202110985919 A CN202110985919 A CN 202110985919A CN 113672427 A CN113672427 A CN 113672427A
Authority
CN
China
Prior art keywords
abnormal
work order
maintenance work
current operation
monitored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110985919.0A
Other languages
English (en)
Inventor
程飞
汪冠春
胡一川
褚瑞
李玮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Laiye Network Technology Co Ltd
Laiye Technology Beijing Co Ltd
Original Assignee
Beijing Laiye Network Technology Co Ltd
Laiye Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Laiye Network Technology Co Ltd, Laiye Technology Beijing Co Ltd filed Critical Beijing Laiye Network Technology Co Ltd
Priority to CN202110985919.0A priority Critical patent/CN113672427A/zh
Publication of CN113672427A publication Critical patent/CN113672427A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance

Abstract

本发明实施例公开一种基于RPA及AI的异常处理方法、装置、设备及介质,该方法包括:监测已建立连接的待监测对象是否存在异常;所述待监测对象包括服务器设备和/或应用服务;当监测到所述待监测对象存在异常时,创建所述异常对应的当前运维工单;所述当前运维工单至少包括异常日志描述信息;在预先建立的知识库中检索与所述当前运维工单对应的异常响应处理方案,并将检索到的所述异常响应处理方案发送至RPA数字员工进行异常修复;所述知识库中存储有历史异常日志描述信息和对应的异常响应处理方案。通过采用上述技术方案,能够提高异常处理效率。

Description

基于RPA及AI的异常处理方法、装置、设备及介质
技术领域
本发明实施例涉及系统运维技术领域,具体而言,涉及一种基于RPA及AI的异常处理方法、装置、设备及介质。
背景技术
RPA(Robotic Process Automation,机器人流程自动化),是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
AI(Artificial Intelligence,人工智能)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
RPA具有独特的优势:低代码、非侵入。低代码是说,RPA不需要很高的IT水平就能操作,不懂编程的业务人员也能开发流程;非侵入是说,RPA可以模拟人的操作,不用软件系统开放接口。但是传统的RPA具有一定的局限性:只能基于固定的规则,并且应用场景受限。随着AI技术的不断发展,RPA与AI深度融合克服了传统RPA的局限,RPA+AI=Hand work+Head work,正在极大的改变劳动力的价值。
目前,针对机房中的服务器设备或对应的应用服务出现异常展开运维工作时,伴随着服务器应用的不断增加,运维的工作量和压力也逐渐加大。而现行处理异常的工作都是由使用服务器设备或应用服务的客户,主动发现设备或应用工作异常时,创建运维工单提交后等待管理人员处理并反馈结果。如此,若有大量的运维工单产生时,就无法及时快速响应处理。因此,人工进行异常处理费时费力,效率非常低。
发明内容
本发明实施例提供一种基于RPA及AI的异常处理方法、装置、设备及介质,用以克服人工进行异常处理费时费力,效率低下的问题。
第一方面,本发明实施提供了一种基于RPA及AI的异常处理方法,包括:
S1、监测已建立连接的待监测对象是否存在异常;所述待监测对象包括服务器设备和/或应用服务;
S2、当监测到所述待监测对象存在异常时,创建所述异常对应的当前运维工单;所述当前运维工单至少包括异常日志描述信息;
S3、在预先建立的知识库中检索与所述当前运维工单对应的异常响应处理方案,并将检索到的所述异常响应处理方案发送至RPA数字员工进行异常修复;所述知识库中存储有历史异常日志描述信息和对应的异常响应处理方案。
可选的,所述步骤S2包括:
S21、当监测到所述待监测对象存在异常时,记录所述异常对应的异常日志,并根据所述异常日志确定所述异常的异常名称和异常日志描述信息;
S22、根据预设的工单编号规则,确定所述异常的工单编号;
S23、创建至少包括所述工单编号、所述异常名称、以及所述异常日志描述信息的当前运维工单。
可选的,所述在预先建立的知识库中检索与所述当前运维工单对应的异常响应处理方案包括:
S31、提取所述当前运维工单中的关键字信息;
S32、根据所述关键字信息,并采用自然语言处理NLP中的文本分类算法,确定所述当前运维工单的重要程度等级;
S33、根据所述当前运维工单的重要程度等级,以及所有未处理运维工单的重要程度等级,确定所述当前运维工单的处理优先级;
S34、在所述处理优先级到来时,在预先建立的知识库中检索与所述当前运维工单对应的异常响应处理方案。
可选的,所述方法还包括:
S4、在所述RPA数字员工进行异常修复后,重新检测所述异常是否被正确修复;
S5、当所述异常被正确修复时,关闭所述当前运维工单;
S6、当所述异常未被正确修复时,将所述当前运维工单转派给运维人员。
可选的,所述方法还包括:
当未在所述知识库中检索到与所述当前运维工单对应的异常响应处理方案时,将所述当前运维工单转派给运维人员。
可选的,在所述步骤S1之前,所述方法还包括:
S7、配置需要监控的服务器设备的相关信息,所述相关信息包括以下至少一项:IP地址和用户名密码;
S8、配置需要监控的应用服务的系统访问链接。
第二方面,本发明实施例提供了一种基于RPA及AI的异常处理装置,包括:
异常监测模块,用于监测已建立连接的待监测对象是否存在异常;所述待监测对象包括服务器设备和/或应用服务;
工单创建模块,用于当监测到所述待监测对象存在异常时,创建所述异常对应的当前运维工单;所述当前运维工单至少包括异常日志描述信息;
异常修复模块,用于在预先建立的知识库中检索与所述当前运维工单对应的异常响应处理方案,并将检索到的所述异常响应处理方案发送至RPA数字员工进行异常修复;所述知识库中存储有历史异常日志描述信息和对应的异常响应处理方案。
可选的,所述工单创建模块包括:
信息确定子模块,用于当监测到所述待监测对象存在异常时,记录所述异常对应的异常日志,并根据所述异常日志确定所述异常的异常名称和异常日志描述信息;
编号确定子模块,用于根据预设的工单编号规则,确定所述异常的工单编号;
工单创建子模块,用于创建至少包括所述工单编号、所述异常名称、以及所述异常日志描述信息的当前运维工单。
可选的,所述异常修复模块包括:
关键字信息提取子模块,用于提取所述当前运维工单中的关键字信息;
重要程度等级确定子模块,用于根据所述关键字信息,并采用自然语言处理NLP中的文本分类算法,确定所述当前运维工单的重要程度等级;
优先级确定子模块,用于根据所述当前运维工单的重要程度等级,以及所有未处理运维工单的重要程度等级,确定所述当前运维工单的处理优先级;
处理方案检索子模块,用于在所述处理优先级到来时,在预先建立的知识库中检索与所述当前运维工单对应的异常响应处理方案。
可选的,所述装置还包括:
异常检测模块,用于在所述RPA数字员工进行异常修复后,重新检测所述异常是否被正确修复;
工单关闭模块,用于当所述异常被正确修复时,关闭所述当前运维工单;
工单流转模块,用于当所述异常未被正确修复时,将所述当前运维工单转派给运维人员。
可选的,所述装置还包括:
所述工单流转模块,还被配置为当所述异常修复模块未在所述知识库中检索到与所述当前运维工单对应的异常响应处理方案时,将所述当前运维工单转派给运维人员。
可选的,在所述步骤S1之前,所述装置还包括:
配置模块,用于配置需要监控的服务器设备的相关信息,所述相关信息包括以下至少一项:IP地址和用户名密码;配置需要监控的应用服务的系统访问链接。
第三方面,本发明实施例还提供了一种设备,所述设备包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明任意实施例所提供的基于RPA及AI的异常处理方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时执行本发明任意实施例所提供的基于RPA及AI的异常处理方法。
本发明实施例提供的技术方案,通过RPA机器人实现了自动异常处理。RPA机器人如果监测到服务器设备和应用服务中存在异常时,可以自动创建当前运维工单,并在预先建立的知识库中检索与该当前运维工单对应的异常响应处理方案,从而由RPA数字员工自动进行异常修复。相对于相关技术中人工进行异常修复的方式,通过采用本发明实施例提供的技术方案,解决了人工操作过程费时费力的问题,提升了异常修复的效率,提升了用户体验。
本发明实施例的创新点包括:
1、RPA机器人如果监测到服务器设备和应用服务中存在异常时,可以自动创建当前运维工单,并在预先建立的知识库中检索与该当前运维工单对应的异常响应处理方案,从而由RPA数字员工自动进行异常修复,解决了人工操作过程费时费力的问题,提升了异常修复的效率,提升了用户体验,是本发明实施例的创新点之一。
2、当有多个未处理运维工单时,可以基于每个运维工单中的关键字信息确定其重要程度等级,也就是说,可以对每个运维工单进行优先级排序,从而可以优先处理比较紧急的运维工单,对该运维工单对应的异常进行修复,降低各异常造成的影响,是本发明实施例的创新点之一。
3、对于不同服务器设备和应用服务运维需求的增加或减少,可以直接通过RPA+AI的配置方式,不依赖各类工单平台的接口,可直接在系统界面上操作,操作灵活方便,是本发明实施例的创新点之一。
附图说明
为了更清楚地说明本发明实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是利用自动化服务平台UiBot创建的基于RPA及AI的异常处理方法的流程截图;
图1b是创建运维工单过程的一种示意图;
图1c是已创建的运维工单示意图;
图2是本发明实施例一提供的基于RPA及AI的异常处理方法的流程图;
图3是本发明实施例二提供的基于RPA及AI的异常处理方法的流程图;
图4是本发明实施例三提供的一种基于RPA及AI的异常处理装置的结构框图;
图5是本发明实施例四提供的一种计算设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例及附图中的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了更加清楚、明白地解释本发明各实施例的内容,下面先对本发明实施例的基本工作原理进行简单介绍。
机器人流程自动化(Robotic Process Automation)简称RPA,是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。
AI(Artificial Intelligence)是人工智能的英文缩写,它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
相关的业务中,针对机房中的服务器设备或对应的应用服务出现异常展开运维工作时,伴随着服务器应用的不断增加,运维的工作量和压力也逐渐加大。而现行处理异常的工作都是由使用服务器设备或应用服务的客户,主动发现设备或应用工作异常时,创建运维工单提交后等待管理人员处理并反馈结果。如此,若有大量的运维工单产生时,就无法及时快速响应处理。并且,其中通常存在大量简单的异常工单,例如重启设备、应用等,几个指令对端口或服务进行开放或关闭即可修复。这些工单也消耗了大量的人员时间精力,同时也无法以最快的效率帮助客户解决问题。
因此,基于这种考虑,本发明实施例提出了一种基于RPA及AI的异常处理方法,实现异常自动处理,提高异常处理效率。图1a是利用自动化服务平台UiBot创建的基于RPA及AI相结合的方式进行异常处理的流程截图,该自动化服务平台是可以为RPA机器人提供AI能力的平台。本实施例中,RPA机器人会按照如图1a所示的流程进行异常处理操作。
在本实施例中,可以应用RPA+AI技术创建不同任务功能的运维虚拟数字员工,将其应用在运维工作流程的各项环节中。包括但不限于RPA运维监控预警、RPA+AI异常工单分类、RPA+AI异常响应方案检验、RPA异常自动修复、RPA修复结果通知等。
如图1a所示,其中,在运维监控预警环节,RPA机器人可以不间断的循环监控服务器设备和应用异常,比如可以7x24小时不间断地读取运维资产进行日志扫描,确定是否存在异常,其中,“7”代表7天。并且,可以根据监控频率要求增加/减少RPA的数量。在RPA+AI异常工单分类环节,当监测到存在异常时,可以创建对应的异常工单,并且可以进行工单分类。这里的分类具体指可以对工单进行重要等级分类,如可以根据工单中包括的异常日志描述信息中的关键字,对工单进行重要等级分类,其中,关键字的识别可采用NLP(NaturalLanguage Processing,自然语言处理)中的语义识别方法进行识别。从而在RPA+AI异常响应方案检验阶段,可以依据各异常工单的重要等级,依次对各异常工单进行处理。比如当存在应用服务异常类型的异常工单和服务器设备异常类型的异常工单时,可以优先处理应用服务异常类型的异常工单,处理完成后再处理服务器设备异常类型的异常工单。
在RPA+AI异常响应方案检验阶段,可以在知识库中检索异常处理方案。在RPA异常自动修复阶段,如果在知识库中检索到异常处理方案,则由虚拟员工自动尝试修复,如果没有,则流转工单至运维人员进行修复,如可以将异常工单以邮件形式发送至运维人员,由运维人员手动进行异常修复;虚拟员工自动修复之后,可以再次检测异常是否已被修复,如果修复未成功,则可以流转工单至运维人员进行修复,如可以将异常工单以邮件形式发送至运维人员,由运维人员手动进行异常修复。在RPA修复结果通知阶段,可以在虚拟员工自动修复成功后,关闭异常工单,并将修复结果通知管理人员。
如图1b所示,当需要创建运维工单时,RPA机器人可以首先在创建工单界面确定工单号、标题、问题描述(也即异常日志描述信息)、问题分类、受理者、以及优先级等信息,进而可以创建对应的工单。已创建的工单可以显示在工单列表中,如图1c所示,“机器人”分类下面的待处理工单表示需要机器人自动处理的工单;“人工”分类下面的待处理工单表示已流转至运维人员的工单,需要人工处理。
通过采用上述自动异常处理的方法,保证了异常处理的及时性,代替了人工进行异常修复时,所有的异常工单都需要等待人工查询后处理的过程,提高了异常处理的效率。
下面对本发明实施例提供基于RPA及AI的异常处理方法的具体实现过程进行详细介绍。
实施例一
图2是本发明实施例一提供的基于RPA及AI的异常处理方法的流程图,该方法基于RPA及AI的异常处理装置来执行,该装置可通过软件和/或硬件的方式实现。本实施例提供的方法可应用在自动化服务平台,例如UiBot上,该平台是可以为RPA机器人提供AI能力的平台。如图2所示,该方法包括:
S110、监测已建立连接的待监测对象是否存在异常;待监测对象包括服务器设备和/或应用服务。
在本实施例中,RPA机器人可以持续地对需要监测的服务器设备和/或应用服务进行监测。如可以设定一时间间隔,如1毫秒、3毫秒、5毫秒等,周期性地进行监测。上述时间间隔可以根据待监测对象的数量、重要程度等进行调整,本发明实施例对此不作限定。
在RPA机器人对待监测对象进行监测之前,可以首先与各待监测对象建立连接,从而RPA机器人可以获取到各待监测对象的运行数据,进而可以根据获取的运行数据确定其是否存在异常。例如,RPA机器人可以根据各待监测对象的唯一标识信息,与各待监测对象建立连接。
在一种实现方式中,可以通过本地化配置表(数据库)或相关的平台功能实现待监测对象的相应配置。具体的,可以配置需要监控的服务器设备的相关信息,相关信息包括以下至少一项:IP地址和用户名密码;并配置需要监控的应用服务的系统访问链接。
相关技术中,对于客户自行扩展的设备或应用,若需要加入运维需求,可能要与运维管理平台打通,实现托管服务。该项工作根据选择的平台不同,可能存在适配开发的工作量,配置不灵活。本实施例中,对于不同服务器设备和应用服务运维需求的增加或减少,可以直接通过RPA+AI的配置方式,不依赖各类工单平台的接口,可直接在系统界面上操作,操作灵活方便,是本发明实施例的创新点之一。
S120、当监测到待监测对象存在异常时,创建异常对应的当前运维工单;当前运维工单至少包括异常日志描述信息。
当RPA机器人监测到任一待监测对象存在异常时,表明需要对该待监测对象进行修复,这种情况下,RPA机器人可以创建该异常对应的运维工单,可以称为当前运维工单,以作为修复修复的依据。可以理解,针对不同类型的异常,通常需要采用不同的方式进行修复,因此,构建本次异常对应的当前运维工单,可以辅助RPA机器人快速准确的对本次异常进行修复。
可以理解,无论是服务器设备还是应用服务,其运行过程都会产生相应的日志,且日志中可以包括其运行相关数据。在本实施例中,生成的当前运维工单可以包括待监测对象的异常日志描述信息,以根据异常日志描述信息确定具体的异常原因等,采用对应的方式对其进行修复。其中,上述异常日志描述信息可以为服务器设备或应用服务运行产生的日志的关键信息。
在一种实现方式中,当RPA机器人监测到待监测对象存在异常时,可以首先记录异常对应的异常日志,并根据异常日志信息确定该异常的异常名称和异常日志描述信息;之后,可以根据预设的工单编号规则,确定异常的工单编号;最后,可以创建至少包括工单编号、异常名称、以及异常日志描述信息的当前运维工单。
其中,上述异常名称例如可以为服务器设备电源异常、应用服务非正常停止等。上述工单编号可以包括字符、数字等,预先设定好编号规则,如上一个工单编号为000010,下一个工单编号可以为000011,再下一个工单编号可以为000012等。上述工单编号只是示例,只要能区分出每个工单,可以将工单编号设置为别的格式,本发明实施例对此不作限定。
确定异常日志描述信息时,例如,针对获取到的日志,RPA机器人可以采用NLP中的语义识别方法对该日志进行识别,得到其中包括的关键信息,作为对应的异常日志描述信息。
S130、在预先建立的知识库中检索与当前运维工单对应的异常响应处理方案,并将检索到的异常响应处理方案发送至RPA数字员工进行异常修复;知识库中存储有历史异常日志描述信息和对应的异常响应处理方案。
在本发明实施例中,可以预先构建一知识库,其中可以存储有历史异常日志描述信息以及对应的异常响应处理方案。例如,可以在工单系统里构建一数据库,将其存储在预定位置,且其中保存有历史已知的异常信息和定位异常信息的关键词。其中,存储的各异常响应处理方案可以为程序脚本。
在进行异常处理时,当RPA机器人对当前运维工单进行处理时,可以在预先建立的知识库中检索与当前运维工单对应的异常响应处理方案,并将检索到的异常响应处理方案发送至RPA数字员工进行异常修复。例如,RPA机器人可以计算当前运维工单中包括的异常日志描述信息和知识库中存储的各历史异常日志描述信息的匹配度,并将匹配度最高的历史异常日志描述信息对应的异常响应处理方案作为当前运维工单对应的异常响应处理方案。
当检索到当前运维工单对应的异常响应处理方案后,RPA机器人将检索到的异常响应处理方案发送至RPA数字员工,RPA数字员工自动执行异常响应处理方案中的脚本即可进行异常修复。
本发明实施例提供的技术方案,通过RPA机器人实现了自动异常处理。RPA机器人如果监测到服务器设备和应用服务中存在异常时,可以自动创建当前运维工单,并在预先建立的知识库中检索与该当前运维工单对应的异常响应处理方案,从而由RPA数字员工自动进行异常修复。相对于相关技术中人工进行异常修复的方式,通过采用本发明实施例提供的技术方案,解决了人工操作过程费时费力的问题,提升了异常修复的效率,提升了用户体验。
可以理解,知识库中存储的为之前已知的异常情况以及对应的异常响应处理方案,但在实际应用中,可能产生之前未出现过的异常。例如,用户新配置了与之前性能完全不同的服务器设备,应用服务上线了全新的功能等,这种情况下,新的服务器设备或应用服务新的功能可能会产生新的异常类型,在知识库中也可能检索不到当前运维工单对应的异常响应处理方案。
作为本发明实施例的一种实施方式,为了保证异常处理的完整性,当RPA机器人未在知识库中检索到与当前运维工单对应的异常响应处理方案时,可以将当前运维工单转派给运维人员,由运维人员手动进行异常修复。例如,可以将当前运维工单以邮件形式发送至运维人员,或者,可以将当前运维工单流转至固定的文件目录下,运维人员定时查看该目录即可对其中的未处理运维工单进行处理。
针对未能在知识库中检索到异常响应处理方案的当前运维工单,将其流转至运维人员进行处理,可以保证每个运维工单都能够得到处理,从而修复所有出现的异常,保证服务器设备或应用服务正常运行,为本发明实施例的发明点之一。
在一种实现方式中,当运维人员收到流转的运维工单并对其进行处理后,可以更新知识库的内容,根据当前处理的运维工单在知识库中增加历史异常日志描述信息和对应的异常响应处理方案,如此,后续即可通过RPA机器人自动对同样的异常进行处理,提高异常处理效率,为本发明实施例的发明点之一。
作为本发明实施例的一种实施方式,在RPA数字员工进行异常修复后,RPA机器人可以重新检测异常是否被正确修复;当异常被正确修复时,可以关闭当前运维工单;当异常未被正确修复时,可以将当前运维工单转派给运维人员。如此,可以保证所有的异常均被修复,保证服务器设备或应用服务正常运行,为本发明实施例的发明点之一。
实施例二
图3是本发明实施例二提供的基于RPA及AI的异常处理方法的流程图,本实施例为RPA机器人在预先建立的知识库中检索与当前运维工单对应的异常响应处理方案的具体操作过程,如图3所示,该方法包括:
S310、提取当前运维工单中的关键字信息。
在一种实现方式中,RPA机器人可以提取当前运维工单中包括的异常日志描述信息中的关键字,作为当前运维工单中的关键字信息。其中,关键字的提取可采用NLP中的语义识别方法进行。
S320、根据关键字信息,并采用自然语言处理NLP中的文本分类算法,确定当前运维工单的重要程度等级。
例如,当根据关键字信息确定当前运维工单的异常类型为应用服务异常类型或服务器设备异常类型。并且,可以将应用服务异常类型的工单的重要程度等级确定为“紧急”,将服务器设备异常类型的工单的重要程度等级确定为“一般”等。
S330、根据当前运维工单的重要程度等级,以及所有未处理运维工单的重要程度等级,确定当前运维工单的处理优先级。
例如,可以将重要程度等级为“紧急”的工单的优先级设置为高于重要程度等级为“一般”的工单的优先级。当存在相同重要程度等级的工单时,可以根据各工单的创建时间,确定创建时间越早的工单,其优先级越高。
S340、在处理优先级到来时,在预先建立的知识库中检索与当前运维工单对应的异常响应处理方案。
当确定各运维工单的优先级后,RPA机器人可以根据各未处理运维工单的优先级,依次对各运维工单进行处理。
本实施例中,当有多个未处理运维工单时,可以基于每个运维工单中的关键字信息确定其重要程度等级,也就是说,可以对每个运维工单进行优先级排序,从而可以优先处理比较紧急的运维工单,对该运维工单对应的异常进行修复,降低各异常造成的影响
实施例三
图4是本发明实施例三提供的一种基于RPA及AI的异常处理装置的结构框图,如图4所示,该装置包括:异常监测模块410、工单创建模块420和异常修复模块430;其中,
异常监测模块410,用于监测已建立连接的待监测对象是否存在异常;所述待监测对象包括服务器设备和/或应用服务;
工单创建模块420,用于当监测到所述待监测对象存在异常时,创建所述异常对应的当前运维工单;所述当前运维工单至少包括异常日志描述信息;
异常修复模块430,用于在预先建立的知识库中检索与所述当前运维工单对应的异常响应处理方案,并将检索到的所述异常响应处理方案发送至RPA数字员工进行异常修复;所述知识库中存储有历史异常日志描述信息和对应的异常响应处理方案。
可选的,所述工单创建模块420包括:
信息确定子模块,用于当监测到所述待监测对象存在异常时,记录所述异常对应的异常日志,并根据所述异常日志确定所述异常的异常名称和异常日志描述信息;
编号确定子模块,用于根据预设的工单编号规则,确定所述异常的工单编号;
工单创建子模块,用于创建至少包括所述工单编号、所述异常名称、以及所述异常日志描述信息的当前运维工单。
可选的,所述异常修复模块430包括:
关键字信息提取子模块,用于提取所述当前运维工单中的关键字信息;
重要程度等级确定子模块,用于根据所述关键字信息,并采用自然语言处理NLP中的文本分类算法,确定所述当前运维工单的重要程度等级;
优先级确定子模块,用于根据所述当前运维工单的重要程度等级,以及所有未处理运维工单的重要程度等级,确定所述当前运维工单的处理优先级;
处理方案检索子模块,用于在所述处理优先级到来时,在预先建立的知识库中检索与所述当前运维工单对应的异常响应处理方案。
可选的,所述装置还包括:
异常检测模块,用于在所述RPA数字员工进行异常修复后,重新检测所述异常是否被正确修复;
工单关闭模块,用于当所述异常被正确修复时,关闭所述当前运维工单;
工单流转模块,用于当所述异常未被正确修复时,将所述当前运维工单转派给运维人员。
可选的,所述装置还包括:
所述工单流转模块,还被配置为当所述异常修复模块未在所述知识库中检索到与所述当前运维工单对应的异常响应处理方案时,将所述当前运维工单转派给运维人员。
可选的,在所述步骤S1之前,所述装置还包括:
配置模块,用于配置需要监控的服务器设备的相关信息,所述相关信息包括以下至少一项:IP地址和用户名密码;配置需要监控的应用服务的系统访问链接。
本发明实施例提供的技术方案,通过RPA机器人实现了自动异常处理。RPA机器人如果监测到服务器设备和应用服务中存在异常时,可以自动创建当前运维工单,并在预先建立的知识库中检索与该当前运维工单对应的异常响应处理方案,从而由RPA数字员工自动进行异常修复。相对于相关技术中人工进行异常修复的方式,通过采用本发明实施例提供的技术方案,解决了人工操作过程费时费力的问题,提升了异常修复的效率,提升了用户体验。
本发明实施例所提供的基于RPA及AI的异常处理装置可执行本发明任意实施例所提供的基于RPA及AI的异常处理方法,具备执行方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的基于RPA及AI的异常处理方法。
实施例四
请参阅图5,图5是本发明实施例四提供的一种计算设备的结构示意图。如图5所示,该计算设备可以包括:
存储有可执行程序代码的存储器701;
与存储器701耦合的处理器702;
其中,处理器702调用存储器701中存储的可执行程序代码,执行本发明任意实施例所提供的基于RPA及AI的异常处理方法。
本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行本发明任意实施例所提供的基于RPA及AI的异常处理方法。
在本发明的各种实施例中,应理解,上述各过程的序号的大小并不意味着执行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在本发明所提供的实施例中,应理解,“与A相应的B”表示B与A相关联,根据A可以确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确定B。
另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本发明的技术方案本质上或者说对相关技术做出贡献的部分或者该技术方案的全部或者部分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明的各个实施例上述方法的部分或全部步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
本领域普通技术人员可以理解:实施例中的装置中的模块可以按照实施例描述分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。

Claims (10)

1.一种基于RPA及AI的异常处理方法,其特征在于,包括:
S1、监测已建立连接的待监测对象是否存在异常;所述待监测对象包括服务器设备和/或应用服务;
S2、当监测到所述待监测对象存在异常时,创建所述异常对应的当前运维工单;所述当前运维工单至少包括异常日志描述信息;
S3、在预先建立的知识库中检索与所述当前运维工单对应的异常响应处理方案,并将检索到的所述异常响应处理方案发送至RPA数字员工进行异常修复;所述知识库中存储有历史异常日志描述信息和对应的异常响应处理方案。
2.根据权利要求1所述的方法,其特征在于,所述步骤S2包括:
S21、当监测到所述待监测对象存在异常时,记录所述异常对应的异常日志,并根据所述异常日志确定所述异常的异常名称和异常日志描述信息;
S22、根据预设的工单编号规则,确定所述异常的工单编号;
S23、创建至少包括所述工单编号、所述异常名称、以及所述异常日志描述信息的当前运维工单。
3.根据权利要求1所述的方法,其特征在于,所述在预先建立的知识库中检索与所述当前运维工单对应的异常响应处理方案包括:
S31、提取所述当前运维工单中的关键字信息;
S32、根据所述关键字信息,并采用自然语言处理NLP中的文本分类算法,确定所述当前运维工单的重要程度等级;
S33、根据所述当前运维工单的重要程度等级,以及所有未处理运维工单的重要程度等级,确定所述当前运维工单的处理优先级;
S34、在所述处理优先级到来时,在预先建立的知识库中检索与所述当前运维工单对应的异常响应处理方案。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
S4、在所述RPA数字员工进行异常修复后,重新检测所述异常是否被正确修复;
S5、当所述异常被正确修复时,关闭所述当前运维工单;
S6、当所述异常未被正确修复时,将所述当前运维工单转派给运维人员。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述方法还包括:
当未在所述知识库中检索到与所述当前运维工单对应的异常响应处理方案时,将所述当前运维工单转派给运维人员。
6.根据权利要求1-4任一项所述的方法,其特征在于,在所述步骤S1之前,所述方法还包括:
S7、配置需要监控的服务器设备的相关信息,所述相关信息包括以下至少一项:IP地址和用户名密码;
S8、配置需要监控的应用服务的系统访问链接。
7.一种基于RPA及AI的异常处理装置,其特征在于,包括:
异常监测模块,用于监测已建立连接的待监测对象是否存在异常;所述待监测对象包括服务器设备和/或应用服务;
工单创建模块,用于当监测到所述待监测对象存在异常时,创建所述异常对应的当前运维工单;所述当前运维工单至少包括异常日志描述信息;
异常修复模块,用于在预先建立的知识库中检索与所述当前运维工单对应的异常响应处理方案,并将检索到的所述异常响应处理方案发送至RPA数字员工进行异常修复;所述知识库中存储有历史异常日志描述信息和对应的异常响应处理方案。
8.根据权利要求7所述的装置,其特征在于,所述工单创建模块包括:
信息确定子模块,用于当监测到所述待监测对象存在异常时,记录所述异常对应的异常日志,并根据所述异常日志确定所述异常的异常名称和异常日志描述信息;
编号确定子模块,用于根据预设的工单编号规则,确定所述异常的工单编号;
工单创建子模块,用于创建至少包括所述工单编号、所述异常名称、以及所述异常日志描述信息的当前运维工单。
9.一种设备,其特征在于,所述设备包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行如权利要求1-6中任一所述的基于RPA及AI的异常处理方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的基于RPA及AI的异常处理方法。
CN202110985919.0A 2021-08-26 2021-08-26 基于rpa及ai的异常处理方法、装置、设备及介质 Pending CN113672427A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110985919.0A CN113672427A (zh) 2021-08-26 2021-08-26 基于rpa及ai的异常处理方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110985919.0A CN113672427A (zh) 2021-08-26 2021-08-26 基于rpa及ai的异常处理方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN113672427A true CN113672427A (zh) 2021-11-19

Family

ID=78546480

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110985919.0A Pending CN113672427A (zh) 2021-08-26 2021-08-26 基于rpa及ai的异常处理方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN113672427A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114448693A (zh) * 2022-01-24 2022-05-06 来也科技(北京)有限公司 结合rpa和ai的安全控制方法、装置、电子设备和介质
CN114995700A (zh) * 2022-06-21 2022-09-02 岭澳核电有限公司 小缺陷的点巡检方法、装置、计算机设备和存储介质
CN116090808A (zh) * 2023-03-06 2023-05-09 北京神州光大科技有限公司 一种rpa断点重建方法、装置、电子设备和介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110659173A (zh) * 2018-06-28 2020-01-07 中兴通讯股份有限公司 一种运维系统及方法
CN110703179A (zh) * 2019-09-05 2020-01-17 国网新疆电力有限公司电力科学研究院 一种基于知识库的电压电流类计量异常处理方法
CN111612174A (zh) * 2020-05-09 2020-09-01 广东电网有限责任公司 输电线路视频监控设备控制方法、系统、存储介质及计算机设备
CN111796960A (zh) * 2020-07-01 2020-10-20 中国建设银行股份有限公司 一种机器人设备异常自动化恢复的方法及系统
CN112799909A (zh) * 2021-01-26 2021-05-14 上海瀚银信息技术有限公司 一种服务器自动化管理系统及方法
CN112926756A (zh) * 2021-04-15 2021-06-08 重庆中源绿蓝环境科技有限公司 一种中央空调设备ai维修知识库应用方法
CN113254311A (zh) * 2021-05-31 2021-08-13 广州衡昊数据科技有限公司 一种分布式电源系统的监控系统和监控方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110659173A (zh) * 2018-06-28 2020-01-07 中兴通讯股份有限公司 一种运维系统及方法
CN110703179A (zh) * 2019-09-05 2020-01-17 国网新疆电力有限公司电力科学研究院 一种基于知识库的电压电流类计量异常处理方法
CN111612174A (zh) * 2020-05-09 2020-09-01 广东电网有限责任公司 输电线路视频监控设备控制方法、系统、存储介质及计算机设备
CN111796960A (zh) * 2020-07-01 2020-10-20 中国建设银行股份有限公司 一种机器人设备异常自动化恢复的方法及系统
CN112799909A (zh) * 2021-01-26 2021-05-14 上海瀚银信息技术有限公司 一种服务器自动化管理系统及方法
CN112926756A (zh) * 2021-04-15 2021-06-08 重庆中源绿蓝环境科技有限公司 一种中央空调设备ai维修知识库应用方法
CN113254311A (zh) * 2021-05-31 2021-08-13 广州衡昊数据科技有限公司 一种分布式电源系统的监控系统和监控方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114448693A (zh) * 2022-01-24 2022-05-06 来也科技(北京)有限公司 结合rpa和ai的安全控制方法、装置、电子设备和介质
CN114995700A (zh) * 2022-06-21 2022-09-02 岭澳核电有限公司 小缺陷的点巡检方法、装置、计算机设备和存储介质
CN116090808A (zh) * 2023-03-06 2023-05-09 北京神州光大科技有限公司 一种rpa断点重建方法、装置、电子设备和介质

Similar Documents

Publication Publication Date Title
CN113672427A (zh) 基于rpa及ai的异常处理方法、装置、设备及介质
CN110704231A (zh) 一种故障处理方法及装置
US20050144151A1 (en) System and method for decision analysis and resolution
US11153144B2 (en) System and method of automated fault correction in a network environment
US11704189B1 (en) System and method for autonomous data center operation and healing
CN110166297A (zh) 运维方法、系统、设备及计算机可读存储介质
JP2011076161A (ja) インシデント管理システム
US20200012990A1 (en) Systems and methods of network-based intelligent cyber-security
US20230129123A1 (en) Monitoring and Management System for Automatically Generating an Issue Prediction for a Trouble Ticket
WO2015148328A1 (en) System and method for accelerating problem diagnosis in software/hardware deployments
US20050097507A1 (en) Solution network knowledge verification
JP5942481B2 (ja) 運用作業管理システム、方法、及びプログラム
CN111865673A (zh) 一种自动化故障管理方法、装置及系统
CN110968864A (zh) 安全事件的应急响应处理方法及装置
US8090994B2 (en) System, method, and computer readable media for identifying a log file record in a log file
US20190354991A1 (en) System and method for managing service requests
CN108353086A (zh) 用于监测工业控制系统的部署确保检查
US10657199B2 (en) Calibration technique for rules used with asset monitoring in industrial process control and automation systems
CN114238474A (zh) 基于排水系统的数据处理方法、装置、设备及存储介质
JP2017054288A (ja) 遠隔保守サービスシステム
CN115495214A (zh) 一种泛it服务切片作业辅助系统及方法
CN112966056B (zh) 一种信息处理方法、装置、设备、系统及可读存储介质
CN115185792A (zh) 故障硬件处理方法、装置和系统
CN111835566A (zh) 一种系统故障管理方法、装置及系统
CN113918204A (zh) 一种元数据脚本管理方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination