CN117896232A - 一种设备运维的方法和装置 - Google Patents

一种设备运维的方法和装置 Download PDF

Info

Publication number
CN117896232A
CN117896232A CN202211255140.4A CN202211255140A CN117896232A CN 117896232 A CN117896232 A CN 117896232A CN 202211255140 A CN202211255140 A CN 202211255140A CN 117896232 A CN117896232 A CN 117896232A
Authority
CN
China
Prior art keywords
maintenance
target
scene
equipment
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211255140.4A
Other languages
English (en)
Inventor
徐维佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuzhou Online E Commerce Beijing Co ltd
Original Assignee
Wuzhou Online E Commerce Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuzhou Online E Commerce Beijing Co ltd filed Critical Wuzhou Online E Commerce Beijing Co ltd
Priority to CN202211255140.4A priority Critical patent/CN117896232A/zh
Publication of CN117896232A publication Critical patent/CN117896232A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • H04L43/045Processing captured monitoring data, e.g. for logfile generation for graphical visualisation of monitoring data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供了一种设备运维的方法和装置,所述方法包括:获取目标设备的设备数据,并根据所述设备数据,确定所述目标设备的待运维事件及所述待运维事件对应的目标运维场景;其中,所述待运维事件为需要对所述目标设备存在的故障或异常进行维护或预警的事件;调用所述目标运维场景对应的目标运维通道,生成运维策略;按照所述运维策略,对所述目标设备进行运维。通过本发明实施例,实现了分析设备故障对应的运维场景并根据运维场景来采用不同的运维策略,能够对设备故障进行及时发现、定位、分析、处理,提升了运维效率和作业稳定性。

Description

一种设备运维的方法和装置
技术领域
本发明涉及运维技术领域,特别是涉及一种设备运维的方法和装置。
背景技术
随着科学技术的发展,智能设备在生产作业中的应用日益增多,如在物流场景下,智能设备参与了物流包裹从分拣到出库的多个环节,显著提高了物流作业效率。然而,若在设备出现故障后,没有及时发现、定位、分析、处理设备故障,将会导致作业效率下降,甚至阻塞整个作业的实操链路,影响作业稳定性。
发明内容
鉴于上述问题,提出了以便提供克服上述问题或者至少部分地解决上述问题的一种设备运维的方法和装置,包括:
一种设备运维的方法,该方法包括:
获取目标设备的设备数据,并根据设备数据,确定目标设备的待运维事件及待运维事件对应的目标运维场景;其中,待运维事件为需要对目标设备存在的故障或异常进行维护或预警的事件;
调用目标运维场景对应的目标运维通道,生成运维策略;
按照运维策略,对目标设备进行运维。
可选地,运维策略包括自动化运维策略,调用目标运维场景对应的目标运维通道,生成运维策略,包括:
在目标运维场景为自动化运维场景的情况下,调用自动化运维场景对应的目标运维通道,确定待运维事件对应的多个标准运维服务;
对多个标准运维服务进行编排,得到自动化运维策略。
可选地,按照运维策略,对目标设备进行运维,包括:
根据自动化运维策略,生成运维指令;
将运维指令发送至目标设备,以对目标设备进行自动化运维。
可选地,运维策略包括工单运维策略,调用目标运维场景对应的目标运维通道,生成运维策略,包括:
在目标运维场景为工单运维场景的情况下,调用工单运维场景对应的目标运维通道,对待运维事件进行工单处理,得到工单运维策略。
可选地,运维策略包括预警运维策略,调用目标运维场景对应的目标运维通道,生成运维策略,包括:
在目标运维场景为预警运维场景的情况下,调用预警运维场景对应的目标运维通道,对待运维事件进行预警分析,得到预警运维策略。
可选地,还包括:
获取目标设备的运维数据,并根据运维数据,生成可视化数据。
可选地,目标设备为物流设备。
一种设备运维的装置,该装置包括:
目标运维场景确定模块,用于获取目标设备的设备数据,并根据设备数据,确定目标设备的待运维事件及待运维事件对应的目标运维场景;其中,待运维事件为需要对目标设备存在的故障或异常进行维护或预警的事件;
运维策略生成模块,用于调用目标运维场景对应的目标运维通道,生成运维策略;
目标设备运维模块,用于按照运维策略,对目标设备进行运维。
一种电子设备,包括处理器、存储器及存储在存储器上并能够在处理器上运行的计算机程序,计算机程序被处理器执行时实现如上的设备运维的方法。
一种计算机可读存储介质,计算机可读存储介质上存储计算机程序,计算机程序被处理器执行时实现如上的设备运维的方法。
本发明实施例具有以下优点:
在本发明实施例中,通过获取目标设备的设备数据,并根据设备数据,确定目标设备的待运维事件及待运维事件对应的目标运维场景,然后调用目标运维场景对应的目标运维通道,生成运维策略,按照运维策略,对目标设备进行运维,实现了分析设备故障对应的运维场景并根据运维场景来采用不同的运维策略,能够对设备故障进行及时发现、定位、分析、处理,提升了运维效率和作业稳定性。
附图说明
为了更清楚地说明本发明的技术方案,下面将对本发明的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的一种运维架构的示意图;
图2是本发明一实施例提供的一种设备运维的步骤流程图;
图3是本发明一实施例提供的一种物流场景下设备运维的示意图;
图4是本发明一实施例提供的另一种设备运维的方法的步骤流程图;
图5是本发明一实施例提供的另一种设备运维的方法的步骤流程图;
图6是本发明一实施例提供的另一种设备运维的方法的步骤流程图;
图7是本发明一实施例提供的一种设备运维的装置的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明实施例中,对于不同的设备故障,可以采用统一的消息通道进行数据采集,然后根据不同的运维场景执行不同的运维策略,实现场景化的分层运维,如对于不同类型的设备故障,由决策中心根据不同的运维场景,将任务分发到预警、工单、自动化运维的通道中,整个过程中无需人工介入,有效提升了运维效率和作业稳定性。
如图1,运维框架可以包括智能硬件、通道、基础能力、运维服务、数据能力这几个部分,在物流场景下,智能硬件可以包括自动化硬件,如首车、线体、小车、供包台,还可以包括高拍仪、云监控、灯条等其他硬件,智能硬件可以通过通道与运维服务端进行交互,通道可以包括基于MQTT(Message Queuing Telemetry Transport,消息队列遥测传输)协议建立的消息通道、自定义的协议栈。
对于运维服务端的基础能力,可以包括元数据管理、策略中心、服务编排,元数据管理可以设备属性(IOT设备固有的属性,如在线状态、运行状态、设备唯一ID等)、事件指令(事件即为设备端通过MQTT消息通道上报云端的消息,包括设备状态上报事件和设备异常事件等,指令即为云端通过MQTT通道下发设备端等消息,设备端应用接收消息后执行指定动作,比如清理本地存储)、规则(分层运维的规则,故障需要进入何种运维通道由规则决定)、服务(自动化运维的标准服务,绑定工作流的节点执行运维动作),策略中心可以包括场景管理(定义基础运维场景定义,预警、工单、自动化运维)、模板管理(为每种故障设置一个运维模版,模版绑定运维场景、表达式)、表达式管理(故障运维的schema定义,表明该故障在运维场景下应该如何处理,比如预警场景下,定义故障A持续3分钟产生预警,预警级别为普通,通知方式为短信,持续10分钟升级到严重,改为电话通知),服务编排可以包括动态脚本(是使用一种特定的描述性语言,依据一定的格式编写的流程脚本,系统通过解析脚本,确定运维流程该如何执行)、服务组合(不同的运维标准服务通过脚本定义的规则组合成故障处理流程服务)、回滚补偿(依据工作流执行服务时如果出现失败的情况需要执行特殊动作,回滚:取消前面已经执行成功环节,当次运维失败,补偿:重新执行失败环节,直到成功或者超过一定次数)、监控(监控编排中异常情况)。
对于运维服务端的运维服务,可以包括预警、自动化运维、工单,预警部分可以包括触发规则(预警触发的规则,如规定3分钟内设备离线超过3次开始预警)、通知渠道(预警触达设备运维人员的通道,如短信、电话)、SLA(Service Level Agreement,服务等级协议)管理(预警的风险级别,如普通、严重,对于预警一直持续超过一定时间,需要提升预警风险级别,提高处理人重视程度),自动化运维部分可以包括触发条件管理(类似上文预警触发规则,指满足一定的条件下,该故障由决策中心派往自动化运维模块处理)、流程模板管理(自动化运维对于每一种故障类型通过配置流程模版定义了故障处理的标准工作流,每一个流程节点对应一个标准的运维服务,当故障发生,云端通过执行预先定义的工作流完成故障自运维)、指令下发,工单部分可以包括派单、转交、提醒/升级、过程查询。
对于运维服务端的数据能力,可以包括运维大盘和报告分析,运维大盘部分可以包括预警大盘、设备状态大盘、作业数据大盘(故障事件和运维历史通过日志方式持久化到大数据平台,最终产出离线/实时的数据图表,用于表征当前设备稳定性水位和洞察改进运维服务),报告分析可以包括运维周报、诊断报告、优化建议。
以下对本发明实施例进行进一步说明:
参照图2,示出了本发明一实施例提供的一种设备运维的方法的步骤流程图,具体可以包括如下步骤:
步骤201,获取目标设备的设备数据,并根据设备数据,确定目标设备的待运维事件及待运维事件对应的目标运维场景;其中,待运维事件为需要对目标设备存在的故障或异常进行维护或预警的事件。
在物流场景下,目标设备可以为物流设备,该物流设备可以为智能硬件或物联网(Internet of Things,IoT)设备,智能硬件为通过软硬件结合的方式,对传统设备进行改造,进而让其拥有智能化功能,在智能化之后,硬件具备连接的能力,实现互联网服务的加载。对于目标设备,其可以部署有运维客户端,运维客户端可以采集目标设备的设备数据,然后将设备数据上报至运维服务端,其可以按照预设的时间间隔进行发送,如间隔10分钟发送一次,上报的设备数据可以包括目标设备的运行状态和异常信息。
例如,在物流场景下,运行状态可以为首车状态、小车状态、线体状态,异常信息可以为小车启动异常、断网异常、断电异常。
如图3,运维服务端可以设置有消息中心,消息中心可以设置消息处理器和消息通道,目标设备中运维客户端和运维服务端之间可以基于MQTT协议建立消息通道,运维客户端可以将设备数据经由消息通道上报至运维服务端中消息处理器。
在一示例中,运维客户端和运维服务端之间可以按照约定的协议格式进行交互,约定的协议格式可以包括消息头和消息体,消息头可以包括目标设备的ID、消息ID、消息类型,消息体可以包括消息要传达的内容,即设备数据。
在获得设备数据后,运维服务端可以对设备数据进行分析,根据设备数据的异常情况,确定目标设备的待运维事件,如设备数据中某个作业手臂A的状态为异常状态,则可以确定待运维事件为作业手臂A的状态异常。
在实际应用中,可以预先归类配置多种运维场景,如运维场景可以包括自动化运维场景、工单运维场景、预警运维场景,进而确定待运维事件对应的目标运维场景。
其中,自动化运维场景为针对有标准处理流程的待运维事件,其需要在线上采用SOP(Standard Operating Procedure,标准作业程序)运维,工单运维场景为针对需要外部技术支持的待运维事件,即需要运维工程师处理,预警运维场景为针对需要进行预警的待运维事件,即需要推送预警通知至指定用户。
如图3,运维服务端可以设置有策略中心和DB(Data Base,数据库),消息中心将设备数据发送至策略中心,策略中心可以在DB进行策略元数据查询,进而可以根据查询到的数据,确定目标运维场景。
步骤202,调用目标运维场景对应的目标运维通道,生成运维策略。
在确定目标运维场景后,则可以将运维任务分发至目标运维场景对应的目标运维通道,由目标运维通道根据设备数据生成相应的运维策略。
如图3,运维服务端可以设置有预警、工单、自动化运维三个运维通道,消息中心将设备数据发送至策略中心,策略中心经决策后可以将任务分发至运维通道。
在本发明一实施例中,运维策略可以包括自动化运维策略,步骤202,可以包括:
子步骤11,在目标运维场景为自动化运维场景的情况下,调用自动化运维场景对应的目标运维通道,确定待运维事件对应的多个标准运维服务。
在目标运维场景为自动化运维场景的情况下,即要在线上采用SOP运维,则可以调用自动化运维场景对应的目标运维通道,从多个候选标准运维服务中,确定待运维事件对应的多个标准运维服务。
子步骤12,对多个标准运维服务进行编排,得到自动化运维策略。
在确定多个标准运维服务后,可以对多个标准运维服务通过脚本化的方式进行编排,即多个标准运维服务进行排列组合,进而可以生成自动化运维策略。
例如,对于设备版本更新,采用线下运维的方式,可以包括如下操作:版本检查→由用户点击更新按钮→更新完成重启,而采用线上自动化运维的方式,可以包括以下操作:版本检查服务→云端推送更新指令→客户端上报更新完成→云端下发重启指令,将这多个标准运维服务通过脚本化的方式进行编排,达到自助处理无需人工介入。
如图3,运维服务端可以设置有编排中心,编排中心可以从DB中进行服务元数据查询,进而可以得到多个标准运维服务,然后对多个标准运维服务进行编排,进而可以生成自动化运维策略。其中,编排中心可以提供服务编排的能力,服务编排是一种通过简单的拖拉拽式流程编排以及参数配置的方式来进行服务开发的能力,并支持对已开发的服务重新进行组合编排,从而在无需代码开发的情况下提供新服务。
在本发明一实施例中,运维策略可以包括工单运维策略,步骤102,可以包括:
在目标运维场景为工单运维场景的情况下,调用工单运维场景对应的目标运维通道,对待运维事件进行工单处理,得到工单运维策略。
在目标运维场景为工单运维场景的情况下,即需要运维工程师处理,则可以调用工单运维场景对应的目标运维通道,对待运维事件进行工单处理,生成包含相应工单的工单运维策略。
在本发明一实施例中,运维策略可以包括预警运维策略,步骤102,可以包括:
在目标运维场景为预警运维场景的情况下,调用预警运维场景对应的目标运维通道,对待运维事件进行预警分析,得到预警运维策略。
在目标运维场景为预警运维场景的情况下,即需要推送预警通知至指定用户,调用预警运维场景对应的目标运维通道,根据触发时机和预警规则制定包含预警通知推送任务的预警运维策略。
步骤203,按照运维策略,对目标设备进行运维。
在生成运维策略后,可以按照运维策略,对目标设备进行相应的运维。
在本发明一实施例中,步骤203,可以包括:
子步骤21,根据自动化运维策略,生成运维指令。
在运维策略为自动化运维策略的情况下,可以直接根据自动化运维策略,生成运维指令,该运维指令可以用于控制目标设备进行运维操作。
子步骤22,将运维指令发送至目标设备,以对目标设备进行自动化运维。
在生成运维指令后,可以将运维指令下发至目标设备,目标设备在接收到运维指令后,进而可以对自身进行自动化运维。
如图3,在生成运维指令后,可以通过消息中心,经由基于MQTT协议建立的消息通道发送至目标设备,目标设备进而可以按照运维指令进行自动化运维。
在本发明一实施例中,还可以包括:
获取目标设备的运维数据,并根据运维数据,生成可视化数据。
对于目标设备,则可以获取运维数据,然后可以对运维数据进行可视化,如生成图表,进而可以向运维人员进行显示,帮助运维人员快速了解设备的运维情况。
如图3,可以从DB中查询运维数据,然后可以在数据大盘的UI界面中进行显示。
在本发明实施例中,通过获取目标设备的设备数据,并根据设备数据,确定目标设备的待运维事件及待运维事件对应的目标运维场景,然后调用目标运维场景对应的目标运维通道,生成运维策略,按照运维策略,对目标设备进行运维,实现了分析设备故障对应的运维场景并根据运维场景来采用不同的运维策略,能够对设备故障进行及时发现、定位、分析、处理,提升了运维效率和作业稳定性。
参照图4,示出了本发明一实施例提供的另一种设备运维的方法的步骤流程图,具体可以包括如下步骤:
步骤401,获取目标设备的设备数据,并根据设备数据,确定目标设备的待运维事件及待运维事件对应的目标运维场景;其中,待运维事件为需要对目标设备存在的故障或异常进行维护或预警的事件。
在物流场景下,目标设备可以为物流设备,该物流设备可以为智能硬件或物联网(Internet of Things,IoT)设备,智能硬件为通过软硬件结合的方式,对传统设备进行改造,进而让其拥有智能化功能,在智能化之后,硬件具备连接的能力,实现互联网服务的加载。对于目标设备,其可以部署有运维客户端,运维客户端可以采集目标设备的设备数据,然后将设备数据上报至运维服务端,其可以按照预设的时间间隔进行发送,如间隔10分钟发送一次,上报的设备数据可以包括目标设备的运行状态和异常信息。
例如,在物流场景下,运行状态可以为首车状态、小车状态、线体状态,异常信息可以为小车启动异常、断网异常、断电异常。
如图3,运维服务端可以设置有消息中心,消息中心可以设置消息处理器和消息通道,目标设备中运维客户端和运维服务端之间可以基于MQTT协议建立消息通道,运维客户端可以将设备数据经由消息通道上报至运维服务端中消息处理器。
在一示例中,运维客户端和运维服务端之间可以按照约定的协议格式进行交互,约定的协议格式可以包括消息头和消息体,消息头可以包括目标设备的ID、消息ID、消息类型,消息体可以包括消息要传达的内容,即设备数据。
在获得设备数据后,运维服务端可以对设备数据进行分析,根据设备数据的异常情况,确定目标设备的待运维事件,如设备数据中某个作业手臂A的状态为异常状态,则可以确定待运维事件为作业手臂A的状态异常。
在实际应用中,可以预先归类配置多种运维场景,如运维场景可以包括自动化运维场景、工单运维场景、预警运维场景,进而确定待运维事件对应的目标运维场景。
其中,自动化运维场景为针对有标准处理流程的待运维事件,其需要在线上采用SOP(Standard Operating Procedure,标准作业程序)运维,工单运维场景为针对需要外部技术支持的待运维事件,即需要运维工程师处理,预警运维场景为针对需要进行预警的待运维事件,即需要推送预警通知至指定用户。
如图3,运维服务端可以设置有策略中心和DB(Data Base,数据库),消息中心将设备数据发送至策略中心,策略中心可以在DB进行策略元数据查询,进而可以根据查询到的数据,确定目标运维场景。
步骤402,在目标运维场景为自动化运维场景的情况下,调用自动化运维场景对应的目标运维通道,确定待运维事件对应的多个标准运维服务。
在目标运维场景为自动化运维场景的情况下,即要在线上采用SOP运维,则可以调用自动化运维场景对应的目标运维通道,从多个候选标准运维服务中,确定待运维事件对应的多个标准运维服务。
步骤403,对多个标准运维服务进行编排,得到自动化运维策略。
在确定多个标准运维服务后,可以对多个标准运维服务通过脚本化的方式进行编排,即多个标准运维服务进行排列组合,进而可以生成自动化运维策略。
例如,对于设备版本更新,采用线下运维的方式,可以包括如下操作:版本检查→由用户点击更新按钮→更新完成重启,而采用线上自动化运维的方式,可以包括以下操作:版本检查服务→云端推送更新指令→客户端上报更新完成→云端下发重启指令,将这多个标准运维服务通过脚本化的方式进行编排,达到自助处理无需人工介入。
如图3,运维服务端可以设置有编排中心,编排中心可以从DB中进行服务元数据查询,进而可以得到多个标准运维服务,然后对多个标准运维服务进行编排,进而可以生成自动化运维策略。其中,编排中心可以提供服务编排的能力,服务编排是一种通过简单的拖拉拽式流程编排以及参数配置的方式来进行服务开发的能力,并支持对已开发的服务重新进行组合编排,从而在无需代码开发的情况下提供新服务。
步骤404,根据自动化运维策略,生成运维指令。
在运维策略为自动化运维策略的情况下,可以直接根据自动化运维策略,生成运维指令,该运维指令可以用于控制目标设备进行运维操作。
步骤405,将运维指令发送至目标设备,以对目标设备进行自动化运维。
在生成运维指令后,可以将运维指令下发至目标设备,目标设备在接收到运维指令后,进而可以对自身进行自动化运维。
如图3,在生成运维指令后,可以通过消息中心,经由基于MQTT协议建立的消息通道发送至目标设备,目标设备进而可以按照运维指令进行自动化运维。
在本发明实施例中,通过获取目标设备的设备数据,并根据设备数据,确定目标设备的待运维事件及待运维事件对应的目标运维场景,在目标运维场景为自动化运维场景的情况下,调用自动化运维场景对应的目标运维通道,确定待运维事件对应的多个标准运维服务,对多个标准运维服务进行编排,得到自动化运维策略,根据自动化运维策略,生成运维指令,将运维指令发送至目标设备,以对目标设备进行自动化运维,实现了在自动化运维的场景下生成运维策略,提升了运维的效率。
参照图5,示出了本发明一实施例提供的另一种设备运维的方法的步骤流程图,具体可以包括如下步骤:
步骤501,获取目标设备的设备数据,并根据设备数据,确定目标设备的待运维事件及待运维事件对应的目标运维场景;其中,待运维事件为需要对目标设备存在的故障或异常进行维护或预警的事件。
在物流场景下,目标设备可以为物流设备,该物流设备可以为智能硬件或物联网(Internet of Things,IoT)设备,智能硬件为通过软硬件结合的方式,对传统设备进行改造,进而让其拥有智能化功能,在智能化之后,硬件具备连接的能力,实现互联网服务的加载。对于目标设备,其可以部署有运维客户端,运维客户端可以采集目标设备的设备数据,然后将设备数据上报至运维服务端,其可以按照预设的时间间隔进行发送,如间隔10分钟发送一次,上报的设备数据可以包括目标设备的运行状态和异常信息。
例如,在物流场景下,运行状态可以为首车状态、小车状态、线体状态,异常信息可以为小车启动异常、断网异常、断电异常。
如图3,运维服务端可以设置有消息中心,消息中心可以设置消息处理器和消息通道,目标设备中运维客户端和运维服务端之间可以基于MQTT协议建立消息通道,运维客户端可以将设备数据经由消息通道上报至运维服务端中消息处理器。
在一示例中,运维客户端和运维服务端之间可以按照约定的协议格式进行交互,约定的协议格式可以包括消息头和消息体,消息头可以包括目标设备的ID、消息ID、消息类型,消息体可以包括消息要传达的内容,即设备数据。
在获得设备数据后,运维服务端可以对设备数据进行分析,根据设备数据的异常情况,确定目标设备的待运维事件,如设备数据中某个作业手臂A的状态为异常状态,则可以确定待运维事件为作业手臂A的状态异常。
在实际应用中,可以预先归类配置多种运维场景,如运维场景可以包括自动化运维场景、工单运维场景、预警运维场景,进而确定待运维事件对应的目标运维场景。
其中,自动化运维场景为针对有标准处理流程的待运维事件,其需要在线上采用SOP(Standard Operating Procedure,标准作业程序)运维,工单运维场景为针对需要外部技术支持的待运维事件,即需要运维工程师处理,预警运维场景为针对需要进行预警的待运维事件,即需要推送预警通知至指定用户。
如图3,运维服务端可以设置有策略中心和DB(Data Base,数据库),消息中心将设备数据发送至策略中心,策略中心可以在DB进行策略元数据查询,进而可以根据查询到的数据,确定目标运维场景。
步骤502,在目标运维场景为工单运维场景的情况下,调用工单运维场景对应的目标运维通道,对待运维事件进行工单处理,得到工单运维策略。
在目标运维场景为工单运维场景的情况下,即需要运维工程师处理,则可以调用工单运维场景对应的目标运维通道,对待运维事件进行工单处理,生成包含相应工单的工单运维策略。
步骤503,按照工单运维策略,对目标设备进行运维。
在生成运维策略后,可以按照运维策略,对目标设备进行相应的运维。
在本发明实施例中,通过获取目标设备的设备数据,并根据设备数据,确定目标设备的待运维事件及待运维事件对应的目标运维场景,在目标运维场景为工单运维场景的情况下,调用工单运维场景对应的目标运维通道,对待运维事件进行工单处理,得到工单运维策略,按照工单运维策略,对目标设备进行运维,实现了在工单运维的场景下生成运维策略,提升了运维的效率。
参照图6,示出了本发明一实施例提供的另一种设备运维的方法的步骤流程图,具体可以包括如下步骤:
步骤601,获取目标设备的设备数据,并根据设备数据,确定目标设备的待运维事件及待运维事件对应的目标运维场景;其中,待运维事件为需要对目标设备存在的故障或异常进行维护或预警的事件。
在物流场景下,目标设备可以为物流设备,该物流设备可以为智能硬件或物联网(Internet of Things,IoT)设备,智能硬件为通过软硬件结合的方式,对传统设备进行改造,进而让其拥有智能化功能,在智能化之后,硬件具备连接的能力,实现互联网服务的加载。对于目标设备,其可以部署有运维客户端,运维客户端可以采集目标设备的设备数据,然后将设备数据上报至运维服务端,其可以按照预设的时间间隔进行发送,如间隔10分钟发送一次,上报的设备数据可以包括目标设备的运行状态和异常信息。
例如,在物流场景下,运行状态可以为首车状态、小车状态、线体状态,异常信息可以为小车启动异常、断网异常、断电异常。
如图3,运维服务端可以设置有消息中心,消息中心可以设置消息处理器和消息通道,目标设备中运维客户端和运维服务端之间可以基于MQTT协议建立消息通道,运维客户端可以将设备数据经由消息通道上报至运维服务端中消息处理器。
在一示例中,运维客户端和运维服务端之间可以按照约定的协议格式进行交互,约定的协议格式可以包括消息头和消息体,消息头可以包括目标设备的ID、消息ID、消息类型,消息体可以包括消息要传达的内容,即设备数据。
在获得设备数据后,运维服务端可以对设备数据进行分析,根据设备数据的异常情况,确定目标设备的待运维事件,如设备数据中某个作业手臂A的状态为异常状态,则可以确定待运维事件为作业手臂A的状态异常。
在实际应用中,可以预先归类配置多种运维场景,如运维场景可以包括自动化运维场景、工单运维场景、预警运维场景,进而确定待运维事件对应的目标运维场景。
其中,自动化运维场景为针对有标准处理流程的待运维事件,其需要在线上采用SOP(Standard Operating Procedure,标准作业程序)运维,工单运维场景为针对需要外部技术支持的待运维事件,即需要运维工程师处理,预警运维场景为针对需要进行预警的待运维事件,即需要推送预警通知至指定用户。
如图3,运维服务端可以设置有策略中心和DB(Data Base,数据库),消息中心将设备数据发送至策略中心,策略中心可以在DB进行策略元数据查询,进而可以根据查询到的数据,确定目标运维场景。
步骤602,在目标运维场景为预警运维场景的情况下,调用预警运维场景对应的目标运维通道,对待运维事件进行预警分析,得到预警运维策略。
在目标运维场景为预警运维场景的情况下,即需要推送预警通知至指定用户,调用预警运维场景对应的目标运维通道,根据触发时机和预警规则制定包含预警通知推送任务的预警运维策略。
步骤603,按照预警运维策略,对目标设备进行运维。
在生成运维策略后,可以按照运维策略,对目标设备进行相应的运维。
在本发明实施例中,通过获取目标设备的设备数据,并根据设备数据,确定目标设备的待运维事件及待运维事件对应的目标运维场景,在目标运维场景为预警运维场景的情况下,调用预警运维场景对应的目标运维通道,对待运维事件进行预警分析,得到预警运维策略,按照预警运维策略,对目标设备进行运维,实现了在预警运维的场景下生成运维策略,提升了运维的效率。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图7,示出了本发明一实施例提供的一种设备运维的装置的结构示意图,具体可以包括如下模块:
目标运维场景确定模块701,用于获取目标设备的设备数据,并根据设备数据,确定目标设备的待运维事件及待运维事件对应的目标运维场景;其中,待运维事件为需要对目标设备存在的故障或异常进行维护或预警的事件。
运维策略生成模块702,用于调用目标运维场景对应的目标运维通道,生成运维策略。
目标设备运维模块703,用于按照运维策略,对目标设备进行运维。
在本发明一实施例中,运维策略包括自动化运维策略,运维策略生成模块702,包括:
标准运维服务确定子模块,用于在目标运维场景为自动化运维场景的情况下,调用自动化运维场景对应的目标运维通道,确定待运维事件对应的多个标准运维服务;
自动化运维策略得到子模块,用于对多个标准运维服务进行编排,得到自动化运维策略。
在本发明一实施例中,目标设备运维模块703,包括:
运维指令生成子模块,用于根据自动化运维策略,生成运维指令;
自动化运维子模块,用于将运维指令发送至目标设备,以对目标设备进行自动化运维。
在本发明一实施例中,运维策略包括工单运维策略,运维策略生成模块702,包括:
工单运维策略得到子模块,用于在目标运维场景为工单运维场景的情况下,调用工单运维场景对应的目标运维通道,对待运维事件进行工单处理,得到工单运维策略。
在本发明一实施例中,运维策略包括预警运维策略,运维策略生成模块702,包括:
预警运维策略得到子模块,用于在目标运维场景为预警运维场景的情况下,调用预警运维场景对应的目标运维通道,对待运维事件进行预警分析,得到预警运维策略。
在本发明一实施例中,还包括:
可视化数据生成模块,用于获取目标设备的运维数据,并根据运维数据,生成可视化数据。
在本发明一实施例中,目标设备为物流设备。
在本发明实施例中,通过获取目标设备的设备数据,并根据设备数据,确定目标设备的待运维事件及待运维事件对应的目标运维场景,然后调用目标运维场景对应的目标运维通道,生成运维策略,按照运维策略,对目标设备进行运维,实现了分析设备故障对应的运维场景并根据运维场景来采用不同的运维策略,能够对设备故障进行及时发现、定位、分析、处理,提升了运维效率和作业稳定性。
本发明一实施例还提供了一种电子设备,可以包括处理器、存储器及存储在存储器上并能够在处理器上运行的计算机程序,计算机程序被处理器执行时实现如上设备运维的方法。
本发明一实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储计算机程序,计算机程序被处理器执行时实现如上设备运维的方法。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对所提供的一种设备运维的方法和装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种设备运维的方法,其特征在于,所述方法包括:
获取目标设备的设备数据,并根据所述设备数据,确定所述目标设备的待运维事件及所述待运维事件对应的目标运维场景;其中,所述待运维事件为需要对所述目标设备存在的故障或异常进行维护或预警的事件;
调用所述目标运维场景对应的目标运维通道,生成运维策略;
按照所述运维策略,对所述目标设备进行运维。
2.根据权利要求1所述的方法,其特征在于,所述运维策略包括自动化运维策略,所述调用所述目标运维场景对应的目标运维通道,生成运维策略,包括:
在所述目标运维场景为自动化运维场景的情况下,调用所述自动化运维场景对应的目标运维通道,确定所述待运维事件对应的多个标准运维服务;
对所述多个标准运维服务进行编排,得到自动化运维策略。
3.根据权利要求2所述的方法,其特征在于,所述按照所述运维策略,对所述目标设备进行运维,包括:
根据所述自动化运维策略,生成运维指令;
将所述运维指令发送至所述目标设备,以对所述目标设备进行自动化运维。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述运维策略包括工单运维策略,所述调用所述目标运维场景对应的目标运维通道,生成运维策略,包括:
在所述目标运维场景为工单运维场景的情况下,调用所述工单运维场景对应的目标运维通道,对所述待运维事件进行工单处理,得到工单运维策略。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述运维策略包括预警运维策略,所述调用所述目标运维场景对应的目标运维通道,生成运维策略,包括:
在所述目标运维场景为预警运维场景的情况下,调用所述预警运维场景对应的目标运维通道,对所述待运维事件进行预警分析,得到预警运维策略。
6.根据权利要求1所述的方法,其特征在于,还包括:
获取所述目标设备的运维数据,并根据所述运维数据,生成可视化数据。
7.根据权利要求1所述的方法,其特征在于,所述目标设备为物流设备。
8.一种设备运维的装置,其特征在于,所述装置包括:
目标运维场景确定模块,用于获取目标设备的设备数据,并根据所述设备数据,确定所述目标设备的待运维事件及所述待运维事件对应的目标运维场景;其中,所述待运维事件为需要对所述目标设备存在的故障或异常进行维护或预警的事件;
运维策略生成模块,用于调用所述目标运维场景对应的目标运维通道,生成运维策略;
目标设备运维模块,用于按照所述运维策略,对所述目标设备进行运维。
9.一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的设备运维的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的设备运维的方法。
CN202211255140.4A 2022-10-13 2022-10-13 一种设备运维的方法和装置 Pending CN117896232A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211255140.4A CN117896232A (zh) 2022-10-13 2022-10-13 一种设备运维的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211255140.4A CN117896232A (zh) 2022-10-13 2022-10-13 一种设备运维的方法和装置

Publications (1)

Publication Number Publication Date
CN117896232A true CN117896232A (zh) 2024-04-16

Family

ID=90639969

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211255140.4A Pending CN117896232A (zh) 2022-10-13 2022-10-13 一种设备运维的方法和装置

Country Status (1)

Country Link
CN (1) CN117896232A (zh)

Similar Documents

Publication Publication Date Title
CN110794800B (zh) 一种智慧工厂信息管理的监控系统
CN109271602B (zh) 深度学习模型发布方法及装置
CN110166297A (zh) 运维方法、系统、设备及计算机可读存储介质
CN111427676B (zh) 一种机器人流程自动化任务处理方法及装置
US7860768B2 (en) Exception handling framework
CN108076098A (zh) 一种业务处理方法及系统
KR101416280B1 (ko) 이벤트 처리 시스템 및 방법
CN109144829A (zh) 故障处理方法、装置、计算机设备和存储介质
CN113434327A (zh) 一种故障处理系统、方法、设备和存储介质
CN110611707A (zh) 一种任务调度的方法及装置
CN111464601A (zh) 一种节点服务调度系统和方法
CN111796960A (zh) 一种机器人设备异常自动化恢复的方法及系统
CN113434323A (zh) 数据中台的任务流控制方法及相关装置
CN110717739A (zh) 工作流发布方法、装置、设备与计算机可读存储介质
CN113760634A (zh) 一种数据处理方法和装置
CN117896232A (zh) 一种设备运维的方法和装置
CN113658351A (zh) 一种产品生产的方法、装置、电子设备及存储介质
CN113179180A (zh) 一种玄武盾客户端灾难故障修复方法、装置和存储介质
CN112671555A (zh) 一种异动跟踪管控的方法及系统
CN109274533B (zh) 一种基于规则引擎的Web服务故障的定位装置和方法
CN115509714A (zh) 一种任务处理方法、装置、电子设备及存储介质
CN115934252A (zh) 一种基于Kafka实现全自动负载均衡消费消息的方法及系统
CN114302438B (zh) 网元的异常处理方法、装置、设备以及存储介质
CN106972942B (zh) 告警处理方法及系统
CN111399971A (zh) 一种网元状态解析方法、装置和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination