CN111800299A - 一种边缘云的运营维护系统及其方法 - Google Patents
一种边缘云的运营维护系统及其方法 Download PDFInfo
- Publication number
- CN111800299A CN111800299A CN202010651022.XA CN202010651022A CN111800299A CN 111800299 A CN111800299 A CN 111800299A CN 202010651022 A CN202010651022 A CN 202010651022A CN 111800299 A CN111800299 A CN 111800299A
- Authority
- CN
- China
- Prior art keywords
- diagnosis
- unit
- fault
- edge cloud
- treatment library
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012423 maintenance Methods 0.000 title claims abstract description 74
- 238000000034 method Methods 0.000 title claims description 19
- 238000003745 diagnosis Methods 0.000 claims abstract description 164
- 230000008439 repair process Effects 0.000 claims abstract description 141
- 230000001360 synchronised effect Effects 0.000 claims abstract description 8
- 238000004458 analytical method Methods 0.000 claims description 62
- 238000012544 monitoring process Methods 0.000 claims description 14
- 238000007689 inspection Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 5
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000009434 installation Methods 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
Abstract
本发明提供了一种边缘云的运营维护系统,包边缘云和中心云,边缘云包括运维服务中心、计算节点和虚拟机,运维服务中心包括第一诊疗库;运维服务中心用于获取计算节点和虚拟机的数据,并对数据进行故障分析,并判断故障对应的修复方案是否在第一诊疗库;中心云,包括第二诊疗库;中心云接收边缘云上传的故障后,在第二诊疗库中查找故障对应的匹配特征,将匹配特征对应的修复方案同步至所述第一诊疗库,本发明还公开了一种边缘云的运营维护方法,本发明实现了边缘云能够自动处理日常故障,自动累积较为全面的运维处理方法,无需频繁升级,为持续运营提供了保障,降低人工运维成本,同时提高了工作效率。
Description
技术领域
本发明属于边缘云维护技术领域,具体涉及一种边缘云的运营维护系统及其方法。
背景技术
边缘云是一种在网络边缘或靠近用户接入点侧部署云计算能力的平台,是边缘计算的重要组成部分。边缘计算是相对于中心云计算而言的,与传统的云计算中心化思维不同,其主要计算节点及应用分布式部署在看见终端设备的数据中心或者物理设备上,数据不用传输到云端完成处理,在边缘端上就可以完成实时数据分析和智能化处理,使得服务的响应性能、可靠性都高于中心化的云计算。总体来说边缘计算具有低时延、高带宽、安全性等特征,在5G和工业互联网领域,对边缘计算的需求更加迫切。
边缘云相对于中心云来说具有大规模、异构设施、网络不可靠或有限的带宽、无人值守的特点,需要满足对边缘基础设施的管理,包含对虚拟机及裸金属资源池的管理及统一调度。由于边缘云的特征,首先是大规模的特征,每个边缘站点都需要安装部署边缘云平台,需要大量的重复人力物力满足此项需求;其次无人值守,在边缘云平台需要实施更新或安装补丁时,当前传统的模式需要手动远程登录站点服务器进行更新,在某些场景下无法满足批量操作及自动化的需求。在某些平台上,部署过程包括角色规划、操作系统安装、平台安装、平台配置、功能测试等步骤,其中平台安装及配置工作耗时较长,并且组件间依赖关系较为复杂,总体安装可能需要数周或数月,并且部署过程无法批量复制应用到其它平台。然而对于快速变化的边缘环境来说,例如电信企业或者工业需要的是能够快速启动创新服务的平台,任何低效率的操作会对企业造成不可估量的损失。边缘站点地理位置分散、边缘架构千差万别,如何构造尽可能自动化并且可重复的平台安装和调试,尽可能消除人工干预,打造可扩展、可自动升级维护的边缘云平台,降低人力成本,是当前亟待解决的重要问题。
发明内容
为了解决上述问题,本发明的第一目的在于,提供了一种边缘云的运营维护系统,实现了边缘云能够自动处理日常故障,自动累积较为全面的运维处理方法,降低人工运维成本,同时提高了工作效率。
为实现上述目的,本发明按照以下技术方案予以实现:
一种边缘云的运营维护系统,包括:
边缘云,包括运维服务中心、计算节点和虚拟机,所述运维服务中心包括第一诊疗库;所述运维服务中心用于获取所述计算节点和所述虚拟机的数据,并对所述数据进行故障分析,并用于判断所述故障对应的修复方案是否在所述第一诊疗库;
中心云,包括第二诊疗库;所述中心云接收所述边缘云上传的所述故障后,在所述第二诊疗库中查找所述故障对应的匹配特征,将所述匹配特征对应的修复方案同步至所述第一诊疗库。
进一步的,所述运维服务中心还包括监测单元、分析单元;
所述监测单元对所述计算节点和所述虚拟机进行检查,并把检查得到的数据发送至所述分析单元,所述分析单元对所述数据进行故障分析,得到故障数据。
进一步的,所述分析单元把所述故障数据的序列化成有特定格式的匹配特征,并根据所述匹配特征的排列组合在所述第一诊疗库中查找对应的修复方案。
进一步的,所述运维服务中心还包括上报单元;
若所述分析单元在所述第一诊疗库可以找到所述对应的修复方案,则所述边缘云根据所述修复方案对故障进行修复;
若所述分析单元在所述第一诊疗库没有找到所述对应的修复方案,则所述上报单元将所述故障数据上传至所述中心云。
进一步的,所述边缘云还包括修复单元、第一执行单元;
所述分析单元将所述修复方案发送至所述修复单元,所述修复单元生成对应的命令脚本,并发送至所述第一执行单元,所述第一执行单元执行所述命令脚本以修复故障。
进一步的,所述中心云还包括收集单元、匹配单元;
所述收集单元接收所述上报单元上传的所述故障数据,并发送至所述匹配单元,所述匹配单元确认所述第二诊疗库中是否存在所述故障数据对应的修复方案。
进一步的,所述中心云还包括命令单元,若所述匹配单元在所述第二诊疗库可以找到所述修复方案,则所述命令单元下发同步指令,将所述修复方案同步至所述第一诊疗库。
进一步的,所述中心云还包括诊断单元,若所述匹配单元在所述第二诊疗库没有找到所述修复方案,则所述诊断单元对所述故障数据进行诊断,并把得到的修复方案更新至所述第二诊疗库。
进一步的,所述运维服务中心还包括指令接收单元和第二执行单元;
所述诊断单元对所述指令接收单元发送诊断指令,所述第二执行单元执行所述诊断指令,对所述边缘云进行查看和定位故障,并将得到的故障通过所述指令接收单元反馈至所述诊断单元,所述诊断单元分析所述故障并得到相应的修复方案,将所述修复方案更新至所述第二诊疗库和同步至所述第一诊疗库。
本发明的第二目的在于,提供了一种边缘云的运营维护方法,解决了无需人员到达现场进行维修的问题,减少企业损失。
为实现上述目的,本发明按照以下技术方案予以实现:
获取边缘云的计算节点和虚拟机的数据,并对所述数据进行故障分析;
判断所述故障对应的修复方案是否在边缘云的第一诊疗库;
上传所述故障至中心云,并在所述中心云的第二诊疗库查找所述故障对应的匹配特征,将所述匹配特征对应的修复方案同步至所述第一诊疗库。
进一步的,所述获取边缘云的计算节点和虚拟机的数据,并对所述数据进行故障分析的步骤包括以下具体步骤:
所述边缘云的运维服务中心包括监测单元、分析单元;
所述监测单元对所述计算节点和所述虚拟机进行检查,并把检查得到的数据发送至所述分析单元,所述分析单元对所述数据进行故障分析。
进一步的,所述运维服务中心判断所述故障对应的修复方案是否在第一诊疗库的步骤包括以下具体步骤:
所述分析单元把分析得到的故障数据的序列化成有特定格式的匹配特征;
根据所述匹配特征的排列组合在所述第一诊疗库中查找对应的修复方案。
进一步的,若所述第一诊疗库存在所述对应的修复方案,则所述边缘云利用所述修复方案进行故障修复;若所述第一诊疗库不存在所述对应的修复方案,则所述上报单元将所述故障数据上传至所述中心云。
进一步的,所述中心云接收所述边缘云上传的所述故障的步骤包括以下具体步骤:
所述边缘云还包括修复单元和第一执行单元;
将所述修复方案发送至所述修复单元;
生成对应的命令脚本,并发送至所述第一执行单元;
执行所述命令脚本以修复故障。
进一步的,所述中心云的第二诊疗库查找所述故障对应的匹配特征,将所述匹配特征对应的修复方案同步至所述第一诊疗库的步骤包括以下具体步骤:
所述中心云还包括收集单元、匹配单元;
所述收集单元接收所述上报单元上传的所述故障数据,并发送至所述匹配单元;
所述匹配单元确认所述第二诊疗库中是否存在所述故障数据对应的修复方案。
进一步的,所述中心云还包括命令单元,若所述第二诊疗库存在所述匹配特征,则所述命令单元下发同步指令,将所述匹配特征对应的修复方案同步至所述第一诊疗库。
进一步的,所述中心云还包括诊断单元,若所述第二诊疗库不存在所述对应的修复方案,则所述诊断单元对所述故障数据进行诊断,并把得到的修复方案更新至所述第二诊疗库。
进一步的,所述诊断单元对所述故障数据进行诊断,并把得到的修复方案更新至所述第二诊疗库的步骤包括以下具体步骤:
所述运维服务中心还包括指令接收单元和第二执行单元;
所述诊断单元对所述指令接收单元发送诊断指令,所述第二执行单元执行所述诊断指令,并将得到的故障通过所述指令接收单元反馈至所述诊断单元;
所述诊断单元分析所述故障并得到相应的修复方案,将所述修复方案更新至所述第二诊疗库和同步至所述第一诊疗库。
与现有技术相比,本发明的有益技术效果如下:
本发明提供了一种边缘云的运营维护系统,包括边缘云和中心云,边缘云包括运维服务中心、计算节点和虚拟机,所述运维服务中心包括第一诊疗库;所述运维服务中心用于获取所述计算节点和所述虚拟机的数据,并对所述数据进行故障分析,并用于判断所述故障对应的修复方案是否在所述第一诊疗库;中心云,包括第二诊疗库;所述中心云接收所述边缘云上传的所述故障后,在所述第二诊疗库中查找所述故障对应的匹配特征,将所述匹配特征对应的修复方案同步至所述第一诊疗库,实现了边缘云能够自动处理日常故障,自动累积较为全面的运维处理方法,降低人工运维成本,同时提高了工作效率。
本发明提供了一种边缘云的运营维护方法,边缘云的运维服务中心获取计算节点和虚拟机的数据,并对所述数据进行故障分析;所述运维服务中心判断所述故障对应的修复方案是否在第一诊疗库;中心云接收所述边缘云上传的所述故障,并在所述中心云的第二诊疗库查找所述故障对应的匹配特征,将所述匹配特征对应的修复方案同步至所述第一诊疗库,提供了一种统一的全要素覆盖的边缘云检查方法,无需频繁升级,为持续运营提供了保障,解决了无需人员到达现场进行维修的问题,减少企业损失。
附图说明
图1是本发明实施例1中所述的边缘云的运营维护系统的部署结构示意图。
图2是本发明实施例1中所述的边缘云的运营维护方法的步骤示意图。
具体实施方式
为了充分地了解本发明的目的、特征和效果,以下将结合附图与具体实施方式对本发明的构思、具体步骤及产生的技术效果作进一步说明。
实施例1
如图所示,本发明公开了一种边缘云的运营维护系统,包括边缘云和中心云,边缘云包括运维服务中心、计算节点和虚拟机,运维服务中心包括第一诊疗库,中心云包括第二诊疗库;运维服务中心用于获取计算节点和虚拟机的数据,并对数据进行故障分析,并用于判断故障对应的修复方案是否在第一诊疗库;中心云接收边缘云上传的故障后,在第二诊疗库中查找故障对应的匹配特征,将匹配特征对应的修复方案同步至第一诊疗库。
具体的在本实施例中,在中心云上初始化第二诊疗库的数据,把已知的修复方案存入第二诊疗库,时刻自动同步至边缘云的第一诊疗库,这里说的诊疗库至包含特征、特征描述、检查项和修复方案的集合记录,边缘云上的运维服务中心通过第一诊疗库中的方案可以自动解决大部分目前已知的故障,对于未知的故障,运维服务中心将故障数据上报至中心云,之后运维人员参与操作,将修复方案更新至第二诊疗库中,第一诊疗库同步更新第二诊疗库的修复方案,通过这样设置,实现了边缘云能够自动处理日常故障,自动累积较为全面的运维处理方法,降低人工运维成本,同时提高了工作效率。
优选的,运维服务中心还包括监测单元、分析单元;监测单元对计算节点和虚拟机进行检查,并把检查得到的数据发送至分析单元,分析单元对数据进行故障分析,得到故障数据。
具体的在本实施例中,边缘云上的监测单元时刻对控制节点、计算节点和检查用的虚拟机进行一个常规检查,例如检查节点的网络状态(用ifconfig、iptables、ovs-vsctlshow等命令)、内存状态(用free-m、cat/proc/meminfo等命令)、磁盘状态(用fdisk、df-h、dmesg等命令)、硬盘状态(用ipmitool等命令)等,之后监测单元将检查得到的数据发送至分析单元,分析单元接收到检查数据后根据第一诊疗库进行分析,得到故障数据。
优选的,分析单元把故障数据的序列化成有特定格式的匹配特征,并根据匹配特征的排列组合在第一诊疗库中查找对应的修复方案。
具体的在本实施例中,分析单元将检查得到的数据的序列化成有特定格式的特征,例如检查结果是vm网络中断,则特征是P1=VM,T1=Network,S1=Error;又例如检查结果是CPU过热,并且CPU风扇故障,则特征是P1=HWCPU,T1=Network,S1=OverHeat,P2=HWCPU,T2=FAN,S2=Error。分析单元根据这些特征的排列组合在第一诊疗库中查找相应的修复方案。
优选的,运维服务中心还包括上报单元;若分析单元在第一诊疗库可以找到对应的修复方案,则边缘云根据修复方案对故障进行修复;若分析单元在第一诊疗库没有找到对应的修复方案,则上报单元将故障数据上传至所述中心云。
具体的在本实施例中,若分析单元在第一诊疗库中找到相应的修复方案,则边缘云自身根据修复方案对故障进行修复,若分析单元在第一诊疗库中未找到相应的修复方案,则将运维服务中心的上报单元将故障数据上传至中心云,再从中心云查找相应的修复方案。
优选的,边缘云还包括修复单元、第一执行单元;分析单元将修复方案发送至修复单元,修复单元生成对应的命令脚本,并发送至第一执行单元,第一执行单元执行命令脚本以修复故障。
具体的在本实施例中,分析单元在第一诊疗库中找到相应的修复方案后,分析单元将修复方案发送至修复单元,修复单元根据修复方案生成对应的执行命令脚本,之后传给第一执行单元,第一执行单元接收修复单元发来的命令脚本,按照脚本执行以修复故障,例如修复虚拟机网卡脚本则是ifconfig eth0down;ifconfig eth0 up;systemct1restart network。
优选的,中心云还包括收集单元、匹配单元、命令单元以及诊断单元;收集单元接收上报单元上传的故障数据,并发送至匹配单元,匹配单元确认第二诊疗库是否存在故障数据对应的匹配特征。
具体的在本实施例中,中心云的收集单元接收到来自边缘云的上报单元上传的故障数据后,先送往匹配单元,由匹配单元再次匹配第二诊疗库中有没有相对应的匹配特征。具体的在本实施例中,若匹配单元在第二诊疗库可以找到匹配特征,则命令单元下发同步指令,将匹配特征对应的修复方案同步至第一诊疗库。若第二诊疗库不存在匹配特征,则中心云对故障数据进行诊断,并把得到的修复方案更新至第二诊疗库。
优选的,运维服务中心还包括指令接收单元和第二执行单元;诊断单元对指令接收单元发送诊断指令,第二执行单元执行诊断指令,对边缘云进行查看和定位故障,并将得到的故障通过指令接收单元反馈至诊断单元,诊断单元分析故障并得到相应的修复方案,将修复方案更新至第二诊疗库和同步至第一诊疗库。
具体的在本实施例中,运维人员通过中心云的诊断单元对边缘云的指令接收单元发起诊断指令,第二执行单元执行诊断指令,对边缘云进行查看和定位故障,此操作支持系统的常规命令操作,如查看系统参数、查看防火墙规则、查看网卡状态等等,操作范围可包含到计算节点和检查用虚拟机,并将得到的故障通过指令接收单元反馈至诊断单元,操作人员对诊断单元接收的数据进行故障分析并得到相应的修复方案,对第二诊疗库进行更新操作,记录新的故障修复记录,以供第二诊疗库同步更新至第一诊疗库,进而边缘云根据第一诊疗库中的修复方案对故障进行修复。
实施例2
本发明公开了一种边缘云的运营维护方法,包括以下步骤:
获取边缘云的计算节点和虚拟机的数据,并对数据进行故障分析;
判断故障对应的修复方案是否在边缘云的第一诊疗库;
上传故障至中心云,并在中心云的第二诊疗库查找故障对应的匹配特征,将匹配特征对应的修复方案同步至第一诊疗库。
具体的在本实施例中,首先获取边缘云中需维护的计算节点和虚拟机的的数据,并对数据进行故障分析,判断边缘云的第一诊疗库中是否存在故障数据对应的修复方案,如果存在,则边缘云利用修复方案进行故障修复,如果不存在,则边缘云将故障数据上传至中心云的第二诊疗库,在中心云确认第二诊疗库中是否存在故障数据对应的修复方案的匹配特征,如果存在,则将匹配特征对应的修复方案下发至边缘云进行故障修复,如果不存在,则对边缘云进行检查定位故障,将故障对应的修复方案更新至第二诊疗库中。通过这样设置,提供了一种统一的全要素覆盖的边缘云检查方法,无需频繁升级,为持续运营提供了保障,解决了无需人员到达现场进行维修的问题,减少企业损失。
优选的,获取边缘云的计算节点和虚拟机的数据,并对数据进行故障分析的步骤包括以下具体步骤:
边缘云的运维服务中心包括监测单元、分析单元;
监测单元对计算节点和虚拟机进行检查,并把检查得到的数据发送至分析单元,分析单元对数据进行故障分析。
具体的在本实施例中,边缘云上的监测单元时刻对控制节点、计算节点和检查用的虚拟机进行一个常规检查,例如检查节点的网络状态(用ifconfig、iptables、ovs-vsctlshow等命令)、内存状态(用free-m、cat/proc/meminfo等命令)、磁盘状态(用fdisk、df-h、dmesg等命令)、硬盘状态(用ipmitool等命令)等,之后监测单元将检查得到的数据发送至分析单元,分析单元接收到检查数据后根据第一诊疗库进行分析,得到故障数据。
优选的,运维服务中心判断故障对应的修复方案是否在第一诊疗库的步骤包括以下具体步骤:
分析单元把分析得到的故障数据的序列化成有特定格式的匹配特征;
根据匹配特征的排列组合在第一诊疗库中查找对应的修复方案。
具体的在本实施例中,分析单元将检查得到的数据的序列化成有特定格式的特征,例如检查结果是vm网络中断,则特征是P1=VM,T1=Network,S1=Error;又例如检查结果是CPU过热,并且CPU风扇故障,则特征是P1=HWCPU,T1=Network,S1=OverHeat,P2=HWCPU,T2=FAN,S2=Error。分析单元根据这些特征的排列组合在第一诊疗库中查找相应的修复方案。
优选的,若第一诊疗库存在对应的修复方案,则边缘云利用修复方案进行故障修复;若第一诊疗库不存在对应的修复方案,则上报单元将故障数据上传至中心云。
具体的在本实施例中,若分析单元在第一诊疗库找到相应的修复方案,则边缘云自身根据修复方案进行故障修复,若分析单元在第一诊疗库中未找到相应的修复方案,则将运维服务中心的上报单元将故障数据上传至中心云,再从中心云查找相应的修复方案。
优选的,中心云接收边缘云上传的故障的步骤包括以下具体步骤:
边缘云还包括修复单元和第一执行单元;
将修复方案发送至修复单元;
生成对应的命令脚本,并发送至第一执行单元;
执行所述命令脚本以修复故障。
具体的在本实施例中,分析单元在第一诊疗库找到相应的修复方案后,分析单元将修复方案发送至修复单元,修复单元根据修复方案生成对应的执行命令脚本,之后传给第一执行单元,第一执行单元接收修复单元发来的命令脚本,按照脚本执行以修复故障,例如修复虚拟机网卡脚本则是ifconfig eth0down;ifconfig eth0 up;systemct1 restartnetwork。
优选的,中心云的第二诊疗库查找故障对应的匹配特征,将匹配特征对应的修复方案同步至第一诊疗库的步骤包括以下具体步骤:
中心云还包括收集单元、匹配单元;
收集单元接收上报单元上传的故障数据,并发送至匹配单元;
匹配单元确认第二诊疗库中是否存在故障数据对应的修复方案。
具体的在本实施例中,中心云的收集单元接收到来自边缘云的上报单元上传的故障数据后,先送往匹配单元,由匹配单元再次匹配第二诊疗库有没有相对应的修复方案。
具体的在本实施例中,中心云还包括命令单元,若第二诊疗库存在修复方案,则命令单元下发同步指令,将对应的修复方案同步至第一诊疗库;中心云还包括诊断单元,若第二诊疗库不存在修复方案,则中心云对故障数据进行诊断,并把得到的修复方案更新至第二诊疗库。
优选的,诊断单元对故障数据进行诊断,并把得到的修复方案更新至第二诊疗库的步骤包括以下具体步骤:
运维服务中心还包括指令接收单元和第二执行单元;
诊断单元对指令接收单元发送诊断指令,第二执行单元执行诊断指令,并将得到的故障通过指令接收单元反馈至诊断单元;
诊断单元分析故障并得到相应的修复方案,将修复方案更新至第二诊疗库和同步至第一诊疗库。
具体的在本实施例中,运维人员通过中心云的诊断单元对边缘云的指令接收单元发起诊断操作,此操作支持系统的常规命令操作,如查看系统参数、查看防火墙规则、查看网卡状态等等,操作范围可包含到计算节点和检查用虚拟机,当运维人员通过一系列的常规检查定位问题后,可以对第二诊疗库进行更新操作,记录新的故障修复记录,以供第二诊疗库同步更新至第一诊疗库,进而边缘云根据第一诊疗库中的修复方案进行故障修复。
本领域普通技术人员可以意识到,结合本发明实施例中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可查看存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上详细描述了本发明的较佳具体实施例,应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明构思在现有技术基础上通过逻辑分析、推理或者根据有限的实验可以得到的技术方案,均应该在由本权利要求书所确定的保护范围。
Claims (10)
1.一种边缘云的运营维护系统,其特征在于,包括:
边缘云,包括运维服务中心、计算节点和虚拟机,所述运维服务中心包括第一诊疗库;所述运维服务中心用于获取所述计算节点和所述虚拟机的数据,并对所述数据进行故障分析,并用于判断所述故障对应的修复方案是否在所述第一诊疗库;
中心云,包括第二诊疗库;所述中心云接收所述边缘云上传的所述故障后,在所述第二诊疗库中查找所述故障对应的匹配特征,将所述匹配特征对应的修复方案同步至所述第一诊疗库。
2.根据权利要求1所述的边缘云的运营维护系统,其特征在于,
所述运维服务中心还包括监测单元、分析单元;
所述监测单元对所述计算节点和所述虚拟机进行检查,并把检查得到的数据发送至所述分析单元,所述分析单元对所述数据进行故障分析,得到故障数据。
3.根据权利要求2所述的边缘云的运营维护系统,其特征在于,
所述分析单元把所述故障数据的序列化成有特定格式的匹配特征,并根据所述匹配特征的排列组合在所述第一诊疗库中查找对应的修复方案。
4.根据权利要求3所述的边缘云的运营维护系统,其特征在于,所述运维服务中心还包括上报单元;
若所述分析单元在所述第一诊疗库可以找到所述对应的修复方案,则所述边缘云根据所述修复方案对故障进行修复;
若所述分析单元在所述第一诊疗库没有找到所述对应的修复方案,则所述上报单元将所述故障数据上传至所述中心云。
5.根据权利要求4所述的边缘云的运营维护系统,其特征在于,
所述边缘云还包括修复单元、第一执行单元;
所述分析单元将所述修复方案发送至所述修复单元,所述修复单元生成对应的命令脚本,并发送至所述第一执行单元,所述第一执行单元执行所述命令脚本以修复故障。
6.根据权利要求5所述的边缘云的运营维护系统,其特征在于,
所述中心云还包括收集单元、匹配单元;
所述收集单元接收所述上报单元上传的所述故障数据,并发送至所述匹配单元,所述匹配单元确认所述第二诊疗库中是否存在所述故障数据对应的修复方案。
7.根据权利要求6所述的边缘云的运营维护系统,其特征在于,
所述中心云还包括命令单元,若所述匹配单元在所述第二诊疗库可以找到所述修复方案,则所述命令单元下发同步指令,将所述修复方案同步至所述第一诊疗库。
8.根据权利要求6所述的边缘云的运营维护系统,其特征在于,所述中心云还包括诊断单元,若所述匹配单元在所述第二诊疗库没有找到所述修复方案,则所述诊断单元对所述故障数据进行诊断,并把得到的修复方案更新至所述第二诊疗库。
9.根据权利要求8所述的边缘云的运营维护系统,其特征在于,
所述运维服务中心还包括指令接收单元和第二执行单元;;
所述诊断单元对所述指令接收单元发送诊断指令,所述第二执行单元执行所述诊断指令,对所述边缘云进行查看和定位故障,并将得到的故障通过所述指令接收单元反馈至所述诊断单元,所述诊断单元分析所述故障并得到相应的修复方案,将所述修复方案更新至所述第二诊疗库进而同步至所述第一诊疗库。
10.一种边缘云的运营维护方法,其特征在于,包括:
获取边缘云的计算节点和虚拟机的数据,并对所述数据进行故障分析;
判断所述故障对应的修复方案是否在边缘云的第一诊疗库;
上传所述故障至中心云,并在所述中心云的第二诊疗库查找所述故障对应的匹配特征,将所述匹配特征对应的修复方案同步至所述第一诊疗库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010651022.XA CN111800299A (zh) | 2020-07-08 | 2020-07-08 | 一种边缘云的运营维护系统及其方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010651022.XA CN111800299A (zh) | 2020-07-08 | 2020-07-08 | 一种边缘云的运营维护系统及其方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111800299A true CN111800299A (zh) | 2020-10-20 |
Family
ID=72809788
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010651022.XA Pending CN111800299A (zh) | 2020-07-08 | 2020-07-08 | 一种边缘云的运营维护系统及其方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111800299A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112929245A (zh) * | 2021-01-27 | 2021-06-08 | 浪潮软件科技有限公司 | 一种基于云边协同技术管理智慧家庭边缘计算平台的方法 |
CN113009896A (zh) * | 2021-03-09 | 2021-06-22 | 国能大渡河猴子岩发电有限公司 | 基于边缘计算和云计算的生产控制方法及系统 |
CN116501444A (zh) * | 2023-04-28 | 2023-07-28 | 重庆大学 | 智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统及方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110113188A (zh) * | 2019-04-22 | 2019-08-09 | 腾讯科技(深圳)有限公司 | 跨子域通信运维方法、总运维服务器和介质 |
CN110572448A (zh) * | 2019-08-30 | 2019-12-13 | 烽火通信科技股份有限公司 | 一种分布式边缘云系统架构 |
US20200192344A1 (en) * | 2018-12-18 | 2020-06-18 | General Electric Company | Apparatus And Method For Repair Of Edge Devices |
CN111355610A (zh) * | 2020-02-25 | 2020-06-30 | 网宿科技股份有限公司 | 一种基于边缘网络的异常处理方法及装置 |
-
2020
- 2020-07-08 CN CN202010651022.XA patent/CN111800299A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200192344A1 (en) * | 2018-12-18 | 2020-06-18 | General Electric Company | Apparatus And Method For Repair Of Edge Devices |
CN110113188A (zh) * | 2019-04-22 | 2019-08-09 | 腾讯科技(深圳)有限公司 | 跨子域通信运维方法、总运维服务器和介质 |
CN110572448A (zh) * | 2019-08-30 | 2019-12-13 | 烽火通信科技股份有限公司 | 一种分布式边缘云系统架构 |
CN111355610A (zh) * | 2020-02-25 | 2020-06-30 | 网宿科技股份有限公司 | 一种基于边缘网络的异常处理方法及装置 |
Non-Patent Citations (1)
Title |
---|
陈思等: "基于边云智能协同的配电网信息物理系统", 《北京信息科技大学学报(自然科学版)》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112929245A (zh) * | 2021-01-27 | 2021-06-08 | 浪潮软件科技有限公司 | 一种基于云边协同技术管理智慧家庭边缘计算平台的方法 |
CN113009896A (zh) * | 2021-03-09 | 2021-06-22 | 国能大渡河猴子岩发电有限公司 | 基于边缘计算和云计算的生产控制方法及系统 |
CN116501444A (zh) * | 2023-04-28 | 2023-07-28 | 重庆大学 | 智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统及方法 |
CN116501444B (zh) * | 2023-04-28 | 2024-02-27 | 重庆大学 | 智能网联汽车域控制器虚拟机异常云边协同监测和恢复系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111800299A (zh) | 一种边缘云的运营维护系统及其方法 | |
US5949976A (en) | Computer performance monitoring and graphing tool | |
US20040153837A1 (en) | Automated testing | |
CN110943851B (zh) | 基于微服务的告警处理方法、装置及电子设备 | |
CN106970880A (zh) | 一种分布式自动化软件测试方法及系统 | |
CN110971464A (zh) | 一种适合灾备中心的运维自动化系统 | |
CN105740142A (zh) | Ssr集中管理平台压力测试管理系统 | |
CN111427321A (zh) | 一种兼容多协议的mes数据采集系统及其方法 | |
CN113193881A (zh) | 一种基于hplc深化应用的智能化功能验证检测方法 | |
CN106843965A (zh) | 一种自动安装系统测试工具的系统及安装方法 | |
CN111340260A (zh) | 煤矿井下设备的远程故障诊断系统、方法及装置 | |
CN115664939A (zh) | 一种基于自动化技术的综合运维方法、装置和存储介质 | |
CN113364115B (zh) | 一种电力电缆信息综合处理系统、方法 | |
CN105099816A (zh) | 一种航空任务电子系统通用综合检测装置及检测方法 | |
CN113760730A (zh) | 一种自动化测试的方法和装置 | |
CN114610378B (zh) | 服务器环境配置方法、系统、存储介质及设备 | |
CN109685682A (zh) | 基于关系数据库智能生成调控系统检修操作票的方法 | |
CN115913314A (zh) | 中继卫星地面站数据中继任务流程监控方法、装置及系统 | |
CN210724868U (zh) | 数据处理系统及控制设备 | |
CN113835939A (zh) | 故障信息的处理方法及装置、存储介质、电子装置 | |
CN113886665A (zh) | 自动化运维方法、装置、设备及存储介质 | |
CN111639022A (zh) | 交易测试方法及装置、存储介质、电子装置 | |
CN117613908B (zh) | 基于配电网络的智能运维方法及系统 | |
CN110059236A (zh) | 一种应用网络爬虫技术进行电力规划收资的数据采集、处理方法 | |
CN111427930A (zh) | 一种低压光伏储能微网设备监测管理系统、方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201020 |
|
RJ01 | Rejection of invention patent application after publication |