CN107222340A - 一种基于云平台的故障处理方法及装置 - Google Patents

一种基于云平台的故障处理方法及装置 Download PDF

Info

Publication number
CN107222340A
CN107222340A CN201710391948.8A CN201710391948A CN107222340A CN 107222340 A CN107222340 A CN 107222340A CN 201710391948 A CN201710391948 A CN 201710391948A CN 107222340 A CN107222340 A CN 107222340A
Authority
CN
China
Prior art keywords
failure
fault
software
hardware
script
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710391948.8A
Other languages
English (en)
Inventor
杨瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201710391948.8A priority Critical patent/CN107222340A/zh
Publication of CN107222340A publication Critical patent/CN107222340A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种基于云平台的故障处理方法及装置,该方法包括:在云端系统运行中出现故障时,判断故障种类为硬件故障还是软件故障;若故障种类为硬件故障,执行硬件故障对应的故障处理方案;若故障种类为软件故障,执行软件故障对应的故障处理方案。该方法实现节省人工成本。

Description

一种基于云平台的故障处理方法及装置
技术领域
本发明涉及故障处理技术领域,特别是涉及一种基于云平台的故障处理方法及装置。
背景技术
目前,随着云平台大量的投入使用,响应大批量、高并发的需求越来越得到用户的青睐,但是伴随着如此巨大的云端服务的使用量,人工维护和解决故障的成本就显得格外高,但是目前对云端系统的故障维护都是由人工来发现故障,人工解决故障,消耗大量人工成本。
发明内容
本发明的目的是提供一种基于云平台的故障处理方法及装置,以实现节省人工成本。
为解决上述技术问题,本发明提供一种基于云平台的故障处理方法,该方法包括:
在云端系统运行中出现故障时,判断故障种类为硬件故障还是软件故障;
若故障种类为硬件故障,执行硬件故障对应的故障处理方案;
若故障种类为软件故障,执行软件故障对应的故障处理方案。
优选的,所述硬件故障包括存储设备出现异常或者主机宕机断电;所述软件故障包括脚本执行错误或者软件安装失败。
优选的,所述若故障种类为硬件故障,执行硬件故障对应的故障处理方案,包括:
若故障为存储设备出现异常,将存储设备中的存储信息复制到云平台上的虚拟设备中;
若故障为主机宕机断电,保存主机所有信息。
优选的,所述若故障种类为软件故障,执行软件故障对应的故障处理方案,包括:
若故障为脚本执行错误,跳过当前执行错误的脚本,执行下一个脚本;
若故障为软件安装失败,重新配置环境变量,进行软件安装。
本发明还提供一种基于云平台的故障处理装置,用于实现上述方法,包括:
故障判断模块,用于在云端系统运行中出现故障时,判断故障种类为硬件故障还是软件故障;
硬件故障处理模块,用于若故障种类为硬件故障,执行硬件故障对应的故障处理方案;
软件故障处理模块,用于若故障种类为软件故障,执行软件故障对应的故障处理方案。
优选的,所述硬件故障包括存储设备出现异常或者主机宕机断电;所述软件故障包括脚本执行错误或者软件安装失败。
优选的,所述硬件故障处理模块包括:
异常处理单元,用于若故障为存储设备出现异常,将存储设备中的存储信息复制到云平台上的虚拟设备中;
断电处理单元,用于若故障为主机宕机断电,保存主机所有信息。
优选的,所述软件故障处理模块包括:
脚本处理单元,用于若故障为脚本执行错误,跳过当前执行错误的脚本,执行下一个脚本;
软件处理单元,用于若故障为软件安装失败,重新配置环境变量,进行软件安装。
本发明所提供的一种基于云平台的故障处理方法及装置,在云端系统运行中出现故障时,判断故障种类为硬件故障还是软件故障;若故障种类为硬件故障,执行硬件故障对应的故障处理方案;若故障种类为软件故障,执行软件故障对应的故障处理方案。可见,在云端系统出现故障时,判断故障种类为硬件故障还是软件故障,对于硬件故障执行硬件故障对应的故障处理方案,对于软件故障执行软件故障对应的故障处理方案,达到故障的自动化处理,无需人工解决故障,节省人工成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明所提供的一种基于云平台的故障处理方法的流程图;
图2为本发明所提供的一种基于云平台的故障处理装置的结构示意图。
具体实施方式
本发明的核心是提供一种基于云平台的故障处理方法及装置,以实现节省人工成本。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明所提供的一种基于云平台的故障处理方法的流程图,该方法包括:
S11:在云端系统运行中出现故障时,判断故障种类为硬件故障还是软件故障;
S12:若故障种类为硬件故障,执行硬件故障对应的故障处理方案;
S13:若故障种类为软件故障,执行软件故障对应的故障处理方案。
可见,该方法中,在云端系统出现故障时,判断故障种类为硬件故障还是软件故障,对于硬件故障执行硬件故障对应的故障处理方案,对于软件故障执行软件故障对应的故障处理方案,达到故障的自动化处理,无需人工解决故障,节省人工成本。
基于上述方法,具体的,所述硬件故障包括存储设备出现异常或者主机宕机断电;所述软件故障包括脚本执行错误或者软件安装失败。
进一步的,步骤S12的过程具体为:若故障为存储设备出现异常,将存储设备中的存储信息复制到云平台上的虚拟设备中;若故障为主机宕机断电,保存主机所有信息。
进一步的,步骤S13的过程具体为:若故障为脚本执行错误,跳过当前执行错误的脚本,执行下一个脚本;若故障为软件安装失败,重新配置环境变量,进行软件安装。
详细的,本方法处理云端系统运行中发现的故障或异常,用户通过自定义故障处理的方案,包含故障种类、故障的解决办法等,然后系统根据用户设置的方案,自动化的执行,自主解决系统遇到的运行时的故障或异常,最后将结果进行反馈或申报。具体的,实施过程包括:用户设定故障处理方案;根据方案自动化处理故障;反馈处理结果。由于人工维护和解决故障的成本就显得格外高,因此本方法将故障的自动化处理引入云平台(云海OS),让用户自行制定故障处理方案就能很好的解决这一问题。
故障处理方案是系统自动化处理故障的依据。用户自定义一种或多种故障处理方案,在系统运行时遇见故障时候,能够自动化处理并解决问题。其方案包含:故障的种类例如硬件、软件等,当然此故障种类的划分可依据具体的场景和需求而添加;种类下分的故障处理方案,如遇到硬件故障了如何解决,解决之后如何反馈等。
系统自动处理故障过程中,根据用户设定的故障处理方案,在系统运行时,获取到了对应的故障,则按照之前方案自动化执行,解决该故障。如在系统运行时,由于缺少环境变量的配置,导致了软件安装失败或无法使用的异常,此时就可以按照方案进行处理,例如配置环境变量重新安装或卸载,安装其他同类软件。
反馈处理结果过程中,故障的处理结果如何反馈,是依据用户方案设定的。用户可以根据实际需求制定某类故障的反馈信息,或申请审批故障信息,或故障的详细信息,或仅仅反馈处理结果例如成功、失败。
具体实施过程中,用户登录云平台制定故障的分类及解决方案;系统根据用户制定的方案捕捉故障并自动化处理和解决;按要求反馈故障的信息。设计合理故障自动化处理流程,使得可以产出更合理更便捷更灵活的系统故障处理方案,从而提升用户的使用体验,解决云平台处理故障的问题。
本方法将自动化处理故障的方案引入云平台例如云海OS,能够大大简化大数据量和高并发操作时候可能导致的系统故障的处理流程,节省了大量的人工成本,便捷了用户的操作,实现了用户定制化的需求,并且减少了成本,提高了效率。
请参考图2,图2为本发明所提供的一种基于云平台的故障处理装置的结构示意图,用于实现上述方法,该装置包括:
故障判断模块101,用于在云端系统运行中出现故障时,判断故障种类为硬件故障还是软件故障;
硬件故障处理模块102,用于若故障种类为硬件故障,执行硬件故障对应的故障处理方案;
软件故障处理模块103,用于若故障种类为软件故障,执行软件故障对应的故障处理方案。
可见,该装置中,在云端系统出现故障时,判断故障种类为硬件故障还是软件故障,对于硬件故障执行硬件故障对应的故障处理方案,对于软件故障执行软件故障对应的故障处理方案,达到故障的自动化处理,无需人工解决故障,节省人工成本。
基于上述装置,具体的,硬件故障包括存储设备出现异常或者主机宕机断电;所述软件故障包括脚本执行错误或者软件安装失败。
进一步的,硬件故障处理模块包括:异常处理单元,用于若故障为存储设备出现异常,将存储设备中的存储信息复制到云平台上的虚拟设备中;断电处理单元,用于若故障为主机宕机断电,保存主机所有信息。
进一步的,软件故障处理模块包括:脚本处理单元,用于若故障为脚本执行错误,跳过当前执行错误的脚本,执行下一个脚本;软件处理单元,用于若故障为软件安装失败,重新配置环境变量,进行软件安装。
综上,本发明所提供的一种基于云平台的故障处理方法及装置,在云端系统运行中出现故障时,判断故障种类为硬件故障还是软件故障;若故障种类为硬件故障,执行硬件故障对应的故障处理方案;若故障种类为软件故障,执行软件故障对应的故障处理方案。可见,在云端系统出现故障时,判断故障种类为硬件故障还是软件故障,对于硬件故障执行硬件故障对应的故障处理方案,对于软件故障执行软件故障对应的故障处理方案,达到故障的自动化处理,无需人工解决故障,节省人工成本。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
以上对本发明所提供的一种基于云平台的故障处理方法及装置进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (8)

1.一种基于云平台的故障处理方法,其特征在于,包括:
在云端系统运行中出现故障时,判断故障种类为硬件故障还是软件故障;
若故障种类为硬件故障,执行硬件故障对应的故障处理方案;
若故障种类为软件故障,执行软件故障对应的故障处理方案。
2.如权利要求1所述的方法,其特征在于,所述硬件故障包括存储设备出现异常或者主机宕机断电;所述软件故障包括脚本执行错误或者软件安装失败。
3.如权利要求2所述的方法,其特征在于,所述若故障种类为硬件故障,执行硬件故障对应的故障处理方案,包括:
若故障为存储设备出现异常,将存储设备中的存储信息复制到云平台上的虚拟设备中;
若故障为主机宕机断电,保存主机所有信息。
4.如权利要求3所述的方法,其特征在于,所述若故障种类为软件故障,执行软件故障对应的故障处理方案,包括:
若故障为脚本执行错误,跳过当前执行错误的脚本,执行下一个脚本;
若故障为软件安装失败,重新配置环境变量,进行软件安装。
5.一种基于云平台的故障处理装置,其特征在于,用于实现权利要求1至4中任意一项方法,包括:
故障判断模块,用于在云端系统运行中出现故障时,判断故障种类为硬件故障还是软件故障;
硬件故障处理模块,用于若故障种类为硬件故障,执行硬件故障对应的故障处理方案;
软件故障处理模块,用于若故障种类为软件故障,执行软件故障对应的故障处理方案。
6.如权利要求5所述的装置,其特征在于,所述硬件故障包括存储设备出现异常或者主机宕机断电;所述软件故障包括脚本执行错误或者软件安装失败。
7.如权利要求6所述的装置,其特征在于,所述硬件故障处理模块包括:
异常处理单元,用于若故障为存储设备出现异常,将存储设备中的存储信息复制到云平台上的虚拟设备中;
断电处理单元,用于若故障为主机宕机断电,保存主机所有信息。
8.如权利要求7所述的装置,其特征在于,所述软件故障处理模块包括:
脚本处理单元,用于若故障为脚本执行错误,跳过当前执行错误的脚本,执行下一个脚本;
软件处理单元,用于若故障为软件安装失败,重新配置环境变量,进行软件安装。
CN201710391948.8A 2017-05-27 2017-05-27 一种基于云平台的故障处理方法及装置 Pending CN107222340A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710391948.8A CN107222340A (zh) 2017-05-27 2017-05-27 一种基于云平台的故障处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710391948.8A CN107222340A (zh) 2017-05-27 2017-05-27 一种基于云平台的故障处理方法及装置

Publications (1)

Publication Number Publication Date
CN107222340A true CN107222340A (zh) 2017-09-29

Family

ID=59946884

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710391948.8A Pending CN107222340A (zh) 2017-05-27 2017-05-27 一种基于云平台的故障处理方法及装置

Country Status (1)

Country Link
CN (1) CN107222340A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108391015A (zh) * 2018-01-09 2018-08-10 国网山东省电力公司滨州供电公司 一种调度软交换ip话机故障检测报警系统
CN109327344A (zh) * 2018-11-29 2019-02-12 郑州云海信息技术有限公司 一种白盒交换机故障诊断方法及装置
CN109858637A (zh) * 2019-01-10 2019-06-07 深圳市万华汽车服务投资控股有限公司 一种无人值守的洗车故障处理方法、装置以及系统
CN110943851A (zh) * 2018-09-25 2020-03-31 中国移动通信集团广东有限公司 基于微服务的告警处理方法、装置及电子设备
CN112306749A (zh) * 2020-10-26 2021-02-02 珠海格力电器股份有限公司 控制系统中服务的处理方法及装置、控制系统
CN112954121A (zh) * 2019-11-26 2021-06-11 国网山东省电力公司滨州供电公司 一种调度软交换话机状态检测报警系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008039236A1 (en) * 2006-09-28 2008-04-03 Emc Corporation Responding to a storage processor failure with continued write caching
CN101373450A (zh) * 2007-08-21 2009-02-25 联想(北京)有限公司 处理cpu异常的方法及系统
CN101556679A (zh) * 2009-05-21 2009-10-14 中国建设银行股份有限公司 一种综合前端系统故障处理方法及计算机设备
CN103167004A (zh) * 2011-12-15 2013-06-19 中国移动通信集团上海有限公司 云平台主机系统故障修复方法及云平台前端控制服务器
CN103838637A (zh) * 2014-03-03 2014-06-04 江苏智联天地科技有限公司 基于数据挖掘的终端自主故障诊断与恢复方法
CN106338982A (zh) * 2016-09-26 2017-01-18 深圳前海弘稼科技有限公司 故障处理方法、故障处理装置和服务器
CN106383760A (zh) * 2016-09-19 2017-02-08 郑州云海信息技术有限公司 一种计算机故障管理方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008039236A1 (en) * 2006-09-28 2008-04-03 Emc Corporation Responding to a storage processor failure with continued write caching
CN101373450A (zh) * 2007-08-21 2009-02-25 联想(北京)有限公司 处理cpu异常的方法及系统
CN101556679A (zh) * 2009-05-21 2009-10-14 中国建设银行股份有限公司 一种综合前端系统故障处理方法及计算机设备
CN103167004A (zh) * 2011-12-15 2013-06-19 中国移动通信集团上海有限公司 云平台主机系统故障修复方法及云平台前端控制服务器
CN103838637A (zh) * 2014-03-03 2014-06-04 江苏智联天地科技有限公司 基于数据挖掘的终端自主故障诊断与恢复方法
CN106383760A (zh) * 2016-09-19 2017-02-08 郑州云海信息技术有限公司 一种计算机故障管理方法及装置
CN106338982A (zh) * 2016-09-26 2017-01-18 深圳前海弘稼科技有限公司 故障处理方法、故障处理装置和服务器

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108391015A (zh) * 2018-01-09 2018-08-10 国网山东省电力公司滨州供电公司 一种调度软交换ip话机故障检测报警系统
CN110943851A (zh) * 2018-09-25 2020-03-31 中国移动通信集团广东有限公司 基于微服务的告警处理方法、装置及电子设备
CN109327344A (zh) * 2018-11-29 2019-02-12 郑州云海信息技术有限公司 一种白盒交换机故障诊断方法及装置
CN109327344B (zh) * 2018-11-29 2021-10-26 郑州云海信息技术有限公司 一种白盒交换机故障诊断方法及装置
CN109858637A (zh) * 2019-01-10 2019-06-07 深圳市万华汽车服务投资控股有限公司 一种无人值守的洗车故障处理方法、装置以及系统
CN112954121A (zh) * 2019-11-26 2021-06-11 国网山东省电力公司滨州供电公司 一种调度软交换话机状态检测报警系统
CN112306749A (zh) * 2020-10-26 2021-02-02 珠海格力电器股份有限公司 控制系统中服务的处理方法及装置、控制系统

Similar Documents

Publication Publication Date Title
CN107222340A (zh) 一种基于云平台的故障处理方法及装置
CN111162941B (zh) 一种Kubernetes环境自动化管理虚拟IP的方法
CN115292026B (zh) 容器集群的管理方法、装置、设备及计算机可读存储介质
CN106301876B (zh) 物理机升级方法、业务迁移方法及装置
WO2017107656A1 (zh) 虚拟化网元故障自愈方法及装置
US20160232065A1 (en) Preserving management services with self-contained metadata through the disaster recovery life cycle
CN108134690B (zh) 网络业务部署流程控制方法、装置及系统
WO2016045439A1 (zh) 一种vnfm容灾保护的方法、装置和nfvo、存储介质
CN107729176A (zh) 一种配置文件管理系统的容灾方法及容灾系统
CN105653401A (zh) 应用系统灾备、运维、监控和应急启停调度方法及装置
CN103780428A (zh) 应用于云架构的集中式资源管理方法及系统
CN111669284A (zh) OpenStack自动化部署方法、电子设备、存储介质及系统
CN112199157A (zh) 一种云环境管理方法
CN107688512A (zh) 一种优化虚拟机数据备份方法和系统
CN113535532B (zh) 故障注入系统、方法和装置
CN112783570A (zh) 基于服务网格的应用迁移方法、系统和介质
CN104780068B (zh) 一种机房迁移的网络切换方法、装置及系统
CN108055142B (zh) 一种vCPE设备的接口自动化配置方法及系统
CN111506393B (zh) 一种基于arm的虚拟化装置及其使用方法
CN107529180B (zh) 一种基站云测试环境构建装置和方法
CN117009238A (zh) 数据测试方法、装置、电子设备、存储介质和程序产品
CN107608887A (zh) 一种创建虚拟操作系统测试服务器的方法
CN113746676B (zh) 基于容器集群的网卡管理方法、装置、设备、介质及产品
CN106557386A (zh) 基于kvm部署备份虚拟网卡虚拟机的方法、装置及系统
CN105204975A (zh) 基于JavaEE体系架构的性能监控系统及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170929