CN108241545B - 系统故障的调试方法及装置 - Google Patents

系统故障的调试方法及装置 Download PDF

Info

Publication number
CN108241545B
CN108241545B CN201611227433.6A CN201611227433A CN108241545B CN 108241545 B CN108241545 B CN 108241545B CN 201611227433 A CN201611227433 A CN 201611227433A CN 108241545 B CN108241545 B CN 108241545B
Authority
CN
China
Prior art keywords
debugging
environment
container
token
debugging environment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611227433.6A
Other languages
English (en)
Other versions
CN108241545A (zh
Inventor
李秀波
汤伟
白耀伟
张卓豫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Suzhou Software Technology Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Suzhou Software Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Suzhou Software Technology Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201611227433.6A priority Critical patent/CN108241545B/zh
Publication of CN108241545A publication Critical patent/CN108241545A/zh
Application granted granted Critical
Publication of CN108241545B publication Critical patent/CN108241545B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例公开了一种系统故障的调试方法,包括:在监听到线上系统出现故障后,激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的令牌Token;其中,所述系统调试环境是通过开源的应用容器引擎Docker集群技术及轻量级容器技术预先部署好的,所述系统调试环境中存在有至少一个容器调试环境,所述容器调试环境都处于睡眠等待状态,所述容器调试环境存储有对应的线上系统的系统信息;在确定接收到的Token为所述编号唯一的Token时,根据调试指令及获取到的所述线上系统的故障信息对所述对应的容器调试环境进行调试,并将所述对应的容器调试环境反馈的分析结果呈现。本发明实施例同时还公开了一种系统故障的调试装置。

Description

系统故障的调试方法及装置
技术领域
本发明涉及系统业务支撑技术领域,尤其涉及一种系统故障的调试方法及装置。
背景技术
Linux操作系统的用户,在使用过程中基本都曾遇到过系统突然宕机或者自动重启等故障,同样的,针对于企业级Linux服务器操作系统也存在类似的问题,因涉及到客户核心数据的安全,所以对其稳定性、安全性和可恢复性要求很高,出现宕机等故障需要能够迅速定位并解决,并避免同类问题再次复现或者成为系统安全漏洞。
图1为现有的系统故障的调试方法的流程图,如图1所示,目前Linux出现系统宕机等故障之后,调试分析人员需要花费大量工作去准备调试环境,该方法大致分为以下几个步骤:
1、准备调试机:调试机可以是一台物理机或者一个虚拟机,需要安装相应的Linux操作系统;
2、下载安装调试内核环境:调试分析人员需要从具有繁多版本的调试内核的相关远程服务器临时下载、安装与发生故障的系统相同版本的内核,并配置相关调试环境;
3、获取发生故障的瞬间内存现场:从发生故障的系统或者通过系统管理员通过临时网络拷贝方式获取发生故障的系统在瞬间所生产的内存现场文件(大小由几百MB到几十个GB不等)到调试机系统;
4、登陆调试:调试分析人员需要登陆到调试系统,然后进行调试分析。
调试分析人员利用现有的系统故障的调试方法会出现配置调试环境费时、调试环境兼容性差等问题,无法对出现的系统故障进行快速响应,降低了工作效率。
发明内容
有鉴于此,本发明实施例期望提供一种系统故障的调试方法及装置,以实现对调试环境的快速配置部署以及兼容多种不同配置的调试环境,使调试分析人员无需等待就可以进行调试操作,能够进行快速响应,提高工作效率。
为达到上述目的,本发明的技术方案是这样实现的:
本发明提供一种系统故障的调试方法,所述方法包括:
在监听到线上系统出现故障后,激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的令牌Token;其中,所述系统调试环境是通过开源的应用容器引擎Docker集群技术及轻量级容器技术预先部署好的,所述系统调试环境中存在有至少一个容器调试环境,所述容器调试环境都处于睡眠等待状态,所述容器调试环境存储有对应的线上系统的系统信息;
在确定接收到的Token为所述编号唯一的Token时,根据调试指令及获取到的所述线上系统的故障信息对所述对应的容器调试环境进行调试,并将所述对应的容器调试环境反馈的分析结果呈现。
上述方案中,所述在监听到线上系统出现故障后,所述方法还包括:
获取所述线上系统的系统信息;
判断所述线上系统的系统信息是否在所述系统调试环境中存在;
所述激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的Token,包括:
若所述线上系统的系统信息在所述系统调试环境中存在,则激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的Token;
若所述线上系统的系统信息在所述系统调试环境中未存在,则在所述系统调试环境中创建与所述线上系统所对应的容器调试环境,激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的Token。
上述方案中,所述在所述系统调试环境中创建与所述线上系统所对应的容器调试环境之后,所述方法还包括:
在完成所述对应的容器调试环境的调试后,更新所述系统调试环境,得到更新后的系统调试环境。
上述方案中,所述方法还包括:
监听所述线上系统是否出现故障。
上述方案中,所述在确定接收到的Token为所述编号唯一的Token时,根据调试指令及获取到的所述线上系统的故障信息对所述对应的容器调试环境进行调试,包括:
通过网页作为调试接口接收输入的Token,并判断所述输入的Token是否为所述编号唯一的Token;
在确定所述输入的Token为所述编号唯一的Token时,接收输入的调试指令;
根据所述输入的调试指令及获取到的所述线上系统的故障信息对所述对应的容器调试环境进行调试;
将所述对应的容器调试环境反馈的分析结果呈现。
本发明还提供一种系统故障的调试装置,所述装置包括:
调试环境服务模块,用于在监听到线上系统出现故障后,激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的令牌Token;其中,所述系统调试环境是通过开源的应用容器引擎Docker集群技术及轻量级容器技术预先部署好的,所述系统调试环境中存在有至少一个容器调试环境,所述容器调试环境都处于睡眠等待状态,所述容器调试环境存储有对应的线上系统的系统信息;
接口服务模块,用于在确定接收到的Token为所述编号唯一的Token时,根据调试指令及获取到的所述线上系统的故障信息对所述对应的容器调试环境进行调试,并将所述对应的容器调试环境反馈的分析结果呈现。
上述方案中,所述装置还包括:
监听服务模块,用于获取所述线上系统的系统信息;
所述调试环境服务模块,还用于判断所述线上系统的系统信息是否在所述系统调试环境中存在;
所述调试环境服务模块,还具体用于若所述线上系统的系统信息在所述系统调试环境中存在,则激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的Token;
所述调试环境服务模块,还具体用于若所述线上系统的系统信息在所述系统调试环境中未存在,则在所述系统调试环境中创建与所述线上系统所对应的容器调试环境,激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的Token。
上述方案中,
所述调试环境服务模块,还用于在根据调试指令对所述对应的容器调试环境进行调试并完成调试后,更新所述系统调试环境,得到更新后的系统调试环境。
上述方案中,所述监听服务模块,还用于监听所述线上系统是否出现故障。
上述方案中,
所述接口服务模块,具体用于通过网页作为调试接口接收输入的Token,并判断所述输入的Token是否为所述编号唯一的Token;在确定所述输入的Token为所述编号唯一的Token时,接收输入的调试指令;
所述调试环境服务模块,还用于根据所述输入的调试指令及获取到的所述线上系统的故障信息对所述对应的容器调试环境进行调试;
所述接口服务模块,还具体用于将所述对应的容器调试环境反馈的分析结果呈现。
本发明实施例提供的系统故障的调试方法及装置,通过在监听到线上系统出现故障后,激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的Token;其中,其中,所述系统调试环境是通过Docker集群技术及轻量级容器技术预先部署好的,所述系统调试环境中存在有至少一个容器调试环境,所述容器调试环境都处于睡眠等待状态,所述容器调试环境存储有对应的线上系统的系统信息;在确定接收到的Token为所述编号唯一的Token时,根据调试指令及获取到的所述线上系统的故障信息对所述对应的容器调试环境进行调试;将所述对应的容器调试环境反馈的分析结果呈现;本发明实施例的方法,能够对调试环境的快速配置部署以及能够兼容多种不同配置的调试环境,使调试分析人员无需等待就可以进行调试操作,能够进行快速响应,提高了工作效率。
附图说明
图1为现有的系统故障的调试方法的流程图;
图2为本发明系统故障的调试方法实施例一的流程图;
图3为本发明系统故障的调试方法实施例二的流程图;
图4为本发明系统故障的调试方法实施例二的系统故障的调试装置的结构框架图;
图5为本发明系统故障的调试装置实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
图2为本发明系统故障的调试方法实施例一的流程图,如图1所示,本发明实施例提供的系统故障的调试方法可以应用在系统故障的调试装置(以下简称调试装置)上,该方法可以包括如下步骤:
步骤201、在监听到线上系统出现故障后,激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的令牌Token。
调试装置在监听到线上系统出现故障后,激活存在系统调试环境中与该线上系统所对应的容器调试环境,并生成编号唯一的令牌Token;其中,所述系统调试环境是通过开源的应用容器引擎Docker集群技术及轻量级容器技术预先部署好的,所述系统调试环境中存在有至少一个容器调试环境,所述容器调试环境都处于睡眠等待状态,所述容器调试环境存储有对应的线上系统的系统信息;若所述系统调试环境中存在有多个容器调试环境时,则它们各自都不相同,每一个容器调试环境都存储有各自对应的线上系统的系统信息。
调试装置在生成编号唯一的Token后,会通给调试分析人员。
利用Docker集群技术及轻量级容器技术预先部署好系统调试环境,这样能够做到秒级部署以及能够兼容多种不同配置的系统环境,使调试分析人员基本无需等待就可以进行调试操作。
步骤202、在确定接收到的Token为所述编号唯一的Token时,根据调试指令及获取到的所述线上系统的故障信息对所述对应的容器调试环境进行调试。
调试装置通过网页作为与调试分析人员的接入点,调试分析人员通过网页输入Token,在确定接收到的Token为之前分配生成的所述编号唯一的Token时,根据调试指令及在线获取到的线上系统的故障信息对所述对应的容器调试环境进行调试。
通过网页作为调试接入点,调试分析人员不再依赖特殊系统环境,无需花费大量时间和精力去自行部署调试环境,也不再依赖调试环境,只要网络条件满足,就可以随时随地进行在线调试;另外,通过在线获取线上系统的故障信息,不再需要做宕机系统内存现场文件拷贝或者下载,节省了磁盘空间和下载等待时间。
步骤203、将所述对应的容器调试环境反馈的分析结果呈现。
调试装置将对应的容器调试环境反馈的分析结果呈现出来,供调试分析人员进行后续操作。
本发明实施例提供的系统故障的调试方法,调试装置通过在监听到线上系统出现故障后,激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的Token;其中,其中,所述系统调试环境是通过Docker集群技术及轻量级容器技术预先部署好的,所述系统调试环境中存在有至少一个容器调试环境,所述容器调试环境都处于睡眠等待状态,所述容器调试环境存储有对应的线上系统的系统信息;在确定接收到的Token为所述编号唯一的Token时,根据调试指令及获取到的所述线上系统的故障信息对所述对应的容器调试环境进行调试;将所述对应的容器调试环境反馈的分析结果呈现;本发明实施例的方法,能够对调试环境的快速配置部署以及能够兼容多种不同配置的调试环境,使调试分析人员无需等待就可以进行调试操作,能够进行快速响应,提高了工作效率。
为了更加体现出本发明的目的,在上述实施例的基础上,进一步的举例说明。
图3为本发明系统故障的调试方法实施例二的流程图,图4为本发明系统故障的调试方法实施例二的系统故障的调试装置的结构框架图,如图4所示,本发明实施例提供的系统故障的调试方法应用在系统故障的调试装置上,该装置包括了监听服务模块、调试环境服务模块、接口服务模块;其中,监听服务模块与线上系统通过网络互联,实时监控线上系统状态以及获取出现宕机故障时的系统内存信息;调试环境服务模块与服务器通过网络互联,实时获取服务器中的各种线上系统的调试内核。
具体的,本发明实施例提供的系统故障的调试方法对应于出现宕机故障时的处理,如图3所示,该方法可以包括如下步骤:
步骤301、监听线上系统是否出现故障。
监听服务模块监听线上系统是否出现宕机故障,若监听到线上系统未出现宕机故障,则执行步骤302;若监听到线上系统出现宕机故障,则执行步骤303。
步骤302、结束任务。
监听服务模块结束当前处理任务。
步骤303、获取所述线上系统的系统信息。
调试环境服务模块获取所述线上系统的系统信息。
步骤304、判断所述线上系统的系统信息是否在所述系统调试环境中存在。
调试环境服务模块判断所述线上系统的系统信息是否在所述系统调试环境中存在,若所述线上系统的系统信息在所述系统调试环境中存在,则执行步骤305;若所述线上系统的系统信息在所述系统调试环境中未存在,则执行步骤306。
其中,所述系统调试环境是通过Docker集群技术及轻量级容器技术预先部署好的,所述系统调试环境中存在有至少一个轻量级容器调试环境,所述容器调试环境都处于睡眠等待状态,所述容器调试环境存储有对应的线上系统的系统信息;若所述系统调试环境中存在有多个轻量级容器调试环境时,则它们各自都不相同,每一个轻量级容器调试环境都存储有各自对应的线上系统的系统信息。
例如,调试环境服务模块使用Docker集群技术及轻量级容器技术预先搭载好一系列的与现有线上系统一致且轻量级的容器调试环境,并都处于睡眠等待状态,这些容器调试环境都存储在系统调试环境中。
步骤305、激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的Token。
调试环境服务模块激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的Token;例如,调试环境服务模块在确定出系统调试环境中存在有线上系统对应的容器调试环境后,会快速反应,并可以在1秒内激活,启动早已经部署好的、对应的容器调试环境,并生成编号唯一的Token。
步骤306、在所述系统调试环境中创建与所述线上系统所对应的容器调试环境,激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的Token。
调试环境服务模块在所述系统调试环境中创建与所述线上系统所对应的容器调试环境,激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的Token;例如,如果调试环境服务模块确定出线上系统所对应的容器调试环境缺失,则首先会根据当前线上系统的环境要求触发自动部署机制,实现在系统调试环境中自动构建与当前线上系统一致的所对应的容器调试环境,之后,激活该对应的容器调试环境,并生成编号唯一的Token。
步骤307、将编号唯一的Token通知给调试分析人员。
接口服务模块将调试环境服务模块生成的编号唯一的Token通知给调试分析人员;例如,接口服务模块可以通过邮件等方式将调试环境服务模块生成的编号唯一的Token通知给调试分析人员。
步骤308、通过网页作为调试接口接收输入的Token,并判断所述输入的Token是否为所述编号唯一的Token。
接口服务模块将调试接口以网页方式与调试分析人员进行交互及命令数据的收发,在调试分析人员登陆调试服务器之后,在网页上输入Token,接口服务模块判断调试分析人员输入的Token是否为调试环境服务模块生成的编号唯一的Token,若判断出输入的Token不是所述编号唯一的Token,则执行步骤309;若判断出输入的Token为所述编号唯一的Token,则执行步骤310。
调试人员在登陆调试服务器之后,需要通过唯一的Token接入对应调试环境;同时通过网页作为调试接口,调试人员脱离了对调试环境的依赖,可以通过PC机器、手机、等手持设备进行登陆并发送调试指令。
步骤309、结束任务。
接口服务模块结束当前处理任务。
步骤310、接收输入的调试指令。
接口服务模块接收调试分析人员在网页上输入的调试指令,将该调试指令发送至调试环境服务模块。
步骤311、根据所述输入的调试指令及获取到的所述线上系统的故障信息对所述对应的容器调试环境进行调试。
调试环境服务模块根据调试分析人员输入的调试指令及通过监听服务模块获取到的当前线上系统的故障信息,对当前线上系统所对应的容器调试环境进行调试、分析等处理。
步骤312、将所述对应的容器调试环境反馈的分析结果呈现。
接口服务模块将对应的容器调试环境反馈的分析结果在网页上呈现出来,供调试分析人员参考和使用。
步骤313、在完成调试后,更新所述系统调试环境,得到更新后的系统调试环境。
调试环境服务模块在完成调试后,会更新系统调试环境,将新添加的容器调试环境存入系统调试环境中,形成更新后的系统调试环境,以备下次快速响应。
本发明实施例提供的系统故障的调试方法,调试装置通过监听线上系统是否出现故障;在出现故障后获取所述线上系统的系统信息;判断所述线上系统的系统信息是否在所述系统调试环境中存在,若存在,则激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的Token;若不存在,则在所述系统调试环境中创建与所述线上系统所对应的容器调试环境,激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的Token;将编号唯一的Token通知给调试分析人员;通过网页作为调试接口接收输入的Token,并判断所述输入的Token是否为所述编号唯一的Token;在确定所述输入的Token为所述编号唯一的Token后,接收输入的调试指令;根据所述输入的调试指令及获取到的所述线上系统的故障信息对所述对应的容器调试环境进行调试;将所述对应的容器调试环境反馈的分析结果呈现;在完成调试后,更新所述系统调试环境,得到更新后的系统调试环境;通过本发明提供的方法,能够对调试环境的快速配置部署以及能够兼容多种不同配置的调试环境,使调试分析人员无需等待就可以进行调试操作,能够进行快速响应,提高了工作效率;进一步的,调试分析人员不再需要花费大量时间和精力去自行部署调试环境,也不再依赖调试环境,只要网络条件满足,就可以随时随地进行在线调试,另外,通过在线获取线上系统的故障信息,不再需要做宕机系统内存现场文件拷贝或者下载,节省了磁盘空间和下载等待时间。
图5为本发明系统故障的调试装置实施例的结构示意图,如图5所示,本发明实施例提供的系统故障的调试装置05包括:调试环境服务模块51、接口服务模块52;其中,
所述调试环境服务模块51,用于在监听到线上系统出现故障后,激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的令牌Token;其中,所述系统调试环境是通过开源的应用容器引擎Docker集群技术及轻量级容器技术预先部署好的,所述系统调试环境中存在有至少一个容器调试环境,所述容器调试环境都处于睡眠等待状态,所述容器调试环境存储有对应的线上系统的系统信息;
所述接口服务模块52,用于在确定接收到的Token为所述编号唯一的Token时,根据调试指令及获取到的所述线上系统的故障信息对所述对应的容器调试环境进行调试,并将所述对应的容器调试环境反馈的分析结果呈现。
进一步的,所述装置还包括:监听服务模块53;其中,
所述监听服务模块53,用于获取所述线上系统的系统信息;
所述调试环境服务模块51,还用于判断所述线上系统的系统信息是否在所述系统调试环境中存在;
所述调试环境服务模块51,还具体用于若所述线上系统的系统信息在所述系统调试环境中存在,则激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的Token;
所述调试环境服务模块51,还具体用于若所述线上系统的系统信息在所述系统调试环境中未存在,则在所述系统调试环境中创建与所述线上系统所对应的容器调试环境,激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的Token。
进一步的,
所述调试环境服务模块51,还用于在根据调试指令对所述对应的容器调试环境进行调试并完成调试后,更新所述系统调试环境,得到更新后的系统调试环境。
进一步的,所述监听服务模块53,还用于监听所述线上系统是否出现故障。
进一步的,
所述接口服务模块52,具体用于通过网页作为调试接口接收输入的Token,并判断所述输入的Token是否为所述编号唯一的Token;在确定所述输入的Token为所述编号唯一的Token时,接收输入的调试指令;
所述调试环境服务模块51,还用于根据所述输入的调试指令及获取到的所述线上系统的故障信息对所述对应的容器调试环境进行调试;
所述接口服务模块52,还具体用于将所述对应的容器调试环境反馈的分析结果呈现。
本实施例的装置,可以用于执行上述所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
在实际应用中,所述调试环境服务模块51、接口服务模块52、监听服务模块53均可由位于系统故障的调试装置05中的中央处理器(Central Processing Unit,CPU)、微处理器(Micro Processor Unit,MPU)、数字信号处理器(Digital Signal Processor,DSP)或现场可编程门阵列(Field Programmable Gate Array,FPGA)等实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (10)

1.一种系统故障的调试方法,其特征在于,所述方法包括:
在监听到线上系统出现故障后,激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的令牌Token;其中,所述系统调试环境是通过开源的应用容器引擎Docker集群技术及轻量级容器技术预先部署好的,所述系统调试环境中存在有至少一个容器调试环境,所述容器调试环境都处于睡眠等待状态,所述容器调试环境存储有对应的线上系统的系统信息;
在确定通过调试接口接收到的Token为所述编号唯一的Token时,根据调试指令及获取到的所述线上系统的故障信息对所述对应的容器调试环境进行调试,并将所述对应的容器调试环境反馈的分析结果呈现。
2.根据权利要求1所述的方法,其特征在于,所述在监听到线上系统出现故障后,所述方法还包括:
获取所述线上系统的系统信息;
判断所述线上系统的系统信息是否在所述系统调试环境中存在;
所述激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的Token,包括:
若所述线上系统的系统信息在所述系统调试环境中存在,则激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的Token;
若所述线上系统的系统信息在所述系统调试环境中未存在,则在所述系统调试环境中创建与所述线上系统所对应的容器调试环境,激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的Token。
3.根据权利要求2所述的方法,其特征在于,所述在所述系统调试环境中创建与所述线上系统所对应的容器调试环境之后,所述方法还包括:
在完成所述对应的容器调试环境的调试后,更新所述系统调试环境,得到更新后的系统调试环境。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
监听所述线上系统是否出现故障。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述在确定接收到的Token为所述编号唯一的Token时,根据调试指令及获取到的所述线上系统的故障信息对所述对应的容器调试环境进行调试,包括:
通过网页作为调试接口接收输入的Token,并判断所述输入的Token是否为所述编号唯一的Token;
在确定所述输入的Token为所述编号唯一的Token时,接收输入的调试指令;
根据所述输入的调试指令及获取到的所述线上系统的故障信息对所述对应的容器调试环境进行调试;
将所述对应的容器调试环境反馈的分析结果呈现。
6.一种系统故障的调试装置,其特征在于,所述装置包括:
调试环境服务模块,用于在监听到线上系统出现故障后,激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的令牌Token;其中,所述系统调试环境是通过开源的应用容器引擎Docker集群技术及轻量级容器技术预先部署好的,所述系统调试环境中存在有至少一个容器调试环境,所述容器调试环境都处于睡眠等待状态,所述容器调试环境存储有对应的线上系统的系统信息;
接口服务模块,用于在确定通过调试接口接收到的Token为所述编号唯一的Token时,根据调试指令及获取到的所述线上系统的故障信息对所述对应的容器调试环境进行调试,并将所述对应的容器调试环境反馈的分析结果呈现。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
监听服务模块,用于获取所述线上系统的系统信息;
所述调试环境服务模块,还用于判断所述线上系统的系统信息是否在所述系统调试环境中存在;
所述调试环境服务模块,还具体用于若所述线上系统的系统信息在所述系统调试环境中存在,则激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的Token;
所述调试环境服务模块,还具体用于若所述线上系统的系统信息在所述系统调试环境中未存在,则在所述系统调试环境中创建与所述线上系统所对应的容器调试环境,激活所述系统调试环境中与所述线上系统所对应的容器调试环境,并生成编号唯一的Token。
8.根据权利要求6所述的装置,其特征在于,
所述调试环境服务模块,还用于在根据调试指令对所述对应的容器调试环境进行调试并完成调试后,更新所述系统调试环境,得到更新后的系统调试环境。
9.根据权利要求7所述的装置,其特征在于,所述监听服务模块,还用于监听所述线上系统是否出现故障。
10.根据权利要求6至9任一项所述的装置,其特征在于,
所述接口服务模块,具体用于通过网页作为调试接口接收输入的Token,并判断所述输入的Token是否为所述编号唯一的Token;在确定所述输入的Token为所述编号唯一的Token时,接收输入的调试指令;
所述调试环境服务模块,还用于根据所述输入的调试指令及获取到的所述线上系统的故障信息对所述对应的容器调试环境进行调试;
所述接口服务模块,还具体用于将所述对应的容器调试环境反馈的分析结果呈现。
CN201611227433.6A 2016-12-27 2016-12-27 系统故障的调试方法及装置 Active CN108241545B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611227433.6A CN108241545B (zh) 2016-12-27 2016-12-27 系统故障的调试方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611227433.6A CN108241545B (zh) 2016-12-27 2016-12-27 系统故障的调试方法及装置

Publications (2)

Publication Number Publication Date
CN108241545A CN108241545A (zh) 2018-07-03
CN108241545B true CN108241545B (zh) 2021-06-08

Family

ID=62702731

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611227433.6A Active CN108241545B (zh) 2016-12-27 2016-12-27 系统故障的调试方法及装置

Country Status (1)

Country Link
CN (1) CN108241545B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109960657B (zh) * 2019-03-26 2023-05-12 浪潮商用机器有限公司 一种测试环境部署方法及相关装置
CN112148420B (zh) * 2019-06-28 2024-04-02 杭州海康威视数字技术股份有限公司 基于容器技术的异常任务处理方法、服务器及云平台
CN114691486A (zh) * 2020-12-30 2022-07-01 腾讯科技(深圳)有限公司 程序调试方法、装置及计算机设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101056216A (zh) * 2006-04-10 2007-10-17 华为技术有限公司 一种测试系统和测试方法
CN101303664A (zh) * 2008-06-19 2008-11-12 腾讯科技(深圳)有限公司 一种专业快速测试装置和方法
CN102650967A (zh) * 2011-02-24 2012-08-29 上海宝信软件股份有限公司 分布式信息系统的集中式远程调试方法
CN102694698A (zh) * 2012-06-07 2012-09-26 浪潮电子信息产业股份有限公司 一种快速建立小型网络测试系统的方法
CN105138765A (zh) * 2015-08-21 2015-12-09 中国科学院自动化研究所 基于Docker的人工交通系统大规模计算实验方法
CN105607998A (zh) * 2015-12-11 2016-05-25 成都新兴信息技术研究所 一种通过在线方式进行嵌入软件调试的系统与方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9672120B2 (en) * 2014-06-28 2017-06-06 Vmware, Inc. Maintaining consistency using reverse replication during live migration

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101056216A (zh) * 2006-04-10 2007-10-17 华为技术有限公司 一种测试系统和测试方法
CN101303664A (zh) * 2008-06-19 2008-11-12 腾讯科技(深圳)有限公司 一种专业快速测试装置和方法
CN102650967A (zh) * 2011-02-24 2012-08-29 上海宝信软件股份有限公司 分布式信息系统的集中式远程调试方法
CN102694698A (zh) * 2012-06-07 2012-09-26 浪潮电子信息产业股份有限公司 一种快速建立小型网络测试系统的方法
CN105138765A (zh) * 2015-08-21 2015-12-09 中国科学院自动化研究所 基于Docker的人工交通系统大规模计算实验方法
CN105607998A (zh) * 2015-12-11 2016-05-25 成都新兴信息技术研究所 一种通过在线方式进行嵌入软件调试的系统与方法

Also Published As

Publication number Publication date
CN108241545A (zh) 2018-07-03

Similar Documents

Publication Publication Date Title
US10152382B2 (en) Method and system for monitoring virtual machine cluster
US7694181B2 (en) Automated software testing framework
CN107463362B (zh) 基于多个Jenkins的持续部署的方法和系统
US20150100829A1 (en) Method and system for selecting and executing test scripts
US20150100832A1 (en) Method and system for selecting and executing test scripts
CN109739744B (zh) 一种测试系统及方法
EP3495946A1 (en) Server updates
US20150100830A1 (en) Method and system for selecting and executing test scripts
US8914329B1 (en) Automated time-based testing method for distributed system
CN108241545B (zh) 系统故障的调试方法及装置
US20150100831A1 (en) Method and system for selecting and executing test scripts
CN110727575B (zh) 一种信息处理方法、系统、装置、以及存储介质
CN104539487A (zh) 一种基于云平台的系统测试及可靠性评估方法
CN104199694A (zh) 一种基于pxe的操作系统自动安装与恢复方法
CN110908674A (zh) 应用程序的自动化部署方法及装置
CN107797914A (zh) 代码处理方法、装置及代码发布系统
CN109901985B (zh) 分布式测试装置及方法、存储介质和电子设备
CN109905263A (zh) 一种自动化运维部署系统
CN111258591A (zh) 程序部署任务执行方法、装置、计算机设备和存储介质
CN111769979A (zh) 一种云资源编排方法、系统、终端及存储介质
CN110865840A (zh) 一种应用管理方法、装置、服务器及存储介质
CN107678969B (zh) 测试版本发布方法、装置、版本控制设备和测试机
CN114338363A (zh) 一种持续集成方法、装置、设备及存储介质
CN105224453A (zh) 系统兼容性的自动测试方法及装置
CN105897487B (zh) 用于运维系统的设备管理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant