CN108427627A - 统计系统稳定性的方法及装置和电子设备 - Google Patents

统计系统稳定性的方法及装置和电子设备 Download PDF

Info

Publication number
CN108427627A
CN108427627A CN201810111459.7A CN201810111459A CN108427627A CN 108427627 A CN108427627 A CN 108427627A CN 201810111459 A CN201810111459 A CN 201810111459A CN 108427627 A CN108427627 A CN 108427627A
Authority
CN
China
Prior art keywords
service
goal systems
unavailable
moment
availability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810111459.7A
Other languages
English (en)
Inventor
黄居华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201810111459.7A priority Critical patent/CN108427627A/zh
Publication of CN108427627A publication Critical patent/CN108427627A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本说明书实施例提供一种统计系统稳定性的方法及装置和电子设备,所述方法包括:根据预先配置的针对至少一个系统的可用性检测任务,向检测系统发起服务可用性检测请求,以使所述检测系统对所述系统进行服务可用性检测;接收所述检测系统返回的对应所述系统的检测结果;对于所述检测结果为服务不可用的目标系统,记录所述目标系统的服务不可用时刻;在接收到所述目标系统的服务恢复时,记录所述目标系统的服务恢复时刻;根据所述服务不可用时刻和服务恢复时刻计算所述目标系统的服务不可用的持续时长。

Description

统计系统稳定性的方法及装置和电子设备
技术领域
本说明书实施例涉及互联网技术领域,尤其涉及一种统计系统稳定性的方法及装置和电子设备。
背景技术
服务器可能系统load过高,或者内存不足,一些服务进程可能不稳定,偶尔会自动异常终止,需要一个监控程序脚本来对这个进程进行监控,当发现被监控的服务进程异常终止或不能正常提供服务了,将其启动或重新启动,且运维数据自动保留分析环境稳定性。
需要提供一种更有效率的统计系统稳定性的方案。
发明内容
本说明书实施例提供的一种统计系统稳定性的方法及装置和电子设备:
根据本说明书实施例的第一方面,提供一种统计系统稳定性的方法,所述方法包括:
根据预先配置的针对至少一个系统的可用性检测任务,向检测系统发起服务可用性检测请求,以使所述检测系统对所述系统进行服务可用性检测;
接收所述检测系统返回的对应所述系统的检测结果;
对于所述检测结果为服务不可用的目标系统,记录所述目标系统的服务不可用时刻;
在接收到所述目标系统的服务恢复时,记录所述目标系统的服务恢复时刻;
根据所述服务不可用时刻和服务恢复时刻计算所述目标系统的服务不可用的持续时长。
可选的,所述向检测系统发起服务可用性检测请求,具体包括:
生成针对所述至少一个系统的可用性检测的检测脚本;
将所述检测脚本发送给检测系统。
可选的,所述可用性检测任务为对配置的所有系统周期性地进行服务可用性检测。
可选的,所述服务不可用时刻为接收到目标系统的服务不可用时的时间戳;
或者,
发送重启所述目标系统不可用服务的指令时的时间戳。
可选的,对于所述检测结果为服务不可用的目标系统,所述方法还包括:
向所述服务恢复系统发送服务恢复请求,以使所述检测系统重启服务不可用的目标系统。
可选的,所述方法还包括:
统计所述预先配置的至少一个系统的服务重启次数;
和/或,
统计所述预先配置的至少一个系统发生服务不可用的次数;
和/或,
统计所述预先配置的至少一个系统的服务重启次数,计算重启频率。
根据本说明书实施例的第二方面,提供一种统计系统稳定性的装置,所述装置包括:
检测单元,根据预先配置的针对至少一个系统的可用性检测任务,向检测系统发起服务可用性检测请求,以使所述检测系统对所述系统进行服务可用性检测;
接收单元,接收所述检测系统返回的对应所述系统的检测结果;
第一记录单元,对于所述检测结果为服务不可用的目标系统,记录所述目标系统的服务不可用时刻;
第二记录单元,在接收到所述目标系统的服务恢复时,记录所述目标系统的服务恢复时刻;
计算单元,根据所述服务不可用时刻和服务恢复时刻计算所述目标系统的服务不可用的持续时长。
可选的,所述检测单元,具体包括:
生成子单元,根据预先配置的针对至少一个系统的可用性检测任务,生成针对所述至少一个系统的可用性检测的检测脚本;
发送子单元,将所述检测脚本发送给检测系统。
可选的,所述可用性检测任务为对配置的所有系统周期性地进行服务可用性检测。
可选的,所述服务不可用时刻为接收到目标系统的服务不可用时的时间戳;
或者,
发送重启所述目标系统不可用服务的指令时的时间戳。
可选的,对于所述检测结果为服务不可用的目标系统,所述装置还包括:
恢复子单元,向所述服务恢复系统发送服务恢复请求,以使所述检测系统重启服务不可用的目标系统。
可选的,所述装置还包括:
第一统计子单元,统计所述预先配置的至少一个系统的服务重启次数;
和/或,
第二统计子单元,统计所述预先配置的至少一个系统发生服务不可用的次数;
和/或,
第三统计子单元,统计所述预先配置的至少一个系统的服务重启次数,计算重启频率。
根据本说明书实施例的第三方面,提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为实现上述任一统计系统稳定性的方法。
本说明书实施例,提供了一种统计系统稳定性的方案,通过环境大盘用户只需要简单的选择需要检测的系统服务即可,而无需用户针对每个系统编写检测脚本,由环境大盘自动生成用于进行可用性检测的脚本,并自动向检测系统发送检测请求从而实线可用性检测。另一方面,环境大盘可以自动记录服务不可用系统的服务不可用时刻以及服务恢复时刻;并可以统计预设周期内各个系统服务不可用的时长、服务不可用的次数、系统服务重启的次数等反映系统稳定性的参数,从而便于用户直观的获知各个系统的稳定性。再一方面,环境大盘可以自动恢复系统不可用的服务。
附图说明
图1是本说明书一实施例提供的统计系统稳定性的方法的流程图;
图2是本说明书一实施例提供的具体地业务流程的示意图;
图3是本说明书一实施例提供的统计系统稳定性的装置的模块示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。
在本说明书使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
相关技术中,检测服务可用性以及恢复不可用服务的方式如下:
一般需要编写一个shell(计算机壳体)监控脚本,并在系统的crontab中将该脚本配置为定期自动执行。例如可以配置为5分钟执行一次服务可用性检测。监控脚本可以通过监控服务进程的端口或者日志文件的修改时间等判断目标系统的服务是否存在异常中止或者不能正常提供服务,在识别出目标系统的服务存在异常中止或者不能正常提供服务的情况下,确定所述目标系统的服务可不用,进而可以恢复该不可用的服务。
以下可以结合图1所示的例子介绍本说明书一种实现统计系统稳定性的方法的实施例,如图1所示,该方法可以包括以下步骤:
步骤210:根据预先配置的针对至少一个系统的可用性检测任务,向检测系统发起服务可用性检测请求,以使所述检测系统对所述系统进行服务可用性检测;
步骤220:接收所述检测系统返回的对应所述系统的检测结果;
步骤230:对于所述检测结果为服务不可用的目标系统,记录所述目标系统的服务不可用时刻;
步骤240:在接收到所述目标系统的服务恢复时,记录所述目标系统的服务恢复时刻;
步骤250:根据所述服务不可用时刻和服务恢复时刻计算所述目标系统的服务不可用的持续时长。
以下以图2所示的一个具体地业务流程的示意图,可以包括环境大盘、检测系统、服务恢复系统、目标系统。其中,所述环境大盘、检测系统和服务恢复系统可以是集成在一起的,也可以是相互独立的。由于环境大盘可以是一个抽象的概念,也就是说在有的实施例中,所述环境大盘、检测系统、服务恢复系统可以是一个系统,该系统分别具有环境大盘、检测系统、服务恢复系统的功能。所述环境大盘用于根据预先配置的可用性检测任务控制所述检测系统对目标系统进行可用性检测,在检测到目标系统服务不可用时,还可以控制服务恢复系统重启不可用服务,并且记录目标系统服务不可用时刻以及服务恢复时刻,从而统计目标系统的稳定性数据。所述目标系统可以是指进行可用性检测的系统。具体地,如图2所示:
1:环境大盘可以获取当前配置的针对至少一个系统的可用性检测任务。
所述环境大盘,可以供用户配置需要检测的系统、服务,例如自定义每个服务的可用性监控策略。
2:环境大盘根据所述配置的针对至少一个系统的可用性检测任务,向检测系统发起服务可用性检测请求。
在一个实施例中,所述可用性检测任务为对配置的所有系统周期性地进行服务可用性检测。环境大盘中用户还可以配置可用性检测的周期,例如可以设置5分钟检测一次。那么,环境大盘就可以每5分钟向检测系统发起针对至配置的所有系统的可用性检测请求。一般的,环境大盘可以启动一个定时器,在该定时器到达预设时长(周期)的情况下,向检测系统发发起针对至配置的所有系统的可用性检测请求。所述预设时长可以是人为设置的一个经验值。
在一实施例中,所述向检测系统发起服务可用性检测请求,具体包括:
生成针对所述至少一个系统的可用性检测的检测脚本;
将所述检测脚本发送给检测系统。
如此,环境大盘可以自动生成针对用户配置的系统的检测脚本,并可以将该检测脚本发送给检测系统,以使检测系统运行检测脚本实现对系统的可用性检测。
在另一个实施例中,环境大盘向检测系统发起服务可用性检测请求之后,由检测系统自动生成针对用户配置的系统的检测脚本,从而实现对系统的可用性检测。
3:检测系统根据所述环境大盘发起的可用性检测请求,对配置的所有系统进行可用性检测。
在一个实施例中,检测系统可以监控目标系统的服务进程的端口,当服务进程的端口不通时,说明该目标系统的服务不可用。
所述端口可以是指接口电路中的一些寄存器,这些寄存器分别用来存放数据信息、控制信息和状态信息等。相应的,端口分别可以称为数据端口、控制端口和状态端口等。对于提供服务的系统来说,系统就是对外开放了可以调用相应服务的端口,这样外部用户就可以通过这些端口向系统获取服务了。通常,系统正常提供服务的话,该服务对应的端口必须是打开的;如果端口关闭,那么外部用户也就无法使用系统提供的服务。
在一个实施例中,检测系统可以监控目标系统的服务进程的日志,然后根据日志中记录的最后修改时刻与系统当前时刻,在这两个时刻之间的差值超过阈值的时,说明该目标系统的服务不能正常提供服务,即服务不可用。
当然,在实际应用中,还可以通过其它手段来检测目标系统的服务是否不可用,此处不再一一赘述。
4:所述检测系统获取针对系统的检测结果,并将所述检测结果返回给所述环境大盘。
5:所述环境大盘接收所述检测系统返回的对应所述系统的检测结果。
6.1:对所述检测结果为服务不可用的目标系统,所述环境大盘可以记录该目标系统的服务不可用时刻。
在一实施例中,所述服务不可用时刻可以为接收到目标系统的服务不可用时的时间戳;或者,
发送重启所述目标系统不可用服务的指令时的时间戳;
或者,
目标系统返回的服务不可用时的时间戳。
6.2:对所述检测结果为服务不可用的目标系统,所述环境大盘向所述服务恢复系统发送服务恢复请求,以使所述检测系统重启服务不可用的目标系统。
7:所述服务恢复系统根据所述环境大盘发起的服务恢复请求,重启目标系统不可用的服务。
8:所述服务恢复系统在获取到所述目标系统的不可用服务恢复时,向所述环境大盘返回所述恢复结果。
一般情况下,服务恢复系统都会设置有重试机制。即如果首次重启目标系统不可用的服务失败的话,还会重复执行重启服务的操作。当然,考虑到有些服务并不是重启就可以解决的,在到达一定条件的情况下,服务恢复系统可以停止重试,向所述环境大盘返回无法恢复的结果。
在一实施例中。所述条件,可以例如,重启次数到达预设次数,即当重启次数到达预设次数时,服务恢复系统可以停止重试,向所述环境大盘返回无法恢复的结果。
在一个实施例中,对于无法恢复服务的系统,所述服务恢复系统可以通知运维系统,供运维系统处理。
9:在接收到所述目标系统的服务恢复时,所述环境大盘可以记录所述目标系统的服务恢复时刻。
10:所述环境大盘根据所述服务不可用时刻和服务恢复时刻计算所述目标系统的服务不可用的持续时长。
例如,计算服务恢复时刻与服务不可用时刻之间的时间差,将所述时间差作为目标系统服务不可用的持续时长。
举例说明,用户可以配置针对系统A和系统B的可用性检测任务。如此,环境大盘可以根据配置的可用性检测任务,向检测系统发起针对系统A和系统B的可用性检测请求。假设环境大盘接收所述检测系统返回的系统A的检测结果为服务不可用,系统B的检测结果为服务可用;则环境大盘记录系统A服务不可用时刻为t1。然后,环境大盘向服务恢复系统发起针对系统A的服务恢复请求。当环境大盘接收所述服务恢复系统返回的恢复结果为服务恢复成功时,记录系统A服务恢复时刻为t2。在环境大盘可以根据t1和t2,求出时间差作为系统A服务不可用时长。
在一个实施中,所述方法还可以包括:
统计所述预先配置的至少一个系统的服务重启次数,计算重启频率。
统计所述预先配置的至少一个系统发生服务不可用的次数。
本说明书提供的环境大盘,用户只需要简单的选择需要检测的系统服务即可,而无需用户针对每个系统编写检测脚本,由环境大盘自动生成用于进行可用性检测的脚本,并自动向检测系统发送检测请求从而实线可用性检测。另一方面,环境大盘可以自动记录服务不可用系统的服务不可用时刻以及服务恢复时刻;并可以统计预设周期内各个系统服务不可用的时长、服务不可用的次数、系统服务重启的次数等反映系统稳定性的参数,从而便于用户直观的获知各个系统的稳定性。再一方面,环境大盘可以自动恢复系统不可用的服务。
在一个实施例中,所述环境大盘还可以具有可视化子系统,所述可视化子系统可以用于供用户查看各系统稳定性参数。当
在一个实施例中,当系统服务重启次数到达阈值时,说明该系统可能存在不稳定因素,例如系统的硬件配置过低,或者软件代码出现问题等;此时可以主动提示用户,或者推送给运维系统。在一种实施例中,可视化子系统与运维系统也可以集成在一起。
与前述统计系统稳定性的方法实施例相对应,本说明书还提供了统计系统稳定性的装置的实施例。所述装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,本说明书统计系统稳定性的装置所在设备的一种硬件结构可以包括处理器、网络接口、内存以及非易失性存储器之外,实施例中装置所在的设备通常根据该统计系统稳定性的实际功能,还可以包括其他硬件,对此不再赘述。
请参见图3,为本说明书一实施例提供的统计系统稳定性的装置的模块图,所述装置对应了图1所示实施例,所述装置包括:
检测单元310,根据预先配置的针对至少一个系统的可用性检测任务,向检测系统发起服务可用性检测请求,以使所述检测系统对所述系统进行服务可用性检测;
接收单元320,接收所述检测系统返回的对应所述系统的检测结果;
第一记录单元330,对于所述检测结果为服务不可用的目标系统,记录所述目标系统的服务不可用时刻;
第二记录单元340,在接收到所述目标系统的服务恢复时,记录所述目标系统的服务恢复时刻;
计算单元350,根据所述服务不可用时刻和服务恢复时刻计算所述目标系统的服务不可用的持续时长。
在一个可选的实施例中:
所述检测单元310,具体包括:
生成子单元,根据预先配置的针对至少一个系统的可用性检测任务,生成针对所述至少一个系统的可用性检测的检测脚本;
发送子单元,将所述检测脚本发送给检测系统。
在一个可选的实施例中:
所述可用性检测任务为对配置的所有系统周期性地进行服务可用性检测。
在一个可选的实施例中:
所述服务不可用时刻为接收到目标系统的服务不可用时的时间戳;
或者,
发送重启所述目标系统不可用服务的指令时的时间戳。
在一个可选的实施例中:
对于所述检测结果为服务不可用的目标系统,所述装置还包括:
恢复子单元,向所述服务恢复系统发送服务恢复请求,以使所述检测系统重启服务不可用的目标系统。
在一个可选的实施例中:
所述装置还包括:
第一统计子单元,统计所述预先配置的至少一个系统的服务重启次数;
和/或,
第二统计子单元,统计所述预先配置的至少一个系统发生服务不可用的次数;
和/或,
第三统计子单元,统计所述预先配置的至少一个系统的服务重启次数,计算重启频率。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上图3描述了统计系统稳定性的装置的内部功能模块和结构示意,其实质上的执行主体可以为一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
根据预先配置的针对至少一个系统的可用性检测任务,向检测系统发起服务可用性检测请求,以使所述检测系统对所述系统进行服务可用性检测;
接收所述检测系统返回的对应所述系统的检测结果;
对于所述检测结果为服务不可用的目标系统,记录所述目标系统的服务不可用时刻;
在接收到所述目标系统的服务恢复时,记录所述目标系统的服务恢复时刻;
根据所述服务不可用时刻和服务恢复时刻计算所述目标系统的服务不可用的持续时长。
可选的,所述向检测系统发起服务可用性检测请求,具体包括:
生成针对所述至少一个系统的可用性检测的检测脚本;
将所述检测脚本发送给检测系统。
可选的,所述可用性检测任务为对配置的所有系统周期性地进行服务可用性检测。
可选的,所述服务不可用时刻为接收到目标系统的服务不可用时的时间戳;
或者,
发送重启所述目标系统不可用服务的指令时的时间戳。
可选的,对于所述检测结果为服务不可用的目标系统,还包括:
向所述服务恢复系统发送服务恢复请求,以使所述检测系统重启服务不可用的目标系统。
可选的,还包括:
统计所述预先配置的至少一个系统的服务重启次数;
和/或,
统计所述预先配置的至少一个系统发生服务不可用的次数;
和/或,
统计所述预先配置的至少一个系统的服务重启次数,计算重启频率。
在上述电子设备的实施例中,应理解,该处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,而前述的存储器可以是只读存储器(英文:read-only memory,缩写:ROM)、随机存取存储器(英文:random access memory,简称:RAM)、快闪存储器、硬盘或者固态硬盘。结合本发明实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于电子设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本说明书的其它实施方案。本说明书旨在涵盖本说明书的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本说明书的一般性原理并包括本说明书未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本说明书的真正范围和精神由下面的权利要求指出。
应当理解的是,本说明书并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本说明书的范围仅由所附的权利要求来限制。

Claims (13)

1.一种统计系统稳定性的方法,所述方法包括:
根据预先配置的针对至少一个系统的可用性检测任务,向检测系统发起服务可用性检测请求,以使所述检测系统对所述系统进行服务可用性检测;
接收所述检测系统返回的对应所述系统的检测结果;
对于所述检测结果为服务不可用的目标系统,记录所述目标系统的服务不可用时刻;
在接收到所述目标系统的服务恢复时,记录所述目标系统的服务恢复时刻;
根据所述服务不可用时刻和服务恢复时刻计算所述目标系统的服务不可用的持续时长。
2.根据权利要求1所述的方法,所述向检测系统发起服务可用性检测请求,具体包括:
生成针对所述至少一个系统的可用性检测的检测脚本;
将所述检测脚本发送给检测系统。
3.根据权利要求1所述的方法,所述可用性检测任务为对配置的所有系统周期性地进行服务可用性检测。
4.根据权利要求1所述的方法,所述服务不可用时刻为接收到目标系统的服务不可用时的时间戳;
或者,
发送重启所述目标系统不可用服务的指令时的时间戳。
5.根据权利要求1所述的方法,对于所述检测结果为服务不可用的目标系统,所述方法还包括:
向所述服务恢复系统发送服务恢复请求,以使所述检测系统重启服务不可用的目标系统。
6.根据权利要求1所述的方法,所述方法还包括:
统计所述预先配置的至少一个系统的服务重启次数;
和/或,
统计所述预先配置的至少一个系统发生服务不可用的次数;
和/或,
统计所述预先配置的至少一个系统的服务重启次数,计算重启频率。
7.一种统计系统稳定性的装置,所述装置包括:
检测单元,根据预先配置的针对至少一个系统的可用性检测任务,向检测系统发起服务可用性检测请求,以使所述检测系统对所述系统进行服务可用性检测;
接收单元,接收所述检测系统返回的对应所述系统的检测结果;
第一记录单元,对于所述检测结果为服务不可用的目标系统,记录所述目标系统的服务不可用时刻;
第二记录单元,在接收到所述目标系统的服务恢复时,记录所述目标系统的服务恢复时刻;
计算单元,根据所述服务不可用时刻和服务恢复时刻计算所述目标系统的服务不可用的持续时长。
8.根据权利要求7所述的装置,所述检测单元,具体包括:
生成子单元,根据预先配置的针对至少一个系统的可用性检测任务,生成针对所述至少一个系统的可用性检测的检测脚本;
发送子单元,将所述检测脚本发送给检测系统。
9.根据权利要求1所述的装置,所述可用性检测任务为对配置的所有系统周期性地进行服务可用性检测。
10.根据权利要求1所述的装置,所述服务不可用时刻为接收到目标系统的服务不可用时的时间戳;
或者,
发送重启所述目标系统不可用服务的指令时的时间戳。
11.根据权利要求1所述的装置,对于所述检测结果为服务不可用的目标系统,所述装置还包括:
恢复子单元,向所述服务恢复系统发送服务恢复请求,以使所述检测系统重启服务不可用的目标系统。
12.根据权利要求1所述的装置,所述装置还包括:
第一统计子单元,统计所述预先配置的至少一个系统的服务重启次数;
和/或,
第二统计子单元,统计所述预先配置的至少一个系统发生服务不可用的次数;
和/或,
第三统计子单元,统计所述预先配置的至少一个系统的服务重启次数,计算重启频率。
13.一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为如上权利要求1-6中任一项所述的方法。
CN201810111459.7A 2018-02-05 2018-02-05 统计系统稳定性的方法及装置和电子设备 Pending CN108427627A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810111459.7A CN108427627A (zh) 2018-02-05 2018-02-05 统计系统稳定性的方法及装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810111459.7A CN108427627A (zh) 2018-02-05 2018-02-05 统计系统稳定性的方法及装置和电子设备

Publications (1)

Publication Number Publication Date
CN108427627A true CN108427627A (zh) 2018-08-21

Family

ID=63156512

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810111459.7A Pending CN108427627A (zh) 2018-02-05 2018-02-05 统计系统稳定性的方法及装置和电子设备

Country Status (1)

Country Link
CN (1) CN108427627A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110109767A (zh) * 2019-05-10 2019-08-09 重庆八戒电子商务有限公司 一种分布式系统可用性的分析方法及系统
CN111949384A (zh) * 2019-05-14 2020-11-17 龙芯中科技术有限公司 任务调度方法、装置、设备及计算机可读存储介质
CN115994070A (zh) * 2023-03-21 2023-04-21 深圳市明源云科技有限公司 系统可用率检测方法、装置、电子设备及可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7117396B2 (en) * 2001-12-28 2006-10-03 Intel Corporation Scalable CPU error recorder
CN104391777A (zh) * 2014-11-12 2015-03-04 中标软件有限公司 基于Linux操作系统的云平台及其运行监控方法和装置
US20160321152A1 (en) * 2014-05-28 2016-11-03 International Business Machines Corporation Determining an availability score based on available resources of different resource types in a cloud computing environment of storage servers providing cloud services to customers in the cloud computing environment to determine whether to perform a failure operation for one of the storage servers
CN106155844A (zh) * 2016-07-29 2016-11-23 深圳创维数字技术有限公司 一种web服务器的自恢复方法和自恢复系统
CN106789158A (zh) * 2016-11-11 2017-05-31 工业和信息化部电信研究院 一种云服务保险定损方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7117396B2 (en) * 2001-12-28 2006-10-03 Intel Corporation Scalable CPU error recorder
US20160321152A1 (en) * 2014-05-28 2016-11-03 International Business Machines Corporation Determining an availability score based on available resources of different resource types in a cloud computing environment of storage servers providing cloud services to customers in the cloud computing environment to determine whether to perform a failure operation for one of the storage servers
CN104391777A (zh) * 2014-11-12 2015-03-04 中标软件有限公司 基于Linux操作系统的云平台及其运行监控方法和装置
CN106155844A (zh) * 2016-07-29 2016-11-23 深圳创维数字技术有限公司 一种web服务器的自恢复方法和自恢复系统
CN106789158A (zh) * 2016-11-11 2017-05-31 工业和信息化部电信研究院 一种云服务保险定损方法和系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110109767A (zh) * 2019-05-10 2019-08-09 重庆八戒电子商务有限公司 一种分布式系统可用性的分析方法及系统
CN111949384A (zh) * 2019-05-14 2020-11-17 龙芯中科技术有限公司 任务调度方法、装置、设备及计算机可读存储介质
CN111949384B (zh) * 2019-05-14 2023-05-02 龙芯中科技术股份有限公司 任务调度方法、装置、设备及计算机可读存储介质
CN115994070A (zh) * 2023-03-21 2023-04-21 深圳市明源云科技有限公司 系统可用率检测方法、装置、电子设备及可读存储介质
CN115994070B (zh) * 2023-03-21 2023-08-04 深圳市明源云科技有限公司 系统可用率检测方法、装置、电子设备及可读存储介质

Similar Documents

Publication Publication Date Title
US7934071B2 (en) Method of managing storage capacity in a storage system, a storage device and a computer system
CN107015991B (zh) 数据一致性的自检方法、装置、系统和业务装置
CN105144074B (zh) 使用混合存储器设备的块存储
US7529979B2 (en) Hardware/software based indirect time stamping methodology for proactive hardware/software event detection and control
CN108427627A (zh) 统计系统稳定性的方法及装置和电子设备
US20160378583A1 (en) Management computer and method for evaluating performance threshold value
CN110071821A (zh) 备用节点的指定
CN105893185B (zh) 一种数据备份方法和装置
US20060112308A1 (en) Selection of status data from synchronous redundant devices
CN108667740B (zh) 流量控制的方法、装置及系统
CN111342986B (zh) 分布式节点管理方法及装置、分布式系统、存储介质
CN114218037A (zh) 一种硬盘管理方法、装置、设备及机器可读存储介质
CN109104326B (zh) 超时处理方法及装置和电子设备
CN108279993B (zh) 实现业务降级的方法及装置和电子设备
CN102780872B (zh) 装置监视服务器以及装置监视系统
JP7059859B2 (ja) 制御方法、制御装置および制御プログラム
CN107392606B (zh) 账户管理方法及装置
CN112948156A (zh) 内存耗尽诊断方法、装置、系统和存储介质
CN113542398B (zh) 分布式集群系统的管控方法、装置、介质和设备
JP2020038525A (ja) 異常検知装置
CN109656901A (zh) 数据处理方法和装置、电子设备
CN111371818B (zh) 一种数据请求的验证方法、装置及设备
US20180295195A1 (en) Method and apparatus for performing storage space management for multiple virtual machines
JP2008217118A (ja) ログファイル管理装置及びログファイル送信装置及びログファイル管理方法及びログファイル送信方法及びプログラム
CN107479986A (zh) 业务流量的控制方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200924

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200924

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20180821

RJ01 Rejection of invention patent application after publication