CN111786827A - 分布式云计算环境的故障关联定位报警方法及装置 - Google Patents

分布式云计算环境的故障关联定位报警方法及装置 Download PDF

Info

Publication number
CN111786827A
CN111786827A CN202010603377.1A CN202010603377A CN111786827A CN 111786827 A CN111786827 A CN 111786827A CN 202010603377 A CN202010603377 A CN 202010603377A CN 111786827 A CN111786827 A CN 111786827A
Authority
CN
China
Prior art keywords
environment
metadata
layer
cloud computing
positioning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010603377.1A
Other languages
English (en)
Inventor
曹辉健
刘慕雨
王泽洋
黄镜澄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202010603377.1A priority Critical patent/CN111786827A/zh
Publication of CN111786827A publication Critical patent/CN111786827A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种分布式云计算环境的故障关联定位报警方法及装置,方法包括:定义一组描述云计算环境的各层环境信息的元数据;将所述的元数据标记到云计算环境的各层环境;根据环境异常时的报警信息和所述元数据生成定位故障层环境的关联定位报警信息。本发明解决在云计算环境下,分布式体系中,软硬件故障关联定位的困难的问题,提供了一种分布式云计算环境下故障软硬件关联定位的装置和方法,从而可以将业务报警关联到系统的每一个层面,可以将系统每一个层面的报警按业务维度聚合。

Description

分布式云计算环境的故障关联定位报警方法及装置
技术领域
本发明涉及分布式云计算监控技术,具体的讲是一种分布式云计算环境下故障关联定位方法及装置。
背景技术
一个业务系统从底层到顶层涉及基础设施,操作系统、应用程序等,各层面均会部署监控报警机制,当业务发生异常,通常伴随着从底层到顶层的多个报警,但常常无法将这些报警关联起来,不利于故障根因快速定位。
随着云计算和分布式服务化的使用范围越来越广,一个业务系统涉及IAAS,PAAS,多个容器、多个服务等,由于IAAS和PAAS的池化资源特性,具体的业务部署的底层资源存在不确定性,更加剧了报警关联的难度。
发明内容
为解决在云计算环境下,分布式体系中,软硬件故障关联定位困难的问题,本发明提供了一种分布式云计算环境的故障关联定位报警方法,包括:
定义一组描述云计算环境的各层环境信息的元数据;
将所述的元数据标记到云计算环境的各层环境;
根据环境异常时的报警信息和所述元数据生成定位故障层环境的关联定位报警信息。
本发明实施例中,所述的云计算环境的各层环境信息包括:各层环境的应用名信息、业务标签信息;
所述的各层环境包括:IAAS环境、PAAS容器环境及应用程序服务。
本发明实施例中,所述的将所述的元数据标记到云计算环境的各层环境包括:
建立IAAS环境时,将所述的元数据标记到IAAS环境的操作系统环境变量;
建立PAAS容器环境时,将所述的元数据标记到PAAS容器的操作系统环境变量;
部署应用程序服务时,将所述的元数据标记到部署的应用程序服务的操作系统环境变量。
本发明实施例中,所述的根据环境异常时的报警信息和所述元数据生成定位故障层环境的关联定位报警信息包括:
从各层环境的操作系统环境变量获取对应的元数据;
根据异常时的报警信息和获取的对应的元数据生成定位故障层环境的关联定位报警信息。
同时,本发明还提供一种分布式云计算环境的故障关联定位报警装置,包括:
定义模块,用于定义一组描述云计算环境的各层环境信息的元数据;
标记模块,用于将所述的元数据标记到云计算环境的各层环境;
定位报警模块,用于根据环境异常时的报警信息和所述元数据生成定位故障层环境的关联定位报警信息。
本发明实施例中,所述的云计算环境的各层环境信息包括:各层环境的应用名信息、业务标签信息;
所述的各层环境包括:IAAS环境、PAAS容器环境及应用程序服务。
本发明实施例中,所述的标记模块包括:
IAAS环境标记单元,用于建立IAAS环境时,将所述的元数据标记到IAAS环境的操作系统环境变量;
PAAS容器环境标记单元,用于建立PAAS容器环境时,将所述的元数据标记到PAAS容器的操作系统环境变量;
应用程序服务标记单元,用于部署应用程序服务时,将所述的元数据标记到部署的应用程序服务的操作系统环境变量。
本发明实施例中,所述的定位报警模块包括:
元数据获取单元,用于从各层环境的操作系统环境变量获取对应的元数据;
定位报警信息生成单元,用于根据异常时的报警信息和获取的对应的元数据生成定位故障层环境的关联定位报警信息。
同时,本发明还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述方法。
同时,本发明还提供一种计算机可读存储介质,计算机可读存储介质存储有执行上述方法的计算机程序。
本发明解决在云计算环境下,分布式体系中,软硬件故障关联定位的困难的问题,提供了一种分布式云计算环境下故障软硬件关联定位的装置和方法,从而可以将业务报警关联到系统的每一个层面,可以将系统每一个层面的报警按业务维度聚合。
为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种分布式云计算环境的故障关联定位报警方法的流程图;
图2为本发明提供的一种分布式云计算环境的故障关联定位报警装置的框图;
图3为本发明实施例中的示意图;
图4为本发明提供的电子设备实施例的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
元数据(Metadata),又称中介数据、中继数据,为描述数据的数据(data aboutdata),主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。元数据算是一种电子式目录,为了达到编制目录的目的,必须在描述并收藏数据的内容或特色,进而达成协助数据检索的目的。元数据是关于数据的组织、数据域及其关系的信息,简言之,元数据就是关于数据的数据。
如图1所示,本发明提供了一种分布式云计算环境的故障关联定位报警方法,包括:
步骤S101,定义一组描述云计算环境的各层环境信息的元数据;
步骤S102,将所述的元数据标记到云计算环境的各层环境;
步骤S103,根据环境异常时的报警信息和所述元数据生成定位故障层环境的关联定位报警信息。
本发明提供的分布式云计算环境的故障关联定位报警方法,通过定义一组元数据,比如应用名,业务标签,当搭建系统运行环境时,从系统底层到顶层传递和继承这些元数据,实现从系统底层到顶层的关联统一,当业务发生异常时,根据元数据,能迅速识别故障发生的位置。
本发明实施例中,所述的云计算环境的各层环境信息包括:各层环境的应用名信息、业务标签信息;
所述的各层环境包括:IAAS环境、PAAS容器环境及应用程序服务。
本实施例中,定义的一组元数据,比如应用名,业务标签,当搭建系统运行环境时,从IAAS、PAAS、容器、服务层传递和继承这些元数据,实现从系统底层到顶层的关联统一,当业务发生异常时,根据元数据,能迅速识别故障发生的位置,实现从下到上的报警聚合,帮助根因定位。
本发明实施例中,所述的将所述的元数据标记到云计算环境的各层环境包括:
建立IAAS环境时,将所述的元数据标记到IAAS环境的操作系统环境变量;
建立PAAS容器环境时,将所述的元数据标记到PAAS容器的操作系统环境变量;
部署应用程序服务时,将所述的元数据标记到部署的应用程序服务的操作系统环境变量。
本发明实施例中,所述的根据环境异常时的报警信息和所述元数据生成定位故障层环境的关联定位报警信息包括:
从各层环境的操作系统环境变量获取对应的元数据;
根据异常时的报警信息和获取的对应的元数据生成定位故障层环境的关联定位报警信息。
IAAS(Infrastructure as a Service),即基础设施即服务。指把IT基础设施作为一种服务通过网络对外提供,并根据用户对资源的实际使用量或占用量进行计费的一种服务模式。
在这种服务模型中,普通用户不用自己构建一个数据中心等硬件设施,而是通过租用的方式,利用Internet从IaaS服务提供商获得计算机基础设施服务,包括服务器、存储和网络等服务。
PAAS是(Platform as a Service)的缩写,是指平台即服务。把服务器平台作为一种服务提供的商业模式,通过网络进行程序提供的服务称之为SAAS(Software as aService),而云计算时代相应的服务器平台或者开发环境作为服务进行提供就成为了PaaS(Platform as a Service)。
本发明提出一种分布式云计算环境下故障软硬件关联定位的方案。为解决在云计算环境下,分布式体系中,软硬件故障关联定位的困难。
同时,如图2所示,本发明还提供一种分布式云计算环境的故障关联定位报警装置,包括:
定义模块201,用于定义一组描述云计算环境的各层环境信息的元数据;
标记模块202,用于将所述的元数据标记到云计算环境的各层环境;
定位报警模块203,用于根据环境异常时的报警信息和所述元数据生成定位故障层环境的关联定位报警信息。
本发明实施例中,所述的云计算环境的各层环境信息包括:各层环境的应用名信息、业务标签信息;
所述的各层环境包括:IAAS环境、PAAS容器环境及应用程序服务。
本发明实施例中,所述的标记模块包括:
IAAS环境标记单元,用于建立IAAS环境时,将所述的元数据标记到IAAS环境的操作系统环境变量;
PAAS容器环境标记单元,用于建立PAAS容器环境时,将所述的元数据标记到PAAS容器的操作系统环境变量;
应用程序服务标记单元,用于部署应用程序服务时,将所述的元数据标记到部署的应用程序服务的操作系统环境变量。
本发明实施例中,所述的定位报警模块包括:
元数据获取单元,用于从各层环境的操作系统环境变量获取对应的元数据;
定位报警信息生成单元,用于根据异常时的报警信息和获取的对应的元数据生成定位故障层环境的关联定位报警信息。
本发明实施例提供一种实现分布式云计算环境下故障软硬件关联定位的技术方案,主要在于利用一组统一的元数据描述各环节信息,实现关联统一。即通过定义一组元数据,比如应用名,业务标签,当搭建系统运行环境时,从IAAS、PAAS、容器、服务层传递和继承这些元数据,实现从系统底层到顶层的关联统一,当业务发生异常时,根据元数据,能迅速识别故障发生的位置,实现从下到上的报警聚合,帮助根因定位。
如图3所示,为本发明实施例中提供的实现分布式云计算环境下故障软硬件关联定位的环境搭建和运行监控流程示意图。
本实施例中涉及的装置包括:元数据维护装置,IAAS环境搭建装置,PAAS容器环境搭建装置,应用程序部署装置,IAAS环境监控装置,PAAS环境监控装置,服务监控装置,监控报警关联装置以及监控报警装置。
IAAS环境搭建装置,PAAS容器环境搭建装置及应用程序部署装置,用于搭建IAAS环境、PAAS容器环境及部署应用程序服务,将定义的元数据分别各自标记到搭建、部署的IAAS环境、PAAS容器环境及部署应用程序服务
环境搭建流程,目的是将元数,据从系统底层到顶层传递和标记,具体包括:
步骤1:元数据维护装置,实现元数据的定义,提供元数据维护、存储和查询功能。
步骤2:IAAS环境搭建装置从元数据维护装置获取元数据,一方面在搭建IAAS环境时将元数据标记在IAAS环境上,一方面将元数据传递给PAAS容器环境搭建装置。
本发明实施例中,将元数据标记到IAAS环境上是为了将云数据从下层到上层传递,本实施例中的传递顺序为:IAAS-->PAAS-->应用程序。
IAAS环境元数据标记技术:在新建IAAS环境时,将元数据以操作系统环境变量的方式设置到IAAS环境中。
步骤3:PAAS容器环境搭建装置从IAAS环境搭建装置获取元数据,一方面在搭建PAAS容器环境时将元数据标记在PAAS容器环境上,一方面将元数据传递给应用程序部署装置。
PAAS环境元数据标记技术:在新建PAAS容器时,从操作系统环境变量获取元数据,设置到容器所属用户的环境变量中。
步骤4:应用程序部署装置从PAAS容器环境搭建装置获取元数据,将元数据标记在应用程序服务上。
应用程序元数据标记技术:从PAAS容器的环境变量中获取元数据。
运行监控流程包括如下步骤:
步骤1:IAAS环境监控装置检测到IAAS环境异常时,将IAAS环境对应的元数据及报警信息发送给监控报警关联装置。
本实施例中,通过从IAAS操作系统环境变量中获取IAAS环境对应的元数据。
步骤2:PAAS环境监控装置检测到PAAS容器异常时,将PAAS容器对应的元数据及报警信息发送给监控报警关联装置。
同样,本实施例中,通过从PAAS容器操作系统环境变量中获取PAAS环境对应的元数据。
步骤3:服务监控装置检测到应用程序服务异常时,将应用程序服务对应的元数据及报警信息发送给监控报警关联装置。
也同样,从应用程序服务操作系统环境变量中获取应用程序服务对应元数据。
步骤4:监控报警关联部署装置按元数据将来自IAAS环境监控装置、PAAS环境监控装置、服务监控装置的报警信息关联在一起,形成携带IAAS环境信息、PAAS环境信息、服务信息的业务报警内容,并传递给监控报警装置。
按元数据将来自IAAS环境监控装置、PAAS环境监控装置、服务监控装置的报警信息关联在一起可以将业务报警关联到系统的每一个层面,可以将系统每一个层面的报警按业务维度聚合。
步骤5:监控报警装置接收监控报警关联部署的业务报警内容,并对外报警。
本实施例还提供一种电子设备,该电子设备可以是台式计算机、平板电脑及移动终端等,本实施例不限于此。在本实施例中,该电子设备可以参照前述方法及装置的实施例,其内容被合并于此,重复之处不再赘述。
图4为本发明实施例的电子设备600的系统构成的示意框图。如图4所示,该电子设备600可以包括中央处理器100和存储器140;存储器140耦合到中央处理器100。值得注意的是,该图是示例性的;还可以使用其他类型的结构,来补充或代替该结构,以实现电信功能或其他功能。
一实施例中,分布式云计算环境的故障关联定位报警功能可以被集成到中央处理器100中。其中,中央处理器100可以被配置为进行如下控制:
定义一组描述云计算环境的各层环境信息的元数据;
将所述的元数据标记到云计算环境的各层环境;
根据环境异常时的报警信息和所述元数据生成定位故障层环境的关联定位报警信息。
本发明实施例中,所述的云计算环境的各层环境信息包括:各层环境的应用名信息、业务标签信息;
所述的各层环境包括:IAAS环境、PAAS容器环境及应用程序服务。
本发明实施例中,所述的将所述的元数据标记到云计算环境的各层环境包括:
建立IAAS环境时,将所述的元数据标记到IAAS环境的操作系统环境变量;
建立PAAS容器环境时,将所述的元数据标记到PAAS容器的操作系统环境变量;
部署应用程序服务时,将所述的元数据标记到部署的应用程序服务的操作系统环境变量。
本发明实施例中,所述的根据环境异常时的报警信息和所述元数据生成定位故障层环境的关联定位报警信息包括:
从各层环境的操作系统环境变量获取对应的元数据;
根据异常时的报警信息和获取的对应的元数据生成定位故障层环境的关联定位报警信息。
在另一个实施方式中,分布式云计算环境的故障关联定位报警装置可以与中央处理器100分开配置,例如可以将分布式云计算环境的故障关联定位报警装置配置为与中央处理器100连接的芯片,通过中央处理器的控制来实现分布式云计算环境的故障关联定位报警功能。
如图4所示,该电子设备600还可以包括:通信模块110、输入单元120、音频处理单元130、显示器160、电源170。值得注意的是,电子设备600也并不是必须要包括图4中所示的所有部件;此外,电子设备600还可以包括图4中没有示出的部件,可以参考现有技术。
如图4所示,中央处理器100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器100接收输入并控制电子设备600的各个部件的操作。
其中,存储器140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器100可执行该存储器140存储的该程序,以实现信息存储或处理等。
输入单元120向中央处理器100提供输入。该输入单元120例如为按键或触摸输入装置。电源170用于向电子设备600提供电力。显示器160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。
该存储器140可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器140还可以是某种其它类型的装置。存储器140包括缓冲存储器141(有时被称为缓冲器)。存储器140可以包括应用/功能存储部142,该应用/功能存储部142用于存储应用程序和功能程序或用于通过中央处理器100执行电子设备600的操作的流程。
存储器140还可以包括数据存储部143,该数据存储部143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器140的驱动程序存储部144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
通信模块110即为经由天线111发送和接收信号的发送机/接收机110。通信模块(发送机/接收机)110耦合到中央处理器100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)110还经由音频处理器130耦合到扬声器131和麦克风132,以经由扬声器131提供音频输出,并接收来自麦克风132的音频输入,从而实现通常的电信功能。音频处理器130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器130还耦合到中央处理器100,从而使得可以通过麦克风132能够在本机上录音,且使得可以通过扬声器131来播放本机上存储的声音。
本发明实施例还提供一种计算机可读程序,其中当在电子设备中执行所述程序时,所述程序使得计算机在所述电子设备中执行如上面实施例所述的分布式云计算环境的故障关联定位报警方法。
本发明实施例还提供一种存储有计算机可读程序的存储介质,其中所述计算机可读程序使得计算机在电子设备中执行上面实施例所述的分布式云计算环境的故障关联定位报警。
以上参照附图描述了本发明的优选实施方式。这些实施方式的许多特征和优点根据该详细的说明书是清楚的,因此所附权利要求旨在覆盖这些实施方式的落入其真实精神和范围内的所有这些特征和优点。此外,由于本领域的技术人员容易想到很多修改和改变,因此不是要将本发明的实施方式限于所例示和描述的精确结构和操作,而是可以涵盖落入其范围内的所有合适修改和等同物。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种分布式云计算环境的故障关联定位报警方法,其特征在于,所述的方法包括:
定义一组描述云计算环境的各层环境信息的元数据;
将所述的元数据标记到云计算环境的各层环境;
根据环境异常时的报警信息和所述元数据生成定位故障层环境的关联定位报警信息。
2.如权利要求1所述的分布式云计算环境的故障关联定位报警方法,其特征在于,所述的云计算环境的各层环境信息包括:各层环境的应用名信息、业务标签信息;
所述的各层环境包括:IAAS环境、PAAS容器环境及应用程序服务。
3.如权利要求2所述的分布式云计算环境的故障关联定位报警方法,其特征在于,所述的将所述的元数据标记到云计算环境的各层环境包括:
建立IAAS环境时,将所述的元数据标记到IAAS环境的操作系统环境变量;
建立PAAS容器环境时,将所述的元数据标记到PAAS容器的操作系统环境变量;
部署应用程序服务时,将所述的元数据标记到部署的应用程序服务的操作系统环境变量。
4.如权利要求3所述的分布式云计算环境的故障关联定位报警方法,其特征在于,所述的根据环境异常时的报警信息和所述元数据生成定位故障层环境的关联定位报警信息包括:
从各层环境的操作系统环境变量获取对应的元数据;
根据异常时的报警信息和获取的对应的元数据生成定位故障层环境的关联定位报警信息。
5.一种分布式云计算环境的故障关联定位报警装置,其特征在于,所述的装置包括:
定义模块,用于定义一组描述云计算环境的各层环境信息的元数据;
标记模块,用于将所述的元数据标记到云计算环境的各层环境;
定位报警模块,用于根据环境异常时的报警信息和所述元数据生成定位故障层环境的关联定位报警信息。
6.如权利要求5所述的分布式云计算环境的故障关联定位报警装置,其特征在于,所述的云计算环境的各层环境信息包括:各层环境的应用名信息、业务标签信息;
所述的各层环境包括:IAAS环境、PAAS容器环境及应用程序服务。
7.如权利要求6所述的分布式云计算环境的故障关联定位报警装置,其特征在于,所述的标记模块包括:
IAAS环境标记单元,用于建立IAAS环境时,将所述的元数据标记到IAAS环境的操作系统环境变量;
PAAS容器环境标记单元,用于建立PAAS容器环境时,将所述的元数据标记到PAAS容器的操作系统环境变量;
应用程序服务标记单元,用于部署应用程序服务时,将所述的元数据标记到部署的应用程序服务的操作系统环境变量。
8.如权利要求7所述的分布式云计算环境的故障关联定位报警装置,其特征在于,所述的定位报警模块包括:
元数据获取单元,用于从各层环境的操作系统环境变量获取对应的元数据;
定位报警信息生成单元,用于根据异常时的报警信息和获取的对应的元数据生成定位故障层环境的关联定位报警信息。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4任一项所述方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至4任一项所述方法的计算机程序。
CN202010603377.1A 2020-06-29 2020-06-29 分布式云计算环境的故障关联定位报警方法及装置 Pending CN111786827A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010603377.1A CN111786827A (zh) 2020-06-29 2020-06-29 分布式云计算环境的故障关联定位报警方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010603377.1A CN111786827A (zh) 2020-06-29 2020-06-29 分布式云计算环境的故障关联定位报警方法及装置

Publications (1)

Publication Number Publication Date
CN111786827A true CN111786827A (zh) 2020-10-16

Family

ID=72760151

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010603377.1A Pending CN111786827A (zh) 2020-06-29 2020-06-29 分布式云计算环境的故障关联定位报警方法及装置

Country Status (1)

Country Link
CN (1) CN111786827A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114024825A (zh) * 2021-11-02 2022-02-08 中邮科通信技术股份有限公司 一种云计算环境下业务端到端的故障监测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130086434A1 (en) * 2011-09-30 2013-04-04 International Business Machines Corporation Configuration fault localization in shared resource environments
CN108121586A (zh) * 2016-11-29 2018-06-05 上海有云信息技术有限公司 一种PaaS层故障迁移装置及方法
CN108632057A (zh) * 2017-03-17 2018-10-09 华为技术有限公司 一种云计算服务器的故障恢复方法、装置及管理系统
CN109634813A (zh) * 2018-12-11 2019-04-16 平安科技(深圳)有限公司 电子装置、云平台异常确认方法及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130086434A1 (en) * 2011-09-30 2013-04-04 International Business Machines Corporation Configuration fault localization in shared resource environments
CN108121586A (zh) * 2016-11-29 2018-06-05 上海有云信息技术有限公司 一种PaaS层故障迁移装置及方法
CN108632057A (zh) * 2017-03-17 2018-10-09 华为技术有限公司 一种云计算服务器的故障恢复方法、装置及管理系统
CN109634813A (zh) * 2018-12-11 2019-04-16 平安科技(深圳)有限公司 电子装置、云平台异常确认方法及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114024825A (zh) * 2021-11-02 2022-02-08 中邮科通信技术股份有限公司 一种云计算环境下业务端到端的故障监测方法

Similar Documents

Publication Publication Date Title
JP6285010B2 (ja) 意味論的モデル化およびタグ付けを使用してアプリケーションを管理する方法およびその装置
CN109145238B (zh) 一种卡片显示方法、装置及移动设备
US20170351723A1 (en) Managing data format of data received from devices in an internet of things network
CN102902531A (zh) 一种安卓应用程序的定制、生成方法及其装置
CN110717536A (zh) 一种生成训练样本的方法及装置
CN105659209A (zh) 在客户端设备上托管的云服务
CN108363684A (zh) 表单创建方法、装置及服务器
CN108289118A (zh) 一种分布式消息流的管理方法和装置
CN112906206B (zh) 数字孪生模型构建方法和装置
CN107071036A (zh) 一种下载驱动文件的方法、网络服务器及系统
CN108196902B (zh) 用于展示开屏广告的方法与设备
CN111078506A (zh) 业务数据跑批任务监控方法及装置
CN112328413A (zh) 应用服务的调用方法、装置及系统
CN110119386A (zh) 数据处理方法、数据处理装置、介质和计算设备
CN106341497B (zh) 数字id生成方法及装置
CN111786827A (zh) 分布式云计算环境的故障关联定位报警方法及装置
CN110019538A (zh) 一种数据表切换方法及装置
CN110297945B (zh) 基于xbrl的数据信息处理方法及系统
CN117435569A (zh) 缓存系统动态扩容方法、装置、设备、介质和程序产品
CN110166955B (zh) 一种进行日程提醒的方法与设备
CN108804403B (zh) 业务图表的实现方法和装置
CN105144073A (zh) 可移除存储设备身份和配置信息
CN106330899A (zh) 私有云设备账号管理方法、系统、电子设备及服务器
CN108965578A (zh) 信息推送方法及装置
CN104216919A (zh) 用于完善电子地图数据的方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201016