CN113192228A - 集群自动化巡检方法及装置 - Google Patents

集群自动化巡检方法及装置 Download PDF

Info

Publication number
CN113192228A
CN113192228A CN202110486437.0A CN202110486437A CN113192228A CN 113192228 A CN113192228 A CN 113192228A CN 202110486437 A CN202110486437 A CN 202110486437A CN 113192228 A CN113192228 A CN 113192228A
Authority
CN
China
Prior art keywords
index
cluster
state
health
elasticissearch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110486437.0A
Other languages
English (en)
Other versions
CN113192228B (zh
Inventor
吴庭栋
任政
郑杰
程鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202110486437.0A priority Critical patent/CN113192228B/zh
Publication of CN113192228A publication Critical patent/CN113192228A/zh
Application granted granted Critical
Publication of CN113192228B publication Critical patent/CN113192228B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C1/00Registering, indicating or recording the time of events or elapsed time, e.g. time-recorders for work people
    • G07C1/20Checking timed patrols, e.g. of watchman
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • H04L67/025Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1008Server selection for load balancing based on parameters of servers, e.g. available memory or workload
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种集群自动化巡检方法及装置,可用于云计算技术领域,方法包括:获得各Elasticsearch集群在至少两个时间点上的健康度指标和对应的ip状态指标,所述ip状态指标包括:各Elasticsearch集群中每个ip的存储指标,CPU使用率指标和线程拒绝指标;对每个时间点,分别将所述各Elasticsearch集群的健康度指标和对应的ip状态指标写入该时间点对应的csv文件;根据所述健康度指标,将各时间点对应的csv文件进行比对;根据比对的结果,进行集群自动化巡检。本发明可以快速有效分析集群状态,以便及时处理出现问题的集群。

Description

集群自动化巡检方法及装置
技术领域
本发明涉及云计算技术领域,尤其涉及集群自动化巡检方法及装置。
背景技术
随着银行在云计算领域的不断深入发展,每天会有海量的日志产生,这些日志会以一定的标准格式上送到Elasticsearch,有部分是直接上送到Elasticsearch的,有部分是先上送到Kafka然后再通过logstash消费到Elasticsearch的,不管是哪种方式,日志最终都保存在Elasticsearch中进行可视化配置的,因此,必须保证Elasticsearch集群的持久稳定可靠运行。
虽然Elasticsearch本身提供了相应的查看集群状态的相关命令,但当集群很大很多时,其中包含的节点很多,情况相对复杂,采用人工巡检的方式就显得不可取,无法快速有效的分析出集群的状态,集群出现问题也无法及时处理。
因此,亟需一种可以克服上述问题的集群自动化巡检方案。
发明内容
本发明实施例提供一种集群自动化巡检方法,用以快速有效分析集群状态,以便及时处理出现问题的集群,该方法包括:
获得各Elasticsearch集群在至少两个时间点上的健康度指标和对应的ip状态指标,所述ip状态指标包括:各Elasticsearch集群中每个ip的存储指标,CPU使用率指标和线程拒绝指标;
对每个时间点,分别将所述各Elasticsearch集群的健康度指标和对应的ip状态指标写入该时间点对应的csv文件;
根据所述健康度指标,将各时间点对应的csv文件进行比对;
根据比对的结果,进行集群自动化巡检。
本发明实施例提供一种集群自动化巡检装置,用以快速有效分析集群状态,以便及时处理出现问题的集群,该装置包括:
指标获得模块,用于获得各Elasticsearch集群在至少两个时间点上的健康度指标和对应的ip状态指标,所述ip状态指标包括:各Elasticsearch集群中每个ip的存储指标,CPU使用率指标和线程拒绝指标;
文件写入模块,用于对每个时间点,分别将所述各Elasticsearch集群的健康度指标和对应的ip状态指标写入该时间点对应的csv文件;
文件比对模块,用于根据所述健康度指标,将各时间点对应的csv文件进行比对;
集群巡检模块,用于根据比对的结果,进行集群自动化巡检。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述集群自动化巡检方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述集群自动化巡检方法的计算机程序。
本发明实施例通过获得各Elasticsearch集群在至少两个时间点上的健康度指标和对应的ip状态指标,所述ip状态指标包括:各Elasticsearch集群中每个ip的存储指标,CPU使用率指标和线程拒绝指标;对每个时间点,分别将所述各Elasticsearch集群的健康度指标和对应的ip状态指标写入该时间点对应的csv文件;根据所述健康度指标,将各时间点对应的csv文件进行比对;根据比对的结果,进行集群自动化巡检。本发明实施例通过对至少两个时间点上健康度指标和对应的ip状态指标对应的csv文件进行比对,比较各时间点之间的指标状态的浮动情况,并根据比对的结果实现了集群自动化巡检,无需进行人工巡检,快速有效分析集群状态,提高巡检效率,以便及时处理出现问题的集群。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中集群自动化巡检方法示意图;
图2为本发明具体实施例中集群自动化巡检方法示意图;
图3为本发明实施例中集群自动化巡检装置结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
为了快速有效分析集群状态,以便及时处理出现问题的集群,本发明实施例提供一种集群自动化巡检方法,如图1所示,该方法可以包括:
步骤101、获得各Elasticsearch集群在至少两个时间点上的健康度指标和对应的ip状态指标,所述ip状态指标包括:各Elasticsearch集群中每个ip的存储指标,CPU使用率指标和线程拒绝指标;
步骤102、对每个时间点,分别将所述各Elasticsearch集群的健康度指标和对应的ip状态指标写入该时间点对应的csv文件;
步骤103、根据所述健康度指标,将各时间点对应的csv文件进行比对;
步骤104、根据比对的结果,进行集群自动化巡检。
由图1所示可以得知,本发明实施例通过获得各Elasticsearch集群在至少两个时间点上的健康度指标和对应的ip状态指标,所述ip状态指标包括:各Elasticsearch集群中每个ip的存储指标,CPU使用率指标和线程拒绝指标;对每个时间点,分别将所述各Elasticsearch集群的健康度指标和对应的ip状态指标写入该时间点对应的csv文件;根据所述健康度指标,将各时间点对应的csv文件进行比对;根据比对的结果,进行集群自动化巡检。本发明实施例通过对至少两个时间点上健康度指标和对应的ip状态指标对应的csv文件进行比对,比较各时间点之间的指标状态的浮动情况,并根据比对的结果实现了集群自动化巡检,无需进行人工巡检,快速有效分析集群状态,提高巡检效率,以便及时处理出现问题的集群。
实施例中,获得各Elasticsearch集群在至少两个时间点上的健康度指标和对应的ip状态指标,所述ip状态指标包括:各Elasticsearch集群中每个ip的存储指标,CPU使用率指标和线程拒绝指标。
本实施例中,获得各Elasticsearch集群在至少两个时间点上的健康度指标和对应的ip状态指标,包括:
分别在至少两个时间点上,利用Elasticsearch提供的查询集群状态命令获得该时间点上各Elasticsearch集群的健康度指标和对应的ip状态指标。
具体实施时,利用Elasticsearch提供的查询集群状态的若干命令,依次获取到Elasticsearch集群的health、allocation、_nodes等状态值,从而得到各Elasticsearch集群的健康度指标和对应的ip状态指标。
实施例中,对每个时间点,分别将所述各Elasticsearch集群的健康度指标和对应的ip状态指标写入该时间点对应的csv文件。
具体实施时,逐个将各Elasticsearch集群中对应ip状态指标进行提取,依次写入csv文件,采用同样的方式将多个Elasticsearch集群的相关内容写入,以此来得到对各Elasticsearch集群的巡检结果,一方面可以从巡检结果文件中去判断Elasticsearch集群是否异常,另一方面随着巡检次数的增加,下次(下一时间点)巡检结果可以与上次(上一时间点)的巡检结果进行比对,得到某一项的上升与下滑,进而为集群的可持续运行提供支撑。
实施例中,根据所述健康度指标,将各时间点对应的csv文件进行比对,根据比对的结果,进行集群自动化巡检。
本实施例中,根据所述健康度指标,将各时间点对应的csv文件进行比对,包括:
若健康度指标为异常状态,则将各时间点对应的csv文件中的ip状态指标进行逐一比对,确定指标浮动数据。
本实施例中,根据比对的结果,进行集群自动化巡检,包括:
将所述指标浮动数据与预设的浮动阈值进行比较;
若所述指标浮动数据超出浮动阈值,则进行报警。
下面给出一个具体实施例,说明本发明集群自动化巡检方案的具体应用。在本具体实施例中,如图2所示,具体步骤如下:
1):利用Elasticsearch提供的查询集群health、allocation、_nodes等状态的命令获取各集群的相关指标(健康度、存储、CPU使用率、线程拒绝等);
2):提取每个集群的健康度,写入csv文件A;
3):提取集群中每个ip的存储、线程拒绝等,并按顺序写入csv文件;
4):查看csv文件A,得到对各Elasticsearch集群的巡检结果,集群健康度为red或yellow时则要详细参考各项指标进行处理;
5):在一段时间后,重复之前的步骤,得到巡检结果csv文件B;
6):csv文件B与csv文件A各项数值进行对比,设置各项指标的浮动阈值,超出阈值,则需要进行一定的报警,进一步分析。
在时间点1和时间点2对各集群分别进行自动化巡检,得到巡检结果csv文件A和csv文件B,可以单独对csv文件A和csv文件B结果进行分析,也可进行对比分析,设置指标阈值,超出阈值进行报警提醒,从而减少Elasticsearch集群人工巡检带来的负担以及效率问题,减少了人工的使用,提升巡检效率,可以更直观的查看各Elasticsearch集群的各项指标,巡检结果可以与上一次巡检进行比对,指标超出所设置的阈值可报警。
基于同一发明构思,本发明实施例还提供了一种集群自动化巡检装置,如下面的实施例所述。由于这些解决问题的原理与集群自动化巡检方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
图3为本发明实施例中集群自动化巡检装置的结构图,如图3所示,该装置包括:
指标获得模块301,用于获得各Elasticsearch集群在至少两个时间点上的健康度指标和对应的ip状态指标,所述ip状态指标包括:各Elasticsearch集群中每个ip的存储指标,CPU使用率指标和线程拒绝指标;
文件写入模块302,用于对每个时间点,分别将所述各Elasticsearch集群的健康度指标和对应的ip状态指标写入该时间点对应的csv文件;
文件比对模块303,用于根据所述健康度指标,将各时间点对应的csv文件进行比对;
集群巡检模块304,用于根据比对的结果,进行集群自动化巡检。
一个实施例中,所述指标获得模块301进一步用于:
分别在至少两个时间点上,利用Elasticsearch提供的查询集群状态命令获得该时间点上各Elasticsearch集群的健康度指标和对应的ip状态指标。
一个实施例中,所述文件比对模块303进一步用于:
若健康度指标为异常状态,则将各时间点对应的csv文件中的ip状态指标进行逐一比对,确定指标浮动数据。
一个实施例中,所述集群巡检模块304进一步用于:
将所述指标浮动数据与预设的浮动阈值进行比较;
若所述指标浮动数据超出浮动阈值,则进行报警。
综上所述,本发明实施例通过获得各Elasticsearch集群在至少两个时间点上的健康度指标和对应的ip状态指标,所述ip状态指标包括:各Elasticsearch集群中每个ip的存储指标,CPU使用率指标和线程拒绝指标;对每个时间点,分别将所述各Elasticsearch集群的健康度指标和对应的ip状态指标写入该时间点对应的csv文件;根据所述健康度指标,将各时间点对应的csv文件进行比对;根据比对的结果,进行集群自动化巡检。本发明实施例通过对至少两个时间点上健康度指标和对应的ip状态指标对应的csv文件进行比对,比较各时间点之间的指标状态的浮动情况,并根据比对的结果实现了集群自动化巡检,无需进行人工巡检,快速有效分析集群状态,提高巡检效率,以便及时处理出现问题的集群。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种集群自动化巡检方法,其特征在于,包括:
获得各Elasticsearch集群在至少两个时间点上的健康度指标和对应的ip状态指标,所述ip状态指标包括:各Elasticsearch集群中每个ip的存储指标,CPU使用率指标和线程拒绝指标;
对每个时间点,分别将所述各Elasticsearch集群的健康度指标和对应的ip状态指标写入该时间点对应的csv文件;
根据所述健康度指标,将各时间点对应的csv文件进行比对;
根据比对的结果,进行集群自动化巡检。
2.如权利要求1所述的集群自动化巡检方法,其特征在于,获得各Elasticsearch集群在至少两个时间点上的健康度指标和对应的ip状态指标,包括:
分别在至少两个时间点上,利用Elasticsearch提供的查询集群状态命令获得该时间点上各Elasticsearch集群的健康度指标和对应的ip状态指标。
3.如权利要求1所述的集群自动化巡检方法,其特征在于,根据所述健康度指标,将各时间点对应的csv文件进行比对,包括:
若健康度指标为异常状态,则将各时间点对应的csv文件中的ip状态指标进行逐一比对,确定指标浮动数据。
4.如权利要求3所述的集群自动化巡检方法,其特征在于,根据比对的结果,进行集群自动化巡检,包括:
将所述指标浮动数据与预设的浮动阈值进行比较;
若所述指标浮动数据超出浮动阈值,则进行报警。
5.一种集群自动化巡检装置,其特征在于,包括:
指标获得模块,用于获得各Elasticsearch集群在至少两个时间点上的健康度指标和对应的ip状态指标,所述ip状态指标包括:各Elasticsearch集群中每个ip的存储指标,CPU使用率指标和线程拒绝指标;
文件写入模块,用于对每个时间点,分别将所述各Elasticsearch集群的健康度指标和对应的ip状态指标写入该时间点对应的csv文件;
文件比对模块,用于根据所述健康度指标,将各时间点对应的csv文件进行比对;
集群巡检模块,用于根据比对的结果,进行集群自动化巡检。
6.如权利要求5所述的集群自动化巡检装置,其特征在于,所述指标获得模块进一步用于:
分别在至少两个时间点上,利用Elasticsearch提供的查询集群状态命令获得该时间点上各Elasticsearch集群的健康度指标和对应的ip状态指标。
7.如权利要求5所述的集群自动化巡检装置,其特征在于,所述文件比对模块进一步用于:
若健康度指标为异常状态,则将各时间点对应的csv文件中的ip状态指标进行逐一比对,确定指标浮动数据。
8.如权利要求7所述的集群自动化巡检装置,其特征在于,所述集群巡检模块进一步用于:
将所述指标浮动数据与预设的浮动阈值进行比较;
若所述指标浮动数据超出浮动阈值,则进行报警。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4任一所述方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求1至4任一所述方法的计算机程序。
CN202110486437.0A 2021-04-30 2021-04-30 集群自动化巡检方法及装置 Active CN113192228B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110486437.0A CN113192228B (zh) 2021-04-30 2021-04-30 集群自动化巡检方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110486437.0A CN113192228B (zh) 2021-04-30 2021-04-30 集群自动化巡检方法及装置

Publications (2)

Publication Number Publication Date
CN113192228A true CN113192228A (zh) 2021-07-30
CN113192228B CN113192228B (zh) 2023-04-07

Family

ID=76983498

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110486437.0A Active CN113192228B (zh) 2021-04-30 2021-04-30 集群自动化巡检方法及装置

Country Status (1)

Country Link
CN (1) CN113192228B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080231863A1 (en) * 2007-03-20 2008-09-25 Tokyo Electron Limited Automated process control using optical metrology with a photonic nanojet
US20160267223A1 (en) * 2015-03-10 2016-09-15 Practice Fusion, Inc. Integrated health data analysis system
CN106656533A (zh) * 2015-10-29 2017-05-10 大唐移动通信设备有限公司 一种集群系统的负荷处理监控方法及装置
CN107391633A (zh) * 2017-06-30 2017-11-24 北京奇虎科技有限公司 数据库集群自动优化处理方法、装置及服务器
US20180102938A1 (en) * 2016-10-11 2018-04-12 Oracle International Corporation Cluster-based processing of unstructured log messages
CN108733532A (zh) * 2017-04-18 2018-11-02 北京京东尚科信息技术有限公司 大数据平台的健康度管控方法、装置、介质及电子设备
CN109522287A (zh) * 2018-09-18 2019-03-26 平安科技(深圳)有限公司 分布式文件存储集群的监控方法、系统、设备及介质
CN110297867A (zh) * 2019-06-28 2019-10-01 浪潮云信息技术有限公司 基于国产cpu和分布式容器集群的数据库集群运行方法及系统
CN110674096A (zh) * 2019-08-28 2020-01-10 北京浪潮数据技术有限公司 节点故障排查方法、装置、设备及计算机可读存储介质
CN111026621A (zh) * 2019-12-23 2020-04-17 杭州安恒信息技术股份有限公司 面向Elasticsearch集群的监控报警方法、装置、设备、介质
CN112506894A (zh) * 2020-12-02 2021-03-16 平安医疗健康管理股份有限公司 基于链路追踪的服务链日志处理方法、装置和计算机设备
CN112651719A (zh) * 2020-12-01 2021-04-13 扬州道远人防科技有限公司 人防工程智能化巡检维护系统及方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080231863A1 (en) * 2007-03-20 2008-09-25 Tokyo Electron Limited Automated process control using optical metrology with a photonic nanojet
US20160267223A1 (en) * 2015-03-10 2016-09-15 Practice Fusion, Inc. Integrated health data analysis system
CN106656533A (zh) * 2015-10-29 2017-05-10 大唐移动通信设备有限公司 一种集群系统的负荷处理监控方法及装置
US20180102938A1 (en) * 2016-10-11 2018-04-12 Oracle International Corporation Cluster-based processing of unstructured log messages
CN108733532A (zh) * 2017-04-18 2018-11-02 北京京东尚科信息技术有限公司 大数据平台的健康度管控方法、装置、介质及电子设备
CN107391633A (zh) * 2017-06-30 2017-11-24 北京奇虎科技有限公司 数据库集群自动优化处理方法、装置及服务器
CN109522287A (zh) * 2018-09-18 2019-03-26 平安科技(深圳)有限公司 分布式文件存储集群的监控方法、系统、设备及介质
CN110297867A (zh) * 2019-06-28 2019-10-01 浪潮云信息技术有限公司 基于国产cpu和分布式容器集群的数据库集群运行方法及系统
CN110674096A (zh) * 2019-08-28 2020-01-10 北京浪潮数据技术有限公司 节点故障排查方法、装置、设备及计算机可读存储介质
CN111026621A (zh) * 2019-12-23 2020-04-17 杭州安恒信息技术股份有限公司 面向Elasticsearch集群的监控报警方法、装置、设备、介质
CN112651719A (zh) * 2020-12-01 2021-04-13 扬州道远人防科技有限公司 人防工程智能化巡检维护系统及方法
CN112506894A (zh) * 2020-12-02 2021-03-16 平安医疗健康管理股份有限公司 基于链路追踪的服务链日志处理方法、装置和计算机设备

Also Published As

Publication number Publication date
CN113192228B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
EP3798846B1 (en) Operation and maintenance system and method
CN111158977A (zh) 一种异常事件根因定位方法及装置
CN107025224B (zh) 一种监控任务运行的方法和设备
CN105094698A (zh) 一种基于历史监测数据的磁盘容量预测方法
CN110009062B (zh) 分类模型训练方法及装置
CN108829505A (zh) 一种分布式调度系统及方法
CN114595210A (zh) 一种多维数据的异常检测方法、装置及电子设备
CN112529528A (zh) 基于大数据流计算的工作流监控与告警方法、装置及系统
CN115981902A (zh) 一种细粒度分布式微服务系统异常根因定位方法及装置
CN107193498B (zh) 一种对数据进行去重复处理的方法及装置
CN113869778A (zh) 一种基于城市管理的无人机河道巡检方法及系统
CN112214768A (zh) 一种恶意进程的检测方法及装置
CN110889597A (zh) 业务时序指标异常检测方法及装置
CN107920067B (zh) 一种主动对象存储系统上的入侵检测方法
CN113192228B (zh) 集群自动化巡检方法及装置
US10592390B2 (en) Detecting anomalous function execution in a program
CN113313304A (zh) 一种基于大数据决策树的电网事故异常分析方法及系统
CN113094154A (zh) 一种基于阿里云的大数据处理方法及系统
CN114327963A (zh) 一种异常检测方法及装置
Qi et al. Data mining based root-cause analysis of performance bottleneck for big data workload
CN108345791B (zh) 处理器安全检测方法、系统及检测装置
CN114881112A (zh) 一种系统异常检测方法、装置、设备及介质
CN113296990B (zh) 时序数据的异常识别方法及装置
CN114331688A (zh) 一种银行柜面系统业务批量运行状态检测方法及装置
CN114416410A (zh) 一种异常分析方法、设备和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant