CN106383776A - 一种分布式搜索集群系统的监控及自愈方法、装置 - Google Patents

一种分布式搜索集群系统的监控及自愈方法、装置 Download PDF

Info

Publication number
CN106383776A
CN106383776A CN201610787088.5A CN201610787088A CN106383776A CN 106383776 A CN106383776 A CN 106383776A CN 201610787088 A CN201610787088 A CN 201610787088A CN 106383776 A CN106383776 A CN 106383776A
Authority
CN
China
Prior art keywords
clustered node
information
anomalous event
distributed search
abnormal events
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610787088.5A
Other languages
English (en)
Inventor
邓智
张峥嵘
李宗继
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing VRV Software Corp Ltd
Original Assignee
Beijing VRV Software Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing VRV Software Corp Ltd filed Critical Beijing VRV Software Corp Ltd
Priority to CN201610787088.5A priority Critical patent/CN106383776A/zh
Publication of CN106383776A publication Critical patent/CN106383776A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment

Abstract

本发明公开一种分布式搜索集群系统的监控及自愈方法、装置,方法包括:实时采集分布式搜索集群系统各集群节点的各项预设监控指标的值;基于各集群节点的各项预设监控指标的值,与预设监控策略进行匹配,得到各集群节点对应的异常事件信息及异常事件对应的处理信息;基于各集群节点对应的异常事件信息及异常事件对应的处理信息,对存在异常事件的各目标集群节点进行处理,实现分布式搜索集群系统的监控及自愈。本发明可实时了解分布式搜索集群系统的整体运行状况,包括分布式搜索集群系统的资源使用情况、分布式搜索集群系统各集群节点的健康状态、分布式搜索集群系统的即时访问量等信息,并在集群节点存在异常(包括过载)情况时实现自愈。

Description

一种分布式搜索集群系统的监控及自愈方法、装置
技术领域
本发明涉及计算机技术领域,具体涉及一种分布式搜索集群系统的监控及自愈方法、装置。
背景技术
随着数据来源的多样性,数据量的激增、数据结构的多样性、数据搜索的实时性,传统的关系数据库难以满足数据搜索业务的需求,分布式搜索集群系统很好的解决了上述情况。分布式搜索集群系统考虑到用于搜索的集群文档数量巨大,因此为大量的集群文档建立索引文件,在索引文件中进行信息搜索。由于索引文件数据量也很大,为了提高信息搜索效率,分布式搜索集群系统将索引文件划分成多份,分别存储在多台搜索服务器中,在多台搜索服务器中并行搜索以提高效率。多台搜索服务器构成分布式搜索集群系统,搜索服务器也可以称为分布式搜索集群系统的集群节点。
分布式搜索集群系统可能会存在资源不够用、集群节点故障、即时访问量过大导致分布式搜索集群系统超负荷的问题。
发明内容
鉴于上述问题,本发明提出了克服上述问题或者至少部分地解决上述问题的一种分布式搜索集群系统的监控及自愈方法、装置。
为此目的,第一方面,本发明提出一种分布式搜索集群系统的监控及自愈方法,包括:
实时采集分布式搜索集群系统各集群节点的各项预设监控指标的值;
基于各集群节点的各项预设监控指标的值,与预设监控策略进行匹配,得到各集群节点对应的异常事件信息及异常事件对应的处理信息;
基于各集群节点对应的异常事件信息及异常事件对应的处理信息,对存在异常事件的各目标集群节点进行处理,实现分布式搜索集群系统的监控及自愈。
可选的,所述实时采集分布式搜索集群系统各集群节点的各项预设监控指标的值之后,还包括:
同步采集到的各集群节点的各项预设监控指标的值;
相应地,所述基于各集群节点的各项预设监控指标的值,与预设监控策略进行匹配,包括:
基于同步后的各集群节点的各项预设监控指标的值,与预设监控策略进行匹配。
可选的,所述同步采集到的各集群节点的各项预设监控指标的值,包括:
通过分布式应用程序协调服务zookeeper,同步采集到的各集群节点的各项预设监控指标的值。
可选的,所述得到各集群节点对应的异常事件信息及异常事件对应的处理信息之后,还包括:
记录日志信息,该日志信息中携带有各集群节点对应的异常事件信息及异常事件对应的处理信息。
可选的,所述得到各集群节点对应的异常事件信息及异常事件对应的处理信息之后,还包括:
将各集群节点对应的异常事件信息及异常事件对应的处理信息推送到分布式搜索集群系统的前端,以使所述前端显示各集群节点对应的异常事件信息及异常事件对应的处理信息。
第二方面,本发明还提出一种分布式搜索集群系统的监控及自愈装置,包括:
采集模块,用于实时采集分布式搜索集群系统各集群节点的各项预设监控指标的值;
监控模块,用于基于各集群节点的各项预设监控指标的值,与预设监控策略进行匹配,得到各集群节点对应的异常事件信息及异常事件对应的处理信息;
处理模块,用于基于各集群节点对应的异常事件信息及异常事件对应的处理信息,对存在异常事件的各目标集群节点进行处理,实现分布式搜索集群系统的监控及自愈。
可选的,还包括:
同步模块,用于同步所述采集模块采集到的各集群节点的各项预设监控指标的值;
相应地,所述监控模块,用于基于同步后的各集群节点的各项预设监控指标的值,与预设监控策略进行匹配,得到各集群节点对应的异常事件信息及异常事件对应的处理信息。
可选的,所述同步模块,具体用于通过分布式应用程序协调服务zookeeper,同步采集到的各集群节点的各项预设监控指标的值。
可选的,还包括:
记录模块,用于所述监控模块得到各集群节点对应的异常事件信息及异常事件对应的处理信息之后,记录日志信息,该日志信息中携带有各集群节点对应的异常事件信息及异常事件对应的处理信息。
可选的,还包括:
推送模块,用于所述监控模块得到各集群节点对应的异常事件信息及异常事件对应的处理信息之后,将各集群节点对应的异常事件信息及异常事件对应的处理信息推送到分布式搜索集群系统的前端,以使所述前端显示各集群节点对应的异常事件信息及异常事件对应的处理信息。
相比于现有技术,本发明提出的分布式搜索集群系统的监控及自愈方法、装置,具有如下有益效果:
1、实时了解分布式搜索集群系统的整体运行状况,包括分布式搜索集群系统的资源使用情况、分布式搜索集群系统各集群节点的健康状态、分布式搜索集群系统的即时访问量(也称为分布式搜索集群系统的负载)等信息;
2、在分布式搜索集群系统的即时访问量过大(也称为分布式搜索集群系统超负荷)时及时扩充资源,如:新增集群节点和/或扩展集群节点的CPU、内存等。
3、实时了解分布式搜索集群系统各集群节点的运行状态,当某个集群节点与分布式搜索集群系统分离时,及时采取措施恢复、自愈。
4、提供性能报表,作为分布式搜索集群系统性能分析和调优的重要参考依据。
附图说明
图1为本发明第一实施例提供的一种分布式搜索集群系统的监控方法流程图;
图2为本发明第二实施例提供的一种分布式搜索集群系统的监控装置结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
如图1所示,本实施例公开一种分布式搜索集群系统的监控及自愈方法,可包括以下步骤101~103:
101、实时采集分布式搜索集群系统各集群节点的各项预设监控指标的值。
本实施例中,监控指标例如:资源使用情况、集群节点的健康状态、即时访问量等,本领域技术人员可根据实际情况设置监控指标。
102、基于各集群节点的各项预设监控指标的值,与预设监控策略进行匹配,得到各集群节点对应的异常事件信息及异常事件对应的处理信息。
本实施例中,当某个集群节点的即时访问量过大时,得到的异常信息为用于指示集群节点过载的异常信息。
在实际应用中,步骤102还可通过分布式搜索集群系统的应用程序编程接口(Application Programming Interface,API)获取分布式搜索集群系统的状态信息,并将状态信息与预设监控策略进行匹配,同样也可从状态信息中得到存在异常的集群节点及对应的状态信息。
103、基于各集群节点对应的异常事件信息及异常事件对应的处理信息,对存在异常事件的各目标集群节点进行处理,实现分布式搜索集群系统的监控及自愈。
本实施例公开的分布式搜索集群系统的监控及自愈方法,可实时了解分布式搜索集群系统的整体运行状况,包括分布式搜索集群系统的资源使用情况、分布式搜索集群系统各集群节点的健康状态、分布式搜索集群系统的即时访问量等信息,并在集群节点存在异常(包括过载)情况时实现自愈,减少人工干预和业务影响。
在一个具体的例子中,步骤101所述实时采集分布式搜索集群系统各集群节点的各项预设监控指标的值之后,还包括图1中未示出的步骤101’:
101’、同步采集到的各集群节点的各项预设监控指标的值。
本实施例中,考虑实时采集的分布式搜索集群系统各集群节点的各项预设监控指标的值有时间差,为了便于监控效率,不至于每次采集到数据就进行监控,本实施例会同步采集到的各集群节点的各项预设监控指标的值。
相应地,步骤102所述基于各集群节点的各项预设监控指标的值,与预设监控策略进行匹配,包括:
基于同步后的各集群节点的各项预设监控指标的值,与预设监控策略进行匹配。
在一个具体的例子中,步骤101’所述同步采集到的各集群节点的各项预设监控指标的值,包括:
通过分布式应用程序协调服务zookeeper,同步采集到的各集群节点的各项预设监控指标的值。
本实施例中采用zookeeper实现同步采集到的各集群节点的各项预设监控指标的值,本领域技术人员可基于本发明构思,采用其他手段实现同步功能。
在一个具体的例子中,步骤102所述得到各集群节点对应的异常事件信息及异常事件对应的处理信息之后,还包括图1未示出的步骤102’:
102’、记录日志信息,该日志信息中携带有各集群节点对应的异常事件信息及异常事件对应的处理信息。
本实施例中,对各集群节点对应的异常事件信息及异常事件对应的处理信息记录日志,以便后续管理员查阅日志,了解分布式搜索集群系统的不同时间点的工作状态。
在一个具体的例子中,步骤102所述得到各集群节点对应的异常事件信息及异常事件对应的处理信息之后,还包括图1未示出的步骤102”:
102”、将各集群节点对应的异常事件信息及异常事件对应的处理信息推送到分布式搜索集群系统的前端,以使所述前端显示各集群节点对应的异常事件信息及异常事件对应的处理信息。
本实施例中,前端可实时绘制图表曲线形式直观的将各集群节点对应的异常事件信息及异常事件对应的处理信息展现给用户。
综合以上图1涉及的各实施例公开的分布式搜索集群系统的监控及自愈方法,可知,具有如下有益效果:
1、实时了解分布式搜索集群系统的整体运行状况,包括分布式搜索集群系统的资源使用情况、分布式搜索集群系统各集群节点的健康状态、分布式搜索集群系统的即时访问量(也称为分布式搜索集群系统的负载)等信息;
2、在分布式搜索集群系统的即时访问量过大(也称为分布式搜索集群系统超负荷)时及时扩充资源,如:新增集群节点和/或扩展集群节点的CPU、内存等。
3、实时了解分布式搜索集群系统各集群节点的运行状态,当某个集群节点与分布式搜索集群系统分离时,及时采取措施恢复、自愈。
4、提供性能报表,作为分布式搜索集群系统性能分析和调优的重要参考依据。
如图2所示,本实施例公开一种分布式搜索集群系统的监控及自愈装置,可包括以下单元:采集模块21、监控模块22以及处理模块23,各模块的具体说明如下:
采集模块21,用于实时采集分布式搜索集群系统各集群节点的各项预设监控指标的值;
监控模块22,用于基于各集群节点的各项预设监控指标的值,与预设监控策略进行匹配,得到各集群节点对应的异常事件信息及异常事件对应的处理信息;
处理模块23,用于基于各集群节点对应的异常事件信息及异常事件对应的处理信息,对存在异常事件的各目标集群节点进行处理,实现分布式搜索集群系统的监控及自愈。
本实施例公开的分布式搜索集群系统的监控及自愈装置,可实现图1所示的分布式搜索集群系统的监控及自愈方法的流程,因此,本实施例中的装置的效果及说明可参见图1所示的方法实施例,在此不再赘述。
在一个具体的例子中,图2所示的分布式搜索集群系统的监控及自愈装置还包括图2中未示出的:同步模块24。
同步模块24,用于同步所述采集模块21采集到的各集群节点的各项预设监控指标的值。
相应地,所述监控模块22,用于基于同步后的各集群节点的各项预设监控指标的值,与预设监控策略进行匹配,得到各集群节点对应的异常事件信息及异常事件对应的处理信息。
在一个具体的例子中,所述同步模块24,具体用于通过分布式应用程序协调服务zookeeper,同步采集到的各集群节点的各项预设监控指标的值。
在一个具体的例子中,图2所示的分布式搜索集群系统的监控及自愈装置还包括图2中未示出的:记录模块25。
记录模块25,用于所述监控模块22得到各集群节点对应的异常事件信息及异常事件对应的处理信息之后,记录日志信息,该日志信息中携带有各集群节点对应的异常事件信息及异常事件对应的处理信息。
在一个具体的例子中,图2所示的分布式搜索集群系统的监控及自愈装置还包括图2中未示出的:推送模块26。
推送模块26,用于所述监控模块22得到各集群节点对应的异常事件信息及异常事件对应的处理信息之后,将各集群节点对应的异常事件信息及异常事件对应的处理信息推送到分布式搜索集群系统的前端,以使所述前端显示各集群节点对应的异常事件信息及异常事件对应的处理信息。
在实际应用中,可将采集模块21和处理模块23集成到集群节点中,亦即各集群节点中设置采集模块21和处理模块23。各集群节点中的采集模块21和处理模块23均与同一个监控模块22交互。
本领域技术人员可以理解,可以把实施例中的各模块组合成一个模块,以及此外可以把它们分成多个子模块。除了这样的特征和/或过程或者单元中的至少一些是互相排斥之处,可以采用任何组合对本说明书中公开的所有特征以及如此公开的任何方法或者设备的所有过程或模块进行组合。除非另外明确陈述,本说明书中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。
本领域技术人员可以理解,实施例中的各模块可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。
虽然结合附图描述了本发明的实施方式,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (10)

1.一种分布式搜索集群系统的监控及自愈方法,其特征在于,包括:
实时采集分布式搜索集群系统各集群节点的各项预设监控指标的值;
基于各集群节点的各项预设监控指标的值,与预设监控策略进行匹配,得到各集群节点对应的异常事件信息及异常事件对应的处理信息;
基于各集群节点对应的异常事件信息及异常事件对应的处理信息,对存在异常事件的各目标集群节点进行处理,实现分布式搜索集群系统的监控及自愈。
2.根据权利要求1所述的方法,其特征在于,所述实时采集分布式搜索集群系统各集群节点的各项预设监控指标的值之后,还包括:
同步采集到的各集群节点的各项预设监控指标的值;
相应地,所述基于各集群节点的各项预设监控指标的值,与预设监控策略进行匹配,包括:
基于同步后的各集群节点的各项预设监控指标的值,与预设监控策略进行匹配。
3.根据权利要求2所述的方法,其特征在于,所述同步采集到的各集群节点的各项预设监控指标的值,包括:
通过分布式应用程序协调服务zookeeper,同步采集到的各集群节点的各项预设监控指标的值。
4.根据权利要求2所述的方法,其特征在于,所述得到各集群节点对应的异常事件信息及异常事件对应的处理信息之后,还包括:
记录日志信息,该日志信息中携带有各集群节点对应的异常事件信息及异常事件对应的处理信息。
5.根据权利要求1所述的方法,其特征在于,所述得到各集群节点对应的异常事件信息及异常事件对应的处理信息之后,还包括:
将各集群节点对应的异常事件信息及异常事件对应的处理信息推送到分布式搜索集群系统的前端,以使所述前端显示各集群节点对应的异常事件信息及异常事件对应的处理信息。
6.一种分布式搜索集群系统的监控及自愈装置,其特征在于,包括:
采集模块,用于实时采集分布式搜索集群系统各集群节点的各项预设监控指标的值;
监控模块,用于基于各集群节点的各项预设监控指标的值,与预设监控策略进行匹配,得到各集群节点对应的异常事件信息及异常事件对应的处理信息;
处理模块,用于基于各集群节点对应的异常事件信息及异常事件对应的处理信息,对存在异常事件的各目标集群节点进行处理,实现分布式搜索集群系统的监控及自愈。
7.根据权利要求6所述的装置,其特征在于,还包括:
同步模块,用于同步所述采集模块采集到的各集群节点的各项预设监控指标的值;
相应地,所述监控模块,用于基于同步后的各集群节点的各项预设监控指标的值,与预设监控策略进行匹配,得到各集群节点对应的异常事件信息及异常事件对应的处理信息。
8.根据权利要求7所述的装置,其特征在于,所述同步模块,具体用于通过分布式应用程序协调服务zookeeper,同步采集到的各集群节点的各项预设监控指标的值。
9.根据权利要求7所述的装置,其特征在于,还包括:
记录模块,用于所述监控模块得到各集群节点对应的异常事件信息及异常事件对应的处理信息之后,记录日志信息,该日志信息中携带有各集群节点对应的异常事件信息及异常事件对应的处理信息。
10.根据权利要求6所述的装置,其特征在于,还包括:
推送模块,用于所述监控模块得到各集群节点对应的异常事件信息及异常事件对应的处理信息之后,将各集群节点对应的异常事件信息及异常事件对应的处理信息推送到分布式搜索集群系统的前端,以使所述前端显示各集群节点对应的异常事件信息及异常事件对应的处理信息。
CN201610787088.5A 2016-08-30 2016-08-30 一种分布式搜索集群系统的监控及自愈方法、装置 Pending CN106383776A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610787088.5A CN106383776A (zh) 2016-08-30 2016-08-30 一种分布式搜索集群系统的监控及自愈方法、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610787088.5A CN106383776A (zh) 2016-08-30 2016-08-30 一种分布式搜索集群系统的监控及自愈方法、装置

Publications (1)

Publication Number Publication Date
CN106383776A true CN106383776A (zh) 2017-02-08

Family

ID=57938790

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610787088.5A Pending CN106383776A (zh) 2016-08-30 2016-08-30 一种分布式搜索集群系统的监控及自愈方法、装置

Country Status (1)

Country Link
CN (1) CN106383776A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107423194A (zh) * 2017-06-30 2017-12-01 阿里巴巴集团控股有限公司 前端异常告警处理方法、装置及系统
CN108768790A (zh) * 2018-06-29 2018-11-06 北京奇虎科技有限公司 分布式搜索集群监控方法及装置、计算设备、存储介质
CN109495335A (zh) * 2017-09-12 2019-03-19 阿里巴巴集团控股有限公司 业务监控方法、装置、系统及电子设备
CN109614289A (zh) * 2018-12-10 2019-04-12 浪潮(北京)电子信息产业有限公司 一种存储节点监控方法、系统、设备及计算机存储介质
CN110162645A (zh) * 2019-05-28 2019-08-23 广东三维家信息科技有限公司 基于索引的图像检索方法、装置及电子设备
CN110928750A (zh) * 2018-09-19 2020-03-27 阿里巴巴集团控股有限公司 数据处理方法、装置及设备
CN111026621A (zh) * 2019-12-23 2020-04-17 杭州安恒信息技术股份有限公司 面向Elasticsearch集群的监控报警方法、装置、设备、介质
CN112492632A (zh) * 2020-11-09 2021-03-12 厦门亿联网络技术股份有限公司 一种基于漫游系统的异常监控方法、系统
CN112769605A (zh) * 2020-12-30 2021-05-07 杭州东方通信软件技术有限公司 一种异构多云的运维管理方法及混合云平台
CN115065511A (zh) * 2022-05-30 2022-09-16 济南浪潮数据技术有限公司 一种处理集群异常事件的方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101719841A (zh) * 2009-11-13 2010-06-02 曙光信息产业(北京)有限公司 分布式集群监控系统及方法
CN102340415A (zh) * 2011-06-23 2012-02-01 北京新媒传信科技有限公司 一种服务器集群系统的监控方法和一种服务器集群系统
CN102394901A (zh) * 2011-06-23 2012-03-28 北京新媒传信科技有限公司 一种服务器集群系统及其中的监控策略更新方法
CN103618644A (zh) * 2013-11-26 2014-03-05 曙光信息产业股份有限公司 一种基于hadoop集群的分布式监控系统及其方法
US20140304399A1 (en) * 2013-04-06 2014-10-09 Citrix Systems, Inc. Systems and methods for providing monitoring in a cluster system
CN105187548A (zh) * 2015-09-25 2015-12-23 浪潮(北京)电子信息产业有限公司 一种集群监控信息收集方法与系统
CN105337765A (zh) * 2015-10-10 2016-02-17 上海新炬网络信息技术有限公司 一种分布式hadoop集群故障自动诊断修复系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101719841A (zh) * 2009-11-13 2010-06-02 曙光信息产业(北京)有限公司 分布式集群监控系统及方法
CN102340415A (zh) * 2011-06-23 2012-02-01 北京新媒传信科技有限公司 一种服务器集群系统的监控方法和一种服务器集群系统
CN102394901A (zh) * 2011-06-23 2012-03-28 北京新媒传信科技有限公司 一种服务器集群系统及其中的监控策略更新方法
US20140304399A1 (en) * 2013-04-06 2014-10-09 Citrix Systems, Inc. Systems and methods for providing monitoring in a cluster system
CN103618644A (zh) * 2013-11-26 2014-03-05 曙光信息产业股份有限公司 一种基于hadoop集群的分布式监控系统及其方法
CN105187548A (zh) * 2015-09-25 2015-12-23 浪潮(北京)电子信息产业有限公司 一种集群监控信息收集方法与系统
CN105337765A (zh) * 2015-10-10 2016-02-17 上海新炬网络信息技术有限公司 一种分布式hadoop集群故障自动诊断修复系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
王延光等: "油田信息化", 《胜利油田地球物理技术进展与实践 下 2005-2011年》 *
谢新洲: "《竞争情报进展 2014版》", 30 April 2016 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107423194A (zh) * 2017-06-30 2017-12-01 阿里巴巴集团控股有限公司 前端异常告警处理方法、装置及系统
CN107423194B (zh) * 2017-06-30 2021-01-22 创新先进技术有限公司 前端异常告警处理方法、装置及系统
CN109495335B (zh) * 2017-09-12 2022-12-27 阿里巴巴集团控股有限公司 业务监控方法、装置、系统及电子设备
CN109495335A (zh) * 2017-09-12 2019-03-19 阿里巴巴集团控股有限公司 业务监控方法、装置、系统及电子设备
CN108768790A (zh) * 2018-06-29 2018-11-06 北京奇虎科技有限公司 分布式搜索集群监控方法及装置、计算设备、存储介质
CN110928750A (zh) * 2018-09-19 2020-03-27 阿里巴巴集团控股有限公司 数据处理方法、装置及设备
CN110928750B (zh) * 2018-09-19 2023-04-18 阿里巴巴集团控股有限公司 数据处理方法、装置及设备
CN109614289A (zh) * 2018-12-10 2019-04-12 浪潮(北京)电子信息产业有限公司 一种存储节点监控方法、系统、设备及计算机存储介质
CN110162645A (zh) * 2019-05-28 2019-08-23 广东三维家信息科技有限公司 基于索引的图像检索方法、装置及电子设备
CN111026621A (zh) * 2019-12-23 2020-04-17 杭州安恒信息技术股份有限公司 面向Elasticsearch集群的监控报警方法、装置、设备、介质
CN111026621B (zh) * 2019-12-23 2023-04-07 杭州安恒信息技术股份有限公司 面向Elasticsearch集群的监控报警方法、装置、设备、介质
CN112492632B (zh) * 2020-11-09 2023-02-17 厦门亿联网络技术股份有限公司 一种基于漫游系统的异常监控方法、系统
CN112492632A (zh) * 2020-11-09 2021-03-12 厦门亿联网络技术股份有限公司 一种基于漫游系统的异常监控方法、系统
CN112769605A (zh) * 2020-12-30 2021-05-07 杭州东方通信软件技术有限公司 一种异构多云的运维管理方法及混合云平台
CN115065511A (zh) * 2022-05-30 2022-09-16 济南浪潮数据技术有限公司 一种处理集群异常事件的方法及系统

Similar Documents

Publication Publication Date Title
CN106383776A (zh) 一种分布式搜索集群系统的监控及自愈方法、装置
CN105989076B (zh) 一种数据统计方法以及装置
CN103235820B (zh) 一种集群系统中数据存储方法与装置
CN107204894A (zh) 网络业务质量的监控方法及装置
CN105677918A (zh) 一种基于Kafka和Quartz的分布式爬虫架构及其实现方法
CN104917627B (zh) 一种用于大型服务器集群的日志集群扫描与分析方法
CN104714984A (zh) 一种数据库优化的方法和装置
CN109408509A (zh) 数据存储方法、装置及计算机设备
WO2021185079A1 (zh) 相似故障推荐方法及相关设备
CN108932217A (zh) 能耗统计的方法及装置
CN106682206A (zh) 一种大数据处理方法及系统
US11461367B2 (en) Multi-source data management mechanism and platform
CN105187554A (zh) 服务器性能监控方法及系统
CN106789347A (zh) 一种基于告警数据实现告警关联和网络故障诊断的方法
CN102075964A (zh) 网管系统获取性能数据的方法和设备
CN103607731B (zh) 一种测量报告的处理方法及装置
CN106302421A (zh) 一种信息拦截处理方法以及装置
CN114691662A (zh) 一种数据质量检查规则自适应方法、存储介质及系统
CN105471626A (zh) 一种分配内存存储数据的方法和系统
CN109560978B (zh) 网络流量检测方法、装置及系统和计算机可读存储介质
CN111159131A (zh) 性能优化方法、装置、设备及计算机可读存储介质
CN105868365A (zh) 一种基于Hadoop的传统网管数据处理方法
CN116389223B (zh) 一种基于大数据的人工智能可视化预警系统及方法
CN105426407A (zh) 一种基于内容分析的web数据采集方法
CN106933926B (zh) 数据表的过滤方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170208

RJ01 Rejection of invention patent application after publication