CN113672472A - 磁盘监控方法及装置 - Google Patents
磁盘监控方法及装置 Download PDFInfo
- Publication number
- CN113672472A CN113672472A CN202110999902.0A CN202110999902A CN113672472A CN 113672472 A CN113672472 A CN 113672472A CN 202110999902 A CN202110999902 A CN 202110999902A CN 113672472 A CN113672472 A CN 113672472A
- Authority
- CN
- China
- Prior art keywords
- disk
- monitored object
- usage
- prediction information
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 94
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000012545 processing Methods 0.000 claims abstract description 99
- 230000001133 acceleration Effects 0.000 claims abstract description 97
- 238000012423 maintenance Methods 0.000 claims abstract description 38
- 238000004140 cleaning Methods 0.000 claims description 38
- 238000004590 computer program Methods 0.000 claims description 28
- 230000015654 memory Effects 0.000 claims description 11
- 238000005192 partition Methods 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 5
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000012806 monitoring device Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 238000013461 design Methods 0.000 description 7
- 230000002349 favourable effect Effects 0.000 description 5
- 230000001960 triggered effect Effects 0.000 description 5
- 230000036541 health Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004806 packaging method and process Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3034—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3055—Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3089—Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
- G06F11/3093—Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3476—Data logging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/80—Database-specific techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Computer Hardware Design (AREA)
- Data Mining & Analysis (AREA)
- Debugging And Monitoring (AREA)
Abstract
本公开提供了一种磁盘监控方法,应用于金融技术领域或其他技术领域,本方法包括:以预设频率采集被监控对象的磁盘状态参数;对预定时长内采集的磁盘状态参数进行分析处理,得到与所述被监控对象关联的磁盘用量增速信息;基于所述磁盘用量增速信息,进行针对所述被监控对象的磁盘状态预测,得到与所述被监控对象的磁盘关联的状态预测信息;以及根据所述磁盘用量增速信息和所述状态预测信息,触发针对所述被监控对象的磁盘运维操作。本公开还提供一种磁盘监控装置、一种电子设备及一种计算机存储介质。
Description
技术领域
本公开涉及数据库技术领域和金融技术领域,特别是涉及一种磁盘监控方法及装置、电子设备、计算机可读存储介质和计算机程序产品。
背景技术
对服务器的各项资源使用情况进行监控具有重要意义。利用监控工具采集的服务器监控指标包括服务器资源指标,服务器资源指标例如包括CPU使用率、消耗资源进程、磁盘I/O速度和读写比例等。
在实现本公开技术方案过程中,发明人发现相关技术中利用监控工具采集的服务器监控指标缺乏数据库指标数据,数据库监控依赖运维人员定时巡检以判断数据库健康状态,这影响数据库问题发现并处理的时效性,影响数据库性能,造成数据库运维成本提升。
发明内容
本公开的一个方面提供了一种磁盘监控方法,包括:以预设频率采集被监控对象的磁盘状态参数;对预定时长内采集的磁盘状态参数进行分析处理,得到与所述被监控对象关联的磁盘用量增速信息;基于所述磁盘用量增速信息,进行针对所述被监控对象的磁盘状态预测,得到与所述被监控对象的磁盘关联的状态预测信息;以及根据所述磁盘用量增速信息和所述状态预测信息,触发针对所述被监控对象的磁盘运维操作。
可选地,所述以预设频率采集被监控对象的磁盘状态参数,包括:通过在所述被监控对象的操作系统中部署监控插件,利用所述监控插件以预设频率采集所述被监控对象的所述磁盘状态参数,其中,所述磁盘状态参数包括磁盘已用容量、磁盘容量配额、磁盘挂载目录、磁盘分区信息、磁盘活动时长、磁盘所属存储池中的至少之一。
可选地,所述利用所述监控插件以预设频率采集所述被监控对象的所述磁盘状态参数,包括:利用所述监控插件通过非云环境下数据采集方式和/或云环境下数据采集方式,以预设频率采集所述被监控对象的所述磁盘状态参数,其中,所述被监控对象包括计算设备、数据库、存储设备中的至少之一,所述计算设备用于承载相应的数据业务。
可选地,所述基于所述磁盘用量增速信息,进行针对所述被监控对象的磁盘状态预测,得到与所述被监控对象的磁盘关联的状态预测信息,包括:基于所述磁盘用量增速信息,进行针对所述被监控对象的磁盘状态预测,得到与所述被监控对象的磁盘关联的可用容量预测信息、容量耗尽预测信息、可使用时长预测信息、用量增速异常预警信息中的至少之一。
可选地,所述根据所述磁盘用量增速信息和所述状态预测信息,触发针对所述被监控对象的磁盘运维操作,包括:根据所述磁盘用量增速信息和所述状态预测信息,确定所述被监控对象的磁盘用量比率和/或磁盘可使用时长是否满足预设报警阈值;在确定所述被监控对象的磁盘用量比率和/或磁盘可使用时长满足所述报警阈值的情况下,触发针对所述被监控对象的磁盘预警提示。
可选地,所述根据所述磁盘用量增速信息和所述状态预测信息,触发针对所述被监控对象的磁盘运维操作,包括:根据所述磁盘用量增速信息和所述状态预测信息,确定所述被监控对象是否满足预设的磁盘清理条件;在确定所述被监控对象满足所述磁盘清理条件的情况下,基于所述磁盘用量增速信息确定针对所述被监控对象的磁盘的清理速率;根据确定出的所述清理速率,进行针对所述被监控对象的磁盘的清理处理,其中,针对所述磁盘的清理速率大于磁盘用量增速。
可选地,所述被监控对象的磁盘包括日志存储层、日志缓冲层和日志消费层;所述根据所述磁盘用量增速信息和所述状态预测信息,触发针对所述被监控对象的磁盘运维操作,包括:根据所述磁盘用量增速信息和所述状态预测信息,确定所述被监控对象是否满足预设的磁盘扩容条件;在确定所述被监控对象满足所述磁盘扩容条件的情况下,根据所述状态预测信息确定针对所述磁盘中的日志存储层的扩容量;根据针对所述磁盘中的日志存储层的扩容量,以及根据所述日志存储层与日志缓冲层、日志消费层的匹配比例,进行针对所述日志存储层、日志缓冲层和日志消费层的扩容处理。
可选地,所述根据所述磁盘用量增速信息和所述状态预测信息,触发针对所述被监控对象的磁盘运维操作,包括:根据所述磁盘用量增速信息和所述状态预测信息,确定所述被监控对象的磁盘负载是否满足预设禁用条件;在确定所述被监控对象的磁盘负载满足所述禁用条件的情况下,向所述被监控对象发送禁用指令,以使所述被监控对象停止对外服务。
可选地,所述方法还包括:对部署在所述被监控对象的操作系统中的监控插件进行插件管理,所述插件管理包括插件调用管理、合法性验证、配置信息管理中的至少之一。
可选地,所述方法还包括:进行针对所述磁盘状态参数、所述磁盘用量增速信息和所述状态预测信息的序列化处理,得到序列化处理后的磁盘监控数据;以及可视化展示所述序列化处理后的磁盘监控数据。
本公开的另一方面提供了一种磁盘监控装置,包括:采集模块,用于以预设频率采集被监控对象的磁盘状态参数;第一处理模块,用于对预定时长内采集的磁盘状态参数进行分析处理,得到与所述被监控对象关联的磁盘用量增速信息;第二处理模块,用于基于所述磁盘用量增速信息,进行针对所述被监控对象的磁盘状态预测,得到与所述被监控对象的磁盘关联的状态预测信息;以及第三处理模块,用于根据所述磁盘用量增速信息和所述状态预测信息,触发针对所述被监控对象的磁盘运维操作。
可选地,所述采集模块用于通过在所述被监控对象的操作系统中部署监控插件,利用所述监控插件以预设频率采集所述被监控对象的所述磁盘状态参数,其中,所述磁盘状态参数包括磁盘已用容量、磁盘容量配额、磁盘挂载目录、磁盘分区信息、磁盘活动时长、磁盘所属存储池中的至少之一。
可选地,所述采集模块用于利用所述监控插件通过非云环境下数据采集方式和/或云环境下数据采集方式,以预设频率采集所述被监控对象的所述磁盘状态参数,其中,所述被监控对象包括计算设备、数据库、存储设备中的至少之一,所述计算设备用于承载相应的数据业务。
可选地,所述第二处理模块包括第一处理子模块,用于基于所述磁盘用量增速信息,进行针对所述被监控对象的磁盘状态预测,得到与所述被监控对象的磁盘关联的可用容量预测信息、容量耗尽预测信息、可使用时长预测信息、用量增速异常预警信息中的至少之一。
可选地,所述第三处理模块包括:第二处理子模块,用于根据所述磁盘用量增速信息和所述状态预测信息,确定所述被监控对象的磁盘用量比率和/或磁盘可使用时长是否满足预设报警阈值;第三处理子模块,用于在确定所述被监控对象的磁盘用量比率和/或磁盘可使用时长满足所述报警阈值的情况下,触发针对所述被监控对象的磁盘预警提示。
可选地,所述第三处理模块包括:第四处理子模块,用于根据所述磁盘用量增速信息和所述状态预测信息,确定所述被监控对象是否满足预设的磁盘清理条件;第五处理子模块,用于在确定所述被监控对象满足所述磁盘清理条件的情况下,基于所述磁盘用量增速信息确定针对所述被监控对象的磁盘的清理速率;第六处理子模块,用于根据确定出的所述清理速率,进行针对所述被监控对象的磁盘的清理处理,其中,针对所述磁盘的清理速率大于磁盘用量增速。
可选地,所述被监控对象的磁盘包括日志存储层、日志缓冲层和日志消费层;所述第三处理模块包括:第七处理子模块,用于根据所述磁盘用量增速信息和所述状态预测信息,确定所述被监控对象是否满足预设的磁盘扩容条件;第八处理子模块,用于在确定所述被监控对象满足所述磁盘扩容条件的情况下,根据所述状态预测信息确定针对所述磁盘中的日志存储层的扩容量;第九处理子模块,用于根据针对所述磁盘中的日志存储层的扩容量,以及根据所述日志存储层与日志缓冲层、日志消费层的匹配比例,进行针对所述日志存储层、日志缓冲层和日志消费层的扩容处理。
可选地,所述第三处理模块包括:第十处理子模块,用于根据所述磁盘用量增速信息和所述状态预测信息,确定所述被监控对象的磁盘负载是否满足预设禁用条件;第十一处理子模块,用于在确定所述被监控对象的磁盘负载满足所述禁用条件的情况下,向所述被监控对象发送禁用指令,以使所述被监控对象停止对外服务。
可选地,所述装置还包括第四处理模块,用于对部署在所述被监控对象的操作系统中的监控插件进行插件管理,所述插件管理包括插件调用管理、合法性验证、配置信息管理中的至少之一。
可选地,所述装置还包括第五处理模块,用于进行针对所述磁盘状态参数、所述磁盘用量增速信息和所述状态预测信息的序列化处理,得到序列化处理后的磁盘监控数据;以及可视化展示所述序列化处理后的磁盘监控数据。
本公开的另一方面提供了一种电子设备,包括:一个或多个处理器;以及存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现本公开实施例的方法。
本公开的另一方面提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器实现本公开实施例的方法。
本公开的另一方面提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现本公开实施例的方法。
附图说明
为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中,
图1示意性示出了根据本公开实施例的磁盘监控方法及装置的系统架构;
图2示意性示出了根据本公开实施例的一种磁盘监控方法的流程图;
图3示意性示出了根据本公开实施例的另一磁盘监控方法的流程图;
图4示意性示出了根据本公开实施例的又一磁盘监控方法的流程图;
图5示意性示出了根据本公开实施例的再一磁盘监控方法的流程图;
图6示意性示出了根据本公开实施例的又一磁盘监控方法的流程图;
图7示意性示出了根据本公开实施例的一种磁盘监控装置的框图;
图8示意性示出了根据本公开实施例的电子设备的框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性地,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了特征、操作、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、操作、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程磁盘监控装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读存储介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。
对服务器的各项资源使用情况进行监控具有重要意义。利用监控工具采集的服务器监控指标通常包括服务器资源指标,示例性地,利用监控服务器资源工具nmon采集的服务器资源指标包括CPU使用率、消耗资源进程、磁盘I/O速度和读写比例、磁盘适配器、页面空间和页面速度、网络文件系统、内核统计信息等。
在实现本公开技术方案过程中,发明人发现相关技术中利用监控工具采集的服务器监控指标缺乏数据库指标数据,数据库监控依赖运维人员定时巡检以判断数据库健康状态。这影响数据库问题预警的实时性,以及影响数据库问题解决的有效性,影响数据库性能及使用体验,造成数据库运维成本提升。
针对相关技术中存在的技术问题,本公开实施例提供了一种磁盘监控方法及装置。根据本公开实施例,首先,以预设频率采集被监控对象的磁盘状态参数,对预定时长内采集的磁盘状态参数进行分析处理,得到与被监控对象关联的磁盘用量增速信息。然后,基于磁盘用量增速信息,进行针对被监控对象的磁盘状态预测,得到与被监控对象的磁盘关联的状态预测信息。接下来,根据磁盘用量增速信息和状态预测信息,触发针对被监控对象的磁盘运维操作。
图1示意性示出了根据本公开实施例的磁盘监控方法及装置的系统架构。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
如图1所示,系统架构100可以包括运维管理平台101、磁盘监控平台102、被监控对象103和网络104,网络104为用于在运维管理平台101、磁盘监控平台102和被监控对象103之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
实际应用中,运维管理平台101和磁盘监控平台102可以部署于同一独立的物理服务器,也可以部署于多个物理服务器构成的服务器集群或分布式系统,还可以部署于提供云服务、云计算、网络服务、中间件服务等基础云计算服务的云服务器。被监控对象103可以是非云环境下或云环境下的设备或应用,被监控对象103例如包括计算设备1031、数据库1032和存储设备1032,计算设备1031用于承载相应的数据业务。
利用磁盘监控平台102以预设频率采集被监控对象103(例如包括计算设备1031、数据库1032和存储设备1032)的磁盘状态参数,对预定时长内采集的磁盘状态参数进行分析处理,得到与被监控对象103关联的磁盘用量增速信息,以及基于磁盘用量增速信息,进行针对被监控对象103的磁盘状态预测,得到与被监控对象103的磁盘关联的状态预测信息。接下来,利用磁盘监控平台102根据确定出的磁盘用量增速信息和状态预测信息,触发运维管理平台101进行针对被监控对象103的磁盘运维操作。
需要说明的是,本公开实施例的磁盘监控方法和装置可用于金融领域,也可用于除金融领域之外的任意领域。以下将结合附图和具体实施例详细阐述本公开。
图2示意性示出了根据本公开实施例的一种磁盘监控方法的流程图,如图2所示,方法200可以包括操作S210~S240。
在操作S210,以预设频率采集被监控对象的磁盘状态参数。
接下来,在操作S220,对预定时长内采集的磁盘状态参数进行分析处理,得到与被监控对象关联的磁盘用量增速信息。
接下来,在操作S230,基于磁盘用量增速信息,进行针对被监控对象的磁盘状态预测,得到与被监控对象的磁盘关联的状态预测信息。
以及
接下来,在操作S240,根据磁盘用量增速信息和状态预测信息,触发针对被监控对象的磁盘运维操作。
下面详细说明本实施例的磁盘监控方法的各步骤的示例流程。
在操作S210,以预设频率采集被监控对象的磁盘状态参数。
在本公开实施例中,通过在被监控对象的操作系统中部署监控插件,利用监控插件以预设频率采集被监控对象的磁盘状态参数。可选地,利用监控插件通过非云环境下数据采集方式和/或云环境下数据采集方式,以预设频率采集被监控对象的磁盘状态参数。被监控对象可以是非云环境下和/或云环境下的设备或应用,被监控对象例如可以是计算设备、数据库、存储设备等,计算设备用于承载相应的数据业务。
示例性地,进行磁盘监控处理的被监控对象为云服务器,云服务器用于承载相应的数据业务。在云服务器的操作系统中部署Prometheus的Node_Exporter插件,利用Node_Exporter插件以预设频率采集云服务器的磁盘状态参数。Prometheus是一种应用较为广泛的监控软件,通过在需要被监控的服务器中部署监控客户端或插件,利用监控客户端或插件采集服务器数据,以此实现针对服务器的资源使用情况监控。
对于非云环境下的数据采集,针对不同数据采集环境,可以采用集中数据采集方法和分层式数据采集方法,例如采用基于SYSLOG、JMS(Java Message Service,Java消息服务)、SNMP(Simple Network Management Protocol,简单网络管理协议)、WEBSERVICE等协议的数据采集方式。对于云环境下的数据采集,可以利用多级多域的数据采集框架,对云环境中的存储节点进行数据采集。
以预设频率采集被监控对象的磁盘状态参数,磁盘状态参数可以包括磁盘运行参数、磁盘交互参数和磁盘硬件参数。磁盘运行参数例如包括磁盘已用容量、磁盘活动时长、磁盘温度、磁盘smart健康状态等参数。磁盘交互参数例如包括磁盘所属存储池、磁盘挂载目录、磁盘分区信息等参数。磁盘硬件参数例如包括磁盘容量配额、磁盘版本信息、磁盘框编号、磁盘框路径等参数。
磁盘所属存储池与磁盘挂载的服务器主机、业务应用种类、业务项目明细等内容有关。业务项目为构成业务应用的项目子集,示例性地,在业务应用种类为银行转账应用的情况下,业务项目可以是银行转账应用中的身份验证项目。磁盘分区信息用于指示磁盘的存储框架,磁盘的存储框架例如包括日志存储层、日志缓冲层和日志消费层,日志存储层用于持久化存储业务日志数据,日志缓冲层用于缓存业务日志数据,日志消费层用于暂存待进行解析处理的业务日志数据。
作为一种可行的方式,对部署在被监控对象的操作系统中的监控插件进行插件管理,插件管理包括插件调用管理、合法性验证、配置信息管理、网络状态检测中的至少之一。对部署在被监控对象中的监控插件进行插件管理,有利于提高监控插件的稳定性和可用性。
以预设频率采集被监控对象的磁盘状态参数,通过按预定时间间隔记录被监控对象的磁盘状态参数,有利于实现基于磁盘状态参数进行多维度、灵活时间段的磁盘用量分析,能够为被监控对象的磁盘状态预测提供有效数据来源。
接下来,在操作S220,对预定时长内采集的磁盘状态参数进行分析处理,得到与被监控对象关联的磁盘用量增速信息。
在本公开实施例中,对预定时长内采集的磁盘状态参数进行分析处理,得到与被监控对象关联的磁盘用量变化信息,例如得到被监控对象基于预定时长的磁盘用量增速信息。例如,对每N天采集的磁盘状态参数进行分析处理,得到被监控对象基于每N天的磁盘用量增速信息,N为大于1的整数。示例性地,对每相邻两天采集的磁盘状态参数进行分析处理,得到被监控对象后一天相对前一天的磁盘用量增加量。
接下来,在操作S230,基于磁盘用量增速信息,进行针对被监控对象的磁盘状态预测,得到与被监控对象的磁盘关联的状态预测信息。
在本公开实施例中,根据确定出的磁盘用量增速信息,进行针对被监控对象的磁盘状态预测,得到与被监控对象的磁盘关联的状态预测信息。可选地,基于多时间维度进行针对被监控对象的磁盘容量预测,磁盘容量预测例如包括磁盘可用容量预测、磁盘容量耗尽预测、磁盘可使用时长预测、磁盘用量增速过快预测等。磁盘可用容量是根据磁盘已用容量和磁盘容量配额决定的,磁盘容量耗尽为磁盘可用容量低于预设可用容量阈值,磁盘可使用时长是根据磁盘可用容量和磁盘用量增速决定的。
示例性地,磁盘容量配额为200G,相邻两天采集的磁盘状态参数指示磁盘已用容量分别为40G、60G。对相邻两天采集的磁盘状态参数进行分析,确定磁盘用量增速为20G/天,以此预测磁盘在接下来第1、2天的可用容量分别为120G、100G,预测在接下来第7天磁盘容量耗尽,也即磁盘可使用时长为7天。
磁盘已用容量及磁盘用量增速可能随实际业务情况不断变化,以待监控对象为业务服务器为例进行说明,应用程序在处理业务过程中,需要持续不断生成业务日志,并将业务日志暂存于业务服务器的磁盘中,因此,业务服务器的磁盘已用容量及磁盘用量增速可能处于不断变化状态。在复杂多变的业务环境下,面向用户提供的互联网服务可能出现业务流量暴涨的情况(例如在电商大促时段),短时间内突然升高的业务流量容易引发业务日志数量激增,造成业务服务器的磁盘被打满的情况。因此,为避免业务服务器出现不可用或宕机、影响用户使用互联网服务的情况,需要周期性采集业务服务器的磁盘状态参数,并根据磁盘状态参数进行针对业务服务器的磁盘状态预测,以实现基于磁盘状态预测结果触发及时有效的磁盘运维操作。
作为一种可行的方式,还可以对预定时长内采集的磁盘状态参数进行例如清洗、过滤、补缺失、数据格式转换等预处理,得到预处理后的磁盘状态参数。将预处理后的磁盘状态参数输入预设的磁盘负载预测模型,得到与被监控对象的磁盘关联的磁盘用量增速信息和状态预测信息。
接下来,在操作S240,根据磁盘用量增速信息和状态预测信息,触发针对被监控对象的磁盘运维操作。
在本公开实施例中,作为一种可行的方式,进行针对磁盘状态参数、磁盘用量增速信息和状态预测信息的序列化处理,得到序列化处理后的磁盘监控数据,并且可视化展示序列化处理后的磁盘监控数据。序列化处理为将数据对象转换为可以存储或传输的形式的过程,例如可以将数据对象保存到文件或数据库字段中。将相同时间点采集的磁盘状态参数作为单条数据进行存储,同时将与磁盘状态参数对应的磁盘用量增速信息和状态预测信息进行关联存储。例如,将同一时间点采集的磁盘状态参数,以及将与磁盘状态参数对应的磁盘用量增速信息和状态预测信息,以同一数据报表的形式进行关联存储,得到序列化处理后的磁盘监控数据。
可选地,可以利用可视化工具Grafana,对序列化处理后的磁盘监控数据进行页面展示。同时,Grafana可以通过提供应用程序编程API接口,支持其他应用调用磁盘监控数据。另外,也可以利用Django可视化展示磁盘监控数据,Django是一种开放源代码的Web应用框架,其能够根据用户个性化需求定制显示页面,能够实现灵活性更高、可视化形式更多样的数据展示功能。本设计有利于为针对待监控对象进行的磁盘运维工作提供可视化程度高、参考价值大的数据来源支持。
另外,还可以调用openpyxl驱动,提取序列化处理后的磁盘监控数据,并将磁盘监控数据插入到Excel表中。然后,调用邮件服务器将Excel表以插件形式,发送给运维平台管理人员。
通过本公开实施例,以预设频率采集被监控对象的磁盘状态参数;对预定时长内采集的磁盘状态参数进行分析处理,得到与被监控对象关联的磁盘用量增速信息;基于磁盘用量增速信息,进行针对被监控对象的磁盘状态预测,得到与被监控对象的磁盘关联的状态预测信息;以及根据磁盘用量增速信息和状态预测信息,触发针对被监控对象的磁盘运维操作。利用监控工具采集被监控对象的数据库指标数据(即磁盘状态参数),通过对预定时长内采集的磁盘状态参数进行分析处理,得到与被监控对象关联的磁盘用量增速信息,基于磁盘用量增速信息确定被监控对象的磁盘的状态预测信息,以实现基于磁盘的状态预测信息进行针对被监控对象的磁盘运维操作。该种设计能够有效提高磁盘问题预警的时效性,和改善磁盘问题解决的有效性,以及有利于保证被监控对象的数据库性能的稳定性和可用性。此外,由于可以基本无需依赖运维人员定时巡检以判断磁盘健康状态,该种设计还有利于降低磁盘运维成本,有利于实现对私有云监控更高效且人力成本更低的监控方法。
图3示意性示出了根据本公开实施例的另一磁盘监控方法的流程图,如图3所示,操作S240可以包括操作S310~S320。
在操作S310,根据磁盘用量增速信息和状态预测信息,确定被监控对象的磁盘用量比率和/或磁盘可使用时长是否满足预设报警阈值。
接下来,在操作S320,在确定被监控对象的磁盘用量比率和/或磁盘可使用时长满足报警阈值的情况下,触发针对被监控对象的磁盘预警提示。
在本公开实施例中,根据确定出的被监控对象的磁盘用量增速信息和磁盘状态预测信息,计算被监控对象基于预设时间点的磁盘用量比率和/或磁盘可使用时长。在磁盘用量比率和/或磁盘可使用时长处于预设报警范围的情况下,确定磁盘状态满足报警触发条件,生成针对被监控对象的磁盘预警提示。
示例性地,在磁盘实时已用容量大于磁盘容量配额的90%以上,或者磁盘可使用时长小于24小时的情况下,生成针对被监控对象的磁盘预警提示。本设计有利于弥补因监控工作不足,造成磁盘问题预警不及时、问题处理效率低的问题,通过触发及时有效的磁盘运维操作,能够有效改善被监控对象的数据库性能,有利于保证数据库功能的稳定性。
图4示意性示出了根据本公开实施例的又一磁盘监控方法的流程图,如图4所示,操作S240可以包括操作S410~S430。
在操作S410,根据磁盘用量增速信息和状态预测信息,确定被监控对象是否满足预设的磁盘清理条件。
接下来,在操作S420,在确定被监控对象满足磁盘清理条件的情况下,基于磁盘用量增速信息确定针对被监控对象的磁盘的清理速率。
接下来,在操作S430,根据确定出的清理速率,进行针对被监控对象的磁盘的清理处理,其中,针对磁盘的清理速率大于磁盘用量增速。
在本公开实施例中,根据确定出的被监控对象的磁盘用量增速信息和状态预测信息,例如根据被监控对象基于预设时间点的磁盘可用容量、磁盘用量比率、磁盘可使用时长、磁盘用量增速等信息,确定被监控对象是否满足预设的磁盘清理条件。
在确定被监控对象满足磁盘清理条件的情况下,基于磁盘用量增速信息确定针对被监控对象的磁盘的清理速率。可选地,针对被监控对象的磁盘的清理速率大于磁盘用量增速。假设ti时刻采集的磁盘状态参数指示磁盘实时用量为Ri,tj时刻采集的磁盘状态参数指示磁盘实时用量为Rj,tj>ti,tj时刻相对ti时刻的磁盘用量增速可表示为V=(Rj-RI)/(tj-ti)。按照大于磁盘用量增速的清理速率,进行针对被监控对象的磁盘的清理处理。在被监控对象为分布式系统中的不同服务器的情况下,通过对分布式系统执行有效的磁盘清理策略,有利于有效应对业务流量突发增长的情况,能够有效保证分布式系统处于数据库性能较优的状态。
图5示意性示出了根据本公开实施例的再一磁盘监控方法的流程图,如图5所示,操作S240可以包括操作S510~S530。
在操作S510,根据磁盘用量增速信息和状态预测信息,确定被监控对象是否满足预设的磁盘扩容条件。
接下来,在操作S520,在确定被监控对象满足磁盘扩容条件的情况下,根据状态预测信息确定针对磁盘中的日志存储层的扩容量。
接下来,在操作S530,根据针对磁盘中的日志存储层的扩容量,以及根据日志存储层与日志缓冲层、日志消费层的匹配比例,进行针对日志存储层、日志缓冲层和日志消费层的扩容处理。
在本公开实施例中,在部分业务环境下,磁盘的存储框架可以包括日志存储层、日志缓冲层和日志消费层,日志存储层用于持久化存储业务日志数据,日志缓冲层用于缓存业务日志数据,日志消费层用于暂存待进行解析处理的业务日志数据。根据确定出的被监控对象的磁盘用量增速信息和状态预测信息,确定被监控对象是否满足预设的磁盘扩容条件。在确定被监控对象满足磁盘扩容条件的情况下,根据被监控对象基于预设时间点的磁盘可用容量、磁盘用量比率、磁盘可使用时长、磁盘用量增速等信息,确定针对磁盘中的日志存储层的扩容量。
在确定出针对磁盘中的日志存储层的扩容量后,根据与日志存储层关联的扩容量,以及根据日志存储层与日志缓冲层、日志消费层的匹配比例,进行针对日志存储层、日志缓冲层和日志消费层的扩容处理。示例性地,基于N:N:90N的匹配比例,进行针对日志存储层、日志缓冲层和日志消费层的扩容处理。本设计有利于改善被监控对象的数据库性能的可扩展性和使用高效性,能够有效避免磁盘剩余空间不足时扩容时间紧张的问题。
图6示意性示出了根据本公开实施例的又一磁盘监控方法的流程图,如图6所示,操作S240可以包括操作S610~S620。
在操作S610,根据磁盘用量增速信息和状态预测信息,确定被监控对象的磁盘负载是否满足预设禁用条件。
接下来,在操作S620,在确定被监控对象的磁盘负载满足禁用条件的情况下,向被监控对象发送禁用指令,以使被监控对象停止对外服务。
在本公开实施例中,根据确定出的被监控对象的磁盘用量增速信息和状态预测信息,确定被监控对象的磁盘负载是否满足预设禁用条件,例如确定被监控对象的磁盘可用容量、磁盘用量比率、磁盘可使用时长等信息是否满足预设禁用条件。在确定被监控对象的磁盘负载满足禁用条件的情况下,向被监控对象发送禁用指令,以使被监控对象停止对外服务。
图7示意性示出了根据本公开实施例的一种磁盘监控装置的框图。
如图7所示,装置700包括采集模块701、第一处理模块702、第二处理模块703和第三处理模块704。
其中,采集模块701,用于以预设频率采集被监控对象的磁盘状态参数。第一处理模块702,用于对预定时长内采集的磁盘状态参数进行分析处理,得到与被监控对象关联的磁盘用量增速信息。第二处理模块703,用于基于磁盘用量增速信息,进行针对被监控对象的磁盘状态预测,得到与被监控对象的磁盘关联的状态预测信息。第三处理模块704,用于根据磁盘用量增速信息和状态预测信息,触发针对被监控对象的磁盘运维操作。
通过本公开实施例,以预设频率采集被监控对象的磁盘状态参数;对预定时长内采集的磁盘状态参数进行分析处理,得到与被监控对象关联的磁盘用量增速信息;基于磁盘用量增速信息,进行针对被监控对象的磁盘状态预测,得到与被监控对象的磁盘关联的状态预测信息;以及根据磁盘用量增速信息和状态预测信息,触发针对被监控对象的磁盘运维操作。利用监控工具采集被监控对象的数据库指标数据(即磁盘状态参数),通过对预定时长内采集的磁盘状态参数进行分析处理,得到与被监控对象关联的磁盘用量增速信息,基于磁盘用量增速信息确定被监控对象的磁盘的状态预测信息,以实现基于磁盘的状态预测信息进行针对被监控对象的磁盘运维操作。该种设计能够有效提高磁盘问题预警的时效性,和改善磁盘问题解决的有效性,以及有利于保证被监控对象的数据库性能的稳定性和可用性。此外,由于可以基本无需依赖运维人员定时巡检以判断磁盘健康状态,该种设计还有利于降低磁盘运维成本,有利于实现对私有云监控更高效且人力成本更低的监控方法。
作为一种可行的方式,采集模块用于通过在被监控对象的操作系统中部署监控插件,利用监控插件以预设频率采集被监控对象的磁盘状态参数,其中,磁盘状态参数包括磁盘已用容量、磁盘容量配额、磁盘挂载目录、磁盘分区信息、磁盘活动时长、磁盘所属存储池中的至少之一。
作为一种可行的方式,采集模块用于利用监控插件通过非云环境下数据采集方式和/或云环境下数据采集方式,以预设频率采集被监控对象的磁盘状态参数,其中,被监控对象包括计算设备、数据库、存储设备中的至少之一,计算设备用于承载相应的数据业务。
作为一种可行的方式,第二处理模块包括第一处理子模块,用于基于磁盘用量增速信息,进行针对被监控对象的磁盘状态预测,得到与被监控对象的磁盘关联的可用容量预测信息、容量耗尽预测信息、可使用时长预测信息、用量增速异常预警信息中的至少之一。
作为一种可行的方式,第三处理模块包括:第二处理子模块,用于根据磁盘用量增速信息和状态预测信息,确定被监控对象的磁盘用量比率和/或磁盘可使用时长是否满足预设报警阈值;第三处理子模块,用于在确定被监控对象的磁盘用量比率和/或磁盘可使用时长满足报警阈值的情况下,触发针对被监控对象的磁盘预警提示。
作为一种可行的方式,第三处理模块包括:第四处理子模块,用于根据磁盘用量增速信息和状态预测信息,确定被监控对象是否满足预设的磁盘清理条件;第五处理子模块,用于在确定被监控对象满足磁盘清理条件的情况下,基于磁盘用量增速信息确定针对被监控对象的磁盘的清理速率;第六处理子模块,用于根据确定出的清理速率,进行针对被监控对象的磁盘的清理处理,其中,针对磁盘的清理速率大于磁盘用量增速。
作为一种可行的方式,被监控对象的磁盘包括日志存储层、日志缓冲层和日志消费层;第三处理模块包括:第七处理子模块,用于根据磁盘用量增速信息和状态预测信息,确定被监控对象是否满足预设的磁盘扩容条件;第八处理子模块,用于在确定被监控对象满足磁盘扩容条件的情况下,根据状态预测信息确定针对磁盘中的日志存储层的扩容量;第九处理子模块,用于根据针对磁盘中的日志存储层的扩容量,以及根据日志存储层与日志缓冲层、日志消费层的匹配比例,进行针对日志存储层、日志缓冲层和日志消费层的扩容处理。
作为一种可行的方式,第三处理模块包括:第十处理子模块,用于根据磁盘用量增速信息和状态预测信息,确定被监控对象的磁盘负载是否满足预设禁用条件;第十一处理子模块,用于在确定被监控对象的磁盘负载满足禁用条件的情况下,向被监控对象发送禁用指令,以使被监控对象停止对外服务。
作为一种可行的方式,该装置还包括第四处理模块,用于对部署在被监控对象的操作系统中的监控插件进行插件管理,插件管理包括插件调用管理、合法性验证、配置信息管理中的至少之一。
作为一种可行的方式,该装置还包括第五处理模块,用于进行针对磁盘状态参数、磁盘用量增速信息和状态预测信息的序列化处理,得到序列化处理后的磁盘监控数据;以及可视化展示序列化处理后的磁盘监控数据。
需要说明的是,在本公开实施例中,装置部分的实施方式与方法部分的实施方式相同或类似,在此不再赘述。
根据本公开的实施例的模块中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者根据本公开实施例的模块中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,采集模块701、第一处理模块702、第二处理模块703和第三处理模块704中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,采集模块701、第一处理模块702、第二处理模块703和第三处理模块704中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。采集模块701、第一处理模块702、第二处理模块703和第三处理模块704中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图8示意性示出了适于实现根据本公开实施例的处理方法和处理装置的电子设备800的方框图。图8示出的电子设备800仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图8所示,根据本公开实施例的电子设备800包括处理器801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。处理器801例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器801还可以包括用于缓存用途的板载存储器。处理器801可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 803中,存储有电子设备800操作所需的各种程序和数据。处理器801、ROM802以及RAM 803通过总线804彼此相连。处理器801通过执行ROM 802和/或RAM 803中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,程序也可以存储在除ROM802和RAM 803以外的一个或多个存储器中。处理器801也可以通过执行存储在一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,电子设备800还可以包括输入/输出(I/O)接口805,输入/输出(I/O)接口805也连接至总线804。电子设备800还可以包括连接至I/O接口805的以下部件中的一项或多项:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被处理器801执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 802和/或RAM 803和/或ROM 802和RAM 803以外的一个或多个存储器。
本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行本公开实施例所提供的方法的程序代码,当计算机程序产品在电子设备上运行时,该程序代码用于使电子设备实现本公开实施例所提供的用于文件上传漏洞的检测方法。
在该计算机程序被处理器801执行时,执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。
在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分809被下载和安装,和/或从可拆卸介质811被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java,C++,python,“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
Claims (14)
1.一种磁盘监控方法,包括:
以预设频率采集被监控对象的磁盘状态参数;
对预定时长内采集的磁盘状态参数进行分析处理,得到与所述被监控对象关联的磁盘用量增速信息;
基于所述磁盘用量增速信息,进行针对所述被监控对象的磁盘状态预测,得到与所述被监控对象的磁盘关联的状态预测信息;以及
根据所述磁盘用量增速信息和所述状态预测信息,触发针对所述被监控对象的磁盘运维操作。
2.根据权利要求1所述的方法,其中,所述以预设频率采集被监控对象的磁盘状态参数,包括:
通过在所述被监控对象的操作系统中部署监控插件,利用所述监控插件以预设频率采集所述被监控对象的所述磁盘状态参数,
其中,所述磁盘状态参数包括磁盘已用容量、磁盘容量配额、磁盘挂载目录、磁盘分区信息、磁盘活动时长、磁盘所属存储池中的至少之一。
3.根据权利要求2所述的方法,其中,所述利用所述监控插件以预设频率采集所述被监控对象的所述磁盘状态参数,包括:
利用所述监控插件通过非云环境下数据采集方式和/或云环境下数据采集方式,以预设频率采集所述被监控对象的所述磁盘状态参数,
其中,所述被监控对象包括计算设备、数据库、存储设备中的至少之一,所述计算设备用于承载相应的数据业务。
4.根据权利要求1所述的方法,其中,所述基于所述磁盘用量增速信息,进行针对所述被监控对象的磁盘状态预测,得到与所述被监控对象的磁盘关联的状态预测信息,包括:
基于所述磁盘用量增速信息,进行针对所述被监控对象的磁盘状态预测,得到与所述被监控对象的磁盘关联的可用容量预测信息、容量耗尽预测信息、可使用时长预测信息、用量增速异常预警信息中的至少之一。
5.根据权利要求1所述的方法,其中,所述根据所述磁盘用量增速信息和所述状态预测信息,触发针对所述被监控对象的磁盘运维操作,包括:
根据所述磁盘用量增速信息和所述状态预测信息,确定所述被监控对象的磁盘用量比率和/或磁盘可使用时长是否满足预设报警阈值;
在确定所述被监控对象的磁盘用量比率和/或磁盘可使用时长满足所述报警阈值的情况下,触发针对所述被监控对象的磁盘预警提示。
6.根据权利要求1所述的方法,其中,所述根据所述磁盘用量增速信息和所述状态预测信息,触发针对所述被监控对象的磁盘运维操作,包括:
根据所述磁盘用量增速信息和所述状态预测信息,确定所述被监控对象是否满足预设的磁盘清理条件;
在确定所述被监控对象满足所述磁盘清理条件的情况下,基于所述磁盘用量增速信息确定针对所述被监控对象的磁盘的清理速率;
根据确定出的所述清理速率,进行针对所述被监控对象的磁盘的清理处理,其中,针对所述磁盘的清理速率大于磁盘用量增速。
7.根据权利要求1所述的方法,其中,所述被监控对象的磁盘包括日志存储层、日志缓冲层和日志消费层;
所述根据所述磁盘用量增速信息和所述状态预测信息,触发针对所述被监控对象的磁盘运维操作,包括:
根据所述磁盘用量增速信息和所述状态预测信息,确定所述被监控对象是否满足预设的磁盘扩容条件;
在确定所述被监控对象满足所述磁盘扩容条件的情况下,根据所述状态预测信息确定针对所述磁盘中的日志存储层的扩容量;
根据针对所述磁盘中的日志存储层的扩容量,以及根据所述日志存储层与日志缓冲层、日志消费层的匹配比例,进行针对所述日志存储层、日志缓冲层和日志消费层的扩容处理。
8.根据权利要求1所述的方法,其中,所述根据所述磁盘用量增速信息和所述状态预测信息,触发针对所述被监控对象的磁盘运维操作,包括:
根据所述磁盘用量增速信息和所述状态预测信息,确定所述被监控对象的磁盘负载是否满足预设禁用条件;
在确定所述被监控对象的磁盘负载满足所述禁用条件的情况下,向所述被监控对象发送禁用指令,以使所述被监控对象停止对外服务。
9.根据权利要求2所述的方法,还包括:
对部署在所述被监控对象的操作系统中的监控插件进行插件管理,所述插件管理包括插件调用管理、合法性验证、配置信息管理中的至少之一。
10.根据权利要求1至8任一项所述的方法,还包括:
进行针对所述磁盘状态参数、所述磁盘用量增速信息和所述状态预测信息的序列化处理,得到序列化处理后的磁盘监控数据;以及
可视化展示所述序列化处理后的磁盘监控数据。
11.一种磁盘监控装置,包括:
采集模块,用于以预设频率采集被监控对象的磁盘状态参数;
第一处理模块,用于对预定时长内采集的磁盘状态参数进行分析处理,得到与所述被监控对象关联的磁盘用量增速信息;
第二处理模块,用于基于所述磁盘用量增速信息,进行针对所述被监控对象的磁盘状态预测,得到与所述被监控对象的磁盘关联的状态预测信息;以及
第三处理模块,用于根据所述磁盘用量增速信息和所述状态预测信息,触发针对所述被监控对象的磁盘运维操作。
12.一种电子设备,包括:
一个或多个处理器;以及
存储器,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至10中任一项所述的方法。
13.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器实现权利要求1至10中任一项所述的方法。
14.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现权利要求1至10中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110999902.0A CN113672472A (zh) | 2021-08-27 | 2021-08-27 | 磁盘监控方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110999902.0A CN113672472A (zh) | 2021-08-27 | 2021-08-27 | 磁盘监控方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113672472A true CN113672472A (zh) | 2021-11-19 |
Family
ID=78547257
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110999902.0A Pending CN113672472A (zh) | 2021-08-27 | 2021-08-27 | 磁盘监控方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113672472A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114265555A (zh) * | 2021-12-22 | 2022-04-01 | 杭州安恒信息技术股份有限公司 | 一种磁盘数据的清理方法、装置及介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105094698A (zh) * | 2015-07-08 | 2015-11-25 | 浪潮(北京)电子信息产业有限公司 | 一种基于历史监测数据的磁盘容量预测方法 |
CN107480028A (zh) * | 2017-07-21 | 2017-12-15 | 东软集团股份有限公司 | 磁盘可使用的剩余时长的获取方法及装置 |
CN109445706A (zh) * | 2018-10-30 | 2019-03-08 | 紫光华山信息技术有限公司 | 磁盘分区扩容方法、装置及服务端 |
CN109766234A (zh) * | 2018-12-11 | 2019-05-17 | 国网甘肃省电力公司信息通信公司 | 基于时间序列模型的磁盘存储容量预测方法 |
CN110377228A (zh) * | 2019-06-19 | 2019-10-25 | 深圳壹账通智能科技有限公司 | 区块链节点的自动扩容方法、装置、运维终端及存储介质 |
CN110489062A (zh) * | 2019-08-27 | 2019-11-22 | 浪潮云信息技术有限公司 | 一种基于OpenStack环境的磁盘扩容方法及系统 |
CN111949503A (zh) * | 2020-08-14 | 2020-11-17 | 中国工商银行股份有限公司 | 数据库的管理方法、装置、计算设备和介质 |
-
2021
- 2021-08-27 CN CN202110999902.0A patent/CN113672472A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105094698A (zh) * | 2015-07-08 | 2015-11-25 | 浪潮(北京)电子信息产业有限公司 | 一种基于历史监测数据的磁盘容量预测方法 |
CN107480028A (zh) * | 2017-07-21 | 2017-12-15 | 东软集团股份有限公司 | 磁盘可使用的剩余时长的获取方法及装置 |
CN109445706A (zh) * | 2018-10-30 | 2019-03-08 | 紫光华山信息技术有限公司 | 磁盘分区扩容方法、装置及服务端 |
CN109766234A (zh) * | 2018-12-11 | 2019-05-17 | 国网甘肃省电力公司信息通信公司 | 基于时间序列模型的磁盘存储容量预测方法 |
CN110377228A (zh) * | 2019-06-19 | 2019-10-25 | 深圳壹账通智能科技有限公司 | 区块链节点的自动扩容方法、装置、运维终端及存储介质 |
CN110489062A (zh) * | 2019-08-27 | 2019-11-22 | 浪潮云信息技术有限公司 | 一种基于OpenStack环境的磁盘扩容方法及系统 |
CN111949503A (zh) * | 2020-08-14 | 2020-11-17 | 中国工商银行股份有限公司 | 数据库的管理方法、装置、计算设备和介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114265555A (zh) * | 2021-12-22 | 2022-04-01 | 杭州安恒信息技术股份有限公司 | 一种磁盘数据的清理方法、装置及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230004434A1 (en) | Automated reconfiguration of real time data stream processing | |
US11755452B2 (en) | Log data collection method based on log data generated by container in application container environment, log data collection device, storage medium, and log data collection system | |
US9712410B1 (en) | Local metrics in a service provider environment | |
CN110046070B (zh) | 服务器集群系统的监控方法、装置、电子设备及存储介质 | |
US9600523B2 (en) | Efficient data collection mechanism in middleware runtime environment | |
CN104937548A (zh) | 动态图的性能监视 | |
Hauser et al. | Reviewing cloud monitoring: Towards cloud resource profiling | |
US9037705B2 (en) | Routing of performance data to dependent calculators | |
CN114625597A (zh) | 监控运维系统、方法、装置、电子设备及存储介质 | |
CN114500318B (zh) | 一种批量作业监控方法及装置、设备及介质 | |
CN116708217A (zh) | 一种数据中心设备监控方法、系统、电子设备及存储介质 | |
CN113794719B (zh) | 一种基于Elasticsearch技术网络异常流量分析方法、装置和电子设备 | |
CN114760233B (zh) | 业务处理方法、装置、电子设备及存储介质 | |
CN113032237B (zh) | 数据处理方法及装置、电子设备和计算机可读存储介质 | |
CN115809119A (zh) | 容器编排引擎的监控方法、系统及装置 | |
CN113672472A (zh) | 磁盘监控方法及装置 | |
CN110245120B (zh) | 流式计算系统及流式计算系统的日志数据处理方法 | |
CN116260703A (zh) | 分布式消息服务节点cpu性能故障自恢复方法及装置 | |
US9141460B2 (en) | Identify failed components during data collection | |
CN113132431B (zh) | 服务监控方法、服务监控装置、电子设备及介质 | |
CN115202973A (zh) | 应用运行状态的确定方法、装置、电子设备和介质 | |
CN114116782A (zh) | 分布式数据库资源管控方法、装置、电子设备和存储介质 | |
CN113900905A (zh) | 日志监控方法、装置、电子设备及存储介质 | |
CN113760671A (zh) | 在线任务诊断方法、装置和电子设备 | |
CN104883273A (zh) | 虚拟化服务管理平台中业务影响模型的处理方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |