CN116089283A - 模拟准生产环境的监控测试方法、系统、设备和可读介质 - Google Patents
模拟准生产环境的监控测试方法、系统、设备和可读介质 Download PDFInfo
- Publication number
- CN116089283A CN116089283A CN202310010828.4A CN202310010828A CN116089283A CN 116089283 A CN116089283 A CN 116089283A CN 202310010828 A CN202310010828 A CN 202310010828A CN 116089283 A CN116089283 A CN 116089283A
- Authority
- CN
- China
- Prior art keywords
- monitoring
- cluster
- virtual machine
- quasi
- user virtual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 210
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 81
- 238000010998 test method Methods 0.000 title claims abstract description 22
- 238000004458 analytical method Methods 0.000 claims abstract description 30
- 238000012360 testing method Methods 0.000 claims description 38
- 238000000034 method Methods 0.000 claims description 18
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 238000007726 management method Methods 0.000 claims description 5
- 238000012423 maintenance Methods 0.000 abstract description 8
- 238000004088 simulation Methods 0.000 abstract description 7
- 239000000047 product Substances 0.000 description 7
- 230000005856 abnormality Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 6
- 230000008439 repair process Effects 0.000 description 5
- 230000010354 integration Effects 0.000 description 3
- 238000013515 script Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 241001178520 Stomatepia mongo Species 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000013522 software testing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/3668—Software testing
- G06F11/3672—Test management
- G06F11/3688—Test management for test execution, e.g. scheduling of test suites
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3006—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/302—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/3664—Environments for testing or debugging software
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/3668—Software testing
- G06F11/3672—Test management
- G06F11/3692—Test management for test results analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
- G06F2009/45562—Creating, deleting, cloning virtual machine instances
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明提供了模拟准生产环境的监控测试方法、系统、设备和可读介质,该种模拟准生产环境的监控测试方法包括搭建准生产环境并创建用户虚拟机,其中,用户虚拟机至少安装若干用户场景服务;部署自动化监控,配置各个集群的自动化监控信息;根据自动化监控信息持续或分时段监控准生产环境和/或用户虚拟机,生成集群监控报告和/或用户虚拟机监控报告并分析集群问题获得分析结果,以便定位集群问题并修复。通过本申请提出的技术方案提升准生产环境的稳定性,达到对客户环境的模拟;通过对监控报告的分析来及时发现可能在客户生产环境出现的问题,在发布之前关注到问题进行及时修复,减少后续客户环境的运维成本。
Description
技术领域
本申请涉及超融合技术领域,尤其涉及一种分布式存储访问授权管理方法、系统、设备和可读介质。
背景技术
软件生命周期主要可以包括为这几个步骤:需求分析—软件设计—程序编码—软件测试—运行维护;软件测试的生命周期(软件开发的流程):需求分析—测试计划—测试设计/开发—测试执行—报告评估,目前国内外软件开发测试行业,大部分都直接采用或者基于Jenkins来组建软件项目的CICD(持续集成和持续交付)流程方案,即软件第一次上线后,会不断循环软件测试的流程,按照实际需求为软件扩展新功能,或修复旧问题。在传统的测试流程中软件回归测试完成,验收通过即完成产品测试,软件上线后,若出现问题不能第一时间发现,可能出现的问题只能在客户场景发现进而解决问题。
现有的软件测试方案只遵循了传统的软件生命周期和测试流程,超融合测试环境不稳定,测试数据量比较小,但很难模拟和及时发现客户生产环境的问题。尤其对于Bto B的产品而言,对产品的质量要求很高,在客户环境发现问题,后续的修复,只能被动加快等待版本迭代,或提供临时修复方案。影响客户对产品的印象,耗费人力维护客户,也为后续的运维工作增加难度。
发明内容
基于现有技术中的缺陷,模拟准生产环境的监控测试方法在集成测试周期结束后,版本发布之前,用自动化监控环境,分析报告结果的方式进行补充测试,本发明提供了一种模拟准生产环境的监控测试方法、系统、设备和可读介质。
在本申请的第一方面提供了一种模拟准生产环境的监控测试方法,具体包括:
搭建准生产环境并创建用户虚拟机,用户虚拟机至少安装若干用户场景服务;
部署自动化监控,配置各个集群的自动化监控信息;
根据自动化监控信息持续或分时段监控准生产环境和/或用户虚拟机,生成集群监控报告和/或用户虚拟机监控报告,并保存在对应的本地数据库;
根据集群监控报告和/或用户虚拟机监控报告分析集群问题获得分析结果;
在分析结果不符合预期条件的情况下,重新定位集群问题并修复。
在上述第一方面的一种可能的实现中,于该种模拟准生产环境的监控测试方法中,搭建准生产环境并部署用户虚拟机包括:
预设CPU架构,选择集群系统;
将集群系统布局于对应的集群架构上,并根据用户场景部署用户虚拟机。
在上述第一方面的一种可能的实现中,于该种模拟准生产环境的监控测试方法中,配置各个集群的自动化监控信息包括:
预设机房故障场景,根据故障场景记录对应的目标操作数据;
根据目标操作数据在集群各个节点部署监测工具配置各个集群的自动化监控信息。
在上述第一方面的一种可能的实现中,于该种模拟准生产环境的监控测试方法中,根据自动化监控信息持续或分时段监控准生产环境和/或用户虚拟机包括:
预设查询周期;
根据查询周期接收集群中每个主机的管理IP发出的监控请求;
其中,监控请求包括监控集群主机信息、监控系统运行状况、监控集群中各个服务运行状况,
和/或,
监控请求包括监控特定集群上运行的用户虚拟机状态及用户虚拟机内部服务在上述第一方面的一种可能的实现中,于该种模拟准生产环境的监控测试方法中,
生成的集群监控报告包括以下任意一个或者多个文件:
用于记录集群与自动化监控服务连接状况出现异常的第一数据文件;
用于定位并分析产生集群出现异常的第二数据文件;
用于反馈集群的监控应用是否正常运行的第三数据文件;
用于反馈集群内服务运行所属的CPU核心是否符合预期的第四数据文件;
用于反馈主机系统服务常驻内存使用情况的第五数据文件;
用于反馈主机系统服务CPU使用率的第六数据文件。
在上述第一方面的一种可能的实现中,于该种模拟准生产环境的监控测试方法中,
生成的所述用户虚拟机监控报告至少包括以下任意一个或者多个文件:
用于监控用户虚拟机运行状态的第一状态文件;
用于监控用户虚拟机和/或用户虚拟机部署应用后相关性能指标的第二状态文件;
用于监控用户虚拟机内运行的相关服务应用运行状态的第三状态文件。
在上述第一方面的一种可能的实现中,于该种模拟准生产环境的监控测试方法中,
在分析结果不符合预期条件的情况下,重新定位集群问题并修复包括:
记录集群中各个服务的运行状态;
在监控到存在任一服务需要发生重启的情况下,分析服务的重启原因;
在重启原因不符合预期条件的情况下,重新定位集群问题并修复。
在上述第二方面的一种可能的实现中,于该种模拟准生产环境的监控测试系统中,
搭建单元,用于搭建准生产环境并创建用户虚拟机,用户虚拟机至少安装若干用户场景服务;
部署单元,用于部署自动化监控,配置各个集群的自动化监控信息;
监控单元,用于根据自动化监控信息持续或分时段监控准生产环境和/或用户虚拟机,生成集群监控报告和/或用户虚拟机监控报告,并保存在对应的本地数据库;
分析单元,用于根据集群监控报告和/或用户虚拟机监控报告分析集群问题获得分析结果;
定位单元,用于在分析结果不符合预期条件的情况下,重新定位集群问题并修复。
本申请的第三方面提供了一种电子设备,包括:
存储器,存储器用于存储处理程序;
处理器,处理器执行处理程序时实现前述第一方面所提供的模拟准生产环境的监控测试方法。
本申请的第四方面提供了一种可读存储介质,该种可读存储介质上存储有处理程序,处理程序被处理器执行时实现如前述第一方面所提供的模拟准生产环境的监控测试方法。
与现有技术相比,本申请具有如下的有益效果:
本申请通过搭建内部的模拟准生产超融合环境,并基于准生产超融合环境创建用户虚拟机,提升准生产环境的稳定性、数据量级别、使用场景,达到对客户环境的模拟;再通过对超融合SMTX OS、SMTX ZBS以及其上运行的用户虚拟机的进行监控,根据自动化监控信息持续或分时段监控准生产环境和/或用户虚拟机,生成集群监控报告和/或用户虚拟机监控报告,通过对监控报告的分析来及时发现可能在客户生产环境出现的问题,并进行及时解决。通过在模拟准生产环境的上述两监控报告的维护,可以加强版本的测试深度,可以在发布之前关注到可能在客户环境出现的问题,进行及时修复,增加版本稳定性,减少后续客户环境的运维成本。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1根据本申请的实施例,示出了模拟准生产环境的监控测试方法的流程图;
图2根据本申请的实施例,示出了模拟准生产环境的监控测试系统框图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
为了解决现有技术中,现有的软件测试方案只遵循了传统的软件生命周期和测试流程,超融合测试环境不稳定,测试数据量比较小,但很难模拟和及时发现客户生产环境的问题等技术缺陷,本申请提出了一种模拟准生产环境的监控测试方法、系统、设备和可读介质,通过该种模拟准生产环境的监控测试方法搭建内部的模拟准生产超融合环境,并基于准生产超融合环境创建用户虚拟机保证准生产环境的稳定性、数据量级别、使用场景,达到对客户环境的模拟;再通过对超融合SMTX OS、SMTX ZBS、以及上面运行的用户虚拟机的进行监控,根据自动化监控信息持续或分时段监控准生产环境和/或用户虚拟机,生成集群监控报告和/或用户虚拟机监控报告,通过对监控报告的分析来及时发现可能在客户生产环境出现的问题,并进行及时解决。通过在模拟准生产环境的上述两监控报告的维护,可以加强版本的测试深度,可以在发布之前关注到可能在客户环境出现的问题,进行及时修复,增加版本稳定性,减少后续客户环境的运维成本。
具体地,图1根据本申请的一些实施例,示出了一种模拟准生产环境的监控测试方法流程图,具体包括:
步骤100:搭建准生产环境并创建用户虚拟机,用户虚拟机至少安装若干用户场景服务。可以理解的是,在集成测试周期结束后,版本发布之前,通过搭建模拟准生产环境,基于自动化监控环境,于集群上部署用户场景虚拟机,基于模拟准生产环境的实际监控需求虚拟机至少安装若干用户场景服务进行进一步补充和可靠性的测试。
步骤200:部署自动化监控,配置各个集群的自动化监控信息。可以理解的是,为了实现对准生产环境的监控,需要按照监控需求对各个集群的自动化监控信息进行部署,以便根据监控到的信息分析并定位问题。
于本申请的一些实施例中,可以在集群个节点部署coredump工具监控服务内部运行状况。
步骤300:根据自动化监控信息持续或分时段监控准生产环境和/或用户虚拟机,生成集群监控报告和/或用户虚拟机监控报告,并保存在对应的本地数据库。可以理解的是,自动化监控信息中包括相关的自动化脚本,通过自动化脚本按照一定的监控周期持续或分时段监控准生产环境和/或用户虚拟机,生成集群监控报告和/或用户虚拟机监控报告。
于本申请的一些实施例中,监控的内容可以包括模拟准生产环境的版本包,监控周期可以为持续监控,或者设定在某些固定的额时段进行监控,并将分时段监控或者持续监控的数据存到自动化的数据库中,需要生成集群监控报告和/或用户虚拟机监控报告,自动取某一固定时段的监测数据或者前连续24小时的数据来生成报告。
可选地,该自动化监控持续或者分时段监控可以在软件上线前监控时间持续至少两周或者上线后监控时间持续一个月以上。
步骤400:根据集群监控报告和/或用户虚拟机监控报告分析集群问题获得分析结果。可以理解的是,通过集群监控报告和/或用户虚拟机监控报告按照一定的分析周期进行模拟准生产环境的硬件及空间进行分析和硬件运维,获得分析结果,分析结果至少包括了旧问题和新问题。
步骤500:在分析结果不符合预期条件的情况下,重新定位集群问题并修复。可以理解的是,分析结果至少包括了旧问题或者在预期条件下的一些问题,包括网络、机器硬件异常、运维操作、研发调试等异常,对各个异常问题进行记录分析,安排后续产品迭代,回归测试等方案;对产生的新问题进行集中分析,寻找在测试、研发中的漏洞及时更正,修复。
于上述步骤100中,搭建准生产环境并部署用户虚拟机包括:
预设CPU架构,选择集群系统;将集群系统布局于对应的集群架构上,并根据用户场景部署用户虚拟机。可以理解的是,由不同架构、集群系统、用户虚拟机及部署的用户服务等互相组合,构建出模拟的生产环境。
于本申请的一些实施例中,集群系统的选择可以包括SMTX OS(双活、vhost、rdma)、SMTX ZBS;集群架构的选择可以包括X86、Hygon(x86和oe)、Arm(arm feiteng和armkunpeng)等;用户虚拟机包括:ubuntu、centos等虚拟机,虚拟机部署的场景服务可以包括例如如:oracle、docker、kafka等场景服务,本领域技术人员可以根据实际的系统,架构,虚拟机及环境服务的需求进行适当的组合搭建合适的搭建准生产环境并部署用户虚拟机,及其部署用户服务以进行环境的监测,在此不做限定。
于上述步骤200中,配置各个集群的自动化监控信息包括:预设机房故障场景,根据故障场景记录对应的目标操作数据;根据目标操作数据在集群各个节点部署监测工具配置各个集群的自动化监控信息。可以理解的是,运维人员可以根据实际可能出现的机房故障进行场景模拟记录该故障场景下对应的目标操作数据,监控准生产环境稳定性运维人员进行机房故障模拟,以监控准生产环境稳定性。
于上述步骤300中,根据自动化监控信息持续或分时段监控准生产环境和/或用户虚拟机包括:
预设查询周期;
根据查询周期接收集群中每个主机的管理IP发出的监控请求;
其中,监控请求包括监控集群主机信息、监控系统运行状况、监控集群中各个服务运行状况,
和/或,
监控请求包括监控特定集群上运行的用户虚拟机状态及用户虚拟机内部服务状态。
于上述步骤300中,生成的集群监控报告至少包括以下任意一个或者多个文件:
用于记录集群与自动化监控服务连接状况出现异常的第一数据文件;
用于定位并分析产生集群出现异常的第二数据文件;
用于反馈集群的监控应用是否正常运行的第三数据文件;
用于反馈集群内服务运行所属的CPU核心是否符合预期的第四数据文件;
用于反馈主机系统服务常驻内存使用情况的第五数据文件;
用于反馈主机系统服务CPU使用率的第六数据文件。
可以理解的是,集群的监控可以通过调用特定的API实现,集群每个主机的管理IP,每间隔固定的时间间隔,调用相关的API实现监控数据文件的获取:包括获取集群主机信息,包含主机版本、运行状态等;查询当前整个系统运行状况;查询集群各个服务运行状况,如mongo、zookeeper等服务。
可以理解的是,用于记录集群与自动化监控服务连接状况出现异常的第一数据文件可以通过请求展示被监控集群与Jenkin的连接状态,记录集群与自动化监控服务连接是否正常,若出现异常,进一步分析对该异常进行分析,判断自动化服务或者是集群出现的问题。
可以理解的是,用于定位并分析产生集群出现异常的第二数据文件可以通过记录集群出现异常时存档的coredump文件,保留数据用于后续定位软件以release模式打包或上线后,程序奔溃时日志以crash文件形式记录到本地,通过自动化监控方式监控该类文件产生,来及时定位分析产生crash的原因。
可以理解的是,用于反馈集群的监控应用是否正常运行的第三数据文件可以展示高级监控服务与集群的连接状态,集群内部运行高级监控应用,以便反映集群监控应用是否正常运行。
可以理解的是,用于反馈集群内服务运行所属的CPU核心是否符合预期的第四数据文件通常展示cgroup问题,用于反映集群内服务运行所属的CPU核心是否符合预期,与预期不符时需进一步确认是由于非活跃的线程导致的误差还是服务运行出现问题。
可以理解的是,用于反馈主机系统服务常驻内存使用情况的第五数据文件,主机-系统服务常驻内存使用,不同服务配置不同监控指标,当监控到的实际指标超出预期指标时,进一步分析超预期的原因,并进行定位分析。
可以理解的是,用于反馈主机系统服务CPU使用率的第六数据文件,主机-系统服务CPU使用率,基于不同的虚拟服务需要根据配置不同的服务,配置不同的监控指标,当CPU使用率的百分值超预期时,进一步分析超预期的原因,并进行定位分析。
于上述步骤300中,生成的用户虚拟机监控报告至少包括以下任意一个或者多个文件:
用于监控用户虚拟机运行状态的第一状态文件;
用于监控用户虚拟机和/或用户虚拟机部署应用后相关性能指标的第二状态文件;
用于监控用户虚拟机内运行的相关服务应用运行状态的第三状态文件。
可以理解的是,用户虚拟机监控报告监控的内容包括虚拟机运行状态检查,是否为运行状态,虚拟机的内存、CPU性能指标是否符合预期,虚拟机内运行的服务应用,运行状态检查;虚拟机部署应用后,压力测试等脚本的测试结果性能指标是否符合预期;虚拟机是否产生crash文件,检查虚拟机是否出现崩溃,如有异常后使用crash文件定位原因。
可以理解的是,通过预设特定的客户场景,搭建出包括虚拟机版本、容器、数据库、服务器等应用构建场景虚拟机。通过自动化监控对特定集群上运行的虚拟机状态及虚拟机内部服务状态进行检查,生成用户场景虚拟机测试报告,通过对测试报告中的信息,判断虚拟机及内部服务的运行是否正常。
于上述步骤500中,在分析结果不符合预期条件的情况下,重新定位集群问题并修复包括:
记录集群中各个服务的运行状态;
在监控到存在任一服务需要发生重启的情况下,分析服务的重启原因;
在重启原因不符合预期条件的情况下,重新定位集群问题并修复。
可以理解的是,记录各个服务的运行状态,如果监控发生重启、暂停状态,需判断重启原因是否符合预期,查看服务日志,如网络抖动导致的重启是符合预期的,不是网络等预期原因导致的,则继续定位是否为新问题,重新定位集群问题并修复。
在本申请的一些实施例中,图2示出了模拟准生产环境的监控测试系统,应用于前述实施例所提供的模拟准生产环境的监控测试方法中,该种模拟准生产环境的监控测试系统具体可以包括:
搭建单元1,用于搭建准生产环境并创建用户虚拟机,所述用户虚拟机至少安装若干用户场景服务;
部署单元2,用于部署自动化监控,配置各个集群的自动化监控信息;
监控单元3,用于根据所述自动化监控信息持续或分时段监控所述准生产环境和/或所述用户虚拟机,生成集群监控报告和/或用户虚拟机监控报告,并保存在对应的本地数据库;
分析单元4,用于根据所述集群监控报告和/或所述用户虚拟机监控报告分析集群问题获得分析结果;
定位单元5,用于在所述分析结果不符合预期条件的情况下,重新定位所述集群问题并修复。
可以理解的是,上述模拟准生产环境的监控测试系统各个功能模块执行与前述分模拟准生产环境的监控测试方法相同的步骤流程,在此不做赘述。
此外,本发明还提供了一种基于模拟准生产环境的监控测试的设备,包括:
存储器:用于存储计算机程序;
处理器:用于执行所述计算机程序以实现如上所述的一种模拟准生产环境的监控测试方法的步骤。
此外,这里需要指出的是:本申请实施例还提供了一种计算机存储介质,该计算机可读存储介质中存储有指令,当其在计算机或处理器上运行时,使得计算机或处理器执行上述任一个实施例所述方法中的一个或多个步骤。上述装置的各组成模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在所述计算机可读取存储介质中,基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机产品存储在计算机可读存储介质中。
上述计算机可读存储介质可以是前述实施例所述的服务器的内部存储单元,例如硬盘或内存。上述计算机可读存储介质也可以是上述服务器的外部存储设备,例如配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,上述计算机可读存储介质还可以既包括上述服务器的内部存储单元也包括外部存储设备。上述计算机可读存储介质用于存储上述计算机程序以及上述服务器所需的其他程序和数据。上述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本申请提出的技术方案涉及方法、装置、系统、电子设备、计算机可读存储介质和/或计算机程序产品。计算机程序产品可以包括用于执行本公开的各个方面的计算机可读程序指令。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可通过计算机程序来指令相关的硬件来完成,该计算机的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可存储程序代码的介质。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
Claims (10)
1.一种模拟准生产环境的监控测试方法,其特征在于,所述的方法包括:
搭建准生产环境并创建用户虚拟机,所述用户虚拟机至少安装若干用户场景服务;
部署自动化监控,配置各个集群的自动化监控信息;
根据所述自动化监控信息持续或分时段监控所述准生产环境和/或所述用户虚拟机,生成集群监控报告和/或用户虚拟机监控报告,并保存在对应的本地数据库;
根据所述集群监控报告和/或所述用户虚拟机监控报告分析集群问题获得分析结果;
在所述分析结果不符合预期条件的情况下,重新定位所述集群问题并修复。
2.根据权利要求1所述的一种模拟准生产环境的监控测试方法,其特征在于,搭建准生产环境并部署用户虚拟机包括:
预设CPU架构,选择集群系统;
将所述集群系统布局于对应的集群架构上,并根据用户场景部署用户虚拟机。
3.根据权利要求1所述的一种模拟准生产环境的监控测试方法,其特征在于,配置各个集群的自动化监控信息包括:
预设机房故障场景,根据所述故障场景记录对应的目标操作数据;
根据所述目标操作数据在集群各个节点部署监测工具配置各个集群的自动化监控信息。
4.根据权利要求1所述的一种模拟准生产环境的监控测试方法,其特征在于,根据所述自动化监控信息持续或分时段监控所述准生产环境和/或所述用户虚拟机包括:
预设查询周期;
根据所述查询周期接收集群中每个主机的管理IP发出的监控请求;
其中,所述监控请求包括监控集群主机信息、监控系统运行状况、监控集群中各服务的运行状况,
和/或,
所述监控请求包括监控特定集群上运行的用户虚拟机状态及用户虚拟机内部服务状态。
5.根据权利要求1所述一种模拟准生产环境的监控测试方法,其特征在于,生成的所述集群监控报告至少包括以下任意一个或者多个文件:
用于记录所述集群与自动化监控服务连接状况出现异常的第一数据文件;
用于定位并分析产生所述集群出现异常的第二数据文件;
用于反馈所述集群的监控应用是否正常运行的第三数据文件;
用于反馈集群内服务运行所属的CPU核心是否符合预期的第四数据文件;
用于反馈主机系统服务常驻内存使用情况的第五数据文件;
用于反馈主机系统服务CPU使用率的第六数据文件。
6.根据权利要求1所述一种模拟准生产环境的监控测试方法,其特征在于,生成的所述用户虚拟机监控报告至少包括以下任意一个或者多个文件:
用于监控所述用户虚拟机运行状态的第一状态文件;
用于监控所述用户虚拟机和/或所述用户虚拟机部署应用后相关性能指标的第二状态文件;
用于监控所述用户虚拟机内运行的相关服务应用运行状态的第三状态文件。
7.根据权利要求1所述一种模拟准生产环境的监控测试方法,其特征在于,在所述分析结果不符合预期条件的情况下,重新定位所述集群问题并修复包括:
记录集群中各个服务的运行状态;
在监控到存在任一所述服务需要发生重启的情况下,分析所述服务的重启原因;
在所述重启原因不符合所述预期条件的情况下,重新定位所述集群问题并修复。
8.一种模拟准生产环境的监控测试系统,其特征在于,所述的系统包括:
搭建单元,用于搭建准生产环境并创建用户虚拟机,所述用户虚拟机至少安装若干用户场景服务;
部署单元,用于部署自动化监控,配置各个集群的自动化监控信息;
监控单元,用于根据所述自动化监控信息持续或分时段监控所述准生产环境和/或所述用户虚拟机,生成集群监控报告和/或用户虚拟机监控报告,并保存在对应的本地数据库;
分析单元,用于根据所述集群监控报告和/或所述用户虚拟机监控报告分析集群问题获得分析结果;
定位单元,用于在所述分析结果不符合预期条件的情况下,重新定位所述集群问题并修复。
9.一种电子设备,其特征在于,包括:
存储器,所述存储器用于存储处理程序;
处理器,所述处理器执行所述处理程序时实现如权利要求1至7中任意一项所述的模拟准生产环境的监控测试方法。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有处理程序,所述处理程序被处理器执行时实现如权利要求1至7中任意一项所述的模拟准生产环境的监控测试方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310010828.4A CN116089283A (zh) | 2023-01-04 | 2023-01-04 | 模拟准生产环境的监控测试方法、系统、设备和可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310010828.4A CN116089283A (zh) | 2023-01-04 | 2023-01-04 | 模拟准生产环境的监控测试方法、系统、设备和可读介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116089283A true CN116089283A (zh) | 2023-05-09 |
Family
ID=86200438
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310010828.4A Pending CN116089283A (zh) | 2023-01-04 | 2023-01-04 | 模拟准生产环境的监控测试方法、系统、设备和可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116089283A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060089977A1 (en) * | 2001-06-15 | 2006-04-27 | Spencer Cramer | System and method for providing virtual online engineering of a production environment |
US20140053226A1 (en) * | 2012-08-14 | 2014-02-20 | Ca, Inc. | Self-adaptive and proactive virtual machine images adjustment to environmental security risks in a cloud environment |
CN103713935A (zh) * | 2013-12-04 | 2014-04-09 | 中国科学院深圳先进技术研究院 | 一种在线管理Hadoop集群资源的方法和装置 |
US20150172206A1 (en) * | 2013-12-13 | 2015-06-18 | International Business Machines Corporation | Fractional Reserve High Availability Using Cloud Command Interception |
CN109284275A (zh) * | 2018-09-28 | 2019-01-29 | 郑州云海信息技术有限公司 | 一种云平台虚拟机文件系统监控方法和装置 |
-
2023
- 2023-01-04 CN CN202310010828.4A patent/CN116089283A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060089977A1 (en) * | 2001-06-15 | 2006-04-27 | Spencer Cramer | System and method for providing virtual online engineering of a production environment |
US20140053226A1 (en) * | 2012-08-14 | 2014-02-20 | Ca, Inc. | Self-adaptive and proactive virtual machine images adjustment to environmental security risks in a cloud environment |
CN103713935A (zh) * | 2013-12-04 | 2014-04-09 | 中国科学院深圳先进技术研究院 | 一种在线管理Hadoop集群资源的方法和装置 |
US20150172206A1 (en) * | 2013-12-13 | 2015-06-18 | International Business Machines Corporation | Fractional Reserve High Availability Using Cloud Command Interception |
CN109284275A (zh) * | 2018-09-28 | 2019-01-29 | 郑州云海信息技术有限公司 | 一种云平台虚拟机文件系统监控方法和装置 |
Non-Patent Citations (1)
Title |
---|
富亚军: "《企业互联网架构原理与实践》", vol. 1, 机械工业出版社, pages: 282 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110309071B (zh) | 测试代码的生成方法及模块、测试方法及系统 | |
CN111147322B (zh) | 5g核心网微服务架构的测试系统及方法 | |
US9294296B2 (en) | Automated test execution in a shared virtualized resource pool | |
CN111881014B (zh) | 一种系统测试方法、装置、存储介质及电子设备 | |
CN111831569A (zh) | 基于故障注入的测试方法、装置、计算机设备和存储介质 | |
US8549522B1 (en) | Automated testing environment framework for testing data storage systems | |
CN106612204B (zh) | 业务校验方法及装置 | |
CN112631846A (zh) | 一种故障演练方法、装置、计算机设备及存储介质 | |
CN111274077A (zh) | 一种磁盘阵列可靠性测试方法、系统、终端及存储介质 | |
CN108199901B (zh) | 硬件报修方法、系统、设备、硬件管理服务器与存储介质 | |
CN111382080A (zh) | 一种设备云管理平台系统的稳定性测试方法 | |
CN110990289B (zh) | 一种自动提交bug的方法、装置、电子设备及存储介质 | |
CN110291505A (zh) | 减少应用的恢复时间 | |
CN115550164A (zh) | 一种一键安装、管理单节点大数据组件的方法及系统 | |
CN111142929A (zh) | 一种设备生产过程中的固件配置方法、装置、设备及介质 | |
CN110750445A (zh) | 一种yarn组件高可用性功能的测试方法、系统及设备 | |
CN108600007B (zh) | 一种云平台责任追溯方法和系统 | |
CN101266566A (zh) | 多测试场景自动调度系统和方法 | |
CN111124724B (zh) | 一种分布式块存储系统的节点故障测试方法及装置 | |
CN116089283A (zh) | 模拟准生产环境的监控测试方法、系统、设备和可读介质 | |
CN115759518A (zh) | 基于混沌工程的可用性治理系统 | |
CN109783292A (zh) | 一种服务器信息的检查方法及系统 | |
CN103019927B (zh) | 一种性能测试方法和系统 | |
CN114385498A (zh) | 性能测试方法、系统、计算机设备及可读存储介质 | |
Chen et al. | Big data system testing method based on chaos engineering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20230509 |
|
RJ01 | Rejection of invention patent application after publication |