CN103902442B - 一种云软件健康度评测方法及系统 - Google Patents

一种云软件健康度评测方法及系统 Download PDF

Info

Publication number
CN103902442B
CN103902442B CN201210573073.0A CN201210573073A CN103902442B CN 103902442 B CN103902442 B CN 103902442B CN 201210573073 A CN201210573073 A CN 201210573073A CN 103902442 B CN103902442 B CN 103902442B
Authority
CN
China
Prior art keywords
cloud software
health degree
cloud
software
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210573073.0A
Other languages
English (en)
Other versions
CN103902442A (zh
Inventor
陈曦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201210573073.0A priority Critical patent/CN103902442B/zh
Publication of CN103902442A publication Critical patent/CN103902442A/zh
Application granted granted Critical
Publication of CN103902442B publication Critical patent/CN103902442B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种云软件健康度评测方法及系统,其中,该方法包括:嵌入数据采集插件采集云软件的状态数据,将数据采集插件与云软件一同打包进虚拟机镜像实例;获取虚拟机镜像实例启动后的媒介访问控制地址,根据媒介访问控制地址获得云软件的进程识别参数;根据进程识别参数对云软件进行定位,分析虚拟机镜像实例获得云软件的健康度数据;根据健康度数据对云软件的健康度进行评测。本发明的云软件健康度评测方法和系统,根据提出的健康度评测计算公式,依据健康度数据获取模块获取的多维度的健康度数据,能够准确的评测云软件在各种条件下的健康度指标。

Description

一种云软件健康度评测方法及系统
技术领域
本发明涉及通信领域中云计算技术领域,具体地,涉及云软件健康度评测方法及系统。
背景技术
云计算是当前移动互联网的技术热点,为用户提供了在Internet上使用的资源和服务。除了弹性计算、云存储等常见的云计算服务,传统的软件提供商也在基于云计算基础设施提供软件的云端版本,用户无需按照传统的方式在本地安装,可直接在云端使用软件,Amazon等云计算服务提供商称这种软件为云软件(Cloud Software)。
云软件需要基于云计算基础设施提供,通常云计算基础设施由云计算IaaS(Infrastructure as a Service,基础设施即服务)平台实现,提供计算资源、存储资源和网络资源等虚拟化资源,云软件需要和基础操作系统一起被打包在虚拟机镜像(VirtualMachine Image,以下简称VMI)中,并部署于云计算基础设施上运行。VMI是云计算IaaS服务上的部署和运行单元,包含了操作系统和相关软件,传统的软件Stack和云软件Stack对比如图1所示。
云软件是一种新的软件交付和使用方式,需要打包在VMI中并运行于云计算IaaS平台之上,在这种新的架构下,云软件及相应依赖环境(即VMI)的运行状况评测流程如图2所示,包括:
步骤1,含有云软件对的VMI启动,云计算IaaS平台记录VMI的启动时间;
步骤2,VMI管理模块(云计算IaaS平台的一部分)获取VMI对运行资源的使用情况,并记录进日志;
步骤3,含有云软件对的VMI停止,云计算IaaS平台记录VMI的停止时间;
步骤4,云计算IaaS平台将日志传递给单独的VMI评测平台;
步骤5,VMI评测平台分析日志,获取VMI(含云软件)的运行时间和整体运行资源占用情况,并基于这些数据进行评价。
在实现本发明过程中,发明人发现现有的云软件(包含在VMI中)评测方法中至少存在如下问题:
(1)不能实现云软件运行状况的精准获取:VMI评测平台将云计算IaaS平台同步的VMI运行时间作为云软件的运行时间,而在VMI运行期间,其中的云软件可能处于停止状态,因此云软件的实际运行时间并不等于VMI的运行时间;IaaS平台同步的VMI运行资源使用情况是整个VMI(包括操作系统和若干软件)的资源使用情况,不能准确反映某一云软件的资源使用情况;
(2)不能对运行于同一VMI的多个云软件区分评测:在同一个VMI中可能包含多款云软件,而这些云软件的运行时间(启停状态)不同,使用的运行资源情况也不同,而当前的方法是依据VMI的运行时间和运行资源使用情况一概而论,无法区分每个云软件的运行情况,进而不能实现区分评测。
发明内容
本发明是为了克服现有技术中无法对云软件进行精准评测的缺陷,根据本发明的一个方面,提出一种云软件健康度评测方法。
根据本发明实施例的云软件健康度评测方法,包括:
嵌入数据采集插件采集云软件的状态数据,将数据采集插件与云软件一同打包进虚拟机镜像实例;
获取虚拟机镜像实例启动后的媒介访问控制地址,根据媒介访问控制地址获得云软件的进程识别参数;
根据进程识别参数对云软件进行定位,分析所述虚拟机镜像实例获得云软件的健康度数据;
根据健康度数据对云软件的健康度进行评测。
本发明是为了克服现有技术中无法对云软件进行精准评测的缺陷,根据本发明的另一个方面,提出一种云软件健康度评测系统。
根据本发明实施例的云软件健康度评测系统,包括:
健康度数据获取模块,用于采集云软件的状态数据,与云软件一同打包进虚拟机镜像实例,获取虚拟机镜像实例启动后的媒介访问控制地址,根据媒介访问控制地址获得云软件的进程识别参数,根据进程识别参数对云软件进行定位,分析虚拟机镜像实例获得云软件的健康度数据;
健康度评测模块,用于根据健康度数据对云软件的健康度进行评测。
本发明的云软件健康度评测方法和系统,健康度数据获取模块与云软件运行于同一VMI实例中,能够实时准确的捕获云软件进程的运行状况,实现对云软件健康度数据的精准获取。
本发明的云软件健康度评测方法和系统,实现对运行于同一VMI实例中的多个云软件区分评测,突破了现有技术中依赖VMI实例运行状态笼统判断云软件运行状况的限制,通过健康度数据获取模块获取的精准健康度数据,达到对同一VMI实例中不同云软件的健康度精准评测的目的。
本发明的云软件健康度评测方法和系统,根据提出的健康度评测计算公式,依据健康度数据获取模块获取的多维度的健康度数据,能够准确的评测云软件在各种条件下的健康度指标。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为传统软件Stack和云软件Stack的对比结构示意图;
图2为现有技术中云软件健康度评测流程示意图;
图3为本发明云软件健康度评测系统的架构图;
图4为本发明以Linux操作系统为例查看云软件进程的示例代码;
图5为本发明云软件进程定位流程示意图;
图6为本发明云软件运行时间记录流程示意图;
图7为本发明侦测云软件异常退出流程示意图;
图8为本发明获取云软件资源使用情况流程示意图;
图9为本发明云软件资源使用统计图;
图10为本发明云软件健康度评测方法的流程示意图;
图11为本发明云软件健康度评测系统的结构示意图。
具体实施方式
下面结合附图,对本发明的具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
本发明提出了一种基于云计算平台运行的云软件的健康度评测方法及系统,能够实现对运行于云计算环境中的云软件健康度数据的精准获取,并根据健康度评测模型计算出健康指数和生成评测报告,从而指导云软件的优化和改进。实现该评测方法的系统包括两个模块:健康度数据获取模块和健康度评测模块。
健康度数据获取模块用于精准地获取云软件的健康度数据,如健康运行时间、非正常退出次数、运行资源占用情况等,并对这些数据进行预处理后同步给健康度评测模块;健康度评测模块用于基于云软件的健康数据,根据健康度评测模型计算出健康指数并生成评测报告。
健康度数据获取模块作为操作系统的内嵌式应用,以后台进程的形式运行于云软件所在的IaaS虚拟机镜像(VMI)实例中,对云软件进程生命周期状态和相关数据进行获取,预处理后同步给健康度评测模块进行处理和计算。其中健康度数据获取模块作为应用程序嵌入到操作系统中,为了能够应用于不同的操作系统平台,本部分程序采用Java实现,并通过JVM(Java虚拟机)的跨平台特性实现。
如图3所示,本发明的云软件健康度评测系统包括的健康度数据获取模块和健康度评测模块的功能和实现逻辑描述如下:
1.健康度数据获取模块
本模块用于一组云软件状态数据采集和同步应用,运行于云软件所在的操作系统,并针对不同操作系统实现了相应版本的数据采集插件;该模块作为应用程序内嵌到操作系统中,并和云软件一同打包进VMI。这组应用在操作系统启动后表现为两个系统后台进程,实现功能如下:
1)软件状态数据采集:用于监控云软件的生命周期状态和操作系统状态,统计云软件的健康度数据,如运行时间、异常退出次数、运行资源使用情况(CPU、内存等),并同步给健康度评测模块。
数据采集插件:软件运行状态数据的采集是通过执行操作系统提供的资源查看命令行实现的,不同操作系统上提供了不同的命令行工具,为了最大程度实现程序模块的可重用性和灵活度,本部分程序采用插件方式实现,即根据不同操作系统的命令实现不同的数据采集插件,并应用于不同的操作系统之上。
如图4所示,在操作系统启动后,健康度数据获取模块即会启动,并通过数据采集插件运行相关命令,完成数据采集任务,包括:定位云软件相关进程,记录云软件运行时间,获取云软件进程对系统资源的使用情况,侦测云软件异常退出情况,相关任务的处理流程如下:
a)云软件进程定位流程,从健康度评测模块获取云软件识别参数,如常用进程名称、常用端口号、常用安装路径和日志分析关键字等,通过该流程能够准确的定位到云软件的相关进程,如图5所示;
b)记录云软件运行时间流程,其中T秒为软件运行时间获取间隔,可根据系统压力和对数据获取的精准度要求进行调整,如图6所示;
c)侦测云软件异常退出,如果在云软件进程启动并运行一段时间后,本程序无法获取该进程,则需要侦测该进程是否是正常退出,或者是因为云软件Crash导致的异常退出,如图7所示;
d)获取云软件资源使用情况,如图8所示;
数据过滤和处理:数据采集插件获取的原始数据都会交给数据过滤和处理程序,经过对大量的原始数据进行过滤并抽取关键数据后,云软件的各种状态数据将会存放在本地文件中,相关的数据结构如下:
a)云软件运行时间记录数据结构,如果因为云软件重启造成进程ID的变化,会创建一张新表并记录在新的进程ID下的运行时间,如表1所示;
表1
名称 长度 描述
SoftwareName 32 云软件名称
ProcessID 64 云软件进程ID
StartTime 64 云软件进程启动时刻
RunningTime 2048 运行时间,单位:秒,长度可扩展
b)云软件异常退出情况记录数据结构,如表2所示;
表2
名称 长度 描述
SoftwareName 32 云软件名称
ProcessID 64 云软件进程ID
CrashTime 64 云软件异常退出时刻
c)云软件运行资源使用记录数据结构,如表3所示;
表3
数据同步:在一个评测周期内,可以一次或多次向健康度评测模块同步健康度数据,这取决于本地记录占用磁盘空间、评测的策略以及VMI(含操作系统)运行状况。
操作系统状态监控:健康度数据获取模块会注册操作系统退出事件,在操作系统退出时记录并同步一次数据。
2)数据采集进程守护:监控健康度数据采集应用的运行状态并对异常状况进行处理。
数据采集进程监控:基于心跳机制,定期向数据采集进程发送信号量,以监控当前健康度数据采集进程的状态。
异常处理:如果健康度数据采集进程异常终止,则重新启动另一个健康度数据采集进程,并将异常情况上报健康度评测模块,用作之后的评测补偿等操作。
2.健康度评测模块
本模块用于从健康度数据获取模块接收云软件健康度数据,并“自学习”的进行资源使用模式识别,并根据健康度评测模型从多个维度客观的计算云软件健康度指标并生成评测报告。本模块包含两部分功能:
1)健康度评测:用于分析并计算云软件的健康度指标
运行资源使用模式识别:每款云软件在不同的运行环境(VMI)中,因为整体云计算资源的配置(CPU、内存和磁盘等)、云软件压力负载等因素,会表现出不同的资源使用规律和模式,而对于资源使用模式的识别能够有效帮助评测云软件对资源使用的平稳度,如果云软件对资源的使用经常会出现无规律的激增、甚至导致程序的退出,则会降低该云软件的健康度评测分值。通过对云软件资源使用记录的分析,可以判断出资源使用模式周期、周期内不同时间段的资源使用波动范围,并可依据这些指标绘制云软件资源使用统计图,如图9所示,使用情况较为稳定。
健康度计算:综合考虑云软件的最长正常运行时间、异常退出频次和资源使用稳定度等多种因素,计算出云软件在某一运行环境(即VMI实例,不同VMI实例中运行资源的分配不一样)中的健康度数值。下面给出各健康度因子的评估方法,最后给出健康度的计算公式:
a)最长正常运行时间:在一个评测周期内,云软件可能会重启多次,每次重启后都会以新的进程在VMI内运行,因此需要根据表1的云软件运行时间记录进行统计,选取其中时间最长的记录作为健康度因子的取值。
b)异常退出频次:在一个评测周期内,云软件可能会多次异常退出,因此需要根据表2的云软件异常退出情况记录统计云软件的退出次数,并以此作为计算本健康度因子的基础取值。
c)资源使用稳定度:根据运行资源使用模式识别分析出的资源使用模型,以及表3云软件运行资源使用记录,综合评定该健康度因子,比如某次资源使用采样记录的云软件CPU使用率占比为0.4,而在该记录所处的时间段内资源使用的波动范围是[0.3,0.7],0.4较波动的均值偏离度较小(偏离度的计算可以使用其他数学模型,此处仅作示例性说明),则此时的资源使用稳定度较高。
综合上述健康度因子,给出健康度评测的计算公式如下:
Rating H = β · ( α 1 · ( Σ i = 1 n C λ + Σ i = 1 n M λ + Σ i = 1 n D λ ) n + α 2 · T a T b + α 3 · 1 N C )
上述公式中各个参数的意义解释如表4所示。
表4
上述公式中的各个参数的取值以及计算方法可以根据软件类型、软件评测关注点动态调整,最终的计算结果分值越高,证明健康度越高。本计算模型可以满足广泛类型的云软件对健康度评测的要求。
评测报告生成:根据健康度计算结果制作评测报告,内容还可以包括运行资源使用模型和原始健康度数据,报告形式则采取图文结合的方式自动生成html网页,允许云计算IaaS平台管理者和云软件提供者查看。
2)健康度评测知识库:存储各种云软件评测经验值和评测模型因子值,并能够与云计算IaaS平台交互获取云软件信息。
健康度评测模型管理:因为不同类型的云软件关注的健康度因子是不同的,因此需要管理不同类型云软件的健康度模型,比如应用服务器云软件更多关注CPU和内存的占用率,而数据库云软件关注的则是磁盘的I/O。
健康度评测经验值管理:业界各类云软件的健康度测试benchmark管理,如正常运行时间、资源负载分级等,这些参数都会应用于健康度的计算。
云软件信息管理:管理所有云计算IaaS平台支持的云软件信息,特别是云软件进程识别参数。在一个VMI(含云软件)启动后,本部分程序会与云计算IaaS平台交互,获取运行于相应VMI中的云软件信息,并支持运行于VMI中的健康度数据获取模块请求云软件进程的识别参数,用于云软件进程定位。
如图10所示,为本发明云软件健康度评测方法的流程示意图,包括:
步骤101,用户启动虚拟机镜像(VMI)的实例,相关云软件包含在该VMI实例中;
步骤102,云计算IaaS平台获取VMI实例的相关信息,如:启动该实例的用户标识、VMI实例的MAC(Media Access Controller,媒介访问控制)地址、VMI中包含云软件的标识,并将信息向健康度评测模块同步;
步骤103,健康度评测模块记录VMI实例和云软件相关的信息;
步骤104,VMI实例启动后,健康度数据获取模块作为应用也在系统启动后运行起来,健康度数据获取模块获取本VMI实例的MAC地址,并将本MAC地址作为参数去健康度评测模块查询包含在本VMI中云软件的相关信息;
步骤105,健康度评测模块根据MAC地址查询出相关信息,如云软件进程识别参数,并返回给健康度数据获取模块;
步骤106,健康度数据获取模块根据云软件的信息对云软件的进程进行定位,并记录云软件的健康度数据;
步骤107,在预先设置的健康度数据记录同步间隔到达后,或者操作系统准备停止后,健康度数据获取模块将相关的云软件健康度记录同步至健康度评测模块;
步骤108,健康度评测模块根据云软件健康度数据记录进行健康度评测。
本发明的云软件健康度评测方法,主要需要实现如下接口:
1、VMI实例启动通知接口(云计算IaaS平台→健康度评测模块)请求参数【VMIInitialReq】:
名称 类型 长度/单位字节 描述 必选/可选
SoftwareList List VMI包含的云软件列表 必选
VMIID String 64 VMI实例的MAC地址 必选
应答参数【VMIInitialRsp】:
名称 类型 描述 必选/可选
errormessage String 结果描述 必选
statuscode String 结果码 必选
2、VMI信息查询接口(健康度数据获取模块←→健康度评测模块)请求参数【GetVMIInfoReq】:
名称 类型 长度/单位字节 描述 必选/可选
VMIID String 64 VMI实例的MAC地址 必选
应答参数【GetVMIInfoRsp】:
云软件健康度数据同步接口(健康度数据获取模块→健康度评测模块)请求参数【HealthDataSyncReq】:
名称 类型 长度/单位字节 描述 必选/可选
SoftwareName String 128 云软件名称 必选
VMIID String 64 VMI实例的MAC地址 必选
RunningTime List 一组运行时间记录 必选
CrashTime List 一组异常退出记录 必选
ResourceStat List 一组资源使用情况记录 必选
应答参数【HealthDataSyncRsp】:
名称 类型 描述 必选/可选
errormessage String 结果描述 必选
statuscode String 结果码 必选
本发明的云软件健康度评测方法,健康度数据获取模块与云软件运行于同一VMI实例中,能够实时准确的捕获云软件进程的运行状况,实现对云软件健康度数据的精准获取。
本发明的云软件健康度评测方法,实现对运行于同一VMI实例中的多个云软件区分评测,突破了现有技术中依赖VMI实例运行状态笼统判断云软件运行状况的限制,通过健康度数据获取模块获取的精准健康度数据,达到对同一VMI实例中不同云软件的健康度精准评测的目的。
本发明的云软件健康度评测方法,根据提出的健康度评测计算公式,依据健康度数据获取模块获取的多维度的健康度数据,能够准确的评测云软件在各种条件下的健康度指标。
如图11所示,本发明公开了一种云软件健康度评测系统,包括:
健康度数据获取模块10,用于采集云软件的状态数据,与云软件一同打包进虚拟机镜像实例,获取虚拟机镜像实例启动后的媒介访问控制地址,根据媒介访问控制地址获得云软件的进程识别参数,根据进程识别参数对云软件进行定位,分析虚拟机镜像实例获得云软件的健康度数据;
健康度评测模块20,用于根据健康度数据对云软件的健康度进行评测。
其中:健康度数据包括:负载加权值、健康度因子加权值、资源使用稳定度因子、正常运行时间因子和周期内云软件异常退出次数;
健康度评测模块,具体用于根据负载加权值、健康度因子加权值、资源使用稳定度因子、正常运行时间因子和周期内云软件异常退出次数对云软件的健康度进行评测。
其中:
对云软件的健康度进行评测的公式包括:
Rating H = β · ( α 1 · ( Σ i = 1 n C λ + Σ i = 1 n M λ + Σ i = 1 n D λ ) n + α 2 · T a T b + α 3 · 1 N C )
RatingH代表健康度评分值,β代表负载加权值,α1,α2,α3代表各项健康度因子加权值,Cλ,Mλ,Dλ分别代表CPU、内存和磁盘I/O资源使用稳定度因子,代表正常运行时间因子,Ta为评测周期内云软件最长的正常运行时间,Tb为云软件的正常运行基准时间,NC为云软件异常退出次数。
其中:健康度数据获取模块包括:
信息获取子模块11,用于根据进程识别参数获取云软件的进程信息;
进程判断子模块12,用于在多个进程符合条件的状态下,判断是否能够通过云软件端口号定位进程;
进程定位子模块13,用于如果无法通过云软件端口号定位进程,则通过进程启动命令行参数寻找并分析云软件启动日志,定位云软件的进程;否则,通过云软件端口号定位云软件的进程。
本发明的云软件健康度评测系统,健康度数据获取模块与云软件运行于同一VMI实例中,能够实时准确的捕获云软件进程的运行状况,实现对云软件健康度数据的精准获取。
本发明的云软件健康度评测系统,实现对运行于同一VMI实例中的多个云软件区分评测,突破了现有技术中依赖VMI实例运行状态笼统判断云软件运行状况的限制,通过健康度数据获取模块获取的精准健康度数据,达到对同一VMI实例中不同云软件的健康度精准评测的目的。
本发明的云软件健康度评测系统,根据提出的健康度评测计算公式,依据健康度数据获取模块获取的多维度的健康度数据,能够准确的评测云软件在各种条件下的健康度指标。
本发明能有多种不同形式的具体实施方式,上面以图3-图11为例结合附图对本发明的技术方案作举例说明,这并不意味着本发明所应用的具体实例只能局限在特定的流程或实施例结构中,本领域的普通技术人员应当了解,上文所提供的具体实施方案只是多种优选用法中的一些示例,任何体现本发明权利要求的实施方式均应在本发明技术方案所要求保护的范围之内。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种云软件健康度评测方法,其特征在于,包括:
嵌入数据采集插件采集云软件的状态数据,将所述数据采集插件与所述云软件一同打包进虚拟机镜像实例;
获取所述虚拟机镜像实例启动后的媒介访问控制地址,根据所述媒介访问控制地址获得所述云软件的进程识别参数;
根据所述进程识别参数对所述云软件进行定位,分析所述虚拟机镜像实例获得所述云软件的健康度数据;
根据所述健康度数据对所述云软件的健康度进行评测。
2.根据权利要求1所述的方法,其特征在于,所述健康度数据包括:负载加权值、健康度因子加权值、资源使用稳定度因子、正常运行时间因子和周期内云软件异常退出次数;
所述根据健康度数据对所述云软件的健康度进行评测的步骤包括:
根据负载加权值、健康度因子加权值、资源使用稳定度因子、正常运行时间因子和周期内云软件异常退出次数对所述云软件的健康度进行评测。
3.根据权利要求2所述的方法,其特征在于,所述对云软件的健康度进行评测的公式包括:
Rating H = β · ( α 1 · ( Σ i = 1 n C λ + Σ i = 1 n M λ + Σ i = 1 n D λ ) n + α 2 · T a T b + α 3 · 1 N C )
所述RatingH代表健康度评分值,所述β代表负载加权值,所述α123代表各项健康度因子加权值,Cλ,Mλ,Dλ分别代表CPU、内存和磁盘I/O资源使用稳定度因子,代表正常运行时间因子,Ta为评测周期内云软件最长的正常运行时间,Tb为云软件的正常运行基准时间,NC为云软件异常退出次数。
4.根据权利要求3所述的方法,其特征在于,所述评测周期内云软件最长的正常运行时间为一个评测周期内重启多次的云软件运行时间中最长的时间。
5.根据权利要求4所述的方法,其特征在于,所述云软件异常退出次数为一个评测周期内云软件异常退出的总次数。
6.根据权利要求1所述的方法,其特征在于,所述根据所述进程识别参数对所述云软件进行定位的步骤包括:
根据所述进程识别参数获取所述云软件的进程信息,在多个所述进程符合条件的状态下,如果无法通过云软件端口号定位进程,则通过进程启动命令行参数寻找并分析云软件启动日志,定位所述云软件的进程;否则,通过云软件端口号定位所述云软件的进程。
7.一种云软件健康度评测系统,其特征在于,包括:
健康度数据获取模块,用于采集云软件的状态数据,与所述云软件一同打包进虚拟机镜像实例,获取所述虚拟机镜像实例启动后的媒介访问控制地址,根据所述媒介访问控制地址获得所述云软件的进程识别参数,根据所述进程识别参数对所述云软件进行定位,分析所述虚拟机镜像实例获得所述云软件的健康度数据;
健康度评测模块,用于根据所述健康度数据对所述云软件的健康度进行评测。
8.根据权利要求7所述的系统,其特征在于,所述健康度数据包括:负载加权值、健康度因子加权值、资源使用稳定度因子、正常运行时间因子和周期内云软件异常退出次数;
所述健康度评测模块,具体用于根据负载加权值、健康度因子加权值、资源使用稳定度因子、正常运行时间因子和周期内云软件异常退出次数对所述云软件的健康度进行评测。
9.根据权利要求8所述的系统,其特征在于,所述对云软件的健康度进行评测的公式包括:
Rating H = β · ( α 1 · ( Σ i = 1 n C λ + Σ i = 1 n M λ + Σ i = 1 n D λ ) n + α 2 · T a T b + α 3 · 1 N C )
所述RatingH代表健康度评分值,所述β代表负载加权值,所述α123代表各项健康度因子加权值,Cλ,Mλ,Dλ分别代表CPU、内存和磁盘I/O资源使用稳定度因子,代表正常运行时间因子,Ta为评测周期内云软件最长的正常运行时间,Tb为云软件的正常运行基准时间,NC为云软件异常退出次数。
10.根据权利要求7所述的系统,其特征在于,所述健康度数据获取模块包括:
信息获取子模块,用于根据所述进程识别参数获取所述云软件的进程信息;
进程判断子模块,用于在多个所述进程符合条件的状态下,判断是否能够通过云软件端口号定位进程;
进程定位子模块,用于如果无法通过云软件端口号定位进程,则通过进程启动命令行参数寻找并分析云软件启动日志,定位所述云软件的进程;否则,通过云软件端口号定位所述云软件的进程。
CN201210573073.0A 2012-12-25 2012-12-25 一种云软件健康度评测方法及系统 Active CN103902442B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210573073.0A CN103902442B (zh) 2012-12-25 2012-12-25 一种云软件健康度评测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210573073.0A CN103902442B (zh) 2012-12-25 2012-12-25 一种云软件健康度评测方法及系统

Publications (2)

Publication Number Publication Date
CN103902442A CN103902442A (zh) 2014-07-02
CN103902442B true CN103902442B (zh) 2016-11-23

Family

ID=50993777

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210573073.0A Active CN103902442B (zh) 2012-12-25 2012-12-25 一种云软件健康度评测方法及系统

Country Status (1)

Country Link
CN (1) CN103902442B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572249B (zh) * 2015-01-20 2016-04-20 北京奇虎科技有限公司 评测骚扰电话识别工具的系统和方法
CN104735063B (zh) * 2015-03-11 2018-01-02 广东电子工业研究院有限公司 一种用于云基础设施的安全评测方法
CN105930255B (zh) * 2015-10-16 2019-01-29 中国银联股份有限公司 一种系统健康度预测方法及装置
CN105589787B (zh) * 2015-12-18 2018-08-28 畅捷通信息技术股份有限公司 应用程序的健康检查方法及健康检查系统
CN105700990A (zh) * 2016-01-18 2016-06-22 电信科学技术第五研究所 以任务为对象的软硬件运行监控方法
CN107783814A (zh) * 2016-08-29 2018-03-09 中国石油化工股份有限公司 软件资产集中保护方法及系统
CN106951984B (zh) * 2017-02-28 2021-02-02 深圳市华傲数据技术有限公司 一种系统健康度动态分析预测方法及装置
US10965566B2 (en) 2017-11-03 2021-03-30 International Business Machines Corporation System and method for detecting changes in cloud service up-time
CN108595333B (zh) * 2018-04-26 2021-08-03 Oppo广东移动通信有限公司 PaaS平台中应用进程的健康检查方法及装置
CN110968495A (zh) * 2018-09-29 2020-04-07 浙江大学 一种容器云平台性能评估方法及装置
CN110188116B (zh) * 2019-04-10 2020-11-10 口碑(上海)信息技术有限公司 核对脚本的处理方法及装置、存储介质、电子装置
CN111124821A (zh) * 2019-12-13 2020-05-08 苏州智加科技有限公司 行车软件检测方法、装置及存储介质
CN112019382B (zh) * 2020-08-20 2022-06-03 苏州浪潮智能科技有限公司 一种云计算管理平台的健康评估方法、系统及装置
CN112069047B (zh) * 2020-09-02 2023-02-07 鹏城实验室 计算生态检测方法、装置、设备以及存储介质
CN112527611A (zh) * 2020-09-24 2021-03-19 上海趣蕴网络科技有限公司 一种产品健康度评估方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101373447A (zh) * 2008-08-20 2009-02-25 上海超级计算中心 计算机集群的健康度检测系统和方法
CN102081622A (zh) * 2009-11-30 2011-06-01 中国移动通信集团贵州有限公司 评估系统健康度的方法及系统健康度评估装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10783504B2 (en) * 2010-02-26 2020-09-22 Red Hat, Inc. Converting standard software licenses for use in cloud computing environments

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101373447A (zh) * 2008-08-20 2009-02-25 上海超级计算中心 计算机集群的健康度检测系统和方法
CN102081622A (zh) * 2009-11-30 2011-06-01 中国移动通信集团贵州有限公司 评估系统健康度的方法及系统健康度评估装置

Also Published As

Publication number Publication date
CN103902442A (zh) 2014-07-02

Similar Documents

Publication Publication Date Title
CN103902442B (zh) 一种云软件健康度评测方法及系统
CN103246602B (zh) 代码覆盖率确定方法及系统、代码覆盖检测方法及系统
US20140195860A1 (en) Early Detection Of Failing Computers
CN100589418C (zh) 告警相关性规则的生成方法及生成系统
US8661125B2 (en) System comprising probe runner, monitor, and responder with associated databases for multi-level monitoring of a cloud service
CN103150250B (zh) 应用程序性能检测系统和应用程序性能检测方法
US10860454B2 (en) Analyzing large-scale data processing jobs
Shahid et al. Towards Resilient Method: An exhaustive survey of fault tolerance methods in the cloud computing environment
CN110750458A (zh) 大数据平台测试方法、装置、可读存储介质及电子设备
Magalhaes et al. Detection of performance anomalies in web-based applications
JP2013050950A (ja) 分散環境におけるトランザクション別に区別されたメトリックの効率的収集
Nguyen et al. Automated verification of load tests using control charts
Cremonesi et al. Indirect estimation of service demands in the presence of structural changes
CN103761393B (zh) 一种基于细粒度性能计数器建立系统实时功耗模型的方法
CN108287876A (zh) 支持多种格式的电能质量数据服务质量检测方法和装置
CN105487958B (zh) 处理器内部行为监测方法
US20130006568A1 (en) Test Operation
Sözer Architecting fault-tolerant software systems
Mendoza et al. Machine learning for anomaly detection on VM and host performance metrics
Nguyen et al. Automatic load test verification using control charts
Jia et al. A predictive control approach for fault management of computing systems
Ren et al. HybridTune: Spatio-temporal Data and Model Driven Performance Diagnosis for Big Data Systems
Ekhlasi et al. DTraComp: Comparing distributed execution traces for understanding intermittent latency sources
JP6601232B2 (ja) 分析方法、分析装置、及び分析プログラム
CN117453567A (zh) 混沌测试方法、装置及设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant