CN104102875B - 基于加权朴素贝叶斯分类器的软件服务质量监控方法及系统 - Google Patents

基于加权朴素贝叶斯分类器的软件服务质量监控方法及系统 Download PDF

Info

Publication number
CN104102875B
CN104102875B CN201410351264.1A CN201410351264A CN104102875B CN 104102875 B CN104102875 B CN 104102875B CN 201410351264 A CN201410351264 A CN 201410351264A CN 104102875 B CN104102875 B CN 104102875B
Authority
CN
China
Prior art keywords
sample
influence
factor
data
qos
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410351264.1A
Other languages
English (en)
Other versions
CN104102875A (zh
Inventor
张鹏程
庄媛
冯钧
朱跃龙
万定生
刘宗磊
周宇鹏
肖艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN201410351264.1A priority Critical patent/CN104102875B/zh
Publication of CN104102875A publication Critical patent/CN104102875A/zh
Application granted granted Critical
Publication of CN104102875B publication Critical patent/CN104102875B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • G06F18/24155Bayesian classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Hardware Design (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种基于加权朴素贝叶斯分类器的软件服务质量的监控方法及监控系统,方法通过构造的加权朴素贝叶斯分类器判断软件的QoS属于满足标准类、不满足标准类还是无法判断,训练时设定影响因子组合,影响因子即非软件本身对QoS的影响,计算影响因子组合权值以及先验知识,监控时由分类器得到监控结果,分析、存储并返回评价给数据服务端。系统包括:控制器,采集不同的服务质量声明,向观察器发布不同服务质量所需的数据标准指令,传递需与数据集匹配的QoS标准给训练器,控制采集周期以及频率;数据库汇总分析器的监控结果;服务能力评价模块向数据服务设备返回软件的监控结果和评价结果;还包括观察器、训练器、优化样本集和分析器。

Description

基于加权朴素贝叶斯分类器的软件服务质量监控方法及系统
技术领域
本发明涉及一种基于加权朴素贝叶斯分类器的软件服务质量监控方法及系统,尤其涉及对运行时QoS需求指标动态加权的监控,属于信息技术领域。
背景技术
Web服务技术适应于任何类型的Web环境,包括互联网、Intranet以及Extranet,实现了企业与企业、企业与消费者之间的通信。从Web服务的关键技术来看,Web服务仍具有很大的研究空间和挑战,其中用户需求中最重要的问题之一就是服务质量(Quality ofService)问题,QoS的好坏是Web服务在商业应用中能否取得成功的关键。在面向服务(Service-Oriented Architecture)应用十分广泛的今天,软件系统能够动态将一些松耦合并且具有统一接口定义方式的组件(也就是Service)组合构建起来的,然而在复杂多变的Web环境中,对于第三方服务的依赖会带来许多不确定问题,无法满足QoS需求。因此需要采用运行时监控技术对其进行监控以保证软件执行的正确性。
QoS的关键指标如可用性、吞吐量、时延、时延变化(包括抖动和漂移)和丢失等通常用概率来表示不确定性,当前最科学的表示方法是采用模糊语言,来表示系统的可靠运行需要监控诊断的特征量估计值,例如“患者通过网络急救中心呼叫得到应答的时间小于30秒的概率为80%”等。当前的概率监控方法采用假设检验来进行统计,也有基于贝叶斯因子的监控方法,前者只使用单一概率值评估,实际可执行性差,后者的监控结果出错率有待降低,更重要的是,现有的方法都忽略了环境对监控结果的影响,不同的环境会影响我们的概率监控结果,这些环境包括用户的位置,网络,服务器的CPU,RAM,I/O等,例如用户在不同地区使用同一服务时可能体验不同的QoS。因此,现有的概率监控技术已经无法满足概率监控的需要。
发明内容
发明目的:针对现有技术中存在的问题与不足,提供一种新的监控方法以及监控系统,结合监控环境对监控结果的影响,判断系统运行时行为是否满足系统的QoS属性,使动态QoS监控系统更加敏感,监控结果更加精确,为自适应,用户选择服务提供决策依据,从而保证软件系统的安全可靠。
技术方案:一种基于加权朴素贝叶斯推断的软件服务质量监控方法,包括如下步骤:
1)根据QoS标准Θ,设定满足QoS标准的类别c0和不满足QoS标准的类别c1
2)训练已搜集到的样本集,获得不同影响因子组合权值wR以及先验知识pli
3)读取运行时的带监控的观测变量组合作为单次样本对单次监控样本进行预处理,样本预处理为对样本进行缺失值填充以及离散化;
4)根据样本影响因子R调用权值表得到R的权值;
5)统计二项分布成功率的贝叶斯估计值并判别本次样本使样本集的成功率分布于c0还是c1
6)更新样本先验概率p(ci);
7)调用朴素贝叶斯分类器 xk∈{0,1}得出结果,其中Ci,i∈(0,1);调用加权朴素贝叶斯公式如下:
由加权朴素贝叶斯分类器以及Harold Jeffrey的T解释得到 TWi Rp(X|Ci)P(Ci)},其中
对于所述Harold Jeffrey对T解释:支持类C0和支持类C1的比值T,T的取值以及样本集对分类的影响表1:
表1 T值的意义
8)定期连续读取变量组合作为样本,对样本进行预处理并存入样本集 xk∈{0,1},m表示样本总数,重复步骤3)~8);
所述的影响因子权值,包括三个方面的参数,分别是用户参数,服务端参数,网络环境参数,用户参数包括地点,客户端属性等,服务端参数以云端为例,包括云环境提供的虚拟机的内存大小和计算单元个数,网络环境参数包括带宽和负载,由于影响因子互相不独立,为了减少误差,将上诉参数划分不同的组合,例如影响因子描述如下“中国的用户在PC端调用服务,此时带宽为1Kbit/s,负载为150,所调用服务在云端的服务器参数为虚拟机内存为3.05G”,根据tf*idf算法可知,影响因子对分类的影响与影响因子R在Ci中出现的概率成正比,和影响因子在全部样本中出现的概率成反比,故 表示影响因子为R且使整个样本集的成功率落在区域Ci的单个样本个数,Nci表示样本落在区域Ci的样本总个数,N表示样本总个数,nR表示影响因子为R的样本的总个数;
所述的朴素贝叶斯分类器,具体为:
1)计算先验知识pli,其中pli为经过在不同环境下进行训练的P(xk=1,ci)/P(ci)的平均值;
2)计算二项分布概率
3)计算P(ci)=nci/N;
4)计算影响因子组合权值
5)构造朴素贝叶斯分类器
表示样本xk的权值,所述的分析结果,具体为选取阀值Thres,T默认为Θ/(1-Θ),类别后验概率较大与较小的比值大于T,说明样本属于后验概率较大的类,否则属于无法判断的区域。
为了实现上述目的,本发明还提供该方法采用的监控系统,所述系统包括:控制器,用于采集运行时软件的不同服务质量声明,产生不同服务质量所需的数据集标准,指示观察器搜集所需的对应数据集,指导分析器匹配QoS标准和数据集,并控制采集周期和频率;数据库汇总分析器结果数据,并将数据交给服务能力评价模块进行分析,最终得到可以用自然语言向数据服务设备反馈的软件监控结果和评价结果;观察器,用于从数据服务设备端收集所需的服务数据以及影响因子定位,对数据进行补全和离散化;训练器,将不同的影响因子组合作为监控的外部影响,在该影响下得到样本集分析,得到影响因子组合权值wT以及先验知识pli;分析器,根据样本信息调用先验信息以及影响因子权值表,根据朴素贝叶斯分类模块得到监控结果,存入监控结果数据库。
所述控制器包括:QoS信息采集模块,用于采集运行时软件的服务声明标准,作为监控标准,产生不同搜集任务指示数据收集端收集对应数据集;计时器,控制监控任务下观察器采用周期性以及一定频率采集监控对象数据;QoS适配生成模块,根据QoS标准生成需匹配的服务标准给对应的训练器;评估软件QoS属性模块,综合评估软件服务能力,向数据服务设备返回自然语言描述的软件服务质量评价;监控结果数据库,汇总不同QoS的监控结果,传递给评估软件QoS属性模块;
所述观察器包括:数据收集器:用于从数据服务设备端采集训练数据和监控数据,训练数据的影响因子已知,监控数据的影响因子需要影响因子定位模块确定;数据预处理模块:将影响因子进行缺失补全,对训练数据离散化期望得到更准确的结果;影响因子定位模块:定位每一次监控的影响因子;
所述分析器包括:信息匹配模块:根据控制器提供的QoS适配标准以及经过预处理分类的数据进行匹配,存入样本信息库中,并用来计算监控结果;样本数据库:存放经过预处理的样本;权值获取模块:根据样本的影响因子组合查找影响因子权值表获取权值;朴素贝叶斯分类模块:根据样本影响因子R调用影响因子权值表得到影响因子组合权值wR,样本满足QoS属性则xi=1,调用加权朴素贝叶斯分类器进行监控,将结果存入监控结果数据库中。
所述训练器包括:影响因子训练声明模块,提供影响因子组合;训练信息采集模块,向影响因子参数设置端发送参数设置值,指导数据采集端收集不同的QoS标准的数据集;伯努利后验信息统计模块,统计每个样本加入样本集后对样本集成功率改变后的值,并比较其与QoS标准的关系;影响因子权值计算模块,根据tf*idf算法得到影响因子组合对分类的权值;先验知识获取模块,根据伯努利后验信息统计模块得到的结果计算先验知识pli;影响因子权值数据库,存储量化的影响因子权值,供分析器对朴素贝叶斯分类器进行加权。
本发明采用上述技术方案,具有以下有益效果:
朴素贝叶斯以其运行快速,易于实现的特点,被广泛应用在很多实际的应用系统中,由于本实验的样本相互独立,对每个样本的参数可以分别估计,这样大大减少了计算量,虽然样本是否符合QoS属性对总样本的判断都有影响,但是实际上对分类起作用的还是成功的样本,除了样本本身,我们还考虑了环境因素对监控的影响,采用tf*idf算法计算影响因子(即环境因素)组合对分类的影响,能够使系统对样本值更加敏感,获得的结果更加精确。
附图说明
图1为本发明所提出的监控系统结构示意图;
图2为本发明所提出的影响因子权值以及先验知识获取系统结构图;
图3为本发明所提出的一种基于加权朴素贝叶斯分类器推断的软件服务质量动态监控方法的实施流程图;
图4为本发明所提出的影响因子权值的获取流程;
图5为本发明所提出的加权朴素贝叶斯分类器的构造。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
如图1所示,为本发明所提出的监控系统结构示意图,所述系统包括:
控制器,用于采集运行时软件的不同服务质量声明,产生不同服务质量所需的数据集标准,指示观察器搜集所需的对应数据集,指导分析器匹配QoS标准和数据集,并控制采集周期和频率,数据库汇总分析器结果数据,并将数据交给服务能力评价模块进行分析,最终得到可以用自然语言向数据服务设备反馈的软件监控结果和评价结果;
观察器,用于从数据服务设备端收集所需的服务数据以及影响因子定位,对数据进行补全和离散化;
训练器,将不同的影响因子组合作为监控的外部影响,在该影响下得到样本集分析,得到影响因子组合权值wT以及先验知识pli
分析器,根据样本信息调用先验信息以及影响因子权值表,根据朴素贝叶斯分类模块得到监控结果,存入监控结果数据库。
控制器包括:QoS信息采集模块,用于采集运行时软件的服务声明标准,作为监控标准,产生不同搜集任务指示数据收集端收集对应数据集;计时器,控制监控任务下观察器采用周期性以及一定频率采集监控对象数据;QoS适配生成模块,根据QoS标准生成需匹配的服务标准给对应的训练器;评估软件QoS属性模块,综合评估软件服务能力,向数据服务设备返回自然语言描述的软件服务质量评价;监控结果数据库,汇总不同QoS的监控结果,传递给评估软件QoS属性模块。
观察器包括:数据收集器:用于从数据服务设备端采集训练数据和监控数据,训练数据的影响因子已知,监控数据的影响因子需要影响因子定位模块确定;数据预处理模块:将影响因子进行缺失补全,对训练数据离散化期望得到更准确的结果;影响因子定位模块:定位每一次监控的影响因子;
分析器包括:信息匹配模块:根据控制器提供的QoS适配标准以及经过预处理分类的数据进行匹配,存入样本信息库中,并用来计算监控结果;样本数据库:存放经过预处理的样本;权值获取模块:根据样本的影响因子组合查找影响因子权值表获取权值;朴素贝叶斯分类模块:根据样本影响因子R调用影响因子权值表得到影响因子组合权值wR,样本满足QoS属性则xk=1,调用加权朴素贝叶斯分类器进行监控,将结果存入监控结果数据库中。
训练器包括:影响因子训练声明模块,提供影响因子组合;训练信息采集模块,向影响因子参数设置端发送参数设置值,指导数据采集端收集不同的QoS标准的数据集;伯努利后验信息统计模块,统计每个样本加入样本集后对样本集成功率改变后的值,并比较其与QoS标准的关系;影响因子权值计算模块,根据tf*idf算法得到影响因子组合对分类的权值;先验知识获取模块,根据伯努利后验信息统计模块得到的结果计算先验知识pki;影响因子权值数据库,存储量化的影响因子权值,供分析器对朴素贝叶斯分类器进行加权。
以监控QoS服务为例,通过训练器获得先验知识以及不同环境下的影响因子权值,控制器获得不同级别的软件服务的不同服务标准,并将其转化为机器识别的规约化语言,指导分析器对不同服务标准进行并行监控,观察器从数据服务端收集样本数据并进行缺失补全离散化,并定位影响因子,分析器根据控制器提供的QoS适配标准将数据进行分类,指导分析器调用QoS所属的先验知识,通过影响因子获得影响因子的权值,利用朴素贝叶斯分类器作出相应的判断,存入监控结果数据库,通过服务能力评价模块向数据服务端返回自然语言的软件监控结果及评价结果。
如图2所示,为本发明的影响因子权值和先验知识获取系统结构图,适用于获取影响因子组合对各个QoS标准监控时的影响。训练器训练样本,得到不同影响因子组合对监控的影响,具体步骤如下:
1)影响因子训练声明模块声明不同的影响因子组合以及待监控的QoS标准集合,影响因子组合声明控制训练样本在何种环境下训练,QoS标准集合用来指导训练不同QoS属性的先验知识;
2)训练信息采集模块设定影响因子参数,即训练时服务的运行环境,并将QoS标准作为指令指导数据收集端数据;
3)观察器根据QoS标准收集数据,并将数据进行预处理,预处理包括缺失信息补全以及样本信息离散化;
4)二项分布可靠性计算和分析模块计算每个样本加入样本后对样本集成功率即二项分布可靠性的改变,对其进行分析,如果使样本集成功率属于满足QoS标准的类别c0,则认为样本的加入使样本集趋于属于c0,反之亦然;
5)影响因子权值计算模块通过步骤4)得到的训练信息结合tf*idf算法计算每组影响因子对每个QoS属性的影响,即权值;
6)先验知识获取模块:通过步骤4)得到的训练信息通过公式P(xk=1,ci)/P(ci)得到先验知识,由于训练环境有误差,我们取所有影响因子组合的先验知识的平均值为先验知识。
如图3所示,为基于加权朴素贝叶斯推断的软件服务质量监控方法的监控方法流程图,步骤如下:
步骤101:根据QoS标准,设定满足QoS标准的类别C0和不满足QoS标准的类别C1
步骤102:获取训练样本
步骤103:训练QoS先验信息以及各影响因子组合对监控结果影响的权值;
步骤104:对数据进行预处理;
步骤105:搜集样本并对样本进行预处理,定位影响因子组合;
步骤106:通过影响因子组合调用数据库得到权值;
步骤107:通过加权朴素贝叶斯分类器进行监控分析;
步骤108:判断P(c0|X)是否大于T P(c1|X)
步骤109:如果步骤108判断为真,说明监控到此时系统满足QoS标准;
步骤110:判断P(c1|X)是否大于T P(c0|X),
步骤111:如果110判断为真,说明监控到此时系统不满足QoS标准;
步骤112:如果不满足步骤108和步骤110,则说明无法确定是否满足QoS标准;
步骤113:向评估软件QoS属性模块返回监控结果,生成自然语言描述的监控结果和评价;
步骤114:将返回监控结果和评价返回给数据服务端;
步骤115:监控进入下一个周期。
如图4所示,为基于加权朴素贝叶斯推断的软件服务质量监控方法的训练权值流程图,步骤如下:
步骤201:判断是否持续监控;
步骤202:如果持续监控,读取一个样本;
步骤203:样本总数加1;
步骤204:获取样本的影响因子组合,将该组合数目加1;
步骤205:判断样本是否满足QoS属性,例如,QoS标准要求服务响应时间小于0.3秒的概率大于95%,则此处判断样本响应时间是否小于0.3秒;
步骤206:如果115步骤判断为是,将样本满足QoS属性的数目X加1;
步骤207:单个样本的加入使样本集的可靠性点估计值更改,具体计算公式为θ=X/N;
步骤208:判断样本集是否满足QoS标准,即θ是否大于95%;
步骤209:如果步骤207判定为是,则含有该影响因子组合的样本所属类别为c0的数目加1,所属类别加1;
步骤210:如果步骤207判定为否,则含有该影响因子组合的样本所属类别为c1的数目加1,所属类别加1;
步骤211:如果112判断结果为否,则计算影响因子组合Ri的权值wRi,计算公式为:
步骤212:输出所有影响因子权值。
如图5所示,为基于加权朴素贝叶斯推断的软件服务质量监控方法的构造朴素贝叶斯分类器流程图,步骤如下:
步骤301:读取一个带监控的样本;
步骤302:样本总数N加1;
步骤303:定位影响因子组合;
步骤304:查找权值表获取影响因子组合权值;
步骤305:判断样本是否满足QoS属性;
步骤306:步骤125判断为是,则样本值为1;
步骤307:步骤125判断为是,样本值为1的样本数X加1;
步骤308:步骤125判断为是,样本集成功率Θ=X/N;
步骤309:步骤125判断为否,则样本值为0;
步骤310:计算每个样本的先验条件概率,公式为:
步骤311:点估计是否满足QoS属性标准的判断;
步骤312:步骤131为是执行本步骤,满足QoS属性标准的样本Y加1;
步骤313:求得步骤ci的似然概率;
步骤314:求得样本集的先验概率;
步骤315:构造加权朴素贝叶斯分类器。

Claims (9)

1.一种基于加权朴素贝叶斯分类器的软件服务质量动态监控方法,其特征在于,所述方法包括以下步骤:
1)根据QoS标准Θ,设定满足QoS标准的类别C0和不满足QoS标准的类别C1
2)训练样本,获得不同影响因子组合权值wR以及先验知识pli
3)读取运行时的观测变量组合作为样本对样本进行补全和离散化预处理;
4)根据样本影响因子R调用权值表得到样本xk的权值
5)统计二项分布成功率的贝叶斯估计值并判别本次样本使样本集的成功率分布Ci,i∈(0,1);
6)更新样本先验概率p(Ci);
7)调用加权朴素贝叶斯分类器得出结果,调用加权朴素贝叶斯公式如下: arg max c i ∈ C { W i R P ( X | C i ) P ( C i ) , TW i R P ( X | C i ) P ( C i ) } ;
8)定期连续读取变量组合作为样本,对样本进行预处理并存入样本集 xk∈{0,1},m表示样本总数,重复步骤3)~8)。
2.如权利要求1所述的基于加权朴素贝叶斯分类器的软件服务质量动态监控方法,其特征在于,对于所述步骤2)和步骤5):引入二项分布的自然共轭先验分布,即贝塔分布,根据二项分布可靠性分析得到二项分布可靠性为a、b分别为伯努利参数,这里设定其分别为1,其中m为样本总数;β>Θ,代表本次样本的加入使样本集的二项分布成功率满足QoS标准Θ,即成功率落在C0区域,反之为C1,代表本次样本的加入使样本集的成功率不满足QoS标准,Θ表示监控的要求。
3.如权利要求1所述的基于加权朴素贝叶斯分类器的软件服务质量动态监控方法,其特征在于,对于所述步骤2):根据tf*idf算法可知,影响因子对分类的权值与影响因子T在Ci中出现的概率成正比,和影响因子在全部样本中出现的概率成反比,故 表示影响因子为R且使整个样本集的成功率落在区域Ci的单个样本个数,Nci表示样本落在区域Ci的样本总个数,N表示样本总个数,nR表示影响因子为R的样本的总个数。
4.如权利要求1所述的基于加权朴素贝叶斯分类器的软件服务质量动态监控方法,其特征在于,对于所述步骤2):我们用pli表示P(xk=1|Ci),样本xi的先验概率为其中pli为经过在不同环境下进行训练的P(xk=1,Ci)/P(Ci)的平均值。
5.如权利要求1所述的基于加权朴素贝叶斯分类器的软件服务质量动态监控方法,其特征在于,对于所述步骤7):由加权朴素贝叶斯分类器以及Harold Jeffrey的T解释得到其中
6.一种基于加权朴素贝叶斯分类器的软件服务质量动态监控系统,其特征在于,包括:
a)控制器:用于采集运行时软件的不同服务质量声明,产生不同服务质量所需的数据集标准,指示观察器搜集所需的对应数据集,指导分析器匹配QoS标准和数据集,并控制采集周期和频率,数据库汇总分析器结果数据,并将数据交给服务能力评价模块进行分析,最终得到可以用自然语言向数据服务设备反馈的软件监控结果和评价结果;
b)观察器:用于从数据服务设备端收集所需的服务数据以及影响因子定位,对数据进行补全和离散化;
c)训练器:将不同的影响因子组合作为监控的外部影响,在该影响下得到的样本集进行分析,得到影响因子组合权值wT以及先验知识pki
d)分析器:根据样本信息调用先验信息以及影响因子权值表,根据朴素贝叶斯分类模块得到监控结果,存入监控结果数据库;
所述训练器,包括:
影响因子训练声明模块:提供影响因子组合;
训练信息采集模块:向影响因子参数设置端发送参数设置值,指导数据采集端收集不同的QoS标准的数据集;
伯努利后验信息统计模块:统计每个样本加入样本集后对样本集成功率改变后的值,并比较其与QoS标准的关系;
影响因子权值计算模块:根据tf*idf算法得到影响因子组合对分类的权值;
先验知识获取模块:根据伯努利后验信息统计模块得到的结果计算先验知识pki
影响因子权值数据库:存储量化的影响因子权值,供分析器对朴素贝叶斯分类器进行加权;
训练器中影响因子,包括:
用户影响因子:用户的位置,使用软件的设备,CPU的型号;
环境影响因子:主要考虑网络负载以及带宽;
服务器端影响因子:在云环境下,指虚拟机的内存大小和计算单元个数。
7.如权利要求6所述的基于加权朴素贝叶斯分类器的软件服务质量动态监控系统,其特征在于,所述控制器包括:
QoS信息采集模块,用于采集运行时软件的服务声明标准,作为监控标准,产生不同搜集任务指示数据收集端收集对应数据集;QoS信息采集模块获取服务质量规约,作为机器可读的监控标准,指导数据收集端进行采集并产生QoS适配标准;
计时器,控制监控任务下观察器采用周期性以及一定频率采集监控对象数据;
QoS适配生成模块,根据QoS标准生成需匹配的服务标准给对应的训练器;
评估软件QoS属性模块,综合评估软件服务能力,向数据服务设备返回自然语言描述的软件服务质量评价;
监控结果数据库,汇总不同QoS的监控结果,传递给评估软件QoS属性模块。
8.如权利要求6所述的基于加权朴素贝叶斯分类器的软件服务质量动态监控系统,其特征在于,所述观察器,包括:
数据收集器:用于从数据服务设备端采集训练数据和监控数据,训练数据的影响因子已知,监控数据的影响因子需要影响因子定位模块确定;
数据预处理模块:将影响因子进行缺失补全,对训练数据离散化期望得到更准确的结果;
影响因子定位模块:定位每一次监控的影响因子。
9.如权利要求6所述的基于加权朴素贝叶斯分类器的软件服务质量动态监控系统,其特征在于,所述分析器,包括:
QoS信息匹配模块:根据控制器提供的QoS适配标准以及经过预处理分类的数据进行匹配,存入样本信息库中,并用来计算监控结果;
样本数据库:存放经过预处理的样本;
权值获取模块:根据样本的影响因子组合查找影响因子权值表获取权值;
朴素贝叶斯分类模块:根据样本影响因子R调用影响因子权值表得到WR,样本满足QoS属性则xi=1,调用加权朴素贝叶斯分类器进行监控,将结果存入监控结果数据库中。
CN201410351264.1A 2014-07-22 2014-07-22 基于加权朴素贝叶斯分类器的软件服务质量监控方法及系统 Expired - Fee Related CN104102875B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410351264.1A CN104102875B (zh) 2014-07-22 2014-07-22 基于加权朴素贝叶斯分类器的软件服务质量监控方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410351264.1A CN104102875B (zh) 2014-07-22 2014-07-22 基于加权朴素贝叶斯分类器的软件服务质量监控方法及系统

Publications (2)

Publication Number Publication Date
CN104102875A CN104102875A (zh) 2014-10-15
CN104102875B true CN104102875B (zh) 2017-05-03

Family

ID=51671018

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410351264.1A Expired - Fee Related CN104102875B (zh) 2014-07-22 2014-07-22 基于加权朴素贝叶斯分类器的软件服务质量监控方法及系统

Country Status (1)

Country Link
CN (1) CN104102875B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106294346A (zh) * 2015-05-13 2017-01-04 厦门美柚信息科技有限公司 一种论坛帖子识别方法及装置
CN105046045B (zh) * 2015-06-05 2018-06-19 河海大学 一种基于贝叶斯组合的Web服务QoS预测方法
US11507848B2 (en) * 2016-08-08 2022-11-22 TCL Research America Inc. Experience-aware anomaly processing system and method
CN106375452B (zh) * 2016-09-05 2019-07-12 河海大学 一种加权分类Web服务QoS监控方法
CN106484496B (zh) * 2016-10-28 2019-08-20 云南大学 基于贝叶斯网的虚拟机底层环境特征分析与性能度量方法
CN107331385A (zh) * 2017-07-07 2017-11-07 重庆邮电大学 一种骚扰电话的识别与拦截方法
CN107612704B (zh) * 2017-07-28 2019-10-01 北京邮电大学 物联网服务的排序方法及装置
CN109960839B (zh) * 2017-12-26 2023-04-28 中国移动通信集团浙江有限公司 基于机器学习的业务支撑系统业务链路发现方法和系统
CN108037979B (zh) * 2017-12-26 2021-07-13 云南大学 基于含隐变量贝叶斯网的虚拟机性能下降评估方法
CN110046633B (zh) * 2018-11-23 2023-05-02 创新先进技术有限公司 一种数据质量检测方法及装置
CN110417867B (zh) * 2019-07-03 2020-06-16 河海大学 移动边缘环境下的Web服务QoS监控方法
CN110568286B (zh) * 2019-09-12 2021-08-24 齐鲁工业大学 基于加权的双隐朴素贝叶斯的变压器故障诊断方法及系统
CN111506425B (zh) * 2020-04-14 2021-12-17 星辰天合(北京)数据科技有限公司 服务质量数据处理方法和装置
CN112329877A (zh) * 2020-11-16 2021-02-05 山西三友和智慧信息技术股份有限公司 一种基于投票机制的web服务分类方法及系统
CN112486767B (zh) * 2020-11-25 2022-10-18 中移(杭州)信息技术有限公司 云资源的智能监控方法、系统、服务器以及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102708149A (zh) * 2012-04-01 2012-10-03 河海大学 数据质量管理方法和系统
CN102866942A (zh) * 2012-09-13 2013-01-09 河海大学 一种基于贝叶斯推断的软件服务质量监控方法及系统
CN102956023A (zh) * 2012-08-30 2013-03-06 南京信息工程大学 一种基于贝叶斯分类的传统气象数据与感知数据融合的方法
CN103778206A (zh) * 2014-01-14 2014-05-07 河南科技大学 一种网络服务资源的提供方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102708149A (zh) * 2012-04-01 2012-10-03 河海大学 数据质量管理方法和系统
CN102956023A (zh) * 2012-08-30 2013-03-06 南京信息工程大学 一种基于贝叶斯分类的传统气象数据与感知数据融合的方法
CN102866942A (zh) * 2012-09-13 2013-01-09 河海大学 一种基于贝叶斯推断的软件服务质量监控方法及系统
CN103778206A (zh) * 2014-01-14 2014-05-07 河南科技大学 一种网络服务资源的提供方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于加权朴素贝叶斯分类算法的学生成绩决策分析;蔡洁等;《佳木斯大学学报(自然科学版)》;20100131;第28卷(第1期);第150-152页 *

Also Published As

Publication number Publication date
CN104102875A (zh) 2014-10-15

Similar Documents

Publication Publication Date Title
CN104102875B (zh) 基于加权朴素贝叶斯分类器的软件服务质量监控方法及系统
CN108520357B (zh) 一种线损异常原因的判别方法、装置及服务器
CN109347668A (zh) 一种服务质量评估模型的训练方法及装置
CN104967629B (zh) 网络攻击检测方法及装置
US11108676B2 (en) Method and system for detecting network quality based on a network fluctuation model
US8180914B2 (en) Deleting data stream overload
CN109753499A (zh) 一种运维监控数据治理方法
CN105207821B (zh) 一种面向业务的网络综合性能评估方法
CN106844138A (zh) 运维报警系统及方法
CN103281370B (zh) 一种评估宽带网络Internet服务质量的方法
CN104965784B (zh) 自动测试方法及装置
CN111292020B (zh) 一种基于随机森林的电网实时运行风险评估方法及系统
CN109598534A (zh) 信息确定方法及装置、电子设备及存储介质
CN109446812A (zh) 一种嵌入式系统固件安全分析方法及系统
CN102866942B (zh) 一种基于贝叶斯推断的软件服务质量监控方法及系统
CN108803545A (zh) 多参数联合分析报警方法及系统
CN111881185A (zh) 一种数据监控方法、装置、设备及存储介质
US20210099894A1 (en) Forcasting time series data
CN111144738A (zh) 信息处理方法、装置、计算机设备和存储介质
CN111652403A (zh) 一种基于反馈修正的工作平台任务工作量预测方法
CN112699048A (zh) 基于人工智能的程序故障处理方法、装置、设备及存储介质
CN115378928B (zh) 基于云服务的监控方法及系统
CN116909712A (zh) 基于机器学习的智能任务调度系统及其方法
CN112150179A (zh) 一种信息推送方法和装置
ur Rehman et al. LTE downlink throughput modeling using neural networks

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170503

Termination date: 20210722