CN103139310B - 一种基于混合协同过滤的Web服务QoS预测方法 - Google Patents

一种基于混合协同过滤的Web服务QoS预测方法 Download PDF

Info

Publication number
CN103139310B
CN103139310B CN201310070867.XA CN201310070867A CN103139310B CN 103139310 B CN103139310 B CN 103139310B CN 201310070867 A CN201310070867 A CN 201310070867A CN 103139310 B CN103139310 B CN 103139310B
Authority
CN
China
Prior art keywords
service
user
represent
class
qos
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310070867.XA
Other languages
English (en)
Other versions
CN103139310A (zh
Inventor
俞东进
吴萌萌
殷昱煜
李万清
穆海伦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN201310070867.XA priority Critical patent/CN103139310B/zh
Publication of CN103139310A publication Critical patent/CN103139310A/zh
Application granted granted Critical
Publication of CN103139310B publication Critical patent/CN103139310B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种基于混合协同过滤的Web服务QoS预测方法,现有的Web服务QoS预测方法的预测精确度不高,特别是在QoS数据稀疏的情况下该情况更为严重,本发明根据用户和服务的相关信息,首先将用户和服务分类,然后根据目标用户和目标服务所属分类的不同使用不同的预测方法计算其QoS预测值,并在计算预测值的过程中使用改进的欧氏距离方法计算用户间和服务间的相似度。与传统方法相比,本发明具有较高的Web服务QoS的预测精度,尤其在历史QoS数据稀疏情况下,其预测精度相比现有方法有明显提高。

Description

一种基于混合协同过滤的Web服务QoS预测方法
技术领域
本发明属于服务选择领域,具体涉及到一种基于混合协同过滤的Web服务QoS预测方法。
背景技术
当前,利用Web服务组合技术有效地组织Internet中的各类服务,开发既满足用户功能性需求、又满足服务质量(QualityofService,简称QoS)需求的企业级应用,已成为Internet环境下软件开发的重要方式。其中,服务选择是服务组合过程中的关键环节。由于存在大量功能、行为相同或相似而QoS不同的Web服务,进行服务选择时必须考虑它们的QoS属性。
迄今为止,国内外研究者已提出了许多基于QoS的服务选择方法,这些方法大多针对服务的QoS信息较为完整的情况,然而实际情况并非都是如此。服务的QoS信息通常来自于用户调用后得到的数据。但是一个用户一般并不可能调用过所有的服务,这样就需要在众多的候选服务中,在服务QoS信息不完全情况下进行选择。
当前,服务QoS预测已成为Web服务领域的一个热点问题。通过大量实验的验证和比较,基于协同过滤的预测方法是迄今为止整体预测精度最好的方法。但是在QoS数据稀疏的情况下,该类方法的预测精度较其他方法提高并不十分明显。同时,通过分析真实QoS数据,可以发现QoS数据的重要特点正是数据稀疏性。
发明内容
本发明针对现有技术的不足,提出了一种基于混合协同过滤的Web服务QoS预测方法。
本发明一种基于混合协同过滤的Web服务QoS预测方法的具体步骤是:
步骤(1)获取用户调用Web服务QoS历史记录信息,并将所获取的初始QoS矩阵正规化,具体计算公式为:,其中,表示用户u调用服务s的QoS,表示与用户u相关的所有QoS记录的平均值,表示用户u调用服务所得QoS数据的标准偏差;
步骤(2)根据用户和服务的相关信息,将用户分为“普通用户类”和“特殊用户类”,将服务分为“普通服务类”、“特殊服务类”和“区域敏感服务类”;根据定义1确定“特殊用户类”,根据定义2确定“特殊服务类”,根据定义3和定义4确定“区域敏感服务类”,未被划分入以上任意类的用户和服务分别组成“普通用户类”和“普通服务类”;
步骤(3)目标用户属于“特殊用户类”,而目标服务不属于“特殊服务类”,则使用UMEAN方法计算预测值,即将目标用户调用过的QoS记录的均值作为预测值;
步骤(4)目标服务属于“特殊服务类”,而目标用户不属于“特殊用户类”,则使用IMEAN方法计算预测值,即将目标服务被调用的QoS记录的均值作为预测值;
步骤(5)目标服务属于“特殊服务类”,且目标用户属于“特殊用户类”,则将使用UMEAN方法和IMEAN方法获得的预测值的均值作为最终的预测值;
步骤(6)目标服务对于目标用户所属区域敏感,根据定义5,将目标用户所属区域对目标服务的中心作为最终的预测值;
步骤(7)目标用户和目标服务分别属于“普通用户类”和“普通服务类”,根据定义6和定义7,使用改进欧氏距离计算用户间和服务间的相似度,使用Top-K算法选择目标用户和目标服务的相似邻居,最后根据定义8使用综合预测方法计算最终的预测值。
定义1特殊用户类。用户QoS均值最大的个用户组成“特殊用户类”。其中,用户QoS均值是指与该用户相关的所有QoS记录的平均值,是控制特殊用户类中用户个数的阈值,可根据实际情况指定。
定义2特殊服务类。服务QoS均值最大的个服务组成“特殊服务类”。其中,服务QoS均值是指与该服务相关的所有QoS记录的平均值,是控制特殊服务类中服务个数的阈值,可根据实际情况指定。
定义3用户区域。将用户按照所在物理位置的不同分成f类,用户表示属于第i个区域的用户的集合,用表示用户区域的集合,即
定义4区域敏感服务。若服务s满足,则称服务s对区域敏感。其中,表示一个名为的服务;为控制区域敏感服务的阈值,可根据实际情况指定;表示区域中用户调用服务s所得QoS记录的集合的中值,简称区域的中值;表示用户区域集合中各个区域中值所组成的集合的中值;表示用户区域集合中各个区域中值与的差的绝对值所组成的集合的中值,计算公式为
定义5区域中心。区域对服务s的中心是指:区域中所有用户调用服务s所得QoS集合的中值,计算公式为:
定义6用户相似度。本发明中,用户u1和u2的相似度使用改进欧式距离计算,具体公式为:,其中,表示用户u1和u2共同调用过的服务集合,表示用户u1和用户u2共同调用服务的个数,表示服务s被用户调用所得QoS数据的标准偏差,计算公式为:表示调用服务s的用户集合,表示调用服务s的用户的个数,表示用户ui调用服务s的QoS值,表示与服务s相关的所有QoS记录的平均值。
定义7服务相似度。本发明中,服务s1和s2的相似度使用改进欧式距离计算,具体公式为:,其中,表示共同调用服务s1和s2的用户集合,表示共同调用服务s1和s2的用户的个数,表示表示用户u调用服务所得QoS数据的标准偏差,计算公式为:表示用户u调用的服务集合,表示用户u调用服务的个数,表示用户u调用服务s的QoS值,表示与服务u相关的所有QoS记录的平均值。
定义8综合预测方法。综合预测方法的计算公式为:,其中,表示基于用户的预测结果,计算公式为表示目标用户u的相似邻居集合,表示用户u1调用服务s的QoS,表示用户u与u1的相似度),表示基于服务的预测结果,计算公式为其中表示目标服务s的相似邻居集合,表示用户u调用服务s1的QoS,表示服务s与服务s1的相似度,()分别表示基于用户预测结果和基于服务预测结果的权重,计算公式为:分别为调节基于用户和基于服务预测结果权重的固定因子,计算公式为:为调节基于用户和基于服务预测结果权重的可变因子,可根据实际情况指定。
有益效果:本发明通过考虑用户和服务的自身特性将用户和服务分类,并且根据目标用户和目标服务所属分类的不同使用不同的预测方法计算其QoS预测值,并利用改进的欧氏距离方法计算用户和服务的相似度,解决了传统相似度计算方法可能存在的对相似度值评估过高的问题,同时通过引入平衡因子整合了相似用户对相同服务QoS的预测结果和相同用户对相似服务QoS的预测结果。与传统方法相比,本发明具有较高的Web服务QoS的预测精度,尤其在历史QoS数据稀疏情况下,其预测精度相比现有方法有明显提高。
附图说明
图1本发明的主要流程图。
具体实施方式
如图1所示,本发明一种基于混合协同过滤的Web服务QoS预测方法包括以下步骤:
步骤(1)获取用户调用Web服务QoS历史记录信息,并将所获取的初始QoS矩阵正规化,具体计算公式为:,其中,表示用户u调用服务s的QoS,表示与用户u相关的所有QoS记录的平均值,表示用户u调用服务所得QoS数据的标准偏差;
步骤(2)根据用户和服务的相关信息,将用户分为“普通用户类”和“特殊用户类”,将服务分为“普通服务类”、“特殊服务类”和“区域敏感服务类”;根据定义1确定“特殊用户类”,根据定义2确定“特殊服务类”,根据定义3和定义4确定“区域敏感服务类”,未被划分入以上任意类的用户和服务分别组成“普通用户类”和“普通服务类”;
步骤(3)目标用户属于“特殊用户类”,而目标服务不属于“特殊服务类”,则使用UMEAN方法计算预测值,即将目标用户调用过的QoS记录的均值作为预测值;
步骤(4)目标服务属于“特殊服务类”,而目标用户不属于“特殊用户类”,则使用IMEAN方法计算预测值,即将目标服务被调用的QoS记录的均值作为预测值;
步骤(5)目标服务属于“特殊服务类”,且目标用户属于“特殊用户类”,则将使用UMEAN方法和IMEAN方法获得的预测值的均值作为最终的预测值;
步骤(6)目标服务对于目标用户所属区域敏感,根据定义5,将目标用户所属区域对目标服务的中心作为最终的预测值;
步骤(7)目标用户和目标服务分别属于“普通用户类”和“普通服务类”,根据定义6和定义7,使用改进欧氏距离计算用户间和服务间的相似度,使用Top-K算法选择目标用户和目标服务的相似邻居,最后根据定义8使用综合预测方法计算最终的预测值。
定义1特殊用户类。用户QoS均值最大的个用户组成“特殊用户类”。其中,用户QoS均值是指与该用户相关的所有QoS记录的平均值,是控制特殊用户类中用户个数的阈值,可根据实际情况指定。
定义2特殊服务类。服务QoS均值最大的个服务组成“特殊服务类”。其中,服务QoS均值是指与该服务相关的所有QoS记录的平均值,是控制特殊服务类中服务个数的阈值,可根据实际情况指定。
定义3用户区域。将用户按照所在物理位置的不同分成f类,用户表示属于第i个区域的用户的集合,用表示用户区域的集合,即
定义4区域敏感服务。若服务s满足,则称服务s对区域敏感。其中,表示一个名为的服务;为控制区域敏感服务的阈值,可根据实际情况指定;表示区域中用户调用服务s所得QoS记录的集合的中值,简称区域的中值;表示用户区域集合中各个区域中值所组成的集合的中值;表示用户区域集合中各个区域中值与的差的绝对值所组成的集合的中值,计算公式为
定义5区域中心。区域对服务s的中心是指:区域中所有用户调用服务s所得QoS集合的中值,计算公式为:
定义6用户相似度。本发明中,用户u1和u2的相似度使用改进欧式距离计算,具体公式为:,其中,表示用户u1和u2共同调用过的服务集合,表示用户u1和用户u2共同调用服务的个数,表示服务s被用户调用所得QoS数据的标准偏差,计算公式为:表示调用服务s的用户集合,表示调用服务s的用户的个数,表示用户ui调用服务s的QoS值,表示与服务s相关的所有QoS记录的平均值。
定义7服务相似度。本发明中,服务s1和s2的相似度使用改进欧式距离计算,具体公式为:,其中,表示共同调用服务s1和s2的用户集合,表示共同调用服务s1和s2的用户的个数,表示表示用户u调用服务所得QoS数据的标准偏差,计算公式为:表示用户u调用的服务集合,表示用户u调用服务的个数,表示用户u调用服务s的QoS值,表示与服务u相关的所有QoS记录的平均值。
定义8综合预测方法。综合预测方法的计算公式为:,其中,表示基于用户的预测结果,计算公式为表示目标用户u的相似邻居集合,表示用户u1调用服务s的QoS,表示用户u与u1的相似度),表示基于服务的预测结果,计算公式为其中表示目标服务s的相似邻居集合,表示用户u调用服务s1的QoS,表示服务s与服务s1的相似度,()分别表示基于用户预测结果和基于服务预测结果的权重,计算公式为:分别为调节基于用户和基于服务预测结果权重的固定因子,计算公式为:为调节基于用户和基于服务预测结果权重的可变因子,可根据实际情况指定。

Claims (1)

1.一种基于混合协同过滤的Web服务QoS预测方法,
定义1特殊用户类;用户QoS均值最大的Nu个用户组成特殊用户类;其中,用户QoS均值是指与该用户相关的所有QoS记录的平均值,Nu是控制特殊用户类中用户个数的阈值,根据实际情况指定;
定义2特殊服务类;服务QoS均值最大的Ns个服务组成特殊服务类;其中,服务QoS均值是指与该服务相关的所有QoS记录的平均值,Ns是控制特殊服务类中服务个数的阈值,根据实际情况指定;
定义3用户区域;将用户按照所在物理位置的不同分成f类,用户URi表示属于第i个区域的用户的集合,用UR表示用户区域的集合,即UR={UR1,UR2,...,URf};
定义4区域敏感服务;若服务s满足s∈{sj||median(URi,sj)-median(UR,sj)|≥λ×MMAD(UR,sj)},则称服务s对区域URi敏感;其中,sj表示一个名为sj的服务;λ为控制区域敏感服务的阈值,根据实际情况指定;median(URi,s)表示区域URi中用户调用服务s所得QoS记录的集合的中值,简称区域URi的中值;median(UR,s)表示用户区域集合UR中各个区域中值所组成的集合的中值;MMAD(UR,s)表示用户区域集合UR中各个区域中值与median(UR,s)的差的绝对值所组成的集合的中值,计算公式为MMAD(UR,s)=median(|median(URi,s)-median(UR,s)|),i=1,2,...,f,median(UR,sj)表示区域UR中用户调用服务sj所得QoS记录的集合的中值;
定义5区域中心;区域URi对服务s的中心是指:区域URi中所有用户调用服务s所得QoS集合的中值,计算公式为:
定义6用户相似度;用户u1和u2的相似度使用改进欧式距离计算,具体公式为:其中,S表示用户u1和u2共同调用过的服务集合,|S|表示用户u1和用户u2共同调用服务的个数,ds表示服务s被用户调用所得QoS数据的标准偏差,计算公式为:Us表示调用服务s的用户集合,|Us|表示调用服务s的用户的个数,表示用户ui调用服务s的QoS值,表示与服务s相关的所有QoS记录的平均值,ru,s表示用户u调用服务s的QoS值;
定义7服务相似度;服务s1和s2的相似度使用改进欧式距离计算,具体公式为:其中,U表示共同调用服务s1和s2的用户集合,|U|表示共同调用服务s1和s2的用户的个数,du表示用户u调用服务所得QoS数据的标准偏差,计算公式为:Su表示用户u调用的服务集合,|Su|表示用户u调用服务的个数,ru,s表示用户u调用服务s的QoS值,表示与服务u相关的所有QoS记录的平均值;
定义8综合预测方法;综合预测方法的计算公式为:P(ru,s)=wu*Pu+ws*Ps,其中,Pu表示基于用户的预测结果,计算公式为Lu表示目标用户u的相似邻居集合,表示用户u1调用服务s的QoS,表示用户u与u1的相似度,Ps表示基于服务的预测结果,计算公式为其中Ls表示目标服务s的相似邻居集合,表示用户u调用服务s1的QoS,表示服务s与服务s1的相似度,wu和ws分别表示基于用户预测结果和基于服务预测结果的权重,wu+ws=1,计算公式为:conu和cons分别为调节基于用户和基于服务预测结果权重的固定因子,计算公式为:w为调节基于用户和基于服务预测结果权重的可变因子,根据实际情况指定;
其特征在于该方法包括以下步骤:
步骤(1)获取用户调用Web服务QoS历史记录信息,并将所获取的初始QoS矩阵正规化,具体计算公式为:其中,ru,s表示用户u调用服务s的QoS,表示与用户u相关的所有QoS记录的平均值,σu表示用户u调用服务所得QoS数据的标准偏差,r′u,s表示将所获取的初始QoS矩阵正规化得到的值;
步骤(2)根据用户和服务的相关信息,将用户分为普通用户类和特殊用户类,将服务分为普通服务类、特殊服务类和区域敏感服务类;根据定义1确定特殊用户类,根据定义2确定特殊服务类,根据定义3和定义4确定区域敏感服务类,未被划分入特殊用户类、特殊服务类、区域敏感服务类的用户和服务分别组成普通用户类和普通服务类;
步骤(3)目标用户属于特殊用户类,而目标服务不属于特殊服务类,则使用UMEAN方法计算预测值,即将目标用户调用过的QoS记录的均值作为预测值;
步骤(4)目标服务属于特殊服务类,而目标用户不属于特殊用户类,则使用IMEAN方法计算预测值,即将目标服务被调用的QoS记录的均值作为预测值;
步骤(5)目标服务属于特殊服务类,且目标用户属于特殊用户类,则将使用UMEAN方法和IMEAN方法获得的预测值的均值作为最终的预测值;
步骤(6)目标服务对于目标用户所属区域敏感,根据定义5,将目标用户所属区域对目标服务的中心作为最终的预测值;
步骤(7)目标用户和目标服务分别属于普通用户类和普通服务类,根据定义6和定义7,使用改进欧氏距离计算用户间和服务间的相似度,使用Top-K算法选择目标用户和目标服务的相似邻居,最后根据定义8使用综合预测方法计算最终的预测值。
CN201310070867.XA 2013-03-06 2013-03-06 一种基于混合协同过滤的Web服务QoS预测方法 Active CN103139310B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310070867.XA CN103139310B (zh) 2013-03-06 2013-03-06 一种基于混合协同过滤的Web服务QoS预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310070867.XA CN103139310B (zh) 2013-03-06 2013-03-06 一种基于混合协同过滤的Web服务QoS预测方法

Publications (2)

Publication Number Publication Date
CN103139310A CN103139310A (zh) 2013-06-05
CN103139310B true CN103139310B (zh) 2016-04-27

Family

ID=48498607

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310070867.XA Active CN103139310B (zh) 2013-03-06 2013-03-06 一种基于混合协同过滤的Web服务QoS预测方法

Country Status (1)

Country Link
CN (1) CN103139310B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104601385A (zh) * 2013-10-31 2015-05-06 浙江大学 基于地理位置的WebService服务质量预测方法
CN103684850B (zh) * 2013-11-25 2017-02-22 浙江大学 基于服务邻域的Web Service服务质量预测方法
CN103840985A (zh) * 2014-02-28 2014-06-04 浙江大学 基于用户邻域的Web Service服务质量预测方法及装置
CN104753718B (zh) * 2015-02-25 2018-02-13 重庆大学 基于非负聚合的缺失服务吞吐率补足方法和装置
US9872188B2 (en) * 2015-07-28 2018-01-16 Futurewei Technologies, Inc. Adaptive filtering based network anomaly detection
CN105430099B (zh) * 2015-12-22 2018-09-28 湖南科技大学 一种基于位置聚类的协同式Web服务性能预测方法
CN106055665B (zh) * 2016-06-02 2020-03-17 兰州大学 基于异常值剔除的情境感知Web服务推荐方法和系统
CN107133268B (zh) * 2017-04-01 2020-03-31 南京邮电大学 一种用于Web服务推荐的协同过滤方法
CN107480250B (zh) * 2017-08-11 2018-09-21 安徽大学 一种基于Spark平台Web服务个性化推荐方法及系统
CN108563660B (zh) * 2017-12-29 2022-02-01 温州大学 服务推荐方法、系统及服务器
CN110232151B (zh) * 2019-05-22 2022-07-15 温州大学 一种混合概率分布检测的QoS预测模型的构建方法
CN112328912B (zh) * 2020-11-03 2023-05-19 重庆大学 一种利用地点感知的QoS预测方法
CN117560400A (zh) * 2021-09-29 2024-02-13 兴容(上海)信息技术股份有限公司 一种服务提供的优化方法和系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102882657A (zh) * 2011-07-15 2013-01-16 瑞典爱立信有限公司 用于上行链路秩自适应的方法、设备和系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060101116A1 (en) * 2004-10-28 2006-05-11 Danny Rittman Multifunctional telephone, walkie talkie, instant messenger, video-phone computer, based on WiFi (Wireless Fidelity) and WiMax technology, for establishing global wireless communication, network and video conferencing via the internet
US20120158631A1 (en) * 2010-12-15 2012-06-21 Scientific Conservation, Inc. Analyzing inputs to an artificial neural network

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102882657A (zh) * 2011-07-15 2013-01-16 瑞典爱立信有限公司 用于上行链路秩自适应的方法、设备和系统

Also Published As

Publication number Publication date
CN103139310A (zh) 2013-06-05

Similar Documents

Publication Publication Date Title
CN103139310B (zh) 一种基于混合协同过滤的Web服务QoS预测方法
CN103617547B (zh) 一种业务推荐方法及系统
Tian Optimal policy for attracting FDI: Investment cost subsidy versus tax rate reduction
WO2018090545A1 (zh) 融合时间因素的协同过滤方法、装置、服务器和存储介质
CN104573048A (zh) 一种基于智能手机流量数据的用户基础属性预测方法
US20130218876A1 (en) Method and apparatus for enhancing context intelligence in random index based system
CN105095909A (zh) 一种应用于移动网络的用户相似性评估方法及装置
CN103336433A (zh) 基于反步法的混合自适应预测控制系统及其预测控制方法
CN108989092A (zh) 一种无线网络预测方法、电子设备及存储介质
CN114143326A (zh) 负载调节方法、管理节点以及存储介质
CN109769210A (zh) 用户活动区域相似度判断方法、装置、计算机设备
CN114266473A (zh) 一种基于数据分析的供应链需求预测系统及方法
Chen et al. Lifetime performance evaluation and analysis model of passive component capacitor products
US10031534B1 (en) Providing set point comparison
CN110659930A (zh) 基于用户行为的消费提质方法、装置、存储介质及设备
Gao et al. Workload prediction of cloud workflow based on graph neural network
Zhu et al. FMSR: A fairness-aware mobile service recommendation method
CN107563402A (zh) 一种社交关系推断方法及系统
Lok et al. A new statistical depth function with applications to multimodal data
CN105975564B (zh) 基于相对熵相似度的知识推荐方法
US20200320544A1 (en) Intelligent toe cap
Liu et al. Characterizing and forecasting urban vibrancy evolution: A multi-view graph mining perspective
CN109685101B (zh) 一种多维数据自适应采集方法及系统
CN112749343A (zh) 资源推荐方法、装置及计算机存储介质
CN106055665A (zh) 基于异常值剔除的情境感知Web服务推荐方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant