CN104615683A - 一种具有高可扩展性的时间及位置感知的协同过滤技术 - Google Patents

一种具有高可扩展性的时间及位置感知的协同过滤技术 Download PDF

Info

Publication number
CN104615683A
CN104615683A CN201510031278.XA CN201510031278A CN104615683A CN 104615683 A CN104615683 A CN 104615683A CN 201510031278 A CN201510031278 A CN 201510031278A CN 104615683 A CN104615683 A CN 104615683A
Authority
CN
China
Prior art keywords
user
web service
time
sim
similar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510031278.XA
Other languages
English (en)
Inventor
黄林鹏
于程远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN201510031278.XA priority Critical patent/CN104615683A/zh
Publication of CN104615683A publication Critical patent/CN104615683A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种具有高可扩展性的时间及位置感知的协同过滤技术,通过利用用户及Web服务的IP地址所属的AS(An autonomous system)对用户及Web服务进行分类;在寻找类似用户和类似Web服务的时候只在与活动用户和目标Web服务处于同一个AS中的用户和Web服务中寻找。然后利用这些用户及Web服务来进行预测,提高了算法的可扩展性和预测精确度。

Description

一种具有高可扩展性的时间及位置感知的协同过滤技术
技术领域
本发明涉及一种计算机应用技术领域的方法,具体是一种具有高可扩展性的时间及位置感知的协同过滤技术及系统。
背景技术
随着Web服务以及互联网技术的迅猛发展,越来越多具有相似功能的Web服务出现在网络中。这种现象一方面给了用户更多的选择,另一方面用户不得不花费大量的时间以及精力来寻找真正满足自己需求的Web服务。就算找到了满足用户功能需求的Web服务,但是该Web服务的非功能属性(QoS属性)也不一定满足,即便是Web提供者声明的非功能属性(QoS属性)满足用户需求,该用户感受到的Web服务的QoS属性值很可能与Web服务提供者声明的QoS属性值不同。用户直接去调用Web服务观察到的QoS属性才是最正确的,但是该方法却完全行不同。由于网络中具有相同或类似的功能的Web服务实在太多,导致用户完全没有足够的时间和精力一个一个去尝试,即使有足够的时间或者精力也不一定能承受如此昂贵的花费。因此,如何从大量的具有相同或者类似功能的Web服务中选出真正满足用户需求的Web服务变得越来越重要。
协同过滤技术的出现为上述问题提供了一个良好的技术途径。协同过滤技术利用一个N×M用户-Web服务矩阵Mu,s记录用户调用Web服务时观察到的该Web服务的QoS属性值。其中N代表该Web服务推荐系统中已经注册的用户数量,M代表该Web服务推荐系统中已经注册的Web服务数量。矩阵中的项表示编号为ui的用户调用过编号为sj的Web服务,并且用户ui观察到的Web服务sj的QoS属性值记录在项中。假如则表示用户ui没有调用过Web服务sj。协同过滤技术通过找到和活动用户类似的用户,然后根据类似用户观察到的目标Web服务的QoS属性值来预测活动用户观察到的目标Web服务的QoS属性值。这样的预测值往往非常接近活动用户实际观察到的QoS属性值。协同过滤技术可以分成两大类:基于内存的协同过滤技术和基于模型的协同过滤技术。基于内存的协同过滤技术的特点是容易实现且预测精确度较高,但是可扩展性差。而基于模型的协同过滤技术的特点是具有较好的可扩展性,但是该类技术的预测准确度较低。
由于Web服务以及互联网技术的迅猛发展,导致用户数量及Web服务的数量极其膨大,最终导致基于内存的协同过滤技术预测QoS属性值所需的时间和资源都超过了能容忍的地步。而基于模型的协同过滤技术的预测质量又较差。因此,现有的协同过滤技术很难既保证预测质量有保证预测速度。
发明内容
本发明的目的在于克服现有技术中存在的不足,提供一种既能保证预测质量又能保证预测速度的协同过滤技术以及基于该技术的Web服务推荐系统,通过利用用户及Web服务的IP地址所属的AS(An autonomous system)对用户及Web服务进行分类,由于QoS中的性能属性,例如反应时间,吞吐量与用户与Web服务之间的网络距离相关。因此,在寻找类似用户和类似Web服务的时候只在与活动用户和目标Web服务处于同一个AS中的用户和Web服务寻找。然后利用这些用户及Web服务来进行预测,不仅仅能提高算法的可扩展性,还能提高预测精确度。
本发明的目的通过以下技术方案来实现:一种具有高可扩展性的时间及位置感知的协同过滤技术,包括以下步骤:
步骤一,根据用户及Web服务的IP地址对用户及Web服务进行分类,得到用户群及Web服务群,利用用户-Web服务-时间张量记录QoS值;
其中,所述用户群,是指IP地址属于同一个AS的用户构成的集合;所述Web服务群,是指IP地址属于同一个AS的Web服务构成的集合;所述用户-Web服务-时间张量,是指张量的项用于记录用户ui在时间tk上观察到的Web服务sj的QoS属性值。
步骤二,计算所有和目标Web服务处于同一个AS的Web服务与目标Web服务之间的平均类似度,然后选择k个平均类似度最高的Web服务形成topK类似Web服务集合;
其中,所述目标Web服务,是指需要被预测QoS属性值的那个Web服务;所述所有和目标Web服务处于同一个AS的Web服务,是指Web服务的IP地址和目标Web服务的IP地址属于同一个AS的所有Web服务构成的集合,其中目标Web服务也属于该集合;所述topK类似Web服务集合N′(s),是指与目标Web服务类似度最高的K个Web服务所组成的集合。
所述平均类似度的计算公式如下
sim t k 1 ( s j 1 , s j 2 ) = Σ t k ∈ t D sim ( s j 1 , t k , s j 2 , t k ) | t D | 其中表示web服务在时间tk上的类似度。tD是时间区间集合。
步骤三,计算所有和活动用户处于同一个AS的用户与活动用户之间的平均类似度,然后选择k个平均类似度最高的用户形成topK类似用户集合;
其中,所述活动用户,是指需要使用某个Web服务的用户;所述所有和活动用户处于同一个AS的用户,是指用户的IP地址和活动用户的IP地址属于同一个AS的所有用户构成的集合,其中活动用户也属于该集合;所述topK类似用户集合N′(u),是指与活动用户类似度最高的K个用户所组成的集合。
所述平均类似度的计算公式如下:
sim t k 1 ( u i 1 , u i 2 ) = Σ t k ∈ t D sim ( u i 1 , t k , u i 2 , t k ) | t D | 其中表示用户在时间tk上的类似度。tD是时间区间集合。
步骤四,分别利用基于用户的协调过滤算法(user-based CF algorithm)和基于项目的协调过滤算法(item-based CF algorithm)来预测QoS属性值,然后将这两个值加权平均,既得到本发明最终的预测值。
其中,所述利用基于用户的协调过滤算法预测的QoS属性值,是指根据步骤三寻找到的topK类似用户集合利用基于用户的协调过滤算法的预测公式计算获得的QoS属性值;所述利用基于项目的协调过滤算法预测的QoS属性值,是指根据步骤二寻找到的topK类似Web服务集合利用基于项目的协调过滤算法的预测公式计算获得的QoS属性值;所述加权平均,是指利用基于用户的协调过滤算法获得的QoS属性值乘上权重infu再加上利用基于项目的协调过滤算法预测的QoS属性值与权重infs的乘积。
所述权重infu的计算公式如下:
inf u = Σ u i ∈ N ′ ( u ) sim t k 1 ( u i 1 , u i 2 ) Σ u i ∈ N ′ ( u ) sim t k 1 ( u i 1 , u i 2 ) + Σ s j ∈ N ′ ( s ) sim t k 1 ( s j 1 , s j 2 ) , 其中指利用步骤三中的公式计算出的两个用户之间的平均类似度,指利用步骤二中的公式计算出的两个web服务之间的平均类似度。
所述权重infs的计算公式如下:
inf s = Σ u i ∈ N ′ ( u ) sim t k 1 ( s j 1 , s j 2 ) Σ u i ∈ N ′ ( u ) sim t k 1 ( u i 1 , u i 2 ) + Σ s j ∈ N ′ ( s ) sim t k 1 ( s j 1 , s j 2 ) 其中指利用步骤三中的公式计算出的两个用户之间的平均类似度,指利用步骤二中的公式计算出的两个web服务之间的平均类似度。
本发明具有以下有益效果:
寻找类似的用户(Web服务)只在活动用户(目标Web服务)所在的用户群(Web服务群)中寻找,而不需要计算系统中的每一个用户(Web服务)与活动用户(目标Web服务)的类似度,计算量小,可扩展性高;预测QoS属性值时引入了时间的概念以及网络距离的概念,大幅度提高了预测精确度。
附图说明
图1为本发明实施例中进行QoS属性值预测的流程示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
如图1所示,本发明实施例提供了一种具有高可扩展性的时间及位置感知的协同过滤技术,包括以下步骤:
步骤一,计算所有和目标Web服务处于同一个AS的Web服务与目标Web服务之间的平均类似度,然后选择k个平均类似度最高的Web服务形成topK类似Web服务集合;
所述目标Web服务,是指需要被预测QoS属性值的那个Web服务。
所述所有和目标Web服务处于同一个AS的Web服务,是指Web服务的IP地址和目标Web服务的IP地址属于同一个AS的所有Web服务构成的集合,其中目标Web服务也属于该集合。
所述平均类似度,是指利用公式计算出来的值。
所述topK类似Web服务集合,是指与目标Web服务类似度最高的K个Web服务所组成的集合。
步骤二,计算所有和活动用户处于同一个AS的用户与活动用户之间的平均类似度,然后选择k个平均类似度最高的用户形成topK类似用户集合;
所述活动用户,是指需要使用某个Web服务的用户。
所述所有和活动用户处于同一个AS的用户,是指用户的IP地址和活动用户的IP地址属于同一个AS的所有用户构成的集合,其中活动用户也属于该集合。
所述平均类似度,是指利用公式计算出来的值。
所述topK类似用户集合,是指与活动用户类似度最高的K个用户所组成的集合。
步骤三,利用基于用户的协调过滤算法(user-based CF algorithm)来预测QoS属性值;
所述利用基于用户的协调过滤算法预测的QoS属性值,是指根据步骤二寻找到的topK类似用户集合利用基于用户的协调过滤算法的预测公式计算获得的QoS属性值。
步骤四,利用基于项目的协调过滤算法(item-based CF algorithm)来预测QoS属性值;
所述利用基于项目的协调过滤算法预测的QoS属性值,是指根据步骤一寻找到的topK类似Web服务集合利用基于项目的协调过滤算法的预测公式计算获得的QoS属性值。
步骤五,将步骤三和步骤四获得的两个值加权平均,既得到本发明最终的预测值。
所述加权平均,是指利用基于用户的协调过滤算法获得的QoS属性值乘上权重infu再加上利用基于项目的协调过滤算法预测的QoS属性值与权重infs的乘积。
所述权重infu,是指利用公式 inf u = Σ u i ∈ N ′ ( u ) sim t k 1 ( u i 1 , u i 2 ) Σ u i ∈ N ′ ( u ) sim t k 1 ( u i 1 , u i 2 ) + Σ s j ∈ N ′ ( s ) sim t k 1 ( s j 1 , s j 2 ) 计算出来的结果。
所述权重infs,是指利用公式 inf s = Σ u i ∈ N ′ ( u ) sim t k 1 ( s j 1 , s j 2 ) Σ u i ∈ N ′ ( u ) sim t k 1 ( u i 1 , u i 2 ) + Σ s j ∈ N ′ ( s ) sim t k 1 ( s j 1 , s j 2 ) 计算出来的结果。
本具体实施寻找类似的用户(Web服务)只在活动用户(目标Web服务)所在的用户群(Web服务群)中寻找,而不需要计算系统中的每一个用户(Web服务)与活动用户(目标Web服务)的类似度,计算量小;本发明预测QoS属性值引入了时间的概念以及网络距离的概念,由于Web服务的QoS属性中包含性能属性;性能属性包括反应时间及吞吐量等;而性能属性与用户和Web服务的网络距离有关系;同时,性能属性又与Web服务的状态有关,而Web服务的状态又与时间相关,从而大幅度提高了预测精确度。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。

Claims (9)

1.一种具有高可扩展性的时间及位置感知的协同过滤技术,其特征在于,包括以下步骤:
步骤一,根据用户及Web服务的IP地址对用户及Web服务进行分类,得到用户群及Web服务群,利用用户-Web服务-时间张量记录QoS值;
步骤二,计算所有和目标Web服务处于同一个AS的Web服务与目标Web服务之间的平均类似度,然后选择k个平均类似度最高的Web服务形成topK类似Web服务集合;
步骤三,计算所有和活动用户处于同一个AS的用户与活动用户之间的平均类似度,然后选择k个平均类似度最高的用户形成topK类似用户集合;
步骤四,分别利用基于用户的协调过滤算法和基于项目的协调过滤算法来预测QoS属性值,然后将这两个值加权平均,既得到最终的预测值。
2.根据权利要求1所述的一种具有高可扩展性的时间及位置感知的协同过滤技术,其特征在于,所述步骤一中用户-Web服务-时间张量是指张量的项用于记录用户ui在时间tk上观察到的Web服务Sj的QoS属性值。
3.根据权利要求1所述的一种具有高可扩展性的时间及位置感知的协同过滤技术,其特征在于,所述步骤二中Web服务之间的平均类似度的计算公式如下:
sim t k 1 ( s j 1 , s j 2 ) = Σ t k ∈ t D sim ( s j 1 , t k , s j 2 , t k ) | t D | , 其中表示web服务在时间tk上的类似度。tD是时间区间集合。
4.根据权利要求1所述的一种具有高可扩展性的时间及位置感知的协同过滤技术,其特征在于,所述步骤三中用户之间的平均类似度的计算公式如下:
sim t k 1 ( u i 1 , u i 2 ) = Σ t k ∈ t D sim ( u i 1 , t k , u i 2 , t k ) | t D | , 其中表示用户在时间tk上的类似度。tD是时间区间集合。
5.根据权利要求1所述的一种具有高可扩展性的时间及位置感知的协同过滤技术,其特征在于,所述步骤四中利用基于用户的协调过滤算法预测的QoS属性值是指根据步骤三寻找到的topK类似用户集合N′(u)利用基于用户的协调过滤算法的预测公式计算获得的QoS属性值。
6.根据权利要求1所述的一种具有高可扩展性的时间及位置感知的协同过滤技术,其特征在于,所述步骤四中利用基于项目的协调过滤算法预测的QoS属性值是指根据步骤二寻找到的topK类似Web服务集合N′(s)利用基于项目的协调过滤算法的预测公式计算获得的QoS属性值。
7.根据权利要求1所述的一种具有高可扩展性的时间及位置感知的协同过滤技术,其特征在于,所述步骤四中的加权平均是指利用基于用户的协调过滤算法获得的QoS属性值乘上权重infu再加上利用基于项目的协调过滤算法预测的QoS属性值与权重infs的乘积。
8.根据权利要求7所述的一种具有高可扩展性的时间及位置感知的协同过滤技术,其特征在于,所述权重infu,的计算公式如下:
inf u = Σ u i ∈ N ′ ( u ) sim t k 1 ( u j 1 , u j 2 ) Σ u i ∈ N ′ ( u ) sim t k 1 ( u i 1 , u i 2 ) + Σ s j ∈ N ′ ( s ) sim t k 1 ( s j 1 , s j 2 ) , 其中N′(u)是指权利要求5中的topK类似用户集合,N′(s)是指权利要求6中的topK类似Web服务集合。
9.根据权利要求7所述的一种具有高可扩展性的时间及位置感知的协同过滤技术,其特征在于,所述权重infs的计算公式如下:
inf s = Σ u i ∈ N ′ ( u ) sim t k 1 ( s j 1 , s j 2 ) Σ u i ∈ N ′ ( u ) sim t k 1 ( u i 1 , u i 2 ) + Σ s j ∈ N ′ ( s ) sim t k 1 ( s j 1 , s j 2 ) , 其中N′(u)是指权利要求5中的topK类似用户集合,N′(s)是指权利要求6中的topK类似Web服务集合。
CN201510031278.XA 2015-01-21 2015-01-21 一种具有高可扩展性的时间及位置感知的协同过滤技术 Pending CN104615683A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510031278.XA CN104615683A (zh) 2015-01-21 2015-01-21 一种具有高可扩展性的时间及位置感知的协同过滤技术

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510031278.XA CN104615683A (zh) 2015-01-21 2015-01-21 一种具有高可扩展性的时间及位置感知的协同过滤技术

Publications (1)

Publication Number Publication Date
CN104615683A true CN104615683A (zh) 2015-05-13

Family

ID=53150125

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510031278.XA Pending CN104615683A (zh) 2015-01-21 2015-01-21 一种具有高可扩展性的时间及位置感知的协同过滤技术

Country Status (1)

Country Link
CN (1) CN104615683A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105430099A (zh) * 2015-12-22 2016-03-23 湖南科技大学 一种基于位置聚类的协同式Web服务性能预测方法
CN106095887A (zh) * 2016-06-07 2016-11-09 兰州大学 基于加权时空效应的情境感知Web 服务推荐方法
CN110149406A (zh) * 2019-05-24 2019-08-20 江西农业大学 一种基于群分类的协同过滤Web服务推荐方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7792101B1 (en) * 1999-05-11 2010-09-07 Cisco Technology, Inc. Hardware TOS remapping based on source autonomous system identifier
CN102508870A (zh) * 2011-10-10 2012-06-20 南京大学 一种结合评分数据与标签数据的个性化推荐方法
US20140081997A1 (en) * 2007-11-29 2014-03-20 Cisco Technology, Inc. Socially collaborative filtering
CN103886073A (zh) * 2014-03-24 2014-06-25 河南理工大学 基于协同过滤的煤矿信息推荐系统
CN103927347A (zh) * 2014-04-01 2014-07-16 复旦大学 一种基于用户行为模型和蚁群聚类的协同过滤推荐算法
US20140307544A1 (en) * 2013-04-10 2014-10-16 Cisco Technology, Inc. Methods and devices for providing a self-stretching policer

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7792101B1 (en) * 1999-05-11 2010-09-07 Cisco Technology, Inc. Hardware TOS remapping based on source autonomous system identifier
US20140081997A1 (en) * 2007-11-29 2014-03-20 Cisco Technology, Inc. Socially collaborative filtering
CN102508870A (zh) * 2011-10-10 2012-06-20 南京大学 一种结合评分数据与标签数据的个性化推荐方法
US20140307544A1 (en) * 2013-04-10 2014-10-16 Cisco Technology, Inc. Methods and devices for providing a self-stretching policer
CN103886073A (zh) * 2014-03-24 2014-06-25 河南理工大学 基于协同过滤的煤矿信息推荐系统
CN103927347A (zh) * 2014-04-01 2014-07-16 复旦大学 一种基于用户行为模型和蚁群聚类的协同过滤推荐算法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
姜叶春: "《基于QoS的个性化Web服务推荐方法研究》", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105430099A (zh) * 2015-12-22 2016-03-23 湖南科技大学 一种基于位置聚类的协同式Web服务性能预测方法
CN105430099B (zh) * 2015-12-22 2018-09-28 湖南科技大学 一种基于位置聚类的协同式Web服务性能预测方法
CN106095887A (zh) * 2016-06-07 2016-11-09 兰州大学 基于加权时空效应的情境感知Web 服务推荐方法
CN110149406A (zh) * 2019-05-24 2019-08-20 江西农业大学 一种基于群分类的协同过滤Web服务推荐方法及系统

Similar Documents

Publication Publication Date Title
Ribeiro et al. Sampling directed graphs with random walks
RU2607621C2 (ru) Способ, система и машиночитаемый носитель данных для группирования в социальных сетях
CN105005582B (zh) 多媒体信息的推荐方法及装置
CN109800139A (zh) 服务器健康度分析方法,装置,存储介质及电子设备
CN106952166A (zh) 一种社交平台的用户影响力估算方法及装置
Ngonmang et al. Churn prediction in a real online social network using local community analysis
CN110335123B (zh) 基于社交电商平台的商品推荐方法、系统、计算机可读介质以及装置
Chen et al. Influence maximization on signed social networks with integrated pagerank
Niu et al. Context-aware service ranking in wireless sensor networks
CN108038746A (zh) 基于关键用户和时间上下文的二部图推荐方法
Yang et al. Exploring influence maximization in online and offline double-layer propagation scheme
CN105719164A (zh) 一种推荐付费多媒体资源的方法及装置
CN104615683A (zh) 一种具有高可扩展性的时间及位置感知的协同过滤技术
Huang et al. Using reputation measurement to defend mobile social networks against malicious feedback ratings
Buongiovanni et al. Will you take the knee? italian twitter echo chambers’ genesis during euro 2020
Yadati et al. Game theoretic models for social network analysis
CN105959368B (zh) 一种社交云热点资源预测与部署的方法
Li et al. Annotating semantic tags of locations in location-based social networks
CN104967643A (zh) 一种获取转移数据的方法及装置
Cunningham et al. Assessing network representations for identifying interdisciplinarity
Ma et al. Toward seed-insensitive solutions to local community detection
Fan et al. Context-aware ubiquitous web services recommendation based on user location update
Sun et al. Optimal defense strategy model based on differential game in edge computing
Nguyen et al. Modeling link formation behaviors in dynamic social networks
Meng et al. Comparison of different centrality measures to find influential nodes in complex networks

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination