CN103678618B - 一种基于社交网络平台的Web服务推荐方法 - Google Patents
一种基于社交网络平台的Web服务推荐方法 Download PDFInfo
- Publication number
- CN103678618B CN103678618B CN201310695891.2A CN201310695891A CN103678618B CN 103678618 B CN103678618 B CN 103678618B CN 201310695891 A CN201310695891 A CN 201310695891A CN 103678618 B CN103678618 B CN 103678618B
- Authority
- CN
- China
- Prior art keywords
- user
- service
- class
- interest
- web services
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 19
- 239000011159 matrix material Substances 0.000 claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 15
- 230000009467 reduction Effects 0.000 claims abstract description 6
- 206010008190 Cerebrovascular accident Diseases 0.000 claims description 28
- 208000006011 Stroke Diseases 0.000 claims description 28
- 230000008569 process Effects 0.000 claims description 6
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 230000006698 induction Effects 0.000 claims description 3
- 241000208340 Araliaceae Species 0.000 claims 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims 1
- 235000003140 Panax quinquefolius Nutrition 0.000 claims 1
- 235000008434 ginseng Nutrition 0.000 claims 1
- 230000036961 partial effect Effects 0.000 abstract 1
- 238000001914 filtration Methods 0.000 description 7
- 230000006399 behavior Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000007418 data mining Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000009412 basement excavation Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种基于社交网络平台的Web服务推荐方法,将Web服务分成不同的服务类,在社交网络中获取用户的基本信息,取一部分用户作为训练用户,得到用户感兴趣的服务类,并据此建立用户‑服务类矩阵,然后根据用户‑服务类矩阵对用户进行聚类,得到不同的用户兴趣类,对于社交网络中需要进行Web服务推荐的新用户,根据用户兴趣类进行推荐。本发明首先对Web服务进行主题提取,通过将Web服务映射为Web服务类,实现对用户‑服务矩阵进行降维,然后通过从社交网络中提取用户的基本信息和兴趣标签,充分利用标签信息和语义信息来解决词语同义问题,再结合通过分析已有用户的历史访问记录得到的聚类结果,对新用户进行Web服务推荐。
Description
技术领域
本发明属于计算机技术领域,涉及数据挖掘中的推荐方法,用于向用户自动进行Web服务的推荐,为一种基于社交网络平台的Web服务推荐方法。
背景技术
Web服务通过标准的Web协议提供服务,从而保证不同平台的应用服务可以进行相互操作。随着互联网技术的发展,Web服务的数量增长迅速,在为用户提供多样选择的同时,也带来了信息过载问题。因此,为用户提供高效、精准的Web服务选择和推荐算法,成为目前服务计算领域的热点问题。
在诸多可供选择的功能相同或相似的Web服务中,QoS值(Quality-of-Service)经常用来描述Web服务的非功能性特征,并且通常作为服务推荐的标准。QoS属性分为用户依赖性和非用户依赖性属性,其中一些非用户依赖性的属性(例如价格、流行性、可用性等),可以通过服务提供商或者第三方注册机构获得(例如UDDI)。而对于用户依赖性的QoS属性(例如响应时间、吞吐量等)则与用户的位置和网络状况有非常直接的关系,以此作为用户判断Web服务是否满足预期功能需求的依据。但仅以服务的QoS值作为对用户进行个性化服务推荐的标准有以下不足:1)QoS值反映的只是服务和用户之间的属性关系,并未挖掘出用户的潜在服务需求;2)当用户使用服务的主观意向不明确时,无法使用QoS值进行合适的推荐;3)QoS属性的存在必然要求用户使用某个服务,在增加用户开销的同时也会增加服务提供商的负担。
协同过滤算法是推荐系统中最常用的算法,主要有基于内存的算法和基于模型的算法。基于内存的算法包括基于用户的、基于物品的以及两者的结合。基于用户的协同过滤算法主要通过找到和目标用户兴趣相似度比较高的用户来对目标用户进行物品推荐;基于物品的协同过滤算法主要给目标用户推荐与他们之前喜欢的物品相似的物品。基于模型的协同过滤算法是通过已有的用户数据训练出模型,然后根据模型对新用户进行兴趣预测。
使用协同过滤算法进行Web服务推荐有诸多限制,其中最重要的一点是目前可以使用的大规模的包含用户真实评价的Web服务数据集太少。之前将协同过滤算法应用于Web服务的推荐工作通常都是在电影推荐数据集Movielens上进行。但考虑到Movielens数据集中服务种类的单一性,仅使用该数据集缺乏足够的说服力。
众所周知,目前最热门的社交网络有Facebook,Twitter和LinkedIn等。在社交网络上,用户可以与家人、朋友以及兴趣爱好相同的人建立社会关系。与此同时,大部分的社交网络都提供了“社会网络连接服务(SNCS)”,允许第三方系统或平台开发社会网络应用并可以根据用户设定读取用户社会网络中的相关信息,例如Facebook Platform,GoogleFriend Connect和MySpaceID,因此,所有相互连接的网络系统就构成了一个庞大的社会网络,里面包含了丰富的用户信息,即个人信息和社会关系。
因此,在进行Web服务推荐时,可以使用社交网络的用户信息并充分挖掘用户的潜在需求,对用户做更为合理的服务推荐。同时,我们可以根据已有用户的历史行为分析出所提供服务的关联程度,根据用户的兴趣标签进行相应的服务推荐和预测,不需要用户事先使用过相应的服务。
发明内容
本发明要解决的问题是:1)随着用户和服务的数量增加,Web服务推荐算法需要具有处理高维稀疏矩阵的能力,并且需要在短时间内给出推荐结果;2)现有的绝大多数的推荐系统不能发现词语间的同义问题,会把含义相同或者相近的词语划分为不同的类别,如何在聚类过程中将隐含相同含义的词语划分为一类;3)在协同过滤算法的基础上,如何解决冷启动的问题,即发现一个新用户与聚类结果中不同组用户之间的联系。
本发明的技术方案为:一种基于社交网络平台的Web服务推荐方法,根据Web服务提供商提供的服务基本信息,将Web服务分成不同的服务类,由服务类中各Web服务名称的汇总得到服务类名称;在社交网络中获取用户的基本信息,取一部分用户作为训练用户,并得到训练用户对Web服务的访问记录,提取用户对Web服务的综合评价信息生成用户-服务矩阵,由用户-服务矩阵中综合评价信息超过设定阈值的Web服务得到用户感兴趣的Web服务集合,对应前述服务类再对用户感兴趣的Web服务集合进行分类,得到用户感兴趣的服务类,并据此建立用户-服务类矩阵,实现从服务到服务类的降维;然后根据用户-服务类矩阵对用户进行聚类,得到不同的用户兴趣类,每个用户兴趣类包含四个变量:主变量是该类别对应的若干训练用户,即用户类,变量二是由根据主变量基本信息所得到的该用户类中用户的特征,变量三是该类别中用户感兴趣的服务类,变量四是变量三中用户感兴趣的服务类包含的所有服务;
对于社交网络中需要进行Web服务推荐的新用户,获取新用户基本信息和兴趣标签,使用同义词词典WordNet计算新用户的兴趣标签与各服务类名称的语义相似度,得到与新用户兴趣最相似的服务类Most SC,根据用户兴趣类的变量,将服务类Most SC对应的用户兴趣类加入推荐列表,计算新用户基本信息和推荐列表中各用户兴趣类中用户特征的相似度,得到用户兴趣类排序,并对其中的服务类和服务分别排序,根据排序结果选取其中的前N个Web服务进行推荐。
获取用户兴趣类,具体为:
11)根据Web服务提供商提供的服务基本信息,将Web服务分成不同的服务类SC;
12)首先计算用户U对于服务S的所有属性的综合评价取值R(U,S),然后根据R(U,S)计算用户与服务类之间的关联系数P(U,SC):
上式中,U表示用户,S表示Web服务,Set={Ratt1,Ratt2,…,Rattp}为Web服务的属性值集合,设Set1,Set2∈Set,Set1∪Set2=Set,Set1={Ratt1,Ratt2,…,Rattb}为正比集,Set2={Ratt1,Ratt2,…,Rattc}为反比集,λi和θj分别是Ratti和Rattj两项的权重参数,i=1,2,…,b,j=1,2,…,c,b和c分别为Set1和Set2的集合内元素总数,R(U,S)表示的是用户U对于服务S的所有属性的综合评价取值;
其中,L表示的是服务类SC中包含的所有服务的个数,k∈[1,2,…L],Pk表示用户U访问的属于服务类SC的Web服务占其所有访问的Web服务的比例,Rk用于表示用户U对于服务类SC中第k个服务的综合评价取值,Rmax是Rk的最大值,Rmin是Rk的最小值,m和n分别是Pk s和两项的系数,m取值0.5,n取值1,s是Pk的指数,t是的指数,s和t用于提高区分度,s取值2,t取值1,P(U,SC)表示用户U与服务类SC之间的关联系数;
13)计算服务类与服务类之间的相似度A(SCv,SCw):
SCv表示第v个服务类,SCw表示第w个服务类,N表示训练用户的总数,Uf表示第f个用户,P(Uf,SCv)即是由公式(2)得到的用户Uf与第v个服务类之间的关联系数,P(Uf,SCw)是用户Uf与第w个服务类之间的关联系数;
14)根据服务类之间的相似性划分用户兴趣类:
第一步,从所有服务类中选出与其他各服务类之间相似度之和Ei最大的一个服务类,作为用户兴趣类划分的起始点;
第二步,以Ei递减的顺序遍历其他服务类,找出所有与起所述始点相似度大于阈值λ的服务类,λ=0.5;
第三步,将第二步得到的服务类与作为起始点的服务类划分到一起,将其对应的所有用户划分成一个用户兴趣类,并已经划分的服务类从所有服务类的集合中移除;
返回第一步,对剩余的服务类重复进行第一步至第三步,如此迭代,直至服务类集合为空为止;
15)根据第14)步所得到的用户兴趣类以及各用户基本信息,分析归纳各用户兴趣类中的用户特征,包括性别c1、年龄c2和职业c3等。
作为优选,采用个性化推荐算法对社交网络中的新用户进行Web服务推荐:
21)由社交网站获取新用户标注的兴趣标签和基本信息,使用同义词词典WordNet,根据公式(4)计算出新用户的兴趣标签和各服务类名称的语义相似度sim(M1,M2),M1和M2为兴趣标签和服务类名称对应的码字,M1=(x1x2x3……xd),M2=(y1y2y3……yd),排序后从中选出与用户兴趣最相似的服务类Most_SC;
其中xq,yq分别表示兴趣标签和服务类名称的码字中第q位的分量,经过对关键词的映射变为1或0,关键词采用服务类名称,兴趣标签如果与服务类名称为同义词,那么对应的码字分量就定义为1,否则定义为0;
22)找出包含服务类Most_SC的用户兴趣类,加入推荐列表中;
23)计算新用户基本信息和推荐列表中所有用户兴趣类中用户特征的相似度,并且从大到小排序,具体过程为:
a)在推荐列表中,所有用户兴趣类对应的权重初始值都为0;
b)从推荐列表起始开始遍历,当用户兴趣类的用户特征性别c1、年龄c2和职业c3分别和新用户的基本信息的对应项内容相符时,权重分别增加w1、w2、w3,如果不相符,则仍然为0;根据公式(5)计算出相似度的取值;
UPAa表示用户兴趣类a用户特征信息,UPAnew表示新用户特征基本信息,w1、w2、w3表示用户兴趣类a在用户性别c1、年龄c2和职业c3三种特征上与新用户对应项的权重增加情况;
c)将推荐列表中的用户兴趣类按照相似度从大到小顺序排序;
24)找出排序后的推荐列表中优先级最高的前三个用户兴趣类,再选择每个兴趣类的前N个Web服务推荐给新用户,前N个服务选择方式为:选择用户兴趣类中的前e个服务类,每个服务类中取前g个服务,N=e*g,用户兴趣类中服务类的排序顺序根据公式(6)计算,每个服务类中Web服务的排序根据公式(7)计算:
P(Uy,SC)为通过公式(2)得到的第y个用户的P(U,SC),Uy表示第y个用户,SC表示的是服务类,Q(SC)表示的是服务类SC质量,
R(Uz,S)为通过公式(1)得到的第z个用户的R(U,S),Uz表示第z个用户,S表示的是服务,Q(S)表示的是服务S的质量。
本发明首先对Web服务进行主题提取,即根据Web服务提供商提供的服务基本信息进行类别划分,通过将Web服务映射为Web服务类,实现对用户-服务矩阵进行降维,将高维矩阵转化为低维矩阵进行处理。然后通过从社交网络中提取用户的基本信息和兴趣标签,充分利用标签信息和语义信息来解决词语同义问题,再结合通过分析已有用户的历史访问记录得到的聚类结果,对新用户进行Web服务推荐。
本发明通过采用以上技术方案,具有以下优点:
1、根据用户对于服务的反馈信息,将用户对于服务的关系转换为用户对于服务类的关系,这样会大大降低用户矩阵的维度。
2、充分利用用户和服务的标签信息,标签信息表示的是语义的理解,采用标签信息得到的人工分类结果要优于无监督聚类效果。
3、对用户兴趣进行挖掘的时候,考虑的是用户的多方面兴趣,而不是用户与某一类别之间确定的属于或者不属于的关系,数据挖掘更全面,对用户的适应度更高。
附图说明
图1为本发明Web服务推荐方法总体流程图。
图2为本发明用户与服务之间的关系示意图。
图3为本发明用户与服务类之间的关联度示意图。
图4为本发明的聚类算法流程图。
图5为本发明的个性化推荐算法流程图。
具体实施方式
本发明提供一种基于社交网络平台的Web服务推荐方法,用于将现有的Web服务推荐方法与社交网络中的用户信息和社会关系相结合,对用户的兴趣进行深层次的挖掘,从而对用户进行个性化的Web服务推荐。本发明设计了提取用户兴趣的聚类算法和结合用户基本信息的个性化推荐算法两部分:聚类算法用于分析用户对于Web服务的历史访问行为,根据兴趣相似程度将用户划分到不同的类别中,考虑到用户可具有多个兴趣,同一用户可以属于不同的类;个性化推荐算法用于将社交网络中用户的基本信息和兴趣标签应用到Web服务推荐中,结合聚类算法得到的用户兴趣类,从性别、年龄、职业和兴趣等多方面对用户进行服务推荐。
本发明的实施过程如图1所示:在社交网络中,取一部分用户作为训练用户,并得到训练用户对Web服务的访问记录;根据训练用户对Web服务的访问记录,提取用户对Web服务的综合评价信息生成用户-服务矩阵,矩阵的元素为各用户对各Web服务的综合评价信息,用户与Web服务之间的关系如图2所示;根据Web服务提供商提供的服务基本信息,将Web服务分成不同的服务类,服务类中有多个服务,每个服务都有自己的名称,将其整理汇总,可得到服务类名称列表;根据用户-服务矩阵,得到用户感兴趣的服务集合,用户感兴趣的服务集合是指用户综合评价信息较高的服务的集合,由用户-服务矩阵中各服务对应的综合评价信息总值来划分确定,这个集合中的Web服务是属于各服务类的,由此得到为用户-服务类矩阵,如图3所示,实现从服务到服务类的降维;然后根据用户-服务类矩阵对用户进行聚类,得到不同的用户兴趣类,每个用户兴趣类包含四个变量:主变量是该类别对应的若干训练用户,即用户类,变量二是由根据主变量基本信息所得到的该用户类中用户的特征,变量三是该类别中用户感兴趣的服务类,变量四是变量三中用户感兴趣的服务类包含的所有服务。每一个用户兴趣类对应若干训练用户,同时每一个用户也可能对应属于多个用户兴趣类,由所述若干训练用户的基本信息得到该用户兴趣类的用户特征;对于需要进行Web服务推荐的新用户,获取新用户基本信息和兴趣标签,使用同义词词典WordNet计算新用户的兴趣标签与各服务类名称的语义相似度,得到与新用户兴趣最相似的服务类Most SC,将服务类Most SC对应的用户兴趣类加入推荐列表,计算新用户基本信息和推荐列表中各用户兴趣类中用户特征的相似度,得到用户兴趣类排序,并对其中的服务类和服务分别排序,根据排序结果选取其中的前N个Web服务进行推荐。
本发明分为聚类算法和个性化推荐算法两个部分。其中,聚类算法主要提出了一种通过分析大量用户行为日志、挖掘多种用户潜在兴趣,从而将用户聚成多个可重叠的兴趣类别的算法,该算法可以解决高维数据的降维问题;个性化推荐算法引入社交网络中用户的基本信息和兴趣标签作为起始数据,可以部分解决推荐系统的冷启动问题,并结合聚类算法对用户兴趣挖掘的结果,给出符合用户需求的个性化的推荐列表。
下面结合附图,对本发明进行详细描述。
用户个人对于Web服务的偏好获取方式主要有两种,一种是用户直接对使用过的Web服务给出显式的评分,另一种是从用户大量的行为日志中提取或者分析其他的各项指标通过综合计算得出用户对于服务的喜好程度。本发明中的聚类算法所采用的是第二种方式,即通过用户调用服务所产生的QoS指标来计算用户对于Web服务的个人偏好。进行实验需要的数据集包括用户的个人信息(通过社交网络提供的SNS入口得到),服务的具体信息(如服务名、WSDL文档等,可以从服务提供商处获取)和用户调用服务的QoS值矩阵(如响应时间、吞吐量等,通过目前通用的分布式试验平台来收集)。
聚类算法是数据挖掘中用来发现数据分布和隐含模式的一项重要技术,其目的是把大量数据点的集合分成若干类,使得每个类中的数据之间最大程度地相似,而不同类中的数据最大程度地不同。聚类是一种无监督的分类,没有任何先验知识可用。聚类算法根据数据在聚类中的聚集规则以及应用这些规则的方法,可以分成多种类型,常用的有划分式聚类算法、层次化聚类算法、基于密度和网格的聚类算法等等。本发明中的聚类如图4所示,具体如下:
输入:用户总数、社交网络中用户的个人信息;服务总数、服务基本信息;用户调用服务的QoS值矩阵;
输出:用户兴趣类。
11)根据Web服务提供商提供的服务基本信息,将Web服务S分成不同的服务类SC;
12)首先计算用户U对于服务S的所有属性的综合评价取值R(U,S),然后根据R(U,S)计算用户与服务类之间的关联系数P(U,SC):
上式中,U表示用户,S表示Web服务,Set={Ratt1,Ratt2,…,Rattp}为Web服务的属性值集合,设Set1,Set2∈Set,Set1∪Set2=Set,Set1={Ratt1,Ratt2,…,Rattb}为正比集,Set2={Ratt1,Ratt2,…,Rattc}为反比集,λi和θj分别是Ratti和Rattj(i=1,2,…,b,j=1,2,…,c)两项的权重参数,R(U,S)表示的是用户U对于服务S的所有属性的综合评价取值;
其中,L表示的是服务类SC中包含的所有服务的个数,k=1,2,…L,Pk表示用户U访问的属于服务类SC的Web服务占其所有访问的Web服务的比例,Rk用于表示用户U对于服务类SC中第k个服务S的综合评价取值,Rmax是Rk的最大值,Rmin是Rk的最小值,m和n分别是Pk s和两项的系数,通过用Java代码编写服务推荐实验来确定,确定标准是推荐的准确率,根据多次实验的经验值,m取0.5、n取1时有较好的分类效果,s是Pk的指数,t是的指数,s和t用于提高区分度,s取2,t取1,P(U,SC)表示用户U与服务类SC之间的关联系数;
13)计算服务类与服务类之间的相似度A(SCv,SCw):
SCv表示第v个服务类,SCw表示第w个服务类,N表示训练用户的总数,Uf表示第f个用户,P(Uf,SCv)即是由公式(2)得到的用户Uf与第v个服务类之间的关联系数,P(Uf,SCw)是用户Uf与第w个服务类之间的关联系数;
14)根据服务类之间的相似性划分用户兴趣类:
第一步,从所有服务类中选出与其他各服务类之间相似度之和Ei最大的一个服务类,作为用户兴趣类划分的起始点;
第二步,以Ei递减的顺序遍历其他服务类,找出所有与起所述始点相似度大于阈值λ的服务类,λ=0.5;
第三步,将第二步得到的服务类与作为起始点的服务类划分到一起,将其对应的所有用户划分成一个用户兴趣类,并已经划分的服务类从所有服务类的集合中移除;
返回第一步,对剩余的服务类重复进行第一步至第三步,如此迭代,直至服务类集合为空为止;
15)根据第14)步所得到的用户兴趣类以及各用户基本信息,分析归纳各用户兴趣类中的用户特征,包括性别c1、年龄c2和职业c3等。
个性化推荐算法是根据用户的兴趣特点和历史行为,向用户推荐其感兴趣的Web服务。随着Web服务种类和数量的快速增长,用户需要花费大量的时间和精力才能找到自己希望使用的服务。个性化推荐算法是根据用户的个人兴趣和访问习惯,对用户进行一对一的个性化预测,从而自动为用户提供推荐列表的方法。本发明中的个性化推荐流程如图5所示,具体如下:
输入:新用户的基本信息,包括用户编号、性别、年龄、职业等,和兴趣标签。
输出:推荐给新用户的TopN服务列表
21)由社交网站获取新用户标注的兴趣标签和基本信息,使用同义词词典WordNet,根据公式(4)计算出新用户的兴趣标签和各服务类名称的语义相似度sim(M1,M2),M1和M2为兴趣标签和服务类名称对应的码字,M1=(x1x2x3……xd),M2=(y1y2y3……yd),排序后从中选出与用户兴趣最相似的服务类Most_SC:
其中xq,yq分别表示兴趣标签和服务类名称的码字中第q位的分量,经过对关键词的映射变为1或0。其中,关键词采用服务类名称。对兴趣标签进行语义分析时,如果与服务类名称为同义词,那么对应的码字分量就定义为1,否则定义为0。
22)找出包含服务类Most_SC的用户兴趣类,加入推荐列表中;
23)计算新用户基本信息和推荐列表中所有用户兴趣类中用户特征的相似度,并且从大到小排序,具体过程为:
a)在推荐列表中,所有用户兴趣类对应的权重初始值都为0;
b)从推荐列表起始开始遍历,当用户兴趣类的用户特征性别c1、年龄c2和职业c3分别和新用户的基本信息的对应项内容相符时,权重分别增加w1、w2、w3,如果不相符,则仍然为0;根据公式(5)计算出相似度的取值;
UPAa表示用户兴趣类a用户特征信息,UPAnew表示新用户特征基本信息,w1、w2、w3表示用户兴趣类a在用户性别c1、年龄c2和职业c3三种特征上与新用户对应项的权重增加情况。
c)将推荐列表中的用户兴趣类按照相似度从大到小顺序排序;
24)找出排序后的推荐列表中优先级最高的前三个用户兴趣类,再选择每个兴趣类的前N个Web服务推荐给新用户。前N个服务选择方式为:选择用户兴趣类中的前e个服务类,每个服务类中取前g个服务,N=e*g。用户兴趣类中服务类的排序顺序根据公式(6)计算,每个服务类中Web服务的排序根据公式(7)计算:
P(Uy,SC)为通过公式(2)得到的第y个用户的P(U,SC),Uy表示第y个用户,SC表示的是服务类,Q(SC)表示的是服务类SC质量。
R(Uz,S)为通过公式(1)得到的第z个用户的R(U,S),Uz表示第z个用户,S表示的是服务,Q(S)表示的是服务S的质量。
Claims (1)
1.一种基于社交网络平台的Web服务推荐方法,其特征是:根据Web服务提供商提供的服务基本信息,将Web服务分成不同的服务类,由服务类中各Web服务名称的汇总得到服务类名称;在社交网络中获取用户的基本信息,取一部分用户作为训练用户,并得到训练用户对Web服务的访问记录,提取用户对Web服务的综合评价信息生成用户-服务矩阵,由用户-服务矩阵中综合评价信息超过设定阈值的Web服务得到用户感兴趣的Web服务集合,对应前述服务类再对用户感兴趣的Web服务集合进行分类,得到用户感兴趣的服务类,并据此建立用户-服务类矩阵,实现从服务到服务类的降维;然后根据用户-服务类矩阵对用户进行聚类,得到不同的用户兴趣类,每个用户兴趣类包含四个变量:主变量是该类别对应的若干训练用户,即用户类,变量二是由根据主变量基本信息所得到的该用户类中用户的特征,变量三是该类别中用户感兴趣的服务类,变量四是变量三中用户感兴趣的服务类包含的所有服务;
对于社交网络中需要进行Web服务推荐的新用户,获取新用户基本信息和兴趣标签,使用同义词词典WordNet计算新用户的兴趣标签与各服务类名称的语义相似度,得到与新用户兴趣最相似的服务类Most SC,根据用户兴趣类的变量,将服务类Most SC对应的用户兴趣类加入推荐列表,计算新用户基本信息和推荐列表中各用户兴趣类中用户特征的相似度,得到用户兴趣类排序,并对其中的服务类和服务分别排序,根据排序结果选取其中的前N个Web服务进行推荐;
获取用户兴趣类具体为:
11)根据Web服务提供商提供的服务基本信息,将Web服务分成不同的服务类SC;
12)首先计算用户U对于服务S的所有属性的综合评价取值R(U,S),然后根据R(U,S)计算用户与服务类之间的关联系数P(U,SC):
上式中,U表示用户,S表示Web服务,Set={Ratt1,Ratt2,…,Rattp}为Web服务的属性值集合,设Set1,Set2∈Set,Set1∪Set2=Set,Set1={Ratt1,Ratt2,…,Rattb}为正比集,Set2={Ratt1,Ratt2,…,Rattc}为反比集,λi和θj分别是Ratti和Rattj两项的权重参数,i=1,2,…,b,j=1,2,…,c,b和c分别为Set1和Set2的集合内元素总数,R(U,S)表示的是用户U对于服务S的所有属性的综合评价取值;
其中,L表示的是服务类SC中包含的所有服务的个数,k∈[1,2,…L],Pk表示用户U访问的属于服务类SC的Web服务占其所有访问的Web服务的比例,Rk用于表示用户U对于服务类SC中第k个服务的综合评价取值,Rmax是Rk的最大值,Rmin是Rk的最小值,m和n分别是Pk s和两项的系数,m取值0.5,n取值1,s是Pk的指数,t是的指数,s和t用于提高区分度,s取值2,t取值1,P(U,SC)表示用户U与服务类SC之间的关联系数;
13)计算服务类与服务类之间的相似度A(SCv,SCw):
SCv表示第v个服务类,SCw表示第w个服务类,N表示训练用户的总数,Uf表示第f个用户,P(Uf,SCv)即是由公式(2)得到的用户Uf与第v个服务类之间的关联系数,P(Uf,SCw)是用户Uf与第w个服务类之间的关联系数;
14)根据服务类之间的相似性划分用户兴趣类:
第一步,从所有服务类中选出与其他各服务类之间相似度之和Ei最大的一个服务类,作为用户兴趣类划分的起始点;
第二步,以Ei递减的顺序遍历其他服务类,找出所有与所述起始点相似度大于阈值λ的服务类,λ=0.5;
第三步,将第二步得到的服务类与作为起始点的服务类划分到一起,将其对应的所有用户划分成一个用户兴趣类,并已经划分的服务类从所有服务类的集合中移除;
返回第一步,对剩余的服务类重复进行第一步至第三步,如此迭代,直至服务类集合为空为止;
15)根据第14)步所得到的用户兴趣类以及各用户基本信息,分析归纳各用户兴趣类中的用户特征,包括性别c1、年龄c2和职业c3等;
采用个性化推荐算法对社交网络中的新用户进行Web服务推荐具体为:
21)由社交网站获取新用户标注的兴趣标签和基本信息,使用同义词词典WordNet, 根据公式(4)计算出新用户的兴趣标签和各服务类名称的语义相似度sim(M1,M2),M1和M2为兴趣标签和服务类名称对应的码字,M1=(x1x2x3……xd),M2=(y1y2y3……yd),d表示码字的长度,排序后从中选出与用户兴趣最相似的服务类Most_SC;
其中xq,yq分别表示兴趣标签和服务类名称的码字中第q位的分量,经过对关键词的映射变为1或0,关键词采用服务类名称,兴趣标签如果与服务类名称为同义词,那么对应的码字分量就定义为1,否则定义为0;
22)找出包含服务类Most_SC的用户兴趣类,加入推荐列表中;
23)计算新用户基本信息和推荐列表中所有用户兴趣类中用户特征的相似度,并且从大到小排序,具体过程为:
a)在推荐列表中,所有用户兴趣类对应的权重初始值都为0;
b)从推荐列表起始开始遍历,当用户兴趣类的用户特征性别c1、年龄c2和职业c3分别和新用户的基本信息的对应项内容相符时,权重分别增加w1、w2、w3,如果不相符,则仍然为0;根据公式(5)计算出相似度的取值;
UPAa表示用户兴趣类a用户特征信息,UPAnew表示新用户特征基本信息,w1、w2、w3表示用户兴趣类a在用户性别c1、年龄c2和职业c3三种特征上与新用户对应项的权重增加情况;
c)将推荐列表中的用户兴趣类按照相似度从大到小顺序排序;
24)找出排序后的推荐列表中优先级最高的前三个用户兴趣类,再选择每个兴趣类的前N个Web服务推荐给新用户,前N个服务选择方式为:选择用户兴趣类中的前e个服务类,每个服务类中取前g个服务,N=e*g,用户兴趣类中服务类的排序顺序根据公式(6)计算,每个服务类中Web服务的排序根据公式(7)计算:
P(Uy,SC)为通过公式(2)得到的第y个用户的P(U,SC),Uy表示第y个用户,SC表示的是服务类,X表示服务类SC对应的用户总数,Q(SC)表示的是服务类SC质量,
R(Uz,S)为通过公式(1)得到的第z个用户的R(U,S),Uz表示第z个用户,S表示的是服务,P表示服务S对应的用户总数Q(S)表示的是服务S的质量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310695891.2A CN103678618B (zh) | 2013-12-17 | 2013-12-17 | 一种基于社交网络平台的Web服务推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310695891.2A CN103678618B (zh) | 2013-12-17 | 2013-12-17 | 一种基于社交网络平台的Web服务推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103678618A CN103678618A (zh) | 2014-03-26 |
CN103678618B true CN103678618B (zh) | 2017-01-25 |
Family
ID=50316163
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310695891.2A Expired - Fee Related CN103678618B (zh) | 2013-12-17 | 2013-12-17 | 一种基于社交网络平台的Web服务推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103678618B (zh) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104021233B (zh) * | 2014-06-30 | 2017-02-15 | 电子科技大学 | 一种基于社区发现的社交网络好友推荐方法 |
CN104182483B (zh) * | 2014-08-07 | 2017-11-10 | 蔡剑 | 基于社会网络的服务索引库的建立方法及服务搜索方法 |
CN105893361A (zh) * | 2014-09-23 | 2016-08-24 | 江苏奥博洋信息技术有限公司 | 社会化媒体中的用户结构化分类方法 |
CN104281695B (zh) * | 2014-10-13 | 2017-12-15 | 安徽华贞信息科技有限公司 | 基于组合理论的类自然语言的语义信息抽取方法及其系统 |
CN104408115B (zh) * | 2014-11-25 | 2017-09-22 | 三星电子(中国)研发中心 | 一种电视平台上基于语义链接的异构资源推荐方法和装置 |
EP3026584A1 (en) | 2014-11-25 | 2016-06-01 | Samsung Electronics Co., Ltd. | Device and method for providing media resource |
CN104750499B (zh) * | 2015-04-21 | 2018-06-26 | 南京大学 | 基于约束求解和描述逻辑的Web服务组合方法 |
CN107153850A (zh) * | 2016-03-04 | 2017-09-12 | 上海阿法迪智能标签系统技术有限公司 | 图书相关信息的获取方法及系统 |
CN105760541B (zh) * | 2016-03-15 | 2019-06-14 | 传成文化传媒(上海)有限公司 | 视频点餐推荐方法及系统 |
CN107203772B (zh) * | 2016-03-16 | 2020-11-06 | 创新先进技术有限公司 | 一种用户类型识别方法及装置 |
CN105912727B (zh) * | 2016-05-18 | 2019-02-15 | 电子科技大学 | 一种在线社交网络标注系统中的快速推荐方法 |
CN106127506B (zh) * | 2016-06-13 | 2019-12-17 | 浙江大学 | 一种基于主动学习解决商品冷启动问题的推荐方法 |
CN107886345B (zh) * | 2016-09-30 | 2021-12-07 | 阿里巴巴集团控股有限公司 | 选取数据对象的方法及装置 |
CN107798543A (zh) * | 2016-12-15 | 2018-03-13 | 平安科技(深圳)有限公司 | 一种方案智能匹配方法和装置 |
CN107423320B (zh) * | 2017-03-30 | 2023-06-09 | 青岛大学 | 一种大数据架构下的医学领域自媒体平台数据推送方法 |
CN108337569A (zh) * | 2018-04-03 | 2018-07-27 | 优视科技有限公司 | 一种基于视频的互动讨论方法、装置和终端设备 |
WO2020133398A1 (zh) * | 2018-12-29 | 2020-07-02 | 深圳市欢太科技有限公司 | 应用推荐方法、装置、服务器和计算机可读存储介质 |
CN110070134A (zh) * | 2019-04-25 | 2019-07-30 | 厦门快商通信息咨询有限公司 | 一种基于用户兴趣感知的推荐方法及装置 |
CN112417310B (zh) * | 2019-08-21 | 2023-10-03 | 上海掌门科技有限公司 | 建立智能服务索引以及推荐智能服务的方法 |
CN111882398A (zh) * | 2020-07-31 | 2020-11-03 | 深圳市华云中盛科技股份有限公司 | 智慧城市服务推荐方法、装置、计算机设备及存储介质 |
CN112801741A (zh) * | 2021-01-27 | 2021-05-14 | 长沙市到家悠享家政服务有限公司 | 家政服务推荐方法、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102622396A (zh) * | 2011-11-30 | 2012-08-01 | 浙江大学 | 一种基于标签的web服务聚类方法 |
CN102880725A (zh) * | 2012-10-23 | 2013-01-16 | 武汉大学 | 一种基于按需服务组织的推荐方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080250450A1 (en) * | 2007-04-06 | 2008-10-09 | Adisn, Inc. | Systems and methods for targeted advertising |
-
2013
- 2013-12-17 CN CN201310695891.2A patent/CN103678618B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102622396A (zh) * | 2011-11-30 | 2012-08-01 | 浙江大学 | 一种基于标签的web服务聚类方法 |
CN102880725A (zh) * | 2012-10-23 | 2013-01-16 | 武汉大学 | 一种基于按需服务组织的推荐方法 |
Non-Patent Citations (1)
Title |
---|
Recommending Web Service Based on User Relationships and Preferences;Min Gong et al.;《2013 IEEE 20th Internatioanl Conference on Web Services(ICWS)》;20130703;第381页第2段至383页倒数第1段、第383页第7段 * |
Also Published As
Publication number | Publication date |
---|---|
CN103678618A (zh) | 2014-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103678618B (zh) | 一种基于社交网络平台的Web服务推荐方法 | |
Lee et al. | Collaborative filtering with ordinal scale-based implicit ratings for mobile music recommendations | |
CN104834686B (zh) | 一种基于混合语义矩阵的视频推荐方法 | |
CN104899273B (zh) | 一种基于话题和相对熵的网页个性化推荐方法 | |
CN108363821A (zh) | 一种信息推送方法、装置、终端设备及存储介质 | |
CN103678635B (zh) | 基于标签有向图的网络音乐聚合推荐方法 | |
CN107833117B (zh) | 一种考虑标签信息的贝叶斯个性化排序推荐方法 | |
CN107633430A (zh) | 一种基于群体社区的商品推荐方法 | |
CN105893406A (zh) | 群体用户画像方法及系统 | |
CN103810162B (zh) | 推荐网络信息的方法和系统 | |
CN104933622A (zh) | 一种基于用户和微博主题的微博流行度预测方法及系统 | |
CN102004774A (zh) | 基于统一概率模型的个性化用户标签建模与推荐方法 | |
CN106503025A (zh) | 一种应用推荐方法和系统 | |
Chen et al. | Modeling user's receptiveness over time for recommendation | |
Zhou et al. | Relevance feature mapping for content-based multimedia information retrieval | |
CN109816015B (zh) | 一种基于材料数据的推荐方法及系统 | |
CN105678590A (zh) | 一种面向社交网络基于云模型的topN推荐方法 | |
Zhao et al. | Gender profiling from a single snapshot of apps installed on a smartphone: An empirical study | |
CN104572733A (zh) | 用户兴趣标签分类的方法及装置 | |
CN104008193B (zh) | 一种基于典型用户群组发现技术的信息推荐方法 | |
CN117151870A (zh) | 一种基于客群画像行为分析方法及系统 | |
CN106446575A (zh) | 智能推送医疗资源的方法及系统 | |
Huang et al. | Information fusion oriented heterogeneous social network for friend recommendation via community detection | |
CN113434778B (zh) | 基于正则化框架和注意力机制的推荐方法 | |
CN101986301A (zh) | 一种基于逆邻分析的协作过滤推荐系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20180402 Address after: 210000 Xuanwu Avenue, Xuanwu District, Jiangsu, Nanjing 699-1 Patentee after: Jiangsu AIA Software Co.,Ltd. Address before: Qixia Xianlin Avenue District of Nanjing City, Jiangsu province 210023 No. 163 Department of computer science and technology Nanjing University Patentee before: Nanjing University |
|
TR01 | Transfer of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170125 Termination date: 20211217 |
|
CF01 | Termination of patent right due to non-payment of annual fee |