CN114168861A - 一种基于时间感知的服务推荐方法 - Google Patents

一种基于时间感知的服务推荐方法 Download PDF

Info

Publication number
CN114168861A
CN114168861A CN202111486028.7A CN202111486028A CN114168861A CN 114168861 A CN114168861 A CN 114168861A CN 202111486028 A CN202111486028 A CN 202111486028A CN 114168861 A CN114168861 A CN 114168861A
Authority
CN
China
Prior art keywords
service
users
services
user
qos
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111486028.7A
Other languages
English (en)
Inventor
毛宏燕
顾汇龙
王敬梓
黎洪炜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China Normal University
Original Assignee
East China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China Normal University filed Critical East China Normal University
Priority to CN202111486028.7A priority Critical patent/CN114168861A/zh
Publication of CN114168861A publication Critical patent/CN114168861A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及服务推荐以及深度学习领域,尤其涉及一种基于时间感知的服务推荐方法。一种基于时间感知的服务推荐方法,包括以下步骤:S1、数据预处理;S2、计算用户/服务之间的相似度;S3、筛选出与目标用户/服务相似度最高的前k个用户/服务的集合;S4、对目标用户的QoS值进行预测;S5、根据最终的QoS预测值对目标用户进行服务推荐。本发明提供了一种结合了协同过滤以及长短期记忆网络,利用相邻时间段的服务质量指标对部分空缺的指标进行填充,以缓解数据稀疏的问题,利用协同过滤筛选出相似群体,再利用长短期记忆网络学习与相似用户或相似服务有关的服务质量指标随时间的变化趋势,从而实现高效准确的服务推荐的基于时间感知的服务推荐方法。

Description

一种基于时间感知的服务推荐方法
技术领域
本发明涉及服务推荐以及深度学习领域,尤其涉及一种基于时间感知的服务推荐方法。
背景技术
在互联网产业规模不断扩大的背景之下,海量的数据在日常的生活生产中产生。大量数据的冗余繁杂为用户与服务提供商都带来许多的困难,用户难以快速准确地找到符合兴趣爱好或需要使用的服务,而管理者难以对自己所提供的服务合理地进行资源分配以及向目标用户准确推送。推荐系统通过特定的方式将用户以及服务紧密地联系起来,从而有效地缓解了上述问题,为服务消费者以及服务提供者都带来了便利。
服务推荐研究中最重要的步骤之一是通过当前服务质量(QoS)指标准确预测和计算丢失或将来的QoS指标。服务质量指标包含多个方面,例如安全性、可用性、准确性等,并且QoS指标是通过将服务与服务提供者结合在一起的网络服务程序观察并提供的。服务推荐系统可以通过预测QoS指标将服务推荐给用户,同时也可以让服务提供者找到会使用他们服务的用户群体以及未来的服务调用状态,因此,提高QoS指标预测的准确性有助于分析用户对于服务的兴趣爱好,从而提高服务推荐的性能。
推荐系统中最为重要的一步即为采用的推荐算法,随着推荐系统的不断更新、改进,越来越多的推荐算法被提出并且应用于不同的领域。服务推荐系统中最为流行和较易扩展的推荐算法之一就是其中的协同过滤(CF)。CF可以挖掘用户隐藏的喜好,利用相似的用户或是相似的物品进行推荐。
但是,CF难以处理数据稀疏性问题,而且,CF也难以挖掘用户行为在时间序列中的变化。这也就意味着在用户与服务数量急剧上升的互联网环境中,CF在服务推荐方面往往达不到很好的效果。同时,由于用户的行为会因为时间的变化而发生改变,CF也难以学习到这一变化对服务推荐产生的影响。
发明内容
本发明的目的是针对现有技术的缺陷,提供了一种结合了协同过滤以及长短期记忆网络,利用相邻时间段的服务质量指标对部分空缺的指标进行填充,以缓解数据稀疏的问题,利用协同过滤筛选出相似群体,再利用长短期记忆网络学习与相似用户或相似服务有关的服务质量指标随时间的变化趋势,从而实现高效准确的服务推荐的基于时间感知的服务推荐方法。
为了实现以上目的,本发明采用以下技术方案:
一种基于时间感知的服务推荐方法,包括以下步骤:
S1、数据预处理,从云服务器处获取用户信息形成数据包,并对数据包进行预处理;
S2、将步骤S1中进行预处理后的数据包根据用户调用服务产生的QoS值,计算用户/服务之间的相似度;
S3、将步骤S2所得的用户/服务的相似度结合该用户/服务对应的地理位置信息,筛选出与目标用户/服务相似度最高的前k个用户/服务的集合;
S4、结合步骤S3所得的相似目标用户/服务的集合,对目标用户的QoS值进行长短期记忆网络模型进行训练,并对目标用户的QoS值进行预测;
S5、结合步骤S4的预测结果,计算出最终的QoS预测值,以根据最终的QoS预测值对目标用户进行服务推荐。
进一步地,本发明还包括以下技术方案:
所述步骤S1的数据预处理包括以下步骤:
S101、数据归一化,利用线性归一化的方法,将QoS值的范围转换到
Figure 439588DEST_PATH_IMAGE001
之间,具体 公式如下:
Figure 570224DEST_PATH_IMAGE002
其中,
Figure 801485DEST_PATH_IMAGE003
代表用户ut时刻调用服务i所产生的QoS指标,
Figure 451909DEST_PATH_IMAGE004
Figure 641582DEST_PATH_IMAGE005
分别 代表所有QoS指标的最大值与最小值;
S102、利用缺失值相邻时间段内的QoS值填充缺失值,缓解数据稀疏的问题,具体计算公式为:
Figure 752190DEST_PATH_IMAGE006
其中,
Figure 787142DEST_PATH_IMAGE007
代表用户在T时间段内调用对应服务的QoS指标的均值,用来填充值为0 或空的
Figure 292073DEST_PATH_IMAGE003
其中,T的定义为:
Figure 387068DEST_PATH_IMAGE008
其中,0与63指时间片的取值范围,d代表前后相邻时间段的长度。
所述步骤S2中用户/服务之间的相似度计算包括以下步骤:
S201、提出基于用户调用服务个数的个性化权重,用户调用的服务越多,该用户所占的权重越大,具体计算公式为:
Figure 695558DEST_PATH_IMAGE009
其中,
Figure 268622DEST_PATH_IMAGE010
表示所有服务的总数量,
Figure 893639DEST_PATH_IMAGE011
表示用户调用过的服务的数量,
Figure 910267DEST_PATH_IMAGE012
代表此权 重在整个模型中的影响程度,当
Figure 987945DEST_PATH_IMAGE012
取0时,即可认为该权重不对模型造成影响;
S202、计算重要性权重,调用过两个服务的用户数越多,该服务对目标服务越重要,具体计算公式为:
Figure 630279DEST_PATH_IMAGE013
其中,
Figure 375381DEST_PATH_IMAGE014
代表调用过服务
Figure 61446DEST_PATH_IMAGE015
的用户数量,
Figure 626419DEST_PATH_IMAGE016
代表调用过服务
Figure 541286DEST_PATH_IMAGE015
与服务
Figure 875315DEST_PATH_IMAGE017
的用 户;
S203、利用牛顿冷却定理计算服务的兴趣衰减系数,具体计算公式为:
Figure 496396DEST_PATH_IMAGE018
其中,
Figure 548666DEST_PATH_IMAGE019
代表
Figure 267223DEST_PATH_IMAGE020
中的用户上一次调用服务
Figure 721338DEST_PATH_IMAGE015
的时刻,
Figure 483626DEST_PATH_IMAGE021
代表在
Figure 23192DEST_PATH_IMAGE019
时用户对于服 务
Figure 811020DEST_PATH_IMAGE015
感兴趣的程度,
Figure 119641DEST_PATH_IMAGE022
代表衰减系数;
S204、结合以上三种权重及系数,采用皮尔逊相关系数计算服务间的相似度,具体计算公式为:
Figure 819875DEST_PATH_IMAGE023
Figure 581158DEST_PATH_IMAGE024
其中,U就是
Figure 907097DEST_PATH_IMAGE020
,代表在
Figure 70225DEST_PATH_IMAGE025
时刻调用过服务
Figure 439895DEST_PATH_IMAGE015
以及服务
Figure 954053DEST_PATH_IMAGE017
的用户集合,
Figure 818104DEST_PATH_IMAGE026
代表 在
Figure 835739DEST_PATH_IMAGE025
时刻内所有
Figure 146284DEST_PATH_IMAGE020
内用户调用服务
Figure 882159DEST_PATH_IMAGE015
产生的QoS指标的均值。
所述步骤S203还包括:若每一次用户调用服务时初始的感兴趣程度相同,将权重 化简成
Figure 284321DEST_PATH_IMAGE027
所述步骤S2中用户之间的相似度计算公式为:
Figure 422042DEST_PATH_IMAGE028
其中,
Figure 399094DEST_PATH_IMAGE011
表示所有用户的数量,
Figure 356685DEST_PATH_IMAGE010
表示调用过该服务的用户的数量,
Figure 828118DEST_PATH_IMAGE029
代表此权 重在整个模型中的影响程度;
Figure 820345DEST_PATH_IMAGE030
其中,
Figure 204184DEST_PATH_IMAGE031
代表用户
Figure 914651DEST_PATH_IMAGE032
调用过的服务的数量,
Figure 924195DEST_PATH_IMAGE033
代表被用户
Figure 770929DEST_PATH_IMAGE032
与用户
Figure 89783DEST_PATH_IMAGE034
调用过的 服务;
Figure 21967DEST_PATH_IMAGE035
其中,
Figure 835202DEST_PATH_IMAGE036
代表服务上一次被用户调用的时刻,
Figure 802021DEST_PATH_IMAGE021
代表在
Figure 524733DEST_PATH_IMAGE036
时用户
Figure 209793DEST_PATH_IMAGE032
对于服务感兴 趣的程度,
Figure 561140DEST_PATH_IMAGE037
代表在
Figure 382465DEST_PATH_IMAGE038
时用户
Figure 777543DEST_PATH_IMAGE032
对于服务感兴趣的程度,
Figure 684319DEST_PATH_IMAGE022
代表衰减系数,
Figure 839357DEST_PATH_IMAGE039
代表自然常数;
Figure 515189DEST_PATH_IMAGE040
Figure 848213DEST_PATH_IMAGE041
其中,S为
Figure 242285DEST_PATH_IMAGE042
,代表在
Figure 138697DEST_PATH_IMAGE025
时刻用户
Figure 183882DEST_PATH_IMAGE032
Figure 937074DEST_PATH_IMAGE034
共同调用过的服务集合,
Figure 552863DEST_PATH_IMAGE043
代表用户 在
Figure 315283DEST_PATH_IMAGE025
时刻内调用
Figure 731088DEST_PATH_IMAGE042
集合内服务产生的QoS指标的均值。
所述筛选出与目标用户/服务相似度最高的前k个用户/服务的集合包括以下步骤:
S301、根据自治域筛选出与目标用户/服务在同一自治域的用户/服务,若相似用户/服务数量小于k,则扩大筛选范围,进入下一步;若相似用户/服务数量大于k,在这个集合内利用Top-k算法筛选出相似用户/服务,并排除相似度小于0的用户/服务;
若筛选完后的用户数量小于k,则扩大筛选范围;若筛选完后的用户数量不小于k,则返回相似用户/服务集合;
S302、根据国家筛选出与目标用户/服务在同一国家的用户/服务,若相似用户/服务数量小于k,则扩大筛选范围,进入下一步;若相似用户/服务数量大于k,在这个集合内利用Top-k算法筛选出相似用户/服务,并排除相似度小于0的用户/服务;
若筛选完后的用户数量小于k,则扩大筛选范围;若筛选完后的用户数量不小于k,则返回相似用户/服务集合;
S303、利用所有数据,计算与其他全部的用户/服务的相似度,利用Top-k算法筛选出前k个相似度不小于0的用户/服务,若不满k个就只用这些相似用户/服务。
所述步骤S4中长短期记忆网络的模型训练以及对于QoS值的预测包括以下步骤:
S401、根据目标用户的相似用户以及目标用户本身构建相关的数据集,并利用数据集训练长短期记忆网络模型,得到目标用户在特定时刻调用目标服务所产生的QoS值;
S402、根据目标服务的相似服务以及目标服务本身构建相关的数据集,并利用数据集训练另一个长短期记忆网络模型,得到目标用户在特定时刻调用目标服务所产生的QoS值;
S403、对预测值进行反归一化处理,计算公式为:
Figure 655182DEST_PATH_IMAGE044
其中,
Figure 758267DEST_PATH_IMAGE004
Figure 58798DEST_PATH_IMAGE005
分别代表所有QoS指标的最大值与最小值。
所述步骤S5中最终QoS预测值的计算过程以及服务推荐包括以下步骤:
S501、利用用户间的相似度计算用户平均相似度权重,计算公式为:
Figure 812997DEST_PATH_IMAGE045
其中,
Figure 907992DEST_PATH_IMAGE046
代表填充缺失值时采用的相邻时间段长度;
S502、利用相似用户所预测的QoS值计算基于用户的预测值,计算公式为:
Figure 498373DEST_PATH_IMAGE047
其中,
Figure 337016DEST_PATH_IMAGE048
代表经由LSTM模型得到的基于相似用户的用户u
Figure 712765DEST_PATH_IMAGE025
时刻调用服 务i产生的QoS预测值,
Figure 978661DEST_PATH_IMAGE049
在LSTM训练与预测时相似用户在
Figure 56338DEST_PATH_IMAGE025
时刻调用服务i产生的 QoS值;
S503,利用用户间的相似度计算服务平均相似度权重,计算公式为:
Figure 433093DEST_PATH_IMAGE050
其中,
Figure 161884DEST_PATH_IMAGE046
代表填充缺失值时采用的相邻时间段长度;
S504,利用相似服务所预测的QoS值计算基于服务的预测值,计算公式为:
Figure 598681DEST_PATH_IMAGE051
其中,
Figure 163655DEST_PATH_IMAGE048
代表经由LSTM模型得到的基于相似服务的用户u
Figure 78521DEST_PATH_IMAGE025
时刻调用服 务i产生的QoS预测值,
Figure 691512DEST_PATH_IMAGE052
在LSTM训练与预测时相似服务在
Figure 299210DEST_PATH_IMAGE025
时刻被用户u调用产生的 QoS值;
S505,利用加权的方式结合基于用户的预测方法以及基于服务的预测方法,计算最终的QoS预测值,计算公式为:
Figure 820322DEST_PATH_IMAGE053
其中,
Figure 804458DEST_PATH_IMAGE054
代表基于用户的LSTM预测方法与基于服务的LSTM预测方法所占 的比重;
S506,根据预测出的QoS值,选出性能最好的服务推荐给目标用户。
采用本发明技术方案,本发明的有益效果为:
1、本发明利用相邻时间段的QoS值填充部分缺失QoS值,有效缓解了数据稀疏带来的问题,提升了预测的准确性。
2、本发明利用牛顿冷却定律模拟用户对于服务的兴趣变化,更好地考虑到了用户对于服务调用的实际情况。
3、计算相似度时加入个性化权重以及重要性权重,有效地减少了部分数据较少的用户或服务对推荐造成的影响。
4、利用长短期记忆网络进行QoS值预测,有效学习了时序上QoS变化的规律,提高了服务推荐的准确性。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
本发明的一种基于时间感知的服务推荐方法,方法结合了协同过滤以及长短期记忆网络,提高了服务推荐的准确性,具体包括如下步骤:
S1、数据预处理,对收集到的数据进行预处理,以减少数据本身带来的误差并在一定程度上缓解数据稀疏的问题,具体包括如下步骤:
S101,数据归一化,利用线性归一化的方法,将QoS值的范围转换到
Figure 507841DEST_PATH_IMAGE055
之间,具体 公式如下:
Figure 286441DEST_PATH_IMAGE056
其中,
Figure 560427DEST_PATH_IMAGE057
代表用户ut时刻调用服务i所产生的QoS指标,
Figure 82676DEST_PATH_IMAGE058
Figure 407609DEST_PATH_IMAGE059
分别 代表所有QoS指标的最大值与最小值。
S102、利用缺失值相邻时间段内的QoS值填充缺失值,缓解数据稀疏的问题,具体计算公式为:
Figure 91531DEST_PATH_IMAGE060
其中,
Figure 118393DEST_PATH_IMAGE061
代表用户在T时间段内调用对应服务的QoS指标的均值,用来填充值为0 或空的
Figure 444332DEST_PATH_IMAGE057
,其中,T的定义为:
Figure 856728DEST_PATH_IMAGE062
其中,0与63指时间片的取值范围,d代表前后相邻时间段的长度,可以通过调节d来调整缺失值填充依赖的数据范围,从而调整整个模型的预测效果以适应不同稀疏程度的数据与应用场景。
S2、根据用户调用服务产生的QoS值,计算用户(服务)间的相似度,具体包括如下步骤:
S201、由于在实际生活中,不同的用户对服务推荐的贡献是不同的,为了调整不同用户对于相似度的贡献,提出基于用户调用服务个数的个性化权重,用户调用的服务越多,该用户所占的权重越大,具体计算公式为:
Figure 977131DEST_PATH_IMAGE063
其中,
Figure 225709DEST_PATH_IMAGE064
表示所有服务的总数量,
Figure 89760DEST_PATH_IMAGE065
表示用户调用过的服务的数量,
Figure 126636DEST_PATH_IMAGE066
代表此权 重在整个模型中的影响程度,当
Figure 417940DEST_PATH_IMAGE066
取0时,即可认为该权重不对模型造成影响。实例中采用 的
Figure 153815DEST_PATH_IMAGE066
值为0.9。
S202、为了防止只被少量用户调用过的服务影响相似用户的筛选,引入重要性权重,调用过两个服务的用户数越多,该服务对目标服务越重要,具体计算公式为:
Figure 821557DEST_PATH_IMAGE067
其中,
Figure 208544DEST_PATH_IMAGE068
代表调用过服务
Figure 670750DEST_PATH_IMAGE069
的用户数量,
Figure 893921DEST_PATH_IMAGE070
代表调用过服务
Figure 365353DEST_PATH_IMAGE069
与服务
Figure 108313DEST_PATH_IMAGE071
的用 户。
S203、由于用户兴趣会随着时间而产生变化,所以时间因素对于相似度的计算也有影响,本方法利用牛顿冷却定理计算服务的兴趣衰减系数,具体计算公式为:
Figure 6998DEST_PATH_IMAGE072
其中,
Figure 717465DEST_PATH_IMAGE073
代表
Figure 727010DEST_PATH_IMAGE074
中的用户上一次调用服务
Figure 823011DEST_PATH_IMAGE069
的时刻,
Figure 892598DEST_PATH_IMAGE075
代表在
Figure 824782DEST_PATH_IMAGE073
时用户对于服 务
Figure 638017DEST_PATH_IMAGE069
感兴趣的程度,
Figure 290322DEST_PATH_IMAGE076
代表衰减系数。在这里,我们假设每一次用户调用服务时初始的感兴 趣程度相同,此权重就可以化简成
Figure 327548DEST_PATH_IMAGE077
。实例中采用的
Figure 747028DEST_PATH_IMAGE076
值为0.2。
S204、结合以上三种权重及系数,采用皮尔逊相关系数计算服务间的相似度,具体计算公式为:
Figure 98375DEST_PATH_IMAGE078
Figure 168968DEST_PATH_IMAGE079
其中,U就是
Figure 783620DEST_PATH_IMAGE074
,代表在
Figure 487134DEST_PATH_IMAGE080
时刻调用过服务
Figure 596166DEST_PATH_IMAGE069
以及服务
Figure 271998DEST_PATH_IMAGE071
的用户集合,
Figure 854289DEST_PATH_IMAGE081
代表 在
Figure 248362DEST_PATH_IMAGE080
时刻内所有
Figure 190779DEST_PATH_IMAGE074
内用户调用服务
Figure 986696DEST_PATH_IMAGE069
产生的QoS指标的均值。
进一步地,用户间的相似度计算具体步骤如下:
S205、与服务间的相似度计算方式类似,用户间相似度的,具体计算公式为:
Figure 474310DEST_PATH_IMAGE082
Figure 355678DEST_PATH_IMAGE083
Figure 594462DEST_PATH_IMAGE084
Figure 244886DEST_PATH_IMAGE085
Figure 168980DEST_PATH_IMAGE086
其中,
Figure 272065DEST_PATH_IMAGE065
表示所有用户的数量,
Figure 556284DEST_PATH_IMAGE064
表示调用过该服务的用户的数量,
Figure 326794DEST_PATH_IMAGE087
代表此权 重在整个模型中的影响程度。
Figure 421789DEST_PATH_IMAGE088
代表服务上一次被用户调用的时刻,
Figure 12171DEST_PATH_IMAGE075
代表在
Figure 601546DEST_PATH_IMAGE088
时用户
Figure 226562DEST_PATH_IMAGE089
对于服务感兴趣的程度,
Figure 492459DEST_PATH_IMAGE076
代表衰减系数。S即为
Figure 570136DEST_PATH_IMAGE090
,代表在
Figure 196158DEST_PATH_IMAGE080
时刻用户
Figure 675681DEST_PATH_IMAGE089
Figure 112479DEST_PATH_IMAGE091
共同调用 过的服务集合,
Figure 677452DEST_PATH_IMAGE092
代表用户在
Figure 605701DEST_PATH_IMAGE080
时刻内调用
Figure 939730DEST_PATH_IMAGE090
集合内服务产生的QoS指标的均值。
S3、根据相似度以及地理位置信息,筛选出与目标用户(服务)相似度最高的前k个用户(服务)集合,具体包括如下步骤:
S301,根据自治域筛选出与目标用户(服务)在同一自治域的用户(服务),若相似用户(服务)数量小于k,则扩大筛选范围,进入下一步;若相似用户(服务)数量大于k,在这个集合内利用Top-k算法筛选出相似用户(服务),并排除相似度小于0的用户(服务)。若筛选完后的用户数量小于k,则扩大筛选范围;若筛选完后的用户数量不小于k,则返回相似用户(服务)集合。
S302、根据国家筛选出与目标用户(服务)在同一国家的用户(服务),若相似用户(服务)数量小于k,则扩大筛选范围,进入下一步;若相似用户(服务)数量大于k,在这个集合内利用Top-k算法筛选出相似用户(服务),并排除相似度小于0的用户(服务)。若筛选完后的用户数量小于k,则扩大筛选范围;若筛选完后的用户数量不小于k,则返回相似用户(服务)集合。
S303、利用所有数据,计算与其他全部的用户(服务)的相似度,利用Top-k算法筛选出前k个相似度不小于0的用户(服务),若不满k个就只用这些相似用户(服务)。
S4、利用与目标用户以及相似用户相关的QoS值对长短期记忆网络模型进行训练并对目标QoS值进行预测,具体包括如下步骤:
S401、根据目标用户的相似用户以及目标用户本身构建相关的数据集,并利用数据集训练长短期记忆网络模型,得到目标用户在特定时刻调用目标服务所产生的QoS值。实例中使用的学习率为0.1,隐藏神经元个数为25。
S402、根据目标服务的相似服务以及目标服务本身构建相关的数据集,并利用数据集训练另一个长短期记忆网络模型,得到目标用户在特定时刻调用目标服务所产生的QoS值。实例中使用的学习率为0.1,隐藏神经元个数为25。
S403、对预测值进行反归一化处理,具体计算公式为:
Figure 547429DEST_PATH_IMAGE093
其中,
Figure 599699DEST_PATH_IMAGE058
Figure 833103DEST_PATH_IMAGE059
分别代表所有QoS指标的最大值与最小值。
S5、结合S4中的结果,计算最终的QoS预测值并根据结果对目标用户进行服务推荐,具体包括如下步骤:
S501、利用用户间的相似度计算用户平均相似度权重,具体计算公式为:
Figure 21639DEST_PATH_IMAGE094
其中,
Figure 800239DEST_PATH_IMAGE095
代表填充缺失值时采用的相邻时间段长度。
S502、利用相似用户所预测的QoS值计算基于用户的预测值,具体计算公式为:
Figure 339804DEST_PATH_IMAGE096
其中,
Figure 612785DEST_PATH_IMAGE097
代表经由LSTM模型得到的基于相似用户的用户u
Figure 921407DEST_PATH_IMAGE080
时刻调用服 务i产生的QoS预测值,
Figure 870908DEST_PATH_IMAGE098
在LSTM训练与预测时相似用户在
Figure 163349DEST_PATH_IMAGE080
时刻调用服务i产生的 QoS值。
S503、利用用户间的相似度计算服务平均相似度权重,具体计算公式为:
Figure 207397DEST_PATH_IMAGE099
其中,
Figure 370526DEST_PATH_IMAGE095
代表填充缺失值时采用的相邻时间段长度。
S504、利用相似服务所预测的QoS值计算基于服务的预测值,具体计算公式为:
Figure 756508DEST_PATH_IMAGE100
其中,
Figure 5086DEST_PATH_IMAGE097
代表经由LSTM模型得到的基于相似服务的用户u
Figure 888378DEST_PATH_IMAGE080
时刻调用服 务i产生的QoS预测值,
Figure 906013DEST_PATH_IMAGE101
在LSTM训练与预测时相似服务在
Figure 197317DEST_PATH_IMAGE080
时刻被用户u调用产生的 QoS值。
S505、利用加权的方式结合基于用户的预测方法以及基于服务的预测方法,计算最终的QoS预测值,具体计算公式为:
Figure 933192DEST_PATH_IMAGE102
其中,
Figure 850201DEST_PATH_IMAGE103
代表基于用户的LSTM预测方法与基于服务的LSTM预测方法所占 的比重。
S506、根据预测出的QoS值,选出性能最好的服务(响应时间短且吞吐量大)推荐给目标用户。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例, 而本发明的范围由所附的权利要求范围决定。

Claims (8)

1.一种基于时间感知的服务推荐方法,其特征在于,包括以下步骤:
S1、数据预处理,从云服务器处通过用户调用服务产生的服务质量日志信息获取响应时间以及吞吐量的数据,同时,获取服务以及用户的ip地址、所处自治系统、城市、国家等信息,将所有数据与信息整合形成数据包,并对数据包进行预处理;
S2、将步骤S1中进行预处理后的数据包根据用户调用服务产生的QoS值,计算用户/服务之间的相似度;
S3、将步骤S2所得的用户/服务的相似度结合该用户/服务对应的地理位置信息,筛选出与目标用户/服务相似度最高的前k个用户/服务的集合;
S4、结合步骤S3所得的相似目标用户/服务的集合,对目标用户的QoS值进行长短期记忆网络模型进行训练,并对目标用户的QoS值进行预测;
S5、结合步骤S4的预测结果,计算出最终的QoS预测值,以根据最终的QoS预测值对目标用户进行服务推荐。
2.根据权利要求1所述的一种基于时间感知的服务推荐方法,其特征在于所述步骤S1的数据预处理包括以下步骤:
S101、数据归一化,利用线性归一化的方法,将QoS值的范围转换到
Figure DEST_PATH_IMAGE001
之间,具体公式如下:
Figure DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE003
代表用户ut时刻调用服务i所产生的QoS指标,
Figure DEST_PATH_IMAGE004
Figure DEST_PATH_IMAGE005
分别代表所有QoS指标的最大值与最小值;
S102、利用缺失值相邻时间段内的QoS值填充缺失值,缓解数据稀疏的问题,具体计算公式为:
Figure DEST_PATH_IMAGE006
其中,
Figure DEST_PATH_IMAGE007
代表用户在T时间段内调用对应服务的QoS指标的均值,用来填充值为0或空的
Figure 43713DEST_PATH_IMAGE003
其中,T的定义为:
Figure DEST_PATH_IMAGE008
其中,0与63指时间片的取值范围,d代表前后相邻时间段的长度。
3.根据权利要求1所述的一种基于时间感知的服务推荐方法,其特征在于所述步骤S2中用户/服务之间的相似度计算包括以下步骤:
S201、提出基于用户调用服务个数的个性化权重,用户调用的服务越多,该用户所占的权重越大,具体计算公式为:
Figure DEST_PATH_IMAGE009
其中,
Figure DEST_PATH_IMAGE010
表示所有服务的总数量,
Figure DEST_PATH_IMAGE011
表示用户调用过的服务的数量,
Figure DEST_PATH_IMAGE012
代表此权重在整个模型中的影响程度,当
Figure 446006DEST_PATH_IMAGE012
取0时,即可认为该权重不对模型造成影响;
S202、计算重要性权重,调用过两个服务的用户数越多,该服务对目标服务越重要,具体计算公式为:
Figure DEST_PATH_IMAGE013
其中,
Figure DEST_PATH_IMAGE014
代表调用过服务
Figure DEST_PATH_IMAGE015
的用户数量,
Figure DEST_PATH_IMAGE016
代表调用过服务
Figure 385930DEST_PATH_IMAGE015
与服务
Figure DEST_PATH_IMAGE017
的用户;
S203、利用牛顿冷却定理计算服务的兴趣衰减系数,具体计算公式为:
Figure DEST_PATH_IMAGE018
其中,
Figure DEST_PATH_IMAGE019
代表
Figure DEST_PATH_IMAGE020
中的用户上一次调用服务
Figure 594189DEST_PATH_IMAGE015
的时刻,
Figure DEST_PATH_IMAGE021
代表在
Figure 346244DEST_PATH_IMAGE019
时用户对于服务
Figure 824499DEST_PATH_IMAGE015
感兴趣的程度,
Figure DEST_PATH_IMAGE022
代表衰减系数;
S204、结合以上三种权重及系数,采用皮尔逊相关系数计算服务间的相似度,具体计算公式为:
Figure DEST_PATH_IMAGE023
Figure DEST_PATH_IMAGE024
其中,U就是
Figure 449122DEST_PATH_IMAGE020
,代表在
Figure DEST_PATH_IMAGE025
时刻调用过服务
Figure 851285DEST_PATH_IMAGE015
以及服务
Figure 51322DEST_PATH_IMAGE017
的用户集合,
Figure DEST_PATH_IMAGE026
代表在
Figure 966057DEST_PATH_IMAGE025
时刻内所有
Figure 126911DEST_PATH_IMAGE020
内用户调用服务
Figure 395081DEST_PATH_IMAGE015
产生的QoS指标的均值。
4.根据权利要求1所述的一种基于时间感知的服务推荐方法,其特征在于所述步骤S2中用户之间的相似度计算公式为:
Figure DEST_PATH_IMAGE027
其中,
Figure 606882DEST_PATH_IMAGE011
表示所有用户的数量,
Figure 239989DEST_PATH_IMAGE010
表示调用过该服务的用户的数量,
Figure DEST_PATH_IMAGE028
代表此权重在整个模型中的影响程度;
Figure DEST_PATH_IMAGE029
其中,
Figure DEST_PATH_IMAGE030
代表用户
Figure DEST_PATH_IMAGE031
调用过的服务的数量,
Figure DEST_PATH_IMAGE032
代表被用户
Figure 20295DEST_PATH_IMAGE031
与用户
Figure DEST_PATH_IMAGE033
调用过的服务;
Figure DEST_PATH_IMAGE034
其中,
Figure DEST_PATH_IMAGE035
代表服务上一次被用户调用的时刻,
Figure 420053DEST_PATH_IMAGE021
代表在
Figure 266786DEST_PATH_IMAGE035
时用户
Figure 759209DEST_PATH_IMAGE031
对于服务感兴趣的程度,
Figure DEST_PATH_IMAGE036
代表在
Figure DEST_PATH_IMAGE037
时用户
Figure 956972DEST_PATH_IMAGE031
对于服务感兴趣的程度,
Figure 691579DEST_PATH_IMAGE022
代表衰减系数,
Figure DEST_PATH_IMAGE038
代表自然常数;
Figure DEST_PATH_IMAGE039
Figure DEST_PATH_IMAGE040
其中,S为
Figure DEST_PATH_IMAGE041
,代表在
Figure 78305DEST_PATH_IMAGE025
时刻用户
Figure 256476DEST_PATH_IMAGE031
Figure 738273DEST_PATH_IMAGE033
共同调用过的服务集合,
Figure DEST_PATH_IMAGE042
代表用户在
Figure 479833DEST_PATH_IMAGE025
时刻内调用
Figure 566738DEST_PATH_IMAGE041
集合内服务产生的QoS指标的均值。
5.根据权利要求1所述的一种基于时间感知的服务推荐方法,其特征在于所述筛选出与目标用户/服务相似度最高的前k个用户/服务的集合包括以下步骤:
S301、根据自治域筛选出与目标用户/服务在同一自治域的用户/服务,若相似用户/服务数量小于k,则扩大筛选范围,进入下一步;若相似用户/服务数量大于k,在这个集合内利用Top-k算法筛选出相似用户/服务,并排除相似度小于0的用户/服务;
若筛选完后的用户数量小于k,则扩大筛选范围;若筛选完后的用户数量不小于k,则返回相似用户/服务集合;
S302、根据国家筛选出与目标用户/服务在同一国家的用户/服务,若相似用户/服务数量小于k,则扩大筛选范围,进入下一步;若相似用户/服务数量大于k,在这个集合内利用Top-k算法筛选出相似用户/服务,并排除相似度小于0的用户/服务;
若筛选完后的用户数量小于k,则扩大筛选范围;若筛选完后的用户数量不小于k,则返回相似用户/服务集合;
S303、利用所有数据,计算与其他全部的用户/服务的相似度,利用Top-k算法筛选出前k个相似度不小于0的用户/服务,若不满k个就只用这些相似用户/服务。
6.根据权利要求1所述的一种基于时间感知的服务推荐方法,其特征在于步骤S4中长短期记忆网络的模型训练以及对于QoS值的预测包括以下步骤:
S401、根据目标用户的相似用户以及目标用户本身构建相关的数据集,并利用数据集训练长短期记忆网络模型,得到目标用户在特定时刻调用目标服务所产生的QoS值;
S402、根据目标服务的相似服务以及目标服务本身构建相关的数据集,并利用数据集训练另一个长短期记忆网络模型,得到目标用户在特定时刻调用目标服务所产生的QoS值;
S403、对预测值进行反归一化处理,计算公式为:
Figure DEST_PATH_IMAGE043
其中,
Figure 994439DEST_PATH_IMAGE004
Figure 838898DEST_PATH_IMAGE005
分别代表所有QoS指标的最大值与最小值。
7.根据权利要求1所述的一种基于时间感知的服务推荐方法,其特征在于所述步骤S5中最终QoS预测值的计算过程以及服务推荐包括以下步骤:
S501、利用用户间的相似度计算用户平均相似度权重,计算公式为:
Figure DEST_PATH_IMAGE044
其中,
Figure DEST_PATH_IMAGE045
代表填充缺失值时采用的相邻时间段长度;
S502、利用相似用户所预测的QoS值计算基于用户的预测值,计算公式为:
Figure DEST_PATH_IMAGE046
其中,
Figure DEST_PATH_IMAGE047
代表经由LSTM模型得到的基于相似用户的用户u
Figure 915308DEST_PATH_IMAGE025
时刻调用服务i产生的QoS预测值,
Figure DEST_PATH_IMAGE048
在LSTM训练与预测时相似用户在
Figure 79223DEST_PATH_IMAGE025
时刻调用服务i产生的QoS值;
S503,利用用户间的相似度计算服务平均相似度权重,计算公式为:
Figure DEST_PATH_IMAGE049
其中,
Figure 864776DEST_PATH_IMAGE045
代表填充缺失值时采用的相邻时间段长度;
S504,利用相似服务所预测的QoS值计算基于服务的预测值,计算公式为:
Figure DEST_PATH_IMAGE050
其中,
Figure 976957DEST_PATH_IMAGE047
代表经由LSTM模型得到的基于相似服务的用户u
Figure 607790DEST_PATH_IMAGE025
时刻调用服务i产生的QoS预测值,
Figure DEST_PATH_IMAGE051
在LSTM训练与预测时相似服务在
Figure 154440DEST_PATH_IMAGE025
时刻被用户u调用产生的QoS值;
S505,利用加权的方式结合基于用户的预测方法以及基于服务的预测方法,计算最终的QoS预测值,计算公式为:
Figure DEST_PATH_IMAGE052
其中,
Figure DEST_PATH_IMAGE053
代表基于用户的LSTM预测方法与基于服务的LSTM预测方法所占的比重;
S506,根据预测出的QoS值,选出性能最好的服务推荐给目标用户。
8.根据权利要求3所述的一种基于时间感知的服务推荐方法,其特征在于所述步骤S203还包括:若每一次用户调用服务时初始的感兴趣程度相同,将权重化简成
Figure DEST_PATH_IMAGE054
CN202111486028.7A 2021-12-07 2021-12-07 一种基于时间感知的服务推荐方法 Pending CN114168861A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111486028.7A CN114168861A (zh) 2021-12-07 2021-12-07 一种基于时间感知的服务推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111486028.7A CN114168861A (zh) 2021-12-07 2021-12-07 一种基于时间感知的服务推荐方法

Publications (1)

Publication Number Publication Date
CN114168861A true CN114168861A (zh) 2022-03-11

Family

ID=80483965

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111486028.7A Pending CN114168861A (zh) 2021-12-07 2021-12-07 一种基于时间感知的服务推荐方法

Country Status (1)

Country Link
CN (1) CN114168861A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116132347A (zh) * 2023-04-06 2023-05-16 湖南工商大学 算网融合环境下基于Bi-LSTM的服务QoS预测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116132347A (zh) * 2023-04-06 2023-05-16 湖南工商大学 算网融合环境下基于Bi-LSTM的服务QoS预测方法

Similar Documents

Publication Publication Date Title
KR101030653B1 (ko) 정보 엔트로피를 이용하여 유사도를 보정하는 사용자 기반 협업 필터링 추천 시스템
Yu et al. A Web service QoS prediction approach based on time-and location-aware collaborative filtering
CN106503022B (zh) 推送推荐信息的方法和装置
US7389201B2 (en) System and process for automatically providing fast recommendations using local probability distributions
TWI636416B (zh) 內容個人化之多相排序方法和系統
WO2015192667A1 (zh) 推荐广告的方法及广告推荐服务器
Berman et al. The minmax regret gradual covering location problem on a network with incomplete information of demand weights
Lai et al. Novel personal and group-based trust models in collaborative filtering for document recommendation
CN106776928B (zh) 基于内存计算框架、融合社交及时空数据的位置推荐方法
Yu et al. Time-aware collaborative filtering for QoS-based service recommendation
Margaris et al. Improving collaborative filtering's rating prediction quality by considering shifts in rating practices
CN111695084A (zh) 模型生成方法、信用评分生成方法、装置、设备及存储介质
KR101725510B1 (ko) 사용자 성향을 고려한 소셜 이벤트 추천 방법 및 장치
KR20110096488A (ko) 최적화된 도메인간 정보 퀄리티 평가를 갖는 협동적 네트워킹
Chen et al. Trust-aware and location-based collaborative filtering for web service QoS prediction
CN114168861A (zh) 一种基于时间感知的服务推荐方法
CN109657725B (zh) 一种基于复杂时空情境感知的服务质量预测方法及系统
CN104123321B (zh) 一种确定推荐图片的方法及装置
US20240107125A1 (en) System and method for modelling access requests to multi-channel content sharing platforms
CN107291860B (zh) 种子用户确定方法
Margaris et al. Enhancing rating prediction quality through improving the accuracy of detection of shifts in rating practices
CN112218114A (zh) 视频缓存控制方法、装置和计算机可读存储介质
CN114510627A (zh) 对象推送方法、装置、电子设备及存储介质
CN113486933B (zh) 模型训练方法、用户身份信息预测方法及装置
CN113869951A (zh) 推荐内容确定方法、推荐方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination