CN114168861A

CN114168861A - 一种基于时间感知的服务推荐方法

Info

Publication number: CN114168861A
Application number: CN202111486028.7A
Authority: CN
Inventors: 毛宏燕; 顾汇龙; 王敬梓; 黎洪炜
Original assignee: East China Normal University
Current assignee: East China Normal University
Priority date: 2021-12-07
Filing date: 2021-12-07
Publication date: 2022-03-11

Abstract

本发明涉及服务推荐以及深度学习领域，尤其涉及一种基于时间感知的服务推荐方法。一种基于时间感知的服务推荐方法，包括以下步骤：S1、数据预处理；S2、计算用户/服务之间的相似度；S3、筛选出与目标用户/服务相似度最高的前k个用户/服务的集合；S4、对目标用户的QoS值进行预测；S5、根据最终的QoS预测值对目标用户进行服务推荐。本发明提供了一种结合了协同过滤以及长短期记忆网络，利用相邻时间段的服务质量指标对部分空缺的指标进行填充，以缓解数据稀疏的问题，利用协同过滤筛选出相似群体，再利用长短期记忆网络学习与相似用户或相似服务有关的服务质量指标随时间的变化趋势，从而实现高效准确的服务推荐的基于时间感知的服务推荐方法。

Description

一种基于时间感知的服务推荐方法

技术领域

本发明涉及服务推荐以及深度学习领域，尤其涉及一种基于时间感知的服务推荐方法。

背景技术

在互联网产业规模不断扩大的背景之下，海量的数据在日常的生活生产中产生。大量数据的冗余繁杂为用户与服务提供商都带来许多的困难，用户难以快速准确地找到符合兴趣爱好或需要使用的服务，而管理者难以对自己所提供的服务合理地进行资源分配以及向目标用户准确推送。推荐系统通过特定的方式将用户以及服务紧密地联系起来，从而有效地缓解了上述问题，为服务消费者以及服务提供者都带来了便利。

服务推荐研究中最重要的步骤之一是通过当前服务质量（QoS）指标准确预测和计算丢失或将来的QoS指标。服务质量指标包含多个方面，例如安全性、可用性、准确性等，并且QoS指标是通过将服务与服务提供者结合在一起的网络服务程序观察并提供的。服务推荐系统可以通过预测QoS指标将服务推荐给用户，同时也可以让服务提供者找到会使用他们服务的用户群体以及未来的服务调用状态，因此，提高QoS指标预测的准确性有助于分析用户对于服务的兴趣爱好，从而提高服务推荐的性能。

推荐系统中最为重要的一步即为采用的推荐算法，随着推荐系统的不断更新、改进，越来越多的推荐算法被提出并且应用于不同的领域。服务推荐系统中最为流行和较易扩展的推荐算法之一就是其中的协同过滤（CF）。CF可以挖掘用户隐藏的喜好，利用相似的用户或是相似的物品进行推荐。

但是，CF难以处理数据稀疏性问题，而且，CF也难以挖掘用户行为在时间序列中的变化。这也就意味着在用户与服务数量急剧上升的互联网环境中，CF在服务推荐方面往往达不到很好的效果。同时，由于用户的行为会因为时间的变化而发生改变，CF也难以学习到这一变化对服务推荐产生的影响。

发明内容

本发明的目的是针对现有技术的缺陷，提供了一种结合了协同过滤以及长短期记忆网络，利用相邻时间段的服务质量指标对部分空缺的指标进行填充，以缓解数据稀疏的问题，利用协同过滤筛选出相似群体，再利用长短期记忆网络学习与相似用户或相似服务有关的服务质量指标随时间的变化趋势，从而实现高效准确的服务推荐的基于时间感知的服务推荐方法。

为了实现以上目的，本发明采用以下技术方案：

一种基于时间感知的服务推荐方法，包括以下步骤：

S1、数据预处理，从云服务器处获取用户信息形成数据包，并对数据包进行预处理；

S2、将步骤S1中进行预处理后的数据包根据用户调用服务产生的QoS值，计算用户/服务之间的相似度；

S3、将步骤S2所得的用户/服务的相似度结合该用户/服务对应的地理位置信息，筛选出与目标用户/服务相似度最高的前k个用户/服务的集合；

S4、结合步骤S3所得的相似目标用户/服务的集合，对目标用户的QoS值进行长短期记忆网络模型进行训练，并对目标用户的QoS值进行预测；

S5、结合步骤S4的预测结果，计算出最终的QoS预测值，以根据最终的QoS预测值对目标用户进行服务推荐。

进一步地，本发明还包括以下技术方案：

所述步骤S1的数据预处理包括以下步骤：

S101、数据归一化，利用线性归一化的方法，将QoS值的范围转换到

之间，具体公式如下：

其中，

代表用户u在t时刻调用服务i所产生的QoS指标，

与

分别代表所有QoS指标的最大值与最小值；

S102、利用缺失值相邻时间段内的QoS值填充缺失值，缓解数据稀疏的问题，具体计算公式为：

其中，

代表用户在T时间段内调用对应服务的QoS指标的均值，用来填充值为0 或空的

；

其中，T的定义为：

其中，0与63指时间片的取值范围，d代表前后相邻时间段的长度。

所述步骤S2中用户/服务之间的相似度计算包括以下步骤：

S201、提出基于用户调用服务个数的个性化权重，用户调用的服务越多，该用户所占的权重越大，具体计算公式为：

其中，

表示所有服务的总数量，

表示用户调用过的服务的数量，

代表此权重在整个模型中的影响程度，当

取0时，即可认为该权重不对模型造成影响；

S202、计算重要性权重，调用过两个服务的用户数越多，该服务对目标服务越重要，具体计算公式为：

其中，

代表调用过服务

的用户数量，

代表调用过服务

与服务

的用户；

S203、利用牛顿冷却定理计算服务的兴趣衰减系数，具体计算公式为：

其中，

代表

中的用户上一次调用服务

的时刻，

代表在

时用户对于服务

感兴趣的程度，

代表衰减系数；

S204、结合以上三种权重及系数，采用皮尔逊相关系数计算服务间的相似度，具体计算公式为：

其中，U就是

，代表在

时刻调用过服务

以及服务

的用户集合，

代表在

时刻内所有

内用户调用服务

产生的QoS指标的均值。

所述步骤S203还包括：若每一次用户调用服务时初始的感兴趣程度相同，将权重化简成

。

所述步骤S2中用户之间的相似度计算公式为：

其中，

表示所有用户的数量，

表示调用过该服务的用户的数量，

代表此权重在整个模型中的影响程度；

其中，

代表用户

调用过的服务的数量，

代表被用户

与用户

调用过的服务；

其中，

代表服务上一次被用户调用的时刻，

代表在

时用户

对于服务感兴趣的程度，

代表在

时用户

对于服务感兴趣的程度，

代表衰减系数，

代表自然常数；

其中，S为

，代表在

时刻用户

与

共同调用过的服务集合，

代表用户在

时刻内调用

集合内服务产生的QoS指标的均值。

所述筛选出与目标用户/服务相似度最高的前k个用户/服务的集合包括以下步骤：

S301、根据自治域筛选出与目标用户/服务在同一自治域的用户/服务，若相似用户/服务数量小于k，则扩大筛选范围，进入下一步；若相似用户/服务数量大于k，在这个集合内利用Top-k算法筛选出相似用户/服务，并排除相似度小于0的用户/服务；

若筛选完后的用户数量小于k，则扩大筛选范围；若筛选完后的用户数量不小于k，则返回相似用户/服务集合；

S302、根据国家筛选出与目标用户/服务在同一国家的用户/服务，若相似用户/服务数量小于k，则扩大筛选范围，进入下一步；若相似用户/服务数量大于k，在这个集合内利用Top-k算法筛选出相似用户/服务，并排除相似度小于0的用户/服务；

S303、利用所有数据，计算与其他全部的用户/服务的相似度，利用Top-k算法筛选出前k个相似度不小于0的用户/服务，若不满k个就只用这些相似用户/服务。

所述步骤S4中长短期记忆网络的模型训练以及对于QoS值的预测包括以下步骤：

S401、根据目标用户的相似用户以及目标用户本身构建相关的数据集，并利用数据集训练长短期记忆网络模型，得到目标用户在特定时刻调用目标服务所产生的QoS值；

S402、根据目标服务的相似服务以及目标服务本身构建相关的数据集，并利用数据集训练另一个长短期记忆网络模型，得到目标用户在特定时刻调用目标服务所产生的QoS值；

S403、对预测值进行反归一化处理，计算公式为：

其中，

与

分别代表所有QoS指标的最大值与最小值。

所述步骤S5中最终QoS预测值的计算过程以及服务推荐包括以下步骤：

S501、利用用户间的相似度计算用户平均相似度权重，计算公式为：

其中，

代表填充缺失值时采用的相邻时间段长度；

S502、利用相似用户所预测的QoS值计算基于用户的预测值，计算公式为：

其中，

代表经由LSTM模型得到的基于相似用户的用户u在

时刻调用服务i产生的QoS预测值，

在LSTM训练与预测时相似用户在

时刻调用服务i产生的 QoS值；

S503，利用用户间的相似度计算服务平均相似度权重，计算公式为：

其中，

代表填充缺失值时采用的相邻时间段长度；

S504，利用相似服务所预测的QoS值计算基于服务的预测值，计算公式为：

其中，

代表经由LSTM模型得到的基于相似服务的用户u在

时刻调用服务i产生的QoS预测值，

在LSTM训练与预测时相似服务在

时刻被用户u调用产生的 QoS值；

S505，利用加权的方式结合基于用户的预测方法以及基于服务的预测方法，计算最终的QoS预测值，计算公式为：

其中，

代表基于用户的LSTM预测方法与基于服务的LSTM预测方法所占的比重；

S506，根据预测出的QoS值，选出性能最好的服务推荐给目标用户。

采用本发明技术方案，本发明的有益效果为：

1、本发明利用相邻时间段的QoS值填充部分缺失QoS值，有效缓解了数据稀疏带来的问题，提升了预测的准确性。

2、本发明利用牛顿冷却定律模拟用户对于服务的兴趣变化，更好地考虑到了用户对于服务调用的实际情况。

3、计算相似度时加入个性化权重以及重要性权重，有效地减少了部分数据较少的用户或服务对推荐造成的影响。

4、利用长短期记忆网络进行QoS值预测，有效学习了时序上QoS变化的规律，提高了服务推荐的准确性。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。

本发明的一种基于时间感知的服务推荐方法，方法结合了协同过滤以及长短期记忆网络，提高了服务推荐的准确性，具体包括如下步骤：

S1、数据预处理，对收集到的数据进行预处理，以减少数据本身带来的误差并在一定程度上缓解数据稀疏的问题，具体包括如下步骤：

S101，数据归一化，利用线性归一化的方法，将QoS值的范围转换到

之间，具体公式如下：

其中，

代表用户u在t时刻调用服务i所产生的QoS指标，

与

分别代表所有QoS指标的最大值与最小值。

其中，

，其中，T的定义为：

其中，0与63指时间片的取值范围，d代表前后相邻时间段的长度，可以通过调节d来调整缺失值填充依赖的数据范围，从而调整整个模型的预测效果以适应不同稀疏程度的数据与应用场景。

S2、根据用户调用服务产生的QoS值，计算用户（服务）间的相似度，具体包括如下步骤：

S201、由于在实际生活中，不同的用户对服务推荐的贡献是不同的，为了调整不同用户对于相似度的贡献，提出基于用户调用服务个数的个性化权重，用户调用的服务越多，该用户所占的权重越大，具体计算公式为：

其中，

表示所有服务的总数量，

表示用户调用过的服务的数量，

代表此权重在整个模型中的影响程度，当

取0时，即可认为该权重不对模型造成影响。实例中采用的

值为0.9。

S202、为了防止只被少量用户调用过的服务影响相似用户的筛选，引入重要性权重，调用过两个服务的用户数越多，该服务对目标服务越重要，具体计算公式为：

其中，

代表调用过服务

的用户数量，

代表调用过服务

与服务

的用户。

S203、由于用户兴趣会随着时间而产生变化，所以时间因素对于相似度的计算也有影响，本方法利用牛顿冷却定理计算服务的兴趣衰减系数，具体计算公式为:

其中，

代表

中的用户上一次调用服务

的时刻，

代表在

时用户对于服务

感兴趣的程度，

代表衰减系数。在这里，我们假设每一次用户调用服务时初始的感兴趣程度相同，此权重就可以化简成

。实例中采用的

值为0.2。

其中，U就是

，代表在

时刻调用过服务

以及服务

的用户集合，

代表在

时刻内所有

内用户调用服务

产生的QoS指标的均值。

进一步地，用户间的相似度计算具体步骤如下：

S205、与服务间的相似度计算方式类似，用户间相似度的，具体计算公式为：

其中，

表示所有用户的数量，

表示调用过该服务的用户的数量，

代表此权重在整个模型中的影响程度。

代表服务上一次被用户调用的时刻，

代表在

时用户

对于服务感兴趣的程度，

代表衰减系数。S即为

，代表在

时刻用户

与

共同调用过的服务集合，

代表用户在

时刻内调用

集合内服务产生的QoS指标的均值。

S3、根据相似度以及地理位置信息，筛选出与目标用户（服务）相似度最高的前k个用户（服务）集合，具体包括如下步骤：

S301，根据自治域筛选出与目标用户（服务）在同一自治域的用户（服务），若相似用户（服务）数量小于k，则扩大筛选范围，进入下一步；若相似用户（服务）数量大于k，在这个集合内利用Top-k算法筛选出相似用户（服务），并排除相似度小于0的用户（服务）。若筛选完后的用户数量小于k，则扩大筛选范围；若筛选完后的用户数量不小于k，则返回相似用户（服务）集合。

S302、根据国家筛选出与目标用户（服务）在同一国家的用户（服务），若相似用户（服务）数量小于k，则扩大筛选范围，进入下一步；若相似用户（服务）数量大于k，在这个集合内利用Top-k算法筛选出相似用户（服务），并排除相似度小于0的用户（服务）。若筛选完后的用户数量小于k，则扩大筛选范围；若筛选完后的用户数量不小于k，则返回相似用户（服务）集合。

S303、利用所有数据，计算与其他全部的用户（服务）的相似度，利用Top-k算法筛选出前k个相似度不小于0的用户（服务），若不满k个就只用这些相似用户（服务）。

S4、利用与目标用户以及相似用户相关的QoS值对长短期记忆网络模型进行训练并对目标QoS值进行预测，具体包括如下步骤：

S401、根据目标用户的相似用户以及目标用户本身构建相关的数据集，并利用数据集训练长短期记忆网络模型，得到目标用户在特定时刻调用目标服务所产生的QoS值。实例中使用的学习率为0.1，隐藏神经元个数为25。

S402、根据目标服务的相似服务以及目标服务本身构建相关的数据集，并利用数据集训练另一个长短期记忆网络模型，得到目标用户在特定时刻调用目标服务所产生的QoS值。实例中使用的学习率为0.1，隐藏神经元个数为25。

S403、对预测值进行反归一化处理，具体计算公式为：

其中，

与

分别代表所有QoS指标的最大值与最小值。

S5、结合S4中的结果，计算最终的QoS预测值并根据结果对目标用户进行服务推荐，具体包括如下步骤：

S501、利用用户间的相似度计算用户平均相似度权重，具体计算公式为：

其中，

代表填充缺失值时采用的相邻时间段长度。

S502、利用相似用户所预测的QoS值计算基于用户的预测值，具体计算公式为：

其中，

代表经由LSTM模型得到的基于相似用户的用户u在

时刻调用服务i产生的QoS预测值，

在LSTM训练与预测时相似用户在

时刻调用服务i产生的 QoS值。

S503、利用用户间的相似度计算服务平均相似度权重，具体计算公式为：

其中，

代表填充缺失值时采用的相邻时间段长度。

S504、利用相似服务所预测的QoS值计算基于服务的预测值，具体计算公式为：

其中，

代表经由LSTM模型得到的基于相似服务的用户u在

时刻调用服务i产生的QoS预测值，

在LSTM训练与预测时相似服务在

时刻被用户u调用产生的 QoS值。

S505、利用加权的方式结合基于用户的预测方法以及基于服务的预测方法，计算最终的QoS预测值，具体计算公式为：

其中，

代表基于用户的LSTM预测方法与基于服务的LSTM预测方法所占的比重。

S506、根据预测出的QoS值，选出性能最好的服务（响应时间短且吞吐量大）推荐给目标用户。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。