CN107493328B

CN107493328B - 一种基于特征融合的合作缓存方法

Info

Publication number: CN107493328B
Application number: CN201710693249.9A
Authority: CN
Inventors: 王源; 江昊; 吴静; 周建国; 胡芷毅; 张毅
Original assignee: Wuhan University WHU
Current assignee: Wuhan University WHU
Priority date: 2017-08-14
Filing date: 2017-08-14
Publication date: 2019-10-11
Anticipated expiration: 2037-08-14
Also published as: CN107493328A

Abstract

本发明公开了一种基于特征融合的合作缓存方法，利用移动互联网的基站数据集，获得用户的内容相似矩阵和位置相似矩阵，所述用户记录包括单个用户在不同时间分别访问的基站和上网内容；对内容相似矩阵和位置相似矩阵进行融合，得到融合后的相似矩阵；利用融合后的相似矩阵对用户进行聚类，得到用户的类别关系；将用户类别关系映射到基站，得到基站的合作关系；根据得到的基站的合作关系，计算基站的缓存策略。本发明利用移动互联网的基站数据集，从基站合作的角度，提出一个新方法，确定基站的缓存内容。

Description

一种基于特征融合的合作缓存方法

技术领域

本发明属于移动互联网技术领域，特别涉及一种基于特征融合的合作缓存方法。

背景技术

随着信息技术的发展，带有定位功能的移动电子设备被广泛的应用到人们的日常生活中来。从支撑用户移动通话、社交网络等通信行为的智能手机、平板电脑，到公交车、出租车等公共交通工具中的车载GPS，都能长时间、高精度的跟踪个体的空间移动行为。进入到大数据时代，这些能够高效的记录人类移动轨迹的设备所产生的包含丰富的关于人类日常行为位置信息的数据被保存下来，使得基于大规模原始数据的人类移动行为研究成为可能。

核心网部分功能下沉至基站侧已成为新的趋势，于是一种协作缓存的思想应运而生。地理空间上的基站被划分为若干社区，每个社区都由一个管理单元控制。当用户关联至基站时，该基站与其合作基站可以共同为用户提供服务。因此，缓存方法的设计需要考虑用户上网偏好行为的影响。为了解决上述矛盾，网络运营商需要知道在什么地方缓存什么内容。考虑到移动互联网的本质是以用户为中心，利用移动通信网络技术为用户提供互联网服务。同时考虑用户在多个维度上的行为偏好特征，从复杂的异质群体中挖掘多维度相似用户群体是解决上述矛盾的有效途径，通过为不同的群体提供其所需的网络资源，可以在保证用户体验的同时减少网络资源的浪费。

挖掘多维度相似用户群体的前提是获得用户群体在多维度描述下的相似描述。随着移动互联网、物联网及数据采集技术的发展，我们面临各种各样的数据集合，这就使得同一个用户对象具有多种维度的描述，比如可以分别从时间、空间和内容三个维度描述用户的行为特征。目前可从基于阶段角度、基于特征级别角度以及基于高层语义信息的角度等三个角度融合不同类型的数据信息。考虑到基于阶段角度、基于特征级别角度融合方法的不足，以及相似矩阵层面融合方法的优势，选择在高层语义信息层面利用不同维度的相似矩阵对多种数据类型进行融合。

发明内容

本发明针对上述问题，提出了一种基于特征融合的合作缓存方法，为基站间构建合作关系，并在此基础上制定基站缓存策略。

本发明所采用的技术方案是：一种基于特征融合的合作缓存方法，其特征在于，包括以下步骤：

步骤1：利用移动互联网的基站数据集，获得用户的内容相似矩阵和位置相似矩阵；

步骤2：对步骤1中的内容相似矩阵和位置相似矩阵进行融合，得到融合后的相似矩阵；

步骤3：根据步骤2中得到的融合后的相似矩阵对用户进行聚类，得到用户的类别关系；

步骤4：将步骤3中得到的用户类别关系映射到基站，得到基站的合作关系；

步骤5：根据步骤5中得到的基站的合作关系，计算基站的缓存策略。

相对于现有技术，本发明的有益效果为：能够有效利用下一代移动互联网的核心功能下沉的特点，通过基站侧缓存提升传输资源的利用效率；利用下一代移动互联网资源池化的特点，有针对性地设计了基站间的合作服务策略，提升基站存储空间的利用效率；同时用多维度对用户的特征和访问习惯进行描述，完整地刻画了用户的使用习惯，制定更有针对性的服务策略，从服务速率和质量等方面提升用户体验。

附图说明

图1为本发明实施例的流程图。

具体实施方式

为了便于本领域普通技术人员理解和实施本发明，下面结合附图及实施例对本发明作进一步的详细描述，应当理解，此处所描述的实施示例仅用于说明和解释本发明，并不用于限定本发明。

请见图1，本发明提供的一种基于特征融合的合作缓存方法，包括以下步骤：

步骤1.1：统计每个用户访问过的内容集合和位置集合；

例如，获取单个用户记录<时间，基站，内容>，如<t1,cell1,time1,load1>等，对其进行统计后的结果得到<用户，内容列表>和<用户，基站列表>，如<u1,{c1,c2,c3……}>，<u1,{l1,l2,l3}>；

步骤1.2：令第i个用户访问的内容集合为C_i，第i个用户访问的位置集合为L_i，则第i个用户和第j个用户之间的内容相似度为：

其中，

那么第i个用户和第j个用户之间的位置相似度为：

其中，U_k是内容k的流行程度，N_k是位置k的流行程度。

步骤2.1：令融合优化式为：

其中，P₁、P₂为待融合的相似矩阵，P为待求解的融合矩阵，α、β、λ为可调整系数；

步骤2.2：令

g(P)＝λ||P||₁；

故迭代式为：

其中：表示对f(P_k)求梯度，L表示步骤2.1中的融合优化式中的Lipschitz常数，P_k表示第k次迭代的结果；

求得：

步骤2.3：令y₁＝P₀，t₁＝1，k＝1，L＝L(f)，max_iter为最大迭代次数；

执行下述循环：

当k<max_iter， k＝k+1。

步骤3.1：初始将每一个用户当做一个类，计算模块度modularity_origin；

步骤3.2：对每一个类，依次将其与其相邻的用户合并成一个新的类，计算全局模块度modularity_new；

步骤3.3：如果全局模块度modularity_new大于modularity_origin，令modularity_origin＝modularity_new，并保留步骤3.2中的合并结果；

步骤3.4：当还有用户没有遍历到，循环执行步骤3.2；

步骤3.5：判断上一轮循环是否有模块度提升，如果没有则循环结束，如果有则将合并后的结果作为输入重新开始循环执行步骤3.2。

步骤4.1：对于步骤3中得到的每一个用户类，统计该类访问过的基站及访问次数；

步骤4.2：对于每一个基站将其放入到访问其次数最多的用户类中；

例如，用户类U1和用户类U2均访问了基站B1，用户类U1访问基站B1的次数为900次，用户类U2访问基站B1的次数为1200次，那么基站B1将被放入用户类U2；

步骤4.3：属于同一个用户类的基站间构建合作关系。

例如，基站B2和基站B3均属于用户类U3，那么基站B2和基站B3之间有合作关系；基站B4属于用户类B4，那么基站B4和基站B2，基站B4和基站B3之间没有合作关系。

步骤5：根据步骤5中得到的基站的合作关系，计算基站的缓存策略；

具体实现过程为：

设基站B_j上已缓存的内容大小为k，基站B_j的缓存空间为V_j，第i个用户访问的内容集合为C_i；对于每一个内容C_i，检查每一个基站B_j，若V_j-k>0，则直接将内容C_i缓存至基站B_j；V_j-k＝0，将C_i替换当前缓存的内容中收益Profit最小的一个，重新计算总收益TotalProfit，若TotalProfit-Profit>0，则替换，若TotalProfit-Profit≤0，则不做替换；TotalProfit为基站上所有内容的Profit之和；

其中：

P_ij表示用户向第i个基站请求第j个内容的概率，R_loc为从用户请求的基站获取用户请求的内容的命中率权重，R_remk为从用户请求的基站所在的类的k基站获取用户请求的内容的命中率权重，为一个范围为0～1的值，跟基站k与基站i的距离成反比(传输距离越远传输时间就越长)。

应当理解的是，本说明书未详细阐述的部分均属于现有技术。

应当理解的是，上述针对较佳实施例的描述较为详细，并不能因此而认为是对本发明专利保护范围的限制，本领域的普通技术人员在本发明的启示下，在不脱离本发明权利要求所保护的范围情况下，还可以做出替换或变形，均落入本发明的保护范围之内，本发明的请求保护范围应以所附权利要求为准。

Claims

1.一种基于特征融合的合作缓存方法，其特征在于，包括以下步骤：

步骤1的具体实现包括以下子步骤：

步骤1.1：统计每个用户访问过的内容集合和位置集合；

其中，

那么第i个用户和第j个用户之间的位置相似度为：

其中，U_k是内容k的流行程度，N_k是位置k的流行程度；

步骤2的具体实现包括以下子步骤：

步骤2.1：令融合优化式为：

步骤2.2：令

g(P)＝λ||P||₁；

故迭代式为：

求得：

执行下述循环：

当k＜max_iter， k＝k+1；

步骤5的具体实现过程为：

设基站B_j上已缓存的内容大小为k，基站B_j的缓存空间为V_j，第i个用户访问的内容集合为C_i；对于每一个内容C_i，检查每一个基站B_j，若V_j-k＞0，则直接将内容C_i缓存至基站B_j；V_j-k＝0，将C_i替换当前缓存的内容中收益Profit最小的一个，重新计算总收益TotalProfit，若TotalProfit-Profit＞0，则替换，若TotalProfit-Profit≤0，则不做替换；TotalProfit为基站上所有内容的Profit之和；

其中：

P_ij表示用户向第i个基站请求第j个内容的概率，R_loc为从用户请求的基站获取用户请求的内容的命中率权重，R_remk为从用户请求的基站所在的类的k基站获取用户请求的内容的命中率权重，为一个范围为0～1的值，跟基站k与基站i的距离成反比。

2.根据权利要求1所述的基于特征融合的合作缓存方法，其特征在于，步骤3的具体实现包括以下子步骤：

步骤3.4：当还有用户没有遍历到，循环执行步骤3.2；

3.根据权利要求1所述的基于特征融合的合作缓存方法，其特征在于，步骤4的具体实现包括以下子步骤：

步骤4.3：属于同一个用户类的基站间构建合作关系。