CN107493328B - 一种基于特征融合的合作缓存方法 - Google Patents

一种基于特征融合的合作缓存方法 Download PDF

Info

Publication number
CN107493328B
CN107493328B CN201710693249.9A CN201710693249A CN107493328B CN 107493328 B CN107493328 B CN 107493328B CN 201710693249 A CN201710693249 A CN 201710693249A CN 107493328 B CN107493328 B CN 107493328B
Authority
CN
China
Prior art keywords
base station
user
content
class
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710693249.9A
Other languages
English (en)
Other versions
CN107493328A (zh
Inventor
王源
江昊
吴静
周建国
胡芷毅
张毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201710693249.9A priority Critical patent/CN107493328B/zh
Publication of CN107493328A publication Critical patent/CN107493328A/zh
Application granted granted Critical
Publication of CN107493328B publication Critical patent/CN107493328B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services
    • H04L67/568Storing data temporarily at an intermediate stage, e.g. caching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种基于特征融合的合作缓存方法,利用移动互联网的基站数据集,获得用户的内容相似矩阵和位置相似矩阵,所述用户记录包括单个用户在不同时间分别访问的基站和上网内容;对内容相似矩阵和位置相似矩阵进行融合,得到融合后的相似矩阵;利用融合后的相似矩阵对用户进行聚类,得到用户的类别关系;将用户类别关系映射到基站,得到基站的合作关系;根据得到的基站的合作关系,计算基站的缓存策略。本发明利用移动互联网的基站数据集,从基站合作的角度,提出一个新方法,确定基站的缓存内容。

Description

一种基于特征融合的合作缓存方法
技术领域
本发明属于移动互联网技术领域,特别涉及一种基于特征融合的合作缓存方法。
背景技术
随着信息技术的发展,带有定位功能的移动电子设备被广泛的应用到人们的日常生活中来。从支撑用户移动通话、社交网络等通信行为的智能手机、平板电脑,到公交车、出租车等公共交通工具中的车载GPS,都能长时间、高精度的跟踪个体的空间移动行为。进入到大数据时代,这些能够高效的记录人类移动轨迹的设备所产生的包含丰富的关于人类日常行为位置信息的数据被保存下来,使得基于大规模原始数据的人类移动行为研究成为可能。
核心网部分功能下沉至基站侧已成为新的趋势,于是一种协作缓存的思想应运而生。地理空间上的基站被划分为若干社区,每个社区都由一个管理单元控制。当用户关联至基站时,该基站与其合作基站可以共同为用户提供服务。因此,缓存方法的设计需要考虑用户上网偏好行为的影响。为了解决上述矛盾,网络运营商需要知道在什么地方缓存什么内容。考虑到移动互联网的本质是以用户为中心,利用移动通信网络技术为用户提供互联网服务。同时考虑用户在多个维度上的行为偏好特征,从复杂的异质群体中挖掘多维度相似用户群体是解决上述矛盾的有效途径,通过为不同的群体提供其所需的网络资源,可以在保证用户体验的同时减少网络资源的浪费。
挖掘多维度相似用户群体的前提是获得用户群体在多维度描述下的相似描述。随着移动互联网、物联网及数据采集技术的发展,我们面临各种各样的数据集合,这就使得同一个用户对象具有多种维度的描述,比如可以分别从时间、空间和内容三个维度描述用户的行为特征。目前可从基于阶段角度、基于特征级别角度以及基于高层语义信息的角度等三个角度融合不同类型的数据信息。考虑到基于阶段角度、基于特征级别角度融合方法的不足,以及相似矩阵层面融合方法的优势,选择在高层语义信息层面利用不同维度的相似矩阵对多种数据类型进行融合。
发明内容
本发明针对上述问题,提出了一种基于特征融合的合作缓存方法,为基站间构建合作关系,并在此基础上制定基站缓存策略。
本发明所采用的技术方案是:一种基于特征融合的合作缓存方法,其特征在于,包括以下步骤:
步骤1:利用移动互联网的基站数据集,获得用户的内容相似矩阵和位置相似矩阵;
步骤2:对步骤1中的内容相似矩阵和位置相似矩阵进行融合,得到融合后的相似矩阵;
步骤3:根据步骤2中得到的融合后的相似矩阵对用户进行聚类,得到用户的类别关系;
步骤4:将步骤3中得到的用户类别关系映射到基站,得到基站的合作关系;
步骤5:根据步骤5中得到的基站的合作关系,计算基站的缓存策略。
相对于现有技术,本发明的有益效果为:能够有效利用下一代移动互联网的核心功能下沉的特点,通过基站侧缓存提升传输资源的利用效率;利用下一代移动互联网资源池化的特点,有针对性地设计了基站间的合作服务策略,提升基站存储空间的利用效率;同时用多维度对用户的特征和访问习惯进行描述,完整地刻画了用户的使用习惯,制定更有针对性的服务策略,从服务速率和质量等方面提升用户体验。
附图说明
图1为本发明实施例的流程图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
请见图1,本发明提供的一种基于特征融合的合作缓存方法,包括以下步骤:
步骤1:利用移动互联网的基站数据集,获得用户的内容相似矩阵和位置相似矩阵;
步骤1.1:统计每个用户访问过的内容集合和位置集合;
例如,获取单个用户记录<时间,基站,内容>,如<t1,cell1,time1,load1>等,对其进行统计后的结果得到<用户,内容列表>和<用户,基站列表>,如<u1,{c1,c2,c3……}>,<u1,{l1,l2,l3}>;
步骤1.2:令第i个用户访问的内容集合为Ci,第i个用户访问的位置集合为Li,则第i个用户和第j个用户之间的内容相似度为:
其中,
那么第i个用户和第j个用户之间的位置相似度为:
其中,Uk是内容k的流行程度,Nk是位置k的流行程度。
步骤2:对步骤1中的内容相似矩阵和位置相似矩阵进行融合,得到融合后的相似矩阵;
步骤2.1:令融合优化式为:
其中,P1、P2为待融合的相似矩阵,P为待求解的融合矩阵,α、β、λ为可调整系数;
步骤2.2:令
g(P)=λ||P||1
故迭代式为:
其中:表示对f(Pk)求梯度,L表示步骤2.1中的融合优化式中的Lipschitz常数,Pk表示第k次迭代的结果;
求得:
步骤2.3:令y1=P0,t1=1,k=1,L=L(f),max_iter为最大迭代次数;
执行下述循环:
当k<max_iter, k=k+1。
步骤3:根据步骤2中得到的融合后的相似矩阵对用户进行聚类,得到用户的类别关系;
步骤3.1:初始将每一个用户当做一个类,计算模块度modularity_origin;
步骤3.2:对每一个类,依次将其与其相邻的用户合并成一个新的类,计算全局模块度modularity_new;
步骤3.3:如果全局模块度modularity_new大于modularity_origin,令modularity_origin=modularity_new,并保留步骤3.2中的合并结果;
步骤3.4:当还有用户没有遍历到,循环执行步骤3.2;
步骤3.5:判断上一轮循环是否有模块度提升,如果没有则循环结束,如果有则将合并后的结果作为输入重新开始循环执行步骤3.2。
步骤4:将步骤3中得到的用户类别关系映射到基站,得到基站的合作关系;
步骤4.1:对于步骤3中得到的每一个用户类,统计该类访问过的基站及访问次数;
步骤4.2:对于每一个基站将其放入到访问其次数最多的用户类中;
例如,用户类U1和用户类U2均访问了基站B1,用户类U1访问基站B1的次数为900次,用户类U2访问基站B1的次数为1200次,那么基站B1将被放入用户类U2;
步骤4.3:属于同一个用户类的基站间构建合作关系。
例如,基站B2和基站B3均属于用户类U3,那么基站B2和基站B3之间有合作关系;基站B4属于用户类B4,那么基站B4和基站B2,基站B4和基站B3之间没有合作关系。
步骤5:根据步骤5中得到的基站的合作关系,计算基站的缓存策略;
具体实现过程为:
设基站Bj上已缓存的内容大小为k,基站Bj的缓存空间为Vj,第i个用户访问的内容集合为Ci;对于每一个内容Ci,检查每一个基站Bj,若Vj-k>0,则直接将内容Ci缓存至基站Bj;Vj-k=0,将Ci替换当前缓存的内容中收益Profit最小的一个,重新计算总收益TotalProfit,若TotalProfit-Profit>0,则替换,若TotalProfit-Profit≤0,则不做替换;TotalProfit为基站上所有内容的Profit之和;
其中:
Pij表示用户向第i个基站请求第j个内容的概率,Rloc为从用户请求的基站获取用户请求的内容的命中率权重,Rremk为从用户请求的基站所在的类的k基站获取用户请求的内容的命中率权重,为一个范围为0~1的值,跟基站k与基站i的距离成反比(传输距离越远传输时间就越长)。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (3)

1.一种基于特征融合的合作缓存方法,其特征在于,包括以下步骤:
步骤1:利用移动互联网的基站数据集,获得用户的内容相似矩阵和位置相似矩阵;
步骤1的具体实现包括以下子步骤:
步骤1.1:统计每个用户访问过的内容集合和位置集合;
步骤1.2:令第i个用户访问的内容集合为Ci,第i个用户访问的位置集合为Li,则第i个用户和第j个用户之间的内容相似度为:
其中,
那么第i个用户和第j个用户之间的位置相似度为:
其中,Uk是内容k的流行程度,Nk是位置k的流行程度;
步骤2:对步骤1中的内容相似矩阵和位置相似矩阵进行融合,得到融合后的相似矩阵;
步骤2的具体实现包括以下子步骤:
步骤2.1:令融合优化式为:
其中,P1、P2为待融合的相似矩阵,P为待求解的融合矩阵,α、β、λ为可调整系数;
步骤2.2:令
g(P)=λ||P||1
故迭代式为:
其中:表示对f(Pk)求梯度,L表示步骤2.1中的融合优化式中的Lipschitz常数,Pk表示第k次迭代的结果;
求得:
步骤2.3:令y1=P0,t1=1,k=1,L=L(f),max_iter为最大迭代次数;
执行下述循环:
当k<max_iter, k=k+1;
步骤3:根据步骤2中得到的融合后的相似矩阵对用户进行聚类,得到用户的类别关系;
步骤4:将步骤3中得到的用户类别关系映射到基站,得到基站的合作关系;
步骤5:根据步骤5中得到的基站的合作关系,计算基站的缓存策略;
步骤5的具体实现过程为:
设基站Bj上已缓存的内容大小为k,基站Bj的缓存空间为Vj,第i个用户访问的内容集合为Ci;对于每一个内容Ci,检查每一个基站Bj,若Vj-k>0,则直接将内容Ci缓存至基站Bj;Vj-k=0,将Ci替换当前缓存的内容中收益Profit最小的一个,重新计算总收益TotalProfit,若TotalProfit-Profit>0,则替换,若TotalProfit-Profit≤0,则不做替换;TotalProfit为基站上所有内容的Profit之和;
其中:
Pij表示用户向第i个基站请求第j个内容的概率,Rloc为从用户请求的基站获取用户请求的内容的命中率权重,Rremk为从用户请求的基站所在的类的k基站获取用户请求的内容的命中率权重,为一个范围为0~1的值,跟基站k与基站i的距离成反比。
2.根据权利要求1所述的基于特征融合的合作缓存方法,其特征在于,步骤3的具体实现包括以下子步骤:
步骤3.1:初始将每一个用户当做一个类,计算模块度modularity_origin;
步骤3.2:对每一个类,依次将其与其相邻的用户合并成一个新的类,计算全局模块度modularity_new;
步骤3.3:如果全局模块度modularity_new大于modularity_origin,令modularity_origin=modularity_new,并保留步骤3.2中的合并结果;
步骤3.4:当还有用户没有遍历到,循环执行步骤3.2;
步骤3.5:判断上一轮循环是否有模块度提升,如果没有则循环结束,如果有则将合并后的结果作为输入重新开始循环执行步骤3.2。
3.根据权利要求1所述的基于特征融合的合作缓存方法,其特征在于,步骤4的具体实现包括以下子步骤:
步骤4.1:对于步骤3中得到的每一个用户类,统计该类访问过的基站及访问次数;
步骤4.2:对于每一个基站将其放入到访问其次数最多的用户类中;
步骤4.3:属于同一个用户类的基站间构建合作关系。
CN201710693249.9A 2017-08-14 2017-08-14 一种基于特征融合的合作缓存方法 Active CN107493328B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710693249.9A CN107493328B (zh) 2017-08-14 2017-08-14 一种基于特征融合的合作缓存方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710693249.9A CN107493328B (zh) 2017-08-14 2017-08-14 一种基于特征融合的合作缓存方法

Publications (2)

Publication Number Publication Date
CN107493328A CN107493328A (zh) 2017-12-19
CN107493328B true CN107493328B (zh) 2019-10-11

Family

ID=60645578

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710693249.9A Active CN107493328B (zh) 2017-08-14 2017-08-14 一种基于特征融合的合作缓存方法

Country Status (1)

Country Link
CN (1) CN107493328B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109194763B (zh) * 2018-09-21 2020-05-26 北京邮电大学 一种超密集网络中基于小型基站自组织协作的缓存方法
CN113709816B (zh) * 2021-06-04 2024-03-22 武汉大学 一种基于多特征用户群体的基站协作缓存方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8954556B2 (en) * 2011-12-01 2015-02-10 Verizon Patent And Licensing Inc. Utility-based model for caching programs in a content delivery network
CN104507124A (zh) * 2014-12-24 2015-04-08 中国科学院声学研究所 一种基站缓存的管理方法及用户访问的处理方法
CN105245592A (zh) * 2015-09-29 2016-01-13 西安电子科技大学 基于相近缓存协作的移动网络基站缓存内容放置方法
CN106507415A (zh) * 2016-10-20 2017-03-15 北京工业大学 一种面向移动网络的内容缓存及网络协同方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8954556B2 (en) * 2011-12-01 2015-02-10 Verizon Patent And Licensing Inc. Utility-based model for caching programs in a content delivery network
CN104507124A (zh) * 2014-12-24 2015-04-08 中国科学院声学研究所 一种基站缓存的管理方法及用户访问的处理方法
CN105245592A (zh) * 2015-09-29 2016-01-13 西安电子科技大学 基于相近缓存协作的移动网络基站缓存内容放置方法
CN106507415A (zh) * 2016-10-20 2017-03-15 北京工业大学 一种面向移动网络的内容缓存及网络协同方法

Also Published As

Publication number Publication date
CN107493328A (zh) 2017-12-19

Similar Documents

Publication Publication Date Title
Kumari et al. Multimedia big data computing and Internet of Things applications: A taxonomy and process model
Zheng et al. Semantic caching in location-dependent query processing
Lee et al. Data management in location-dependent information services
CN104412266A (zh) 用于具有动态排序的树结构的多维数据储存和文件系统的方法和装置
CN102523274B (zh) 基于核心网侧的无线个性化精准信息主动推送系统及方法
CN104951570A (zh) 基于数据挖掘及lbs的兼职智能推荐系统
CN111258978A (zh) 一种数据存储的方法
CN103064842B (zh) 信息订阅处理装置和信息订阅处理方法
CN102158365A (zh) 一种网络日志挖掘中的用户聚类方法及系统
WO2021164131A1 (zh) 地图展示方法、系统、计算机设备和存储介质
CN107493328B (zh) 一种基于特征融合的合作缓存方法
CN108647266A (zh) 一种异构数据快速分布存储、交互方法
CN103200269A (zh) 互联网信息统计方法及系统
CN101299198A (zh) 一种动态自适应的网格数据迁移方法
CN116993555A (zh) 国土空间规划重点区域识别的分区方法、系统及存储介质
CN104750860B (zh) 一种不确定数据的数据存储方法
CN109213940B (zh) 大数据下实现用户位置计算的方法、存储介质、设备及系统
CN112950079A (zh) 绿地供需数据处理方法、系统、计算机设备及存储介质
CN111861540A (zh) 信息推送方法、装置、计算机设备和存储介质
CN115329221B (zh) 一种针对多源地理实体的查询方法及查询系统
Zeng et al. Edge oriented urban hotspot prediction for human-centric internet of things
Li et al. Research on the inheritance and protection of data mining technology in national sports
Cheng et al. Point-of-interest recommendation based on bidirectional self-attention mechanism by fusing spatio-temporal preference
CN114168838A (zh) 兴趣点在线搜索排序方法与系统、以及云端搜索服务平台
Qi et al. Big data prediction in location-aware wireless caching: A machine learning approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant