CN110134878B - 基于用户偏好与服务变化双向感知的移动服务推荐方法 - Google Patents
基于用户偏好与服务变化双向感知的移动服务推荐方法 Download PDFInfo
- Publication number
- CN110134878B CN110134878B CN201910407619.7A CN201910407619A CN110134878B CN 110134878 B CN110134878 B CN 110134878B CN 201910407619 A CN201910407619 A CN 201910407619A CN 110134878 B CN110134878 B CN 110134878B
- Authority
- CN
- China
- Prior art keywords
- service
- mobile service
- track
- mobile
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种基于用户偏好与服务变化双向感知的移动服务推荐方法,所述方法如下步骤:部署数据采集系统,定时采集移动服务的前端数据并处理,生成服务的新增与退出、服务的受欢迎度以及服务的更新功能集合信息;收集用户的移动服务使用记录,计算各个移动服务的活跃度,形成用户的移动服务轨道数据;构建TRACK_DATA与UDATEFUNCTION_HISTORY之间的关系模型;根据CURRENT用户的移动服务轨道数据,预测用户期望的更新功能更集合,并从CURRENT时间段内监控的移动服务中选择契合用户期望的移动服务推荐给用户。该方法能实现用户偏好与服务变化的双向感知,并根据感知结果进行精准的移动服务推荐。
Description
技术领域
本发明属于移动服务技术领域,涉及一种移动服务推荐方法,具体涉及一种基于用户偏好与服务变化双向感知的移动服务推荐方法。
背景技术
近年来,随着移动互联网的飞速发展,移动服务的数量也呈现高速增长。用户寻找自己感兴趣的移动服务开始变得越来越困难,出现了严重的信息过载问题。因此,针对用户的移动服务推荐显得尤为重要。移动服务推荐可以帮助用户过滤无用的信息,从而使用户发现感兴趣的服务。
目前较为普遍的服务推荐方法主要有基于协同过滤与基于内容的推荐,基于协同过滤算法认为具有相似行为兴趣的用户喜欢相同的服务,而基于内容的推荐则将与用户曾经喜欢的服务相类似的其他服务推荐给用户,这些方法存在以下两个缺陷,一是不能准确感知用户真正的喜好,忽略用户自身喜好所带来的需求;二是认为用户的兴趣偏好和服务本身都是静态的,没有考虑两者的变化因素,而实际上,用户的兴趣会随着时间不断地变化,服务本身也在持续地改变。
所以,如何在考虑用户兴趣和服务变化的基础上,较为精准地为用户推荐所需的移动服务是服务推荐领域的难点与重点。
发明内容
为了解决现有技术中存在的以上问题,本发明提供了一种基于用户偏好与服务变化双向感知的移动服务推荐方法。该方法能实现用户偏好与服务变化的双向感知,并根据感知结果进行精准的移动服务推荐。
本发明的目的是通过以下技术方案实现的:
一种基于用户偏好与服务变化双向感知的移动服务推荐方法,包括如下步骤:
步骤一、部署数据采集系统,监控应用市场里六种类型下的所有移动服务,每天定时采集这些移动服务的前端数据,并对采集的数据进行处理,生成服务的新增与退出、服务的受欢迎度以及服务的更新功能集合信息;
步骤二、收集用户的移动服务使用记录,计算各个移动服务的活跃度,形成用户的移动服务轨道数据;
步骤三、选择某个历史时间段HISTORY,获取在HISTORY时间段内P个用户,总计V个移动服务的轨道数据TRACK_DATA以及HISTORY时间内这V个移动服务的更新功能集合UDATEFUNCTION_HISTORY,构建TRACK_DATA与UDATEFUNCTION_HISTORY之间的关系模型;
步骤四、使用步骤三建立好的关系模型,根据当前时间段CURRENT用户的移动服务轨道数据,预测用户期望的更新功能更集合,并从数据采集系统在CURRENT时间段内监控的移动服务中选择契合用户期望的移动服务推荐给用户。
相比于现有技术,本发明具有如下优点:
本发明充分考虑了用户真实兴趣偏好和服务两者的动态变化,并根据历史数据建立起了用户兴趣偏好变化与服务功能变化之间的关系模型,通过关系模型可以较为精确地预测用户期望的更新功能集合,根据预测的结果推荐给用户的移动服务能够最大程度契合用户的期望。
附图说明
图1是本发明移动服务推荐方法的工作流程示意图;
图2是本发明功能抽取器的工作流程示意图;
图3是本发明GBRT模型的构建示意图。
具体实施方式
下面结合附图对本发明的技术方案作进一步的说明,但并不局限于此,凡是对本发明技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,均应涵盖在本发明的保护范围中。
本发明提供了一种基于用户偏好与服务变化双向感知的移动服务推荐方法,如图1所示,所述方法具体包括如下步骤:
步骤一、部署数据采集系统,监控应用市场里六种类型下的所有移动服务,每天定时采集这些移动服务的前端数据,并对采集的数据进行一系列处理,生成服务的新增与退出、服务的受欢迎度以及服务的更新功能集合等信息。
本步骤中,数据采集系统监控的移动服务所属的六种类型分别是便捷生活、影音播放、社交网络、新闻资讯、学习办公以及网购支付。
本步骤中,移动服务的前端数据包括六种类型下所有移动服务的统一资源定位符URL、移动服务的下载量DOWNLOAD、好评率LIKERATE以及最新版本更新内容UPDATECONTENT。
本步骤中,服务的新增与退出信息是通过对比相邻两次采集的所有移动服务的统一资源定位符集合来获取的,假设前一次采集的统一资源定位符的集合为LASTURLS,本次采集的统一资源定位符集合为NOWURLS,则新增的服务为NOWURLS和LASTURLS的差集NOWURLS\LASTURLS,退出的服务为LASTURLS与NOWURLS的差集LASTURLS\NOWURLS。
本步骤中,服务的受欢迎度POPULARITY定义为移动服务的下载量DOWNLOAD与移动服务的好评率LIKERATE乘积:
POPULARITY=DOWNLOAD×LIKERATE。
本步骤中,服务的更新功能集合UPDAFUNCTION是指通过功能抽取器从最新版本更新内容UPDATECONTENT中抽取的功能短语,其工作流程如图2所示,功能抽取器先对最新版本的更新内容UPDATECONTENT进行分词,然后进行词性标注,再进行依存语法分析,最后从分析结果中抽取出名词加动词的主谓短语。
步骤二、收集用户的移动服务使用记录,计算各个移动服务的活跃度,形成用户的移动服务轨道数据。
本步骤中,假设用户的相关移动服务有S1,S2,…Sn,移动服务的活跃度指的是一段时间内用户花费在该移动服务的总时长,其中一段时间可以为一周。假设该段时间内活跃度最高的是移动服务Si,活跃度值为LT,活跃度最低的是移动服务Sj,活跃度值为ST,则将区间[LT,ST]划分成10个更小的等长区间[LT1,ST1],…,[LT10,ST10],每个区间称之为一个轨道,区间的编号i为轨道的值,轨道值越小,代表该移动服务越频繁被使用,每个移动服务根据其使用时长划分到相应的轨道,例如,Si的活跃度值在[LTi,STi]之间,则Si的轨道为i。用户使用的所有移动服务及其轨道(S1,TRACK1),(S2,TRACK2),…,(Sn,TRACKn)汇集起来便形成了本步骤所述的用户的移动服务轨道数据。
步骤三、选择某个历史时间段HISTORY,获取在HISTORY时间段内P个用户,总计V个移动服务的轨道数据TRACK_DATA以及HISTORY时间内这V个移动服务的更新功能集合UDATEFUNCTION_HISTORY,构建TRACK_DATA与UDATEFUNCTION_HISTORY之间的关系模型。
本步骤中,历史时间段HISTORY是一段长为m周的时间,移动服务轨道数据来自于P个用户,总共涵盖V个移动服务,平均每个用户包含大约V/P个移动服务,最终得到的移动服务轨道数据TRACK_DATA如下所示:
其中,Si表示第i移动服务,[TRACKi1,…TRACKim]表示第i个移动服务1至m周的轨道值。
m周内V个移动服务的更新功能集合
UPDATEFUNCTION_HISTORY如下所示:
其中,UFi表示第i移动服务在1至m周的更新功能集合。
本步骤中,TRACK_DATA与UPDATEFUNCTION_HISTORY之间关系的构建主要采用集成学习方法中的梯度上升回归树(GBRT)模型,具体包括以下分步骤:
①对于TRACK_DATA中每个移动服务Si的轨道序列[TRACKi1,…TRACKim],提取其统计特征xi1、熵特征xi2以及分段特征xi3,其中:统计特征xi1包括最小(MIN)、最大值(MAX)、均值(MEAN)、方差(VAR),熵特征xi2包括BINNED ENTROPY、APPROXIMATE ENTROPY,分段特征xi3包括分段聚合逼近(PAA),将这三类特征连接成一维的特征向量Xi=[xi1,xi2,xi3]。所述的BINNED ENTROPY、APPROXIMATEENTROPY、PAA的计算方法分别如下:
a、BINNEDENTROPY:
从熵的定义出发,考虑把序列T的取值进行分桶操作,将[MIN(T),MAX(T)]等分为MAXBIN个桶,T的取值就会分散在这MAXBIN个桶中,根据等距分桶的情况,计算出这个概率分布的熵:
其中,Pk表示序列T的取值落在第k个桶的概率,MAXBIN表示桶的个数,LEN(T)表示序列T的长度。
如果序列T的BINNEDENTROPY的取值较大,说明序列T的取值是较为均匀的分布在[MIN(T),MAX(T)]之间的,相反,如果取值较小,说明取值是集中在某一段的。
b、APPROXIMATEENTROPY:
假设序列T:{t1,…tN}的长度为N,同时APPROXIMATEENTROPY拥有两个参数q和r,计算APPROXIMATEENTROPY的步骤如下:
Step1:固定两个参数,正整数q和整数r,q是为了对序列进行一个片段的提取,r是表示两个序列之间距离的参数,需要构造新的q维向量如下:
Step2:通过新的向量T1(q),…TN-q+1(q),计算哪些向量与Ti较为相似:
在这里,距离d通常选择L2范数;
Step3:考虑函数
Step4:APPROXIMATEENTROPY的值为:
APPROXIMATE ENTROPY(q,r)=Φm(r)-Φm+1(r);
如果序列X具有某种趋势或重复片段,那么它的APPROXIMATE ENTROPY就会很小,反之,如果序列X几乎是随机出现的,那么它的APPROXIMATEENTROPY就会很大。
c、PAA:
式中,N表示原始序列的长度,w表示产生的PAA序列的长度,w取值越小,PAA对原始序列的抽象程度越低,在这里,w通常取3~5,i={1,2,…,w}。
②使用LDA主题模型对UPDATEFUNCTION_HISTORY的每一个移动服务Si的更新功能集合UFi进一步抽象表示,形成主题分布向量TSi,将该向量作为目标变量Yi的值。
③将上述两个步骤中得到的移动服务Si的特征向量Xi以及其对应的目标变量Yi作为第i条训练样例,V个移动服务总共构成大小为V条训练样例的训练集,输入GBRT模型进行训练,并将训练结束后的模型持久化到磁盘。
步骤四、使用建立好的关系模型,根据当前时间段CURRENT用户的移动服务轨道数据,预测用户期望的更新功能更集合,并从数据采集系统在CURRENT时间段内监控的移动服务中选择契合用户期望的移动服务推荐给用户。若CURRENT时间段内用户的移动服务轨道数据为TRACK_DATA_USER,预测的用户期望的更新功能集合的主题分布向量为TU',则步骤一CURRENT时间段内监控的所有移动服务的更新功能集合为UPDATEFUNCTION_CURRENT,将其中每一个移动服务的更新功能集合通过主题模型表示成主题分布向量TSi',计算TSi'与用户期望的主题分布向量TU'之间的相似度,并将相似度最大的移动服务推荐给用户。
本步骤中,选择的当前时间段CURRENT是最近u周,用户移动服务轨道数据为TRACK_DATA_USER,数据采集系统监控下的最近u周所有移动服务的更新功能集合为UPDATEFUNCTION_CURRENT,加载训练好的GBRT模型,预测用户期望的更新功能集合的主题分布向量TU',然后再将UPDATEFUNCTION_CURRENT中的每一个移动服务Si'的更新功能集合UFi'通过主题模型表示成主题分布向量TSi',计算其与TU'的相似度,最后将相似度最大的移动服务推荐给用户。
本步骤中,TSi'和TU'相似度的度量采用余弦相似度计算方法,余弦相似度计算方法的公式为:
Claims (5)
1.一种基于用户偏好与服务变化双向感知的移动服务推荐方法,其特征在于所述方法包括如下步骤:
步骤一、部署数据采集系统,监控应用市场里六种类型下的所有移动服务,每天定时采集这些移动服务的前端数据,并对采集的数据进行处理,生成服务的新增与退出、服务的受欢迎度以及服务的更新功能集合信息,其中:
数据采集系统监控的移动服务所属的六种类型分别是便捷生活、影音播放、社交网络、新闻资讯、学习办公以及网购支付;
移动服务的前端数据包括六种类型下所有移动服务的统一资源定位符URL、移动服务的下载量DOWNLOAD、好评率LIKERATE以及最新版本更新内容UPDATECONTENT;
步骤二、收集用户的移动服务使用记录,计算各个移动服务的活跃度,形成用户的移动服务轨道数据,具体步骤如下:
假设用户的相关移动服务有S1,S2,…Sn,移动服务的活跃度指的是一段时间内用户花费在该移动服务的总时长,假设该段时间内活跃度最高的是移动服务Si,活跃度值为LT,活跃度最低的是移动服务Sj,活跃度值为ST,则将区间[LT,ST]划分成10个等长区间[LT1,ST1],…,[LT10,ST10],每个区间称之为一个轨道,每个移动服务根据其使用时长划分到相应的轨道,用户使用的所有移动服务及其轨道(S1,TRACK1),(S2,TRACK2),…,(Sn,TRACKn)汇集起来形成用户的移动服务轨道数据;
步骤三、选择某个历史时间段HISTORY,获取在HISTORY时间段内P个用户,总计V个移动服务的轨道数据TRACK_DATA以及HISTORY时间内这V个移动服务的更新功能集合UDATEFUNCTION_HISTORY,构建TRACK_DATA与UDATEFUNCTION_HISTORY之间的关系模型,其中:
TRACK_DATA与UPDATEFUNCTION_HISTORY之间关系的构建主要采用集成学习方法中的梯度上升回归树模型,具体包括以下分步骤:
①对于TRACK_DATA中每个移动服务Si的轨道序列[TRACKi1,…TRACKim],提取其统计特征xi1、熵特征xi2以及分段特征xi3,将这三类特征连接成一维的特征向量Xi=[xi1,xi2,xi3];
所述统计特征xi1包括最小值MIN、最大值MAX、均值MEAN、方差VAR,熵特征xi2包括BINNEDENTROPY、APPROXIMATE ENTROPY,分段特征xi3包括分段聚合逼近PAA;
所述BINNED ENTROPY、APPROXIMATE ENTROPY、PAA的计算方法分别如下:
a、BINNED ENTROPY:
从熵的定义出发,把序列T的取值进行分桶操作,将[MIN(T),MAX(T)]等分为MAXBIN个桶,根据等距分桶的情况,计算出概率分布的熵:
其中,Pk表示序列T的取值落在第k个桶的概率,MAXBIN表示桶的个数,LEN(T)表示序列T的长度;
b、APPROXIMATE ENTROPY:
假设序列T:{t1,…tN}的长度为N,同时APPROXIMATE ENTROPY拥有两个参数q和r,计算APPROXIMATE ENTROPY的步骤如下:
Step1:固定两个参数,正整数q和整数r,r是表示两个序列之间距离的参数,为了对序列进行一个片段的提取,构造新的q维向量如下:
Step2:通过新的向量T1(q),…TN-q+1(q),计算哪些向量与Ti相似:
Ci q=(number of Tj(q)such that d(Ti(q),Tj(q)≤r))/(N-q+1);
在这里,距离d选择L2范数;
Step3:考虑函数
Step4:APPROXIMATE ENTROPY的值为:
APPROXIMATE ENTROPY(q,r)=Φm(r)-Φm+1(r);
c、PAA:
式中,N表示原始序列的长度,w表示产生的PAA序列的长度;
②使用LDA主题模型对UPDATEFUNCTION_HISTORY的每一个移动服务Si的更新功能集合UFi抽象表示,形成主题分布向量TSi,将该向量作为目标变量Yi的值;
③将上述①、②两个步骤中得到的移动服务Si的特征向量Xi以及其对应的目标变量Yi作为第i条训练样例,V个移动服务总共构成大小为V条训练样例的训练集,输入GBRT模型进行训练,并将训练结束后的模型持久化到磁盘;
步骤四、使用步骤三建立的关系模型,根据当前时间段CURRENT用户的移动服务轨道数据,预测用户期望的更新功能集合,并从数据采集系统在CURRENT时间段内监控的移动服务中选择契合用户期望的移动服务推荐给用户。
2.根据权利要求1所述的基于用户偏好与服务变化双向感知的移动服务推荐方法,其特征在于所述步骤一中,服务的新增与退出信息是通过对比相邻两次采集的所有移动服务的统一资源定位符集合来获取的,假设前一次采集的统一资源定位符的集合为LASTURLS,本次采集的统一资源定位符集合为NOWURLS,则新增的服务为NOWURLS和LASTURLS的差集NOWURLS\LASTURLS,退出的服务为LASTURLS与NOWURLS的差集LASTURLS\NOWURLS;服务的受欢迎度POPULARITY定义为移动服务的下载量DOWNLOAD与移动服务的好评率LIKERATE乘积:POPULARITY=DOWNLOAD×LIKERATE;服务的更新功能集合UPDAFUNCTION是指通过功能抽取器从最新版本更新内容UPDATECONTENT中抽取的功能短语,功能抽取器先对最新版本的更新内容UPDATECONTENT进行分词,然后进行词性标注,再进行依存语法分析,最后从分析结果中抽取出名词加动词的主谓短语。
4.根据权利要求1所述的基于用户偏好与服务变化双向感知的移动服务推荐方法,其特征在于所述步骤四中,选择的当前时间段CURRENT是最近u周,用户移动服务轨道数据为TRACK_DATA_USER,数据采集系统监控下的最近u周所有移动服务的更新功能集合为UPDATEFUNCTION_CURRENT,加载训练好的GBRT模型,预测用户期望的更新功能集合的主题分布向量TU',然后再将UPDATEFUNCTION_CURRENT中的每一个移动服务Si'的更新功能集合UFi'通过主题模型表示成主题分布向量TSi',计算TSi'与TU'的相似度,最后将相似度最大的移动服务推荐给用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910407619.7A CN110134878B (zh) | 2019-05-16 | 2019-05-16 | 基于用户偏好与服务变化双向感知的移动服务推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910407619.7A CN110134878B (zh) | 2019-05-16 | 2019-05-16 | 基于用户偏好与服务变化双向感知的移动服务推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110134878A CN110134878A (zh) | 2019-08-16 |
CN110134878B true CN110134878B (zh) | 2022-12-16 |
Family
ID=67574543
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910407619.7A Active CN110134878B (zh) | 2019-05-16 | 2019-05-16 | 基于用户偏好与服务变化双向感知的移动服务推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110134878B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114004654A (zh) * | 2021-11-04 | 2022-02-01 | 中南大学 | 基于大数据分析的互联网卡用户画像构建方法及系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015062623A1 (en) * | 2013-10-28 | 2015-05-07 | Telefonaktiebolaget L M Ericsson (Publ) | Group recommendation for selection of service items |
CN107491992B (zh) * | 2017-08-25 | 2020-12-25 | 哈尔滨工业大学(威海) | 一种基于云计算的智能服务推荐方法 |
CN107562947B (zh) * | 2017-09-26 | 2021-07-02 | 宿州学院 | 一种移动时空感知下动态即时推荐服务模型建立方法 |
-
2019
- 2019-05-16 CN CN201910407619.7A patent/CN110134878B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN110134878A (zh) | 2019-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021042826A1 (zh) | 一种视频播放完整度预测方法及装置 | |
CN107038213B (zh) | 一种视频推荐的方法及装置 | |
CN109960761B (zh) | 信息推荐方法、装置、设备及计算机可读存储介质 | |
CN105930425A (zh) | 个性化视频推荐方法及装置 | |
CN110851706B (zh) | 用户点击模型的训练方法、装置、电子设备及存储介质 | |
CN103106208A (zh) | 一种移动互联网中的流媒体内容推荐方法和系统 | |
CN112052387B (zh) | 一种内容推荐方法、装置和计算机可读存储介质 | |
CN112597395A (zh) | 对象推荐方法、装置、设备及存储介质 | |
CN105100164B (zh) | 网络服务推荐方法和装置 | |
CN105430505A (zh) | 一种基于组合策略的iptv节目推荐方法 | |
CN114637911B (zh) | 一种注意力融合感知网络的下一个兴趣点推荐方法 | |
CN111125429A (zh) | 一种视频推送方法、装置和计算机可读存储介质 | |
CN108595526B (zh) | 资源推荐方法及装置 | |
CN113207010A (zh) | 模型训练方法、直播推荐方法、设备、程序产品 | |
CN111259231A (zh) | 应用程序的推荐方法和装置 | |
CN111259195A (zh) | 一种视频推荐方法、装置、电子设备及可读存储介质 | |
CN112100221A (zh) | 一种资讯推荐方法、装置、推荐服务器及存储介质 | |
CN113362109A (zh) | 媒介资源的推荐方法、装置、电子设备、存储介质 | |
CN110598126B (zh) | 基于行为习惯的跨社交网络用户身份识别方法 | |
CN110134878B (zh) | 基于用户偏好与服务变化双向感知的移动服务推荐方法 | |
CN106604068A (zh) | 一种更新媒体节目的方法及其系统 | |
CN108024148B (zh) | 基于行为特征的多媒体文件识别方法、处理方法及装置 | |
CN112565902A (zh) | 一种视频推荐方法、装置及电子设备 | |
CN115795156A (zh) | 物料召回和神经网络训练方法、装置、设备及存储介质 | |
CN110413770A (zh) | 将群消息归类到群话题的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |