CN103678518A - 一种推荐列表调整方法和装置 - Google Patents

一种推荐列表调整方法和装置 Download PDF

Info

Publication number
CN103678518A
CN103678518A CN201310618205.1A CN201310618205A CN103678518A CN 103678518 A CN103678518 A CN 103678518A CN 201310618205 A CN201310618205 A CN 201310618205A CN 103678518 A CN103678518 A CN 103678518A
Authority
CN
China
Prior art keywords
recommendation list
game class
application
team
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310618205.1A
Other languages
English (en)
Other versions
CN103678518B (zh
Inventor
崔毅东
陈莉萍
梁康
杨谈
李菁
雷友珣
漆涛
金跃辉
周斯达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN201310618205.1A priority Critical patent/CN103678518B/zh
Publication of CN103678518A publication Critical patent/CN103678518A/zh
Application granted granted Critical
Publication of CN103678518B publication Critical patent/CN103678518B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施方式提出一种推荐列表调整方法和装置。方法包括:获取用户的应用下载历史记录,基于所述应用下载历史记录计算在预定时间内,游戏类应用和非游戏类应用在该用户总下载应用中所占比例,以获取游戏类应用和非游戏类应用的偏好指数,并针对该用户生成产生冗余推荐列表;基于计算出的游戏类应用和非游戏类应用的偏好指数调整所述冗余推荐列表以形成最终推荐列表,其中该最终推荐列表中的游戏类应用和非游戏类应用的分布与该用户的游戏类应用和非游戏类应用的偏好指数保持对应;向该用户呈现所述最终推荐列表。本发明使推荐列表能针对不同用户的兴趣偏好差异做出个性化推荐。

Description

一种推荐列表调整方法和装置
技术领域
本发明实施方式涉及信息处理技术领域,更具体地,涉及一种推荐列表调整方法和装置。
背景技术
近年来,随着智能手机,平板电脑等移动终端的普及,移动互联网已经成为用户贴身的媒体。手机已经不再只是一个基本通讯和信息传递的终端,而是成为了一个人们随身携带的娱乐应用终端。这一变化,催生了巨大的移动应用市场产业,比如,著名的"愤怒的小鸟"就是在手机游戏里最受欢迎的游戏之一,与Google地图一样,也几乎成了很多智能手机用户的标准配置。
与此同时,用户的消费方式,消费习惯和消费行为都在随之改变:PC用户和智能手机用户在采购他们服务的时候是有时间区别的,移动终端上的消费者普遍没有耐心,总是希望立刻就可以找到他们想要的东西。有一个很典型的例子,82%利用移动终端订房间的用户,是在24小时以内决定并完成的,几乎就是到了目的地就用手机来订酒店,比在电脑上订酒店的用户,花的时间要短的多。移动终端用户的这种“冲动性购买”、“即时性购买”行为,其实是对传统互联网相对慢条斯理的商务模式的一种颠覆。针对这种新的变化,企业需要在极短的时间内帮助用户找到他们可能感兴趣的应用,以占领移动营销的先机。
目前,在推荐系统领域中比较成熟的应用包括Amazon和Netflix的推荐系统。Amazon推荐系统涉及电子商务领域,使用了混合推荐算法,一种是改进的基于项目的协同过滤技术,另一种是按照用户社交网络中好友关系,给用户推荐好友在Amazon上喜欢的物品;Netflix推荐系统涉及在线影片租赁,采用的同样是一种结合了用户行为模式后改良的基于项目的协同过滤技术。相对于前两个领域,移动应用市场由于受到的关注较少,用户行为特征的研究成果也不多,而且数据稀疏问题更加严重。
发明内容
本发明实施方式提出一种推荐列表调整方法,使推荐列表能针对不同用户的兴趣偏好差异做出个性化推荐。
本发明实施方式提出一种推荐列表调整装置,使推荐列表能针对不同用户的兴趣偏好差异做出个性化推荐。
本发明实施方式的技术方案如下:
一种推荐列表调整方法,包括:
获取用户的应用下载历史记录,基于所述应用下载历史记录计算在预定时间内,游戏类应用和非游戏类应用在该用户总下载应用中所占比例,以获取游戏类应用和非游戏类应用的偏好指数,并针对该用户生成产生冗余推荐列表;
基于计算出的游戏类应用和非游戏类应用的偏好指数调整所述冗余推荐列表以形成最终推荐列表,其中该最终推荐列表中的游戏类应用和非游戏类应用的分布与该用户的游戏类应用和非游戏类应用的偏好指数保持对应;
向该用户呈现所述最终推荐列表。
所述基于计算出的游戏类应用和非游戏类应用的偏好指数调整冗余推荐列表以形成最终推荐列表包括:
从冗余推荐列表中确定正选推荐列表,所述正选推荐列表包括冗余推荐列表中依据预测评分从大到小排序的预定数目项;
计算游戏类应用需要调整进入所述正选推荐列表的数量n,从候选推荐列表中选择评分最高的游戏类应用替代正选列表中评分最低的非游戏类应用,如果双方的评分的差值小于预先设置的阈值则交换成功,反之,交换失败,然后再从候选推荐列表中选择次高的游戏类应用替代正选推荐列表中评分次低的非游戏类应用,如果双方的评分的差值小于所述阈值则交换成功,反之,交换失败,以此类推;其中迭代在满足下列两个条件中的任何一个时结束:
出现评分的差值大于所述阈值;
调整进入正选推荐列表的数目达到n;
将调整后的正选推荐列表确定为最终推荐列表。
所述基于计算出的游戏类应用和非游戏类应用的偏好指数调整冗余推荐列表以形成最终推荐列表包括:
计算游戏类应用需要调整退出正选推荐列表的数量n,从候选推荐列表中选择评分最高的非游戏类应用替代正选列表中评分最低的游戏类应用,如果双方的评分的差值小于预先设置的阈值则交换成功,反之,交换失败,然后再从候选推荐列表中选择次高的非游戏类应用替代正选推荐列表中评分次低的游戏类应用,如果双方的评分的差值小于所述阈值则交换成功,反之,交换失败,以此类推;其中迭代在满足下列两个条件中的任何一个时结束:
出现评分的差值大于所述阈值;
调整进入正选推荐列表的数目达到n;
将调整后的正选推荐列表确定为最终推荐列表。
所述针对该用户生成产生冗余推荐列表包括:
采用基于用户的协同过滤算法针对该用户生成产生冗余推荐列表。
一种推荐列表调整装置,包括偏好指数确定单元、推荐列表生成单元和列表呈现单元,其中:
偏好指数确定单元,用于获取用户的应用下载历史记录,基于所述应用下载历史记录计算在预定时间内,游戏类应用和非游戏类应用在该用户总下载应用中所占比例,以获取游戏类应用和非游戏类应用的偏好指数,并针对该用户生成产生冗余推荐列表;
推荐列表生成单元,用于基于计算出的游戏类应用和非游戏类应用的偏好指数调整冗余推荐列表以形成最终推荐列表,其中该最终推荐列表中的游戏类应用和非游戏类应用的分布与该用户的游戏类应用和非游戏类应用的偏好指数保持对应;
列表呈现单元,用于向该用户呈现所述最终推荐列表。
推荐列表生成单元,用于:
从冗余推荐列表中确定正选推荐列表,所述正选推荐列表包括冗余推荐列表中依据预测评分从大到小排序的预定数目项;
计算游戏类应用需要调整进入正选推荐列表的数量n,从候选推荐列表中选择评分最高的游戏类应用替代正选列表中评分最低的非游戏类应用,如果双方的评分的差值小于预先设置的阈值则交换成功,反之,交换失败,然后再从候选推荐列表中选择次高的游戏类应用替代正选推荐列表中评分次低的非游戏类应用,如果双方的评分的差值小于所述阈值则交换成功,反之,交换失败,以此类推;其中迭代在满足下列两个条件中的任何一个时结束:
出现评分的差值大于所述阈值;
调整进入正选推荐列表的数目达到n;
将调整后的正选推荐列表确定为最终推荐列表。
推荐列表生成单元,用于:
计算游戏类应用需要调整退出正选推荐列表的数量n,从候选推荐列表中选择评分最高的非游戏类应用替代正选列表中评分最低的游戏类应用,如果双方的评分的差值小于预先设置的阈值则交换成功,反之,交换失败,然后再从候选推荐列表中选择次高的非游戏类应用替代正选推荐列表中评分次低的游戏类应用,如果双方的评分的差值小于所述阈值则交换成功,反之,交换失败,以此类推;其中迭代在满足下列两个条件中的任何一个时结束:
出现评分的差值大于所述阈值;
调整进入正选推荐列表的数目达到n;
将调整后的正选推荐列表确定为最终推荐列表。
偏好指数确定单元,用于采用基于用户的协同过滤算法针对该用户生成产生冗余推荐列表。
从上述技术方案可以看出,在本发明实施方式中,获取用户的应用下载历史记录,基于所述应用下载历史记录计算在预定时间内,游戏类应用和非游戏类应用在该用户总下载应用中所占比例,以获取游戏类应用和非游戏类应用的偏好指数,并针对该用户生成产生冗余推荐列表;基于计算出的游戏类应用和非游戏类应用的偏好指数调整所述冗余推荐列表以形成最终推荐列表,其中该最终推荐列表中的游戏类应用和非游戏类应用的分布与该用户的游戏类应用和非游戏类应用的偏好指数保持对应;向该用户呈现所述最终推荐列表。
由此可见,本发明具有下列优点:
(1)、高扩展度;本申请步骤二中的推荐算法可以是任何一个基于评分预测的推荐系统模型。只要算法最终能给出产品的预测分数,不论具体的技术实现如何,都可以使用列表调整算法改进结果,能很好的满足多同商家的需求,不需要对商家已有的系统做太多规模的调整;
(2)、快速;本申请在步骤一中采用离线方式计算用户偏好,这样提高推荐商品列表的调整速度,适用于大型商家对推荐效率的需求;
(3)、对用户兴趣变化反映灵敏;客户的兴趣偏好在相对较短的时间段上稳定,而在相对较长的时间段上会有变化,本申请采用定时计算用户兴趣偏好的方式,随着时间推移,不断调整用户兴趣偏好值,以满足客户不断变更的需求;
(4)、提高精度;由于引入了用户兴趣偏好的指数有利于小区数据稀疏带来的影响,所以调整后的推荐列表将比调整之前的推荐列表在准确性上有更大的提高。
附图说明
图1为根据本发明推荐列表调整方法的流程图。
图2为根据本发明实施方式的推荐列表调整方法的流程图。
图3为根据本发明实施方式推荐列表调整的示范性流程图。
图4为根据本发明实施方式推荐列表调整装置的示范性结构图。
图5为根据本发明推荐列表调整装置的结构图。
图6为推荐列表调整第一实例示意图。
图7为推荐列表调整第二实例示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。
本申请的目标是在已有的推荐算法的基础之上,提供一种用于移动应用市场的推荐系统的推荐列表调整方法及装置,它可以为现有的推荐系统算法服务,在几乎不增加推荐系统额外负担的前提之下,使得推荐结果尽量与用户的兴趣倾向相互一致。
首先,对本申请中涉及的专业术语定义如下:
资讯:在推荐系统领域中,推荐的资讯可以是用户感兴趣的书,商品,新闻,智能终端应用等。
移动应用市场:聚合各类手机应用开发者及其优秀应用,满足不同类型的手机用户实时体验、下载和订购需求的综合商场。通过手机客户端、wap和www网站为用户提供软件、游戏、主题、视频、音乐、图书等一站式服务。著名的移动应用市场有:Google Play,App Store,等等。
推荐列表:推荐算法针对某个用户进行推荐时,会对各个不同的资讯进行打分预测。在所有能被推荐的资讯中选择其中的N个资讯作为最终结果一起向用户推荐,这样的集合即为推荐列表。N是列表长度。推荐列表内部不分先后。
冗余推荐列表:产生最终的长度为N的推荐列表前,生成一个长度为M(M>N)的冗余推荐列表,最终的推荐列表由冗余推荐列表通过相关算法调整后产生。
正选推荐列表:列表长度为M1,冗余推荐的一部分,是冗余推荐列表中预测评分最大的前M1项,但并不是每一项都能作为最终推荐列表的一员,其中的一些项目可能会被替换出正选推荐列表。当列表调整完成后,正选推荐列表中的M1个项目就作为最终推荐列表呈现给用户。
候选推荐列表:列表长度为M2,冗余推荐的一部分,是冗余推荐列表中除了正选列表中的其他部分。候选列表中的项目,作为候选项,满足列表调整条件的会替换正选列表中相应的选项,成为最终推荐列表的一员。
用户行为特征向量:自定义的计算机数据结构,在计算机中,量化地描述用户行为特征。
协同过滤(CF,Collaborative Filtering):推荐系统领域的一种经典算法。分析用户兴趣,在用户群中找到与指定用户的相似程度最高的几个用户(最近邻),综合这些相似用户对某一资讯的打分评价,形成系统对该指定用户对此资讯的喜好程度预测。预测分数越大代表用户越喜爱。依据该方法,对所有能被推荐的资讯都进行打分。最后依据资讯预测打分的排序,向用户推荐一个或者多个资讯。打分评价收集的打分信息不一定局限于特别感兴趣的,特别不感兴趣资讯的纪录也相当重要。
基于用户的协同过滤(CF-U,Collaborative Filtering User-based):基于一个这样的假设“跟你喜好相似的人喜欢的东西你也很有可能喜欢。”所以基于用户的协同过滤主要的任务就是找出用户的最近邻居,从而根据最近邻居的喜好做出未知项的评分预测。
基于项目的协同过滤(CF-I,Collaborative Filtering Item-based):通过用户对不同项目(item)的评分来评测项目之间的相似性,基于项目之间的相似性做出推荐。以项目为基础的协同过滤方法有一个基本的假设“能够引起使用者兴趣的项目,必定与其之前评分高的项目相似”,透过计算项目之间的相似性来代替使用者之间的相似性。
兴趣偏好:一段时间内,移动互联网用户会倾向于使用某一类应用。这与个人的兴趣爱好,生活习惯都有密切的联系。
偏好指数:定量地描述指定用户对某一种类资讯的喜好程度,本申请中用户对游戏类应用的偏好指数,即为该用户所下载的所有应用中,游戏类应用所占比例。同理,对非游戏类应用的偏好指数,即为所下载的所有应用中,非游戏类应用所占比例。比如,用户A在一段时间内(通常是一个月)下载的10个应用中游戏应用有7个,占总比例的0.7,非游戏应用有3个,占总比例的0.3,即用户对游戏的偏好指数为0.7,对非游戏的偏好指数为0.3。
图1为根据本发明推荐列表调整方法的流程图。
如图1所示:
步骤101:获取用户的应用下载历史记录,基于所述应用下载历史记录计算在预定时间内,游戏类应用和非游戏类应用在该用户总下载应用中所占比例,以获取游戏类应用和非游戏类应用的偏好指数,并针对该用户生成产生冗余推荐列表。
步骤102:基于计算出的游戏类应用和非游戏类应用的偏好指数调整所述冗余推荐列表以形成最终推荐列表,其中该最终推荐列表中的游戏类应用和非游戏类应用的分布与该用户的游戏类应用和非游戏类应用的偏好指数保持对应。
步骤103:向该用户呈现所述最终推荐列表。
在一个实施方式中:
基于计算出的游戏类应用和非游戏类应用的偏好指数调整冗余推荐列表以形成最终推荐列表包括:
从冗余推荐列表中确定正选推荐列表,所述正选推荐列表包括冗余推荐列表中依据预测评分从大到小排序的预定数目项;
计算游戏类应用需要调整进入所述正选推荐列表的数量n,从候选推荐列表中选择评分最高的游戏类应用替代正选列表中评分最低的非游戏类应用,如果双方的评分的差值小于预先设置的阈值则交换成功,反之,交换失败,然后再从候选推荐列表中选择次高的游戏类应用替代正选推荐列表中评分次低的非游戏类应用,如果双方的评分的差值小于所述阈值则交换成功,反之,交换失败,以此类推;其中迭代在满足下列两个条件中的任何一个时结束:
出现评分的差值大于所述阈值;
调整进入正选推荐列表的数目达到n;
将调整后的正选推荐列表确定为最终推荐列表。
在一个实施方式中:
基于计算出的游戏类应用和非游戏类应用的偏好指数调整冗余推荐列表以形成最终推荐列表包括:
计算游戏类应用需要调整退出正选推荐列表的数量n,从候选推荐列表中选择评分最高的非游戏类应用替代正选列表中评分最低的游戏类应用,如果双方的评分的差值小于预先设置的阈值则交换成功,反之,交换失败,然后再从候选推荐列表中选择次高的非游戏类应用替代正选推荐列表中评分次低的游戏类应用,如果双方的评分的差值小于所述阈值则交换成功,反之,交换失败,以此类推;其中迭代在满足下列两个条件中的任何一个时结束:
出现评分的差值大于所述阈值;
调整进入正选推荐列表的数目达到n;
将调整后的正选推荐列表确定为最终推荐列表。
在一个实施方式中,可以采用基于用户的协同过滤算法针对该用户生成产生冗余推荐列表。
在本发明实施方式中,首先根据下载应用历史信息,使用用户的下载比例指数来描述兴趣偏好以计算偏好指数。可以由传统的协同过滤算法针对特定用户进行推荐,对每个应用程序进行打分预测,选出打分预测最高的前M项应用程序作为冗余推荐列表。调整正选推荐列表,把满足条件的候选列表中的项目调入正选推荐列表,并替换相应的正选推荐列表项目。目的是让正选列表中游戏和非游戏应用比例尽量能与用户偏好指数相一致。在调整操作全部结束后,将正选列表作为最终结果推荐给用户。
如果一个用户在一段时间内(通常为1个月)下载的应用程序为10个,其中游戏程序为7个,非游戏为3个,则该用户的下载比例指数为7:3。这个指数也就反映了用户的兴趣偏好,我们希望在最终向用户的推荐列表中应用程序的游戏和非游戏比例同样能呈现出相同的兴趣偏好,即,最终的推荐列表尽可能由打分最高的7个游戏运用和3个非游戏运用组成。传统的协同过滤算法往往无法达到这样的要求,因此需要对推荐列表进行调整。
本发明针对移动应用市场,应用可以分为游戏和非游戏两大类。
步骤一:利用用户历史记录,计算每一个用户在最近一段时间内,个人对游戏类应用和非游戏类应用的偏好指数。N个用户可以计算得到N个偏好指数,即每个用户会得到自身的偏好指数。
步骤二:产生冗余推荐列表,利用已有的推荐系统算法对用户进行推荐,产生冗余推荐列表。
比如,GroupLens在1994年提出了基于用户的协同过滤(CF-U,Collaborative Filtering User-based)算法。该算法是最早得到应用的协同过滤算法。分为三个步骤:
a)数据表述:通常是获得一个m×n的用户项目评分矩阵,m行代表用户数,n列代表项目数,矩阵元素Ri,j表示用户i对项目j的评分值;
b)发现k最近邻:根据用户项目评分矩阵计算用户或项目的相似度,按照相似度从大到小为当前用户求得一个最近邻集合N;
c)产生推荐数据集:当前用户获得k最近邻后,可预测当前用户对任意的项目的评分。然后根据预测评分的高低,选择一个或多个项目作为最后的推荐结果。所以要得到当前用户评分最相似的k近邻,必须计算用户之间的相似度。
传统的相似性度量方法一般为余弦相似性。用户评分被当成n维空间向量,如果用户对项目没有进行评分,则用户对该项目的评分设为0,用户之间的相似度通过向量间的余弦夹角度量:
sin ( u i , u j ) = cos ( u i , u j ) = u i * u j | u i | * | u j | = Σ c = 1 n R i , c * R j , c Σ c = 1 n R i , c 2 * Σ c = 1 n R j , c 2
用传统的预测方法,预测用户a对项目p的评分,其中N为用户a的最近邻集合,
Figure BDA0000424529190000102
是用户a的平均评分:
pred ( a , p ) = r a ‾ + Σ b ∈ N sim ( a , b ) * ( r b , p - r b ‾ ) Σ b ∈ N sin ( a , b ) .
然而随着系统中的数据量日益庞大,导致目前的一些推荐技术不能实时快速有效的做出推荐;与此同时,一个一直困扰着推荐系统的问题是局部数据稀疏性问题,尽管一个系统的数据量极大,但是对于每一个用户,其浏览与购买的商品所占系统中总的商品数的比例实在太少,这就导致了计算用户相似度的问题上无法做到准确有效,而且常常忽视一个用户对不同种类商品的偏好这一重要信息,这样大大的影响了推荐的结果。例如,在向用户A做个性化推荐的时候,A个人的行为特征全部由他的最近邻体现,在有充足的数据情况之下,最近邻能够体现用户A的兴趣偏好,但是当数据过于稀疏的时候,最近邻与用户A的相似度很低,自然最近邻代表用户A特征的可信度也就大打折扣。用户的兴趣偏好信息也就在这里被忽略掉了。因此需要重新引入在计算用户相似度过程中被忽略掉的有价值的内容。
步骤三:列表调整,根据步骤一中计算的用户偏好指数,调整冗余推荐列表,使最终的推荐列表中产品种类的分布与用户对不同产品的偏好程度尽量一致。
步骤四:呈现推荐结果。
具体而言,在步骤一中,通过统计最近一段时间内(通常是一个月),游戏和非游戏类应用在特定的用户总下载应用中所占比例,得到该用户对这一类应用的偏好指数;
(2)在步骤二中,已有的推荐系统算法可以是CF-U,CF-I等方法。只要是基于预测用户未购买产品的可能评分来进行推荐的算法,均可以被用于本申请的列表调整方法。
(3)在步骤二中,冗余推荐列表的包括三个方面的信息:应用名称,应用类型,以及应用在推荐系统中的预测打分。冗余推荐列表依据评分信息由大到小排列。最终推荐列表将从冗余推荐列表中产生。
(4)在步骤三中,调整的方法:首先,计算出游戏类应用需要调整进入(退出)正选推荐列表的数量n,从候选推荐列表中选择评分最高的游戏类应用(非游戏类应用)替代正选列表中评分最低的非游戏类应用(游戏类应用),如果双方的评分的差值小于预先设置的阈值则交换成功,反之,交换失败,然后再从候选推荐列表中选择次高的游戏类应用(非游戏类应用)替代正选推荐列表中评分次低的非游戏类应用(游戏类应用),如果双方的评分的差值小于阈值则交换成功,反之,交换失败,以此类推。迭代在满足两个条件中的任何一个时结束:1.出现评分的差值大于阈值;2.调整进入列表的数目达到n。
以需要从候选推荐列表中调整n个游戏应用进入正选列表为例,列表调整的流程图如图3所示,其中,冗余推荐列表长度为M,正选列表长度为M1,候选列表长度为M2,阈值是调整算法本身需要设定的参数。
本发明具有如下优点:
(1)、高扩展度;本申请步骤二中的推荐算法可以是任何一个基于评分预测的推荐系统模型。只要算法最终能给出产品的预测分数,不论具体的技术实现如何,都可以使用列表调整算法改进结果,能很好的满足多同商家的需求,不需要对商家已有的系统做太多规模的调整;
(2)、快速;本申请在步骤一中采用离线方式计算用户偏好,这样提高推荐商品列表的调整速度,适用于大型商家对推荐效率的需求;
(3)、对用户兴趣变化反映灵敏;客户的兴趣偏好在相对较短的时间段上稳定,而在相对较长的时间段上会有变化,本申请采用定时计算用户兴趣偏好的方式,随着时间推移,不断调整用户兴趣偏好值,以满足客户不断变更的需求;
(4)、提高精度;由于引入了用户兴趣偏好的指数有利于小区数据稀疏带来的影响,所以调整后的推荐列表将比调整之前的推荐列表在准确性上有更大的提高。
下面描述本申请的系统架构。
图4为根据本发明实施方式推荐列表调整装置的示范性结构图。
如图4所示,主要包括3个模块:
模块A负责从数据库或者缓存中拿到用户行为数据,通过分析不同行为,生成当前用户的特征向量。不过,如果是使用非行为特征,就不需要使用行为提取和分析模块了。该模块的输出是用户特征向量。
模块B负责将用户的特征向量通过特征-物品相关矩阵转换为初始推荐物品列表。
模块C负责对初始的冗余推荐列表进行调整,排名等处理,从而生成最终的推荐推荐结果。
与用户相关的外部数据包括:用户行为数据[1]和用户属性数据[2]。用户行为数据[1]是指用户在移动应用市场上活动所产生的一系列信息,包括下载、评分、浏览、文字点评等记录。这时的用户行为数据种类繁多,并不是每一种用户信息都是本发明需要的,因此,需要由行为特征提取[3]来筛选数据。最后,结合用户属性数据[2],通过行为特征转换[4],将具体的外部数据转换成计算机可以理解的行为特征向量[5]。考虑到用户行为实时变化,因此,模块A需要实时更新。
与应用相关的外部数据包括:应用推荐表[11],包括应用名称,所属类别,价格等一系列用户关心的应用信息。应用推荐表[11]结合行为特征向量[5]就形成了特征-物品相关推荐。由于每隔一段时间会有新的一批应用加入,因此该模块需要定时更新。
冗余推荐列表[7]由传统的推荐算法产生,经过推荐列表调整[8]后得到最后的推荐结果,本申请需要对推荐内容进行解释[9],连同推荐结果一起呈现给用户[10]。
图5为根据本发明推荐列表调整装置的结构图。
如图5所示,该装置包括偏好指数确定单元501、推荐列表生成单元502和列表呈现单元503,其中:
偏好指数确定单元501,用于获取用户的应用下载历史记录,基于所述应用下载历史记录计算在预定时间内,游戏类应用和非游戏类应用在该用户总下载应用中所占比例,以获取游戏类应用和非游戏类应用的偏好指数,并针对该用户生成产生冗余推荐列表;
推荐列表生成单元502,用于基于计算出的游戏类应用和非游戏类应用的偏好指数调整冗余推荐列表以形成最终推荐列表,其中该最终推荐列表中的游戏类应用和非游戏类应用的分布与该用户的游戏类应用和非游戏类应用的偏好指数保持对应;
列表呈现单元503,用于向该用户呈现所述最终推荐列表。
在一个实施方式中:
推荐列表生成单元502,用于:
从冗余推荐列表中确定正选推荐列表,所述正选推荐列表包括冗余推荐列表中依据预测评分从大到小排序的预定数目项;
计算游戏类应用需要调整进入正选推荐列表的数量n,从候选推荐列表中选择评分最高的游戏类应用替代正选列表中评分最低的非游戏类应用,如果双方的评分的差值小于预先设置的阈值则交换成功,反之,交换失败,然后再从候选推荐列表中选择次高的游戏类应用替代正选推荐列表中评分次低的非游戏类应用,如果双方的评分的差值小于所述阈值则交换成功,反之,交换失败,以此类推;其中迭代在满足下列两个条件中的任何一个时结束:
出现评分的差值大于所述阈值;
调整进入正选推荐列表的数目达到n;
将调整后的正选推荐列表确定为最终推荐列表。
在一个实施方式中:
推荐列表生成单元502,用于:
计算游戏类应用需要调整退出正选推荐列表的数量n,从候选推荐列表中选择评分最高的非游戏类应用替代正选列表中评分最低的游戏类应用,如果双方的评分的差值小于预先设置的阈值则交换成功,反之,交换失败,然后再从候选推荐列表中选择次高的非游戏类应用替代正选推荐列表中评分次低的游戏类应用,如果双方的评分的差值小于所述阈值则交换成功,反之,交换失败,以此类推;其中迭代在满足下列两个条件中的任何一个时结束:
出现评分的差值大于所述阈值;
调整进入正选推荐列表的数目达到n;
将调整后的正选推荐列表确定为最终推荐列表。
在一个实施方式中:
偏好指数确定单元501,用于采用基于用户的协同过滤算法针对该用户生成产生冗余推荐列表。
使本发明的目的,技术方案及优点更加清楚明白,以下将据实例对本发明做进一步详细说明,描述用户A和用户B的冗余推荐列表调整过程。
图6为推荐列表调整第一实例示意图。
如图6所示,第一实例:用户A的冗余推荐列表调整过程:
冗余推荐列表长度为20,其中正选推荐列表长度为10,候选推荐列表长度为10,用户的游戏偏好指数为0.8,列表调整阈值为0.25。
首先计算需要从候选推荐列表调整进入正选推荐列表的游戏数目n:
n=正选推荐列表长度×游戏偏好指数–正选推荐列表中游戏个数。
经过计算,n=5,即至多要从候选推荐列表调整5个游戏进入正选推荐列表中,以替代正选推荐列表中的非游戏项目。
选择正选推荐列表中第9号项目与候选列表中第11号项目进行比较,预测评分的差值为0.03小于阈值0.25,第一次交换操作成功,第11号项目进入正选推荐列表,操作继续;
选择正选推荐列表中第8号项目与候选列表中第12号项目进行比较,预测评分的差值为0.09小于阈值0.25,第二次交换操作成功,第12号项目进入正选推荐列表,操作继续;
选择正选推荐列表中第7号项目与候选列表中第13号项目进行比较,预测评分的差值为0.14小于阈值0.25,第三次交换操作成功,第13号项目进入正选推荐列表,操作继续;
选择正选推荐列表中第5号项目与候选列表中第16号项目进行比较,预测评分的差值为0.30大于阈值0.25,第四次交换操作失败,第5号项目留在正选推荐列表中,虽然此时调整列表的比较没有达到n=5次,但是由于后面比较中预测评分差值肯定无法小于阈值,所以操作提前结束。
图7为推荐列表调整第一实例示意图。
如图7所示,第二实例为用户B的冗余推荐列表调整过程。
冗余推荐列表长度为20,其中正选推荐列表长度为10,候选推荐列表长度为10,用户的游戏偏好指数为0.3,列表调整阈值为0.25。
首先计算需要从候选推荐列表调整进入正选推荐列表的游戏数目n:
n=正选推荐列表长度×游戏偏好指数–正选推荐列表中游戏个数。
经过计算,n=-4,即至多要从候选推荐列表调整4个非游戏进入正选推荐列表中,替代正选推荐列表中的游戏项目。
选择正选推荐列表中第10号项目与候选列表中第11号项目进行比较,预测评分的差值为0.01小于阈值0.25,第一次交换操作成功,第11号项目进入正选推荐列表,操作继续;
选择正选推荐列表中第9号项目与候选列表中第12号项目进行比较,预测评分的差值为0.04小于阈值0.25,第二次交换操作成功,第12号项目进入正选推荐列表,操作继续;
选择正选推荐列表中第7号项目与候选列表中第13号项目进行比较,预测评分的差值为0.14小于阈值0.25,第三次交换操作成功,第13号项目进入正选推荐列表,操作继续;
选择正选推荐列表中第5号项目与候选列表中第16号项目进行比较,预测评分的差值为0.17小于阈值0.25,第四次交换操作成功,第16号项目进入正选推荐列表,此时调整列表的比较达到|n|次,所以操作结束。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种推荐列表调整方法,其特征在于,包括:
获取用户的应用下载历史记录,基于所述应用下载历史记录计算在预定时间内,游戏类应用和非游戏类应用在该用户总下载应用中所占比例,以获取游戏类应用和非游戏类应用的偏好指数,并针对该用户生成产生冗余推荐列表;
基于计算出的游戏类应用和非游戏类应用的偏好指数调整所述冗余推荐列表以形成最终推荐列表,其中该最终推荐列表中的游戏类应用和非游戏类应用的分布与该用户的游戏类应用和非游戏类应用的偏好指数保持对应;
向该用户呈现所述最终推荐列表。
2.根据权利要求1所述的推荐列表调整方法,其特征在于,所述基于计算出的游戏类应用和非游戏类应用的偏好指数调整冗余推荐列表以形成最终推荐列表包括:
从冗余推荐列表中确定正选推荐列表,所述正选推荐列表包括冗余推荐列表中依据预测评分从大到小排序的预定数目项;
计算游戏类应用需要调整进入所述正选推荐列表的数量n,从候选推荐列表中选择评分最高的游戏类应用替代正选列表中评分最低的非游戏类应用,如果双方的评分的差值小于预先设置的阈值则交换成功,反之,交换失败,然后再从候选推荐列表中选择次高的游戏类应用替代正选推荐列表中评分次低的非游戏类应用,如果双方的评分的差值小于所述阈值则交换成功,反之,交换失败,以此类推;其中迭代在满足下列两个条件中的任何一个时结束:
出现评分的差值大于所述阈值;
调整进入正选推荐列表的数目达到n;
将调整后的正选推荐列表确定为最终推荐列表。
3.根据权利要求1所述的推荐列表调整方法,其特征在于,所述基于计算出的游戏类应用和非游戏类应用的偏好指数调整冗余推荐列表以形成最终推荐列表包括:
计算游戏类应用需要调整退出正选推荐列表的数量n,从候选推荐列表中选择评分最高的非游戏类应用替代正选列表中评分最低的游戏类应用,如果双方的评分的差值小于预先设置的阈值则交换成功,反之,交换失败,然后再从候选推荐列表中选择次高的非游戏类应用替代正选推荐列表中评分次低的游戏类应用,如果双方的评分的差值小于所述阈值则交换成功,反之,交换失败,以此类推;其中迭代在满足下列两个条件中的任何一个时结束:
出现评分的差值大于所述阈值;
调整进入正选推荐列表的数目达到n;
将调整后的正选推荐列表确定为最终推荐列表。
4.根据权利要求1-3中任一项所述的推荐列表调整方法,其特征在于,所述针对该用户生成产生冗余推荐列表包括:
采用基于用户的协同过滤算法针对该用户生成产生冗余推荐列表。
5.一种推荐列表调整装置,其特征在于,包括偏好指数确定单元、推荐列表生成单元和列表呈现单元,其中:
偏好指数确定单元,用于获取用户的应用下载历史记录,基于所述应用下载历史记录计算在预定时间内,游戏类应用和非游戏类应用在该用户总下载应用中所占比例,以获取游戏类应用和非游戏类应用的偏好指数,并针对该用户生成产生冗余推荐列表;
推荐列表生成单元,用于基于计算出的游戏类应用和非游戏类应用的偏好指数调整冗余推荐列表以形成最终推荐列表,其中该最终推荐列表中的游戏类应用和非游戏类应用的分布与该用户的游戏类应用和非游戏类应用的偏好指数保持对应;
列表呈现单元,用于向该用户呈现所述最终推荐列表。
6.根据权利要求5所述的推荐列表调整装置,其特征在于,
推荐列表生成单元,用于:
从冗余推荐列表中确定正选推荐列表,所述正选推荐列表包括冗余推荐列表中依据预测评分从大到小排序的预定数目项;
计算游戏类应用需要调整进入正选推荐列表的数量n,从候选推荐列表中选择评分最高的游戏类应用替代正选列表中评分最低的非游戏类应用,如果双方的评分的差值小于预先设置的阈值则交换成功,反之,交换失败,然后再从候选推荐列表中选择次高的游戏类应用替代正选推荐列表中评分次低的非游戏类应用,如果双方的评分的差值小于所述阈值则交换成功,反之,交换失败,以此类推;其中迭代在满足下列两个条件中的任何一个时结束:
出现评分的差值大于所述阈值;
调整进入正选推荐列表的数目达到n;
将调整后的正选推荐列表确定为最终推荐列表。
7.根据权利要求5所述的推荐列表调整装置,其特征在于,
推荐列表生成单元,用于:
计算游戏类应用需要调整退出正选推荐列表的数量n,从候选推荐列表中选择评分最高的非游戏类应用替代正选列表中评分最低的游戏类应用,如果双方的评分的差值小于预先设置的阈值则交换成功,反之,交换失败,然后再从候选推荐列表中选择次高的非游戏类应用替代正选推荐列表中评分次低的游戏类应用,如果双方的评分的差值小于所述阈值则交换成功,反之,交换失败,以此类推;其中迭代在满足下列两个条件中的任何一个时结束:
出现评分的差值大于所述阈值;
调整进入正选推荐列表的数目达到n;
将调整后的正选推荐列表确定为最终推荐列表。
8.根据权利要求5-7中任一项所述的推荐列表调整装置,其特征在于,
偏好指数确定单元,用于采用基于用户的协同过滤算法针对该用户生成产生冗余推荐列表。
CN201310618205.1A 2013-11-28 2013-11-28 一种推荐列表调整方法和装置 Expired - Fee Related CN103678518B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310618205.1A CN103678518B (zh) 2013-11-28 2013-11-28 一种推荐列表调整方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310618205.1A CN103678518B (zh) 2013-11-28 2013-11-28 一种推荐列表调整方法和装置

Publications (2)

Publication Number Publication Date
CN103678518A true CN103678518A (zh) 2014-03-26
CN103678518B CN103678518B (zh) 2017-02-15

Family

ID=50316063

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310618205.1A Expired - Fee Related CN103678518B (zh) 2013-11-28 2013-11-28 一种推荐列表调整方法和装置

Country Status (1)

Country Link
CN (1) CN103678518B (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572962A (zh) * 2014-12-31 2015-04-29 浙江大学 一种app推荐的方法和系统
CN105991722A (zh) * 2015-02-12 2016-10-05 广东欧珀移动通信有限公司 一种下载器推荐方法、应用服务器、终端及系统
CN106383907A (zh) * 2016-09-30 2017-02-08 北京小米移动软件有限公司 应用推荐方法和装置
CN106598643A (zh) * 2016-11-08 2017-04-26 北京奇虎科技有限公司 一种下载应用程序抢红包的方法、装置及系统
CN106610968A (zh) * 2015-10-21 2017-05-03 广州酷狗计算机科技有限公司 一种歌单列表确定方法、装置及电子设备
CN106779907A (zh) * 2016-11-18 2017-05-31 广州粤亮信息科技有限公司 移动应用推荐方法及装置
CN106850750A (zh) * 2016-12-26 2017-06-13 北京五八信息技术有限公司 一种实时推送信息的方法和装置
CN107423355A (zh) * 2017-05-26 2017-12-01 北京三快在线科技有限公司 信息推荐方法及装置、电子设备
CN107562846A (zh) * 2017-08-28 2018-01-09 广州优视网络科技有限公司 一种推荐应用的方法和装置
CN108136261A (zh) * 2015-07-23 2018-06-08 Cy游戏公司 服务器和程序
CN108667877A (zh) * 2017-03-31 2018-10-16 腾讯科技(深圳)有限公司 确定推荐信息的方法及装置、计算机设备及存储介质
CN109615504A (zh) * 2018-11-02 2019-04-12 深圳壹账通智能科技有限公司 产品推荐方法、装置、电子设备和计算机可读存储介质
WO2019085333A1 (zh) * 2017-11-01 2019-05-09 平安科技(深圳)有限公司 项目推荐方法、电子设备及计算机可读存储介质
CN110473038A (zh) * 2018-05-10 2019-11-19 北京嘀嘀无限科技发展有限公司 一种产品推荐方法、产品推荐系统及计算机设备
CN113283960A (zh) * 2021-05-18 2021-08-20 武汉畅来电子商务有限公司 基于大数据分析和云计算的垂直电商平台商品智能推荐方法和云服务平台
WO2022000942A1 (zh) * 2020-06-28 2022-01-06 中国科学院深圳先进技术研究院 数据分享网络的控制方法、网络系统及相关装置
CN117829965A (zh) * 2024-03-01 2024-04-05 深圳欧税通技术有限公司 一种用于跨境电商平台的产品推荐系统及方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109635199B (zh) * 2018-12-17 2021-06-01 广州大学 基于用户行为的应用列表动态推荐方法及系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101867594A (zh) * 2010-03-05 2010-10-20 宇龙计算机通信科技(深圳)有限公司 一种数据传输的方法、装置及系统
CN102104688A (zh) * 2011-02-15 2011-06-22 宇龙计算机通信科技(深圳)有限公司 软件推荐方法和移动终端
CN102541590B (zh) * 2011-12-14 2015-09-30 北京奇虎科技有限公司 一种软件推荐方法及推荐系统
CN102567511B (zh) * 2011-12-27 2013-10-02 奇智软件(北京)有限公司 一种应用自动推荐的方法及装置
US9084932B2 (en) * 2012-01-13 2015-07-21 Gtech Canada Ulc Automated discovery of gaming preferences
CN102999588A (zh) * 2012-11-15 2013-03-27 广州华多网络科技有限公司 一种多媒体应用的推荐方法和系统

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572962A (zh) * 2014-12-31 2015-04-29 浙江大学 一种app推荐的方法和系统
CN105991722A (zh) * 2015-02-12 2016-10-05 广东欧珀移动通信有限公司 一种下载器推荐方法、应用服务器、终端及系统
CN105991722B (zh) * 2015-02-12 2020-03-10 Oppo广东移动通信有限公司 一种下载器推荐方法、应用服务器、终端及系统
CN108136261A (zh) * 2015-07-23 2018-06-08 Cy游戏公司 服务器和程序
CN108136261B (zh) * 2015-07-23 2021-03-30 Cy游戏公司 服务器和非暂时性计算机可读介质
CN106610968A (zh) * 2015-10-21 2017-05-03 广州酷狗计算机科技有限公司 一种歌单列表确定方法、装置及电子设备
CN106610968B (zh) * 2015-10-21 2020-09-04 广州酷狗计算机科技有限公司 一种歌单列表确定方法、装置及电子设备
CN106383907A (zh) * 2016-09-30 2017-02-08 北京小米移动软件有限公司 应用推荐方法和装置
CN106598643A (zh) * 2016-11-08 2017-04-26 北京奇虎科技有限公司 一种下载应用程序抢红包的方法、装置及系统
CN106779907A (zh) * 2016-11-18 2017-05-31 广州粤亮信息科技有限公司 移动应用推荐方法及装置
CN106850750A (zh) * 2016-12-26 2017-06-13 北京五八信息技术有限公司 一种实时推送信息的方法和装置
CN106850750B (zh) * 2016-12-26 2020-11-10 北京五八信息技术有限公司 一种实时推送信息的方法和装置
CN108667877A (zh) * 2017-03-31 2018-10-16 腾讯科技(深圳)有限公司 确定推荐信息的方法及装置、计算机设备及存储介质
CN107423355A (zh) * 2017-05-26 2017-12-01 北京三快在线科技有限公司 信息推荐方法及装置、电子设备
CN107562846B (zh) * 2017-08-28 2022-03-01 阿里巴巴(中国)有限公司 一种推荐应用的方法和装置
CN107562846A (zh) * 2017-08-28 2018-01-09 广州优视网络科技有限公司 一种推荐应用的方法和装置
WO2019085333A1 (zh) * 2017-11-01 2019-05-09 平安科技(深圳)有限公司 项目推荐方法、电子设备及计算机可读存储介质
CN110473038A (zh) * 2018-05-10 2019-11-19 北京嘀嘀无限科技发展有限公司 一种产品推荐方法、产品推荐系统及计算机设备
CN109615504A (zh) * 2018-11-02 2019-04-12 深圳壹账通智能科技有限公司 产品推荐方法、装置、电子设备和计算机可读存储介质
WO2022000942A1 (zh) * 2020-06-28 2022-01-06 中国科学院深圳先进技术研究院 数据分享网络的控制方法、网络系统及相关装置
CN113283960A (zh) * 2021-05-18 2021-08-20 武汉畅来电子商务有限公司 基于大数据分析和云计算的垂直电商平台商品智能推荐方法和云服务平台
CN113283960B (zh) * 2021-05-18 2022-08-19 河南中钢网科技集团股份有限公司 基于大数据分析和云计算的垂直电商平台商品智能推荐方法和云服务平台
CN117829965A (zh) * 2024-03-01 2024-04-05 深圳欧税通技术有限公司 一种用于跨境电商平台的产品推荐系统及方法

Also Published As

Publication number Publication date
CN103678518B (zh) 2017-02-15

Similar Documents

Publication Publication Date Title
CN103678518A (zh) 一种推荐列表调整方法和装置
CN103823908B (zh) 基于用户偏好的内容推荐方法和服务器
KR101871747B1 (ko) 유사성향 기반 사용자-관광상품 추천 방법 및 시스템
CN111461841B (zh) 物品推荐方法、装置、服务器及存储介质
CN106485562B (zh) 一种基于用户历史行为的商品信息推荐方法及系统
Neidhardt et al. Eliciting the users' unknown preferences
Xiang et al. Time-dependent models in collaborative filtering based recommender system
CN104239338A (zh) 信息推荐方法及装置
CN103377250A (zh) 基于邻域的top-k推荐方法
CN101482884A (zh) 一种基于用户偏好评分分布的协作推荐系统
CN106447463A (zh) 一种基于马尔科夫决策过程模型的商品推荐方法
CN106168980A (zh) 多媒体资源推荐排序方法及装置
CN109493113A (zh) 一种优惠信息的提供方法以及装置
CN108153791A (zh) 一种资源推荐方法和相关装置
US11200593B2 (en) Predictive recommendation system using tiered feature data
CN104239335B (zh) 特定用户信息获取方法及装置
CN110689402A (zh) 推荐商家的方法、装置、电子设备及可读存储介质
US10318984B1 (en) Predictive recommendation system using tiered feature data
CN110347923B (zh) 一种可回溯的快速裂变式构建用户画像的方法
Mandić et al. Restaurant online reputation and destination competitiveness: Insight into TripAdvisor data
CN113688306A (zh) 一种基于强化学习的推荐策略生成方法及装置
CN110874432B (zh) 排序方法、信息推荐方法、系统及装置
KR102576123B1 (ko) 제품 공동구매 연계 시스템 및 방법
RU2648951C1 (ru) Система и способ подбора и отображения рекомендуемого контента пользователю
KR101734915B1 (ko) 메타 데이터 및 소비 이력 정보를 이용한 컨텐츠 스킬업 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170215