CN103218366B - 下载资源推荐方法及系统 - Google Patents

下载资源推荐方法及系统 Download PDF

Info

Publication number
CN103218366B
CN103218366B CN201210018761.0A CN201210018761A CN103218366B CN 103218366 B CN103218366 B CN 103218366B CN 201210018761 A CN201210018761 A CN 201210018761A CN 103218366 B CN103218366 B CN 103218366B
Authority
CN
China
Prior art keywords
download
resource
targeted customer
user
history
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210018761.0A
Other languages
English (en)
Other versions
CN103218366A (zh
Inventor
冀祖峰
刘刚
朱臣元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201210018761.0A priority Critical patent/CN103218366B/zh
Priority to PCT/CN2012/086906 priority patent/WO2013107238A1/zh
Priority to CA2861898A priority patent/CA2861898C/en
Priority to US14/373,003 priority patent/US9264502B2/en
Publication of CN103218366A publication Critical patent/CN103218366A/zh
Application granted granted Critical
Publication of CN103218366B publication Critical patent/CN103218366B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computer Hardware Design (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

一种下载资源推荐方法,包括以下步骤:获取目标用户的下载记录,根据所述下载记录获取与目标用户关联的目标用户群组;获取所述目标用户群组的下载记录和全局用户群组的下载记录;对所述目标用户群组的下载记录和所述全局用户群组的下载记录进行处理,生成目标用户群组的下载记录中的下载资源与全局用户群组之间的差异度;根据所述差异度对所述下载资源进行排序,将排序靠前的预设数量的下载资源推荐给所述目标用户。此外,还提供了一种下载资源推荐系统。上述下载资源推荐方法及系统提高了向目标用户推荐下载资源的准确度。

Description

下载资源推荐方法及系统
【技术领域】
本发明涉及网络技术领域,特别涉及一种下载资源推荐方法及系统。
【背景技术】
随着通信事业的发展,网络带宽得到了较大的提升,从而出现了大量的提供下载资源的网站和客户端软件。这些网站和客户端软件将下载资源分门别类,然后展示给用户。用户可以根据自己的需要选择合适的下载资源进行下载。下载资源可包括软件、视频、音频、图片、文本等。为了使用户选择资源更加便利,除了支持用户主动提交下载请求的功能以外,还提供额外的下载资源推荐的功能,就是将一些优质的下载资源,例如热门电影,热门游戏,常用软件等,主动推送到页面或者客户端上展现给用户。
传统技术中的一种下载资源推荐方法,根据下载资源的下载记录确定下载资源的热度(下载量越大热度越高),然后将下载资源按照热度排序,并将热度排名的top N(即资源热度排名的前N个下载资源,N为自然数,可根据需求设置)推荐给用户。但由于下载资源的下载记录只能反映统计学上用户整体的兴趣点,因此推荐给用户的下载资源与用户的相关性不高。
传统技术中的另一种改进型下载资源推荐方法,先根据每个用户对每个下载资源的评分建立一张评分表(评分矩阵),然后根据用户对不同下载资源的评分的相似度来挖掘出和目标用户(待推荐用户)相似的目标用户群组,然后根据该群组的整体喜好程度(如目标用户群组中的用户对下载资源的评分)向目标用户推荐下载资源。
然而,这种改进型下载资源推荐方法虽然在前一种下载资源推荐方法的基础上提高了下载资源与目标用户的相关性,但是,用户对下载资源的评分不易获取(很多用户下载完成后并不会进行评分),且由于仅仅通过目标用户群组的整体喜好程度来判定目标用户对下载资源的兴趣度,使得目标用户与下载资源相关性不足,从而使得向目标用户推荐下载资源的方法的准确度不高。
【发明内容】
基于此,有必要提供一种提高推荐的准确度的下载资源推荐方法。
一种下载资源推荐方法,包括以下步骤:
获取目标用户的下载记录,根据所述下载记录获取与目标用户关联的目标用户群组;
获取所述目标用户群组的下载记录和全局用户群组的下载记录;
对所述目标用户群组的下载记录和所述全局用户群组的下载记录进行处理,生成目标用户群组的下载记录中的下载资源与全局用户群组之间的差异度;
根据所述差异度对所述下载资源进行排序,将排序靠前的预设数量的下载资源推荐给所述目标用户。
优选的,所述根据所述下载记录获取与目标用户对应的目标用户群组的步骤包括:
获取近期用户的下载记录;
遍历所述用户的下载记录,对每个所述用户的下载记录,执行:
将所述用户的下载记录与所述目标用户的下载记录进行对比,获取下载记录与所述目标用户的下载记录匹配的用户,将所述获取的用户添加到目标用户群组中。
优选的,所述将所述用户的下载记录与所述目标用户的下载记录进行对比,获取下载记录与所述目标用户的下载记录匹配的用户的步骤为:
获取所述用户的下载记录中的资源哈希值和/或资源文件名;
将所述用户的下载记录中的资源哈希值和/或资源文件名与所述目标用户的下载记录中的资源哈希值和/或资源文件名进行对比,获取资源哈希值和/或资源文件名与所述目标用户相匹配的用户。
优选的,所述对目标用户群组的下载记录和所述全局用户群组的下载记录进行处理,生成目标用户群组中的下载资源与全局用户群组之间的差异度的步骤包括:
统计所述目标用户群组的下载记录中下载资源的下载频次;
筛选出所述目标用户群组的下载记录中的下载频次超过第一阈值的下载资源。
优选的,所述对所述目标用户群组的下载记录和所述全局用户群组的下载记录进行处理,获得目标用户群组的下载记录中的下载资源与全局用户群组之间的差异度的步骤包括:
获取所述目标用户群组的下载记录中的下载资源的第一下载频次,以及所述目标用户群组中的下载记录中的下载资源在所述全局用户群组中的下载记录中的第二下载频次;
获取目标用户群组的第一用户数以及全体用户群组的第二用户数;
根据所述第一下载频次、第二下载频次、第一用户数和第二用户数计算得到所述筛选出的下载资源与所述全局用户群组的差异度。
优选的,在所述根据所述差异度对所述下载资源进行排序的步骤之前还包括:
筛选出差异度大于第二阈值的所述目标用户群组中的下载资源。
此外,还有必要提供一种提高推荐的准确度的下载资源推荐系统。
一种下载资源推荐系统,包括以下模块:
目标用户群组获取模块,用于获取目标用户的下载记录,根据所述下载记录获取与目标用户关联的目标用户群组;
下载记录获取模块,用于获取所述目标用户群组的下载记录和全局用户群组的下载记录;
差异度生成模块,用于对所述目标用户群组的下载记录和所述全局用户群组的下载记录进行处理,生成目标用户群组的下载记录中的下载资源与全局用户群组之间的差异度;
推荐模块,用于根据所述差异度对所述下载资源进行排序,将排序靠前的预设数量的下载资源推荐给所述目标用户。
优选的,所述目标用户群组获取模块还用于获取近期用户的下载记录,遍历所述用户的下载记录,对每个所述用户的下载记录,执行:
将所述用户的下载记录与所述目标用户的下载记录进行对比,获取下载记录与所述目标用户的下载记录匹配的用户,将所述获取的用户添加到目标用户群组中。
优选的,所述目标用户群组获取模块还用于获取所述用户的下载记录中的资源哈希值和/或资源文件名,将所述用户的下载记录中的资源哈希值和/或资源文件名与所述目标用户的下载记录中的资源哈希值和/或资源文件名进行对比,获取资源哈希值和/或资源文件名与所述目标用户相匹配的用户。
优选的,还包括资源筛选模块,用于统计所述目标用户群组的下载记录中下载资源的下载频次,筛选出所述目标用户群组的下载记录中的下载频次超过第一阈值的下载资源。
优选的,所述差异度生成模块还用于获取所述目标用户群组的下载记录中的下载资源的第一下载频次,以及所述目标用户群组中的下载记录中的下载资源在所述全局用户群组中的下载记录中的第二下载频次,获取目标用户群组的第一用户数以及全体用户群组的第二用户数,根据所述第一下载频次、第二下载频次、第一用户数和第二用户数计算得到所述筛选出的下载资源与所述全局用户群组的差异度。
优选的,所述资源筛选模块还用于筛选出差异度大于第二阈值的所述目标用户群组中的下载资源。
上述下载资源推荐方法和系统,先通过目标用户的下载记录获取该用户所属的目标用户群组,然后再根据目标用户群组在下载频次上与全局用户群组的差异度选择合适的下载资源推荐给目标用户。由于目标用户和目标用户群组中的其他用户在对下载资源的兴趣上相关性较强,可以推出,当目标用户群组对下载资源的兴趣度和全局用户群组相比差异度较大时,目标用户对这些下载资源的兴趣度相较于全局用户群组中的其他用户下载过的下载资源更高,从而提高了向目标用户推荐下载资源的准确度。
【附图说明】
图1为一个实施例中下载资源推荐方法的流程图;
图2为一个实施例中下载资源推荐系统的结构示意图;
图3为另一个实施例中下载资源推荐系统的结构示意图。
【具体实施方式】
如图1所示,在一个实施例中,一种下载资源推荐方法,包括以下步骤:
步骤S102,获取目标用户的下载记录,根据下载记录获取与目标用户关联的目标用户群组。
目标用户即为待推荐的用户。在一个实施例中,可以获取目标用户近期的下载记录,如最近一周或最近一月的下载记录。下载记录中可包括该用户下载了哪些下载资源以及下载资源的下载频次等。
在一个实施例中,在步骤S102中,获取近期用户的下载记录,遍历用户的下载记录,对每个用户的下载记录,执行:将用户的下载记录与目标用户的下载记录进行对比,获取下载记录与目标用户的下载记录匹配的用户,将获取的用户添加到目标用户群组中。
优选的,可获取近期活跃用户的下载记录,活跃用户是指用户活跃度超过事先设定的参考值的用户,用户活跃度可以为下载次数、在线时间、每日启动下载次数或这三者的加权平均值。具体的,可每隔一段时间统计出活跃用户,并将活跃用户存储在用户库中。
下载记录中记录了每个活跃用户在近期下载的下载资源的名称和/或下载资源的哈希值以及下载资源的下载频次。以活跃用户为单位遍历该下载记录,若目标用户的下载记录中的下载资源和该活跃用户的下载记录中的下载资源匹配,则将该用户添加到目标用户群组中。
进一步的,可设置目标用户群组中的用户数的最大值,当目标用户群组的用户数达到该最大值时,则停止遍历。
进一步的,可获取用户的下载记录中的资源哈希值和/或资源文件名,将用户的下载记录中的资源哈希值和/或资源文件名与目标用户的下载记录中的资源哈希值和/或资源文件名进行对比,获取资源哈希值和/或资源文件名与目标用户相匹配的用户。
在对比下载资源的哈希值时,可先获取目标用户的下载记录中记录的下载资源的哈希值,然后和遍历的用户的下载记录中记录的下载资源的哈希值进行对比,若相同,则判定两者匹配,否则,则判定两者不匹配。
在对比下载资源的名称时,可先获取目标用户的下载记录中记录的下载资源的名称以及遍历的用户的下载记录中的下载资源的名称,然后采用最大公共子串的方法判定两者的名称是否相匹配。例如,设最大公共子串为0.5,若目标用户的下载记录中记录的下载资源的名称为“哈利波特与魔法石”,遍历的用户的下载记录中记录的下载资源的名称为“哈利波特与火焰杯”,则最大公共子串为“哈利波特与”,则相似度为5/8,大于0.5,判定两者匹配。
此外,还可设置一阈值,在遍历用户的下载记录的过程中,若所遍历到的用户的下载记录中与目标用户的资源哈希值和/或资源文件名相匹配的下载资源超过该阈值,则将该遍历的用户添加到目标用户群组。
步骤S 104,获取目标用户群组的下载记录和全局用户群组的下载记录。
全局用户群组可以包括所有用户,也可设置全局用户群组的用户数,根据该用户数选取的一个较大的用户样本空间作为全局用户群组。例如,可随机选取10000个用户加入全局用户群组。
步骤S106,对目标用户群组的下载记录和全局用户群组的下载记录进行处理,生成目标用户群组的下载记录中的下载资源与全局用户群组之间的差异度。
在一个实施例中,获取目标用户群组的下载记录中的下载资源的第一下载频次,以及目标用户群组中的下载记录中的下载资源在全局用户群组中的下载记录中的第二下载频次;获取目标用户群组的第一用户数以及全体用户群组的第二用户数;根据第一下载频次、第二下载频次、第一用户数和第二用户数计算得到筛选出的下载资源与全局用户群组的差异度。
在一个实施例中,可根据如下公式计算差异度:
其中,diff表示目标用户群组的下载记录中的下载资源与全局用户群组之间的差异度;M1为遍历到下载资源R时,获取到的目标用户群组的第一用户数。M2为全体用户群组的第二用户数;R1=M1/N1,其中,R1为目标用户群组对下载资源R的平均下载频次,N1为目标用户群组对下载资源R的第一下载频次;R2=M2/N2,其中,R2为全体用户群组对下载资源R的平均下载频次,N2为全体用户群组对下载资源R的第二下载频次。
当R1>R2时,diff为正数,表示下载资源R在目标用户群体更受到偏爱。diff值越大,越具备推荐价值。当R1<R2时,diff为负数,表示下载资源R在目标用户群体不受到偏爱。diff值越小,越不具备推荐价值。分母的计算作为一个增益系数,防止当M1、M2变得很大时,R1和R2的结果都偏小,得到的差异度不明显。
在一个实施例中,步骤S106还可包括:统计目标用户群组的下载记录中下载资源的下载频次,筛选出目标用户群组的下载记录中的下载频次超过第一阈值的下载资源。
具体的,可在生成差异度之前,获取到目标用户群组的下载记录后,可遍历每个用户的下载记录,将每个用户的下载资源的下载频次进行叠加,统计出目标用户群组的下载资源的下载频次。然后再按照该下载频次对下载资源排序,从该下载记录中提取下载频次大于第一阈值的下载资源,作为目标用户群体的热点资源。
进一步的,对于全局用户群体,也可按照相同的原理提取全局用户群体的热点资源。在生成差异度时,则可仅对目标用户群体的热点资源和全局用户群体的热点资源进行处理。
通过筛选出热点资源,可以减少生成差异度时需要处理的数据个数,降低了差异度计算的规模,从而减少了不必要的性能损耗。
步骤S108,根据差异度对下载资源进行排序,将排序靠前的预设数量的下载资源推荐给目标用户。
遍历下载资源之后,可将差异度按照从大到小的顺序排序,然后取排序后的下载资源序列的top N,即排序靠前的前N个下载资源,然后将下载资源推荐给用户,N为预设的自然数。
优选的,可在用户的显示界面上以列表的形式按照差异度的大小顺序展示下载资源的名称、大小、以及下载频次,方便用户选择下载。
在一个实施例中,根据差异度对下载资源排序之前,还可以筛选出差异度大于第二阈值的目标用户群组中的下载资源。在排序之前过滤掉差异度较小的下载资源可以减少需要排序的下载资源的个数,从而提高排序效率。
在另一个实施例中,还可以将提取的top N的下载资源缓存,并将推荐的下载资源分页展示给用户,然后根据用户发出的翻页请求从缓存中获取与翻页请求对应的top N的下载资源。当用户界面展示有限时,可以减少不必要的差异度计算,从而提高推荐的效率。
如图2所示,在一个实施例中,一种下载资源推荐系统,包括目标用户群组获取模块102、下载记录获取模块104、差异度生成模块106以及推荐模块108,其中:
目标用户群组获取模块102,用于获取目标用户的下载记录,根据下载记录获取与目标用户关联的目标用户群组。
目标用户即为待推荐的用户。在一个实施例中,目标用户群组获取模块102可用于获取目标用户近期的下载记录,如最近一周或最近一月的下载记录。下载记录中可包括该用户下载了哪些下载资源,以及下载资源的下载频次等。
在一个实施例中,目标用户群组获取模块102可用于获取近期用户的下载记录,遍历用户的下载记录,对每个用户的下载记录,执行:将用户的下载记录与目标用户的下载记录进行对比,获取下载记录与目标用户的下载记录匹配的用户,将述获取的用户添加到目标用户群组中。
优选的,目标用户群组获取模块102可用于获取近期活跃用户的下载记录,活跃用户是指用户活跃度超过事先设定的参考值的用户,用户活跃度可以为下载次数、在线时间、每日启动下载次数或这三者的加权平均值。具体的,可每隔一段时间统计出活跃用户,并将活跃用户存储在用户库中。
该下载记录中记录了每个活跃用户在近期下载的下载资源的名称和/或下载资源的哈希值以及下载资源的下载频次。以活跃用户为单位遍历该下载记录,若目标用户的下载记录中的下载资源和该活跃用户的下载记录中的下载资源匹配,则将该用户添加到目标用户群组中。
进一步的,可设置目标用户群组中的用户数的最大值,当目标用户群组的用户数达到该最大值时,则停止遍历。
进一步的,目标用户群组获取模块102可用于获取用户的下载记录中的资源哈希值和/或资源文件名,将用户的下载记录中的资源哈希值和/或资源文件名与目标用户的下载记录中的资源哈希值和/或资源文件名进行对比,获取资源哈希值和/或资源文件名与目标用户相匹配的用户。
目标用户群组获取模块102在对比下载资源的哈希值时,可先获取目标用户的下载记录中记录的下载资源的哈希值,然后和遍历的用户的下载记录中记录的下载资源的哈希值进行对比,若相同,则判定两者匹配,否则,则判定两者不匹配。
目标用户群组获取模块102在对比下载资源的名称时,可先获取目标用户的下载记录中记录的下载资源的名称以及遍历的用户的下载记录中的下载资源的名称,然后采用最大公共子串的方法判定两者的名称是否相匹配。例如,设最大公共子串为0.5,若目标用户的下载记录中记录的下载资源的名称为“哈利波特与魔法石”,遍历的用户的下载记录中记录的下载资源的名称为“哈利波特与火焰杯”,则最大公共子串为“哈利波特与”,则相似度为5/8,大于0.5,判定两者相匹配。
此外,还可设置一阈值,在遍历用户的下载记录的过程中,若所遍历到的用户的下载记录中与目标用户的资源哈希值和/或资源文件名相匹配的下载资源超过该阈值,则将该遍历的用户添加到目标用户群组。
下载记录获取模块104,用于获取目标用户群组的下载记录和全局用户群组的下载记录。
全局用户群组可以包括所有用户,也可设置全局用户群组的用户数,根据该用户数选取的一个较大的用户样本空间作为全局用户群组。例如,可随机选取10000个用户加入全局用户群组。
差异度生成模块106,用于对目标用户群组的下载记录和全局用户群组的下载记录进行处理,生成目标用户群组的下载记录中的下载资源与全局用户群组之间的差异度;。
在一个实施例中,差异度生成模块106可用于获取目标用户群组的下载记录中的下载资源的第一下载频次,以及目标用户群组中的下载记录中的下载资源在全局用户群组中的下载记录中的第二下载频次;获取目标用户群组的第一用户数以及全体用户群组的第二用户数;根据第一下载频次、第二下载频次、第一用户数和第二用户数计算得到筛选出的下载资源与全局用户群组的差异度。
在一个实施例中,差异度生成模块106可用于根据如下公式计算差异度:
其中,diff表示目标用户群组的下载记录中的下载资源与全局用户群组之间的差异度;M1为目标用户群组的第一用户数。M2为全体用户群组的第二用户数;R1=M1/N1,其中,R1为目标用户群组对下载资源R的平均下载频次,N1为目标用户群组对下载资源R的第一下载频次;R2=M2/N2,其中,R2为全体用户群组对下载资源R的平均下载频次,N2为全体用户群组对下载资源R的第二下载频次。
当R1>R2时,diff为正数,表示下载资源R在目标用户群体更受到偏爱。diff值越大,越具备推荐价值。当R1<R2时,diff为负数,表示下载资源R在目标用户群体不受到偏爱。diff值越小,越不具备推荐价值。分母的计算作为一个增益系数,防止当M1,M2变得很大时,R1和R2的结果都偏小,得到的差异度不明显。
在一个实施例中,如图3所示,下载资源推荐系统还包括资源筛选模块110,用于统计目标用户群组的下载记录中下载资源的下载频次,筛选出目标用户群组的下载记录中的下载频次超过第一阈值的下载资源。
具体的,资源筛选模块110可用于在在生成差异度之前,获取到目标用户群组的下载记录后,遍历每个用户的下载记录,将每个用户的下载资源的下载频次进行叠加,统计出目标用户群组的下载资源的下载频次。然后再按照该下载频次对下载资源排序,从该下载记录中提取下载频次大于第一阈值的下载资源,作为目标用户群体的热点资源。
进一步的,对于全局用户群体,资源筛选模块110也可用于按照相同的原理提取全局用户群体的热点资源。在生成差异度时,则可仅对目标用户群体的热点资源和全局用户群体的热点资源进行处理。
通过筛选出热点资源,可以减少生成差异度时需要处理的数据个数,降低了差异度计算的规模,从而减少了不必要的性能损耗。
推荐模块108,用于根据差异度对下载资源进行排序,将排序靠前的预设数量的下载资源推荐给目标用户。
遍历下载资源之后,推荐模块108可用于将差异度按照从大到小的顺序排序,然后取排序后的下载资源序列的top N,即排序靠前的前N个下载资源,然后将下载资源推荐给用户,N为预设的自然数。
优选的,推荐模块108可用于在用户的显示界面上以列表的形式按照差异度的大小顺序展示下载资源的名称、大小、以及下载频次,方便用户选择下载。
在一个实施例中,如图3所示,资源筛选模块110还可用于筛选出差异度大于第二阈值的目标用户群组中的下载资源。
在排序之前过滤掉差异度较小的下载资源可以减少需要排序的下载资源的个数,从而提高排序效率。
在另一个实施例中,推荐模块108还可用于将提取的top N的下载资源缓存,并将推荐的下载资源分页展示给用户,然后根据用户发出的翻页请求从缓存中获取与翻页请求对应的top N的下载资源。当用户界面展示有限时,可以减少不必要的差异度计算,从而提高推荐的效率。
上述下载资源推荐方法和系统,先通过目标用户的下载记录获取该用户所属的目标用户群组,然后再根据目标用户群组在下载频次上与全局用户群组的差异度选择合适的下载资源推荐给目标用户。由于目标用户和目标用户群组中的其他用户在对下载资源的兴趣上相关性较强,可以推出,当目标用户群组对下载资源的兴趣度和全局用户群组相比差异度较大时,目标用户对这些下载资源的兴趣度相较于全局用户群组中的其他用户下载过的下载资源更高,从而提高了向目标用户推荐下载资源的准确度。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (12)

1.一种下载资源推荐方法,包括以下步骤:
获取目标用户的下载记录,根据所述下载记录获取与目标用户关联的目标用户群组;所述目标用户群组包括近期的下载记录与所述目标用户的下载记录匹配的用户;
获取所述目标用户群组的下载记录和全局用户群组的下载记录;
对所述目标用户群组的下载记录和所述全局用户群组的下载记录进行处理,生成目标用户群组的下载记录中的下载资源与全局用户群组之间的差异度;
根据所述差异度对所述下载资源进行排序,将排序靠前的预设数量的下载资源推荐给所述目标用户。
2.根据权利要求1所述的下载资源推荐方法,其特征在于,所述根据所述下载记录获取与目标用户对应的目标用户群组的步骤包括:
获取近期用户的下载记录;
遍历所述用户的下载记录,对每个所述用户的下载记录,执行:
将所述用户的下载记录与所述目标用户的下载记录进行对比,获取下载记录与所述目标用户的下载记录匹配的用户,将获取的所述用户添加到目标用户群组中。
3.根据权利要求2所述的下载资源推荐方法,其特征在于,所述将所述用户的下载记录与所述目标用户的下载记录进行对比,获取下载记录与所述目标用户的下载记录匹配的用户的步骤为:
获取所述用户的下载记录中的资源哈希值和/或资源文件名;
将所述用户的下载记录中的资源哈希值和/或资源文件名与所述目标用户的下载记录中的资源哈希值和/或资源文件名进行对比,获取资源哈希值和/或资源文件名与所述目标用户相匹配的用户。
4.根据权利要求1所述的下载资源推荐方法,其特征在于,所述对所述目标用户群组的下载记录和所述全局用户群组的下载记录进行处理,生成目标用户群组的下载记录中的下载资源与全局用户群组之间的差异度的步骤包括:
统计所述目标用户群组的下载记录中下载资源的下载频次;
筛选出所述目标用户群组的下载记录中的下载频次超过第一阈值的下载资源。
5.根据权利要求1所述的下载资源推荐方法,其特征在于,所述对所述目标用户群组的下载记录和所述全局用户群组的下载记录进行处理,生成目标用户群组的下载记录中的下载资源与全局用户群组之间的差异度的步骤包括:
获取所述目标用户群组的下载记录中的下载资源的第一下载频次,以及所述目标用户群组中的下载记录中的下载资源在所述全局用户群组中的下载记录中的第二下载频次;
获取目标用户群组的第一用户数以及全局用户群组的第二用户数;
根据所述第一下载频次、第二下载频次、第一用户数和第二用户数计算得到所述下载资源与所述全局用户群组的差异度。
6.根据权利要求5所述的下载资源推荐方法,其特征在于,在所述根据所述差异度对所述下载资源进行排序的步骤之前还包括:
筛选出差异度大于第二阈值的所述目标用户群组中的下载资源。
7.一种下载资源推荐系统,其特征在于,包括以下模块:
目标用户群组获取模块,用于获取目标用户的下载记录,根据所述下载记录获取与目标用户关联的目标用户群组;所述目标用户群组包括近期的下载记录与所述目标用户的下载记录匹配的用户;
下载记录获取模块,用于获取所述目标用户群组的下载记录和全局用户群组的下载记录;
差异度生成模块,用于对所述目标用户群组的下载记录和所述全局用户群组的下载记录进行处理,生成目标用户群组的下载记录中的下载资源与全局用户群组之间的差异度;
推荐模块,用于根据所述差异度对所述下载资源进行排序,将排序靠前的预设数量的下载资源推荐给所述目标用户。
8.根据权利要求7所述的下载资源推荐系统,其特征在于,所述目标用户群组获取模块还用于获取近期用户的下载记录,遍历所述用户的下载记录,对每个所述用户的下载记录,执行:
将所述用户的下载记录与所述目标用户的下载记录进行对比,获取下载记录与所述目标用户的下载记录匹配的用户,将获取的所述用户添加到目标用户群组中。
9.根据权利要求8所述的下载资源推荐系统,其特征在于,所述目标用户群组获取模块还用于获取所述用户的下载记录中的资源哈希值和/或资源文件名,将所述用户的下载记录中的资源哈希值和/或资源文件名与所述目标用户的下载记录中的资源哈希值和/或资源文件名进行对比,获取资源哈希值和/或资源文件名与所述目标用户相匹配的用户。
10.根据权利要求7所述的下载资源推荐系统,其特征在于,还包括资源筛选模块,用于统计所述目标用户群组的下载记录中下载资源的下载频次,筛选出所述目标用户群组的下载记录中的下载频次超过第一阈值的下载资源。
11.根据权利要求7所述的下载资源推荐系统,其特征在于,所述差异度生成模块还用于获取所述目标用户群组的下载记录中的下载资源的第一下载频次,以及所述目标用户群组中的下载记录中的下载资源在所述全局用户群组中的下载记录中的第二下载频次,获取目标用户群组的第一用户数以及全局用户群组的第二用户数,根据所述第一下载频次、第二下载频次、第一用户数和第二用户数计算得到所述下载资源与所述全局用户群组的差异度。
12.根据权利要求10所述的下载资源推荐系统,其特征在于,所述资源筛选模块还用于筛选出差异度大于第二阈值的所述目标用户群组中的下载资源。
CN201210018761.0A 2012-01-20 2012-01-20 下载资源推荐方法及系统 Active CN103218366B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201210018761.0A CN103218366B (zh) 2012-01-20 2012-01-20 下载资源推荐方法及系统
PCT/CN2012/086906 WO2013107238A1 (zh) 2012-01-20 2012-12-19 下载资源推荐方法、系统及存储介质
CA2861898A CA2861898C (en) 2012-01-20 2012-12-19 Download resource recommendation method, system and storage medium
US14/373,003 US9264502B2 (en) 2012-01-20 2012-12-19 Download resource recommendation method, system and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210018761.0A CN103218366B (zh) 2012-01-20 2012-01-20 下载资源推荐方法及系统

Publications (2)

Publication Number Publication Date
CN103218366A CN103218366A (zh) 2013-07-24
CN103218366B true CN103218366B (zh) 2017-09-01

Family

ID=48798581

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210018761.0A Active CN103218366B (zh) 2012-01-20 2012-01-20 下载资源推荐方法及系统

Country Status (4)

Country Link
US (1) US9264502B2 (zh)
CN (1) CN103218366B (zh)
CA (1) CA2861898C (zh)
WO (1) WO2013107238A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530365B (zh) * 2013-10-12 2017-07-04 北京搜狗信息服务有限公司 获取资源的下载链接的方法及系统
CN104636378A (zh) * 2013-11-12 2015-05-20 中兴通讯股份有限公司 应用程序的推送方法及装置
CN103929484B (zh) * 2014-04-18 2018-01-09 北京搜狗科技发展有限公司 为用户整合个性化资源的方法及装置
CN103944986B (zh) * 2014-04-18 2018-01-02 北京搜狗科技发展有限公司 为用户整合个性化资源的方法及装置
CN106469146A (zh) * 2015-08-12 2017-03-01 腾讯科技(深圳)有限公司 一种利用社交群组进行推荐的验证系统及系统
CN105912550A (zh) * 2015-12-15 2016-08-31 乐视网信息技术(北京)股份有限公司 一种移动终端的信息推荐方法及装置
CN106656768B (zh) * 2017-02-09 2020-06-23 腾讯科技(深圳)有限公司 一种资源推荐方法及装置
WO2020065777A1 (ja) * 2018-09-26 2020-04-02 日本電気株式会社 情報処理装置、制御方法、及びプログラム
WO2020252742A1 (zh) * 2019-06-20 2020-12-24 深圳市云中飞网络科技有限公司 资源推送方法及相关产品
CN111209033B (zh) * 2020-01-10 2024-01-12 百度在线网络技术(北京)有限公司 小程序包的下载方法及相关设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101105795A (zh) * 2006-10-27 2008-01-16 北京搜神网络技术有限责任公司 基于网络行为的个性化推荐方法和系统
CN102043781A (zh) * 2009-10-23 2011-05-04 华为技术有限公司 一种网页资源推荐方法及装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040093595A1 (en) * 2002-08-08 2004-05-13 Eric Bilange Software application framework for network-connected devices
US20050071485A1 (en) * 2003-09-26 2005-03-31 Arun Ramagopal System and method for identifying a network resource
US7890047B2 (en) * 2007-04-11 2011-02-15 The Directv Group, Inc. Method and system for file sharing between a group of user devices using obtained permissions
US8244884B2 (en) * 2007-04-11 2012-08-14 The Directv Group, Inc. Method and apparatus for file sharing between a group of user devices with crucial portions sent via satellite and non-crucial portions sent using a peer-to-peer network
US7895341B2 (en) * 2007-04-11 2011-02-22 The Directv Group, Inc. Method and apparatus for file sharing between a group of user devices with separately sent crucial portions and non-crucial portions
US8345869B2 (en) * 2007-04-11 2013-01-01 The Directv Group, Inc. Method and apparatus for file sharing of missing content between a group of user devices in a peer-to-peer network
US8417939B2 (en) * 2007-04-11 2013-04-09 The DIRECTV Goup, Inc. Method and apparatus for file sharing between a group of user devices with encryption-decryption information sent via satellite and the content sent separately
US8386486B2 (en) * 2008-07-02 2013-02-26 Palo Alto Research Center Incorporated Method for facilitating social networking based on fashion-related information
US8666979B2 (en) 2010-04-09 2014-03-04 Palo Alto Research Center Incorporated Recommending interesting content using messages containing URLs

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101105795A (zh) * 2006-10-27 2008-01-16 北京搜神网络技术有限责任公司 基于网络行为的个性化推荐方法和系统
CN102043781A (zh) * 2009-10-23 2011-05-04 华为技术有限公司 一种网页资源推荐方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
社会网络中兴趣发现与信息组织的研究;谢兴;《中国博士学位论文全文数据库信息科技辑》;20111215(第12期);第1-83页 *

Also Published As

Publication number Publication date
CN103218366A (zh) 2013-07-24
CA2861898A1 (en) 2013-07-25
US9264502B2 (en) 2016-02-16
WO2013107238A1 (zh) 2013-07-25
US20140379808A1 (en) 2014-12-25
CA2861898C (en) 2017-01-10

Similar Documents

Publication Publication Date Title
CN103218366B (zh) 下载资源推荐方法及系统
US9978093B2 (en) Method and system for pushing mobile application
CN105210048B (zh) 基于社交媒体的内容识别方法
US9361373B1 (en) Content aggregation and presentation
CN104991899B (zh) 用户属性的识别方法及装置
US8555173B2 (en) Recommendation engine
US20150205580A1 (en) Method and System for Sorting Online Videos of a Search
CN102737029B (zh) 搜索方法及系统
CN105893443A (zh) 视频推荐方法、装置和服务器
CN102999507B (zh) 网络微博名人信息的推荐处理方法和装置
CN103020090B (zh) 一种提供链接推荐的方法及装置
JP5673336B2 (ja) 情報処理方法、表示方法、情報処理装置、表示装置、情報処理プログラム、表示プログラム
CN106326391A (zh) 多媒体资源推荐方法及装置
US10873556B2 (en) Systems and methods for compiling, curating, and sharing digital content
CN104021140B (zh) 一种网络视频的处理方法及装置
US20130290340A1 (en) Providing Control Over a Personalized Category of Information
JP2008181186A (ja) クエリーログを利用したキーワードとサイトの関連度を求める方法
CN106599285B (zh) 基于新闻类搜索提供搜索结果的方法及装置
CN107103028A (zh) 一种信息处理方法及装置
JP2011048729A (ja) クエリ抽出装置、クエリ抽出方法およびクエリ抽出プログラム
KR101908073B1 (ko) 관심도 높은 단어를 검색어로 추천하는 문장완성형 검색시스템 및 방법
JP6414192B2 (ja) 情報処理装置、情報処理方法、情報処理プログラム
Prawesh et al. Probabilistic news recommender systems with feedback
US10037550B2 (en) System and method for identifying offline consumer interests for online personalization by leveraging multimedia inputs
KR100773066B1 (ko) 인터넷 정보검색방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant