WO2013107238A1 - 下载资源推荐方法、系统及存储介质 - Google Patents

下载资源推荐方法、系统及存储介质 Download PDF

Info

Publication number
WO2013107238A1
WO2013107238A1 PCT/CN2012/086906 CN2012086906W WO2013107238A1 WO 2013107238 A1 WO2013107238 A1 WO 2013107238A1 CN 2012086906 W CN2012086906 W CN 2012086906W WO 2013107238 A1 WO2013107238 A1 WO 2013107238A1
Authority
WO
WIPO (PCT)
Prior art keywords
download
resource
record
target user
user
Prior art date
Application number
PCT/CN2012/086906
Other languages
English (en)
French (fr)
Inventor
冀祖峰
刘刚
朱臣元
Original Assignee
腾讯科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 腾讯科技(深圳)有限公司 filed Critical 腾讯科技(深圳)有限公司
Priority to CA2861898A priority Critical patent/CA2861898C/en
Priority to US14/373,003 priority patent/US9264502B2/en
Publication of WO2013107238A1 publication Critical patent/WO2013107238A1/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/535Tracking the activity of the user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level

Definitions

  • the present invention relates to the field of network technologies, and in particular, to a download resource recommendation method, system, and storage medium.
  • Download resources can include software, video, audio, pictures, text, and more.
  • the function of recommending additional download resources is also provided, that is, some high-quality download resources, such as popular movies, popular games, commonly used software, etc., are actively pushed. Present to the user on the page or on the client.
  • a download resource recommendation method in the traditional technology determining the popularity of the downloaded resource according to the download record of the downloaded resource (the higher the download volume is, the higher the popularity), and then sorting the download resources according to the heat, and ranking the top N of the heat (ie, the resource)
  • the top N download resources of the heat ranking, N is a natural number, which can be recommended to the user according to the requirements.
  • the download record of the download resource can only reflect the statistical interest of the user as a whole, the relevance of the download resource recommended to the user is not high.
  • Another improved download resource recommendation method in the conventional technology is to first create a score table (score matrix) according to each user's score for each download resource, and then mine according to the similarity of the user's scores on different download resources.
  • a target user group similar to the target user (to be recommended user) is selected, and then the download resource is recommended to the target user according to the overall preference of the group (such as the rating of the downloaded resource by the user in the target user group).
  • the improved download resource recommendation method improves the correlation between the download resource and the target user on the basis of the former download resource recommendation method, but the user scores the download resource. It is not easy to obtain (many users do not score after downloading), and because the target user's interest in downloading resources is determined only by the overall preference of the target user group, the target user has insufficient correlation with the download resource, thereby making the target user
  • the method of recommending downloading resources to a target user is not accurate.
  • a method for recommending download resources including the following steps:
  • the download resources are sorted according to the degree of difference, and a preset number of downloaded resources that are ranked first are recommended to the target user.
  • the step of obtaining a target user group corresponding to the target user according to the download record includes:
  • the step of comparing the download record of the user with the download record of the target user, and obtaining the user whose download record matches the download record of the target user is:
  • the resource hash value and/or the resource file name in the download record of the user with the target are compared to obtain a resource hash value and/or a user whose resource file name matches the target user.
  • the step of processing the download record of the target user group and the download record of the global user group, and generating the degree of difference between the download resource and the global user group in the target user group includes:
  • the download resource whose download frequency in the download record of the target user group exceeds the first threshold is filtered out.
  • the downloading record of the target user group and the download record of the global user group are processed, and the difference between the download resource and the global user group in the download record of the target user group is obtained.
  • the steps include:
  • the method before the step of sorting the download resources according to the difference degree, the method further includes:
  • the download resource in the target user group whose degree of difference is greater than the second threshold is filtered out.
  • a download resource recommendation system including the following modules:
  • a target user group obtaining module configured to acquire a download record of the target user, and obtain a target user group associated with the target user according to the download record;
  • a download record obtaining module configured to acquire a download record of the target user group and a download record of a global user group
  • a difference degree generating module configured to process a download record of the target user group and a download record of the global user group, and generate a download resource between the download record of the target user group and the global user group Degree of difference
  • a recommendation module configured to sort the download resources according to the difference degree, and recommend a preset number of download resources that are ranked first to the target user.
  • the target user group obtaining module is further configured to obtain a download record of a recent user, traverse the download record of the user, and perform a download record for each of the users, and execute:
  • the target user group obtaining module is further configured to acquire a resource hash value and/or a resource file name in the download record of the user, and use a resource hash value and/or in the download record of the user.
  • the resource file name and the resource hash value and/or the resource file name in the download record of the target user are further included, and the resource screening module is configured to collect the download frequency of the download resource in the download record of the target user group. And downloading, in the download record of the target user group, a download resource whose download frequency exceeds a first threshold.
  • the difference degree generating module is further configured to acquire a first download frequency of the download resource in the download record of the target user group, and download resources in the download record in the target user group are in the The second download frequency in the download record in the global user group, the first user number of the target user group and the second user number of the entire user group, according to the first download frequency, the second download frequency, and the second download frequency
  • the number of users and the number of second users are calculated to obtain the difference between the filtered download resource and the global user group.
  • the resource screening module is further configured to filter download resources in the target user group whose degree of difference is greater than a second threshold.
  • the above-mentioned download resource recommendation method, system and storage medium first obtain the target user group to which the user belongs by using the download record of the target user, and then according to the target user group on the download frequency.
  • the degree of difference of the global user group is selected and recommended to the target user. Since the target user and other users in the target user group are more relevant in the interest in downloading the resource, it can be launched, when the target user group has a greater degree of interest in downloading the resource than the global user group.
  • the target user's interest in these download resources is higher than that downloaded by other users in the global user group, thereby improving the accuracy of recommending download resources to the target user.
  • 1 is a flow chart of a method for recommending downloading resources in an embodiment
  • FIG. 2 is a schematic structural diagram of a download resource recommendation system in an embodiment
  • FIG. 3 is a schematic structural diagram of a download resource recommendation system in another embodiment.
  • a method for recommending downloading resources includes the following steps: Step S102: Acquire a download record of a target user, and obtain a target user group associated with the target user according to the download record.
  • the target user is the user to be recommended.
  • a recent download record of the target user such as a download record for the most recent week or the most recent month, may be obtained.
  • the download record can include which download resources the user downloaded and the download frequency of the download resources.
  • step S102 obtaining a download record of a recent user, traversing the download record of the user, and downloading the record for each user, performing: comparing the download record of the user with the download record of the target user, and obtaining the download The user who matches the download record of the target user is recorded, and the obtained user is added to the target user group.
  • the download record of the recent active user is obtained, and the active user refers to the user whose user activity exceeds the preset reference value, and the user activity may be the number of downloads, the online time, the number of downloads per download, or the like. Weighted average. Specifically, the active users can be counted at regular intervals, and the active users are stored in the user library.
  • the download record records the name and/or name of the download resource that each active user downloaded in the near future.
  • the download record is traversed in units of active users. If the download resource in the download record of the target user matches the download resource in the download record of the active user, the user is added to the target user group.
  • the maximum number of users in the target user group may be set, and when the number of users of the target user group reaches the maximum value, the traversal is stopped.
  • the resource hash value and/or the resource file name in the download record of the user may be obtained, and the resource hash value and/or the resource file name in the download record of the user and the resource hash in the download record of the target user may be obtained.
  • the value and/or resource file name are compared to obtain a resource hash value and/or a user whose resource file name matches the target user.
  • the hash value of the download resource recorded in the download record of the target user may be obtained first, and then compared with the hash value of the download resource recorded in the download record of the traversed user, if the same Then, it is determined that the two match, otherwise, it is determined that the two do not match.
  • the name of the download resource recorded in the download record of the target user and the name of the download resource in the download record of the traversed user may be obtained first, and then the names of the two are determined by the method of the largest common substring. Whether it matches. For example, if the maximum common substring is 0.5, if the name of the download resource recorded in the download record of the target user is "Harry Potter and the Sorcerer's Stone", the name of the download resource recorded in the download record of the traversed user is "Ha” Libert and the Goblet", then the largest common substring is "Harry Potter and”, then the similarity is 5/8, greater than 0.5, and the two are judged to match.
  • a threshold may also be set. In the process of traversing the download record of the user, if the downloaded resource of the traversed user's download record matches the resource hash value and/or the resource file name of the target user exceeds the threshold. , then add the traversed user to the target user group.
  • Step S104 Obtain a download record of the target user group and a download record of the global user group.
  • the global user group may include all users, and may also set the number of users of the global user group, and a larger user sample space selected according to the number of users is used as the global user group. For example, 10,000 users can be randomly selected to join a global user group.
  • Step S106 processing the download record of the target user group and the download record of the global user group, and generating a difference between the download resource and the global user group in the download record of the target user group. Different degrees.
  • the degree of difference can be calculated according to the following formula:
  • diff represents the degree of difference between the download resource and the global user group in the download record of the target user group
  • M1 is the first user number of the target user group obtained when traversing to the download resource R.
  • M2 is the second number of users of the entire user group
  • R1 M1/N1, where R1 is the average download frequency of the target user group to the download resource R, and N1 is the first download frequency of the target user group to the download resource R.
  • R2 M2/N2, where R2 is the average download frequency of the download resource R for all user groups, and N2 is the second download frequency of the download resource R for all user groups.
  • step S106 may further include: counting download frequency of download resources in the download record of the target user group, and filtering out download resources in the download record of the target user group that exceed the first threshold.
  • the download record of each user may be traversed, and the download frequency of each user's download resource is superimposed, and the target user group is counted. Download the download frequency of the resource. Then follow the download frequency to download the capital The source is sorted, and the download resource whose download frequency is greater than the first threshold is extracted from the download record as a hotspot resource of the target user group.
  • the hotspot resources of the global user group may also be extracted according to the same principle.
  • the degree of difference is generated, only the hotspot resources of the target user group and the hotspot resources of the global user group may be processed.
  • the number of data that needs to be processed when the difference is generated can be reduced, and the scale of the difference calculation can be reduced, thereby reducing unnecessary performance loss.
  • Step S108 Sort the download resources according to the degree of difference, and recommend the preset number of download resources that are ranked first to the target user.
  • the differences can be sorted in descending order, and then the top N of the sorted download resource sequence is taken, that is, the top N download resources are sorted first, and then the download resources are recommended to the user, N The default natural number.
  • the name, size, and download frequency of the downloaded resource may be displayed in the form of a list on the display interface of the user according to the size of the difference, so that the user can select the download.
  • the download resources in the target user group whose degree of difference is greater than the second threshold may also be filtered out. Filtering out download resources with less difference before sorting can reduce the number of download resources that need to be sorted, thereby improving sorting efficiency.
  • a download resource recommendation system includes a target user group obtaining module 102, a download record obtaining module 104, a difference degree generating module 106, and a recommendation module 108, wherein:
  • the target user group obtaining module 102 is configured to acquire a download record of the target user, and acquire a target user group associated with the target user according to the download record.
  • the target user is the user to be recommended.
  • the 102 can be used to get a recent download record of the target user, such as the download record for the most recent week or the most recent month.
  • the download record may include which download resources the user downloaded, and the download frequency of the download resources.
  • the target user group obtaining module 102 may be configured to obtain a download record of a recent user, traverse the download record of the user, and perform a download record for each user, and perform: downloading the download record of the user and the download record of the target user In contrast, the user who matches the download record of the target user is obtained, and the obtained user is added to the target user group.
  • the target user group obtaining module 102 can be used to obtain the download record of the recent active user, and the active user refers to the user whose user activity exceeds the preset reference value, and the user activity can be the download frequency, the online time, and the daily Start the number of downloads or a weighted average of the three.
  • the active users can be counted at regular intervals, and the active users are stored in the user library.
  • the download record records the name of the download resource recently downloaded by each active user and/or the hash value of the download resource and the download frequency of the downloaded resource.
  • the download record is traversed in units of active users. If the download resource in the download record of the target user matches the download resource in the download record of the active user, the user is added to the target user group.
  • the maximum number of users in the target user group may be set, and when the number of users of the target user group reaches the maximum value, the traversal is stopped.
  • the target user group obtaining module 102 may be configured to obtain a resource hash value and/or a resource file name in the download record of the user, and the resource hash value and/or the resource file name in the download record of the user and the target user.
  • the resource hash value and/or the resource file name in the download record are compared to obtain a resource hash value and/or a user whose resource file name matches the target user.
  • the target user group obtaining module 102 may first obtain a hash value of the download resource recorded in the download record of the target user, and then download the downloaded resource recorded in the download record of the traversed user. The Greek values are compared. If they are the same, the two are judged to match. Otherwise, it is determined that the two do not match.
  • the target user group obtaining module 102 may first obtain the target when comparing the names of the downloaded resources.
  • the name of the download resource recorded in the download record of the user and the name of the download resource in the download record of the traversed user and then use the method of the largest common substring to determine whether the names of the two match. For example, if the maximum common substring is 0.5, if the name of the download resource recorded in the download record of the target user is "Harry Potter and the Sorcerer's Stone", the name of the download resource recorded in the download record of the traversed user is "Ha" Libert and the Goblet", then the largest common substring is "Harry Potter and”, then the similarity is 5/8, greater than 0.5, and the two are matched.
  • a threshold may also be set. In the process of traversing the download record of the user, if the downloaded resource of the traversed user's download record matches the resource hash value and/or the resource file name of the target user exceeds the threshold. , then add the traversed user to the target user group.
  • the download record obtaining module 104 is configured to obtain a download record of the target user group and a download record of the global user group.
  • the global user group may include all users, and may also set the number of users of the global user group, and a larger user sample space selected according to the number of users is used as the global user group. For example, 10,000 users can be randomly selected to join a global user group.
  • the difference degree generating module 106 is configured to process the download record of the target user group and the download record of the global user group, and generate a difference degree between the download resource and the global user group in the download record of the target user group; .
  • the difference generation module 106 is configured to acquire a first download frequency of the download resource in the download record of the target user group, and the download resource in the download record in the target user group is in the global user group.
  • the second download frequency in the download record; the first user number of the target user group and the second user number of the entire user group; according to the first download frequency, the second download frequency, the first user number, and the second user The number calculation calculates the difference between the filtered download resource and the global user group.
  • the difference generation module 106 can be configured to calculate the degree of difference according to the following formula:
  • the download resource recommendation system further includes a resource screening module 110, configured to collect a download frequency of the download resource in the download record of the target user group, and filter out the download record of the target user group.
  • the download resource whose download frequency exceeds the first threshold.
  • the resource screening module 110 may be configured to: after acquiring the download record of the target user group, generate a download record of the target user group, traverse the download record of each user, and superimpose the download frequency of each user's download resource, and calculate The download frequency of the download resources of the target user group. Then, the download resource is sorted according to the download frequency, and the download resource whose download frequency is greater than the first threshold is extracted from the download record as a hotspot resource of the target user group.
  • the resource screening module 110 can also be used to extract hotspot resources of the global user group according to the same principle. When the degree of difference is generated, only the hotspot resources of the target user group and the hotspot resources of the global user group may be processed.
  • the number of data that needs to be processed when the difference is generated can be reduced, and the scale of the difference calculation can be reduced, thereby reducing unnecessary performance loss.
  • the recommendation module 108 is configured to sort the download resources according to the degree of difference, and recommend the preset number of download resources with the top ranking to the target user.
  • the recommendation module 108 can be used to order the differences in descending order Sort, then take the top N of the sorted download resource sequence, that is, sort the top N download resources, and then recommend the download resource to the user, where N is the preset natural number.
  • the recommendation module 108 can be used to display the name, size, and download frequency of the download resource in the form of a list in the form of a difference on the display interface of the user, so that the user can select the download.
  • the resource screening module 110 is further configured to filter out download resources in a target user group whose degree of difference is greater than a second threshold.
  • Filtering out download resources with less difference before sorting can reduce the number of download resources that need to be sorted, thereby improving sorting efficiency.
  • the recommendation module 108 is further configured to cache the extracted download resources of the top N, and display the recommended download resources to the user, and then obtain and page the request from the cache according to the page turning request sent by the user. Corresponding top N download resources.
  • the unnecessary degree of difference calculation can be reduced, thereby improving the efficiency of the recommendation.
  • the above-mentioned download resource recommendation method, system and storage medium first obtain the target user group to which the user belongs by using the download record of the target user, and then select an appropriate one according to the difference degree of the target user group on the download frequency and the global user group.
  • the download resource is recommended to the target user. Since the target user and other users in the target user group are more relevant in the interest in downloading the resource, it can be launched, when the target user group has a greater degree of interest in downloading the resource than the global user group.
  • the target user's interest in these download resources is higher than that downloaded by other users in the global user group, thereby improving the accuracy of recommending download resources to the target user.
  • the present invention also provides one or more computer storage media containing computer executable instructions for performing a download resource recommendation method.
  • the storage medium may be a magnetic disk, an optical disk, or a read-only memory (ROM). Or random access memory (RAM), etc. It is not to be construed as limiting the scope of the invention. It should be noted that a number of variations and modifications may be made by those skilled in the art without departing from the spirit and scope of the invention. Therefore, the scope of the invention should be determined by the appended claims.

Abstract

一种下载资源推荐方法,包括以下步骤:获取目标用户的下载记录,根据所述下载记录获取与目标用户关联的目标用户群组;获取所述目标用户群组的下载记录和全局用户群组的下载记录;对所述目标用户群组的下载记录和所述全局用户群组的下载记录进行处理,生成目标用户群组的下载记录中的下载资源与全局用户群组之间的差异度;根据所述差异度对所述下载资源进行排序,将排序靠前的预设数量的下载资源推荐给所述目标用户。此外,还提供了一种下载资源推荐系统以及存储介质。上述下载资源推荐方法、系统及存储介质提高了向目标用户推荐下载资源的准确度。

Description

说 明 书 发明名称: 下载资源推荐方法、 系统及存储介盾 【技术领域】
本发明涉及网络技术领域, 特别涉及一种下载资源推荐方法、 系统及存 储介质。
【背景技术】
随着通信事业的发展, 网络带宽得到了较大的提升, 从而出现了大量的 提供下载资源的网站和客户端软件。 这些网站和客户端软件将下载资源分门 别类, 然后展示给用户。 用户可以根据自己的需要选择合适的下载资源进行 下载。 下载资源可包括软件、 视频、 音频、 图片、 文本等。 为了使用户选择 资源更加便利, 除了支持用户主动提交下载请求的功能以外, 还提供额外的 下载资源推荐的功能, 就是将一些优质的下载资源, 例如热门电影, 热门游 戏, 常用软件等, 主动推送到页面或者客户端上展现给用户。
传统技术中的一种下载资源推荐方法, 根据下载资源的下载记录确定下 载资源的热度(下载量越大热度越高), 然后将下载资源按照热度排序, 并将 热度排名的 top N (即资源热度排名的前 N个下载资源, N为自然数, 可根据 需求设置)推荐给用户。 但由于下载资源的下载记录只能反映统计学上用户 整体的兴趣点, 因此推荐给用户的下载资源与用户的相关性不高。
传统技术中的另一种改进型下载资源推荐方法, 先根据每个用户对每个 下载资源的评分建立一张评分表(评分矩阵), 然后根据用户对不同下载资源 的评分的相似度来挖掘出和目标用户 (待推荐用户 )相似的目标用户群组, 然后根据该群组的整体喜好程度(如目标用户群组中的用户对下载资源的评 分) 向目标用户推荐下载资源。
然而, 这种改进型下载资源推荐方法虽然在前一种下载资源推荐方法的 基础上提高了下载资源与目标用户的相关性, 但是, 用户对下载资源的评分 不易获取(很多用户下载完成后并不会进行评分), 且由于仅仅通过目标用户 群组的整体喜好程度来判定目标用户对下载资源的兴趣度, 使得目标用户与 下载资源相关性不足, 从而使得向目标用户推荐下载资源的方法的准确度不 高。
【发明内容】
基于此, 有必要提供一种提高推荐的准确度的下载资源推荐方法。
一种下载资源推荐方法, 包括以下步骤:
获取目标用户的下载记录, 根据所述下载记录获取与目标用户关联的目 标用户群组;
获取所述目标用户群组的下载记录和全局用户群组的下载记录; 对所述目标用户群组的下载记录和所述全局用户群组的下载记录进行处 理, 生成目标用户群组的下载记录中的下载资源与全局用户群组之间的差异 度;
根据所述差异度对所述下载资源进行排序, 将排序靠前的预设数量的下 载资源推荐给所述目标用户。
优选的, 所述根据所述下载记录获取与目标用户对应的目标用户群组的 步骤包括:
获取近期用户的下载记录;
遍历所述用户的下载记录, 对每个所述用户的下载记录, 执行: 将所述用户的下载记录与所述目标用户的下载记录进行对比, 获取下载 记录与所述目标用户的下载记录匹配的用户, 将所述获取的用户添加到目标 用户群组中。
优选的, 所述将所述用户的下载记录与所述目标用户的下载记录进行对 比, 获取下载记录与所述目标用户的下载记录匹配的用户的步骤为:
获取所述用户的下载记录中的资源哈希值和 /或资源文件名;
将所述用户的下载记录中的资源哈希值和 /或资源文件名与所述目标用 户的下载记录中的资源哈希值和 /或资源文件名进行对比, 获取资源哈希值和 /或资源文件名与所述目标用户相匹配的用户。
优选的, 所述对目标用户群组的下载记录和所述全局用户群组的下载记 录进行处理, 生成目标用户群组中的下载资源与全局用户群组之间的差异度 的步骤包括:
统计所述目标用户群组的下载记录中下载资源的下载频次;
筛选出所述目标用户群组的下载记录中的下载频次超过第一阈值的下载 资源。
优选的, 所述对所述目标用户群组的下载记录和所述全局用户群组的下 载记录进行处理, 获得目标用户群组的下载记录中的下载资源与全局用户群 组之间的差异度的步骤包括:
获取所述目标用户群组的下载记录中的下载资源的第一下载频次, 以及 所述目标用户群组中的下载记录中的下载资源在所述全局用户群组中的下载 记录中的第二下载频次;
获取目标用户群组的第一用户数以及全体用户群组的第二用户数; 根据所述第一下载频次、 第二下载频次、 第一用户数和第二用户数计算 得到所述筛选出的下载资源与所述全局用户群组的差异度。
优选的, 在所述根据所述差异度对所述下载资源进行排序的步骤之前还 包括:
筛选出差异度大于第二阈值的所述目标用户群组中的下载资源。 此外, 还有必要提供一种提高推荐的准确度的下载资源推荐系统。
一种下载资源推荐系统, 包括以下模块:
目标用户群组获取模块, 用于获取目标用户的下载记录, 根据所述下载 记录获取与目标用户关联的目标用户群组;
下载记录获取模块, 用于获取所述目标用户群组的下载记录和全局用户 群组的下载记录; 差异度生成模块, 用于对所述目标用户群组的下载记录和所述全局用户 群组的下载记录进行处理, 生成目标用户群组的下载记录中的下载资源与全 局用户群组之间的差异度;
推荐模块, 用于根据所述差异度对所述下载资源进行排序, 将排序靠前 的预设数量的下载资源推荐给所述目标用户。
优选的, 所述目标用户群组获取模块还用于获取近期用户的下载记录, 遍历所述用户的下载记录, 对每个所述用户的下载记录, 执行:
将所述用户的下载记录与所述目标用户的下载记录进行对比, 获取下载 记录与所述目标用户的下载记录匹配的用户, 将所述获取的用户添加到目标 用户群组中。
优选的, 所述目标用户群组获取模块还用于获取所述用户的下载记录中 的资源哈希值和 /或资源文件名, 将所述用户的下载记录中的资源哈希值和 / 或资源文件名与所述目标用户的下载记录中的资源哈希值和 /或资源文件名 优选的, 还包括资源筛选模块, 用于统计所述目标用户群组的下载记录 中下载资源的下载频次, 筛选出所述目标用户群组的下载记录中的下载频次 超过第一阈值的下载资源。
优选的, 所述差异度生成模块还用于获取所述目标用户群组的下载记录 中的下载资源的第一下载频次, 以及所述目标用户群组中的下载记录中的下 载资源在所述全局用户群组中的下载记录中的第二下载频次, 获取目标用户 群组的第一用户数以及全体用户群组的第二用户数,根据所述第一下载频次、 第二下载频次、 第一用户数和第二用户数计算得到所述筛选出的下载资源与 所述全局用户群组的差异度。
优选的, 所述资源筛选模块还用于筛选出差异度大于第二阈值的所述目 标用户群组中的下载资源。
上述下载资源推荐方法、 系统及存储介质, 先通过目标用户的下载记录 获取该用户所属的目标用户群组, 然后再根据目标用户群组在下载频次上与 全局用户群组的差异度选择合适的下载资源推荐给目标用户。 由于目标用户 和目标用户群组中的其他用户在对下载资源的兴趣上相关性较强,可以推出, 当目标用户群组对下载资源的兴趣度和全局用户群组相比差异度较大时, 目 标用户对这些下载资源的兴趣度相较于全局用户群组中的其他用户下载过的 下载资源更高, 从而提高了向目标用户推荐下载资源的准确度。
【附图说明】
图 1为一个实施例中下载资源推荐方法的流程图;
图 2为一个实施例中下载资源推荐系统的结构示意图;
图 3为另一个实施例中下载资源推荐系统的结构示意图。
【具体实施方式】
如图 1所示, 在一个实施例中, 一种下载资源推荐方法, 包括以下步骤: 步骤 S102, 获取目标用户的下载记录, 根据下载记录获取与目标用户关 联的目标用户群组。
目标用户即为待推荐的用户。 在一个实施例中, 可以获取目标用户近期 的下载记录, 如最近一周或最近一月的下载记录。 下载记录中可包括该用户 下载了哪些下载资源以及下载资源的下载频次等。
在一个实施例中, 在步骤 S102中, 获取近期用户的下载记录, 遍历用户 的下载记录, 对每个用户的下载记录, 执行: 将用户的下载记录与目标用户 的下载记录进行对比, 获取下载记录与目标用户的下载记录匹配的用户, 将 获取的用户添加到目标用户群组中。
优选的, 可获取近期活跃用户的下载记录, 活跃用户是指用户活跃度超 过事先设定的参考值的用户, 用户活跃度可以为下载次数、 在线时间、 每曰 启动下载次数或这三者的加权平均值。 具体的, 可每隔一段时间统计出活跃 用户, 并将活跃用户存储在用户库中。
下载记录中记录了每个活跃用户在近期下载的下载资源的名称和 /或下 载资源的哈希值以及下载资源的下载频次。 以活跃用户为单位遍历该下载记 录, 若目标用户的下载记录中的下载资源和该活跃用户的下载记录中的下载 资源匹配, 则将该用户添加到目标用户群组中。
进一步的, 可设置目标用户群组中的用户数的最大值, 当目标用户群组 的用户数达到该最大值时, 则停止遍历。
进一步的, 可获取用户的下载记录中的资源哈希值和 /或资源文件名, 将 用户的下载记录中的资源哈希值和 /或资源文件名与目标用户的下载记录中 的资源哈希值和 /或资源文件名进行对比,获取资源哈希值和 /或资源文件名与 目标用户相匹配的用户。
在对比下载资源的哈希值时, 可先获取目标用户的下载记录中记录的下 载资源的哈希值, 然后和遍历的用户的下载记录中记录的下载资源的哈希值 进行对比, 若相同, 则判定两者匹配, 否则, 则判定两者不匹配。
在对比下载资源的名称时, 可先获取目标用户的下载记录中记录的下载 资源的名称以及遍历的用户的下载记录中的下载资源的名称, 然后采用最大 公共子串的方法判定两者的名称是否相匹配。 例如, 设最大公共子串为 0.5 , 若目标用户的下载记录中记录的下载资源的名称为 "哈利波特与魔法石", 遍 历的用户的下载记录中记录的下载资源的名称为 "哈利波特与火焰杯", 则最 大公共子串为 "哈利波特与", 则相似度为 5/8 , 大于 0.5 , 判定两者匹配。
此外, 还可设置一阈值, 在遍历用户的下载记录的过程中, 若所遍历到 的用户的下载记录中与目标用户的资源哈希值和 /或资源文件名相匹配的下 载资源超过该阈值, 则将该遍历的用户添加到目标用户群组。
步骤 S104, 获取目标用户群组的下载记录和全局用户群组的下载记录。 全局用户群组可以包括所有用户, 也可设置全局用户群组的用户数, 根 据该用户数选取的一个较大的用户样本空间作为全局用户群组。 例如, 可随 机选取 10000个用户加入全局用户群组。
步骤 S106, 对目标用户群组的下载记录和全局用户群组的下载记录进行 处理, 生成目标用户群组的下载记录中的下载资源与全局用户群组之间的差 异度。
在一个实施例中, 获取目标用户群组的下载记录中的下载资源的第一下 载频次, 以及目标用户群组中的下载记录中的下载资源在全局用户群组中的 下载记录中的第二下载频次; 获取目标用户群组的第一用户数以及全体用户 群组的第二用户数; 根据第一下载频次、 第二下载频次、 第一用户数和第二 用户数计算得到筛选出的下载资源与全局用户群组的差异度。
在一个实施例中, 可根据如下公式计算差异度:
Figure imgf000009_0001
其中, diff表示目标用户群组的下载记录中的下载资源与全局用户群组之 间的差异度; Ml 为遍历到下载资源 R时, 获取到的目标用户群组的第一用 户数。 M2为全体用户群组的第二用户数; R1=M1/N1 , 其中, R1为目标用户 群组对下载资源 R的平均下载频次, N1为目标用户群组对下载资源 R的第 一下载频次; R2=M2/N2 , 其中, R2为全体用户群组对下载资源 R的平均下 载频次, N2为全体用户群组对下载资源 R的第二下载频次。
当 Rl > R2时, diff为正数, 表示下载资源 R在目标用户群体更受到偏 爱。 diff值越大, 越具备推荐价值。 当 R1 < R2时, diff为负数, 表示下载资 源 R在目标用户群体不受到偏爱。 diff值越小, 越不具备推荐价值。 分母的 计算作为一个增益系数, 防止当 Ml、 M2变得很大时, R1和 R2的结果都偏 小, 得到的差异度不明显。
在一个实施例中, 步骤 S106还可包括: 统计目标用户群组的下载记录中 下载资源的下载频次, 筛选出目标用户群组的下载记录中的下载频次超过第 一阈值的下载资源。
具体的, 可在生成差异度之前, 获取到目标用户群组的下载记录后, 可 遍历每个用户的下载记录, 将每个用户的下载资源的下载频次进行叠加, 统 计出目标用户群组的下载资源的下载频次。 然后再按照该下载频次对下载资 源排序, 从该下载记录中提取下载频次大于第一阈值的下载资源, 作为目标 用户群体的热点资源。
进一步的, 对于全局用户群体, 也可按照相同的原理提取全局用户群体 的热点资源。 在生成差异度时, 则可仅对目标用户群体的热点资源和全局用 户群体的热点资源进行处理。
通过筛选出热点资源, 可以减少生成差异度时需要处理的数据个数, 降 低了差异度计算的规模, 从而减少了不必要的性能损耗。
步骤 S108, 根据差异度对下载资源进行排序, 将排序靠前的预设数量的 下载资源推荐给目标用户。
遍历下载资源之后, 可将差异度按照从大到小的顺序排序, 然后取排序 后的下载资源序列的 top N, 即排序靠前的前 N个下载资源, 然后将下载资 源推荐给用户, N为预设的自然数。
优选的, 可在用户的显示界面上以列表的形式按照差异度的大小顺序展 示下载资源的名称、 大小、 以及下载频次, 方便用户选择下载。
在一个实施例中, 根据差异度对下载资源排序之前, 还可以筛选出差异 度大于第二阈值的目标用户群组中的下载资源。 在排序之前过滤掉差异度较 小的下载资源可以减少需要排序的下载资源的个数, 从而提高排序效率。
在另一个实施例中, 还可以将提取的 top N的下载资源緩存, 并将推荐 的下载资源分页展示给用户, 然后根据用户发出的翻页请求从緩存中获取与 翻页请求对应的 top N的下载资源。 当用户界面展示有限时, 可以减少不必 要的差异度计算, 从而提高推荐的效率。 如图 2所示, 在一个实施例中, 一种下载资源推荐系统, 包括目标用户 群组获取模块 102、 下载记录获取模块 104、 差异度生成模块 106以及推荐模 块 108, 其中:
目标用户群组获取模块 102, 用于获取目标用户的下载记录, 根据下载 记录获取与目标用户关联的目标用户群组。 目标用户即为待推荐的用户。 在一个实施例中, 目标用户群组获取模块
102 可用于获取目标用户近期的下载记录, 如最近一周或最近一月的下载记 录。 下载记录中可包括该用户下载了哪些下载资源, 以及下载资源的下载频 次等。
在一个实施例中, 目标用户群组获取模块 102可用于获取近期用户的下 载记录, 遍历用户的下载记录, 对每个用户的下载记录, 执行: 将用户的下 载记录与目标用户的下载记录进行对比, 获取下载记录与目标用户的下载记 录匹配的用户, 将述获取的用户添加到目标用户群组中。
优选的, 目标用户群组获取模块 102可用于获取近期活跃用户的下载记 录, 活跃用户是指用户活跃度超过事先设定的参考值的用户, 用户活跃度可 以为下载次数、 在线时间、 每日启动下载次数或这三者的加权平均值。 具体 的, 可每隔一段时间统计出活跃用户, 并将活跃用户存储在用户库中。
该下载记录中记录了每个活跃用户在近期下载的下载资源的名称和 /或 下载资源的哈希值以及下载资源的下载频次。 以活跃用户为单位遍历该下载 记录, 若目标用户的下载记录中的下载资源和该活跃用户的下载记录中的下 载资源匹配, 则将该用户添加到目标用户群组中。
进一步的, 可设置目标用户群组中的用户数的最大值, 当目标用户群组 的用户数达到该最大值时, 则停止遍历。
进一步的, 目标用户群组获取模块 102可用于获取用户的下载记录中的 资源哈希值和 /或资源文件名,将用户的下载记录中的资源哈希值和 /或资源文 件名与目标用户的下载记录中的资源哈希值和 /或资源文件名进行对比, 获取 资源哈希值和 /或资源文件名与目标用户相匹配的用户。
目标用户群组获取模块 102在对比下载资源的哈希值时, 可先获取目标 用户的下载记录中记录的下载资源的哈希值, 然后和遍历的用户的下载记录 中记录的下载资源的哈希值进行对比, 若相同, 则判定两者匹配, 否则, 则 判定两者不匹配。
目标用户群组获取模块 102在对比下载资源的名称时, 可先获取目标用 户的下载记录中记录的下载资源的名称以及遍历的用户的下载记录中的下载 资源的名称, 然后釆用最大公共子串的方法判定两者的名称是否相匹配。 例 如,设最大公共子串为 0.5 , 若目标用户的下载记录中记录的下载资源的名称 为 "哈利波特与魔法石", 遍历的用户的下载记录中记录的下载资源的名称为 "哈利波特与火焰杯", 则最大公共子串为 "哈利波特与", 则相似度为 5/8 , 大于 0.5 , 判定两者相匹配。
此外, 还可设置一阈值, 在遍历用户的下载记录的过程中, 若所遍历到 的用户的下载记录中与目标用户的资源哈希值和 /或资源文件名相匹配的下 载资源超过该阈值, 则将该遍历的用户添加到目标用户群组。
下载记录获取模块 104, 用于获取目标用户群组的下载记录和全局用户 群组的下载记录。
全局用户群组可以包括所有用户, 也可设置全局用户群组的用户数, 根 据该用户数选取的一个较大的用户样本空间作为全局用户群组。 例如, 可随 机选取 10000个用户加入全局用户群组。
差异度生成模块 106, 用于对目标用户群组的下载记录和全局用户群组 的下载记录进行处理, 生成目标用户群组的下载记录中的下载资源与全局用 户群组之间的差异度;。
在一个实施例中, 差异度生成模块 106可用于获取目标用户群组的下载 记录中的下载资源的第一下载频次, 以及目标用户群组中的下载记录中的下 载资源在全局用户群组中的下载记录中的第二下载频次; 获取目标用户群组 的第一用户数以及全体用户群组的第二用户数; 根据第一下载频次、 第二下 载频次、 第一用户数和第二用户数计算得到筛选出的下载资源与全局用户群 组的差异度。
在一个实施例中,差异度生成模块 106可用于根据如下公式计算差异度:
(RI - R2) 其中, diff表示目标用户群组的下载记录中的下载资源与全局用户群组之 间的差异度; Ml为目标用户群组的第一用户数。 M2为全体用户群组的第二 用户数; R1=M1/N1 , 其中, R1为目标用户群组对下载资源 R的平均下载频 次, N1为目标用户群组对下载资源 R的第一下载频次; R2=M2/N2, 其中, R2为全体用户群组对下载资源 R的平均下载频次, N2为全体用户群组对下 载资源 R的第二下载频次。
当 Rl > R2时, diff为正数, 表示下载资源 R在目标用户群体更受到偏 爱。 diff值越大, 越具备推荐价值。 当 R1 < R2时, diff为负数, 表示下载资 源 R在目标用户群体不受到偏爱。 diff值越小, 越不具备推荐价值。 分母的 计算作为一个增益系数, 防止当 Ml , M2变得很大时, R1和 R2的结果都偏 小, 得到的差异度不明显。
在一个实施例中, 如图 3所示, 下载资源推荐系统还包括资源筛选模块 110, 用于统计目标用户群组的下载记录中下载资源的下载频次, 筛选出目标 用户群组的下载记录中的下载频次超过第一阈值的下载资源。
具体的, 资源筛选模块 110可用于在在生成差异度之前, 获取到目标用 户群组的下载记录后, 遍历每个用户的下载记录, 将每个用户的下载资源的 下载频次进行叠加, 统计出目标用户群组的下载资源的下载频次。 然后再按 照该下载频次对下载资源排序, 从该下载记录中提取下载频次大于第一阈值 的下载资源, 作为目标用户群体的热点资源。
进一步的, 对于全局用户群体, 资源筛选模块 110也可用于按照相同的 原理提取全局用户群体的热点资源。 在生成差异度时, 则可仅对目标用户群 体的热点资源和全局用户群体的热点资源进行处理。
通过筛选出热点资源, 可以减少生成差异度时需要处理的数据个数, 降 低了差异度计算的规模, 从而减少了不必要的性能损耗。
推荐模块 108 , 用于根据差异度对下载资源进行排序, 将排序靠前的预 设数量的下载资源推荐给目标用户。
遍历下载资源之后, 推荐模块 108可用于将差异度按照从大到小的顺序 排序, 然后取排序后的下载资源序列的 top N, 即排序靠前的前 N个下载资 源, 然后将下载资源推荐给用户, N为预设的自然数。
优选的, 推荐模块 108可用于在用户的显示界面上以列表的形式按照差 异度的大小顺序展示下载资源的名称、 大小、 以及下载频次, 方便用户选择 下载。
在一个实施例中, 如图 3所示, 资源筛选模块 110还可用于筛选出差异 度大于第二阈值的目标用户群组中的下载资源。
在排序之前过滤掉差异度较小的下载资源可以减少需要排序的下载资源 的个数, 从而提高排序效率。
在另一个实施例中, 推荐模块 108还可用于将提取的 top N的下载资源 緩存, 并将推荐的下载资源分页展示给用户, 然后根据用户发出的翻页请求 从緩存中获取与翻页请求对应的 top N的下载资源。 当用户界面展示有限时, 可以减少不必要的差异度计算, 从而提高推荐的效率。
上述下载资源推荐方法、 系统及存储介质, 先通过目标用户的下载记录 获取该用户所属的目标用户群组, 然后再根据目标用户群组在下载频次上与 全局用户群组的差异度选择合适的下载资源推荐给目标用户。 由于目标用户 和目标用户群组中的其他用户在对下载资源的兴趣上相关性较强,可以推出, 当目标用户群组对下载资源的兴趣度和全局用户群组相比差异度较大时, 目 标用户对这些下载资源的兴趣度相较于全局用户群组中的其他用户下载过的 下载资源更高, 从而提高了向目标用户推荐下载资源的准确度。 此外, 本发明还提供了一个或多个包含计算机可执行指令的计算机存储 介质, 所述计算机可执行指令用于执行一种下载资源推荐方法。 本领域普通 技术人员可以理解实现上述实施例方法中的全部或部分流程, 是可以通过计 算机程序来指令相关的硬件来完成, 所述的程序可存储于一计算机可读取存 储介质中, 该程序在执行时, 可包括如上述各方法的实施例的流程。 其中, 所述的存储介质可为磁碟、光盘、只读存储记忆体( Read-Only Memory, ROM ) 或随机存储记忆体 ( Random Access Memory, RAM )等。 细, 但并不能因此而理解为对本发明专利范围的限制。 应当指出的是, 对于 本领域的普通技术人员来说, 在不脱离本发明构思的前提下, 还可以做出若 干变形和改进, 这些都属于本发明的保护范围。 因此, 本发明专利的保护范 围应以所附权利要求为准。

Claims

权 利 要 求 书
1、 一种下载资源推荐方法, 包括以下步骤:
获取目标用户的下载记录, 根据所述下载记录获取与目标用户关联的目 标用户群组;
获取所述目标用户群组的下载记录和全局用户群组的下载记录; 对所述目标用户群组的下载记录和所述全局用户群组的下载记录进行处 理, 生成目标用户群组的下载记录中的下载资源与全局用户群组之间的差异 度;
根据所述差异度对所述下载资源进行排序, 将排序靠前的预设数量的下 载资源推荐给所述目标用户。
2、 根据权利要求 1所述的下载资源推荐方法, 其特征在于, 所述根据所 获取近期用户的下载记录;
遍历所述用户的下载记录, 对每个所述用户的下载记录, 执行: 将所述用户的下载记录与所述目标用户的下载记录进行对比, 获取下载 记录与所述目标用户的下载记录匹配的用户, 将所述获取的用户添加到目标 用户群组中。
3、 根据权利要求 2所述的下载资源推荐方法, 其特征在于, 所述获取近 期用户的下载记录的步骤为:
获取近期活跃用户的下载记录。
4、 根据权利要求 2所述的下载资源推荐方法, 其特征在于, 所述将所述 用户的下载记录与所述目标用户的下载记录进行对比, 获取下载记录与所述 目标用户的下载记录匹配的用户的步骤为:
获取所述用户的下载记录中的资源哈希值和 /或资源文件名;
将所述用户的下载记录中的资源哈希值和 /或资源文件名与所述目标用 户的下载记录中的资源哈希值和 /或资源文件名进行对比, 获取资源哈希值和 /或资源文件名与所述目标用户相匹配的用户。
5、 根据权利要求 4所述的下载资源推荐方法, 其特征在于, 所述将所述 用户的下载记录中的资源哈希值和 /或资源文件名与所述目标用户的下载记 采用最大公共子串的方法判定所述用户的下载记录中的资源文件名与所 述目标用户的下载记录中的资源文件名是否相匹配。
6、 根据权利要求 1所述的下载资源推荐方法, 其特征在于, 所述对目标 用户群组的下载记录和所述全局用户群组的下载记录进行处理, 生成目标用 户群组中的下载资源与全局用户群组之间的差异度的步骤包括:
统计所述目标用户群组的下载记录中下载资源的下载频次;
筛选出所述目标用户群组的下载记录中的下载频次超过第一阈值的下载 资源。
7、 根据权利要求 6所述的下载资源推荐方法, 其特征在于, 所述对所述 目标用户群组的下载记录和所述全局用户群组的下载记录进行处理, 获得目 标用户群组的下载记录中的下载资源与全局用户群组之间的差异度的步骤包 括:
获取所述目标用户群组的下载记录中的下载资源的第一下载频次, 以及 所述目标用户群组中的下载记录中的下载资源在所述全局用户群组中的下载 记录中的第二下载频次;
获取目标用户群组的第一用户数以及全体用户群组的第二用户数; 根据所述第一下载频次、 第二下载频次、 第一用户数和第二用户数计算 得到所述筛选出的下载资源与所述全局用户群组的差异度。
8、 根据权利要求 7所述的下载资源推荐方法, 其特征在于, 所述根据所 述第一下载频次、 第二下载频次、 第一用户数和第二用户数计算得到所述筛 选出的下载资源与所述全局用户群组的差异度的步骤为:
根据如下公式计算差异度: /i?l x (l - i?l) R2 x (l - R2)
Ml + M2
其中, diff表示目标用户群组的下载记录中的下载资源与全局用户群组之 间的差异度; Ml 为遍历到下载资源 R时, 获取到的目标用户群组的第一用 户数; M2为全体用户群组的第二用户数; R1=M1/N1 , 其中, R1为目标用户 群组对下载资源 R的平均下载频次, N1为目标用户群组对下载资源 R的第 一下载频次; R2=M2/N2 , 其中, R2为全体用户群组对下载资源 R的平均下 载频次, N2为全体用户群组对下载资源 R的第二下载频次。
9、 根据权利要求 7所述的下载资源推荐方法, 其特征在于, 在所述根据 所述差异度对所述下载资源进行排序的步骤之前还包括:
筛选出差异度大于第二阈值的所述目标用户群组中的下载资源。
10、 一种下载资源推荐系统, 其特征在于, 包括以下模块:
目标用户群组获取模块, 用于获取目标用户的下载记录, 根据所述下载 记录获取与目标用户关联的目标用户群组;
下载记录获取模块, 用于获取所述目标用户群组的下载记录和全局用户 群组的下载记录;
差异度生成模块, 用于对所述目标用户群组的下载记录和所述全局用户 群组的下载记录进行处理, 生成目标用户群组的下载记录中的下载资源与全 局用户群组之间的差异度;
推荐模块, 用于根据所述差异度对所述下载资源进行排序, 将排序靠前 的预设数量的下载资源推荐给所述目标用户。
11、 根据权利要求 7所述的下载资源推荐系统, 其特征在于, 所述目标 用户群组获取模块还用于获取近期用户的下载记录, 遍历所述用户的下载记 录, 对每个所述用户的下载记录, 执行:
将所述用户的下载记录与所述目标用户的下载记录进行对比, 获取下载 记录与所述目标用户的下载记录匹配的用户, 将所述获取的用户添加到目标 用户群组中。
12、 根据权利要求 11所述的下载资源推荐系统, 其特征在于, 所述目标 用户群组获取模块还用于获取近期活跃用户的下载记录。
13、 根据权利要求 11所述的下载资源推荐系统, 其特征在于, 所述目标 用户群组获取模块还用于获取所述用户的下载记录中的资源哈希值和 /或资 源文件名, 将所述用户的下载记录中的资源哈希值和 /或资源文件名与所述目 标用户的下载记录中的资源哈希值和 /或资源文件名进行对比, 获取资源哈希 值和 /或资源文件名与所述目标用户相匹配的用户。
14、 根据权利要求 13所述的下载资源推荐系统, 其特征在于, 所述目标 用户群组获取模块还用于采用最大公共子串的方法判定所述用户的下载记录 中的资源文件名与所述目标用户的下载记录中的资源文件名是否相匹配。
15、 根据权利要求 10所述的下载资源推荐系统, 其特征在于, 还包括资 源筛选模块,用于统计所述目标用户群组的下载记录中下载资源的下载频次, 筛选出所述目标用户群组的下载记录中的下载频次超过第一阈值的下载资 源。
16、 根据权利要求 15所述的下载资源推荐系统, 其特征在于, 所述差异 度生成模块还用于获取所述目标用户群组的下载记录中的下载资源的第一下 载频次, 以及所述目标用户群组中的下载记录中的下载资源在所述全局用户 群组中的下载记录中的第二下载频次, 获取目标用户群组的第一用户数以及 全体用户群组的第二用户数, 根据所述第一下载频次、 第二下载频次、 第一 用户数和第二用户数计算得到所述筛选出的下载资源与所述全局用户群组的 差异度。
17、 根据权利要求 16所述的下载资源推荐系统, 其特征在于, 所述差异 度生成模块还用于根据如下公式计算差异度:
(RI - R2) 其中, diff表示目标用户群组的下载记录中的下载资源与全局用户群组之 间的差异度; Ml 为遍历到下载资源 R时, 获取到的目标用户群组的第一用 户数; M2为全体用户群组的第二用户数; R1=M1/N1 , 其中, R1为目标用户 群组对下载资源 R的平均下载频次, N1为目标用户群组对下载资源 R的第 一下载频次; R2=M2/N2 , 其中, R2为全体用户群组对下载资源 R的平均下 载频次, N2为全体用户群组对下载资源 R的第二下载频次。
18、 根据权利要求 16所述的下载资源推荐系统, 其特征在于, 所述资源 筛选模块还用于筛选出差异度大于第二阈值的所述目标用户群组中的下载资 源。
19、 一个或多个包含计算机可执行指令的存储介质, 所述计算机可执行 指令用于执行一种下载资源推荐方法, 其特征在于, 所述方法包括以下步骤: 获取目标用户的下载记录, 根据所述下载记录获取与目标用户关联的目 标用户群组;
获取所述目标用户群组的下载记录和全局用户群组的下载记录; 对所述目标用户群组的下载记录和所述全局用户群组的下载记录进行处 理, 生成目标用户群组的下载记录中的下载资源与全局用户群组之间的差异 度;
根据所述差异度对所述下载资源进行排序, 将排序靠前的预设数量的下 载资源推荐给所述目标用户。
20、 根据权利要求 19所述的存储介质, 其特征在于, 所述根据所述下载 获取近期用户的下载记录;
遍历所述用户的下载记录, 对每个所述用户的下载记录, 执行: 将所述用户的下载记录与所述目标用户的下载记录进行对比, 获取下载 记录与所述目标用户的下载记录匹配的用户, 将所述获取的用户添加到目标 用户群组中。
21、 根据权利要求 20所述的存储介质, 其特征在于, 所述获取近期用户 的下载记录的步骤为:
获取近期活跃用户的下载记录。
22、 根据权利要求 20所述的存储介质, 其特征在于, 所述将所述用户的 下载记录与所述目标用户的下载记录进行对比, 获取下载记录与所述目标用 户的下载记录匹配的用户的步骤为:
获取所述用户的下载记录中的资源哈希值和 /或资源文件名;
将所述用户的下载记录中的资源哈希值和 /或资源文件名与所述目标用 户的下载记录中的资源哈希值和 /或资源文件名进行对比, 获取资源哈希值和
/或资源文件名与所述目标用户相匹配的用户。
23、 根据权利要求 22所述的存储介质, 其特征在于, 所述将所述用户的 下载记录中的资源哈希值和 /或资源文件名与所述目标用户的下载记录中的 采用最大公共子串的方法判定所述用户的下载记录中的资源文件名与所 述目标用户的下载记录中的资源文件名是否相匹配。
24、 根据权利要求 19所述的存储介质, 其特征在于, 所述对目标用户群 组的下载记录和所述全局用户群组的下载记录进行处理, 生成目标用户群组 中的下载资源与全局用户群组之间的差异度的步骤包括:
统计所述目标用户群组的下载记录中下载资源的下载频次;
筛选出所述目标用户群组的下载记录中的下载频次超过第一阈值的下载 资源。
25、 根据权利要求 24所述的存储介质, 其特征在于, 所述对所述目标用 户群组的下载记录和所述全局用户群组的下载记录进行处理, 获得目标用户 群组的下载记录中的下载资源与全局用户群组之间的差异度的步骤包括: 获取所述目标用户群组的下载记录中的下载资源的第一下载频次, 以及 所述目标用户群组中的下载记录中的下载资源在所述全局用户群组中的下载 记录中的第二下载频次;
获取目标用户群组的第一用户数以及全体用户群组的第二用户数; 根据所述第一下载频次、 第二下载频次、 第一用户数和第二用户数计算 得到所述筛选出的下载资源与所述全局用户群组的差异度。
26、 根据权利要求 25所述的存储介质, 其特征在于, 所述根据所述第一 下载频次、 第二下载频次、 第一用户数和第二用户数计算得到所述筛选出的 下载资源与所述全局用户群组的差异度的步骤为:
根据如下公式计算差异度:
Figure imgf000022_0001
其中, diff表示目标用户群组的下载记录中的下载资源与全局用户群组之 间的差异度; Ml 为遍历到下载资源 R时, 获取到的目标用户群组的第一用 户数; M2为全体用户群组的第二用户数; R1=M1/N1 , 其中, R1为目标用户 群组对下载资源 R的平均下载频次, N1为目标用户群组对下载资源 R的第 一下载频次; R2=M2/N2 , 其中, R2为全体用户群组对下载资源 R的平均下 载频次, N2为全体用户群组对下载资源 R的第二下载频次。
27、 根据权利要求 25所述的存储介质, 其特征在于, 在所述根据所述差 异度对所述下载资源进行排序的步骤之前还包括:
筛选出差异度大于第二阈值的所述目标用户群组中的下载资源。
PCT/CN2012/086906 2012-01-20 2012-12-19 下载资源推荐方法、系统及存储介质 WO2013107238A1 (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CA2861898A CA2861898C (en) 2012-01-20 2012-12-19 Download resource recommendation method, system and storage medium
US14/373,003 US9264502B2 (en) 2012-01-20 2012-12-19 Download resource recommendation method, system and storage medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201210018761.0A CN103218366B (zh) 2012-01-20 2012-01-20 下载资源推荐方法及系统
CN201210018761.0 2012-01-20

Publications (1)

Publication Number Publication Date
WO2013107238A1 true WO2013107238A1 (zh) 2013-07-25

Family

ID=48798581

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2012/086906 WO2013107238A1 (zh) 2012-01-20 2012-12-19 下载资源推荐方法、系统及存储介质

Country Status (4)

Country Link
US (1) US9264502B2 (zh)
CN (1) CN103218366B (zh)
CA (1) CA2861898C (zh)
WO (1) WO2013107238A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103530365B (zh) * 2013-10-12 2017-07-04 北京搜狗信息服务有限公司 获取资源的下载链接的方法及系统
CN104636378A (zh) * 2013-11-12 2015-05-20 中兴通讯股份有限公司 应用程序的推送方法及装置
CN103929484B (zh) * 2014-04-18 2018-01-09 北京搜狗科技发展有限公司 为用户整合个性化资源的方法及装置
CN103944986B (zh) * 2014-04-18 2018-01-02 北京搜狗科技发展有限公司 为用户整合个性化资源的方法及装置
CN106469146A (zh) * 2015-08-12 2017-03-01 腾讯科技(深圳)有限公司 一种利用社交群组进行推荐的验证系统及系统
CN105912550A (zh) * 2015-12-15 2016-08-31 乐视网信息技术(北京)股份有限公司 一种移动终端的信息推荐方法及装置
CN106656768B (zh) * 2017-02-09 2020-06-23 腾讯科技(深圳)有限公司 一种资源推荐方法及装置
WO2020065777A1 (ja) * 2018-09-26 2020-04-02 日本電気株式会社 情報処理装置、制御方法、及びプログラム
WO2020252742A1 (zh) * 2019-06-20 2020-12-24 深圳市云中飞网络科技有限公司 资源推送方法及相关产品
CN111209033B (zh) * 2020-01-10 2024-01-12 百度在线网络技术(北京)有限公司 小程序包的下载方法及相关设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101105795A (zh) * 2006-10-27 2008-01-16 北京搜神网络技术有限责任公司 基于网络行为的个性化推荐方法和系统
US20100005105A1 (en) * 2008-07-02 2010-01-07 Palo Alto Research Center Incorporated Method for facilitating social networking based on fashion-related information
EP2375351A1 (en) * 2010-04-09 2011-10-12 Palo Alto Research Center Incorporated System and method for recommending interesting content in an information stream

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040093595A1 (en) * 2002-08-08 2004-05-13 Eric Bilange Software application framework for network-connected devices
US20050071485A1 (en) * 2003-09-26 2005-03-31 Arun Ramagopal System and method for identifying a network resource
US7890047B2 (en) * 2007-04-11 2011-02-15 The Directv Group, Inc. Method and system for file sharing between a group of user devices using obtained permissions
US8244884B2 (en) * 2007-04-11 2012-08-14 The Directv Group, Inc. Method and apparatus for file sharing between a group of user devices with crucial portions sent via satellite and non-crucial portions sent using a peer-to-peer network
US7895341B2 (en) * 2007-04-11 2011-02-22 The Directv Group, Inc. Method and apparatus for file sharing between a group of user devices with separately sent crucial portions and non-crucial portions
US8345869B2 (en) * 2007-04-11 2013-01-01 The Directv Group, Inc. Method and apparatus for file sharing of missing content between a group of user devices in a peer-to-peer network
US8417939B2 (en) * 2007-04-11 2013-04-09 The DIRECTV Goup, Inc. Method and apparatus for file sharing between a group of user devices with encryption-decryption information sent via satellite and the content sent separately
CN102043781B (zh) * 2009-10-23 2013-03-27 华为技术有限公司 一种网页资源推荐方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101105795A (zh) * 2006-10-27 2008-01-16 北京搜神网络技术有限责任公司 基于网络行为的个性化推荐方法和系统
US20100005105A1 (en) * 2008-07-02 2010-01-07 Palo Alto Research Center Incorporated Method for facilitating social networking based on fashion-related information
EP2375351A1 (en) * 2010-04-09 2011-10-12 Palo Alto Research Center Incorporated System and method for recommending interesting content in an information stream

Also Published As

Publication number Publication date
CN103218366A (zh) 2013-07-24
CA2861898A1 (en) 2013-07-25
US9264502B2 (en) 2016-02-16
CN103218366B (zh) 2017-09-01
US20140379808A1 (en) 2014-12-25
CA2861898C (en) 2017-01-10

Similar Documents

Publication Publication Date Title
WO2013107238A1 (zh) 下载资源推荐方法、系统及存储介质
CN107480158B (zh) 基于相似性得分评估内容项目与图像的匹配的方法和系统
US20230185857A1 (en) Method and system for providing context based query suggestions
JP5306114B2 (ja) クエリ抽出装置、クエリ抽出方法およびクエリ抽出プログラム
CN107766399B (zh) 用于使图像与内容项目匹配的方法和系统及机器可读介质
US20120030186A1 (en) Method and apparatus for reconstructing a search query
US20170351709A1 (en) Method and system for dynamically rankings images to be matched with content in response to a search query
WO2015109966A1 (en) Method and system for collecting content
CN105389590B (zh) 一种视频聚类推荐方法和装置
CN104699696B (zh) 文件推荐方法和装置
CN106326297B (zh) 一种应用程序推荐方法及装置
CN107145497B (zh) 基于图像和内容的元数据选择与内容匹配的图像的方法
WO2015126940A1 (en) Global comments for a media item
WO2014015808A1 (zh) 推送信息的方法和装置
US10275472B2 (en) Method for categorizing images to be associated with content items based on keywords of search queries
CN114070852B (zh) 直播延迟优化方法及装置
US10289739B1 (en) System to recommend content based on trending social media topics
EP2811399A1 (en) Method and terminal for starting music application
WO2013107031A1 (zh) 基于评论信息确定视频质量参数的方法、装置和系统
US10394838B2 (en) App store searching
US20140280099A1 (en) Method, apparatus and computer storage medium for acquiring hot content
Deveaud et al. On the importance of venue-dependent features for learning to rank contextual suggestions
TW201941077A (zh) 一種下拉提示方法和裝置
US20190042576A1 (en) System and method for mining playlist data for use in providing digital media or other content
WO2018218403A1 (zh) 一种内容推送方法及装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12866148

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 14373003

Country of ref document: US

ENP Entry into the national phase

Ref document number: 2861898

Country of ref document: CA

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205N DATED 26/09/2014)

122 Ep: pct application non-entry in european phase

Ref document number: 12866148

Country of ref document: EP

Kind code of ref document: A1