CN103136289A - 资源推荐方法及系统 - Google Patents
资源推荐方法及系统 Download PDFInfo
- Publication number
- CN103136289A CN103136289A CN2011103987897A CN201110398789A CN103136289A CN 103136289 A CN103136289 A CN 103136289A CN 2011103987897 A CN2011103987897 A CN 2011103987897A CN 201110398789 A CN201110398789 A CN 201110398789A CN 103136289 A CN103136289 A CN 103136289A
- Authority
- CN
- China
- Prior art keywords
- resource
- user
- action events
- unit
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种资源推荐方法,包括如下步骤:获取资源中操作事件的发生次数以及产生所述操作事件的用户,将所述用户与所述资源相关联;按照产生所述操作事件的用户对获取的发生次数进行加权求和得到与所述用户相关的资源的加权值;根据所述产生操作事件的用户以及加权值提取资源,形成资源集合;推荐形成的资源集合。上述资源推荐方法及系统中,对资源中操作事件进行发生次数的统计并对其进行加权求和得到与用户相关的资源的加权值,进而根据产生操作事件的用户以及加权值进行推荐资源的提取,由于对操作事件的统计以及加权求和所得到的与用户相关的资源的加权值均准确地反映了用户对某一资源的喜爱程序,因此大大提高了推荐的准确性。
Description
【技术领域】
本发明涉及互联网技术,特别是涉及一种资源推荐方法及系统。
【背景技术】
为方便用户对互联网中的资源进行查找获取,常常会向用户进行资源的推荐,以避免用户花费大量的时间和精力从大量无关的资源中找出感兴趣的资源。在传统的资源推荐过程中,每一资源均有与其相对应的评分,只需要将评分较高的资源推荐给用户即可。
每一资源的评分反映了用户对该资源的喜爱程序,但是,在实际的资源推荐过程中,并不是所有的资源都有对应的评分,没有评分的资源也混杂于大量资源中,并且用户在对资源进行评分时通常较为随意,不能真正反应用户对资源的喜爱程序,这都将导致不能针对用户进行准确的资源推荐。
【发明内容】
基于此,有必要提供一种能提高准确性的资源推荐方法。
此外,还有必要提供一种能提高准确性的资源推荐系统。
一种资源推荐方法,包括如下步骤:
获取资源中操作事件的发生次数以及产生所述操作事件的用户,将所述用户与所述资源相关联;
按照产生所述操作事件的用户对获取的发生次数进行加权求和得到与所述用户相关的资源的加权值;
根据所述产生操作事件的用户以及加权值提取资源,形成资源集合;
推荐形成的资源集合。
优选地,所述获取资源中操作事件的发生次数以及产生所述操作事件的用户的步骤为:
采集资源的操作事件以及产生所述操作事件的用户;
按照所述操作事件的用户对所述采集的操作事件进行计数得到所述操作事件对应的发生次数,并判断所述发生次数是否达到所述操作事件的阈值,若是,则
将所述发生次数设置为所述操作事件的阈值。
优选地,所述按照产生所述操作事件的用户对获取的发生次数进行加权求和得到与所述用户相关的资源的加权值的步骤为:
获取操作事件产生的时间点与当前时间之间的时间间隔以及所述操作事件对应的衰减系数;
根据所述时间间隔和衰减系数,按照产生所述操作事件的用户对所述操作事件的发生次数进行加权求和得到与所述用户相关的资源的加权值。
优选地,所述根据所述产生操作事件的用户以及加权值提取资源,形成资源集合的步骤之前还包括:
获取所述用户的属性信息;
所述根据所述产生操作事件的用户以及加权值提取资源,形成资源集合的步骤为:
根据所述用户的属性信息获取属性信息相同的用户;
按照所述属性信息相同的用户提取资源的加权值;
对所述提取的加权值进行汇总得到与所述资源相关的汇总值;
按照与所述资源相关的汇总值提取资源,将所述提取的资源形成与所述相同的属性信息对应的第一资源集合。
优选地,所述根据所述产生操作事件的用户以及加权值提取资源,形成资源集合的步骤为:
将所述加权值进行归一处理得到所述用户对资源的评分;
筛选出所关联的用户相同的资源形成存在相似关系的资源组合,并根据用户对资源的评分计算资源组合中资源之间的相似度;
从筛选的资源组合中提取包含相同资源的资源组合,获取所述提取的资源组合中与相同资源存在相似关系的资源;
逐一对每一用户获取所述与相同资源存在相似关系的资源的评分以及相似度,并根据获取的评分及相似度估算所述用户对相同资源的预测分值;
对每一用户中按照所述预测分值提取相同资源,得到所述用户对应的第二资源集合。
优选地,所述推荐形成的资源集合的步骤包括:
探测登录的用户;
在产生所述操作事件的用户中查找所述登录的用户,判断是否存在所述登录的用户,若是,则获取与所述登录的用户对应的第二资源集合;若否,则
获取所述登录的用户的属性信息;
获取与所述登录的用户的属性信息对应的第一资源集合;
将所述第一资源集合或第二资源集合推送给登录的用户。
优选地,所述根据获取的评分及相似度估算所述用户对相同资源的预测分值的步骤之后还包括:
获取与所述用户对相同资源的评分,并根据所述用户对相同资源的评分评估所述预测分值的准确度;
判断所述预测分值的准确度是否大于阈值,若是,则对所述资源集合进行调整。
一种资源推荐系统,包括:
操作获取模块,用于获取资源中操作事件的发生次数以及产生所述操作事件的用户,将所述用户与所述资源相关联;
加权求和模块,用于按照产生所述操作事件的用户对获取的发生次数进行加权求和得到与所述用户相关的资源的加权值;
提取模块,用于根据所述产生操作事件的用户以及加权值提取资源,形成资源集合;
推荐模块,用于推荐形成的资源集合。
优选地,所述操作获取模块包括:
事件采集单元,用于采集资源的操作事件以及产生所述操作事件的用户;
计数单元,用于对所述采集的操作事件进行计数得到所述操作事件对应的发生次数,并判断所述发生次数是否达到所述操作事件的阈值,若是,则通知设置单元;
所述设置单元用于将所述发生次数设置为所述操作事件的阈值。
优选地,加权求和模块包括:
时间获取单元,用于获取操作事件产生的时间点与当前时间之间的时间间隔以及所述操作事件对应的衰减系数;
求和单元,用于根据所述时间间隔和衰减系数,按照产生所述操作事件的用户对所述操作事件的发生次数进行加权求和得到与所述用户相关的资源的加权值。
优选地,还包括:
信息获取模块,用于获取所述用户的属性信息;
所述提取模块包括:
用户获取单元,用于根据所述用户的属性信息获取属性信息相同的用户;
加权值提取单元,用于按照所述属性信息相同的用户提取资源的加权值;
汇总单元,用于对所述提取的加权值进行汇总得到与所述资源相关的汇总值;
资源提取单元,用于按照与所述资源相关的汇总值提取资源,将所述提取的资源形成与所述相同的属性信息对应的第一资源集合。
优选地,所述提取模块包括:
归一处理单元,用于将所述加权值进行归一处理得到与所述用户对资源的评分;
筛选单元,用于筛选出所关联的用户相同的资源形成存在相似关系的资源组合,并根据与用户对资源的评分计算资源组合中资源之间的相似度;
资源获取单元,用于从筛选的资源组合中提取包含相同资源的资源组合,获取所述提取的资源组合中与相同资源存在相似关系的资源;
估算单元,用于逐一对每一用户获取所述与相同资源存在相似关系的资源的评分以及相似度,并根据获取的评分及相似度估算所述用户对相同资源的预测分值;
相同资源提取单元,用于对每一用户按照所述预测分值提取相同资源,得到所述用户对应的第二资源集合。
优选地,所述推荐模块包括:
探测单元,用于探测登录的用户;
查找单元,用于在产生所述操作事件的用户中查找所述登录的用户,判断是否存在所述登录的用户,若是,则通知集合获取单元,若否,则通知属性提取单元;
所述集合获取单元用于获取与所述登录的用户对应的第二资源集合;
所述属性提取单元用于获取所述登录的用户的属性信息;
所述集合获取单元还用于获取与所述登录的用户的属性信息对应的第一资源集合;
推送单元,用于将所述第一资源集合或第二资源集合推送给登录的用户。
优选地,所述提取模块还包括:
评估单元,用于获取与所述用户对相同资源的评分,并根据所述用户对相同资源的评分评估所述预测分值的准确度;
判断调整单元,判断所述预测分值的准确度是否大于阈值,若是,则对所述资源集合进行调整。
上述资源推荐方法及系统中,对资源中操作事件进行发生次数的统计并对其进行加权求和得到与用户相关的资源的加权值,进而根据产生操作事件的用户以及加权值进行推荐资源的提取,由于对操作事件的统计以及加权求和所得到的与用户相关的资源的加权值均准确地反映了用户对某一资源的喜爱程序,因此大大提高了推荐的准确性。
【附图说明】
图1为一个实施例中资源推荐方法的流程图;
图2为图1中获取资源中操作事件的发生次数以及产生该操作事件的用户,将用户与资源相关联的方法流程图;
图3为图1中按照产生该操作事件的用户对获取的发生次数进行加权求和得到与用户相关的资源的加权值的方法流程图;
图4为一个实施例中根据产生操作事件的用户以及加权值提取资源,形成资源集合的方法流程图;
图5为另一个实施例中根据产生操作事件的用户以及加权值提取资源,形成资源集合的方法流程图;
图6为图1中推荐形成的资源集合的方法流程图;
图7为另一个实施例中根据产生操作事件的用户以及加权值提取资源,形成资源集合的方法流程图;
图8为一个实施例中资源推荐系统的结构示意图;
图9为一个实施例中操作获取模块的结构示意图;
图10为一个实施例中加权求和模块的结构示意图;
图11为一个实施例中提取模块的结构示意图;
图12为另一个实施例中提取模块的结构示意图;
图13为另一个实施例中提取模块的结构示意图;
图14为图8中推荐模块的结构示意图。
【具体实施方式】
在一个实施例中,如图1所示,一种资源推荐方法包括如下步骤:
步骤S110,获取资源中操作事件的发生次数以及产生该操作事件的用户,将用户与资源相关联。
本实施例中,在互联网中,该资源可以歌曲等各种音频文件,也可以是电影等视频文件,操作事件是用户访问该资源时触发的操作,可以是对歌曲的分享、收听、下载、收藏、快速切换至下一首、停止播放以及评分等。例如,在互联网中为用户进行歌曲播放的歌曲列表,每一用户由于兴趣爱好的不同所对应的歌曲列表中的歌曲也各不相同,因此,探测每一用户在自己的歌曲列表中访问歌曲的操作事件,得到任一歌曲所对应的每一类操作事件的发生次数,并将用户与资源相关联,建立用户与资源之间的对应关系,其中,用户与资源之间的对应关系为一对多的关系或者一对一的关系,这是由实际情况所确定的。
在一个实施例中,如图2所示,上述步骤S110的具体过程为:
步骤S111,采集资源的操作事件以及产生该操作事件的用户。
本实施例中,该操作事件是分别与产生该操作事件的用户和资源相对应的,是一用户对某一资源所触的操作事件。
步骤S113,按照产生操作事件的用户对采集的操作事件进行计数得到该操作事件对应的发生次数,并判断发生次数是否达到操作事件的阈值,若是,则进入步骤S115,若否,则返回步骤S111。
本实施例中,逐一采集到的操作事件进行计数,得到每一类型的操作事件所对应的发生次数,且用于计数的操作事件是与同一用户同一资源相对应的。为了避免某一过于频繁发生的操作事件产生的影响过大,需要判断操作事件对应的发生次数是否会达到设定的操作事件的阈值,若是,则进入步骤S115。不同种类的操作事件会有不同大小的阈值,可根据需要进行灵活调整。
步骤S115,将发生次数设置为操作事件的阈值。
步骤S130,按照产生该操作事件的用户对获取的发生次数进行加权求和得到与用户相关的资源的加权值。
本实施例中,获取资源中每一操作事件所对应的权重,根据产生该操作事件的用户逐一对与该操作事件关联的资源中每一种类的操作事件的发生次数进行加权求和,以得到与用户相关的资源的加权值,该加权值是与资源相关联的,即每一用户所访问的每一资源均对应了一个加权值。
例如,若资源为歌曲,则每一操作事件所对应的权重及衰减系数如下表所示。
表1
在一个实施例中,如图3所示,上述步骤S130的具体过程为:
步骤S131,获取操作事件产生的时间点与当前时间之间的时间间隔以及该操作事件对应的衰减系数。
步骤S133,根据时间间隔和衰减系数,按照产生操作事件的用户对操作事件的发生次数进行加权求和得到与用户相关的资源的加权值。
本实施例中,在对与用户相关的资源中操作事件的发生次数进行加权求和处理时,还应当考虑相对时间因素,因为随着时间的推移,用户对资源的喜爱程度也会发生较大的变化,因此为了保证推荐的准确性,应当根据操作事件产生的时间点与当前时间之间的时间间隔以及对应的衰减系数进行加权求和,具体的加权求和过程如以下公式所示:
∑(权重*发生次数*exp(衰减系数*时间间隔))
步骤S150,根据产生操作事件的用户以及加权值提取资源,形成资源集合。
本实施例中,将产生了操作事件的用户和得到的加权值的从高到低顺序作为提取条件,从大量的资源中提取出一个或少量几个资源,并将这些提取的资源形成资源集合。
步骤S170,推荐形成的资源集合。
本实施例中,向处于在线状态的用户或刚完成登录的用户推荐形成的资源集合,由于资源集合中的资源是根据产生操作事件的用户和得到的加权值进行提取的,资源集合中的资源是受用户喜爱的可能性较高,使得用户不需要在大量的资源中寻找也能够获取到较感兴趣的资源,降低了用户的查找成本。
在一个实施例中,上述步骤S150之前还包括获取用户的属性信息的步骤。
本实施例中,用户的属性信息包括了用户的年龄、性别、地域以及职业等信息。
如图4所示,上述步骤S150的具体过程为:
步骤S410,根据用户的属性信息获取属性信息相同的用户。
本实施例中,由于每一用户均有与其相对应的属性信息,因此,可根据属性信息对用户进行分类,属性信息相同的用户即为同一类别中的用户。
步骤S430,按照属性信息相同的用户提取资源的加权值。
本实施例中,在同一类别的用户中,提取与该用户相关的资源的加权值,使得用户和这一与该用户相关的资源的加权值相关联,即建立用户与资源之间的对应关系以及资源和与该用户相关的资源的加权值之间的对应关系,形成一条用户对应资源,资源对应了加权值的记录,此时,同一类别中的加权值是与属性信息相同的不同用户相关的,并且属于同一资源。
步骤S450,对提取的加权值进行汇总得到与资源相关的汇总值。
本实施例中,对同一类别中的加权值进行汇总得到该类别中对应资源的汇总值。例如,表2所示,User1、User2以及User2均为属性相同的用户,并且对应的加权值是与同一个资源相对应的,因此,可将User1、User2以及User2归为同一个类别,并对加权值进行汇总,得到如表3所示的汇总值,即该类别中的汇总值为101。
用户 | 性别 | 年龄 | 地域 | 职业 | 资源 | 加权值 |
User1 | 男 | 【20-25】 | 广东 | 工程师 | Song1 | 30 |
User2 | 男 | 【20-25】 | 广东 | 工程师 | Song1 | 45 |
User3 | 男 | 【20-25】 | 广东 | 工程师 | Song1 | 26 |
User4 | 男 | 【20-25】 | 广东 | 工程师 | Song2 | 36 |
User5 | 女 | 【25-30】 | 浙江 | 教师 | Song3 | 23 |
...... | ...... | ...... | ...... | ...... | ...... | ...... |
表2
性别 | 年龄 | 地域 | 职业 | 资源 | 汇总值 |
男 | 【20-25】 | 广东 | 工程师 | Song1 | 30+45+26=101 |
男 | 【20-25】 | 广东 | 工程师 | Song2 | 36 |
女 | 【25-30】 | 浙江 | 教师 | Song3 | 23 |
...... | ...... | ...... | ...... | ...... | ...... |
表3
步骤S470,按照与资源相关的汇总值提取资源,将提取的资源形成与相同的属性信息对应的每一资源集合。
本实施例中,获取同一属性信息所对应的汇总值,按照从高到低的顺序从获取到的汇总值中提取预设数量的汇总值,并根据提取的汇总值得到相关联的资源,进而所得到的资源组成了资源集合,该资源集合也是与属性信息相对应的,即资源集合中的资源均与同一属性信息相关联。
在得到与相同的属性信息对应的资源集合后,可直接将资源集合推送给用户,以向其推荐资源,也可以待用户登录后再根据该用户的属性信息进行推荐。
在另一个实施例中,如图5所示,上述步骤S150的具体过程为:
步骤S510,将加权值进行归一处理得到用户对资源的评分。
本实施例中,与用户相关的资源的加权值利用最大-最小标准化的方法进行归一处理,得到1、2、3、4、5中的任意值,归一处理后的加权值即为该用户对资源的评分。
具体地,最大-最小标准化的方法是对加权值进行变换后使得变换后得到的用户对资源的评分落在某个固定的区别内。例如,在用户U对所有资源的加权值中的最大值和最小值分别为maxu和minu,而用户U对资源S的加权值为value,此时,通过最大-最小标准化的方法得到用户U对资源S的评分,即(value-minu)/(maxu-minu)。
步骤S530,筛选出所关联的用户相同的资源形成存在相似关系的资源组合,并根据用户对资源的评分计算资源组合中资源之间的相似度。
本实施例中,由于任一用户均可对任一资源触发操作事件,而每一资源都是面向多个用户的,因此每一个资源也对应了多个用户,例如,若资源是歌曲,则同一个歌曲将有多个不同的用户对其触发了操作事件。在大量的资源中筛选出所关联的用户相同的资源,这些资源即为存在相似关系的相似资源,且由于用户对资源的评分反映了用户对该资源的喜爱程度,因此可根据用户对这一资源喜爱程度的差别来计算相似资源之间的相似度,具体的计算过程可以采用余弦相似性、皮尔森相关系数以及修正余弦相似性等方式。
例如,如表4所示,在一个实施例中资源1所关联的用户为user2、user4、user5以及user6,资源2所关联的用户也为user2、user4、user5以及user6,因此在筛选的过程中,资源1和资源2将被筛选出来,并形成资源组合;获取资源1中每一用户对应的评分以及资源2中每一用户对应的评分,以进行相似度的计算,得到资源1和资源2之间的相似度。
表4
具体地,若采用余弦相似性的方法进行资源1和资源2之间相似度的计算,则如以下公式所示:
若采用皮尔森相关系数的方法进行资源1和资源2之间相似度的计算,则如以下公式所示:
若采用修正余弦相似性的方法进行资源1和资源2之间相似度的计算,则如以下公式所示:
步骤S550,从筛选的资源组合中提取包含相同资源的资源组合,获取提取的资源组合中与相同资源存在相似关系的资源。
本实施例中,在多个资源组合之间存在着相同资源的可能性是非常大的,从筛选得到的多个资源组合中提取包含了相同资源的资源组合,并获取这些包含了相同资源的资源组合中与相同资源存在相似关系的资源。
步骤S570,逐一对每一用户获取与相同资源存在相似关系的资源的评分以及相似度,并根据获取的评分及相似度估算用户对相同资源的预测分值。
本实施例中,预测每一用户对相同资源的打分得到该用户对相同资源的预测分值。具体地,获取与相同资源存在相似关系的资源所对应的评分以及相似度,并计算该评分与相似度之间的乘积,所有乘积的平均值即为该用户对相同资源的预测分值。
例如,在一个具体的实施例中,如表5所示,该资源为歌曲,与歌曲S存在相似关系的歌曲为song1、song2、song3和song4,并且均有对应用户U对每一首歌曲的评分,首先计算与歌曲S存在相似关系的歌曲与用户U对其的评分之间的乘积,进而对所有的乘积进行平均得到用户U对歌曲S的预测分值2.6。
表5
可通过上述方式根据每一用户对资源的评分估算出该用户对资源的预测分值。
步骤S590,对每一用户中按照预测分值提取相同资源,得到用户对应的第二资源集合。
本实施例中,在每一用户中,按照该用户对资源的预测分值的从大到小的顺序提取对应的相同资源,并将多个相同资源组成用户所对应的第二资源集合。在任一第二资源集合中的资源是某一用户的预测分值较高的资源,被该用户喜爱的可能性也较大。
在另一个实施例中,如图6所示,上述推荐形成的资源集合的步骤的具体过程为:
步骤S610,探测登录的用户。
步骤S620,在产生操作事件的用户中查找登录的用户,判断是否存在登录的用户,若是,则进入步骤S630,若否,则进入步骤S640。
本实施例中,当判断到产生操作事件的用户中存在着登录的用户,则说明该可根据该用户在本次登录之前对资源触发的操作事件以及对某些资源的评分进行资源的推荐,即获取对应的第二资源集合;若产生操作事件的用户中不存在登录的用户,则说明该用户是新用户,需要获取这一用户的属性信息,进而按照这一属性信息得到对应的每一资源集合。
步骤S630,获取与登录的用户对应的第二资源集合。
步骤S640,获取登录的用户的属性信息。
步骤S650,获取与登录的用户的属性信息对应的每一资源集合。
步骤S660,将第一资源集合或第二资源集合推送给登录的用户。
本实施例中,将第一资源集合或第二资源集合推送给登录的用户,进而向登录的用户推荐资源集合中的资源。
在另一个实施例中,如图7所示,上述步骤S570之后还包括如下步骤:
步骤S710,获取与用户对相同资源的评分,并根据用户对相同资源的评分评估预测分值的准确度。
本实施例中,通过平均绝对误差MAE来评估预测分值的准确度,以便于对整个资源推荐方法进行调整,平均绝对误差MAE越小,则预测分值就越准确。例如,如表6所示:
用户 | 歌曲 | 用户实际打分 | 用户预测打分 |
user1 | Song1 | 3 | 2.5 |
User2 | Song1 | 4 | 3 |
User3 | Song2 | 2.5 | |
user4 | Song3 | 3 | 2.6 |
user5 | Song4 | 2 | 1.8 |
user6 | Song3 | 4 | 4.3 |
表6
其中,
步骤S730,判断预测分值的准确度是否大于阈值,若是,则进入步骤S650,若否,则结束。
步骤S750,对资源集合进行调整。
本实施例中,当判断到预测分值的准确度大于阈值时,可对预测分值的估算、相似度的计算方法以及各操作事件的权重进行调整。
在一个实施例中,如图8所示,一种资源推荐系统,包括操作获取模块10、加权求和模块30、提取模块50以及推荐模块70。
操作获取模块10,用于获取资源中操作事件的发生次数以及产生操作事件的用户,将用户与资源相关联。
本实施例中,在互联网中,该资源可以歌曲等各种音频文件,也可以是电影等视频文件,操作事件是用户访问该资源时触发的操作,可以是对歌曲的分享、收听、下载、收藏、快速切换至下一首、停止播放以及评分等。例如,在互联网中为用户进行歌曲播放的歌曲列表,每一用户由于兴趣爱好的不同所对应的歌曲列表中的歌曲也各不相同,因此,操作获取模块10探测每一用户在自己的歌曲列表中访问歌曲的操作事件,得到任一歌曲所对应的每一类操作事件的发生次数,并将用户与资源相关联,建立用户与资源之间的对应关系,其中,用户与资源之间的对应关系为一对多的关系或者一对一的关系,这是由实际情况所确定的。
在一个实施例中,如图9所示,上述操作获取模块10包括事件采集单元110、计数单元130以及设置单元150。
事件采集单元110,用于采集资源的操作事件以及产生操作事件的用户。
本实施例中,该操作事件是分别与产生该操作事件的用户和资源相对应的,是一用户对某一资源所触的操作事件。
计数单元130,用于对采集的操作事件进行计数得到操作事件对应的发生次数,并判断发生次数是否达到操作事件的阈值,若是,则通知设置单元150。
本实施例中,计数单元130逐一采集到的操作事件进行计数,得到每一类型的操作事件所对应的发生次数,且用于计数的操作事件是与同一用户同一资源相对应的。为了避免某一过于频繁发生的操作事件产生的影响过大,需要判断操作事件对应的发生次数是否会达到设定的操作事件的阈值,若是,则通知设置单元150。不同种类的操作事件会有不同大小的阈值,可根据需要进行灵活调整。
设置单元150,用于将发生次数设置为操作事件的阈值。
加权求和模块30,用于按照产生操作事件的用户对获取的发生次数进行加权求和得到与用户相关的资源的加权值。
本实施例中,加权求和模块30获取资源中每一操作事件所对应的权重,根据产生该操作事件的用户逐一对与该操作事件关联的资源中每一种类的操作事件的发生次数进行加权求和,以得到与用户相关的资源的加权值,该加权值是与资源相关联的,即每一用户所访问的每一资源均对应了一个加权值。
在一个实施例中,如图10所示,上述加权求和模块30包括时间获取单元310以及求和单元330。
时间获取单元310,用于获取操作事件产生的时间点与当前时间之间的时间间隔以及操作事件对应的衰减系数。
求和单元330,用于根据时间间隔和衰减系数,按照产生操作事件的用户对操作事件的发生次数进行加权求和得到与用户相关的资源的加权值。
本实施例中,求和单元330在对与用户相关的资源中操作事件的发生次数进行加权求和处理时,还应当考虑相对时间因素,因为随着时间的推移,用户对资源的喜爱程度也会发生较大的变化,因此为了保证推荐的准确性,应当根据操作事件产生的时间点与当前时间之间的时间间隔以及对应的衰减系数进行加权求和,具体的加权求和过程如以下公式所示:
∑(权重*发生次数*exp(衰减系数*时间间隔))
提取模块50,用于根据产生操作事件的用户以及加权值提取资源,形成资源集合。
本实施例中,提取模块50将产生了操作事件的用户和得到的加权值的从高到低顺序作为提取条件,从大量的资源中提取出一个或少量几个资源,并将这些提取的资源形成资源集合。
推荐模块70,用于推荐形成的资源集合。
本实施例中,推荐模块70向处于在线状态的用户或刚完成登录的用户推荐形成的资源集合,由于资源集合中的资源是根据产生操作事件的用户和得到的加权值进行提取的,资源集合中的资源是受用户喜爱的可能性较高,使得用户不需要在大量的资源中寻找也能够获取到较感兴趣的资源,降低了用户的查找成本。
在另一个实施例中,上述资源推荐系统还包括了信息获取模块,该信息获取模块用于获取用户的属性信息。
本实施例中,用户的属性信息包括了用户的年龄、性别、地域以及职业等信息。
如图11所示,提取模块50包括用户获取单元501、加权值提取单元502、汇总单元503以及资源提取单元504。
用户获取单元501,用于根据用户的属性信息获取属性信息相同的用户。
本实施例中,由于每一用户均有与其相对应的属性信息,因此,用户获取单元501可根据属性信息对用户进行分类,属性信息相同的用户即为同一类别中的用户。
加权值提取单元502,用于按照属性信息相同的用户提取资源的加权值。
本实施例中,在同一类别的用户中,加权值提取单元502提取与该用户相关的资源的加权值,使得用户和这一与该用户相关的资源的加权值相关联,即建立用户与资源之间的对应关系以及资源和与该用户相关的资源的加权值之间的对应关系,形成一条用户对应资源,资源对应了加权值的记录,此时,同一类别中的加权值是与属性信息相同的不同用户相关的,并且属于同一资源。
汇总单元503,用于对提取的加权值进行汇总得到与资源相关的汇总值。
本实施例中,汇总单元503对同一类别中的加权值进行汇总得到该类别中对应资源的汇总值。
资源提取单元504,用于按照与资源相关的汇总值提取资源,将提取的资源形成与相同的属性信息对应的第一资源集合。
本实施例中,获取同一属性信息所对应的汇总值,资源提取单元504按照从高到低的顺序从获取到的汇总值中提取预设数量的汇总值,并根据提取的汇总值得到相关联的资源,进而所得到的资源组成了资源集合,该资源集合也是与属性信息相对应的,即资源集合中的资源均与同一属性信息相关联。
在资源提取单元504得到与相同的属性信息对应的资源集合后,可直接将资源集合推送给用户,以向其推荐资源,也可以待用户登录后再根据该用户的属性信息进行推荐。
在另一个实施例中,如图12所示,上述提取模块50包括归一处理单元505、筛选单元506、资源获取单元507、估算单元508以及相同资源提取单元509。
归一处理单元505,用于将加权值进行归一处理得到与用户对资源的评分。
本实施例中,归一处理单元505将与用户相关的资源的加权值利用最大-最小标准化的方法进行归一处理,得到1、2、3、4、5中的任意值,归一处理后的加权值即为该用户对资源的评分。
具体地,最大-最小标准化的方法是对加权值进行变换后使得变换后得到的用户对资源的评分落在某个固定的区别内。
筛选单元506,用于筛选出所关联的用户相同的资源形成存在相似关系的资源组合,并根据与用户对资源的评分计算资源组合中资源之间的相似度。
本实施例中,由于任一用户均可对任一资源触发操作事件,而每一资源都是面向多个用户的,因此每一个资源也对应了多个用户,例如,若资源是歌曲,则同一个歌曲将有多个不同的用户对其触发了操作事件。在大量的资源中筛选出所关联的用户相同的资源,这些资源即为存在相似关系的相似资源,且由于用户对资源的评分反映了用户对该资源的喜爱程度,因此筛选单元506可根据用户对这一资源喜爱程度的差别来计算相似资源之间的相似度,具体的计算过程可以采用余弦相似性、皮尔森相关系数以及修正余弦相似性等方式。
资源获取单元507,用于从筛选的资源组合中提取包含相同资源的资源组合,获取提取的资源组合中与相同资源存在相似关系的资源。
本实施例中,在多个资源组合之间存在着相同资源的可能性是非常大的,资源获取单元507从筛选得到的多个资源组合中提取包含了相同资源的资源组合,并获取这些包含了相同资源的资源组合中与相同资源存在相似关系的资源。
估算单元508,用于逐一对每一用户获取与相同资源存在相似关系的资源的评分以及相似度,并根据获取的评分及相似度估算用户对相同资源的预测分值。
本实施例中,估算单元508预测每一用户对相同资源的打分得到该用户对相同资源的预测分值。具体地,估算单元508获取与相同资源存在相似关系的资源所对应的评分以及相似度,并计算该评分与相似度之间的乘积,所有乘积的平均值即为该用户对相同资源的预测分值。估算单元508可通过上述方式根据每一用户对资源的评分估算出该用户对资源的预测分值。
相同资源提取单元509,用于对每一用户按照预测分值提取相同资源,得到用户对应的第二资源集合。
本实施例中,在每一用户中,相同资源提取单元509按照该用户对资源的预测分值的从大到小的顺序提取对应的相同资源,并将多个相同资源组成用户所对应的第二资源集合。在任一第二资源集合中的资源是某一用户的预测分值较高的资源,被该用户喜爱的可能性也较大。
在另一个实施例中,如图13所示,提取模块50还包括了评估单元510以及判断调整单元511。
评估单元510,用于获取与用户对相同资源的评分,并根据用户对相同资源的评分评估预测分值的准确度。
本实施例中,评估单元510通过平均绝对误差MAE来评估预测分值的准确度,以便于对整个资源推荐方法进行调整,平均绝对误差MAE越小,则预测分值就越准确。
判断调整单元511,判断预测分值的准确度是否大于阈值,若是,则对资源集合进行调整,若否,则结束。
本实施例中,当判断到预测分值的准确度大于阈值时,可对预测分值的估算、相似度的计算方法以及各操作事件的权重进行调整。
在一个实施例中,如图14所示,上述推荐模块70包括探测单元710、查找单元720、集合获取单元730、属性提取单元740以及推送单元750。
探测单元710,用于探测登录的用户.
查找单元720,用于在产生操作事件的用户中查找登录的用户,判断是否存在登录的用户,若是,则通知集合获取单元730,若否,则通知属性提取单元740。
本实施例中,查找单元720当判断到产生操作事件的用户中存在着登录的用户,则说明该可根据该用户在本次登录之前对资源触发的操作事件以及对某些资源的评分进行资源的推荐,即获取对应的第二资源集合;若产生操作事件的用户中不存在登录的用户,则说明该用户是新用户,需要获取这一用户的属性信息,进而按照这一属性信息得到对应的每一资源集合。
集合获取单元730,用于获取与登录的用户对应的第二资源集合。
属性提取单元740,用于获取登录的用户的属性信息。
集合获取单元730还用于获取与登录的用户的属性信息对应的第一资源集合。
推送单元750,用于将第一资源集合或第二资源集合推送给登录的用户。
本实施例中,推送单元750将第一资源集合或第二资源集合推送给登录的用户,进而向登录的用户推荐资源集合中的资源。
上述资源推荐方法及系统中,对资源中操作事件进行发生次数的统计并对其进行加权求和得到与用户相关的资源的加权值,进而根据产生操作事件的用户以及加权值进行推荐资源的提取,由于对操作事件的统计以及加权求和所得到的与用户相关的资源的加权值均准确地反映了用户对某一资源的喜爱程序,因此大大提高了推荐的准确性。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (14)
1.一种资源推荐方法,包括如下步骤:
获取资源中操作事件的发生次数以及产生所述操作事件的用户,将所述用户与所述资源相关联;
按照产生所述操作事件的用户对获取的发生次数进行加权求和得到与所述用户相关的资源的加权值;
根据所述产生操作事件的用户以及加权值提取资源,形成资源集合;
推荐形成的资源集合。
2.根据权利要求1所述的资源推荐方法,其特征在于,所述获取资源中操作事件的发生次数以及产生所述操作事件的用户的步骤为:
采集资源的操作事件以及产生所述操作事件的用户;
按照所述操作事件的用户对所述采集的操作事件进行计数得到所述操作事件对应的发生次数,并判断所述发生次数是否达到所述操作事件的阈值,若是,则
将所述发生次数设置为所述操作事件的阈值。
3.根据权利要求1所述的资源推荐方法,其特征在于,所述按照产生所述操作事件的用户对获取的发生次数进行加权求和得到与所述用户相关的资源的加权值的步骤为:
获取操作事件产生的时间点与当前时间之间的时间间隔以及所述操作事件对应的衰减系数;
根据所述时间间隔和衰减系数,按照产生所述操作事件的用户对所述操作事件的发生次数进行加权求和得到与所述用户相关的资源的加权值。
4.根据权利要求1所述的资源推荐方法,其特征在于,所述根据所述产生操作事件的用户以及加权值提取资源,形成资源集合的步骤之前还包括:
获取所述用户的属性信息;
所述根据所述产生操作事件的用户以及加权值提取资源,形成资源集合的步骤为:
根据所述用户的属性信息获取属性信息相同的用户;
按照所述属性信息相同的用户提取资源的加权值;
对所述提取的加权值进行汇总得到与所述资源相关的汇总值;
按照与所述资源相关的汇总值提取资源,将所述提取的资源形成与所述相同的属性信息对应的第一资源集合。
5.根据权利要求1或4所述的资源推荐方法,其特征在于,所述根据所述产生操作事件的用户以及加权值提取资源,形成资源集合的步骤为:
将所述加权值进行归一处理得到所述用户对资源的评分;
筛选出所关联的用户相同的资源形成存在相似关系的资源组合,并根据用户对资源的评分计算资源组合中资源之间的相似度;
从筛选的资源组合中提取包含相同资源的资源组合,获取所述提取的资源组合中与相同资源存在相似关系的资源;
逐一对每一用户获取所述与相同资源存在相似关系的资源的评分以及相似度,并根据获取的评分及相似度估算所述用户对相同资源的预测分值;
对每一用户中按照所述预测分值提取相同资源,得到所述用户对应的第二资源集合。
6.根据权利要求5所述的资源推荐方法,其特征在于,所述推荐形成的资源集合的步骤包括:
探测登录的用户;
在产生所述操作事件的用户中查找所述登录的用户,判断是否存在所述登录的用户,若是,则获取与所述登录的用户对应的第二资源集合;若否,则
获取所述登录的用户的属性信息;
获取与所述登录的用户的属性信息对应的第一资源集合;
将所述第一资源集合或第二资源集合推送给登录的用户。
7.根据权利要求5所述的资源推荐方法,其特征在于,所述根据获取的评分及相似度估算所述用户对相同资源的预测分值的步骤之后还包括:
获取与所述用户对相同资源的评分,并根据所述用户对相同资源的评分评估所述预测分值的准确度;
判断所述预测分值的准确度是否大于阈值,若是,则对所述资源集合进行调整。
8.一种资源推荐系统,其特征在于,包括:
操作获取模块,用于获取资源中操作事件的发生次数以及产生所述操作事件的用户,将所述用户与所述资源相关联;
加权求和模块,用于按照产生所述操作事件的用户对获取的发生次数进行加权求和得到与所述用户相关的资源的加权值;
提取模块,用于根据所述产生操作事件的用户以及加权值提取资源,形成资源集合;
推荐模块,用于推荐形成的资源集合。
9.根据权利要求8所述的资源推荐系统,其特征在于,所述操作获取模块包括:
事件采集单元,用于采集资源的操作事件以及产生所述操作事件的用户;
计数单元,用于对所述采集的操作事件进行计数得到所述操作事件对应的发生次数,并判断所述发生次数是否达到所述操作事件的阈值,若是,则通知设置单元;
所述设置单元用于将所述发生次数设置为所述操作事件的阈值。
10.根据权利要求8所述的资源推荐系统,其特征在于,加权求和模块包括:
时间获取单元,用于获取操作事件产生的时间点与当前时间之间的时间间隔以及所述操作事件对应的衰减系数;
求和单元,用于根据所述时间间隔和衰减系数,按照产生所述操作事件的用户对所述操作事件的发生次数进行加权求和得到与所述用户相关的资源的加权值。
11.根据权利要求8所述的资源推荐系统,其特征在于,还包括:
信息获取模块,用于获取所述用户的属性信息;
所述提取模块包括:
用户获取单元,用于根据所述用户的属性信息获取属性信息相同的用户;
加权值提取单元,用于按照所述属性信息相同的用户提取资源的加权值;
汇总单元,用于对所述提取的加权值进行汇总得到与所述资源相关的汇总值;
资源提取单元,用于按照与所述资源相关的汇总值提取资源,将所述提取的资源形成与所述相同的属性信息对应的第一资源集合。
12.根据权利要求8或11所述的资源推荐系统,其特征在于,所述提取模块包括:
归一处理单元,用于将所述加权值进行归一处理得到与所述用户对资源的评分;
筛选单元,用于筛选出所关联的用户相同的资源形成存在相似关系的资源组合,并根据与用户对资源的评分计算资源组合中资源之间的相似度;
资源获取单元,用于从筛选的资源组合中提取包含相同资源的资源组合,获取所述提取的资源组合中与相同资源存在相似关系的资源;
估算单元,用于逐一对每一用户获取所述与相同资源存在相似关系的资源的评分以及相似度,并根据获取的评分及相似度估算所述用户对相同资源的预测分值;
相同资源提取单元,用于对每一用户按照所述预测分值提取相同资源,得到所述用户对应的第二资源集合。
13.根据权利要求12所述的资源推荐系统,其特征在于,所述推荐模块包括:
探测单元,用于探测登录的用户;
查找单元,用于在产生所述操作事件的用户中查找所述登录的用户,判断是否存在所述登录的用户,若是,则通知集合获取单元,若否,则通知属性提取单元;
所述集合获取单元用于获取与所述登录的用户对应的第二资源集合;
所述属性提取单元用于获取所述登录的用户的属性信息;
所述集合获取单元还用于获取与所述登录的用户的属性信息对应的第一资源集合;
推送单元,用于将所述第一资源集合或第二资源集合推送给登录的用户。
14.根据权利要求12所述的资源推荐系统,其特征在于,所述提取模块还包括:
评估单元,用于获取与所述用户对相同资源的评分,并根据所述用户对相同资源的评分评估所述预测分值的准确度;
判断调整单元,判断所述预测分值的准确度是否大于阈值,若是,则对所述资源集合进行调整。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110398789.7A CN103136289B (zh) | 2011-12-05 | 2011-12-05 | 资源推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110398789.7A CN103136289B (zh) | 2011-12-05 | 2011-12-05 | 资源推荐方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103136289A true CN103136289A (zh) | 2013-06-05 |
CN103136289B CN103136289B (zh) | 2016-09-28 |
Family
ID=48496121
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201110398789.7A Active CN103136289B (zh) | 2011-12-05 | 2011-12-05 | 资源推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103136289B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104765751A (zh) * | 2014-01-07 | 2015-07-08 | 腾讯科技(深圳)有限公司 | 应用推荐方法及装置 |
CN105740210A (zh) * | 2016-03-17 | 2016-07-06 | 腾讯科技(深圳)有限公司 | 一种信息相似度确定方法及装置 |
WO2017041541A1 (zh) * | 2015-09-08 | 2017-03-16 | 北京邮电大学 | 推送推荐信息的方法、服务器及存储介质 |
CN108197285A (zh) * | 2018-01-15 | 2018-06-22 | 腾讯科技(深圳)有限公司 | 一种数据推荐方法以及装置 |
CN109284445A (zh) * | 2018-12-11 | 2019-01-29 | 北京达佳互联信息技术有限公司 | 网络资源的推荐方法、装置、服务器及存储介质 |
CN109978642A (zh) * | 2017-12-27 | 2019-07-05 | 中移(杭州)信息技术有限公司 | 一种信息推荐方法、装置和通信设备 |
CN111510783A (zh) * | 2020-04-26 | 2020-08-07 | 咪咕动漫有限公司 | 确定视频曝光量的方法、装置、电子设备和存储介质 |
CN112463854A (zh) * | 2020-11-30 | 2021-03-09 | 上海寻梦信息技术有限公司 | 基于数据分析的关联实体挖掘方法、系统、设备及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1750004B (zh) * | 2004-08-04 | 2010-05-05 | 索尼株式会社 | 信息处理装置和方法 |
CN102043781A (zh) * | 2009-10-23 | 2011-05-04 | 华为技术有限公司 | 一种网页资源推荐方法及装置 |
CN102110098A (zh) * | 2009-12-25 | 2011-06-29 | 腾讯科技(深圳)有限公司 | 网络信息推荐方法及系统 |
CN102654860A (zh) * | 2011-03-01 | 2012-09-05 | 北京彩云在线技术开发有限公司 | 一种个性化音乐推荐方法及系统 |
-
2011
- 2011-12-05 CN CN201110398789.7A patent/CN103136289B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1750004B (zh) * | 2004-08-04 | 2010-05-05 | 索尼株式会社 | 信息处理装置和方法 |
CN102043781A (zh) * | 2009-10-23 | 2011-05-04 | 华为技术有限公司 | 一种网页资源推荐方法及装置 |
CN102110098A (zh) * | 2009-12-25 | 2011-06-29 | 腾讯科技(深圳)有限公司 | 网络信息推荐方法及系统 |
CN102654860A (zh) * | 2011-03-01 | 2012-09-05 | 北京彩云在线技术开发有限公司 | 一种个性化音乐推荐方法及系统 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104765751A (zh) * | 2014-01-07 | 2015-07-08 | 腾讯科技(深圳)有限公司 | 应用推荐方法及装置 |
CN104765751B (zh) * | 2014-01-07 | 2019-05-24 | 腾讯科技(深圳)有限公司 | 应用推荐方法及装置 |
WO2017041541A1 (zh) * | 2015-09-08 | 2017-03-16 | 北京邮电大学 | 推送推荐信息的方法、服务器及存储介质 |
CN105740210A (zh) * | 2016-03-17 | 2016-07-06 | 腾讯科技(深圳)有限公司 | 一种信息相似度确定方法及装置 |
CN105740210B (zh) * | 2016-03-17 | 2020-06-16 | 腾讯科技(深圳)有限公司 | 一种信息相似度确定方法及装置 |
CN109978642A (zh) * | 2017-12-27 | 2019-07-05 | 中移(杭州)信息技术有限公司 | 一种信息推荐方法、装置和通信设备 |
CN108197285A (zh) * | 2018-01-15 | 2018-06-22 | 腾讯科技(深圳)有限公司 | 一种数据推荐方法以及装置 |
CN109284445A (zh) * | 2018-12-11 | 2019-01-29 | 北京达佳互联信息技术有限公司 | 网络资源的推荐方法、装置、服务器及存储介质 |
CN111510783A (zh) * | 2020-04-26 | 2020-08-07 | 咪咕动漫有限公司 | 确定视频曝光量的方法、装置、电子设备和存储介质 |
CN111510783B (zh) * | 2020-04-26 | 2022-06-03 | 咪咕动漫有限公司 | 确定视频曝光量的方法、装置、电子设备和存储介质 |
CN112463854A (zh) * | 2020-11-30 | 2021-03-09 | 上海寻梦信息技术有限公司 | 基于数据分析的关联实体挖掘方法、系统、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN103136289B (zh) | 2016-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103136289A (zh) | 资源推荐方法及系统 | |
US9420413B2 (en) | Push method, system and server based on location information | |
CN105138653B (zh) | 一种基于典型度和难度的题目推荐方法及其推荐装置 | |
US9501524B2 (en) | Searching and determining active area | |
CN104462560B (zh) | 一种个性化推荐系统的推荐方法 | |
WO2017096832A1 (zh) | 媒体数据推荐方法及服务器 | |
US9818065B2 (en) | Attribution of activity in multi-user settings | |
CN103425650B (zh) | 推荐搜索方法和系统 | |
Lymberopoulos et al. | Location-aware click prediction in mobile local search | |
KR20150036117A (ko) | 쿼리 확장 | |
CN107896153B (zh) | 一种基于移动用户上网行为的流量套餐推荐方法及装置 | |
CN112182351B (zh) | 一种基于多特征融合的新闻推荐方法及装置 | |
CN112488716B (zh) | 一种异常事件检测系统 | |
TWI571756B (zh) | 用以分析瀏覽記錄及其文件之方法及其系統 | |
CN106980646A (zh) | 基于流行度对用户兴趣的影响机制分析及其在推荐算法中应用的方法 | |
CN103744918A (zh) | 基于垂直领域的微博搜索排序方法及系统 | |
Kouki | Recommender system performance evaluation and prediction: an information retrieval perspective | |
CN104008193A (zh) | 一种基于典型用户群组发现技术的信息推荐方法 | |
CN103577505A (zh) | 媒体文件的兴趣度预测方法和系统 | |
CN109526027B (zh) | 一种小区容量优化方法、装置、设备及计算机存储介质 | |
CN108205551B (zh) | 一种歌曲推荐方法和歌曲推荐系统 | |
CN106021423B (zh) | 基于群组划分的元搜索引擎个性化结果推荐方法 | |
CN105589935A (zh) | 社交群组识别方法 | |
US20220075804A1 (en) | Method and device for providing guide information for enhancement of artist's reputation | |
KR101621735B1 (ko) | 추천 검색어 제공 방법 및 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20130605 Assignee: Ocean interactive (Beijing) Information Technology Co., Ltd. Assignor: Tencent Technology (Shenzhen) Co., Ltd. Contract record no.: 2016990000422 Denomination of invention: Method and system for recommending download resources Granted publication date: 20160928 License type: Common License Record date: 20161009 |
|
LICC | Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model |