CN104965889A - 内容推荐方法及装置 - Google Patents
内容推荐方法及装置 Download PDFInfo
- Publication number
- CN104965889A CN104965889A CN201510337165.2A CN201510337165A CN104965889A CN 104965889 A CN104965889 A CN 104965889A CN 201510337165 A CN201510337165 A CN 201510337165A CN 104965889 A CN104965889 A CN 104965889A
- Authority
- CN
- China
- Prior art keywords
- content
- theme label
- weight
- label
- recommended
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
Abstract
本发明公开了一种内容推荐方法及装置,属于计算机技术领域。所述方法包括:根据用户浏览的内容所对应的主题标签计算用户对应的第一向量,第一向量的n个分量中的每个分量对应于一个主题标签,且分量的数值为主题标签在用户感兴趣的各个主题标签中的权重;根据每个待推荐内容所对应的主题标签计算待推荐内容对应的第二向量,第二向量的n个分量分别与第一向量的n个分量对应,且每个分量的数值为待推荐内容属于对应的主题标签的权重;计算第一向量和每个第二向量之间的相似度;将相似度满足推荐条件的待推荐内容确定为推荐给用户的内容。本发明解决了对所有用户推荐相同图片,图片推荐的准确率较低的问题,达到提高图片推荐的准确率的效果。
Description
技术领域
本发明涉及计算机技术领域,特别涉及一种内容推荐方法及装置。
背景技术
用户在浏览网页的过程中,经常会被网页中的一些图片所吸引,此时用户通常会点击这些图片,以进一步欣赏图片。根据用户的点击行为,可以对用户进行图片推荐。
现有技术提供的一种图片推荐方法包括:对于电子设备中存储的每张图片,电子设备统计每张图片的总点击次数,按照总点击次数由多到少的顺序对每张图片进行排名,将排在前列的图片推荐给用户。
当根据图片的总点击次数的排名来推荐图片时,对所有用户推荐的图片相同,而不同用户所感兴趣的图片不同,导致图片推荐的准确率较低。
发明内容
为了解决对所有的用户推荐相同的图片,导致图片推荐的准确率较低的问题,本发明实施例提供了一种内容推荐方法及装置。所述技术方案如下:
第一方面,提供了一种内容推荐方法,所述方法包括:
根据用户浏览的内容所对应的主题标签计算所述用户对应的第一向量,所述第一向量的n个分量中的每个分量对应于一个主题标签,且所述分量的数值为所述主题标签在所述用户感兴趣的各个主题标签中的权重,n为正整数;
根据每个待推荐内容所对应的主题标签计算所述待推荐内容对应的第二向量,所述第二向量的n个分量分别与所述第一向量的n个分量对应,且每个分量的数值为所述待推荐内容属于对应的主题标签的权重;
计算所述第一向量和每个第二向量之间的相似度;
将相似度满足推荐条件的待推荐内容确定为推荐给所述用户的内容。
第二方面,提供了一种内容推荐装置,所述装置包括:
第一计算模块,用于根据用户浏览的内容所对应的主题标签计算所述用户对应的第一向量,所述第一向量的n个分量中的每个分量对应于一个主题标签,且所述分量的数值为所述主题标签在所述用户感兴趣的各个主题标签中的权重,n为正整数;
第二计算模块,用于根据每个待推荐内容所对应的主题标签计算所述待推荐内容对应的第二向量,所述第二向量的n个分量分别与所述第一向量的n个分量对应,且每个分量的数值为所述待推荐内容属于对应的主题标签的权重;
相似度计算模块,用于计算所述第一计算模块得到的所述第一向量和所述第二计算模块得到的每个第二向量之间的相似度;
内容确定模块,用于将所述相似度计算模块得到的相似度满足推荐条件的待推荐内容确定为推荐给所述用户的内容。
本发明实施例提供的技术方案的有益效果是:
通过根据用户浏览的内容所对应的主题标签计算用户对应的第一向量,第一向量的n个分量中的每个分量对应于一个主题标签,且分量的数值为主题标签在用户感兴趣的各个主题标签中的权重;根据每个待推荐内容所对应的主题标签计算待推荐内容对应的第二向量,第二向量的n个分量分别与第一向量的n个分量对应,且每个分量的数值为待推荐内容属于对应的主题标签的权重;计算第一向量和每个第二向量之间的相似度;将相似度满足推荐条件的待推荐内容确定为推荐给用户的内容,可以根据用户浏览的图片为用户推荐图片,解决了对所有的用户推荐相同的图片,导致图片推荐的准确率较低的问题,达到了提高图片推荐的准确率的效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的内容推荐方法的方法流程图;
图2是本发明另一实施例提供的内容推荐方法的方法流程图;
图3是本发明一个实施例提供的内容推荐装置的结构框图;
图4是本发明再一实施例提供的内容推荐装置的结构框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
请参考图1,其示出了本发明一个实施例提供的内容推荐方法的方法流程图,该内容推荐方法可以应用于电子设备中,该电子设备可以是服务器或终端,该终端可以是智能电视、智能手机或者平板电脑等等。该内容推荐方法,包括:
步骤101,根据用户浏览的内容所对应的主题标签计算用户对应的第一向量,该第一向量的n个分量中的每个分量对应于一个主题标签,且分量的数值为主题标签在用户感兴趣的各个主题标签中的权重,n为正整数。
步骤102,根据每个待推荐内容所对应的主题标签计算待推荐内容对应的第二向量,该第二向量的n个分量分别与第一向量的n个分量对应,且每个分量的数值为待推荐内容属于对应的主题标签的权重。
步骤103,计算第一向量和每个第二向量之间的相似度。
步骤104,将相似度满足推荐条件的待推荐内容确定为推荐给用户的内容。
综上所述,本发明实施例提供的内容推荐方法,通过根据用户浏览的内容所对应的主题标签计算用户对应的第一向量,第一向量的n个分量中的每个分量对应于一个主题标签,且分量的数值为主题标签在用户感兴趣的各个主题标签中的权重;根据每个待推荐内容所对应的主题标签计算待推荐内容对应的第二向量,第二向量的n个分量分别与第一向量的n个分量对应,且每个分量的数值为待推荐内容属于对应的主题标签的权重;计算第一向量和每个第二向量之间的相似度;将相似度满足推荐条件的待推荐内容确定为推荐给用户的内容,可以根据用户浏览的图片为用户推荐图片,解决了对所有的用户推荐相同的图片,导致图片推荐的准确率较低的问题,达到了提高图片推荐的准确率的效果。
请参考图2,其示出了本发明另一实施例提供的内容推荐方法的方法流程图,该内容推荐方法可以应用于电子设备中,该电子设备可以是服务器或终端,该终端可以是智能电视、智能手机或者平板电脑等等。该内容推荐方法,包括:
步骤201,获取用户本次浏览的内容所对应的当前主题标签,将当前主题标签添加到用户的标签集合中,该标签集合还包括历史主题标签,该历史主题标签是用户在历史时刻浏览的内容所对应的主题标签。
用户本次浏览的内容可以是文本、图片、音频、视频中的一种。其中,文本、图片、音频、视频可以直接展示在网页中,也可以以链接或附件的形式展示在网页中,本实施例不限定内容在网页中的展示形式。用户可以通过点击、选中、购买等操作来浏览内容。
本实施例中,每个内容对应于至少一个主题标签,每个主题标签用于描述一个主题。比如,内容是一张“牛奶”的广告图片,则该内容所对应的主题标签可以是“早餐”、“饮料”、“补品”等。其中,一个主题包括具有相似功能的内容,比如,主题“早餐”包括的内容是“牛奶”、“蛋糕”、“粥”等。
内容所对应的主题标签可以是人为指定的,也可以是对该内容的描述信息进行分析后确定的。当根据对内容的描述信息进行分析来确定主题标签时,电子设备预先读取内容库中的每个内容,对于每个内容,电子设备先对该内容的描述信息进行分词。比如,内容的描述信息是“牛奶和苹果搭配更健康”,则电子设备可以从该描述信息中提取出分词“牛奶”和“苹果”。电子设备再根据语义模型确定每个分词所对应的主题标签。比如,“牛奶”对应的主题标签是“早餐”、“饮料”、“补品”,“苹果”对应的主题标签是“早餐”、“水果”,则可以将“早餐”、“饮料”、“补品”、“水果”确定为该内容所对应的主题标签。其中,语义模型可以是LDA(Latent Dirichlet Allocation,文档主题生成模型)、word2vec等,本实施例不作限定。
需要说明的是,电子设备可以直接将根据各个分词得到的主题标签确定为该内容所对应的主题标签,也可以根据筛选条件对得到的主题标签进行筛选,将筛选后的主题标签确定为该内容所对应的主题标签,筛选条件可以根据主题标签的权重确定,本实施例不作限定。其中,主题标签的权重用于表示内容属于该主题的概率,可以通过语义模型得到,此过程为现有技术,此处不作赘述。
电子设备可以将用户在当前时刻浏览的内容所对应的主题标签确定为当前主题标签,再将各个当前主题标签添加到标签集合中,该标签集合用于存储截止到当前时刻,用户所浏览的所有内容所对应的主题标签。当用户还在历史时刻浏览过其他内容时,标签集合还包括历史主题标签,该历史主题标签是在历史时刻浏览的内容所对应的主题标签。
步骤202,计算标签集合中每个当前主题标签和每个历史主题标签的权重。
电子设备可以根据经验值设置每个当前主题标签和每个历史主题标签的权重,也可以根据公式计算每个当前主题标签和每个历史主题标签,本实施例以根据公式计算每个当前主题标签和每个历史主题标签为例进行说明。
具体地,计算标签集合中每个当前主题标签和每个历史主题标签的权重,包括:
1)根据历史主题标签的添加时刻确定衰减因子,根据衰减因子对上一次计算得到的历史主题标签的权重进行衰减,得到历史主题标签的权重,添加时刻与当前时刻的差值的绝对值与衰减因子呈正相关关系;
2)根据衰减因子设置当前主题标签的权重。
由于历史主题标签的添加时刻与当前时刻的差值的绝对值越大,用户浏览该内容的时间越久远,用户当前对该内容感兴趣的概率越小,因此,在将当前主题标签添加到标签集合中后,电子设备可以减小历史主题标签的权重,再计算当前主题标签的权重。
具体地,电子设备可以计算添加时刻与当前时刻的差值的绝对值,根据该绝对值计算衰减因子,将上一次计算得到的历史主题标签的权重乘以该衰减因子,再将上一次计算得到的权重减去该乘积的差值确定为该历史主题标签的权重。其中,添加时刻与当前时刻的差值的绝对值与衰减因子呈正相关关系。即,差值的绝对值越大,衰减因子越大,历史主题标签的权重衰减越大,对图片推荐的影响越小;差值的绝对值越小,衰减因子越小,历史主题标签的权重衰减越小,对图片推荐的影响越大。
衰减因子可以是属于(0,1]区间的一个数值。比如,将1年前的历史主题标签的衰减因子确定为0.8,将1天前的历史主题标签的衰减因子确定为0.05。
假设,上一次计算历史主题标签的权重是0.5,根据该历史主题标签的添加时刻确定的衰减因子是0.6,则该历史主题标签的权重=0.5-0.5*0.6=0.2。
在计算当前主题标签的权重时,电子设备根据语义模型获取当前主题标签的原始权重,将该原始权重乘以预定比例得到当前主题标签的权重。其中,预定比例可以是1减去衰减因子的差值。假设当前主题标签的原始权重是0.7,衰减因子是0.6,则该当前主题标签的权重=0.2*(1-0.6)=0.28。
优选的,电子设备还可以根据用户对内容进行的操作确定行为权重,将原始权重乘以预定比例得到的乘积再乘以行为权重,将计算结果确定为当前主题标签的权重。比如,对内容的操作包括点击操作和购买操作,且购买操作的行为权重高于点击操作的行为权重。
需要补充说明的是,当某一个当前主题标签与历史主题标签相同时,确定用户对该当前主题标签非常感兴趣,此时可以在上一次计算得到的历史主题标签的权重的基础上增大该权重,以提高该当前主题标签对图片推荐的影响。
步骤203,将各个权重作为n个分量中对应的分量的数值,得到第一向量,该第一向量的n个分量中的每个分量对应于一个主题标签,且分量的数值为主题标签在用户感兴趣的各个主题标签中的权重,n为正整数。
其中,第一分量包括n个分量,且每个分量对应于一个主题标签。n的数值可以自行设置,也可以进行修改,本实施例不作限定。通常,可以将n设置为500。
假设用户浏览的是牛奶的图片、n为4、4个主题标签分别为“早餐”、“饮料”、“补品”、“水果”、“早餐”的权重为0.4、“饮料”的权重为0.5、“补品”的权重为0.1、“水果”的权重为0,则第一向量为(0.4,0.5,0.1,0)。
步骤204,读取标签集合中的各个主题标签。
此时,电子设备读取到的各个主题标签包括当前主题标签和历史主题标签。
步骤205,根据预设对应关系从内容库中选择每个主题标签所对应的至少一个内容,得到待推荐内容集合,预设对应关系是每个主题标签与至少一个内容之间的对应关系。
由于预设对应关系中存储有每个主题标签所对应的至少一个内容,因此,在确定出各个主题标签后,可以根据预设对应关系读取到每个主题标签所对应的至少一个内容,得到待推荐内容集合。
本实施例中,根据预设对应关系从内容库中选择每个主题标签所对应的至少一个内容,得到待推荐内容集合之前,还包括:
1)对于内容库中的每个内容,对内容的描述信息进行分词;
2)根据语义模型确定每个分词所对应的主题标签和每个主题标签的权重;
3)将各个权重作为内容所对应的各个主题标签的权重,并筛选出满足预定条件的权重所对应的主题标签,建立预设对应关系。
其中,步骤1)和步骤2)的流程详见步骤201中的描述,此处不赘述。在得到每个分词所对应的主题标签和每个主题标签的权重后,电子设备可以将各个分词所对应的主题标签的权重确定为内容所对应的各个主题标签的权重。比如,分词“牛奶”所对应的主题标签“早餐”的权重是0.3,则牛奶图片所对应的主题标签“早餐”的权重是0.3。
电子设备还可以按照主题标签的权重由高到低的顺序对各个权重进行排序,筛选出排在前排的m个权重,获取这m个权重所对应的m个主题标签,建立内容与m个主题标签之间的正排索引,m为正整数。电子设备再根据正排索引建立每个主题标签与内容之间的倒排索引,即得到预设对应关系。其中,建立正排索引和倒排索引的过程为现有技术,此处不作赘述。
步骤206,获取待推荐内容集合中每个待推荐内容所对应的各个主题标签的权重,将各个权重作为n个分量中对应的分量的数值,得到第二向量,该第二向量的n个分量分别与第一向量的n个分量对应,且每个分量的数值为待推荐内容属于对应的主题标签的权重。
其中,第二向量与第一向量中对应位置的分量所对应的主题标签相同。比如,第一向量中4个分量所对应的主题标签依次是“早餐”、“饮料”、“补品”、“水果”、“早餐”,则第二向量中4个分量所对应的主题标签依次是“早餐”、“饮料”、“补品”、“水果”、“早餐”。假设“早餐”的权重为0.2、“饮料”的权重为0.1、“补品”的权重为0.1、“水果”的权重为0.6,则第二向量为(0.2,0.1,0.1,0.6)。
本实施例中,电子设备可以在步骤205中得到内容所对应的各个主题标签的权重后,根据各个权重计算该内容的第二向量;也可以在确定某一个内容是待推荐内容后,获取该待推荐内容所对应的各个主题标签的权重,根据各个权重计算该待推荐内容的第二向量,本实施例不限定第二向量的生成时机。
步骤207,计算第一向量和每个第二向量之间的相似度。
本实施例以相似度是第一向量和第二向量的余弦值为例进行说明,则根据公式计算第一向量和第二向量之间的余弦值。
步骤208,将相似度满足推荐条件的待推荐内容确定为推荐给用户的内容。
电子设备还可以设置推荐条件,根据推荐条件对相似度进行筛选,并将筛选出的相似度所对应的待推荐内容确定为推荐给用户的内容。当相似度是余弦值时,由于余弦值越大,第一向量和第二向量之间越相似,用户对第二向量所对应的待推荐内容感兴趣的概率越大,因此,可以将大于预定阈值的余弦值确定为满足推荐条件,或,将余弦值按照由大到小的顺序进行排列,确定排在前排的前k个余弦值满足推荐条件,k为正整数。当然,电子设备还可以设置其他推荐条件,本实施例不作限定。
综上所述,本发明实施例提供的内容推荐方法,通过根据用户浏览的内容所对应的主题标签计算用户对应的第一向量,第一向量的n个分量中的每个分量对应于一个主题标签,且分量的数值为主题标签在用户感兴趣的各个主题标签中的权重;根据每个待推荐内容所对应的主题标签计算待推荐内容对应的第二向量,第二向量的n个分量分别与第一向量的n个分量对应,且每个分量的数值为待推荐内容属于对应的主题标签的权重;计算第一向量和每个第二向量之间的相似度;将相似度满足推荐条件的待推荐内容确定为推荐给用户的内容,可以根据用户浏览的图片为用户推荐图片,解决了对所有的用户推荐相同的图片,导致图片推荐的准确率较低的问题,达到了提高图片推荐的准确率的效果。
另外,通过根据历史主题标签的添加时刻确定衰减因子,根据衰减因子对上一次计算得到的历史主题标签的权重进行衰减,可以在历史主题标签的添加时刻与当前时刻之间的差值的绝对值较大时,增大对该历史主题标签的衰减幅度,以降低该历史主题标签对推荐图片的影响;在历史主题标签的添加时刻与当前时刻之间的差值的绝对值较小时,减小对该历史主题标签的衰减幅度,以提高该历史主题标签对推荐图片的影响,从而突出用户现阶段的兴趣,达到进一步提高图片推荐的准确性的效果。
请参考图3,其示出了本发明一个实施例提供的内容推荐装置的结构框图,该内容推荐方法可以应用于电子设备中,该电子设备可以是服务器或终端,该终端可以是智能电视、智能手机或者平板电脑等等。该内容推荐装置,包括:
第一计算模块310,用于根据用户浏览的内容所对应的主题标签计算用户对应的第一向量,第一向量的n个分量中的每个分量对应于一个主题标签,且分量的数值为主题标签在用户感兴趣的各个主题标签中的权重,n为正整数;
第二计算模块320,用于根据每个待推荐内容所对应的主题标签计算待推荐内容对应的第二向量,第二向量的n个分量分别与第一向量的n个分量对应,且每个分量的数值为待推荐内容属于对应的主题标签的权重;
相似度计算模块330,用于计算第一计算模块310得到的第一向量和第二计算模块320得到的每个第二向量之间的相似度;
内容确定模块340,用于将相似度计算模块330得到的相似度满足推荐条件的待推荐内容确定为推荐给用户的内容。
综上所述,本发明实施例提供的内容推荐装置,通过根据用户浏览的内容所对应的主题标签计算用户对应的第一向量,第一向量的n个分量中的每个分量对应于一个主题标签,且分量的数值为主题标签在用户感兴趣的各个主题标签中的权重;根据每个待推荐内容所对应的主题标签计算待推荐内容对应的第二向量,第二向量的n个分量分别与第一向量的n个分量对应,且每个分量的数值为待推荐内容属于对应的主题标签的权重;计算第一向量和每个第二向量之间的相似度;将相似度满足推荐条件的待推荐内容确定为推荐给用户的内容,可以根据用户浏览的图片为用户推荐图片,解决了对所有的用户推荐相同的图片,导致图片推荐的准确率较低的问题,达到了提高图片推荐的准确率的效果。
请参考图4,其示出了本发明再一实施例提供的内容推荐装置的结构框图,该内容推荐方法可以应用于电子设备中,该电子设备可以是服务器或终端,该终端可以是智能电视、智能手机或者平板电脑等等。该内容推荐装置,包括:
第一计算模块410,用于根据用户浏览的内容所对应的主题标签计算用户对应的第一向量,第一向量的n个分量中的每个分量对应于一个主题标签,且分量的数值为主题标签在用户感兴趣的各个主题标签中的权重,n为正整数;
第二计算模块420,用于根据每个待推荐内容所对应的主题标签计算待推荐内容对应的第二向量,第二向量的n个分量分别与第一向量的n个分量对应,且每个分量的数值为待推荐内容属于对应的主题标签的权重;
相似度计算模块430,用于计算第一计算模块410得到的第一向量和第二计算模块420得到的每个第二向量之间的相似度;
内容确定模块440,用于将相似度计算模块430得到的相似度满足推荐条件的待推荐内容确定为推荐给用户的内容。
可选的,第一计算模块410,包括:
标签获取单元411,用于获取用户本次浏览的内容所对应的当前主题标签;
标签添加单元412,用于将标签获取单元411获取的当前主题标签添加到用户的标签集合中,标签集合还包括历史主题标签,历史主题标签是用户在历史时刻浏览的内容所对应的主题标签;
权重计算单元413,用于计算标签集合中每个当前主题标签和每个历史主题标签的权重;
第一计算单元414,用于将权重计算单元413得到的各个权重作为n个分量中对应的分量的数值,得到第一向量。
可选的,权重计算单元413,包括:
第一计算子单元4131,用于根据历史主题标签的添加时刻确定衰减因子,根据衰减因子对上一次计算得到的历史主题标签的权重进行衰减,得到历史主题标签的权重,添加时刻与当前时刻的差值的绝对值与衰减因子呈正相关关系;
第二计算子单元4132,用于根据第一计算子单元4131得到的衰减因子设置当前主题标签的权重。
可选的,第二计算模块420,包括:
标签读取单元421,用于读取标签集合中的各个主题标签;
集合确定单元422,用于根据预设对应关系从内容库中选择标签读取单元421得到的每个主题标签所对应的至少一个内容,得到待推荐内容集合,预设对应关系是每个主题标签与至少一个内容之间的对应关系;
第二计算单元423,用于获取集合确定单元422得到的待推荐内容集合中每个待推荐内容所对应的各个主题标签的权重,将各个权重作为n个分量中对应的分量的数值,得到第二向量。
可选的,第二计算模块420,还包括:
信息分词单元424,用于集合确定单元422根据预设对应关系从内容库中选择每个主题标签所对应的至少一个内容,得到待推荐内容集合之前,对于内容库中的每个内容,对内容的描述信息进行分词;
标签确定单元425,用于根据语义模型确定信息分词单元424得到的每个分词所对应的主题标签和每个主题标签的权重;
关系建立单元426,用于将标签确定单元425得到的各个权重作为内容所对应的各个主题标签的权重,并筛选出满足预定条件的权重所对应的主题标签,建立预设对应关系。
可选的,内容是文本、图片、音频、视频中的一种。
综上所述,本发明实施例提供的内容推荐装置,通过根据用户浏览的内容所对应的主题标签计算用户对应的第一向量,第一向量的n个分量中的每个分量对应于一个主题标签,且分量的数值为主题标签在用户感兴趣的各个主题标签中的权重;根据每个待推荐内容所对应的主题标签计算待推荐内容对应的第二向量,第二向量的n个分量分别与第一向量的n个分量对应,且每个分量的数值为待推荐内容属于对应的主题标签的权重;计算第一向量和每个第二向量之间的相似度;将相似度满足推荐条件的待推荐内容确定为推荐给用户的内容,可以根据用户浏览的图片为用户推荐图片,解决了对所有的用户推荐相同的图片,导致图片推荐的准确率较低的问题,达到了提高图片推荐的准确率的效果。
另外,通过根据历史主题标签的添加时刻确定衰减因子,根据衰减因子对上一次计算得到的历史主题标签的权重进行衰减,可以在历史主题标签的添加时刻与当前时刻之间的差值的绝对值较大时,增大对该历史主题标签的衰减幅度,以降低该历史主题标签对推荐图片的影响;在历史主题标签的添加时刻与当前时刻之间的差值的绝对值较小时,减小对该历史主题标签的衰减幅度,以提高该历史主题标签对推荐图片的影响,从而突出用户现阶段的兴趣,达到进一步提高图片推荐的准确性的效果。
路需要说明的是:上述实施例提供的内容推荐装置在进行内容推荐时,仅
需要说明的是:上述实施例提供的内容推荐装置在进行内容推荐时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将内容推荐装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的内容推荐装置与内容推荐方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (12)
1.一种内容推荐方法,其特征在于,所述方法包括:
根据用户浏览的内容所对应的主题标签计算所述用户对应的第一向量,所述第一向量的n个分量中的每个分量对应于一个主题标签,且所述分量的数值为所述主题标签在所述用户感兴趣的各个主题标签中的权重,n为正整数;
根据每个待推荐内容所对应的主题标签计算所述待推荐内容对应的第二向量,所述第二向量的n个分量分别与所述第一向量的n个分量对应,且每个分量的数值为所述待推荐内容属于对应的主题标签的权重;
计算所述第一向量和每个第二向量之间的相似度;
将相似度满足推荐条件的待推荐内容确定为推荐给所述用户的内容。
2.根据权利要求1所述的方法,其特征在于,所述根据用户浏览的内容所对应的主题标签计算所述用户对应的第一向量,包括:
获取所述用户本次浏览的内容所对应的当前主题标签;
将所述当前主题标签添加到所述用户的标签集合中,所述标签集合还包括历史主题标签,所述历史主题标签是所述用户在历史时刻浏览的内容所对应的主题标签;
计算所述标签集合中每个当前主题标签和每个历史主题标签的权重;
将各个权重作为所述n个分量中对应的分量的数值,得到所述第一向量。
3.根据权利要求2所述的方法,其特征在于,所述计算所述标签集合中每个当前主题标签和每个历史主题标签的权重,包括:
根据所述历史主题标签的添加时刻确定衰减因子,根据所述衰减因子对上一次计算得到的所述历史主题标签的权重进行衰减,得到所述历史主题标签的权重,所述添加时刻与当前时刻的差值的绝对值与所述衰减因子呈正相关关系;
根据所述衰减因子设置所述当前主题标签的权重。
4.根据权利要求2所述的方法,其特征在于,所述根据每个待推荐内容所对应的主题标签计算所述待推荐内容对应的第二向量,包括:
读取所述标签集合中的各个主题标签;
根据预设对应关系从内容库中选择每个主题标签所对应的至少一个内容,得到待推荐内容集合,所述预设对应关系是每个主题标签与至少一个内容之间的对应关系;
获取所述待推荐内容集合中每个待推荐内容所对应的各个主题标签的权重,将各个权重作为所述n个分量中对应的分量的数值,得到所述第二向量。
5.根据权利要求4所述的方法,其特征在于,所述根据预设对应关系从内容库中选择每个主题标签所对应的至少一个内容,得到待推荐内容集合之前,还包括:
对于所述内容库中的每个内容,对所述内容的描述信息进行分词;
根据语义模型确定每个分词所对应的主题标签和每个主题标签的权重;
将各个权重作为所述内容所对应的各个主题标签的权重,并筛选出满足预定条件的权重所对应的主题标签,建立所述预设对应关系。
6.根据权利要求1至5任一所述的方法,其特征在于,所述内容是文本、图片、音频、视频中的一种。
7.一种内容推荐装置,其特征在于,所述装置包括:
第一计算模块,用于根据用户浏览的内容所对应的主题标签计算所述用户对应的第一向量,所述第一向量的n个分量中的每个分量对应于一个主题标签,且所述分量的数值为所述主题标签在所述用户感兴趣的各个主题标签中的权重,n为正整数;
第二计算模块,用于根据每个待推荐内容所对应的主题标签计算所述待推荐内容对应的第二向量,所述第二向量的n个分量分别与所述第一向量的n个分量对应,且每个分量的数值为所述待推荐内容属于对应的主题标签的权重;
相似度计算模块,用于计算所述第一计算模块得到的所述第一向量和所述第二计算模块得到的每个第二向量之间的相似度;
内容确定模块,用于将所述相似度计算模块得到的相似度满足推荐条件的待推荐内容确定为推荐给所述用户的内容。
8.根据权利要求7所述的装置,其特征在于,所述第一计算模块,包括:
标签获取单元,用于获取所述用户本次浏览的内容所对应的当前主题标签;
标签添加单元,用于将所述标签获取单元获取的所述当前主题标签添加到所述用户的标签集合中,所述标签集合还包括历史主题标签,所述历史主题标签是所述用户在历史时刻浏览的内容所对应的主题标签;
权重计算单元,用于计算所述标签集合中每个当前主题标签和每个历史主题标签的权重;
第一计算单元,用于将所述权重计算单元得到的各个权重作为所述n个分量中对应的分量的数值,得到所述第一向量。
9.根据权利要求8所述的装置,其特征在于,所述权重计算单元,包括:
第一计算子单元,用于根据所述历史主题标签的添加时刻确定衰减因子,根据所述衰减因子对上一次计算得到的所述历史主题标签的权重进行衰减,得到所述历史主题标签的权重,所述添加时刻与当前时刻的差值的绝对值与所述衰减因子呈正相关关系;
第二计算子单元,用于根据所述第一计算子单元得到的所述衰减因子设置所述当前主题标签的权重。
10.根据权利要求8所述的装置,其特征在于,所述第二计算模块,包括:
标签读取单元,用于读取所述标签集合中的各个主题标签;
集合确定单元,用于根据预设对应关系从内容库中选择所述标签读取单元得到的每个主题标签所对应的至少一个内容,得到待推荐内容集合,所述预设对应关系是每个主题标签与至少一个内容之间的对应关系;
第二计算单元,用于获取所述集合确定单元得到的所述待推荐内容集合中每个待推荐内容所对应的各个主题标签的权重,将各个权重作为所述n个分量中对应的分量的数值,得到所述第二向量。
11.根据权利要求10所述的装置,其特征在于,所述第二计算模块,还包括:
信息分词单元,用于所述集合确定单元根据预设对应关系从内容库中选择每个主题标签所对应的至少一个内容,得到待推荐内容集合之前,对于所述内容库中的每个内容,对所述内容的描述信息进行分词;
标签确定单元,用于根据语义模型确定所述信息分词单元得到的每个分词所对应的主题标签和每个主题标签的权重;
关系建立单元,用于将所述标签确定单元得到的各个权重作为所述内容所对应的各个主题标签的权重,并筛选出满足预定条件的权重所对应的主题标签,建立所述预设对应关系。
12.根据权利要求7至11任一所述的装置,其特征在于,所述内容是文本、图片、音频、视频中的一种。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510337165.2A CN104965889B (zh) | 2015-06-17 | 2015-06-17 | 内容推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510337165.2A CN104965889B (zh) | 2015-06-17 | 2015-06-17 | 内容推荐方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104965889A true CN104965889A (zh) | 2015-10-07 |
CN104965889B CN104965889B (zh) | 2017-06-13 |
Family
ID=54219926
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510337165.2A Active CN104965889B (zh) | 2015-06-17 | 2015-06-17 | 内容推荐方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104965889B (zh) |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105718510A (zh) * | 2016-01-12 | 2016-06-29 | 海信集团有限公司 | 一种多媒体数据推荐方法及装置 |
CN105809558A (zh) * | 2016-03-15 | 2016-07-27 | 平安科技(深圳)有限公司 | 基于社交网络的推荐方法和装置 |
CN105824904A (zh) * | 2016-03-15 | 2016-08-03 | 浙江大学 | 基于中医药领域专业词向量的中草药植物图片爬取方法 |
CN106126669A (zh) * | 2016-06-28 | 2016-11-16 | 北京邮电大学 | 基于标签的用户协同过滤内容推荐方法及装置 |
CN106202294A (zh) * | 2016-07-01 | 2016-12-07 | 北京奇虎科技有限公司 | 基于关键词和主题模型融合的相关新闻计算方法及装置 |
CN106407420A (zh) * | 2016-09-23 | 2017-02-15 | 广州视源电子科技股份有限公司 | 一种多媒体资源的推荐方法及系统 |
WO2017114019A1 (zh) * | 2015-12-29 | 2017-07-06 | 广州神马移动信息科技有限公司 | 一种基于潜在狄利克雷分配(lda)模型的关键词推荐方法和系统 |
CN108647227A (zh) * | 2018-03-26 | 2018-10-12 | 北京奇艺世纪科技有限公司 | 一种推荐方法及装置 |
CN108877880A (zh) * | 2018-06-29 | 2018-11-23 | 清华大学 | 基于病历文本的病人相似性度量装置及方法 |
CN109359239A (zh) * | 2018-09-06 | 2019-02-19 | 安徽华米信息科技有限公司 | 图片推荐方法及装置 |
CN109543099A (zh) * | 2018-10-29 | 2019-03-29 | 维沃移动通信有限公司 | 一种内容推荐方法及终端设备 |
CN109819002A (zh) * | 2017-11-22 | 2019-05-28 | 腾讯科技(深圳)有限公司 | 数据推送方法和装置、存储介质及电子装置 |
CN109982155A (zh) * | 2019-03-25 | 2019-07-05 | 北京奇艺世纪科技有限公司 | 一种播单推荐方法及系统 |
CN110110201A (zh) * | 2018-01-09 | 2019-08-09 | 苏州跃盟信息科技有限公司 | 一种内容推荐方法和系统 |
CN110110202A (zh) * | 2018-01-09 | 2019-08-09 | 苏州跃盟信息科技有限公司 | 一种信息流推送方法及装置 |
CN110147499A (zh) * | 2019-05-21 | 2019-08-20 | 智者四海(北京)技术有限公司 | 打标签方法、推荐方法及记录介质 |
CN110147500A (zh) * | 2019-05-21 | 2019-08-20 | 北京奇艺世纪科技有限公司 | 一种信息推荐方法及装置 |
CN110601956A (zh) * | 2019-09-06 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 一种内容聚合方法、装置、计算机设备和存储介质 |
CN110929166A (zh) * | 2019-12-27 | 2020-03-27 | 咪咕文化科技有限公司 | 一种内容推荐的方法、电子设备和存储介质 |
CN111339429A (zh) * | 2020-03-27 | 2020-06-26 | 上海景域智能科技有限公司 | 一种资讯推荐方法 |
CN111400609A (zh) * | 2018-12-27 | 2020-07-10 | 广州市百果园网络科技有限公司 | 用户推荐方法、装置、存储介质及服务器 |
CN111666522A (zh) * | 2020-06-10 | 2020-09-15 | 创新奇智(上海)科技有限公司 | 信息处理方法、装置、设备和存储介质 |
CN111737582A (zh) * | 2020-07-29 | 2020-10-02 | 腾讯科技(深圳)有限公司 | 一种内容推荐方法及装置 |
CN112070586A (zh) * | 2020-09-09 | 2020-12-11 | 腾讯科技(深圳)有限公司 | 基于语义识别的物品推荐方法、装置、计算机设备及介质 |
CN112508611A (zh) * | 2020-12-11 | 2021-03-16 | 江苏云柜网络技术有限公司 | 一种快递柜即时竞价动态展示广告的方法 |
CN112990984A (zh) * | 2021-04-19 | 2021-06-18 | 广州欢网科技有限责任公司 | 一种广告视频推荐方法、装置、设备及存储介质 |
CN114422835A (zh) * | 2021-12-29 | 2022-04-29 | 上海数即数据科技有限公司 | 一种基于大数据分析的广告定向推广平台 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101674458A (zh) * | 2008-09-08 | 2010-03-17 | 索尼株式会社 | 用于内容推荐的设备、方法和计算机程序以及记录介质 |
CN102411596A (zh) * | 2010-09-21 | 2012-04-11 | 阿里巴巴集团控股有限公司 | 一种信息推荐方法及系统 |
CN102831234A (zh) * | 2012-08-31 | 2012-12-19 | 北京邮电大学 | 基于新闻内容和主题特征的个性化新闻推荐装置和方法 |
CN104063481A (zh) * | 2014-07-02 | 2014-09-24 | 山东大学 | 一种基于用户实时兴趣向量的电影个性化推荐方法 |
CN104239512A (zh) * | 2014-09-16 | 2014-12-24 | 电子科技大学 | 一种文本推荐方法 |
-
2015
- 2015-06-17 CN CN201510337165.2A patent/CN104965889B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101674458A (zh) * | 2008-09-08 | 2010-03-17 | 索尼株式会社 | 用于内容推荐的设备、方法和计算机程序以及记录介质 |
CN102411596A (zh) * | 2010-09-21 | 2012-04-11 | 阿里巴巴集团控股有限公司 | 一种信息推荐方法及系统 |
CN102831234A (zh) * | 2012-08-31 | 2012-12-19 | 北京邮电大学 | 基于新闻内容和主题特征的个性化新闻推荐装置和方法 |
CN104063481A (zh) * | 2014-07-02 | 2014-09-24 | 山东大学 | 一种基于用户实时兴趣向量的电影个性化推荐方法 |
CN104239512A (zh) * | 2014-09-16 | 2014-12-24 | 电子科技大学 | 一种文本推荐方法 |
Cited By (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017114019A1 (zh) * | 2015-12-29 | 2017-07-06 | 广州神马移动信息科技有限公司 | 一种基于潜在狄利克雷分配(lda)模型的关键词推荐方法和系统 |
US10685185B2 (en) | 2015-12-29 | 2020-06-16 | Guangzhou Shenma Mobile Information Technology Co., Ltd. | Keyword recommendation method and system based on latent Dirichlet allocation model |
CN105718510B (zh) * | 2016-01-12 | 2019-06-18 | 海信集团有限公司 | 一种多媒体数据推荐方法及装置 |
CN105718510A (zh) * | 2016-01-12 | 2016-06-29 | 海信集团有限公司 | 一种多媒体数据推荐方法及装置 |
CN105809558A (zh) * | 2016-03-15 | 2016-07-27 | 平安科技(深圳)有限公司 | 基于社交网络的推荐方法和装置 |
CN105824904A (zh) * | 2016-03-15 | 2016-08-03 | 浙江大学 | 基于中医药领域专业词向量的中草药植物图片爬取方法 |
CN105824904B (zh) * | 2016-03-15 | 2018-12-25 | 浙江大学 | 基于中医药领域专业词向量的中草药植物图片爬取方法 |
CN106126669A (zh) * | 2016-06-28 | 2016-11-16 | 北京邮电大学 | 基于标签的用户协同过滤内容推荐方法及装置 |
CN106126669B (zh) * | 2016-06-28 | 2019-07-16 | 北京邮电大学 | 基于标签的用户协同过滤内容推荐方法及装置 |
CN106202294A (zh) * | 2016-07-01 | 2016-12-07 | 北京奇虎科技有限公司 | 基于关键词和主题模型融合的相关新闻计算方法及装置 |
CN106407420A (zh) * | 2016-09-23 | 2017-02-15 | 广州视源电子科技股份有限公司 | 一种多媒体资源的推荐方法及系统 |
CN106407420B (zh) * | 2016-09-23 | 2020-04-21 | 广州视源电子科技股份有限公司 | 一种多媒体资源的推荐方法及系统 |
CN109819002A (zh) * | 2017-11-22 | 2019-05-28 | 腾讯科技(深圳)有限公司 | 数据推送方法和装置、存储介质及电子装置 |
CN109819002B (zh) * | 2017-11-22 | 2021-06-08 | 腾讯科技(深圳)有限公司 | 数据推送方法和装置、存储介质及电子装置 |
CN110110201A (zh) * | 2018-01-09 | 2019-08-09 | 苏州跃盟信息科技有限公司 | 一种内容推荐方法和系统 |
CN110110202A (zh) * | 2018-01-09 | 2019-08-09 | 苏州跃盟信息科技有限公司 | 一种信息流推送方法及装置 |
CN108647227A (zh) * | 2018-03-26 | 2018-10-12 | 北京奇艺世纪科技有限公司 | 一种推荐方法及装置 |
CN108877880A (zh) * | 2018-06-29 | 2018-11-23 | 清华大学 | 基于病历文本的病人相似性度量装置及方法 |
CN108877880B (zh) * | 2018-06-29 | 2020-11-20 | 清华大学 | 基于病历文本的病人相似性度量装置及方法 |
CN109359239A (zh) * | 2018-09-06 | 2019-02-19 | 安徽华米信息科技有限公司 | 图片推荐方法及装置 |
CN109543099A (zh) * | 2018-10-29 | 2019-03-29 | 维沃移动通信有限公司 | 一种内容推荐方法及终端设备 |
CN109543099B (zh) * | 2018-10-29 | 2020-09-29 | 维沃移动通信有限公司 | 一种内容推荐方法及终端设备 |
CN111400609B (zh) * | 2018-12-27 | 2024-02-13 | 广州市百果园网络科技有限公司 | 用户推荐方法、装置、存储介质及服务器 |
CN111400609A (zh) * | 2018-12-27 | 2020-07-10 | 广州市百果园网络科技有限公司 | 用户推荐方法、装置、存储介质及服务器 |
CN109982155B (zh) * | 2019-03-25 | 2021-10-12 | 北京奇艺世纪科技有限公司 | 一种播单推荐方法及系统 |
CN109982155A (zh) * | 2019-03-25 | 2019-07-05 | 北京奇艺世纪科技有限公司 | 一种播单推荐方法及系统 |
CN110147500A (zh) * | 2019-05-21 | 2019-08-20 | 北京奇艺世纪科技有限公司 | 一种信息推荐方法及装置 |
CN110147499A (zh) * | 2019-05-21 | 2019-08-20 | 智者四海(北京)技术有限公司 | 打标签方法、推荐方法及记录介质 |
CN110601956A (zh) * | 2019-09-06 | 2019-12-20 | 腾讯科技(深圳)有限公司 | 一种内容聚合方法、装置、计算机设备和存储介质 |
CN110929166B (zh) * | 2019-12-27 | 2023-10-20 | 咪咕文化科技有限公司 | 一种内容推荐的方法、电子设备和存储介质 |
CN110929166A (zh) * | 2019-12-27 | 2020-03-27 | 咪咕文化科技有限公司 | 一种内容推荐的方法、电子设备和存储介质 |
CN111339429A (zh) * | 2020-03-27 | 2020-06-26 | 上海景域智能科技有限公司 | 一种资讯推荐方法 |
CN111339429B (zh) * | 2020-03-27 | 2022-09-13 | 上海景域智能科技有限公司 | 一种资讯推荐方法 |
CN111666522A (zh) * | 2020-06-10 | 2020-09-15 | 创新奇智(上海)科技有限公司 | 信息处理方法、装置、设备和存储介质 |
CN111737582A (zh) * | 2020-07-29 | 2020-10-02 | 腾讯科技(深圳)有限公司 | 一种内容推荐方法及装置 |
CN111737582B (zh) * | 2020-07-29 | 2020-12-08 | 腾讯科技(深圳)有限公司 | 一种内容推荐方法及装置 |
CN112070586A (zh) * | 2020-09-09 | 2020-12-11 | 腾讯科技(深圳)有限公司 | 基于语义识别的物品推荐方法、装置、计算机设备及介质 |
CN112070586B (zh) * | 2020-09-09 | 2023-11-28 | 腾讯科技(深圳)有限公司 | 基于语义识别的物品推荐方法、装置、计算机设备及介质 |
CN112508611A (zh) * | 2020-12-11 | 2021-03-16 | 江苏云柜网络技术有限公司 | 一种快递柜即时竞价动态展示广告的方法 |
CN112990984A (zh) * | 2021-04-19 | 2021-06-18 | 广州欢网科技有限责任公司 | 一种广告视频推荐方法、装置、设备及存储介质 |
CN114422835A (zh) * | 2021-12-29 | 2022-04-29 | 上海数即数据科技有限公司 | 一种基于大数据分析的广告定向推广平台 |
Also Published As
Publication number | Publication date |
---|---|
CN104965889B (zh) | 2017-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104965889A (zh) | 内容推荐方法及装置 | |
JP5984834B2 (ja) | ウェブサイト横断情報を表示する方法およびシステム | |
CN106326391B (zh) | 多媒体资源推荐方法及装置 | |
CN105512331A (zh) | 一种视频推荐方法及装置 | |
CN105488233A (zh) | 阅读信息推荐方法和系统 | |
CN105718184A (zh) | 一种数据处理方法和装置 | |
CN109872796A (zh) | 一种菜谱推荐方法和装置 | |
CN108260008A (zh) | 一种视频推荐方法、装置及电子设备 | |
CN103984741A (zh) | 用户属性信息提取方法及其系统 | |
CN110111167A (zh) | 一种确定推荐对象的方法和装置 | |
CN107332905A (zh) | 信息推送方法、装置及服务器 | |
CN107545491A (zh) | 一种推荐信息的数据处理方法和装置 | |
CN112100221A (zh) | 一种资讯推荐方法、装置、推荐服务器及存储介质 | |
US10169798B2 (en) | Automatic selection of featured product groups within a product search engine | |
CN106202513A (zh) | 浏览器的浏览主站推荐方法和装置 | |
CN110570271A (zh) | 信息推荐方法、装置、电子设备及可读存储介质 | |
CN104331429B (zh) | 对网络对象进行多特征维度量化的方法及装置 | |
CN112711706A (zh) | 信息交互方法、装置、可读存储介质和电子设备 | |
CN110399527B (zh) | 影视推荐方法、装置及存储介质 | |
CN115860869A (zh) | 店铺信息推荐方法、设备及存储介质 | |
CN106326312A (zh) | 信息显示方法、装置及系统 | |
CN110309361B (zh) | 一种视频评分的确定方法、推荐方法、装置及电子设备 | |
CN108763318B (zh) | 物品推荐方法和装置 | |
CN104050198B (zh) | 一种网页信息的识别方法及装置 | |
CN109583922B (zh) | 分析购买需求的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |