CN108256010A - 内容推荐方法及装置 - Google Patents

内容推荐方法及装置 Download PDF

Info

Publication number
CN108256010A
CN108256010A CN201810005605.8A CN201810005605A CN108256010A CN 108256010 A CN108256010 A CN 108256010A CN 201810005605 A CN201810005605 A CN 201810005605A CN 108256010 A CN108256010 A CN 108256010A
Authority
CN
China
Prior art keywords
information
content
content information
key word
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810005605.8A
Other languages
English (en)
Inventor
郭晓波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201810005605.8A priority Critical patent/CN108256010A/zh
Publication of CN108256010A publication Critical patent/CN108256010A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书披露的实施例提供一种内容推荐方法,该方法包括:根据新产生的第一内容信息,确定该内容信息的关键词信息,以及从多个第二内容信息中确定与该关键词信息匹配的至少一个第三内容信息,然后确定第一内容信息和至少一个第三内容信息中各个第三内容信息的相似度,并根据该相似度确定与第一内容信息相关的第一内容推荐信息,和/或确定与各个第三内容信息相关的第三内容推荐信息。

Description

内容推荐方法及装置
技术领域
本说明书披露的多个实施例涉及互联网技术领域,尤其涉及一种内容推荐方法及装置。
背景技术
随着互联网技术的发展,人们越来越频繁地浏览网络平台提供的内容信息。例如,在网络购物平台中浏览商品信息,或者在新闻平台浏览热点信息,或者在理财平台浏览理财资讯,或者视频网站浏览广告信息等。
不同用户在使用同一网络平台时,对其提供的内容信息的需求有着或多或少的差异。另一方面,网络平台中信息的海量增长也常常让用户难以选择。为了提升用户体验,往往根据用户过去的历史行为,向用户推荐有可能感兴趣的内容。但是这样的方式由于不够及时等不足,难以满足用户要求。因此,需要提供一种合理的方法,以满足用户浏览网络平台中提供的内容信息的多种需求。
发明内容
本说明书描述了一种内容推荐方法及装置,通过根据新产生的第一内容信息,确定该内容信息的关键词信息,以及从多个第二内容信息中确定与该关键词信息匹配的第三内容信息,然后确定第一内容信息和第三内容信息的相似度,并根据该相似度确定与第一内容信息相关的第一内容推荐信息,和/或确定与第三内容信息相关的第三内容推荐信息,从而实现在预定时限内向用于准确推荐最新的内容推荐信息。
第一方面,提供了一种内容推荐方法。该方法包括:
获取新产生的第一内容信息,以及确定所述第一内容信息的关键词信息;
至少根据预先存储的所述关键词信息与多个第二内容信息的映射关系,从所述多个第二内容信息中确定与所述关键词信息匹配的至少一个第三内容信息;
确定所述第一内容信息与所述至少一个第三内容信息中的各个第三内容信息的相似度;
根据所述相似度,确定与所述第一内容信息相关的第一内容推荐信息,和/或确定与所述各个第三内容信息相关的第三内容推荐信息。
在一种可能的实施方式中,所述关键词信息包括关键词的权重值,所述从所述多个第二内容信息中确定与所述关键词信息匹配的至少一个第三内容信息,包括:
确定所述多个第二内容信息中的各个第二内容信息中包括的所述关键词的权重值;
当所述权重值不小于预设值时,将该第二内容信息作为所述至少一个第三内容信息。
在一种可能的实施方式中,所述关键词信息包括第一关键词信息和第二关键词信息,所述从所述多个第二内容信息中确定与所述关键词信息匹配的至少一个第三内容信息,包括:
从所述多个第二内容信息中确定与所述第一关键词信息匹配的第一候选内容信息,以及与所述第二关键词信息匹配的第二候选内容信息;
将所述第一候选内容信息和所述第二候选内容信息的交集或并集作为所述至少一个第三内容信息。
在一种可能的实施方式中,所述确定所述第一内容信息与所述至少一个第三内容信息中的各个第三内容信息的相似度,包括:
通过余弦相似度模型或者皮尔森相关系数模型,确定所述相似度。
在一种可能的实施方式中,所述确定与所述第一内容信息相关的第一内容推荐信息,包括:
当所述相似度不小于预设值时,将与所述相似度对应的第三内容信息作为所述第一内容推荐信息。
在一种可能的实施方式中,所述确定与所述第一内容信息相关的第一内容推荐信息,包括:
根据所述相似度,对所述至少一个第三内容信息中的各个第三内容信息进行排名;
根据所述排名结果,将名次在预设范围内的第三内容信息作为所述第一内容推荐信息。
在一种可能的实施方式中,所述确定与所述各个第三内容信息相关的第三内容推荐信息,包括:
当所述相似度不小于预设值时,将所述第一内容信息作为所述第三内容推荐信息。
在一种可能的实施方式中,所述确定与所述各个第三内容信息相关的第三内容推荐信息,包括:
根据所述相似度,确定所述第一内容信息在与所述各个第三内容信息相关的内容信息中的排名;
当所述排名在预设排名范围内时,将所述第一内容信息作为所述第三内容推荐信息。
在一种可能的实施方式中,所述关键词信息包括一元分词信息、二元分词信息、三元分词信息、标签信息和类目信息中的至少一种。
第二方面,提供了一种内容推荐装置。该装置包括:
获取单元,用于获取新产生的第一内容信息,以及确定所述第一内容信息的关键词信息;
处理单元,用于至少根据预先存储的所述关键词信息与多个第二内容信息的映射关系,从所述多个第二内容信息中确定与所述关键词信息匹配的至少一个第三内容信息;
计算单元,用于确定所述第一内容信息与所述至少一个第三内容信息中的各个第三内容信息的相似度;
第一确定单元,用于根据所述相似度,确定与所述第一内容信息相关的第一内容推荐信息;
第二确定单元,用于确定与所述各个第三内容信息相关的第三内容推荐信息。
在一种可能的设计中,所述获取单元确定的关键词信息包括关键词的权重值,所述处理单元具体用于:
确定所述多个第二内容信息中的各个第二内容信息中包括的所述关键词的权重值;
当所述权重值不小于预设值时,将该第二内容信息作为所述至少一个第三内容信息。
在一种可能的设计中,所述获取单元确定的关键词信息包括第一关键词信息和第二关键词信息,所述处理单元具体用于:
从所述多个第二内容信息中确定与所述第一关键词信息匹配的第一候选内容信息,以及与所述第二关键词信息匹配的第二候选内容信息;
将所述第一候选内容信息和所述第二候选内容信息的交集或并集作为所述至少一个第三内容信息。
在一种可能的设计中,所述计算单元具体用于:
通过余弦相似度模型或者皮尔森相关系数模型,确定所述相似度。
在一种可能的设计中,所述第一确定单元具体用于:
当所述相似度不小于预设值时,将与所述相似度对应的第三内容信息作为所述第一内容推荐信息。
在一种可能的设计中,所述第一确定单元具体用于:
根据所述相似度,对所述至少一个第三内容信息中的各个第三内容信息进行排名;
根据所述排名结果,将名次在预设范围内的第三内容信息作为所述第一内容推荐信息。
在一种可能的设计中,所述第二确定单元具体用于:
当所述相似度不小于预设值时,将所述第一内容信息作为所述第三内容推荐信息。
在一种可能的设计中,所述第二确定单元具体用于:
根据所述相似度,确定所述第一内容信息在与所述各个第三内容信息相关的内容信息中的排名;
当所述排名在预设排名范围内时,将所述第一内容信息作为所述第三内容推荐信息。
在一种可能的设计中,所述获取单元确定的关键词信息包括一元分词信息、二元分词信息、三元分词信息、标签信息和类目信息中的至少一种。
第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序。当所述计算机程序在计算机中执行时,令计算机执行上述第一方面中任一种实施方式提供的方法。
第四方面,提供了一种计算设备,包括存储器和处理器。所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现上述第一方面中任一种实施方式提供的方法。
本说明书提供的一种内容推荐方法及装置,首先确定新产生的第一内容信息的关键词信息,从多个第二内容信息中确定与该关键词信息匹配的至少一个第三内容信息,然后确定第一内容信息和至少一个第三内容信息中各个第三内容信息的相似度,并根据该相似度确定与第一内容信息相关的第一内容推荐信息,以及与各个第三内容信息相关的第三内容推荐信息,通过这样的方式,实现向用户快速、全面、准确地提供最新的内容推荐信息。
附图说明
为了更清楚地说明本说明书披露的多个实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书披露的多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本说明书披露的一个实施例提供的一种内容推荐方法的流程图;
图2为本说明书披露的一个实施例提供的一种内容推荐装置的结构图。
具体实施方式
下面结合附图,对本说明书披露的多个实施例进行描述。
图1为本说明书披露的一个实施例提供的一种内容推荐方法的流程图。所述方法的执行主体可以为具有处理能力的设备:服务器或者系统或者装置。如图1所示,所述方法具体包括:
步骤S110,获取新产生的第一内容信息,以及确定第一内容信息的关键词信息。
具体地,第一内容信息为网络平台中新产生或新出现的内容信息。在一个实施例中,第一内容信息为用户新发布的内容信息。在另一实施例中,第一内容信息为网络平台服务方根据采集的数据生成的内容信息。第一内容信息可以包括图文信息(如,图片、文章等)或音视频信息(如,音频、视频广告等)。确定第一内容信息的关键词信息,可以包括:确定第一内容信息的文本信息,并根据文本信息确定关键词信息。
在一个实施例中,第一内容信息包括视频广告,此时,可以从视频中提取文字信息以及将其中的音频信息转化为文字信息,并根据其中的文字信息确定视频广告的关键词信息;或者,第一内容信息包括视频广告和该视频广告的文本介绍信息,则可以根据文本介绍信息确定视频广告的关键词信息。
在另一个实施例中,第一内容信息包括文章,此时,可以直接确定该文章中的关键词信息。
关键词信息可以包括一元分词信息(unigram)、二元分词信息(bigram)、三元分词信息(trigram)、标签信息(tag)和类目信息(category)等。其中,一元分词信息可以包括内容信息中的单个的汉字,如支、付、宝等。二元分词信息可以包括内容信息中连续的两个汉字,如:支付、付宝等,三元分词信息包括内容信息中连续的三个汉字,如支付宝等。标签信息可以包括内容信息的创建者为该内容信息定义的便于用户搜索的关键词信息,如财经、运动、音乐、育儿等。类目信息可以包括内容信息所对应的类别信息,如股票、基金、足球、摇滚、吉他等。
在一个实施例中,在获取新产生的第一内容信息后,可以通过关键词提取平台(Key-Extraction),提取第一内容信息的关键词信息。现有技术中,已经存在多种确定和提取关键词的算法,上述关键词提取平台可以根据需要,采用适当的方式进行关键词的提取。
在一个例子中,第一内容信息为一篇财经资讯,通过关键词提取平台提取的第一内容信息的关键词信息可以包括:一元分词信息(例如,股、权)、二元分词信息(例如,云锋、资本、协议、传媒、体育、战略、)、三元分词信息(例如,合伙人、互联网、出资额、高科技)、标签信息(例如,投资、泛海控股)、类目信息(例如,基金)等。
步骤S120,至少根据预先存储的关键词信息与多个第二内容信息的映射关系,从多个第二内容信息中确定与关键词信息匹配的至少一个第三内容信息。
具体地,服务器可以预先对网络平台中的各种内容信息进行分析,从中提取出相应的关键词,进而建立内容信息与关键词的映射关系。根据该映射关系,可以从关键词反向定位出对应的内容信息。在此将与步骤S110中提取的关键词相对应的内容信息称为第二内容信息。相应地,服务器可以根据该映射关系从多个第二内容信息中确定与关键词信息匹配的至少一个第三内容信息。
通过采用这种方式,根据服务器中预先存储的多个关键词信息与多个内容信息的映射关系,可以从预先存储的所有内容信息中、快速定位出与第一内容信息的关键词信息具有映射关系的多个第二内容信息,然后从多个第二内容信息中确定与关键词信息匹配的至少一个第三内容信息,以避免在确定第三内容信息时对第一内容信息和服务器中预先存储的所有内容信息进行全量计算,从而大幅度减小服务器或系统的性能消耗。
在一个实施例中,映射关系可以体现为映射表,映射表中可以包括多个关键词信息中每个关键词信息对应的内容列表,内容列表中包括多个第二内容信息。
在一个例子中,在预先存储的包括第一内容信息的关键词信息和多个第二内容信息的映射关系的映射表中,涉及该关键词信息和多个第二内容信息的部分可以如表1所示,其中Cn(n=1,…,100)表示多个第二内容信息中的第n个第二内容信息。
表1
在一个实施例中,从多个第二内容信息中确定与关键词信息匹配的至少一个第三内容信息,可以包括:将多个第二内容信息作为与关键词信息匹配的至少一个第三内容信息。
在一个例子中,第一内容信息的关键词信息如表1中所示,相应地,可以将表1中包括的多个第二内容信息(如,C1-C100)作为第三内容信息。
在另一个实施例中,关键词信息包括关键词的权重值。关键词的权重值可以通过多种方式确定。例如,在一个例子中,对于n元分词类的关键词,其权重值可以基于该关键词在对应内容信息中的词频而确定。对于标签类的关键词,其权重值可以按照创建者的定义而确定。相应地,从多个第二内容信息中确定第三内容信息的方式可以包括:确定多个第二内容信息中的各个第二内容信息中包括的关键词的权重值;当权重值不小于预设值时,将该第二内容信息作为至少一个第三内容信息。
在一个例子中,第一内容的关键词信息如表1中所示,多个第二内容信息为表1中的C1-C100。此时,可以确定各个第二内容信息中包括的关键词的权重值,例如,对于标签信息“投资”,C1和C99中“投资”的权重分别为0.2和0.05。假定与“投资”对应的预设值为0.1,相应地,可以将C1作为第三内容信息,而不将C99作为第三内容信息。
在还一个实施例中,关键词信息可以包括第一关键词信息和第二关键词信息。相应地,可以从多个第二内容信息中确定与第一关键词信息匹配的第一候选内容信息,以及与第二关键词信息匹配的第二候选内容信息。并将第一候选内容信息和第二候选内容信息的交集或并集作为至少一个第三内容信息。
在一个例子中,第一内容的关键词信息如表1中所示,表1中包括多个关键词信息。此时,可以将与多个关键词信息中每个关键词对应的内容列表,作为与该关键词匹配的候选内容信息,并将这些候选内容信息的并集作为第三内容信息,如,C1-C100。或者,将这些候选内容信息的交集作为第三内容信息,如,C1-C90。
在另一个例子中,第一内容的关键词信息如表1中所示,表1中包括多个关键词信息。例如,第一关键词信息包括标签信息“投资”和与之对应的权重的预设值0.2;第二关键词信息包括类目信息“基金”和与之对应的权重的预设值0.1。相应地,根据表1中的映射关系,假定确定出的第一候选内容信息为C1-C20,第二候选内容信息为C1-C50,那么在一个例子中,可以将C1-C20和C1-C50的交集C1-C20作为第三内容信息。
可以理解,在根据内容信息与关键词的映射关系确定出第二内容信息之后,可以根据业务的需要,通过各种方式从上述第二内容信息中确定出第三内容信息,而并不限于以上举例的方式。
在确定与第一内容信息的关键词信息匹配的至少一个第三内容信息后,接着,在步骤S130,确定第一内容信息与至少一个第三内容信息中的各个第三内容信息的相似度。
具体地,根据第一内容信息的关键词信息构建第一关键词特征向量,以及根据第三内容信息的关键词信息构建第三关键词特征向量(或者,获取预先存储的第三关键词特征向量)。然后,利用相似度算法计算第一关键词特征向量和第三关键词特征向量的相似度。其中相似度算法可以包括余弦相似度模型或者皮尔森相关系数模型。
在一个实施例中,关键词特征向量可以表示为:V={F1,F2,…,Fk,…,FN},其中Fk={s1,s2,…,si,…,sn},Fk表示关键词信息的类别,如一元分词信息、二元分析信息、三元分词信息、标签信息和类目信息等;si表示对应的关键词信息的类别下的关键词信息,如一元分词信息中的股、权等,si在Fk中可以按照si的权重从大到小进行排序。
在一个实施例中,相似度算法可以包括余弦相似度模型。例如,第一关键词特征向量可以表示为V0={A1,A2,…,Ak,…,AN},与至少一个第三内容信息中第i(i≥1)个第三内容信息对应的第三关键词特征向量可以表示为Vi={B1,B2,…,Bk,…,BN},此时,可以使用包括以下公式的余弦相似度模型,计算第一关键词特征向量和各个第三关键词特征向量的相似度。
式(1)中,sim(V0,Vi)表示V0和Vi的相似度,表示的的平均值。
步骤S140,根据相似度,确定与第一内容信息相关的第一内容推荐信息,和/或确定与各个第三内容信息相关的第三内容推荐信息。
具体地,可以根据第一内容信息与各个第三内容信息的相似度,确定与第一内容信息相关的第一内容推荐信息,和/或确定与各个第三内容信息相关的第三内容推荐信息。
在一个实施例中,确定与第一内容信息相关的第一内容推荐信息,可以包括:当相似度不小于预设值时,将与该相似度对应的第三内容信息作为第一内容推荐信息。
预设值可以根据与第一内容信息相关的业务规则进行设定,例如,第一内容信息属于理财类资讯,其业务规则可以包括向用户推荐与第一内容信息的相似度高于0.6的内容信息。又例如,第一内容信息属于运动栏目,其业务规则可以包括向用户推荐与第一内容信息的相似度高于0.8的内容信息。
在一个例子中,相似度的预设值为0.6,第三内容信息包括C1-C50,其中C1-C10与第一内容信息的相似度为0.8(>0.6),C20-C50与第一内容信息的相似度为0.4(<0.6)。相应地,可以将第三内容信息中的C1-C10作为第一内容推荐信息。
在另一个实施例中,确定与第一内容信息相关的第一内容推荐信息,可以包括:根据相似度,对至少一个第三内容信息中的各个第三内容信息进行排名。根据排名结果,将名次在预设范围内的第三内容信息作为第一内容推荐信息。
预设范围可以根据与第一内容信息相关的业务规则进行设定,例如,第一内容信息属于科技资讯,其业务规则可以包括向用户推荐与第一内容信息的相似度排在前五位的内容信息。又例如,第一内容信息属于音乐栏目,其业务规则可以包括向用户推荐与第一内容信息的相似度排在前十位的内容信息。
在一个例子中,名次的预设范围为前十,第三内容信息中一共包括50个内容信息。相应地,根据这50个内容信息的相似度,对这50个内容信息进行排名,并选取排在前十位的内容信息作为第一内容推荐信息。
在又一个实施例中,确定与第三内容信息相关的第三内容推荐信息,可以包括:当相似度不小于预设值时,将第一内容信息作为第三内容推荐信息。
在一个例子中,相似度的预设值为0.6,第一内容信息与第三内容信息的相似度为0.7(>0.6)。相应地,可以将第一内容信息作为第三内容推荐信息。
在另一个例子中,相似度的预设值为0.8,第一内容信息与第三内容信息的相似度为0.7(<0.8)。相应地,可以不将第一内容信息作为第三内容推荐信息。
在还一个实施例中,确定与各个第三内容信息相关的第三内容推荐信息,包括:根据相似度,确定第一内容信息在与各个第三内容信息相关的内容信息中的排名。当排名在预设排名范围内时,将第一内容信息作为该第三内容推荐信息。
在一个例子中,名词的预设范围为前十,可以确定第一内容信息在与各个第三内容信息相关的内容信息中的排名为第五(在前十以内)。相应地,可以将第一内容信息作为第三内容推荐信息。
在另一个例子中,名词的预设范围为前五,可以确定第一内容信息在与各个第三内容信息相关的内容信息中的排名为第六(不在前五以内)。相应地,可以不将第一内容信息作为第三内容推荐信息。
需要说明的是,在步骤S140之后,还可以包括:根据第一(或第三)内容推荐信息,向用户进行内容信息的推荐。
在一个实施例中,根据第一(或第三)内容推荐信息,向用户进行内容信息的推荐,可以包括:结合用户对第一(或第三)内容推荐信息中各个内容信息的点击及评分情况,进一步确定向用户推荐的与第一(或第三)内容信息相关的内容推荐信息。例如,将第一(或第三)内容推荐信息中用户浏览过的内容推荐信息靠后显示。
在另一个实施例中,当用户对第一(或第三)内容信息进行搜索时,可以在搜索结果中显示第一(或第三)内容推荐信息。
在又一个实施例中,在用户点击第一(或第三)内容信息后,可以在第一(或第三)内容信息所述的栏目中向用户推荐第一(或第三)内容推荐信息。
此外,上述多个实施例中披露的内容推荐方法,可以基于Dump流实现。Dump流是在ASDI(AI Search Data Ingestion)平台上所构建的一种具体业务的计算容器。其中ASDI是一种实时数据处理平台,主要完成从数据源到最终存储之间的数据通路,目前支持数据全量、实时导入,支持多表连接(join),支持业务方定制插件进行业务处理。
通过Dump流的方式实施上述内容推荐方法,可以实现在预定时限(如,在接收用户的内容服务请求后的1min、1s之内)内向用户进行全面、准确的内容推荐。
由上可知,在本说明书披露的多个实施例提供的内容推荐方法中,首先确定新产生的第一内容信息的关键词信息,从多个第二内容信息中确定与该关键词信息匹配的至少一个第三内容信息,然后确定第一内容信息和至少一个第三内容信息中各个第三内容信息的相似度,并根据该相似度确定与第一内容信息相关的第一内容推荐信息,以及与各个第三内容信息相关的第三内容推荐信息,通过这样的方式,实现向用户快速、全面、准确地提供最新的内容推荐信息。此外,通过Dump流的方式,可以实现在预定时限(如1s、1ms内)内响应用户的内容服务请求、快速向用户推荐内容信息。
与内容推荐方法对应地,本说明书披露的多个实施例还提供一种内容推荐装置,如图2所示,该装置200包括:
获取单元210,用于获取新产生的第一内容信息,以及确定第一内容信息的关键词信息。
处理单元220,用于至少根据预先存储的关键词信息与多个第二内容信息的映射关系,从多个第二内容信息中确定与关键词信息匹配的至少一个第三内容信息;
计算单元230,用于确定第一内容信息与至少一个第三内容信息中的各个第三内容信息的相似度;
第一确定单元240,用于根据相似度,确定与第一内容信息相关的第一内容推荐信息;
第二确定单元250,用于确定与各个第三内容信息相关的第三内容推荐信息。
在一个可能的实施方式中,获取单元210确定的关键词信息包括关键词的权重值,处理单元220具体用于:
确定多个第二内容信息中的各个第二内容信息中包括的关键词的权重值;
当权重值不小于预设值时,将该第二内容信息作为至少一个第三内容信息。
在一个可能的实施方式中,获取单元210确定的关键词信息包括第一关键词信息和第二关键词信息,处理单元220具体用于:
从多个第二内容信息中确定与第一关键词信息匹配的第一候选内容信息,以及与第二关键词信息匹配的第二候选内容信息;
将第一候选内容信息和第二候选内容信息的交集或并集作为至少一个第三内容信息。
在一个可能的实施方式中,计算单元230具体用于:
通过余弦相似度模型或者皮尔森相关系数模型,确定相似度。
在一个可能的实施方式中,第一确定单元240具体用于:
当相似度不小于预设值时,将与相似度对应的第三内容信息作为第一内容推荐信息。
在一个可能的实施方式中,第一确定单元240具体用于:
根据相似度,对至少一个第三内容信息中的各个第三内容信息进行排名;
根据排名结果,将名次在预设范围内的第三内容信息作为第一内容推荐信息。
在一个可能的实施方式中,第二确定单元250具体用于:
当相似度不小于预设值时,将第一内容信息作为第三内容推荐信息。
在一个可能的实施方式中,第二确定单元250具体用于:
根据相似度,确定第一内容信息在与各个第三内容信息相关的内容信息中的排名;
当排名在预设排名范围内时,将第一内容信息作为第三内容推荐信息。
在一个可能的实施方式中,获取单元210确定的关键词信息包括一元分词信息、二元分词信息、三元分词信息、标签信息和类目信息中的至少一种。
由上可知,在本说明书披露的多个实施例提供的内容推荐装置中,获取单元210根据新产生的第一内容信息,确定该内容信息的关键词信息,处理单元220从多个第二内容信息中确定与该关键词信息匹配的至少一个第三内容信息,计算单元230确定第一内容信息和至少一个第三内容信息中各个第三内容信息的相似度,第一确定单元240根据该相似度确定与第一内容信息相关的第一内容推荐信息,第二确定单元250确定与各个第三内容信息相关的第三内容推荐信息,通过这样的方式,实现向用户快速、全面、准确地提供最新的内容推荐信息。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本说明书披露的多个实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
以上所述的具体实施方式,对本说明书披露的多个实施例的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本说明书披露的多个实施例的具体实施方式而已,并不用于限定本说明书披露的多个实施例的保护范围,凡在本说明书披露的多个实施例的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本说明书披露的多个实施例的保护范围之内。

Claims (18)

1.一种内容推荐方法,其特征在于,包括:
获取新产生的第一内容信息,以及确定所述第一内容信息的关键词信息;
至少根据预先存储的所述关键词信息与多个第二内容信息的映射关系,从所述多个第二内容信息中确定与所述关键词信息匹配的至少一个第三内容信息;
确定所述第一内容信息与所述至少一个第三内容信息中的各个第三内容信息的相似度;
根据所述相似度,确定与所述第一内容信息相关的第一内容推荐信息,和/或确定与所述各个第三内容信息相关的第三内容推荐信息。
2.根据权利要求1所述的方法,其特征在于,所述关键词信息包括关键词的权重值,所述从所述多个第二内容信息中确定与所述关键词信息匹配的至少一个第三内容信息,包括:
确定所述多个第二内容信息中的各个第二内容信息中包括的所述关键词的权重值;
当所述权重值不小于预设值时,将该第二内容信息作为所述至少一个第三内容信息。
3.根据权利要求1所述的方法,其特征在于,所述关键词信息包括第一关键词信息和第二关键词信息,所述从所述多个第二内容信息中确定与所述关键词信息匹配的至少一个第三内容信息,包括:
从所述多个第二内容信息中确定与所述第一关键词信息匹配的第一候选内容信息,以及与所述第二关键词信息匹配的第二候选内容信息;
将所述第一候选内容信息和所述第二候选内容信息的交集或并集作为所述至少一个第三内容信息。
4.根据权利要求1所述的方法,其特征在于,所述确定所述第一内容信息与所述至少一个第三内容信息中的各个第三内容信息的相似度,包括:
通过余弦相似度模型或者皮尔森相关系数模型,确定所述相似度。
5.根据权利要求1所述的方法,其特征在于,所述确定与所述第一内容信息相关的第一内容推荐信息,包括:
当所述相似度不小于预设值时,将与所述相似度对应的第三内容信息作为所述第一内容推荐信息。
6.根据权利要求1所述的方法,其特征在于,所述确定与所述第一内容信息相关的第一内容推荐信息,包括:
根据所述相似度,对所述至少一个第三内容信息中的各个第三内容信息进行排名;
根据所述排名结果,将名次在预设范围内的第三内容信息作为所述第一内容推荐信息。
7.根据权利要求1所述的方法,其特征在于,所述确定与所述各个第三内容信息相关的第三内容推荐信息,包括:
当所述相似度不小于预设值时,将所述第一内容信息作为所述第三内容推荐信息。
8.根据权利要求1所述的方法,其特征在于,所述确定与所述各个第三内容信息相关的第三内容推荐信息,包括:
根据所述相似度,确定所述第一内容信息在与所述各个第三内容信息相关的内容信息中的排名;
当所述排名在预设排名范围内时,将所述第一内容信息作为所述第三内容推荐信息。
9.根据权利要求1-8任一项所述的方法,其特征在于,所述关键词信息包括一元分词信息、二元分词信息、三元分词信息、标签信息和类目信息中的至少一种。
10.一种内容推荐装置,其特征在于,包括:
获取单元,用于获取新产生的第一内容信息,以及确定所述第一内容信息的关键词信息;
处理单元,用于至少根据预先存储的所述关键词信息与多个第二内容信息的映射关系,从所述多个第二内容信息中确定与所述关键词信息匹配的至少一个第三内容信息;
计算单元,用于确定所述第一内容信息与所述至少一个第三内容信息中的各个第三内容信息的相似度;
第一确定单元,用于根据所述相似度,确定与所述第一内容信息相关的第一内容推荐信息;
第二确定单元,用于确定与所述各个第三内容信息相关的第三内容推荐信息。
11.根据权利要求10所述的装置,其特征在于,所述获取单元确定的关键词信息包括关键词的权重值,所述处理单元具体用于:
确定所述多个第二内容信息中的各个第二内容信息中包括的所述关键词的权重值;
当所述权重值不小于预设值时,将该第二内容信息作为所述至少一个第三内容信息。
12.根据权利要求10所述的装置,其特征在于,所述获取单元确定的关键词信息包括第一关键词信息和第二关键词信息,所述处理单元具体用于:
从所述多个第二内容信息中确定与所述第一关键词信息匹配的第一候选内容信息,以及与所述第二关键词信息匹配的第二候选内容信息;
将所述第一候选内容信息和所述第二候选内容信息的交集或并集作为所述至少一个第三内容信息。
13.根据权利要求10所述的装置,其特征在于,所述计算单元具体用于:
通过余弦相似度模型或者皮尔森相关系数模型,确定所述相似度。
14.根据权利要求10所述的装置,其特征在于,所述第一确定单元具体用于:
当所述相似度不小于预设值时,将与所述相似度对应的第三内容信息作为所述第一内容推荐信息。
15.根据权利要求10所述的装置,其特征在于,所述第一确定单元具体用于:
根据所述相似度,对所述至少一个第三内容信息中的各个第三内容信息进行排名;
根据所述排名结果,将名次在预设范围内的第三内容信息作为所述第一内容推荐信息。
16.根据权利要求10所述的装置,其特征在于,所述第二确定单元具体用于:
当所述相似度不小于预设值时,将所述第一内容信息作为所述第三内容推荐信息。
17.根据权利要求10所述的装置,其特征在于,所述第二确定单元具体用于:
根据所述相似度,确定所述第一内容信息在与所述各个第三内容信息相关的内容信息中的排名;
当所述排名在预设排名范围内时,将所述第一内容信息作为所述第三内容推荐信息。
18.根据权利要求10-17任一项所述的装置,其特征在于,所述获取单元确定的关键词信息包括一元分词信息、二元分词信息、三元分词信息、标签信息和类目信息中的至少一种。
CN201810005605.8A 2018-01-03 2018-01-03 内容推荐方法及装置 Pending CN108256010A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810005605.8A CN108256010A (zh) 2018-01-03 2018-01-03 内容推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810005605.8A CN108256010A (zh) 2018-01-03 2018-01-03 内容推荐方法及装置

Publications (1)

Publication Number Publication Date
CN108256010A true CN108256010A (zh) 2018-07-06

Family

ID=62725777

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810005605.8A Pending CN108256010A (zh) 2018-01-03 2018-01-03 内容推荐方法及装置

Country Status (1)

Country Link
CN (1) CN108256010A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112598471A (zh) * 2020-12-25 2021-04-02 北京知因智慧科技有限公司 一种产品的推荐方法、推荐装置及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103136228A (zh) * 2011-11-25 2013-06-05 阿里巴巴集团控股有限公司 一种图片搜索方法以及图片搜索装置
CN103425640A (zh) * 2012-05-14 2013-12-04 华为技术有限公司 一种多媒体问答系统及方法
CN104699696A (zh) * 2013-12-05 2015-06-10 深圳市腾讯计算机系统有限公司 文件推荐方法和装置
CN107092608A (zh) * 2016-04-16 2017-08-25 口碑控股有限公司 一种目标对象的搜索、推荐方法和设备
US20170316515A1 (en) * 2016-04-28 2017-11-02 Sanjay Varma Systems and Methods for Dynamically Identifying and Presenting Matching User Profiles to a User
CN107506459A (zh) * 2017-08-29 2017-12-22 环球智达科技(北京)有限公司 一种基于影片相似度的影片推荐方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103136228A (zh) * 2011-11-25 2013-06-05 阿里巴巴集团控股有限公司 一种图片搜索方法以及图片搜索装置
CN103425640A (zh) * 2012-05-14 2013-12-04 华为技术有限公司 一种多媒体问答系统及方法
CN104699696A (zh) * 2013-12-05 2015-06-10 深圳市腾讯计算机系统有限公司 文件推荐方法和装置
CN107092608A (zh) * 2016-04-16 2017-08-25 口碑控股有限公司 一种目标对象的搜索、推荐方法和设备
US20170316515A1 (en) * 2016-04-28 2017-11-02 Sanjay Varma Systems and Methods for Dynamically Identifying and Presenting Matching User Profiles to a User
CN107506459A (zh) * 2017-08-29 2017-12-22 环球智达科技(北京)有限公司 一种基于影片相似度的影片推荐方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112598471A (zh) * 2020-12-25 2021-04-02 北京知因智慧科技有限公司 一种产品的推荐方法、推荐装置及电子设备

Similar Documents

Publication Publication Date Title
US8352473B2 (en) Product synthesis from multiple sources
US10242105B2 (en) Comment ranking by search engine
JP5662961B2 (ja) レビュー処理方法およびシステム
CN105765573B (zh) 网站通信量优化方面的改进
Chehal et al. Implementation and comparison of topic modeling techniques based on user reviews in e-commerce recommendations
CN106959966A (zh) 一种信息推荐方法及系统
US20190332602A1 (en) Method of data query based on evaluation and device
WO2014093433A1 (en) Analyzing commodity evaluations
KR20050049750A (ko) 온라인 광고 시스템 및 방법
US10977264B2 (en) Selecting supplemental content for inclusion in a network page
JP6405343B2 (ja) 情報処理装置、情報処理方法、およびプログラム
CN105931082B (zh) 一种商品类目关键词提取方法和装置
KR20110050062A (ko) 마케팅 서비스 기능을 가지는 소셜 네트워킹 시스템 및 그 방법
KR20050050016A (ko) 온라인 광고 시스템 및 방법
CN108470289B (zh) 基于电商购物平台的虚拟物品发放方法及设备
US8903817B1 (en) Determining search relevance from user feedback
WO2020147714A1 (zh) 一种可配送实体的推送方法以及装置
CN108256010A (zh) 内容推荐方法及装置
CN111737607A (zh) 数据处理方法、装置、电子设备以及存储介质
US20150348098A1 (en) Identifying A Product Placement Opportunity Within A Screenplay
CN110909154A (zh) 摘要生成方法及装置
CN110827063A (zh) 一种多策略融合的商品推荐方法、装置、终端及存储介质
JP2017097512A (ja) 動画広告配信サーバおよびプログラム
CN118195744B (zh) 一种用于跨境电商平台的客户分析系统
WO2023079703A1 (ja) 処理実行システム、処理実行方法、及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1256509

Country of ref document: HK

TA01 Transfer of patent application right

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20180706

RJ01 Rejection of invention patent application after publication