CN109977316A - 一种并行式文章推荐方法、装置、设备及存储介质 - Google Patents

一种并行式文章推荐方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN109977316A
CN109977316A CN201910251343.8A CN201910251343A CN109977316A CN 109977316 A CN109977316 A CN 109977316A CN 201910251343 A CN201910251343 A CN 201910251343A CN 109977316 A CN109977316 A CN 109977316A
Authority
CN
China
Prior art keywords
article
user
recommendation
list
parallel type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910251343.8A
Other languages
English (en)
Inventor
陈滨
梁晓斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Armored Network Co Ltd
Original Assignee
Xiamen Armored Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Armored Network Co Ltd filed Critical Xiamen Armored Network Co Ltd
Priority to CN201910251343.8A priority Critical patent/CN109977316A/zh
Publication of CN109977316A publication Critical patent/CN109977316A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种并行式文章推荐方法、装置、设备及存储介质,涉及信息技术领域。根据用户的历史浏览文章,构建用户结构化模型;根据用户结构化模型以及预设的至少两种推荐算法,获得对应于用户的至少两种文章推荐算法;分别将待推荐的文章通过至少两种文章推荐算法,获得与每种文章推荐算法对应的推荐文章列表;根据至少两种文章推荐算法的预设权重值,从每个文章推荐列表选取预定的文章,以混合生成相应于所述用户的最终推荐文章列表。本发明采用并行式混合并行式文章推荐方法,保证了推荐出的文章数据集合了所有文章推荐算法的推荐的优点,弥补了单项推荐的不足,使得推荐文章数据更加的准确有效。

Description

一种并行式文章推荐方法、装置、设备及存储介质
技术领域
本发明涉及信息技术领域,具体而言,涉及一种并行式文章推荐方法、装置、设备及存储介质。
背景技术
随着互联网的快速发展,人们每天需要面对大量的信息,为了让用户能够准确阅读到用户感兴趣的文章,从而提高用户粘性,推荐系统服务也逐渐地被运用到资讯类网站/移动应用中。文章推荐系统可以根据资讯类网站/移动应用的用户数据与文章内容,为网站/移动应用的用户计算出文章资讯,使得用户可以不受其他多余信息的干扰,直接查看到自身感兴趣的文章资讯。目前的文章推荐系统主要采用的是基于内容的推荐算法或者协同过滤算法。
基于内容的推荐算法主要根据用户的当前及历史的行为内容通过机器学习的方法计算得出当前用户的相关内容标签,然后再根据用户的内容标签进行内容的推荐。但是基于内容的推荐只是单一的用户数据样本,尤其是针对用户行为稀少的情况下,得出的用户内容标签不够准确,精度较低。
而协同过滤算法是在基于内容算法的基础上利用其他用户的历史行为内容,即在得出当前用户的内容标签后,在数据库中进行对比,找到用户相似内容标签的其他用户,然后将其他用户感兴趣的内容推荐给当前用户。虽然协同过滤算法在一定程度上提高了推荐精度,但当用户及文章数据的增多,而且部分没有访问行为的文章就很难出现在推荐的列表中,造成文章资源分配不均,不利于文章的相应阅读推广。
因此,需研发一种推荐精度高、覆盖的文章数广的混合推荐算法用于减少单项文章推荐算法的不足,使得文章推荐更加准确且更符合相应的推荐要求。
发明内容
有鉴于此,本发明实施例的目的在于提供一种并行式文章推荐方法、装置、设备及存储介质,以改善现有技术中单项文章推荐算法的不足的问题。
本发明较佳实施例提供了一种并行式文章推荐方法,包括:
根据用户的历史浏览文章,构建用户结构化模型;
根据所述用户结构化模型以及预设的至少两种推荐算法,获得对应于所述用户的至少两种文章推荐算法;
分别将待推荐的文章通过所述至少两种文章推荐算法,获得与每种文章推荐算法对应的推荐文章列表;
根据所述至少两种文章推荐算法的预设权重值,从每个文章推荐列表选取预定的文章,以混合生成相应于所述用户的最终推荐文章列表。
优选地,根据用户的历史浏览文章,构建用户结构化模型的步骤包括:
获取用户的历史浏览文章的特征数据;
基于所述特征数据,采用机器学习的分类算法构建用户结构化模型;
储存为用户构建的所述用户结构化模型。
优选地,所述文章推荐算法包括如下中的两个:热点新闻推荐算法、基于内容的推荐算法或协同过滤算法。
优选地,所述协同过滤算法包括基于用户的协同过滤算法和基于文章的协同过滤算法。
优选地,还包括:
获取用户对生成的最终推荐文章列表中的已阅读文章;
获取已阅读文章在各个推荐文章列表中的占比以及排列位置;
根据所述占比和排列位置更新所述至少两种文章推荐算法的权重值。
本发明实施例还提供了一种并行式文章推荐装置,包括:
建模单元,用于根据用户的历史浏览文章,构建用户结构化模型;
算法单元,用于根据所述用户结构化模型以及预设的至少两种推荐算法,获得对应于所述用户的至少两种文章推荐算法;
推荐单元,用于分别将待推荐的文章通过所述至少两种文章推荐算法,获得与每种文章推荐算法对应的推荐文章列表;
混合单元,用于根据所述至少两种文章推荐算法的预设权重值,从每个文章推荐列表选取预定的文章,以混合生成相应于所述用户的最终推荐文章列表。
优选地,所述建模单元包括:
获取模块,用于获取用户的历史浏览文章的特征数据;
构建模块,用于基于所述特征数据,采用机器学习的分类算法构建用户结构化模型;
储存模块,用于储存为用户构建的所述用户结构化模型。
优选地,所述文章推荐算法包括如下中的两个:热点新闻推荐算法、基于内容的推荐算法或协同过滤算法。
本发明实施例还提供了一种并行式文章推荐设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序时实现上述的并行式文章推荐方法。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述并行式文章推荐方法的步骤。
本发明提供了一种并行式文章推荐方法、装置、设备及存储介质,通过将文章库中的文章数据分别经过至少两种不同文章推荐算法的计算得出至少两种不同推荐文章列表,再将这些推荐文章列表进行混合生成最终文章推荐列表。这种并行式混合文章推荐算法推荐出的文章集合了所用的所有文章推荐算法的推荐的优点,弥补了单项推荐的不足,避免文章都集中在有用户行为的文章上,使得推荐文章数据更加的准确有效。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明第一实施例提供的一种并行式文章推荐方法的流程图;
图2为本发明第一实施例提供的并行式文章推荐方法的原理图;
图3是本发明第二实施例提供的并行式文章推荐装置的结构示意图。
图标:201-建模单元;202-算法单元;203-推荐单元;204-混合单元。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
请参考图1及图2,本发明的第一实施例提供了一种并行式文章推荐方法,其可由并行式文章推荐设备来执行,并至少包括如下步骤:
S101,根据用户的历史浏览文章,构建用户结构化模型。
其中,在本实施例中,所述并行式文章推荐设备例如可为一个服务器或者具有数据处理和收发能力的终端,其安装有相应的计算机程序(例如一个中间件),并通过执行所述计算机程序来实现本实施例的并行式文章推荐方法。
其中,在本发明的一较佳实施例中,根据用户的历史浏览文章,构建用户结构化模型的具体步骤包括:
获取用户的历史浏览文章的特征数据;
基于所述特征数据,采用机器学习的分类算法构建用户结构化模型;
储存为用户构建的所述用户结构化模型。
其中,在本实施例中,所述并行式文章推荐设备的文章库当中的每篇文章均具备至少一个特征属性标签。具体地,在文章库中的所有文章通过预设的文章信息标签库的标签,每篇文章至少提取一个所对应的文章标签词,而后通过数值型数据归一化、非数值型数据词袋法将文章标签词转换为词特征向量,再通过TF-IDF(Term frequency-inversedocument frequency,词频-逆文件频率指数)进行内容分析,获得每篇文章的特征属性标签,而这些特征属性标签就形成每篇文章的特征数据。且随着文章信息标签库当中标签词数量和文章库文章数量的不断增加,每篇文章的特征属性标签描述也进行持续的更新。其中,TF-IDF算法是一种统计方法,一种用于信息检索与数据挖掘的常用加权技术,通过对文本数据进行数据挖掘,得到可以作为特征数据的词语,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,因此,通过TF-IDF算法对文章内容分析后获得文章的特征数据与文章内容具有更强的关联性,提高文章的特征数据的价值。
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。在本实施例中,所述并行式文章推荐设备获取每个用户的历史浏览文章的特征数据,使用机器学习的分类算法构建每个用户以文章的特征属性标签为内容的用户结构化模型,即以文章的特征数据为内容的用户结构化模型,并储存于用户结构化模型库中。而且,随着用户浏览文章数据的不断增多,机器学习还会对用户结构化模型进行持续的修正调整。其中,所述机器学习可通过分类算法如KNN(K-NearestNeighbor,邻近算法)、决策树算法等为每个用户构建用户结构化模型,但不限于此,并且这些分类算法均为现有技术,这里就不在赘述。
S102,根据所述用户结构化模型以及预设的至少两种推荐算法,获得对应于所述用户的至少两种文章推荐算法。
S103,分别将待推荐的文章通过所述至少两种文章推荐算法,获得与每种文章推荐算法对应的推荐文章列表。
S104,根据所述至少两种文章推荐算法的预设权重值,从每个文章推荐列表选取预定的文章,以混合生成相应于所述用户的最终推荐文章列表。
具体地,在本实施例中,将多个推荐文章列表根据不同文章推荐算法的预设权重值和推荐个数进行混合并生成所述最终推荐文章列表。以两种文章推荐算法生产最终推荐文章列表举例,最终文章推荐列表的推荐个数为15篇文章,运营人员可预先设定其中一种文章推荐算法生成的第一推荐文章列表文章数占最终推荐文章列表文章数的60%(权重值),另一种文章推荐算法获得的第二推荐文章列表的文章数占最终推荐文章列表文章数的40%(权重值)。因而,去除重复文章和用户已阅读过的文章,从第一推荐文章列表中抽取9篇推荐文章,第二推荐文章列表中抽取6篇推荐文章,混合成15篇推荐文章作为最终文章推荐列表输出给用户。需要说明的是,实际操作中会根据版面等不同需要来进行选择相应的文章推荐算法,并设定不同的权重值,这里不做限定。按照上述并行式混合并行式文章推荐方法推荐出的文章集合了所用的所有文章推荐算法的推荐的优点,弥补了单项推荐的不足,使得推荐文章数据更加的准确有效。
优选地,在第一实施例的基础上,在一个优选实施例中,所述文章推荐算法包括如下中的两个:热点新闻推荐算法、基于内容的推荐算法或协同过滤算法。
在本实施例中,所述热点新闻推荐算法是根据文章发表的时间及当前的热点词、文章标签来进行文章列表的选择推荐的一种算法,在本实施例中,通过热点新闻推荐算法生成推荐文章列表的步骤包括:
设置热点关键词与热点时间;
匹配所述热点关键词与文章的特征数据,生成文章样品数据;
根据文章发布时间和所述热点时间对所述文章样品数据进行排序,生成推荐文章列表。
具体地,首先运营人员对最新出现的热点进行热点关键词以及热点时间进行设置。而后,并行式文章推荐设备通过对每篇文章的特征数据与热点关键词进行匹配,获得具有热点关键词特征属性标签的文章样品数据,最后根据每篇文章的发布时间以及热点关键词出现的热点时间进行排序,从而获得推荐文章列表,该推荐文章列表内的文章数据均具有较强的实时性与热点性。
在本实施例中,基于内容的推荐算法是根据用户的当前及历史浏览文章内容通过机器学习的方法计算得出用户的相关内容标签,然后再根据用户的内容标签进行内容的推荐。
具体地,基于内容的推荐算法生成推荐文章列表的具体步骤包括:
匹配文章的特征数据与所述用户结构化模型,生成文章样品数据;其中,采用余弦相识度的公式计算所述用户结构化模型与文章的特征数据的匹配距离;
基于所述匹配距离,将文章样品数据排序、去重后生成推荐文章列表。
具体地,在本实施例中,文章库中的每篇文章的特征数据都与该用户的用户结构化模型进行匹配操作,为用户推荐一组相关性最大的文章样品数据,并生成相应的推荐文章列表。
其中所述的匹配操作主要为计算用户结构化模型与每篇文章的特征数据的匹配距离,而后根据所述匹配距离排序、去重后获得推荐文章列表。具体操作如下:将文章的特征数据(标签)用矩阵来表示,如文章Ia[1,1,0,....0,0,0],其中标签有效的为1,无效为0。而用户结构化模型也用矩阵表示,如用户Ua[0.5,x,y,......z],其中,对于标签的感兴趣度用数值表示。本实施例通过利用余弦相识度的公式来计算用户Ua与文章Ia的匹配距离,其具体公式如下所示:
Ua表示用户Ua矩阵中对应的值,例如举例的0.5;Ia表示文章Ia矩阵中对应的值,如举例中的1;余弦相识度越大说明用户越可能喜欢。通过计算出文章库中文章Ia与用户Ua的余弦相似度,从而进行降序排序,去掉用户Ua已经阅读过的文章,生成一组与用户Ua相关性最大的文章样品数据,根据预设的推荐条数生成推荐文章列表。
优选地,在上述实施例的基础上,在一个优选实施例中,所述协同过滤算法包括基于用户的协同过滤算法和基于文章的协同过滤算法。
具体地,在本实施例中,通过所述协同过滤算法获得所述推荐文章列表的具体步骤包括:
分别将待推荐的文章通过两种协同过滤算法,获得与两种协同过滤算法对应的第一列表和第二列表;
根据两种所述协同过滤算法的预设权重值,从所述第一列表和所述第二列表选取预定的文章,以混合生成相应于所述用户的推荐文章列表。
其中,基于用户的协同过滤算法是利用其他用户的历史浏览文章的特征数据,获得其他用户的结构化模型,并在用户结构化模型库中进行其他用户结构模型与当前用户结构模型之间的对比,找到与当前用户具有相似的用户结构化模型的其他用户,然后将其他用户当前及历史浏览文章推荐给当前用户。而基于文章的协同过滤算法是根据用户的历史浏览文章的特征数据,将该特征数据与文章库中所有文章的特征数据进行对比,找到与当前用户历史浏览文章相似的文章样品数据,然后推荐给当前用户。基于用户的协同过滤算法推荐的文章偏向有用户行为的文章上,而基于文章的协同过滤算法则可推荐无用户行为的文章,弥补基于用户的协同过滤算法的不足,将二者获得的推荐列表并行式混合后进行推荐,有利于增加推荐的精确度。需要说明的是,本实施例当中的第一列表和第二列表不做对应设置,可将待推荐的文章先通过基于用户的协同过滤算法,获得第一列表,则待推荐的文章先通过基于文章的协同过滤算法,获得第二列表;也可将待推荐的文章先通过基于文章的协同过滤算法,获得第一列表,则待推荐的文章先通过基于用户的协同过滤算法,获得第二列表。
为了方便,以将待推荐的文章先通过基于用户的协同过滤算法,获得第一列表,待推荐的文章先通过基于文章的协同过滤算法,获得第二列表进行实施例列举。
优选地,在本发明的一较佳实施例中,通过基于用户的协同过滤算法获得相应于所述用户的第一列表的步骤包括:
基于所述用户结构化模型,获得各个用户之间的用户相关度系数;
根据所述用户相关度系数,生成第一文章样品数据;
过滤所述第一文章样品数据中已阅读文章数据后,加权、排序生成第一列表。
其中,在本实施例中,并行式文章推荐设备将各个用户结构化模型通过皮尔逊相关度评价计算得出各个用户之间的用户相关度系数,皮尔逊相关系数计算公式如下所示,计算用户U和其他用户V之间的用户相关度系数:
根据上述公式计算结果得出的各个用户之间的用户相关度系数,通过比较用户相关度系数的数值,获得与用户U相近的其他用户列表,而后从待推荐的文章中得到其他用户列表的历史浏览文章,去除用户U已浏览的文章,剩余的文章进行加权排序,获得最适合推荐给用户U的第一列表。其中,剩余的文章通过文章系数乘以用户相关度系数的数值进行加权排序。所述文章系数为用户U相近的其他用户V对该文章的感兴趣程度,可根据其他用户V对文章的浏览、评论、点赞等行为获得文章系数,两个系数相乘获得推荐给用户U的权重,按照权重从高到低排序,得出最适合推荐给用户U的第一列表。
除此之外,在本发明的另一较佳实施例中,从待推荐的文章得到所述用户列表的历史浏览文章可先以文章发布时间、热点、标签为标准,选出具有热点效应的相关的文章样品数据;在文章样品数据去除用户已浏览的文章,剩余的文章样品数据进行加权排序,获得最适合推荐给用户的第一列表,使推荐给用户的文章具有时效性和热点性。
优选地,在本发明的另一较佳实施例中,通过基于文章的协同过滤算法获得相应于所述用户的第二列表的步骤包括:
基于用户的历史浏览文章的特征数据,获取各个文章之间的文章相关度系数;
根据所述文章相关度系数,生成第二文章样品数据;
过滤所述第二文章样品数据中已阅读文章数据后,加权、排序生成第二列表。
其中,在本实施例中,基于文章的协同过滤算法与基于用户的协同过滤算法相似,用户的历史浏览文章的特征数据和文章库中文章的特征数据通过皮尔逊相关度评价计算得出各个文章之间的文章相关度系数,而后从待推荐的文章得到与所述用户历史浏览文章相近的文章,去除用户U已浏览的文章,剩余的文章进行加权排序,获得最适合推荐给用户U的第二列表。其中,剩余的文章通过文章特征数据乘以文章相关度系数加权排序,两个系数相乘获得推荐给用户的权重,按照权重从高到低排序,得出最适合推荐给用户的第二列表。
除此之外,在本发明的另一较佳实施例中,从待推荐的文章得到与所述用户历史浏览文章相近的文章可先以文章发布时间、热点、标签为标准,选出具有热点效应的相关的文章样品数据;在文章样品数据去除用户已浏览的文章,剩余的文章样品数据进行加权排序,获得最适合推荐给用户的第二列表,使推荐给用户的文章具有时效性和热点性。
在本实施例中,基于用户的协同过滤算法和基于文章的协同过滤算法获得第一列表和第二列表,根据基于用户的协同过滤算法和基于文章的协同过滤算法的预设权重值和推荐个数进行混合并生成推荐文章列表。其混合方式与最终列表的混合方式一致,这里就不在进行赘述。本实施例提供的并行式混合协同过滤算法可提供比较丰富的类型推荐给到用户,弥补了单种协同过滤算法推荐的不足,避免文章都集中在有用户行为的文章上。
在上述实施例的基础上,在本发明一较佳实施例中,将待推荐的文章分别通过热点新闻推荐算法和协同过滤算法生成两种不同的推荐文章列表,而后将这两种推荐文章列表按照文章推荐算法的不同的权重值,混合生成最终文章推荐列表;其中,协同过滤算法包括基于用户的协同过滤算法和基于文章的协同过滤算法。这种并行式文章推荐方法一般用于首页推荐(用户兴趣及热点新闻)等。这种推荐算法可以提供比较丰富的类型推荐给到用户,弥补了单种推荐的不足,避免文章都集中在有用户行为的文章上。
在上述实施例的基础上,在一个优选实施例中,还包括:
获取用户对生成的最终推荐文章列表中的已阅读文章;
获取已阅读文章在各个推荐文章列表中的占比以及排列位置;
根据所述占比和排列位置更新所述至少两种文章推荐算法的权重值。
具体地,例如文章库的所有文章分别通多个文章推荐算法获得了多个推荐文章列表,每个文章推荐文章列表包含已经排序好的100篇推荐文章,再根据不同文章推荐算法的权重值,从不同的推荐文章列表抽取相应的文章数形成含有15篇文章数的最终推荐文章列表。但该形式的并行式文章推荐方法是按照已设定文章推荐算法的权重值生成最终推荐文章,不是按照用户的阅读偏好进行文章推荐,灵活性不够。
为此,在本实施例中,并行式文章推荐设备获取用户对生成的最终推荐文章列表中的已阅读文章和未阅读的文章信息,有利于了解用户的阅读偏好;其中,已阅读文章代表用户的偏爱阅读的文章,未阅读文章代表用户不喜欢阅读的文章。而后并行式文章推荐设备通过获取所述用户已阅读文章在各个推荐文章列表中的占比以及排列位置,按照推荐文章列表当中已阅读文章占比和排列位置从高到低的排序方式,对文章推荐算法进行权重值更新,已阅读文章排列位置低且占比低的文章推荐算法权重值降低,已阅读文章排列位置高且占比高的文章推荐算法权重值增加,根据用户的偏好文章对文章推荐算法的权重值进行重设,确保生成的最终文章推荐列表更符合用户的偏爱需求,灵活度高。
请参考图3,本发明的第二实施例提供了一种并行式文章推荐装置,包括:
建模单元201,用于根据用户的历史浏览文章,构建用户结构化模型;
算法单元202,用于根据所述用户结构化模型以及预设的至少两种推荐算法,获得对应于所述用户的至少两种文章推荐算法;
推荐单元203,用于分别将待推荐的文章通过所述至少两种文章推荐算法,获得与每种文章推荐算法对应的推荐文章列表;
混合单元204,用于根据所述至少两种文章推荐算法的预设权重值,从每个文章推荐列表选取预定的文章,以混合生成相应于所述用户的最终推荐文章列表。
优选地,所述并行式文章推荐装置还包括:
文章获取单元,用于获取用户对生成的最终推荐文章列表中的已阅读文章;
占比和位置获取单元,用于获取已阅读文章在各个推荐文章列表中的占比以及排列位置;
算法权重更新单元,用于根据所述占比和排列位置更新所述至少两种文章推荐算法的权重值。
优选地,所述建模单元201的步骤包括:
获取模块,用于获取用户的历史浏览文章的特征数据;
构建模块,用于基于所述特征数据,采用机器学习的分类算法构建用户结构化模型;
存储模块,用于储存为用户构建的所述用户结构化模型。
优选地,所述算法单元202包括如下中的两个算法模块:热点新闻推荐算法模块、基于内容的推荐算法模块或协同过滤算法模块。
其中,所述热点新闻推荐算法模块用于:
设置热点关键词与热点时间;
匹配所述热点关键词与文章的特征数据,生成文章样品数据;
根据文章发布时间和所述热点时间对所述文章样品数据进行排序,生成推荐文章列表。
其中,所述基于内容的推荐算法模块用于:
匹配文章的特征数据与所述用户结构化模型,生成文章样品数据;其中,采用余弦相识度的公式计算所述用户结构化模型与文章的特征数据的匹配距离;
基于所述匹配距离,将文章样品数据排序、去重后生成推荐文章列表。
优选地,所述协同过滤算法模块包括基于用户的协同过滤算法模块和基于文章的协同过滤算法模块。
优选地,所述协同过滤算法模块用于:
分别将待推荐的文章通过两种协同过滤算法,获得与两种协同过滤算法对应的第一列表和第二列表;
根据两种所述协同过滤算法的预设权重值,从所述第一列表和所述第二列表选取预定的文章,以混合生成相应于所述用户的推荐文章列表。
其中,所述基于用户的协同过滤算法模块用于:
基于所述用户结构化模型,获得各个用户之间的用户相关度系数;
根据所述用户相关度系数,生成第一文章样品数据;
过滤所述第一文章样品数据中已阅读文章数据后,加权、排序生成第一列表。
其中,所述基于文章的协同过滤算法模块用于:
基于用户的历史浏览文章的特征数据,获取各个文章之间的文章相关度系数;
根据所述文章相关度系数,生成第二文章样品数据;
过滤所述第二文章样品数据中已阅读文章数据后,加权、排序生成第二列表。
本发明第三实施例还提供一种并行式文章推荐设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序时实现如上述实施例的并行式文章推荐方法。
本发明第四实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述实施例的并行式文章推荐方法的步骤。
示例性地,本发明实施例所述的计算机程序可以被分割成一个或多个模块,所述一个或者多个模块被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述实现服务器设备中的执行过程。例如,本发明第二实施例中所述的装置。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(APPlication Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述并行式文章推荐方法的控制中心,利用各种接口和线路连接整个所述实现并行式文章推荐方法的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现并行式文章推荐方法的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、文字转换功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、文字消息数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,所述实现服务设备的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一个计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种并行式文章推荐方法,其特征在于,包括:
根据用户的历史浏览文章,构建用户结构化模型;
根据所述用户结构化模型以及预设的至少两种推荐算法,获得对应于所述用户的至少两种文章推荐算法;
分别将待推荐的文章通过所述至少两种文章推荐算法,获得与每种文章推荐算法对应的推荐文章列表;
根据所述至少两种文章推荐算法的预设权重值,从每个文章推荐列表选取预定的文章,以混合生成相应于所述用户的最终推荐文章列表。
2.根据权利要求1所述的并行式文章推荐方法,其特征在于,根据用户的历史浏览文章,构建用户结构化模型的步骤包括:
获取用户的历史浏览文章的特征数据;
基于所述特征数据,采用机器学习的分类算法构建用户结构化模型;
储存为用户构建的所述用户结构化模型。
3.根据权利要求1所述的并行式文章推荐方法,其特征在于,所述文章推荐算法包括如下中的两个:热点新闻推荐算法、基于内容的推荐算法或协同过滤算法。
4.根据权利要求3所述的并行式文章推荐方法,其特征在于,所述协同过滤算法包括基于用户的协同过滤算法和基于文章的协同过滤算法。
5.根据权利要求1所述的并行式文章推荐方法,其特征在于,还包括:
获取用户对生成的最终推荐文章列表中的已阅读文章;
获取已阅读文章在各个推荐文章列表中的占比以及排列位置;
根据所述占比和排列位置更新所述至少两种文章推荐算法的权重值。
6.一种并行式文章推荐装置,其特征在于,包括:
建模单元,用于根据用户的历史浏览文章,构建用户结构化模型;
算法单元,用于根据所述用户结构化模型以及预设的至少两种推荐算法,获得对应于所述用户的至少两种文章推荐算法;
推荐单元,用于分别将待推荐的文章通过所述至少两种文章推荐算法,获得与每种文章推荐算法对应的推荐文章列表;
混合单元,用于根据所述至少两种文章推荐算法的预设权重值,从每个文章推荐列表选取预定的文章,以混合生成相应于所述用户的最终推荐文章列表。
7.根据权利要求6所述的并行式文章推荐装置,其特征在于,所述建模单元包括:
获取模块,用于获取用户的历史浏览文章的特征数据;
构建模块,用于基于所述特征数据,采用机器学习的分类算法构建用户结构化模型;
储存模块,用于储存为用户构建的所述用户结构化模型。
8.根据权利要求6所述的并行式文章推荐装置,其特征在于,所述文章推荐算法包括如下中的两个:热点新闻推荐算法、基于内容的推荐算法或协同过滤算法。
9.一种并行式文章推荐设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述计算机程序时实现如权利要求1~5任意一项所述的并行式文章推荐方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1~5任一项所述并行式文章推荐方法的步骤。
CN201910251343.8A 2019-03-29 2019-03-29 一种并行式文章推荐方法、装置、设备及存储介质 Pending CN109977316A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910251343.8A CN109977316A (zh) 2019-03-29 2019-03-29 一种并行式文章推荐方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910251343.8A CN109977316A (zh) 2019-03-29 2019-03-29 一种并行式文章推荐方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN109977316A true CN109977316A (zh) 2019-07-05

Family

ID=67081709

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910251343.8A Pending CN109977316A (zh) 2019-03-29 2019-03-29 一种并行式文章推荐方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN109977316A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110532479A (zh) * 2019-09-05 2019-12-03 北京思维造物信息科技股份有限公司 一种信息推荐方法、装置及设备
CN111651584A (zh) * 2020-04-17 2020-09-11 世纪保众(北京)网络科技有限公司 一种基于用户行为特征及文章属性的保险文章推荐方法
CN111738754A (zh) * 2020-06-01 2020-10-02 上海晶赞融宣科技有限公司 对象推荐方法及装置、存储介质、计算机设备
WO2021012790A1 (zh) * 2019-07-22 2021-01-28 平安科技(深圳)有限公司 页面数据生成方法、装置、计算机设备及存储介质
CN112633321A (zh) * 2020-11-26 2021-04-09 北京瑞友科技股份有限公司 一种人工智能推荐系统及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103578007A (zh) * 2012-07-20 2014-02-12 三星电子(中国)研发中心 用于智能设备的混合推荐系统及其方法
CN104424278A (zh) * 2013-08-29 2015-03-18 腾讯科技(深圳)有限公司 一种获取热点资讯的方法及装置
US20160253325A1 (en) * 2014-12-30 2016-09-01 Socialtopias, Llc Method and apparatus for programmatically adjusting the relative importance of content data as behavioral data changes
CN108304556A (zh) * 2018-02-06 2018-07-20 中国传媒大学 基于内容与协同过滤相结合的个性化推荐方法
CN108470136A (zh) * 2017-07-17 2018-08-31 王庆军 一种拟探索视频特征数据的语义低维特征的获取方法
CN108733834A (zh) * 2018-05-28 2018-11-02 广东工业大学 一种面向用户的推荐方法、装置及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103578007A (zh) * 2012-07-20 2014-02-12 三星电子(中国)研发中心 用于智能设备的混合推荐系统及其方法
CN104424278A (zh) * 2013-08-29 2015-03-18 腾讯科技(深圳)有限公司 一种获取热点资讯的方法及装置
US20160253325A1 (en) * 2014-12-30 2016-09-01 Socialtopias, Llc Method and apparatus for programmatically adjusting the relative importance of content data as behavioral data changes
CN108470136A (zh) * 2017-07-17 2018-08-31 王庆军 一种拟探索视频特征数据的语义低维特征的获取方法
CN108304556A (zh) * 2018-02-06 2018-07-20 中国传媒大学 基于内容与协同过滤相结合的个性化推荐方法
CN108733834A (zh) * 2018-05-28 2018-11-02 广东工业大学 一种面向用户的推荐方法、装置及存储介质

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021012790A1 (zh) * 2019-07-22 2021-01-28 平安科技(深圳)有限公司 页面数据生成方法、装置、计算机设备及存储介质
CN110532479A (zh) * 2019-09-05 2019-12-03 北京思维造物信息科技股份有限公司 一种信息推荐方法、装置及设备
CN111651584A (zh) * 2020-04-17 2020-09-11 世纪保众(北京)网络科技有限公司 一种基于用户行为特征及文章属性的保险文章推荐方法
CN111738754A (zh) * 2020-06-01 2020-10-02 上海晶赞融宣科技有限公司 对象推荐方法及装置、存储介质、计算机设备
CN112633321A (zh) * 2020-11-26 2021-04-09 北京瑞友科技股份有限公司 一种人工智能推荐系统及方法

Similar Documents

Publication Publication Date Title
CN109977316A (zh) 一种并行式文章推荐方法、装置、设备及存储介质
CN108363821A (zh) 一种信息推送方法、装置、终端设备及存储介质
Chakrabarti et al. Structured learning for non-smooth ranking losses
CN103729359B (zh) 一种推荐搜索词的方法及系统
US8155992B2 (en) Method and system for high performance model-based personalization
CN106844407B (zh) 基于数据集相关性的标签网络产生方法和系统
CN103136683A (zh) 计算产品参考价格的方法、装置及产品搜索方法、系统
US8660901B2 (en) Matching of advertising sources and keyword sets in online commerce platforms
CN102236663A (zh) 一种基于垂直搜索的查询方法、系统和装置
CN103309886A (zh) 一种基于交易平台的结构化信息搜索方法和装置
CN110111167A (zh) 一种确定推荐对象的方法和装置
CN109165975A (zh) 标签推荐方法、装置、计算机设备及存储介质
CN102999586A (zh) 一种网站推荐的方法和装置
Valkanas et al. Mining competitors from large unstructured datasets
CN110852785B (zh) 用户分级方法、装置及计算机可读存储介质
CN109325146A (zh) 一种视频推荐方法、装置、存储介质和服务器
CN103514181A (zh) 一种搜索方法和装置
CN110503506A (zh) 基于评分数据的物品推荐方法、装置及介质
CN110413888A (zh) 一种书籍推荐方法及装置
CN111310032A (zh) 资源推荐方法、装置、计算机设备及可读存储介质
CN110473073A (zh) 线性加权推荐的方法及装置
CN113946686A (zh) 电力营销知识图谱构建方法及系统
Rao et al. Product recommendation system from users reviews using sentiment analysis
CN110489531B (zh) 高频问题的确定方法和装置
Liu et al. Recent advances in personal recommender systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190705

RJ01 Rejection of invention patent application after publication