CN108509630A - 一种新闻推荐方法及装置 - Google Patents

一种新闻推荐方法及装置 Download PDF

Info

Publication number
CN108509630A
CN108509630A CN201810311311.8A CN201810311311A CN108509630A CN 108509630 A CN108509630 A CN 108509630A CN 201810311311 A CN201810311311 A CN 201810311311A CN 108509630 A CN108509630 A CN 108509630A
Authority
CN
China
Prior art keywords
news
sublist
temperature
keyword
relevance degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810311311.8A
Other languages
English (en)
Inventor
陈嘉慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sohu New Media Information Technology Co Ltd
Original Assignee
Beijing Sohu New Media Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sohu New Media Information Technology Co Ltd filed Critical Beijing Sohu New Media Information Technology Co Ltd
Priority to CN201810311311.8A priority Critical patent/CN108509630A/zh
Publication of CN108509630A publication Critical patent/CN108509630A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Abstract

本发明公开了一种新闻推荐方法及装置,包括:获取用户的目标新闻和目标时间,其中,所述目标新闻表征所述用户当前时刻阅读的新闻信息,所述目标时间表征所述用户当前阅读新闻的时间段;提取所述目标新闻的关键词,并根据所述关键词计算得到相关新闻子列表;提取得到与所述目标时间对应的热度新闻,并根据所述热度新闻生成热度新闻子列表;将所述相关新闻子列表和所述热度新闻子列表进行组合,得到新闻推荐列表。由于在该新闻推荐列表中不仅包括了相关新闻还包括了当前热度新闻,避免了用户持续阅读相关新闻的枯燥性,进而提升了用户的阅读体验,因此提升了新闻推荐效果。

Description

一种新闻推荐方法及装置
技术领域
本发明涉及新闻处理技术领域,特别是涉及一种新闻推荐方法及装置。
背景技术
伴随着互联网技术和移动终端的发展,人们更习惯通过移动终端来进行新闻阅读。通常为了方便用户对新闻的阅读在对应的新闻客户端会进行新闻推荐。
在整个新闻的推荐过程中,相关新闻的推荐作为数据点击流量的来源之一,占据了重要地位。当用户点击某条新闻的时候,通常下拉至尾部,会有三到五条新闻组成相关列表,用户可以点击该相关列表中的新闻,跳转到另一条新闻继续阅读。因此,相关新闻的推荐效果的好坏,会直接影响到用户的阅读体验。如何提升相关新闻的推荐效果,显得至关重要。
发明内容
针对于上述问题,本发明提供一种新闻推荐方法及装置,基于将相关新闻与热度新闻相结合的方式,实现了提升新闻推荐效果的目的。
为了实现上述目的,本发明提供了如下技术方案:
一种新闻推荐方法,包括:
获取用户的目标新闻和目标时间,其中,所述目标新闻表征所述用户当前时刻阅读的新闻信息,所述目标时间表征所述用户当前阅读新闻的时间段;
提取所述目标新闻的关键词,并根据所述关键词计算得到相关新闻子列表;
提取得到与所述目标时间对应的热度新闻,并根据所述热度新闻生成热度新闻子列表;
将所述相关新闻子列表和所述热度新闻子列表进行组合,得到新闻推荐列表。
优选地,所述提取所述目标新闻的关键词,并根据所述关键词计算得到相关新闻子列表,包括:
提取所述目标新闻关键词,并根据所述关键词的权重值确定目标关键词;
获取与所述目标关键词对应的新闻列表,并计算所述新闻列表中的各个新闻与所述目标新闻之间的相关度值;
选取所述相关度值满足预设阈值范围的新闻作为初始新闻,并根据所述初始新闻的点击曝光率计算得到所述初始新闻的目标相关度值;
依据所述目标相关度值对所述初始新闻进行排序,得到相关新闻子列表。
优选地,所述选取所述相关度值满足预设阈值范围的新闻作为初始新闻,并根据所述初始新闻的点击曝光率计算得到所述初始新闻的目标相关度值,包括:
选取所述相关度值满足预设阈值范围的新闻作为初始新闻;
获取所述初始新闻的点击曝光率,并依据所述点击曝光率和所述初始新闻的相关度值计算得到第一相关度值;
对所述第一相关度值进行调整处理,得到目标相关度值。
优选地,所述将所述相关新闻子列表和所述热度新闻子列表进行组合,得到新闻推荐列表,包括:
获取所述相关新闻子列表中的第一新闻信息和所述热度新闻子列表中的第二新闻信息;
将所述第一新闻信息和所述第二新闻信息进行去重处理,得到第一相关新闻子列表和第一热度新闻子列表;
根据预设新闻推荐数量,分别选取所述第一相关新闻子列表中的相关新闻和所述第一热度新闻子列表中的热度新闻,并将所述相关新闻和所述热度新闻组合生成新闻推荐列表。
优选地,还包括:
若所述目标新闻的关键词属性满足预设的弱主题类别,则获取与所述目标新闻相关主题的热度新闻组成所述新闻推荐列表。
一种新闻推荐装置,包括:
获取模块,用于获取用户的目标新闻和目标时间,其中,所述目标新闻表征所述用户当前时刻阅读的新闻信息,所述目标时间表征所述用户当前阅读新闻的时间段;
计算模块,用于提取所述目标新闻的关键词,并根据所述关键词计算得到相关新闻子列表;
生成模块,用于提取得到与所述目标时间对应的热度新闻,并根据所述热度新闻生成热度新闻子列表;
组合模块,用于将所述相关新闻子列表和所述热度新闻子列表进行组合,得到新闻推荐列表。
优选地,所述计算模块包括:
确定单元,用于提取所述目标新闻关键词,并根据所述关键词的权重值确定目标关键词;
第一计算单元,用于获取与所述目标关键词对应的新闻列表,并计算所述新闻列表中的各个新闻与所述目标新闻之间的相关度值;
第二计算单元,用于选取所述相关度值满足预设阈值范围的新闻作为初始新闻,并根据所述初始新闻的点击曝光率计算得到所述初始新闻的目标相关度值;
排序单元,用于依据所述目标相关度值对所述初始新闻进行排序,得到相关新闻子列表。
优选地,所述第二计算单元包括:
选取子单元,用于选取所述相关度值满足预设阈值范围的新闻作为初始新闻;
计算子单元,用于获取所述初始新闻的点击曝光率,并依据所述点击曝光率和所述初始新闻的相关度值计算得到第一相关度值;
对所述第一相关度值进行调整处理,得到目标相关度值。
优选地,所述组合模块包括:
新闻获取单元,用于获取所述相关新闻子列表中的第一新闻信息和所述热度新闻子列表中的第二新闻信息;
去重单元,用于将所述第一新闻信息和所述第二新闻信息进行去重处理,得到第一相关新闻子列表和第一热度新闻子列表;
组合单元,用于根据预设新闻推荐数量,分别选取所述第一相关新闻子列表中的相关新闻和所述第一热度新闻子列表中的热度新闻,并将所述相关新闻和所述热度新闻组合生成新闻推荐列表。
优选地,还包括:
第二组成模块,用于若所述目标新闻的关键词属性满足预设的弱主题类别,则获取与所述目标新闻相关主题的热度新闻组成所述新闻推荐列表。
相较于现有技术,本发明提供了一种新闻推荐方法及装置,通过根据用户的目标新闻生成了相关新闻子列表,并通过根据用户的目标时间生成了热度新闻子列表,对该相关新闻子列表和热度新闻子列表进行组合生成了新闻推荐列表。由于在该新闻推荐列表中不仅包括了相关新闻还包括了当前热度新闻,避免了用户持续阅读相关新闻的枯燥性,进而提升了用户的阅读体验,因此提升了新闻推荐效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种新闻推荐方法的流程示意图;
图2为本发明实施例提供的一种相关新闻子列表的生成方法的流程示意图;
图3为本发明实施例提供的一种新闻推荐装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有设定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
在本发明实施例中提供了一种新闻推荐方法,参见图1,该方法可以包括:
S11、获取用户的目标新闻和目标时间;
其中,所述目标新闻表征所述用户当前时刻阅读的新闻信息,所述目标时间表征所述用户当前阅读新闻的时间段;
具体的,不同的用户在进行新闻阅读时会有不同的需求,例如某些用户喜欢关注娱乐新闻,在其阅读过程中通常会持续选择娱乐新闻进行阅读。为了能够更准确地为该用户推送或推荐相关新闻需要获取到其正在阅读的新闻信息,也就是目标新闻。
而热点新闻具有实时性,所以要根据该用户的目标时间即当前阅读新闻的时间段进行相关推荐。因此,获取用户的目标新闻和目标时间为后续为用户提供新闻推荐提供了基础。
S12、提取所述目标新闻的关键词,并根据所述关键词计算得到相关新闻子列表;
在本发明实施例中是根据目标新闻的关键词进行相关新闻的推荐的。即对目标新闻进行分词,在分词过程中包括了目标新闻的标题和正文,然后,提取出目标新闻的关键词,需要说明的是该关键词是目标新闻的核心关键词,即关键词权重大于预设阈值的关键词。这是由于往往一篇新闻有多个关键词,若将每一个关键词都作为核心关键词,一方面获取到的相关新闻数量较多,另一方面其相关度也会不准确,因此需要通过设置一个阈值提取到核心关键词。依据关键词和关键词权重计算获得相关新闻,并组成相关新闻列表,在该列表中可以记载相关新闻和该相关新闻对应的相关值等信息。
S13、提取得到与所述目标时间对应的热度新闻,并根据所述热度新闻生成热度新闻子列表;
在该目标时间对应的时间段内根据点击曝光率(Click-Through-Rate,CTR)提取得到对应的热度新闻,然后将提取得到的热度新闻生成热度新闻子列表。在该列表中可以记载热度新闻和该热度新闻对应的CTR等信息。
S14、将所述相关新闻子列表和所述热度新闻子列表进行组合,得到新闻推荐列表。
在每个新闻客户端中一条新闻对应的推荐新闻数量受该新闻客户端的显示版面的限制,所以要结合推荐数量,在对应的相关新闻子列表和热度新闻子列表中选取对应的新闻组成新闻推荐列表,同时也要考虑两种类型的新闻之间是否有重复的新闻。例如,在某个新闻客户端中设置有5条新闻推荐位置,则可以在相关新闻子列表中选择3条相关新闻,在热度新闻子列表中选择2条热度新闻组成推荐新闻列表,展示在对应的新闻推荐位置。
在本发明实施例提供的一种新闻推荐方法,通过根据用户的目标新闻生成了相关新闻子列表,并通过根据用户的目标时间生成了热度新闻子列表,对该相关新闻子列表和热度新闻子列表进行组合生成了新闻推荐列表。由于在该新闻推荐列表中不仅包括了相关新闻还包括了当前热度新闻,避免了用户持续阅读相关新闻的枯燥性,进而提升了用户的阅读体验,因此提升了新闻推荐效果。
在本发明的另一实施例中还提供了一种相关新闻子列表的生成方法,参见图2,包括:
S121、提取所述目标新闻关键词,并根据所述关键词的权重值确定目标关键词;
S122、获取与所述目标关键词对应的新闻列表,并计算所述新闻列表中的各个新闻与所述目标新闻之间的相关度值;
S123、选取所述相关度值满足预设阈值范围的新闻作为初始新闻,并根据所述初始新闻的点击曝光率计算得到所述初始新闻的目标相关度值;
S124、依据所述目标相关度值对所述初始新闻进行排序,得到相关新闻子列表。
在对目标新闻进行分词,得到关键词之后,需要根据预设的关键词权重值确定该目标新闻的目标关键词。例如,将关键词权重值设置为0.5,则该目标关键词为权重值大于0.5的关键词。
根据该目标关键词召回候选新闻,也就是该候选新闻的核心关键词与目标新闻的目标关键词有所重叠,需要说明的是该候选新闻的核心关键词也是通过设置关键词权重值确定的。将对应的候选新闻组成与该目标关键词对应的新闻列表,并计算该新闻列表中各个新闻与目标新闻之间的相关度值。在本发明实施例中是通过计算二者的余弦相似度来计算得到的相关度值的。也就是将新闻列表中的新闻的若干核心关键词的权重值组成一个关键词权重向量,同样的目标新闻也生成一个关键词权重向量,计算两个向量的余弦相似度,进而作为相关度值。当然也可以选取其他计算方式,本发明不做一一说明。
在获得了相关度值之后,需要选取满足预设阈值范围的新闻作为初始新闻,例如相关度预设阈值范围为[0.3,0.65]也就是新闻与目标新闻之间的相关度值在0.3和0.65之间才可以作为初始新闻,这样保证新闻既不会高度相关,因为高度相关意味着很有可能两篇新闻的内容是一样的,同时也尽可能地杜绝了候选新闻的噪声。
得到初始新闻后,计算每篇初始新闻的CTR,并根据该CTR计算得到初始新闻的目标相关度值,具体的包括:
选取所述相关度值满足预设阈值范围的新闻作为初始新闻;
获取所述初始新闻的点击曝光率,并依据所述点击曝光率和所述初始新闻的相关度值计算得到第一相关度值;
对所述第一相关度值进行调整处理,得到目标相关度值。
首先计算第一相关度值,即为(权重1*CTR+权重2*相关度),其中,权重1为初始新闻的CTR的权重值,权重2为初始新闻与目标新闻的相关度值对应的权重值。
需要说明的是,初始新闻的CTR是经过平滑处理得到的CTR,这是由于考虑到在实际场景中,新闻的曝光量不一定足够,如果直接计算CTR会造成便宜,所以可以引入贝叶斯平滑算法对CTR进行平滑处理。
然后对第一相关度值进行调整处理得到目标相关度值,这里的调整处理主要是指需要将第一相关度值与对应的时间衰减函数进行相乘,进而保证了相关新闻推荐的准确性。在本发明实施例中时间衰减函数用的是版衰减函数,衰减周期是一周。因此,在本实施例中目标相关度值=(权重1*ctr+权重2*相关度)*时间衰减函数,其中,权重1和权重2在实际场景中也会进行相应的调整。
在新闻推荐过程中的目标是希望尽可能提升用户的阅读体验,挖掘用户可能会感兴趣的话题。同时,新闻推荐不同于电商推荐,个性化因素并没有那么突出,用户在阅读新闻时具有从众性,特别是用户看新闻的高峰都集中在上下班的碎片时间里,更倾向于看当天热门时间和话题,如果一味只推荐相关新闻,用户看到的全部都是大同小异的时间,非常单调。因此,本发明提出了分层推荐,即包括相关新闻也包括热度新闻。
在生成热度新闻子列表的过程中,是根据在该目标时间内的新闻CTR排序取这一时间段内同分类下最热的新闻。需要说明的是,根据用户当前浏览的目标新闻同一主题分类下的热度新闻,例如,该用户选择的是娱乐新闻,则该热度新闻为娱乐新闻主题下对应的CTR最高的新闻。
在本发明实施例中还提供了一种新闻列表生成方法,包括:
获取所述相关新闻子列表中的第一新闻信息和所述热度新闻子列表中的第二新闻信息;
将所述第一新闻信息和所述第二新闻信息进行去重处理,得到第一相关新闻子列表和第一热度新闻子列表;
根据预设新闻推荐数量,分别选取所述第一相关新闻子列表中的相关新闻和所述第一热度新闻子列表中的热度新闻,并将所述相关新闻和所述热度新闻组合生成新闻推荐列表。
由于选取的相关新闻和热度新闻有可能有相同的新闻,或者基本一致的新闻,其中,基本一致的新闻可以包括重复率值高于预设阈值的新闻。则需要对相关新闻子列表和热度新闻子列表中的新闻进行去重,然后再根据展示版面对各个子列表中的新闻依据数量进行选取。上述描述只是本实施例中的一种实施方式,也可以先确定数量再去重,这样可以减少去重比对,若去重后数量不足再选取补充。
在生成推荐新闻列表的过程中,也可能会出现该推荐新闻列表中只有热点新闻而没有相关新闻的情况。在实际观察数据中,我们发现有一些特定的分类,例如搞笑类中的新闻多以段子和笑话为主,新闻相关性非常低,用户也不会关注新闻的主题是什么,这类的主题可以定义为弱主题类别,这种新闻在进行新闻推荐时直接推荐该同分类的热度新闻。
因此,在本发明实施例中的新闻推荐策略是采用的分层推荐方式即包括相关新闻层和热度新闻层。保证了新闻推荐的体验效果。在新闻推荐过程中服务的稳定性也是至关重要的因素,只有服务稳定了,才能保证上述推荐策略的正确实现,用户反馈的效果才是真实的效果,因此,本发明的实施例中还对服务的稳定性做了改进,改进方法如下:
对服务进行水平扩展,减少单台服务压力;
服务进行微服务改造后,采用断路器进行服务异常降级,保证服务稳定性,避免服务崩溃;
构建立体缓存体系,实现分布式缓存方案,优化了本地缓存实现。
因此,通过对服务的改进也保证了新闻推荐列表的稳定性,降低了超时率。
在本发明实施例中还提供了一种新闻推荐装置,参见图3,包括:
获取模块10,用于获取用户的目标新闻和目标时间,其中,所述目标新闻表征所述用户当前时刻阅读的新闻信息,所述目标时间表征所述用户当前阅读新闻的时间段;
计算模块20,用于提取所述目标新闻的关键词,并根据所述关键词计算得到相关新闻子列表;
生成模块30,用于提取得到与所述目标时间对应的热度新闻,并根据所述热度新闻生成热度新闻子列表;
组合模块40,用于将所述相关新闻子列表和所述热度新闻子列表进行组合,得到新闻推荐列表。
可选地,所述计算模块包括:
确定单元,用于提取所述目标新闻关键词,并根据所述关键词的权重值确定目标关键词;
第一计算单元,用于获取与所述目标关键词对应的新闻列表,并计算所述新闻列表中的各个新闻与所述目标新闻之间的相关度值;
第二计算单元,用于选取所述相关度值满足预设阈值范围的新闻作为初始新闻,并根据所述初始新闻的点击曝光率计算得到所述初始新闻的目标相关度值;
排序单元,用于依据所述目标相关度值对所述初始新闻进行排序,得到相关新闻子列表。
可选地,所述第二计算单元包括:
选取子单元,用于选取所述相关度值满足预设阈值范围的新闻作为初始新闻;
计算子单元,用于获取所述初始新闻的点击曝光率,并依据所述点击曝光率和所述初始新闻的相关度值计算得到第一相关度值;
对所述第一相关度值进行调整处理,得到目标相关度值。
可选地,所述组合模块包括:
新闻获取单元,用于获取所述相关新闻子列表中的第一新闻信息和所述热度新闻子列表中的第二新闻信息;
去重单元,用于将所述第一新闻信息和所述第二新闻信息进行去重处理,得到第一相关新闻子列表和第一热度新闻子列表;
组合单元,用于根据预设新闻推荐数量,分别选取所述第一相关新闻子列表中的相关新闻和所述第一热度新闻子列表中的热度新闻,并将所述相关新闻和所述热度新闻组合生成新闻推荐列表。
可选地,还包括:
第二组成模块,用于若所述目标新闻的关键词属性满足预设的弱主题类别,则获取与所述目标新闻相关主题的热度新闻组成所述新闻推荐列表。
在本发明实施例提供的一种新闻推荐装置,通过根据用户的目标新闻生成了相关新闻子列表,并通过根据用户的目标时间生成了热度新闻子列表,对该相关新闻子列表和热度新闻子列表进行组合生成了新闻推荐列表。由于在该新闻推荐列表中不仅包括了相关新闻还包括了当前热度新闻,避免了用户持续阅读相关新闻的枯燥性,进而提升了用户的阅读体验,因此提升了新闻推荐效果。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种新闻推荐方法,其特征在于,包括:
获取用户的目标新闻和目标时间,其中,所述目标新闻表征所述用户当前时刻阅读的新闻信息,所述目标时间表征所述用户当前阅读新闻的时间段;
提取所述目标新闻的关键词,并根据所述关键词计算得到相关新闻子列表;
提取得到与所述目标时间对应的热度新闻,并根据所述热度新闻生成热度新闻子列表;
将所述相关新闻子列表和所述热度新闻子列表进行组合,得到新闻推荐列表。
2.根据权利要求1所述的方法,其特征在于,所述提取所述目标新闻的关键词,并根据所述关键词计算得到相关新闻子列表,包括:
提取所述目标新闻关键词,并根据所述关键词的权重值确定目标关键词;
获取与所述目标关键词对应的新闻列表,并计算所述新闻列表中的各个新闻与所述目标新闻之间的相关度值;
选取所述相关度值满足预设阈值范围的新闻作为初始新闻,并根据所述初始新闻的点击曝光率计算得到所述初始新闻的目标相关度值;
依据所述目标相关度值对所述初始新闻进行排序,得到相关新闻子列表。
3.根据权利要求2所述的方法,其特征在于,所述选取所述相关度值满足预设阈值范围的新闻作为初始新闻,并根据所述初始新闻的点击曝光率计算得到所述初始新闻的目标相关度值,包括:
选取所述相关度值满足预设阈值范围的新闻作为初始新闻;
获取所述初始新闻的点击曝光率,并依据所述点击曝光率和所述初始新闻的相关度值计算得到第一相关度值;
对所述第一相关度值进行调整处理,得到目标相关度值。
4.根据权利要求1所述的方法,其特征在于,所述将所述相关新闻子列表和所述热度新闻子列表进行组合,得到新闻推荐列表,包括:
获取所述相关新闻子列表中的第一新闻信息和所述热度新闻子列表中的第二新闻信息;
将所述第一新闻信息和所述第二新闻信息进行去重处理,得到第一相关新闻子列表和第一热度新闻子列表;
根据预设新闻推荐数量,分别选取所述第一相关新闻子列表中的相关新闻和所述第一热度新闻子列表中的热度新闻,并将所述相关新闻和所述热度新闻组合生成新闻推荐列表。
5.根据权利要求1所述的方法,其特征在于,还包括:
若所述目标新闻的关键词属性满足预设的弱主题类别,则获取与所述目标新闻相关主题的热度新闻组成所述新闻推荐列表。
6.一种新闻推荐装置,其特征在于,包括:
获取模块,用于获取用户的目标新闻和目标时间,其中,所述目标新闻表征所述用户当前时刻阅读的新闻信息,所述目标时间表征所述用户当前阅读新闻的时间段;
计算模块,用于提取所述目标新闻的关键词,并根据所述关键词计算得到相关新闻子列表;
生成模块,用于提取得到与所述目标时间对应的热度新闻,并根据所述热度新闻生成热度新闻子列表;
组合模块,用于将所述相关新闻子列表和所述热度新闻子列表进行组合,得到新闻推荐列表。
7.根据权利要求6所述的装置,其特征在于,所述计算模块包括:
确定单元,用于提取所述目标新闻关键词,并根据所述关键词的权重值确定目标关键词;
第一计算单元,用于获取与所述目标关键词对应的新闻列表,并计算所述新闻列表中的各个新闻与所述目标新闻之间的相关度值;
第二计算单元,用于选取所述相关度值满足预设阈值范围的新闻作为初始新闻,并根据所述初始新闻的点击曝光率计算得到所述初始新闻的目标相关度值;
排序单元,用于依据所述目标相关度值对所述初始新闻进行排序,得到相关新闻子列表。
8.根据权利要求7所述的装置,其特征在于,所述第二计算单元包括:
选取子单元,用于选取所述相关度值满足预设阈值范围的新闻作为初始新闻;
计算子单元,用于获取所述初始新闻的点击曝光率,并依据所述点击曝光率和所述初始新闻的相关度值计算得到第一相关度值;
对所述第一相关度值进行调整处理,得到目标相关度值。
9.根据权利要求6所述的装置,其特征在于,所述组合模块包括:
新闻获取单元,用于获取所述相关新闻子列表中的第一新闻信息和所述热度新闻子列表中的第二新闻信息;
去重单元,用于将所述第一新闻信息和所述第二新闻信息进行去重处理,得到第一相关新闻子列表和第一热度新闻子列表;
组合单元,用于根据预设新闻推荐数量,分别选取所述第一相关新闻子列表中的相关新闻和所述第一热度新闻子列表中的热度新闻,并将所述相关新闻和所述热度新闻组合生成新闻推荐列表。
10.根据权利要求6所述的装置,其特征在于,还包括:
第二组成模块,用于若所述目标新闻的关键词属性满足预设的弱主题类别,则获取与所述目标新闻相关主题的热度新闻组成所述新闻推荐列表。
CN201810311311.8A 2018-04-09 2018-04-09 一种新闻推荐方法及装置 Pending CN108509630A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810311311.8A CN108509630A (zh) 2018-04-09 2018-04-09 一种新闻推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810311311.8A CN108509630A (zh) 2018-04-09 2018-04-09 一种新闻推荐方法及装置

Publications (1)

Publication Number Publication Date
CN108509630A true CN108509630A (zh) 2018-09-07

Family

ID=63380773

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810311311.8A Pending CN108509630A (zh) 2018-04-09 2018-04-09 一种新闻推荐方法及装置

Country Status (1)

Country Link
CN (1) CN108509630A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110457604A (zh) * 2019-07-03 2019-11-15 平安科技(深圳)有限公司 基于人工智能的推荐方法及相关设备
CN111192657A (zh) * 2018-11-15 2020-05-22 宁波方太厨具有限公司 一种基于用户行为热度的菜谱推荐方法
CN111324818A (zh) * 2020-03-20 2020-06-23 安徽火蓝数据有限公司 一种网络信息处理方法及处理系统
CN111666473A (zh) * 2019-03-07 2020-09-15 上海博泰悦臻网络技术服务有限公司 车辆、车机设备及其车机设备新闻溯源方法
CN117390144A (zh) * 2023-12-13 2024-01-12 北京搜狐新媒体信息技术有限公司 一种新闻时效性的确定方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101446959A (zh) * 2008-12-30 2009-06-03 深圳市迅雷网络技术有限公司 一种基于互联网的新闻推荐方法和系统
CN101694659A (zh) * 2009-10-20 2010-04-14 浙江大学 基于多主题追踪的个性化网络新闻推送方法
KR20140056536A (ko) * 2012-10-29 2014-05-12 한양대학교 에리카산학협력단 뉴스 추천 시스템 및 뉴스 추천 방법
CN106202294A (zh) * 2016-07-01 2016-12-07 北京奇虎科技有限公司 基于关键词和主题模型融合的相关新闻计算方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101446959A (zh) * 2008-12-30 2009-06-03 深圳市迅雷网络技术有限公司 一种基于互联网的新闻推荐方法和系统
CN101694659A (zh) * 2009-10-20 2010-04-14 浙江大学 基于多主题追踪的个性化网络新闻推送方法
KR20140056536A (ko) * 2012-10-29 2014-05-12 한양대학교 에리카산학협력단 뉴스 추천 시스템 및 뉴스 추천 방법
CN106202294A (zh) * 2016-07-01 2016-12-07 北京奇虎科技有限公司 基于关键词和主题模型融合的相关新闻计算方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
唐瑞: "基于内容的推荐与基于协同过滤融合的新闻推荐研究", 《中国优秀硕士学位论文全文数据库,信息科技辑》 *
让家恒: "基于协同过滤的新闻推荐系统在hadoop上的研究与实现", 《中国优秀硕士学位论文全文数据库,信息科技辑》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111192657A (zh) * 2018-11-15 2020-05-22 宁波方太厨具有限公司 一种基于用户行为热度的菜谱推荐方法
CN111666473A (zh) * 2019-03-07 2020-09-15 上海博泰悦臻网络技术服务有限公司 车辆、车机设备及其车机设备新闻溯源方法
CN110457604A (zh) * 2019-07-03 2019-11-15 平安科技(深圳)有限公司 基于人工智能的推荐方法及相关设备
CN111324818A (zh) * 2020-03-20 2020-06-23 安徽火蓝数据有限公司 一种网络信息处理方法及处理系统
CN117390144A (zh) * 2023-12-13 2024-01-12 北京搜狐新媒体信息技术有限公司 一种新闻时效性的确定方法及装置
CN117390144B (zh) * 2023-12-13 2024-03-08 北京搜狐新媒体信息技术有限公司 一种新闻时效性的确定方法及装置

Similar Documents

Publication Publication Date Title
CN108509630A (zh) 一种新闻推荐方法及装置
CN106504011B (zh) 一种业务对象的展示方法和装置
CN106372249B (zh) 一种点击率预估方法、装置及电子设备
US8321278B2 (en) Targeted advertisements based on user profiles and page profile
JP5802745B2 (ja) インテリジェントナビゲーションの方法、装置、およびシステム
CN101281540B (zh) 用于处理信息的设备、方法和计算机程序
CN102929928B (zh) 基于多维相似度的个性化新闻推荐方法
US9076148B2 (en) Dynamic pricing models for digital content
CN106407210B (zh) 一种业务对象的展示方法和装置
US20110055018A1 (en) Dynamic bid pricing for sponsored search
CN105335519A (zh) 模型生成方法及装置、推荐方法及装置
US20070219994A1 (en) Methods and systems for displaying media utilizing user-generated data
CN106777282B (zh) 相关搜索的排序方法和装置
WO2009006234A2 (en) Automatic video recommendation
EP2238545A1 (en) Video quality measures
CN104199898B (zh) 一种属性信息的获取方法及装置、推送方法及装置
CN109168047B (zh) 视频推荐方法、装置、服务器及存储介质
CN104899315A (zh) 推送用户信息的方法和装置
US20180060427A1 (en) Navigating a Taxonomy Using Search Queries
CN105718566B (zh) 一种智能音乐推荐系统
EP3312738A2 (en) Method and device for displaying keyword
CN106897398B (zh) 一种视频展示方法及装置
US20110313843A1 (en) Search advertisement targeting
KR101659064B1 (ko) 사용자 피드백을 이용하여 컨텐츠에 대한 평가 점수를 산출하기 위한 방법 및 장치
Chiny et al. Netflix recommendation system based on TF-IDF and cosine similarity algorithms

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180907

RJ01 Rejection of invention patent application after publication