CN107465754B - 一种新闻推荐方法和装置 - Google Patents
一种新闻推荐方法和装置 Download PDFInfo
- Publication number
- CN107465754B CN107465754B CN201710730800.2A CN201710730800A CN107465754B CN 107465754 B CN107465754 B CN 107465754B CN 201710730800 A CN201710730800 A CN 201710730800A CN 107465754 B CN107465754 B CN 107465754B
- Authority
- CN
- China
- Prior art keywords
- user
- scene
- news
- interest
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/55—Push-based network services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/2866—Architectures; Arrangements
- H04L67/30—Profiles
- H04L67/306—User profiles
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开一种新闻推荐方法及装置,所述方法在获得第一用户的新闻获取请求时,获得第一用户当前对应的第一场景;根据预先制定的用户、用户场景以及用户对新闻的兴趣信息之间的对应关系,确定所述第一用户在所述第一场景对应的针对新闻的第一兴趣信息;其中,所述对应关系基于不同用户在不同场景中对新闻的相应历史行为预先制定;最终,基于所述第一兴趣信息,对所述第一用户进行新闻推荐。可见,本发明提出了一种依据用户的历史行为并结合用户场景,来对用户进行基于场景的新闻推荐的方案,在推荐新闻时,除了以用户对新闻的历史行为为依据,还同时参考了用户所处的场景,从而能够实现向用户进行更加精准的新闻推荐。
Description
技术领域
本发明属于新闻的个性化推荐技术领域,尤其涉及一种新闻推荐方法和装置。
背景技术
随着智能手机、平板等终端设备的不断发展和普及,基于终端的新闻阅读已逐渐成为人们的生活方式之一。
用户在基于智能手机等终端进行新闻阅读时,可首先通过在新闻客户端(如搜狐或百度等新闻客户端)执行首页下拉操作,来获取源源不断的新闻,由于新闻客户端每天会有数以万计的新闻产生,因此,一般考虑在用户获取新闻时向用户作相应的新闻推荐,以辅助用户高效地获得其较为感兴趣的新闻。而为了实现高质量的新闻推荐,如何精确匹配用户兴趣,进而精准地向用户推送感兴趣的新闻成为该领域的技术难点。
目前,各大新闻推荐产品一般根据用户在新闻客户端的历史行为(如用户在新闻客户端对新闻的点击,分享,评论,点赞等操作行为),来计算用户兴趣,进而基于用户兴趣进行新闻推荐。而该方式由于仅以用户行为这一单一因素作为参考来确定用户兴趣,从而,不可避免地仍存在推荐不够准确的问题,比如可能会造成不合时宜的推荐,如用户虽然有较多的浏览娱乐新闻的历史行为,然而在工作时间向用户推荐这些信息显然不够合理。
发明内容
有鉴于此,本发明的目的在于提供一种新闻推荐方法和系统,旨在结合用户行为及用户所在的场景向用户进行基于场景的新闻推荐,以进一步提升新闻推荐的精准度。
为此,本发明公开如下技术方案:
一种新闻推荐方法,包括:
在获得第一用户的新闻获取请求时,获得第一用户当前对应的第一场景;
根据预先制定的用户、用户场景以及用户对新闻的兴趣信息之间的对应关系,确定所述第一用户在所述第一场景对应的针对新闻的第一兴趣信息;其中,所述对应关系基于不同用户在不同场景中对新闻的相应历史行为预先制定;
基于所述第一兴趣信息,对所述第一用户进行新闻推荐。
上述方法,优选的,所述获得第一用户当前对应的第一场景,包括:
获得所述第一用户当前对应的位置信息、网络环境及时间信息;
根据所述位置信息、网络环境及时间信息,确定所述第一用户当前对应的第一场景。
上述方法,优选的,在所述对应关系中,用户在相应用户场景下对新闻的兴趣信息包括:所述用户场景的各个场景特征对应于所述用户的各个兴趣标签的权重;其中,所述用户的各个兴趣标签为基于用户对新闻的历史行为所确定的兴趣标签,所述用户场景的各个场景特征对应于所述用户的各个兴趣标签的权重为:基于用户在不同场景中对新闻的相应历史行为,利用逻辑回归模型所训练的权重;
则所述根据预先制定的用户、用户场景以及用户对新闻的兴趣信息之间的对应关系,确定所述第一用户在所述第一场景对应的针对新闻的第一兴趣信息,包括:
根据预先制定的用户、用户场景以及用户对新闻的兴趣信息之间的对应关系,确定所述第一场景的各个场景特征对应于所述第一用户的各个兴趣标签的权重。
上述方法,优选的,所述基于所述第一兴趣信息,对所述第一用户进行新闻推荐,包括:
根据所述第一场景的各个场景特征对应于所述第一用户的各个兴趣标签的权重,计算所述第一用户在所述第一场景中对所述第一用户的各个兴趣标签的偏好值;
基于第一用户在所述第一场景中对所述各个兴趣标签的偏好值,向第一用户进行新闻推荐。
上述方法,优选的,所述基于第一用户在所述第一场景中对所述各个兴趣标签的偏好值,向第一用户进行新闻推荐,包括:
从第一用户的各个兴趣标签中,确定出对应的偏好值表示偏好程度较高的预定数量的目标兴趣标签;
按倒排索引方式,从新闻数据库中查询对应于每个目标兴趣标签的新闻;
将查询得到的各个新闻按新闻所对应的目标兴趣标签的偏好值降序排列,并按排列后的顺序推荐给第一用户。
上述方法,优选的,还包括:
根据第一用户对所推荐的新闻的反馈信息,对所述第一用户在所述第一场景对应的针对新闻的第一兴趣信息进行调整。
一种新闻推荐装置,包括:
获取单元,用于在获得第一用户的新闻获取请求时,获得第一用户当前对应的第一场景;
确定单元,用于根据预先制定的用户、用户场景以及用户对新闻的兴趣信息之间的对应关系,确定所述第一用户在所述第一场景对应的针对新闻的第一兴趣信息;其中,所述对应关系基于不同用户在不同场景中对新闻的相应历史行为预先制定;
推荐单元,用于基于所述第一兴趣信息,对所述第一用户进行新闻推荐。
上述装置,优选的,所述获取单元,具体用于:
获得所述第一用户当前对应的位置信息、网络环境及时间信息;根据所述位置信息、网络环境及时间信息,确定所述第一用户当前对应的第一场景。
上述装置,优选的,在所述对应关系中,用户在相应用户场景下对新闻的兴趣信息包括:所述用户场景的各个场景特征对应于所述用户的各个兴趣标签的权重;其中,所述用户的各个兴趣标签为基于用户对新闻的历史行为所确定的兴趣标签,所述用户场景的各个场景特征对应于所述用户的各个兴趣标签的权重为:基于用户在不同场景中对新闻的相应历史行为,利用逻辑回归模型所训练的权重;
则所述确定单元,具体用于:根据预先制定的用户、用户场景以及用户对新闻的兴趣信息之间的对应关系,确定所述第一场景的各个场景特征对应于所述第一用户的各个兴趣标签的权重。
上述装置,优选的,所述推荐单元,具体用于:
根据所述第一场景的各个场景特征对应于所述第一用户的各个兴趣标签的权重,计算所述第一用户在所述第一场景中对所述第一用户的各个兴趣标签的偏好值;基于第一用户在所述第一场景中对所述各个兴趣标签的偏好值,向第一用户进行新闻推荐。
上述装置,优选的,所述推荐单元基于第一用户在所述第一场景中对所述各个兴趣标签的偏好值,向第一用户进行新闻推荐,具体包括:
从第一用户的各个兴趣标签中,确定出对应的偏好值表示偏好程度较高的预定数量的目标兴趣标签;按倒排索引方式,从新闻数据库中查询对应于每个目标兴趣标签的新闻;将查询得到的各个新闻按新闻所对应的目标兴趣标签的偏好值降序排列,并按排列后的顺序推荐给第一用户。
上述装置,优选的,还包括:
调整单元,用于根据第一用户对所推荐的新闻的反馈信息,对所述第一用户在所述第一场景对应的针对新闻的第一兴趣信息进行调整。
由以上方案可知,本发明提供的新闻推荐方法及装置,在获得第一用户的新闻获取请求时,获得第一用户当前对应的第一场景;根据预先制定的用户、用户场景以及用户对新闻的兴趣信息之间的对应关系,确定所述第一用户在所述第一场景对应的针对新闻的第一兴趣信息;其中,所述对应关系基于不同用户在不同场景中对新闻的相应历史行为预先制定;最终,基于所述第一兴趣信息,对所述第一用户进行新闻推荐。可见,本发明提出了一种依据用户的历史行为并结合用户场景,来对用户进行基于场景的新闻推荐的方案,在推荐新闻时,除了以用户对新闻的历史行为为依据,还同时参考了用户所处的场景,从而能够实现向用户进行更加精准的新闻推荐。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明实施例提供的新闻推荐方法的一种流程图;
图2是本发明实施例提供的新闻推荐方法的另一种流程图;
图3是本发明实施例提供的新闻推荐装置的一种结构示意图;
图4是本发明实施例提供的新闻推荐装置的另一种结构示意图。
具体实施方式
为了引用和清楚起见,下文中使用的技术名词、简写或缩写总结解释如下:
用户场景:用户使用新闻客户端时所处的“环境”,包括时间、地点、天气、日期、社会背景、网络环境,以及基于此所做的合理推理,比如午饭等餐时,地铁上,旅游途中等等。
用户行为:用户在新闻客户端的操作,如用户在新闻客户端针对新闻所执行的点击,分享,评论,点赞等。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种新闻推荐方法,该方法可应用于新闻客户端或专门的新闻推荐产品中,旨在结合用户行为及用户所在的场景向用户进行基于场景的新闻推荐,以进一步提升新闻推荐的精准度,参考图1提供的新闻推荐方法的一种流程图,所述方法可以包括以下步骤:
步骤101、在获得第一用户的新闻获取请求时,获得第一用户当前对应的第一场景。
所述第一用户,通常来说为基于智能手机或平板等终端设备的新闻客户端用户。
第一用户的新闻获取请求可以是第一用户在存在新闻阅读需求时,通过在新闻客户端(如搜狐或百度等新闻客户端)执行调出新闻的相应操作所触发的请求,比如,具体地,可以是通过执行打开新闻首页的操作所触发的新闻获取请求,或者,还可以是通过在已打开的新闻首页上执行下拉操作所触发的新闻获取请求等,本实施例对此不作限定。
由于本发明在对用户进行新闻推荐时,同时参考用户对新闻的历史行为(比如用户在新闻客户端对娱乐、军事、社会等新闻执行的点击、转发、点赞、评论等历史行为)以及用户所处的场景,对用户进行基于场景的新闻推荐,基于此,在获得第一用户的新闻获取请求时,本步骤首先获得第一用户当前所处的第一场景。
用户场景的获取需要基于一系列的场景信息,所述场景信息可以包括但不局限于:用户发出新闻获取请求时所对应的最近一预定时间段内(比如3min)的位置信息、用户所处的网络环境、当前的时间信息以及机型等等,其中,所述各场景信息可在用户触发新闻获取请求时,直接携带在所述新闻获取请求中,或者,也可以在用户触发新闻获取请求(不包括所述场景信息)后,再检测获取这些信息。之后可通过对各场景信息进行处理来获得用户场景。
示例性地,可根据用户在发出新闻获取请求时所对应的最近一预定时间段内(比如3min)的位置信息,分析用户位置的变化速度,进而通过用户位置的变化速度反映用户的交通工具,其中,交通工具可以分为但不限于:[停留,行走,自行车,汽车,火车];根据用户位置是否在经常停留的位置,反映出用户在[家,公司,常访点,途中]中的哪一种;可根据用户当前的实际网络情况及实际时间情况,确定用户的网络环境及当前的时间、日期等信息,其中,网络环境可划分为[wifi,4g,3g,2g,wwan],时间可划分为[0-5,6-9,10-11,12-14,15-17,17-19,20-23],日期可划分为[工作日,非工作日,假期]等等,当然,本实施例提供的这些划分方式仅是为了说明问题而提供的示例性而非限定性划分,实际应用中,不必局限于本实施例提供的划分方式。
在此基础上,可将处理所得的以上各类场景信息作为用户场景的特征分量,并对各特征分量作笛卡尔积,来得到用户的当前场景的向量,参考以下的表1,表1提供了用户场景向量的一具体实例。
表1
名称 | 交通工具 | 位置 | 网络环境 | 时间段 | 日期 |
属性 | 汽车 | 途中 | 4g | 6-9 | 工作日 |
实际应用中,可直接将用户的场景向量(包括各个场景特征分量)作为用户场景,或者,也可以在获得用户的场景向量基础上,推测出一个概括性场景,作为最终的用户场景。比如,可直接将表1的场景向量作为用户场景或者还可以根据表1推测出用户正在上班路上,从而可将用户场景确定为“在上班路上”。
基于以上提供的用户场景的获取过程,本步骤中针对第一用户,可首先获得所述第一用户当前对应的位置信息、网络环境及时间信息等各种场景信息;之后,可根据所述各种场景信息,确定出所述第一用户当前对应的第一场景,该第一场景包括多种场景特征,所述多种场景特征可以包括但不局限于交通工具、位置、网络环境、时间段、日期等等。
步骤102、根据预先制定的用户、用户场景以及用户对新闻的兴趣信息之间的对应关系,确定所述第一用户在所述第一场景对应的针对新闻的第一兴趣信息;其中,所述对应关系基于不同用户在不同场景中对新闻的相应历史行为预先制定。
为了实现为“基于场景的新闻推荐”提供依据,本发明预先制定用户、用户场景以及用户对新闻的兴趣信息之间的对应关系,其中,可预先根据用户在新闻客户端的历史行为,比如,用户在新闻客户端对相应类型新闻的点击(浏览)、转发、评论或点赞等历史行为,来挖掘用户的兴趣。并对用户兴趣和场景做笛卡儿积,来得到用户在不同场景下的兴趣,进而实现为对用户进行基于场景的精准新闻推荐提供依据。
接下来,本实施例对用户、用户场景以及用户对新闻的兴趣信息之间的对应关系的制定过程进行阐述。
新闻客户端每天都会有数万篇新闻入库,为了支持对用户兴趣进行匹配,以及支持根据匹配的用户兴趣进行新闻检索,本实施例中,在对新闻入库时会对新闻打上相应的新闻标签,并根据新闻标签建立倒排索引。具体地,新闻客户端的每篇新闻都具有唯一的ID(IDentity,身份标识号码),新闻入库时会对新闻打上标签,其中,新闻标签可以包括但不限于新闻所属的频道(如娱乐、军事、教育、社会等等)、新闻主题以及新闻关键词等。在对新闻打上标签后,将新闻保存为key-value形式,key指新闻标签,value则指新闻的ID。例如体育类(即新闻标签)新闻对应存储有doc1,doc2,doc4(即新闻ID),社会类(即新闻标签)新闻对应存储有doc3,doc9(即新闻ID)等,从而以key-value形式实现了新闻的倒排索引,按此种方式保存的新闻相比于传统方式中直接以新闻id做key的优势是,能够根据用户的兴趣,迅速检索到用户感兴趣的新闻。
在此基础上,可进行用户兴趣的建立,用户兴趣主要是基于用户在新闻客户端的历史操作记录来进行挖掘的。由于新闻都具有标签,从而可根据用户历史行为对应的新闻标签,映射用户的兴趣标签,比如,针对用户阅读过或点赞或转发过的娱乐类新闻、教育类新闻等对应的频道(娱乐、教育)、主题、关键词等,可将这些新闻标签映射为用户的兴趣标签,用户的兴趣标签同样可以包括但不限于用户感兴趣的新闻的频道、主题及关键词等等。在基于用户的历史行为挖掘用户兴趣的同时,可结合用户的历史场景对挖掘的用户兴趣进行基于场景的权重分配或打分,来表示用户在相应场景中对这些兴趣的偏好程度或强弱,基于场景的兴趣权重分配或打分主要考虑用户点击的次数,相应频道/类型新闻对用户曝光的次数,以及用户行为距离现在的时间间隔等等。例如,用户上个月看了篇体育新闻,和昨天看了篇体育新闻,这两种时间间隔的行为对应的兴趣强度是不同的,一般来说,距当前的时间间隔较小的行为,相比于时间间隔较大的相同行为而言,其对应的兴趣强度要高一些。
其中,可根据用户场景和用户兴趣提取特征,具体地,可以把用户的场景特征、用户的兴趣特征(兴趣标签对应的特征)分别作离散化,例如,网络环境如果是2g,则可将其离散化表示为[1,0,0,0],相对应地,可将3g表示为[0,1,0,1],4g表示为[0,0,1,0],wifi表示为[0,0,0,1],用户的兴趣特征也可以类似表示,比如,假设用户兴趣只包括两种兴趣特征:体育和社会,则可将体育表示为[1,0],社会表示为[0,1],之后,将场景特征和兴趣特征作笛卡尔积,比如将网络环境和用户的兴趣特征作笛卡尔积,那么一个用户在wifi环境下看体育新闻,则可以表示为[0,0,0,1,0,0,0,0],在wifi环境下看社会新闻可以表示为[0,0,0,0,0,0,0,1],在2g环境下看社会新闻可以表示为[0,0,0,0,1,0,0,0]。以此实现了根据用户场景和用户兴趣进行特征提取,并将基于用户场景和兴趣提取的特征表示成向量形式,在此基础上,可把提取的特征对应的向量放到逻辑回归模型中去训练,以得到各个特征对应的权重,由于根据用户场景和用户兴趣提取的特征具体为场景特征与用户兴趣特征的笛卡尔积,从而,训练所得的各个特征的权重,能够表示用户场景的各个场景特征对应于用户的各个兴趣标签的权重。
在此基础上,可将训练所得的用户场景中各个场景特征对应于用户的各个兴趣标签的权重,作为该用户在该场景中对应的针对新闻的兴趣信息,从而得到了用户、用户场景以及用户对新闻的兴趣信息之间的对应关系,实际应用中,可将该对应关系在数据库中进行存储,并作为后续对用户进行基于场景的新闻推荐的依据。
基于以上阐述可知,当获得第一用户的新闻获取请求,并获得第一用户当前对应的第一场景后,可根据预先制定的用户、用户场景以及用户对新闻的兴趣信息之间的对应关系,来确定所述第一用户在所述第一场景中对应的针对新闻的第一兴趣信息,具体地,可以通过查询上述对应关系所在的数据库,确定出所述第一场景的各个场景特征对应于所述第一用户的各个兴趣标签的权重。
步骤103、基于所述第一兴趣信息,对所述第一用户进行新闻推荐。
在获得所述第一用户在所述第一场景对应的针对新闻的第一兴趣信息,即获得所述第一场景的各个场景特征对应于所述第一用户的各个兴趣标签的权重后,可根据所述第一场景的各个场景特征对应于所述第一用户的各个兴趣标签的权重,计算所述第一用户在所述第一场景中对所述第一用户的各个兴趣标签的偏好值;并基于第一用户在所述第一场景中对所述各个兴趣标签的偏好值,向第一用户进行新闻推荐。
具体地,当计算出所述第一用户在所述第一场景中对所述第一用户的各个兴趣标签的偏好值后,可对第一用户的各个兴趣标签按其对应的偏好值降序排列,并从排序序列中取出前预定数量的标签,作为第一用户较为偏好的目标兴趣标签;在此基础上,可按倒排索引方式,从新闻数据库中查询出对应于每个目标兴趣标签的新闻,并将查询得到的各个新闻按新闻所对应的目标兴趣标签的偏好值降序排列,最终按排列后的顺序将各新闻推荐给第一用户,从而实现了向第一用户进行基于场景的新闻推荐。当然,在查询出的新闻数量较庞大时,还可以取排序后的前预定数量的新闻而非全部新闻推荐给用户,或者,将每种兴趣标签对应的前预定数量的新闻推荐给用户等等,本实施例对此不作限定,
由以上方案可知,本实施例提供的新闻推荐方法,在获得第一用户的新闻获取请求时,获得第一用户当前对应的第一场景;根据预先制定的用户、用户场景以及用户对新闻的兴趣信息之间的对应关系,确定所述第一用户在所述第一场景对应的针对新闻的第一兴趣信息;其中,所述对应关系基于不同用户在不同场景中对新闻的相应历史行为预先制定;最终,基于所述第一兴趣信息,对所述第一用户进行新闻推荐。可见,本发明提出了一种依据用户的历史行为并结合用户场景,来对用户进行基于场景的新闻推荐的方案,在推荐新闻时,除了以用户对新闻的历史行为为依据,还同时参考了用户所处的场景,从而能够实现向用户进行更加精准的新闻推荐。
在本发明接下来的另一实施例中,参考图2示出的新闻推荐方法的另一种流程图,所述方法还可以包括:
步骤104、根据第一用户对所推荐的新闻的反馈信息,对所述第一用户在所述第一场景对应的针对新闻的第一兴趣信息进行调整。
在向第一用户进行基于场景的新闻推荐后,用户会对推荐的新闻作出相应反馈,比如,用户对其中某些新闻进行点击浏览,某些新闻进行转发、评论或点赞,而其他的某些新闻则忽略等等。
本实施例旨在根据第一用户对所推荐的新闻的反馈信息,对所述对应关系中第一用户在所述第一场景中对应的针对新闻的第一兴趣信息进行调整,比如,调整第一兴趣信息中的兴趣标签,或者调整第一兴趣信息中某场景特征对某兴趣标签的权重(可理解为调整用户的兴趣模型)等等。
由于用户模型需要实时更新,本实施例优选地采用了一种在线学习的机器学习模型ftrl(Follow-the-regularized-Leader)来进行用户兴趣模型的训练及调整。它能够较好的得到稀疏解,并具有很高的精度。由于这种算法是一种相对比较成熟的算法。这里不再赘述。
本实施例通过基于用户反馈对所述对应关系进行动态调整,能够使得所述对应关系与用户最新的实际行为、实际兴趣情况更为贴合,从而能够进一步提升后续对用户进行基于场景的新闻推荐时的推荐准确度。
本发明在接下来的又一实施例中提供一种新闻推荐装置,该推荐装置可应用于新闻客户端或专门的新闻推荐产品中,旨在结合用户行为及用户所在的场景向用户进行基于场景的新闻推荐,以进一步提升新闻推荐的精准度,参考图3提供的新闻推荐装置的一种结构示意图,所述装置可以包括:
获取单元100,用于在获得第一用户的新闻获取请求时,获得第一用户当前对应的第一场景;确定单元200,用于根据预先制定的用户、用户场景以及用户对新闻的兴趣信息之间的对应关系,确定所述第一用户在所述第一场景对应的针对新闻的第一兴趣信息;其中,所述对应关系基于不同用户在不同场景中对新闻的相应历史行为预先制定;推荐单元300,用于基于所述第一兴趣信息,对所述第一用户进行新闻推荐。
在本发明实施例的一实施方式中,所述获取单元,具体用于:获得所述第一用户当前对应的位置信息、网络环境及时间信息;根据所述位置信息、网络环境及时间信息,确定所述第一用户当前对应的第一场景。
在本发明实施例的一实施方式中,所述确定单元,具体用于:根据预先制定的用户、用户场景以及用户对新闻的兴趣信息之间的对应关系,确定所述第一场景的各个场景特征对应于所述第一用户的各个兴趣标签的权重。
在本发明实施例的一实施方式中,所述推荐单元,具体用于:根据所述第一场景的各个场景特征对应于所述第一用户的各个兴趣标签的权重,计算所述第一用户在所述第一场景中对所述第一用户的各个兴趣标签的偏好值;基于第一用户在所述第一场景中对所述各个兴趣标签的偏好值,向第一用户进行新闻推荐。
在本发明实施例的一实施方式中,所述推荐单元基于第一用户在所述第一场景中对所述各个兴趣标签的偏好值,向第一用户进行新闻推荐,具体包括:从第一用户的各个兴趣标签中,确定出对应的偏好值表示偏好程度较高的预定数量的目标兴趣标签;按倒排索引方式,从新闻数据库中查询对应于每个目标兴趣标签的新闻;将查询得到的各个新闻按新闻所对应的目标兴趣标签的偏好值降序排列,并按排列后的顺序推荐给第一用户。
在本发明实施例的一实施方式中,参考图4提供的新闻推荐装置的另一种结构示意图,所述装置还可以包括:调整单元400,用于根据第一用户对所推荐的新闻的反馈信息,对所述第一用户在所述第一场景对应的针对新闻的第一兴趣信息进行调整。
此处,需要说明的是,本实施例涉及的新闻推荐装置的描述,与上文方法的描述是类似的,且同方法的有益效果描述,对于本发明的新闻推荐装置在本实施例中未披露的技术细节,请参照本发明方法实施例的说明,本实施对此不再作赘述。
还需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
为了描述的方便,描述以上系统或装置时以功能分为各种模块或单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
最后,还需要说明的是,在本文中,诸如第一、第二、第三和第四等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (12)
1.一种新闻推荐方法,其特征在于,包括:
在获得第一用户的新闻获取请求时,获得第一用户当前对应的第一场景;
根据预先制定的用户、用户场景以及用户对新闻的兴趣信息之间的对应关系,确定所述第一用户在所述第一场景对应的针对新闻的第一兴趣信息;其中,所述对应关系基于不同用户在不同场景中对新闻的相应历史行为预先制定;
基于所述第一兴趣信息,对所述第一用户进行新闻推荐;
其中,在所述对应关系中,用户在相应用户场景下对新闻的兴趣信息包括:所述用户场景的各个场景特征对应于所述用户的各个兴趣标签的权重;
则制定用户、用户场景以及用户对新闻的兴趣信息之间的对应关系的过程包括:
根据用户历史行为对应的新闻标签映射用户的兴趣标签;
根据用户场景和用户兴趣进行特征提取,该根据用户场景和用户兴趣进行特征提取的过程包括:把用户的场景特征、用户的兴趣特征分别作离散化,所述场景特征为用户历史行为对应的用户场景所包括的场景特征,所述兴趣特征为用户的兴趣标签对应的兴趣特征;将用户的场景特征和兴趣特征作笛卡尔积,并将该笛卡尔积的结果作为根据用户场景和用户兴趣提取的特征;
将根据用户场景和用户兴趣提取的特征表示成向量形式;
把提取的特征所对应的向量放到逻辑回归模型进行训练,得到各个所提取的特征对应的权重;其中,训练得到的各个特征的权重,能够表示用户场景的各个场景特征对应于用户的各个兴趣标签的权重。
2.根据权利要求1所述的方法,其特征在于,所述获得第一用户当前对应的第一场景,包括:
获得所述第一用户当前对应的位置信息、网络环境及时间信息;
根据所述位置信息、网络环境及时间信息,确定所述第一用户当前对应的第一场景。
3.根据权利要求2所述的方法,其特征在于,
所述根据预先制定的用户、用户场景以及用户对新闻的兴趣信息之间的对应关系,确定所述第一用户在所述第一场景对应的针对新闻的第一兴趣信息,包括:
根据预先制定的用户、用户场景以及用户对新闻的兴趣信息之间的对应关系,确定所述第一场景的各个场景特征对应于所述第一用户的各个兴趣标签的权重。
4.根据权利要求3所述的方法,其特征在于,所述基于所述第一兴趣信息,对所述第一用户进行新闻推荐,包括:
根据所述第一场景的各个场景特征对应于所述第一用户的各个兴趣标签的权重,计算所述第一用户在所述第一场景中对所述第一用户的各个兴趣标签的偏好值;
基于第一用户在所述第一场景中对所述各个兴趣标签的偏好值,向第一用户进行新闻推荐。
5.根据权利要求4所述的方法,其特征在于,所述基于第一用户在所述第一场景中对所述各个兴趣标签的偏好值,向第一用户进行新闻推荐,包括:
从第一用户的各个兴趣标签中,确定出对应的偏好值表示偏好程度较高的预定数量的目标兴趣标签;
按倒排索引方式,从新闻数据库中查询对应于每个目标兴趣标签的新闻;
将查询得到的各个新闻按新闻所对应的目标兴趣标签的偏好值降序排列,并按排列后的顺序推荐给第一用户。
6.根据权利要求1-5任一项所述的方法,其特征在于,还包括:
根据第一用户对所推荐的新闻的反馈信息,对所述第一用户在所述第一场景对应的针对新闻的第一兴趣信息进行调整。
7.一种新闻推荐装置,其特征在于,包括:
获取单元,用于在获得第一用户的新闻获取请求时,获得第一用户当前对应的第一场景;
确定单元,用于根据预先制定的用户、用户场景以及用户对新闻的兴趣信息之间的对应关系,确定所述第一用户在所述第一场景对应的针对新闻的第一兴趣信息;其中,所述对应关系基于不同用户在不同场景中对新闻的相应历史行为预先制定;
推荐单元,用于基于所述第一兴趣信息,对所述第一用户进行新闻推荐;
其中,在所述对应关系中,用户在相应用户场景下对新闻的兴趣信息包括:所述用户场景的各个场景特征对应于所述用户的各个兴趣标签的权重;
则制定用户、用户场景以及用户对新闻的兴趣信息之间的对应关系的过程包括:
根据用户历史行为对应的新闻标签映射用户的兴趣标签;
根据用户场景和用户兴趣进行特征提取,该根据用户场景和用户兴趣进行特征提取的过程包括:把用户的场景特征、用户的兴趣特征分别作离散化,所述场景特征为用户历史行为对应的用户场景所包括的场景特征,所述兴趣特征为用户的兴趣标签对应的兴趣特征;将用户的场景特征和兴趣特征作笛卡尔积,并将该笛卡尔积的结果作为根据用户场景和用户兴趣提取的特征;
将根据用户场景和用户兴趣提取的特征表示成向量形式;
把提取的特征所对应的向量放到逻辑回归模型进行训练,得到各个所提取的特征对应的权重;其中,训练得到的各个特征的权重,能够表示用户场景的各个场景特征对应于用户的各个兴趣标签的权重。
8.根据权利要求7所述的装置,其特征在于,所述获取单元,具体用于:
获得所述第一用户当前对应的位置信息、网络环境及时间信息;根据所述位置信息、网络环境及时间信息,确定所述第一用户当前对应的第一场景。
9.根据权利要求8所述的装置,其特征在于,所述确定单元,具体用于:根据预先制定的用户、用户场景以及用户对新闻的兴趣信息之间的对应关系,确定所述第一场景的各个场景特征对应于所述第一用户的各个兴趣标签的权重。
10.根据权利要求9所述的装置,其特征在于,所述推荐单元,具体用于:
根据所述第一场景的各个场景特征对应于所述第一用户的各个兴趣标签的权重,计算所述第一用户在所述第一场景中对所述第一用户的各个兴趣标签的偏好值;基于第一用户在所述第一场景中对所述各个兴趣标签的偏好值,向第一用户进行新闻推荐。
11.根据权利要求10所述的装置,其特征在于,所述推荐单元基于第一用户在所述第一场景中对所述各个兴趣标签的偏好值,向第一用户进行新闻推荐,具体包括:
从第一用户的各个兴趣标签中,确定出对应的偏好值表示偏好程度较高的预定数量的目标兴趣标签;按倒排索引方式,从新闻数据库中查询对应于每个目标兴趣标签的新闻;将查询得到的各个新闻按新闻所对应的目标兴趣标签的偏好值降序排列,并按排列后的顺序推荐给第一用户。
12.根据权利要求7-11任一项所述的装置,其特征在于,还包括:
调整单元,用于根据第一用户对所推荐的新闻的反馈信息,对所述第一用户在所述第一场景对应的针对新闻的第一兴趣信息进行调整。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710730800.2A CN107465754B (zh) | 2017-08-23 | 2017-08-23 | 一种新闻推荐方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710730800.2A CN107465754B (zh) | 2017-08-23 | 2017-08-23 | 一种新闻推荐方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107465754A CN107465754A (zh) | 2017-12-12 |
CN107465754B true CN107465754B (zh) | 2020-05-22 |
Family
ID=60550309
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710730800.2A Active CN107465754B (zh) | 2017-08-23 | 2017-08-23 | 一种新闻推荐方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107465754B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108595580B (zh) * | 2018-04-17 | 2022-08-09 | 创新先进技术有限公司 | 新闻推荐方法、装置、服务器及存储介质 |
CN108696577A (zh) * | 2018-04-18 | 2018-10-23 | 上海小蚁科技有限公司 | 一种资讯推送方法及装置、存储介质、服务器 |
CN108829808B (zh) * | 2018-06-07 | 2021-07-13 | 麒麟合盛网络技术股份有限公司 | 一种页面个性化排序方法、装置及电子设备 |
CN110020192A (zh) * | 2018-07-31 | 2019-07-16 | 北京微播视界科技有限公司 | 一种信息内容推送方法和装置、服务端设备 |
CN109299369B (zh) * | 2018-10-09 | 2021-04-23 | 北京奇艺世纪科技有限公司 | 一种推荐数据的确定方法、装置及服务器 |
CN110427550A (zh) * | 2019-06-27 | 2019-11-08 | 乐安县云智易联科技有限公司 | 资讯推荐方法及装置 |
CN110502299B (zh) * | 2019-08-12 | 2021-05-14 | 南京大众书网图书文化有限公司 | 一种用于提供小说信息的方法与设备 |
CN111401820A (zh) * | 2020-04-09 | 2020-07-10 | 福建好运联联信息科技有限公司 | 一种提高社交平台的物流效率的方法及终端 |
CN111597458B (zh) * | 2020-04-15 | 2023-11-17 | 北京百度网讯科技有限公司 | 场景元素的抽取方法、装置、设备及存储介质 |
CN111523007B (zh) * | 2020-04-27 | 2023-12-26 | 北京百度网讯科技有限公司 | 用户感兴趣信息确定方法、装置、设备以及存储介质 |
CN111914172B (zh) * | 2020-07-29 | 2021-09-10 | 上海梅斯医药科技有限公司 | 一种基于用户标签的医学信息推荐方法及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103996088A (zh) * | 2014-06-10 | 2014-08-20 | 苏州工业职业技术学院 | 基于多维特征组合逻辑回归的广告点击率预测方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070104186A1 (en) * | 2005-11-04 | 2007-05-10 | Bea Systems, Inc. | System and method for a gatekeeper in a communications network |
CN103106259B (zh) * | 2013-01-25 | 2016-01-20 | 西北工业大学 | 一种基于情境的移动网页内容推荐方法 |
CN104008184A (zh) * | 2014-06-10 | 2014-08-27 | 百度在线网络技术(北京)有限公司 | 信息的推送方法和装置 |
CN104794207B (zh) * | 2015-04-23 | 2018-04-10 | 山东大学 | 一种基于协作的推荐系统及其工作方法 |
CN105608121B (zh) * | 2015-12-14 | 2020-09-25 | 东软集团股份有限公司 | 一种个性化推荐方法及装置 |
-
2017
- 2017-08-23 CN CN201710730800.2A patent/CN107465754B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103996088A (zh) * | 2014-06-10 | 2014-08-20 | 苏州工业职业技术学院 | 基于多维特征组合逻辑回归的广告点击率预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107465754A (zh) | 2017-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107465754B (zh) | 一种新闻推荐方法和装置 | |
CN108229590B (zh) | 一种获取多标签用户画像的方法和装置 | |
US10685065B2 (en) | Method and system for recommending content to a user | |
US10180979B2 (en) | System and method for generating suggestions by a search engine in response to search queries | |
CN109522480B (zh) | 一种信息推荐方法、装置、电子设备及存储介质 | |
CN108363821A (zh) | 一种信息推送方法、装置、终端设备及存储介质 | |
US11238233B2 (en) | Artificial intelligence engine for generating semantic directions for websites for automated entity targeting to mapped identities | |
US20140257795A1 (en) | Linguistic Expression of Preferences in Social Media for Prediction and Recommendation | |
CN108205766A (zh) | 信息推送方法、装置及系统 | |
CN105718184A (zh) | 一种数据处理方法和装置 | |
CN102799591A (zh) | 一种提供推荐词的方法及装置 | |
CA3059929C (en) | Text searching method, apparatus, and non-transitory computer-readable storage medium | |
CN103295145A (zh) | 一种基于用户消费特征向量的手机广告投放方法 | |
CN108763321A (zh) | 一种基于大规模相关实体网络的相关实体推荐方法 | |
CN106296257A (zh) | 一种基于用户行为分析的固定广告位投放方法及系统 | |
KR101963817B1 (ko) | 키워드 검색량 기반 예측 정보 생성 장치 및 방법 | |
CN103514181A (zh) | 一种搜索方法和装置 | |
CN111400613A (zh) | 物品推荐方法、装置、介质及计算机设备 | |
CN104765758A (zh) | 用于搜索结果定向的系统和方法 | |
CN101382939A (zh) | 基于眼球跟踪的网页文本个性化搜索方法 | |
US20230015090A1 (en) | Systems and Methods for Dynamically Classifying Products and Assessing Applicability of Product Regulations | |
CN105022830A (zh) | 一种基于用户行为的加权轨迹数据集构建方法 | |
CN110309406B (zh) | 点击率预估方法、装置、设备及存储介质 | |
CN101000632A (zh) | 意向驱动的博客搜索以及浏览系统 | |
KR20190081671A (ko) | 온라인 쇼핑몰 통합 관리 시스템에서의 유사상품을 검색하는 방법 및 그 서버 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |