CN108052597A - 新闻推送的方法、装置、设备及计算机可读介质 - Google Patents

新闻推送的方法、装置、设备及计算机可读介质 Download PDF

Info

Publication number
CN108052597A
CN108052597A CN201711321051.4A CN201711321051A CN108052597A CN 108052597 A CN108052597 A CN 108052597A CN 201711321051 A CN201711321051 A CN 201711321051A CN 108052597 A CN108052597 A CN 108052597A
Authority
CN
China
Prior art keywords
push
news
user
user group
target user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711321051.4A
Other languages
English (en)
Inventor
王梦来
李会鹏
朱振
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201711321051.4A priority Critical patent/CN108052597A/zh
Publication of CN108052597A publication Critical patent/CN108052597A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明提出一种新闻推送的方法,包括以下步骤:接收需要推送的新闻资讯;召回与所述新闻资讯相关的目标用户群;对所述目标用户群内的每个目标用户分别计算推送概率值,具体包括:根据当前时间特征、推送频率特征和点击到达率特征,计算每个目标用户的推送概率值;判断所述推送概率值是否大于设定阈值,若是则推送新闻资讯至对应的目标用户。本发明实施例在向目标用户推送新闻资讯时,结合了时间特征和频率特征的判断,从而可以在恰当的时间给用户推送新闻资讯。另外,通过点击到达率预估,可以给目标用户推送最适合的新闻资讯,从而可以提高推送的准确性。

Description

新闻推送的方法、装置、设备及计算机可读介质
技术领域
本发明涉及大数据技术领域,尤其涉及一种新闻推送的方法及装置、设备和计算机可读介质。
背景技术
推送类信息流广泛应用于资讯类应用(Application,APP)。当用户打开APP,APP会根据用户的兴趣爱好和历史浏览记录个性化的推荐文章,这种模式依赖于用户主动打开APP。因此,目前大多采用自动推送的模式。而目前的新闻推送系统一般包括以下三种:
1、全量广播,即人工选出一篇最新最热的文章推送给所有的用户。
2、离线产出各个分类或者标签对应的用户包,人工指定文章推送指定用户包。
3、机器挖掘新闻,根据用户点击的历史数据判断其兴趣偏好,给用户推送其可能感兴趣的文章。
然而,第一种技术方案的缺点是:无个性化,推送方式简单粗暴,效果完全依赖于发送推送资讯的人员的先验知识,资源好点击率就高,资源不好点击率就低,且对用户存在一定程度的打扰。
第二种技术方案的缺点是:虽然存在一定程度的个性化,但是个性化的粒度很粗,只计算了用户对于某些标签的喜好程度,在实际场景中我们需要计算用户对于某篇文章的喜好程度,同时,离线用户包方式没有考虑时间因素,用户在当前时刻是否应该推送资讯,在当前时间推送资讯是否能达到收益最大化。
第三种技术方案的缺点是:虽然个性化程度足够,但是没有考虑用户推送频次的限制和推送时间选择,会存在如果一个用户比较活跃,该用户多篇文章召回多次,更极端情况是一个用户几分钟之内被召回多次,在短时间内一个用户被推送多篇文章,造成不好的用户体验。
发明内容
本发明实施例提供一种新闻推送的方法、装置、设备及计算机可读介质,以至少解决现有技术中的以上技术问题。
第一方面,本发明实施例提供了一种新闻推送的方法,包括以下步骤:
接收需要推送的新闻资讯;
召回与所述新闻资讯相关的目标用户群;
对所述目标用户群内的每个目标用户分别计算推送概率值;
判断所述推送概率值是否大于设定阈值,若是则推送新闻资讯至对应的目标用户。
结合第一方面,本发明在第一方面的第一种实现方式中,所述召回与所述新闻资讯相关的目标用户群包括:
基于倒排索引的方式,获取第一用户群;
基于语义向量的相关性计算,获取第二用户群;
通过离线用户包的调取,获取第三用户群;
对第一用户群、第二用户群和第三用户群求取并集,获得目标用户群。
结合第一方面,本发明在第一方面的第二种实现方式中,所述对所述目标用户群内的每个目标用户分别计算推送概率值包括:根据当前时间特征、推送频率特征和点击到达率特征,计算每个目标用户的推送概率值。
结合第一方面的第二种实现方式,本发明在第一方面的第三种实现方式中,所述当前时间特征包括:当前时间点和当前时间与目标用户上一次被推送的时间间隔。
结合第一方面的第二种实现方式,本发明在第一方面的第四种实现方式中,所述推送频率特征包括:目标用户当前被推送的次数。
结合第一方面的第二种实现方式,本发明在第一方面的第五种实现方式中,所述点击到达率特征包括:当前新闻资讯的点击到达率分数。
结合第一方面的第五种实现方式,本发明在第一方面的第六种实现方式中,所述判断所述推送概率值是否大于设定阈值,若是则推送新闻资讯至对应的目标用户的步骤具体包括:推送点击到达率分数值最大的新闻资讯至目标用户
结合第一方面,本发明在第一方面的第七种实现方式中,在所述判断所述推送概率值是否大于设定阈值,若是则推送新闻资讯至对应的目标用户之后还包括:接收目标用户的反馈日志。
第二方面,本发明实施例提供了一种新闻推送的装置,包括:
获取模块,用于接收需要推送的新闻资讯;
召回模块,用于召回与所述新闻资讯相关的目标用户群;
触发模块,用于对所述目标用户群内的每个目标用户分别计算推送概率值,具体包括:根据当前时间特征、推送频率特征和点击到达率特征,计算每个目标用户的推送概率值;
推送模块,用于判断所述推送概率值是否大于设定阈值,若是则进行新闻资讯推送。
结合第二方面,本发明在第二方面的第一种实现方式中,所述召回模块中包括:
第一召回子模块,用于基于倒排索引的方式,获取第一用户群;
第二召回子模块,用于基于语义向量的相关性计算,获取第二用户群;
第三召回子模块,用于通过离线用户包的调取,获取第三用户群;
并集子模块,用于对第一用户群、第二用户群和第三用户群求取并集,获得目标用户群。
结合第二方面,本发明在第二方面的第二种实现方式中,所述触发模块具体用于根据当前时间特征、推送频率特征和点击到达率特征,计算每个目标用户的推送概率值。
结合第二方面的第二种实现方式,本发明在第二方面的第三种实现方式中,所述当前时间特征包括:当前时间点和当前时间与目标用户上一次被推送的时间间隔。
结合第二方面的第二种实现方式,本发明在第二方面的第四种实现方式中,所述推送频率特征包括:目标用户当前被推送的次数。
结合第二方面的第二种实现方式,本发明在第二方面的第五种实现方式中,所述点击到达率特征包括:当前新闻资讯的点击到达率分数。
结合第二方面的第五种实现方式,本发明在第二方面的第六种实现方式中,所述推送模块中具体推送点击到达率分数值最大的新闻资讯至目标用户。
结合第二方面,本发明在第二方面的第七种实现方式中,还包括反馈模块,用于接收目标用户的反馈日志。
所述装置的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
在一个可能的设计中,新闻推送的装置的结构中包括处理器和存储器,所述存储器用于存储支持新闻推送的装置执行上述第一方面中新闻推送的方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述新闻推送的装置还可以包括通信接口,用于新闻推送的装置与其他设备或通信网络通信。
第三方面,本发明实施例提供了一种计算机可读介质,用于存储新闻推送的装置所用的计算机软件指令,其包括用于执行上述第一方面的新闻推送的方法所涉及的程序。
上述技术方案中的一个技术方案具有如下优点或有益效果:本发明实施例在向目标用户推送新闻资讯时,结合了时间特征和频率特征的判断,从而可以在恰当的时间给用户推送新闻资讯。另外,通过点击到达率预估,可以给目标用户推送最适合的新闻资讯,从而可以提高推送的准确性。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。
图1为实施例一的新闻推送方法的步骤流程图;
图2实施例一的步骤S120的具体步骤流程图;
图3为实施例二的新闻推送的方法步骤流程图;
图4为实施例三的新闻推送的装置的连接框图;
图5为实施例四的新闻推送的装置的连接框图;
图6为实施例五的新闻推送的设备连接框图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
本发明实施例旨在解决现有技术中新闻推送时个性化程度不够,以及没有充分考虑用户推送频率和推送时间的技术问题。本发明实施例主要在向目标用户推送新闻资讯时,结合了时间特征和频率特征的判断,从而提高给用户推送新闻资讯的准确性,下面分别通过以下实施例进行技术方案的展开描述。
实施例一
请参阅图1,其为本发明实施例一的新闻推送方法的步骤流程图。本实施例一提供了一种新闻推送方法,包括以下步骤:
S110:接收需要推送的新闻资讯。
在本步骤中,所述新闻资讯可以通过资源挖掘,热门消息的收集等方式进行获取,然后再进行编辑成对应的新闻资讯。
S120:召回与所述新闻资讯相关的目标用户群。
当收到需要推送新闻资讯后,则需要针对该新闻资讯的内容召回对应目标用户群。如图2所示,而在本实施例一中,召回目标用户群的方式可以包括以下步骤:
S121:基于倒排索引的方式,获取第一用户群。
在本步骤中,根据所述新闻资讯的属性特征搜索相应的用户群体。例如,若当前新闻资讯为娱乐类新闻资讯,则可以根据该新闻资讯特征,搜索对娱乐类感兴趣的用户群体。
S122:基于语义向量的相关性计算,获取第二用户群。
在本步骤中,根据语义向量进行用户群体的匹配筛选。新闻资讯的内容可以转化为对应的语义向量,根据用户的兴趣也可以转化为对应的向量,然后求取两者的余弦值,若余弦值越接近1,则代表这两者的相关性越大。比如,将当前新闻资讯的语义内容转化为对应的语义向量,然后与用户群体的向量求取余弦值。假设当前新闻资讯为娱乐类新闻资讯,而用户的感兴趣的点也在娱乐类上,则这两者的相关性就越大。
S123:通过离线用户包的调取,获取第三用户群。
在本步骤中,所述离线用户包为根据不同类型将用户进行划分,然后再进行存储。根据推送的资讯的内容类型,寻找与之相同类型的用户群体,然后将相同类型的用户群体挑选出来。
S124:对第一用户群、第二用户群和第三用户群求取并集,获得目标用户群。
通过以上三种方式获取的用户群体,有可能存在重叠部分,因此在本步骤中将以上三种方式获取的用户群体求取并集,去除重叠的用户,最终获得完整的目标用户群。
S130:对所述目标用户群内的每个目标用户分别计算推送概率值,具体包括:根据当前时间特征、推送频率特征和点击到达率(CTR)特征,计算每个目标用户的推送概率值。
在本步骤中,所述当前时间特征可以包括当前时间点和当前时间与目标用户上一次被推送的时间间隔等。所述推送频率特征可以包括目标用户当前被推送的次数。所述CTR(Click-Through-Rate)特征可以包括:当前新闻资讯的CTR分数。
在本步骤中,结合了当前时间点的因素,考虑是否应当向用户推送新闻资讯。假如,当前时间点为凌晨一二点,此时目标用户并不处于活跃状态,若此时推送对应新闻资讯至用户,则会给用户造成困扰。另外,若前后两次推送的时间太短,则也容易在短时间内造成多次推送的现象,给用户带来了不便。同时,还应该充分考虑用户的被推送的次数和频率,比如可以设定推送的次数阈值等方式,当推送的次数达到设定阈值,则不再推送新闻资讯。另外,还应当考虑到新闻资讯本身的CTR得分,即可以通过现有的一些CTR模型对当前新闻资讯进行CTR预估,获得当前新闻资讯的CTR得分,从而判断是否应当向用户推送该新闻资讯。
需要说明的是,以上时间特征、推送频率特征和CTR特征的具体应用方式,可以根据实际情况进行设定,并不限定于上述列举的应用方式。另外,根据实际情况,还可以在推送的模型中加入以下特征:历史活跃程度、积压文章数、历史点击时间、用户文章匹配度、用户资源类型、用户推送历史等等。
S140:判断所述推送概率值是否大于设定阈值,若是则推送新闻资讯至对应的目标用户。
在本步骤中可以通过分布文件系统(HDFS)的方式向目标用户推送对应的新闻资讯。另外,如果同时有多篇新闻资讯的推送的概率值大于设定的阈值,则挑选CTR分数值最大的新闻资讯推送给目标用户。
实施例二
与实施例一的区别在于:本实施例二在S140推送步骤之后,还包括了用于接收用户的反馈日志,具体的方案如下:
如图3所示,其为本实施例二的新闻推送方法的步骤流程图。本实施例二的新闻推送方法包括以下步骤:
S210:接收需要推送的新闻资讯。
S220:召回与所述新闻资讯相关的目标用户群。
S230:对所述目标用户群内的每个目标用户分别计算推送概率值,具体包括:根据当前时间特征、推送频率特征和点击到达率特征,计算每个目标用户的推送概率值。
S240:判断所述推送概率值是否大于设定阈值,若是则推送新闻资讯至对应的目标用户。
S250:接收用户的反馈日志。
在本实施例二中,通过增加可以根据用户的反馈日志获取用户的兴趣点,从而对用户进行分类的调整。比如:当推送了娱乐新闻至目标用户,而目标用户联系多次都未点击该新闻资讯,则有可能该目标用户对该类型的新闻不感兴趣,则相应地需要调整目标用户的分类。
实施例三
本实施例三对应于实施例一,提供了一种新闻推送的装置。请参阅图4,其为本实施例三的新闻推送的装置的连接框图。
本实施例三的新闻推送的装置,包括:
获取模块110,用于接收需要推送的新闻资讯。
召回模块120,用于召回与所述新闻资讯相关的目标用户群。所述召回模块120中包括:
第一召回子模块121,用于基于倒排索引的方式,获取第一用户群。
第二召回子模块122,用于基于语义向量的相关性计算,获取第二用户群。
第三召回子模块123,用于通过离线用户包的调取,获取第三用户群。
并集子模块124,用于对第一用户群、第二用户群和第三用户群求取并集,获得目标用户群。
触发模块130,用于对所述目标用户群内的每个目标用户分别计算推送概率值,具体包括:根据当前时间特征、推送频率特征和点击到达率(CTR)特征,计算每个目标用户的推送概率值。所述当前时间特征包括:当前时间点和当前时间与目标用户上一次被推送的时间间隔。所述推送频率特征包括:目标用户当前被推送的次数。所述CTR特征包括:当前新闻资讯的CTR分数。
推送模块140,用于判断所述推送概率值是否大于设定阈值,若是则进行新闻资讯推送。
本实施例三与实施例一的原理相同,故不再赘述。
实施例四
本实施例四与实施例二对应,提供了一种新闻推送的装置,具体如下:
如图5所示,为本实施例四的新闻推送的装置的连接框图。本发明实施例四提供了一种新闻推送的装置,包括:
获取模块210,用于接收需要推送的新闻资讯。
召回模块220,用于召回与所述新闻资讯相关的目标用户群。
触发模块230,用于对所述目标用户群内的每个目标用户分别计算推送概率值,具体包括:根据当前时间特征、推送频率特征和CTR特征,计算每个目标用户的推送概率值。所述当前时间特征包括:当前时间点和当前时间与目标用户上一次被推送的时间间隔。所述推送频率特征包括:目标用户当前被推送的次数。所述CTR特征包括:当前新闻资讯的CTR分数。
推送模块240,用于判断所述推送概率值是否大于设定阈值,若是则进行新闻资讯推送。
反馈步骤250,用于接收用户的反馈日志。
本实施例四的应用方式与原理与实施例二相同,故不再赘述。
实施例五
本发明实施例五提供一种新闻推送的设备,如图6所示,该设备包括:存储器310和处理器320,存储器310内存储有可在处理器320上运行的计算机程序。所述处理器320执行所述计算机程序时实现上述实施例中的新闻推送的方法。所述存储器310和处理器320的数量可以为一个或多个。
该设备还包括:
通信接口330,用于与外界设备进行通信,进行数据交互传输。
存储器310可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器310、处理器320和通信接口330独立实现,则存储器310、处理器320和通信接口330可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,PeripheralComponent)总线或扩展工业标准体系结构(EISA,Extended Industry StandardComponent)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器310、处理器320及通信接口330集成在一块芯片上,则存储器310、处理器320及通信接口330可以通过内部接口完成相互间的通信。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
本发明实施例所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质的更具体的示例至少(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,计算机可读存储介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
在本发明实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于指令执行系统、输入法或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、射频(Radio Frequency,RF)等等,或者上述的任意合适的组合。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器,磁盘或光盘等。
综上所述,本发明实施例在向目标用户推送新闻资讯时,结合了时间特征和频率特征的判断,从而可以在恰当的时间给用户推送新闻资讯。另外,通过CTR预估,给目标用户推送最适合的新闻资讯,可以提高准确性。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (18)

1.一种新闻推送的方法,其特征在于,包括
接收需要推送的新闻资讯;
召回与所述新闻资讯相关的目标用户群;
对所述目标用户群内的每个目标用户分别计算推送概率值;
判断所述推送概率值是否大于设定阈值,若是则推送新闻资讯至对应的目标用户。
2.根据权利要求1所述的新闻推送的方法,其特征在于,所述召回与所述新闻资讯相关的目标用户群的步骤包括:
基于倒排索引的方式,获取第一用户群;
基于语义向量的相关性计算,获取第二用户群;
通过离线用户包的调取,获取第三用户群;
对第一用户群、第二用户群和第三用户群求取并集,获得目标用户群。
3.根据权利要求1所述的新闻推送的方法,其特征在于,所述对所述目标用户群内的每个目标用户分别计算推送概率值的步骤包括:根据当前时间特征、推送频率特征和点击到达率特征,计算每个目标用户的推送概率值。
4.根据权利要求3所述的新闻推送的方法,其特征在于,所述当前时间特征包括:当前时间点和当前时间与目标用户上一次被推送的时间间隔。
5.根据权利要求3所述的新闻推送的方法,其特征在于,所述推送频率特征包括:目标用户当前被推送的次数。
6.根据权利要求3所述的新闻推送的方法,其特征在于,所述点击到达率特征包括:当前新闻资讯的点击到达率分数。
7.根据权利要求6所述的新闻推送的方法,其特征在于,所述判断所述推送概率值是否大于设定阈值,若是则推送新闻资讯至对应的目标用户的步骤具体包括:推送点击到达率的分数值最大的新闻资讯至目标用户。
8.根据权利要求1所述的新闻推送的方法,其特征在于,在所述判断所述推送概率值是否大于设定阈值,若是则推送新闻资讯至对应的目标用户的步骤之后还包括:接收目标用户的反馈日志。
9.一种新闻推送的装置,其特征在于,包括:
获取模块,用于接收需要推送的新闻资讯;
召回模块,用于召回与所述新闻资讯相关的目标用户群;
触发模块,用于对所述目标用户群内的每个目标用户分别计算推送概率值;
推送模块,用于判断所述推送概率值是否大于设定阈值,若是则进行新闻资讯推送。
10.根据权利要求9所述的新闻推送的装置,其特征在于,所述召回模块中包括:
第一召回子模块,用于基于倒排索引的方式,获取第一用户群;
第二召回子模块,用于基于语义向量的相关性计算,获取第二用户群;
第三召回子模块,用于通过离线用户包的调取,获取第三用户群;
并集子模块,用于对第一用户群、第二用户群和第三用户群求取并集,获得目标用户群。
11.根据权利要求9所述的新闻推送的装置,其特征在于,所述触发模块具体用于根据当前时间特征、推送频率特征和点击到达率特征,计算每个目标用户的推送概率值。
12.根据权利要求11所述的新闻推送的装置,其特征在于,所述当前时间特征包括:当前时间点和当前时间与目标用户上一次被推送的时间间隔。
13.根据权利要求11所述的新闻推送的装置,其特征在于,所述推送频率特征包括:目标用户当前被推送的次数。
14.根据权利要求11所述的新闻推送的装置,其特征在于,所述点击到达率特征包括:当前新闻资讯的点击到达率分数。
15.根据权利要求14所述的新闻推送的装置,其特征在于,所述推送模块中具体推送点击到达率分数值最大的新闻资讯至目标用户。
16.根据权利要求9所述的新闻推送的装置,其特征在于,还包括反馈模块,用于接收目标用户的反馈日志。
17.一种新闻推送的设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-8中任一所述的新闻推送的方法。
18.一种计算机可读介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8中任一所述的新闻推送的方法。
CN201711321051.4A 2017-12-12 2017-12-12 新闻推送的方法、装置、设备及计算机可读介质 Pending CN108052597A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711321051.4A CN108052597A (zh) 2017-12-12 2017-12-12 新闻推送的方法、装置、设备及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711321051.4A CN108052597A (zh) 2017-12-12 2017-12-12 新闻推送的方法、装置、设备及计算机可读介质

Publications (1)

Publication Number Publication Date
CN108052597A true CN108052597A (zh) 2018-05-18

Family

ID=62123807

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711321051.4A Pending CN108052597A (zh) 2017-12-12 2017-12-12 新闻推送的方法、装置、设备及计算机可读介质

Country Status (1)

Country Link
CN (1) CN108052597A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110765358A (zh) * 2019-10-25 2020-02-07 秒针信息技术有限公司 一种资讯推送方法、装置、电子设备及可读存储介质
CN111343045A (zh) * 2020-02-14 2020-06-26 青岛聚看云科技有限公司 调整心跳频率的方法及装置
CN112948402A (zh) * 2021-01-15 2021-06-11 浙江大华技术股份有限公司 数据库更新方法、装置、电子设备、计算机可读存储介质
CN114036391A (zh) * 2021-11-17 2022-02-11 北京百度网讯科技有限公司 数据推送方法、装置、电子设备和存储介质
CN115080862A (zh) * 2022-07-20 2022-09-20 广州市保伦电子有限公司 基于推荐算法的会议推荐系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103714067A (zh) * 2012-09-29 2014-04-09 腾讯科技(深圳)有限公司 一种信息推送方法和装置
CN105045831A (zh) * 2015-06-30 2015-11-11 北京奇艺世纪科技有限公司 一种消息推送方法及装置
CN106202475A (zh) * 2016-07-18 2016-12-07 合网络技术(北京)有限公司 一种视频推荐列表的推送方法及装置
CN107360246A (zh) * 2017-07-28 2017-11-17 广州优视网络科技有限公司 一种消息推送方法及装置、一种终端及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103714067A (zh) * 2012-09-29 2014-04-09 腾讯科技(深圳)有限公司 一种信息推送方法和装置
CN105045831A (zh) * 2015-06-30 2015-11-11 北京奇艺世纪科技有限公司 一种消息推送方法及装置
CN106202475A (zh) * 2016-07-18 2016-12-07 合网络技术(北京)有限公司 一种视频推荐列表的推送方法及装置
CN107360246A (zh) * 2017-07-28 2017-11-17 广州优视网络科技有限公司 一种消息推送方法及装置、一种终端及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
丛文卓: "《深度微商》", 31 May 2016, 清华大学出版社 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110765358A (zh) * 2019-10-25 2020-02-07 秒针信息技术有限公司 一种资讯推送方法、装置、电子设备及可读存储介质
CN110765358B (zh) * 2019-10-25 2022-08-09 秒针信息技术有限公司 一种资讯推送方法、装置、电子设备及可读存储介质
CN111343045A (zh) * 2020-02-14 2020-06-26 青岛聚看云科技有限公司 调整心跳频率的方法及装置
CN111343045B (zh) * 2020-02-14 2022-06-28 青岛聚看云科技有限公司 调整心跳频率的方法及装置
CN112948402A (zh) * 2021-01-15 2021-06-11 浙江大华技术股份有限公司 数据库更新方法、装置、电子设备、计算机可读存储介质
CN114036391A (zh) * 2021-11-17 2022-02-11 北京百度网讯科技有限公司 数据推送方法、装置、电子设备和存储介质
CN115080862A (zh) * 2022-07-20 2022-09-20 广州市保伦电子有限公司 基于推荐算法的会议推荐系统
CN115080862B (zh) * 2022-07-20 2022-11-15 广州市保伦电子有限公司 基于推荐算法的会议推荐系统

Similar Documents

Publication Publication Date Title
CN108052597A (zh) 新闻推送的方法、装置、设备及计算机可读介质
CN104469423B (zh) 一种虚拟道具下发方法及相关设备、系统
CN107967357A (zh) 一种好友的推送方法、系统及终端设备
CN103150669B (zh) 广告主不披露私有信息并使用私有信息投放广告的方法
CN105302887A (zh) 信息的推送方法和推送装置
CN106997357A (zh) 一种消息处理方法、装置及系统
CN104537115A (zh) 用户兴趣的探索方法和装置
CN107360246A (zh) 一种消息推送方法及装置、一种终端及存储介质
CN107918649A (zh) 信息推荐和搜索方法、装置、设备及计算机可读介质
CN107463552A (zh) 一种生成视频主题名称的方法和装置
CN110210899A (zh) 基于广告相似性的广告推送方法、装置和设备
CN105262794A (zh) 内容投放方法及装置
CN107968842A (zh) 基于分布式系统的新闻推送方法、装置及设备
CN105354722A (zh) 信息投放方法及装置
CN109168019A (zh) 直播处理方法、装置、设备及计算机可读介质
CN105488109A (zh) 内容项目排布方法、装置及系统
CN108363730A (zh) 一种内容推荐方法、系统及终端设备
WO2020258773A1 (zh) 确定推送用户群的方法、装置、设备及存储介质
CN109033190B (zh) 一种推荐信息的推送方法、装置及设备
CN108335136A (zh) 一种广告定价方法及计算设备
CN108492136A (zh) 一种广告物料推荐方法、装置及服务器
CN105183295A (zh) 一种应用图标的归类方法及终端
CN111681042A (zh) 广告推荐方法、服务器及终端设备
CN108123972A (zh) 多媒体文件的分配方法及装置
CN110457596A (zh) 一种资源推荐处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180518