CN107968842B - 基于分布式系统的新闻推送方法、装置及设备 - Google Patents

基于分布式系统的新闻推送方法、装置及设备 Download PDF

Info

Publication number
CN107968842B
CN107968842B CN201711430481.XA CN201711430481A CN107968842B CN 107968842 B CN107968842 B CN 107968842B CN 201711430481 A CN201711430481 A CN 201711430481A CN 107968842 B CN107968842 B CN 107968842B
Authority
CN
China
Prior art keywords
news
user
pushing
target
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711430481.XA
Other languages
English (en)
Other versions
CN107968842A (zh
Inventor
王梦来
李会鹏
朱振
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201711430481.XA priority Critical patent/CN107968842B/zh
Publication of CN107968842A publication Critical patent/CN107968842A/zh
Application granted granted Critical
Publication of CN107968842B publication Critical patent/CN107968842B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/60Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
    • H04L67/62Establishing a time schedule for servicing the requests

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于分布式系统的新闻推送方法、装置及设备,其中,分布式系统包括:中控机和多台从机,方法包括:中控机在预设的触发时间,将当前时间获取的所有审核的新闻资源平均分配到多台从机上;从机根据预设的用户推荐特征将分配到的新闻资源与用户进行匹配,将新闻资源添加到匹配成功的目标用户的待推送队列中,并向中控机发送匹配完成响应;中控机在获取所有从机发送的匹配完成响应后,向多台从机发送推送激活消息;从机根据目标用户当前的待推送队列,计算是否有满足推送条件的目标新闻,若存在目标新闻,则计算推送时间,并在推送时间向目标用户推送目标新闻。保证了新闻推送的精准性和时效性,智能的决定推送时间,提升用户体验。

Description

基于分布式系统的新闻推送方法、装置及设备
技术领域
本发明涉及信息处理技术领域,尤其涉及一种基于分布式系统的新闻推送方法、装置及设备。
背景技术
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。
目前,随着互联网、终端设备等技术的快速发展,用户面临着信息过剩的问题。比如腾讯、新浪、网易、中国新闻网、环球时报、凤凰资讯等新闻网站一天的新闻量之和达到10万有余,用户无法从中找出可能感兴趣的新闻,并且大多数用户不会主动去关注新闻,而是利用碎片时间被动的接收一些头条新闻,因此,需要对用户进行新闻推送。
相关技术中,新闻推送的方式主要有三种,比如人工选择当前最新最热的新闻推送给全体用户;再比如人工筛选多个类别的新闻,推送给不同类别的用户;又比如通过机器挖掘新闻,进而根据用户点击的历史数据判断其信息偏好来推送更多类似内容。上述新闻推送方式的精准度不高,不能保证新闻的时效性,并且都是计算完成就立刻下发,有可能会导致用户短时间内收到多条新闻推送。
发明内容
本发明的目的旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种基于分布式系统的新闻推送方法,以保证新闻推送的精准性和时效性,并且能够智能的决定推送时间和内容,提升了用户体验。
本发明的第二个目的在于提出一种基于分布式系统的新闻推送装置。
本发明的第三个目的在于提出一种计算机设备。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
为达上述目的,本发明第一方面实施例提供了一种基于分布式系统的新闻推送方法,其中,分布式系统包括:中控机和多台从机,方法包括:中控机在预设的触发时间,将当前时间获取的所有审核的新闻资源平均分配到多台从机上;从机根据预设的用户推荐特征将分配到的新闻资源与用户进行匹配,将新闻资源添加到匹配成功的目标用户的待推送队列中,并向中控机发送匹配完成响应;中控机在获取所有从机发送的匹配完成响应后,向多台从机发送推送激活消息;从机根据目标用户当前的待推送队列,计算是否有满足推送条件的目标新闻,若存在目标新闻,则计算推送时间,并在推送时间向目标用户推送目标新闻。
本发明实施例的基于分布式系统的新闻推送方法,通过中控机在预设的触发时间,将当前时间获取的所有审核的新闻资源平均分配到多台从机上,进而从机根据预设的用户推荐特征将分配到的新闻资源与用户进行匹配,将新闻资源添加到匹配成功的目标用户的待推送队列中,并向中控机发送匹配完成响应,中控机在获取所有从机发送的匹配完成响应后,向多台从机发送推送激活消息,进一步从机根据目标用户当前的待推送队列,计算是否有满足推送条件的目标新闻,在存在目标新闻时计算推送时间,并在推送时间向目标用户推送目标新闻。由此,保证了新闻推送的精准性和时效性,实现了个性化的新闻推送,并且能够智能的决定推送时间和内容,提升了用户体验。
另外,根据本发明上述实施例的基于分布式系统的新闻推送方法还可以具有如下附加技术特征:
可选地,所述预设的用户推荐特征,包括:用户兴趣点,用户类别,以及用户所在的地域。
可选地,所述从机根据所述目标用户当前的待推送队列,计算是否有满足推送条件的目标新闻,包括:根据所述目标用户当前的待推送队列的新闻资源获取点击率评估特征,所述评估特征包括:用户与每个新闻资源的兴趣点匹配度,新闻自身的属性,用户的固有属性,用户在推送历史中的点击偏好;根据所述评估特征和预设的权重计算当前的待推送队列中每个新闻资源的得分,将得分最高的新闻资源与预设阈值进行匹配,若匹配成功,则获取满足推送条件的目标新闻。
可选地,所述若存在所述目标新闻,则计算推送时间,包括:按照预设策略对当前时间、所述目标用户的当前活跃度,以及所述目标新闻的时效性进行分析,计算推送时间。
可选地,在所述推送时间向所述目标用户推送所述目标新闻之后,还包括:所述从机从推送日志中获取用户历史推送信息以及对应的用户历史点击信息;根据所述用户历史推送信息以及对应的用户历史点击信息更新用户兴趣训练模型和点击率预估训练模型的样本数据。
为达上述目的,本发明第二方面实施例提供了一种基于分布式系统的新闻推送装置,其中,分布式系统包括:中控机和多台从机,装置包括:分配模块,用于所述中控机在预设的触发时间,将当前时间获取的所有审核的新闻资源平均分配到所述多台从机上;匹配模块,用于所述从机根据预设的用户推荐特征将分配到的新闻资源与用户进行匹配,将所述新闻资源添加到匹配成功的目标用户的待推送队列中,并向所述中控机发送匹配完成响应;激活模块,用于所述中控机在获取所有从机发送的匹配完成响应后,向所述多台从机发送推送激活消息;第一处理模块,用于所述从机根据所述目标用户当前的待推送队列,计算是否有满足推送条件的目标新闻;第二处理模块,用于若存在所述目标新闻,则计算推送时间,并在所述推送时间向所述目标用户推送所述目标新闻。
本发明实施例的基于分布式系统的新闻推送装置,通过中控机在预设的触发时间,将当前时间获取的所有审核的新闻资源平均分配到多台从机上,进而从机根据预设的用户推荐特征将分配到的新闻资源与用户进行匹配,将新闻资源添加到匹配成功的目标用户的待推送队列中,并向中控机发送匹配完成响应,中控机在获取所有从机发送的匹配完成响应后,向多台从机发送推送激活消息,进一步从机根据目标用户当前的待推送队列,计算是否有满足推送条件的目标新闻,在存在目标新闻时计算推送时间,并在推送时间向目标用户推送目标新闻。由此,保证了新闻推送的精准性和时效性,实现了个性化的新闻推送,并且能够智能的决定推送时间和内容,提升了用户体验。
另外,根据本发明上述实施例的基于分布式系统的新闻推送装置还可以具有如下附加技术特征:
可选地,所述第一处理模块,具体用于:根据所述目标用户当前的待推送队列的新闻资源获取点击率评估特征,所述评估特征包括:用户与每个新闻资源的兴趣点匹配度,新闻自身的属性,用户的固有属性,用户在推送历史中的点击偏好;根据所述评估特征和预设的权重计算当前的待推送队列中每个新闻资源的得分,将得分最高的新闻资源与预设阈值进行匹配,若匹配成功,则获取满足推送条件的目标新闻。
可选地,所述的装置,还包括:获取模块,用于所述从机从推送日志中获取用户历史推送信息以及对应的用户历史点击信息;第三处理模块,用于根据所述用户历史推送信息以及对应的用户历史点击信息更新用户兴趣训练模型和点击率预估训练模型的样本数据。
为达上述目的,本发明第三方面实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如第一方面实施例所述的基于分布式系统的新闻推送方法。
为达上述目的,本发明第四方面实施例提供了一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如第一方面实施例所述的基于分布式系统的新闻推送方法。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明实施例所提供的一种基于分布式系统的新闻推送方法的流程示意图;
图2为本发明实施例所提供的另一种基于分布式系统的新闻推送方法的流程示意图;
图3为本发明实施例所提供的又一种基于分布式系统的新闻推送方法的流程示意图;
图4为本发明实施例所提供的一种基于分布式系统的新闻推送方法的实际应用流程示意图;
图5为本发明实施例所提供的一种基于分布式系统的新闻推送装置的结构示意图;
图6为本发明实施例所提供的另一种基于分布式系统的新闻推送装置的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的基于分布式系统的新闻推送方法、装置及设备。
在实际应用当中,新闻数量比较多,如果采用集中式计算方式进行处理,需要耗费较长时间,不能保证新闻的时效性。因此,本发明实施例的基于分布式系统的新闻推送方法中分布式系统包括:中控机和多台从机,通过基于分布式系统的计算框架,将计算分配给多台从机进行处理,可以在短时间内进行一次全量计算,从而节约整体计算时间,提高计算效率,保证新闻推送的时效性。
图1为本发明实施例所提供的一种基于分布式系统的新闻推送方法的流程示意图,如图1所示,该基于分布式系统的新闻推送方法包括:
步骤101,中控机在预设的触发时间,将当前时间获取的所有审核的新闻资源平均分配到多台从机上。
其中,可以预先设置中控机的触发时间,即中控机运行的时间。触发时间可以根据大量实验数据确定,或者根据用户的实际需求确定,此处不作限定。
作为一种示例,将触发时间设置为20分钟,中控机每经过20分钟运行一次,将截止当前时间获取的所有审核的新闻资源平均分配到多台从机上。作为另一种示例,触发时间可以设置为每天的6时、12时、18时,中控机在每天的6时、12时和18时分别运行一次,将截止当前时间获取的所有审核的新闻资源平均分配到多台从机上。
可以理解的是,中控机可以获取审核的新闻资源。通常,新闻资源多种多样,为了保证新闻的质量和多样性,需要多大量(比如超过5000篇)的新闻进行挖掘并审核。其中,新闻资源来源包括新热新闻、门户优质新闻、地域新闻以及突发事件等,资源类型包括图文、图集以及短视频等。
其中,中控机将新闻资源平均分配到多台从机上的方式可以有很多种,作为一种可能的实现方式,中控机可以采用自动分配的方式将新闻资源平均分配到多台从机上,理想情况下每台从机分配一篇新闻资源。
步骤102,从机根据预设的用户推荐特征将分配到的新闻资源与用户进行匹配,将新闻资源添加到匹配成功的目标用户的待推送队列中,并向中控机发送匹配完成响应。
可以理解,不同的用户希望看到的新闻也不同,比如,有的用户更希望看到自己感兴趣的新闻,再比如,有的用户更希望看到所在区域的新闻等等。因此,可以根据用户推荐特征将新闻资源与用户进行匹配,进而将新闻资源添加到匹配成功的目标用户的待推送队列中,以实现对不同用户进行个性化的新闻推送,保证了新闻推送的精准性,提升了用户体验。
其中,用户推荐特征可以有多种,作为一种示例,可以采用用户的兴趣点作为用户的推荐特征,例如,将用户的兴趣点按照军事、娱乐等划分,从机将分配到的新闻资源与用户的兴趣点进行匹配,进而将新闻资源添加到匹配成功的目标用户的待推送队列中,比如将军事类的新闻资源添加到兴趣点为军事的目标用户的待推送队列中,将娱乐类的新闻资源添加到兴趣点为娱乐的目标用户的待推送队列中等等。
作为另一种示例,可以采用用户类别作为用户的推荐特征,例如,将用户类别按照职业划分,从机将分配到的新闻资源与用户的职业进行匹配,进而将新闻资源添加到匹配成功的目标用户的待推送队列中。
作为又一种示例,可以采用用户所在的地域作为用户的推荐特征,例如,将用户所在的地域按照城市划分,从机将分配到的新闻资源与用户所在的城市进行匹配,进而将新闻资源添加到匹配成功的目标用户的待推送队列中。
需要说明的是,上述用户的推荐特征可以单一进行作用,也可以任意组合进行作用,此处不作限定。
需要说明的是,从机向中控机发送匹配完成响应的方式有多种,可以根据实际应用需要进行选择设置,此处不做限制。
步骤103,中控机在获取所有从机发送的匹配完成响应后,向多台从机发送推送激活消息。
步骤104,从机根据目标用户当前的待推送队列,计算是否有满足推送条件的目标新闻,若存在目标新闻,则计算推送时间,并在推送时间向目标用户推送目标新闻。
其中,中控机向多台从机发送推送激活消息,表示可以确定推送时间、目标用户和目标新闻,从而完成新闻推送。
其中,从机根据目标用户当前的待推送队列,计算是否有满足推送条件的目标新闻方式有很多种,举例说明如下:
第一种示例,按照目标用户与当前的待推送队列的新闻资源的相关性、点击率等等进行排序,将得分最高的新闻资源作为目标新闻推送出去。
第二种示例,预先设置兴趣点匹配度,新闻自身的属性,用户的固有属性,用户在推送历史中的点击偏好等评估特征对应的权重,从而计算当前的待推送队列中每个新闻资源的得分,将得分最高的新闻资源与预设阈值进行匹配,在匹配成功时获取满足推送条件的目标新闻。
其中,在存在目标新闻时计算推送时间的方式有很多种,举例说明如下:
第一种示例,按照预设策略对当前时间、目标用户的当前活跃度,以及目标新闻的时效性进行分析,计算推送时间。
第二种示例,直接通过预设算法对目标新闻进行处理得到对应的推送时间。
进而从机通过计算获取满足推送条件的目标新闻和推送时间后,在推送时间向目标用户推送目标新闻,从而实现了智能的决定推送的时间和内容,提升了用户体验。
综上所述,本发明实施例的基于分布式系统的新闻推送方法,通过中控机在预设的触发时间,将当前时间获取的所有审核的新闻资源平均分配到多台从机上,进而从机根据预设的用户推荐特征将分配到的新闻资源与用户进行匹配,将新闻资源添加到匹配成功的目标用户的待推送队列中,并向中控机发送匹配完成响应,中控机在获取所有从机发送的匹配完成响应后,向多台从机发送推送激活消息,进一步从机根据目标用户当前的待推送队列,计算是否有满足推送条件的目标新闻,若存在目标新闻,则计算推送时间,并在推送时间向目标用户推送目标新闻。由此,保证了新闻推送的精准性和时效性,实现了个性化的新闻推送,并且能够智能的决定推送时间和内容,提升了用户体验。
图2为本发明实施例所提供的另一种基于分布式系统的新闻推送方法的流程示意图,如图2所示,该基于分布式系统的新闻推送方法包括:
步骤201,中控机在预设的触发时间,将当前时间获取的所有审核的新闻资源平均分配到多台从机上。
步骤202,从机根据预设的用户推荐特征将分配到的新闻资源与用户进行匹配,将新闻资源添加到匹配成功的目标用户的待推送队列中,并向中控机发送匹配完成响应。
步骤203,中控机在获取所有从机发送的匹配完成响应后,向多台从机发送推送激活消息。
需要说明的是,步骤S201-S203的描述与上述步骤S101-S103相对应,因此对的步骤S201-S203的描述参考上述步骤S101-S103的描述,在此不再赘述。
步骤204,根据目标用户当前的待推送队列的新闻资源获取点击率评估特征。
其中,评估特征包括但不限于:用户与每个新闻资源的兴趣点匹配度,新闻自身的属性,用户的固有属性,用户在推送历史中的点击偏好等中的一种或者多种。
具体地,获取点击率评估特征的方式有多种,作为一种可能的实现方式,可以通过相关特征提取算法,对目标用户当前待推送队列中的新闻资源进行特征提取,进而获取相关新闻资源的点击率评估特征。
步骤205,根据评估特征和预设的权重计算当前的待推送队列中每个新闻资源的得分,将得分最高的新闻资源与预设阈值进行匹配,若匹配成功,则获取满足推送条件的目标新闻。
可以理解,不同评估特征对于不同的用户的重要程度不同,比如,用户可能对历史推送中点击过的新闻更感兴趣,因此,通过对每个评估特征预先设置权重,进而根据评估特征和预设的权重通过相关算法(例如加权求和等)计算当前的待推送队列中每个新闻资源得分,以获取得分最高的新闻资源。
进而将得分最高的新闻资源与预设阈值匹配,以获取满足推送条件的目标新闻。可以理解的是,新闻资源的得分越高,被用户点击的可能性越大。
需要说明的是,若得分最高的新闻资源与预设阈值匹配失败,可以认为没有满足推送条件的新闻,等待下一次推送激活。由此,使得推送的新闻更能满足用户需要,进一步提高了新闻推送的精准性,提升了用户体验。
步骤206,按照预设策略对当前时间、所述目标用户的当前活跃度,以及所述目标新闻的时效性进行分析,计算推送时间,并在推送时间向目标用户推送目标新闻。
具体地,在计算得知存在满足推送条件的目标新闻之后,需要进一步计算目标新闻的推送时间,从而在推送时间向目标用户推送目标新闻,使得用户能够在合适的时间接收到新闻推送,提升用户体验。
具体地,可以按照预设策略对当前时间、目标用户的当前活跃度,以及目标新闻的时效性进行分析,并通过相关算法计算推送时间。
其中,预设策略可以根据用户需要进行设置,下面举例进行说明:
作为一种示例,预设策略可以设置为计算当前时间是否适合推送,若当前时间适合推送目标新闻,则直接进行推送。
作为另一种示例,预设策略可以设置为目标用户的当前活跃度比较高时对应的时间推送目标新闻。
由此,可以按照预设策略对当前时间、目标用户的当前活跃度,以及目标新闻的时效性进行分析,并计算推送时间,实现了智能的决定新闻推送的时间,使用户能在适当的时间接收到新闻推送,提升了用户体验。
基于上述实施例,为了能够让推送的内容和时间更符合用户的需求,在推送时间向目标用户推送目标新闻之后,可以通过对用户推送日志进行信息挖掘,进而训练用户兴趣模型和点击率预估模型,从而使本发明实施例的基于分布式系统的新闻推送方法更精准和智能。
图3为本发明实施例所提供的又一种基于分布式系统的新闻推送方法的流程示意图,如图3所示,在步骤104或步骤206之后,该基于分布式系统的新闻推送方法包括:
步骤301,从机从推送日志中获取用户历史推送信息以及对应的用户历史点击信息。
其中,推送日志用于记录用户历史推送信息和对应的用户历史点击信息,包括但不限于用户的推送、到达、展现、点击等行为。
从机获取用户历史推送信息以及对应的用户历史点击信息的方式有多种,作为一种可能的实现方式,从机可以直接从推送日志中下载相应的信息。
步骤302,根据用户历史推送信息以及对应的用户历史点击信息更新用户兴趣训练模型和点击率预估训练模型的样本数据。
作为一种示例,在从机从推送日志获取相应信息之后,可以利用机器学习模型更新用户兴趣训练模型和点击率预估训练模型,使得下一次新闻推送的内容和时间更符合用户需求,提升了用户体验。
综上所述,本发明实施例的基于分布式系统的新闻推送方法通过从机从推送日志中获取用户历史推送信息以及对应的用户历史点击信息,进而根据用户历史推送信息以及对应的用户历史点击信息更新用户兴趣训练模型和点击率预估训练模型的样本数据。由此,使新闻推送更加智能,进一步提高了推送的新闻内容精准性,提升了用户体验。
为了更加清楚的描述本发明实施例的基于分布式系统的新闻推送方法,下面以该方法在具体场景中的应用方法为例进行描述,图4为本发明实施例所提供的一种基于分布式系统的新闻推送方法的实际应用流程示意图,如图4所示,该方法包括:
首先,资源挖掘模块通过机器挖掘获取适合推送的新闻资源。其中,新闻来源包括但不限于新热新闻、门户优质新闻、地域新闻以及突发事件等。新闻类型包括但不限于图文、图集、GIF(Graphics Interchange Format,图像互换格式)图以及短视频等。
经过初步的新闻资源挖掘,可以获得比如超过5000篇新闻资源,保证新闻多样性。进而对机器挖掘的新闻进行人工审核,使得新闻涵盖尽可能多的兴趣点和类别,保证新闻的质量,进一步地,资源分配模块采用主从模式,在中控机上比如每20分钟运行一次,把截止当前时间编辑审核过的所有资源平均分配到多台从机上,并按照资源的兴趣点,类别,地域等属性,查询倒排拉取对应的用户,进行一次粗粒度的资源到用户的分配,把资源添加到目标用户待推送队列中。
中控机在确认所有的从机完成匹配之后,调用中控机上的推送激活模块。进而,推送激活模块采用主从模式,每个从机根据目标用户当前的待推送队列,计算是否有值得推送的新闻资源,同时将最终得到的新闻资源进行排序,将得分最高的新闻资源作为目标新闻,并计算推送时间,最后在推送时间向目标用户推送目标新闻。其中,图4中的点击率预估模块利用机器学习模型预估用户对新闻的点击概率。
最后,日志接入模块通过对离线日志的挖掘,将前一天用户的推送、到达、展现、点击等行为融入到用户的兴趣点模型中,并为激活模块和点击率预估模块的模型训练提供样本数据。由此,保证了新闻推送的精准性和时效性,实现了个性化的新闻推送,能够智能的决定推送时间和内容,并且能够不断更新训练模型,提升用户体验。
图5为本发明实施例所提供的一种基于分布式系统的新闻推送装置的结构示意图,如图5所示,该基于分布式系统的新闻推送装置包括:分配模块10,匹配模块20,激活模块30,第一处理模块40,第二处理模块50。
其中,分配模块10,用于中控机在预设的触发时间,将当前时间获取的所有审核的新闻资源平均分配到多台从机上。
匹配模块20,用于从机根据预设的用户推荐特征将分配到的新闻资源与用户进行匹配,将新闻资源添加到匹配成功的目标用户的待推送队列中,并向中控机发送匹配完成响应。
激活模块30,用于中控机在获取所有从机发送的匹配完成响应后,向多台从机发送推送激活消息。
第一处理模块40,用于从机根据目标用户当前的待推送队列,计算是否有满足推送条件的目标新闻;
第二处理模块50,用于若存在目标新闻,则计算推送时间,并在推送时间向目标用户推送目标新闻。
需要说明的是,前述对于图1实施例所述的基于分布式系统的新闻推送方法的解释说明同样适用于该实施例的基于分布式系统的新闻推送装置,此处不再赘述。
综上所述,本发明实施例的基于分布式系统的新闻推送装置,通过中控机在预设的触发时间,将当前时间获取的所有审核的新闻资源平均分配到多台从机上,进而从机根据预设的用户推荐特征将分配到的新闻资源与用户进行匹配,将新闻资源添加到匹配成功的目标用户的待推送队列中,并向中控机发送匹配完成响应,中控机在获取所有从机发送的匹配完成响应后,向多台从机发送推送激活消息,进一步从机根据目标用户当前的待推送队列,计算是否有满足推送条件的目标新闻,若存在目标新闻,则计算推送时间,并在推送时间向目标用户推送目标新闻。由此,保证了新闻推送的精准性和时效性,实现了个性化的新闻推送,并且能够智能的决定推送时间和内容,提升了用户体验。
图6为本发明实施例所提供的另一种基于分布式系统的新闻推送装置的结构示意图,如图6所示,该基于分布式系统的新闻推送装置还包括:获取模块60,第三处理模块70。
其中,第一处理模块40,具体用于根据目标用户当前的待推送队列的新闻资源获取点击率评估特征,评估特征包括:用户与每个新闻资源的兴趣点匹配度,新闻自身的属性,用户的固有属性,用户在推送历史中的点击偏好;根据评估特征和预设的权重计算当前的待推送队列中每个新闻资源的得分,将得分最高的新闻资源与预设阈值进行匹配,若匹配成功,则获取满足推送条件的目标新闻。
获取模块60,用于从机从推送日志中获取用户历史推送信息以及对应的用户历史点击信息。
第三处理模块70,用于根据用户历史推送信息以及对应的用户历史点击信息更新用户兴趣训练模型和点击率预估训练模型的样本数据。
需要说明的是,前述实施例所述的基于分布式系统的新闻推送方法的解释说明同样适用于该实施例的基于分布式系统的新闻推送装置,此处不再赘述。
综上所述,本发明实施例的基于分布式系统的新闻推送装置通过从机从推送日志中获取用户历史推送信息以及对应的用户历史点击信息,进而根据用户历史推送信息以及对应的用户历史点击信息更新用户兴趣训练模型和点击率预估训练模型的样本数据。由此,使新闻推送更加智能,进一步提高了推送的新闻内容精准性,提升了用户体验。
为了实现上述实施例,本发明实施例还提出一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,在处理器执行计算机程序时,实现如前述任一实施例所述的基于分布式系统的新闻推送方法。
为了实现上述实施例,本发明实施例还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如前述任一实施例所述的基于分布式系统的新闻推送方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (10)

1.一种基于分布式系统的新闻推送方法,其特征在于,所述分布式系统包括:中控机和多台从机,所述方法包括:
所述中控机在预设的触发时间,将截止至当前时间获取的所有审核的新闻资源平均分配到所述多台从机上;
所述从机根据预设的用户推荐特征将分配到的新闻资源与用户进行匹配,将所述新闻资源添加到匹配成功的目标用户的待推送队列中,并向所述中控机发送匹配完成响应;
所述中控机在获取所有从机发送的匹配完成响应后,向所述多台从机发送推送激活消息;
所述从机根据所述目标用户当前的待推送队列,计算是否有满足推送条件的目标新闻,若存在所述目标新闻,则计算推送时间,并在所述推送时间向所述目标用户推送所述目标新闻。
2.如权利要求1所述的方法,其特征在于,所述预设的用户推荐特征,包括:
用户兴趣点,用户类别,以及用户所在的地域。
3.如权利要求1所述的方法,其特征在于,所述从机根据所述目标用户当前的待推送队列,计算是否有满足推送条件的目标新闻,包括:
根据所述目标用户当前的待推送队列的新闻资源获取点击率评估特征,所述评估特征包括:用户与每个新闻资源的兴趣点匹配度,新闻自身的属性,用户的固有属性,用户在推送历史中的点击偏好;
根据所述评估特征和预设的权重计算当前的待推送队列中每个新闻资源的得分,将得分最高的新闻资源与预设阈值进行匹配,若匹配成功,则获取满足推送条件的目标新闻。
4.如权利要求1所述的方法,其特征在于,所述若存在所述目标新闻,则计算推送时间,包括:
按照预设策略对当前时间、所述目标用户的当前活跃度,以及所述目标新闻的时效性进行分析,计算推送时间。
5.如权利要求1-4任一所述的方法,其特征在于,在所述推送时间向所述目标用户推送所述目标新闻之后,还包括:
所述从机从推送日志中获取用户历史推送信息以及对应的用户历史点击信息;
根据所述用户历史推送信息以及对应的用户历史点击信息更新用户兴趣训练模型和点击率预估训练模型的样本数据。
6.一种基于分布式系统的新闻推送装置,其特征在于,所述分布式系统包括:中控机和多台从机,所述装置包括:
分配模块,用于所述中控机在预设的触发时间,将截止至当前时间获取的所有审核的新闻资源平均分配到所述多台从机上;
匹配模块,用于所述从机根据预设的用户推荐特征将分配到的新闻资源与用户进行匹配,将所述新闻资源添加到匹配成功的目标用户的待推送队列中,并向所述中控机发送匹配完成响应;
激活模块,用于所述中控机在获取所有从机发送的匹配完成响应后,向所述多台从机发送推送激活消息;
第一处理模块,用于所述从机根据所述目标用户当前的待推送队列,计算是否有满足推送条件的目标新闻;
第二处理模块,用于若存在所述目标新闻,则计算推送时间,并在所述推送时间向所述目标用户推送所述目标新闻。
7.如权利要求6所述的装置,其特征在于,所述第一处理模块,具体用于:
根据所述目标用户当前的待推送队列的新闻资源获取点击率评估特征,所述评估特征包括:用户与每个新闻资源的兴趣点匹配度,新闻自身的属性,用户的固有属性,用户在推送历史中的点击偏好;
根据所述评估特征和预设的权重计算当前的待推送队列中每个新闻资源的得分,将得分最高的新闻资源与预设阈值进行匹配,若匹配成功,则获取满足推送条件的目标新闻。
8.如权利要求6或7所述的装置,其特征在于,还包括:
获取模块,用于所述从机从推送日志中获取用户历史推送信息以及对应的用户历史点击信息;
第三处理模块,用于根据所述用户历史推送信息以及对应的用户历史点击信息更新用户兴趣训练模型和点击率预估训练模型的样本数据。
9.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1-5中任一项所述的基于分布式系统的新闻推送方法。
10.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一项所述的基于分布式系统的新闻推送方法。
CN201711430481.XA 2017-12-26 2017-12-26 基于分布式系统的新闻推送方法、装置及设备 Active CN107968842B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711430481.XA CN107968842B (zh) 2017-12-26 2017-12-26 基于分布式系统的新闻推送方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711430481.XA CN107968842B (zh) 2017-12-26 2017-12-26 基于分布式系统的新闻推送方法、装置及设备

Publications (2)

Publication Number Publication Date
CN107968842A CN107968842A (zh) 2018-04-27
CN107968842B true CN107968842B (zh) 2020-12-08

Family

ID=61994857

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711430481.XA Active CN107968842B (zh) 2017-12-26 2017-12-26 基于分布式系统的新闻推送方法、装置及设备

Country Status (1)

Country Link
CN (1) CN107968842B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108737535B (zh) * 2018-05-14 2021-10-29 平安科技(深圳)有限公司 一种消息推送方法、存储介质和服务器
CN109246184B (zh) * 2018-07-31 2022-07-08 平安科技(深圳)有限公司 一种时间信息获取方法、装置和可读存储介质
CN109862073B (zh) * 2018-12-29 2021-07-16 浙江口碑网络技术有限公司 通知消息的推送方法及装置、存储介质、电子装置
CN111125429B (zh) * 2019-12-20 2023-05-30 腾讯科技(深圳)有限公司 一种视频推送方法、装置和计算机可读存储介质
CN111143688B (zh) * 2019-12-31 2021-03-02 南京新一代人工智能研究院有限公司 一种基于移动新闻客户端的评估方法及其系统
CN112333259A (zh) * 2020-10-29 2021-02-05 云账户技术(天津)有限公司 消息推送方法、装置以及可读存储介质
CN114519604A (zh) * 2022-01-26 2022-05-20 北京金堤科技有限公司 确定用户推送首活比例的方法和装置、存储介质和电子设备

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104113512A (zh) * 2013-04-18 2014-10-22 华为技术有限公司 一种cdn系统、广告推送系统及广告推送方法
CN104601639A (zh) * 2014-03-13 2015-05-06 腾讯科技(深圳)有限公司 网页应用消息推送方法、客户端、服务器及系统
CN104166668B (zh) * 2014-06-09 2018-02-23 南京邮电大学 基于folfm模型的新闻推荐系统及方法
CN104217352A (zh) * 2014-08-20 2014-12-17 苏州海云网络科技有限公司 移动广告精确推送系统
US20160337174A1 (en) * 2015-05-15 2016-11-17 David Francis Jorm Automated network peering in a social-network model
CN104965863B (zh) * 2015-06-05 2019-04-26 北京奇虎科技有限公司 一种对象聚类方法和装置
CN105630953B (zh) * 2015-12-23 2019-05-14 北京奇虎科技有限公司 移动搜索客户端展示新闻的方法和装置
CN105554142B (zh) * 2015-12-24 2019-02-01 北京奇虎科技有限公司 消息推送的方法、装置及系统

Also Published As

Publication number Publication date
CN107968842A (zh) 2018-04-27

Similar Documents

Publication Publication Date Title
CN107968842B (zh) 基于分布式系统的新闻推送方法、装置及设备
CN109902849B (zh) 用户行为预测方法及装置、行为预测模型训练方法及装置
KR102358604B1 (ko) 융합 데이터 처리 방법 및 정보 추천 시스템
CN108108821B (zh) 模型训练方法及装置
CN109408703B (zh) 信息推荐方法及其系统、装置、电子设备、存储介质
CN105550903B (zh) 目标用户确定方法及装置
CN110968767B (zh) 排序引擎训练方法及装置、业务卡排序方法及装置
CN112016773B (zh) 一种确定潜力主播的方法及装置
CN110413867B (zh) 用于内容推荐的方法及系统
CN109547807B (zh) 一种基于直播的信息处理方法、装置及服务器
CN113326440B (zh) 基于人工智能的推荐方法、装置及电子设备
CN109389424B (zh) 流量分配方法、装置、电子设备及存储介质
CN107871088B (zh) 一种信息处理方法、装置、终端和计算机可读存储介质
CN109657164B (zh) 发布消息的方法、装置及存储介质
CN111314446B (zh) 一种资源更新方法、装置、服务器及存储介质
CN115098290A (zh) 基于自动更新的nlp模型的智能人工服务方法和装置
CN113934871B (zh) 多媒体推荐模型的训练方法、装置、电子设备及存储介质
CN115221307A (zh) 一种文章识别方法、装置、计算机设备及存储介质
CN108304370B (zh) 数据更新方法及装置
CN112633513A (zh) 数据处理方法、系统、装置及计算机可读存储介质
CN116955773A (zh) 一种多媒体信息的推荐方法、装置、电子设备及存储介质
CN115391653A (zh) 通知消息管理方法及装置
CN115146193A (zh) 一种内容审核方法和装置
CN114186845A (zh) 定时执行指标计算任务的方法和装置
CN117235371A (zh) 视频推荐方法、模型训练方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant