CN108846028A - 文章投放方法、介质、装置和计算设备 - Google Patents

文章投放方法、介质、装置和计算设备 Download PDF

Info

Publication number
CN108846028A
CN108846028A CN201810510179.3A CN201810510179A CN108846028A CN 108846028 A CN108846028 A CN 108846028A CN 201810510179 A CN201810510179 A CN 201810510179A CN 108846028 A CN108846028 A CN 108846028A
Authority
CN
China
Prior art keywords
article
special topic
user
article special
topic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810510179.3A
Other languages
English (en)
Inventor
李勤思
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Netease Media Technology Beijing Co Ltd
Original Assignee
Netease Media Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Netease Media Technology Beijing Co Ltd filed Critical Netease Media Technology Beijing Co Ltd
Priority to CN201810510179.3A priority Critical patent/CN108846028A/zh
Publication of CN108846028A publication Critical patent/CN108846028A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明的实施方式提供了一种文章投放方法、介质、装置和计算设备。该文章投放方法包括:提取待推荐的各个文章中的关键词;基于从所述各个文章中提取出的关键词,确定所述各个文章之间的关联关系;根据具有关联关系的多篇文章生成文章专题;投放所述文章专题。本发明实施例的技术方案一方面能够根据文章之间的关联关系来对待推荐的文章进行分类,实现了对文章的有效管理;另一方面使得在投放文章专题之后,用户通过一次触发操作(如点击操作)可以查看到多篇具有关联关系的文章,进而能够在扩展文章阅读范围的前提下,简化用户的操作,并且提高了用户的阅读时长,从而有利于提升用户的使用体验。

Description

文章投放方法、介质、装置和计算设备
技术领域
本发明的实施方式涉及通信及计算机技术领域,更具体地,本发明的实施方式涉及文章投放方法、介质、装置和计算设备。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
目前,移动终端(如手机、平板电脑等)中的资讯类软件一般会提供信息流列表,如文章列表,用户通过点击信息流列表中的某一篇资讯可进入内容详情页。当用户阅读正文之后,需要通过操作(如点击、滑动操作等)返回到信息流列表,继续浏览并选择查看其它资讯内容。
发明内容
但是,用户一次点击只能看到一篇文章的内容,如果同一个信息流内有多条用户感兴趣的内容,那么需要用户多次返回信息流列表进行寻找和点击,重复操作较多,导致费时费力,进而会影响用户的使用体验。
为此,非常需要一种改进的文章投放方案,以确保用户的一次点击操作能够查看到多篇相关联的文章,进而能够在扩展文章阅读范围的前提下,简化用户的操作,有利于提升用户的使用体验。
在本上下文中,本发明的实施方式期望提供一种文章投放方法、介质、装置和计算设备。
在本发明实施方式的第一方面中,提供了一种文章投放方法,包括:提取待推荐的各个文章中的关键词;基于从所述各个文章中提取出的关键词,确定所述各个文章之间的关联关系;根据具有关联关系的多篇文章生成文章专题;投放所述文章专题。
在本发明的一些实施例中,基于前述方案,在根据具有关联关系的多篇文章生成文章专题之后,还包括:根据生成的多个文章专题的内容重叠度和/或专题名称,对所述多个文章专题进行合并处理。
在本发明的一些实施例中,基于前述方案,在根据具有关联关系的多篇文章生成文章专题之后,还包括:检测并删除生成的所述文章专题中的重复内容;和/或删除生成的所述文章专题中包含的与所述文章专题的匹配度小于或等于预定值的文章。
在本发明的一些实施例中,基于前述方案,在根据具有关联关系的多篇文章生成文章专题之后,还包括:根据所述文章专题所包含的各个文章的特征,从所述文章专题所包含的文章中确定所述文章专题的封面文章和/或封面图片;根据所述封面文章和/或所述封面图片,生成所述文章专题的封面。
在本发明的一些实施例中,基于前述方案,根据所述文章专题所包含的各个文章的特征,从所述文章专题所包含的文章中确定所述文章专题的封面文章和/或封面图片,包括:根据所述文章专题所包含的各个文章的点击率和/或质量,从所述文章专题所包含的中选择点击率最高和/或质量最高的文章作为所述封面文章和/或选择点击率最高和/或质量最高的文章中的图片作为所述封面图片。
在本发明的一些实施例中,基于前述方案,若所述文章专题具有封面文章,则根据所述封面文章的属性及统计数据,确定所述文章专题的属性及统计数据。
在本发明的一些实施例中,基于前述方案,所述属性包括:分类、关键词、质量;所述统计数据包括点击率、曝光量。
在本发明的一些实施例中,基于前述方案,在投放所述文章专题之后,还包括:统计所述文章专题的点击率;若所述文章专题的点击率低于预定点击率,则根据所述文章专题所包含的各个文章的特征,修改所述文章专题的封面。
在本发明的一些实施例中,基于前述方案,所述的方法还包括:根据生成的所述文章专题所包含的各个文章的点击率,对所述文章专题所包含的文章进行排序。
在本发明的一些实施例中,基于前述方案,所述的方法还包括:每经过预定时长,则根据待推荐的所有文章重新生成所述文章专题。
在本发明的一些实施例中,基于前述方案,所述的方法还包括:若已投放的文章专题中包含的任一篇文章失效,则停止投放所述文章专题。
在本发明的一些实施例中,基于前述方案,在停止投放所述文章专题之后,还包括:根据停止投放的文章专题中未失效的文章,重新生成文章专题。
在本发明的一些实施例中,基于前述方案,在根据具有关联关系的多篇文章生成文章专题之后,还包括:若接收到对所述文章专题的删除指令,则删除所述文章专题;和/或若接收到对所述文章专题中的任一文章的删除指令,则从所述文章专题中删除所述任一文章;和/或若接收到对所述文章专题中的文章顺序的调整指令,则根据所述调整指令对所述文章专题中的文章顺序进行调整。
在本发明的一些实施例中,基于前述方案,在投放所述文章专题之后,还包括:统计所述文章专题的曝光次数和点击率;若所述文章专题的曝光次数达到预定次数,且所述文章专题的点击率低于预定点击率,则停止投放所述文章专题。
在本发明的一些实施例中,基于前述方案,在投放所述文章专题之后,还包括:若检测到所述文章专题针对任一用户曝光过,且所述用户未点击所述文章专题,则停止向所述用户投放所述文章专题和/或所述文章专题的封面文章。
在本发明的一些实施例中,基于前述方案,在投放所述文章专题之后,还包括:若检测到任一用户点击所述文章专题,则在所述用户浏览所述文章专题之后,停止向所述用户投放所述文章专题、和/或所述文章专题的封面文章、和/或所述文章专题内已曝光/点击的文章、和/或所述文章专题内的所有文章。
在本发明的一些实施例中,基于前述方案,在投放所述文章专题之前,还包括:统计所述文章专题内的文章针对各个用户的曝光情况,或被所述各个用户的点击情况;根据所述文章专题内的文章针对各个用户的曝光情况,或被所述各个用户的点击情况,确定是否向所述各个用户投放所述文章专题。
在本发明的一些实施例中,基于前述方案,根据所述文章专题内的文章针对各个用户的曝光情况,或被所述各个用户的点击情况,确定是否向所述各个用户投放所述文章专题,包括:若所述文章专题的封面文章针对任一用户已经曝光过或已被所述任一用户点击过,则不向所述任一用户投放所述文章专题;或在所述文章专题的封面文章针对任一用户未曝光过、且未被所述任一用户点击过的情况下,若所述文章专题内的其它文章针对所述任一用户的曝光比例达到预定值,则不向所述任一用户投放所述文章专题。
在本发明的一些实施例中,基于前述方案,所述的方法还包括:在投放所述文章专题时,控制显示所述文章专题的终端在所述终端的显示界面上实时显示所述文章专题的数量。
在本发明的一些实施例中,基于前述方案,所述的方法还包括:在投放所述文章专题时,控制显示所述文章专题的终端在所述终端的显示界面上实时显示与所述文章专题的类别相匹配的文章数量。
在本发明的一些实施例中,基于前述方案,在投放所述文章专题之后,还包括:根据用户对所述文章专题所包含的文章的点击次数,计算所述用户对应的推荐模型中各个参数的权重,其中,所述点击次数与所述权重的增加量成反相关关系。
在本发明的一些实施例中,基于前述方案,在投放所述文章专题之后,还包括:统计所述文章专题的点击率,以及所述文章专题所包含的各个文章的点击率;根据所述文章专题的点击率、所述文章专题所包含的各个文章的点击率及所述文章专题所包含的各个文章的质量,确定所述文章专题的质量。
在本发明的一些实施例中,基于前述方案,在根据具有关联关系的多篇文章生成文章专题之后,还包括:获取用户的核心兴趣点,和/或根据用户在预定时间段内的行为数据确定所述用户的实时画像;确定与所述核心兴趣点和/或所述实时画像相匹配的目标文章专题;提高所述目标文章专题的推荐权重,以在向所述用户推荐文章时,将所述目标文章专题推荐给所述用户。
在本发明的一些实施例中,基于前述方案,所述的方法还包括:将所述文章专题与所述待推荐的各个文章进行区分存储。
在本发明实施方式的第二方面中,提供了一种介质,其上存储有程序,该程序被处理器执行时实现如上述实施例中所述的方法。
在本发明实施方式的第三方面中,提供了一种文章投放装置,包括:提取单元,用于提取待推荐的各个文章中的关键词;第一确定单元,用于基于从所述各个文章中提取出的关键词,确定所述各个文章之间的关联关系;专题生成单元,用于根据具有关联关系的多篇文章生成文章专题;投放单元,用于投放所述文章专题。
在本发明的一些实施例中,基于前述方案,所述的装置还包括:合并处理单元,用于在所述专题生成单元根据具有关联关系的多篇文章生成文章专题之后,根据生成的多个文章专题的内容重叠度和/或专题名称,对所述多个文章专题进行合并处理。
在本发明的一些实施例中,基于前述方案,所述专题生成单元还用于:在根据具有关联关系的多篇文章生成文章专题之后,检测并删除生成的所述文章专题中的重复内容,和/或删除生成的所述文章专题中包含的与所述文章专题的匹配度小于或等于预定值的文章。
在本发明的一些实施例中,基于前述方案,所述的装置还包括:封面生成单元,用于在所述专题生成单元生成文章专题之后,根据所述文章专题所包含的各个文章的特征,从所述文章专题所包含的文章中确定所述文章专题的封面文章和/或封面图片,并根据所述封面文章和/或所述封面图片,生成所述文章专题的封面。
在本发明的一些实施例中,基于前述方案,所述封面生成单元用于:根据所述文章专题所包含的各个文章的点击率和/或质量,从所述文章专题所包含的中选择点击率最高和/或质量最高的文章作为所述封面文章和/或选择点击率最高和/或质量最高的文章中的图片作为所述封面图片。
在本发明的一些实施例中,基于前述方案,所述的装置还包括:第二确定单元,用于在所述文章专题具有封面文章时,根据所述封面文章的属性及统计数据,确定所述文章专题的属性及统计数据。
在本发明的一些实施例中,基于前述方案,所述属性包括:分类、关键词、质量;所述统计数据包括点击率、曝光量。
在本发明的一些实施例中,基于前述方案,所述的装置还包括:第一统计单元,用于在投放所述文章专题之后,统计所述文章专题的点击率;所述封面生成单元还用于:若所述文章专题的点击率低于预定点击率,则根据所述文章专题所包含的各个文章的特征,修改所述文章专题的封面。
在本发明的一些实施例中,基于前述方案,所述的装置还包括:排序单元,用于根据生成的所述文章专题所包含的各个文章的点击率,对所述文章专题所包含的文章进行排序。
在本发明的一些实施例中,基于前述方案,所述专题生成单元还用于:每经过预定时长,则根据待推荐的所有文章重新生成所述文章专题。
在本发明的一些实施例中,基于前述方案,所述投放单元还用于:若已投放的文章专题中包含的任一篇文章失效,则停止投放所述文章专题。
在本发明的一些实施例中,基于前述方案,所述专题生成单元还用于:在所述投放单元停止投放所述文章专题之后,根据停止投放的文章专题中未失效的文章,重新生成文章专题。
在本发明的一些实施例中,基于前述方案,所述专题生成单元还用于:若接收到对所述文章专题的删除指令,则删除所述文章专题;和/或若接收到对所述文章专题中的任一文章的删除指令,则从所述文章专题中删除所述任一文章;和/或若接收到对所述文章专题中的文章顺序的调整指令,则根据所述调整指令对所述文章专题中的文章顺序进行调整。
在本发明的一些实施例中,基于前述方案,所述的装置还包括:第二统计单元,用于在所述投放单元投放所述文章专题之后,统计所述文章专题的曝光次数和点击率;所述投放单元还用于:若所述文章专题的曝光次数达到预定次数,且所述文章专题的点击率低于预定点击率,则停止投放所述文章专题。
在本发明的一些实施例中,基于前述方案,所述投放单元还用于:在投放所述文章专题之后,若检测到所述文章专题针对任一用户曝光过,且所述用户未点击所述文章专题,则停止向所述用户投放所述文章专题和/或所述文章专题的封面文章。
在本发明的一些实施例中,基于前述方案,所述投放单元还用于:在投放所述文章专题之后,若检测到任一用户点击所述文章专题,则在所述用户浏览所述文章专题之后,停止向所述用户投放所述文章专题、和/或所述文章专题的封面文章、和/或所述文章专题内已曝光/点击的文章、和/或所述文章专题内的所有文章。
在本发明的一些实施例中,基于前述方案,所述的装置还包括:第三统计单元,用于在投放所述文章专题之前,统计所述文章专题内的文章针对各个用户的曝光情况,或被所述各个用户的点击情况;所述投放单元还用于根据所述文章专题内的文章针对各个用户的曝光情况,或被所述各个用户的点击情况,确定是否向所述各个用户投放所述文章专题。
在本发明的一些实施例中,基于前述方案,所述投放单元用于:若所述文章专题的封面文章针对任一用户已经曝光过或已被所述任一用户点击过,则不向所述任一用户投放所述文章专题;或在所述文章专题的封面文章针对任一用户未曝光过、且未被所述任一用户点击过的情况下,若所述文章专题内的其它文章针对所述任一用户的曝光比例达到预定值,则不向所述任一用户投放所述文章专题。
在本发明的一些实施例中,基于前述方案,所述投放单元还用于:在投放所述文章专题时,控制显示所述文章专题的终端在所述终端的显示界面上实时显示所述文章专题的数量。
在本发明的一些实施例中,基于前述方案,所述投放单元还用于:在投放所述文章专题时,控制显示所述文章专题的终端在所述终端的显示界面上实时显示与所述文章专题的类别相匹配的文章数量。
在本发明的一些实施例中,基于前述方案,所述的装置还包括:计算单元,用于在所述投放单元投放所述文章专题之后,根据用户对所述文章专题所包含的文章的点击次数,计算所述用户对应的推荐模型中各个参数的权重,其中,所述点击次数与所述权重的增加量成反相关关系。
在本发明的一些实施例中,基于前述方案,在投放所述文章专题之后,还包括:第四统计单元,用于统计所述文章专题的点击率,以及所述文章专题所包含的各个文章的点击率;第三确定单元,用于根据所述文章专题的点击率、所述文章专题所包含的各个文章的点击率及所述文章专题所包含的各个文章的质量,确定所述文章专题的质量。
在本发明的一些实施例中,基于前述方案,所述的装置还包括:获取单元,用于在所述专题生成单元根据具有关联关系的多篇文章生成文章专题之后,获取用户的核心兴趣点,和/或根据用户在预定时间段内的行为数据确定所述用户的实时画像;第四确定单元,用于确定与所述核心兴趣点和/或所述实时画像相匹配的目标文章专题;处理单元,用于提高所述目标文章专题的推荐权重,以在向所述用户推荐文章时,将所述目标文章专题推荐给所述用户。
在本发明的一些实施例中,基于前述方案,所述的装置还包括:存储单元,用于将所述文章专题与所述待推荐的各个文章进行区分存储。
在本发明实施方式的第四方面中,提供了一种计算设备,包括:处理器和存储器,所述存储器存储有可执行指令,所述处理器用于调用所述存储器存储的可执行指令执行如上述实施例中所述的方法。
根据本发明实施方式的文章投放方法、介质、装置和计算设备,通过提取待推荐的各个文章中的关键词,基于从各个文章中提取出的关键词确定各个文章之间的关联关系,以根据具有关联关系的多篇文章生成文章专题,一方面使得能够根据文章之间的关联关系来对待推荐的文章进行分类,实现了对文章的有效管理;另一方面使得在投放文章专题之后,用户通过一次触发操作(如点击操作)可以查看到多篇具有关联关系的文章,进而能够在扩展文章阅读范围的前提下,简化用户的操作,并且提高了用户的阅读时长,从而有利于提升用户的使用体验。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1示意性示出了根据本发明的一个实施例的文章投放方法的流程图;
图2示意性示出了根据本发明的一个实施例的生成文章专题的流程图;
图3示意性示出了根据本发明的一个实施例的文章投放装置的框图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本发明更加透彻和完整,并且能够将本发明的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本发明可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本发明的实施方式,提出了一种文章投放方法、介质、装置和计算设备。
在本文中,需要理解的是,所涉及的术语“专题”是指针对某个特定对象而特别收集制作而成的一种集中作品,这个对象可以是具体的某个人物或者某个事物,也可以是某个抽象的范围或者领域。“文章专题”即为包含多篇文章的集合。
术语“信息流列表”表示应用内信息自上而下的排序方式,是图形用户界面中显示的信息列表,可为用户提供资讯内容,用户可以通过下拉刷新、上拉加载来获取新内容,满足阅读需求。
此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。
发明概述
本发明人发现,用户在信息流列表中的一次点击只能看到一篇文章的内容,如果同一个信息流内有多条用户感兴趣的内容,那么需要用户多次返回信息流列表进行寻找和点击,重复操作较多,导致费时费力,进而会影响用户的使用体验。
因此,本发明的实施例提供了一种文章投放方法、介质、装置和计算设备,可以确保用户的一次点击操作能够查看到多篇相关联的文章,进而能够在扩展文章阅读范围的前提下,简化用户的操作,有利于提升用户的使用体验。
在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限制性实施方式。
应用场景总览
需要注意的是,下述应用场景仅是为了便于理解本发明的精神和原理而示出,本发明的实施方式在此方面不受任何限制。相反,本发明的实施方式可以应用于适用的任何场景。
服务器端在向用户推荐文章时,可以基于从待推荐的文章中提取出的关键词确定各个文章之间的关联关系,进而基于具有关联关系的多篇文章生成文章专题,并投放给用户。当用户在信息流列表中选择某一文章专题之后,可以查看到多篇相关联的文章,进而能够确保通过一次点击操作来阅读多篇文章,简化用户的操作,有利于提升用户的使用体验。
示例性方法
下面结合上述的应用场景,参考图1和图2来描述根据本发明示例性实施方式的文章投放方法。
图1示意性示出了根据本发明的一个实施例的文章投放方法的流程图。
参照图1所示,根据本发明的一个实施例的文章投放方法,包括如下步骤S110至步骤S140,详细介绍如下:
在步骤S110中,提取待推荐的各个文章中的关键词。
在本发明的一个实施例中,提取待推荐的各个文章中的关键词即是提取出待推荐的文章中包含的能够反映文章主题的关键词,进而能够基于各个文章的关键词来确定各个文章之间的关联关系。
在步骤S120中,基于从所述各个文章中提取出的关键词,确定所述各个文章之间的关联关系。
在本发明的一个实施例中,若从多个文章中提取出的关键词相同、相近或具有关联性,则可以确定这多个文章之间具有关联关系。比如从多个文章中提取出的关键词都包含明星A,那么可以说明这些文章都是与明星A相关联的,进而可以确定这些文章具有关联关系。
在步骤S130中,根据具有关联关系的多篇文章生成文章专题。
在本发明的一个实施例中,在根据具有关联关系的多篇文章生成文章专题之后,可以根据生成的多个文章专题的内容重叠度和/或专题名称,对所述多个文章专题进行合并处理,进而能够实现对相同或相近的文章专题的去重处理。
在本发明的一个实施例中,在根据具有关联关系的多篇文章生成文章专题之后,还可以检测并删除生成的所述文章专题中的重复内容,以实现对文章专题内的文章内容进行去重处理,避免文章专题内包含重复内容而影响用户的阅读体验。
在本发明的一个实施例中,在根据具有关联关系的多篇文章生成文章专题之后,还可以删除生成的文章专题中包含的与所述文章专题的匹配度小于或等于预定值的文章,进而能够避免文章专题内包含与文章专题不相关的文章而影响用户的阅读体验。
在本发明的一个实施例中,在生成文章专题之后,还可以根据文章专题所包含的各个文章的特征,从文章专题所包含的文章中确定所述文章专题的封面文章和/或封面图片;根据所述封面文章和/或所述封面图片,生成所述文章专题的封面。比如可以根据文章专题所包含的各个文章的点击率和/或质量,从所述文章专题所包含的中选择点击率最高和/或质量最高的文章作为所述封面文章和/或选择点击率最高和/或质量最高的文章中的图片作为所述封面图片,进而可以通过点击率最高和/或质量最高的文章来吸引用户点击文章专题进行查看。
在本发明的一个实施例中,若文章专题具有封面文章,则根据所述封面文章的属性及统计数据,确定所述文章专题的属性及统计数据。其中,文章专题的属性可以包括:分类、关键词、质量、所代表的用户兴趣点等,文章专题的统计数据可以包括点击率、曝光量等。该实施例的技术方案使得能够基于封面文章的属性及统计数据来方便地确定文章专题的属性及统计数据。
在本发明的一个实施例中,在生成文章专题之后,还可以根据最终用户或者后台用户的指令来对文章专题进行调整,比如若接收到对文章专题的删除指令,则删除所述文章专题;再如若接收到对文章专题中的任一文章的删除指令,则从所述文章专题中删除所述任一文章;又如若接收到对文章专题中的文章顺序的调整指令,则根据所述调整指令对所述文章专题中的文章顺序进行调整。该实施例的技术方案使得文章管理方能够方便地对生成的文章专题进行调整。
在本发明的一个实施例中,在生成文章专题之后,可以根据生成的文章专题所包含的各个文章的点击率,对文章专题所包含的文章进行排序。比如可以按照点击率由高到低的顺序来对文章专题所包含的文章进行排序,以增强对用户的吸引度。
在本发明的一个实施例中,可以每经过预定时长,根据待推荐的所有文章重新生成文章专题,进而能够确保文章专题的及时更新,以提高用户的阅读体验。
在本发明的一个实施例中,可以将生成的文章专题与待推荐的各个文章进行区分存储,进而能够实现文章专题与文章的区分存储,保证单篇文章还能够继续被推荐。
继续参照图1所示,在步骤S140中,投放所述文章专题。
在本发明的一个实施例中,投放文章专题可以是对同一类用户投放相同的文章专题,也可以是针对每个用户分别投放相应的专题,或者针对所有的用户投放相同的文章专题等。
在本发明的一个实施例中,在投放文章专题时,可以控制显示文章专题的终端在显示界面上实时显示文章专题的数量。比如可以在终端显示界面上的同一屏内仅显示一个文章专题,避免过度推荐文章专题而影响用户的阅读体验。
在本发明的一个实施例中,在投放所述文章专题时,可以控制显示文章专题的终端在显示界面上实时显示与所述文章专题的类别相匹配的文章数量。比如若在终端显示界面上显示有文章专题,那么在同一屏内控制与该文章专题相匹配的文章数量不超过3篇(仅为示例),进而能够避免过度推荐相类似的文章而影响用户的阅读体验。
在本发明的一个实施例中,在投放文章专题之后,可以统计文章专题的点击率,当文章专题的点击率低于预定点击率时,可以根据文章专题所包含的各个文章的特征,修改文章专题的封面,进而能够通过及时修改文章专题的封面来提高用户的阅读兴趣,进而提高文章专题的点击率。
在本发明的一个实施例中,若已投放的文章专题中包含的任一篇文章失效,则停止投放该文章专题。该实施例的技术方案使得文章专题中包含的文章失效后,能够及时停止投放文章专题,避免了继续投放包含有失效文章的文章专题而影响用户的阅读体验。进一步地,在本发明的一个实施例中,当停止投放文章专题之后,可以根据停止投放的文章专题中未失效的文章,重新生成文章专题,进而能够保证继续投放未失效的文章。
在本发明的一个实施例中,在投放文章专题之后,可以统计文章专题的曝光次数和点击率;若文章专题的曝光次数达到预定次数,且所述文章专题的点击率低于预定点击率,则停止投放所述文章专题。该实施例的技术方案使得能够及时停止投放对用户吸引力较小(曝光次数较多但点击率较低说明文章专题对用户的吸引力较小)的文章专题,避免了继续投放对用户吸引力较小的文章专题而影响用户的体验。
在本发明的一个实施例中,在投放文章专题之后,若检测到所述文章专题针对任一用户曝光过,且所述用户未点击所述文章专题,则停止向所述用户投放所述文章专题和/或所述文章专题的封面文章。在该实施例中,若文章专题针对某个用户曝光过,且该用户未点击该文章专题,说明用户对该文章专题不感兴趣,或该文章专题对用户的吸引力较小,因此通过停止向该用户投放该文章专题或者该文章专题的封面文章,使得能够针对用户的实际兴趣点及时调整投放策略,进而能够提高用户的使用体验。
在本发明的一个实施例中,在投放文章专题之后,若检测到任一用户点击该文章专题,则在用户浏览该文章专题之后,停止向该用户投放所述文章专题、和/或所述文章专题的封面文章、和/或所述文章专题内已曝光/点击的文章、和/或所述文章专题内的所有文章。该实施例的技术方案使得用户在浏览该文章专题之后,停止向该用户投放与该专题相关的文章,以避免重复投放造成用户的困扰。
在本发明的一个实施例中,在投放文章专题之前,可以统计文章专题内的文章针对各个用户的曝光情况,或被所述各个用户的点击情况;根据所述文章专题内的文章针对各个用户的曝光情况,或被所述各个用户的点击情况,确定是否向所述各个用户投放所述文章专题。比如若文章专题的封面文章针对任一用户已经曝光过或已被所述任一用户点击过,则不向所述任一用户投放所述文章专题,避免重复投放而影响用户体验。再如在文章专题的封面文章针对任一用户未曝光过、且未被所述任一用户点击过的情况下,若文章专题内的其它文章针对所述任一用户的曝光比例达到预定值(如40%以上等),则不向所述任一用户投放所述文章专题,进而也可以避免重复投放而对用户造成困扰。
在本发明的一个实施例中,在投放文章专题之后,可以根据用户对文章专题所包含的文章的点击次数,计算用户对应的推荐模型中各个参数的权重,其中,所述点击次数与所述权重的增加量成反相关关系。在该实施例中,由于同一文章专题中各个文章包含的关键词等重复度较高,因此通过使点击次数与推荐模型中各个参数的权重增加量成反相关关系,使得能够随着对文章专题内文章的点击次数的增加,逐步减小权重增加量,进而能够对推荐模型中各个参数的权重进行有效控制,避免权重增加较大而导致不能公平推荐其它文章专题或文章,同时也能够避免向用户继续推荐过多类似的文章或文章专题而影响用户体验。
在本发明的一个实施例中,在投放文章专题之后,还可以统计文章专题的点击率,以及所述文章专题所包含的各个文章的点击率;根据所述文章专题的点击率、所述文章专题所包含的各个文章的点击率及所述文章专题所包含的各个文章的质量,确定所述文章专题的质量。该实施例的技术方案使得能够基于确定的文章专题的质量来优化后续的专题推荐策略,进而确保提高用户的体验。其中,若文章专题的点击率较高,或者文章专题内包含的各个文章的点击率较高,或者文章专题所包含的文章质量较高,则说明文章专题的质量较高。
在本发明的一个实施例中,在根据具有关联关系的多篇文章生成文章专题之后,还包括:获取用户的核心兴趣点,和/或根据用户在预定时间段内的行为数据确定所述用户的实时画像;确定与所述核心兴趣点和/或所述实时画像相匹配的目标文章专题;提高所述目标文章专题的推荐权重,以在向所述用户推荐文章时,将所述目标文章专题推荐给所述用户。该实施例的技术方案使得能够向用户推荐与其实时画像相匹配的文章专题,进而能够提高用户的阅读兴趣,同时也能够提高文章专题的点击率,有利于提高用户对产品的粘度。
图2示意性示出了根据本发明的一个实施例的生成文章专题的流程图。
参照图2所示,根据本发明的一个实施例的生成文章专题的流程,包括如下步骤:
步骤S201,从数据库中获取文章数据。
在本发明的一个实施例中,从数据库中获取的文章数据可以是待推荐给用户的文章数据。
步骤S202,提取关键词组合。
在本发明的一个实施例中,提取关键词组合即为从各个文章中提取相应的关键词组合。比如可以从一篇文章中提取1-5个关键词。
步骤S203,初步构建专题。
在本发明的一个实施例中,可以根据从文章中提取出的关键词组合来构建专题,比如将关键词相同或相近的文章合并在一起构建专题。其中,文章专题内的文章可以按照点击率由高到低的顺序进行排列。
步骤S204,根据专题重叠度合并专题。
在本发明的一个实施例中,根据专题重叠度合并专题即为根据生成的多个专题之间的重叠度,将生成的专题进行合并。
步骤S205,根据专题名称合并专题。
在本发明的一个实施例中,可以将专题名称相同或相近的专题进行合并。需要说明的是,步骤S204与步骤S205之间既可以同时执行,也可以先执行其中的某个步骤,然后再执行另一个步骤。
步骤S206,文本、图像去重。
在本发明的一个实施例中,文本、图像去重即为删除专题内包含的重复文本和/或图像。比如若文章之间的相似度超过75%,则可以进行去重处理。
步骤S207,过滤和专题匹配度较小的文章。
在本发明的一个实施例中,过滤和专题匹配度较小的文章即为从专题内删除掉与专题匹配度较小的文章。
在本发明的一个实施例中,文章专题内的文章数量可以大于或等于5篇或7篇,且小于或等于12篇(数值在此仅为示例)。
步骤S208,获取质量和所代表的用户POI(Point of Interest,兴趣点)等特征。
在本发明的一个实施例中,可以从数据库中获取文章质量和POI等特征。
步骤S209,选取封面文章。
在本发明的一个实施例中,步骤S209即为选取文章专题的封面文章。比如可以将文章专题内质量最好和/或点击率最高的文章作为文章专题的封面文章。此外,文章专题可以既可以正常显示(正常显示与展开显示相对应,比如折叠显示),也可以展开显示,展开显示时可以设置提引语,该提引语可与标题一致,标题和封面可以选取与点击率最高(或文章质量最高)的文章的相关信息。
步骤S210,选取专题配图。
在本发明的一个实施例中,步骤S210即为选取文章专题的专题配图。比如可以将封面文章中的图片作为专题配图等。此外,文章专题可以有顶部图,该顶部图可以选取包含有大图的文章中的图片。其中,顶部图即为设置在一个文章专题内的文章列表之上的图。
步骤S211,生成专题插入到后台。
在本发明的一个实施例中,生成的专题可以设置一个更新频率,比如所有专题可以每天更新一次,之前的专题全部失效,其中,新生成的专题中可能存在与老专题完全一样的专题,但是专题id应当不同。此外,若专题内的文章撤稿或过期,则立刻进行更新,具体地可以控制立即不投放当前专题,并且可以基于剩余的可用文章创建新的专题投放。
在本发明的一个实施例中,用于生成专题的文章可以选取在有效期范围内的文章和当前可用的其它文章等。
此外,本发明的实施例还提出了对文章专题的存储策略、人工审核/运营干预策略、投放策略等,以下分别进行阐述:
1、存储策略:
(1)文章专题与文章专题内的单篇文章可以分别存储,以确保单篇文章还能被推荐、或者形成新的文章专题;
(2)专题列表中自动生成的文章专题(自动生成的文章专题即基于本发明实施例的技术方案生成的文章专题)与人工编辑生成的专题可以进行区分存储;
(3)自动生成的不同类型的文章专题可以分别存储。
2、人工审核/运营干预策略:
(1)人工可以删除自动生成的文章专题,或者删除文章专题内的某文章;
(2)人工可以调整文章专题内的文章顺序(比如根据创建时间、权重、栏目顺序等进行调整);
(3)自动生成的文章专题可以被移动到人工编辑区由人工进行编辑,也可以直接加入某文章频道进行投放。
3、投放策略:
(1)展示
①对于普通的文章专题,在展示时的封面标题和封面图片可以来自文章专题内点击率最高的一篇文章;
②如果文章专题内有大图文章(大图文章即为前述的包含有大图的文章),则可以选取点击率最高的大图文章的大图作为专题内的顶部图;
③如果专题内没有大图文章,则可以不展示顶部图;
④专题的分类、所代表的用户兴趣点、关键词、质量、点击率采用封面文章的数据;
(2)其它控制策略
①优先投放大图专题;
②点击率控制,如果文章专题曝光了30次且点击率高于10%,则继续投放,否则不再继续投放;
③去重
A、如果文章专题没被曝光过,则文章专题可继续投放。
B、如果文章专题投放之后用户未点击,则可以过滤掉该文章专题和文章专题的封面文章,但是文章专题内的其他文章可以不过滤(需要说明的是,该实施例中的“过滤”即为不再投放)。换句话说,如果文章专题投放之后用户未点击,说明用户可能对该文章专题不感兴趣,那么后续不再向该用户投放该文章专题和该文章专题的封面文章,但是对于该文章专题内的其他文章,则可以继续向该用户投放(比如可以单独投放这些文章或者通过这些文章构成其它文章专题进行投放)。
C、如果文章专题投放之后用户进行了点击,则可以过滤掉该文章专题和文章专题的封面文章,并且也可以过滤掉文章专题内曝光过或用户点击过的内容(或者可以过滤掉文章专题内的所有文章)。换句话说,如果文章专题在投放之后用户进行了点击,说明用户查看了该文章专题,因此为了避免重复投放,则后续可以不再向该用户投放该文章专题和该文章专题的封面文章(如不再单独投放该封面文章或者不再通过该封面文章形成新的文章专题进行投放),并且也可以不再向该用户投放该文章专题内已经曝光过或者用户已经点击过的内容,或者也可以不再向该用户投放文章专题内的所有文章(如不再单独投放或者不再通过这些文章/内容形成新的文章专题进行投放)。
D、文章专题被曝光过,则可以分情况投放,具体如下:
d1、封面文章(封面文章是作为文章专题封面的文章,在展示文章专题时可以展示封面文章的部分内容,比如将封面文章的摘要作为文章专题的摘要进行展示等)已曝光或被点击,则不投放;
d2、封面文章未曝光且未点击,但专题内的文章部分曝光,则当已曝光篇数达到总数的40%(向上取整,且数值在此仅为示例)以上时,不再投放;否则,继续投放。或者在文章专题内过滤掉这些文章,当过滤后的文章数小于5篇(数值在此仅为示例)时,此专题不再投放;否则,继续投放。
④失效时间
A、可以由人工控制文章专题是否处于投放状态;
B、全部专题每天更新,新专题的id与旧专题的id可以设置为不相同;
C、如果某个专题内的文章失效,则该专题实时失效,并且立刻重新生成新专题进行投放;
D、不在投放范围的文章专题需要立即停止投放,不满足去重条件的专题严格控制投放。
⑤防止过渡推荐
A、终端显示界面中的同一屏内显示有文章专题时,可以控制与文章专题同类别文章的推荐数量,比如可以控制同一屏内同类别的文章不超过3篇(含专题、视频等);
B、控制终端显示界面中同一屏内显示的专题数量,比如同一屏内可以不超过1个;
C、当待推荐的文章和文章专题的点击率、文章质量同水平的情况下,优先推荐文章专题。
⑥影响模型
A、点击文章专题时,对分类、所代表的用户兴趣点、关键词的权重影响按封面文章计算,点击专题内同一文章不重复计算权重。
B、由于文章专题内的文章分类、所代表的用户兴趣点、关键词等重复度较高,因此当文章专题内的文章被点击多次时,对模型的影响要逐步、快速降权。比如可以采取三次方降权,具体地,假设每次点击对兴趣点的影响为:兴趣点A(0.59)、兴趣点B(0.32),则第一次点击后:A'=A+0.59、B'=B+0.32;第二次点击后:A”=A'+0.205(0.59^3)、B”=B'+0.033(0.32^3)。
C、对疲劳度模型的影响:由于专题内同一分类的文章较多,可能会出现短期内疲劳记分增加而导致达到疲劳上限的情况,因此需要注意与疲劳度模型的冲突问题,比如对同一专题内的多篇文章进行点击时,不增加疲劳记分,或者也按照前述的三次方降权的方式来控制疲劳记分的增加。
⑦专题内质量评估
A、统计文章专题的所属类别、文章专题内全部文章的质量加权分数、文章专题的点击率、文章专题的内部文章点击率等指标,以便于对文章专题的质量进行评估,为后续优化提供数据指导;
B、文章专题的点击率过低时,可以通过修改文章专题的标题、封面图、替换封面文章等方式来进行优化。
⑧召回和重排
A、新增一个召回模块,召回与用户的核心兴趣点和/或与用户在预定时间段内的行为数据(用户在预定时间段内的行为数据比如可以是用户在预定时间段内都搜索与“天龙八部”相关的内容,那么可以召回与“天龙八部”相关的文章专题)相匹配的文章专题。
B、重排时提高召回的文章专题的权限,以确保召回的文章专题在重排时都能够优先推荐给用户。
本发明上述实施例的技术方案通过根据文章之间的关联关系来生成文章专题,并投放生成的文章专题,使得用户通过一次触发操作可以查看到多篇具有关联关系的文章,满足了用户对自己感兴趣的领域(如某垂直领域、热点事件等)的阅读需求,并且能够在扩展文章阅读范围的前提下,简化用户的操作,提升了一次点击行为带来的用户体验。
示例性介质
在介绍了本发明示例性实施方式的方法之后,接下来,对本发明示例性实施方式的介质进行说明。
在一些可能的实施方式中,本发明的各个方面还可以实现为一种介质,其上存储有程序代码,当所述程序代码被设备的处理器执行时用于实现本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的文章投放方法中的步骤。
具体地,所述设备的处理器执行所述程序代码时用于实现如下步骤:提取待推荐的各个文章中的关键词;基于从所述各个文章中提取出的关键词,确定所述各个文章之间的关联关系;根据具有关联关系的多篇文章生成文章专题;投放所述文章专题。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时还用于实现如下步骤:在根据具有关联关系的多篇文章生成文章专题之后,根据生成的多个文章专题的内容重叠度和/或专题名称,对所述多个文章专题进行合并处理。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时还用于实现如下步骤:在根据具有关联关系的多篇文章生成文章专题之后,检测并删除生成的所述文章专题中的重复内容;和/或删除生成的所述文章专题中包含的与所述文章专题的匹配度小于或等于预定值的文章。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时还用于实现如下步骤:在根据具有关联关系的多篇文章生成文章专题之后,根据所述文章专题所包含的各个文章的特征,从所述文章专题所包含的文章中确定所述文章专题的封面文章和/或封面图片;根据所述封面文章和/或所述封面图片,生成所述文章专题的封面。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时用于实现如下步骤:根据所述文章专题所包含的各个文章的点击率和/或质量,从所述文章专题所包含的中选择点击率最高和/或质量最高的文章作为所述封面文章和/或选择点击率最高和/或质量最高的文章中的图片作为所述封面图片。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时还用于实现如下步骤:若所述文章专题具有封面文章,则根据所述封面文章的属性及统计数据,确定所述文章专题的属性及统计数据。
在本发明的一些实施例中,所述属性包括:分类、关键词、质量;所述统计数据包括点击率、曝光量。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时还用于实现如下步骤:在投放所述文章专题之后,统计所述文章专题的点击率;若所述文章专题的点击率低于预定点击率,则根据所述文章专题所包含的各个文章的特征,修改所述文章专题的封面。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时还用于实现如下步骤:根据生成的所述文章专题所包含的各个文章的点击率,对所述文章专题所包含的文章进行排序。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时还用于实现如下步骤:每经过预定时长,则根据待推荐的所有文章重新生成所述文章专题。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时还用于实现如下步骤:若已投放的文章专题中包含的任一篇文章失效,则停止投放所述文章专题。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时还用于实现如下步骤:在停止投放所述文章专题之后,根据停止投放的文章专题中未失效的文章,重新生成文章专题。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时还用于实现如下步骤:在根据具有关联关系的多篇文章生成文章专题之后,若接收到对所述文章专题的删除指令,则删除所述文章专题;和/或若接收到对所述文章专题中的任一文章的删除指令,则从所述文章专题中删除所述任一文章;和/或若接收到对所述文章专题中的文章顺序的调整指令,则根据所述调整指令对所述文章专题中的文章顺序进行调整。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时还用于实现如下步骤:在投放所述文章专题之后,统计所述文章专题的曝光次数和点击率;若所述文章专题的曝光次数达到预定次数,且所述文章专题的点击率低于预定点击率,则停止投放所述文章专题。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时还用于实现如下步骤:在投放所述文章专题之后,若检测到所述文章专题针对任一用户曝光过,且所述用户未点击所述文章专题,则停止向所述用户投放所述文章专题和/或所述文章专题的封面文章。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时还用于实现如下步骤:在投放所述文章专题之后,若检测到任一用户点击所述文章专题,则在所述用户浏览所述文章专题之后,停止向所述用户投放所述文章专题、和/或所述文章专题的封面文章、和/或所述文章专题内已曝光/点击的文章、和/或所述文章专题内的所有文章。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时还用于实现如下步骤:在投放所述文章专题之前,统计所述文章专题内的文章针对各个用户的曝光情况,或被所述各个用户的点击情况;根据所述文章专题内的文章针对各个用户的曝光情况,或被所述各个用户的点击情况,确定是否向所述各个用户投放所述文章专题。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时用于实现如下步骤:若所述文章专题的封面文章针对任一用户已经曝光过或已被所述任一用户点击过,则不向所述任一用户投放所述文章专题;或在所述文章专题的封面文章针对任一用户未曝光过、且未被所述任一用户点击过的情况下,若所述文章专题内的其它文章针对所述任一用户的曝光比例达到预定值,则不向所述任一用户投放所述文章专题。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时还用于实现如下步骤:在投放所述文章专题时,控制显示所述文章专题的终端在所述终端的显示界面上实时显示所述文章专题的数量。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时还用于实现如下步骤:在投放所述文章专题时,控制显示所述文章专题的终端在所述终端的显示界面上实时显示与所述文章专题的类别相匹配的文章数量。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时还用于实现如下步骤:在投放所述文章专题之后,根据用户对所述文章专题所包含的文章的点击次数,计算所述用户对应的推荐模型中各个参数的权重,其中,所述点击次数与所述权重的增加量成反相关关系。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时还用于实现如下步骤:在投放所述文章专题之后,统计所述文章专题的点击率,以及所述文章专题所包含的各个文章的点击率;根据所述文章专题的点击率、所述文章专题所包含的各个文章的点击率及所述文章专题所包含的各个文章的质量,确定所述文章专题的质量。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时还用于实现如下步骤:在根据具有关联关系的多篇文章生成文章专题之后,获取用户的核心兴趣点,和/或根据用户在预定时间段内的行为数据确定所述用户的实时画像;确定与所述核心兴趣点和/或所述实时画像相匹配的目标文章专题;提高所述目标文章专题的推荐权重,以在向所述用户推荐文章时,将所述目标文章专题推荐给所述用户。
在本发明的一些实施方式中,所述设备的处理器执行所述程序代码时还用于实现如下步骤:将所述文章专题与所述待推荐的各个文章进行区分存储。
需要说明的是:上述的介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于:电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线、光缆、RF等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
示例性装置
在介绍了本发明示例性实施方式的介质之后,接下来,参考图3对本发明示例性实施方式的文章投放装置进行说明。
图3示意性示出了根据本发明的一个实施例的文章投放装置的框图。
参照图3所示,根据本发明的一个实施例的文章投放装置300,包括:提取单元301、第一确定单元302、专题生成单元303和投放单元304。
其中,提取单元301用于提取待推荐的各个文章中的关键词;第一确定单元302用于基于从所述各个文章中提取出的关键词,确定所述各个文章之间的关联关系;专题生成单元303用于根据具有关联关系的多篇文章生成文章专题;投放单元304用于投放所述文章专题。
在本发明的一些实施例中,基于前述方案,所述的装置300还包括:合并处理单元305,用于在所述专题生成单元根据具有关联关系的多篇文章生成文章专题之后,根据生成的多个文章专题的内容重叠度和/或专题名称,对所述多个文章专题进行合并处理。
在本发明的一些实施例中,基于前述方案,所述专题生成单元303还用于:在根据具有关联关系的多篇文章生成文章专题之后,检测并删除生成的所述文章专题中的重复内容,和/或删除生成的所述文章专题中包含的与所述文章专题的匹配度小于或等于预定值的文章。
在本发明的一些实施例中,基于前述方案,所述的装置300还包括:封面生成单元306,用于在所述专题生成单元303生成文章专题之后,根据所述文章专题所包含的各个文章的特征,从所述文章专题所包含的文章中确定所述文章专题的封面文章和/或封面图片,并根据所述封面文章和/或所述封面图片,生成所述文章专题的封面。
在本发明的一些实施例中,基于前述方案,所述封面生成单元306用于:根据所述文章专题所包含的各个文章的点击率和/或质量,从所述文章专题所包含的中选择点击率最高和/或质量最高的文章作为所述封面文章和/或选择点击率最高和/或质量最高的文章中的图片作为所述封面图片。
在本发明的一些实施例中,基于前述方案,所述的装置300还包括:第二确定单元307,用于在所述文章专题具有封面文章时,根据所述封面文章的属性及统计数据,确定所述文章专题的属性及统计数据。
在本发明的一些实施例中,基于前述方案,所述属性包括:分类、关键词、质量;所述统计数据包括点击率、曝光量。
在本发明的一些实施例中,基于前述方案,所述的装置300还包括:第一统计单元308,用于在投放所述文章专题之后,统计所述文章专题的点击率;所述封面生成单元306还用于:若所述文章专题的点击率低于预定点击率,则根据所述文章专题所包含的各个文章的特征,修改所述文章专题的封面。
在本发明的一些实施例中,基于前述方案,所述的装置300还包括:排序单元309,用于根据生成的所述文章专题所包含的各个文章的点击率,对所述文章专题所包含的文章进行排序。
在本发明的一些实施例中,基于前述方案,所述专题生成单元303还用于:每经过预定时长,则根据待推荐的所有文章重新生成所述文章专题。
在本发明的一些实施例中,基于前述方案,所述投放单元304还用于:若已投放的文章专题中包含的任一篇文章失效,则停止投放所述文章专题。
在本发明的一些实施例中,基于前述方案,所述专题生成单元303还用于:在所述投放单元停止投放所述文章专题之后,根据停止投放的文章专题中未失效的文章,重新生成文章专题。
在本发明的一些实施例中,基于前述方案,专题生成单元303还用于:若接收到对所述文章专题的删除指令,则删除所述文章专题;和/或若接收到对所述文章专题中的任一文章的删除指令,则从所述文章专题中删除所述任一文章;和/或若接收到对所述文章专题中的文章顺序的调整指令,则根据所述调整指令对所述文章专题中的文章顺序进行调整。
在本发明的一些实施例中,基于前述方案,所述的装置300还包括:第二统计单元310,用于在所述投放单元投放所述文章专题之后,统计所述文章专题的曝光次数和点击率;所述投放单元304还用于:若所述文章专题的曝光次数达到预定次数,且所述文章专题的点击率低于预定点击率,则停止投放所述文章专题。
在本发明的一些实施例中,基于前述方案,所述投放单元304还用于:在投放所述文章专题之后,若检测到所述文章专题针对任一用户曝光过,且所述用户未点击所述文章专题,则停止向所述用户投放所述文章专题和/或所述文章专题的封面文章。
在本发明的一些实施例中,基于前述方案,所述投放单元304还用于:在投放所述文章专题之后,若检测到任一用户点击所述文章专题,则在所述用户浏览所述文章专题之后,停止向所述用户投放所述文章专题、和/或所述文章专题的封面文章、和/或所述文章专题内已曝光/点击的文章、和/或所述文章专题内的所有文章。
在本发明的一些实施例中,基于前述方案,所述的装置300还包括:第三统计单元311,用于在投放所述文章专题之前,统计所述文章专题内的文章针对各个用户的曝光情况,或被所述各个用户的点击情况;所述投放单元304还用于根据所述文章专题内的文章针对各个用户的曝光情况,或被所述各个用户的点击情况,确定是否向所述各个用户投放所述文章专题。
在本发明的一些实施例中,基于前述方案,所述投放单元304用于:若所述文章专题的封面文章针对任一用户已经曝光过或已被所述任一用户点击过,则不向所述任一用户投放所述文章专题;或在所述文章专题的封面文章针对任一用户未曝光过、且未被所述任一用户点击过的情况下,若所述文章专题内的其它文章针对所述任一用户的曝光比例达到预定值,则不向所述任一用户投放所述文章专题。
在本发明的一些实施例中,基于前述方案,所述投放单元304还用于:在投放所述文章专题时,控制显示所述文章专题的终端在所述终端的显示界面上实时显示所述文章专题的数量。
在本发明的一些实施例中,基于前述方案,所述投放单元304还用于:在投放所述文章专题时,控制显示所述文章专题的终端在所述终端的显示界面上实时显示与所述文章专题的类别相匹配的文章数量。
在本发明的一些实施例中,基于前述方案,所述的装置300还包括:计算单元312,用于在所述投放单元投放所述文章专题之后,根据用户对所述文章专题所包含的文章的点击次数,计算所述用户对应的推荐模型中各个参数的权重,其中,所述点击次数与所述权重的增加量成反相关关系。
在本发明的一些实施例中,基于前述方案,所述的装置300还包括:第四统计单元313,用于在投放所述文章专题之后,统计所述文章专题的点击率,以及所述文章专题所包含的各个文章的点击率;第三确定单元314,用于根据所述文章专题的点击率、所述文章专题所包含的各个文章的点击率及所述文章专题所包含的各个文章的质量,确定所述文章专题的质量。
在本发明的一些实施例中,基于前述方案,所述的装置300还包括:获取单元315,用于在所述专题生成单元根据具有关联关系的多篇文章生成文章专题之后,获取用户的核心兴趣点,和/或根据用户在预定时间段内的行为数据确定所述用户的实时画像;第四确定单元316,用于确定与所述核心兴趣点和/或所述实时画像相匹配的目标文章专题;处理单元317,用于提高所述目标文章专题的推荐权重,以在向所述用户推荐文章时,将所述目标文章专题推荐给所述用户。
在本发明的一些实施例中,基于前述方案,所述的装置300还包括:存储单元318,用于将所述文章专题与所述待推荐的各个文章进行区分存储。
示例性计算设备
在介绍了本发明示例性实施方式的方法、介质和装置之后,接下来,介绍根据本发明的另一示例性实施方式的计算设备。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,根据本发明实施方式的计算设备可以至少包括至少一个处理器、以及至少一个存储器。其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的文章投放方法中的步骤。例如,所述处理器可以执行如图1中所示的步骤S110,提取待推荐的各个文章中的关键词;步骤S120,基于从所述各个文章中提取出的关键词,确定所述各个文章之间的关联关系;步骤S130,根据具有关联关系的多篇文章生成文章专题;步骤S140,投放所述文章专题。
又如,所述处理器也可以执行如图2中所示的步骤。
应当注意,尽管在上文详细描述中提及了文章投放装置的若干单元或子单元,但是这种划分仅仅是示例性的,并非是强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或单元的特征和功能可以在一个模块或单元中具体化。反之,上文描述的一个模块或单元的特征和功能可以进一步划分为由多个模块或单元来具体化。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所发明的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims (10)

1.一种文章投放方法,包括:
提取待推荐的各个文章中的关键词;
基于从所述各个文章中提取出的关键词,确定所述各个文章之间的关联关系;
根据具有关联关系的多篇文章生成文章专题;
投放所述文章专题。
2.根据权利要求1所述的方法,其中,在根据具有关联关系的多篇文章生成文章专题之后,还包括:
根据生成的多个文章专题的内容重叠度和/或专题名称,对所述多个文章专题进行合并处理。
3.根据权利要求1所述的方法,其中,在根据具有关联关系的多篇文章生成文章专题之后,还包括:
检测并删除生成的所述文章专题中的重复内容;和/或
删除生成的所述文章专题中包含的与所述文章专题的匹配度小于或等于预定值的文章。
4.根据权利要求1所述的方法,其中,在根据具有关联关系的多篇文章生成文章专题之后,还包括:
根据所述文章专题所包含的各个文章的特征,从所述文章专题所包含的文章中确定所述文章专题的封面文章和/或封面图片;
根据所述封面文章和/或所述封面图片,生成所述文章专题的封面。
5.根据权利要求4所述的方法,其中,根据所述文章专题所包含的各个文章的特征,从所述文章专题所包含的文章中确定所述文章专题的封面文章和/或封面图片,包括:
根据所述文章专题所包含的各个文章的点击率和/或质量,从所述文章专题所包含的中选择点击率最高和/或质量最高的文章作为所述封面文章和/或选择点击率最高和/或质量最高的文章中的图片作为所述封面图片。
6.根据权利要求4所述的方法,其中,若所述文章专题具有封面文章,则根据所述封面文章的属性及统计数据,确定所述文章专题的属性及统计数据。
7.根据权利要求4所述的方法,其中,在投放所述文章专题之后,还包括:
统计所述文章专题的点击率;
若所述文章专题的点击率低于预定点击率,则根据所述文章专题所包含的各个文章的特征,修改所述文章专题的封面。
8.一种介质,其上存储有程序,该程序被处理器执行时实现如权利要求1至7中任一项所述的方法。
9.一种文章投放装置,包括:
提取单元,用于提取待推荐的各个文章中的关键词;
第一确定单元,用于基于从所述各个文章中提取出的关键词,确定所述各个文章之间的关联关系;
专题生成单元,用于根据具有关联关系的多篇文章生成文章专题;
投放单元,用于投放所述文章专题。
10.一种计算设备,包括:处理器和存储器,所述存储器存储有可执行指令,所述处理器用于调用所述存储器存储的可执行指令执行如权利要求1至7中任一项所述的方法。
CN201810510179.3A 2018-05-24 2018-05-24 文章投放方法、介质、装置和计算设备 Pending CN108846028A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810510179.3A CN108846028A (zh) 2018-05-24 2018-05-24 文章投放方法、介质、装置和计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810510179.3A CN108846028A (zh) 2018-05-24 2018-05-24 文章投放方法、介质、装置和计算设备

Publications (1)

Publication Number Publication Date
CN108846028A true CN108846028A (zh) 2018-11-20

Family

ID=64213463

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810510179.3A Pending CN108846028A (zh) 2018-05-24 2018-05-24 文章投放方法、介质、装置和计算设备

Country Status (1)

Country Link
CN (1) CN108846028A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188077A (zh) * 2019-05-29 2019-08-30 北京市律典通科技有限公司 一种电子卷宗智能分类方法、装置、电子设备和存储介质
CN111428049A (zh) * 2020-03-20 2020-07-17 北京百度网讯科技有限公司 一种事件专题的生成方法、装置、设备和存储介质
CN112328937A (zh) * 2020-11-04 2021-02-05 支付宝(杭州)信息技术有限公司 信息投放方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069102A (zh) * 2015-08-03 2015-11-18 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN107944033A (zh) * 2017-12-13 2018-04-20 北京百度网讯科技有限公司 关联话题推荐方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069102A (zh) * 2015-08-03 2015-11-18 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN107944033A (zh) * 2017-12-13 2018-04-20 北京百度网讯科技有限公司 关联话题推荐方法和装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188077A (zh) * 2019-05-29 2019-08-30 北京市律典通科技有限公司 一种电子卷宗智能分类方法、装置、电子设备和存储介质
CN110188077B (zh) * 2019-05-29 2021-03-19 北京市律典通科技有限公司 一种电子卷宗智能分类方法、装置、电子设备和存储介质
CN111428049A (zh) * 2020-03-20 2020-07-17 北京百度网讯科技有限公司 一种事件专题的生成方法、装置、设备和存储介质
CN112328937A (zh) * 2020-11-04 2021-02-05 支付宝(杭州)信息技术有限公司 信息投放方法及装置
CN112328937B (zh) * 2020-11-04 2024-01-30 支付宝(杭州)信息技术有限公司 信息投放方法及装置

Similar Documents

Publication Publication Date Title
Parikh et al. ToTTo: A controlled table-to-text generation dataset
CN106547742B (zh) 基于人工智能的语义解析结果处理方法和装置
CN108536679A (zh) 命名实体识别方法、装置、设备及计算机可读存储介质
CN109815368A (zh) 资源推荐方法、装置、设备及计算机可读存储介质
US20180124437A1 (en) System and method for video data collection
CN110196972B (zh) 文案生成方法、装置及计算机可读存储介质
CN108846028A (zh) 文章投放方法、介质、装置和计算设备
CN103534697B (zh) 用于提供统计对话管理器训练的方法和系统
CN109409892A (zh) 风险评估方法和系统
CN107256428A (zh) 数据处理方法、数据处理装置、存储设备及网络设备
CN109522950A (zh) 图像评分模型训练方法及装置和图像评分方法及装置
CN110166650A (zh) 视频集的生成方法及装置、计算机设备与可读介质
CN110895568B (zh) 处理庭审记录的方法和系统
CN106649739B (zh) 多轮交互信息继承识别方法、装置以及交互系统
CN108810642A (zh) 一种弹幕显示方法、装置及电子设备
CN108875769A (zh) 数据标注方法、装置和系统及存储介质
CN109257656A (zh) 一种语音连麦方法、装置、服务器及存储介质
CN109275047A (zh) 视频信息处理方法及装置、电子设备、存储介质
CN109240786A (zh) 一种主题更换方法及电子设备
CN108920450A (zh) 一种基于电子设备的知识点复习方法及电子设备
CN108924663A (zh) 直播房间管理方法、装置、电子设备及存储介质
US20190295199A1 (en) Intelligent legal simulator
CN108920640A (zh) 基于语音交互的上下文获取方法及设备
US20230214423A1 (en) Video generation
CN110209875A (zh) 用户内容画像确定方法、访问对象推荐方法和相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination