CN109993583B - 信息推送方法和装置、存储介质及电子装置 - Google Patents

信息推送方法和装置、存储介质及电子装置 Download PDF

Info

Publication number
CN109993583B
CN109993583B CN201910262355.0A CN201910262355A CN109993583B CN 109993583 B CN109993583 B CN 109993583B CN 201910262355 A CN201910262355 A CN 201910262355A CN 109993583 B CN109993583 B CN 109993583B
Authority
CN
China
Prior art keywords
information
pushed
keyword
similarity
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910262355.0A
Other languages
English (en)
Other versions
CN109993583A (zh
Inventor
米兰
李忠飞
王飞
贾东元
姚勋元
宋源
王栩瑶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tencent Information Technology Co Ltd
Original Assignee
Shenzhen Tencent Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Tencent Information Technology Co Ltd filed Critical Shenzhen Tencent Information Technology Co Ltd
Priority to CN201910262355.0A priority Critical patent/CN109993583B/zh
Publication of CN109993583A publication Critical patent/CN109993583A/zh
Application granted granted Critical
Publication of CN109993583B publication Critical patent/CN109993583B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种信息推送方法和装置、存储介质及电子装置。其中,该方法包括:获取目标应用的第一账号的历史浏览数据;在历史浏览数据记录了第一账号通过目标应用浏览过的目标信息的情况下,根据历史浏览数据记录的目标信息和热门信息,在目标应用收集到的信息集合中确定出第一待推送信息,其中,热门信息是信息集合中热度指数超过预定阈值的信息;向第一账号推送第一待推送信息。本发明解决了相关技术中信息推送不准确的技术问题。

Description

信息推送方法和装置、存储介质及电子装置
技术领域
本发明涉及计算机领域,具体而言,涉及一种信息推送方法和装置、存储介质及电子装置。
背景技术
相关技术中,在向用户推送信息的过程中,通常是向用户推送热门信息或者使用协同过滤的方法向用户推送信息。
然而,若是采用上述方法,仅推送热门信息时,无法准确根据用户特征推荐信息,仅根据协同过滤的方法推送信息时,在用户数量较少的情况下,无法准确向用户推送信息。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种信息推送方法和装置、存储介质及电子装置,以至少解决相关技术中信息推送不准确的技术问题。
根据本发明实施例的一个方面,提供了一种信息推送方法,包括:获取目标应用的第一账号的历史浏览数据;在历史浏览数据记录了第一账号通过目标应用浏览过的目标信息的情况下,根据历史浏览数据记录的目标信息和热门信息,在目标应用收集到的信息集合中确定出第一待推送信息,其中,热门信息是信息集合中热度指数超过预定阈值的信息;向第一账号推送第一待推送信息。
根据本发明实施例的另一个方面,还提供了一种信息显示方法,包括:检测到第一账号登录应用的情况下,在上述应用的显示界面显示第一待推送信息,其中,上述第一待推送信息为根据热门信息与第一账号对应用上显示的历史信息进行浏览的历史浏览数据,从应用收集到的信息集合中确定的信息。
根据本发明实施例的又一方面,还提供了一种信息推送装置,包括:第一获取单元,用于获取目标应用的第一账号的历史浏览数据;第一确定单元,用于在上述历史浏览数据记录了上述第一账号通过上述目标应用浏览过的目标信息的情况下,根据上述历史浏览数据记录的上述目标信息和热门信息,在上述目标应用收集到的信息集合中确定出第一待推送信息,其中,上述热门信息是上述信息集合中热度指数超过预定阈值的信息;第一推送单元,用于向上述第一账号推送上述第一待推送信息。
作为一种可选的示例,上述装置还包括:第二确定单元,用于在获取目标应用的第一账号的历史浏览数据之后,在上述历史浏览数据为空的情况下,根据上述热门信息在上述目标应用收集到的上述信息集合中确定出第二待推送信息;第二推送单元,用于向上述第一账号推送上述第二待推送信息。
作为一种可选的示例,上述确定单元包括:第一确定模块,用于确定上述目标信息的第一标签集与上述热门信息的第二标签集以及上述信息集合中的第一信息的第三标签集;第二确定模块,用于确定上述第一标签集与上述第三标签集之间的第一相似度;第三确定模块,用于确定上述第二标签集与上述第三标签集之间的第二相似度;第四确定模块,用于根据上述第一相似度与上述第二相似度确定上述第一信息对应的目标相似度;第五确定模块,用于在上述目标相似度大于第一阈值的情况下,将上述第一信息作为上述第一待推送信息。
作为一种可选的示例,上述第四确定模块还用于:通过以下公式确定上述目标相似度:
T=(1-α)Pretag(ttop,i)+αPreact(u,i) (1)
其中,T为上述第一信息对应的待推送信息的目标相似度,上述Pretag(ttop,i)为上述第二相似度,上述ttop为上述热门信息,上述i为上述第一信息,上述Preact(u,i)为上述第一相似度,上述u为上述目标信息,0<α<1。
作为一种可选的示例,上述第二确定模块包括:第一确定子模块,用于根据上述第一标签集与上述第三标签集的标签相似度与词向量相似度确定上述第一相似度,其中,上述标签相似度为上述第一标签集与上述第三标签集的交集和上述第一标签集与上述第三标签集的并集的比值,上述词向量相似度为对上述第一标签集进行分词并整合成的第一词向量结构与对上述第三标签集进行分词并整合成的第二词向量结构的余弦相似度;上述第三确定模块包括:第二确定子模块,用于将上述第二标签集与上述第三标签集的交集和上述第二标签集与上述第三标签集的并集的比值作为上述第二相似度。
作为一种可选的示例,上述第一确定子模块还用于:根据如下公式计算上述第一相似度:
Preact(u,i)=β1J(u,i)+β2C(u,i) (2)
其中,上述Preact(u,i)为上述第一相似度,上述J(u,i)为上述标签相似度,上述C(u,i)为上述词向量相似度,上述u为上述目标信息,上述i为上述第一信息,β1>0,β2>0且β1+β2=1。
作为一种可选的示例,上述装置还包括:上述装置还包括:建立单元,用于在确定上述目标信息的第一标签集与上述热门信息的第二标签集以及上述信息集合中的第一信息的第三标签集之前,建立关键词表的标签库,其中,上述标签库中包含有多个标签,上述关键词表中的每一个关键词与上述多个标签中每一个标签均对应一个权重,上述权重表示上述关键词表中的每一个关键词与上述多个标签中每一个标签的关联程度;上述第一确定模块包括:第三确定子模块,用于获取上述目标信息的第一关键词集;获取上述关键词表的标签库中与上述第一关键词集中的第一关键词对应的标签;将与上述第一关键词对应的标签中与上述第一关键词对应的权重最大的标签作为上述第一关键词的第一目标标签;将所有的上述第一目标标签作为上述第一标签集;第四确定子模块,用于获取上述热门信息的第二关键词集;获取上述关键词表的标签库中与上述第二关键词集中的第二关键词对应的标签;将与上述第二关键词对应的标签中与上述第二关键词对应的权重最大的标签作为上述第二关键词的第二目标标签;将所有的上述第二目标标签作为上述第二标签集;第五确定子模块,用于获取上述第一信息的第三关键词集;获取上述关键词表的标签库中与上述第三关键词集中的第三关键词对应的标签;将与上述第三关键词对应的标签中与上述第三关键词对应的权重最大的标签作为上述第三关键词的第三目标标签;将所有的上述第三目标标签作为上述第三标签集。
作为一种可选的示例,上述第一推送单元包括:第一推送模块,用于向上述第一账号推送上述第一待推送信息的标题信息与摘要信息;第二推送模块,用于在检测到对上述标题信息或者上述摘要信息的点击操作的情况下,向上述第一账号推送上述第一待推送信息的正文信息,其中,上述第一待推送信息包括上述标题信息、上述摘要信息和上述正文信息。
作为一种可选的示例,上述装置还包括:输入单元,用于在向上述第一账号推送上述第一待推送信息的摘要信息之前,将上述第一待推送信息输入到目标神经网络模型中,其中,上述目标神经网络模型为通过输入样本推送信息与样本摘要信息对初始神经网络模型进行训练后得到的收敛后的神经网络模型,上述目标神经网络模型用于在输入上述第一待推送信息后,输出上述第一待推送信息的上述摘要信息;第二获取单元,用于获取上述目标神经网络模型输出的上述摘要信息。
作为一种可选的示例,上述装置还包括:第三推送单元,用于在向上述第一账号推送上述第一待推送信息之后,向上述第一账号推送上述第一待推送信息中关键词的热度指数,其中,上述关键词的热度指数与上述关键词和其他关键词位于同一篇文档中的文档的数量,及上述关键词被作为一篇文档中的关键词的文档的数量相关。
作为一种可选的示例,上述装置还包括:第三获取单元,用于在向上述第一账号推送上述第一待推送信息中关键词的热度指数之前,获取上述第一待推送信息中第i个关键词在预定时间段内每一天的热度指数;第三确定单元,用于根据上述每一天的热度指数和以下公式确定上述第一待推送信息中第i个关键词的热度指数;
HI(keyi)=∑je-jHIj(keyi) (3)
其中,上述HI(keyi)为上述第一待推送信息中的第i个关键词的热度指数;上述j表示距离当前时间的天数,0≤j≤N,上述N为上述预定时间段内的天数;上述HIj(keyi)为第一待推送信息中的第i个关键词距离当前时间j天的热度指数,上述keyi为上述第一待推送信息中的第i个关键词,1≤i≤M,上述M为第一待推送信息中关键词的数量。
作为一种可选的示例,上述第三获取单元还用于:通过以下公式确定上述第一待推送信息中上述第i个关键词在上述预定时间段内每一天的热度指数:
HIj(keyi)=αf(PRj(keyi))+(1-α)f(DCj(keyi)) (4)
其中,上述keyi为上述第一待推送信息中的第i个关键词,上述PRj(keyi)为上述第一待推送信息的第i个关键词距离当前时间j天的热度值,上述DCj(keyi)为上述第一待推送信息的第i个关键词距离当前时间j天的频数值,其中,上述第一待推送信息中第i个关键词距离当前时间j天的热度值与在距离当前时间j天时,上述关键词与其他关键词出现在同一篇文档中的文档数量相关,上述第一待推送信息的第i个关键词距离当前时间j天的频数值为在距离当前时间j天中将上述第一待推送信息的第i个关键词作为文档中的关键词的文档数量。
作为一种可选的示例,将每一个关键词的当前热度初始化为1/N,其中,上述装置还包括:第四确定单元,用于通过以下步骤确定上述第一待推送信息中每一个关键词距离当前时间j天的热度值:重复以下公式计算上述第一待推送信息中每一个关键词距离当前时间j天的热度值,直到上述第一待推送信息中每一个关键距离当前时间j天的热度值的变化量小于第三阈值,其中,上述第一待推送信息中每一个关键词距离当前时间j天的热度值的变化量为连续两次计算得到的同一个关键词在距离当前时间j天时的热度值的差值:
Figure BDA0002015694230000061
其中,上述keyi表示第一待推送信息的第i个关键词,上述keyr表示第一待推送信息的第r个关键词,i=1,2,...,M,r=1,2,...,M,k=1,2,...,M,上述M为上述第一待推送信息中关键词的数量,上述PRj(keyi)表示上述第i个关键词距离当前时间j天的热度值,上述d为常数,上述Wrij表示上述第一待推送信息的第r个关键词和上述第一待推送信息的第i个关键词在距离当前时间j天时,出现在一篇文档中的文档数量,上述Wrkj表示上述第一待推送信息的第r个关键词和上述第一待推送信息的第k个关键词在距离当前时间j天中出现在一篇文档中的文档数量,上述(keyi,keyr)in a document表示上述keyi,与上述keyr位于同一篇文档中。
根据本发明实施例的又一方面,还提供了一种信息显示装置,包括:第一显示单元,用于检测到第一账号登录应用的情况下,在上述应用的显示界面显示第一待推送信息,其中,上述第一待推送信息为根据热门信息与第一账号对应用上显示的历史信息进行浏览的历史浏览数据,从应用收集到的信息集合中确定的信息。
作为一种可选的示例,上述第一显示单元包括:第一显示模块,用于显示上述第一待推送信息中的标题信息;第二显示模块,用于在检测到对上述第一待推送信息中的标题信息的选中操作的情况下,显示上述第一待推送信息的摘要信息,其中,上述摘要信息为对上述第一待推送信息进行归纳后得到的信息,上述第一待推送信息包括上述标题信息与上述摘要信息。
作为一种可选的示例,上述装置还包括:第二显示单元,用于在检测到第一账号登录应用的情况下,在上述应用的显示界面显示第一待推送信息之后,显示上述第一待推送信息中关键词的热度指数,其中,上述关键词的热度指数与上述关键词和其他关键词位于同一篇文档中的文档数量,及上述关键词被作为一篇文档中的关键词的文档数量相关。
根据本发明实施例的又一方面,还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述信息推送方法。
根据本发明实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的信息推送方法或信息显示方法。
在本发明实施例中,采用获取目标应用的第一账号的历史浏览数据;在历史浏览数据记录了第一账号通过目标应用浏览过的目标信息的情况下,根据历史浏览数据记录的目标信息和热门信息,在目标应用收集到的信息集合中确定出第一待推送信息以及向向第一账号推送第一待推送信息的方法。由于在上述方法中,在确定第一待推送信息时,第一待推送信息是根据热门信息与第一账号的历史浏览数据所确定的。因此,实现了提高推送信息过程中的信息推送准确度的效果,解决了相关技术中信息推送不准确的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的信息推送方法的应用环境的示意图;
图2是根据本发明实施例的一种可选的信息推送方法的流程示意图;
图3是根据本发明实施例的一种可选的信息推送方法的示意图;
图4是根据本发明实施例的另一种可选的信息推送方法的示意图;
图5是根据本发明实施例的又一种可选的信息推送方法的示意图;
图6是根据本发明实施例的又一种可选的信息推送方法的示意图;
图7是根据本发明实施例的又一种可选的信息推送方法的示意图;
图8是根据本发明实施例的又一种可选的信息推送方法的示意图;
图9是根据本发明实施例的又一种可选的信息推送方法的示意图;
图10是根据本发明实施例的一种可选的信息显示方法的流程示意图;
图11是根据本发明实施例的一种可选的信息推送装置的结构示意图;
图12是根据本发明实施例的一种可选的信息显示装置的结构示意图;
图13是根据本发明实施例的一种可选的电子装置的结构示意图;
图14是根据本发明实施例的一种可选的电子装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例的一个方面,提供了一种信息推送方法,可选地,作为一种可选的实施方式,上述信息推送方法可以但不限于应用于如图1所示的环境中。如图1所示,图1中包括用户102,用户设备104,用户102与用户设备104之间可以进行人机交互。用户设备104中包括存储器106,用于存储交互数据,处理器108,用于对交互数据进行处理或转发。用户设备104与服务器112之间通过网络110传递数据,服务器112包括数据库114,用于存储数据、推送引擎116,用于向用户设备104推送第一待推送信息。图1中的104-2为可选的第一待推送信息,用户102可以通过与用户设备104的交互查看第一待推送信息。
可选地,上述用户设备可以但不限于为手机、平板电脑、笔记本电脑、PC机等终端,上述网络可以包括但不限于无线网络或有线网络。其中,该无线网络包括:WIFI及其他实现无线通信的网络。上述有线网络可以包括但不限于:广域网、城域网、局域网。上述服务器可以包括但不限于任何可以进行计算的硬件设备。
需要说明的是,相关技术中,在向用户推送信息的过程中,通常是向用户推送热门信息或者使用协同过滤的方法向用户推送信息。然而,若是采用上述方法,无法准确根据用户特征推荐信息,推荐信息的准确度低。而采用本方案中的方法,在向用户推送信息时,推送的是根据热门信息与第一账号的历史浏览数据所确定的,因此,实现了提高推送信息过程中的信息推送准确度的效果。
可选地,作为一种可选的实施方式,如图2所示,上述信息推送方法包括:
S202,获取目标应用的第一账号的历史浏览数据;
S204,在历史浏览数据记录了第一账号通过目标应用浏览过的目标信息的情况下,根据历史浏览数据记录的目标信息和热门信息,在目标应用收集到的信息集合中确定出第一待推送信息,其中,热门信息是信息集合中热度指数超过预定阈值的信息;
S206,向第一账号推送第一待推送信息。
可选地,上述信息推送方法可以但不限于应用于向用户推送内容的过程中。例如,向用户推送新闻、广告的过程中。上述目标应用可以为用户使用第一账号登录的应用,如新闻应用、娱乐应用等。以推送新闻为例,本方案中获取第一账号登录新闻应用后的历史浏览数据。历史浏览数据可以为历史浏览的新闻应用中显示的新闻。热门信息可以为热门新闻。在获取到历史浏览数据后,由于历史浏览数据中包括历史浏览的系新闻。因此,根据历史浏览的新闻和热门新闻,确定向用户推送的新闻,从而推送的新闻与用户的行为及热点新闻相关联,提高推送新闻的准确度。
例如,如图3所示,图3为一种可选的推送新闻的显示界面。图3中302为登录第一账号后的第一账号显示区域,304为选择新闻类型的区域,306为新闻推送区域。
或者,本方案还可以应用于图4所示的场景中。图4中402为登录第一账号后显示的第一账号,404为新闻推送区域。
需要说明的是,图3与图4中的展示方法仅为示例。本方案对推送过程中具体的显示位置与显示形式不做限定。在移动终端上推送时,同样可以使用小程序的形式进行推送。
通过本实施例,在向第一账号推送第一待推送信息时,通过根据热门信息与第一账号的历史浏览数据确定第一待推送信息,从而提高了第一待推送信息的准确度。
可选地,若是第一账号首次登陆目标应用,还未产生历史记录,因此,历史浏览数据为空。此时,需要单独根据热门信息在目标应用所收集到的信息集合中确定出所要推送的第二待推送信息。在第一账号产生浏览行为之后,再根据用户行为产生的历史浏览数据与热门信息确定出所要推送的第一待推送信息。
例如,如图5所示,图5为一种可选的推送第二待推送信息的界面图。第二待推送信息为新闻。图5中502为热点新闻,而504中显示的则为根据热点新闻确定出的第二待推送信息,即与热点新闻相关的拓展新闻。
可选地,在根据历史浏览数据与热门信息确定第一待推送信息时,还需要确定出历史浏览数据中目标信息的第一标签集,热门信息的第二标签集与第一信息的第三标签集。其中,第一信息是目标应用收集到的信息集合中的任意一条信息。然后,根据第一标签集与第三标签集之间的第一相似度、第二标签集与第三标签集之间的第二相似度确定第一信息的目标相似度,在目标相似度大于第一阈值的的情况下,将第一信息确定为第一待推送信息。若是目标相似度小于或者等于第一阈值,则第一信息不能作为第一待推送信息。
在确定上述第一标签集、第二标签集与第三标签集之前,需要首先建立关键词表的标签库。标签库中存储有多个标签,每一个关键词与标签库都对应存在一个权重。例如,关键词:“赛事”、“售后”、“评价”与标签库中的标签“游戏”相关联,但是关联度不同。如“赛事”可以直接隶属于“游戏”,而“评价”属于“售后”,“售后”属于“游戏”。因此,可以得到关键词“赛事”、“售后”、“评价”与标签“游戏”的关系。关系越近,则权重越小,关系越远,则权重越大。“评价”的权重要大于“赛事”或“售后”的权重。在得到所有的关键词对应的标签库之后,可以通过标签库确定上述第一标签集、第二标签集与第三标签集。
可选地,在推送第一待推送信息之后,在显示界面上显示第一待推送信息的标题信息。如图6所示,若是检测到对第一待推送信息的标题信息的选中操作(如光标位于标题信息之上),则显示第一待推送信息中的摘要信息。在鼠标点击第一待推送信息的标题信息或者摘要信息的情况下,向第一账号推送第一待推送信息的正文信息。图6中在光标602位于第一待推送信息“游戏1综合评分9.8”之上时,显示摘要信息604,摘要信息604为对第一待推送信息进行归纳后得到的内容。
可选地,在推送第一待推送信息之后,还可以同时推送第一待推送信息的热度指数。上述热度指数表示第一待推送信息的热度。例如,如图7所示,在显示第一待推送信息的同时,显示有热度指数702。在显示热度指数702时,可以显示最热的第一待推送信息的热度指数,或者显示特定的第一待推送信息的热度指数。例如,如图8所示,图8为在用户观看某一条待推送信息的时候,显示的用户观看的第一待推送信息的热度指数。游戏1的点802对应的时间与点804对应的时间的热度指数较高。
通过本实施例,通过上述方法确定推送的第一待推送信息,从而可以根据热度信息与历史浏览信息确定第一待推送信息,提高了推送信息的推送效率。
作为一种可选的实施方案,获取目标应用的第一账号的历史浏览数据之后,还包括:
S1,在历史浏览数据为空的情况下,根据热门信息在目标应用收集到的信息集合中确定出第二待推送信息;
S2,向第一账号推送第二待推送信息。
以将上述信息推送方法应用到推送新闻的过程中进行说明。当新闻应用推送新闻时,若是用户未产生浏览记录,此时历史浏览数据为空,则可以根据热门内容,将与热门内容相关的新闻内容推送给用户。
例如,将多个数据源例如内部游戏名、信息流文章关键词、Steam游戏名以及由他们关联到的百度百科别名等作为关键词输入,经过清洗统一命名之后,借助爬虫技术关联百度百科等信息源,得到这些关键词输入的关联标签,按玩法、开发商、发行商、平台和主题等模块划分标签类型,再结合业务规则对这些标签进行打包,合并近义词,得到统一标签,并基于标签类型和标签层级赋予初始权重,构建关键词标签库。越常用的标签初始权重越低。
标签库为每个关键词提供了一系列带权重的标签,基于标签库可以实现对用户进行扩展阅读推荐,具体来说实现如下:
首先,行业分析系统会展示当期热门信息,每个热门信息包含若干描述同一主题的文章,每篇文章都有至少一个关键词,例如,以热门信息“游戏”为主题的文章,可以为描述游戏的售卖情况、游戏的价格等,则关键词可以为游戏、售卖或者游戏、价格。将同一话题的关键词关联标签库,得到带权重标签,对标签进行去重聚合,权重取最大权重,得到当前话题的带权标签集;如游戏对应的最大权重的标签为娱乐,而价格对应的权重最大的标签为销售。则游戏对应的标签集为“娱乐、销售”。在通过上述方法得到热门信息的第二标签集之后,将待推送的新闻中每一篇新闻的第三标签集与热门信息的第二标签集进行匹配,求得两个标签集的相似度。匹配过程可以使用杰卡得公式。公式如下:
Figure BDA0002015694230000131
其中,Pretag(t,i)表示当前话题t对待推荐文章i的基于标签的偏好得分,J(t,i)表示话题t与文章i的Jaccard相似度(基于标签),Tag(t)表示关键词集t的关联标签集。将当前话题t对待推荐文章i中偏好得分最高的待推荐文章最为第一待推送信息推送给用户。
通过本实施例,通过上述方法确定出与热门信息相关的第二待推荐信息,从而在用户还未产生行为的时候即可确定出第二待推荐信息,提高了推荐信息的推荐准确性。
作为一种可选的实施方案,根据历史浏览数据记录的目标信息和热门信息,在目标应用收集到的信息集合中确定出第一待推送信息包括:
S1,确定目标信息的第一标签集与热门信息的第二标签集以及信息集合中的第一信息的第三标签集;
S2,确定第一标签集与第三标签集之间的第一相似度;
S3,确定第二标签集与第三标签集之间的第二相似度;
S4,根据第一相似度与第二相似度确定第一信息对应的目标相似度;
S5,在目标相似度大于第一阈值的情况下,将第一信息作为第一待推送信息。
继续结合推送新闻的场景进行说明。在用户在目标应用上产生了浏览、点击等行为,目标应用可以得到用户的历史浏览数据,历史浏览数据中每篇文章都有至少一个关键词,接着把历史浏览数据中的关键词关联标签库,得到带权重标签,对标签进行去重聚合,权重取最大权重,得到历史浏览数据的的第一标签集。将热门新闻与标签库关联,得到第二标签集,将目标应用采集到的每一个新闻与标签库关联,得到每一个新闻的第三标签集。然后,计算第一标签集与每一个新闻的第三标签集的第一相似度,与第二标签集与每一个新闻的第三标签集的第二相似度,第二相似度可以根据杰卡得公式计算。根据第一相似度与第二相似度得到每一个新闻的目标相似度。根据目标相似度确定是否将对应的新闻作为第一待推送信息推送给用户。
通过本实施例,通过上述方法,从而实现了根据用户的历史浏览数据与热门信息确定第一待推送信息,提高了信息推送的准确度。
作为一种可选的实施方案,根据第一相似度与第二相似度确定目标相似度包括:
S1,通过以下公式确定目标相似度:
T=(1-α)Pretag(ttop,i)+αPreact(u,i) (7)
其中,T为所述第一信息对应的待推送信息的目标相似度,所述Pretag(ttop,i)为所述第二相似度,所述ttop为所述热门信息,所述i为所述第一信息,所述Preact(u,i)为所述第一相似度,所述u为所述目标信息,0<α<1。
可选地,由于在确定第一待推送信息的过程中,可以根据热门信息与用户的历史浏览信息确定第一待推送信息。而用户的历史浏览信息的重要性要高于热门信息的重要性。因此,采用上述公式,a会随着用户行为增加而逐渐从0增长到某个小于1的阈值,此时,热门信息对第一待推送信息的影响将很小,用户的历史浏览数据对第一待推送信息的影响很大。
通过本实施例,通过上述方法,从而保证了随着历史浏览数据的增加,第一待推送信息越准确的效果。
作为一种可选的实施方案,
确定第一标签集与第三标签集的第一相似度包括:S1,根据所述第一标签集与所述第三标签集的标签相似度与词向量相似度确定所述第一相似度,其中,所述标签相似度为所述第一标签集与所述第三标签集的交集和所述第一标签集与所述第三标签集的并集的比值,所述词向量相似度为对所述第一标签集进行分词并整合成的第一词向量结构与对所述第三标签集进行分词并整合成的第二词向量结构的余弦相似度;
确定第二标签集与第三标签集的第二相似度包括:S1,将所述第二标签集与所述第三标签集的交集和所述第二标签集与所述第三标签集的并集的比值作为所述第二相似度。
在计算用户的历史浏览数据的第一标签集与目标应用收集到的信息集合中每一条新闻的第三标签集的第一相似度时,需要计算标签相似度与词向量相似度。标签相似度可以通过杰卡得公式计算,而词向量相似度为将用户的历史浏览数据的内容进行分词,整合成词向量结构,再计算该词向量与目标应用收集到的信息集合中每一条新闻的相应词向量的余弦相似度。通过对标签相似度与词向量相似度加权求和,可以得到第一相似度。
通过本实施例,通过根据杰卡得公式与余弦相似度确定第一相似度,从而可以从两个维度确定第一相似度,保证了第一相似度的确定准确度,进一步保证了推送信息的推送准确度。
作为一种可选的实施方案,根据第一标签集与第三标签集的标签相似度与词向量相似度确定第一相似度包括:
S1,根据如下公式计算第一相似度:
Preact(u,i)=β1J(u,i)+β2C(u,i) (8)
其中,所述Preact(u,i)为所述第一相似度,所述J(u,i)为所述标签相似度,所述C(u,i)为所述词向量相似度,所述u为所述目标信息,所述i为所述第一信息,β1>0,β2>0且β12=1。
通过本实施例,通过上述方法确定第一相似度,从而保证了第一相似度的确定准确性,进一步保证了推送信息的推送准确性。
作为一种可选的实施方案,在根据历史浏览数据的第一标签集与热门信息的第二标签集确定第一信息的目标相似度之前,方法还包括:S1,建立关键词表的标签库,其中,所述标签库中包含有多个标签,所述关键词表中的每一个关键词与所述多个标签中每一个标签均对应一个权重,所述权重表示所述关键词表中的每一个关键词与所述多个标签中每一个标签的关联程度;
确定历史浏览数据的第一标签集包括:S1,获取所述目标信息的第一关键词集;获取所述关键词表的标签库中与所述第一关键词集中的第一关键词对应的标签;将与所述第一关键词对应的标签中与所述第一关键词对应的权重最大的标签作为所述第一关键词的第一目标标签;将所有的所述第一目标标签作为所述第一标签集;
确定热门信息的第二标签集包括:S1,获取所述热门信息的第二关键词集;获取所述关键词表的标签库中与所述第二关键词集中的第二关键词对应的标签;将与所述第二关键词对应的标签中与所述第二关键词对应的权重最大的标签作为所述第二关键词的第二目标标签;将所有的所述第二目标标签作为所述第二标签集;
确定待推送信息的第三标签集包括:S1,获取所述第一信息的第三关键词集;获取所述关键词表的标签库中与所述第三关键词集中的第三关键词对应的标签;将与所述第三关键词对应的标签中与所述第三关键词对应的权重最大的标签作为所述第三关键词的第三目标标签;将所有的所述第三目标标签作为所述第三标签集。
例如,将多个数据源例如内部游戏名、信息流文章关键词、Steam游戏名以及由他们关联到的百度百科别名等作为关键词输入,经过清洗统一命名之后,借助爬虫技术关联百度百科等信息源,得到这些关键词输入的关联标签,按玩法、开发商、发行商、平台和主题等模块划分标签类型,再结合业务规则对这些标签进行打包,合并近义词,得到统一标签,并基于标签类型和标签层级赋予初始权重,构建关键词标签库。越常用的标签初始权重越低。
在构建标签库之后,将历史浏览数据中的关键词关联到标签库中,得到历史浏览数据的第一标签集,将热门信息中的关键词关联到标签库中,得到热门信息的第二标签集,将信息集合中每一条信息与标签库关联,得到每一条信息的第三标签集。
通过本实施例,通过上述方法确定标签库与第一标签集、第二标签集、第三标签集,从而保证了确定标签集的准确度。
作为一种可选的实施方案,所述向所述第一账号推送所述第一待推送信息包括:
S1,向所述第一账号推送所述第一待推送信息的标题信息与摘要信息;
S2,在检测到对所述标题信息或者所述摘要信息的点击操作的情况下,向所述第一账号推送所述第一待推送信息的正文信息,其中,所述第一待推送信息包括所述标题信息、所述摘要信息和所述正文信息。
例如,在推送新闻的过程中,在向第一账号的应用推送了新闻的标题信息与摘要信息之后,只显示新闻的标题,如图6所示,当检测到鼠标对应的光标602对新闻的选中操作(光标位于标题信息之上)的情况下,显示摘要信息604。若是检测到鼠标对标题或者摘要的点击操作,则获取正文内容并显示。智能摘要功能,帮助用户大幅度提升阅读效率。由于专业用户(分析师)每天需要阅读大量文章,而很多文章的内容相似度较高。为了提高阅读效率,分析师现在只需要将鼠标移到新闻或文章的标题上,就可以知道文章的中心思想,再决定是否要点击进文章进行深度阅读。
通过本实施例,通过上述方法,在保证了推送的内容的准确性的同时,提高了对文章进行阅读的阅读效率。
作为一种可选的实施方案,在向所述第一账号推送所述第一待推送信息的摘要信息之前,所述方法还包括:
S1,将所述第一待推送信息输入到目标神经网络模型中,其中,所述目标神经网络模型为通过输入样本推送信息与样本摘要信息对初始神经网络模型进行训练后得到的收敛后的神经网络模型,所述目标神经网络模型用于在输入所述第一待推送信息后,输出所述第一待推送信息的所述摘要信息;
S2,获取所述目标神经网络模型输出的所述摘要信息。
可选地,本实施例考虑生成摘要的算法模型,这属于NLP的自动文摘方向,基于文本预测本身非线性、复杂、提取未知特征和关系等特点,考虑采用循环神经网络算法(RNN)。
不同于传统摘要的人工编辑和传统自动文摘的抽取方式,基于RNN的生成式自动文摘不需要人工干预,且同时考虑了上下文信息。
如图9所示,图9左侧,RNN比传统的神经网络ANN多了一个隐藏层的循环,该循环层权重记为W。把它按循环展开,可以得到上图右:t时刻的输入xt,会连同t-1时刻隐藏层的结果一起加权后,再被t时刻的隐藏层激活为st,st再被输出层加权激活为ot。
实现RNN生成智能摘要的模型,主要分成三步:数据预处理、RNN模型和生成摘要。
第一步是数据预处理,以每个话题的若干去重文章作为输入,对输入文章依次进行权重扩展(取话题代表文章)、结构清洗、结巴分词和one-hot编码,得到RNN模型的输入;
第二步是RNN模型,基于文章构建模型训练出权重参数。初始权重采用一些文献推荐的以上一层连接数为标准取随机数;隐藏层的激活函数采用双曲正切tanh:
Figure BDA0002015694230000191
输出层的激活函数采用softmax:
Figure BDA0002015694230000192
其中,n为正整数,表示数据空间维度。
损失函数取交叉熵:
Figure BDA0002015694230000193
用梯度下降实现RNN的权重更新机制BPTT,去更新权重参数,收敛准则判断依据为损失很小或者不怎么变化;
第三步是生成摘要,将待预测话题的代表文章(权重最大)输入训练好的RNN网络,预测其摘要,设定终止条件控制摘要长度。这一步主要做一些基于规则的操作,例如生成标点开头、连续重复等异常词的处理规则,当最终的生成摘要为空时的处理规则等。若生成摘要为空,改用模糊预测的方式去生成,不同于精确预测取概率最大的词作为结果,模糊预测是让概率最大的词有最大的概率被取到,但其他词也有相应的概率可以被取到。
至此,得到了热门话题的智能摘要生成:
Summa(t)=RNN(trepre) (12)
其中,RNN(trepre)表示对话题t的代表文章trepre生成智能摘要。
通过本实施例,通过上述方法获取第一待推送信息的摘要信息,从而在保证了推送信息的准确性的同时,提高了获取到的摘要信息的准确性。
作为一种可选的实施方案,在向所述第一账号推送所述第一待推送信息之后,所述方法还包括:
S1,向所述第一账号推送所述第一待推送信息中关键词的热度指数,其中,所述关键词的热度指数与所述关键词和其他关键词位于同一篇文档中的文档的数量,及所述关键词被作为一篇文档中的关键词的文档的数量相关。
例如,在向用户推送新闻时,在推送第一待推送信息后,还可以推送第一待推送信息的热度指数。如图7-8所示,图7中以表格的形式显示有热度指数702,而图8中以折线图的形式显示热度指数。
通过本实施例,通过上述方法推送热度指数,从而在保证了推送准确度的同时,提高了第一待推送信息的信息完整度。
作为一种可选的实施方案,在向所述第一账号推送所述第一待推送信息中关键词的热度指数之前,所述方法还包括:
S1,获取所述第一待推送信息中第i个关键词在预定时间段内每一天的热度指数;
S2,根据所述每一天的热度指数和以下公式确定所述第一待推送信息中第i个关键词的热度指数;
HI(keyi)=∑je-jHIj(keyi) (13)
其中,所述HI(keyi)为所述第一待推送信息中的第i个关键词的热度指数;所述j表示距离当前时间的天数,0≤j≤N,所述N为所述预定时间段内的天数;所述HIj(keyi)为第一待推送信息中的第i个关键词距离当前时间j天的热度指数,所述keyi为所述第一待推送信息中的第i个关键词,1≤i≤M,所述M为第一待推送信息中关键词的数量。
可选地,本实施例中在确定了预定时间段内第一待推送信息中的关键词的每一天的热度热度指数之后,通过上述公式,计算得到关键词的热度指数。
通过本实施例,通过上述方法,提高了确定关键词的热度指数的准确度。
作为一种可选的实施方案,所述获取所述第一待推送信息中的第i个关键词在预定时间段内每一天的热度指数包括:
S1,通过以下公式确定所述第一待推送信息中所述第i个关键词在所述预定时间段内每一天的热度指数:
HIj(keyi)=αf(PRj(keyi))+(1-α)f(DCj(keyi)) (14)
其中,所述keyi为所述第一待推送信息中的第i个关键词,所述PRj(keyi)为所述第一待推送信息的第i个关键词距离当前时间j天的热度值,所述DCj(keyi)为所述第一待推送信息的第i个关键词距离当前时间j天的频数值,其中,所述第一待推送信息中第i个关键词距离当前时间j天的热度值与在距离当前时间j天时,所述关键词与其他关键词出现在同一篇文档中的文档数量相关,所述第一待推送信息的第i个关键词距离当前时间j天的频数值为在距离当前时间j天中将所述第一待推送信息的第i个关键词作为文档中的关键词的文档数量。
在计算关键词每一天的热度指数时,需要计算关键词的热度值与频数值,然后根据热度值与频数值确定出关键词每一天的热度指数。
通过本实施例,通过上述公式确定关键词每一天的热度指数,提高了关键词热度指数的确定准确度。
作为一种可选的实施方案,将每一个关键词的当前热度初始化为1/N,其中,所述方法还包括:通过以下步骤确定所述第一待推送信息中每一个关键词距离当前时间j天的热度值:
S1,重复以下公式计算所述第一待推送信息中每一个关键词距离当前时间j天的热度值,直到所述第一待推送信息中每一个关键距离当前时间j天的热度值的变化量小于第三阈值,其中,所述第一待推送信息中每一个关键词距离当前时间j天的热度值的变化量为连续两次计算得到的同一个关键词在距离当前时间j天时的热度值的差值:
Figure BDA0002015694230000221
其中,所述keyi表示第一待推送信息的第i个关键词,所述keyr表示第一待推送信息的第r个关键词,i=1,2,...,M,r=1,2,...,M,k=1,2,...,M,所述M为所述第一待推送信息中关键词的数量,所述PRj(keyi)表示所述第i个关键词距离当前时间j天的热度值,所述d为常数,所述Wrij表示所述第一待推送信息的第r个关键词和所述第一待推送信息的第i个关键词在距离当前时间j天时,出现在一篇文档中的文档数量,所述Wrkj表示所述第一待推送信息的第r个关键词和所述第一待推送信息的第k个关键词在距离当前时间j天中出现在一篇文档中的文档数量,所述(keyi,keyr)in a document表示所述keyi,与所述keyr位于同一篇文档中。
关键词热度指数的构造主要包括以下三个步骤:
1)基于TF-IDF思想计算当前的文档频数热度DC
TF-IDF算法是综合考虑词项频率和逆文档频率的词频热度算法,它认为一个词在一篇文档中很重要,除了要求该词在该文档中出现频率很高之外,还需要满足该词在文档集中出现频率很低(例如每篇文档都会高频出现的词“的”就不该成为关键词),基于此得到了每篇文章的关键词,再借鉴文档频率的思想,按关键词出现的文章数(即文档频数)来作为关键词keyi的文档频数热度DC(keyi):
DC(keyi)=Count({docj|keyi is a keyword in docj}) (16)
2)基于PageRank方法的关键词共现加成PR
传统热度指数只考虑当前阅读量等热度相关指标,但却忽略了关键词共现的加成,例如2018年8月21日至25日举办的德国科隆游戏展期间,许多游戏相关文章的关键词除了包含特定游戏名,还包含“GC2018”,按传统的热度指数构造算法,将只考虑包含“GC2018”这一关键词的文章数,文章阅读量等指标,并不会考虑“许多游戏与该词共同出现”这一信息,而这一信息本身是对该关键词的热度指数有加成的。
热度指数构造算法首先是基于上述传统算法的不足来优化,借助PageRank算法来实现关键词间的共现对关键词的加成。PageRank是一个用于计算网页重要性的算法,它通过网页间的相互链接来确定网页的重要性排序;具体来说,一个网页被其他网页链接得越多,它的排序就应该更前;另一方面,一个网页越是被排序靠前的网页所链接,它的排序也应该越前。
具体到关键词热度指数的构造上,基于的假设是一篇文章中同时出现的任意两个关键词有互相链接,如此一来:一个关键词被其他关键词链接得越多,它的排序就应该更前(热度更高);另一方面,一个关键词越是被排序靠前(高热度)的关键词所链接,它的排序也应该越前(热度更高)。
算法实现过程可以表示为以下公式:
Figure BDA0002015694230000231
其中,keyi表示第i个关键词(i=1,2,...,N),PR(keyi)表示该关键词的PageRank值,d为阻尼系数(一般取0.85),N为关键词个数,Wji表示关键词j和关键词i共现的文章个数。在任意初始化所有PR(keyi)值(例如初始化为1/N)之后,按上述公式迭代刷新,直到满足收敛条件(例如所有PR(keyi)都不再变化,或者变化很小),则完成了算法的训练,得到所有关键词的PR值{PR(keyi)}i=1,2,...,N。
3)基于指数衰减的历史热度加成
结合实际业务场景,历史的热度指数应该对当前关键词的热度指数有影响,但不会是100%的影响,而是有所折损,因此引入指数衰减来实现该折损加成:
HI(keyi)=∑je-jHIj(keyi) (18)
其中,HI(keyi)为热度指数;j表示距离当前时间节点的时间跨度,即,j=0表示当天,j=1表示昨日,j=2表示前日,等;HIj(keyi)表示时间跨度为j的热度指数,其计算由步骤1)的文档频数热度DC和步骤2)的共现热度PR按权重α(0<α<1)加权得到:
HIj(keyi)=αf(PRj(keyi))+(1-α)f(DCj(keyi)) (19)
其中,f(x)为统一量纲用的归一化函数,例如sigmoid函数或者tanh函数。
至此,已经完成了关键词热度指数HI(keyi)的构造,对所有关键词计算其热度指数,按热度指数值降序,可得到Top N热度关键词,也可用于后续的关键词热度发现和热度趋势观察分析等。
通过本实施例,通过上述方法确定关键词的热度值,从而保证了热度值的确定准确度,进一步提高了关键词的热度指数的准确度。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
根据本发明实施例的另一方面,还提供了一种信息显示方法。可选地,如图10所示,该方法包括:
S1002,检测到第一账号登录应用的情况下,在所述应用的显示界面显示第一待推送信息,其中,所述第一待推送信息为根据热门信息与第一账号对应用上显示的历史信息进行浏览的历史浏览数据,从应用收集到的信息集合中确定的信息。
可选地,上述信息显示方法可以但不限于应用于向用户显示内容的过程中。例如,向用户显示新闻、广告的过程中。上述应用可以为用户使用第一账号登录的应用,如新闻应用、娱乐应用等。以显示新闻为例,本方案中获取第一账号登录新闻应用后的历史浏览数据。历史浏览数据可以为历史浏览的新闻应用中显示的新闻。热门信息可以为热门新闻。在获取到历史浏览数据后,由于历史浏览数据中包括历史浏览的系新闻。因此,根据历史浏览的新闻和热门新闻,确定向用户显示的新闻,从而显示的新闻与用户的行为及热点新闻相关联,提高显示新闻的准确度。
作为一种可选的实施方案,所述检测到第一账号登录应用的情况下,在所述应用的显示界面显示第一待推送信息包括:
S1,显示所述第一待推送信息中的标题信息;
S2,在检测到对所述第一待推送信息中的标题信息的选中操作的情况下,显示所述第一待推送信息的摘要信息,其中,所述摘要信息为对所述第一待推送信息进行归纳后得到的信息,所述第一待推送信息包括所述标题信息与所述摘要信息。
例如在客户端显示推送的新闻之后,如图6所示,当检测到鼠标对应的光标602对新闻的选中操作的情况下,显示摘要信息604。智能摘要功能,帮助用户大幅度提升阅读效率。由于专业用户(分析师)每天需要阅读大量文章,而很多文章的内容相似度较高。为了提高阅读效率,分析师现在只需要将鼠标移到新闻或文章的标题上,就可以知道文章的中心思想,再决定是否要点击进文章进行深度阅读。
通过本实施例,通过上述方法,在保证了推送的内容的准确性的同时,提高了对文章进行阅读的阅读效率。
作为一种可选的实施方案,在检测到第一账号登录应用的情况下,在所述应用的显示界面显示第一待推送信息之后,所述方法还包括:
S1,显示所述第一待推送信息中关键词的热度指数,其中,所述关键词的热度指数与所述关键词和其他关键词位于同一篇文档中的文档数量,及所述关键词被作为一篇文档中的关键词的文档数量相关。
例如,在向用户推送新闻时,在推送第一待推送信息后,还可以推送第一待推送信息的热度指数。如图7-8所示,图7中以表格的形式显示有热度指数702,而图8中以折线图的形式显示热度指数。
通过本实施例,通过上述方法推送热度指数,从而在保证了推送准确度的同时,提高了第一待推送信息的信息完整度。
根据本发明实施例的又一个方面,还提供了一种用于实施上述信息推送方法的信息推送装置。如图11所示,该装置包括:
(1)第一获取单元1102,用于获取目标应用的第一账号的历史浏览数据;
(2)第一确定单元1104,用于在历史浏览数据记录了第一账号通过目标应用浏览过的目标信息的情况下,根据历史浏览数据记录的目标信息和热门信息,在目标应用收集到的信息集合中确定出第一待推送信息,其中,热门信息是信息集合中热度指数超过预定阈值的信息;
(3)第一推送单元1106,用于向第一账号推送第一待推送信息。
可选地,上述信息推送装置可以但不限于应用于向用户推送内容的过程中。例如,向用户推送新闻、广告的过程中。上述目标应用可以为用户使用第一账号登录的应用,如新闻应用、娱乐应用等。以推送新闻为例,本方案中获取第一账号登录新闻应用后的历史浏览数据。历史浏览数据可以为历史浏览的新闻应用中显示的新闻。热门信息可以为热门新闻。在获取到历史浏览数据后,由于历史浏览数据中包括历史浏览的系新闻。因此,根据历史浏览的新闻和热门新闻,确定向用户推送的新闻,从而推送的新闻与用户的行为及热点新闻相关联,提高推送新闻的准确度。
例如,如图3所示,图3为一种可选的推送新闻的显示界面。图3中302为登录第一账号后的第一账号显示区域,304为选择新闻类型的区域,306为新闻推送区域。
或者,本方案还可以应用于图4所示的场景中。图4中402为登录第一账号后显示的第一账号,404为新闻推送区域。
需要说明的是,图3与图4中的展示方法仅为示例。本方案对推送过程中具体的显示位置与显示形式不做限定。在移动终端上推送时,同样可以使用小程序的形式进行推送。
通过本实施例,在向第一账号推送第一待推送信息时,通过根据热门信息与第一账号的历史浏览数据确定第一待推送信息,从而提高了第一待推送信息的准确度。
可选地,若是第一账号首次登陆目标应用,还未产生历史记录,因此,历史浏览数据为空。此时,需要单独根据热门信息在目标应用所收集到的信息集合中确定出所要推送的第二待推送信息。在第一账号产生浏览行为之后,再根据用户行为产生的历史浏览数据与热门信息确定出所要推送的第一待推送信息。
例如,如图5所示,图5为一种可选的推送第二待推送信息的界面图。第二待推送信息为新闻。图5中502为热点新闻,而504中显示的则为根据热点新闻确定出的第二待推送信息,即与热点新闻相关的拓展新闻。
可选地,在根据历史浏览数据与热门信息确定第一待推送信息时,还需要确定出历史浏览数据中目标信息的第一标签集,热门信息的第二标签集与第一信息的第三标签集。其中,第一信息是目标应用收集到的信息集合中的任意一条信息。然后,根据第一标签集与第三标签集之间的第一相似度、第二标签集与第三标签集之间的第二相似度确定第一信息的目标相似度,在目标相似度大于第一阈值的的情况下,将第一信息确定为第一待推送信息。若是目标相似度小于或者等于第一阈值,则第一信息不能作为第一待推送信息。
在确定上述第一标签集、第二标签集与第三标签集之前,需要首先建立关键词表的标签库。标签库中存储有多个标签,每一个关键词与标签库都对应存在一个权重。例如,关键词:“赛事”、“售后”、“评价”与标签库中的标签“游戏”相关联,但是关联度不同。如“赛事”可以直接隶属于“游戏”,而“评价”属于“售后”,“售后”属于“游戏”。因此,可以得到关键词“赛事”、“售后”、“评价”与标签“游戏”的关系。关系越近,则权重越小,关系越远,则权重越大。“评价”的权重要大于“赛事”或“售后”的权重。在得到所有的关键词对应的标签库之后,可以通过标签库确定上述第一标签集、第二标签集与第三标签集。
可选地,在推送第一待推送信息之后,若是检测到对第一待推送信息的选中操作,则向目标应用推送第一待推送信息的摘要信息。可选地,上述选中操作可以为光标位于第一待推送信息的位置上,或者鼠标点击第一待推送信息。例如,以光标位于第一待推送信息的位置上为选中为例,如图6所示,图6中在光标602位于第一待推送信息“游戏1综合评分9.8”之上时,显示摘要信息604,摘要信息604为对第一待推送信息总结后得到的内容。
可选地,在推送第一待推送信息之后,还可以同时推送第一待推送信息的热度指数。上述热度指数表示第一待推送信息的热度。例如,如图7所示,在显示第一待推送信息的同时,显示有热度指数702。在显示热度指数702时,可以显示最热的第一待推送信息的热度指数,或者显示特定的第一待推送信息的热度指数。例如,如图8所示,图8为在用户观看某一条待推送信息的时候,显示的用户观看的第一待推送信息的热度指数。游戏1的点802对应的时间与点804对应的时间的热度指数较高。
通过本实施例,通过上述方法确定推送的第一待推送信息,从而可以根据热度信息与历史浏览信息确定第一待推送信息,提高了推送信息的推送效率。
作为一种可选的实施方案,上述装置还包括:
(1)第二确定单元,用于在获取目标应用的第一账号的历史浏览数据之后,在历史浏览数据为空的情况下,根据热门信息在目标应用收集到的信息集合中确定出第二待推送信息;
(2)第二推送单元,用于向第一账号推送第二待推送信息。
通过本实施例,通过上述方法确定出与热门信息相关的第二待推荐信息,从而在用户还未产生行为的时候即可确定出第二待推荐信息,提高了推荐信息的推荐准确性。
作为一种可选的实施方案,上述确定单元包括:
(1)第一确定模块,用于确定目标信息的第一标签集与热门信息的第二标签集以及信息集合中的第一信息的第三标签集;
(2)第二确定模块,用于确定第一标签集与第三标签集之间的第一相似度;
(3)第三确定模块,用于确定第二标签集与第三标签集之间的第二相似度;
(4)第四确定模块,用于根据第一相似度与第二相似度确定第一信息对应的目标相似度;
(5)第五确定模块,用于在目标相似度大于第一阈值的情况下,将第一信息作为第一待推送信息。
通过本实施例,通过上述方法,从而实现了根据用户的历史浏览数据与热门信息确定第一待推送信息,提高了信息推送的准确度。
作为一种可选的实施方案,上述第四确定模块还用于:
通过以下公式确定目标相似度:
T=(1-α)Pretag(ttop,i)+αPreact(u,i) (20)
其中,T为第一信息对应的待推送信息的目标相似度,Pretag(ttop,i)为第二相似度,ttop为热门信息,i为第一信息,Preact(u,i)为第一相似度,u为目标信息,0<α<1。
通过本实施例,通过上述方法,从而保证了随着历史浏览数据的增加,第一待推送信息越准确的效果。
作为一种可选的实施方案,
上述第二确定模块包括:(1)第一确定子模块,用于根据所述第一标签集与所述第三标签集的标签相似度与词向量相似度确定所述第一相似度,其中,所述标签相似度为所述第一标签集与所述第三标签集的交集和所述第一标签集与所述第三标签集的并集的比值,所述词向量相似度为对所述第一标签集进行分词并整合成的第一词向量结构与对所述第三标签集进行分词并整合成的第二词向量结构的余弦相似度;
上述第三确定模块包括:(1)第二确定子模块,用于将所述第二标签集与所述第三标签集的交集和所述第二标签集与所述第三标签集的并集的比值作为所述第二相似度。
通过本实施例,通过根据杰卡得公式与余弦相似度确定第一相似度,从而可以从两个维度确定第一相似度,保证了第一相似度的确定准确度,进一步保证了推送信息的推送准确度。
作为一种可选的实施方案,上述第一确定子模块还用于根据如下公式计算所述第一相似度:
Preact(u,i)=β1J(u,i)+β2C(u,i) (21)
其中,所述Preact(u,i)为所述第一相似度,所述J(u,i)为所述标签相似度,所述C(u,i)为所述词向量相似度,所述u为所述目标信息,所述i为所述第一信息,β1>0,β2>0且β1+β2=1。
通过本实施例,通过上述方法确定第一相似度,从而保证了第一相似度的确定准确性,进一步保证了推送信息的推送准确性。
作为一种可选的实施方案,
上述装置还包括:(1)建立单元,用于在确定所述目标信息的第一标签集与所述热门信息的第二标签集以及所述信息集合中的第一信息的第三标签集之前,建立关键词表的标签库,其中,所述标签库中包含有多个标签,所述关键词表中的每一个关键词与所述多个标签中每一个标签均对应一个权重,所述权重表示所述关键词表中的每一个关键词与所述多个标签中每一个标签的关联程度;
上述第一确定模块包括:(1)第三确定子模块,用于获取所述目标信息的第一关键词集;获取所述关键词表的标签库中与所述第一关键词集中的第一关键词对应的标签;将与所述第一关键词对应的标签中与所述第一关键词对应的权重最大的标签作为所述第一关键词的第一目标标签;将所有的所述第一目标标签作为所述第一标签集;第四确定子模块,用于获取所述热门信息的第二关键词集;获取所述关键词表的标签库中与所述第二关键词集中的第二关键词对应的标签;将与所述第二关键词对应的标签中与所述第二关键词对应的权重最大的标签作为所述第二关键词的第二目标标签;将所有的所述第二目标标签作为所述第二标签集;第五确定子模块,用于获取所述第一信息的第三关键词集;获取所述关键词表的标签库中与所述第三关键词集中的第三关键词对应的标签;将与所述第三关键词对应的标签中与所述第三关键词对应的权重最大的标签作为所述第三关键词的第三目标标签;将所有的所述第三目标标签作为所述第三标签集。
通过本实施例,通过上述方法确定标签库与第一标签集、第二标签集、第三标签集,从而保证了确定标签集的准确度。
作为一种可选的实施方案,上述第一推送单元包括:
(1)第一推送模块,用于向所述第一账号推送所述第一待推送信息的标题信息与摘要信息;
(1)第二推送模块,用于在检测到对所述标题信息或者所述摘要信息的点击操作的情况下,向所述第一账号推送所述第一待推送信息的正文信息,其中,所述第一待推送信息包括所述标题信息、所述摘要信息和所述正文信息。
通过本实施例,通过上述方法,在保证了推送的内容的准确性的同时,提高了对文章进行阅读的阅读效率。
作为一种可选的实施方案,上述装置还包括:
(1)输入单元,用于在向所述第一账号推送所述第一待推送信息的摘要信息之前,将所述第一待推送信息输入到目标神经网络模型中,其中,所述目标神经网络模型为通过输入样本推送信息与样本摘要信息对初始神经网络模型进行训练后得到的收敛后的神经网络模型,所述目标神经网络模型用于在输入所述第一待推送信息后,输出所述第一待推送信息的所述摘要信息;
(2)第二获取单元,用于获取所述目标神经网络模型输出的所述摘要信息。
通过本实施例,通过上述方法获取第一待推送信息的摘要信息,从而在保证了推送信息的准确性的同时,提高了获取到的摘要信息的准确性。
作为一种可选的实施方案,上述装置还包括:
(1)第三推送单元,用于在向所述第一账号推送所述第一待推送信息之后,向所述第一账号推送所述第一待推送信息中关键词的热度指数,其中,所述关键词的热度指数与所述关键词和其他关键词位于同一篇文档中的文档的数量,及所述关键词被作为一篇文档中的关键词的文档的数量相关。
通过本实施例,通过上述方法推送热度指数,从而在保证了推送准确度的同时,提高了第一待推送信息的信息完整度。
作为一种可选的实施方案,上述装置还包括:
(1)第三获取单元,用于在向所述第一账号推送所述第一待推送信息中关键词的热度指数之前,获取所述第一待推送信息中第i个关键词在预定时间段内每一天的热度指数;
(2)第三确定单元,用于根据所述每一天的热度指数和以下公式确定所述第一待推送信息中第i个关键词的热度指数;
HI(keyi)=∑je-jHIj(keyi) (22)
其中,所述HI(keyi)为所述第一待推送信息中的第i个关键词的热度指数;所述j表示距离当前时间的天数,0≤j≤N,所述N为所述预定时间段内的天数;所述HIj(keyi)为第一待推送信息中的第i个关键词距离当前时间j天的热度指数,所述keyi为所述第一待推送信息中的第i个关键词,1≤i≤M,所述M为第一待推送信息中关键词的数量。
通过本实施例,通过上述方法,提高了确定关键词的热度指数的准确度。
作为一种可选的实施方案,上述第三获取单元还用于:通过以下公式确定所述第一待推送信息中所述第i个关键词在所述预定时间段内每一天的热度指数:
HIj(keyi)=αf(PRj(keyi))+(1-α)f(DCj(keyi)) (23)
其中,所述keyi为所述第一待推送信息中的第i个关键词,所述PRj(keyi)为所述第一待推送信息的第i个关键词距离当前时间j天的热度值,所述DCj(keyi)为所述第一待推送信息的第i个关键词距离当前时间j天的频数值,其中,所述第一待推送信息中第i个关键词距离当前时间j天的热度值与在距离当前时间j天时,所述关键词与其他关键词出现在同一篇文档中的文档数量相关,所述第一待推送信息的第i个关键词距离当前时间j天的频数值为在距离当前时间j天中将所述第一待推送信息的第i个关键词作为文档中的关键词的文档数量。
通过本实施例,通过上述公式确定关键词每一天的热度指数,提高了关键词热度指数的确定准确度。
作为一种可选的实施方案,将每一个关键词的当前热度初始化为1/N,其中,所述装置还包括:第四确定单元,用于通过以下步骤确定所述第一待推送信息中每一个关键词距离当前时间j天的热度值:
重复以下公式计算所述第一待推送信息中每一个关键词距离当前时间j天的热度值,直到所述第一待推送信息中每一个关键距离当前时间j天的热度值的变化量小于第三阈值,其中,所述第一待推送信息中每一个关键词距离当前时间j天的热度值的变化量为连续两次计算得到的同一个关键词在距离当前时间j天时的热度值的差值:
Figure BDA0002015694230000341
其中,所述keyi表示第一待推送信息的第i个关键词,所述keyr表示第一待推送信息的第r个关键词,i=1,2,...,M,r=1,2,...,M,k=1,2,...,M,所述M为所述第一待推送信息中关键词的数量,所述PRj(keyi)表示所述第i个关键词距离当前时间j天的热度值,所述d为常数,所述Wrij表示所述第一待推送信息的第r个关键词和所述第一待推送信息的第i个关键词在距离当前时间j天时,出现在一篇文档中的文档数量,所述Wrkj表示所述第一待推送信息的第r个关键词和所述第一待推送信息的第k个关键词在距离当前时间j天中出现在一篇文档中的文档数量,所述(keyi,keyr)in a document表示所述keyi,与所述keyr位于同一篇文档中。
通过本实施例,通过上述方法确定关键词的热度值,从而保证了热度值的确定准确度,进一步提高了关键词的热度指数的准确度。
根据本发明实施例的又一个方面,还提供了一种用于实施上述信息推送方法的信息推送装置。如图12所示,该装置包括:
(1)第一显示单元1202,用于检测到第一账号登录应用的情况下,在所述应用的显示界面显示第一待推送信息,其中,所述第一待推送信息为根据热门信息与第一账号对应用上显示的历史信息进行浏览的历史浏览数据,从应用收集到的信息集合中确定的信息。
可选地,上述信息显示装置可以但不限于应用于向用户显示内容的过程中。例如,向用户显示新闻、广告的过程中。上述应用可以为用户使用第一账号登录的应用,如新闻应用、娱乐应用等。以显示新闻为例,本方案中获取第一账号登录新闻应用后的历史浏览数据。历史浏览数据可以为历史浏览的新闻应用中显示的新闻。热门信息可以为热门新闻。在获取到历史浏览数据后,由于历史浏览数据中包括历史浏览的系新闻。因此,根据历史浏览的新闻和热门新闻,确定向用户显示的新闻,从而显示的新闻与用户的行为及热点新闻相关联,提高显示新闻的准确度。
作为一种可选的实施方案,上述第一显示单元包括:
(1)第一显示模块,用于显示所述第一待推送信息中的标题信息;
(2)第二显示模块,用于在检测到对所述第一待推送信息中的标题信息的选中操作的情况下,显示所述第一待推送信息的摘要信息,其中,所述摘要信息为对所述第一待推送信息进行归纳后得到的信息,所述第一待推送信息包括所述标题信息与所述摘要信息。
通过本实施例,通过上述方法,在保证了推送的内容的准确性的同时,提高了对文章进行阅读的阅读效率。
作为一种可选的实施方案,上述装置还包括:
(1)第二显示单元,用于在检测到第一账号登录应用的情况下,在所述应用的显示界面显示第一待推送信息之后,显示所述第一待推送信息中关键词的热度指数,其中,所述关键词的热度指数与所述关键词和其他关键词位于同一篇文档中的文档数量,及所述关键词被作为一篇文档中的关键词的文档数量相关。
通过本实施例,通过上述方法推送热度指数,从而在保证了推送准确度的同时,提高了第一待推送信息的信息完整度。
根据本发明实施例的又一个方面,还提供了一种用于实施上述信息推送方法的电子装置,如图13所示,该电子装置包括存储器1302和处理器1304,该存储器1302中存储有计算机程序,该处理器1304被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子装置可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取目标应用的第一账号的历史浏览数据;
S2,在历史浏览数据记录了第一账号通过目标应用浏览过的目标信息的情况下,根据历史浏览数据记录的目标信息和热门信息,在目标应用收集到的信息集合中确定出第一待推送信息,其中,热门信息是信息集合中热度指数超过预定阈值的信息;
S3,向第一账号推送第一待推送信息。
可选地,本领域普通技术人员可以理解,图13所示的结构仅为示意,电子装置也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图13其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图13中所示更多或者更少的组件(如网络接口等),或者具有与图13所示不同的配置。
其中,存储器1302可用于存储软件程序以及模块,如本发明实施例中的信息推送方法和装置对应的程序指令/模块,处理器1304通过运行存储在存储器1302内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的信息推送方法。存储器1302可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1302可进一步包括相对于处理器1304远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器1302具体可以但不限于用于存储历史浏览数据等信息。作为一种示例,如图13所示,上述存储器1302中可以但不限于包括上述信息推送装置中的第一获取单元1102、第一确定单元1104、第一推送单元1106。此外,还可以包括但不限于上述信息推送装置中的其他模块单元,本示例中不再赘述。
可选地,上述的传输装置1306用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置1306包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置1306为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
此外,上述电子装置还包括:显示器1308,用于显示第一待推送信息;和连接总线1310,用于连接上述电子装置中的各个模块部件。
根据本发明实施例的又一个方面,还提供了一种用于实施上述信息显示方法的电子装置,如图14所示,该电子装置包括存储器1402和处理器1404,该存储器1402中存储有计算机程序,该处理器1404被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子装置可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,检测到第一账号登录应用的情况下,在应用的显示界面显示第一待推送信息,其中,第一待推送信息为根据热门信息与第一账号对应用上显示的历史信息进行浏览的历史浏览数据,从应用收集到的信息集合中确定的信息。
可选地,本领域普通技术人员可以理解,图14所示的结构仅为示意,电子装置也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图14其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图14中所示更多或者更少的组件(如网络接口等),或者具有与图14所示不同的配置。
其中,存储器1402可用于存储软件程序以及模块,如本发明实施例中的信息显示方法和装置对应的程序指令/模块,处理器1404通过运行存储在存储器1402内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的信息显示方法。存储器1402可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1402可进一步包括相对于处理器1404远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器1402具体可以但不限于用于存储历史浏览数据等信息。作为一种示例,如图14所示,上述存储器1402中可以但不限于包括上述信息推送装置中的第一显示单元1202。此外,还可以包括但不限于上述信息推送装置中的其他模块单元,本示例中不再赘述。
可选地,上述的传输装置1406用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置1406包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置1406为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
此外,上述电子装置还包括:显示器1408,用于显示第一待推送信息;和连接总线1410,用于连接上述电子装置中的各个模块部件。
根据本发明的实施例的又一方面,还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取目标应用的第一账号的历史浏览数据;
S2,在历史浏览数据记录了第一账号通过目标应用浏览过的目标信息的情况下,根据历史浏览数据记录的目标信息和热门信息,在目标应用收集到的信息集合中确定出第一待推送信息,其中,热门信息是信息集合中热度指数超过预定阈值的信息;
S3,向第一账号推送第一待推送信息。
或者,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,检测到第一账号登录应用的情况下,在应用的显示界面显示第一待推送信息,其中,第一待推送信息为根据热门信息与第一账号对应用上显示的历史信息进行浏览的历史浏览数据,从应用收集到的信息集合中确定的信息。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (15)

1.一种信息推送方法,其特征在于,包括:
获取目标应用的第一账号的历史浏览数据;
在所述历史浏览数据记录了所述第一账号通过所述目标应用浏览过的目标信息的情况下,根据所述历史浏览数据记录的所述目标信息和热门信息,在所述目标应用收集到的信息集合中确定出第一待推送信息,其中,所述热门信息是所述信息集合中热度指数超过预定阈值的信息;
在所述目标应用上向所述第一账号推送所述第一待推送信息;
其中,所述根据所述历史浏览数据记录的所述目标信息和热门信息,在所述目标应用收集到的信息集合中确定出第一待推送信息包括:确定所述目标信息的第一标签集与所述热门信息的第二标签集以及所述信息集合中的第一信息的第三标签集;确定所述第一标签集与所述第三标签集之间的第一相似度;确定所述第二标签集与所述第三标签集之间的第二相似度;根据所述第一相似度与所述第二相似度确定所述第一信息对应的目标相似度;在所述目标相似度大于第一阈值的情况下,将所述第一信息作为所述第一待推送信息;
其中,确定所述第一标签集与所述第三标签集的第一相似度包括:根据所述第一标签集与所述第三标签集的标签相似度与词向量相似度确定所述第一相似度,其中,所述标签相似度为所述第一标签集与所述第三标签集的交集和所述第一标签集与所述第三标签集的并集的比值,所述词向量相似度为对所述第一标签集进行分词并整合成的第一词向量结构与对所述第三标签集进行分词并整合成的第二词向量结构的余弦相似度;确定所述第二标签集与所述第三标签集的第二相似度包括:将所述第二标签集与所述第三标签集的交集和所述第二标签集与所述第三标签集的并集的比值作为所述第二相似度;
其中,在向所述第一账号推送所述第一待推送信息之后,所述方法还包括:向所述第一账号推送所述第一待推送信息中关键词的热度指数,其中,所述关键词的热度指数与所述关键词和其他关键词位于同一篇文档中的文档的数量,及所述关键词被作为一篇文档中的关键词的文档的数量相关;
其中,所述方法还包括通过如下公式获取所述第一待推送信息中第i个关键词在预定时间段内每一天的热度指数;
根据所述每一天的热度指数和以下公式确定所述第一待推送信息中第i个关键词的热度指数;
Figure FDA0003085382720000021
其中,所述HI(keyi)为所述第一待推送信息中的第i个关键词的热度指数;所述j表示距离当前时间的天数,0≤j≤N,所述N为所述预定时间段内的天数;所述HIj(keyi)为所述第一待推送信息中的第i个关键词距离当前时间j天的热度指数,所述keyi为所述第一待推送信息中的第i个关键词,1≤i≤M,所述M为第一待推送信息中关键词的数量;
其中,在推送所述第一待推送信息后,所述方法还包括:在检测到光标位于所述第一待推送信息的标题信息上的情况下,在所述目标应用中显示所述第一待推送信息的摘要信息,在检测到对所述第一待推送信息的所述标题信息或所述摘要信息的点击操作的情况下,推送所述第一待推送信息的正文信息。
2.根据权利要求1所述的方法,其特征在于,获取目标应用的第一账号的历史浏览数据之后,还包括:
在所述历史浏览数据为空的情况下,根据所述热门信息在所述目标应用收集到的所述信息集合中确定出第二待推送信息;
向所述第一账号推送所述第二待推送信息。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一相似度与所述第二相似度确定所述目标相似度包括:
通过以下公式确定所述目标相似度:
T=(1-α)Pretag(ttop,i)+αPreact(u,i)
其中,T为所述第一信息对应的待推送信息的目标相似度,所述Pretag(ttop,i)为所述第二相似度,所述ttop为所述热门信息,所述i为所述第一信息,所述Preact(u,i)为所述第一相似度,所述u为所述目标信息,0<α<1。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第一标签集与所述第三标签集的标签相似度与词向量相似度确定所述第一相似度包括:
根据如下公式计算所述第一相似度:
Preact(u,i)=β1J(u,i)+β2C(u,i)
其中,所述Preact(u,i)为所述第一相似度,所述J(u,i)为所述标签相似度,所述C(u,i)为所述词向量相似度,所述u为所述目标信息,所述i为所述第一信息,β1>0,β2>0且β12=1。
5.根据权利要求1或3至4中任意一项所述的方法,其特征在于,
在确定所述目标信息的第一标签集与所述热门信息的第二标签集以及所述信息集合中的第一信息的第三标签集之前,所述方法还包括:建立关键词表的标签库,其中,所述标签库中包含有多个标签,所述关键词表中的每一个关键词与所述多个标签中每一个标签均对应一个权重,所述权重表示所述关键词表中的每一个关键词与所述多个标签中每一个标签的关联程度;
确定所述目标信息的第一标签集包括:获取所述目标信息的第一关键词集;获取所述关键词表的标签库中与所述第一关键词集中的第一关键词对应的标签;将与所述第一关键词对应的标签中与所述第一关键词对应的权重最大的标签作为所述第一关键词的第一目标标签;将所有的所述第一目标标签作为所述第一标签集;
确定所述热门信息的所述第二标签集包括:获取所述热门信息的第二关键词集;获取所述关键词表的标签库中与所述第二关键词集中的第二关键词对应的标签;将与所述第二关键词对应的标签中与所述第二关键词对应的权重最大的标签作为所述第二关键词的第二目标标签;将所有的所述第二目标标签作为所述第二标签集;
确定所述信息集合中的第一信息的第三标签集包括:获取所述第一信息的第三关键词集;获取所述关键词表的标签库中与所述第三关键词集中的第三关键词对应的标签;将与所述第三关键词对应的标签中与所述第三关键词对应的权重最大的标签作为所述第三关键词的第三目标标签;将所有的所述第三目标标签作为所述第三标签集。
6.根据权利要求1所述的方法,其特征在于,所述向所述第一账号推送所述第一待推送信息包括:
向所述第一账号推送所述第一待推送信息的标题信息与摘要信息;
在检测到对所述标题信息或者所述摘要信息的点击操作的情况下,向所述第一账号推送所述第一待推送信息的正文信息,其中,所述第一待推送信息包括所述标题信息、所述摘要信息和所述正文信息。
7.根据权利要求6所述的方法,其特征在于,在向所述第一账号推送所述第一待推送信息的摘要信息之前,所述方法还包括:
将所述第一待推送信息输入到目标神经网络模型中,其中,所述目标神经网络模型为通过输入样本推送信息与样本摘要信息对初始神经网络模型进行训练后得到的收敛后的神经网络模型,所述目标神经网络模型用于在输入所述第一待推送信息后,输出所述第一待推送信息的所述摘要信息;
获取所述目标神经网络模型输出的所述摘要信息。
8.根据权利要求1所述的方法,其特征在于,所述获取所述第一待推送信息中的第i个关键词在预定时间段内每一天的热度指数包括:
通过以下公式确定所述第一待推送信息中所述第i个关键词在所述预定时间段内每一天的热度指数:
HIj(keyi)=αf(PRj(keyi))+(1-α)f(DCj(keyi))
其中,f(x)为统一量纲用的归一化函数,所述keyi为所述第一待推送信息中的第i个关键词,所述PRj(keyi)为所述第一待推送信息的第i个关键词距离当前时间j天的热度值,所述DCj(keyi)为所述第一待推送信息的第i个关键词距离当前时间j天的频数值,其中,所述第一待推送信息中第i个关键词距离当前时间j天的热度值与在距离当前时间j天时,所述关键词与其他关键词出现在同一篇文档中的文档数量相关,所述第一待推送信息的第i个关键词距离当前时间j天的频数值为在距离当前时间j天中将所述第一待推送信息的第i个关键词作为文档中的关键词的文档数量。
9.根据权利要求8所述的方法,其特征在于,将每一个关键词的当前热度初始化为1/N,其中,所述方法还包括:通过以下步骤确定所述第一待推送信息中每一个关键词距离当前时间j天的热度值:
重复以下公式计算所述第一待推送信息中每一个关键词距离当前时间j天的热度值,直到所述第一待推送信息中每一个关键距离当前时间j天的热度值的变化量小于第三阈值,其中,所述第一待推送信息中每一个关键词距离当前时间j天的热度值的变化量为连续两次计算得到的同一个关键词在距离当前时间j天时的热度值的差值:
Figure FDA0003085382720000061
其中,所述keyi表示第一待推送信息的第i个关键词,所述keyr表示第一待推送信息的第r个关键词,i=1,2,...,M,r=1,2,...,M,k=1,2,...,M,所述M为所述第一待推送信息中关键词的数量,所述PRj(keyi)表示所述第i个关键词距离当前时间j天的热度值,所述d为常数,所述Wrij表示所述第一待推送信息的第r个关键词和所述第一待推送信息的第i个关键词在距离当前时间j天时,出现在一篇文档中的文档数量,所述Wrkj表示所述第一待推送信息的第r个关键词和所述第一待推送信息的第k个关键词在距离当前时间j天中出现在一篇文档中的文档数量,所述(keyi,keyr)in a document表示所述keyi,与所述keyr位于同一篇文档中。
10.一种信息显示方法,其特征在于,包括:
检测到第一账号登录应用的情况下,在所述应用的显示界面显示第一待推送信息,其中,所述第一待推送信息为根据热门信息与第一账号对应用上显示的历史信息进行浏览的历史浏览数据,从应用收集到的信息集合中确定的信息;
其中,在显示所述第一待推送信息之前,所述方法还包括:确定所述历史浏览数据中的目标信息的第一标签集与所述热门信息的第二标签集以及所述信息集合中的第一信息的第三标签集;确定所述第一标签集与所述第三标签集之间的第一相似度;确定所述第二标签集与所述第三标签集之间的第二相似度;根据所述第一相似度与所述第二相似度确定所述第一信息对应的目标相似度;在所述目标相似度大于第一阈值的情况下,将所述第一信息作为所述第一待推送信息;
其中,确定所述第一标签集与所述第三标签集的第一相似度包括:根据所述第一标签集与所述第三标签集的标签相似度与词向量相似度确定所述第一相似度,其中,所述标签相似度为所述第一标签集与所述第三标签集的交集和所述第一标签集与所述第三标签集的并集的比值,所述词向量相似度为对所述第一标签集进行分词并整合成的第一词向量结构与对所述第三标签集进行分词并整合成的第二词向量结构的余弦相似度;确定所述第二标签集与所述第三标签集的第二相似度包括:将所述第二标签集与所述第三标签集的交集和所述第二标签集与所述第三标签集的并集的比值作为所述第二相似度;
其中,在检测到第一账号登录应用的情况下,在所述应用的显示界面显示第一待推送信息之后,所述方法还包括:显示所述第一待推送信息中关键词的热度指数,其中,所述关键词的热度指数与所述关键词和其他关键词位于同一篇文档中的文档数量,及所述关键词被作为一篇文档中的关键词的文档数量相关;
其中,所述方法还包括获取所述第一待推送信息中第i个关键词在预定时间段内每一天的热度指数;根据所述每一天的热度指数和以下公式确定所述第一待推送信息中第i个关键词的热度指数;
Figure FDA0003085382720000071
其中,所述HI(keyi)为所述第一待推送信息中的第i个关键词的热度指数;所述j表示距离当前时间的天数,0≤j≤N,所述N为所述预定时间段内的天数;所述HIj(keyi)为所述第一待推送信息中的第i个关键词距离当前时间j天的热度指数,所述keyi为所述第一待推送信息中的第i个关键词,1≤i≤M,所述M为第一待推送信息中关键词的数量;
其中,在显示所述第一待推送信息后,所述方法还包括:在检测到光标位于所述第一待推送信息的标题信息上的情况下,显示所述第一待推送信息的摘要信息,在检测到对所述第一待推送信息的所述标题信息或所述摘要信息的点击操作的情况下,显示所述第一待推送信息的正文信息。
11.根据权利要求10所述的方法,其特征在于,所述检测到第一账号登录应用的情况下,在所述应用的显示界面显示第一待推送信息包括:
显示所述第一待推送信息中的标题信息;
在检测到对所述第一待推送信息中的标题信息的选中操作的情况下,显示所述第一待推送信息的摘要信息,其中,所述摘要信息为对所述第一待推送信息进行归纳后得到的信息,所述第一待推送信息包括所述标题信息与所述摘要信息。
12.一种信息推送装置,其特征在于,包括:
第一获取单元,用于获取目标应用的第一账号的历史浏览数据;
第一确定单元,用于在所述历史浏览数据记录了所述第一账号通过所述目标应用浏览过的目标信息的情况下,根据所述历史浏览数据记录的所述目标信息和热门信息,在所述目标应用收集到的信息集合中确定出第一待推送信息,其中,所述热门信息是所述信息集合中热度指数超过预定阈值的信息;
第一推送单元,用于在所述目标应用上向所述第一账号推送所述第一待推送信息;
其中,所述装置还用于确定所述目标信息的第一标签集与所述热门信息的第二标签集以及所述信息集合中的第一信息的第三标签集;确定所述第一标签集与所述第三标签集之间的第一相似度;确定所述第二标签集与所述第三标签集之间的第二相似度;根据所述第一相似度与所述第二相似度确定所述第一信息对应的目标相似度;在所述目标相似度大于第一阈值的情况下,将所述第一信息作为所述第一待推送信息;根据所述第一标签集与所述第三标签集的标签相似度与词向量相似度确定所述第一相似度,其中,所述标签相似度为所述第一标签集与所述第三标签集的交集和所述第一标签集与所述第三标签集的并集的比值,所述词向量相似度为对所述第一标签集进行分词并整合成的第一词向量结构与对所述第三标签集进行分词并整合成的第二词向量结构的余弦相似度;确定所述第二标签集与所述第三标签集的第二相似度包括:将所述第二标签集与所述第三标签集的交集和所述第二标签集与所述第三标签集的并集的比值作为所述第二相似度;在向所述第一账号推送所述第一待推送信息之后,向所述第一账号推送所述第一待推送信息中关键词的热度指数,其中,所述关键词的热度指数与所述关键词和其他关键词位于同一篇文档中的文档的数量,及所述关键词被作为一篇文档中的关键词的文档的数量相关;
所述装置还用于获取所述第一待推送信息中第i个关键词在预定时间段内每一天的热度指数;根据所述每一天的热度指数和以下公式确定所述第一待推送信息中第i个关键词的热度指数;
Figure FDA0003085382720000091
其中,所述HI(keyi)为所述第一待推送信息中的第i个关键词的热度指数;所述j表示距离当前时间的天数,0≤j≤N,所述N为所述预定时间段内的天数;所述HIj(keyi)为所述第一待推送信息中的第i个关键词距离当前时间j天的热度指数,所述keyi为所述第一待推送信息中的第i个关键词,1≤i≤M,所述M为第一待推送信息中关键词的数量;
其中,所述装置还用于在显示所述第一待推送信息后,在检测到光标位于所述第一待推送信息的标题信息上的情况下,在所述目标应用上显示所述第一待推送信息的摘要信息,在检测到对所述第一待推送信息的所述标题信息或所述摘要信息的点击操作的情况下,推送所述第一待推送信息的正文信息。
13.一种信息显示装置,其特征在于,包括:
第一显示单元,用于检测到第一账号登录应用的情况下,在所述应用的显示界面显示第一待推送信息,其中,所述第一待推送信息为根据热门信息与第一账号对应用上显示的历史信息进行浏览的历史浏览数据,从应用收集到的信息集合中确定的信息;
其中,所述装置还用于确定所述目标信息的第一标签集与所述热门信息的第二标签集以及所述信息集合中的第一信息的第三标签集;确定所述第一标签集与所述第三标签集之间的第一相似度;确定所述第二标签集与所述第三标签集之间的第二相似度;根据所述第一相似度与所述第二相似度确定所述第一信息对应的目标相似度;在所述目标相似度大于第一阈值的情况下,将所述第一信息作为所述第一待推送信息;根据所述第一标签集与所述第三标签集的标签相似度与词向量相似度确定所述第一相似度,其中,所述标签相似度为所述第一标签集与所述第三标签集的交集和所述第一标签集与所述第三标签集的并集的比值,所述词向量相似度为对所述第一标签集进行分词并整合成的第一词向量结构与对所述第三标签集进行分词并整合成的第二词向量结构的余弦相似度;确定所述第二标签集与所述第三标签集的第二相似度包括:将所述第二标签集与所述第三标签集的交集和所述第二标签集与所述第三标签集的并集的比值作为所述第二相似度;在向所述第一账号推送所述第一待推送信息之后,向所述第一账号推送所述第一待推送信息中关键词的热度指数,其中,所述关键词的热度指数与所述关键词和其他关键词位于同一篇文档中的文档的数量,及所述关键词被作为一篇文档中的关键词的文档的数量相关;
所述装置还用于获取所述第一待推送信息中第i个关键词在预定时间段内每一天的热度指数;根据所述每一天的热度指数和以下公式确定所述第一待推送信息中第i个关键词的热度指数;
Figure FDA0003085382720000111
其中,所述HI(keyi)为所述第一待推送信息中的第i个关键词的热度指数;所述j表示距离当前时间的天数,0≤j≤N,所述N为所述预定时间段内的天数;所述HIj(keyi)为所述第一待推送信息中的第i个关键词距离当前时间j天的热度指数,所述keyi为所述第一待推送信息中的第i个关键词,1≤i≤M,所述M为第一待推送信息中关键词的数量;
其中,所述装置还用于在显示所述第一待推送信息后,在检测到光标位于所述第一待推送信息的标题信息上的情况下,显示所述第一待推送信息的摘要信息,在检测到对所述第一待推送信息的所述标题信息或所述摘要信息的点击操作的情况下,显示所述第一待推送信息的正文信息。
14.一种存储介质,所述存储介质存储有计算机程序,其特征在于,所述计算机程序运行时执行所述权利要求1至9或10至11任一项中所述的方法。
15.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至9或10至11任一项中所述的方法。
CN201910262355.0A 2019-04-02 2019-04-02 信息推送方法和装置、存储介质及电子装置 Active CN109993583B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910262355.0A CN109993583B (zh) 2019-04-02 2019-04-02 信息推送方法和装置、存储介质及电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910262355.0A CN109993583B (zh) 2019-04-02 2019-04-02 信息推送方法和装置、存储介质及电子装置

Publications (2)

Publication Number Publication Date
CN109993583A CN109993583A (zh) 2019-07-09
CN109993583B true CN109993583B (zh) 2021-07-27

Family

ID=67132166

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910262355.0A Active CN109993583B (zh) 2019-04-02 2019-04-02 信息推送方法和装置、存储介质及电子装置

Country Status (1)

Country Link
CN (1) CN109993583B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111339417A (zh) * 2020-02-26 2020-06-26 惠龙易通国际物流股份有限公司 信息推送方法、装置及服务器
CN111738754A (zh) * 2020-06-01 2020-10-02 上海晶赞融宣科技有限公司 对象推荐方法及装置、存储介质、计算机设备
CN112035613B (zh) * 2020-08-28 2023-09-12 光大科技有限公司 基于多轮对话的信息推送方法及装置、存储介质、电子装置
CN112507211A (zh) * 2020-11-18 2021-03-16 青岛海尔科技有限公司 消息推送方法、装置、存储介质及电子装置
CN113327154B (zh) * 2021-06-18 2022-05-13 苏州极易科技股份有限公司 基于大数据的电商用户讯息推送方法及系统
CN113313539B (zh) * 2021-07-29 2021-10-26 广东联讯科技发展股份有限公司 一种基于大数据的数字化营销服务管理平台
CN115292472B (zh) * 2022-10-09 2022-12-30 四川师范大学 一种小程序消息的推送方法以及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106407381A (zh) * 2016-09-13 2017-02-15 北京百度网讯科技有限公司 一种基于人工智能的推送信息的方法和装置
CN106993030A (zh) * 2017-03-22 2017-07-28 北京百度网讯科技有限公司 基于人工智能的信息推送方法和装置
CN107480227A (zh) * 2017-07-28 2017-12-15 佛山市南方数据科学研究院 一种基于大数据的信息推送方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105046497A (zh) * 2007-11-14 2015-11-11 潘吉瓦公司 评估供应交易的公共记录
US10346867B2 (en) * 2012-06-11 2019-07-09 Retailmenot, Inc. Intents for offer-discovery systems
CN107808295B (zh) * 2016-09-09 2021-06-11 腾讯科技(深圳)有限公司 多媒体数据投放方法及装置
US20180093131A1 (en) * 2016-09-30 2018-04-05 Ali C. Barnes Rhythmic athletic training systems and methods
CN108805594B (zh) * 2017-04-27 2022-04-12 北京京东尚科信息技术有限公司 信息推送方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106407381A (zh) * 2016-09-13 2017-02-15 北京百度网讯科技有限公司 一种基于人工智能的推送信息的方法和装置
CN106993030A (zh) * 2017-03-22 2017-07-28 北京百度网讯科技有限公司 基于人工智能的信息推送方法和装置
CN107480227A (zh) * 2017-07-28 2017-12-15 佛山市南方数据科学研究院 一种基于大数据的信息推送方法

Also Published As

Publication number Publication date
CN109993583A (zh) 2019-07-09

Similar Documents

Publication Publication Date Title
CN109993583B (zh) 信息推送方法和装置、存储介质及电子装置
CN110941740B (zh) 视频推荐方法及计算机可读存储介质
US7743047B2 (en) Accounting for behavioral variability in web search
CN110717098A (zh) 基于元路径的上下文感知用户建模方法、序列推荐方法
CN103886090A (zh) 基于用户喜好的内容推荐方法及装置
US9767417B1 (en) Category predictions for user behavior
CN111259173B (zh) 一种搜索信息推荐方法及装置
CN101641697A (zh) 对网页的相关搜索查询及其应用
US9767204B1 (en) Category predictions identifying a search frequency
CN111723260B (zh) 推荐内容的获取方法、装置、电子设备及可读存储介质
CN111737578A (zh) 一种推荐方法及系统
CN110413888A (zh) 一种书籍推荐方法及装置
US10474670B1 (en) Category predictions with browse node probabilities
CN110222260A (zh) 一种搜索方法、装置及存储介质
CN114896517A (zh) 一种商品推荐方法、系统、设备及存储介质
CN112712418A (zh) 推荐商品信息的确定方法和装置、存储介质及电子设备
CN109819002B (zh) 数据推送方法和装置、存储介质及电子装置
Liu et al. Online recommendations based on dynamic adjustment of recommendation lists
Miao et al. Joint prediction of rating and popularity for cold-start item by sentinel user selection
CN112862567A (zh) 一种在线展会的展品推荐方法与系统
Dong et al. Improving sequential recommendation with attribute-augmented graph neural networks
Yang et al. Finding experts in community question answering based on topic-sensitive link analysis
CN110851708B (zh) 负样本的抽取方法、装置、计算机设备和存储介质
CN101655853A (zh) 建立模型的装置和方法
CN109919699B (zh) 项目推荐方法、项目推荐系统以及计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant