CN105468653B - 基于社交应用软件的数据推荐方法和装置 - Google Patents

基于社交应用软件的数据推荐方法和装置 Download PDF

Info

Publication number
CN105468653B
CN105468653B CN201410466121.5A CN201410466121A CN105468653B CN 105468653 B CN105468653 B CN 105468653B CN 201410466121 A CN201410466121 A CN 201410466121A CN 105468653 B CN105468653 B CN 105468653B
Authority
CN
China
Prior art keywords
data
login account
data channel
application software
login
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410466121.5A
Other languages
English (en)
Other versions
CN105468653A (zh
Inventor
李冰
江军平
何聚
黄海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201410466121.5A priority Critical patent/CN105468653B/zh
Publication of CN105468653A publication Critical patent/CN105468653A/zh
Application granted granted Critical
Publication of CN105468653B publication Critical patent/CN105468653B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种基于社交应用软件的数据推荐方法和装置。其中,该方法包括:获取社交应用软件上第一登录账户的至少一个兴趣信息;获取社交应用软件上与第二登录账户关联的数据池,数据池用于保存如下数据:至少一个第二登录账户操作过的数据和/或推荐评分高于预定阈值的数据,其中,第二登录账户为与第一登录账户具有关系链的登录账户;使用至少一个兴趣信息对数据池中的数据进行筛选,得到与每个兴趣信息匹配的数据;将与每个兴趣信息匹配的数据推送给社交应用软件进行显示。本发明解决了现有技术中为社交应用软件上当前登录账户所推荐的数据量少,导致推送给当前用户的数据不完整的技术问题。

Description

基于社交应用软件的数据推荐方法和装置
技术领域
本发明涉及计算机互联网领域,具体而言,涉及一种基于社交应用软件的数据推荐方法和装置。
背景技术
随着计算机互联网技术的飞速发展,基于互联网的社交应用软件应运而生,例如:微博、微信、微视、人人网等。社交应用软件是一种为用户提供一种即时交互的平台,在用户使用登录账户登录该社交平台之后,可以构建每个用户之间的关系链,例如,在任意一个用户关注了其他用户或者与其他用户相互关注,可以认为用户与其他用户之间具有关系链,具有关系链的用户可以查看对方发表的数据,该数据可以包括:网页、视频、音频、文字和图片等。
此处需要说明的是,如果第一用户与第二用户之间直接具有关系链,第二用户与第三用户之间也直接具有关系链,但第一用户与第三用户之间不具有关系链,可以认为第一用户与第三用户之间不具备直接的关系,但存在间接的关系,在将用户之间存在的直接关系链称为一级关系链的情况下,第一用户与第三用户之间的间接关系可以称为二级关系链。
现有的社交应用产品一般会以用户的一度关系链为基础来构建时间轴timeline,在当前用户的时间轴timeline里显示与该用户具有一级关系链的用户所发表的数据,即系统仅向当前用户推送该当前用户所关注或相互关注的用户所发表的消息。
分析可知,现有技术提供的上述方案主要存在以下几个方面的缺陷:首先,当前用户在时间轴timeline上获取到的内容不够丰富,获取新内容成本较高。对于与当前用户具有一度关系链的好友数量较少的用户,尤其是新用户来说,依据一度关系链构建的timeline所能呈现的信息量不足,用户想要获取额外信息则需要付出较高的成本,用户参与互动的欲望也会下降,这在一定程度上有可能造成用户流失。其次,关系链扩展困难。用户一般会选择感兴趣的人作为自己的好友。随着时间的推移,用户在某个社交平台上的好友圈可能会逐渐收敛,最后停止在一个相对固定的范围内,再想发现其他好友会变得越来越困难。
针对上述现有技术中为社交应用软件上当前登录账户所推荐的数据量少,导致推送给当前用户的数据不完整的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种基于社交应用软件的数据推荐方法和装置,以至少解决现有技术中为社交应用软件上当前登录账户所推荐的数据量少,导致推送给当前用户的数据不完整的技术问题。
根据本发明实施例的一个方面,提供了一种基于社交应用软件的数据推荐方法,该方法包括:获取社交应用软件上第一登录账户的至少一个兴趣信息;获取社交应用软件上与第二登录账户关联的数据池,数据池用于保存如下数据:至少一个第二登录账户操作过的数据和/或推荐评分高于预定阈值的数据,其中,第二登录账户为与第一登录账户具有关系链的登录账户;使用至少一个兴趣信息对数据池中的数据进行筛选,得到与每个兴趣信息匹配的数据;将与每个兴趣信息匹配的数据推送给社交应用软件进行显示。
根据本发明实施例的一个方面,提供了一种基于社交应用软件的数据推荐方法,该方法包括:确定社交应用软件上第一登录账户与任意一个第二登录账户之间的关联度,其中,第二登录账户和第一登录账户分别同时与第三登录账户在社交应用软件中具有直接的关系链,且第二登录账户和第一登录账户之间不具有直接的关系链;通过比对社交应用软件上第一登录账户的至少一个兴趣信息和第二登录账户的至少一个兴趣信息,确定第一登录账户分别与每个第二登录账户相互重合的兴趣信息;使用第一登录账户与任意一个第二登录账户之间的关联度和/或相互重合的兴趣信息,确定第一登录账户与每个第二登录账户的关系链分值;提取关系链分值超过预设的关系阈值的第二登录账户来构成第二登录账户集合;获取与第二登录账户集合中任意一个或多个第二登录账户所关联的数据池,数据池用于保存如下数据:第二登录账户集合中至少一个第二登录账户操作过的数据和/或推荐评分高于预定阈值的数据;将数据池中的数据推送给社交应用软件进行显示。
根据本发明实施例的另一方面,还提供了一种基于社交应用软件的数据推荐装置,该装置包括:第一获取模块,用于获取社交应用软件上第一登录账户的至少一个兴趣信息;第二获取模块,用于获取社交应用软件上与第二登录账户关联的数据池,数据池用于保存如下数据:至少一个第二登录账户操作过的数据和/或推荐评分高于预定阈值的数据,其中,第二登录账户为与第一登录账户具有关系链的登录账户;筛选模块,用于使用至少一个兴趣信息对数据池中的数据进行筛选,得到与每个兴趣信息匹配的数据;推送模块,用于将与每个兴趣信息匹配的数据推送给社交应用软件进行显示。
根据本发明实施例的另一方面,还提供了一种基于社交应用软件的数据推荐装置,该装置包括:第一确定模块,用于确定社交应用软件上第一登录账户与任意一个第二登录账户之间的关联度,其中,第二登录账户和第一登录账户分别同时与第三登录账户在社交应用软件中具有直接的关系链,且第二登录账户和第一登录账户之间不具有直接的关系链;比对模块,用于通过比对社交应用软件上第一登录账户的至少一个兴趣信息和第二登录账户的至少一个兴趣信息,确定第一登录账户分别与每个第二登录账户相互重合的兴趣信息;第二确定模块,用于使用第一登录账户与任意一个第二登录账户之间的关联度和/或相互重合的兴趣信息,确定第一登录账户与每个第二登录账户的关系链分值;提取模块,用于提取关系链分值超过预设的关系阈值的第二登录账户来构成第二登录账户集合;第三获取模块,用于获取与第二登录账户集合中任意一个或多个第二登录账户所关联的数据池,数据池用于保存如下数据:第二登录账户集合中至少一个第二登录账户操作过的数据和/或推荐评分高于预定阈值的数据;推送模块,用于将数据池中的数据推送给社交应用软件进行显示。
在本发明实施例中,采用获取社交应用软件上第一登录账户的至少一个兴趣信息;获取社交应用软件上与第二登录账户关联的数据池,数据池用于保存如下数据:至少一个第二登录账户操作过的数据和/或推荐评分高于预定阈值的数据,其中,第二登录账户为与第一登录账户具有关系链的登录账户;使用至少一个兴趣信息对数据池中的数据进行筛选,得到与每个兴趣信息匹配的数据;将与每个兴趣信息匹配的数据推送给社交应用软件进行显示的方式,进而解决了现有技术中为社交应用软件上当前登录账户所推荐的数据量少,导致推送给当前用户的数据不完整的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例的一种运行基于社交应用软件的数据推荐的计算机终端的硬件结构框图;
图2是根据本发明实施例一的基于社交应用软件的数据推荐方法的流程图;
图3是根据本发明实施例二的基于社交应用软件的数据推荐方法的流程图;
图4是根据本发明图3所示实施例二的社交应用软件平台上各个登录账户之间的关系链示意图;
图5是根据本法实施例三的基于社交应用软件的数据推荐装置的结构示意图;
图6是根据本法实施例三的一种可选的基于社交应用软件的数据推荐装置的结构示意图;
图7a和图7b是根据本法实施例三的另一种可选的基于社交应用软件的数据推荐装置的结构示意图;
图8是根据本法实施例四的基于社交应用软件的数据推荐装置的结构示意图;
图9是根据本法实施例四的第一种可选的基于社交应用软件的数据推荐装置的结构示意图;
图10是根据本法实施例四第二种可选的的基于社交应用软件的数据推荐装置的结构示意图;
图11是根据本法实施例四第三种可选的的基于社交应用软件的数据推荐装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面就本申请涉及到的部分名词解释如下:
时间轴timeline:也叫时间线,常见于各种社交类产品,指将各种类型的数据按时间顺序进行排列,形成一个连续的消息流展现给用户。
实施例1
根据本发明实施例,提供了一种基于社交应用软件的数据推荐方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是本发明实施例的一种运行基于社交应用软件的数据推荐的计算机终端的硬件结构框图。如图1所示,计算机终端10可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的基于社交应用软件的数据推荐方法所对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的基于社交应用软件的数据推荐方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
在上述运行环境下,本申请提供了如图2所示的基于社交应用软件的数据推荐方法。图2是根据本发明实施例一的基于社交应用软件的数据推荐方法的流程图。
如图2所示,该基于社交应用软件的数据推荐方法可以包括如下实现步骤:
步骤S20,获取社交应用软件上第一登录账户的至少一个兴趣信息。
本申请上述步骤S20中的社交应用软件不限于微博、微信、微视、人人网等为用户提供社交平台的产品。用户可以在社交应用软件上注册登录账户,每个用户使用登录账户登录社交应用软件之后,可以通过使用社交应用软件提供的社交功能来确定登录账户的兴趣点,从而获取到每个登录账户的兴趣信息。
例如,以微视为例,当任意一个注册成功的登录账户成功登录微视之后,可以使用社交应用软件提供的频道功能来确定用户的兴趣点,具体的,在当前用户访问微视提供的至少一个视频频道(可以包括体育视频频道、电影视频频道、生活视频频道、汽车视频频道等各种类型的频道,每个视频频道聚合了内容相近或相同的视频)来观看不同类型的视频之后,系统可以依据用户所访问或观看过的视频频道来记录当前用户的兴趣信息,例如,如果当前登录账户在一定时间内访问体育视频频道和电影视频频道的访问频率超过一定比率(60次/分钟),则可以确定该登录账户的兴趣信息包括:体育和电影。
步骤S22,获取社交应用软件上与第二登录账户关联的数据池,数据池用于保存如下数据:至少一个第二登录账户操作过的数据和/或推荐评分高于预定阈值的数据,其中,第二登录账户为与第一登录账户具有关系链的登录账户。
本申请上述步骤S22中的第二登录账户可以是与第一登录账户具有一级关系链的登陆账户或二级关系链的登录账户,优选地,此处的第二登录账户是与第一登录账户具有一级关系链的登陆账户。上述数据池中的数据类型可以包括:网页、视频、音频、文字和图片等。
仍旧以微视为例,此处的数据池为视频构成的集合,其中,第二登录账户操作过的数据包括如下任意一种或多种视频:第二登录账户点击观看过的视频、评论过的视频、点赞过的视频和转发过的视频;推荐评分高于预定阈值的数据是指系统使用历史数据对数据库中的所有视频进行评价,将评价高的视频作为备选对象进行保存,此时的视频第一登录账户和/或第二登录账户都没有访问过。
步骤S24,使用至少一个兴趣信息对数据池中的数据进行筛选,得到与每个兴趣信息匹配的数据。
本申请上述步骤S24可以实现,在确定了当前登录账户的兴趣信息之后,利用该兴趣信息在数据池中进行匹配,查看数据池中那些数据与兴趣信息匹配,从而得到第一登录账户所感兴趣的数据。
仍旧以微视为例,在确定该登录账户的兴趣信息为体育和电影之后,可以查询数据池中的视频的视频内容和类型,提取具有体育或电影的特征的视频,从而确定了需要推送给第一登录用户的视频。
步骤S26,将与每个兴趣信息匹配的数据推送给社交应用软件进行显示。优选地,可以将与每个兴趣信息匹配的数据显示在社交应用软件提供的时间轴上。
由上可知,本申请上述实施例一所提供的方案,通过确定社交应用软件上任意一个第一登录账户的至少一个兴趣信息,并获取与第一登录账户具有关系链的第二登录账户关联的数据池之后,利用兴趣信息对数据池中的数据进行筛选,从而得到当前第一登录账户所感兴趣的所有数据。上述方案的关键之处在于,当前登录账户进一步获取了具有关系链的其他用户所发表的数据,且与自身的兴趣相吻合,从而解决了现有技术中为社交应用软件上当前登录账户所推荐的数据量少,导致推送给当前用户的数据不完整的技术问题,进而实现了为社交应用软件上登录的当前用户推荐了更加完善的数据。
此处需要说明的是,与微博等基于文字的社交产品不同,微视的基础是视频,而视频的生产成本要远远高于文字以及图片,因此微视平台上的视频内容要远远少于微博等产品,因此,本申请实施例一提供的方案优选应用在微视平台上。
具体的,登录用户在微视上除了可以发表原创和转发消息以外,用户在微视平台上还能进行包括评论以及赞在内的其他操作,由于这类操作的成本相对较低,所以数量和频率都要高于发表和转发视频,因此,利用实施例一提供的方案,可以实现在微视提供的时间轴timeline上用户不仅能看到自己发表、原创、转发等操作的视频之外,还可以显示好友发表的视频以及转发、点赞等操作的视频,使得时间轴上显示的内容不再受到极大的限制。通过本方法可以基于当前登录用户本人过往的行为和兴趣,结合整个微视平台的热点以及用户好友评论和赞过的视频等数据,从中挖掘用户可能感兴趣的视频,最后可以采用推荐的形式呈现在用户的timeline中。
本申请上述实施例提供的一种可选方案中,上述步骤S20,获取社交应用软件上第一登录账户的至少一个兴趣信息的方案可以包括如下步骤:
步骤S201,获取第一登录账户通过社交应用软件访问数据频道集合中的至少一个数据频道,其中,第一登录账户所访问过的数据频道构成第一子数据频道集合,数据频道为聚合了相似度大于等于第一阈值的数据的集合。
上述步骤S201中的数据频道集合表征包含了多种类型的数据频道,每个数据频道聚合了相似或相同的数据。可以通过用户访问那种类型的数据频道来确定用户的兴趣点。
例如,以微视为例,如果当前登录账户在一定时间内频繁访问数据频道集合中体育视频频道和电影视频频道,或者点击、播放或者转发了大量这两个视频频道中的视频,则可以确定第一子数据频道集合包含了体育视频频道和电影视频频道,且该第一登录账户的兴趣点包括体育和电影。
步骤S203,获取第一子数据频道集合中每个数据频道的历史访问比率。
优选地,上述步骤S203,获取第一子数据频道集合中每个数据频道的历史访问比率的步骤可以采用如下实施方案:
步骤S2031,通过如下公式计算得到第一子数据频道集合P中每个数据频道Pi的历史访问比率Pi1:Pi1=fi1/Si1,其中,fi1为第一登录账户访问数据频道Pi的访问次数,Si1为第一登录账户访问第一子数据频道集合P中所有数据频道的总访问次数。
仍旧以微视为例,第一子数据频道集合P可以包括:育视频频道、电影视频频道、生活视频频道、汽车视频频道等各种类型的频道,在数据频道P1为体育视频频道的情况下,f11是指第一登录账户访问该体育视频频道的访问次数,其中,访问方式包括:播放、点评、转发等方式来访问体育频道中的体育视频。S11是指当前登录账户访问第一子数据频道集合P中所有类型的视频频道的总和。
步骤S205,获取第一子数据频道集合中的每个数据频道的热门度,热门度用于表征数据频道由所有登录账户访问后生成的访问比率。
优选地,上述步骤S205,获取第一子数据频道集合中的每个数据频道的热门度的步骤可以采用如下实施方案:
步骤S2051,通过如下公式计算得到第一子数据频道集合P中每个数据频道Pi的热门度Pi2:Pi2=fi2/Si2,其中,fi2为数据频道Pi被所有登录账户访问过的总次数,Si2为第一子数据频道集合P中所有数据频道被访问过的总次数。
仍旧以微视为例,第一子数据频道集合P可以包括:育视频频道、电影视频频道、生活视频频道、汽车视频频道等各种类型的频道,在数据频道P1为体育视频频道的情况下,f12是指该体育视频频道被任意一个或多个登录账户访问过的访问次数,其中,访问方式包括:播放、点评、转发等方式来访问体育频道中的体育视频。S12是指第一子数据频道集合P中所有类型的视频频道被任意一个或多个登录账户访问过的总和。
步骤S207,根据第一子数据频道集合中每个数据频道的历史访问频率和热门度,计算得到每个数据频道的兴趣值。
基于上述步骤S203和步骤S205的计算结果,上述步骤S207,根据第一子数据频道集合中每个数据频道的历史访问频率和热门度,计算得到每个数据频道的兴趣值的步骤可以采用如下实施方案:
步骤S2071,通过如下公式计算得到第一子数据频道集合P中每个数据频道Pi的兴趣值Pi:Pi=Pi1*exp(Q-Pi2),其中,Pi1为数据频道Pi的历史访问比率,Pi2为数据频道Pi的热门度,Q是所有数据频道中的最高热门度。
步骤S209,将兴趣值大于等于兴趣阈值的数据频道的兴趣标签设置为第一登录账户的兴趣信息。
本申请上述步骤S201至步骤S209提供了一种获取当前登录账户的兴趣信息的可选方案,通过利用社交应用软件提供的客户端功能模块(例如微视的视频频道功能模块)来获取当前登录账户的兴趣信息。
仍旧以微视为例,当任意一个注册成功的登录账户成功登录微视之后,可以使用社交应用软件提供的频道功能来确定用户的兴趣点。
具体的,频道功能是微视客户端的一个功能模块,它聚合了内容近似或者相同的视频,用户兴趣喜好的挖掘是基于用户对频道的访问记录进行的。对每个用户,要根据其喜好为每个频道打分,分值越高代表喜好度越高。打分的标准有两个:用户对频道的访问量Pi1和频道自身的热门度Pi2。访问量Pi1=对频道的访问次数/用户的总访问次数,频道热门度Pi2=频道被访问次数/所有频道被访问次数。
在一种可选的方案中,由于热门频道的视频通常情况下已经以非常高的频率推送给了客户,因此,本申请立足于给客户推送一些冷门但用户感兴趣的频道,因此,可以采用如下公式来确定哪些视频会写入推荐表中,从而实现优先推荐用户感兴趣的冷门频道,但推荐列表中也不能全部是冷门频道,该得分计算公式是:Pi=Pi1*exp(Q-Pi2),其中Pi1是用户对任意一个频道的访问量,Pi2是任意一个频道的热门度,Q是所有频道的最高热门度。例如,可以采用上述方案选取用户最爱的5个兴趣频道作为用户的兴趣点。
在本申请提供的另外一个可选方案中,第二登录账户操作过的数据包括如下任意一种或多种类型的数据:第二登录账户评论过的数据、第二登录账户转发过的数据,其中,在执行上述步骤S22之前,即获取社交应用软件上与第一登录账户关联的数据池之前,本申请还可以提供如下方案来计算得到数据池中推荐评分高于预定阈值的数据的推荐评分:
步骤S21,通过如下公式计算数据的推荐评分score:score=(第一权重值*score1+第二权重值*score2)*时间因子,其中,score1用于表示操作数据的评分,score2用于表示数据的互动评分值,时间因子用于表征当前时间与数据的发布时间的时间差值,第一权重值和第二权重值可以根据需求进行预先设定。
此处需要说明的是,推荐评分高于预定阈值的数据被称为热门数据。
仍旧以微视为例,热门数据可以是指热门视频,推荐评分的计算公式中的操作数据的评分可以是视频被转、评、赞等操作的得分,互动评分值可以是指视频的互动得分。上述方案提供了热门视频的确定方式,具体的,热门视频的计算考虑到视频的转评赞数量,播放数量,发表时间等多方面因素。每个视频都有自己的推荐评分,该推荐评分可以由视频被转、评、赞等操作的得分和互动得分按照7:3的权重相加求和,后乘以时间因子而得,例如:推荐评分score=(0.7*转评赞得分+0.3*互动得分)*时间因子。
其中,转评赞得分可以按照转:评:赞(例如10:3:1)的比例计算,即转评赞得分=((10*转+3*评+赞)/10000)0.25求得。而互动得分使用了互动率和可信度两个概念,其中可信度是根据播放量求得,可信度=(播放量>播放量阈值?1:(播放量/播放量阈值)),其中,播放量是指当前视频的播放次数,播放量阈值可以是预设的阀值,上述可信度的计算过程可以是:判断视频的播放量是否大于播放量阈值,如果播放量大于播放量阈值,则可信度为1,如果播放量小于等于播放量阈值,则可信度=播放量/播放量阈值的计算结果。互动率则考虑互动情况与实际播放量的比值,即互动率=(10*转+3*评+赞)/播放量。综合互动率和可信度,一个视频的互动得分=((可信度*互动率)/平均互动率)*0.25。时间因子也是热门视频推荐的关健,由当前时间和视频创建时间的差值计算而来,具体的计算方式随发布时间而已:一天内视频、三天内视频、一周内视频、一个月内视频和一个月以上的视频各不相同。
由此可知,针对现有技术存在的无法推荐完善的数据的问题,本发明提出一种基于好友、二度关系扩展和兴趣挖掘出最终推送给用户的完整数据,从而构建用户时间轴timeline上显示的内容的方法。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
根据本发明实施例,还提供了一种基于社交应用软件的数据推荐方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例二所提供的方法实施例仍旧可以在移动终端、计算机终端或者类似的运算装置中执行。此处需要说明的是,实施例二所提供的方法实施例仍旧可以运行在图1所示的计算机终端上。
以在上述运行环境下为,本申请还可以提供如图3所示的基于社交应用软件的数据推荐方法。图3是根据本发明实施例二的基于社交应用软件的数据推荐方法的流程图。
如图3所示,该基于社交应用软件的数据推荐方法可以包括如下实现步骤:
步骤S30,确定社交应用软件上第一登录账户与任意一个第二登录账户之间的关联度,其中,第二登录账户和第一登录账户分别与第三登录账户在社交应用软件中具有直接的关系链,且第二登录账户和第一登录账户不具有直接的关系链。
本申请上述步骤S30中的社交应用软件不限于微博、微信、微视、人人网等为用户提供社交平台的产品。社交应用软件平台上任意一个登录用户直接关注或相互关注的用户称为其一度好友,他们之间的关系链为一级关系链,对一度好友进行扩展进而可以得到其二度好友,也就是好友的好友,登录账户之间的关联度表示用户之间的亲密度。
结合图4可知,本申请上述实施例中的第一登录账户可以是登录社交应用软件的用户A,第二登录账户可以包括以下任意一个用户:用户E、用户F、用户G和用户H,第三登录账户可以包括以下任意一个用户:用户B、用户C和用户D。
具体的,在上图4中,用户A分别关注了B、C和D,即用户B、C和D均为与用户A具有一级关系链的一度好友。同时,B关注了E和G,C关注了F和H,D关注了G,而A没有关注E、F、G和H中的任何一个,则用户E、F、G和H均为与用户A具有二级关系链的二度好友。
通过图4所示的二度关系扩展,用户关系链得到了极大的扩充。但由于二度好友数量巨大,因此需要进一步过滤。本方案选择基于用户与二度好友的亲密度,结合用户本身的兴趣与二度好友发表视频的热度,过滤出推荐给用户的视频。
步骤S32,通过比对社交应用软件上第一登录账户的至少一个兴趣信息和第二登录账户的至少一个兴趣信息,确定第一登录账户分别与每个第二登录账户相互重合的兴趣信息。
本申请上述步骤S30中的用户可以在社交应用软件上注册登录账户,每个用户使用登录账户登录社交应用软件之后,可以通过使用社交应用软件提供的社交功能来确定登录账户的兴趣点,从而获取到每个登录账户的兴趣信息。
例如,以微视为例,当任意一个注册成功的登录账户成功登录微视之后,可以使用社交应用软件提供的频道功能来确定用户的兴趣点,具体的,在当前用户访问微视提供的至少一个视频频道(可以包括体育视频频道、电影视频频道、生活视频频道、汽车视频频道等各种类型的频道,每个视频频道聚合了内容相近或相同的视频)来观看不同类型的视频之后,系统可以依据用户所访问或观看过的视频频道来记录当前用户的兴趣信息,例如,如果当前登录账户在一定时间内访问体育视频频道和电影视频频道的访问频率超过一定比率(60次/分钟),则可以确定该登录账户的兴趣信息包括:体育和电影。
此处需要说明的是,在获取到两个登录账户的兴趣信息之后,可以同将所述第一登录账户的兴趣信息分别与每个第二登录账户兴趣信息进行比对,来确定所述第一登录账户与每个所述第二登录账户相互重合的兴趣信息。
步骤S34,使用第一登录账户与任意一个第二登录账户之间的关联度和/或相互重合的兴趣信息,确定第一登录账户与每个第二登录账户的关系链分值。
本申请上述步骤S24中的关联度描述了两个登录账户之间的关系相关程度,在两个登录账户彼此为二度好友的情况下,用户二度好友的介绍人(即两个登录账户同时关注的用户,是用户的一度好友)越多,说明用户认识二度好友的可能性越多,对其发表、转发、转评赞过的视频就越为感兴趣。所以用户跟每个二度好友的关联度都是通过介绍人数量计算而来的。另外,相互重合的兴趣信息可以表示两个登录账户的兴趣得分。
一种可选方案中,可以采用将两个登录账户之间的关联度和相关兴趣得分求和作为二度好友关系链得分,排序即可以得到一个用户二度好友的排名。
步骤S36,提取关系链分值超过预设的关系阈值的第二登录账户来构成第二登录账户集合。
步骤S38,获取与第二登录账户集合中任意一个或多个第二登录账户所关联的数据池,数据池用于保存如下数据:第二登录账户集合中至少一个第二登录账户操作过的数据和/或推荐评分高于预定阈值的数据。
本申请上述步骤S38中的第二登录账户可以是与第一登录账户具有二级关系链的登录账户。上述数据池中的数据类型可以包括:网页、视频、音频、文字和图片等。
仍旧以微视为例,此处的数据池为视频构成的集合,其中,第二登录账户操作过的数据包括如下任意一种或多种视频:第二登录账户点击观看过的视频、评论过的视频、点赞过的视频和转发过的视频;推荐评分高于预定阈值的数据是指系统使用历史数据对数据库中的所有视频进行评价,将评价高的视频作为备选对象进行保存,此时的视频第一登录账户和/或第二登录账户都没有访问过。
步骤S40,将数据池中的数据推送给社交应用软件进行显示。优选地,可以将数据池中的数据显示在社交应用软件提供的时间轴上。
由上可知,本申请上述实施例二所提供的方案,通过获取与当前登录账户具有二级关系链的账户的关联度,以及第二登录账的至少一个兴趣信息,来确定第一登录账户与每个第二登录账户的关系链分值,在利用关系链分值对所有的第二登录账户进行过滤之后,通过获取过滤后的每个第二登录账户的推荐数据,从而得到向当前第一登录账户推荐的所有有效数据。上述方案的关键之处在于,首先确定与当前登录账户具有亲密关系的登陆账户,然后获取这些登录账户的有效推荐数据,从而解决了现有技术中为社交应用软件上当前登录账户所推荐的数据量少,导致推送给当前用户的数据不完整的技术问题,进而实现了为社交应用软件上登录的当前用户推荐了更加完善的数据。
此处需要说明的是,与微博等基于文字的社交产品不同,微视的基础是视频,而视频的生产成本要远远高于文字以及图片,因此微视平台上的视频内容要远远少于微博等产品,因此,本申请实施例一提供的方案优选应用在微视平台上。
具体的,登录用户在微视上除了可以发表原创和转发消息以外,用户在微视平台上还能进行包括评论以及赞在内的其他操作,由于这类操作的成本相对较低,所以数量和频率都要高于发表和转发视频,因此,利用实施例一提供的方案,可以实现在微视提供的时间轴timeline上用户不仅能看到自己发表、原创、转发等操作的视频之外,还可以显示好友发表的视频以及转发、点赞等操作的视频,使得时间轴上显示的内容不再受到极大的限制。通过本方法可以基于当前登录用户本人过往的行为和兴趣,结合整个微视平台的热点以及用户好友评论和赞过的视频等数据,从中挖掘用户可能感兴趣的视频,最后可以采用推荐的形式呈现在用户的timeline中。
本申请提供的一种可选的方案中,上述步骤S30,确定社交应用软件上第一登录账户与任意一个第二登录账户之间的关联度的方案,可以通过如下实施方案实现:
步骤S301,通过如下计算公式计算得到第一登录账户与任意一个第二登录账户之间的关联度Ri:Ri=50*log2(1+1.0*personNum),其中,personNum表示第一登陆账户与第二登录账户的共同关注的对象的数量。
此计算公式满足对数函数,表示用户和二度好友之间的介绍人越多,用户和二度好友的亲密度就越强。可以采用50*log2(1+1.0*personNum)来计算得到当前用户与二度好友的亲密度。
本申请提供的一种可选方案中,上述步骤S32,在比对社交应用软件上第一登录账户的至少一个兴趣信息和第二登录账户的至少一个兴趣信息之前,还可以执行如下步骤:
步骤S31,获取社交应用软件上第一登录账户或第二登录账户的至少一个兴趣信息,该步骤S31可以包括如下一种可选的实施方案:
步骤S311,获取第一登录账户或第二登录账户通过社交应用软件访问数据频道集合中的至少一个数据频道,其中,第一登录账户所访问过的数据频道构成第一子数据频道集合,第二登录账户所访问过的数据频道构成第二子数据频道集合,数据频道为聚合了相似度大于等于第一阈值的数据的集合。
上述步骤S311中的数据频道集合表征包含了多种类型的数据频道,每个数据频道聚合了相似或相同的数据。可以通过用户访问那种类型的数据频道来确定用户的兴趣点。
例如,以微视为例,如果当前第一登录账户在一定时间内频繁访问数据频道集合中体育视频频道和电影视频频道,或者点击、播放或者转发了大量这两个视频频道中的视频,则可以确定第一子数据频道集合包含了体育视频频道和电影视频频道,且该第一登录账户的兴趣点包括体育和电影。
此处需要说明的是,上述第二登录账户确定兴趣点的原理可以与第一账户确定兴趣点的原理相同。
步骤S313,获取第一子数据频道集合或第二子数据频道集合中每个数据频道的历史访问比率。
优选地,上述步骤S313,获取第一子数据频道集合中每个数据频道的历史访问比率的步骤可以采用如下实施方案:通过如下公式计算得到第一子数据频道集合P中每个数据频道Pi的历史访问比率Pi1:Pi1=fi1/Si1,其中,fi1为第一登录账户访问数据频道Pi的访问次数,Si1为第一登录账户访问第一子数据频道集合P中所有数据频道的总访问次数。
仍旧以微视为例,第一子数据频道集合P可以包括:育视频频道、电影视频频道、生活视频频道、汽车视频频道等各种类型的频道,在数据频道P1为体育视频频道的情况下,f11是指第一登录账户访问该体育视频频道的访问次数,其中,访问方式包括:播放、点评、转发等方式来访问体育频道中的体育视频。S11是指当前登录账户访问第一子数据频道集合P中所有类型的视频频道的总和。
此处需要说明的是,上述获取第二子数据频道集合中每个数据频道的历史访问比率的原理可以与获取第一子数据频道集合中每个数据频道的历史访问比率的原理相同。
步骤S315,获取第一子数据频道集合或第二子数据频道集合中的每个数据频道的热门度,热门度用于表征数据频道由所有登录账户访问后生成的访问比率。
优选地,上述步骤S315,获取第一子数据频道集合中的每个数据频道的热门度的步骤可以采用如下实施方案:通过如下公式计算得到第一子数据频道集合P中每个数据频道Pi的热门度Pi2:Pi2=fi2/Si2,其中,fi2为数据频道Pi被所有登录账户访问过的总次数,Si2为第一子数据频道集合P中所有数据频道被访问过的总次数。
仍旧以微视为例,第一子数据频道集合P可以包括:育视频频道、电影视频频道、生活视频频道、汽车视频频道等各种类型的频道,在数据频道P1为体育视频频道的情况下,f12是指该体育视频频道被任意一个或多个登录账户访问过的访问次数,其中,访问方式包括:播放、点评、转发等方式来访问体育频道中的体育视频。S12是指第一子数据频道集合P中所有类型的视频频道被任意一个或多个登录账户访问过的总和。
此处需要说明的是,上述获取第二子数据频道集合中的每个数据频道的热门度的原理可以与获取第一子数据频道集合中的每个数据频道的热门度的原理相同。
步骤S317,根据第一子数据频道集合或第二子数据频道集合中每个数据频道的历史访问频率和热门度,计算得到第一子数据频道集合或第二子数据频道集合中每个数据频道的兴趣值。
基于上述步骤S313和步骤S315的计算结果,上述步骤S317中,根据第一子数据频道集合中每个数据频道的历史访问频率和热门度,计算得到每个数据频道的兴趣值的步骤可以采用如下实施方案:通过如下公式计算得到第一子数据频道集合P中每个数据频道Pi的兴趣值Pi:Pi=Pi1*exp(Q-Pi2),其中,Pi1为数据频道Pi的历史访问比率,Pi2为数据频道Pi的热门度,Q是所有数据频道中的最高热门度。
此处需要说明的是,上述步骤S317中,第二子数据频道集合中每个数据频道的兴趣值的计算原理可以与获取第一子数据频道集合中每个数据频道的兴趣值的计算原理相同。
步骤S319,将兴趣值大于等于兴趣阈值的数据频道的兴趣标签设置为第一登录账户或第二登录账户的兴趣信息。
本申请上述步骤S311至步骤S319提供了一种获取当前登录账户的兴趣信息的可选方案,通过利用社交应用软件提供的客户端功能模块(例如微视的视频频道功能模块)来获取当前登录账户的兴趣信息。
仍旧以微视为例,当任意一个注册成功的登录账户成功登录微视之后,可以使用社交应用软件提供的频道功能来确定用户的兴趣点。
具体的,频道功能是微视客户端的一个功能模块,它聚合了内容近似或者相同的视频,用户兴趣喜好的挖掘是基于用户对频道的访问记录进行的。对每个用户,要根据其喜好为每个频道打分,分值越高代表喜好度越高。打分的标准有两个:用户对频道的访问量Pi1和频道自身的热门度Pi2。访问量Pi1=对频道的访问次数/用户的总访问次数,频道热门度Pi2=频道被访问次数/所有频道被访问次数。
在一种可选的方案中,由于热门频道的视频通常情况下已经以非常高的频率推送给了客户,因此,本申请立足于给客户推送一些冷门但用户感兴趣的频道,因此,可以采用如下公式来确定哪些视频会写入推荐表中,从而实现优先推荐用户感兴趣的冷门频道,但推荐列表中也不能全部是冷门频道,该得分计算公式是:Pi=Pi1*exp(Q-Pi2),其中Pi1是用户对任意一个频道的访问量,Pi2是任意一个频道的热门度,Q是所有频道的最高热门度。例如,可以采用上述方案选取用户最爱的5个兴趣频道作为用户的兴趣点。
优选地,上述步骤S34,使用第一登录账户与任意一个第二登录账户之间的关联度和/或相互重合的兴趣信息,确定第一登录账户与每个第二登录账户的关系链分值的方案可以包括如下实施方案:
步骤S341,获取第一登录账户与每个第二登录账户相互重合的兴趣信息的数量。
步骤S343,根据相互重合的兴趣信息的数量确定第一登录账户与每个第二登录账户的兴趣分值。
此处需要说明的是,由于第一登录账户与每个第二登录账户作为二度好友时,具有二级关系链的两个登录账户的兴趣点的重合比例则可以作为用户和二度好友的用户的兴趣分值。结合图4可知,当用户A有二度好友E时,可以通过步骤S311至步骤S319计算得到用户A有二度好友E同时最关注的兴趣点,即可以获取到二者的共同兴趣有n(小于等于5)个,此时,可以采用如下计算公式计算用户和二度好友的兴趣得分,该计算公式可以是100*(n/5)。
步骤S345,将第一登录账户与任意一个第二登录账户之间的关联度和兴趣分值进行累加,计算得到每个与第一登录账户具有关系链的第二登录账户的关系链分值。
由此可知,上述方案中,在步骤S311至步骤S319实现了获取到第一登录账户和第二登录账户同时最关注的兴趣点之后,本申请提供的一种可选方案中,
上述步骤S345可以实现由二度好友的关联度和计算得到的兴趣分值进行求和作为二度好友关系链分值,进一步的,可以按照关系链分值进行排序即可以得到一个用户二度好友的排名。
此时可以从用户的每个二度好友关注的热门视频中选取热度最高的m个视频作为推荐,每个视频推荐分数为(二度关系链得分*0.7+视频热度得分*0.3);其中m为二度关系链得分对50取余数。最终对所有推荐视频根据推荐分数由高到低排序,将最好的若干视频推荐给用户。
在本申请提供的另外一个可选方案中,第二登录账户操作过的数据包括如下任意一种或多种类型的数据:第二登录账户评论过的数据、第二登录账户转发过的数据,其中,在执行上述步骤S38之前,即在获取与第二登录账户集合中任意一个或多个第二登录账户所关联的数据池之前,本申请还可以提供如下方案来计算得到数据池中推荐评分高于预定阈值的数据的推荐评分:
步骤S371,通过如下公式计算数据的推荐评分score:score=(第一权重值*score1+第二权重值*score2)*时间因子,其中,score1用于表示操作数据的评分,score2用于表示数据的互动评分值,时间因子用于表征当前时间与数据的发布时间的时间差值,第一权重值和第二权重值可以根据需求进行预先设定。
此处需要说明的是,推荐评分高于预定阈值的数据被称为热门数据。
仍旧以微视为例,热门数据可以是指热门视频,推荐评分的计算公式中的操作数据的评分可以是视频被转、评、赞等操作的得分,互动评分值可以是指视频的互动得分。上述方案提供了热门视频的确定方式,具体的,热门视频的计算考虑到视频的转评赞数量,播放数量,发表时间等多方面因素。每个视频都有自己的推荐评分,该推荐评分可以由视频被转、评、赞等操作的得分和互动得分按照7:3的权重相加求和,后乘以时间因子而得,例如:推荐评分score=(0.7*转评赞得分+0.3*互动得分)*时间因子。
其中,转评赞得分可以按照转:评:赞(例如10:3:1)的比例计算,即转评赞得分=((10*转+3*评+赞)/10000)0.25求得。而互动得分使用了互动率和可信度两个概念,其中可信度是根据播放量求得,可信度=(播放量>播放量阈值?1:(播放量/播放量阈值)),其中,播放量是指当前视频的播放次数,播放量阈值可以是预设的阀值,上述可信度的计算过程可以是:判断视频的播放量是否大于播放量阈值,如果播放量大于播放量阈值,则可信度为1,如果播放量小于等于播放量阈值,则可信度=播放量/播放量阈值的计算结果。互动率则考虑互动情况与实际播放量的比值,即互动率=(10*转+3*评+赞)/播放量。综合互动率和可信度,一个视频的互动得分=((可信度*互动率)/平均互动率)*0.25。时间因子也是热门视频推荐的关健,由当前时间和视频创建时间的差值计算而来,具体的计算方式随发布时间而已:一天内视频、三天内视频、一周内视频、一个月内视频和一个月以上的视频各不相同。
由此可知,针对现有技术存在的无法推荐完善的数据的问题,本发明提出一种基于好友、二度关系扩展和兴趣挖掘出最终推送给用户的完整数据,从而构建用户时间轴timeline上显示的内容的方法。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例3
根据本发明实施例,还提供了一种用于实施上述方法实施例的装置实施例,本申请上述实施例所提供的装置可以在计算机终端上运行。
图5是根据本法实施例三的基于社交应用软件的数据推荐装置的结构示意图。
如图5所示,该应基于社交应用软件的数据推荐装置可以包括:第一获取模块50、第二获取模块52、筛选模块54和推送模块56。
其中,第一获取模块50,用于获取社交应用软件上第一登录账户的至少一个兴趣信息;第二获取模块52,用于获取社交应用软件上与第二登录账户关联的数据池,数据池用于保存如下数据:至少一个第二登录账户操作过的数据和/或推荐评分高于预定阈值的数据,其中,第二登录账户为与第一登录账户具有关系链的登录账户;筛选模块54,用于使用至少一个兴趣信息对数据池中的数据进行筛选,得到与每个兴趣信息匹配的数据;推送模块56,用于将与每个兴趣信息匹配的数据推送给社交应用软件进行显示。
由上可知,本申请上述实施例三所提供的方案,通过确定社交应用软件上任意一个第一登录账户的至少一个兴趣信息,并获取与第一登录账户具有关系链的第二登录账户关联的数据池之后,利用兴趣信息对数据池中的数据进行筛选,从而得到当前第一登录账户所感兴趣的所有数据。上述方案的关键之处在于,当前登录账户进一步获取了具有关系链的其他用户所发表的数据,且与自身的兴趣相吻合,从而解决了现有技术中为社交应用软件上当前登录账户所推荐的数据量少,导致推送给当前用户的数据不完整的技术问题,进而实现了为社交应用软件上登录的当前用户推荐了更加完善的数据。
此处需要说明的是,上述第一获取模块50、第二获取模块52、筛选模块54和推送模块56对应于实施例一中的步骤S20至步骤S26,四个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
优选地,如图6所示,上述第一获取模块50可以包括:第一子获取模块501、第二子获取模块503、第三子获取模块505、处理模块507和设置模块509。
其中,第一子获取模块501,用于获取第一登录账户通过社交应用软件访问数据频道集合中的至少一个数据频道,其中,第一登录账户所访问过的数据频道构成第一子数据频道集合,数据频道为聚合了相似度大于等于第一阈值的数据的集合;第二子获取模块503,用于获取第一子数据频道集合中每个数据频道的历史访问比率;第三子获取模块505,用于获取第一子数据频道集合中的每个数据频道的热门度,热门度用于表征数据频道由所有登录账户访问后生成的访问比率;处理模块507,用于根据第一子数据频道集合中每个数据频道的历史访问频率和热门度,计算得到每个数据频道的兴趣值;设置模块509,用于将兴趣值大于等于兴趣阈值的数据频道的兴趣标签设置为第一登录账户的兴趣信息。
此处需要说明的是,上述第一子获取模块501、第二子获取模块503、第三子获取模块505、处理模块507和设置模块509对应于实施例一中的步骤S201至步骤S209,五个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
优选地,上述第二子获取模块503可以包括:第一计算模块5031,用于通过如下公式计算得到第一子数据频道集合P中每个数据频道Pi的历史访问比率Pi1:Pi1=fi1/Si1,其中,fi1为第一登录账户访问数据频道Pi的访问次数,Si1为第一登录账户访问第一子数据频道集合P中所有数据频道的总访问次数。
此处需要说明的是,上述第一计算模块5031对应于实施例一中的步骤S2031,该模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
优选地,上述第三子获取模块505可以包括:第二计算模块5051,用于通过如下公式计算得到第一子数据频道集合P中每个数据频道Pi的热门度Pi2:Pi2=fi2/Si2,其中,fi2为数据频道Pi被所有登录账户访问过的总次数,Si2为第一子数据频道集合P中所有数据频道被访问过的总次数。
此处需要说明的是,上述第二计算模块5051对应于实施例一中的步骤S2051,该模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
优选地,上述处理模块507可以包括:第三计算模块5071,用于通过如下公式计算得到第一子数据频道集合P中每个数据频道Pi的兴趣值Pi:Pi=Pi1*exp(Q-Pi2),其中,Pi1为数据频道Pi的历史访问比率,Pi2为数据频道Pi的热门度,Q是所有数据频道中的最高热门度。
此处需要说明的是,上述第三计算模块5071对应于实施例一中的步骤S2071,该模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
优选地,第二登录账户操作过的数据包括如下任意一种或多种类型的数据:第二登录账户评论过的数据、第二登录账户转发过的数据。
如图7a和图7b所示,在执行第二获取模块52之前,上述装置还可以执行如下功能模块:第四计算模块51,用于通过如下公式计算数据的推荐评分score:score=(第一权重值*score1+第二权重值*score2)*时间因子,其中,score1用于表示操作数据的评分,score2用于表示数据的互动评分值,时间因子用于表征当前时间与数据的发布时间的时间差值。
此处需要说明的是,上述第四计算模块51对应于实施例一中的步骤S21,四个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
由此可知,针对现有技术存在的无法推荐完善的数据的问题,本发明提出一种基于好友、二度关系扩展和兴趣挖掘出最终推送给用户的完整数据,从而构建用户时间轴timeline上显示的内容的方法。
实施例4
根据本发明实施例,还提供了另一种用于实施上述方法实施例的装置实施例,本申请上述实施例所提供的装置可以在计算机终端上运行。
图8是根据本法实施例四的基于社交应用软件的数据推荐装置的结构示意图。
如图8所示,该应基于社交应用软件的数据推荐装置可以包括:第一确定模块80、比对模块82、第二确定模块84、提取模块86、第三获取模块88和推送模块90。
其中,第一确定模块80,用于确定社交应用软件上第一登录账户与任意一个第二登录账户之间的关联度,其中,第二登录账户和第一登录账户分别同时与第三登录账户在社交应用软件中具有直接的关系链,且第二登录账户和第一登录账户之间不具有直接的关系链;比对模块82,用于通过比对社交应用软件上第一登录账户的至少一个兴趣信息和第二登录账户的至少一个兴趣信息,确定第一登录账户分别与每个第二登录账户相互重合的兴趣信息;第二确定模块84,用于使用第一登录账户与任意一个第二登录账户之间的关联度和/或相互重合的兴趣信息,确定第一登录账户与每个第二登录账户的关系链分值;提取模块86,用于提取关系链分值超过预设的关系阈值的第二登录账户来构成第二登录账户集合;第三获取模块88,用于获取与第二登录账户集合中任意一个或多个第二登录账户所关联的数据池,数据池用于保存如下数据:第二登录账户集合中至少一个第二登录账户操作过的数据和/或推荐评分高于预定阈值的数据;推送模块90,用于将数据池中的数据推送给社交应用软件进行显示。
由上可知,本申请上述实施例四所提供的方案,通过获取与当前登录账户具有二级关系链的账户的关联度,以及第二登录账的至少一个兴趣信息,来确定第一登录账户与每个第二登录账户的关系链分值,在利用关系链分值对所有的第二登录账户进行过滤之后,通过获取过滤后的每个第二登录账户的推荐数据,从而得到向当前第一登录账户推荐的所有有效数据。上述方案的关键之处在于,首先确定与当前登录账户具有亲密关系的登陆账户,然后获取这些登录账户的有效推荐数据,从而解决了现有技术中为社交应用软件上当前登录账户所推荐的数据量少,导致推送给当前用户的数据不完整的技术问题,进而实现了为社交应用软件上登录的当前用户推荐了更加完善的数据。
此处需要说明的是,上述第一确定模块80、比对模块82、第二确定模块84、提取模块86、第三获取模块88和推送模块90对应于实施例二中的步骤S30至步骤S40,六个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例二所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例二提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
优选地,上述第一确定模块80可以包括:第五计算模块801,用于通过如下计算公式计算得到第一登录账户与任意一个第二登录账户之间的关联度Ri:Ri=50*log2(1+1.0*personNum),其中,personNum表示第一登陆账户与第二登录账户的共同关注的对象的数量。
此处需要说明的是,上述第五计算模块801对应于实施例二中的步骤S301,该模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例二所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例二提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
优选地,如图9所示,在执行比对模块82之前,上述装置还可以执行如下功能模块:第四获取模块81,用于获取社交应用软件上第一登录账户或第二登录账户的至少一个兴趣信息。
其中,如图9所示,该第四获取模块81可以包括:第五获取模块811、第六获取模块813、第七获取模块815、第六计算模块817和标记模块819。
其中,第五获取模块811,用于获取第一登录账户或第二登录账户通过社交应用软件访问数据频道集合中的至少一个数据频道,其中,第一登录账户所访问过的数据频道构成第一子数据频道集合,第二登录账户所访问过的数据频道构成第二子数据频道集合,数据频道为聚合了相似度大于等于第一阈值的数据的集合;第六获取模块813,用于获取第一子数据频道集合或第二子数据频道集合中每个数据频道的历史访问比率;第七获取模块815,用于获取第一子数据频道集合或第二子数据频道集合中的每个数据频道的热门度,热门度用于表征数据频道由所有登录账户访问后生成的访问比率;第六计算模块817,用于根据第一子数据频道集合或第二子数据频道集合中每个数据频道的历史访问频率和热门度,计算得到第一子数据频道集合或第二子数据频道集合中每个数据频道的兴趣值;标记模块819,用于将兴趣值大于等于兴趣阈值的数据频道的兴趣标签设置为第一登录账户或第二登录账户的兴趣信息。
此处需要说明的是,上述第五获取模块811、第六获取模块813、第七获取模块815、第六计算模块817和标记模块819对应于实施例二中的步骤S311至步骤S319,五个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例二所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例二提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
优选地,如图10所示,上述第二确定模块84可以包括:第八获取模块841、第七计算模块843和累加模块845。
其中,第八获取模块841,用于获取第一登录账户与每个第二登录账户相互重合的兴趣信息的数量;第七计算模块843,用于根据相互重合的兴趣信息的数量确定第一登录账户与每个第二登录账户的兴趣分值;累加模块845,用于将第一登录账户与任意一个第二登录账户之间的关联度和兴趣分值进行累加,计算得到每个与第一登录账户具有关系链的第二登录账户的关系链分值。
此处需要说明的是,上述第八获取模块841、第七计算模块843和累加模块845对应于实施例二中的步骤S341至步骤S345,三个模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例二所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例二提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
优选地,如图11所示,在执行第三获取模块88之前,上述装置还可以执行如下功能模块:第八计算模块87,用于通过如下公式计算数据的推荐评分score:score=(第一权重值*score1+第二权重值*score2)*时间因子,其中,score1用于表示操作数据的评分,score2用于表示数据的互动评分值,时间因子用于表征当前时间与数据的发布时间的时间差值。
此处需要说明的是,上述第八计算模块87对应于实施例二中的步骤S371,该模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例二所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例二提供的计算机终端10中,可以通过软件实现,也可以通过硬件实现。
此处需要说明的是,推荐评分高于预定阈值的数据被称为热门数据。
仍旧以微视为例,热门数据可以是指热门视频,推荐评分的计算公式中的操作数据的评分可以是视频被转、评、赞等操作的得分,互动评分值可以是指视频的互动得分。上述方案提供了热门视频的确定方式,具体的,热门视频的计算考虑到视频的转评赞数量,播放数量,发表时间等多方面因素。每个视频都有自己的推荐评分,该推荐评分可以由视频被转、评、赞等操作的得分和互动得分按照7:3的权重相加求和,后乘以时间因子而得,例如:推荐评分score=(0.7*转评赞得分+0.3*互动得分)*时间因子。
其中,转评赞得分可以按照转:评:赞(例如10:3:1)的比例计算,即转评赞得分=((10*转+3*评+赞)/10000)0.25求得。而互动得分使用了互动率和可信度两个概念,其中可信度是根据播放量求得,可信度=(播放量>播放量阈值?1:(播放量/播放量阈值)),其中,播放量是指当前视频的播放次数,播放量阈值可以是预设的阀值,上述可信度的计算过程可以是:判断视频的播放量是否大于播放量阈值,如果播放量大于播放量阈值,则可信度为1,如果播放量小于等于播放量阈值,则可信度=播放量/播放量阈值的计算结果。互动率则考虑互动情况与实际播放量的比值,即互动率=(10*转+3*评+赞)/播放量。综合互动率和可信度,一个视频的互动得分=((可信度*互动率)/平均互动率)*0.25。时间因子也是热门视频推荐的关健,由当前时间和视频创建时间的差值计算而来,具体的计算方式随发布时间而已:一天内视频、三天内视频、一周内视频、一个月内视频和一个月以上的视频各不相同。
由此可知,针对现有技术存在的无法推荐完善的数据的问题,本发明提出一种基于好友、二度关系扩展和兴趣挖掘出最终推送给用户的完整数据,从而构建用户时间轴timeline上显示的内容的方法。
实施例5
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一基于社交应用软件的数据推荐方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个服务器中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取社交应用软件上第一登录账户的至少一个兴趣信息;获取社交应用软件上与第二登录账户关联的数据池,数据池用于保存如下数据:至少一个第二登录账户操作过的数据和/或推荐评分高于预定阈值的数据,其中,第二登录账户为与第一登录账户具有关系链的登录账户;使用至少一个兴趣信息对数据池中的数据进行筛选,得到与每个兴趣信息匹配的数据;将与每个兴趣信息匹配的数据推送给社交应用软件进行显示。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:获取第一登录账户通过社交应用软件访问数据频道集合中的至少一个数据频道,其中,第一登录账户所访问过的数据频道构成第一子数据频道集合,数据频道为聚合了相似度大于等于第一阈值的数据的集合;获取第一子数据频道集合中每个数据频道的历史访问比率;获取第一子数据频道集合中的每个数据频道的热门度,热门度用于表征数据频道由所有登录账户访问后生成的访问比率;根据第一子数据频道集合中每个数据频道的历史访问频率和热门度,计算得到每个数据频道的兴趣值;将兴趣值大于等于兴趣阈值的数据频道的兴趣标签设置为第一登录账户的兴趣信息。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:通过如下公式计算得到第一子数据频道集合P中每个数据频道Pi的历史访问比率Pi1:Pi1=fi1/Si1,其中,fi1为第一登录账户访问数据频道Pi的访问次数,Si1为第一登录账户访问第一子数据频道集合P中所有数据频道的总访问次数。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:通过如下公式计算得到第一子数据频道集合P中每个数据频道Pi的热门度Pi2:Pi2=fi2/Si2,其中,fi2为数据频道Pi被所有登录账户访问过的总次数,Si2为第一子数据频道集合P中所有数据频道被访问过的总次数。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:通过如下公式计算得到第一子数据频道集合P中每个数据频道Pi的兴趣值Pi:Pi=Pi1*exp(Q-Pi2),其中,Pi1为数据频道Pi的历史访问比率,Pi2为数据频道Pi的热门度,Q是所有数据频道中的最高热门度。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:通过如下公式计算数据的推荐评分score:score=(第一权重值*score1+第二权重值*score2)*时间因子,其中,score1用于表示操作数据的评分,score2用于表示数据的互动评分值,时间因子用于表征当前时间与数据的发布时间的时间差值。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:将与每个兴趣信息匹配的数据显示在社交应用软件提供的时间轴上。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
可选地,本实施例中的具体示例可以参考上述实施例1和实施例3中所描述的示例,本实施例在此不再赘述。
实施例6
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一基于社交应用软件的数据推荐方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个服务器中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:确定社交应用软件上第一登录账户与任意一个第二登录账户之间的关联度,其中,第二登录账户和第一登录账户分别同时与第三登录账户在社交应用软件中具有直接的关系链,且第二登录账户和第一登录账户之间不具有直接的关系链;通过比对社交应用软件上第一登录账户的至少一个兴趣信息和第二登录账户的至少一个兴趣信息,确定第一登录账户分别与每个第二登录账户相互重合的兴趣信息;使用第一登录账户与任意一个第二登录账户之间的关联度和/或相互重合的兴趣信息,确定第一登录账户与每个第二登录账户的关系链分值;提取关系链分值超过预设的关系阈值的第二登录账户来构成第二登录账户集合;获取与第二登录账户集合中任意一个或多个第二登录账户所关联的数据池,数据池用于保存如下数据:第二登录账户集合中至少一个第二登录账户操作过的数据和/或推荐评分高于预定阈值的数据;将数据池中的数据推送给社交应用软件进行显示。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:通过如下计算公式计算得到第一登录账户与任意一个第二登录账户之间的关联度Ri:Ri=50*log2(1+1.0*personNum),其中,personNum表示第一登陆账户与第二登录账户的共同关注的对象的数量。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:获取社交应用软件上第一登录账户或第二登录账户的至少一个兴趣信息,该步骤包括:获取第一登录账户或第二登录账户通过社交应用软件访问数据频道集合中的至少一个数据频道,其中,第一登录账户所访问过的数据频道构成第一子数据频道集合,第二登录账户所访问过的数据频道构成第二子数据频道集合,数据频道为聚合了相似度大于等于第一阈值的数据的集合;获取第一子数据频道集合或第二子数据频道集合中每个数据频道的历史访问比率;获取第一子数据频道集合或第二子数据频道集合中的每个数据频道的热门度,热门度用于表征数据频道由所有登录账户访问后生成的访问比率;根据第一子数据频道集合或第二子数据频道集合中每个数据频道的历史访问频率和热门度,计算得到第一子数据频道集合或第二子数据频道集合中每个数据频道的兴趣值;将兴趣值大于等于兴趣阈值的数据频道的兴趣标签设置为第一登录账户或第二登录账户的兴趣信息。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:获取第一登录账户与每个第二登录账户相互重合的兴趣信息的数量;根据相互重合的兴趣信息的数量确定第一登录账户与每个第二登录账户的兴趣分值;将第一登录账户与任意一个第二登录账户之间的关联度和兴趣分值进行累加,计算得到每个与第一登录账户具有关系链的第二登录账户的关系链分值。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:通过如下公式计算数据的推荐评分score:score=(第一权重值*score1+第二权重值*score2)*时间因子,其中,score1用于表示操作数据的评分,score2用于表示数据的互动评分值,时间因子用于表征当前时间与数据的发布时间的时间差值。
可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:将与每个兴趣信息匹配的数据显示在社交应用软件提供的时间轴上。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
可选地,本实施例中的具体示例可以参考上述实施例2和实施例4中所描述的示例,本实施例在此不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (20)

1.一种基于社交应用软件的数据推荐方法,其特征在于,包括:
获取社交应用软件上第一登录账户的至少一个兴趣信息;
获取所述社交应用软件上与第二登录账户关联的数据池,所述数据池用于保存如下数据:至少一个第二登录账户操作过的数据和/或推荐评分高于预定阈值的数据,其中,所述第二登录账户为与所述第一登录账户具有关系链的登录账户,所述第二登录账户操作过的数据包括如下任意一种或多种类型的数据:所述第二登录账户评论过的数据、所述第二登录账户转发过的数据;
使用所述至少一个兴趣信息对所述数据池中的数据进行筛选,得到与每个兴趣信息匹配的数据;
将与所述每个兴趣信息匹配的数据推送给所述社交应用软件进行显示;
其中,获取社交应用软件上第一登录账户的至少一个兴趣信息的步骤包括:获取所述第一登录账户通过所述社交应用软件访问数据频道集合中的至少一个数据频道,其中,所述第一登录账户所访问过的数据频道构成第一子数据频道集合,所述数据频道为聚合了相似度大于等于第一阈值的数据的集合;获取所述第一子数据频道集合中每个数据频道的历史访问比率;获取所述第一子数据频道集合中的每个数据频道的热门度,所述热门度用于表征所述数据频道由所有登录账户访问后生成的访问比率;根据所述第一子数据频道集合中所述每个数据频道的所述历史访问频率和所述热门度,计算得到每个数据频道的兴趣值;将所述兴趣值大于等于兴趣阈值的数据频道的兴趣标签设置为所述第一登录账户的兴趣信息。
2.根据权利要求1所述的方法,其特征在于,获取所述第一子数据频道集合中每个数据频道的历史访问比率的步骤包括:
通过如下公式计算得到所述第一子数据频道集合P中每个数据频道Pi的历史访问比率Pi1:
Pi1=fi1/Si1,其中,fi1为所述第一登录账户访问所述数据频道Pi的访问次数,Si1为所述第一登录账户访问所述第一子数据频道集合P中所有数据频道的总访问次数。
3.根据权利要求2所述的方法,其特征在于,获取所述第一子数据频道集合中的每个数据频道的热门度的步骤包括:
通过如下公式计算得到所述第一子数据频道集合P中每个数据频道Pi的热门度Pi2:
Pi2=fi2/Si2,其中,fi2为所述数据频道Pi被所有登录账户访问过的总次数,Si2为所述第一子数据频道集合P中所有数据频道被访问过的总次数。
4.根据权利要求3所述的方法,其特征在于,根据所述第一子数据频道集合中所述每个数据频道的所述历史访问频率和所述热门度,计算得到每个数据频道的兴趣值的步骤包括:
通过如下公式计算得到所述第一子数据频道集合P中每个数据频道Pi的兴趣值Pi:
Pi=Pi1*exp(Q-Pi2),其中,Pi1为所述数据频道Pi的历史访问比率,Pi2为数据频道Pi的热门度,Q是所有数据频道中的最高热门度。
5.根据权利要求1所述的方法,其特征在于,在获取所述社交应用软件上与所述第一登录账户关联的数据池之前,所述方法还包括:
通过如下公式计算所述数据的推荐评分score:
score=(第一权重值*score1+第二权重值*score2)*时间因子,其中,score1用于表示操作所述数据的评分,score2用于表示所述数据的互动评分值,所述时间因子用于表征当前时间与所述数据的发布时间的时间差值。
6.根据权利要求1所述的方法,其特征在于,在将与所述每个兴趣信息匹配的数据推送给所述社交应用软件进行显示之后,所述方法包括:
将与所述每个兴趣信息匹配的数据显示在所述社交应用软件提供的时间轴上。
7.一种基于社交应用软件的数据推荐方法,其特征在于,包括:
确定社交应用软件上第一登录账户与任意一个第二登录账户之间的关联度,其中,所述第二登录账户和所述第一登录账户分别同时与第三登录账户在所述社交应用软件中具有直接的关系链,且所述第二登录账户和所述第一登录账户之间不具有直接的关系链;
通过比对所述社交应用软件上所述第一登录账户的至少一个兴趣信息和所述第二登录账户的至少一个兴趣信息,确定所述第一登录账户分别与每个所述第二登录账户相互重合的兴趣信息;
使用所述第一登录账户与任意一个第二登录账户之间的关联度和/或所述相互重合的兴趣信息,确定所述第一登录账户与每个所述第二登录账户的关系链分值;
提取所述关系链分值超过预设的关系阈值的第二登录账户来构成第二登录账户集合;
获取与所述第二登录账户集合中任意一个或多个第二登录账户所关联的数据池,所述数据池用于保存如下数据:所述第二登录账户集合中至少一个第二登录账户操作过的数据和/或推荐评分高于预定阈值的数据,其中,所述第二登录账户操作过的数据包括如下任意一种或多种类型的数据:第二登录账户评论过的数据、第二登录账户转发过的数据;
将所述数据池中的数据推送给所述社交应用软件进行显示;
其中,在比对所述社交应用软件上所述第一登录账户的至少一个兴趣信息和所述第二登录账户的至少一个兴趣信息之前,所述方法还包括:获取所述社交应用软件上所述第一登录账户或所述第二登录账户的至少一个兴趣信息,该步骤包括:获取所述第一登录账户或所述第二登录账户通过所述社交应用软件访问数据频道集合中的至少一个数据频道,其中,所述第一登录账户所访问过的数据频道构成第一子数据频道集合,所述第二登录账户所访问过的数据频道构成第二子数据频道集合,所述数据频道为聚合了相似度大于等于第一阈值的数据的集合;获取所述第一子数据频道集合或所述第二子数据频道集合中每个数据频道的历史访问比率;获取所述第一子数据频道集合或所述第二子数据频道集合中的每个数据频道的热门度,所述热门度用于表征所述数据频道由所有登录账户访问后生成的访问比率;根据所述第一子数据频道集合或所述第二子数据频道集合中所述每个数据频道的所述历史访问频率和所述热门度,计算得到所述第一子数据频道集合或所述第二子数据频道集合中每个数据频道的兴趣值;将所述兴趣值大于等于兴趣阈值的数据频道的兴趣标签设置为所述第一登录账户或所述第二登录账户的兴趣信息。
8.根据权利要求7所述的方法,其特征在于,确定社交应用软件上第一登录账户与任意一个第二登录账户之间的关联度的步骤包括:
通过如下计算公式计算得到所述第一登录账户与任意一个所述第二登录账户之间的关联度Ri:
Ri=50*log2(1+1.0*personNum),其中,personNum表示所述第一登录账户与所述第二登录账户的共同关注的对象的数量。
9.根据权利要求7至8中任意一项所述的方法,其特征在于,使用所述第一登录账户与任意一个第二登录账户之间的关联度和/或所述相互重合的兴趣信息,确定所述第一登录账户与每个所述第二登录账户的关系链分值的步骤包括:
获取所述第一登录账户与每个所述第二登录账户相互重合的兴趣信息的数量;
根据所述相互重合的兴趣信息的数量确定所述第一登录账户与每个所述第二登录账户的兴趣分值;
将所述第一登录账户与任意一个第二登录账户之间的关联度和所述兴趣分值进行累加,计算得到每个与所述第一登录账户具有关系链的第二登录账户的关系链分值。
10.根据权利要求7所述的方法,其特征在于,在获取与所述第二登录账户集合中任意一个或多个第二登录账户所关联的数据池之前,所述方法还包括:
通过如下公式计算所述数据的推荐评分score:
score=(第一权重值*score1+第二权重值*score2)*时间因子,其中,score1用于表示操作所述数据的评分,score2用于表示所述数据的互动评分值,所述时间因子用于表征当前时间与所述数据的发布时间的时间差值。
11.根据权利要求7所述的方法,其特征在于,在将所述数据池中的数据推送给所述社交应用软件进行显示之后,所述方法还包括:
将所述数据池中的数据显示在所述社交应用软件提供的时间轴上。
12.一种基于社交应用软件的数据推荐装置,其特征在于,包括:
第一获取模块,用于获取社交应用软件上第一登录账户的至少一个兴趣信息;
第二获取模块,用于获取所述社交应用软件上与第二登录账户关联的数据池,所述数据池用于保存如下数据:至少一个第二登录账户操作过的数据和/或推荐评分高于预定阈值的数据,其中,所述第二登录账户为与所述第一登录账户具有关系链的登录账户,所述第二登录账户操作过的数据包括如下任意一种或多种类型的数据:所述第二登录账户评论过的数据、所述第二登录账户转发过的数据;
筛选模块,用于使用所述至少一个兴趣信息对所述数据池中的数据进行筛选,得到与每个兴趣信息匹配的数据;
推送模块,用于将与所述每个兴趣信息匹配的数据推送给所述社交应用软件进行显示;
其中,所述第一获取模块包括:第一子获取模块,用于获取所述第一登录账户通过所述社交应用软件访问数据频道集合中的至少一个数据频道,其中,所述第一登录账户所访问过的数据频道构成第一子数据频道集合,所述数据频道为聚合了相似度大于等于第一阈值的数据的集合;第二子获取模块,用于获取所述第一子数据频道集合中每个数据频道的历史访问比率;第三子获取模块,用于获取所述第一子数据频道集合中的每个数据频道的热门度,所述热门度用于表征所述数据频道由所有登录账户访问后生成的访问比率;处理模块,用于根据所述第一子数据频道集合中所述每个数据频道的所述历史访问频率和所述热门度,计算得到每个数据频道的兴趣值;设置模块,用于将所述兴趣值大于等于兴趣阈值的数据频道的兴趣标签设置为所述第一登录账户的兴趣信息。
13.根据权利要求12所述的装置,其特征在于,所述第二子获取模块包括:
第一计算模块,用于通过如下公式计算得到所述第一子数据频道集合P中每个数据频道Pi的历史访问比率Pi1:
Pi1=fi1/Si1,其中,fi1为所述第一登录账户访问所述数据频道Pi的访问次数,Si1为所述第一登录账户访问所述第一子数据频道集合P中所有数据频道的总访问次数。
14.根据权利要求13所述的装置,其特征在于,所述第三子获取模块包括:
第二计算模块,用于通过如下公式计算得到所述第一子数据频道集合P中每个数据频道Pi的热门度Pi2:
Pi2=fi2/Si2,其中,fi2为所述数据频道Pi被所有登录账户访问过的总次数,Si2为所述第一子数据频道集合P中所有数据频道被访问过的总次数。
15.根据权利要求14所述的装置,其特征在于,所述处理模块包括:
第三计算模块,用于通过如下公式计算得到所述第一子数据频道集合P中每个数据频道Pi的兴趣值Pi:
Pi=Pi1*exp(Q-Pi2),其中,Pi1为所述数据频道Pi的历史访问比率,Pi2为数据频道Pi的热门度,Q是所有数据频道中的最高热门度。
16.根据权利要求12所述的装置,其特征在于,所述装置还包括:
第四计算模块,用于通过如下公式计算所述数据的推荐评分score:
score=(第一权重值*score1+第二权重值*score2)*时间因子,其中,score1用于表示操作所述数据的评分,score2用于表示所述数据的互动评分值,所述时间因子用于表征当前时间与所述数据的发布时间的时间差值。
17.一种基于社交应用软件的数据推荐装置,其特征在于,包括:
第一确定模块,用于确定社交应用软件上第一登录账户与任意一个第二登录账户之间的关联度,其中,所述第二登录账户和所述第一登录账户分别同时与第三登录账户在所述社交应用软件中具有直接的关系链,且所述第二登录账户和所述第一登录账户之间不具有直接的关系链;
比对模块,用于通过比对所述社交应用软件上所述第一登录账户的至少一个兴趣信息和所述第二登录账户的至少一个兴趣信息,确定所述第一登录账户分别与每个所述第二登录账户相互重合的兴趣信息;
第二确定模块,用于使用所述第一登录账户与任意一个第二登录账户之间的关联度和/或所述相互重合的兴趣信息,确定所述第一登录账户与每个所述第二登录账户的关系链分值;
提取模块,用于提取所述关系链分值超过预设的关系阈值的第二登录账户来构成第二登录账户集合;
第三获取模块,用于获取与所述第二登录账户集合中任意一个或多个第二登录账户所关联的数据池,所述数据池用于保存如下数据:所述第二登录账户集合中至少一个第二登录账户操作过的数据和/或推荐评分高于预定阈值的数据,所述第二登录账户操作过的数据包括如下任意一种或多种类型的数据:所述第二登录账户评论过的数据、所述第二登录账户转发过的数据;
推送模块,用于将所述数据池中的数据推送给所述社交应用软件进行显示;
其中,所述装置还包括:第四获取模块,用于获取所述社交应用软件上所述第一登录账户或所述第二登录账户的至少一个兴趣信息,该第四获取模块可以包括如下功能模块:第五获取模块,用于获取所述第一登录账户或所述第二登录账户通过所述社交应用软件访问数据频道集合中的至少一个数据频道,其中,所述第一登录账户所访问过的数据频道构成第一子数据频道集合,所述第二登录账户所访问过的数据频道构成第二子数据频道集合,所述数据频道为聚合了相似度大于等于第一阈值的数据的集合;第六获取模块,用于获取所述第一子数据频道集合或所述第二子数据频道集合中每个数据频道的历史访问比率;第七获取模块,用于获取所述第一子数据频道集合或所述第二子数据频道集合中的每个数据频道的热门度,所述热门度用于表征所述数据频道由所有登录账户访问后生成的访问比率;第六计算模块,用于根据所述第一子数据频道集合或所述第二子数据频道集合中所述每个数据频道的所述历史访问频率和所述热门度,计算得到所述第一子数据频道集合或所述第二子数据频道集合中每个数据频道的兴趣值;标记模块,用于将所述兴趣值大于等于兴趣阈值的数据频道的兴趣标签设置为所述第一登录账户或所述第二登录账户的兴趣信息。
18.根据权利要求17所述的装置,其特征在于,所述第一确定模块包括:
第五计算模块,用于通过如下计算公式计算得到所述第一登录账户与任意一个所述第二登录账户之间的关联度Ri:
Ri=50*log2(1+1.0*personNum),其中,personNum表示所述第一登录账户与所述第二登录账户的共同关注的对象的数量。
19.根据权利要求17至18中任意一项所述的装置,其特征在于,所述第二确定模块包括:
第八获取模块,用于获取所述第一登录账户与每个所述第二登录账户相互重合的兴趣信息的数量;
第七计算模块,用于根据所述相互重合的兴趣信息的数量确定所述第一登录账户与每个所述第二登录账户的兴趣分值;
累加模块,用于将所述第一登录账户与任意一个第二登录账户之间的关联度和所述兴趣分值进行累加,计算得到每个与所述第一登录账户具有关系链的第二登录账户的关系链分值。
20.根据权利要求17所述的装置,其特征在于,所述装置还包括:
第八计算模块,用于通过如下公式计算所述数据的推荐评分score:score=(第一权重值*score1+第二权重值*score2)*时间因子,其中,score1用于表示操作所述数据的评分,score2用于表示所述数据的互动评分值,所述时间因子用于表征当前时间与所述数据的发布时间的时间差值。
CN201410466121.5A 2014-09-12 2014-09-12 基于社交应用软件的数据推荐方法和装置 Active CN105468653B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410466121.5A CN105468653B (zh) 2014-09-12 2014-09-12 基于社交应用软件的数据推荐方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410466121.5A CN105468653B (zh) 2014-09-12 2014-09-12 基于社交应用软件的数据推荐方法和装置

Publications (2)

Publication Number Publication Date
CN105468653A CN105468653A (zh) 2016-04-06
CN105468653B true CN105468653B (zh) 2020-06-16

Family

ID=55606357

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410466121.5A Active CN105468653B (zh) 2014-09-12 2014-09-12 基于社交应用软件的数据推荐方法和装置

Country Status (1)

Country Link
CN (1) CN105468653B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106873955A (zh) * 2016-06-07 2017-06-20 阿里巴巴集团控股有限公司 动态列表的显示方法、装置、设备和系统
CN106254218B (zh) * 2016-08-11 2020-04-21 王纯柏 即时通讯账户关联方法及装置
CN108268556A (zh) * 2017-01-03 2018-07-10 南宁富桂精密工业有限公司 信息推荐方法及信息推送端
CN107948255B (zh) * 2017-11-13 2019-09-03 苏州达家迎信息技术有限公司 App的推送方法及计算机可读存储介质
CN109978534A (zh) * 2017-12-25 2019-07-05 上海瀚决网络科技有限公司 社交平台的社交信息排序显示方法和虚拟货币分配方法
CN109377401B (zh) * 2018-08-24 2022-02-18 腾讯科技(武汉)有限公司 一种数据处理方法、装置、系统、服务器及存储介质
CN112328865B (zh) * 2019-07-31 2024-01-05 北京达佳互联信息技术有限公司 信息处理和推荐方法、装置、设备及存储介质
CN110852794A (zh) * 2019-10-28 2020-02-28 上海连尚网络科技有限公司 一种小说推荐方法及设备
CN112989172B (zh) * 2019-12-02 2024-03-12 北京达佳互联信息技术有限公司 内容推荐方法、装置、计算机设备及存储介质
CN111177062B (zh) * 2019-12-02 2024-04-05 上海连尚网络科技有限公司 一种用于提供阅读呈现信息的方法与设备
CN112231590B (zh) * 2020-10-15 2023-06-27 中国联合网络通信集团有限公司 内容推荐方法、系统、计算机设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916286A (zh) * 2010-08-23 2010-12-15 宇龙计算机通信科技(深圳)有限公司 一种信息推荐方法及系统
US20130013419A1 (en) * 2011-07-08 2013-01-10 Electronics And Telecommunications Research Institute Application execution apparatus, application providing apparatus, and application distribution method using chaining of applications
CN103425703B (zh) * 2012-05-25 2018-07-27 深圳市腾讯计算机系统有限公司 一种网络信息的处理方法和装置
CN103020254B (zh) * 2012-12-20 2016-03-02 北京趣拿信息技术有限公司 信息的推荐方法及装置
CN103914550B (zh) * 2014-04-11 2017-08-18 百度在线网络技术(北京)有限公司 展现推荐内容的方法和装置

Also Published As

Publication number Publication date
CN105468653A (zh) 2016-04-06

Similar Documents

Publication Publication Date Title
CN105468653B (zh) 基于社交应用软件的数据推荐方法和装置
US10999634B2 (en) Media content recommendation method, server, client, and storage medium
Naraine et al. User engagement from within the Twitter community of professional sport organizations
CN110134829B (zh) 视频定位方法和装置、存储介质及电子装置
Dooms et al. Movietweetings: a movie rating dataset collected from twitter
US9396763B2 (en) Computer-assisted collaborative tagging of video content for indexing and table of contents generation
US9299113B2 (en) Social media driven information interface
US9798457B2 (en) Synchronization of media interactions using context
US8849721B2 (en) Structured objects and actions on a social networking system
US9032290B2 (en) Tool for creating structured objects and actions on a social networking system
US8132200B1 (en) Intra-video ratings
US8566725B2 (en) Audience platform
CN105574045B (zh) 一种视频推荐方法和服务器
US20130073280A1 (en) Dynamic sentence formation from structured objects and actions in a social networking system
US20150154304A1 (en) System and method for providing knowledge sharing service based on user relationship information of social network service
CN111708901A (zh) 多媒体资源推荐方法、装置、电子设备及存储介质
CN102971762A (zh) 促进社交网络用户之间的交互
KR20150000513A (ko) 소셜 네트워킹 업데이트 내의 미디어 객체의 부분에 대한 링크의 실시간 제공
CN102946549A (zh) 一种移动社交视频分享方法与系统
CN104375746A (zh) 一种分类展示app内容的互动式数据处理方法
WO2013026325A1 (zh) 一种人物搜索方法、装置及存储介质
CN112507163B (zh) 时长预测模型训练方法、推荐方法、装置、设备及介质
US10990620B2 (en) Aiding composition of themed articles about popular and novel topics and offering users a navigable experience of associated content
CN104317804A (zh) 发布投票信息的方法和装置
US20150128071A1 (en) System and method for providing social network service

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant