CN111159541A - 一种帐号行为偏好的确定方法及装置 - Google Patents
一种帐号行为偏好的确定方法及装置 Download PDFInfo
- Publication number
- CN111159541A CN111159541A CN201911267876.1A CN201911267876A CN111159541A CN 111159541 A CN111159541 A CN 111159541A CN 201911267876 A CN201911267876 A CN 201911267876A CN 111159541 A CN111159541 A CN 111159541A
- Authority
- CN
- China
- Prior art keywords
- behavior
- account
- media resource
- data log
- exposure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种帐号行为偏好的确定方法及装置,其中,该方法包括:从媒体资源页面获取第一媒体资源的曝光数据日志和行为数据日志,其中,曝光数据日志记录了用于指示向帐号展示第一媒体资源的数据,行为数据日志记录了用于指示帐号对第一媒体资源执行目标行为的数据;根据曝光数据日志和行为数据日志确定调整参数,其中,调整参数用于指示帐号行为偏好的影响因素对帐号行为偏好的影响度;使用调整参数对初始行为偏好进行调整,得到帐号对应的目标行为偏好。本申请解决了对帐号行为偏好进行确定的准确率较低的技术问题。
Description
技术领域
本申请涉及计算机领域,尤其涉及一种帐号行为偏好的确定方法及装置。
背景技术
现在相关领域和应用上对活动的用户行为偏好进行评分主要分为2类,一类是简单计算或其他近似评分作为指标,并没有考虑到数据分布特性,评分无法客观反映行为偏好,如曝光次数为2,执行1次行为的用户的评分可能会比曝光次数为100,执行40次行为的用户的评分高;另一类是通过模型预测方式,该方式需大量资源投入,且模型准确率不高。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种帐号行为偏好的确定方法及装置。
根据本申请实施例的一个方面,提供了一种帐号行为偏好的确定方法,包括:
从媒体资源页面获取第一媒体资源的曝光数据日志和行为数据日志,其中,所述曝光数据日志记录了用于指示向帐号展示所述第一媒体资源的数据,所述行为数据日志记录了用于指示所述帐号对所述第一媒体资源执行目标行为的数据;
根据所述曝光数据日志和所述行为数据日志确定调整参数,其中,所述调整参数用于指示帐号行为偏好的影响因素对所述帐号行为偏好的影响度;
使用所述调整参数对初始行为偏好进行调整,得到所述帐号对应的目标行为偏好。
根据本申请实施例的另一方面,还提供了一种帐号行为偏好的确定装置,包括:
获取模块,用于从媒体资源页面获取第一媒体资源的曝光数据日志和行为数据日志,其中,所述曝光数据日志记录了用于指示向帐号展示所述第一媒体资源的数据,所述行为数据日志记录了用于指示所述帐号对所述第一媒体资源执行目标行为的数据;
确定模块,用于根据所述曝光数据日志和所述行为数据日志确定调整参数,其中,所述调整参数用于指示帐号行为偏好的影响因素对所述帐号行为偏好的影响度;
调整模块,用于使用所述调整参数对初始行为偏好进行调整,得到所述帐号对应的目标行为偏好。
可选地,所述确定模块包括:
第一确定单元,用于根据所述曝光数据日志和所述行为数据日志确定所述第一媒体资源的资源特征,其中,所述资源特征用于指示所述第一媒体资源的传播度;
第二确定单元,用于根据所述资源特征确定所述第一媒体资源的资源权重,其中,所述调整参数包括所述资源权重。
可选地,所述确定模块还包括:
第一统计单元,用于从所述曝光数据日志和所述行为数据日志中统计所述调整参数,其中,所述调整参数包括:曝光次数、行为次数、第一时间衰减因子和第二时间衰减因子,所述曝光次数用于指示所述第一媒体资源在传播期间内的被展示的次数,所述行为次数用于指示所述第一媒体资源在所述传播期间内被执行所述目标行为的次数,所述第一时间衰减因子用于指示所述第一媒体资源的曝光时间与当前时间之间的关系,所述第二时间衰减因子用于指示所述第一媒体资源的行为时间与当前时间之间的关系。
可选地,所述第一统计单元包括:
第一提取子单元,用于从所述曝光数据日志中提取曝光数据,其中,所述曝光数据用于记录具有对应关系的帐号标识、媒体资源标识和曝光时间,所述曝光时间用于指示向所述帐号展示所述第一媒体资源的时间;
第二提取子单元,用于从所述行为数据日志中提取行为数据,其中,所述行为数据用于记录具有对应关系的帐号标识、媒体资源标识、行为时间和行为标识,所述行为时间用于指示所述帐号对所述第一媒体资源执行所述目标行为的时间,所述行为标识用于指示所述帐号是否对所述第一媒体资源执行了所述目标行为;
合并子单元,用于将所述曝光数据和所述行为数据合并,生成目标记录表,其中,所述目标记录表用于记录具有对应关系的帐号标识、媒体资源标识、曝光时间、行为时间和行为标识;
统计子单元,用于从所述目标记录表中统计所述曝光次数、所述行为次数、所述第一时间衰减因子、所述第二时间衰减因子以及所述资源特征,其中,所述资源特征包括:媒体资源时长,参与数量和行为数量,所述媒体资源时长用于指示所述第一媒体资源的持续时长,所述参与数量用于指示参与所述第一媒体资源的帐号数,所述行为数量用于指示对所述第一媒体资源执行所述目标行为的帐号数。
可选地,所述第一提取子单元用于:
统计所述曝光数据日志中所包括的互不相同的帐号标识;
从所述曝光数据日志中查找所述互不相同的帐号标识中每个帐号标识对应的媒体资源标识和每个媒体资源标识对应的曝光时间;
以帐号标识为关键字,媒体资源标识和曝光时间为关键字的对应值,建立帐号标识、媒体资源标识和曝光时间之间的对应关系,得到所述曝光数据。
可选地,所述第二提取子单元用于:
统计所述行为数据日志中所包括的互不相同的帐号标识;
从所述行为数据日志中查找所述互不相同的帐号标识中每个帐号标识对应的媒体资源标识和每个媒体资源标识对应的行为时间和行为标识;
以帐号标识为关键字,媒体资源标识、行为时间和行为标识为关键字的对应值,建立帐号标识、媒体资源标识、行为时间和行为标识之间的对应关系,得到所述行为数据。
可选地,所述合并子单元用于:
按照帐号标识以及媒体资源标识将所述行为数据中记录的行为时间和行为标识添加到所述曝光数据记录的具有对应关系的帐号标识、媒体资源标识和曝光时间中;
将所述行为数据中未记录的帐号标识以及媒体资源标识所对应的行为时间设置为空,将行为时间设置为空的行为标识设置为用于指示对应的帐号未对所述第一媒体资源执行所述目标行为;
将具有对应关系的帐号标识、媒体资源标识、曝光时间、行为时间和行为标识确定为所述目标记录表。
可选地,所述调整模块包括:
获取单元,用于根据所述曝光数据日志和所述行为数据日志获取第一参数和第二参数,其中,所述初始行为偏好为所述第一参数和所述第二参数的比值;
第三确定单元,用于根据所述调整参数确定行为调整度和曝光调整度,其中,所述行为调整度用于指示所述帐号对所述第一媒体资源执行所述目标行为的程度,所述曝光调整度用于指示向所述帐号曝光所述第一媒体资源的程度;
调整单元,用于使用所述行为调整度对所述第一参数进行调整得到第一调整参数,并使用所述曝光调整度对所述第二参数进行调整得到第二调整参数;
第四确定单元,用于将所述第一调整参数与所述第二调整参数的比值确定为所述目标行为偏好。
可选地,所述获取单元包括:
第一确定子单元,用于确定所述帐号是否点击所述第一媒体资源服从伯努利分布Ber(r),其中,r为所述伯努利分布的参数;
第二确定子单元,用于确定所述伯努利分布的参数r服从贝塔分布Beta(a,b),其中,a和b为所述贝塔分布的参数;
估计子单元,用于根据所述曝光数据日志和所述行为数据日志估计所述贝塔分布的参数a和b;
第三确定子单元,用于将a确定为所述第一参数,a+b确定为所述第二参数。
可选地,其特征在于,所述装置还包括:
筛选模块,用于在使用所述调整参数对初始行为偏好进行调整,得到所述帐号对应的目标行为偏好之后,从所述帐号筛选出所述目标行为偏好满足行为偏好条件的目标帐号;
推送模块,用于向所述目标帐号推送第二媒体资源。
可选地,所述筛选模块包括:
第五确定单元,用于根据所述曝光数据日志和所述行为数据日志确定裂变参数,其中,所述裂变参数用于指示所述帐号之间的裂变信息;
第六确定单元,用于根据所述裂变参数和所述帐号行为偏好确定筛选参数,其中,所述筛选参数与所述裂变参数正相关且所述筛选参数与所述帐号行为偏好正相关;
筛选单元,用于从所述帐号中筛选出所述筛选参数高于目标筛选阈值的帐号作为所述目标帐号。
根据本申请实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的方法。
根据本申请实施例的另一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器通过计算机程序执行上述的方法。
在本申请实施例中,采用从媒体资源页面获取第一媒体资源的曝光数据日志和行为数据日志,其中,曝光数据日志记录了用于指示向帐号展示第一媒体资源的数据,行为数据日志记录了用于指示帐号对第一媒体资源执行目标行为的数据;根据曝光数据日志和行为数据日志确定调整参数,其中,调整参数用于指示帐号行为偏好的影响因素对帐号行为偏好的影响度;使用调整参数对初始行为偏好进行调整,得到帐号对应的目标行为偏好的方式,通过对曝光数据和行为数据的整合统计,得到能够影响帐号行为偏好的调整参数,通过调整参数对初始帐号行为偏好进行调整,达到了得到准确度更高的目标行为偏好的目的,从而实现了提高对帐号行为偏好进行确定的准确率的技术效果,进而解决了对帐号行为偏好进行确定的准确率较低的技术问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请实施例的帐号行为偏好的确定方法的硬件环境的示意图;
图2是根据本申请实施例的一种可选的帐号行为偏好的确定方法的流程图;
图3是根据本申请实施例的帐号裂变关系的示意图;
图4是根据本申请可选实施例的一种分享偏好评分的确定方法的流程图;
图5是根据本申请实施例的一种可选的帐号行为偏好的确定装置的示意图;
以及
图6是根据本申请实施例的一种终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例的一方面,提供了一种帐号行为偏好的确定的方法实施例。
可选地,在本实施例中,上述帐号行为偏好的确定方法可以应用于如图1所示的由终端101和服务器103所构成的硬件环境中。如图1所示,服务器103通过网络与终端101进行连接,可用于为终端或终端上安装的客户端提供服务(如游戏服务、应用服务等),可在服务器上或独立于服务器设置数据库,用于为服务器103提供数据存储服务,上述网络包括但不限于:广域网、城域网或局域网,终端101并不限定于PC、手机、平板电脑等。本申请实施例的帐号行为偏好的确定方法可以由服务器103来执行,也可以由终端101来执行,还可以是由服务器103和终端101共同执行。其中,终端101执行本申请实施例的帐号行为偏好的确定方法也可以是由安装在其上的客户端来执行。
图2是根据本申请实施例的一种可选的帐号行为偏好的确定方法的流程图,如图2所示,该方法可以包括以下步骤:
步骤S202,从媒体资源页面获取第一媒体资源的曝光数据日志和行为数据日志,其中,所述曝光数据日志记录了用于指示向帐号展示所述第一媒体资源的数据,所述行为数据日志记录了用于指示所述帐号对所述第一媒体资源执行目标行为的数据;
步骤S204,根据所述曝光数据日志和所述行为数据日志确定调整参数,其中,所述调整参数用于指示帐号行为偏好的影响因素对所述帐号行为偏好的影响度;
步骤S206,使用所述调整参数对初始行为偏好进行调整,得到所述帐号对应的目标行为偏好。
通过上述步骤S202至步骤S206,采用从媒体资源页面获取第一媒体资源的曝光数据日志和行为数据日志,其中,曝光数据日志记录了用于指示向帐号展示第一媒体资源的数据,行为数据日志记录了用于指示帐号对第一媒体资源执行目标行为的数据;根据曝光数据日志和行为数据日志确定调整参数,其中,调整参数用于指示帐号行为偏好的影响因素对帐号行为偏好的影响度;使用调整参数对初始行为偏好进行调整,得到帐号对应的目标行为偏好的方式,通过对曝光数据和行为数据的整合统计,得到能够影响帐号行为偏好的调整参数,通过调整参数对初始帐号行为偏好进行调整,达到了得到准确度更高的目标行为偏好的目的,从而实现了提高对帐号行为偏好进行确定的准确率的技术效果,进而解决了对帐号行为偏好进行确定的准确率较低的技术问题。
在步骤S202提供的技术方案中,第一媒体资源泛指用于进行行为偏好评分的活动,不限于活动页面,也可以是视频,音频,链接,文件,小程序,公众号等等。第一媒体资源可以但不限于包括一个或者多个媒体资源。
可选地,在本实施例中,目标行为可以但不限于包括各种用户操作行为,比如:分享、收藏、点击、评论、点赞等等行为。
可选地,在本实施例中,曝光数据日志记录了用于指示向帐号展示第一媒体资源的数据,行为数据日志记录了用于指示帐号对第一媒体资源执行目标行为的数据。曝光数据日志和行为数据日志可以但不限于是通过前端第一媒体资源页面埋点上报获取到的日志。
在步骤S204提供的技术方案中,调整参数用于指示帐号行为偏好的影响因素对帐号行为偏好的影响度。比如:上述调整参数可以但不限于包括:活动权重,曝光次数,分享次数,时间衰退因子等等。
在步骤S206提供的技术方案中,得到的目标行为偏好可以但不限于用于对帐号进行分类,筛选,其他媒体资源的推广等等。
可选地,在本实施例中,初始行为偏好可以但不限于通过平均分享次数与平均曝光次数的比值来确定。或者也可以通过贝叶斯平滑因子来确定。
作为一种可选的实施例,根据所述曝光数据日志和所述行为数据日志确定调整参数包括:
S11,根据所述曝光数据日志和所述行为数据日志确定所述第一媒体资源的资源特征,其中,所述资源特征用于指示所述第一媒体资源的传播度;
S12,根据所述资源特征确定所述第一媒体资源的资源权重,其中,所述调整参数包括所述资源权重。
可选地,在本实施例中,为每个第一媒体资源确定其对应的资源权重,用来表示每个第一媒体资源的重要程度,推广程度,传播程度等信息。
可选地,在本实施例中,可以但不限于通过以下方式确定资源权重Wi,
其中,k表示资源权重的影响因子(即第一媒体资源的资源特征),可以包括:资源时长、参与人数和分享人数等等。i表示每个第一媒体资源。Vki为影响因子的取值。i至n是全部的第一媒体资源。此外,资源权重也可以通过配置方式实现。
作为一种可选的实施例,根据所述曝光数据日志和所述行为数据日志确定调整参数还包括:
S21,从所述曝光数据日志和所述行为数据日志中统计所述调整参数,其中,所述调整参数包括:曝光次数、行为次数、第一时间衰减因子和第二时间衰减因子,所述曝光次数用于指示所述第一媒体资源在传播期间内的被展示的次数,所述行为次数用于指示所述第一媒体资源在所述传播期间内被执行所述目标行为的次数,所述第一时间衰减因子用于指示所述第一媒体资源的曝光时间与当前时间之间的关系,所述第二时间衰减因子用于指示所述第一媒体资源的行为时间与当前时间之间的关系。
可选地,在本实施例中,每个媒体资源中用户的行为次数和媒体资源的时间对用户的评分也有影响。比如:调整参数还可以包括:曝光次数、行为次数、第一时间衰减因子和第二时间衰减因子,曝光次数用于指示第一媒体资源在传播期间内的被展示的次数,行为次数用于指示第一媒体资源在传播期间内被执行目标行为的次数,第一时间衰减因子用于指示第一媒体资源的曝光时间与当前时间之间的关系,曝光时间与当前时间距离越近,第一时间衰减因子越大,第二时间衰减因子用于指示第一媒体资源的行为时间与当前时间之间的关系,行为时间与当前时间距离越近,第二时间衰减因子越大。
可选地,在本实施例中,时间衰退因子考虑的是曝光、分享行为在不同时间段反应出用户不同的偏好,距离当前越近的日期,曝光、分享的权重越大,反之,越早的历史曝光、分享行为,权重越小。也就是说,距离当前时间越近的曝光或者分享对于帐号行为偏好的影响越大。
作为一种可选的实施例,从所述曝光数据日志和所述行为数据日志中统计所述调整参数包括:
S31,从所述曝光数据日志中提取曝光数据,其中,所述曝光数据用于记录具有对应关系的帐号标识、媒体资源标识和曝光时间,所述曝光时间用于指示向所述帐号展示所述第一媒体资源的时间;
S32,从所述行为数据日志中提取行为数据,其中,所述行为数据用于记录具有对应关系的帐号标识、媒体资源标识、行为时间和行为标识,所述行为时间用于指示所述帐号对所述第一媒体资源执行所述目标行为的时间,所述行为标识用于指示所述帐号是否对所述第一媒体资源执行了所述目标行为;
S33,将所述曝光数据和所述行为数据合并,生成目标记录表,其中,所述目标记录表用于记录具有对应关系的帐号标识、媒体资源标识、曝光时间、行为时间和行为标识;
S34,从所述目标记录表中统计所述曝光次数、所述行为次数、所述第一时间衰减因子、所述第二时间衰减因子以及所述资源特征,其中,所述资源特征包括:媒体资源时长,参与数量和行为数量,所述媒体资源时长用于指示所述第一媒体资源的持续时长,所述参与数量用于指示参与所述第一媒体资源的帐号数,所述行为数量用于指示对所述第一媒体资源执行所述目标行为的帐号数。
可选地,在本实施例中,通过从日志中提取帐号的曝光数据(包括帐号ID(即帐号标志),活动ID(即媒体资源标识),曝光时间)和行为数据(包括帐号ID,活动ID,是否执行目标行为(即行为标识),行为时间)并对其进行合并处理,来生成目标记录表,该生成目标记录表中可以但不限于包括以下字段:帐号ID,活动ID,曝光时间,行为时间,是否执行目标行为。为了记录得更加清晰,目标记录表还可以进行分区,比如:按时间分区存储,按媒体资源分区存储等等。比如:分区为天,则目标记录表可以进行每天的增量更新。
可选地,在本实施例中,可以但不限于采用键值对的形式来记录曝光数据、行为数据和目标记录表,其中,帐号标识可以作为关键字,其他数据作为关键字的对应值。
可选地,在本实施例中,可以但不限于通过以下方式提取曝光数据:
S311,统计所述曝光数据日志中所包括的互不相同的帐号标识;
S312,从所述曝光数据日志中查找所述互不相同的帐号标识中每个帐号标识对应的媒体资源标识和每个媒体资源标识对应的曝光时间;
S313,以帐号标识为关键字,媒体资源标识和曝光时间为关键字的对应值,建立帐号标识、媒体资源标识和曝光时间之间的对应关系,得到所述曝光数据。
在一个可选的实施方式中,曝光数据日志中可以是以曝光时间为顺序记录了帐号标识和媒体资源标识,如表1所示,可以按照帐号标识来统计对各个帐号曝光的活动以及曝光时间。
表1
可选地,在本实施例中,可以但不限于通过以下方式提取行为数据:
S321,统计所述行为数据日志中所包括的互不相同的帐号标识;
S322,从所述行为数据日志中查找所述互不相同的帐号标识中每个帐号标识对应的媒体资源标识和每个媒体资源标识对应的行为时间和行为标识;
S323,以帐号标识为关键字,媒体资源标识、行为时间和行为标识为关键字的对应值,建立帐号标识、媒体资源标识、行为时间和行为标识之间的对应关系,得到所述行为数据。
在上述可选的实施方式中,以分享行为为例,行为数据日志中可以是以分享时间为顺序记录了帐号标识、媒体资源标识和分享标识,如表2所示,可以按照帐号标识来统计对各个帐号分享的活动、分享时间以及分享标识。
表2
可选地,在本实施例中,可以但不限于通过以下方式合并曝光数据和行为数据:
S331,按照帐号标识以及媒体资源标识将所述行为数据中记录的行为时间和行为标识添加到所述曝光数据记录的具有对应关系的帐号标识、媒体资源标识和曝光时间中;
S332,将所述行为数据中未记录的帐号标识以及媒体资源标识所对应的行为时间设置为空,将行为时间设置为空的行为标识设置为用于指示对应的帐号未对所述第一媒体资源执行所述目标行为;
S333,将具有对应关系的帐号标识、媒体资源标识、曝光时间、行为时间和行为标识确定为所述目标记录表。
在上述可选的实施方式中,将上述表1和表2进行合并,即可得到如表3所示的目标记录表。
表3
其中,分享标识为0代表未执行分享行为,分享标识为1代表执行了分享行为。
作为一种可选的实施例,使用所述调整参数对所述初始行为偏好进行调整,得到所述帐号对应的目标行为偏好包括:
S41,根据所述曝光数据日志和所述行为数据日志获取第一参数和第二参数,其中,所述初始行为偏好为所述第一参数和所述第二参数的比值;
S42,根据所述调整参数确定行为调整度和曝光调整度,其中,所述行为调整度用于指示所述帐号对所述第一媒体资源执行所述目标行为的程度,所述曝光调整度用于指示向所述帐号曝光所述第一媒体资源的程度;
S43,使用所述行为调整度对所述第一参数进行调整得到第一调整参数,并使用所述曝光调整度对所述第二参数进行调整得到第二调整参数;
S44,将所述第一调整参数与所述第二调整参数的比值确定为所述目标行为偏好。
可选地,在本实施例中,初始行为偏好可以但不限于包括平均分享次数与平均曝光次数的比值,即平均分享次数为第一参数,平均曝光次数为第二参数。
可选地,在本实施例中,平均分享次数与平均曝光次数可以但不限于通过从曝光数据日志和行为数据日志中统计历史数据来确定。平均分享次数=活动分享总次数/活动分享用户数,平均曝光次数=活动曝光总次数/活动曝光用户数。
可选地,在本实施例中,曝光调整度用于指示向帐号曝光第一媒体资源的程度。比如:以分享活动链接为例,曝光调整度Q可以但不限于用以下公式确定,Q=∑iWi×Ei×T1i,其中,i表示每个活动链接,Wi表示每个活动的权重,Ei表示每个活动的分享次数,T1i表示每个活动的第一时间衰减因子。
可选地,在本实施例中,行为调整度用于指示帐号对第一媒体资源执行目标行为的程度。比如:以分享活动链接为例,行为调整度P可以但不限于用以下公式确定,P=∑iWi×Ni×T2i,其中,i表示每个活动链接,Wi表示每个活动的权重,Ni表示每个活动的分享次数,T2i表示每个活动的第二时间衰减因子。
作为一种可选的实施例,根据所述曝光数据日志和所述行为数据日志获取所述第一参数和所述第二参数包括:
S51,确定所述帐号是否点击所述第一媒体资源服从伯努利分布Ber(r),其中,r为所述伯努利分布的参数;
S52,确定所述伯努利分布的参数r服从贝塔分布Beta(a,b),其中,a和b为所述贝塔分布的参数;
S53,根据所述曝光数据日志和所述行为数据日志估计所述贝塔分布的参数a和b;
S54,将a确定为所述第一参数,a+b确定为所述第二参数。
可选地,在本实施例中,可以但不限于通过贝叶斯平滑因子实现初始行为偏好的调整,用户是否点击服从伯努利分布Ber(r),r服从Beta分布B(a,b),根据历史行为可估计出Beta(a,b)的参数a、b,则初始行为偏好如下:
可选地,在本实施例中,贝叶斯平滑是基于贝叶斯统计推断,预设一个经验初始值,再通过当前的点击量和曝光量来修正这个初始值的过程。伯努利分布亦称“零一分布”、“两点分布”。称随机变量X有伯努利分布,参数为p(0<p<1),如果它分别以概率p和1-p取1和0为值。贝塔分布也称Beta分布,是指一组定义在区间的连续概率分布,有两个参数a、b,作为伯努利分布和二项式分布的共轭先验分布的密度函数。
作为一种可选的实施例,在使用所述调整参数对初始行为偏好进行调整,得到所述帐号对应的目标行为偏好之后,所述方法还包括:
S61,从所述帐号筛选出所述目标行为偏好满足行为偏好条件的目标帐号;
S62,向所述目标帐号推送第二媒体资源。
可选地,在本实施例中,得到的目标行为偏好可以用于筛选目标帐号作为种子用户来进行其他媒体资源的推广。
可选地,在本实施例中,种子用户能够给产品传播、迭代和收入带来受益的,在初始用户中筛选出来的具有高活跃、有影响力的用户群体。在社交裂变活动中种子用户具有一定的意见领袖性质,乐于分享的同时能够扩散带来更多的用户加入。
可选地,在本实施例中,偏好条件可以但不限于包括:目标行为偏好高于某值,目标行为偏好落入某区间内等等能够筛选出某一类型的特定帐号的条件。
作为一种可选的实施例,从所述帐号筛选出所述目标行为偏好满足行为偏好条件的目标帐号包括:
S71,根据所述曝光数据日志和所述行为数据日志确定裂变参数,其中,所述裂变参数用于指示所述帐号之间的裂变信息;
S72,根据所述裂变参数和所述帐号行为偏好确定筛选参数,其中,所述筛选参数与所述裂变参数正相关且所述筛选参数与所述帐号行为偏好正相关;
S73,从所述帐号中筛选出所述筛选参数高于目标筛选阈值的帐号作为所述目标帐号。
可选地,在本实施例中,还可以加入帐号之间裂变关系的因素来筛选种子用户。
可选地,在本实施例中,可以通过统计出帐号分享交互行为表记录帐号分享后裂变帐号的交互行为,主要字段可以但不限于包括:分享帐号ID,活动ID,分享时间,裂变帐号ID,分区。此表分区可以为天,每天增量更新。
可选地,在本实施例中,图3是根据本申请实施例的帐号裂变关系的示意图,如图3所示,根据帐号分享偏好评分表和帐号分享交互行为表可得到帐号分享裂变数据(帐号分享偏好评分表为评分计算后得到的;帐号分享交互行为表来自活动分享日志,记录帐号分享该活动后,为活动带来了多少新增帐号,带来帐号越多,传递层级越多,帐号价值越高),在计算上考虑分裂用户的二次裂变因素,以加总求和方式作为帐号裂变效果(即上述筛选参数)的衡量指标,对每个帐号的裂变效果进行排序,从而获取高裂变价值的帐号作为种子用户包。裂变效果评估指标S通过如下公式计算:
其中,i为每个活动,Scorei为每个活动的帐号行为偏好,Ni为每个活动的裂变次数。
本申请还提供了一种可选实施例,该可选实施例提供了一种分享偏好评分的确定方式,图4是根据本申请可选实施例的一种分享偏好评分的确定方法的流程图,如图4所示,整个流程分为数据收集、数据ETL处理、评分计算、种子用户生成四个环节。
在数据收集过程中,前端通过埋点上报各个活动页面的曝光和分享日志,通过统一收集模块,将前端日志格式化处理后,接入大数据平台(Hive)。
在数据ETL处理过程中,通过对上述曝光和分享日志的ETL处理,处理过程可以但不限于包括格式统一、字段解析、数据清洗、多表关联等,生成曝光-分享记录表和用户分享交互行为表,作为后续模块的输入数据。
在评分计算过程中,基于曝光-分享记录表,通过统计分析,生成评分计算的输入数据,包括每个活动的权重值(资源权重)、每个用户的分享意愿评分初始值(初始行为偏好)、根据曝光和分享时间计算得出第一时间衰减因子和第二时间衰减因子对评分初始值进行调整,根据以上输入数据计算每个用户的分享偏好评分。
在种子用户生成的过程中,对参与分享活动的用户,可通过日志获取该用户拉来的新用户数据(裂变),生成用户分享交互行为表,结合用户的分享偏好评分和裂变效率(拉新用户数)等指标,对分享用户进行排序,获取高质量用户作为种子用户,后续新活动可重点运营种子用户。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
根据本申请实施例的另一个方面,还提供了一种用于实施上述帐号行为偏好的确定方法的帐号行为偏好的确定装置。图5是根据本申请实施例的一种可选的帐号行为偏好的确定装置的示意图,如图5所示,该装置可以包括:
获取模块52,用于从媒体资源页面获取第一媒体资源的曝光数据日志和行为数据日志,其中,所述曝光数据日志记录了用于指示向帐号展示所述第一媒体资源的数据,所述行为数据日志记录了用于指示所述帐号对所述第一媒体资源执行目标行为的数据;
确定模块54,用于根据所述曝光数据日志和所述行为数据日志确定调整参数,其中,所述调整参数用于指示帐号行为偏好的影响因素对所述帐号行为偏好的影响度;
调整模块56,用于使用所述调整参数对初始行为偏好进行调整,得到所述帐号对应的目标行为偏好。
需要说明的是,该实施例中的获取模块52可以用于执行本申请实施例中的步骤S202,该实施例中的确定模块54可以用于执行本申请实施例中的步骤S204,该实施例中的调整模块56可以用于执行本申请实施例中的步骤S206。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。
通过上述模块,通过对曝光数据和行为数据的整合统计,得到能够影响帐号行为偏好的调整参数,通过调整参数对初始帐号行为偏好进行调整,达到了得到准确度更高的目标行为偏好的目的,从而实现了提高对帐号行为偏好进行确定的准确率的技术效果,进而解决了对帐号行为偏好进行确定的准确率较低的技术问题。
作为一种可选的实施例,所述确定模块包括:
第一确定单元,用于根据所述曝光数据日志和所述行为数据日志确定所述第一媒体资源的资源特征,其中,所述资源特征用于指示所述第一媒体资源的传播度;
第二确定单元,用于根据所述资源特征确定所述第一媒体资源的资源权重,其中,所述调整参数包括所述资源权重。
作为一种可选的实施例,所述确定模块还包括:
第一统计单元,用于从所述曝光数据日志和所述行为数据日志中统计所述调整参数,其中,所述调整参数包括:曝光次数、行为次数、第一时间衰减因子和第二时间衰减因子,所述曝光次数用于指示所述第一媒体资源在传播期间内的被展示的次数,所述行为次数用于指示所述第一媒体资源在所述传播期间内被执行所述目标行为的次数,所述第一时间衰减因子用于指示所述第一媒体资源的曝光时间与当前时间之间的关系,所述第二时间衰减因子用于指示所述第一媒体资源的行为时间与当前时间之间的关系。
作为一种可选的实施例,所述第一统计单元包括:
第一提取子单元,用于从所述曝光数据日志中提取曝光数据,其中,所述曝光数据用于记录具有对应关系的帐号标识、媒体资源标识和曝光时间,所述曝光时间用于指示向所述帐号展示所述第一媒体资源的时间;
第二提取子单元,用于从所述行为数据日志中提取行为数据,其中,所述行为数据用于记录具有对应关系的帐号标识、媒体资源标识、行为时间和行为标识,所述行为时间用于指示所述帐号对所述第一媒体资源执行所述目标行为的时间,所述行为标识用于指示所述帐号是否对所述第一媒体资源执行了所述目标行为;
合并子单元,用于将所述曝光数据和所述行为数据合并,生成目标记录表,其中,所述目标记录表用于记录具有对应关系的帐号标识、媒体资源标识、曝光时间、行为时间和行为标识;
统计子单元,用于从所述目标记录表中统计所述曝光次数、所述行为次数、所述第一时间衰减因子、所述第二时间衰减因子以及所述资源特征,其中,所述资源特征包括:媒体资源时长,参与数量和行为数量,所述媒体资源时长用于指示所述第一媒体资源的持续时长,所述参与数量用于指示参与所述第一媒体资源的帐号数,所述行为数量用于指示对所述第一媒体资源执行所述目标行为的帐号数。
可选地,所述第一提取子单元用于:
统计所述曝光数据日志中所包括的互不相同的帐号标识;
从所述曝光数据日志中查找所述互不相同的帐号标识中每个帐号标识对应的媒体资源标识和每个媒体资源标识对应的曝光时间;
以帐号标识为关键字,媒体资源标识和曝光时间为关键字的对应值,建立帐号标识、媒体资源标识和曝光时间之间的对应关系,得到所述曝光数据。
可选地,所述第二提取子单元用于:
统计所述行为数据日志中所包括的互不相同的帐号标识;
从所述行为数据日志中查找所述互不相同的帐号标识中每个帐号标识对应的媒体资源标识和每个媒体资源标识对应的行为时间和行为标识;
以帐号标识为关键字,媒体资源标识、行为时间和行为标识为关键字的对应值,建立帐号标识、媒体资源标识、行为时间和行为标识之间的对应关系,得到所述行为数据。
可选地,所述合并子单元用于:
按照帐号标识以及媒体资源标识将所述行为数据中记录的行为时间和行为标识添加到所述曝光数据记录的具有对应关系的帐号标识、媒体资源标识和曝光时间中;
将所述行为数据中未记录的帐号标识以及媒体资源标识所对应的行为时间设置为空,将行为时间设置为空的行为标识设置为用于指示对应的帐号未对所述第一媒体资源执行所述目标行为;
将具有对应关系的帐号标识、媒体资源标识、曝光时间、行为时间和行为标识确定为所述目标记录表。
作为一种可选的实施例,所述调整模块包括:
获取单元,用于根据所述曝光数据日志和所述行为数据日志获取第一参数和第二参数,其中,所述初始行为偏好为所述第一参数和所述第二参数的比值;
第三确定单元,用于根据所述调整参数确定行为调整度和曝光调整度,其中,所述行为调整度用于指示所述帐号对所述第一媒体资源执行所述目标行为的程度,所述曝光调整度用于指示向所述帐号曝光所述第一媒体资源的程度;
调整单元,用于使用所述行为调整度对所述第一参数进行调整得到第一调整参数,并使用所述曝光调整度对所述第二参数进行调整得到第二调整参数;
第四确定单元,用于将所述第一调整参数与所述第二调整参数的比值确定为所述目标行为偏好。
作为一种可选的实施例,所述获取单元包括:
第一确定子单元,用于确定所述帐号是否点击所述第一媒体资源服从伯努利分布Ber(r),其中,r为所述伯努利分布的参数;
第二确定子单元,用于确定所述伯努利分布的参数r服从贝塔分布Beta(a,b),其中,a和b为所述贝塔分布的参数;
估计子单元,用于根据所述曝光数据日志和所述行为数据日志估计所述贝塔分布的参数a和b;
第三确定子单元,用于将a确定为所述第一参数,a+b确定为所述第二参数。
作为一种可选的实施例,所述装置还包括:
筛选模块,用于在使用所述调整参数对初始行为偏好进行调整,得到所述帐号对应的目标行为偏好之后,从所述帐号筛选出所述目标行为偏好满足行为偏好条件的目标帐号;
推送模块,用于向所述目标帐号推送第二媒体资源。
作为一种可选的实施例,所述筛选模块包括:
第五确定单元,用于根据所述曝光数据日志和所述行为数据日志确定裂变参数,其中,所述裂变参数用于指示所述帐号之间的裂变信息;
第六确定单元,用于根据所述裂变参数和所述帐号行为偏好确定筛选参数,其中,所述筛选参数与所述裂变参数正相关且所述筛选参数与所述帐号行为偏好正相关;
筛选单元,用于从所述帐号中筛选出所述筛选参数高于目标筛选阈值的帐号作为所述目标帐号。
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现,其中,硬件环境包括网络环境。
根据本申请实施例的另一个方面,还提供了一种用于实施上述帐号行为偏好的确定方法的服务器或终端。
图6是根据本申请实施例的一种终端的结构框图,如图6所示,该终端可以包括:一个或多个(图中仅示出一个)处理器601、存储器603、以及传输装置605,如图6所示,该终端还可以包括输入输出设备607。
其中,存储器603可用于存储软件程序以及模块,如本申请实施例中的帐号行为偏好的确定方法和装置对应的程序指令/模块,处理器601通过运行存储在存储器603内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的帐号行为偏好的确定方法。存储器603可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器603可进一步包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述的传输装置605用于经由一个网络接收或者发送数据,还可以用于处理器与存储器之间的数据传输。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置605包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置605为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
其中,具体地,存储器603用于存储应用程序。
处理器601可以通过传输装置605调用存储器603存储的应用程序,以执行下述步骤:
S1,从媒体资源页面获取第一媒体资源的曝光数据日志和行为数据日志,其中,所述曝光数据日志记录了用于指示向帐号展示所述第一媒体资源的数据,所述行为数据日志记录了用于指示所述帐号对所述第一媒体资源执行目标行为的数据;
S2,根据所述曝光数据日志和所述行为数据日志确定调整参数,其中,所述调整参数用于指示帐号行为偏好的影响因素对所述帐号行为偏好的影响度;
S3,使用所述调整参数对初始行为偏好进行调整,得到所述帐号对应的目标行为偏好。
采用本申请实施例,提供了一种帐号行为偏好的确定的方案。通过对曝光数据和行为数据的整合统计,得到能够影响帐号行为偏好的调整参数,通过调整参数对初始帐号行为偏好进行调整,达到了得到准确度更高的目标行为偏好的目的,从而实现了提高对帐号行为偏好进行确定的准确率的技术效果,进而解决了对帐号行为偏好进行确定的准确率较低的技术问题。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
本领域普通技术人员可以理解,图6所示的结构仅为示意,终端可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile InternetDevices,MID)、PAD等终端设备。图6其并不对上述电子装置的结构造成限定。例如,终端还可包括比图6中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图6所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
本申请的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行帐号行为偏好的确定方法的程序代码。
可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
S1,从媒体资源页面获取第一媒体资源的曝光数据日志和行为数据日志,其中,所述曝光数据日志记录了用于指示向帐号展示所述第一媒体资源的数据,所述行为数据日志记录了用于指示所述帐号对所述第一媒体资源执行目标行为的数据;
S2,根据所述曝光数据日志和所述行为数据日志确定调整参数,其中,所述调整参数用于指示帐号行为偏好的影响因素对所述帐号行为偏好的影响度;
S3,使用所述调整参数对初始行为偏好进行调整,得到所述帐号对应的目标行为偏好。
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (14)
1.一种帐号行为偏好的确定方法,其特征在于,包括:
从媒体资源页面获取第一媒体资源的曝光数据日志和行为数据日志,其中,所述曝光数据日志记录了用于指示向帐号展示所述第一媒体资源的数据,所述行为数据日志记录了用于指示所述帐号对所述第一媒体资源执行目标行为的数据;
根据所述曝光数据日志和所述行为数据日志确定调整参数,其中,所述调整参数用于指示帐号行为偏好的影响因素对所述帐号行为偏好的影响度;
使用所述调整参数对初始行为偏好进行调整,得到所述帐号对应的目标行为偏好。
2.根据权利要求1所述的方法,其特征在于,根据所述曝光数据日志和所述行为数据日志确定调整参数包括:
根据所述曝光数据日志和所述行为数据日志确定所述第一媒体资源的资源特征,其中,所述资源特征用于指示所述第一媒体资源的传播度;
根据所述资源特征确定所述第一媒体资源的资源权重,其中,所述调整参数包括所述资源权重。
3.根据权利要求2所述的方法,其特征在于,根据所述曝光数据日志和所述行为数据日志确定调整参数还包括:
从所述曝光数据日志和所述行为数据日志中统计所述调整参数,其中,所述调整参数包括:曝光次数、行为次数、第一时间衰减因子和第二时间衰减因子,所述曝光次数用于指示所述第一媒体资源在传播期间内的被展示的次数,所述行为次数用于指示所述第一媒体资源在所述传播期间内被执行所述目标行为的次数,所述第一时间衰减因子用于指示所述第一媒体资源的曝光时间与当前时间之间的关系,所述第二时间衰减因子用于指示所述第一媒体资源的行为时间与当前时间之间的关系。
4.根据权利要求3所述的方法,其特征在于,从所述曝光数据日志和所述行为数据日志中统计所述调整参数包括:
从所述曝光数据日志中提取曝光数据,其中,所述曝光数据用于记录具有对应关系的帐号标识、媒体资源标识和曝光时间,所述曝光时间用于指示向所述帐号展示所述第一媒体资源的时间;
从所述行为数据日志中提取行为数据,其中,所述行为数据用于记录具有对应关系的帐号标识、媒体资源标识、行为时间和行为标识,所述行为时间用于指示所述帐号对所述第一媒体资源执行所述目标行为的时间,所述行为标识用于指示所述帐号是否对所述第一媒体资源执行了所述目标行为;
将所述曝光数据和所述行为数据合并,生成目标记录表,其中,所述目标记录表用于记录具有对应关系的帐号标识、媒体资源标识、曝光时间、行为时间和行为标识;
从所述目标记录表中统计所述曝光次数、所述行为次数、所述第一时间衰减因子、所述第二时间衰减因子以及所述资源特征,其中,所述资源特征包括:媒体资源时长,参与数量和行为数量,所述媒体资源时长用于指示所述第一媒体资源的持续时长,所述参与数量用于指示参与所述第一媒体资源的帐号数,所述行为数量用于指示对所述第一媒体资源执行所述目标行为的帐号数。
5.根据权利要求4所述的方法,其特征在于,从所述曝光数据日志中提取曝光数据包括:
统计所述曝光数据日志中所包括的互不相同的帐号标识;
从所述曝光数据日志中查找所述互不相同的帐号标识中每个帐号标识对应的媒体资源标识和每个媒体资源标识对应的曝光时间;
以帐号标识为关键字,媒体资源标识和曝光时间为关键字的对应值,建立帐号标识、媒体资源标识和曝光时间之间的对应关系,得到所述曝光数据。
6.根据权利要求4所述的方法,其特征在于,从所述行为数据日志中提取行为数据包括:
统计所述行为数据日志中所包括的互不相同的帐号标识;
从所述行为数据日志中查找所述互不相同的帐号标识中每个帐号标识对应的媒体资源标识和每个媒体资源标识对应的行为时间和行为标识;
以帐号标识为关键字,媒体资源标识、行为时间和行为标识为关键字的对应值,建立帐号标识、媒体资源标识、行为时间和行为标识之间的对应关系,得到所述行为数据。
7.根据权利要求4所述的方法,其特征在于,将所述曝光数据和所述行为数据合并,生成目标记录表包括:
按照帐号标识以及媒体资源标识将所述行为数据中记录的行为时间和行为标识添加到所述曝光数据记录的具有对应关系的帐号标识、媒体资源标识和曝光时间中;
将所述行为数据中未记录的帐号标识以及媒体资源标识所对应的行为时间设置为空,将行为时间设置为空的行为标识设置为用于指示对应的帐号未对所述第一媒体资源执行所述目标行为;
将具有对应关系的帐号标识、媒体资源标识、曝光时间、行为时间和行为标识确定为所述目标记录表。
8.根据权利要求1所述的方法,其特征在于,使用所述调整参数对所述初始行为偏好进行调整,得到所述帐号对应的目标行为偏好包括:
根据所述曝光数据日志和所述行为数据日志获取第一参数和第二参数,其中,所述初始行为偏好为所述第一参数和所述第二参数的比值;
根据所述调整参数确定行为调整度和曝光调整度,其中,所述行为调整度用于指示所述帐号对所述第一媒体资源执行所述目标行为的程度,所述曝光调整度用于指示向所述帐号曝光所述第一媒体资源的程度;
使用所述行为调整度对所述第一参数进行调整得到第一调整参数,并使用所述曝光调整度对所述第二参数进行调整得到第二调整参数;
将所述第一调整参数与所述第二调整参数的比值确定为所述目标行为偏好。
9.根据权利要求8所述的方法,其特征在于,根据所述曝光数据日志和所述行为数据日志获取所述第一参数和所述第二参数包括:
确定所述帐号是否点击所述第一媒体资源服从伯努利分布Ber(r),其中,r为所述伯努利分布的参数;
确定所述伯努利分布的参数r服从贝塔分布Beta(a,b),其中,a和b为所述贝塔分布的参数;
根据所述曝光数据日志和所述行为数据日志估计所述贝塔分布的参数a和b;
将a确定为所述第一参数,a+b确定为所述第二参数。
10.根据权利要求1至9中任一项所述的方法,其特征在于,在使用所述调整参数对初始行为偏好进行调整,得到所述帐号对应的目标行为偏好之后,所述方法还包括:
从所述帐号筛选出所述目标行为偏好满足行为偏好条件的目标帐号;
向所述目标帐号推送第二媒体资源。
11.根据权利要求10所述的方法,其特征在于,从所述帐号筛选出所述目标行为偏好满足行为偏好条件的目标帐号包括:
根据所述曝光数据日志和所述行为数据日志确定裂变参数,其中,所述裂变参数用于指示所述帐号之间的裂变信息;
根据所述裂变参数和所述帐号行为偏好确定筛选参数,其中,所述筛选参数与所述裂变参数正相关且所述筛选参数与所述帐号行为偏好正相关;
从所述帐号中筛选出所述筛选参数高于目标筛选阈值的帐号作为所述目标帐号。
12.一种帐号行为偏好的确定装置,其特征在于,包括:
获取模块,用于从媒体资源页面获取第一媒体资源的曝光数据日志和行为数据日志,其中,所述曝光数据日志记录了用于指示向帐号展示所述第一媒体资源的数据,所述行为数据日志记录了用于指示所述帐号对所述第一媒体资源执行目标行为的数据;
确定模块,用于根据所述曝光数据日志和所述行为数据日志确定调整参数,其中,所述调整参数用于指示帐号行为偏好的影响因素对所述帐号行为偏好的影响度;
调整模块,用于使用所述调整参数对初始行为偏好进行调整,得到所述帐号对应的目标行为偏好。
13.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至11任一项中所述的方法。
14.一种电子装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器通过所述计算机程序执行上述权利要求1至11任一项中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911267876.1A CN111159541B (zh) | 2019-12-11 | 2019-12-11 | 一种帐号行为偏好的确定方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911267876.1A CN111159541B (zh) | 2019-12-11 | 2019-12-11 | 一种帐号行为偏好的确定方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111159541A true CN111159541A (zh) | 2020-05-15 |
CN111159541B CN111159541B (zh) | 2023-08-25 |
Family
ID=70556715
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911267876.1A Active CN111159541B (zh) | 2019-12-11 | 2019-12-11 | 一种帐号行为偏好的确定方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111159541B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112000709A (zh) * | 2020-07-17 | 2020-11-27 | 微梦创科网络科技(中国)有限公司 | 一种社交媒体信息的总曝光量批量挖掘方法及装置 |
CN112291297A (zh) * | 2020-09-04 | 2021-01-29 | 腾讯科技(深圳)有限公司 | 资讯数据的处理方法、装置、存储介质以及电子设备 |
CN114237752A (zh) * | 2021-12-20 | 2022-03-25 | 百度在线网络技术(北京)有限公司 | 推送页面的显示方法、装置、电子设备和存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101729856A (zh) * | 2008-10-29 | 2010-06-09 | 索尼株式会社 | 信息处理装置和信息处理方法 |
CN107004004A (zh) * | 2014-09-22 | 2017-08-01 | 汤姆逊许可公司 | 使用深度知觉作为搜索、用户兴趣或偏好的指示符 |
CN107562875A (zh) * | 2017-08-31 | 2018-01-09 | 北京麒麟合盛网络技术有限公司 | 一种模型的更新方法、装置及系统 |
US20190052922A1 (en) * | 2016-06-02 | 2019-02-14 | Tencent Technology (Shenzhen) Company Limited | Method, apparatus, and storage medium for media file delivery |
CN109657138A (zh) * | 2018-12-10 | 2019-04-19 | 深圳墨世科技有限公司 | 一种视频推荐方法、装置、电子设备及存储介质 |
CN109815409A (zh) * | 2019-02-02 | 2019-05-28 | 北京七鑫易维信息技术有限公司 | 一种信息的推送方法、装置、穿戴设备及存储介质 |
CN110490625A (zh) * | 2018-05-11 | 2019-11-22 | 北京京东尚科信息技术有限公司 | 用户偏好确定方法及装置、电子设备、存储介质 |
-
2019
- 2019-12-11 CN CN201911267876.1A patent/CN111159541B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101729856A (zh) * | 2008-10-29 | 2010-06-09 | 索尼株式会社 | 信息处理装置和信息处理方法 |
CN107004004A (zh) * | 2014-09-22 | 2017-08-01 | 汤姆逊许可公司 | 使用深度知觉作为搜索、用户兴趣或偏好的指示符 |
US20190052922A1 (en) * | 2016-06-02 | 2019-02-14 | Tencent Technology (Shenzhen) Company Limited | Method, apparatus, and storage medium for media file delivery |
CN107562875A (zh) * | 2017-08-31 | 2018-01-09 | 北京麒麟合盛网络技术有限公司 | 一种模型的更新方法、装置及系统 |
CN110490625A (zh) * | 2018-05-11 | 2019-11-22 | 北京京东尚科信息技术有限公司 | 用户偏好确定方法及装置、电子设备、存储介质 |
CN109657138A (zh) * | 2018-12-10 | 2019-04-19 | 深圳墨世科技有限公司 | 一种视频推荐方法、装置、电子设备及存储介质 |
CN109815409A (zh) * | 2019-02-02 | 2019-05-28 | 北京七鑫易维信息技术有限公司 | 一种信息的推送方法、装置、穿戴设备及存储介质 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112000709A (zh) * | 2020-07-17 | 2020-11-27 | 微梦创科网络科技(中国)有限公司 | 一种社交媒体信息的总曝光量批量挖掘方法及装置 |
CN112000709B (zh) * | 2020-07-17 | 2023-10-24 | 微梦创科网络科技(中国)有限公司 | 一种社交媒体信息的总曝光量批量挖掘方法及装置 |
CN112291297A (zh) * | 2020-09-04 | 2021-01-29 | 腾讯科技(深圳)有限公司 | 资讯数据的处理方法、装置、存储介质以及电子设备 |
CN114237752A (zh) * | 2021-12-20 | 2022-03-25 | 百度在线网络技术(北京)有限公司 | 推送页面的显示方法、装置、电子设备和存储介质 |
CN114237752B (zh) * | 2021-12-20 | 2023-09-26 | 百度在线网络技术(北京)有限公司 | 推送页面的显示方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111159541B (zh) | 2023-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11714876B1 (en) | Real-time event transcription system and method | |
CN109241425B (zh) | 一种资源推荐方法、装置、设备及存储介质 | |
US20220414600A1 (en) | System and methods for improved meeting engagement | |
CN111159541B (zh) | 一种帐号行为偏好的确定方法及装置 | |
AU2013204865B2 (en) | Methods and apparatus to share online media impressions data | |
WO2018126953A1 (zh) | 种子人群扩散方法、装置、信息投放系统以及存储介质 | |
CN108154379B (zh) | 媒体信息的发布方法和装置 | |
CN108460627A (zh) | 营销活动方案推送方法、装置、计算机设备及存储介质 | |
AU2011202431A1 (en) | Methods, Apparatus, and Articles of Manufacture to Rank Users in an Online Social Network | |
CA2889349A1 (en) | Methods and apparatus to estimate demographics of users employing social media | |
CN108764332A (zh) | 一种渠道质量分析方法、计算设备及存储介质 | |
CN111371672A (zh) | 消息推送方法及装置 | |
CN112070564B (zh) | 广告拉取方法、装置、系统与电子设备 | |
CN109428910A (zh) | 一种数据处理方法、装置及系统 | |
CN103700004A (zh) | 一种微博广告服务信息推送方法及装置 | |
CN114024737B (zh) | 确定直播间刷量的方法、装置及计算机可读存储介质 | |
CN110189092B (zh) | 审核组成员评估方法及装置 | |
CN108066990A (zh) | 一种从候选用户列表中选择用户的方法、装置及服务器 | |
CN109684546A (zh) | 推荐方法、装置、存储介质及终端 | |
CN110232148B (zh) | 项目推荐系统、方法以及装置 | |
CN117237016A (zh) | 广告投放策略的调整方法、装置、计算机设备和存储介质 | |
CN111738754A (zh) | 对象推荐方法及装置、存储介质、计算机设备 | |
CN111612366A (zh) | 渠道质量评估方法、装置、电子设备及存储介质 | |
CN114466214B (zh) | 直播间人数统计方法及装置 | |
GB2517358A (en) | Recommendation creation system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |