CN106296254B - 一种曝光行为数据的管理方法及装置 - Google Patents

一种曝光行为数据的管理方法及装置 Download PDF

Info

Publication number
CN106296254B
CN106296254B CN201510312735.2A CN201510312735A CN106296254B CN 106296254 B CN106296254 B CN 106296254B CN 201510312735 A CN201510312735 A CN 201510312735A CN 106296254 B CN106296254 B CN 106296254B
Authority
CN
China
Prior art keywords
exposure
behavior
target user
data stream
exposure behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510312735.2A
Other languages
English (en)
Other versions
CN106296254A (zh
Inventor
王利
李益群
吕超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201510312735.2A priority Critical patent/CN106296254B/zh
Publication of CN106296254A publication Critical patent/CN106296254A/zh
Application granted granted Critical
Publication of CN106296254B publication Critical patent/CN106296254B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例公开了一种曝光行为数据的管理方法及装置,所述方法包括:实时获取曝光数据流,曝光数据流包括执行曝光行为的用户的用户标识信息及各个用户对应的曝光行为数据;在预设时间段内获取到的曝光数据流中获取各个用户标识信息对应的曝光行为次数;将各个用户标识信息对应的曝光行为次数进行比较,在曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据。采用本发明实施例,可实时处理曝光数据流,提升数据处理效率。

Description

一种曝光行为数据的管理方法及装置
技术领域
本发明涉及计算机应用技术领域,尤其涉及一种曝光行为数据的管理方法及装置。
背景技术
曝光指的是在客户端显示产品,以便让用户查看。点击指的是用户点击客户端显示的产品,客户端显示产品页面。CTR(Click Through Rate,点击率)指的是用户点击客户端显示的产品的概率。其中通过点击次数与曝光次数之间的比例可以得到点击率,曝光次数即在客户端显示产品的次数,点击次数即用户点击客户端显示的产品的次数。用户出于某种恶意目的,存在曝光作弊的行为,例如,卖家为了增加自己的产品被用户搜索到的可能性,将增加竞争对手的曝光次数,而竞争对手的点击次数保持不变,则降低了竞争对手的点击率,以至于在客户端显示竞争对手的产品的几率较低,增加了卖家的产品被用户搜索到的可能性,则该卖家存在曝光行为异常。
曝光反作弊可以对曝光作弊的行为进行打击,曝光反作弊指的是根据曝光行为数据判断是否存在曝光作弊。曝光反作弊方法一般通过离线的方式进行处理,具体的,曝光服务器将曝光行为数据发送给分布式文件系统,离线分析平台批量获取分布式文件系统中的曝光行为数据,对曝光行为数据进行分析处理,判断是否存在曝光作弊,并将分析结果发送给曝光服务器。通过离线的方式对曝光行为数据进行批量处理,实时性不足,数据处理效率较低。
发明内容
本发明实施例所要解决的技术问题在于,提供一种曝光行为数据的管理方法及装置,可实时处理曝光数据流,提升数据处理效率。
为了解决上述技术问题,本发明实施例提供了一种曝光行为数据的管理方法,包括:
实时获取曝光数据流,所述曝光数据流包括执行曝光行为的用户的用户标识信息及各个所述用户对应的曝光行为数据;
在预设时间段内获取到的所述曝光数据流中获取各个所述用户标识信息对应的曝光行为次数;
将各个所述用户标识信息对应的曝光行为次数进行比较,在所述曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据。
相应地,本发明实施例还提供了一种曝光行为数据的管理装置,包括:
数据流获取模块,用于实时获取曝光数据流,所述曝光数据流包括执行曝光行为的用户的用户标识信息及各个所述用户对应的曝光行为数据;
曝光次数获取模块,用于在预设时间段内获取到的所述曝光数据流中获取各个所述用户标识信息对应的曝光行为次数;
曝光数据确定模块,用于将各个所述用户标识信息对应的曝光行为次数进行比较,在所述曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据。
实施本发明实施例,通过实时获取曝光数据流,其中曝光数据流包括执行曝光行为的用户的用户标识信息及各个用户对应的曝光行为数据,在预设时间段内获取到的曝光数据流中获取各个用户标识信息对应的曝光行为次数,将各个用户标识信息对应的曝光行为次数进行比较,在曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据,可实时处理曝光数据流,提升数据处理效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例中提供的一种曝光行为数据的管理方法的流程示意图;
图2是本发明另一实施例中提供的一种曝光行为数据的管理方法的流程示意图;
图3是本发明另一实施例中提供的一种曝光行为数据的管理方法的流程示意图;
图4是本发明实施例中提供的一种曝光行为数据的管理装置的结构示意图;
图5是本发明实施例中提供的一种终端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
现有的曝光行为数据的管理方法中,曝光服务器将曝光行为数据发送给分布式文件系统,离线分析平台批量获取分布式文件系统中的曝光行为数据,对曝光行为数据进行分析处理,判断是否存在曝光作弊,并将分析结果发送给曝光服务器。对曝光行为数据进行批量处理,实时性不足,数据处理效率较低。
本发明实施例提供了一种曝光行为数据的管理方法,通过实时获取曝光数据流,其中曝光数据流包括执行曝光行为的用户的用户标识信息及各个用户对应的曝光行为数据,在预设时间段内获取到的曝光数据流中获取各个用户标识信息对应的曝光行为次数,将各个用户标识信息对应的曝光行为次数进行比较,在曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据,可实时处理曝光数据流,提升数据处理效率。
本发明实施例提及到的用户标识信息可以包括IP(Internet Protocol,网际协议)地址、user-Agent(用户代理,指浏览器或者搜索引擎等,携带硬件平台、系统软件、应用软件和用户个人偏好)或者cookies(指网站为了辨别用户身份、进行session(会话)跟踪而储存在用户本地终端上的数据)等,具体不受本发明实施例的限制。
本发明实施例提及到的曝光行为数据可以包括曝光行为对应的被曝光产品的产品信息、曝光行为对应的访问时间或者曝光行为对应的访问页面等。被曝光产品可以包括图像或者文本等,例如应用软件或者商品等图像。被曝光产品的产品信息可以包括被曝光产品的产品标识信息或者数据量等。
上述曝光行为数据的管理方法可以运行在平板电脑、手机、个人计算机(PersonalComputer,PC)、笔记本电脑、车载设备或网络电视等终端中。
请参见图1,图1是本发明实施例中的一种曝光行为数据的管理方法的流程示意图,如图所示本发明实施例中的曝光行为数据的管理方法可以包括:
S101,实时获取曝光数据流。
终端可以实时获取曝光数据流。其中曝光数据流可以包括:执行曝光行为的用户的用户标识信息及各个用户对应的曝光行为数据。具体实现中,终端可以创建storm框架(流式处理框架),通过storm框架中的接入层实时获取曝光数据流,通过storm框架中的统计层在预设时间段内获取到的曝光数据流中获取各个用户标识信息对应的曝光行为次数,通过storm框架中的聚合层将各个用户标识信息对应的曝光行为次数进行比较,在曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据。本发明实施例通过storm框架可实现对曝光数据流的实时处理。
例如,用户浏览当前网页,当前网页中的产品信息被曝光,则用户执行了曝光行为,执行曝光行为的用户的用户标识信息可以包括:IP地址、user-Agent或者cookie等,用户对应的曝光行为数据可以包括:曝光行为对应的被曝光产品的产品信息、曝光行为对应的访问时间或者曝光行为对应的访问页面等。
在可选实施例中,曝光行为数据可以包括曝光行为对应的被曝光产品的产品信息,则终端实时获取曝光数据流之后,可以在预设时间段内获取到的曝光数据流中获取各个被曝光产品对应的曝光行为次数及其点击行为次数,将各个被曝光产品对应的点击行为次数除以对应的曝光行为次数,获取各个被曝光产品的实时点击率,当目标产品的实时点击率大于预设比例阈值时,在曝光数据流中确定存在曝光行为异常的目标用户曝光的目标产品的目标产品信息。
例如,用户浏览当前网页,当前网页中的产品信息被曝光,被曝光产品的曝光行为次数为一次,用户通过在当前网页中点击目标产品的方式访问目标产品的主页面,目标产品的点击行为次数为一次。预设时间段可以为5s,终端实时获取曝光数据流,在获取到时长为5s的曝光数据流之后,可以在时长为5s的曝光数据流中获取各个被曝光产品对应的曝光行为次数及其点击行为次数,例如第一被曝光产品对应的曝光行为次数为100次,点击行为次数为6次,则第一被曝光产品的实时点击率为6%;第二被曝光产品对应的曝光行为次数为120次,点击行为次数为2次,则第二被曝光产品的实时点击率为1.7%。通过数据表明,曝光行为正常的用户对应的被曝光产品的实时点击率小于5%,则本发明实施例中的预设比例阈值可以为5%,第一被曝光产品的实时点击率大于预设比例阈值,则终端可以确定第一被曝光产品对应的曝光行为存在曝光行为异常,进而在曝光数据流中确定第一被曝光产品的产品信息。
需要指出的是,本发明实施例中的预设时间段包含但不局限于5s,预设比例阈值包含但不局限于5%,研发人员可以结合不同场景进行相应的修改,具体不受本发明实施例的限制。
在可选实施例中,终端可以对曝光行为数据的管理方法进行配置化,即将上述曝光行为数据的管理方法对应的逻辑参数存储到配置文件中,通过获取经过更新的逻辑参数,以实现对上述曝光行为数据的管理方法的更新。例如storm框架包括接入层、统计层和聚合层,终端可以分别将接入层对应的逻辑参数、统计层对应的逻辑参数和聚合层对应的逻辑参数存储到配置文件中,研发人员可以更新配置文件中的逻辑参数,并发布经过更新的逻辑参数,终端通过经过更新的逻辑参数,对上述曝光行为数据的管理方法进行更新。现有的更新曝光行为数据的管理方法的过程中,研发人员需要修改代码,对经过修改的代码进行测试,并发布测试成功的代码,终端根据发布的代码对上述曝光行为数据的管理方法进行更新,更新周期较长。本发明实施例通过修改逻辑参数实现曝光行为数据的管理方法的更新,可缩短更新周期。
S102,在预设时间段内获取到的曝光数据流中获取各个用户标识信息对应的曝光行为次数。
终端实时获取曝光数据流之后,可以在预设时间段内获取到的曝光数据流中获取各个用户标识信息对应的曝光行为次数。
当用户标识信息为IP地址时,以下文所示的表格一为例:
表格一
IP地址 曝光行为次数
101.226.33.218 1
120.68.43.10 1
222.82.44.14 71
60.13.132.236 1
221.7.7.59 2
终端实时获取曝光数据流,在获取到时长为5s的曝光数据流之后,可以在时长为5s的曝光数据流中获取各个IP地址对应的曝光行为次数,例如101.226.33.218对应的曝光行为次数为1次,222.82.44.14对应的曝光行为次数为71次。
S103,将各个用户标识信息对应的曝光行为次数进行比较,在曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据。
终端可以将各个用户标识信息对应的曝光行为次数进行比较,在曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据。以表格一中各个IP地址对应的曝光行为次数为例,终端将各个IP地址对应的曝光行为次数进行比较,得到各个IP地址对应的曝光行为次数普遍为1次,222.82.44.14对应的曝光行为次数为71次,则存在曝光行为异常的目标用户为222.82.44.14,终端可以获取222.82.44.14对应的曝光行为数据。
在可选实施例中,曝光行为数据可以包括曝光行为对应的被曝光产品的产品信息,则终端在曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据之后,可以在目标用户对应的曝光行为数据中获取目标用户曝光各个被曝光产品的曝光行为次数,将目标用户曝光各个被曝光产品的曝光行为次数进行比较,在曝光数据流中确定存在曝光行为异常的目标用户曝光的目标产品的目标产品信息。
例如,终端确定存在曝光行为异常的目标用户为222.82.44.14,并获取222.82.44.14对应的曝光行为数据,其中该曝光行为数据可以以下文所示表格二为例:
表格二
Figure BDA0000734287290000061
终端可以在222.82.44.14对应的曝光行为数据中获取目标用户曝光各个被曝光产品的曝光行为次数,例如网页http://kino.cw.cn/cw.php的曝光行为次数为1次,网页http://www.abc.com的曝光行为次数为67次,终端将各个被曝光产品的曝光行为次数进行比较,得到各个被曝光产品的曝光行为次数普遍为1次,http://www.abc.com的曝光行为次数为67次,则存在曝光行为异常的目标用户曝光的目标产品为http://www.abc.com,终端可以获取http://www.abc.com的产品信息。
在可选实施例中,终端在曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据之后,可以标识目标用户对应的曝光行为数据,并输出经过标识的目标用户对应的曝光行为数据。例如,存在曝光行为异常的目标用户为222.82.44.14,终端可以标识222.82.44.14对应的曝光行为数据,并输出经过标识的222.82.44.14对应的曝光行为数据,可选的,终端还可以输出未标识的曝光行为正常的用户对应的曝光行为数据。
优选的,终端在曝光数据流中确定存在曝光行为异常的目标用户曝光的目标产品的目标产品信息之后,可以标识目标用户曝光的目标产品的目标产品信息,并输出经过标识的目标用户曝光的目标产品的目标产品信息。例如,存在曝光行为异常的目标用户222.82.44.14曝光的目标产品为http://www.abc.com,终端可以标识目标用户222.82.44.14曝光的http://www.abc.com的产品信息,并输出经过标识的222.82.44.14曝光的http://www.abc.com的产品信息,可选的,终端还可以输出未标识的曝光行为正常的用户对应的曝光行为数据以及存在曝光行为异常的目标用户曝光的其他产品的产品信息。
在可选实施例中,终端在曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据之后,可以在曝光数据流中过滤目标用户对应的曝光行为数据,根据经过过滤的曝光数据流,对点击率进行估算。例如,存在曝光行为异常的目标用户为222.82.44.14,终端可以在曝光数据流中过滤222.82.44.14对应的曝光行为数据,进而根据经过过滤的曝光数据流,获取各个被曝光产品对应的曝光行为次数和点击行为次数,将各个被曝光产品对应的点击行为次数除以对应的曝光行为次数,以获取各个被曝光产品的预估点击率。
优选的,终端在曝光数据流中确定存在曝光行为异常的目标用户曝光的目标产品的目标产品信息之后,可以在曝光数据流中过滤目标用户曝光的目标产品的目标产品信息,根据经过过滤的曝光数据流,对点击率进行估算。例如,存在曝光行为异常的目标用户222.82.44.14曝光的目标产品为http://www.abc.com,终端可以在曝光数据流中过滤目标用户222.82.44.14曝光的http://www.abc.com的产品信息,进而根据经过过滤的曝光数据流,对各个被曝光产品的点击率进行估算。
本发明实施例中,实时获取曝光数据流,在预设时间段内获取到的曝光数据流中获取各个用户标识信息对应的曝光行为次数,将各个用户标识信息对应的曝光行为次数进行比较,在曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据,可实时处理曝光数据流,提升数据处理效率。
请参见图2,图2是本发明另一实施例中的曝光行为数据的管理方法的流程示意图,如图所示本发明实施例中的曝光行为数据的管理方法可以包括:
S201,实时获取曝光数据流。具体可以参考前文实施例中的S101,本实施例中不再赘述。
S202,在预设时间段内获取到的曝光数据流中获取各个用户标识信息对应的曝光行为次数。
终端实时获取曝光数据流之后,可以在预设时间段内获取到的曝光数据流中获取各个用户标识信息对应的曝光行为次数。
当用户标识信息为IP地址时,以表格一为例,终端实时获取曝光数据流,在获取到时长为5s的曝光数据流之后,可以在时长为5s的曝光数据流中获取各个IP地址对应的曝光行为次数,例如101.226.33.218对应的曝光行为次数为1次,222.82.44.14对应的曝光行为次数为71次。
S203,将各个用户标识信息对应的曝光行为次数进行比较,在曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据。
终端可以将各个用户标识信息对应的曝光行为次数进行比较,在曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据。以表格一中各个IP地址对应的曝光行为次数为例,终端将各个IP地址对应的曝光行为次数进行比较,得到各个IP地址对应的曝光行为次数普遍为1次,222.82.44.14对应的曝光行为次数为71次,则存在曝光行为异常的目标用户为222.82.44.14,终端可以获取222.82.44.14对应的曝光行为数据。
S204,在目标用户对应的曝光行为数据中获取目标用户曝光各个被曝光产品的曝光行为次数。
终端可以在目标用户对应的曝光行为数据中获取目标用户曝光各个被曝光产品的曝光行为次数。
以表格二为例,终端确定存在曝光行为异常的目标用户为222.82.44.14,并获取222.82.44.14对应的曝光行为数据,终端可以在222.82.44.14对应的曝光行为数据中获取目标用户曝光各个被曝光产品的曝光行为次数,例如网页http://kino.cw.cn/cw.php的曝光行为次数为1次,网页http://www.abc.com的曝光行为次数为67次。
S205,将目标用户曝光各个被曝光产品的曝光行为次数进行比较,在曝光数据流中确定存在曝光行为异常的目标用户曝光的目标产品的目标产品信息。
终端可以将目标用户曝光各个被曝光产品的曝光行为次数进行比较,在曝光数据流中确定存在曝光行为异常的目标用户曝光的目标产品的目标产品信息。以222.82.44.14对应的曝光行为数据为例,终端将各个被曝光产品的曝光行为次数进行比较,得到各个被曝光产品的曝光行为次数普遍为1次,http://www.abc.com的曝光行为次数为67次,则存在曝光行为异常的目标用户曝光的目标产品为http://www.abc.com,终端可以获取http://www.abc.com的产品信息。
本发明实施例中,在预设时间段内获取到的曝光数据流中获取各个用户标识信息对应的曝光行为次数,在曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据,在目标用户对应的曝光行为数据中获取目标用户曝光各个被曝光产品的曝光行为次数,在曝光数据流中确定存在曝光行为异常的目标用户曝光的目标产品的目标产品信息,可实时处理曝光数据流,提升数据处理效率。
请参见图3,图3是本发明另一实施例中的曝光行为数据的管理方法的流程示意图,如图所示本发明实施例中的曝光行为数据的管理方法可以包括:
S301,实时获取曝光数据流。
S302,在预设时间段内获取到的曝光数据流中获取各个被曝光产品对应的曝光行为次数及其点击行为次数。
终端可以在预设时间段内获取到的曝光数据流中获取各个被曝光产品对应的曝光行为次数及其点击行为次数。
例如,用户浏览当前网页,当前网页中的产品信息被曝光,被曝光产品的曝光行为次数为一次,用户通过在当前网页中点击目标产品的方式访问目标产品的主页面,目标产品的点击行为次数为一次。预设时间段可以为5s,终端实时获取曝光数据流,在获取到时长为5s的曝光数据流之后,可以在时长为5s的曝光数据流中获取各个被曝光产品对应的曝光行为次数及其点击行为次数,例如第一被曝光产品对应的曝光行为次数为100次,点击行为次数为6次;第二被曝光产品对应的曝光行为次数为120次,点击行为次数为2次。
S303,将各个被曝光产品对应的点击行为次数除以对应的曝光行为次数,获取各个被曝光产品的实时点击率。
终端可以将各个被曝光产品对应的点击行为次数除以对应的曝光行为次数,获取各个被曝光产品的实时点击率。例如,第一被曝光产品对应的曝光行为次数为100次,点击行为次数为6次,则第一被曝光产品的实时点击率为6%;第二被曝光产品对应的曝光行为次数为120次,点击行为次数为2次,则第二被曝光产品的实时点击率为1.7%。
S304,当目标产品的实时点击率大于预设比例阈值时,在曝光数据流中确定存在曝光行为异常的目标用户曝光的目标产品的目标产品信息。
终端可以判断各个被曝光产品的实时点击率是否大于预设比例阈值,当目标产品的实时点击率大于预设比例阈值时,在曝光数据流中确定存在曝光行为异常的目标用户曝光的目标产品的目标产品信息。
例如,通过数据表明,曝光行为正常的用户对应的被曝光产品的实时点击率小于5%,则本发明实施例中的预设比例阈值可以为5%,第一被曝光产品的实时点击率大于预设比例阈值,则终端可以确定第一被曝光产品对应的曝光行为存在曝光行为异常,进而在曝光数据流中确定第一被曝光产品的产品信息。
S305,标识目标用户对应的曝光行为数据。
终端在曝光数据流中确定存在曝光行为异常的目标用户曝光的目标产品的目标产品信息之后,可以标识目标用户对应的曝光行为数据。例如,存在曝光行为异常的目标用户为222.82.44.14,终端可以标识222.82.44.14对应的曝光行为数据。
在可选实施例中,终端在曝光数据流中确定存在曝光行为异常的目标用户曝光的目标产品的目标产品信息之后,可以标识目标用户曝光的目标产品的目标产品信息。例如,存在曝光行为异常的目标用户222.82.44.14曝光的目标产品为http://www.abc.com,终端可以标识目标用户222.82.44.14曝光的http://www.abc.com的产品信息。
S306,输出经过标识的目标用户对应的曝光行为数据。
终端可以输出经过标识的目标用户对应的曝光行为数据。可选的,终端还可以输出未标识的曝光行为正常的用户对应的曝光行为数据。
在可选实施例中,终端标识目标用户曝光的目标产品的目标产品信息之后,可以输出经过标识的目标用户曝光的目标产品的目标产品信息。可选的,终端还可以输出未标识的曝光行为正常的用户对应的曝光行为数据以及存在曝光行为异常的目标用户曝光的其他产品的产品信息。
本发明实施例中,在预设时间段内获取到的曝光数据流中获取各个被曝光产品对应的曝光行为次数及其点击行为次数,将各个被曝光产品对应的曝光行为次数除以对应的点击行为次数,获取各个被曝光产品的实时点击率,当目标产品的实时点击率大于预设比例阈值时,在曝光数据流中确定存在曝光行为异常的目标用户曝光的目标产品的目标产品信息,标识目标用户对应的曝光行为数据,输出经过标识的目标用户对应的曝光行为数据,可实时处理曝光数据流,提升数据处理效率。
请参见图4,图4是本发明实施例中提供的一种曝光行为数据的管理装置的结构示意图,本发明实施例中的曝光行为数据的管理装置可以包括平板电脑、手机、个人计算机、笔记本电脑、车载设备、网络电视等终端,如图所示本实施例中的曝光行为数据的管理装置至少可以包括数据流获取模块401、曝光次数获取模块402以及曝光数据确定模块403,其中:
数据流获取模块401,用于实时获取曝光数据流,其中曝光数据流可以包括:执行曝光行为的用户的用户标识信息及各个用户对应的曝光行为数据。
例如,用户浏览当前网页,当前网页中的产品信息被曝光,则用户执行了曝光行为,执行曝光行为的用户的用户标识信息可以包括:IP地址、user-Agent或者cookie等,用户对应的曝光行为数据可以包括:曝光行为对应的被曝光产品的产品信息、曝光行为对应的访问时间或者曝光行为对应的访问页面等。
曝光次数获取模块402,用于在预设时间段内获取到的曝光数据流中获取各个用户标识信息对应的曝光行为次数。
当用户标识信息为IP地址时,以表格一为例,数据流获取模块401实时获取曝光数据流,在获取到时长为5s的曝光数据流之后,曝光次数获取模块402可以在时长为5s的曝光数据流中获取各个IP地址对应的曝光行为次数,例如101.226.33.218对应的曝光行为次数为1次,222.82.44.14对应的曝光行为次数为71次。
曝光数据确定模块403,用于将各个用户标识信息对应的曝光行为次数进行比较,在曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据。
以表格一中各个IP地址对应的曝光行为次数为例,曝光数据确定模块403将各个IP地址对应的曝光行为次数进行比较,得到各个IP地址对应的曝光行为次数普遍为1次,222.82.44.14对应的曝光行为次数为71次,则存在曝光行为异常的目标用户为222.82.44.14,曝光数据确定模块403可以获取222.82.44.14对应的曝光行为数据。
在可选实施例中,曝光行为数据可以包括曝光行为对应的被曝光产品的产品信息,则曝光次数获取模块402,还用于曝光数据确定模块403在曝光数据流中确定目标用户对应的曝光行为数据之后,在目标用户对应的曝光行为数据中获取目标用户曝光各个被曝光产品的曝光行为次数。
进一步的,本发明实施例中的曝光行为数据的管理装置还可以包括:
产品信息确定模块404,用于将目标用户曝光各个被曝光产品的曝光行为次数进行比较,在曝光数据流中确定存在曝光行为异常的目标用户曝光的目标产品的目标产品信息。
以表格二为例,曝光数据确定模块403确定存在曝光行为异常的目标用户为222.82.44.14,并获取222.82.44.14对应的曝光行为数据,曝光次数获取模块402可以在222.82.44.14对应的曝光行为数据中获取目标用户曝光各个被曝光产品的曝光行为次数,例如网页http://kino.cw.cn/cw.php的曝光行为次数为1次,网页http://www.abc.com的曝光行为次数为67次,产品信息确定模块404将各个被曝光产品的曝光行为次数进行比较,得到各个被曝光产品的曝光行为次数普遍为1次,http://www.abc.com的曝光行为次数为67次,则存在曝光行为异常的目标用户曝光的目标产品为http://www.abc.com,产品信息确定模块404可以获取http://www.abc.com的产品信息。
在可选实施例中,曝光行为数据可以包括曝光行为对应的被曝光产品的产品信息,则本发明实施例中的曝光行为数据的管理装置还可以包括:
点击次数获取模块405,用于数据流获取模块401实时获取曝光数据流之后,在预设时间段内获取到的曝光数据流中获取各个被曝光产品对应的曝光行为次数及其点击行为次数。
点击率获取模块406,用于将各个被曝光产品对应的点击行为次数除以对应的曝光行为次数,获取各个被曝光产品的实时点击率。
产品信息获取模块407,用于当目标产品的实时点击率大于预设比例阈值时,在曝光数据流中确定存在曝光行为异常的目标用户曝光的目标产品的目标产品信息。
例如,用户浏览当前网页,当前网页中的产品信息被曝光,被曝光产品的曝光行为次数为一次,用户通过在当前网页中点击目标产品的方式访问目标产品的主页面,目标产品的点击行为次数为一次。预设时间段可以为5s,数据流获取模块401实时获取曝光数据流,在获取到时长为5s的曝光数据流之后,点击次数获取模块405可以在时长为5s的曝光数据流中获取各个被曝光产品对应的曝光行为次数及其点击行为次数,例如第一被曝光产品对应的曝光行为次数为100次,点击行为次数为6次,则点击率获取模块406获取到第一被曝光产品的实时点击率为6%;第二被曝光产品对应的曝光行为次数为120次,点击行为次数为2次,则点击率获取模块406获取到第二被曝光产品的实时点击率为1.7%。通过数据表明,曝光行为正常的用户对应的被曝光产品的实时点击率小于5%,则本发明实施例中的预设比例阈值可以为5%,第一被曝光产品的实时点击率大于预设比例阈值,则产品信息获取模块407可以确定第一被曝光产品对应的曝光行为存在曝光行为异常,进而在曝光数据流中确定第一被曝光产品的产品信息。
在可选实施例中,本发明实施例中的曝光行为数据的管理装置还可以包括:
标识模块408,用于曝光数据确定模块403在曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据之后,标识目标用户对应的曝光行为数据。
输出模块409,用于输出经过标识的目标用户对应的曝光行为数据。
例如,存在曝光行为异常的目标用户为222.82.44.14,标识模块408可以标识222.82.44.14对应的曝光行为数据,输出模块409输出经过标识的222.82.44.14对应的曝光行为数据,可选的,输出模块409还可以输出未标识的曝光行为正常的用户对应的曝光行为数据。
在可选实施例中,本发明实施例中的曝光行为数据的管理装置还可以包括:
过滤模块410,用于曝光数据确定模块403在曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据之后,在曝光数据流中过滤目标用户对应的曝光行为数据。
估算模块411,用于根据经过过滤的曝光数据流,对点击率进行估算。
例如,存在曝光行为异常的目标用户为222.82.44.14,过滤模块410可以在曝光数据流中过滤222.82.44.14对应的曝光行为数据,进而估算模块411根据经过过滤的曝光数据流,获取各个被曝光产品对应的曝光行为次数和点击行为次数,将各个被曝光产品对应的点击行为次数除以对应的曝光行为次数,以获取各个被曝光产品的预估点击率。
本发明实施例中,数据流获取模块401实时获取曝光数据流,曝光次数获取模块402在预设时间段内获取到的曝光数据流中获取各个用户标识信息对应的曝光行为次数,曝光数据确定模块403将各个用户标识信息对应的曝光行为次数进行比较,在曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据,可实时处理曝光数据流,提升数据处理效率。
请参见图5,图5为本发明实施例提供的一种终端的结构示意图,本发明实施例提供的终端可以用于实施上述图1~图3所示的本发明各实施例实现的方法,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照图1~图3所示的本发明各实施例。
如图5所示,该终端包括:至少一个处理器501,例如CPU,至少一个输出装置503,存储器504,至少一个通信总线502。其中,通信总线502用于实现这些组件之间的连接通信。其中,输出装置504具体可以为显示屏,用于输出经过标识的目标用户对应的曝光行为数据。其中,存储器504可能包含高速RAM存储器,也可能还包括非不稳定的存储器,例如至少一个磁盘存储器。存储器504可选的可以包含至少一个位于远离前述处理器501的存储装置。处理器501可以结合图4所示的曝光行为数据的管理装置。存储器504中存储一组程序代码,且处理器501调用存储器504中存储的程序代码,用于执行以下操作:
实时获取曝光数据流,其中曝光数据流可以包括:执行曝光行为的用户的用户标识信息及各个用户对应的曝光行为数据。
在预设时间段内获取到的曝光数据流中获取各个用户标识信息对应的曝光行为次数。
将各个用户标识信息对应的曝光行为次数进行比较,在曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据。
在可选实施例中,曝光行为数据可以包括曝光行为对应的被曝光产品的产品信息,则处理器501在曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据之后,还可以执行以下操作:
在目标用户对应的曝光行为数据中获取目标用户曝光各个被曝光产品的曝光行为次数。
将目标用户曝光各个被曝光产品的曝光行为次数进行比较,在曝光数据流中确定存在曝光行为异常的目标用户曝光的目标产品的目标产品信息。
在可选实施例中,曝光行为数据可以包括曝光行为对应的被曝光产品的产品信息,则处理器501实时获取曝光数据流之后,还可以执行以下操作:
在预设时间段内获取到的曝光数据流中获取各个被曝光产品对应的曝光行为次数及其点击行为次数。
将各个被曝光产品对应的点击行为次数除以对应的曝光行为次数,获取各个被曝光产品的实时点击率。
当目标产品的实时点击率大于预设比例阈值时,在曝光数据流中确定存在曝光行为异常的目标用户曝光的目标产品的目标产品信息。
在可选实施例中,处理器501在曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据之后,还可以执行以下操作:
标识目标用户对应的曝光行为数据。
通过输出装置503输出经过标识的目标用户对应的曝光行为数据。
在可选实施例中,处理器501在曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据之后,还可以执行以下操作:
在曝光数据流中过滤目标用户对应的曝光行为数据。
根据经过过滤的曝光数据流,对点击率进行预估。
具体的,本发明实施例中介绍的终端可以用以实施本发明结合图1~图3介绍的方法实施例中的部分或全部流程。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (8)

1.一种曝光行为数据的管理方法,其特征在于,包括:
对配置文件中存储的逻辑参数进行更新,其中,所述配置文件存储有storm框架中的接入层的逻辑参数,所述storm框架中的统计层的逻辑参数以及所述storm框架中的聚合层的逻辑参数,经过更新的逻辑参数包括所述接入层的逻辑参数,所述统计层的逻辑参数和所述聚合层的逻辑参数;
通过所述storm框架中的接入层实时获取曝光数据流,所述曝光数据流包括执行曝光行为的用户的用户标识信息及各个所述用户对应的曝光行为数据,所述storm框架是一种流式处理框架;
通过所述storm框架中的统计层在预设时间段内获取到的所述曝光数据流中获取各个所述用户标识信息对应的曝光行为次数;
通过所述storm框架中的聚合层将各个所述用户标识信息对应的曝光行为次数进行比较,在所述曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据,所述目标用户对应的曝光行为数据包括所述目标用户曝光的各个被曝光产品的产品信息;
通过所述storm框架中的统计层的逻辑参数在所述目标用户对应的曝光行为数据中获取所述目标用户曝光各个被曝光产品的曝光行为次数;
通过所述storm框架中的聚合层的逻辑参数将所述目标用户曝光各个被曝光产品的曝光行为次数进行比较,在所述目标用户对应的曝光行为数据中确定所述目标用户曝光的存在曝光行为异常的目标产品的目标产品信息。
2.根据权利要求1所述方法,其特征在于,所述在所述曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据之后,还包括:
标识所述目标用户对应的曝光行为数据;
输出所述经过标识的目标用户对应的曝光行为数据。
3.根据权利要求1所述方法,其特征在于,所述在所述曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据之后,还包括:
在所述曝光数据流中过滤所述目标用户对应的曝光行为数据;
根据经过过滤的曝光数据流,对点击率进行估算。
4.一种曝光行为数据的管理装置,其特征在于,包括:
数据流获取模块,用于对配置文件中存储的逻辑参数进行更新,其中,所述配置文件存储有storm框架中的接入层的逻辑参数,所述storm框架中的统计层的逻辑参数以及所述storm框架中的聚合层的逻辑参数,经过更新的逻辑参数包括所述接入层的逻辑参数,所述统计层的逻辑参数和所述聚合层的逻辑参数;
通过所述storm框架中的接入层实时获取曝光数据流,所述曝光数据流包括执行曝光行为的用户的用户标识信息及各个所述用户对应的曝光行为数据,所述storm框架是一种流式处理框架;
曝光次数获取模块,用于通过所述storm框架中的统计层在预设时间段内获取到的所述曝光数据流中获取各个所述用户标识信息对应的曝光行为次数;
曝光数据确定模块,用于通过所述storm框架中的聚合层将各个所述用户标识信息对应的曝光行为次数进行比较,在所述曝光数据流中确定存在曝光行为异常的目标用户对应的曝光行为数据,所述目标用户对应的曝光行为数据包括所述目标用户曝光的各个被曝光产品的产品信息;
所述曝光次数获取模块,还用于通过所述storm框架中的统计层的逻辑参数在所述目标用户对应的曝光行为数据中获取所述目标用户曝光各个被曝光产品的曝光行为次数;
产品信息确定模块,用于通过所述storm框架中的聚合层的逻辑参数将所述目标用户曝光各个被曝光产品的曝光行为次数进行比较,在所述目标用户对应的曝光行为数据中确定所述目标用户曝光的存在曝光行为异常的目标产品的目标产品信息。
5.根据权利要求4所述装置,其特征在于,所述装置还包括:
标识模块,用于所述曝光数据确定模块在所述曝光数据流中确定所述目标用户对应的曝光行为数据之后,标识所述目标用户对应的曝光行为数据;
输出模块,用于输出所述经过标识的目标用户对应的曝光行为数据。
6.根据权利要求4所述装置,其特征在于,所述装置还包括:
过滤模块,用于所述曝光数据确定模块在所述曝光数据流中确定所述目标用户对应的曝光行为数据之后,在所述曝光数据流中过滤所述目标用户对应的曝光行为数据;
估算模块,用于根据经过过滤的曝光数据流,对点击率进行估算。
7.一种终端,其特征在于,所述终端包括:
存储器,用于存储程序代码;
处理器,用于调用所述存储器中存储的所述程序代码,执行如权利要求1至3任一项所述的曝光行为数据的管理方法。
8.一种计算机可读取存储介质,其特征在于,所述计算机可读取存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被终端执行时使所述终端执行如权利要求1至3任一项所述的曝光行为数据的管理方法。
CN201510312735.2A 2015-06-09 2015-06-09 一种曝光行为数据的管理方法及装置 Active CN106296254B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510312735.2A CN106296254B (zh) 2015-06-09 2015-06-09 一种曝光行为数据的管理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510312735.2A CN106296254B (zh) 2015-06-09 2015-06-09 一种曝光行为数据的管理方法及装置

Publications (2)

Publication Number Publication Date
CN106296254A CN106296254A (zh) 2017-01-04
CN106296254B true CN106296254B (zh) 2021-06-25

Family

ID=57660090

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510312735.2A Active CN106296254B (zh) 2015-06-09 2015-06-09 一种曝光行为数据的管理方法及装置

Country Status (1)

Country Link
CN (1) CN106296254B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103514178A (zh) * 2012-06-18 2014-01-15 阿里巴巴集团控股有限公司 一种基于点击率的搜索排序方法及装置
CN103714057A (zh) * 2012-09-28 2014-04-09 北京亿赞普网络技术有限公司 一种在线网页信息的实时监测方法和装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100384161C (zh) * 2005-12-31 2008-04-23 华为技术有限公司 一种业务行为异常处理方法及系统
KR20080048185A (ko) * 2006-11-28 2008-06-02 엔에이치엔(주) 유무선 네트워크를 통해 제공되는 광고를 관리하는 방법 및상기 방법을 수행하는 시스템
CN100499512C (zh) * 2007-08-10 2009-06-10 北大方正集团有限公司 互联网数据信息点击量的统计方法和装置
US8244517B2 (en) * 2008-11-07 2012-08-14 Yahoo! Inc. Enhanced matching through explore/exploit schemes
CN102724182B (zh) * 2012-05-30 2015-03-25 北京像素软件科技股份有限公司 异常客户端的识别方法
CN103886068B (zh) * 2014-03-20 2018-04-03 北京国双科技有限公司 用于互联网用户行为分析的数据处理方法和装置
CN104268644A (zh) * 2014-09-23 2015-01-07 新浪网技术(中国)有限公司 广告位上的广告的点击次数预估方法和装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103514178A (zh) * 2012-06-18 2014-01-15 阿里巴巴集团控股有限公司 一种基于点击率的搜索排序方法及装置
CN103714057A (zh) * 2012-09-28 2014-04-09 北京亿赞普网络技术有限公司 一种在线网页信息的实时监测方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
社交电视网络及其应用分析;朱月;《电视技术》;20150317;第39卷(第6期);第27-31页 *

Also Published As

Publication number Publication date
CN106296254A (zh) 2017-01-04

Similar Documents

Publication Publication Date Title
US20190356684A1 (en) Detecting robotic internet activity across domains utilizing one-class and domain adaptation machine-learning models
CN108721898B (zh) 帧率的确定方法和装置、存储介质、电子装置
US10657559B2 (en) Generating and utilizing a conversational index for marketing campaigns
CN111160624B (zh) 一种用户意向预测方法、用户意向预测装置及终端设备
US10896445B2 (en) System and method to selectively update supplemental content rendered in placement regions of a rendered page
CN109034867B (zh) 点击流量检测方法、装置及存储介质
CN114095567A (zh) 数据访问请求的处理方法、装置、计算机设备及介质
CN112307464A (zh) 诈骗识别方法、装置及电子设备
CN109688109B (zh) 基于客户端信息识别的验证码的验证方法及装置
US8719934B2 (en) Methods, systems and media for detecting non-intended traffic using co-visitation information
US20160308983A1 (en) Information processing method and service platform
CN113746790B (zh) 一种异常流量管理方法、电子设备及存储介质
CN106817296B (zh) 信息推荐的测试方法、装置以及电子设备
CN111199454B (zh) 实时用户转化评估方法、装置及电子设备
CN117040799A (zh) 页面拦截规则生成、页面访问控制方法、装置及电子设备
CN112732553A (zh) 图像测试方法、装置、电子设备及存储介质
CN106296254B (zh) 一种曝光行为数据的管理方法及装置
CN110457632B (zh) 网页加载的处理方法及装置
US10803094B1 (en) Predicting reach of content using an unresolved graph
US10936691B1 (en) Stable identifier architecture
US20100217647A1 (en) Determining share of voice
US10922335B1 (en) User targeting using an unresolved graph
CN110232393B (zh) 数据的处理方法、装置、存储介质和电子装置
CN112312156A (zh) 一种直播景象提醒方法、装置、设备及存储介质
US11328212B1 (en) Predicting demographic information using an unresolved graph

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant