CN103593376B - 一种采集用户行为数据的方法及装置 - Google Patents

一种采集用户行为数据的方法及装置 Download PDF

Info

Publication number
CN103593376B
CN103593376B CN201210295725.9A CN201210295725A CN103593376B CN 103593376 B CN103593376 B CN 103593376B CN 201210295725 A CN201210295725 A CN 201210295725A CN 103593376 B CN103593376 B CN 103593376B
Authority
CN
China
Prior art keywords
data
operation behavior
screening
user
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210295725.9A
Other languages
English (en)
Other versions
CN103593376A (zh
Inventor
雷鑫
陈锣斌
孙宏发
沈涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201210295725.9A priority Critical patent/CN103593376B/zh
Publication of CN103593376A publication Critical patent/CN103593376A/zh
Application granted granted Critical
Publication of CN103593376B publication Critical patent/CN103593376B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种采集用户行为数据的方法及装置,该方法包括:当检测到任一操作行为发生时,生成与该操作行为对应的操作行为数据;将所述操作行为数据中的数据项与预设的多个筛选统计策略中的策略项进行匹配,若与任一筛选统计策略匹配成功,则获取与所述任一筛选统计策略对应的第一筛选统计策略标识;将第一筛选统计策略标识与所述操作行为数据中的用户唯一标识组合生成关键词;将具有相同关键词的操作行为数据存储到预设的存储空间。本申请公开的方法和装置通过实时的预计算处理,将任一操作行为发生时候,则及时的将操作行为数据按照多个条件进行分类存储使用户操作行为数据的描述更加丰富,并提升了用户行为数据的分析精度。

Description

一种采集用户行为数据的方法及装置
技术领域
本申请涉及网络技术领域,尤其涉及一种采集用户行为数据的方法及装置。
背景技术
CTU是网络加护系统中的风险控制管理核心监控系统。主要对盗用、欺诈、盗卡风险进行实时以及非实时监控,控制这些风险导致的资金损失,保障客户资金安全以及交易安全。
即用户通过计算机在互联网站上的行为,如在支付宝的登录、修改信息、支付资金等操作。
原有方案,在对用户操作行为数据进行分析时(由于性能瓶颈,只能查询到最长为当前时间起前6个小时),再从海量数据中查询最长当前时间前6小时段的所有原始操作流水记录,获取到数据后,再进行筛选、分类、统计、汇总,即现用现计算处理。
现有技术缺点:由于现有技术中数据分析是在分析的时候,再从海量数据中查询最长当前时间前6小时段的所有原始操作流水记录,获取到数据后,再进行筛选、分类、统计、汇总,即现用现计算处理,因此性能及效率会比较差。同时,现有技术未将当前原始用户操作行为数据进行预先设好的多个条件进行筛选、分类、统计、汇总,因此在事后随着时间的推移,这些历史数据将无法获取到当时的一些数据场景快照,或者说获取到的成本非常高。
发明内容
本申请提供一种采集用户行为数据的方法及装置,本申请所提供的方法和装置解决现有技术中数据分析从海量数据中查询目标数据,因此数据查询性能及效率会比较差的问题。
本申请提供一种采集用户行为数据的方法,该方法包括:
当检测到任一操作行为发生时,生成与该操作行为对应的操作行为数据;
将所述操作行为数据中的数据项与预设的多个筛选统计策略中的策略项进行匹配,若与任一筛选统计策略匹配成功,则获取与所述任一筛选统计策略对应的第一筛选统计策略标识;
将第一筛选统计策略标识与所述操作行为数据中的用户唯一标识组合生成关键词;
将具有相同关键词的操作行为数据存储到预设的存储空间。
当从存储的历史操作行为数据中获取任一用户对任一事件的历史操作行为数据,该方法还包括:
接收获取所述任一用户的历史操作行为数据的数据获取请求;
从所述数据获取请求中获取与所述任一事件对应的数据筛选统计项,并根据获取的数据筛选统计项生成筛选统计策略标识;
将生成的筛选统计策略标识与所述任一用户的唯一标识组合生成关键词;
将生成的关键词与所述数据结构中保存的关键词进行匹配,如果匹配到相同的,则获取关键词对应的历史操作行为数据。
本申请根据上述方法还提供一种采集用户行为数据的装置,该装置包括:
数据接收单元,用于当检测到任一操作行为发生时,获取与该操作行为对应的操作行为数据;
筛选统计策略标识确定单元,用于将所述操作行为数据中的数据项与预设的多个筛选统计策略中的策略项进行匹配,若与任一筛选统计策略匹配成功,则获取与所述任一筛选统计策略对应的第一筛选统计策略标识;
关键词生成单元,用于将第一筛选统计策略标识与所述操作行为数据中的用户唯一标识组合生成关键词;
数据存储单元,用于将具有相同关键词的操作行为数据存储到预设的存储空间。
当从所述预设的存储空间中获取任一用户对任一事件的操作行为数据,则该装置还包括:
查询单元,用于接收获取任一用户的历史操作行为数据的数据获取请求;从所述数据获取请求中获取与所述任一事件对应的数据筛选统计项,并根据获取的数据筛选统计项生成筛选统计策略标识;将生成的筛选统计策略标识与所述任一用户的唯一标识组合生成关键词;将生成的关键词与所述数据结构中保存的关键词进行匹配,如果匹配到相同的,则获取关键词对应的历史操作行为数据。
上述技术方案中的一个或两个,至少具有如下技术效果:
本申请实施例所提供的方法和装置通过提前实时的预计算处理,将当前用户对应的历史操作行为数据进行预先设好的多个条件进行筛选、分类、统计、汇总,这样即解决了原来无法解决的对历史操作行为数据快照问题,使原始用户操作行为数据的描述更加丰富,以此大大提升用户行为分析的精度。
附图说明
图1为本申请实施例一种采集用户行为数据的方法的流程图;
图2为本申请实施例在本申请实施例中关键词的结构示意图;
图3为本申请实施例数据结构中缓存队列的结构示意图;
图4为本申请实施例中基于某一筛选策略的缓存队列结构示意图;
图5为本申请实施例一种采集用户行为数据装置的结构示意图;
图6为本申请实施例中数据存储单元的结构示意图。
具体实施方式
本申请实施例提供一种采集用户行为数据的方法,该方法包括:当检测到任一操作行为发生时,生成与该操作行为对应的操作行为数据;将所述操作行为数据中的数据项与预设的多个筛选统计策略中的策略项进行匹配,若与任一筛选统计策略匹配成功,则获取与所述任一筛选统计策略对应的第一筛选统计策略标识;将第一筛选统计策略标识与所述操作行为数据中的用户唯一标识组合生成关键词;将所述关键词相同的操作行为数据组合存储到预设的存储空间。
本申请通过实时的预计算处理,当检测到任一用户当前正在执行某一操作时,根据预先设好的多个筛选规则(多个筛选规则组成筛选统计策略)将当前执行网络操作的用户操作行为数据进行筛选、分类、统计、汇总,这样即解决了原来无法解决的对历史操作行为数据快照问题,使用户操作行为数据的描述更加丰富,以此大大提升用户行为分析的精度。
本申请实施例中所公开的用户操作行为数据是指用户通过计算机在互联网站上进行操作时,服务器针对用户的操作行为生成的描述相关操作行为的数据,如在支付宝的登录、修改信息、支付资金等操作行为时,则对应的会生成记录登录、修改信息、支付资金的操作行为数据。例如:某一用户执行了登录操作,则对应的操作行为数据可以是:用户账号、登录时间、登录设备IP、登录是否成功等等信息。
本申请所提供的方法是通过对实时的用户操作行为数据进行筛选、分类、统计、汇总等预计算加工处理,使风险行为分析系统在分析当前用户的操作行为时只需要从预计算加工处理后的数据中查询所需数据结果即可,不需要在分析的过程中再进行以上对用户操作行为的分类、统计、汇总,再加上通过使用筛选统计策略标识(Key)+采集的数据块(Value)的方式缓存到服务器,使原有的海量数据查询每次平均需要25ms,提升到获取数据只需要平均5ms,所以大大提升了风险分析的性能及效率。
如图1所示,基于上述目的本申请实施例提供一种采集用户行为数据的方法,下面结合说明书附图对本申请的具体实施方式进行详细说明:
步骤101,当检测到任一操作行为发生时,获取与该操作行为对应的操作行为数据;
在本申请实施例中,当一个用户操作行为发生时接收业务系统以消息事件的形式发送来的数据;
例如:当用户A对被监控的某一网站页面执行操作行为时,则对应会触发风险监控系统获取该用户A所执行的操作行为对应的操作行为数据。
因为业务系统的多样性以及业务系统功能的多样性,所以不同业务系统应用的数据会存在一定的差异,进而接收到的用户操作行为数据会存在不同的数据格式。为了便于数据的筛选和统计本申请实施例还在接收业务系统发送来的用户操作行为数据之后,还进一步将接收到的用户操作行为数据转为相同的数据格式。
步骤102,将所述操作行为数据中的数据项与预设的多个筛选统计策略中的策略项进行匹配,若与任一筛选统计策略匹配成功,则获取与所述任一筛选统计策略对应的第一筛选统计策略标识;
所述数据筛选统计项包括待采集数据的业务条件、数据采集的累积时长和待采集数据的对应事件等。
在本申请实施例中,风险监控系统可以首先设置接收数据筛选统计项的显示页面,风险监控系统的操控用户可以根据显示页面的显示内容数据选择数据筛选统计项;风险监控系统根据用户数据的这些数据筛选统计项对应的生成一个数据的项目对应的筛选统计策略标识;即当用户对被监控的某一网络内容执行操作时,则会获取用户的操作行为数据。根据前述内容风险监控系统已经生成了多个筛选统计策略,所以在风险监控系统检测到任一操作行为数据后,则会将操作行为数据中的数据项与筛选统计策略中的策略项进行匹配,从而确定当前检测到的操作行为数据符合哪一个筛选统计策略。
当执行筛选统计功能的系统接收到所述任一用户的历史操作行为数据时,则会根据已经加载好的数据筛选统计项通过规则引擎进行处理,并将处理后的结果再更新到缓存服务器上。
步骤103,将所述第一筛选统计策略标识与所述操作行为数据中的用户唯一标识组合生成关键词(在本申请实施例中关键词203也可以称为KEY,具体示意如图2所示,具体由筛选统计策略标识201和用户的唯一标识202组合生成);
因为本申请实施例所提供的方法是针对任一用户实现的,所以在进行数据的分类处理时,根据事件和用户的标识对接收到的数据进行分类处理。所以在本申请实施例中还需要将用户的唯一标识与筛选统计策略标识组合形成与分类数据对应的关键词。
所述用户的唯一标识包括多种,本申请实施例中可以选用IP地址,用户的网络注册账号、或者用户终端的MAC地址等等。
1)如果当前执行操作行为的用户,所执行的操作行为数据符合的分类条件是5分钟内用户非正常的付款:
即该分类条件所对应的数据筛选统计项包括:业务条件:非正常;累计事件:用户付款。该分类条件对应一个第一筛选统计策略标识。
其中,因为用户一般通过网络账号付款,所以在统计用户是否正常付款的操作行为数据时,则主体类型可选择网络账号,在该实施例中可以选择主体值:200802302323023
则对应的组成的KEY为:第一筛选统计策略标识200802302323023。
2)如果当前执行操作行为的用户,所执行的操作行为数据符合的分类条件是:5分钟一个电脑非正常的付款,主体:电脑;
即该分类条件所对应的数据筛选统计项包括:业务条件:非正常电脑;累计事件:用户付款该分类条件对应一个第二筛选统计策略标识。
其中,主体类型可选择MAC,并且主体值:电脑的唯一标识;
组成的KEY为:第二筛选统计策略标识电脑的唯一标识。
其中所述5分钟为存储符合该分类条件的操作行为数据的数据结构长度,即在存储符合所述筛选统计策略的数据时,只是保存5分钟范围内的数据。如果当前检测到的符合分类条件(即筛选统计策略)的数据存储到预设的数据结构中,则会导致数据中存储的数据超出5分钟的长度,则将超出5分钟范围的历史数据(原始已存的)删除或者是将一定时间段的数据进行合并(删除例如:数据结构中存储有一个数据的时间是17:00,而当前检测到的数据时间是17:06。17点检测到的数据超出了5分钟的范围,所以则会删除存储的17点的操作行为数据。),然后将当前检测到的操作行为数据存储到数据结构中。
为了使得缓存数据的信息更为全面,以及数据的分类更为合理,则本申请实施例所提供的方法中还根据数据生成的时间将收集的数据划分成多个数据块。
步骤104,将具有相同关键词的操作行为数据存储到预设的存储空间。
在本申请实施例中,关键词是根据操作行为数据的操作用户以及操作行为属性生成的,所以在该实施例中每条操作行为数据都对应一个关键词。因为用户在一定时间段内可能会多次执行某一操作行为,所以在设定时间段(该设定时间段为预设的累积时长)内符合同一筛选统计策略的操作行为数据可以包括多个。因为关键词是通过筛选统计策略和用户的唯一性标识结合生成的,所以在设定时间段内同一用户符合同一筛选统计策略的多个操作行为数据对应同一个关键词。所以在本申请实施例中将关键词相同的操作行为数据存储预设的一个数据结构中。
其中,在本申请实施例中所述数据结构按照时间片划分,在操作行为数据存储时,则按照操作行为数据的生成时间对应的存储到数据结构的不同位置。
另外,因为风险系统将采集到的操作行为数据按照一定时间段进行累积,所以在本申请中在存储所述操作行为数据时,会根据累积时长确定数据的分析精度,所以对于不同累积时长的筛选统计策略所对应的数据划分为数据块时,所根据的时间片单位会不同。所述根据预设的时间片将所述关键词相同的操作行为数据划分为多个数据块包括:
从所述第一筛选统计策略标识中获取筛选操作行为数据的累积时长值;
将所述累积时长与第一阈值(在本申请实施例中可以设置该第一阈值为两小时)进行比较,若所述累积时长大于第一阈值(即所述筛选统计策略中所设定的累积时长大于两小时),则根据第一预设时间片(本申请实施例中可以是1分钟)将所述第一历史操作行为数据划分为多个数据块;若所述累积时长值不大于第一阈值,则根据第二预设时间片(本申请实施例中可以是1秒)将所述第一历史操作行为数据划分为多个数据块;其中,所述第二预设时间片小于第一预设时间片。
因为操作行为数据的完整信息都存储在业务系统中,并且为了方便操作行为数据的存储和查询,每个操作行为数据都对应一个唯一的流水号。所以在本发明实施例中为了减小数据的存储量以及避免存储空间的浪费,将关键词和操作行为数据对应存储到数据结构时,则只是在数据结构中存储操作行为数据对应的流水号。当查询某一操作行为数据时,获取操作行为数据的流水号后,通过流水号在业务系统中获取对应的操作行为数据即可。
在本申请实施例中,缓存对象中使用了队列来存储累计值。该实施例中若第一阈值以2小时为例,则对于2小时内的累计精确到秒(该实施中如果精确度为1秒,则时间片为每一秒)来做累计,队列的最大长度N为:2*60*60=7200(该队列的格式如图3所示,每个数据结构中包括KEY301和累积时长时间段内符合条件的数据块302,在本实施例中302中存储的是在业务系统中,数据块所对应的流水号);对于累计时长为2小时至3天的累计精确到1分钟,队列最大长度N为:3*24*60=4320。
在本申请实施例中,因为只存储满足条件的数据,所以时间片队列中的时间不是连续时间,只有满足对应业务条件的事件发生的时间点才会被累计到队列中(如图4所示,每个数据结构中包括KEY401和累积时长时间段内符合条件的数据块402,在本实施例中402中存储的是在业务系统中,数据块所对应的流水号。两分钟的队列虽然长度为120,队列并不是满的,只有三个时间片有值,而且不是连续的时间片)。
根据上述方法存储的数据,当需要查询某一数据时,从所述数据结构中获取任一用户对任一事件的历史操作行为数据还包括:
接收获取历史操作行为数据的数据获取请求;
从所述数据获取请求中获取与所述任一事件对应的数据筛选统计项,并根据获取的数据筛选统计项生成筛选统计策略标识;
将生成的筛选统计策略标识与用户的唯一标识组合生成关键词;
将生成的关键词与所述数据结构中保存的关键词进行匹配,如果匹配到相同的,则获取关键词对应的历史操作行为数据。
如图5所示,根据上述方法本申请实施例还提供一种采集用户行为数据的装置,该装置包括:
数据接收单元501,用当检测到任一操作行为发生时,获取与该操作行为对应的操作行为数据;
筛选统计策略标识确定单元502,用于将所述操作行为数据中的数据项与预设的多个筛选统计策略中的策略项进行匹配,若与任一筛选统计策略匹配成功,则获取与所述任一筛选统计策略对应的第一筛选统计策略标识;
关键词生成单元503,用于将第一筛选统计策略标识与所述操作行为数据中的用户唯一标识组合生成关键词;
数据存储单元504,用于将具有相同关键词的操作行为数据存储到预设的存储空间。
如图6所示,为了使得缓存数据的信息更为全面,以及数据的分类更为合理,则本申请实施例所提供的方法中还根据数据生成的时间将收集的数据划分成多个数据块。则所述数据存储单元504包括:
数据块生成模块601,用于根据预设的时间片将所述关键词相同的操作行为数据划分为多个数据块;
另外,因为对于不同时间生成的数据所需要的分析精度不相同,所以对于不同时间生成的数据在划分数据块时,所根据的时间片单位会不同。所以所述数据块生成模块601根据预设的时间片将所述关键词相同的操作行为数据划分为多个数据块包括:
从所述第一筛选统计策略标识中获取数据采集的累积时长;
将所述累积时长与第一阈值进行比较,若所述累积时长大于第一阈值,则根据第一预设时间片将所述第一历史操作行为数据划分为多个数据块;若所述累积时长不大于第一阈值,则根据第二预设时间片将所述第一历史操作行为数据划分为多个数据块;其中,所述第二预设时间片小于第一预设时间片。
存储模块602,用于按照所述操作行为数据的生成时间将所述数据块组合存储到预设的存储空间。
根据上述方法存储的数据,当需要查询某一数据时,用户从所述数据结构中获取任一用户对任一事件的原始用户操作行为数据该装置还包括:
查询单元505,用于接收获取所述任一用户的历史操作行为数据的数据获取请求;从所述数据获取请求中获取与所述任一事件对应的数据筛选统计项,并根据获取的数据筛选统计项生成筛选统计策略标识;将生成的筛选统计策略标识与所述任一用户的唯一标识组合生成关键词;将生成的关键词与所述数据结构中保存的关键词进行匹配,如果匹配到相同的,则获取关键词对应的历史操作行为数据。
本申请实施例中的上述一个或多个技术方案,至少具有如下的技术效果:
提升用户行为分析精度,本申请通过任一用户操作行为发生时,实时的预计算处理该用户对应的设定时间段内的历史操作行为数据,所述预计算处理为将当前用户的操作行为数据进行预先设好的多个条件进行以时间片为刻度的筛选、分类、统计、汇总,这样即解决了原来无法解决的对历史操作行为数据快照问题,使历史操作行为数据的描述更加丰富,以此大大提升用户行为分析的精度。
提升性能及效率,本申请通过对实时的历史操作行为数据进行以时间片为刻度的筛选、分类、统计、汇总预计算加工处理,使风险行为分析系统在分析当前用户的操作行为时只需要查询到已经预计算加工处理好的数据结果即可,不需要在分析的过程中再进行以上对历史操作行为数据的分类、统计、汇总,再加上通过使用Key-Value缓存服务器做为存储,使原有的海量数据查询每次平均需要25ms,提升到获取数据只需要平均5ms,所以大大提升了风险分析的性能及效率。
本申请所述的方法并不限于具体实施方式中所述的实施例,本领域技术人员根据本申请的技术方案得出其它的实施方式,同样属于本申请的技术创新范围。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (8)

1.一种采集用户行为数据的方法,其特征在于,该方法包括:
当检测到任一操作行为发生时,生成与该操作行为对应的操作行为数据;
将所述操作行为数据中的数据筛选统计项与预设的多个筛选统计策略中的策略项进行匹配,若与任一筛选统计策略匹配成功,则获取与所述任一筛选统计策略对应的第一筛选统计策略标识;
将第一筛选统计策略标识与所述操作行为数据中的用户唯一标识组合生成关键词;
根据预设的时间片将所述关键词相同的操作行为数据划分为多个数据块;按照所述操作行为数据的生成时间将所述数据块组合存储到预设的存储空间。
2.如权利要求1所述的方法,其特征在于,所述用户唯一标识包括用户终端的IP地址,用户的网络注册账号或者用户终端的MAC地址。
3.如权利要求1所述的方法,其特征在于,所述数据筛选统计项包括待采集数据的业务条件、数据采集的累积时长和待采集数据的对应事件。
4.如权利要求3所述的方法,其特征在于,所述根据预设的时间片将所述关键词相同的操作行为数据划分为多个数据块:
从所述第一筛选统计策略标识中获取数据采集的累积时长;
将所述累积时长与第一阈值进行比较,若所述累积时长大于第一阈值,则根据第一预设时间片将第一历史操作行为数据划分为多个数据块;若所述累积时长不大于第一阈值,则根据第二预设时间片将所述第一历史操作行为数据划分为多个数据块;其中,所述第二预设时间片小于第一预设时间片。
5.如权利要求1所述的方法,其特征在于,该方法还包括获取任一用户对任一事件的历史操作行为数据还包括:
接收获取所述任一用户的历史操作行为数据的数据获取请求;
从所述数据获取请求中获取与所述任一事件对应的数据筛选统计项,并根据获取的数据筛选统计项生成筛选统计策略标识;
将生成的筛选统计策略标识与所述任一用户的唯一标识组合生成关键词;
将生成的关键词与预设的数据结构中保存的关键词进行匹配,如果匹配到相同的,则获取关键词对应的历史操作行为数据。
6.一种采集用户行为数据的装置,其特征在于,该装置包括:
数据接收单元,用于当检测到任一操作行为发生时,获取与该操作行为对应的操作行为数据;
筛选统计策略标识确定单元,用于将所述操作行为数据中的数据筛选统计项与预设的多个筛选统计策略中的策略项进行匹配,若与任一筛选统计策略匹配成功,则获取与所述任一筛选统计策略对应的第一筛选统计策略标识;
关键词生成单元,用于将第一筛选统计策略标识与所述操作行为数据中的用户唯一标识组合生成关键词;
数据存储单元,用于根据预设的时间片将所述关键词相同的操作行为数据划分为多个数据块,将具有相同关键词的操作行为数据存储到预设的存储空间。
7.如权利要求6所述的装置,其特征在于,数据存储单元根据预设的时间片将所述关键词相同的操作行为数据划分为多个数据块包括:
从所述第一筛选统计策略标识中获取数据采集的累积时长;
将所述累积时长与第一阈值进行比较,若所述累积时长大于第一阈值,则根据第一预设时间片将第一历史操作行为数据划分为多个数据块;若所述累积时长不大于第一阈值,则根据第二预设时间片将所述第一历史操作行为数据划分为多个数据块;其中,所述第二预设时间片小于第一预设时间片。
8.如权利要求6所述的装置,其特征在于,当从所述预设的存储空间中获取任一用户对任一事件的操作行为数据,则该装置还包括:
查询单元,用于接收获取任一用户的历史操作行为数据的数据获取请求;从所述数据获取请求中获取与所述任一事件对应的数据筛选统计项,并根据获取的数据筛选统计项生成筛选统计策略标识;将生成的筛选统计策略标识与所述任一用户的唯一标识组合生成关键词;将生成的关键词与预设的数据结构中保存的关键词进行匹配,如果匹配到相同的,则获取关键词对应的历史操作行为数据。
CN201210295725.9A 2012-08-17 2012-08-17 一种采集用户行为数据的方法及装置 Active CN103593376B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210295725.9A CN103593376B (zh) 2012-08-17 2012-08-17 一种采集用户行为数据的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210295725.9A CN103593376B (zh) 2012-08-17 2012-08-17 一种采集用户行为数据的方法及装置

Publications (2)

Publication Number Publication Date
CN103593376A CN103593376A (zh) 2014-02-19
CN103593376B true CN103593376B (zh) 2017-09-15

Family

ID=50083525

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210295725.9A Active CN103593376B (zh) 2012-08-17 2012-08-17 一种采集用户行为数据的方法及装置

Country Status (1)

Country Link
CN (1) CN103593376B (zh)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110008248B (zh) * 2014-02-21 2023-07-28 创新先进技术有限公司 一种数据处理方法和装置
CN104954818B (zh) * 2014-03-27 2019-03-15 中国电信股份有限公司 调整播放列表中媒体项顺序的方法与装置
CN105677687A (zh) * 2014-11-21 2016-06-15 阿里巴巴集团控股有限公司 一种数据处理方法及装置
CN105653561B (zh) * 2014-12-02 2019-11-15 阿里巴巴集团控股有限公司 数据的处理方法及装置
CN105868878B (zh) * 2015-01-21 2019-11-15 阿里巴巴集团控股有限公司 Mac地址的风险识别方法及装置
CN106295382B (zh) * 2015-05-20 2019-06-14 阿里巴巴集团控股有限公司 一种信息风险防控方法及装置
CN105141408A (zh) * 2015-07-23 2015-12-09 柳州易旺科技有限公司 一种试验现场信息收集方法
CN106547799B (zh) * 2015-09-23 2019-11-12 北京国双科技有限公司 数据的导入方法及装置
CN106878970B (zh) 2015-12-14 2020-05-05 阿里巴巴集团控股有限公司 变更手机号码的业务请求的识别方法及装置
CN107085576A (zh) * 2016-02-15 2017-08-22 阿里巴巴集团控股有限公司 一种流式数据统计算法及装置
CN107122369B (zh) * 2016-02-25 2021-05-11 创新先进技术有限公司 一种业务数据处理方法、装置和系统
CN106126539B (zh) * 2016-06-15 2020-09-29 百度在线网络技术(北京)有限公司 一种用户行为数据处理方法和装置
CN106327324B (zh) * 2016-08-23 2019-08-16 同盾控股有限公司 一种网络行为特征的快速计算方法和系统
CN106330552A (zh) * 2016-08-30 2017-01-11 成都广达新网科技股份有限公司 一种可配置的网管用户行为采集系统及其工作方法
CN108319542B (zh) * 2017-01-17 2022-10-28 百度在线网络技术(北京)有限公司 信息处理方法、装置及系统
CN106878397A (zh) * 2017-01-21 2017-06-20 浙江沛宏网络科技有限公司 一种web用户行为反馈方法及系统
CN107180338A (zh) * 2017-05-22 2017-09-19 深圳市小牛在线互联网信息咨询有限公司 业务执行方法、装置、存储介质及计算机设备
CN109214846B (zh) * 2017-07-04 2020-08-04 上海优扬新媒信息技术有限公司 信息存储方法和装置
CN107491300A (zh) * 2017-07-13 2017-12-19 深圳市金立通信设备有限公司 一种智能功能的提示方法及其终端
CN107613129B (zh) * 2017-09-28 2021-01-12 Oppo广东移动通信有限公司 解锁方法及相关产品
CN110120964B (zh) * 2018-02-07 2022-07-08 北京三快在线科技有限公司 用户行为监控方法和装置以及计算设备
CN110366021B (zh) * 2018-04-11 2020-12-04 北京嘀嘀无限科技发展有限公司 多媒体资源的存储方法、装置、设备和计算机存储介质
CN108984668A (zh) * 2018-06-29 2018-12-11 深圳鼎盛电脑科技有限公司 一种数据处理的方法、装置、设备及存储介质
CN111078622A (zh) * 2018-10-18 2020-04-28 武汉光谷航天三江激光产业技术研究院有限公司 一种多路数据采集及筛选方法和装置
CN110928917A (zh) * 2019-11-11 2020-03-27 北京齐尔布莱特科技有限公司 一种目标用户的确定方法、装置、计算设备及介质
CN112950352A (zh) * 2021-02-08 2021-06-11 北京淇瑀信息科技有限公司 用户筛选策略生成方法、装置及电子设备
CN113297217B (zh) * 2021-05-20 2021-12-17 广州光点信息科技有限公司 一种数据传输方法、装置及系统
CN113500993B (zh) * 2021-06-21 2022-09-20 上汽通用五菱汽车股份有限公司 防碰撞功能参数的标定方法、车辆及可读存储介质
CN116320019B (zh) * 2023-05-16 2023-10-27 荣耀终端有限公司 数据采集方法、介质以及电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102413013A (zh) * 2011-11-21 2012-04-11 北京神州绿盟信息安全科技股份有限公司 网络异常行为检测方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7925551B2 (en) * 2004-06-09 2011-04-12 Syncada Llc Automated transaction processing system and approach
CN100446486C (zh) * 2007-05-11 2008-12-24 北京工业大学 网络流行为的行为分析参数的提取方法
CN101431485B (zh) * 2008-12-31 2012-07-04 深圳市迅雷网络技术有限公司 一种自动推荐互联网上信息的方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102413013A (zh) * 2011-11-21 2012-04-11 北京神州绿盟信息安全科技股份有限公司 网络异常行为检测方法及装置

Also Published As

Publication number Publication date
CN103593376A (zh) 2014-02-19

Similar Documents

Publication Publication Date Title
CN103593376B (zh) 一种采集用户行为数据的方法及装置
US10110687B2 (en) Session based web usage reporter
CN104424229B (zh) 一种多维度拆分的计算方法及系统
CN105989129B (zh) 实时数据统计方法和装置
US6208977B1 (en) Accounting and billing based on network use
US7555482B2 (en) Automatic detection of abnormal data access activities
Zhang et al. Taxi-passenger-demand modeling based on big data from a roving sensor network
CN103731284B (zh) 关联多个网络帐号的方法和系统
US9317537B2 (en) Database and method for evaluating data therefrom
CN107819696A (zh) 一种交易流量控制方法和系统
CN102254238B (zh) 带有聚集器中的去重复的可缩放记帐
CN107103068A (zh) 业务缓存的更新方法及装置
CN101576988A (zh) 信用数据交互系统及交互方法
US7840523B2 (en) Method and system for time-sliced aggregation of data that monitors user interactions with a web page
AU2022204007A1 (en) Summary chains in distributed systems
CN110049061A (zh) 高速网络上轻量级DDoS攻击检测装置及检测方法
CN106992886A (zh) 一种基于分布式存储的日志分析方法及装置
CN106033324A (zh) 一种数据存储的方法和装置
CN111597168A (zh) 一种基于诚信值的区块链容量回收方案
CN108446984A (zh) 一种投资数据管理方法及装置
CN107133367A (zh) 一种信息处理方法及系统、服务器
CN103455509B (zh) 一种获取时间窗口模型参数的方法和系统
US8782162B1 (en) System for merging and comparing real-time analytics data with conventional analytics data
CN106951360A (zh) 数据统计完整度计算方法和系统
CN110851758B (zh) 一种网页访客数量统计方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20191211

Address after: P.O. Box 31119, grand exhibition hall, hibiscus street, 802 West Bay Road, Grand Cayman, Cayman Islands

Patentee after: Innovative advanced technology Co., Ltd

Address before: Cayman Islands Grand Cayman capital building, a four storey No. 847 mailbox

Patentee before: Alibaba Group Holding Co., Ltd.