CN103500177A - 一种用户激活数的统计方法及装置 - Google Patents

一种用户激活数的统计方法及装置 Download PDF

Info

Publication number
CN103500177A
CN103500177A CN201310403440.7A CN201310403440A CN103500177A CN 103500177 A CN103500177 A CN 103500177A CN 201310403440 A CN201310403440 A CN 201310403440A CN 103500177 A CN103500177 A CN 103500177A
Authority
CN
China
Prior art keywords
user
access logs
user access
statistical form
activates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310403440.7A
Other languages
English (en)
Inventor
田亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Leshi Zhixin Electronic Technology Tianjin Co Ltd
Original Assignee
Leshi Zhixin Electronic Technology Tianjin Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Leshi Zhixin Electronic Technology Tianjin Co Ltd filed Critical Leshi Zhixin Electronic Technology Tianjin Co Ltd
Priority to CN201310403440.7A priority Critical patent/CN103500177A/zh
Publication of CN103500177A publication Critical patent/CN103500177A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Fuzzy Systems (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明的实施例提供一种用户激活数的统计方法及装置,涉及通信领域,能够实时保存用户访问日志,保证时间最早的访问日志有效,减少了需要进行统计的原始数据量,提高了运行效率。该方法包括:获取预设时间段内记录的用户访问日志;在预设的用户激活数统计表中,判断所述用户访问日志中的各个用户标识是否已保存至所述预设的用户激活数统计表中;若已保存,则不将已保存的用户标识对应的用户访问日志保存至所述预设的用户激活数统计表中;若未保存,则将未保存的用户标识对应的满足预设条件的用户访问日志保存至所述预设的用户激活数统计表中;根据所述预设时间段内所述预设的用户激活数统计表中新增的用户访问日志的数量,统计用户激活数。

Description

一种用户激活数的统计方法及装置
技术领域
本发明涉及通信领域,尤其涉及一种用户激活数的统计方法及装置。
背景技术
平台能直接或间接为用户提供各种服务,用户激活数,用户活跃度,用户在线时长等都可以作为评估一个平台的指标。其中,平台用户激活是指用户第一次使用平台的行为,用户激活数是评价平台比较重要的一个指标,它的统计对平台的价值评估有着重要指导意义。
在现有技术中,对于没有直接提供用户激活数的平台,在统计用户激活数指标时通常需要记录用户的所有活动日志,然后根据平台上线到现在的所有用户日志进行统计分析,找出哪些用户是本日、本周、本月新增加的用户并进行统计。
但是,由于无法确定用户在某个时间点的活动是用户在该平台上的第一次访问,随着时间推移及用户数和用户活动量的增长,原始数据会越来越多,导致统计的性能则越来越低。
发明内容
本发明的实施例提供了一种用户激活数的统计方法及装置,能够实时保存用户访问日志,同时保证时间最早的访问日志有效,其他访问日志无效或不进行保存,减少了需要进行统计的原始数据量,提高了运行效率。
为达到上述目的,本发明的实施例采用如下技术方案:
本发明实施例提供一种用户激活数的统计方法,包括:
获取预设时间段内记录的用户访问日志,所述用户访问日志至少包括用户标识,以及与各个用户标识对应的访问内容;
在预设的用户激活数统计表中,判断所述用户访问日志中的各个用户标识是否已保存至所述预设的用户激活数统计表中;
若已保存,则不将已保存的用户标识对应的用户访问日志保存至所述预设的用户激活数统计表中;
若未保存,则将未保存的用户标识对应的满足预设条件的用户访问日志保存至所述预设的用户激活数统计表中;
根据所述预设时间段内所述预设的用户激活数统计表中新增的用户访问日志的数量,统计用户激活数。
生成所述预设的用户激活统计表的方法,包括:
读取已记录的所有的用户访问日志;
确定对应于各个用户标识的满足预设条件的用户访问日志;
保存满足所述预设条件的用户访问日志,以生成包含有满足所述预设条件的用户访问日志的用户激活统计表。
所述预设条件为对应于各个用户标识的访问日志中访问时间为最早。
所述不将已保存的用户标识对应的用户访问日志保存至所述预设的用户激活数统计表中,具体包括:
若已保存用户访问日志的数量小于预设门限值,则将所述已保存的用户标识对应的用户访问日志保存至预设的用户访问统计表中;
若已保存用户访问日志的数量等于预设门限值,则删除所述已保存的用户标识对应的用户访问日志。
生成所述预设的用户访问统计表的方法,包括:
读取已记录的所有的用户访问日志;
确定对应于各个用户标识的不满足预设条件的用户访问日志;
按照预设规则,保存所述不满足预设条件的用户访问日志,以生成包含有所述不满足预设条件的用户访问日志的用户访问统计表。
所述将未保存的用户标识对应的满足预设条件的用户访问日志保存至所述预设的用户激活数统计表中,具体包括:
确定所述未保存的用户标识对应的用户访问日志中访问时间为最早的用户访问日志;
将所述访问为时间最早的用户访问日志保存至所述预设的用户激活数统计表中。
本发明实施例提供的一种控制器,包括:
获取单元,用于获取预设时间段内记录的用户访问日志,所述用户访问日志至少包括用户标识,以及与各个用户标识对应的访问内容;
处理单元,用于在预设的用户激活数统计表中,判断所述用户访问日志中的各个用户标识是否已保存至所述预设的用户激活数统计表中;若已保存,则不将已保存的用户标识对应的用户访问日志保存至所述预设的用户激活数统计表中;若未保存,则将未保存的用户标识对应的满足预设条件的用户访问日志保存至所述预设的用户激活数统计表中;根据所述预设时间段内所述预设的用户激活数统计表中新增的用户访问日志的数量,统计用户激活数。
所述处理单元,用于读取已记录的所有的用户访问日志;确定对应于各个用户标识的满足预设条件的用户访问日志;保存满足所述预设条件的用户访问日志,以生成包含有满足所述预设条件的用户访问日志的用户激活统计表。
所述处理单元包括判断模块及存储模块;
所述判断模块,用于在预设的用户激活数统计表中,判断所述用户访问日志中的各个用户标识是否已保存至所述预设的用户激活数统计表中;
所述存储模块,用于将未保存的用户标识对应的满足预设条件的用户访问日志保存至所述预设的用户激活数统计表中。
所述处理单元将未保存的用户标识对应的满足预设条件的用户访问日志保存至所述预设的用户激活数统计表中,具体包括:
确定所述未保存的用户标识对应的用户访问日志中访问时间为最早的用户访问日志;
将所述访问为时间最早的用户访问日志保存至所述预设的用户激活数统计表中。
本发明提供了一种用户激活数的统计方法及装置,平台控制器获取预设时间段内记录的用户访问日志,然后在预设的用户激活数统计表中,判断用户访问日志中的各个用户标识是否已保存至所述预设的用户激活数统计表中,若已保存,则平台控制器不将已保存的用户标识对应的用户访问日志保存至所述预设的用户激活数统计表中,若未保存,则平台控制器将未保存的用户标识对应的满足预设条件的用户访问日志保存至所述预设的用户激活数统计表中,最后,平台控制器根据预设时间段内预设的用户激活数统计表中新增的用户访问日志的数量,统计用户激活数。通过该方案,平台控制器能够实时保存用户访问日志,同时保证时间最早的访问日志有效,其他访问日志无效或不进行保存,减少了需要进行统计的原始数据量,提高了运行效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的用户激活数的统计方法的流程示意图一;
图2为本发明实施例的用户激活数的统计方法的流程示意图二;
图3为本发明实施例的控制器的结构示意图一;
图4为本发明实施例的控制器的结构示意图二。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本文描述的各种技术只适合平台不提供用户激活的具体事件,平台只能提供用户的访问日志作为原始数据。
保存用户访问日志的存储系统,可以是HBase,也可以是支持版本(version)的其他存储系统。其中,HBase是一个分布式的、面向列的开源数据库,它不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库,是基于列的而不是基于行的模式。现有技术中,Bigtable是一个疏松的分布式的持久的多维排序的映射(map),这个map被行键,列键,和时间戳索引。HBase使用和Bigtable非常相同的数据模型,用户存储数据行在一个表里,一个数据行拥有一个可选择的键和任意数量的列,表是疏松的存储的,因此用户可以给行定义各种不同的列。HBase通过行和列确定一个存贮单元,每个存贮单元都保存着同一份数据的多个版本,版本通过时间戳来索引。每个存贮单元中,不同版本的数据按照时间倒序排序,即最新的数据排在最前面。一般的应用程序只是简单(不通过时间戳)的请求一个单元的数据。在这种条件下,HBase只是简单地返回最新的版本,即时间戳最大的版本。为了避免数据存在过多版本造成的的管理(包括存贮和索引)负担,HBase提供了两种数据版本回收方式:一是保存数据的最后n个版本,二是保存最近一段时间内的版本。
MapReduce是一个针对大规模群组中的海量数据(大于1TB)处理的分布式编程模型。MapReduce本身源自于函数式语言,主要通过"映射(Map)"和"化简(Reduce)"这两个步骤来并行处理大规模的数据集。首先,Map会先对由很多独立元素组成的逻辑列表中的每一个元素进行指定的操作,且原始列表不会被更改,会创建多个新的列表来保存Map的处理结果。也就意味着,Map操作是高度并行的。当Map工作完成之后,系统会接着对新生成的多个列表进行清理(Shuffle)和排序,之后,会这些新创建的列表进行Reduce操作,也就是对一个列表中的元素根据Key值进行适当的合并。通过MapReduce这个分布式处理框架,不仅能用于处理大规模数据,而且能将很多繁琐的细节隐藏起来,比如,自动并行化、负载均衡和灾备管理等,这样将极大地简化程序员的开发工作。另外,MapReduce的伸缩性非常好,而过去的大多数分布式处理框架,在伸缩性方面都与MapReduce相差甚远。
实施例一
本发明实施例提供用户激活数的统计方法,如图1所示,该方法包括:
S101、平台控制器获取预设时间段内记录的用户访问日志,其中用户访问日志至少包括用户标识,以及与各个用户标识对应的访问内容。
用户访问平台时,平台控制器会记录每一个用户的所有用户访问日志。
具体的,平台控制器记录用户访问日志后,需要针对所记录的用户访问日志做出相应处理。平台控制器先读取预设时间段内记录的用户访问日志,该用户访问日志至少包括用户标识,以及与各个用户标识对应的访问内容。
可选的,预设时间段可以为每天,两个小时,30分钟等时间段。
S102、平台控制器在预设的用户激活数统计表中,判断用户访问日志中的各个用户标识是否已保存至预设的用户激活数统计表中。
可选的,保存预设的用户激活数统计表的存储系统,可以是HBase,也可以是支持版本(version)的其他存储系统。
具体的,在平台控制器读取预设时间段内记录的用户访问日志后,所述平台控制器根据所述用户访问日志中的用户标识,在预设的用户激活数统计表中判断所述用户访问日志中的各个用户标识是否已保存至所述预设的用户激活数统计表。
例如,当平台控制器读取的用户访问日志中用户标识为张三,则平台控制器在预设的用户激活数统计表中查找是否保存有用户标识为张三的用户访问日志。
S103、若已保存,则平台控制器不将已保存的用户标识对应的用户访问日志保存至预设的用户激活数统计表中。
可选的,保存预设的用户激活数统计表的存储系统,可以是HBase,也可以是支持版本(version)的其他存储系统。
具体的,若所述用户访问日志中的用户标识已保存至HBase所述预设的用户激活数统计表中,则平台控制器将已保存的用户标识对应的用户访问日志不保存至所述预设的用户激活数统计表中。
例如,平台控制器在读取用户标识为张三的用户访问日志后,在预设的用户激活数统计表中判断,若HBase用户激活数统计表中已经保存有用户标识为张三的用户访问日志,则不将所读取的用户标识为张三的用户访问日志保存在预设的用户激活数统计表中。
S104、若未保存,则平台控制器将未保存的用户标识对应的满足预设条件的用户访问日志保存至预设的用户激活数统计表中。
可选的,保存用户访问日志的存储系统,可以是HBase,也可以是支持版本(version)的其他存储系统。
具体的,若所述用户访问日志中的用户标识未保存至所述预设的用户激活数统计表中,则平台控制器将未保存的用户标识对应的用户访问日志保存至所述预设的用户激活数统计表中。
例如,平台控制器在读取用户标识为张三的用户访问日志后,在预设的用户激活数统计表中判断,若HBase用户激活数统计表中尚未保存有用户标识为张三的用户访问日志,则将所读取的用户标识为张三的用户访问日志保存至预设的用户激活数统计表中。
S105、平台控制器根据预设时间段内预设的用户激活数统计表中新增的用户访问日志的数量,统计用户激活数。
具体的,当平台控制器需要对用户激活数进行统计时,平台控制器只需在预设的用户激活数统计表中查找预设时间段内新增的用户访问日志,进行用户激活数统计。
例如,平台控制器需要统计2013年5月5日的新增用户数量时,平台控制器只需在预设的用户激活数统计表中,根据2013年5月5日查找新增的用户访问日志,对相应的用户访问日志数量进行统计,即对2013年5月5日的用户激活数进行了统计。
本发明提供了一种用户激活数的统计方法,平台控制器获取预设时间段内记录的用户访问日志,然后在预设的用户激活数统计表中,判断用户访问日志中的各个用户标识是否已保存至所述预设的用户激活数统计表中,若已保存,则平台控制器不将已保存的用户标识对应的用户访问日志保存至所述预设的用户激活数统计表中,若未保存,则平台控制器将未保存的用户标识对应的满足预设条件的用户访问日志保存至所述预设的用户激活数统计表中,最后,平台控制器根据预设时间段内预设的用户激活数统计表中新增的用户访问日志的数量,统计用户激活数。通过该方案,平台控制器能够实时保存用户访问日志,同时保证时间最早的访问日志有效,其他访问日志无效或不进行保存,减少了需要进行统计的原始数据量,提高了运行效率。
实施例二
本实施例提供了一种用户激活数的统计方法,如图2所示,该方法包括:
S201、平台控制器获取预设时间段内记录的用户访问日志。
平台控制器会记录每一个用户访问平台时的所有用户访问日志。
其中,用户访问日志至少包括用户标识,以及与各个用户标识对应的访问内容,用户标识包括用户ID、用户账号中的至少一个,与各个用户标识对应的访问内容包括访问时间、用户所在地理位置信息中的至少一个。
具体的,平台控制器记录用户访问日志后,需要针对所记录的用户访问日志做出相应处理,平台控制器首先读取预设时间段内记录的用户访问日志。
可选的,预设时间段可以为每天,两个小时,30分钟等时间段。
S202、平台控制器在预设的用户激活数统计表中,判断用户访问日志中的各个用户标识是否已保存至预设的用户激活数统计表中。
可选的,保存预设的用户激活数统计表的存储系统,可以是HBase,也可以是支持版本(version)的其他存储系统。
具体的,预设的用户激活统计表是通过平台控制器读取已记录的所有的用户访问日志,然后,确定对应于各个用户标识的用户访问日志中访问时间为最早的用户访问日志,最后保存各个用户标识对应访问时间为最早的用户访问日志后生成的。
可选的,若保存预设的用户激活数统计表的存储系统是HBase,则所述预设的用户激活统计表可以使用用户标识作为HBase的行主键,日志内容作为列进行保存,每个列的版本值为(Long.maxValue()-事件发生时间)。
进一步地,在平台控制器读取预设时间段内记录的用户访问日志后,平台控制器根据用户访问日志中的用户标识,在HBase预设的用户激活数统计表中判断用户访问日志中的各个用户标识是否已保存至预设的用户激活数统计表。
例如,当平台控制器读取的用户访问日志中用户标识为张三,则平台控制器在HBase预设的用户激活数统计表中查找是否保存有用户标识为张三的用户访问日志。
S203、若用户访问日志中的各个用户标识已保存至预设的用户激活数统计表中,且已保存用户访问日志的数量小于预设门限值,则平台控制器将该已保存的用户标识对应的用户访问日志保存至预设的用户访问统计表中。
可选的,保存用户访问日志的存储系统,可以是HBase,也可以是支持版本(version)的其他存储系统。
具体的,若保存用户访问日志的存储系统为HBase,所述用户访问日志中的用户标识已保存至所述预设的用户激活数统计表中,则HBase将已保存的用户标识对应的用户访问日志不保存至预设的用户激活数统计表中。
进一步地,若已保存用户访问日志的数量小于预设门限值,则HBase将已保存的用户标识对应的用户访问日志保存至预设的用户访问统计表中。
具体的,预设的用户访问统计表是通过平台控制器读取已记录的所有的用户访问日志,确定对应于各个用户标识的访问时间不是最早的用户访问日志,最后按照HBase提供的数据版本回收方式,保存所述访问时间不是最早的用户访问日志后生成的。
例如,用户标识为张三的用户访问日志已经在HBase预设的用户激活数统计表中保存。平台控制器在读取用户标识为张三的用户访问日志后,在预设的用户激活数统计表中判断,得知在用户激活数统计表中已经保存有用户标识为张三的用户访问日志,则不将所读取的用户标识为张三的用户访问日志保存在预设的用户激活数统计表中。若HBase预设的用户激活数统计表中用户标识为张三的用户访问日志数量小于HBase提供的数据版本数量,则将所读取的用户标识为张三的用户访问日志保存在预设的用户访问统计表中,作为历史版本保存。
S204、若用户访问日志中的各个用户标识已保存至预设的用户激活数统计表中,且已保存用户访问日志的数量等于预设门限值,则平台控制器删除该已保存的用户标识对应的用户访问日志。
可选的,保存用户访问日志的存储系统,可以是HBase,也可以是支持版本(version)的其他存储系统。
具体的,若保存用户访问日志的存储系统为HBase,用户访问日志中的用户标识已保存至预设的用户激活数统计表中,则HBase将已保存的用户标识对应的用户访问日志不保存至预设的用户激活数统计表中。
进一步地,若已保存用户访问日志的数量等于预设门限值,则删除所述已保存的用户标识对应的用户访问日志。
例如,用户标识为张三的用户访问日志已经在HBase所述预设的用户激活数统计表中保存。平台控制器在读取用户标识为张三的用户访问日志后,在预设的用户激活数统计表中判断,得知在用户激活数统计表中已经保存有用户标识为张三的用户访问日志,则不将所读取的用户标识为张三的用户访问日志保存在预设的用户激活数统计表中。若HBase预设的用户激活数统计表中用户标识为张三的用户访问日志数量等于HBase提供的数据版本数量,则删除所读取的用户标识为张三的用户访问日志。
S205、若用户访问日志中的各个用户标识未保存至预设的用户激活数统计表中,则平台控制器将该未保存的用户标识对应的满足预设条件的用户访问日志保存至预设的用户激活数统计表中。
可选的,保存用户访问日志的存储系统,可以是HBase,也可以是支持版本(version)的其他存储系统。
具体的,若保存用户访问日志的存储系统为HBase,用户访问日志中的用户标识未保存至预设的用户激活数统计表中,则HBase将未保存的用户标识对应的用户访问日志保存至预设的用户激活数统计表中。
可选的,保存用户访问日志时,可以使用用户标识作为行主键,日志内容作为列进行保存,每个列的版本值为(Long.maxValue()-事件发生时间)。
例如,平台控制器在读取用户标识为张三的用户访问日志后,在HBase预设的用户激活数统计表中判断,得知在用户激活数统计表中未保存有用户标识为张三的用户访问日志,则将所读取的用户标识为张三的用户访问日志使用张三作为行主键,日志内容作为列进行保存,每个列的版本内容为(Long.maxValue()-访问时间),保存至预设的用户激活数统计表中。
S206、平台控制器根据预设时间段内预设的用户激活数统计表中新增的用户访问日志的数量,统计用户激活数。
可选的,统计用户激活数可以使用mapreduce计算。
具体的,若使用mapreduce进行计算,平台控制器从HBase中读取数据,并根据预设时间段内预设的用户激活数统计表中新增的用户访问日志的数量,进行相应的统计。
例如,平台控制器需要统计2013年5月5日的新增用户数量时,平台控制器只需在HBase预设的用户激活数统计表中,根据2013年5月5日查找新增的用户访问日志,使用mapreduce对相应的用户访问日志数量进行统计,即对2013年5月5日的用户激活数进行了统计。
可选的,平台控制器也可以从HBase中读取数据,按照所述预设时间段内和用户所在地理位置信息,计算预设的用户激活数统计表中新增的用户访问日志的数量。
例如,平台控制器需要统计2013年5月5日北京地区的新增用户数量时,平台控制器只需在HBase预设的用户激活数统计表中,根据2013年5月5日和北京地区查找新增的用户访问日志,使用mapreduce对相应的用户访问日志数量进行统计,即对2013年5月5日北京地区的用户激活数进行了统计。
本发明提供了一种用户激活数的统计方法,平台控制器获取预设时间段内记录的用户访问日志,然后在预设的用户激活数统计表中,判断用户访问日志中的各个用户标识是否已保存至所述预设的用户激活数统计表中,若已保存,则平台控制器不将已保存的用户标识对应的用户访问日志保存至所述预设的用户激活数统计表中,若未保存,则平台控制器将未保存的用户标识对应的满足预设条件的用户访问日志保存至所述预设的用户激活数统计表中,最后,平台控制器根据预设时间段内预设的用户激活数统计表中新增的用户访问日志的数量,统计用户激活数。通过该方案,平台控制器能够实时保存用户访问日志,同时保证时间最早的访问日志有效,其他访问日志无效或不进行保存,减少了需要进行统计的原始数据量,提高了运行效率。
实施例三
本发明提供了一种控制器,如图3所示,包括:
获取单元10,用于获取预设时间段内记录的用户访问日志,所述用户访问日志至少包括用户标识,以及与各个用户标识对应的访问内容;
处理单元11,用于在预设的用户激活数统计表中,判断所述用户访问日志中的各个用户标识是否已保存至所述预设的用户激活数统计表中;若已保存,则不将已保存的用户标识对应的用户访问日志保存至所述预设的用户激活数统计表中;若未保存,则将未保存的用户标识对应的满足预设条件的用户访问日志保存至所述预设的用户激活数统计表中;根据所述预设时间段内所述预设的用户激活数统计表中新增的用户访问日志的数量,统计用户激活数。
进一步地,所述处理单元11,用于读取已记录的所有的用户访问日志;确定对应于各个用户标识的满足预设条件的用户访问日志;保存满足所述预设条件的用户访问日志,以生成包含有满足所述预设条件的用户访问日志的用户激活统计表。
进一步地,如图4所示,所述处理单元11包括判断模块12及存储模块13;
所述判断模块12,用于在预设的用户激活数统计表中,判断所述用户访问日志中的各个用户标识是否已保存至所述预设的用户激活数统计表中;
所述存储模块13,用于将未保存的用户标识对应的满足预设条件的用户访问日志保存至所述预设的用户激活数统计表中。
进一步地,所述处理单元11将未保存的用户标识对应的满足预设条件的用户访问日志保存至所述预设的用户激活数统计表中,具体包括:
确定所述未保存的用户标识对应的用户访问日志中访问时间为最早的用户访问日志;
将所述访问为时间最早的用户访问日志保存至所述预设的用户激活数统计表中。
本发明提供了一种控制器,主要包括获取单元和处理单元。平台控制器获取预设时间段内记录的用户访问日志,然后在预设的用户激活数统计表中,判断用户访问日志中的各个用户标识是否已保存至所述预设的用户激活数统计表中,若已保存,则平台控制器不将已保存的用户标识对应的用户访问日志保存至所述预设的用户激活数统计表中,若未保存,则平台控制器将未保存的用户标识对应的满足预设条件的用户访问日志保存至所述预设的用户激活数统计表中,最后,平台控制器根据预设时间段内预设的用户激活数统计表中新增的用户访问日志的数量,统计用户激活数。通过该方案,平台控制器能够实时保存用户访问日志,同时保证时间最早的访问日志有效,其他访问日志无效或不进行保存,减少了需要进行统计的原始数据量,提高了运行效率。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种用户激活数的统计方法,其特征在于,包括:
获取预设时间段内记录的用户访问日志,所述用户访问日志至少包括用户标识,以及与各个用户标识对应的访问内容;
在预设的用户激活数统计表中,判断所述用户访问日志中的各个用户标识是否已保存至所述预设的用户激活数统计表中;
若已保存,则不将已保存的用户标识对应的用户访问日志保存至所述预设的用户激活数统计表中;
若未保存,则将未保存的用户标识对应的满足预设条件的用户访问日志保存至所述预设的用户激活数统计表中;
根据所述预设时间段内所述预设的用户激活数统计表中新增的用户访问日志的数量,统计用户激活数。
2.根据权利要求1所述的用户激活数的统计方法,其特征在于,生成所述预设的用户激活统计表的方法,包括:
读取已记录的所有的用户访问日志;
确定对应于各个用户标识的满足预设条件的用户访问日志;
保存满足所述预设条件的用户访问日志,以生成包含有满足所述预设条件的用户访问日志的用户激活统计表。
3.根据权利要求1或2所述的用户激活数的统计方法,其特征在于,所述预设条件为对应于各个用户标识的访问日志中访问时间为最早。
4.根据权利要求1所述的用户激活数的统计方法,其特征在于,所述不将已保存的用户标识对应的用户访问日志保存至所述预设的用户激活数统计表中,具体包括:
若已保存用户访问日志的数量小于预设门限值,则将所述已保存的用户标识对应的用户访问日志保存至预设的用户访问统计表中;
若已保存用户访问日志的数量等于预设门限值,则删除所述已保存的用户标识对应的用户访问日志。
5.所述根据权利要求4所述的用户激活数的统计方法,其特征在于,生成所述预设的用户访问统计表的方法,包括:
读取已记录的所有的用户访问日志;
确定对应于各个用户标识的不满足预设条件的用户访问日志;
按照预设规则,保存所述不满足预设条件的用户访问日志,以生成包含有所述不满足预设条件的用户访问日志的用户访问统计表。
6.根据权利要求1所述的用户激活数的统计方法,其特征在于,所述将未保存的用户标识对应的满足预设条件的用户访问日志保存至所述预设的用户激活数统计表中,具体包括:
确定所述未保存的用户标识对应的用户访问日志中访问时间为最早的用户访问日志;
将所述访问为时间最早的用户访问日志保存至所述预设的用户激活数统计表中。
7.一种控制器,其特征在于,包括:
获取单元,用于获取预设时间段内记录的用户访问日志,所述用户访问日志至少包括用户标识,以及与各个用户标识对应的访问内容;
处理单元,用于在预设的用户激活数统计表中,判断所述用户访问日志中的各个用户标识是否已保存至所述预设的用户激活数统计表中;若已保存,则不将已保存的用户标识对应的用户访问日志保存至所述预设的用户激活数统计表中;若未保存,则将未保存的用户标识对应的满足预设条件的用户访问日志保存至所述预设的用户激活数统计表中;根据所述预设时间段内所述预设的用户激活数统计表中新增的用户访问日志的数量,统计用户激活数。
8.根据权利要求7所述的控制器,其特征在于,
所述处理单元,用于读取已记录的所有的用户访问日志;确定对应于各个用户标识的满足预设条件的用户访问日志;保存满足所述预设条件的用户访问日志,以生成包含有满足所述预设条件的用户访问日志的用户激活统计表。
9.根据权利要求7所述的控制器,其特征在于,所述处理单元包括判断模块及存储模块;
所述判断模块,用于在预设的用户激活数统计表中,判断所述用户访问日志中的各个用户标识是否已保存至所述预设的用户激活数统计表中;
所述存储模块,用于将未保存的用户标识对应的满足预设条件的用户访问日志保存至所述预设的用户激活数统计表中。
10.根据权利要求9所述的控制器,其特征在于,所述处理单元将未保存的用户标识对应的满足预设条件的用户访问日志保存至所述预设的用户激活数统计表中,具体包括:
确定所述未保存的用户标识对应的用户访问日志中访问时间为最早的用户访问日志;
将所述访问为时间最早的用户访问日志保存至所述预设的用户激活数统计表中。
CN201310403440.7A 2013-09-06 2013-09-06 一种用户激活数的统计方法及装置 Pending CN103500177A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310403440.7A CN103500177A (zh) 2013-09-06 2013-09-06 一种用户激活数的统计方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310403440.7A CN103500177A (zh) 2013-09-06 2013-09-06 一种用户激活数的统计方法及装置

Publications (1)

Publication Number Publication Date
CN103500177A true CN103500177A (zh) 2014-01-08

Family

ID=49865388

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310403440.7A Pending CN103500177A (zh) 2013-09-06 2013-09-06 一种用户激活数的统计方法及装置

Country Status (1)

Country Link
CN (1) CN103500177A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104504077A (zh) * 2014-12-22 2015-04-08 北京国双科技有限公司 网页访问数据的统计方法和装置
CN105824952A (zh) * 2016-03-28 2016-08-03 努比亚技术有限公司 一种处理数据的装置和方法
CN106294090A (zh) * 2016-08-03 2017-01-04 五八同城信息技术有限公司 一种数据统计方法和装置
CN108427687A (zh) * 2017-02-15 2018-08-21 北京国双科技有限公司 一种用户数处理方法及装置
CN109246216A (zh) * 2018-09-11 2019-01-18 北京云测信息技术有限公司 一种访问请求处理方法和装置
CN109960922A (zh) * 2019-03-11 2019-07-02 北京三快在线科技有限公司 一种识别新激活设备的方法及装置
CN113377734A (zh) * 2021-07-02 2021-09-10 北京爱奇艺科技有限公司 一种数据统计方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101242307A (zh) * 2008-02-01 2008-08-13 刘峰 用嵌入代码代理日志实现网站访问分析系统与方法
CN102043705A (zh) * 2009-10-19 2011-05-04 阿里巴巴集团控股有限公司 一种统计输入行为的方法及装置
CN102880676A (zh) * 2012-09-10 2013-01-16 新浪网技术(中国)有限公司 统计用户行为数据的方法及用户行为数据统计系统
CN103001796A (zh) * 2012-11-13 2013-03-27 北界创想(北京)软件有限公司 服务端处理网络日志数据的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101242307A (zh) * 2008-02-01 2008-08-13 刘峰 用嵌入代码代理日志实现网站访问分析系统与方法
CN102043705A (zh) * 2009-10-19 2011-05-04 阿里巴巴集团控股有限公司 一种统计输入行为的方法及装置
CN102880676A (zh) * 2012-09-10 2013-01-16 新浪网技术(中国)有限公司 统计用户行为数据的方法及用户行为数据统计系统
CN103001796A (zh) * 2012-11-13 2013-03-27 北界创想(北京)软件有限公司 服务端处理网络日志数据的方法及装置

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104504077A (zh) * 2014-12-22 2015-04-08 北京国双科技有限公司 网页访问数据的统计方法和装置
CN104504077B (zh) * 2014-12-22 2018-04-03 北京国双科技有限公司 网页访问数据的统计方法和装置
CN105824952A (zh) * 2016-03-28 2016-08-03 努比亚技术有限公司 一种处理数据的装置和方法
CN105824952B (zh) * 2016-03-28 2019-04-19 努比亚技术有限公司 一种处理数据的装置和方法
CN106294090A (zh) * 2016-08-03 2017-01-04 五八同城信息技术有限公司 一种数据统计方法和装置
CN108427687A (zh) * 2017-02-15 2018-08-21 北京国双科技有限公司 一种用户数处理方法及装置
CN109246216A (zh) * 2018-09-11 2019-01-18 北京云测信息技术有限公司 一种访问请求处理方法和装置
CN109960922A (zh) * 2019-03-11 2019-07-02 北京三快在线科技有限公司 一种识别新激活设备的方法及装置
CN109960922B (zh) * 2019-03-11 2021-09-07 北京三快在线科技有限公司 一种识别新激活设备的方法及装置
CN113377734A (zh) * 2021-07-02 2021-09-10 北京爱奇艺科技有限公司 一种数据统计方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN103500177A (zh) 一种用户激活数的统计方法及装置
CN103425663B (zh) 嵌入式系统数据库创建表、存记录、删记录的方法和装置
CN103902653B (zh) 一种构建数据仓库表血缘关系图的方法和装置
CN102129442A (zh) 一种分布式数据库系统和数据访问方法
CN104881353B (zh) 面向Hive平台的用户行为审计系统及方法
CN103399861B (zh) 一种网址导航中的网址推荐方法、装置和系统
CN104281717B (zh) 一种建立海量id映射关系的方法
CN105989160A (zh) 一种针对Redis数据库的内存数据持久化方法和装置
CN103246549B (zh) 一种数据转存的方法及系统
CN106095828A (zh) 一种基于用电信息采集终端的曲线数据存储方案
CN108304142B (zh) 一种数据管理方法和装置
CN103645984B (zh) 日志处理方法及装置
CN102937956A (zh) 一种智能变电站中实时报文的存储方法及其装置
CN101639851A (zh) 一种数据存储、查询的方法和装置
CN111672128A (zh) 基于本地保留时长识别的游戏商城游戏推荐方法及系统
CN110851758B (zh) 一种网页访客数量统计方法及装置
CN111913913A (zh) 访问请求的处理方法和装置
CN102611725B (zh) 一种存储节点的方法及装置
CN105164629A (zh) 计算机系统及其层级存储的控制方法
CN106961670B (zh) 基于分布式架构的地理围栏系统及工作方法
JP6012869B2 (ja) 情報管理システム、情報管理装置、情報管理方法、及びプログラム
CN112650931B (zh) 一种内容推荐方法
CN108197255A (zh) 一种设置查询树的方法、设备及计算机可读存储介质
CN105550347B (zh) 数据处理方法及装置
CN108984720B (zh) 基于列存储的数据查询方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140108

RJ01 Rejection of invention patent application after publication