CN112527803B - 一种数据处理方法、装置以及计算机设备 - Google Patents
一种数据处理方法、装置以及计算机设备 Download PDFInfo
- Publication number
- CN112527803B CN112527803B CN202011604823.7A CN202011604823A CN112527803B CN 112527803 B CN112527803 B CN 112527803B CN 202011604823 A CN202011604823 A CN 202011604823A CN 112527803 B CN112527803 B CN 112527803B
- Authority
- CN
- China
- Prior art keywords
- user
- target
- data
- time
- bitmap field
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 25
- 238000000034 method Methods 0.000 claims abstract description 34
- 238000004364 calculation method Methods 0.000 claims abstract description 20
- 238000012545 processing Methods 0.000 claims abstract description 18
- 230000006399 behavior Effects 0.000 claims description 50
- 230000014759 maintenance of location Effects 0.000 claims description 30
- 238000007619 statistical method Methods 0.000 claims description 12
- 230000002688 persistence Effects 0.000 claims 1
- 238000004590 computer program Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000000717 retained effect Effects 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开提供了一种数据处理方法、装置以及计算机设备,其中,该方法包括:获取用户针对目标应用的行为数据;根据行为数据,更新目标数据表中的统计数据;其中,目标数据表中的每条统计数据对应一个用户,且,每条统计数据至少包括用户标识信息、用户注册时间、以及用户操作信息,用户操作信息中包含目标位图字段,目标位图字段用于表征用户在预设时间内针对目标应用的操作次数和/或操作时间;基于统计数据,确定目标应用对应的新增数据和留存数据。本公开实施例能够降低了数据计算的复杂度,以及提高了数据处理的效率。
Description
技术领域
本公开涉及数据处理的技术领域,具体而言,涉及一种数据处理方法、装置以及计算机设备。
背景技术
随着互联网技术的发展,网络用户数量逐年增加,例如,用户可以通过互联网观看视频,在线直播,以及进行相关学习和教育等。比如,线上教育行业,越来越多的人选择通过网络去学习。因此,针对现有的应用程序需要通过对用户行为数据进行分析来确定该应用程序用户的新增情况和留存情况。在现有的技术方案中,可以预先根据用户行为数据统计出多个数据表格,例如,用户新增表和用户操作表,然后,根据用户新增表和用户操作表进行统计分析。但是,采用该方式进行统计分析时,需要将多个表格之间进行关联才能获取数据,此时,将多个表格进行关联的方式增加了数据计算的复杂度,从而降低了数据计算的效率。
发明内容
本公开实施例至少提供一种数据处理方法、装置以及计算机设备。
第一方面,本公开实施例提供了一种数据处理方法,包括:获取用户针对目标应用的行为数据;根据所述行为数据,更新目标数据表中的统计数据;其中,所述目标数据表中的每条统计数据对应一个用户,且,每条统计数据至少包括用户标识信息、用户注册时间、以及用户操作信息,所述用户操作信息中包含目标位图字段,所述目标位图字段用于表征用户在预设时间内针对目标应用的操作次数和/或操作时间;基于所述统计数据,确定所述目标应用对应的新增数据和留存数据。
在本公开实施例中,在获取到用户针对目标应用的行为数据之后,首先对行为数据进行处理,得到一个包含多条统计数据的目标数据表。在确定目标应用的新增数据和留存数据时,不必再将多个表格进行关联,通过一个目标数据表就可以确定目标应用的用户新增数据和留存数据,从而降低了数据计算的复杂度,以及提高了数据处理的效率;通过目标位图字段来统计用户在预设时间内的操作次数和/或操作时间的方式,能够实现在一个条数据中记录对应用户的操作情况,从而避免了数据之间的重复性。
结合第一方面,本公开实施例提供了第一方面的第一种可能的实施方式,其中,所述根据所述行为数据,更新目标数据表中的统计数据,包括:基于所述行为数据确定用户对所述目标应用执行操作的操作时间;根据所述操作时间,更新第一统计数据中用户操作信息的目标位图字段,其中,所述第一统计数据所对应的用户与所述行为数据中所对应的用户相同。
结合第一方面第一种可能的实施方式,本公开实施例提供了第一方面的第二种可能的实施方式,其中,若所述预设时间为预设月份,则所述目标位图字段用于表征该用户在所述预设月份内的月操作次数和/或月操作时间;若所述预设时间为预设年份,则所述目标位图字段用于表征该用户在所述预设年份内的年操作次数和/或年操作时间。
结合第一方面的第一种可能的实施方式或第二种可能的实施方式,本公开实施例提供了第一方面的第三种可能的实施方式,其中,所述目标位图字段包括以下任一种:二进制位图字段、十进制位图字段、八进制位图字段和十六进制位图字段。
结合第一方面,本公开实施例提供了第一方面的第四种可能的实施方式,其中,所述基于所述统计数据,确定所述目标应用对应的留存数据,包括:获取第一目标时间;对所述统计数据中用户操作信息的目标位图字段进行遍历,确定在所述第一目标时间对所述目标应用执行操作的第一目标用户;根据确定出的第一目标用户的数量确定所述目标应用对应的留存数据。
结合第一方面,本公开实施例提供了第一方面的第五种可能的实施方式,其中,所述基于所述统计数据,确定所述目标应用对应的新增数据,包括:确定第一注册时间;对每条所述统计数据中的用户注册时间进行遍历,确定注册时间为所述第一注册时间的第二目标用户;根据确定出的第二目标用户的数量确定所述目标应用对应的新增数据。
结合第一方面,本公开实施例提供了第一方面的第六种可能的实施方式,其中,所述基于所述统计数据,确定所述目标应用对应的留存数据,包括:基于所述统计数据确定第三目标用户,其中,所述第三目标用户包括:注册时间为第二注册时间的用户,或者,操作时间为第二目标时间的用户;基于所述统计数据中用户操作信息的目标位图字段确定目标时间段内对所述目标应用执行操作的用户信息;其中,所述目标时间段为所述第二注册时间或者所述第二目标时间之后的时间段;根据所述目标时间段内对所述目标应用执行操作的用户信息确定所述第三目标用户在所述目标时间段内的留存数据。
结合第一方面,本公开实施例提供了第一方面的第七种可能的实施方式,其中,所述方法还包括:读取所述目标数据表中每条统计数据中用户操作信息的目标位图字段;根据读取到的用户操作信息的目标位图字段确定每个用户的登录记录;对所述每个用户的登录记录进行平均计算,得到所述用户年平均登录时间。
第二方面,本公开实施例还提供一种数据处理装置,包括:获取单元,用于获取用户针对目标应用的行为数据;更新单元,用于根据所述行为数据,更新目标数据表中的统计数据;其中,所述目标数据表中的每条统计数据对应一个用户,且,每条统计数据至少包括用户标识信息、用户注册时间、以及用户操作信息,所述用户操作信息中包含目标位图字段,所述目标位图字段用于表征用户在预设时间内针对目标应用的操作次数和/或操作时间;统计分析单元,用于基于所述统计数据,确定所述目标应用对应的用户新增数据和留存数据。
第三方面,本公开实施例还提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
本公开实施例提供的一种数据处理方法、装置以及计算机设备,在该方法中,在获取到用户针对目标应用的行为数据之后,首先对行为数据进行处理,得到一个包含多条统计数据的目标数据表。在确定目标应用的新增数据和留存数据时,不必再将多个表格进行关联,通过一个目标数据表就可以确定目标应用的用户新增数据和留存数据,从而降低了数据计算的复杂度,以及提高了数据处理的效率;通过目标位图字段来统计用户在预设时间内的操作次数和/或操作时间的方式,能够实现在一个条数据中记录对应用户的操作情况,从而避免了数据之间的重复性。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了现有技术中所提供的一种数据处理方法的示意图;
图2示出了本公开实施例所提供的一种数据处理方法的流程图;
图3示出了本公开实施例所提供的一种数据处理方法中,基于获取的用户行为数据,更新目标应用的目标数据表中的至少一条统计数据的具体方法的流程图;
图4示出了本公开实施例所提供的一种数据处理方法的示意图;
图5示出了本公开实施例所提供的一种数据处理方法中,根据行为数据更新目标数据表中的统计数据的具体方法的流程图;
图6示出了本公开实施例所提供的一种数据处理方法中,第一种基于所述统计数据,确定目标应用对应的新增数据和留存数据的具体方法的流程图;
图7示出了本公开实施例所提供的一种数据处理方法中,第二种基于所述统计数据,确定目标应用对应的新增数据和留存数据的具体方法的流程图;
图8示出了本公开实施例所提供的一种数据处理装置的示意图;
图9示出了本公开实施例所提供的一种计算机设备的结构示意图。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
经研究发现,在现有的用户新增数据和用户留存数据的统计处理方法中,根据用户行为数据统计出多个数据表格,例如,用户新增表和用户活跃表;根据用户新增表和用户活跃表进行用户新增数据和用户留存数据的统计分析。如图1所示,20200101新增设备至20200104新增设备即为上述所描述的用户新增表,20200101活跃设备至20200104活跃设备即为上述所描述的用户活跃表。图1中设备活跃日志中所存储的数据即为用户行为数据。但是,采用将用户行为数据统计用户新增表和用户活跃表的方式会导致用户新增表和用户活跃表中包含重复的数据,例如,用户新增表中可能会包含用户活跃表中的数据,用户活跃表中也可能会包含用户新增表中的数据。在此情况下,在计算用户新增数据和用户留存数据时,就需要将用户新增表和用户活跃表进行关联才能获取数据。此时,将用户新增表和用户活跃表进行关联的方式增加了数据计算的复杂度,从而降低了数据计算的效率。
基于上述研究,本公开提供了一种数据处理方法,首先,对用户针对目标应用的行为数据进行处理,得到一个包含多条统计数据的目标数据表此时,在确定目标应用的新增数据和留存数据时,不必再将多个表格进行关联,通过一个目标数据表就可以确定目标应用的用户新增数据和留存数据,上述处理方式可以降低数据计算的复杂度,以及提高数据处理的效率;通过目标位图字段来统计用户在预设时间内的操作次数和/或操作时间的方式,能够实现在一个条数据中记录对应用户的操作情况,从而避免了数据之间的重复性。
针对以上方案所存在的缺陷,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本公开针对上述问题所提出的解决方案,都应该是发明人在本公开过程中对本公开做出的贡献。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
为便于对本实施例进行理解,首先对本公开实施例所公开的一种数据处理方法进行详细介绍,本公开实施例所提供的数据处理方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该数据处理方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
下面以执行主体为终端设备为例对本公开实施例提供的数据处理方法加以说明。
实施例一
参见图2所示,为本公开实施例提供的一种数据处理方法的流程图,所述方法包括步骤S201~S205,其中:
步骤S201:获取用户针对目标应用的行为数据。
步骤S203:基于行为数据,更新目标数据表中的统计数据;其中,目标数据表中的每条统计数据对应一个用户,且,每条统计数据至少包括用户标识信息、用户注册时间、以及用户操作信息,所述用户操作信息中包含目标位图字段,所述目标位图字段用于表征用户在预设时间内针对目标应用的操作次数和/或操作时间。
在本公开实施例中,行为数据可以为用户在访问目标应用时所产生的数据,例如,该行为数据可以为用户注册时间、用户登录时间,用户下线时间,用户的访问记录等数据。其中,该行为数据可以包含在设备操作日志中。
在本公开实施例中,在目标数据表中包含至少一条统计数据,每条统计数据对应一个用户。统计数据中的用户标识信息可以为用户账号信息,还可以为登录该用户账号信息的设备ID信息。用户注册时间可以为用户首次登录该目标应用的日期,例如,可以为2020年10月10日13时30分。用户操作信息可以为该用户在首次登录该目标应用之后对该目标应用执行相应操作的信息,例如,假设该用户的注册时间信息为2020年10月10号13时30分,那么该用户操作信息可以为该用户在2020年10月10号13时30分之后的一段时间内的对目标应用的操作信息,其中,一段时间的时长可以实际需要来进行设定。
用户操作信息可以为用户对目标应用的登入登出操作,对该目标应用的点击、浏览、购买、收藏和评论等用户对目标应用的各种操作行为。
在本公开实施例中,可以通过目标位图字段来统计用户在预设时间内的操作次数和/或操作时间,通过上述统计方式,能够实现在一个条数据中记录对应的用户操作信息,从而避免了数据之间的重复性,以保证未丢失任何数据的情况下,简化了用户行为数据的存储,在存储简化的基础上,实现现有技术计算逻辑的简化。
步骤S205:基于统计数据,确定所述目标应用对应的新增数据和留存数据。
在本公开实施例中,可以设置在检测到统计数据满足统计触发条件的情况下,确定目标应用对应的新增数据和留存数据,其中,统计触发条件可以为预先设定的任意触发条件。例如,当检测到用户的统计指令之后,则确定满足预设的统计触发条件。又例如,在检测到当前时间为预设统计时间的情况下,确定满足预设的统计触发条件,其中,用户可以设定每隔一段时间对目标数据表中的统计数据进行统计分析,具体时间间隔本公开不作具体限定。
在本公开实施例中,在获取到用户针对目标应用的行为数据之后,首先对行为数据进行处理,得到一个包含多条统计数据的目标数据表。在确定目标应用的新增数据和留存数据时,不必再将多个表格进行关联,通过一个目标数据表就可以确定目标应用的用户新增数据和留存数据,从而降低了数据计算的复杂度,以及提高了数据处理的效率。
在本公开的一个可选实施方式中,如图3所示,上述步骤S203,根据行为数据,更新目标数据表中的统计数据,包括如下步骤:
步骤S301:基于行为数据确定用户对所述目标应用执行操作的操作时间;
在本公开实施例中,操作时间可以理解为用户对目标应用执行相应操作的时间,例如,执行以下任一种操作的时间:登入、登出、点击、浏览、购买、收藏和评论等操作。例如,该操作时间可以表示为:某用户在2020年10月10日10时30分登录该目标应用,或者表示为:某用户在2020年10月10日10时30分浏览该目标应用中的某个页面,或者表示为:某用户在2020年10月10日10时30分收藏该目标应用中的某个页面。
步骤S302:根据操作时间,更新第一统计数据中用户操作信息的目标位图字段,其中,所述第一统计数据所对应的用户与所述用户行为数据中所对应的用户相同。
通过上述描述可知,在本公开实施例中,每条统计数据对应一个用户ID,该用户ID可以是用户账号信息或者用户所使用的设备ID信息。在本公开实施例中,在获取到行为数据之后,首先要根据行为数据确定其所对应的用户ID(记为用户A)。然后,在目标数据表中查找所属于该用户ID(用户A)的统计数据,并将查找到的统计数据标记为第一统计数据。
在本公开实施例中,如图4所示,目标数据表中的每条统计数据包括以下信息:用户标识信息、用户注册时间、以及用户操作信息。也就是说,在第一统计数据中包含以下信息:用户A的标识信息(例如,用户A的用户ID信息)、用户A的注册时间、以及用户A对目标应用执行相应操作的操作信息。其中,用户A的用户操作信息可以通过目标位图字段来进行表示,该目标位图字段用于表征用户A在预设时间内的操作次数和/或操作时间。
在本公开实施例中,可以根据获取到的用户针对目标应用的行为数据确定用户A对目标应用执行操作的操作时间,然后,根据该操作时间对第一统计数据中的目标位图字段进行更新,使得更新之后的目标位图字段记录用户的本次操作记录。
需要说明的是,在本公开实施例中,如果在目标数据表中未查找到所属于该用户ID(用户A)的统计数据,则在目标数据表中为该用户A创建一条统计数据,以使新创建的统计数据中的目标位图字段记录用户的本次操作记录。该条统计数据中包含:用户A的用户标识信息(用户A的用户ID信息)、用户A的用户注册时间、以及用户A的用户操作信息。
通过上述描述可知,在现有技术中,预先设定了多个表,例如,新增设备表和活跃设备表。但是,在新增设备表和活跃设备表中包含重复存储的内容。但是,在本公开实施例中,采用一个目标设备表对每个用户的注册时间和操作信息进行统计,可以避免数据之间的重复性,从而在保证未丢失任何数据的情况下,简化了数据的存储,在存储简化的基础上,实现简化现有技术计算逻辑。
在本公开实施例的一个可选实施方式中,预设时间可以表示为:预设月份和/或预设年份。也就是说,在本公开实施例中,可以采用按月统计,和/或,按年统计的方式来统计用户操作信息。
需要说明的是,除了按月统计和/或按年统计之外,还可以选择按周统计或者按季度统计,具体统计方式用户可以根据实际需要来进行设定,本公开不作具体限定,在下述实施方式中,以按月统计和按年统计的方式来进行介绍。
方式一:按月份统计
若预设操作时间为预设月份,则目标位图字段用于表征该用户在所述预设月份内的月操作次数和/或月操作时间。
例如,该预设时间可以为2020年10月,此时,目标位图字段表示该用户在2020年10月的月操作次数和/或月操作时间。
需要说明的是,在本公开实施方式中,目标位图字段包括以下任一种:二进制位图字段、十进制位图字段、八进制位图字段和十六进制位图字段。
假设目标位图字段为二进制位图字段,那么该目标位图字段可以表示为:202010:二进制bit位,其中,二进制bit位的数量与当月的天数相关联,例如,2020年10月时,该二进制bit位的数量可以为31位。假设,用户对目标应用所执行的操作为登录操作,此时,若31个二进制bit位中10月1号对应的二进制bit位为1,表示用户在2020年10月1号登录该目标应用。又例如,若31个二进制bit位中10月2号对应的bit位为0,表示用户在2020年10月2号未登录该目标应用。
假设目标位图字段为十进制位图字段,那么该目标位图字段可以表示为:202010:十进制数值。例如,若其存储格式为202010:1,表示的含义为2020年10月,用户在10月的第一天(即10月1号)对目标应用执行了相应的操作,其中,目标位图字段中十进制数值1可以表示为2的0(1(1号)-1)次方;又例如,若其存储格式为202010:5,表示的含义为2020年10月,用户在10月的第一天(即10月1号)和第三天(即10月3号)对目标应用执行了相应的操作,目标位图字段中十进制数值5可以表示为2的0次方(1(1号)-1)+2的2次方(1(3号)-1)=5。
假设目标位图字段为八进制位图字段或十六进制位图字段,那么该目标位图字段可以表示为:202010:八进制数值或十六进制数值。其中,八进制数值或十六进制数值均可以通过二进制数值(或者十进制数值)转化得到,此处不再详细描述转化过程。
方式二:按年份统计
若所述预设时间为预设年份,则所述目标位图字段用于表征该每个用户在所述预设年份内的年操作次数和/或年操作时间。
例如,该预设时间可以为2020年,此时,目标位图字段表示该用户在2020年的年操作次数和/或年操作时间。
需要说明的是,在本公开实施方式中,目标位图字段包括以下任一种:二进制位图字段、十进制位图字段、八进制位图字段和十六进制位图字段。
假设目标位图字段为二进制位图字段,那么该目标位图字段可以表示为:2020:二进制bit位,其中,二进制bit位的数量与当年的天数相关联,例如,2020年,该二进制bit位的数量可以为366位。假设,用户对目标应用所执行的操作为登录,此时,若366个二进制bit位中10月1号对应的二进制bit位为1,则表示用户在2020年10月1号登录该目标应用;若366个二进制bit位中10月2号对应的bit位为0,则表示用户在2020年10月2号未登录该目标应用。
假设目标位图字段为十进制位图字段,那么该目标位图字段可以表示为:2020:十进制数值。例如,若其存储格式为2020:1,表示的含义为2020年,用户在2020年的第一天(即1月1号)对目标应用执行了相应的操作,其中,目标位图字段中十进制数值1可以表示为2的0(1(1号)-1)次方;又例如,若其存储格式为2020:5,表示的含义为2020年,用户在2020年的第一天(即1月1号)和第三天(即1月3号)对目标应用执行了相应的操作,目标位图字段中十进制数值5可以表示为2的0次方(1(1号)-1)+2的2次方(1(3号)-1)=5。
假设目标位图字段为八进制位图字段或十六进制位图字段,那么该目标位图字段可以表示为:2020:八进制数值或十六进制数值。其中,八进制数值或十六进制数值均可以通过二进制数值(或者十进制数值)转化得到,此处不再详细描述转化过程。
需要说明的是,在本公开实施例中,若目标位图字段采用二进制位图字段,可以更加直观的描述用户在各个预设年份的年操作次数和/或年操作时间。若目标位图字段采用十进制、八进制或者十六进制位图字段时,则可以简化数据的存储空间,从而可以进一步提高数据的处理效率。
通过上述描述可知,在本公开实施例中,通过目标位图字段来统计用户在预设时间内的操作次数和/或操作时间的方式,能够实现在一个条数据中记录对应用户针对目标应用的操作情况,从而避免了数据之间的重复性,以保证未丢失任何数据的情况下,简化了用户行为数据的存储,在存储简化的基础上,实现现有技术计算逻辑的简化。
在本公开实施例中,在更新目标应用的目标数据表中的至少一条统计数据之后,就可以在根据目标数据表中的统计数据确定目标应用对应的新增数据和留存数据。
具体地,留存数据可以用于表征目标应用的用户活跃情况和/或用户留存情况,新增数据可以用于表征目标应用的用户新增情况。下面将结合具体实施方式介绍新增数据和留存数据的确定过程。
在本公开的一个可选实施方式中,若留存数据表征目标应用的用户活跃情况,那么如图5所示,上述步骤S205,基于所述统计数据,确定所述目标应用对应的留存数据包括如下步骤:
步骤S501:获取第一目标时间;
步骤S502:对所述统计数据中用户操作信息的目标位图字段进行遍历,确定在所述第一目标时间对目标应用执行操作的第一目标用户;
步骤S503:根据确定出的第一目标用户的数量确定所述目标应用对应的留存数据;其中,该留存数据用于表征目标应用的用户活跃情况。
在本公开实施例中,若留存数据用于表征目标应用的用户活跃情况,则首先获取用户预先设定的第一目标时间,该第一目标时间可以设定为一个确定的日期,例如,第一目标时间可以设定为2020年10月10日。然后,根据设定的第一目标时间,依次对目标数据表中每条统计数据中用户操作信息的目标位图字段进行筛选,判断用户是否在设定的第一目标时间内对目标应用执行了相应的操作。若确定出用户在第一目标时间内对目标应用执行了相应的操作,则将该用户确定为第一目标用户。若确定出用户在所设定的第一目标时间内未对目标应用执行了相应的操作,则确定该用户不是第一目标用户。最后,在对每条统计数据中用户操作信息的目标位图字段进行遍历之后,统计出所有第一目标用户的数量,即为目标应用在预设的第一目标时间内的留存数据。
通过上述描述可知,在本公开实施例中,统计数据中的用户操作信息可以通过目标位图字段的方式来进行表示。此时,在本公开实施例中,在获取到目标活跃时间之后,可以对每条统计数据中的目标位图字段来进行读取,从而通过对读取到的目标位图字段进行分析的方式来判断该条统计数据所对应的用户在第一目标时间是否对目标应用执行了相应的操作,若是,则确定该用户为第一用户。在对每条统计数据中的目标位图字段进行读取分析之后,就可以确定所有的第一目标用户,最后,根据确定出的第一目标用户的数量确定所述目标应用对应的留存数据。
通过上述描述可知,在本公开实施例中,在统计留存数据时,不需要将用户新增表和用户活跃表进行关联,通过一个目标数据表就可以实现目标活跃时间内留存数据的获取。因此,在本公开实施例中,采用一个目标数据表来进行目标应用对应的留存数据的方式,能够简化数据计算逻辑,从而提高数据计算效率。
在本公开的一个可选实施方式中,若新增数据用于表征目标应用的用户新增情况,那么如图6所示,上述步骤S205,基于所述统计数据,确定所述目标应用对应的新增数据包括如下步骤:
步骤S601:确定第一注册时间;
步骤S602:对每条所述统计数据中的用户注册时间进行遍历,确定注册时间为所述第一注册时间的第二目标用户;
步骤S603:根据确定出的第二目标用户的数量确定所述目标应用对应的新增数据。
在本公开实施例中,若新增数据用于表征目标应用的用户新增情况,那么可以获取用户预先设定的第一注册时间,该第一注册时间可以设定为具体日期,例如,设定第一注册时间为2020年10月10日,则需要统计注册时间为2020年10月10日的用户;然后,依据设定的第一注册时间,依次对目标数据表中的每条统计数据中的用户注册时间所在字段进行遍历筛选,从而判断用户的注册时间是否为设定的第一注册时间。若用户的用户注册时间与设定的第一注册时间相同,则将该用户确定为第二目标用户,否则确定不是第二目标用户。最后,在对每条统计数据中的用户注册时间进行遍历之后,统计出所有第二目标用户的数量,即为目标应用在第一注册时间的新增数据。
通过上述描述可知,在本公开实施例中,每条统计数据都对应一个用户,且该统计数据中包含所对应用户的用户注册时间。在确定第一注册时间的新增数据时,可以通过遍历每条统计数据中用户注册时间所在的字段就可以确定第一注册时间内的新增用户,从而根据新增用户确定新增数据。相对于现有的技术方案,不需要将用户新增设备统计到一个数据表,在简化数据存储空间的同时,依然可以快速的确定第一注册时间内的新增数据。
在本公开的一个可选实施方式中,若留存数据用于表征目标应用的用户留存情况,那么如图7所示,上述步骤S205,基于所述统计数据,确定所述目标应用对应的留存数据包括如下步骤:
步骤S701:基于统计数据确定第三目标用户,其中,所述第三目标用户包括:注册时间为第二注册时间的用户,或者,操作时间为第二目标时间的用户;
步骤S702:基于所述多条统计数据中用户操作信息的目标位图字段确定目标时间段内对所述目标应用执行操作的用户信息;其中,所述目标时间段为所述第二注册时间或者所述目标活跃时间之后的时间段;
步骤S703:根据所述目标时间段内对所述目标应用执行操作的用户信息确定所述第三目标用户在所述目标时间段内的用户留存数据。
需要说明的是,在本公开实施例中,若留存数据用于表征目标应用的用户留存情况,那么该留存情况可以为以下至少之一:新增用户留存情况,活跃用户留存情况,用户年平均登录时间,下面将分情况介绍上述步骤S701至步骤S703。
情况一:留存数据为新增用户留存情况。
在本公开实施例中,可以预先设定一个注册时间,即第二注册时间。然后,依次对目标设备表中的多条统计数据的用户注册时间所在字段进行遍历筛选,以判断每条统计数据所对应用户的注册日期是否为第二注册时间。若确定出用户的用户注册时间与第二注册时间相同,则将该用户确定为第三目标用户。在对每条统计数据中的用户注册时间所在字段全部遍历筛选之后,就可以统计出第三目标用户的数量。
在本公开实施例中,在确定出第三目标用户之后,就可以确定一个目标时间段,该目标时间段为第二注册时间之后的一个时间段,该时间段可以为3天,还可以7天,还可以10天,本公开对目标时间段的时长不做具体限定,用户可以根据实际需要来进行设定。
例如,第二注册时间为2020年1月1号,那么目标时间段可以选择为2020年1月2号至2020年1月8号,还可以选择为2020年1月2号至2020年1月4号。
在确定出目标时间段之后,就可以在目标数据表的多条统计数据中确定目标时间段内对目标应用执行操作的用户信息,例如,在目标数据表的多条统计数据中确定2020年1月2号至2020年1月8号内对目标应用执行操作的用户信息。
在确定出目标时间段内对目标应用执行操作的用户信息之后,就可以将确定出的用户作信息和第三目标用户进行匹配,从而确定第三目标用户在目标时间段内的新增用户留存情况(即,第三目标用户在目标时间段内的留存数据),具体匹配过程可以描述为:
比如,目标时间段为2020年1月2号至2020年1月8号,那么可以确定每个第三目标用户在目标时间段内的上线天数,如果上线天数满足预设要求(例如,活跃天数大于1),则确定该第三目标用户在目标时间段内为新增留存用户。
需要说明的是,预设要求可以根据实际需要来进行设定,或者,根据目标时间段的时长来进行设定。例如,目标时间段为3天,那么该预设要求可以为上线天数大于1天,又例如,目标时间段为7天,那么该预设要求可以为上线天数大于3天。
情况二:留存数据为活跃用户留存情况。
在本公开实施例中,可以预先设定一个操作时间,即第二目标时间。然后,依次对目标设备表中的多条统计数据的用户操作信息所在目标位图字段进行遍历筛选,以判断每条统计数据所对应用户的操作时间是否为第二目标时间。若确定出用户的操作时间为第二目标时间,则将该用户确定为第三目标用户。在对每条统计数据中的用户操作信息所在目标位图字段全部遍历筛选之后,就可以统计出第三目标用户的数量。
在本公开实施例中,在确定出第三目标用户之后,就可以确定一个目标时间段,该目标时间段为第二目标活跃时间之后的一个时间段,该时间段可以为3天,还可以7天,还可以10天,本公开对目标时间段的时长不做具体限定,用户可以根据实际需要来进行设定。
例如,第二目标活跃时间为2020年1月1号,那么目标时间段可以选择为2020年1月2号至2020年1月8号,还可以选择为2020年1月2号至2020年1月4号。
在确定出目标时间段之后,就可以在目标数据表的多条统计数据中确定目标时间段内对目标应用执行操作的用户信息,例如,在目标数据表的多条统计数据中确定2020年1月2号至2020年1月8号内对目标应用执行操作的用户信息。
在确定出目标时间段内对所述目标应用执行操作的用户信息之后,就可以将确定出的用户信息和第三目标用户进行匹配,从而确定第三目标用户在目标时间段内的留存情况(即,第三目标用户在目标时间段内的用户留存数据),具体匹配过程可以描述为:
比如,目标时间段为2020年1月2号至2020年1月8号,那么可以确定每个第三目标用户在目标时间段内的上线天数,如果活跃天数满足预设要求(例如,上线天数大于1),则确定该第三目标用户在目标时间段内为活跃留存用户。
需要说明的是,预设要求可以根据实际需要来进行设定,或者,根据目标时间段的时长来进行设定。例如,目标时间段为3天,那么该预设要求可以为上线天数大于1天,又例如,目标时间段为7天,那么该预设要求可以为上线天数大于3天。
情况三:用户留存数据为用户年平均登录时间。
在此情况下,上述步骤基于所述目标数据表进行用户行为数据统计,确定所述目标应用对应的活跃状态统计结果包括如下步骤:
(1)、读取所述目标数据表中每条统计数据中的用户操作信息;
(2)、根据读取到的用户操作信息确定每个用户的登录记录;
(3)、对所述每个用户的登录记录进行平均计算,得到所述用户年平均登录记录。
通过上述描述可知,在本申请中,用户操作信息可以表示为用户的年操作数据(例如,年操作次数和/或年操作时间),还可以表示为用户的月操作数据(例如,月操作次数和/或月操作时间)。
如果用户操作信息为用户的年操作数据,那么可以对每条统计数据中的年用户操作信息进行一个统计计算,从而确定该用户在该年的登录天数。在确定出每个用户在该年的登录天数之后,就可以对每个用户的登录天数进行平均计算,得到所述用户年平均登录时间。
如果用户操作信息为用户的月操作数据,那么可以对每条统计数据中的月用户操作信息进行一个统计计算,从而确定该用户在该年的登录天数。在对每条统计数据中的月操作数据进行统计计算之后,就可以确定出每个用户在该年的登录天数之后,之后,就可以对每个用户的登录天数进行平均计算,得到所述用户年平均登录时间。
在本公开实施例中,通过计算用户年平均登录时间,可以确定用户访问目标应用的频率,从而为目标应用的运营团队提供相应的运行策略制定依据。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
基于同一发明构思,本公开实施例中还提供了与数据处理方法对应的数据处理装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述数据处理方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
实施例二
参照图8所示,为本公开实施例提供的一种数据处理装置的架构示意图,所述装置包括:获取单元81、更新单元82和统计分析单元83;其中,
获取单元81,用于获取用户针对目标应用的行为数据;
更新单元82,用于根据所述行为数据,更新目标数据表中的统计数据;其中,所述目标数据表中的每条统计数据对应一个用户,且,每条统计数据至少包括用户标识信息、用户注册时间、以及用户操作信息,所述用户操作信息中包含目标位图字段,所述目标位图字段用于表征用户在预设时间内针对目标应用的操作次数和/或操作时间;
统计分析单元83,用于基于所述统计数据,确定所述目标应用对应的新增数据和留存数据。
本公开实施例中,对目标应用的用户行为数据进行处理,得到一个包含多条统计数据的目标数据表。在确定目标应用的用户新增情况和用户留存情况时,不必再将多个表格进行关联,通过一个目标数据表就可以确定目标应用的用户新增情况和用户留存情况,从而降低了数据计算的复杂度,以及提高了数据处理的效率。
一种可能的实施方式中,更新单元,还用于:基于所述行为数据确定用户对所述目标应用执行操作的操作时间;根据所述操作时间,更新第一统计数据中用户操作信息的目标位图字段,其中,所述第一统计数据所对应的用户与所述行为数据中所对应的用户相同。
一种可能的实施方式中,若所述预设时间为预设月份,则所述目标位图字段用于表征该用户在所述预设月份内的月操作次数和/或月操作时间;若所述预设时间为预设年份,则所述目标位图字段用于表征该用户在所述预设年份内的年操作次数和/或年操作时间。
一种可能的实施方式中,所述目标位图字段包括以下任一种:二进制位图字段、十进制位图字段、八进制位图字段和十六进制位图字段。
一种可能的实施方式中,统计分析单元,还用于:获取第一目标时间;对所述统计数据中的用户操作信息进行遍历,确定在所述第一目标时间对所述目标应用执行操作的第一目标用户;根据确定出的第一目标用户的数量确定所述目标应用对应的留存数据。
一种可能的实施方式中,统计分析单元,还用于:确定第一注册时间;对每条所述统计数据中的用户注册时间进行遍历,确定注册时间为所述第一注册时间的第二目标用户;根据确定出的第二目标用户的数量确定所述目标应用对应的新增数据。
一种可能的实施方式中,统计分析单元,还用于:基于所述统计数据确定第三目标用户,其中,所述第三目标用户包括:注册时间为第二注册时间的用户,或者,操作时间为第二目标时间的用户;基于所述多条统计数据确定目标时间段内对所述目标应用执行操作的用户信息;其中,所述目标时间段为所述第二注册时间或者所述第二目标时间之后的时间段;根据所述目标时间段内对所述目标应用执行操作的用户信息确定所述第三目标用户在所述目标时间段内的留存数据。
一种可能的实施方式中,统计分析单元,还用于:读取所述目标数据表中每条统计数据中的用户操作信息;根据读取到的用户操作信息确定每个用户的登录记录;对所述每个用户的登录记录进行平均计算,得到所述用户年平均登录时间。
实施例三
基于同一技术构思,本公开实施例还提供了一种计算机设备。参照图9所示,为本公开实施例提供的计算机设备900的结构示意图,包括处理器901、存储器902、和总线903。其中,存储器902用于存储执行指令,包括内存9021和外部存储器9022;这里的内存9021也称内存储器,用于暂时存放处理器901中的运算数据,以及与硬盘等外部存储器9022交换的数据,处理器901通过内存9021与外部存储器9022进行数据交换,当计算机设备900运行时,处理器901与存储器902之间通过总线903通信,使得处理器901在执行以下指令:
获取用户针对目标应用的行为数据;根据所述行为数据,更新目标数据表中的统计数据;其中,所述目标数据表中的每条统计数据对应一个用户,且,每条统计数据至少包括用户标识信息、用户注册时间、以及用户操作信息,所述用户操作信息中包含目标位图字段,所述目标位图字段用于表征用户在预设时间内针对目标应用的操作次数和/或操作时间;基于所述统计数据,确定所述目标应用对应的新增数据和留存数据。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的数据处理方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
本公开实施例还提供一种计算机程序产品,该计算机程序产品承载有程序代码,所述程序代码包括的指令可用于执行上述方法实施例中所述的数据处理方法的步骤,具体可参见上述方法实施例,在此不再赘述。
其中,上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。
Claims (8)
1.一种数据处理方法,其特征在于,包括:
获取用户针对目标应用的行为数据;
根据所述行为数据,更新目标数据表中的统计数据;其中,所述目标数据表中的每条统计数据对应一个用户,且,每条统计数据至少包括用户标识信息、用户注册时间、以及用户操作信息,所述用户操作信息中包含目标位图字段,所述目标位图字段用于表征用户在预设时间内针对目标应用的操作次数和/或操作时间;
基于所述统计数据,确定所述目标应用对应的新增数据和留存数据;
若所述预设时间为预设月份,则所述目标位图字段用于表征该用户在所述预设月份内的月操作次数和/或月操作时间;
若所述预设时间为预设年份,则所述目标位图字段用于表征该用户在所述预设年份内的年操作次数和/或年操作时间;
所述基于所述统计数据,确定所述目标应用对应的留存数据,包括:
获取第一目标时间;
对所述统计数据中用户操作信息的目标位图字段进行遍历,确定在所述第一目标时间对所述目标应用执行操作的第一目标用户;
根据确定出的第一目标用户的数量确定所述目标应用对应的留存数据。
2.根据权利要求1所述的方法,其特征在于,所述根据所述行为数据,更新目标数据表中的统计数据,包括:
基于所述行为数据确定用户对所述目标应用执行操作的操作时间;
根据所述操作时间,更新第一统计数据中用户操作信息的目标位图字段,其中,所述第一统计数据所对应的用户与所述行为数据中所对应的用户相同。
3.根据权利要求1所述的方法,其特征在于,所述目标位图字段包括以下任一种:二进制位图字段、十进制位图字段、八进制位图字段和十六进制位图字段。
4.根据权利要求1所述的方法,其特征在于,所述基于所述统计数据,确定所述目标应用对应的新增数据,包括:
确定第一注册时间;
对每条所述统计数据中的用户注册时间进行遍历,确定注册时间为所述第一注册时间的第二目标用户;
根据确定出的第二目标用户的数量确定所述目标应用对应的新增数据。
5.根据权利要求1所述的方法,其特征在于,所述基于所述统计数据,确定所述目标应用对应的留存数据,还包括:
基于所述统计数据确定第三目标用户,其中,所述第三目标用户包括:注册时间为第二注册时间的用户,或者,操作时间为第二目标时间的用户;
基于所述统计数据中用户操作信息的目标位图字段确定目标时间段内对所述目标应用执行操作的用户信息;其中,所述目标时间段为所述第二注册时间或者所述第二目标时间之后的时间段;
根据所述目标时间段内对所述目标应用执行操作的用户信息确定所述第三目标用户在所述目标时间段内的留存数据。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
读取所述目标数据表中每条统计数据中用户操作信息的目标位图字段;
根据读取到的用户操作信息的目标位图字段确定每个用户的登录记录;
对所述每个用户的登录记录进行平均计算,得到用户年平均登录时间。
7.一种数据处理装置,其特征在于,包括:
获取单元,用于获取用户针对目标应用的行为数据;
更新单元,用于根据所述行为数据,更新目标数据表中的统计数据;其中,所述目标数据表中的每条统计数据对应一个用户,且,每条统计数据至少包括用户标识信息、用户注册时间、以及用户操作信息,所述用户操作信息中包含目标位图字段,所述目标位图字段用于表征用户在预设时间内针对目标应用的操作次数和/或操作时间;若所述预设时间为预设月份,则所述目标位图字段用于表征该用户在所述预设月份内的月操作次数和/或月操作时间;若所述预设时间为预设年份,则所述目标位图字段用于表征该用户在所述预设年份内的年操作次数和/或年操作时间;
统计分析单元,用于基于所述统计数据,确定所述目标应用对应的用户新增数据和留存数据;所述基于所述统计数据,确定所述目标应用对应的留存数据,包括:获取第一目标时间;对所述统计数据中用户操作信息的目标位图字段进行遍历,确定在所述第一目标时间对所述目标应用执行操作的第一目标用户;根据确定出的第一目标用户的数量确定所述目标应用对应的留存数据。
8.一种计算机设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至6任一项所述的数据处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011604823.7A CN112527803B (zh) | 2020-12-30 | 2020-12-30 | 一种数据处理方法、装置以及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011604823.7A CN112527803B (zh) | 2020-12-30 | 2020-12-30 | 一种数据处理方法、装置以及计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112527803A CN112527803A (zh) | 2021-03-19 |
CN112527803B true CN112527803B (zh) | 2024-01-26 |
Family
ID=74977575
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011604823.7A Active CN112527803B (zh) | 2020-12-30 | 2020-12-30 | 一种数据处理方法、装置以及计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112527803B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114356972B (zh) * | 2021-12-03 | 2022-08-23 | 四川科瑞软件有限责任公司 | 一种数据处理方法、基于事件时间的检索方法和装置 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105630972A (zh) * | 2015-12-24 | 2016-06-01 | 网易(杭州)网络有限公司 | 数据处理方法及装置 |
CN106997431A (zh) * | 2016-01-22 | 2017-08-01 | 阿里巴巴集团控股有限公司 | 一种数据处理方法及装置 |
CN107508917A (zh) * | 2017-09-29 | 2017-12-22 | 济南浚达信息技术有限公司 | 一种基于bitmap的web网站用户活跃度统计方法及系统 |
CN108140009A (zh) * | 2015-10-13 | 2018-06-08 | 微软技术许可有限责任公司 | 分布式自主式基于rdma的b树键值管理器 |
CN108306936A (zh) * | 2017-12-28 | 2018-07-20 | 深圳市创梦天地科技股份有限公司 | 用户指标统计方法及服务器 |
CN108364197A (zh) * | 2018-02-12 | 2018-08-03 | 广州虎牙信息科技有限公司 | 确定应用的用户留存率的方法、应用推广方法及电子设备 |
CN108415952A (zh) * | 2018-02-02 | 2018-08-17 | 北京腾云天下科技有限公司 | 用户数据存储方法、标签计算方法及计算设备 |
CN108737898A (zh) * | 2018-05-23 | 2018-11-02 | 武汉斗鱼网络科技有限公司 | 一种热点直播推送方法、服务器及存储介质 |
CN109272348A (zh) * | 2018-08-22 | 2019-01-25 | 中国平安人寿保险股份有限公司 | 活跃用户数量确定方法及装置、存储介质和电子设备 |
CN109471874A (zh) * | 2018-10-30 | 2019-03-15 | 华为技术有限公司 | 数据分析方法、设备及存储介质 |
CN109993572A (zh) * | 2019-02-15 | 2019-07-09 | 生迪智慧科技有限公司 | 留存率统计方法、装置、设备及存储介质 |
CN110535943A (zh) * | 2019-08-29 | 2019-12-03 | 广州华多网络科技有限公司 | 数据处理方法、装置、电子设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090290458A1 (en) * | 2008-05-23 | 2009-11-26 | Tai-Liang Lin | Method of updating disc information of optical disc |
-
2020
- 2020-12-30 CN CN202011604823.7A patent/CN112527803B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108140009A (zh) * | 2015-10-13 | 2018-06-08 | 微软技术许可有限责任公司 | 分布式自主式基于rdma的b树键值管理器 |
CN105630972A (zh) * | 2015-12-24 | 2016-06-01 | 网易(杭州)网络有限公司 | 数据处理方法及装置 |
CN106997431A (zh) * | 2016-01-22 | 2017-08-01 | 阿里巴巴集团控股有限公司 | 一种数据处理方法及装置 |
CN107508917A (zh) * | 2017-09-29 | 2017-12-22 | 济南浚达信息技术有限公司 | 一种基于bitmap的web网站用户活跃度统计方法及系统 |
CN108306936A (zh) * | 2017-12-28 | 2018-07-20 | 深圳市创梦天地科技股份有限公司 | 用户指标统计方法及服务器 |
CN108415952A (zh) * | 2018-02-02 | 2018-08-17 | 北京腾云天下科技有限公司 | 用户数据存储方法、标签计算方法及计算设备 |
CN108364197A (zh) * | 2018-02-12 | 2018-08-03 | 广州虎牙信息科技有限公司 | 确定应用的用户留存率的方法、应用推广方法及电子设备 |
CN108737898A (zh) * | 2018-05-23 | 2018-11-02 | 武汉斗鱼网络科技有限公司 | 一种热点直播推送方法、服务器及存储介质 |
CN109272348A (zh) * | 2018-08-22 | 2019-01-25 | 中国平安人寿保险股份有限公司 | 活跃用户数量确定方法及装置、存储介质和电子设备 |
CN109471874A (zh) * | 2018-10-30 | 2019-03-15 | 华为技术有限公司 | 数据分析方法、设备及存储介质 |
CN109993572A (zh) * | 2019-02-15 | 2019-07-09 | 生迪智慧科技有限公司 | 留存率统计方法、装置、设备及存储介质 |
CN110535943A (zh) * | 2019-08-29 | 2019-12-03 | 广州华多网络科技有限公司 | 数据处理方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112527803A (zh) | 2021-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108833453B (zh) | 一种确定应用账号的方法及设备 | |
Riadi | Forensic investigation technique on android's blackberry messenger using nist framework | |
US10489714B2 (en) | Fingerprinting and matching log streams | |
US8997229B1 (en) | Anomaly detection for online endorsement event | |
US10489715B2 (en) | Fingerprinting and matching log streams | |
Valente et al. | Recent extinctions disturb path to equilibrium diversity in Caribbean bats | |
EP3186722A1 (en) | Systems and methods for analyzing document coverage by keyword extraction | |
CN107133263A (zh) | Poi推荐方法、装置、设备及计算机可读存储介质 | |
CN112527803B (zh) | 一种数据处理方法、装置以及计算机设备 | |
CN107481039A (zh) | 一种事件处理方法及终端设备 | |
US20160373472A1 (en) | Capturing correlations between activity and non-activity attributes using n-grams | |
US20200175029A1 (en) | Method and system for optimizing validations carried out for input data at a data warehouse | |
CN107169005A (zh) | Poi推荐方法、装置、设备及计算机可读存储介质 | |
CN109800099A (zh) | 一种用户操作行为的还原方法、存储介质和终端设备 | |
CN110737691B (zh) | 用于处理访问行为数据的方法和装置 | |
US10664501B2 (en) | Deriving and interpreting users collective data asset use across analytic software systems | |
CN109740344B (zh) | 威胁情报模型建立方法、装置、电子设备及存储介质 | |
CN114169451A (zh) | 行为数据分类处理方法、装置、设备及存储介质 | |
CN113157525A (zh) | 一种数据收集方法、装置、计算机设备和存储介质 | |
CN112579861A (zh) | 一种计数方法及装置 | |
CN112306465B (zh) | 一种计数方法及装置 | |
CN111859327A (zh) | 登录角色的识别方法及装置 | |
CN111367750A (zh) | 一种异常处理方法、装置及其设备 | |
CN110992096B (zh) | 预测模型训练方法、装置以及媒体标识预测方法及装置 | |
Kaushik et al. | Forensic Analysis of WhatsApp chat data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |