CN111611143A - 数据处理方法及装置、电子设备和计算机可读存储介质 - Google Patents
数据处理方法及装置、电子设备和计算机可读存储介质 Download PDFInfo
- Publication number
- CN111611143A CN111611143A CN202010428846.0A CN202010428846A CN111611143A CN 111611143 A CN111611143 A CN 111611143A CN 202010428846 A CN202010428846 A CN 202010428846A CN 111611143 A CN111611143 A CN 111611143A
- Authority
- CN
- China
- Prior art keywords
- application
- reporting
- inventory
- applications
- stock
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3438—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3452—Performance evaluation by statistical analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Abstract
本发明提出了一种数据处理方法及装置、电子设备和计算机可读存储介质,该方法包括:从指定存储设备读取上报信息集合,上报信息集合包括多个活跃用户的上报信息,每个活跃用户的上报信息包括已安装应用列表;对于多个活跃用户涉及的全部上报应用中的多个目标上报应用,确定每个目标上报应用上报的全部已安装应用列表中第一应用的数量和第二应用的数量;基于每个目标上报应用对应的第一应用的数量与第二应用的数量,确定第一应用与第二应用的目标存量比;获取第二应用的存量;基于目标存量比和第二应用的存量,确定第一应用的存量。该技术方案使最终获得的应用存量的准确性得以有效提升,为依赖于存量所进行的应用开发和维护工作提供了便利。
Description
【技术领域】
本发明涉及计算机技术领域,尤其涉及一种数据处理方法及装置、电子设备和计算机可读存储介质。
【背景技术】
在应用开发和维护过程中,往往需要获取应用的存量为参照数据,应用的存量指的是当前有多少终端安装有该应用。
一般地,可将当日使用目标应用的用户数量作为目标应用的当日存量,或者,将目标应用在当日的总注册用户量作为目标应用的当日存量。然而,用户安装有目标应用的情况下,并不一定会使用目标应用,目标应用的注册用户也未必均安装有该目标应用。故上述两种方式所得的目标应用的存量并不准确,进而影响依赖于存量所进行的应用开发和维护工作。
因此,如何获取准确的应用存量,成为目前亟待解决的技术问题。
【发明内容】
本发明实施例提供了一种数据处理方法及装置、电子设备和计算机可读存储介质,旨在解决相关技术中应用存量的计算准确性低下的技术问题。
第一方面,本发明实施例提供了一种数据处理方法,包括:从指定存储设备读取上报信息集合,所述上报信息集合包括多个活跃用户的上报信息,其中,每个活跃用户的上报信息包括:活跃用户ID、已安装应用列表和上报所述已安装应用列表的上报应用的标识;对于所述多个活跃用户涉及的全部上报应用中的多个目标上报应用,基于所述上报信息集合,确定每个目标上报应用上报的全部所述已安装应用列表中第一应用的数量和第二应用的数量;基于全部所述目标上报应用中的每个所述目标上报应用对应的所述第一应用的数量与所述第二应用的数量,确定所述第一应用与所述第二应用的目标存量比;获取所述第二应用的存量,所述第二应用的存量是根据所述第二应用的发布方按照预定周期公布的存量数据确定的;基于所述目标存量比和所述第二应用的存量,确定所述第一应用的存量。
第二方面,本发明实施例提供了一种数据处理装置,包括:上报信息集合获取单元,用于从指定存储设备读取上报信息集合,所述上报信息集合包括多个活跃用户的上报信息,其中,每个活跃用户的上报信息包括:活跃用户ID、已安装应用列表和上报所述已安装应用列表的上报应用的标识;应用数量确定单元,用于对于所述多个活跃用户涉及的全部上报应用中的多个目标上报应用,基于所述上报信息集合,确定每个目标上报应用上报的全部所述已安装应用列表中第一应用的数量和第二应用的数量;存量比确定单元,用于基于全部所述目标上报应用中的每个所述目标上报应用对应的所述第一应用的数量与所述第二应用的数量,确定所述第一应用与所述第二应用的目标存量比;第二应用存量获取单元,用于获取所述第二应用的存量,所述第二应用的存量是根据所述第二应用的发布方按照预定周期公布的存量数据确定的;第一应用存量确定单元,用于基于所述目标存量比和所述第二应用的存量,确定所述第一应用的存量。
第三方面,本发明实施例提供了一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行上述第一方面中任一项所述的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行上述第一方面中任一项所述的方法流程。
以上技术方案,首先,从指定存储设备读取多个活跃用户的上报信息所组成的上报信息集合,活跃用户指的是用于统计应用存量的终端,该终端可安装有多个应用。其中,活跃用户的上报信息包括活跃用户ID、活跃用户自身的已安装应用列表以及活跃用户的已安装应用中上报所述已安装应用列表的上报应用的标识。上报信息集合可准确地反映此多个活跃用户当前的应用安装情况,利用全面、准确的上报信息集合,最终所确定的应用的存量的准确性也能够得以提升。
接着,本发明实施例提供的方法,对于所述多个活跃用户涉及的全部上报应用中的多个目标上报应用,确定每个目标上报应用上报的全部所述已安装应用列表中第一应用的数量和第二应用的数量。对于每个活跃用户,其安装的全部应用均可作为上报应用,为其上报其自身的上报信息。上报应用的数量繁多,在多个活跃用户涉及的全部上报应用中选择覆盖用户范围足够广、用户群体足够稳定的多个目标上报应用。
对于每个目标上报应用来说,多个活跃用户中有若干个活跃用户的上报信息都由自身的该目标上报应用进行上报。这样,该目标上报应用上报的全部已安装应用列表即该若干个活跃用户的已安装应用列表,目标上报应用上报的全部所述已安装应用列表中第一应用的数量,即该若干个活跃用户中安装有第一应用的活跃用户数量,目标上报应用上报的全部所述已安装应用列表中第二应用的数量,即该若干个活跃用户中安装有第二应用的活跃用户数量。利用覆盖用户范围足够广、用户群体足够稳定的多个目标上报应用各自对应的第一应用的数量和第二应用的数量,最终确定的第一应用的存量的准确性也得以提升。
对于每个目标上报应用,其上报的全部上报信息所对应的活跃用户集合相当于一个样本,每个样本中第一应用的数量即为第一应用在该样本中的存量,每个样本中第二应用的数量即为第二应用在该样本中的存量。通过多个样本中第一应用的存量和第二应用的存量,确定目标存量比,该目标存量比反映了实际场景中第一应用的存量和第二应用的存量的相对大小。
接着,获取第二应用的存量,其中,第二应用的存量是根据所述第二应用的发布方按照预定周期公布的存量数据确定的。
由于目标存量比反映了实际场景中第一应用的存量和第二应用的存量的相对大小,且已知第二应用的存量,那么,基于第一应用的存量和第二应用的存量的相对大小,和第二应用的存量,即能够确定第一应用的存量。第一应用的存量反映了较为准确的当前安装有第一应用的用户数量。
以上技术方案,对活跃用户上报的上报信息进行多样本化的处理,以获取更为准确有效的应用间的存量比,从而使最终获得的应用存量的准确性得以有效提升,为依赖于存量所进行的应用开发和维护工作提供了便利。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出了根据本发明的一个实施例的数据处理方法的流程图;
图2示出了根据本发明的另一个实施例的数据处理方法的流程图;
图3示出了根据本发明的再一个实施例的数据处理方法的流程图;
图4示出了根据本发明的又一个实施例的数据处理方法的流程图;
图5示出了根据本发明的一个实施例的数据处理装置的框图;
图6示出了根据本发明的一个实施例的电子设备的框图。
【具体实施方式】
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
实施例一
图1示出了根据本发明的一个实施例的数据处理方法的流程图。
如图1所示,根据本发明的一个实施例的数据处理方法的流程包括:
步骤102,从指定存储设备读取上报信息集合,所述上报信息集合包括多个活跃用户的上报信息,其中,每个活跃用户的上报信息包括:活跃用户ID、已安装应用列表和上报所述已安装应用列表的上报应用的标识。
首先,从指定存储设备读取多个活跃用户的上报信息所组成的上报信息集合,活跃用户指的是用于统计应用存量的终端,该终端可安装有多个应用。其中,活跃用户的上报信息包括活跃用户ID、活跃用户自身的已安装应用列表以及活跃用户的已安装应用中上报所述已安装应用列表的上报应用的标识。上报信息集合可准确地反映此多个活跃用户当前的应用安装情况,利用全面、准确的上报信息集合,最终所确定的应用的存量的准确性也能够得以提升。
步骤104,对于所述多个活跃用户涉及的全部上报应用中的多个目标上报应用,基于所述上报信息集合,确定每个目标上报应用上报的全部所述已安装应用列表中第一应用的数量和第二应用的数量。
对于每个活跃用户,其安装的全部应用均可作为上报应用,为其上报其自身的上报信息。上报应用的数量繁多,在多个活跃用户涉及的全部上报应用中选择覆盖用户范围足够广、用户群体足够稳定的多个目标上报应用。
对于每个目标上报应用来说,多个活跃用户中有若干个活跃用户的上报信息都由自身的该目标上报应用进行上报。这样,该目标上报应用上报的全部已安装应用列表即该若干个活跃用户的已安装应用列表,目标上报应用上报的全部所述已安装应用列表中第一应用的数量,即该若干个活跃用户中安装有第一应用的活跃用户数量,目标上报应用上报的全部所述已安装应用列表中第二应用的数量,即该若干个活跃用户中安装有第二应用的活跃用户数量。利用覆盖用户范围足够广、用户群体足够稳定的多个目标上报应用各自对应的第一应用的数量和第二应用的数量,最终确定的第一应用的存量的准确性也得以提升。
步骤106,基于全部所述目标上报应用中的每个所述目标上报应用对应的所述第一应用的数量与所述第二应用的数量,确定所述第一应用与所述第二应用的目标存量比。
对于每个目标上报应用,其上报的全部上报信息所对应的活跃用户集合相当于一个样本,每个样本中第一应用的数量即为第一应用在该样本中的存量,每个样本中第二应用的数量即为第二应用在该样本中的存量。通过多个样本中第一应用的存量和第二应用的存量,确定目标存量比,该目标存量比反映了实际场景中第一应用的存量和第二应用的存量的相对大小。
步骤108,获取所述第二应用的存量。
所述第二应用的存量是根据所述第二应用的发布方按照预定周期公布的存量数据确定的。
步骤110,基于所述目标存量比和所述第二应用的存量,确定所述第一应用的存量。
由于目标存量比反映了实际场景中第一应用的存量和第二应用的存量的相对大小,且已知第二应用的存量,那么,基于第一应用的存量和第二应用的存量的相对大小,和第二应用的存量,即能够确定第一应用的存量。第一应用的存量反映了较为准确的当前安装有第一应用的用户数量。
以上技术方案,对活跃用户上报的上报信息进行多样本化的处理,以获取更为准确有效的应用间的存量比,从而使最终获得的应用存量的准确性得以有效提升,为依赖于存量所进行的应用开发和维护工作提供了便利。
实施例二
上报信息集合存储于指定存储设备,并基于活跃用户不断上报的上报信息进行更新。每个活跃用户的上报信息包括:活跃用户ID、已安装应用列表和上报所述已安装应用列表的上报应用的标识。
其中,活跃用户包括但不限于移动终端等电子设备,活跃用户ID可为电子设备的唯一标识码,也可为该电子设备出厂设置或使用者手动设置的任何标识信息。活跃用户的已安装应用列表包括活跃用户所安装有的全部应用。活跃用户中的每个具有上报信息上报功能的应用均可对本活跃用户的已安装应用列表进行上报,这些具有上报信息上报功能的应用即为上报应用,每个上报应用具有自身的标识,该标识包括但不限于上报应用的名称、编码等个体识别信息。示例性地,上报信息集合如下表1所示。
活跃用户ID | 已安装应用列表 | 上报应用标识 |
a<sub>1</sub> | (APP1,APP2,APP3) | APP1 |
a<sub>2</sub> | (APP1,APP2,APP4,APP5) | APP2 |
…… | …… | …… |
a<sub>n</sub> | (APP1,APP2,APP6,APP7) | APP6 |
表1
具体来说,指定存储设备存储的所述上报信息集合按照如下方式更新:
第一,对于所述上报信息集合中的任一活跃用户ID,以实时获得的该活跃用户ID对应的最新已安装应用列表,覆盖该活跃用户ID在所述上报信息集合中的历史已安装应用列表。
由于活跃用户中的每个具有上报信息上报功能的应用均可对本活跃用户的已安装应用列表进行上报,那么,对于每个活跃用户,应用存量的计算端在每个当前存量计算周期内都会收到该活跃用户上报的多次上报信息。在后续计算应用存量的过程中,只能其中的一次上报信息为准进行统计。因此,对于上报信息集合中的活跃用户ID,每获取到最新已安装应用列表,就以最新已安装应用列表覆盖上报信息集合中该活跃用户ID已有的历史已安装应用列表。换言之,无论该活跃用户的哪个应用于何时上报何内容的已安装应用列表,均以该活跃用户对应的最新一次上报的已安装应用列表为准。由此,使得各活跃用户在上报信息集合中的已安装应用列表始终与其最新的应用安装情况相符合,大大提升了上报信息集合的更新及时性及准确性。利用更新及时且准确的上报信息集合,最终所确定的应用的存量的准确性也能够得以提升。
第二,对于所述上报信息集合中的任一活跃用户ID,判断其最后一次获得所述最新已安装应用列表的时刻距当前时刻是否超过指定时长,其中,在判断结果为是时,删除该活跃用户ID所属的活跃用户的上报信息。
指定时长为用户在活跃状态下上报已安装应用列表所能够具有的最长间隔,其中,活跃状态指的是该用户仍为经常发生信息上报、信息处理等活动的有效活跃用户。对于所述上报信息集合中的任一活跃用户ID,其最后一次获得所述最新已安装应用列表的时刻距当前时刻超过指定时长,也就是说,该活跃用户ID对应的用户已相当长一段时间内未进行信息上报,此时,可确定该用户脱离活跃状态,处于失效状态,无法作为计算应用存量的有效样本。反之,说明该用户仍处于活跃状态,可作为计算应用存量的有效样本,无需进行删除操作。
由此,可在上报信息集合中及时剔除影响计算应用存量的准确性的无效样本,使得将其剔除后的上报信息集合更为准确有效,利用更为准确有效的上报信息集合,最终所确定的应用的存量的准确性也能够得以提升。
第三,将实时新增活跃用户的上报信息实时增加至所述上报信息集合中。
随着电子设备的增多,实时新增活跃用户也在不断增加,其内安装的应用造成应用存量的增加,因此,实时新增活跃用户为影响应用存量的准确性的因素之一。将实时新增活跃用户的上报信息实时增加至所述上报信息集合中,便于获得更为准确有效的上报信息集合,而利用更为准确有效的上报信息集合,最终所确定的应用的存量的准确性也能够得以提升为使得上报信息集合
在一种可能的设计中,可仅使用上述三种实时更新上报信息集合的方式中的一种,以实时更新上报信息集合,利用实时更新的上报信息集合,最终所确定的应用的存量的准确性也能够得以提升。在另一种可能的设计中,可将上述三种实时更新上报信息集合的方式中的三种或任意两种组合使用,相对于仅使用上述三种实时更新上报信息集合的方式中的一种,可获得更为准确有效的实时更新后的上报信息集合。利用更为准确有效的实时更新后的上报信息集合,最终所确定的应用的存量的准确性也能够得以提升。
需要补充的是,指定存储设备可为用于确定第一应用的存量的电子设备的一部分,也可为该电子设备以外的独立设备,还可以是该电子设备以外的集成于任意设备的存储模块。
实施例三
图2示出了根据本发明的另一个实施例的数据处理方法的流程图。
如图2所示,根据本发明的另一个实施例的数据处理方法的流程包括:
步骤202,从指定存储设备读取上报信息集合,所述上报信息集合包括多个活跃用户的上报信息,其中,每个活跃用户的上报信息包括:活跃用户ID、已安装应用列表和上报所述已安装应用列表的上报应用的标识。
活跃用户指的是用于统计应用存量的终端,该终端可安装有多个应用。其中,活跃用户的上报信息包括但不限于活跃用户ID、活跃用户自身的已安装应用列表以及活跃用户的已安装应用中上报所述已安装应用列表的上报应用的标识。上报信息集合可准确地反映此多个活跃用户当前的应用安装情况,利用全面、准确的上报信息集合,最终所确定的应用的存量的准确性也能够得以提升。
其中,活跃用户包括但不限于移动终端等电子设备,活跃用户ID可为电子设备的唯一标识码,也可为该电子设备出厂设置或使用者手动设置的任何标识信息。活跃用户的已安装应用列表包括活跃用户所安装有的全部应用。活跃用户中的每个具有上报信息上报功能的应用均可对本活跃用户的已安装应用列表进行上报,这些具有上报信息上报功能的应用即为上报应用,每个上报应用具有自身的标识,该标识包括但不限于上报应用的名称、编码等个体识别信息。
步骤204,对于所述多个活跃用户涉及的全部上报应用中的多个目标上报应用,基于所述上报信息集合,确定每个目标上报应用上报的全部所述已安装应用列表中第一应用的数量和第二应用的数量。
对于每个活跃用户,其安装的全部应用均可作为上报应用,为其上报其自身的上报信息。上报应用的数量繁多,在多个活跃用户涉及的全部上报应用中选择覆盖用户范围足够广、用户群体足够稳定的多个目标上报应用。
对于每个目标上报应用来说,多个活跃用户中有若干个活跃用户的上报信息都由自身的该目标上报应用进行上报。这样,该目标上报应用上报的全部已安装应用列表即该若干个活跃用户的已安装应用列表,目标上报应用上报的全部所述已安装应用列表中第一应用的数量,即该若干个活跃用户中安装有第一应用的活跃用户数量,目标上报应用上报的全部所述已安装应用列表中第二应用的数量,即该若干个活跃用户中安装有第二应用的活跃用户数量。利用覆盖用户范围足够广、用户群体足够稳定的多个目标上报应用各自对应的第一应用的数量和第二应用的数量,最终确定的第一应用的存量的准确性也得以提升。示例性地,上报信息集合包括10个活跃用户,每个活跃用户的ID、已安装应用列表和上报应用标识如下表2所示。当然,活跃用户数量不限于10个,,各活跃用户的已安装应用列表中的应用数量、应用名称等内容也不限于下表所示。
活跃用户ID | 已安装应用列表 | 上报应用标识 |
a<sub>1</sub> | (APP1,APP2,APP3) | APP1 |
a<sub>2</sub> | (APP1,APP2,APP4,APP5) | APP2 |
a<sub>3</sub> | (APP1,APP2,APP4,APP5) | APP2 |
a<sub>4</sub> | (APP1,APP2,APP6,APP7) | APP6 |
a<sub>5</sub> | (APP2,APP3,APP6,APP7) | APP6 |
a<sub>6</sub> | (APP1,APP2,APP6,APP7) | APP6 |
a<sub>7</sub> | (APP1,APP4,APP7,APP8) | APP1 |
a<sub>8</sub> | (APP1,APP2,APP7,APP9) | APP1 |
a<sub>9</sub> | (APP2,APP4,APP6,APP9) | APP6 |
a<sub>10</sub> | (APP1,APP4,APP6,APP9) | APP9 |
表2
其中,上报信息集合中10个活跃用户所涉及的全部上报应用包括:APP1、APP2、APP6和APP9。
进一步地,选择APP1和APP6作为目标上报应用。
APP1作为目标上报应用时,分别为a1、a7和a8上报了已安装应用列表(APP1,APP2,APP3)、(APP1,APP4,APP7,APP8)和(APP1,APP2,APP7,APP9)。若待确定存量的第一应用为APP4,作为确定第一应用的存量的参考对象的第二应用为APP2,则APP1上报的这三个已安装应用列表中,第一应用的数量为1,第二应用的数量为2。
APP6作为目标上报应用时,分别为a4、a5、a6和a9上报了已安装应用列表(APP1,APP2,APP6,APP7)、(APP2,APP3,APP6,APP7)、(APP1,APP2,APP6,APP7)和(APP2,APP4,APP6,APP9)。待确定存量的第一应用为APP4,作为确定第一应用的存量的参考对象的第二应用为APP2,则APP6上报的这四个已安装应用列表中,第一应用的数量为1,第二应用的数量为4。
步骤206,确定每个所述目标上报应用对应的所述第一应用的数量与所述第二应用的数量的比值。
对于每个目标上报应用,以第二应用作为第一应用的参照对象,将第一应用的数量与第二应用的数量进行比较,得到两者的比值。此时,对于每个目标上报应用,其上报的全部上报信息所对应的活跃用户集合相当于一个样本,该比值即为此样本下安装有第一应用的活跃用户数量和安装有第二应用的活跃用户数量的比值,也就是此样本下第一应用与第二应用的存量比。
基于上述表2给出的实例,目标上报应用APP1对应的第一应用的数量与所述第二应用的数量的比值为0.5,目标上报应用APP6对应的第一应用的数量与所述第二应用的数量的比值为0.25。
步骤208,对全部所述目标上报应用各自对应的所述比值进行加权处理,得到所述第一应用与所述第二应用的目标存量比。
全部目标上报应用中,每个目标上报应用的全部上报信息所对应的活跃用户集合均相当于一个样本,利用多个样本中第一应用和第二应用的存量比,可确定两者的目标存量比。该目标存量比相对于该多个样本的存量比更具可靠性。
其中,由于各目标上报应用的覆盖用户范围、用户群体稳定性不同,其作为计算第一应用存量的样本的可靠性也就不同。进一步地,可使用权重表示目标上报应用的可靠性,目标上报应用的覆盖用户范围越广、用户群体稳定性越高,其对应的权重越高,其对应的比值的可靠性也就越高。
基于上述原理,加权处理过程中,将各目标上报应用对应的比值乘以其权重,得到各目标上报应用对应的乘积,再对所有目标上报应用对应的乘积求和,得到最终的目标存量比。换言之,以多个目标上报应用各自的上报信息分别作为样本,计算每个样本中第一应用与第二应用的存量比,并对此多个存量比加权处理,得到相对于每个存量比都更具准确性的目标存量比。使用该更具准确性的目标存量比,最终确定的第一应用的存量的准确性也得以提升。
基于上述表2给出的实例,目标上报应用APP1的权重为0.4,目标上报应用APP6的权重为0.6,则对目标上报应用APP1以及目标上报应用APP6对应的所述比值进行加权计算,0.5*0.4+0.25*0.6=0.35,即此时的目标存量比。
所述第二应用的存量是根据所述第二应用的发布方按照预定周期公布的存量数据确定的,在一种可能的设计中,可直接获取第二应用在距离当前时刻最近的历史时刻的历史存量,作为第二应用的存量。
在另一种可能的设计中,针对相关技术中提出的,可通过第三方应用(即上述的第二应用,以下统称第二应用)公开的其自身存量以及第二应用与目标应用的存量比直接计算得到目标应用的存量,这一计算方式,第二应用一般每周或每月公开一次其自身存量。如,第二应用在周一公开其自身存量,该周的周日计算目标应用的存量时,仍需使用第二应用在周一所公开的存量。然而,第二应用的实际存量是不断变化的,其周一所公开的存量与其周日时的实际存量并不相同,故直接使用其周一时的存量来计算目标应用周日时的存量,得到的计算结果并不准确,进而影响依赖于存量所进行的应用开发和维护工作。
对此,通过步骤210和步骤212,对第二应用在距离当前时刻最近的历史时刻的历史存量进行进一步修正后,再将修正结果作为第二应用的存量。
步骤210,基于所述第二应用在多个历史时刻下的历史存量,确定所述第二应用的单位存量变化量。
以第二应用在距离当前时刻最近的历史时刻的历史存量为基础,获取更为准确有效的第二应用的存量。第二应用在多个历史时刻下均被公开有历史存量,换言之,每个历史存量均是由第二应用的发布方按照预定周期进行公布的、第二应用在一历史时刻时的存量。通过这多个历史时刻和对应的历史存量,可通过曲线拟合、均值计算等方式,确定第二应用在单位时间内的存量变化量,即单位存量变化量。该单位时间可大于、小于或等于存量计算周期。
步骤212,基于所述单位存量变化量,以及所述第二应用在距离当前时刻最近的历史时刻的历史存量,确定所述当前时刻下所述第二应用的存量。
接着,获取第二应用在距离当前时刻最近的历史时刻的历史存量,并计算该历史时刻与当前时刻的时间间隔,从而以该时间间隔乘以第二应用的单位存量变化量,即第二应用在该时间间隔内的存量变化量。再将第二应用在该时间间隔内的存量变化量与第二应用在该历史时刻的历史存量相加,即得到第二应用在当前时刻的存量。
由此,相对于相关技术的技术方案,可获取更为准确有效的第二应用的存量,应用更为准确有效的第二应用的存量计算第一应用的存量的基础,从而提升了最终得到的第一应用的存量的准确性。
步骤214,基于所述目标存量比和所述第二应用的存量,确定所述第一应用的存量。
由于目标存量比反映了实际场景中第一应用的存量和第二应用的存量的相对大小,且已知第二应用的存量,那么,基于第一应用的存量和第二应用的存量的相对大小,和第二应用的存量,即能够确定第一应用的存量。第一应用的存量反映了较为准确的当前安装有第一应用的用户数量。
以上技术方案,对活跃用户上报的上报信息进行多样本化的处理,以获取更为准确有效的应用间的存量比,从而使最终获得的应用存量的准确性得以有效提升,为依赖于存量所进行的应用开发和维护工作提供了便利。
实施例四
图3示出了根据本发明的再一个实施例的数据处理方法的流程图。
如图3所示,根据本发明的再一个实施例的数据处理方法的流程包括:
步骤302,从指定存储设备读取上报信息集合,所述上报信息集合包括多个活跃用户的上报信息,其中,每个活跃用户的上报信息包括:活跃用户ID、已安装应用列表和上报所述已安装应用列表的上报应用的标识。
活跃用户指的是用于统计应用存量的终端,该终端可安装有多个应用。其中,活跃用户的上报信息包括但不限于活跃用户ID、活跃用户自身的已安装应用列表以及活跃用户的已安装应用中上报所述已安装应用列表的上报应用的标识。上报信息集合体现为列表的形式,或体现为符合实际存量计算需求的其他任何形式。上报信息集合可准确地反映此多个活跃用户当前的应用安装情况,利用全面、准确的上报信息集合,最终所确定的应用的存量的准确性也能够得以提升。
其中,活跃用户包括但不限于移动终端等电子设备,活跃用户ID可为电子设备的唯一标识码,也可为该电子设备出厂设置或使用者手动设置的任何标识信息。活跃用户的已安装应用列表包括活跃用户所安装有的全部应用。活跃用户中的每个具有上报信息上报功能的应用均可对本活跃用户的已安装应用列表进行上报,这些具有上报信息上报功能的应用即为上报应用,每个上报应用具有自身的标识,该标识包括但不限于上报应用的名称、编码等个体识别信息。
步骤304,对于所述多个活跃用户涉及的全部上报应用中的多个目标上报应用,基于所述上报信息集合,确定每个目标上报应用上报的全部所述已安装应用列表中第一应用的数量和第二应用的数量。
对于每个活跃用户,其安装的全部应用均可作为上报应用,为其上报其自身的上报信息。上报应用的数量繁多,在多个活跃用户涉及的全部上报应用中选择覆盖用户范围足够广、用户群体足够稳定的多个目标上报应用。
对于每个目标上报应用来说,多个活跃用户中有若干个活跃用户的上报信息都由自身的该目标上报应用进行上报。这样,该目标上报应用上报的全部已安装应用列表即该若干个活跃用户的已安装应用列表,目标上报应用上报的全部所述已安装应用列表中第一应用的数量,即该若干个活跃用户中安装有第一应用的活跃用户数量,目标上报应用上报的全部所述已安装应用列表中第二应用的数量,即该若干个活跃用户中安装有第二应用的活跃用户数量。利用覆盖用户范围足够广、用户群体足够稳定的多个目标上报应用各自对应的第一应用的数量和第二应用的数量,最终确定的第一应用的存量的准确性也得以提升。
步骤306,确定每个所述目标上报应用对应的所述第一应用的数量与所述第二应用的数量的比值。
对于每个目标上报应用,以第二应用作为第一应用的参照对象,将第一应用的数量与第二应用的数量进行比较,得到两者的比值。此时,对于每个目标上报应用,其上报的全部上报信息所对应的活跃用户集合相当于一个样本,该比值即为此样本下安装有第一应用的活跃用户数量和安装有第二应用的活跃用户数量的比值,也就是此样本下第一应用与第二应用的存量比。
步骤308,对全部所述目标上报应用各自对应的所述比值进行加权处理,得到所述第一应用与所述第二应用的目标存量比。
全部目标上报应用中,每个目标上报应用的全部上报信息所对应的活跃用户集合均相当于一个样本,利用多个样本中第一应用和第二应用的存量比,可确定两者的目标存量比。该目标存量比相对于该多个样本的存量比更具可靠性。
其中,由于各目标上报应用的覆盖用户范围、用户群体稳定性不同,其作为计算第一应用存量的样本的可靠性也就不同。进一步地,可使用权重表示目标上报应用的可靠性,目标上报应用的覆盖用户范围越广、用户群体稳定性越高,其对应的权重越高,其对应的比值的可靠性也就越高。
基于上述原理,加权处理过程中,将各目标上报应用对应的比值乘以其权重,得到各目标上报应用对应的乘积,再对所有目标上报应用对应的乘积求和,得到最终的目标存量比。换言之,以多个目标上报应用各自的上报信息分别作为样本,计算每个样本中第一应用与第二应用的存量比,并对此多个存量比加权处理,得到相对于每个存量比都更具准确性的目标存量比。使用该更具准确性的目标存量比,最终确定的第一应用的存量的准确性也得以提升。
步骤310,确定所述第二应用的存量与所述目标存量比的乘积,作为所述第一应用的存量。
目标存量比反映了第一应用的存量与第二应用的存量的实际比值,在已知第二应用的存量的基础上,可直接计算第二应用的存量与所述目标存量比的乘积作为所述第一应用的存量,该存量反映了较为准确的当前安装有第一应用的用户数量。
以上技术方案,对活跃用户上报的上报信息进行多样本化的处理,以获取更为准确有效的应用间的存量比,从而使最终获得的应用存量的准确性得以有效提升,为依赖于存量所进行的应用开发和维护工作提供了便利。
实施例五
图4示出了根据本发明的又一个实施例的数据处理方法的流程图。
如图4所示,根据本发明的又一个实施例的数据处理方法的流程包括:
步骤402,从指定存储设备读取上报信息集合,所述上报信息集合包括多个活跃用户的上报信息,其中,每个活跃用户的上报信息包括:活跃用户ID、已安装应用列表和上报所述已安装应用列表的上报应用的标识。
活跃用户指的是用于统计应用存量的终端,该终端可安装有多个应用。其中,活跃用户的上报信息包括但不限于活跃用户ID、活跃用户自身的已安装应用列表以及活跃用户的已安装应用中上报所述已安装应用列表的上报应用的标识。上报信息集合体现为列表的形式,或体现为符合实际存量计算需求的其他任何形式。上报信息集合可准确地反映此多个活跃用户当前的应用安装情况,利用全面、准确的上报信息集合,最终所确定的应用的存量的准确性也能够得以提升。
其中,活跃用户包括但不限于移动终端等电子设备,活跃用户ID可为电子设备的唯一标识码,也可为该电子设备出厂设置或使用者手动设置的任何标识信息。活跃用户的已安装应用列表包括活跃用户所安装有的全部应用。活跃用户中的每个具有上报信息上报功能的应用均可对本活跃用户的已安装应用列表进行上报,这些具有上报信息上报功能的应用即为上报应用,每个上报应用具有自身的标识,该标识包括但不限于上报应用的名称、编码等个体识别信息。
步骤404,对于所述多个活跃用户涉及的全部上报应用中的多个目标上报应用,基于所述上报信息集合,确定每个目标上报应用上报的全部所述已安装应用列表中第一应用的数量和第二应用的数量。
对于每个活跃用户,其安装的全部应用均可作为上报应用,为其上报其自身的上报信息。上报应用的数量繁多,在多个活跃用户涉及的全部上报应用中选择覆盖用户范围足够广、用户群体足够稳定的多个目标上报应用。
对于每个目标上报应用来说,多个活跃用户中有若干个活跃用户的上报信息都由自身的该目标上报应用进行上报。这样,该目标上报应用上报的全部已安装应用列表即该若干个活跃用户的已安装应用列表,目标上报应用上报的全部所述已安装应用列表中第一应用的数量,即该若干个活跃用户中安装有第一应用的活跃用户数量,目标上报应用上报的全部所述已安装应用列表中第二应用的数量,即该若干个活跃用户中安装有第二应用的活跃用户数量。利用覆盖用户范围足够广、用户群体足够稳定的多个目标上报应用各自对应的第一应用的数量和第二应用的数量,最终确定的第一应用的存量的准确性也得以提升。
步骤406,确定每个所述目标上报应用对应的所述第一应用的数量与所述第二应用的数量的比值。
对于每个目标上报应用,以第二应用作为第一应用的参照对象,将第一应用的数量与第二应用的数量进行比较,得到两者的比值。此时,对于每个目标上报应用,其上报的全部上报信息所对应的活跃用户集合相当于一个样本,该比值即为此样本下安装有第一应用的活跃用户数量和安装有第二应用的活跃用户数量的比值,也就是此样本下第一应用与第二应用的存量比。
步骤408,对全部所述目标上报应用各自对应的所述比值进行加权处理,得到所述第一应用与所述第二应用的目标存量比。
全部目标上报应用中,每个目标上报应用的全部上报信息所对应的活跃用户集合均相当于一个样本,利用多个样本中第一应用和第二应用的存量比,可确定两者的目标存量比。该目标存量比相对于该多个样本的存量比更具可靠性。
其中,由于各目标上报应用的覆盖用户范围、用户群体稳定性不同,其作为计算第一应用存量的样本的可靠性也就不同。进一步地,可使用权重表示目标上报应用的可靠性,目标上报应用的覆盖用户范围越广、用户群体稳定性越高,其对应的权重越高,其对应的比值的可靠性也就越高。
基于上述原理,加权处理过程中,将各目标上报应用对应的比值乘以其权重,得到各目标上报应用对应的乘积,再对所有目标上报应用对应的乘积求和,得到最终的目标存量比。换言之,以多个目标上报应用各自的上报信息分别作为样本,计算每个样本中第一应用与第二应用的存量比,并对此多个存量比加权处理,得到相对于每个存量比都更具准确性的目标存量比。使用该更具准确性的目标存量比,最终确定的第一应用的存量的准确性也得以提升。
步骤410,确定所述第二应用的存量与所述目标存量比的乘积,作为所述第一应用在当前存量计算周期的第一存量。
对第一应用的存量可每周、每日、甚至每个小时进行一次统计,为此,可设置当前存量计算周期,在每个当前存量计算周期的初始时刻或最末时刻对第一应用当前的存量进行计算。
在实际场景下,为排除活跃用户增减和变动、数据计算准确性等因素带来的影响,可对以目标存量比与第二应用的存量相乘所得的第一存量的可靠性进行进一步判断,以便获取更为准确有效的第一应用的存量。
步骤412,获取所述第一应用在所述当前存量计算周期的在前存量计算周期内的第二存量,并确定所述第一存量与所述第二存量的第一差值。
第一存量为计算所得的第一应用在当前存量计算周期内的存量,由于每个存量计算周期均会计算第一应用在当时的存量,故可直接获得第一应用于在前存量计算周期内的第二存量,并计算第一存量与所述第二存量的第一差值。以第二存量作为参照,第一差值体现了当前存量计算周期相对于在前存量计算周期的存量变动情况。
步骤414,获取所述第一应用在所述当前存量计算周期相对于所述在前存量计算周期的安装量和卸载量,并获取所述安装量与所述卸载量的第二差值。
第一应用在所述当前存量计算周期相对于所述在前存量计算周期的安装量与卸载量为已有数据,两者的第二差值也体现了当前存量计算周期相对于在前存量计算周期的实际存量变动情况。
步骤416,判断所述第一差值与所述第二差值是否均为正值或均为负值,在判断结果为是时,进入步骤418,在判断结果为否时,进入步骤420。
以第二差值,也即两周期间的实际存量变动情况为参照,若两者正负不一致,说明第一差值所体现的存量变动情况与两周期间的实际存量变动情况不符合,则用于计算第一差值的第一存量不可靠,此时,将第一存量丢弃,进入步骤420,将第二存量与第二差值的和确定为所述第一应用的存量。
若两者均为正值或均为负值,说明第一差值所体现的存量变动情况与第二差值所体现的实际存量变动情况的变动趋势是一致的,此时,暂不丢弃第一存量,进入步骤418进行进一步判断。
步骤418,判断所述第一差值是否大于所述第二差值的指定倍数,在判断结果为是时,进入步骤420,在判断结果为否时,进入步骤422。
在第一差值所体现的存量变动情况与两周期间的实际存量变动情况的变动趋势是一致的情况下,再判断存量变动大小是否合理。具体地,判断第一差值是否大于所述第二差值的指定倍数,该指定倍数为第一差值可靠的情况下其相对第二差值的最大倍数。
第一差值大于所述第二差值的指定倍数,也就是说,两周期间的实际存量变动大小远大于两周期间安装量与卸载量的实际差值。这说明第一差值所体现的存量变动大小与两周期间的实际存量变动大小严重不符,则用于计算第一差值的第一存量不可靠,此时,将第一存量丢弃,进入步骤420,将第二存量与第二差值的和确定为所述第一应用的存量。
第一差值未大于所述第二差值的指定倍数,也就是说,两周期间的实际存量变动大小与两周期间安装量与卸载量的实际差值在可接受的误差范围内,则可进入步骤422,将用于计算第一差值的第一存量直接作为第一应用的存量。
步骤420,将所述第二存量与所述第二差值的和确定为所述第一应用的存量。
在前存量计算周期内第一应用的存量为第二存量,接着,进入当前存量计算周期,两周期间安装量与卸载量的实际差值为第二差值,第二差值体现了当前存量计算周期相对于在前存量计算周期的第一应用的增量。当然,第二差值可为正,也可为负。此时,将在前存量计算周期内第一应用的第二存量,与当前存量计算周期相对于在前存量计算周期的第一应用的增量相加,得到具有高可靠性的第一应用的存量。
步骤422,将所述第一存量确定为所述第一应用的存量。
第一差值未大于所述第二差值的指定倍数,也就是说,两周期间的实际存量变动大小与两周期间安装量与卸载量的实际差值在可接受的误差范围内,则可进入步骤422,将用于计算第一差值的第一存量直接作为第一应用的存量。
以上技术方案,对活跃用户上报的上报信息进行多样本化的处理,以获取更为准确有效的应用间的存量比,从而使最终获得的应用存量的准确性得以有效提升,为依赖于存量所进行的应用开发和维护工作提供了便利。
图5示出了根据本发明的一个实施例的数据处理装置的框图。
如图5所示,本发明实施例提供了一种数据处理装置500,包括:上报信息集合获取单元502,用于从指定存储设备读取上报信息集合,所述上报信息集合包括多个活跃用户的上报信息,其中,每个活跃用户的上报信息包括:活跃用户ID、已安装应用列表和上报所述已安装应用列表的上报应用的标识;应用数量确定单元504,用于对于所述多个活跃用户涉及的全部上报应用中的多个目标上报应用,基于所述上报信息集合,确定每个目标上报应用上报的全部所述已安装应用列表中第一应用的数量和第二应用的数量;存量比确定单元506,用于基于全部所述目标上报应用中的每个所述目标上报应用对应的所述第一应用的数量与所述第二应用的数量,确定所述第一应用与所述第二应用的目标存量比;第二应用存量获取单元508,用于获取所述第二应用的存量,所述第二应用的存量是根据所述第二应用的发布方按照预定周期公布的存量数据确定的;第一应用存量确定单元510,用于基于所述目标存量比和所述第二应用的存量,确定所述第一应用的存量。
在本申请的实施例中,可选地,所述指定存储设备存储的所述上报信息集合按照如下方式更新:对于所述上报信息集合中的任一活跃用户ID,以实时获得的该活跃用户ID对应的最新已安装应用列表,覆盖该活跃用户ID在所述上报信息集合中的历史已安装应用列表;以及对于所述上报信息集合中的任一活跃用户ID,判断其最后一次获得所述最新已安装应用列表的时刻距当前时刻是否超过指定时长,其中,在判断结果为是时,删除该活跃用户ID所属的活跃用户的上报信息;以及将实时新增活跃用户的上报信息实时增加至所述上报信息集合中。
在本申请的实施例中,可选地,所述存量比确定单元506用于:确定每个所述目标上报应用对应的所述第一应用的数量与所述第二应用的数量的比值;对全部所述目标上报应用各自对应的所述比值进行加权处理,得到所述第一应用与所述第二应用的目标存量比。
在本申请的实施例中,可选地,第二应用存量获取单元508用于:基于所述第二应用在多个历史时刻下的历史存量,确定所述第二应用的单位存量变化量;基于所述单位存量变化量,以及所述第二应用在距离当前时刻最近的历史时刻的历史存量,确定所述当前时刻下所述第二应用的存量。
在本申请的实施例中,可选地,所述第一应用存量确定单元510用于:确定所述第二应用的存量与所述目标存量比的乘积,作为所述第一应用的存量。
在本申请的实施例中,可选地,所述第一应用存量确定单元510用于:确定所述第二应用的存量与所述目标存量比的乘积,作为所述第一应用在当前存量计算周期的第一存量;获取所述第一应用在所述当前存量计算周期的在前存量计算周期内的第二存量,并确定所述第一存量与所述第二存量的第一差值;获取所述第一应用在所述当前存量计算周期相对于所述在前存量计算周期的安装量和卸载量,并获取所述安装量与所述卸载量的第二差值;判断所述第一差值与所述第二差值是否均为正值或均为负值;在判断结果为所述第一差值与所述第二差值均为正值或均为负值的情况下,基于所述第一差值和所述第二差值,确定所述第一应用的存量;否则,将所述第二存量与所述第二差值的和确定为所述第一应用的存量。
在本申请的实施例中,可选地,所述第一存量确定单元510在基于所述第一差值和所述第二差值,确定所述第一应用的存量的过程中,用于:判断所述第一差值是否大于所述第二差值的指定倍数;在判断结果为所述第一差值大于所述第二差值的指定倍数时,将所述第二存量与所述第二差值的和确定为所述第一应用的存量;否则,将所述第一存量确定为所述第一应用的存量。
该数据处理装置500使用实施例一至五中任一项所述的方案,因此,具有上述所有技术效果,在此不再赘述。
图6示出了根据本发明的一个实施例的电子设备的框图。
如图6所示,本发明的一个实施例的电子设备600,包括至少一个存储器602;以及,与所述至少一个存储器602通信连接的处理器604;其中,所述存储器存储有可被所述至少一个处理器604执行的指令,所述指令被设置为用于执行上述实施例一至五中任一项所述的方案。因此,该电子设备600具有和实施例一至五中任一项相同的技术效果,在此不再赘述。
本发明实施例的电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子装置。
另外,本发明实施例提供了一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行上述实施例一至五中任一项所述的方法流程。
以上结合附图详细说明了本发明的技术方案,通过本发明的技术方案,对活跃用户上报的上报信息进行多样本化的处理,以获取更为准确有效的应用间的存量比,从而使最终获得的应用存量的准确性得以有效提升,为依赖于存量所进行的应用开发和维护工作提供了便利。
应当理解,尽管在本发明实施例中可能采用术语第一、第二等来描述应用,但这些应用不应限于这些术语。这些术语仅用来将应用彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一应用也可以被称为第二应用,类似地,第二应用也可以被称为第一应用。
取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (10)
1.一种数据处理方法,其特征在于,包括:
从指定存储设备读取上报信息集合,所述上报信息集合包括多个活跃用户的上报信息,其中,每个活跃用户的上报信息包括:活跃用户ID、已安装应用列表和上报所述已安装应用列表的上报应用的标识;
对于所述多个活跃用户涉及的全部上报应用中的多个目标上报应用,基于所述上报信息集合,确定每个目标上报应用上报的全部所述已安装应用列表中第一应用的数量和第二应用的数量;
基于全部所述目标上报应用中的每个所述目标上报应用对应的所述第一应用的数量与所述第二应用的数量,确定所述第一应用与所述第二应用的目标存量比;
获取所述第二应用的存量,所述第二应用的存量是根据所述第二应用的发布方按照预定周期公布的存量数据确定的;
基于所述目标存量比和所述第二应用的存量,确定所述第一应用的存量。
2.根据权利要求1所述的数据处理方法,其特征在于,所述指定存储设备存储的所述上报信息集合按照如下方式更新:
对于所述上报信息集合中的任一活跃用户ID,以实时获得的该活跃用户ID对应的最新已安装应用列表,覆盖该活跃用户ID在所述上报信息集合中的历史已安装应用列表;以及
对于所述上报信息集合中的任一活跃用户ID,判断其最后一次获得所述最新已安装应用列表的时刻距当前时刻是否超过指定时长,其中,在判断结果为是时,删除该活跃用户ID所属的活跃用户的上报信息;以及
将实时新增活跃用户的上报信息实时增加至所述上报信息集合中。
3.根据权利要求1所述的数据处理方法,其特征在于,所述基于其对应的所述第一应用的数量与所述第二应用的数量,确定所述第一应用与所述第二应用的目标存量比的步骤,包括:
确定每个所述目标上报应用对应的所述第一应用的数量与所述第二应用的数量的比值;
对全部所述目标上报应用各自对应的所述比值进行加权处理,得到所述第一应用与所述第二应用的目标存量比。
4.根据权利要求1所述的数据处理方法,其特征在于,所述获取所述第二应用的存量的步骤,包括:
基于所述第二应用在多个历史时刻下的历史存量,确定所述第二应用的单位存量变化量;
基于所述单位存量变化量,以及所述第二应用在距离当前时刻最近的历史时刻的历史存量,确定所述当前时刻下所述第二应用的存量。
5.根据权利要求1至4中任一项所述的数据处理方法,其特征在于,所述基于所述目标存量比和所述第二应用的存量,确定所述第一应用的存量的步骤,包括:
确定所述第二应用的存量与所述目标存量比的乘积,作为所述第一应用在当前存量计算周期的第一存量;
获取所述第一应用在所述当前存量计算周期的在前存量计算周期内的第二存量,并确定所述第一存量与所述第二存量的第一差值;
获取所述第一应用在所述当前存量计算周期相对于所述在前存量计算周期的安装量和卸载量,并获取所述安装量与所述卸载量的第二差值;
判断所述第一差值与所述第二差值是否均为正值或均为负值;
在判断结果为所述第一差值与所述第二差值均为正值或均为负值的情况下,基于所述第一差值和所述第二差值,确定所述第一应用的存量;
否则,将所述第二存量与所述第二差值的和确定为所述第一应用的存量。
6.根据权利要求5所述的数据处理方法,其特征在于,所述基于所述第一差值和所述第二差值,确定所述第一应用的存量的步骤,包括:
判断所述第一差值是否大于所述第二差值的指定倍数;
在判断结果为所述第一差值大于所述第二差值的指定倍数时,将所述第二存量与所述第二差值的和确定为所述第一应用的存量;
否则,将所述第一存量确定为所述第一应用的存量。
7.一种数据处理装置,其特征在于,包括:
上报信息集合获取单元,用于从指定存储设备读取上报信息集合,所述上报信息集合包括多个活跃用户的上报信息,其中,每个活跃用户的上报信息包括:活跃用户ID、已安装应用列表和上报所述已安装应用列表的上报应用的标识;
应用数量确定单元,用于对于所述多个活跃用户涉及的全部上报应用中的多个目标上报应用,基于所述上报信息集合,确定每个目标上报应用上报的全部所述已安装应用列表中第一应用的数量和第二应用的数量;
存量比确定单元,用于基于全部所述目标上报应用中的每个所述目标上报应用对应的所述第一应用的数量与所述第二应用的数量,确定所述第一应用与所述第二应用的目标存量比;
第二应用存量获取单元,用于获取所述第二应用的存量,所述第二应用的存量是根据所述第二应用的发布方按照预定周期公布的存量数据确定的;
第一应用存量确定单元,用于基于所述目标存量比和所述第二应用的存量,确定所述第一应用的存量。
8.根据权利要求7所述的数据处理装置,其特征在于,所述指定存储设备存储的所述上报信息集合按照如下方式更新:
对于所述上报信息集合中的任一活跃用户ID,以实时获得的该活跃用户ID对应的最新已安装应用列表,覆盖该活跃用户ID在所述上报信息集合中的历史已安装应用列表;以及
对于所述上报信息集合中的任一活跃用户ID,判断其最后一次获得所述最新已安装应用列表的时刻距当前时刻是否超过指定时长,其中,在判断结果为是时,删除该活跃用户ID所属的活跃用户的上报信息;以及
将实时新增活跃用户的上报信息实时增加至所述上报信息集合中。
9.一种电子设备,其特征在于,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行上述权利要求1至6中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,存储有计算机可执行指令,所述计算机可执行指令用于执行如权利要求1至6中任一项所述的方法流程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010428846.0A CN111611143B (zh) | 2020-05-20 | 2020-05-20 | 数据处理方法及装置、电子设备和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010428846.0A CN111611143B (zh) | 2020-05-20 | 2020-05-20 | 数据处理方法及装置、电子设备和计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111611143A true CN111611143A (zh) | 2020-09-01 |
CN111611143B CN111611143B (zh) | 2023-06-30 |
Family
ID=72200329
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010428846.0A Active CN111611143B (zh) | 2020-05-20 | 2020-05-20 | 数据处理方法及装置、电子设备和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111611143B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113435765A (zh) * | 2021-07-06 | 2021-09-24 | 南京莱斯信息技术股份有限公司 | 一种公共信用信息归集质量考核方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120291022A1 (en) * | 2011-05-09 | 2012-11-15 | Google Inc. | Generating application recommendations based on user installed applications |
JP5422069B1 (ja) * | 2013-03-11 | 2014-02-19 | 日本電信電話株式会社 | アイテム推薦システム、アイテム推薦方法およびアイテム推薦プログラム |
CN105404532A (zh) * | 2015-11-05 | 2016-03-16 | 广东欧珀移动通信有限公司 | 终端设备中软件的恢复方法、装置和终端设备 |
CN106682058A (zh) * | 2016-08-08 | 2017-05-17 | 腾讯科技(深圳)有限公司 | 应用程序的筛选方法、装置和系统 |
CN106846094A (zh) * | 2016-12-29 | 2017-06-13 | 广州优视网络科技有限公司 | 一种基于已安装应用来推荐应用信息的方法和装置 |
CN107480165A (zh) * | 2017-06-21 | 2017-12-15 | 上海恺英网络科技有限公司 | 一种页面排位的方法及设备 |
CN107729544A (zh) * | 2017-11-01 | 2018-02-23 | 广州优视网络科技有限公司 | 一种推荐应用的方法和装置 |
CN108563758A (zh) * | 2018-04-17 | 2018-09-21 | 广州虎牙信息科技有限公司 | 用户数量测算方法、装置、设备和存储介质 |
CN110020152A (zh) * | 2017-12-04 | 2019-07-16 | 中国移动通信集团终端有限公司 | 应用推荐方法及装置 |
CN110798511A (zh) * | 2019-10-14 | 2020-02-14 | 浙江每日互动网络科技股份有限公司 | 目标app的日活跃用户数量预测方法及计算机设备 |
-
2020
- 2020-05-20 CN CN202010428846.0A patent/CN111611143B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120291022A1 (en) * | 2011-05-09 | 2012-11-15 | Google Inc. | Generating application recommendations based on user installed applications |
JP5422069B1 (ja) * | 2013-03-11 | 2014-02-19 | 日本電信電話株式会社 | アイテム推薦システム、アイテム推薦方法およびアイテム推薦プログラム |
CN105404532A (zh) * | 2015-11-05 | 2016-03-16 | 广东欧珀移动通信有限公司 | 终端设备中软件的恢复方法、装置和终端设备 |
CN106682058A (zh) * | 2016-08-08 | 2017-05-17 | 腾讯科技(深圳)有限公司 | 应用程序的筛选方法、装置和系统 |
CN106846094A (zh) * | 2016-12-29 | 2017-06-13 | 广州优视网络科技有限公司 | 一种基于已安装应用来推荐应用信息的方法和装置 |
CN107480165A (zh) * | 2017-06-21 | 2017-12-15 | 上海恺英网络科技有限公司 | 一种页面排位的方法及设备 |
CN107729544A (zh) * | 2017-11-01 | 2018-02-23 | 广州优视网络科技有限公司 | 一种推荐应用的方法和装置 |
CN110020152A (zh) * | 2017-12-04 | 2019-07-16 | 中国移动通信集团终端有限公司 | 应用推荐方法及装置 |
CN108563758A (zh) * | 2018-04-17 | 2018-09-21 | 广州虎牙信息科技有限公司 | 用户数量测算方法、装置、设备和存储介质 |
CN110798511A (zh) * | 2019-10-14 | 2020-02-14 | 浙江每日互动网络科技股份有限公司 | 目标app的日活跃用户数量预测方法及计算机设备 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113435765A (zh) * | 2021-07-06 | 2021-09-24 | 南京莱斯信息技术股份有限公司 | 一种公共信用信息归集质量考核方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111611143B (zh) | 2023-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108876464B (zh) | 一种作弊行为检测方法、装置、服务设备及存储介质 | |
CN108924213B (zh) | 一种服务器的qps控制方法、装置及电子设备 | |
CN107193718A (zh) | 一种充电提醒方法、系统及终端设备 | |
CN105337783B (zh) | 监测通信设备非正常消耗流量的方法及装置 | |
CN112418673A (zh) | 案件分配方法、装置及介质 | |
CN111626754B (zh) | 养卡用户识别方法及装置 | |
CN113114770B (zh) | 用户识别方法、电子设备和计算机可读存储介质 | |
CN111611143A (zh) | 数据处理方法及装置、电子设备和计算机可读存储介质 | |
CN106933323B (zh) | 一种优化应用程序耗电的方法、装置及电子设备 | |
CN110108296B (zh) | 一种步数统计方法、电子设备及计算机可读存储介质 | |
CN111580836B (zh) | 数据处理方法及装置、电子设备和计算机可读存储介质 | |
CN111428197A (zh) | 数据处理方法、装置及设备 | |
CN111159169A (zh) | 数据治理方法及设备 | |
CN110855484A (zh) | 自动检测业务量变化的方法、系统、电子设备和存储介质 | |
CN113836043B (zh) | 基于测试用例的中台自维护方法、装置及存储介质 | |
CN113283486B (zh) | 一种基于wifi的设备类型确定方法、电子设备及存储介质 | |
CN108632054B (zh) | 信息传播量的预测方法及装置 | |
CN113157756B (zh) | 互动数据统计方法、装置、电子设备及存储介质 | |
CN111563026B (zh) | 数据处理方法及装置、电子设备和计算机可读存储介质 | |
CN114205455A (zh) | 应用定位处理方法、装置、设备和存储介质 | |
CN112673611B (zh) | 移动终端控制方法、移动终端控制装置及移动终端 | |
CN113159509A (zh) | 一种订单处理方法、系统、装置以及存储介质 | |
CN112669091A (zh) | 数据处理方法、装置及存储介质 | |
CN114722278B (zh) | 推送信息的方法、装置、存储介质和电子设备 | |
CN111523083A (zh) | 一种电力负荷申报数据的确定方法以及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 310012 Room 418, West District, Building A, 525 Xixi Road, Xihu District, Hangzhou City, Zhejiang Province Applicant after: Daily interactive Co.,Ltd. Address before: 310012 Room 418, West District, Building A, 525 Xixi Road, Xihu District, Hangzhou City, Zhejiang Province Applicant before: ZHEJIANG MEIRI INTERDYNAMIC NETWORK TECHNOLOGY Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |