CN108874641A - 一种埋点数据的分析方法及装置 - Google Patents
一种埋点数据的分析方法及装置 Download PDFInfo
- Publication number
- CN108874641A CN108874641A CN201810554442.9A CN201810554442A CN108874641A CN 108874641 A CN108874641 A CN 108874641A CN 201810554442 A CN201810554442 A CN 201810554442A CN 108874641 A CN108874641 A CN 108874641A
- Authority
- CN
- China
- Prior art keywords
- data
- data item
- measurand
- burying
- support
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3438—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明适用于数据处理技术领域,提供了一种埋点数据的分析方法及装置,包括:获取被测对象的埋点数据;所述被测对象包括应用程序或网页;确定所述被测对象的实际使用时段,并将所述实际使用时段之内的埋点数据识别为实际应用数据;根据预设模型确定所述实际应用数据中的关联数据;对所述关联数据进行分析,得到所述被测对象的运行信息或者所述被测对象的用户使用信息。本发明通过分析关联数据得到整个实际使用时间之内的用户行为情况和软件的运行状态情况,实现完整、全面的数据统计与分析,提高了用户行为分析的连贯性和可追踪性。
Description
技术领域
本发明属于数据处理技术领域,尤其涉及一种埋点数据的分析方法及装置。
背景技术
在应用程序(Application,App)或者网页中进行埋点便可以获取到用户在使用过程中的操作信息,通过在App代码中加入与信息搜集相关的代码,在适当的时机发送给服务器,服务器通过数据建模等方法确定用户的具体动作。例如,如果开发者想要知道用户使用某个软件的情况,那么在软件的某个按钮的监听函数中加上一段代码,用一个变量记下用户点击该按钮的次数,然后通过合理的时机将这个变量的值传给该软件后台的服务器,服务器对这些变量的值进行分析,便可确定出用户打开软件之后的具体动作。
但是,现有技术中在获取到用户的应用数据之后,只是根据埋点处获取到的操作信息单独分析某一点处的用户数据,尤其是当App或者网页的功能较复杂、用户数量技术较大的情况下,不能对整个使用过程进行全面的监控,造成数据分析的局限性。
发明内容
有鉴于此,本发明实施例提供了一种埋点数据的分析方法及装置,以解决现有技术中不能对整个使用过程进行全面的监控,造成数据分析的局限性的问题。
本发明实施例的第一方面提供了一种埋点数据的分析方法,包括:
获取被测对象的埋点数据;所述被测对象包括应用程序或网页;
确定所述被测对象的实际使用时段,并将所述实际使用时段之内的埋点数据识别为实际应用数据;
根据预设模型确定所述实际应用数据中的关联数据;
对所述关联数据进行分析,得到所述被测对象的运行信息或者所述被测对象的用户使用信息。
本发明实施例的第二方面提供了一种埋点数据的装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取被测对象的埋点数据;所述被测对象包括应用程序或网页;
确定所述被测对象的实际使用时段,并将所述实际使用时段之内的埋点数据识别为实际应用数据;
根据预设模型确定所述实际应用数据中的关联数据;
对所述关联数据进行分析,得到所述被测对象的运行信息或者所述被测对象的用户使用信息。
本发明实施例的第三方面提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。
实施本发明实施例提供的一种埋点数据的分析方法及装置具有以下有益效果:通过获取埋点数据确定被测对象的实际使用时段,以及该实际使用时段之内的关联数据,通过分析关联数据得到整个实际使用时间之内的用户行为情况和软件的运行状态情况,实现完整、全面的数据统计与分析,提高了用户行为分析的连贯性和可追踪性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的埋点数据的分析方法的流程图;
图2是本发明实施例二提供的埋点数据的分析方法的流程图;
图3是本发明实施例二提供的实际使用时段的示意图;
图4是本发明实施例三提供的埋点数据的分析方法的流程图;
图5是本发明实施例四提供的埋点数据的分析装置的示意图;
图6是本发明实施例五提供的埋点数据的分析装置的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明实施例通过埋点数据得到关联数据,以对关联数据进行分析,得到整个时间段之内、某一操作过程中的用户行为情况和软件的运行状态情况,解决了根据单一埋点处获取到的操作信息单独分析某一点处的用户数据,不能对整个使用过程进行全面的监控,造成数据分析的局限性的问题。
在本发明实施例中,流程的执行主体为计算机、服务器等终端设备,但并不限于此,该终端设备具有分析埋点数据的功能。图1示出了本发明第一实施例提供的埋点数据的分析装置的控制方法的实现流程图,详述如下:
在S101中,获取被测对象的埋点数据;所述被测对象包括应用程序或网页。
埋点是分析被测对象时的一种数据采集方法,通过在被测对象的程序中进行埋点可以获取到被测对象的运行数据,再对这些数据进行分析便可以得到被测对象的运行情况,或者用户使用该被测对象时的用户习惯等。
示例性地,在应用程序的界面初始化时,同时初始化第三方数据分析服务商的软件开发工具包(Software Development Kit,SDK),然后在某个事件发生时就调用SDK里面相应的数据发送接口发送数据。例如,若需要统计应用程序里面某个按钮的点击次数,则在这个按钮被点击时,在按钮对应的点击鼠标OnClick函数里面调用SDK提供的数据发送接口来发送数据。
进一步的,在获取被测对象的埋点数据时,可以是设定一个或者多个固定的时间来获取埋点数据;也可以设定一个获取周期,周期性的获取埋点数据;还可以检测当前时刻的网络状态是否拥堵,根据所生成的埋点数据量的多少,选择网络状态良好的时候获取埋点数据,此处不做限定。
在S102中,确定所述被测对象的实际使用时段,并将所述实际使用时段之内的埋点数据识别为实际应用数据。
由于被测对象在运行过程中,可能一直在生成埋点数据。若埋点数据的数据量较大,且冗余数据较多时,往往会对分析过程造成干扰,而影响埋点数据的分析结果。例如,在某个被测对象被开启并未进行操作时,便可能生成埋点数据,这些埋点数据即为冗余数据。可选的,可以将这些冗余数据直接删除,以保证埋点数据的精简性,提高数据传输和处理的效率。
在本实施例中,通过根据埋点数据的属性,确定被测对象的实际使用时段,以将使用时段之内的埋点数据识别为实际应用数据,保证数据分析的有效性。
具体的,每个软件或者网页在实际使用过程中,都是从打开到转入后台、锁屏或者关闭,在这个过程中所有的操作动作都是可以通过埋点数据体现的。例如,打开或者关闭一个应用程序时,其埋点数据中就会体现出应用程序的启动时间或者关闭时间。
每个埋点数据中都有时间标识,这个时间标识用来确定生成该埋点数据的时间。通过识别埋点数据的变化特点,确定被测对象的实际使用时间,并根据该实际使用时间和埋点数据的时间标识,截取在该实际使用时间之内的埋点数据,这些截取到的数据,便是实际应用数据。
在S103中,根据预设模型确定所述实际应用数据中的关联数据。
实际应用数据是独立存在的,例如,应用程序中某个按钮的点击时间、某个视频的用户点击量等,不受其他类型数据的影响,无法直接的确定哪些数据之间可能存在关联。
因此,在本方案中,通过计算各类型的实际应用数据之间的支持度和置信度,确定置信度较高的数据项中的数据为关联数据,以对关联数据进行关联分析。
在S104中,对所述关联数据进行分析,得到所述被测对象的运行信息或者所述被测对象的用户使用信息。
在确定关联数据之后,对关联数据进行关联分析。其中,关联分析的方法可以为线性回归分析、主成分分析、典型相关分析、判别分析、聚类分析、贝叶斯统计分析或者通过统计分析软件进行分析,此处不做限定。
示例性地,若将实际应用数据与用户的实际使用习惯或者被测对象的运行方式结合,应用程序中某个按钮的点击时间、某段时间中的点击次数便可以关联起来,以得到应用程序的某个按钮的点击率和点击高峰期等信息,用以评价该按钮对应的功能属性是否符合用户需求或者用户使用率;还可以将网页中某个视频的用户点击量、观看时段或者是重复观看视频段关联起来,以得到这个视频的用户喜好程度、用户类型或者视频关注点。
以上可以看出,本发明实施例提供的一种埋点数据的分析方法通过对被测对象进行埋点获取埋点数据,确定被测对象的实际使用时段,以及该实际使用时段之内的关联数据,通过分析关联数据得到整个实际使用时间之内的用户行为情况和软件的运行状态情况,实现完整、全面的数据统计与分析,提高了用户行为分析的连贯性和可追踪性。
图2示出了本发明第二实施例提供的一种埋点数据的分析方法S102的具体实现流程图。参见图2所示,相对于图1所述实施例,本实施例提供的一种埋点数据的分析方法中S102包括S201~S202,具体详述如下:
在S201中,根据所述被测对象启动到运行所述被测对象的终端锁屏之间的时间段、所述被测对象启动到被切换到后台之间的时间段,以及从所述被测对象启动到关闭之间的时间段确定所述被测对象的实际使用时段。
由于通过埋点获取到的数据是长时间的数据集,但是大量的数据又会造成较大的数据冗余,浪费数据处理和分析的时间。因此,为了更准确地确定被测对象在被使用过程中的实际使用数据,则根据用户的操作行为确定用户使用被测对象的使用时长。将以下任一时间段确定所述被测对象的实际使用时段:从所述被测对象启动到运行所述被测对象的终端锁屏之间的时间段、从所述被测对象启动到被切换到后台之间的时间段,以及从所述被测对象启动到关闭之间的时间段。
进一步的,由于很多被测对象在退出之后仍旧会在后台运行,或者运行被测对象的终端即使锁屏时候,被测对象也会继续运行,因此,这里设定一个预设时间阈值,用于通过这个时间来截取被测对象的实际使用时段。
需要说明的是,这里的终端可以是手机、平板电脑或者计算机等设备,此处不做限定。
示例性地,请一并结合图3所示,图3为本实施例提供的实际使用时段的示意图,设定该时间阈值为半分钟。若运行被测对象的终端锁屏超过半分钟,或者半分钟之内没有获取到任何操作信息,则从启动到锁屏的这段时间作为实际使用时段;或者,从被测对象被启动应用到被切换到后台,并且在后台的时间超过半分钟,则视为应用已经使用结束,从启动到切换到后台的半分钟作为实际使用时段;或者,从被测对象被启动到关闭的这段时间作为实际使用时段,但是如果在后台运行超过半分钟;若后台运行时长t2≥30s,则本次使用时长t为:t=t1+t2+t3,其中,t1为后台运行之前的前端运行时长,t3为后台运行之后的前端运行时长;若t2<30s,则本次使用时长t为:t=t1,舍弃t2,t3则是新一次使用时的使用时长。
需要说明的是,在本实施例中的时间阈值设定为半分钟,还可以根据终端的设置情况、被测对象的运行情况或者用户的使用情况设定该时间阈值,此处不做限定。
在S202中,根据所述埋点数据的时间标识,将所述时间标识在所述实际使用时段中的埋点数据识别为所述实际应用数据。
在确定了实际使用时间之后,根据埋点数据的时间标识以及实际使用时间的起点和终点,将时间标识在实际使用时段中的埋点数据识别为实际应用数据。
通过根据用户的操作行为确定用户使用被测对象的使用时长,更准确地确定被测对象在被使用过程中的实际使用数据,降低了数据冗余,提高了数据分析的准确性。
图4示出了本发明第三实施例提供的一种埋点数据的分析方法S103的具体实现流程图。参见图4所示,相对于图1所述实施例,本实施例提供的一种埋点数据的分析方法中S103包括S401~S404,具体详述如下:
在S401中,根据所述实际应用数据中各数据项的类型标识,对每个所述类型标识对应数据项的数据项数进行计数。
每个实际应用数据的数据项都有各自的类型标识,该类型可以是按照数据项的属性进行命名,例如,按钮的点击时间、点击次数或者视频的观看时长等。通过根据实际应用数据的数据项的类型标识,对同一类型标识的数据项进行计数得到数据项数,以通过该数据项数确定实际使用时间中该类数据的发生频率。
在S402中,根据所述数据项数,计算所述数据项中第一类型标识对应的第一数据项与第二类型标识对应的第二数据项之间的支持度。
本实施例中,第一类型标识对应的数据项为第一数据项,第二类型标识对应的数据项为第二数据项。支持度用于衡量数据项中第一数据项与第二数据项同时出现的频率关系。
具体的,步骤S402可以包括:
根据如下公式计算所述数据项中第一类型标识对应的第一数据项与第二类型标识对应的第二数据项之间的前项支持度:
根据如下公式计算所述数据项中第一类型标识对应的第一数据项与第二类型标识对应的第二数据项之间的关联支持度:
其中,support_count(A)用于表示第一类型标识对应的第一数据项的数据项数;support_count(N)用于表示所有类型标识对应的数据项的总数据项数;support_count(A∪B)用于表示第一类型标识与第二类型标识共同对应的数据项的数据项数。
示例性地,假如被测的应用程序中的两个按钮分别为第一按钮和第二按钮,在实际应用时间中的按动次数分别记为第一数据项和第二数据项,这两个数据项分别对应第一类型标识与第二类型标识。计算第一数据项的数据项数与总数据项数之比,作为前项支持度。前项支持度用于衡量第一数据项在总数据项中的比重,即该按钮的按动次数在总的按钮按动次数中的比重;确定第一类型标识与第二类型标识共同对应的数据项的数据项数,计算该数据项数与总数据项数之比,作为关联支持度。关联支持度用于衡量第一数据和第二数据项对应的动作共同发生的项数在总按钮按动次数中的比重。
在S403中,根据所述第一数据项与所述第二数据项之间的支持度计算其对应的置信度。
根据如下公式计算第一数据项与所述第二数据项之间的置信度:
通过用关联支持度与前项支持度相比,确定第一数据项与第二数据项之间的置信度,置信度用于体现当A出现时,B是否也会出现或有多大概率出现。如果置信度度为100%,则A和B是必然的关联关系。如果置信度太低,则说明A的出现与B是否出现关系不大,即两个数据项之间不存在关联关系。
在S404中,将所述置信度大于或者等于预设的置信度阈值的第一数据项和第二数据项中的数据识别为所述关联数据。
在计算出第一数据项和第二数据项之间的置信度之后,通过衡量该置信度的大小确定第一数据项和第二数据项之间的关联关系的强弱。
在本实施例中,设定一个置信度阈值,来衡量第一数据项和第二数据项之间的关联关系的强弱。具体的,若置信度大于或者等于该置信度阈值,则第一数据项和第二数据项中的数据关联程度较强,第一数据项和第二数据项中的数据为所述关联数据;若置信度小于该置信度阈值,则第一数据项和第二数据项中的数据关联程度较若,第一数据项和第二数据项中的数据并不是关联数据。
通过计算不同数据标识对应的数据项之间的置信度,可确定不同数据项之间的关联程度,进而确定关联程度较高的数据项为关联数据项,并对这些数据项之间进行关联分析,保证了埋点数据分析过程和结果的完整与全面。
图5示出了本发明实施例四提供的一种埋点数据的分析装置,该装置包括的各单元用于执行图1对应的实施例中的各步骤。具体请参阅图1与图1所对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。
参见图5,所述埋点数据的分析装置包括:
埋点数据获取单元501,用于获取被测对象的埋点数据;所述被测对象包括应用程序或网页。
实际数据确定单元502,用于确定所述被测对象的实际使用时段,并将所述实际使用时段之内的埋点数据识别为实际应用数据。
关联数据确定单元503,用于根据预设模型确定所述实际应用数据中的关联数据。
关联数据分析单元504,用于对所述关联数据进行分析,得到所述被测对象的运行信息或者所述被测对象的用户使用信息。
可选的,实际数据确定单元502可以包括:
使用时段确定单元,用于根据所述被测对象启动到运行所述被测对象的终端锁屏之间的时间段、所述被测对象启动到被切换到后台之间的时间段,以及从所述被测对象启动到关闭之间的时间段确定所述被测对象的实际使用时段。
实际数据识别单元,用于根据所述埋点数据的时间标识,将所述时间标识在所述实际使用时段中的埋点数据识别为所述实际应用数据。
可选的,关联数据确定单元503可以包括:
项数技术单元,用于根据所述实际应用数据中各数据项的类型标识,对每个所述类型标识对应数据项的数据项数进行计数。
支持度单元,用于根据所述数据项数,计算所述数据项中第一类型标识对应的第一数据项与第二类型标识对应的第二数据项之间的支持度。
置信度单元,用于根据所述第一数据项与所述第二数据项之间的支持度计算其对应的置信度。
关联数据单元,用于将所述置信度大于或者等于预设的置信度阈值的第一数据项和第二数据项中的数据识别为所述关联数据。
可选的,支持度单元可以包括:
前项支持度单元,用于根据如下公式计算所述数据项中第一类型标识对应的第一数据项与第二类型标识对应的第二数据项之间的前项支持度:
关联支持度单元,用于根据如下公式计算所述数据项中第一类型标识对应的第一数据项与第二类型标识对应的第二数据项之间的关联支持度:
其中,support_count(A)用于表示第一类型标识对应的第一数据项的数据项数;support_count(N)用于表示所有类型标识对应的数据项的总数据项数;support_count(A∪B)用于表示第一类型标识与第二类型标识共同对应的数据项的数据项数。
可选的,置信度单元可以包括:
置信度计算单元,用于根据如下公式计算第一数据项与所述第二数据项之间的置信度:
因此,本发明实施例提供的埋点数据的分析装置可以通过获取埋点数据,确定被测对象的实际使用时段,以及该实际使用时段之内的关联数据,通过分析关联数据得到整个实际使用时间之内的用户行为情况和软件的运行状态情况,实现完整、全面的数据统计与分析,提高了用户行为分析的连贯性和可追踪性。
图6是本发明实施例五提供的一种埋点数据的分析装置的示意图。如图6所示,该实施例的埋点数据的分析装置6包括:处理器60、存储器61以及存储在所述存储器61中并可在所述处理器60上运行的计算机程序62,例如置信度的计算程序。所述处理器60执行所述计算机程序62时实现上述各个埋点数据的分析方法实施例中的步骤,例如图1所示的S101至S104。或者,所述处理器60执行所述计算机程序62时实现上述各装置实施例中各单元的功能,例如图5所示模块501至504功能。
示例性的,所述计算机程序62可以被分割成一个或多个单元,所述一个或者多个单元被存储在所述存储器61中,并由所述处理器60执行,以完成本发明。所述一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序62在所述埋点数据的分析装置6中的执行过程。例如,所述计算机程序62可以被分割成埋点数据获取单元、实际数据确定单元、关联数据确定单元以及关联数据分析单元,各单元具体功能如下:
埋点数据获取单元,用于获取被测对象的埋点数据;所述被测对象包括应用程序或网页。
实际数据确定单元,用于确定所述被测对象的实际使用时段,并将所述实际使用时段之内的埋点数据识别为实际应用数据。
关联数据确定单元,用于根据预设模型确定所述实际应用数据中的关联数据。
关联数据分析单元,用于对所述关联数据进行分析,得到所述被测对象的运行信息或者所述被测对象的用户使用信息。
所述埋点数据的分析装置可包括,但不仅限于,处理器60、存储器61。本领域技术人员可以理解,图6仅仅是埋点数据的分析装置6的示例,并不构成对埋点数据的分析装置6的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述埋点数据的分析装置还可以包括输入输出设备、网络接入设备、总线等。
所称处理器60可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器61可以是所述终端设备6的内部存储单元,例如终端设备6的硬盘或内存。所述存储器61也可以是所述终端设备6的外部存储设备,例如所述终端设备6上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器61还可以既包括所述终端设备6的内部存储单元也包括外部存储设备。所述存储器61用于存储所述计算机程序以及所述终端设备6所需的其他程序和数据。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元完成,即将所述装置的内部结构划分成不同的功能单元,以完成以上描述的全部或者部分功能。实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的终端设备和方法,可以通过其它的方式实现。例如,以上所描述的终端设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random AccessMemory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种埋点数据的分析方法,其特征在于,包括:
获取被测对象的埋点数据;所述被测对象包括应用程序或网页;
确定所述被测对象的实际使用时段,并将所述实际使用时段之内的埋点数据识别为实际应用数据;
根据预设模型确定所述实际应用数据中的关联数据;
对所述关联数据进行分析,得到所述被测对象的运行信息或者所述被测对象的用户使用信息。
2.如权利要求1所述的埋点数据的分析方法,其特征在于,所述确定所述被测对象的实际使用时段,并将所述实际使用时段之内的埋点数据识别为实际应用数据,包括:
根据所述被测对象启动到运行所述被测对象的终端锁屏之间的时间段、所述被测对象启动到被切换到后台之间的时间段,以及从所述被测对象启动到关闭之间的时间段确定所述被测对象的实际使用时段;
根据所述埋点数据的时间标识,将所述时间标识在所述实际使用时段中的埋点数据识别为所述实际应用数据。
3.如权利要求1或2所述的埋点数据的分析方法,其特征在于,所述根据预设模型确定所述实际应用数据中的关联数据,包括:
根据所述实际应用数据中各数据项的类型标识,对每个所述类型标识对应数据项的数据项数进行计数;
根据所述数据项数,计算所述数据项中第一类型标识对应的第一数据项与第二类型标识对应的第二数据项之间的支持度;
根据所述第一数据项与所述第二数据项之间的支持度计算其对应的置信度;
将所述置信度大于或者等于预设的置信度阈值的第一数据项和第二数据项中的数据识别为所述关联数据。
4.如权利要求3所述的埋点数据的分析方法,其特征在于,所述根据所述数据项数,计算所述数据项中第一类型标识对应的第一数据项与第二类型标识对应的第二数据项之间的支持度,包括:
根据如下公式计算所述数据项中第一类型标识对应的第一数据项与第二类型标识对应的第二数据项之间的前项支持度:
根据如下公式计算所述数据项中第一类型标识对应的第一数据项与第二类型标识对应的第二数据项之间的关联支持度:
其中,support_count(A)用于表示第一类型标识对应的第一数据项的数据项数;support_count(N)用于表示所有类型标识对应的数据项的总数据项数;support_count(A∪B)用于表示第一类型标识与第二类型标识共同对应的数据项的数据项数。
5.如权利要求4所述的埋点数据的分析方法,其特征在于,所述根据所述第一数据项与所述第二数据项之间的支持度计算其对应的置信度,包括:
根据如下公式计算第一数据项与所述第二数据项之间的置信度:
6.一种埋点数据的分析装置,包括存储器以及处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如下步骤:
获取被测对象的埋点数据;所述被测对象包括应用程序或网页;
确定所述被测对象的实际使用时段,并将所述实际使用时段之内的埋点数据识别为实际应用数据;
根据预设模型确定所述实际应用数据中的关联数据;
对所述关联数据进行分析,得到所述被测对象的运行信息或者所述被测对象的用户使用信息。
7.如权利要求6所述的埋点数据的分析装置,其特征在于,所述确定所述被测对象的实际使用时段,并将所述实际使用时段之内的埋点数据识别为实际应用数据,包括:
根据所述被测对象启动到运行所述被测对象的终端锁屏之间的时间段、所述被测对象启动到被切换到后台之间的时间段,以及从所述被测对象启动到关闭之间的时间段确定所述被测对象的实际使用时段;
根据所述埋点数据的时间标识,将所述时间标识在所述实际使用时段中的埋点数据识别为所述实际应用数据。
8.如权利要求6或7所述的埋点数据的分析装置,其特征在于,所述根据预设模型确定所述实际应用数据中的关联数据,包括:
根据所述实际应用数据中各数据项的类型标识,对每个所述类型标识对应数据项的数据项数进行计数;
根据所述数据项数,计算所述数据项中第一类型标识对应的第一数据项与第二类型标识对应的第二数据项之间的支持度;
根据所述第一数据项与所述第二数据项之间的支持度计算其对应的置信度;
将所述置信度大于或者等于预设的置信度阈值的第一数据项和第二数据项中的数据识别为所述关联数据。
9.如权利要求8所述的埋点数据的分析装置,其特征在于,所述根据所述数据项数,计算所述数据项中第一类型标识对应的第一数据项与第二类型标识对应的第二数据项之间的支持度,包括:
根据如下公式计算所述数据项中第一类型标识对应的第一数据项与第二类型标识对应的第二数据项之间的前项支持度:
根据如下公式计算所述数据项中第一类型标识对应的第一数据项与第二类型标识对应的第二数据项之间的关联支持度:
其中,support_count(A)用于表示第一类型标识对应的第一数据项的数据项数;support_count(N)用于表示所有类型标识对应的数据项的总数据项数;support_count(A∪B)用于表示第一类型标识与第二类型标识共同对应的数据项的数据项数。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810554442.9A CN108874641A (zh) | 2018-06-01 | 2018-06-01 | 一种埋点数据的分析方法及装置 |
PCT/CN2018/097448 WO2019227650A1 (zh) | 2018-06-01 | 2018-07-27 | 一种埋点数据的分析方法、终端设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810554442.9A CN108874641A (zh) | 2018-06-01 | 2018-06-01 | 一种埋点数据的分析方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108874641A true CN108874641A (zh) | 2018-11-23 |
Family
ID=64336023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810554442.9A Pending CN108874641A (zh) | 2018-06-01 | 2018-06-01 | 一种埋点数据的分析方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108874641A (zh) |
WO (1) | WO2019227650A1 (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109767259A (zh) * | 2018-12-15 | 2019-05-17 | 深圳壹账通智能科技有限公司 | 基于埋点数据的运营活动推广方法、装置、设备及介质 |
CN109871331A (zh) * | 2019-03-04 | 2019-06-11 | 北京车联天下信息技术有限公司 | 软件功能试错决策分析方法和装置 |
CN110995687A (zh) * | 2019-11-26 | 2020-04-10 | 深圳市随手金服信息科技有限公司 | 一种猫池设备识别方法、装置、设备及存储介质 |
CN111221717A (zh) * | 2020-01-17 | 2020-06-02 | 北大方正集团有限公司 | 用户行为数据处理方法和计算机可读存储介质 |
CN111221711A (zh) * | 2019-10-12 | 2020-06-02 | 中国平安财产保险股份有限公司 | 用户行为数据处理方法、服务器及存储介质 |
CN111552620A (zh) * | 2020-04-03 | 2020-08-18 | 北京字节跳动网络技术有限公司 | 数据获取方法、装置、终端及存储介质 |
CN113064801A (zh) * | 2021-03-10 | 2021-07-02 | 深圳依时货拉拉科技有限公司 | 数据埋点的方法、装置、可读存储介质及计算机设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050125276A1 (en) * | 2003-12-05 | 2005-06-09 | Grigore Rusu | System and method for event tracking across plural contact mediums |
CN102238045A (zh) * | 2010-04-27 | 2011-11-09 | 广州迈联计算机科技有限公司 | 一种无线互联网用户行为的预测系统和方法 |
CN102946319A (zh) * | 2012-09-29 | 2013-02-27 | 焦点科技股份有限公司 | 网络用户行为信息分析系统及其分析方法 |
CN103186675A (zh) * | 2013-04-03 | 2013-07-03 | 南京安讯科技有限责任公司 | 一种基于网络热词识别的网页自动分类方法 |
CN105512210A (zh) * | 2015-11-27 | 2016-04-20 | 网神信息技术(北京)股份有限公司 | 关联事件类型的检测方法及装置 |
CN108052985A (zh) * | 2017-12-28 | 2018-05-18 | 努比亚技术有限公司 | 信息采集方法、信息采集终端及计算机可读存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104572043B (zh) * | 2013-10-16 | 2018-01-19 | 阿里巴巴集团控股有限公司 | 一种对客户端应用的控件进行实时埋点的方法及装置 |
CN107220745B (zh) * | 2017-04-24 | 2021-03-09 | 北京红马传媒文化发展有限公司 | 一种意图行为数据的识别方法、系统及设备 |
CN107818162B (zh) * | 2017-11-01 | 2019-02-01 | 平安科技(深圳)有限公司 | 埋点处理方法、装置、计算机设备和存储介质 |
-
2018
- 2018-06-01 CN CN201810554442.9A patent/CN108874641A/zh active Pending
- 2018-07-27 WO PCT/CN2018/097448 patent/WO2019227650A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050125276A1 (en) * | 2003-12-05 | 2005-06-09 | Grigore Rusu | System and method for event tracking across plural contact mediums |
CN102238045A (zh) * | 2010-04-27 | 2011-11-09 | 广州迈联计算机科技有限公司 | 一种无线互联网用户行为的预测系统和方法 |
CN102946319A (zh) * | 2012-09-29 | 2013-02-27 | 焦点科技股份有限公司 | 网络用户行为信息分析系统及其分析方法 |
CN103186675A (zh) * | 2013-04-03 | 2013-07-03 | 南京安讯科技有限责任公司 | 一种基于网络热词识别的网页自动分类方法 |
CN105512210A (zh) * | 2015-11-27 | 2016-04-20 | 网神信息技术(北京)股份有限公司 | 关联事件类型的检测方法及装置 |
CN108052985A (zh) * | 2017-12-28 | 2018-05-18 | 努比亚技术有限公司 | 信息采集方法、信息采集终端及计算机可读存储介质 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109767259A (zh) * | 2018-12-15 | 2019-05-17 | 深圳壹账通智能科技有限公司 | 基于埋点数据的运营活动推广方法、装置、设备及介质 |
CN109871331A (zh) * | 2019-03-04 | 2019-06-11 | 北京车联天下信息技术有限公司 | 软件功能试错决策分析方法和装置 |
CN111221711A (zh) * | 2019-10-12 | 2020-06-02 | 中国平安财产保险股份有限公司 | 用户行为数据处理方法、服务器及存储介质 |
CN110995687A (zh) * | 2019-11-26 | 2020-04-10 | 深圳市随手金服信息科技有限公司 | 一种猫池设备识别方法、装置、设备及存储介质 |
CN110995687B (zh) * | 2019-11-26 | 2022-06-07 | 深圳市铭数信息有限公司 | 一种猫池设备识别方法、装置、设备及存储介质 |
CN111221717A (zh) * | 2020-01-17 | 2020-06-02 | 北大方正集团有限公司 | 用户行为数据处理方法和计算机可读存储介质 |
CN111552620A (zh) * | 2020-04-03 | 2020-08-18 | 北京字节跳动网络技术有限公司 | 数据获取方法、装置、终端及存储介质 |
CN111552620B (zh) * | 2020-04-03 | 2023-07-11 | 北京字节跳动网络技术有限公司 | 数据获取方法、装置、终端及存储介质 |
CN113064801A (zh) * | 2021-03-10 | 2021-07-02 | 深圳依时货拉拉科技有限公司 | 数据埋点的方法、装置、可读存储介质及计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2019227650A1 (zh) | 2019-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108874641A (zh) | 一种埋点数据的分析方法及装置 | |
CN112424763B (zh) | 对象推荐方法及装置、存储介质与终端设备 | |
CN102402481B (zh) | 异步程序代码的模糊测试 | |
CN110032511A (zh) | 一种接口测试方法及接口测试设备 | |
Koch et al. | Cordies: expressive event correlation in distributed systems | |
CN109474483A (zh) | 一种设备异常情况的检测方法、检测装置及终端设备 | |
CN110210883A (zh) | 群控账号识别方法、装置、服务器及存储介质 | |
CN114139210B (zh) | 一种基于智慧业务的大数据安全威胁处理方法及系统 | |
CN110225104A (zh) | 数据获取方法、装置及终端设备 | |
CN108833458A (zh) | 一种应用推荐方法、装置、介质及设备 | |
CN108810116A (zh) | 消息处理方法及相关产品 | |
CN107396199A (zh) | 弹幕数据展示方法及装置、计算机可读存储介质 | |
CN106383764A (zh) | 一种数据采集方法和设备 | |
WO2021254101A1 (zh) | 信息推荐方法、装置及电子设备 | |
CN108664628A (zh) | 一种数据的导出方法及设备 | |
CN112949172A (zh) | 一种数据处理方法、装置、机器可读介质及设备 | |
CN110362565A (zh) | 在事件聚类中使用和更新一组节点之间的拓扑关系 | |
CN109522191A (zh) | 一种采集交互行为指令的属性信息的方法及装置 | |
CN108197002A (zh) | 移动设备无埋点数据统计方法、系统、终端及介质 | |
CN110443044A (zh) | 区块链客户端漏洞挖掘方法、装置、设备及存储介质 | |
CN106482742B (zh) | 计步数据的获取方法及装置 | |
CN112016027A (zh) | 监控访问数据运营平台的方法和装置 | |
CN107272989B (zh) | 应用启动方法、装置及终端设备 | |
CN110602215A (zh) | 基于联盟区块链的资源处理方法及联盟区块链系统 | |
CN103326892B (zh) | Web接口的操作方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181123 |