CN113468026A - 基于移动互联网的行为大数据埋点采集方法及系统 - Google Patents

基于移动互联网的行为大数据埋点采集方法及系统 Download PDF

Info

Publication number
CN113468026A
CN113468026A CN202110877995.XA CN202110877995A CN113468026A CN 113468026 A CN113468026 A CN 113468026A CN 202110877995 A CN202110877995 A CN 202110877995A CN 113468026 A CN113468026 A CN 113468026A
Authority
CN
China
Prior art keywords
configuration parameter
embedded point
point
table entry
embedded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202110877995.XA
Other languages
English (en)
Inventor
赵天硕
黄义宝
田巧玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongguan Huixuehuiwan Education Technology Co ltd
Original Assignee
Dongguan Huixuehuiwan Education Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongguan Huixuehuiwan Education Technology Co ltd filed Critical Dongguan Huixuehuiwan Education Technology Co ltd
Priority to CN202110877995.XA priority Critical patent/CN113468026A/zh
Publication of CN113468026A publication Critical patent/CN113468026A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供一种基于移动互联网的行为大数据埋点采集方法及系统,通过获取第一大数据采集埋点实例获取到的第一埋点采集行为数据,其中,并在历史行为大数据采集日志库中获取与第一埋点采集行为数据相关联的第二埋点采集行为数据,然后根据第一埋点配置参数表项和所述第二埋点配置参数表项,对所述第一埋点配置参数表项中的配置参数进行配置优化,得到第一配置参数优化表项,最后,根据第一配置参数优化表项对第一大数据采集埋点实例对应的各个数据埋点进行埋点参数配置,使第一大数据采集埋点实例根据所述第一配置参数优化表项进行后续的行为大数据采集。如此,可以提升基于数据埋点而实现的行为大数据采集的准确性和可靠性。

Description

基于移动互联网的行为大数据埋点采集方法及系统
技术领域
本发明涉及移动互联网及大数据采集技术领域,具体而言,涉及一种基于移动互联网的行为大数据埋点采集方法及系统。
背景技术
随着移动互联网技术的快速发展,人们可通过移动终端随时随地的使用移动互联网服务,例如可以通过智能手机随时浏览网页新闻、进行在线购物、下载网络数据、使用网络云服务等。进一步地,随着5G通信技术等新一代通信技术的普及,网络速度也得到了极大的提升,移动互联网给用户带来的便利性愈发明显的体现了出来。用户在使用移动互联网的相关服务的同时,针对提供服务的各平台商家而言,针对用户流量的分析以改善服务质量以及用户体验是极为重要的研究方向之一。例如,可以针对用户的操作行为进行行为大数据分析,分析用户行为意图进行用户画像,来实现相应的流量变现等应用。
然而,要实现上述的行为大数据分析,需要针对用户行为大数据进行采集。数据埋点是数据采集的一种重要方式,可以用来记录和收集用户的操作行为。例如,当用户的行为达到埋点采集设置的条件的时候,比如进入某个页面、点击某个按钮等,会自动触发记录和存储,使这些数据会被收集并被传输到相应的分析终端(如服务商提供的大数据分析服务器)。又例如,在应用中特定的流程中收集先关的应用信息,用来跟踪应用使用的状况,以用于作为优化产品或后端应用的数据支撑,如,可以包括包括访问数(Visits),访客数(Visitor),停留时长(Time On Site),页面浏览数(Page Views)和跳出率(Bounce Rate)等用户行为的采集。
经发明人研究发现,基于数据埋点的大数据采集方法,可能因为数据埋点的参数配置,如业务信息配置、埋点动作信息配置等与实际的数据采集环境不匹配或者参数配置不正确等因素导致数据漏采集、数据不完整、不准确等问题。
发明内容
基于以上问题,本发明实施例的目的在于提供一种基于移动互联网的行为大数据埋点采集方法,所述方法包括:
获取第一大数据采集埋点实例获取到的第一埋点采集行为数据,其中,所述第一埋点采集行为数据包括所述第一大数据采集埋点实例通过对应的一组数据埋点并根据第一埋点配置参数表项进行行为数据采集所获取到的埋点采集行为数据;
在历史行为大数据采集日志库中获取与所述第一埋点采集行为数据相关联的第二埋点采集行为数据,其中,所述第二埋点采集行为数据包括第二大数据采集埋点实例通过对应的一组数据埋点并根据第二埋点配置参数表项进行行为数据采集所获取到的埋点采集行为数据;
根据所述第一埋点配置参数表项和所述第二埋点配置参数表项,对所述第一埋点配置参数表项中的配置参数进行配置优化,得到第一配置参数优化表项;
根据所述第一配置参数优化表项对所述第一大数据采集埋点实例对应的各个数据埋点进行埋点参数配置,使所述第一大数据采集埋点实例根据所述第一配置参数优化表项进行后续的行为大数据采集。
为实现上述目的,本实施例的一种优选实施方式中,所述根据所述第一埋点配置参数表项和所述第二埋点配置参数表项,对所述第一埋点配置参数表项中的配置参数进行配置优化,得到第一配置参数优化表项,包括:
根据所述第一埋点配置参数表项获取第二埋点配置参数表项,其中,所述第一埋点采集行为数据是所述第一大数据采集埋点实例控制对应的一组数据埋点根据第一埋点业务路径进行行为数据采集获得,所述第一埋点业务路径包括第一埋点序列,所述第一埋点配置参数表项包括所述第一埋点序列中的任意两个业务关联的埋点位置上所述第一大数据采集埋点实例的业务关联配置参数、以及在所述第一埋点序列中的每个埋点位置上所述第一大数据采集埋点实例的独立业务配置参数;
根据所述第二埋点配置参数表项获取第一配置参数优化表项和第二配置参数优化表项,其中,所述第二埋点采集行为数据是所述第二大数据采集埋点实例控制对应的一组数据埋点根据第二埋点业务路径进行行为数据采集获得,所述第二埋点业务路径包括第二埋点序列,所述第二埋点配置参数表项包括所述第一埋点序列中的任意两个业务关联的埋点位置上所述第二大数据采集埋点实例的业务关联配置参数、以及在所述第一埋点序列中的每个埋点位置上所述第二大数据采集埋点实例的独立业务配置参数;
根据所述第一大数据采集埋点实例的业务关联配置参数、第一大数据采集埋点实例的独立业务配置参数、第二大数据采集埋点实例的业务关联配置参数以第二大数据采集埋点实例的独立业务配置参数对所述第一埋点配置参数表项中的配置参数进行配置优化,得到所述第一配置参数优化表项。
为实现上述目的,本实施例的一种优选实施方式中,所述根据所述第一大数据采集埋点实例的业务关联配置参数、第一大数据采集埋点实例的独立业务配置参数、第二大数据采集埋点实例的业务关联配置参数以第二大数据采集埋点实例的独立业务配置参数对所述第一埋点配置参数表项中的配置参数进行配置优化,得到所述第一配置参数优化表项,包括:
根据所述第一埋点配置参数表项和所述第二埋点配置参数表项,确定第一埋点分布拓扑结构;其中,所述第一埋点分布拓扑结构包括所述第一埋点序列、第一埋点连边序列、所述第二埋点序列、第二埋点连边序列以及第三埋点连边序列,所述第一埋点连边序列包括所述第一埋点序列中任意两个业务关联的埋点位置之间的埋点连边,所述第二埋点连边序列包括所述第二埋点序列中任意两个业务关联的埋点位置之间的埋点连边,第三埋点连边序列包括所述第一埋点序列中的埋点位置与所述第二埋点序列中的埋点位置之间的埋点连边;
获取所述第三埋点连边序列中的各埋点连边对应的两个埋点位置之间的业务关联配置参数;
根据所述第三埋点连边序列中的各埋点连边对应的两个埋点位置之间的业务关联配置参数,确定所述第三埋点连边序列中是否包括无关联关系的埋点连边;
当所述第三埋点连边序列中包括无关联关系的埋点连边时,在所述第一埋点分布拓扑结构中移除所述无关联关系的埋点连边,得到第二埋点分布拓扑结构;
根据所述第二埋点分布拓扑结构,分别对所述第一埋点配置参数表项中的第一独立业务配置参数序列以及所述第二埋点配置参数表项中的第二独立业务配置参数序列进行配置优化,得到所述第一配置参数优化表项和所述第二配置参数优化表项;其中,所述第一配置参数优化表项是将所述第一埋点配置参数表项中的所述第一独立业务配置参数序列优化为第三独立业务配置参数序列而获得的埋点配置参数表项,所述第二配置参数优化表项是将所述第二埋点配置参数表项中的所述第二独立业务配置参数序列优化为第四独立业务配置参数序列而获得的埋点配置参数表项。
为实现上述目的,本实施例的一种优选实施方式中,所述根据所述第三埋点连边序列中的各埋点连边对应的两个埋点位置之间的业务关联配置参数,确定所述第三埋点连边序列中是否包括无关联关系的埋点连边,包括:
确定所述第三埋点连边序列中的各埋点连边与所述第一埋点连边序列以及所述第二埋点连边序列中的埋点连边形成的连边网络,得到第一连边网络簇;
针对所述第三埋点连边序列中的各埋点连边,依次遍历各埋点连边,将当前遍历的埋点连边作为当前埋点连边;
在所述第一连边网络簇中确定包括所述当前埋点连边的第二连边网络簇;
根据所述第二连边网络簇中的每个连边网络中的埋点连边对应的业务关联配置参数,确定所述当前埋点连边的采集数据特征偏移;
在所述当前埋点连边的采集数据特征偏移达到预设偏移量时,将所述当前埋点连边确定为无关联关系的埋点连边;
所述根据所述第二连边网络簇中的每个连边网络中的埋点连边对应的业务关联配置参数,确定所述当前埋点连边的采集数据特征偏移,包括:
针对所述第二连边网络簇中的各连边网络,依次遍历各连边网络,将当前遍历的连边网络作为当前连边网络;
将所述当前连边网络中的各埋点连边对应的业务关联配置参数转换成参数配置向量,得到参数配置向量集合,其中,所述参数配置向量表征所述业务关联配置参数中的行为采集空域信息和行为采集时域信息;
根据所述参数配置向量集合,确定所述当前连边网络对应的采集数据特征偏移;
根据所述第二连边网络簇中的每个连边网络对应的采集数据特征偏移,确定所述当前埋点连边的采集数据特征偏移;
所述根据所述参数配置向量集合,确定所述当前连边网络对应的采集数据特征偏移,包括:
将所述参数配置向量集合中的各参数配置向量按照预设向量融合规则依次进行向量融合,得到融合向量集合,其中,所述融合向量集合包括表征目标业务关联配置参数中的行为采集空域信息和行为采集时域信息,所述目标业务关联配置参数为所述当前连边网络中的各埋点连边对应的业务关联配置参数所形成的全局业务关联配置参数;
根据所述融合向量集合,得到所述当前连边网络对应的采集数据特征偏移。
为实现上述目的,本实施例的一种优选实施方式中,所述根据所述第二连边网络簇中的每个连边网络对应的采集数据特征偏移,确定所述当前埋点连边的采集数据特征偏移,包括:
将所述第二连边网络簇中的每个连边网络对应的采集数据特征偏移的特征偏移加权结果确定为所述当前埋点连边的采集数据特征偏移;
所述在所述当前埋点连边的采集数据特征偏移达到预设偏移量时,将所述当前埋点连边确定为无关联关系的埋点连边,包括:
在所述当前埋点连边的采集数据特征偏移达到预设特征偏移阈值时,将所述当前埋点连边确定为无关联关系的埋点连边。
为实现上述目的,本实施例的一种优选实施方式中,所述根据所述第二埋点分布拓扑结构,分别对所述第一埋点配置参数表项中的第一独立业务配置参数序列以及所述第二埋点配置参数表项中的第二独立业务配置参数序列进行配置优化,得到所述第一配置参数优化表项和所述第二配置参数优化表项,包括:
根据第一配置参数优化策略,对所述第一埋点配置参数表项中的第一独立业务配置参数序列以及所述第二埋点配置参数表项中的第二独立业务配置参数序列进行配置优化,得到所述第一配置参数优化表项和所述第二配置参数优化表项,其中,所述第一配置参数优化策略是根据所述第二埋点分布拓扑结构中的埋点连边对应的业务关联配置参数确定得到的配置参数优化策略。
为实现上述目的,本实施例的一种优选实施方式中,所述根据第一配置参数优化策略,对所述第一埋点配置参数表项中的第一独立业务配置参数序列以及所述第二埋点配置参数表项中的第二独立业务配置参数序列进行配置优化,得到所述第一配置参数优化表项和所述第二配置参数优化表项,包括:
对所述第一埋点配置参数表项中的独立业务配置参数以及所述第二埋点配置参数表项中的独立业务配置参数进行配置优化,使得所述第二埋点分布拓扑结构中的各埋点连边已获取的业务关联配置参数与各埋点连边当前获取的业务关联配置参数之间的参数差异收敛,其中,所述各埋点连边当前获取的业务关联配置参数是通过所述各埋点连边对应的埋点位置上的独立业务配置参数计算得到的业务关联配置参数。
为实现上述目的,本实施例的一种优选实施方式中,所述根据所述第二埋点分布拓扑结构,对所述第一埋点配置参数表项中的第一独立业务配置参数序列以及所述第二埋点配置参数表项中的第二独立业务配置参数序列进行配置优化,得到所述第一配置参数优化表项和所述第二配置参数优化表项,包括:
根据第二配置参数优化策略,对所述第一埋点配置参数表项中的第一独立业务配置参数序列以及所述第二埋点配置参数表项中的第二独立业务配置参数序列进行配置优化,得到所述第一配置参数优化表项和所述第二配置参数优化表项,其中,所述第二配置参数优化策略是根据所述第二埋点分布拓扑结构中的埋点连边对应的业务关联配置参数和第一理论配置参数序列确定得到的配置参数优化策略,所述第一理论配置参数序列中的每个理论配置参数为所述第一埋点序列中的一个埋点位置的理论配置参数;
其中,所述根据第二配置参数优化策略,对所述第一埋点配置参数表项中的第一独立业务配置参数序列以及所述第二埋点配置参数表项中的第二独立业务配置参数序列进行配置优化,得到所述第一配置参数优化表项和所述第二配置参数优化表项,包括:
对所述第一埋点配置参数表项中的独立业务配置参数以及所述第二埋点配置参数表项中的独立业务配置参数进行配置优化,使得第一全局参数差异与第二全局参数差异收敛,其中,所述第一全局参数差异是所述第二埋点分布拓扑结构中的各埋点连边已获取的业务关联配置参数与各埋点连边当前获取的业务关联配置参数之间的参数差异的加权之和,所述各埋点连边当前获取的业务关联配置参数是通过所述各埋点连边对应的埋点位置上的独立业务配置参数计算得到的业务关联配置参数,所述第二全局参数差异是所述第一理论配置参数序列中的每个理论配置参数与对应的埋点位置上的独立业务配置参数之间的参数差异。
为实现上述目的,本实施例的一种优选实施方式中,所述根据所述第一埋点配置参数表项和所述第二埋点配置参数表项,对所述第一埋点配置参数表项中的独立业务配置参数以及所述第二埋点配置参数表项中的独立业务配置参数进行配置优化,得到第一配置参数优化表项和第二配置参数优化表项之后,所述方法还包括:
根据所述第一配置参数优化表项中的第三独立业务配置参数序列,对第一埋点采集行为数据集中的第一埋点采集行为数据进行数据校正,其中,所述第一配置参数优化表项是将所述第一埋点配置参数表项中的第一独立业务配置参数序列优化为所述第三独立业务配置参数序列而获得的埋点配置参数表项,所述第一埋点采集行为数据集是所述第一大数据采集埋点实例根据所述第一埋点业务路径进行行为数据采集获取到的行为数据的集合,所述第一独立业务配置参数序列包括所述第一埋点序列中的第三埋点序列上所述第一大数据采集埋点实例的独立业务配置参数,所述第一埋点采集行为数据包括所述第三埋点序列上所述第一大数据采集埋点实例采集的埋点采集行为数据;
根据所述第二配置参数优化表项中的第四独立业务配置参数序列,对第二埋点采集行为数据集中的第二埋点采集行为数据进行数据校正,其中,所述第二配置参数优化表项是将所述第二埋点配置参数表项中的第二独立业务配置参数序列优化为所述第四独立业务配置参数序列而获得的埋点配置参数表项,所述第二埋点采集行为数据集是所述第二大数据采集埋点实例根据所述第二埋点业务路径进行行为数据采集获取到的行为数据的集合,所述第二独立业务配置参数序列包括所述第二埋点序列中的第四埋点序列上所述第二大数据采集埋点实例的独立业务配置参数,所述第二埋点采集行为数据包括所述第四埋点序列上所述第二大数据采集埋点实例采集的埋点采集行为数据。
本发明实施的目的还在于提供一种基于移动互联网的行为大数据埋点采集系统,包括处理器和存储器,所述存储器和所述处理器连接,所述存储器用于存储程序、指令或代码,所述处理器用于执行所述存储器中的程序、指令或代码,以实现上述的方法。
综上所述,本发明实施例提供的基于移动互联网的行为大数据埋点采集方法及系统, 通过获取第一大数据采集埋点实例获取到的第一埋点采集行为数据,其中,所述第一埋点采集行为数据包括所述第一大数据采集埋点实例通过对应的一组数据埋点并根据第一埋点配置参数表项进行行为数据采集所获取到的埋点采集行为数据; 然后,在历史行为大数据采集日志库中获取与所述第一埋点采集行为数据相关联的第二埋点采集行为数据,其中,所述第二埋点采集行为数据包括第二大数据采集埋点实例通过对应的一组数据埋点并根据第二埋点配置参数表项进行行为数据采集所获取到的埋点采集行为数据;其次,根据所述第一埋点配置参数表项和所述第二埋点配置参数表项,对所述第一埋点配置参数表项中的配置参数进行配置优化,得到第一配置参数优化表项;最后,根据所述第一配置参数优化表项对所述第一大数据采集埋点实例对应的各个数据埋点进行埋点参数配置,使所述第一大数据采集埋点实例根据所述第一配置参数优化表项进行后续的行为大数据采集。
如此,在第一大数据采集埋点实例获取到的第一埋点采集行为数据与第二大数据采集埋点实例获取到的第二埋点采集行为数据的基础上,根据根据所述第一埋点配置参数表项和所述第二埋点配置参数表项对对所述第一埋点配置参数表项中的配置参数进行配置优化,例如可以参照第二埋点采集行为数据基于第二埋点配置参数表项中的对应埋点的配置参数对第一埋点配置参数表项中的各配置参数进行配置优化,得到的第一配置参数优化表项用于作为第一大数据采集埋点实例后续进行行为大数据采集的依据,可以提升基于数据埋点而实现的行为大数据采集的准确性和可靠性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍。
图1是本发明实施例提供的用于执行基于移动互联网的行为大数据埋点采集方法的流程示意图。
图2是本发明实施例提供的用户实现上述方法的行为大数据埋点采集系统的系统架构示意图。
图3是图1中步骤30的详细实现过程示意图。
图4是图2中的行为大数据埋点采集系统所包括的功能模块示意图。
具体实施方式
请参阅图1,图1是本发明实施例提供的基于移动互联网的行为大数据埋点采集方法的流程示意图。本实施例中,所述方法可由一种基于移动互联网的行为大数据埋点采集系统执行,下面进行详细介绍。
例如图2所示,是本发明实施例提供的用于执行基于移动互联网的行为大数据埋点采集方法的行为大数据埋点采集系统20的架构示意图。举例来说,所述行为大数据埋点采集系统20可以是,但不限于,具有大数据采集及分析能力的电子设备或计算机设备。例如,所述行为大数据埋点采集系统20可以是独立的服务器或者由至少两个服务器形成的服务器集群或云服务平台。此外,所述行为大数据埋点采集系统20也可以是用于提供移动互联网有关的网络云服务、网络云数据库、网络云计算、网络云存储等服务的云服务器或云服务中心。
优选地,如图2所示,所述行为大数据埋点采集系统20可以包括存储器21、处理器22、以及行为大数据埋点采集单元23。本实施例中,所述存储器21、处理器22彼此之间可以直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件互相之间可以通过一条或多条通信总线实现电性连接。所述存储器21可以是各种可能的存储介质,例如,本实施例优选为一种非易失性的机器可读存储介质。所述存储器21用于存储各种类型的程序、指令或可执行代码,例如所述行为大数据埋点采集单元23所包括的各种软件功能模块对应的软件程序部分。其中,所述行为大数据埋点采集单元23可以包括至少一个以软件形式储存于所述存储器21中的程序功能模块、软件功能模块或逻辑模块,所述处理器22通过运行存储在存储器21内的软件程序以及模块,例如本申请实施例中的行为大数据埋点采集单元23中的软件程序以及模块,从而实现所述行为大数据埋点采集系统20的各种功能应用以及数据处理,例如实现本申请实施例提供的相关方法。
其中,所述存储器21可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。所述处理器22可能是一种具有数据处理能力的芯片,例如可以是,但不限于,通用处理器,包括中央处理器 (Central Processing Unit,CPU)、多核心处理器、网络处理器 (NetworkProcessor,NP)等,用于执行本申请实施例中的方法所包括的步骤、方法及逻辑程序等。
在上述内容的基础上,下面对图1所示的基于移动互联网的行为大数据埋点采集方法进行详细说明。如图1所示,所述方法可以包括下述的步骤10-40的内容。
步骤10,获取第一大数据采集埋点实例获取到的第一埋点采集行为数据。
在本实施的一种可能的实施方案中,其中,所述第一埋点采集行为数据包括所述第一大数据采集埋点实例通过对应的一组数据埋点根据第一埋点配置参数表项进行行为数据采集所获取到的埋点采集行为数据。
步骤20,在历史行为大数据采集日志库中获取与所述第一埋点采集行为数据相关联的第二埋点采集行为数据。
在本实施的一种可能的实施方案中,其中,所述第二埋点采集行为数据包括第二大数据采集埋点实例通过对应的一组数据埋点并根据第二埋点配置参数表项进行行为数据采集所获取到的埋点采集行为数据。
此外,本实施例中, 所述所述第一大数据采集埋点实例对应的一组数据埋点与第二大数据采集埋点实例对应的一组数据埋点可以分别是两组不同的数据埋点,每组数据埋点分别包括多个数据埋点用于对不同的行为数据进行埋点采集。所述第一大数据采集埋点实施和所述第二大数据采集埋点实例分别为不同的数据采集埋点实例,分别用于控制不同组中的数据埋点进行行为数据的采集。
示例性地,在一种可能的实现方式中,本实施例的应用场景可以是在大数据采集埋点实例的应用测试场景或者大数据采集埋点实例的更新场景,用于确定较为匹配实际场景的埋点配置参数。例如,可替代地,所述第一大数据采集埋点实例可以是一个当前需测试的埋点实例,所述第二大数据采集埋点实例可以是位于当前需测试的埋点实例之前已进行过行为数据埋点测试挖掘的其他任意一个或多个数据采集埋点实例。
步骤30,根据所述第一埋点配置参数表项和所述第二埋点配置参数表项,对所述第一埋点配置参数表项中的配置参数进行配置优化,得到第一配置参数优化表项。
例如,在实施例的一种可能的实现方案中,以埋点测试阶段的应用场景为例,可通过预先确定或预先知晓的的一组或多组互联网操作事件对应用的各个操作行为通过自动化操作测试控件进行模拟操作测试,然后通过不同的埋点实例基于不同的埋点参数配置表项进行操作行为的采集。埋点参数配置表项可以包括行为采集过程中所需的各种配置参数。例如,示例性地,可以包括各数据埋点分别对应的时空配置信息,如各个不同的数据采集埋点实例控制下(或对应)的一组埋点分别对应的操作行为采集时间信息,执行逻辑信息,采集位置信息等,还可以包括针对不同的埋点分别配置的业务项目配置信息,埋点间的关键业务配置信息等。最后可以根据不同实例采集的结果分别与预先知晓的数据进行比对分析,看哪些实例在哪些埋点的采集数据更贴近实际以相应的调整当其他对应的实例在不同埋点处的配置参数得到优化配置表项。一些可能的详细实现方式将在后文进行详细描述。
步骤40,根据所述第一配置参数优化表项对所述第一大数据采集埋点实例对应的各个数据埋点进行埋点参数配置,使所述第一大数据采集埋点实例根据所述第一配置参数优化表项进行后续的行为大数据采集。
如此,通过上述方式,在第一大数据采集埋点实例获取到的第一埋点采集行为数据与第二大数据采集埋点实例获取到的第二埋点采集行为数据的基础上,根据根据所述第一埋点配置参数表项和所述第二埋点配置参数表项对对所述第一埋点配置参数表项中的配置参数进行配置优化,例如可以参照第二埋点采集行为数据基于第二埋点配置参数表项中的对应埋点的配置参数对第一埋点配置参数表项中的各配置参数进行配置优化,得到的第一配置参数优化表项用于作为第一大数据采集埋点实例后续进行行为大数据采集的依据,可以提升基于数据埋点而实现的行为大数据采集的准确性和可靠性。
此外,在另一种可能的示例中,当某个大数据埋点采集实例需要进行更新时,也可以适用本实施例的方法将更新后的实例通过上述的方案对更新后的实例对应的埋点配置参数进行校正优化后再使用,以提升基于数据埋点而实现的行为大数据采集的准确性和可靠性。
此外,在上述内容的基础上,本发明实施例中,还可以进一步根据所述第一配置参数优化表项,对所述第一埋点采集行为数据进行数据校正,将矫正后的第一埋点采集行为数据作为所述第一大数据采集埋点实例所采集的最终用户行为大数据,可以用于后续其他的大数据采集埋点实例的配置参数优化更新进行参考和对照,例如可以在下一次进行实例更新时进行更新实例的配置参数的微调校正而使用,具体不进行限定。
在本实施例中,针对上述步骤30,为了实现根据所述第一埋点配置参数表项和所述第二埋点配置参数表项,对所述第一埋点配置参数表项中的配置参数进行配置优化,得到第一配置参数优化表项,如图3所示,可以通过下述的步骤301-步骤303具体实现,下面进行举例说明。
步骤301,根据所述第一埋点配置参数表项获取第二埋点配置参数表项。
本实施例中,在一种可能的实现方案中,所述第一埋点采集行为数据是所述第一大数据采集埋点实例控制对应的一组数据埋点根据第一埋点业务路径进行行为数据采集获得。所述第一埋点业务路径包括第一埋点序列,所述第一埋点配置参数表项包括所述第一埋点序列中的任意两个业务关联的埋点位置上所述第一大数据采集埋点实例的业务关联配置参数、以及在所述第一埋点序列中的每个埋点位置上所述第一大数据采集埋点实例的独立业务配置参数。
步骤302,根据所述第二埋点配置参数表项获取第一配置参数优化表项和第二配置参数优化表项。
优选地,本实施例中,所述第二埋点采集行为数据可以是所述第二大数据采集埋点实例控制对应的一组数据埋点根据第二埋点业务路径进行行为数据采集获得。其中,所述第二埋点业务路径可以包括第二埋点序列,所述第二埋点配置参数表项包括所述第一埋点序列中的任意两个业务关联的埋点位置上所述第二大数据采集埋点实例的业务关联配置参数、以及在所述第一埋点序列中的每个埋点位置上所述第二大数据采集埋点实例的独立业务配置参数。
应当理解,在上述步骤301和302中, 可以理解的是,所述业务关联配置参数可以是具有业务关联的不同数据埋点之间在对具有业务关联关系的行为数据进行采集所需配置的埋点配置参数。所述独立业务配置参数可以是每个不同的数据埋点对独立业务进行行为数据采集所需的埋点配置参数,具体可以视实际应用需求进行配置,本实施例对此不进行限制。
此外,上述的第一埋点业务路径以及第二埋点业务路径分别可以是对应的一组数据埋点按照预先确定的业务行为数据采集规则将各埋点按照预定的业务采集逻辑进行时序上的排列而形成的业务数据采集路径,在其他实施例中,也可以是在空间域上按照埋点序列的顺序进行排列而形成的业务数据采集路径,具体不进行限定。
步骤303,根据所述第一大数据采集埋点实例的业务关联配置参数、第一大数据采集埋点实例的独立业务配置参数、第二大数据采集埋点实例的业务关联配置参数以第二大数据采集埋点实例的独立业务配置参数对所述第一埋点配置参数表项中的配置参数进行配置优化,得到所述第一配置参数优化表项。
本实施中,作为一种示例,步骤303可以通过以下步骤具体实现。
(1),根据所述第一埋点配置参数表项和所述第二埋点配置参数表项,确定第一埋点分布拓扑结构。其中,所述第一埋点分布拓扑结构包括所述第一埋点序列、第一埋点连边序列、所述第二埋点序列、第二埋点连边序列以及第三埋点连边序列。所述第一埋点连边序列包括所述第一埋点序列中任意两个业务关联的埋点位置之间的埋点连边,所述第二埋点连边序列包括所述第二埋点序列中任意两个业务关联的埋点位置之间的埋点连边,第三埋点连边序列包括所述第一埋点序列中的埋点位置与所述第二埋点序列中的埋点位置之间的埋点连边。作为一种示例,所述埋点分布拓扑结构可以是一种关系型数据结构、关系型知识图谱、关系网络等形式,具体不进行限定。
(2)获取所述第三埋点连边序列中的各埋点连边对应的两个埋点位置之间的业务关联配置参数。
(3)根据所述第三埋点连边序列中的各埋点连边对应的两个埋点位置之间的业务关联配置参数,确定所述第三埋点连边序列中是否包括无关联关系的埋点连边。
例如,在本实施例种,基于步骤(3),可以包括以下内容。
首先,确定所述第三埋点连边序列中的各埋点连边与所述第一埋点连边序列以及所述第二埋点连边序列中的埋点连边形成的连边网络,得到第一连边网络簇。
其次,针对所述第三埋点连边序列中的各埋点连边,依次遍历各埋点连边,将当前遍历的埋点连边作为当前埋点连边。
然后,在所述第一连边网络簇中确定包括所述当前埋点连边的第二连边网络簇。
接着,根据所述第二连边网络簇中的每个连边网络中的埋点连边对应的业务关联配置参数,确定所述当前埋点连边的采集数据特征偏移。
示例性地,例如可以针对所述第二连边网络簇中的各连边网络,依次遍历各连边网络,将当前遍历的连边网络作为当前连边网络;然后,将所述当前连边网络中的各埋点连边对应的业务关联配置参数转换成参数配置向量,得到参数配置向量集合,其中,所述参数配置向量表征所述业务关联配置参数中的行为采集空域信息和行为采集时域信息; 其次,根据所述参数配置向量集合,确定所述当前连边网络对应的采集数据特征偏移;最后,根据所述第二连边网络簇中的每个连边网络对应的采集数据特征偏移,确定所述当前埋点连边的采集数据特征偏移;例如,可以将所述第二连边网络簇中的每个连边网络对应的采集数据特征偏移的特征偏移加权结果确定为所述当前埋点连边的采集数据特征偏移。
其中,所述根据所述参数配置向量集合,确定所述当前连边网络对应的采集数据特征偏移,可以包括:将所述参数配置向量集合中的各参数配置向量按照预设向量融合规则依次进行向量融合,得到融合向量集合,其中,所述融合向量集合包括表征目标业务关联配置参数中的行为采集空域信息和行为采集时域信息,所述目标业务关联配置参数为所述当前连边网络中的各埋点连边对应的业务关联配置参数所形成的全局业务关联配置参数;然后,根据所述融合向量集合,得到所述当前连边网络对应的采集数据特征偏移。
例如,所述当前埋点连边的采集数据特征偏移可以是对当前埋点连边对应的两个埋点所采集的行为数据之间的数据特征之间的差异进行的表达,可以通过特征向量距离的方式实现。其中,所述第一连边网络簇和第二连边网络簇可以分别是所述连边网络中的一个聚团或者一个子网络。
最后,在所述当前埋点连边的采集数据特征偏移达到预设偏移量时,将所述当前埋点连边确定为无关联关系的埋点连边。例如,在所述当前埋点连边的采集数据特征偏移达到预设特征偏移阈值时,将所述当前埋点连边确定为无关联关系的埋点连边。
(4)当所述第三埋点连边序列中包括无关联关系的埋点连边时,在所述第一埋点分布拓扑结构中移除所述无关联关系的埋点连边,得到第二埋点分布拓扑结构。
在本实施例中,以埋点连边为单元,先获取该埋点连边所在的所有连边网络,根据所在的连边网络簇中的每个连边网络中的埋点连边对应的业务关联配置参数,确定该埋点连边是否需要被移除。按照上述方式,判断第三埋点连边序列中的每个埋点连边是否需要移除,将无关联关系的埋点连边移除后,得到第二埋点分布拓扑结构。根据第二埋点分布拓扑结构对大数据采集埋点实例的独立业务配置参数进行配置优化。
(5)根据所述第二埋点分布拓扑结构,分别对所述第一埋点配置参数表项中的第一独立业务配置参数序列以及所述第二埋点配置参数表项中的第二独立业务配置参数序列进行配置优化,得到所述第一配置参数优化表项和所述第二配置参数优化表项。其中,所述第一配置参数优化表项是将所述第一埋点配置参数表项中的所述第一独立业务配置参数序列优化为第三独立业务配置参数序列而获得的埋点配置参数表项,所述第二配置参数优化表项是将所述第二埋点配置参数表项中的所述第二独立业务配置参数序列优化为第四独立业务配置参数序列而获得的埋点配置参数表项。
在本实施例中,第二埋点配置参数表项可以包括至少一个,以包括一个第二埋点配置参数表项为例,根据埋点配置参数表项生成的埋点分布拓扑结构中可以包括一个第一埋点配置参数表项和一个第二埋点配置参数表项,共两个埋点配置参数表项,两个埋点配置参数表项可分别对应表项编号Table1、Table2,其中,每个埋点配置参数表项包括一埋点序列中的任意两个业务关联的埋点位置上第一大数据采集埋点实例的业务关联配置参数、以及在一埋点序列中的每个埋点位置上第一大数据采集埋点实例的独立业务配置参数。埋点配置参数表项Table1中包括10个埋点位置,埋点配置参数表项Table2包括十二个埋点位置,其中,第一埋点连边序列包括埋点配置参数表项Table1对应的四个埋点连边。例如Re11、Re12、Re13、Re14等,第二埋点连边序列包括埋点配置参数表项Table2对应的五个埋点连边,例如Re21、Re22、Re23、Re24、Re25等等,第三埋点连边序列包括第一埋点序列中的埋点位置与第二埋点序列中的埋点位置之间埋点连边。
在本实施中,上述根据第一埋点配置参数表项和第二埋点配置参数表项,确定第一埋点分布拓扑结构可以是根据第一埋点配置参数表项和第二埋点配置参数表项进行连边网络模拟,以得到对应的埋点范围对应的埋点分布拓扑结构。
示例性地,在一种可能的实现方式中,针对步骤(5),可以根据第一配置参数优化策略,对所述第一埋点配置参数表项中的第一独立业务配置参数序列以及所述第二埋点配置参数表项中的第二独立业务配置参数序列进行配置优化,得到所述第一配置参数优化表项和所述第二配置参数优化表项。其中,所述第一配置参数优化策略是根据所述第二埋点分布拓扑结构中的埋点连边对应的业务关联配置参数确定得到的配置参数优化策略。例如,可首先对所述第一埋点配置参数表项中的独立业务配置参数以及所述第二埋点配置参数表项中的独立业务配置参数进行配置优化,使得所述第二埋点分布拓扑结构中的各埋点连边已获取的业务关联配置参数与各埋点连边当前获取的业务关联配置参数之间的参数差异收敛。其中,所述各埋点连边当前获取的业务关联配置参数是通过所述各埋点连边对应的埋点位置上的独立业务配置参数计算得到的业务关联配置参数。例如,所述参数差异收敛可以是指对应的参数差异的差异性量化指标(如可以是相似度或者特征距离)低于预设的指标阈值。
进一步地,针对步骤(5),还可以包括以下内容。
根据第二配置参数优化策略,对所述第一埋点配置参数表项中的第一独立业务配置参数序列以及所述第二埋点配置参数表项中的第二独立业务配置参数序列进行配置优化,得到所述第一配置参数优化表项和所述第二配置参数优化表项。其中,所述第二配置参数优化策略可以是根据所述第二埋点分布拓扑结构中的埋点连边对应的业务关联配置参数和第一理论配置参数序列确定得到的配置参数优化策略。所述第三埋点连边序列中除所述无关联关系的埋点连边以外的埋点连边形成第四埋点连边序列,所述第一理论配置参数序列中的每个理论配置参数为所述第一埋点序列中的一个埋点位置的理论配置参数。所述理论配置参数序列,例如可以是,但不限于,对历史埋点采集过程中得到的相关数据进行分析后,根据经验而设定的配置参数序列。
其中,所述根据第二配置参数优化策略,对所述第一埋点配置参数表项中的第一独立业务配置参数序列以及所述第二埋点配置参数表项中的第二独立业务配置参数序列进行配置优化,得到所述第一配置参数优化表项和所述第二配置参数优化表项,可以是:
对所述第一埋点配置参数表项中的独立业务配置参数以及所述第二埋点配置参数表项中的独立业务配置参数进行配置优化,使得第一全局参数差异与第二全局参数差异收敛。
其中,所述第一全局参数差异是所述第二埋点分布拓扑结构中的各埋点连边已获取的业务关联配置参数与各埋点连边当前获取的业务关联配置参数之间的参数差异的加权之和,所述各埋点连边当前获取的业务关联配置参数是通过所述各埋点连边对应的埋点位置上的独立业务配置参数计算得到的业务关联配置参数,所述第二全局参数差异是所述第一理论配置参数序列中的每个理论配置参数与对应的埋点位置上的独立业务配置参数之间的参数差异。示例性地,第一全局参数差异以及第二全局参数差异低于预设的差异量化指标阈值时,则可被认为差异收敛。
如此,通过上述(1)-(5)的步骤,通过引入埋点分布拓扑结构的方式对第一大数据采集埋点实例对应的一组数据埋点以及第二大数据采集埋点实例对应的一组数据埋点通过埋点分布拓扑结构的方式进行表达,通过埋点连边等方式来确定对应埋点之间的关系,一方面可以对第一大数据采集埋点实例对应的第一埋点配置参数表项进行优化得到第一大数据采集埋点实例后续进行行为大数据采集可以使用的第一配置参数优化表项。另一方面,还可以同时对第二大数据采集埋点实例对应的第二埋点配置参数表项进行优化得到第二大数据采集埋点实例后续进行行为大数据采集可以使用的第二配置参数优化表项。如此,后续在进行行为大数据采集时,可以选择性使用第一大数据采集埋点实例或第二大数据采集埋点实例进行行为大数据的采集,可以拓展相关的应用范围和场景。
进一步地,在上述内容的基础上,为了使得第一大数据采集埋点实例和第二大数据采集埋点实例分别得到的埋点采集行为数据可以用于后续的其他实例的参数配置校正或优化,本发明实施例还可以包括以下内容。
首先,根据所述第一配置参数优化表项中的第三独立业务配置参数序列,对第一埋点采集行为数据集中的第一埋点采集行为数据进行数据校正。其中,所述第一配置参数优化表项是将所述第一埋点配置参数表项中的第一独立业务配置参数序列优化为所述第三独立业务配置参数序列而获得的埋点配置参数表项,所述第一埋点采集行为数据集是所述第一大数据采集埋点实例根据所述第一埋点业务路径进行行为数据采集获取到的行为数据的集合,所述第一独立业务配置参数序列包括所述第一埋点序列中的第三埋点序列上所述第一大数据采集埋点实例的独立业务配置参数,所述第一埋点采集行为数据包括所述第三埋点序列上所述第一大数据采集埋点实例采集的埋点采集行为数据。
然后,根据所述第二配置参数优化表项中的第四独立业务配置参数序列,对第二埋点采集行为数据集中的第二埋点采集行为数据进行数据校正。其中,所述第二配置参数优化表项是将所述第二埋点配置参数表项中的第二独立业务配置参数序列优化为所述第四独立业务配置参数序列而获得的埋点配置参数表项,所述第二埋点采集行为数据集是所述第二大数据采集埋点实例根据所述第二埋点业务路径进行行为数据采集获取到的行为数据的集合,所述第二独立业务配置参数序列包括所述第二埋点序列中的第四埋点序列上所述第二大数据采集埋点实例的独立业务配置参数,所述第二埋点采集行为数据包括所述第四埋点序列上所述第二大数据采集埋点实例采集的埋点采集行为数据。
如图4所示,是图2中的行为大数据埋点采集系统20所包括的功能模块示意图。在本实施例中,行为大数据埋点采集系统20可以包括第一获取模块201,第二获取模块202,表项优化模块203以及优化配置模块204。
上述的这些模块可以是集成在所述行为大数据埋点采集单元23中的软件功能模块,也可以是直接存储在存储器21中的软件功能模块,下面对这些模块的功能进行详细介绍。
所述第一获取模块201,用于 获取第一大数据采集埋点实例获取到的第一埋点采集行为数据,其中,所述第一埋点采集行为数据包括所述第一大数据采集埋点实例通过对应的一组数据埋点并根据第一埋点配置参数表项进行行为数据采集所获取到的埋点采集行为数据。
所述第二获取模块202,用于在历史行为大数据采集日志库中获取与所述第一埋点采集行为数据相关联的第二埋点采集行为数据,其中,所述第二埋点采集行为数据包括第二大数据采集埋点实例通过对应的一组数据埋点并根据第二埋点配置参数表项进行行为数据采集所获取到的埋点采集行为数据。
所述表项优化模块203,用于根据所述第一埋点配置参数表项和所述第二埋点配置参数表项,对所述第一埋点配置参数表项中的配置参数进行配置优化,得到第一配置参数优化表项。
所述优化配置模块204,用于根据所述第一配置参数优化表项对所述第一大数据采集埋点实例对应的各个数据埋点进行埋点参数配置,使所述第一大数据采集埋点实例根据所述第一配置参数优化表项进行后续的行为大数据采集。
其中,所述表项优化模块根据所述第一埋点配置参数表项和所述第二埋点配置参数表项,对所述第一埋点配置参数表项中的配置参数进行配置优化,得到第一配置参数优化表项,包括:
根据所述第一埋点配置参数表项获取第二埋点配置参数表项,其中,所述第一埋点采集行为数据是所述第一大数据采集埋点实例控制对应的一组数据埋点根据第一埋点业务路径进行行为数据采集获得,所述第一埋点业务路径包括第一埋点序列,所述第一埋点配置参数表项包括所述第一埋点序列中的任意两个业务关联的埋点位置上所述第一大数据采集埋点实例的业务关联配置参数、以及在所述第一埋点序列中的每个埋点位置上所述第一大数据采集埋点实例的独立业务配置参数;
根据所述第二埋点配置参数表项获取第一配置参数优化表项和第二配置参数优化表项,其中,所述第二埋点采集行为数据是所述第二大数据采集埋点实例控制对应的一组数据埋点根据第二埋点业务路径进行行为数据采集获得,所述第二埋点业务路径包括第二埋点序列,所述第二埋点配置参数表项包括所述第一埋点序列中的任意两个业务关联的埋点位置上所述第二大数据采集埋点实例的业务关联配置参数、以及在所述第一埋点序列中的每个埋点位置上所述第二大数据采集埋点实例的独立业务配置参数;
根据所述第一大数据采集埋点实例的业务关联配置参数、第一大数据采集埋点实例的独立业务配置参数、第二大数据采集埋点实例的业务关联配置参数以第二大数据采集埋点实例的独立业务配置参数对所述第一埋点配置参数表项中的配置参数进行配置优化,得到所述第一配置参数优化表项。
本实施例中,应当理解,上述的各个功能模块, 包括第一获取模块201,第二获取模块202,表项优化模块203以及优化配置模块204可以分别对应实现上述方法实施例中的步骤10-步骤40,关于这些模块的更多的具体内容够可以参照对应的方法步骤,此处不在一一赘述。
综上所述,本发明实施例提供的基于移动互联网的行为大数据埋点采集方法及系统, 通过获取第一大数据采集埋点实例获取到的第一埋点采集行为数据,其中,所述第一埋点采集行为数据包括所述第一大数据采集埋点实例通过对应的一组数据埋点并根据第一埋点配置参数表项进行行为数据采集所获取到的埋点采集行为数据; 然后,在历史行为大数据采集日志库中获取与所述第一埋点采集行为数据相关联的第二埋点采集行为数据,其中,所述第二埋点采集行为数据包括第二大数据采集埋点实例通过对应的一组数据埋点并根据第二埋点配置参数表项进行行为数据采集所获取到的埋点采集行为数据;其次,根据所述第一埋点配置参数表项和所述第二埋点配置参数表项,对所述第一埋点配置参数表项中的配置参数进行配置优化,得到第一配置参数优化表项;最后,根据所述第一配置参数优化表项对所述第一大数据采集埋点实例对应的各个数据埋点进行埋点参数配置,使所述第一大数据采集埋点实例根据所述第一配置参数优化表项进行后续的行为大数据采集。如此,在第一大数据采集埋点实例获取到的第一埋点采集行为数据与第二大数据采集埋点实例获取到的第二埋点采集行为数据的基础上,根据根据所述第一埋点配置参数表项和所述第二埋点配置参数表项对对所述第一埋点配置参数表项中的配置参数进行配置优化,例如可以参照第二埋点采集行为数据基于第二埋点配置参数表项中的对应埋点的配置参数对第一埋点配置参数表项中的各配置参数进行配置优化,得到的第一配置参数优化表项用于作为第一大数据采集埋点实例后续进行行为大数据采集的依据,可以提升基于数据埋点而实现的行为大数据采集的准确性和可靠性。
进一步地,通过引入埋点分布拓扑结构的方式对第一大数据采集埋点实例对应的一组数据埋点以及第二大数据采集埋点实例对应的一组数据埋点通过埋点分布拓扑结构的方式进行表达,通过埋点连边等方式来确定对应埋点之间的关系,一方面可以对第一大数据采集埋点实例对应的第一埋点配置参数表项进行优化得到第一大数据采集埋点实例后续进行行为大数据采集可以使用的第一配置参数优化表项。另一方面,还可以同时对第二大数据采集埋点实例对应的第二埋点配置参数表项进行优化得到第二大数据采集埋点实例后续进行行为大数据采集可以使用的第二配置参数优化表项。如此,后续在进行行为大数据采集时,可以选择性使用第一大数据采集埋点实例或第二大数据采集埋点实例进行行为大数据的采集,可以拓展相关的应用范围和场景。
以上所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。因此,本说明书内容不应理解为对本申请的限制通常在附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。此外,在附图中提供的本发明的实施例的详细描述并非旨在限制本发明的保护范围,而仅仅是表示本发明的选定实施例。因此,本发明的保护范围应以权利要求的保护范围为准。此外,基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下可获得的所有其它实施例,都应属于本发明保护的范围。

Claims (10)

1.一种基于移动互联网的行为大数据埋点采集方法,其特征在于,所述方法包括:
获取第一大数据采集埋点实例获取到的第一埋点采集行为数据,其中,所述第一埋点采集行为数据包括所述第一大数据采集埋点实例通过对应的一组数据埋点并根据第一埋点配置参数表项进行行为数据采集所获取到的埋点采集行为数据;
在历史行为大数据采集日志库中获取与所述第一埋点采集行为数据相关联的第二埋点采集行为数据,其中,所述第二埋点采集行为数据包括第二大数据采集埋点实例通过对应的一组数据埋点并根据第二埋点配置参数表项进行行为数据采集所获取到的埋点采集行为数据;
根据所述第一埋点配置参数表项和所述第二埋点配置参数表项,对所述第一埋点配置参数表项中的配置参数进行配置优化,得到第一配置参数优化表项;
根据所述第一配置参数优化表项对所述第一大数据采集埋点实例对应的各个数据埋点进行埋点参数配置,使所述第一大数据采集埋点实例根据所述第一配置参数优化表项进行后续的行为大数据采集。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一埋点配置参数表项和所述第二埋点配置参数表项,对所述第一埋点配置参数表项中的配置参数进行配置优化,得到第一配置参数优化表项,包括:
根据所述第一埋点配置参数表项获取第二埋点配置参数表项,其中,所述第一埋点采集行为数据是所述第一大数据采集埋点实例控制对应的一组数据埋点根据第一埋点业务路径进行行为数据采集获得,所述第一埋点业务路径包括第一埋点序列,所述第一埋点配置参数表项包括所述第一埋点序列中的任意两个业务关联的埋点位置上所述第一大数据采集埋点实例的业务关联配置参数、以及在所述第一埋点序列中的每个埋点位置上所述第一大数据采集埋点实例的独立业务配置参数;
根据所述第二埋点配置参数表项获取第一配置参数优化表项和第二配置参数优化表项,其中,所述第二埋点采集行为数据是所述第二大数据采集埋点实例控制对应的一组数据埋点根据第二埋点业务路径进行行为数据采集获得,所述第二埋点业务路径包括第二埋点序列,所述第二埋点配置参数表项包括所述第一埋点序列中的任意两个业务关联的埋点位置上所述第二大数据采集埋点实例的业务关联配置参数、以及在所述第一埋点序列中的每个埋点位置上所述第二大数据采集埋点实例的独立业务配置参数;
根据所述第一大数据采集埋点实例的业务关联配置参数、第一大数据采集埋点实例的独立业务配置参数、第二大数据采集埋点实例的业务关联配置参数以第二大数据采集埋点实例的独立业务配置参数对所述第一埋点配置参数表项中的配置参数进行配置优化,得到所述第一配置参数优化表项。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一大数据采集埋点实例的业务关联配置参数、第一大数据采集埋点实例的独立业务配置参数、第二大数据采集埋点实例的业务关联配置参数以第二大数据采集埋点实例的独立业务配置参数对所述第一埋点配置参数表项中的配置参数进行配置优化,得到所述第一配置参数优化表项,包括:
根据所述第一埋点配置参数表项和所述第二埋点配置参数表项,确定第一埋点分布拓扑结构;其中,所述第一埋点分布拓扑结构包括所述第一埋点序列、第一埋点连边序列、所述第二埋点序列、第二埋点连边序列以及第三埋点连边序列,所述第一埋点连边序列包括所述第一埋点序列中任意两个业务关联的埋点位置之间的埋点连边,所述第二埋点连边序列包括所述第二埋点序列中任意两个业务关联的埋点位置之间的埋点连边,第三埋点连边序列包括所述第一埋点序列中的埋点位置与所述第二埋点序列中的埋点位置之间的埋点连边;
获取所述第三埋点连边序列中的各埋点连边对应的两个埋点位置之间的业务关联配置参数;
根据所述第三埋点连边序列中的各埋点连边对应的两个埋点位置之间的业务关联配置参数,确定所述第三埋点连边序列中是否包括无关联关系的埋点连边;
当所述第三埋点连边序列中包括无关联关系的埋点连边时,在所述第一埋点分布拓扑结构中移除所述无关联关系的埋点连边,得到第二埋点分布拓扑结构;
根据所述第二埋点分布拓扑结构,分别对所述第一埋点配置参数表项中的第一独立业务配置参数序列以及所述第二埋点配置参数表项中的第二独立业务配置参数序列进行配置优化,得到所述第一配置参数优化表项和所述第二配置参数优化表项;其中,所述第一配置参数优化表项是将所述第一埋点配置参数表项中的所述第一独立业务配置参数序列优化为第三独立业务配置参数序列而获得的埋点配置参数表项,所述第二配置参数优化表项是将所述第二埋点配置参数表项中的所述第二独立业务配置参数序列优化为第四独立业务配置参数序列而获得的埋点配置参数表项。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第三埋点连边序列中的各埋点连边对应的两个埋点位置之间的业务关联配置参数,确定所述第三埋点连边序列中是否包括无关联关系的埋点连边,包括:
确定所述第三埋点连边序列中的各埋点连边与所述第一埋点连边序列以及所述第二埋点连边序列中的埋点连边形成的连边网络,得到第一连边网络簇;
针对所述第三埋点连边序列中的各埋点连边,依次遍历各埋点连边,将当前遍历的埋点连边作为当前埋点连边;
在所述第一连边网络簇中确定包括所述当前埋点连边的第二连边网络簇;
根据所述第二连边网络簇中的每个连边网络中的埋点连边对应的业务关联配置参数,确定所述当前埋点连边的采集数据特征偏移;
在所述当前埋点连边的采集数据特征偏移达到预设偏移量时,将所述当前埋点连边确定为无关联关系的埋点连边;
所述根据所述第二连边网络簇中的每个连边网络中的埋点连边对应的业务关联配置参数,确定所述当前埋点连边的采集数据特征偏移,包括:
针对所述第二连边网络簇中的各连边网络,依次遍历各连边网络,将当前遍历的连边网络作为当前连边网络;
将所述当前连边网络中的各埋点连边对应的业务关联配置参数转换成参数配置向量,得到参数配置向量集合,其中,所述参数配置向量表征所述业务关联配置参数中的行为采集空域信息和行为采集时域信息;
根据所述参数配置向量集合,确定所述当前连边网络对应的采集数据特征偏移;
根据所述第二连边网络簇中的每个连边网络对应的采集数据特征偏移,确定所述当前埋点连边的采集数据特征偏移;
所述根据所述参数配置向量集合,确定所述当前连边网络对应的采集数据特征偏移,包括:
将所述参数配置向量集合中的各参数配置向量按照预设向量融合规则依次进行向量融合,得到融合向量集合,其中,所述融合向量集合包括表征目标业务关联配置参数中的行为采集空域信息和行为采集时域信息,所述目标业务关联配置参数为所述当前连边网络中的各埋点连边对应的业务关联配置参数所形成的全局业务关联配置参数;
根据所述融合向量集合,得到所述当前连边网络对应的采集数据特征偏移。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第二连边网络簇中的每个连边网络对应的采集数据特征偏移,确定所述当前埋点连边的采集数据特征偏移,包括:
将所述第二连边网络簇中的每个连边网络对应的采集数据特征偏移的特征偏移加权结果确定为所述当前埋点连边的采集数据特征偏移;
所述在所述当前埋点连边的采集数据特征偏移达到预设偏移量时,将所述当前埋点连边确定为无关联关系的埋点连边,包括:
在所述当前埋点连边的采集数据特征偏移达到预设特征偏移阈值时,将所述当前埋点连边确定为无关联关系的埋点连边。
6.根据权利要求3所述的方法,其特征在于,所述根据所述第二埋点分布拓扑结构,分别对所述第一埋点配置参数表项中的第一独立业务配置参数序列以及所述第二埋点配置参数表项中的第二独立业务配置参数序列进行配置优化,得到所述第一配置参数优化表项和所述第二配置参数优化表项,包括:
根据第一配置参数优化策略,对所述第一埋点配置参数表项中的第一独立业务配置参数序列以及所述第二埋点配置参数表项中的第二独立业务配置参数序列进行配置优化,得到所述第一配置参数优化表项和所述第二配置参数优化表项,其中,所述第一配置参数优化策略是根据所述第二埋点分布拓扑结构中的埋点连边对应的业务关联配置参数确定得到的配置参数优化策略。
7.根据权利要求6所述的方法,其特征在于,所述根据第一配置参数优化策略,对所述第一埋点配置参数表项中的第一独立业务配置参数序列以及所述第二埋点配置参数表项中的第二独立业务配置参数序列进行配置优化,得到所述第一配置参数优化表项和所述第二配置参数优化表项,包括:
对所述第一埋点配置参数表项中的独立业务配置参数以及所述第二埋点配置参数表项中的独立业务配置参数进行配置优化,使得所述第二埋点分布拓扑结构中的各埋点连边已获取的业务关联配置参数与各埋点连边当前获取的业务关联配置参数之间的参数差异收敛,其中,所述各埋点连边当前获取的业务关联配置参数是通过所述各埋点连边对应的埋点位置上的独立业务配置参数计算得到的业务关联配置参数。
8.根据权利要求3所述的方法,其特征在于,所述根据所述第二埋点分布拓扑结构,对所述第一埋点配置参数表项中的第一独立业务配置参数序列以及所述第二埋点配置参数表项中的第二独立业务配置参数序列进行配置优化,得到所述第一配置参数优化表项和所述第二配置参数优化表项,包括:
根据第二配置参数优化策略,对所述第一埋点配置参数表项中的第一独立业务配置参数序列以及所述第二埋点配置参数表项中的第二独立业务配置参数序列进行配置优化,得到所述第一配置参数优化表项和所述第二配置参数优化表项,其中,所述第二配置参数优化策略是根据所述第二埋点分布拓扑结构中的埋点连边对应的业务关联配置参数和第一理论配置参数序列确定得到的配置参数优化策略,所述第一理论配置参数序列中的每个理论配置参数为所述第一埋点序列中的一个埋点位置的理论配置参数;
其中,所述根据第二配置参数优化策略,对所述第一埋点配置参数表项中的第一独立业务配置参数序列以及所述第二埋点配置参数表项中的第二独立业务配置参数序列进行配置优化,得到所述第一配置参数优化表项和所述第二配置参数优化表项,包括:
对所述第一埋点配置参数表项中的独立业务配置参数以及所述第二埋点配置参数表项中的独立业务配置参数进行配置优化,使得第一全局参数差异与第二全局参数差异收敛,其中,所述第一全局参数差异是所述第二埋点分布拓扑结构中的各埋点连边已获取的业务关联配置参数与各埋点连边当前获取的业务关联配置参数之间的参数差异的加权之和,所述各埋点连边当前获取的业务关联配置参数是通过所述各埋点连边对应的埋点位置上的独立业务配置参数计算得到的业务关联配置参数,所述第二全局参数差异是所述第一理论配置参数序列中的每个理论配置参数与对应的埋点位置上的独立业务配置参数之间的参数差异。
9.根据权利要求3-8任意一项所述的方法,其特征在于,所述根据所述第一埋点配置参数表项和所述第二埋点配置参数表项,对所述第一埋点配置参数表项中的独立业务配置参数以及所述第二埋点配置参数表项中的独立业务配置参数进行配置优化,得到第一配置参数优化表项和第二配置参数优化表项之后,所述方法还包括:
根据所述第一配置参数优化表项中的第三独立业务配置参数序列,对第一埋点采集行为数据集中的第一埋点采集行为数据进行数据校正,其中,所述第一配置参数优化表项是将所述第一埋点配置参数表项中的第一独立业务配置参数序列优化为所述第三独立业务配置参数序列而获得的埋点配置参数表项,所述第一埋点采集行为数据集是所述第一大数据采集埋点实例根据所述第一埋点业务路径进行行为数据采集获取到的行为数据的集合,所述第一独立业务配置参数序列包括所述第一埋点序列中的第三埋点序列上所述第一大数据采集埋点实例的独立业务配置参数,所述第一埋点采集行为数据包括所述第三埋点序列上所述第一大数据采集埋点实例采集的埋点采集行为数据;
根据所述第二配置参数优化表项中的第四独立业务配置参数序列,对第二埋点采集行为数据集中的第二埋点采集行为数据进行数据校正,其中,所述第二配置参数优化表项是将所述第二埋点配置参数表项中的第二独立业务配置参数序列优化为所述第四独立业务配置参数序列而获得的埋点配置参数表项,所述第二埋点采集行为数据集是所述第二大数据采集埋点实例根据所述第二埋点业务路径进行行为数据采集获取到的行为数据的集合,所述第二独立业务配置参数序列包括所述第二埋点序列中的第四埋点序列上所述第二大数据采集埋点实例的独立业务配置参数,所述第二埋点采集行为数据包括所述第四埋点序列上所述第二大数据采集埋点实例采集的埋点采集行为数据。
10.一种基于移动互联网的行为大数据埋点采集系统,其特征在于,包括处理器和存储器,所述存储器和所述处理器连接,所述存储器用于存储程序、指令或代码,所述处理器用于执行所述存储器中的程序、指令或代码,以实现权利要求1-9任意一项所述的方法。
CN202110877995.XA 2021-08-02 2021-08-02 基于移动互联网的行为大数据埋点采集方法及系统 Withdrawn CN113468026A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110877995.XA CN113468026A (zh) 2021-08-02 2021-08-02 基于移动互联网的行为大数据埋点采集方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110877995.XA CN113468026A (zh) 2021-08-02 2021-08-02 基于移动互联网的行为大数据埋点采集方法及系统

Publications (1)

Publication Number Publication Date
CN113468026A true CN113468026A (zh) 2021-10-01

Family

ID=77883601

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110877995.XA Withdrawn CN113468026A (zh) 2021-08-02 2021-08-02 基于移动互联网的行为大数据埋点采集方法及系统

Country Status (1)

Country Link
CN (1) CN113468026A (zh)

Similar Documents

Publication Publication Date Title
CN114840486B (zh) 用户行为数据采集方法、系统及云平台
CN104598380A (zh) 一种基于控件的自动化测试方法及系统
KR20190022431A (ko) 랜덤 포레스트 모델의 훈련 방법, 전자장치 및 저장매체
CN111382073A (zh) 自动化测试用例确定方法、装置、设备及存储介质
CN112801155B (zh) 基于人工智能的业务大数据分析方法及服务器
CN113918526A (zh) 日志处理方法、装置、计算机设备和存储介质
CN113676563A (zh) 内容分发网络服务的调度方法、装置、设备及存储介质
CN105117340A (zh) 用于iOS浏览器应用质量评估的URL检测方法和装置
CN112511384B (zh) 流量数据处理方法、装置、计算机设备和存储介质
CN112231481A (zh) 网址的分类方法、装置、计算机设备和存储介质
CN111949548B (zh) 一种自动化越权渗透测试方法和存储设备
CN111459577B (zh) 应用安装来源跟踪方法、装置、设备及存储介质
CN113468026A (zh) 基于移动互联网的行为大数据埋点采集方法及系统
CN116302889A (zh) 功能模块的性能测试方法、装置和服务器
CN115292571A (zh) 一种App数据采集方法及系统
CN114911515A (zh) 配置管理方法、装置、设备及介质
CN113254349A (zh) 基于云函数的ab测试处理方法、装置、设备及存储介质
CN113569938A (zh) 基于时空域特征的业务大数据采集方法及服务器
CN110516143B (zh) 一种基于浏览器的业务数据提取方法及装置
CN113642885B (zh) 基于人工智能的业务环境指标信息处理方法及系统
CN116561735B (zh) 一种基于多认证源的互信认证方法、系统及电子设备
CN111143644A (zh) 物联网设备的识别方法及装置
CN113420220B (zh) 一种服务推荐方法、装置、服务器及终端
CN117421729B (zh) 一种自动化程序攻击检测方法、装置、系统及介质
CN114826879B (zh) 日志传输方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20211001

WW01 Invention patent application withdrawn after publication