CN110677310B - 流量归因方法、装置以及终端 - Google Patents

流量归因方法、装置以及终端 Download PDF

Info

Publication number
CN110677310B
CN110677310B CN201810720283.5A CN201810720283A CN110677310B CN 110677310 B CN110677310 B CN 110677310B CN 201810720283 A CN201810720283 A CN 201810720283A CN 110677310 B CN110677310 B CN 110677310B
Authority
CN
China
Prior art keywords
dimension
attribution
traffic
candidate
change
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810720283.5A
Other languages
English (en)
Other versions
CN110677310A (zh
Inventor
王晓元
叶峻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201810720283.5A priority Critical patent/CN110677310B/zh
Publication of CN110677310A publication Critical patent/CN110677310A/zh
Application granted granted Critical
Publication of CN110677310B publication Critical patent/CN110677310B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提出一种流量归因方法、装置和终端,所述方法包括:监控目标维度的流量变化;当流量变化异常时,将目标维度的流量在候选归因维度上进行分解,得到候选归因维度的归因维度值的交叉流量,每个候选归因维度具有一个或多个归因维度值;计算候选归因维度的各归因维度值的交叉流量的变化分布;根据变化分布,确定候选归因维度是否为引起流量变化异常的归因维度。对流量变化进行了准确的归因分析,进而对流量变化异常做进一步解释和指导,给用户运营提供指导与方向。

Description

流量归因方法、装置以及终端
技术领域
本发明涉及计算机技术领域,具体涉及一种流量归因方法、装置以及终端。
背景技术
无论是PC互联网时代、移动互联网时代,还是AI时代,流量始终是网站和APP的生存之本,对流量的监控和分析是互联网企业的核心业务,也是传统企业往互联网转型迈出的第一步。目前对流量的分析主要侧重于对流量维度及指标的监控分析上,比如流量的来源渠道分析,流量的转化率等指标,而对于流量变化背后的原因,缺乏系统性的分析技术。然而,流量的归因是很多企业客户的核心诉求,不仅要知道流量怎样变化,更想知道流量为什么发生变化。典型的客户反馈如:“流量发生异常不知道原因在哪,没有头绪,日常只能靠运营手工排查,非常低效”。
目前,监控网站或APP流量是否变化异常的检测方式有两种:第一,根据历史流量,系统通过趋势分析、异常检测算法自动检测出来。第二,允许用户进行自定义设置,系统根据设置条件判断是否触发流量异常。此外,其他“归因”相关概念较多应用在电商场景的多渠道归因中,比如,把转化因子分摊到转化路径的多个渠道上。
发明内容
本发明实施例提供一种流量归因方法、装置和终端,以至少解决现有技术中的以上技术问题。
第一方面,本发明实施例提供了一种流量归因方法,包括:
监控目标维度的流量变化;
当所述流量变化异常时,将所述目标维度的流量在候选归因维度上进行分解,得到所述候选归因维度的归因维度值的交叉流量;其中,每个所述候选归因维度具有一个或多个所述归因维度值;
计算所述候选归因维度的各归因维度值的交叉流量的变化分布;
根据所述变化分布,确定所述候选归因维度是否为引起所述流量变化异常的归因维度。
结合第一方面,本发明在第一方面的第一种实施方式中,计算所述候选归因维度的各归因维度值的交叉流量的变化分布,包括:
计算所述候选归因维度的各归因维度值的交叉流量的同比变化分布,以及所述候选归因维度的各归因维度值的交叉流量与所述候选归因维度的总体流量之比的占比变化分布。
结合第一方面的第一种实施方式,在第二种实施方式中,根据所述变化分布,确定所述候选归因维度是否是引起所述流量变化异常的归因维度,包括:
当所述同比变化大于第一阈值,且所述占比变化大于第二阈值时,则确认所述候选归因维度为引起所述流量变化异常的归因维度。
结合第一方面的第一种实施方式,在第三种实施方式中,所述归因维度值包括枚举型维度值和穷举型维度值,计算所述候选归因维度的各归因维度值的交叉流量的同比变化分布,包括:
当所述归因维度值为枚举型维度值时,获取所述候选归因维度中所有所述枚举型维度值的交叉流量,根据所述枚举型维度值的交叉流量得到所述同比变化分布;
当所述归因维度值为穷举型维度值时,选取交叉流量大于第三阈值的穷举型维度值,根据已选取的所述穷举型维度值的交叉流量得到所述同比变化分布。
结合第一方面的第一种实施方式,在第四种实施方式中,所述归因维度值包括枚举型维度值和穷举型维度值,计算所述候选归因维度的各归因维度值的交叉流量与所述候选归因维度的总体流量之比的占比变化分布,包括:
当所述归因维度值为枚举型维度值时,计算所述候选归因维度中所有的所述枚举型维度值的交叉流量与所述候选归因维度总体流量之比,得到所述占比变化分布;
当所述归因维度值为穷举型维度值时,选取交叉流量大于第四阈值的穷举型维度值,计算已选取的所述穷举型维度值的交叉流量与已选取的所述候选归因维度的总体流量之比,得到所述占比变化分布。
结合第一方面的第一种实施方式,在第五种实施方式中,确定所述候选归因维度是否为引起所述流量变化异常的归因维度之后,还包括:
根据所述同比变化分布及所述占比变化分布对引起所述流量变化异常的归因维度进行排序。
结合第一方面的第二种实施方式,在第六种实施方式中,确定所述候选归因维度是否为引起所述流量变化异常的归因维度之后,还包括:
根据预定义的归因维度关联关系,获取与引起所述流量变化异常的归因维度相关联的关联归因维度;
计算所述关联归因维度的交叉流量的同比变化分布;
当所述关联归因维度的交叉流量的同比变化大于所述第一阈值时,确认所述关联归因维度为引起所述流量变化异常的归因维度。
结合第一方面,本发明在第一方面的第七种实施方式中,当所述流量变化异常时,将所述目标维度的流量在候选归因维度上进行分解之前,还包括:
根据流量归因特征为所有的所述候选归因维度进行分类,得到各所述候选归因维度类型,并为各所述候选归因维度类型分别设置对应的权重,其中,所述流量归因特征包括节假日、渠道来源、访问内容以及运行环境。
第二方面,本发明实施例提供了一种流量归因装置,包括:
目标维度流量监控模块,用于监控目标维度的流量变化;
交叉流量获取模块,用于当所述流量变化异常时,将所述目标维度的流量在候选归因维度上进行分解,得到所述候选归因维度的归因维度值的交叉流量;其中,每个所述候选归因维度具有一个或多个所述归因维度值;
交叉流量变化分布计算模块,用于计算所述候选归因维度的各归因维度值的交叉流量的变化分布;
流量异常归因模块,用于根据所述变化分布,确定所述候选归因维度是否为引起所述流量变化异常的归因维度。
在一个可能的设计中,所述交叉流量变化分布计算模块包括:
同比变化计算单元,用于计算所述候选归因维度的各归因维度值的交叉流量的同比变化分布;
占比变化计算单元,用于计算所述候选归因维度的各归因维度值的交叉流量与所述候选归因维度的总体流量之比的占比变化分布。
在一个可能的设计中,所述装置还包括:
归因维度排序模块,用于根据所述同比变化分布及所述占比变化分布对引起所述流量变化异常的归因维度进行排序。
在一个可能的设计中,所述装置还包括:
归因维度关联模块,用于根据预定义的归因维度关联关系,获取与引起所述流量变化异常的归因维度相关联的关联归因维度;
关联归因维度流量同比计算模块,用于计算所述关联归因维度的交叉流量的同比变化分布;
关联归因维度模块,用于当所述关联归因维度的交叉流量的同比变化大于所述第一阈值时,确认所述关联归因维度为引起所述流量变化异常的归因维度。
在一个可能的设计中,所述装置还包括:
候选归因维度分类模块,用于根据流量归因特征为所有的所述候选归因维度进行分类,得到各所述候选归因维度类型,并为各所述候选归因维度类型分别设置对应的权重,其中,所述流量归因特征包括节假日、渠道来源、访问内容以及运行环境。
所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
第三方面,本发明提供了一种流量异常归因的终端的结构中包括处理器和存储器,所述存储器用于存储支持流量异常归因的装置执行上述第一方面中流量异常归因方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述流量异常归因的装置还可以包括通信接口,用于流量异常归因的装置与其他设备或通信网络通信。
第四方面,本发明实施例提供了一种计算机可读存储介质,用于存储流量异常归因的装置所用的计算机软件指令,其包括用于执行上述第一方面中流量异常归因的方法为流量异常归因的装置所涉及的程序。
上述技术方案中的一个技术方案具有如下优点或有益效果:本发明提供了一种流量归因方法,通过对目标维度的流量变化进行监控,并将流量变化分解于候选归因维度上进行分析,根据各个候选归因维度上的交叉流量变化分布来确定候选归因维度是否为引起所述流量变化异常的归因维度。对流量变化进行了准确的归因分析,进而对流量变化异常做进一步解释和指导,给用户运营提供指导与方向性。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。
图1为本发明实施例提供的流量归因方法流程图;
图2为本发明实施例提供的流量归因方法示意图;
图3为本发明实施例提供的一种候选归因维度的各归因维度值的交叉流量的同比变化分布图;
图4为本发明实施例提供的一种候选归因维度的各归因维度值的交叉流量与候选归因维度的总体流量之比的占比变化分布图;
图5为本发明实施例提供的另一种候选归因维度的各归因维度值的交叉流量的同比变化分布图;
图6为本发明实施例提供的另一种候选归因维度的各归因维度值的交叉流量与候选归因维度的总体流量之比的占比变化分布图;
图7为本发明实施例提供的一种利用流量归因方法进行归因分析的示例图;
图8为本发明实施例提供的另一种利用流量归因方法进行归因分析的示例图;
图9为本发明实施例提供的引起流量变化异常的归因维度相关联的关联归因维度示意图;
图10为本发明实施例提供的候选归因维度分类示例图;
图11为本发明实施例提供的一种流量归因装置结构框图;
图12为本发明实施例提供的另一种流量归因装置结构框图;
图13为本发明实施例提供的计算机可读存储介质结构示意图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
实施例一
在一种具体的实施方式中,提供了一种流量归因方法,通常应用在流量监控分析场景下,但不局限于流量监控及分析,如图1所示,流量归因方法包括:
步骤S100:监控目标维度的流量变化。
本实施例中,大幅变化或者小幅波动均是流量变化的表现,对流量变化的方式不做约束。目标维度通常是根据业务需要用户自定义的维度,例如,入口页面、搜索引擎等。监控目标维度的整体流量或用户设置的流量。例如,监控搜索引擎渠道过来的流量,或者某个地区或某种设备过来的流量。
步骤S200:当流量变化异常时,将目标维度的流量在候选归因维度上进行分解,得到候选归因维度的归因维度值的交叉流量,其中,每个候选归因维度具有一个或多个归因维度值。
本实施例中,候选归因维度包括但不局限于节假日、搜索引擎、搜索词、新老访客、省份、城市、国家、运营商、访问设备、浏览器类型、操作系统、屏幕尺寸等的一项或多项。归因维度值是候选归因维度下的具体维度值。例如,候选归因维度是省份时,归因维度值包括江苏、山西以及山东等。分解的过程的具体示例如下:
例如,目标维度为入口页面的流量变化异常。将候选归因维度为地域,且归因维度值为上海的流量分解出来,得到的交叉流量就是入口页面流量中地域是上海的流量。监测目标维度是百度渠道导流的流量,候选归因维度是入口页面。分析流量百度渠道导流的流量的每一个访次。一旦访问了入口页面上任意一个维度值(具体的某个入口页面),那么<该访次,该入口页面>会单独剥离出来,成为交叉流量。
本实施例中,将目标维度的流量在所有的候选归因维度上进行分解,得到在各个候选归因维度下能够列举出来的所有或部分归因维度值的交叉流量,便于后续计算交叉流量分布做准备。
步骤S300:计算候选归因维度的各归因维度值的交叉流量的变化分布。
将步骤S200中在候选归因维度上分解出来的各个归因维度值对应的交叉流量记录下来,交叉流量作为纵坐标,各个归因维度值作为横坐标,绘出交叉流量分布图。为了更加直观清楚的观察交叉流量的变化,选择可以是一周、一月或者一季度的预设周期,绘出同比变化图。当然,交叉流量的变化分布包括但不限于上述方法的绘制方法,还可以是其它能够体现变化的分布图,均在本实施例的保护范围内。
步骤S400:根据变化分布,确定候选归因维度是否为引起流量变化异常的归因维度。
可根据实际情况设置流量变化异常的条件,若变化分布满足条件则确定候选归因维度是否为引起流量变化异常的归因维度。
结合图2所示,在一种实施方式中,计算候选归因维度的各归因维度值的交叉流量的分布,包括:
计算候选归因维度的各归因维度值的交叉流量的同比变化分布,以及候选归因维度的各归因维度值的交叉流量与候选归因维度的总体流量之比的占比变化分布。
本实施例中,用周期T是一周进行举例说明,假设上周一的目标维度的流量在候选归因维度上分解得到的每个归因维度值的交叉流量为L1,本周一的目标维度的流量在候选归因维度上分解得到的对应归因维度值的交叉流量为L2,同比可以是L1与L2的比值。占比分布是指同一归因维度下所有归因维度值的占比分布。每个归因维度值对应一个候选归因维度的占比,此占比可以是归因维度值的交叉流量与候选归因维度的总体流量的比值。占比变化就是上周一的候选归因维度的占比和本周一的候选归因维度的占比。
在一种实施方式中,确定候选归因维度是否是引起流量变化异常的归因维度,包括:当同比变化大于第一阈值,且占比变化大于第二阈值时,则确认候选归因维度为引起流量变化异常的归因维度。
筛选出同比变化大于第一阈值,且占比变化大于第二阈值的候选归因维度,对在此范围内的进行排序,优先考虑在候选归因维度上的占比变化较大且单个归因维度值上的同比变化较大确认为引起流量变化异常的归因维度。
需要指出的是,第一阈值和第二阈值根据业务的需要或者客户需求等其它类型的实际情况进行设置,均在本实施例的保护范围内。
在一种实施方式中,归因维度值包括枚举型维度值和穷举型维度值,计算候选归因维度的各归因维度值的交叉流量的同比变化分布,包括:
当归因维度值为枚举型维度值时,获取候选归因维度中所有枚举型维度值的交叉流量,根据枚举型维度值的交叉流量得到所述同比变化分布;
当归因维度值为穷举型维度值时,选取交叉流量大于第三阈值的穷举型维度值,根据已选取的穷举型维度值的交叉流量得到同比变化分布。
在一种实施方式中,归因维度值包括枚举型维度值和穷举型维度值,计算候选归因维度的各归因维度值的交叉流量与候选归因维度的总体流量之比的占比变化分布,包括:
当归因维度值为枚举型维度值时,计算候选归因维度中所有的枚举型维度值的交叉流量与候选归因维度总体流量之比,得到占比变化分布;
当归因维度值为穷举型维度值时,选取交叉流量大于第四阈值的穷举型维度值,计算已选取的穷举型维度值的交叉流量与已选取的候选归因维度的总体流量之比,得到占比变化分布。
本实施例中,以候选归因维度为地域,归因维度值为辽宁、湖南、安徽、山东等为例的枚举型维度值,预设周期是一周的同比变化分布进行说明。如图3所示,上周一江苏这一归因维度值的交叉流量大约是35000pv,本周一江苏这一归因维度值的交叉流量大约是20000pv,同比变化约为1.75。如图4所示,上周一江苏这一归因维度值的占比是0.2,本周一江苏这一归因维度值的交叉流量大约是0.18,占比变化约为0.11。从图3和图4可以看出,虽然同比变化1.75大于如1.5的第一阈值,但是占比变化0.11远小于如1.2的第二阈值,因此,上述这种情况下,流量变化异常的原因并不是江苏这个归因维度值,可能是整体环境的变化导致了流量发生变化。
如图5所示,上周一广东这一归因维度值的交叉流量大约是55000pv,本周一广东这一归因维度值的交叉流量大约是25000pv,同比变化约为2.2。如图6所示,上周一广东这一归因维度值的占比大约是0.28,本周一广东这一归因维度值的占比大约是0.15,占比变化约为1.86。从图5和图6可以看出,同比变化2.2大于第一阈值1.5,占比变化1.86大于第二阈值1.2,因此,上述这种情况下,流量变化异常的原因就是广东这个归因维度值。
同理,穷举型维度值如搜索词,搜索词的数量太多,以至于无法全部列出,因此,只对预设周期内只取交叉流量度值大于第三阈值的穷举型维度值进行列举即可。例如,在某一搜索引擎中输入任一搜索词,只要通过这个搜索词跳转到目标站点上均可。需要指出的是,第一阈值、第二阈值、第三阈值以及第四阈值均根据实际情况进行调整,均在本实施例的保护范围内。
如图7和图8所示,本实施例提供的流量归因方法进行归因分析的具体应用包括:对目标维度是网站的流量变化进行监控。发送站点异常通知给用户,并说明具体流量异常变化分布情况。对流量进行归因分析,得出引起流量变化异常的归因维度,例如地域、来源页面、入口页面等。用户根据分析出来的所有的引起流量异常变化的归因维度分别进行运营验证,得出引起流量变化异常的最终原因。
通过对目标维度的流量变化进行监控,并将流量变化分解于候选归因维度上进行分析,计算预设周期的各个候选归因维度上的交叉流量变化分布,确定候选归因维度是否为引起流量变化异常的归因维度。对流量变化进行了准确的归因分析,进而对流量变化异常做进一步解释和指导,给用户运营提供指导与方向性。
在一种实施方式中,确定候选归因维度是否为引起流量变化异常的归因维度之后,还包括:
根据同比变化分布及占比变化分布对引起流量变化异常的归因维度进行排序。目的是筛选出更为准确的引起流量变化异常的归因维度。
在一种实施方式中,确定候选归因维度是否为引起流量变化异常的归因维度之后,还包括:
根据预定义的归因维度关联关系,获取与引起流量变化异常的归因维度相关联的关联归因维度;
计算关联归因维度的交叉流量的同比变化分布;
当关联归因维度的交叉流量的同比变化大于第一阈值时,确认关联归因维度为引起流量变化异常的归因维度。
预定义的归因维度关联关系如图9所示。在上述的实施方式中筛选出至少一个引起流量变化异常的归因维度,根据与此归因维度相关联的归因维度继续进行筛选,提高流量异常归因的准确率。例如,某个搜索引擎排在归因结果的前几位中,用户可能追溯的一个问题是,在这个搜索引擎的流量变化下,是否由主要搜索词的变化引起的,进而是否是由某个入口页面的变化引起的。
在一种实施方式中,当流量变化异常时,将目标维度的流量在候选归因维度上进行分解之前,还包括:
根据流量归因特征为所有的候选归因维度进行分类,得到各候选归因维度类型,并根据所述候选归因维度类型给所述候选归因维度分别设置对应的权重,其中,流量归因特征包括节假日、渠道来源、访问内容以及运行环境。
如图10所示,用于候选归因维度的类型可分为以下四大类:(1)节假日:用于反映节假日因素所引起的流量变化。(2)渠道来源:跟该流量来源相关因素,包括来源类型、来源页面、来源域名、搜索引擎、搜索词、新老访客。(3)访问内容:主要包括入口页面,这在访问顺序上具有最重要地位。(4)运行环境:跟该流量相关的时间、地点、客户端环境等相关因素,包括省份、城市、国家、运营商、访问设备、浏览器类型、操作系统、屏幕尺寸、分时时段等。其中,Y代表是枚举型,N代表是穷举型。
上述列举出来的每一类候选归因维度在网站或APP运营中都具有实际意义:第一,若某个节假日因素导致流量上升,则提示运营人员可以充分利用这个时间段加大流量转化效率,如果导致流量下降,也属于正常调整范围。第二,如果某个来源渠道因素如果导致流量上升,则提示可以更加重视并加大该渠道的运营,如果导致下降,则在排除渠道自身临时问题的情况下,可以降低该渠道权重。第三,若发现入口页面对流量变化产品产生影响,需要运营立即对入口页面进行优化及调整。第四,运行环境涉及因素较多,某个归因维度值的影响跟设备环境问题或运营活动都可能有关系。
此外,在运营业务上的价值不同,为了以体现在各个业务上的侧重比,对不同的归因维度值赋予不同的权重,并在最后从候选归因维度中提取出引起流量异常变化的归因维度时加上权重,提高归因准确率。
实施例二
在另一种具体实施方式中,提供了一种流量归因装置,如图11所示包括:
目标维度流量监控模块10,用于监控目标维度的流量变化;
交叉流量获取模块20,用于当流量变化异常时,将目标维度的流量在候选归因维度上进行分解,得到候选归因维度的归因维度值的交叉流量;其中,每个所述候选归因维度具有一个或多个所述归因维度值;
交叉流量变化分布计算模块30,用于计算候选归因维度的各归因维度值的交叉流量的变化分布;
流量异常归因模块40,用于根据变化分布,确定候选归因维度是否为引起所述流量变化异常的归因维度。
在一种实施方式中,交叉流量变化分布计算模块30包括:
同比变化计算单元,用于计算候选归因维度的各归因维度值的交叉流量的同比变化分布;
占比变化计算单元,用于计算候选归因维度的各归因维度值的交叉流量与所述候选归因维度的总体流量之比的占比变化分布。
如图12所示,在一种实施方式中,流量归因装置还包括:
归因维度排序模块50,用于根据同比变化分布及占比变化分布对引起流量变化异常的归因维度进行排序。
在一种实施方式中,流量归因装置还包括:
归因维度关联模块60,用于根据预定义的归因维度关联关系,获取与引起流量变化异常的归因维度相关联的关联归因维度;
关联归因维度流量同比计算模块70,用于计算关联归因维度的交叉流量的同比变化分布;
关联归因维度模块80,用于当关联归因维度的交叉流量的同比变化大于第一阈值时,确认关联归因维度为引起流量变化异常的归因维度。
在一种实施方式中,装置还包括:
候选归因维度分类模块,用于根据流量归因特征为所有的候选归因维度进行分类,得到各候选归因维度类型,并为各候选归因维度类型分别设置对应的权重,其中,流量归因特征包括节假日、渠道来源、访问内容以及运行环境。
实施例三
本发明实施例提供了一种流量归因的终端,如图13所示,包括:
存储器400和处理器500,存储器400内存储有可在处理器500上运行的计算机程序。处理器500执行所述计算机程序时实现上述实施例中的流量归因的方法。存储器400和处理器500的数量可以为一个或多个。
通信接口600,用于存储器400和处理器500与外部进行通信。
存储器400可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器400、处理器500以及通信接口600独立实现,则存储器400、处理器500以及通信接口600可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,PeripheralComponent)总线或扩展工业标准体系结构(EISA,Extended Industry StandardComponent)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图13中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器400、处理器500以及通信接口600集成在一块芯片上,则存储器400、处理器500及通信接口600可以通过内部接口完成相互间的通信。
实施例四
一种计算机可读存储介质,其存储有计算机程序,所述程序被处理器执行时实现如实施例一包括的任一所述的流量归因的方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (8)

1.一种流量归因方法,其特征在于,包括:
监控目标维度的流量变化;
当所述流量变化异常时,将所述目标维度的流量在候选归因维度上进行分解,得到所述候选归因维度的归因维度值的交叉流量,其中,每个所述候选归因维度具有多个所述归因维度值;
计算所述候选归因维度的各归因维度值的交叉流量的同比变化分布,以及所述候选归因维度的各归因维度值的交叉流量与所述候选归因维度的总体流量之比的占比变化分布;其中,同比为在相邻周期的同一时间,所述目标维度的流量在所述候选归因维度的各归因维度值的交叉流量的比值;
根据所述同比变化分布和所述占比变化分布,确定所述候选归因维度是否为引起所述流量变化异常的归因维度;
所述根据所述同比变化分布和所述占比变化分布,确定所述候选归因维度是否是引起所述流量变化异常的归因维度,包括:
当同比变化大于第一阈值,且占比变化大于第二阈值时,则确认所述候选归因维度为引起所述流量变化异常的归因维度;
所述方法还包括:
根据所述同比变化分布及所述占比变化分布对引起所述流量变化异常的归因维度进行排序,并对排序后的归因维度赋予对应的权重,其中,优先考虑所述占比变化,再考虑所述同比变化;
在得到至少一个引起所述流量变化异常的归因维度的情况下,根据预定义的归因维度关联关系,获取与引起所述流量变化异常的归因维度相关联的关联归因维度;其中,所述候选归因维度的维度可选范围与所述关联归因维度的维度可选范围相同;
计算所述关联归因维度的交叉流量的同比变化分布;
当所述关联归因维度的交叉流量的同比变化大于所述第一阈值时,确认所述关联归因维度为引起所述流量变化异常的归因维度。
2.根据权利要求1所述的方法,其特征在于,所述归因维度值包括枚举型维度值和穷举型维度值,计算所述候选归因维度的各归因维度值的交叉流量的同比变化分布,包括:
当所述归因维度值为枚举型维度值时,获取所述候选归因维度中所有所述枚举型维度值的交叉流量,根据所述枚举型维度值的交叉流量得到所述同比变化分布;
当所述归因维度值为穷举型维度值时,选取交叉流量大于第三阈值的穷举型维度值,根据已选取的所述穷举型维度值的交叉流量得到所述同比变化分布。
3.根据权利要求1所述的方法,其特征在于,所述归因维度值包括枚举型维度值和穷举型维度值,计算所述候选归因维度的各归因维度值的交叉流量与所述候选归因维度的总体流量之比的占比变化分布,包括:
当所述归因维度值为枚举型维度值时,计算所述候选归因维度中所有的所述枚举型维度值的交叉流量与所述候选归因维度总体流量之比,得到所述占比变化分布;
当所述归因维度值为穷举型维度值时,选取交叉流量大于第四阈值的穷举型维度值,计算已选取的所述穷举型维度值的交叉流量与已选取的所述候选归因维度的总体流量之比,得到所述占比变化分布。
4.根据权利要求1所述的方法,其特征在于,当所述流量变化异常时,将所述目标维度的流量在候选归因维度上进行分解之前,还包括:
根据流量归因特征为所有的所述候选归因维度进行分类,得到各所述候选归因维度类型,并根据所述候选归因维度类型给所述候选归因维度分别设置对应的权重,其中,所述流量归因特征包括节假日、渠道来源、访问内容以及运行环境。
5.一种流量归因装置,其特征在于,包括:
目标维度流量监控模块,用于监控目标维度的流量变化;
交叉流量获取模块,用于当所述流量变化异常时,将所述目标维度的流量在候选归因维度上进行分解,得到所述候选归因维度的归因维度值的交叉流量;其中,每个所述候选归因维度具有多个所述归因维度值;
交叉流量变化分布计算模块,用于计算所述候选归因维度的各归因维度值的交叉流量的变化分布;
流量异常归因模块,用于根据所述变化分布,确定所述候选归因维度是否为引起所述流量变化异常的归因维度;
归因维度关联模块,用于在得到至少一个引起所述流量变化异常的归因维度的情况下,根据预定义的归因维度关联关系,获取与引起所述流量变化异常的归因维度相关联的关联归因维度;其中,所述候选归因维度的维度可选范围与所述关联归因维度的维度可选范围相同;
关联归因维度流量同比计算模块,用于计算所述关联归因维度的交叉流量的同比变化分布;
关联归因维度模块,用于当所述关联归因维度的交叉流量的同比变化大于第一阈值时,确认所述关联归因维度为引起所述流量变化异常的归因维度;
其中,所述交叉流量变化分布计算模块包括:
同比变化计算单元,用于计算所述候选归因维度的各归因维度值的交叉流量的同比变化分布;其中,同比为在相邻周期的同一时间,所述目标维度的流量在所述候选归因维度的各归因维度值的交叉流量的比值;
占比变化计算单元,用于计算所述候选归因维度的各归因维度值的交叉流量与所述候选归因维度的总体流量之比的占比变化分布;
所述流量异常归因模块,用于当同比变化分布大于第一阈值,且占比变化分布大于第二阈值时,则确认所述候选归因维度为引起所述流量变化异常的归因维度;
所述装置还包括:
归因维度排序模块,用于根据所述同比变化分布及所述占比变化分布对引起所述流量变化异常的归因维度进行排序,并对排序后的归因维度赋予对应的权重,其中,优先考虑所述占比变化,再考虑所述同比变化。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
候选归因维度分类模块,用于根据流量归因特征为所有的所述候选归因维度进行分类,得到各所述候选归因维度类型,并为各所述候选归因维度类型分别设置对应的权重,其中,所述流量归因特征包括节假日、渠道来源、访问内容以及运行环境。
7.一种流量归因的终端,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-4中任一所述的方法。
8.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一所述的方法。
CN201810720283.5A 2018-07-03 2018-07-03 流量归因方法、装置以及终端 Active CN110677310B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810720283.5A CN110677310B (zh) 2018-07-03 2018-07-03 流量归因方法、装置以及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810720283.5A CN110677310B (zh) 2018-07-03 2018-07-03 流量归因方法、装置以及终端

Publications (2)

Publication Number Publication Date
CN110677310A CN110677310A (zh) 2020-01-10
CN110677310B true CN110677310B (zh) 2023-04-07

Family

ID=69065660

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810720283.5A Active CN110677310B (zh) 2018-07-03 2018-07-03 流量归因方法、装置以及终端

Country Status (1)

Country Link
CN (1) CN110677310B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003014974A2 (en) * 2001-07-09 2003-02-20 Polyvista, Inc A method for generating multidimensional summary reports from multidimensional data
US8600796B1 (en) * 2012-01-30 2013-12-03 Bazaarvoice, Inc. System, method and computer program product for identifying products associated with polarized sentiments
CN105468701A (zh) * 2015-11-18 2016-04-06 车智互联(北京)科技有限公司 一种计算外部来源对网站流量波动的影响度的方法和装置
CN106708647A (zh) * 2016-12-30 2017-05-24 浙江工商大学 大数据环境下的分布式跨维度异常数据检测方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101799830A (zh) * 2010-03-25 2010-08-11 北京国双科技有限公司 可实现多维度自由剖析的流量数据处理方法
US9754266B2 (en) * 2010-04-21 2017-09-05 Excalibur Ip, Llc Online serving threshold and delivery policy adjustment
US10404777B2 (en) * 2015-10-19 2019-09-03 Adobe Inc. Identifying sources of anomalies in multi-variable metrics using linearization
CN107154880B (zh) * 2016-03-03 2020-12-15 创新先进技术有限公司 系统监控方法及装置
CN107885634B (zh) * 2016-09-29 2020-06-16 腾讯科技(深圳)有限公司 监控中异常信息的处理方法和装置
CN107957988A (zh) * 2016-10-18 2018-04-24 阿里巴巴集团控股有限公司 用于确定数据异常原因的方法、装置及电子设备
CN108156012B (zh) * 2016-12-06 2021-09-10 中国移动通信集团设计院有限公司 一种网络报障数据多维度分类统计分析方法及装置
CN106960086A (zh) * 2017-03-09 2017-07-18 中国电建集团贵阳勘测设计研究院有限公司 一种基于大坝监控数据评估防渗帷幕可靠性的方法
CN107784322B (zh) * 2017-09-30 2021-06-25 东软集团股份有限公司 异常数据检测方法、装置、存储介质以及程序产品

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003014974A2 (en) * 2001-07-09 2003-02-20 Polyvista, Inc A method for generating multidimensional summary reports from multidimensional data
US8600796B1 (en) * 2012-01-30 2013-12-03 Bazaarvoice, Inc. System, method and computer program product for identifying products associated with polarized sentiments
CN105468701A (zh) * 2015-11-18 2016-04-06 车智互联(北京)科技有限公司 一种计算外部来源对网站流量波动的影响度的方法和装置
CN106708647A (zh) * 2016-12-30 2017-05-24 浙江工商大学 大数据环境下的分布式跨维度异常数据检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
颜若愚 ; 郑庆华 ; .使用交叉熵检测和分类网络异常流量.西安交通大学学报.2010,(第06期),全文. *

Also Published As

Publication number Publication date
CN110677310A (zh) 2020-01-10

Similar Documents

Publication Publication Date Title
CN108090567B (zh) 电力通信系统故障诊断方法及装置
CN107729376B (zh) 保险数据审核方法、装置、计算机设备及存储介质
CN110489314A (zh) 模型异常检测方法、装置、计算机设备和存储介质
CN113469857A (zh) 一种数据处理方法、装置、电子设备以及存储介质
CN113051308A (zh) 告警信息处理方法、设备、存储介质及装置
WO2021043094A1 (zh) 基于位置服务的位置识别方法、装置、设备及存储介质
CN108536812B (zh) 无效数据资源的清除方法、装置、设备及计算机可读介质
CN110677310B (zh) 流量归因方法、装置以及终端
CN110442466B (zh) 防止请求重复访问方法、装置、计算机设备及存储介质
CN110795308A (zh) 一种服务器检验方法、装置、设备及存储介质
US9183388B2 (en) Injustice detecting system, injustice detecting device and injustice detecting method
CN115237796A (zh) 一种链路异常的识别方法、装置、存储介质及电子设备
CN111222739B (zh) 核电站的任务分配方法及核电站的任务分配系统
CN109284354B (zh) 脚本搜索方法、装置、计算机设备及存储介质
CN115129575A (zh) 一种代码覆盖结果生成方法及装置
CN113254292A (zh) 距离感应功能检测方法及装置
CN113312261A (zh) 测试用例筛选方法、设备、存储介质及装置
CN113626387A (zh) 一种任务数据的导出方法、装置、电子设备及存储介质
CN109165127B (zh) 问题接口的定位方法、装置及电子设备
CN112363915A (zh) 用于页面性能测试的方法、装置、终端设备及存储介质
CN112988536A (zh) 一种数据异常检测方法、装置、设备及存储介质
CN116957822B (zh) 表单的检测方法、装置、电子设备及存储介质
CN113392022B (zh) 测试需求分析方法、设备、计算机可读介质和程序产品
CN112667688A (zh) 数据分析方法、数据分析装置、存储介质和电子设备
CN117609074A (zh) 接口自动化测试方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant