CN116070958A - 归因分析方法、装置、电子设备和存储介质 - Google Patents

归因分析方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN116070958A
CN116070958A CN202310132250.XA CN202310132250A CN116070958A CN 116070958 A CN116070958 A CN 116070958A CN 202310132250 A CN202310132250 A CN 202310132250A CN 116070958 A CN116070958 A CN 116070958A
Authority
CN
China
Prior art keywords
index
value
indexes
level
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310132250.XA
Other languages
English (en)
Inventor
程宇
马钦泓
于明华
郭志斌
阮前
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Information Technology Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Information Technology Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202310132250.XA priority Critical patent/CN116070958A/zh
Publication of CN116070958A publication Critical patent/CN116070958A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种归因分析方法、装置、电子设备和存储介质,属于数据处理技术领域。该方法包括:获取N级指标中各指标的指标值,确定N级指标中后N‑1级指标中各指标对应的贡献度,确定M个指标路径分别对应的总贡献度,由此,可比较M个指标路径对于N级指标中第一级指标的贡献度,以确定M个指标路径中的总贡献度最大的指标路径,可进一步确定N级指标中第一级指标的归因因子,减少对人工计算的依赖性,提高归因分析的自主性,以提高归因分析的计算效率。

Description

归因分析方法、装置、电子设备和存储介质
技术领域
本公开涉及数据处理技术领域,具体涉及一种归因分析方法、装置、电子设备和存储介质。
背景技术
互联网技术的逐步发展推动了大数据技术的飞速发展,依靠大数据技术建立相对较为完善的指标体系,可以通过收集指标数据,计算指标数据来确定指标波动的情况,而根据指标波动的情况可以进一步确定指标波动是否正常,其次,对于指标异常波动的情况判断出现指标波动的原因,称为归因分析,最后,可以根据指标的归因分析进行全局量化,以进一步推动业务的执行。
现有技术由于指标数据的快速变化,人工手动计算指标数据,以进一步进行指标的归因分析,但人工手动计算无法快速响应于指标数据的变化。因此,人工手动计算无法快速处理指标数据,计算效率较低。
发明内容
本申请实施例提供了一种归因分析方法、装置、电子设备和存储介质,能够解决现有技术存在计算效率较低等问题。
第一方面,本申请实施例提供了一种归因分析方法,方法包括:
获取N级指标中各指标的指标值,其中,N为大于1的整数;
确定所述N级指标中后N-1级指标中各指标对应的贡献度,其中,第二指标对应的贡献度根据所述第二指标的指标值和第一指标的指标值确定,所述第二指标对应的贡献度为所述第二指标对所述第一指标的贡献度,所述第二指标为所述N级指标中第i+1级指标中的任一个指标,所述第一指标为所述N级指标中第i级指标中包括所述第二指标的指标,i为小于N的正整数;
确定M个指标路径分别对应的总贡献度,其中,M为所述N级指标中第N级指标包括的指标数量,所述M个指标路径的各指标路径均包括N个指标,所述M个指标路径中的第j个指标路径包括所述第N级指标中的第j个指标,所述N级指标的前N-1级指标中与所述第j个指标对应的指标,所述第j个指标路径对应的总贡献度根据所述第j个指标路径中各指标对应的贡献度确定,j为小于或等于M的正整数;
根据所述M个指标路径分别对应的总贡献度,确定所述M个指标路径中总贡献度最大的指标路径,得到目标指标路径;
根据所述目标指标路径,确定所述N级指标中第一级指标的归因结果。
在一个可能实现的实施例中,所述根据所述目标指标路径,确定所述N级指标中第一级指标的归因结果,归因分析方法包括:
获取目标指标对应的T个指标因子的第一指标值,所述目标指标为所述目标指标路径的第N级指标中的一个指标;
根据指标因子计算模型,确定所述T个指标因子的第二指标值;
根据所述第一指标值和所述第二指标值的平均值,确定所述T个指标因子的第二指标值的目标指标因子;
将所述目标指标因子确定为所述N级指标中第一级指标的归因结果。
在一个可能实现的实施例中,第一指标和第二指标的指标类型为数值型;所述确定所述N级指标中后N-1级指标中各指标对应的贡献度,归因分析方法包括:
获取第一值、第二值以及第三值;所述第一值为所述第一指标在第一周期内的指标值,所述第二值为所述第二指标在第一周期内的指标值,所述第三值为所述第二指标在第二周期内的指标值;所述第一周期和所述第二周期为相同长度的连续周期;
计算所述第二值和所述第三值之差,得到第一差值;
根据所述第一值、所述第一差值,确定所述第二指标对所述第一指标的贡献度。
在一个可能实现的实施例中,第一指标和第二指标的指标类型为比率型;
所述确定所述N级指标中后N-1级指标中各指标对应的贡献度,归因分析方法包括:
获取第四值、第五值、第六值以及第七值;所述第四值为所述第一指标在第一周期内的指标值;所述第五值为所述第一指标在第二周期内的指标值;所述第六值为所述第二指标在第一周期内的指标值;所述第七值为所述第二指标在第二周期内的指标值;
计算所述第四值和所述第五值的差值,得到第二差值;
根据所述第六值和所述第七值,确定第一系数和第二系数;所述第一系数为所述第五值与在所述第二周期内所述N级指标中第i+1级指标中的各指标之和的比率;所述第二系数为第一系数与第二预系数的差值;所述第二预系数为所述第七值在所述第一周期内所述N级指标中第i+1级指标中的各指标之和的比率;
根据所述第一系数和所述第二系数,确定所述第二指标对所述第一指标的贡献度。
在一个可能实现的实施例中,所述确定所述N级指标中后N-1级指标中各指标对应的贡献度,归因分析方法包括:
获取所述第二指标中各指标对应的权重值;
根据所述第二指标中各指标对应的指标值和所述权重值,确定所述第二指标对所述第一指标的贡献率。
在一个可能实现的实施例中,在获取N级指标中各指标的指标值之前,归因分析方法还包括:
在指标分层模型中采集基础指标值;所述基础指标值包括所述N级指标中各指标的指标值;所述指标分层模型基于所述基础指标值构建;
通过所述指标分层模型对所述基础指标值对应的基础指标建立指标关联关系;
根据所述指标关联关系,构建所述基础指标的M个指标路径。
第二方面,本申请实施例提供了一种归因分析装置,归因分析装置包括获取模块,用于获取N级指标中各指标的指标值,其中,N为大于1的整数;
第一确定模块,用于确定所述N级指标中后N-1级指标中各指标对应的贡献度,其中,第二指标对应的贡献度根据所述第二指标的指标值和第一指标的指标值确定,所述第二指标对应的贡献度为所述第二指标对所述第一指标的贡献度,所述第二指标为所述N级指标中第i+1级指标中的任一个指标,所述第一指标为所述N级指标中第i级指标中包括所述第二指标的指标,i为小于N的正整数;
第二确定模块,用于确定M个指标路径分别对应的总贡献度,其中,M为所述N级指标中第N级指标包括的指标数量,所述M个指标路径的各指标路径均包括N个指标,所述M个指标路径中的第j个指标路径包括所述第N级指标中的第j个指标,所述N级指标的前N-1级指标中与所述第j个指标对应的指标,所述第j个指标路径对应的总贡献度根据所述第j个指标路径中各指标对应的贡献度确定,j为小于或等于M的正整数;
第三确定模块,用于根据所述M个指标路径分别对应的总贡献度,确定所述M个指标路径中总贡献度最大的指标路径,得到目标指标路径;
第四确定模块,用于根据所述目标指标路径,确定所述N级指标中第一级指标的归因结果。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时执行实现上述归因分析方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述归因分析实施例的各个过程。
第五方面,本申请实施例提供了一种计算机程序产品,计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备执行实现上述归因分析实施例的各个过程。
本申请实施例提供的归因分析方法、装置、电子设备、计算机可读存储介质和计算机程序产品,该步骤包括:首先,获取N级指标中各指标的指标值,其次,确定N级指标中后N-1级指标中各指标对应的贡献度,而后,确定M个指标路径分别对应的总贡献度,由此,可比较M个指标路径对于N级指标中第一级指标的贡献度,以确定M个指标路径中的总贡献度最大的目标指标路径,最后,可进一步确定N级指标中第一级指标的归因因子,减少对人工计算的依赖性,提高归因分析的自主性,以提高归因分析的计算效率。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为现有技术的一种归因分析方法的流程图;
图2为本申请实施例提供的一种归因分析方法的流程图;
图3为本申请实施例提供的一种四级指标示意图之一;
图4为本申请实施例提供的一种四级指标示意图之二;
图5为本申请实施例提供的一种归因分析方法中配置域的流程图;
图6为本申请实施例提供的一种归因分析方法中计算域的流程图;
图7为本申请实施例提供的一种归因分析装置的结构框图;
图8为本申请实施例提供的一种归因分析电子设备的结构图。
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
在本文中,诸如第一第二等之类的关系术语仅仅用来将一个实体或操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
如图1所示,现有技术的步骤包括:
S101:数据收集关键指标。
在数据收集关键指标过程中,通过系统收集关键指标对应的指标值,依赖于人工的手动计算,得到计算结果,进而对于计算结果进行线下统计。
S102:数据分析评估。
目前对于计算结果评估总指标的波动原因主要依赖于人工手动统计分析指标的趋势和单指标的波动情况,确定单指标对于总指标的贡献度,进一步确定总指标的波动原因。
现有技术根据人工手动计算并统计关键指标的指标值,能够分析得到总指标的波动原因。
经本申请人研究发现,目前的这种归因分析方法存在以下技术问题:
单指标的指标值由于计算口径的修改和新增频率的提高,依靠人工手动计算,无法快速响应于单指标的指标值的变化频率,因此,无法及时确定总指标波动的原因,计算效率较低。
鉴于上述研究发现,本申请实施例提供了一种归因分析方法,以解决现有技术中存在的上述技术问题。
本申请实施例的技术构思在于:本申请通过线上的统一定义和管理,便于灵活支撑指标算子的定义和计算,可减少对人工指标管理的依赖性,确定数据库中指标的指标关联关系,进一步地,根据指标关联关系计算指标项对于总指标的贡献度,以确定指标的波动原因,提高指标计算的效率。
本申请实施例提供了一种归因分析方法,如图2所示,归因分析方法步骤如下:
S201:获取N级指标中各指标的指标值,其中,N为大于1的整数。
从系统中获取系统计算出的N级指标中各级指标的指标值,N级指标可以为二级指标、三级指标,甚至四级指标,其中,N级指标中各指标的指标值包括第N级指标、第N-1级指标、第N-2级指标至第一级指标的指标值,此处不做限定,基于所获取的N级指标中各指标的指标值,为S202中确定N级指标中后N-1级指标中各指标对应的贡献度打下数据基础。
在一个示例中,N为四,即获取四级指标中各指标的指标值,如表1所示,四级指标中包括第一级指标、第二级指标、第三级指标以及第四级指标,其中,第一级指标为资源效能分配率,第一级指标可拆解为第二级指标,第二级指标的指标值的波动直接影响第一级指标的指标值,第二级指标为整体资源分配率和整体资源利用率,第二级指标中的整体资源分配率可具体分为租户A资源分配率和租户B资源分配率,第二级指标中的整体资源利用率可具体分为租户A资源利用率和租户B资源利用率,第三级指标具体可以为租户A资源分配率、租户B资源分配率、租户A资源利用率和租户B资源利用率;第三级指标中的租户A资源分配率可分为租户A裸金属服务器分配使用率和租户A虚拟机分配使用率,租户A资源利用率可分为租户A CPU利用率、租户A内存利用率以及租户A磁盘利用率,同理,租户B资源分配率可分为租户B裸金属服务器分配使用率和租户B虚拟机分配使用率,租户B资源利用率可分为租户B CPU利用率、租户B内存利用率以及租户B磁盘利用率,故,第四级指标可以包括租户A裸金属服务器分配使用率、租户A虚拟机分配使用率、租户B裸金属服务器分配使用率、租户B虚拟机分配使用率、租户A CPU利用率、租户A内存利用率、租户A磁盘利用率、租户B资源利用率可分为租户B CPU利用率、租户B内存利用率以及租户B磁盘利用率。获取该四级指标中各指标的指标值,即获取四级指标中第一级指标、第二级指标、第三级指标以及第四级指标的指标值。
表1:四级指标表
Figure SMS_1
S202:确定所述N级指标中后N-1级指标中各指标对应的贡献度,其中,第二指标对应的贡献度根据所述第二指标的指标值和第一指标的指标值确定,所述第二指标对应的贡献度为所述第二指标对所述第一指标的贡献度,所述第二指标为所述N级指标中第i+1级指标中的任一个指标,所述第一指标为所述N级指标中第i级指标中包括所述第二指标的指标,i为小于N的正整数。
第二指标可以为N级指标中第i+1级指标中的任一个指标,第一指标可以为N级指标中第i级指标中包括第二指标的指标,根据S201所获取的N级指标中各指标的指标值,可以确定N级指标中后N-1级指标中各指标对应的贡献度,具体地,通过根据第一指标和第二指标的指标值,可以确定第二指标对第一指标的贡献率,从而,可以确定N级指标中第i+1级指标中的指标对第i级指标中对应的指标的贡献率。
通过确定第二指标对第一指标的贡献度,进一步地,可以确定N级指标中后N-1级指标中各指标对应的贡献度,第二指标的贡献度表示在第一指标的波动时,第二指标对于第一指标的波动的影响大小。
在一个具体的示例中,如图3所示,若以第三级指标中的租户A利用率为第二指标,则第一指标为第二级指标中的资源利用率,根据租户利用率和资源利用率的指标值可以确定租户A利用率对资源利用率指标波动的影响,在确定租户A利用率对应的贡献率后,再以第二级指标中的资源利用率为第二指标,以第一级指标的资源效能为第一指标,确定资源利用率对资源效能的贡献率,同理,可确定N级指标中后N-1级指标中各指标对应的贡献度。
通过逐层递进的计算方式,可使用大数据技术依次算出N级指标中后N-1级指标中各指标对应的贡献度,以减少人工手动的数据计算,提高数据计算准确度和效率。
S203:确定M个指标路径分别对应的总贡献度,其中,M为所述N级指标中第N级指标包括的指标数量,所述M个指标路径的各指标路径均包括N个指标,所述M个指标路径中的第j个指标路径包括所述第N级指标中的第j个指标,所述N级指标的前N-1级指标中与所述第j个指标对应的指标,所述第j个指标路径对应的总贡献度根据所述第j个指标路径中各指标对应的贡献度确定,j为小于或等于M的正整数。
总贡献度是指M个指标路径中的任一个指标路径中的各个指标的贡献度之和,M个指标路径中的任一个指标路径是,包括第一级指标、第二级指标、第三级指标至第N级指标等N个指标在内的指标路径,M是由N级指标中第N级指标中的指标数量决定的。
对于本申请实施例的确定M个指标路径分别对应的总贡献度的方法有两种方法。
一种方法可以是将N级指标中后N-1级指标中各指标对应的贡献度输入至决策树模型中,求出贡献度的熵,采用后剪枝解决剪枝决策树存在过拟合的问题,找到跃层增益较大的“拐点”,向上递归确定一条贡献度最大的指标路径。
在一个示例中,如图4所示,通过向上递归的方式从第一级指标,确定第二级指标的贡献度,从而确定第三级指标的贡献度,进而确定第四级指标的贡献度。具体地,通过确定资源利用率为第一级指标中对应的跃层增益较大的“拐点”,则计算资源利用率对应的贡献度,确定租户B磁盘利用率为第二级指标中资源利用率对应的跃层增益较大的“拐点”,由此,计算租户B磁盘利用率对应的贡献度,从而获取租户B磁盘利用率对应的指标路径,该指标路径可以包括资源效能、资源利用率、租户B利用率以及租户B磁盘利用率。
另一种方法可以是本申请可以根据计算第一级指标、第二级指标、第三级指标至第N级指标的贡献度之和,确定指标路径的总贡献度,以比较M个指标路径中的最大的指标路径。
通过决策树算法确定M个指标路径对应的总贡献度,可以提高计算的准确度,快速响应于指标值的变化,提高计算的效率。
S204:根据所述M个指标路径分别对应的总贡献度,确定所述M个指标路径中总贡献度最大的指标路径,得到目标指标路径;
通过比较M个指标路径对应的总贡献度,可以确定M个指标路径中总贡献度最大的一个指标路径,其中,总贡献度最大的一个指标路径可以称为目标指标路径,目标指标路径包括N级指标中的各级别指标,在每一级指标对应有一个指标,因此,目标指标路径包括N个指标,该N个指标代表不同级别的指标,N个指标对应有N个指标值。
比较M个指标路径对应的总贡献度,目的是找出目标指标路径,根据目标指标路径进而找到对一级指标影响最大的归因因素,系统自主找出目标指标路径,减少人力资源的浪费,高效找出影响一级指标波动的因素。
S205:根据所述目标指标路径,确定所述N级指标中第一级指标的归因结果。
在确定目标指标路径后,可以确定影响目标指标路径中第一级指标波动的主要影响因素,得到第一级指标的归因结果。
在一个示例中,如图4所示,若一个指标路径的总贡献度最大,该指标路径可以包括资源效能、资源利用率、租户B利用率以及租户B磁盘利用率,则可确定该指标路径为目标指标路径,由此,可进一步确定四级指标中第一级指标的归因结果,该归因结果具体可以表示为:首先,四级指标中第一级指标波动的主要影响因素是第二级指标中的资源利用率,其次,资源利用率波动的主要影响因素是四级指标中第三级指标中的租户B利用率,最后,租户B利用率波动的主要影响因素是四级指标中第四级指标中的租户B磁盘利用率。
根据目标指标路径,进一步确定对应N级指标中对第一级指标的归因结果,可以由系统进行比较总贡献度的指标路径,确定目标指标路径,从而确定归因结果,减少人为主观判断的影响,可以提高系统计算的效率的准确性。
本申请实施例提供的归因分析方法、装置、电子设备、计算机可读存储介质和计算机程序产品,该步骤包括:首先,获取N级指标中各指标的指标值,其次,确定N级指标中后N-1级指标中各指标对应的贡献度,而后,确定M个指标路径分别对应的总贡献度,由此,可自主比较M个指标路径对于N级指标中第一级指标的贡献度,以确定M个指标路径中的总贡献度最大的指标路径,该总贡献度最大的指标路径可以为目标指标路径,最后,可根据目标指标路径进一步确定N级指标中第一级指标的归因因子,减少对人工计算的依赖性,提高归因分析的自主性,进而提高归因分析的计算效率。
在一些实施例中,所述根据目标指标路径,确定所述N级指标中第一级指标的归因结果,归因分析方法可以包括:
获取目标指标对应的T个指标因子的第一指标值,所述目标指标为所述目标指标路径的第N级指标中的一个指标;
根据指标因子计算模型,确定所述T个指标因子的第二指标值;
根据所述第一指标值和所述第二指标值的平均值,确定所述T个指标因子对应的目标指标因子;
将所述目标指标因子确定为所述N级指标中第一级指标的归因结果。
首先,在确定目标指标路径的情况下,确定目标指标路径对应的N级指标中第N级指标中的一个指标,将该指标表述为目标指标,将目标指标的指标值自动导入到数据湖中,通过对目标指标的分析,获取该目标指标对应的T个指标因子的第一指标值。
其次,基于tarRocks聚合模型和kylin星形模型计算目标指标对应的T个指标因子的第二指标值,具体地,可以在数据导入的时候提前使用tarRocks聚合模型根据主键对导入的数据进行预聚合操作,在应用时直接使用相应的数据,以加快计算速度。
而后,计算第一指标值和第二指标值的平均值,确定T个指标因子对应的目标指标因子,对目标指标因子进行分析,可以得到直观分析图,其中,直观分析图可以包括指标饼图和直方图等,该直观分析图可用于进一步分析N级指标中第一级指标的归因结果。
其中,对于数据量比较大的指标,可以采用超级博客(HyperLogLog,HLL)近似计算方法,可以提升计算效率,还可以减轻数据去重分析的计算压力。与此同时,若是使用HLL去重,需要在建表语句中,将目标的指标列的类型设置为HLL,聚合函数设置为HLL_UNION。根据数据集大小和所采用的哈希函数的类型,HLL算法的误差可控制在1%至10%左右。
在一个示例中,以租户B磁盘利用率为例,该租户B磁盘利用率为四级指标中第四级指标中的一个指标,将租户B磁盘利用率确定为目标指标,对租户B磁盘利用率进行分析,确定该租户B磁盘利用率的指标因子可以包括应用磁盘利用率和中间件磁盘利用率,即T为2,获取该指标因子对应的第一指标值,即应用磁盘利用率的第一指标值为50%,和中间件磁盘利用率的第一指标值为50%,根据StarRocks聚合模型、kylin星形模型实时计算出的该指标因子对应的第二指标值,具体地,应用磁盘利用率的第一指标值为60%,和中间件磁盘利用率的第一指标值为40%,计算所述相同应用和相同中间件的平均值为45%和55%,则可确定目标指标因子为中间件磁盘利用率为N级指标中第一级指标的一个归因结果,即影响第一级指标波动的主要因素包括中间磁盘利用率。
通过对目标指标的指标因子进行分析,可对N级指标中第一级指标的归因结果进行全面的分析,以提高计算的准确度。
在一些实施例中,第一指标和第二指标的指标类型为数值型;所述确定所述N级指标中后N-1级指标中各指标对应的贡献度,归因分析方法可以包括:
获取第一值、第二值以及第三值;所述第一值为所述第一指标在第一周期内的指标值,所述第二值为所述第二指标在第一周期内的指标值,所述第三值为所述第二指标在第二周期内的指标值;所述第一周期和所述第二周期为相同长度的连续周期;
计算所述第二值和所述第三值之差,得到第一差值;
根据所述第一值、所述第一差值,确定所述第二指标对所述第一指标的贡献度。
在第一指标和第二指标的指标类型为数值类的前提下,以连续两个周期,即第一周期和第二周期的指标值为例。第一周期和第二周期的时长单位可以是小时,也可以是天。比如,第一周期为30天,则对应地,第二周期为与第一周期连续的30天。
可以根据贡献度计算公式确定第二指标对所述第一指标的贡献度,该数值类对应的贡献度计算公式为:
Figure SMS_2
其中,
Figure SMS_3
为第二指标Xi对第一指标的贡献度,
Figure SMS_4
为第二值,
Figure SMS_5
为第三值,
Figure SMS_6
为第一差值,Y0为第一值。
同理,根据上述贡献度计算公式,可以确定N级指标中第i+1级指标中的各个指标的贡献度。
另外,还可以确定根据贡献度求和公式和N级指标中第i+1级指标中的各个指标的贡献度,可以确定N级指标中第i级指标中包括所述第二指标的一个指标的波动率,该贡献度求和公式具体为:
Figure SMS_7
其中,ΔY%为N级指标中第i级指标中包括所述第二指标的一个指标的波动率,
Figure SMS_8
Figure SMS_9
分别为N级指标中第i+1级指标中的一个不同的指标。
在一个示例中,访问网站独立访客(Unique Visitor,UV)的总数等于各个渠道UV的数量之和,其中,访问网站独立访客(Unique Visitor,UV)的总数为第一指标,一个渠道UV的数量为第二指标,由于第一指标的指标值是根据多个第二指标的指标值之和确定的,故称该第一指标和该第二指标为数值型。
设置数值型指标对应的贡献度计算公式,可采用多给服务器并行计算N级指标中各指标对应的贡献度,可提高计算的效率和准确度。
在一些实施例中,将第一指标和第二指标的指标类型为比率型;所述确定所述N级指标中后N-1级指标中各指标对应的贡献度,归因分析方法可以包括:
获取第四值、第五值、第六值以及第七值;所述第四值为所述第一指标在第一周期内的指标值;所述第五值为所述第一指标在第二周期内的指标值;所述第六值为所述第二指标在第一周期内的指标值;所述第七值为所述第二指标在第二周期内的指标值;
计算所述第四值和所述第五值的差值,得到第二差值;
根据所述第二差值、所述第六值和所述第七值,确定第一系数和第二系数;所述第一系数为所述第二差值与第一比值的乘积,所述第一比值为所述第五值与在所述第二周期内所述N级指标中第i+1级指标中的各指标之和的比率;所述第二系数为所述第二差值与第三系数的乘积,所述第三系数为所述第一比值与第二比值的差值;所述第二比值为所述第七值与所述第一周期内所述N级指标中第i+1级指标中的各指标之和的比率;
根据所述第一系数和所述第二系数,确定所述第二指标对所述第一指标的贡献度。
在确定第一指标和第二指标的指标类型为比率型的情况下,首先,归因分析系统可以根据比率计算公式,计算第一比值
Figure SMS_10
和第二比值
Figure SMS_11
Figure SMS_12
其中,Pi表示占比率,
Figure SMS_13
为N级指标中第i+1级指标中的一个指标,
Figure SMS_14
第i+1级指标中的各指标之和,第一比值
Figure SMS_15
表示第五值与在所述第二周期内所述N级指标中第i+1级指标中的各指标之和的比率;第二比值
Figure SMS_16
表示为第七值与所述第一周期内所述N级指标中第i+1级指标中的各指标之和的比率。
其次,归因分析系统可基于第一比值和第二差值,确定指标Xi的指标波动贡献度:
Figure SMS_17
其中,
Figure SMS_18
为指标Xi的指标波动贡献度,其可以称为第一系数,
Figure SMS_19
为第二差值,
Figure SMS_20
为第一指标在第一周期内的指标值,
Figure SMS_21
为第一指标在第二周期内的指标值,
Figure SMS_22
表示在第一周期内第二指标的占比率。
而后,归因分析系统可基于第三系数和第二差值,确定指标Xi的结构变化率:
Figure SMS_23
其中,
Figure SMS_24
为指标Xi的结构变化率,其可以称为第二系数,
Figure SMS_25
表示为第三系数,
Figure SMS_26
表示第一比值,
Figure SMS_27
表示第二比值。
进而,归因分析系统可基于第一系数和第二系数,确定指标Xi对于ΔY%的贡献度:
Figure SMS_28
其中,
Figure SMS_29
表示为指标Xi对于ΔY%的贡献度,
Figure SMS_30
为第一指标在第一周期内的指标值。
最后,可计算第二指标对应的贡献度,进而确定影响第一指标的波动的影响因素。
Figure SMS_31
其中,ΔY%表示第一指标的波动差值。
设置比率型指标对应的贡献度计算公式,可采用多给服务器并行计算N级指标中各指标对应的贡献度,可减少人工计算的错误率,进而提高计算的效率和准确度。
在一些实施例中,所述确定所述N级指标中后N-1级指标中各指标对应的贡献度,归因分析方法可以包括:
获取所述第二指标对应的权重值;
根据所述第二指标对应的指标值和所述权重值,确定所述第二指标对所述第一指标的贡献度。
权重值可以表述为第二指标对于第一指标波动的影响程度。
用户可在权重配置模块对第二指标设置对应的权重值,归因分析系统获取用户对第二指标设置对应的权重值,根据所述第二指标对应的权重值,确定第二指标在一个周期内的指标值,根据第二指标在一个周期内的指标值,其中,一个周期的时长由业务类型决定。
权重值配置的条件要满足:N级指标中第i+1级指标中的各个指标对应的权重值之和等于1。
在一个示例中,以一个二级指标为例,二级指标中的第一级指标为资源效能,第二级指标包括整体资源分配率X1和整体资源利用率X2,整体资源分配率和整体资源利用率对应的权重分别为w1=40%和w2=60%,则第二级指标对第一级指标的贡献度为Y,
Y=w1*X1+w2*X2
其中,X1为N级指标中第i+1级指标中的一个指标,X2为N级指标中第i+1级指标中除X1之外的一个指标,w1和w2对应为X1和X2的权重。
因此,根据第二指标的对应的权重值,可根据第二指标对第一指标波动的影响程度,确定第二指标对第一指标的贡献度,可全面分析第二指标对于第一指标的影响程度,以提高计算的准确性。
在一些实施例中,在获取N级指标中各指标的指标值之前,归因分析方法还可以包括:
在指标分层模型中采集基础指标值;所述基础指标值包括所述N级指标中各指标的指标值;所述指标分层模型基于所述基础指标值构建;
通过所述指标分层模型对所述基础指标值对应的基础指标建立指标关联关系;
根据所述指标关联关系,构建所述基础指标的M个指标路径。
在指标分层模型中采集基础指标值之前,如图5所示,在配置域对相应的指标进行指标值获取和权重配置等操作,具体步骤如下:
S501:定义数仓分层。
基于获取的指标值,可以建立数仓的贴源(Operational Data Store,ODS)层、数据明细(Data Warehouse Detail,DWD)层、数据仓库轻汇总(Data Warehouse Summary,DWS)层等数据存储模型,对源数据进行数据存储和数据处理,在对应的数据存储模型存储不同数据类型的数据,数据类型可以包括数据格式,而后在应用过程中分别从数据存储模型中的各层获取对应的指标值。
在一个示例中,租户A CPU利用率的指标可以从DWS层机器资源汇总表获取,还可以从DWD层获取租户A所有机器CPU资源日均明细数据,也可以从ODS层获取每台机器日志每分钟的CPU数据及对应机器配置CPU的值,每层模型可以被复用。
S502:指标定义。
从数据存储模型中获取基础指标的指标值后,生成数据文件,在大数据源数据管理中定义表、字段密码与字段之间的关系,将数据文件中指标密码与平台中指标密码关联,进一步构建指标名称、指标值的指标分层模型,其中,表对应的是数据文件,数据文件的文件类型可以为Excel、Word等文件类型。
S503:权重配置。
通过可视化配置的方式设置导入的N级指标中各指标的权重值。
在一个示例中,配置三级指标的权重值,第一级指标指的是资源效能分,第二级指标指的是资源分配率、资源利用率,第三级指标指的是不同租户的资源利用率。在整体配置完成后,归因分析系统可进行自动纠错,校验每一个指标拆分后的指标的权重值之和是否满足100%,若满足100%,则确定权重配置成功,可进行下一步操作。若不满足100%,则确定权重配置失败,需用户重新配置。
S504:指标计算配置。
可在线上化配置各层级基础指标的指标值的计算公式。
在一个示例中,基础指标的指标值的计算公式可以为租户A资源利用率=(租户ACPU利用率+租户A内存利用率+租户A磁盘利用率)/3。
基于在配置域对基础指标进行相应的操作后,如图6所示,可在计算域对基础指标进行贡献度计算等操作,具体步骤如下:
S601:基于指标计算配置计算各层指标值;
S601:基于权重、收集的指标值,计算其波动贡献度;
S601:找出贡献最大的维度组合;
S601:指标可继续多维分析、实时计算。
指标计算配置可以表述为指标值的计算公式,基于基础指标的指标值的计算公式,可使用Apache Spark进行离线基础指标的指标值计算、可使用Flink实时流式计算中N级指标中各指标的指标值,其中,Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎,Flink作为实时计算的一个流式计算引擎,可以处理多种实时数据。
由于每天/每小时不同层级的指标都是有波动的,根据用户需求获取对应周期的指标值,对相应的指标的波动情况进行拆解分析,以确定哪个指标对总指标的波动贡献度最大,另外,由于各种指标值的来源不同,指标值对应的指标类型也不尽相同,因此,本申请将指标类型分为两类:数值型和比率型,并相应地给出了指标贡献度的计算公式,用于归因分析系统快速获取指标贡献度。
将计算得到的指标贡献度输入决策树模型,求出贡献度的熵,而后,采用后剪枝(Post-pruning)解决剪枝决策树存在过拟合的问题,找跃层增益较大的指标;在基于决策树模型找到指标后,向上递归找出一条贡献度最大的指标路径,即目标指标路径。
其中,后剪枝的方式为:先把整颗决策树构造完毕,然后自底向上的对非叶结点进行考察,若将该结点对应的子树换为叶结点能够带来泛化性能的提升,则把该子树替换为叶结点,本方案借鉴了CCP-代价复杂度的方法。
对于目标指标路径而言,可对目标指标路径中的第N级指标中的第j个指标进行拆解,得到对应的指标因子,进一步确定目标指标路径中的第一级指标波动的主要影响因素。
此外,参见图7,本申请实施例还提供了一种归因分析装置700,该装置700包括获取模块701、第一确定模块702、第二确定模块703、第三确定模块704,各模块之间共同完成归因分析过程,具体为:
获取模块701,用于获取N级指标中各指标的指标值,其中,N为大于1的整数。
第一确定模块702,用于确定所述N级指标中后N-1级指标中各指标对应的贡献度,其中,第二指标对应的贡献度根据所述第二指标的指标值和第一指标的指标值确定,所述第二指标对应的贡献度为所述第二指标对所述第一指标的贡献度,所述第二指标为所述N级指标中第i+1级指标中的任一个指标,所述第一指标为所述N级指标中第i级指标中包括所述第二指标的指标,i为小于N的正整数。
第二确定模块703,用于确定M个指标路径分别对应的总贡献度,其中,M为所述N级指标中第N级指标包括的指标数量,所述M个指标路径的各指标路径均包括N个指标,所述M个指标路径中的第j个指标路径包括所述第N级指标中的第j个指标,所述N级指标的前N-1级指标中与所述第j个指标对应的指标,所述第j个指标路径对应的总贡献度根据所述第j个指标路径中各指标对应的贡献度确定,j为小于或等于M的正整数。
第三确定模块704,用于根据所述M个指标路径分别对应的总贡献度,确定所述M个指标路径中总贡献度最大的指标路径,得到目标指标路径;
第四确定模块705,用于根据所述目标指标路径,确定所述N级指标中第一级指标的归因结果,其中,所述目标指标路径为所述M个指标路径中总贡献度最大的指标路径。
在一些实施例中,第四确定模块705,用于根据所述目标指标路径,确定所述N级指标中第一级指标的归因结果,该装置还可以包括第一获取模块,用于获取目标指标对应的T个指标因子的第一指标值,所述目标指标为所述目标指标路径的第N级指标中的一个指标;
第五确定模块,用于根据指标因子计算模型,确定所述T个指标因子的第二指标值;
第六确定模块,用于根据所述第一指标值和所述第二指标值的平均值,确定所述T个指标因子的第二指标值的目标指标因子;
第七确定模块,用于将所述目标指标因子确定为所述N级指标中第一级指标的归因结果。
在一些实施例中,第一确定模块702,用于确定所述N级指标中后N-1级指标中各指标对应的贡献度,装置还可以包括第二获取模块,用于获取第一值、第二值以及第三值;所述第一值为所述第一指标在第一周期内的指标值,所述第二值为所述第二指标在第一周期内的指标值,所述第三值为所述第二指标在第二周期内的指标值;所述第一周期和所述第二周期为相同长度的连续周期;
第一计算模块,用于计算所述第二值和所述第三值之差,得到第一差值;
第八确定模块,用于根据所述第一值、所述第一差值,确定所述第二指标对所述第一指标的贡献度。
在一些实施例中,第一确定模块702,用于确定所述N级指标中后N-1级指标中各指标对应的贡献度,装置还可以包括:
第三获取模块,用于获取第四值、第五值、第六值以及第七值;所述第四值为所述第一指标在第一周期内的指标值;所述第五值为所述第一指标在第二周期内的指标值;所述第六值为所述第二指标在第一周期内的指标值;所述第七值为所述第二指标在第二周期内的指标值;
第二计算模块,用于计算所述第四值和所述第五值的差值,得到第二差值;
第九确定模块,用于根据所述第二差值、所述第六值和所述第七值,确定第一系数和第二系数;所述第一系数为所述第二差值与第一比值的乘积,所述第一比值为所述第五值与在所述第二周期内所述N级指标中第i+1级指标中的各指标之和的比率;所述第二系数为所述第二差值与第三系数的乘积,所述第三系数为所述第一比值与第二比值的差值;所述第二比值为所述第七值与所述第一周期内所述N级指标中第i+1级指标中的各指标之和的比率;
第十确定模块,用于根据所述第一系数和所述第二系数,确定所述第二指标对所述第一指标的贡献度。
在一些实施例中,第一确定模块702,用于确定所述N级指标中后N-1级指标中各指标对应的贡献度,装置还包括第四获取模块,用于获取所述第二指标对应的权重值;
第十一确定模块,用于根据所述第二指标对应的指标值和所述权重值,确定所述第二指标对所述第一指标的贡献度。
在一些实施例中,在获取模块701,用于获取N级指标中各指标的指标值之前,装置还包括采集模块,用于在指标分层模型中采集基础指标值;所述基础指标值包括所述N级指标中各指标的指标值;所述指标分层模型基于所述基础指标值构建;
建立模块,用于通过所述指标分层模型对所述基础指标值对应的基础指标建立指标关联关系;
构建模块,用于根据所述指标关联关系,构建所述基础指标的M个指标路径。
本申请实施例提供的归因分析装置的各个模块,可以实现图2提供归因分析方法的各个步骤的功能,并能达到其相应的技术效果,为简洁描述,在此不再赘述。
本申请实施例还提供一种电子设备,如图8所示,电子设备800可以包括:处理器801、存储器802、通信接口803以及总线804。
具体地,上述处理器801可以包括中央处理器(Central Processing Unit,CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC)或者可以配置成本申请实施例的一个或多个集成电路。
存储器802可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器802可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在一个实施例中,存储器802可以包括可移除或不可移除(或固定)的介质,或者存储器802是非易失性固态存储器。存储器802可在综合网关容载设备的内部或外部。
在一个实施例中,存储器802可以是只读存储器(Read Only Memory,ROM),在一个实施例中,该ROM可以是掩膜编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
存储802可以包括只读存储器(ROM),随机存取存储器(RAM),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本公开的一方面的方法所描述的操作。
处理器801通过读取并执行存储器802中存储的计算机程序指令,以实现图2所示实施例中的方法S201至S205,并达到图2所示实施例执行其方法/步骤达到相应技术效果,为简洁描述在此不再赘述。
在一个示例中,电子设备800还可包括通信接口803和总线804。其中,如图8所示,处理器801、存储器802、通信接口803通过总线804连接并完成相互间的通信。
通信接口803,主要用于实现本发明实施例中各模块、装置、单元和设备之间的通信。
总线804包括硬件、软件或两者,将在文档中嵌入文件的电子设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(Accelerated Graphics Port,AGP)或其它图形总线、增强工业标准架构(Extended Industry Standard Architecture,EISA)总线、前端总线(Front Side Bus,FSB)、超传输(Hyper Transport,HT)互连、工业标准架构(Industry Standard Architecture,ISA)总线、无线带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适单总线或者两个或者更多个以上这些的组合。在合适的情况下,总线710可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该电子设备可以执行本申请实施例中的归因分析方法,从而实现结合图2描述的归因分析方法。
另外,结合上述实施例中的归因分析方法,本申请实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行上述实施例中的任意一种归因分析方法。
本申请还提供了一种计算机程序产品,计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备执行实现上述任意一项归因分析方法实施例的各个过程。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、只读存储器(Read-Only Memory,ROM)、闪存、可擦除只读存储器(Erasable ReadOnly Memory,EROM)、软盘、只读光盘(Compact Disc Read-Only Memory,CD-ROM)、光盘、硬盘、光纤介质、射频(Radio Frequency,RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或源数据系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
上面参考根据本申请的实施例的方法、装置(源数据系统)、电子设备和存储介质的流程图和/或框图描述了本公开的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的源数据系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种归因分析方法,其特征在于,方法包括:
获取N级指标中各指标的指标值,其中,N为大于1的整数;
确定所述N级指标中后N-1级指标中各指标对应的贡献度,其中,第二指标对应的贡献度根据所述第二指标的指标值和第一指标的指标值确定,所述第二指标对应的贡献度为所述第二指标对所述第一指标的贡献度,所述第二指标为所述N级指标中第i+1级指标中的任一个指标,所述第一指标为所述N级指标中第i级指标中包括所述第二指标的指标,i为小于N的正整数;
确定M个指标路径分别对应的总贡献度,其中,M为所述N级指标中第N级指标包括的指标数量,所述M个指标路径的各指标路径均包括N个指标,所述M个指标路径中的第j个指标路径包括所述第N级指标中的第j个指标,所述N级指标的前N-1级指标中与所述第j个指标对应的指标,所述第j个指标路径对应的总贡献度根据所述第j个指标路径中各指标对应的贡献度确定,j为小于或等于M的正整数;
根据所述M个指标路径分别对应的总贡献度,确定所述M个指标路径中总贡献度最大的指标路径,得到目标指标路径;
根据所述目标指标路径,确定所述N级指标中第一级指标的归因结果。
2.根据权利要求1所述的归因分析方法,其特征在于,所述根据所述目标指标路径,确定所述N级指标中第一级指标的归因结果,包括:
获取目标指标对应的T个指标因子的第一指标值,所述目标指标为所述目标指标路径的第N级指标中的一个指标;
根据指标因子计算模型,确定所述T个指标因子的第二指标值;
根据所述第一指标值和所述第二指标值的平均值,确定所述T个指标因子的第二指标值的目标指标因子;
将所述目标指标因子确定为所述N级指标中第一级指标的归因结果。
3.根据权利要求1所述的归因分析方法,其特征在于,第一指标和第二指标的指标类型为数值型;所述确定所述N级指标中后N-1级指标中各指标对应的贡献度,包括:
获取第一值、第二值以及第三值;所述第一值为所述第一指标在第一周期内的指标值,所述第二值为所述第二指标在第一周期内的指标值,所述第三值为所述第二指标在第二周期内的指标值;所述第一周期和所述第二周期为相同长度的连续周期;
计算所述第二值和所述第三值之差,得到第一差值;
根据所述第一值、所述第一差值,确定所述第二指标对所述第一指标的贡献度。
4.根据权利要求1所述的归因分析方法,其特征在于,第一指标和第二指标的指标类型为比率型;
所述确定所述N级指标中后N-1级指标中各指标对应的贡献度,包括:
获取第四值、第五值、第六值以及第七值;所述第四值为所述第一指标在第一周期内的指标值;所述第五值为所述第一指标在第二周期内的指标值;所述第六值为所述第二指标在第一周期内的指标值;所述第七值为所述第二指标在第二周期内的指标值;
计算所述第四值和所述第五值的差值,得到第二差值;
根据所述第二差值、所述第六值和所述第七值,确定第一系数和第二系数;所述第一系数为所述第二差值与第一比值的乘积,所述第一比值为所述第五值与在所述第二周期内所述N级指标中第i+1级指标中的各指标之和的比率;所述第二系数为所述第二差值与第三系数的乘积,所述第三系数为所述第一比值与第二比值的差值;所述第二比值为所述第七值与所述第一周期内所述N级指标中第i+1级指标中的各指标之和的比率;
根据所述第一系数和所述第二系数,确定所述第二指标对所述第一指标的贡献度。
5.根据权利要求1所述的归因分析方法,其特征在于,所述确定所述N级指标中后N-1级指标中各指标对应的贡献度,包括:
获取所述第二指标对应的权重值;
根据所述第二指标对应的指标值和所述权重值,确定所述第二指标对所述第一指标的贡献度。
6.根据权利要求1所述的归因分析方法,其特征在于,在获取N级指标中各指标的指标值之前,所述方法还包括:
在指标分层模型中采集基础指标值;所述基础指标值包括所述N级指标中各指标的指标值;所述指标分层模型基于所述基础指标值构建;
通过所述指标分层模型对所述基础指标值对应的基础指标建立指标关联关系;
根据所述指标关联关系,构建所述基础指标的M个指标路径。
7.一种归因分析装置,其特征在于,所述装置包括:
获取模块,用于获取N级指标中各指标的指标值,其中,N为大于1的整数;
第一确定模块,用于确定所述N级指标中后N-1级指标中各指标对应的贡献度,其中,第二指标对应的贡献度根据所述第二指标的指标值和第一指标的指标值确定,所述第二指标对应的贡献度为所述第二指标对所述第一指标的贡献度,所述第二指标为所述N级指标中第i+1级指标中的任一个指标,所述第一指标为所述N级指标中第i级指标中包括所述第二指标的指标,i为小于N的正整数;
第二确定模块,用于确定M个指标路径分别对应的总贡献度,其中,M为所述N级指标中第N级指标包括的指标数量,所述M个指标路径的各指标路径均包括N个指标,所述M个指标路径中的第j个指标路径包括所述第N级指标中的第j个指标,所述N级指标的前N-1级指标中与所述第j个指标对应的指标,所述第j个指标路径对应的总贡献度根据所述第j个指标路径中各指标对应的贡献度确定,j为小于或等于M的正整数;
第三确定模块,用于根据所述M个指标路径分别对应的总贡献度,确定所述M个指标路径中总贡献度最大的指标路径,得到目标指标路径;
第四确定模块,用于根据所述目标指标路径,确定所述N级指标中第一级指标的归因结果。
8.一种电子设备,所述设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时执行如权利要求1至6任意一项所述归因分析方法。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任意一项所述归因分析方法。
10.一种计算机程序产品,其特征在于,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如权利要求1至6任意一项所述归因分析方法。
CN202310132250.XA 2023-02-17 2023-02-17 归因分析方法、装置、电子设备和存储介质 Pending CN116070958A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310132250.XA CN116070958A (zh) 2023-02-17 2023-02-17 归因分析方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310132250.XA CN116070958A (zh) 2023-02-17 2023-02-17 归因分析方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN116070958A true CN116070958A (zh) 2023-05-05

Family

ID=86183582

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310132250.XA Pending CN116070958A (zh) 2023-02-17 2023-02-17 归因分析方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN116070958A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117853232A (zh) * 2024-03-07 2024-04-09 杭银消费金融股份有限公司 一种信贷风险异常巡检归因预警方法与系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117853232A (zh) * 2024-03-07 2024-04-09 杭银消费金融股份有限公司 一种信贷风险异常巡检归因预警方法与系统
CN117853232B (zh) * 2024-03-07 2024-05-24 杭银消费金融股份有限公司 一种信贷风险异常巡检归因预警方法与系统

Similar Documents

Publication Publication Date Title
US10621492B2 (en) Multiple record linkage algorithm selector
CN108959187B (zh) 一种变量分箱方法、装置、终端设备及存储介质
CN111176953B (zh) 一种异常检测及其模型训练方法、计算机设备和存储介质
CN111368887B (zh) 雷雨天气预测模型的训练方法及雷雨天气预测方法
CN117113235B (zh) 一种云计算数据中心能耗优化方法及系统
CN114978956B (zh) 智慧城市网络设备性能异常突变点检测方法及装置
CN112686418B (zh) 一种履约时效预测方法和装置
CN108022123B (zh) 一种业务模型的自动调整方法及装置
CN116070958A (zh) 归因分析方法、装置、电子设备和存储介质
CN111090401B (zh) 存储设备性能预测方法及装置
CN114912720A (zh) 基于记忆网络电力负荷预测方法、装置、终端及存储介质
CN114513470A (zh) 网络流量控制方法、装置、设备及计算机可读存储介质
CN110826196B (zh) 一种工业设备运行数据的处理方法及装置
CN114997879B (zh) 一种支付路由方法、装置、设备和存储介质
CN115238583B (zh) 一种支持增量日志的业务流程剩余时间预测方法与系统
CN116866152A (zh) 风险操作管控方法、装置、电子设备及存储介质
CN116432099A (zh) 日志分类方法、装置、电子设备及存储介质
CN112967154B (zh) 一种电力系统Well-being的评估方法及装置
CN114861858A (zh) 一种路面异常数据检测方法、装置、设备及可读存储介质
CN115658990B (zh) 一种用于目标空间分群的数据处理方法及装置
CN113656267B (zh) 设备能效的计算方法、装置、电子设备及存储介质
CN117764455B (zh) 一种数据的通用指标管理方法及系统
CN114580758B (zh) 一种多城市自动能源负荷预测方法及系统
CN112632365B (zh) 一种舆情事件发展阶段自动划分与标识方法
CN113722403B (zh) 异常运行数据的聚类方法、装置、存储介质及处理器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination