CN116227995B - 一种基于机器学习的指标分析方法及系统 - Google Patents
一种基于机器学习的指标分析方法及系统 Download PDFInfo
- Publication number
- CN116227995B CN116227995B CN202310066421.3A CN202310066421A CN116227995B CN 116227995 B CN116227995 B CN 116227995B CN 202310066421 A CN202310066421 A CN 202310066421A CN 116227995 B CN116227995 B CN 116227995B
- Authority
- CN
- China
- Prior art keywords
- dimension
- index
- abnormal
- indexes
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Software Systems (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Tourism & Hospitality (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Game Theory and Decision Science (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Numerical Control (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于机器学习的指标分析方法及系统,包括:根据指标的相关定义和数据标准,确定核心指标相关联的各类维度数据;对核心指标对应的各类维度数据进行评估与预测,发现异常维度;对所述异常维度下的数值数据进行分析,确定主要异常维度;根据主要异常维度对应的主要数值数据,自动分析异常原因,生成分析结论;进而发现指标背后所蕴藏的更深刻的数据洞察,帮助用户制定更精准的决策。
Description
技术领域
本发明涉及数据建模技术领域,特别涉及一种基于机器学习的指标分析方法及系统。
背景技术
指标作为企业的核心数据资产,通常能够精准的反应企业的各类运营状态,但是仅仅通过指标,得到的仅仅只是表现,不清楚具体的指标发生变化与波动的原因,也无法通过指标真实的去推导相关的策略。分析指标,发现指标中出现的较大异常,分析指标变化原因,进而发现指标背后所蕴藏的更深刻的数据洞察,帮助用户制定更精准的决策,是目前更多用户期盼解决的核心问题。
发明内容
本发明提供一种基于机器学习的指标分析方法及系统,分析指标下维度变化原因,进而发现指标背后所蕴藏的更深刻的数据洞察,帮助用户制定更精准的决策。
一种基于机器学习的指标分析方法,包括:
S1:根据指标的相关定义和数据标准,确定核心指标相关联的各类维度数据;
S2:对核心指标对应的各类维度数据进行评估与预测,发现异常维度;
S3:对所述异常维度下的数值数据进行分析,确定主要异常维度;
S4:根据主要异常维度对应的主要数值数据,自动分析异常原因,生成分析结论。
优选的,S1中,根据指标的相关定义和数据标准,确定核心指标相关联的各类维度数据,包括:
获取核心指标的相关定义的关键词,并获取与所述关键词关联的目标关键词,基于所述目标关键词从全部指标中获取关联指标,并根据关联指标的相关定义,确定所述指标与关联指标之间的关联度,以及确定关联度的正相关和负相关;
根据核心指标的数据标准,对关联指标进行指标映射,得到标准关联指标;
从业务数据中获取与所述核心指标和标准关联指标相关的业务数据,并根据所述关联度对所述业务数据进行分类,得到各类维度数据。
优选的,S1之前,还包括获取服务业务相关的核心指标,具体为:
获取全部指标之间的关联度,并将全部指标中与其他指标的关联范围大于预设关联范围的指标,作为第一指标;
获取所述第一指标的关键词,将关键词按照预设的规则与各类维度数据进行匹配,得到目标维度数据,并分析所述目标维度数据对应的业务实例,根据所述业务实例中的业务关键词,确定业务实例之间的关联关系;
基于所述关联关系,进行知识图谱的构建和核心指标的确定。
优选的,S3中,对所述异常维度下的数值数据进行分析,确定主要异常维度,包括:
获取在所述异常维度下的历史异常表现数据,并确定所述历史异常表现数据对异常维度的影响程度;
基于所述历史异常表现数据及其对异常维度的影响程度,对所述历史异常表现数据进行标准化,得到标准化规则,根据所述标准化规则对历史异常表现数据及其对异常维度的影响程度进行标准化,得到单一决策树;
确定所述异常维度之间在横向上的关联特征,基于所述关联特征对所有单一决策树进行整合,得到横向决策树;
确定在所述异常维度下,所述历史异常表现数据在时间上的变化特征,并基于所述变化特征及其对异常维度的影响,建立时间特征决策树;
基于所有历史异常表现数据对异常维度的综合影响,对所述横向决策树和时间特征决策树进行整合,得到目标决策树;
将每个异常维度下的数值数据输入所述目标决策树中,得到对应的影响值,将影响值最大对应的异常维度作为主要异常维度。
优选的,S4中,根据主要异常维度对应的主要数值数据,自动分析异常原因,生成分析结论,包括:
根据所述主要异常维度的定义,对核心指标下的维度进行分析,根据分析结果从知识图谱中得到与主要异常维度的相关维度,分析所述相关维度在对主要异常维度的贡献度;
获取所述主要异常维度的异常值,结合所述相关维度在对主要异常维度的贡献度,计算得到主要异常维度的整体异常度;
判断所述整体异常度是否大于预设异常度;
若是,确定所述主要异常维度重度异常,并进行预警提醒;
否则,确定所述主要异常维度轻度异常,将所述主要异常维度和相关维度输入预先训练得到的原因分析模型中,得到异常原因。
一种基于机器学习的指标分析系统,包括:
数据挖掘模块,用于根据指标的相关定义和数据标准,确定核心指标相关联的各类维度数据;
维度确定模块,用于对核心指标对应的各类维度数据进行评估与预测,发现异常维度;
主要确定模块,用于对所述异常维度下的数值数据进行分析,确定主要异常维度;
异常分析模块,用于根据主要异常维度对应的主要数值数据,自动分析异常原因,生成分析结论。
优选的,所述数据挖掘模块,包括:
指标分析单元,用于获取核心指标的相关定义的关键词,并获取与所述关键词关联的目标关键词,基于所述目标关键词从全部指标中获取关联指标,并根据关联指标的相关定义,确定所述指标与关联指标之间的关联度,以及确定关联度的正相关和负相关;
数据获取单元,用于根据核心指标的数据标准,对关联指标进行指标映射,得到标准关联指标,从业务数据中获取与所述核心指标和标准关联指标相关的业务数据,并根据所述关联度对所述业务数据进行分类,得到各类维度数据。
优选的,还包括:指标确定模块,用于获取服务业务相关的核心指标;
所述指标确定模块,包括:
指标关联单元,用于获取全部指标之间的关联度,并将全部指标中与其他指标的关联范围大于预设关联范围的指标,作为第一指标;
关系确定单元,用于获取所述第一指标的关键词,将关键词按照预设的规则与各类维度数据进行匹配,得到目标维度数据,并分析所述目标维度数据对应的业务实例,根据所述业务实例中的业务关键词,确定业务实例之间的关联关系;
指标确定单元,用于基于所述关联关系,进行知识图谱的构建和核心指标的确定。
优选的,所述主要确定模块,包括:
历史分析单元,用于获取在所述异常维度下的历史异常表现数据,并确定所述历史异常表现数据对异常维度的影响程度;
决策生成单元,用于用于基于所述历史异常表现数据及其对异常维度的影响程度,对所述历史异常表现数据进行标准化,得到标准化规则,根据所述标准化规则对历史异常表现数据及其对异常维度的影响程度进行标准化,得到单一决策树;
横向分析单元,用于确定所述异常维度之间在横向上的关联特征,基于所述关联特征对所有单一决策树进行整合,得到横向决策树;
时间分析单元,用于确定在所述异常维度下,所述历史异常表现数据在时间上的变化特征,并基于所述变化特征及其对异常维度的影响,建立时间特征决策树;
综合确定单元,用于基于所有历史异常表现数据对异常维度的综合影响,对所述横向决策树和时间特征决策树进行整合,得到目标决策树;
主要维度确定单元,用于将每个异常维度下的数值数据输入所述目标决策树中,得到对应的影响值,将影响值最大对应的异常维度作为主要异常维度。
优选的,所述异常分析模块,包括:
指标分析单元,用于根据所述主要异常维度的定义,对核心指标下的维度进行分析,根据分析结果从知识图谱中得到与主要异常维度的相关维度,分析所述相关维度在对主要异常维度的贡献度;
异常计算单元,用于获取所述主要异常维度的异常值,结合所述相关维度在对主要异常维度的贡献度,计算得到主要异常维度的整体异常度;
判断所述整体异常度是否大于预设异常度;
若是,确定所述主要异常维度重度异常,并进行预警提醒;
否则,确定所述主要异常维度轻度异常,将所述主要异常维度和相关维度输入预先训练得到的原因分析模型中,得到异常原因。本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例中一种基于机器学习的指标分析方法的流程图;
图2为本发明实施例中一种基于机器学习的指标分析系统的结构图;
图3为本发明实施例中指标确定模块的结构图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
实施例1
本发明实施例提供一种基于机器学习的指标分析方法,如图1所示,包括:
S1:根据指标的相关定义和数据标准,确定核心指标相关联的各类维度数据;
S2:对核心指标对应的各类维度数据进行评估与预测,发现异常维度;
S3:对所述异常维度下的数值数据进行分析,确定主要异常维度;
S4:根据主要异常维度对应的主要数值数据,自动分析异常原因,生成分析结论。
在该实施例中,对核心指标对应的各类维度数据进行评估与预测,发现异常维度具体为将核心指标对应的各类维度数据与预先设定的维度数值进行差异比较,差异值不满足预设差异范围的作为异常维度。
上述设计方案的有益效果是:通过根据指标的定义和数据指标来挖掘得到关联的维度数据,为指标的深刻分析提供基础,通过核心指标结合维度数据进行分析,发现异常维度,然后根据与异常维度对应的相关维度,自动分析异常原因,生成分析结论,分析指标变化原因,进而发现指标背后所蕴藏的更深刻的数据洞察,帮助用户制定更精准的决策。
实施例2
基于实施例1的基础上,本发明实施例提供一种基于机器学习的指标分析方法,S1中,根据指标的相关定义和数据标准,确定核心指标相关联的各类维度数据,包括:
获取核心指标的相关定义的关键词,并获取与所述关键词关联的目标关键词,基于所述目标关键词从全部指标中获取关联指标,并根据关联指标的相关定义,确定所述指标与关联指标之间的关联度,以及确定关联度的正相关和负相关;
根据核心指标的数据标准,对关联指标进行指标映射,得到标准关联指标;
从业务数据中获取与所述核心指标和标准关联指标相关的业务数据,并根据所述关联度对所述业务数据进行分类,得到各类维度数据。
在该实施例中,所述关联度的正相关和负相关可作为后续对维度数据获取的依据。
上述设计方案的有益效果是:通过根据指标的定义和数据指标来挖掘得到关联的维度数据,为指标的深刻分析提供基础。
实施例3
基于实施例1的基础上,本发明实施例提供一种基于机器学习的指标分析方法,S1之前,还包括获取服务业务相关的核心指标,具体为:
获取全部指标之间的关联度,并将全部指标中与其他指标的关联范围大于预设关联范围的指标,作为第一指标;
获取所述第一指标的关键词,将关键词按照预设的规则与各类维度数据进行匹配,得到目标维度数据,并分析所述目标维度数据对应的业务实例,根据所述业务实例中的业务关键词,确定业务实例之间的关联关系;
基于所述关联关系,进行知识图谱的构建和核心指标的确定。
在该实施例中,基于所述关联关系,进行知识图谱的构建和核心指标的确定具体为:
基于所述关联关系,确定第一指标的自身重要度和在业务实例中的整体重要度,并基于所述整体重要度,确定第一指标在知识图谱中的位置,根据自身重要度对所述位置进行调整,得到目标位置;
将所述第一指标输入所述知识图谱对应的目标位置中,并根据其他指标与第一指标的关联度,将其他指标输入所述知识图谱对应的其他位置中,得到初始知识图谱;
分析其他指标在所述业务实例中的作用点和作用强度,对所述初始知识图谱中的其他指标进行位置调整,得到目标知识图谱;
获取所述目标知识图谱中的图谱节点,并根据服务业务对所述图谱节点进行相关标记,得到标记节点,确定所述标记节点对应的标记指标;
判断所述标记指标是否属于第一指标,若是,将所述标记指标作为核心指标;
若所述标记指标属于其他指标,判断所述标记指标与第一指标关联的关联个数和平均关联度;
若所述标记指标与第一指标关联的关联个数和平均关联度均满足预设关联要求;
若是,则将所述标记指标作为核心指标;
否则,则将所述标记指标不作为核心指标。
在该实施例中,通过对标记指标进行是否为第一指标的分析,来确定标记指标能否作为最终的核心指标,提高了核心指标确定的准确性,减少冗余性,为后续异常原因的分析提供准确地数据基础。
上述设计方案的有益效果是:通过对标记指标进行是否为第一指标的分析,来确定标记指标能否作为最终的核心指标,提高了核心指标确定的准确性,减少冗余性,为后续异常原因的分析提供准确地数据基础,通过构建知识图谱确定核心指标,便于对指标分析的精准性。
实施例4
基于实施例1的基础上,本发明实施例提供一种基于机器学习的指标分析方法,S3中,对所述异常维度下的数值数据进行分析,确定主要异常维度,包括:
获取在所述异常维度下的历史异常表现数据,并确定所述历史异常表现数据对异常维度的影响程度;
基于所述历史异常表现数据及其对异常维度的影响程度,对所述历史异常表现数据进行标准化,得到标准化规则,根据所述标准化规则对历史异常表现数据及其对异常维度的影响程度进行标准化,得到单一决策树;
确定所述异常维度之间在横向上的关联特征,基于所述关联特征对所有单一决策树进行整合,得到横向决策树;
确定在所述异常维度下,所述历史异常表现数据在时间上的变化特征,并基于所述变化特征及其对异常维度的影响,建立时间特征决策树;
基于所有历史异常表现数据对异常维度的综合影响,对所述横向决策树和时间特征决策树进行整合,得到目标决策树;
将每个异常维度下的数值数据输入所述目标决策树中,得到对应的影响值,将影响值最大对应的异常维度作为主要异常维度。
在该实施例中,决策树用于确定在不同维度下取值对应的影响值。
在该实施例中,根据所述标准化规则对历史异常表现数据及其对异常维度的影响程度进行标准化,得到单一决策树,保证在各个异常维度下决策树输出的一致性,便于直观的进行比较。
在该实施例中,横向决策树为在统一时间节点,所有数值数据对异常维度的综合影响。
在该实施例中,所述目标决策树,用于从多个异常维度存在数值异常的情况下,确定影响最大的异常维度。
上述设计方案的有益效果是:通过在横向和时间上对异常维度进行数值分析,结合历史异常数据,建立综合的目标决策树,对每个异常维度下的数值数据进行决策,确定影响值,从而确定只要异常维度,利用历史异常数据通过人工智能的方式建立目标决策树,提高确定主要异常维度的效率和保证确定出的主要异常维度的准确性,为异常原因的分析提供准确的数据基础。
实施例5
基于实施例1的基础上,本发明实施例提供一种基于机器学习的指标分析方法,根据主要异常维度对应的主要数值数据,自动分析异常原因,生成分析结论,包括:
根据所述主要异常维度的定义,对核心指标下的维度进行分析,根据分析结果从知识图谱中得到与主要异常维度的相关维度,分析所述相关维度在对主要异常维度的贡献度;
获取所述主要异常维度的异常值,结合所述相关维度在对主要异常维度的贡献度,计算得到主要异常维度的整体异常度;
其中,K表示所述主要异常维度的整体异常度,n表示所述相关维度的个数,mi表示第i个相关维度下的数值的个数,βij表示第i个相关维度下的第j个数值的贡献度,取值为(0,1),βj0表示第i个相关维度下的第j个数值的标准贡献度,取值为(0,1),δi表示第i个相关维度与主要异常维度的关联度,取值为(0,1),α表示所述主要异常维度的异常值;
判断所述整体异常度是否大于预设异常度;
若是,确定所述主要异常维度重度异常,并进行预警提醒;
否则,确定所述主要异常维度轻度异常,将所述主要异常维度和相关维度输入预先训练得到的原因分析模型中,得到异常原因。
在该实施例中,判定所述主要异常维度重度异常,并进行预警提醒,因为异常重度,单靠分析模型不能进行有效准确地分析,需要提醒工作人员进行查看,人工辅助发现异常原因。
在该实施例中,所述原因分析模型为根据历史异常的数据情况训练得到,只用于轻度异常的判断,无法进行重度异常的判断。
上述设计方案的有益效果是:通过根据主要异常维度的异常值,结合其关联维度的数值的贡献度计算得到主要异常维度的整体异常度,作为异常原因分析方式的标准,便于选择合适的方式进行异常原因的分析确定,分析指标变化原因,进而发现指标背后所蕴藏的更深刻的数据洞察,帮助用户制定更精准的决策。
实施例6
本发明实施例提供一种基于机器学习的指标分析系统,如图2所示,包括:
数据挖掘模块,用于根据指标的相关定义和数据标准,确定核心指标相关联的各类维度数据;
维度确定模块,用于对核心指标对应的各类维度数据进行评估与预测,发现异常维度;
主要确定模块,用于对所述异常维度下的数值数据进行分析,确定主要异常维度;
异常分析模块,用于根据主要异常维度对应的主要数值数据,自动分析异常原因,生成分析结论。
上述设计方案的有益效果是:通过根据指标的定义和数据指标来挖掘得到关联的维度数据,为指标的深刻分析提供基础,通过核心指标结合维度数据进行分析,发现异常维度,然后根据与异常维度对应的相关维度,自动分析异常原因,生成分析结论,分析指标变化原因,进而发现指标背后所蕴藏的更深刻的数据洞察,帮助用户制定更精准的决策。
实施例7
基于实施例6的基础上,本发明实施例提供一种基于机器学习的指标分析系统,所述数据挖掘模块,包括:
指标分析单元,用于获取核心指标的相关定义的关键词,并获取与所述关键词关联的目标关键词,基于所述目标关键词从全部指标中获取关联指标,并根据关联指标的相关定义,确定所述指标与关联指标之间的关联度,以及确定关联度的正相关和负相关;
数据获取单元,用于根据核心指标的数据标准,对关联指标进行指标映射,得到标准关联指标,从业务数据中获取与所述核心指标和标准关联指标相关的业务数据,并根据所述关联度对所述业务数据进行分类,得到各类维度数据。
在该实施例中,所述关联度的正相关和负相关可作为后续对维度数据获取的依据。
上述设计方案的有益效果是:通过根据指标的定义和数据指标来挖掘得到关联的维度数据,为指标的深刻分析提供基础。
实施例8
基于实施例6的基础上,本发明实施例提供一种基于机器学习的指标分析系统,如图3所示,还包括:指标确定模块,用于获取服务业务相关的核心指标;
所述指标确定模块,包括:
指标关联单元,用于获取全部指标之间的关联度,并将全部指标中与其他指标的关联范围大于预设关联范围的指标,作为第一指标;
关系确定单元,用于获取所述第一指标的关键词,将关键词按照预设的规则与各类维度数据进行匹配,得到目标维度数据,并分析所述目标维度数据对应的业务实例,根据所述业务实例中的业务关键词,确定业务实例之间的关联关系;
指标确定单元,用于基于所述关联关系,进行知识图谱的构建和核心指标的确定。
在该实施例中,所述指标确定单元,包括:
位置确定单元,用于基于所述关联关系,确定第一指标的自身重要度和在业务实例中的整体重要度,并基于所述整体重要度,确定第一指标在知识图谱中的位置,根据自身重要度对所述位置进行调整,得到目标位置;
图谱获取单元,用于将所述第一指标输入所述知识图谱对应的目标位置中,并根据其他指标与第一指标的关联度,将其他指标输入所述知识图谱对应的其他位置中,得到初始知识图谱;
图谱调整单元,用于分析其他指标在所述业务实例中的作用点和作用强度,对所述初始知识图谱中的其他指标进行位置调整,得到目标知识图谱;
节点标记单元,用于获取所述目标知识图谱中的图谱节点,并根据服务业务对所述图谱节点进行相关标记,得到标记节点,确定所述标记节点对应的标记指标;
判断单元,用于判断所述标记指标是否属于第一指标,若是,将所述标记指标作为核心指标;
若所述标记指标属于其他指标,判断所述标记指标与第一指标关联的关联个数和平均关联度;
若所述标记指标与第一指标关联的关联个数和平均关联度均满足预设关联要求;
若是,则将所述标记指标作为核心指标;
否则,则将所述标记指标不作为核心指标。
在该实施例中,通过对标记指标进行是否为第一指标的分析,来确定标记指标能否作为最终的核心指标,提高了核心指标确定的准确性,减少冗余性,为后续异常原因的分析提供准确地数据基础。
上述设计方案的有益效果是:通过对标记指标进行是否为第一指标的分析,来确定标记指标能否作为最终的核心指标,提高了核心指标确定的准确性,减少冗余性,为后续异常原因的分析提供准确地数据基础,通过构建知识图谱确定核心指标,便于对指标分析的精准性。
实施例9
基于实施例6的基础上,本发明实施例提供一种基于机器学习的指标分析系统,所述主要确定模块,包括:
历史分析单元,用于获取在所述异常维度下的历史异常表现数据,并确定所述历史异常表现数据对异常维度的影响程度;
决策生成单元,用于用于基于所述历史异常表现数据及其对异常维度的影响程度,对所述历史异常表现数据进行标准化,得到标准化规则,根据所述标准化规则对历史异常表现数据及其对异常维度的影响程度进行标准化,得到单一决策树;
横向分析单元,用于确定所述异常维度之间在横向上的关联特征,基于所述关联特征对所有单一决策树进行整合,得到横向决策树;
时间分析单元,用于确定在所述异常维度下,所述历史异常表现数据在时间上的变化特征,并基于所述变化特征及其对异常维度的影响,建立时间特征决策树;
综合确定单元,用于基于所有历史异常表现数据对异常维度的综合影响,对所述横向决策树和时间特征决策树进行整合,得到目标决策树;
主要维度确定单元,用于将每个异常维度下的数值数据输入所述目标决策树中,得到对应的影响值,将影响值最大对应的异常维度作为主要异常维度。
在该实施例中,决策树用于确定在不同维度下取值对应的影响值。
在该实施例中,根据所述标准化规则对历史异常表现数据及其对异常维度的影响程度进行标准化,得到单一决策树,保证在各个异常维度下决策树输出的一致性,便于直观的进行比较。
在该实施例中,横向决策树为在统一时间节点,所有数值数据对异常维度的综合影响。
在该实施例中,所述目标决策树,用于从多个异常维度存在数值异常的情况下,确定影响最大的异常维度。
上述设计方案的有益效果是:通过在横向和时间上对异常维度进行数值分析,结合历史异常数据,建立综合的目标决策树,对每个异常维度下的数值数据进行决策,确定影响值,从而确定只要异常维度,利用历史异常数据通过人工智能的方式建立目标决策树,提高确定主要异常维度的效率和保证确定出的主要异常维度的准确性,为异常原因的分析提供准确的数据基础。实施例10
基于实施例6的基础上,本发明实施例提供一种基于机器学习的指标分析系统,所述异常分析模块,包括:
指标分析单元,用于根据所述主要异常维度的定义,对核心指标下的维度进行分析,根据分析结果从知识图谱中得到与主要异常维度的相关维度,分析所述相关维度在对主要异常维度的贡献度;
异常计算单元,用于获取所述主要异常维度的异常值,结合所述相关维度在对主要异常维度的贡献度,计算得到主要异常维度的整体异常度;
其中,K表示所述主要异常维度的整体异常度,n表示所述相关维度的个数,mi表示第i个相关维度下的数值的个数,βij表示第i个相关维度下的第j个数值的贡献度,取值为(0,1),βj0表示第i个相关维度下的第j个数值的标准贡献度,取值为(0,1),δi表示第i个相关维度与主要异常维度的关联度,取值为(0,1),α表示所述主要异常维度的异常值;
判断所述整体异常度是否大于预设异常度;
若是,确定所述主要异常维度重度异常,并进行预警提醒;
否则,确定所述主要异常维度轻度异常,将所述主要异常维度和相关维度输入预先训练得到的原因分析模型中,得到异常原因。
在该实施例中,判定所述主要异常维度重度异常,并进行预警提醒,因为异常重度,单靠分析模型不能进行有效准确地分析,需要提醒工作人员进行查看,人工辅助发现异常原因。
在该实施例中,所述原因分析模型为根据历史异常的数据情况训练得到,只用于轻度异常的判断,无法进行重度异常的判断。
上述设计方案的有益效果是:通过根据主要异常维度的异常值,结合其关联维度的数值的贡献度计算得到主要异常维度的整体异常度,作为异常原因分析方式的标准,便于选择合适的方式进行异常原因的分析确定,分析指标变化原因,进而发现指标背后所蕴藏的更深刻的数据洞察,帮助用户制定更精准的决策。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (6)
1.一种基于机器学习的指标分析方法,其特征在于,包括:
S1:根据指标的相关定义和数据标准,确定核心指标相关联的各类维度数据;
S2:对核心指标对应的各类维度数据进行评估与预测,发现异常维度;
S3:对所述异常维度下的数值数据进行分析,确定主要异常维度;
S4:根据主要异常维度对应的主要数值数据,自动分析异常原因,生成分析结论;
S1之前,还包括获取服务业务相关的核心指标,具体为:
获取全部指标之间的关联度,并将全部指标中与其他指标的关联范围大于预设关联范围的指标,作为第一指标;
获取所述第一指标的关键词,将关键词按照预设的规则与各类维度数据进行匹配,得到目标维度数据,并分析所述目标维度数据对应的业务实例,根据所述业务实例中的业务关键词,确定业务实例之间的关联关系;
基于所述关联关系,确定第一指标的自身重要度和在业务实例中的整体重要度,并基于所述整体重要度,确定第一指标在知识图谱中的位置,根据自身重要度对所述位置进行调整,得到目标位置;
将所述第一指标输入所述知识图谱对应的目标位置中,并根据其他指标与第一指标的关联度,将其他指标输入所述知识图谱对应的其他位置中,得到初始知识图谱;
分析其他指标在所述业务实例中的作用点和作用强度,对所述初始知识图谱中的其他指标进行位置调整,得到目标知识图谱;
获取所述目标知识图谱中的图谱节点,并根据服务业务对所述图谱节点进行相关标记,得到标记节点,确定所述标记节点对应的标记指标;
判断所述标记指标是否属于第一指标,若是,将所述标记指标作为核心指标;
若所述标记指标属于其他指标,判断所述标记指标与第一指标关联的关联个数和平均关联度;
若所述标记指标与第一指标关联的关联个数和平均关联度均满足预设关联要求;
若是,则将所述标记指标作为核心指标;
否则,则将所述标记指标不作为核心指标;
S3中,对所述异常维度下的数值数据进行分析,确定主要异常维度,包括:
获取在所述异常维度下的历史异常表现数据,并确定所述历史异常表现数据对异常维度的影响程度;
基于所述历史异常表现数据及其对异常维度的影响程度,对所述历史异常表现数据进行标准化,得到标准化规则,根据所述标准化规则对历史异常表现数据及其对异常维度的影响程度进行标准化,得到单一决策树;
确定所述异常维度之间在横向上的关联特征,基于所述关联特征对所有单一决策树进行整合,得到横向决策树;
确定在所述异常维度下,所述历史异常表现数据在时间上的变化特征,并基于所述变化特征及其对异常维度的影响,建立时间特征决策树;
基于所有历史异常表现数据对异常维度的综合影响,对所述横向决策树和时间特征决策树进行整合,得到目标决策树;
将每个异常维度下的数值数据输入所述目标决策树中,得到对应的影响值,将影响值最大对应的异常维度作为主要异常维度。
2.根据权利要求1所述的一种基于机器学习的指标分析方法,其特征在于,S1中,根据指标的相关定义和数据标准,确定核心指标相关联的各类维度数据,包括:
获取核心指标的相关定义的关键词,并获取与所述关键词关联的目标关键词,基于所述目标关键词从全部指标中获取关联指标,并根据关联指标的相关定义,确定所述指标与关联指标之间的关联度,以及确定关联度的正相关和负相关;
根据核心指标的数据标准,对关联指标进行指标映射,得到标准关联指标;
从业务数据中获取与所述核心指标和标准关联指标相关的业务数据,并根据所述关联度对所述业务数据进行分类,得到各类维度数据。
3.根据权利要求1所述的一种基于机器学习的指标分析方法,其特征在于,S4中,根据主要异常维度对应的主要数值数据,自动分析异常原因,生成分析结论,包括:
根据所述主要异常维度的定义,对核心指标下的维度进行分析,根据分析结果从知识图谱中得到与主要异常维度的相关维度,分析所述相关维度在对主要异常维度的贡献度;
获取所述主要异常维度的异常值,结合所述相关维度在对主要异常维度的贡献度,计算得到主要异常维度的整体异常度;
判断所述整体异常度是否大于预设异常度;
若是,确定所述主要异常维度重度异常,并进行预警提醒;
否则,确定所述主要异常维度轻度异常,将所述主要异常维度和相关维度输入预先训练得到的原因分析模型中,得到异常原因。
4.一种基于机器学习的指标分析系统,其特征在于,包括:
数据挖掘模块,用于根据指标的相关定义和数据标准,确定核心指标相关联的各类维度数据;
维度确定模块,用于对核心指标对应的各类维度数据进行评估与预测,发现异常维度;
主要确定模块,用于对所述异常维度下的数值数据进行分析,确定主要异常维度;
异常分析模块,用于根据主要异常维度对应的主要数值数据,自动分析异常原因,生成分析结论;
还包括:指标确定模块,用于获取服务业务相关的核心指标;
所述指标确定模块,包括:
指标关联单元,用于获取全部指标之间的关联度,并将全部指标中与其他指标的关联范围大于预设关联范围的指标,作为第一指标;
关系确定单元,用于获取所述第一指标的关键词,将关键词按照预设的规则与各类维度数据进行匹配,得到目标维度数据,并分析所述目标维度数据对应的业务实例,根据所述业务实例中的业务关键词,确定业务实例之间的关联关系;
指标确定单元,用于基于所述关联关系,确定第一指标的自身重要度和在业务实例中的整体重要度,并基于所述整体重要度,确定第一指标在知识图谱中的位置,根据自身重要度对所述位置进行调整,得到目标位置;
将所述第一指标输入所述知识图谱对应的目标位置中,并根据其他指标与第一指标的关联度,将其他指标输入所述知识图谱对应的其他位置中,得到初始知识图谱;
分析其他指标在所述业务实例中的作用点和作用强度,对所述初始知识图谱中的其他指标进行位置调整,得到目标知识图谱;
获取所述目标知识图谱中的图谱节点,并根据服务业务对所述图谱节点进行相关标记,得到标记节点,确定所述标记节点对应的标记指标;
判断所述标记指标是否属于第一指标,若是,将所述标记指标作为核心指标;
若所述标记指标属于其他指标,判断所述标记指标与第一指标关联的关联个数和平均关联度;
若所述标记指标与第一指标关联的关联个数和平均关联度均满足预设关联要求;
若是,则将所述标记指标作为核心指标;
否则,则将所述标记指标不作为核心指标;
所述主要确定模块,包括:
历史分析单元,用于获取在所述异常维度下的历史异常表现数据,并确定所述历史异常表现数据对异常维度的影响程度;
决策生成单元,用于用于基于所述历史异常表现数据及其对异常维度的影响程度,对所述历史异常表现数据进行标准化,得到标准化规则,根据所述标准化规则对历史异常表现数据及其对异常维度的影响程度进行标准化,得到单一决策树;
横向分析单元,用于确定所述异常维度之间在横向上的关联特征,基于所述关联特征对所有单一决策树进行整合,得到横向决策树;
时间分析单元,用于确定在所述异常维度下,所述历史异常表现数据在时间上的变化特征,并基于所述变化特征及其对异常维度的影响,建立时间特征决策树;
综合确定单元,用于基于所有历史异常表现数据对异常维度的综合影响,对所述横向决策树和时间特征决策树进行整合,得到目标决策树;
主要维度确定单元,用于将每个异常维度下的数值数据输入所述目标决策树中,得到对应的影响值,将影响值最大对应的异常维度作为主要异常维度。
5.根据权利要求4所述的一种基于机器学习的指标分析系统,其特征在于,所述数据挖掘模块,包括:
指标分析单元,用于获取核心指标的相关定义的关键词,并获取与所述关键词关联的目标关键词,基于所述目标关键词从全部指标中获取关联指标,并根据关联指标的相关定义,确定所述指标与关联指标之间的关联度,以及确定关联度的正相关和负相关;
数据获取单元,用于根据核心指标的数据标准,对关联指标进行指标映射,得到标准关联指标,从业务数据中获取与所述核心指标和标准关联指标相关的业务数据,并根据所述关联度对所述业务数据进行分类,得到各类维度数据。
6.根据权利要求4所述的一种基于机器学习的指标分析系统,其特征在于,所述异常分析模块,包括:
指标分析单元,用于根据所述主要异常维度的定义,对核心指标下的维度进行分析,根据分析结果从知识图谱中得到与主要异常维度的相关维度,分析所述相关维度在对主要异常维度的贡献度;
异常计算单元,用于获取所述主要异常维度的异常值,结合所述相关维度在对主要异常维度的贡献度,计算得到主要异常维度的整体异常度;
判断所述整体异常度是否大于预设异常度;
若是,确定所述主要异常维度重度异常,并进行预警提醒;
否则,确定所述主要异常维度轻度异常,将所述主要异常维度和相关维度输入预先训练得到的原因分析模型中,得到异常原因。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310066421.3A CN116227995B (zh) | 2023-02-06 | 2023-02-06 | 一种基于机器学习的指标分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310066421.3A CN116227995B (zh) | 2023-02-06 | 2023-02-06 | 一种基于机器学习的指标分析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116227995A CN116227995A (zh) | 2023-06-06 |
CN116227995B true CN116227995B (zh) | 2023-09-12 |
Family
ID=86574285
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310066421.3A Active CN116227995B (zh) | 2023-02-06 | 2023-02-06 | 一种基于机器学习的指标分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116227995B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108683530A (zh) * | 2018-04-28 | 2018-10-19 | 北京百度网讯科技有限公司 | 多维度数据的数据分析方法、装置及存储介质 |
CN110163457A (zh) * | 2018-02-14 | 2019-08-23 | 北京京东尚科信息技术有限公司 | 一种业务指标的异常定位方法和装置 |
WO2020044568A1 (ja) * | 2018-08-31 | 2020-03-05 | ヤマハ発動機株式会社 | メンテナンス要求指標データ出力装置及びメンテナンス要求指標データ出力方法 |
CN115018106A (zh) * | 2021-03-04 | 2022-09-06 | 腾讯科技(深圳)有限公司 | 异常分析方法、装置、设备及计算机可读存储介质 |
CN115641019A (zh) * | 2022-10-12 | 2023-01-24 | 上海浦东发展银行股份有限公司 | 指标异常分析方法、装置、计算机设备和存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8140383B2 (en) * | 2007-12-17 | 2012-03-20 | Sap Ag | Derived and automated key performance indicator reports |
-
2023
- 2023-02-06 CN CN202310066421.3A patent/CN116227995B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110163457A (zh) * | 2018-02-14 | 2019-08-23 | 北京京东尚科信息技术有限公司 | 一种业务指标的异常定位方法和装置 |
CN108683530A (zh) * | 2018-04-28 | 2018-10-19 | 北京百度网讯科技有限公司 | 多维度数据的数据分析方法、装置及存储介质 |
WO2020044568A1 (ja) * | 2018-08-31 | 2020-03-05 | ヤマハ発動機株式会社 | メンテナンス要求指標データ出力装置及びメンテナンス要求指標データ出力方法 |
CN115018106A (zh) * | 2021-03-04 | 2022-09-06 | 腾讯科技(深圳)有限公司 | 异常分析方法、装置、设备及计算机可读存储介质 |
CN115641019A (zh) * | 2022-10-12 | 2023-01-24 | 上海浦东发展银行股份有限公司 | 指标异常分析方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
信息系统的数据库指标多维度异常发现算法分析;郝成亮;电脑知识与技术;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116227995A (zh) | 2023-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107633265B (zh) | 用于优化信用评估模型的数据处理方法及装置 | |
Rufo et al. | Log-linear pool to combine prior distributions: A suggestion for a calibration-based approach | |
CN111046930A (zh) | 一种基于决策树算法的供电服务满意度影响因素识别方法 | |
CN116485020B (zh) | 一种基于大数据的供应链风险识别预警方法、系统及介质 | |
CN115729761B (zh) | 一种硬盘故障预测方法、系统、设备及介质 | |
CN115543973B (zh) | 一种基于知识谱图与机器学习的数据质量规则推荐方法 | |
CN114266289A (zh) | 一种复杂装备健康状态评估方法 | |
CN113487223B (zh) | 一种基于信息融合的风险评估方法和评估系统 | |
CN117763316A (zh) | 一种基于机器学习的高维数据降维方法及降维系统 | |
CN118035757A (zh) | 一种基于大语言模型的电驱总成故障诊断方法及装置 | |
CN116542380B (zh) | 基于自然语言的电厂供应链碳足迹优化方法及装置 | |
CN116227995B (zh) | 一种基于机器学习的指标分析方法及系统 | |
CN116956089A (zh) | 电器设备温度异常检测模型训练方法以及检测方法 | |
CN116955648B (zh) | 一种基于非隐私数据关联的知识图谱分析方法 | |
CN118211171B (zh) | 一种基于知识图谱的目标路径挖掘方法 | |
CN117171778B (zh) | 一种数据库的访问流量控制方法及系统 | |
CN117539920B (zh) | 基于房产交易多维度数据的数据查询方法及系统 | |
CN117933832B (zh) | 航天器地面等效性试验的指标权重评估方法 | |
CN118656676A (zh) | 应用于大数据系统的数据质量管理方法及系统 | |
Enck | On the Monitoring and Prediction of US Business Cycles using Statistical Process Monitoring | |
CN118861590A (zh) | 一种基于输变电设备使用寿命的供电预测方法及系统 | |
Baptista et al. | Revision and implementation of metrics to evaluate the performance of prognostics models | |
CN118917390A (zh) | 基于知识大模型的服务知识库管理系统及方法 | |
CN114943424A (zh) | 一种企业经营指标关系生成方法及系统 | |
CN118071006A (zh) | 一种装备体系能力需求满足度评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |