CN110059126A - 基于lkj异常值数据的复杂关联网络分析方法及系统 - Google Patents
基于lkj异常值数据的复杂关联网络分析方法及系统 Download PDFInfo
- Publication number
- CN110059126A CN110059126A CN201910338513.6A CN201910338513A CN110059126A CN 110059126 A CN110059126 A CN 110059126A CN 201910338513 A CN201910338513 A CN 201910338513A CN 110059126 A CN110059126 A CN 110059126A
- Authority
- CN
- China
- Prior art keywords
- task
- data
- variable
- model
- lkj
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000003012 network analysis Methods 0.000 title claims abstract description 24
- 230000002159 abnormal effect Effects 0.000 claims abstract description 73
- 238000010276 construction Methods 0.000 claims description 31
- 238000003860 storage Methods 0.000 claims description 20
- 239000011159 matrix material Substances 0.000 claims description 14
- 238000000605 extraction Methods 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 8
- 238000004321 preservation Methods 0.000 claims description 7
- 230000009467 reduction Effects 0.000 claims description 7
- 230000009471 action Effects 0.000 claims description 6
- 239000003086 colorant Substances 0.000 claims description 6
- 238000007418 data mining Methods 0.000 claims description 6
- 235000013399 edible fruits Nutrition 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 6
- 238000000540 analysis of variance Methods 0.000 claims description 5
- 230000001186 cumulative effect Effects 0.000 claims description 5
- 238000010219 correlation analysis Methods 0.000 claims description 4
- 238000011017 operating method Methods 0.000 claims description 4
- 238000013480 data collection Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 2
- 238000012098 association analyses Methods 0.000 abstract description 8
- 238000003745 diagnosis Methods 0.000 abstract description 6
- 238000010224 classification analysis Methods 0.000 abstract description 2
- 241001269238 Data Species 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 3
- 239000013589 supplement Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B61—RAILWAYS
- B61L—GUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
- B61L27/00—Central railway traffic control systems; Trackside control; Communication systems specially adapted therefor
- B61L27/20—Trackside control of safe travel of vehicle or train, e.g. braking curve calculation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/258—Data format conversion from or to a database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Fuzzy Systems (AREA)
- Tourism & Hospitality (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Mechanical Engineering (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于LKJ异常值数据的复杂关联网络分析方法及系统,为LKJ故障诊断和关联分析提高了效率和可信度。其技术方案为:模型由一定数量的节点和节点之间的连边所共同组成,用来描述现实生活中事物之间的相互联系,对于不同标志下异常值进行综合和分类分析研究,从而实现设备故障关联分析。基于模型建立的系统和方法用于分析不同LKJ异常特性数据之间的关联关系及集聚程度,实现LKJ设备故障诊断的关联分析,能及时发现LKJ设备异常或故障,对设备故障进行及时处理,避免LKJ设备带病运行。
Description
技术领域
本发明涉及一种针对LKJ(列车运行控制装置)设备异常或故障的关联分析,具体涉及基于LKJ设备异常值数据的复杂关联网络模型的分析方法和系统。
背景技术
列车运行控制装置(LKJ)是列车运行中的重要设备之一,保障了铁路行车安全和支撑了铁路相关技术发展,LKJ设备状态的好坏决定了列车运行过程中的安全性与稳定性。随着LKJ设备二十多年的推广和应用,LKJ设备插件及原器件不断地升级和换代,LKJ设备质量有所下降,LKJ设备出现部分微小异常,后续可能会导致LKJ设备故障,影响LKJ设备或列车的正常运行,严重时可能引发列车事故。
如何利用LKJ运行记录数据,通过大数据挖掘技术实现设备故障关联探索,及时发现LKJ潜在故障隐患,避免LKJ带病运行,是目前亟待解决的问题。
发明内容
以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。
本发明的目的在于解决上述问题,提供了一种基于LKJ异常值数据的复杂关联网络分析方法及系统,为LKJ故障诊断和关联分析提高了效率和可信度,它不仅能对设备故障关联信息进行智能挖掘,还能帮助设备故障诊断业务专家或维修人员及时对设备进行诊断,正确地加以维修,以减少维修时间,提前排除设备隐患,为LKJ设备状态修提供有效手段,具有较高研究价值和实际意义。
本发明的技术方案为:本发明揭示了一种基于LKJ异常值数据的复杂关联网络分析方法,包括模型构建任务流和模型应用任务流两方面的处理,其中:
模型构建任务流的运行步骤为:
第一步,开启模型构建任务,利用历史运行文件数据传入数据预提取任务中,汇总所有异常变量数据;
第二步,开启数据规整、特征补充任务,通过数据挖掘中的特征提取、特征补充,将数据预提取任务的保存结果进行数据规整,并基于数据规整结果判断当前任务是模型构建任务还是模型应用任务,若为模型构建任务则继续后续模型构建任务流,若为模型应用任务则转至模型应用任务流中处理;
第三步,进入特征降维任务,输出为降维后的建模数据集;
第四步,进入异常变量关联复杂网络构建任务,异常变量关联复杂网络模型的结果经评估后若模型不满足要求则重新返回第二步的执行流程,若模型满足要求则将异常变量关联复杂网络模型的结果保存;
第五步,传入异常变量关联复杂网络保存结果,进入异常变量因子提取任务,得到异常变量因子提取结果;
第六步,传入异常变量因子提取结果,进入异常类别复杂网络构建任务,并保存异常类别复杂网络结果,至此模型构建任务流结束。
模型应用任务流的运行步骤为:
第一步,开启模型应用任务,利用当前LKJ运行记录文件传入数据预提取任务中,汇总所有异常变量数据;
第二步,开启数据规整、特征补充任务,通过数据挖掘中的特征提取、特征补充,将数据预提取任务的保存结果进行数据规整,并基于数据规整结果判断当前任务是模型构建任务还是模型应用任务,若为模型应用任务则继续后续模型应用任务流,若为模型构建任务则转至模型构建任务流中处理;
第三步,系统中是否存在模型结果参数,如不存在则退出流程,若存在则进入异常变量复杂网络应用任务,输入第二步的任务执行结果,同时传入模型构建任务流中的异常变量复杂网络结果参数,任务最终结果进入到数据保存环节,将异常变量复杂网络应用结果加以保存;
第四步,传入异常变量复杂网络应用任务的结果,进入异常类别复杂网络应用任务,任务最终结果进入数据保存环节中,将异常类别复杂网络应用结果加以保存。
根据本发明的基于LKJ异常值数据的复杂关联网络分析方法的一实施例,在模型构建任务/模型应用任务流的第一步中,数据预提取任务包括以下子任务:
进入异常模式库匹配任务,然后判断历史数据中是否存在异常,如果存在则输出保存,其中模式库中的模式包括异常模式、频繁模式、通用模式、已有规则;
进入滑动窗口连续变量突变阈值库匹配任务,然后判断历史数据中是否存在异常,如果存在则输出保存,其中变量包括LKJ速度、管压、缸压、电流;
进入连续变量相关系数阈值库匹配任务,然后判断历史数据中是否存在异常,如果存在则输出保存,其中变量包括LKJ速度、管压、缸压、电流;
提取异常当前线路位置以及包括LKJ速度、管压、缸压、电流在内的故障状态数据,然后输出保存;
上述输出保存的数据进入异常变量数据汇总任务,汇总所有异常变量数据。
根据本发明的基于LKJ异常值数据的复杂关联网络分析方法的一实施例,在模型构建任务的第四步中,异常变量关联复杂网络构建任务的处理步骤如下:
步骤1:收集整理异常拦截数据,对数据进行结构化整理;
步骤2:对步骤1中的异常拦截后的变量,计算异常拦截后的各变量的相关系数;
步骤3:基于步骤1计算得到的变量间相关系数,建立变量关联网络,其中,节点为异常拦截后的变量,相关系数衡量节点之间的紧密程度,相关系数强,则相关线条粗,反之,相关线条细;
步骤4:进行异常变量关联复杂网络模型关键节点探索与网络模型优化。
根据本发明的基于LKJ异常值数据的复杂关联网络分析方法的一实施例,异常变量关联复杂网络构建任务的步骤4中的探索与优化处理包括:
删除相关系数小于一设定值的关联;
网络模型中连接边的粗细用相关系数表示;
将连接边数大于等于一设定值的节点用不同颜色突出表示。
根据本发明的基于LKJ异常值数据的复杂关联网络分析方法的一实施例,在模型构建任务的第五步中,异常变量因子提取的具体步骤如下:
步骤1:将原始数据标准化,以消除变量间在数量级和量纲上的不同;
步骤2:求标准化数据的相关矩阵;
步骤3:求相关矩阵的特征值和特征向量;
步骤4:计算方差贡献率与累积方差贡献率;
步骤5:对于多个异常变量因子,在前若干个因子所包含的累积方差贡献率不低于一阈值时,提取该若干个异常变量因子,以反应原评价指标。
根据本发明的基于LKJ异常值数据的复杂关联网络分析方法的一实施例,在模型构建任务的第六步中,异常类别复杂网络构建任务的具体步骤如下:
步骤1:收集整理异常拦截数据,对数据进行结构化整理;
步骤2:对异常拦截变量进行分类整理:当前分类采用因子分析根据样本数据进行的分类,后续根据运行数据进行学习修正分类结果;
步骤3:计算第2步中分类的各类变量的典型相关系数,采用典型相关分析中第一对典型相关系数衡量类别之间的关联性;
步骤4:基于步骤3中的异常类别间的典型相关系数,建立异常类别关联复杂网络模型;
步骤5:异常类别关联复杂网络模型关键节点探索与网络模型优化。
根据本发明的基于LKJ异常值数据的复杂关联网络分析方法的一实施例,异常类别复杂网络构建任务中的步骤5进一步包括:
删除典型相关系数小于一设定值的关联;
网络模型中连接边的粗细用相关系数表示;
将连接边数大于等于一设定值的节点用不同颜色突出表示。
根据本发明的基于LKJ异常值数据的复杂关联网络分析方法的一实施例,模型应用任务流的第四步的异常类别复杂网络应用任务的处理如下:
异常类别关联复杂关系网络模型应用调用异常类别关联复杂关系网络模型中的参数,对新拦截的异常变量进行异常类别匹配,识别并获取其关联节点、关联关键节点信息,以得到任务最终结果。
本发明还揭示了一种基于LKJ异常值数据的复杂关联网络分析系统,包括:
处理器;以及
存储器,所述存储器被配置为存储一系列计算机可执行的指令以及与所述一系列计算机可执行的指令相关联的计算机可访问的数据,
其中,当所述一系列计算机可执行的指令被所述处理器执行时,使得所述处理器进行如上所述的方法。
本发明还揭示了一种非临时性计算机可读存储介质,所述非临时性计算机可读存储介质上存储有一系列计算机可执行的指令,当所述一系列可执行的指令被计算装置执行时,使得计算装置进行如前述的方法。
本发明对比现有技术有如下的有益效果:本发明分析方法和系统所依赖的模型由一定数量的节点和节点之间的连边所共同组成,用来描述现实生活中事物之间的相互联系,对于不同标志下异常值进行综合和分类分析研究,从而实现设备故障关联分析。基于模型建立的系统和方法用于分析不同LKJ异常特性数据之间的关联关系及集聚程度,实现LKJ设备故障诊断的关联分析,能及时发现LKJ设备异常或故障,对设备故障进行及时处理,避免LKJ设备带病运行,使列车运行过程中的安全性与稳定性得到有效保障。
附图说明
在结合以下附图阅读本公开的实施例的详细描述之后,能够更好地理解本发明的上述特征和优点。在附图中,各组件不一定是按比例绘制,并且具有类似的相关特性或特征的组件可能具有相同或相近的附图标记。
图1示出了本发明的基于LKJ异常值数据的复杂关联网络分析方法的一实施的流程图。
具体实施方式
以下结合附图和具体实施例对本发明作详细描述。注意,以下结合附图和具体实施例描述的诸方面仅是示例性的,而不应被理解为对本发明的保护范围进行任何限制。
图1示出了本发明的基于LKJ异常值数据的复杂关联网络分析方法的一实施的流程。请参见图1,下面是对本实施例的方法的实施步骤的详细描述。
首先,定时调度任务设定为两种类型的任务,一种类型是模型构建任务,定时运行初始值为每月一次;另一种类型是模型应用任务,定时运行初始值为每日一次。以下就两种类型的任务分别进行说明。
一、定时调度任务一:模型构建任务
第一步,开启模型构建任务,利用历史运行文件数据(半年或一年)传入数据预提取任务中。数据预提取任务包括如下子任务:
(1)进入异常模式库(模式库中的模式包括异常模式、频繁模式、通用模式、已有规则等)匹配任务,然后判断历史数据中是否存在异常,如果存在则输出保存;
(2)进入滑动窗口连续变量(变量包括LKJ速度、管压、缸压、电流)突变阈值库匹配任务,然后判断历史数据中是否存在异常,如果存在则输出保存;
(3)进入连续变量(变量包括LKJ速度、管压、缸压、电流)相关系数阈值库匹配任务,然后判断历史数据中是否存在异常,如果存在则输出保存;
(4)提取异常当前线路位置、LKJ速度、管压、缸压、电流等故障状态数据,然后输出保存;
(5)上述(1)~(4)步骤输出数据进入异常变量数据汇总任务,然后汇总所有异常变量数据。
第二步,开启数据规整、特征补充任务,输入为第一步的数据预提取任务最后保存结果,通过数据挖掘中的特征提取、特征补充等方法,实现数据的规整;输出为数据规整后的数据表。输出结果进入判断,如果判断结果为模型构建任务,则进入模型构建任务流,如果判断结果为模型应用任务,则进入模型应用任务流。以下步骤以进入模型构建任务流的流程走向进行说明。
第三,进入特征降维任务,输出为降维后的建模数据集。
第四,进入异常变量复杂网络构建任务,异常变量关联复杂网络模型的模型步骤如下:
(1)收集整理异常拦截数据,对数据进行结构化整理。
(2)对(1)中的异常拦截后的变量,计算异常拦截后的各变量的相关系数。
(3)基于变量间相关系数,建立变量关联网络。其中,节点为异常拦截后的变量,相关系数衡量节点之间的紧密程度,相关系数强,则相关线条粗,反之,相关线条细。
(4)异常变量关联复杂网络模型的关键节点探索与网络模型优化,具体处理如下。
(a)删除相关系数较小的关联,具体根据更多运行数据进行学习修正。当前删除的是相关系数小于等于0.3的关联。
(b)网络模型中连接边的粗细用相关系数表示。
(c)将连接边数大于等于5(具体需根据运行数据的增多进行学习调整)的节点用不同颜色突出表示。
异常变量关联复杂网络模型的结果经过评估环节,如模型不满足要求,则重新返回第二步的执行流程;如模型满足要求,则进入后续的结果保存环节:将异常变量复杂网络结果保存。
第五步,传入异常变量复杂网络保存结果,进入异常变量因子提取任务,异常变量因子提取的具体步骤如下:
(1)将原始数据标准化,以消除变量间在数量级和量纲上的不同。
其中,X代表原始数据中所有变量集合,下标i代表第i个变量,用Xi表示。xi代表Xi具体样本的真实值,E(Xi)代表Xi所有样本的均值,Var(Xi)代表Xi的所有样本的方差。
(2)求标准化数据的相关矩阵。相关矩阵也叫相关系数矩阵,是由矩阵各列间的相关系数构成的,其计算的是不同变量之间的相关系数。即相关矩阵第i行第j列的元素是原矩阵第i列和第j列的相关系数。
(3)求相关矩阵的特征值和特征向量。设A是n阶方阵,如果存在数m和非零n维列向量x,使得Ax=mx成立,则称m是矩阵A的一个特征值(characteristic value)或本征值(eigenvalue)。非零n维列向量x称为矩阵A的属于(对应于)特征值m的特征向量或本征向量,简称A的特征向量或A的本征向量。
(4)计算方差贡献率与累积方差贡献率。首先,样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;样本方差的算术平方根叫做样本标准差。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。计算方差贡献率则是不同变量方差在所考察的随机变量的总方差中所占的比例。累计方差贡献率则是指贡献率的波动情况的累计。
(5)确定因子:设F1,F2,…,Fp为p个因子,其中前m个因子包含的数据信息总量(即其累积贡献率)不低于80%时,可取前m个因子来反应原评价指标。
第六步,传入异常变量因子提取结果,进入异常类别复杂网络构建任务,具体步骤如下:
(1)收集整理异常拦截数据,对数据进行结构化整理。
(2)对异常拦截变量进行分类整理。当前分类,采用因子分析根据样本数据进行的分类。后续需根据更多运行数据进行学习修正分类结果。
(3)计算上一步各类变量的典型相关系数。采用典型相关分析中第一对典型相关系数衡量类别之间的关联性。
典型相关系数分析方法简介如下:通常,一般的简单相关系数描述两组变量的相关关系只是孤立考虑单个X与单个Y间的相关,没有考虑X、Y变量组内部各变量间的相关。两组间有许多简单相关系数,使问题显得复杂,难以从整体描述。典型相关是简单相关、多重相关的推广。它是研究两组变量之间相关性的一种统计分析方法,也是一种降维技术。
设x=(x1,x2,...,xp1)'和y=(y1,y2,...yp2)'是两组随机变量,为了进行典型相关分析,借助主成分分析的思想,从x和y中提取主成分因子u和v,使得u和v的相关程度最大,从而将两组变量之间的研究问题,转化为两个变量u和v之间的关系,即研究x的线性函数u=a'x与y的线性函数v=b'y之间的相关关系,使达到最大,其中μu、μv分别代表变量u和v的均值,σu、σv分别代表u和v的标准差,x和y是随机的两组随机变量,p1、p2分别代表的是x和y的变量维度。
求解得到的a1和b1使ρ(u,v)达到最大值ρ1,我们称u1=a'x,v1=b'y为第一对典型相关变量,称ρ1为第一个典型相关系数。
(4)基于上一步异常类别间的典型相关系数,建立异常类别关联复杂网络模型,从而实现从异常变量关联复杂网络中,提取共性因子并分类的目的。异常类别关联复杂网络模型是从异常变量关联复杂网络中提取变量并分类所形成的异常类别。
(5)异常类别关联复杂网络模型关键节点探索与网络模型优化,具体处理如下。
(a)删除典型相关系数较小的关联,具体根据更多运行数据进行学习修正。当前删除的是相关系数小于0.05的关联。
(b)网络模型中连接边的粗细用相关系数表示。
(c)将连接边数大于等于5(具体需根据运行数据的增多进行学习调整)的节点用不同颜色突出表示。
异常类别复杂网络模型构建任务结果进入结果保存环节:异常类别复杂网络结果保存。
至此,完成定时调度任务一(即模型构建任务)。
任务二:模型应用任务
第一步,开启模型应用任务,利用当前LKJ运行记录文件(当天或按需调整)传入数据预提取任务中。数据预提取任务包括如下子任务:
(1)进入异常模式库(模式包括异常模式、频繁模式、通用模式、已有规则等)匹配任务,然后判断历史数据中是否存在异常,如果存在则输出保存;
(2)进入滑动窗口连续变量(变量包括LKJ速度、管压、缸压、电流)突变阈值库匹配任务,然后判断历史数据中是否存在异常,如果存在则输出保存;
(3)进入连续变量(变量包括LKJ速度、管压、缸压、电流)相关系数阈值库匹配任务,然后判断历史数据中是否存在异常,如果存在则输出保存;
(4)提取异常当前线路位置、LKJ速度、管压、缸压、电流等故障状态数据,然后输出保存;
(5)上述(1)-(4)步骤输出数据进入异常变量数据汇总任务,然后汇总所有异常变量数据。
第二步,开启数据规整、特征补充任务,输入为数据预提取任务最后保存结果,通过数据挖掘中的特征提取、特征补充等方法,实现数据的规整;输出为数据规整后的数据表。输出结果进入判断,如果判断结果为模型应用任务,则进入模型应用任务流。
进一步判断,系统中是否存在模型结果参数,如不存在则中间退出,如存在则进入第三步。
第三步,进入异常变量复杂网络应用任务,输入第二步的任务执行结果,同时传入异常变量复杂网络结果参数,任务最终结果进入数据保存环节:异常变量复杂网络应用结果保存。
第四步,传入异常变量复杂网络应用任务结果,进入异常类别复杂网络应用任务,具体应用内容为:异常类别关联复杂关系网络模型应用调用异常类别关联复杂关系网络模型中的参数,对新拦截的异常变量进行异常类别匹配,识别并获取其关联节点、关联关键节点信息,任务最终结果进入数据保存环节:异常类别复杂网络应用结果保存。
至此,完成定时调度任务二,结束模型应用任务流。
此外,本发明还公开了一种基于LKJ异常值数据的复杂关联网络分析系统,系统包括处理器和存储器。
存储器被配置为存储一系列计算机可执行的指令以及与这一系列计算机可执行的指令相关联的计算机可访问的数据。
当这一系列计算机可执行的指令被处理器执行时,使得处理器进行如图1所示实施例的方法。由于该方法的实施例已经在前述内容中详细描述,在此不再赘述。
本发明还公开了一种非临时性计算机可读存储介质,非临时性计算机可读存储介质上存储有一系列计算机可执行的指令。当这一系列可执行的指令被计算装置执行时,使得计算装置进行如图1所示实施例的方法。由于该方法的实施例已经在前述内容中详细描述,在此不再赘述。
总的来说,本发明的创新之处在于:建立了基于异常值数据的复杂关联网络模型及系统,模型及系统可分析不同异常特性数据之间的关联关系及集聚程度,设计了两组变量之间相关性的统计分析方法,最终得以实现LKJ故障的关联分析。
本发明的技术效果在于:首次将复杂网络算法应用于LKJ数据故障关联探索。对于不同探索标志下异常值进行综合和分类探索研究,用于故障规则挖掘分析。通过结合深度分析算法,帮助用户洞察无法直接观测到的数据背后的关联、趋势和逻辑。通过深度分析算法进行数据预测和数据关联性洞察,实现对数据含义和价值的深度挖掘。
尽管为使解释简单化将上述方法图示并描述为一系列动作,但是应理解并领会,这些方法不受动作的次序所限,因为根据一个或多个实施例,一些动作可按不同次序发生和/或与来自本文中图示和描述或本文中未图示和描述但本领域技术人员可以理解的其他动作并发地发生。
本领域技术人员将进一步领会,结合本文中所公开的实施例来描述的各种解说性逻辑板块、模块、电路、和算法步骤可实现为电子硬件、计算机软件、或这两者的组合。为清楚地解说硬件与软件的这一可互换性,各种解说性组件、框、模块、电路、和步骤在上面是以其功能性的形式作一般化描述的。此类功能性是被实现为硬件还是软件取决于具体应用和施加于整体系统的设计约束。技术人员对于每种特定应用可用不同的方式来实现所描述的功能性,但这样的实现决策不应被解读成导致脱离了本发明的范围。
结合本文所公开的实施例描述的各种解说性逻辑板块、模块、和电路可用通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件、或其设计成执行本文所描述功能的任何组合来实现或执行。通用处理器可以是微处理器,但在替换方案中,该处理器可以是任何常规的处理器、控制器、微控制器、或状态机。处理器还可以被实现为计算设备的组合,例如DSP与微处理器的组合、多个微处理器、与DSP核心协作的一个或多个微处理器、或任何其他此类配置。
结合本文中公开的实施例描述的方法或算法的步骤可直接在硬件中、在由处理器执行的软件模块中、或在这两者的组合中体现。软件模块可驻留在RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD-ROM、或本领域中所知的任何其他形式的存储介质中。示例性存储介质耦合到处理器以使得该处理器能从/向该存储介质读取和写入信息。在替换方案中,存储介质可以被整合到处理器。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替换方案中,处理器和存储介质可作为分立组件驻留在用户终端中。
在一个或多个示例性实施例中,所描述的功能可在硬件、软件、固件或其任何组合中实现。如果在软件中实现为计算机程序产品,则各功能可以作为一条或更多条指令或代码存储在计算机可读介质上或藉其进行传送。计算机可读介质包括计算机存储介质和通信介质两者,其包括促成计算机程序从一地向另一地转移的任何介质。存储介质可以是能被计算机访问的任何可用介质。作为示例而非限定,这样的计算机可读介质可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁存储设备、或能被用来携带或存储指令或数据结构形式的合意程序代码且能被计算机访问的任何其它介质。任何连接也被正当地称为计算机可读介质。例如,如果软件是使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)、或诸如红外、无线电、以及微波之类的无线技术从web网站、服务器、或其它远程源传送而来,则该同轴电缆、光纤电缆、双绞线、DSL、或诸如红外、无线电、以及微波之类的无线技术就被包括在介质的定义之中。如本文中所使用的盘(disk)和碟(disc)包括压缩碟(CD)、激光碟、光碟、数字多用碟(DVD)、软盘和蓝光碟,其中盘(disk)往往以磁的方式再现数据,而碟(disc)用激光以光学方式再现数据。上述的组合也应被包括在计算机可读介质的范围内。
提供对本公开的先前描述是为使得本领域任何技术人员皆能够制作或使用本公开。对本公开的各种修改对本领域技术人员来说都将是显而易见的,且本文中所定义的普适原理可被应用到其他变体而不会脱离本公开的精神或范围。由此,本公开并非旨在被限定于本文中所描述的示例和设计,而是应被授予与本文中所公开的原理和新颖性特征相一致的最广范围。
Claims (10)
1.一种基于LKJ异常值数据的复杂关联网络分析方法,其特征在于,包括模型构建任务流和模型应用任务流两方面的处理,其中:
模型构建任务流的运行步骤为:
第一步,开启模型构建任务,利用历史运行文件数据传入数据预提取任务中,汇总所有异常变量数据;
第二步,开启数据规整、特征补充任务,通过数据挖掘中的特征提取、特征补充,将数据预提取任务的保存结果进行数据规整,并基于数据规整结果判断当前任务是模型构建任务还是模型应用任务,若为模型构建任务则继续后续模型构建任务流,若为模型应用任务则转至模型应用任务流中处理;
第三步,进入特征降维任务,输出为降维后的建模数据集;
第四步,进入异常变量关联复杂网络构建任务,异常变量关联复杂网络模型的结果经评估后若模型不满足要求则重新返回第二步的执行流程,若模型满足要求则将异常变量关联复杂网络模型的结果保存;
第五步,传入异常变量关联复杂网络保存结果,进入异常变量因子提取任务,得到异常变量因子提取结果;
第六步,传入异常变量因子提取结果,进入异常类别复杂网络构建任务,并保存异常类别复杂网络结果,至此模型构建任务流结束。
模型应用任务流的运行步骤为:
第一步,开启模型应用任务,利用当前LKJ运行记录文件传入数据预提取任务中,汇总所有异常变量数据;
第二步,开启数据规整、特征补充任务,通过数据挖掘中的特征提取、特征补充,将数据预提取任务的保存结果进行数据规整,并基于数据规整结果判断当前任务是模型构建任务还是模型应用任务,若为模型应用任务则继续后续模型应用任务流,若为模型构建任务则转至模型构建任务流中处理;
第三步,系统中是否存在模型结果参数,如不存在则退出流程,若存在则进入异常变量复杂网络应用任务,输入第二步的任务执行结果,同时传入模型构建任务流中的异常变量复杂网络结果参数,任务最终结果进入到数据保存环节,将异常变量复杂网络应用结果加以保存;
第四步,传入异常变量复杂网络应用任务的结果,进入异常类别复杂网络应用任务,任务最终结果进入数据保存环节中,将异常类别复杂网络应用结果加以保存。
2.根据权利要求1所述的基于LKJ异常值数据的复杂关联网络分析方法,其特征在于,在模型构建任务/模型应用任务流的第一步中,数据预提取任务包括以下子任务:
进入异常模式库匹配任务,然后判断历史数据中是否存在异常,如果存在则输出保存,其中模式库中的模式包括异常模式、频繁模式、通用模式、已有规则;
进入滑动窗口连续变量突变阈值库匹配任务,然后判断历史数据中是否存在异常,如果存在则输出保存,其中变量包括LKJ速度、管压、缸压、电流;
进入连续变量相关系数阈值库匹配任务,然后判断历史数据中是否存在异常,如果存在则输出保存,其中变量包括LKJ速度、管压、缸压、电流;
提取异常当前线路位置以及包括LKJ速度、管压、缸压、电流在内的故障状态数据,然后输出保存;
上述输出保存的数据进入异常变量数据汇总任务,汇总所有异常变量数据。
3.根据权利要求1所述的基于LKJ异常值数据的复杂关联网络分析方法,其特征在于,在模型构建任务的第四步中,异常变量关联复杂网络构建任务的处理步骤如下:
步骤1:收集整理异常拦截数据,对数据进行结构化整理;
步骤2:对步骤1中的异常拦截后的变量,计算异常拦截后的各变量的相关系数;
步骤3:基于步骤1计算得到的变量间相关系数,建立变量关联网络,其中,节点为异常拦截后的变量,相关系数衡量节点之间的紧密程度,相关系数强,则相关线条粗,反之,相关线条细;
步骤4:进行异常变量关联复杂网络模型关键节点探索与网络模型优化。
4.根据权利要求3所述的基于LKJ异常值数据的复杂关联网络分析方法,其特征在于,异常变量关联复杂网络构建任务的步骤4中的探索与优化处理包括:
删除相关系数小于一设定值的关联;
网络模型中连接边的粗细用相关系数表示;
将连接边数大于等于一设定值的节点用不同颜色突出表示。
5.根据权利要求1所述的基于LKJ异常值数据的复杂关联网络分析方法,其特征在于,在模型构建任务的第五步中,异常变量因子提取的具体步骤如下:
步骤1:将原始数据标准化,以消除变量间在数量级和量纲上的不同;
步骤2:求标准化数据的相关矩阵;
步骤3:求相关矩阵的特征值和特征向量;
步骤4:计算方差贡献率与累积方差贡献率;
步骤5:对于多个异常变量因子,在前若干个因子所包含的累积方差贡献率不低于一阈值时,提取该若干个异常变量因子,以反应原评价指标。
6.根据权利要求1所述的基于LKJ异常值数据的复杂关联网络分析方法,其特征在于,在模型构建任务的第六步中,异常类别复杂网络构建任务的具体步骤如下:
步骤1:收集整理异常拦截数据,对数据进行结构化整理;
步骤2:对异常拦截变量进行分类整理:当前分类采用因子分析根据样本数据进行的分类,后续根据运行数据进行学习修正分类结果;
步骤3:计算第2步中分类的各类变量的典型相关系数,采用典型相关分析中第一对典型相关系数衡量类别之间的关联性;
步骤4:基于步骤3中的异常类别间的典型相关系数,建立异常类别关联复杂网络模型;
步骤5:异常类别关联复杂网络模型关键节点探索与网络模型优化。
7.根据权利要求6所述的基于LKJ异常值数据的复杂关联网络分析方法,其特征在于,异常类别复杂网络构建任务中的步骤5进一步包括:
删除典型相关系数小于一设定值的关联;
网络模型中连接边的粗细用相关系数表示;
将连接边数大于等于一设定值的节点用不同颜色突出表示。
8.根据权利要求1所述的基于LKJ异常值数据的复杂关联网络分析方法,其特征在于,模型应用任务流的第四步的异常类别复杂网络应用任务的处理如下:
异常类别关联复杂关系网络模型应用调用异常类别关联复杂关系网络模型中的参数,对新拦截的异常变量进行异常类别匹配,识别并获取其关联节点、关联关键节点信息,以得到任务最终结果。
9.一种基于LKJ异常值数据的复杂关联网络分析系统,其特征在于,包括:
处理器;以及
存储器,所述存储器被配置为存储一系列计算机可执行的指令以及与所述一系列计算机可执行的指令相关联的计算机可访问的数据,
其中,当所述一系列计算机可执行的指令被所述处理器执行时,使得所述处理器进行如权利要求1至8中任一项所述的方法。
10.一种非临时性计算机可读存储介质,其特征在于,所述非临时性计算机可读存储介质上存储有一系列计算机可执行的指令,当所述一系列可执行的指令被计算装置执行时,使得计算装置进行如权利要求1至8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910338513.6A CN110059126B (zh) | 2019-04-25 | 2019-04-25 | 基于lkj异常值数据的复杂关联网络分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910338513.6A CN110059126B (zh) | 2019-04-25 | 2019-04-25 | 基于lkj异常值数据的复杂关联网络分析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110059126A true CN110059126A (zh) | 2019-07-26 |
CN110059126B CN110059126B (zh) | 2023-04-07 |
Family
ID=67320662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910338513.6A Active CN110059126B (zh) | 2019-04-25 | 2019-04-25 | 基于lkj异常值数据的复杂关联网络分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110059126B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111067506A (zh) * | 2019-12-19 | 2020-04-28 | 佛山科学技术学院 | 一种vr游戏生理信息采集装置及方法 |
CN113806356A (zh) * | 2020-06-16 | 2021-12-17 | 中国移动通信集团重庆有限公司 | 数据识别方法、装置及计算设备 |
CN114819458A (zh) * | 2021-12-31 | 2022-07-29 | 第四范式(北京)技术有限公司 | 仿真模型的构建方法和仿真模型的构建装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100057649A1 (en) * | 2008-09-04 | 2010-03-04 | Chang Eun Lee | System and method for fault prediction in home network |
CN105572492A (zh) * | 2015-10-22 | 2016-05-11 | 北京建筑大学 | 一种城轨列车辅助逆变器故障诊断装置 |
US20170015339A1 (en) * | 2014-12-12 | 2017-01-19 | Beijing Jiaotong University | Complex network-based high speed train system safety evaluation method |
CN107248000A (zh) * | 2017-06-28 | 2017-10-13 | 广东技术师范学院 | 一种基于数据挖掘的车载信号设备智能维修方法 |
CN108132982A (zh) * | 2017-12-13 | 2018-06-08 | 湖南中车时代通信信号有限公司 | 基于大数据的列车运行监控装置数据的分析系统和方法 |
CN108334674A (zh) * | 2018-01-17 | 2018-07-27 | 浙江大学 | 一种基于参数关联性智能分析的汽轮机高压缸运行状态监测方法 |
-
2019
- 2019-04-25 CN CN201910338513.6A patent/CN110059126B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100057649A1 (en) * | 2008-09-04 | 2010-03-04 | Chang Eun Lee | System and method for fault prediction in home network |
US20170015339A1 (en) * | 2014-12-12 | 2017-01-19 | Beijing Jiaotong University | Complex network-based high speed train system safety evaluation method |
CN105572492A (zh) * | 2015-10-22 | 2016-05-11 | 北京建筑大学 | 一种城轨列车辅助逆变器故障诊断装置 |
CN107248000A (zh) * | 2017-06-28 | 2017-10-13 | 广东技术师范学院 | 一种基于数据挖掘的车载信号设备智能维修方法 |
CN108132982A (zh) * | 2017-12-13 | 2018-06-08 | 湖南中车时代通信信号有限公司 | 基于大数据的列车运行监控装置数据的分析系统和方法 |
CN108334674A (zh) * | 2018-01-17 | 2018-07-27 | 浙江大学 | 一种基于参数关联性智能分析的汽轮机高压缸运行状态监测方法 |
Non-Patent Citations (2)
Title |
---|
ZHIWEN CHEN, ET AL: "Fault Detection for Non-Gaussian Processes Using Generalized Canonical Correlation Analysis and Randomized Algorithms", 《IEEE TRANSACTIONS ON INDUSTRIAL ELECTRONICS》 * |
郭玉霞: "高速铁路动车组故障关联关系分析的研究", 《中国优秀硕士学位论文全文数据库 中国优秀硕士学位论文全文数据库 中国优秀硕士学位论文全文数据库 工业科技II辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111067506A (zh) * | 2019-12-19 | 2020-04-28 | 佛山科学技术学院 | 一种vr游戏生理信息采集装置及方法 |
CN113806356A (zh) * | 2020-06-16 | 2021-12-17 | 中国移动通信集团重庆有限公司 | 数据识别方法、装置及计算设备 |
CN113806356B (zh) * | 2020-06-16 | 2024-03-19 | 中国移动通信集团重庆有限公司 | 数据识别方法、装置及计算设备 |
CN114819458A (zh) * | 2021-12-31 | 2022-07-29 | 第四范式(北京)技术有限公司 | 仿真模型的构建方法和仿真模型的构建装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110059126B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110852856B (zh) | 一种基于动态网络表征的发票虚开识别方法 | |
Jiang et al. | Wavelet based feature extraction and multiple classifiers for electricity fraud detection | |
CN110223168A (zh) | 一种基于企业关系图谱的标签传播反欺诈检测方法及系统 | |
CN110059126A (zh) | 基于lkj异常值数据的复杂关联网络分析方法及系统 | |
CN110555455A (zh) | 一种基于实体关系的在线交易欺诈检测方法 | |
CN105516127B (zh) | 面向内部威胁检测的用户跨域行为模式挖掘方法 | |
CN109615116A (zh) | 一种电信诈骗事件检测方法和检测系统 | |
CN108038778A (zh) | 互联网金融小微贷款的团伙欺诈识别方法及装置 | |
CN109858930B (zh) | 基于关联图谱表征学习的线上交易欺诈检测方法 | |
KR102281819B1 (ko) | 오토인코더 앙상블 기반 이상행위 탐지 방법 및 시스템 | |
CN111191720B (zh) | 一种业务场景的识别方法、装置及电子设备 | |
CN112738014A (zh) | 一种基于卷积时序网络的工控流量异常检测方法及系统 | |
CN110011990A (zh) | 内网安全威胁智能分析方法 | |
CN116541782A (zh) | 一种电力营销数据异常识别方法 | |
CN112491891A (zh) | 物联网环境下基于混合深度学习的网络攻击检测方法 | |
CN116541755A (zh) | 一种基于时序图表征学习的金融行为模式分析预测方法 | |
CN116074092A (zh) | 一种基于异构图注意力网络的攻击场景重构系统 | |
CN115409120A (zh) | 一种基于数据驱动的用户窃电行为检测辅助方法 | |
Yin et al. | A feature selection method for improved clonal algorithm towards intrusion detection | |
KR20220134954A (ko) | 오토인코더 앙상블 기반 이상행위 탐지 방법 및 시스템 | |
CN111292182A (zh) | 一种信贷欺诈检测方法及系统 | |
CN116578904A (zh) | 基于集成机器学习的区块链地址属性分类方法及系统 | |
CN105930430A (zh) | 一种基于非累积属性的实时欺诈检测方法及装置 | |
Chehida et al. | Applied statistical model checking for a sensor behavior analysis | |
CN111241145A (zh) | 一种基于大数据的自愈规则挖掘方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |