CN111858926A - 一种基于多元异构数据的管廊设备故障预测方法及系统 - Google Patents

一种基于多元异构数据的管廊设备故障预测方法及系统 Download PDF

Info

Publication number
CN111858926A
CN111858926A CN202010514755.9A CN202010514755A CN111858926A CN 111858926 A CN111858926 A CN 111858926A CN 202010514755 A CN202010514755 A CN 202010514755A CN 111858926 A CN111858926 A CN 111858926A
Authority
CN
China
Prior art keywords
data
equipment
training
text
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010514755.9A
Other languages
English (en)
Inventor
欧阳康淼
曾国华
宫大庆
薛刚
张妍
史金栋
台启民
薛斐
张真继
马健
李清华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Infrastructure Investment Co ltd Formerly Beijing Metro Group Co ltd
Original Assignee
Beijing Infrastructure Investment Co ltd Formerly Beijing Metro Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Infrastructure Investment Co ltd Formerly Beijing Metro Group Co ltd filed Critical Beijing Infrastructure Investment Co ltd Formerly Beijing Metro Group Co ltd
Priority to CN202010514755.9A priority Critical patent/CN111858926A/zh
Publication of CN111858926A publication Critical patent/CN111858926A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Economics (AREA)
  • Evolutionary Computation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Algebra (AREA)
  • General Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于多元异构数据的管廊设备故障预测方法,包括:综合设备运行历史数据、管廊内环境数据以及设备故障影响因素,通过自编码器以及深度神经网络训练数据,得出设备故障预测预警情况。本发明还提供了一种基于多元异构数据的管廊设备故障预测系统。本发明中,结合设备运行历史数据、管廊内环境数据及巡检文本数据,结合两种数据的预测算法框架,获得设备故障预测与预警结果,不但提升了设备故障预测准确率,而且降低了设备故障率。

Description

一种基于多元异构数据的管廊设备故障预测方法及系统
技术领域
本发明涉及管廊监视管理技术领域,尤其涉及一种基于多元异构数据的管廊设备故障预测方法及系统。
背景技术
城市综合管廊(以下简称管廊)为地下集约化隧道,集电力、通信、燃气、给水、中水、污水等专业管线于一体。现有方案在管廊设备上配置多个传感器,通过第一目标传感器对设备状态进行检测,获取第一目标传感器输出的第一检测数据;根据预设条件判断第一检测数据是否为无效数据;如果第一检测数据为无效数据,再根据预定义的分级指标对若干备用传感器进行排序,确定第二目标传感器;然后通过第二目标传感器对管廊设备状态进行检测,获取第二目标传感器输出的第二检测数据;最后根据第二检测数据确定故障诊断结果。
当前对于管廊设备的管理仅依赖于员工巡检传感器发现故障、报修等一系列人工操作,针对简单的项目级、公司级管廊的运维尚可正常运转,但在城市级综合管廊监管体系下则有很大弊端,仅靠传感器检测只能排除已发生故障,且效率低下。
发明内容
为了解决背景技术中存在的技术问题,本发明提出了一种基于多元异构数据的管廊设备故障预测方法及系统,基于深度学习算法预测设备全生命周期的故障风险,以降低设备发生故障的概率。
本发明提出的一种基于多元异构数据的管廊设备故障预测系统,包括:
SVM文本分类模块,用于获取巡检文本数据,根据巡检文本数据识别出故障信息;
逻辑回归影响因素分析模块,与SVM文本分类模块连接,用于接收SVM文本分类模块输出的故障信息,并获取故障设备所在区域管廊内环境数据,提取设备故障影响因素;
深度学习预测模块,与逻辑回归影响因素分析模块连接,接收设备故障影响因素信息,并获取故障设备所在区域管廊内环境数据和设备运行历史数据,综合设备运行历史数据、管廊内环境数据以及设备故障影响因素,通过自编码器以及深度神经网络训练数据,得出设备故障预测预警情况。
优选地,SVM文本分类模块具体包括:
文本预处理子模块,用于对训练文本进行文本预处理;
向量表示子模块,与文本特征提取子模块连接,用于对预处理后的文本进行文本向量表示,并进行归一化;
分类器构建子模块,与向量表示子模块连接,用于对文本向量进行训练,构建分类器。
优选地,逻辑回归影响因素分析模块提取设备故障影响因素,具体包括:
1.初始化W,b:W随机初始化为接近0的数,b则初始化为0;
2.计算预测的输出结果
Figure BDA0002529640870000021
逻辑回归的函数形式为;
Figure BDA0002529640870000022
z=wTX+b(w,b∈R)
Figure BDA0002529640870000023
3.计算损失函数J(w,b)
假设训练样本共有m个,则上标i表示第i个样本,对于训练样本(x1,y1),...,(xm,ym),希望预测的输出结果尽可能的接近真实的结果,即
Figure BDA0002529640870000031
逻辑回归的损失函数为:
Figure BDA0002529640870000032
定义代价函数为m个训练样本损失函数的平均值
Figure BDA0002529640870000033
以上平均值衡量了预测结果与真实结果之间的平均错误代价,优化的目标是最小化代价函数J(w,b);
4.计算梯度
Figure BDA0002529640870000034
梯度下降中,w,b的更新方式为:
Figure BDA0002529640870000035
Figure BDA0002529640870000036
α为学习率learning-rate表示移动步长;
5.根据梯度下降法更新w和b;
6.重复2-5步骤,直到导数得到最小化的代价函数J(w,b);
7.确定权重W为环境变量对设备各自的影响因素权重。
优选地,深度学习预测模块通过自编码器以及深度神经网络训练数据,具体包括:无监督预训的SAE,将不同的特征组合成不同的训练数据集,对贪婪层的SAE进行预训练,SAE用于初始化DNN的权重和偏差;监督训练的深度神经网络;预测并输出预测结果。
本发明还提供了一种基于多元异构数据的管廊设备故障预测方法,包括以下步骤:
步骤101,获取巡检文本数据,根据巡检文本数据识别出故障信息;
步骤102,接收SVM文本分类模块10输出的故障信息,并获取故障设备所在区域管廊内环境数据,提取设备故障影响因素;
步骤103,接收设备故障影响因素信息,并获取故障设备所在区域管廊内环境数据和设备运行历史数据,综合设备运行历史数据、管廊内环境数据以及设备故障影响因素,通过自编码器以及深度神经网络训练数据,得出设备故障预测预警情况。
优选地,步骤101具体包括:
对训练文本进行文本预处理;
对预处理后的文本进行文本向量表示,并进行归一化;
对文本向量进行训练,构建分类器。
优选地,步骤102具体包括:
1.初始化W,b:W随机初始化为接近0的数,b则初始化为0;
2.计算预测的输出结果
Figure BDA0002529640870000041
逻辑回归的函数形式为;
Figure BDA0002529640870000042
z=wTX+b(w,b∈R)
Figure BDA0002529640870000043
3.计算损失函数J(w,b)
假设训练样本共有m个,则上标i表示第i个样本,对于训练样本(x1,y1),...,(xm,ym),希望预测的输出结果尽可能的接近真实的结果,即
Figure BDA0002529640870000044
逻辑回归的损失函数为:
Figure BDA0002529640870000051
定义代价函数为m个训练样本损失函数的平均值
Figure BDA0002529640870000052
以上平均值衡量了预测结果与真实结果之间的平均错误代价,优化的目标是最小化代价函数J(w,b);
4.计算梯度
Figure BDA0002529640870000053
梯度下降中,w,b的更新方式为:
Figure BDA0002529640870000054
Figure BDA0002529640870000055
α为学习率learning-rate表示移动步长;
5.根据梯度下降法更新w和b;
6.重复2-5步骤,直到导数得到最小化的代价函数J(w,b);
7.确定权重W为环境变量对设备各自的影响因素权重。
优选地,步骤103具体包括:
无监督预训的SAE,将不同的特征组合成不同的训练数据集,对贪婪层的SAE进行预训练,SAE用于初始化DNN的权重和偏差;
监督训练的深度神经网络;
预测并输出预测结果。
本发明中,结合设备运行历史数据、管廊内环境数据及巡检文本数据,结合两种数据的预测算法框架,获得设备故障预测与预警结果,不但提升了设备故障预测准确率,而且降低了设备故障率。
附图说明
图1为本发明实施例提出的基于多元异构数据的管廊设备故障预测系统结构图;
图2为本发明实施例提出的SVM文本分类模块结构图;
图3为本发明实施例提出的基于多元异构数据的管廊设备故障预测方法流程图。
具体实施方式
本发明实施例提出了一种基于多元异构数据的管廊设备故障预测系统,如图1所示,包括:SVM文本分类模块10、逻辑回归影响因素分析模块20和深度学习预测模块30。
SVM文本分类模块10,用于获取巡检文本数据,根据巡检文本数据识别出故障信息,包括故障发生区域和故障具体内容等,将故障信息发送给逻辑回归影响因素分析模块20;
逻辑回归影响因素分析模块20,与SVM文本分类模块10连接,用于接收SVM文本分类模块10输出的故障信息,并获取故障设备所在区域管廊内环境数据,提取设备故障影响因素;
深度学习预测模块30,与逻辑回归影响因素分析模块20连接,接收设备故障影响因素信息,并获取故障设备所在区域管廊内环境数据和设备运行历史数据,综合设备运行历史数据、管廊内环境数据以及设备故障影响因素,通过自编码器以及深度神经网络训练数据,得出设备故障预测预警情况。
本发明实施例中,SVM文本分类模块10如图2所示,具体包括:
文本预处理子模块11,用于对训练文本进行文本预处理,具体包括:使用jieba(一种Python中文分词组件)进行文本分词;去除停用词,例如虚词、语气助词、连词及介词等;
特征提取与向量表示子模块12,与文本预处理子模块11连接,用于对预处理后的文本进行文本向量表示,并进行归一化。具体方法为TF-IDF,TF-IDF公式来计算词的权值:
Figure BDA0002529640870000071
其中tfik表示词语tk在文档di中出现的频率,N为训练文档总数,nk为在训练集中出现词tk的文档数。由TF-IDF公式,一批文档中某词出现的频率越高,区分度则越小,权值也越低;而在一个文档中,某词出现的频率越高,区分度则越大,权重越大。
归一化就是要把需要处理的数据经过处理后(通过某种算法)限制在需要的一定范围内:
Figure BDA0002529640870000072
公式(2)中a为关键词的词频,min为该词在所有文本中的最小词频,max为该词在所有文本中的最大词频。这一步就是归一化,当用词频进行比较时,容易发生较大的偏差,归一化能使文本分类更加精确。
分类器构建子模块13,与特征提取与向量表示子模块12连接,用于对文本向量进行训练,构建分类器。经过文本预处理、特征提取、特征表示、归一化处理后,已经把原来的文本信息抽象成一个向量化的样本集,然后把此样本集与训练好的模板文件进行相似度计算,若不属于该类别,则与其他类别的模板文件进行计算,直到分进相应的类别,这就是SVM模型的文本分类方式。将预处理后的新文本输入分类器,得到文本分类结果。
本发明实施例中,逻辑回归影响因素分析模块20,一方面获取廊内环境指标数据,具体包括温度、湿度、氧气、甲烷、硫化氢、以及水位等(可以通过传感器采集);另一方面,获取各位置是否故障信息;输出为每项环境指标对设备故障的影响因素权重。逻辑回归实际上是一种分类方法,主要用于二分类问题,输出在0到1,代表了属于某一类的概率,如下式为输入X属于第1类的概率,记为
Figure BDA0002529640870000081
一般在概率大于0.5时,将输出结果判为1,否则为0。
逻辑回归包括以下步骤:
1.初始化W,b:W随机初始化为接近0的数,b则初始化为0;
2.计算预测的输出结果
Figure BDA0002529640870000082
逻辑回归的函数形式为;
Figure BDA0002529640870000083
z=wTX+b(w,b∈R)
Figure BDA0002529640870000084
3.计算损失函数J(w,b)
假设训练样本共有m个,则上标i表示第i个样本,对于训练样本(x1,y1),...,(xm,ym),希望预测的输出结果尽可能的接近真实的结果,即
Figure BDA0002529640870000085
逻辑回归的损失函数为:
Figure BDA0002529640870000086
定义代价函数为m个训练样本损失函数的平均值
Figure BDA0002529640870000087
以上平均值衡量了预测结果与真实结果之间的平均错误代价,优化的目标是最小化代价函数J(w,b)。
4.计算梯度
Figure BDA0002529640870000091
梯度下降中,w,b的更新方式为:
Figure BDA0002529640870000092
Figure BDA0002529640870000093
α为学习率learning-rate表示移动步长。
5.根据梯度下降法更新w和b
6.重复2-5步骤,直到导数得到最小化的代价函数J(w,b)。
7.确定权重W为环境变量对设备各自的影响因素权重。
本发明实施例中,SAE-DNN的训练和预测程序包括三个阶段。在第一阶段,使用无监督预训的SAE(Stacked Autoencoders,堆叠自动编码器),将不同的特征组合成不同的训练数据集,对SAE进行逐层贪婪预训练(greedy layer-wise pre-training)。SAE用于初始化DNN(Deep Neural Networks,深度神经网络)的权重和偏差;第二阶段,利用标签数据进行监督DNN;最后阶段预测。
本发明实施例建立了一种基于叠层自编码(SAE-DNN)模型的深层神经网络,用于可疑异常的识别。在SAE阶段,可以对特征向量进行特征提取,并将训练后的权值输入DNN中,提高了可疑异常检测的准确性。
该深层神经网络通常有一个由输入向量组成的输入层X,一个或多个隐藏层,包含被定义为等式(3)中所示编码器的变换特征向量H,以及输出层,其包含如等式(4)所示的定义为解码器的重构向量R。δ和
Figure BDA0002529640870000094
表示等式中所示的线性和加权组合。(5)和(4)。输出向量应与输入向量匹配,输入向量具有与输入向量相同的维数和值.T(·)是激活函数。使用tanh和rectifier作为方程中所示的激活函数。如:(7)和(8)。
H=f(X)=T(∑iwixi+bi) (3)
Figure BDA0002529640870000101
δ=∑iwixi+bi (5)
Figure BDA0002529640870000102
(6)
Figure BDA0002529640870000103
Rectifer(α)=max(0,α) (8)
其中输入向量X是一组训练数据集{x1,x2,x3,...,xn};H是一组编码器{h1,h2,h3,...,hn};R是一组重构结果{r1,r2,r3,...,rn};f(X)是编码器函数,权重项为(wi)偏置项为(bi);g(H)是解码器函数权重项为
Figure BDA0002529640870000104
偏置项为(bi);α表示δ或者
Figure BDA0002529640870000105
式(9)用于最小化输入向量X和重建向量R之间的重构误差。
L(X,R)=minL(X,R) (9)
为了使重建结果R与输入向量X匹配,应通过微调参数wi和bi使损失函数L(X,R)最小化。如方程式所示。
Figure BDA0002529640870000106
Figure BDA0002529640870000107
wi和wi′是每个隐藏层中第i个节点的原始权重和更新权重;bi and bi′是每个隐藏层中第i个节点的原始偏置和更新偏置;η为学习率。
通过自编码器以及深度神经网络训练数据,得出设备故障预测预警情况的具体实现步骤包括:
第一阶段:无监督预训的SAE,将不同的特征组合成不同的训练数据集,对贪婪层的SAE进行预训练,SAE用于初始化DNN的权重和偏差。具体包括以下步骤:
1.输入:
(1)训练集X={xij},i是无监督输入样本的数量,j是无监督输入的变量数;
(2)一个输入层,一个输出层,N个隐藏层;
(3)每个隐藏层的节点数:kn(n=1,2,N);
(4)停止阈值:θ.
2.步骤1:随机初始化所有层(N+2)的参数(w,b)。
3.步骤2:分层训练所有隐藏层中的所有节点,每一层的培训过程包括以下四个方面:
(1)用等式(3),(5),(7)对每个节点进行编码。
(2)用等式(4),(5),(7)对每个节点进行解码。
(3)用公式(9)计算重建误差L(X,R);
(4)反向传播算法:
如果(L(X,R)>θ),用等式(10)以及(11)最小化重建误差L(X,R)。进入步骤2(1);否则结束。
4.步骤3:重复步骤2,直到所有隐藏层中的所有隐藏节点都经过训练。
5.输出预先训练的SAE。
第二阶段:监督训练的深度神经网络。
6.输入:
(1)预先训练的SAE;
(2)训练集X={xij’},i是监督输入样本的数量,j’是监督输入的变量数;
(3)一个输入层,一个输出层,N’个隐藏层数;
(4)各隐藏层节点数:kn(n=1,2...N’);
(5)停止阈值:θ′·。
7.步骤4:使用SAE初始化参数(w’,b’)作为所有层(N’+2)的初始参数。
8.步骤5:以设备是否有损坏的风险作为标签数据,对输入层到输出层的所有节点进行训练,包括以下三个步骤。
(1)利用公式(3),(5),(8)对每个节点进行逐层前馈算法训练,得到输出层的输出Y;
(2)用公式(9)计算第一输入层的输入与最后输出层的输出之间的误差L(X,Y);
(3)反向传播算法:
如(L(X,Y)>θ′),用等式(10)以及(11),最小化误差L(X,Y)。进入步骤5(1);否则结束。
9.输出:训练模型(预测器)。
第三阶段:预测。
10.输入:(1)测试数据T={tmj},m为测试样本数量,j为输入变量数;
(2)已训练好的预测器
11.步骤6:将T输入预测器。
12.步骤7:执行预测。
13.输出预测结果。
本发明实施例提出了一种基于多元异构数据的管廊设备故障预测方法,如图3所示,包括以下步骤:
步骤101,获取巡检文本数据,根据巡检文本数据识别出故障信息,包括故障发生区域和故障具体内容等。具体包括:对训练文本进行文本预处理,具体包括:使用jieba进行文本分词;去除停用词,例如虚词、语气助词、连词及介词等;对预处理后的文本进行文本向量表示,并进行归一化;对文本向量进行训练,构建分类器。
步骤102,接收SVM文本分类模块10输出的故障信息,并获取故障设备所在区域管廊内环境数据,提取设备故障影响因素。具体包括以下步骤:
1.初始化W,b:W随机初始化为接近0的数,b则初始化为0;
2.计算预测的输出结果
Figure BDA0002529640870000131
逻辑回归的函数形式为;
Figure BDA0002529640870000132
z=wTX+b(w,b∈R)
Figure BDA0002529640870000133
3.计算损失函数J(w,b)
假设训练样本共有m个,则上标i表示第i个样本,对于训练样本(x1,y1),...,(xm,ym),希望预测的输出结果尽可能的接近真实的结果,即
Figure BDA0002529640870000134
逻辑回归的损失函数为:
Figure BDA0002529640870000135
定义代价函数为m个训练样本损失函数的平均值
Figure BDA0002529640870000141
以上平均值衡量了预测结果与真实结果之间的平均错误代价,优化的目标是最小化代价函数J(w,b)。
4.计算梯度
Figure BDA0002529640870000142
梯度下降中,w,b的更新方式为:
Figure BDA0002529640870000143
Figure BDA0002529640870000144
α为学习率learning-rate表示移动步长。
5.根据梯度下降法更新w和b
6.重复2-5步骤,直到导数得到最小化的代价函数J(w,b)。
7.确定权重W为环境变量对设备各自的影响因素权重。
步骤103,接收设备故障影响因素信息,并获取故障设备所在区域管廊内环境数据和设备运行历史数据,综合设备运行历史数据、管廊内环境数据以及设备故障影响因素,通过自编码器以及深度神经网络训练数据,得出设备故障预测预警情况。包括以下步骤:
第一阶段:无监督预训的SAE,将不同的特征组合成不同的训练数据集,对贪婪层的SAE进行预训练,SAE用于初始化DNN的权重和偏差。具体包括以下步骤:
1.输入:
(1)训练集X={xij},i是无监督输入样本的数量,j是无监督输入的变量数;
(2)一个输入层,一个输出层,N个隐藏层;
(3)每个隐藏层的节点数:kn(n=1,2,N);
(4)停止阈值:θ.
2.步骤1:随机初始化所有层(N+2)的参数(w,b)。
3.步骤2:分层训练所有隐藏层中的所有节点,每一层的培训过程包括以下四个方面:
(1)用等式(3),(5),(7)对每个节点进行编码。
(2)用等式(4),(5),(7)对每个节点进行解码。
(3)用公式(9)计算重建误差L(X,R);
(4)反向传播算法:
如果(L(X,R)>θ),用等式(10)以及(11)最小化重建误差L(X,R)。进入步骤2(1);否则结束。
4.步骤3:重复步骤2,直到所有隐藏层中的所有隐藏节点都经过训练。
5.输出预先训练的SAE。
第二阶段:监督训练的深度神经网络。
6.输入:
(1)预先训练的SAE;
(2)训练集X={xij’},i是监督输入样本的数量,j’是监督输入的变量数;
(3)一个输入层,一个输出层,N’个隐藏层数;
(4)各隐藏层节点数:kn(n=1,2...N’);
(5)停止阈值:θ′·。
7.步骤4:使用SAE初始化参数(w’,b’)作为所有层(N’+2)的初始参数。
8.步骤5:以设备是否有损坏的风险作为标签数据,对输入层到输出层的所有节点进行训练,包括以下三个步骤。
(1)利用公式(3),(5),(8)对每个节点进行逐层前馈算法训练,得到输出层的输出Y;
(2)用公式(9)计算第一输入层的输入与最后输出层的输出之间的误差L(X,Y);
(3)反向传播算法:
如(L(X,Y)>θ′),用等式(10)以及(11),最小化误差L(X,Y)。进入步骤5(1);否则结束。
9.输出:训练模型(预测器)。
第三阶段:预测。
10.输入:(1)测试数据T={tmj},m为测试样本数量,j为输入变量数;
(2)已训练好的预测器
11.步骤6:将T输入预测器。
12.步骤7:执行预测。
13.输出预测结果。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

Claims (8)

1.一种基于多元异构数据的管廊设备故障预测系统,其特征在于,包括:
SVM文本分类模块(10),用于获取巡检文本数据,根据巡检文本数据识别出故障信息;
逻辑回归影响因素分析模块(20),与SVM文本分类模块(10)连接,用于接收SVM文本分类模块(10)输出的故障信息,并获取故障设备所在区域管廊内环境数据,提取设备故障影响因素;
深度学习预测模块(30),与逻辑回归影响因素分析模块(20)连接,接收设备故障影响因素信息,并获取故障设备所在区域管廊内环境数据和设备运行历史数据,综合设备运行历史数据、管廊内环境数据以及设备故障影响因素,通过自编码器以及深度神经网络训练数据,得出设备故障预测预警情况。
2.根据权利要求1所述的基于多元异构数据的管廊设备故障预测系统,其特征在于,SVM文本分类模块(10)具体包括:
文本预处理子模块(11),用于对训练文本进行文本预处理;
特征提取与向量表示子模块(13),与文本预处理子模块(11)连接,用于对预处理后的文本进行文本向量表示,并进行归一化;
分类器构建子模块(13),与特征提取与向量表示子模块(12)连接,用于对文本向量进行训练,构建分类器。
3.根据权利要求1所述的基于多元异构数据的管廊设备故障预测系统,其特征在于,逻辑回归影响因素分析模块(20)提取设备故障影响因素,具体包括:
1.初始化W,b:W随机初始化为接近0的数,b则初始化为0;
2.计算预测的输出结果
Figure FDA0002529640860000011
逻辑回归的函数形式为;
Figure FDA0002529640860000012
z=wTX+b(w,b∈R)
Figure FDA0002529640860000021
3.计算损失函数J(w,b)
假设训练样本共有m个,则上标i表示第i个样本,对于训练样本(x1,y1),...,(xm,ym),希望预测的输出结果尽可能的接近真实的结果,即
Figure FDA0002529640860000022
逻辑回归的损失函数为:
Figure FDA0002529640860000023
定义代价函数为m个训练样本损失函数的平均值
Figure FDA0002529640860000024
以上平均值衡量了预测结果与真实结果之间的平均错误代价,优化的目标是最小化代价函数J(w,b);
4.计算梯度
Figure FDA0002529640860000025
梯度下降中,w,b的更新方式为:
Figure FDA0002529640860000026
Figure FDA0002529640860000027
α为学习率learning-rate表示移动步长;
5.根据梯度下降法更新w和b;
6.重复2-5步骤,直到导数得到最小化的代价函数J(w,b);
7.确定权重W为环境变量对设备各自的影响因素权重。
4.根据权利要求1所述的基于多元异构数据的管廊设备故障预测系统,其特征在于,深度学习预测模块(30)通过自编码器以及深度神经网络训练数据,具体包括:无监督预训的SAE,将不同的特征组合成不同的训练数据集,对贪婪层的SAE进行预训练,SAE用于初始化DNN的权重和偏差;监督训练的深度神经网络;预测并输出预测结果。
5.一种基于多元异构数据的管廊设备故障预测方法,其特征在于,包括以下步骤:
步骤101,获取巡检文本数据,根据巡检文本数据识别出故障信息;
步骤102,接收故障信息,并获取故障设备所在区域管廊内环境数据,提取设备故障影响因素;
步骤103,接收设备故障影响因素信息,并获取故障设备所在区域管廊内环境数据和设备运行历史数据,综合设备运行历史数据、管廊内环境数据以及设备故障影响因素,通过自编码器以及深度神经网络训练数据,得出设备故障预测预警情况。
6.根据权利要求5所述的基于多元异构数据的管廊设备故障预测方法,其特征在于,步骤101具体包括:
对训练文本进行文本预处理;
对预处理后的文本进行文本向量表示,并进行归一化;
对文本向量进行训练,构建分类器。
7.根据权利要求5所述的基于多元异构数据的管廊设备故障预测方法,其特征在于,步骤102具体包括:
1.初始化W,b:W随机初始化为接近0的数,b则初始化为0;
2.计算预测的输出结果
Figure FDA0002529640860000031
逻辑回归的函数形式为;
Figure FDA0002529640860000032
z=wTX+b(w,b∈R)
Figure FDA0002529640860000041
3.计算损失函数J(w,b)
假设训练样本共有m个,则上标i表示第i个样本,对于训练样本(x1,y1),...,(xm,ym),希望预测的输出结果尽可能的接近真实的结果,即
Figure FDA0002529640860000042
逻辑回归的损失函数为:
Figure FDA0002529640860000043
定义代价函数为m个训练样本损失函数的平均值
Figure FDA0002529640860000044
以上平均值衡量了预测结果与真实结果之间的平均错误代价,优化的目标是最小化代价函数J(w,b);
4.计算梯度
Figure FDA0002529640860000045
梯度下降中,w,b的更新方式为:
Figure FDA0002529640860000046
Figure FDA0002529640860000047
α为学习率learning-rate表示移动步长;
5.根据梯度下降法更新w和b;
6.重复2-5步骤,直到导数得到最小化的代价函数J(w,b);
7.确定权重W为环境变量对设备各自的影响因素权重。
8.根据权利要求5所述的基于多元异构数据的管廊设备故障预测方法,其特征在于,步骤103具体包括:
无监督预训的SAE,将不同的特征组合成不同的训练数据集,对贪婪层的SAE进行预训练,SAE用于初始化DNN的权重和偏差;
监督训练的深度神经网络;
预测并输出预测结果。
CN202010514755.9A 2020-06-08 2020-06-08 一种基于多元异构数据的管廊设备故障预测方法及系统 Pending CN111858926A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010514755.9A CN111858926A (zh) 2020-06-08 2020-06-08 一种基于多元异构数据的管廊设备故障预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010514755.9A CN111858926A (zh) 2020-06-08 2020-06-08 一种基于多元异构数据的管廊设备故障预测方法及系统

Publications (1)

Publication Number Publication Date
CN111858926A true CN111858926A (zh) 2020-10-30

Family

ID=72987544

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010514755.9A Pending CN111858926A (zh) 2020-06-08 2020-06-08 一种基于多元异构数据的管廊设备故障预测方法及系统

Country Status (1)

Country Link
CN (1) CN111858926A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112861681A (zh) * 2021-01-29 2021-05-28 长兴云尚科技有限公司 一种基于云端处理的管廊视频智能分析方法及系统
CN112862188A (zh) * 2021-02-06 2021-05-28 罗普特科技集团股份有限公司 一种多传感器环境预测方法及系统
CN112884170A (zh) * 2020-12-17 2021-06-01 上海智大电子有限公司 一种综合管廊预测性智能运维系统及方法
CN114046179A (zh) * 2021-09-15 2022-02-15 山东省计算中心(国家超级计算济南中心) 一种基于co监测数据智能识别和预测井下安全事故的方法
CN115293057A (zh) * 2022-10-10 2022-11-04 深圳先进技术研究院 一种基于多源异构数据的风力发电机故障预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109670584A (zh) * 2018-12-27 2019-04-23 张婧 一种基于大数据的故障诊断方法及系统
CN110263767A (zh) * 2019-07-12 2019-09-20 南京工业大学 结合压缩数据采集和深度学习的智能转轴故障诊断方法
CN110263846A (zh) * 2019-06-18 2019-09-20 华北电力大学 基于故障数据深度挖掘及学习的故障诊断方法
CN111144499A (zh) * 2019-12-27 2020-05-12 北京工业大学 基于深度神经网络的风机叶片早期结冰故障检测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109670584A (zh) * 2018-12-27 2019-04-23 张婧 一种基于大数据的故障诊断方法及系统
CN110263846A (zh) * 2019-06-18 2019-09-20 华北电力大学 基于故障数据深度挖掘及学习的故障诊断方法
CN110263767A (zh) * 2019-07-12 2019-09-20 南京工业大学 结合压缩数据采集和深度学习的智能转轴故障诊断方法
CN111144499A (zh) * 2019-12-27 2020-05-12 北京工业大学 基于深度神经网络的风机叶片早期结冰故障检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
G. XUE ET AL.:,: ""Environmental Intelligent Control of Underground Integrated Pipe Gallery Based on Equipment Failure Rate"", vol. 7, pages 160062 - 160071, XP011755345, DOI: 10.1109/ACCESS.2019.2950381 *
LIJUAN LIU, RUNG-CHING CHEN: ""A novel passenger flow prediction model using deep learning methods"", pages 74 - 91 *
终日而思一: ""通俗地说逻辑回归【Logistic regression】算法(一)"", pages 1, Retrieved from the Internet <URL:https://zhuanlan.zhihu.com/p/90520763> *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112884170A (zh) * 2020-12-17 2021-06-01 上海智大电子有限公司 一种综合管廊预测性智能运维系统及方法
CN112861681A (zh) * 2021-01-29 2021-05-28 长兴云尚科技有限公司 一种基于云端处理的管廊视频智能分析方法及系统
CN112861681B (zh) * 2021-01-29 2023-04-07 长兴云尚科技有限公司 一种基于云端处理的管廊视频智能分析方法及系统
CN112862188A (zh) * 2021-02-06 2021-05-28 罗普特科技集团股份有限公司 一种多传感器环境预测方法及系统
CN114046179A (zh) * 2021-09-15 2022-02-15 山东省计算中心(国家超级计算济南中心) 一种基于co监测数据智能识别和预测井下安全事故的方法
CN114046179B (zh) * 2021-09-15 2023-09-22 山东省计算中心(国家超级计算济南中心) 一种基于co监测数据智能识别和预测井下安全事故的方法
CN115293057A (zh) * 2022-10-10 2022-11-04 深圳先进技术研究院 一种基于多源异构数据的风力发电机故障预测方法
CN115293057B (zh) * 2022-10-10 2022-12-20 深圳先进技术研究院 一种基于多源异构数据的风力发电机故障预测方法

Similar Documents

Publication Publication Date Title
CN111858926A (zh) 一种基于多元异构数据的管廊设备故障预测方法及系统
Smarsly et al. Machine learning techniques for structural health monitoring
Liu et al. Fault diagnosis of water quality monitoring devices based on multiclass support vector machines and rule-based decision trees
CN113642225A (zh) 一种基于attention机制的CNN-LSTM短期风电功率预测方法
CN113762329A (zh) 一种大型轧机状态预测模型的构建方法及构建系统
CN113438114B (zh) 互联网系统的运行状态监控方法、装置、设备及存储介质
Zhou et al. Trustworthy fault diagnosis with uncertainty estimation through evidential convolutional neural networks
CN116457802A (zh) 利用未被标记的传感器数据对工业系统中的罕见故障的自动实时检测、预测和阻止
CN114528547B (zh) 基于社区特征选择的icps无监督在线攻击检测方法和设备
CN112070180B (zh) 基于信息物理双侧数据的电网设备状态判断方法及装置
CN114580978A (zh) 一种环评报告质量检查系统及其方法
CN118152901B (zh) 基于数据驱动的设备故障预测方法及系统
CN116842379A (zh) 一种基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法
CN110046663A (zh) 一种复杂机电系统故障临界态辨识方法
CN117275518A (zh) 一种面向小样本数据的设备故障声纹检测方法
CN114881173A (zh) 基于自注意力机制的简历分类方法和装置
CN118522925A (zh) 基于深度学习的质子交换膜燃料电池水管理故障预测方法、系统和装置
CN117763335A (zh) 一种基于大模型的设备故障预测方法
CN113837213A (zh) 一种基于贝叶斯的深潜器多变量融合及漏水检测方法
CN117749658A (zh) 故障预测方法、网络运维管理平台、电子设备及介质
CN115898927A (zh) 一种基于机器学习的聚变装置分子泵故障诊断与预测方法
CN114819350A (zh) 基于多任务的传感器故障情况下的rul预测方法
CN112232607B (zh) 一种地铁客流量预测方法及装置
Liu et al. Information-based Gradient enhanced Causal Learning Graph Neural Network for fault diagnosis of complex industrial processes
CN110837932A (zh) 基于dbn-ga模型的太阳能集热系统热功率预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Country or region after: China

Address after: Room 908, 9/F, Building 2, Beijing Investment Building, No. 6, Xiaoying North Road, Chaoyang District, Beijing 100,101

Applicant after: Beijing Infrastructure Investment Co.,Ltd.

Address before: Room 908, 9/F, Building 2, Beijing Investment Building, No. 6, Xiaoying North Road, Chaoyang District, Beijing 100,101

Applicant before: Beijing Infrastructure Investment Co.,Ltd. (formerly Beijing Metro Group Co.,Ltd.)

Country or region before: China

CB02 Change of applicant information