CN110361966A - 一种基于双隐层量子线路循环单元神经网络的趋势预测方法 - Google Patents
一种基于双隐层量子线路循环单元神经网络的趋势预测方法 Download PDFInfo
- Publication number
- CN110361966A CN110361966A CN201811507945.7A CN201811507945A CN110361966A CN 110361966 A CN110361966 A CN 110361966A CN 201811507945 A CN201811507945 A CN 201811507945A CN 110361966 A CN110361966 A CN 110361966A
- Authority
- CN
- China
- Prior art keywords
- quantum
- phase
- follows
- hidden
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于双隐层量子线路循环单元神经网络的趋势预测方法,包括以下步骤:构建原始运行数据的排列熵集;排列熵集输入DHL‑QCRUNN训练和预测,得到预测的排列熵集;构建各时间点预测值与实际值的排列熵误差集;将排列熵误差集输入DHL‑QCRUNN训练和预测,得到预测的归一化的排列熵误差集;反归一化处理,得到最终预测结果。本发明提出了一种新型量子神经网络——双隐层量子线路循环单元神经网络,本发明通过LM算法来更新DHL‑QCRUNN的网络参数以提高该神经网络的收敛性能,与其它人工智能方法相比,DHL‑QCRUNN具有更好的非线性逼近能力、泛化特性和更快的收敛速度,本发明用于对监控的对象的运行趋势预测,达到了较高的预测精度、预测稳定性和计算效率。
Description
技术领域
本发明涉及神经网络技术领域,尤其涉及一种基于双隐层量子线路循环单 元神经网络的趋势预测方法。
背景技术
旋转机械(如:发动机、汽轮机等)作为在石化、电力、冶金、煤炭、核 能等行业中有着广泛应用的关键设备,常常因出现各种不同形式的故障而影响 其正常运转,严重时甚至会引发机毁人亡的重大事故。将先进的故障诊断技术 应用到旋转机械上,可起到确保设备安全运行、节约维修费用以及防止环境污 染等关键作用,具有巨大的经济效益。
通常,机械设备检修方式可分为发生事故停机检修、定期停机检修、视情 维修(也称为预测维修)三种。其中,视情维修由于具有后勤保障规模小、经 济可承受性好、高效率以及可避免重大灾难性事故等显著优势而具有良好的发 展前景。
视情维修要求系统自身具有对设备故障进行预测并对其健康状态进行管理 的能力,以实现“经济可承受性”的目标,由此产生了故障预测与健康管理 (prognostic andhealth management,PHM)的理念,而实现基于视情维修的PHM技 术的关键在于故障预测。
在大多数的工业PHM系统中,建立复杂部件或系统的数学或物理模型十分 困难甚至无法实现,或识别模型的参数较为复杂,因此,部件或系统设计、仿 真、运行和维护等各个阶段的测试、传感器历史数据就成为掌握系统性能下降 的主要手段。由此,基于测试或传感器数据的数据驱动(data-driven)预测方法逐 渐获得重视并取得快速发展,成为PHM领域的重要研究热点。
目前,基于数据驱动的预测方法有随机系数模型,趋势估计和人工智能等 方法。特别是基于人工智能的预测方法如支持向量机(Support Vector Machine, SVM),模糊逻辑(fuzzy logic,FL)模型,人工神经网络(Artificial Neural Network, ANN)等,由于其在生成合适模型方面的灵活性,受到了广泛的关注与欢迎。然 而,这些预测方法由于各自的缺陷很难得到理想的预测结果。比如支持向量机 核函数及其参数很多情况是人为选定,带有许多不确定性;模糊逻辑具有与SVM 类似的问题;基于人工神经网络的预测方法中,诸如BP神经网络 (Back-Propagation Neural Network,BPNN),循环神经网络(RecurrentNeural Network,RNN)等经典神经网络,存在学习收敛速度慢、训练困难、网络的学习 和记忆具有不稳定性等问题,而Elman神经网络(Elman Neural Network, Elman-NN)和长短时记忆神经网络(Long Short Term Memory Neural Network, LSTMNN)等RNN的变体,由于它们自身理论和结构上的缺陷,仍然难以做出 准确预测。
量子计算作为一种极富前景的非线性模型,被认为是改进神经计算的有效 途径之一。量子神经网络利用了量子计算的一些优势特别是其并行计算特性, 比经典神经网络具有更强的并行处理能力,并且在数据处理方面具有前所未有 的潜在优势。因此,可以通过量子计算与新型神经网络相结合的方式来构建新 型量子神经网络,然后将该新型量子神经网络应用于旋转机械预测领域来解决 现有预测方法面临的预测精度和计算速度等问题,从而突破PHM技术关键难题。
发明内容
本发明所要解决的技术问题是提供一种预测精度高且网络收敛速度快的基 于双隐层量子线路循环单元神经网络的趋势预测方法。
为解决上述技术问题,本发明的技术方案是:一种基于双隐层量子线路循 环单元神经网络的趋势预测方法,包括以下步骤:
S1:采集监控对象的原始运行数据构建排列熵集;
S2:将所述排列熵集输入双隐层量子线路循环单元神经网络进行训练和预 测,得到预测的排列熵集;
S3:计算各时间点实际的排列熵和预测的排列熵之间的误差,构建排列熵 误差集;
S4:将所述排列熵误差集归一化处理后,输入双隐层量子线路循环单元神 经网络进行训练和预测,得到预测的归一化的排列熵误差集;
S5:将预测的归一化的排列熵误差集进行反归一化处理,得到最终预测结 果;
所述方法,还包括:在步骤S2之前,构建双隐层量子线路循环单元神经网 络,其中,双隐层量子线路循环单元神经网络简称为DHL-QCRUNN,具体步骤 如下:
S21:创建量子相移门模型,得出量子比特经过相移门变换后最新状态与初 始状态之间的关系,具体如下:
记量子相移门为令量子比特的初始状态则|φ0>可 通过R(θ)进行如下变换:
式中|φ′0>表示经过相移变换后的最新状态;
S22:创建多位受控非门模型,得出在多个控制量子比特的联合控制下的目 标量子比特的输出,具体如下:
在量子系统中,单个量子比特的状态受多个量子比特的联合控制的动态行 为,以多位受控非门Cn(X)来描述,其中,|x1>,|x2>,…|xn>是控制比特,是输 入目标比特,|φ>是输出目标比特。Cn(X)的计算规则定义如下:
式中,是单比特量子非门;X的指数表示x1,x2,…,xn的积, 若前n个量子比特全为1,即|xi>=|1>,则单比特量子非门X作用到使其翻转得 到|φ>;
设控制量子比特为|xi>=αi|0>+βi|1>,目标量子比特输入态为则经过Cn(X)变换后的输出推导如下:
式中,αi 2+βi 2=1; 表示张量积;
由式(3)可知,Cn(X)的输出处于n+1个量子比特的纠缠态中,|φ>处于状态 |1>的概率为:
因此,在n个控制比特的联合控制下输出目标比特|φ>可以表示为:
式中为|φ>的相位
S23:由量子相移门和多位受控非门来创建量子线路循环单元,设定是t 时刻的控制量子比特,是t时刻的目标量子比特输入态,是第i个量子相移 门的相位,|φt>是t时刻的目标量子比特输出态,则在量子线路循环单元中,将目 标量子比特输出态|φt>作为下一时刻的目标量子比特输入,即实现对 输入序列的历史记忆,具体如下:
令t=1,2,…,T表示T个采样时间点,可表示为:
目标量子比特输出态|φt>可表示为:
根据量子相移门和多位受控非门的定义公式(1-5),可推导出|φt>的相位如下:
式中,当t=1时,
S24:创建双隐层量子线路循环单元神经网络模型,采用输出层激发态的概 率幅来表示最终输出,具体如下:以表示输入序列; 表示输入比特;表示第一隐层输入; 表示第一隐层输出;表示第二隐层输入; 为第二隐层输出;表示输出比 特;表示最终输出;
设为:
式中,为的相位,为归一化输入样本, 则,
根据量子线路循环单元的输入输出关系,第一隐层和第二隐层的输入分别 表示为:
记第一隐层输出为:
根据公式(6-8),可推导出的相位如下:
式中,j=1,2,…,p;为的相位;
当t=1时,其中表示输入层量子相移门的相位;
同理,第二隐层输出为:
则的相位如下:
式中,k=1,2,…,q;为的相位;当t=1时
其中表示第一隐层量子相移门的相位;
输出表示如下:
式中l=1,2,…,n,为的相位;
根据公式(1-5)可推导出
式中,表示第二隐层量子相门的相位。
为简化计算过程,用处于状态|1>的概率幅来表示最终输出,即:
S25:双隐层量子线路神经网络DHL-QCRUNN的学习算法:
通过更新输入层和隐层的量子相移门相位来完成每一步训练;
记第s步训练中各相位为相应的相位增量为则更新的相位可表示为:
采用LM算法更新和设DHL-QCRUNN的逼近误差函 数为:
式中,和分别表示实际输出和期望输出,则Et是关于的一致连续函数;
根据链式求导法则,的梯度可表示如下:
其中,
同理,可以计算的梯度为:
其中,
的梯度为:
令表示由输入层和双隐层量子相移门的相位组成矢量,表示误差矢量, Jt表示由各参数的梯度组成的雅克比矩阵,其定义如下:
式中,l=1,2,…,n;
利用LM算法更新
式中,为的增量; I为单位矩阵;μ是一个确保矩阵(Jt)TJt+μI可逆的微小正数;
将里的增量分别代入式(17-19),即可实现各个相位的更新,也即完成一 次对DHL-QCRUNN的训练。
作为优选的技术方案,步骤S2和S4中,将所述排列熵集或排列熵误差集 输入双隐层量子线路循环单元神经网络进行训练和预测,包括以下步骤:
将所述排列熵集或排列熵误差集通过相空间重构将样本集 分为训练样本集Xtrain和相应的期望输出集两部分,其表达 式分别如下:
其中,Xtrain的每一列表示一个m(m<b-a)维训练样本,其训练目标是对 应列中的元素,显然,训练样本总数为b-a-m+1;
DHL-QCRUNN训练步骤如下:
(1)在第一步训练中初始化相位,把[0,2π]内的值随机赋给
(2)将训练样本集输入DHL-QCRUNN计算输出
(3)利用LM算法更新以得到下一个训练周期的初始相位;
(4)重复步骤(2)和步骤(3)直到和的均方误差小于设定的阈值Emse, 或达到最大训练步数Nmax;
DHL-QCRUNN训练完成后,采用多步预测法进行状态退化趋势预测, DHL-QCRUNN的预测步骤如下:
(1)将训练集最后m个样本{xb-m+1,xb-m+2,…,xb}作为DHL-QCRUNN的初始输 入,得到b+1时刻的输出
用作为DHL-QCRUNN的输入,得到b+2时刻的输出以此类推,向DHL-QCRUNN输入得到b+N时刻的输出 完成第N步预测。
作为优选的技术方案,步骤S3中,计算各时间点的实际排列熵与预测的排 列熵之间的误差,采用下列公式:
定义b+N(b=120,121,…,932)时刻的排列熵误差为:
其中,N表示预测样本个数;xb+i和分别表示b+i时刻的排列熵实际值 和排列熵预测值。
作为优选的技术方案,所述监控对象是旋转机械,所述原始运行数据是旋 转机械的原始振动数据。
由于采用了上述技术方案,本发明的有益效果是:本发明提出了一种新型 量子神经网络——双隐层量子线路循环单元神经网络(DHL-QCRUNN),在 DHL-QCRUNN中,设计双隐层结构以提高复杂输入输出关系下的网络非线性映射 能力;引入量子相移门和多位受控非门以实现信息从输入层到输出层的传递; 利用双隐层的量子反馈机制可以获得输入序列的整体记忆;此外,本发明通过 量子Levenberg-Marquardt(LM)算法来更新DHL-QCRUNN的网络参数(即各个量 子相移门相位)以提高该神经网络的收敛性能。因此,与其它人工智能方法相 比,DHL-QCRUNN具有更好的非线性逼近能力、泛化特性和更快的收敛速度。
然后,基于DHL-QCRUNN的上述优点,用于对监控的对象的运行趋势预测, 达到了较高的预测精度、预测稳定性和计算效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施 例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述 中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付 出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的工作流程图;
图2是本发明实施例中量子相移门的拓扑图;
图3是本发明实施例中多位受控非门的拓扑图;
图4是本发明实施例中量子线路循环单元的拓扑图;
图5是本发明实施例中双隐层量子线路循环单元的拓扑图;
图6是本发明实施例中1号轴承在最后7天内的排列熵的示意图;
图7是本发明实施例中1号轴承在最后7天的归一化排列熵误差曲线图;
图8是本发明实施例中DHL-QCRUNN预测的归一化排列熵误差曲线图;
图9是本发明实施例中四种神经网络的逼近误差曲线图;
图10是本发明实施例中BPNN预测的归一化排列熵误差曲线图;
图11是本发明实施例中RNN预测的归一化排列熵误差曲线图;
图12是本发明实施例中LSTMNN预测的归一化排列熵误差曲线图;
图13是本发明实施例中LS-SVM预测的归一化排列熵误差曲线图;
图14是本发明实施例中五种状态退化趋势预测方法的计算时间比较示意图。
图15是本发明实施例中五种状态退化趋势预测方法的计算时间比较柱状示 意图。
具体实施方式
如图1所示,一种基于双隐层量子线路循环单元神经网络的趋势预测方法, 包括以下步骤:
S1:采集监控对象的原始运行数据构建排列熵集;
S2:将排列熵集输入双隐层量子线路循环单元神经网络进行训练和预测, 得到预测的排列熵集;
S3:计算各时间点实际的排列熵和预测的排列熵之间的误差,构建排列熵 误差集;
S4:将排列熵误差集归一化处理后,输入双隐层量子线路循环单元神经网 络进行训练和预测,得到预测的归一化的排列熵误差集;
S5:将预测的归一化的排列熵误差集进行反归一化处理,得到最终预测结 果;
本方法,还包括:在步骤S2之前,构建双隐层量子线路循环单元神经网络, 其中,双隐层量子线路循环单元神经网络简称为DHL-QCRUNN,具体步骤如下:
S21:创建量子相移门模型,量子相移门的拓扑图如图2所示,得出量子比 特经过相移门变换后最新状态与初始状态之间的关系,具体如下:
记量子相移门为令量子比特的初始状态则|φ0>可 通过R(θ)进行如下变换:
式中|φ′0>表示经过相移变换后的最新状态;
S22:创建多位受控非门模型,多位受控非门的拓扑图如图3所示,得出在 多个控制量子比特的联合控制下的目标量子比特的输出,具体如下:
在量子系统中,单个量子比特的状态受多个量子比特的联合控制的动态行 为,以多位受控非门Cn(X)来描述,其中,|x1>,|x2>,...|xn>是控制比特,是输 入目标比特,|φ>是输出目标比特。Cn(X)的计算规则定义如下:
式中,是单比特量子非门;X的指数表示x1,x2,…,xn的积, 若前n个量子比特全为1,即|xi>=|1>,则单比特量子非门X作用到使其翻转得 到|φ>;
设控制量子比特为|xi>=αi|0>+βi|1>,目标量子比特输入态为则经过Cn(X)变换后的输出推导如下:
式中,αi 2+βi 2=1; 表示张量积;
由式(3)可知,Cn(X)的输出处于n+1个量子比特的纠缠态中,|φ>处于状态 |1>的概率为:
因此,在n个控制比特的联合控制下输出目标比特|φ>可以表示为:
式中为|φ>的相位
S23:由量子相移门和多位受控非门来创建量子线路循环单元,量子线路循 环单元的拓扑图如图5所示,设定是t时刻的控制量子比特,是t时刻的 目标量子比特输入态,是第i个量子相移门的相位,|φt>是t时刻的目标量子比 特输出态,则在量子线路循环单元中,将目标量子比特输出态|φt>作为下一时刻 的目标量子比特输入,即实现对输入序列的历史记忆,具体如下:
令t=1,2,…,T表示T个采样时间点,可表示为:
目标量子比特输出态|φt>可表示为:
根据量子相移门和多位受控非门的定义公式(1-5),可推导出|φt>的相位如下:
式中,当t=1时,
S24:创建双隐层量子线路循环单元神经网络模型,双隐层量子线路循环单 元神经网络的拓扑图如图5所示,采用输出层激发态的概率幅来表示最终输出, 具体如下:以表示输入序列;表示输入比特; 表示第一隐层输入;表示 第一隐层输出;表示第二隐层输入; 为第二隐层输出;表示输出比特; 表示最终输出;
设为:
式中,为的相位,为归一化输入样本, 则,
根据量子线路循环单元的输入输出关系,第一隐层和第二隐层的输入分别 表示为:
记第一隐层输出为:
根据公式(6-8),可推导出的相位如下:
式中,j=1,2,…,p;为的相位;
当t=1时,其中表示输入层量子相移门的相位;
同理,第二隐层输出为:
则的相位如下:
式中,k=1,2,…,q;为的相位;当t=1时 其中表示第一隐层量子相移门的相位;
输出表示如下:
式中l=1,2,…,n,为的相位;
根据公式(1-5)可推导出
式中,表示第二隐层量子相门的相位。
为简化计算过程,用处于状态|1>的概率幅来表示最终输出,即:
S25:双隐层量子线路神经网络DHL-QCRUNN的学习算法:
通过更新输入层和隐层的量子相移门相位来完成每一步训练;
记第s步训练中各相位为相应的相位增量为则更新的相位可表示为:
采用LM算法更新和设DHL-QCRUNN的逼近误差函 数为:
式中,和分别表示实际输出和期望输出,则Et是关于的一致连续函数;
根据链式求导法则,的梯度可表示如下:
其中,
同理,可以计算的梯度为:
其中,
的梯度为:
令表示由输入层和双隐层量子相移门的相位组成矢量,表示误差矢量, Jt表示由各参数的梯度组成的雅克比矩阵,其定义如下:
式中,l=1,2,…,n;
利用LM算法更新
式中,为的增量; I为单位矩阵;μ是一个确保矩阵(Jt)TJt+μI可逆的微小正数;
将里的增量分别代入式(17-19),即可实现各个相位的更新,也即完成一 次对DHL-QCRUNN的训练。
在步骤S2和S4中,将排列熵集或排列熵误差集输入双隐层量子线路循环 单元神经网络进行训练和预测,包括以下步骤:
将排列熵集或排列熵误差集通过相空间重构将样本集分 为训练样本集Xtrain和相应的期望输出集两部分,其表达式分别如下:
其中,Xtrain的每一列表示一个m(m<b-a)维训练样本,其训练目标是对 应列中的元素,显然,训练样本总数为b-a-m+1;
DHL-QCRUNN训练步骤如下:
(1)在第一步训练中初始化相位,把[0,2π]内的值随机赋给
(2)将训练样本集输入DHL-QCRUNN计算输出
(3)利用LM算法更新以得到下一个训练周期的初始相位;
(4)重复步骤(2)和步骤(3)直到和的均方误差小于设定的阈值Emse, 或达到最大训练步数Nmax;
DHL-QCRUNN训练完成后,采用多步预测法进行状态退化趋势预测, DHL-QCRUNN的预测步骤如下:
(1)将训练集最后m个样本{xb-m+1,xb-m+2,…,xb}作为DHL-QCRUNN的初始输 入,得到b+1时刻的输出
用作为DHL-QCRUNN的输入,得到b+2时刻的输出以此类推,向DHL-QCRUNN输入得到b+N时刻的输出 完成第N步预测。
在步骤S3中,计算各时间点的实际排列熵与预测的排列熵之间的误差,采 用下列公式:
定义b+N(b=120,121,…,932)时刻的排列熵误差为:
其中,N表示预测样本个数;xb+i和分别表示b+i时刻的排列熵实际值 和排列熵预测值。
本实施例以Cincinnati大学实测的滚动轴承状态退化数据验证本发明所提 出的方法:在轴承实验台的转轴上安装四个航空专用轴承,这些航空轴承为 Rexnord公司制造的ZA-2115双列滚子轴承,交流电机通过带传动以2000r/min 的恒定转速带动转轴旋转,实验过程中轴承被施加6000lbs的径向载荷。采样 频率为20kHz,采样长度为20480个点,每隔10min采集一次轴承的振动数据, 轴承持续运行直到出现故障。
在该实验中,1号轴承运行到第七天时因出现外圈故障而失效,采用1号轴 承的状态退化数据来验证本发明所提方法的有效性。取1号轴承运行七天的状 态退化的振动数据(即984个样本)来构造排列熵,其中,排列熵算法的嵌入维 数和时间延迟分别设为d=5和τ=3。
构造的排列熵如图6所示,从第548点开始出现明显下降曲线,表明轴承 处于初始退化阶段(早期故障阶段)。从第548到第697点开始出现明显不规则 曲线,表明轴承出现了较大外圈缺陷,在697点以后不规则曲线密集程度明显 增多,表明该轴承已出现严重故障,濒临失效。
采用用DHL-QCRUNN来完成对各组排列熵序列的预测。
DHL-QCRUNN的参数设定如下:输入层维数m=8;第一隐层维数p=6;第二隐 层维数q=10;输出层维数n=1;最大训练步数Nmax=5000;均方误差阈值 Emse=0.0001,预测样本数N=50。
令分别将每组排列熵输入DHL-QCRUNN,来完 成每组相应的50个排列熵样本的预测。
再根据式(36)可计算排列熵误差((Epe)170,…,(Epe)982),经归一化处理后得到((Epen)170,…,(Epen)982),如图7所示。
再通过DHL-QCRUNN来预测归一化排列熵误差。DHL-QCRUNN的参数设定如下: 输入层维数m=8;第一隐层维数p=6;第二隐层维数q=10;输出层维数n=1; 最大训练步数Nmax=5000;均方误差阈值Emse=0.0001。预测样本数取N=50。
图7中第600到679个采样点处于初始退化阶段,是状态退化趋势观测中 最重要的时间序列数据。因此,取这80个样本的实际归一化排列熵误差进行预 测验证,其中前30个样本点作为训练样本(即令a=600,b=629),后50个样 本点作为测试样本,使用DHL-QCRUNN并根据第2节的多步向前预测法来预测后 50个测试样本的归一化排列熵误差值,最终预测曲线如图8所示。
图8结果表明,被预测的在[630,679]区间内的归一化排列熵误差与图7对应 的实际归一化排列熵误差非常接近,即由预测的归一化排列熵误差拟合的曲线 与实际归一化排列熵误差的动态趋势(即实际状态退化趋势)一致,说明基于 DHL-QCRUNN的趋势预测方法是有效的,可以将该方法用于旋转机械的状态退化 趋势预测。
通过三组比较来验证所提出的基于DHL-QCRUNN的旋转机械状态退化趋势预 测方法的优势:
利用用BPNN、RNN和LSTMNN与DHL-QCRUNN进行收敛特性比较,各神经网 络参数设置保持不变,这四种神经网络的逼近误差如图9所示。
从图9中可以看出,相较于BPNN、RNN、LSTMNN,DHL-QCRUNN的逼近误差 更快的达到了设定阈值,说明所提出的DHL-QCRUNN具有更好的泛化特性和更快 的收敛速度。
然后,将基于DHL-QCRUNN方法得到的预测精度与基于其它方法(BPNN、RNN、LSTMNN和LS-SVM)获得的预测精度相比较。后四种方法的训练次数及预测方式(即输入输出方式)同本发明DHL-QCRUNN保持一致。
BPNN、RNN、LSTMNN的学习率均设为α=0.5;LS-SVM选择RBF核函数,通过 留一法交叉验证参数优化算法自动设置核参数和正则化参数。采用这些方法得 到的双列滚子轴承的状态退化趋势预测结果如图10至图13所示。
为进一步定量评价预测精度,采用均方根误差(RMSE)作为评价指标,其表 达式为:
其中,N表示预测样本个数;(Epe)b+i和分别表示第b+i个样本点的 实际的归一化排列熵误差和预测的归一化排列熵误差。
在DHL-QCRUNN、BPNN、RNN、LSTMNN、LS-SVM参数设置保持不变的条件下, 用这五种预测方法重复进行100次预测,取最小均方根误差emin、最大均方根误 差emax、平均均方根误差作为100次预测的预测误差评价指标,结果见表1。
表1 5种状态退化趋势预测方法的预测误差比较
图9和表1结果表明,DHL-QCRUNN的平均预测误差相对最小,且预测误差 的波动范围也相对最小,说明将DHL-QCRUNN用于双列滚子轴承的状态退化趋势 预测,相比于BPNN、RNN、LSTMNN及LS-SVM可以取得更高的预测精度和预测稳 定性。
最后,将BPNN、RNN、LSTMNN与LS-SVM进行状态退化趋势预测的计算时间 与DHL-QCRUNN的计算时间进行对比,其结果如图14所示。DHL-QCRUNN的计算 时间为0.870189s,BPNN的计算时间为1.215257s,RNN的计算时间为1.252406 s,LSTMNN的计算时间为4.856815s,LS-SVM的计算时间为0.181720s, DHL-QCRUNN的计算时间仅比LS-SVM略长(两者仍处于同一数量级)。表明与BPNN、 RNN、LSTMNN和LS-SVM四种方法相比,本发明提出的基于DHL-QCRUNN的趋势预 测方法应用于旋转机械状态退化趋势预测具有更高的计算效率。
以上显示和描述了本发明的基本原理、主要特征及本发明的优点。本行业 的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中 描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明 还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本 发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (4)
1.一种基于双隐层量子线路循环单元神经网络的趋势预测方法,其特征在于,包括以下步骤:
S1:采集监控对象的原始运行数据构建排列熵集;
S2:将所述排列熵集输入双隐层量子线路循环单元神经网络进行训练和预测,得到预测的排列熵集;
S3:计算各时间点实际的排列熵和预测的排列熵之间的误差,构建排列熵误差集;
S4:将所述排列熵误差集归一化处理后,输入双隐层量子线路循环单元神经网络进行训练和预测,得到预测的归一化的排列熵误差集;
S5:将预测的归一化的排列熵误差集进行反归一化处理,得到最终预测结果;
所述方法,还包括:在步骤S2之前,构建双隐层量子线路循环单元神经网络,其中,双隐层量子线路循环单元神经网络简称为DHL-QCRUNN,具体步骤如下:
S21:创建量子相移门模型,得出量子比特经过相移门变换后最新状态与初始状态之间的关系,具体如下:
记量子相移门为令量子比特的初始状态则|φ0>可通过R(θ)进行如下变换:
式中|φ′0>表示经过相移变换后的最新状态;
S22:创建多位受控非门模型,得出在多个控制量子比特的联合控制下的目标量子比特的输出,具体如下:
在量子系统中,单个量子比特的状态受多个量子比特的联合控制的动态行为,以多位受控非门Cn(X)来描述,其中,|x1>,|x2>,...|xn>是控制比特,是输入目标比特,|φ>是输出目标比特。Cn(X)的计算规则定义如下:
式中,是单比特量子非门;X的指数表示x1,x2,...,xn的积,若前n个量子比特全为1,即|xi>=|1>,则单比特量子非门X作用到使其翻转得到|φ>;
设控制量子比特为|xi>=αi|0>+βi|1>,目标量子比特输入态为则经过Cn(X)变换后的输出推导如下:
式中,αi 2+βi 2=1; 表示张量积;
由式(3)可知,Cn(X)的输出处于n+1个量子比特的纠缠态中,|φ>处于状态|1>的概率为:
因此,在n个控制比特的联合控制下输出目标比特|φ>可以表示为:
式中为|φ>的相位
S23:由量子相移门和多位受控非门来创建量子线路循环单元,设定是t时刻的控制量子比特,是t时刻的目标量子比特输入态,是第i个量子相移门的相位,|φt>是t时刻的目标量子比特输出态,则在量子线路循环单元中,将目标量子比特输出态|φt>作为下一时刻的目标量子比特输入,即实现对输入序列的历史记忆,具体如下:
令t=1,2,…,T表示T个采样时间点,可表示为:
目标量子比特输出态|φt>可表示为:
根据量子相移门和多位受控非门的定义公式(1-5),可推导出|φt>的相位如下:
式中,当t=1时,
S24:创建双隐层量子线路循环单元神经网络模型,采用输出层激发态的概率幅来表示最终输出,具体如下:以表示输入序列; 表示输入比特;表示第一隐层输入; 表示第一隐层输出;表示第二隐层输入;为第二隐层输出;表示输出比特;表示最终输出;
设为:
式中,为的相位,为归一化输入样本,则,
根据量子线路循环单元的输入输出关系,第一隐层和第二隐层的输入分别表示为:
记第一隐层输出为:
根据公式(6-8),可推导出的相位如下:
式中,j=1,2,…,p;为的相位;
当t=1时,其中表示输入层量子相移门的相位;
同理,第二隐层输出为:
则的相位如下:
式中,k=1,2,…,q;为的相位;当t=1时 其中表示第一隐层量子相移门的相位;
输出表示如下:
式中l=1,2,…,n,为的相位;
根据公式(1-5)可推导出
式中,表示第二隐层量子相门的相位。
为简化计算过程,用处于状态|1>的概率幅来表示最终输出,即:
S25:双隐层量子线路神经网络DHL-QCRUNN的学习算法:
通过更新输入层和隐层的量子相移门相位来完成每一步训练;
记第s步训练中各相位为相应的相位增量为则更新的相位可表示为:
采用LM算法更新和设DHL-QCRUNN的逼近误差函数为:
式中,和分别表示实际输出和期望输出,则Et是关于的一致连续函数;
根据链式求导法则,的梯度可表示如下:
其中,
同理,可以计算的梯度为:
其中,
的梯度为:
令表示由输入层和双隐层量子相移门的相位组成矢量,表示误差矢量,Jt表示由各参数的梯度组成的雅克比矩阵,其定义如下:
式中,
利用LM算法更新
式中,为的增量;I为单位矩阵;μ是一个确保矩阵(Jt)TJt+μI可逆的微小正数;
将里的增量分别代入式(17-19),即可实现各个相位的更新,也即完成一次对DHL-QCRUNN的训练。
2.如权利要求1所述的一种基于双隐层量子线路循环单元神经网络的趋势预测方法,其特征在于:步骤S2和S4中,将所述排列熵集或排列熵误差集输入双隐层量子线路循环单元神经网络进行训练和预测,包括以下步骤:
将所述排列熵集或排列熵误差集通过相空间重构将样本集分为训练样本集Xtrain和相应的期望输出集两部分,其表达式分别如下:
其中,Xtrain的每一列表示一个m(m<b-a)维训练样本,其训练目标是对应列中的元素,显然,训练样本总数为b-a-m+1;
DHL-QCRUNN训练步骤如下:
(1)在第一步训练中初始化相位,把[0,2π]内的值随机赋给
(2)将训练样本集输入DHL-QCRUNN计算输出
(3)利用LM算法更新以得到下一个训练周期的初始相位;
(4)重复步骤(2)和步骤(3)直到和的均方误差小于设定的阈值Emse,或达到最大训练步数Nmax;
DHL-QCRUNN训练完成后,采用多步预测法进行状态退化趋势预测,DHL-QCRUNN的预测步骤如下:
(1)将训练集最后m个样本{xb-m+1,xb-m+2,…,xb}作为DHL-QCRUNN的初始输入,得到b+1时刻的输出
用作为DHL-QCRUNN的输入,得到b+2时刻的输出以此类推,向DHL-QCRUNN输入得到b+N时刻的输出完成第N步预测。
3.如权利要求1所述的一种基于双隐层量子线路循环单元神经网络的趋势预测方法,其特征在于:步骤S3中,计算各时间点的实际排列熵与预测的排列熵之间的误差,采用下列公式:
定义b+N(b=120,121,…,932)时刻的排列熵误差为:
其中,N表示预测样本个数;xb+i和分别表示b+i时刻的排列熵实际值和排列熵预测值。
4.如权利要求1所述的一种基于双隐层量子线路循环单元神经网络的趋势预测方法,其特征在于:所述监控对象是旋转机械,所述原始运行数据是旋转机械的原始振动数据。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2018106687152 | 2018-06-23 | ||
CN201810668715 | 2018-06-23 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110361966A true CN110361966A (zh) | 2019-10-22 |
CN110361966B CN110361966B (zh) | 2022-05-27 |
Family
ID=68215117
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811507945.7A Active CN110361966B (zh) | 2018-06-23 | 2018-12-11 | 一种基于双隐层量子线路循环单元神经网络的趋势预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110361966B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104392143A (zh) * | 2014-12-09 | 2015-03-04 | 北京四方继保自动化股份有限公司 | 一种自适应量子神经网络汽轮机故障趋势预测方法 |
CN104951836A (zh) * | 2014-03-25 | 2015-09-30 | 上海市玻森数据科技有限公司 | 基于神经网络技术的发帖预测系统 |
CN105139274A (zh) * | 2015-08-16 | 2015-12-09 | 东北石油大学 | 基于量子粒子群与小波神经网络的输电线路覆冰预测方法 |
CN105913026A (zh) * | 2016-04-12 | 2016-08-31 | 江苏大学 | 一种基于Haar-PCA特征和概率神经网络的行人检测方法 |
CN106127300A (zh) * | 2016-07-04 | 2016-11-16 | 哈尔滨理工大学 | 一种旋转机械健康状态预测方法 |
CN106529701A (zh) * | 2016-10-21 | 2017-03-22 | 国网吉林省电力有限公司信息通信公司 | 基于改进的萤火虫算法优化神经网络的光纤状态预测方法 |
CN107194460A (zh) * | 2017-05-22 | 2017-09-22 | 厦门大学 | 金融时间序列预测的量子粒子群优化递归神经网络方法 |
CN107592198A (zh) * | 2017-07-24 | 2018-01-16 | 广东工业大学 | 量子 Fourier 变换的四维 Hopfield 神经网络图像加密方法 |
-
2018
- 2018-12-11 CN CN201811507945.7A patent/CN110361966B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104951836A (zh) * | 2014-03-25 | 2015-09-30 | 上海市玻森数据科技有限公司 | 基于神经网络技术的发帖预测系统 |
CN104392143A (zh) * | 2014-12-09 | 2015-03-04 | 北京四方继保自动化股份有限公司 | 一种自适应量子神经网络汽轮机故障趋势预测方法 |
CN105139274A (zh) * | 2015-08-16 | 2015-12-09 | 东北石油大学 | 基于量子粒子群与小波神经网络的输电线路覆冰预测方法 |
CN105913026A (zh) * | 2016-04-12 | 2016-08-31 | 江苏大学 | 一种基于Haar-PCA特征和概率神经网络的行人检测方法 |
CN106127300A (zh) * | 2016-07-04 | 2016-11-16 | 哈尔滨理工大学 | 一种旋转机械健康状态预测方法 |
CN106529701A (zh) * | 2016-10-21 | 2017-03-22 | 国网吉林省电力有限公司信息通信公司 | 基于改进的萤火虫算法优化神经网络的光纤状态预测方法 |
CN107194460A (zh) * | 2017-05-22 | 2017-09-22 | 厦门大学 | 金融时间序列预测的量子粒子群优化递归神经网络方法 |
CN107592198A (zh) * | 2017-07-24 | 2018-01-16 | 广东工业大学 | 量子 Fourier 变换的四维 Hopfield 神经网络图像加密方法 |
Non-Patent Citations (3)
Title |
---|
YAGUO LEI等: "A Model-Based Method for Remaining Useful Life Prediction of Machinery", 《 IEEE TRANSACTIONS ON RELIABILITY》 * |
孟祥萍等: "基于量子计算多Agent系统理论的人工神经网络训练方法", 《系统仿真技术及其应用》 * |
李鹏华等: "量子门Elman神经网络及其梯度扩展的量子反向传播学习算法", 《自动化学报》 * |
Also Published As
Publication number | Publication date |
---|---|
CN110361966B (zh) | 2022-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | A hybrid wind power forecasting approach based on Bayesian model averaging and ensemble learning | |
Zhang et al. | Prediction of remaining useful life based on bidirectional gated recurrent unit with temporal self-attention mechanism | |
Wang et al. | Degradation evaluation of slewing bearing using HMM and improved GRU | |
Xu et al. | Assessing short-term voltage stability of electric power systems by a hierarchical intelligent system | |
Wang et al. | A deep feature enhanced reinforcement learning method for rolling bearing fault diagnosis | |
Hong et al. | Application of Gaussian process regression for bearing degradation assessment | |
Wang et al. | A hybrid optimization-based recurrent neural network for real-time data prediction | |
CN108428023B (zh) | 基于量子加权门限重复单元神经网络的趋势预测方法 | |
CN109447305A (zh) | 一种基于量子加权长短时记忆神经网络的趋势预测方法 | |
Xiang et al. | Quantum weighted gated recurrent unit neural network and its application in performance degradation trend prediction of rotating machinery | |
CN109766745A (zh) | 强化学习三态组合长短时记忆神经网络系统及训练和预测方法 | |
Zheng et al. | Real-time transient stability assessment based on deep recurrent neural network | |
Yang et al. | A continual learning-based framework for developing a single wind turbine cybertwin adaptively serving multiple modeling tasks | |
Zhu et al. | Condition monitoring of wind turbine based on deep learning networks and kernel principal component analysis | |
Tang et al. | Prediction of bearing performance degradation with bottleneck feature based on LSTM network | |
Chen et al. | Transfer life prediction of gears by cross-domain health indicator construction and multi-hierarchical long-term memory augmented network | |
Henriksen et al. | Electrical load forecasting utilizing an explainable artificial intelligence (xai) tool on norwegian residential buildings | |
Shahriyari et al. | A Deep Learning-Based Approach for Comprehensive Rotor Angle Stability Assessment | |
Qin et al. | Dynamic weighted federated remaining useful life prediction approach for rotating machinery | |
Yanwen et al. | Security assessment of coal mine power grid voltage based on an improved AHP‐FCE | |
Wang et al. | Cloud computing and extreme learning machine for a distributed energy consumption forecasting in equipment-manufacturing enterprises | |
CN110361966A (zh) | 一种基于双隐层量子线路循环单元神经网络的趋势预测方法 | |
Sun et al. | A data-driven framework for tunnel infrastructure maintenance | |
Bouazzi et al. | Deep recurrent neural networks based Bayesian optimization for fault diagnosis of uncertain GCPV systems depending on outdoor condition variation | |
Doudkin et al. | Spacecraft Telemetry Time Series Forecasting With Ensembles of Neural Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |