CN108256238B - 一种基于深度学习的光纤光栅波长解调方法及装置 - Google Patents

一种基于深度学习的光纤光栅波长解调方法及装置 Download PDF

Info

Publication number
CN108256238B
CN108256238B CN201810061027.XA CN201810061027A CN108256238B CN 108256238 B CN108256238 B CN 108256238B CN 201810061027 A CN201810061027 A CN 201810061027A CN 108256238 B CN108256238 B CN 108256238B
Authority
CN
China
Prior art keywords
layer
network
function
data
parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201810061027.XA
Other languages
English (en)
Other versions
CN108256238A (zh
Inventor
邹承明
张天柱
柳星
姜德生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University of Technology WUT
Original Assignee
Wuhan University of Technology WUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University of Technology WUT filed Critical Wuhan University of Technology WUT
Priority to CN201810061027.XA priority Critical patent/CN108256238B/zh
Publication of CN108256238A publication Critical patent/CN108256238A/zh
Application granted granted Critical
Publication of CN108256238B publication Critical patent/CN108256238B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/061Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using biological neurons, e.g. biological neurons connected to an integrated circuit

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Neurology (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Geometry (AREA)
  • Computer Hardware Design (AREA)
  • Optical Communication System (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度学习的光纤光栅波长解调方法及装置,具体提出了一种基于深度神经网络来对光纤光栅获取的波峰数据进行拟合的寻峰方法。综合BatchNormalization、Dropout和L2范数正则化的技术,解决了深度神经网络中训练速度过慢、参数修改繁琐、易陷入局部最优和过拟合的问题。本发明实现了针对光纤光栅波长解调仪波峰数据的高速高精度寻峰算法。

Description

一种基于深度学习的光纤光栅波长解调方法及装置
技术领域
本发明涉及一种光纤光栅的波长解调方法领域,具体涉及一种使用深度学习来分析光纤光栅波长解调仪中的波峰数据并进行寻峰的方法及装置。
背景技术
随着现代工业的发展,各种传感检测领域对检测精度、速度、可靠性以及设备成本有了更高的要求,而当前一些相关的光纤光栅传感解调产品未能尽然满足其要求。只有提高光纤光栅解调仪的解调速度和精度,才能更好的实现复杂机械系统的状态监测,如何实现光纤光栅高速、高精度解调,已成为影响其广泛发展的瓶颈之一。
传统的解调方法具有解调速度不够快以及精度不高等问题,尤其是当数据量特别大时,解析速度尤为滞后。而神经网络具有很强的拟合能力,可以映射任意复杂的非线性关系;并且其泛化的特点能够对训练样本有很好的预测和控制,能有效解决波峰数据中存在的大量噪声所造成的影响;且网络的中间层数、各层的处理单元数及网络的学习系数等参数可根据具体情况设定,灵活性很大。结合这些特点,我们将其应用于光纤光栅波长解调仪的数据分析中,大大提高对数据的拟合结果的精度。
传统的神经网络具有参数选择繁琐、训练速度较慢、容易陷入局部最优和过拟合等问题,尤其是在深度神经网络中,当网络的层数加大时这些问题更为突出。
发明内容
为了弥补现有技术的不足,完成对光纤光栅波长解调仪数据的高速高进度分析,本发明考虑到神经网络拟合能力强、泛化能力强和自适应性强的特点,并综合BatchNormalization、Dropout和L2范数正则化的技术,提出了一种基于深度学习的高速高精度的光纤光栅波长解调方法及装置。
本发明采用的技术方案如下:
一种基于深度学习的光纤光栅波长解调方法,包括以下步骤:
步骤A1:解析光纤光栅波长解调仪接收的波峰数据并生成训练样本;
步骤A2:初始化神经网络;
步骤A3:采集训练样本并对每层神经元进行BatchNormalization处理;
步骤A4:对每层神经元进行Dropout的处理,并引入L2范数进行正则化,使用随机梯度下降法更新网络权重参数θt
步骤A5:计算预测误差,更新网络的参数矩阵;
步骤A6:判断预测误差是否满足终止条件,若否,回转执行步骤A3;若是,更新θ*=θt
步骤A7:训练结束,得到网络模型;
步骤A8:将需要检测的波峰数据放入训练好的网络,通过模型获得波峰数据的高斯函数参数;函数的参数即是波峰所在位置和波峰值。
其中,步骤A1的具体实现包括以下子步骤:
步骤A1.1:获取光纤光栅波长解调仪的波峰数据,用传统方法拟合这些数据,得到它们的高斯函数参数,作为输出样本Y;
步骤A1.2:用高斯参数决定的函数表达式随机生成L个数据点,作为输入样本
Figure BDA0001555308010000021
其中
Figure BDA0001555308010000022
依此法生成m个训练样本。
其中,步骤A2的具体实现包括以下子步骤:
步骤A2.1:定义n层的神经网络{h1,h2,...,hn},每层的输出函数表示为hi(x)=g(θix);其中g(x)表示非线性激活函数,不同神经网络层之间允许使用不同的激活函数,θi表示第i层的参数矩阵,x表示与其对应层神经元的输入向量;
步骤A2.2:定义网络执行第t次时包含了所有层的参数矩阵为θt,给初始状态网络参数θ0赋初值。
其中,步骤A3中所述的对每层神经元进行BatchNormalization处理,具体实现方式实包括以下子步骤:
步骤A3.1:采集训练样本{(X1,Y1),(X2,Y2),...,(Xm,Ym)};
步骤A3.2:计算每一批训练数据每层神经元xi的平均值
Figure BDA0001555308010000023
其中m是当前层神经元的个数,xi是每个神经元的输入;
步骤A3.3:计算每层神经元xi的均方差
Figure BDA0001555308010000031
步骤A3.4:对输入xi进行归一化处理,
Figure BDA0001555308010000032
其中ε是防止分母过于接近于0的较小的常数;
步骤A3.5:得到新的神经元输入
Figure BDA0001555308010000033
其中γ、β是通过链式法则学习到的重构参数,通过调节该参数可以恢复出原始网络所具有的特征分布。
其中,步骤A4中所述的Dropout处理的具体实现方式包括以下子步骤:
步骤A4.1:以概率p,随机生成一个0、1的向量,记为门控变量σj;依此法生成门控变量σ1,σ2,...,σm
步骤A4.2:设置门控矩阵Ai,为含有门控变量rj的矩阵;定义经过门控层后的输出函数
Figure BDA0001555308010000034
其中·表示按元素相乘。
其中,步骤A5中所述的计算预测误差的具体计算方式包括以下子步骤:
步骤A5.1:用fθ,σ表示参数为θ、门控变量为σ的神经网络,定义误差函数Rθ并引入L2范数,
Figure BDA0001555308010000035
其中
Figure BDA0001555308010000036
是用于惩罚预测误差的损失函数,λ∈[0,1]为正则化的超参数;
步骤A5.2:由于采取了BatchNormalization操作,更新验证误差函数中的
Figure BDA0001555308010000037
其中E[x]=Eββ],
Figure BDA0001555308010000038
步骤A5.3:生成新的学习率ηt,更新参数矩阵
Figure BDA0001555308010000039
一种基于深度学习的光纤光栅波长解调装置,包括:
解析单元,用于解析光纤光栅波长解调仪接收的波峰数据并生成训练样本;
初始化单元,用于初始化神经网络;
第一处理单元,用于采集训练样本并对每层神经元进行BatchNormalization处理;
第二处理单元,用于对每层神经元进行Dropout的处理,并引入L2范数进行正则化,使用随机梯度下降法更新网络权重参数θt
数据更新单元,用于计算预测误差,更新网络的参数矩阵;
判断单元,用于判断预测误差是否满足终止条件,若否,回转执行第一处理单元;若是,更新θ*=θt
网络模型获取单元,用于训练结束,得到网络模型;
计算单元,用于将需要检测的波峰数据放入训练好的网络,通过模型获得波峰数据的高斯函数参数;函数的参数即是波峰所在位置和波峰值。
其中,所述解析单元,具体用于:
步骤A1.1:获取光纤光栅波长解调仪的波峰数据,用传统方法拟合这些数据,得到它们的高斯函数参数,作为输出样本Y;
步骤A1.2:用高斯参数决定的函数表达式随机生成L个数据点,作为输入样本
Figure BDA0001555308010000041
其中
Figure BDA0001555308010000042
依此法生成m个训练样本。
其中,所述初始化单元,具体用于:
步骤A2.1:定义n层的神经网络{h1,h2,...,hn},每层的输出函数表示为hi(x)=g(θix);其中g(x)表示非线性激活函数,不同神经网络层之间允许使用不同的激活函数,θi表示第i层的参数矩阵,x表示与其对应层神经元的输入向量;
步骤A2.2:定义网络执行第t次时包含了所有层的参数矩阵为θt,给初始状态网络参数θ0赋初值;
所述第一处理单元中的对每层神经元进行BatchNormalization处理,具体实现方式实包括以下子步骤:
步骤A3.1:采集训练样本{(X1,Y1),(X2,Y2),...,(Xm,Ym)};
步骤A3.2:计算每一批训练数据每层神经元xi的平均值
Figure BDA0001555308010000051
其中m是当前层神经元的个数,xi是每个神经元的输入;
步骤A3.3:计算每层神经元xi的均方差
Figure BDA0001555308010000052
步骤A3.4:对输入xi进行归一化处理,
Figure BDA0001555308010000053
其中ε是防止分母过于接近于0的较小的常数;
步骤A3.5:得到新的神经元输入
Figure BDA0001555308010000054
其中γ、β是通过链式法则学习到的重构参数,通过调节该参数可以恢复出原始网络所具有的特征分布。
其中,所述第二处理单元中的Dropout处理的具体实现方式包括以下子步骤:
步骤A4.1:以概率p,随机生成一个0、1的向量,记为门控变量σj;依此法生成门控变量σ1,σ2,...,σm
步骤A4.2:设置门控矩阵Ai,为含有门控变量rj的矩阵;定义经过门控层后的输出函数
Figure BDA0001555308010000055
其中·表示按元素相乘;
所述数据更新单元中的计算预测误差的具体计算方式包括以下子步骤:
步骤A5.1:用fθ,σ表示参数为θ、门控变量为σ的神经网络,定义误差函数Rθ并引入L2范数,
Figure BDA0001555308010000056
其中
Figure BDA0001555308010000057
是用于惩罚预测误差的损失函数,λ∈[0,1]为正则化的超参数;
步骤A5.2:由于采取了BatchNormalization操作,更新验证误差函数中的
Figure BDA0001555308010000058
其中E[x]=Eββ],
Figure BDA0001555308010000059
步骤A5.3:生成新的学习率ηt,更新参数矩阵
Figure BDA00015553080100000510
有益效果:
本发明将神经网络应用于光纤光栅解调中,大大提高了对波峰数据解调的精度,改善了传统解调方法精度不够、面对大量数据时速度过慢的问题;本发明考虑神经网络的特性,并综合BatchNormalization、Dropout和L2范数正则化的技术,解决了深度神经网络中训练速度过慢、参数修改繁琐、易陷入局部最优和容易产生过拟合的问题,能非常有效地对光纤光栅的波峰数据进行高速高精度解调,灵活度高、适应能力强,可以有效面对各种应用场景。
附图说明
图1为本发明实施例的一种基于深度学习的光纤光栅波长解调方法的流程图;
图2为本发明实施例的一种基于深度学习的光纤光栅波长解调装置的结构示意图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
实施例1
请见图1,本发明提供的一种基于深度学习的光纤光栅解调方法,包括以下步骤:
步骤01:获取光纤光栅波长解调仪的波峰数据,用传统方法拟合这些数据,得到它们的高斯函数参数,作为输出样本Y;
步骤02:用高斯参数决定的函数表达式随机生成L个数据点,作为输入样本
Figure BDA0001555308010000061
其中
Figure BDA0001555308010000062
依此法生成m个训练样本;
步骤03:定义n层的神经网络{h1,h2,...,hn},每层的输出函数表示为hi(x)=g(θix);其中g(x)表示非线性激活函数,不同神经网络层之间允许使用不同的激活函数,θi表示第i层的参数矩阵,x表示与其对应层神经元的输入向量;
步骤04:定义网络执行第t次时包含了所有层的参数矩阵为θt,给初始状态网络参数θ0赋初值;
步骤05:采集训练样本{(X1,Y1),(X2,Y2),...,(Xm,Ym)}
步骤06:计算每一批训练数据每层神经元xi的平均值
Figure BDA0001555308010000071
其中m是当前层神经元的个数,xi是每个神经元的输入;
步骤07:计算每层神经元xi的均方差
Figure BDA0001555308010000072
步骤08:对输入xi进行归一化处理,
Figure BDA0001555308010000073
其中ε是防止分母过于接近于0的较小的常数;
步骤09:得到新的神经元输入
Figure BDA0001555308010000074
其中γ、β是通过链式法则学习到的重构参数,通过调节该参数可以恢复出原始网络所具有的特征分布;
步骤10:以概率p,随机生成一个0、1的向量,记为门控变量σj;依此法生成门控变量σ1,σ2,...,σm
步骤11:设置门控矩阵Ai,为含有门控变量rj的矩阵;定义经过门控层后的输出函数
Figure BDA0001555308010000075
其中·表示按元素相乘;
步骤12:用fθ,σ表示参数为θ、门控变量为σ的神经网络,定义误差函数Rθ并引入L2范数,
Figure BDA0001555308010000076
其中
Figure BDA0001555308010000077
是用于惩罚预测误差的损失函数,λ∈[0,1]为正则化的超参数;
步骤A13:由于采取了BatchNormalization操作,更新验证误差函数中的
Figure BDA0001555308010000078
其中E[x]=Eββ],
Figure BDA0001555308010000079
步骤A14:生成新的学习率ηt,更新参数矩阵
Figure BDA0001555308010000081
步骤15:判断预测误差是否满足终止条件,若否,回转执行步骤步骤05;若是,更新θ*=θt
步骤16:训练结束,得到网络模型;
步骤17:将需要检测的波峰数据放入训练好的网络,通过模型获得波峰数据的高斯函数参数;函数的参数即是波峰所在位置和波峰值。
本发明公开了一种基于深度学习的光纤光栅波长解调方法及装置,具体提出了一种基于深度神经网络来对光纤光栅获取的波峰数据进行拟合的寻峰方法。综合BatchNormalization、Dropout和L2范数正则化的技术,解决了深度神经网络中训练速度过慢、参数修改繁琐、易陷入局部最优和过拟合的问题。本发明实现了针对光纤光栅波长解调仪波峰数据的高速高精度寻峰算法。
实施例2
本实施例属于装置实施例,与上述实施例1方法实施例属于同一技术构思,在本实施例中未详尽描述的内容,请参见方法实施例1.
如图2所示,本发明所述的一种基于深度学习的光纤光栅波长解调装置,包括:
解析单元,用于解析光纤光栅波长解调仪接收的波峰数据并生成训练样本;
初始化单元,用于初始化神经网络;
第一处理单元,用于采集训练样本并对每层神经元进行BatchNormalization处理;
第二处理单元,用于对每层神经元进行Dropout的处理,并引入L2范数进行正则化,使用随机梯度下降法更新网络权重参数θt
数据更新单元,用于计算预测误差,更新网络的参数矩阵;
判断单元,用于判断预测误差是否满足终止条件,若否,回转执行第一处理单元;若是,更新θ*=θt
网络模型获取单元,用于训练结束,得到网络模型;
计算单元,用于将需要检测的波峰数据放入训练好的网络,通过模型获得波峰数据的高斯函数参数;函数的参数即是波峰所在位置和波峰值。
其中,所述解析单元,具体用于:
步骤A1.1:获取光纤光栅波长解调仪的波峰数据,用传统方法拟合这些数据,得到它们的高斯函数参数,作为输出样本Y;
步骤A1.2:用高斯参数决定的函数表达式随机生成L个数据点,作为输入样本
Figure BDA0001555308010000091
其中
Figure BDA0001555308010000092
依此法生成m个训练样本。
其中,所述初始化单元,具体用于:
步骤A2.1:定义n层的神经网络{h1,h2,...,hn},每层的输出函数表示为hi(x)=g(θix);其中g(x)表示非线性激活函数,不同神经网络层之间允许使用不同的激活函数,θi表示第i层的参数矩阵,x表示与其对应层神经元的输入向量;
步骤A2.2:定义网络执行第t次时包含了所有层的参数矩阵为θt,给初始状态网络参数θ0赋初值;
所述第一处理单元中的对每层神经元进行BatchNormalization处理,具体实现方式实包括以下子步骤:
步骤A3.1:采集训练样本{(X1,Y1),(X2,Y2),...,(Xm,Ym)};
步骤A3.2:计算每一批训练数据每层神经元xi的平均值
Figure BDA0001555308010000093
其中m是当前层神经元的个数,xi是每个神经元的输入;
步骤A3.3:计算每层神经元xi的均方差
Figure BDA0001555308010000094
步骤A3.4:对输入xi进行归一化处理,
Figure BDA0001555308010000095
其中ε是防止分母过于接近于0的较小的常数;
步骤A3.5:得到新的神经元输入
Figure BDA0001555308010000096
其中γ、β是通过链式法则学习到的重构参数,通过调节该参数可以恢复出原始网络所具有的特征分布。
其中,所述第二处理单元中的Dropout处理的具体实现方式包括以下子步骤:
步骤A4.1:以概率p,随机生成一个0、1的向量,记为门控变量σj;依此法生成门控变量σ1,σ2,...,σm
步骤A4.2:设置门控矩阵Ai,为含有门控变量rj的矩阵;定义经过门控层后的输出函数
Figure BDA0001555308010000101
其中·表示按元素相乘;
步骤A4.3:用fθ,σ表示参数为θ、门控变量为σ的神经网络,定义误差函数Rθ并引入L2范数,
Figure BDA0001555308010000102
其中
Figure BDA0001555308010000103
是用于惩罚预测误差的损失函数,λ∈[0,1]为正则化的超参数;
所述数据更新单元中的计算预测误差的具体计算方式包括以下子步骤:
步骤A5.1:用fθ,σ表示参数为θ、门控变量为σ的神经网络,定义误差函数Rθ并引入L2范数,
Figure BDA0001555308010000104
其中
Figure BDA0001555308010000105
是用于惩罚预测误差的损失函数,λ∈[0,1]为正则化的超参数;
步骤A5.2:由于采取了BatchNormalization操作,更新验证误差函数中的
Figure BDA0001555308010000106
其中E[x]=Eββ],
Figure BDA0001555308010000107
步骤A5.3:生成新的学习率ηt,更新参数矩阵
Figure BDA0001555308010000108
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (7)

1.一种基于深度学习的光纤光栅波长解调方法,其特征在于,包括以下步骤:
步骤A1:解析光纤光栅波长解调仪接收的波峰数据并生成训练样本;
步骤A2:初始化神经网络;
步骤A3:采集训练样本并对每层神经元进行BatchNormalization处理;
步骤A4:对每层神经元进行Dropout的处理,并引入L2范数进行正则化,使用随机梯度下降法更新网络权重参数θt
步骤A5:计算预测误差,更新网络的参数矩阵;
步骤A6:判断预测误差是否满足终止条件,若否,回转执行步骤A3;若是,更新θ*=θt
步骤A7:训练结束,得到网络模型;
步骤A8:将需要检测的波峰数据放入训练好的网络,通过模型获得波峰数据的高斯函数参数;函数的参数即是波峰所在位置和波峰值;
步骤A4中所述的Dropout处理的具体实现方式包括以下子步骤:
步骤A4.1:以概率p,随机生成一个0、1的向量,记为门控变量σj;依此法生成门控变量σ1,σ2,...,σm
步骤A4.2:设置门控矩阵Ai,为含有门控变量rj的矩阵;定义经过门控层后的输出函数
Figure FDA0003114155650000011
其中·表示按元素相乘;
步骤A5中所述的计算预测误差的具体计算方式包括以下子步骤:
步骤A5.1:用fθ,σ表示参数为θ、门控变量为σ的神经网络,定义误差函数Rθ并引入L2范数,
Figure FDA0003114155650000012
其中
Figure FDA0003114155650000013
是用于惩罚预测误差的损失函数,λ∈[0,1]为正则化的超参数;
步骤A5.2:由于采取了BatchNormalization操作,更新验证误差函数中的
Figure FDA0003114155650000014
其中E[x]=Eββ],
Figure FDA0003114155650000015
步骤A5.3:生成新的学习率ηt,更新参数矩阵
Figure FDA0003114155650000016
2.根据权利要求1所述的基于深度学习的光纤光栅波长解调方法,其特征在于,步骤A1的具体实现包括以下子步骤:
步骤A1.1:获取光纤光栅波长解调仪的波峰数据,用传统方法拟合这些数据,得到它们的高斯函数参数,作为输出样本Y;
步骤A1.2:用高斯参数决定的函数表达式随机生成L个数据点,作为输入样本
Figure FDA0003114155650000021
其中
Figure FDA0003114155650000022
依此法生成m个训练样本。
3.根据权利要求2所述的基于深度学习的光纤光栅波长解调方法,其特征在于,步骤A2的具体实现包括以下子步骤:
步骤A2.1:定义n层的神经网络{h1,h2,...,hn},每层的输出函数表示为hi(x)=g(θix);其中g(x)表示非线性激活函数,不同神经网络层之间允许使用不同的激活函数,θi表示第i层的参数矩阵,x表示与其对应层神经元的输入向量;
步骤A2.2:定义网络执行第t次时包含了所有层的参数矩阵为θt,给初始状态网络参数θ0赋初值。
4.根据权利要求3所述的基于深度学习的光纤光栅波长解调方法,其特征在于,步骤A3中所述的对每层神经元进行BatchNormalization处理,具体实现方式实包括以下子步骤:
步骤A3.1:采集训练样本{(X1,Y1),(X2,Y2),...,(Xm,Ym)};
步骤A3.2:计算每一批训练数据每层神经元xi的平均值
Figure FDA0003114155650000023
其中m是当前层神经元的个数,xi是每个神经元的输入;
步骤A3.3:计算每层神经元xi的均方差
Figure FDA0003114155650000024
步骤A3.4:对输入xi进行归一化处理,
Figure FDA0003114155650000025
其中ε是防止分母过于接近于0的较小的常数;
步骤A3.5:得到新的神经元输入
Figure FDA0003114155650000026
其中γ、β是通过链式法则学习到的重构参数,通过调节该参数可以恢复出原始网络所具有的特征分布。
5.一种基于深度学习的光纤光栅波长解调装置,采用权利要求1-4任一项所述的基于深度学习的光纤光栅波长解调方法,其特征在于,包括:
解析单元,用于解析光纤光栅波长解调仪接收的波峰数据并生成训练样本;
初始化单元,用于初始化神经网络;
第一处理单元,用于采集训练样本并对每层神经元进行BatchNormalization处理;
第二处理单元,用于对每层神经元进行Dropout的处理,并引入L2范数进行正则化,使用随机梯度下降法更新网络权重参数θt
数据更新单元,用于计算预测误差,更新网络的参数矩阵;
判断单元,用于判断预测误差是否满足终止条件,若否,回转执行第一处理单元;若是,更新θ*=θt
网络模型获取单元,用于训练结束,得到网络模型;
计算单元,用于将需要检测的波峰数据放入训练好的网络,通过模型获得波峰数据的高斯函数参数;函数的参数即是波峰所在位置和波峰值;
所述第二处理单元中的Dropout处理的具体实现方式包括以下子步骤:
步骤A4.1:以概率p,随机生成一个0、1的向量,记为门控变量σj;依此法生成门控变量σ1,σ2,...,σm
步骤A4.2:设置门控矩阵Ai,为含有门控变量rj的矩阵;定义经过门控层后的输出函数
Figure FDA0003114155650000031
其中·表示按元素相乘;
所述数据更新单元中的计算预测误差的具体计算方式包括以下子步骤:
步骤A5.1:用fθ,σ表示参数为θ、门控变量为σ的神经网络,定义误差函数Rθ并引入L2范数,
Figure FDA0003114155650000032
其中
Figure FDA0003114155650000033
是用于惩罚预测误差的损失函数,λ∈[0,1]为正则化的超参数;
步骤A5.2:由于采取了BatchNormalization操作,更新验证误差函数中的
Figure FDA0003114155650000034
其中E[x]=Eββ],
Figure FDA0003114155650000035
步骤A5.3:生成新的学习率ηt,更新参数矩阵
Figure FDA0003114155650000036
6.根据权利要求5所述的基于深度学习的光纤光栅波长解调装置,其特征在于,所述解析单元,具体用于:
步骤A1.1:获取光纤光栅波长解调仪的波峰数据,用传统方法拟合这些数据,得到它们的高斯函数参数,作为输出样本Y;
步骤A1.2:用高斯参数决定的函数表达式随机生成L个数据点,作为输入样本
Figure FDA0003114155650000041
其中
Figure FDA0003114155650000042
依此法生成m个训练样本。
7.根据权利要求6所述的基于深度学习的光纤光栅波长解调装置,其特征在于,所述初始化单元,具体用于:
步骤A2.1:定义n层的神经网络{h1,h2,...,hn},每层的输出函数表示为hi(x)=g(θix);其中g(x)表示非线性激活函数,不同神经网络层之间允许使用不同的激活函数,θi表示第i层的参数矩阵,x表示与其对应层神经元的输入向量;
步骤A2.2:定义网络执行第t次时包含了所有层的参数矩阵为θt,给初始状态网络参数θ0赋初值;
所述第一处理单元中的对每层神经元进行BatchNormalization处理,具体实现方式实包括以下子步骤:
步骤A3.1:采集训练样本{(X1,Y1),(X2,Y2),...,(Xm,Ym)};
步骤A3.2:计算每一批训练数据每层神经元xi的平均值
Figure FDA0003114155650000043
其中m是当前层神经元的个数,xi是每个神经元的输入;
步骤A3.3:计算每层神经元xi的均方差
Figure FDA0003114155650000044
步骤A3.4:对输入xi进行归一化处理,
Figure FDA0003114155650000045
其中ε是防止分母过于接近于0的较小的常数;
步骤A3.5:得到新的神经元输入
Figure FDA0003114155650000046
其中γ、β是通过链式法则学习到的重构参数,通过调节该参数可以恢复出原始网络所具有的特征分布。
CN201810061027.XA 2018-01-22 2018-01-22 一种基于深度学习的光纤光栅波长解调方法及装置 Expired - Fee Related CN108256238B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810061027.XA CN108256238B (zh) 2018-01-22 2018-01-22 一种基于深度学习的光纤光栅波长解调方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810061027.XA CN108256238B (zh) 2018-01-22 2018-01-22 一种基于深度学习的光纤光栅波长解调方法及装置

Publications (2)

Publication Number Publication Date
CN108256238A CN108256238A (zh) 2018-07-06
CN108256238B true CN108256238B (zh) 2021-08-03

Family

ID=62742111

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810061027.XA Expired - Fee Related CN108256238B (zh) 2018-01-22 2018-01-22 一种基于深度学习的光纤光栅波长解调方法及装置

Country Status (1)

Country Link
CN (1) CN108256238B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109087130A (zh) * 2018-07-17 2018-12-25 深圳先进技术研究院 一种基于注意力机制的推荐系统及推荐方法
CN109460708A (zh) * 2018-10-09 2019-03-12 东南大学 一种基于生成对抗网络的林火图像样本生成方法
CN109000694B (zh) * 2018-10-19 2020-11-10 武汉烽理光电技术有限公司 光栅制备在线监测方法及系统
CN109282837B (zh) * 2018-10-24 2021-06-22 福州大学 基于lstm网络的布拉格光纤光栅交错光谱的解调方法
CN110887513A (zh) * 2019-11-19 2020-03-17 天津大学 一种基于bp神经网络的光纤光栅传感系统及其解调方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0894886A (ja) * 1994-09-21 1996-04-12 Nec Corp 光モジュール光軸調整方法
CN102435214A (zh) * 2011-09-20 2012-05-02 华北电力大学(保定) 光纤光栅谱峰高精度快速寻峰方法
CN105758434A (zh) * 2015-10-12 2016-07-13 北京信息科技大学 基于线阵InGaAs扫描FBG反射谱的传感解调方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0894886A (ja) * 1994-09-21 1996-04-12 Nec Corp 光モジュール光軸調整方法
CN102435214A (zh) * 2011-09-20 2012-05-02 华北电力大学(保定) 光纤光栅谱峰高精度快速寻峰方法
CN105758434A (zh) * 2015-10-12 2016-07-13 北京信息科技大学 基于线阵InGaAs扫描FBG反射谱的传感解调方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Radial-basis function network for the approximation of FBG sensor spectra with distorted peaks;Paterno,A.S等;《MEASUREMENT SCIENCE AND TECHNOLOGY》;20060531;第17卷(第5期);1039-1045 *
基于浅层学习引导深度学习的行人检测;刘弋锋;《中国博士学位论文全文数据库 信息科技辑》;20170615(第6期);I138-46 *
基于虚拟仪器技术的FBG波长解调系统研究;卢丹;《中国优秀硕士学位论文全文数据库 信息科技辑》;20150315(第3期);I140-334 *
多尺度卷积循环神经网络的情感分类技术;吴琼 等;《华侨大学学报(自然科学版)》;20171130;第38卷(第6期);875-879 *

Also Published As

Publication number Publication date
CN108256238A (zh) 2018-07-06

Similar Documents

Publication Publication Date Title
CN108256238B (zh) 一种基于深度学习的光纤光栅波长解调方法及装置
Jethani et al. Fastshap: Real-time shapley value estimation
CN110321603B (zh) 一种用于航空发动机气路故障诊断的深度计算模型
Shiba et al. Secrets of event-based optical flow
CN106570464B (zh) 一种快速处理人脸遮挡的人脸识别方法及装置
CN111130839A (zh) 一种流量需求矩阵预测方法及其系统
Keriven et al. NEWMA: a new method for scalable model-free online change-point detection
CN109766992B (zh) 基于深度学习的工控异常检测及攻击分类方法
Luo et al. Bayesian deep learning with hierarchical prior: Predictions from limited and noisy data
CN109242106B (zh) 样本处理方法、装置、设备和存储介质
CN114333013A (zh) 人脸识别模型的训练方法、装置、电子设备及存储介质
Do et al. Dynamic background modeling based on radial basis function neural networks for moving object detection
CN111461445A (zh) 短期风速预测方法、装置、计算机设备及存储介质
CN111310963A (zh) 电站的发电数据预测方法、装置、计算机设备和存储介质
Pothuganti Review on over-fitting and under-fitting problems in Machine Learning and solutions
Viet‐Uyen Ha et al. High variation removal for background subtraction in traffic surveillance systems
Vargas et al. Activation functions for convolutional neural networks: Proposals and experimental study
Ikhlasse et al. Multimodal cloud resources utilization forecasting using a Bidirectional Gated Recurrent Unit predictor based on a power efficient Stacked denoising Autoencoders
Ma et al. Estimation of Gaussian overlapping nuclear pulse parameters based on a deep learning LSTM model
CN115099135A (zh) 一种改进的人工神经网络多类型作业功耗预测方法
CN106709934A (zh) 频域高斯核函数图像追踪方法
CN115694985A (zh) 基于tmb的混合网络流量攻击预测方法
CN116391193A (zh) 以基于能量的潜变量模型为基础的神经网络的方法和设备
CN111353602A (zh) 特征衍生方法、装置、设备及计算机可读存储介质
Xia et al. Milling Tool Wear Prediction Based on 1DCNN-LSTM

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210803

CF01 Termination of patent right due to non-payment of annual fee