CN116561590B - 基于深度学习的微纳光纤负载大小和位置预测方法及装置 - Google Patents

基于深度学习的微纳光纤负载大小和位置预测方法及装置 Download PDF

Info

Publication number
CN116561590B
CN116561590B CN202310834041.XA CN202310834041A CN116561590B CN 116561590 B CN116561590 B CN 116561590B CN 202310834041 A CN202310834041 A CN 202310834041A CN 116561590 B CN116561590 B CN 116561590B
Authority
CN
China
Prior art keywords
data
load
spectrum
optical fiber
micro
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310834041.XA
Other languages
English (en)
Other versions
CN116561590A (zh
Inventor
姜婷
侯磊
余婷
姚妮
张吉
张磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Lab
Original Assignee
Zhejiang Lab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Lab filed Critical Zhejiang Lab
Priority to CN202310834041.XA priority Critical patent/CN116561590B/zh
Publication of CN116561590A publication Critical patent/CN116561590A/zh
Application granted granted Critical
Publication of CN116561590B publication Critical patent/CN116561590B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01LMEASURING FORCE, STRESS, TORQUE, WORK, MECHANICAL POWER, MECHANICAL EFFICIENCY, OR FLUID PRESSURE
    • G01L1/00Measuring force or stress, in general
    • G01L1/24Measuring force or stress, in general by measuring variations of optical properties of material when it is stressed, e.g. by photoelastic stress analysis using infrared, visible light, ultraviolet
    • G01L1/242Measuring force or stress, in general by measuring variations of optical properties of material when it is stressed, e.g. by photoelastic stress analysis using infrared, visible light, ultraviolet the material being an optical fibre
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • G06F18/15Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • G06N3/0442Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Abstract

本发明公开了一种基于深度学习的微纳光纤负载大小和位置预测方法及装置,提出一种基于多尺度一维卷积神经网络(1D‑CNN)和长短期记忆网络(LSTM)的方法(MSCNN‑LSTM),能够同时精确预测施加在微纳光纤表面的负载大小和位置。通过数据增强的技术解决了在可用数据集较少的情况下深度学习易陷入过拟合的风险,同时通过将光谱数据与当前时间无负载下原始光谱数据做比值,解除了因原始光谱变化引起的数据偏差对模型预测的影响,提高模型对光谱数据对应负载大小和位置预测准确率。本发明方法在整个实验范围内能准确预测负载大小(MAE=0.02N)和负载施加位置(MAE=7.6um),可用于开发广泛运用的触觉传感器。

Description

基于深度学习的微纳光纤负载大小和位置预测方法及装置
技术领域
本发明属于微纳光纤高分辨率预测领域,尤其涉及基于深度学习的微纳光纤负载大小和位置预测方法及装置。
背景技术
微纳光纤是近年来发展起来的直径接近或小于光波长的一种新型光波导,其直径可比普通光纤小2-3个数量级,具有尺寸小、光场约束能力强、倏逝场比例大、弯曲半径小和损耗低等特点。对微纳光纤传感器上的压力负载大小和负载位置的准确预测以在很多应用场景中(如医疗健康监测)发挥重要的作用,也是实现类人触觉感知的关键问题。目前存在一些研究,使用机器学习的方法对按压微纳光纤传感器获得的光谱数据进行预测分析,但是负载定位误差只能达到微米(mm)级别,且对于负载大小的预测结果也不太理想。
发明内容
本申请实施例的目的在于针对现有技术的不足,提供一种基于深度学习的微纳光纤负载大小和位置预测方法及装置。
根据本申请实施例的第一方面,提供一种基于深度学习的微纳光纤负载大小和位置预测方法,包括:
(1)基于直径为1.0-1.2 μm的微纳光纤,通过光谱数据收集装备,收集所述微纳光纤的各个位置在不同压力负载下获得的光谱数据;
(2)通过数据增强技术,增加所述光谱数据的数据量;
(3)将每一个波长通道光谱数据与原始光谱数据作比值处理,对比值处理后的数据做归一化处理;
(4)构建多尺度1-DCNN-LSTM模型;
(5)设计位置和负载的加权误差损失函数,基于归一化后的数据对所述多尺度1-DCNN-LSTM模型进行训练;
(6)利用训练好的多尺度1-DCNN-LSTM模型对待测微纳光纤进行负载大小和位置预测。
进一步地,步骤(1)通过以下子步骤来实现:
(1.1)采用火焰加热机械拉伸技术制备直径为1.0-1.2μm的二氧化硅微纳光纤,并将微纳光纤两端分别接白光光源和光谱仪;
(1.2)通过实验,获得所述微纳光纤的检测区域内各个位置在不同压力负载下的光谱数据、每个位置可检测光谱变化的最小负载以及每个位置在当前实验时间下无负载的原始光谱数据。
进一步地,步骤(2)通过以下子步骤来实现:
(2.1)针对每个位置,选取大于负载变化值的负载所获得的光谱数据作为有效数据,其中所述负载变化值的可检测光谱变化的最小负载;
(2.2)基于所述有效数据,通过对同一位置相邻大小负载获得的光谱数据做平均处理的方式,对该位置中间大小负载下的光谱数据进行补充,从而获得更多的光谱数据。
进一步地,步骤(3)通过以下子步骤来实现:
(3.1)将每一个波长通道的光谱数据与原始光谱数据做比值处理,将得到的比率更新为该通道的光谱数据值;
(3.2)将所有的光谱数据按照预定比例划分为训练集和测试集,其中所述测试集用于模型训练后的评估;
(3.3)针对所述训练集,使用极大值极小值归一化方法,对光谱数据以及对应的标签分别做归一化处理。
进一步地,所述多尺度1-DCNN-LSTM模型包括序列转换模块、特征提取模块和位置与负载预测模块;
所述序列转换模块用于对光谱数据进行下采样生成不同尺度的光谱序列数据以及使用不同大小的滑动窗口对光谱数据进行滑动平均操作,从而生成不同平滑程度的光谱序列数据;
所述特征提取模块用于提取所述序列转换模块输出的光谱序列数据的特征,从而生成混合特征向量;
所述负载预测模块用于基于所述混合特征向量,利用对应的预测网络分别对光谱数据对应的位置和负载大小进行预测。
进一步地,在所述特征提取模块中,利用独立的若干组卷积层和最大池化层的组合,分别提取所述光谱序列数据的特征;基于得到的若干光谱序列数据的特征,基于长短期记忆神经网络层,提取具有多尺度特征的混合特征向量。
进一步地,步骤(5)中,位置和负载的加权误差损失函数为:
其中,分别表示预测的位置和真实的位置,/>分别表示预测的负载大小和真实的负载大小,/>表示所述归一化后的数据的总个数。
根据本申请实施例的第二方面,提供一种基于深度学习的微纳光纤负载大小和位置预测装置,包括:
收集模块,用于基于直径为1.0-1.2 μm的微纳光纤,通过光谱数据收集装备,收集所述微纳光纤的各个位置在不同压力负载下获得的光谱数据;
数据增强模块,用于通过数据增强技术,增加所述光谱数据的数据量;
归一化模块,用于将每一个波长通道光谱数据与原始光谱数据作比值处理,对比值处理后的数据做归一化处理;
建模模块,用于构建多尺度1-DCNN-LSTM模型;
训练模块,用于设计位置和负载的加权误差损失函数,基于归一化后的数据对所述多尺度1-DCNN-LSTM模型进行训练;
预测模块,用于利用训练好的多尺度1-DCNN-LSTM模型对待测微纳光纤进行负载大小和位置预测。
根据本申请实施例的第三方面,提供一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的方法。
根据本申请实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现如第一方面所述方法的步骤。
本申请的实施例提供的技术方案可以包括以下有益效果:
(1)本发明提供了一种基于深度学习的微纳光纤负载大小和位置同步进行预测的方法,通过数据增强技术,解决了深度学习方法应用于该领域容易陷入过拟合,从而对未知数据预测不准确的问题;
(2)本发明通过使用将光谱数据与当前时间下的原始光谱数据做比值的方法,消除了因原始光谱的变化引起的数据偏差对模型预测能力的影响,从而提高模型的预测精度;
(3)本发明使用多尺度1DCNN-LSTM模型(MSCNN-LSTM模型),通过使用下采样和滑动平均的方法生成了不同尺度和不同平滑程度的光谱数据,并对多尺度的信息特征进行提取整合,提高了信息提取的有效性,从而进一步提高模型的预测性能;
(4)本发明所提出的方法能够在整个实验范围内准确预测负载大小(MAE=0.02N)和负载施加位置(MAE=7.6um),该方法和装置可用于开发广泛运用的触觉传感器。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是根据一示例性实施例示出的方法总流程示意图。
图2是根据一示例性实施例示出的多尺度卷积神经网络-长短期记忆神经网络预测模型 MSCNN-LSTM框架图。
图3为一维卷积神经网络CNN示意图。
图4为长短期记忆神经网络记忆LSTM单元结构图。
图5是根据一示例性实施例示出的方法对位置预测的相关结果图。
图6是根据一示例性实施例示出的方法对负载预测的相关结果图。
图7是根据一示例性实施例示出的一种装置的框图。
图8是根据一示例性实施例示出的一种电子设备的示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
图1是根据一示例性实施例示出的一种基于深度学习的微纳光纤负载大小和位置预测方法的流程图,如图1所示,该方法应用于终端中,可以包括以下步骤:
(1)基于直径为1.0-1.2 μm的微纳光纤,通过光谱数据收集装备,收集所述微纳光纤的各个位置在不同压力负载下获得的光谱数据;
(2)通过数据增强技术,增加所述光谱数据的数据量;
(3)将每一个波长通道光谱数据与原始光谱数据作比值处理,对比值处理后的数据做归一化处理;
(4)构建多尺度1-DCNN-LSTM模型;
(5)设计位置和负载的加权误差损失函数,基于归一化后的数据对所述多尺度1-DCNN-LSTM模型进行训练;
(6)利用训练好的多尺度1-DCNN-LSTM模型对待测微纳光纤进行负载大小和位置预测。
在步骤(1)的具体实施中,基于直径为1.0-1.2 μm的微纳光纤,通过光谱数据收集装备,收集所述微纳光纤的各个位置在不同压力负载下获得的光谱数据;
此步骤可以分成两个步骤:光纤传感器设备准备、光谱数据收集,具体地:
光纤传感器设备准备过程中,将单模光纤固定于光纤拉锥平台上,利用电解水产生的氢气燃烧对单模光纤加热直至熔融态,然后光纤拉锥平台以0.1 mm/s的速度相向运动拉动微纳光纤两端以拉伸处理,使得微纳光纤中间一段的部分逐渐变细直到直径为1.0-1.2 um 左右,然后停止拉伸拉长,冷却形成;在直径为1.0-1.2 um的微纳光纤中间一段形成腰区,在腰区两端的直径沿轴向变化的微纳光纤所在段形成拉锥过渡区。微纳光纤两端分别接白光光源和光谱仪,压力施加至微纳光纤腰区(锥区),锥区产生变形引入光学弯曲损耗,进而获得白光光源发出光束经微纳光纤传导后到光谱仪中的信号变化并获得压力负载值。
光谱数据收集过程中,在每个增量位置施加压力之前,对力传感器进行校准和置零。在每个预定位置收集全面的数据,其中各位置间隔为10um,包括获得的光谱数据、对应负载大小数据、相应的光谱数据以及在该位置诱发可检测光谱变化的最小负载、原始光谱数据(无负载时获取的光谱数据)。最终获得位置上压力负载下获得的光谱数据/>、每个位置诱发可检测光谱变化的最小负载/>以及每个位置施加压力负载前在无负载下的原始光谱数据/>。其中/>表示第/>个位置,/>表示第/>个负载大小,/>表示在位置/>负载/>下获得的n维光谱数据(例如在一实施例中,选取n=2048),/>表示在位置/>负载/>下获得的n维光谱数据的第/>个数据,/>表示位置/>上诱发可检测光谱变化的最小负载,/>表示在位置/>上无负载下获得的n维原始光谱数据,/>表示在位置/>下无负载下获得的n维原始光谱数据的第/>个数据。
在步骤(2)的具体实施中,通过数据增强技术,增加所述光谱数据的数据量;
具体地,所述步骤(2)可以通过以下子步骤来实现:
(2.1)针对每个位置,选取大于负载变化值(可检测光谱变化的最小负载)的负载所获得的光谱数据作为有效数据;
具体地,当作用的力过于小,光谱数据接近原始光谱数据,直接一起放入模型中会影响模型的预测结果,所以仅选取大于变化值的负载所获得的光谱数据进行处理后输入模型。
(2.2)基于所述有效数据,通过对同一位置相邻大小负载获得的光谱数据做平均处理的方式,对该位置中间大小负载下的光谱数据进行补充,从而获得更多的光谱数据;
在步骤(3)的具体实施中,将每一个波长通道光谱数据与原始光谱数据作比值处理,对比值处理后的数据做归一化处理;
具体地,所述步骤(3)可以通过以下子步骤来实现:
(3.1)将每一个波长通道的光谱数据与原始光谱数据做比值处理,将得到的比率更新为该通道的光谱数据值;
具体地,由于不同条件下采集到的原始光谱数据具有不同的量纲和量纲单位,会影响数据分析的结果。为减少因原始光谱的变化引起的数据偏差对模型预测能力的影响,将每一个波长通道光谱数据与原始光谱数据的做比值处理,将比率当作该通道的光谱数据值:
(3.2)将所有的光谱数据按照预定比例划分为训练集和测试集,其中所述测试集用于模型训练后的评估;
具体地,将经过步骤(3.1)得到的所有光谱数据值按照预定比例(一实施例中为8:2)进行划分,其中训练集作为标签(即产生该光谱数据所对应的负载位置和大小)已知的数据集合,用于训练模型,测试集作为模型未知数据,用于评估训练好的模型的效果。
(3.3)针对训练集,使用极大值极小值归一化方法,对光谱数据以及对应的标签分别做归一化处理;
在将训练集数据输入模型前,通过以下方式对输入数据进行归一化处理,以便加快模型的收敛速度并提高模型精度:
其中表示光谱数据的第/>维数据,/>分别表示所有光谱数据的第/>维的最小和最大值。
标签的归一化处理同理,此处不作赘述。
在步骤(4)的具体实施中,构建多尺度1-DCNN-LSTM模型;
具体地,该模型的输入数据为光谱数据,输出数据为光谱数据相应的位置和负载大小。如图2所示,该模型分成3个模块:序列转换模块、特征提取模块和位置与负载预测模块。
如图2所示,在序列转换模块中,长期特征反映了整体趋势,短期特征表明了局部区域的细微变化,两者都可能对任务的预测质量来说至关重要,因此使用下采样方法来生成不同尺度的光谱数据,生成公式为:
其中表示下采样的间隔,当k=1时,将获得原序列,当k越大,表示获取数据间隔越大,可取集合[2,3,4…],在本实例中/>取[8],/>表示在参数/>下针对在位置/>负载/>下获得的n=2048维光谱数据生成的光谱序列数据,共/>维,其中/>表示向下取整,/>表示在参数/>下生成的所有光谱序列数据集合。
从实际应用中获得的数据往往存在各种随机扰动与噪声,为了在含有噪声的原始光谱数据上提取有效的信息从而提高预测精度,本申请使用不同大小的滑动窗口对光谱数据进行滑动平均操作,从而生成不同平滑程度的光谱数据,生成公式为:
其中表示滑动窗口的大小,当l=1时,将获得原序列,当l越大,表示滑动窗口越大,可取集合[2,3,4…],在本实例中/>取[8],/>表示在参数/>下针对在位置/>负载/>下获得的n=2048维光谱数据生成的光谱序列数据,共/>维,/>表示在参数/>下生成的所有光谱序列数据集合。
在特征提取模块(网络结构如图2特征提取部分)中,将经过两种方式的序列变换,得到了不同长度的光谱序列输入到一些独立一维卷积层中(一维卷积神经网络CNN如图3所示),并经过最大池化层减少特征的大小,进一步减少模型参数的大小,从而避免模型过拟合。计算过程表示为:
其中表示输入的光谱序列数据,/>为经过一维卷积层和最大池化层后提取到的特征,/>代表卷积运算,/>为激活函数。每个卷积层具有64个核滤波器(大小为5x1),步长为1,最大池化层的池化窗口大小和下采样因子设为,其中/>表示各个序列的长度。在获得多尺度序列/>的特征/>后,我们将这些特征进行拼接/>,并将其输入到一个隐藏大小为512的LSTM(长短期记忆神经网络)层中,以提取具有多尺度特征的混合特征。LSTM内部网络结构通过三个门控结构更新,分别为输入门,输出门与遗忘门,同时包含一个内部记忆单元,如图4所示。在第t时刻中,LSTM内部计算更新公式如下:
最终每条光谱数据都将提取出512维的混合特征向量
在负载预测模块中,利用特征提取模块输出的混合特征向量,采用两种预测网络分别对光谱对应的位置和压力负载大小进行预测。在一实施例中,对于每个预测网络,都包含一个隐藏层大小为128的全连接层(此全连接层的隐藏层大小可为除128以外的其他值)、一个隐藏层大小为1的全连接层和一个具有sigmoid激活函数的输出层:
其中均为模型参数,/>为sigmoid激活函数。
在步骤(5)的具体实施中,设计位置和负载的加权误差损失函数,基于归一化后的数据对所述多尺度1-DCNN-LSTM模型进行训练;
具体地,将位置和负载的真实值和预测值的平均绝对误差加权和作为损失函数,其中位置大小的MAE(平均绝对误差损失,Mean Absolute Error Loss)和负载大小的MAE的权重可取任意值,此处为了体现对位置预测的重要性,分别取为1和0.2。具体损失函数为:
其中,分别表示预测的位置和真实的位置,/>分别表示预测的负载大小和真实的负载大小,/>表示训练集的总个数。最后,使用Adam方法对模型参数进行优化,在优化迭代的过程中,如果满足早停条件或者达到最大迭代次数Epoch=200,则模型训练完成。
将测试集输入训练好的模型,对测试集合的光谱数据的位置和负载进行预测。需要说明的是,在将测试集输出模型前,需对测试集进行处理,处理方法及过程与训练集相同。
对于位置的预测结果分布如图5中的(a)所示,MAE值达到0.76,亦即7.6um,达到微米级别。将整段光纤均分成m段,查看模型对光谱数据所在位置区间的预测能力,结果如图5中的(b)所示,随着m取值为1,2,3…,560不断增大时,亦即区间划分越细时,模型的位置区间预测能力逐渐降低,当m=560时,ACC仍能达到66.95%,也就是说大部分的光谱数据的位置预测都控制在单向10um误差范围内。图5中的(c)展示了将光纤划分为20个区间,模型预测的混淆矩阵,可以看出模型的准确率达到98.67%,而其他分类错误的点均落在相邻区间内。图5中的(d)展示了在每个位置所有光谱数据的预测位置的MAE结果,可以看出位置[0,250]上的光谱数据相对预测比较准,我们也使用滑动窗口的方法,找到了预测最好的一段区间为[151,250],在这个区间上预测MAE结果为0.644,亦即6.44um。
而对于负载大小的预测结果分布如图6中的(a)所示,MAE值达到0.02,亦即0.22N,预测精度很高。将负载大小均分成m段,查看模型对光谱数据负载大小的预测能力,结果如图6中的(b)所示,随着m取值为1,2,3…,150不断增大时,亦即区间划分越细时,模型的负载大小区间预测能力逐渐降低,当m=150时,ACC仍能达到64.61%,也就是说大部分的光谱数据的负载预测都控制在单向0.02N误差范围内。图6中的(c)展示了将负载大小划分为10个区间,模型预测的混淆矩阵,可以看出模型的准确率达到95.88%,而其他分类错误的点均落在相邻区间内。图6中的(d)展示了每个力负载下所有光谱数据的预测负载大小的MAE结果,结果显示在负载不小于1.3N时,预测结果较好,且预测误差大部分在0.01N(负载不大于0.9N时,MAE均为0.01N)。
在步骤(6)的具体实施中,利用训练好的多尺度1-DCNN-LSTM模型对待测微纳光纤进行负载大小和位置预测;
具体地,在进行预测前,需对基于所述待测微纳光纤得到的光谱数据进行步骤(3.3)中的归一化处理,此处不作赘述。
与前述的深度学习的微纳光纤负载大小和位置预测方法的实施例相对应,本申请还提供了深度学习的微纳光纤负载大小和位置预测装置的实施例。
图7是根据一示例性实施例示出的一种基于深度学习的微纳光纤负载大小和位置预测装置框图。参照图7,该装置可以包括:
收集模块21,用于基于直径为1.0-1.2 μm的微纳光纤,通过光谱数据收集装备,收集所述微纳光纤的各个位置在不同压力负载下获得的光谱数据;
数据增强模块22,用于通过数据增强技术,增加所述光谱数据的数据量;
归一化模块23,用于将每一个波长通道光谱数据与原始光谱数据作比值处理,对比值处理后的数据做归一化处理;
建模模块24,用于构建多尺度1-DCNN-LSTM模型;
训练模块25,用于设计位置和负载的加权误差损失函数,基于归一化后的数据对所述多尺度1-DCNN-LSTM模型进行训练;
预测模块26,用于利用训练好的多尺度1-DCNN-LSTM模型对待测微纳光纤进行负载大小和位置预测。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
相应的,本申请还提供一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述的深度学习的微纳光纤负载大小和位置预测方法。如图8所示,为本发明实施例提供的一种基于深度学习的微纳光纤负载大小和位置预测方法所在任意具备数据处理能力的设备的一种硬件结构图,除了图8所示的处理器、内存以及网络接口之外,实施例中装置所在的任意具备数据处理能力的设备通常根据该任意具备数据处理能力的设备的实际功能,还可以包括其他硬件,对此不再赘述。
相应的,本申请还提供一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现如上述的深度学习的微纳光纤负载大小和位置预测方法。所述计算机可读存储介质可以是前述任一实施例所述的任意具备数据处理能力的设备的内部存储单元,例如硬盘或内存。所述计算机可读存储介质也可以是外部存储设备,例如所述设备上配备的插接式硬盘、智能存储卡(Smart Media Card,SMC)、SD卡、闪存卡(Flash Card)等。进一步的,所述计算机可读存储介还可以既包括任意具备数据处理能力的设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述任意具备数据处理能力的设备所需的其他程序和数据,还可以用于暂时地存储已经输出或者将要输出的数据。
本领域技术人员在考虑说明书及实践这里公开的内容后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。

Claims (7)

1.一种基于深度学习的微纳光纤负载大小和位置预测方法,其特征在于,包括:
(1)基于直径为1.0-1.2 μm的微纳光纤,通过光谱数据收集装备,收集所述微纳光纤的各个位置在不同压力负载下获得的光谱数据;
(2)通过数据增强技术,增加所述光谱数据的数据量;具体为:针对每个位置,选取大于负载变化值的负载所获得的光谱数据作为有效数据,其中所述负载变化值的可检测光谱变化的最小负载;基于所述有效数据,通过对同一位置相邻大小负载获得的光谱数据做平均处理的方式,对该位置中间大小负载下的光谱数据进行补充,从而获得更多的光谱数据;
(3)将每一个波长通道光谱数据与原始光谱数据作比值处理,对比值处理后的数据做归一化处理;
(4)构建多尺度1-DCNN-LSTM模型;所述多尺度1-DCNN-LSTM模型包括序列转换模块、特征提取模块和位置与负载预测模块;所述序列转换模块用于对光谱数据进行下采样生成不同尺度的光谱序列数据以及使用不同大小的滑动窗口对光谱数据进行滑动平均操作,从而生成不同平滑程度的光谱序列数据;所述特征提取模块用于提取所述序列转换模块输出的光谱序列数据的特征,从而生成混合特征向量;所述负载预测模块用于基于所述混合特征向量,利用对应的预测网络分别对光谱数据对应的位置和负载大小进行预测;
(5)设计位置和负载的加权误差损失函数,基于归一化后的数据对所述多尺度1-DCNN-LSTM模型进行训练,其中位置和负载的加权误差损失函数为:
其中,分别表示预测的位置和真实的位置,/>分别表示预测的负载大小和真实的负载大小,/>表示所述归一化后的数据的总个数;
(6)利用训练好的多尺度1-DCNN-LSTM模型对待测微纳光纤进行负载大小和位置预测。
2.根据权利要求1所述的方法,其特征在于,步骤(1)通过以下子步骤来实现:
(1.1)采用火焰加热机械拉伸技术制备直径为1.0-1.2μm的二氧化硅微纳光纤,并将微纳光纤两端分别接白光光源和光谱仪;
(1.2)通过实验,获得所述微纳光纤的检测区域内各个位置在不同压力负载下的光谱数据、每个位置可检测光谱变化的最小负载以及每个位置在当前实验时间下无负载的原始光谱数据。
3.根据权利要求1所述的方法,其特征在于,步骤(3)通过以下子步骤来实现:
(3.1)将每一个波长通道的光谱数据与原始光谱数据做比值处理,将得到的比率更新为该通道的光谱数据值;
(3.2)将所有的光谱数据按照预定比例划分为训练集和测试集,其中所述测试集用于模型训练后的评估;
(3.3)针对所述训练集,使用极大值极小值归一化方法,对光谱数据以及对应的标签分别做归一化处理。
4.根据权利要求1所述的方法,其特征在于,在所述特征提取模块中,利用独立的若干组卷积层和最大池化层的组合,分别提取所述光谱序列数据的特征;基于得到的若干光谱序列数据的特征,基于长短期记忆神经网络层,提取具有多尺度特征的混合特征向量。
5.一种基于深度学习的微纳光纤负载大小和位置预测装置,其特征在于,包括:
收集模块,用于基于直径为1.0-1.2 μm的微纳光纤,通过光谱数据收集装备,收集所述微纳光纤的各个位置在不同压力负载下获得的光谱数据;
数据增强模块,用于通过数据增强技术,增加所述光谱数据的数据量;具体为:针对每个位置,选取大于负载变化值的负载所获得的光谱数据作为有效数据,其中所述负载变化值的可检测光谱变化的最小负载;基于所述有效数据,通过对同一位置相邻大小负载获得的光谱数据做平均处理的方式,对该位置中间大小负载下的光谱数据进行补充,从而获得更多的光谱数据;
归一化模块,用于将每一个波长通道光谱数据与原始光谱数据作比值处理,对比值处理后的数据做归一化处理;
建模模块,用于构建多尺度1-DCNN-LSTM模型;所述多尺度1-DCNN-LSTM模型包括序列转换模块、特征提取模块和位置与负载预测模块;所述序列转换模块用于对光谱数据进行下采样生成不同尺度的光谱序列数据以及使用不同大小的滑动窗口对光谱数据进行滑动平均操作,从而生成不同平滑程度的光谱序列数据;所述特征提取模块用于提取所述序列转换模块输出的光谱序列数据的特征,从而生成混合特征向量;所述负载预测模块用于基于所述混合特征向量,利用对应的预测网络分别对光谱数据对应的位置和负载大小进行预测;
训练模块,用于设计位置和负载的加权误差损失函数,基于归一化后的数据对所述多尺度1-DCNN-LSTM模型进行训练,其中位置和负载的加权误差损失函数为:
其中,分别表示预测的位置和真实的位置,/>分别表示预测的负载大小和真实的负载大小,/>表示所述归一化后的数据的总个数;
预测模块,用于利用训练好的多尺度1-DCNN-LSTM模型对待测微纳光纤进行负载大小和位置预测。
6.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4任一项所述的方法。
7.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现如权利要求1-4中任一项所述方法的步骤。
CN202310834041.XA 2023-07-10 2023-07-10 基于深度学习的微纳光纤负载大小和位置预测方法及装置 Active CN116561590B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310834041.XA CN116561590B (zh) 2023-07-10 2023-07-10 基于深度学习的微纳光纤负载大小和位置预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310834041.XA CN116561590B (zh) 2023-07-10 2023-07-10 基于深度学习的微纳光纤负载大小和位置预测方法及装置

Publications (2)

Publication Number Publication Date
CN116561590A CN116561590A (zh) 2023-08-08
CN116561590B true CN116561590B (zh) 2023-10-03

Family

ID=87496874

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310834041.XA Active CN116561590B (zh) 2023-07-10 2023-07-10 基于深度学习的微纳光纤负载大小和位置预测方法及装置

Country Status (1)

Country Link
CN (1) CN116561590B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020073737A1 (zh) * 2018-10-10 2020-04-16 浙江大学 一种基于深度学习的定量光谱数据分析处理方法
CN111914907A (zh) * 2020-07-13 2020-11-10 河海大学 一种基于深度学习空谱联合网络的高光谱图像分类方法
KR102197297B1 (ko) * 2019-09-27 2020-12-31 서울대학교산학협력단 순환형 3차원 완전 합성곱망을 활용한 초분광영상의 변화탐지 방법
CN112199548A (zh) * 2020-09-28 2021-01-08 华南理工大学 一种基于卷积循环神经网络的音乐音频分类方法
CN114494846A (zh) * 2021-12-18 2022-05-13 南京理工大学 基于多尺度内卷网络的高光谱图像分类的方法
CN114628037A (zh) * 2022-02-25 2022-06-14 上海应用技术大学 一种基于深度学习卷积神经网络的新冠病毒识别预测模型
CN114785701A (zh) * 2022-04-06 2022-07-22 中国电信股份有限公司 光传送网流量预测方法、装置、电子设备及存储介质
CN114821321A (zh) * 2022-04-27 2022-07-29 浙江工业大学 一种基于多尺度级联卷积神经网络的叶片高光谱图像分类和回归方法
CN114997208A (zh) * 2022-04-14 2022-09-02 中国科学院合肥物质科学研究院 一种基于长短期记忆网络的组织光学参数提取方法及系统
CN115293326A (zh) * 2022-07-05 2022-11-04 深圳市国电科技通信有限公司 电力负荷预测模型的训练方法、装置及电力负荷预测方法
CN116342939A (zh) * 2023-03-15 2023-06-27 天津科技大学 一种基于cnn与lstm的复合恒星光谱分类方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11193884B2 (en) * 2018-07-02 2021-12-07 The Research Foundation For The State University Of New York System and method for structural characterization of materials by supervised machine learning-based analysis of their spectra
US11593655B2 (en) * 2018-11-30 2023-02-28 Baidu Usa Llc Predicting deep learning scaling
KR20230030437A (ko) * 2021-08-25 2023-03-06 삼성전자주식회사 디바이스 구조 예측 모델 생성 방법 및 시뮬레이션 장치

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020073737A1 (zh) * 2018-10-10 2020-04-16 浙江大学 一种基于深度学习的定量光谱数据分析处理方法
KR102197297B1 (ko) * 2019-09-27 2020-12-31 서울대학교산학협력단 순환형 3차원 완전 합성곱망을 활용한 초분광영상의 변화탐지 방법
CN111914907A (zh) * 2020-07-13 2020-11-10 河海大学 一种基于深度学习空谱联合网络的高光谱图像分类方法
CN112199548A (zh) * 2020-09-28 2021-01-08 华南理工大学 一种基于卷积循环神经网络的音乐音频分类方法
CN114494846A (zh) * 2021-12-18 2022-05-13 南京理工大学 基于多尺度内卷网络的高光谱图像分类的方法
CN114628037A (zh) * 2022-02-25 2022-06-14 上海应用技术大学 一种基于深度学习卷积神经网络的新冠病毒识别预测模型
CN114785701A (zh) * 2022-04-06 2022-07-22 中国电信股份有限公司 光传送网流量预测方法、装置、电子设备及存储介质
CN114997208A (zh) * 2022-04-14 2022-09-02 中国科学院合肥物质科学研究院 一种基于长短期记忆网络的组织光学参数提取方法及系统
CN114821321A (zh) * 2022-04-27 2022-07-29 浙江工业大学 一种基于多尺度级联卷积神经网络的叶片高光谱图像分类和回归方法
CN115293326A (zh) * 2022-07-05 2022-11-04 深圳市国电科技通信有限公司 电力负荷预测模型的训练方法、装置及电力负荷预测方法
CN116342939A (zh) * 2023-03-15 2023-06-27 天津科技大学 一种基于cnn与lstm的复合恒星光谱分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于深度学习的LSTM光伏预测;崔承刚;邹宇航;;上海电力学院学报(第06期);38-46 *

Also Published As

Publication number Publication date
CN116561590A (zh) 2023-08-08

Similar Documents

Publication Publication Date Title
CN112101220A (zh) 一种无监督模型参数迁移的滚动轴承寿命预测方法
CN109447078A (zh) 一种自然场景图像敏感文字的检测识别方法
CN109685212B (zh) 一种机器阅读理解模型的分阶段训练方法及装置
CN114970605A (zh) 一种多模态特征融合神经网络的制冷设备故障诊断方法
CN116910493B (zh) 基于多源特征提取的设备故障诊断模型的构建方法及装置
Tinoco et al. Piezometric level prediction based on data mining techniques
CN111160462A (zh) 一种基于多传感器数据对齐的无监督个性化人类活动识别方法
CN115841004B (zh) 基于多维数据的带钢热轧过程力学性能软测量方法及装置
CN115293128A (zh) 基于多模态对比学习放射学报告生成模型训练方法及系统
CN116340796A (zh) 时序数据分析方法、装置、设备及存储介质
CN114511710A (zh) 一种基于卷积神经网络的图像目标检测方法
CN116975645A (zh) 一种基于vae-mrcnn的工业过程软测量建模方法
CN116561590B (zh) 基于深度学习的微纳光纤负载大小和位置预测方法及装置
Liu et al. A novel integration framework for degradation-state prediction via transformer model with autonomous optimizing mechanism
CN113858566A (zh) 一种基于机器学习的注塑机能耗预测方法及系统
CN115775623A (zh) 一种基于注意力机制的前列腺癌分级诊断系统
Lin et al. Damage detection in a benchmark structure using long short-term memory networks
Xu et al. Zero-shot compound fault diagnosis method based on semantic learning and discriminative features
CN114757310B (zh) 情感识别模型及其训练方法、装置、设备及可读存储介质
Wang et al. Concrete compression test data estimation based on a wavelet neural network model
CN114971375A (zh) 基于人工智能的考核数据处理方法、装置、设备及介质
CN114863181A (zh) 一种基于预测概率知识蒸馏的性别分类方法和系统
Wang et al. A Relief-PGS algorithm for feature selection and data classification
Wang A new variable selection method for soft sensor based on deep learning
CN116778300B (zh) 一种基于知识蒸馏的小目标检测方法、系统和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant