CN117313531A - 光子能带预测透射谱模型的训练、预测方法、介质及设备 - Google Patents
光子能带预测透射谱模型的训练、预测方法、介质及设备 Download PDFInfo
- Publication number
- CN117313531A CN117313531A CN202311258452.5A CN202311258452A CN117313531A CN 117313531 A CN117313531 A CN 117313531A CN 202311258452 A CN202311258452 A CN 202311258452A CN 117313531 A CN117313531 A CN 117313531A
- Authority
- CN
- China
- Prior art keywords
- transmission spectrum
- size
- output
- layer
- energy band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000411 transmission spectrum Methods 0.000 title claims abstract description 238
- 238000012549 training Methods 0.000 title claims abstract description 114
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000001228 spectrum Methods 0.000 claims abstract description 43
- 230000008569 process Effects 0.000 claims abstract description 30
- 230000003044 adaptive effect Effects 0.000 claims abstract description 27
- 238000010586 diagram Methods 0.000 claims abstract description 25
- 238000013136 deep learning model Methods 0.000 claims abstract description 24
- 230000006870 function Effects 0.000 claims description 57
- 230000004913 activation Effects 0.000 claims description 53
- 230000015654 memory Effects 0.000 claims description 36
- 230000009466 transformation Effects 0.000 claims description 25
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 15
- 238000011176 pooling Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 12
- 210000002569 neuron Anatomy 0.000 claims description 6
- 238000013459 approach Methods 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 230000001131 transforming effect Effects 0.000 claims description 4
- 239000013598 vector Substances 0.000 claims description 4
- 238000004891 communication Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 7
- 238000013135 deep learning Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Geometry (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明提供了一种光子能带预测透射谱模型的训练、预测方法、介质及设备,包括如下步骤:构建透射谱自适应编码器‑解码器模型;对透射谱自适应编码器‑解码器模型进行训练;对能带图像编码器进行训练;对能带‑光谱解码器进行训练。本发明针对输入输出为光子结构复杂自由度的深度学习模型训练误差大和模型训练难以收敛的问题进行了改进,借鉴自适应编码器模型的思想,从而对数据进行学习和训练,使得最终编码器将输入的能带图像数据转换为低维数据特征,解码器则将低维数据特征转换为透射谱数据,通过间接训练的过程,解决了现有技术存在输入为二维光子能带图、输出为一维透射谱的深度学习模型训练误差大、难以收敛的问题。
Description
技术领域
本发明属于光子器件技术领域,更具体地,涉及光子能带预测透射谱模型的训练、预测方法、介质及设备。
背景技术
随着5G通讯、高端芯片等信息技术的飞速发展,大容量大带宽的光学信息传输、处理和存储技术成为必然趋势,对高性能、微型化和集成化的微纳光子器件有着迫切的需求。
近年来随着各种深度学习的模型技术和开发,深度学习已经在计算机科学和工程相关领域广泛应用。光子学界也受益于深度学习技术快速发展,通过将深度学习模型与基础物理相结合,可以高效地求解描述物理系统的偏微分方程,帮助了解物理现象背后的支配规律。在给定的设计空间内,深度学习具有泛化能力,可以生成快速、准确的设计,而不需要逐个案例进行耗时的数值计算。经过良好训练的深度学习模型可以直接建立从设计到目标光子器件光学特性的映射,反之亦然。
通常,深度学习被认为是可以作为发现结构及其光学响应之间复杂关系的有力工具。目前的研究大多是以光谱和结构参数为输入输出,光谱可以方便地离散成向量,从而可以方便地纳入深度学习模型。为了解决复杂光子结构设计问题,需要立即做的一项任务是建立光子能带图、光场分布图等二维数据与透射谱、结构参数等一维数据的深度学习模型,然而这类二维数据不能直接离散化,且特征复杂不易学习,即使经过一些预处理步骤后,直接作为模型输入的效果也不太好,从而存在输入为二维光子能带图、输出为一维透射谱的深度学习模型训练误差大、难以收敛的问题。
发明内容
为了解决现有技术的不足,本发明提供光子能带预测透射谱模型的训练方法,所述光子能带预测透射谱模型包括能带图像编码器和能带-光谱解码器,所述能带图像编码器为一深度学习模型,用于将二维能带图像转换为具有固定长度的一维编码,所述能带-光谱解码器为一深度学习模型,用于将一维编码转化为对应的光谱;包括如下步骤:S1、构建透射谱自适应编码器-解码器模型,所述透射谱自适应编码器-解码器模型包括透射谱自适应编码器和透射谱自适应解码器,两者为相互独立的深度学习模型,所述透射谱自适应编码器的输出与所述透射谱自适应解码器的输入尺寸相同;S2、对所述透射谱自适应编码器-解码器模型进行训练,训练流程如下:使用透射谱数据作为输入和目标,将透射谱数据输入到透射谱自适应编码器中转化为一维编码,将一维编码输入到透射谱自适应解码器中输出为透射谱数据,计算预测误差并传递给Adam优化器,Adam优化器会根据预测误差的大小自动调整透射谱自适应编码器和透射谱自适应解码器的参数,使得输出的透射谱数据逐渐接近真实透射谱数据,多次迭代训练,直到输出的透射谱数据的预测误差达到收敛;S3、对所述能带图像编码器进行训练,训练流程如下:使用能带图像作为输入、步骤S2中训练结束得到的透射谱数据的一维编码作为目标,将能带图像输入到能带图像编码器中转化为一维编码,计算预测误差,将预测误差传递给Adam优化器对能带图像编码器的参数进行优化,多次迭代训练,直到输出的一维编码的预测误差达到收敛;S4、对所述能带-光谱解码器进行训练,训练流程如下:使用步骤S3中训练结束得到的一位编码即伪透射谱编码作为输入、真实透射谱数据作为目标,将伪透射谱编码输入到所述能带-光谱解码器中转化为透射谱,计算预测误差,将预测误差传递给Adam优化器对能带-光谱解码器的参数进行优化,多次迭代训练,直到输出的透射谱的预测误差达到收敛。
进一步地,所述透射谱自适应编码器的网络结构包括三个线性层和两个ReLU激活函数,透射谱自适应编码器的输入层的大小为321,经过第一个线性层后,输出大小变为500,然后通过ReLU激活函数进行非线性变换,接下来经过第二个线性层后,输出大小变为400,再次经过ReLU激活函数,最后经过第三个线性层后,输出大小变为300;所述透射谱自适应解码器的网络结构包括也包含三个线性层和两个ReLU激活函数,透射谱自适应解码器的输入层的大小为300,经过第一个线性层后,输出大小变为400,然后通过ReLU激活函数进行非线性变换,接下来经过第二个线性层后,输出大小变为500,再次经过ReLU激活函数,最后经过第三个线性层后,输出大小变为321,与透射谱自适应编码器的输入层的尺寸相同。
进一步地,所述能带图像编码器由卷积层和全连接层构建,用于将二维能带图像转化为一维编码;初始能带图的尺寸为267×200像素;首先,图像经过第一个卷积层,该卷积层使用三个滤波器堆图像进行特征提取;随后,经过池化层,将图像的尺寸减小为100×133,以减少参数数量并保留重要的特征信息;接下来,图像通过第二个卷积层和池化层进一步减小尺寸,变为50×66,这一步骤有助于提取更高级别的特征;然后,经过展平层,将50×66的图像转化为一维编码,大小为13200,展平层将图像中的像素按照一维顺序排列,以便后续的全连接层进行处理;接下来,一维编码通过5个线性层逐步减小维度,线性层是全连接层,每个神经元与上一层的所有神经元相连,通过这些线性层,模型逐步提取和压缩输入图像中的关键特征,最终得到大小为300的一维编码;所述能带-光谱解码器的网格结构包括三个线性层和两个ReLU激活函数,能带-光谱解码器的输入层的大小为300,经过第一个线性层后,输出大小变为800,然后通过ReLU激活函数进行非线性变换,接下来经过第二个线性层后,输出大小变为500,再次经过ReLU激活函数,最后经过第三个线性层后,输出大小变为321,与透射谱自适应编码器的输入层的的尺寸相同。
进一步地,训练完毕的所述能带图像编码器的结构、权重及偏置按模块的连接顺序构成如下:1)一个输入通道数为3,输出通道数为32的卷积层,卷积核大小为3,填充大小为1;2)使用ReLU激活函数对卷积层的输出进行非线性变换;3)一个大小为2×2的最大池化层,用于减小特征图的尺寸;4)一个输入通道数为32,输出通道数为32的卷积层,卷积核大小为3,填充大小为1;5)使用ReLU激活函数对卷积层的输出进行非线性变换;6)一个大小为2×2的最大池化层,用于进一步减小特征图的尺寸;7)一个输入通道数为32,输出通道数为16的卷积层,卷积核大小为3,填充大小为1;8)使用ReLU激活函数对卷积层的输出进行非线性变换;9)一个大小为2×2的最大池化层,用于进一步减小特征图的尺寸;10)将特征图展平成一维向量;11)一个输入大小为13200,输出大小为5000的线性层;12)使用ReLU激活函数对线性层的输出进行非线性变换;13)一个输入大小为5000,输出大小为2500的线性层;14)使用ReLU激活函数对线性层的输出进行非线性变换;15)一个输入大小为2500,输出大小为1000的线性层;16)使用ReLU激活函数对线性层的输出进行非线性变换;17)一个输入大小为1000,输出大小为500的线性层;18)使用ReLU激活函数对线性层的输出进行非线性变换;19)一个输入大小为500,输出大小为300的线性层;训练完毕的所述能带-光谱解码器的结构、权重及偏置按模块的连接顺序构成如下:1)一个输入大小为300,输出大小为800的线性层;2)使用ReLU激活函数对线性层的输出进行非线性变换;3)一个输入大小为800,输出大小为500的线性层;4)使用ReLU激活函数对线性层的输出进行非线性变换;5)一个输入大小为500,输出大小为321的线性层;6)使用Sigmoid激活函数对线性层的输出进行非线性变换。
进一步地,所述透射谱自适应编码器-解码器模型的训练过程中,使用均方根误差函数来计算预测输出与真实透射谱数据之间的所述预测误差;所述能带图像编码器的训练过程中,使用平滑平均绝对误差计算预测误差;所述能带-光谱解码器的训练过程中,使用平滑平均绝对误差计算预测误差。
本发明还提供计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上所述的光子能带预测透射谱模型的训练方法的步骤。
本发明还提供计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的光子能带预测透射谱模型的训练方法的步骤。
本发明还提供光子能带预测透射谱的预测方法,包括如下步骤:采用如上所述的光子能带预测透射谱模型的训练方法训练光子能带预测透射谱模型;采用训练完毕的光子能带预测透射谱模型对待预测的能带图像进行处理得到透射谱数据结果。
本发明还提供计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上所述的光子能带预测透射谱的预测方法的步骤。
本发明还提供计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的光子能带预测透射谱的预测方法的步骤。
本发明所采取的技术方案带来的有益效果是:本发明针对输入输出为光子结构复杂自由度的深度学习模型训练误差大和模型训练难以收敛的问题进行了改进,构建了光子能带预测透射谱模型包括能带图像编码器和能带-光谱解码器,能带图像编码器为一深度学习模型,用于将二维能带图像转换为具有固定长度的一维编码,能带-光谱解码器为一深度学习模型,用于将一维编码转化为对应的光谱,通过网络编码解码的方式对输入光子能带图进行编码,将输入数据转换成更易于传输或存储的格式,并通过解码的方式输出透射谱;借鉴自适应编码器模型的思想,构建透射谱自适应编码器-解码器模型,透射谱自适应编码器-解码器模型包括透射谱自适应编码器和透射谱自适应解码器,两者为相互独立的深度学习模型,透射谱自适应编码器的输出与透射谱自适应解码器的输入尺寸相同;改进了自适应编码器的训练过程,具体为对透射谱自适应编码器-解码器模型进行训练,训练流程如下:使用透射谱数据作为输入和目标,将透射谱数据输入到透射谱自适应编码器中转化为一维编码,将一维编码输入到透射谱自适应解码器中输出为透射谱数据,计算预测误差并传递给Adam优化器,Adam优化器会根据预测误差的大小自动调整透射谱自适应编码器和透射谱自适应解码器的参数,使得输出的透射谱数据逐渐接近真实透射谱数据,多次迭代训练,直到输出的透射谱数据的预测误差达到收敛;对能带图像编码器进行训练,训练流程如下:使用能带图像作为输入、步骤S2中训练结束得到的透射谱数据的一维编码作为目标,将能带图像输入到能带图像编码器中转化为一维编码,计算预测误差,将预测误差传递给Adam优化器对能带图像编码器的参数进行优化,多次迭代训练,直到输出的一维编码的预测误差达到收敛;对能带-光谱解码器进行训练,训练流程如下:使用上述步骤中训练结束得到的一位编码即伪透射谱编码作为输入、真实透射谱数据作为目标,将伪透射谱编码输入到能带-光谱解码器中转化为透射谱,计算预测误差,将预测误差传递给Adam优化器对能带-光谱解码器的参数进行优化,多次迭代训练,直到输出的透射谱的预测误差达到收敛;从而对数据进行学习和训练,使得最终编码器将输入的能带图像数据转换为低维数据特征,解码器则将低维数据特征转换为透射谱数据,通过间接训练的过程,从而解决了现有技术存在输入为二维光子能带图、输出为一维透射谱的深度学习模型训练误差大、难以收敛的问题。
附图说明
图1为本发明的光子能带预测透射谱模型示意图;
图2为本发明的光子能带图;
图3为本发明的透射谱自适应编码器-解码器模型训练流程示意图;
图4为本发明的透射谱自适应编码器-解码器模型训练误差收敛示意图;
图5为本发明的透射谱自适应编码器-解码器模型效果示意图;
图6为本发明的能带图像编码器网络结构;
图7为本发明的能带图像编码器训练流程示意图;
图8为本发明的能带图像编码器训练误差收敛示意图;
图9为本发明的能带-光谱解码器训练流程示意图;
图10为本发明的能带-光谱解码器训练误差收敛示意图;
图11为本发明的能带-光谱解码器解码效果示意图;
图12为本发明的能带图像编码器网络结构、权重、偏置示意图;
图13为本发明的能带-光谱解码器网络结构、权重、偏置示意图;
图14为本发明的计算机设备的结构框图。
具体实施方式
为了使本发明的目的、技术方案和效果更加清楚的理解,现将结合附图对本发明实施方式作进一步的描述。
本发明针对输入输出为光子结构复杂自由度的深度学习模型训练误差大和模型训练难以收敛的问题进行了改进,通过网络编码解码的方式对输入光子能带图进行编码,将输入数据转换成更易于传输或存储的格式,并通过解码的方式输出透射谱,通过间接训练的过程,从而解决上述技术问题。
自适应编码器由两个主要部分组成:一个编码器和一个解码器。编码器将输入的不同领域数据转换为低维数据特征,解码器则将低维数据特征转换回原始数据。
借鉴自适应编码器模型的思想,改进了自适应编码器的训练过程,对数据进行学习和训练,使得最终编码器将输入的能带图像数据转换为低维数据特征,解码器则将低维数据特征转换为透射谱数据。改进后的训练过程如下:
①在目标域数据集上训练编码器,学习目标域的特征表达。
②定义新的编码器,并使用源域数据作为输入,将通过原编码器后的目标域数据集编码特征作为目标,通过新编码器将源域数据映射到目标域的特征空间。
③定义新的解码器,输入源域数据的编码,使用目标域数据对解码器进行有监督训练,优化解码器的参数。通过②中编码器和该步骤中的解码器将源域数据映射到目标域的空间。
本发明实施例的光子能带预测透射谱模型如图1所示,包括能带图像编码器和能带-光谱解码器,所述能带图像编码器为一深度学习模型,用于将二维能带图像转换为具有固定长度的一维编码,所述能带-光谱解码器为一深度学习模型,用于将一维编码转化为对应的光谱。
能带图像编码器是一个深度学习模型,二维能带图像(如图2所示)经过训练好的能带图像编码器转换为具有固定长度的一维编码,这个编码可以看作是对能带图像的抽象表示,其中包含了关于能带结构的重要信息。一维编码可以进一步输入到训练好的能带-光谱解码器中,能带-光谱解码器是另一个深度学习模型,通过能带-光谱解码器,将一维编码转化为对应的光谱。
该模型通过对能带图像的编码和解码得到透射谱数据,当能带数据通过编码器和解码器的映射过程时,解码器可以将能带数据映射至透射谱数据的空间,从而实现能带图数据到透射谱数据的转换。
本发明实施例提供一种光子能带预测透射谱模型的训练方法,该模型的训练包括四个阶段:构建透射谱自适应编码器-解码器模型,透射谱自适应编码器-解码器模型的无监督学习训练、能带图像编码器的训练、能带图-透射谱解码器的训练,具体如下:
S1、构建透射谱自适应编码器-解码器模型。所述透射谱自适应编码器-解码器模型包括透射谱自适应编码器和透射谱自适应解码器,两者为相互独立的深度学习模型,所述透射谱自适应编码器的输出与所述透射谱自适应解码器的输入尺寸相同。
具体的,透射谱自适应编码器和透射谱自适应解码器是两个独立的模型,编码器的输出与解码器的输入尺寸相同,它们由多个全连接层组成。所述透射谱自适应编码器的网络结构包括三个线性层和两个ReLU激活函数,透射谱自适应编码器的输入层的大小为321,经过第一个线性层后,输出大小变为500,然后通过ReLU激活函数进行非线性变换,接下来经过第二个线性层后,输出大小变为400,再次经过ReLU激活函数,最后经过第三个线性层后,输出大小变为300;所述透射谱自适应解码器的网络结构也包括三个线性层和两个ReLU激活函数,透射谱自适应解码器的输入层的大小为300,经过第一个线性层后,输出大小变为400,然后通过ReLU激活函数进行非线性变换,接下来经过第二个线性层后,输出大小变为500,再次经过ReLU激活函数,最后经过第三个线性层后,输出大小变为321,与透射谱自适应编码器的输入层的尺寸相同。
透射谱自适应编码器将321个数据点的透射谱数据编码为300个数据点的透射谱特征编码,透射谱自适应解码器将透射谱特征编码解码为输入的321个数据点的透射谱数据。
S2、对所述透射谱自适应编码器-解码器模型进行训练。透射谱自适应编码器与解码器的训练,使用无监督学习的模型训练方式,将透射谱作为输入和预期标签进行训练。
如图3所示,训练流程如下:使用透射谱数据作为输入和目标,在训练过程中,首先将透射谱数据输入到透射谱自适应编码器中,通过编码器将透射谱数据转化为一维编码,这个编码包含了透射谱中的关键特征信息。接下来,将一维编码输入到透射谱自适应解码器中,透射谱自适应解码器的任务是将一维编码转化为透射谱数据。通过透射谱自适应解码器,模型可以将编码转化为与输入透射谱相匹配的输出透射谱。在训练过程中,使用均方根误差函数(Root Mean Squared Error,RMSE)来衡量预测输出与真实透射谱之间的差异。通过计算预测误差,可以将误差传递给Adam优化器,优化器会根据误差的大小自动调整透射谱自适应编码器和透射谱自适应解码器的参数,使得模型的输出逐渐接近真实透射谱。通过多次迭代训练,模型会不断调整参数,直到输出透射谱的预测误差达到收敛,即模型的输出与真实透射谱之间的差异较小。这样,就可以构建出一个输入透射谱的透射谱自适应编码器-解码器模型,该模型可以将透射谱数据转化为一维编码,并且可以根据这个编码进行解码,最终得到输入透射谱的预测结果。
这一阶段的训练结果如图4所示,从图中可以看出训练集与测试集的误差都小于0.03,模型准确率高达97%。
在训练完成后,即可得到最终的编码、解码模型。本实施例中输入透射谱数据至透射谱编码器进行编码,再将编码结果输入透射谱解码器中进行解码,最终得到结果如图5所示,左图为实际透射谱,右图为透射谱先编码后解码后的透射谱。从图5中可以看出,透射谱自适应编码器可以成功的将原透射谱数据进行编码,并且编码结果可以较好的解码为原透射谱。
S3、对所述能带图像编码器进行训练。优选的实施例中,如图6所示,所述能带图像编码器由卷积层和全连接层构建,用于将二维能带图像转化为一维编码;初始能带图的尺寸为267×200像素;首先,图像经过第一个卷积层,该卷积层使用三个滤波器堆图像进行特征提取;随后,经过池化层,将图像的尺寸减小为100×133,以减少参数数量并保留重要的特征信息;接下来,图像通过第二个卷积层和池化层进一步减小尺寸,变为50×66,这一步骤有助于提取更高级别的特征;然后,经过展平层,将50×66的图像转化为一维编码,大小为13200,展平层将图像中的像素按照一维顺序排列,以便后续的全连接层进行处理;接下来,一维编码通过5个线性层逐步减小维度,线性层是全连接层,每个神经元与上一层的所有神经元相连,通过这些线性层,模型逐步提取和压缩输入图像中的关键特征,最终得到大小为300的一维编码。
如图7所示,训练流程如下:使用能带图像作为输入、步骤S2中训练结束得到的透射谱数据的一维编码作为目标,在训练过程中,将能带图输入到能带图像编码器中,通过编码器将能带图转化为一维编码,通过平滑平均绝对误差(Smooth Mean Absolute ErrorLoss,Huber Loss)计算预测误差,将误差传递给Adam优化器对编码器的参数进行优化,通过多次迭代训练,模型会不断调整参数,直到输出透射谱的预测误差达到收敛。这样,就可以构建出一个能带图像编码器模型,该模型可以将能带图像数据转化为一维编码,并且可以根据这个编码进行解码,最终得到能带图像预测透射谱的结果。
这一阶段的训练结果如下,从图8可以看出,该能带图像编码器的模型的训练集和测试集的误差在不断的训练过后都小于0.04,代表预测伪透射谱编码的准确率较高。
S4、对所述能带-光谱解码器进行训练。
对于在S3中的伪透射谱输出,虽然可以通过S2中透射谱解码器将部分伪透射谱完整的解码为原透射谱,但是同时也会由于测试集上0.04的误差,导致伪透射谱编码解码成透射谱的误差较大。
因此,为了解决这个问题,需要根据S3中的伪透射谱编码输出,再训练一个“伪透射谱编码”解码器,以真实透射谱数据为预测目标。输入S3中的伪透射谱编码,输出伪透射谱编码解码后的透射谱数据。
由于“伪透射谱编码”解码器是直接以伪透射谱编码作为输入,并以真实透射谱数据作为指导的,所以当能带图像编码器与起伪透射谱编码解码作用的能带-透射谱解码器拼接之后,整个模型的误差将仅由能带-透射谱解码器的误差决定。
优选的实施例中,所述能带-光谱解码器的网格结构包括三个线性层和两个ReLU激活函数,能带-光谱解码器的输入层的大小为300,经过第一个线性层后,输出大小变为800,然后通过ReLU激活函数进行非线性变换,接下来经过第二个线性层后,输出大小变为500,再次经过ReLU激活函数,最后经过第三个线性层后,输出大小变为321,与透射谱自适应编码器的输入层的的尺寸相同。
如图9所示,训练流程如下:使用S3中得到的伪透射谱编码作为模型的输入,真实透射谱作为目标。在训练过程中,将伪透射谱编码输入到能带-透射谱解码器中,将伪透射谱编码转化为透射谱,通过平滑平均绝对误差计算预测误差,将误差传递给Adam优化器对编码器的参数进行优化,通过多次迭代训练,模型会以真实透射谱数据为指导不断调整参数,直到输出透射谱的预测误差达到收敛。在这一训练阶段,旨在训练出针对伪透射谱编码的数据作为输入的解码模型,实现伪透射谱编码预测透射谱的操作。
图10是能带-透射谱解码器模型的训练效果,可以看出,能带-透射谱解码器的Huber Loss在0.012以下,模型的准确度很高。
该模型对伪透射谱编码的解码效果如图11所示。可以看出,能带-透射谱解码器可以将伪透射谱编码的解码效果很好,得到的预测透射谱数据与原始透射谱数据相比准确率较高。
由于最终模型仅用到了训练完毕的能带图像编码器和能带-透射谱解码器,因此,仅对这两者模型内部的网络结构、权重、偏置进行展示。
其中,能带图像编码器模型代表结构、权重及偏置如图12所示:1)一个输入通道数为3,输出通道数为32的卷积层,卷积核大小为3,填充大小为1。2)使用ReLU激活函数对卷积层的输出进行非线性变换。3)一个大小为2×2的最大池化层,用于减小特征图的尺寸。4)一个输入通道数为32,输出通道数为32的卷积层,卷积核大小为3,填充大小为1。5)使用ReLU激活函数对卷积层的输出进行非线性变换。6)一个大小为2×2的最大池化层,用于进一步减小特征图的尺寸。7)一个输入通道数为32,输出通道数为16的卷积层,卷积核大小为3,填充大小为1。8)使用ReLU激活函数对卷积层的输出进行非线性变换。9)一个大小为2×2的最大池化层,用于进一步减小特征图的尺寸。10)将特征图展平成一维向量。11)一个输入大小为13200,输出大小为5000的线性层。12)使用ReLU激活函数对线性层的输出进行非线性变换。13)一个输入大小为5000,输出大小为2500的线性层。14)使用ReLU激活函数对线性层的输出进行非线性变换。15)一个输入大小为2500,输出大小为1000的线性层。16)使用ReLU激活函数对线性层的输出进行非线性变换。17)一个输入大小为1000,输出大小为500的线性层。18)使用ReLU激活函数对线性层的输出进行非线性变换。19)一个输入大小为500,输出大小为300的线性层。
能带-透射谱解码器模型的结构、权重及其偏置如图13所示:1)一个输入大小为300,输出大小为800的线性层。2)使用ReLU激活函数对线性层的输出进行非线性变换。3)一个输入大小为800,输出大小为500的线性层。4)使用ReLU激活函数对线性层的输出进行非线性变换。5)一个输入大小为500,输出大小为321的线性层。6)使用Sigmoid激活函数对线性层的输出进行非线性变换。
本发明的另一实施例,提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现前文所述的光子能带预测透射谱模型的训练方法的步骤。
其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(HardDisk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
本发明的另一实施例,提供一种计算机设备,其中,包括:包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现前文所述的光子能带预测透射谱模型的训练方法的步骤。
如图14所示,该计算机设备可以包括:至少一个处理器71,例如CPU(CentralProcessing Unit,中央处理器),至少一个通信接口73,存储器74,至少一个通信总线72。其中,通信总线72用于实现这些组件之间的连接通信。其中,通信接口73可以包括显示屏(Display)、键盘(Keyboard),可选通信接口73还可以包括标准的有线接口、无线接口。存储器74可以是高速RAM存储器(Random Access Memory,易挥发性随机存取存储器),也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器74可选的还可以是至少一个位于远离前述处理器71的存储装置。其中,存储器74中存储应用程序,且处理器71调用存储器74中存储的程序代码,以用于执行上述任一方法步骤。
其中,通信总线72可以是外设部件互连标准(peripheralcomponentinterconnect,简称PCI)总线或扩展工业标准结构(extended industrystandardarchitecture,简称EISA)总线等。通信总线72可以分为地址总线、数据总线、控制总线等。为便于表示,图14中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器74可以包括易失性存储器(英文:volatile memory),例如随机存取存储器(英文:random-access memory,缩写:RAM);存储器也可以包括非易失性存储器(英文:non-volatile memory),例如快闪存储器(英文:flash memory),硬盘(英文:harddiskdrive,缩写:HDD)或固态硬盘(英文:solid-state drive,缩写:SSD);存储器74还可以包括上述种类的存储器的组合。
其中,处理器71可以是中央处理器(英文:central processing unit,缩写:CPU),网络处理器(英文:network processor,缩写:NP)或者CPU和NP的组合。
其中,处理器71还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(英文:application-specific integrated circuit,缩写:ASIC),可编程逻辑器件(英文:programmable logic device,缩写:PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(英文:complex programmable logic device,缩写:CPLD),现场可编程逻辑门阵列(英文:field-programmable gate array,缩写:FPGA),通用阵列逻辑(英文:genericarraylogic,缩写:GAL)或其任意组合。
可选地,存储器74还用于存储程序指令。处理器71可以调用程序指令,实现如本发明的光子能带预测透射谱模型的训练方法。
本发明的另一实施例,提供一种光子能带预测透射谱的预测方法,其特征在于,包括如下步骤:采用如前文所述的光子能带预测透射谱模型的训练方法训练光子能带预测透射谱模型;采用训练完毕的光子能带预测透射谱模型对待预测的能带图像进行处理得到透射谱数据结果。
本发明的另一实施例,提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现前文所述的光子能带预测透射谱的预测方法的步骤。
本发明的另一实施例,提供一种计算机设备,其中,包括:包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现前文所述的光子能带预测透射谱的预测方法的步骤。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种光子能带预测透射谱模型的训练方法,所述光子能带预测透射谱模型包括能带图像编码器和能带-光谱解码器,所述能带图像编码器为一深度学习模型,用于将二维能带图像转换为具有固定长度的一维编码,所述能带-光谱解码器为一深度学习模型,用于将一维编码转化为对应的光谱;其特征在于,包括如下步骤:S1、构建透射谱自适应编码器-解码器模型,所述透射谱自适应编码器-解码器模型包括透射谱自适应编码器和透射谱自适应解码器,两者为相互独立的深度学习模型,所述透射谱自适应编码器的输出与所述透射谱自适应解码器的输入尺寸相同;S2、对所述透射谱自适应编码器-解码器模型进行训练,训练流程如下:使用透射谱数据作为输入和目标,将透射谱数据输入到透射谱自适应编码器中转化为一维编码,将一维编码输入到透射谱自适应解码器中输出为透射谱数据,计算预测误差并传递给Adam优化器,Adam优化器会根据预测误差的大小自动调整透射谱自适应编码器和透射谱自适应解码器的参数,使得输出的透射谱数据逐渐接近真实透射谱数据,多次迭代训练,直到输出的透射谱数据的预测误差达到收敛;S3、对所述能带图像编码器进行训练,训练流程如下:使用能带图像作为输入、步骤S2中训练结束得到的透射谱数据的一维编码作为目标,将能带图像输入到能带图像编码器中转化为一维编码,计算预测误差,将预测误差传递给Adam优化器对能带图像编码器的参数进行优化,多次迭代训练,直到输出的一维编码的预测误差达到收敛;S4、对所述能带-光谱解码器进行训练,训练流程如下:使用步骤S3中训练结束得到的一位编码即伪透射谱编码作为输入、真实透射谱数据作为目标,将伪透射谱编码输入到所述能带-光谱解码器中转化为透射谱,计算预测误差,将预测误差传递给Adam优化器对能带-光谱解码器的参数进行优化,多次迭代训练,直到输出的透射谱的预测误差达到收敛。
2.根据权利要求1所述的训练方法,其特征在于,所述透射谱自适应编码器的网络结构包括三个线性层和两个ReLU激活函数,透射谱自适应编码器的输入层的大小为321,经过第一个线性层后,输出大小变为500,然后通过ReLU激活函数进行非线性变换,接下来经过第二个线性层后,输出大小变为400,再次经过ReLU激活函数,最后经过第三个线性层后,输出大小变为300;所述透射谱自适应解码器的网络结构也包括三个线性层和两个ReLU激活函数,透射谱自适应解码器的输入层的大小为300,经过第一个线性层后,输出大小变为400,然后通过ReLU激活函数进行非线性变换,接下来经过第二个线性层后,输出大小变为500,再次经过ReLU激活函数,最后经过第三个线性层后,输出大小变为321,与透射谱自适应编码器的输入层的尺寸相同。
3.根据权利要求2所述的训练方法,其特征在于,所述能带图像编码器由卷积层和全连接层构建,用于将二维能带图像转化为一维编码;初始能带图的尺寸为267×200像素;首先,图像经过第一个卷积层,该卷积层使用三个滤波器堆图像进行特征提取;随后,经过池化层,将图像的尺寸减小为100×133,以减少参数数量并保留重要的特征信息;接下来,图像通过第二个卷积层和池化层进一步减小尺寸,变为50×66,这一步骤有助于提取更高级别的特征;然后,经过展平层,将50×66的图像转化为一维编码,大小为13200,展平层将图像中的像素按照一维顺序排列,以便后续的全连接层进行处理;接下来,一维编码通过5个线性层逐步减小维度,线性层是全连接层,每个神经元与上一层的所有神经元相连,通过这些线性层,模型逐步提取和压缩输入图像中的关键特征,最终得到大小为300的一维编码;所述能带-光谱解码器的网格结构包括三个线性层和两个ReLU激活函数,能带-光谱解码器的输入层的大小为300,经过第一个线性层后,输出大小变为800,然后通过ReLU激活函数进行非线性变换,接下来经过第二个线性层后,输出大小变为500,再次经过ReLU激活函数,最后经过第三个线性层后,输出大小变为321,与透射谱自适应编码器的输入层的的尺寸相同。
4.根据权利要求3所述的训练方法,其特征在于,训练完毕的所述能带图像编码器的结构、权重及偏置按模块的连接顺序构成如下:1)一个输入通道数为3,输出通道数为32的卷积层,卷积核大小为3,填充大小为1;2)使用ReLU激活函数对卷积层的输出进行非线性变换;3)一个大小为2×2的最大池化层,用于减小特征图的尺寸;4)一个输入通道数为32,输出通道数为32的卷积层,卷积核大小为3,填充大小为1;5)使用ReLU激活函数对卷积层的输出进行非线性变换;6)一个大小为2×2的最大池化层,用于进一步减小特征图的尺寸;7)一个输入通道数为32,输出通道数为16的卷积层,卷积核大小为3,填充大小为1;8)使用ReLU激活函数对卷积层的输出进行非线性变换;9)一个大小为2×2的最大池化层,用于进一步减小特征图的尺寸;10)将特征图展平成一维向量;11)一个输入大小为13200,输出大小为5000的线性层;12)使用ReLU激活函数对线性层的输出进行非线性变换;13)一个输入大小为5000,输出大小为2500的线性层;14)使用ReLU激活函数对线性层的输出进行非线性变换;15)一个输入大小为2500,输出大小为1000的线性层;16)使用ReLU激活函数对线性层的输出进行非线性变换;17)一个输入大小为1000,输出大小为500的线性层;18)使用ReLU激活函数对线性层的输出进行非线性变换;19)一个输入大小为500,输出大小为300的线性层;训练完毕的所述能带-光谱解码器的结构、权重及偏置按模块的连接顺序构成如下:1)一个输入大小为300,输出大小为800的线性层;2)使用ReLU激活函数对线性层的输出进行非线性变换;3)一个输入大小为800,输出大小为500的线性层;4)使用ReLU激活函数对线性层的输出进行非线性变换;5)一个输入大小为500,输出大小为321的线性层;6)使用Sigmoid激活函数对线性层的输出进行非线性变换。
5.根据权利要求4所述的训练方法,其特征在于,所述透射谱自适应编码器-解码器模型的训练过程中,使用均方根误差函数来计算预测输出与真实透射谱数据之间的所述预测误差;所述能带图像编码器的训练过程中,使用平滑平均绝对误差计算预测误差;所述能带-光谱解码器的训练过程中,使用平滑平均绝对误差计算预测误差。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-5中任一项所述的光子能带预测透射谱模型的训练方法的步骤。
7.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-5中任一项所述的光子能带预测透射谱模型的训练方法的步骤。
8.一种光子能带预测透射谱的预测方法,其特征在于,包括如下步骤:采用如权利要求1-5中任一项所述的光子能带预测透射谱模型的训练方法训练光子能带预测透射谱模型;采用训练完毕的光子能带预测透射谱模型对待预测的能带图像进行处理得到透射谱数据结果。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求8所述的光子能带预测透射谱的预测方法的步骤。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求8所述的光子能带预测透射谱的预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311258452.5A CN117313531A (zh) | 2023-09-26 | 2023-09-26 | 光子能带预测透射谱模型的训练、预测方法、介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311258452.5A CN117313531A (zh) | 2023-09-26 | 2023-09-26 | 光子能带预测透射谱模型的训练、预测方法、介质及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117313531A true CN117313531A (zh) | 2023-12-29 |
Family
ID=89261540
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311258452.5A Pending CN117313531A (zh) | 2023-09-26 | 2023-09-26 | 光子能带预测透射谱模型的训练、预测方法、介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117313531A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117892641A (zh) * | 2024-03-18 | 2024-04-16 | 艾索信息股份有限公司 | 阵列天线的模型训练方法、预测方法、装置、设备及介质 |
-
2023
- 2023-09-26 CN CN202311258452.5A patent/CN117313531A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117892641A (zh) * | 2024-03-18 | 2024-04-16 | 艾索信息股份有限公司 | 阵列天线的模型训练方法、预测方法、装置、设备及介质 |
CN117892641B (zh) * | 2024-03-18 | 2024-05-31 | 艾索信息股份有限公司 | 阵列天线的模型训练方法、预测方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210125070A1 (en) | Generating a compressed representation of a neural network with proficient inference speed and power consumption | |
US10417525B2 (en) | Object recognition with reduced neural network weight precision | |
WO2020204904A1 (en) | Learning compressible features | |
JP7408799B2 (ja) | ニューラルネットワークモデルの圧縮 | |
CN117313531A (zh) | 光子能带预测透射谱模型的训练、预测方法、介质及设备 | |
WO2022028197A1 (zh) | 一种图像处理方法及其设备 | |
CN112801280A (zh) | 视觉深度自适应神经网络的一维卷积位置编码方法 | |
Zhang et al. | Lossless image compression using a multi-scale progressive statistical model | |
CN114978189A (zh) | 一种数据编码方法以及相关设备 | |
CN116935126A (zh) | 一种基于经典—量子混合机器学习的医学图像分类方法 | |
CN117499711A (zh) | 视频生成模型的训练方法、装置、设备及存储介质 | |
TW202406344A (zh) | 一種點雲幾何資料增強、編解碼方法、裝置、碼流、編解碼器、系統和儲存媒介 | |
CN116095183A (zh) | 一种数据压缩方法以及相关设备 | |
CN116597263A (zh) | 图像合成模型的训练方法及相关装置 | |
Shi et al. | Rate-distortion optimized post-training quantization for learned image compression | |
CN113554719B (zh) | 一种图像编码方法、解码方法、存储介质及终端设备 | |
CN115022637A (zh) | 一种图像编码方法、图像解压方法以及装置 | |
CN116457780A (zh) | 信息处理装置、信息处理方法和信息处理系统 | |
CN115699757A (zh) | 图像处理网络的输入预处理方法和输出后处理方法及装置 | |
CN113962893B (zh) | 基于多尺度局部自注意力生成对抗网络的人脸图像修复方法 | |
KR102394951B1 (ko) | 인코딩, 디코딩 장치 및 방법 | |
WO2024032075A1 (zh) | 图像处理网络的训练、编解码方法及电子设备 | |
US20240161327A1 (en) | Diffusion models having continuous scaling through patch-wise image generation | |
KR20240025629A (ko) | 광학 흐름를 이용한 비디오 압축 | |
CN116403026A (zh) | 一种基于多类别风格提取的风格迁移方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |