CN117786617A

CN117786617A - 一种基于ga-lstm高光谱定量反演的布料成分分析方法及系统

Info

Publication number: CN117786617A
Application number: CN202410214228.4A
Authority: CN
Inventors: 涂兵; 张峻华; 叶井飞; 曹兆楼; 匡文剑; 陈云云; 王琳
Original assignee: Nanjing University of Information Science and Technology
Current assignee: Nanjing University of Information Science and Technology
Priority date: 2024-02-27
Filing date: 2024-02-27
Publication date: 2024-03-29
Anticipated expiration: 2044-02-27
Also published as: CN117786617B

Abstract

本发明公开了一种基于GA‑LSTM高光谱定量反演的布料成分分析方法及系统，涉及检测技术领域，包括：接收样本布料光谱数据，对样本布料光谱数据进行预处理，得到样本数据，将样本数据进行分类得到训练集和测试集；将训练集和测试集输入至预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型内，输出得到一次训练LSTM的布料成分分析回归模型；优化一次训练LSTM的布料成分分析回归模型的学习率，将优化后的学习率输入至一次训练LSTM的布料成分分析回归模型内，输出得到二次训练LSTM的布料成分分析回归模型；将待测布料的融合后的光谱数据输入至二次训练LSTM的布料成分分析回归模型内，得到布料成分分析结果。

Description

一种基于GA-LSTM高光谱定量反演的布料成分分析方法及系统

技术领域

本发明涉及检测技术领域，具体的是一种基于GA-LSTM高光谱定量反演的布料成分分析方法及系统。

背景技术

作为决定产品价值的主要指标，纺织品纤维成分和含量一直是生产者、消费者和各级市场监管部门十分关心的问题。国内外为保护消费者的合法权益，也颁布相应法令规定纺织品必须标注纤维成分及其含量。但在实际生产和市场交易中，纺织品的以次充好、虚假声明和掺假情况等问题也并不少见。因此，纺织品纤维含量的定量检测一直都是众多检测项目中极其重要的一环。而现存的纺织品纤维检测方法(燃烧法、溶解法等)，不仅检测周期长，检测环境要求高，还存在污染环境的问题。故研究一种高效、便捷以及环保的检测方法具有重要意义。

发明内容

为解决上述背景技术中提到的不足，本发明的目的在于提供一种基于GA-LSTM高光谱定量反演的布料成分分析方法及系统，可以快速、无损的检测混纺织品中的纤维含量。

第一方面，本发明的目的可以通过以下技术方案实现：一种基于GA-LSTM高光谱定量反演的布料成分分析方法，方法包括以下步骤：

接收样本布料光谱数据，对样本布料光谱数据进行预处理，得到样本数据，将样本数据进行分类得到训练集和测试集；

将训练集和测试集输入至预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型内，输出得到一次训练LSTM的布料成分分析回归模型；

优化一次训练LSTM的布料成分分析回归模型的学习率，提高一次训练LSTM的布料成分分析回归模型的训练精度，将优化后的学习率输入至一次训练LSTM的布料成分分析回归模型内，输出得到二次训练LSTM的布料成分分析回归模型；

获取待测布料光谱数据，对待测布料光谱数据进行预处理得到待测布料的融合后的光谱数据，将待测布料的融合后的光谱数据输入至二次训练LSTM的布料成分分析回归模型内，输出得到布料成分分析结果。

结合第一方面，在第一方面的某些实现方式中，该方法还包括：所述样本布料光谱数据的采集方法：利用近红外光谱仪采集羊毛、涤纶和棉混的纺织品的近红外反射光谱，得到样本布料光谱数据。

结合第一方面，在第一方面的某些实现方式中，该方法还包括：所述对样本布料光谱数据进行预处理的过程采用线性函数归一化的方法。

结合第一方面，在第一方面的某些实现方式中，该方法还包括：所述线性函数归一化是将一条样本布料光谱数据映射到[0,1]，归一化的公式如下：

其中，为归一化之后的样本布料光谱数据的数值，/>为样本布料光谱数据的实际数值，/>为一条样本布料光谱数据中最小值，/>为一条样本布料光谱数据中最大值。

结合第一方面，在第一方面的某些实现方式中，该方法还包括：所述预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型：

LSTM在t时刻的输出ht为：

其中：为t时刻的输出门，/>为长时记忆输入；

遗忘门是由当前时刻的输入/>以及上一时刻外部状态/>所共同决定的，计算公式为：

其中为Sigmoid函数，/>、/>以及/>分别为遗忘门的权重和偏置；

为t时刻的输入门，由两部分组成，一是由Sigmoid函数输出/>，二是由/>激活函数输出/>，再通过两者向量的元素乘积得到更新后的细胞状态，其计算公式为：

其中、/>以及/>、/>分别代表各自的权重，/>代表偏置，更新后的细胞状态为/>，计算公式为：

数据信息在通过遗忘门后选择保留一部分信息通过输入门更新数据状态，

经由输出门决定最终的输出结果并将输出结果传递给外部状态/>，输出门的表达式为：

其中、/>为输出门的权重，/>为输出门的偏置。

LSTM 网络的门控机制以及线性连接有效解决了普通循环神经网络的梯度爆炸或消失问题，在实践中该模型也应用在多个领域，表明了其在循环神经网络模型中的优越性。

结合第一方面，在第一方面的某些实现方式中，该方法还包括：所述预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型的方法：

数据准备：收集和准备用于训练和测试模型的数据；

数据预处理：对数据进行预处理以满足模型的输入要求，包括对数据进行标准化、归一化、分词、向量化操作，确保数据格式适用于LSTM模型。

划分数据集：将数据集划分为训练集和测试集；

构建LSTM模型：使用深度学习框架PyTorch构建LSTM模型；

定义模型结构：确定LSTM模型的层数、每层的神经元数量以及其他超参数，根据问题的复杂程度和数据集的特点来决定模型的结构；

编译模型：配置LSTM模型的损失函数、优化器和评估指标。本发明使用的损失函数包括平均绝对误差MAE和均方根误差RMSE，使用的优化器为Adam优化器；

模型训练：使用训练集对LSTM模型进行训练，通过反向传播算法和优化器更新模型的权重和偏置，使模型能够逐渐学习数据集中的特征和模式；

模型验证和调优：使用验证集评估模型的性能，并根据验证结果调整模型的超参数和结构；

模型测试：在测试集上评估经过训练和验证的LSTM模型的性能，使用决定系数R-Squared来评估模型的准确性；

模型应用：使用经过训练和测试的LSTM模型进行预测或分类，将新的输入数据输入到LSTM模型中，得到LSTM模型的输出结果。

结合第一方面，在第一方面的某些实现方式中，该方法还包括：所述LSTM的布料成分分析回归模型选取的评价指标包括决定系数、平均绝对误差、均方根误差；

其中，所述决定系数的计算公式：

其中R-squared代表决定系数，为纺织品纤维真实含量，/>为模型对纺织品纤维的预测含量，/>为纺织品纤维含量的平均值，n为样本数；

平均绝对误差的计算公式：

其中MAE代表平均绝对误差，为纺织品纤维真实含量，/>为模型对纺织品纤维的预测含量，/>为纺织品纤维含量的平均值，n为样本数；

均方根误差的计算公式：

其中RMSE代表均方根误差，为纺织品纤维真实含量，/>为模型对纺织品纤维的预测含量，/>为纺织品纤维含量的平均值，n为样本数。

结合第一方面，在第一方面的某些实现方式中，该方法还包括：所述将待测布料的融合后的光谱数据输入至二次训练LSTM的布料成分分析回归模型内，输出得到布料成分分析结果的过程：

将羊毛、涤纶和棉混的纺织品待测布料光谱数据训练集输入至LSTM模型中，获取二次训练LSTM的布料成分分析回归模型预测的目标羊毛、涤纶和棉混的纺织品成分结果。

第二方面，为了达到上述目的，本发明公开了一种基于GA-LSTM高光谱定量反演的布料成分分析系统，包括：

数据处理模块，用于接收样本布料光谱数据，对样本布料光谱数据进行预处理，得到样本数据，将样本数据进行分类得到训练集和测试集；

一次训练模块，用于将训练集和测试集输入至预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型内，输出得到一次训练LSTM的布料成分分析回归模型；

二次训练模块，用于优化一次训练LSTM的布料成分分析回归模型的学习率，将优化后的学习率输入至一次训练LSTM的布料成分分析回归模型内，输出得到二次训练LSTM的布料成分分析回归模型；

成分分析模块，用于获取待测布料光谱数据，对待测布料光谱数据进行预处理得到待测布料的融合后的光谱数据，将待测布料的融合后的光谱数据输入至二次训练LSTM的布料成分分析回归模型内，输出得到布料成分分析结果。

结合第二方面，在第二方面的某些实现方式中，该系统还包括：所述数据处理模块中样本布料光谱数据的采集方法：利用近红外光谱仪采集羊毛、涤纶和棉混的纺织品的近红外反射光谱，得到样本布料光谱数据；

数据处理模块内对样本布料光谱数据进行预处理的过程采用线性函数归一化的方法；

数据处理模块内线性函数归一化是将一条样本布料光谱数据映射到[0,1]，归一化的公式如下：

其中，为归一化之后的样本布料光谱数据的数值，/>为样本布料光谱数据的实际数值，/>为一条样本布料光谱数据中最小值，/>为一条样本布料光谱数据中最大值；

一次训练模块内预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型：

预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型：

LSTM在t时刻的输出ht为：

其中：为t时刻的输出门，/>为长时记忆输入；

其中为Sigmoid函数，/>、/>以及/>分别为遗忘门的权重和偏置；

其中、/>为输出门的权重，/>为输出门的偏置。

一次训练模块内预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型的方法：

数据准备：收集和准备用于训练和测试模型的数据；

划分数据集：将数据集划分为训练集和测试集；

构建LSTM模型：使用深度学习框架PyTorch构建LSTM模型；

一次训练模块、二次训练模块内LSTM的布料成分分析回归模型选取的评价指标包括决定系数、平均绝对误差、均方根误差；

其中，所述决定系数的计算公式：

平均绝对误差的计算公式：

均方根误差的计算公式：

其中RMSE代表均方根误差，为纺织品纤维真实含量，/>为模型对纺织品纤维的预测含量，/>为纺织品纤维含量的平均值，n为样本数；

成分分析模块内将待测布料的融合后的光谱数据输入至二次训练LSTM的布料成分分析回归模型内，输出得到布料成分分析结果的过程：

本发明的有益效果：

本发明基于深度学习技术对数据处理的优势，构建适用于羊毛、涤纶和棉混的纺织品成分检测的GA-LSTM模型，自动建立回归关系，从而检测羊毛、涤纶和棉混的纺织品成分，实现了羊毛、涤纶和棉混的纺织品的红外光谱数据与深度学习技术在布料成分检测方面的应用。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图；

图1是本发明方法流程示意图；

图2是本发明工作流程示意图；

图3是本发明羊毛、涤纶和棉混的纺织品成分检测的LSTM的布料成分分析回归模型示意图；

图4是本发明系统结构示意图；

图5是本发明LSTM神经网络的神经元结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

实施例一：

下面，对本申请实施例涉及的相关术语进行介绍：

长短期记忆神经网络：长短期记忆神经网络（LSTM，Long Short-Term Memory）是一种时间循环神经网络，是为了解决一般的RNN（循环神经网络）存在的长期依赖问题而专门设计出来的，所有的RNN都具有一种重复神经网络模块的链式形式。在标准RNN中，这个重复的结构模块只有一个非常简单的结构，例如一个tanh层。

光谱数据：光谱数据存在与光谱库内，光谱库是由高光谱成像光谱仪在一定条件下测得的各类地物反射光谱数据的集合。光谱库在准确地解译遥感图像信息、快速地实现未知地物的匹配、提高遥感分类识别水平起着至关重要的作用。由于高光谱成像光谱仪产生了庞大的数据量，建立地物光谱数据库，运用先进的计算机技术来保存、管理和分析这些信息，是提高遥感信息的分析处理水平并使其能得到高效、合理之应用的唯一途径，并给人们认识、识别及匹配地物提供了基础。

均方根误差：均方根误差，亦称标准误差。在有限测量次数中，均方根误差常用下式表示：√[∑di^2/n]=Re，式中：n为测量次数；di为一组测量值与真值的偏差；Re为均方根误差。如果误差统计分布是正态分布，那么随机误差落在±σ以内的概率为68%，σ表示正态分布的分散程度。

平均绝对误差：平均绝对误差是所有单个观测值与算术平均值的偏差的绝对值的平均，平均绝对误差可以避免误差相互抵消的问题，因而可以准确反映实际预测误差的大小。

近红外反射光谱：近红外反射光谱是介于可见光（Vis）和中红外（MIR）之间的电磁辐射波，美国材料检测协会（ASTM）将近红外光谱区定义为780-2526nm的区域，是人们在吸收光谱中发现的第一个非可见光区。近红外光谱区与有机分子中含氢基团（O-H、N-H、C-H）振动的合频和各级倍频的吸收区一致，通过扫描样品的近红外光谱，可以得到样品中有机分子含氢基团的特征信息，而且利用近红外光谱技术分析样品具有方便、快速、高效、准确和成本较低，不破坏样品，不消耗化学试剂，不污染环境等优点，因此该技术受到越来越多人的青睐。

如图1所示，一种基于GA-LSTM高光谱定量反演的布料成分分析方法，方法包括以下步骤：

其中，所述样本布料光谱数据的采集方法包括：

反射光谱测量：使用光谱测量设备（如光谱分析仪或分光光度计），在可见光和近红外等波长范围内测量布料样品的反射光谱。通过照射光源并测量样品反射的光强，可以获取不同波长下的反射率数据。

傅里叶变换红外光谱（FTIR）：使用傅里叶变换红外光谱仪，通过照射红外光源并测量布料样品在红外波长范围内的吸收光谱。这种方法可以提供关于样品分子结构和化学成分的信息。

偏振光谱测量：使用偏振光谱仪，测量布料样品对不同偏振方向的光的响应。这种方法可以提供关于布料的光学特性和纤维取向的信息。

荧光光谱测量：通过照射布料样品并测量其发射的荧光光谱，获取布料样品在不同波长下的荧光特性。这种方法可以提供关于布料成分、表面性质和荧光染料等的信息。

分光光度法：使用分光光度计，在特定波长下测量布料样品吸收或透射的光强。这种方法可以用于分析布料样品中特定成分的浓度或检测某些化学反应的进程。

具体的，在本实施例的实施过程中采用近红外光谱仪采集羊毛、涤纶和棉混的纺织品的近红外反射光谱，得到样本布料光谱数据，采用近红外光谱仪的好处是高效、便捷以及环保。

对样本布料光谱数据进行预处理的方法包括：

缺失值处理：处理数据中的缺失值，有几种常见的方法：

删除包含缺失值的行或列。

使用均值、中位数或其他统计量填充缺失值。

使用插值方法（如线性插值）来预测缺失值。

异常值处理：检测和处理数据中的异常值，防止其对模型产生负面影响。

主成分分析（PCA）：将原始特征投影到新的坐标轴上，保留最重要的信息。

在本实施例的实施过程中，采用线性函数归一化的方法对样本布料光谱数据进行预处理，采用线性函数归一化的好处是：

保留相对距离关系：线性函数归一化保留了数据之间的相对距离关系。即便进行了缩放，数据点之间的相对顺序和距离关系仍然保持不变，这对于许多机器学习算法是重要的。

避免特征间差异过大：当不同特征的尺度相差较大时，某些机器学习算法可能对尺度较大的特征更为敏感，导致模型性能下降。线性函数归一化可以避免这种问题，确保各个特征在相似的尺度范围内。

有助于梯度下降算法的收敛：在使用梯度下降等优化算法进行模型训练时，尺度相近的特征可以使算法更快地收敛。线性函数归一化确保了特征的值在一个较小的范围内，有助于提高优化算法的效率。

对神经网络有益：在神经网络中，输入数据通常被限制在 [0，1] 范围内。线性函数归一化使得数据更符合这种要求，有助于模型的训练和性能。

适用于某些距离度量：在使用基于距离的算法（如 K-近邻算法）时，数据的尺度可能会对距离计算产生影响。线性函数归一化有助于确保各个特征对距离的贡献大致相等。

线性函数归一化是将一条样本布料光谱数据映射到[0,1]，归一化的公式如下：

LSTM在t时刻的输出ht为：

其中：为t时刻的输出门，/>为长时记忆输入；

其中为Sigmoid函数，/>、/>以及/>分别为遗忘门的权重和偏置；

其中、/>为输出门的权重，/>为输出门的偏置。

预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型的方法：

数据准备：收集和准备用于训练和测试模型的数据。确保数据集是清洁、标记正确，并且与问题的任务相关。

数据预处理：对数据进行预处理以满足模型的输入要求。包括对数据进行标准化、归一化、分词、向量化等操作。确保数据格式适用于LSTM模型。

划分数据集：将数据集划分为训练集和测试集。通常，训练集用于模型的训练，测试集用于评估模型的最终性能。

构建LSTM模型：使用深度学习框架PyTorch构建LSTM模型。

定义模型结构：确定LSTM模型的层数、每层的神经元数量以及其他超参数。根据问题的复杂程度和数据集的特点来决定模型的结构。

编译模型：配置LSTM模型的损失函数、优化器和评估指标。本发明使用的损失函数包括平均绝对误差（MAE）和均方根误差（RMSE），使用的优化器为Adam优化器。

模型训练：使用训练集对LSTM模型进行训练。通过反向传播算法和优化器更新模型的权重和偏置，使模型能够逐渐学习数据集中的特征和模式。

模型验证和调优：使用验证集评估模型的性能，并根据验证结果调整模型的超参数和结构。

模型测试：在测试集上评估经过训练和验证的LSTM模型的性能。本发明使用决定系数（R-Squared）来评估模型的准确性。

模型应用：使用经过训练和测试的LSTM模型进行预测或分类。将新的输入数据输入到模型中，得到模型的输出结果。

本文使用python进行 LSTM 模型的构建，在构建模型之前需要划分训练集和测试集，并且LSTM 神经网络需要人为设定的初始参数有，隐藏层个数、隐藏层神经元个数、优化器、激活函数、初始学习率等，具体设定的参数值如下表所示。

具体的，下面通过实施例对本发明方案作进一步阐述：

输入数据为：256×1×61的高维数据；

将上述数据经过1×32×2的卷积核进行卷积操作，得到256×32×60的数据；

对256×32×60的数据进行最大池化操作，得到256×32×30的数据；

定义两个空数据h0：4×256×32，c0：4×256×32，将h0，c0与上一步得到的256×32×30的数据一起放到预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型中进行训练，得到256×32×32的数据；

对256×32×32的数据进行降维操作，降维后的数据为：256×1024；

对256×1024数据进行线性操作，得到256×6的数据；

优化一次训练LSTM的布料成分分析回归模型的学习率，提高一次训练LSTM的布料成分分析回归模型的训练精度，以提高高布料成分分析的准确率，将优化后的学习率输入至一次训练LSTM的布料成分分析回归模型内，输出得到二次训练LSTM的布料成分分析回归模型；

具体的，下面通过实施例对本发明方案作进一步阐述：

如图3所示，包括：

1.遗忘门：当输入新的信息时，模型若需遗忘旧的信息，此时通过遗忘门来完成。遗忘门是LSTM单元的关键组成部分，可以控制哪些信息要保留、哪些信息要遗忘，并且以某种方式避免梯度随时间反向传播时引发的梯度消失和梯度爆炸的问题。遗忘门决定LSTM从上一时刻的细胞状态Ct-1中丢弃什么信息。该门读取ht-1和xt，然后通过sigmoid将其映射到0到1之间的数值，最终该数值再与细胞状态Ct-1相乘，来决定Ct-1该丢弃什么信息。当该数值为1时表示完全地保留Ct-1的信息，当该数值为0时表示完全地丢弃Ct-1的信息。

2.输入门：确定哪些新的信息被保留在细胞状态中。输入门用于控制网络当前输入数据xt流入记忆单元的多少，即有多少输入信息可以保存Ct到中。输入门包括两部分，第一部分：由sigmoid组成的“输入门”产生的介于0到1之间的控制信号it，用来控制Ct输入的程度；第二部分：通过一个tanh层产生当前时刻的候选细胞状态Ct，这个值将由it决定添加到细胞状态中的程度。

3.更新细胞状态Ct：将旧的细胞状态Ct-1更新为当前细胞状态Ct。有了遗忘门产生的控制信号ft，tanh层产生的候选细胞状态，输入门产生的控制信号it，就可以将Ct-1更新为Ct。首先ft*Ct-1确定上一个细胞状态要保留的信息；然后得到候选细胞状态需要保留的信息；最后将这两部分相加，得到最终的当前时刻的细胞状态Ct。

4.输出门：输出值基于细胞状态，但是会有一个过滤的过程。这里也包括两部分操作：第一部分，由sigmoid组成的“输出门”产生的介于0到1之间的控制信号ot；第二部分，将最终产生的输出信息tanh(Ct)与控制信号ot相乘，得到最终的输出值ht。输出门控制记忆单元Ct对当前输出值ht的影响，即记忆单元中的哪一部分会在时间步t输出。

种群初始化。首先，根据问题的潜在解答方式进行编码，然后在解空间中使用随机数初始化一个群体，其中群体中的每个个体都代表着数字化的编码。

评估种群。为了评估种群内每个个体的适应性，使用适应性函数对种群中的每个个体进行评估，从而计算出每个个体的适应度。

选择操作。一旦获得了种群内每个个体的适应度值，接下来，使用选择算子在种群内进行操作，其目的是将经过优化的个体，也就是那些适应度值较高的个体传递到下一代。

交叉操作。根据上一步选择的个体，通过一定的概率阈值来控制是否使用交叉方法生成新的个体。交叉的方式可以包括单点交叉、多点交叉等不同的方法。

变异操作。对种群内的个体的染色体进行一定的变异，这即意味着使用变异算子来影响群体中的染色体。在经过选择、交叉、变异等一系列操作后，初始种群将演化成下一代种群。

终止判断。如果在进化过程中获得了具有最大适应度的个体，那么将其标识为最优解并输出，随后终止计算过程。

其中，优化一次训练LSTM的布料成分分析回归模型的学习率的方法包括：

固定学习率（Fixed Learning Rate）：最简单的方法是使用固定的学习率，在整个训练过程中保持不变。这种方法适用于简单的任务和较小的数据集，但可能无法很好地应对复杂的问题。

学习率衰减（Learning Rate Decay）：学习率衰减是一种逐渐降低学习率的策略。常见的衰减方式包括按照固定的衰减率或按照固定的步长进行衰减。例如，可以在每个epoch或每个一定步长后将学习率乘以一个衰减因子，使学习率逐渐减小。学习率衰减可以帮助模型在训练初期更快地收敛，在训练后期更稳定地搜索最优解。

动态调整学习率（Learning Rate Scheduling）：动态调整学习率是根据训练过程中的模型性能或其他指标来自适应地调整学习率。常见的方法包括基于验证集损失的性能来调整学习率，例如当验证集损失不再下降时降低学习率。另一种方法是根据训练的迭代次数或其他指标设定学习率的变化规则，例如使用三角形学习率策略（TriangularLearning Rate Policy）或余弦退火学习率（Cosine Annealing Learning Rate）等。

自适应学习率方法（Adaptive Learning Rate）：自适应学习率方法根据模型在训练过程中的表现来自动调整学习率。常见的自适应学习率方法包括动量优化算法（如Momentum、Nesterov Accelerated Gradient）、自适应矩估计算法（如Adagrad、RMSProp、Adam）等。这些方法根据梯度的统计信息或历史梯度信息来调整学习率，以提高收敛速度和性能。

多尺度学习率策略（Multi-Scale Learning Rate）：对于一些特定的任务，不同层次的特征可能具有不同的重要性。多尺度学习率策略通过为不同层次或不同参数组设置不同的学习率，以更好地适应不同层次的特征。例如，可以将较低层次的参数组设置较高的学习率，以便更快地学习低层次的特征。

在本实施例中，采用遗传算法优化一次训练LSTM的布料成分分析回归模型的学习率，遗传算法是一种全局优化算法，可以搜索参数空间中的多个候选解。通过遗传算法优化学习率，可以更全面地探索学习率的最优取值范围，可能找到更好的解决方案。相比之下，传统的手动调节学习率方法通常只能搜索有限的几个取值;遗传算法通过不断迭代和交叉变异的过程，能够在搜索过程中逐渐优化学习率。它可以根据当前的适应度评估结果动态地调整学习率的取值，使得算法能够在不同的训练阶段自适应地调整。这种适应性和鲁棒性使得遗传算法在处理复杂的优化问题时具有优势;遗传算法的计算过程可以进行并行化处理，通过同时评估多个候选解，加快了学习率优化的速度。这对于深度学习中大规模数据和复杂模型的情况尤为重要，可以减少整体的训练时间。在优化前学习率为1e-3，优化之后的学习率为1.32157356e-3；

且采用遗传算法初始种群设置为20，变异率设置为30，神经元个数的区间设置为[16,40]，学习率的区间设置为[0.0001,0.1]；

其中，LSTM的布料成分分析回归模型选取的评价指标包括决定系数、平均绝对误差、均方根误差；

其中，所述决定系数的计算公式：

平均绝对误差的计算公式：

均方根误差的计算公式：

根据三个指标将训练前的LSTM的布料成分分析回归模型和训练后的二次训练LSTM的布料成分分析回归模型（GA-LSTM）进行对比，如下表所示：

上述方案中，所述待测布料光谱数据是使用配有波长范围为1550 nm~1850 nm，光谱分辨率为5 nm的FPI红外光谱传感器的红外光谱分析仪对羊毛、涤纶和棉混的纺织品采用24位高精度采样，将羊毛、涤纶和棉混的纺织品的光谱数据提取出61个特征；

其中，所述棉混为棉的混合纺织品；

将待测布料的融合后的光谱数据输入至二次训练LSTM的布料成分分析回归模型内，输出得到布料成分分析结果的过程：

实施例二：第二方面，如图4所示，本发明公开了一种基于GA-LSTM高光谱定量反演的布料成分分析系统，包括：

其中，为归一化之后的样本布料光谱数据的数值，/>为样本布料光谱数据的实际数值，/>为一条样本布料光谱数据中最小值，/>为一条样本布料光谱数据中最大值；/>

LSTM在t时刻的输出ht为：

其中：为t时刻的输出门，/>为长时记忆输入；

其中为Sigmoid函数，/>、/>以及/>分别为遗忘门的权重和偏置；

其中、/>为输出门的权重，/>为输出门的偏置。

数据准备：收集和准备用于训练和测试模型的数据；

数据预处理：对数据进行预处理以满足模型的输入要求，包括对数据进行标准化、归一化、分词、向量化等操作，确保数据格式适用于LSTM模型。

划分数据集：将数据集划分为训练集和测试集；

构建LSTM模型：使用深度学习框架PyTorch构建LSTM模型；

定义模型结构：确定LSTM模型的层数、每层的神经元数量，根据问题的复杂程度和数据集的特点来决定模型的结构；

其中，所述决定系数的计算公式：

平均绝对误差的计算公式：

均方根误差的计算公式：

在本说明书的描述中，参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上显示和描述了本公开的基本原理、主要特征和本公开的优点。本行业的技术人员应该了解，本公开不受上述实施例的限制，上述实施例和说明书中描述的只是说明本公开的原理，在不脱离本公开精神和范围的前提下，本公开还会有各种变化和改进，这些变化和改进都落入要求保护的本公开范围内容。

Claims

1.一种基于GA-LSTM高光谱定量反演的布料成分分析方法，其特征在于，方法包括以下步骤：

2.根据权利要求1所述的一种基于GA-LSTM高光谱定量反演的布料成分分析方法，其特征在于，所述样本布料光谱数据的采集方法：利用近红外光谱仪采集含有羊毛、涤纶和棉混的纺织品的近红外反射光谱，得到样本布料光谱数据。

3.根据权利要求1所述的一种基于GA-LSTM高光谱定量反演的布料成分分析方法，其特征在于，所述对样本布料光谱数据进行预处理的过程采用线性函数归一化的方法。

4.根据权利要求3所述的一种基于GA-LSTM高光谱定量反演的布料成分分析方法，其特征在于，所述线性函数归一化是将一条样本布料光谱数据映射到[0,1]，归一化的公式如下：

5.根据权利要求1所述的一种基于GA-LSTM高光谱定量反演的布料成分分析方法，其特征在于，所述预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型：

LSTM在t时刻的输出ht为：

其中：为t时刻的输出门，/>为长时记忆输入；

其中为Sigmoid函数，/>、/>以及/>分别为遗忘门的权重和偏置；

其中、/>为输出门的权重，/>为输出门的偏置。

6.根据权利要求5所述的一种基于GA-LSTM高光谱定量反演的布料成分分析方法，其特征在于，所述预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型的方法：

数据准备：收集和准备用于训练和测试模型的数据；

数据预处理：对数据进行预处理以满足模型的输入要求，包括对数据进行标准化、归一化、分词、向量化操作，确保数据格式适用于LSTM模型；

划分数据集：将数据集划分为训练集和测试集；

构建LSTM模型：使用深度学习框架PyTorch构建LSTM模型；

编译模型：配置LSTM模型的损失函数、优化器和评估指标，使用的损失函数包括平均绝对误差MAE和均方根误差RMSE，使用的优化器为Adam优化器；

7.根据权利要求6所述的一种基于GA-LSTM高光谱定量反演的布料成分分析方法，其特征在于，所述LSTM的布料成分分析回归模型选取的评价指标包括决定系数、平均绝对误差、均方根误差；

其中，所述决定系数的计算公式：

平均绝对误差的计算公式：

均方根误差的计算公式：

8.根据权利要求1所述的一种基于GA-LSTM高光谱定量反演的布料成分分析方法，其特征在于，所述将待测布料的融合后的光谱数据输入至二次训练LSTM的布料成分分析回归模型内，输出得到布料成分分析结果的过程：

9.一种基于GA-LSTM高光谱定量反演的布料成分分析系统，其特征在于，包括：

二次训练模块，用于优化一次训练LSTM的布料成分分析回归模型的学习率，提高一次训练LSTM的布料成分分析回归模型的训练精度，将优化后的学习率输入至一次训练LSTM的布料成分分析回归模型内，输出得到二次训练LSTM的布料成分分析回归模型；

10.根据权利要求9所述的一种基于GA-LSTM高光谱定量反演的布料成分分析系统，其特征在于，所述数据处理模块中样本布料光谱数据的采集方法：利用近红外光谱仪采集羊毛、涤纶和棉混的纺织品的近红外反射光谱，得到样本布料光谱数据；

LSTM在t时刻的输出ht为：

其中：为t时刻的输出门，/>为长时记忆输入；

其中为Sigmoid函数，/>、/>以及/>分别为遗忘门的权重和偏置；

其中、/>为输出门的权重，/>为输出门的偏置；

数据准备：收集和准备用于训练和测试模型的数据；

划分数据集：将数据集划分为训练集和测试集；

构建LSTM模型：使用深度学习框架PyTorch构建LSTM模型；

模型应用：使用经过训练和测试的LSTM模型进行预测或分类，将新的输入数据输入到LSTM模型中，得到LSTM模型的输出结果；

其中，所述决定系数的计算公式：

平均绝对误差的计算公式：

均方根误差的计算公式：