CN117786617A - 一种基于ga-lstm高光谱定量反演的布料成分分析方法及系统 - Google Patents
一种基于ga-lstm高光谱定量反演的布料成分分析方法及系统 Download PDFInfo
- Publication number
- CN117786617A CN117786617A CN202410214228.4A CN202410214228A CN117786617A CN 117786617 A CN117786617 A CN 117786617A CN 202410214228 A CN202410214228 A CN 202410214228A CN 117786617 A CN117786617 A CN 117786617A
- Authority
- CN
- China
- Prior art keywords
- model
- lstm
- cloth
- data
- component analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000004744 fabric Substances 0.000 title claims abstract description 236
- 238000004458 analytical method Methods 0.000 title claims abstract description 113
- 238000012549 training Methods 0.000 claims abstract description 139
- 238000001228 spectrum Methods 0.000 claims abstract description 62
- 238000012360 testing method Methods 0.000 claims abstract description 40
- 238000013528 artificial neural network Methods 0.000 claims abstract description 35
- 238000007781 pre-processing Methods 0.000 claims abstract description 26
- 230000015654 memory Effects 0.000 claims abstract description 21
- 238000000034 method Methods 0.000 claims description 78
- 239000004753 textile Substances 0.000 claims description 72
- 230000003595 spectral effect Effects 0.000 claims description 58
- 238000004364 calculation method Methods 0.000 claims description 33
- 238000010606 normalization Methods 0.000 claims description 33
- 230000006870 function Effects 0.000 claims description 32
- 239000000203 mixture Substances 0.000 claims description 31
- 210000004027 cell Anatomy 0.000 claims description 28
- 229920000742 Cotton Polymers 0.000 claims description 26
- 239000000835 fiber Substances 0.000 claims description 24
- 210000002268 wool Anatomy 0.000 claims description 24
- 229920000728 polyester Polymers 0.000 claims description 23
- 230000008569 process Effects 0.000 claims description 21
- 238000012886 linear function Methods 0.000 claims description 18
- 238000012795 verification Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 17
- 238000011156 evaluation Methods 0.000 claims description 13
- 230000007787 long-term memory Effects 0.000 claims description 12
- 238000013135 deep learning Methods 0.000 claims description 9
- 210000002569 neuron Anatomy 0.000 claims description 9
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 7
- 230000003213 activating effect Effects 0.000 claims description 6
- 238000002360 preparation method Methods 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 6
- 239000013598 vector Substances 0.000 claims description 6
- 239000004615 ingredient Substances 0.000 claims 2
- 238000013507 mapping Methods 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 10
- 230000004927 fusion Effects 0.000 abstract description 2
- 238000005457 optimization Methods 0.000 description 8
- 230000002068 genetic effect Effects 0.000 description 7
- 238000002329 infrared spectrum Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 5
- 238000004880 explosion Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000008034 disappearance Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 4
- 238000005033 Fourier transform infrared spectroscopy Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 238000000701 chemical imaging Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000010287 polarization Effects 0.000 description 3
- 238000000985 reflectance spectrum Methods 0.000 description 3
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 2
- 238000000862 absorption spectrum Methods 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000003912 environmental pollution Methods 0.000 description 2
- 238000002189 fluorescence spectrum Methods 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000010200 validation analysis Methods 0.000 description 2
- 229920004934 Dacron® Polymers 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000009841 combustion method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000011978 dissolution method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 230000001678 irradiating effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000005020 polyethylene terephthalate Substances 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Treatment Of Fiber Materials (AREA)
Abstract
本发明公开了一种基于GA‑LSTM高光谱定量反演的布料成分分析方法及系统,涉及检测技术领域,包括:接收样本布料光谱数据,对样本布料光谱数据进行预处理,得到样本数据,将样本数据进行分类得到训练集和测试集;将训练集和测试集输入至预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型内,输出得到一次训练LSTM的布料成分分析回归模型;优化一次训练LSTM的布料成分分析回归模型的学习率,将优化后的学习率输入至一次训练LSTM的布料成分分析回归模型内,输出得到二次训练LSTM的布料成分分析回归模型;将待测布料的融合后的光谱数据输入至二次训练LSTM的布料成分分析回归模型内,得到布料成分分析结果。
Description
技术领域
本发明涉及检测技术领域,具体的是一种基于GA-LSTM高光谱定量反演的布料成分分析方法及系统。
背景技术
作为决定产品价值的主要指标,纺织品纤维成分和含量一直是生产者、消费者和各级市场监管部门十分关心的问题。国内外为保护消费者的合法权益,也颁布相应法令规定纺织品必须标注纤维成分及其含量。但在实际生产和市场交易中,纺织品的以次充好、虚假声明和掺假情况等问题也并不少见。因此,纺织品纤维含量的定量检测一直都是众多检测项目中极其重要的一环。而现存的纺织品纤维检测方法(燃烧法、溶解法等),不仅检测周期长,检测环境要求高,还存在污染环境的问题。故研究一种高效、便捷以及环保的检测方法具有重要意义。
发明内容
为解决上述背景技术中提到的不足,本发明的目的在于提供一种基于GA-LSTM高光谱定量反演的布料成分分析方法及系统,可以快速、无损的检测混纺织品中的纤维含量。
第一方面,本发明的目的可以通过以下技术方案实现:一种基于GA-LSTM高光谱定量反演的布料成分分析方法,方法包括以下步骤:
接收样本布料光谱数据,对样本布料光谱数据进行预处理,得到样本数据,将样本数据进行分类得到训练集和测试集;
将训练集和测试集输入至预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型内,输出得到一次训练LSTM的布料成分分析回归模型;
优化一次训练LSTM的布料成分分析回归模型的学习率,提高一次训练LSTM的布料成分分析回归模型的训练精度,将优化后的学习率输入至一次训练LSTM的布料成分分析回归模型内,输出得到二次训练LSTM的布料成分分析回归模型;
获取待测布料光谱数据,对待测布料光谱数据进行预处理得到待测布料的融合后的光谱数据,将待测布料的融合后的光谱数据输入至二次训练LSTM的布料成分分析回归模型内,输出得到布料成分分析结果。
结合第一方面,在第一方面的某些实现方式中,该方法还包括:所述样本布料光谱数据的采集方法:利用近红外光谱仪采集羊毛、涤纶和棉混的纺织品的近红外反射光谱,得到样本布料光谱数据。
结合第一方面,在第一方面的某些实现方式中,该方法还包括:所述对样本布料光谱数据进行预处理的过程采用线性函数归一化的方法。
结合第一方面,在第一方面的某些实现方式中,该方法还包括:所述线性函数归一化是将一条样本布料光谱数据映射到[0,1],归一化的公式如下:
其中,为归一化之后的样本布料光谱数据的数值,/>为样本布料光谱数据的实际数值,/>为一条样本布料光谱数据中最小值,/>为一条样本布料光谱数据中最大值。
结合第一方面,在第一方面的某些实现方式中,该方法还包括:所述预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型:
LSTM在t时刻的输出ht为:
其中:为t时刻的输出门,/>为长时记忆输入;
遗忘门是由当前时刻的输入/>以及上一时刻外部状态/>所共同决定的,计算公式为:
其中为Sigmoid函数,/>、/>以及/>分别为遗忘门的权重和偏置;
为t时刻的输入门,由两部分组成,一是由Sigmoid函数输出/>,二是由/>激活函数输出/>,再通过两者向量的元素乘积得到更新后的细胞状态,其计算公式为:
其中、/>以及/>、/>分别代表各自的权重,/>代表偏置,更新后的细胞状态为/>,计算公式为:
数据信息在通过遗忘门后选择保留一部分信息通过输入门更新数据状态,
经由输出门决定最终的输出结果并将输出结果传递给外部状态/>,输出门的表达式为:
其中、/>为输出门的权重,/>为输出门的偏置。
LSTM 网络的门控机制以及线性连接有效解决了普通循环神经网络的梯度爆炸或消失问题,在实践中该模型也应用在多个领域,表明了其在循环神经网络模型中的优越性。
结合第一方面,在第一方面的某些实现方式中,该方法还包括:所述预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型的方法:
数据准备:收集和准备用于训练和测试模型的数据;
数据预处理:对数据进行预处理以满足模型的输入要求,包括对数据进行标准化、归一化、分词、向量化操作,确保数据格式适用于LSTM模型。
划分数据集:将数据集划分为训练集和测试集;
构建LSTM模型:使用深度学习框架PyTorch构建LSTM模型;
定义模型结构:确定LSTM模型的层数、每层的神经元数量以及其他超参数,根据问题的复杂程度和数据集的特点来决定模型的结构;
编译模型:配置LSTM模型的损失函数、优化器和评估指标。本发明使用的损失函数包括平均绝对误差MAE和均方根误差RMSE,使用的优化器为Adam优化器;
模型训练:使用训练集对LSTM模型进行训练,通过反向传播算法和优化器更新模型的权重和偏置,使模型能够逐渐学习数据集中的特征和模式;
模型验证和调优:使用验证集评估模型的性能,并根据验证结果调整模型的超参数和结构;
模型测试:在测试集上评估经过训练和验证的LSTM模型的性能,使用决定系数R-Squared来评估模型的准确性;
模型应用:使用经过训练和测试的LSTM模型进行预测或分类,将新的输入数据输入到LSTM模型中,得到LSTM模型的输出结果。
结合第一方面,在第一方面的某些实现方式中,该方法还包括:所述LSTM的布料成分分析回归模型选取的评价指标包括决定系数、平均绝对误差、均方根误差;
其中,所述决定系数的计算公式:
其中R-squared代表决定系数,为纺织品纤维真实含量,/>为模型对纺织品纤维的预测含量,/>为纺织品纤维含量的平均值,n为样本数;
平均绝对误差的计算公式:
其中MAE代表平均绝对误差,为纺织品纤维真实含量,/>为模型对纺织品纤维的预测含量,/>为纺织品纤维含量的平均值,n为样本数;
均方根误差的计算公式:
其中RMSE代表均方根误差,为纺织品纤维真实含量,/>为模型对纺织品纤维的预测含量,/>为纺织品纤维含量的平均值,n为样本数。
结合第一方面,在第一方面的某些实现方式中,该方法还包括:所述将待测布料的融合后的光谱数据输入至二次训练LSTM的布料成分分析回归模型内,输出得到布料成分分析结果的过程:
将羊毛、涤纶和棉混的纺织品待测布料光谱数据训练集输入至LSTM模型中,获取二次训练LSTM的布料成分分析回归模型预测的目标羊毛、涤纶和棉混的纺织品成分结果。
第二方面,为了达到上述目的,本发明公开了一种基于GA-LSTM高光谱定量反演的布料成分分析系统,包括:
数据处理模块,用于接收样本布料光谱数据,对样本布料光谱数据进行预处理,得到样本数据,将样本数据进行分类得到训练集和测试集;
一次训练模块,用于将训练集和测试集输入至预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型内,输出得到一次训练LSTM的布料成分分析回归模型;
二次训练模块,用于优化一次训练LSTM的布料成分分析回归模型的学习率,将优化后的学习率输入至一次训练LSTM的布料成分分析回归模型内,输出得到二次训练LSTM的布料成分分析回归模型;
成分分析模块,用于获取待测布料光谱数据,对待测布料光谱数据进行预处理得到待测布料的融合后的光谱数据,将待测布料的融合后的光谱数据输入至二次训练LSTM的布料成分分析回归模型内,输出得到布料成分分析结果。
结合第二方面,在第二方面的某些实现方式中,该系统还包括:所述数据处理模块中样本布料光谱数据的采集方法:利用近红外光谱仪采集羊毛、涤纶和棉混的纺织品的近红外反射光谱,得到样本布料光谱数据;
数据处理模块内对样本布料光谱数据进行预处理的过程采用线性函数归一化的方法;
数据处理模块内线性函数归一化是将一条样本布料光谱数据映射到[0,1],归一化的公式如下:
其中,为归一化之后的样本布料光谱数据的数值,/>为样本布料光谱数据的实际数值,/>为一条样本布料光谱数据中最小值,/>为一条样本布料光谱数据中最大值;
一次训练模块内预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型:
预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型:
LSTM在t时刻的输出ht为:
其中:为t时刻的输出门,/>为长时记忆输入;
遗忘门是由当前时刻的输入/>以及上一时刻外部状态/>所共同决定的,计算公式为:
其中为Sigmoid函数,/>、/>以及/>分别为遗忘门的权重和偏置;
为t时刻的输入门,由两部分组成,一是由Sigmoid函数输出/>,二是由/>激活函数输出/>,再通过两者向量的元素乘积得到更新后的细胞状态,其计算公式为:
其中、/>以及/>、/>分别代表各自的权重,/>代表偏置,更新后的细胞状态为/>,计算公式为:
数据信息在通过遗忘门后选择保留一部分信息通过输入门更新数据状态,
经由输出门决定最终的输出结果并将输出结果传递给外部状态/>,输出门的表达式为:
其中、/>为输出门的权重,/>为输出门的偏置。
LSTM 网络的门控机制以及线性连接有效解决了普通循环神经网络的梯度爆炸或消失问题,在实践中该模型也应用在多个领域,表明了其在循环神经网络模型中的优越性。
一次训练模块内预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型的方法:
数据准备:收集和准备用于训练和测试模型的数据;
数据预处理:对数据进行预处理以满足模型的输入要求,包括对数据进行标准化、归一化、分词、向量化操作,确保数据格式适用于LSTM模型。
划分数据集:将数据集划分为训练集和测试集;
构建LSTM模型:使用深度学习框架PyTorch构建LSTM模型;
定义模型结构:确定LSTM模型的层数、每层的神经元数量以及其他超参数,根据问题的复杂程度和数据集的特点来决定模型的结构;
编译模型:配置LSTM模型的损失函数、优化器和评估指标。本发明使用的损失函数包括平均绝对误差MAE和均方根误差RMSE,使用的优化器为Adam优化器;
模型训练:使用训练集对LSTM模型进行训练,通过反向传播算法和优化器更新模型的权重和偏置,使模型能够逐渐学习数据集中的特征和模式;
模型验证和调优:使用验证集评估模型的性能,并根据验证结果调整模型的超参数和结构;
模型测试:在测试集上评估经过训练和验证的LSTM模型的性能,使用决定系数R-Squared来评估模型的准确性;
模型应用:使用经过训练和测试的LSTM模型进行预测或分类,将新的输入数据输入到LSTM模型中,得到LSTM模型的输出结果。
一次训练模块、二次训练模块内LSTM的布料成分分析回归模型选取的评价指标包括决定系数、平均绝对误差、均方根误差;
其中,所述决定系数的计算公式:
其中R-squared代表决定系数,为纺织品纤维真实含量,/>为模型对纺织品纤维的预测含量,/>为纺织品纤维含量的平均值,n为样本数;
平均绝对误差的计算公式:
其中MAE代表平均绝对误差,为纺织品纤维真实含量,/>为模型对纺织品纤维的预测含量,/>为纺织品纤维含量的平均值,n为样本数;
均方根误差的计算公式:
其中RMSE代表均方根误差,为纺织品纤维真实含量,/>为模型对纺织品纤维的预测含量,/>为纺织品纤维含量的平均值,n为样本数;
成分分析模块内将待测布料的融合后的光谱数据输入至二次训练LSTM的布料成分分析回归模型内,输出得到布料成分分析结果的过程:
将羊毛、涤纶和棉混的纺织品待测布料光谱数据训练集输入至LSTM模型中,获取二次训练LSTM的布料成分分析回归模型预测的目标羊毛、涤纶和棉混的纺织品成分结果。
本发明的有益效果:
本发明基于深度学习技术对数据处理的优势,构建适用于羊毛、涤纶和棉混的纺织品成分检测的GA-LSTM模型,自动建立回归关系,从而检测羊毛、涤纶和棉混的纺织品成分,实现了羊毛、涤纶和棉混的纺织品的红外光谱数据与深度学习技术在布料成分检测方面的应用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图;
图1是本发明方法流程示意图;
图2是本发明工作流程示意图;
图3是本发明羊毛、涤纶和棉混的纺织品成分检测的LSTM的布料成分分析回归模型示意图;
图4是本发明系统结构示意图;
图5是本发明LSTM神经网络的神经元结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例一:
下面,对本申请实施例涉及的相关术语进行介绍:
长短期记忆神经网络:长短期记忆神经网络(LSTM,Long Short-Term Memory)是一种时间循环神经网络,是为了解决一般的RNN(循环神经网络)存在的长期依赖问题而专门设计出来的,所有的RNN都具有一种重复神经网络模块的链式形式。在标准RNN中,这个重复的结构模块只有一个非常简单的结构,例如一个tanh层。
光谱数据:光谱数据存在与光谱库内,光谱库是由高光谱成像光谱仪在一定条件下测得的各类地物反射光谱数据的集合。光谱库在准确地解译遥感图像信息、快速地实现未知地物的匹配、提高遥感分类识别水平起着至关重要的作用。由于高光谱成像光谱仪产生了庞大的数据量,建立地物光谱数据库,运用先进的计算机技术来保存、管理和分析这些信息,是提高遥感信息的分析处理水平并使其能得到高效、合理之应用的唯一途径,并给人们认识、识别及匹配地物提供了基础。
均方根误差:均方根误差,亦称标准误差。在有限测量次数中,均方根误差常用下式表示:√[∑di^2/n]=Re,式中:n为测量次数;di为一组测量值与真值的偏差;Re为均方根误差。如果误差统计分布是正态分布,那么随机误差落在±σ以内的概率为68%,σ表示正态分布的分散程度。
平均绝对误差:平均绝对误差是所有单个观测值与算术平均值的偏差的绝对值的平均,平均绝对误差可以避免误差相互抵消的问题,因而可以准确反映实际预测误差的大小。
近红外反射光谱:近红外反射光谱是介于可见光(Vis)和中红外(MIR)之间的电磁辐射波,美国材料检测协会(ASTM)将近红外光谱区定义为780-2526nm的区域,是人们在吸收光谱中发现的第一个非可见光区。近红外光谱区与有机分子中含氢基团(O-H、N-H、C-H)振动的合频和各级倍频的吸收区一致,通过扫描样品的近红外光谱,可以得到样品中有机分子含氢基团的特征信息,而且利用近红外光谱技术分析样品具有方便、快速、高效、准确和成本较低,不破坏样品,不消耗化学试剂,不污染环境等优点,因此该技术受到越来越多人的青睐。
如图1所示,一种基于GA-LSTM高光谱定量反演的布料成分分析方法,方法包括以下步骤:
接收样本布料光谱数据,对样本布料光谱数据进行预处理,得到样本数据,将样本数据进行分类得到训练集和测试集;
其中,所述样本布料光谱数据的采集方法包括:
反射光谱测量:使用光谱测量设备(如光谱分析仪或分光光度计),在可见光和近红外等波长范围内测量布料样品的反射光谱。通过照射光源并测量样品反射的光强,可以获取不同波长下的反射率数据。
傅里叶变换红外光谱(FTIR):使用傅里叶变换红外光谱仪,通过照射红外光源并测量布料样品在红外波长范围内的吸收光谱。这种方法可以提供关于样品分子结构和化学成分的信息。
偏振光谱测量:使用偏振光谱仪,测量布料样品对不同偏振方向的光的响应。这种方法可以提供关于布料的光学特性和纤维取向的信息。
荧光光谱测量:通过照射布料样品并测量其发射的荧光光谱,获取布料样品在不同波长下的荧光特性。这种方法可以提供关于布料成分、表面性质和荧光染料等的信息。
分光光度法:使用分光光度计,在特定波长下测量布料样品吸收或透射的光强。这种方法可以用于分析布料样品中特定成分的浓度或检测某些化学反应的进程。
具体的,在本实施例的实施过程中采用近红外光谱仪采集羊毛、涤纶和棉混的纺织品的近红外反射光谱,得到样本布料光谱数据,采用近红外光谱仪的好处是高效、便捷以及环保。
对样本布料光谱数据进行预处理的方法包括:
缺失值处理:处理数据中的缺失值,有几种常见的方法:
删除包含缺失值的行或列。
使用均值、中位数或其他统计量填充缺失值。
使用插值方法(如线性插值)来预测缺失值。
异常值处理:检测和处理数据中的异常值,防止其对模型产生负面影响。
主成分分析(PCA):将原始特征投影到新的坐标轴上,保留最重要的信息。
在本实施例的实施过程中,采用线性函数归一化的方法对样本布料光谱数据进行预处理,采用线性函数归一化的好处是:
保留相对距离关系:线性函数归一化保留了数据之间的相对距离关系。即便进行了缩放,数据点之间的相对顺序和距离关系仍然保持不变,这对于许多机器学习算法是重要的。
避免特征间差异过大:当不同特征的尺度相差较大时,某些机器学习算法可能对尺度较大的特征更为敏感,导致模型性能下降。线性函数归一化可以避免这种问题,确保各个特征在相似的尺度范围内。
有助于梯度下降算法的收敛:在使用梯度下降等优化算法进行模型训练时,尺度相近的特征可以使算法更快地收敛。线性函数归一化确保了特征的值在一个较小的范围内,有助于提高优化算法的效率。
对神经网络有益:在神经网络中,输入数据通常被限制在 [0,1] 范围内。线性函数归一化使得数据更符合这种要求,有助于模型的训练和性能。
适用于某些距离度量:在使用基于距离的算法(如 K-近邻算法)时,数据的尺度可能会对距离计算产生影响。线性函数归一化有助于确保各个特征对距离的贡献大致相等。
线性函数归一化是将一条样本布料光谱数据映射到[0,1],归一化的公式如下:
其中,为归一化之后的样本布料光谱数据的数值,/>为样本布料光谱数据的实际数值,/>为一条样本布料光谱数据中最小值,/>为一条样本布料光谱数据中最大值。
将训练集和测试集输入至预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型内,输出得到一次训练LSTM的布料成分分析回归模型;
预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型:
LSTM在t时刻的输出ht为:
其中:为t时刻的输出门,/>为长时记忆输入;
遗忘门是由当前时刻的输入/>以及上一时刻外部状态/>所共同决定的,计算公式为:
其中为Sigmoid函数,/>、/>以及/>分别为遗忘门的权重和偏置;
为t时刻的输入门,由两部分组成,一是由Sigmoid函数输出/>,二是由/>激活函数输出/>,再通过两者向量的元素乘积得到更新后的细胞状态,其计算公式为:
其中、/>以及/>、/>分别代表各自的权重,/>代表偏置,更新后的细胞状态为/>,计算公式为:
数据信息在通过遗忘门后选择保留一部分信息通过输入门更新数据状态,
经由输出门决定最终的输出结果并将输出结果传递给外部状态/>,输出门的表达式为:
其中、/>为输出门的权重,/>为输出门的偏置。
LSTM 网络的门控机制以及线性连接有效解决了普通循环神经网络的梯度爆炸或消失问题,在实践中该模型也应用在多个领域,表明了其在循环神经网络模型中的优越性。
预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型的方法:
数据准备:收集和准备用于训练和测试模型的数据。确保数据集是清洁、标记正确,并且与问题的任务相关。
数据预处理:对数据进行预处理以满足模型的输入要求。包括对数据进行标准化、归一化、分词、向量化等操作。确保数据格式适用于LSTM模型。
划分数据集:将数据集划分为训练集和测试集。通常,训练集用于模型的训练,测试集用于评估模型的最终性能。
构建LSTM模型:使用深度学习框架PyTorch构建LSTM模型。
定义模型结构:确定LSTM模型的层数、每层的神经元数量以及其他超参数。根据问题的复杂程度和数据集的特点来决定模型的结构。
编译模型:配置LSTM模型的损失函数、优化器和评估指标。本发明使用的损失函数包括平均绝对误差(MAE)和均方根误差(RMSE),使用的优化器为Adam优化器。
模型训练:使用训练集对LSTM模型进行训练。通过反向传播算法和优化器更新模型的权重和偏置,使模型能够逐渐学习数据集中的特征和模式。
模型验证和调优:使用验证集评估模型的性能,并根据验证结果调整模型的超参数和结构。
模型测试:在测试集上评估经过训练和验证的LSTM模型的性能。本发明使用决定系数(R-Squared)来评估模型的准确性。
模型应用:使用经过训练和测试的LSTM模型进行预测或分类。将新的输入数据输入到模型中,得到模型的输出结果。
本文使用python进行 LSTM 模型的构建,在构建模型之前需要划分训练集和测试集,并且LSTM 神经网络需要人为设定的初始参数有,隐藏层个数、隐藏层神经元个数、优化器、激活函数、初始学习率等,具体设定的参数值如下表所示。
具体的,下面通过实施例对本发明方案作进一步阐述:
输入数据为:256×1×61的高维数据;
将上述数据经过1×32×2的卷积核进行卷积操作,得到256×32×60的数据;
对256×32×60的数据进行最大池化操作,得到256×32×30的数据;
定义两个空数据h0:4×256×32,c0:4×256×32,将h0,c0与上一步得到的256×32×30的数据一起放到预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型中进行训练,得到256×32×32的数据;
对256×32×32的数据进行降维操作,降维后的数据为:256×1024;
对256×1024数据进行线性操作,得到256×6的数据;
优化一次训练LSTM的布料成分分析回归模型的学习率,提高一次训练LSTM的布料成分分析回归模型的训练精度,以提高高布料成分分析的准确率,将优化后的学习率输入至一次训练LSTM的布料成分分析回归模型内,输出得到二次训练LSTM的布料成分分析回归模型;
具体的,下面通过实施例对本发明方案作进一步阐述:
如图3所示,包括:
1.遗忘门:当输入新的信息时,模型若需遗忘旧的信息,此时通过遗忘门来完成。遗忘门是LSTM单元的关键组成部分,可以控制哪些信息要保留、哪些信息要遗忘,并且以某种方式避免梯度随时间反向传播时引发的梯度消失和梯度爆炸的问题。遗忘门决定LSTM从上一时刻的细胞状态Ct-1中丢弃什么信息。该门读取ht-1和xt,然后通过sigmoid将其映射到0到1之间的数值,最终该数值再与细胞状态Ct-1相乘,来决定Ct-1该丢弃什么信息。当该数值为1时表示完全地保留Ct-1的信息,当该数值为0时表示完全地丢弃Ct-1的信息。
2.输入门:确定哪些新的信息被保留在细胞状态中。输入门用于控制网络当前输入数据xt流入记忆单元的多少,即有多少输入信息可以保存Ct到中。输入门包括两部分,第一部分:由sigmoid组成的“输入门”产生的介于0到1之间的控制信号it,用来控制Ct输入的程度;第二部分:通过一个tanh层产生当前时刻的候选细胞状态Ct,这个值将由it决定添加到细胞状态中的程度。
3.更新细胞状态Ct:将旧的细胞状态Ct-1更新为当前细胞状态Ct。有了遗忘门产生的控制信号ft,tanh层产生的候选细胞状态,输入门产生的控制信号it,就可以将Ct-1更新为Ct。首先ft*Ct-1确定上一个细胞状态要保留的信息;然后得到候选细胞状态需要保留的信息;最后将这两部分相加,得到最终的当前时刻的细胞状态Ct。
4.输出门:输出值基于细胞状态,但是会有一个过滤的过程。这里也包括两部分操作:第一部分,由sigmoid组成的“输出门”产生的介于0到1之间的控制信号ot;第二部分,将最终产生的输出信息tanh(Ct)与控制信号ot相乘,得到最终的输出值ht。输出门控制记忆单元Ct对当前输出值ht的影响,即记忆单元中的哪一部分会在时间步t输出。
种群初始化。首先,根据问题的潜在解答方式进行编码,然后在解空间中使用随机数初始化一个群体,其中群体中的每个个体都代表着数字化的编码。
评估种群。为了评估种群内每个个体的适应性,使用适应性函数对种群中的每个个体进行评估,从而计算出每个个体的适应度。
选择操作。一旦获得了种群内每个个体的适应度值,接下来,使用选择算子在种群内进行操作,其目的是将经过优化的个体,也就是那些适应度值较高的个体传递到下一代。
交叉操作。根据上一步选择的个体,通过一定的概率阈值来控制是否使用交叉方法生成新的个体。交叉的方式可以包括单点交叉、多点交叉等不同的方法。
变异操作。对种群内的个体的染色体进行一定的变异,这即意味着使用变异算子来影响群体中的染色体。在经过选择、交叉、变异等一系列操作后,初始种群将演化成下一代种群。
终止判断。如果在进化过程中获得了具有最大适应度的个体,那么将其标识为最优解并输出,随后终止计算过程。
其中,优化一次训练LSTM的布料成分分析回归模型的学习率的方法包括:
固定学习率(Fixed Learning Rate):最简单的方法是使用固定的学习率,在整个训练过程中保持不变。这种方法适用于简单的任务和较小的数据集,但可能无法很好地应对复杂的问题。
学习率衰减(Learning Rate Decay):学习率衰减是一种逐渐降低学习率的策略。常见的衰减方式包括按照固定的衰减率或按照固定的步长进行衰减。例如,可以在每个epoch或每个一定步长后将学习率乘以一个衰减因子,使学习率逐渐减小。学习率衰减可以帮助模型在训练初期更快地收敛,在训练后期更稳定地搜索最优解。
动态调整学习率(Learning Rate Scheduling):动态调整学习率是根据训练过程中的模型性能或其他指标来自适应地调整学习率。常见的方法包括基于验证集损失的性能来调整学习率,例如当验证集损失不再下降时降低学习率。另一种方法是根据训练的迭代次数或其他指标设定学习率的变化规则,例如使用三角形学习率策略(TriangularLearning Rate Policy)或余弦退火学习率(Cosine Annealing Learning Rate)等。
自适应学习率方法(Adaptive Learning Rate):自适应学习率方法根据模型在训练过程中的表现来自动调整学习率。常见的自适应学习率方法包括动量优化算法(如Momentum、Nesterov Accelerated Gradient)、自适应矩估计算法(如Adagrad、RMSProp、Adam)等。这些方法根据梯度的统计信息或历史梯度信息来调整学习率,以提高收敛速度和性能。
多尺度学习率策略(Multi-Scale Learning Rate):对于一些特定的任务,不同层次的特征可能具有不同的重要性。多尺度学习率策略通过为不同层次或不同参数组设置不同的学习率,以更好地适应不同层次的特征。例如,可以将较低层次的参数组设置较高的学习率,以便更快地学习低层次的特征。
在本实施例中,采用遗传算法优化一次训练LSTM的布料成分分析回归模型的学习率,遗传算法是一种全局优化算法,可以搜索参数空间中的多个候选解。通过遗传算法优化学习率,可以更全面地探索学习率的最优取值范围,可能找到更好的解决方案。相比之下,传统的手动调节学习率方法通常只能搜索有限的几个取值;遗传算法通过不断迭代和交叉变异的过程,能够在搜索过程中逐渐优化学习率。它可以根据当前的适应度评估结果动态地调整学习率的取值,使得算法能够在不同的训练阶段自适应地调整。这种适应性和鲁棒性使得遗传算法在处理复杂的优化问题时具有优势;遗传算法的计算过程可以进行并行化处理,通过同时评估多个候选解,加快了学习率优化的速度。这对于深度学习中大规模数据和复杂模型的情况尤为重要,可以减少整体的训练时间。在优化前学习率为1e-3,优化之后的学习率为1.32157356e-3;
且采用遗传算法初始种群设置为20,变异率设置为30,神经元个数的区间设置为[16,40],学习率的区间设置为[0.0001,0.1];
其中,LSTM的布料成分分析回归模型选取的评价指标包括决定系数、平均绝对误差、均方根误差;
其中,所述决定系数的计算公式:
其中R-squared代表决定系数,为纺织品纤维真实含量,/>为模型对纺织品纤维的预测含量,/>为纺织品纤维含量的平均值,n为样本数;
平均绝对误差的计算公式:
其中MAE代表平均绝对误差,为纺织品纤维真实含量,/>为模型对纺织品纤维的预测含量,/>为纺织品纤维含量的平均值,n为样本数;
均方根误差的计算公式:
其中RMSE代表均方根误差,为纺织品纤维真实含量,/>为模型对纺织品纤维的预测含量,/>为纺织品纤维含量的平均值,n为样本数。
根据三个指标将训练前的LSTM的布料成分分析回归模型和训练后的二次训练LSTM的布料成分分析回归模型(GA-LSTM)进行对比,如下表所示:
获取待测布料光谱数据,对待测布料光谱数据进行预处理得到待测布料的融合后的光谱数据,将待测布料的融合后的光谱数据输入至二次训练LSTM的布料成分分析回归模型内,输出得到布料成分分析结果。
上述方案中,所述待测布料光谱数据是使用配有波长范围为1550 nm~1850 nm,光谱分辨率为5 nm的FPI红外光谱传感器的红外光谱分析仪对羊毛、涤纶和棉混的纺织品采用24位高精度采样,将羊毛、涤纶和棉混的纺织品的光谱数据提取出61个特征;
其中,所述棉混为棉的混合纺织品;
将待测布料的融合后的光谱数据输入至二次训练LSTM的布料成分分析回归模型内,输出得到布料成分分析结果的过程:
将羊毛、涤纶和棉混的纺织品待测布料光谱数据训练集输入至LSTM模型中,获取二次训练LSTM的布料成分分析回归模型预测的目标羊毛、涤纶和棉混的纺织品成分结果。
实施例二:第二方面,如图4所示,本发明公开了一种基于GA-LSTM高光谱定量反演的布料成分分析系统,包括:
数据处理模块,用于接收样本布料光谱数据,对样本布料光谱数据进行预处理,得到样本数据,将样本数据进行分类得到训练集和测试集;
一次训练模块,用于将训练集和测试集输入至预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型内,输出得到一次训练LSTM的布料成分分析回归模型;
二次训练模块,用于优化一次训练LSTM的布料成分分析回归模型的学习率,将优化后的学习率输入至一次训练LSTM的布料成分分析回归模型内,输出得到二次训练LSTM的布料成分分析回归模型;
成分分析模块,用于获取待测布料光谱数据,对待测布料光谱数据进行预处理得到待测布料的融合后的光谱数据,将待测布料的融合后的光谱数据输入至二次训练LSTM的布料成分分析回归模型内,输出得到布料成分分析结果。
结合第二方面,在第二方面的某些实现方式中,该系统还包括:所述数据处理模块中样本布料光谱数据的采集方法:利用近红外光谱仪采集羊毛、涤纶和棉混的纺织品的近红外反射光谱,得到样本布料光谱数据;
数据处理模块内对样本布料光谱数据进行预处理的过程采用线性函数归一化的方法;
数据处理模块内线性函数归一化是将一条样本布料光谱数据映射到[0,1],归一化的公式如下:
其中,为归一化之后的样本布料光谱数据的数值,/>为样本布料光谱数据的实际数值,/>为一条样本布料光谱数据中最小值,/>为一条样本布料光谱数据中最大值;/>
一次训练模块内预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型:
预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型:
LSTM在t时刻的输出ht为:
其中:为t时刻的输出门,/>为长时记忆输入;
遗忘门是由当前时刻的输入/>以及上一时刻外部状态/>所共同决定的,计算公式为:
其中为Sigmoid函数,/>、/>以及/>分别为遗忘门的权重和偏置;
为t时刻的输入门,由两部分组成,一是由Sigmoid函数输出/>,二是由/>激活函数输出/>,再通过两者向量的元素乘积得到更新后的细胞状态,其计算公式为:
其中、/>以及/>、/>分别代表各自的权重,/>代表偏置,更新后的细胞状态为/>,计算公式为:
数据信息在通过遗忘门后选择保留一部分信息通过输入门更新数据状态,
经由输出门决定最终的输出结果并将输出结果传递给外部状态/>,输出门的表达式为:
其中、/>为输出门的权重,/>为输出门的偏置。
LSTM 网络的门控机制以及线性连接有效解决了普通循环神经网络的梯度爆炸或消失问题,在实践中该模型也应用在多个领域,表明了其在循环神经网络模型中的优越性。
一次训练模块内预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型的方法:
数据准备:收集和准备用于训练和测试模型的数据;
数据预处理:对数据进行预处理以满足模型的输入要求,包括对数据进行标准化、归一化、分词、向量化等操作,确保数据格式适用于LSTM模型。
划分数据集:将数据集划分为训练集和测试集;
构建LSTM模型:使用深度学习框架PyTorch构建LSTM模型;
定义模型结构:确定LSTM模型的层数、每层的神经元数量,根据问题的复杂程度和数据集的特点来决定模型的结构;
编译模型:配置LSTM模型的损失函数、优化器和评估指标。本发明使用的损失函数包括平均绝对误差MAE和均方根误差RMSE,使用的优化器为Adam优化器;
模型训练:使用训练集对LSTM模型进行训练,通过反向传播算法和优化器更新模型的权重和偏置,使模型能够逐渐学习数据集中的特征和模式;
模型验证和调优:使用验证集评估模型的性能,并根据验证结果调整模型的超参数和结构;
模型测试:在测试集上评估经过训练和验证的LSTM模型的性能,使用决定系数R-Squared来评估模型的准确性;
模型应用:使用经过训练和测试的LSTM模型进行预测或分类,将新的输入数据输入到LSTM模型中,得到LSTM模型的输出结果。
一次训练模块、二次训练模块内LSTM的布料成分分析回归模型选取的评价指标包括决定系数、平均绝对误差、均方根误差;
其中,所述决定系数的计算公式:
其中R-squared代表决定系数,为纺织品纤维真实含量,/>为模型对纺织品纤维的预测含量,/>为纺织品纤维含量的平均值,n为样本数;
平均绝对误差的计算公式:
其中MAE代表平均绝对误差,为纺织品纤维真实含量,/>为模型对纺织品纤维的预测含量,/>为纺织品纤维含量的平均值,n为样本数;
均方根误差的计算公式:
其中RMSE代表均方根误差,为纺织品纤维真实含量,/>为模型对纺织品纤维的预测含量,/>为纺织品纤维含量的平均值,n为样本数;
成分分析模块内将待测布料的融合后的光谱数据输入至二次训练LSTM的布料成分分析回归模型内,输出得到布料成分分析结果的过程:
将羊毛、涤纶和棉混的纺织品待测布料光谱数据训练集输入至LSTM模型中,获取二次训练LSTM的布料成分分析回归模型预测的目标羊毛、涤纶和棉混的纺织品成分结果。
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本公开的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上显示和描述了本公开的基本原理、主要特征和本公开的优点。本行业的技术人员应该了解,本公开不受上述实施例的限制,上述实施例和说明书中描述的只是说明本公开的原理,在不脱离本公开精神和范围的前提下,本公开还会有各种变化和改进,这些变化和改进都落入要求保护的本公开范围内容。
Claims (10)
1.一种基于GA-LSTM高光谱定量反演的布料成分分析方法,其特征在于,方法包括以下步骤:
接收样本布料光谱数据,对样本布料光谱数据进行预处理,得到样本数据,将样本数据进行分类得到训练集和测试集;
将训练集和测试集输入至预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型内,输出得到一次训练LSTM的布料成分分析回归模型;
优化一次训练LSTM的布料成分分析回归模型的学习率,提高一次训练LSTM的布料成分分析回归模型的训练精度,将优化后的学习率输入至一次训练LSTM的布料成分分析回归模型内,输出得到二次训练LSTM的布料成分分析回归模型;
获取待测布料光谱数据,对待测布料光谱数据进行预处理得到待测布料的融合后的光谱数据,将待测布料的融合后的光谱数据输入至二次训练LSTM的布料成分分析回归模型内,输出得到布料成分分析结果。
2.根据权利要求1所述的一种基于GA-LSTM高光谱定量反演的布料成分分析方法,其特征在于,所述样本布料光谱数据的采集方法:利用近红外光谱仪采集含有羊毛、涤纶和棉混的纺织品的近红外反射光谱,得到样本布料光谱数据。
3.根据权利要求1所述的一种基于GA-LSTM高光谱定量反演的布料成分分析方法,其特征在于,所述对样本布料光谱数据进行预处理的过程采用线性函数归一化的方法。
4.根据权利要求3所述的一种基于GA-LSTM高光谱定量反演的布料成分分析方法,其特征在于,所述线性函数归一化是将一条样本布料光谱数据映射到[0,1],归一化的公式如下:
其中,为归一化之后的样本布料光谱数据的数值,/>为样本布料光谱数据的实际数值,/>为一条样本布料光谱数据中最小值,/>为一条样本布料光谱数据中最大值。
5.根据权利要求1所述的一种基于GA-LSTM高光谱定量反演的布料成分分析方法,其特征在于,所述预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型:
LSTM在t时刻的输出ht为:
其中:为t时刻的输出门,/>为长时记忆输入;
遗忘门是由当前时刻的输入/>以及上一时刻外部状态/>所共同决定的,计算公式为:
其中为Sigmoid函数,/>、/>以及/>分别为遗忘门的权重和偏置;
为t时刻的输入门,由两部分组成,一是由Sigmoid函数输出/>,二是由/>激活函数输出/>,再通过两者向量的元素乘积得到更新后的细胞状态,其计算公式为:
其中、/>以及/>、/>分别代表各自的权重,/>代表偏置,更新后的细胞状态为/>,计算公式为:
数据信息在通过遗忘门后选择保留一部分信息通过输入门更新数据状态,
经由输出门决定最终的输出结果并将输出结果传递给外部状态/>,输出门的表达式为:
其中、/>为输出门的权重,/>为输出门的偏置。
6.根据权利要求5所述的一种基于GA-LSTM高光谱定量反演的布料成分分析方法,其特征在于,所述预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型的方法:
数据准备:收集和准备用于训练和测试模型的数据;
数据预处理:对数据进行预处理以满足模型的输入要求,包括对数据进行标准化、归一化、分词、向量化操作,确保数据格式适用于LSTM模型;
划分数据集:将数据集划分为训练集和测试集;
构建LSTM模型:使用深度学习框架PyTorch构建LSTM模型;
定义模型结构:确定LSTM模型的层数、每层的神经元数量,根据问题的复杂程度和数据集的特点来决定模型的结构;
编译模型:配置LSTM模型的损失函数、优化器和评估指标,使用的损失函数包括平均绝对误差MAE和均方根误差RMSE,使用的优化器为Adam优化器;
模型训练:使用训练集对LSTM模型进行训练,通过反向传播算法和优化器更新模型的权重和偏置,使模型能够逐渐学习数据集中的特征和模式;
模型验证和调优:使用验证集评估模型的性能,并根据验证结果调整模型的超参数和结构;
模型测试:在测试集上评估经过训练和验证的LSTM模型的性能,使用决定系数R-Squared来评估模型的准确性;
模型应用:使用经过训练和测试的LSTM模型进行预测或分类,将新的输入数据输入到LSTM模型中,得到LSTM模型的输出结果。
7.根据权利要求6所述的一种基于GA-LSTM高光谱定量反演的布料成分分析方法,其特征在于,所述LSTM的布料成分分析回归模型选取的评价指标包括决定系数、平均绝对误差、均方根误差;
其中,所述决定系数的计算公式:
其中R-squared代表决定系数,为纺织品纤维真实含量,/>为模型对纺织品纤维的预测含量,/>为纺织品纤维含量的平均值,n为样本数;
平均绝对误差的计算公式:
其中MAE代表平均绝对误差,为纺织品纤维真实含量,/>为模型对纺织品纤维的预测含量,/>为纺织品纤维含量的平均值,n为样本数;
均方根误差的计算公式:
其中RMSE代表均方根误差,为纺织品纤维真实含量,/>为模型对纺织品纤维的预测含量,/>为纺织品纤维含量的平均值,n为样本数。
8.根据权利要求1所述的一种基于GA-LSTM高光谱定量反演的布料成分分析方法,其特征在于,所述将待测布料的融合后的光谱数据输入至二次训练LSTM的布料成分分析回归模型内,输出得到布料成分分析结果的过程:
将羊毛、涤纶和棉混的纺织品待测布料光谱数据训练集输入至LSTM模型中,获取二次训练LSTM的布料成分分析回归模型预测的目标羊毛、涤纶和棉混的纺织品成分结果。
9.一种基于GA-LSTM高光谱定量反演的布料成分分析系统,其特征在于,包括:
数据处理模块,用于接收样本布料光谱数据,对样本布料光谱数据进行预处理,得到样本数据,将样本数据进行分类得到训练集和测试集;
一次训练模块,用于将训练集和测试集输入至预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型内,输出得到一次训练LSTM的布料成分分析回归模型;
二次训练模块,用于优化一次训练LSTM的布料成分分析回归模型的学习率,提高一次训练LSTM的布料成分分析回归模型的训练精度,将优化后的学习率输入至一次训练LSTM的布料成分分析回归模型内,输出得到二次训练LSTM的布料成分分析回归模型;
成分分析模块,用于获取待测布料光谱数据,对待测布料光谱数据进行预处理得到待测布料的融合后的光谱数据,将待测布料的融合后的光谱数据输入至二次训练LSTM的布料成分分析回归模型内,输出得到布料成分分析结果。
10.根据权利要求9所述的一种基于GA-LSTM高光谱定量反演的布料成分分析系统,其特征在于,所述数据处理模块中样本布料光谱数据的采集方法:利用近红外光谱仪采集羊毛、涤纶和棉混的纺织品的近红外反射光谱,得到样本布料光谱数据;
数据处理模块内对样本布料光谱数据进行预处理的过程采用线性函数归一化的方法;
数据处理模块内线性函数归一化是将一条样本布料光谱数据映射到[0,1],归一化的公式如下:
其中,为归一化之后的样本布料光谱数据的数值,/>为样本布料光谱数据的实际数值,/>为一条样本布料光谱数据中最小值,/>为一条样本布料光谱数据中最大值;
一次训练模块内预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型:
LSTM在t时刻的输出ht为:
其中:为t时刻的输出门,/>为长时记忆输入;
遗忘门是由当前时刻的输入/>以及上一时刻外部状态/>所共同决定的,计算公式为:
其中为Sigmoid函数,/>、/>以及/>分别为遗忘门的权重和偏置;
为t时刻的输入门,由两部分组成,一是由Sigmoid函数输出/>,二是由/>激活函数输出/>,再通过两者向量的元素乘积得到更新后的细胞状态,其计算公式为:
其中、/>以及/>、/>分别代表各自的权重,/>代表偏置,更新后的细胞状态为/>,计算公式为:
数据信息在通过遗忘门后选择保留一部分信息通过输入门更新数据状态,
经由输出门决定最终的输出结果并将输出结果传递给外部状态/>,输出门的表达式为:
其中、/>为输出门的权重,/>为输出门的偏置;
一次训练模块内预先建立的长短期记忆神经网络LSTM的布料成分分析回归模型的方法:
数据准备:收集和准备用于训练和测试模型的数据;
数据预处理:对数据进行预处理以满足模型的输入要求,包括对数据进行标准化、归一化、分词、向量化操作,确保数据格式适用于LSTM模型;
划分数据集:将数据集划分为训练集和测试集;
构建LSTM模型:使用深度学习框架PyTorch构建LSTM模型;
定义模型结构:确定LSTM模型的层数、每层的神经元数量,根据问题的复杂程度和数据集的特点来决定模型的结构;
编译模型:配置LSTM模型的损失函数、优化器和评估指标,使用的损失函数包括平均绝对误差MAE和均方根误差RMSE,使用的优化器为Adam优化器;
模型训练:使用训练集对LSTM模型进行训练,通过反向传播算法和优化器更新模型的权重和偏置,使模型能够逐渐学习数据集中的特征和模式;
模型验证和调优:使用验证集评估模型的性能,并根据验证结果调整模型的超参数和结构;
模型测试:在测试集上评估经过训练和验证的LSTM模型的性能,使用决定系数R-Squared来评估模型的准确性;
模型应用:使用经过训练和测试的LSTM模型进行预测或分类,将新的输入数据输入到LSTM模型中,得到LSTM模型的输出结果;
一次训练模块、二次训练模块内LSTM的布料成分分析回归模型选取的评价指标包括决定系数、平均绝对误差、均方根误差;
其中,所述决定系数的计算公式:
其中R-squared代表决定系数,为纺织品纤维真实含量,/>为模型对纺织品纤维的预测含量,/>为纺织品纤维含量的平均值,n为样本数;
平均绝对误差的计算公式:
其中MAE代表平均绝对误差,为纺织品纤维真实含量,/>为模型对纺织品纤维的预测含量,/>为纺织品纤维含量的平均值,n为样本数;
均方根误差的计算公式:
其中RMSE代表均方根误差,为纺织品纤维真实含量,/>为模型对纺织品纤维的预测含量,/>为纺织品纤维含量的平均值,n为样本数;
成分分析模块内将待测布料的融合后的光谱数据输入至二次训练LSTM的布料成分分析回归模型内,输出得到布料成分分析结果的过程:
将羊毛、涤纶和棉混的纺织品待测布料光谱数据训练集输入至LSTM模型中,获取二次训练LSTM的布料成分分析回归模型预测的目标羊毛、涤纶和棉混的纺织品成分结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410214228.4A CN117786617B (zh) | 2024-02-27 | 2024-02-27 | 一种基于ga-lstm高光谱定量反演的布料成分分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410214228.4A CN117786617B (zh) | 2024-02-27 | 2024-02-27 | 一种基于ga-lstm高光谱定量反演的布料成分分析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117786617A true CN117786617A (zh) | 2024-03-29 |
CN117786617B CN117786617B (zh) | 2024-04-30 |
Family
ID=90389610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410214228.4A Active CN117786617B (zh) | 2024-02-27 | 2024-02-27 | 一种基于ga-lstm高光谱定量反演的布料成分分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117786617B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140079297A1 (en) * | 2012-09-17 | 2014-03-20 | Saied Tadayon | Application of Z-Webs and Z-factors to Analytics, Search Engine, Learning, Recognition, Natural Language, and Other Utilities |
US20140201126A1 (en) * | 2012-09-15 | 2014-07-17 | Lotfi A. Zadeh | Methods and Systems for Applications for Z-numbers |
CN109166118A (zh) * | 2018-09-05 | 2019-01-08 | 深圳灵图慧视科技有限公司 | 织物表面属性检测方法、装置及计算机设备 |
CN113887317A (zh) * | 2021-09-06 | 2022-01-04 | 池明旻 | 基于π模型的织物纤维成分半监督分类方法 |
CN113962140A (zh) * | 2021-09-14 | 2022-01-21 | 国网河北省电力有限公司电力科学研究院 | 基于ga-lstm的汽轮机阀门流量特性函数的优化方法 |
CN114414523A (zh) * | 2021-10-25 | 2022-04-29 | 上海布眼人工智能科技有限公司 | 一种基于自动波段选择的纺织纤维成分定性方法 |
CN115018193A (zh) * | 2022-07-01 | 2022-09-06 | 北京华能新锐控制技术有限公司 | 基于lstm-ga模型的时间序列风能数据预测方法 |
CN115219906A (zh) * | 2022-06-27 | 2022-10-21 | 武汉理工大学 | 基于ga-pso优化的多模型融合电池荷电状态预测方法及系统 |
CN115619563A (zh) * | 2022-11-09 | 2023-01-17 | 杭州师范大学 | 一种基于神经网络的股票价格分析方法 |
CN115700665A (zh) * | 2022-10-27 | 2023-02-07 | 浙江理工大学 | 一种基于Attention-GRU模型的纺纱质量预测方法 |
US20230281618A1 (en) * | 2021-07-14 | 2023-09-07 | Strong Force TX Portfolio 2018, LLC | Systems and methods with integrated gaming engines and smart contracts |
WO2024001942A1 (zh) * | 2022-06-30 | 2024-01-04 | 西南交通大学 | 一种基于mi-gra与改进pso-lstm的山区边坡位移预测方法 |
CN117524340A (zh) * | 2024-01-04 | 2024-02-06 | 南京信息工程大学 | 基于多层一维cnn深度网络的纺织品成份定量表征方法 |
-
2024
- 2024-02-27 CN CN202410214228.4A patent/CN117786617B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140201126A1 (en) * | 2012-09-15 | 2014-07-17 | Lotfi A. Zadeh | Methods and Systems for Applications for Z-numbers |
US20140079297A1 (en) * | 2012-09-17 | 2014-03-20 | Saied Tadayon | Application of Z-Webs and Z-factors to Analytics, Search Engine, Learning, Recognition, Natural Language, and Other Utilities |
CN109166118A (zh) * | 2018-09-05 | 2019-01-08 | 深圳灵图慧视科技有限公司 | 织物表面属性检测方法、装置及计算机设备 |
US20230281618A1 (en) * | 2021-07-14 | 2023-09-07 | Strong Force TX Portfolio 2018, LLC | Systems and methods with integrated gaming engines and smart contracts |
CN113887317A (zh) * | 2021-09-06 | 2022-01-04 | 池明旻 | 基于π模型的织物纤维成分半监督分类方法 |
CN113962140A (zh) * | 2021-09-14 | 2022-01-21 | 国网河北省电力有限公司电力科学研究院 | 基于ga-lstm的汽轮机阀门流量特性函数的优化方法 |
CN114414523A (zh) * | 2021-10-25 | 2022-04-29 | 上海布眼人工智能科技有限公司 | 一种基于自动波段选择的纺织纤维成分定性方法 |
CN115219906A (zh) * | 2022-06-27 | 2022-10-21 | 武汉理工大学 | 基于ga-pso优化的多模型融合电池荷电状态预测方法及系统 |
WO2024001942A1 (zh) * | 2022-06-30 | 2024-01-04 | 西南交通大学 | 一种基于mi-gra与改进pso-lstm的山区边坡位移预测方法 |
CN115018193A (zh) * | 2022-07-01 | 2022-09-06 | 北京华能新锐控制技术有限公司 | 基于lstm-ga模型的时间序列风能数据预测方法 |
CN115700665A (zh) * | 2022-10-27 | 2023-02-07 | 浙江理工大学 | 一种基于Attention-GRU模型的纺纱质量预测方法 |
CN115619563A (zh) * | 2022-11-09 | 2023-01-17 | 杭州师范大学 | 一种基于神经网络的股票价格分析方法 |
CN117524340A (zh) * | 2024-01-04 | 2024-02-06 | 南京信息工程大学 | 基于多层一维cnn深度网络的纺织品成份定量表征方法 |
Non-Patent Citations (5)
Title |
---|
包振山 等: "基于LSTM-GA的股票价格涨跌预测模型", 计算机科学, no. 1, 15 June 2020 (2020-06-15), pages 467 - 473 * |
姜添 等: "RNN在降落伞开伞特性研究中的应用", 航天返回与遥感, no. 06, 15 December 2019 (2019-12-15), pages 35 - 43 * |
王彩虹 等: "基于支持向量机的近红外光谱羊毛混纺面料的无损鉴别技术", 毛纺科技, no. 04, 5 April 2016 (2016-04-05), pages 1 - 5 * |
王晨阳 等: "基于遗传算法优化卷积长短记忆混合神经网络模型的光伏发电功率预测", 物理学报, no. 10, 6 May 2020 (2020-05-06), pages 149 - 155 * |
黄孟强 等: "基于1D-CNN的近红外光谱定量分析棉/涤纶/羊毛混纺纤维含量方法研究", 光谱学与光谱分析, vol. 43, no. 11, 6 November 2023 (2023-11-06), pages 3565 - 3570 * |
Also Published As
Publication number | Publication date |
---|---|
CN117786617B (zh) | 2024-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hopke | The evolution of chemometrics | |
Atkinson et al. | The forward search: Theory and data analysis | |
CN111126575B (zh) | 基于机器学习的气体传感器阵列混合气体检测方法及装置 | |
CN103235095B (zh) | 注水肉检测方法和装置 | |
CN110717368A (zh) | 一种纺织品定性分类方法 | |
US20210157824A1 (en) | Preprocessing for a Classification Algorithm | |
CN112613536A (zh) | 一种基于smote和深度学习的近红外光谱柴油牌号识别方法 | |
CN109460471A (zh) | 一种基于自学习的方式建立纤维种类图谱库的方法 | |
Bai et al. | Novel hybrid extreme learning machine and multi-objective optimization algorithm for air pollution prediction | |
Arshad et al. | Estimation of leaf water content from mid-and thermal-infrared spectra by coupling genetic algorithm and partial least squares regression | |
Tan et al. | Mutual information-induced interval selection combined with kernel partial least squares for near-infrared spectral calibration | |
CN113903407A (zh) | 成分识别方法、装置、电子设备和存储介质 | |
Omondiagbe et al. | Soil texture prediction with automated deep convolutional neural networks and population-based learning | |
CN117786617B (zh) | 一种基于ga-lstm高光谱定量反演的布料成分分析方法及系统 | |
CN116519661A (zh) | 一种基于卷积神经网络的大米识别检测方法 | |
CN117491293A (zh) | 一种基于高光谱的高陡岸坡碳酸盐岩体溶蚀快速评估方法 | |
Wang et al. | Estimation of soil organic matter by in situ Vis-NIR spectroscopy using an automatically optimized hybrid model of convolutional neural network and long short-term memory network | |
Fu et al. | Prediction of financial economic time series based on group intelligence algorithm based on machine learning | |
CN115797763A (zh) | 一种植被空间分布格局调查方法及植被分类系统 | |
Ye et al. | Remote sensing retrieval of suspended solids in Longquan Lake based on GA-SVM model | |
CN107179297A (zh) | 一种智能红木种类鉴定方法及其平台 | |
CN114219157A (zh) | 一种基于最优决策和动态分析的烷烃气体红外光谱测量方法 | |
Li et al. | SVM-based apple classification of soluble solids content by near-infrared spectroscopy | |
Hamidi et al. | Texture‐based classification of high‐resolution precipitation forecasts with machine‐learning methods | |
CN117740727B (zh) | 一种基于红外高光谱的纺织品成分定量反演方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |