CN117273070B - 一种基于孪生卷积自编码器构建的光谱模型转移方法 - Google Patents

一种基于孪生卷积自编码器构建的光谱模型转移方法 Download PDF

Info

Publication number
CN117273070B
CN117273070B CN202311524302.4A CN202311524302A CN117273070B CN 117273070 B CN117273070 B CN 117273070B CN 202311524302 A CN202311524302 A CN 202311524302A CN 117273070 B CN117273070 B CN 117273070B
Authority
CN
China
Prior art keywords
near infrared
machine
spectrum
infrared spectrum
encoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311524302.4A
Other languages
English (en)
Other versions
CN117273070A (zh
Inventor
吴箭
杨泽会
郝贤伟
徐元飞
李瑞东
吕小芳
毕一鸣
张志成
李卫星
徐梦瑶
张建
王昕�
吴灵通
王宇敏
招云芳
付涛
李正莹
张恺
夏春艳
朱剑波
夏自麟
夏丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yunnan Leaf Tobacco Redrying Co ltd
Original Assignee
Yunnan Leaf Tobacco Redrying Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yunnan Leaf Tobacco Redrying Co ltd filed Critical Yunnan Leaf Tobacco Redrying Co ltd
Priority to CN202311524302.4A priority Critical patent/CN117273070B/zh
Publication of CN117273070A publication Critical patent/CN117273070A/zh
Application granted granted Critical
Publication of CN117273070B publication Critical patent/CN117273070B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3563Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明属于烟草近红外光谱模型转移技术领域,具体涉及一种基于孪生卷积自编码器构建的光谱模型转移方法,包括:S1:获取源机与从机的近红外光谱;S2:将获取的近红外光谱进行数据集随机划分,划分为训练集和测试集;S3:使用误差椭圆法分别剔除源机和从机近红外光谱中的异常数据;S4:分别对源机和从机的近红外光谱进行预处理;S5:设计基于卷积自编码器的孪生编码器A和B;S6:设计基于孪生编码器A和B的转移模型C;S7:训练集中源机和从机的近红外光谱训练转移模型C;S8:测试集中源机和从机的近红外光谱评估转移模型C。本发明解决现有由于环境不同、仪器零部件的差异等原因,而导致的不同仪器间近红外模型无法共享的问题。

Description

一种基于孪生卷积自编码器构建的光谱模型转移方法
技术领域
本发明属于烟草近红外光谱模型转移技术领域,具体涉及一种基于孪生卷积自编码器构建的光谱模型转移方法。
背景技术
近红外光谱技术作为一种成分分析方法,具有低成本、无损、无污染、快速高效等优点,被广泛应用于烟草行业。然而在实际应用中,即使同一个厂家同一个型号的两台近红外光谱仪器,由于环境不同、仪器零部件的差异等原因,会导致仪器间测量出的光谱存在差异。由于建立光谱模型需要投入大量的人力、物力,花费巨大,如果将已经建立的模型应用于其他仪器,那么不仅节约大量的人力、物力,而且对于实现模型的共享,提高模型的通用性、适用性具有重要的意义。
近年来,深度学习技术凭借其学习能力强、适应性好、上限高、可移植性好等优点,在多个领域下大放异彩。但将其应用于光谱模型转移上,却鲜有研究。对于光谱数据量大、变量多以及冗余表达等问题,利用深度学习的深层网络结构,能够充分提取光谱特征,有利于加强光谱之间的紧密关联,并且可以实现高维度光谱的降维。
然而,深度学习在训练时,往往需要大量数据及算力,尤其对数据量的要求较为严苛,使用小样本训练的模型很容易陷入对小样本的过拟合以及对目标任务的欠拟合。但基于小样本的模型训练在当前的烟草工业界有着广泛的需求。
发明内容
本发明解决现有由于环境不同、仪器零部件的差异等原因,而导致的不同仪器间近红外模型无法共享的问题,提供采用深度学习技术的一种基于孪生卷积自编码器构建的光谱模型转移方法,通过进行孪生卷积自编码器构建的网络结构设计,以能够充分提取红外光谱特征、加强光谱之间的紧密关联、实现高维度光谱的降维,从而实现不同仪器间近红外模型共享。进一步各卷积池化层参数设置合理,能确保在小样本数据集上转移模型也不会发生过拟合现象,预测精度较高。
本发明要求保护的技术方案如下:
一种基于孪生卷积自编码器构建的光谱模型转移方法,包括如下步骤:
S1:获取源机与从机的近红外光谱;
S2:将S1获取的近红外光谱进行数据集随机划分,划分为训练集和测试集,训练集和测试集均有源机和从机近红外光谱;
S3:使用误差椭圆法分别剔除训练集和测试集中的源机和从机近红外光谱中的异常数据;
S4:分别对S3得到的训练集和测试集中源机以及从机的近红外光谱进行预处理;
S5:设计基于卷积自编码器的孪生编码器A和B;采用S4得到的训练集中从机的近红外光谱训练孪生编码器A;采用S4得到的训练集中源机的近红外光谱训练孪生编码器B;
S6:设计基于S5所述孪生编码器A和孪生编码器B的转移模型C;
S7:使用S4得到的训练集中源机和从机的近红外光谱训练S6的转移模型C;
S8:采用S4得到的测试集中源机和从机的近红外光谱评估转移模型C,检验光谱转移效果。
S1中获取源机与从机的近红外光谱时,每条源机的近红外光谱和从机的近红外光谱均从相同的烟叶样本分别用源机与从机扫描得到。
S3中所述误差椭圆法包括如下步骤:
S31:使用主成分分析(PCA)方法,分别将训练集和测试集中的源机以及从机的近红外光谱进行降维,只保留两个主成分,并分别计算降维后训练集和测试集中,源机的近红外光谱以及训练集和测试集中从机的近红外光谱的均值和两个主成分的标准差,并据此分别确定训练集和测试集中源机的近红外光谱的误差椭圆以及训练集和测试集中从机的近红外光谱对应的误差椭圆;
S32:分别对降维后训练集和测试集中源机近红外光谱以及从机的近红外光谱,计算其T2统计量,由此判断出训练集和测试集中的离群点,并将其从训练集和测试集中剔除;所述T2统计量用于发现样本点中的离群点。
S32中T2统计量发现样本点中的离群点的具体原理为:
定义第i个样本点对第h主成分th的贡献率为,公式如下:
(1)
其中,是第i个样本点的第h主成分;/>是主成分th的方差;n是样本点个数;
通过公式(1)可计算样本点i对主成分的累计贡献率,公式如下:
(2)
其中,是第i个样本点的第h主成分;/>是主成分th的方差;n是样本点个数;当:
(3)
时,认为在95%的检验水平上,样本点i对主成分的贡献过大,此时该样本i是离群点;其中,n是样本点个数;m为主成分数;/>为累计贡献率;F 0.05(m,n-m)为检验水平α = 0.05,分子自由度为m,分母自由度为 n-m 的F分布的单侧右分位点,通过查询F分布的F界值表得到;
当m为2时,即主成分数为2时,将m = 2 带入公式(3)可得到如下公式:
(4)
其中, t1i是第i个样本点的第1主成分; t2i是第i个样本点的第2主成分;是主成分t1的方差;/>是主成分t2的方差;n是样本点个数;c为T2统计量;
公式(4)符合椭圆方程构造,在平面图上表示的是一个椭圆,样本点落在椭圆内为正常样本,落在椭圆外为离群样本。
优选地,S4所述预处理包括如下步骤:
S41:分别对S3得到的训练集和测试集中源机以及从机的近红外光谱增加波长点,其吸光度与波长点保持一致;
S42:通过Savitzky-Golay平滑滤波器分别对增加了波长点后的源机的近红外光谱和从机的近红外光谱求其一阶导数;
S43:对训练集和测试集中源机的近红外光谱、从机近红外光谱一阶导数、训练集和测试集中从机的近红外光谱和从机近红外光谱一阶导数进行标准差标准化(Z-ScoreStandardScaler),其计算公式如下所示:
(5)
其中,xij为实际变量值;xi为各变量的平均值;si为各变量的标准差;Zij为标准化后的变量值。
优选地,S5中设计基于卷积自编码器的孪生编码器的步骤如下:
S51:构建卷积池化块(ConvPooling Block),其结构为一维卷积(Conv1D)-LeakyReLU激活函数(LeakyReLU)-一维平均池化(AveragePooling1D);
S52:构建转置卷积块(ConvTranspose Block),其结构为一维转置卷积层(Conv1DTranspose)-LeakyReLU激活函数(LeakyReLU);
S53:构建编码器(Encoder),其结构为输入层(InputLayer)-高斯噪音(GaussianNoise)-卷积池化层块一(ConvPooling Block1)-卷积池化层块二(ConvPoolingBlock2)-卷积池化层块三(ConvPooling Block3)-卷积池化层块四(ConvPoolingBlock4);
S54:构建解码器(Decoder),其结构为输入层(InputLayer)-转置卷积块一(ConvTranspose Block1)-转置卷积块二(ConvTranspose Block2)-转置卷积块三(ConvTranspose Block3)-转置卷积块四(ConvTranspose Block4);
S55:构建孪生编码器(Siamese Coder),其结构为左输入层(Input Layer left)-左编码(Encoder left)-左特征映射(feature map left)-左特征映射(feature mapleft) + 右特征映射(feature map right)-左解码(Decoder left)和右输入层(InputLayer right)-右编码(Encoder right)-右特征映射(feature map right)-左特征映射(feature map left) + 右特征映射(feature map right)-右解码(Decoder right);其中,孪生编码器的输入层、编码、特征映射和解码均分为左右两支,其中一支的输入输出为近红外光谱,另一支的输入输出则为对应近红外光谱的一阶导数;另外,两支解码器共享了编码器部分输出的“特征图”。
优选地,S6包括如下步骤:
S61:获取训练好的孪生编码器A中的左输入层(Input Layer left)-左编码(Encoder left)和右输入层(Input Layer right)-右编码(Encoder right)部分,记作Upper Part,并冻结其参数;
S62:获取训练好的孪生编码器B中的左解码(Decoder left)和右解码(Decoderright)部分,记作Lower Part,并冻结其参数;
S63:在Upper Part和Lower Part之间加入由一维卷积层和LeakyReLU层构成的特征转换模块,并将所述Upper Part、特征转换模块、Lower Part和输出层(Output)依次进行拼接,最终得到了“可实现源机近红外光谱转换为从机近红外光谱”的光谱转移模型;所述一维卷积层权重可变。
优选地,S5中训练孪生编码器A和孪生编码器B时会给编译模型设置参数;S7中训练转移模型C时会给编译模型设置参数;其中,训练孪生编码器A时,编译模型参数设置为:损失函数loss设为均方误差mse,优化器optimizer设为Adam,学习率learning_rate设为3e-3,最大迭代轮次epochs设为2000,每步的批次大小batch_size设为32,验证集数据大小validation_split设置为0.10,即以10%的数据用作验证;回调函数部分,使用早停止(Early Stopping),其中触发终止的阈值patience设为100,增大或减小的阈值min_delta设为1e-5,加载训练过程中保存最优模型权重,将恢复最佳权重restore_best_weights设为True,学习率调度ReduceLROnPlateau中的最大等待轮次数patience设为30,学习率缩放因子factor设为0.75;训练孪生编码器B时,编译模型参数设置为:损失函数设为均方误差,优化器设为Adam,学习率设为3e-3,最大迭代轮次设为2000,每步的批次大小设为32,验证集数据大小设置为0.10,即以10%的数据用作验证;回调函数部分,使用早停止,其中触发终止的阈值设为100,增大或减小的阈值设为1e-5,加载训练过程中保存最优模型权重,将恢复最佳权重设为True,学习率调度中的最大等待轮次数设为30,学习率缩放因子设为0.75;训练转移模型C时,编译模型参数设置为:损失函数分别设为["mse", "mse"],损失权重设为[0.01, 0.99],优化器设为Nadam,学习率设为1e-3,最大迭代轮次设为2000,每步的批次大小设为16,验证集数据大小设置为0.10,即以10%的数据用作验证;回调函数部分,使用早停止,其中触发终止的阈值为50,增大或减小的阈值设为1e-5,加载训练过程中保存最优模型权重,将恢复最佳权重设为True,学习率调度中的最大等待轮次数设为20,学习率缩放因子设为0.75;所述早停止为一种可对抗过拟合的正则化方法。
S8包括如下步骤:
S81:使用转移模型C在测试集的从机近红外光谱及其一阶导数上进行预测,对于所得预测源机近红外光谱一阶导数进行标准化逆变换,所述标准化逆变换的公式如下:
(6)
其中,xij为实际变量值;xi为各变量的平均值;si为各变量的标准差;Zij为标准化后的变量值;
S82:使用Savitzky-Golay平滑滤波器对其进行平滑处理,去除添加的波长点,将光谱一阶导数还原,进而求出经平滑处理后预测源机光谱一阶导数的原函数,即为从机转后近红外光谱;
S83:模型评估:对比“源机近红外光谱与从机近红外光谱的平均绝对误差MAE”和“源机近红外光谱与转后从机近红外光谱的平均绝对误差MAE”,观察前者是否显著大于后者。
优选地,所述“源机近红外光谱与从机近红外光谱的平均绝对误差MAE”的计算方法如下:
S831:对测试集中每条源机近红外光谱及其对应的从机近红外光谱,计算两条光谱之间的平均绝对误差,记为MAE;
S832:利用S831中的方法,计算所有源机近红外光谱及其对应的从机近红外光谱间的MAE,再将这些MAE求平均,即得“源机近红外光谱与从机近红外光谱的平均绝对误差MAE”。
有益效果:
本发明提供一种基于孪生卷积自编码器构建的光谱模型转移方法,首先获取源机与从机的近红外光谱,然后对源机与从机的近红外光谱进行划分、清洗和预处理;设计基于卷积自编码器的孪生编码器,分别对训练集中源机近红外光谱和从机近红外光谱进行训练得到两个结构完全相同的“孪生编码器”,然后基于这两个结构完全相同的“孪生编码器”进行孪生卷积自编码器构建的网络结构设计,以能够充分提取红外光谱数特征、加强光谱之间的紧密关联、实现高维度光谱的降维,从而实现不同仪器间近红外模型共享,最终得到了“可实现源机近红外光谱转换为从机近红外光谱”的光谱转移模型,解决现有由于环境不同、仪器零部件的差异等原因,而导致的不同仪器间近红外模型无法共享的问题。
本发明方法中只需将源机近红外光谱及其一阶导数输入光谱转移模型,获取模型输出的转后近红外光谱一阶导数,对其进行平滑处理后,再求出其原函数,即可实现源机近红外光谱到从机近红外光谱的转换。将整个过程编写为自动化脚本后,在应用时只需提供数据、训练模型、预测光谱即可。整个过程十分简便且转移模型的训练和推理速度快,能够极大程度地节约源机光谱数据标注和重新构建模型的时间成本。
本发明虽然涉及卷积神经网络,但由于网络结构和各卷积池化层参数的合理设置,经实测发现,即便在小样本数据集上转移模型也没有发生过拟合,其预测精度依然较高,相比于其它基于深度学习的模型转移方法,在算力需求和模型性能上有着明显的优势。
本发明实施例中仅使用少量的源机光谱数据对光谱转移模型进行训练,即可实现源机光谱向从机光谱的转移,显著地节省了重新构建烟碱预测模型的时间并且保证了较高的预测精度。
本发明提供的方法能够有效地校准不同的近红外光谱检测仪器,显著提升校准效率,进而降低生产成本,提高复烤厂或烟叶公司的生产效率和质量。
附图说明
图1为本发明方案的流程图。
图2为烟叶样本源机光谱图(左)、从机光谱图(右)。
图3为源机光谱的误差椭圆(左)、从机光谱的误差椭圆(右)。
图4为卷积池化块(左)、转置卷积块(右)。
图5为带高斯噪声的编码器(左)、解码器(右)。
图6为孪生编码器。
图7为卷积孪生编码器结构。
图8为不同数量的标准光谱下,转前/后从机光谱与源机光谱的MAE。
图9为不同数量的标准光谱下,转前/后从机光谱一阶导数与源机光谱一阶导数的MAE。
具体实施方式
下面结合附图对本发明的具体内容做进一步详细描述,但并不因此限制本发明的保护范围。
一种基于孪生卷积自编码器构建的光谱模型转移方法,如图1所示,包括如下步骤:
S1:获取源机与从机的近红外光谱;每条源机的近红外光谱和从机的近红外光谱均从相同的烟叶样本分别用源机与从机扫描得到,共采集5640片烟叶,其中包含云南不同产地(保山、玉溪、红河、宣威4个产地),不同部位(上、中、下3个部位)的烟叶,分别用源机与从机扫描,得到的源机烟叶的近红外光谱如图2(左)所示,从机烟叶近红外光谱如图2(右)所示。
S2:将S1获取的近红外光谱进行数据集随机划分,划分为训练集和测试集,训练集和测试集均有源机和从机近红外光谱;训练集与测试集的比例设定为85% : 15%。经过划分后,训练集和测试集的数据量分别为4794和846。
S3:使用误差椭圆法分别剔除训练集和测试集中源机以及从机的近红外光谱中的异常数据;根据误差椭圆法,剔除训练集和测试集中源机以及从机的近红外光谱中的离群值,源机光谱中离群异常样本与正常样本如图3(左)所示,从机光谱中离群异常样本与正常样本如图3(右)所示。剔除训练集和测试集中源机以及从机的近红外光谱中的离群值后,训练集和测试集的数据量分别为4685和826。
所述误差椭圆法包括如下步骤:
S31:使用主成分分析方法,分别将训练集和测试集中的源机以及从机的近红外光谱进行降维,只保留两个主成分,并分别计算降维后训练集和测试集中,源机的近红外光谱以及训练集和测试集中从机的近红外光谱的均值和两个主成分的标准差,并据此分别确定训练集和测试集中源机的近红外光谱的误差椭圆以及训练集和测试集中从机的近红外光谱对应的误差椭圆;
S32:分别对降维后训练集和测试集中源机近红外光谱以及从机的近红外光谱,计算其T2统计量,由此判断出训练集和测试集中的离群点,并将其从训练集和测试集中剔除;所述T2统计量用于发现样本点中的离群点,具体原理为:
定义第i个样本点对第h主成分th的贡献率为,公式如下:
(1)
其中,是第i个样本点的第h主成分;/>是主成分th的方差;n是样本点个数;
通过公式(1)可计算样本点i对主成分的累计贡献率,公式如下:
(2)
其中,是第i个样本点的第h主成分;/>是主成分th的方差;n是样本点个数;
根据特雷西(Tracy)等人的研究,累计贡献率服从以下分布:
其中,n是样本点个数;m为主成分数;为累计贡献率;F(m,n-m)为检验水平α =1,分子自由度为m,分母自由度为 n-m 的F分布的单侧右分位点,通过查询F分布的F界值表得到;当:
(3)
时,认为在95%的检验水平上,样本点i对主成分的贡献过大,该样本点i为离群点;其中,n是样本点个数;m为主成分数;/>为累计贡献率;F 0.05 (m,n-m)为检验水平α = 0.05,分子自由度为m,分母自由度为 n-m 的F分布的单侧右分位点,通过查询F分布的F界值表得到;
特别的,当m = 2时,也即主成分数m为2时,将m = 2带入公式(3)可得到如下公式:
上式中,为T2统计量,记作c,因此可得到如下公式:
(4)
其中, t1i是第i个样本点的第1主成分; t2i是第i个样本点的第2主成分;是主成分t1的方差;/>是主成分t2的方差;n是样本点个数;c为T2统计量;
由公式(4)可得到如下计算公式:
(4-1)
其中,公式(4-1)是一个椭圆的计算公式,因此,公式(4)也是一个椭圆的计算公式,符合椭圆方程构造,如图3所示,在光谱样本的第一主成分和第二主成分平面图上,可以画出一个椭圆,样本点落在椭圆内为正常样本,落在椭圆外为离群样本。
S4:分别对S3得到的训练集和测试集中源机以及从机的近红外光谱数据进行预处理;具体包括如下步骤:
S41:分别对S3得到的训练集和测试集中源机以及从机的近红外光谱增加波长点,其吸光度与波长点保持一致;具体地,分别对S3得到的源机和从机的近红外光谱增加9个(虚假的)波长点,其吸光度与波长点1650一致,该操作保证数据集的形状为(m, 360);
S42:通过Savitzky-Golay平滑滤波器(三次多项式、一阶导)分别对增加了波长点后的训练集和测试集中源机以及从机的近红外光谱求其一阶导数,得到源机近红外光谱一阶导数和从机近红外光谱一阶导数;所述训练集和测试集中源机近红外光谱包含测试集中源机的近红外光谱和训练集中源机的近红外光谱;所述训练集和测试集中从机的近红外光谱包含测试集中从机的近红外光谱和训练集中从机的近红外光谱;
S43:对训练集和测试集中源机近红外光谱、训练集和测试集中从机的近红外光谱、从机近红外光谱一阶导数和源机近红外光谱一阶导数进行标准差标准化,其计算公式如下所示:
(5)
其中,xij为实际变量值;xi为各变量的平均值;si为各变量的标准差;Zij为标准化后的变量值。
S5:设计基于卷积自编码器的孪生编码器A和B;采用S4得到的训练集中的从机近红外光谱训练孪生编码器A;采用S4得到的训练集中源机的近红外光谱训练孪生编码器B;设计基于卷积自编码器的孪生编码器的具体步骤如下:
S51:构建卷积池化块,其结构为一维卷积-LeakyReLU激活函数-一维平均池化,如图4(左)所示;
S52:构建转置卷积块,其结构为一维转置卷积层-LeakyReLU激活函数,如图4(右)所示;
S53:构建编码器,其结构为输入层-高斯噪音-卷积池化层块一-卷积池化层块二-卷积池化层块三-卷积池化层块四,如图5(左)所示;
S54:构建解码器,其结构为输入层-转置卷积块一-转置卷积块二-转置卷积块三-转置卷积块四,如图5(右)所示;
S55:构建孪生编码器,其结构为左输入层-左编码-左特征映射-左特征映射 + 右特征映射-左解码和右输入层-右编码-右特征映射-左特征映射 + 右特征映射-右解码,如图6所示;其中,孪生编码器的输入层、编码、特征映射和解码均分为左右两支,其中一支的输入输出为近红外光谱,另一支的输入输出则为对应近红外光谱的一阶导数;另外,两支解码器共享了编码器部分输出的“特征图”。
用训练集中从机的近红外光谱训练孪生编码器A时,编译模型参数设置为:损失函数设为均方误差,优化器设为Adam,学习率设为3e-3,最大迭代轮次设为2000,每步的批次大小设为32,验证集数据大小设置为 0.10,也即以10%的数据用作验证;回调函数部分,使用早停止;所述早停止为一种可对抗过拟合的正则化方法,其中触发终止的阈值设为100,增大或减小的阈值设为1e-5,加载训练过程中保存最优模型权重,因此将恢复最佳权重设为True,学习率调度中的最大等待轮次数设为30,学习率缩放因子设为0.75。该孪生编码器在第870个轮次时停止训练。
用训练集中源机的近红外光谱训练孪生编码器B时,编译模型参数设置为:损失函数设为均方误差,优化器设为Adam,学习率设为3e-3,最大迭代轮次设为2000,每步的批次大小设为32,验证集数据大小设置为 0.10,也即以10%的数据用作验证;回调函数部分,使用早停止,其中触发终止的阈值patience设为100,增大或减小的阈值设为1e-5,加载训练过程中保存最优模型权重,因此将恢复最佳权重设为True,学习率调度中的最大等待轮次数设为30,学习率缩放因子设为0.75。该孪生编码器在第387个轮次时停止训练。
设计基于S5所述孪生编码器A和孪生编码器B的转移模型C,其网络结构如图7所示;具体包括如下步骤:
S61:获取训练好的孪生编码器A中的左输入层-左编码和右输入层-右编码部分,记作Upper Part,并冻结其参数;
S62:获取训练好的孪生编码器B中的左解码和右解码部分,记作Lower Part,并冻结其参数;
S63:在Upper Part和Lower Part之间加入由一维卷积层和LeakyReLU层构成的特征转换模块(Conv1D-LeakyReLU-Conv1D-LeakyReLU),并将所述Upper Part、特征转换模块、Lower Part和输出层依次进行拼接,最终得到了“可实现源机近红外光谱转换为从机近红外光谱”的光谱转移模型;所述一维卷积层权重可变;在本发明的具体实施例中,左侧部分和右侧部分分别依次进行拼接,拼接结果如下:左输入层-左编码-一维卷积-LeakyReLU激活函数-一维卷积-LeakyReLU激活函数-左解码-左输出层和右输入层-右编码-一维卷积-LeakyReLU激活函数-一维卷积-LeakyReLU激活函数-右解码-右输出层。
S7:使用S4得到的训练集中的源机和从机的近红外光谱训练S6的转移模型C;使用训练集中的源机与从机近红外光谱训练转移模型C时,编译模型参数设置为:损失函数分别设为["mse", "mse"],损失权重设为[0.01, 0.99],优化器设为Nadam,学习率设为1e-3,最大迭代轮次设为2000,每步的批次大小设为16,验证集数据大小设置为0.10,即以10%的数据用作验证;回调函数部分,使用早停止,其中触发终止的阈值设为50,增大或减小的阈值设为1e-5,加载训练过程中保存最优模型权重,因此将恢复最佳权重设为True,学习率调度中的最大等待轮次数设为20,学习率缩放因子设为0.75。
S8:采用S4得到的测试集中的源机和从机的近红外光谱评估转移模型C,检验光谱转移效果;具体包括如下步骤:
S81:使用转移模型C在测试集的从机近红外光谱及其一阶导数上进行预测,对于所得预测源机近红外光谱一阶导数进行标准化逆变换,所述标准化逆变换的公式如下:
(6)
其中,xij为实际变量值;xi为各变量的平均值;si为各变量的标准差;Zij为标准化后的变量值;
S82:使用Savitzky-Golay平滑滤波器对其进行平滑处理,去除添加的波长点,将光谱一阶导数还原,进而求出经平滑处理后预测源机光谱一阶导数的原函数,此即为从机转后光谱;
S83:模型评估:对比“源机近红外光谱与从机近红外光谱的平均绝对误差MAE”和“源机近红外光谱与转后从机近红外光谱的平均绝对误差MAE”,观察前者是否显著大于后者。
所述“源机近红外光谱与从机近红外光谱的平均绝对误差MAE”的计算方法如下:
S831:对测试集中每条源机近红外光谱及其对应的从机近红外光谱,计算两条光谱之间的平均绝对误差,记为MAE;
S832:利用S831中的方法,计算所有源机近红外光谱及其对应的从机近红外光谱间的MAE,再将这些MAE求平均,即得“源机近红外光谱与从机近红外光谱的平均绝对误差MAE”。
举例说明:假设源机的一条光谱为:0.51、0.61、0.65、0.71、0.82,对应从机的一条光谱为:0.58、0.68、0.69、0.78、0.88;那么:
MAE1 = ( |0.51-0.58| + |0.61-0.68| + |0.65-0.69| + |0.71-0.78| + |0.82-0.88| )/5
假设源机的另一条光谱为:0.41、0.51、0.65、0.75、0.82,对应从机的一条光谱为:0.48、0.58、0.69、0.78、0.86;那么:
MAE2 = ( |0.41-0.48| + |0.51-0.58| + |0.65-0.69| + |0.75-0.78| + |0.82-0.86| )/5
依次类推,得到MAE3,MAE4......MAEn;
那么,源机近红外光谱与从机近红外光谱的平均绝对误差为:
MAE = (MAE1+MAE2+MAE3+...MAEn)/n
同理,可计算源机近红外光谱与转后从机近红外光谱的平均绝对误差MAE。
在测试集上,分别比较源机的近红外光谱和从机的近红外光谱、源机近红外光谱和转后从机近红外光谱的平均绝对误差MAE,结果如下表1所示:
在测试集上,分别比较源机近红外光谱一阶导数和从机近红外光谱一阶导数、源机近红外光谱一阶导数和转后从机近红外光谱一阶导数的平均绝对误差MAE,结果如下表2所示:
从上表1、2可以发现,经过转移模型C转移后的从机近红外光谱无论是光谱本身还是其一阶导数,都更为接近源机近红外光谱。
小样本上转移模型的效果:由于需要使用模型转移的场景通常是因为标准光谱(即源机和从机扫描相同烟叶产生的成对的近红外光谱)数量较少,因此有必要测试该方法在标准光谱数量较少时的表现,因此测试该方法分别在42个训练样本,8个测试样本、85个训练样本,15个测试样本、127个训练样本,23个测试样本、170个训练样本,30个测试样本、212个训练样本,38个测试样本,4种小样本情况下的结果MAE,最终结果如图8所示。
如图8、9所示,在4种小样本情况下,经转移模型转后的从机近红外光谱,无论是光谱本身还是其一阶导数,均比源机近红外光谱的MAE更小,说明该转移模型效果较好。

Claims (7)

1.一种基于孪生卷积自编码器构建的光谱模型转移方法,其特征在于,包括如下步骤:
S1:获取源机与从机的近红外光谱;
S2:将S1获取的近红外光谱进行数据集随机划分,划分为训练集和测试集,训练集和测试集均有源机和从机近红外光谱;
S3:使用误差椭圆法分别剔除训练集和测试集中的源机和从机近红外光谱中的异常数据;
S4:分别对S3得到的训练集和测试集中源机以及从机的近红外光谱进行预处理;
S5:设计基于卷积自编码器的孪生编码器A和B;采用S4得到的训练集中从机的近红外光谱训练孪生编码器A;采用S4得到的训练集中源机的近红外光谱训练孪生编码器B;设计基于卷积自编码器的孪生编码器的步骤如下:
S51:构建卷积池化块,其结构为一维卷积-LeakyReLU激活函数-一维平均池化;
S52:构建转置卷积块,其结构为一维转置卷积层-LeakyReLU激活函数;
S53:构建编码器,其结构为输入层-高斯噪音-卷积池化层块一-卷积池化层块二-卷积池化层块三-卷积池化层块四;
S54:构建解码器,其结构为输入层-转置卷积块一-转置卷积块二-转置卷积块三-转置卷积块四;
S55:构建孪生编码器,其结构为左输入层-左编码-左特征映射-(左特征映射 + 右特征映射)-左解码和右输入层-右编码-右特征映射-(左特征映射 + 右特征映射)-右解码;其中,孪生编码器的输入层、编码、特征映射和解码均分为左右两支,其中一支的输入输出为近红外光谱,另一支的输入输出则为对应近红外光谱的一阶导数;另外,两支解码器共享了编码器部分输出的“特征图”;
S6:设计基于S5所述孪生编码器A和孪生编码器B的转移模型C;包括如下步骤:
S61:获取训练好的孪生编码器A中的左输入层-左编码和右输入层-右编码部分,记作Upper Part,并冻结其参数;
S62:获取训练好的孪生编码器B中的左解码和右解码部分,记作Lower Part,并冻结其参数;
S63:在Upper Part和Lower Part之间加入由一维卷积层和LeakyReLU层构成的特征转换模块,并将所述Upper Part、特征转换模块、Lower Part和输出层依次进行拼接,最终得到了“可实现源机近红外光谱转换为从机近红外光谱”的光谱转移模型;所述一维卷积层权重可变;
S7:使用S4得到的训练集中源机和从机的近红外光谱训练S6的转移模型C;
S8:采用S4得到的测试集中源机和从机的近红外光谱评估转移模型C,检验光谱转移效果。
2.根据权利要求1所述的基于孪生卷积自编码器构建的光谱模型转移方法,其特征在于,S1中获取源机与从机的近红外光谱时,每条源机的近红外光谱和从机的近红外光谱均从相同的烟叶样本分别用源机与从机扫描得到。
3.根据权利要求1所述的基于孪生卷积自编码器构建的光谱模型转移方法,其特征在于,S3中所述误差椭圆法包括如下步骤:
S31:使用主成分分析方法,分别将训练集和测试集中的源机以及从机的近红外光谱进行降维,只保留两个主成分,并分别计算降维后训练集和测试集中源机的近红外光谱以及训练集和测试集中从机的近红外光谱的均值和两个主成分的标准差,并据此分别确定训练集和测试集中源机的近红外光谱的误差椭圆以及训练集和测试集中从机的近红外光谱对应的误差椭圆;
S32:分别对S31降维后训练集和测试集中源机近红外光谱以及从机的近红外光谱计算其T2统计量,由此判断出训练集和测试集中的离群点,并将其从训练集和测试集中剔除;所述T2统计量用于发现样本点中的离群点。
4.根据权利要求3所述的基于孪生卷积自编码器构建的光谱模型转移方法,其特征在于,S32中T2统计量发现样本点中的离群点的具体原理为:
定义第i个样本点对第h主成分th的贡献率为 ,公式如下:
(1)
其中,是第i个样本点的第h主成分,/>是主成分th的方差,n是样本点个数;
通过公式(1)可计算样本点i对主成分的累计贡献率,公式如下:
(2)
其中,是第i个样本点的第h主成分,/>是主成分th的方差,n是样本点个数;
当:
(3)
时,认为在95%的检验水平上,样本点i对主成分的贡献过大,此时所述样本点i是离群点;其中,n是样本点个数;m为主成分数;/>为累计贡献率;F0.05(m,n-m) 为检验水平α = 0.05,分子自由度为m,分母自由度为 n-m 的F分布的单侧右分位点,通过查询F分布的F界值表得到;
当m为2时,即主成分数为2时,将m = 2带入公式(3)可得到如下公式:
(4)
其中,t1i 是第i个样本点的第1主成分;t2i 是第i个样本点的第2主成分; 是主成分t1的方差;/> 是主成分t2的方差;n是样本点个数;c为T2统计量;
公式(4)符合椭圆方程构造,在光谱样本的第一主成分和第二主成分平面图上表示的是一个椭圆,样本点落在椭圆内为正常样本,落在椭圆外为离群样本。
5.根据权利要求1所述的基于孪生卷积自编码器构建的光谱模型转移方法,其特征在于,S4所述预处理包括如下步骤:
S41:分别对S3得到的训练集和测试集中源机以及从机的近红外光谱增加波长点,其吸光度与波长点保持一致;
S42:通过Savitzky-Golay平滑滤波器分别对增加了波长点后的源机的近红外光谱和从机的近红外光谱求其一阶导数;
S43:对训练集和测试集中源机的近红外光谱和源机近红外光谱一阶导数,以及训练集和测试集中从机的近红外光谱和从机近红外光谱一阶导数进行标准差标准化,其计算公式如下所示:
(5)
其中,xij为实际变量值;xi为各变量的平均值;si为各变量的标准差;Zij为标准化后的变量值。
6.根据权利要求5所述的基于孪生卷积自编码器构建的光谱模型转移方法,其特征在于,S8具体包括如下步骤:
S81:使用转移模型C在测试集的从机近红外光谱及其一阶导数上进行预测,对于所得预测源机近红外光谱一阶导数进行标准化逆变换,所述标准化逆变换的公式如下:
(6)
其中,xij为实际变量值;xi为各变量的平均值;si为各变量的标准差;Zij为标准化后的变量值;
S82:使用Savitzky-Golay平滑滤波器对其进行平滑处理,去除添加的波长点,将光谱一阶导数还原,进而求出经平滑处理后预测源机光谱一阶导数的原函数,即为从机转后近红外光谱;
S83:模型评估:对比“源机近红外光谱与从机近红外光谱的平均绝对误差MAE”和“源机近红外光谱与通过转移模型C将源机近红外光谱转化得到的从机近红外光谱的平均绝对误差MAE”,观察前者是否显著大于后者。
7.根据权利要求6所述的基于孪生卷积自编码器构建的光谱模型转移方法,其特征在于,所述“源机近红外光谱与从机近红外光谱的平均绝对误差MAE”的计算方法如下:
S831:对测试集中每条源机近红外光谱及其对应的从机近红外光谱,计算两条光谱之间的平均绝对误差,记为MAE;
S832:利用S831中的方法,计算所有源机近红外光谱及其对应的从机近红外光谱间的MAE,再将这些MAE求平均,即得“源机近红外光谱与从机近红外光谱的平均绝对误差MAE”。
CN202311524302.4A 2023-11-16 2023-11-16 一种基于孪生卷积自编码器构建的光谱模型转移方法 Active CN117273070B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311524302.4A CN117273070B (zh) 2023-11-16 2023-11-16 一种基于孪生卷积自编码器构建的光谱模型转移方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311524302.4A CN117273070B (zh) 2023-11-16 2023-11-16 一种基于孪生卷积自编码器构建的光谱模型转移方法

Publications (2)

Publication Number Publication Date
CN117273070A CN117273070A (zh) 2023-12-22
CN117273070B true CN117273070B (zh) 2024-02-02

Family

ID=89214579

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311524302.4A Active CN117273070B (zh) 2023-11-16 2023-11-16 一种基于孪生卷积自编码器构建的光谱模型转移方法

Country Status (1)

Country Link
CN (1) CN117273070B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113959974A (zh) * 2021-09-27 2022-01-21 桂林电子科技大学 一种普适性近红外光谱模型的传递方法
CN114818985A (zh) * 2022-05-31 2022-07-29 安徽农业大学 基于中心锚点三元组优化伪孪生网络的茶叶品质评价方法
CN114821354A (zh) * 2022-04-19 2022-07-29 福州大学 一种基于孪生多任务网络的城市建筑物变化遥感检测方法
CN115931738A (zh) * 2023-01-09 2023-04-07 云南烟叶复烤有限责任公司 一种对成品片烟质量稳定性进行评价的方法及评价系统
EP4162864A1 (en) * 2021-10-07 2023-04-12 Olive Healthcare Inc. Methods for analyzing body composition
CN116595208A (zh) * 2023-07-17 2023-08-15 云南大学 高光谱图像的分类方法、装置及电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113959974A (zh) * 2021-09-27 2022-01-21 桂林电子科技大学 一种普适性近红外光谱模型的传递方法
EP4162864A1 (en) * 2021-10-07 2023-04-12 Olive Healthcare Inc. Methods for analyzing body composition
CN114821354A (zh) * 2022-04-19 2022-07-29 福州大学 一种基于孪生多任务网络的城市建筑物变化遥感检测方法
CN114818985A (zh) * 2022-05-31 2022-07-29 安徽农业大学 基于中心锚点三元组优化伪孪生网络的茶叶品质评价方法
CN115931738A (zh) * 2023-01-09 2023-04-07 云南烟叶复烤有限责任公司 一种对成品片烟质量稳定性进行评价的方法及评价系统
CN116595208A (zh) * 2023-07-17 2023-08-15 云南大学 高光谱图像的分类方法、装置及电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
transferable network with Siamese architecture for anomaly detection in hyperspectral image;Weiqiang Rao ET AL;《International Journal of Applied Earth Observations and Geoinformation》;第106卷;1-13 *
基于深度学习的药品近红外光谱数据多分类方法研究;郑安兵;《中国博士学位论文全文数据库》(第06期);B014-75 *

Also Published As

Publication number Publication date
CN117273070A (zh) 2023-12-22

Similar Documents

Publication Publication Date Title
CN111401553B (zh) 一种基于神经网络的缺失数据填充方法及系统
CN112364567B (zh) 一种基于退化轨迹相似度一致检验的剩余寿命预测方法
CN111563436B (zh) 一种基于ct-cdd的红外光谱测量仪器标定迁移方法
CN108801950B (zh) 基于滑动窗多尺度主元分析的紫外光谱水质异常检测方法
CN108958226B (zh) 基于生存信息势—主成分分析算法的te过程故障检测方法
CN116400161B (zh) 激光器的设备校准方法、装置、设备及存储介质
CN116089777B (zh) 一种基于信息智能匹配的新能源智能结算方法及系统
CN111398523B (zh) 基于分布的传感器数据校准方法及系统
CN114757269A (zh) 一种基于局部子空间-邻域保持嵌入的复杂过程精细化故障检测方法
CN117273070B (zh) 一种基于孪生卷积自编码器构建的光谱模型转移方法
CN112747921A (zh) 一种基于na-memd的多传感器机械故障诊断的方法
CN110823089A (zh) 用于测量半导体器件的光学关键尺寸的方法和设备
CN114216877B (zh) 茶叶近红外光谱分析中谱峰自动检测与重构方法及系统
CN116644583A (zh) 一种基于vmd和弗雷歇距离相结合的油气管道泄漏信号预处理方法及系统
CN117131022B (zh) 一种电力信息系统的异构数据迁移方法
CN110543869A (zh) 滚珠丝杠寿命预测方法、装置、计算机设备及存储介质
CN112785088B (zh) 一种基于dcae-lstm短期日负荷曲线预测方法
CN116127398B (zh) 一种基于机理模型与多源数据融合的液压泵故障诊断方法
CN116702580A (zh) 一种基于注意力卷积自编码器的发酵过程故障监测方法
CN114386485A (zh) 一种建筑光纤光栅应力传感器的应力曲线聚类方法
CN112558467A (zh) 基于输出误差递推辨识火电机组协调控制模型的方法
CN113933263B (zh) 基于指标拟合的近红外光谱模型建立方法
CN111562226B (zh) 基于吸收光谱特征峰面积的海水总氮总磷分析方法及系统
CN116738759B (zh) 装备的设计运维方法、装置、计算机设备及可读存储介质
CN116956232B (zh) 一种基于邻域保持嵌入回归的质量相关故障检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant