CN117273070B

CN117273070B - 一种基于孪生卷积自编码器构建的光谱模型转移方法

Info

Publication number: CN117273070B
Application number: CN202311524302.4A
Authority: CN
Inventors: 吴箭; 杨泽会; 郝贤伟; 徐元飞; 李瑞东; 吕小芳; 毕一鸣; 张志成; 李卫星; 徐梦瑶; 张建; 王昕�; 吴灵通; 王宇敏; 招云芳; 付涛; 李正莹; 张恺; 夏春艳; 朱剑波
Original assignee: Yunnan Leaf Tobacco Redrying Co ltd
Current assignee: Yunnan Leaf Tobacco Redrying Co ltd
Priority date: 2023-11-16
Filing date: 2023-11-16
Publication date: 2024-02-02
Anticipated expiration: 2043-11-16
Also published as: CN117273070A

Abstract

本发明属于烟草近红外光谱模型转移技术领域，具体涉及一种基于孪生卷积自编码器构建的光谱模型转移方法，包括：S1：获取源机与从机的近红外光谱；S2：将获取的近红外光谱进行数据集随机划分，划分为训练集和测试集；S3：使用误差椭圆法分别剔除源机和从机近红外光谱中的异常数据；S4：分别对源机和从机的近红外光谱进行预处理；S5：设计基于卷积自编码器的孪生编码器A和B；S6：设计基于孪生编码器A和B的转移模型C；S7：训练集中源机和从机的近红外光谱训练转移模型C；S8：测试集中源机和从机的近红外光谱评估转移模型C。本发明解决现有由于环境不同、仪器零部件的差异等原因，而导致的不同仪器间近红外模型无法共享的问题。

Description

一种基于孪生卷积自编码器构建的光谱模型转移方法

技术领域

本发明属于烟草近红外光谱模型转移技术领域，具体涉及一种基于孪生卷积自编码器构建的光谱模型转移方法。

背景技术

近红外光谱技术作为一种成分分析方法，具有低成本、无损、无污染、快速高效等优点，被广泛应用于烟草行业。然而在实际应用中，即使同一个厂家同一个型号的两台近红外光谱仪器，由于环境不同、仪器零部件的差异等原因，会导致仪器间测量出的光谱存在差异。由于建立光谱模型需要投入大量的人力、物力，花费巨大，如果将已经建立的模型应用于其他仪器，那么不仅节约大量的人力、物力，而且对于实现模型的共享，提高模型的通用性、适用性具有重要的意义。

近年来，深度学习技术凭借其学习能力强、适应性好、上限高、可移植性好等优点，在多个领域下大放异彩。但将其应用于光谱模型转移上，却鲜有研究。对于光谱数据量大、变量多以及冗余表达等问题，利用深度学习的深层网络结构，能够充分提取光谱特征，有利于加强光谱之间的紧密关联，并且可以实现高维度光谱的降维。

然而，深度学习在训练时，往往需要大量数据及算力，尤其对数据量的要求较为严苛，使用小样本训练的模型很容易陷入对小样本的过拟合以及对目标任务的欠拟合。但基于小样本的模型训练在当前的烟草工业界有着广泛的需求。

发明内容

本发明解决现有由于环境不同、仪器零部件的差异等原因，而导致的不同仪器间近红外模型无法共享的问题，提供采用深度学习技术的一种基于孪生卷积自编码器构建的光谱模型转移方法，通过进行孪生卷积自编码器构建的网络结构设计，以能够充分提取红外光谱特征、加强光谱之间的紧密关联、实现高维度光谱的降维，从而实现不同仪器间近红外模型共享。进一步各卷积池化层参数设置合理，能确保在小样本数据集上转移模型也不会发生过拟合现象，预测精度较高。

本发明要求保护的技术方案如下：

一种基于孪生卷积自编码器构建的光谱模型转移方法，包括如下步骤：

S1：获取源机与从机的近红外光谱；

S2：将S1获取的近红外光谱进行数据集随机划分，划分为训练集和测试集，训练集和测试集均有源机和从机近红外光谱；

S3：使用误差椭圆法分别剔除训练集和测试集中的源机和从机近红外光谱中的异常数据；

S4：分别对S3得到的训练集和测试集中源机以及从机的近红外光谱进行预处理；

S5：设计基于卷积自编码器的孪生编码器A和B；采用S4得到的训练集中从机的近红外光谱训练孪生编码器A；采用S4得到的训练集中源机的近红外光谱训练孪生编码器B；

S6：设计基于S5所述孪生编码器A和孪生编码器B的转移模型C；

S7：使用S4得到的训练集中源机和从机的近红外光谱训练S6的转移模型C；

S8：采用S4得到的测试集中源机和从机的近红外光谱评估转移模型C，检验光谱转移效果。

S1中获取源机与从机的近红外光谱时，每条源机的近红外光谱和从机的近红外光谱均从相同的烟叶样本分别用源机与从机扫描得到。

S3中所述误差椭圆法包括如下步骤：

S31：使用主成分分析（PCA）方法，分别将训练集和测试集中的源机以及从机的近红外光谱进行降维，只保留两个主成分，并分别计算降维后训练集和测试集中，源机的近红外光谱以及训练集和测试集中从机的近红外光谱的均值和两个主成分的标准差，并据此分别确定训练集和测试集中源机的近红外光谱的误差椭圆以及训练集和测试集中从机的近红外光谱对应的误差椭圆；

S32：分别对降维后训练集和测试集中源机近红外光谱以及从机的近红外光谱，计算其T²统计量，由此判断出训练集和测试集中的离群点，并将其从训练集和测试集中剔除；所述T²统计量用于发现样本点中的离群点。

S32中T²统计量发现样本点中的离群点的具体原理为：

定义第i个样本点对第h主成分t_h的贡献率为，公式如下：

（1）

其中，是第i个样本点的第h主成分；/>是主成分t_h的方差；n是样本点个数；

通过公式（1）可计算样本点i对主成分的累计贡献率，公式如下：

（2）

其中，是第i个样本点的第h主成分；/>是主成分t_h的方差；n是样本点个数；当：

（3）

时，认为在95%的检验水平上，样本点i对主成分的贡献过大，此时该样本i是离群点；其中，n是样本点个数；m为主成分数；/>为累计贡献率；F _0.05(m,n-m)为检验水平α = 0.05，分子自由度为m，分母自由度为 n-m 的F分布的单侧右分位点，通过查询F分布的F界值表得到；

当m为2时，即主成分数为2时，将m = 2 带入公式（3）可得到如下公式：

（4）

其中， t_1i是第i个样本点的第1主成分； t_2i是第i个样本点的第2主成分；是主成分t₁的方差；/>是主成分t₂的方差；n是样本点个数；c为T²统计量；

公式（4）符合椭圆方程构造，在平面图上表示的是一个椭圆，样本点落在椭圆内为正常样本，落在椭圆外为离群样本。

优选地，S4所述预处理包括如下步骤：

S41：分别对S3得到的训练集和测试集中源机以及从机的近红外光谱增加波长点，其吸光度与波长点保持一致；

S42：通过Savitzky-Golay平滑滤波器分别对增加了波长点后的源机的近红外光谱和从机的近红外光谱求其一阶导数；

S43：对训练集和测试集中源机的近红外光谱、从机近红外光谱一阶导数、训练集和测试集中从机的近红外光谱和从机近红外光谱一阶导数进行标准差标准化(Z-ScoreStandardScaler)，其计算公式如下所示：

（5）

其中，x_ij为实际变量值；x_i为各变量的平均值；s_i为各变量的标准差；Z_ij为标准化后的变量值。

优选地，S5中设计基于卷积自编码器的孪生编码器的步骤如下：

S51：构建卷积池化块（ConvPooling Block），其结构为一维卷积（Conv1D）-LeakyReLU激活函数（LeakyReLU）-一维平均池化（AveragePooling1D）；

S52：构建转置卷积块（ConvTranspose Block），其结构为一维转置卷积层（Conv1DTranspose）-LeakyReLU激活函数（LeakyReLU）；

S53：构建编码器（Encoder），其结构为输入层（InputLayer）-高斯噪音（GaussianNoise）-卷积池化层块一（ConvPooling Block1）-卷积池化层块二（ConvPoolingBlock2）-卷积池化层块三（ConvPooling Block3）-卷积池化层块四（ConvPoolingBlock4）；

S54：构建解码器（Decoder），其结构为输入层（InputLayer）-转置卷积块一（ConvTranspose Block1）-转置卷积块二（ConvTranspose Block2）-转置卷积块三（ConvTranspose Block3）-转置卷积块四（ConvTranspose Block4）；

S55：构建孪生编码器（Siamese Coder），其结构为左输入层（Input Layer left）-左编码（Encoder left）-左特征映射（feature map left）-左特征映射（feature mapleft） + 右特征映射（feature map right）-左解码（Decoder left）和右输入层（InputLayer right）-右编码（Encoder right）-右特征映射（feature map right）-左特征映射（feature map left） + 右特征映射（feature map right）-右解码（Decoder right）；其中，孪生编码器的输入层、编码、特征映射和解码均分为左右两支，其中一支的输入输出为近红外光谱，另一支的输入输出则为对应近红外光谱的一阶导数；另外，两支解码器共享了编码器部分输出的“特征图”。

优选地，S6包括如下步骤：

S61：获取训练好的孪生编码器A中的左输入层（Input Layer left）-左编码（Encoder left）和右输入层（Input Layer right）-右编码（Encoder right）部分，记作Upper Part，并冻结其参数；

S62：获取训练好的孪生编码器B中的左解码（Decoder left）和右解码（Decoderright）部分，记作Lower Part，并冻结其参数；

S63：在Upper Part和Lower Part之间加入由一维卷积层和LeakyReLU层构成的特征转换模块，并将所述Upper Part、特征转换模块、Lower Part和输出层（Output）依次进行拼接，最终得到了“可实现源机近红外光谱转换为从机近红外光谱”的光谱转移模型；所述一维卷积层权重可变。

优选地，S5中训练孪生编码器A和孪生编码器B时会给编译模型设置参数；S7中训练转移模型C时会给编译模型设置参数；其中，训练孪生编码器A时，编译模型参数设置为：损失函数loss设为均方误差mse，优化器optimizer设为Adam，学习率learning_rate设为3e-3，最大迭代轮次epochs设为2000，每步的批次大小batch_size设为32，验证集数据大小validation_split设置为0.10，即以10%的数据用作验证；回调函数部分，使用早停止（Early Stopping），其中触发终止的阈值patience设为100，增大或减小的阈值min_delta设为1e-5，加载训练过程中保存最优模型权重，将恢复最佳权重restore_best_weights设为True，学习率调度ReduceLROnPlateau中的最大等待轮次数patience设为30，学习率缩放因子factor设为0.75；训练孪生编码器B时，编译模型参数设置为：损失函数设为均方误差，优化器设为Adam，学习率设为3e-3，最大迭代轮次设为2000，每步的批次大小设为32，验证集数据大小设置为0.10，即以10%的数据用作验证；回调函数部分，使用早停止，其中触发终止的阈值设为100，增大或减小的阈值设为1e-5，加载训练过程中保存最优模型权重，将恢复最佳权重设为True，学习率调度中的最大等待轮次数设为30，学习率缩放因子设为0.75；训练转移模型C时，编译模型参数设置为：损失函数分别设为["mse", "mse"]，损失权重设为[0.01, 0.99]，优化器设为Nadam，学习率设为1e-3，最大迭代轮次设为2000，每步的批次大小设为16，验证集数据大小设置为0.10，即以10%的数据用作验证；回调函数部分，使用早停止，其中触发终止的阈值为50，增大或减小的阈值设为1e-5，加载训练过程中保存最优模型权重，将恢复最佳权重设为True，学习率调度中的最大等待轮次数设为20，学习率缩放因子设为0.75；所述早停止为一种可对抗过拟合的正则化方法。

S8包括如下步骤：

S81：使用转移模型C在测试集的从机近红外光谱及其一阶导数上进行预测，对于所得预测源机近红外光谱一阶导数进行标准化逆变换，所述标准化逆变换的公式如下：

（6）

其中，x_ij为实际变量值；x_i为各变量的平均值；s_i为各变量的标准差；Z_ij为标准化后的变量值；

S82：使用Savitzky-Golay平滑滤波器对其进行平滑处理，去除添加的波长点，将光谱一阶导数还原，进而求出经平滑处理后预测源机光谱一阶导数的原函数，即为从机转后近红外光谱；

S83：模型评估：对比“源机近红外光谱与从机近红外光谱的平均绝对误差MAE”和“源机近红外光谱与转后从机近红外光谱的平均绝对误差MAE”，观察前者是否显著大于后者。

优选地，所述“源机近红外光谱与从机近红外光谱的平均绝对误差MAE”的计算方法如下：

S831：对测试集中每条源机近红外光谱及其对应的从机近红外光谱，计算两条光谱之间的平均绝对误差，记为MAE；

S832：利用S831中的方法，计算所有源机近红外光谱及其对应的从机近红外光谱间的MAE，再将这些MAE求平均，即得“源机近红外光谱与从机近红外光谱的平均绝对误差MAE”。

有益效果：

本发明提供一种基于孪生卷积自编码器构建的光谱模型转移方法，首先获取源机与从机的近红外光谱，然后对源机与从机的近红外光谱进行划分、清洗和预处理；设计基于卷积自编码器的孪生编码器，分别对训练集中源机近红外光谱和从机近红外光谱进行训练得到两个结构完全相同的“孪生编码器”，然后基于这两个结构完全相同的“孪生编码器”进行孪生卷积自编码器构建的网络结构设计，以能够充分提取红外光谱数特征、加强光谱之间的紧密关联、实现高维度光谱的降维，从而实现不同仪器间近红外模型共享，最终得到了“可实现源机近红外光谱转换为从机近红外光谱”的光谱转移模型，解决现有由于环境不同、仪器零部件的差异等原因，而导致的不同仪器间近红外模型无法共享的问题。

本发明方法中只需将源机近红外光谱及其一阶导数输入光谱转移模型，获取模型输出的转后近红外光谱一阶导数，对其进行平滑处理后，再求出其原函数，即可实现源机近红外光谱到从机近红外光谱的转换。将整个过程编写为自动化脚本后，在应用时只需提供数据、训练模型、预测光谱即可。整个过程十分简便且转移模型的训练和推理速度快，能够极大程度地节约源机光谱数据标注和重新构建模型的时间成本。

本发明虽然涉及卷积神经网络，但由于网络结构和各卷积池化层参数的合理设置，经实测发现，即便在小样本数据集上转移模型也没有发生过拟合，其预测精度依然较高，相比于其它基于深度学习的模型转移方法，在算力需求和模型性能上有着明显的优势。

本发明实施例中仅使用少量的源机光谱数据对光谱转移模型进行训练，即可实现源机光谱向从机光谱的转移，显著地节省了重新构建烟碱预测模型的时间并且保证了较高的预测精度。

本发明提供的方法能够有效地校准不同的近红外光谱检测仪器，显著提升校准效率，进而降低生产成本，提高复烤厂或烟叶公司的生产效率和质量。

附图说明

图1为本发明方案的流程图。

图2为烟叶样本源机光谱图（左）、从机光谱图（右）。

图3为源机光谱的误差椭圆（左）、从机光谱的误差椭圆（右）。

图4为卷积池化块（左）、转置卷积块（右）。

图5为带高斯噪声的编码器（左）、解码器（右）。

图6为孪生编码器。

图7为卷积孪生编码器结构。

图8为不同数量的标准光谱下，转前/后从机光谱与源机光谱的MAE。

图9为不同数量的标准光谱下，转前/后从机光谱一阶导数与源机光谱一阶导数的MAE。

具体实施方式

下面结合附图对本发明的具体内容做进一步详细描述，但并不因此限制本发明的保护范围。

一种基于孪生卷积自编码器构建的光谱模型转移方法，如图1所示，包括如下步骤：

S1：获取源机与从机的近红外光谱；每条源机的近红外光谱和从机的近红外光谱均从相同的烟叶样本分别用源机与从机扫描得到，共采集5640片烟叶，其中包含云南不同产地（保山、玉溪、红河、宣威4个产地），不同部位（上、中、下3个部位）的烟叶，分别用源机与从机扫描，得到的源机烟叶的近红外光谱如图2（左）所示，从机烟叶近红外光谱如图2（右）所示。

S2：将S1获取的近红外光谱进行数据集随机划分，划分为训练集和测试集，训练集和测试集均有源机和从机近红外光谱；训练集与测试集的比例设定为85% : 15%。经过划分后，训练集和测试集的数据量分别为4794和846。

S3：使用误差椭圆法分别剔除训练集和测试集中源机以及从机的近红外光谱中的异常数据；根据误差椭圆法，剔除训练集和测试集中源机以及从机的近红外光谱中的离群值，源机光谱中离群异常样本与正常样本如图3（左）所示，从机光谱中离群异常样本与正常样本如图3（右）所示。剔除训练集和测试集中源机以及从机的近红外光谱中的离群值后，训练集和测试集的数据量分别为4685和826。

所述误差椭圆法包括如下步骤：

S31：使用主成分分析方法，分别将训练集和测试集中的源机以及从机的近红外光谱进行降维，只保留两个主成分，并分别计算降维后训练集和测试集中，源机的近红外光谱以及训练集和测试集中从机的近红外光谱的均值和两个主成分的标准差，并据此分别确定训练集和测试集中源机的近红外光谱的误差椭圆以及训练集和测试集中从机的近红外光谱对应的误差椭圆；

S32：分别对降维后训练集和测试集中源机近红外光谱以及从机的近红外光谱，计算其T²统计量，由此判断出训练集和测试集中的离群点，并将其从训练集和测试集中剔除；所述T²统计量用于发现样本点中的离群点，具体原理为：

定义第i个样本点对第h主成分t_h的贡献率为，公式如下：

（1）

（2）

根据特雷西（Tracy）等人的研究，累计贡献率服从以下分布：

其中，n是样本点个数；m为主成分数；为累计贡献率；F(m,n-m)为检验水平α =1，分子自由度为m，分母自由度为 n-m 的F分布的单侧右分位点，通过查询F分布的F界值表得到；当：

（3）

时，认为在95%的检验水平上，样本点i对主成分的贡献过大，该样本点i为离群点；其中，n是样本点个数；m为主成分数；/>为累计贡献率；F _0.05(m,n-m)为检验水平α = 0.05，分子自由度为m，分母自由度为 n-m 的F分布的单侧右分位点，通过查询F分布的F界值表得到；

特别的，当m = 2时，也即主成分数m为2时，将m = 2带入公式（3）可得到如下公式：

上式中，为T²统计量，记作c，因此可得到如下公式：

（4）

由公式（4）可得到如下计算公式：

（4-1）

其中，公式（4-1）是一个椭圆的计算公式，因此，公式（4）也是一个椭圆的计算公式，符合椭圆方程构造，如图3所示，在光谱样本的第一主成分和第二主成分平面图上，可以画出一个椭圆，样本点落在椭圆内为正常样本，落在椭圆外为离群样本。

S4：分别对S3得到的训练集和测试集中源机以及从机的近红外光谱数据进行预处理；具体包括如下步骤：

S41：分别对S3得到的训练集和测试集中源机以及从机的近红外光谱增加波长点，其吸光度与波长点保持一致；具体地，分别对S3得到的源机和从机的近红外光谱增加9个（虚假的）波长点，其吸光度与波长点1650一致，该操作保证数据集的形状为（m, 360）；

S42：通过Savitzky-Golay平滑滤波器（三次多项式、一阶导）分别对增加了波长点后的训练集和测试集中源机以及从机的近红外光谱求其一阶导数，得到源机近红外光谱一阶导数和从机近红外光谱一阶导数；所述训练集和测试集中源机近红外光谱包含测试集中源机的近红外光谱和训练集中源机的近红外光谱；所述训练集和测试集中从机的近红外光谱包含测试集中从机的近红外光谱和训练集中从机的近红外光谱；

S43：对训练集和测试集中源机近红外光谱、训练集和测试集中从机的近红外光谱、从机近红外光谱一阶导数和源机近红外光谱一阶导数进行标准差标准化，其计算公式如下所示：

（5）

S5：设计基于卷积自编码器的孪生编码器A和B；采用S4得到的训练集中的从机近红外光谱训练孪生编码器A；采用S4得到的训练集中源机的近红外光谱训练孪生编码器B；设计基于卷积自编码器的孪生编码器的具体步骤如下：

S51：构建卷积池化块，其结构为一维卷积-LeakyReLU激活函数-一维平均池化，如图4（左）所示；

S52：构建转置卷积块，其结构为一维转置卷积层-LeakyReLU激活函数，如图4（右）所示；

S53：构建编码器，其结构为输入层-高斯噪音-卷积池化层块一-卷积池化层块二-卷积池化层块三-卷积池化层块四，如图5（左）所示；

S54：构建解码器，其结构为输入层-转置卷积块一-转置卷积块二-转置卷积块三-转置卷积块四，如图5（右）所示；

S55：构建孪生编码器，其结构为左输入层-左编码-左特征映射-左特征映射 + 右特征映射-左解码和右输入层-右编码-右特征映射-左特征映射 + 右特征映射-右解码，如图6所示；其中，孪生编码器的输入层、编码、特征映射和解码均分为左右两支，其中一支的输入输出为近红外光谱，另一支的输入输出则为对应近红外光谱的一阶导数；另外，两支解码器共享了编码器部分输出的“特征图”。

用训练集中从机的近红外光谱训练孪生编码器A时，编译模型参数设置为：损失函数设为均方误差，优化器设为Adam，学习率设为3e-3，最大迭代轮次设为2000，每步的批次大小设为32，验证集数据大小设置为 0.10，也即以10%的数据用作验证；回调函数部分，使用早停止；所述早停止为一种可对抗过拟合的正则化方法，其中触发终止的阈值设为100，增大或减小的阈值设为1e-5，加载训练过程中保存最优模型权重，因此将恢复最佳权重设为True，学习率调度中的最大等待轮次数设为30，学习率缩放因子设为0.75。该孪生编码器在第870个轮次时停止训练。

用训练集中源机的近红外光谱训练孪生编码器B时，编译模型参数设置为：损失函数设为均方误差，优化器设为Adam，学习率设为3e-3，最大迭代轮次设为2000，每步的批次大小设为32，验证集数据大小设置为 0.10，也即以10%的数据用作验证；回调函数部分，使用早停止，其中触发终止的阈值patience设为100，增大或减小的阈值设为1e-5，加载训练过程中保存最优模型权重，因此将恢复最佳权重设为True，学习率调度中的最大等待轮次数设为30，学习率缩放因子设为0.75。该孪生编码器在第387个轮次时停止训练。

设计基于S5所述孪生编码器A和孪生编码器B的转移模型C，其网络结构如图7所示；具体包括如下步骤：

S61：获取训练好的孪生编码器A中的左输入层-左编码和右输入层-右编码部分，记作Upper Part，并冻结其参数；

S62：获取训练好的孪生编码器B中的左解码和右解码部分，记作Lower Part，并冻结其参数；

S63：在Upper Part和Lower Part之间加入由一维卷积层和LeakyReLU层构成的特征转换模块（Conv1D-LeakyReLU-Conv1D-LeakyReLU），并将所述Upper Part、特征转换模块、Lower Part和输出层依次进行拼接，最终得到了“可实现源机近红外光谱转换为从机近红外光谱”的光谱转移模型；所述一维卷积层权重可变；在本发明的具体实施例中，左侧部分和右侧部分分别依次进行拼接，拼接结果如下：左输入层-左编码-一维卷积-LeakyReLU激活函数-一维卷积-LeakyReLU激活函数-左解码-左输出层和右输入层-右编码-一维卷积-LeakyReLU激活函数-一维卷积-LeakyReLU激活函数-右解码-右输出层。

S7：使用S4得到的训练集中的源机和从机的近红外光谱训练S6的转移模型C；使用训练集中的源机与从机近红外光谱训练转移模型C时，编译模型参数设置为：损失函数分别设为["mse", "mse"]，损失权重设为[0.01, 0.99]，优化器设为Nadam，学习率设为1e-3，最大迭代轮次设为2000，每步的批次大小设为16，验证集数据大小设置为0.10，即以10%的数据用作验证；回调函数部分，使用早停止，其中触发终止的阈值设为50，增大或减小的阈值设为1e-5，加载训练过程中保存最优模型权重，因此将恢复最佳权重设为True，学习率调度中的最大等待轮次数设为20，学习率缩放因子设为0.75。

S8：采用S4得到的测试集中的源机和从机的近红外光谱评估转移模型C，检验光谱转移效果；具体包括如下步骤：

（6）

S82：使用Savitzky-Golay平滑滤波器对其进行平滑处理，去除添加的波长点，将光谱一阶导数还原，进而求出经平滑处理后预测源机光谱一阶导数的原函数，此即为从机转后光谱；

所述“源机近红外光谱与从机近红外光谱的平均绝对误差MAE”的计算方法如下：

举例说明：假设源机的一条光谱为：0.51、0.61、0.65、0.71、0.82，对应从机的一条光谱为：0.58、0.68、0.69、0.78、0.88；那么：

MAE1 = ( |0.51-0.58| + |0.61-0.68| + |0.65-0.69| + |0.71-0.78| + |0.82-0.88| )/5

假设源机的另一条光谱为：0.41、0.51、0.65、0.75、0.82，对应从机的一条光谱为：0.48、0.58、0.69、0.78、0.86；那么：

MAE2 = ( |0.41-0.48| + |0.51-0.58| + |0.65-0.69| + |0.75-0.78| + |0.82-0.86| )/5

依次类推，得到MAE3,MAE4......MAEn；

那么，源机近红外光谱与从机近红外光谱的平均绝对误差为：

MAE = (MAE1+MAE2+MAE3+...MAEn)/n

同理，可计算源机近红外光谱与转后从机近红外光谱的平均绝对误差MAE。

在测试集上，分别比较源机的近红外光谱和从机的近红外光谱、源机近红外光谱和转后从机近红外光谱的平均绝对误差MAE，结果如下表1所示：

在测试集上，分别比较源机近红外光谱一阶导数和从机近红外光谱一阶导数、源机近红外光谱一阶导数和转后从机近红外光谱一阶导数的平均绝对误差MAE，结果如下表2所示：

从上表1、2可以发现，经过转移模型C转移后的从机近红外光谱无论是光谱本身还是其一阶导数，都更为接近源机近红外光谱。

小样本上转移模型的效果：由于需要使用模型转移的场景通常是因为标准光谱（即源机和从机扫描相同烟叶产生的成对的近红外光谱）数量较少，因此有必要测试该方法在标准光谱数量较少时的表现，因此测试该方法分别在42个训练样本，8个测试样本、85个训练样本，15个测试样本、127个训练样本，23个测试样本、170个训练样本，30个测试样本、212个训练样本，38个测试样本，4种小样本情况下的结果MAE，最终结果如图8所示。

如图8、9所示，在4种小样本情况下，经转移模型转后的从机近红外光谱，无论是光谱本身还是其一阶导数，均比源机近红外光谱的MAE更小，说明该转移模型效果较好。

Claims

1.一种基于孪生卷积自编码器构建的光谱模型转移方法，其特征在于，包括如下步骤：

S1：获取源机与从机的近红外光谱；

S5：设计基于卷积自编码器的孪生编码器A和B；采用S4得到的训练集中从机的近红外光谱训练孪生编码器A；采用S4得到的训练集中源机的近红外光谱训练孪生编码器B；设计基于卷积自编码器的孪生编码器的步骤如下：

S51：构建卷积池化块，其结构为一维卷积-LeakyReLU激活函数-一维平均池化；

S52：构建转置卷积块，其结构为一维转置卷积层-LeakyReLU激活函数；

S53：构建编码器，其结构为输入层-高斯噪音-卷积池化层块一-卷积池化层块二-卷积池化层块三-卷积池化层块四；

S54：构建解码器，其结构为输入层-转置卷积块一-转置卷积块二-转置卷积块三-转置卷积块四；

S55：构建孪生编码器，其结构为左输入层-左编码-左特征映射-（左特征映射 + 右特征映射）-左解码和右输入层-右编码-右特征映射-（左特征映射 + 右特征映射）-右解码；其中，孪生编码器的输入层、编码、特征映射和解码均分为左右两支，其中一支的输入输出为近红外光谱，另一支的输入输出则为对应近红外光谱的一阶导数；另外，两支解码器共享了编码器部分输出的“特征图”；

S6：设计基于S5所述孪生编码器A和孪生编码器B的转移模型C；包括如下步骤：

S63：在Upper Part和Lower Part之间加入由一维卷积层和LeakyReLU层构成的特征转换模块，并将所述Upper Part、特征转换模块、Lower Part和输出层依次进行拼接，最终得到了“可实现源机近红外光谱转换为从机近红外光谱”的光谱转移模型；所述一维卷积层权重可变；

2.根据权利要求1所述的基于孪生卷积自编码器构建的光谱模型转移方法，其特征在于，S1中获取源机与从机的近红外光谱时，每条源机的近红外光谱和从机的近红外光谱均从相同的烟叶样本分别用源机与从机扫描得到。

3.根据权利要求1所述的基于孪生卷积自编码器构建的光谱模型转移方法，其特征在于，S3中所述误差椭圆法包括如下步骤：

S31：使用主成分分析方法，分别将训练集和测试集中的源机以及从机的近红外光谱进行降维，只保留两个主成分，并分别计算降维后训练集和测试集中源机的近红外光谱以及训练集和测试集中从机的近红外光谱的均值和两个主成分的标准差，并据此分别确定训练集和测试集中源机的近红外光谱的误差椭圆以及训练集和测试集中从机的近红外光谱对应的误差椭圆；

S32：分别对S31降维后训练集和测试集中源机近红外光谱以及从机的近红外光谱计算其T²统计量，由此判断出训练集和测试集中的离群点，并将其从训练集和测试集中剔除；所述T²统计量用于发现样本点中的离群点。

4.根据权利要求3所述的基于孪生卷积自编码器构建的光谱模型转移方法，其特征在于，S32中T²统计量发现样本点中的离群点的具体原理为：

定义第i个样本点对第h主成分t_h的贡献率为，公式如下：

(1)

其中，是第i个样本点的第h主成分，/>是主成分t_h的方差，n是样本点个数；

(2)

当：

(3)

时，认为在95%的检验水平上，样本点i对主成分的贡献过大，此时所述样本点i是离群点；其中，n是样本点个数；m为主成分数；/>为累计贡献率；F_0.05(m,n-m) 为检验水平α = 0.05，分子自由度为m，分母自由度为 n-m 的F分布的单侧右分位点，通过查询F分布的F界值表得到；

当m为2时，即主成分数为2时，将m = 2带入公式（3）可得到如下公式：

(4)

其中，t_1i 是第i个样本点的第1主成分；t_2i 是第i个样本点的第2主成分；是主成分t₁的方差；/> 是主成分t₂的方差；n是样本点个数；c为T²统计量；

公式（4）符合椭圆方程构造，在光谱样本的第一主成分和第二主成分平面图上表示的是一个椭圆，样本点落在椭圆内为正常样本，落在椭圆外为离群样本。

5.根据权利要求1所述的基于孪生卷积自编码器构建的光谱模型转移方法，其特征在于，S4所述预处理包括如下步骤：

S43：对训练集和测试集中源机的近红外光谱和源机近红外光谱一阶导数，以及训练集和测试集中从机的近红外光谱和从机近红外光谱一阶导数进行标准差标准化，其计算公式如下所示：

(5)

6.根据权利要求5所述的基于孪生卷积自编码器构建的光谱模型转移方法，其特征在于，S8具体包括如下步骤：

(6)

S83：模型评估：对比“源机近红外光谱与从机近红外光谱的平均绝对误差MAE”和“源机近红外光谱与通过转移模型C将源机近红外光谱转化得到的从机近红外光谱的平均绝对误差MAE”，观察前者是否显著大于后者。

7.根据权利要求6所述的基于孪生卷积自编码器构建的光谱模型转移方法，其特征在于，所述“源机近红外光谱与从机近红外光谱的平均绝对误差MAE”的计算方法如下：