CN114048672A

CN114048672A - 基于联邦学习的织物纤维成分检测方法

Info

Publication number: CN114048672A
Application number: CN202111242183.4A
Authority: CN
Inventors: 池明旻
Original assignee: Individual
Current assignee: Individual
Priority date: 2021-10-25
Filing date: 2021-10-25
Publication date: 2022-02-15

Abstract

本发明公开了基于联邦学习的织物纤维成分检测方法。该检测方法包含以下步骤：获取多个参与方的纺织品纤维成分近红外光谱特征数据；各个参与方进行本地的局部卷积神经网络模型训练；中控服务器向各个参与方的服务器发起联合建模任务请求；各参与方的服务器收到建模任务请求后，将局部模型的参数发送给所述中控服务器；中控服务器对收到的局部模型参数进行聚合操作，根据聚合后的结果对全局模型的参数进行更新，将更新后的全局模型返回给所述各参与方的服务器；直至达到容忍误差下界或最大迭代次数，输出最终的全局模型。基于联邦学习的检测方法允许多个数据所有者协作训练和使用共享的预测模型，打破了数据壁垒，并能够保持本地训练数据的私密性。

Description

基于联邦学习的织物纤维成分检测方法

技术领域

本发明属于纺织品成分分析和人工智能技术交叉领域，具体涉及一种基于联邦学习的织物纤维成分检测方法。

背景技术

织物纤维的成分分析具有重要意义。传统的人工分析方法耗时长、成本高，利用深度神经网络对纤维样品的近红外光谱进行分析则可以解决这些问题。然而深度神经网络需要大量传统的纤维成分分析方法得来的有标签数据进行支撑，单个数据拥有方在本地训练出的算法模型在准确度上有所欠缺。

联邦学习是一种机器学习环境，其目标是在训练数据分布在大量不同客户的情况下，训练一个高质量的集中模型。它允许多个数据所有者协作训练和使用共享的预测模型，同时能够保持所有本地训练数据的私密性。将联邦学习算法利用于织物纤维的成分分析，可以通过汇总所有可用的数据以得到一个更准确的预测模型。

发明内容

为解决现有技术中存在的问题，本发明提供一种基于联邦学习的织物纤维成分检测方法。考虑标签数据来源于多个客户端的现状，利用联邦学习算法将各个客户端的数据进行联合建模，能够在保障数据安全的同时有效解决单个客户端数据不足以支撑模型训练的问题。

为实现上述目的，本发明提供一种基于联邦学习的织物纤维成分检测方法，按照如下步骤进行：

S1：获取多个参与方的纺织品纤维成分的近红外光谱特征数据，对数据进行清洗、预处理和存储；

S11：数据包括：利用手持式近红外光谱仪，采集织物900至1700纳米波段反射率的近红外光谱特征作为特征向量x，作为模型的输入；12种常见材质难以区分的问题，包括：棉、麻、氨纶、腈纶、涤纶、天丝、人丝、丝绸、尼龙、羊毛、羊绒、莫代尔作为标签向量y；

S12：对数据进行清洗，对数据进行必要的重读、切分、去冗、平滑、降噪等预处理，对各参与方提供的数据进行标准化处理；

S13：将清洗和预处理后的数据上传到本地服务器中；

S2：各个参与方训练本地的局部卷积神经网络(CNN)模型。

S21：所使用的卷积神经网络模型主干包括残差卷积神经网络模块，分支卷积神经网络模块，注意力模块，中间卷积层和池化层；

S22：使用可处理一维序列数据的深度残差卷积神经网络提取一维光谱数据的深层特征，分为四个由残差块组成的卷积模块，每个模块使用若干个同样输出通道数的残差块；在每个卷积模块后增加通道注意力，深层特征提取后经过一个由卷积、批量归一化层和ReLu组成的中间卷积结构以适应特征大小至下一模块。

S23：而后，该特征同时经过四个不同的由卷积、批量归一化层、ReLu组成的分支卷积神经网络模块，将提取的四个特征连接以提升网络宽度；最后通过一个全局池化层将提取到的特征维度转换为一维。构建十二个并行的全连接层，对得到的一维高级特征进行综合.对十二个全连接层中的每一层都构建Sigmoid分类器，对一维特征进行分类。

S24：将训练集作为损失函数的输入，通过反向传播算法计算参数的梯度，利用梯度下降算法更新模型参数，得到训练好的模型。将训练集作为损失函数的输入，通过反向传播算法计算参数的梯度，利用梯度下降算法更新模型参数，得到训练好的模型。定义损失函数Loss度量真实标签和预测概率之间的差异，选用交叉熵损失函数CrossEntropy，总损失TotalLoss为十二个分类器的平均损失：

其中N为样本数，在每个二分类器中y_i为第i个样本的标签，P_i为第i个样本的预测概率，k为第k个二分类器。

S3：中控服务器向所述各个参与方的服务器发起联合建模任务请求；

S4：所述各参与方的服务器收到建模任务请求后，将局部模型的参数发送给所述中控服务器；

S5：所属中控服务器对收到的来自所述各参与方服务器的局部模型参数进行聚合操作并对全局模型的参数进行更新，将更新后的全局模型返回给所述各参与方的服务器；

S6：所述各参与方服务器根据收到的全局模型参数更新局部模型参数；

S7：重复步骤S2-S6，直至模型收敛或达到最大迭代次数，输出最终的全局模型。

与现有的技术相比，本发明具有如下优点：能够在保障数据安全的同时有效解决单个客户端数据不足以支撑模型训练的问题。

附图说明

下面结合附图和具体实施方式对本申请作进一步详细的说明。

图1为本发明实施例的基于联邦学习的织物纤维成分检测方法流程图。

图2为本发明实施例的联邦学习框架示意图。

图3为本发明实施例的局部卷积神经网络模型架构图。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。

实施例一

步骤1：各参与方将纺织品纤维成分的近红外光谱特征数据上传到本地服务器。

需要采集的数据包括：织物900至1700纳米波段反射率的近红外光谱特征作为特征向量x，作为模型的输入；十二种常见材质包括棉、麻、氨纶、腈纶、涤纶、天丝、人丝、丝绸、尼龙、羊毛、羊绒、莫代尔作为标签向量y。x是228维的向量，y是12维的{0，1}向量y＝[y₁,y₂,…,y_i,…,y₁₂]，分别表示该样本中第i种材质是否存在。

对数据进行清洗，对数据进行必要的重读、切分、去冗、平滑、降噪等预处理，对各参与方提供的数据进行标准化处理。完成后各参与方将清洗和预处理后的数据上传到本地服务器中。

步骤2：各个参与方训练本地的局部卷积神经网络(CNN)模型。

所使用的卷积神经网络模型主干包括残差卷积神经网络模块，分支卷积神经网络模块，注意力模块，中间卷积层和池化层；

使用可处理一维序列数据的深度残差卷积神经网络提取一维光谱数据的深层特征，分为四个由残差块组成的卷积模块，每个模块使用若干个同样输出通道数的残差块；

残差网络可以解决深度网络难以训练的问题。将残差单元表示为

x_l+1＝x_l+F(x_l,W_l)

其中x_l和x_l+1表示第l个单元的输入和输出，F为残差函数。则通过递归可以从浅层的l单元得到深层的L单元

将代价函数用loss表示，则

这样抑制了梯度的衰减，可以避免梯度消失现象的发生。

在每个卷积模块后增加通道注意力，深层特征提取后经过一个由卷积、批量归一化层和ReLu组成的中间卷积结构以适应特征大小至下一模块。

而后，该特征同时经过四个不同的由卷积、批量归一化层、ReLu组成的分支卷积神经网络模块，分别为：卷积核大小为1×1卷积的分支1；卷积核大小为1×1和3×1卷积堆叠，卷积核大于1的padding填充大小为1的分支2；卷积核大小为1×1，3×1和3×1卷积堆叠，卷积核大于1的padding填充大小为1的分支3；池化窗口为3×1的最大池化和卷积核大小为1×1卷积的堆叠，池化窗口padding填充大小为1的分支4。将提取的四个特征连接以提升网络宽度；最后通过一个全局池化层将提取到的特征维度转换为一维。

构建十二个并行的全连接层，对得到的一维高级特征进行综合，十二个并行的全连接层分别表示步骤1所述的十二种常见材质特征的综合，构建过程如：

y_k＝f_k(w_k×x+b_k),k＝1,2,…,12

其中k表示全连接层的序号，w_k是第k层的参数，b_k是第k层的偏置，×代表矩阵乘法，f是恒等函数f(x)＝x。对十二个全连接层中的每一层都构建Sigmoid分类器，对一维特征进行分类，如下式所示：

将训练集作为损失函数的输入，通过反向传播算法计算参数的梯度，利用梯度下降算法更新模型参数，得到训练好的模型。定义损失函数Loss度量真实标签和预测概率之间的差异，选用交叉熵损失函数CrossEntropy,总损失TotalLoss为十二个分类器的平均损失：

步骤3：中控服务器向所述各个参与方的服务器发起联合建模任务请求，各参与方的服务器收到建模任务请求后，将局部模型的参数发送给所述中控服务器。

步骤4：所属中控服务器对收到的来自所述各参与方服务器的局部模型参数进行聚合操作并对全局模型的参数进行更新，将更新后的全局模型返回给所述各参与方的服务器。

假设有K个参与方的服务器协作进行模型训练，其拥有的数据分别为n₁,n₂,…,n_K，各本地模型参数分别为w₁,w₂,…,w_K，w是全局模型参数，则每次聚合操作维

步骤5：各参与方服务器根据收到的全局模型参数更新局部模型参数。

步骤6：重复步骤2-5，直至模型收敛或达到最大迭代次数，输出最终的全局模型。

以上所述仅是本申请的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请技术原理的前提下，还可以做出若干改进和替换，这些改进和替换也应视为本申请的保护范围。

Claims

1.基于联邦学习的织物纤维成分检测方法，其特征在于，所述织物纤维成分检测方法包括：

S1：各参与方对数据进行清洗、标准化等预处理，完成后上传数据到本地服务器中；

S2：各个参与方训练本地的局部卷积神经网络(CNN)模型；

S3：中控服务器向所述各个参与方的服务器发起联合建模任务请求，各参与方的服务器收到建模任务请求后，将局部模型的参数发送给所述中控服务器；

S4：所属中控服务器对收到的来自所述各参与方服务器的局部模型参数进行聚合操作并对全局模型的参数进行更新，将更新后的全局模型返回给所述各参与方的服务器；

S5：各参与方服务器根据收到的全局模型参数更新局部模型参数；

S6：重复步骤S2-S5，直至模型收敛或达到最大迭代次数，输出最终的全局模型。

2.根据权利要求1所述的织物纤维成分检测方法，其特征在于，所述步骤S2进一步包括：

S22：使用可处理一维序列数据的深度残差卷积神经网络提取一维光谱数据的深层特征，分为四个由残差块组成的卷积模块，每个模块使用若干个同样输出通道数的残差块；在每个卷积模块后增加通道注意力，深层特征提取后经过一个由卷积、批量归一化层和ReLu组成的中间卷积结构以适应特征大小至下一模块；

S23：而后，该特征同时经过四个不同的由卷积、批量归一化层、ReLu组成的分支卷积神经网络模块，分别为：卷积核大小为1×1卷积的分支1；卷积核大小为1×1和3×1卷积堆叠，卷积核大于1的padding填充大小为1的分支2；卷积核大小为1×1，3×1和3×1卷积堆叠，卷积核大于1的padding填充大小为1的分支3；池化窗口为3×1的最大池化和卷积核大小为1×1卷积的堆叠，池化窗口padding填充大小为1的分支4；将提取的四个特征连接以提升网络宽度；最后通过一个全局池化层将提取到的特征维度转换为一维；构建十二个并行的全连接层，对得到的一维高级特征进行综合；对十二个全连接层中的每一层都构建Sigmoid分类器，对一维特征进行分类；

S24：将训练集作为损失函数的输入，通过反向传播算法计算参数的梯度，利用梯度下降算法更新模型参数，得到训练好的模型。将训练集作为损失函数的输入，通过反向传播算法计算参数的梯度，利用梯度下降算法更新模型参数，得到训练好的模型；定义损失函数Loss度量真实标签和预测概率之间的差异，选用交叉熵损失函数CrossEntropy，总损失TotalLoss为十二个分类器的平均损失：

3.根据权利要求1所述的织物纤维成分检测方法，其特征在于，所述步骤S4进一步包括：

S41：假设有K个参与方的服务器协作进行模型训练，其拥有的数据分别为n₁,n₂,…,n_K，各本地模型参数分别为w₁,w₂,…,w_K，w是全局模型参数，则每次聚合操作维

4.根据权利要求1所述的织物纤维成分检测方法，其特征在于，所述中控服务器完成对全局模型参数的更新后，将评估模型的预测准确率，当准确率达到规定要求后终止训练过程，输出最终的全局模型。