WO2023116155A1

WO2023116155A1 - 神经网络操作方法、装置及存储介质

Info

Publication number: WO2023116155A1
Application number: PCT/CN2022/126458
Authority: WO
Inventors: 金立强; 高秋彬; 刘正宣
Original assignee: 大唐移动通信设备有限公司
Priority date: 2021-12-23
Filing date: 2022-10-20
Publication date: 2023-06-29
Also published as: TW202326523A

Abstract

本公开实施例提供一种神经网络操作方法、装置及存储介质，包括：根据可变维度的类型在第一神经网络中添加随机掩膜层，得到第二神经网络；所述随机掩膜层用于对输入至所述随机掩膜层的张量进行随机掩膜处理；利用样本数据对所述第二神经网络进行训练。本公开实施例提供的神经网络操作方法、装置及存储介质，通过在神经网络中添加随机掩膜层，仅需训练和部署一个神经网络适应不同输入输出维度要求，该方法训练复杂度低、存储开销低，易于部署和在线训练持续演进。

Description

神经网络操作方法、装置及存储介质

相关申请的交叉引用

本申请要求于2021年12月23日提交的申请号为202111593613.7，发明名称为“神经网络训练与部署方法、装置及存储介质”和于2022年01月13日提交的申请号为202210039452.5，发明名称为“神经网络操作方法、装置及存储介质”的中国专利申请的优先权，其通过引用方式全部并入本文。

技术领域

本公开涉及通信技术领域，尤其涉及一种神经网络操作方法、装置及存储介质。

背景技术

当神经网络输入维度(采集到部分数据导致输入维度不同)和/或输出维度不确定时，需要对所有可能的输入维度和/或输出维度分别训练一个神经网络以应对不同维度和任务需求。

图1是现有技术中维度可变的神经网络的训练方法的原理图，如图1所示，现有可行的解决方案便是对不同输入维度分别训练一个神经网络，如图1所示，系统根据输入维度会自动选择相应的神经网络做出预测，随着输入维度的不断增大(采集到实时的数据从部分到完整)，神经网络的预测值由“粗糙”逐渐转向“准确”。

但是，上述方案中神经网络的个数会随着维度可能的情况的增加而增加，神经网络(模型)训练的复杂度高，模型存储开销大，不利于实际部署和神经网络在线学习持续演进。

发明内容

本公开实施例提供一种神经网络操作方法、装置及存储介质，用以解决现有技术中神经网络的个数会随着维度可能的情况的增加而增加的技术问题。

第一方面，本公开实施例提供一种神经网络操作方法，包括：

根据可变维度的类型在第一神经网络中添加随机掩膜层，得到第二神经网络；所述随机掩膜层用于对输入至所述随机掩膜层的张量进行随机掩膜处理；

利用样本数据对所述第二神经网络进行训练。

在一些实施例中，所述可变维度类型包括以下类型中的一种或多种：

输入维度可变；

输出维度可变；

中间维度可变。

在一些实施例中，所述根据可变维度的类型在第一神经网络中添加随机掩膜层，包括：

在所述可变维度的类型为输入维度可变的情况下，在所述第一神经网络的输入层之前添加随机掩膜层。

在所述可变维度的类型为输出维度可变的情况下，在所述第一神经网络的输出层之后添加随机掩膜层。

在所述可变维度的类型为中间维度可变的情况下，在所述第一神经网络的中间层添加随机掩膜层。

在一些实施例中，所述在所述第一神经网络的中间层添加随机掩膜层，包括：

在只有一个中间维度可变的情况下，在相关联的中间层之前或之后添加一个随机掩膜层。

在一些实施例中，所述在所述神经网络的中间层添加随机掩膜层，包括：

在有多个中间维度可变的情况下，在每一相关联的中间层之前或之后分别添加一个随机掩膜层。

在一些实施例中，所述利用样本数据对所述第二神经网络进行训练，包括：

在每一样本数据的输入数据的维度均为第一阈值的情况，直接利用所有的样本数据对所述第二神经网络进行训练；所述第一阈值为所有样本数据的输入数据的维度的最大值。

在存在至少一个第一样本数据的情况，先对所述第一样本数据进行增强处理，再利用所有的第一样本数据和所有的第二样本数据对所述第二神经网络进行训练；所述第一样本数据为输入数据的维度不为第一阈值的样本数据；所述第二样本数据为输入数据的维度为所述第一阈值的样本数据；所述第一阈值为所有样本数据的输入数据的维度的最大值。

在一些实施例中，所述对所述第一样本数据进行增强处理，包括：

对所述第一样本数据的输入数据进行高位补零。

对所述第一样本数据的输入数据进行低位补零。

在存在至少一个第一样本数据的情况，先剔除所述第一样本数据，再利用所有的第二样本数据对所述第二神经网络进行训练；所述第一样本数据为输入数据的维度不为第一阈值的样本数据；所述第二样本数据为输入数据的维度为所述第一阈值的样本数据；所述第一阈值为所有样本数据的输入数据的维度的最大值。

在一些实施例中，所述对输入至所述随机掩膜层的张量进行随机掩膜处理，包括：

确定输入至所述随机掩膜层的张量以及随机掩膜张量；

利用所述随机掩膜张量对输入至所述随机掩膜层的张量进行随机掩膜处理。

在一些实施例中，所述对输入至所述随机掩膜层的张量进行随机掩膜处理的表达式如下：

其中，

表示随机掩膜层输出的张量，X表示输入至随机掩膜层的张量，

表示张量逐位点乘运算，M表示随机掩膜张量。

在一些实施例中，所述随机掩膜张量为硬值掩膜张量。

在一些实施例中，所述随机掩膜张量为软值掩膜张量。

在一些实施例中，所述随机掩膜张量由硬值掩膜张量和软值掩膜张量组合而成。

在一些实施例中，所述利用样本数据对所述第二神经网络进行训练之后，还包括：

将经过训练后的第二神经网络中的随机掩膜层替换为张量变换层；所述张量变换层用于对输入至所述张量变换层的张量进行维度变换。

在一些实施例中，所述将经过训练后的第二神经网络中的随机掩膜层替换为张量变换层，包括：

在经过训练后的第二神经网络的输入层之前存在随机掩膜层的情况下，将经过训练后的第二神经网络的输入层之前的随机掩膜层替换为张量填充层；所述张量填充层用于将输入至所述张量填充层的张量的维度增大到第一阈值；所述第一阈值为所有样本数据的输入数据的维度的最大值。

在经过训练后的第二神经网络的输出层之后存在随机掩膜层的情况下，将经过训练后的第二神经网络的输出层之后的随机掩膜层替换为张量裁剪层；所述张量裁剪层用于将输入至所述张量裁剪层的张量的维度减小到第一目标值。

在经过训练后的第二神经网络的中间层存在随机掩膜层的情况下，将经过训练后的第二神经网络的中间层的随机掩膜层替换为张量裁剪级联张量填充层；所述张量裁剪级联张量填充层用于将输入至所述张量裁剪级联张量填充层的张量的维度先减小到第二目标值，再增大到原来的维度。

第二方面，本公开实施例提供一种电子设备，包括存储器，收发机，处理器；

存储器，用于存储计算机程序；收发机，用于在所述处理器的控制下收发数据；处理器，用于读取所述存储器中的计算机程序并执行以下操作：

输入维度可变；

输出维度可变；

中间维度可变。

对所述第一样本数据的输入数据进行高位补零。

对所述第一样本数据的输入数据进行低位补零。

确定输入至所述随机掩膜层的张量以及随机掩膜张量；

其中，

表示张量逐位点乘运算，M表示随机掩膜张量。

在一些实施例中，所述随机掩膜张量为硬值掩膜张量。

在一些实施例中，所述随机掩膜张量为软值掩膜张量。

第三方面，本公开实施例提供一种神经网络操作方法，其特征在于，包括：

获取预测数据；

将所述预测数据输入至部署好的目标神经网络，得到所述目标神经网络输出的预测结果；其中，所述目标神经网络包括至少一个张量变换层，所述张量变换层用于对输入至所述张量变换层的张量进行维度变换。

在一些实施例中，所述目标神经网络为所述第一方面中的任一项所述的第二神经网络。

第四方面，本公开实施例提供一种电子设备，包括存储器，收发机，处理器；

获取预测数据；

第五方面，本公开实施例提供一种神经网络操作装置，包括：

添加模块，用于根据可变维度的类型在第一神经网络中添加随机掩膜层，得到第二神经网络；所述随机掩膜层用于对输入至所述随机掩膜层的张量进行随机掩膜处理；

训练模块，用于利用样本数据对所述第二神经网络进行训练。

输入维度可变；

输出维度可变；

中间维度可变。

在一些实施例中，所述添加模块具体用于：

在一些实施例中，所述训练模块具体用于：

对所述第一样本数据的输入数据进行高位补零。

在一些实施例中，所述训练模块具体用于：

对所述第一样本数据的输入数据进行低位补零。

在一些实施例中，所述训练模块具体用于：

确定输入至所述随机掩膜层的张量以及随机掩膜张量；

其中，

表示张量逐位点乘运算，M表示随机掩膜张量。

在一些实施例中，所述随机掩膜张量为硬值掩膜张量。

在一些实施例中，所述随机掩膜张量为软值掩膜张量。

在一些实施例中，还包括部署模块；

所述部署模块用于将经过训练后的第二神经网络中的随机掩膜层替换为张量变换层；所述张量变换层用于对输入至所述张量变换层的张量进行维度变换。

在一些实施例中，所述部署模块具体用于：

第六方面，本公开实施例提供一种神经网络操作装置，包括：

获取模块，用于获取预测数据；

处理模块，用于将所述预测数据输入至部署好的目标神经网络，得到所述目标神经网络输出的预测结果；其中，所述目标神经网络包括至少一个张量变换层，所述张量变换层用于对输入至所述张量变换层的张量进行维度变换。

在一些实施例中，在一些实施例中，所述目标神经网络为所述第五方面中的任一项所述的第二神经网络。

第七方面，本公开实施例还提供一种处理器可读存储介质，所述处理器可读存储介质存储有计算机程序，所述计算机程序用于使处理器执行如上所述第一方面或第三方面所述的神经网络操作方法的步骤。

第八方面，本公开实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序用于使计算机执行如上所述第一方面或第三方面所述的神经网络操作方法的步骤。

第九方面，本公开实施例还提供一种通信设备可读存储介质，所述通信设备可读存储介质存储有计算机程序，所述计算机程序用于使通信设备执行如上所述第一方面或第三方面所述的神经网络操作方法的步骤。

第十方面，本公开实施例还提供一种芯片产品可读存储介质，所述芯片产品可读存储介质存储有计算机程序，所述计算机程序用于使芯片产品执行如上所述第一方面或第三方面所述的神经网络操作方法的步骤。

本公开实施例提供的神经网络操作方法、装置及存储介质，通过在神经网络中添加随机掩膜层，仅需训练和部署一个神经网络适应不同输入输出维度要求，该方法训练复杂度低、存储开销低，易于部署和在线训练持续演进。

附图说明

为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是现有技术中维度可变的神经网络的训练方法的原理图；

图2是本公开实施例提供的神经网络操作方法的流程示意图；

图3是本公开实施例提供的维度可变神经网络训练框图；

图4是本公开实施例提供的硬值掩膜张量示意图；

图5是本公开实施例提供的维度可变神经网络部署框图；

图6是本公开实施例提供的张量填充与张量裁剪模块示意图；

图7是本公开实施例提供的自编码器神经网络示意图；

图8是本公开实施例提供的单符号和双符号DMRS示意图；

图9是本公开实施例提供的基于自编码器的CSI压缩反馈框图；

图10是本公开实施例提供的一种电子设备的结构示意图；

图11是本公开实施例提供的一种神经网络操作装置的结构示意图。

具体实施方式

人工神经网络是从信息处理角度对人脑的神经元网络进行抽象建立的一种简化模型。在学术界和工业界，人工神经网络简称为神经网络，是一种由大量计算节点按特定方式相互连接构成的计算模型，该模型通常是对某种算法、某种函数映射的表达或近似表达。在神经网络的训练阶段，工程人员首先需要确定神经网络的结构、超参数，然后将数据喂入模型并给予梯度反向传播更新训练神经网络的权重。训练好的神经网络是输入数据与标签之间映射关系的一种近似，在部署阶段将新的数据喂入神经网络就可以得到预测值。常见的神经网络有全连接前馈神经网络、卷积神经网络、递归神经网络等。随着计算机性能的提升以及图形处理器(GPU)的大量部署，神经网络在计算机视觉、自然语言处理、生物医学、自动控制领域的应用已经十分普遍。

神经网络的训练和部署通常是面向具体任务的，因此神经网络的输入和输出维度一般是确定的。面向A任务训练的神经网络通常无法用于B任务，或者用于B任务时性能较差。当神经网络输入和输出维度不确定时，需要对所有可能的输入和输出维度分别训练一个神经网络以应对不同维度和任务需求。例如，系统根据部署的神经网络预测值做出响应，神经网络的输入是实时采集到的数据。当系统实时性要求较高时，系统希望神经网络基于采集到的部分数据也能给出一些“粗糙的”预测结果，以便系统提前向较优方向响应，从而节省向最优方向响应的总时间。现有可行的解决方案便是对不同输入数据维度(采集到部分数据导致输入维度不同)分别训练一个神经网络，如图1所示。系统根据输入维度会自动选择相应的神经网络做出预测，随着输入维度的不断增大(采集到实时的数据从部分到完整)，神经网络的预测值由“粗糙”逐渐转向“准确”。

当神经网络的输入和输出维度不确定时，现有技术需要部署多个神经网络以应对不同的输入输出维度要求。神经网络的个数会随着维度可能的情况增加而增加，模型训练的复杂度高，模型存储开销大，不利于实际部署和神经网络在线学习持续演进。

基于上述技术问题，本公开实施例提出一种神经网络操作方法、装置及存储介质，该方法通过在神经网络中添加随机掩膜层，仅需训练和部署一个神经网络适应不同输入输出维度要求，训练复杂度低、存储开销低，易于部署和在线训练持续演进。

为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

图2是本公开实施例提供的神经网络操作方法的流程示意图，如图2所示，本公开实施例提供一种神经网络操作方法，其执行主体可以为电子设备，例如，终端、基站、核心网网元等。该方法包括：

步骤201、根据可变维度的类型在第一神经网络中添加随机掩膜层，得到第二神经网络；该随机掩膜层用于对输入至该随机掩膜层的张量进行随机掩膜处理；

步骤202、利用样本数据对该第二神经网络进行训练。

在一些实施例中，该可变维度类型包括以下类型中的一种或多种：

输入维度可变；

输出维度可变；

中间维度可变。

在一些实施例中，根据可变维度的类型在第一神经网络中添加随机掩膜层，包括：

在该可变维度的类型为输入维度可变的情况下，在该第一神经网络的输入层之前添加随机掩膜层。

在该可变维度的类型为输出维度可变的情况下，在该第一神经网络的输出层之后添加随机掩膜层。

在该可变维度的类型为中间维度可变的情况下，在该第一神经网络的中间层添加随机掩膜层。

在一些实施例中，在该第一神经网络的中间层添加随机掩膜层，包括：

在一些实施例中，在该神经网络的中间层添加随机掩膜层，包括：

在一些实施例中，利用样本数据对该第二神经网络进行训练，包括：

在每一样本数据的输入数据的维度均为第一阈值的情况，直接利用所有的样本数据对该第二神经网络进行训练；该第一阈值为所有样本数据的输入数据的维度的最大值。

在存在至少一个第一样本数据的情况，先对该第一样本数据进行增强处理，再利用所有的第一样本数据和所有的第二样本数据对该第二神经网络进行训练；该第一样本数据为输入数据的维度不为第一阈值的样本数据；该第二样本数据为输入数据的维度为该第一阈值的样本数据；该第一阈值为所有样本数据的输入数据的维度的最大值。

在一些实施例中，对该第一样本数据进行增强处理，包括：

对该第一样本数据的输入数据进行高位补零。

在一些实施例中，对该第一样本数据进行增强处理，包括：

对该第一样本数据的输入数据进行低位补零。

在存在至少一个第一样本数据的情况，先剔除该第一样本数据，再利用所有的第二样本数据对该第二神经网络进行训练；该第一样本数据为输入数据的维度不为第一阈值的样本数据；该第二样本数据为输入数据的维度为该第一阈值的样本数据；该第一阈值为所有样本数据的输入数据的维度的最大值。

在一些实施例中，对输入至该随机掩膜层的张量进行随机掩膜处理，包括：

确定输入至该随机掩膜层的张量以及随机掩膜张量；

利用该随机掩膜张量对输入至该随机掩膜层的张量进行随机掩膜处理。

在一些实施例中，该对输入至该随机掩膜层的张量进行随机掩膜处理的表达式如下：

其中，

表示张量逐位点乘运算，M表示随机掩膜张量。

在一些实施例中，该随机掩膜张量为硬值掩膜张量。

在一些实施例中，该随机掩膜张量为软值掩膜张量。

在一些实施例中，该随机掩膜张量由硬值掩膜张量和软值掩膜张量组合而成。

在一些实施例中，利用样本数据对该第二神经网络进行训练之后，还包括：

将经过训练后的第二神经网络中的随机掩膜层替换为张量变换层；该张量变换层用于对输入至该张量变换层的张量进行维度变换。

在一些实施例中，将经过训练后的第二神经网络中的随机掩膜层替换为张量变换层，包括：

在经过训练后的第二神经网络的输入层之前存在随机掩膜层的情况下，将经过训练后的第二神经网络的输入层之前的随机掩膜层替换为张量填充层；该张量填充层用于将输入至该张量填充层的张量的维度增大到第一阈值；该第一阈值为所有样本数据的输入数据的维度的最大值。

在经过训练后的第二神经网络的输出层之后存在随机掩膜层的情况下，将经过训练后的第二神经网络的输出层之后的随机掩膜层替换为张量裁剪层；该张量裁剪层用于将输入至该张量裁剪层的张量的维度减小到第一目标值。

在经过训练后的第二神经网络的中间层存在随机掩膜层的情况下，将经过训练后的第二神经网络的中间层的随机掩膜层替换为张量裁剪级联张量填充层；该张量裁剪级联张量填充层用于将输入至该张量裁剪级联张量填充层的张量的维度先减小到第二目标值，再增大到原来的维度。

本公开实施例根据训练数据的最大维度、标签的最大维度，以及任务要求确定神经输入层、输出层、一些中间层的输入张量维度、输出张量维度。

图3是本公开实施例提供的维度可变神经网络训练框图，如图3所示，在训练阶段，对需要维度可变的张量所对应的层添加输随机掩膜模块(也可称为“随机掩膜层”)来训练网络。具体可以包括如下步骤：

1、如果神经网络输入的维度可变，则在输入层左侧添加随机掩膜模块；

2、如果神经网络输出的维度可变，则在输出层右侧添加随机掩膜模块；

3、如果神经网络中第i个中间层的输出与第i+1个中间层的输入维度可变，则在中间层i与中间层i+1之间添加随机掩膜模块；

4、若神经网络的输入、输出、中间层同时存在多个维度可变要求，则在相应位置添加多个随机掩膜模块。

5、在输入层左侧，训练数据可以只采用最大维度的数据(如果存在非最大维度的数据，可以先剔除这些数据)，也可以训练之前先做数据增强处理，通过高位或者低位补零方式，把低维度的输入数据增加到最大维度。

通过添加随机掩膜模块后，神经网络通过计算损失函数关于神经网络权重的梯度值更新训练神经网络。随机掩膜操作(随机掩膜处理)对张量X作用，表示为

其中，

X,M均为

维度(例如，X是长度64，宽度64的图片，那么L _X＝64×64×3，3表示红绿蓝三基色通道)的R _X阶张量，

是输入张量第i阶的维度，运算

表示张量逐位点乘，M是(随机)掩膜张量，

是掩膜结果。掩膜张量M为随机张量，对于每一个训练样本、每一个训练周期(Epoch)都是独立同分布的。R _X阶的掩膜张量M，维度为

可以是但不限于：

1、硬值掩膜(Hard-Masking)

表示需要掩膜的阶数(例如，对6×6×3维度的图片，长宽6×6维度掩膜，对红绿蓝三基色通道的3维度不做掩膜，则I＝{1,2}，如图4所示，3阶张量维度是6×6×3，对于

和

t＝3和t＝4)。张量

索引为

的元素取值如下：

其中，整数

服从某一给定概率分布(例如，均匀分布)，对于每个I _i，t独立同分布。

2、软值掩膜(Soft-Masking)

例如，指数衰减的软值掩膜

张量

索引为

的元素取值如下：

其中，实数λ∈[0,λ _max]服从某一分布(例如，均匀分布)，对于每个I _i，λ也是独立同分布。

3、在M中，还可以一部分采用硬值掩膜，一部分采用软值掩膜，也即硬值掩膜与软值掩膜的组合。

上述掩膜张量作用于某一张量时，不会改变张量本身维度，等价于对该张量进行加权操作，

索引小的位置的张量值分配更大权重。

例如，对于一阶张量(向量)，硬值掩膜

是一个前t位为1后

位为0的向量，

等价于对X的后

位数值置零，张量维度不变。

训练过程中，优化器基于损失计算梯度反向传播，并更新神经网络权值参数。

此外，在图3中还可以包含如下内容：

1、神经网络可以是但不限于卷积神经网络、前馈全连接神经网络、递归神经网络及其组合；

2、损失函数可以是但不限于均方误差、1范数、分类交叉熵、余弦相似度；

3、随机掩膜模块通过自定义梯度，掩膜张量当作常数张量等方式，避免梯度消失或不可导问题；

4、输入侧随机掩膜、输出侧随机掩膜、中间层随机掩膜可以同时存在，也可以只存在其中几个，具体使用几个可以根据具体任务确定。

图5是本公开实施例提供的维度可变神经网络部署框图，如图5所示，在部署阶段，维度可变的神经网络通过对训练好的神经网络移除随机掩膜模块，添加张量填充模块(也可称为“张量填充层”)和张量裁剪模块(也可称为“张量裁剪层”)来构造。具体可以包括如下步骤：

1、输入层左侧的随机掩膜模块替换为张量填充模块，通过低位或者高位补零方式将输入张量填充至最大输入维度；

2、输出层右侧的随机掩膜模块替换为张量裁剪模块，通过高位或者低位裁剪方式输出张量；

3、中间层i与中间层i+1之间的随机掩膜模块替换为，张量裁剪模块级联张量填充模块。

在整个过程中，仅需训练和部署一个神经网络便可适应不同的输入输出维度要求，避免了多个神经网络训练和存储问题。

维度可变的神经网络基于上述训练好的神经网络，移除随机掩膜模块，替换张量填充和张量剪裁模块来构造，如图5所示。替换的张量填充和张量裁剪模块如图6所示，当输入张量X第i阶长度小于

则采取对高位或者低位补零来填充张量使得第i阶的维数等于

1、若采取高位补零，训练过程如图3一样；

2、若采取低位补零，则张量X所对应的随机掩膜张量M，第i阶索引还需要额外增加反向重排操作。

当输出张量X的第i阶维度大于要求维度时，输出张量X通过截取低位或者高位的方式剪裁张量，目的是得到满足输出维度要求的张量

1、若采取低位截取，训练过程与图3一样；

2、若采取高位截取，则在训练阶段张量X对应的随机掩膜张量M，第i阶索引还需要额外增加反向重排操作。

可以看到，系统仅需一个神经网络部署，输出张量按需剪裁，输入张量补零填充就可以满足不同输入输出维度要求。

下面以几个具体的实施例，对上述方法进行进一步说明。

实施例1：

如图7所示，神经网络为一个自编码器，用于图像压缩，其中编码器模块用于压缩图片，解码器模块用于恢复图片。编码器输入和解码器输出均为

维的图片，编码器输出(也是解码器的输入)维度要求可变，最大维度为L _Z＝8192。在训练阶段，编码器与译码器之间添加随机硬值掩膜模块，掩膜张量的参数t∈[0,8192]服从均匀分布，采用Adam优化器训练自编码器神经网络。当神经网络训练完成后，编码器被部署在发送端，解码器被部署在接收端。发送端根据压缩率要求，截取编码器输出张量；接收端根据接收到的张量长度确定张量填充比特数并填充张量，然后送入解码器恢复图片。

实施例2：

与实施例1一样，自编码器用于图像压缩，编码器输入和解码器输出均为

维的图片，编码器输出(也是译码器的输入)维度可变，最大维度为L _Z＝128×128×3×(1-η _min)。编码特征Z维度越小，压缩率

越高，恢复的图像越模糊；编码特征维度越大，压缩率η越低，恢复的图像越清晰。压缩率的可能值为

在训练阶段，硬值掩膜模块的参数t∈{8192,4096,2048,1024}服从等概率分布

作用于编码器输出。

实施例3：

基于人工智能的信道估计算法中，接收端根据解调参考信号(DMRS)的接收值，估计出所有时频资源块上的信道系数，信道恢复算法基于神经网络实现的。在单个时隙(14个OFDM符号)，8个物理资源块(96个频点)下，单符号DMRS和双符号DMRS配置如图8所示。单符号DMRS配置对应于神经网络输入维度是48×1×2(48对应频率，1对应时间，2对应复数的实部和虚部)，双符号DMRS配置(在单符号配置基础上再额外配置一个DMRS符号)对应于神经网络输入维度48×2×2，神经网络的输出维度是96×14×2。用于信道估计的神经网络最大输入维度是L _X＝48×2×2，训练阶段对输入张量第2阶的索引维度(时间维度)进行软值掩膜，参数λ∈[0，20]均匀分布。部署后的输入维度可变的神经网络同时用于单符号和双符号DMRS配置的信道估计。

实施例4：

与实施例3一样，在单个时隙(14个OFDM符号)、8个物理资源块(96个频点)下，单符号DMRS配置对应于神经网络输入维度48×1×2，双符号DMRS配置对应于神经网络输入维度48×2×2。用于信道估计的神经网络最大输入维度是L _X＝48×2×2。在训练阶段，对输入张量第2阶的索引维度(时间维度)进行硬值掩膜，参数为t＝1,2，概率分布为

实施例5：

如图9所示，基于人工智能的信道状态信息(CSI)压缩算法采用自编码器实现，编码器部署于UE侧，解码器部署于基站侧。UE侧基于CSI参考信号(RS)估计出信道H并计算预编码向量V，预编码向量V的维度大小为n _band×n _T×2＝12×32×2＝768，其中n _band＝12表示12个子带，n _T＝32表示32根发天线，2表示实部虚部。编码器将768维度的V输入值编码器压缩成一个向量，张量裁剪模块根据需要反馈的比特数k裁剪编码器的输出后发送给基站测。基站侧根据反馈比特数对接收到的比特流做张量填充，并输入到解码器恢复出预编码向量

在训练阶段，自编码的编码器与解码器之间添加张量掩膜模块，采用随机硬值掩膜，掩膜张量的参数t∈[1,384]服从均匀分布，损失函数为余弦相似度。

本公开实施例提出的神经网络操作方法，仅需训练和部署一个神经网络适应不同输入输出维度要求，该方法训练复杂度低、存储开销低，易于部署和在线训练持续演进。

图10是本公开实施例提供的一种电子设备的结构示意图，如图10所示，所述电子设备包括存储器1020，收发机1000，处理器1010，其中：

存储器1020，用于存储计算机程序；收发机1000，用于在所述处理器1010的控制下收发数据；处理器1010，用于读取所述存储器1020中的计算机程序并执行以下操作：

利用样本数据对所述第二神经网络进行训练。

具体地，收发机1000，用于在处理器1010的控制下接收和发送数据。

其中，在图10中，总线架构可以包括任意数量的互联的总线和桥，具体由处理器1010代表的一个或多个处理器和存储器1020代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口提供接口。收发机1000可以是多个元件，即包括发送机和接收机，提供用于在传输介质上与各种其他装置通信的单元，这些传输介质包括无线信道、有线信道、光缆等传输介质。处理器1010负责管理总线架构和通常的处理，存储器1020可以存储处理器1010在执行操作时所使用的数据。

处理器1010可以是中央处理器(CPU)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)或复杂可编程逻辑器件 (Complex Programmable Logic Device，CPLD)，处理器也可以采用多核架构。

输入维度可变；

输出维度可变；

中间维度可变。

对所述第一样本数据的输入数据进行高位补零。

对所述第一样本数据的输入数据进行低位补零。

确定输入至所述随机掩膜层的张量以及随机掩膜张量；

其中，

表示张量逐位点乘运算，M表示随机掩膜张量。

在一些实施例中，所述随机掩膜张量为硬值掩膜张量。

在一些实施例中，所述随机掩膜张量为软值掩膜张量。

具体地，本公开实施例提供的上述电子设备，能够实现上述执行主体为电子设备的方法实施例所实现的所有方法步骤，且能够达到相同的技术效果，在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。

本公开实施例还提供一种神经网络操作方法，包括：

获取预测数据；

在一些实施例中，所述目标神经网络为上述实施例中的任一项所述的第二神经网络。

本公开实施例还提供一种电子设备，包括存储器，收发机，处理器，其中：

获取预测数据；

具体地，收发机，用于在处理器的控制下接收和发送数据。

总线架构可以包括任意数量的互联的总线和桥，具体由处理器代表的一个或多个处理器和存储器代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起，这些都是本领域所公知的，因此，本文不再对其进行进一步描述。总线接口提供接口。收发机可以是多个元件，即包括发送机和接收机，提供用于在传输介质上与各种其他装置通信的单元，这些传输介质包括无线信道、有线信道、光缆等传输介质。处理器负责管理总线架构和通常的处理，存储器可以存储处理器在执行操作时所使用的数据。

处理器可以是中央处理器(CPU)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)或复杂可编程逻辑器件(Complex Programmable Logic Device，CPLD)，处理器也可以采用多核架构。

本公开实施例提出的电子设备，仅需训练和部署一个神经网络适应不同输入输出维度要求，该方法训练复杂度低、存储开销低，易于部署和在线训练持续演进。

图11是本公开实施例提供的一种神经网络操作装置的结构示意图，如图11所示，本公开实施例提供一种神经网络操作装置，包括添加模块1101和训练模块1102，其中：

添加模块1101用于根据可变维度的类型在第一神经网络中添加随机掩膜层，得到第二神经网络；所述随机掩膜层用于对输入至所述随机掩膜层的张量进行随机掩膜处理；训练模块1102用于利用样本数据对所述第二神经网络进行训练。

输入维度可变；

输出维度可变；

中间维度可变。

在一些实施例中，所述添加模块具体用于：

在一些实施例中，所述训练模块具体用于：

对所述第一样本数据的输入数据进行高位补零。

在一些实施例中，所述训练模块具体用于：

对所述第一样本数据的输入数据进行低位补零。

在一些实施例中，所述训练模块具体用于：

确定输入至所述随机掩膜层的张量以及随机掩膜张量；

其中，

表示张量逐位点乘运算，M表示随机掩膜张量。

在一些实施例中，所述随机掩膜张量为硬值掩膜张量。

在一些实施例中，所述随机掩膜张量为软值掩膜张量。

在一些实施例中，还包括部署模块；

在一些实施例中，所述部署模块具体用于：

具体地，本公开实施例提供的上述神经网络操作装置，能够实现上述执行主体为电子设备的方法实施例所实现的所有方法步骤，且能够达到相同的技术效果，在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。

本公开实施例还提供一种神经网络操作装置，包括：

获取模块，用于获取预测数据；

本公开实施例提出的神经网络操作装置，仅需训练和部署一个神经网络适应不同输入输出维度要求，该方法训练复杂度低、存储开销低，易于部署和在线训练持续演进。

需要说明的是，本公开上述各实施例中对单元/模块的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。另外，在本公开各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可读取存储介质中。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

在一些实施例中，还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序用于使计算机执行上述各方法实施例提供的神经网络操作方法的步骤。

具体地，本公开实施例提供的上述计算机可读存储介质，能够实现上述各方法实施例所实现的所有方法步骤，且能够达到相同的技术效果，在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。

需要说明的是：所述计算机可读存储介质可以是处理器能够存取的任何可用介质或数据存储设备，包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、EPROM、EEPROM、非易失性存储器(NAND FLASH)、固态硬盘(SSD))等。

另外需要说明的是：本公开实施例中术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换，以便本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施，且“第一”、“第二”所区别的对象通常为一类，并不限定对象的个数，例如第一对象可以是一个，也可以是多个。

本公开实施例中术语“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

本公开实施例中术语“多个”是指两个或两个以上，其它量词与之类似。

本公开实施例提供的技术方案可以适用于多种系统，尤其是5G系统。例如适用的系统可以是全球移动通讯(global system of mobile communication，GSM)系统、码分多址(code division multiple access，CDMA)系统、宽带码分多址(Wideband Code Division Multiple Access，WCDMA)通用分组无线业务(general packet radio service，GPRS)系统、长期演进(long term evolution，LTE)系统、LTE频分双工(frequency division duplex，FDD)系统、LTE时分双工(time division duplex，TDD)系统、高级长期演进(long term evolution advanced，LTE-A)系统、通用移动系统(universal mobile telecommunication system，UMTS)、全球互联微波接入(worldwide interoperability for microwave access，WiMAX)系统、5G新空口(New Radio,NR)系统等。这多种系统中均包括终端设备和网络设备。系统中还可以包括核心网部分，例如演进的分组系统(Evloved Packet System,EPS)、5G系统(5GS)等。

本公开实施例涉及的终端设备，可以是指向用户提供语音和/或数据连通性的设备，具有无线连接功能的手持式设备、或连接到无线调制解调器的其他处理设备等。在不同的系统中，终端设备的名称可能也不相同，例如在5G系统中，终端设备可以称为用户设备(User Equipment，UE)。无线终端设备可以经无线接入网(Radio Access Network,RAN)与一个或多个核心网(Core Network,CN)进行通信，无线终端设备可以是移动终端设备，如移动电话(或称为“蜂窝”电话)和具有移动终端设备的计算机，例如，可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置，它们与无线接入网交换语言和/或数据。例如，个人通信业务(Personal Communication Service，PCS)电话、无绳电话、会话发起协议(Session Initiated Protocol，SIP)话机、无线本地环路(Wireless Local Loop，WLL)站、个人数字助理(Personal Digital Assistant，PDA)等设备。无线终端设备也可以称为系统、订户单元(subscriber unit)、订户站(subscriber station)，移动站(mobile station)、移动台(mobile)、远程站(remote station)、接入点(access point)、远程终端设备(remote terminal)、接入终端设备(access terminal)、用户终端设备(user terminal)、用户代理(user agent)、用户装置(user device)，本公开实施例中并不限定。

本公开实施例涉及的网络设备，可以是基站，该基站可以包括多个为终端提供服务的小区。根据具体应用场合不同，基站又可以称为接入点，或者可以是接入网中在空中接口上通过一个或多个扇区与无线终端设备通信的设备，或者其它名称。网络设备可用于将收到的空中帧与网际协议(Internet Protocol，IP)分组进行相互更换，作为无线终端设备与接入网的其余部分之间的路由器，其中接入网的其余部分可包括网际协议(IP)通信网络。网络设备还可协调对空中接口的属性管理。例如，本公开实施例涉及的网络设备可以是全球移动通信系统(Global System for Mobile communications，GSM)或码分多址接入(Code Division Multiple Access，CDMA)中的网络设备(Base Transceiver Station，BTS)，也可以是带宽码分多址接入(Wide-band Code Division Multiple Access，WCDMA)中的网络设备(NodeB)，还可以是长期演进(long term evolution，LTE)系统中的演进型网络设备(evolutional Node B，eNB或e-NodeB)、5G网络架构(next generation system)中的5G基站(gNB)，也可以是家庭演进基站(Home evolved Node B，HeNB)、中继节点(relay node)、家庭基站(femto)、微微基站(pico)等，本公开实施例中并不限定。在一些网络结构中，网络设备可以包括集中单元(centralized unit，CU)节点和分布单元(distributed unit，DU)节点，集中单元和分布单元也可以地理上分开布置。

网络设备与终端设备之间可以各自使用一或多根天线进行多输入多输出(Multi Input Multi Output,MIMO)传输，MIMO传输可以是单用户MIMO(Single User MIMO,SU-MIMO)或多用户MIMO(Multiple User MIMO,MU-MIMO)。根据根天线组合的形态和数量，MIMO传输可以是2D-MIMO、3D-MIMO、FD-MIMO或massive-MIMO，也可以是分集传输或预编码传输或波束赋形传输等。

本领域内的技术人员应明白，本公开的实施例可提供为方法、系统、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机可执行指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机可执行指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些处理器可执行指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的处理器可读存储器中，使得存储在该处理器可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些处理器可执行指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本公开进行各种改动和变型而不脱离本公开的精神和范围。这样，倘若本公开的这些修改和变型属于本公开权利要求及其等同技术的范围之内，则本公开也意图包含这些改动和变型在内。

Claims

一种神经网络操作方法，其特征在于，包括：

根据可变维度的类型在第一神经网络中设置随机掩膜层，得到第二神经网络；所述随机掩膜层用于对输入至所述随机掩膜层的张量进行随机掩膜处理；

利用样本数据对所述第二神经网络进行训练。
根据权利要求1所述的神经网络操作方法，其特征在于，所述可变维度类型包括以下类型中的一种或多种：

输入维度可变；

输出维度可变；

中间维度可变。
根据权利要求2所述的神经网络操作方法，其特征在于，所述根据可变维度的类型在第一神经网络中设置随机掩膜层，包括：

在所述可变维度的类型为输入维度可变的情况下，在所述第一神经网络的输入层之前设置随机掩膜层。
根据权利要求2所述的神经网络操作方法，其特征在于，所述根据可变维度的类型在第一神经网络中设置随机掩膜层，包括：

在所述可变维度的类型为输出维度可变的情况下，在所述第一神经网络的输出层之后设置随机掩膜层。
根据权利要求2所述的神经网络操作方法，其特征在于，所述根据可变维度的类型在第一神经网络中设置随机掩膜层，包括：

在所述可变维度的类型为中间维度可变的情况下，在所述第一神经网络的中间层设置随机掩膜层。
根据权利要求5所述的神经网络操作方法，其特征在于，所述在所述第一神经网络的中间层设置随机掩膜层，包括：

在只有一个中间维度可变的情况下，在相关联的中间层之前或之后设置一个随机掩膜层。
根据权利要求5所述的神经网络操作方法，其特征在于，所述在所述神经网络的中间层设置随机掩膜层，包括：

在有多个中间维度可变的情况下，在每一相关联的中间层之前或之后分别设置一个随机掩膜层。
根据权利要求1所述的神经网络操作方法，其特征在于，所述利用样本数据对所述第二神经网络进行训练，包括：

在每一样本数据的输入数据的维度均为第一阈值的情况，直接利用所有的样本数据对所述第二神经网络进行训练；所述第一阈值为所有样本数据的输入数据的维度的最大值。
根据权利要求1所述的神经网络操作方法，其特征在于，所述利用样本数据对所述第二神经网络进行训练，包括：

在存在至少一个第一样本数据的情况，先对所述第一样本数据进行增强处理，再利用所有的第一样本数据和所有的第二样本数据对所述第二神经网络进行训练；所述第一样本数据为输入数据的维度不为第一阈值的样本数据；所述第二样本数据为输入数据的维度为所述第一阈值的样本数据；所述第一阈值为所有样本数据的输入数据的维度的最大值。
根据权利要求9所述的神经网络操作方法，其特征在于，所述对所述第一样本数据进行增强处理，包括：

对所述第一样本数据的输入数据进行高位补零。
根据权利要求9所述的神经网络操作方法，其特征在于，所述对所述第一样本数据进行增强处理，包括：

对所述第一样本数据的输入数据进行低位补零。
根据权利要求1所述的神经网络操作方法，其特征在于，所述利用样本数据对所述第二神经网络进行训练，包括：

在存在至少一个第一样本数据的情况，先剔除所述第一样本数据，再利用所有的第二样本数据对所述第二神经网络进行训练；所述第一样本数据为输入数据的维度不为第一阈值的样本数据；所述第二样本数据为输入数据的维度为所述第一阈值的样本数据；所述第一阈值为所有样本数据的输入数据的维度的最大值。
根据权利要求1所述的神经网络操作方法，其特征在于，所述对输入至所述随机掩膜层的张量进行随机掩膜处理，包括：

确定输入至所述随机掩膜层的张量以及随机掩膜张量；

利用所述随机掩膜张量对输入至所述随机掩膜层的张量进行随机掩膜处理。
根据权利要求13所述的神经网络操作方法，其特征在于，所述对输入至所述随机掩膜层的张量进行随机掩膜处理的表达式如下：

其中，
表示随机掩膜层输出的张量，X表示输入至随机掩膜层的张量，
表示张量逐位点乘运算，M表示随机掩膜张量。
根据权利要求13所述的神经网络操作方法，其特征在于，所述随机掩膜张量为硬值掩膜张量。
根据权利要求13所述的神经网络操作方法，其特征在于，所述随机掩膜张量为软值掩膜张量。
根据权利要求13所述的神经网络操作方法，其特征在于，所述随机掩膜张量由硬值掩膜张量和软值掩膜张量组合而成。
根据权利要求1所述的神经网络操作方法，其特征在于，所述利用样本数据对所述第二神经网络进行训练之后，还包括：

将经过训练后的第二神经网络中的随机掩膜层更新为张量变换层；所述张量变换层用于对输入至所述张量变换层的张量进行维度变换。
根据权利要求18所述的神经网络操作方法，其特征在于，所述将经过训练后的第二神经网络中的随机掩膜层更新为张量变换层，包括：

在经过训练后的第二神经网络的输入层之前存在随机掩膜层的情况下，将经过训练后的第二神经网络的输入层之前的随机掩膜层更新为张量填充层；所述张量填充层用于将输入至所述张量填充层的张量的维度增大到第一阈值；所述第一阈值为所有样本数据的输入数据的维度的最大值。
根据权利要求18所述的神经网络操作方法，其特征在于，所述将经过训练后的第二神经网络中的随机掩膜层更新为张量变换层，包括：

在经过训练后的第二神经网络的输出层之后存在随机掩膜层的情况下，将经过训练后的第二神经网络的输出层之后的随机掩膜层更新为张量裁剪层；所述张量裁剪层用于将输入至所述张量裁剪层的张量的维度减小到第一目标值。
根据权利要求18所述的神经网络操作方法，其特征在于，所述将经过训练后的第二神经网络中的随机掩膜层更新为张量变换层，包括：

在经过训练后的第二神经网络的中间层存在随机掩膜层的情况下，将经过训练后的第二神经网络的中间层的随机掩膜层更新为张量裁剪级联张量填充层；所述张量裁剪级联张量填充层用于将输入至所述张量裁剪级联张量填充层的张量的维度先减小到第二目标值，再增大到原来的维度。
一种电子设备，其特征在于，包括存储器，收发机，处理器；

存储器，用于存储计算机程序；收发机，用于在所述处理器的控制下收发数据；处理器，用于读取所述存储器中的计算机程序并执行以下操作：

根据可变维度的类型在第一神经网络中设置随机掩膜层，得到第二神经网络；所述随机掩膜层用于对输入至所述随机掩膜层的张量进行随机掩膜处理；

利用样本数据对所述第二神经网络进行训练。
根据权利要求22所述的电子设备，其特征在于，所述可变维度类型包括以下类型中的一种或多种：

输入维度可变；

输出维度可变；

中间维度可变。
根据权利要求23所述电子设备，其特征在于，所述根据可变维度的类型在第一神经网络中设置随机掩膜层，包括：

在所述可变维度的类型为输入维度可变的情况下，在所述第一神经网络的输入层之前设置随机掩膜层。
根据权利要求23所述电子设备，其特征在于，所述根据可变维度的类型在第一神经网络中设置随机掩膜层，包括：

在所述可变维度的类型为输出维度可变的情况下，在所述第一神经网络的输出层之后设置随机掩膜层。
根据权利要求23所述电子设备，其特征在于，所述根据可变维度的类型在第一神经网络中设置随机掩膜层，包括：

在所述可变维度的类型为中间维度可变的情况下，在所述第一神经网络的中间层设置随机掩膜层。
根据权利要求26所述的电子设备，其特征在于，所述在所述第一神经网络的中间层设置随机掩膜层，包括：

在只有一个中间维度可变的情况下，在相关联的中间层之前或之后设置一个随机掩膜层。
根据权利要求26所述的电子设备，其特征在于，所述在所述神经网络的中间层设置随机掩膜层，包括：

在有多个中间维度可变的情况下，在每一相关联的中间层之前或之后分别设置一个随机掩膜层。
根据权利要求22所述的电子设备，其特征在于，所述利用样本数据对所述第二神经网络进行训练，包括：

在每一样本数据的输入数据的维度均为第一阈值的情况，直接利用所有的样本数据对所述第二神经网络进行训练；所述第一阈值为所有样本数据的输入数据的维度的最大值。
根据权利要求22所述的电子设备，其特征在于，所述利用样本数据对所述第二神经网络进行训练，包括：

在存在至少一个第一样本数据的情况，先对所述第一样本数据进行增强处理，再利用所有的第一样本数据和所有的第二样本数据对所述第二神经网络进行训练；所述第一样本数据为输入数据的维度不为第一阈值的样本数据；所述第二样本数据为输入数据的维度为所述第一阈值的样本数据；所述第一阈值为所有样本数据的输入数据的维度的最大值。
根据权利要求30所述的电子设备，其特征在于，所述对所述第一样本数据进行增强处理，包括：

对所述第一样本数据的输入数据进行高位补零。
根据权利要求30所述的电子设备，其特征在于，所述对所述第一样本数据进行增强处理，包括：

对所述第一样本数据的输入数据进行低位补零。
根据权利要求22所述的电子设备，其特征在于，所述利用样本数据对所述第二神经网络进行训练，包括：

在存在至少一个第一样本数据的情况，先剔除所述第一样本数据，再利用所有的第二样本数据对所述第二神经网络进行训练；所述第一样本数据为输入数据的维度不为第一阈值的样本数据；所述第二样本数据为输入数据的维度为所述第一阈值的样本数据；所述第一阈值为所有样本数据的输入数据的维度的最大值。
根据权利要求22所述的电子设备，其特征在于，所述对输入至所述随机掩膜层的张量进行随机掩膜处理，包括：

确定输入至所述随机掩膜层的张量以及随机掩膜张量；

利用所述随机掩膜张量对输入至所述随机掩膜层的张量进行随机掩膜处理。
根据权利要求34所述的电子设备，其特征在于，所述对输入至所述随机掩膜层的张量进行随机掩膜处理的表达式如下：

其中，
表示随机掩膜层输出的张量，X表示输入至随机掩膜层的张量，
表示张量逐位点乘运算，M表示随机掩膜张量。
根据权利要求34所述的电子设备，其特征在于，所述随机掩膜张量为硬值掩膜张量。
根据权利要求34所述的电子设备，其特征在于，所述随机掩膜张量为软值掩膜张量。
根据权利要求34所述的电子设备，其特征在于，所述随机掩膜张量由硬值掩膜张量和软值掩膜张量组合而成。
根据权利要求22所述的电子设备，其特征在于，所述利用样本数据对所述第二神经网络进行训练之后，还包括：

将经过训练后的第二神经网络中的随机掩膜层更新为张量变换层；所述张量变换层用于对输入至所述张量变换层的张量进行维度变换。
根据权利要求39所述的电子设备，其特征在于，所述将经过训练后的第二神经网络中的随机掩膜层更新为张量变换层，包括：

在经过训练后的第二神经网络的输入层之前存在随机掩膜层的情况下，将经过训练后的第二神经网络的输入层之前的随机掩膜层更新为张量填充层；所述张量填充层用于将输入至所述张量填充层的张量的维度增大到第一阈值；所述第一阈值为所有样本数据的输入数据的维度的最大值。
根据权利要求39所述的电子设备，其特征在于，所述将经过训练后的第二神经网络中的随机掩膜层更新为张量变换层，包括：

在经过训练后的第二神经网络的输出层之后存在随机掩膜层的情况下，将经过训练后的第二神经网络的输出层之后的随机掩膜层更新为张量裁剪层；所述张量裁剪层用于将输入至所述张量裁剪层的张量的维度减小到第一目标值。
根据权利要求39所述的电子设备，其特征在于，所述将经过训练后的第二神经网络中的随机掩膜层更新为张量变换层，包括：

在经过训练后的第二神经网络的中间层存在随机掩膜层的情况下，将经过训练后的第二神经网络的中间层的随机掩膜层更新为张量裁剪级联张量填充层；所述张量裁剪级联张量填充层用于将输入至所述张量裁剪级联张量填充层的张量的维度先减小到第二目标值，再增大到原来的维度。
一种神经网络操作方法，其特征在于，包括：

获取预测数据；

将所述预测数据输入至部署好的目标神经网络，得到所述目标神经网络输出的预测结果；其中，所述目标神经网络包括至少一个张量变换层，所述张量变换层用于对输入至所述张量变换层的张量进行维度变换。
根据权利要求43所述的神经网络操作方法，其特征在于，所述目标神经网络为权利要求1至21中的任一项所述的第二神经网络。
一种电子设备，其特征在于，包括存储器，收发机，处理器；

存储器，用于存储计算机程序；收发机，用于在所述处理器的控制下收发数据；处理器，用于读取所述存储器中的计算机程序并执行以下操作：

获取预测数据；

将所述预测数据输入至部署好的目标神经网络，得到所述目标神经网络输出的预测结果；其中，所述目标神经网络包括至少一个张量变换层，所述张量变换层用于对输入至所述张量变换层的张量进行维度变换。
根据权利要求45所述的电子设备，其特征在于，所述目标神经网络为权利要求1至21中的任一项所述的第二神经网络。
一种神经网络操作装置，其特征在于，包括：

添加模块，用于根据可变维度的类型在第一神经网络中设置随机掩膜层，得到第二神经网络；所述随机掩膜层用于对输入至所述随机掩膜层的张量进行随机掩膜处理；

训练模块，用于利用样本数据对所述第二神经网络进行训练。
根据权利要求47所述的神经网络操作装置，其特征在于，所述可变维度类型包括以下类型中的一种或多种：

输入维度可变；

输出维度可变；

中间维度可变。
根据权利要求48所述的神经网络操作装置，其特征在于，所述添加模块具体用于：

在所述可变维度的类型为输入维度可变的情况下，在所述第一神经网络的输入层之前添加随机掩膜层。
根据权利要求48所述的神经网络操作装置，其特征在于，所述添加模块具体用于：

在所述可变维度的类型为输出维度可变的情况下，在所述第一神经网络的输出层之后添加随机掩膜层。
根据权利要求48所述的神经网络操作装置，其特征在于，所述添加模块具体用于：

在所述可变维度的类型为中间维度可变的情况下，在所述第一神经网络的中间层添加随机掩膜层。
根据权利要求51所述的神经网络操作装置，其特征在于，所述添加模块具体用于：

在只有一个中间维度可变的情况下，在相关联的中间层之前或之后添加一个随机掩膜层。
根据权利要求51所述的神经网络操作装置，其特征在于，所述添加模块具体用于：

在有多个中间维度可变的情况下，在每一相关联的中间层之前或之后分别添加一个随机掩膜层。
根据权利要求47所述的神经网络操作装置，其特征在于，所述训练模块具体用于：

在每一样本数据的输入数据的维度均为第一阈值的情况，直接利用所有的样本数据对所述第二神经网络进行训练；所述第一阈值为所有样本数据的输入数据的维度的最大值。
根据权利要求47所述的神经网络操作装置，其特征在于，所述训练模块具体用于：

在存在至少一个第一样本数据的情况，先对所述第一样本数据进行增强处理，再利用所有的第一样本数据和所有的第二样本数据对所述第二神经网络进行训练；所述第一样本数据为输入数据的维度不为第一阈值的样本数据；所述第二样本数据为输入数据的维度为所述第一阈值的样本数据；所述第一阈值为所有样本数据的输入数据的维度的最大值。
根据权利要求55所述的神经网络操作装置，其特征在于，所述训练模块具体用于：

对所述第一样本数据的输入数据进行高位补零。
根据权利要求55所述的神经网络操作装置，其特征在于，所述训练模块具体用于：

对所述第一样本数据的输入数据进行低位补零。
根据权利要求47所述的神经网络操作装置，其特征在于，所述训练模块具体用于：

在存在至少一个第一样本数据的情况，先剔除所述第一样本数据，再利用所有的第二样本数据对所述第二神经网络进行训练；所述第一样本数据为输入数据的维度不为第一阈值的样本数据；所述第二样本数据为输入数据的维度为所述第一阈值的样本数据；所述第一阈值为所有样本数据的输入数据的维度的最大值。
根据权利要求47所述的神经网络操作装置，其特征在于，所述训练模块具体用于：

确定输入至所述随机掩膜层的张量以及随机掩膜张量；

利用所述随机掩膜张量对输入至所述随机掩膜层的张量进行随机掩膜处理。
根据权利要求59所述的神经网络操作装置，其特征在于，所述对输入至所述随机掩膜层的张量进行随机掩膜处理的表达式如下：

其中，
表示随机掩膜层输出的张量，X表示输入至随机掩膜层的张量，
表示张量逐位点乘运算，M表示随机掩膜张量。
根据权利要求59所述的神经网络操作装置，其特征在于，所述随机掩膜张量为硬值掩膜张量。
根据权利要求59所述的神经网络操作装置，其特征在于，所述随机掩膜张量为软值掩膜张量。
根据权利要求59所述的神经网络操作装置，其特征在于，所述随机掩膜张量由硬值掩膜张量和软值掩膜张量组合而成。
根据权利要求47所述的神经网络操作装置，其特征在于，还包括部署模块；

所述部署模块用于将经过训练后的第二神经网络中的随机掩膜层替换为张量变换层；所述张量变换层用于对输入至所述张量变换层的张量进行维度变换。
根据权利要求64所述的神经网络操作装置，其特征在于，所述部署模块具体用于：

在经过训练后的第二神经网络的输入层之前存在随机掩膜层的情况下，将经过训练后的第二神经网络的输入层之前的随机掩膜层替换为张量填充层；所述张量填充层用于将输入至所述张量填充层的张量的维度增大到第一阈值；所述第一阈值为所有样本数据的输入数据的维度的最大值。
根据权利要求64所述的神经网络操作装置，其特征在于，所述部署模块具体用于：

在经过训练后的第二神经网络的输出层之后存在随机掩膜层的情况下，将经过训练后的第二神经网络的输出层之后的随机掩膜层替换为张量裁剪层；所述张量裁剪层用于将输入至所述张量裁剪层的张量的维度减小到第一目标值。
根据权利要求64所述的神经网络操作装置，其特征在于，所述部署模块具体用于：

在经过训练后的第二神经网络的中间层存在随机掩膜层的情况下，将经过训练后的第二神经网络的中间层的随机掩膜层替换为张量裁剪级联张量填充层；所述张量裁剪级联张量填充层用于将输入至所述张量裁剪级联张量填充层的张量的维度先减小到第二目标值，再增大到原来的维度。
一种神经网络操作装置，其特征在于，包括：

获取模块，用于获取预测数据；

处理模块，用于将所述预测数据输入至部署好的目标神经网络，得到所述目标神经网络输出的预测结果；其中，所述目标神经网络包括至少一个张量变换层，所述张量变换层用于对输入至所述张量变换层的张量进行维度变换。
根据权利要求68所述的神经网络操作装置，其特征在于，所述目标神经网络为权利要求47至67中的任一项所述的第二神经网络。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序用于使计算机执行权利要求1至21中的任一项所述的神经网络操作方法，或者权利要求43至44中的任一项所述的神经网络操作方法。