WO2021169160A1

WO2021169160A1 - 图像归一化处理方法及装置、存储介质

Info

Publication number: WO2021169160A1
Application number: PCT/CN2020/103575
Authority: WO
Inventors: 张瑞茂; 彭章琳; 吴凌云; 罗平
Original assignee: 深圳市商汤科技有限公司
Priority date: 2020-02-27
Filing date: 2020-07-22
Publication date: 2021-09-02
Also published as: TWI751668B; CN111325222A; TW202133032A; US20220415007A1

Abstract

本公开提供了一种图像归一化处理方法，其中，该方法包括：采用K个归一化因子，分别对特征图进行归一化处理，获得与所述K个归一化因子各自对应的备选归一化特征图，其中K是大于1的整数；确定所述K个归一化因子中各个归一化因子的第一权重值；根据所述K个归一化因子各自对应的备选归一化特征图和所述第一权重值，确定与所述特征图对应的目标归一化特征图。

Description

图像归一化处理方法及装置、存储介质

相关申请的交叉引用

本专利申请要求于2020年2月27日提交的、申请号为202010123511.8、发明名称为“图像归一化处理方法及装置、存储介质”的中国专利申请的优先权，该申请的全文以引用的方式并入本文中。

技术领域

本公开涉及深度学习领域，尤其涉及一种图像归一化处理方法及装置、存储介质。

背景技术

在自然语言处理、语音识别、计算机视觉等任务中，各种归一化(Normalization)技术成为深度学习所必不可少的模块。归一化技术通常在输入张量的不同维度进行统计量的计算，从而让不同的归一化方法适用于不同的视觉任务。

发明内容

本公开提供了一种图像归一化处理方法及装置、存储介质。

根据本公开实施例的第一方面，提供一种图像归一化处理方法，所述方法包括：采用K个归一化因子，分别对特征图进行归一化处理，获得与所述K个归一化因子各自对应的备选归一化特征图，其中K是大于1的整数；确定所述K个归一化因子中各个归一化因子的第一权重值；根据所述K个归一化因子各自对应的备选归一化特征图和所述第一权重值，确定与所述特征图对应的目标归一化特征图。

根据本公开实施例的第二方面，提供一种图像归一化处理装置，所述装置包括：归一化处理模块，用于采用K个归一化因子，分别对特征图进行归一化处理，获得与所述K个归一化因子各自对应的备选归一化特征图，其中K是大于1的整数；第一确定模块，用于确定所述K个归一化因子中各个归一化因子的第一权重值；第二确定模块，用于根据所述K个归一化因子各自对应的备选归一化特征图和所述第一权重值，确定与所述特征图对应的目标归一化特征图。

根据本公开实施例的第三方面，提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，当处理器调用所述计算机程序时，所述处理器用于执行上述第一方面所述的图像归一化处理方法。

根据本公开实施例的第四方面，提供一种电子设备，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为调用所述存储器中存储的可执行指令，实现第一方面所述的图像归一化处理方法。

根据本公开实施例的第五方面，提供一种计算机程序产品，所述计算机程序产品中存储有计算机可读指令，当所述计算机可读指令被处理器执行时实现第一方面所述的图像归一化处理方法。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1是本公开根据一示例性实施例示出的一种图像归一化处理方法流程图；

图2是本公开根据一示例性实施例示出的步骤120的流程图；

图3是本公开根据一示例性实施例示出的步骤121的流程图；

图4是本公开根据一示例性实施例示出的步骤122的流程图；

图5是本公开根据一示例性实施例示出的步骤123的流程图；

图6是本公开根据一示例性实施例示出的步骤130的流程图；

图7是本公开根据一示例性实施例示出的一种图像归一化处理架构框图；

图8是本公开根据一示例性实施例示出的一种图像归一化处理装置框图；

图9是本公开根据一示例性实施例示出的一种电子设备的硬件结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

在本公开使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本公开。在本公开和所附权利要求书中所运行的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本公开可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本公开范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

可选择归一化(Switchable Normalization，SN)方法可以面向每个卷积层，自适应地将不同的归一化算子进行线性组合，使得深度神经网络中每一层都能优化出各自独立的归一化方法，适用于各种视觉任务。然而，SN虽然可以对不同的网络结构、不同的数据集学习不同的归一化参数，但是并不能根据样本特征的变化，动态地调整归一化参数。限制了归一化的灵活性，无法获得更优的深度神经网络。

本公开实施例提供了一种图像归一化处理方法，可以适用于不同的网络模型和视觉任务，根据特征图自适应性地确定不同的归一化因子的第一权重值，提高了归一化算法的灵活性。在图像处理领域，可以对图像内容进行识别从而输出对应的结果，具体可以但不限于表现为图像识别、目标检测、目标分割等技术。识别图像内容通常可以是先提取图像中的图像特征，再根据提取的特征输出识别结果。例如，在进行人脸识别的时候，可以提取图像中的人脸特征，根据提取的人脸特征识别人脸的属性。可理解的是，本公开实施例提供的图像归一化方法可以应用于图像处理领域。

例如图1所示，图1是根据一示例性实施例示出的一种图像归一化处理方法，该方法包括以下步骤110-130：

在步骤110中，采用不同的归一化因子，分别对特征图进行归一化处理，获得与各个归一化因子对应的备选归一化特征图。在一些实施例中，采用K个归一化因子，分别对特征图进行归一化处理，获得与K个归一化因子各自对应的备选归一化特征图。其中K是大于1的整数。

在本公开实施例中，可以先获取待处理图像对应的特征图，其中，待处理图像可以是任意一张需要进行归一化处理的图像。通过对待处理图像提取不同维度的图像特征，可以得到该待处理图像对应的特征图，特征图的数目可以为N，N为正整数。

其中，图像特征可以包括图像中的颜色特征、纹理特征、形状特征等。颜色特征是一种全局特征，描述了图像所对应的对象的表面颜色属性，纹理特征也是一种全局特征，它描述了图像所对应对象的表面纹理属性，形状特征有两类表示方法，一类是轮廓特征，另一类是区域特征，图像的轮廓特征主要针对对象的外边界，而图像的区域特征则关系到图像区域的形状。

在本公开实施例中，可以通过预先训练好的神经网络，来提取待处理图像的图像特征。该神经网络可以包括但不限于VGG Net(Visual Geometry Group Network，视觉几何群网络)、GoogleNet(Google Network，谷歌网络)等。还可以是通过其他方法来提取待处理图像的图像特征，在此不做具体限定。

在本公开实施例中，不同的归一化因子是指不同的归一化处理方法，包括但不限于批归一化(BatchNormalization，BN)方法，层归一化(LayerNormalization，LN)方法，实例归一化(InstanceNormalization，IN)方法，组归一化(GroupNormalization，GN)方法。

在采用所述不同的归一化因子，分别对特征图进行归一化处理之前，先分别确定各个归一化因子对应的统计量Ω，其中，统计量Ω可以包括方差和/或均值。这里的统计量Ω是与归一化因子相对应的，即每个归一化因子对应一个或一组统计量Ω。

进一步地，采用不同的统计量Ω，分别对特征图进行归一化处理，得到与各个归一化因子对应的备选归一化特征图。

例如，特征图的数目为N张，归一化因子的总数目为K，则可以得到N组备选归一化特征图，每组备选归一化特征图中包括K张备选归一化特征图。

在步骤120中，确定各个归一化因子的第一权重值。

在本公开实施例中，可以根据特征图，自适应地确定与特征图对应的每个归一化因子的第一权重值。

其中，归一化因子的第一权重值用于表示采用该归一化因子对特征图进行归一化处理后，得到的备选归一化特征图占K个备选归一化特征图的比重。在本公开实施例中，可以采用K个归一化因子，确定特征图对应的K个第一特征向量，根据这K个第一特征向量之间的相关性，得到各个归一化因子的第一权重值。

在步骤130中，根据各个归一化因子对应的备选归一化特征图和各个归一化因子的所述第一权重值，确定与所述特征图对应的目标归一化特征图。

在本公开实施例中，针对各个备选归一化特征图，将该备选归一化特征图和该备选归一化特征图对应的归一化因子的第一权重值相乘，得到与该备选归一化特征图对应的第一归一化特征图；结合该备选归一化特征图对应的归一化因子的第二权重值对该第一归一化特征图进行尺寸的调整，得到与该备选归一化特征图对应的第二归一化特征图；结合该备选归一化特征图对应的归一化因子的目标偏移值对该第二归一化特征图进行移动，得到与该备选归一化特征图对应的第三归一化特征图。最终将各个第三归一化特征图相加，就可以得到特征图对应的目标归一化特征图。

其中，第二权重值用于调整第一归一化特征图的尺寸，通过对第一归一化特征图进行缩小或放大，使得缩放后的第二归一化特征图符合目标归一化特征图所对应的尺寸需求。第二权重值可以在神经网络的训练过程中，根据样本图像的尺寸、神经网络最终需要输出的归一化特征图的尺寸来确定，一旦神经网络训练完成，第二权重值针对同一归一化因子保持不变。

目标偏移值用来移动第二归一化特征图，使得移动后得到的第三归一化特征图的位置上下重叠，便于后续对第三归一化特征图进行相加。目标偏移值同样可以在神经网络的训练过程中，根据样本图像的尺寸、神经网络最终需要输出的归一化特征图的尺寸来确定，一旦神经网络训练完成，目标偏移值针对同一归一化因子保持不变。

另外，在本公开实施例中，目标归一化特征图的数目与特征图的数目相同。

例如，特征图的数目为N，最终得到的目标归一化特征图的数目也为N。

上述实施例中，可以采用不同的归一化因子，分别对特征图进行归一化处理，从而得到与各个归一化因子对应的备选归一化特征图。根据与各个归一化因子对应的备选归一化特征图和各个归一化因子的第一权重值，确定与特征图对应的目标归一化特征图。从而实现了根据特征图，自适应性地确定不同的归一化因子的第一权重值的目的，提高了归一化算法的灵活性。

在一些实施例中，可以用以下公式(1)确定各个归一化因子的第一权重值：

其中，X _n表示第n张特征图，

表示第n张特征图对应的第k个归一化因子的第一权重值，k表示1至K中的任一整数，K表示归一化因子的总数目，Ω ^k表示基于第k个归一化因子计算得到的的统计量，包括均值μ ^k和/或方差σ ^k，F(.)表示用于计算第k个归一化因子的第一权重值的函数，θ表示可学习参数。

在一些实施例中，特征图的数目为多个时，每张特征图的处理方式一致，为了便于描述，可以忽略公式1中的n，特征图可以仅用其中一张特征图X来表示，即在本公开下面的实施例中，需要确定与特征图X对应的各个归一化因子的第一权重值。

例如图2所示，步骤120可以包括121-123：

在步骤121中，针对各个归一化因子，确定与该归一化因子对应的第一特征向量。

在本公开实施例中，可以对特征图进行下采样，获得与各个归一化因子对应的第二特征向量x。采用该归一化因子，确定该归一化因子对应的统计量Ω，根据该统计量Ω对与该归一化因子对应的第二特征向量x进行归一化处理，获得与该归一化因子对应的第三特征向量

其中第三特征向量的数目为K。对第三特征向量

进行降维处理后，获得第一特征向量z，其中，第一特征向量的数目也为K。

在步骤122中，根据与各个归一化因子对应的第一特征向量之间的相关性，确定相关性矩阵。

在本公开实施例中，可以根据每个第一特征向量z和每个第一特征向量z对应的转置向量z ^T之间的乘积，来描述多个第一特征向量之间的相关性，从而确定相关性矩阵v。

在步骤123中，根据所述相关性矩阵，确定各个归一化因子的所述第一权重值。

在本公开实施例中，可以将相关性矩阵v依次通过第一全连接网络、tanh(双曲正切)变化和第二全连接网络，转换为备选向量，再对该备选向量进行归一化之后得到目标向量λ。根据目标向量λ，得到各个归一化因子的所述第一权重值。

上述实施例中，可以根据各个归一化因子，先确定与各个归一化因子对应的第一特征向量，再确定各个第一特征向量之间的相关性，进而确定出各个归一化因子的第一权重值，实现简便，可用性高。

在一些实施例中，例如图3所示，步骤121可以包括1211-1213：

在步骤1211中，对所述特征图进行下采样，获得与所述特征图对应的第二特征向量。

在本公开实施例中，可以通过平均池化或最大池化的方法对特征图进行下采样，从而得到与特征图对应的K个第二特征向量。在本公开中，通过X _n表示第n张特征图，每张特征图的处理方式一致，为了便于描述，忽略n，特征图可以仅用X来表示。在进行下采样之后，可以得到与特征图对应的K个第二特征向量x。其中，x是C维的，C是特征图的通道数目。

在步骤1212中，针对各个归一化因子，采用该归一化因子，对与该归一化因子对应的第二特征向量进行归一化处理，获得第三特征向量。

在本公开实施例中，可以基于各个归一化因子，计算与该归一化因子对应的统计量Ω，其中，Ω包括均值和/或方差。在本公开实施例中，Ω可以同时包括方差和均值。

根据统计量Ω，分别对第二特征向量x进行归一化处理，得到K个第三特征向量

其中，

也是C维的。

在步骤1213中，对所述第三特征向量进行降维处理，获得与该归一化因子对应的第一特征向量。

在本公开实施例中，在进行降维处理时，可以采用卷积方式，为了减少降维处理的计算开销，可以采用分组卷积的方式，将特征图对应的通道数目C与预设超参数r的商作为所述分组数目，例如，特征图X对应的通道数目为C，预设超参数为r，则分组数目为C/r。这样可以确保整个降维处理的过程中的参数量恒定为C，获得K个第一特征向量z，第一特征向量z是C/r维的。

上述实施例中，对特征图进行下采样后，获得对应的K个第二特征向量。采用K个归一化因子，分别对这K个第二特征向量进行归一化处理，获得K个第三特征向量，再对这K个第三特征向量进行降维处理，获得K个第一特征向量。便于后续确定不同的归一化因子的第一权重值，可用性高。

在一些实施例中，例如图4所示，步骤122可以包括1221-1222：

在步骤1221中，确定每个第一特征向量对应的转置向量。

在本公开实施例中，可以为每个第一特征向量z确定对应的转置向量z ^T。

在步骤1222中，针对每个第一特征向量，将该第一特征向量和各个转置向量相乘，获得所述相关性矩阵。

在本公开实施例中，任意一个第一特征向量z与任意一个转置向量z ^T相乘，最终可以得到相关性矩阵v。其中，v是K×K维的。在一些实施例中，以K＝5、C/r＝3为例，确定第一特征向量1[a ₁，a ₂，a ₃]对应的第一转置向量，确定第一特征向量2[b ₁，b ₂，b ₃]对应的第二转置向量，确定第一特征向量3[c ₁，c ₂，c ₃]对应的第三转置向量，确定第一特征向量4[d ₁，d ₂，d ₃]对应的第四转置向量，确定第一特征向量5[e ₁，e ₂，e ₃]对应的第五转置向量；第一特征向量1与第一转置向量、第二转置向量、第三转置向量、第四转置向量和第五转置向量分别相乘，得到相关性矩阵的第一行中的元素；第一特征向量2与第一转置向量、第二转置向量、第三转置向量、第四转置向量和第五转置向量分别相乘，得到相关性矩阵的第二行中的元素；第一特征向量3与第一转置向量、第二转置向量、第三转置向量、第四转置向量和第五转置向量分别相乘，得到相关性矩阵的第三行中的元素；第一特征向量4与第一转置向量、第二转置向量、第三转置向量、第四转置向量和第五转置向量分别相乘，得到相关性矩阵的第四行中的元素；第一特征向量5与第一转置向量、第二转置向量、第三转置向量、第四转置向量和第五转置向量分别相乘，得到相关性矩阵的第五行中的元素。这样，得到了K×K维的相关性矩阵。

上述实施例中，针对各个第一特征向量，利用该第一特征向量和各个转置向量的乘积来描述多个第一特征向量之间的相关性，从而得到相关性矩阵，便于后续确定不同的归一化因子的第一权重值，可用性高。

在一些实施例中，例如图5所示，步骤123可以包括1231-1233：

在步骤1231中，依次通过第一全连接网络、双曲正切变换和第二全连接网络，将所述相关性矩阵转换为备选向量。

在本公开实施例中，相关性矩阵v的维度为K×K，可以先将相关性矩阵v输入第一全连接网络，其中，全连接网络是指由全连接层组成的神经网络，该神经网络中每一层的每一个结点都与相邻网络层的每一个结点相连。再通过tanh(双曲正切)变化将相关性矩阵v的维度从K×K转换为πK，其中π是预设超参数，可以选取任意正整数值，例如50。

进一步地，可以再通过第二全连接网络将维度由πK转换为K，获得K维的备选向量。

在步骤1232中，对所述备选向量中的值进行归一化处理，获得归一化处理后的目标向量。

在本公开实施例中，可以通过归一化函数，例如softmax函数，将K维的备选向量中的值进行归一化处理，确保

从而获得归一化处理后的K维的目标向量λ。在本公开实施例中，在确定一张特征图对应的目标归一化特征图时，λ _k与λ ^k可互换使用。

在步骤1233中，根据所述目标向量，确定各个归一化因子的所述第一权重值。

本公开实施例中，目标向量λ＝[λ ₁，λ ₂，...，λ _k] ^T是K维的，可以将目标向量中第k个维度的值作为与第k个归一化因子的所述第一权重值。

上述实施例中，可以依次通过第一全连接网络、双曲正切变换和第二全连接网络，将所述相关性矩阵的维度转换为备选向量，然后对备选向量中的值进行归一化处理，获得归一化处理后的目标向量，再根据目标向量，就可以确定不同的归一化因子的第一权重值，可用性高。

在一些实施例中，例如图6所示，上述步骤130可以包括131-134：

在步骤131中，针对各个归一化因子，将与该归一化因子对应的备选归一化特征图与该归一化因子的所述第一权重值相乘，获得与该归一化因子对应的第一归一化特征图。

在本公开实施例中，每个归一化因子分别对特征图进行归一化处理，得到与该归一化因子对应的备选归一化特征图，将备选归一化特征图与对应的归一化因子的第一权重值相乘，得到第一归一化特征图。

在步骤132中，针对各个所述归一化因子，根据与该归一化因子对应的第二权重值，调整与该归一化因子对应的第一归一化特征图的尺寸，获得与该归一化因子对应的第二归一化特征图。

在本公开实施例中，第二权重值在神经网络训练完成后，针对同一归一化因子是保持不变的。可以通过与该归一化因子对应的第二权重值与对应的第一归一化特征图相乘，来对该对应的第一归一化特征图进行尺寸的调整，从而获得第二归一化特征图。第二归一化特征图的尺寸符合最终的目标归一化特征图所需要的尺寸。

在步骤133中，针对各个所述归一化因子，根据与该归一化因子对应的目标偏移值，移动与该归一化因子对应的第二归一化特征图，获得与该归一化因子对应的第三归一化特征图。

在本公开实施例中，目标偏移值在神经网络训练完成后，针对同一归一化因子是保持不变的。可以通过与该归一化因子对应的目标偏移值与对应的第二归一化特征图相加，来对该对应的第二归一化特征图进行移动，从而获得第三归一化特征图。各个归一化因子对应的第三归一化特征图的位置上下重叠。

在步骤134中，将所述K个第三归一化特征图相加后，获得与所述特征图对应的目标归一化特征图。

在本公开实施例中，各个第三归一化特征图的位置是上下重叠的，对各个第三归一化特征图中同一位置的像素值进行相加，最终可以得到与特征图X对应的目标归一化特征图

在本公开实施例中，步骤103可以通过以下公式(2)表示：

其中，

表示特征图X对应的目标归一化特征图。λ _k表示第k个归一化因子的第一权重值。μ ^k表示第k个归一化因子对应的统计量Ω ^k中的均值。σ ^k表示第k个归一化因子对应的统计量Ω ^k中的方差。ε是为了避免方差为零时，公式2中的分母取值也为零的一个预设值。γ ^k表示第k个归一化因子对应的第二权重值，相当于比例参数，用于缩放第一归一化特征图。β ^k表示第k个归一化因子对应的目标偏移值，相当于偏移参数，用于移动第二归一化特征图。通过γ ^k和β ^k可以得到最终符合尺寸需求的目标归一化特征图

通过公式(2)可以看出，均值μ ^k和方差σ ^k采用相同的权重值。如果待处理图像是训练过程中的样本图像，那么可以避免均值和方差采用不同的权重值导致的过拟合现象。在本公开实施例中，通过不同的归一化因子对应的权重值将各个备选归一化特征图进行线性组合，而不是采用不同的归一化因子对各个备选归一化特征图进行线性组合，使得归一化算法更加灵活，可用性更高。

另外，在本公开实施例中，为了获得更加优化的目标归一化特征图，针对每个归一化因子引入第二权重值和目标偏移值。其中，第二权重值和目标偏移值可以在神经网络的归一化层训练过程中得到，训练完成后针对同一归一化因子保持不变。

上述实施例中，针对各个归一化因子，将该归一化因子对应的备选归一化特征图与该归一化因子的所述第一权重值相乘，获得与该归一化因子对应的第一归一化特征图；通过与该归一化因子对应的第二权重值和目标偏移值，对与该归一化因子对应的第一归一化特征图进行尺寸的调整和移动；将尺寸调整和移动后的第三归一化特征图相加，获得与所述特征图对应的目标归一化特征图。从而根据不同的归一化因子，灵活地确定出特征图对应的目标归一化特征图，在实际应用时可以替换各种神经网络中的任意归一化层，易于实现与优化。

在一些实施例中，例如图7所示，提供了一种图像归一化处理过程的框架图。

针对特征图X，可以采用归一化因子k计算出该归一化因子k对应的统计量Ω ^k，统计量Ω ^k包括均值μ ^k和方差σ ^k，基于统计量Ω ¹，Ω ²，...Ω ^k，...Ω ^K，分别对特征图X进行归一化处理，可以得到K个备选归一化特征图。

另外，通过平均池化或最大池化的方法对特征图X进行下采样，获得与特征图X对应的K个第二特征向量x。根据统计量Ω ¹，Ω ²，...Ω ^k，...Ω ^K分别对第二特征向量x进行归一化处理，获得K个第三特征向量

通过分组卷积，对K个第三特征向量

进行降维处理后，获得与特征图X对应的K个第一特征向量z。

可以确定每个第一特征向量z对应的转置向量z ^T。任意一个第一特征向量z与任意一个转置向量z ^T相乘，可以用来描述多个第一特征向量之间的相关性，最终得到相关性矩阵v。其中，v是K×K维的。

将相关性矩阵v输入第一全连接网络，再通过tanh变化将相关性矩阵v的维度从K×K转换为πK，其中π是预设超参数，可以选取任意正整数值，例如50。进一步地，可以再通过第二全连接网络将维度由πK转换为K，得到备选向量。

采用归一化函数，例如softmax函数对备选向量进行归一化处理，让

得到归一化之后的目标向量λ＝[λ ₁，λ ₂，...，λ _k] ^T，让目标向量λ每个维度的值作为对应的归一化因子的第一权重值。这样，根据特征图，自适应性地确定不同的归一化因子的第一权重值，提高了归一化算法的灵活性。

将K个备选归一化特征图分别与对应的归一化因子的第一权重值λ _k相乘后，获得K个第一归一化特征图。K个第一归一化特征图分别与第二权重值γ ^k相乘，获得K个第二归一化特征图。K个第二归一化特征图再分别与目标偏移值β ^k相加，获得K个第三归一化特征图。最终将这K个第三归一化特征图相加，获得与特征图X对应的目标归一化特征图

其中，图7中未示出γ ^k和β ^k。

上述实施例中，可以确定不同归一化因子的第一权重值，拓展了图像归一化方法可用于分析的范畴，使得在同一个框架内对不同粒度的数据内容进行分析成为可能，推动了深度学习归一化技术的前沿发展。另外，通过设计上述图像归一化处理方法，使得整个网络在优化稳定的同时能够减少过拟合现象。该归一化层可能替换网络结构中任意的归一化层。相比于其他归一化方法具有易于实现与优化、即插即用等优势。

在一些实施例中，当待处理图像为样本图像时，该图像归一化方法可以用于对神经网络进行训练，训练后得到的神经网络可以作为一个子网络，替换用于执行各种任务的神经网络中的归一化层。其中，各种任务包括但不限于语义理解、语音识别、计算机视觉任务等。

在训练过程中，采用上述过程可以根据针对不同任务的样本图像，自适应地确定各个归一化因子对应的第一权重值，解决了在样本集合不同的情况下，无法动态调整归一化因子的权重值，所带来的归一化算法不灵活的问题。

在本公开实施例中，如果针对某个任务的样本图像，完成神经网络的训练之后，可以直接替换该任务对应的神经网络中的归一化层，实现即插即用的目的。如果有其他任务对应的神经网络，可以通过微调网络参数的方式直接替换到新的神经网络上，从而可以提升其他任务的性能。

与前述方法实施例相对应，本公开还提供了装置的实施例。

如图8所示，图8是本公开根据一示例性实施例示出的一种图像归一化处理装置框图，装置包括：归一化处理模块210，用于采用K个归一化因子，分别对特征图进行归一化处理，获得与所述K个归一化因子各自对应的备选归一化特征图，其中K是大于1的整数；第一确定模块220，用于各个所述归一化因子的第一权重值；第二确定模块230，用于根据所述K个归一化因子各自对应的备选归一化特征图和各个所述归一化因子的所述第一权重值，确定与所述特征图对应的目标归一化特征图。

在一些实施例中，所述第一确定模块包括：第一确定子模块，用于针对各个所述归一化因子，确定与该归一化因子对应的第一特征向量；第二确定子模块，用于根据K个所述第一特征向量之间的相关性，确定相关性矩阵；第三确定子模块，用于根据所述相关性矩阵，确定各个所述归一化因子的所述第一权重值。

在一些实施例中，所述第一确定子模块包括：下采样单元，用于对所述特征图进行下采样，获得与所述特征图对应的K个第二特征向量；第一归一化处理单元，用于该归一化因子，对所述K个第二特征向量中与该归一化因子对应的第二特征特征向量进行归一化处理，获得第三特征向量；降维处理单元，用于对所述第三特征向量进行降维处理，获得所述第一特征向量。

在一些实施例中，所述第二确定子模块包括：第一确定单元，用于确定每个第一特征向量对应的转置向量；第二确定单元，用于将每个第一特征向量和每个所述转置向量两两相乘，获得所述相关性矩阵。

在一些实施例中，所述第三确定子模块包括：转换单元，用于依次通过第一全连接网络、双曲正切变换和第二全连接网络，将所述相关性矩阵转换为备选向量；第二归一化处理单元，用于对所述备选向量中的值进行归一化处理，获得归一化处理后的目标向量；第三确定单元，用于根据所述目标向量，确定各个所述归一化因子的所述第一权重值，其中所述目标向量包括K个元素。

在一些实施例中，所述第三确定单元包括：将所述目标向量中第k个元素，作为第k个归一化因子的所述第一权重值，其中k为1至K中的任一整数。

在一些实施例中，所述第二确定模块包括：第四确定子模块，用于针对各个归一化因子，将与该归一化因子对应的备选归一化特征图与该归一化因子的所述第一权重值相乘，获得与该归一化因子对应的第一归一化特征图；第五确定子模块，用于针对各个归一化因子，根据与该归一化因子对应的第二权重值，调整与该归一化因子对应的第一归一化特征图的尺寸，获得与该归一化因子对应的第二归一化特征图；第六确定子模块，用于针对各个归一化因子，根据与该归一化因子对应的目标偏移值，移动与该归一化因子对应的第二归一化特征图，获得与该归一化因子对应的第三归一化特征图；第七确定子模块，用于将K个第三归一化特征图相加后，获得与所述特征图对应的目标归一化特征图。

对于装置实施例而言，由于其基本对应于方法实施例，所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本公开方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

本公开实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，当处理器调用所述计算机程序时，所述处理器用于执行上述任一实施例所述的图像归一化处理方法。所述计算机可读存储介质包括非暂态计算机可读存储介质。

在一些实施例中，本公开实施例提供了一种计算机程序产品，包括计算机可读代码，当计算机可读代码在设备上运行时，设备中的处理器执行用于实现如上任一实施例提供的图像归一化处理方法的指令。

在一些实施例中，本公开实施例还提供了另一种计算机程序产品，用于存储计算机可读指令，指令被执行时使得计算机执行上述任一实施例提供的图像归一化处理方法的操作。

该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一些实施例中，所述计算机程序产品可以体现为计算机存储介质，在一些实施例中，计算机程序产品可体现为软件产品，例如软件开发包(Software Development Kit，SDK)等等。

本公开实施例还提供了一种电子设备，包括：处理器；用于存储处理器可执行指令的存储器；其中，处理器被配置为调用所述存储器中存储的可执行指令，实现上述任一实施例所述的图像归一化处理方法。

图9为本公开实施例提供的一种电子设备的硬件结构示意图。该电子设备310包括处理器311，还可以包括输入装置312、输出装置313和存储器314。该输入装置312、输出装置313、存储器314和处理器311之间通过总线相互连接。

存储器314包括但不限于随机存储记忆体(random access memory，RAM)、只读存储器(read-only memory，ROM)、可擦除可编程只读存储器(erasable programmable read only memory，EPROM)、或便携式只读存储器(compact disc read-only memory，CD-ROM)，该存储器用于相关指令及数据。

输入装置312用于输入数据和/或信号，以及输出装置313用于输出数据和/或信号。输出装置313和输入装置312可以是独立的器件，也可以是一个整体的器件。

处理器311可以包括是一个或多个处理器，例如包括一个或多个中央处理器(central processing unit，CPU)，在处理器311是一个CPU的情况下，该CPU可以是单核CPU，也可以是多核CPU。

存储器314用于存储网络设备的程序代码和数据。

处理器311用于调用该存储器314中的程序代码和数据，执行上述方法实施例中的步骤。具体可参见方法实施例中的描述，在此不再赘述。

可以理解的是，图9仅仅示出了一种图像归一化处理装置的简化设计。在实际应用中，图像归一化处理装置还可以分别包含必要的其他元件，包含但不限于任意数量的输入/输出装置、处理器、控制器、存储器等，而所有可以实现本公开实施例的图像归一化处理装置都在本公开的保护范围之内。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或者惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

以上所述仅为本公开的一些实施例而已，并不用以限制本公开，凡在本公开的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本公开保护的范围之内。

Claims

一种图像归一化处理方法，包括：

采用K个归一化因子，分别对特征图进行归一化处理，获得与所述K个归一化因子各自对应的备选归一化特征图，其中K是大于1的整数；

确定所述K个归一化因子中各个归一化因子的第一权重值；

根据所述K个归一化因子各自对应的备选归一化特征图和所述第一权重值，确定与所述特征图对应的目标归一化特征图。
根据权利要求1所述的方法，其特征在于，确定所述K个归一化因子中各个归一化因子的第一权重值，包括：

针对所述K个归一化因子中各个归一化因子的第一权重值，确定与该归一化因子对应的第一特征向量；

根据K个所述第一特征向量之间的相关性，确定相关性矩阵；

根据所述相关性矩阵，确定所述K个归一化因子中各个归一化因子的所述第一权重值。
根据权利要求2所述的方法，其特征在于，针对所述K个归一化因子中各个归一化因子，确定与该归一化因子对应的第一特征向量，包括：

对所述特征图进行下采样，获得与所述特征图对应的K个第二特征向量；

采用该归一化因子，对所述K个第二特征向量中与该归一化因子对应的第二特征特征向量进行归一化处理，获得第三特征向量；

对所述第三特征向量进行降维处理，获得所述第一特征向量。
根据权利要求2或3所述的方法，其特征在于，根据K个所述第一特征向量之间的相关性，确定所述相关性矩阵，包括：

确定每个所述第一特征向量对应的转置向量；

针对每个所述第一特征向量，将该第一特征向量和各个所述转置向量相乘，获得所述相关性矩阵。
根据权利要求2-4任一项所述的方法，其特征在于，根据所述相关性矩阵，确定所述K个归一化因子中各个归一化因子的所述第一权重值，包括：

依次通过第一全连接网络、双曲正切变换和第二全连接网络，将所述相关性矩阵转换为备选向量；

对所述备选向量中的值进行归一化处理，获得归一化处理后的目标向量；

根据所述目标向量，确定所述K个归一化因子中各个归一化因子的所述第一权重值，其中所述目标向量包括K个元素。
根据权利要求5所述的方法，其特征在于，根据所述目标向量，确定所述K个归一化因子中各个归一化因子的所述第一权重值，包括：

将所述目标向量中第k个元素，作为第k个归一化因子的所述第一权重值，其中k为1至K中的任一整数。
根据权利要求1-6任一项所述的方法，其特征在于，根据所述K个归一化因子各自对应的备选归一化特征图和所述第一权重值，确定与所述特征图对应的目标归一化特征图，包括：

针对所述K个归一化因子中各个归一化因子，

将与该归一化因子对应的所述备选归一化特征图与该归一化因子的所述第一权重值相乘，获得与该归一化因子对应的第一归一化特征图；

根据与该归一化因子对应的第二权重值，调整与该归一化因子对应的第一归一化特征图的尺寸，获得与该归一化因子对应的第二归一化特征图；

根据与该归一化因子对应的目标偏移值，移动与该归一化因子对应的第二归一化特征图，获得与该归一化因子对应的第三归一化特征图；

将K个所述第三归一化特征图相加后，获得与所述特征图对应的目标归一化特征图。
一种图像归一化处理装置，包括：

归一化处理模块，用于采用K个归一化因子，分别对特征图进行归一化处理，获得与所述K个归一化因子各自对应的备选归一化特征图，其中K是大于1的整数；

第一确定模块，用于确定所述K个归一化因子中各个归一化因子的第一权重值；

第二确定模块，用于根据所述K个归一化因子各自对应的备选归一化特征图和所述第一权重值，确定与所述特征图对应的目标归一化特征图。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，当处理器调用所述计算机程序时，所述处理器用于执行上述权利要求1-7任一所述的图像归一化处理方法。
一种电子设备，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为调用所述存储器中存储的所述处理器可执行指令，实现权利要求1-7中任一项所述的图像归一化处理方法。
一种计算机程序产品，所述计算机程序产品中存储有计算机可读指令，当所述计算机可读指令被处理器执行时实现权利要求1至7任一所述的图像归一化处理方法。