CN116109831A - 归一化处理方法及装置、电子设备、存储介质 - Google Patents
归一化处理方法及装置、电子设备、存储介质 Download PDFInfo
- Publication number
- CN116109831A CN116109831A CN202111322561.XA CN202111322561A CN116109831A CN 116109831 A CN116109831 A CN 116109831A CN 202111322561 A CN202111322561 A CN 202111322561A CN 116109831 A CN116109831 A CN 116109831A
- Authority
- CN
- China
- Prior art keywords
- normalization
- result
- feature map
- processing method
- modes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本公开实施例是关于一种归一化处理方法及装置、电子设备、存储介质,涉及计算机技术领域,该归一化处理方法包括:获取待处理对象对应的特征图;通过多种归一化方式分别对所述特征图进行归一化,得到各所述归一化方式对应的参考结果;对所述参考结果进行逻辑操作确定所述特征图对应的归一化结果,并根据所述归一化结果对所述待处理对象执行对应的操作。本公开的技术方案能够提高归一化的准确性。
Description
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种归一化处理方法、归一化处理装置、电子设备以及计算机可读存储介质。
背景技术
在神经网络的应用过程中,归一化处理是非常重要的过程。例如可以对图像进行归一化并根据归一化结果来进行图像分类或图像识别。在图像处理过程中需要提高归一化的处理效果,以便于准确处理图像。
相关技术中,对于不同的应用场景,分别采用不同的归一化方法来进行归一化处理。其中,得到的归一化结果具有一定的局限性,通用性较差。除此之外,选择的归一化方式可能并不适合,且得到的归一化结果不准确。进行归一化处理时需要较多的计算资源,可靠性较差。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种归一化处理方法及装置、电子设备、存储介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的归一化结果不准确的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一个方面,提供一种归一化处理方法,包括:获取待处理对象对应的特征图;通过多种归一化方式分别对所述特征图进行归一化,得到各所述归一化方式对应的参考结果;对所述参考结果进行逻辑操作确定所述特征图对应的归一化结果,并根据所述归一化结果对所述待处理对象执行对应的操作。
根据本公开的一个方面,提供一种归一化处理装置,包括:特征图获取模块,用于获取待处理对象对应的特征图;归一化模块,用于通过多种归一化方式分别对所述特征图进行归一化,得到各所述归一化方式对应的参考结果;逻辑处理模块,用于对所述参考结果进行逻辑操作确定所述特征图对应的归一化结果,并根据所述归一化结果对所述待处理对象执行对应的操作。
根据本公开的一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的归一化处理方法。
根据本公开的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的归一化处理方法。
本公开实施例中提供的归一化处理方法、归一化处理装置、电子设备以及计算机可读存储介质中,通过多种归一化方式分别对所述待处理特征图进行归一化,得到各所述归一化方式对应的参考结果;对所述参考结果进行逻辑操作确定所述特征图对应的归一化结果。一方面,由于使用了多种归一化方式来对同一个特征图进行混合归一化,对不同的归一化方式进行了组合,能够从不同的维度来进行归一化,增加了归一化所考虑的维度的全面性,提高归一化的准确性。另一方面,通过多种归一化方式对同一个特征图进行混合归一化,避免了使用单一方式进行归一化的局限性,能够选择到更合适的归一化方式,且能够应用于各种应用场景,增加了应用范围,提高了归一化可靠性和归一化效率,且增加了通用性。减少了需要的计算资源和存储空间,进而能够根据归一化结果对待处理对象进行精准操作。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了可以应用本公开实施例的归一化处理方法或归一化处理装置的系统架构图。
图2示出了适于用来实现本公开实施例的电子设备的结构示意图。
图3示意性示出本公开实施例中一种归一化处理方法的示意图。
图4示意性示出本公开实施例中特征图的示意图。
图5示意性示出本公开实施例中多种归一化方式的示意图。
图6示意性示出本公开实施例中确定归一化结果的流程示意图。
图7示意性示出本公开实施例中进行自适应归一化的示意图。
图8示意性示出本公开实施例中一种归一化处理装置的框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
相关技术中,BN在Batch较小时,统计的均值和标准差不准确,使得归一化的效果不好,较大的Batch又会导致GPU显存不足。BN在RNN网络中效果不好,由于RNN的输入是动态的,因此Batch的大小是变化的,因此,BN统计的均值和标准差不准确。在构建网络过程中,基本需要依靠过往经验和大量的试验来确定,费时费力。BIN虽然通过可学习的参数将BN和IN结合在一起,但是没有考虑其他归一化的优点,使得最终归一化效果有限。
为了解决上述问题,本公开实施例中提供了一种归一化处理方法,可以应用于需要进行归一化的应用场景。
图1示出了可以应用本公开实施例的归一化处理方法或归一化处理装置的应用场景的示意图。
参考图1中所示,客户端101可以是各种类型的具有计算功能的设备,例如可以为智能手机、平板电脑、台式计算机、车载设备、可穿戴设备等等。待处理对象102可以为图像或者是数据等等。待处理对象还可以包括对应的特征图。客户端101可以通过多种归一化方式分别对所述特征图进行归一化,得到各所述归一化方式对应的参考结果;进一步对所述参考结果进行逻辑操作确定所述特征图对应的归一化结果,并根据所述归一化结果对所述待处理对象执行对应的操作。
需要说明的是,本公开实施例所提供的归一化处理方法可以完全由客户端来执行。相应地,归一化处理装置可设置于客户端中。
图2示出了适于用来实现本公开示例性实施方式的电子设备的示意图。本公开的终端可以被配置为如图2所示电子设备的形式,然而,需要说明的是,图2示出的电子设备仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
本公开的电子设备至少包括处理器和存储器,存储器用于存储一个或多个程序,当一个或多个程序被处理器执行时,使得处理器可以实现本公开示例性实施方式的方法。
具体的,如图2所示,电子设备200可以包括:处理器210、内部存储器221、外部存储器接口222、通用串行总线(Universal Serial Bus,USB)接口230、充电管理模块240、电源管理模块241、电池242、天线1、天线2、移动通信模块250、无线通信模块260、音频模块270、扬声器271、受话器272、麦克风273、耳机接口274、传感器模块280、显示屏290、摄像模组291、指示器292、马达293、按键294以及用户标识模块(Subscriber IdentificationModule,SIM)卡接口295等。其中传感器模块280可以包括深度传感器、压力传感器、陀螺仪传感器、气压传感器、磁传感器、加速度传感器、距离传感器、接近光传感器、指纹传感器、温度传感器、触摸传感器、环境光传感器及骨传导传感器等。
可以理解的是,本申请实施例示意的结构并不构成对电子设备200的具体限定。在本申请另一些实施例中,电子设备200可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或软件和硬件的组合实现。
处理器210可以包括一个或多个处理单元,例如:处理器210可以包括应用处理器、调制解调处理器、图形处理器、图像信号处理器、控制器、视频编解码器、数字信号处理器、基带处理器和/或神经网络处理器(Neural-etwork Processing Unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。另外,处理器210中还可以设置存储器,用于存储指令和数据。本示例性实施方式中的模型训练方法可以由应用处理器、图形处理器或图像信号处理器来执行,当方法涉及到神经网络相关的处理时,可以由NPU来执行。
内部存储器221可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。内部存储器221可以包括存储程序区和存储数据区。外部存储器接口222可以用于连接外部存储卡,例如Micro SD卡,实现扩展电子设备200的存储能力。
移动终端200的通信功能可以通过移动通信模块、天线1、无线通信模块、天线2、调制解调处理器以及基带处理器等实现。天线1和天线2用于发射和接收电磁波信号。移动通信模块可以提供应用在移动终端200上2G、3G、4G、5G等移动通信解决方案。无线通信模块可以提供应用在移动终端200上的无线局域网、蓝牙、近场通信等无线通信解决方案。
显示屏用于实现显示功能,如显示用户界面、图像、视频等。摄像模块用于实现拍摄功能,如拍摄图像、视频等。音频模块用于实现音频功能,如播放音频,采集语音等。电源模块用于实现电源管理功能,如为电池充电、为设备供电、监测电池状态等。
本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读存储介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如下述实施例中所述的方法。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
本公开实施例中,归一化处理方法可以包括以下步骤S310至S330,其中:
在步骤S310中,获取待处理对象对应的特征图;
在步骤S320中,通过多种归一化方式分别对所述特征图进行归一化,得到各所述归一化方式对应的参考结果;
在步骤S330中,对所述参考结果进行逻辑操作确定所述特征图对应的归一化结果,并根据所述归一化结果对所述待处理对象执行对应的操作。
本公开实施例中,一方面,由于使用了多种归一化方式来对同一个特征图进行混合归一化,能够从不同的维度来进行归一化,增加了归一化所考虑的维度的全面性,提高归一化的准确性。另一方面,通过多种归一化方式对同一个特征图进行混合归一化,避免了使用单一方式进行归一化的局限性,能够选择到更合适的归一化方式,且能够应用于各种应用场景,增加了应用范围,提高了归一化可靠性和归一化效率,且增加了通用性。
接下来,参考图3对本公开实施例中的归一化处理方法进行详细说明。
在步骤S310中,获取待处理对象对应的特征图。
本公开实施例中,待处理对象可以为图像或者是其他类型的对象等等,具体根据应用场景而确定。特征图表示之前输入上某个特征分布的数据。在神经网络模型的每个卷积层,数据都是以三维形式存在的,其可以相当于多个二维图片叠在一起,其中每一个图片称为一个特征图。对于神经网络而言,层与层之间会有若干个卷积核,上一层和每个特征图跟每个卷积核做卷积,都会产生下一层的一个特征图。特征图的具体结构可以如图4中所示,特征图可以用X表示。参考图4中所示,特征图可以包括多个维度,且多个维度可以为[N,H,W,C]。其中,N表示特征的Batch,即图像数量(n张图像);H代表特征的图像高度Height;W代表特征的图像宽度Width;C代表特征的Channel,即颜色通道。
在步骤S320中,通过多种归一化方式分别对所述特征图进行归一化,得到各所述归一化方式对应的参考结果。
本公开实施例中,多种归一化方式可以包括实例归一化、批归一化、分组归一化以及层归一化中的至少两个,例如可以只包括实例归一化和批归一化,也可以包括实例归一化、批归一化以及分组归一化等等,还可以同时包括实例归一化、批归一化、分组归一化以及层归一化。归一化方式还可以包括其他归一化方式。所有的归一化方式中的部分或者是全部均可以进行组合形成混合归一化方式。对特征进行归一化时,可以按照公式(1)进行,以通过求解特征的均值和标准差来计算归一化后的特征:
其中,In为输入特征,Out是归一化后的特征,需要求解的参数为输入特征的均值μIn和标准差σIn。
需要说明的是,IN(Instance Normalization,实例归一化),BN(BatchNormalization,批归一化),GN(Group Normalization,分组归一化)和LN(LayerNormalization,层归一化)在计算单个均值和标准差时对应的特征图上的统计的数据范围完全不同,具体参考图5中所示。
具体地,参考图5中所示,批归一化在NxHxW上统计均值和标准差,主要解决是内部协变量偏移的问题。BN主要作用于Batch维度,对NxHxW做归一化,对于小的Batch效果不是很好。加入BN层能够使得模型的收敛速度加快。单个通道的均值和标准差的计算公式如公式(2)所示。其中,c代表通道的索引值,X为输入的特征图,ε是一个微小量,防止除零。
实例归一化在HxW上统计均值和标准差,和BN的最大区别在于,IN作用于单个实例,BN作用于一个Batch。IN多适用于生成模型,比如人脸修复,生成对抗网络。具体如公式(3)所示:
层归一化LN在HxWxC上统计均值和标准差,相比于BN,LN在Batch较小的情况下也能使用,常用于RNN模型,如公式(4)所示:
分组归一化GN沿channel方向分成G组,然后在每个组内沿C/GxHxW计算均值和标准差,用于每组的归一化计算,GN独立于Batch,IN和LN是GN的两种特殊情况:当G等于C时,GN变成了IN,当G=1时,GN变成了LN。具体如公式(5)所示:
BIN(Batch-Instance Normalization),将BN和IN进行结合,通过一个可学习参数ρ进行加权,设In为输入特征图,ρ是一个取值范围为0到1,BIN的计算公式如公式(6)所示:
Out=BN(In)*ρ+IN(In)*(1-ρ) 公式(6)
在获取到待处理对象对应的特征图后,可以通过每一种归一化方式分别对特征图进行归一化处理,以便于通过所有归一化方式对同一个特征图进行归一化。具体地,可以采用多种归一化方式对特征图进行并行归一化处理,以提高归一化效率。
参考结果指的是使用每一种归一化方式对特征图进行归一化得到的结果。举例而言,可通过分组归一化GN对特征图X进行归一化得到参考结果X1,通过层归一化LN对特征图X进行归一化得到参考结果X2,通过实例归一化IN对特征图X进行归一化得到参考结果X3,通过批归一化BN对特征图X进行归一化得到参考结果X4。
具体地,可以通过GN对特征图X沿C/GxHxW计算均值与标准差,通过LN对特征图X沿HxWxC计算均值与标准差,通过IN对特征图X沿HxW计算均值与标准差,通过BN对特征图X沿NxHxW计算均值与标准差,从而得到特征图针对于每一种归一化方式的参考结果。
在步骤S330中,对所述参考结果进行逻辑操作确定所述特征图对应的归一化结果,并根据所述归一化结果对所述待处理对象执行对应的操作。
本公开实施例中,参考结果为每种归一化方式对应的输出结果。逻辑操作用于对多个参考结果进行组合,以得到一个整体结果。逻辑操作可以包括乘法操作以及组合操作等等。组合操作可以包括加法操作或拼接操作。
具体地,在对所述参考结果进行逻辑操作确定所述特征图对应的归一化结果时,可以按照各所述归一化方式对应的权重系数对所述参考结果进行调整得到初始归一化结果,并根据所述初始归一化结果确定所述归一化结果。初始归一化结果指的是对参考结果进行调整处理而得到的中间结果,其指的是局部归一化结果。
本公开实施例中,权重系数可以用于描述每个归一化方式的重要程度(即归一化过程中起作用的程度)。并且,权重系数与重要程度正相关,即权重系数越大,重要程度越高;权重系数越小,重要程度越低。其中,可以对多个参考参数进行学习,得到每个归一化方式对应的权重系数。参考参数可以为可学习参数,即数值可以发生变化的数值。具体可以通过反向传播方式对参考参数所表示的可学习参数进行调整,以更新每个参考参数对应的数值,并在神经网络模型训练完成时将对应的参考参数确定为权重系数。即,按照反向传播方式对参考参数的数值进行调整,直至模型训练完成时确定参数学习完成,以得到权重系数。并且,权重系数为四个可学习参数经过激活函数后的输出值,权重系数的取值范围为0至1。激活函数可以为sigmoid函数,也可以为其他函数。
需要补充的是,在可学习参数的学习过程中,为了达到自适应效果,可以在神经网络模型的损失函数中加入正则化项损失,通过正则化项损失对权重系数进行更新调整,以使得多个权重系数具有区分度。正则化项损失可以根据多个权重系数以及多个权重系数对应的均值μa而确定。具体如公式(7)所示:
其中,权重系数的值越大,则代表该归一化方式所起的作用越大。例如,权重系数a1、a2、a3、a4中,a1是最大值,则代表分组归一化GN的重要程度最高,GN在整个归一化过程中所起的作用最大。
在损失函数中增加正则化项损失的情况下,首先可以对代表可学习参数的参考参数进行学习更改参考参数的数值,以确定多个权重系数。进一步地,可以通过正则化项损失对多个权重系数进行更新,使多个权重系数其中之一最大,以使得多个权重系数具有区分度。需要说明的是,在神经网络模型收敛时,可以根据损失函数中的正则化项损失确定一个最大的权重系数。
在得到权重系数后,可以按照各归一化方式对应的权重系数对所述参考结果进行调整得到初始归一化结果,并根据所述初始归一化结果确定所述归一化结果。
图6中示意性示出了确定归一化结果的流程图,参考图6中所示,主要包括以下步骤:
在步骤S610中,对各所述归一化方式对应的权重系数与所述参考结果进行乘法操作,得到所述初始归一化结果;
在步骤S620中,对所述初始归一化结果进行组合操作,得到所述归一化结果。
本公开实施例中,可以将每个归一化方式对应的权重系数与每个归一化方式针对于特征图的参考结果相乘,得到每个归一化方式对应的初始归一化结果。进一步地,可以将多个初始归一化结果进行组合操作,得到根据多个归一化方式中的一种方式或多种方式确定的特征图对应的归一化结果。组合操作可以为加法操作,也可以为拼接操作。在组合操作为加法操作时,可以将所有的初始归一化结果相加,得到归一化结果。当组合操作为拼接操作时,可以将所有的初始归一化结果按照通道维度进行拼接,得到归一化结果。当组合操作为拼接操作时,可以充分利用多种归一化后的特征,增强模型的特征提取能力。
举例而言,可以根据权重系数与参考结果相乘,得到多个初始归一化结果a1X1、a2X2、a3X3、a4X4。然后将多个初始归一化结果通过加法操作进行组合a1X1+a2X2+a3X3+a4X4得到归一化结果Y。
本公开实施例中,引入可学习参数对应的权重系数,用于对多种归一化方式对同一个特征图的参考结果进行加权,能够通过多种归一化方式来对特征图进行处理。
图7中示出了进行自适应归一化的示意图,参考图7中所示,主要包括:
假设X是待归一化的特征图,将特征图X分别经过GN、LN、IN和BN四个模块得到每个归一化方式对应的参考结果。然后将输出的参考结果分别乘以相应的权重系数a1、a2、a3和a4,得到对应的初始归一化结果,最后将初始归一化结果进行加法操作得到归一化结果Y。其中a1、a2、a3和a4分别是四个可学习的参考参数经过sigmoid函数后的输出值,权重系数a1至a4的取值范围为0到1。
除此之外,所述方法还可以包括:将权重系数最大的归一化方式确定为目标归一化方式,忽略多个归一化方式中的其他归一化方式,并根据目标归一化方式对特征图进行归一化来确定归一化结果。权重系数最大确定的目标归一化方式可以用于表示重要程度最高的归一化方式,其所起的作用也最大,在多个归一化方式中效果最好。也就是说,可以在通过多种归一化方式进行归一化后,利用目标归一化方式重新进行归一化处理,以使用重要程度最高的方式进行归一化,指导模型归一化方法的选择。
需要说明的是,可以根据实际需求确定保留原归一化结果还是根据目标归一化方式重新进行归一化。实际需求可以根据应用场景而确定。应用场景不同,则确定归一化结果的方式不同。例如,在内存较小时,可以只根据多个归一化方式得到归一化结果;在内存较大时,可以根据多个归一化方式得到归一化结果,进一步还可以根据目标归一化方式重新进行归一化得到归一化结果。
本公开实施例中的归一化方法,可以用于任何需要进行归一化的应用场景中,如分类、识别、检测、分割、人脸修复、视频超分等场景,增加了应用范围,提高了通用性。在得到归一化结果之后,可以根据归一化结果对待处理对象执行对应的操作。对应的操作具体根据归一化的应用场景而确定。例如,可以根据归一化结果对待处理对象进行识别等等。
本公开实施例中的技术方案,由于使用了多种归一化方式来对同一个特征图进行混合归一化,对不同的归一化方式进行了组合,能够从不同的维度来进行归一化,避免了单一归一化发能够使导致的计算结果不准确的问题,增加了归一化所考虑的维度的全面性,提高归一化的准确性。结合了多种归一化方式,归一化效果更好。可以应用于各种需要归一化操作的场景,结合多种归一化操作的结果,增加模型的特征,避免通过大量经验和试验来确定模型的过程,减少模型的开发周期。归一化不会增加计算量且提高了原始模型的性能。引入可学习参数,用于学习对各种归一化结果进行加权,使得神经网络学习权重系数,用于区分多个归一化方式,从而提高归一化结果的准确性。自适应归一化引入正则化项损失,让加权参数具有区分度,能够指示出模型各个不同层使用哪种归一化起到的作用最大,确定出目标归一化方式,指导模型归一化方法的选择,从而在精简模型方面提供指导信息。通过多种归一化方式对同一个特征图进行混合归一化,避免了使用单一方式进行归一化的局限性,进一步能够根据正则化项损失选择到更合适的归一化方式作为目标归一化方式,增加了应用范围,提高了归一化可靠性和归一化效率。该归一化方式可以应用于各种应用场景中,增加了通用性和可执行性。通过多种归一化方式的组合,减少了需要的计算资源和存储空间,进而能够根据归一化结果对待处理对象进行精准操作。
本公开实施例中提供了一种归一化处理装置,参考图8中所示,该归一化处理装置800可以包括:
特征图获取模块801,用于获取待处理对象对应的特征图;
归一化模块802,用于通过多种归一化方式分别对所述特征图进行归一化,得到各所述归一化方式对应的参考结果;
逻辑处理模块803,用于对所述参考结果进行逻辑操作确定所述特征图对应的归一化结果,并根据所述归一化结果对所述待处理对象执行对应的操作。
在本公开的一种示例性实施例中,所述多种归一化方式包括实例归一化、批归一化、分组归一化以及层归一化中的至少两种。
在本公开的一种示例性实施例中,逻辑处理模块包括:处理控制模块,用于按照各所述归一化方式对应的权重系数对所述参考结果进行调整得到初始归一化结果,并根据所述初始归一化结果确定所述归一化结果。
在本公开的一种示例性实施例中,处理控制模块包括:乘法操作模块,用于对各所述归一化方式对应的权重系数与所述参考结果进行乘法操作,得到所述初始归一化结果;组合模块,用于对所述初始归一化结果进行组合操作,得到所述归一化结果。
在本公开的一种示例性实施例中,所述装置还包括:权重更新模块,用于根据损失函数中的正则化项损失对所述权重系数进行更新。
在本公开的一种示例性实施例中,所述正则化项损失根据各所述权重系数与各所述权重系数对应的均值确定。
在本公开的一种示例性实施例中,所述装置还包括:归一化方式确定模块,用于将所述权重系数最大的归一化方式确定为目标归一化方式,并根据所述目标归一化方式对所述特征图进行归一化确定所述归一化结果。
需要说明的是,上述归一化处理装置中各模块的具体细节已经在对应的归一化处理方法中进行了详细描述,因此此处不再赘述。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
本领域技术人员在考虑说明书及实践这里公开的内容后,将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。
Claims (10)
1.一种归一化处理方法,其特征在于,包括:
获取待处理对象对应的特征图;
通过多种归一化方式分别对所述特征图进行归一化,得到各所述归一化方式对应的参考结果;
对所述参考结果进行逻辑操作确定所述特征图对应的归一化结果,并根据所述归一化结果对所述待处理对象执行对应的操作。
2.根据权利要求1所述的归一化处理方法,其特征在于,所述多种归一化方式包括实例归一化、批归一化、分组归一化以及层归一化中的至少两种。
3.根据权利要求1所述的归一化处理方法,其特征在于,所述对所述参考结果进行逻辑操作确定所述特征图对应的归一化结果,包括:
按照各所述归一化方式对应的权重系数对所述参考结果进行调整得到初始归一化结果,并根据所述初始归一化结果确定所述归一化结果。
4.根据权利要求3所述的归一化处理方法,其特征在于,所述按照各所述归一化方式对应的权重系数对所述参考结果进行调整得到初始归一化结果,并根据所述初始归一化结果确定所述归一化结果,包括:
对各所述归一化方式对应的权重系数与所述参考结果进行乘法操作,得到所述初始归一化结果;
对所述初始归一化结果进行组合操作,得到所述归一化结果。
5.根据权利要求3或4所述的归一化处理方法,其特征在于,所述方法还包括:
根据损失函数中的正则化项损失对所述权重系数进行更新。
6.根据权利要求5所述的归一化处理方法,其特征在于,所述正则化项损失根据各所述权重系数与各所述权重系数对应的均值确定。
7.根据权利要求3所述的归一化处理方法,其特征在于,所述方法还包括:
将所述权重系数最大的归一化方式确定为目标归一化方式,并根据所述目标归一化方式对所述特征图进行归一化确定所述归一化结果。
8.一种归一化处理装置,其特征在于,包括:
特征图获取模块,用于获取待处理对象对应的特征图;
归一化模块,用于通过多种归一化方式分别对所述特征图进行归一化,得到各所述归一化方式对应的参考结果;
逻辑处理模块,用于对所述参考结果进行逻辑操作确定所述特征图对应的归一化结果,并根据所述归一化结果对所述待处理对象执行对应的操作。
9.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-7任意一项所述的归一化处理方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任意一项所述的归一化处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111322561.XA CN116109831A (zh) | 2021-11-09 | 2021-11-09 | 归一化处理方法及装置、电子设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111322561.XA CN116109831A (zh) | 2021-11-09 | 2021-11-09 | 归一化处理方法及装置、电子设备、存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116109831A true CN116109831A (zh) | 2023-05-12 |
Family
ID=86256640
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111322561.XA Pending CN116109831A (zh) | 2021-11-09 | 2021-11-09 | 归一化处理方法及装置、电子设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116109831A (zh) |
-
2021
- 2021-11-09 CN CN202111322561.XA patent/CN116109831A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200334830A1 (en) | Method, apparatus, and storage medium for processing video image | |
US11609968B2 (en) | Image recognition method, apparatus, electronic device and storage medium | |
CN111368685B (zh) | 关键点的识别方法、装置、可读介质和电子设备 | |
US20210272306A1 (en) | Method for training image depth estimation model and method for processing image depth information | |
US11816880B2 (en) | Face recognition method and apparatus, computer device, and storage medium | |
US11526970B2 (en) | System and method for video processing with enhanced temporal consistency | |
US20230394669A1 (en) | Point cloud segmentation method and apparatus, device, and storage medium | |
CN107909583B (zh) | 一种图像处理方法、装置及终端 | |
KR102557561B1 (ko) | 이미지의 깊이 정보를 결정하는 방법 및 시스템 | |
US10599913B2 (en) | Face model matrix training method and apparatus, and storage medium | |
CN111967515A (zh) | 图像信息提取方法、训练方法及装置、介质和电子设备 | |
CN115205925A (zh) | 表情系数确定方法、装置、电子设备及存储介质 | |
CN113902636A (zh) | 图像去模糊方法及装置、计算机可读介质和电子设备 | |
US20230281956A1 (en) | Method for generating objective function, apparatus, electronic device and computer readable medium | |
CN114677350A (zh) | 连接点提取方法、装置、计算机设备及存储介质 | |
CN112990440A (zh) | 用于神经网络模型的数据量化方法、可读介质和电子设备 | |
CN111814811A (zh) | 图像信息提取方法、训练方法及装置、介质和电子设备 | |
CN110619602B (zh) | 一种图像生成方法、装置、电子设备及存储介质 | |
CN113989121A (zh) | 归一化处理方法及装置、电子设备、存储介质 | |
CN116109831A (zh) | 归一化处理方法及装置、电子设备、存储介质 | |
CN114254563A (zh) | 数据处理方法及装置、电子设备、存储介质 | |
CN113537470A (zh) | 模型量化方法及装置、存储介质及电子设备 | |
CN114998172A (zh) | 图像处理方法及相关系统 | |
CN113362260A (zh) | 图像优化方法及装置、存储介质及电子设备 | |
CN114090262A (zh) | 对象处理方法及装置、电子设备、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |