CN113989121A - 归一化处理方法及装置、电子设备、存储介质 - Google Patents
归一化处理方法及装置、电子设备、存储介质 Download PDFInfo
- Publication number
- CN113989121A CN113989121A CN202111322564.3A CN202111322564A CN113989121A CN 113989121 A CN113989121 A CN 113989121A CN 202111322564 A CN202111322564 A CN 202111322564A CN 113989121 A CN113989121 A CN 113989121A
- Authority
- CN
- China
- Prior art keywords
- normalization
- result
- sub
- processing method
- initial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010606 normalization Methods 0.000 title claims abstract description 298
- 238000003672 processing method Methods 0.000 title claims abstract description 27
- 238000010586 diagram Methods 0.000 claims abstract description 43
- 238000012545 processing Methods 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 description 52
- 238000000034 method Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 15
- 230000008569 process Effects 0.000 description 11
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 4
- 238000010295 mobile communication Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4038—Image mosaicing, e.g. composing plane images from plane sub-images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本公开实施例是关于一种归一化处理方法及装置、电子设备、存储介质,涉及计算机技术领域,该归一化处理方法包括:获取待处理对象对应的特征图,并将所述特征图划分为多个子特征图;通过多种归一化方式对所述子特征图进行归一化,得到各所述子特征图对应的参考结果;根据所述参考结果得到初始归一化结果,对所述初始归一化结果进行拼接操作确定所述特征图对应的归一化结果,并根据所述归一化结果对所述待处理对象执行对应的操作。本公开的技术方案能够提高归一化的准确性。
Description
技术领域
本公开涉及计算机技术领域,具体而言,涉及一种归一化处理方法、归一化处理装置、电子设备以及计算机可读存储介质。
背景技术
在神经网络的应用过程中,归一化处理是非常重要的过程。例如可以对图像进行归一化并根据归一化结果来进行图像分类或图像识别。在图像处理过程中需要提高归一化的处理效果,以便于准确处理图像。
相关技术中,对于不同的应用场景,分别采用不同的归一化方法来进行归一化处理。其中,得到的归一化结果具有一定的局限性,且得到的归一化结果不准确。除此之外,归一化过程中的计算量较大,因此导致归一化效率较差,且需要较多的计算资源。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种归一化处理方法及装置、电子设备、存储介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的归一化结果不准确的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一个方面,提供一种归一化处理方法,包括:获取待处理对象对应的特征图,并将所述特征图划分为多个子特征图;通过多种归一化方式对所述子特征图进行归一化,得到各所述子特征图对应的参考结果;根据所述参考结果得到初始归一化结果,对所述初始归一化结果进行拼接操作确定所述特征图对应的归一化结果,并根据所述归一化结果对所述待处理对象执行对应的操作。
根据本公开的一个方面,提供一种归一化处理装置,包括:特征划分模块,用于获取待处理对象对应的特征图,并将所述特征图划分为多个子特征图;归一化模块,用于通过多种归一化方式对所述子特征图进行归一化,得到各所述子特征图对应的参考结果;拼接模块,用于根据所述参考结果得到初始归一化结果,对所述初始归一化结果进行拼接操作确定所述特征图对应的归一化结果,并根据所述归一化结果对所述待处理对象执行对应的操作。
根据本公开的一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的归一化处理方法。
根据本公开的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的归一化处理方法。
本公开实施例中提供的归一化处理方法、归一化处理装置、电子设备以及计算机可读存储介质中,将特征图划分为多个子特征图,通过多种归一化方式对所述子特征图进行归一化,得到各所述子特征图对应的参考结果,根据参考结果得到初始归一化结果,对所述初始归一化结果进行拼接操作确定所述特征图对应的归一化结果。一方面,由于使用了多种归一化方式来进行混合归一化,能够从不同的维度来进行归一化,增加了归一化所考虑的维度的全面性,提高归一化的准确性,且避免了单一方式进行归一化的局限性,增加了应用范围。另一方面,通过多种归一化方式进行混合归一化,由于多种归一化方式的每一种归一化方式分别对其中一个子特征图进行归一化从而实现对不同子特征图进行归一化的过程,降低了计算量,减少了需要的计算资源和存储空间,且提高了归一化效率,进而能够根据归一化结果对待处理对象进行精准操作。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了可以应用本公开实施例的归一化处理方法或归一化处理装置的系统架构图。
图2示出了适于用来实现本公开实施例的电子设备的结构示意图。
图3示意性示出本公开实施例中一种归一化处理方法的示意图。
图4示意性示出本公开实施例中特征图的示意图。
图5示意性示出本公开实施例中多种归一化方式的示意图。
图6示意性示出本公开实施例中确定初始归一化结果的流程示意图。
图7示意性示出本公开实施例中进行混合归一化的示意图。
图8示意性示出本公开实施例中一种归一化处理装置的框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
本公开实施例中提供了一种归一化处理方法,可以应用于需要进行归一化的应用场景。
图1示出了可以应用本公开实施例的归一化处理方法或归一化处理装置的应用场景的示意图。
参考图1中所示,客户端101可以是各种类型的具有计算功能的设备,例如可以为智能手机、平板电脑、台式计算机、车载设备、可穿戴设备等等。待处理对象102可以为图像或者是数据等等。待处理对象还可以包括对应的特征图。客户端101可以对待处理对象的特征图进行划分,得到多个子特征图;进一步通过多种归一化方式对子特征图进行归一化处理,得到每个子特征图对应的参考结果;进而对参考结果进行处理得到初始归一化结果,并对初始归一化结果进行拼接操作从而得到特征图对应的归一化结果。进一步地,可以在归一化结果的基础上来对待处理对象进行对应的操作。
需要说明的是,本公开实施例所提供的归一化处理方法可以完全由客户端来执行。相应地,归一化处理装置可设置于客户端中。
图2示出了适于用来实现本公开示例性实施方式的电子设备的示意图。本公开的终端可以被配置为如图2所示电子设备的形式,然而,需要说明的是,图2示出的电子设备仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
本公开的电子设备至少包括处理器和存储器,存储器用于存储一个或多个程序,当一个或多个程序被处理器执行时,使得处理器可以实现本公开示例性实施方式的方法。
具体的,如图2所示,电子设备200可以包括:处理器210、内部存储器221、外部存储器接口222、通用串行总线(Universal Serial Bus,USB)接口230、充电管理模块240、电源管理模块241、电池242、天线1、天线2、移动通信模块250、无线通信模块260、音频模块270、扬声器271、受话器272、麦克风273、耳机接口274、传感器模块280、显示屏290、摄像模组291、指示器292、马达293、按键294以及用户标识模块(Subscriber IdentificationModule,SIM)卡接口295等。其中传感器模块280可以包括深度传感器、压力传感器、陀螺仪传感器、气压传感器、磁传感器、加速度传感器、距离传感器、接近光传感器、指纹传感器、温度传感器、触摸传感器、环境光传感器及骨传导传感器等。
可以理解的是,本申请实施例示意的结构并不构成对电子设备200的具体限定。在本申请另一些实施例中,电子设备200可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或软件和硬件的组合实现。
处理器210可以包括一个或多个处理单元,例如:处理器210可以包括应用处理器、调制解调处理器、图形处理器、图像信号处理器、控制器、视频编解码器、数字信号处理器、基带处理器和/或神经网络处理器(Neural-etwork Processing Unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。另外,处理器210中还可以设置存储器,用于存储指令和数据。本示例性实施方式中的模型训练方法可以由应用处理器、图形处理器或图像信号处理器来执行,当方法涉及到神经网络相关的处理时,可以由NPU来执行。
内部存储器221可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。内部存储器221可以包括存储程序区和存储数据区。外部存储器接口222可以用于连接外部存储卡,例如Micro SD卡,实现扩展电子设备200的存储能力。
移动终端200的通信功能可以通过移动通信模块、天线1、无线通信模块、天线2、调制解调处理器以及基带处理器等实现。天线1和天线2用于发射和接收电磁波信号。移动通信模块可以提供应用在移动终端200上2G、3G、4G、5G等移动通信解决方案。无线通信模块可以提供应用在移动终端200上的无线局域网、蓝牙、近场通信等无线通信解决方案。
显示屏用于实现显示功能,如显示用户界面、图像、视频等。摄像模块用于实现拍摄功能,如拍摄图像、视频等。音频模块用于实现音频功能,如播放音频,采集语音等。电源模块用于实现电源管理功能,如为电池充电、为设备供电、监测电池状态等。
本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读存储介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如下述实施例中所述的方法。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
相关技术中,BN在Batch较小时,统计的均值和标准差不准确,使得归一化的效果不好,较大的Batch又会导致GPU显存不足。BN在RNN网络中效果不好,由于RNN的输入是动态的,因此Batch的大小是变化的,因此,BN统计的均值和标准差不准确。BIN虽然通过可学习的参数将BN和IN结合在一起,但是没有考虑其他归一化的优点,使得最终归一化效果有限。BIN将两个归一化操作分别作用于同一特征图上,会导致较大的计算量增大。
为了解决上述技术问题,本公开实施例中,提供了一种归一化处理方法,具体可以包括步骤S310至步骤S330,其中:
在步骤S310中,获取待处理对象对应的特征图,并将所述特征图划分为多个子特征图;
在步骤S320中,通过多种归一化方式对所述子特征图进行归一化,得到各所述子特征图对应的参考结果;
在步骤S330中,根据所述参考结果得到初始归一化结果,对所述初始归一化结果进行拼接操作确定所述特征图对应的归一化结果,并根据所述归一化结果对所述待处理对象执行对应的操作。
本公开实施例中,一方面,由于使用了多种归一化方式来进行混合归一化,能够从不同的维度来进行归一化,增加了归一化所考虑的维度的全面性,提高归一化的准确性,且避免了单一方式进行归一化的局限性,增加了应用范围。另一方面,通过多种归一化方式进行混合归一化,由于多种归一化方式的每一种分别对其中一个子特征图进行归一化,降低了计算量,提高了归一化效率。
接下来,参考图3对本公开实施例中的归一化处理方法进行详细说明。
在步骤S310中,获取待处理对象对应的特征图,并将所述特征图划分为多个子特征图。
本公开实施例中,待处理对象可以为图像或者是其他类型的对象等等,具体根据应用场景而确定。特征图表示之前输入上某个特征分布的数据。在神经网络模型的每个卷积层,数据都是以三维形式存在的,其可以相当于多个二维图片叠在一起,其中每一个图片称为一个特征图。对于神经网络而言,层与层之间会有若干个卷积核,上一层和每个特征图跟每个卷积核做卷积,都会产生下一层的一个特征图。特征图可以如图4中所示,特征图可以用X表示。参考图4中所示,特征图可以包括多个维度,且多个维度可以为[N,H,W,C]。其中,N表示特征的Batch,即图像数量(n张图像);H代表特征的图像高度Height;W代表特征的图像宽度Width;C代表特征的Channel,即颜色通道。
本公开实施例中,可以将特征图划分为多个子特征图。子特征图指的是特征图的一部分,多个子特征图不同且多个子特征图互补成完整的特征图。子特征图的数量可以根据归一化方式的数量而确定,即子特征图的数量可以等于归一化方式的数量。例如归一化方式包括四种,则可以将特征图划分为四个子特征图等等。
具体地,可以根据归一化方式的数量对特征图进行平均划分,得到与归一化方式的数量相等的多个子特征图,即划分得到的每个子特征图的大小相等。在此基础上,可以按照通道将特征图进行平均划,得到多个子特征图。通道可以为颜色通道,例如R通道、G通道或者是B通道等等。举例而言,假设X是待归一化的特征图,将特征图X按通道等分成四份,得到多个子特征图(X1,X2,X3,X4)。
在步骤S320中,通过多种归一化方式对所述子特征图进行归一化,得到各所述子特征图对应的参考结果。
本公开实施例中,多种归一化方式可以包括实例归一化、批归一化、分组归一化以及层归一化中的至少两个,例如可以只包括实例归一化和批归一化,也可以包括实例归一化、批归一化以及分组归一化等等,还可以同时包括实例归一化、批归一化、分组归一化以及层归一化。归一化方式还可以包括其他归一化方式。所有的归一化方式中的部分或者是全部均可以进行组合形成混合归一化方式。对特征进行归一化时,可以按照公式(1)计算均值和标准差,以计算归一化的特征来进行归一化:
其中,In为输入特征,Out是归一化后的特征,需要求解的参数为输入特征的均值μIn和标准差σIn。
IN(Instance Normalization,实例归一化),BN(Batch Normalization,批归一化),GN(Group Normalization,分组归一化)和LN(Layer Normalization,层归一化)在计算单个均值和标准差时对应的特征图上的统计的数据范围完全不同,具体参考图5中所示。
具体地,批归一化在NxHxW上统计均值和标准差,主要解决是内部协变量偏移的问题。BN主要作用于Batch维度,对NxHxW做归一化,对于小的Batch效果不是很好。加入BN层能够使得模型的收敛速度加快。单个通道的均值和标准差的计算公式如公式(2)所示。其中,c代表通道的索引值,x为输入的特征图,ε是一个微小量,防止除零。
实例归一化在HxW上统计均值和标准差,和BN的最大区别在于,IN作用于单个实例,BN作用于一个Batch。IN多适用于生成模型,比如人脸修复,生成对抗网络。具体如公式(3)所示:
层归一化LN在HxWxC上统计均值和标准差,相比于BN,LN在Batch较小的情况下也能使用,常用于RNN模型,如公式(4)所示:
分组归一化GN沿channel方向分成G组,然后在每个组内沿C/GxHxW计算均值和标准差,用于每组的归一化计算,GN独立于Batch,IN和LN是GN的两种特殊情况:当G等于C时,GN变成了IN,当G=1时,GN变成了LN。具体如公式(5)所示:
BIN(Batch-Instance Normalization),将BN和IN进行结合,通过一个可学习参数ρ进行加权,设In为输入特征图,ρ是一个取值范围为0到1,BIN的计算公式如公式(6)所示:
Out=BN(In)*ρ+IN(In)*(1-ρ) 公式(6)
在将特征图划分为多个子特征图后,可以将每个子特征图分别经过多种归一化方式对应的模块,通过每种归一化方式对一种子特征图进行归一化处理。需要说明的是,归一化方式与子特征图之间是一一对应关系。每种归一化方式只能对一个子特征图进行归一化,而不能同时对多个子特征图进行归一化,以通过所有归一化方式进行归一化。
其中,可以通过多种归一化方式中的任意一种归一化方式来对子特征图进行归一化。具体地,可以按照预定顺序确定每个子特征图对应的归一化方式。预定顺序可以根据实际需求进行设置,对于不同的实际需求而言,其对应的预定顺序可能完全不同。并且,预定顺序不同,相应的神经网络模型的参数也不同。举例而言,预定顺序可以为分组归一化、层归一化、实例归一化以及批归一化的先后顺序。预定顺序也可以为层归一化、分组归一化、批归一化以及实例归一化的先后顺序。本公开实施例中,以预定顺序为分组归一化、层归一化、实例归一化以及批归一化的先后顺序为例进行说明。
参考结果指的是对每一种子特征图使用对应的归一化方式进行归一化得到的结果。通过对应的归一化方式对每个子特征图进行归一化,能够得到归一化模块输出的每个子特征图对应的参考结果。
举例而言,可通过分组归一化GN对子特征图X1进行归一化得到参考结果1,通过层归一化LN对子特征图X2进行归一化得到参考结果2,通过实例归一化IN对子特征图X3进行归一化得到参考结果3,通过批归一化BN对子特征图X4进行归一化得到参考结果4。
具体地,可以通过GN对子特征图X1沿C/GxHxW计算均值与标准差,通过LN对子特征图X2沿HxWxC计算均值与标准差,通过IN对子特征图X3沿HxW计算均值与标准差,通过BN对子特征图X4沿NxHxW计算均值与标准差,从而得到各自对应的参考结果。
在步骤S330中,根据所述参考结果得到初始归一化结果,对所述初始归一化结果进行拼接操作确定所述特征图对应的归一化结果,并根据所述归一化结果对所述待处理对象执行对应的操作。
本公开实施例中,参考结果为每个子特征图对应的归一化模块的输出。初始归一化结果指的是对参考结果进行处理得到的结果,其指的是局部归一化结果。归一化结果指的是对特征图进行归一化得到的最终结果,归一化结果属于整体结果。具体可以根据归一化方式的重要程度来确定初始归一化结果。重要程度不同,根据参考结果得到初始归一化结果的步骤也不同。拼接操作用于将不同子特征图的初始归一化结果进行组合,得到特征图对应的整体的归一化结果。
图6中示意性示出了确定初始归一化结果的流程图,参考图6中所示,主要包括步骤S610至步骤S630,其中:
在步骤S610中,确定各归一化方式的重要程度是否相同。若否,则转至步骤S620。若是,则转至步骤S630。
本步骤中,可以根据实际需求确定归一化方式的重要程度是否相同。多种不同的归一化方式,其重要程度可以完全不同,重要程度从大到小的排列顺序可以为:分组归一化、层归一化、实例归一化以及批归一化。重要程度从大到小的排列顺序也可以为:批归一化、分组归一化、层归一化以及实例归一化。除此之外,每种归一化方式的重要程度也可以相同,此处不作限定。
在步骤S620中,若各所述归一化方式的重要程度不同,根据各所述归一化方式对应的权重系数对各所述参考结果进行调整,根据调整后的参考结果确定初始归一化结果。
本步骤中,权重系数可以用于描述每个归一化方式的重要程度。并且,权重系数与重要程度正相关,即权重系数越大,重要程度越高。其中,可以对多个参考参数进行学习,得到每个归一化方式对应的权重系数。参考参数可以为可学习参数,具体可以通过反向传播方式对可学习参数进行调整,以更新每个参考参数对应的数值,从而在神经网络模型训练完成时将对应的参考参数确定为权重系数。即,按照反向传播方式对参考参数的数值进行调整,直至模型训练完成时确定参数学习完成,以得到权重系数。并且,权重系数为四个可学习参数经过激活函数后的输出值,权重系数的取值范围为0至1。激活函数可以为sigmoid函数,也可以为其他函数。
本步骤中,加入a1、a2、a3和a4四个可学习参数,可以使得神经网络对Y1、Y2、Y3、Y4四个部分特征进行平衡,避免了某一种归一化方式的结果占据主导地位所导致的局限性。能够根据多种归一化方式得到的归一化结果,提高结果的准确性。
在步骤S630中,若各所述归一化方式的重要程度相同,将各所述参考结果确定为所述初始归一化结果。
本步骤中,如果重要程度相同,可以将多个权重系数分别设为固定数值1,也可以直接去除权重系数a1、a2、a3和a4,即不使用权重系数。基于此,由于不考虑不同归一化方式之间的重要程度的影响,可以直接将各个归一化方式的参考结果作为初始归一化结果。
在得到初始归一化结果之后,对所述初始归一化结果进行拼接操作确定所述特征图对应的归一化结果。
本步骤中,在进行拼接操作时,可以按照通道维度将每个归一化方式的初始归一化结果拼接,从而得到特征图对应的归一化结果。通道维度可以为颜色通道,具体可以包括R通道、G通道以及B通道等等。
本公开实施例中,引入可学习参数对应的权重系数,用于对多种归一化方式的参考结果进行加权,能够对每个子特征图的参考结果进行平衡。根据重要程度对每种归一化方式对子特征图的初始归一化结果进行拼接,能够提高准确性。
图7中示出了进行混合归一化的示意图,参考图7中所示,主要包括:
假设X是待归一化的特征图,将特征图X按通道等分成四份得到多个子特征图(X1,X2,X3,X4)。分别经过GN、LN、IN和BN四个模块得到每个子特征图的参考结果。然后将输出的参考结果分别乘以相应的权重系数a1、a2、a3和a4,得到对应的初始归一化结果Y1、Y2、Y3和Y4,最后将初始归一化结果按通道维度拼接在一起得到归一化结果。其中a1、a2、a3和a4分别是四个可学习的参考参数经过sigmoid函数后的输出值,权重系数a1至a4的取值范围为0到1。
本公开实施例中的技术方案,混合归一化方式结合了多种归一化方式,由于使用了多种归一化方式来进行混合归一化,能够从不同的维度来进行归一化,增加了归一化所考虑的维度的全面性,提高归一化的准确性,且避免了单一方式进行归一化的局限性,增加了应用范围,提高了归一化的准确性。混合归一化中引入可学习参数,用于学习对各种归一化结果进行加权,使得神经网络学习权重系数来平衡各个归一化方式的初始归一化结果,从而提高归一化结果的准确性。通过多种归一化方式进行混合归一化,由于多种归一化方式的每一种只对其中一个子特征图进行归一化,减少了需要的计算资源和存储空间,降低了计算量,提高了归一化效率。混合归一化可以应用于各种需要归一化操作的场景,提高了通用性。结合多种归一化操作的结果,增加模型的特征。混合归一化不会增加计算量且提高了原始模型的性能。并且能够根据归一化结果对待处理对象进行精准操作。
本公开实施例中的方法,可以用于任何需要进行归一化的应用场景中,如分类、识别、检测、分割、人脸修复、视频超分等场景,增加了应用范围,提高了通用性。在得到归一化结果之后,可以在归一化结果的基础上对待处理对象执行对应的操作。对应的操作具体根据归一化的应用场景而确定。例如,可以根据归一化结果对待处理对象进行识别等等。
本公开实施例中提供了一种归一化处理装置,参考图8中所示,该归一化处理装置800可以包括:
特征划分模块801,用于获取待处理对象对应的特征图,并将所述特征图划分为多个子特征图;
归一化模块802,用于通过多种归一化方式对所述子特征图进行归一化,得到各所述子特征图对应的参考结果;
拼接模块803,用于根据所述参考结果得到初始归一化结果,对所述初始归一化结果进行拼接操作确定所述特征图对应的归一化结果,并根据所述归一化结果对所述待处理对象执行对应的操作。
在本公开的一种示例性实施例中,所述多种归一化方式包括实例归一化、批归一化、分组归一化以及层归一化中的至少两种。
在本公开的一种示例性实施例中,特征划分模块包括:划分控制模块,用于按照多个通道维度对所述待处理特征图进行划分,得到所述多个子特征图,所述子特征图的数量与所述归一化方式的数量相同。
在本公开的一种示例性实施例中,拼接模块包括:第一确定模块,用于若各所述归一化方式的重要程度不同,根据各所述归一化方式对应的权重系数对各所述参考结果进行调整,根据调整后的参考结果确定初始归一化结果;第二确定模块,用于若各所述归一化方式的重要程度相同,将各所述参考结果确定为所述初始归一化结果。
在本公开的一种示例性实施例中,拼接模块包括:拼接控制模块,用于按照通道维度对所述初始归一化结果进行拼接操作,确定所述归一化结果。
在本公开的一种示例性实施例中,所述装置还包括:权重确定模块,用于对多个参考参数进行学习,得到各所述归一化方式对应的所述权重系数。
在本公开的一种示例性实施例中,权重确定模块包括:权重学习模块,用于通过反向传播方式调整所述多个参考参数的数值以进行学习,确定各所述归一化方式对应的所述权重系数。
需要说明的是,上述归一化处理装置中各模块的具体细节已经在对应的归一化处理方法中进行了详细描述,因此此处不再赘述。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
本领域技术人员在考虑说明书及实践这里公开的内容后,将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。
Claims (10)
1.一种归一化处理方法,其特征在于,包括:
获取待处理对象对应的特征图,并将所述特征图划分为多个子特征图;
通过多种归一化方式对所述子特征图进行归一化,得到各所述子特征图对应的参考结果;
根据所述参考结果得到初始归一化结果,对所述初始归一化结果进行拼接操作确定所述特征图对应的归一化结果,并根据所述归一化结果对所述待处理对象执行对应的操作。
2.根据权利要求1所述的归一化处理方法,其特征在于,所述多种归一化方式包括实例归一化、批归一化、分组归一化以及层归一化中的至少两种。
3.根据权利要求1所述的归一化处理方法,其特征在于,所述将所述待处理特征图划分为多个子特征图,包括:
按照多个通道维度对所述待处理特征图进行划分,得到所述多个子特征图,所述子特征图的数量与所述归一化方式的数量相同。
4.根据权利要求1所述的归一化处理方法,其特征在于,所述根据所述参考结果得到初始归一化结果,包括:
若各所述归一化方式的重要程度不同,根据各所述归一化方式对应的权重系数对各所述参考结果进行调整,根据调整后的参考结果确定初始归一化结果;
若各所述归一化方式的重要程度相同,将各所述参考结果确定为所述初始归一化结果。
5.根据权利要求1所述的归一化处理方法,其特征在于,所述对所述初始归一化结果进行拼接操作确定所述特征图对应的归一化结果,包括:
按照通道对所述初始归一化结果进行拼接操作,确定所述归一化结果。
6.根据权利要求1所述的归一化处理方法,其特征在于,所述方法还包括:
对多个参考参数进行学习,得到各所述归一化方式对应的所述权重系数。
7.根据权利要求6所述的归一化处理方法,其特征在于,所述对多个参考参数进行学习,得到各所述归一化方式对应的所述权重系数,包括:
通过反向传播方式调整所述多个参考参数的数值以进行学习,确定各所述归一化方式对应的所述权重系数。
8.一种归一化处理装置,其特征在于,包括:
特征划分模块,用于获取待处理对象对应的特征图,并将所述特征图划分为多个子特征图;
归一化模块,用于通过多种归一化方式对所述子特征图进行归一化,得到各所述子特征图对应的参考结果;
拼接模块,用于根据所述参考结果得到初始归一化结果,对所述初始归一化结果进行拼接操作确定所述特征图对应的归一化结果,并根据所述归一化结果对所述待处理对象执行对应的操作。
9.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-7任意一项所述的归一化处理方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任意一项所述的归一化处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111322564.3A CN113989121A (zh) | 2021-11-09 | 2021-11-09 | 归一化处理方法及装置、电子设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111322564.3A CN113989121A (zh) | 2021-11-09 | 2021-11-09 | 归一化处理方法及装置、电子设备、存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113989121A true CN113989121A (zh) | 2022-01-28 |
Family
ID=79747473
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111322564.3A Pending CN113989121A (zh) | 2021-11-09 | 2021-11-09 | 归一化处理方法及装置、电子设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113989121A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116913525A (zh) * | 2023-09-12 | 2023-10-20 | 北京万物成理科技有限公司 | 特征组归一化方法、装置、电子设备和存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108875787A (zh) * | 2018-05-23 | 2018-11-23 | 北京市商汤科技开发有限公司 | 一种图像识别方法及装置、计算机设备和存储介质 |
CN113515992A (zh) * | 2020-11-06 | 2021-10-19 | 阿里巴巴集团控股有限公司 | 目标识别方法、设备及存储介质 |
US20210326710A1 (en) * | 2020-04-16 | 2021-10-21 | Tencent America LLC | Neural network model compression |
-
2021
- 2021-11-09 CN CN202111322564.3A patent/CN113989121A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108875787A (zh) * | 2018-05-23 | 2018-11-23 | 北京市商汤科技开发有限公司 | 一种图像识别方法及装置、计算机设备和存储介质 |
US20210326710A1 (en) * | 2020-04-16 | 2021-10-21 | Tencent America LLC | Neural network model compression |
CN113515992A (zh) * | 2020-11-06 | 2021-10-19 | 阿里巴巴集团控股有限公司 | 目标识别方法、设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
SEONGUK SEO: "Learning to Optimize Domain Specific Normalization for Domain Generalization", 《ECCV2020》, 17 November 2020 (2020-11-17) * |
熊子婕: "基于全局特征和局部特征拼接的行人重识别方法研究", 《中国优秀硕士学位论文全文数据库》, 31 August 2020 (2020-08-31) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116913525A (zh) * | 2023-09-12 | 2023-10-20 | 北京万物成理科技有限公司 | 特征组归一化方法、装置、电子设备和存储介质 |
CN116913525B (zh) * | 2023-09-12 | 2024-02-06 | 北京万物成理科技有限公司 | 特征组归一化方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111476309B (zh) | 图像处理方法、模型训练方法、装置、设备及可读介质 | |
CN109800732B (zh) | 用于生成漫画头像生成模型的方法和装置 | |
CN111950723B (zh) | 神经网络模型训练方法、图像处理方法、装置及终端设备 | |
US20230394669A1 (en) | Point cloud segmentation method and apparatus, device, and storage medium | |
US20190147013A1 (en) | Apparatus and method of low complexity optimization solver for path smoothing with constraint variation | |
CN108701355B (zh) | Gpu优化和在线基于单高斯的皮肤似然估计 | |
US11928860B2 (en) | On the fly adaptive convolutional neural network for variable computational budget | |
US11699070B2 (en) | Method and apparatus for providing rotational invariant neural networks | |
EP4447008A1 (en) | Facial recognition method and apparatus | |
CN111967515A (zh) | 图像信息提取方法、训练方法及装置、介质和电子设备 | |
CN112990440A (zh) | 用于神经网络模型的数据量化方法、可读介质和电子设备 | |
CN116229054A (zh) | 图像处理方法、装置及电子设备 | |
CN113989121A (zh) | 归一化处理方法及装置、电子设备、存储介质 | |
CN111916097A (zh) | 用于语音增强的高斯加权自注意力的方法和系统 | |
CN109697083B (zh) | 数据的定点化加速方法、装置、电子设备及存储介质 | |
CN115605922A (zh) | 自适应运行时高效图像分类的输入图像大小可切换网络 | |
CN113537470A (zh) | 模型量化方法及装置、存储介质及电子设备 | |
CN111814811A (zh) | 图像信息提取方法、训练方法及装置、介质和电子设备 | |
WO2023061195A1 (zh) | 图像获取模型的训练方法、图像检测方法、装置及设备 | |
US11527022B2 (en) | Method and apparatus for transforming hair | |
CN117315758A (zh) | 面部表情的检测方法、装置、电子设备及存储介质 | |
CN113780534B (zh) | 网络模型的压缩方法、图像生成方法、装置、设备及介质 | |
CN111583139B (zh) | 腮红调整方法、装置、电子设备及计算机可读介质 | |
CN114998172A (zh) | 图像处理方法及相关系统 | |
CN114254563A (zh) | 数据处理方法及装置、电子设备、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |