TWI751668B

TWI751668B - 影像歸一化處理方法、電腦可讀取記錄媒體和電子設備

Info

Publication number: TWI751668B
Application number: TW109129634A
Authority: TW
Inventors: 張瑞茂; 彭章琳; 吳淩云; 羅平
Original assignee: 大陸商深圳市商湯科技有限公司
Priority date: 2020-02-27
Filing date: 2020-08-28
Publication date: 2022-01-01
Also published as: WO2021169160A1; CN111325222A; TW202133032A; US20220415007A1

Abstract

本發明提供了一種影像歸一化處理方法，其中，該方法包括：採用K個歸一化因子，分別對特徵圖進行歸一化處理，獲得與所述K個歸一化因子各自對應的備選歸一化特徵圖，其中K是大於1的整數；確定所述K個歸一化因子中各個歸一化因子的第一權重值；根據所述K個歸一化因子各自對應的備選歸一化特徵圖和所述第一權重值，確定與所述特徵圖對應的目標歸一化特徵圖。

Description

影像歸一化處理方法、電腦可讀取記錄媒體和電子設備

本發明涉及深度學習領域，尤其涉及一種影像歸一化處理方法、電腦記錄媒體和電子設備。 [相關申請的交叉引用]

本專利申請要求於2020年2月27日提交的、申請號爲202010123511.8、發明名稱爲“圖像歸一化處理方法及裝置、存儲介質”的中國專利申請的優先權，該申請的全文以引用的方式併入本文中。

在自然語言處理、語音識別、電腦視覺等任務中，各種歸一化（Normalization）技術成為深度學習所必不可少的模組。歸一化技術通常在輸入張量的不同維度進行統計量的計算，從而讓不同的歸一化方法適用於不同的視覺任務。

本發明提供了一種影像歸一化處理方法、電腦記錄媒體和電子設備。

根據本發明實施例的第一方面，提供一種影像歸一化處理方法，所述方法包括：採用K個歸一化因子，分別對特徵圖進行歸一化處理，獲得與所述K個歸一化因子各自對應的備選歸一化特徵圖，其中K是大於1的整數；確定所述K個歸一化因子中各個歸一化因子的第一權重值；根據所述K個歸一化因子各自對應的備選歸一化特徵圖和所述第一權重值，確定與所述特徵圖對應的目標歸一化特徵圖。

根據本發明實施例的第二方面，提供一種影像歸一化處理裝置，所述裝置包括：歸一化處理模組，用於採用K個歸一化因子，分別對特徵圖進行歸一化處理，獲得與所述K個歸一化因子各自對應的備選歸一化特徵圖，其中K是大於1的整數；第一確定模組，用於確定所述K個歸一化因子中各個歸一化因子的第一權重值；第二確定模組，用於根據所述K個歸一化因子各自對應的備選歸一化特徵圖和所述第一權重值，確定與所述特徵圖對應的目標歸一化特徵圖。

根據本發明實施例的第三方面，提供一種電腦可讀取記錄媒體，所述電腦可讀取記錄媒體儲存有電腦程式，當處理器調用所述電腦程式時，所述處理器用於執行上述第一方面所述的影像歸一化處理方法。

根據本發明實施例的第四方面，提供一種電子設備，包括：處理器；用於儲存所述處理器可執行指令的記憶體；其中，所述處理器被配置為調用所述記憶體中儲存的可執行指令，實現第一方面所述的影像歸一化處理方法。

根據本發明實施例的第五方面，提供一種電腦程式產品，所述電腦程式產品中儲存有計算機可讀指令，當所述計算機可讀指令被處理器執行時實現第一方面所述的影像歸一化處理方法。

這裡將詳細地對示例性實施例進行說明，其示例表示在附圖中。下面的描述涉及附圖時，除非另有表示，不同附圖中的相同數字表示相同或相似的要素。以下示例性實施例中所描述的實施方式並不代表與本發明相一致的所有實施方式。相反，它們僅是與如所附申請專利範圍中所詳述的、本發明的一些方面相一致的裝置和方法的例子。

在本發明使用的術語是僅僅出於描述特定實施例的目的，而非旨在限制本發明。在本發明和所附申請專利範圍中所運行的單數形式的“一種”、“所述”和“該”也旨在包括多數形式，除非上下文清楚地表示其他含義。還應當理解，本文中使用的術語“和/或”是指並包含一個或多個相關聯的列出項目的任何或所有可能組合。

應當理解，儘管在本發明可能採用術語第一、第二、第三等來描述各種信息，但這些信息不應限於這些術語。這些術語僅用來將同一類型的信息彼此區分開。例如，在不脫離本發明範圍的情況下，第一信息也可以被稱為第二信息，類似地，第二信息也可以被稱為第一信息。取決於語境，如在此所使用的詞語“如果”可以被解釋成為“在……時”或“當……時”或“響應於確定”。

可選擇歸一化（Switchable Normalization，SN）方法可以面向每個卷積層，自適應地將不同的歸一化算子進行線性組合，使得深度神經網路中每一層都能優化出各自獨立的歸一化方法，適用於各種視覺任務。然而，SN雖然可以對不同的網路結構、不同的資料集學習不同的歸一化參數，但是並不能根據樣本特徵的變化，動態地調整歸一化參數。限制了歸一化的靈活性，無法獲得更優的深度神經網路。

本發明實施例提供了一種影像歸一化處理方法，可以適用於不同的網路模型和視覺任務，根據特徵圖自適應性地確定不同的歸一化因子的第一權重值，提高了歸一化算法的靈活性。在影像處理領域，可以對影像內容進行識別從而輸出對應的結果，具體可以但不限於表現為影像識別、目標檢測、目標分割等技術。識別影像內容通常可以是先提取影像中的影像特徵，再根據提取的特徵輸出識別結果。例如，在進行人臉識別的時候，可以提取影像中的人臉特徵，根據提取的人臉特徵識別人臉的屬性。可理解的是，本發明實施例提供的影像歸一化方法可以應用於影像處理領域。

例如圖1所示，圖1是根據一示例性實施例繪示的一種影像歸一化處理方法，該方法包括以下步驟110-130：

在步驟110中，採用不同的歸一化因子，分別對特徵圖進行歸一化處理，獲得與各個歸一化因子對應的備選歸一化特徵圖。在一些實施例中，採用K個歸一化因子，分別對特徵圖進行歸一化處理，獲得與K個歸一化因子各自對應的備選歸一化特徵圖。其中K是大於1的整數。

在本發明實施例中，可以先獲取待處理影像對應的特徵圖，其中，待處理影像可以是任意一張需要進行歸一化處理的影像。通過對待處理影像提取不同維度的影像特徵，可以得到該待處理影像對應的特徵圖，特徵圖的數目可以為

，

為正整數。

其中，影像特徵可以包括影像中的顏色特徵、紋理特徵、形狀特徵等。顏色特徵是一種全域特徵，描述了影像所對應的對象的表面顏色屬性，紋理特徵也是一種全域特徵，它描述了影像所對應對象的表面紋理屬性，形狀特徵有兩類表示方法，一類是輪廓特徵，另一類是區域特徵，影像的輪廓特徵主要針對對象的外邊界，而影像的區域特徵則關係到影像區域的形狀。

在本發明實施例中，可以通過預先訓練好的神經網路，來提取待處理影像的影像特徵。該神經網路可以包括但不限於VGG Net（Visual Geometry Group Network，視覺幾何群網路）、GoogleNet（Google Network，谷歌網路）等。還可以是通過其他方法來提取待處理影像的影像特徵，在此不做具體限定。

在本發明實施例中，不同的歸一化因子是指不同的歸一化處理方法，包括但不限於批歸一化（BatchNormalization，BN）方法，層歸一化（LayerNormalization，LN）方法，實例歸一化（InstanceNormalization，IN）方法，組歸一化（GroupNormalization，GN）方法。

在採用所述不同的歸一化因子，分別對特徵圖進行歸一化處理之前，先分別確定各個歸一化因子對應的統計量

，其中，統計量

可以包括變異數和/或均值。這裡的統計量

是與歸一化因子相對應的，即每個歸一化因子對應一個或一組統計量

。

進一步地，採用不同的統計量

，分別對特徵圖進行歸一化處理，得到與各個歸一化因子對應的備選歸一化特徵圖。

例如，特徵圖的數目為

張，歸一化因子的總數目為

，則可以得到

組備選歸一化特徵圖，每組備選歸一化特徵圖中包括

張備選歸一化特徵圖。

在步驟120中，確定各個歸一化因子的第一權重值。

在本發明實施例中，可以根據特徵圖，自適應地確定與特徵圖對應的每個歸一化因子的第一權重值。

其中，歸一化因子的第一權重值用於表示採用該歸一化因子對特徵圖進行歸一化處理後，得到的備選歸一化特徵圖佔K個備選歸一化特徵圖的比重。在本發明實施例中，可以採用K個歸一化因子，確定特徵圖對應的K個第一特徵向量，根據這K個第一特徵向量之間的相關性，得到各個歸一化因子的第一權重值。

在步驟130中，根據各個歸一化因子對應的備選歸一化特徵圖和各個歸一化因子的所述第一權重值，確定與所述特徵圖對應的目標歸一化特徵圖。

在本發明實施例中，針對各個備選歸一化特徵圖，將該備選歸一化特徵圖和該備選歸一化特徵圖對應的歸一化因子的第一權重值相乘，得到與該備選歸一化特徵圖對應的第一歸一化特徵圖；結合該備選歸一化特徵圖對應的歸一化因子的第二權重值對該第一歸一化特徵圖進行尺寸的調整，得到與該備選歸一化特徵圖對應的第二歸一化特徵圖；結合該備選歸一化特徵圖對應的歸一化因子的目標偏移值對該第二歸一化特徵圖進行移動，得到與該備選歸一化特徵圖對應的第三歸一化特徵圖。最終將各個第三歸一化特徵圖相加，就可以得到特徵圖對應的目標歸一化特徵圖。

其中，第二權重值用於調整第一歸一化特徵圖的尺寸，通過對第一歸一化特徵圖進行縮小或放大，使得縮放後的第二歸一化特徵圖符合目標歸一化特徵圖所對應的尺寸需求。第二權重值可以在神經網路的訓練過程中，根據樣本影像的尺寸、神經網路最終需要輸出的歸一化特徵圖的尺寸來確定，一旦神經網路訓練完成，第二權重值針對同一歸一化因子保持不變。

目標偏移值用來移動第二歸一化特徵圖，使得移動後得到的第三歸一化特徵圖的位置上下重疊，便於後續對第三歸一化特徵圖進行相加。目標偏移值同樣可以在神經網路的訓練過程中，根據樣本影像的尺寸、神經網路最終需要輸出的歸一化特徵圖的尺寸來確定，一旦神經網路訓練完成，目標偏移值針對同一歸一化因子保持不變。

另外，在本發明實施例中，目標歸一化特徵圖的數目與特徵圖的數目相同。

例如，特徵圖的數目為

，最終得到的目標歸一化特徵圖的數目也為

。

上述實施例中，可以採用不同的歸一化因子，分別對特徵圖進行歸一化處理，從而得到與各個歸一化因子對應的備選歸一化特徵圖。根據與各個歸一化因子對應的備選歸一化特徵圖和各個歸一化因子的第一權重值，確定與特徵圖對應的目標歸一化特徵圖。從而實現了根據特徵圖，自適應性地確定不同的歸一化因子的第一權重值的目的，提高了歸一化算法的靈活性。

在一些實施例中，可以用以下公式（1）確定各個歸一化因子的第一權重值：

（1）

其中，

表示第

張特徵圖，

表示第

張特徵圖對應的第k個歸一化因子的第一權重值，k表示1至K中的任一整數，

表示歸一化因子的總數目，

表示基於第k個歸一化因子計算得到的的統計量，包括均值

和/或變異數

，

表示用於計算第k個歸一化因子的第一權重值的函數，

表示可學習參數。

在一些實施例中，特徵圖的數目為多個時，每張特徵圖的處理方式一致，為了便於描述，可以忽略公式1中的

，特徵圖可以僅用其中一張特徵圖

來表示，即在本發明下面的實施例中，需要確定與特徵圖X對應的各個歸一化因子的第一權重值。

例如圖2所示，步驟120可以包括121-123：

在步驟121中，針對各個歸一化因子，確定與該歸一化因子對應的第一特徵向量。

在本發明實施例中，可以對特徵圖進行下采樣，獲得與各個歸一化因子對應的第二特徵向量

。採用該歸一化因子，確定該歸一化因子對應的統計量

，根據該統計量

對與該歸一化因子對應的第二特徵向量

進行歸一化處理，獲得與該歸一化因子對應的第三特徵向量

，其中第三特徵向量的數目為

。對第三特徵向量

進行降維處理後，獲得第一特徵向量

，其中，第一特徵向量的數目也為

。

在步驟122中，根據與各個歸一化因子對應的第一特徵向量之間的相關性，確定相關性矩陣。

在本發明實施例中，可以根據每個第一特徵向量

和每個第一特徵向量

對應的轉置向量

之間的乘積，來描述多個第一特徵向量之間的相關性，從而確定相關性矩陣

。

在步驟123中，根據所述相關性矩陣，確定各個歸一化因子的所述第一權重值。

在本發明實施例中，可以將相關性矩陣

依次通過第一全連接網路、tanh（雙曲正切）變化和第二全連接網路，轉換為備選向量，再對該備選向量進行歸一化之後得到目標向量

。根據目標向量

，得到各個歸一化因子的所述第一權重值。

上述實施例中，可以根據各個歸一化因子，先確定與各個歸一化因子對應的第一特徵向量，再確定各個第一特徵向量之間的相關性，進而確定出各個歸一化因子的第一權重值，實現簡便，可用性高。

在一些實施例中，例如圖3所示，步驟121可以包括1211-1213：

在步驟1211中，對所述特徵圖進行下采樣，獲得與所述特徵圖對應的第二特徵向量。

在本發明實施例中，可以通過平均池化或最大池化的方法對特徵圖進行下采樣，從而得到與特徵圖對應的K個第二特徵向量。在本發明中，通過

表示第

張特徵圖，每張特徵圖的處理方式一致，為了便於描述，忽略

，特徵圖可以僅用

來表示。在進行下采樣之後，可以得到與特徵圖對應的K個第二特徵向量

。其中，

是

維的，

是特徵圖的通道數目。

在步驟1212中，針對各個歸一化因子，採用該歸一化因子，對與該歸一化因子對應的第二特徵向量進行歸一化處理，獲得第三特徵向量。

在本發明實施例中，可以基於各個歸一化因子，計算與該歸一化因子對應的統計量

，其中，

包括均值和/或變異數（Variance）。在本發明實施例中，

可以同時包括變異數和均值。

根據統計量

，分別對第二特徵向量

進行歸一化處理，得到

個第三特徵向量

，其中，

也是

維的。

在步驟1213中，對所述第三特徵向量進行降維處理，獲得與該歸一化因子對應的第一特徵向量。

在本發明實施例中，在進行降維處理時，可以採用卷積方式，為了減少降維處理的計算開銷，可以採用分組卷積的方式，將特徵圖對應的通道數目

與預設超參數

的商作為所述分組數目，例如，特徵圖

對應的通道數目為

，預設超參數為

，則分組數目為

。這樣可以確保整個降維處理的過程中的參數量恆定為

，獲得

個第一特徵向量

，第一特徵向量

是

維的。

上述實施例中，對特徵圖進行下采樣後，獲得對應的K個第二特徵向量。採用K個歸一化因子，分別對這K個第二特徵向量進行歸一化處理，獲得K個第三特徵向量，再對這K個第三特徵向量進行降維處理，獲得K個第一特徵向量。便於後續確定不同的歸一化因子的第一權重值，可用性高。

在一些實施例中，例如圖4所示，步驟122可以包括1221-1222：

在步驟1221中，確定每個第一特徵向量對應的轉置向量。

在本發明實施例中，可以為每個第一特徵向量

確定對應的轉置向量

。

在步驟1222中，針對每個第一特徵向量，將該第一特徵向量和各個轉置向量相乘，獲得所述相關性矩陣。

在本發明實施例中，任意一個第一特徵向量

與任意一個轉置向量

相乘，最終可以得到相關性矩陣

。其中，

是

維的。在一些實施例中，以K=5、C/r=3為例，確定第一特徵向量1

對應的第一轉置向量，確定第一特徵向量2

對應的第二轉置向量，確定第一特徵向量3

對應的第三轉置向量，確定第一特徵向量4

對應的第四轉置向量，確定第一特徵向量5

對應的第五轉置向量；第一特徵向量1與第一轉置向量、第二轉置向量、第三轉置向量、第四轉置向量和第五轉置向量分別相乘，得到相關性矩陣的第一行中的元素；第一特徵向量2與第一轉置向量、第二轉置向量、第三轉置向量、第四轉置向量和第五轉置向量分別相乘，得到相關性矩陣的第二行中的元素；第一特徵向量3與第一轉置向量、第二轉置向量、第三轉置向量、第四轉置向量和第五轉置向量分別相乘，得到相關性矩陣的第三行中的元素；第一特徵向量4與第一轉置向量、第二轉置向量、第三轉置向量、第四轉置向量和第五轉置向量分別相乘，得到相關性矩陣的第四行中的元素；第一特徵向量5與第一轉置向量、第二轉置向量、第三轉置向量、第四轉置向量和第五轉置向量分別相乘，得到相關性矩陣的第五行中的元素。這樣，得到了

維的相關性矩陣。

上述實施例中，針對各個第一特徵向量，利用該第一特徵向量和各個轉置向量的乘積來描述多個第一特徵向量之間的相關性，從而得到相關性矩陣，便於後續確定不同的歸一化因子的第一權重值，可用性高。

在一些實施例中，例如圖5所示，步驟123可以包括1231-1233：

在步驟1231中，依次通過第一全連接網路、雙曲正切變換和第二全連接網路，將所述相關性矩陣轉換為備選向量。

在本發明實施例中，相關性矩陣

的維度為

，可以先將相關性矩陣

輸入第一全連接網路，其中，全連接網路是指由全連接層組成的神經網路，該神經網路中每一層的每一個結點都與相鄰網路層的每一個結點相連。再通過tanh（雙曲正切）變化將相關性矩陣

的維度從

轉換為

，其中

是預設超參數，可以選取任意正整數值，例如50。

進一步地，可以再通過第二全連接網路將維度由

轉換為

，獲得

維的備選向量。

在步驟1232中，對所述備選向量中的值進行歸一化處理，獲得歸一化處理後的目標向量。

在本發明實施例中，可以通過歸一化函數，例如softmax函數，將

維的備選向量中的值進行歸一化處理，確保

，從而獲得歸一化處理後的

維的目標向量

。在本發明實施例中，在確定一張特徵圖對應的目標歸一化特徵圖時，

與

可互換使用。

在步驟1233中，根據所述目標向量，確定各個歸一化因子的所述第一權重值。

本發明實施例中，目標向量

是

維的，可以將目標向量中第k個維度的值作為與第k個歸一化因子的所述第一權重值。

上述實施例中，可以依次通過第一全連接網路、雙曲正切變換和第二全連接網路，將所述相關性矩陣的維度轉換為備選向量，然後對備選向量中的值進行歸一化處理，獲得歸一化處理後的目標向量，再根據目標向量，就可以確定不同的歸一化因子的第一權重值，可用性高。

在一些實施例中，例如圖6所示，上述步驟130可以包括131-134：

在步驟131中，針對各個歸一化因子，將與該歸一化因子對應的備選歸一化特徵圖與該歸一化因子的所述第一權重值相乘，獲得與該歸一化因子對應的第一歸一化特徵圖。

在本發明實施例中，每個歸一化因子分別對特徵圖進行歸一化處理，得到與該歸一化因子對應的備選歸一化特徵圖，將備選歸一化特徵圖與對應的歸一化因子的第一權重值相乘，得到第一歸一化特徵圖。

在步驟132中，針對各個所述歸一化因子，根據與該歸一化因子對應的第二權重值，調整與該歸一化因子對應的第一歸一化特徵圖的尺寸，獲得與該歸一化因子對應的第二歸一化特徵圖。

在本發明實施例中，第二權重值在神經網路訓練完成後，針對同一歸一化因子是保持不變的。可以通過與該歸一化因子對應的第二權重值與對應的第一歸一化特徵圖相乘，來對該對應的第一歸一化特徵圖進行尺寸的調整，從而獲得第二歸一化特徵圖。第二歸一化特徵圖的尺寸符合最終的目標歸一化特徵圖所需要的尺寸。

在步驟133中，針對各個所述歸一化因子，根據與該歸一化因子對應的目標偏移值，移動與該歸一化因子對應的第二歸一化特徵圖，獲得與該歸一化因子對應的第三歸一化特徵圖。

在本發明實施例中，目標偏移值在神經網路訓練完成後，針對同一歸一化因子是保持不變的。可以通過與該歸一化因子對應的目標偏移值與對應的第二歸一化特徵圖相加，來對該對應的第二歸一化特徵圖進行移動，從而獲得第三歸一化特徵圖。各個歸一化因子對應的第三歸一化特徵圖的位置上下重疊。

在步驟134中，將所述K個第三歸一化特徵圖相加後，獲得與所述特徵圖對應的目標歸一化特徵圖。

在本發明實施例中，各個第三歸一化特徵圖的位置是上下重疊的，對各個第三歸一化特徵圖中同一位置的像素值進行相加，最終可以得到與特徵圖

對應的目標歸一化特徵圖

。

在本發明實施例中，步驟103可以通過以下公式（2）表示：

（2）

其中，

表示特徵圖

對應的目標歸一化特徵圖。

表示第

個歸一化因子的第一權重值。

表示第

個歸一化因子對應的統計量

中的均值。

表示第

個歸一化因子對應的統計量

中的變異數。

是為了避免變異數為零時，公式2中的分母取值也為零的一個預設值。

表示第

個歸一化因子對應的第二權重值，相當於比例參數，用於縮放第一歸一化特徵圖。

表示第

個歸一化因子對應的目標偏移值，相當於偏移參數，用於移動第二歸一化特徵圖。通過

和

可以得到最終符合尺寸需求的目標歸一化特徵圖

。

通過公式（2）可以看出，均值

和變異數

採用相同的權重值。如果待處理影像是訓練過程中的樣本影像，那麼可以避免均值和變異數採用不同的權重值導致的過擬合現象。在本發明實施例中，通過不同的歸一化因子對應的權重值將各個備選歸一化特徵圖進行線性組合，而不是採用不同的歸一化因子對各個備選歸一化特徵圖進行線性組合，使得歸一化算法更加靈活，可用性更高。

另外，在本發明實施例中，為了獲得更加優化的目標歸一化特徵圖，針對每個歸一化因子引入第二權重值和目標偏移值。其中，第二權重值和目標偏移值可以在神經網路的歸一化層訓練過程中得到，訓練完成後針對同一歸一化因子保持不變。

上述實施例中，針對各個歸一化因子，將該歸一化因子對應的備選歸一化特徵圖與該歸一化因子的所述第一權重值相乘，獲得與該歸一化因子對應的第一歸一化特徵圖；通過與該歸一化因子對應的第二權重值和目標偏移值，對與該歸一化因子對應的第一歸一化特徵圖進行尺寸的調整和移動；將尺寸調整和移動後的第三歸一化特徵圖相加，獲得與所述特徵圖對應的目標歸一化特徵圖。從而根據不同的歸一化因子，靈活地確定出特徵圖對應的目標歸一化特徵圖，在實際應用時可以替換各種神經網路中的任意歸一化層，易於實現與優化。

在一些實施例中，例如圖7所示，提供了一種影像歸一化處理過程的框架圖。

針對特徵圖

，可以採用歸一化因子

計算出該歸一化因子

對應的統計量

，統計量

包括均值

和變異數

，基於統計量

，分別對特徵圖

進行歸一化處理，可以得到K個備選歸一化特徵圖。

另外，通過平均池化或最大池化的方法對特徵圖

進行下采樣，獲得與特徵圖

對應的K個第二特徵向量

。根據統計量

分別對第二特徵向量

進行歸一化處理，獲得

個第三特徵向量

。通過分組卷積，對

個第三特徵向量

進行降維處理後，獲得與特徵圖

對應的

個第一特徵向量

。

可以確定每個第一特徵向量

對應的轉置向量

。任意一個第一特徵向量

與任意一個轉置向量

相乘，可以用來描述多個第一特徵向量之間的相關性，最終得到相關性矩陣

。其中，

是

維的。

將相關性矩陣

輸入第一全連接網路，再通過tanh變化將相關性矩陣

的維度從

轉換為

，其中

是預設超參數，可以選取任意正整數值，例如50。進一步地，可以再通過第二全連接網路將維度由

轉換為

，得到備選向量。

採用歸一化函數，例如softmax函數對備選向量進行歸一化處理，讓

，得到歸一化之後的目標向量

，讓目標向量

每個維度的值作為對應的歸一化因子的第一權重值。這樣，根據特徵圖，自適應性地確定不同的歸一化因子的第一權重值，提高了歸一化算法的靈活性。

將K個備選歸一化特徵圖分別與對應的歸一化因子的第一權重值

相乘後，獲得K個第一歸一化特徵圖。K個第一歸一化特徵圖分別與第二權重值

相乘，獲得K個第二歸一化特徵圖。K個第二歸一化特徵圖再分別與目標偏移值

相加，獲得K個第三歸一化特徵圖。最終將這K個第三歸一化特徵圖相加，獲得與特徵圖

對應的目標歸一化特徵圖

，其中，圖7中未繪示

和

。

上述實施例中，可以確定不同歸一化因子的第一權重值，拓展了影像歸一化方法可用於分析的範疇，使得在同一個框架內對不同粒度的資料內容進行分析成為可能，推動了深度學習歸一化技術的前沿發展。另外，通過設計上述影像歸一化處理方法，使得整個網路在優化穩定的同時能夠減少過擬合現象。該歸一化層可能替換網路結構中任意的歸一化層。相比於其他歸一化方法具有易於實現與優化、即插即用等優勢。

在一些實施例中，當待處理影像為樣本影像時，該影像歸一化方法可以用於對神經網路進行訓練，訓練後得到的神經網路可以作為一個子網路，替換用於執行各種任務的神經網路中的歸一化層。其中，各種任務包括但不限於語義理解、語音識別、電腦視覺任務等。

在訓練過程中，採用上述過程可以根據針對不同任務的樣本影像，自適應地確定各個歸一化因子對應的第一權重值，解決了在樣本集合不同的情況下，無法動態調整歸一化因子的權重值，所帶來的歸一化算法不靈活的問題。

在本發明實施例中，如果針對某個任務的樣本影像，完成神經網路的訓練之後，可以直接替換該任務對應的神經網路中的歸一化層，實現即插即用的目的。如果有其他任務對應的神經網路，可以通過微調網路參數的方式直接替換到新的神經網路上，從而可以提升其他任務的性能。

與前述方法實施例相對應，本發明還提供了裝置的實施例。

如圖8所示，圖8是本發明根據一示例性實施例繪示的一種影像歸一化處理裝置框圖，裝置包括：歸一化處理模組210，用於採用K個歸一化因子，分別對特徵圖進行歸一化處理，獲得與所述K個歸一化因子各自對應的備選歸一化特徵圖，其中K是大於1的整數；第一確定模組220，用於各個所述歸一化因子的第一權重值；第二確定模組230，用於根據所述K個歸一化因子各自對應的備選歸一化特徵圖和各個所述歸一化因子的所述第一權重值，確定與所述特徵圖對應的目標歸一化特徵圖。

在一些實施例中，所述第一確定模組包括：第一確定子模組，用於針對各個所述歸一化因子，確定與該歸一化因子對應的第一特徵向量；第二確定子模組，用於根據K個所述第一特徵向量之間的相關性，確定相關性矩陣；第三確定子模組，用於根據所述相關性矩陣，確定各個所述歸一化因子的所述第一權重值。

在一些實施例中，所述第一確定子模組包括：下采樣單元，用於對所述特徵圖進行下采樣，獲得與所述特徵圖對應的K個第二特徵向量；第一歸一化處理單元，用於該歸一化因子，對所述K個第二特徵向量中與該歸一化因子對應的第二特徵特徵向量進行歸一化處理，獲得第三特徵向量；降維處理單元，用於對所述第三特徵向量進行降維處理，獲得所述第一特徵向量。

在一些實施例中，所述第二確定子模組包括：第一確定單元，用於確定每個第一特徵向量對應的轉置向量；第二確定單元，用於將每個第一特徵向量和每個所述轉置向量兩兩相乘，獲得所述相關性矩陣。

在一些實施例中，所述第三確定子模組包括：轉換單元，用於依次通過第一全連接網路、雙曲正切變換和第二全連接網路，將所述相關性矩陣轉換為備選向量；第二歸一化處理單元，用於對所述備選向量中的值進行歸一化處理，獲得歸一化處理後的目標向量；第三確定單元，用於根據所述目標向量，確定各個所述歸一化因子的所述第一權重值，其中所述目標向量包括K個元素。

在一些實施例中，所述第三確定單元包括：將所述目標向量中第k個元素，作為第k個歸一化因子的所述第一權重值，其中k為1至K中的任一整數。

在一些實施例中，所述第二確定模組包括：第四確定子模組，用於針對各個歸一化因子，將與該歸一化因子對應的備選歸一化特徵圖與該歸一化因子的所述第一權重值相乘，獲得與該歸一化因子對應的第一歸一化特徵圖；第五確定子模組，用於針對各個歸一化因子，根據與該歸一化因子對應的第二權重值，調整與該歸一化因子對應的第一歸一化特徵圖的尺寸，獲得與該歸一化因子對應的第二歸一化特徵圖；第六確定子模組，用於針對各個歸一化因子，根據與該歸一化因子對應的目標偏移值，移動與該歸一化因子對應的第二歸一化特徵圖，獲得與該歸一化因子對應的第三歸一化特徵圖；第七確定子模組，用於將K個第三歸一化特徵圖相加後，獲得與所述特徵圖對應的目標歸一化特徵圖。

對於裝置實施例而言，由於其基本對應於方法實施例，所以相關之處參見方法實施例的部分說明即可。以上所描述的裝置實施例僅僅是示意性的，其中作為分離部件說明的單元可以是或者也可以不是物理上分開的，作為單元顯示的部件可以是或者也可以不是物理單元，即可以位於一個地方，或者也可以分布到多個網路單元上。可以根據實際的需要選擇其中的部分或者全部模組來實現本發明方案的目的。本領域通常知識者在不付出創造性勞動的情況下，即可以理解並實施。

本發明實施例還提供了一種電腦可讀取記錄媒體，所述電腦可讀取記錄媒體儲存有電腦程式，當處理器調用所述電腦程式時，所述處理器用於執行上述任一實施例所述的影像歸一化處理方法。所述電腦可讀取記錄媒體包括非暫態電腦可讀取記錄媒體。

在一些實施例中，本發明實施例提供了一種電腦程式產品，包括計算機可讀程式碼，當計算機可讀程式碼在設備上運行時，設備中的處理器執行用於實現如上任一實施例提供的影像歸一化處理方法的指令。

在一些實施例中，本發明實施例還提供了另一種電腦程式產品，用於儲存計算機可讀指令，指令被執行時使得計算機執行上述任一實施例提供的影像歸一化處理方法的操作。

該電腦程式產品可以具體通過硬體、軟體或其結合的方式實現。在一些實施例中，所述電腦程式產品可以體現為電腦記錄媒體，在一些實施例中，電腦程式產品可體現為軟體產品，例如軟體開發套件(Software Development Kit，SDK)等等。

本發明實施例還提供了一種電子設備，包括：處理器；用於儲存處理器可執行指令的記憶體；其中，處理器被配置為調用所述記憶體中儲存的可執行指令，實現上述任一實施例所述的影像歸一化處理方法。

圖9為本發明實施例提供的一種電子設備的硬體結構示意圖。該電子設備310包括處理器311，還可以包括輸入裝置312、輸出裝置313和記憶體314。該輸入裝置312、輸出裝置313、記憶體314和處理器311之間通過匯流排相互連接。

記憶體314包括但不限於隨機儲存記憶體（random access memory，RAM）、唯讀記憶體（read-only memory，ROM）、可抹除可程式唯讀記憶體（erasable programmable read only memory，EPROM）、或光碟唯讀記憶體（compact disc read-only memory，CD-ROM），該記憶體用於相關指令及資料。

輸入裝置312用於輸入資料和/或信號，以及輸出裝置313用於輸出資料和/或信號。輸出裝置313和輸入裝置312可以是獨立的器件，也可以是一個整體的器件。

處理器311可以包括是一個或多個處理器，例如包括一個或多個中央處理器（central processing unit，CPU），在處理器311是一個CPU的情況下，該CPU可以是單核CPU，也可以是多核CPU。

記憶體314用於儲存網路設備的程式碼和資料。

處理器311用於調用該記憶體314中的程式碼和資料，執行上述方法實施例中的步驟。具體可參見方法實施例中的描述，在此不再贅述。

可以理解的是，圖9僅僅繪示了一種影像歸一化處理裝置的簡化設計。在實際應用中，影像歸一化處理裝置還可以分別包含必要的其他元件，包含但不限於任意數量的輸入/輸出裝置、處理器、控制器、記憶體等，而所有可以實現本發明實施例的影像歸一化處理裝置都在本發明的保護範圍之內。

本領域技術人員在考慮說明書及實踐這裡公開的發明後，將容易想到本發明的其它實施方案。本發明旨在涵蓋本發明的任何變型、用途或者適應性變化，這些變型、用途或者適應性變化遵循本發明的一般性原理並包括本發明未公開的本技術領域中的公知常識或者慣用技術手段。說明書和實施例僅被視為示例性的，本發明的真正範圍和精神由下面的請求項指出。

以上所述僅為本發明的一些實施例而已，並不用以限制本發明，凡在本發明的精神和原則之內，所做的任何修改、等同替換、改進等，均應包含在本發明保護的範圍之內。

110~130,121~123,1211~1213,1221~1222,1231~1233,131~134:步驟 210:歸一化處理模組 220:第一確定模組 230:第二確定模組 310:電子設備 311:處理器 312:輸入裝置 313:輸出裝置 314:記憶體

此處的附圖被併入說明書中並構成本說明書的一部分，示出了符合本發明的實施例，並與說明書一起用於解釋本發明的原理。圖1是本發明根據一示例性實施例繪示的一種影像歸一化處理方法流程圖。圖2是本發明根據一示例性實施例繪示的步驟120的流程圖。圖3是本發明根據一示例性實施例繪示的步驟121的流程圖。圖4是本發明根據一示例性實施例繪示的步驟122的流程圖。圖5是本發明根據一示例性實施例繪示的步驟123的流程圖。圖6是本發明根據一示例性實施例繪示的步驟130的流程圖。圖7是本發明根據一示例性實施例繪示的一種影像歸一化處理架構框圖。圖8是本發明根據一示例性實施例繪示的一種影像歸一化處理裝置框圖。圖9是本發明根據一示例性實施例繪示的一種電子設備的硬體結構示意圖。

110~130:步驟

Claims

一種影像歸一化處理方法，應用於電子設備的處理器中，所述方法包括：獲取待處理影像對應的特徵圖；採用K個歸一化因子，分別對所述特徵圖進行歸一化處理，獲得與所述K個歸一化因子各自對應的備選歸一化特徵圖，其中K是大於1的整數；確定所述K個歸一化因子中各個歸一化因子的第一權重值，包括：針對所述K個歸一化因子中各個歸一化因子，確定與該歸一化因子對應的第一特徵向量；根據K個所述第一特徵向量之間的相關性，確定相關性矩陣；以及根據所述相關性矩陣，確定所述K個歸一化因子中各個歸一化因子的所述第一權重值；根據所述K個歸一化因子各自對應的備選歸一化特徵圖和所述第一權重值，確定與所述特徵圖對應的目標歸一化特徵圖；以及基於所述目標歸一化特徵圖對所述待處理影像中的內容進行識別以得到所述待處理影像對應的識別結果。
如請求項1所述的方法，其中，針對所述K個歸一化因子中各個歸一化因子，確定與該歸一化因子對應的所述第一特徵向量，包括：對所述特徵圖進行下采樣，獲得與所述特徵圖對應的K個第二特徵向量；採用該歸一化因子，對所述K個第二特徵向量中與該歸一化因子對應的第二特徵特徵向量進行歸一化處理，獲得第三特徵向量；對所述第三特徵向量進行降維處理，獲得所述第一特徵向量。
如請求項1或2所述的方法，其中，根據K個所述第一特徵向量之間的相關性，確定所述相關性矩陣，包括：確定每個所述第一特徵向量對應的轉置向量；針對每個所述第一特徵向量，將該第一特徵向量和各個所述轉置向量相乘，獲得所述相關性矩陣。
如請求項1或2所述的方法，其中，根據所述相關性矩陣，確定所述K個歸一化因子中各個歸一化因子的所述第一權重值，包括：依次通過第一全連接網路、雙曲正切變換和第二全連接網路，將所述相關性矩陣轉換為備選向量；對所述備選向量中的值進行歸一化處理，獲得歸一化處理後的目標向量；根據所述目標向量，確定所述K個歸一化因子中各個歸一化因子的所述第一權重值，其中所述目標向量包括K個元素。
如請求項4所述的方法，其中，根據所述目標向量，確定所述K個歸一化因子中各個歸一化因子的所述第一權重值，包括：將所述目標向量中第k個元素，作為第k個歸一化因子的所述第一權重值，其中k為1至K中的任一整數。
如請求項1-2任一項所述的方法，其中，根據所述K個歸一化因子各自對應的備選歸一化特徵圖和所述第一權重值，確定與所述特徵圖對應的所述目標歸一化特徵圖，包括：針對所述K個歸一化因子中各個歸一化因子，將與該歸一化因子對應的所述備選歸一化特徵圖與該歸一化因子的所述第一權重值相乘，獲得與該歸一化因子對應的第一歸一化特徵圖；根據與該歸一化因子對應的第二權重值，調整與該歸一化因子對應的所述第一歸一化特徵圖的尺寸，獲得與該歸一化因子對應的第二歸一化特徵圖；根據與該歸一化因子對應的目標偏移值，移動與該歸一化因子對應的所述第二歸一化特徵圖，獲得與該歸一化因子對應的第三歸一化特徵圖；將K個所述第三歸一化特徵圖相加後，獲得與所述特徵圖對應的所述目標歸一化特徵圖。
一種電腦可讀取記錄媒體，所述電腦可讀取記錄媒體儲存有電腦程式，當處理器調用所述電腦程式時，所述處理器用於執行上述請求項1-6任一所述的影像歸一化處理方法。
一種電子設備，包括：處理器；用於儲存處理器可執行指令的記憶體；其中，所述處理器被配置為調用所述記憶體中儲存的所述處理器可執行指令，實現請求項1-6中任一項所述的影像歸一化處理方法。