JP2020537204A - ディープニューラルネットワークの正規化方法および装置、機器、ならびに記憶媒体 - Google Patents
ディープニューラルネットワークの正規化方法および装置、機器、ならびに記憶媒体 Download PDFInfo
- Publication number
- JP2020537204A JP2020537204A JP2020510104A JP2020510104A JP2020537204A JP 2020537204 A JP2020537204 A JP 2020537204A JP 2020510104 A JP2020510104 A JP 2020510104A JP 2020510104 A JP2020510104 A JP 2020510104A JP 2020537204 A JP2020537204 A JP 2020537204A
- Authority
- JP
- Japan
- Prior art keywords
- dimension
- sample
- feature map
- variance
- mean value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Neurology (AREA)
- Image Analysis (AREA)
- Length Measuring Devices By Optical Means (AREA)
- Databases & Information Systems (AREA)
Abstract
Description
少なくとも一つの入力データを含む入力データセットをディープニューラルネットワークに入力することと、
前記ディープニューラルネットワークにおけるネットワーク層が出力した特徴マップセットを少なくとも一つの次元で正規化し、少なくとも一つの次元の分散および少なくとも一つの次元の平均値を得て、そのうち、前記特徴マップセットは、少なくとも一つの特徴マップを含み、少なくとも一つのチャネルに対応し、各チャネルはそれぞれ少なくとも一つの前記特徴マップに対応することと、
前記少なくとも一つの次元の分散および前記少なくとも一つの次元の平均値に基づいて正規化後の目標特徴マップセットを特定することと、を含むディープニューラルネットワークの正規化方法が提供される。
空間次元、チャネル次元及びバッチ座標次元の少なくとも一つを含む。
前記特徴マップセットを、空間次元に基づいて正規化し、空間次元の分散および空間次元の平均値を得ること、および/または、
前記特徴マップセットを、チャネル次元に基づいて正規化し、チャネル次元の分散およびチャネル次元の平均値を得ること、および/または、
前記特徴マップセットを、バッチ座標次元に基づいて正規化し、バッチ座標次元の分散およびバッチ座標次元の平均値を得ること、を含む。
前記特徴マップセット内の少なくとも一つの特徴マップの高さ値、幅値および前記特徴マップセットに対応するチャネル数を変数とし、前記少なくとも一つの特徴マップに基づいて前記チャネル次元の平均値を得ることと、
前記チャネル次元の平均値および前記少なくとも一つの特徴マップに基づき、前記チャネル次元の分散を得ることと、を含む。
前記特徴マップセット内の少なくとも一つの特徴マップの高さ値、幅値および前記入力データセットに対応する入力データ数を変数とし、前記少なくとも一つの特徴マップに基づいて前記バッチ座標次元の平均値を得ることと、
前記バッチ座標次元の平均値および前記少なくとも一つの特徴マップに基づき、前記バッチ座標次元の分散を得ることと、を含む。
前記特徴マップセットを、空間次元に基づいて正規化し、空間次元の分散および空間次元の平均値を得ることと、
前記空間次元の分散および前記空間次元の平均値に基づき、前記チャネル次元に対応するチャネル次元の分散およびチャネル次元の平均値を得ることと、
前記空間次元の分散および前記空間次元の平均値に基づき、前記バッチ座標次元に対応するバッチ座標次元の分散およびバッチ座標次元の平均値を得ることと、を含む。
前記特徴マップセット内の少なくとも一つの特徴マップの高さ値および幅値を変数とし、前記少なくとも一つの特徴マップに基づいて前記空間次元の平均値を得ることと、
前記空間次元の平均値および前記少なくとも一つの特徴マップに基づき、前記空間次元の分散を得ることと、を含む。
前記特徴マップセットに対応するチャネル数を変数とし、前記空間次元の平均値に基づいて前記チャネル次元の平均値を得ることと、
前記特徴マップセットに対応するチャネル数を変数とし、前記空間次元の平均値、前記空間次元の分散および前記チャネル次元の平均値に基づいて前記チャネル次元の分散を得ることと、を含む。
前記入力データセットに対応する入力データ数を変数とし、前記空間次元の平均値に基づいて前記バッチ座標次元の平均値を得ることと、
前記入力データセットに対応する入力データ数を変数とし、前記空間次元の平均値、前記空間次元の分散および前記バッチ座標次元の平均値に基づいて前記バッチ座標次元の分散を得ることと、を含む。
前記少なくとも一つの次元の分散を重み付け平均して正規化分散を得て、前記少なくとも一つの次元の平均値を重み付け平均して正規化平均値を得ることと、
前記正規化分散および前記正規化平均値に基づいて前記目標特徴マップセットを特定することと、を含む。
前記正規化分散、前記正規化平均値、スケールパラメータおよびシフトパラメータに基づいて前記特徴マップセットを処理し、前記目標特徴マップセットを得ることを含む。
前記方法は、少なくとも一つのサンプルデータを含む前記サンプルデータセットに基づいて前記ディープニューラルネットワークを訓練することをさらに含む。
前記サンプルデータセットに基づいて前記ディープニューラルネットワークを訓練することは、
前記サンプルデータセットをディープニューラルネットワークに入力し、前記ネットワーク層によって少なくとも一つのサンプル特徴マップを含むサンプルの特徴マップセットを出力することと、
前記正規化層によって前記サンプルの特徴マップセットを少なくとも一つの次元で正規化し、サンプルの少なくとも一つの次元の分散およびサンプルの少なくとも一つの次元の平均値を得ることと、
前記サンプルの少なくとも一つの次元の分散および前記サンプルの少なくとも一つの次元の平均値に基づいて正規化後の予測特徴マップセットを特定することと、
前記予測特徴マップセットに基づいて前記サンプルデータに対応する予測結果を特定することと、
前記予測結果および前記マーク情報に基づき、前記少なくとも一つのネットワーク層のパラメータおよび前記少なくとも一つの正規化層のパラメータを調整することと、を含む。
空間次元重み値、チャネル次元重み値及びバッチ座標次元重み値の少なくとも一つを含む。
前記サンプルの特徴マップセットを、空間次元に基づいて正規化し、サンプルの空間次元の分散およびサンプルの空間次元の平均値を得ること、および/または、
前記サンプルの特徴マップセットを、チャネル次元に基づいて正規化し、サンプルのチャネル次元の分散およびサンプルのチャネル次元の平均値を得ること、および/または、
前記サンプルの特徴マップセットを、バッチ座標次元に基づいて正規化し、サンプルのバッチ座標次元の分散およびサンプルのバッチ座標次元の平均値を得ること、を含む。
前記サンプルの特徴マップセット内の少なくとも一つのサンプル特徴マップの高さ値、幅値および前記サンプルの特徴マップセットに対応するチャネル数を変数とし、前記少なくとも一つのサンプル特徴マップに基づいて前記サンプルのチャネル次元の平均値を得ることと、
前記サンプルのチャネル次元の平均値および前記少なくとも一つのサンプル特徴マップに基づき、前記サンプルのチャネル次元の分散を得ることと、を含む。
前記サンプルの特徴マップセット内の少なくとも一つのサンプル特徴マップの高さ値、幅値および前記サンプルデータセットに対応するサンプルデータ数を変数とし、前記少なくとも一つのサンプル特徴マップに基づいて前記サンプルのバッチ座標次元の平均値を得ることと、
前記サンプルのバッチ座標次元の平均値および前記少なくとも一つのサンプル特徴マップに基づき、前記サンプルのバッチ座標次元の分散を得ることと、を含む。
前記サンプルの特徴マップセットを、空間次元に基づいて正規化し、サンプルの空間次元の分散およびサンプルの空間次元の平均値を得ることと、
前記サンプルの空間次元の分散および前記サンプルの空間次元の平均値に基づき、前記チャネル次元に対応するサンプルのチャネル次元の分散およびサンプルのチャネル次元の平均値を得ることと、
前記サンプルの空間次元の分散および前記サンプルの空間次元の平均値に基づき、前記バッチ座標次元に対応するサンプルのバッチ座標次元の分散およびサンプルのバッチ座標次元の平均値を得ることと、を含む。
前記サンプルの特徴マップセット内の少なくとも一つのサンプル特徴マップの高さ値および幅値を変数とし、前記少なくとも一つのサンプル特徴マップに基づいて前記サンプルの空間次元の平均値を得ることと、
前記サンプルの空間次元の平均値および前記少なくとも一つのサンプル特徴マップに基づき、前記サンプルの空間次元の分散を得ることと、を含む。
前記サンプルの特徴マップセットに対応するチャネル数を変数とし、前記サンプルの空間次元の平均値に基づいて前記サンプルのチャネル次元の平均値を得ることと、
前記サンプルの特徴マップセットに対応するチャネル数を変数とし、前記サンプルの空間次元の平均値、前記サンプルの空間次元の分散および前記サンプルのチャネル次元の平均値に基づいて前記サンプルのチャネル次元の分散を得ることと、を含む。
前記サンプルデータセットに対応するサンプルデータ数を変数とし、前記サンプルの空間次元の平均値に基づいて前記サンプルのバッチ座標次元の平均値を得ることと、
前記サンプルデータセットに対応するサンプルデータ数を変数とし、前記サンプルの空間次元の平均値、前記サンプルの空間次元の分散および前記サンプルのバッチ座標次元の平均値に基づいて前記サンプルのバッチ座標次元の分散を得ることと、を含む。
前記サンプルの少なくとも一つの次元の分散を重み付け平均してサンプル正規化分散を得て、前記サンプルの少なくとも一つの次元の平均値を重み付け平均してサンプル正規化平均値を得ることと、
前記サンプル正規化分散、前記サンプル正規化平均値、スケールパラメータおよびシフトパラメータに基づいて前記サンプルの特徴マップセットを処理し、前記予測特徴マップセットを得ることと、を含む。
少なくとも一つの入力データを含む入力データセットをディープニューラルネットワークに入力するための入力ユニットと、
前記ディープニューラルネットワークにおけるネットワーク層が出力した特徴マップセットを少なくとも一つの次元で正規化し、少なくとも一つの次元の分散および少なくとも一つの次元の平均値を得て、そのうち、前記特徴マップセットは、少なくとも一つの特徴マップを含み、少なくとも一つのチャネルに対応し、各チャネルはそれぞれ少なくとも一つの前記特徴マップに対応する次元正規化ユニットと、
前記少なくとも一つの次元の分散および前記少なくとも一つの次元の平均値に基づいて正規化後の目標特徴マップセットを特定するためのバッチ正規化ユニットと、を含むディープニューラルネットワークの正規化装置が提供される。
空間次元、チャネル次元及びバッチ座標次元の少なくとも一つを含む。
前記特徴マップセットを、チャネル次元に基づいて正規化し、チャネル次元の分散およびチャネル次元の平均値を得るために、および/または、
前記特徴マップセットを、バッチ座標次元に基づいて正規化し、バッチ座標次元の分散およびバッチ座標次元の平均値を得るために用いられる。
前記装置は少なくとも一つのサンプルデータを含む前記サンプルデータセットに基づいて前記ディープニューラルネットワークを訓練するための訓練ユニットをさらに含む。
前記入力ユニットはさらに、前記サンプルデータセットをディープニューラルネットワークに入力し、前記ネットワーク層によって少なくとも一つのサンプル特徴マップを含むサンプルの特徴マップセットを出力するために用いられ、
前記次元正規化ユニットはさらに、前記正規化層によって前記サンプルの特徴マップセットを少なくとも一つの次元で正規化し、サンプルの少なくとも一つの次元の分散およびサンプルの少なくとも一つの次元の平均値を得るために用いられ、
前記バッチ正規化ユニットはさらに、前記サンプルの少なくとも一つの次元の分散および前記サンプルの少なくとも一つの次元の平均値に基づいて正規化後の予測特徴マップセットを特定するために用いられ、
前記結果特定ユニットはさらに、前記予測特徴マップセットに基づいて前記サンプルデータに対応する予測結果を特定するために用いられ、
前記訓練ユニットは、前記予測結果および前記マーク情報に基づき、前記少なくとも一つのネットワーク層のパラメータおよび前記少なくとも一つの正規化層のパラメータを調整するために用いられる。
空間次元重み値、チャネル次元重み値及びバッチ座標次元重み値の少なくとも一つを含む。
前記サンプルの特徴マップセットを、チャネル次元に基づいて正規化し、サンプルのチャネル次元の分散およびサンプルのチャネル次元の平均値を得るために、および/または、
前記サンプルの特徴マップセットを、バッチ座標次元に基づいて正規化し、サンプルのバッチ座標次元の分散およびサンプルのバッチ座標次元の平均値を得るために用いられる。
前記メモリと通信して前記実行可能命令を実行することで上記いずれか一項に記載のディープニューラルネットワークの正規化方法の動作を行うためのプロセッサを含む電子機器が提供される。
本開示は、図面を伴う以下の詳細な説明によって、より明確に理解されることができる。
特徴マップセットを、空間次元に基づいて正規化し、空間次元の分散および空間次元の平均値を得ること、および/または、
特徴マップセットを、チャネル次元に基づいて正規化し、チャネル次元の分散およびチャネル次元の平均値を得ること、および/または、
特徴マップセットを、バッチ座標次元に基づいて正規化し、バッチ座標次元の分散およびバッチ座標次元の平均値を得ること、を含んでもよい。
(式1)
・・・式(1)
ここで、μkは平均値を表し、σk 2は分散を表し、hncijは任意の4次元(N,H,W,C)の特徴マップであり、正規化層の入力とされ、そのうち、Nは1バッチのデータの量を表し、HおよびWはそれぞれ特徴マップの高さ値および幅値を表し、Cは特徴マップセットが対応するチャネル数(即ちステップ120におけるネットワーク層に対応するチャネル数)を表し、k∈Ω、Ω={BN、IN、LN}、そのうち、BN、IN、LNはそれぞれバッチ軸N、空間軸H×W、チャネル軸Cに沿って統計量を計算するバッチ正規化、インスタンス正規化、層正規化である。三つの次元の計算方法は類似するが、統計量の画素範囲は異なり、Ikは各次元の統計計算の画素範囲であり、hncijはIk内の点である。
特徴マップセット内の少なくとも一つの特徴マップの高さ値および幅値を変数とし、少なくとも一つの特徴マップに基づいて空間次元の平均値を得ることと、
空間次元の平均値および少なくとも一つの特徴マップに基づき、空間次元の分散を得ることと、を含む。
特徴マップセット内の少なくとも一つの特徴マップの高さ値、幅値および特徴マップセットが対応するチャネル数を変数とし、少なくとも一つの特徴マップに基づいてチャネル次元の平均値を得ることと、
チャネル次元の平均値および少なくとも一つの特徴マップに基づき、チャネル次元の分散を得ることと、を含む。
特徴マップセット内の少なくとも一つの特徴マップの高さ値、幅値および入力データセットに対応する入力データ数を変数とし、少なくとも一つの特徴マップに基づいてバッチ座標次元の平均値を得ることと、
バッチ座標次元の平均値および少なくとも一つの特徴マップに基づき、バッチ座標次元の分散を得ることと、を含む。
特徴マップセットを、空間次元に基づいて正規化し、空間次元の分散および空間次元の平均値を得ることと、
空間次元の分散および空間次元の平均値に基づき、チャネル次元に対応するチャネル次元の分散およびチャネル次元の平均値を得ることと、
空間次元の分散および空間次元の平均値に基づき、バッチ座標次元に対応するバッチ座標次元の分散およびバッチ座標次元の平均値を得ることと、を含んでもよい。
特徴マップセット内の少なくとも一つの特徴マップの高さ値および幅値を変数とし、少なくとも一つの特徴マップに基づいて空間次元の平均値を得ることと、
空間次元の平均値および少なくとも一つの特徴マップに基づき、空間次元の分散を得ることと、を含む。
(式2)
・・・式(2)
ここで、μinは空間次元の平均値を表し、
(数1)
は空間次元の分散を表す。
特徴マップセットに対応するチャネル数を変数とし、空間次元の平均値に基づいてチャネル次元の平均値を得ることと、
特徴マップセットに対応するチャネル数を変数とし、空間次元の平均値、空間次元の分散およびチャネル次元の平均値に基づいてチャネル次元の分散を得ることと、を含む。
(式3)
・・・式(3)
ここで、μlnはチャネル次元の平均値を表し、
(数2)
はチャネル次元の分散を表す。
入力データセットに対応する入力データ数を変数とし、空間次元の平均値に基づいてバッチ座標次元の平均値を得ることと、
入力データセットに対応する入力データ数を変数とし、空間次元の平均値、空間次元の分散およびバッチ座標次元の平均値に基づいてバッチ座標次元の分散を得ることと、を含む。
(式4)
・・・式(4)
ここで、μbnはバッチ座標次元の平均値を表し、
(数3)
はバッチ座標次元の分散を表す。
少なくとも一つの次元の分散を重み付け平均して正規化分散を得て、少なくとも一つの次元の平均値を重み付け平均して正規化平均値を得ることと、
正規化分散および正規化平均値に基づいて目標特徴マップセットを特定することと、を含んでもよい。
正規化分散、正規化平均値、スケールパラメータおよびシフトパラメータに基づいて特徴マップセットを処理し、目標特徴マップセットを得ることを含む。
(式5)
・・・式(5)
(数4)
を出力する。ここで、n∈[1, N]、Nは一つの小バッチのサンプル数を表し、c∈[1, C]、Cは特徴マップのチャネル数であり、i∈[1, H]かつj∈[1, W]、HおよびWはそれぞれ各チャネル空間次元での高さ値および幅値である。自己適応正規化方法による計算は式(5)を参照すればよい。γおよびβはそれぞれ一般的なズームおよびシフトパラメータであり、εは数値の不安定を予防するための非常に小さい定数である。各画素点について、正規化の平均値μ=Σk∈Ωωkμkであり、分散σ=Σk∈Ωωkσk 2であり、ωkは異なる次元の平均値および分散に対応する次元重み値を表す。平均値および分散の演算は3つの次元(空間次元、チャネル次元およびバッチ座標次元)の平均値および分散によって決定され、即ちΩ={BN、IN、LN}であり、ここで、BN、IN、LNはそれぞれバッチ軸N、空間軸H×W、チャネル軸Cに沿って統計量を計算するバッチ正規化、インスタンス正規化、層正規化であり、図2に示されたとおりである。図2は本開示の実施例のディープニューラルネットワークの正規化方法の一例の例示図である。
目標特徴マップセットに基づいて入力データセットが少なくとも一つのデータ結果に対応することを特定することを含んでもよい。
本開示の実施例の方法はさらに、
サンプルデータセットに基づいてディープニューラルネットワークを訓練することを含んでもよい。
サンプルデータセットをディープニューラルネットワークに入力し、ネットワーク層によって少なくとも一つのサンプル特徴マップを含むサンプルの特徴マップセットを出力することと、
正規化層によってサンプルの特徴マップセットを少なくとも一つの次元で正規化し、サンプルの少なくとも一つの次元の分散およびサンプルの少なくとも一つの次元の平均値を得ることと、
サンプルの少なくとも一つの次元の分散およびサンプルの少なくとも一つの次元の平均値に基づいて正規化後の予測特徴マップセットを特定することと、
予測特徴マップセットに基づいてサンプルデータに対応する予測結果を特定することと、
予測結果およびマーク情報に基づき、少なくとも一つのネットワーク層のパラメータおよび少なくとも一つの正規化層のパラメータを調整することと、を含む。
サンプルの特徴マップセットを、空間次元に基づいて正規化し、サンプルの空間次元の分散およびサンプルの空間次元の平均値を得ること、および/または、
サンプルの特徴マップセットを、チャネル次元に基づいて正規化し、サンプルのチャネル次元の分散およびサンプルのチャネル次元の平均値を得ること、および/または、
サンプルの特徴マップセットを、バッチ座標次元に基づいて正規化し、サンプルのバッチ座標次元の分散およびサンプルのバッチ座標次元の平均値を得ること、を含む。
サンプルの特徴マップセット内の少なくとも一つのサンプル特徴マップの高さ値および幅値を変数とし、少なくとも一つのサンプル特徴マップに基づいてサンプルの空間次元の平均値を得ることと、
サンプルの空間次元の平均値および少なくとも一つのサンプル特徴マップに基づき、サンプルの空間次元の分散を得ることと、を含む。
サンプルの特徴マップセット内の少なくとも一つのサンプル特徴マップの高さ値、幅値およびサンプルの特徴マップセットが対応するチャネル数を変数とし、少なくとも一つのサンプル特徴マップに基づいてサンプルのチャネル次元の平均値を得ることと、
サンプルのチャネル次元の平均値および少なくとも一つのサンプル特徴マップに基づき、サンプルのチャネル次元の分散を得ることと、を含む。
サンプルの特徴マップセット内の少なくとも一つのサンプル特徴マップの高さ値、幅値およびサンプルデータセットに対応するサンプルデータ数を変数とし、少なくとも一つのサンプル特徴マップに基づいてサンプルのバッチ座標次元の平均値を得ることと、
サンプルのバッチ座標次元の平均値および少なくとも一つのサンプル特徴マップに基づき、サンプルのバッチ座標次元の分散を得ることと、を含む。
サンプルの特徴マップセットを、空間次元に基づいて正規化し、サンプルの空間次元の分散およびサンプルの空間次元の平均値を得ることと、
任意選択的に、サンプルの特徴マップセット内の少なくとも一つのサンプル特徴マップの高さ値および幅値を変数とし、少なくとも一つのサンプル特徴マップに基づいてサンプルの空間次元の平均値を得ることと、
サンプルの空間次元の平均値および少なくとも一つのサンプル特徴マップに基づき、サンプルの空間次元の分散を得ることと、を含む。
任意選択的に、サンプルの特徴マップセットに対応するチャネル数を変数とし、サンプルの空間次元の平均値に基づいてサンプルのチャネル次元の平均値を得て、
サンプルの特徴マップセットに対応するチャネル数を変数とし、サンプルの空間次元の平均値、サンプルの空間次元の分散およびサンプルのチャネル次元の平均値に基づいてサンプルのチャネル次元の分散を得る。
前記サンプルデータセットに対応するサンプルデータ数を変数とし、前記サンプルの空間次元の平均値、前記サンプルの空間次元の分散および前記サンプルのバッチ座標次元の平均値に基づいて前記サンプルのバッチ座標次元の分散を得る。
サンプルの少なくとも一つの次元の分散を重み付け平均してサンプル正規化分散を得て、サンプルの少なくとも一つの次元の平均値を重み付け平均してサンプル正規化平均値を得ることと、
サンプル正規化分散、サンプル正規化平均値、スケールパラメータおよびシフトパラメータに基づいてサンプルの特徴マップセットを処理し、予測特徴マップセットを得ることと、を含む。
サンプルの少なくとも一つの次元の分散を重み付け平均してサンプル正規化分散を得ることは、
サンプルの空間次元の分散と空間次元重み値との積、サンプルのチャネル次元の分散とチャネル次元重み値との積、およびサンプルのバッチ座標次元の分散とバッチ座標次元重み値との積を加算し、求めた和に基づいてサンプル正規化分散を得ることを含む。
サンプルの少なくとも一つの次元の平均値を重み付け平均してサンプル正規化平均値を得ることは、
サンプルの空間次元の平均値と空間次元重み値との積、サンプルのチャネル次元の平均値とチャネル次元重み値との積、およびサンプルのバッチ座標次元の平均値とバッチ座標次元重み値との積を加算し、求めた和に基づいてサンプル正規化平均値を得ることを含む。
(式6)
・・・式(6)
ここで、ωkは異なる次元の平均値および分散に対応する次元重み値を表し、λkは三つの次元の統計量に対応するネットワークパラメータであり、該パラメータは逆伝搬時に最適化学習を行い、λkを最適化することで次元重み値ωkの最適化を実現し、
(数5)
はzの値がbn、inおよびlnの場合の、対応するeλzの和を計算することを表す。Softmax関数により最適化パラメータを正規化し、統計量の最終的な重み付け係数(次元重み値)を計算することができる。また、全ての重み付け係数ωkの和は1であり、各重み付け係数ωkの値は0から1の範囲にある。
ここで、入力データセットは少なくとも一つの入力データを含み、該ディープニューラルネットワークは、畳み込みニューラルネットワーク(CNN)、リカレントニューラルネットワーク(RNN)または長期短期記憶ネットワーク(LSTM)、または画像分類(ImageNet)、目標検出および分割(COCO)、映像認識(Kinetics)、画像スタイル化および筆跡生成などを含む様々なビジョンタスクを実現するニューラルネットワークを含むことができるが、これらに限定されない。
特徴マップセットは少なくとも一つの特徴マップを含み、かつ少なくとも一つのチャネルに対応し、各チャネルはそれぞれ少なくとも一つの特徴マップに対応する。任意選択的に、次元は、空間次元、チャネル次元、及びバッチ座標次元の少なくとも一つを含むことができるが、これらに限定されない。
特徴マップセットを、チャネル次元に基づいて正規化し、チャネル次元の分散およびチャネル次元の平均値を得るために、および/または、
特徴マップセットを、バッチ座標次元に基づいて正規化し、バッチ座標次元の分散およびバッチ座標次元の平均値を得るために用いられる。
目標特徴マップセットに基づいて入力データセットが少なくとも一つのデータ結果に対応することを特定するための結果特定ユニットを含んでもよい。
本開示の実施例の装置はさらに、
サンプルデータセットに基づいてディープニューラルネットワークを訓練するための訓練ユニットを含む。
入力ユニット41はさらに、サンプルデータセットをディープニューラルネットワークに入力し、ネットワーク層によって少なくとも一つのサンプル特徴マップを含むサンプルの特徴マップセットを出力するために用いられ、
次元正規化ユニット42はさらに、正規化層によってサンプルの特徴マップセットを少なくとも一つの次元で正規化し、サンプルの少なくとも一つの次元の分散およびサンプルの少なくとも一つの次元の平均値を得るために用いられ、
バッチ正規化ユニット43はさらに、サンプルの少なくとも一つの次元の分散およびサンプルの少なくとも一つの次元の平均値に基づいて正規化後の予測特徴マップセットを特定するために用いられ、
結果特定ユニットはさらに、予測特徴マップセットに基づいてサンプルデータに対応する予測結果を特定するために用いられ、
訓練ユニットはさらに、予測結果およびマーク情報に基づき、少なくとも一つのネットワーク層のパラメータおよび少なくとも一つの正規化層のパラメータを調整するために用いられる。
サンプルの特徴マップセットを、チャネル次元に基づいて正規化し、サンプルのチャネル次元の分散およびサンプルのチャネル次元の平均値を得るために、および/または、
サンプルの特徴マップセットを、バッチ座標次元に基づいて正規化し、サンプルのバッチ座標次元の分散およびサンプルのバッチ座標次元の平均値を得るために用いられる。
バッチ正規化ユニット43はサンプルの少なくとも一つの次元の分散を重み付け平均してサンプル正規化分散を得る場合、サンプルの空間次元の分散と空間次元重み値との積、サンプルのチャネル次元の分散とチャネル次元重み値との積、およびサンプルのバッチ座標次元の分散とバッチ座標次元重み値との積を加算し、求めた和に基づいてサンプル正規化分散を得るために用いられる。
バッチ正規化ユニット43はサンプルの少なくとも一つの次元の平均値を重み付け平均してサンプル正規化平均値を得る場合、サンプルの空間次元の平均値と空間次元重み値との積、サンプルのチャネル次元の平均値とチャネル次元重み値との積、およびサンプルのバッチ座標次元の平均値とバッチ座標次元重み値との積を加算し、求めた和に基づいてサンプル正規化平均値を得るために用いられる。
前記メモリと通信して前記実行可能命令を実行することで上記いずれか一項に記載のディープニューラルネットワークの正規化方法の動作を行うためのプロセッサを含む電子機器が提供される。
Claims (50)
- 少なくとも一つの入力データを含む入力データセットをディープニューラルネットワークに入力することと、
前記ディープニューラルネットワークにおけるネットワーク層が出力した特徴マップセットを少なくとも一つの次元で正規化し、少なくとも一つの次元の分散および少なくとも一つの次元の平均値を得て、そのうち、前記特徴マップセットは、少なくとも一つの特徴マップを含み、少なくとも一つのチャネルに対応し、各チャネルはそれぞれ少なくとも一つの前記特徴マップに対応することと、
前記少なくとも一つの次元の分散および前記少なくとも一つの次元の平均値に基づいて正規化後の目標特徴マップセットを特定することと、を含むことを特徴とするディープニューラルネットワークの正規化方法。 - 前記次元は、
空間次元、チャネル次元及びバッチ座標次元の少なくとも一つを含むことを特徴とする請求項1に記載の方法。 - ニューラルネットワーク層が出力した特徴マップセットを、少なくとも一つの次元で正規化し、少なくとも一つの次元の分散および少なくとも一つの次元の平均値を得ることは、
前記特徴マップセットを、空間次元に基づいて正規化し、空間次元の分散および空間次元の平均値を得ること、および/または、
前記特徴マップセットを、チャネル次元に基づいて正規化し、チャネル次元の分散およびチャネル次元の平均値を得ること、および/または、
前記特徴マップセットを、バッチ座標次元に基づいて正規化し、バッチ座標次元の分散およびバッチ座標次元の平均値を得ること、を含むことを特徴とする請求項2に記載の方法。 - 前記特徴マップセットを、チャネル次元に基づいて正規化し、チャネル次元の分散およびチャネル次元の平均値を得ることは、
前記特徴マップセット内の少なくとも一つの特徴マップの高さ値、幅値および前記特徴マップセットに対応するチャネル数を変数とし、前記少なくとも一つの特徴マップに基づいて前記チャネル次元の平均値を得ることと、
前記チャネル次元の平均値および前記少なくとも一つの特徴マップに基づき、前記チャネル次元の分散を得ることと、を含むことを特徴とする請求項3に記載の方法。 - 前記特徴マップセットを、バッチ座標次元に基づいて正規化し、バッチ座標次元の分散およびバッチ座標次元の平均値を得ることは、
前記特徴マップセット内の前記少なくとも一つの特徴マップの高さ値、幅値および前記入力データセットに対応する入力データ数を変数とし、前記少なくとも一つの特徴マップに基づいて前記バッチ座標次元の平均値を得ることと、
前記バッチ座標次元の平均値および前記少なくとも一つの特徴マップに基づき、前記バッチ座標次元の分散を得ることと、を含むことを特徴とする請求項3または4に記載の方法。 - 前記ディープニューラルネットワークにおけるネットワーク層が出力した特徴マップセットを少なくとも一つの次元で正規化し、少なくとも一つの次元の分散および少なくとも一つの次元の平均値を得ることは、
前記特徴マップセットを、空間次元に基づいて正規化し、空間次元の分散および空間次元の平均値を得ることと、
前記空間次元の分散および前記空間次元の平均値に基づき、前記チャネル次元に対応するチャネル次元の分散およびチャネル次元の平均値を得ることと、
前記空間次元の分散および前記空間次元の平均値に基づき、前記バッチ座標次元に対応するバッチ座標次元の分散およびバッチ座標次元の平均値を得ることと、を含むことを特徴とする請求項2に記載の方法。 - 前記特徴マップセットを、空間次元に基づいて正規化し、空間次元の分散および空間次元の平均値を得ることは、
前記特徴マップセット内の少なくとも一つの特徴マップの高さ値および幅値を変数とし、前記少なくとも一つの特徴マップに基づいて前記空間次元の平均値を得ることと、
前記空間次元の平均値および前記少なくとも一つの特徴マップに基づき、前記空間次元の分散を得ることと、を含むことを特徴とする請求項3から6のいずれか一項に記載の方法。 - 前記空間次元の分散および前記空間次元の平均値に基づき、前記チャネル次元に対応するチャネル次元の分散およびチャネル次元の平均値を得ることは、
前記特徴マップセットに対応するチャネル数を変数とし、前記空間次元の平均値に基づいて前記チャネル次元の平均値を得ることと、
前記特徴マップセットに対応するチャネル数を変数とし、前記空間次元の平均値、前記空間次元の分散および前記チャネル次元の平均値に基づいて前記チャネル次元の分散を得ることと、を含むことを特徴とする請求項6または7に記載の方法。 - 前記空間次元の分散および前記空間次元の平均値に基づき、前記バッチ座標次元に対応するバッチ座標次元の分散およびバッチ座標次元の平均値を得ることは、
前記入力データセットに対応する入力データ数を変数とし、前記空間次元の平均値に基づいて前記バッチ座標次元の平均値を得ることと、
前記入力データセットに対応する入力データ数を変数とし、前記空間次元の平均値、前記空間次元の分散および前記バッチ座標次元の平均値に基づいて前記バッチ座標次元の分散を得ることと、を含むことを特徴とする請求項6から8のいずれか一項に記載の方法。 - 前記少なくとも一つの次元の分散および前記少なくとも一つの次元の平均値に基づいて正規化後の目標特徴マップセットを特定することは、
前記少なくとも一つの次元の分散を重み付け平均して正規化分散を得て、前記少なくとも一つの次元の平均値を重み付け平均して正規化平均値を得ることと、
前記正規化分散および前記正規化平均値に基づいて前記目標特徴マップセットを特定することと、を含むことを特徴とする請求項1から9のいずれか一項に記載の方法。 - 前記正規化分散および前記正規化平均値に基づいて前記目標特徴マップセットを特定することは、
前記正規化分散、前記正規化平均値、スケールパラメータおよびシフトパラメータに基づいて前記特徴マップセットを処理し、前記目標特徴マップセットを得ることを含むことを特徴とする請求項10に記載の方法。 - 前記目標特徴マップセットに基づいて前記入力データセットが少なくとも一つのデータ結果に対応することを特定することをさらに含むことを特徴とする請求項1から11のいずれか一項に記載の方法。
- 前記入力データはマーク情報を有するサンプルデータであり、
少なくとも一つのサンプルデータを含む前記サンプルデータセットに基づいて前記ディープニューラルネットワークを訓練することをさらに含むことを特徴とする請求項1から12のいずれか一項に記載の方法。 - 前記ディープニューラルネットワークは少なくとも一つのネットワーク層および少なくとも一つの正規化層を含み、
前記サンプルデータセットに基づいて前記ディープニューラルネットワークを訓練することは、
前記サンプルデータセットを前記ディープニューラルネットワークに入力し、前記ネットワーク層によって、少なくとも一つのサンプル特徴マップを含むサンプルの特徴マップセットを出力することと、
前記正規化層によって前記サンプルの特徴マップセットを少なくとも一つの次元で正規化し、サンプルの少なくとも一つの次元の分散およびサンプルの少なくとも一つの次元の平均値を得ることと、
前記サンプルの少なくとも一つの次元の分散および前記サンプルの少なくとも一つの次元の平均値に基づいて正規化後の予測特徴マップセットを特定することと、
前記予測特徴マップセットに基づいて前記サンプルデータに対応する予測結果を特定することと、
前記予測結果および前記マーク情報に基づき、前記少なくとも一つのネットワーク層のパラメータおよび前記少なくとも一つの正規化層のパラメータを調整することと、を含むことを特徴とする請求項13に記載の方法。 - 前記正規化層のパラメータは、次元に対応する重み値、スケールパラメータおよびシフトパラメータの少なくとも一つを含むことを特徴とする請求項14に記載の方法。
- 前記重み値は、
空間次元重み値、チャネル次元重み値及びバッチ座標次元重み値の少なくとも一つを含むことを特徴とする請求項15に記載の方法。 - 前記正規化層によって前記サンプルの特徴マップセットを少なくとも一つの次元で正規化し、サンプルの少なくとも一つの次元の分散およびサンプルの少なくとも一つの次元の平均値を得ることは、
前記サンプルの特徴マップセットを、空間次元に基づいて正規化し、サンプルの空間次元の分散およびサンプルの空間次元の平均値を得ること、および/または、
前記サンプルの特徴マップセットを、チャネル次元に基づいて正規化し、サンプルのチャネル次元の分散およびサンプルのチャネル次元の平均値を得ること、および/または、
前記サンプルの特徴マップセットを、バッチ座標次元に基づいて正規化し、サンプルのバッチ座標次元の分散およびサンプルのバッチ座標次元の平均値を得ること、を含むことを特徴とする請求項14から16のいずれか一項に記載の方法。 - 前記サンプルの特徴マップセットを、チャネル次元に基づいて正規化し、サンプルのチャネル次元の分散およびサンプルのチャネル次元の平均値を得ることは、
前記サンプルの特徴マップセット内の少なくとも一つのサンプル特徴マップの高さ値、幅値および前記サンプルの特徴マップセットに対応するチャネル数を変数とし、前記少なくとも一つのサンプル特徴マップに基づいて前記サンプルのチャネル次元の平均値を得ることと、
前記サンプルのチャネル次元の平均値および前記少なくとも一つのサンプル特徴マップに基づき、前記サンプルのチャネル次元の分散を得ることと、を含むことを特徴とする請求項17に記載の方法。 - 前記サンプルの特徴マップセットを、バッチ座標次元に基づいて正規化し、サンプルのバッチ座標次元の分散およびサンプルのバッチ座標次元の平均値を得ることは、
前記サンプルの特徴マップセット内の少なくとも一つのサンプル特徴マップの高さ値、幅値および前記サンプルデータセットに対応するサンプルデータ数を変数とし、前記少なくとも一つのサンプル特徴マップに基づいて前記サンプルのバッチ座標次元の平均値を得ることと、
前記サンプルのバッチ座標次元の平均値および前記少なくとも一つのサンプル特徴マップに基づき、前記サンプルのバッチ座標次元の分散を得ることと、を含むことを特徴とする請求項17または18に記載の方法。 - 前記正規化層によって前記サンプルの特徴マップセットを少なくとも一つの次元で正規化し、サンプルの少なくとも一つの次元の分散およびサンプルの少なくとも一つの次元の平均値を得ることは、
前記サンプルの特徴マップセットを、空間次元に基づいて正規化し、サンプルの空間次元の分散およびサンプルの空間次元の平均値を得ることと、
前記サンプルの空間次元の分散および前記サンプルの空間次元の平均値に基づき、前記チャネル次元に対応するサンプルのチャネル次元の分散およびサンプルのチャネル次元の平均値を得ることと、
前記サンプルの空間次元の分散および前記サンプルの空間次元の平均値に基づき、前記バッチ座標次元に対応するサンプルのバッチ座標次元の分散およびサンプルのバッチ座標次元の平均値を得ることと、を含むことを特徴とする請求項14から16のいずれか一項に記載の方法。 - 前記サンプルの特徴マップセットを、空間次元に基づいて正規化し、サンプルの空間次元の分散およびサンプルの空間次元の平均値を得ることは、
前記サンプルの特徴マップセット内の少なくとも一つのサンプル特徴マップの高さ値および幅値を変数とし、前記少なくとも一つのサンプル特徴マップに基づいて前記サンプルの空間次元の平均値を得ることと、
前記サンプルの空間次元の平均値および前記少なくとも一つのサンプル特徴マップに基づき、前記サンプルの空間次元の分散を得ることと、を含むことを特徴とする請求項17から20のいずれか一項に記載の方法。 - 前記サンプルの空間次元の分散および前記サンプルの空間次元の平均値に基づき、前記チャネル次元に対応するサンプルのチャネル次元の分散およびサンプルのチャネル次元の平均値を得ることは、
前記サンプルの特徴マップセットに対応するチャネル数を変数とし、前記サンプルの空間次元の平均値に基づいて前記サンプルのチャネル次元の平均値を得ることと、
前記サンプルの特徴マップセットに対応するチャネル数を変数とし、前記サンプルの空間次元の平均値、前記サンプルの空間次元の分散および前記サンプルのチャネル次元の平均値に基づいて前記サンプルのチャネル次元の分散を得ることと、を含むことを特徴とする請求項20または21に記載の方法。 - 前記サンプルの空間次元の分散および前記サンプルの空間次元の平均値に基づき、前記バッチ座標次元に対応するサンプルのバッチ座標次元の分散およびサンプルのバッチ座標次元の平均値を得ることは、
前記サンプルデータセットに対応するサンプルデータ数を変数とし、前記サンプルの空間次元の平均値に基づいて前記サンプルのバッチ座標次元の平均値を得ることと、
前記サンプルデータセットに対応するサンプルデータ数を変数とし、前記サンプルの空間次元の平均値、前記サンプルの空間次元の分散および前記サンプルのバッチ座標次元の平均値に基づいて前記サンプルのバッチ座標次元の分散を得ることと、を含むことを特徴とする請求項20から22のいずれか一項に記載の方法。 - 前記サンプルの少なくとも一つの次元の分散および前記サンプルの少なくとも一つの次元の平均値に基づいて正規化後の予測特徴マップセットを特定することは、
前記サンプルの少なくとも一つの次元の分散を重み付け平均してサンプル正規化分散を得て、前記サンプルの少なくとも一つの次元の平均値を重み付け平均してサンプル正規化平均値を得ることと、
前記サンプル正規化分散、前記サンプル正規化平均値、スケールパラメータおよびシフトパラメータに基づいて前記サンプルの特徴マップセットを処理し、前記予測特徴マップセットを得ることと、を含むことを特徴とする請求項14から23のいずれか一項に記載の方法。 - 少なくとも一つの入力データを含む入力データセットをディープニューラルネットワークに入力するための入力ユニットと、
前記ディープニューラルネットワークにおけるネットワーク層が出力した特徴マップセットを少なくとも一つの次元で正規化し、少なくとも一つの次元の分散および少なくとも一つの次元の平均値を得て、そのうち、前記特徴マップセットは、少なくとも一つの特徴マップを含み、少なくとも一つのチャネルに対応し、各チャネルはそれぞれ少なくとも一つの前記特徴マップに対応する次元正規化ユニットと、
前記少なくとも一つの次元の分散および前記少なくとも一つの次元の平均値に基づいて正規化後の目標特徴マップセットを特定するためのバッチ正規化ユニットと、を含むことを特徴とするディープニューラルネットワークの正規化装置。 - 前記次元は、
空間次元、チャネル次元及びバッチ座標次元の少なくとも一つを含むことを特徴とする請求項25に記載の装置。 - 前記次元正規化ユニットは、前記特徴マップセットを、空間次元に基づいて正規化し、空間次元の分散および空間次元の平均値を得るために、および/または、
前記特徴マップセットを、チャネル次元に基づいて正規化し、チャネル次元の分散およびチャネル次元の平均値を得るために、および/または、
前記特徴マップセットを、バッチ座標次元に基づいて正規化し、バッチ座標次元の分散およびバッチ座標次元の平均値を得るために用いられることを特徴とする請求項26に記載の装置。 - 前記次元正規化ユニットは前記特徴マップセットを、チャネル次元に基づいて正規化し、チャネル次元の分散およびチャネル次元の平均値を得る場合、具体的に、前記特徴マップセット内の少なくとも一つの特徴マップの高さ値、幅値および前記特徴マップセットに対応するチャネル数を変数とし、前記少なくとも一つの特徴マップに基づいて前記チャネル次元の平均値を得て、前記チャネル次元の平均値および前記少なくとも一つの特徴マップに基づき、前記チャネル次元の分散を得るために用いられることを特徴とする請求項27に記載の装置。
- 前記次元正規化ユニットは前記特徴マップセットを、バッチ座標次元に基づいて正規化し、バッチ座標次元の分散およびバッチ座標次元の平均値を得る場合、具体的に、前記特徴マップセット内の前記少なくとも一つの特徴マップの高さ値、幅値および前記入力データセットに対応する入力データ数を変数とし、前記少なくとも一つの特徴マップに基づいて前記バッチ座標次元の平均値を得て、前記バッチ座標次元の平均値および前記少なくとも一つの特徴マップに基づき、前記バッチ座標次元の分散を得るために用いられることを特徴とする請求項27または28に記載の装置。
- 前記次元正規化ユニットは、前記特徴マップセットを、空間次元に基づいて正規化し、空間次元の分散および空間次元の平均値を得て、前記空間次元の分散および前記空間次元の平均値に基づき、前記チャネル次元に対応するチャネル次元の分散およびチャネル次元の平均値を得て、前記空間次元の分散および前記空間次元の平均値に基づき、前記バッチ座標次元に対応するバッチ座標次元の分散およびバッチ座標次元の平均値を得るために用いられることを特徴とする請求項26に記載の装置。
- 前記次元正規化ユニットは前記特徴マップセットを、空間次元に基づいて正規化し、空間次元の分散および空間次元の平均値を得る場合、前記特徴マップセット内の少なくとも一つの特徴マップの高さ値および幅値を変数とし、前記少なくとも一つの特徴マップに基づいて前記空間次元の平均値を得て、前記空間次元の平均値および前記少なくとも一つの特徴マップに基づき、前記空間次元の分散を得るために用いられることを特徴とする請求項27から30のいずれか一項に記載の装置。
- 前記次元正規化ユニットは前記空間次元の分散および前記空間次元の平均値に基づき、前記チャネル次元に対応するチャネル次元の分散およびチャネル次元の平均値を得る場合、前記特徴マップセットに対応するチャネル数を変数とし、前記空間次元の平均値に基づいて前記チャネル次元の平均値を得て、前記特徴マップセットに対応するチャネル数を変数とし、前記空間次元の平均値、前記空間次元の分散および前記チャネル次元の平均値に基づいて前記チャネル次元の分散を得るために用いられることを特徴とする請求項30または31に記載の装置。
- 前記次元正規化ユニットは前記空間次元の分散および前記空間次元の平均値に基づき、前記バッチ座標次元に対応するバッチ座標次元の分散およびバッチ座標次元の平均値を得る場合、前記入力データセットに対応する入力データ数を変数とし、前記空間次元の平均値に基づいて前記バッチ座標次元の平均値を得て、前記入力データセットに対応する入力データ数を変数とし、前記空間次元の平均値、前記空間次元の分散および前記バッチ座標次元の平均値に基づいて前記バッチ座標次元の分散を得るために用いられることを特徴とする請求項30から32のいずれか一項に記載の装置。
- 前記バッチ正規化ユニットは前記少なくとも一つの次元の分散および前記少なくとも一つの次元の平均値に基づいて正規化後の目標特徴マップセットを特定する場合、前記少なくとも一つの次元の分散を重み付け平均して正規化分散を得て、前記少なくとも一つの次元の平均値を重み付け平均して正規化平均値を得て、前記正規化分散および前記正規化平均値に基づいて前記目標特徴マップセットを特定するために用いられることを特徴とする請求項25から33のいずれか一項に記載の装置。
- 前記バッチ正規化ユニットは前記正規化分散および前記正規化平均値に基づいて前記目標特徴マップセットを特定する場合、前記正規化分散、前記正規化平均値、スケールパラメータおよびシフトパラメータに基づいて前記特徴マップセットを処理し、前記目標特徴マップセットを得るために用いられることを特徴とする請求項34に記載の装置。
- 前記目標特徴マップセットに基づいて前記入力データセットが少なくとも一つのデータ結果に対応することを特定するための結果特定ユニットをさらに含むことを特徴とする請求項25から35のいずれか一項に記載の装置。
- 前記入力データはマーク情報を有するサンプルデータであり、
少なくとも一つのサンプルデータを含む前記サンプルデータセットに基づいて前記ディープニューラルネットワークを訓練するための訓練ユニットをさらに含むことを特徴とする請求項25から36のいずれか一項に記載の装置。 - 前記ディープニューラルネットワークは少なくとも一つのネットワーク層および少なくとも一つの正規化層を含み、
前記入力ユニットはさらに、前記サンプルデータセットを前記ディープニューラルネットワークに入力し、前記ネットワーク層によって、少なくとも一つのサンプル特徴マップを含むサンプルの特徴マップセットを出力するために用いられ、
前記次元正規化ユニットはさらに、前記正規化層によって前記サンプルの特徴マップセットを少なくとも一つの次元で正規化し、サンプルの少なくとも一つの次元の分散およびサンプルの少なくとも一つの次元の平均値を得るために用いられ、
前記バッチ正規化ユニットはさらに、前記サンプルの少なくとも一つの次元の分散および前記サンプルの少なくとも一つの次元の平均値に基づいて正規化後の予測特徴マップセットを特定するために用いられ、
前記結果特定ユニットはさらに、前記予測特徴マップセットに基づいて前記サンプルデータに対応する予測結果を特定するために用いられ、
前記訓練ユニットは、前記予測結果および前記マーク情報に基づき、前記少なくとも一つのネットワーク層のパラメータおよび前記少なくとも一つの正規化層のパラメータを調整するために用いられることを特徴とする請求項37に記載の装置。 - 前記正規化層のパラメータは、次元に対応する重み値、スケールパラメータおよびシフトパラメータの少なくとも一つを含むことを特徴とする請求項38に記載の装置。
- 前記重み値は、
空間次元重み値、チャネル次元重み値及びバッチ座標次元重み値の少なくとも一つを含むことを特徴とする請求項39に記載の装置。 - 前記次元正規化ユニットは具体的に、前記サンプルの特徴マップセットを、空間次元に基づいて正規化し、サンプルの空間次元の分散およびサンプルの空間次元の平均値を得るために、および/または、
前記サンプルの特徴マップセットを、チャネル次元に基づいて正規化し、サンプルのチャネル次元の分散およびサンプルのチャネル次元の平均値を得るために、および/または、
前記サンプルの特徴マップセットを、バッチ座標次元に基づいて正規化し、サンプルのバッチ座標次元の分散およびサンプルのバッチ座標次元の平均値を得るために用いられることを特徴とする請求項38から40のいずれか一項に記載の装置。 - 前記次元正規化ユニットは前記サンプルの特徴マップセットを、チャネル次元に基づいて正規化し、サンプルのチャネル次元の分散およびサンプルのチャネル次元の平均値を得る場合、前記サンプルの特徴マップセット内の少なくとも一つのサンプル特徴マップの高さ値、幅値および前記サンプルの特徴マップセットに対応するチャネル数を変数とし、前記少なくとも一つのサンプル特徴マップに基づいて前記サンプルのチャネル次元の平均値を得て、前記サンプルのチャネル次元の平均値および前記少なくとも一つのサンプル特徴マップに基づき、前記サンプルのチャネル次元の分散を得るために用いられることを特徴とする請求項41に記載の装置。
- 前記次元正規化ユニットは前記サンプルの特徴マップセットを、バッチ座標次元に基づいて正規化し、サンプルのバッチ座標次元の分散およびサンプルのバッチ座標次元の平均値を得る場合、前記サンプルの特徴マップセット内の少なくとも一つのサンプル特徴マップの高さ値、幅値および前記サンプルデータセットに対応するサンプルデータ数を変数とし、前記少なくとも一つのサンプル特徴マップに基づいて前記サンプルのバッチ座標次元の平均値を得て、前記サンプルのバッチ座標次元の平均値および前記少なくとも一つのサンプル特徴マップに基づき、前記サンプルのバッチ座標次元の分散を得るために用いられることを特徴とする請求項41または42に記載の装置。
- 前記次元正規化ユニットは、前記サンプルの特徴マップセットを、空間次元に基づいて正規化し、サンプルの空間次元の分散およびサンプルの空間次元の平均値を得て、前記サンプルの空間次元の分散および前記サンプルの空間次元の平均値に基づき、前記チャネル次元に対応するサンプルのチャネル次元の分散およびサンプルのチャネル次元の平均値を得て、前記サンプルの空間次元の分散および前記サンプルの空間次元の平均値に基づき、前記バッチ座標次元に対応するサンプルのバッチ座標次元の分散およびサンプルのバッチ座標次元の平均値を得るために用いられることを特徴とする請求項41から43のいずれか一項に記載の装置。
- 前記次元正規化ユニットは前記サンプルの特徴マップセットを、空間次元に基づいて正規化し、サンプルの空間次元の分散およびサンプルの空間次元の平均値を得る場合、前記サンプルの特徴マップセット内の少なくとも一つのサンプル特徴マップの高さ値および幅値を変数とし、少なくとも一つの前記サンプル特徴マップに基づいて前記サンプルの空間次元の平均値を得て、前記サンプルの空間次元の平均値および前記少なくとも一つのサンプル特徴マップに基づき、前記サンプルの空間次元の分散を得るために用いられることを特徴とする請求項41から44のいずれか一項に記載の装置。
- 前記次元正規化ユニットは前記サンプルの空間次元の分散および前記サンプルの空間次元の平均値に基づき、前記チャネル次元に対応するサンプルのチャネル次元の分散およびサンプルのチャネル次元の平均値を得る場合、前記サンプルの特徴マップセットに対応するチャネル数を変数とし、前記サンプルの空間次元の平均値に基づいて前記サンプルのチャネル次元の平均値を得て、前記サンプルの特徴マップセットに対応するチャネル数を変数とし、前記サンプルの空間次元の平均値、前記サンプルの空間次元の分散および前記サンプルのチャネル次元の平均値に基づいて前記サンプルのチャネル次元の分散を得るために用いられることを特徴とする請求項44または45に記載の装置。
- 前記次元正規化ユニットは前記サンプルの空間次元の分散および前記サンプルの空間次元の平均値に基づき、前記バッチ座標次元に対応するサンプルのバッチ座標次元の分散およびサンプルのバッチ座標次元の平均値を得る場合、前記サンプルデータセットに対応するサンプルデータ数を変数とし、前記サンプルの空間次元の平均値に基づいて前記サンプルのバッチ座標次元の平均値を得て、前記サンプルデータセットに対応するサンプルデータ数を変数とし、前記サンプルの空間次元の平均値、前記サンプルの空間次元の分散および前記サンプルのバッチ座標次元の平均値に基づいて前記サンプルのバッチ座標次元の分散を得るために用いられることを特徴とする請求項44から46のいずれか一項に記載の装置。
- 前記バッチ正規化ユニットは、前記サンプルの少なくとも一つの次元の分散を重み付け平均してサンプル正規化分散を得て、前記サンプルの少なくとも一つの次元の平均値を重み付け平均してサンプル正規化平均値を得て、前記サンプル正規化分散、前記サンプル正規化平均値、スケールパラメータおよびシフトパラメータに基づいて前記サンプルの特徴マップセットを処理し、前記予測特徴マップセットを得るために用いられることを特徴とする請求項38から47のいずれか一項に記載の装置。
- 実行可能命令を記憶するためのメモリ、および
前記メモリと通信して前記実行可能命令を実行することで請求項1から24のいずれか一項に記載のディープニューラルネットワークの正規化方法の動作を行うためのプロセッサを含むことを特徴とする電子機器。 - コンピュータ読み取り可能な命令を記憶するためのコンピュータ読み取り可能記憶媒体であって、前記命令は実行される時に請求項1から24のいずれか一項に記載のディープニューラルネットワークの正規化方法の動作を実行することを特徴とするコンピュータ読み取り可能記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810609601.0 | 2018-06-13 | ||
CN201810609601.0A CN108921283A (zh) | 2018-06-13 | 2018-06-13 | 深度神经网络的归一化方法和装置、设备、存储介质 |
PCT/CN2019/090964 WO2019238072A1 (zh) | 2018-06-13 | 2019-06-12 | 深度神经网络的归一化方法和装置、设备、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020537204A true JP2020537204A (ja) | 2020-12-17 |
JP7009614B2 JP7009614B2 (ja) | 2022-01-25 |
Family
ID=64419572
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020510104A Active JP7009614B2 (ja) | 2018-06-13 | 2019-06-12 | ディープニューラルネットワークの正規化方法および装置、機器、ならびに記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20200257979A1 (ja) |
JP (1) | JP7009614B2 (ja) |
KR (1) | KR20210018180A (ja) |
CN (1) | CN108921283A (ja) |
WO (1) | WO2019238072A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110096933B (zh) * | 2018-01-30 | 2023-07-18 | 华为技术有限公司 | 目标检测的方法、装置及系统 |
US20190279043A1 (en) * | 2018-03-06 | 2019-09-12 | Tazi AI Systems, Inc. | Online machine learning system that continuously learns from data and human input |
CN108921283A (zh) * | 2018-06-13 | 2018-11-30 | 深圳市商汤科技有限公司 | 深度神经网络的归一化方法和装置、设备、存储介质 |
US20200242771A1 (en) * | 2019-01-25 | 2020-07-30 | Nvidia Corporation | Semantic image synthesis for generating substantially photorealistic images using neural networks |
CN109784420B (zh) * | 2019-01-29 | 2021-12-28 | 深圳市商汤科技有限公司 | 一种图像处理方法及装置、计算机设备和存储介质 |
CN109886392B (zh) * | 2019-02-25 | 2021-04-27 | 深圳市商汤科技有限公司 | 数据处理方法和装置、电子设备和存储介质 |
CN110753264B (zh) * | 2019-10-23 | 2022-06-07 | 支付宝(杭州)信息技术有限公司 | 视频生成方法、装置及设备 |
CN111325222A (zh) * | 2020-02-27 | 2020-06-23 | 深圳市商汤科技有限公司 | 图像归一化处理方法及装置、存储介质 |
CN111508038A (zh) * | 2020-04-17 | 2020-08-07 | 北京百度网讯科技有限公司 | 图像处理方法、装置、电子设备及计算机可读存储介质 |
CN111985613B (zh) * | 2020-07-22 | 2024-06-21 | 东南大学 | 基于l1范数组归一化的卷积神经网络电路的归一化方法 |
WO2022040963A1 (en) * | 2020-08-26 | 2022-03-03 | Intel Corporation | Methods and apparatus to dynamically normalize data in neural networks |
CN115803752A (zh) * | 2020-09-08 | 2023-03-14 | 华为技术有限公司 | 深度卷积神经网络中的归一化 |
CN112926646B (zh) * | 2021-02-22 | 2023-07-04 | 上海壁仞智能科技有限公司 | 数据批量标准化方法、计算设备和计算机可读存储介质 |
CN113191446B (zh) * | 2021-05-17 | 2022-04-08 | 电子科技大学 | 一种基于深度归一化网络的多旋翼无人机目标识别方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018508879A (ja) * | 2015-01-28 | 2018-03-29 | グーグル エルエルシー | バッチ正規化レイヤ |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110688891B (zh) * | 2015-08-15 | 2024-05-31 | 硕动力公司 | 采用3d批归一化的三维(3d)卷积 |
CN106203624B (zh) * | 2016-06-23 | 2019-06-21 | 上海交通大学 | 基于深度神经网络的矢量量化系统及方法 |
US9836853B1 (en) * | 2016-09-06 | 2017-12-05 | Gopro, Inc. | Three-dimensional convolutional neural networks for video highlight detection |
EP3552112A1 (en) * | 2016-12-09 | 2019-10-16 | Beijing Horizon Information Technology Co., Ltd. | Systems and methods for data management |
CN106780466A (zh) * | 2016-12-21 | 2017-05-31 | 广西师范大学 | 一种基于卷积神经网络的宫颈细胞图像识别方法 |
US10867255B2 (en) * | 2017-03-03 | 2020-12-15 | Hong Kong Applied Science and Technology Research Institute Company Limited | Efficient annotation of large sample group |
CN107169956B (zh) * | 2017-04-28 | 2020-02-14 | 西安工程大学 | 基于卷积神经网络的色织物疵点检测方法 |
CN107798356A (zh) * | 2017-11-24 | 2018-03-13 | 郑州大学西亚斯国际学院 | 基于深度卷积神经网络的作物叶片病害识别方法 |
CN108921283A (zh) * | 2018-06-13 | 2018-11-30 | 深圳市商汤科技有限公司 | 深度神经网络的归一化方法和装置、设备、存储介质 |
-
2018
- 2018-06-13 CN CN201810609601.0A patent/CN108921283A/zh active Pending
-
2019
- 2019-06-12 KR KR1020207013708A patent/KR20210018180A/ko not_active Application Discontinuation
- 2019-06-12 JP JP2020510104A patent/JP7009614B2/ja active Active
- 2019-06-12 WO PCT/CN2019/090964 patent/WO2019238072A1/zh active Application Filing
-
2020
- 2020-04-29 US US16/862,304 patent/US20200257979A1/en not_active Abandoned
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018508879A (ja) * | 2015-01-28 | 2018-03-29 | グーグル エルエルシー | バッチ正規化レイヤ |
Non-Patent Citations (1)
Title |
---|
YUXIN WU ET AL.: ""Group Normalization"", ARXIV.ORG [ONLINE], vol. arXiv:1803.08494v2, JPN6021015436, April 2018 (2018-04-01), pages 1 - 10, ISSN: 0004494231 * |
Also Published As
Publication number | Publication date |
---|---|
WO2019238072A1 (zh) | 2019-12-19 |
US20200257979A1 (en) | 2020-08-13 |
JP7009614B2 (ja) | 2022-01-25 |
KR20210018180A (ko) | 2021-02-17 |
CN108921283A (zh) | 2018-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7009614B2 (ja) | ディープニューラルネットワークの正規化方法および装置、機器、ならびに記憶媒体 | |
CN108229479B (zh) | 语义分割模型的训练方法和装置、电子设备、存储介质 | |
CN108460338B (zh) | 人体姿态估计方法和装置、电子设备、存储介质、程序 | |
CN108399383B (zh) | 表情迁移方法、装置存储介质及程序 | |
TWI721510B (zh) | 雙目圖像的深度估計方法、設備及儲存介質 | |
CN112949678B (zh) | 深度学习模型对抗样本生成方法、系统、设备及存储介质 | |
CN109934792B (zh) | 电子装置及其控制方法 | |
JP7013489B2 (ja) | 学習装置、実写画像分類装置の生成システム、実写画像分類装置の生成装置、学習方法及びプログラム | |
CN114925748B (zh) | 模型训练及模态信息的预测方法、相关装置、设备、介质 | |
CN109117806B (zh) | 一种手势识别方法和装置 | |
WO2020082830A1 (zh) | 处理图像的方法和装置 | |
CN111814804B (zh) | 基于ga-bp-mc神经网络的人体三维尺寸信息预测方法及装置 | |
CN112990318B (zh) | 持续学习方法、装置、终端及存储介质 | |
CN111223128A (zh) | 目标跟踪方法、装置、设备及存储介质 | |
CN113065593A (zh) | 模型训练方法、装置、计算机设备和存储介质 | |
CN111862040A (zh) | 人像图片质量评价方法、装置、设备及存储介质 | |
WO2022126917A1 (zh) | 基于深度学习的人脸图像评估方法、装置、设备及介质 | |
JP2021144461A (ja) | 学習装置及び推論装置 | |
CN112862840B (zh) | 图像分割方法、装置、设备及介质 | |
CN115546554A (zh) | 敏感图像的识别方法、装置、设备和计算机可读存储介质 | |
CN114897884A (zh) | 基于多尺度边缘特征融合的无参考屏幕内容图像质量评估方法 | |
CN114170485A (zh) | 深度学习可解释方法及设备、存储介质和程序产品 | |
CN109993694B (zh) | 一种生成超分辨率图像的方法及装置 | |
CN113919476A (zh) | 一种图像处理方法、装置、电子设备以及存储介质 | |
WO2021142741A1 (zh) | 目标跟踪方法、装置及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200415 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200415 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210407 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210427 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210726 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211221 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220112 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7009614 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |