JP6935542B2 - バッチ正規化レイヤ - Google Patents
バッチ正規化レイヤ Download PDFInfo
- Publication number
- JP6935542B2 JP6935542B2 JP2020092300A JP2020092300A JP6935542B2 JP 6935542 B2 JP6935542 B2 JP 6935542B2 JP 2020092300 A JP2020092300 A JP 2020092300A JP 2020092300 A JP2020092300 A JP 2020092300A JP 6935542 B2 JP6935542 B2 JP 6935542B2
- Authority
- JP
- Japan
- Prior art keywords
- layer
- neural network
- layer output
- dimension
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010606 normalization Methods 0.000 title claims description 91
- 238000013528 artificial neural network Methods 0.000 claims description 192
- 238000012549 training Methods 0.000 claims description 89
- 238000000034 method Methods 0.000 claims description 34
- 230000009471 action Effects 0.000 claims description 25
- 230000009021 linear effect Effects 0.000 claims description 8
- 239000006185 dispersion Substances 0.000 claims description 4
- 230000001131 transforming effect Effects 0.000 claims 6
- 230000009022 nonlinear effect Effects 0.000 claims 1
- 230000001052 transient effect Effects 0.000 claims 1
- 230000008569 process Effects 0.000 description 16
- 238000012545 processing Methods 0.000 description 14
- 238000004590 computer program Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 206010011878 Deafness Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 231100000895 deafness Toxicity 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 208000016354 hearing loss disease Diseases 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Image Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
- User Interface Of Digital Computer (AREA)
Description
102 トレーニング例のバッチ
104 ニューラル・ネットワーク・レイヤA
106 レイヤA出力
108 バッチ正規化レイヤ
110 バッチ正規化レイヤ出力
112 ニューラル・ネットワーク・レイヤB
114 ニューラル・ネットワーク出力
Claims (30)
- ニューラル・ネットワーク内の第1のニューラル・ネットワーク・レイヤと第2のニューラル・ネットワーク・レイヤとの間にバッチ正規化レイヤを有するニューラル・ネットワークをトレーニングするための方法であって、前記第1のニューラル・ネットワーク・レイヤは、次元によりインデックス化された複数の成分を有する第1のレイヤ出力を生成し、前記方法が、
トレーニングデータの複数のバッチでの前記ニューラル・ネットワークのトレーニング中に、複数のトレーニング例を含む各バッチについて、
前記バッチ内の前記複数のトレーニング例の各々に対する各第1のレイヤ出力を受信するステップと、
前記次元の各々について、前記次元における前記第1のレイヤ出力の成分の平均を計算するステップと、
前記次元の各々について、前記次元における前記第1のレイヤ出力の前記成分の標準偏差を計算するステップと、
前記各第1のレイヤ出力の前記複数の成分の各々を正規化し、前記バッチ内の各トレーニング例に対する各正規化されたレイヤ出力を生成するステップであって、
前記各第1のレイヤ出力ごとに、かつ前記複数の成分の各々ごとに、前記成分に対応する前記次元に対する前記計算された平均と前記成分に対応する前記次元に対する前記計算された標準偏差とを用いて前記第1のレイヤ出力の前記成分を正規化するステップを含む、前記正規化されたレイヤ出力を生成するステップと、
前記正規化されたレイヤ出力から、前記トレーニング例の各々に対する各バッチ正規化レイヤ出力を生成するステップと、
入力として前記バッチ正規化レイヤ出力を前記第2のニューラル・ネットワーク・レイヤに提供するステップと
を含む、方法。 - 前記正規化されたレイヤ出力からの前記トレーニング例の各々に対する各バッチレイヤ正規化出力を生成するステップが、
前記トレーニング例の各々に対して、前記次元に対する1組のパラメータの現在の値に従って、前記次元における前記トレーニング例に対する前記正規化されたレイヤ出力の成分を各次元について変換するステップを含む、請求項1に記載の方法。 - 前記バッチ正規化レイヤは、
前記ニューラル・ネットワークが、前記次元の各々に対する前記1組のパラメータのトレーニングされた値を決定するためにトレーニングされた後に、
新しいニューラル・ネットワーク入力に対する、前記第1のニューラル・ネットワーク・レイヤによって生成される新たな第1のレイヤ出力を受信することと、
前記次元に対する予め計算された平均および標準偏差の統計値を用いて前記新たな第1のレイヤ出力の各成分を正規化して、新たな正規化されたレイヤ出力を生成することと、
前記次元に対する前記1組のパラメータのトレーニングされた値に従って、前記次元における前記トレーニング例について前記新たな正規化されたレイヤ出力の前記成分を各次元について変換することによって、新たなバッチ正規化レイヤ出力を生成することと、
新たなレイヤ出力として前記バッチ正規化レイヤ出力を前記第2のニューラル・ネットワーク・レイヤに提供することと
を行うように構成された、請求項3に記載の方法。 - 前記次元に対する前記予め計算された平均および標準偏差の統計値が、前記ニューラル・ネットワークのトレーニング中に前記第1のニューラル・ネットワーク・レイヤによって生成された第1のレイヤ出力から計算される、請求項4に記載の方法。
- 前記次元に対する前記予め計算された平均および標準偏差の統計値が、前記ニューラル・ネットワークがトレーニングされた後に前記第1のニューラル・ネットワーク・レイヤにより生成された新たな第1のレイヤ出力から計算される、請求項4に記載の方法。
- 前記ニューラル・ネットワーク・システムがトレーニングされた後に前記ニューラル・ネットワーク・システムによって処理される新たなニューラル・ネットワーク入力が、前記ニューラル・ネットワーク・システムをトレーニングするために用いられた前記トレーニング例とは異なるタイプの入力である、請求項6に記載の方法。
- 前記第1のニューラル・ネットワーク・レイヤは、前記第1のニューラル・ネットワーク・レイヤに対する1組のパラメータの現在の値に従って、前記第1のレイヤ出力を修正することによって前記第1のレイヤ出力を生成する、請求項1に記載の方法。
- 前記第2のニューラル・ネットワーク・レイヤが、非線形動作を前記バッチ正規化レイヤ出力に適用することによって第2のレイヤ出力を生成する、請求項8に記載の方法。
- 前記第1のニューラル・ネットワーク・レイヤは、1組のパラメータの現在の値に従って第1のレイヤ出力を修正し、修正された第1のレイヤ出力を生成し、その後に非線形動作を前記修正された第1のレイヤ入力に適用することによって、前記第1のレイヤ出力を生成する、請求項1に記載の方法。
- 前記ニューラル・ネットワークのトレーニング中に、前記ニューラル・ネットワークのパラメータの値を調整することとの一部として前記平均および前記標準偏差を誤差逆伝播するステップをさらに含む、請求項1に記載の方法。
- システムであって、
1つまたは複数のコンピュータと、複数の命令を記録する1つまたは複数の記憶デバイスとを備え、
前記複数の命令は、前記1つまたは複数のコンピュータによって実行されたときに、前記1つまたは複数のコンピュータに、ニューラル・ネットワーク内の第1のニューラル・ネットワーク・レイヤと第2のニューラル・ネットワーク・レイヤとの間にバッチ正規化レイヤを有するニューラル・ネットワークをトレーニングするための動作を行わせ、
前記第1のニューラル・ネットワーク・レイヤは、次元によりインデックス化された複数の成分を有する第1のレイヤ出力を生成し、
前記複数の動作が、トレーニングデータの複数のバッチでの前記ニューラル・ネットワークのトレーニング中に、複数のトレーニング例を含む各バッチについて、
前記バッチ内の前記複数のトレーニング例の各々に対する各第1のレイヤ出力を受信する動作と、
前記次元の各々について、前記次元における前記第1のレイヤ出力の成分の平均を計算する動作と、
前記次元の各々について、前記次元における前記第1のレイヤ出力の前記成分の標準偏差を計算する動作と、
前記各第1のレイヤ出力の前記複数の成分の各々を正規化し、前記バッチ内の各トレーニング例に対する各正規化されたレイヤ出力を生成する動作であって、
前記各第1のレイヤ出力ごとに、かつ前記複数の成分の各々ごとに、前記成分に対応する前記次元に対する前記計算された平均と前記成分に対応する前記次元に対する前記計算された標準偏差とを用いて前記第1のレイヤ出力の前記成分を正規化する動作を含む、前記正規化されたレイヤ出力を生成する動作と、
前記正規化されたレイヤ出力から、前記トレーニング例の各々に対する各バッチ正規化レイヤ出力を生成する動作と、
入力として前記バッチ正規化レイヤ出力を前記第2のニューラル・ネットワーク・レイヤに提供する動作と
を含む、システム。 - 前記正規化されたレイヤ出力からの前記トレーニング例の各々に対する各バッチレイヤ正規化出力を生成する動作が、
前記トレーニング例の各々に対して、前記次元に対する1組のパラメータの現在の値に従って、前記次元における前記トレーニング例に対する前記正規化されたレイヤ出力の成分を各次元について変換する動作を含む、請求項12に記載のシステム。 - 前記バッチ正規化レイヤは、
前記ニューラル・ネットワークが、前記次元の各々に対する前記1組のパラメータのトレーニングされた値を決定するためにトレーニングされた後に、
新しいニューラル・ネットワーク入力に対する、前記第1のニューラル・ネットワーク・レイヤによって生成される新たな第1のレイヤ出力を受信することと、
前記次元に対する予め計算された平均および標準偏差の統計値を用いて前記新たな第1のレイヤ出力の各成分を正規化して、新たな正規化されたレイヤ出力を生成することと、
前記次元に対する前記1組のパラメータのトレーニングされた値に従って、前記次元における前記トレーニング例について前記新たな正規化されたレイヤ出力の前記成分を各次元について変換することによって、新たなバッチ正規化レイヤ出力を生成することと、
新たなレイヤ出力として前記バッチ正規化レイヤ出力を前記第2のニューラル・ネットワーク・レイヤに提供することと
を行うように構成された、請求項14に記載のシステム。 - 前記次元に対する前記予め計算された平均および標準偏差の統計値が、前記ニューラル・ネットワークのトレーニング中に前記第1のニューラル・ネットワーク・レイヤによって生成された第1のレイヤ出力から計算される、請求項15に記載のシステム。
- 前記次元に対する前記予め計算された平均および標準偏差の統計値が、前記ニューラル・ネットワークがトレーニングされた後に前記第1のニューラル・ネットワーク・レイヤにより生成された新たな第1のレイヤ出力から計算される、請求項15に記載のシステム。
- 前記ニューラル・ネットワーク・システムがトレーニングされた後に前記ニューラル・ネットワーク・システムによって処理される新たなニューラル・ネットワーク入力が、前記ニューラル・ネットワーク・システムをトレーニングするために用いられた前記トレーニング例とは異なるタイプの入力である、請求項17に記載のシステム。
- 前記第1のニューラル・ネットワーク・レイヤは、前記第1のニューラル・ネットワーク・レイヤに対する1組のパラメータの現在の値に従って、前記第1のレイヤ出力を修正することによって前記第1のレイヤ出力を生成する、請求項12に記載のシステム。
- 前記第2のニューラル・ネットワーク・レイヤが、非線形動作を前記バッチ正規化レイヤ出力に適用することによって第2のレイヤ出力を生成する、請求項19に記載のシステム。
- 前記第1のニューラル・ネットワーク・レイヤは、1組のパラメータの現在の値に従って第1のレイヤ出力を修正し、修正された第1のレイヤ出力を生成し、その後に非線形動作を前記修正された第1のレイヤ入力に適用することによって、前記第1のレイヤ出力を生成する、請求項12に記載のシステム。
- 前記複数の動作が、前記ニューラル・ネットワークのトレーニング中に、前記ニューラル・ネットワークのパラメータの値を調整することとの一部として前記平均および前記標準偏差を誤差逆伝播する動作をさらに含む、請求項12に記載のシステム。
- 複数の命令を記録した1つまたは複数の非一時的コンピュータ可読記録媒体であって、前記命令は、1つまたは複数のコンピュータによって実行されたときに、前記1つまたは複数のコンピュータに、ニューラル・ネットワーク内の第1のニューラル・ネットワーク・レイヤと第2のニューラル・ネットワーク・レイヤとの間にバッチ正規化レイヤを有するニューラル・ネットワークをトレーニングするための動作を行わせ、
前記第1のニューラル・ネットワーク・レイヤは、次元によりインデックス化された複数の成分を有する第1のレイヤ出力を生成し、
前記複数の動作が、トレーニングデータの複数のバッチでの前記ニューラル・ネットワークのトレーニング中に、複数のトレーニング例を含む各バッチについて、
前記バッチ内の前記複数のトレーニング例の各々に対する各第1のレイヤ出力を受信する動作と、
前記次元の各々について、前記次元における前記第1のレイヤ出力の成分の平均を計算する動作と、
前記次元の各々について、前記次元における前記第1のレイヤ出力の前記成分の標準偏差を計算する動作と、
前記各第1のレイヤ出力の前記複数の成分の各々を正規化し、前記バッチ内の各トレーニング例に対する各正規化されたレイヤ出力を生成する動作であって、
前記各第1のレイヤ出力ごとに、かつ前記複数の成分の各々ごとに、前記成分に対応する前記次元に対する前記計算された平均と前記成分に対応する前記次元に対する前記計算された標準偏差とを用いて前記第1のレイヤ出力の前記成分を正規化する動作を含む、前記正規化されたレイヤ出力を生成する動作と、
前記正規化されたレイヤ出力から、前記トレーニング例の各々に対する各バッチ正規化レイヤ出力を生成する動作と、
入力として前記バッチ正規化レイヤ出力を前記第2のニューラル・ネットワーク・レイヤに提供する動作と
を含む、非一時的コンピュータ可読記録媒体。 - 前記正規化されたレイヤ出力からの前記トレーニング例の各々に対する各バッチレイヤ正規化出力を生成する動作が、
前記トレーニング例の各々に対して、前記次元に対する1組のパラメータの現在の値に従って、前記次元における前記トレーニング例に対する前記正規化されたレイヤ出力の成分を各次元について変換する動作を含む、請求項23に記載の非一時的コンピュータ可読記録媒体。 - 前記バッチ正規化レイヤは、
前記ニューラル・ネットワークが、前記次元の各々に対する前記1組のパラメータのトレーニングされた値を決定するためにトレーニングされた後に、
新しいニューラル・ネットワーク入力に対する、前記第1のニューラル・ネットワーク・レイヤによって生成される新たな第1のレイヤ出力を受信することと、
前記次元に対する予め計算された平均および標準偏差の統計値を用いて前記新たな第1のレイヤ出力の各成分を正規化して、新たな正規化されたレイヤ出力を生成することと、
前記次元に対する前記1組のパラメータのトレーニングされた値に従って、前記次元における前記トレーニング例について前記新たな正規化されたレイヤ出力の前記成分を各次元について変換することによって、新たなバッチ正規化レイヤ出力を生成することと、
新たなレイヤ出力として前記バッチ正規化レイヤ出力を前記第2のニューラル・ネットワーク・レイヤに提供することと
を行うように構成された、請求項25に記載の非一時的コンピュータ可読記録媒体。 - 前記第1のニューラル・ネットワーク・レイヤは、前記第1のニューラル・ネットワーク・レイヤに対する1組のパラメータの現在の値に従って、前記第1のレイヤ出力を修正することによって前記第1のレイヤ出力を生成する、請求項23に記載の非一時的コンピュータ可読記録媒体。
- 前記第2のニューラル・ネットワーク・レイヤが、非線形動作を前記バッチ正規化レイヤ出力に適用することによって第2のレイヤ出力を生成する、請求項27に記載の非一時的コンピュータ可読記録媒体。
- 前記第1のニューラル・ネットワーク・レイヤは、1組のパラメータの現在の値に従って第1のレイヤ出力を修正し、修正された第1のレイヤ出力を生成し、その後に非線形動作を前記修正された第1のレイヤ入力に適用することによって、前記第1のレイヤ出力を生成する、請求項23に記載の非一時的コンピュータ可読記録媒体。
- 前記複数の動作が、前記ニューラル・ネットワークのトレーニング中に、前記ニューラル・ネットワークのパラメータの値を調整することとの一部として前記平均および前記標準偏差を誤差逆伝播する動作をさらに含む、請求項23に記載の非一時的コンピュータ可読記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021137180A JP7179935B2 (ja) | 2015-01-28 | 2021-08-25 | バッチ正規化レイヤ |
JP2022183459A JP7536844B2 (ja) | 2015-01-28 | 2022-11-16 | バッチ正規化レイヤ |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562108984P | 2015-01-28 | 2015-01-28 | |
US62/108,984 | 2015-01-28 | ||
JP2018232445A JP6710745B2 (ja) | 2015-01-28 | 2018-12-12 | バッチ正規化レイヤ |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018232445A Division JP6710745B2 (ja) | 2015-01-28 | 2018-12-12 | バッチ正規化レイヤ |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021137180A Division JP7179935B2 (ja) | 2015-01-28 | 2021-08-25 | バッチ正規化レイヤ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020149719A JP2020149719A (ja) | 2020-09-17 |
JP6935542B2 true JP6935542B2 (ja) | 2021-09-15 |
Family
ID=55349983
Family Applications (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017539561A Active JP6453477B2 (ja) | 2015-01-28 | 2016-01-28 | バッチ正規化レイヤ |
JP2018232445A Active JP6710745B2 (ja) | 2015-01-28 | 2018-12-12 | バッチ正規化レイヤ |
JP2020092300A Active JP6935542B2 (ja) | 2015-01-28 | 2020-05-27 | バッチ正規化レイヤ |
JP2021137180A Active JP7179935B2 (ja) | 2015-01-28 | 2021-08-25 | バッチ正規化レイヤ |
JP2022183459A Active JP7536844B2 (ja) | 2015-01-28 | 2022-11-16 | バッチ正規化レイヤ |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017539561A Active JP6453477B2 (ja) | 2015-01-28 | 2016-01-28 | バッチ正規化レイヤ |
JP2018232445A Active JP6710745B2 (ja) | 2015-01-28 | 2018-12-12 | バッチ正規化レイヤ |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021137180A Active JP7179935B2 (ja) | 2015-01-28 | 2021-08-25 | バッチ正規化レイヤ |
JP2022183459A Active JP7536844B2 (ja) | 2015-01-28 | 2022-11-16 | バッチ正規化レイヤ |
Country Status (17)
Country | Link |
---|---|
US (9) | US10417562B2 (ja) |
EP (3) | EP3251059B1 (ja) |
JP (5) | JP6453477B2 (ja) |
KR (2) | KR102055355B1 (ja) |
CN (1) | CN107278310A (ja) |
AU (5) | AU2016211333B2 (ja) |
CA (1) | CA2975251C (ja) |
DE (1) | DE112016000509T5 (ja) |
DK (1) | DK3251059T3 (ja) |
ES (1) | ES2714152T3 (ja) |
IL (1) | IL253676A0 (ja) |
MX (1) | MX2017009879A (ja) |
PL (1) | PL3251059T3 (ja) |
RU (1) | RU2666308C1 (ja) |
SG (1) | SG11201706127RA (ja) |
TR (1) | TR201902908T4 (ja) |
WO (1) | WO2016123409A1 (ja) |
Families Citing this family (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PL3251059T3 (pl) | 2015-01-28 | 2019-05-31 | Google Llc | Warstwy normalizacji danych wejściowych |
WO2017015887A1 (en) * | 2015-07-29 | 2017-02-02 | Nokia Technologies Oy | Object detection with neural network |
CN109923500B (zh) | 2016-08-22 | 2022-01-04 | 奇跃公司 | 具有深度学习传感器的增强现实显示装置 |
WO2018148526A1 (en) * | 2017-02-10 | 2018-08-16 | Google Llc | Batch renormalization layers |
US10255681B2 (en) * | 2017-03-02 | 2019-04-09 | Adobe Inc. | Image matting using deep learning |
US20190370641A1 (en) * | 2017-03-06 | 2019-12-05 | Sony Corporation | Information processing apparatus |
US11308391B2 (en) | 2017-03-06 | 2022-04-19 | Baidu Usa Llc | Offline combination of convolutional/deconvolutional and batch-norm layers of convolutional neural network models for autonomous driving vehicles |
CN110663049B (zh) * | 2017-04-28 | 2023-12-26 | 谷歌有限责任公司 | 神经网络优化器搜索 |
CN109034384B (zh) * | 2017-06-12 | 2021-06-22 | 浙江宇视科技有限公司 | 一种数据处理方法和装置 |
US10635813B2 (en) | 2017-10-06 | 2020-04-28 | Sophos Limited | Methods and apparatus for using machine learning on multiple file fragments to identify malware |
US11586905B2 (en) * | 2017-10-11 | 2023-02-21 | Arizona Board Of Regents On Behalf Of Arizona State University | Systems and methods for customizing kernel machines with deep neural networks |
EP3701431A1 (en) * | 2017-10-27 | 2020-09-02 | Google LLC | Increasing security of neural networks by discretizing neural network inputs |
WO2019123544A1 (ja) * | 2017-12-19 | 2019-06-27 | オリンパス株式会社 | データ処理方法およびデータ処理装置 |
CN108009634B (zh) * | 2017-12-21 | 2021-05-25 | 美的集团股份有限公司 | 一种卷积神经网络的优化方法、装置及计算机存储介质 |
EP3511872A1 (en) | 2018-01-12 | 2019-07-17 | Sony Corporation | Artificial neural network |
US11003774B2 (en) | 2018-01-26 | 2021-05-11 | Sophos Limited | Methods and apparatus for detection of malicious documents using machine learning |
US11941491B2 (en) | 2018-01-31 | 2024-03-26 | Sophos Limited | Methods and apparatus for identifying an impact of a portion of a file on machine learning classification of malicious content |
WO2019149375A1 (en) * | 2018-02-02 | 2019-08-08 | Toyota Motor Europe | Method and system for processing input data and propagating variance in a neural network |
WO2019149376A1 (en) | 2018-02-02 | 2019-08-08 | Toyota Motor Europe | Method and system for processing input data using a neural network and normalizations |
US20190251429A1 (en) * | 2018-02-12 | 2019-08-15 | Kneron, Inc. | Convolution operation device and method of scaling convolution input for convolution neural network |
CN108875787B (zh) | 2018-05-23 | 2020-07-14 | 北京市商汤科技开发有限公司 | 一种图像识别方法及装置、计算机设备和存储介质 |
CN108921283A (zh) * | 2018-06-13 | 2018-11-30 | 深圳市商汤科技有限公司 | 深度神经网络的归一化方法和装置、设备、存储介质 |
WO2020068498A1 (en) * | 2018-09-27 | 2020-04-02 | Google Llc | Data compression using integer neural networks |
US11947668B2 (en) * | 2018-10-12 | 2024-04-02 | Sophos Limited | Methods and apparatus for preserving information between layers within a neural network |
KR20200051278A (ko) | 2018-11-05 | 2020-05-13 | 삼성전자주식회사 | 인공 신경망에서의 작업 관리 방법 및 이를 포함하는 시스템 |
US11687761B2 (en) * | 2018-12-11 | 2023-06-27 | Amazon Technologies, Inc. | Improper neural network input detection and handling |
US10789510B2 (en) * | 2019-01-11 | 2020-09-29 | Google Llc | Dynamic minibatch sizes |
US10325185B1 (en) * | 2019-01-23 | 2019-06-18 | StradVision, Inc. | Method and device for online batch normalization, on-device learning, and continual learning applicable to mobile devices or IOT devices additionally referring to one or more previous batches to be used for military purpose, drone or robot, and testing method and testing device using the same |
US11574052B2 (en) | 2019-01-31 | 2023-02-07 | Sophos Limited | Methods and apparatus for using machine learning to detect potentially malicious obfuscated scripts |
JP2020135011A (ja) | 2019-02-13 | 2020-08-31 | キオクシア株式会社 | 情報処理装置及び方法 |
CN109886392B (zh) * | 2019-02-25 | 2021-04-27 | 深圳市商汤科技有限公司 | 数据处理方法和装置、电子设备和存储介质 |
KR102046113B1 (ko) | 2019-03-19 | 2019-11-18 | 주식회사 루닛 | 신경망 학습 방법 및 그 장치 |
KR102046133B1 (ko) * | 2019-03-20 | 2019-11-18 | 주식회사 루닛 | 특징 데이터 리캘리브레이션 방법 및 그 장치 |
DE102019204136A1 (de) * | 2019-03-26 | 2020-10-01 | Robert Bosch Gmbh | Verfahren und Vorrichtung für Training und Herstellung eines künstlichen neuronalen Netzes |
KR102037483B1 (ko) | 2019-04-02 | 2019-11-15 | 주식회사 루닛 | 신경망 데이터 정규화 방법 및 그 장치 |
TWI706337B (zh) * | 2019-05-02 | 2020-10-01 | 旺宏電子股份有限公司 | 記憶體裝置及其操作方法 |
US11361218B2 (en) * | 2019-05-31 | 2022-06-14 | International Business Machines Corporation | Noise and signal management for RPU array |
CN111967570B (zh) * | 2019-07-01 | 2024-04-05 | 北京砥脊科技有限公司 | 可视化神经网络系统的实现方法、装置和机器设备 |
KR102461732B1 (ko) * | 2019-07-16 | 2022-11-01 | 한국전자통신연구원 | 강화 학습 방법 및 장치 |
KR20190098106A (ko) | 2019-08-02 | 2019-08-21 | 엘지전자 주식회사 | 배치 정규화 레이어 트레이닝 방법 |
CN110598852A (zh) * | 2019-08-29 | 2019-12-20 | 北京小米移动软件有限公司 | 子网络采样方法、构建超网络拓扑结构的方法及装置 |
DE102019213898A1 (de) * | 2019-09-11 | 2021-03-11 | Robert Bosch Gmbh | Robustes und besser trainierbares künstliches neuronales Netzwerk |
US11568259B2 (en) * | 2019-10-15 | 2023-01-31 | Zoox, Inc. | Cross batch normalization |
KR102127913B1 (ko) | 2019-10-29 | 2020-06-29 | 주식회사 루닛 | 신경망 학습 방법 및 그 장치 |
US11868855B2 (en) * | 2019-11-04 | 2024-01-09 | Hewlett Packard Enterprise Development Lp | Resiliency for machine learning workloads |
KR102143192B1 (ko) | 2019-11-12 | 2020-08-10 | 주식회사 루닛 | 신경망 학습 방법 및 그 장치 |
KR102143191B1 (ko) * | 2019-11-12 | 2020-08-10 | 주식회사 루닛 | 특징 데이터 리캘리브레이션 방법 및 그 장치 |
CN114365180A (zh) | 2019-11-29 | 2022-04-15 | 奥林巴斯株式会社 | 图像处理方法、学习装置以及图像处理装置 |
CN111144556B (zh) * | 2019-12-31 | 2023-07-07 | 中国人民解放军国防科技大学 | 面向深度神经网络训练和推理的范围批处理归一化算法的硬件电路 |
US11610303B2 (en) | 2020-03-03 | 2023-03-21 | The University Court Of The University Of Edinburgh | Data processing apparatus and method |
JP7297705B2 (ja) | 2020-03-18 | 2023-06-26 | 株式会社東芝 | 処理装置、処理方法、学習装置およびプログラム |
US11915419B1 (en) | 2020-06-25 | 2024-02-27 | Verily Life Sciences Llc | Auto-normalization for machine learning |
CN115803752A (zh) * | 2020-09-08 | 2023-03-14 | 华为技术有限公司 | 深度卷积神经网络中的归一化 |
KR102677400B1 (ko) * | 2020-11-11 | 2024-06-24 | 슈어데이터랩 주식회사 | 실시간 가전 사용 예측 시스템 및 방법 |
KR102441442B1 (ko) * | 2021-01-11 | 2022-09-08 | 성균관대학교산학협력단 | 그래프 컨볼루션 네트워크 학습 방법 및 장치 |
US12010129B2 (en) | 2021-04-23 | 2024-06-11 | Sophos Limited | Methods and apparatus for using machine learning to classify malicious infrastructure |
WO2022259566A1 (ja) | 2021-06-09 | 2022-12-15 | コニカミノルタ株式会社 | ニューラル・ネットワーク・システム |
US20230119791A1 (en) * | 2021-10-04 | 2023-04-20 | Qualcomm Incorporated | Relaxed instance frequency normalization for neural-network-based audio processing |
WO2023085852A1 (ko) * | 2021-11-11 | 2023-05-19 | 서울대학교산학협력단 | 통계 기반 정규화를 시행하는 딥 뉴럴 네트워크 학습 장치 및 그 방법 |
US20240281979A1 (en) | 2023-02-22 | 2024-08-22 | Canon Medical Systems Corporation | Medical image processing apparatus and method |
Family Cites Families (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5875284A (en) | 1990-03-12 | 1999-02-23 | Fujitsu Limited | Neuro-fuzzy-integrated data processing system |
JPH05346915A (ja) * | 1992-01-30 | 1993-12-27 | Ricoh Co Ltd | 学習機械並びにニューラルネットワークおよびデータ分析装置並びにデータ分析方法 |
JPH0785280B2 (ja) * | 1992-08-04 | 1995-09-13 | タカタ株式会社 | 神経回路網による衝突予測判定システム |
US5729662A (en) * | 1995-06-07 | 1998-03-17 | Rozmus; J. Michael | Neural network for classification of patterns with improved method and apparatus for ordering vectors |
US5790758A (en) * | 1995-07-07 | 1998-08-04 | The United States Of America As Represented By The Secretary Of The Navy | Neural network architecture for gaussian components of a mixture density function |
US6134537A (en) * | 1995-09-29 | 2000-10-17 | Ai Ware, Inc. | Visualization and self organization of multidimensional data through equalized orthogonal mapping |
US6539267B1 (en) * | 1996-03-28 | 2003-03-25 | Rosemount Inc. | Device in a process system for determining statistical parameter |
US6650779B2 (en) * | 1999-03-26 | 2003-11-18 | Georgia Tech Research Corp. | Method and apparatus for analyzing an image to detect and identify patterns |
US6418378B1 (en) * | 2000-06-26 | 2002-07-09 | Westerngeco, L.L.C. | Neural net prediction of seismic streamer shape |
CA2433999A1 (en) * | 2000-11-30 | 2002-06-06 | Yang Ming Pok | Neural cortex |
US7107207B2 (en) * | 2002-06-19 | 2006-09-12 | Microsoft Corporation | Training machine learning by sequential conditional generalized iterative scaling |
US7082394B2 (en) * | 2002-06-25 | 2006-07-25 | Microsoft Corporation | Noise-robust feature extraction using multi-layer principal component analysis |
US7496546B2 (en) | 2003-03-24 | 2009-02-24 | Riken | Interconnecting neural network system, interconnecting neural network structure construction method, self-organizing neural network structure construction method, and construction programs therefor |
US7219085B2 (en) * | 2003-12-09 | 2007-05-15 | Microsoft Corporation | System and method for accelerating and optimizing the processing of machine learning techniques using a graphics processing unit |
JP2005352900A (ja) | 2004-06-11 | 2005-12-22 | Canon Inc | 情報処理装置、情報処理方法、パターン認識装置、及びパターン認識方法 |
US7747070B2 (en) | 2005-08-31 | 2010-06-29 | Microsoft Corporation | Training convolutional neural networks on graphics processing units |
CN100367300C (zh) | 2006-07-07 | 2008-02-06 | 华中科技大学 | 一种基于人工神经网络的特征选择方法 |
US7606777B2 (en) | 2006-09-01 | 2009-10-20 | Massachusetts Institute Of Technology | High-performance vision system exploiting key features of visual cortex |
EP2345984B1 (en) | 2010-01-19 | 2012-03-14 | Honda Research Institute Europe GmbH | Online learning of grounded categories using adaptive feature spaces |
CN102955946A (zh) * | 2011-08-18 | 2013-03-06 | 刘军 | 基于线性分类树和神经网络的两阶段快速分类器 |
JP5772442B2 (ja) | 2011-09-22 | 2015-09-02 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
US8370279B1 (en) * | 2011-09-29 | 2013-02-05 | Google Inc. | Normalization of predictive model scores |
CN102622418B (zh) * | 2012-02-21 | 2013-08-07 | 北京联合大学 | 一种基于bp神经网络的预测装置及设备 |
US9147154B2 (en) * | 2013-03-13 | 2015-09-29 | Google Inc. | Classifying resources using a deep network |
US10127475B1 (en) | 2013-05-31 | 2018-11-13 | Google Llc | Classifying images |
TWI648609B (zh) | 2013-06-07 | 2019-01-21 | 美商科學設計股份有限公司 | 程序監控系統及方法 |
CN103824055B (zh) * | 2014-02-17 | 2018-03-02 | 北京旷视科技有限公司 | 一种基于级联神经网络的人脸识别方法 |
CN103810999B (zh) * | 2014-02-27 | 2016-10-19 | 清华大学 | 基于分布式神经网络的语言模型训练方法及其系统 |
US9058517B1 (en) | 2014-04-16 | 2015-06-16 | I.R.I.S. | Pattern recognition system and method using Gabor functions |
EP3029606A3 (en) | 2014-11-14 | 2016-09-14 | Thomson Licensing | Method and apparatus for image classification with joint feature adaptation and classifier learning |
PL3251059T3 (pl) | 2015-01-28 | 2019-05-31 | Google Llc | Warstwy normalizacji danych wejściowych |
US11151449B2 (en) * | 2018-01-24 | 2021-10-19 | International Business Machines Corporation | Adaptation of a trained neural network |
KR102046113B1 (ko) * | 2019-03-19 | 2019-11-18 | 주식회사 루닛 | 신경망 학습 방법 및 그 장치 |
US11367163B2 (en) * | 2019-05-31 | 2022-06-21 | Apple Inc. | Enhanced image processing techniques for deep neural networks |
US11568259B2 (en) * | 2019-10-15 | 2023-01-31 | Zoox, Inc. | Cross batch normalization |
US20210150306A1 (en) * | 2019-11-14 | 2021-05-20 | Qualcomm Incorporated | Phase selective convolution with dynamic weight selection |
-
2016
- 2016-01-28 PL PL16704121T patent/PL3251059T3/pl unknown
- 2016-01-28 EP EP16704121.9A patent/EP3251059B1/en active Active
- 2016-01-28 AU AU2016211333A patent/AU2016211333B2/en active Active
- 2016-01-28 EP EP21161358.3A patent/EP3872716A1/en active Pending
- 2016-01-28 KR KR1020177023719A patent/KR102055355B1/ko active IP Right Grant
- 2016-01-28 WO PCT/US2016/015476 patent/WO2016123409A1/en active Application Filing
- 2016-01-28 CA CA2975251A patent/CA2975251C/en active Active
- 2016-01-28 CN CN201680012517.XA patent/CN107278310A/zh active Pending
- 2016-01-28 ES ES16704121T patent/ES2714152T3/es active Active
- 2016-01-28 SG SG11201706127RA patent/SG11201706127RA/en unknown
- 2016-01-28 US US15/009,647 patent/US10417562B2/en active Active
- 2016-01-28 EP EP18207898.0A patent/EP3483795B1/en active Active
- 2016-01-28 KR KR1020197036115A patent/KR102204286B1/ko active IP Right Grant
- 2016-01-28 MX MX2017009879A patent/MX2017009879A/es unknown
- 2016-01-28 RU RU2017130151A patent/RU2666308C1/ru active
- 2016-01-28 TR TR2019/02908T patent/TR201902908T4/tr unknown
- 2016-01-28 JP JP2017539561A patent/JP6453477B2/ja active Active
- 2016-01-28 DE DE112016000509.1T patent/DE112016000509T5/de active Pending
- 2016-01-28 DK DK16704121.9T patent/DK3251059T3/en active
-
2017
- 2017-07-26 IL IL253676A patent/IL253676A0/en active IP Right Grant
-
2018
- 2018-12-12 JP JP2018232445A patent/JP6710745B2/ja active Active
- 2018-12-19 US US16/226,483 patent/US10628710B2/en active Active
-
2019
- 2019-01-17 AU AU2019200309A patent/AU2019200309B2/en active Active
- 2019-09-16 US US16/572,454 patent/US10902319B2/en active Active
-
2020
- 2020-04-01 US US16/837,959 patent/US11308394B2/en active Active
- 2020-05-27 JP JP2020092300A patent/JP6935542B2/ja active Active
- 2020-10-09 AU AU2020250312A patent/AU2020250312B2/en active Active
-
2021
- 2021-01-22 US US17/156,464 patent/US12033073B2/en active Active
- 2021-01-22 US US17/156,453 patent/US11893485B2/en active Active
- 2021-07-30 US US17/390,768 patent/US11281973B2/en active Active
- 2021-08-25 JP JP2021137180A patent/JP7179935B2/ja active Active
-
2022
- 2022-03-16 AU AU2022201819A patent/AU2022201819B2/en active Active
- 2022-04-18 US US17/723,007 patent/US11853885B2/en active Active
- 2022-11-16 JP JP2022183459A patent/JP7536844B2/ja active Active
-
2023
- 2023-12-22 AU AU2023285952A patent/AU2023285952A1/en active Pending
- 2023-12-22 US US18/395,282 patent/US20240249138A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6935542B2 (ja) | バッチ正規化レイヤ | |
EP3563306B1 (en) | Batch renormalization layers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200617 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210709 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210726 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210825 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6935542 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |