WO2019123544A1

WO2019123544A1 - データ処理方法およびデータ処理装置

Info

Publication number: WO2019123544A1
Application number: PCT/JP2017/045573
Authority: WO
Inventors: 淳安藤
Original assignee: オリンパス株式会社
Priority date: 2017-12-19
Filing date: 2017-12-19
Publication date: 2019-06-27
Also published as: US11544563B2; US20200320393A1

Abstract

データ処理装置１００は、ミニバッチに含まれる各データに、第１の畳み込みニューラルネットワーク層を適用して、各データの第１特徴マップを出力させる第１ＣＮＮ適用部１１６と、ミニバッチに含まれる各データの第１統計量を、各データの第１特徴マップに基づいて独立に算出する第１統計量算出部１１８と、ミニバッチに含まれる各データの第１統計量と、累積統計量を基に、各データの正規化パラメータを算出する正規化パラメータ算出部１２０と、ミニバッチに含まれる各データの第１特徴マップを、各データの正規化パラメータを用いて正規化し、各データの正規化特徴マップを出力させる正規化適用部１２２と、ミニバッチに含まれる各データの正規化特徴マップに、第２の畳み込みニューラルネットワーク層を適用して、各データの第２特徴マップを出力させる第２ＣＮＮ適用部１２８と、備える。

Description

データ処理方法およびデータ処理装置

　本発明は、データ処理方法およびデータ処理装置に関する。

　近年、ディープラーニングを用いたデータ処理が注目を集めている。ディープラーニングのモデルの１つに畳み込みニューラルネットワーク（CNN : Convolutional Neural Network）がある。非特許文献１には、この畳み込みニューラルネットワークの中間層においてミニバッチごとに正規化を行う技術が開示されている。非特許文献１に記載される技術によれば、学習の収束性能や未知画像への汎化性能が向上する。

Sergey Ioffe，Christian Szegedy、「Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift」、arXiv:1502.03167 (2015)

　非特許文献１に記載される従来の技術では、ミニバッチに含まれる各データの正規化に用いる統計量としてミニバッチに含まれるすべてのデータの平均および標準偏差を用いるため、データごとに独立に正規化処理を進めることができない。これは、学習速度のさらなる向上の妨げとなる。

　本発明はこうした状況に鑑みなされたものであり、その目的は、ニューラルネットワークを用いたデータ処理において、学習速度のさらなる向上を実現できる技術を提供することにある。

　上記課題を解決するために、本発明のある態様のデータ処理方法は、１以上のデータを含むミニバッチの各データに、第１の畳み込みニューラルネットワーク層を適用して、各データの第１特徴マップを出力させる第１ＣＮＮ適用ステップと、ミニバッチに含まれる各データの第１統計量を、各データの第１特徴マップに基づいて独立に算出する第１統計量算出ステップと、ミニバッチに含まれる各データの第１統計量と、累積統計量を基に、各データの正規化パラメータを算出する正規化パラメータ算出ステップと、ミニバッチに含まれる各データの第１特徴マップを、各データの正規化パラメータを用いて正規化し、各データの正規化特徴マップを出力させる正規化適用ステップと、ミニバッチに含まれる各データの正規化特徴マップに、第２の畳み込みニューラルネットワーク層を適用して、各データの第２特徴マップを出力させる第２ＣＮＮ適用ステップと、を含む。

　本発明の別の態様は、データ処理装置である。この装置は、１以上のデータを含むミニバッチの各データに、第１の畳み込みニューラルネットワーク層を適用して、各データの第１特徴マップを出力させる第１ＣＮＮ適用部と、ミニバッチに含まれる各データの第１統計量を、各データの第１特徴マップに基づいて独立に算出する第１統計量算出部と、ミニバッチに含まれる各データの第１統計量と、累積統計量を基に、各データの正規化パラメータを算出する正規化パラメータ算出部と、ミニバッチに含まれる各データの第１特徴マップを、各データの正規化パラメータを用いて正規化し、各データの正規化特徴マップを出力させる正規化適用部と、ミニバッチに含まれる各データの正規化特徴マップに、第２の畳み込みニューラルネットワーク層を適用して、各データの第２特徴マップを出力させる第２ＣＮＮ適用部と、を備える。

　なお、以上の構成要素の任意の組み合わせ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。

　本発明によれば、ニューラルネットワークを用いたデータ処理において、学習速度のさらなる向上を実現できる。

畳み込みニューラルネットワークのモデルを示す図である。実施の形態に係るデータ処理装置の機能構成を示すブロック図である。図１のデータ処理装置による学習処理の一例を示すフローチャートである。図１のデータ処理装置による適用処理の一例を示すフローチャートである。

　以下、本発明を好適な実施の形態をもとに図面を参照しながら説明する。

　実施の形態に係るデータ処理装置は、多数のデータとそれらに対応する正解データを基に畳み込みニューラルネットワークの学習を行う「学習処理」と、学習された畳み込みニューラルネットワークをテストデータに適用して所定のデータ処理を行う「適用処理」と、を実行する。

　データ処理装置は、学習処理において、畳み込みニューラルネットワークの少なくとも１つの正規化層での正規化処理を、ミニバッチに含まれるデータごとに独立に実施する。具体的にはデータ処理装置は、現在処理しているミニバッチに含まれるデータごとに独立に算出した統計量（平均および標準偏差）と、それまでに処理したミニバッチに含まれるデータに基づく統計量である累積統計量（平均および標準偏差）とに基づいて、現在処理しているミニバッチに含まれる各データの正規化処理をデータごとに独立に実施する。これにより、汎化性能を維持しつつも、正規化層での正規化処理をデータごとに独立に実施できる。つまり、汎化性能を維持しつつも、正規化層での正規化処理を並列に実行できる。

　データ処理装置は、本実施の形態では、図１に示す、ＶＧＧ－１６と呼ばれるモデルをベースにした畳み込みニューラルネットワークを実行する。図１において、ｃｏｎｖ、ｎｏｒｍ、ｒｅｌｕ、ｍａｘｐｏｏｌはそれぞれ、畳み込み層、正規化層、活性化層、最大プーリング層を示す。

　以下では、複数の正規化層のうちの１つに注目して説明する。注目する正規化層を注目正規化層、注目正規化層よりも前の層を第１の畳み込みニューラルネットワーク層、注目正規化層よりも後の層を第２の畳み込みニューラルネットワーク層と呼ぶ。

　図２は、実施の形態に係るデータ処理装置１００の機能構成を示すブロック図である。ここに示す各ブロックは、ハードウエア的には、コンピュータのＣＰＵ（central processing unit）やＧＰＵ（Graphics　Processing　Unit）をはじめとする素子や機械装置で実現でき、ソフトウエア的にはコンピュータプログラム等によって実現されるが、ここでは、それらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックはハードウエア、ソフトウエアの組合せによっていろいろなかたちで実現できることは、本明細書に触れた当業者には理解されるところである。

　データ処理装置１００は、学習処理を実行する学習処理部１０２と、適用処理を実行する適用処理部１０４と、累積統計量保持部１０６と、を備える。

　以下では、データ処理装置１００を画像処理に適用する場合を例に説明する。ただし、当業者によれば、データ処理装置１００を音声認識処理、自然言語処理、その他の処理にも適用可能であることが理解されよう。

　学習処理部１０２は、ミニバッチ単位で学習を繰り返し実行する。学習処理部１０２は、累積統計量初期化部１０８と、ＣＮＮ初期化部１１０と、ミニバッチ取得部１１２と、正解取得部１１４と、第１の畳み込みニューラルネットワーク層の各層の処理を実行する第１ＣＮＮ適用部１１６と、第１統計量算出部１１８と、正規化パラメータ算出部１２０と、注目正規化層の処理を実行する正規化適用部１２２と、第２統計量算出部１２４と、累積統計量更新部１２６と、第２の畳み込みニューラルネットワーク層の各層の処理を実行する第２ＣＮＮ適用部１２８と、全体誤差算出部１３０と、誤差伝播部１３２と、ＣＮＮ更新部１３４と、終了条件判定部１３６と、を備える。

　累積統計量初期化部１０８は、ユーザの指示に基づく学習の開始を契機として、累積統計量保持部１０６に保持される累積統計量を初期化する。本実施の形態では、累積統計量初期化部１０８は、平均を累積する累積統計量の初期値として「０」を設定し、標準偏差を累積する累積統計量の初期値として「１」を設定する。

　ＣＮＮ初期化部１１０は、ユーザの指示に基づく学習の開始を契機として、畳み込みニューラルネットワーク（つまり、後述の第１の畳み込みニューラルネットワーク層および第２の畳み込みニューラルネットワーク層）の畳み込み層の重み係数を初期化する。具体的にはＣＮＮ初期化部１１０は、初期化には平均０、標準偏差wscale／√(c_i×k×k)の正規乱数を用いる。wscaleはスケールパラメータであり、c_iは畳み込み層の入力チャンネル数であり、kは畳み込みカーネルサイズである。また、畳み込み層の重み係数の初期値として、本学習に用いる画像ＤＢとは異なる大規模画像ＤＢによって学習済みの畳み込み層の重み係数を用いてもよい。これにより、学習に用いる画像枚数が少ない場合でも高性能な畳み込みニューラルネットワークの学習を行うことができる。

　ミニバッチ取得部１１２は、予め用意された多数の画像のなかから、１回の学習で利用する１以上（本実施の形態では複数）の所定数の画像（以下、この画像の集まりを「ミニバッチ」と呼ぶ）を取得する。

　正解取得部１１４は、予め用意された多数の正解データのなかから、ミニバッチ取得部１１２により取得された各画像に対応する正解データを取得する。なお正解データが示す正解は、データ処理装置１００を画像分類に用いる場合は画像上に分類カテゴリ対象が含まれるか否かを表す２値であり、データ処理装置１００を物体検出に用いる場合は画像上の各点に対応した候補枠ごとに検出対象が含まれるか否かを表す２値であり、データ処理装置１００を画像変換に用いる場合は理想的な変換結果の画像である。

　第１ＣＮＮ適用部１１６は、ミニバッチに含まれる各画像に第１の畳み込みニューラルネットワーク層を適用し、すなわち第１の畳み込みニューラルネットワーク層に含まれる各層の処理を実行し、各画像の特徴マップをそれぞれ出力させる。以下、第１の畳み込みニューラルネットワーク層を適用したことにより出力された特徴マップを「第１特徴マップ」と呼ぶ。

　第１統計量算出部１１８は、ミニバッチに含まれる各画像の第１特徴マップから、各画像の統計量（以下、「第１統計量」と呼ぶ）をそれぞれ独立に算出する。本実施の形態では、第１統計量算出部１１８は、第１統計量として、対応する画像の第１特徴マップの平均μ_ｎｅｗと標準偏差σ_ｎｅｗを算出する。具体的には、平均μ_ｎｅｗ、標準偏差σ_ｎｅｗはそれぞれ、式（１）、式（２）で算出される。

　ここで、Ｉは第１特徴マップであり、Ｗ、Ｈはそれぞれ第１特徴マップの横幅、高さであり、ｘ、ｙ、ｃ、ｂはそれぞれ第１特徴マップの横幅の添え字、高さの添え字、チャンネル数の添え字、ミニバッチ画像数の添え字である。

　正規化パラメータ算出部１２０は、ミニバッチに含まれる各画像の第１統計量と、累積統計量保持部１０６に保持される累積統計量を基に、各画像の第１特徴マップを正規化するときに用いるパラメータである正規化パラメータを算出する。まず正規化パラメータ算出部１２０は、第１統計量（平均μ_ｎｅｗ、標準偏差σ_ｎｅｗ）と累積統計量（平均μ_ｏｌｄ、標準偏差σ_ｏｌｄ）の差または比が統計量差範囲ｄ_ｍａｘ、ｒ_ｍａｘに収まるように丸めた丸め統計量差ｄ、ｒを算出する。なお統計量差範囲ｄ_ｍａｘ、ｒ_ｍａｘはそれぞれ、実験的または経験的に決定される。

　具体的には、丸め統計量差ｄ、ｒはそれぞれ、式（３）、式（４）で算出される。

　次に正規化パラメータ算出部１２０は、ミニバッチに含まれる各画像の第１統計量と、丸め統計量差を基に、各画像の正規化パラメータμ、σを算出する。具体的には、正規化パラメータμ、σはそれぞれ、式（５）、式（６）で算出される。

　統計量差範囲ｄ_ｍａｘ、ｒ_ｍａｘは、学習の繰り返し回数に応じて変更される。言い換えると、統計量差範囲ｄ_ｍａｘ、ｒ_ｍａｘは、ミニバッチ取得部１１２、正解取得部１１４、第１ＣＮＮ適用部１１６、第１統計量算出部１１８、正規化パラメータ算出部１２０、正規化適用部１２２、累積統計量更新部１２６、第２ＣＮＮ適用部１２８、全体誤差算出部１３０、誤差伝播部１３２およびＣＮＮ更新部１３４による一連の処理の繰り返し回数に応じて変更される。具体的には、繰り返し回数が少ない時点では、累積統計量は大きく変動し不安定であるため、正規化パラメータが第１統計量に近くなるように統計量差範囲は狭くし、繰り返し回数が多くなった時点では、多くのミニバッチから算出した統計量を用いて汎化性能を向上させるべく、正規化パラメータが累積統計量に近くなるように統計量差範囲は広くする。つまり、繰り返し回数が多くなるほど統計量差範囲は広くする。一例としては、繰り返し回数に比例して、統計量差範囲を広くしてもよい。

　変形例として、正規化パラメータ算出部１２０は、ミニバッチに含まれる各画像の正規化パラメータμ、σを、各画像の第１統計量と、累積統計量との重み付け和により、具体的には式（７）、式（８）により、算出してもよい。

　ここで、ｗ_ｓは第１統計量の重みであり、（１－ｗ_ｓ）は累積統計量の重みである。統計量差範囲と同様に、繰り返し回数が少ない時点では累積統計量が大きく変動し不安定であるため、正規化パラメータが第１統計量に近くなるように第１統計量の重みｗ_ｓは大きく（したがって累積統計量の重み（１－ｗ_ｓ）は小さく）し、繰り返し回数が多くなった時点ではより多くのミニバッチから算出した統計量を用いて汎化性能を向上させるため、正規化パラメータが累積統計量に近くなるように第１統計量の重みｗ_ｓは小さく（したがって累積統計量の重み（１－ｗ_ｓ）は大きく）する。つまり、繰り返し回数が多くなるほど第１統計量の重みｗ_ｓを小さく（したがって累積統計量の重み（１－ｗ_ｓ）は大きく）する。一例としては、繰り返し回数に比例して、第１統計量の重みｗ_ｓを小さく（したがって累積統計量の重み（１－ｗ_ｓ）は大きく）してもよい。

　正規化適用部１２２は、ミニバッチに含まれる各画像の第１特徴マップを、各画像の正規化パラメータを用いて正規化し、各画像の正規化特徴マップを出力させる。具体的には正規化特徴マップは、式（９）により算出される。

　ここで、Ｏは正規化特徴マップ、Ｉは第１特徴マップ、γ、βは学習によって獲得される係数である。

　第２統計量算出部１２４は、ミニバッチに含まれる１以上の画像のうちの少なくとも１つの画像に基づく統計量（以下、「第２統計量」と呼ぶ）を算出する。本実施の形態では、第２統計量算出部１２４は、第２統計量として、ミニバッチに含まれる１以上の画像のうちの少なくとも１つの画像の第１特徴マップの平均μ’と標準偏差σ’を算出する。具体的には、平均μ’、標準偏差σ’はそれぞれ、式（１０）、式（１１）で算出される。

　ここで、Ｂはミニバッチ画像数である。

　累積統計量更新部１２６は、第２統計量に基づいて、累積統計量保持部１０６に保持される累積統計量を更新する。本実施の形態では、累積統計量更新部１２６は、式（１２）、式（１３）に示すように、第２統計量と累積統計量の重み付け和を、新たな累積統計量として更新する。

　ここで、ｗ_ｄは累積統計量の重みであり、（１－ｗ_ｄ）は第２統計量の重みである。

　第２ＣＮＮ適用部１２８は、ミニバッチに含まれる各画像の正規化特徴マップに、第２の畳み込みニューラルネットワーク層を適用し、すなわち第２の畳み込みニューラルネットワーク層に含まれる各層の処理を実行し、各画像の特徴マップを出力させる。以下、第２の畳み込みニューラルネットワーク層を適用したことにより出力された特徴マップを「第２特徴マップ」と呼ぶ。

　全体誤差算出部１３０は、第２の特徴マップを基に、処理全体の誤差（以下、「全体誤差」と呼ぶ）を算出する。

　誤差伝播部１３２は、全体誤差を基に、第１ＣＮＮ適用部１１６、正規化適用部１２２および第２ＣＮＮ適用部１２８の各処理における誤差を算出する。

　ＣＮＮ更新部１３４は、誤差伝播部１３２により算出された誤差を基に、第１の畳み込みニューラルネットワーク層および第２の畳み込みニューラルネットワーク層を更新する。誤差を基に畳み込みニューラルネットワークを更新するための手法には、例えば確率的勾配降下法を用いてもよい。

　終了条件判定部１３６は、学習処理部１０２による学習を終了すべきか否かを判定する。学習を終了すべき終了条件は、例えば学習が所定回数行われたことや、外部から終了の指示を受けたことである。終了条件判定部１３６は、終了条件が満たされる場合、学習処理部１０２による処理を終了させる。終了条件判定部１３６は、終了条件が満たされない場合、処理をミニバッチ取得部１１２に戻す。

　適用処理部１０４は、テストデータ取得部１４０と、テストデータ用第１ＣＮＮ適用部１４２と、正規化パラメータ設定部１４４と、テストデータ用正規化適用部１４６と、テストデータ用第２ＣＮＮ適用部１４８と、データ処理部１５０と、を含む。

　テストデータ取得部１４０は、テスト画像を取得する。正規化パラメータ設定部１４４は、累積統計量保持部１０６に保持される累積統計量、つまり学習処理により算出された累積統計量を正規化パラメータに設定する。

　テストデータ用第１ＣＮＮ適用部１４２、テストデータ用正規化適用部１４６、テストデータ用第２ＣＮＮ適用部１４８はそれぞれ、第１ＣＮＮ適用部１１６、正規化適用部１２２、第２ＣＮＮ適用部１２８と同様に構成される。テストデータ用第１ＣＮＮ適用部１４２は、テスト画像に第１の畳み込みニューラルネットワーク層を適用し、テスト画像の第１特徴マップを出力させる。テストデータ用正規化適用部１４６、テスト画像の第１特徴マップを正規化パラメータを用いて正規化し、テスト画像の正規化特徴マップを出力させる。テストデータ用第２ＣＮＮ適用部１４８は、テスト画像の正規化特徴マップに第２の畳み込みニューラルネットワーク層を適用し、テスト画像の第２特徴マップを出力させる。

　データ処理部１５０は、テスト画像の第２特徴マップを基に、当該テスト画像に対して画像分類、物体検出または画像変換などの画像処理を行う。

　以上のように構成されたデータ処理装置１００の動作を説明する。
　図３は、データ処理装置１００による学習処理の一例を示すフローチャートである。累積統計量初期化部１０８は、累積統計量を初期化する（Ｓ１２）。ＣＮＮ初期化部１１０は、第１のニューラルネットワークおよび第２のニューラルネットワークを初期化する（Ｓ１４）。ミニバッチ取得部１１２は、ミニバッチを取得する（Ｓ１６）。正解取得部１１４は、ミニバッチに対応する正解データを取得する（Ｓ１８）。第１ＣＮＮ適用部１１６は、ミニバッチに含まれる各画像に第１のニューラルネットワークを適用し、各画像の第１特徴マップを出力させる（Ｓ２０）。第１統計量算出部１１８は、各画像の第１特徴マップから、各画像の第１統計量をそれぞれ独立に（例えば並列に）算出する（Ｓ２２）。

　正規化パラメータ算出部１２０は、各画像の第１統計量と、累積統計量を基に、各画像の正規化パラメータを算出する（Ｓ２４）。正規化適用部１２２は、各画像の第１特徴マップを、各画像の正規化パラメータを用いて正規化し、各画像の正規化特徴マップを出力させる（Ｓ２６）。第２統計量算出部１２４は、ミニバッチに含まれる１以上の画像のうちの少なくとも１つの画像に基づく第２統計量を算出する（Ｓ２８）。累積統計量更新部１２６は、第２統計量に基づいて、累積統計量を更新する（Ｓ３０)。第２ＣＮＮ適用部１２８は、各画像の正規化特徴マップに第２のニューラルネットワークを適用し、各画像の第２特徴マップを出力させる（Ｓ３２）。全体誤差算出部１３０は、第２の特徴マップを基に、全体誤差を算出する（Ｓ３４）。誤差伝播部１３２は、全体誤差を基に、第１ＣＮＮ適用部１１６、正規化適用部１２２および第２ＣＮＮ適用部１２８の各処理における誤差を算出する（Ｓ３６）。ＣＮＮ更新部１３４は、誤差伝播部１３２により算出された誤差を基に、第１の畳み込みニューラルネットワーク層および第２の畳み込みニューラルネットワーク層を更新する（Ｓ３８）。終了条件判定部１３６は、終了条件が満たされるか否かを判定する（Ｓ４０）。終了条件が満たされない場合（Ｓ４０のＮ）、処理はＳ１６に戻される。終了条件が満たされる場合（Ｓ４０のＹ）、処理は終了する。

　図４は、データ処理装置１００による適用処理の一例を示すフローチャートである。テストデータ取得部１４０は、テスト画像を取得する（Ｓ４２）。テストデータ用第１ＣＮＮ適用部１４２は、テスト画像に第１のニューラルネットワークを適用し、テスト画像の第１特徴マップを出力させる（Ｓ４４）。正規化パラメータ設定部１４４は、学習処理で算出された累積統計量を、正規化パラメータに設定する（Ｓ４６）。テストデータ用正規化適用部１４６は、テスト画像の第１特徴マップを、設定された正規化パラメータを用いて正規化し、テスト画像の正規化特徴マップを出力させる（Ｓ４８）。テストデータ用第２ＣＮＮ適用部１４８は、テスト画像の正規化特徴マップに第２のニューラルネットワークを適用し、テスト画像の第２特徴マップを出力させる（Ｓ５０）。データ処理部１５０は、テスト画像の第２特徴マップを基に、当該テスト画像に対して画像処理を行う（Ｓ５２）。

　以上説明した実施の形態に係るデータ処理装置１００によると、汎化性能を維持しつつも、正規化層での正規化処理を、データごとに独立に実施できる。これにより、正規化層での正規化処理を、すなわち第１統計量算出部１１８、正規化パラメータ算出部１２０および正規化適用部１２２による処理を、並列に実行できる。また、第１ＣＮＮ適用部１１６および第２ＣＮＮ適用部１２８による処理は、元からデータごとに独立に実施でき、累積統計量更新部１２６による処理は、例えばデータごとに算出した第１統計量を保存しておくなどして、後から算出できる。したがって、実施の形態に係るデータ処理装置１００によると、複数のGraphics Processing Unit（GPU）を用意しミニバッチに含まれる複数のデータを割り当て各処理を実行させることで、効率的な並列処理を行うことができる。

　以上、本発明を実施の形態をもとに説明した。この実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。

（第１の変形例）
　実施の形態では、データ処理装置１００がＶＧＧ－１６をベースにした畳み込みニューラルネットワークを実行する場合について説明したが、これに限られず、データ処理装置１００は他のモデルをベースにした畳み込みニューラルネットワークを実行してもよい。データ処理装置１００は例えば、より深い層を持つ、Identity Mapping(IM)を導入したResidual Networkをベースにした畳み込みニューラルネットワークを実行してもよい。この場合、より高精度な認識処理を行うことができる。

　１００　データ処理装置、　１１２　ミニバッチ取得部、　１１６　第１ＣＮＮ適用部、　１１８　第１統計量算出部、　１２０　正規化パラメータ算出部、　１２２　正規化適用部、　１２８　第２ＣＮＮ適用部。

Claims

　１以上のデータを含むミニバッチの各データに、第１の畳み込みニューラルネットワーク層を適用して、各データの第１特徴マップを出力させる第１ＣＮＮ適用ステップと、
　前記ミニバッチに含まれる各データの第１統計量を、各データの第１特徴マップに基づいて独立に算出する第１統計量算出ステップと、
　前記ミニバッチに含まれる各データの第１統計量と、累積統計量を基に、各データの正規化パラメータを算出する正規化パラメータ算出ステップと、
　前記ミニバッチに含まれる各データの第１特徴マップを、各データの正規化パラメータを用いて正規化し、各データの正規化特徴マップを出力させる正規化適用ステップと、
　前記ミニバッチに含まれる各データの正規化特徴マップに、第２の畳み込みニューラルネットワーク層を適用して、各データの第２特徴マップを出力させる第２ＣＮＮ適用ステップと、を含むことを特徴とするデータ処理方法。
　前記ミニバッチに含まれる１以上のデータのうちの少なくとも１つのデータの第１特徴マップに基づく第２統計量を算出する第２統計量算出ステップと、
　前記第２統計量を基に前記累積統計量を更新する累積統計量更新ステップと、をさらに含むことを特徴とする請求項１に記載のデータ処理方法。
　前記ミニバッチは複数のデータを含み、
　前記ミニバッチに含まれる複数のデータを複数のプロセッサに割り当てて、前記第１統計量算出ステップ、前記正規化パラメータ算出ステップおよび前記正規化適用ステップにおける処理を、並列に実行させることを特徴とする請求項１または２に記載のデータ処理方法。
　前記ミニバッチに含まれる各データの正解データを取得する正解取得ステップと、
　前記ミニバッチに含まれる各データの正解データと各データの第２特徴マップを基に、処理全体の誤差を算出する全体誤差算出ステップと、
　前記処理全体の誤差を基に、前記第１ＣＮＮ適用ステップ、前記正規化適用ステップ、前記第２ＣＮＮ適用ステップの各処理における誤差を算出する誤差伝播ステップと、
　前記各処理における誤差を基に前記第１の畳み込みニューラルネットワーク層と前記第２の畳み込みニューラルネットワーク層を更新するＣＮＮ更新ステップと、をさらに含むことを特徴とする請求項１から３のいずれかに記載のデータ処理方法。
　前記正規化パラメータ算出ステップでは、前記ミニバッチに含まれる各データの第１統計量と前記累積統計量との差または比が所定の統計量差範囲に収まるように丸めることで各データの丸め統計量差を算出し、各データの第１統計量と各データの丸め統計量差を基に各データの正規化パラメータを算出することを特徴とする請求項１から４のいずれかに記載のデータ処理方法。
　前記各ステップにおける一連の処理の繰り返し回数に応じて、前記統計量差範囲を変更することを特徴とする請求項５に記載のデータ処理方法。
　前記正規化パラメータ算出ステップでは、前記ミニバッチに含まれる各データの第１統計量と前記累積統計量との重み付け和を基に各データの正規化パラメータを算出することを特徴とする請求項１から４のいずれかに記載のデータ処理方法。
　前記各ステップにおける一連の処理の繰り返し回数に応じて、前記重み付け和における重み付けを変更することを特徴とする請求項７に記載のデータ処理方法。
　前記累積統計量更新ステップでは、前記第２統計量と前記累積統計量の重み付け和を新たな累積統計量として設定することを特徴とする請求項２に記載のデータ処理方法。
　前記第１統計量算出ステップでは、前記ミニバッチに含まれる各データの第１統計量として、各データの第１特徴マップの平均および標準偏差を算出することを特徴とする請求項１から９のいずれかに記載のデータ処理方法。
　前記第２統計量算出ステップでは、前記第２統計量として、前記ミニバッチに含まれる１以上のデータのうちの少なくとも１つのデータの第１特徴マップの平均および標準偏差を算出することを特徴とする請求項２に記載のデータ処理方法。
　前記累積統計量更新ステップでは、前記平均に対応する前記累積統計量の初期値として０を設定し、前記標準偏差に対応する前記累積統計量の初期値として１を設定することを特徴とする請求項１１に記載のデータ処理方法。
　テストデータに前記第１の畳み込みニューラルネットワーク層を適用して、テストデータの第１特徴マップを出力させるテストデータ用第１ＣＮＮ適用ステップ、
　前記累積統計量を前記正規化パラメータに設定する正規化パラメータ設定ステップと、
　前記テストデータの第１特徴マップを、前記正規化パラメータを用いて正規化し、前記テストデータの正規化特徴マップを出力させるテストデータ用正規化適用ステップと、
　前記テストデータの正規化特徴マップに、前記第２の畳み込みニューラルネットワーク層を適用して、前記テストデータの第２特徴マップを出力させるテストデータ用第２ＣＮＮ適用ステップと、
　前記テストデータの第２特徴マップを基に、所定のデータ処理を行うテストデータ処理ステップと、をさらに含むことを特徴とする請求項１から１２のいずれかに記載のデータ処理方法。
　１以上のデータを含むミニバッチの各データに、第１の畳み込みニューラルネットワーク層を適用して、各データの第１特徴マップを出力させる第１ＣＮＮ適用部と、
　前記ミニバッチに含まれる各データの第１統計量を、各データの第１特徴マップに基づいて独立に算出する第１統計量算出部と、
　前記ミニバッチに含まれる各データの第１統計量と、累積統計量を基に、各データの正規化パラメータを算出する正規化パラメータ算出部と、
　前記ミニバッチに含まれる各データの第１特徴マップを、各データの正規化パラメータを用いて正規化し、各データの正規化特徴マップを出力させる正規化適用部と、
　前記ミニバッチに含まれる各データの正規化特徴マップに、第２の畳み込みニューラルネットワーク層を適用して、各データの第２特徴マップを出力させる第２ＣＮＮ適用部と、を備えることを特徴とするデータ処理装置。