WO2022265044A1

WO2022265044A1 - 演算処理装置

Info

Publication number: WO2022265044A1
Application number: PCT/JP2022/023990
Authority: WO
Inventors: 修野村; 哲郎遠藤; 奕涛馬; 浩吉川
Original assignee: 国立大学法人東北大学
Priority date: 2021-06-18
Filing date: 2022-06-15
Publication date: 2022-12-22
Also published as: US20240126616A1; JPWO2022265044A1

Abstract

消費電力をより小さくすることができる演算処理装置を提供する。プーリング処理部２２は、プーリング領域内の要素データが畳み込み演算部から順次に入力される。プーリング処理部２２は、不揮発性のレジスタ３２、比較器３３、マルチプレクサ３４を有する。比較器３３は、畳み込み演算部からの要素データとレジスタ３２が保持している要素データとを比較する。この比較結果に基づいて、マルチプレクサ３４が値の大きな要素データを選択し、選択された要素データがレジスタ３２に保持される。プーリング領域内の各要素データの入力後、レジスタ３２に保持されている要素データがプーリングデータとして出力される。レジスタ３２は、プーリング処理部２２が要素データの入力待ちとなっている間は、ＰＧスイッチ３５がオフとされて電力供給が遮断される。

Description

演算処理装置

　本発明は、演算処理装置に関する。

　畳み込みニューラルネットワーク、すなわち畳み込み層を有するニューラルネットワークを用いて画像認識等を行う演算処理装置が知られており、ロボットの制御や車の運転制御等への応用が期待されている。このような画像認識をはじめとする畳み込みニューラルネットワークでは、畳み込み演算処理、プーリング処理が行われる。畳み込み演算処理では、入力層や中間層のデータを畳み込みフィルタの荷重データを用いて重み付けして加算する膨大な積和演算を行っている。プーリング処理では、畳み込み演算処理で得られる複数の畳み込み演算結果から例えば最大値の抽出や平均値の算出を行っている。

　特許文献１では、畳み込みニューラルネットワークの演算処理を演算処理装置において、１演算サイクルごとに、１回のプーリング処理で必要な全ての畳み込み演算結果のうち一部が得られるようにすることで、畳み込み演算を行う回路規模を小さくすることが提案されている。

　一方、消費電力を抑える技術として、プロセッサコア等の演算回路に対して、電力供給を遮断し、リーク電流を抑制するパワーゲーティングが知られている。

特開２０１５－２１０７０９号公報

　ところで、畳み込みニューラルネットワークの演算処理装置では、上記のように膨大な演算数の積和演算等が必要であり消費電力が問題になっていた。特に、ロボットや車、携帯端末等の末端の機器等においては消費電力をできるだけ抑えることが重要である。このため、畳み込みニューラルネットワークのような演算を行う演算処理装置においては、消費電力をより小さくすることが望まれている。

　本発明は、上記事情に鑑みてなされたものであり、消費電力をより小さくすることができる演算処理装置を提供することを目的とする。

　上記目的を達成するために、本発明の演算処理装置は、畳み込み演算結果データを順次に出力する畳み込み演算部と、プーリング演算回路及び不揮発性のプーリング用記憶回路を有し、前記プーリング用記憶回路が前記畳み込み演算結果データまたは前記プーリング演算回路の演算結果を保持データとして保持し、前記畳み込み演算部からの前記畳み込み演算結果データが入力されるごとに、前記プーリング演算回路が前記保持データを用いてプーリング領域にプーリング処理を行ったプーリングデータを算出して出力するプーリング処理部と、前記畳み込み演算部からの前記畳み込み演算結果データの入力待ちの間における前記プーリング用記憶回路への電力供給を遮断するパワーゲーティング部とを備えるものである。

　本発明の演算処理装置は、複数の畳み込み演算結果データが２次元配列されるチャネルの行ごとに前記畳み込み演算結果データを前記チャネルの行方向に順次に出力する畳み込み演算部と、プーリング演算回路及び不揮発性のプーリング用記憶回路を有し、複数の前記畳み込み演算結果データを前記チャネルの２行２列ごとに区分した各プーリング領域について最大値となる前記畳み込み演算結果データをプーリングデータとして出力するプーリング処理部とを備え、前記プーリング用記憶回路は、前記チャネルの列数をＹ（Ｙは２以上の偶数）として、Ｙ＋２段に接続されたバッファを有し、前記畳み込み演算部からの前記畳み込み演算結果データが１段目のバッファに入力されるごとに、１段目のバッファが入力される前記畳み込み演算結果データを保持して出力し、２段目以降の各バッファが前段のバッファから出力されている前記畳み込み演算結果データを保持して出力し、前記プーリング演算回路は、１段目、２段目、Ｙ＋１段目及びＹ＋２段目の各バッファからの各前記畳み込み演算結果データからなるデータ群が入力され、前記データ群の各前記畳み込み演算結果データを比較する比較器と、前記比較器の比較結果に基づいて前記データ群のうちで最大値となる前記畳み込み演算結果データを選択して出力するセレクタとを有し、前記プーリング処理部は、前記データ群の各前記畳み込み演算結果データが１つのプーリング領域内の前記畳み込み演算結果データの組み合わせとなるときのセレクタから出力されている前記畳み込み演算結果データをプーリングデータとして出力するものである。

　本発明によれば、プーリング処理部が畳み込み演算部からの畳み込み演算結果データの入力待ちとなっているときに、パワーゲーティング部によって不揮発性のプーリング用記憶回路への電力供給を遮断するので、演算処理装置の消費電力をより小さくすることができる。

　本発明によれば、畳み込み演算結果データを保持するバッファ数をチャネルの要素データ数（列数×行数）よりも少ない（列数＋２）個とすることができ、消費電力をより小さくすることができる。

演算処理装置の概略を示すブロック図である。畳み込みニューラルネットワークの接続された階層の例を示す説明図である。畳み込み領域の位置の移動とプーリング領域の関係を示す説明図である。演算ユニットの構成を示すブロック図である。畳み込み演算回路の構成を示すブロック図である。プーリング処理部の構成を示すブロック図である。チャネル並列による次階層の１番目の要素データに対して演算を行う際の畳み込み演算処理の状態を示す説明図である。チャネル並列による次階層の２番目の要素データに対して演算を行う際の畳み込み演算処理の状態を示す説明図である。ＰＧスイッチをオフとしている期間を示す説明図である。平均値プーリング処理を行うプーリング処理部の構成例を示すブロック図である。重み付け平均値プーリング処理を行うプーリング処理部の構成例を示すブロック図である。レジスタ部を多段に接続したバッファで構成したプーリング処理部を示すブロック図である。

　図１において、演算処理装置１０は、畳み込みニューラルネットワークに基づく演算処理を行う。演算処理装置１０は、チャネル（特徴面とも称される）に対して、畳み込みフィルタを用いた畳み込み演算処理、プーリング処理を行う演算部１１、メモリ部１２、パワーゲーティング制御部１４、これらを統括的に制御するコントローラ１５を有している。演算部１１は、詳細を後述するように、畳み込み演算処理及びプーリング処理を行うｋ個（ｋは２以上の整数）の演算ユニット１７が並列に設けられている。

　上述の演算処理装置１０が基づく畳み込みニューラルネットワークは、複数の階層が接続されている。各階層は、１または複数のチャネルを有している。最初の階層は、入力層であって、例えばＲＧＢの各チャネルからなる画像等である。図２に一例として示す畳み込みニューラルネットワークでは、第１～第４階層が接続されている。第１階層は、３つのチャネルｃｈ１－１～ｃｈ１－３を、第２階層は、４つのチャネルｃｈ２－１～ｃｈ２－４を、第３階層は、３つのチャネルｃｈ３－１～ｃｈ３－３を、第４階層は、３つのチャネルｃｈ４－１～ｃｈ４－３をそれぞれ有している。

　第１～第４階層のうち第１階層、第２階層は、畳み込み演算処理の対象とされる階層であり、畳み込み演算処理によって第１階層のチャネルｃｈ１－１～ｃｈ１－３から第２階層のチャネルｃｈ２－１～ｃｈ２－４を、第２階層のチャネルｃｈ２－１～ｃｈ２－４から第３階層のチャネルｃｈ３－１～ｃｈ３－３をそれぞれ生成する。第３階層は、プーリング処理の対象とされる階層であり、プーリング処理によって第３階層のチャネルｃｈ３－１～ｃｈ３－３から第４階層のチャネルｃｈ４－１～ｃｈ４－３を生成する。

　なお、各階層のチャネルは、１または複数とすることができる。また、畳み込み演算処理では、前後の階層において、チャネル数が増減する場合もあるがチャネル数が変化しない場合もある。プーリング処理では、前後の階層におけるチャネル数が同じである。階層は、３階層あるいは５階層以上としてもよい。

　演算部１１は、ｎを１以上の整数として第ｎ階層のチャネルに対して畳み込み演算処理またはプーリング処理を行うことにより第ｎ＋１階層を生成する。階層の生成は、階層を構成する各チャネルを生成することであり、チャネルの生成は、チャネルを構成する各要素データを算出することである。なお、以下の説明において、第ｎ＋１階層に対して第ｎ階層を前階層、第ｎ階層に対して第ｎ＋１階層を次階層と称することがある。したがって、前階層のチャネルに対する畳み込み演算処理、プーリング処理により次階層のチャネルが生成される。

　チャネルは、２次元配列された複数の要素データにより構成される。要素データの２次元配列は、データ構造上の並びであり、各々の要素データが２つの変数（この説明では行と列）において位置が特定され、また要素データ同士の位置関係が特定されるように位置情報が付与されていることを意味する。後述する荷重データについても同様である。各チャネルのサイズすなわち行方向及び列方向の要素データの個数は任意であり特に限定されない。なお、この例では、２次元のチャネルについて説明するが、１次元あるいは３次元以上のチャネルであってもよい。

　畳み込み演算処理では、畳み込み演算により要素データを算出する。畳み込み演算で算出される要素データは、前階層の各チャネルについて畳み込み領域内の各要素データに対して畳み込みフィルタを適用した結果を、各チャネルの同じ位置の各畳み込み領域のもの同士で加算した値である。畳み込みフィルタの適用は、畳み込み領域内の要素データと畳み込みフィルタの荷重データの積和演算結果を求めることである。

　畳み込みフィルタは、要素データに対する重みとなる荷重データを２次元配列したものである。この例では、１つの畳み込みフィルタは、３×３（３行３列）の荷重データで構成される。畳み込みフィルタの各荷重データは、その畳み込みフィルタの目的等に応じた値にそれぞれ設定される。また、この例では、前階層のチャネルと次階層のチャネルの組み合わせに対応した畳み込みフィルタを用いる。

　畳み込み領域は、チャネル上で畳み込みフィルタが適用される範囲を規定しており、畳み込みフィルタと同じ配列サイズ（この例では３行３列）である。畳み込み演算では、畳み込みフィルタの荷重データと畳み込み領域の要素データとが対応する位置同士で乗算される。畳み込み演算処理では、領域の位置を要素データの１個分ずつ移動しながらチャネルの全域を走査するように畳み込み領域を移動させ、畳み込み領域を移動するごとに、要素データ算出処理を行う。

　この例においては、次階層の各々のチャネルについて前階層の全てのチャネルを用いて畳み込み演算を行う。また、前階層のチャネルと次階層のチャネルの組み合わせに対応した畳み込みフィルタを用いて畳み込み演算を行う。

　したがって、図２に示される例においては、例えば第３階層のチャネルｃｈ３－１を生成する際に、チャネルｃｈ２－１に対して畳み込みフィルタを適用するときには、チャネルｃｈ２－１とチャネルｃｈ３－１との組み合わせに対応付けられた畳み込みフィルタを用い、またチャネルｃｈ２－２に対して畳み込みフィルタを適用するときには、チャネルｃｈ２－２とチャネルｃｈ３－１との組み合わせに対応付けられた畳み込みフィルタを用いる。このようにして、チャネルｃｈ３－１を生成する際には、チャネルｃｈ３－１とチャネルｃｈ２－１～ｃｈ２－４との４通りの各組み合わせに対応した４個の畳み込みフィルタを用いて畳み込み演算を行う。同様に、チャネルｃｈ３－２を生成する際には、チャネルｃｈ３－２とチャネルｃｈ２－１～ｃｈ２－４の４通りの各組み合わせに対応した４個の畳み込みフィルタを用いて畳み込み演算を行い、チャネルｃｈ３－３を生成する際には、チャネルｃｈ３－３とチャネルｃｈ２－１～ｃｈ２－４の４通りの各組み合わせに対応した４個の畳み込みフィルタを用いて畳み込み演算を行う。

　なお、畳み込み演算処理において、次階層の１つのチャネルを生成するために、前階層の任意の個数のチャネルを用いることもでき、次階層の１つのチャネルを生成するために前階層の１つのチャネルを用いることもできる。また、１つの階層に用いられる複数の畳み込みフィルタの全部または一部が共通な重みの配列となってかまわない。さらに、畳み込みフィルタの重みの配列が共通な場合に、その共通な重みの配列の１つの畳み込みフィルタを用意しておき、この１つの畳み込みフィルタを複数のチャネルを算出する際に用いてもよい。

　プーリング処理は、一例として、前階層の各々のチャネルから行方向列方向のサイズを縮小した次階層のチャネルをそれぞれ生成する。この例では、プーリング処理として、２行２列のプーリング領域から最大値を抽出する最大値プーリング処理を行う。このため、各々のチャネルについて、チャネルを２行２列の複数のプーリング領域に互いに重複しないよう分け、これらプーリング領域のそれぞれについて領域内の最大値の要素データをプーリング処理の結果として出力する。なお、プーリング領域のサイズは、２行２列に限らない。ｐ、ｑのうちの一方を１以上の整数、他方を２以上の整数として、プーリング領域をｐ行ｑ列としてもよい。さらに、最大値プーリング処理に代えて、後述するように、プーリング領域の要素データの平均値を出力する平均値プーリング処理としてもよい。プーリング処理で縮小されたチャネルからなる階層に対して、さらに畳み込み演算処理を行うこともできる。プーリング領域は、互いに一部が重複するように分けることもでき、この場合、前階層のチャネルと行方向列方向のサイズが同じ次階層のチャネルを生成するようにプーリング処理を行うこともできる。

　図３（Ａ）に示すように、この例の畳み込み領域Ｒａは、３行３列である。演算部１１では、プーリング処理の対象となる階層（次階層、図２の例では第３階層）のチャネルＣｈＢの要素データを求める際には、前階層のチャネルＣｈＡにおける畳み込み領域Ｒａは、図３（Ａ）に示される位置、図３（Ｂ）示すように図３（Ａ）の位置から行方向に１要素データ分移動した位置、図３（Ｃ）に示すように図３（Ａ）に示される位置から列方向に１要素データ分移動した位置、図３（Ｄ）に示すように図３（Ｃ）に示される位置から行方向に１要素データ分移動した位置に順次に移動する。これにより、次階層のチャネルＣｈＢにおける１つのプーリング領域Ｒｂ内の要素データを連続して算出する。なお、１つのプーリング領域Ｒｂ内の要素データを連続して算出するのであれば、畳み込み領域Ｒａの移動の順番は、上記の順序に限定されない。

　図１において、メモリ部１２は、畳み込みフィルタの荷重データ、畳み込み演算処理が適用される階層すなわち前階層の各チャネルの要素データを記憶するとともに、畳み込み演算結果データ及びプーリングデータすなわち次階層の各チャネルの要素データが書き込まれる。プーリング処理の対象の階層については、畳み込み演算で得られる要素データを演算ユニット１７の内部でプーリング処理に引き渡すため、メモリ部１２には書き込まれない。

　パワーゲーティング制御部１４は、詳細を後述するように、コントローラ１５の制御下で各演算ユニット１７内の電力供給の制御、すなわちパワーゲーティングを制御する。

　図４に示すように、演算ユニット１７は、畳み込み演算を行う畳み込み演算部２１、プーリング（この例では最大値の抽出）を行うプーリング処理部２２、活性化関数処理部２３を有している。演算ユニット１７は、これらの他に、畳み込み演算部２１から出力される要素データのデータ長を所定のデータ長に変換するビット数調整回路（図示省略）等が設けられている。

　畳み込み演算部２１は、畳み込み演算を行って要素データを求める。畳み込み演算部２１は、１回の畳み込み演算によって１つの要素データを算出する。畳み込み演算部２１には、１つの要素データを算出する際に、前階層のチャネルを順次に切り替えながら、前階層の各々のチャネルについて畳み込み領域内の９個の要素データと畳み込みフィルタの９個の荷重データとが入力される。

　畳み込み演算部２１からの要素データは、活性化関数処理部２３に入力され、活性化関数を用いて変換される。活性化関数としては、例えばステップ関数、シグモイド関数、正規化線形関数（ReLU：Rectified Linear Unit）、リーク正規化線形関数（Leaky ReLU）、双曲線正接（Hyperbolic tangent）関数等である。活性化関数処理部２３を通した要素データが次階層の要素データとしてメモリ部１２及びプーリング処理部２２に送られる。

　プーリング処理部２２は、上述のプーリング処理を行い、プーリング領域内の最大値となる要素データを出力する。このプーリング処理部２２は、パワーゲーティング制御部１４により、電力供給の制御がなされる。

　なお、以下の説明において、畳み込み演算部２１による畳み込み演算によって得られる要素データ（活性化関数処理部２３を通したもの含む）を特に畳み込み演算結果データと称し、プーリング処理部２２によるプーリング処理によって得られる要素データを特にプーリングデータと称することがある。

　図５に畳み込み演算部２１の一例を示す。この畳み込み演算部２１は、畳み込みフィルタの荷重データと同じ個数（この例では９個）の乗算器２４、マルチプレクサ２５、加算器２６及びレジスタ２７等で構成される。各乗算器２４は、それぞれ要素データと荷重データとが入力され、それらを乗算した乗算結果を出力する。マルチプレクサ２５は、各乗算器２４からの乗算結果を１つずつ選択して出力する。レジスタ２７は、加算器２６の加算結果を保持する。加算器２６は、マルチプレクサ２５から１つの乗算結果が出力されるごとに、そのマルチプレクサ２５からの乗算結果とレジスタ２７に保持されているデータとを加算し、その加算結果をレジスタ２７に保持させる。前階層の各チャネルの要素データ及び畳み込みフィルタの荷重データを畳み込み演算部２１に入力して、最終的にレジスタ２７に保持されている加算結果を、畳み込み演算結果データ（要素データ）として出力する。なお、畳み込み演算部２１の構成は、これに限定されない。

　図６において、プーリング処理部２２は、プーリング演算回路３１と、不揮発性のプーリング用記憶回路としてのレジスタ３２とを有している。プーリング演算回路３１は、レジスタ３２と協働してプーリング領域内の最大値となる要素データを抽出する抽出処理を行う。このプーリング演算回路３１は、比較器３３とマルチプレクサ３４とで構成される。レジスタ３２は、例えば、磁気トンネル接合(MTJ :Magnetic tunnel junciton)素子を用いた複数の不揮発性フリップフロップ（NV-FF）等で構成されている。磁気トンネル接合素子を用いた不揮発性フリップフロップは、他の不揮発性フリップフロップと比較して基板上のサイズが小さく、高密度な集積が要求される畳み込みニューラルネットワークにおいて有利であり、また動作電圧が低いため消費電力を低くする上で有利である。

　レジスタ３２は、不揮発性であるため、電力供給を遮断してもデータを保持し、電力供給を行うことで電源遮断時に保持しているデータの読み出し、データの出力が可能である。このレジスタ３２は、保持データとしてマルチプレクサ３４で選択される要素データを保持する。レジスタ３２は、プーリング領域の最大値の出力が完了するごとにリセットされて、保持している内容が初期値（値「０」）にされる。なお、プーリング用記憶回路の構成は、上記のものに限定されない。

　プーリング演算回路３１を構成する比較器３３及びマルチプレクサ３４には、活性化関数処理部２３を介して畳み込み演算部２１からの要素データとレジスタ３２が保持している要素データとが入力される。比較器３３は、入力される２つの要素データを比較し、値の大きな要素データを選択させる選択信号をマルチプレクサ３４に出力する。マルチプレクサ３４は、セレクタとして機能し、選択信号に基づいて入力されている要素データの一方を選択して出力する。これにより、畳み込み演算部２１からの要素データとレジスタ３２が保持している要素データとで値の大きな要素データがマルチプレクサ３４から出力され、新たな保持データとして、その出力される要素データがレジスタ３２に保持される。

　プーリング演算回路３１に畳み込み演算部２１で算出されるプーリング領域の各要素データを順次に入力することによって、プーリング領域中の最大値となる要素データがレジスタ３２に保持され、その保持されている要素データが１つのプーリング領域についてのプーリングデータとして出力される。

　レジスタ３２には、ＰＧスイッチ３５を介して駆動電圧（ＶＤＤ）が印加されている。ＰＧスイッチ３５は、パワーゲーティング制御部１４とともにパワーゲーティング部を構成する。ＰＧスイッチ３５は、ＭＯＳトランジスタ等で構成され、パワーゲーティング制御部１４によってオン・オフが制御される。ＰＧスイッチ３５のオンにより、レジスタ３２は、電力供給を受けてデータの書き込み、出力（読み出し）が可能になる。ＰＧスイッチ３５をオフとすると、レジスタ３２は、駆動電圧が印加されなくなり、すなわち電力供給が遮断され、データの書き込み、出力が不可能になる。これにより、レジスタ３２に対してパワーゲーティングを行うことができる。なお、この例では、プーリング処理部２２ごとにＰＧスイッチ３５を設けているが、各プーリング処理部２２に共通な１つのＰＧスイッチ３５を設けてもよい。

　パワーゲーティング制御部１４は、プーリング処理期間中において、少なくともレジスタ３２への要素データの書き込みと出力とを行う間ではＰＧスイッチ３５をオンとし、それ以外の間ではＰＧスイッチ３５をオフとして電力消費を低減する。この例では、プーリング処理期間中において、プーリング処理部２２が畳み込み演算部２１からの要素データの入力待ちとなっている間すなわちプーリング処理部２２が処理を行わない間は、ＰＧスイッチ３５をオフとし、それ以外ではＰＧスイッチ３５をオンとする。具体的にＰＧスイッチ３５をオンとする期間は、畳み込み演算部２１からの要素データの出力すなわちプーリング処理部２２への要素データの入力のタイミングから、プーリング演算回路３１の処理によって新たな要素データがレジスタ３２に保持されるまで、またプーリングデータを出力する場合にはその出力が完了するまでの期間である。ＰＧスイッチ３５は、プーリング処理期間以外ではオフとされる。

　なお、この例では、上述のように畳み込み演算部２１で順次に算出されるプーリング領域の各要素データを、要素データが算出されるごとにプーリング処理部２２に入力している。このためプーリング処理期間の開始は、プーリング処理の対象とする階層のチャネルを生成するための畳み込み演算処理の開始時またはプーリング処理の対象とする階層における１番目の要素データのプーリング処理部２２への入力時点である。また、プーリング処理期間の終了は、プーリング処理により生成されるチャネルの最終の要素データのプーリング処理部２２からの出力が完了した時点である。

　１つのプーリング領域に注目した場合には、当該プーリング領域の要素データの算出のための畳み込み演算の開始時または当該プーリング領域の１番目の要素データがプーリング処理部２２に入力される時点がプーリング処理期間の開始であり、レジスタ３２に保持されている当該プーリング領域の最大値となる要素データの出力の完了時がプーリング処理期間の終了である。レジスタ３２に保持されている要素データの出力の完了は、レジスタ２７から出力されている要素データが、レジスタ２７から取得すべき回路によって取得された時点である。この例では、メモリ部１２が要素データをラッチした時点が要素データの出力の完了である。

　演算処理装置１０は、演算部１１に設けたＫ個の演算ユニット１７を用いて、次階層のｋチャネルのそれぞれについて１つの要素データを並列に算出するチャネル並列と称される態様で畳み込み演算処理を行う。また、演算処理装置１０は、畳み込み演算処理で生成される階層がプーリング処理の対象となる場合には、次階層のｋチャネルのそれぞれについて１つの要素データを算出するごとに、上述のようにプーリング領域内の複数の要素データを連続的に算出するように、当該ｋチャネルにおいて畳み込み領域を移動する。なお、畳み込み演算処理により生成される次階層がプーリング処理の対象とならない場合には、上記以外の態様で要素データを算出してもかまわない。

　次に上記構成の作用について、第ｎ階層に対して畳み込み演算処理を行って第ｎ＋１階層を生成し、この第ｎ＋１階層に対してプーリング処理を行って第ｎ＋２階層を生成する場合について説明する。畳み込み演算処理では、図７及び図８に示すように、第ｎ階層は、チャネルＣｈＡ１、ＣｈＡ２、・・・から構成され、この第ｎ階層からチャネルＣｈＢ１、ＣｈＢ２、・・・から構成される第ｎ＋１階層を生成するものとする。

　まず、演算部１１の各演算ユニット１７により第ｎ階層の１番目のチャネルＣｈＡ１の畳み込み領域Ｒａに畳み込みフィルタを適用する演算が行われる。チャネルＣｈＡ１の畳み込み領域Ｒａの９個の要素データがメモリ部１２から読み出されて各演算ユニット１７の畳み込み演算部２１に入力される。また、１つの畳み込みフィルタの９個の荷重データが１つの畳み込み演算部２１に入力されるようにして、１番目のチャネルＣｈＡ１と次階層の１番目～ｋ番目のチャネルＣｈＢ１、ＣｈＢ２、・・・に対応する畳み込みフィルタＦＡ１Ｂ１、ＦＡ１Ｂ２、・・・の荷重データがメモリ部１２から読み出されて各演算ユニット１７の畳み込み演算部２１にそれぞれ入力される。これにより、各畳み込み演算部２１は、それらに入力されたチャネルＣｈＡ１の畳み込み領域Ｒａの要素データと畳み込みフィルタの荷重データとを対応するデータ同士で乗算し、それらの乗算結果の和である積和結果をレジスタ２７にそれぞれ格納する（図７（Ａ））。

　次に、各演算ユニット１７により第ｎ階層の２番目のチャネルＣｈＡ２における、１番目のチャネルＣｈＡ１と同一位置の畳み込み領域Ｒａに畳み込みフィルタを適用する演算を行う。チャネルＣｈＡ２における畳み込み領域Ｒａの９個の要素データが各演算ユニット１７の畳み込み演算部２１に入力されるとともに、２番目のチャネルＣｈＡ２と次階層の１番目～ｋ番目のチャネルＣｈＢ１、ＣｈＢ２、・・・に対応する畳み込みフィルタＦＡ２Ｂ１、ＦＡ２Ｂ２、・・・の荷重データが各演算ユニット１７にそれぞれ入力される。

　各々の演算ユニット１７は、例えばｋチャネルの全ての要素データの算出が完了するまで、次階層の１つのチャネルに対応し、対応する次階層のチャネルは変わらない。このため、例えば、前階層の１番目のチャネルＣｈＡ１を対象とした演算の際に２番目のチャネルＣｈＢ１に対応する畳み込みフィルタＦＡ１Ｂ１の荷重データが入力された演算ユニット１７には、２番目のチャネルＣｈＡ２の演算の際にも２番目のチャネルＣｈＢ２に対応する畳み込みフィルタＦＡ２Ｂ２の荷重データが入力される。

　上記のように要素データと荷重データとが各演算ユニット１７に入力されることにより、各畳み込み演算部２１のレジスタ２７には、チャネルＣｈＡ１の畳み込み領域Ｒａに畳み込みフィルタを適用した積和結果に、チャネルＣｈＡ２の畳み込み領域Ｒａに畳み込みフィルタを適用することで得られる積和結果を加算した値が格納される（図７（Ｂ））。

　以降同様に、各演算ユニット１７の畳み込み演算部２１により、第ｎ階層の３番目以降の各チャネルについて、１番目のチャネルＣｈＡ１と同一位置の畳み込み領域Ｒａに畳み込みフィルタを適用する演算を順次に行う。第ｎ階層の最終のチャネルの畳み込み領域Ｒａに畳み込みフィルタを適用する演算が完了すると、各畳み込み演算部２１のレジスタ２７には、前階層の各チャネルの畳み込み領域Ｒａに畳み込みフィルタを適用した積和結果の総和、すなわち次階層の１番目～ｋ番目のチャネルの各々について１番目の要素データがそれぞれ格納される。このようにして得られた１番目の各要素データ（畳み込み演算結果データ）が畳み込み演算部２１から出力される。

　各演算ユニット１７の畳み込み演算部２１は、上記のように１番目の要素データを算出した後、図８（Ａ）に示すように、畳み込み領域Ｒａを行方向に要素データ１個分ずらし、上記と同じ手順で前階層の１番目のチャネルＣｈＡ１の畳み込み領域Ｒａに畳み込みフィルタＦＡ１Ｂ１、ＦＡ１Ｂ２、・・・を適用する演算を行う。この後、やはり同じ手順で、図８（Ｂ）に示すように、前階層の２番目のチャネルＣｈＡ２における畳み込み領域Ｒａに畳み込みフィルタＦＡ２Ｂ１、ＦＡ２Ｂ２、・・・を適用する演算を畳み込み演算部２１によって行う。以降同様に、前階層の３番目以降の各チャネルについて畳み込み領域Ｒａに畳み込みフィルタを適用する演算を順次に行い、１番目～ｋ番目のチャネルの各々について２番目の要素データを算出して畳み込み演算部２１から出力する。

　２番目の要素データの算出後、畳み込み領域Ｒａを、最初の位置から列方向に要素データ１個分ずらし、上記と同じ手順により、３番目の要素データを畳み込み演算部２１により算出して出力する。３番目の要素データの算出後、畳み込み領域Ｒａを、行方向に要素データ１個分ずらし、上記と同じ手順により、４番目の要素データを畳み込み演算部２１により算出して出力する。このようにして、プーリング処理の対象となるプーリング領域の４つの要素データを連続的に算出する。

　一方、プーリング処理部２２は、図９に示すように、畳み込み演算部２１が畳み込み演算を行っている期間Ｔ１では、要素データの入力待ち状態である。そして、この要素データの入力待ち状態の期間Ｔ１では、パワーゲーティング制御部１４によりＰＧスイッチ３５がオフとされ、各プーリング処理部２２のレジスタ３２への電力供給がそれぞれ遮断されている。

　１番目の要素データ（畳み込み演算結果データ）が畳み込み演算部２１から出力されるタイミングで、パワーゲーティング制御部１４によりＰＧスイッチ３５がオンとされる。これにより、各プーリング処理部２２のレジスタ３２に電力供給がなされデータの書き込みが可能になる。畳み込み演算部２１から出力された要素データが活性化関数処理部２３を介してプーリング処理部２２に入力されると、この入力された要素データとレジスタ３２に保持されているデータとが比較器３３によって比較され、その比較結果に基づいてマルチプレクサ３４が制御される。レジスタ３２は、畳み込み演算が開始されるときにリセットされて初期値（値「０」）を保持しているから、入力された要素データがマルチプレクサ３４によって選択されて、その要素データがレジスタ３２に書き込まれる。

　上記のように１番目の要素データがレジスタ３２に書き込まれると、プーリング処理部２２は、畳み込み演算部２１が期間Ｔ２で算出する２番目の要素データの入力待ちになる。パワーゲーティング制御部１４によりＰＧスイッチ３５がオフとされ、各プーリング処理部２２のレジスタ３２への電力供給が遮断される。

　畳み込み演算部２１が２番目の要素データを出力するタイミングで、パワーゲーティング制御部１４によりＰＧスイッチ３５がオンとされ、レジスタ３２への電力供給がなされる。畳み込み演算部２１から出力された２番目の要素データは、レジスタ３２に保持されている要素データと比較器３３によって比較され、その比較結果に基づいてマルチプレクサ３４が制御される。レジスタ３２は、不揮発性であるため、電力供給が再開されることによって、電源遮断前に保持していたデータを出力する。このため、畳み込み演算部２１から出力された２番目の要素データは、比較器３３によってレジスタ３２に保持されている要素データと比較され、その比較結果に基づいてマルチプレクサ３４が制御される。

　レジスタ３２には、１番目の要素データが保持されているから、１番目の要素データと２番目の要素データとが比較器３３によって比較される。この比較によって、それらの要素データのうち値の大きな要素データがマルチプレクサ３４で選択され、その選択された要素データがレジスタ３２に書き込まれる。このようにレジスタ３２に要素データが新たに書き込まれると、畳み込み演算部２１が期間Ｔ３で算出する３番目の要素データ待ちとなって、ＰＧスイッチ３５がオフとされ、各プーリング処理部２２のレジスタ３２への電力供給が遮断される。

　畳み込み演算部２１が３番目の要素データを出力するタイミングで、パワーゲーティング制御部１４によりＰＧスイッチ３５がオンとされ、レジスタ３２への電力供給がなされる。そして、３番目の要素データとレジスタ３２に保持されている要素データとが比較器３３によって比較される。それらの要素データのうち値の大きな要素データがマルチプレクサ３４で選択されて、選択された要素データがレジスタ３２に書き込まれる。レジスタ３２に要素データが新たに書き込まれると、畳み込み演算部２１が期間Ｔ４で算出する４番目の要素データ待ちとなって、ＰＧスイッチ３５がオフとされ、各プーリング処理部２２のレジスタ３２への電力供給が遮断される。

　畳み込み演算部２１が４番目の要素データを出力するタイミングで、ＰＧスイッチ３５がオンとされ、レジスタ３２への電力供給がなされる。そして、４番目の要素データとレジスタ３２に保持されている要素データとが比較され、それらの要素データのうち値の大きな要素データが選択されてレジスタ３２に書き込まれる。

　これにより、レジスタ３２には、第ｎ＋１階層のプーリング領域内の１番目から４番目の要素データのうち最も値が大きい要素データが保持され、このレジスタ３２に保持されている要素データが第ｎ＋２階層の要素データ（プーリングデータ）としてプーリング処理部２２から出力される。このプーリング処理部２２からの要素データが例えばメモリ部１２にラッチされると、すなわち出力が完了すると、次のプーリング領域の１番目の要素データの入力待ちとなり、ＰＧスイッチ３５がオフとされレジスタ３２への電力供給が遮断される。

　畳み込み演算部２１は、４番目の要素データを出力した後、畳み込み領域Ｒａをさらに移動して、上記と同じ手順で、次のプーリング領域のための要素データを算出する。また、プーリング処理部２２は、１番目～４番目の要素データが出力されるごとに要素データとレジスタ３２に保持しているデータとを比較することで、新たなプーリング領域内の最も値が大きい要素データをレジスタ３２に保持し、その要素データを第ｎ＋２階層の要素データとして出力する。そして、プーリング処理部２２が、上記のように要素データの入力待ちの間は、ＰＧスイッチ３５がオフとされレジスタ３２への電力供給が遮断される。

　上記手順を繰り返し行うことにより、第ｎ＋２階層の１番目～ｋ番目のチャネルの各々について全ての要素データを算出する。第ｎ＋２階層にｋ＋１番目以降のチャネルがある場合には、上記と同じ手順を繰り返すことにより、全てのチャネルの各々について全ての要素データを算出する。なお、プーリングデータを算出するチャネル数が演算ユニット１７の個数よりも少ない場合、一部の演算ユニット１７で演算を行わないが、このような場合には、演算を行わない演算ユニット１７内のレジスタ３２への電力供給を遮断してもよい。

　上記のようにして演算処理装置１０は、プーリング処理部２２によってプーリング処理を行うが、プーリング処理部２２が要素データの入力待ちとなっている間では、レジスタ３２の電力供給を遮断するようにパワーゲーティングしている。このため、要素データの入力待ち状態におけるレジスタ３２のリーク電流が抑制されており、演算処理装置１０の消費電力が小さい。

　レジスタ３２を、磁気トンネル接合素子を用いた不揮発性フリップフロップで構成した場合（以下、不揮発性構成という）の消費電力（動作時消費電力）の、不揮発性ではない通常のフリップフロップで構成した場合（以下、通常構成という）における消費電力（動作時消費電力＋待機時消費電力）に対する計算上の比率は、例えば０．２２とすることができる。この比率の計算では、不揮発性構成の動作時消費電力を通常構成の１０倍とし、通常構成を「待機時消費電力：動作時消費電力」が「３０：１１０」とし、演算処理装置１０におけるレジスタ３２の動作サイクル数の待機サイクル数に対する比を「０．００６」として計算している。

　図１０は、プーリング領域の要素データの平均値を出力する平均値プーリング処理を行うようにプーリング処理部２２を構成した例を示す。プーリング処理部２２は、プーリング演算回路３１と、レジスタ４２とで構成され、プーリング演算回路３１は、加算器４３、２ビットシフタ４４で構成され、レジスタ４２と協働してプーリング領域の要素データの平均値を算出する。加算器４３は、レジスタ４２に保持されているデータと入力される畳み込み演算結果データである要素データとを加算する。レジスタ４２は、不揮発性のプーリング用記憶回路であり、加算器４３の加算結果を保持する。２ビットシフタ４４は、ビットシフト回路であり、除算器として設けられている。２ビットシフタ４４により、プーリング領域の最終の要素データまでを加算器４３で加算した加算結果を２ビットシフトすることで、プーリング領域の要素データの個数（４個）で除した商を算出する。

　プーリング処理部２２は、上記の構成により、プーリング領域の４個の要素データが入力されるごとに、２ビットシフタ４４からのシフト演算の結果がプーリング領域の要素データの平均値である要素データ（プーリングデータ）として出力する。

　レジスタ４２は、レジスタ３２（図６参照）と同様に不揮発性とされており、ＰＧスイッチ３５のオン・オフにより、パワーゲーティングされる。したがって、プーリング処理期間中において、プーリング処理部２２が畳み込み演算部２１からの要素データの入力待ちとなっている間すなわちプーリング処理部２２が処理を行っていない間は、ＰＧスイッチ３５がオフとされて電力供給が遮断される。これにより、演算処理装置１０の消費電力を低減している。

　図１１に示す例のように、加算器４３の前段に所定の重みを乗算する乗算器４５を設け、畳み込み演算結果として入力される要素データに、要素データの位置に応じた重み付けを行ってもよい。重みとしては、例えば二次元ガウシアンにしたがった重みとすることができる。

　図１２は、プーリング用記憶回路としてのレジスタ部５１を多段に設けたバッファ５１ａで構成したプーリング処理部２２の例を示している。この例におけるプーリング処理部２２は、レジスタ部５１の他、比較器５２とセレクタとしてのマルチプレクサ５３とを有する。畳み込み演算部２１からの要素データ（畳み込み演算結果データ）は、レジスタ部５１に入力される。

　なお、この例では、プーリング領域を２行２列とする。また、プーリング処理の対象となる階層のチャネルについて、畳み込み演算部２１が、１行目から順番に各行について要素データを算出し、各々の行については、行の一端から他端に向けて順番に要素データを算出する。また、プーリング処理の対象となる階層のチャネルの列数は偶数であるとする。

　各バッファ５１ａは、データの各ビットがパラレルに入力され、例えばクロックに同期して入力されるデータを保持し、保持しているデータをパラレルに出力するものである。例えば、このようなバッファ５１ａとしては、並列入力並列出力形（PIPO：Parallel-In, Parallel-Out）のシフトレジスタを用いることができる。プーリング処理の対象となる階層の各チャネルの列数（１行の要素データの個数）をＹ（Ｙは、２以上の偶数）としたときに、レジスタ部５１は、（Ｙ＋２）段にバッファ５１ａが接続されている。

　各バッファ５１ａは、前段の出力が後段のバッファ５１ａに入力されるように多段に接続されている。すなわち、１段目のバッファ５１ａに畳み込み演算部２１からの要素データが活性化関数処理部２３を介して入力され、２段目以降のバッファ５１ａは、前段のバッファ５１ａからの出力が後段のバッファ５１ａに入力されるように接続されている。各バッファ５１ａには、１段目のバッファ５１ａへの要素データの入力に同期して、クロックが入力される。これにより、レジスタ部５１に要素データが入力されるごとに、１段目のバッファ５１ａには畳み込み演算部２１からの要素データが保持され、２段目以降のバッファ５１ａは前段のバッファ５１ａから出力されている要素データを保持する。

　プーリング演算回路３１を構成する比較器５２及びマルチプレクサ５３には、１段目、２段目、Ｙ＋１段目及びＹ＋２段目の各バッファ５１ａからの要素データがデータ群として入力される。比較器５２は、入力される４つの要素データを比較して、最も大きな値の要素データを選択して出力させるための選択信号を出力する。マルチプレクサ５３は、選択信号に基づき入力されている４つの要素データのうちの１つの要素データを選択して出力する。

　プーリング演算回路３１は、コントローラ１５の制御により、１段目、２段目、Ｙ＋１段目及びＹ＋２段目の各バッファ５１ａが出力（保持）している４個の要素データが１つのプーリング領域内の要素データの組み合わせとなるときに比較器５２による比較とマルチプレクサ５３による選択とを行う。具体的には、ｍを１以上の整数として、（２ｍ－１）・Ｙ番目の要素データが入力された後、２ｍ・Ｙ番目の要素データが入力されるまでの間、２個の要素データが入力されるごとに、比較器５２による比較とマルチプレクサ５３による選択とを行う。

　上記のようにプーリング処理部２２を構成することにより、プーリング処理の対象のチャネルを重複することなく複数の２行２列に区分した各プーリング領域の最大値となる要素データがマルチプレクサ５３によって選択されて、プーリングデータとして出力される。

　レジスタ部５１は、不揮発性の記憶回路として構成される。すなわち、各バッファ５１ａが不揮発性とされている。他の例と同様に、バッファ５１ａを、磁気トンネル接合素子を用いた複数の不揮発性フリップフロップ（NV-FF）で構成することが好ましい。レジスタ部５１は、ＰＧスイッチ３５を介して駆動電圧（ＶＤＤ）が印加されており、プーリング処理期間中において、プーリング処理部２２が畳み込み演算部２１からの要素データの入力待ちとなっている間では、ＰＧスイッチ３５をオフとして電力消費を低減する。すなわち、１段目のバッファ５１ａが畳み込み演算部２１からの要素データが入力されて格納し、同時に２段目以降の各バッファ５１ａが前段のバッファ５１ａからの要素データが入力されて格納するとき、またプーリングデータを出力するときには、比較器５２による要素データの比較とマルチプレクサ５３による選択を行ってマルチプレクサ５３からの出力が完了するまでの間は、ＰＧスイッチ３５がオンとされ、それ以外のプーリング処理部２２が動作する必要がない間はＰＧスイッチ３５がオフとされてレジスタ部５１への電力供給が遮断される。

　１０　演算処理装置
　１４　パワーゲーティング制御部
　２１　畳み込み演算部
　２２　プーリング処理部
　３２、４２　レジスタ
　３３　比較器
　３４　マルチプレクサ
　５１　レジスタ部
　５１ａ　バッファ
　５２　比較器
　５３　マルチプレクサ

Claims

　畳み込み演算結果データを順次に出力する畳み込み演算部と、
　プーリング演算回路及び不揮発性のプーリング用記憶回路を有し、前記プーリング用記憶回路が前記畳み込み演算結果データまたは前記プーリング演算回路の演算結果を保持データとして保持し、前記畳み込み演算部からの前記畳み込み演算結果データが入力されるごとに、前記プーリング演算回路が前記保持データを用いてプーリング領域にプーリング処理を行ったプーリングデータを算出して出力するプーリング処理部と、
　前記畳み込み演算部からの前記畳み込み演算結果データの入力待ちの間における前記プーリング用記憶回路への電力供給を遮断するパワーゲーティング部と
　を備えることを特徴とする演算処理装置。
　前記プーリング演算回路は、前記畳み込み演算部からの前記畳み込み演算結果データと前記保持データとを比較する比較器と、前記畳み込み演算部からの前記畳み込み演算結果データと前記保持データとが入力され、前記比較器の比較結果に基づき、入力されるデータのうちの値の大きなデータを選択して出力するセレクタとを有し、
　前記プーリング用記憶回路は、前記プーリング演算回路の出力するデータを新たな前記保持データとして保持し、
　前記プーリング処理部は、前記プーリング演算回路への前記プーリング領域の各前記畳み込み演算結果データの入力により前記プーリング用記憶回路が保持する前記保持データをプーリングデータとして出力する
　ことを特徴とする請求項１に記載の演算処理装置。
　前記プーリング演算回路は、前記畳み込み演算部からの前記畳み込み演算結果データと前記保持データとを加算する加算器と、前記加算器の加算結果を前記プーリング領域内の前記畳み込み演算結果データの個数で除算する除算器とを有し、
　前記プーリング用記憶回路は、前記加算器の加算結果を新たな前記保持データとして保持し、
　前記プーリング処理部は、前記プーリング演算回路への前記プーリング領域の各前記畳み込み演算結果データの入力により得られる前記加算器の加算結果を前記除算器で除算したデータをプーリングデータとして出力する
　ことを特徴とする請求項１に記載の演算処理装置。
　前記プーリング演算回路は、前記畳み込み演算部からの前記畳み込み演算結果データに所定の重みを乗算して重み付けする乗算器と、前記乗算器からの乗算結果と前記保持データとを加算する加算器と、前記加算器の加算結果を前記プーリング領域内の前記畳み込み演算結果データの個数で除算する除算器とを有し、
　前記プーリング用記憶回路は、前記加算器の加算結果を新たな前記保持データとして保持し、
　前記プーリング処理部は、前記プーリング演算回路への前記プーリング領域の各前記畳み込み演算結果データの入力により得られる前記加算器の加算結果を前記除算器で除算したデータをプーリングデータとして出力する
　ことを特徴とする請求項１に記載の演算処理装置。
　前記除算器は、前記プーリング領域の各前記畳み込み演算結果データの個数に応じたビット数でデータをシフトするビットシフト回路であることを特徴とする請求項３または４に記載の演算処理装置。
　複数の前記畳み込み演算結果データが２次元配列されたチャネル上のｐ行ｑ列の前記プーリング領域内の前記畳み込み演算結果データが前記プーリング処理部に入力されることを特徴とする請求項１ないし５のいずれか１項に記載の演算処理装置。
　前記プーリング領域は、２行２列であることを特徴とする請求項６に記載の演算処理装置。
　前記プーリング用記憶回路は、不揮発性のレジスタにより構成されていることを特徴とする請求項１ないし７のいずれか１項に記載の演算処理装置。
　前記レジスタは、不揮発性のフリップフロップにより構成されることを特徴とする請求項８に記載の演算処理装置。
　前記畳み込み演算部は、複数の前記畳み込み演算結果データが２次元配列されるチャネルの行ごとに前記畳み込み演算結果データを前記チャネルの行方向に順次に出力し、
　前記プーリング処理部は、複数の前記畳み込み演算結果データを前記チャネルの２行２列ごとに区分した各プーリング領域について最大値となる前記畳み込み演算結果データをプーリングデータとして出力し、
　前記プーリング用記憶回路は、前記チャネルの列数をＹ（Ｙは２以上の偶数）として、Ｙ＋２段に接続された不揮発性のバッファを有し、前記畳み込み演算部からの前記畳み込み演算結果データが１段目のバッファに入力されるごとに、１段目のバッファが入力される前記畳み込み演算結果データを保持して出力し、２段目以降の各バッファが前段のバッファから出力されている前記畳み込み演算結果データを保持して出力し、
　前記プーリング演算回路は、１段目、２段目、Ｙ＋１段目及びＹ＋２段目の各バッファからの各前記畳み込み演算結果データからなるデータ群が入力され、前記データ群の各前記畳み込み演算結果データを比較する比較器と、前記比較器の比較結果に基づいて前記データ群のうちで最大値となる前記畳み込み演算結果データを選択して出力するセレクタとを有し、
　前記プーリング処理部は、前記データ群の各前記畳み込み演算結果データが１つの前記プーリング領域内の前記畳み込み演算結果データの組み合わせとなるときの前記セレクタから出力されている前記畳み込み演算結果データをプーリングデータとして出力する
　ことを特徴とする請求項１に記載の演算処理装置。
　前記バッファは、不揮発性の並列入力並列出力形のシフトレジスタであることを特徴とする請求項１０に記載の演算処理装置。
　前記シフトレジスタは、不揮発性のフリップフロップにより構成されることを特徴とする請求項１１に記載の演算処理装置。
　前記不揮発性のフリップフロップは、磁気トンネル接合素子を含む回路であることを特徴とする請求項１２に記載の演算処理装置。
　複数の畳み込み演算結果データが２次元配列されるチャネルの行ごとに前記畳み込み演算結果データを前記チャネルの行方向に順次に出力する畳み込み演算部と、
　プーリング演算回路及び不揮発性のプーリング用記憶回路を有し、複数の前記畳み込み演算結果データを前記チャネルの２行２列ごとに区分した各プーリング領域について最大値となる前記畳み込み演算結果データをプーリングデータとして出力するプーリング処理部と
　を備え、
　前記プーリング用記憶回路は、前記チャネルの列数をＹ（Ｙは２以上の偶数）として、Ｙ＋２段に接続されたバッファを有し、前記畳み込み演算部からの前記畳み込み演算結果データが１段目のバッファに入力されるごとに、１段目のバッファが入力される前記畳み込み演算結果データを保持して出力し、２段目以降の各バッファが前段のバッファから出力されている前記畳み込み演算結果データを保持して出力し、
　前記プーリング演算回路は、１段目、２段目、Ｙ＋１段目及びＹ＋２段目の各バッファからの各前記畳み込み演算結果データからなるデータ群が入力され、前記データ群の各前記畳み込み演算結果データを比較する比較器と、前記比較器の比較結果に基づいて前記データ群のうちで最大値となる前記畳み込み演算結果データを選択して出力するセレクタとを有し、
　前記プーリング処理部は、前記データ群の各前記畳み込み演算結果データが１つの前記プーリング領域内の前記畳み込み演算結果データの組み合わせとなるときの前記セレクタから出力されている前記畳み込み演算結果データをプーリングデータとして出力する
　ことを特徴とする演算処理装置。