JP6724869B2

JP6724869B2 - 多層ニューラルネットワークのニューロンの出力レベル調整方法

Info

Publication number: JP6724869B2
Application number: JP2017119685A
Authority: JP
Inventors: イリナカタエヴァ; 茂樹大塚
Original assignee: Denso Corp
Current assignee: Denso Corp
Priority date: 2017-06-19
Filing date: 2017-06-19
Publication date: 2020-07-15
Anticipated expiration: 2037-06-19
Also published as: US20200110991A1; JP2019003546A; WO2018235448A1; US12026608B2

Description

本発明は、多層ニューラルネットワークのニューロンの出力レベル調整方法に関する。

多層ニューラルネットワークは、人間の神経回路網の挙動を模倣するように作られた情報処理機構である。この多層ニューラルネットワークは、典型的には、入力値が与えられて他のニューロンに分配するための入力用ニューロンを含む入力層と、外部に対して出力値を出す出力用ニューロンを含む出力層と、入力用ニューロンと出力用ニューロンとの間に存在する中間ニューロンを含む中間層とから構成される。

信号は、入力層から中間層を介して出力層へと一方向に流れる。入力用ニューロンは、入力値に対して処理を行なわずにそのまま中間ニューロンに伝達する。中間ニューロン及び出力用ニューロンは、前の層の複数のニューロンの出力値に、それぞれ、結合の強さを示す正又は負の重みを掛け合わせたものの総和を算出し、その算出値を活性化関数に通して出力値とする。

活性化関数として、従来は、シグモイド関数や、双曲線正接関数が用いられていた。シグモイド関数は、入力値の０を境に、出力値がシグモイド曲線に従い０と１の間で変化する関数である。双曲線正接関数は、入力値の０を境に、出力値がtanhによる双曲線に従って−１と１の間で変化する関数である。しかし、これらの活性化関数を用いた場合、計算負荷が高い、入力値が大きい値を取るときに微分係数、すなわち勾配が小さくなるため、逆誤差伝播法を用いて多層ニューラルネットワークの学習を行う際に、深い層で勾配が消失するといった問題があった。

そのため、近年では、活性化関数として、ReLU（Rectified Linear Unit）やそれに類似する関数（leaky ReLU、maxoutなど）が用いられることが多い。例えば、ReLUは、max(0,x)により定義される関数である。これらの関数の強みは、単純であるため計算が速い、勾配損失しない、スパース性の高さに繋がる、などである。非特許文献１には、ReLUを用いることで、多層ニューラルネットワークの学習時間を短縮できることが記載されている。さらに、非特許文献１には、ReLUは、入力を正規化しなくとも出力が飽和することはないが、ReLUの出力を正規化することにより、認識エラー率を低減できることも示されている。

ただし、非特許文献１では、多層ニューラルネットワークにおける種々の計算がGPU（Graphics Processing Unit）を用いてデジタル的に行われる。従って、ReLUの出力の正規化も容易に行うことができる。一方、GPUは消費電力が大きいという問題があるため、多層ニューラルネットワークにおける計算をより低消費電力にて行うことが可能な専用のハードウエア回路の開発が進められている。そのハードウエア回路の一例として、例えば特許文献１に示されるような、印加電圧や通電電流によって異なる抵抗状態に設定することが可能な抵抗変化型メモリ（メモリスタ）が組み込まれたハイブリッドＣＭＯＳ回路がある。このハイブリッドＣＭＯＳ回路では、入力バーと出力バーとが交差するクロスバー回路の交点に設けられたメモリスタによって入力値に重みが付与される。そして、出力バーにCMOS素子によって構成された集積回路が接続され、この集積回路が、ニューロンとして、重みが付与された入力値の加算や、加算した入力値から活性化関数に応じた出力値の生成をアナログ領域で実行する。

国際公開第２０１７／０１００４８号

A. Krizhevsky, I. Sutskever, and G. E. Hinton, "Imagenet classification with deep convolutional neural networks," in Advances in neural information processing systems, pp. 1097-1105, 2012.

しかしながら、特許文献１に示されるように、CMOS素子によって構成される集積回路（アナログ処理回路）において、活性化関数に応じた出力値の生成がアナログ領域で行われる場合、以下に説明するような問題が生じることが考えられる。なお、以下に説明する問題は、ReLUのような出力値に上限値が定められていない活性化関数を用いる場合、上位階層のニューロンの出力値が増大する傾向が生じるため、特に生じやすくなる。

まず、集積回路内で、活性化関数としての処理を行う回路は、その回路構成や回路素子の特性に応じて、出力可能な範囲である出力レンジが規制される。そのため、活性化関数に応じた出力値が大きい場合、その出力レンジによる制限を受けて、出力値が飽和してしまう可能性がある。出力値が飽和した場合、活性化関数としての処理を行う回路は、正しい出力値を出力することができなくなってしまう。また、ある層のメモリスタは、前層のニューロンにより過大な出力値が生成され、その出力値に応じた入力値が入力されることにより書込閾値以上の電圧が印加されると、コンダクタンスが変化してしまう可能性がある。メモリスタのコンダクタンスが変化してしまった場合、入力値に対して付与すべき所望の重みを付与することができなくなってしまう。

本発明は、上述した点に鑑みてなされたものであり、メモリスタ及びアナログ処理回路を用いて多層ニューラルネットワークを構成する際に、アナログ処理回路の出力の飽和やメモリスタのコンダクタンスの変化の発生を抑制することが可能な、多層ニューラルネットワークのニューロンの出力レベル調整方法を提供することを目的としている。

上記目的を達成するべく、本発明によるニューロンの出力レベル調整方法は、多層ニューラルネットワーク（２０）の階層化されたニューロン（５６）間での信号の伝達及びニューロンでの信号処理をアナログ領域で行うべく、伝達される信号に対してシナプスとしての重みを付与する抵抗変化型メモリであるメモリスタ（５３）と、ニューロンにおける信号処理として、それぞれ重みが付与された信号の加算、及び加算した信号から活性化関数に応じた出力値の生成を実行するアナログ処理回路（４４）とを備えた多層ニューラルネットワークに適用され、
各階層のニューロンの出力値が、最も大きくなったときでも、メモリスタの書込閾値電圧未満であって、かつ活性化関数に応じた出力値の生成を実行するアナログ処理回路の、設定された最大出力レンジ内に収まるように、各階層のニューロンの出力レベルを調整する調整ステップ（Ｓ１１０〜Ｓ１４０、Ｓ２００〜Ｓ２４０）を備える。

従って、本発明によれば、活性化関数に応じた出力値が、アナログ処理回路の出力レンジによる制限を受けて飽和してしまったり、その出力値によって次の階層のメモリスタのコンダクタンスが変化してしまったりすることを抑制することができる。そのため、多層ニューラルネットワークによる認識、予測、運動制御などの精度の劣化を回避することが可能となる。

調整ステップの一例として、調整ステップ（Ｓ１１０〜Ｓ１４０）は、コンピュータ上に構築された多層ニューラルネットワークに対して実行され、
調整ステップは、
各階層のニューロンの出力値を検出する検出ステップ（Ｓ１１０）と、
検出ステップによって検出された各階層のニューロンの出力値に基づいて決定される各階層のニューロンの出力最大値と、活性化関数に応じた出力値の生成を実行するアナログ処理回路の最大出力レンジとに基づいて、各階層毎に、スケーリングファクターを算出する算出ステップ（Ｓ１２０、Ｓ１３０）と、
アナログ処理回路の最大出力レンジは、各階層のニューロンの出力値がメモリスタの書込閾値電圧よりも小さくなるように設定され、
算出ステップで算出された各階層毎のスケーリングファクターによって、それぞれ、対応するメモリスタのコンダクタンスを修正する修正ステップ（Ｓ１４０）と、を含み、
修正ステップによって修正されたコンダクタンスが、実際に前記メモリスタに設定されるようにすることができる。

上記のように、コンピュータ上に構築された多層ニューラルネットワークに対して調整ステップを実行する場合には、スケーリングファクターを算出し、このスケーリングファクターによってメモリスタのコンダクタンス（重み）を修正する、これにより、各階層のニューロンの出力レベルを適切に調整することができるようになる。つまり、スケーリングファクターは、各階層のニューロンの出力最大値と、アナログ処理回路の最大出力レンジとに基づいて、各階層毎に算出される。アナログ処理回路の最大出力レンジは、各階層のニューロンの出力値が必ずメモリスタの書込閾値電圧よりも小さくなるように設定されている。そのため、スケーリングファクターによってメモリスタのコンダクタンスを修正することにより、ニューロンの出力値は、設定されたアナログ処理回路の最大出力レンジの範囲に収まる可能性を高めることができ、さらに、メモリスタの書込閾値電圧を超えないようにすることができる。

また、調整ステップの他の例として、調整ステップ（Ｓ２００〜Ｓ２４０）は、メモリスタ及びアナログ処理回路を用いて構築された多層ニューラルネットワークにおいて学習が行われるときに、併せて実行され、
アナログ処理回路は、演算増幅器と、当該演算増幅器の出力と反転入力端子とを接続し、演算増幅器による増幅度を決定するフィードバック抵抗（Ｒ）と、を含み、フィードバック抵抗としてメモリスタが使用され、
調整ステップは、
各階層のニューロンの出力値を検出する検出ステップ（Ｓ２１０）と、
検出ステップによって検出された各階層のニューロンの出力値が、メモリスタの書込閾値電圧に基づいて定められた所定のレンジ上限を超えているか否かを判定する判定ステップ（Ｓ２２０）と、
レンジ上限を超えた出力値を持つニューロンに対応するアナログ処理回路において、フィードバック抵抗としてのメモリスタの抵抗値を変更して、ニューロンの出力値をレンジ上限以下に低下させる変更ステップ（Ｓ２３０）と、を含むようにすることができる。

上記のように、メモリスタ及びアナログ処理回路を用いて構築された多層ニューラルネットワークにおいて学習が行われるときに、併せて調整ステップも実行する場合、メモリスタのコンダクタンス（重み）は学習によって変更される。従って、調整ステップとして、メモリスタのコンダクタンスを修正することはできない。そのため、アナログ処理回路に、演算増幅器と、メモリスタからなるフィードバック抵抗を設け、出力値がレンジ上限を超えた出力値を持つニューロンに対応するアナログ処理回路において、フィードバック抵抗としてのメモリスタの抵抗値を変更する。このようにしても、ニューロンの出力値が、設定されたアナログ処理回路の最大出力レンジの範囲に収まる可能性を高めることができ、さらに、メモリスタの書込閾値電圧を超えないようにすることができる。

上記括弧内の参照番号は、本発明の理解を容易にすべく、後述する実施形態における具体的な構成との対応関係の一例を示すものにすぎず、なんら本発明の範囲を制限することを意図したものではない。

また、上述した特徴以外の、特許請求の範囲の各請求項に記載した技術的特徴に関しては、後述する実施形態の説明及び添付図面から明らかになる。

実施形態による多層ニューラルネットワークの構造の一例を概念的に示す図である。図１の多層ニューラルネットワークを、クロスバー回路を用いて具現化した場合の構成を示す構成図である。クロスバー回路について説明するための説明図である。クロスバー回路について説明するための別の説明図である。クロスバー回路について説明するためのさらに別の説明図である。第１コンボリューション層の各出力ニューロンの出力値の中の最大出力の振幅を示すグラフである。第２コンボリューション層の各出力ニューロンの出力値の中の最大出力の振幅を示すグラフである。第３コンボリューション層の各出力ニューロンの出力値の中の最大出力の振幅を示すグラフである。第４コンボリューション層の各出力ニューロンの出力値の中の最大出力の振幅を示すグラフである。第５コンボリューション層の各出力ニューロンの出力値の中の最大出力の振幅を示すグラフである。第６コンボリューション層の各出力ニューロンの出力値の中の最大出力の振幅を示すグラフである。第７コンボリューション層の各出力ニューロンの出力値の中の最大出力の振幅を示すグラフである。第１実施形態によるニューロンの出力レベルを調整するための処理を示したフローチャートである。修正フィルタ重み及び修正バイアス入力を用いた場合に、各コンボリューション層の出力ニューロンから出力される最大出力の振幅の一例を示すグラフである。第２実施形態によるニューロンの出力レベルを調整するための処理を示したフローチャートである。

（第１実施形態）
以下、本発明に係る多層ニューラルネットワークのニューロンの出力レベル調整方法の第１実施形態を図面を参照して説明する。なお、本実施形態では、多層ニューラルネットワークとしていわゆる畳み込みニューラルネットワーク（Convolution Neural Network）を採用し、入力データとしての画像を、複数のカテゴリに分類する用途に適用した例について説明する。ただし、本発明は、いわゆる入力層、中間層、及び出力層からなる通常の多層ニューラルネットワークに適用することも可能である。また、多層ニューラルネットワークの用途として、上述した入力画像の分類の他、画像以外のパターン認識、情報圧縮、運動制御、雑音除去、時系列予測などが挙げられる。

図１は、本実施形態による畳み込みニューラルネットワーク２０の構造の一例を概念的に示している。畳み込みニューラルネットワーク２０は、基本的に、コンボリューション層とプーリング層とを交互に接続した構造を有する。例えば、図１に示す例では、畳み込みニューラルネットワーク２０は、第１コンボリューション層２１、第２コンボリューション層２２、第３コンボリューション層２３、第４コンボリューション層２４、第５コンボリューション層２５、第６コンボリューション層２６、及び、第７コンボリューション層２７からなる７層のコンボリューション層を有している。そして、第２コンボリューション層２２と第３コンボリューション層２３との間に、第１プーリング層２８が設けられ、第４コンボリューション層２４と第５コンボリューション層２５との間に、第２プーリング層２９が設けられている。

このように、畳み込みニューラルネットワーク２０においては、コンボリューション層の次に必ずプーリング層が接続されるとは限らず、複数のコンボリューション層を接続した後に、プーリング層が接続されることもある。また、コンボリューション層２１〜２７及びプーリング層２８〜２９の層数は、図１に示す例に限られない。一般的には、コンボリューション層２１〜２７及びプーリング層２８〜２９の層数を増やすほど、認識性能をより向上させることができる。

第１〜第７コンボリューション層２１〜２７は、それぞれ入力される入力データ（画像）に対して、所定のサイズ（例えば３×３、５×５）を有するフィルタを畳み込む演算を行う。入力データとしての画像は、２次元に配列された入力値（ピクセル値）を有する。各コンボリューション層２１〜２７におけるフィルタの畳み込み演算は、一般的な画像処理でのフィルタの畳み込み、すなわち、小サイズの画像（フィルタ）を入力画像に２次元的に畳み込んで、画像をぼかしたり、エッジを強調したりするものと基本的に同じである。

具体的には、第１〜第７コンボリューション層２１〜２７では、フィルタの畳み込み演算として、フィルタとしての小サイズの画像の各ピクセル値（重み）と、入力データとしての画像におけるフィルタと同サイズの領域の各ピクセル値とをそれぞれ掛け合わせた各乗算結果を積算する。この際、入力データが複数枚の画像を含む場合には、それら複数枚の入力画像の同じ領域において同じフィルタによる畳み込み演算が行われ、それらの畳み込み演算による演算結果がさらに積算される。このようにして計算された積算結果は、ReLUなどの活性化関数を経て、各コンボリューション層２１〜２７のフィルタ位置に対応する出力値となる。

フィルタは、所定のストライドで入力データとしての画像上をシフトされていき、各シフト位置において、上述した畳み込み演算が繰り返し行われる。これにより、各コンボリューション層２１〜２７において、入力画像全体に渡ってそれぞれのフィルタのシフト位置に応じた出力値が作成される。それらの出力値を、フィルタのシフト位置に対応するように２次元的にまとめた結果が、各コンボリューション層２１〜２７による出力データとなり、次の階層の入力データとなる。

このように、各コンボリューション層２１〜２７の出力データは、それぞれ２次元的に配列される画像の形を取り、一般的には特徴マップと呼ばれる。この特徴マップは、各コンボリューション層２１〜２７において使用されるフィルタの数と同じ数だけ生成される。このため、通常は、第２コンボリューション層２２以降の各コンボリューション層２２〜２７には、複数枚の入力画像（特徴マップ）を含む入力データが入力される。また、第１コンボリューション層２１においても、入力画像がカラー画像である場合には、ＲＧＢに対応する３枚の画像が入力される。一方、入力画像がグレースケール画像である場合には、第１コンボリューション層２１には、１枚の画像が入力されるだけである。

なお、本実施形態では、第６、第７コンボリューション層２６、２７において使用されるフィルタのサイズは１×１に設定されている。つまり、第６、第７コンボリューション層２６、２７では、各入力画像における同じ位置のピクセル値が、フィルタによる重みを掛け合わされた上で加算される、１×１の畳み込み演算が行われる。これら第６、第７コンボリューション層２６、２７として、いわゆる全結合層を用いることも可能であるが、本実施形態では、第６、第７コンボリューション層２６、２７を含む各コンボリューション層２１〜２７における畳み込み演算を、後述するクロスバー回路を用いてアナログ領域において実行するために、上述したように１×１の畳み込み演算を行うコンボリューション層を採用している。全結合層を採用すると、入力バーの数が過大となり、１つのクロスバー回路で対応することが困難になるためである。クロスバー回路に関しては、後に詳細に説明する。

本実施形態では、上述したように、活性化関数として、ReLUを用いる。ReLUは、max(0,x)により定義される関数である。このように出力値に上限値が定められていないReLUを用いることにより、計算が速い、勾配損失しない、スパース性の高さに繋がる、などのメリットが得られる。ただし、活性化関数はReLUに限られず、ReLUと類似する近似関数(f=log(1+e^x))、leaky ReLU(f=max(0.01 x,x))、Parametric ReLU(f=max(ax,x))、複数の線形関数の中での最大値を関数の値として採用するmaxoutなどを用いても良い。

また、上述したフィルタの重みは学習によって決定される。学習は、本実施形態では、畳み込みニューラルネットワーク２０を、一旦コンピュータ上に構築して、教師あり学習により行われる。学習の対象は、上述したフィルタの重みの他、後述するバイアス入力に対する重みの大きさが含まれる。

第１、第２プーリング層２８、２９は、入力画像のどの位置でフィルタとの適合性が高かったかを示す情報の一部を捨てることにより、入力画像内に現れる特徴の位置変化に対する不変性を高めるとともに、画像のサイズを縮小して後の計算量を削減できるようにするためのものである。

具体的には、第１、第２プーリング層２８、２９は、入力画像に対して所定のサイズ（２×２、３×３など）のウインドウを定め、そのウインドウ内の入力値（ピクセル値）を平均化（平均プーリング）したり、ウインドウ内の入力値の最大値を採用（最大プーリング）したりすることにより、入力画像の複数の入力値をまとめる。このプーリング演算では、プーリングの対象範囲を定めるウインドウが重ならないように、ウインドウが行方向及び列方向にシフトされる。ただし、プーリング範囲を定めるウインドウが一部重なるように、ウインドウをシフトさせても良い。また、このようなプーリングは、各入力画像（特徴マップ）毎に行われるので、プーリング前後の入力画像の枚数は不変である。

出力層３０は、例えば、ソフトマックス関数による正規化により、分類すべき複数のカテゴリ毎に、入力データ１０としての画像が属する確率を出力するように構成される。従って、出力層３０が出力する確率の中で最も高い確率に対応するカテゴリを選択することにより、入力データ１０としての画像を、複数のカテゴリに分類することができる。

次に、上述した構造を有する畳み込みニューラルネットワーク２０を、クロスバー回路及びＣＭＯＳ素子の集積回路によって構成されるアナログ処理回路を用いて具現化するための構成について図２を参照して説明する。図２に示すように、畳み込みニューラルネットワーク２０を具現化するための構成要素として、本実施形態では、主に、マイクロコンピュータ４０、Ｄ／Ａ変換回路４３、クロスバー回路４４、及びＡ／Ｄ変換回路４５を備えている。

最初に、クロスバー回路４４について、図３〜図５に基づいて説明する。クロスバー回路４４は、例えば、抵抗変化型メモリであるメモリスタが組み込まれたハイブリッドＣＭＯＳ回路として構成される。このクロスバー回路４４は、メモリスタにより入力信号に重みを付与するとともに、各ニューロン毎に、それぞれのニューロンに入力される、重みが付与された入力信号を加算し、その加算結果を活性化関数を通して出力値を生成する処理をアナログ領域で行うアナログ処理回路である。

図３に示すように、クロスバー回路４４は、複数の入力バー５０と、複数の出力バー５１、５２と、入力信号に重み付与する複数のメモリスタ５３と、複数の差動演算増幅器５４とを有する。複数の入力バー５０には、マイクロコンピュータ４０によって、入力画像における、上述したフィルタと同サイズの領域の各ピクセル値に対応する入力信号（電圧信号）が入力される。複数の出力バー５１、５２は、複数の入力バー５０とそれぞれ交差するように設けられる。

これらの入力バー５０及び出力バー５１、５２は、図４に示すように、ＣＭＯＳ素子が形成されたＣＭＯＳ基板上に形成され得る。この場合、入力バー５０には、ＣＭＯＳ素子からなる入力ニューロン５５を介して、上述したピクセル値に対応する電圧信号が入力されるように構成される。入力バー５０と出力バー５１との交点には、入力信号に重みを付与するメモリスタ５３が設けられ、入力バー５０と出力バー５１とは、メモリスタ５３を介して接続されている。

メモリスタ５３は、印加電圧や通電電流によって、最小値と最大値との間で、異なる抵抗状態に設定することが可能な抵抗変化型メモリである。例えば、メモリスタ５３のコンダクタンスは、図示しない電圧印加回路を用いて、負の書込電圧を印加することにより増加させることができ、正の書込電圧を印加することにより減少させることができる。そして、メモリスタ５３は、正負の書込電圧以上の電圧が印加されない限り、設定された抵抗状態（コンダクタンス）を維持する。このようなメモリスタ５３として使用可能な素子としては、Pt/TiO2/Pt金属酸化物素子、相変化メモリ、磁気トンネル接合メモリ、などがある。

図４に示す構成を、電気回路的に示すと図５のようになる。図５に示すように、出力バー５１に接続される出力ニューロン５６を構成するＣＭＯＳ素子によって演算増幅器が形成されている。さらに、この演算増幅器の入出力間に抵抗Ｒが接続されることにより、加算器５７が構成されている。このため、図５に示すように、入力ニューロン５５から入力バー５０にそれぞれ入力された電圧信号Ｖ１、Ｖ２は、メモリスタ５３によるコンダクタンスＧ１、Ｇ２がそれぞれ掛け合わされた上で、出力バー５１に接続された加算器５７において加算される。なお、この加算結果は、加算器５７にてＲ倍される。このようにして、出力ニューロン５６において、以下の数式１に示すように、各入力バー５０の電圧信号Ｖ１、Ｖ２、…と、メモリスタ５３のコンダクタンスＧ１、Ｇ２との乗算結果が積算され、さらにＲ倍された結果が得られる。
（数１）
出力ニューロンの出力電圧＝ＲΣＶｉＧｉ
図３に示すように、出力バー５１は、差動演算増幅器５４の非反転入力端子に接続され、出力バー５２は、差動演算増幅器５４の反転入力端子に接続されている。差動演算増幅器５４は、ＣＭＯＳ基板内のＣＭＯＳ素子を用いて構成され得る。なお、図３においては、図５に示した加算器５７は省略されている。さらに、図３では、上述した活性化関数としての処理を行う活性化関数処理回路も省略されている。実際には、加算器５７は差動演算増幅器５４の入力側において、出力バー５１，５２のそれぞれに設けられ、活性化関数処理回路は差動演算増幅器５４の出力側に設けられる。このように、ＣＭＯＳ素子によって構成される集積回路には、加算器５７、差動演算増幅器５４、及び活性化関数処理回路などが含まれる。

本実施形態では、差動演算増幅器５４の非反転入力端子及び反転入力端子に、それぞれ出力バー５１、５２を接続しているので、フィルタとして、正の重みだけでなく、負の重みも利用して畳み込み演算を行うことが可能になる。すなわち、ある入力信号に対して正の重みを掛け合わせる場合には、非反転入力端子に接続された出力バー５１と入力バー５０との間に設けられたメモリスタ５３のコンダクタンスを、反転入力端子に接続された出力バー５２と入力バー５０との間に設けられたメモリスタ５３のコンダクタンスよりも、設定しようとしている正の重み分だけ大きく設定すれば良い。逆に、ある入力信号に対して負の重みを掛け合わせる場合には、反転入力端子に接続された出力バー５２と入力バー５０との間に設けられたメモリスタ５３のコンダクタンスを、非反転入力端子に接続された出力バー５１と入力バー５０との間に設けられたメモリスタ５３のコンダクタンスよりも、設定しようとしている負の重み分だけ大きく設定すれば良い。

従って、本実施形態では、図３に示すように、２本の出力バー５１、５２を１組として、その１組の出力バー５１、５２と入力バー５０との間のメモリスタ５３に対して、該当するコンボリューション層２１〜２７において使用される、それぞれのフィルタ１、２、３、…に対応する重みが設定される。

マイクロコンピュータ４０は、ＣＰＵ４１、ＲＡＭ４２、ＲＯＭなどを備え、例えば、ＲＯＭに記憶されたプログラムに従い、種々の処理を実施する。なお、以下においては、第１コンボリューション層２１を対象とした処理について説明するが、マイクロコンピュータ４０は、他のコンボリューション層２２〜２７に対しても原則として同様の処理を行なう。

まず、マイクロコンピュータ４０は、入力データ１０としての画像において、フィルタの畳み込み演算を行う領域を定め、その領域に含まれる各ピクセルのピクセル値に応じたデジタル信号をＤ／Ａ変換回路４３に出力する。これにより、Ｄ／Ａ変換回路４３は、畳み込み演算が行われる領域の各ピクセル値に応じたアナログ信号（電圧信号）をクロスバー回路４４へ出力する。

さらに、マイクロコンピュータ４０は、クロスバー回路４４における演算処理が終了して、出力が出されるタイミングで、Ａ／Ｄ変換回路４５からの出力を取り込む処理を実行する。この際、Ａ／Ｄ変換回路４５は、第１コンボリューション層２１において使用されるフィルタ数と同数の、あるフィルタのシフト位置での畳み込み演算、活性化関数による処理を経た出力値をデジタル信号に変換して出力している。マイクロコンピュータ４０は、Ａ／Ｄ変換回路４５から出力されたデジタル信号を、複数のフィルタ毎に区別して、ＲＡＭ４２にそれぞれ格納する。

そして、マイクロコンピュータ４０は、入力画像において、フィルタの畳み込み演算を行う領域を所定のストライドだけシフトさせ、そのシフト後の領域に含まれるピクセル値に対応するデジタル信号をＤ／Ａ変換回路４３に出力するとともに、上述したのと同様の処理を行う。これを、入力画像のすべての領域でフィルタのシフトが完了するまで繰り返す。これにより、第１コンボリューション層２１により作成された、フィルタ数と同数の特徴マップを示すデジタルデータがＲＡＭ４２に保存される。

次に、本実施形態の技術的特徴について説明する。上述したように、本実施形態では、畳み込みニューラルネットワーク２０がコンピュータ上に構築され、一般的な勾配降下法、誤差逆伝播法などの手法を用いて、フィルタの重みやバイアス入力の大きさが学習される。この学習により、各コンボリューション層２１〜２７におけるフィルタ重みやバイアス入力に対する重みは最適化されていく。

その一方で、学習が終了した時点での、各コンボリューション層２１〜２７の出力値のレベルは、相互に大きく相違する。特に、ReLUのような、出力値に上限値が定められていない活性化関数を用いた場合、出力層に近い上位層のニューロンほど出力値が増大する傾向が生じるため、各コンボリューション層２１〜２７の出力値のレベル差が大きくなりやすい。

各コンボリューション層２１〜２７のニューロンの出力値のレベル差の一例が、図６〜図１２に示されている。図６〜図１２は、多層ニューラルネットワーク２０に、ある画像が入力された場合の、各コンボリューション層２１〜２７に属する出力ニューロン５６の最大出力振幅をプロットしたものである。なお、各コンボリューション層２１〜２７の出力レベルが異なるだけでなく、同じコンボリューション層２１〜２７に属する出力ニューロン５６に関しても、出力レベルが大きく変動するため、図６〜図１２の縦軸は対数目盛としている。

第１及び第２コンボリューション層２１、２２には、９６個のフィルタが設定されている。そのため、第１及び第２コンボリューション層２１、２２は、９６個のフィルタに対応する９６個の出力ニューロン５６を有する。この９６個の出力ニューロン５６からは、上述したように、フィルタのシフト位置毎に出力値が出力される。図６は、所定の出力値（電圧値）を単位として、第１コンボリューション層２１の各出力ニューロン５６の出力値の中の最大出力の振幅を示したものである。図６に示すように、第１コンボリューション層２１に属する出力ニューロン５６の最大出力は、約２．５〜約１５の範囲に分散している。図７は、第２コンボリューション層２２に属する出力ニューロン５６の最大出力振幅を示している。図７に示すように、第２コンボリューション層２２に属する各々の出力ニューロン５６の最大出力は、約１５〜約５０の範囲に分散している。

第３〜第６コンボリューション層２３〜２６には、それぞれ、１９２個のフィルタが設定されている。そのため、第３〜第６コンボリューション層２３〜２６は、１９２個の出力ニューロン５６を有する。そして、第３コンボリューション層２３に属する各々の出力ニューロン５６の最大出力は、図８に示すように、約１５〜約６５の範囲に分散している。第４コンボリューション層２４に属する各々の出力ニューロン５６の最大出力は、図９に示すように、約２５〜約１１０の範囲に分散している。第５コンボリューション層２５に属する各々の出力ニューロン５６の最大出力は、図１０に示すように、約１８〜約８０の範囲に分散している。第６コンボリューション層２６に属する各々の出力ニューロン５６の最大出力は、図１１に示すように、約２〜約７０の範囲に分散している。

第７コンボリューション層２７は、分類すべきカテゴリ数に応じた１０個の出力ニューロン５６を有する。この第７コンボリューション層２７に属する各々の出力ニューロン５６の最大出力は、図１２に示すように、約２８０〜約６００の範囲に分散している。

以上のように、各コンボリューション層２１〜２７が有する出力ニューロン５６の最大出力には、２００倍以上の開きがある。さらに、同じコンボリューション層２１〜２７に属する出力ニューロンの最大出力も、数倍から数十倍の開きがある。

ここで、本実施形態では、上述したように、活性化関数としての処理を行う活性化関数処理回路は、アナログ処理回路の一部として、ＣＭＯＳ素子から構成される集積回路内に設けられる。従って、活性化関数処理回路は、その回路構成や、回路素子の特性に応じて、出力可能な範囲である出力レンジが規制されることになる。そのため、上述した範囲で最大出力が分散するケースでは、出力レンジに収まらず、出力値が飽和してしまう可能性がある。出力値が飽和した場合、活性化関数処理回路は、正しい出力値を出力することができなくなってしまう。

また、クロスバー回路４４のメモリスタ５３は、前層の出力ニューロン５６によって過大な出力値が生成され、その出力値に応じた入力値が入力された場合、書き込み閾値以上の電圧が印加されてコンダクタンスが変化してしまう可能性が生じる。メモリスタ５３のコンダクタンスが変化してしまった場合、入力値に対して付与すべき重みを付与することができなくなってしまう。

そこで、本実施形態では、学習したフィルタの重みやバイアス入力に対する重みを、そのままクロスバー回路４４のメモリスタ５３に設定するのではなく、各出力ニューロンの出力レベルが適正となるように修正した上で用いることとした。以下、本実施形態における、ニューロンの出力レベルの調整手法について、図１３のフローチャートを参照して説明する。なお、図１３のフローチャートに示す処理は、多層ニューラルネットワークとしての畳み込みニューラルネットワーク２０を構築したコンピュータにおいて実行される。

まず、ステップＳ１００では、コンピュータ上に構築した畳み込みニューラルネットワーク２０に対して、勾配降下法、誤差逆伝播法などの手法を適用し、各コンボリューション層２１〜２７のフィルタの重みやバイアス入力に対する重みの大きさを学習する。なお、本実施形態では、各層のバイアス入力の大きさを所定値（例えば、１）としている。

学習の終了後、ステップＳ１１０において、フィルタ重みやバイアス入力に対する重みが最適化された、コンピュータ上に構築された畳み込みニューラルネットワーク２０にある画像を入力したときの、各コンボリューション層２１〜２７の出力ニューロン５６から出力される出力値を検出する。この際、複数枚の画像を入力して、各層の出力ニューロン５６の出力値を検出するようにしても良い。

そして、ステップＳ１２０において、各コンボリューション層２１〜２７の各出力ニューロン５６の出力値の中の最大出力を、出力ニューロン５６毎に選択する。さらにステップＳ１２０では、コンボリューション層２１〜２７毎に、それぞれのコンボリューション層２１〜２７に含まれる各出力ニューロン５６の最大出力の中の最大値に基づいて、各コンボリューション層２１〜２７での出力ニューロン５６の出力最大値を決定する。

続くステップＳ１３０では、ステップＳ１２０で決定した出力最大値と、活性化関数処理回路の最大出力レンジとに基づいて、各コンボリューション層２１〜２７毎に、スケーリングファクターを算出する。このスケーリングファクターの算出は、第１コンボリューション層２１から第７コンボリューション層２７へと順番に実行される。

活性化関数処理回路の最大出力レンジは、活性化関数処理回路の出力が最大出力レンジの上限値となった場合であっても、次の階層への入力電圧がメモリスタ５３の書込閾値電圧（例えば、０．９Ｖ）以上とならないように設定される。例えば、活性化関数処理回路の最大出力レンジは、０．５Ｖ未満の範囲で設定され、本実施形態では、０．２Ｖとしている。このように、最大出力レンジを、メモリスタ５３の書込閾値電圧に対してマージンを持った０．５Ｖ未満に設定することにより、入力画像に応じて、各コンボリューション層２１〜２７の出力最大値が、ステップＳ１２０にて決定した出力最大値を超えることがあったとしても、メモリスタ５３の書込閾値電圧までは達しないようにすることができる。

第１コンボリューション層２１用の第１層スケーリングファクターは、例えば、下記の数式２に従って算出される。
（数２）
Scaling_factor_layer1=maximum neuron output_layer1/max_range
このように、第１コンボリューション層２１に含まれる出力ニューロン５６の最も大きな出力値に相当する値を第１層出力最大値とし、この第１層出力最大値を、活性化関数処理回路の最大出力レンジで除算して第１層スケーリングファクターを算出する。

次に、第２コンボリューション層２２用の第２層スケーリングファクターは、例えば、下記の数式３に従って算出される。
（数３）
Scaling_factor_layer2
=(maximum neuron output_layer2/max_range)/Scaling_factor_layer1
このように、第２層スケーリングファクターは、第２コンボリューション層２２に含まれる出力ニューロン５６の最も大きな出力値に相当する第２出力最大値を、活性化関数処理回路の最大出力レンジで除算した結果を、第１層スケーリングファクターで除算して算出する。

つまり、第１コンボリューション層２１の各出力ニューロン５６の出力値は、後述するステップＳ１４０の処理により第１層スケーリングファクターによって適正範囲に修正（縮小）される。このため、第２コンボリューション層２２に入力される入力値は、第１層スケーリングファクターによる修正の影響を受ける。そこで、第２層スケーリングファクターは、上述したように第１スケーリングファクターを加味して算出される。

第３〜第７コンボリューション層２３〜２７用の各スケーリングファクターも、同様に下位の階層のスケーリングファクターを加味して、例えば、下記の数式４に従って算出される。
（数４）
Scaling_factor_layerN
=(maximum neuron output_layerN／max_range)/(Scaling_factor_layer1*・・・
*Scaling_factor_layerN-1)
このように、第３〜第７コンボリューション層２３〜２７の上位階層のスケーリングファクターは、それよりも下位階層のスケーリングファクターを累積的に考慮した上で算出される。

各層のスケーリングファクターの算出が完了すると、ステップＳ１４０の処理に進む。ステップＳ１４０では、ステップＳ１００において学習された、各コンボリューション層２１〜２７のフィルタの重みやバイアス入力に対する重みの大きさを、ステップＳ１３０で算出した各層のスケーリングファクターを用いて修正する。具体的には、各コンボリューション層２１〜２７毎に、下記の数式５、数式６に示されるように、学習されたオリジナルのフィルタ重み及びバイアス入力に対する重みを、対応するスケーリングファクターで除算することにより、修正フィルタ重み及び修正バイアス入力重みを算出する。
（数５）
W_{scaled_layerN}=W_{original_layerN}/Scaling_factor_layerN
（数６）
W_Bias_{scaled_layerN=}W_Bias_{original_layerN}/(Scaling_factor_layerN*Scaling_factor_layer (N-1)*・・・* Scaling_factor_layer2*Scaling_factor_layer1)
修正フィルタ重み及び修正バイアス入力重みに関する情報は、図示しないコンダクタンス設定装置に提供される。コンダクタンス設定装置は、各コンボリューション層２１〜２７のクロスバー回路４４の入力バー５０と出力バー５１、５２との間にメモリスタ５３の書込閾値電圧以上の電圧を印加して、それぞれのメモリスタ５３に修正したフィルタ重み及び修正バイアス入力重みに対応するコンダクタンスを設定する。

上述したようにして、各層のスケーリングファクターを算出し、そのスケーリングファクターを用いて、各層のフィルタ重み及びバイアス入力に対する重みを修正することにより、各層の出力ニューロン５６の出力値が、設定されたアナログ処理回路の最大出力レンジの範囲に収まる可能性を高めることができ、さらに、メモリスタ５３の書込閾値電圧を超えないようにすることができる。

なお、本実施形態において活性化関数として用いるＲｅＬＵは、正の範囲において、線形な関数であるため、フィルタの重みやバイアス入力をスケーリングファクターによって修正しても、認識性能に悪影響を与えることはない。

修正フィルタ重み及び修正バイアス入力重みを用いた場合に、各コンボリューション層２１〜２７の出力ニューロン５６から出力される最大出力の振幅を調べた結果を図１４のグラフに示す。図１４には、各コンボリューション層２１〜２７の出力ニューロン５６の最大出力の振幅が重ねて示されている。

図１４から理解されるように、いずれの層の出力ニューロン５６の出力の振幅も、０〜２の範囲に収まっている。図１４に示す例では、最大出力振幅の単位は、電圧値に換算すると０．１Ｖに対応するように定めている。従って、図１４の例では、各層の出力ニューロン５６の出力値は、電圧換算でいずれも０．２Ｖまでの範囲に収まっている。

上述した第１実施形態では、各コンボリューション層２１〜２７の出力最大値を、各コンボリューション層２１〜２７に含まれる出力ニューロン５６の最も大きな出力値に相当する値として算出した。しかしながら、各コンボリューション層２１〜２７の出力最大値の算出方法は、これに限られない。

例えば、各コンボリューション層２１〜２７の出力最大値は、下記の数式７に示すように、各層に含まれる複数の出力ニューロン５６のそれぞれの出力値の最大値を平均化した平均値に対しＭσ（Ｍは実数、σは標準偏差）を加えた値として算出しても良い。
（数７）
第Ｎ層出力最大値=mean value of maximum neuron outputs_layerN+Mσ
標準偏差σの大きさは、単数又は複数の画像を畳み込みニューラルネットワーク２０に入力したときの各出力ニューロン５６の最大出力の分布から算出することができる。また、標準偏差σは、各層毎に算出されることが好ましい。標準偏差σに乗じる実数Ｍは、安全なマージンを確保するため、例えば３〜６の範囲で選択されることが好ましい。

このような算出手法を採用した場合であっても、各コンボリューション層２１〜２７の出力最大値を適切に算出することができる。
（第２実施形態）
次に、本発明に係る多層ニューラルネットワークのニューロンの出力レベル調整方法の第２実施形態について説明する。

上述した第１実施形態では、まず、コンピュータ上に構築された畳み込みニューラルネットワーク２０に対して、フィルタの重みやバイアス入力の大きさの学習を行った。次いで、学習後の畳み込みニューラルネットワーク２０において、各コンボリューション層２１〜２７の出力ニューロン５６の出力値を検出し、その出力値に基づいて、各出力ニューロン５６の出力レベルを調整するためのスケーリングファクターを算出した。

しかしながら、畳み込みニューラルネットワーク２０の学習は、クロスバー回路４４を用いて具現化した構成にて実施することも可能である。本実施形態では、クロスバー回路４４を用いて具現化した畳み込みニューラルネットワーク２０において学習を行うとともに、その学習が行われるときに、併せて各コンボリューション層２１〜２７の出力ニューロン５６の出力レベルの調整を実行するものである。

以下に、クロスバー回路４４を用いて具現化した畳み込みニューラルネットワーク２０の学習の概要を説明する。

クロスバー回路４４を用いて具現化した畳み込みニューラルネットワーク２０に、教師データ（例えば、０から９までの手書きの数字のＭＮＩＳＴデータセット）を入力する。そして、畳み込みニューラルネットワーク２０からのアナログ出力電圧ｙを計測する。このアナログ出力電圧ｙを用いて、誤認識率（例えばＭＮＩＳＴカテゴリ分類の誤認識率）に対応する、目標アナログ出力電圧ｔａｒｇｅｔと実際のアナログ出力電圧ｙとの差ｅ＝ｔａｒｇｅｔ−ｙを算出する。これは、畳み込みニューラルネットワーク２０内の信号の順伝播に相当する。

そして、畳み込みニューラルネットワーク２０の出力側から誤認識率ｅ＝ｔａｒｇｅｔ−ｙに対応する電圧信号を入力して、畳み込みニューラルネットワーク２０の入力側から出力される出力電圧を測定する。これは、畳み込みニューラルネットワーク２０内の信号の逆伝播に相当する。ただし、逆伝播における電圧信号は、アナログ処理回路において、活性化関数処理回路をバイパスして、微分活性化関数処理回路で変換されつつ伝播するようにする。微分活性化関数処理回路とは、活性化関数を微分した関数を具現化する回路である。

そして、順伝播において得られた誤認識率と、逆伝播において得られた出力電圧とに基づいて、クロスバー回路４４の各メモリスタ５３のコンダクタンスについて、コンダクタンス更新量を算出する。さらに、コンダクタンス更新量を実現するために、各メモリスタ５３に印加すべき書込電圧を算出する。このようなニューラルネットワークの学習における順伝播及び逆伝播、並びにこれらに基づいたコンダクタンスの更新量の算出方法は、本願発明者による特許文献１等に詳細に記載されているため、これ以上の説明は省略する。

上述したように、クロスバー回路４４を用いて具現化した畳み込みニューラルネットワーク２０において学習が行われる場合、クロスバー回路４４のメモリスタ５３のコンダクタンス（重み）は学習によって変更される。従って、第１実施形態のように、各コンボリューション層２１〜２７の出力ニューロン５６の出力レベルを調整するために、各メモリスタ５３のコンダクタンスを修正することはできない。

そこで、本実施形態では、アナログ処理回路内に設けられた、図５に示す加算器５７や、図３に示す差動演算増幅器５４を利用して、各層の出力ニューロン５６の出力レベルを調整する。以下に、図１５のフローチャートを用いて、本実施形態による、ニューロンの出力レベル調整方法について詳しく説明する。図１５のフローチャートに示す処理は、マイクロコンピュータ４０によって実行される。

なお、以下の説明では、各層の出力ニューロン５６の出力レベル調整のために、図５に示す加算器５７を利用する例について説明する。この場合、加算器５７のフィードバック抵抗Ｒは、例えばメモリスタによって構成され、そのフィードバック抵抗Ｒの大きさを変更することが可能となっている。

図１５のフローチャートのステップＳ２００では、上述した教師データを用いた学習が行われる。続くステップＳ２１０では、各コンボリューション層２１〜２７の出力ニューロン５６の出力値が検出される。

ステップＳ２２０では、検出された出力ニューロン５６の出力値（つまり、活性化処理回路の出力値）が、メモリスタ５３の書込閾値電圧未満に設定されたアナログ処理回路の最大出力レンジの上限を超えたか否かを判定する。出力ニューロン５６の出力値が、アナログ処理回路の最大出力レンジの上限を超えたと判定すると、ステップＳ２３０の処理に進み、該当する出力ニューロン５６の出力値がレンジ上限未満となるように、加算器５７のフィードバック抵抗Ｒの大きさを調整（低下）する。その後、ステップＳ２４０において、学習が終了したか否かを判定し、終了していない場合には、ステップＳ２００からの処理を繰り返す。

上記のように本実施形態では、出力ニューロン５６の出力値がレンジ上限未満となるように加算器５７のフィードバック抵抗Ｒの大きさを調整する。このため、学習が終了したときには、各出力ニューロン５６の出力値が、設定されたアナログ処理回路の最大出力レンジの範囲に収まる可能性を高めることができ、さらに、メモリスタの書込閾値電圧を超えないようにすることができる。

フィードバック抵抗Ｒの調整は、上述した第１実施形態と同様に、畳み込みニューラルネットワーク２０の入力層に近い下位の階層の出力ニューロン５６から、出力層に近い上位の階層の出力ニューロン５６へと順番に行うことが好ましい。これにより、上位の階層の出力ニューロン５６では、下位の階層の出力ニューロン５６の出力レベルの調整結果を加味した上で、出力レベルの調整を行うことができる。

また、上記のように、下位の階層の出力ニューロン５６から、上位の階層の出力ニューロン５６へと順番に出力レベルの調整を行う場合、同じ階層に属するそれぞれの出力ニューロン５６に対するフィードバック抵抗Ｒの大きさの調整は個別に行っても良い。しかし、例えば、同じ階層に属する複数の出力ニューロン５６の中で、レンジ上限を超えた出力値の中で最も大きい出力値を選定し、その最も大きい出力値を最大出力レンジの上限未満に調整するために必要な分だけ、同じ階層に属する複数の出力ニューロンのフィードバック抵抗Ｒの大きさを一緒に調整するようにしても良い。

さらに、すべての階層の出力ニューロン５６に対応するアナログ処理回路に含まれるフィードバック抵抗Ｒの大きさを一緒に調整するようにしても良い。

また、加算器５７のフィードバック抵抗Ｒではなく、図３に示す差動演算増幅器５４の反転入力端子と出力端子との間に、メモリスタからなるフィードバック抵抗Ｒを接続し、差動演算増幅器５４のフィードバック抵抗Ｒを調整対象としても良い。さらに、調整幅の拡大のため、加算器５７のフィードバック抵抗Ｒと、差動演算増幅器５４のフィードバック抵抗Ｒとの両方を調整対象としても良い。

１０：入力データ
２０：多層ニューラルネットワーク（畳み込みニューラルネットワーク）
４０：マイクロコンピュータ
４４：クロスバー回路
５０：入力バー
５１、５２：出力バー
５３：メモリスタ
５４：差動演算増幅器
５５：入力ニューロン
５６：出力ニューロン
５７：加算器

Claims

多層ニューラルネットワーク（２０）の階層化されたニューロン（５６）間での信号の伝達及び前記ニューロンでの信号処理をアナログ領域で行うべく、伝達される信号に対してシナプスとしての重みを付与する抵抗変化型メモリであるメモリスタ（５３）と、前記ニューロンにおける信号処理として、それぞれ重みが付与された信号の加算、及び加算した信号から活性化関数に応じた出力値の生成を実行するアナログ処理回路（４４）とを備えた多層ニューラルネットワークのニューロンの出力レベル調整方法であって、
各階層のニューロンの出力値が、最も大きくなったときでも、前記メモリスタの書込閾値電圧未満であって、かつ活性化関数に応じた出力値の生成を実行するアナログ処理回路の、設定された最大出力レンジ内に収まるように、各階層のニューロンの出力レベルを調整する調整ステップ（Ｓ１１０〜Ｓ１４０、Ｓ２００〜Ｓ２４０）を備える多層ニューラルネットワークのニューロンの出力レベル調整方法。
前記活性化関数として、出力値に上限値が定められていない活性化関数が用いられる請求項１に記載の多層ニューラルネットワークのニューロンの出力レベル調整方法。
前記調整ステップ（Ｓ１１０〜Ｓ１４０）は、コンピュータ上に構築された多層ニューラルネットワークに対して実行され、
前記調整ステップは、
前記各階層のニューロンの出力値を検出する検出ステップ（Ｓ１１０）と、
前記検出ステップによって検出された前記各階層のニューロンの出力値に基づいて決定される前記各階層のニューロンの出力最大値と、前記活性化関数に応じた出力値の生成を実行する前記アナログ処理回路の最大出力レンジとに基づいて、各階層毎に、スケーリングファクターを算出する算出ステップ（Ｓ１２０、Ｓ１３０）と、
前記アナログ処理回路の最大出力レンジは、前記各階層のニューロンの出力値が前記メモリスタの書込閾値電圧よりも小さくなるように設定され、
前記算出ステップで算出された各階層毎のスケーリングファクターによって、それぞれ、対応する前記メモリスタのコンダクタンスを修正する修正ステップ（Ｓ１４０）と、を含み、
前記修正ステップによって修正されたコンダクタンスが、実際に前記メモリスタに設定される請求項２に記載の多層ニューラルネットワークのニューロンの出力レベル調整方法。
前記算出ステップでは、多層ニューラルネットワークの入力層に近い下位階層のニューロンから、出力層に近い上位階層のニューロンへと順番にスケーリングファクターが算出され、前記上位階層のニューロンに対するスケーリングファクターは、それよりも下位階層のニューロンに対するスケーリングファクターを累積的に考慮した上で算出される請求項３に記載の多層ニューラルネットワークのニューロンの出力レベル調整方法。
前記算出ステップでは、各階層毎に、それぞれの階層に含まれる各ニューロンの出力値の中の最大値に基づいて、前記各階層のニューロンの出力最大値が決定される請求項３又は４に記載の多層ニューラルネットワークのニューロンの出力レベル調整方法。
前記算出ステップでは、各階層毎に、それぞれの階層に含まれる複数のニューロンの各々の出力値の最大値を平均化した平均値に対しＮσ（Ｎは整数、σは標準偏差）を加えた値から、前記各階層のニューロンの出力最大値が決定される請求項３又は４に記載の多層ニューラルネットワークのニューロンの出力レベル調整方法。
コンピュータ上に構築された多層ニューラルネットワークの学習が行われた後に、前記調整ステップが実行される請求項３乃至６のいずれかに記載の多層ニューラルネットワークのニューロンの出力レベル調整方法。
前記アナログ処理回路では、前記メモリスタのコンダクタンスによる重みが付与された信号を加算する際に、併せて重みが付与されたバイアス入力も加算し、
前記修正ステップでは、前記算出ステップで算出された各階層毎のスケーリングファクターによって、それぞれ、対応するバイアス入力に対する重みも修正する請求項３乃至７のいずれかに記載の多層ニューラルネットワークのニューロンの出力レベル調整方法。
前記調整ステップ（Ｓ２００〜Ｓ２４０）は、前記メモリスタ及び前記アナログ処理回路を用いて構築された多層ニューラルネットワークにおいて学習が行われるときに、併せて実行され、
前記アナログ処理回路は、演算増幅器と、当該演算増幅器の出力と反転入力端子とを接続し、前記演算増幅器による増幅度を決定するフィードバック抵抗（Ｒ）と、を含み、前記フィードバック抵抗としてメモリスタが使用され、
前記調整ステップは、
前記各階層のニューロンの出力値を検出する検出ステップ（Ｓ２１０）と、
前記検出ステップによって検出された前記各階層のニューロンの出力値が、前記メモリスタの書込閾値電圧に基づいて定められた所定のレンジ上限を超えているか否かを判定する判定ステップ（Ｓ２２０）と、
前記レンジ上限を超えた出力値を持つニューロンに対応する前記アナログ処理回路において、前記フィードバック抵抗としての前記メモリスタの抵抗値を変更して、ニューロンの出力値を前記レンジ上限以下に低下させる変更ステップ（Ｓ２３０）と、を含む請求項１又は２に記載の多層ニューラルネットワークのニューロンの出力レベル調整方法。
前記変更ステップでは、多層ニューラルネットワークの入力層に近い下位階層のニューロンから、出力層に近い上位階層のニューロンへと順番に、前記フィードバック抵抗としてのメモリスタの抵抗値の変更が行われる請求項９に記載の多層ニューラルネットワークのニューロンの出力レベル調整方法。
前記変更ステップでは、各階層のニューロンに対応する前記アナログ処理回路に含まれる前記フィードバック抵抗としてのメモリスタの抵抗値の変更が一緒に行われる請求項１０に記載の多層ニューラルネットワークのニューロンの出力レベル調整方法。
前記変更ステップでは、すべての階層のニューロンに対応する前記アナログ処理回路に含まれる前記フィードバック抵抗としてのメモリスタの抵抗値の変更が一緒に行われる請求項９に記載の多層ニューラルネットワークのニューロンの出力レベル調整方法。