WO2022230926A1

WO2022230926A1 - 機械学習回路及び情報処理装置

Info

Publication number: WO2022230926A1
Application number: PCT/JP2022/019044
Authority: WO
Inventors: 敦丈小菅; 忠広黒田
Original assignee: 国立大学法人東京大学
Priority date: 2021-04-28
Filing date: 2022-04-27
Publication date: 2022-11-03
Also published as: JPWO2022230926A1

Abstract

複数のニューロンセル回路を含む機械学習回路２０であって、このニューロンセル回路が、複数の入力信号を受け入れる入力部２２０１と、入力部２２０１が受け入れた入力信号を加算する加算器部２２０２と、各入力値に応じた非線形関数の出力結果を保持し、加算器部２２０２が出力する出力信号を入力値として、当該入力値に応じた非線形関数の出力結果を出力する記憶部２２０３と、を含む。 (選択図)図３

Description

機械学習回路及び情報処理装置

　本発明は、機械学習回路及び情報処理装置に関する。

　近年一般的なニューラルネットワーク回路では、ニューロンを模した回路を複数利用しており、この回路はそれぞれ、複数の入力信号のそれぞれに対応する重みを乗じ、当該重みを乗じた結果を累算し、活性化関数により非線形変換して出力するという動作を行っている。

　このとき、重みやニューロンを模した回路間の接続性の機械学習は、重みの記憶や読み出し、入力信号に対する積和演算などのコストが大きいことから、効率的な機械学習を行う方法が種々研究されている（非特許文献１）。

Song Han, et al., Learning both Weights and Connections for Efficient Neural Networks, Advances in Neural Information Processing Systems, Vol.28, 2015 (arXiv:1506.02626)

　しかしながら、上記従来のニューラルネットワーク回路では結局、重み情報の書き込みや読み出しに加え積和演算を避けることができないため、エネルギー効率を十分に向上できないという問題点があった。

　本発明は上記実情に鑑みて為されたもので、エネルギー効率を向上できる機械学習回路及び情報処理装置を提供することを、その目的の一つとする。

　上記従来例の問題点を解決するための本発明の一態様は、複数のニューロンセル回路を含む機械学習回路であって、前記ニューロンセル回路が、複数の入力信号を受け入れる入力部と、前記入力部が受け入れた入力信号を加算する加算器部と、各入力値に応じた非線形関数の出力結果を保持し、前記加算器部が出力する出力信号を入力値として、当該入力値に応じた非線形関数の出力結果を出力する記憶部と、を含むこととしたものである。

　本発明によると、多数のメモリ読み出しや積和演算等に代えて、加算及び一度のメモリ読み出しにより機械学習回路が実現され、エネルギー効率を向上できる。

本発明の実施の形態の例に係る情報処理装置の構成例を表すブロック図である。本発明の実施の形態の例に係るニューロンセル集積回路の概略構成を表す概略配線図である。本発明の実施の形態の例に係るニューロンセル回路の構成例を表すブロック図である。本発明の実施の形態のもう一つの例に係るニューロンセル回路の構成例を表すブロック図である。本発明の実施の形態の別の例に係るニューロンセル回路の構成例を表すブロック図である。本発明の実施の形態のさらに別の例に係るニューロンセル回路の構成例を表すブロック図である。本発明の実施の形態のさらに別の例に係るニューロンセル回路の構成例を表すブロック図である。本発明の実施の形態の別の例に係るニューロンセル集積回路の概略構成を表す概略配線図である。本発明の実施の形態の別の例に係るシフトレジスタ回路部の概略構成を表す概略配線図である。本発明の実施の形態の別の例に係る情報処理装置による画像データの処理例を表す説明図である。本発明の実施の形態のまたもう一つの別の例に係るニューロンセル集積回路の概略構成を表す概略配線図である。本発明の実施の形態の例に係る連結回路の構成例を表す概略配線図である。本発明の実施の形態で利用される記憶素子を用いたスイッチの例を表す概略配線図である。本発明の実施の形態の例に係るニューロンセル回路の集積の態様を表す説明図である。

　本発明の実施の形態について図面を参照しながら説明する。本発明の実施の形態に係る情報処理装置１は、図１に例示するように、入力回路部１０と、少なくとも一つの機械学習回路２０と、出力回路部３０とを含んで構成される。

　入力回路部１０は、外部から入力されたデータを機械学習回路２０に出力する。ここで入力されるデータは、複数（例えばＫ個、ＫはＫ＞１なる整数）のＮビット（Ｎは１以上の自然数）のデータであるものとする。

　機械学習回路２０は、少なくとも一つのニューロンセル集積回路２００を具備して構成される。ここでニューロンセル集積回路２００は、図２に例示するように、入力側回路２１０と、複数のニューロンセル回路２２０（図中ではＮＣと略記する）と、連結回路２３０と、出力側回路２４０とを含む。

　入力側回路２１０は、入力回路部１０または他のニューロンセル集積回路２００（入力側回路２１０自身が含まれるニューロンセル集積回路２００以外のニューロンセル集積回路２００）が出力するＫ個のＮビットのデータ（全体でＫ×Ｎビットのデータ）を受け入れる。

　入力側回路２１０は、受け入れたデータを、同じニューロンセル集積回路２００内に存在する複数のニューロンセル回路２２０の少なくとも一部に対して出力する。なお、このとき、入力側回路２１０は、データの出力先としたニューロンセル回路２２０のそれぞれに、上記Ｋ個のデータを出力する必要はなく、Ｋ個のデータのうちから出力先ごとに選択したデータを、対応するニューロンセル回路２２０に出力するようにしてもよい。

　一例として、入力側回路２１０がデータの出力先とするニューロンセル回路２２０が、４つあり、それぞれを第１のニューロンセル回路２２０ａ，第２のニューロンセル回路２２０ｂ…と称することとし、またＫ＝１６である場合、入力側回路２１０は次のように動作してもよい。すなわち本実施の形態のある例では入力側回路２１０は、第１から第４番目のＮビットのデータ（全体で４×Ｎビットのデータ）を、上記４つのニューロンセル回路２２０ａ，ｂ，ｃ，ｄのうち、第１のニューロンセル回路２２０ａに出力する。また、入力側回路２１０は、第５から第８番目のＮビットのデータを、第２のニューロンセル回路２２０ｂに出力する…といったように、入力側回路２１０は、受け入れたデータを、それぞれ４個のＮビットのデータに分割して、それぞれ対応するニューロンセル回路２２０に出力することとしてもよい。

　以下の説明では、このように入力側回路２１０から直接データの入力を受けるニューロンセル回路２２０を入力端回路と呼び、後に説明する出力側回路２４０に、データを直接出力する（つまりニューロンセル集積回路２００外部に出力されるデータを出力する）ニューロンセル回路２２０を出力端回路と呼ぶ。さらにニューロンセル集積回路２００が備えるニューロンセル回路２２０のうち、出力端回路を除くニューロンセル回路２２０（つまり、その出力が他のニューロンセル回路２２０に出力され得るもの）を、以下では中間回路と呼ぶ。

　ニューロンセル回路２２０は、図３に例示するように、複数のデータを受け入れる入力部２２０１と、入力部２２０１が受け入れたデータを累算する加算器部２２０２と、記憶部２２０３とを含む。

　具体的に入力部２２０１は、Ｋ個の入力ポートを有し、各入力ポートを介して入力データを受け入れる。なお、Ｋ個の入力ポートのすべてに入力データが入力される必要はなく、一部の入力ポートには入力データが入力されない状態となっていてもよい。この場合、当該入力データのない入力ポートは、例えばＧＮＤ（グランドレベルの電位の配線）に接続するなどして、この入力ポートから入力されるデータが「０」を表すものとなるようにしておく。

　加算器部２２０２は、入力部２２０１のＫ個の入力ポートに入力された入力データを累算する。この加算器部２２０２は、例えば、図３に例示したように、２入力の加算器を複数組み合わせて累算を実行してもよいし、K入力の加算器を利用してもよい。

　また記憶部２２０３は、メモリ素子を含んで構成される。ここでメモリ素子は、例えば不揮発性の、ＲＯＭなどのメモリ素子であってもよいし、不揮発性のものであっても、書き換え可能なＲｅＲＡＭであってもよい。さらに、揮発性のＳＲＡＭが用いられてもよい。

　この記憶部２３０３には、所定の関数値を格納しておく。具体的に記憶部２３０３のメモリアドレスａには、所定の関数ｆを用いて演算される値である、ｆ（ａ・Δｑ）の値を（Ｎビットの値として）格納しておく。ここでΔｑは、例えば加算器部２２０２が出力し得る最大の値Ｖmaxと、最小の値Ｖmin、及び関数ｆの定義域ｘmin，ｘmax（ただしｘmin＜ｘmax）を用いて、
Δｑ＝（ｘmax－ｘmin）／（Ｖmax－Ｖmin）
として求めたものである。もっともΔｑの演算はこれに限られず、上記範囲であるＶminからＶmaxの入力値を入力したときに、関数ｆの値が出力されれば、他の演算方法でΔｑを定めても構わない。あるいは、Δｑ＝１となるように、関数ｆの定義域ｘmin，ｘmaxを設定してもよい。このように記憶部２２０３には、各入力値に応じた所定の関数の出力結果が保持された状態となっている。

　記憶部２２０３は、加算器部２２０２が出力する累算の結果をアドレス情報として、当該アドレス情報に対応するメモリアドレスに格納されている値を表すデータを出力する。

　本実施の形態の例では、この記憶部２２０３に格納されている値を演算するための関数は、非線形関数であり、例えばシグモイド関数：

、ＲｅＬＵ関数、Ｓｔｅｐ関数：

、Swish関数：

、絶対値関数、ガウス関数、tanh、正弦関数、余弦関数などから選択された関数とする。また一つのニューロンセル集積回路２００内に存在するニューロンセル回路２２０の記憶部２２０３が、互いに異なる非線形関数によって演算される値を格納していてもよい。また、同じ種類の非線形関数であってもパラメータが互いに異なる非線形関数によって演算される値を格納していてもよい。

　具体的に同じシグモイド関数

であっても、あるニューロンセル回路２２０の記憶部２２０３には、ａ＝３であるときのシグモイド関数の値が格納され、同じニューロンセル集積回路２００内の別のニューロンセル回路２２０の記憶部２２０３には、ａ＝０．３であるときのシグモイド関数の値が格納されていてもよい。

　この記憶部２２０３の出力するＮビットの値のデータは、当該記憶部２２０３を内蔵するニューロンセル回路２２０の外部に出力される。

　連結回路２３０は、中間回路であるニューロンセル回路２２０の出力を、他のニューロンセル回路２２０に入力する。この連結回路２３０は、例えば機械学習の結果を表す既定の配線、あるいは、上記中間回路であるニューロンセル回路２２０の出力と、他のニューロンセル回路２２０の入力との間に設けられ、外部からの指示によりオン・オフ可能なスイッチを備えてもよい。

　ここで連結回路２３０は、中間回路である一つのニューロンセル回路２２０の出力を、他の複数のニューロンセル回路２２０に入力するよう配線されていてもよい。

　このようなスイッチを備えた連結回路２３０は、中間回路であるニューロンセル回路２２０の出力を配列した第１の配線と、入力を受け入れ得る側のニューロンセル回路２２０の入力端子に接続された第２の配線とを交差させ、交差した位置にそれぞれスイッチを配した公知のクロスバスイッチによって実現できる。なお、図２では図示の都合上、スイッチを省略している。

　出力側回路２４０は、出力端回路であるニューロンセル回路２２０が出力するデータを受け入れて、当該受け入れたデータを、出力側回路２４０自身が含まれるニューロンセル集積回路２００以外のニューロンセル集積回路２００、または出力回路部３０に出力する。

　本実施の形態の一例では、図２に示したように、１つのニューロンセル集積回路２００に含まれるニューロンセル回路２２０はｎ行ｍ列のマトリクス状に配され、第１列目のｎ個のニューロンセル回路２２０が、それぞれ入力側回路２１０から少なくとも一つのＮビットのデータを受け入れるよう構成されていてもよい。

　この例では、第２列目のニューロンセル回路２２０の少なくとも一つは、連結回路２３０を介して、第１列目のニューロンセル回路２２０の少なくとも一つから、その出力を、入力データとして受け入れる。

　以下、第ｉ列目の（ただしｉ＋１＜ｍとする。すなわち中間回路である）ニューロンセル回路２２０（第ｉ番目のニューロンセル回路群に相当する）の少なくとも一つは、連結回路２３０を介して、第ｉ＋１列目のニューロンセル回路２２０（第ｉ番目のニューロンセル回路群に相当する）の少なくとも一つに対して、その（第ｉ列目のニューロンセル回路２２０の）出力を、入力データとして出力する。また、第ｍ列目ニューロンセル回路２２０（出力端回路に相当する）は、その出力を、出力側回路２４０に出力する。この場合、出力側回路２４０には、ｎ個の、Ｎビットのデータが出力される。

　そして出力回路部３０は、出力端回路である少なくとも一つの（ここではｎ個の）ニューロンセル集積回路２００の出力側回路２４０が出力するデータを外部に出力する。

［機械学習時の動作］
　本実施の形態では、機械学習時には、例えば情報処理装置１の連結回路２３０としてクロスバスイッチなど、ニューロンセル回路２２０間の配線の切り替えが可能なものを用いる。あるいは、情報処理装置１をＣＰＵ，ＧＰＵ、ＦＰＧＡなどを用い、プログラム可能なソフトウエア的なシミュレータとして構成し、このシミュレータ上で以下の機械学習の処理を実行してもよい。

　この例の情報処理装置１は、入力データと、それに対応して出力するべきデータとの組を複数、教師データとして受け入れる。そして各組について順次、当該組に含まれる入力データを、入力回路部１０に入力し、当該入力した入力データに基づき機械学習回路２０が出力するデータを、出力回路部３０を介して得て、この得られたデータと、入力した入力データに対応する出力データとを比較する。

　情報処理装置１は、この比較の結果に基づいて、機械学習回路２０に含まれる各ニューロンセル集積回路２００内の連結回路２３０のスイッチを制御して、先の入力データを入力したときの機械学習回路２０の出力が、当該入力データに対応する出力データに近接することとなるよう設定する。この動作は、広く知られている強化学習の方法、例えばA. Gaier, D. Ha,"Weight Agnostic Neural Networks", arXiv:1906.04358v2により行うことができる。

　情報処理装置１は、この処理を、教師データに含まれる各組について繰り返して行い、機械学習を実行する。

［推論時の動作］
　情報処理装置１は、上記のような機械学習処理により、機械学習回路２０に含まれる各ニューロンセル集積回路２００内の連結回路２３０のスイッチの設定が最適化されると、当該スイッチの設定を再現するよう配線を固定してもよい。このような配線固定は、例えば連結回路２３０によって連結され得るニューロンセル回路２２０のうち、連結回路２３０が出力データを受け入れるニューロンセル回路２２０の出力を配列した第１の配線を配列した層と、入力を受け入れ得る側のニューロンセル回路２２０の入力端子に接続された第２の配線を配列した層とを立体的に交差させ、連結するべき配線の交差した位置にビアを配して、対応する第１の配線と第２の配線とを連結することとすればよい。なお、立体的な交差は絶縁体層を介して各配線層を積層配置することで実現でき、ビアはこの絶縁体層を貫通して形成すればよい。

　なお、後に説明するように、本実施の形態のニューロンセル集積回路２００をチップ化する場合、ニューロンセル回路２２０内の記憶部２２０３（マスクＲＯＭ）を、ビアを用いて構成し、この連結回路２３０を構成するビアと、当該記憶部２２０３のビアとを同一のマスクで作成することとしてもよい。このようにすると、マスク製造コストを低減できる。

　推論の動作を行う情報処理装置１は、このように、機械学習処理により最適化された設定通りに、機械学習回路２０に含まれる各ニューロンセル集積回路２００内の連結回路２３０のスイッチを設定することで、機械学習した状態となっている機械学習回路２０を用いて、次の処理を行う。

　すなわち情報処理装置１は、入力データを受け入れると、入力回路部１０に入力し、当該入力した入力データに基づき機械学習回路２０が出力するデータを、出力回路部３０を介して得る。この機械学習回路２０の出力するデータは、上記最適化を行った結果となっており、入力データに基づいて推論された出力データが得られていることとなる。

［複数種類の非線形関数］
　既に述べたように、一つのニューロンセル集積回路２００内のニューロンセル回路２２０がその記憶部２２０３に保持する値のもととなった非線形関数が、互いに異なっていてもよい。

　すなわち、入力値に応じた第１の非線形関数の出力結果を保持する第１種の記憶部２２０３を備えた第１種ニューロンセル回路２２０ａと、入力値に応じた、上記の第１の非線形関数とは異なる第２の非線形関数の出力結果を保持する第２種の記憶部２２０３を備えた第２種ニューロンセル回路２２０ｂと…というように、複数種類の非線形関数の値を保持したニューロンセル回路２２０が一つのニューロンセル集積回路２００内に備えられていてもよい。

　さらに本実施の形態において、ニューロンセル集積回路２００が図２に例示したように、ｎ行ｍ列のマトリクス状に配したニューロンセル回路２２０を備える場合、少なくとも一つの列に含まれるニューロンセル回路２２０の群に、上記第１種ニューロンセル回路２２０ａと、第２種ニューロンセル回路２２０ｂとを含んでもよい。この例では、連結回路２３０の設定により、推論の処理において利用する非線形関数を切り替えることが可能となる。

　また、この例では、ｉ列目のニューロンセル回路２２０よりもｊ列目（ｊ＞ｉ）のニューロンセル回路（すなわちより出力側に近いニューロンセル回路）２２０の非線形性を平均的に高いものとしておくことも好適である。非線形性はシグモイド関数やSwish関数であれば、パラメータａの値を０に近くするほど非線形性が低くなる。

　そこで例えばニューロンセル集積回路２００が、いずれも記憶部２２０３にシグモイド関数（またはSwish関数）に基づく値を格納しているが、そのパラメータａの値が互いに異なる（従って非線形関数が互いに異なる）複数のｎ行ｍ列に配列されたニューロンセル回路２２０を含む場合、ｉ列目のニューロンセル回路２２０が保持するシグモイド関数（またはSwish関数）の上記パラメータａの値の総和よりも、ｊ＞ｉなるｊ列目のニューロンセル回路２２０が保持するシグモイド関数（またはSwish関数）の上記パラメータａの値の総和が小さくなるよう設定することとしてもよい。

［負論理とする例］
　また、一般に論理回路では、負論理とすることで回路を簡易化できることから、ニューロンセル集積回路２００を負論理で構成してもよい。この場合、ニューロンセル集積回路２００に含まれる各ニューロンセル回路２２０の記憶部２２０３は、保持する非線形関数の値を負の値とする。

　すなわち、記憶部２２０３に格納されている値を演算するための関数を、シグモイド関数とする場合は、

とし、Swish関数とする場合は、

…というように、対応する非線形関数に－１を乗じた関数を設定する。

　またこの例では、入力回路部１０は、外部から入力されたデータについて、その各ビットを反転して機械学習回路２０に出力する。そして出力回路部３０は機械学習回路２０が出力するデータについて、その各ビットを反転して出力する。

［連結回路における制限］
　さらに本実施の形態において、ニューロンセル集積回路２００が図２に例示したように、ｎ行ｍ列のマトリクス状に配したニューロンセル回路２２０を備える場合、ｉ列目のニューロンセル回路２２０の出力をｉ＋１列目のニューロンセル回路２２０に接続する連結回路２３０ｉにおいてオンとなるスイッチ（互いに連結される配線）の数よりも、ｊ列目（ｊ＞ｉ）のニューロンセル回路（すなわちより出力側に近いニューロンセル回路）２２０の出力をｊ＋１列目のニューロンセル回路２２０に接続する連結回路２３０ｊにおいてオンとなるスイッチ（互いに連結される配線）の数が多くなるよう設定してもよい。

　つまり、第ｉ列目のニューロンセル回路２２０（第ｉ番目のニューロンセル回路群に相当する）に含まれるニューロンセル回路の入力部が受け入れる入力信号の数Ｎiが、第ｊ列目（ｊは、ｊ＞ｉなる１以上の自然数）のニューロンセル回路２２０（第ｊ番目のニューロンセル回路群に相当する）群に含まれるニューロンセル回路２２０の入力部が受け入れる入力信号の数Ｎjより小さい値となるｉ，ｊが存在するよう、各ニューロンセル回路の入力部が受け入れる入力信号の数が設定されてもよい。

　言い換えれば、より入力側に近い中間回路の出力を、次列の入力に連結する連結回路２３０についてはオンとすることのできるスイッチの数を制限してもよい。

　例えば、ｎ行１０列のマトリクス状に配したニューロンセル回路２２０を備えるニューロンセル集積回路２００では、最初の８列に含まれるニューロンセル回路２２０と、その出力から次段のニューロンセル回路２２０の入力とを接続するスイッチの数を、２×ｎ個に限定する。そして９列目のニューロンセル回路２２０と、その出力から次段のニューロンセル回路２２０の入力とを接続するスイッチの数については限定しないようにしてもよい。この構成は、後段のニューロンほど、より多くの信号を受け取って高次の特徴を処理するという人間等の動物のニューロンの構成を模倣したものである。

［記憶部への入力を２系統とする例］
　また、本実施の形態では、各ニューロンセル回路２２０は、入力されたｋ個のデータを累算して、記憶部２２０３の、この累算値に対応するアドレスに格納された非線形関数の値を出力することとしていた。しかしながら本実施の形態のニューロンセル回路２２０は、次の構成としてもよい。

　すなわち、本発明の実施の形態の一例に係るニューロンセル回路２２１は、図４に例示するように、複数のデータを受け入れる入力部２２０１と、入力部２２０１が受け入れたデータを累算する加算器部２２０２′と、記憶部２２０３′とを含む。なお、ニューロンセル回路２２０と同様の構成となるものについては同じ符号を付して説明を省略する。

　加算器部２２０２′は、Ｋ個の入力データのうち、Ｌ個（Ｌ＜Ｋ）の入力データを累算する第１の加算器部２２０２ａ′と、残りの（Ｋ－Ｌ）個の入力データを累算する第２の加算器部２２０２ｂ′とを備える。

　そしてこの加算器部２２０２′は、第１の加算器部２２０２ａ′による累算結果ＸＡと、第２の加算器部２２０２ｂ′による累算結果ＸＢとを出力する。

　記憶部２２０３′は、累算結果ＸＡと累算結果ＸＢとに互いに異なる重みを乗じたときの非線形関数の値を出力するよう、対応するアドレスに当該非線形関数の値を保持する。すなわち、非線形関数としてSwish関数を用いる場合、ここで累算結果ＸＡに乗じる重みをＷｐ、累算結果ＸＢに乗じる重みをＷmとして、記憶部２２０３′のアドレスＸ（例えばＸＡ，ＸＢのビット数がそれぞれ８であれば、上位８ビットにＸＡ，下位８ビットにＸＢを配して得られた値Ｘ）に、

なる値を書き込んでおく。なお、この例でも負論理とする場合は、この関数に－１を乗じた関数の値を格納しておくこととすればよい。またここで、Ｗｐ＝１，Ｗｍ＝－１としておいてもよい。

［一般的なディープラーニングネットワークからの変換］
　またこのように、Ｗｐ，Ｗｍといった正負の重みを乗じることを可能とした場合、既知の、既に機械学習した状態にあるディープラーニングニューラルネットワーク（ＤＮＮ）から、本実施の形態のニューロンセル集積回路２００の連結回路２３０のスイッチの設定（初期設定）を決定してもよい。

　すなわち、機械学習した状態にあるＤＮＮのある層のニューロン間の重みが、各入力データＸ１，Ｘ２，Ｘ３，Ｘ４，Ｘ５についてそれぞれＷ１＝0.08，Ｗ２＝-0.24，Ｗ３＝-0.18，Ｗ４＝0.14，Ｗ５＝0.001であるとし、これらの積和Ｗ１・Ｘ１＋Ｗ２・Ｘ２＋Ｗ３・Ｘ３＋Ｗ４・Ｘ４＋Ｗ５・Ｘ５に対して非線形関数として、

（ａ＝１，ｂ＝１のSwish関数）であるとするときには、Swish関数に基づく値を記憶部２２０３に格納しているニューロンセル回路２２０の入力端子に、前段の回路（入力側回路２１０または他のニューロンセル回路２２０）から入力されるデータを入力する。特に、前段の回路から入力されるデータのうち、（乗じられる重みが正であった）Ｘ１，Ｘ３についてはＷｐの重みを乗じることのできる入力端子（ＩｎA）に入力し、（乗じられる重みが負であった）Ｘ２，Ｘ４についてはＷｍの重みを乗じることのできる入力端子（ＩｎB）に入力することとなるよう接続する。つまり、例えば前段が他のニューロンセル回路２２０であれば連結回路２３０のスイッチ設定をそのように設定する。

　なお、ＤＮＮにおいて重みの係数が予め定めたしきい値（ここでは0.01とする）未満であるＸ５については、重み係数が「０」であるものとして、前段の出力Ｘ５をどこにも接続しないこととしてもよい。入力側回路２１０直後のニューロンセル回路２２０に対する接続であれば、ニューロンセル集積回路２００が、データＸ５の入力を外部から受け入れない（データＸ５の配線をニューロンセル集積回路２００に接続しない）ようにしておく。

　またこの例では、Ｗｐ，Ｗｍを次のように定めてもよい。すなわちＷｐの重みについては、しきい値未満であるＷ５を除き、正の値となっているＷ１，Ｗ４を用いてその統計量（例えば算術平均等）により、Ｗｐ＝（Ｗ１＋Ｗ４）／２と定めてもよい。同様に負の重みＷｎについては、負の値となっているＷ２，Ｗ３を用いて、同様の統計量（ここでは算術平均とする）により、Ｗｎ＝（Ｗ２＋Ｗ３）／２と定めてもよい。

　以下、ＤＮＮの他のニューロンについても、それが利用する非線形関数によりニューロンセル回路２２０を選択し、前段からの入力を、選択したニューロンセル回路２２０のどの入力端子に入力するか（あるいは入力しないか）を、機械学習結果である重みに基づいて設定する。また、その正負の重みをＤＮＮの機械学習結果である重みの統計量により設定する。

　これにより、既存の機械学習した状態にあるＤＮＮに基づいて、本実施の形態の情報処理装置１のニューロンセル回路２２０間の初期的な連結関係が設定される。以下情報処理装置１は、既に説明した機械学習の処理を行って、連結関係を最適化する。またこのとき、重みの値Ｗｐ，Ｗｎも同様に最適化を行ってもよい。

　この例では、既に機械学習した状態にあるＤＮＮをベースに初期値が決定されるため、機械学習処理の効率化が期待できる。

［記憶部への入力を２系統とする他の例］
　また本発明の実施の形態のもう一つの例に係るニューロンセル回路２２２は、図５に例示するように、複数のデータを受け入れる入力部２２０１と、入力部２２０１が受け入れたデータを累算する加算器部２２０２′と、演算部２２０４と、加算部２２０５と、記憶部２２０３″と、出力部２２０６とを含む。なお、ニューロンセル回路２２０，２２１と同様の構成となるものについては同じ符号を付して説明を省略する。

　この例においても加算器部２２０２′は、第１の加算器部２２０２ａ′による累算結果ＸＡと、第２の加算器部２２０２ｂ′による累算結果ＸＢとを出力するものとする。ただしここでは、累算結果ＸＡと累算結果ＸＢとは同じビット数（それぞれｚビットとする）の符号付き二進数であるとする。

　演算部２２０４は、累算結果ＸＡと累算結果ＸＢとのそれぞれに対応して２つ設けられ、演算部２２０４のそれぞれは、例えばｚビットのアドレスの値ＸＡまたはＸＢに対応して、対応するメモリアドレスに、アドレス値に所定の非線形関数を施した結果の値を格納した記憶部（ＲＯＭなどのメモリ）である。ここで非線形関数の結果の値は、出力データのビット幅であるｚビットの値としておく。

　すなわちこの例では演算部２２０４は、入力された累算結果ＸＡ，ＸＢにそれぞれ対応するメモリアドレスに格納された非線形関数の値を出力する。もっとも、この演算部２２０４は、メモリではなく、シフト演算器により実現されてもよい。この場合、累算結果ＸＡと累算結果ＸＢとのそれぞれに対応する演算部２２０４は、対応する累算結果ＸＡ，ＸＢに対してそれぞれ互いに異なる方向への算術シフト演算を行って出力することとしてもよい。例えば累算結果ＸＡの入力を受けた演算部２２０４は、当該累算結果ＸＡをｎビット（例えばｎ＝１でよい）だけ右シフトして出力する。また、累算結果ＸＢの入力を受けた演算部２２０４は、当該累算結果ＸＢをｎビット（例えばｎ＝１でよい）だけ左シフトして出力する。この例においても、算術シフト演算の結果のビット幅は、出力データのビット幅であるｚビットの値としておき、算術シフト演算であふれたビットは廃棄する。

　加算部２２０５は、累算結果ＸＡと累算結果ＸＢとのそれぞれに対応する演算部２２０４の出力するデータを加算して、ｚビットの加算結果Ｘを得る。

　記憶部２２０３″は、ｚビットの加算結果Ｘに対応するｚビットのメモリアドレスごとに、当該メモリアドレスの表すアドレス値に所定の非線形関数を施した結果の値を格納したものである。ここで非線形関数の結果の値は、出力データのビット幅であるｚビットの値としておく。記憶部２２０３″は、入力された加算結果Ｘに対応するメモリアドレスに格納された非線形関数の値を出力する。

　出力部２２０６は、記憶部２２０３″が出力する値を、外部に出力する。なおこの出力部２２０６は、記憶部２２０３″の出力に対して、非線形性を加味するための補正関数をさらに施した結果を演算により求め、当該補正関数を施した後の値を出力することとしてもよい。

　この例のニューロンセル回路は、非線形性の低い非線形関数ｈ（ｘ）を用いる場合、つまり、入力値ｘ１＋ｘ２が０に近い範囲で、
ｈ（ｘ１＋ｘ２）＝ｈ（ｘ１）＋ｈ（ｘ２）
といった近似が成り立つ場合に好適である。

　さらにもう一つの例に係るニューロンセル回路２２３は、図６に例示するように、複数のデータを受け入れる入力部２２０１と、加算器部２２０２″と、記憶部２２０３″と、出力部２２０６とを含む。なお、ニューロンセル回路２２０，２２１と同様の構成となるものについては同じ符号を付して説明を省略する。

　この例において、加算器部２２０２″は、第１の加算器部２２０２ａ″と、第２の加算器部２２０２ｂ″と、反転部２２０２Ｎと、加算部２２０５とを備える。加算器部２２０２ａ″は、Ｋ個の入力データのうち、Ｌ個（Ｌ＜Ｋ）の入力データを累算する。また加算器部２２０２ｂ″は、残りの（Ｋ－Ｌ）個の入力データを累算する。反転部２２０２Ｎは、加算器部２２０２ｂ″の出力する値の正負を反転する。

　そしてこの加算器部２２０２″の加算部２２０５は、第１の加算器部２２０２ａ″が出力する累算結果ＸＡと、第２の加算器部２２０２ｂ″が出力し、正負を反転した結果－ＸＢとを加算した加算結果Ｘ（Ｘ＝ＸＡ－ＸＢ）を出力する。すなわち、この加算器部２２０２″を用いる本実施の形態の例は、累算結果ＸＡに乗じる重みＷｐを「１」、累算結果ＸＢに乗じる重みＷmを「－１」としたものに相当している。また、ここでは、累算結果ＸＡ，ＸＢ及び加算結果Ｘは、いずれもビット数が同じ（それぞれｚビットとする）符号付き二進数であるとする。

　記憶部２２０３″は、既に述べたように、ｚビットの加算結果Ｘに対応するｚビットのメモリアドレスごとに、当該メモリアドレスの表すアドレス値に所定の非線形関数を施した結果の値を格納したものである。ここでｚビットの加算結果Ｘは、符号つき２進数で表されているため、その最上位ビットは符号ビットであり、残りのｚ－１ビットで値を表すものであるが、メモリアドレスとする場合は、ｚビットの値として扱う。つまり一例としてｚ＝４ビットのとき、加算結果Ｘが「－１」に対応するメモリアドレスは（２の補数表現を採用することとして）、２進数で「１１１１」となる。

　またここで非線形関数の結果の値は、出力データのビット幅であるｚビットの値としておく。記憶部２２０３″は、入力された加算結果Ｘに対応するメモリアドレスに格納された非線形関数の値を出力する。

　さらにこの例において、記憶部２２０３″を、所定の演算回路に置き換えてもよい。図７は、図６に例示したニューロンセル回路２２３において、記憶部２２０３″に代えてRelu演算回路部２２０７を配した例を示したものである。

　このRelu演算回路部２２０７は、入力された値Ｘ（加算器部２２０２″が出力する加算結果Ｘ）の符号ビットを参照し、符号ビットが「１」（負）であるときには、入力される値に関わらず、「０」を表すｚビット長の値を出力し、符号ビットが「０」（正）であるときには、入力された値Ｘをそのまま出力する。

　この例によると、記憶部２２０３″を実装する必要がなくなるため、ハードウェアを簡略に構成できる。なお、ここでは演算回路としてRelu演算回路を例として説明したが、本実施の形態はこれに限られず、HardSwish関数の演算結果を出力する回路など、簡易なハードウェアで実現可能な関数（特に非線形関数）を表す回路であれば、どのような回路であっても構わない。

［オーバーフロー防止］
　また、本実施の形態では、各ニューロンセル回路２２０内において、加算器部２２０２の演算結果が（いわばその重みが「１」であり、データの累算が行われるために）オーバーフローして（最大値を超えて）しまいやすい。

　そこで、データのビット数Ｎに対し、加算器部２２０２内での加算演算に用いる変数のビット数をＭ（Ｍは、Ｍ＞Ｎである整数）とし、加算器部２２０２がＭビットの累算結果を出力することとしてもよい。

　この場合、記憶部２２０３では、Ｍビットのアドレス空間内に、アドレス値に応じた非線形関数の値（この値はＮビットとする）を格納しておくこととしてもよい。

　また同様にデータのビット数Ｎに対し、加算器部２２０２内での加算演算に用いる変数のビット数をＭ（Ｍは、Ｍ＞Ｎである整数）とし、加算器部２２０２がＭビットの累算結果を出力させる場合に、当該累算結果においてＮ＋１ビット目からＭビット目までの各ビットに「１」があるか（Ｎビットの累算がオーバーフローしたか）否かを調べて、「１」がある場合（オーバーフローした場合）には、Ｎビットの最大値を記憶部２２０３に出力し、「１」がない（オーバーフローしていない）場合には、累算結果をそのまま出力することとしてもよい。

　この場合は、既に説明したのと同じく、記憶部２２０３では、Ｎビットのアドレス空間内に、アドレス値に応じた非線形関数の値（Ｎビット）を格納しておく。これらの方法によれば、オーバーフローに対応できる。

［プーリングレイヤ用のニューロンセル回路］
　なお、画像処理等で効果があると認められている畳み込みネットワーク（ＣＮＮ）では、プーリング処理と呼ばれる処理が広く利用されている。本実施の形態において、プーリング処理を行うためには、例えば、記憶部２２０３に格納する値を、それぞれ対応するアドレス値ｘに関わらず、定数αを入力されるデータの数ｋで除した値α／ｋとしておけばよい。

　このようにしたニューロンセル回路２２０は、平均化プーリングを行ったものと同じ出力を行うこととなる。

［プログラマブルＲＯＭ］
　なお、既に説明したように、ニューロンセル集積回路２００に含まれるニューロンセル回路２２０のうちには、その記憶部２２０３に格納している値を書き換え可能なように、記憶部２２０３が書き込み可能な記憶素子により構成され、外部からの値の書き込みを受け入れる構成を備えていてもよい。

　この場合、機械学習の過程において、当該ニューロンセル回路２２０で利用する非線形関数も併せて機械学習の対象とすることが可能となる。なお、このようなニューロンセル回路２２０（書き換え可能ニューロンセル回路と呼ぶ）は、ｎ行ｍ列に配されたニューロンセル回路２２０のうち、出力側に近いｍ列目または、ｍ列目からｍ－ｑ列目まで（ｑ＜ｍ）に限って配されてもよい。あるいは、書き換え可能ニューロンセル回路は、ｎ行ｍ列に配されたニューロンセル回路２２０のうち、入力側に近い１列目、または１列目からｑ列目（ｑ＜ｍ）に限って配されてもよい。

　なお、一つのニューロンセル集積回路２００に、書き換え可能でないニューロンセル回路２２０と、書き換え可能なニューロンセル回路２２０とを混在させる場合は、出力に近い後段ほど、書き換え可能なニューロンセル回路２２０が多くなるよう配置することとするのが好適である。

［シフトレジスタによる情報保持］
　また、本実施の形態のある例では、各ニューロンセル回路２２０が、シフトレジスタ回路を介してデータの入力を受け入れることとしてもよい。

　この例に係る機械学習回路２０は、図８に例示するように、少なくとも一つのニューロンセル集積回路２００を具備して構成される。この例でのニューロンセル集積回路２００は、入力側回路２１０と、複数のニューロンセル回路２２０（図中ではＮＣと略記する）と、ニューロンセル回路２２０ごとに設けられたシフトレジスタ回路部２５０と、クロック回路２６０と、連結回路２３０と、出力側回路２４０とを含む。

　またここでシフトレジスタ回路部２５０は、所定のタイミングごとにデータの入力を受け入れ、過去の所定回数（例えばｑ回）に亘って入力されたデータを保持するものである。またこのシフトレジスタ回路部２５０は、当該保持しているｑ回分のデータの少なくとも一部を、上記所定のタイミングで、後段に接続されているニューロンセル回路２２０等に出力する。

　具体的にこのシフトレジスタ回路部２５０は、図９に例示するように、入力端子２５０１と、ｑ個（ｑは１以上の自然数）のシフトレジスタ（図中ではＳＲと略記する）２５０２と、出力端子２５０３とを含む。

　さらにシフトレジスタ２５０２は、入力側回路２１０または連結回路２３０からＰビットのデータ（Ｐは１以上の自然数）の入力を受け入れる入力端子ＩＮと、Ｐビットのデータを出力する出力端子ＯＵＴと、クロック信号の入力端子ＣＬＫとを備える。なお、ｑ＞１であるときには、当該複数のシフトレジスタ２５０２ａ，ｂ…は、直列に、多段に接続される。また複数のシフトレジスタ２５０２ａ，ｂ…を区別しないときには、以下、単にシフトレジスタ２５０２と表記する。

　シフトレジスタ回路部２５０の入力端子２５０１は、入力側回路２１０または連結回路２３０からＰビットのデータの入力を受け入れて、シフトレジスタ２５０２（複数ある場合は初段のシフトレジスタ２５０２ａ）の入力端子ＩＮに出力する。

　シフトレジスタ２５０２は、クロック信号の入力を受け入れたときに、入力端子ＩＮに入力されているＰビットのデータを一時的に保持する。またこのシフトレジスタ２５０２は、クロック信号の入力を受け入れると、前回保持したデータを出力端子ＯＵＴから出力する。なお電源投入直後は、保持するデータが存在しないので、シフトレジスタ２５０２は、保持するデータの各ビットを「０」などの所定の値に初期化しておくものとする。

　またこのシフトレジスタ２５０２の出力端子ＯＵＴは、後段のシフトレジスタ２５０２があるときには、当該後段のシフトレジスタ２５０２の入力端子ＩＮに接続され、後段のシフトレジスタ２５０２がない場合（最後段のシフトレジスタである場合）には、その出力端子ＯＵＴは、シフトレジスタ回路部２５０の出力端子２５０３に接続される。

　この構成を備えることにより、シフトレジスタ回路部２５０は、過去ｑ回に亘って入力されたＰビットのデータを一時的に保持し、ｑ回前に保持したデータを出力することとなる。

　なお、多段に接続されたシフトレジスタ２５０２のうち、最後段のものでない（つまり初段及び中間段の）シフトレジスタ２５０２の少なくとも一部のシフトレジスタ２５０２は、その出力端子ＯＵＴが、後段のシフトレジスタ２５０２の入力端子ＩＮだけでなく、シフトレジスタ回路部２５０の出力端子２５０３にも接続されていてもよい。この例では、ｑ回前に保持したデータと、ｑ－１回前に保持したデータと…前回保持したデータとが出力されることとなる。

　また本実施の形態の一例では、シフトレジスタ回路部２５０の入力端子２５０１は初段のシフトレジスタ２５０２ａの入力端子ＩＮに接続されるとともに、シフトレジスタ回路部２５０の出力端子２５０３にそのまま接続されてもよい。以下では、図９に例示したように、シフトレジスタ回路部２５０の入力端子２５０１が初段のシフトレジスタ２５０２ａの入力端子ＩＮのみに接続され、初段及び中間段のシフトレジスタ２５０２ａ，ｂの出力端子ＯＵＴが後段のシフトレジスタ２５０２ｂ，ｃの入力端子ＩＮに接続されるとともに、シフトレジスタ回路部２５０の出力端子２５０３にも接続されているものとする。

　さらに既に述べたように、最後段のシフトレジスタ２５０２ｃの出力端子ＯＵＴは、シフトレジスタ回路部２５０の出力端子２５０３に接続される。つまりこの例では、シフトレジスタ回路部２５０の出力端子２５０３は（Ｐ×３）ビットのデータを出力することとなる。

　この出力端子２５０３が出力するデータは、このシフトレジスタ回路部２５０に対応しているニューロンセル回路２２０に出力される。なお、対応するニューロンセル回路２２０の入力ポートに入力可能なデータのビット幅は、対応するシフトレジスタ回路部２５０が出力するビット幅以上であるものとする。具体的にニューロンセル回路２２０が、それぞれＫ個のＮビット入力ポート（全体でＫ×Ｎビットの入力ポート）を有しているものとする場合、上述の例であれば、Ｋ×Ｎ≧Ｐ×３であればよい。

　クロック回路２６０は、所定のクロックタイミングごとに「Ｈ」の状態と「Ｌ」の状態とを交互に繰り返すクロック信号（パルス信号）を、各シフトレジスタ２５０２のクロック信号の入力端子ＣＬＫに対して出力する。

　本実施の形態のこの例に係る情報処理装置１を用いる場合、機械学習時には、例えば連結回路２３０としてクロスバスイッチなど、配線の切り替えが可能なものを用いる。そして情報処理装置１は、入力データと、それに対応して出力するべきデータとの組を複数、教師データとして受け入れる。そして情報処理装置１は、各組について順次、次の機械学習の処理を実行する。

　すなわち情報処理装置１は、機械学習の対象となった組に含まれる入力データＤを、所定の単位に分割して、分割入力データｄi（ｉ＝１，２，…）を得ておく。情報処理装置１は、分割入力データｄiを、所定のクロックタイミングごとに、入力回路部１０に順次入力する。

　入力回路部１０は、分割入力データｄiが入力されるごとに、当該分割入力データｄiを、ニューロンセル集積回路２００に出力する。ニューロンセル集積回路２００の入力側回路２１０は、入力された分割入力データｄiを、Ｐビットごとのデータにさらに分割し、当該Ｐビットのデータのそれぞれを、対応するシフトレジスタ回路部２５０に出力する。

　以下の説明では、ニューロンセル集積回路２００は、シフトレジスタ回路部２５０と、対応するニューロンセル回路２２０との組が３組×２段あり、各段の間に連結回路２３０を配してなるものとする。もちろんこれは一例であり、より多数のシフトレジスタ回路部２５０と、対応するニューロンセル回路２２０との組、及びより多数の連結回路２３０が含まれてもよい。また以下の例では、シフトレジスタ回路部２５０がｑ個（ｑは１以上の自然数とする）のシフトレジスタ２５０２を備えるものとする。

　この例では、初段にある３つのシフトレジスタ回路部２５０ａが、入力回路部１０からそれぞれＰビットのデータの入力を受け入れる。そして各シフトレジスタ回路部２５０ａは、過去ｑ回に亘って入力されたＰビットのデータを保持し、また、過去ｑ回前から前回までに入力されたｑ－１個のＰビットのデータ（（ｑ－１）×Ｐビットのデータ）を、クロックタイミングごとに、このシフトレジスタ回路部２５０ａに対応するニューロンセル回路２２０ａに出力する。

　ここでニューロンセル回路２２０が図３に例示したものであれば、このニューロンセル回路２２０ａは、入力された（ｑ－１）×Ｐビットのデータを累算し、その記憶素子２２０３に格納された、上記累算結果に対応する関数の値を表すデータを出力する。

　この出力されたデータは、連結回路２３０を介して後段のシフトレジスタ回路部２５０ｂに出力される。そしてこの後段のシフトレジスタ回路部２５０ｂも、過去ｑ回に亘って入力されたＰビットのデータを保持し、また、過去ｑ回前から前回までに入力されたｑ－１個のＰビットのデータ（（ｑ－１）×Ｐビットのデータ）を、クロックタイミングごとに、このシフトレジスタ回路部２５０ｂに対応するニューロンセル回路２２０ｂに出力する。そして、当該データの入力を受けたニューロンセル回路２２０ｂは、入力された（ｑ－１）×Ｐビットのデータを累算し、その記憶素子２２０３に格納された、上記累算結果に対応する関数の値を表すデータを出力する。

　情報処理装置１は、出力回路部３０を介して最後段のニューロンセル回路２２０ｂが出力するデータを得て、この得られたデータと、入力した入力データに対応する出力データとを比較する。

　情報処理装置１は、この比較の結果に基づいて、ニューロンセル集積回路２００内の連結回路２３０のスイッチを制御して、先の入力データを入力したときの機械学習回路２０の出力が、当該入力データに対応する出力データに近接することとなるよう、既に述べた、広く知られている強化学習の方法、例えばA. Gaier, D. Ha,"Weight Agnostic Neural Networks", arXiv:1906.04358v2により設定することができる。

　情報処理装置１は、以上の処理を、教師データに含まれる各組について繰り返して行い、機械学習を実行する。

　このような情報処理装置１は、例えば画像データに関する機械学習を実行する際に好適に利用できる。すなわち、画像データに関する機械学習を実行する際には、情報処理装置１は、図１０に例示するように、画像データを入力データとし、当該入力データを、ｒ行（ｒは１以上の自然数）含むラインブロックに分割して分割入力データとし、当該ｒ行ごとのラインブロックを、順次、所定のクロックタイミングごとに入力回路部１０に入力する。

　この例では、入力回路部１０が、分割入力データとして、最初のクロックタイミングでは１行目からｒ行目までのラインブロックの入力を、次のクロックタイミングではｒ＋１行目から２ｒ行目までのラインブロックの入力を…というように受け入れて、当該受け入れられたラインブロックのデータをニューロンセル集積回路２００に出力する。するとニューロンセル集積回路２００の入力側回路２１０が、入力されたラインブロックをさらにｓ列（ｓは１以上の自然数）以上の画素列を含むｒ×ｓ画素（上記のＰビットとなるようにする）のブロックＢ1，Ｂ2…に分割し、ブロックごとに、対応するシフトレジスタ回路部２５０を介してニューロンセル回路２２０に出力する。

　この例によると、画像の縦方向に互いに隣接するｑ（シフトレジスタ２５０２の段数）個分のラインブロックごとに、画像データに関する機械学習が行われることとなる。また、ニューロンセル回路２２０を、チャネル（例えば赤（Ｒ），緑（Ｇ），青（Ｂ）及びアルファチャネル（透明度など）などの色成分のデータ）ごとに設けて、それぞれ並列的に処理してもよい。

　次にシフトレジスタを用いた機械学習回路２０を備える情報処理装置１の推論時の動作例について説明する。

　情報処理装置１は、上述の機械学習処理により、機械学習回路２０に含まれる各ニューロンセル集積回路２００内の連結回路２３０のスイッチを設定を最適化（機械学習）した状態で固定した後、推論の処理を実行する。ここでのスイッチの固定の方法は既に説明した方法を採用できるので、繰り返しての説明を省略する。

　推論の動作を行う情報処理装置１は、機械学習処理により最適化された設定通りに、機械学習回路２０に含まれる各ニューロンセル集積回路２００内の連結回路２３０のスイッチが設定された状態で、次のように推論の処理を行う。以下では、上述の機械学習の処理で用いた機械学習回路２０と同様の構成を備えているものとする。

　情報処理装置１は、推論の処理の対象となる入力データを受け入れると、当該入力データを、所定の単位に分割して、分割入力データｄi（ｉ＝１，２，…）を得る。そして情報処理装置１は、分割入力データｄiを、所定のクロックタイミングごとに、入力回路部１０に順次入力する。

　すると初段にある３つのシフトレジスタ回路部２５０ａが、入力回路部１０からそれぞれＰビットのデータの入力を受け入れる。そして各シフトレジスタ回路部２５０ａは、過去ｑ回に亘って入力されたＰビットのデータを保持し、また、過去ｑ回前から前回までに入力されたｑ－１個のＰビットのデータ（（ｑ－１）×Ｐビットのデータ）を、クロックタイミングごとに、このシフトレジスタ回路部２５０ａに対応するニューロンセル回路２２０ａに出力する。

　ここでニューロンセル回路２２０は、図３に例示したものとしているので、このニューロンセル回路２２０ａは、入力された（ｑ－１）×Ｐビットのデータを累算し、その記憶素子２２０３に格納された、上記累算結果に対応する関数の値を表すデータを出力する。

　情報処理装置１は、出力回路部３０を介して最後段のニューロンセル回路２２０ｂが出力するデータを得る。このデータは、上記最適化を行った結果となっており、入力データに基づいて推論された出力データとなっている。

　なお、ここまでの説明ではシフトレジスタ回路部２５０は、対応するニューロンセル回路２２０の前段に配していたが、図８に対応する図１１に例示されるように、シフトレジスタ回路部２５０は、対応するニューロンセル回路２２０の後段に配されてもよい。なお、このように、シフトレジスタ回路部２５０がニューロンセル回路２２０の後段に配される場合、連結回路２３０は、シフトレジスタ回路部２５０が出力するｋ×Ｐビットのデータ（ここでｋは１以上ｑ以下の整数であり例えばｋ＝ｑ－１）と、次段のシフトレジスタ回路部２５０へ入力するビット数分の配線とを互いに連結するものとなる。

　本実施の形態のこれらの例によると、音声や振動のように時系列的なデータや、画像等のように空間的な広がりのある情報を表現したデータについて、時間・空間的に互いに隣接あるいは近接した複数の点に関わるデータを利用した機械学習や推論の処理が可能となり、また、時間・空間的に互いに隣接あるいは近接した複数の点のそれぞれに対応したニューロンセル回路２２０を設ける必要がないので、回路規模の増大を抑制できる。

　また、ここまでの説明ではニューロンセル回路２２０を用いて説明したが、これに代えて、記憶部への入力を２系統としてニューロンセル回路２２１や、図４，図５に例示したニューロンセル回路２２２，２２３が用いられてもよい。

［記憶素子を用いた連結回路］
　また、連結回路２３０は、機械学習時にはクロスバスイッチなどを用い、機械学習の完了後は、ビアなどで対応する配線を連結する例として説明してきたが、本実施の形態はこれらの例に限られない。

　本実施の形態のある例では、図１２に例示するように、連結回路２３０は、前段のニューロンセル回路２２０の出力（各ビットに対応した配線列）を配列した第１の配線２３０１と、前段のニューロンセル回路２２０が出力したデータの入力を受け入れ得る側である後段のニューロンセル回路２２０の入力端子に接続された第２の配線２３０２（入力データの各ビットに対応した配線列）とを交差させ、第１の配線２３０１の各ビットに対応した配線と、第２の配線２３０２の各ビットに対応した配線とのすべての交差位置に、記憶素子を用いたスイッチ回路２３０３を配してもよい。

　このスイッチ回路２３０３は、対応する第１の配線２３０１のあるビットに対応する配線Ａと、第２の配線２３０２のあるビットに対応する配線Ｂとを導通させる状態と、導通させない状態とのいずれかの状態となる。この状態は、外部からの指示により切り替えられる。

　具体的に、このスイッチ回路２３０３は、図１３（ａ）に例示するように、ＲｅＲＡＭ等の不揮発性メモリ（ＮＶＭ）セル２３０３Ｃと、スイッチとなるＦＥＴ２３０３Ｑとを含んで構成されてもよい。この例では、ＦＥＴ２３０３Ｑのソース端子（Ｓ）とドレイン端子（Ｄ）とに配線Ａ，Ｂがそれぞれ接続され、そのゲート端子（Ｇ）には不揮発性メモリセル（２３０３Ｃ）のビット線が接続される。

　この不揮発性メモリセル２３０３Ｃは、外部から入力される信号によりスイッチングしてセット動作またはリセット動作を行い、ビット線を介して出力される信号のＨ，Ｌの状態を変化させる。なお、このような不揮発性メモリセル２３０３Ｃの動作やスイッチングの方法は広く知られているため、ここでの説明は省略する。

　ＦＥＴ２３０３Ｑは、不揮発性メモリセル２３０３Ｃのビット線を介して出力される信号が例えばＨであるときにソース端子とゲート端子との間を導通させて配線Ａ，Ｂ間を電気的に連結する。また、ＦＥＴ２３０３Ｑは、不揮発性メモリセル２３０３Ｃのビット線を介して出力される信号が例えばＬであるときにソース端子とゲート端子との間の導通を遮断して、配線Ａ，Ｂ間を電気的に切り離す。

　この構成によると、外部からの信号によって連結回路２３０による、ニューロンセル回路２２０間のデータの受け渡しの状態を変更可能となる。なお、推論処理を行うためにデータの受け渡しの状態を固定する場合であっても、回路を変更する必要はなく、そのままスイッチ回路２３０３を含んだ連結回路２３０を用いて推論の処理などを行ってよい。

　なお、不揮発性メモリセル２３０３Ｃとしては、比較的回路規模の小さいものを用いることとすれば、回路規模の増大も抑制できる。

　さらに、本実施の形態の別の例では、上記のスイッチ回路２３０３は、図１３（ｂ）に例示するように、ＳＲＡＭ等の揮発性のメモリセル２３０３Ｓを用いて構成されてもよい。この揮発性のメモリセル２３０３Ｓを用いたスイッチ回路２３０３の動作は、基本的には、図１３（ａ）に例示したものと同様であり、記憶素子として揮発性のメモリセル２３０３Ｓを採用している点が異なる。

　この例によると、連結回路２３０の設定を動的に切り替えることが容易となり、情報処理装置１を多種の用途に使用することが可能となる。

　また、図１３（ａ），（ｂ）などに例示したように、連結回路２３０を記憶素子を用いて構成する場合、ニューロンセル回路２２０の記憶部２２０３も同種類の記憶素子を用いて構成することとしてもよい。

［チップ化］
　また本実施の形態のニューロンセル回路２２０を配したチップダイＤを形成して、ニューロンセル集積回路２００を、チップとして実現してもよい。さらに、上記チップダイＤを、図１４に例示するように、入力側Ｉと出力側Ｏとを交互にしてパッケージ基板Ｓ上に積層配置して複数のニューロンセル集積回路２００を１つのパッケージに封じてもよい。なお、このパッケージには、ＣＰＵモジュールやＧＰＵ、従来型のＡＩ（ディープラーニングなどの）チップなど、他のチップ部分がさらに含まれてもよい。このようにＣＰＵモジュールなどを組み合わせて備える場合、当該部分を本実施の形態のニューロンセル回路２２０の出力を受け入れて処理する機械学習手段を構成してもよい。この例では、当該ＣＰＵモジュール等で構成される機械学習手段について、さらに機械学習を行ってもよい。

　１　情報処理装置、１０　入力回路部、２０　機械学習回路、３０　出力回路部、２００　ニューロンセル集積回路、２１０　入力側回路、２２０，２２１，２２２，２２３　ニューロンセル回路、２３０　連結回路、２４０　出力側回路、２５０　シフトレジスタ回路部、２２０１　入力部、２２０２，２２０２′　加算器部、２２０３，２２０３′，２２０３″　記憶部、２２０４　演算部、２２０５　加算部、２２０６　出力部。

Claims

　複数のニューロンセル回路を含む機械学習回路であって、
　前記ニューロンセル回路は、
　複数の入力信号を受け入れる入力部と、
　前記入力部が受け入れた入力信号を加算する加算器部と、
　各入力値に応じた非線形関数の出力結果を保持し、前記加算器部が出力する出力信号を入力値として、当該入力値に応じた非線形関数の出力結果を出力する記憶部と、
　を含むニューロンセル回路である機械学習回路。
　請求項１に記載の機械学習回路であって、
　前記複数のニューロンセル回路の一部を出力端回路とし、出力端回路以外の前記複数のニューロンセル回路を中間回路として、前記中間回路に含まれるニューロンセル回路ごとに、当該ニューロンセル回路の出力信号を、他のニューロンセル回路の各々の入力部に接続するか否かを切り替えるスイッチ回路をさらに有し、
　機械学習時においては、前記スイッチ回路を介したニューロンセル回路間の連結関係を更新する機械学習回路。
　請求項１に記載の機械学習回路であって、
　前記複数のニューロンセル回路の一部を出力端回路とし、出力端回路以外の前記複数のニューロンセル回路を中間回路として、前記中間回路に含まれるニューロンセル回路ごとに、当該ニューロンセル回路の出力信号を、他のニューロンセル回路の少なくとも一部の入力部に接続する連結回路を有する機械学習回路。
　請求項１または２に記載の機械学習回路であって、
　前記複数のニューロンセル回路は、それぞれが複数のニューロンセル回路を含む複数のニューロンセル回路群に区分され、
　第ｉ番目（ｉは１以上の自然数とする）のニューロンセル回路群に含まれるニューロンセル回路ごとに、当該ニューロンセル回路の出力信号を、第ｉ+１番目のニューロンセル回路群に含まれるニューロンセル回路の各々の入力部に接続するか否かを切り替えるスイッチ回路をさらに有し、
　機械学習時においては、前記スイッチ回路を介したニューロンセル回路間の連結関係を更新する機械学習回路。
　請求項１または３に記載の機械学習回路であって、
　前記複数のニューロンセル回路は、それぞれが複数のニューロンセル回路を含む複数のニューロンセル回路群に区分され、
　第ｉ番目（ｉは１以上の自然数とする）のニューロンセル回路群に含まれるニューロンセル回路ごとに、当該ニューロンセル回路の出力信号を、第ｉ＋１番目のニューロンセル回路群に含まれるニューロンセル回路の少なくとも一部の入力部に接続する連結回路をさらに有する機械学習回路。
　請求項４に記載の機械学習回路であって、
　第ｉ番目（ｉは１以上の自然数とする）のニューロンセル回路群に含まれるニューロンセル回路の入力部が受け入れる入力信号の数Ｎiが、第ｊ番目（ｊは、ｊ＞ｉなる１以上の自然数）のニューロンセル回路群に含まれるニューロンセル回路の入力部が受け入れる入力信号の数Ｎjより小さい値となるｉ，ｊが存在するよう、各ニューロンセル回路の入力部が受け入れる入力信号の数が設定されてなる機械学習回路。
　請求項１に記載の機械学習回路であって、
　前記複数のニューロンセル回路の一部のニューロンセル回路は、
　その記憶部が、入力値に応じた第１の非線形関数の出力結果を保持し、前記加算器部が出力する出力信号を入力値として、当該入力値に応じた前記第１の非線形関数の出力結果を出力する第１種の記憶部である第１種ニューロンセル回路であり、
　前記複数のニューロンセル回路のうち前記第１種ニューロンセル回路とは異なるニューロンセル回路の少なくとも一つは、その記憶部が、入力値に応じた、前記第１の非線形関数とは異なる第２の非線形関数の出力結果を保持し、前記加算器部が出力する出力信号を入力値として、当該入力値に応じた前記第２の非線形関数の出力結果を出力する第２種の記憶部である第２種ニューロンセル回路である機械学習回路。
　請求項４に記載の機械学習回路であって、
　第ｉ番目（ｉは１以上の自然数とする）のニューロンセル回路群に含まれるニューロンセル回路の少なくとも一部のニューロンセル回路の前記記憶部は、入力値に応じた第１の非線形関数の出力結果を保持し、前記加算器部が出力する出力信号を入力値として、当該入力値に応じた前記第１の非線形関数の出力結果を出力する第１種の記憶部である第１種ニューロンセル回路であり、
　第ｉ番目（ｉは１以上の自然数とする）のニューロンセル回路群に含まれるニューロンセル回路のうち前記第１種ニューロンセル回路とは異なるニューロンセル回路の少なくとも一つは、その記憶部が、入力値に応じた、前記第１の非線形関数とは異なる第２の非線形関数の出力結果を保持し、前記加算器部が出力する出力信号を入力値として、当該入力値に応じた前記第２の非線形関数の出力結果を出力する第２種の記憶部である第２種ニューロンセル回路である機械学習回路。
　請求項１に記載の機械学習回路であって、
　前記複数のニューロンセル回路を配したダイを備え、チップ化されてなる機械学習回路。
　請求項１に記載の機械学習回路であって、
　ニューロンセル回路に対応して設けられるシフトレジスタ回路部であって、
　所定のタイミングごとにデータの入力を受け入れ、過去の所定の回数に亘って入力されたデータを保持し、当該保持したデータの少なくとも一部を前記所定のタイミングで、後段のニューロンセル回路に出力するシフトレジスタ回路部を備える機械学習回路。
　複数のニューロンセル回路を含む機械学習回路を具備した情報処理装置であって、
　前記ニューロンセル回路が
　複数の入力信号を受け入れる入力部と、
　前記入力部が受け入れた入力信号を加算する加算器部と、
　各入力値に応じた非線形関数の出力結果を保持し、前記加算器部が出力する出力信号を入力値として、当該入力値に応じた非線形関数の出力結果を出力する記憶部と、
　を含むニューロンセル回路である、情報処理装置。