JP2000322400A

JP2000322400A - 情報処理装置

Info

Publication number: JP2000322400A
Application number: JP11128538A
Authority: JP
Inventors: Sukeji Kato; 典司加藤; Hirotsugu Kashimura; 洋次鹿志村
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 1999-05-10
Filing date: 1999-05-10
Publication date: 2000-11-24

Abstract

(57)【要約】【課題】多くのプロセッサユニットが独立かつ高速に
動作でき、かつ、ニューロン出力を簡単な制御系で伝達
できる大規模ニューラルネットワークを実験した情報処
理装置を提供する。【解決手段】同一の物理アドレスを持つ複数のメモリ
ブロック１４₁〜１４_n+1から構成されたニューロン出力
保存メモリ１６と、各メモリブロック１４₁〜１４_nに１
対１で接続され、独立してニューロン演算を行い、得ら
れたニューロン出力値を予め指定されたアドレスに書き
込む複数のプロセッサユニット１０₁〜１０_nと、それぞ
れ接続されたプロセッサユニット１０₁〜１０_nに割り当
てられたニューロンの演算に必要なシナプス係数を格納
する複数のシナプス係数メモリ１２₁〜１２_nと、１つの
メモリブロック１４_n+1に接続され、予め指定されたア
ドレスのメモリに書き込まれる値の変動の収束を判定す
る収束判定回路１８と、装置全体を制御する制御部２０
とを備える。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、情報処理装置に係
り、特に、ニューラルネットワークを利用して情報処理
を行う情報処理装置に関する。

【０００２】

【従来の技術】一般に脳を中心とする神経系は、ニュー
ロンと呼ばれる神経細胞を単位とし、このニューロンが
多数複雑に結合して神経回路網を構成している。個々の
ニューロンは、樹状突起と呼ばれる枝状の線維の集合と
軸索と呼ばれる長い側枝を持つ線維とから成る。

【０００３】インパルスと呼ばれるパルス状の電位変化
が他のニューロンから樹状突起に受け渡されるが、この
インパルスは樹状突起から軸索を伝播する。インパルス
が軸索を伝播して軸索の出力端であるシナプスに達する
と、シナプスと結合する他のニューロンの樹状突起や細
胞にグルタメイトやアセチルコリンなどの神経伝達物質
を放出する。

【０００４】シナプスには、そこで起こった信号伝達の
履歴に応じて、自身の伝達効率を変化させ、他のニュー
ロンに伝達するインパルスのレベルを変えるという性質
がある（シナプス可塑性）。そのため、シナプスと結合
する他のニューロンには、信号伝達の履歴に応じた大き
さのインパルスが受け渡されることとなる。

【０００５】脳を中心とする神経系における情報処理
は、このようなニューロンからニューロンへの信号伝播
のネットワーク全体にわたる集積によって行われる。な
お、各シナプスにおける伝達効率の可塑的変化は、神経
系全体の自己組織化の素過程であると考えられている。

【０００６】このような脳を中心とする神経系における
情報処理を応用してニューラルネットワークを構築した
場合、各ニューロンに対応する信号伝達ユニットを複数
備えたものとして構成される。

【０００７】すなわち、一つのニューロンjは、他のニ
ューロンiから入力x_iを入力する。そして、それぞれの
入力に対しシナプス係数w_ijで重みづけを行い、その総
和u_jを演算する。この値を例えばシグモイド関数？によ
って変換し、出力x_jを出力値とする。この動作を式で示
すと以下の（１）の式のようになる。

【０００８】

【数１】この演算をフォワード演算という。また、一般的に使用
されるバックプロパゲーションによる学習過程において
は、与えられた入力に対して期待する出力値d_iを外部か
ら与え、実際の出力値との誤差が少なくなるようにシナ
プス係数w_ijを更新していく。その更新量は以下の
（２）の式で演算される。

【０００９】

【数２】ここで、ηは学習係数、δ_jは学習誤差である。また、
出力層では、以下の（３）の式で演算を行う。

【００１０】

【数３】また、中間層では、以下の（４）の式で演算を行う。

【００１１】

【数４】このような演算を数千から数万のニューロンからなる大
規模ニューラルネットワークで行う場合、膨大な演算量
となり、専用の情報処理機構が必要となる。

【００１２】従来技術として提案されている特開平５‐
１９７７０７号公報には、図７に示すように、各々シナ
プス係数メモリ６２₁〜６２_n（但し、ｎは整数）を有す
る複数のプロセッサユニット６０₁〜６０_n（但し、ｎは
整数）が、コントローラ６６に接続する時分割バス６４
によって並列に結合された構成の情報処理システムが開
示されている。

【００１３】この情報処理システムでは、各々のプロセ
ッサユニット６０₁〜６０_nは特定のニューロン処理を受
け持ち、コントローラ６６により選択された１つのプロ
セッサユニット（図７の状態では第２プロセッサユニッ
ト６０₂）のみがニューロン演算値を時分割バス６４に
出力する。

【００１４】各プロセッサユニット６０₁〜６０_nは、出
力しているプロセッサユニット（図７の状態では第２プ
ロセッサユニット６０₂）のニューロン演算値に対する
シナプス係数をメモリに保持しており、時分割バス６４
から入力する値に対応するシナプス係数をメモリから読
み出して重み付けし、その積を累積加算する。

【００１５】また、コントローラ６６に選択されたプロ
セッサユニット（図７の状態では第２プロセッサユニッ
ト６０₂）は、累積加算した値を、例えば、シグモイド
関数f（上記（１）の式）によって変換して時分割バス
６４に出力する。各プロセッサユニット６０₁〜６０_nの
時分割バス６４への出力が一通り行われれば、すべてが
（１）の式の演算を行うこととなる。

【００１６】特開平５‐１９７７０７号公報では、以上
説明した構成による並列演算によって大規模ニューラル
ネットワークを構築している。

【００１７】

【発明が解決しようとする課題】しかしながら、前記従
来技術では、時分割バス６４には多数のプロセッサユニ
ットが接続される構成であるため、時分割バス６４のク
ロックを高くすることができず、各プロセッサユニット
に高速にニューロン演算値を供給することができない。
すなわち、バスの転送クロックを高速化できないため、
ニューロン出力の伝達がボトルネックとなり、処理速度
があまり向上しないという問題点がある。

【００１８】また、すべてのプロセッサユニットにデー
タを同時に供給するため、不必要なデータまで受け取っ
てしまう。これらのことから各プロセッサユニットはデ
ータ供給律速となり、高速に演算することができないと
いう問題がある。

【００１９】以上の問題を解決するために、シナプス係
数だけでなく、ニューロン演算値も各プロセッサユニッ
トに持たせる構成が考えられるが、この場合、演算によ
ってニューロン演算値が変化すると、各プロセッサユニ
ットが持っているニューロン演算値を変更しなければな
らない。

【００２０】そのため、プロセッサユニット間で通信を
行う構成とすることが必要となるが、多数のプロセッサ
ユニット間で通信可能となるようにするには構成が複雑
となり、そのための制御回路が大きくなる。したがって
多くのプロセッサユニットを実装できなくなり、大規模
ニューラルネットワークの実現が難しいという問題があ
る。

【００２１】以上のことから本発明は、多くのプロセッ
サユニットが独立かつ高速に動作でき、かつ、ニューロ
ン出力を簡単な制御系で伝達できる大規模ニューラルネ
ットワーク計算用情報処理装置を提供することを目的と
する。

【００２２】

【課題を解決するための手段】上記目的を達成するため
に請求項１の発明の情報処理装置は、各々シナプス係数
を格納した複数のシナプス係数メモリと、各々同一の物
理アドレスを持ち、かつ、ニューロン出力値を記憶する
複数のメモリブロックを備えたニューロン出力保存メモ
リと、各々少なくとも１つの前記メモリブロック及び１
つの前記シナプス係数メモリに接続され、前記シナプス
係数及びニューロン出力値を独立して読出し、各々予め
定められた特定のニューロン演算を独立して行い、得ら
れたニューロン出力値を前記複数のメモリブロックの予
め割り当てられた同一アドレスの各々に書き込む複数の
プロセッサユニットと、を備える。

【００２３】即ち、請求項１の発明の情報処理装置で
は、複数のプロセッサユニットの各々が少なくとも１つ
のメモリブロックと接続されており、全てのメモリブロ
ックが同一の物理アドレスを有するため、各プロセッサ
ユニットがそれぞれ互いの演算結果を取り込みながら独
立して予め割り当てられたニューロン演算を行うことが
できる。

【００２４】各プロセッサユニットのニューロン演算
は、請求項２に記載したように、各々予め割り当てられ
た特定のニューロン演算を複数回繰り返して行い、演算
値が前回の演算値と異なる場合に前記メモリブロックに
書き込む構成とすることにより、無駄な処理がなく、そ
の分高速に動作できるので好ましい。また、他のプロセ
ッサユニットの演算結果が変動しても直ちに変動した演
算結果を取り込んで自身のニューロン出力を修正できる
という利点もある。

【００２５】さらに、請求項３に記載の発明は、請求項
２に記載の情報処理装置において、前記複数のメモリブ
ロックの１つに接続され、前記メモリブロック内の予め
定めたアドレスのニューロン出力値を一定時間ごとに読
み出してニューロン出力値が収束したかを判定する収束
判定手段と、前記収束判定手段により予め定めたアドレ
スのニューロン出力値の全てが収束したと判定された場
合、全てのプロセッサユニットの演算を終了するように
制御する制御手段と、をさらに備える。

【００２６】即ち、各プロセッサユニットの演算により
得られるニューロン出力値は、始めのうちは変動するが
徐々にある一定の値に収束していく。請求項３の発明で
は、収束判定手段が、予め定めたアドレスのニューロン
出力値を一定時間ごとに読み出してニューロン出力値が
収束したかを判定して制御手段がすべてのプロセッサユ
ニットの演算が終了するように制御することにより、必
要なニューロン演算結果を効率よく検出でき、必要なニ
ューロン演算結果が得られれば直ちに演算を終了できる
ので処理効率が良い。

【００２７】なお、各々独立して演算する複数のプロセ
ッサユニットでは、前記メモリブロックの対応するアド
レスにニューロン出力値の書き込みを行うタイミングが
重なる場合があるが、請求項４に記載のように前記複数
のプロセッサユニットのいずれか１つに書き込みを行う
権利を受け渡すように構成することによって、ニューロ
ン出力値の書き込みを行うタイミングが重なっても、予
期しない不備が生じることなく効率的にニューロン出力
値の書き込みを行うことができる。

【００２８】このような情報処理装置におけるニューロ
ン出力保存メモリは、請求項５記載に記載したように、
同一の物理アドレスを持ち、かつ、ニューロン出力値を
記憶する複数のメモリブロックに加えて、前記メモリブ
ロックと該メモリブロックに対応する前記プロセッサユ
ニットとを接続し、前記メモリブロック内のアドレスの
ニューロン出力値を該接続された前記プロセッサユニッ
トに出力するための出力データバスと、前記メモリブロ
ックと該メモリブロックに対応する前記プロセッサユニ
ットとを接続し、前記プロセッサユニットからの読出制
御信号を前記メモリブロックに入力する読出制御線と、
前記読出制御線からの読出制御信号に基いてメモリブロ
ック内のアドレスを指定し、メモリブロック内のアドレ
スのニューロン出力値が前記出力データバスを介して読
み出されるように制御する読出制御手段と、全ての前記
複数のメモリブロックとプロセッサユニットとに共有さ
れた入力データバスと、全ての前記複数のメモリブロッ
クの同一のアドレスと、該アドレスに割り当てられた１
つの前記プロセッサユニットとを接続する複数の書込選
択信号線と、前記複数の書込選択信号線の１つから入力
される前記プロセッサユニットからの書込制御信号によ
り指定された前記複数のメモリブロック内の同一アドレ
スに、前記入力データバスを介してニューロン出力値が
書き込まれるように制御する書込制御手段と、をさらに
備えるように構成するとよい。

【００２９】この場合、メモリブロックは、請求項６に
記載したように、アドレスに各々対応して設けられた複
数のメモリセルにより構成され、前記メモリセルのそれ
ぞれに、前記読出制御線と前記書込選択信号線とが接続
する構成とすることができる。

【００３０】また別のメモリブロックとしては、請求項
７に記載したように、マトリクス状に配置され、かつ、
前記書込制御線からの書込制御信号がマトリクス内の列
アドレスと行アドレスとの組と１体１に対応する複数の
メモリセルにより構成することができる。

【００３１】

【発明の実施の形態】以下、図１〜図６を参照して相互
結合型のニューラルネットワークに本発明を適用した実
施の形態を詳細に説明する。

【００３２】（第１の実施の形態）図１に示すように第
１の実施の形態の情報処理装置は、大別して、複数のプ
ロセッサユニット１０₁〜１０_n（但し、ｎは整数）、複
数のシナプス係数メモリ１２₁〜１２_n、ニューロン出力
保存メモリ１６、収束判定回路１８、制御部２０、拡張
インターフェース２２、ホストインターフェース２４と
から構成される。

【００３３】複数のプロセッサユニット１０₁〜１０
_nは、各々予め割り当てられた２つのニューロンに関す
るニューロン演算を交互に行う。すなわち、具体的に
は、第１プロセッサユニット１０₁にはニューロン１の
演算とニューロン２の演算とが割り当てられ、ニューロ
ン１の演算が終了した後、ニューロン２の演算を行い、
第２プロセッサユニット１０₂にはニューロン３の演算
とニューロン４の演算とが割り当てられ、ニューロン３
の演算が終了した後、ニューロン４の演算を行い、…第
ｎプロセッサユニット１０_nはニューロン２ｎ−１の演
算とニューロン２ｎの演算とが割り当てられ、ニューロ
ン３の演算が終了した後、ニューロン４の演算を行うよ
うに構成されている。なお、詳細は後述する。

【００３４】また、複数のシナプス係数メモリ１２₁〜
１２_nは、プロセッサユニット１０₁〜１０_n（但し、ｎ
は整数）に１対１で接続されており、それぞれ接続され
たプロセッサユニットに割り当てられたニューロンの演
算を行うのに必要なシナプス係数を格納する。このシナ
プス係数はホストインターフェース(Host I/F)２４を介
して入力されたホストコンピュータからの指示に基いて
後述する制御部２０が各シナプス係数メモリ１２₁〜１
２_nにシステムバス３２、接続されたプロセッサユニッ
ト１０₁〜１０_nを介して与えられる。

【００３５】ニューロン出力保存メモリ１６は、複数の
メモリブロック１４₁〜１４_n+1から構成されている。各
メモリブロック１４₁〜１４_n+1には、読み出し制御線２
６₁〜２６_nおよび読み出しデータバス２８₁〜２８_nによ
りプロセッサユニット１０₁〜１０_nが１対１で接続され
ている。

【００３６】また、各メモリブロック１４₁〜１４
_n+1は、アドレス１〜２ｎに対応する２ｎ個のメモリセ
ル１５₀〜１５_2n-1を備えている(図３参照)。メモリブ
ロック１４₁〜１４_n+1における同一アドレスの全てのメ
モリセルと該メモリセルに対応するプロセッサユニット
(例えば、第０メモリセル１５₀であれば第１プロセッサ
ユニット１０₁)とは書込選択信号線３０により接続され
ている。この書込選択信号線３０は全てのアドレスと該
アドレスに対応するプロセッサユニットとを接続してお
り、本第１の実施の形態では、２ｎ本の書込選択信号線
３０₁〜３０_2nが設けられている。

【００３７】これにより、例えば、第１プロセッサユニ
ット１０₁から対応する第１メモリブロック１４₁の第０
メモリセル１５₀に新たにニューロン出力値が書き込ま
れると、この第０メモリセル１５₀に接続する第１書込
選択信号線３０₁により書込選択信号が出力され、書込
データバス３４から第０メモリセル１５₀の新たなニュ
ーロン出力値が読込まれ、全てのメモリブロック１４₂
〜１４_2nのメモリセル１５₀に書き込まれる。これによ
り、全てのメモリブロック１４₁〜１４_n+1は同一の値を
記憶することとなる。なお、メモリブロック１４₁〜１
４_n+1の構成については後述する。

【００３８】収束判定回路１８は、第ｎ＋１メモリブロ
ック１４_n+1と接続されており、制御部２０から予め指
定されたアドレスのメモリセルのニューロン出力値を第
ｎ＋１メモリブロック１４_n+1から読み出して監視し、
ニューラルネット全体の演算が収束したかどうかを判定
する。

【００３９】また、制御部２０は、ホストインターフェ
ース(Host I/F)２４を介して入力されたホストコンピュ
ータからの指示に基いて、例えば、演算の開始および停
止などの各プロセッサユニットの動作をシステムバス３
２を用いて制御したり、監視するプロセッサユニットの
指示を収束判定回路１８に出したり、ユーザが構築した
ネットワークに対応して決定されるシナプス係数をシス
テムバス３２及びプロセッサユニット１０を経由して各
シナプス係数メモリ１２₁〜１２_nに付与するなどの制御
を行う。また、本情報処理装置をマルチチップ構成にす
る場合に他のチップとの通信を拡張インターフェース２
２を介して行う。

【００４０】ここで、プロセッサユニット１０₁〜１０_n
の構成について図２を参照して説明する。図２に示すよ
うに、プロセッサユニット１０₁〜１０_nは、大別して、
乗算器４０、加算器４２、累積結果を保持する累積保持
レジスタ４４、非線型出力回路４６、ニューロン出力保
存レジスタ４８、比較器５０とから構成される。

【００４１】各プロセッサユニット１０₁〜１０_nは、そ
れぞれ対応して接続された読み出し制御線２６₁〜２６_n
および読み出しデータバス２８₁〜２８_nを介してメモリ
ブロック１４₁〜１４_nからニューロン演算に必要なニュ
ーロン出力値を順次読み出す。このニューロン出力値の
読み出しは、各プロセッサユニット１０₁〜１０_nごとに
独立して行う構成である。

【００４２】読み出されたニューロン出力値は、ニュー
ロン出力読み出しＩ／Ｆ３６を介して乗算器４０に入力
される。乗算器４０は、シナプス係数読出（Ｒ）／書き
込み（Ｗ）Ｉ／Ｆ３８を介してシナプス係数メモリ１２
と接続されており、割り当てられたニューロン演算に必
要なシナプス係数を読み出して入力された値と乗算した
後、加算器４２に出力する。

【００４３】加算器４２は、入力された値を累積保持レ
ジスタ４４から読み出した値に加算して累積保持レジス
タ４４に出力する。この積和演算は全シナプスの個数回
行われ、最終的な積和結果が非線型出力回路４６に出力
されてニューロン出力値に変換される。

【００４４】得られたニューロン出力値は、ニューロン
出力保存レジスタ４８に保存されると共に、比較器５０
に出力される。比較器５０では、前回の演算でニューロ
ン出力保存レジスタ４８に保存されているニューロン出
力値と今回の演算で新たに入力されたニューロン出力値
とを比較し、異なる場合に今回の演算で新たに入力され
たニューロン出力値をニューロン出力書き込み（Ｗ）Ｉ
／Ｆ５４を介してニューロン出力保存メモリ１６に書き
込む。

【００４５】このときのニューロン出力保存メモリ１６
への書き込み権利は、常に１つのプロセッサユニットの
みに与えられる。そのため、各プロセッサユニット１０
₁〜１０_nには、書き込み権利の有無を表すフラグ５２が
設けられており、フラグ５２が１となっているプロセッ
サユニットがニューロン出力保存メモリ１６へ書き込み
権利を有し、対応するメモリセルに書き込みを行う。こ
の書き込み権利は、常に１つのプロセッサユニットのみ
に与えられるように、プロセッサユニット間で順に受け
渡されることにより、書き込みの調停が行われている。
なお、書き込み権利の受け渡しについての詳細は後述す
る。

【００４６】本第１の実施の形態では、１つのプロセッ
サユニットに２つのニューロン演算を割り当てた構成と
しているため、１つのプロセッサユニットはそれぞれ２
つの書込選択信号線と接続され、各々対応するニューロ
ン演算の結果を出力する。

【００４７】例えば、第１プロセッサユニット１０₁が
書き込み権利を有し、ニューロン１の演算結果を書き込
む場合、第１書込選択信号線３０₁がアサートされる。
第１プロセッサユニット１０₁の演算結果は書込データ
バス３４に出力されており、第１書込選択信号線３０₁
がアサートされると、書込データバス３４を介してニュ
ーロン１の新たなニューロン出力値が全てのメモリブロ
ック１４₁〜１４_n+1のニューロン１に対応する第０ビッ
トのメモリセル１５₀に書き込まれる。

【００４８】また、第１プロセッサユニット１０₁が書
き込み権利を有し、ニューロン１とニューロン２の演算
結果を書き込む場合は、上述の動作の次に、第２書込選
択信号線３０₂がアサートされ、書込データバス３４を
介してニューロン２の新たなニューロン出力値が全ての
メモリブロック１４₁〜１４_n+1のニューロン２に対応す
るアドレス１のメモリセル１５₁に書き込まれる。この
書き込み動作は第２〜第ｎプロセッサユニット１０₂〜
１０_nについても同様であるので説明は省略する。

【００４９】ここで、ニューロン出力保存メモリ１６を
構成するメモリブロック１４の構成について図３を参照
して説明する。なお、図３では、説明のため、第１メモ
リブロック１４₁について説明するが、第２メモリブロ
ック１４₂から第ｎ＋１メモリブロック１４_n+1について
も同様である。

【００５０】図３に示すように、メモリブロック１４₁
は、アドレス１〜２ｎに対応する２ｎ個の１ビットのメ
モリセル１５₀〜１５_2n-1を列方向に配置して一組とす
るメモリセル群を、ニューロン出力値のビット長である
８ビット分並べたメモリセル群を備えた構成である。

【００５１】各メモリセル１５₀〜１５_2n-1は、データ
入力端子、データ出力端子、データ読み出し選択端子お
よびデータ書込選択端子をもつフリップフロップからな
る２ポートＳＲＡＭセルであり、データ書込選択端子が
ハイの時にデータ入力端子のデータが書き込まれ、一
方、データ読み出し選択端子がハイの時にデータ出力端
子にメモリセルのデータが出力される。

【００５２】各メモリセル１５₀〜１５_2n-1のデータ読
み出し選択端子は、シフトレジスタ５６と接続する読み
出しアドレス選択線５８₁〜５８_2nに接続されており、
各メモリセル１５₀〜１５_2n-1のデータ書込選択端子は
それぞれ書込選択信号線３０₁〜３０_2nに接続される。

【００５３】また、各メモリセル群の第０ビットのメモ
リセル１５₀のデータ出力端子はすべて読み出しデータ
バス２８₁の第0ビット線に、データ入力端子はすべて書
込データバス３４の第0ビット線に接続される。第１ビ
ット以降のメモリセル１５₁〜１５_2n-1についても同様
である。

【００５４】また、シフトレジスタ５６は読み出し制御
線２６₁に接続されている。シフトレジスタ５６が読み
出し制御線２６₁をトグルするたびに、読み出しアドレ
ス選択線５８₁〜５８_2nが順に選択されて、アドレス1〜
２ｎのデータが読み出しデータバス２８₁に順次出力さ
れる。一方、データの書き込み時は、シフトレジスタ５
６は書込選択信号線３０₁〜３０_2nのいずれかをアサー
トする。これにより、書込データバス３４上のデータに
対応するアドレスのメモリセルに、書込データバス３４
上のデータが書き込まれる。

【００５５】なお、書込選択信号線３０₁〜３０_2nおよ
び書込データバス３４はすべてのブロックに接続されて
いるため、書き込みには読み出しの数倍以上の時間を要
する。この書き込み時間内に同じアドレスに対して同時
に読み出しを行った場合、書き込み前のデータか書き込
み後のデータのどちらが読み出されるかは保証されな
い。そのため、制御部２０は収束判定回路１８からネッ
トワークの出力ニューロンのニューロン演算が収束した
との判定を受けると、演算終了信号を全プロセッサユニ
ットに出力して全プロセッサユニットの演算を終了させ
ている。

【００５６】次に、本実施の形態の複数のプロセッサユ
ニット１０₁〜１０_nうちの１つのプロセッサユニット１
０の動作を図４のフローチャートを用いて説明する。な
お、ここでは各プロセッサユニットに第ｉ番目のニュー
ロンと第ｉ+１番目のニューロンとの２つのニューロン
を設けてあるため、ニューラルネットワーク全体のニュ
ーロン数は２ｎである。

【００５７】まず、ステップ１００では、制御部８０か
ら入力された開始信号により第１番目のニューロンを選
択する。なお、ここでは、プロセッサユニットに割り当
てられた２つのニューロンのうち、始めに演算を行う対
象となるニューロンを第１番目のニューロン、次に演算
を行うニューロンを第２番目のニューロンとする。

【００５８】次のステップ１０２では、第１番目のニュ
ーロン演算においてｊ＝０とし、ステップ１０４におい
て選択したニューロンに対応するシナプス係数w_ijを読
み出してシナプス係数メモリに書き込む。

【００５９】即ち、第１番目のニューロンを選択し、第
１番目のニューロンの順方向の演算を行う場合は、
（１）の式におけるシナプス係数w_ij(ｊ＝０〜２ｎ−
１)が、逆方向の演算を行う場合には、（２）の式にお
けるシナプス係数w_ij(ｊ＝０〜２ｎ−１)がシナプス係
数メモリに書き込まれることとなる。なお、順方向と逆
方向の演算を効率よく行うために、両者をシナプス係数
メモリに保存しておいてもよい。

【００６０】次のステップ１０６では、ｊ＝０のときの
ニューロン演算に必要なニューロン出力値をメモリブロ
ック１４から読み出す。その後のステップ１０８では、
読み出したシナプス係数w_ijとニューロン出力値とを乗
算した後、前回の演算で得られた値に加算する積和演算
を行う。

【００６１】次のステップ１１０では、全てのニューロ
ン（ｊ＝０、１、２、…、２ｎ）の出力値について積和
演算が終了したかを判断する。全てのニューロンの出力
値について積和演算が終了していない場合（即ち、ｊ＜
２ｎ）は、ステップ１２０に移行してｊをインクリメン
トし、ステップ１０４に戻り、上述の積和演算を繰り返
す。

【００６２】ステップ１１０において全てのニューロン
の出力値について積和演算が終了したと判断した場合
（即ち、ｊ＝２ｎ）は、ステップ１１２に移行してこの
演算で最終的に得られた値をシグモイド関数（上述した
（１）の式）によって変換し、ニューロン出力値x₀を得
て、次のステップ１１４に移行する。

【００６３】ここで、本実施の形態では、複数のプロセ
ッサユニットが各々独立して演算を行うため、或るプロ
セッサユニットの演算によりニューロン出力値が変化す
るとそのニューロン出力値を使用した他のプロセッサユ
ニットのニューロン出力値も変化することとなる。

【００６４】そのため、ステップ１１４では、得られた
ニューロン出力値x₀が前回の演算で得られたニューロン
出力値から変化したかを判断する。ステップ１１４にお
いてニューロン出力値が変化したと判断した場合は、ス
テップ１１６に移行して書き込み権利があるか否かを判
断し、書き込み権利があれば、ステップ１１８に移行
し、書込選択信号線３０をアサートし、ニューロン出力
保存メモリ１６中の全てのメモリブロックのアドレス０
のメモリセル１５₀に、得られたニューロン出力値x₀を
書き込んでからステップ１２０に移行する。

【００６５】この書き込みはすべてのメモリブロック１
４₁〜１４_n+1に対して行われるため、例えば１０クロッ
ク程度を必要とする。ステップ１１６において書込み権
利がない場合は、次のニューロンの演算処理が続けられ
る。

【００６６】一方、ステップ１１４において、得られた
ニューロン出力値x₀が前回の演算で得られたニューロン
出力値から変化していないと判断した場合、即ち、ニュ
ーロン出力値が０である場合は書き込む必要がないので
ステップ１２０に移行する。

【００６７】ステップ１２０では、プロセッサユニット
内の全てのニューロン演算及び書込みが必要なニューロ
ン出力値の書き込みが終了したかを判断する。終了して
いないと判断した場合は、ステップ１２８に移行して次
のニューロン（即ち、第１番目のニューロンの演算が終
了した後であれば第２番目のニューロン）を選択し、再
びステップ１０２に戻って上述の処理を繰り返す。

【００６８】ステップ１２０において終了したと判断し
た場合は、ステップ１２２に移行して書込み権利を次の
プロセッサユニットに受け渡し、ステップ１２４に移行
する。

【００６９】ステップ１２４では、制御部２０から演算
終了信号が入力されたかを判断する。入力されていない
と判断した場合は、再びステップ１００に戻って上述の
作用を繰り返す。このように演算終了信号が入力される
まで演算を繰り返すことによって、更新された新しい値
による演算値を確実に得ることができる。なお、ステッ
プ１２４において制御部２０から演算終了信号が入力さ
れたと判断した場合は、本ルーチンを終了する。

【００７０】また、本実施の形態では、プロセッサユニ
ットには２つのニューロンが割り当てられているため、
各々のプロセッサユニットは第１番目と第２番目のニュ
ーロンを有する構成であるが、プロセッサユニットに３
つ以上のニューロンを割り当てる構成とすることもで
き、この場合、演算を行う順に第１番目、第２番目、第
３番目、…というように演算する順番を設定し、以上の
演算をすべての割り当てられたニューロンについて順に
行う。

【００７１】次に、非同期に動作する複数のプロセッサ
ユニットが並列に動作して、ニューラルネットワークの
演算を行う場合の動作を、図５のタイムチャートを用い
て説明する。図５のタイミングチャートは、1〜２ｎの
シナプスに対して積和演算し、その演算結果によってニ
ューロン出力が変化した場合に、ニューロン出力保存メ
モリ１６に書き込む動作を表したものである。なお、図
５では、説明を解かりやすくするため第１から第４の４
つのプロセッサユニット１０₁〜１０₄の動作について説
明する。

【００７２】まず、図５の期間Ｉは、第１プロセッサユ
ニット１０₁が第１番目のニューロンに関する1回目の積
和演算を終了し、その結果に基づいてニューロン出力1
をニューロン出力保存メモリ１６に新たな値を書き込ん
だ期間である。

【００７３】この期間Ｉにおいて、第２プロセッサユニ
ット１０₂では第１のニューロンの積和演算の１番目の
シナプスの演算は既に終了しているので、第１プロセッ
サユニット１０₁が書き込んだ新たな値は反映されてい
ないが、第２のニューロンの積和演算はまだ行われてい
ないので、第２のニューロンの積和演算における１番目
のシナプスの演算には第１プロセッサユニット１０₁が
書き込んだ新たな値が反映されることとなる。

【００７４】また、期間Ｉは第３プロセッサユニット１
０₃の第２のニューロンの積和演算における１番目のシ
ナプスの演算中となるため、第１のニューロンの積和演
算の１番目のシナプスの演算には第１プロセッサユニッ
ト１０₁が書き込んだ新たな値が反映されない。また、
第２のニューロンの積和演算においては、１番目のシナ
プスの演算に書き込む前の値が反映されるか、書き込み
後の新たな値が反映されるかは不確かとなる。

【００７５】さらに、第４プロセッサユニット１０₄に
おいては第１のニューロンの積和演算の１番目のシナプ
スの演算は既に終了しており、第２のニューロンの積和
演算も第１プロセッサユニット１０₁が新たな値を書き
込む前に終了しているので、反映されていない。この第
４プロセッサユニット１０₄では、２回目以降の第１の
ニューロン及び第２のニューロンの積和演算に第１プロ
セッサユニット１０₁が書き込んだ新たな値が反映され
ることとなる。

【００７６】このように、いずれの場合も、１回の積和
演算では、新たな値が反映されない場合もあるが、２回
目、３回目と積和演算を繰り返すことにより、正しいニ
ューロン出力値が演算に反映されていくこととなる。

【００７７】したがって、本実施の形態では、収束判定
回路１８（図１参照）が出力ニューロンの出力値を絶え
ずモニターし、この値が収束した時に最終的に演算を終
了したと判断する。

【００７８】以上のプロセスにより、個々のプロセッサ
ユニットに複雑な制御系を持たせなくとも、ニューラル
ネットの演算を行うことができる。

【００７９】また、学習サンプルを次々にニューラルネ
ットワークに入力して学習をおこなうような処理の場
合、各ニューロンの出力値は大きく変化しない。このよ
うな場合は、ニューロン出力保存メモリ3に前回のサン
プルに対する各ニューロンの出力値が保存されているの
で、早く収束させることができる。

【００８０】また、図５の期間IIは、第１プロセッサユ
ニット１０₁の３回目の積和演算、即ち、第１プロセッ
サユニット１０₁の第１番目のニューロンの２回目の積
和演算によるニューロン出力をニューロン出力保存メモ
リ１６に書き込んでいる期間である。

【００８１】この期間に第３プロセッサユニット１０₃
の2回目の積和演算が終了し、ニューロン出力保存メモ
リ3への書き込み要求が発生している。このとき書き込
み権は第１プロセッサユニット１０₁にあるため、第３
プロセッサユニット１０₃の書き込みは待たされる。第
１プロセッサユニット１０₁の書き込みが終わると、書
き込み権は第２プロセッサユニット１０₂に渡される。

【００８２】ここでは、第２プロセッサユニット１０₂
は演算値が前回の値と変わらず新たにデータを書き込む
必要が無いので次のクロックで書き込み権を第３プロセ
ッサユニット１０₃に渡す(期間III)。

【００８３】第３プロセッサユニット１０₃は第２プロ
セッサユニット１０₂から書き込み権が渡されて始めて
書き込みを行う（期間IV）。この期間IVでは、さらに、
第３プロセッサユニット１０₃の書き込み中に第４プロ
セッサユニット１０₄に書き込み要求が発生して、再び
プロセッサユニット間で競合が発生している。

【００８４】この場合も第３プロセッサユニット１０₃
の書き込みの終了後に書き込み権が渡されるまで、第４
プロセッサユニット１０₄の書き込みは開始せず、書き
込み権が第４プロセッサユニット１０₄に渡されてから
第４プロセッサユニット１０₄が書き込みを開始する(期
間V)。なお、書き込み権が渡されるまで書き込み処理は
遅延されているが、次の積和演算は行っている。

【００８５】このように本実施の形態によれば、プロセ
ッサユニットはローカルに接続されたデータのみを用い
て積和演算できるため、演算速度を高くすることができ
る。また、特別なプロトコル無しにニューロン出力値を
共有できるため、複雑な制御回路を必要とせず、回路規
模を小さくできる。

【００８６】なお、上記の本実施の形態では、ニューロ
ン出力保存メモリ１６のメモリセル１４₁〜１４_nとして
ＳＲＡＭを用いたが、ＤＲＡＭセルでもよい。また、ニ
ューロン出力保存メモリ１６からの読み出しは、シフト
レジスタ５６を用いて順次読み出したが、アドレス信号
によって任意のアドレスを読み出す構成にしてもよい。
この場合、シナプス係数メモリ１２にシナプス係数とそ
れに対応するニューロン出力値が格納されたアドレスを
同時に保存し、そのアドレスを用いてニューロン出力を
読み出す構成となる。

【００８７】さらに、本第１の実施の形態では、１つの
プロセッサユニットが２つのニューロンの関する演算を
交互に行う構成としているが、もちろん２つに限らず、
１つのプロセッサユニットが３つ以上のニューロンに関
する演算を行うように構成することもできる。

【００８８】なお、書き込み選択線はメモリブロックの
アドレスと一対一に対応する必要はなく、アドレスをエ
ンコードしたものでもよい。

【００８９】（第２の実施の形態）図６は、本発明の第
２の実施の形態の情報処理装置におけるニューロン出力
保存メモリ１６を構成するメモリセル群の第０ビットの
メモリセルの概略構成を示すブロック図である。なお、
第1ビット以降のメモリセルについても同様の構成であ
るので説明は省略する。また、ニューロン出力保存メモ
リ１６以外の構成は上述の第１の実施の形態と同様であ
るのでこれも説明は省略する。

【００９０】第２の実施の形態のニューロン出力保存メ
モリ１６は、大別して、ＤＲＡＭセル１１、行アドレス
デコーダ１３、読み出し回路と書き込み回路とを備えた
読み出し・書き込み回路１５、アドレスエンコーダ１
７、書き込み行アドレスレジスタ１９、書き込み列アド
レスレジスタ２１、読み出し行アドレスレジスタ２３、
コントローラ２５とから構成される。

【００９１】本第２の実施の形態では、ニューロン出力
保存メモリ１６を構成するメモリセルは、マトリクス状
に配置されたＤＲＡＭセル１１であり、書き込み信号が
ネゲートされている時に行アドレスデコーダ１３によっ
て行選択線が選択されると、読み出し・書き込み回路１
５の読み出し回路によってＤＲＡＭセル１１内の同一行
のメモリセルからデータが同時に読み出される。

【００９２】一方、書込信号がアサートされている時に
行アドレスデコーダ１３によって行選択線が選択される
と、読み出し・書き込み回路１５の書き込み回路によっ
て同一行のメモリセルにデータが同時に書き込まれる。

【００９３】書込選択信号線３０₁〜３０_2nは、書き込
みアドレスエンコーダ１７によって２進エンコードさ
れ、書込選択信号線３０₁〜３０_2nのいずれかが選択さ
れると、その上位ビットが書き込み行アドレスレジスタ
１９に、下位ビットが書き込み列アドレスレジスタ２１
にラッチされる。同時にコントローラ２５に書き込みリ
クエストを行う。読み出し行アドレスレジスタ２３は、
１行分のデータが読み出されるたびにカウントアップさ
れる。

【００９４】データを読み出す場合は、まず読み出し行
アドレスレジスタ２３の値が行アドレスデコーダ１３に
与えられ、ＤＲＡＭセル１１の特定行が選択され、同一
行のデータが読み出し回路によって読み出される。読み
出されたデータはシフトレジスタ５６に書き込まれる。
シフトレジスタ５６は読み出し制御線２６に接続されて
おり、読み出し制御線２６をトグルするたびに、データ
が読み出しデータバス２８に順次出力される。

【００９５】一方、データの書き込み時は、書き込み行
アドレスレジスタ１９が行アドレスデコーダに与えら
れ、ＤＲＡＭセル１１の特定行が選択され、読み出し・
書き込み回路１５の書き込み回路により書き込みデータ
バス３４上のデータが書き込み列アドレスレジスタ２１
で指定したアドレスのメモリセルに書き込まれる。な
お、ここではＤＲＡＭセル１１からの読み出しと前記書
き込みが競合した場合は、読み出しが優先されるように
設定している。

【００９６】以上説明した第２の実施の形態では、ニュ
ーロン出力保存メモリ１６のメモリセル１４₁〜１４_2n
としてＤＲＡＭを用いたが、ＳＲＡＭセルでもよい。ま
た、ニューロン出力保存メモリ１６からの読み出しは、
シフトレジスタ５６を用いて順次読み出したが、アドレ
ス信号によって任意のアドレスを読み出す構成にしても
よい。この場合、シナプス係数メモリ１２（図１参照）
にシナプス係数とそれに対応するニューロン出力値が格
納されたアドレスを同時に保存し、そのアドレスを用い
てニューロン出力を読み出す構成となる。

【００９７】

【発明の効果】以上説明したように本発明によれば、多
くのプロセッサユニットが独立かつ高速に動作でき、か
つ、ニューロン出力を簡単な制御系で伝達できる大規模
ニューラルネットワークを実験した情報処理装置が得ら
れる、という効果がある。

【図面の簡単な説明】

【図１】本発明の第１の実施の形態の情報処理装置の
概略構成を示すブロック図である。

【図２】図１に示した情報処理装置を構成するプロセ
ッサユニットの概略構成を示すブロック図である。

【図３】図１に示した情報処理装置を構成するメモリ
ブロックの概略構成を示すブロック図である。

【図４】図２に示したプロセッサユニットの動作を示
すフローチャートである。

【図５】４つのプロセッサユニットの並列動作を説明
するタイムチャートである。

【図６】本発明の第２の実施の形態の情報処理装置を
構成するメモリブロックの概略構成を示すブロック図で
ある。

【図７】従来の情報処理装置の概略構成を示すブロッ
ク図である。

【符号の説明】

１０₁〜１０_n プロセッサユニット１１ＤＲＡＭセル１２₁〜１２_n シナプス係数メモリ１３行アドレスデコーダ１４₁〜１４_n メモリブロック１５読出し書込み回路１６ニューロン出力保存メモリ１７書込みアドレスエンコーダ１８収束判定回路１９書込み行アドレスレジスタ２０制御部２１書込み列アドレスレジスタ２２拡張インターフェース２３読出し行アドレスレジスタ２４ホストインターフェース２５コントローラ２６₁〜２６_n 読出制御線２８₁〜２８_n 読出データバス３０₁〜３０_n 書込選択信号線３２システムバス３４書込データバス３６ニューロン出力読み出しインターフェース３８シナプス係数読出／書き込みインターフェース４０乗算器４２加算器４４累積保持レジスタ４６非線型出力回路４８ニューロン出力保存レジスタ５０比較器５２フラグ５４ニューロン出力書き込みインターフェース５６シフトレジスタ(読出制御手段／書込制御手段) ５８₁〜５８_2n読み出しアドレス選択線

Claims

【特許請求の範囲】

【請求項１】各々シナプス係数を格納した複数のシナ
プス係数メモリと、各々同一の物理アドレスを持ち、かつ、ニューロン出力
値を記憶する複数のメモリブロックを備えたニューロン
出力保存メモリと、各々少なくとも１つの前記メモリブロック及び１つの前
記シナプス係数メモリに接続され、前記シナプス係数及
びニューロン出力値を独立して読出し、各々予め定めら
れた特定のニューロン演算を独立して行い、得られたニ
ューロン出力値を前記複数のメモリブロックの予め割り
当てられた同一アドレスの各々に書き込む複数のプロセ
ッサユニットと、を備えた情報処理装置。
【請求項２】前記プロセッサユニットは、前記特定の
ニューロン演算を複数回繰り返して行い、演算値が前回
の演算値と異なる場合に前記メモリブロックに書き込む
請求項１に記載の情報処理装置。
【請求項３】前記複数のメモリブロックの１つに接続
され、前記メモリブロック内の予め定めたアドレスのニ
ューロン出力値を一定時間ごとに読み出してニューロン
出力値が収束したかを判定する収束判定手段と、前記収束判定手段により予め定めたアドレスのニューロ
ン出力値の全てが収束したと判定された場合、全てのプ
ロセッサユニットの演算を終了するように制御する制御
手段と、をさらに備えた請求項２に記載の情報処理装置。
【請求項４】前記複数のプロセッサユニットのいずれ
か１つに、プロセッサユニットの各々に順に受け渡され
ると共に、権利があるときに接続された前記メモリブロ
ックの対応するアドレスにニューロン出力値の書き込み
を行う権利を持たせた請求項１から請求項３のいずれか
１項に記載の情報処理装置。
【請求項５】前記ニューロン出力保存メモリは、前記メモリブロックと該メモリブロックに対応する前記
プロセッサユニットとを接続し、前記メモリブロック内
のアドレスのニューロン出力値を該接続された前記プロ
セッサユニットに出力するための出力データバスと、前記メモリブロックと該メモリブロックに対応する前記
プロセッサユニットとを接続し、前記プロセッサユニッ
トからの読出制御信号を前記メモリブロックに入力する
読出制御線と、前記読出制御線からの読出制御信号に基いてメモリブロ
ック内のアドレスを指定し、メモリブロック内のアドレ
スのニューロン出力値が前記出力データバスを介して読
み出されるように制御する読出制御手段と、全ての前記複数のメモリブロックとプロセッサユニット
とに共有された入力データバスと、全ての前記複数のメモリブロックの同一のアドレスと、
該アドレスに割り当てられた１つの前記プロセッサユニ
ットとを接続する複数の書込選択信号線と、前記複数の書込選択信号線の１つから入力される前記プ
ロセッサユニットからの書込制御信号により指定された
前記複数のメモリブロック内の同一アドレスに、前記入
力データバスを介してニューロン出力値が書き込まれる
ように制御する書込制御手段と、をさらに備えた請求項１から請求項４のいずれか１項に
記載の情報処理装置。
【請求項６】前記メモリブロックは、前記アドレスに
各々対応して設けられた複数のメモリセルにより構成さ
れ、前記メモリセルのそれぞれに、前記読出制御線と前記書
込選択信号線とが接続されている請求項５に記載の情報
処理装置。
【請求項７】前記メモリブロックの各々は、マトリク
ス状に配置され、かつ、前記書込制御線からの書込制御
信号がマトリクス内の列アドレスと行アドレスとの組と
１体１に対応する複数のメモリセルにより構成されてい
る請求項５に記載の情報処理装置。