JP3271186B2

JP3271186B2 - 学習処理装置

Info

Publication number: JP3271186B2
Application number: JP26148689A
Authority: JP
Inventors: 篤信平岩; 繁有沢; 茂黒須; 真井上
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1989-10-06
Filing date: 1989-10-06
Publication date: 2002-04-02
Anticipated expiration: 2017-04-02
Also published as: JPH03123959A

Description

【発明の詳細な説明】Ａ産業上の利用分野本発明は、それぞれニューロンに対応する信号処理を
行う複数のユニットにより構成された所謂ニューラルネ
ットワーク（Neural Network:神経回路網）を用いた信
号処理部に対して、バックプロパゲーション（Back pro
pagation:逆伝播）学習則に従った学習処理を施す学習
処理装置に関する。

Ｂ発明の概要本発明は、ニューラルネットワークによる信号処理部
に対してバックプロパゲーション学習則に従った学習処
理を行う学習処理装置において、多数のプロセッシング
・エレメントをメッシュ結合して並列処理により高速学
習処理を実現したものである。

Ｃ従来の技術それぞれニューロンに対応する信号処理を行う複数の
ユニットにより構成された所謂ニューラルネットワーク
を用いた信号処理部に対する学習処理の手法として、
「Parallel Distributed Processing」Vol.1 The MIT P
ress 1986や日経エレクトロニクス1987年８月10月号,N
o.427.pp115−124等において、バックプロパゲーション
学習則が提案されている。

そして、上記バックプロパゲーション学習則は、第５
図に示すように、入力層（11）と出力層（13）の間に中
間層（12）を有する多層構造のニューラルネットワーク
により構成される信号処理部（10）に適用され、高速画
像処理やパターン認識等の各種の信号処理への応用が試
みられている。

すなわち、第５図に示すように、このニューラルネッ
トワークを構成する各ユニット（U_j）は、ユニット
（U_i）からユニット（U_j）への結合係数W_jiで結合され
るユニット（U_i）の出力値O_iの総和net_jを例えばsigmoi
d関数などの所定の関数ｆで変換された値O_jを出力す
る。すなわち、パターンｐの値が入力層の各ユニット
（U_j）に入力値としてそれぞれ供給されたとき、中間層
および出力層の各ユニット（U_j）の出力値O_pjは、なる第１式で表される。

そして、入力層（11）から出力層（13）へ向かって、
各ニューロンに対応するユニット（U_j）の出力値を順次
計算していくことで、上記出力層（13）のユニット
（U_j）の出力値O_pjが得られる。

バックプロパゲーション学習アルゴリズムにおいて
は、上記信号処理部（10）に対して、学習処理部（20）
により、入力パターンｐを与えたときの、出力層（13）
の各ユニット（U_j）の実際の出力値O_pjと望ましい出力
値T_pjすなわち教師信号との二乗誤差の総和E_p を極小化するように、結合係数W_jiを変える学習処理を
出力層（13）から入力層（11）へ向かって順次に行うこ
とによって、教師信号の値T_pjに最も近い出力値O_pjが上
記出力層（13）のユニット（U_j）から出力されるように
なる。

そして、二乗誤差の総和E_pを小さくする結合係数W_ji
の変化量ΔW_jiを、 ΔW_ji∝−∂E_p/∂W_ji ……第３式と決めると、上記第３式は、 ΔW_ji＝η・δ_pj・O_pj ……第４式に変形することができる（この過程は上述の文献を参
照）。

ここで、ηは学習レート（定数）で、ユニットの数や
層の数さらには入出力の値等から経験的に決定される。
また、δ_pjはユニット（U_j）のもつ誤差値である。

従って、上記変化量ΔW_jiを決定するためには、上記
誤差値δ_pjをネットワークの出力層から入力層に向かっ
て逆向きに求めていけば良い。出力層のユニット（U_j）
の誤差値δ_pjは、 δ_pj＝（T_pj−O_pj）f'_j（net_j） ……第５式なる第５式で与えられ、中間層のユニット（U_j）の誤差
値δ_pjは、そのユニット（U_j）が結合されている各ユニ
ット（U_k）（この例では出力層の各ユニット）の結合係
数W_kjおよび誤差値δ_pkを用いて、なる再帰関数により計算される（上記第５式および第６
式を求める過程は上述の文献を参照）。

なお、上記f'_j（net_j）は、出力関数f_j（net_j）の微
分値である。

そして、変化量ΔW_jiは、上記第５式および第６式の
結果を用いて上述の第４式によって求められるが、前回
の学習結果を用いて、 ΔW_ji(n+1)＝η・δ_pj・O_pj＋α・ΔW_ji(n) ……第７式なる第７式により求めることで、より安定した結果が得
られる。なお、αはエラーの振動を減らし、収束を速め
るための安定化定数である。

そして、この学習を繰り返し行い、出力値o_pjと教師
信号の値T_pjとの二乗誤差の総和E_pが十分に小さくなっ
た時点で学習を完了する。

このようなニューラルネットワークを利用して画像処
理や音声認識などの分野において実用に適した装置を実
現するためには、各相のユニットすなわちニューロンの
数を増やし、ネットワークの規模を大きくすることが必
要とされ、それに伴い結合係数の学習に膨大な計算量が
必要となる。

従来より、ニューラルネットワークを利用した装置で
は、ニューラルネットワークにおける計算処理は元来並
列処理であることから、並列処理によって計算速度を高
める試みがなされている。並列化の方法としては、１つ
のニューロンを１つの計算素子に対応させる方法や、複
数のニューロンを担当するプロセッサを結合して用いる
方法があるが、前者はハードウェアが大きくなり、現在
の技術で大規模なネットワークを実現するのは実用的で
はない。

従って、現在提案されているシステムは、その多くが
後者に基づいており、プロセッサとしては信号処理プセ
ッサ（DSP）、汎用のマイクロプロセッサ専用のチップ
を用いたもの等がある。いずれも、複数のプロセッサ
が、互いに通信しながら並列的にニューラルネットワー
クの計算処理を実行する。また、ニューラルネットワー
クの並列処理方式としては、ネットワークを複数に分割
して処理を行うネットワーク分割法やデータを複数のプ
ロセッサに分散させて処理を行うデータ分割法が知られ
ている。

Ｄ発明が解決しようとする課題ところで、上述の如き多層型のニューラルネットワー
クに対するバックプロパゲーション学習則に従った結合
重みの学習処理にネットワーク分割法を採用した場合、
ネットワークの分割数すなわちプロセッサ数が多くなる
と、プロセッサ間の通信時間が増大し、性能の向上が期
待できなくなる。また、データ分割法を採用した場合に
は、大量の学習量が必要であり、データの分割数すなわ
ちプロセッサ数が例えば100以上になると、プロセッサ
間の通信時間が増大し、性能の向上が期待できなくな
る。

そこで、本発明は、上述の如き従来の実情に鑑み、多
数のプロセッサによる並列処理によって、高速且つ少な
いオーバーヘッドでニューラルネットワークに対するバ
ックプロパゲーション学習則に従った結合重みの学習処
理を効率良く行うことができるようにした学習処理装置
を提供することを目的とする。

Ｅ課題を解決するための手段本発明は、上述の目的を達成するために、それぞれニ
ューロンに対応する信号処理を行う複数のユニットによ
り構成された入力層、中間層および出力層を備える信号
処理部と、上記入力層に入力される入力信号パターンに
対する上記出力層の出力値と教師信号として与えられる
所望の出力値との誤差情報に基づいて上記各ユニットの
間の結合の強さの係数を上記出力層側から上記入力層側
に向かって順次に繰り返し計算し、上記結合の強さの係
数の学習処理を行う学習処理部とを備えて成る学習処理
装置において、上記信号処理部として、それぞれ垂直リ
ング結合用のデータ転送メモリと水平リング結合用のデ
ータ転送メモリとを介してメッシュ結合されたＮ×Ｄ個
のプロセッシング・エレメントを備え、上記学習処理部
は、ネットワークをＮ分割し、入力データをＤグループ
に分散させて、上記メッシュ結合されたＮ×Ｄ個のプロ
セッシング・エレメントに学習処理アルゴリズムをマッ
ピングして、上記メッシュ結合されたＮ×Ｄ個のプロセ
ッシング・エレメントによる演算結果を垂直リングと水
平リングを介して転送し、重み更新時に必要な重み変化
量の総和を複数の水平リングにより求め、上記各ユニッ
トの間の結合の強さの係数の学習処理を行うことを特徴
とするものである。

Ｆ作用本発明に係る学習処理装置において、メッシュ結合さ
れた各プロセッシング・エレメントは、周囲の４つのプ
ロセッシング・エレメントとの間で通信は非同期にデー
タの通信を行う。また、同一プロセッシング・エレメン
トを結合する構成のためシステムの拡張が容易となる。

Ｇ実施例以下、本発明の実施例について、図面を参照しながら
詳細に説明する。

本発明に係る学習処理装置は、第１図に示すように、
それぞれ垂直リング結合用のデータ転送メモリVM₍₀₎〜V
M_(N-1)と水平リング結合用のデータ転送メモリHM₍₀₎〜H
M_(D-1)とを介してメッシュ結合されたＮ×Ｄ個のプロセ
ッシング・エレメントPE_（0,0）〜PE_{（Ｄ−1,N−１）}を
備え、ネットワークをＮ分割し、入力データをＤグルー
プに分散させて、上記メッシュ結合されたＮ×Ｄ個のプ
ロセッシング・エレメントPE_（0,0）〜PE
_{（Ｄ−1,N−１）}にバックプロパゲーション学習処理ア
ルゴリズムをマッピングしてなる。

この実施例の学習処理装置は、上述の第５図に示した
それぞれニューロンに対応する信号処理を行う複数のユ
ニットにより構成された入力層（11）、中間層（12）お
よび出力層（13）を備える信号処理部（10）に対する上
記各ユニットの間の結合の強さの係数をバックプロパゲ
ーション学習則に従って上記学習処理部（20）により行
う学習処理装置に本発明を適用したものである。

上記プロセッシング・エレメントPE_（0,0）〜PE
_{（Ｄ−1,N−１）}には、第２図に示すように、例えば、I
ntel社によって開発された64ビット、RISCタイプの汎用
マイクロプロセッサ（80860）がそれぞれ用いられ、ニ
ューロン間の結合の重みすなわち結合係数や出力をスト
アするために4MバイトのローカルメモリRAMが設けられ
ている。また、上記垂直リング結合用の各データ転送メ
モリVM₍₀₎〜VM_(N-1)及び水平リング結合用の各データ転
送メモリHM₍₀₎〜HM_(D-1)としては、FIFO（First in Fir
stout）メモリがそれぞれ用いられている。

そして、上記各プロセッシング・エレメントPE
_（0,0）〜PE_{（Ｄ−1,N−１）}は、隣接する４つのプロセ
ッシング・エレメントPEとFIFOによるデータ転送メモリ
VM,HMを介して結合されており、上記データ転送メモリV
M,HMを介して上記隣接する４つのプロセッシング・エレ
メントPEと非同期に通信を行うことができる。

上記Ｎ×Ｄ個のプロセッシング・エレメントPE
_（0,0）〜PE_{（Ｄ−1,N−１）}をそれぞれ垂直リング結合
用のデータ転送メモリVM₍₀₎〜VM_(N-1)と水平リング結合
用の各データ転送メモリHM₍₀₎〜HM_(D-1)とを介してメッ
シュ結合してなるこの実施例の学習処理装置において、
その垂直方向のリングは、ネットワークをＮ分割してお
り、その垂直リング内の各プロセッシング・エレメント
PE₍₀₎〜PE_(N-1)は異なった結合係数を持ち、上記信号処
理部（10）の中間層（12）の出力値及び逆伝播での上記
中間層（12）の誤差計算の中間結果が転送される。ま
た、水平方向のリングは、入力データをＤグループに分
散させており、その水平リング内の各プロセッシング・
エレメントPE₍₀₎〜PE_(D-1)は異なったデータを持ち、全
データの結合係数W_ijに対する変化量ΣΔW_ijと更新され
た結合係数W_ijのみが転送される。

次に、この学習処理装置は、上述の第５図に示した入
力層（11）、中間層（12）及び出力層（13）を備える３
層構造のニューラルネットワークに対して、例えばネッ
トワークを４（Ｎ＝４）分割して、次の処理アルゴリズ
ム（１）〜（12）に従って学習処理を行う。

（１）入力データＩを与えたときの中間層（12）のユ
ニットU_jへの入力の総和net_jは、により求める。

（２）中間層（12）のユニットU_jの出力H_jは、により求める。

（３）出力層（13）のユニットU_jへの入力は、上記
（１）と同様な積和演算の中間結果net_jを第３図の
（t₁），（t₂），（t₃），（t₄）に示すように上記垂直
リング上を転送することにより各プロセッシング・エレ
メントPE₍₀₎,PE₍₁₎,PE₍₂₎,PE₍₃₎で求める。

（４）出力層（13）のユニットU_jの出力O_jは、上記
（２）と同様に求める。

（５）出力層（13）の誤差値δ_ojは、上記出力層（1
3）のユニットU_jの出力O_jと教師信号T_jとから、 δ_oj＝（T_j−O_j）O_j（１−O_j）により求める。

（６）中間層（12）の誤差値δ_hjは、上記出力層（1
3）の誤差値δ_ojを第４図の（t₁），（t₂），（t₃），
（t₄）に示すように上記垂直リング上を転送しながら、
各プロセッシング・エレメントPE₍₀₎,PE₍₁₎,PE₍₂₎,PE
₍₃₎で、により求める。

（７）ｍ番目入力データに対する結合係数の変化量Δ
W_ij（ｍ）を各層について ΔW_ij（ｍ）＝δ_iO_j＋ΔW_ij（ｍ−１）により求める。

ここで、全データ数をADとすると、上記ｍは、ｍ＝1,
・・・,AD/Dである。

（８）分割された全データに対して（AD/D）回上記
（１）〜（７）の処理を繰り返し行う。

（９）水平リングを使い、データ分割された結合係数
の総和を求める。

（10）結合係数W_ij（ｔ）を更新する。

ここで、ηは学習定数、αは安定化定数、ｔは学習回
数である。

（11）水平リングを使い、更新された結合係数W
_ij（ｔ）をデータ分割された他のプロセッシング・エレ
メントPEに転送する。

（12）出力層の誤差値が目標値以下になるまで、上記
（１）〜（10）の処理を繰り返し行う。

上述の如き構成の学習処理装置では、例えば入力層が
256ユニット、中間層が80ユニット、出力層が32ユニッ
トで構成される３層構造のニューラルネットにおいて、
5120パターンの学習処理を行う場合、ネットワークを４
（Ｎ＝４）分割し、入力データを32（Ｄ＝32）PEグルー
プに分散して、メッシュ結合された128個のプロセッシ
ング・エレメントに上述の（１）〜（12）の学習処理を
行うバックプロパゲーション学習処理アルゴリズムをマ
ッピングし、各プロセッシング・エレメントを50MHzで
動作させると1GCPSの学習速度が得られる。

Ｈ発明の効果上述のように、本発明に係る学習処理装置では、メッ
シュ結合された各プロセッシング・エレメントが周囲の
４つのプロセッシング・エレメントとの間で非同期にデ
ータの通信を行うことにより、プロセッサとオーバーヘ
ッドを小さく抑えることができる。また、同一プロセッ
シング・エレメントを結合する構成のためシステムの拡
張が容易であり、プロセッシング・エレメント数を多く
することによって、全体の処理能力を向上することがで
きる。

従って、本発明によれば、多数のプロセッサによる並
列処理によって、ニューラルネットワークに対するバッ
クプロパゲーション学習則に従った結合係数の学習処理
を高速且つ少ないオーバーヘッドで行う学習処理装置を
実現することができる。

【図面の簡単な説明】

第１図は本発明に係る学習処理装置の構成を概念的に示
すブロック図、第２図は上記学習処理装置を構成するプ
ロセッシング・エレメントの構成概念的に示すブロック
図、第３図は上記学習処理装置の垂直リング上の各プロ
セッシング・エレメントによるバックプロパゲーション
学習処理の前向きの学習処理過程における動作説明図、
第４図は、同じく上記垂直リング上の各プロセッシング
・エレメントによるバックプロパゲーション学習処理の
後向きの学習処理過程における動作説明図、第５図は本
発明を適用する３層構造のニーラルネットワークによる
信号処理部を備える学習処理装置の構成を概念的に示す
ブロック図である。（10）……信号処理部（11）……入力層（12）……中間層（13）……出力層（20）……学習処理部 PE_（0,0）,PE_（0,1）〜PE_{（Ｄ−1,N−１）}……プロセッ
シング・エレメント VM_（0,0）,VM_（0,1）〜VM_{（Ｄ−1,N−１）}……垂直転送
用データ転送メモリ HM_（0,0）,HM_（0,1）〜HM_{（Ｄ−1,N−１）}……水平転送
用データ転送メモリ

───────────────────────────────────────────────────── フロントページの続き (72)発明者井上真東京都品川区北品川６丁目７番35号ソニー株式会社内 (56)参考文献特開昭63−245553（ＪＰ，Ａ) 特開平２−105253（ＪＰ，Ａ) 特開平２−306365（ＪＰ，Ａ) 特開昭63−217462（ＪＰ，Ａ) 特開平１−88767（ＪＰ，Ａ) 特開平１−189755（ＪＰ，Ａ) Ｔ．Ｗａｔａｎａｂｅｅｔ．ａｌ．，ＮｅｕｒａｌＮｅｔｗｏｒｋＳｉｍｕｌａｔｉｏｎｏｎａＭａｓｓｉｖｅｌｙＰａｒａｌｌｅｌＣｅｌｌｕｌａｒＡｒｒａｙＰｒｏｃｅｓｓｏｒ：ＡＡＰ−２，ＩｎｔｅｒｎａｔｉｏｎａｌＪｏｉｎｔＣｏｎｆｅｒｅｎｃｅｏｎＮｅｕｒａｌＮｅｔｗｏｒｋｓ（ＩＪＣＮＮ−89），Ｖｏｌ．▲ＩＩ▼，ｐ．▲ＩＩ▼−155− ｐ．▲ＩＩ▼−161 (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06N 3/00 - 3/10 G06F 15/16 - 15/177 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】それぞれニューロンに対応する信号処理を
行う複数のユニットにより構成された入力層、中間層お
よび出力層を備える信号処理部と、上記入力層に入力さ
れる入力信号パターンに対する上記出力層の出力値と教
師信号として与えられる所望の出力値との誤差情報に基
づいて上記各ユニットの間の結合の強さの係数を上記出
力層側から上記入力層側に向かって順次に繰り返し計算
し、上記結合の強さの係数の学習処理を行う学習処理部
とを備える学習処理装置において、上記信号処理部として、それぞれ垂直リング結合用のデ
ータ転送メモリと水平リング結合用のデータ転送メモリ
とを介してメッシュ結合されたＮ×Ｄ個のプロセッシン
グ・エレメントを備え、上記学習処理部は、ネットワークをＮ分割し、入力デー
タをＤグループに分散させて、上記メッシュ結合された
Ｎ×Ｄ個のプロセッシング・エレメントに学習処理アル
ゴリズムをマッピングして、上記メッシュ結合されたＮ
×Ｄ個のプロセッシング・エレメントによる演算結果を
垂直リングと水平リングを介して転送し、重み更新時に
必要な重み変化量の総和を複数の水平リングにより求
め、上記各ユニットの間の結合の強さの係数の学習処理
を行うことを特徴とする学習処理装置。