JPH09106390A

JPH09106390A - ニューラルネットワーク

Info

Publication number: JPH09106390A
Application number: JP7263833A
Authority: JP
Inventors: Naoya Miyano; 尚哉宮野; Toshiyuki Matsumoto; 松本　　俊行; Hirofumi Inada; 洋文稲田
Original assignee: Sumitomo Metal Industries Ltd
Current assignee: Nippon Steel Corp
Priority date: 1995-10-12
Filing date: 1995-10-12
Publication date: 1997-04-22

Abstract

(57)【要約】【課題】デジタル方式によりハードウェア化されたニ
ューラルネットワークにおいて、勾配降下法における極
小点への補則を乱数発生手段により防止する。【解決手段】ニューラルネットワーク６００は、乱数
を記録可能なメモリ６１、パラメータの更新値を記録可
能なメモリ６３Ａ、６３Ｂ、６３Ｃ、乗算回路６５、加
算回路６６、および比較器６８を含むパラメータの最適
値学習手段と、ニューラルネットワーク入出力特性計算
部６４とを含む。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明はエレクトロニクス分
野および情報処理分野に関し、特にニューラルネットワ
ークのハードウェア化に関する。

【０００２】

【従来の技術】ニューラルネットワークには、フィード
フォワードネットワーク（Feedforward network ）やリ
カレントネットワーク（Recurrent network ）等さまざ
まな形式のものが考案されているが、そのいずれにおい
ても、ニューロンと呼ばれるネットワークの基本構成単
位に対応する適当な基底関数の積和によって、ネットワ
ークの入出力特性が構成されている。これらのニューラ
ルネットワークは、従来、多くの場合ソフトウェアによ
って実現されているが、その動作速度を向上させる目的
で半導体装置等によるハードウェア化が望まれている。

【０００３】ハードウェアによるニューラルネットワー
クの構成に関する従来の方法は、ニューロンの応答特性
をアナログ回路によって再現するか、あるいはデジタル
回路によって再現するかによって、アナログニューラル
ネットワークとデジタルニューラルネットワークとに大
別される。いずれの型のネットワークにおいてもニュー
ロンの応答特性は、シグモイド関数またはステップ関数
である。

【０００４】アナログネットワークの場合には、たとえ
ば、電子情報通信学会技術報告ＩＣＤ９２−１５，ｐ
ｐ．２３−２９に示されているように、ニューロンの応
答関数を再現するために、ＯＰアンプが使用されてい
る。一方、デジタルネットワークの場合には、たとえば
電子情報通信学会技術報告ＩＣＤ９２−１７，ｐｐ．３
９−４６に示されているように、シグモイド関数σ
（ｘ）はベルヌーイ数Ｂ_nを用いた多項式（１）で表わ
されている。

【０００５】

【数１】

【０００６】入力ｘについてＡＬＵ（Alithmetic Logic
Unit ）によりσ（ｘ）を計算することによってニュー
ロンの応答特性が再現される。従来のネットワークにお
いては、ネットワークの特性を特定すべきパラメータの
学習値のみがＲＡＭに記憶されている。

【０００７】ネットワークの構造を特定すべきパラメー
タの最適化は、ソフトウェアまたはハードウェアによっ
て実現される学習アルゴリズムに従って実行される。ソ
フトウェアを利用した学習では、どのようなアルゴリズ
ムでも実現できるので柔軟性がある。非常によく利用さ
れる学習アルゴリズムには、勾配降下法およびそれを応
用したバックプロパゲーション学習則、自己組織化学習
則、Hebb則がある。一方ハードウェアによる学習は、ソ
フトウェアほど柔軟ではないが、演算を高速に実行でき
るという利点がある。学習機能を搭載したハードウェア
に関する従来技術については、たとえばシステム／制御
／情報Ｖｏｌ．３８，Ｎｏ．８，ｐｐ．４２３−４２９
に示されている。ここでは、本発明に関連のある勾配降
下法の原理に関するものを述べる。

【０００８】ニューラルネットワークへの入力をｘ、ネ
ットワークの出力をＦ（ｘ，ξ）とする。ただし、ξは
ネットワークの機能を決定するパラメータで、学習によ
って最適化されるものとする。出力Ｆ（ｘ，ξ）が一致
すべき正解出力をｙ（ｘ）とする。ξ、Ｆ（ｘ，ξ）、
およびｙ（ｘ）はスカラでもよいし、ベクトルでもよ
い。ここではスカラを用いて説明するが、そのことによ
って一般性が失われることはない。ネットワークの出力
精度を図る尺度として、汎関数Ｅ［Ｆ］として、Ｅ［Ｆ］＝（１／２）Σ_x［Ｆ（ｘ，ξ）−ｙ（ｘ）］² （２）と決める。このとき、ξの最適化過程におけるξの時間
変化が、ｄξ／ｄｔ＝−∂Ｅ［Ｆ］／∂ξ （３）となるようにすると、ｄＥ［Ｆ］／ｄｔ＝（∂Ｅ［Ｆ］／∂ξ）（ｄξ／ｄｔ）＝−（∂Ｅ［Ｆ］／ ∂ξ）²≦０（４）となって、ξは常にネットワークの出力誤差Ｅ［Ｆ］が
減少する方向に自動的に変化する。（２）式を数値計算
を実行するための漸化式に書直すと、 ξ（ｎｅｗ）＝ξ（ｏｌｄ）−η（∂Ｅ［Ｆ］／∂ξ）（５）となる。η＞０は学習率と呼ばれる定数で、調節可能な
パラメータである。ところで、（４）式において∂Ｅ
（Ｆ）／∂ξ＝０となるようなＥ［Ｆ］の極小点では、
Ｅ［Ｆ］が最小ではないにもかかわらず、学習が停止す
る。このような極小点への捕捉を防ぐために、（５）式
を改良した ξ（ｎｅｗ）＝ξ（ｏｌｄ）−η（∂Ｅ［Ｆ］／∂ξ）＋αΔξ（ｏｌｄ）（６）が利用される。ここで、Δξ（old ）は前回の学習ルー
プにおけるξの変動であり、αは運動量因子と呼ばれる
調節可能なパラメータである。従来のハードウェアは、
（５）または（６）式を実現したものである。

【０００９】

【発明が解決しようとする課題】アナログネットワーク
の場合には、ネットワークを構成すべき各素子の電気特
性を非常に均一に作製しなければならないので、素子の
製造プロセスにおける均一性に対する要求が厳しく、高
い製造歩留りを得ることは容易ではない。またシグモイ
ド関数以外の応答特性を持つニューロン、たとえば、ガ
ウス関数をニューロンとする正則化ネットワーク（Regu
larization network）を構成する場合には、ニューロン
の応答特性を正確に再現することが困難である。

【００１０】一方、従来のデジタルネットワークにおい
ては製造プロセスはアナログ方式の場合よりも容易であ
るが、ニューロンからの応答特性を実現する際、応答特
性を近似する多項式を計算して設計しなければならない
ことに加えて、ＡＬＵを使用するために回路構成、動作
が複雑になるという問題点がある。これが第１の課題で
ある。

【００１１】次に（５）または（６）式による勾配降下
法では、Ｅ［Ｆ］の極小点への捕捉を完全に防止するこ
とができないので、ネットワークの出力誤差が十分に小
さくなるように学習を実行することが困難である場合が
多いという問題点がある。これが第２の課題である。

【００１２】第３の課題は学習に要する計算時間の問題
である。ソフトウェアによる学習では計算時間が多大で
あり、ハードウェアによる学習によって計算時間を減少
させたい。これが第３の課題である。本発明はこれらの
課題を解決することを目的とする。

【００１３】それゆえに請求項１に記載の発明は、任意
の応答関数を持つニューロンからなるデジタルネットワ
ークを簡潔に実現することができるとともに、勾配降下
法におけるＥ［Ｆ］の極小点への捕捉を防止してネット
ワークの出力誤差が十分に小さくなるように学習を実行
することができ、さらにハードウェアによる学習によっ
て計算時間を減少させることができるニューラルネット
ワークを提供することを目的とする。

【００１４】

【課題を解決するための手段】以下本発明における課題
を解決するための手段の動作原理を説明する。

【００１５】請求項１に記載のニューラルネットワーク
装置においては、回路構成はデジタル方式とし、ニュー
ラルネットワーク内での積和は乗算回路および加算回路
により実現する。ニューロンの応答特性をｆ（ｘ）とす
ると、入力ｘに対する値ｆ（ｘ）を予め計算しておき、
ｘをアドレスとするＲＯＭにｆ（ｘ）の関数値を記録す
る。すなわちニューロンを応答関数値が記録されたＲＯ
Ｍによって実現する。なおＲＯＭの代わりにＲＡＭを用
いることもできる。

【００１６】ネットワークへの入力をＸ＝（ｘ₁，
ｘ₂，…，ｘ_D）、ネットワークの出力をＦ（ｘ）とす
ると、ガウス関数を基底関数とする正規化ネットワーク
は、（７）で表わされる。

【００１７】Ｆ（Ｘ）＝Σ_h=1 ^Nhｃ_hｅｘｐ（−β_hΣ_i=1 ^D（ｘ_i−θ_hi）²）（７）（７）式において、Ｎ_hは隠れ層ノード数、ｃ_h、β_h
およびθ_hiは、勾配降下法によって最適化されるパラメ
ータである。学習則の構成方法については後に述べる。

【００１８】なお正則化ネットワークの原理およびネッ
トワークの学習則については、T. Poggio and F. Giros
i, Proceedings of the IEEE, Vol.78, No.9, pp.1481-
1497（1990）において詳細に述べられている。このネッ
トワークの回路構成は以下のようなものとなる。

【００１９】図１を参照して、正則化ネットワーク内の
処理の流れを説明する。正則化ネットワークのパラメー
タｃ_h、β_hおよびθ_hiはＲＡＭまたはレジスタに記録
されており、必要な際には制御回路によって管理された
これらのメモリから読出されるものとする。

【００２０】まずステップ１で入力ベクトルＸ＝
（ｘ₁、ｘ₂、…、ｘ_D）がネットワークに入力され
る。ステップ２でθ_hiがＲＡＭから読出され、ステップ
３でｘ_i−θ _hiが加算回路によって計算され、ステップ
４でその二乗が乗算回路により計算される。次にステッ
プ５でΣ_i=1 ^D（ｘ_i−θ_hi）²が加算回路によって求
められる。ステップ６でβ_hがＲＡＭから読出され、ス
テップ７でステップ５で求めた和と、−β_hとの積Ｙが
乗算回路によって求められる。ステップ８で積Ｙをガウ
ス関数値が記録されたＲＯＭのアドレスに入力するとニ
ューロンの応答関数が求められる。ステップ９でｃ_hが
ＲＡＭから読出され、ステップ１０、ステップ１１でＲ
ＯＭの出力とｃ_hとが乗算回路および加算回路で乗算お
よび加算され、ニューラルネットワークの出力値が得ら
れる。こうして正則化ネットワークがハードウェア化さ
れる。

【００２１】３層パーセプトロンの場合、出力値Ｆ
（Ｘ）は、以下のように表わされる。Ｆ（Ｘ）＝σ（Σ_h=1 ^NhＷ_hＧ_h（Ｘ）−Ｔ）（８）Ｇ_h（Ｘ）＝σ（Σ_i=1 ^Dｗ_hiｘ_i−ｔ_h）（９）ここで、Ｗ_h、Ｔ、ｗ_hiおよびｔ_hはバックプロパゲー
ション学習則によって最適化されるべきパラメータで、
ＲＡＭまたはレジスタに記録され、必要な際にはこれら
のメモリから読出されるものとする。また、σはシグモ
イド関数であり、σ（ｚ）＝１／［１＋ｅｘｐ（−
ｚ）］と表わされる。多層パーセプトロンの原理と学習
則については、D. E. Rumelhart, J. L. McClelland, a
nd the PDP Research Group, Parallel Distributed ro
cessing, pp.318-362 （MIT Press, Cambridge, 1986）
において詳細に述べられている。

【００２２】図２を参照して、３層パーセプトロンにお
ける処理の流れを説明する。まずステップ１３で入力ベ
クトルＸ＝（ｘ₁、ｘ₂、…、ｘ_D）がネットワークに
入力される。ステップ１４でｗ_hiがＲＡＭから読出さ
れ、ステップ１５でｗ_hiｘ_iが乗算回路によって求めら
れる。ステップ１６でΣ_i=1 ^Dｗ_hiｘ_iが加算回路によ
って求められる。ステップ１７でｔ_hがＲＡＭから読出
され、ステップ１８でｚ＝Σ_i=1 ^Dｗ_hiｘ_i−ｔ_hが加
算回路によって求められる。ステップ１９でこの値ｚを
シグモイド関数が記録されたＲＯＭのアドレスに入力す
るとニューロンの応答関数が求まり、（９）式のＧ
_h（Ｘ）が得られる。

【００２３】今度はＧ_h（Ｘ）を入力とみて、上記と同
様な演算を繰返すと、３層パーセプトロンの出力Ｆ
（Ｘ）が得られ、３層パーセプトロンがハードウェア化
される。

【００２４】すなわちステップ２０でＷ_hが読出され、
ステップ２１でＷ_hＧ_hが乗算回路によって求められ
る。ステップ２２でΣ_h=1 ^NhＷ_hＧ_hが加算回路によっ
て求められる。ステップ２３でＴがＲＡＭから読出され
る。ステップ２４でｚ′＝Σ_h= ₁ ^NhＷ_hＧ_h−Ｔが加算
回路によって求められる。ステップ２５でこの値ｚ′を
シグモイド関数が記録されたＲＯＭのアドレスに入力す
るとニューロンに応答関数が求まり、ステップ２６でこ
のＲＯＭの出力が３層パーセプトロンの出力Ｆ（Ｘ）と
して出力される。

【００２５】以上述べた手段により、デジタル方式によ
ってニューラルネットワークがハードウェア化されてい
る。

【００２６】したがってアナログ方式のように精度の高
い製造技術を必要としない。またネットワークの構成単
位たるニューロンの応答特性はＲＯＭまたはＲＡＭに記
録されているので、これらのメモリ書込むデータを変え
ることによってどのような応答特性も自由にかつ容易に
設定できる。さらにＡＬＵが一切用いられていないので
ニューロンの応答特性の計算は簡単である。

【００２７】これで第１の課題が解決された。次にハー
ドウェアによる学習について説明する。ニューラルネッ
トワークの最適化すべきパラメータをまとめてξと表示
する。（５）式を改良して、 ξ（ｎｅｗ）＝ξ（ｏｌｄ）−η（∂Ｅ［Ｆ］／∂ξ）＋αΔξ（ｏｌｄ）＋ｎｏｉｓｅ（１０）とする。（１０）式において、noise は白色ノイズ、有
色ノイズ、またはカオス時系列として合成されるランダ
ム変数であって、カウンタ回路として実装されるタイマ
によって所望の一定時間間隔で（１０）式に供給され
る。学習過程において、ξが極小点に捕捉された場合
に、このランダム変数によってそのような望ましくない
極小点から脱出することができる。

【００２８】このような一連の学習過程における処理の
流れを図３に示す。入力ｘがシステムに入力され、上述
のネットワーク出力計算部に転送されて、出力値と正解
値との誤差汎関数Ｅ［Ｆ］を計算する。入力ｘとそれに
対応する正解値は、メモリ部に保存される。誤差汎関数
Ｅ［Ｆ］は乗算・加算回路で表現し得る。汎関数Ｅ
［Ｆ］のξに対する微分も乗算・加算回路および基底関
数の応答特性を記憶したメモリ部とによって構成でき
る。学習率ηは、レジスタに保存されている。αおよび
Δξ（old ）もレジスタに保存され、それらの積は乗算
回路によって計算され得る。こうして、（１０）式はハ
ードウェアによって実現可能となる。誤差汎関数Ｅ
［Ｆ］の目標値Ｅ（target）および（１０）式の最大反
復計算回数Ｎ（max）をレジスタに記憶させ、毎回の学
習ループで算出される誤差汎関数Ｅ［Ｆ］とＥ（targe
t）とを比較回路で比較してＥ［Ｆ］≦Ｅ（target）と
なるか、または反復ループ回数がＮ（max ）に一致した
ときに学習を停止させ、その旨ＭＰＵに通信することに
する。このような構成においては、すべての回路は、た
とえばシリコン半導体基板上で従来のＣＭＯＳデジタル
回路によって実現することが可能である。このようなハ
ードウェアシステムを既存のＭＰＵに結合することによ
って前節に述べた課題がすべて達成、克服される。

【００２９】以上のようにデジタル方式によってニュー
ラルネットワークがハードウェア化されるとともに、勾
配降下法におけるＥ［Ｆ］の極小点への補則をランダム
変数によって防止してネットワークの出力誤差が十分に
小さくなるように学習を実行することができ、さらにハ
ードウェアによる学習によって計算時間を減少させるこ
とができる。

【００３０】

【発明の実施の形態】以下本願の発明の実施の形態を図
面を参照しながら詳細に説明する。

【００３１】図４を参照して、本願の請求項１に記載の
ニューラルネットワークにおけるニューラルネットワー
ク入出力特性計算部の実施の形態である正則化ネットワ
ーク出力計算部のハードウェアの一例を説明する。

【００３２】この実施の形態では、ネットワークの入力
ノード数＝３、隠れ層ノード数＝５、出力ノード数＝
１、ニューラルネットワークの入出力データは３２ビッ
ト、単精度、浮動小数点で表現されているとするが、本
発明はこのような条件に限定されるものではない。

【００３３】図４において実施の形態のニューラルネッ
トワーク入出力特性計算部４０１はネットワーク内での
処理の流れを管理する制御部４１を含む。制御部４１内
には入力ノード数、隠れ層ノード数、および出力ノード
数が設定されるべきカウンタ回路が設置されている。実
施の形態のニューラルネットワーク入出力特性計算部４
０１はｃ_h、β_hおよびθ_hi（ｉ＝０，１，２；ｈ＝
０，１，２，３，４）を記憶したＲＡＭ４２を含む。Ｒ
ＡＭの代わりにレジスタを用いてもよい。

【００３４】図４を参照して、実施の形態のニューラル
ネットワーク入出力特性計算部４０１は、ニューラルネ
ットワークの基本構成単位としての基底関数の関数値を
記録可能な第１の記憶手段であるＲＯＭ４６と、第１の
合成回路４８と、第２の合成回路４９とを含む。第１の
合成回路４８は、加算回路４４Ａ、４４Ｂと、乗算回路
４５Ａ、４５Ｂとを含む。第２の合成回路４９は、乗算
回路４５Ｃと、加算回路４４Ｃとを含む。

【００３５】入力ポート４３から入力データｘ_iが次々
とネットワークに取込まれ、加算回路４４Ａの一方の入
力部に入力される。入力データはこのネットワークに入
力するに際して、０と１の間の数値に規格化されてい
る。θ_hiがＲＡＭ４２から読込まれ、加算回路４４Ａの
もう一方の入力部に入力される。こうしてｘ_i−θ_hiが
計算され、その結果が乗算回路４５Ａの２つの入力部に
同時に入力されることによって、（ｘ_i−θ_hi）²が計
算される。この値はもう１つの加算回路４４Ｂの一方の
入力部に入力される。ｉ＝０の場合にはもう一方の入力
部にはゼロ値が入力されているものとする。そして加算
回路４４Ｂの出力は、最初ゼロ値が入力されていた入力
部に帰還される。このような過程は、制御部４１の管理
のもとに入力ノード数に等しい回数繰返される。こうし
て、（２）式の和 Σ_i=1 ^D（ｘ_i−θ_hi）² が求まったので、この和と−β_hとの積Ｙが乗算回路４
５Ｂによって得られる。

【００３６】次に積Ｙがガウス関数値が記録されたＲＯ
Ｍ４６のアドレスに入力される。ＲＯＭ４６のアドレス
は、関数ｅｘｐ（−ｚ）の変数ｚに対応し、０≦ｚ≦２
０の範囲で、かつ、ｚが小数点以下４桁の精度となるよ
うにアドレス幅が設定されている。そしてＲＯＭ４６の
各アドレスには３２ビットの精度でｅｘｐ（−ｚ）の値
が書込まれている。なお、ＲＯＭ４６の部分は、ＥＰＲ
ＯＭやＲＡＭで代用されることも可能である。ＲＯＭ４
６の出力値は乗算回路４５Ｃの一方の入力部に入力され
る。この乗算回路４５Ｃのもう一方の入力部にはＲＡＭ
４２から読出されたｃ_hが入力されている。こうしてＲ
ＯＭ４６の出力とｃ_hとの積が得られる。この積は加算
回路４４Ｃの一方の入力部に入力される。加算回路４４
Ｃのもう一方の入力部にはｈ＝０のときにはゼロ値が入
力されている。そして加算回路４４Ｃの出力値は、最初
ゼロ値が入力されていた入力部に帰還される。上に述べ
た過程を制御部による制御によって隠れ層ノード数に等
しい回数繰返した後、加算回路４４Ｃの出力がネットワ
ークの出力とされる。出力値は出力ポート４７から出力
される。

【００３７】以上のようにデジタル方式によりニューラ
ルネットワークがハードウェア化され、アナログ方式の
場合のように精度の高い製造技術は必要としない。また
ネットワークの構成単位たるニューロンの応答特性はＲ
ＯＭまたはＲＡＭに記録されているので、これらのメモ
リに書込むデータを変えることによりどのような応答特
性も自由にかつ容易に設定できる。さらにＡＬＵは一切
用いられていないので、ニューロンの応答特性の計算は
簡潔である。なお、上述のネットワークにおいて、複数
の加算回路と乗算回路を用いたのは一連の処理をパイプ
ライン制御して高速に実行するためである。回路の占有
面積を小さくしたい場合には、加算回路と乗算回路を単
数使用するか、または一部を重複して使用すればよい。
また上述のネットワークにおいてＲＯＭ４６を複数個使
用して並列処理をさせることもできる。

【００３８】図５を参照して本願の請求項１に記載のニ
ューラルネットワークにおけるニューラルネットワーク
入出力特性計算部の他の実施の形態である３層パーセプ
トロンのハードウェアの一例を説明する。

【００３９】この実施の形態では、ネットワークの入力
ノード数＝３、隠れ層ノード数＝５、出力ノード数＝
１、ニューラルネットワークの入出力データは３２ビッ
ト、単精度、浮動小数点で表現されているとするが、本
発明はこのような条件に限定されるものではない。

【００４０】図５を参照して、実施の形態のニューラル
ネットワーク入出力特性計算部５０１はニューラルネッ
トワークの基本構成単位としての規定関数の関数値を記
録可能な第１の記憶手段であるＲＯＭ５６と、ニューラ
ルネットワークの構造を特定するパラメータの学習値で
あるＷ_h、Ｔ、ｗ_hi、およびｔ_h（ｉ＝０，１，２；ｈ
＝０，１，２，３，４）を記録した第２の記憶手段であ
るＲＡＭ５２と、第１の合成回路５８と、第２の合成回
路５９と、ネットワーク内での処理の流れを管理する制
御部５１とを含む。第１の合成回路５８は、加算回路５
５Ａと乗算回路５４Ａとを含む。第２の合成回路５９は
乗算回路５４Ｂと、加算回路５５Ｂとを含む。制御部５
１内には、入力ノード数、隠れ層ノード数、および出力
ノード数が設定されるべきカウンタ回路が設置されてい
る。なおＲＡＭ５２の代わりにレジスタを用いてもよ
い。

【００４１】入力ポート５３から入力データｘ_iが次々
とネットワークに取込まれ、乗算回路５４Ａの一部の入
力部に入力される。入力データはこのネットワークに入
力するに際して、０と１の間の数値に規格化されてい
る。次にｗ_hiがＲＡＭ５２から読込まれ、乗算回路５４
Ａのもう一方の入力部に入力される。こうしてｗ_hiｘ_i
を計算し、その結果は加算回路５５Ａの一方の入力部に
同時に入力される。加算回路５５Ａのもう一方の入力部
には、最初ゼロ値が入力されており、加算回路５５Ａの
出力は最初ゼロ値が入力されていた入力部に帰還され
る。この過程は制御部によって管理され、入力ノード数
に等しい回数繰返される。

【００４２】次に同じ加算回路５５Ａを用いて、Σ_i=0
²ｗ_hiｘ_iとＲＡＭ５２から読出されたｔ_hとの差を計
算する。この差はシグモイド関数値が記録されたＲＯＭ
５６のアドレスに入力する。ＲＯＭ５６のアドレスは、
関数１／［１＋ｅｘｐ（−ｚ）］の変数ｚに対応し、０
≦ｚ≦２０の範囲で、かつｚが小数点以下４桁の精度と
なるようにアドレス幅が設定されている。そしてＲＯＭ
５６の各アドレスには３２ビットの精度で前記関数値が
書込まれている。なお、ＲＯＭ５６の部分は、ＥＰＲＯ
ＭやＲＡＭで代用されることも可能である。

【００４３】ＲＯＭ５６の出力値は乗算回路５４Ｂの一
方の入力部に入力される。この乗算回路５４Ｂのもう一
方の入力部にはＲＡＭ５２から読出されたＷ_hが入力さ
れている。こうしてＲＯＭ５６の出力とＷ_hとの積が得
られる。この積は加算回路５５Ｂの一方の入力部に入力
される。加算回路５５Ｂのもう一方の入力部にはｈ＝０
のときにはゼロ値が入力されている。そして加算回路５
５Ｂの出力値は、最初ゼロ値が入力されていた入力部に
帰還される。上に述べた過程を制御部による制御によっ
て隠れ層ノード数に等しい回数繰返した後、加算回路５
５Ｂの出力を再びＲＯＭ５６のアドレスに入力し、ＲＯ
Ｍ５６の出力を出力ポート５７に送ると３層パーセプト
ロンの出力値が得られる。

【００４４】以上のようにデジタル方式によりニューラ
ルネットワークがハードウェア化され、アナログ方式の
場合のように精度の高い製造技術は必要としない。また
ネットワークの構成単位たるニューロンの応答特性はＲ
ＯＭまたはＲＡＭに記録されているので、これらのメモ
リに書込むデータを変えることによりどのような応答特
性も自由にかつ容易に設定できる。さらにＡＬＵは一切
用いられていないのでニューロンの応答特性の計算が簡
潔である。

【００４５】上述のネットワークにおいて複数の加算回
路と乗算回路を用いて一連の処理をパイプライン制御
し、高速処理を実現することもできる。また上述のネッ
トワークにおいてＲＯＭ５６を複数個使用して並列処理
をさせることもできる。

【００４６】図６を参照して正則化ネットワークの最適
化を行なう学習回路の実施の形態を説明する。まず実施
の形態の学習回路の構成について説明する。ニューラル
ネットワーク６００は、乱数を記憶するメモリ６１、カ
ウンタ回路６２Ａ、６２Ｂ、６２Ｃ、６２Ｄ、および６
２Ｅを含み、カウンタ回路６２Ａは全学習ループを計数
し、カウンタ回路６２Ｂは摂動を加えるべき学習ループ
間隔を計数する。カウンタ回路６２Ｃ、６２Ｄ、６２Ｅ
はｃ_h、β_h、θ_hiの学習ループ回数を計数する。ニュ
ーラルネットワーク６００はレジスタ６３Ａ、６３Ｂ、
６３Ｃ、６３Ｄ、６３Ｅ、６３Ｆ、６３Ｇ、６３Ｈ、６
３Ｉ、６３Ｊ、および６３Ｋを含む。レジスタ６３Ａ、
６３Ｂ、および６３Ｃはｃ_h、β_h、θ_hiの学習更新値
を記憶し、学習開始時には適当な初期値が記憶されてお
り、図４のＲＡＭ４２と同じものである。レジスタ６３
Ｄ、６３Ｅ、６３Ｆはある学習ループと前回の学習ルー
プにおけるｃ_h、β_h、θ_hiの変動を記憶する。レジス
タ６３Ｇはニューラルネットワークが出力すべきターゲ
ット値を記憶する。レジスタ６３Ｈは許容誤差Ｅ（targ
et）を記憶する。レジスタ６３Ｉは３ビットのフラグレ
ジスタであり、（０，０，１）はｃ_h、（０，１，０）
はβ_h、（１，０，０）はθ_hiの学習ループに対応す
る。また、（０，０，０）は学習終了を表わす。レジス
タ６３Ｊは学習率を記憶し、レジスタ６３Ｋは運動量因
子を記憶する。

【００４７】ニューラルネットワーク６００はニューラ
ルネットワーク入出力特性計算部６４を含み、これは図
４に示したニューラルネットワーク入出力特性計算部４
０１と同じものである。またニューラルネットワーク６
４はガウス関数の入出力特性を記憶したメモリ部を含
む。またニューラルネットワーク６００は乗算器６５、
加算器６６、制御回路６７、および比較器６８を含む。

【００４８】次にこの正則化ネットワークの最適化を行
なう学習回路の動作について説明する。入力ベクトルＸ
が入力されるとニューラルネットワーク入出力特性計算
部６４に転送され、出力Ｆ（Ｘ）が出力される。このと
きｃ_h、β_h、θ_hiの値はレジスタ６３Ａ、６３Ｂ、６
３Ｃから読出される。Ｆ（Ｘ）とレジスタ６３Ｇに記憶
されたターゲット値との差が加算器６６で計算され、レ
ジスタ回路に保存される。この差の二乗は乗算器６５で
計算され、その値もレジスタ回路に保存される。フラグ
レジスタ６３Ｉの状態に応じて乗算器６５、加算器６６
を用いて（１０）式に示した演算を実行する。カウンタ
回路６２Ｂで規定される回数ごとにメモリ６１から乱数
が読出され、その値が（１０）式に加えられる。ガウス
関数値はニューラルネットワーク入出力特性計算部６４
に含まれているガウス関数特性を記憶しているメモリを
使用し、ｃ_h、β_h、θ_hiの反復ループ数はカウンタ回
路６２Ｃ、６２Ｄ、６２Ｅに指定された回数と等しくな
るごとに、ｃ_h→β_h→θ _hi→ｃ_hのように循環する。
各パラメータの更新の各時点においてニューラルネット
ワーク入出力特性計算部６４によりＦ（ｘ）が計算さ
れ、かつＦ（ｘ）とターゲット値との誤差の二乗が計算
されるが、この誤差とレジスタ６３Ｈに記憶されたＥ
（target）とを比較器６８に入力し、誤差が許容誤差よ
りも小さくなるか、またはカウンタ回路６２Ａで計数さ
れるカウント数がＮ（max ）に等しくなると、制御回路
６７が学習を終了させ、その旨をＣＰＵに通信する。

【００４９】なお、多層パーセプトロンの学習の場合
も、上に述べたものと全く同じ技術思想において実現す
ることができる。

【００５０】以上のようにデジタル方式によってニュー
ラルネットワークがハードウェア化されるとともに、勾
配降下法におけるＥ［Ｆ］の極小点への補則を乱数によ
って防止し、ネットワークの出力誤差が十分に小さくな
るように学習を実行することができ、さらにハードウェ
アによる学習によって計算時間を減少させることができ
る。

【図面の簡単な説明】

【図１】実施の形態のニューラルネットワーク入出力特
性計算部である正則化ネットワークにおける処理の流れ
を示すフローチャートである。

【図２】実施の形態のニューラルネットワーク入出力特
性計算部である３層パーセプトロンにおける処理の流れ
を示すフローチャートである。

【図３】実施の形態の学習過程における処理の流れを示
すフローチャートである。

【図４】実施の形態のニューラルネットワーク入出力特
性計算部である正則化ネットワークのブロック図であ
る。

【図５】実施の形態のニューラルネットワーク入出力特
性計算部である３層パーセプトロンのブロック図であ
る。

【図６】実施の形態のニューラルネットワークのブロッ
ク図である。

【符号の説明】

４１制御部３２，４２，５２ＲＡＭ４４Ａ，４４Ｂ，４４Ｃ加算回路４５Ａ，４５Ｂ，４５Ｃ乗算回路３６，４６，５６ＲＯＭ４８，５８第１の合成回路４９，５９第２の合成回路３０１合成回路６００ニューラルネットワーク６４ニューラルネットワーク入出力特性計算部６１メモリ６５乗算回路６６加算回路６７制御回路６８比較器

Claims

【特許請求の範囲】

【請求項１】ニューラルネットワークの基本構成単位
としての基底関数の関数値を記録可能な第１の記憶手
段、ニューラルネットワークの構造を特定するパラメー
タの学習値および更新値を記録可能な第２の記憶手段、
前記ニューラルネットワークへの入力値と前記第２の記
憶手段から読出されたパラメータの学習値との積和を乗
算回路および加算回路によって合成する第１の合成手
段、ならびに前記第１の合成手段の合成値を前記第１の
記憶手段へのアドレスとして入力して読出された前記関
数値と前記第２の記憶手段から読出されたパラメータの
学習値との積和を乗算回路および加算回路によって合成
し当該合成した値をニューラルネットワーク入出力特性
計算部の出力値とする第２の合成手段を含むニューラル
ネットワーク入出力特性計算部と、前記ニューラルネットワークの構造を特定するパラメー
タの最適値学習手段とを含み、前記パラメータの最適値学習手段は、（１）ニューラルネットワークの学習値のための入力
ベクトルおよび出力ターゲットベクトル、ならびにニュ
ーラルネットワークの構造を特定するパラメータの変動
値を記録可能な第３の記憶手段と、（２）前記入力ベクトルを前記ニューラルネットワー
ク入出力特性計算部に入力して得られる出力値と前記出
力ターゲットベクトルとの差に基づいてニューラルネッ
トワークの構造を特定するパラメータの仮の更新値を計
算する乗算回路および加算回路と、（３）前記仮の更新値の計算に使用する乱数の発生手
段と、（４）前記乱数発生手段から読出された乱数を前記仮
の更新値に加算して前記パラメータの更新値を計算する
回路部分とを含み、前記（１）〜（４）による前記パラメータの更新値の計
算を所定の条件が成立するまで繰返させる制御回路とを
含むニューラルネットワーク。