JPH05507804A

JPH05507804A - 出力信頼性指標値を用いてバックプロパゲーションを制御するようにしたニューラル・ネットワーク

Info

Publication number: JPH05507804A
Application number: JP91509233A
Authority: JP
Inventors: ガボースキ，ロジャー・スティーヴン
Original assignee: イーストマン・コダック・カンパニー
Priority date: 1990-05-07
Filing date: 1991-05-01
Publication date: 1993-11-04
Also published as: WO1991017520A1; EP0527895A1; US5052043A

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】出力信頼性指標値を用いてバックプロパゲーションを制御するようにしたニューラル・ネットワーク魚服の技虫立野本発明は、ニューラル・ネットワークのための装置、及びその装置に関連した方法に関するものであり、特に、光学文字認識システム（ＯＣＲシステム）に用いるのに適した。その種の装置及び方法に関するものである。この装置ないし方法は、バックプロパゲーションと、ニニーロン重み及びニューロン・バイアス値の変更調節とを、出力信頼性指標値を用いて制御することによって、ニューラル・ネットワークの応答性を、実際の変化している入力データに、滑らかに、迅速に、且つ正確に適応させることができるようにし、更にそれによって、従来公知のニューラル・ネットワークにおいて、これまで行なわれていた動作と比べて、より力強い動作を行なえるようにしたものである。

背量筺術ワード・プロセッサ等をはじめとする、データを処理するコンピユータ化されたオフィス用機器として、様々な機器が利用されるようになったため、現在使用されている種々雑多な、紙の上に作成する書類（特に、所定の用紙を使用する書類）の量が、この数十年の間に爆発的に増大している。その種の書類の殆どは、その書類の情報を、何らかの時点でその書類から抽出し、その抽出した情報を何らかの方法で処理する必要があるものである。

例を挙げるならば、その種の書類であって、しかも現在広範に使用されている書類として、所定用紙上に作成する銀行小切手がある。通常の使用法では、振出人が、手書きまたは機械印字によってその小切手の所定欄に金額を記入して、その小切手を受取人に渡す。受取人はその小切手を彼自身の取引銀行に入金する。

その銀行がその小切手を処理して支払いをする際には、その銀行の従業員であるオペレータが、その小切手に記入されている金額を読み取り、プリンタを操作して、その小切手の下辺に設けた欄に、余韻に対応した数桁の数字を印字する。小切手のその下辺の欄には更に、その数字と共に電子的に処理される符号である経路選択符号（ルーチン・コード）も印字される。この後、それら数字と経路選択符号とが、機械に読み取られることによって、電子的な振り替えの処理が開始ｉれ、この振り替え処理は、手形交換所を通して、振出人の取引銀行（即ち支払銀行）に開設されている振出人の口座から、受取人の取引銀行（即ち呈示銀行）に開設されている受取人の口座へ、預金を振り替える処理である。更に、その小切手の現物が、手形交換所を通して呈示銀行から支払銀行へ受け渡されることによって、交換決済が完了する。小切手の使用枚数は、過去数年の間に非常な勢いで増加しており、また現在も増加し続けているため、紙の上に作成されている小切手を処理するために銀行が負担するコストも、それにつれて増大の一途をたどっている。銀行としては、このコストの増大を抑えるために、或いはその増大の速度を緩めるために、小切手の処理作業の機械による自動化を、更に高度なものとする努力を不断に続けている。具体的に述べるならば、銀行業務に携わっている種々の方面の人々は、次のように考えている。即ち、人間のオペレータを適当な光学文字認識システム（ＯＣＲシステム）で代替することによって、小切手へコードを打ち込む作業を自動化したならば、その打ち込み作業の作業能率と、その打ち込みの正確度との両方を、格段に向上させることができ、しかもそれと同時に、打ち込み作業に必要なコストの節約も達成できるであろうと、考えているのである。容易に想像できるように、その種のシステムを構成するとすれば、そのシステムは、１枚１枚の小切手に記入されている、手書きないし機械印字した文字ないし数字をスキャンし、そのスキャンによって読み取った金額を、正確に、ディジタル信号（例えば適当なアスキー・ワード等）に変換し、そして特に、プリンタを操作して各小切手の下辺の欄に該当する数字を印字することによって。

小切手へのコード打ち込み作業を実行する、そういう構成のシステムになるであろう。

現代の社会で使用されている紙の上に作成する書類の量は、絶え間なく増え続けているため（用紙上に作成する小切手はそのほんの一例に過ぎない）、その種の書類を読み取って、その内容を機械読取りが可能な形態へ、ないしは直接コンピュータで扱えるデータへと変換するために必要な人的資源は、その確保が急速に困難になりつつあり、また人件費自体も高騰している。そのため、多くの方面において、ＯＣＲシステムを開発及び使用することによって、正確な動作が得られるプロセスの自動化を達成しようとており、特にその初歩の段階としてば、機械印字した英数字の文字を認識して変換するプロセスを自動化することが、そして最終的には、手書きの文字を認識して、それを対応したディジタル・データへ変換するプロセスを自動化することが目標とされている。

機械印字した文字を、ＯＣＲシステムが正確に認識できるようにするための、特に有望な技法の１つに、ニューラル・ネットワークを使用するという技法がある。数学的厳密さをもって動作する伝統的なシーケンシャル・プロセッサである「フォノ・ノイマン型」のディジタル・プロセッサと比較するならば、ニューラル・ネットワークはアナログ形式のものであり、また、一般的に、膨大な処理量をこなす、並列処理能力を発揮することができる。このようなニューラル・ネットワークを使用すると、たとえその入力データが、ファジー（曖昧）で、不完全で、及び／または、多くの場合矛盾を含んだデータであっても、重み付は判断処理を実行することによって、そのような入力データに基づいて、正確な結果ではないにせよ、とにかく高速で、しかも時として驚く程の良好な近似的出力が得られる。

基本的には、ニューラル・ネットワークは、ニューロンと呼ばれる互いに同一構造の複数の処理要素を、多層の階層構造に配列した構成体である。各々のニューロンは、１つまたは複数の入力を有するものとすることができるが、ただし、その出力は１つだけである。複数の入力の各々には、係数によって重み付けをしておく。ニューロンの出力は、通常、その複数の重み付は入力の合計に、更にバイアス値を加えた関数として算出されるようにしている。この関数は、活動度関数と呼ばれており、典型的な例では、シグモイド関数、即ち、Ｓ字形の単調増加関数であって、その入力が正の無限大ないし負の無限大に近付くにつれて、夫々一定の値に漸近する関数としており、この一定の値としては、典型的な例では、正の無限大に近付くときにはｒ＋１」、負の無限大に近付くときには「０」または「−１」であるようにしている。このシグモイド関数と、個々のニューロン重みと、ニューロン・バイアス値とによって、１つのニューロンの、その全ての入力に供給された信号に対する応答性、即ち「興奮度」が定まる。また、ある階層に属する、ある１つニューロンの出力を、その上の階層に属する複数のニューロンの全てへ分配して、それら全てのニューロンの入力とするということが、しばしば行なわれている。典型的なニューラル・ネットワークは、３種類の階層を含んでいる。即ち、そのネットワークの最下位に位置する入力階層、そのネットワークの最上位に位置する出力階層、それに、それら入力階層と出力階層との間の中間に位置する中間階層（隠れ階層）の３種類である。具体的な例として、例えば、英数字の文字に正規化処理を施して７個×５個のビクセルのアレイから成る文字とした正規化処理済文字の認識に使用するためのニューラル・ネットワークの場合について説明するならば、そのビクセル・アレイ中の１つ１つのビクセルに対応した夫々のセンサ（このセンサは例えば、適当な電荷結合デバイス（ＣＣＤ）の中の個々のセル等である）の出力が、入力階層中の、互いに異なったニューロンへ、その入力として供給される。従って、この入力階層には、各ビクセルに対して１個ずつ、合計３５個の個別のニューロンが配置されることになる。この入力階層中のそれらニューロンは、各々がただ１つの出力を備えている。そして、入力階層中のそれら３５個の全てのニューロンの出力は、更に、隠れ階層とも呼ばれる中間階層の中の、全てのニューロンへ分配されて、それらの入力となる。中間階層中のそれら各ニューロンの出力は、出力階層中の全てのニューロンへ分配されて、それらの入力となる。出力階層中のニューロンの個数は、そのニューラル・ネットワークが識別すべき文字の種類数に、等しくするのが一般的である。そして、例えば、それら出力ニューロンのうちの１つを文字ｒＡ」に対応させ、別の１つの出力ニューロンを文字ｒＢＪに対応させ、３番目の出力ニューロンを文字「ａ」に対応させ、４番目の出力ニューロンを文字「ｂ」に対応させるというようにし、以下同様に、英数字の文字の異なった種類の各々を、１つずつの出力ニューロンを対応させるようにする。尚、ここで英数字の文字という中には、文字、数字、句読点、及び／またはその他の必要な、ニューラル・ネットワークが認識すべき記号が含まれる。中間階層中のニューロンの個数を何個にするかを決定する要因の主なものには、以下のものがある。即ち、認識させるためにニューラル・ネットワークへ供給する文字のビットマツプの複雑度、ニューラル・ネットワークの情報キャパシティとして望まれるキャパシティの大きさ、ニューラル・ネットワークに学習させた後に、そのニューラル・ネットワークが獲得する未知のバタンを取り扱うことのできる能力をどの程度に設定するか、そして、後に説明するように、学習処理を施す際に、ニューラル・ネットワークの全ての重みとバイアス値とが適切に収束するまでに、そのニューラル・ネットワークが経なければならない反復処理の回数等が、中間階層中のニューロンの個数を定める主な要因である。尚、ニューラル・ネットワークの出力は、通常は、プロセッサ等の回路へ供給するようにしており、その回路によって、そのニューラル・ネットワークの出力を、後続の処理に適した、適当なマルチビットのディジタル・ワード（例えばアスキー・ワード等）へ変換するようにしている。

ニューラル・ネットワークの運用には、一般的に、２種類の異なった、続けて実行する処理手順が含まれる。即ち、初期化及び学習処理手順（この学習は、バタンか既知で結果的に発生される出力も既知の、所定のバタンについて行なう）と、その後に続けて実行する、実際の未知のバタンを対象とした認識処理手順との２種類である。

先ず最初に、ニューラル・ネットワークの初期化を行ない、この初期化は、そのニューラル・ネットワークの中の全てのニューロンの、そのニューロン重みとニューロン・バイアス値とを、ランダム値にセットすることによって行なう。この場合のランダム値としては、一般的に、ある一定の範囲内にある値を用いる。

この後、ニューラル・ネットワークの学習を実行する。更に詳しく説明すると、ニューラル・ネットワークに対しては、予め定めである複数の所定の入力データ・バタン（いわゆる学習用バタン）を連続して次々と供給する。そして、ニューロン重みとニューロン・バイアス値との、両方の値を同時に調節して、各々の学習用バタンに関するそのニューラル・ネットワークの出力が、その学習バタンに対応した、目標とするニューラル・ネットワーク出力（目標ベクトル）に、略々一致するようにする。学習が完了したならば、全ての重み並びにバイアス値は、そのときの現在値に固定する。これが済んだならば、このニューラル・ネットワークを使用して、未知のバタンの認識を実行することができる。このバタン認識の実行中には、複数の未知のバタンを連続して次々と、ニューラル・ネットワークの複数の入力へ並列的に供給し、それによって得られる、その入力に対応したニューラル・ネットワークの応答を出力ノードから取り出す。理想を述べるならば、あるニューラル・ネットワークが、ある未知の入力バタンを、そのニューラル・ネットワークがそれについて学習したある所与の文字であると認識したときには、出力階層中の、その文字に対応したニューロンが発生する信号が、出力階層中のその他のニューロンが発生するいずれの信号よりも、際立って大きな信号となっているべきである。

学習処理の実行中に、全てのニューロンの、その重み並びにバイアス値を迅速に調節するための方法として、従来から広く用いられている技法の１つに、逆誤差伝搬法Ｃ以下、単に［バックプロパゲーション（逆伝搬法）」と称する）という技法がある。簡単に説明するならば、この技法では、ニューラル・ネットワークへ所定の学習用入力バタン（人力ベクトル）を供給し、その学習用人カバタンを、ニューラル・ネットワークの中を順方向へ伝搬させ、そして出カニニーロンに、その学習用人カバタンに対応した出力バタン（出力ベクトル０）を発生させる。続いて、この出力ベクトルに付随している誤差の大きさを判定し、その判定した誤差を、そのニューラル・ネットワークの中を逆方向へ伝搬させて、そのニューラル・ネットワークの中の個々のニューロンへその誤差を配分する。更にその後、それら各ニューロンの重みとバイアス値とを調節し、このときの調節の方向と量とは、その学習用人カバタンに関するニューラル・ネットワークの全体の誤差の大きさが最小となる方向及び量とする。

ある１つの学習用バタンに関してそのニューラル・ネットワークの全ての重みの調節を完了したならば、続く次の学習用バタンをそのニューラル・ネットワークへ供給し、誤差の大きさの判定及び重みの調節のプロセスを反復して実行し。

以下同様にして、複数の学習用バタンの各々について、以上のプロセスを次々と反復実行して行く。通常は、それら学習用バタンの各々に関して、ニューラル・ネットワークの全体の誤差が所定の限界値に達したならば、以上の反復実行を停止して、この学習処理を終了する。その時点で、ニューラル・ネットワークの全ての重みとバイアス値とを、それらの現在値に固定する。これ以後、未知の入力データについての文字認識作業を、比較的高速で実行することができる。尚、以上に関しては、Ｍ・コーデル著「ニューラル・ネットワーク入門−一第３巻」（Ｍ、　Ｃａｕｄｉｌｌ、　”Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋｓ　Ｐｒｉｍｅｒ　 −−Ｐａｒｔ　ＩＩＩ”、　犯」凶徂匹、　Ｊｕｎｅ−１９８８，ｐａｇｅｓ　５３−５９）を参照されたい。

文字認識処理の実行中に、ニューラル・ネットワークが認識した特定の文字を同定するための方式としては、通常、［勝者の全取り（Ｗｉｎｎｅｒ　ｔａｋｅ　ａｌｌ　）　Ｊ方式を採用している。この方式は、ある人力データのバタンに対して、ニューラル・ネットワークが完全に反応を終了した時点で、他の出力ニューロンが発生している出力値と比べて、最大の出力値を発生している１つの出カニニーロンを、そのニューラル・ネットワークの出力として選出するというものであり、この選出は、そのニューラル・ネットワークに接続した処理回路に行なわせるようにしている。その処理回路は、該当する出力ニューロンを選出したならば、それに続いて、簡単なテーブル・ルックアップ動作等を行なうことによって、ニューラル・ネットワークが同定したその特定の文字の、マルチビットのディジタル表示を検索する。

以上に説明した種類の、バックプロパゲーション方式のニューラル・ネットワークは、研究室の環境の中で、静的な試験データ母集団に基づいて、英数字の文字の認識を実行する場合には、非常に正確な結果を出すことができる。しかしながら、この種のニューラル・ネットワークをＯＣＲシステムに組み込んだ上で、実地に（即ち「実世界環境」の中で）文字の認識を実行した場合には、その実行の結果得られる認識正確度を著しく制約する、重大な問題が発生する。

更に詳しく説明すると、ＯＣＲシステムの製造工場には、一群の複数台のプリンタを用意してあり、それらプリンタを使用して、通常、広範な種々の異なったフォントの英数字の文字を打ち出すようにしている。そして、工場においては、ＯＣＲシステムに組み込んだニューラル・ネットワークに対して、そうして打ち出した特定の文字を認識させるための学習処理を施している。しかしながら、残念なことに、一旦、ＯＣＲシステムが工場を離れて、ユーザの使用現場において運転されるようになったならば、そこでそのＯＣＲシステムは、未だ学習をしていない、様々な見慣れない文字にも直面しなければならない。見慣れない文字に直面することになる具体的な状況としては、例えば、ニューラル・ネットワークに学習させたいずれのフォントとも異なったフォントを、ユーザが使用している場合もあり、及び／または、学習に使用したフォントと、ユーザの使用現場にお− いてスキャンした書類上に印字されていたフォントとがたと久同−であっても、そのフォントで形成されている、学習に使用した特定のタイプフェースとユーザの書類上の実際のタイプフェースとの間に、事実上の相違が存在している場合もある。このように同一のフォントを使用していても、別々のプリンタによって印字したタイプフェースどうしの間には、事実上の相違が存在し得ることの原因としては、例えば、それらプリンタの同じ文字の印字部材の間の摩耗度の相違（摩耗度の相違は、それら印字部材によって印字媒体上に印字したときの印字状態、即ち印影の相違を生じる可能性がある）や、同じ文字の印字部材に付着しているゴミないじ塵芥の付着程度の相違、同じ文字の印字部材から媒体上へ塗布されるインクないしトナーの量の不均一、それに、目に見える僅かな相違、例えば、同じフォントで形成された同じ文字でありながら、プリンタが互いに異なるために生じている、アセンダ（字形の上方突出部）、デセンダ（同じく下方突出ｆＨＩ）、ないしはセリフ（同じく端部の小突出部）の長さの違い等がある。従って、主として、これら例示した要因によって、ユーザの使用現場に設置されたＯＣＲシステムは、取り扱う英数字の文字の母集団が、動的に変化するものとなる可能性が高いのである。ＯＣＲシステムが見慣れない文字に出会うたびに、ニューラル・ネットワークがその文字を誤認してしまい、そのため認識誤り表示を発生するというのは、良くあることである。

実地において使用中に発生する認識誤りの発生率を、許容可能な低いレベルに抑えておくためには、そのＯＣＲシステムのオペレータが、そのシステムに認識させようとしている具体的な文字についての学習処理を、そのシステムに周期的に繰り返して施す必要がある。また、数件分の書類を連続して処理する場合に、それらの書類に使用されているフォントそれ自体が各書類ごとに異なることもあれば、たとえ同一のフォントであっても、そのタイプフェースが書類によって異なることもある。そのため、それらの各書類ごとに、ＯＣＲシステムに学習をさせなければならないということも、良くあることである。しかしながら、ＯＣＲシステムに常時学習させることは、また特に、認識処理すべき一運の書類のその各々ごとに学習させることは、多くの時間を費やすことになるため、そのＯＣＲシステムの全体としての作業能率を著しく低下させてしまう。

更には、ユーザの書類に記入されている文字がつぶれていることも、しばしば経験されることである。この文字のつぶれの原因の主なものとしては、実地使用環境において日常的に見かける印字ミスや、印刷媒体それ自体の汚れないし局部的なキズ（例えば小さな黒い点に見える紙の夾雑物等）がある。ニューラル・ネットワークをそれについて学習させたはずの入力文字の上に、この種の文字のつぶれが発生していると、ニューラル・ネットワークは、その文字を明確に認識することができなくなる。その結果、その文字についてニューラル・ネットワークが発生する出力ベクトルにおいては、その中の最大の出力値と２番目に大きな出力値との間の差が、比較的小さなものとなってしまう可能性が高い。この場合、そのニューラル・ネットワークは、曖昧な認識結果を発生しているわけである。

即ち、その出力ベクトノ囚己よ、高度の不確定性が付随しており、その最大の出力値の信頼性も、比較的低いものとなっている。この曖昧性があるために、最大の出力値を発生している出力ニューロンに対応した文字ではなく、２番目に大きな出力値を発生している出力ニューロンに対応した文字の方が、実際には正確に認識した文字であるという場合もあり得る。ところが、この曖昧性は、前述の「勝者の全取り」方式による出力の選出のプロセスにおいては、全く考慮されない。

従って、その場合には、ニューラル・ネットワークの複数の出力のうちから選出される出力は、誤った出力となる。

そのため、もし、ニューラル・ネットワークの実地使用中に、つぶれた文字を含んでいるユーザの書類を教材として、そのニューラル・ネットワークに学習をさせたならば、その学習をさせたことによって、そのニューラル・ネットワークの出力に不確定性が入り込み、そのため、そのニューラル・ネットワークは、つぶれた文字を認識するように動作が偏向してしまう、そして、このような動作の偏向と、前述の「勝者の全取り」方式の、出力の選出プロセスとが結びつくと、ユーザの書雇上の、つぶれていない健全な入力文字を認識する場合に、その認１誤りの発生率が、減少するどころか、却って増大してしまうという不都合を招く可能性が高くなり、そうなれば、全体としての認１誤りの発生率も上昇してしまう。

実地使用中に、全体としての認識誤りの発生率が上昇することがないように、通常は、ニューラル・ネットワークの重み並びにバイアス値は、工場の段階で、一定の値に固定してしまい、それによって、実地使用中のニューラル・ネットワークの重み並びにバイアス値の変更は、たとえ不可能でない場合であっても、限られた小さな範囲でしか行なえないようにしである。ＯＣＲシステムの、システム全体としての認識誤り発生率は、工場において測定される発生率よりも、ユーザの書類の認識処理を行なうようになってからの認識誤り発生率の方が高くなる傾向があり、これは、ユーザの書類には、つぶれた文字が含まれているためであるが、ただし、これによる認識誤り発生率の上昇は、そのつぶれた文字を教材としてニューラル・ネットワークに学習させたときに生じる認識誤り発生率の上昇に比べれば、小さなもので済む可能性が高いのである。従って、ＯＣＲシステムの製造メーカーが、妥当と考えられる性能を提供しているという場合、実は製造メーカーは、ＯＣＲシステムの実地使用中にその認識誤りの発生率がある程度、高くなることは甘受するように、ユーザに対して暗にめているのである。しかしながら、機械印字した文字の自動認識を、正確に行なうことが、なにより重要視される多くの用途においては、その認識誤り発生率のレベルは、尚、許容可能な程度を超えた高いレベルにある。即ち、現在使用されている種々のＯＣＲシステムは、その種の用途には全く不適当である。

確かに、ＯＣＲシステムが文字認識の作業をしている間、人間のオペレータをこのＯＣＲシステムに配置しておくというのも、この問題の１つの解決法ではある。この方法では、ＯＣＲシステムが文字を誤認したか、或いは、文字を認識したときの不確定性がある程度、高かった場合に、このＯＣＲシステムがオペレータへ合図を出すようにしておく。オペレータは、その合図を受けたならば、該当する文字の１つ１つについて、そのビットマツプを調べて、ＯＣＲシステムへ正しい文字を打ち込むようにする。こうすれば、結果として得られる、このＯＣＲシステムの全体としての正確度は上昇するが、認識システムに人間のオペレータが関与することから、システムの作業能率が著しく低下する上に、その運転コストも大幅に増大する。ＯＣＲシステムを使用する用途の殆どは、コストの増大に関して非常に敏感な用途であるため、システムに人間のオペレータが関与するということは、経済的な理由から全く実用的なものとは言えない。

従って従来より、特に、パックプロパゲーションを採用し、しかもＯＣＲシステムに用いるの適したニューラル・ネットワークであって、動的に変化している「実世界」のユーザの入力データに、その動作を正確に適応させることのできるニューラル・ネットワークが要望されていた。そのようなニューラル・ネットワークであれば、特に、動的に変化している入力文字データに直面した場合に、従来公知のニューラル・ネットワークを使用して、これまで行なわせていた動作と比べて、より高い認識正確度をもって、より力強い動作を行なえるものとなる。

更には、その種のニューラル・ネットワークであれば、充分に高い認識正確度を提供することができるため、ＯＣＲシステムに人間のオペレータを関与させる必要を、多くの場合、完全に払拭することは無理であるにしても、少なくとも、大幅に減少させることができるようになる。従って、その種のニューラル・ネットワークをＯＣＲシステムに用いるようにすれば、全体としての認識正確度を向上させることができるのみならず、ＯＣＲシステムのコストを著しく増大させることなく、その作業能率を向上させることができるという利点も得られる。また更に、これまではＯＣＲシステムには適していなかった多くの用途に、ＯＣＲシステムを利用することもできるようになる。

Ｘ咀の同量従って、本発明の目的は、動的に変化している入力データに対して、その動作を正確に適応させることのできるニューラル・ネットワークを提供することにある。

また、具体的な目的の１つは、学習処理の実行中に、パックプロパゲーションを利用して、そのニューラル・ネットワークの重みとバイアス値とを変更するようにした、上述の種類のニューラル・ネットワークを提供することにある。

また、具体的な目的の１つは、そのニューラル・ネットワークを使用することによって、ＯＣＲシステムのコストが大幅に増加することのない、上述の種類のニューラル・ネットワークを提供することにある。

以上の目的並びにその他の目的は、本発明の教示によれば、以下の構成によって達成される。即ち、その構成は、「未知の入力データに応答して複数の出力値を発生するようにしたネットワークであって、発生したそれら複数の出力値が集合した全体によって、その未知の入力データの中に存在している複数のバタンのうちの１つのバタンを同定するようにしてあり、更に、複数の重み値を付与しであるネットワーク」と、「制御信号と、所定バタンに関する複数の出力値及びそれら複数の出力値に対応した複数の所定の出力目標値とに応答して、前記複数の重み値の各々の値の変更量を決定し、更に、決定したその変更量に応答して、前記未知の入力データがネットワークへ供給されている状態で前記複数の重み値の各々の値を調節して、その未知の入力データに関して前記複数の出力値と前記複数の出力目標値との間に生じる誤差を減少させるようにする決定／調節手段」と、「前記複数の出力値に応答して、それら複数の出力値に関する信頼性指標値を判定する手段Ｊと、「信頼性指標値に応答して前記制御信号を発生することによって、その信頼性指標値が充分な大きさの所定値であるときに、前記決定／調節手段をイネーブルして前記変更量の決定と前記複数の重み値の調節とを行なわせる、制御信号発生手段」とを備えたものである。この構成とすることにより、当該バタンが所定バタンからのずれを生じているときには、ネットワークが、当該バタンを認識するための学習を行なうようになる。

本発明によれば、ニューラル・ネットワークに学習を行なわせる際に利用可能な基礎データを拡張して、実際の未知の入力文字を認識して得た文字のうち、その文字を認識したときの出力信頼性が充分に高かった文字を、その基礎データに包含させるようにしている。出力信頼性の指標値としては、例えば、ニューラル・ネットワークの複数の出力ニューロンが発生する出力値のうちの、最大の出力値と、２番目に大きな出力値との間の比の値とすることができる。文字認識作業の実行中に、認識したときの出力信頼性指標値が所定の範囲内に位置していた文字に対応したニューラル・ネットワークの出力に応答して、パックプロパゲージ３ン並びにニューロン重み及び二ニーロン・バイアス値の調節の実行を許可するようにしている。ある文字を認識したときの出力信頼性がその範囲内にあったならば、（ａ）その文字を表すビットマツプが、ニューラル・ネットワークを初期学習させたときに使用したその文字のビットマツプからある程度変化しており、且つ、（ｂｌそのビットマツプがそのように変化しているにもかかわらず、ニューラル・ネットワークはその文字をおそらくは正しく認識していると推定される、という２つの事実が成立している可能性が高い。そこで、この条件を満たす文字に関してニューラル・ネットワークに再学習させることによって、そのニューラル・ネットワークが、実地使用中に直面している実際の変化している「実世界」の文字の認識作業に、正確に、且つ自動的に適応することができるようになり、従って、初期学習時に（例えば工場その他で）その学習に用いられた文字だけにしか適合しない状態に凍結されずに済むようになる。こうして、ニューラル・ネットワークの学習用データの基礎データの全体をこの方式で拡張して、動的に変化している入力文字のうち、認識したときの出力信頼性が充分な値であった文字をその基礎データに包含するようにしているため、本発明のニューラル・ネットワークは、滑らかに、迅速に、且つ正確に、その応答を、「実世界の」文字に適応させることができ、更にそれによって、従来公知のニューラル・ネットワークにおいて、これまで行なわれてきた動作と比べて、より力強い動作が可能となっている。また、本発明を使用することによって、認識正確度を大幅に向上させることができるため、多くの状況において、人間のオペレータを配置して、誤認した文字の１つ１つについてそのビットマツプを調べて、その後に正しい文字をシステムへ打ち込むという作業に従事させる必要を、たとえ完全ではなくとも、殆ど不要化することができるという利点が得られる。

本発明の好適実施例に係る教示によれば、入力文字を認識したときにその出力値Ｎ性が但通ぎたり、或いは高過ぎた文字に関しては、その文字をニューラル・ネットワークが出力したことに応答して、パックプロパゲーションと、ニューロン重み及びニューロン・バイアス値の調節とが行なわれることはないようにしである。出力信頼性指標値が余りに小さい場合には、それは、認識した文字に大きな不確定性が付随していることを表わしており、一方、出力信頼性指標値が余りに大きい場合には、それは、認識した文字のビットマツプが、たとえ皆無でないにしてもそれ程には変化していないことを表わしており、従って、ニューラル・ネットワークに再学習を行なわせる程のこともなく、また、たとえ再学習を行なわせたとしても、その結果として得られる、ニューラル・ネットワークが提供する認識正確度の向上は、皆無でないにしても、目に見える程のものとなる可能性は低い。

更に、本発明の１つの局面によれば、本発明のシステムが提供する認識正確度は、そのままでも既に、従来公知のニューラル・ネットワークを使用した場合の正確度より優れたものであるが、「２パス」動作を採用すれば、それによって更にその正確度を優れたものとすることができる。この「２パス」動作は、極めて高い認識正確度を必要とする書類に対して用いるのに適したものである。その場合、その種の書類の各ページに対し、本発明のニューラル・ネットワークを初めて通過させる「第１バス」の処理を施す際に、そのページ上の文字を使用した、このニューラル・ネットワークの適応性再学習を、その文字を認識したときの信頼性によって制御しつつ実行する。そして、そのページの全体を、本発明のニューラル・ネットワークを通過させ終ったならば、同じそのページを、本発明のニューラル・ネットワークを再度通過させて、初回と同じ方法でもう一度処理し、それによって、ニューラル・ネットワークを２回目に通過させる「第２パス」の処理を行なう。この方式とすれば、第１バスの処理においては誤認されたかも知れない様々な文字が第２パスにおいては適切に認識される可能性が高く、それによって、そのページの認識正確度を向上させることができる。

２厘の墾里な思酉本発明の教示は、添付図面に関連した、以下の詳細な説明を考察することによって、明瞭且つ容易に理解することができる。添付図面は、以下のとおりである。

図１は、本発明の教示を具体化したニューラル・ネットワークを組み込んだ、光学文字認識システム（ＯＣＲシステム）の一実施例のブロック図である。

図２は、従来公知のニューラル・ネットワークの典型的な一例である、ＯＣＲシステムに用いるための、バックプロパゲーションを採用したニューラル・ネットワークのブロック図である。

図３は、ニューラル・ネットワークの中に用いる典型的なニューロンの、ハイレベルのブロック図である。

図４は、本発明のニューラル・ネットワークの一実施例の、ハイレベルのブロック図である。

図５は、出力信頼性指標値の複数の領域と、出力信頼性指標値がそれらの範囲の中に位置しているときに、それに対応して本発明のニューラル・ネットワークが実行する動作とを図解した図である。

図６は、図６Ａ〜図６Ｄの、図面どうしの正しいつなぎ合せ方を示した図である。

図６Ａ〜図６Ｄは、それらをつなぎ合せた図によって「複パス文字認識及びパックプロパゲーション制御ルーチン」６００の、ハイレベルのフローチャートを示すようにした図であり、このルーチン６００は、本発明の文字認識方法をソフトウェアで構成したものであり、また、図４に示した本発明のニューラル・ネットワークのソフトウェアによる実施例を利用するようにしたルーチンである。

尚、これら図面においては、その理解を容易にするために、異なった図に共通して示されている同一の要素には、できる限り同一の引用符号を使用するようにした。

日を　施するための形態当業者であれば、以下の説明を読了した後には、容易に理解できることであるが、本発明のニューラル・ネットワークは、パタン認識に関連した、広範な様々な用途に利用可能なものである。それらの利用可能な用途のうちの具体的な一例を挙げるならば、英数字の文字を認識するための、光学文字認識に関する用途を挙げることができる。この用途について、更に具体的に説明すると、それらの文字は、任意のプリント媒体（例えば紙やマイクロフィルム等）上に、プリントされ、或いは手書きされた文字であることもあれば、場合によっては、ディジタル化タブレット上に手書きされたものであったり、或いは、ブラウン管（ＣＲＴ）ディスプレイ上にライトペンで手書きされたものであることもある０本発明の二二 −ラル・ネットワークは、紙の上に機械印字された文字を正規化処理したもの（即ち、規定寸法に変換したもの）を認識するようにした光学文字認識システムに使用するのに、特に適したものであるため、また、以下の説明を理解し易くするためにも、本発明の詳細な説明においては、その種の光学文字認識システムに使用する場合を例に取って、説明を進めて行くことにする。

図１に示したのは、機械印字した文字を認識するための光学文字認識システム（ＯＣＲシステム）であり、本発明の教示に従って具体的に構成したニューラル・ネットワークを備えたシステムの一実施例のブロック図である。区示の如（、本システムは、フロントエンド・プロセッサ１１０と、ニューラル・ネットワーク４００と、ネットワーク後置プロセッサ１７０とを備えており、また更にオプションとして、プロセッサ１８５と、端末１９０と、ハード・ディスク・ファイル１９５とを備えている。

認識処理をしている画像書類から取り出す入力画像ビクセルは、適当なスキャナによって発生させ、適当なインターフェース回路を介して供給する（これらはいずれも公知のものであるため、図には示さない）ようにしてあり、それら入力画像ビクセルは、リード５０を介して、フロントエンド・プロセッサ１１０の入力へ供給される。フロントエンド・プロセッサ１１０は、先ず、その書類上に存在している幾つもの文字から１つ１つの文字を分離しく飾りひげのように字面の一部が胴・軸からはみ出している場合にも分離することができる）、次に、分離した各々の文字のビットマツプ・パタンに正規化処理を施して、その文字を一定の寸法のものとしくこれによって、そのビットマツプ・パタンがニューラル・ネットワーク４００の入力として使用可能になる）、次に、正規化しないままの文字と正規化した文字との両方を、夫々、フレーム記憶メモリ１２０とフレーム記憶メモリ１３０とに記憶させ、そして、フレーム記憶メモリ１３０からは、正規化した画像ビクセルのシーケンスを、入出力スイッチ（Ｉ１０スイッチ）１４０を介してニューラル・ネットワーク４００へ供給する。更に詳細に説明すると、リード５０上の入力画像ビクセルのストリームは、フロントエンド・プロセッサ１１０の中に備えた、連結要素アナライザ１１５へ入力する。この連結要素アナライザ１１５は、連結要素解析を実行することによって、書類中の連続する複数の文字の画像を個々に分離する。分離された個々の文字は、その各々が連結要素アナライザ１１５から、リード１１８を介して、フレーム記憶メモリ１２０と、文字ノーマライザ１２５との双方へ入力として供給される。これらのうちフレーム記憶メモリ１２０は、入力書類の現在ページ上に存在している文字を分離して得た個々の文字の、正規化していないビットマツプ・パタンをそのまま記憶するものである。こうして記憶した正規化していない文字は、後に詳述するように、ネットワーク後置プロセッサ１７０が利用する。即ち、文字のうち、その文字のケースが、アッパー・ケース（大文字類）であっても、またロアー・ケース（小文字Ｍ）であっても、正規化処理を施した後にはその形状が同一となる文字については、ネットワーク後置プロセッサ１γ０が、フレーム記憶メモリ１２０の中の正規化していない文字を参照して、その文字のケースを判定するようにしているのである。文字ノーマライザ１２５は、分離した個々の文字のビットマツプの縦と横の夫々の寸法を判定する。そして、個々の文字のうちに、その縦横の寸法が、ニューラル・ネットワーク４００で処理するために必要とされる一定の文字寸法（例えば縦２４ビクセル×横１２ビクセル）より大きかったり、或いは小さかったりするものがあった場合には、文字ノーマライザ１２５が、その文字のビットマツプの寸法を比例関係を保ちつつ変化させて、この一定の文字寸法に一致させる。また、こうして正規化処理を施した文字の各々は、リード１２７を介して、Ｉ１０スイッチ１４０の入力へ供給される。

本発明の好適実施例では、後に詳述するように、適応式動的学習方式によって高い認識正確度を得るために、ニューラル・ネットワークを通過させる処理を２度行なう、２バス方式を採用しており、そのためフレーム記憶メモリ１３０には書類の現在ページ（認識処理を現在実行中のページ）の、まるまる１ペ一ジ分の全ての正規化処理済み文字のビットマツプを記憶させることができるようにしてあり、その記憶させたビットマツプを、ニューラル・ネットワークを２度目に通過させる第２パスを実行する際に、利用するようにしている。このように、１ペ一ジ分のビットマツプを記憶させているため、このフレーム記憶メモリ１３０を使用することによって、書類の各々のページを２回ずつスキャンせずに済み、また、スキャンして得た各々の文字ごとに、文字の分離処理ないし文字の正規化処理を２回ずつ実行する必要もない。更に、フレーム記憶メモリ１３０は、２組の互いに独立したフレーム記憶メモリ１３２と１３４とを含んでいる構成としである。そして、これらメモリの各々に、まるまる１ペ一ジ分の、正規化したビットマツプ文字を記憶させることができるようにしである。これらメモリは、Ｉ１０スイッチ１４０の制御の下に、公知の「ビンボン」方式で動作するようにしてあり、この「ビンボン」方式は、一方のフレーム記憶メモリに、即ちメモリ１３２と１３４のうちの一方に、文字ノーマライザ１２５が送出する正規化処理済ビットマップ・データをリード１３７を介して次々と記憶させている間、他方のフレーム記憶メモリからは、リード１３７とＩ１０スイッチ１４０とを介して、データを次々と読み出してニューラル・ネットワーク４００の入力へ供給するようにしたものである。Ｉ１０スイッチ１４０は、フロントエンド・プロセッサ１１０がその内部で発生する然るべき制御信号に従って、また、ネットワーク後置プロセッサ１７０からリード１７７を介して受け取る制御信号に応答して、フレーム記憶メモリ１３０の中の個々のフレーム記憶メモリ、文字ノーマライザ１２５、及び／または、ニューラル・ネットワーク４００の入力の間に、必要なマルチビット経路（図には詳細に示さない）を確立するものである。例えば、１ペ一ジ分の正規化処理済ビットマツプ文字のデータに対して、ニューラル・ネットワークを初めて通過させる第１パスの処理を施すときには、Ｉ１０スイッチ１４０は、文字ノーマライザ１２５の出力を、フレーム記憶メモリ１３２と１３４のうちで現在、記憶の読出しを行なっている方のフレーム記憶メモリの入力と、ニューラル・ネットワーク４００の入力との、双方へ供給する。これによって、連続する複数の正規化処理済ビットマツプ文字バタンの各々を、次々と、ニューラル・ネットワークを通過させて処理する一方で、同じ文字バタンを、フレーム記憶メモリ１３０の中の２組のフレーム記憶メモリのうちの一方に、次のバス、即ち第２パスにおいて使用できるように、記憶しておくようにしているのである。そしてその第２バスの実行中には、フレーム記憶メモリ１３０の中の２組のフレーム記憶メモリのうち、今回文字バタンを記憶させた方のフレーム記憶メモリの内容を、Ｉ１０スイッチ１４０を介して、連続的に次々と読み出して、ニューラル・ネットワーク４００の入力へ供給する。更に、それと同時に、入力書類のうちの、次のページの正規化処理済ビットマツプ文字のデータを、文字ノーマライザ１２５が、Ｉ１０スイッチ１４０を介して、フレーム記憶メモリ１３０の中の他方のフレーム記憶メモリへ供給し、以下、同様の動作を繰り返すようにしである。このように、フレーム記憶メモリ１３０とＩ１０スイッチ１４０とを協働させることによって、各ページを２回ずつスキャンする必要を無くし、また、スキャンした場合にそれに付随して必要となる、文字の分離処理並びに文字の正規化処理も、２回ずつ行なわずども良いようにしであるため、１ペ一ジ分の、ビットマツプの正規化処理済の文字を、各ページ２回ずつ連続してニューラル・ネットワークを通して処理するようにしても、それによってフロントエンド・プロセッサ１１０の処理速度（この処理速度は、一般的にニューラル・ネットワーク４００やネットワーク後置プロセッサ１７０の処理速度よりも遅い）が、悪影響を受けることがない。尚、本発明は、ＯＣＲシステム１００の中に組み込んである、ニューラル・ネットワーク４００に関するものであって、連結要素アナライザ１１５ないし文字ラーマライザ１２５自体の機能には、直接関係したものではないため、それらの要素の動作については、これ以上詳細には説明しない。ただし、それら要素の動作についての説明は、本発明者による、本願の基礎米国出願の同時係属出願である、発明の名称を「機械印字文字のための光学文字認識ニューラル・ネットワーク・システム」とした、　年−周一日付出願の、米国特許出願筒　号の中に示されている。尚、同米国出願は、この言及をもって本開示に包含するものとする。

ニューラル・ネットワーク４００は、リード２１０上に出力される正規化処理済ビットマツプ文字の、その各々の文字のバタン認識を実行するものである。更に詳細に説明すると、正規化処理済文字の複数のビットの各々を、このニューラル・ネットワーク４００の夫々異なった入力リードへ供給する。ニューラル・ネットワーク４００については、すぐ後に詳細に説明するが、ここでその基本的な点について述べてお（と、ニューラル・ネットワーク４００は、互いに同様の構成の複数の処理要素（いわゆるニューロン）から成る構成体であって、それら複数のニューロンを、複数階層の階層構造を成すように配列することによって、入力ニューロン階層、中間ニューロン階層、及び出力ニューロン階層を個別に設けたものである。正規化処理済文字のビットマツプの各々は、２４個×１２個のビクセルから成る一定の大きさのアレイとして形成されるようにしである。従って合計ビクセル個数は２８８個であるため、ニューラル・ネットワーク４００は、２８８個の入力ニューロンを備えたものとしてあり、入力階層中のそれら２８８個のニューロンの各々に、このビットマツプの中の、夫々に異なったビクセルを供給するようにしである。このニューラル・ネットワーク４００の中間処理要素（即ち中間ニューロン）の個数は、例えば約７５個とするが、ただし、この個数は絶対的なものではない。ニューラル・ネットワーク４００から発生される出力の数は、後に詳述するように出力ニューロンの個数に等しく、また、それら出力ニューロンの個数は、出力リード４８０の中に含まれている、それら出力ニューロンに対応した夫々のリードの本数でもあるが、この数は、ニューラル・ネットワークによって認識しようとしている文字の種類の数に等しくする。このニューラル・ネットワーク４００では、各々が出力値を発生する出力ニューロンを、約５０個、含んでいるようにしている。そして、それら出力ニューロンのうちの１個と、リード４８０のうちの、その１つの出力ニューロンに付随した１本のリードには、文字「Ａ」を対応させてあり、また、別の１個の出力ニューロンとそれに付随したリードには文字「Ｂ」を、更に別の第３のものには文字ｒａＪを、そして第４のものには文字「ｂ」を対応させ、以下同様にして、異なった英数字の各々を対応させである。尚、ここでいう英数字とは、ニューラル・ネットワーク４００が認識する必要のある、文字、数字、句読点、及び／または、その他の必要な記号を含むものである（以後、本明細書においては、これら全てを含めて集合的に「文字」と呼ぶことにする）。ニューラル・ネットワークが発生する出力値の全ては、ネットワーク後置プロセッサ１７０へ供給され、ネットワーク後置プロセッサ１７０は、供給されたそれら出力値に応じた動作を行なうことによって、このニューラル・ネットワークの出力を、それに対応したマルチビットのディジタル・ワード（例えばアスキー・ワード等）へ変換して、後続の処理においてそのワードを使用できるようにする。ニューラル・ネットワーク４００は、好ましくは、集積回路として構成されたディジタル信号処理回路を使用してソフトウェアによって構成するのが良く、使用することのできる集積回路としては、例えば、米国、イリノイ州、シャラムバーブに所在のモトローラ社の製造に係る、５６０００型ディジタル信号プロセッサ（ＤＳＰ）等がある。この集積回路を使用した場合、ニューラル・ネットワーク４００は、２００文字文字量上の処理能力を持つものとすることができる。

ニューラル・ネットワーク４００は、文字認識処理の実行中は、ネットワーク後置プロセッサ１７０と協働し、「勝者の全取り」方式を用いて、ニューラル・ネットワークによって識別された特定の１つの文字を同定する。更に詳細に説明すると、リード２１０へ出力された正規化処理済文字のビットマツプに対する、ニューラル・ネットワーク４００の反応が完全に終了したならば、このニューラル・ネットワークの出力にリード４８０を介して接続しているネットワーク後置プロセッサ１７０が、他の出力ニューロンが発生した出力値よりも大きい、最大の出力値を発生した１つの出力ニューロンを選出する。即ち、ネットワーク後置プロセッサ１７０ば、ニューラル・ネットワーク４００の中の全ての出力ニューロンが、複数本のリード４８０の上に発生した値を互いに比較して、それらの値のうちから、最大の値を１出するのである。ネットワーク後置プロセッサ１７０は、その選出が完了したならば、続いて、例えば簡単なテーブル・ルックアップ動作等を行なって、ニューラル・ネットワークと協働して同定した、即ち、最大の出力を発生した特定の出力ニューロンに対応した、その特定の文字のマルチビットのディジタル表示（例えばアスキー表示等）を、検索して取り出す。また、ある種の正規化処理済ビットマツプ文字は、例えば、文字ｒ０４のように、その文字のケースにかかわらず、即ち、アッパー・ケース（大文字類）であると、ロアー・ケース（小文字類）であるとによらず、同一の形状を呈するため、ネットワーク後置プロセッサ１７０は、ニューラル・ネットワークがその種の文字を認識したと判定したならば、リード１２３をを介して、フレーム記憶メモリ１２０の中の、その文字の、正規化していないビットマツプにアクセスする。ネットワーク後置プロセッサ１７０は、アクセスしたその正規化していないビットマツプに基づいて、その文字の、正規化していない状態での寸法を判定し、それによってその文字のケースを正しく判定することができるようにしである。その文字の正規化していない状態での大きさが比較的大きかったならば、それは、アッパー・ケースであることを表わしており、一方、その文字の正規化していない状態での大きさが比較的小さかったならば、それは、ロアー・ケースであることを表わしている。こうして、認識した文字のケースが判明したならば、ネットワーク後置プロセッサ１アＯは続いて、その文字に該当するディジタル表示（例えばアスキー表示等）をリード１８０上に送出する。ネットワーク後置プロセッサ１７０は更に、リード１７５上に種々の制御信号を発生して、ニューラル・ネットワーク４００の動作を制御する。それら制御信号のうちの１つは、後に詳述するように、ニューラル・ネットワークの学習を実行させるための制ａｍ号である。ネットワーク後置プロセッサ１７０は更に、リード１７３を介して、フロントエンド・プロセッサ１１０へ、場合に応じた種々の選択信号を送出する。それら選択信号は、フロントエンド・プロセッサ１１０に対して、現在ページの正規化処理済入力文字のビットマツプの、ニューラル・ネットワーク４００への再度の供給を開始して、このニューラル・ネットワークを通過させる第２パスの処理を実行させることと、入力書類中の、次のページの正規化処理済入力文字のビットマツプの、ニューラル・ネットワークへの供給を開始して、このニューラル・ネットワークを通過させる第１バスの処理を行なわせることとの、いずれか一方を命令する信号である。更には、様々な公知の制御信号（例えば、特に「ページ処理完了」信号等）が、フロントエンド・プロセッサ１１０の動作と、ネットワーク後置プロセッサ１７０の動作とを、適切に関連付けるために、リード１７７を介して、それらの間でやり取りされる。

ネットワーク後置プロセッサ１７０が送出する出力は、リード１８０を介してプロセッサ１８５へ入力する。プロセッサ１８５は、ハード・ディスク・ファイル１９５に記憶しである誘電データベースと協働して、ニューラル・ネットワーク４００によって認識された文字によって形成されている単語の各々に対して、スペルチェックを実行する。即ち、ネットワーク後置プロセッサ１７０が、１つの単語を形成する一群の文字を送出完了するたびに、このプロセッサ１８５が、誘電データベースを参照するルックアップ動作を行ない、それによって、その単語のスペルが正しいか否かを判断する。ミススペルが発見された場合には、プロセッサ１８５は、リード１２３を介して、フレーム記憶メモリ！２０の中の正規化していない文字のビットマツプをアクセスして、その単語の中の各々の文字を取り出し、そして、リード１８９を介して、それらの文字のビットマツプを端末１９０へ送出して、それらのビットマツプを視覚ディスプレイさせる。続いて、プロセッサ１８５は、端末１９０にプロンプト・メツセージを表示させることによって、この端末１９０に配置されているオペレータに対して、その単語の綴りが、そのままで正しいものであることを認めるか、さもなくば、正しい綴りを入力するかの、いずれかを行なうよう指示をする。オペレータが、現在の綴りが正しいものであることを認めた場合には、プロセッサ１８５は：その単語を形成している一群の文字を、そのまま出力リード１８７上へ送出する。書類上に実際に記されている単語の綴りそれ自体が誤っていて、それをニューラル・ネットワーク４００が、そのまま認識したという場合もあり得るため、たとえ、その単語中の誤字に対する訂正がなされた場合であっても、プロセッサ１８５がその訂正内容をニューラル・ネットワーク４００へ差し戻して学習を実行させることはないようにしてあり、即ち、その種の訂正があった場合、プロセッサ１８５は、訂正された正しい文字を、単に出力リード１８７上に送出する。以上のスペルチェック動作を行なうタイミングとしては、認識処理を実行している現在ページ上の連続した複数の単語の各々について、その１つ１つの単語がニューラル・ネットワーク４００を２度目に通過する第２パスを完了する都度、その単語に対してスペルチェック行なうようにしても良く、或いは、現在ページの全体が、ニューラル・ネットワーク４００を２度目に通過する第２パスを完了した時点で、それら単語に対して一括してスペルチェックを行なうようにしてもよい。また、ハード・ディスク・ファイル１９５には、辞書（即ち諸量データベース）の替わりに、或いは、辞書に加えて更に、認識処理を実行している書類中の誤りの判別及び訂正を助けるための、その他の種類のデータベースを記憶させてお（ようにしても良い。更に、このＯＣＲシステム１００の構成を簡明にして、そのコストを低減するために、プロセッサ１８５、端末１９０、それにハード・ディスク・ファイル１９５に関しては、それらを省略して、このＯＣＲシステムには、データベースに関連した機能（例えばスペルチェック等の機能〕は、持たせないようにしてもよい。そうした場合には、ネットワーク後置プロセッサ１７０がリード１８０上に送出する文字が、そのまま、このＯＣＲシステムの出力になる。

ニューラル・ネットワーク４００の学習は、後に詳述するように、公知の逆誤差伝搬法（以下、単に「パックプロパゲーション（逆伝搬法）」と称する）を利用して行なうようにしている。その要点を述べるならば、この技法では、ニューラル・ネットワークへ、複数の既知の文字（学習用文字）の入力ビツトマツプを連続して次々と供給する。そして、供給したビットマツプの各々に関して、ニューロン重み及びニューロン・バイアス値（これらについても後に詳述する）の調節を行なうことによって、それら学習用文字の各々につＩＪ）で、ニューラル・ネットワークが適切な出力を発生するようにする。

ただし残念なことに、従来公知の、パックプロパゲーションを採用した種々のニューラル・ネットワークには、幾つかの重大な欠点が付随しており、それらの欠点が、それら公知のニューラル・ネットワークをＯＣＲシステムに使用することを困難にしている。その要点を述べると、それら公知のニューラル・ネットワークは、研究室の環境で、静的な試験データの母集団に基づいて、英数字の文字の認識を実行する際に正確な結果を出すことができるが、しかしながら、「実世界」の文字データを使用する実地の環境においては、それらニューラル・ネットワークによって達成し得る認識正確度は、一般的に、太き（低下する。その原因は、ニューラル・ネットワークが実地において直面する「実世界」の文字ないしフォントは、様々な理由から、製造工場においてそのニューラル・ネットワークに学習させた文字ないしフォントとは、しばしば異なっていることがあるからである。更には、タイプフェースにも種々のものがあり、たとえ、それらのタイプフェースのいずれもが一般的なフォントのものであったとしても、認識処理を行なう書類ごとに、そのタイプフェースがある程度、異なっていることも、しばしば経験される。

従来公知の種々のニューラル・ネットワークは、連続して書類を扱って行く際にも、その各書類ごとに学習をさせることができるようにしであるが、その学習をさせるためには相当な時間を費やさねばならず、そのため、そのようにして学習を行なわせると、システムの全体としての処理速度が著しく低下せざるを得ない。更には、特に、印字動作の不備ないしは印字媒体の理疵等のために文字自体がつぶれている場合もある。もし、つぶれた文字に関してニューラル・ネットワークに学習を行なわせたならば、そのニューラル・ネットワークの動作は、そのつぶれた文字を認識するように、偏向してしまうしまう。この動作の偏向に加えて、ネットワーク後置プロセッサが実行する出力の選出方式が、一般的に「勝者の全取り」方式とされているため、それらが相まって、ユーザの書類上の、つぶれていない健全な入力文字を認識する際に発生する認識誤りが減らずに却って増大してしまい、従って、全体としての認識誤りの発生率上昇してしまうという不都合が生じる可能性が高い。

本発明のニューラル・ネットワークは、従来公知の種々のニューラル・ネットワークに付随していたこれらの欠点を、大幅に改善したものである。特に、本発明によれば、ニューラル・ネットワークに学習させる際に、その教材として使用することのできるデータである基礎データを拡張して、その基礎データに、充分な出力信頼性をもって認識された実際の未知の入力文字データの、認識結果を包含させるようにしている。この出力信頼性の指標値は、ニューラル・ネットワークの複数の出カニニーロンが発生する出力値のうちの、最大の出力値と２番目に大きな出力値との間の比の値としている。そして１文字認識処理の実行中に、ある文字を認識したときの出力信頼性指標値が所定の範囲内の値であったならば、そのときのときのニューラル・ネットワークの出力に応答して、パックプロパゲーションと、ニューロン重み及びニューロン・バイアス値の変更調節とを行なわせるようにしている。即ち、ある文字を認識したときに、出力信頼性指標値がその所定範囲内にあったならば、その文字が認識されたということによって、おそらく、以下の事実があるものと考えられる。即ち、その事実とは、（ａｔ認識したその文字を表わすビットマツプは、ニューラル・ネットワークに初期学習を施したときに使用したその文字のビットマツプから、ある程度変化していること、そして、（ｂ）そのビットマツプがそのように変化しているにもかかわらず、ニューラル・ネットワークは、その文字をおそらくは正しく認識していると推定されること、以上２点である。また、ある入力文字を認識したときに、出力信頼性指標値が小さ過ぎるか、或いは、大き過ぎた場合には、そのときのニューラル・ネットワークの出力に応答して、パックプロパゲーションと、ニューロン重み及びニューロン・バイアス値の変更調節とが行なわれることは、ないようにしている。

即ち、出力信頼性指標値が不充分な、小さな値であった場合には、それは、認識された文字に大きな不確定性が付随していることを示しているのであり、一方、出力信頼性指標値が非電に大きな値であった場合には、それは、その認識した文字のビットマツプが、たとえ多少は変化しているにしても、ニューラル・ネットワークに再学習を行なわせる許可を与えることが妥当であるといえる程には、変化していないことを示しているのである。この状態で、もし再学習を行なったとしても、ニューラル・ネットワークが提供する認識正確度の向上は、たとえ皆無では無いにせよ、目に見える程の向上は得られない可能性が高い。それゆえ、この方式でニューラル・ネットワークの学習用データの基礎データの全体を拡張して、動的に変化している入力文字であって、しかも尚、充分な出力信頼性を持って認識された入力文字を、その基礎データに包含するようにしており、これによって本発明のニューラル・ネットワークは、滑らかに、迅速に、且つ、正確にその応答を、変化している入力文字に適応させることができ、更にそれによって、従来公知の種々のニューラル・ネットワークにおいてこれまで行なわれていた動作と比べて、より力強い動作を提供できるようになっているのである。

以上に説明した本発明の方式の理解の上に立って、更に説明を続けると、ニューラル・ネットワーク４００は、出力信頼性指標値をリード４９０上へ発生してネットワーク後置プロセッサ１７０へ供給する。この出力信頼性指標値は、後に詳述するように、それをニューラル・ネットワークの中で使用して、パックプロパゲーションと、ニューロン重み及びニューロン・バイアス値の変更調節とを制御するものである。ネットワーク後置プロセッサ１７０は、この指標値に基づいて、入力書類のうちのある１ページの中の認識した文字のうち、その文字を認識したときに、その出力信頼性が低かった文字、即ち、ニューラル・ネットワーク４００を再度通過させる第２バスの実行によって、識別の結果が異なる可能性のある文字にフラグを付けておく。

ＯＣＲシステム１００に優れた認識正確度を発揮させるためには、既述の如く「２パス」動作を行なわせるようにすることが好ましい。しかしながら、多少は認識精度のレベルが低下することになっても（ただし、従来公知のニューラル・ネットワークの認識正確度と比較すれば、格段に優れたレベルへ低下するだけである）、システムの構成を簡明にして、そのコストを低減する方を望むならば、「２パス」動作の替わりに「１パス」動作を採用するようにしても良い。この場合、入力書類の各ページに対しては、ニューラル・ネットワーク４００を通過させる処理を１回だけ施すことになる。更に、そのようにしたニューラル・ネットワークは、各ページ上の実際の変化している入力文字のうち、認識したときの信頼性が充分に高かったものについて、適応性のある再学習を実行するものとなるが、ただし、そのニューラル・ネットワークは、当該ページ上の文字のうち、最初に誤認された文字を、再度識別し直す機会を持つことはできない。しかしながら、ニューラル・ネットワークの学習用データの基礎データの全体の拡張は行なわれ、実際の変化している入力文字がその基礎データに包含されるようになるため、この場合にも、同一の書類中の後続のページに記されている同じ文字を認識する際の正確度は、従来公知のニューラル・ネットワークを使用した場合に得られる正確度と比較して、格段に優れたものとなる。尚、「１パス」動作を行なわせるのであれば、図１に示したシステム１００から、フレーム記憶メモリ１３０とＩ１０スイッチ１４０とを省略することができ、その場合、文字ノーマライザ１２５の出力を直接、ニューラル・ネットワーク４００の入力へ供給するようにすれば良い。また、別の構成として、システムのオペレータが要求する認識正確度、或いは、このシステムの更に下流に接続する画像処理装置、及び／または、ワードプロセッサ等（不図示）が必要とする認識正確度の程度に応じて、「１パス」動作と「２パス」動作とのいずれか一方を、切り換えによって実行できるよう、このシステム１００を構成するようにしても良い。

本発明の教示を完全に、しかも容易に理解することができるように、以下の説明においては、先ず最初に、図２及び図３を参照して、ＯＣＲシステムに使用することのできる、従来公知の典型的なパックプロパゲーション方式のニューラル・ネットワークの動作について説明する。そしてその後に、図４に示した、本発明を用いてそのニューラル・ネットワークに加える変更部分について、説明することにする。

図２に示すブロック図は、ＯＣＲシステムに使用するための、パックプロパゲーションを利用したニューラル・ネットワーク２００であって、従来公知のニューラル・ネットワークのうちの、典型的な一例のニューラル・ネットワークを示したものである。図示の如く、ニューラル・ネットワーク２００は、複数の互いに同一のニューロンを３層の階層を成すように編成して構成してあり、それら階層は、ニューロン２２１．２２２、及び２２３を有する入力階層２２０、ニューロン２３１．２３２．２３３、及び２３４を有する中間階層２３０、それに、ニューロン２４１．２４２．２４３、及び２４４を有する出力階層２４０である。

これらニューロンの１つ１つは、図３に示す機能構成を有しており、この機能構成については後に詳述する。ＯＣＲという用途に使用するニューラル・ネットワークは、一般的に、これら複数の階層の各々に、比較的多数のニューロンを含んでおり、また、場合によっては、２層以上の中間階層を含んでいる。しかしながら、図を見易くするためと、以下の説明を理解し易くするためとに、図２に示したニューラル・ネットワーク２００も、また、図４に示したニューラル・ネットワーク４００も、３層の階層の各々に、少数のニューロンしか備えていないものを示しである。ニューラル・ネットワークの動作の方式は、そのニューラル・ネットワークの各階層に含まれているニューロンの個数にかかわらず、同じ方式である。

図２に示すように、各々のニューロンは、１つまたは複数の入力を備えているが、その出力は１つだけである。ただし、この出力は、上位の階層へ向けて分配することができ、従って、すぐ上位の階層の中の１つまたは複数のニューロンの入力とすることができる。ニューラル・ネットワーク２００への入力は、リード２１１．２１２、及び２１３を介して供給され、これら３本のリードをまとめて集合的に、入力２１０で表わしてあり、この入力２１０は、入力階層２２０の中に位１している入力ニューロンへの入力である。これらの入力用のリードの各々は、入力ビツトマツプ・バタンの中の個々のビクセルＰ１．Ｐ２．及びＰ３に対応したビットを、ネットワーク２００へ、より詳しくは入力ニューロン２２１．２２２、及び２２３の夫々へ供給している。具体的に、例えば２４個Ｘ１２個のビクセルのアレイの中に形成される正規化処理済文字の認識を行なうためには、図２に示した３個の入力ニューロンに替えて、２８８個の入力ニューロンを使用するようにすれば良い。入力階層２２０の中の各ニューロンの出力は、中間階層２３０の中の各ニューロンへその入力として供給され、そして更に、この中間階層２３０の中の各ニューロンの出力は、出力階層２４０の中の各ニューロンへ、その入力として供給される。階層２２０の中のニューロンから階層２３０の中のニューロンへの入力、並びに階層２３０の中のニューロンから階層２４０の中のニューロンへの入力に対しては、その各々に、係数Ｗによって重みを付与するようにしている。中間階層２３０の中のニューロンへの夫々の入力に付与する重みは、ニューロン重みｗｊｉで表わしてあり、また、それらニューロン重みをまとめて集合的に、重み２２５という引用符号で示しである。一方、出力階層２４０の中のニューロンへの夫々の入力に付与する重みは、ニューロン重みｗｋｊで表わしてあり、また、それらニューロン重みをまとめて集合的に、重み２３５という引用符号で示しである。更に図２に示した各々の重みに実際に付しである、２つの数字の添字は、その重みが関係している特定のニューロンのベアを明示したものである。即ち、２つのうちの先の添字は、そのニューロンのベアのうちの受取側のニューロンを、また後の添字は、送出側のニューロンを明示しており、その重みによって、それらニューロンの間のに存在する比例結合を定義される。ニューロンの各々が送出する出力値は連続値であり、この連続値はアナログ値であっても良く、或いは、好適実施例においてＤＳＰ回路によって実現しているように、マルチビットのディジタル値であっても良い。全ての出カニニーロンが発生する夫々の出力値をまとめて集合的にとらえたものが、このニューラル・ネットワーク２００の出力であり、図中には、出力ニューロン２４１．２４２．２４３、及び２４４の夫々から出力される各々の出力を、出力２８１．２８２．２８３、及び２８４で示しである。出力階層の中のニューロンの個数は、一般的には、ニューラル・ネットワークが識別して認識する必要のある文字の種類数に等しくするようにしている。そして、例えば、出力ニューロン２４１を文字「Ａ」に対応させ、出力ニューロン２４２を文字「ａ」に対応させ、出力ニューロン２４３を文字ｒＢＪに対応させ、出力ニューロン２４４を文字「ｂ」に対応させる、というようにする。機械印字した英数字を認識するためのＯＣＲという用途では、図２に示した４個の出力ニューロンに替えて、約５０個の出力ニューロンを使用するようにすれば良く、その各々の出力ニューロンを、識別して認識すべき、夫々異なった英数字記号（例えば文字、数字、ないしは句読点等）に対応させるようにする。中間階層の中の二ニーロンの個数を決定する要因の主なものは、認識させるためにニューラル・ネットワークへ供給する文字のビットマツプの複雑度、ニューラル・ネットワークの情報キャパシティとして望まれるキャパシティの大きさ、学習終了後にニューラル・ネットワークが獲得する未知のパタンを取扱う能力の程度、それに、後に説明するように、ニューラル・ネットワークに学習させる際にそのニューラル・ネットワークの全ての重みを適切に収束させるまでにそのニューラル・ネットワークに繰り返させることになる反復動作の回数である。

上述の英数字認識用のＯＣＲという用途では、中間階層２３０は、図２に示した４個の中間ニューロンに替えて、約７５個のニューロンを含んでいるようにすれば良い。

このニューラル・ネットワークの中の、任意の１つのニューロンａｋへの合計人力Ｉは、一般的には、そのニューロンへの重み付は入力値の合計に、更にそのニューロンのバイアス値θを加えた関数として算出することができ、これは、次の式（１）及び式（２）で示すとおりである。

出力ニューロンａｋに関しては、中間ニューロンａｊに関しては、一方、ニューロンの出力Ｏは、その人力１　（ａ）の関数であり、次の式（３）で与えられる。

０　（ａ）　＝ｆ　［Ｉ　（ａ）　］　（３）ここで関数ｆは、いわゆる、活動度関数であり、連続した閾値を与えるものである。この関数は、一般的にはシグモイド関数としてあり、即ち、Ｓ字形の単調増加関数であって、入力が正の無限大ないし負の無限大に近づくにつれて、夫々、一定の値に漸近し、一般的には、正の無限大の場合には「＋１」に漸近し、負の無限大の場合にはｒＱＪないし「 −１」に漸近するように定めである。このシグモイド関数と、個々のニューロン重み及びニューロン・バイアス値とによって、そのニューロンの全ての人力へ供給される全ての信号に対する、そのニューロンの応答、即ち「興奮度」が定まる。この活動度関数として使用する関数は、二ニーロン合計入力Ｉ　（ａ）の値を、入力値が負の無限大である場合の漸近値である「０」ないし「−１」と同じく正の無限大である場合の漸近値である「＋１」との間の連続した単調増加する値域の中へ写像する関数でありさえすれば、実際にはどのような関数であっても大差はない。これをシグモイド関数とした場合にはニューロンの出力、例えば０（ａｋ）は、次の式（４）で与えられる。

既述の如く、ニューラル・ネットワークの動作の種類として、一般的に、２種類の処理手順があり、それらを、続けて、相前後して実行するようにしている。

先に実行する処理手順は、初期化を行なった上で、既知の出力を持った、予め定めである既知の文字のビットマツプ・パタンに関する、学習を行なうというものであり、それに続いて実行する処理手順は、実際の未知の入力文字ビットマツプのパタンを認識するという処理手順である。

先ず、ニューラル・ネットワーク２００を初期化するには、このニューラル・ネットワーク２００の中にある全てのニューロンの、重みとバイアス値とを、ランダム値にセットする。このランダム値は一般的に、ある一定の範囲内の値とするようにしており、具体的には、例えば「±０．５」の範囲内の値としている。

続いて、ニューラル・ネットワーク２００に学習をさせる。更に詳しく説明すると、どの文字に対応したものであるかが判っている、予め定めである既知の複数の入力ビツトマツプ、即ち、いわゆる学習用パタンを、ニューラル・ネットワーク２００へ連続して次々と供給する。そして、それら学習用パタンの各々について、ニューラル・ネットワーク２００の中の全ての重みＷと全てのバイアス値θ とを変更調節して、その学習用パタンに含まれている各々のビットマツプに関して、ニューラル・ネットワークの出力が、そのビットマツプのパタンに対応したニューラル・ネットワーク出力目標値に、略々一致した出力値を発生するようにする。こうして学習が終了したならば、全ての重みとバイアス値とを、その現在値に固定する。以上が済んだならば、このニューラル・ネットワークを使用して未知の入力文字パタンの認識作業を行なうことができる。バタン認識作業の実行中は、複数の未知のビットマツプを、連続して次々と、ニューラル・ネットワーク２００の複数の入力２１０へ並列的に供給し、それによって得られる、それらビットマツプに対応したニューラル・ネットワーク応答を、出力階層２４０の中の出力ノード（出力ニューロン）から受け取るようにする。理想を言うならば、ニューラル・ネットワーク２００が、ある未知の入力ビツトマツプを認識した結果、その入力ビツトマツプが、このニューラル・ネットワークがその文字について学習したところの所与の文字であることが判ったときには、出力階層２４０の中にあって当該文字に対応させであるニューロンの発生する出力値が、出力階層２４０の中のその地金てのニューロンが発生する出力値と比べて、際立って大きな値となっているべきである。

バックプロパゲーションを行なうには、予め定めである学習用入力バタン（入力ベクトル）をニューラル・ネットワークへ供給し、その入力ベクトルを、ニューラル・ネットワークの中を順方向へ伝搬させて、その入力ベクトルに対応した出力バタン（出力ベクトル０）を、出力ニューロンに出力させる。そして、この動作に付随して生じた誤差の大きさを判定し、その判定した大きさの誤差を、ニューラル・ネットワークの中を逆向きに伝搬（バックプロパゲーション）させることによって、その誤差を、ニューラル・ネットワークの中の個々のニューロンへ配分する。続いて、各々のニューロンの重みとバイアス値とを変更調節し、この変更調節の方向及び量は、その学習用人カバタンに関する、ニューラル・ネットワークの全体誤差を最小にする方向及び量とする。そして更に、以上の手順を、続（次の学習用パタンに関しても反復して実行し、以下同様に、更にその他の学習用パタンに関しても反復して実行する。

更に詳しく説明すると、所与の学習用入力バタンに関する、ニューラル・ネットワークの中の各々のニューロンの誤差の大きさを判定するようにし、この判定には、いわゆる「一般化デルタルール」を用いる。一般化デルタルールにおいては、所与の学習用人カバタンｐに関して、その任意のニューロン重み（例えば重みｗｋｊ）を原因とする誤差の大きさは、ニューラル・ネットワークの誤差の二乗和（即ち、全てのニューロンによって発生される誤差Ｅｐ）の、偏導関数に比例するものとなっている。これは次のとおりである。

先ず、入力バタンｐに関する、ニューラル・ネットワーク全体誤差Ｅは、次の式％式％この式において、ｔｋは、第にニューロンの出力目標値である。この場合、任意の重み（例えば重みｗｋｊ）に関係したネットワーク誤差の大きさは、その重みの変化に対するニューラル・ネットワーク全体誤差Ｅｐの偏導関数、即ち、ａＥｐ／ａｗｋｊ　で与えられる。このことから、各々の出力ニューロンａｋそのものに関する誤差の大きさδには、その出力ニューロンａｋにおける、実際の出力値Ｏｋと、出力目標値ｔｋと、それらの間の差分の値との関数としてめることができ、これは次のとおりである。

δに＝ｏｋ　（１−Ｏｋ）（ｔｋ−Ｏｋ）　（６）また、任意の中間ニューロンに関する誤差の大きさは、次のとおりである。

これらの、式（６）に示した各々の出カニニーロンの誤差の大きさと、式（７）に示した各々の中間ニューロンの誤差の大きさとを、バックプロパゲーション誤差決定部２６０に算出させる。そして、この誤差の算出を、ニューラル・ネットワークの中を逆向きに進めて行き、即ち、誤差を次々と低位の階層へ伝搬させて行き、最終的には入力階層まで伝搬させる。またバックプロパゲーション誤差決定部２６０へは、それらニューロン誤差の値を算出させるために、リード２５０を介して現在出力ベクトルを供給し、リード２６７を介してニューロン重み並びにニューロン・バイアス値の夫々の現在値（ｗｋｊ（ｎｌ　、　ｗｊｉｆｎ）　、及びθｊ　（ｎｌ　）を供給し、そして、リード２６３を介して出力ニューロンの出力目標値（ｔｋ　）を供給している。尚、重みの値として、大きな値が発生されるのを防止するために、個々の出力ニューロンの各々の出力目標値は、適音、ｒｏ、ＩＪか、或いはｒＯ，９Ｊに設定するようにしている。

バックプロパゲーション誤差決定部２６０は、夫々のニューロン誤差の値を算出したならば、それら算出したニューロン誤差の値を、リード２６５を介して、ニューロン重み／バイアス値決定部２７０へ出力する。そして、全てのニューロン誤差の値が算出されたならば、ニューロン重み／バイアス値決定部２７０は、全ての階層における、ニューロン重み及びニューロン−バイアス値の、その各々の現在値に加える必要のある、変更量（即ち調節量）を決定する。その際に、ニューロン重み／バイアス値決定部２７０は、全体誤差の部分のうちの、最大最の大きさの幾つかの部分を、ニューラル・ネットワークの全体誤差の発生に、多（荷担している重み及びバイアス値に割当てる。この手順は反復実行するものであるが、その第（ｎ＋１）回目の反復実行である、現在実行に関する、重み及びバイアス値の変更量は、以上のようにして算出したニューロン誤差に基づいて、次の式に従って決定するようにしている。

先ず、出力ニューロンａｋの各々については、Δｗｋｊ　ｆｎ＋１）　＝　７７　δｊ　Ｏｋ　＋ａΔｗｋｊ（ｎｌ　（８）Δθｊ（ｎ＋ｌｌ　＝ηδｊ＋αΔ θｊ　［ｎｌ　（９）また、中間ニューロンａｊの各々については、Δｗｊｉ　（ｎ＋１１　＝　ｎδｊｏｋ＋ａΔｗｊｉ（ｎ）　（１０）Δθｉ（ｎ＋１１　＝ηδｉ＋αΔθ１ｆｎｌ　（１１）係数ｎは、ニューラル・ネットワークの学習速度を表わすものである。即ち、この係数ηは、ニューラル・ネットワークの学習動作の実行中に、ニューラル・ネットワークの重みとバイアス値とが、どれ程遠やかに収束するかを定めるものである。この係数の値が大き過ぎると、重み及びバイアス値はその適正値を超えてオーバーシュートするようになり、それによって収束が妨げられるようになる。

また、係数αは、運動量の項に似た性質を持つものであり、重みの値の急激な変化の影響を緩和しく周波数の高い変動をフィルタ除去する性質を持つ）、またそれと共に、ニューラル・ネットワークが、重み空間における誤差曲面の表面に沿って、絶対的な最短距離ではないものの、局部的な最短距離を通って変化して行けるようにするものである。また、これら係数の値は、経験的に定められるものである。こうして重み及びバイアス値の変更量の算出を完了したならば、ニューロン重み／バイアス値決定ｆｆ１２７０は、算出したそれら変更量を、夫々、リード２７２とリード２７４とを介して、ニューラル・ネットワークの中の個々のニューロンの全てへ供給し、その変更量に従ってニューロン重み及びニューロン・バイアス値を更新させる。目標出力ベクトルと実出力ベクトルとの間の誤差に基づいて、ニューラル・ネットワークの重みとバイアス値とを、反復して調節するようにしたこの処理手順は、上記式（５）に示した、このニューラル・ネットワーク２００の二乗和誤差を、効果的に減少させて行くことのできる、最急降下法を構成するものである。ニューラル・ネットワークにおけるパックプロパゲーションの、更に詳しい説明については、Ｄ−Ｊ・バー著「ニューラル・ネットワーク方式の数字認識装置Ｊ　（Ｄ、　Ｊ、　Ｂｕｒｒ、　”Ａ　Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋ　Ｄｉｇｉｔ　Ｒｅｃｏｇｎｉｚｅｒ”。

Ｐｒｏｃｅｅｄｉｎ　ｓ　ｏｆ　ｔｈｅ　１９８６　ＩＥＥＥ　Ｔｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏｎｆｅｒｅｎｃｅ　ｏｆ　Ｓ　ｓｔｅ＋≠刀@Ｍａｎａｎｄ　Ｃｂｅｒｎｅｔｉｃｓ　Ａｔｒａｎｔａ、　Ｇｅｏｒ　ｉａ、　ｐａｇｅｓ　１６２１−１６２５　）や、Ｄ−Ｅ−ラメルハートらによる「誤差伝搬法による内部表示の学習」の第８章（Ｃｈａｐｔｅｒ８、　”Ｌｅａｒｎｉｎｇ　Ｉｎｔｅｒｎａｌ　Ｒｅｐｒｅｓｅｎｔａｔｉｏｎｓ　ｂｙ　Ｅｒｒｏｒ　Ｐｒｏｐａｇａｔｉｏｎ″ｏｆ　ＤA　Ｅ。

Ｒｕｍｅｌｈａｒｔ　ｅｔ　ａｌ、ハｒａｌｌｅｌユ１ｓｔｒｉｂｕｔｅｄ　Ｐｒｏｃｅｓｓｉｎ　、　（ｃｏｐｙｒｉｇｈｔ／１９８６：@ＭＩＴＰｒｅｓｓ；　Ｃａ＋ｎｂｒｉｄｇｅ、　Ｍａｓｓａｃｈｕｓｅｔｔｓｌ）の特に第３２２頁〜第３３０頁を参照されたい。更に、ニューロン並びにネットワーク２００等のニューラル・ネットワークの基礎を成す数学については、Ｎ−Ｊ・エルシン著［学習機械の数学的基礎Ｊ　（Ｎ、　Ｊ、　Ｎｉ１ｓｓｏｎ、　Ｔｈｅハ肋：鮎且ゴ」回悪■山凹し虻±胆ユ扛り胆±訪朋（ｃｏｐｙｒｉｇｈｔ／１９９０：　Ｍｏｒｇａｎ　Ｋａｕｆｍａｎｎ　Ｐｕｂｌｉｓｈｅｒｓ；　Ｓａｎ　Ｍａｔｅｏ、　にａｌｉｆｏｒ獅奄≠戟@）の、特に、その第２．６童「スレショルド・ロジック・ユニット（ＴＬＵ）Ｊ（Ｔｈｅ　Ｔｈｒｅｓｈｏｌｄ　Ｌｏｇｉｃ　Ｕｎｉｔ　［ＴＬＵｌ″ｏｎ　ｐａｇｅｓ　２１−２３　）　、それに第６章「階層機械」　（Ｌａｙｅｒｅｄ　Ｍａｃｈｉｎｅｓ’　ｏｎ　ｐａｇｅｓ　９５−１１４）を参照されたい。

１つの学習用文字ビットマツプに関して、ニューラル・ネットワークの全ての重みの調節が終了したならば、続く次の学習用文字ビットマツプをニューラル・ネットワークへ供給し、そして誤差の決定及び重みの調節のプロセスを反復して実行し、そして更に、一連の複数の学習用ビットマツプの各々について、その反復プロセスを繰り返して実行して行（。一般的には、それら複数の学習用バタンの各々に関して、ニューラル・ネットワーク全体誤差が、予め定めた限界値に到達したならば、その学習用パタンに関する反復実行を中止して、学習を停止させる。この時点で、ニューラル・ネットワーク２００の、全ての重み及びバイアス値を、そのときの現在値に固定する。これ以降は、このニューラル・ネットワーク２００を使用して、未知の入力データを対象とした文字認識作業を、比較的高速で実行することができる。

図３に示したハイレベルのブロック図は、ニューラル・ネットワーク２００に使用した（また、本発明に係るニューラル・ネットワーク４００にも使用した）一般的な構成の、ニューロン３００を示したブロック図である。既述の如（、各々のニューロンは、そのニューロンの複数の重み付は人力の合計値とバイアス値との和に対する、関数を発生するものであり、より具体的には、その和に対して、一定の領域に制限された閾値を、関数として発生するものである。図３に詳しく図示したように、ニューロン３００へは、複数の個々の入力値ＩＮＩ、ＩＮ２、ＩＮ３　、、、、、ＩＮｎから成る入力３１０が供給される。これら入力値は、それらの夫々に割当てられた個々のリード３１０１．３１０２．３１０３１、、、．３１０ｎを介して、それらの夫々に対応した乗算器３３０１．３３０２．３３０３、、、、．３３０ｎへ入力しており、それら乗算器をまとめて集合的に乗算器３３０として表わしている。これらの乗算器は、それらの入力値に、その乗算器に付与しである重みｗｌ　、ｗ２　、ｗ３　、、、、、ｗｎを乗じる乗算を行ない、そしてそれらの乗算によって得られた夫々の積（即ち重み付は値）を、リード３４０を介して加算器３５０の夫々の入力へ供給している。加算器３５０は、それら重み付は値の全てを、リード３５５を介して供給されているバイアス値θに加え合せて１つの和の値を形成する。続いて、この和の値を、リード３６０を介して、閾値要素３７０へ供給する。閾値要素３７０は、予め定めである所定の連続漸近関数（一般的にはシグモイド関数であり、また、シグモイド関数とするのが好ましい）としての機能を果たすものであり、この関数は、その入力を、その入力に対応した、例えば「＋ｌ」から「０」までの間の、出力値へ写像するものである。この閾値要素３７０の出力Ｏは、リード３７５を介して、ニューロン３００の出力として送出される。尚、本発明の好適実施例においては、各ニューロンは、ＤＳＰ回路の中で実行するソフトウェアによって構成するようにしているが、しかしながら、それらニューロンの各々を、アナログ回路ないしディジタル回路によって構成するようにしても良い。更に、それら複数のニューロンによって形成されるニューラル・ネットワークの全体を、特別製のディジタル回路（例えば、然るべき複数の能動要素と接続マトリクスとを組み込んだ、適当な特定用途集積回路（ＡＳＩＣ）や、特注の超大規模集積回路（ＶＬＳＩ）等）によって構成するようにしても良い。また、ニューロン３００と同様の機能特性を備えた複数のニューロンを含んでいる、ニューラル・ネットワークを構成するための、更にその他の幾つかの構成方式（例えば光学的構成方式等）が、Ｒ−Ｋ・ミラー著「ニューラル・ネットワーク」の、第４ｔ［ニューラル・ネットワークの構成方式Ｊ　（Ｃｈａｐｔｅｒ　４″Ｉｍｐｌｅｍｅｎｔａｔｉｏｎ　ｏｆ　Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋ″、　ｐａｇｅｓ　４−１　煤B ４−２６　ｉｎ　Ｒ，Ｋ、　Ｍｉｌｌｅｒ、　Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋｓ　（ｃｏｐｙｒｉｇｈｔ／１９８９：　Ｆａｉｎａｏｎｔ　oｒｅｓｓ；Ｌｉ１ｂｕｒｎ、　Ｇｅｏｒｇｉａｌ　）に説明されテイル。

従来公知の典型的なニューラル・ネットワークの１つであるニューラル・ネットワーク２００の機能、並びに、このニューラル・ネットワークの中で使用している各ニューロンの機能についての、以上の理解の上に立って、以下に、本発明のニューラル・ネットワーク４００について、詳細に説明して行くことにする。

尚、このニューラル・ネットワーク４００を構成している構成要素は、その多くが、ニューラル・ネットワーク２００の中の構成要素と同一のものであるため、以下の説明では、これら２つのニューラル・ネットワークの間の相違点についてのみ、詳細に論じることにする。

図４は、本発明の一実施例に係るニューラル・ネットワーク４００の、ハイレベルのブロック図である。このニューラル・ネットワーク４００は、上述のニューラル・ネットワーク２００に含まれていた構成要素に加えて、更に、信頼性測定／バックプロパゲーション制御部４１０を含んでいる。この信頼性測定／バックプロパゲーション制御部４１０は、ネットワーク人力２１０へ供給される入力ビツトマツプ文字の各々についてニューラル・ネットワーク４００が発生する出力値のベクトルに基づいて、そのベクトルに付随する出力信頼性指標値を算出するものである。また、この出力信頼性指標値は、そのベクトルに含まれている複数の出力値のうちの、最大の出力値と２番目に大きな出力値との間の比の値として算出される。こうして算出したこの指標値に対しては、続いて、閾値処理を施し、その処理の結果を、制御信号として、リード４５０を介してパックプロパゲーション誤差決定部２６０へ供給する。この制御信号による制御は、入力文字認識作業中に、バックプロパゲーション並びにニューロン重み及びニューロン・バイアス値の調節を実行させる（即ち、ニューラル・ネットワークに、認識作業を実行中の現在入力文字の実際のビットマツプに適合させるための、再学習をさせる）か、或いは、それらの動作の実行を禁止して、その再学習をさせないようにするかの、いずれかとするための制御である。

ニューラル・ネットワーク４００が、ある入力文字を、充分に高い信頼性をもって認識したときには、その出力ベクトルの中に顕著なピーク（例えばその値がｒｏ、８Ｊ以上のピーク）が存在しているはずであり、しかも、その顕著なピークは、ただ１つの出力ニューロンにのみ付随しているはずである。また、その他の出力ニューロンが発生している出力値は、比較的小さな値（例えばｒｏ、３Ｊ以下）−にとどまっているはずである。例えば、図４に示したニューラル・ネットワーク４００における、出力信頼性の高い出力ベクトルの具体的な一例を示すならば、　（０，３，０，２，０，８，０，２）というベクトルを挙げることができる。出力ベクトルがこの値であれば、ニューラル・ネットワーク４００は、高い信頼性を持って、入力ビツトマツプが文字ｒＢＪであると、認識しているのである。また、出力ベクトルがこの値であれば、その信頼性指標値は比較的大きな値となり、具体的には、０．８１０．３、即ち約２．６７になる。また、以上とは逆に、ニューラル・ネットワーク４００が、その発生している出力に自信を持っていない場合には、その出力ベクトルの中の最大出力値の近傍に、複数のニューロン出力値から成る団塊（クラスタ）が生じる。図４に示したニューラル・ネットワーク４００における、信頼性の低い出力ベクトルの具体的な一例を示すならば、（ｏ、４．０．７６．０．８．０．６）というベクトルを挙げることができる。この出力ベクトルの信頼性指標値は、比較的小さく、０．８１０．７６、即ち約１．０５である。

信頼性測定／バックプロパゲーション制御部４１０は、出力セレクタ４２０、レシオ値算出器４３０、及び閾値処理部４４０を含んでいる。このうち出力セレクタ４２０は、ニューラル・ネットワーク４００が発生した出力ベクトルをり一ド２５０を介して受け取り、そして受け取ったその出力ベクトルの中から、最大の出力値と、２番目に大きい出力値とを選択する。続いて、選択したそれらの値（ｎｌ　、　ｎ２　）を、リード４２５を介してレシオ値算出器４３０へ送出する。レシオ値算出器４３０は、それらの値の間のレシオ値（ｎｌ／ｎ２）を算出し、そして算出したそのレシオ値を、リード４３５を介して、閾値処理部４４０の入力へ供給する。閾値処理部４４０は、受は取ったそのレシオ値、即ち指標値を、リード４３７を介して供給されている予め定められた複数の所定の限界値（これら限界値は幾つかの信頼性領域に対応したものであり、この点については後に図５に関連して詳述する）との間で比較し、それによって、ニューラル・ネットワーク４００が、その入力として供給された現在文字（記号）を充分な出力信頼性をもって認識したのか否かを判定する。即ち、そのレシオ値である指標値が、ある所定領域の中にあった場合に、閾値処理部４４０は、リード４５０上にハイレベルの信号を送出することによって、バックプロパゲーション誤差決定部２６０に命令を発し、このパックプロパゲーション誤差決定部２６０に、ニューロン誤差を算出させ、そして更に、その算出したニューロン誤差に従ってニューロン重みとニューロン・バイアス値とを然るべ（調節させる。この場合の所定領域とは、出力信頼性の値が大きい高信頼性領域の境界を定めた限界値と、信頼性の値が小さい低信頼性領域の境界を定めた限界値との間に位置する領域である。また、ここで、認識して得た出力文字に関するニューロン誤差の値を算出するためには、上掲の式（６）及び式（７）に示したように目標値を使用せねばならないが、ここで使用する目標値には、以前（即ち、初期化並びに学習の処理手順を実行したときに）、ニューラル・ネットワークに当該出力文字を認識させるための初期学習を行なわせたときに使用した特定の目標ベクトルの中にあった目標値を用いるようにする。また、そのために、初期化並びに学習の処理手順の実行中に、ニューラル・ネットワークの初期学習を行なわせた文字の全てに対応した、その目標値の全てを、パックプロパゲーション誤差決定部２６０に記憶させておくようにしている。以上ようにしたならば、ニューラル・ネットワークの初期学習の実行中（即ち、初期化並びにネットワーク学習の処理手順の実行中）に所定のビットマツプを使用してニューラル・ネットワークの学習を実行したようにして、ただし、所定のビットマツプの代わりに実際の入力ビツトマツプを使用して、その実際の入力文字の認識作業の実行中にニューラル・ネットワークの再学習を行なうことにより、ニューラル・ネットワークに供給される実際の入力文字の変化に対して、このニューラル・ネットワークの応答を、滑らかに且つ正確に、適応させることができる。

ある文字を認識したときに、その文字認識の信頼性指標値が、高信頼性領域の中に位置する値であった場合には、その文字に関してはニューラル・ネットワークに再学習をさせる必要はなく、なぜならば、その文字のビットマツプは、見てそれと判る程には変化しておらず、従って、再学習を実行することによって結果的に得られるニューラル・ネットワークの応答の改善は、たとえ皆無ではないにしても、微々たるものでしかないからである。それゆλ、ｒｊＪ値処理部４４０は、実際にある入力文字を認識したときに、その文字認識の信頼性が充分に高かったならば、リード４５０上にローし・ベルの信号を送出することによって、バックプロパゲーション並びにニューロン重み及びニューロン・バイアス値の調節を禁止する。一方、これとは正反対に、ニューラル・ネットワークがある入力文字を認識したときに、その文字認識の信頼性指標値が小さな値であった場合、即ち、その指標値が低信頼性領域の中の値であった場合にも、この閾値処理部４４０ば、同様にリード４５０上にローレベルの値を送出することによって、再学習を禁止する。この場合には、出力文字は、かなり大きな不確定性を持っているため、ニューラル・ネットワークに再学習をさせるべきではなく、もし再学習をさせたならば、ニューラル・ネットワークの動作が良（ない方向へ偏向してしまい、それによって認識正確度が悪化してしまう可能性が高い。また、このように出力信頼性指標値が低信頼性領域の中に位置する値であった場合には、閾値処理部４４０は更にリード４９０上へ、「低信頼性フラグ」としてハイレベルを送出する。こうしてハイレベルが送出されると、ネットワーク後置プロセッサ１７０（図１参照）がそれに応答して、そのときニューラル・ネットワーク４００が発生してこのネットワーク後置プロセッサ１７０へ供給している出力文字に、マークを付ける（即ちフラグを付ける）。このマークは、その出力文字が低い信頼性をもって認識された文字であり、従って、誤認された文字である可能性があり、また、ニューラル・ネットワークの中を再度通過させる第２パスにおいては、異なった識別をされるかも知れない文字であることを表わすマークである。

本発明のこの独特の教示に従って、ニューラル・ネットワーク４００の学習の対象を、実際の入力文字データのうちで、その文字データを認識したときの出力信頼性が、高過ぎることのないあるレベルにあった入力文字データのみに限るようにすれば、それによって、ある特定の場合にのみ、このニューラル・ネットワークの再学習が実行されるようにすることができる。この特定の場合とは、入力文字のビットマツプがかなり変化しているが、ただしその変化は、その変化にもかかわらず、ニューラル・ネットワークが、その入力文字を正しく認識した可能性が高いと推定される程度の変化であるという場合である。ニューラル・ネットワークに再学習を実行させるときの条件を、このように制限することによって、認識の正確度を実際に向上させることのできる可能性を高めているのである。このように、認識の正確度が向上する可能性が高いのは、具体的には、例えば次のような入力文字を処理している場合である。即ち、その入力文字とは、第１回目の認識作業においては誤認された可能性があるが、ニューラル・ネットワークに再学習させた後に、その入力文字を再度ニューラル・ネットワークの入力に供給すれば、その入力文字が第１回目とは異なって正しく識別し直される可能性があるという入力文字である。尚、ここで、［その入力文字を再度供給する」というのは、例えば、入力書類の現在ページを、ニューラル・ネットワークの中を再度通過させる第２バスを実行するために、再びニューラル・ネットワークへ供給する場合も、また、同一の文字を含んでいる後続の入力ページを、初めてそのニューラル・ネットワークへ供給する場合も含まれる。

以上の理解の上に立って図５について説明すると、同図は、出力信頼性指標値の複数の領域と、本発明のニューラル・ネットワークが、それら領域の中に位置する出力信頼性指標値に応答して実行する動作とを図解して示したものである。

図示の如く、出力信頼性指標値の領域として、３つの領域を設定しである。それらのうち、低出力信頼性領域５１０は、出力信頼性指標値の所定の限界値Ｃ１によってその上限を定めてあり、中間出力信頼性領域５２０は、出力信頼性指標値の所定の限界値Ｃ１と０２とによってその境界を定めてあり、更に、高出力信頼性領域５３０は、出力信頼性指標値の所定の限界値Ｃ２によってその下限を定めである。ただし、これらの限界値は厳密なものではなく、ニューラル・ネットワークに供給される入力データの変化に対して、ニューラル・ネットワークが滑らかに且つ正確に適応することができるように、経験的に設定した値である。実際の出力信頼性指標値Ｃが、低出力信頼性領域５１０の中に位置していた場合には（即ち、Ｃ＜ＣＩ　）、本発明のニューラル・ネットワークは、そのとき認識した文字を、そのままこのニューラル−ネットワークの出力として送出すると共に、「低信頼性フラグ」として、ハイレベルを送出する。更にこの場合には、その認識した文字には、かなりの不確定性が付随しているため、ニューラル・ネットワークは、この文字についての再学習を実行しないようにする。一方、以上とは異なって、実際の出力信頼性指標値Ｃが、中間出力信頼性領域５２０の中に位置していた場合（即ち、ＣＩ≦Ｃ＜Ｃ２）、或いは、高出力信頼性領域５３０の中に位置していた場合（即ち、Ｃ≧Ｃ２）にも、本発明のニューラル・ネットワークは、そのとき認識した文字を、そのままこのニューラル・ネットワークの出力として送出する。ただしこの場合には、その出力文字は充分な出力信頼性をもって認識されたのであるから、ニューラル・ネットワークは、「低信頼性フラグ」のリードへはローレベルを送出する。更に加えて、その出力信頼性指標値が、中間出力信頼性領域５２０の中に位置していた場合には、本発明のニューラル・ネットワークは、その認識した文字、即ち現在認識文字について再学習を実行する。

即ち、もし出力信頼性指標値が、中間出力信頼性領域５２０の中に位置していたのであれば、そのとき認識した文字のビットマツプは、ある程度は変化しているにもかかわらず、なおかつ、その現在入力文字は、充分な信頼性をもって認識されたものであると推定される。それゆえ、その入力文字の実際のビットマツプを用いて再学習を実行させれば、ニューラル・ネットワークの動作がこの入力データの変化（即ち入力文字の変化）に適応するにつれて、その結果として、ニューラル・ネットワークが提供する認識正確度が向上する可能性が高いのである。この認識正確度の向上によって、初めて入力したときには誤認した疑いのある入力文字を、再度入力したときには正しく識別し直せるようになる。一方、実際の出力信頼性指標値が、高出力信頼性領域５３０の中に位置していた場合には、本発明のニューラル・ネットワークは、そのときの現在認識文字に対する再学習を、実行しないようにしている。そのようにしているのは、実際の出力信頼性指標値が高出力信頼性領域５３０の中に位置していた場合には、（ａ）そのときの入力文字のビットマツプが、ニューラル・ネットワークの再学習を正当化し得る程度に変化しており、且つ、ｆｂ）その再学習の結果、ニューラル・ネットワークの認識正確度が目に見えて向上する、という可能性は非常に低いからである。

図６Ａ〜図６Ｄは、それらをつなぎ合せた図によって、「複パス文字認識及びパックプロパゲーション制御ルーチン」６００の、ハイレベルなフローチャートを示すものである。図示のルーチンは、本発明の文字認識方法をソフトウェアで実現したものであり、また２図４に示した、本発明のニューラル・ネットワークの、ソフトウェア構成による実施例を採用したものである。尚、図６Ａ〜図６Ｄを描いた図面どうしの正しいつなぎ合せ方を、図６に示しである。

ルーチン６００の中では、先ず最初に、ブロック６０３とブロック６０６とを含んでいる「初期化及び学習処理手順」を実行し、続いてブロック６１２〜ブロツク６９０から成る「認識処理手順」を実行する。「初期化及び学習処理手順」では、ニューラル・ネットワークを初期化した後に、そのニューラル・ネットワークに学習させるようにし、この学習は、既知の所定の文字ビットマツプから成り、しかもその出力も既知の、複数の学習用バタンを用いて実行する。また「認識処理手順Ｊにおいては、実際の、未知の入力文字のビットマツプ・パタンに対する認識作業を実行する。

ルーチン６００へ入ったならば、先ず、処理の実行は「初期化及び学習処理手順」へ進み、特にその中のブロック６０３へ進む。ブロック６０３では、ニューラル・ネットワークを初期化し、この初期化は、全てのニューロン重み及びニューロン・バイアス値を、それらに対応した所定の固定した限界値によって定めである範囲内の、ランダム値に設定することによって行なう。この範囲を定めている限界値は、具体的には、例えば「±０．５」等の値であるが、ただしこの値は重要なものではない。この後、ブロック６０６を実行して、ネットワークに学習を行なわせる。この学習は、既述の如（、複数の学習用バタンを次々と使用し、それら学習用バタンに関してパックプロパゲーション並びに重み及びバイアス値の調節を行なうという方法で実行するものであり、それら複数の学習用バタンは既知の、所定の文字のビットマツプのバタンであって、それらによって発生する出力も既知のものである。この学習が完了した時点で、「初期化及び学習処理手順」は終了する。続いて処理の実行は「認識処理手順」へ進み、特にその中のブロック６１２へ進む。

ブロック６１２では、フロントエンド・プロセッサ１１０（図１参照）へ命令を発して、このフロントエンド・プロセッサ１１０に、認識処理すべき実際の未知の入力ビツトマツプ文字データの先頭のページにアクセスするための経路を、Ｉ１０スイッチ１４０の中に確立させる。この経路を確立させたならば、処理の実行は、図６Ａ〜図６Ｄに示すようにブロック６１５へ進む。ブロック６１５では、変数ＰＡＳＳを「１」にセットする。このようにセットすることによって、現在ページの処理が、ニューラル・ネットワークを初めて通過させる第１バスによって行なわれていることを、明示するのである。この変数のセットが完了したならば、続いてブロック６１８を実行する。このブロック６１８では、現在ページの中の先頭の文字のビットマツプの読取りを行なう。続いて、処理の実行はブロック６２１へ進み、このブロック６２１では、上で読み取ったビットマツプの中の個々のビットの値をニューラル・ネットワーク４００（図１及び図４参照）の該当する入力ニューロンへ供給する。続いて、図６Ａ〜図６Ｄに示すように、ブロック６２４を実行して、そのビットマツプの中のこれらビットの値を、ニューラル・ネットワークの中を順方向へ伝搬させ、この伝搬は、ニューラル・ネットワークの中の各々のニューロンの出力を算出して行くことによって行なう。ニューラル・ネットワークの中の出力ニューロンの出力値を算出し終わったならば、そのとき、そのビットマツプは、ニューラル・ネットワークの中を最後まで伝搬完了したことになり、続いて処理の実行はブロック６２７へ進む。このブロック６２７では、その時点で全ての出力ニューロンが発生しており、また出力ベクトルとして送出されている出力値の中から、最大の出力値と２番目に大きな出力値と（ｎｌ　、　ｎ２　）を選出する。これらの値を選出したならば、ブロック６３０を実行して、これら２つの値の間の比の値を算出する。こうして算出した比の値が、このニューラル・ネットワークが現在、認識作業を行なっている文字の、実際の出力信頼性指標値Ｃである。

こうして実際の信頼性指標値を算出したならば、処理の実行はブロック６３０から判断ブロック６３３へ進む。この判断ブロック６３３では、上で算出した実際の信頼性指標値を、高出力信頼性領域の下限を定める限界値Ｃ２と比較する。

そして、実際の信頼性指標値が、この限界値０２以上の大きさの値であったならば、処理の実行は、この判断ブロック６３３から出ているＹＥＳ経路を通って、ブロック６４０へ進む。ブロック６４０では、認識されている文字を、ニューラル・ネットワークの出力として送出する。また更に、もしその認識されている文字に、以前低い信頼性をもって認識された文字であることを示すマークが付されていたならば、そのマークを除去する。この後、処理の実行はブロック６４３へ進む。ブロック６４３では、ニューラル・ネットワークが、パックプロパゲーション並びにニューロン重み及びニニーロンバイアス値の変更調節の処理を実行しないように、それらの処理を禁止し、この点については既に充分に説明したとおりである。即ち、この場合、実際の出力信頼性が充分に高いため、たとえ現在認識文字についてニューラル・ネットワークの再学習を実行したとしても、その結果書られるニューラル・ネットワークの認識正確度の向上は、皆無ではないにしても、殆ど目に見える程のものとはならないからである。この後、処理の実行は経路６４５及び経路６５８を介してブロック６６７へ進み、このブロック６６７については後に説明する。一方、前述の判断ブロック６３３において、実際の信頼性指標値が、限界値Ｃ２より小さな値であった場合には、処理の実行は、この判断ブロック６３３から出ているＮｏ経路を通って判断ブロック６４７へ進む。

判断ブロック６４７では、実際の信頼性指標値を、中間出力信頼性領域の限界値である限界値Ｃ２並びに限界値Ｃ１と比較する。この比較によって、実際の信頼性指標値が、中間出力信頼性領域の中の値であることが判明した場合には、処理の実行は、この判断ブロック６４７から出ているＹＥＳ経路を通って、ブロック６５０へ進む。ブロック６５０では、認識されている文字を、ニューラル・ネットワークの出力として送出する。また更に、もしその認識されている文字に、以前低い出力信頼性をもって認識された文字であることを示すマークが付されていたならば、そのマークを除去する。このブロック６５０における処理を全て完了したならば、処理の実行はブロック６５３へ進む。ブロック６５３では、パックプロパゲーションの処理を起動することによって、既に充分に説明したように、ニューラル・ネットワークに、このニューラル・ネットワークの中の各々のニューロンにおける誤差の大きさを算出させる。尚、ここでニューロン誤差の大きさを算出する際に使用するビットマツプは、ニューラル・ネットワークの初期学習の際に使用した、その文字に対応した所定のビットマツプではなく、ニューラル −ネットワークへ現在供給されている入力文字のビットマツプである。また、このニューロン誤差の大きさの算出には、更に目標ベクトルを使用するが、使用するその目標ベクトルは、「初期化及び学習処理手順」において使用した、予め定めた所定の目標ベクトルのうちの、ニューラル・ネットワークが現在認識している出力文字に対応した目標ベクトルである。ニューロン誤差の全てを算出完了したならば、このブロック６５３において更に、既述の如く全てのニューロン重み及びニューロン・バイアス値の新たな値を算出し、そして、その算出した値に従って、ニューロン重み及びニューロン・バイアス値の、全ての値を調節する。このブロック６５３の処理を、全て実行完了した時点で、このニューラル・ネットワークにそのとき供給されている実際の未知の文字の認識結果を利用した、このニューラル・ネットワークの再学習が完了したことになる。この後、処理の実行は、経路６５５及び経路６５８を通ってブロック６６７へ進む。

一方、前述の判断ブロック６４７において、実際の出力信頼性指標値が限界値Ｃ１より小さな値であった場合、徒って、実際の信頼性指標値が低出力信頼性領域の中に位置していることが判明した場合には、処理の実行は、この判断ブロック６４７から出ているＮｏ経路を通ってブロック６６１へ進む。ブロック６６１では、そのとき認識されている文字をニューラル・ネットワークの出力として送出すると共に、その文字が低い出力信頼性を持って認識された文字であることを示すマークを、その文字に付しておく。この後、処理の実行はブロック６６４へ進み、このブロック６６４では、既に充分に説明したように、ニューラル・ネットワークが、バックプロパゲーション並びにニューロン重み及びニューロン・バイアス値を調節する処理を実行しないように、それらの処理を禁止する。この場合、その認識されている文字の、実際の出力信頼性が非常に低いため、もしかりに、このときのニューラル・ネットワークの現在出力ベクトルを用いて、このニューラル・ネットワークの再学習を実行したならば、このニューラル・ネットワークの認識正確度が著しく劣化するおそれがある。続いて、処理の実行は、このブロック６６４から判断ブロック６６７へ進む。

判断ブロック６６７では、現在入力ページ上の最後の文字に到達して、しかもその文字に対する、ニューラル・ネットワークを通過させる処理を完了したか否かを判定する。もし、現在入力ページ上に、ニューラル・ネットワークを通過させる処理を未だ済ませていない入力文字が残っていたならば、処理の実行は、この判断ブロック６６７から出ているＮｏ経路を通って、ブロック６７０へ進む。

ブロック６７０では、Ｉ１０スイッチ１４ｏ（図１参照）を介して、現在ページ上の続く次の文字のビットマツプの読取りを行なう。そのビットマツプが得られたならば、処理の実行はループして戻り、即ち、図６Ａ〜図６Ｄに示すように、経路６７３を介してブロック６２１へ戻り、そして、そのビットマツプに対してニューラル・ネットワークを通過させる処理を施し、以下同様にして、ル〜ブしつつ、次々と入力文字を処理して行く。一方、前述の判断ブロック６６７において、現在ページ上の最後の文字に到達して、しかもその文字に対する、ニューラル・ネットワークを通過させる処理を完了したことが判明したならば、処理の実行は、この判断ブロック６６７から、判断ブロック６７７へ進む。判断ブロック６７７では、変数ＰＡＳＳの値を調べることによって、現在ページに対して、ニューラル・ネットワークを通過させる処理を２回施したか否か、即ち、その変数ＰＡＳＳの値が「２」となっているか否かを判定する。もし、現在ページに対して、ネットワークを初めて通過させる第１バスの処理しか行なわれていなかったならば、処理の実行は、この判断ブロック６７７から、そのＮｏ経路を通って、ブロック６８０へ進む。ブロック６８０では、変数ＰＡＳＳの値を「２」にセットする。この後、処理の実行はループして戻り、即ち、経路６８３を通ってブロック６１８へ戻り、現在ページ上の文字ビットマツプを次々と供給して、ニューラル・ネットワークを２回目に通過させる第２パスの処理を施して行く。一方、前述の判断ブロック６７アにおいて、現在ページの第２バスの処理が完了したことが判明した場合には、処理の実行は、この判断ブロック６７７から判断ブロック６８７へ進む。判断ブロック６８７では、現在その認識作業を実行中の書類の最後のページの処理が完了したか否かを判断する。もし、未だ処理を済ませていないページが残っていたならば、処理の実行は、この判断ブロック６８７から、そのＮｏ経路を通って、ブロック６９０へ進む。ブロック６９０では、フロントエンド・プロセッサ１１０（図１参照〕に命令を発して、このフロントエンド・プロセッサ１１０に、現在書類の中の続く次のページの入力ビツトマツプ文字データをアクセスするための適切な経路を、Ｉ１０スイッチ１４０の中に確立させる。この後、処理の実行はループして戻り、即ち、経路６９３を通ってブロック６１５へ戻り、次ページの処理を行ない、以下同様に処理して行く。一方、前述の判断ブロック６８７において、現在書類の最後のページの処理が完了したことが判明した場合には、それによってこの「認識処理手順」は終了し、処理の実行は、この判断ブロック６８７から出ているＹＥＳ経路を通って、そのままこのルーチン６００から脱出する。

以上の説明においては、機械印字した英数字の文字に、更に正規化処理を施したものを対象として、認識及び識別を行なうようにしたＯＣＲシステムとの関連において、本発明を詳述した。しかしながら、本発明のニューラル・ネットワークは、広範な様々な種類のシステムにおいて扱われている、種々のパタンの認識及び識別を行なうために使用することのできるものである。それらのパタンは、英数字の文字のビクセル・パタンに限られず、任意の種属の予め定められた所定の信号パタンであって良く、例えば、一群の入力センサによって発生される所定の信号バタンであったり、或いは、所与の単一ビットまたはマルチビットのデータ・ストリームの中に存在する信号バタンであったり、或いは、一群のアナログ信号の中に存在する信号バタンであっても良い。また、ビクセル信号とは異なった種類の入力を取り扱う場合には、当業者には容易に理解されるように、個々の入力信号をニューラル・ネットワークの中の適当な入力ニューロンへ結合するために、本発明のニューラル・ネットワークに、適当なインターフェース回路を付加することが必要となることもある。更には、認識すべき個々のパタンに対応させてディジタル出力ワードを発生させるようにした場合には、そのディジタル出力ワードと、そのディジタル出力ワードに割当てられた、ニューラル・ネットワークの中の出力ニューロンとに対応できるように、ネットワーク後置プロセッサのプログラミングの変更も必要となろう。

また更に、以上の説明では、具体的な一例として、取り扱う入力データと出力データのいずれも、コード化していないデータであるものに関して本発明を詳述した、即ち、ニューラル・ネットワークへの入力は、単なるビットマツプであってそのビット間に高度のデータ粒子性は存在しておらず、また、ニューラル・ネットワークからの出力は、最大の出力値を発生しているある１個のニューロンをもって、その出力とするものであった。しかしながら、このニューラル・ネットワークの入力及び出力は、必ずしもその種の入力及び出力に限られるものではない。この点に関して、例えば、このニューラル・ネットワークへ供給するための入力データを、必要とあらば、コード化したマルチビットのワードとすることもでき、そうした場合にも、その入力データを対象として、このニューラル・ネットワークの学習並びに再学習を適切に行なわせることができる。同様に、必要とあらば、このニューラル・ネットワークの出力部が、認識した各バタンに対応して発生する出力を、単一ビットの出力ではなく、コード化したマルチビットの出力とすることも可能である。そうする場合には、例えば、そのマルチビットのバタンを、３ビツトのバタンとし、その３つのビットを、互いに同時に、最大の出力値と、２番目に大きな出力値と、３番目に大きな出力値とを夫々に発生した、３個のニューロンの組に対応した３つのビットとすることができる。更にこの場合、出力信頼性指標値として用いる値は、最も可能性が高いニューラル・ネットワーク出力と、２番目に可能性が高いニューラル・ネットワーク出力との間の、比の値ないしは差の値を表す関数によって算出した値とすることができる。具体的な例を挙げるならば、この関数としては、現在出力ベクトルの中の最も大きな３つの出力値（即ち最大から３番目に大きな出力値までであって、現在入力に関してニューラル・ネットワークが認識したうちで、最も可能性の高い文字に対応した３つの出力値）の平均値と、同じ出力ベクトルの中の、２番目に大きな３つの出力値（即ち２番目に大きな出力値から４番目に大きな出力値までであって、同じ現在入力に関してニューラル・ネットワークが認識したうちで、２番目に可能性の高い文字に対応した３つの出力値）の平均値との間の、比の値を算出する関数を用いることができる。こうして出力信頼性指標値をめたならば、その指標値を使用して、上で説明したのと同様の方式で、誤差の逆方向伝搬とニューロン重み及びニューロン・バイアス値の調節とを制御することができる。尚、この出力信頼性指標値を導出するための関数として、具体的にどのような関数を使用するかについては、例えば、複数の出力ニューロンが送出する複数の出力値の平均値を取り、及び／または、単一出力ニューロンどうし或いは出力値の平均値どうしの間の比を取るようにした関数等が考えられるが、その関数の種類は絶対的なものではない。ただし、処理を簡明にするという観点からすれば、この関数は比較的単純な、線形関数の範祷に含まれるものとするのが良く、また、入力の相違を敏感に捉えて、それを出力に反映することのできる、充分な感受性を有する関数とすべきである。

更に、以上においては説明を容易にするために、規模が小さく構成の簡明なニュ −−ラル・ネットワークを例に取って本発明を詳述した。しかしながらこのニューラル・ネットワークは、その規模を拡張して、任意の個数のニューロンを含むようにすることができ、また、その階層の層数も３層だけではなく、より多（の層を含むようにすることができる。この点に関しては、特に、その中間階層を複数の層から成るものとすることができる。更には、このニューラル・ネットワークの中の互いに隣接していない階層の中に夫々が配置されているニューロンの間を、適当な重みを付して結合するようにしても良い。そのようにした場合でも、バックプロパゲーションを実行させる方式は、その全体として、先に説明した方式と同様の方式とすることができ、また、バックプロパゲーションの実行の禁止についても同様であって、即ち、実際のある入力データに関してニューラル・ネットワークの出力の信頼性指標値が低過ぎ、或いは高過ぎる場合には、その入力データに関する、適応性再学習を阻止するという方式を採用することができる。

更には、以上の説明においては、本発明のニューラル・ネットワークは、ソフトウェアで構成するものとし、また特に、集積回路のディジタル信号プロセッサを使用するものとして説明したが、しかしながら、このニューラル・ネットワークは、必要とあらば、アナログ回路によって構成することも、また、アナログとディジタルを混合した回路によって構成することもでき、しかも容易にそのように構成することのできるものである。

以上に本発明のニューラル・ネットワークの種々の実施例を示し且つ詳述してきたが、当業者であれば、このニューラル・ネットワークのその他の多くの異なった実施例を構成することも、また、本発明の教示を組み込んだニューラル・ネットワークを使用した種々のシステムを構成することも容易なことである。

産　の１　口　び効本発明は、光学文字認識システム（ＯＣＲシステム）に利用可能であるのみならず、広く一般的に、ニューラル・ネットワークを用いてバタン認識を行なう、広範な種々のシステムに利用可能なものである０本発明が、大きな利点をもって提供するニューラル・ネットワークは、その動作を実際の動的に変化する入力データに適応させる際に、滑らかに、迅速に、且つ正確に適応させることができ、しかもそれを、従来技術においてこれまで可能であった以上の高速で行なうことができ、それによって、ニューラル・ネットワークの認識作業の、作業速度、正確度、及び生産性を向上させることができるものである。更には、本発明のニューラル・ネットワークは、学習用データの基礎データの全体を拡張して、実際の動的に変化する入力文字を、その基礎データの中に包含することによって、従来公知のニューラル・ネットワークにおいてこれまで行なわれていた動作と比較して、より力強い動作が行なわれるようにするものである。

！−−−杓一一一豊特に光学文字認識システム（ＯＣＲシステム）に用いるのに適したニューラル・ネットワークのための装置、及びその装置に関連した方法であって、パックプロパゲーションと、ニューロン重み及びニューロン・バイアス値の調節とを、出力信頼性指標値を用いて制御することによって、ニューラル・ネットワークの応答性を、実際の変化する入力データ（入力文字）に、滑らかに、迅速に、且つ正確に適応させることができるようにしである。更に詳しくは、実際の未知の入力文字を認識して得た文字のうち、その文字を認識したときの出力信頼性指標値が所定の範囲内に位置していた入力文字を使用して、バタン認識作業の実行中に、ニューラル・ネットワークに適応のための再学習を行なわせている。更に、この再学習を行なわせるときの出力信頼性指標値の範囲に上限を設定することによって、入力文字がその初期学習用データから充分に変化していて、再学習を行なえばその結果としてニューラル・ネットワークが提供する認識正確度が顕著に上昇する可能性が高いという場合にのみ、ニューラル・ネットワークの再学習が行なわれるようにしている。出力信頼性の指標値としては、ニューラル・ネットワークの複数の出力ニューロンが送出する出力値のうちの、最大の出力値と２番目に大きな出力値との間の比の値を使用している。学習用データの基礎データの全体を拡張して、実際の動的に変化している入力文字をその基礎データの中に包含するようにしたため、本発明のニューラル・ネットワークは、従来公知のニューラル・ネットワークにおいて、これまで行なわれていた動作と比較して、はるかに力強い動作を行なうものとなっている。

国際調査報告、、、Ａ−１Ｖｅ　ＰＣＴ／ｕｓ　９１１０３００３１ｍｗｗ＋ｌｅ＋ｓｌＡｗｌｋｓ＋ｊｍＮｓＰＣＴ／ＵＳ９１１０３ｏｏ３国際調査報告

Claims

【特許請求の範囲】

１．未知の入力データの中に含まれている複数のパタンの存在を認識するための装置において、未知の入力データに応答して複数の出力値を発生するようにしたネットワーク手段であって、発生したそれら複数の出力値が集合した全体によって、その未知の入力データの中に存在している前記複数のパタンのうちの１つのパタンを同定するようにしてあり、更に、複数の重み値を付与してある、前記ネットワーク手段と、制御信号と、前記所定パタンに関する前記複数の出力値及びそれら複数の出力値に対応した複数の所定の出力目標値とに応答して、前記複数の重み値の各々の値の変更量を決定し、更に、決定したその変更量に応答して、前記未知の入力データが前記ネットワーク手段へ供給されている状態で前記複数の重み値の各々の値を調節して、前記未知の入力データに関して前記複数の出力値と前記複数の出力目標値との間に生じる誤差を減少させるようにする決定／調節手段と、前記複数の出力値に応答して、それら複数の出力値に関する信頼性指標値を判定する手段と、前記信頼性指標値に応答して前記制御信号を発生することによって、前記信頼性指標値が充分な大きさの所定値であるときに、前記決定／調節手段をイネープルして前記変更量の決定と前記複数の重み値の調節とを行なわせ、それによって、当該パタンが所定パタンからのずれを生じているときに当該パタンを認識するための学習を前記ネットワーク手段に行なわせる制御信号発生手段と、を備えたことを特徴とする装置。
２．前記ネットワーク手段が、互いに連結して階層構造を成している複数のニューロンを有するネットワークを含んでおり、該ネットワークは、前記未知の入力データに応答してその未知の入力データの中に含まれているパタンを認識すると共に、その認識したパタンに応答して前記複数の出力値を発生するようにしてあり、前記階層構造は、前記複数のニューロンのうちの異なった複数のニューロンから夫々形成した入力階層、中間階層、及び出力階層を備えており、且つ、前記階層構造においては、前記複数のニューロンのうちの所定のペアを成すニューロンどうしを前記複数の重み値のうちの対応する１つの重み値を付与して相互連結してあることを特徴とする請求項１の装置。
３．前記複数のニューロンの各々が、ニューロン出力とニューロン入力とを有していると共に、ニューロン入力の閾値関数としてニューロン出力値を発生するようにしてあり、且つ、前記中間階層中の複数のニューロン及び前記出力階層中の複数のニューロンの各々が、複数のニューロン入力信号に応答し、それら複数のニューロン入力信号の各々に、前記複数の重み値のうちの対応した１つの重み値を乗じることによって、複数の重み付けニューロン入力信号を形成する手段と、前記複数の重み付けニューロン入力信号に応答し、それら複数の重み付けニューロン入力信号の合計値である、重み付け合計値を形成する手段と、前記重み付け合計値に対して、所定の連続國値関数を用いて、國値処理を施すことによって、前記ニューロン出力を発生する手段と、を含んでいることを特徴とする請求項２の装置。
４．前記未知の入力データは複数の入力値から構成されており、それら複数の入力値の各々を、前記入力階層中の複数のニューロンのうちの互いに異なった、そしてその入力値に対応した１つのニューロンヘ、そのニューロン入力信号として供給するようにしてあり、且つ、前記複数の出力値は、それらが集合した全体が、前記出力階層中の複数のニューロンの全てが発生するニューロン出力値によって形成されていることを特徴とする請求項３の装置。
５．前記入力階層中の複数のニューロンのうちの各ニューロンのニューロン出力を、前記中間階層中の複数のニューロンのうちの各ニューロンの複数のニューロン入力のうちの１つのニューロン入力に接続してあり、且つ、前記中間階層中の複数のニューロンのうちの各ニューロンのニューロン出力を、前記出力階層中の複数のニューロンのうちの各ニューロンの複数のニューロン入力のうちの１つのニューロン入力に接続してあることを特徴とする請求項４の装置。
６．前記未知の入力データは、所定個数のピクセルから成るビットマップであり、それら各ピクセルの値を、前記入力階層中の複数のニューロンのうちの互いに異なった、そしてそのピクセルに対応した１つのニューロンヘ、そのニューロン入力として供給するようにしてあることを特徴とする請求項５の装置。
７．前記連続國値関数をシグモイド関数としてあることを特徴とする請求項３の装置。
８．前記重み付け合計値が、前記複数の重み付けニューロン入力信号に加えて更にバイアス値を含んでおり、更に、前記決定／調節手段が、前記複数の出力値とそれら複数の出力値に対応した前記複数の所定の出力目標値とに応答して、前記複数のニューロンの各々に関連したバイアス値の変更量を決定し、更に、決定したその変更量に応答して、前記未知の入力データが前記ネットワーク手段へ供給されている状態で前記バイアス値を変更して、前記誤差を減少させるようにしてあることを特徴とする請求項３の装置。
９．前記制御信号発生手段が、前記信頼性指標値の値か所定領域内にあるときに、前記決定／調節手段をイネーブルするようにしてあることを特徴とする請求項１の装置。
１０．学習手段を備え、該学習手段は、所定の既知の入力パタンに応答するようにしてあり、該学習手段には、複数の所定のニューロン出力値を関連付けてあり、該学習手段は、前記既知のパタンを前記未知の入力データとして、また、前記複数の所定のニューロン出力値を前記複数の出力目標値として、それらを互いに同時に供給するものであり、更に該学習手段は、前記決定／調節手段をイネープルして前記変更量の決定と前記重み値の調節とを行なわせることにより、前記複数の出力値と前記複数の出力目標値との間に生じる誤差を減少させ、それによって前記ネットワーク手段に、前記未知の入力データの中に含まれている前記既知のパタンを初期認識するための学習を行なわせるものであることを特徴とする請求項１の装置。
１１．前記学習手段が、予め定めてある複数の所定の既知の入力パタンを前記未知の入力データとして、それら複数の所定の既知の入力パタンに関連付けて予め定めてある複数の所定のニューロン出力値を前記複数の所定の出力目標値として供給するのと同時に、連続して次々と供給するようにしてあり、更に、該学習手段が、前記決定／調節手段をイネーブルして前記変更量の決定と前記重み値の調節とを行なわせることにより、前記複数の既知の入力パタンの各々に関して前記複数の出力値と前記複数の出力目標値との間に生じる前記誤差を減少させるようにし、それによって前記ネットワーク手段に、前記未知の入力データの中に含まれている前記複数の既知のパタンの各々を初期認識するための学習を行なわせるようにしてあることを特徴とする請求項１０の装置。
１２．前記ネットワーク手段に更に複数のバイアス値を付与してあり、且つ、前記決定／調節手段が、前記複数の出力値とそれら複数の出力値に対応した前記所定の複数の出力目標値とに応答して、前記複数の重み値並びに前記複数のバイアス値の変更量を決定し、更に、決定したその変更量に応答して、前記未知の入力データが前記ネットワーク手段へ供給されている状態で前記複数の重み値並びに前記複数のバイアス値を調節することにより、前記複数の既知の入力パタンの各々に関して前記複数の出力値と前記複数の出力目標値との間に生じる前記誤差を減少させるようにしてあることを特徴とする請求項１１の装置。
１３．前記ネットワーク手段が、互いに連結して階層構造を成している複数のニューロンを有するネットワークを含んでおり、該ネットワークは、前記未知の入力データに応答してその未知の入力データの中に含まれているパタンを認識すると共に、その認識したパタンに応答して前記複数の出力値を発生するようにしてあり、前記階層構造は、前記複数のニューロンのうちの異なった複数のニューロンから夫々形成した入力階層、中間階層、及び出力階層を備えており、且つ、前記階層構造においては、前記複数のニューロンのうちの所定のペアを成すニューロンどうしを、前記複数の重み値のうちの対応する１つの重み値を付与して相互連結してあり、更に、前記複数のニューロンの各々は、ニューロン出力とニューロン入力とを有していると共に、ニューロン入力の閾値関数としてニューロン出力値を発生するようにしてあり、更に、前記中間階層中の複数のニューロン及び前記出力階層中の複数のニューロンの各々が、複数のニューロン入力信号に応答し、それら複数のニューロン入力信号の各々に、前記複数の重み値のうちの対応した１つの重み値を乗じることによって、複数の重み付けニューロン入力信号を形成する手段と、前記複数の重み付けニューロン入力信号と、前記複数のバイアス値のうちの当該ニューロンに関連したバイアス値とに応答して、前記複数の重み付けニューロン入力信号と、当該ニューロンに関連した当該バイアス値との合計値である、重み付け合計値を形成する手段と、前記重み付け合計値に対して、所定のシグモイド関数を用いて、閾値処理を施すことによって、前記ニューロン出力を発生する手段と、を含んでいることを特徴とする請求項１２の装置。
１４．光学文字読取機における、未知のビットマップ形式の入力データの中に含まれている複数のビットマップ形式の英数字の文字パタンの存在を認識するための装置において、未知のビットマップ入力データに応答して複数の出力値を発生するようにしたネットワーク手段であって、発生したそれら複数の出力値が集合した全体によって、その未知のビットマップ入力データの中に存在している前記複数のビットマップ・パタンのうちの１つのビットマップ・パタンを同定するようにしてあり、更に、複数の重み値を付与してある、前記ネットワーク手段と、制御信号と、前記所定のビットマップ・パタンに関する前記複数の出力値及びそれら複数の出力値に対応した複数の所定の出力目標値とに応答して、前記複数の重み値の各々の値の変更量を決定し、更に、決定したその変更量に応答して、前記未知のビットマップ入力データが前記ネットワーク手段へ供給されている状態で前記複数の重み値の各々の値を調節して、前記未知のビットマップ入力データに関して前記複数の出力値と前記複数の出力目標値との間に生じる誤差を減少させるようにする決定／調節手段と、前記複数の出力値に応答して、それら複数の出力値に関する信頼性指標値を判定する手段と、前記信頼性指標値に応答して前記制御信号を発生することによって、前記信頼性指標値が充分な大きさの所定値であるときに前記決定／調節手段をイネーブルして前記変更量の決定と前記複数の重み値の調節とを行なわせ、それによって、当該ビットマップ・パタンが、当該ビットマップ・パタンに対応した英数字の文字の所定のビットマップ・パタンからのずれを生じているときに、当該ビットマップ・パタンを認識するための学習を前記ネットワーク手段に行なわせる制御信号発生手段と、を備えたことを特徴とする装置。
１５．前記ネットワーク手段が、互いに連結して階層構造を成している複数のニューロンを有するネットワークを含んでおり、該ネットワークは、前記未知の入力データに応答してその未知の入力データの中に含まれているビットマップ・パタンを認識すると共に、その認識したビットマップ・パタンに応答して前記複数の出力値を発生するようにしてあり、前記階層構造は、前記複数のニューロンのうちの異なった複数のニューロンから夫々形成した入力階層、中間階層、及び出力階層を備えており、且つ、前記階層構造においては、前記複数のニューロンのうちの所定のペアを成すニューロンどうしを、前記複数の重み値のうちの対応する１つの重み値を付与して相互連結してあり、更に、前記複数のニューロンの各々は、ニューロン出力とニューロン入力とを有していると共に、ニューロン入力の閾値関数としてニューロン出力値を発生するようにしてあり、更に、前記中間階層中の複数のニューロン及び前記出力階層中の複数のニューロンの各々が、複数のニューロン入力信号に応答し、それら複数のニューロン入力信号の各々に、前記複数の重み値のうちの対応した１つの重み値を乗じることによって、複数の重み付けニューロン入力信号を形成する手段と、前記複数の重み付けニューロン入力信号に応答し、それら複数の重み付けニューロン入力信号の合計値である、重み付け合計値を形成する手段と、前記重み付け合計値に対して、所定の連続國値関数を用いて、國値処理を施すことによって、前記ニューロン出力を発生する手段と、を含んでいることを特徴とする請求項１４の装置。
１６．入力ビットマップの中に含まれている各ピクセルの値を、前記入力階層中の複数のニューロンのうちの、互いに異なった、そしてそのピクセルに対応した１つのニューロンヘ、そのニューロン入力として供給するようにしてあり、且つ、前記複数の出力値は、それらが集合した全体が、前記出力階層中の複数のニューロンの全てが発生するニューロン出力値によって形成されていることを特徴とする請求項１５の装置。
１７．前記制御信号発生手段が、前記信頼性指標値の値が所定領域内にあるときに、前記決定／調節手段をイネーブルするようにしてあることを特徴とする請求項１６の装置。
１８．学習手段を備え、該学習手段は、既知の英数字の文字に対応させて予め定めてある所定の既知のビットマップ・パタンに応答するようにしてあり、該学習手段には、複数の所定のニューロン出力値を関連付けてあり、該学習手段は、前記既知のビットマップ・パタンを前記未知のビットマップの入力データとして、また、前記複数の所定のニューロン出力値を前記複数の出力目標値として、それらを互いに同時に供結するものであり、更に該学習手段は、前記決定／調節手段をイネーブルして前記変更量の決定と前記重み値の調節とを行なわせることにより、前記複数の出力値と前記複数の出力目標値との間に生じる誤差を減少させるようにし、それによって前記ネットワーク手段に、前記未知の入力データの中に含まれている前記既知の文字を初期認識するための学習を行なわせるものであることを特徴とする請求項１７の装置。
１９．前記学習手段が、複数の既知の英数字の文字に対応させて予め定めてある複数の所定のビットマップ・パタンを前記未知のビットマップの入力データとして、それら複数の所定のビットマップ・パタンに関連させて予め定めてある複数の所定のニューロン出力値を前記複数の所定の出力目標値として供給するのと同時に、連続して次々と供給するようにしてあり、更に、該学習手段が、前記決定／調節手段をイネーブルして前記変更量の決定と前記重み値の値の調節とを行なわせることにより、前記複数の既知のビットマップ・パタンの各々に関して前記複数の出力値と前記複数の出力目標値との間に生じる前記誤差を減少させるようにし、それによって前記ネットワーク手段に、前記未知の入力データの中に含まれている前記既知の文字の各々を初期認識するための学習を行なわせるようにしてあることを特徴とする請求項１８の装置。
２０．前記ネットワーク手段に更に複数のバイアス値を付与してあり、且つ、前記決定／調節手段が、前記複数の出力値とそれら複数の出力値に対応した前記所定の複数の出力目標値とに応答して、前記複数の重み値並びに前記複数のバイアス値の変更量を決定し、更に、決定したその変更量に応答して、前記未知の入力ビットマップ・データが前記ネットワーク手段へ供給されている状態で前記複数の重み値並びに前記複数のバイアス値を調節することにより、前記複数の既知の文字の各々に関して前記複数の出力値と前記複数の出力目標値との間に生じる前記誤差を減少させるようにしてあることを特徴とする請求項１９の装置。
２１．未知の入力データの中に含まれている複数のパタンの存在を認識するための方法において、未知の入力データに応答して、且つ、複数の重み値を付与してあるネットワークを介して、複数の出力値を発生し、しかも発生するそれら複数の出力値は、それら出力値が集合した全体によって、前記未知の入力データの中に存在している前記複数のパタンのうちの１つのパタンを同定するものである、出力値発生ステップと、制御信号と、前記所定のパタンに関する前記複数の出力値及びそれら複数の出力値に対応した複数の所定の出力目標値とに応答して、前記複数の重み値の各々の値の変更量を決定し、更に、決定したその変更量に応答して、前記未知の入力データが前記ネットワークへ供給されている状態で前記複数の重み値の各々の値を調節して、前記未知の入力データに関して前記複数の出力値と前記複数の出力目標値との間に生じる誤差を減少させるようにする、決定／調節ステップと、前記複数の出力値に応答して、それら複数の出力値に関する信頼性指標値を判定するステップと、前記信頼性指標値に応答して前記制御信号を発生することによって、前記信頼性指標値が充分な大きさの所定値であるときに、前記決定／調節ステップをイネーブルして前記変更量の決定と前記複数の重み値の調節とを行なわせ、それによって、当該パタンが所定パタンからのずれを生じているときに当該パタンを認識するための学習を前記ネットワークに行なわせる、制御信号発生ステップと、を含んでいることを特徴とする方法。
２２．前記ネットワークが、互いに連結して階層構造を成している複数のニューロンを有しており、該ネットワークは，前記未知の入力データに応答してその未知の入力データの中に含まれているパタンを認識すると共に、その認識したパタンに応答して前記複数の出力値を発生するものであり、前記階層構造は、前記複数のニューロンのうちの異なった複数のニューロンから夫々形成した入力階層、中間階層、及び出力階層を備えており、且つ、前記階層構造においては、前記複数のニューロンのうちの所定のペアを成すニューロンどうしを、前記複数の重み値のうちの対応する１つの重み値を付与して相互連結してあり、更に、前記複数のニューロンの各々は、ニューロン出力とニューロン入力とを有していると共に、ニューロン入力の闇値関数としてニューロン出力値を発生するようにしてあり、更に、前記中間階層中の複数のニューロン及び前記出力階層中の複数のニューロンの各々の中において実行するステップであって、複数のニューロン入力信号に応答し、それら複数のニューロン入力信号の各々に、前記複数の重み値のうちの対応した１つの重み値を乗じることによって、複数の重み付けニューロン入力信号を形成するステップと、前記複数の重み付けニューロン入力信号に応答し、それら複数の重み付けニューロン入力信号の合計値である、重み付け合計値を形成するステップと、前記重み付け合計値に対して、所定のシグモイド関数を用いて、國値処理を施すことによって、前記ニューロン出力を発生するステップと、を含んでいることを特徴とする請求項２１の方法。
２３．前記未知の入力データは複数の入力値から構成されており、前記方法が更に、それら複数の入力値の各々を、前記入力階層中の複数のニューロンのうちの互いに異なった、そしてその入力値に対応した１つのニューロンヘ、そのニューロン入力信号として供給するステップと、前記複数の出力値の集合した全体を、前記出力階層中の複数のニューロンの全てが発生するニューロン出力値によって形成するステップと、を含んでいることを特徴とする請求項２２の方法。
２４．前記重み付け合計値が、前記複数の重み付けニューロン入力信号に加えて更にバイアス値を含んでおり、前記決定／調節ステップが更に、前記複数の出力値とそれら複数の出力値に対応した前記複数の所定の出力目標値とに応答して、前記複数のニューロンの各々に関連したバイアス値の変更量を決定し、更に、決定したその変更量に応答して、前記未知の入力データが前記ネットワークへ供給されている状態で前記バイアス値を変更して、前記誤差を減少させるようにするステップ、を含んでいることを特徴とする請求項２３の方法。
２５．前記制御信号発生ステップが更に、前記信頼性指標値の値が所定領域内にあるときに、前記決定／調節ステップをイネーブルするステップを含んでいることを特徴とする請求項２２の方法。
２６．既知の入力パタンに対応させて予め定めてあり、且つ、複数の所定のニューロン出力値を関連付けてある、所定のパタンに応答して、前記ネットワークに学習をさせる、学習ステップを含んでおり、該学習ステップが、前記所定のパタンを前記未知の入力データとして、また、前記複数の所定のニューロン出力値を前記複数の出力目標値として、それらを互いに同時に供給するステップと、前記決定／調節ステップをイネーブルして前記変更量の決定と前記重み値の調節とを行なわせることにより、前記複数の出力値と前記複数の出力目標値との間に生じる誤差を減少させ、それによって前記ネットワークに、前記未知の入力データの中に含まれている前記既知のパタンを初期認識するための学習を行なわせるステップと、を含んでいることを特徴とする請求項２２の方法。
２７．前記学習ステップが更に、複数の既知の入力パタンに対応させて予め定めてある複数の所定のパタンの各々を前記未知の入力データとして、それら複数の所定の既知の入力パタンに関連付けて予め定めてある複数の所定のニューロン出力値を前記複数の所定の出力目標値として供給するのと同時に、連続して次々と供給するステップと、前記決定／調節ステップをイネーブルして前記変更量の決定と前記重み値の調節とを行なわせることにより、前記複数の学習用パタンの各々に関して前記複数の出力値と前記複数の出力目標値との間に生じる前記誤差を減少させるようにし、それによって前記ネットワークに、前記未知の入力データの中に含まれている前記複数の既知のパタンの各々を初期認識するための学習を行なわせるステップと、を含んでいることを特徴とする請求項２６の方法。
２８．前記ネットワークに更に複数のバイアス値を付与してあり、且つ、前記決定／調節ステップが更に、前記複数の出力値とそれら複数の出力値に対応した前記所定の複数の出力目標値とに応答して、前記複数の重み値並びに前記複数のバイアス値の変更量を決定し、更に、決定したその変更量に応答して、前記未知の入力データが前記ネットワークへ供給されている状態で前記複数の重み値並びに前記複数のバイアス値を調節することにより、前記複数の既知の入力パタンの各々に関して前記複数の出力値と前記複数の出力目標値との間に生じる前記誤差を減少させるようにするステップ、を含んでいることを特徴とする請求項２７の方法。
２９．光学文字読取機における、未知のビットマップ形式の入力データの中に含まれている複数のビットマップ形式の英数字の文字パタンの存在を認識するための方法において、未知のビットマップ入力データに応答して、且つ、複数の重み値を付与してあるネットワークを介して、複数の出力値を発生し、しかも発生するそれら複数の出力値は、それら出力値が集合した全体によって、前記未知のビットマップ入力データの中に存在している前記複数のビットマップ・パタンのうちの１つのビットマップ・パタンを同定するものである、出力値発生ステップと、制御信号と、前記所定のビットマップ・パタンに関する前記複数の出力値及びそれら複数の出力値に対応した複数の所定の出力目標値とに応答して、前記複数の重み値の各々の値の変更量を決定し、更に、決定したその変更量に応答して、前記未知のビットマップ入力データが前記ネットワークへ供給されている状態で前記複数の重み値の各々の値を調節して、前記未知のビットマップ入力データに関して前記複数の出力値と前記複数の出力目標値との間に生じる誤差を減少させるようにする、決定／調節ステップと、前記複数の出力値に応答して、それら複数の出力値に関する信頼性指標値を判定するステップと、前記信頼性指標値に応答して前記制御信号を発生することによって、前記信頼性指標値が充分な大きさの所定値であるときに、前記決定／調節ステップをイネーブルして前記変更量の決定と前記複数の重み値の調節とを行なわせ、それによって、当該ビットマップ・パタンが、当該ビットマップ・パタンに対応した英数字の文字の所定のビットマップ・パタンからのずれを生じているときに、当該ビットマップ・パタンを認識するための学習を前記ネットワークに行なわせる、制御信号発生ステップと、を含んでいることを特徴とする方法。
３０．前記ネットワークが、互いに連結して階層構造を成している複数のニューロンを有しており、該ネットワークは、前記未知の入力データに応答してその未知の入力データの中に含まれているパタンを認識すると共に、その認識したパタンに応答して前記複数の出力値を発生するものであり、前記階層構造は、前記複数のニューロンのうちの異なった複数のニューロンから夫々形成した入力階層、中間階層、及び出力階層を備えており、且つ、前記階層構造においては、前記複数のニューロンのうちの所定のペアを成すニューロンどうしを、前記複数の重み値のうちの対応する１つの重み値を付与して相互連結してあり、更に、前記複数のニューロンの各々は、ニューロン出力とニューロン入力とを有していると共に、ニューロン入力の國値関数としてニューロン出力値を発生するようにしてあり、更に、前記中間階層中の複数のニューロン及び前記出力階層中の複数のニューロンの各々の中において実行するステップであって、複数のニューロン入力信号に応答し、それら複数のニューロン入力信号の各々に、前記複数の重み値のうちの対応した１つの重み値を乗じることによって、複数の重み付けニューロン入力信号を形成するステップと、前記複数の重み付けニューロン入力信号に応答し、それら複数の重み付けニューロン入力信号の合計値である、重み付け合計値を形成するステップと、前記重み付け合計値に対して、所定の関数を用いて、國値処理を施すことによって、前記ニューロン出力を発生するステップと、を含んでいることを特徴とする請求項２９の方法。
３１．入力ビットマップの中に含まれている各ピクセルの値を、前記入力階層中の複数のニューロンのうちの、互いに異なった、そしてそのピクセルに対応した１つのニューロンヘ、そのニューロン入力信号として供給するステップと、前記複数の出力値の集合した全体を、前記出力階層中の複数のニューロンの全てが発生するニューロン出力値によって形成するステップと、を含んでいることを特徴とする請求項３０の方法。
３２．前記制御信号発生ステップが便に、前記信頼性指標値の値が所定領域内にあるときに、前記決定／調節ステップをイネーブルするステップを含んでいることを特徴とする請求項３１の方法。
３３．英数字の文字の既知のパタンに対応させて予め定めてあり、且つ、複数の所定のニューロン出力値を関連付けてある、所定のパタンに応答して、前記ネットワークに学習をさせる、学習ステップを含んでおり、該学習ステップが、前記所定のパタンを前記未知の入力データとして、また、前記複数の所定のニューロン出力値を前記複数の出力目標値として、それらを互いに同時に供給するステップと、前記決定／調節ステップをイネーブルして前記変更量の決定と前記重み値の調節とを行なわせることにより、前記複数の出力値と前記複数の出力目標値との間に生じる誤差を減少させ、それによって前記ネットワークに、前記未知のビットマップ入力データの中に含まれている前記既知のパタンを初期認識するための学習を行なわせるステップと、を含んでいることを特徴とする請求項３２の方法。
３４．前記学習ステップが更に、複数の既知の入力パタンに対応させて予め定めてある複数の所定の学習用パタンの各々を前記未知の入力データとして、それら複数の所定の既知の入力パタンに関連付けて予め定めてある複数の所定のニューロン出力値を前記複数の所定の出力目標値として供給するのと同時に、連続して次々と供給するステップと、前記決定／調節ステップをイネーブルして前記変更量の決定と前記重み値の調節とを行なわせることにより、前記複数の学習用パタンの各々に関して前記複数の出力値と前記複数の出力目標値との間に生じる前記誤差を減少させるようにし、それによって前記ネットワークに、前記未知の入力データの中に含まれている前記複数の既知のパタンの各々を初期認識するための学習を行なわせるステップと、を含んでいることを特徴とする請求項３３の方法。
３５．前記ネットワークに更に複数のバイアス値を付与してあり、且つ、前記決定／調節ステップが更に、前記複数の出力値とそれら複数の出力値に対応した前記所定の複数の出力目標値とに応答して、前記複数の重み値並びに前記複数のバイアス値の変更量を決定し、更に、決定したその変更量に応答して、前記未知の入力データが前記ネットワークへ供給されている状態で前記複数の重み値並びに前記複数のバイアス値を調節することにより、前記複数の既知の入力パタンの各々に関して前記複数の出力値と前記複数の出力目標値との間に生じる前記誤差を減少させるようにするステップ、を含んでいることを特徴とする請求項３４の方法。
３６．光学文字読取機における、未知のビットマップ形式の入力データの中に含まれている複数のビットマップ形式の英数字の文字パタンの存在を認識するための方法において、パタン認識処理手順におけるステップとして、未知のビットマップ入力データに応答して、且つ、複数の重み値を付与してあるネットワークを介して、複数の出力値を発生し、しかも発生するそれら複数の出力値は、それら出力値が集合した全体によって、前記未知のビットマップ入力データの中に存在している前記複数のビットマップ・パタンのうちの１つのビットマップ・パタンを同定するものである、出力値発生ステップと、制御信号と、前記所定のビットマップ・パタンに関する前記複数の出力値及びそれら複数の出力値に対応した複数の所定の出力目標値とに応答して、前記複数の重み値の各々の値の変更量を決定し、更に、決定したその変更量に応答して、前記未知のビットマップ入力データが前記ネットワークへ供給されている状態で前記複数の重み値の各々の値を調節して、前記未知のビットマップ入力データに関して前記複数の出力値と前記複数の出力目標値との間に生じる誤差を減少させるようにする、決定／調節ステップと、前記複数の出力値に応答して、それら複数の出力値に関する信頼性指標値を判定するステップと、前記信頼性指標値に応答して前記制御信号を発生することによって、前記信頼性指標値が充分な大きさの所定値であるときに、前記決定／調節ステップをイネーブルして前記変更量の決定と前記複数の重み値の調節とを行なわせ、それによって、当該ビットマップ・パタンが、当該ビットマップ・パタンに対応した英数字の文字の所定のビットマップ・パタンからのずれを生じているときに、当該ビットマップ・パタンを認識するための学習を前記ネットワークに行なわせる、制御信号発生ステップと、を含んでおり、更に、学習処理手順におけるステップとして、英数字の文字に対応させて予め定めてある所定のビットマップ・パタンを前記未知の入力データとして、また、その所定のビットマップ・パタンに対応させて予め定めてある複数の所定のニューロン出力値を前記複数の出力目標値として、夫々に供給するステップと，前記決定／調節ステップをイネーブルして前記変更量の決定と前記重み値の調節とを行なわせることにより、前記複数の出力値と前記複数の出力目標値との間に生じる誤差を減少させ、それによって前記ネットワークに、前記未知のビットマップ入力データの中に含まれている前記既知のパタンを初期認識するための学習を行なわせるステップと、を含んでおり、更に、前記学習処理手順の実行の後に、前記パタン認識処理手順を実行する、ことを特徴とする方法。
３７．前記ネットワークが、互いに連結して階層構造を成している複数のニューロンを有しており、該ネットワークは、前記未知の入力データに応答してその未知の入力データの中に含まれているパタンを認識すると共に、その認識したパタンに応答して前記複数の出力値を発生するものであり、前記階層構造は、前記複数のニューロンのうちの異なった複数のニューロンから夫々形成した入力階層、中間階層、及び出力階層を備えており、且つ、前記階層構造においては、前記複数のニューロンのうちの所定のペアを成すニューロンどうしを、前記複数の重み値のうちの対応する１つの重み値を付与して相互連結してあり、更に、前記複数のニューロンの各々は、ニューロン出力とニューロン入力とを有していると共に、ニューロン入力の國値関数としてニューロン出力値を発生するようにしてあり、更に、前記中間階層中の複数のニューロン及び前記出力階層中の複数のニューロンの各々の中において実行するステップであって、複数のニューロン入力信号に応答し、それら複数のニューロン入力信号の各々に、前記複数の重み値のうちの対応した１つの重み値を乗じることによって、複数の重み付けニューロン入力信号を形成するステップと、前記複数の重み付けニューロン入力信号に応答し、それら複数の重み付けニューロン入力信号の合計値である、重み付け合計値を形成するステップと、前記重み付け合計値に対して、所定のシグモイド関数を用いて、閾値処理を施すことによって、前記ニューロン出力を発生するステップと、を含んでいることを特徴とする請求項３６の方法。
３８．前記未知の入力データは複数の入力値から構成されており、前記方法が更に、それら複数の入力値の各々を、前記入力階層中の複数のニューロンのうちの互いに異なった、そしてその入力値に対応した１つのニューロンヘ、そのニューロン入力信号として供給するステップと、前記複数の出力値の集合した全体を、前記出力階層中の複数のニューロンの全てが発生するニューロン出力値によって形成するステップと、を含んでいることを特徴とする請求項３７の方法。
３９．前記重み付け合計値が、前記複数の重み付けニューロン入力信号に加えて更にバイアス値を含んでおり、前記決定／調節ステップが更に、前記複数の出力値とそれら複数の出力値に対応した前記複数の所定の出力目標値とに応答して、前記複数のニューロンの各々に関連したバイアス値の変更量を決定し、更に、決定したその変更量に応答して、前記未知の入力データが前記ネットワークへ供給されている状態で前記バイアス値を変更して、前記誤差を減少させるようにするステップ、を含んでいることを特徴とする請求項３８の方法。
４０．前記制御信号発生ステップが更に、前記信頼性指標値の値が所定領域内にあるときに、前記決定／調節ステップをイネーブルするステップを含んでいることを特徴とする請求項３６の方法。
４１．認識処理を施している入力書類の各々のページに対して前記パタン認識処理を２同ずつ連続して実行することによって、当該ページの認識正確度を向上させるようにしたことを特徴とする請求項３６の方法。