JPH05506114A

JPH05506114A - 機械印刷文字用光学的文字認識神経網システム

Info

Publication number: JPH05506114A
Application number: JP91504481A
Authority: JP
Inventors: ガボウスキ，ロジャー・スティーヴン; ビートゥ，ルイス・ジェームズ; バースキ，ロリ・リン; タン，ヒン―レオン; アッサド，アンドリュー・マサイアス; デュトン，ダウン・ローライン
Original assignee: イーストマン・コダック・カンパニー
Priority date: 1990-02-02
Filing date: 1991-01-31
Publication date: 1993-09-02
Also published as: WO1991011779A1; US5048097A; EP0513188A1

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。

Description

【発明の詳細な説明】印　・　切−システム発明の背景技匝的分野本発明は、複数のフォントの任意の１つにおける機械印刷された英数字文字を認識するために神経網を用いる光学的文字認識システムの分野に関する。

背景技玉光学的文字認識は、書類上の各文字が所定の英数字記号組における適当な記号と正しく関連していることを必要とする。書類上の文字が特定の英数字記号として認識されなければならないイメージパターンを構成するという意味でこれはパターン認識に頚僚している。パターン認識システムは周知であり、例えば、米国特許第３，１９２，５０５号、３，２６７．４３９号、３，２７５．９８５号、３．２７５，９８６号、及び４，４７９，２４１号に開示されている。斯かるパターン認識システムは、英数字文字を認識する上での固有の問題に対処するのに特に好適ではない、これらの問題は以下に論じられよう。

関連技術は、１９８８年６月発行のカラディルによる「神経網プライマＪＡＩエキスパートの５３頁乃至５９頁に且つルメルハート他による並列ｌｉｄ処理の第 −巻の３１８頁乃至３３０頁に記載されている神経網である。神経網を用いて数（英数字文字）を認識することは、ジョーシア州アトランタでの１９８６年のシステム、人間及び人工頭脳学に関するＩＥＥＥ国際会議の会報の１６２１頁乃至】６２５頁（１９８６年８月）のバーによる「神経網数字認識装置」によって提案された。神経網を用いて英数字文字を認識することは、神経網に関する国際合同会議の会報の第二巻の６０６頁乃至６１４頁（１９８９年６月１８日−２２日）の会報のハヤシ他による「ポケットアルゴリズムを有する結合モデルを用いる英数字文字認識」によって提案されている。ハヤシ他の発表は、度数分布図を用いて書類上の各文字イメージを分割又は分離し且つ次にこれを神経網に伝送する前に各文字イメージを標準寸法に正常化する光学的文字認識システムを開示している。更に、ハヤシ他の発表は、同一のシステムを用いて２つ以上の種類のフォントを認識できることを開示している。しかしながら、上記の特許及び発表のどれも、神経網が曖昧な即ち信頼できない記号選択を行なった時に、即ち、その［点Ｊが第二及び第三選択にかなり近い選択を行なった時に何をすべきかという問題を扱っていない、更に、これらはどれも、隣接文字によって飾りつけられた文字をこれらが度数分布的分割技術によって分離しないように認識する方法の問題を扱っていない。最後に、上記の特許及び発表のどれも、隣接文字に接触している文字の認識方法の問題について扱っていない。

によ　て”れる量神経網が文字イメージを認識してこの文字イメージをこのイメージが表わす記号と正しく関係づけることができる前に、文字イメージは書類上の他の文字のイメージから分離されていなければならず且つその寸法はこの神経網が処理するように訓練されている文字イメージ寸法及びアスペクト比に正常化−一致−していなければならない。隣接している文字イメージを互いに分離することは通常、連続した「オン」画素からなる２つの領域の間に存在している「オン」画素が欠けている行又は列を単純に見つけることからなる分割プロセスによって達成される。

この分割プロセスは単に、これら２つの領域が「オン」画素が欠けていると見いだされた行又は列によって分離された異なった文字イメージであると宣言する。

斯かる分割技術はしばしば「ヒストグラミングｊと呼ばれる。

斯かる分割技術にかかる１つの問題は、これらが飾りつけられた隣接文字を分離できないことである。飾りつけられた文字というのは、必ずしも接触しておらず、それらの一方が他方を囲んでいる隣接した文字である。例えば、特定のフォントにおいて、第１図に示すように、大文字「Ｐ」は次の小文字「ｅ」を囲んでいる。これら２つの文字は本当は書類イメージにおいて互いに分離されているが、第１ａ図から判るように、これら２つの文字の間にはｒオンノ画素が欠けている行又は列が存在していない。斯くして、上で論じられた分割技術はこれら２つの文字を分離することができない、その結果、神経網はどちらの文字も認識することができない。

上で論じられた分割技術に斯かる別の問題は、これらが実際的に接触又は連結している隣接文字を分離することができないことである０例えば、第１ｂ図に示すように、その底部が次の大文字ｒｌ、と併合している大文字「Ｌ」は大文字「Ｕ」のように見え得る。第１ａ図の例のように、第１ｂ図は、「オンＪ画素が欠けている行又は列が存在せず、従ってこの分割技術はこれら２つの連結した文字を分離することができず且つ神経網はこれらの文字のどれも認識することができないことを示している。

神経網を用いて光学的文字認識を達成することに斯かる関連の問題は、神経網が与えられた文字イメージに対して一義的な記号選択を行うことができないことである。斯かる事象は、上記のように、飾りっけ又は接触している文字によって生しるかあるいは悪い書類イメージの品質等の他のことによって生じ得る。周知のように、この神経網はその記号出力の１つにおいて非常に高い得点を且つその他の記号出力の全てにおいて非常に低い得点を発生することにより一義的な選択を行う。神経網が一義的記号選択を行うことができない時に必ず、その記号出方のどれも比較的高い得点を有しておらず、実際その記号出力の幾つかは同様の得点を有し得る。この問題は、特に、特定の文字イメージが神経網に認識可能でないという理由が前もって知られていない場合に、神経網が認識することができない文字イメージを如何に処理するかということである。

更に別の問題は、神経網による処理に適切な寸法に正常化されると、同様の形の英数字記号から実用的に区別不可能な非常に小さな記号（コンマ、引用符等）を含む記号組が選択され得ることである９通常、神経網は、特定の寸法及びアスペクト比の文字イメージを認識するように訓練されている。書類が印刷された時に用いられるフォントに応じであるいは書類が拡大又は縮小を表わすかに応じて、書類からとられた各文字イメージは、神経網によって処理される前に正常化されて、これによりその寸法及びアスペクト比が神経網が認識するように訓練された文字イメージ寸法及びアスペクト比に一致するようにしなければならない。例えば、文字イメージ寸法は２進方画素の１２行×２４列であり得る。

更に別の目的は、特定の記号（例えば、ｃ、ｐ、　ｗ、ｓ、　χ等）のケース（大文字又は小文字）が記号の寸法によってのみ決定され、従って文字正常化の後は区別することができないことである。斯くして、神経網によるそれらの認識に続く斯かる記号のケースを直すために何らかの対策がなされなければならない。

従って、本発明の１つの目的は、神経網が一義的記号選択を行うことができない時は必ず文字を認識することにある。

本発明の別の目的は、神経網が信頼できる選択を行うことができない時はいつでも検知し、次に飾り付けられた隣接文字が存在するか否かを識別することにある。

本発明の更に別の目的は、神経網が信頼できる選択を行うことができない時は必ず検知し且つ次に飾り付けられた隣接文字が存在するか否かあるいは接触している隣接文字が存在するか否かを識別することにある。

本発明の更に別の目的は、文字正常化に続く他の記号から区別することができない特別な記号を認識し且つ適切なケース（大文字あるいは小文字）を神経網によって信顛的に認識されるがそのケースが文字正常化の後区別することができない記号に割り当てることにある。

本発明の更に別の目的は、最も複雑化されていないタスクが先に達成され且つより複雑化されているタスクがそれらの特定の文字イメージの必要性の決定の後にのみ達成されるという順序で前記の目的の各々を達成することにある。

発明の開示本発明は、所定の記号組を認識するように訓練された神経網、この神経網による１ｍのために書類からの文字イメージを分割し正常化する前１プロセツサ、及びこの神経網によって成された誤記号識別を直す後置プロセッサを有する光学的文字認識システムである０本発明の代替実施例において、前置プロセッサは他の方法では分離不可能な文字イメージ、例えば飾り付けられた文字のイメージを分離するために、接触された成分分析によって個々の文字イメージを分割する。

本発明のこの代替実施例において、接触文字は後置プロセッサによって達成される接続成分分析において分離される。この実施例において、後置プロセッサは、より大きな対象に接続されていると見い出された際に接続成分分析によってより大きな対象に究極的に併合される各対象を覚えている。イメージにおけるこれら全ての対象が見い出されると、後置ブロセ／すはこれら併合された対象のどれかが神経網が認識するように訓練された全ての記号の中央高さ又は領域の近（の高さ又は領域を有するか否かを決定する。そうである場合、後置プロセッサはより大きな対象からこの基準に合致する併合された対象を分離する。斯かる場合、併合された対象は接触文字であり、文字正常化器の入力に別々にフィードバックされ次に神経網にフィードバンクされる。

本発明のこの好ましい実施例において、前置プロセッサはより高速であるが強度がより低い分割技術、例えばヒストグラミングを用いており、一方装置プロセッサは神経網によって発生される記号得点を監視する。文字イメージのアスペクト比（幅側る高さ）が所定のしきい値より大きい場合あるいは神経網からの低い記号点を検出した場合、後置プロセッサにおける腕節プロセッサはこの高いアスペクト比即ち低い点を改善するために所定の一連の試みを達成する。大抵の場合、これらの試みの各々は先ｊテの試みより時間を消費する。先ず、後置プロセンサは文字イメージが文字正常化の後特定の既知の文字から区別不可能である１組の特別な記号の１つを含むか否かを決定する。そうである場合、後置プロセッサは神経網の記号選択を無視し、特別な文字を識別する。そうでない場合、後置プロセッサは神経網によって選択された記号がそのケースが文字正常化に続いて未定である記号であるか否かを決定する。そうである場合、後置プロセッサは元の（正常化されていない）文字イメージの寸法から文字の適切なケースを決定する。

そうでない場合、この文字イメージは２つの飾り付けられた記号の文字イメージであるという仮定がなされ、後置プロセッサにおける腕節プロセッサは２つの飾り付けられた文字を分離しようとして接続成分分析を達成する。このようにして、時間を消費する接続成分分析プロセッサは、特定の文字イメージに対して必要であると見い出されない限り用いられない、腕節プロセッサがイメージを２つ以上の文字に分離するのに成功した場合、この結果は文字認識における新しい試みのために神経網の入力にフィードバックされる。接続成分分析の利点は、それがｒオン」画素の連続領域からのみなるイメージにおける断接された対象を画定することにより隣接文字イメージを分離することである。斯くして、これらの領域が飾り付けされているか否かを問わず、接続成分プロセンサは未接続領域を分離する。これらの領域の各々は次に別々に正常化されて神経網に転送される。

そうでない場合、本発明のこの好ましい実施例において、接触文字分離は、接触文字の分離に排他的に割り当てられている接触文字分離プロセッサによって後置プロセッサにおいて達成される。この接触文字分離器プロセッサによって達成されるプロセスは腕筋プロセッサのプロセスよりも時間を消費するため、後置プロセッサは腕筋プロセッサが文字イメージの分離ができない場合にのみ接触文字分離器プロセッサを用いる。接触文字分離器プロセッサは９個のそれぞれの分離試行プロセスを所定の順序で試みることにより同一のイメージにおける２つの未知の文字間の分離点を決定する。各連続試行プロセスは、次の試行プロセスの仮定が存在しないという１組の仮定可能を解消するため、各々の後続の試行プロセスのタスクを簡略にする。この９個の試行プロセスの任意の１つの成功の際、新しく分離された文字イメージのこの対は一度に１つずつ文字正常化器の入力に、従って分離の正しさを証明するために神経網にフィードバックされる。

特定の文字イメージが低い得点でもって神経網によって識別された場合且つ腕筋プロセッサと接触文字分離器プロセッサの両方が文字イメージを２つ以上の文− 字イメージに分離することができない場合、本発明のこの好ましい実施例では、文字イメージは推測プロセッサに転送される。推測プロセッサは、神経網によってなされた第２及び第３高得点記号選択のどちらが問題の文字イメージの文字高さに合致する文字高さを有しているかを決定し、その記号選択を勝者として宣言する。しかしながら、第２及び第３記号選択が文字イメージの文字高さと合致する文字高さを有する場合、推測プロセッサはこの２つの選択のどれが第１の選択と最も混同される可能性があるかを決定し、それを勝者と宣言する。

腕節（接続成分分析）プロセス及び接触文字分離プロセスは、先行特別記号検出及びケース補正プロセスより漸次に時間消費的である。本発明の１つの利点は、神経網の出力が、腕節、分離及び推測プロセスが達成されるか否かを各文字イメージに対して決定し、これによりそれらの各々が必要な場合にのみ用いられるようにすることである。詳細には、本発明のシステムは特定の文字イメージが特に高いアスペクト比を有するかあるいは許容できない程低い得点を有する神経網によって記号選択を刺激する場合のみ斯かる対策プロセスの力を借りる。斯くして、全体のシステムオペレーションの速度は、必要となった場合に腕節プロセス、接触文字分離プロセス及び推測プロセスの利点を享受しながら最適化される。

図面の簡単な説明本発明の好ましい実施例は添付図面に言及して以下に詳細に述べられており、これらの図面において、第１ａ図及びｌｂ図は、１対の飾り付は文字及び１対の接触文字をそれぞれ示す図であり、第２図は本発明の代替実施例を示しており、第３図は本発明を実施する好ましいシステムのブロック図であり、第４図は、第３図のシステムのオペレーションを示すフローダイアグラムであり、第５図は、書類の例示イメージの簡易図であり、第６図は、第５図の書類イメージから分離された文字イメージの簡易図であり、第７図は、本発明に用いられている異なった記号高さ分類を示す図であり、第８図は、第３図のシステムにおける基準パラメータユニットのオペレーションを示すフローダイアグラムであり、第９図は、第３図のシステムにおける文字正常化器によって生成された第６図の文字イメージの未正常化形を示す図であり、第１Ｏ図は、第３図のシステムにおける神経網の典型的な部分の簡易図であり、第１１図は、第３図のシステムにおける特殊記号検出器のオペレーションを示すフローダイアグラムであり、第１２図は、第３図のシステムにおけるケース補正器のオペレーションを示すフローダイアグラムであり、第１３図は、第３図のシステムにおける腕節器のオペレーションを示すフローダイアグラムであり、第１４図は、第３図のシステムにおける腕節器によって用いられている隣接画素の可動核の図であり、第１５図は、第３図のシステムにおける接触文字分離器のオペレーションを示す一般フローダイアグラムであり、第１６図乃至２４図は、第１５図に示されている接触文字分離器のオペレーションにおいて用いられている９個の接触文字分離プロセスのそれぞれの１つのオペレージタンを別々に示すフローダイアグラムであり、第２５図は、新しいイメージが第１５図の接触文字オペレーションに如何に組み込まれるかを示しており、第２６図は、文字イメージの不正分割に対して保護する第１５図の接触分離オペレーションにおいて用いられている検査分割オペレーションを示しており、第２７図は、第２６図の検査分割オペレーションに用いられている一般検査プロセスを示しており、第２８図は、第３図のシステムにおける推測プロセッサのオペレーションを示すフローダイアグラムであり、第２９図は、完全な記号組におけるどの記号が第３図のシステムにおける神経網によって選択される特定の記号と混同される可能性が最も高いかを決定する上で有用なルックアップテーブルを示しており、そして第３０図は、第３図のシステムによって用いられている二進文字イメージワードのフォーマットを示す図である。

本発明を実施するモード之丞土人概説本発明の代替実施例が第２図のブロック図に示されている。光学的文字認識システム２００は接続成分分析器２１０及び文字正常化器２１５を含む前置プロセッサ２０５、文字認識神経網２２０並びにケース混同補正を達成する後置プロセンサ２２５からなっている。接続成分分析器２１０は、文字イメージの各々を全書類のイメージから分離する。接続成分分析器を用いて、分析器２１０は隣接文字のイメージをこれらの文字が飾り付けられている場合に互いに分離する。文字正常化器２１５は、分析器２１０によって供給される個々の文字イメージによって占有される水平行の画素及び垂直列の画素の数を決定する。文字イメージ又は対象によって占有される水平行及び垂直列の画素の数が神経網２２０によって要求されるイメージ寸法から異なる場合、標準化器２１５は、古い文字イメージに基づくが所望数の水平行及び垂直列の画素を占有する正常化された文字イメージを発生する。神経網２２０は正常化された文字イメージからそれが認識するように訓練された組の記号における各記号に対する異なった得点を発生する。神経網２２０は次に最高得点を有する記号を文字イメージによって表わされる記号として宣言する。後置プロセッサ２２５は、神経網によってこのように識別される記号がその上及び下ケース形が形状の点で同等であり且つ従って寸法の差のみによって互いに区別される記号であるかを決定する（勿論斯かる寸法の差は文字標準化器２１５によって達成される文字正常化プロセスの間に失われる）、そうである場合、後置プロセッサ２２５は接続成分分析器２１０によって文字正常化器２１５に転送された元の（未正常化）イメージの寸法に言及することにより現在の記号が上又は下ケースであるかを決定する。斯かる結果を予想して、元のイメージはそれが分析器２１０によって正常化器２１５に転送された時点でメモリ２３０に記憶される。斯くして、後置プロセッサ２２５は単に、メモリ２３０に記憶されているイメージの寸法を決定する。大寸法が上ケース記号を示すのに対して、小さな寸法は下ケース記号を示す。補正が必要であると見い出された場合、後置プロセッサ２２５は神経！２２０によって供給された記号を適当なケースの記号に置き換える。第２図のエレメントの各々は第３図に示されている本発明の好ましい実施例に関連して以下により詳細に論じられよう。

ここで第３図について説明すると、本発明の好ましい実施例は、周知の技術、例えばイメージの水平行及び垂直列に沿ったヒストグラミングを用いて書類イメージ３０５を複数の別々の文字イメージに分割する文字分割器３００を含んでいる。各文字イメージは個別に文字パラメータユニット３１０に送られ、文字パラメータユニット３１０は各文字イメージのパラメータ、例えば文字高さを計算する。斯かるパラメータは第３図のシステムの他の成分による使用のためにメモリ３１５に記憶される０個々の文字イメージは次に周知の技術を用いて文字正常化器３２０によって所定の寸法及びアスペクト比に正常化される。好ましい実施例において、正常化された文字イメージは１２の垂直列及び２４の水平行の二進法画素からなる０分割器３００、文字パラメータユニット３１０、メモリ３１５及び文字正常化器３２０は第３図の好ましい実施例の前置プロセッサ３２５を構成している。

前置プロセッサ３２５は正常化された文字イメージを神経１ｉ３３０の入力に転送する。神経ｍ３３０は所定組の記号の各々を認識するように訓練されている。

神経網３３０は所定組における記号の各々の１つに対する正常化されたイメージの異なった得点を発生し、最高得点を有する記号を文字イメージによって表わされる記号であると宣言する。神経網３３０はこの識別及び現在の文字イメージに対する第１、第２及び第３の高得点記号の対応の得点を後置プロセッサ３４０に送る。後置プロセッサ３４０は神経網３３０によってなされた記号識別が信頼性のあるものであるか否かを決定する。そうでない場合、後１プロセツサ３４０は現在の文字イメージに対するより信頼性の高い記号の選択を見い出すために補正又は対策タスクを達成する。

後置プロセッサ３４０におけるケース補正器３４２ばそのケース識別が文字正常化の後曖昧である記号のケース（上又は下）を補正するタスクを達成する。このタスクは第２図の後置プロセッサ２２５に関連して上で述べられた。しかしながら、第３図のケース補正器３４２は神経網によって識別された記号の適当なケースを決定するために元の文字イメージから文字寸法を計算せず、単に前に文字パラメータユニット３１０によって計算され且つメモリ３１５に記憶されている元の文字イメージの寸法を参照するだけである。

特殊記号検出器３４４は、元の文字イメージ寸法が、表わされる文字が神経網が認識するように訓練された文字でないことを示すか否かを決定する。斯かる記号は、例えば、コンマ又はピリオドあるいはその正常化されていないイメージが神経網の記号組における特定の記号から区別不可能である他の任意の記号であり得る。（ピリオドの正常化されているイメージは「０」と混同され得る。斯かる場合は、特殊記号を検出器がこの文字イメージの識別を決定する。）腕節器３４６は飾り付けされ得る書類イメージ３０５における隣接の文字イメージを分離する。好ましくは、この腕節器３４６は接続成分分析を用いる。腕節器３４６が１つの文字イメージを２つ又はそれ以上の文字イメージに分割できた時は必ず、その結果得られるイメージは神経網３３０による最終的な処理のために文字正常化器３２０の入力にフィードバックされる。

接触文字分離器３４８は、実際に接触しており且つ従って分割器３００あるいは腕節器３４６のどちらかによる分離に容易に供することができない書類イメージにおける隣接の文字イメージを分離する０分離器３４Ｂが１つの文字イメージを２つ又はそれ以上の文字イメージに分割できた場合は必ず、その結果得られるイメージは神経網３３０による最終的な処理のために文字正常化器３２０の入力にフィードバックされる。神経網によってなされた信顧できない文字識別が後置プロセッサ３４０の上記のエレメントのどれによっても補正されない特別な場合は、推測プロセッサ３５０は現在の文字イメージのためにメモリ３１５に記憶されている文字パラメータの全てを考慮に入れ、これにより現在の文字イメージの記号識別のための最上の推測を決定する。

第３図のシステムのオペレーションをこれから第４図の作動フローダイアダラムに言及して一般的に述べることにする。第４図は、第３図のシステムが書類イメージ３０５における個々の文字イメージの各水平行又はラインをいかに処理するかを時間シーケンスで示している。先ず、文字分割器３００は一行の文字イメージを受け、個々の文字イメージをその行に分割することを開始する（第４図のブロック４００）。現在の行における文字イメージの全てが分割器３００によってこのように処理された後、これらはそれぞれ１度に１つずつ文字正常化器３２０に送られる（第４図のブロック４０４）、この文字イメージの正常化された形は神経網３３０によって処理され、神経網３３０は恐らくは文字イメージによって表わされる記号を識別する（第４図のブロック４０６）。基準パラメータユニット３１０は文字イメージにおける連続「オン」画素からなる対象の種々のパラメータ（高さ及び面積等）を計算しこれらをメモリ３１５に記憶する（第４図のブロック４０７）。神経網３３０によってなされる記号の選択が補正されなければならないか否かは次に後置プロセッサ３４０によって決定される。先ず、特殊記号検出器３４４は、元の（未正常化）文字イメージの面積又は高さ一メモリ３１５に記憶されている−が所定のしきい値を下回ったか否かを決定する。（第４図のブロック４０８）、そうである場合（ブロック４０８のＹＥＳ分岐）、特殊記号検出器３４４は神経網の決定を無視し、文字イメージが実際に表わす特殊記号を検出しく第４図のブロック４１０）そして正記号識別を出力する（第４図のブロック４１０）。そうでない場合（ブロック４０８のＮｏ分岐）、ケース補正器３４２は神経！１ｉ３３０によって識別された記号がそのケースが曖昧である記号であるか否かを決定する（第４図のブロック４１４）。そうである場合（ブロック４１４のＹＥＳ分岐）、ケース補正器３４２は元の（未正常化）文字イメージの一メモリ３１５に記憶されている一寸法又は面積からケース（上又は下）を確認する。そうでない場合（ブロック４１４のＮｏ分岐）、ケース補正器３４２は回避される６次に、現在の文字イメージに関連する記号に対する神経網によって計算された点が信転度の所定しきい値を下回るかあるいは文字イメージのアスペクト比が高すぎるか否かについての決定がなされる（第４図のブロック４１８）。

そうでない場合（ブロック４１８のＮｏ分岐）、神経劇の記号識別は信頼性があるものと考えられ、これは最終結果として転送される（第４図のブロック４２０）。

そうでない場合（ブロック４１８のＹＥＳ分岐）、低い得点あるいは高アスペクト比は分割器３００が書類イメージ３０５における２つ（又はそれ以上）の隣接した文字イメージを分離できないことに因るという仮定がなされる。この場合、現在の文字イメージの腕筋がすでに試みられているか否かの決定が先ずなされる（第４図のブロック４２２）。そうでない場合、腕節器３４６は文字イメージを２つ又はそれ以上の別々のイメージに分離することを試みる（ブロック４２４）。

現在の文字イメージからより多くの別々の対象を形成することが成功した場合（第４図のブロック４２６のＹＥＳ分岐）、その結果得られる新しい文字イメージは一度に１つずつ文字標準化器の入力にフィードバックされ、これによりこの新しいイメージがそれぞれ上記のプロセスに供されるようになっている。腕節器３４６が現在の文字イメージを２つの別々のイメージに分離することができない場合（ブロック４２ＧのＮｏ分岐）、この文字イメージは接触文字分離器３４８に送られる。しかしながら、現在の文字イメージの腕筋が既に試みられている場合（ブロック４２２のＹＥＳ分岐）、接触文字分離プロセスが分離器３４８によって現在の文字イメージに対して達成されているか否かについての決定がなされる（第４図のブロック４２８）。そうでない場合（ブロック４２８のＮｏ分岐）、分離器３４８はその接触文字分離プロセスを現在の文字イメージに対して達成する（第４図のブロック４３０）。接触文字分離プロセスが現在の文字イメージを２つに分層することに成功した場合（第４図のブロック４３２のＹＥＳ分岐）、その結果得られる新しい文字イメージは一度に１つずつ文字正常化器３２０の入力にフィードバックされ、これによりこれらの新しいイメージが各々上記のプロセスに供されるようにしている。接触文字分離プロセスが現在の文字イメージを２つの別々の対象に分離することができなかった場合（ブロック４３２のＮｏ分岐〕、現在の文字イメージは推測プロセッサ３５０に送られる。しかしながら、接触文字分離プロセスが既に現在の文字イメージに対して達成されている場合（ブロック４２８のＹＥＳ分岐）、分離器３４８は回避され、現在の文字イメージは直接推測プロセッサ３５０に送られる。推測プロセッサ３５０は神経網３３０によってなされた記号識別を補正することを試み（第４図のブロック４３４）、現在の文字イメージの適切な記号識別のその最上の推測を出力する（第４図のブロック４３６）、最終的な記号識別が後置プロセッサ３４０によってなされると必ず（第４図のブロック４１２、ブロック４２０あるいはブロック４３６Ｌ現在の行における次の文字イメージが文字正常化器３２０の入力に送られ（ブロック４０４）オペレーションの次のサイクルを開始する。

第３図のシステムにおけるエレメントの各々は以下に詳細に述べられる。

ス字丘側五文字分割器３００は、書類の二進イメージにおける隣接の文字を分離して個々の文字イメージを発生する。これは実質的に、画素の全てがｒオフ」である水平行又は垂直列の画素を単に探す周知のヒストグラミング技術を用いて行う。かかる行又は列は連続の「オン」画素を含む２つの隣接の対象に分離する境界として取り扱われる０例えば、書類イメージ３０５は二進法画素の垂直列及び水平行のタスクを含む第５図に示されている二進法イメージのように見え得る。「ａ」５０５及び’ｂＪ５１０のイメージに対する「オン」画素は「オフ」画素の垂直列５１５によってのみ分離される０分割器３００「オフ」画素の列５１５の定位を用いて２つの対象５０５及び５１０を分離してこれにより第６図に示されている連続の「オンＪ画素の「ｂ」対象５１０の個々の二進法文字イメージを発生する。

分割器３００によって達成されたプロセスは当技術において周知であるため、これ以上の説明はここでは必要でない。

バーノー　ユニ　ト文字パラメータユニットは、個々の文字イメージ、例えば分割器３００によって生成された第６図の文字イメージを検査し、イメージにおけるＦオンＪＮ素の最も高い列における画素の数と同時にイメージにおけるｒオン」画素の最も長い行における画素の数を計数する。これらの数はそれぞれ文字イメージの高さ及び幅である０文字パラメータユニットはまた、文字の現在の行における文字の全てに特有な第７図に示されている特定のパラメータを決定する。これらのパラメータは現在の行における文字の全てに共通なベースライン７００に対して相対的に測定される。中間ライン７０５は「ａ」等の平均的な小文字の頂部である。上昇ライン７１０は、「１」又は「ｊ」等の平均的な高い文字の頂部である。下降ライン７１５は、Ｅｊ」、「ｙ」又は’ＰＪ等の下方延長を有する文字の底部である。パラメータユニット３１０はここでは手の込んでいる必要がない当技術において周知の技術を用いて、現在の文字イメージの高さ及び幅、並びに現在の行における文字の全てに特有なベースライン７００に対する相対的な中間ライン７０５、上昇ライン７１０及び下陣ライン７１５の定位を含むパラメータの各々を測定する。

文字基準パラメータユニット３１０のオペレーションは第８図のフローダイアダラムに示されている。基準パラメータユニット３１０は分割器３００からの元の（未正常化）文字イメージを受けるだけでなく、神経網３３０によって識別された記号の対応の得点を受ける。文字イメージに対する記号の神経網の識別がそれが第４図のブロック４２０に至るテストを首尾よく通過したという意味で「最終的」であるかの決定がなされる。この決定は第８図のブロック８００に相当する。そうである場合（ブロック８００のＹＥＳ分岐）、基準パラメータユニット３１０はそのベースラインに対する相対的な現在の文字イメージの中間ライン高さ、上昇ライン高さ及び下降ライン高さく第７図に示されている）を決定する。

そうでない場合（ブロック８０００）Ｎｏ分岐）、神経網によって発生された得点が神経網によってなされた記号の選択が信転性のあるものであることを指示するのに十分高いかの決定がなされる。この後者の決定は第８図のブロック８０２に相当する。そうである場合（ブロック８０２のＹＥＳ分岐）、基準パラメータユニット３１０はそのベースラインに対して相対的な現在の文字イメージの中間ライン高さ、上昇ライン高さ及び下降ライン高さく第７図に示されている）を決定する。そうでない場合（ブロック８０２のＮｏ分岐）、現在の文字イメージは基準パラメータユニットによって回避され、この基準パラメータユニットは次の文字イメージに対して前記のプロセスを反復する。基準パラメータユニット３１０はＣ言語コンピュータプログラムによって実施された。このプログラムは基準パラメータユニット３１０に関連して上で論じられた基準値を計算するのにプログラムによって用いられるイメージから文字データ構造を形成する。加うるに、このプログラムは計数補正器３４２の且つ下で論じられる特殊記号検出器３４４の機能を実施する。

文字正常化器文字正常化器３２０は、元の文字イメージの寸法及び／又はアスペクト比を必要に応じて変化せしめる０例えば、１２列及び２４行の二進画素、例えば第９図に示されている文字イメージを含む文字イメージを認識するように訓練された神経網が本発明で用いられた。第６図の元の文字の例はこの形状に一致せず、比較に値しない。文字正常化器３２０は形状を変化せしめ、これにより神経網３３０によって要求される１２列、２４行二進法イメージに一致するようにしている。

この結果は第９図に示されており、この中で文字（ｂ）の正常化されたイメージは第６図の元の文字より高く且つ細くなっている。

笠扛岩第１０図のブロック図は第３図の神経ｍ３３０の典型的な部分を示している。

神経網３３０は約２８８個（Ｄ入力層　−Ｆ　９０５　ａ、９０５ｂ、９０５ｃ等を含ム入力層９００を有している。各入力ノード９０５は第９図の正常化された１２×２４文字イメージにおける２８８個の二進法画素の特定の１つに接続されている。

入力ノード９０５の全ては言わゆる隠された層９１５における７５本の神経９１０ａ、９１０１）、９１０ｃ等の各々に個別に接続されている。各入力ノード９０５はそれが隠された層の神経９１０の各々の１つに接続されている特定の文字イメージ画素の二進法状態に沿って単に通過する。本明細書の以下にある程度詳細に述べられるように、これらの神経９１０の各々の１つはその２８８個の二進法人力の全てを用いる演算活発化機能を達成して出力を発生する。全ての７５本の隠された層の神経９１０の出力は出力層９２５における５１本の神経９２０ａ、９２０ｂ、９２０ｃ等の各々の１つに接続されている。５１本の神経９２０の各々は神経網３３０が認識するように訓練されている５１個の英数字記号の１つに相当する。（斯かる訓練は以下に定義されよう、）５１本の神経９２０の各々の１つは隠された層９】５からの全ての７５個の出力を用いて演算活発化機能を達成しそれ自身の最終出力を発生する。この最終的な出力は得点であり且つ人力層９００において受けられた正常化された文字イメージとこの得点を発生した神経９２０に関連する記号との間の相関関係に類匍している。斯くして、入力層９００において受けられた各文字イメージに対して、５１個の得点が５１個の出力神経９２０によって出力層９２５において発生される。最も高い点を発生した出力神経に関連する記号は入力層９００において受けられた文字イメージによって表わされる記号として宣言される。

神経網の最も単純な例は、各神経によって達成される活発化機能が単にこれらの入力とこの神経のそれぞれの係数との積の和である神経網である。第１０図について説明すると、この単純な例において、二進法人力Ａｉが２８８個の入力ノード９０５の１番目のノードにおいて受けられ、そこから隠された層９１５における７５本の神経９１０の全てに転送される。隠れた層９１５における神経９１０のｊ番目の神経は人力Ａ１０１番目の入力に係数Ｂｔｊを乗算し、次に全ての２８８個の積ＡｉＢｉｊの和に等しい出力Ｃｊを発生する。斯くして、Ｃｊ＝Σ１ＡｉＢｉｊ同様にして、出力層９２５における出力神経９２０のに番目の神経は隠れた層９１５から受けられた出力Ｃｊのｊ番目の出力に係数Ｄｊｋを乗算し、次に全ての積ＣｊＤｊｋの和に等しい出力得点Ｅｋを発生する。斯くして、Ｅｋ−ΣｊＣｊＤｊｋ２８８個の二進法人力Ａｉに換算した５１個の出力得点Ｅｋを得るために、公式（１）は公式（２）に置換されて、Ｅｋ＝ΣｉΣｊＤｊｋＢｉ　ｊＡｉを得る。

斯かる単純な神経網のオペレーションは公式（３）に因って容易に要約されるが、当技術において周知であるように、各神経によって達成される単純な積の和活発化関数の直線性に因って安定していない。非直線活発化関数がその代わりに用いられる場合に安定が達成される。詳細には、中間層９１５における各神経に対する活発化関数は、Ｃｊ＝　［１＋ｅｘｐ　（−Σ１（ＡｉＢｉｊ＋θｊ））一方出力層９２５における各神経に対する活発化関数は、Ｅｋ＝　（１＋ｅｘｐ　（−Ｅｊ　（ｃｉｐｊｋ＋θｋ））以下に詳細に論じられるように、係数ＢＩＪ及びＤｊｋは既知記号組における各正常化文字イメージの２８８個の二進法画素が２８８個の人力ノード９０５に適用される神経網によって達成される訓練プロセスの過程の期間中に学習される。

この訓練プロセスの間、上記の公式（４）及び（５）における項θｊ及びθには、入力層における且つ前の層には未接続であるが次の層に「オン」信号を一定して出力する隠された層におけ仮作的神経の出力としてそれぞれ学習される。この技術は当技術において周知である。上記の光学的文字認識神経網はＣ言語コンピュータプログラムを用いて実施された。

ここで神経網の訓練を定質的に述べることにする。神経網によって認識される各記号の１２Ｘ２４文字イメージは反復学習プロセスにおいて多数回２８８個の入力ノードに適用される０文字イメージが適用されるたびに、出力層における各神経９２０の出力は所望パターンと比較されて誤差を得る。勿論所望パターンは、適用された文字イメージによって表わされる記号に割り当てられた特定の出力神経（例えば神経９２０ｃ）のみが単一の点を生成するのに対して、他の全ての出力神経はゼロの得点を生成する。に番目の出力神経に対しては、所望得点はｔ、にと表わされ一方その実際の出力得点はＯｋと表わされる。ｋ番目の出力神経に対する誤差δには以下のように定義される。

δに＝　（ｔｋ　−ｏｋ　）　（６ｏｋ　／δ（ｎ　ｅ　ｔｋ　）ここでδｏｋ／δ（ｎｅｔｋ）は上記の公式の出力神経活発化関数の実際の出力Ｏｋに対する偏重関数である。

既知文字イメージの入力層９００への各々の通用に続いて、誤差δには各出力神経９２０に対して計算され、同時に隠れた層９１５から各出力神経９２０によって受けられた７５個の入力１ｊの各々の大きさも計算される。に番目の出力神経によって用いられる係数Ｄｊｋの各々は反復量Ｄｊｋによって変化し、この反復量Ｄｊｋによって変化し、この反復蓋Ｄｊには以下のように定義される。

Ｄｊｋ＝δｋＩｊ十αＤｊｋ’ ここでδは訓練プロセスの学習速度を表わす単一よりも小さな比例定数であり、 δｋ及びＩｊは上記のように定義され、一方Ｄｊｋ“は先行反復の期間中にＤｊｋが変化する量であり、αは学習プロセスの安定に寄与する運動量項目である。

本発明においてαは約０．　９である。

隠れた層の神経９１０の係数Ｂｉｊは上記に与えられた定義と類イ以の定義を用いて同一のプロセスの期間中に学習される。しかしながら、冬服れた層の神経に対する誤差δｊは次の反復的な関係式に従って異なって定義される。

δｊ＝（δｏｊ／δ　（ｎｅｔ　ｊ）　（ΣにδｋＤｊｋ）従って、隠れた層の神経９１０の５番目の神経の係数Ｂｊｊは既知文字イメージの入力層９００への各適用と共に以下に定義される量δＢｉｊだけ変化する。

Ｂｉｊ＝δｊＡｉ公式（９）の右辺の項の各々は上記で定義されている。

訓練プロセス全体は、５１個の出力得点の所望パターンがこの文字イメージに対して達成されるまで、既知の文字イメージを神経網の人力層９００に反復的に適用し、各神経の係数を上記の公式（７）及び（９）に従って変えることにより達成される。このプロセスは、１組の英数字記号を表わす全ての文字イメージがこのように処理されるまで次の既知文字イメージに対して反復される。斯かる訓練プロセスはＣ言語プログラムを用いて実施された。

竺珠記ユ挟土器第３図の特殊記号検出器３４４のオペレーションが第１１図のフローダイヤグラムに示されている。先ず、文字基準パラメータユニット３１０は元の文字イメージにおける連続「オン」画素の対象の高さ及び幅だけでなく現在の行における全ての文字のベースライン定位に対するその位置を決定し、これらのパラメータを前に論じたメモリ３１５に記憶する（第１１図のブロック１１００）、特殊記号検出器３４４は先ず、（文字対象の幅に対する高さの）アスペクト比が０．　５より小さいか否かを決定する（第１１図のブロック１１１０）、そうである場合（ブロック１１１０のＹＥＳ分岐）、検出器３４４は文字対象が下降ラインの底部の近くに定位しているか否かを決定する（第１１図のブロック１１１５）。そうである場合（ブロック１１１５のＹＥＳ分岐）、特殊記号検出器３４４はこの文字イメージを下線記号（−）として識別する（第１１図のブロック１１２０）。

そうでない場合（ブロック１１１５のＮｏ分岐）、特殊記号検出器はこの文字イメージをダッシュ（−）として識別する（第１１図のブロック１１２５）。アスペクト比が０．　５を下回らない場合（ブロック１１１ｏのＮｏ分岐）、検出器３４４は文字対象が底部即ち下降線定位の近くにあるが否がを決定する（第１１図のブロック１１３０）、そうである場合（ブロック１１３ｏのＹＥＳ分岐）、検出器３４４は文字対象のアスペクト比が１．２５より大きいが否かを決定する（第１１図のブロック１１３５）、そうである場合（ブロック１１３５のＹＥＳ分岐）、検出器３４４はこの文字イメージをコンマ（１）として識別する（第１１図のブロック１１４０）、そうでない場合（ブロック１１３５ＯＮｏ分岐）、検出器３４４はこの文字イメージをピリオド（、）として識別する（第１１図のブロック１１４５）、ブロック１１３０の決定が否定的であった場合（ブロック１１３０のＮｏ分岐）、検出器３４４は次に文字対象のアスペクト比が１．２より大きいか否かを決定する（ブロック１１５０）、そうである場合（ブロック１１５０のＹＥＳ分岐）、検出器はこの文字イメージを単一引用符（゛）として識別する（第１１図のブロック１１５５）、そうでない場合（ブロック１１５゜のＮｏ分岐）、検出器３４４はこの文字イメージを二重引用符（”）として識別する（第Ｈ図のブロック１１６０）、これは全ての妥当な可能性を消費し従って与えられた文字イメージに対して特殊記号検出器３４４によって達成されたプロセスを含む。検出器３４４が文字イメージを特定の特殊記号として識別する時は必ず（ブロック１１２０．１１２５．１１４０．１１４５．１１５５又は１１６０におけるように）、斯かる識別は神経網３３０の出力を無視することを銘記すべきである。

特殊記号検出器３４４は神経網がこのように識別された記号に対して非常に高い得点を発生したか否かに拘わらず上記の状況の下で神経網３３０によってなされた記号識別を無視する。斯くして、特殊記号検出器３４４はある意味で神経網３３０の出力から独立している。しかしながら、特殊記号検出器３４４はそれが基準パラメータユニット３１０の出力に錬っているため神経網３３０の出力に間接的に依存する。基準パラメータユニット３１０は、ベースライン定位等の幾何学的特徴及び上記のこれに対する相対的な種々の文字パラメータを計算するために記号が信顛的に識別されることを要求する。

欠二丞補正Ｍ　゛ケース補正器３４２のオペレーションが第１２図のフローダイアグラムに示されている。ケース補正器３４２は先ず、神経網が現在の文字イメージを文字「ＰＪとして識別したかを決定する（第１２図のブロック１２００）、そうである場合（ブロック１２００のＹＥＳ分岐）、補正器３４２は元の文字イメージにおける連続「オンＪＷｉ素の対象が文字ベースラインの下に延長したか否かをメモリ３１５に記憶されている基準パラメータから決定する（第１２図のブロック１２０５）。

そうである場合（ブロック１２０５のＹＥＳ分岐）、ケース補正器３４２ばこの文字イメージを下ケース（小）文字「ｐ」として識別する（第１２図のブロック１２１０）、そうでない場合（ブロック１２０５のＮｏ分岐）、補正器３４２はこの文字イメージを上ケース（大文字）「Ｐ」として識別する（第１２図のブロック１２１５）。神経Ｍ４３３０によって識別される記号が’ＰＪでない場合（ブロック１２００のＮｏ分岐）、ケース補正器３４２は次に、文字イメージにおける連続画素の対象が低い高さを有するか否かを検定し、これにより第７図において定義されたようにこれが中間ラインの上あるいはベースラインの下に延長しないようにしている（第１２図のブロック１２２０）、そうである場合（ブロック１２２０のＹＥＳ分岐）、ケース補正器３４２は神経網によって識別された記号のケースが下ケース（小）であることを決定する（第１２図のブロック１２２５）。

そうでない場合（ブロック１２２０のＮｏ分岐）、ケース補正器３４２は神経網によって識別された記号のケースが上ケースＣ大）であることを決定する（第１２図のブロック１２３０）。

履飾器第３図の腕節器３４６のオペレーションが第１３図のフローダイアグラムに示されている。第４図に関連して前に論じられたように、現在の文字イメージに対して神経網３３０によって発生された最高得点が信鎖できるには低すぎるがあるいはアスペクト比が大きすぎる場合は必ず、この文字イメージが実際に、分割器３００が分離することができなかった文字であるという仮定がなされる。イメージにおけるこの２つの文字を分離する最初の試みは腕節器３４６によってなされる。腕節器３４６はこれらの文字が例えば第１ａ図に示されている様式で飾り付けられている場合は現在のイメージにおける個々の文字を分離することに成功しよう。

ここで第１３図に示されているオペレーションについて説明すると、腕節器３４６は画素の最左垂直列から始めることにより現在の文字イメージ（第９図にこの列の頂部から始めて（第１３図のブロック１３０５）この列を下に降りて最初のｒオンＪ画素に至る（第１３図のブロック１３１０）、腕節器３４６は次に、これら４つの先行する隣接画素の任意がｒオンＪであるかを決定し、そうである場合、任意の斯かる画素にラベルが割り当てられているかを決定する（第１３図のブロック１３１５）、これら４つの先行隣接画素は第９図の未正常化イメージの一部分の図である第１４図に示されている。現在の画素は第１４図の図において ’ＰＪとして表わされており、一方先行の隣接画素は地理的にそれぞれｒＮＷＪ、「Ｎ」、「Ｗ」及びｒｓＷ、として表わされている。これら４つの隣接画素のどれもラベルを付けられていない場合（ブロック１３２０のＮｏ分岐）、整数のリストにおける次の数が新しいラベルとして選択され（第１３図のブロック１３２５）、そしてこのラベルは第１４図における現在の画素’ＰＪに割り当てられる。（第１３図のブロック１３３０）、このラベルだけでなくこのラベルが割り当てられた「オン」画素の定位を腕節Ｈ３４６のメモリ３４６ａに記憶される（第３図参照）、他方、メモリ３４６ａの内容が、先行の隣接画素の１つ又はそれ以上が前にラベルを付けられていること（ブロック１３２０のＹＥＳ分岐）を示す場合、且つ１つの斯かるラベルのみが存在する場合（第１３図のブロック１３３５のＹＥＳ分岐）、前に割り当てられたこの１つのラベルが現在の画素に割り当てられた（ブロック１３３０）現在のラベルとして用いられる（ブロック１３４０）。

しかしながら、２つ以上の前のラベルが存在する場合（ブロック１３３５のＮｏ分岐）及び実際先行の隣接画素の異なった画素に既に割り当てられた２つ（又はそれ以上）のラベルが存在する場合（第１３図のブロック１３４５のＹＥＳ分岐）、先行のラベルは両方共同−の数に変化しく第１３図のブロック１３５０）そしてこの後者の数は現在の画素のラベルとして割り当てられる（ブロック１３３０）。

一方、この時点において腕節器３４６が３つ以上の前のラベルを見い出した場合（ブロック１３４５のＮｏ分岐）、誤差がフラグされる（第１３図のブロック１３５５）。

現在の画素「ｐ」　（第１４図）がブロック１３３０においてラベルを付けられた後、腕節器３４６はこれが第９図の未正常化文字イメージにおける画素の現在の列における「オン」画素の最後（最低）であったか否かを決定する（第１３図のブロック１３６０）、そうでない場合（ブロック１３６０のＮｏ分岐）、腕節器３４６はこの列における次の画素に下降しくブロック１３１０）、そして前記のプロセスを再開する。そうでない場合、これがこの列における最後の「オン」画素である場合（ブロック１３６０のＹＥＳ分岐）、腕節器は次に、この現在の列が文字イメージにおける最後（最古）列であるか否かを決定する（第１３図のブロック１３６５）。そうでない場合（ブロック１３６５のＮｏ分岐）、腕節器３４６は文字イメージにおける次の垂直列に向かって左方に移動しく第１３図のブロック１３７０）、新しい列の頂部に至り（ブロック１３０５）そして前記のプロセスを再開する。そうでない場合（ブロック１３６５のＹＥＳ分岐）、現在の文字イメージの処理が終了する。前記のプロセスは接続成分分析である。

次に、腕節器３４６は前記のプロセスにおいて新しいラベルを不適切に付けられた任意の副対象、例えば文字ｉ又は」の上のドツトあるいはコロン（：）またはセミコロンに）の上のドツトを再結合する（第１３図のブロック１３７５）。

この段階は、これらの副対象の１つが他方の上に完全に重なっていることを要求する。これは、その寸法（連続ｒオン」画素の数）がしきい値の数より小さい任意の斯かる副対象をそれが分離された先行の対象に再結合することにより行われる。勿論、このしきい値の数は斯かるドツトによって典型的に占有された画素の数に依存する。最終的に、腕節器３４６は連続「オン」画素の各々の別々にラベルを付けられた対象を出力する（第１３図のブロック１３８０）。

第２図に基づいて上記に述べられた本発明の代替実施例において、第２図の接続成分分析器２１０は、ブロック１３８５の付加的な段階が第１３図の破線において示されているようにブロック１３７５と１３８０の段階の間に挿入された状態で、第１３図のプロセスを達成する。ブロック１３８５の付加的な段階によって、接続成分分析器は文字イメージにおける接触記号少なくとも有意な程度まで分離することができる。詳細には、これらの対象はブロック１３７５の段階において定義された後、ブロック１３８５の接触文字分離段階は以下のように進行する。先ず、ブロック１３５０の段階において副対象として結合された各々の別々のラベルを付けられた対象の寸法が書類における記号の平均寸法と比較される（ブロック１３９０）、次に、任意の斯かる副対象は書類における記号の平均の所定のしきい値内の寸法を有すると見い出された場合、この副対象はより大きな対象から分離され、それ自身のラベルを有する個々の対象としてその前の状態に復帰する（ブロック１３９５）。

接触文字分離器ｑ概説接触文字分離器３４８のオペレーションが第１５図のフローダイアグラムに全体的に示されている。接触文字分離器３４８によって受けられた文字イメージは独特の論理シーケンスにある９個の異なった分割プロセスに順次に供される。先ず、接触文字分離器３４８は文字イメージをイメージの底部において２つのイメージに分割する時点を見い出すことを試みる（第１５図のブロック１５１０）　。

このオペレーションは本明細書において後に詳細に述べられる。この文字イメージを分割する試みが失敗すると、分離器３４８は次に本明細書において後に述べられる独特の様式でもって分割され得る例えばＣ，Ｏ，Ｇ又はＱ等の記号を現在の文字イメージ内で見い出すように試みる（第１５図のブロック１５１５）。この文字イメージを分割する後者の試みが失敗した場合、分離器３４８は本明細書において後に述べられる更に別の独特の様式でもって分割され得るＦ、Ｔ又はＥ等の記号を文字イメージ内で見い出すように試みる（第１５図のブロック１５２０）。

この一番最後の文字イメージを分割する試みが失敗した場合、分離器３４８はこのイメージが分割され得る領域を文字イメージの頂部において見い出すことを試みる（第１５図のブロック１５２５）。この試みが失敗した場合、分離器３４８はこの文字イメージをその頂部及び底部において同時に分割するように試みる（第１５１２Ｎのブロック１５３０）。この後者の試みが失敗した場合、分離器３４８は本明細書において後に述べられる更に別の独特の様式でもって分割され得るＶ又はＷ等の記号を文字イメージ内で見い出すように試みる（ブロック１５３５）。

この最後の文字イメージを分割する試みが失敗した場合、分離器３４８は本明細書において後に詳細に述べられる更に別の独得の様式でもって分割され得る００等の記号パターンを文字イメージ内で見い出すように試みる（ブロック１５４０）。

この後者の文字イメージを分割する試みが失敗した場合、分離器３４８は、本明細書において後に述べられる更に別の独特の様式でもって分割を可能にする記号Ｆを文字イメージ内で見い出すように試みる（第１５１ｍのブロック１５４５）。

この究極の文字イメージを分割する試みがまた失敗した場合、分離器３４８は、本明細書において後に述べられる対応の独特の様式でもって文字イメージを分割することのできる１組のその他の特殊条件をイメージ内で見い出すように試みる（第１５図のブロック１５５０）、この最終的な試みが失敗した場合、分離器はこの文字イメージを分割することができない（第１５図のブロック１５５５）。

第１５図のブロック１５１０．１５１５．１５２０．１５２５．１５３０．１５３５．１５４０．１５４５及び１５５０に相当する詳細なオペレーションが第１６図、１７図、１８図、１９図、２０図、２１図、２２図、２３図及び２４図を参照して本明細書に後にそれぞれ述べられる。

ここで第１５図に戻って、上で言及されたブロック１５１０乃至１５５０の分割プロセスの任意の１つが実際に文字イメージの分割に成功した場合、元のイメージから一対の分割イメージが発生される。この分割イメージの構造は第２５図に参照して下に述べられる。この結果得られる分割イメージは神経網３３０による処理のために一度に１つずつ文字正常化器３２０の入力にフィードバックされる（第１５図のブロック１５６５）、この１対の分割文字イメージから神経網３３０によって発生される結果は接触文字分離器３４８がそれが偶然に「良」記号を分割していないことを確認する検査分割オペレーション（第１５図のブロック１５７０）において分析される。ブロック１５７０の「検査分割」オペレーションは第２６図及び２７図に言及して本明細書に後に詳細に述べられる。

推摺プ旦皇１丈第３図に関連して上で述べられたように、腕節器３４６と接触文字分離器３４８が両方共現在の文字イメージを２つのイメージに分割できない場合、文字イメージは推測プロセッサ３５０に送られる。この時点において、神経ｍ３３０によってなされた記号選択の見かけ上の不信転性（低い得点によって示されている）が飾り付けられたあるいは接触している文字の分離に失敗したことに因るという仮定は不要になる。その代わり、システムはここで、神経網の記号選択の見かけの不信転性が単に、正しい記号を取得することができなかったことに因ると仮定し、更に正しい記号が実際は低得点選択の記号であると仮定する。推測プロセッサ３５０は神経網３３０によってなされた第１、第２及び第３高得点記号選択を調査し、第１選択を低得点記号選択の１つと置き換える論理的根拠を見い出すことを試みる。そのオペレーションは第２８図のフローダイアグラムに参照して詳細に述べられる。

推測プロセッサ３５０は先ず、腕節器３４６と接触文字分離器３４８が両方共現在の文字イメージを分割することを試みたかを決定する。そうである場合、推測プロセッサ３５０は更に、神経網によって選択された最高得点記号の高さが元の（未正常化）文字イメージにおける連続「オン」画素の対象の実際の高さと一致するか否かを決定する。（第２８図のブロック２８１０）、これが不一致の場合（ブロック２８１０のＹＥＳ分岐）、神経網によって識別されたより低い得点の記号選択の１つが実際は正しい選択であるという可能性が存在し、推測プロセンサ３５０はそれを見い出すように試みる。そうでない場合（ブロック２８１０のＮｏ分岐）、これらの高さが一致している場合、推測プロセッサ３５０は何も行わない（第２８図のブロック２８１５）、ブロック２８１０のＹＥＳ分岐に沿って継続すると、推測プロセッサ３５０は次に、神経網３３０によって識別された第２及び第３高得点記号選択の両方の高さが元の文字イメージにおける対象の実際の高さと一致しているか否かを決定する（第２８図のブロック２８２０）。

そうでない場合（ブロック２８２０のＮｏ分岐）、推測プロセッサ３５０は、神経＊３３０によって識別された第２又は第３記号選択の一方が元の文字イメージにおける対象の高さと一致するか否かを決定する（第２８図のブロック２８２５）。

そうである場合（ブロック２８２５のＹＥＳ分岐）、推測プロセッサは、元の文字イメージの高さと一致する高さを有するより低い得点の記号選択を識別する（第２８図のブロック２８３０）。そうでない場合（ブロック２８２５のＮｏ分岐）、推測プロセッサ３５０は第２９図のルックアップテーブルを検査して、元の文字イメージと関連する記号と一致する高さを有するどの記号が神経網によって識別される最高得点記号と混同される可能性が一番高いかを、神経網が訓練された記号組における記号の全てから決定する（第２８図のブロック２８３５）。

このようにして見い出された記号は、推測プロセッサ３５０によって文字イメージにより表わされる記号として識別される。再びブロック２８２０について説明すると、神経ｍ３３０によって識別された第２及び第３最高得点記号選択が両方共元の文字イメージに関連する高さと一致する高さを有する場合（ブロック２８２０のＹＥＳ分岐）、推測プロセッサ３５０は第２９図のルックアップテーブルに参照して、これら２つのうちどれが神経ＩＭ３３０によって識別された最高得点記号選択と一番混同され易いかを決定する（第２８図のブロック２８４０）。

この「勝者」は推測プロセッサ３５０によって現在の文字イメージに対する正しい記号として識別される。

推測プロセッサ３５０はＣ言語コンピュータプログラムによって実施された。

−の牙　なｉ″Ｂ第１５図の９個の連続接触文字分離オペレーション１５１０乃至１５５０の各々の１つをここで詳細にの述べることにする。本発明の好ましい実施例において、各文字イメージは１２Ｘ２４画素正常化イメージの２８８個の二進法画素を表わす２８８ビツトを含む二進法文字イメージワードとして第３図のシステムを進行する。第３０図に示されているように、未正常化文字イメージにおける連続７オン」画素の対象の高さ及び幅、文字イメージにおける連続「オン」画素の対象の垂直及び水平位置、文字イメージの１２列の各々における行程（未接続「オン」画素）の数、各列における強度（「オン」画素の数）、１２列の各々の１つにおける最高及び最低「オン」画素Ｃ上列及び下列のそれぞれ）の高さ及び全ての列の最高及び最低「オン」画素の現在の列イメージ（それぞれ最上及び最下）への高さを含む基準パラメータユニッ）３１０によって計算される文字基準パラメータを表わす付加的なバイトが付記されている。加うるに、それぞれ飾りひげフラグ及び分離フラグを表わす２つのビットが付記されている６両方のフラグ共初期はゼロに設定される。腕節器３４６はそれがワードを受けると必ず飾りひげフラグを１に設定する。接触文字分離器３４８は、それが文字イメージワードを受けこの文字を分割することが不可能である時は必ず分離フラグを１に設定する。最後の２つのビットの例外はあるが、前記のパラメータは接触文字分離器３４８によって達成される以下の９個のプロセスの種々のプロセスに用いられる。

底部分前ズ三皇凶第１５図の接触文字分離オペレーションは第１６図に示されている底部分割プロセス１５１０から始まる。このプロセスは、Ｃ言語プログラムの〜セクシヨンによって実施される。第１６図の底部分割プロセスは（その定位が第３図の基準パラメータユニット３１０によって前に確立されている）イメージのベースラインを探索することによりブロック１６１０から始まる。ブロック１６１Ｏの探索の目的は、連続「オン」画素の対象における極薄点（最短列高さ）を見い出すことである。斯かる対象は、数ｒ３．にベースラインに沿って結合された数「２」であり得る。斯くして、ブロック１６１０の探索は、イメージのベースラインに始まる連続「オン」画素の最短垂直列を見い出すように試みる（第７図に定義されているように）。このように定義された点における厚さが特定のしきい値を下回るかについての決定がなされる（第１６図のブロック１６１５）。そうでない場合（ブロック１６１５のＮｏ分岐）、第１６図の底部分割プロセスは、「失敗」し〔ブロック１６２０）、第１５図の接触文字分離オペレーションは次の文字分割プロセス（即ち、ブロック１５１５の分割Ｃ０ＧＱ）に至る。しかしながら、第１６図のブロック１６１５の決定が、厚さがしきい値を上回ることを見い出した場合（ブロック１６１５のＹＥＳ分岐）、第１６図の底部分割プロセスはその次の段階に至り、この段階は、文字イメージが大文字「Ｌ」でないことを確認する（第１６図のブロック１６２５）。この段階は、文字ｖＬ」を垂直の棒及び水平の棒に分割するのを避けるのに必要である０本質的に、ブロック１６２５の段階はベースラインの高さから上昇ラインの高さく第７図に定義されているように）まで延びている垂直ライン及び垂直の棒からベースラインに沿って右に延びている水平の棒の存在を探す。分割されるべき文字が文字「Ｌ」であると決定された場合（ブロック１６２５のＡＬＡＲＭ分岐）、この底部分割プロセスは失敗しくブロック１６２０）、第１５図の接触文字分離プロセスは次の分割プロセスに至る。そうでない場合、文字イメージがｒ（−、でない場合（ブロック１６２５のＯＫ分岐）、第１６図の底部分割プロセスは次の段階に進み、この段階は分割されるべき文字イメージが■、ＷあるいはＹでないことを確認する（第１６図のブロック１６３０）。本質的に、ブロック１６３０の段階はその高さが単調に変化し且つ互いの方向に延びてベースラインで合致する反対の方向に傾斜している対角線の対を探す、ブロック１６３０の段階が、文字イメージが■、Ｗ又はＹであると決定した場合（ブロック１６３０のＡＬＡＲＭ分岐）、第１６図の底部分割プロセスは失敗しくブロック１６２０Ｌ第１５図の接触文字分離プロセスは次の段階に進む。そうでない場合（ブロック１６３０のＯＫ分岐）、文字イメージはｖ、Ｗ又はＹのどれでもないと見い出され、第１６図の底部分割プロセスは継続する。この段階は、文字イメージが「Ｊ」あるいは「Ｕ」又は「ｕ」でないことを確認するためである（ブロック１６３５）。本質的に、この段階はその両端が上に延び且つベースラインから文字イメージの中間ラインに延びている垂直線に接続している文字イメージのヘースライン近くの水平の円弧、即ち文字「ｕ」に対応する円弧を探す、この段階はまた、その両端が上に延びている水平円弧及びその円弧の右端から上に延びている垂直ライン、即ち文字Ｊに対応するものを探す１文字イメージがｒＪ、、「Ｕノ又はｒ　ｕ　Ｊであると見い出された場合（ブロック１６３５のＡＬＡＲＭ分岐）、第１６図の底部分割プロセスは停止しくブロック１６２０）−第１５図の接触文字分離オペレーションは次の分割プロセスに進む、そうでない場合（ブロック１６３５のＯＫ分岐）、ブロック１６１０の段階において前に識別された１点は有効であると考えられ、第１６図の底部分割プロセスは新しい箱を構成する段階を始める（第１６図のブロック１６４０）。

ブロック１５６０の新ｉ構成プロセスは、第２５図に言及して以下により詳細に述べられるように、この有効分割点を分割イメージ対の間の境界として用いて、元の文字イメージから一対の分割イメージを生成する。この新箱構成プロセスはプログラムの一セクションにおいて実施される。この後、第１５図の接触文字分離プロセスはブロック１５１０の５ＵＣＣＥＥＤ分岐をとり、前に述べたような様式で継続する。

ＣＯＧ　ｖプロセス前記の底部分割プロセスが失敗した場合、第１５図の接触文字分離プロセスに対する次の段階にはブロック１５１５のＣ０ＧＱプロセスである。このＣｏＧＱ分割プロセスは第１７図に示されている。第１７図について説明すると、ＣｏＧＱ分割プロセスは円の左半分に略相当する円弧を探索する段階から始まる。（第１７図のブロック１７１０）、ブロック１７１０の段階はこのプログラムの１セクシヨンにおいて実施される。斯かる円弧が見い出されない場合（ブロック１７１０のＮＯＴ　ＦＯＵＮＤ分岐）、第１７図のＣｏＧＱ分割プロセスは放棄され、第１５図の接触文字分離オペレーションは次の分割プロセスに進む（第１５図のブロック１５１５のＦＡＩＬ分岐）、ここで第１７図に戻ると、斯かる円弧が見い出された場合（ブロック１７１０のＦＯＵＮＤ分岐）、次の段階は、文字イメージが文字「ｄ」又は「ｑ」であるかを決定することである（第１７図のブロック１７２０）、ブロック１７２０の段階はこのプログラムの１セクシヨンによって実施される。本質的に、ブロック１７２０の段階は円弧の上又は下の高さが円弧、の高さに対する所定の比を超える円弧の右側に接触する垂直棒を見い出すように試みる。「ｄ」又は’ｑＪが存在する場合（ブロック１７２０のＴＲＵＥ分岐）、第１７図のＣｏＧＱ分割プロセスは停止し、第１５図の接触文字分離オペレーションはブロック１５１５のＦＡＩＬ分岐をとり、次の文字分割プロセスに進む。

これは、有効文字「ｄ」又は「ｑ」を分割するのを避けるために必要である。そうでない場合（ブロック１７２０のＦＡＬＳＥ分岐）、第１７図のＣｏＧＱ分割プロセスにおける次の段階は、円弧の右手境界を見い出すことである（第１７図のブロック１７２５）、ブロック１７２５の段階はプログラムの１セクシヨンにおいて実施される０本質的に、ブロック１７２５のステップは先ず、円弧における各画素列を交差する行程の数が１つ又は２つのどちらかである故にこの文字がＣ（又はＯ）であるか否かを決定する。これが真であると見い出された場合、円弧の右手境界は列当りの行程の数が１つ又は少なくとも３つに変化する右への第１点であると考えられる。そうでない場合、ブロック１７２５の段階は、円弧における画素列を交差する行程の数が１から３まで全般的に変化する故にこの文字がＧ（又はＱ）に似ているかを決定する。後者の条件が真であると見い出された場合、円弧の右手境界は、列高さにおいて鋭い垂直の降下又は立ち上がりが存在する右への第１点であると考えられる。斯かる境界が見い出されない場合あるいは円弧において任意の列に４つ以上の行程が存在する場合（ブロック１７２５のＮＯＴ　ＦＯＵＮＤ分岐）、コノ文字ハｃ、　Ｏ，Ｇ又はＱであり得ず、第１５図の接触文字分離オペレーションはブロック１５１５のＦＡＩＬ分岐をとり、次の分割プロセスに進む、そうでない場合、右手境界が円弧に対して見い出された場合（ブロック１７２５のＦＯＵＮＤ分岐）、次の段階は現在の文字イメージを円弧の右手境界において分割することにより形成される一対のイメージを画定する新しい箱を構成することである。（第１７図のブロック１７３０）。ブロック１７３０の折箱構成段階はこのプログラムの１セクシヨンによって達成される。

この段階は上で論じられた第１６図の新ＷＪ構成段ＰＪ１６４０に相当する。第１５図の接触文字分離プロセスはブロック１５１５のＣｏＧＱ分割段階を停止し、ブロック１５１５の５（ＪＣＣＥＥＤ分岐をとって前に述べられたブロック１５６５に至る。

Ｌ工旦芳副１旦土ス前記のＣｏＧＱ分割プロセスが文字イメージを分割することができない場合、第１５図の接触文字分離オペレーションにおける次の段階はブロック１５２０のＦＴＥ分割プロセスである。このプロセスはここで第１８図に言及して詳細に述べられる。ここで第１８図について説明すると、第１段階（第１８図のブロック１８１０）は、上昇ライン高さにおいて平担な頂部−又は水平ラインが文字イメージに存在するかを決定することである。（第７圀に提起したように）。この段階は、このプログラムの１セクシヨンにおいて実施される。平坦な頂部が見い出されない場合（ブロック１ｓｉｏのＮｏ分岐）、ＦＴＥ分割プロセスが終了し、第１５図の接触文字分離プロセスはブロック１５２ｏのＦＡＩＬ分岐をとり、次の文字分割プロセスに至る。そうでない場合、平坦な頂部が存在しくブロック１８１０のＦＯＵＮＤ分岐）、次の段階は、ベースラインから平坦な頂部に上に延びている２つの垂直ラインが存在する（第１８図のブロック１８２０）−例えば、大文字「Ｍ」に接触する大文字「Ｉ」に相当する条件かを決定することである。

そうである場合（ブロックエ８２０のＹＥＳ分岐）、次の段階は、２つの列の間を見て列底部定位の底部に急激な立ち上がり一例えば、それらの頂部のみにおいて結合しているＩ及びＭに相当する条件を探すことである。斯がる条件が見い出される場合（ブロック１８３ｏのＦＯＵＮＤ分岐）、急激な立ち上がりを有する列はイメージが分割されるべき境界であると考えられる（第１８図のブロック１８４０）、斯かる立ち上がりが見い出されない場合（ブロック１８５ｏのＮＯＴ　ＦＯＵＮＤ分岐）、２つの列の間の中間点はイメージが分割されるべき垂直境界を画定する（ブロック１８５０）、ブロック１８２ｏ、１８３ｏ、１８４゜及び１８５０の段階はこのプログラムの１セクシヨンにおいて実施される。２つの垂直列が平坦な頂部の下に見い出されない場合（ブロック１８２ｏのＮｏ分岐）、この文字はＦ、Ｔ又はＥの可能性が最も高い０次の段階は、右の方を見て平坦な頂部の境界を探すことである（ブロック１８６０）、ブロック１８６ｏの段階はこのプログラムの１セクシヨンにおいて実施される。本質的に、ブロック１８６ｏのの段階は、平坦な頂部を含む上昇ライン高さく第７図）に沿って延びているラインにおける僅かな下降又は谷点のどちらか−例えば、頂部において文字Ｔに隣接している文字Ｆに相当する条件を探す、この段階はまた、列高さにおいて右への急激な下降−右方で小文字０に隣接する文字Ｆに相当する条件を探す。下降又は急激な下降のどちらかが斯くして定位されると必ず、次の段階、例えば、この定位におけるイメージを分割しても大文字Ｉの右側に隣接している有効Ｘは分割されずまた大文字■の右側に隣接している■も分割されないことを確認することである。ブロック１８７０の段階はこのプログラムのセクションにおいて実施される。本質的に、ブロック１８７０の段階はブロック１８６０の段階によって検出された下降の上及び下の両方のスペースが空（「オン」画素が欠けた）である場合にＩＸパターンを検出する。ブロック１８７０の段階はブロック１８６００段階によって検出された列高さにおける下降が中間ライン高さく第７図）の下に延び且つ下降の上のスペースが空である場合にＴＶＸパターン検出する。、１χ又はＩＶパターンが検出された場合〔ブロック１８７０のＦＯＵＮＤ分岐）、第１８図のＦＴＥ分割プロセスは失敗し、第１５図の接触文字分離オペレーションはブロック１５２０のＦＡＩＬ分岐をとり次のプロセスに至る。そうでない場合（ブロック１８７０のＯＫ分岐）、イメージはブロック１８６０の段階によって識別された境界において分割される。イメージがブロック１８４０．１８５０又は１８７０の段階の任意において分割されると必ず、次の段階はブロック１８８０の折箱構成段階となる。この後者の段階はプログラムの１セクシヨンにおいて実施される。

頂商封ｆｆ工ｉ玉前記のＦＴＥ分割プロセスが文字イメージの分割に失敗すると、第１５図の接触文字分離プロセスはブロック１５２０のＦＡＩＬ分岐をとり、ブロック１５２５の頂部分割プロセスを開始する。この頂部分割プロセスはここで第１９図に言及して詳細に述べられる。これはこのプログラムのＩセクションによって実施される。

第１段階は、イメージの頂部における上昇ライン高さく第７図）に沿って対象における最弱点を探すことである（第１９図のプロ７り２９００）。この段階はこのプログラムのセクションにおいて実施される。本質的に、この段階は上昇ラインに接触している「オン」画素の最短列を探し、この列の長さが所定量より少ないかを決定する。斯かる弱点が見い出されない場合（ブロック１９００のＮｏ分岐）、第１９図の頂部分割プロセスは失敗する。そうでない場合（ブロック１９００のＦＯＵＮＤ分岐）、このように見い出された弱点は文字イメージを垂直に分割するための可能定位であると考えられる。従って、このように定位された弱点においてイメージを分割すると大文字「Ｔ」の頂部の水平棒の左側が切れるかの決定がなされる（ブロック１９０５）。ブロック１９０５の段階はこのプログラムの１セクシヨンにおいて実施される０本質的に、ブロック１９０５の段階は文字イメージの頂部における水平ライン（第７図の上昇ライン高さ）及び特にブロック１９００の段階において発見された弱点の左のこのラインの部分を探す、ブロック１９０５の段階において、このラインのこの部分の下の領域が空（「オン」画素が欠けている）であるかについての決定がなされる。そうである場合（ブロック１９０５のＹＥＳ分岐）、水平ラインは、文字「Ｔ」の頂部を横切るラインの左側であると考えられ、従って上記で識別された弱点はイメージを分割するのに用いられる。このプロセスは、ブロック１９００の段階に戻ることにより上昇ライン高さに沿って右の方に探索を続けて対象における弱点を探し続ける。

そうでない場合（ブロック１９０５のＮｏ分岐）、次の段階は文字イメージにおける隣接のセリフを探すことである（第１９図のブロック１９１０）。ブロック１９１０の段階はこのプログラムの１セクシヨンにおいて実施される。本質的に、ブロック１９１０の段階は対象の頂部から下に短い距離に且つ中間ライン高さく第７図）の上で終端している列を探す。隣接のセリフが見い出される場合（ブロック１９１０のＦＯＵＮＤ分岐）、次の段階はこのセリフに隣接しているイメージにおける何らかの垂直棒を見い出すことである（第１９図のブロック１９１５）、次に、セリフの頂部からの距離が右の垂直棒までの方が左の垂直棒までよりも大きいかの決定がなされる（第１９図のブロック１９２０）、そうである場合（ブロック１９２０のＹＥＳ分岐）、この条件は例えばパターンＩＴに相当し、イメージはセリフのピークの左において分割される（ブロック１９２５）　、そうでない場合（ブロック１９２０のＮｏ分岐）、この条件は例えばパターンＴＩに相当し、イメージはセリフのピークの右において分割される（ブロック１９３０）　、ブロック１９１５．１９２０．１９２５及び１９３０の段階はこのプログラムの１セクシヨンにおいて実施される。ここでブロック１９１０の段階に戻ると、隣接のセリフが見い出されなかった場合（ブロック１９１０のＮｏＮＥ分岐）、ブロック１９００の段階において見い出された弱点は文字イメージを垂直に分割する正しい点であり得る。しかしながら、次の段階は、パターンＰＴ又はＰ７が存在するかを決定し、そうである場合、Ｔ又は７の頂部の左側をＰの右まで分割するのを避けるように分割点を調節することである（ブロック１９３５）、ブロック１９３５０段階はこのプログラムの１セクシヨンにおいて実施される０本質的に、ブロック】９３５のの段階はイメージの頂部における水平棒の底部（第７図の上昇ライン高さ）に追従し、中間ライン高さ〔第７図）の下に延びていない水平棒の底部の高さにおける下降を探す、任意の斯かる下降はＰＴパターン又はＰ７パターンのどちらかにおける２つの記号の間の境界に相当する。ブロック１９３５の段階は斯かる場合における下降の左側への分割点を調節する０次の段階は後尾セリフを探すことである（第１９図のブロック１９４０）、ブロック１９４０の段階はこのプログラムの１セクシ５ンにおいて実施される。後尾セリフはイメージの頂部（上昇ライン高さ）から下に延びて中間ライン高さの上の高さまで至る提案された分割点の右への非常に短い垂直ラインである。後尾セリフが見い出されない場合（ブロック１９４５のＮｏ分岐）、イメージは提案された定位において垂直に分割される。

そうでない場合、後尾セリフがこの点において見い出される場合（ブロック１９４５のＹＥＳ分岐）、頂部分割プロセスは失敗し、第１５図の接触文字分離オペレーションはブロック１５２５のＦＡＩＬ分岐をとり次のプロセスに、即ちブロック１５３０の頂部及び底部分割プロセスに至る。第１９図の頂部分割プロセスが文字イメージを分割すると必ず、ブロック１９５０の折箱構成段階を用いる。

この段階は、プログラムの１セクシヨンにおいて実施され、第１６図のブロック１６４０の折箱構成段階に相当する。

び　プロセス第１５図のブロック１５３０の頂部及び底部分割プロセスが第２０図に詳細に示されており且つこのプログラムの１セクシヨンによって実施される。ブロック１５３０の頂部及び底部分割プロセスは底部分割プロセス（ブロック１５１０）及び頂部分割プロセス（ブロック１５２５）がイメージの底部及び頂部におし）で未接続領域をそれぞれ見い出すのに失敗し、介入分割プロセスも失敗した場合に有用である。第２０図に示されている頂部及び底部分割プロセスの第１段階（ブロック２０１０）はそれを横切る２つの行程及び最小強度（「オン」画素の数）を有するイメージにおける垂直画素列を見い出すことである。この条件は、例えば、その対向セリフが最小強度の垂直列の頂部及び底部において接続されてし）るパターンＨｒ又はＩＨに相当する。この段階はこのプログラムの１セクシヨンにおいて実施される。斯かる列が定位されない場合（プロ・ツク２０１ＯのＮ。

５ＰＬＩＴ分岐）、第２０図の頂部及び底部分割プロセスが失敗し、第１５図の接触文字分離オペレーションはブロック１５３０のＦＡ■Ｌ分岐をとり次の分割プロセスに至る。そうでない場合、斯かる垂直画素列が見い出される場合（プロ・７り２０１０のＦＯＵＮＤ分岐）、第２０図のプロセスにおける次の段階は、列高さが急激に降下する点において垂直に分割され得るＸａ、Ｉａ、Ｈｘ等の文字パターンの存在を検査することである（ブロック２０２０）、この段階はこのプログラムの１セクシヨンにおいて実施される０本質的に、ブロック２０２０の段階は段階２０１０において見い出される定位の左への垂直列高さにおける急激な降下を探す、斯かる急激な降下が見い出される場合（ブロック２０２０のＦＯＵＮＤ分岐）、イメージは降下の定位において垂直に分割される（ブロック２０３０）。

斯かる降下が見い出されない場合（ブロック２０２０のＮＯＴ　ＦＯＵＮＤ分岐）。

次の段階（第２０図のブロック２０４０）は、ブロック２０１０の段階において識別される定位において先導文字を分割することを避けるために、ＰＯｌＯＴ、Ｏ３等のイメージにおける文字パターンを探すことである。ブロック２０４０の段階はこのプログラムの１セクシヨンにおいて実施される０本質的に、ブロック２０４０の段階は上昇ラインの高さの下の列高さにおける谷点又は僅かな降下を探す（第７図）。斯かる谷点が見い出される場合（ブロック２０４０のＦＯＵＮＤ分岐）、文字イメージは谷点において垂直に分割される（ブロック２０５０）。そうでない場合（ブロック２０４０のＮＯＴ　ＦＯＵＮＤ分岐）、文字イメージはブロック２０１０において識別された定位において垂直に分割される（ブロック２０６０）、第２０図の頂部及び底部分割プロセスが（ブロック２０３０．２０５０、又は２０６０の段階の任意によって）文字イメージを分割すると必ず、次の段階はブロック２０７０の折箱構成段階である。ブロック２０７０の段階はこのプログラムの１セクシヨンにおいて実施され、第１６図のブロック１６４０の折箱構成段階に相当する。

Ｍ光公割ブユ皇ス第１５図のブロック１５３０の頂部及び底部分割プロセスが失敗した場合、第１５図の接触文字分離オペレーションはブロック１５３０のＦＡＩｔ分岐をとり、ブロック１５３５のＶＷ分割プロセスに至る。ブロック１５３５の■Ｗ分割プロセスが第２１図に示されており、このプログラムの１セクンゴンにおいて実施される。第２１図のＶＷ分割プロセスにおける第１の段階は、少なくとも中間ライン高さく第７図）から下に延びベースラインに至る列高さにおける谷点又は降下を探すことである（ブロック２１１０）。斯かる谷点が見い出されない場合（ブロック２１１０（７）ＮＯＴ　ＦＯＵＮＤ分岐）、第２１図のＶＷ分割プロセスハ失敗し、第１５図の接触文字分離プロセスはブロック１５３５のＦＡ■Ｌ分岐をとり次のプロセスに至る。そうでない場合（ブロック２１１０のＦＯＵＮＤ分岐）、次の段階は、ブロック２１１０の段階によって識別された谷点が「■」形であることを証明することである（第２１図のブロック２１２０）。本質的に、ブロック２１２０の段階はそのベースラインにおける幅が所定のしきい値を下回り高さと共に単調に増加する場合この谷点がＶ形であることを決定する。この点がＶ形でない場合、第２１図のＶＷ分割プロセスは失敗する（ブロック２１２０のＮｏ分岐）。ブロック２１１０及び２１２０の段階はこのプログラムの１セクシヨンにおいて実施される。この点がＶ形である場合（ブロック２１２０のＹＥＳ分岐）、次の段階（ブロック２１３０）は、ブロック２１１０の段階によって定位される第１の点の右側への第２谷点を探すことである。この段階はブロック２１１０の段階の様式と伯た様式でもって達成される。斯かる第２谷点が見い出される場合（ブロック２１３０のＦＯＵＮＤ分岐）、次の段階は、それがＶ形に相当するかを決定することである。（ブロック２１４０）、ブロック２１４０の段階はブロック２１２０の様式に似た様式でもって達成される。ブロック２１３０及び２１４０の段階はこのプログラムの１セクンランによって達成される。第２谷点がＶ形である場合（ブロック２１４０のＹＥＳ分岐）、イメージの左側の文字はＷであると考えられ、従って第２谷から右に立ち上がる勾配の端部において分割される（ブロック２１５０）。そうでない場合、■形容が１つしかない場合（ブロック２１４０のＮｏ分岐）、イメージの左側の文字は■であると考えられ、従って第１谷から右に立ち上がる勾配の端部において分割される（段階２１６０）。ブロック２１６０の段階はこのプログラムの１セクシヨンにおいて実施される。ブロック２１３０の段階が第２谷点を見い出せなかった場合同一の段階が続く（ブロック２１３０のＮＯＴ　ＦＯＵＮＤ分岐）、文字イメージがブロック２１５０又は２１６０の段階のどちらかによって分割されると必ず、次の段階はこのプログラムの１セクシヨンによって実施され且つ第１６図のブロック１６４０の折箱構成段階に相当するブロック２１７０の折箱構成段階である。

旦ｑ分別ブ…皇玉 ■Ｗ分割プロセスが失敗した場合、第１５図の接触文字分離オペレーションはブロック１５３５のＦＡＩＬ分岐をとり、ブロック１５４０のＯＯ分割プロセスを開始する。００分割プロセスは第２２図に示されており、このプログラムの１セクシゴンにおいて実施される。この第１段階は、頂部から下に向けてその頂部に向いている対象における小さな「ｖ」形を探すことである（ブロック２２１０）。

ブロック２２１０の段階はこのプログラムの１セクシヨンにおいて実施されるや斯かる形状が見い出されない場合（ブロック２２１０のＮＯＴ　ＦＯＵＮＤ分岐）、第２２図の００分割プロセスは失敗し、第１５図の接触文字分離オペレーションはブロック１５４０のＦＡＩｔ分岐をとって次のプロセスに至る。そうでない場合、斯かるＶ形が見い出される場合（ブロック２２１０のＦＯＵＮＤ分岐）、次の段階はベースラインから上に向けて最初の小さなＶ形の頂点に向いている小さな逆Ｖ形を探すことである（ブロック２２２０）、ブロック２２２０の段階はこのプログラムの１セクシヨンによって実施される。斯かる逆Ｖ形が見い出されない場合（ブロック２２２０のＮＯＴ　ＦＯＵＮＤ分岐）、第２２図のＯＯ分割プロセスは失敗する。そうでない場合、互いの方向を向いている「正」及び「逆」Ｖ形の存在はＶ形の頂点において分割され得る。０Ｏ１ＱＣ，ＯＤ、ＯＰ等の文字パターンの存在に相当する（ブロック２２３０）、次の段階は分割されたイメージに対して新しい箱を構成することである（ブロック２２４０）、ブロック２２４０の段階はこのプログラムの１セクシヨンにおいて実施され、第１６図のブロック１６４０の折箱構成段階に相当する。

土工圀側ブ…皇λ 第１５図の接触文字分離オペレーションはＯｏ分割プロセスが失敗した場合ブロック１５４０のＦＡＩＬ分岐をとり、ブロック１５４５の小ｆ分割プロセスに至る。／ｈ　ｆ分割プロセスは第２３図に示されており、このプログラムの１セクシヨンによって実施される。第１の段階は、小ｒの左側を検出することである（ブロック２３１０）、この段階はこのプログラムの１セクシゴンにおいて実施される０本質的に、ブロック２３１０の段階は高い列であってそこから左方に延びている中間ライン高さく第７図）のあたりにおける短い棒を有するイメージにおける高い列を探す（ブロック２３１０）、斯かる特性が見い出されない場合（ブロック２３１０のＮＯＴ　ＦＯＵＮＤ分岐）、第２３図の小ｆ分割プロセスは失敗し、第１５図の接触文字分離オペレーションはブロック１５４５のＦＡＩＬ分岐をとって次のプロセスに至る。そうでない場合、斯かる特性が見い出された場合（ブロック２３１ＯのＦＯＵＮＤ分岐）、次の段階は小ｆの頂部を検出することである（第２３図のブロック２３２０）、ブロック２３２０の段階はこのプログラムの１セクシヨンにおいて実施される。本質的に、ブロック２３２０の段階はその２つの端部が下方に傾斜しており右に延び且つ上昇ライン（第７図）に接しているブロック２３１０の段階において参照された垂直ラインの頂部における小円弧を探す、この後者の特徴が見い出されない場合（ブロック２３２０のＮｏＴＦＯＵＮＤ分岐）、第２３図の小ｆ分割プロセスは失敗する。そうでない場合（ブロック２３２０のＦＯＵＮＤ分岐）、小文字ｆは見い出されたものと考えられ、次の段階はこの小ｆ右境界を見い出すことである（ブロック２３３０）、ブロック２３３０の段階はプログラムの１セクシヨンにおいて実施される。本質的に、ブロック２３３０の段階はブロック２３２０の段階において検出された円弧の右側への垂直降下あるいは円弧の下方に傾斜している右端部における上方傾斜のどちらかを探す。垂直降下は例えば文字パターンｆｅ又はｆａに相当する。上方傾斜は例えば文字パターンＴｏに相当する。どちらの場合も、垂直降下又は上方傾斜の初めは小ｆの右境界であると考えられる。しカルながら、この境界においてイメージを垂直に分割する前に、イメージのアスペクト比を検査しなければならない（プロ、り２３４０）。ブロック２３４０の段階はこのプログラムの１セクシヨンにおいて実施される。イメージが十分に広くない場合（ブロック２３４０のＮｏ分岐）、同一のイメージ内の別の文字がその後に続く小文字ｆが存在する可能性があり、第２３図の小ｆ分割プロセスは失敗する。そうでない場合（ブロック２３４０のＯＫ分岐）、文字はブロック２３３０の段階によって定位される境界において分割され、新しい分割イメージを定義する新しい箱が構成される（ブロック２３５０）。ブロック２３５０の折箱構成段階はプログラムにおいて実施される。

椎分何第１５図のブロック１５１０乃至１５４５の文字分割プロセスの全てが失敗した場合、イメージを分割するための残りの可能性はブロック１５５０の雑分割プロセスによって探索される。ブロック１５５０の雑分割プロセスが第２４図に示されており、このプログラムの１セクシヨンにおいて実施される。イメージは通常の如く左から右に分析され（ブロック２４００）、第１段階はイメージの頂部又は中間における谷点を探すことである（ブロック２４１０）、斯かる谷点はパターンｂｃ又はｏＯにおける２つの文字の接合点に相当するであろう。ブロック２４１０の段階はこのプログラムの１セクシヨンにおいて実施される０本質的に、この段階は各列の頂部高さを監視し、幾つかの列にわたって列高さにおける僅かな立ち上がりがその後に続く僅かな降下を探す。斯かる特徴が見い出された場合（ブロック２４１０のＦＯＵＮＤ分岐）、次の段階は谷の底部においてイメージを垂直に分割し、分割イメージのこの対に対して新しい箱を構成することである（第２４図のブロック２４２０）、ブロック２４２０の段階はこのプログラムの１セクシヨンにおいて実施される。しかしながら、斯かる特性が見い出されない場合（ブロック２４１ＯのＮＯＴ　ＦＯＵＮＤ分岐）、次の段階は列高さにおける急激な降下を探すことである（ブロック２４３０）、斯かる特性は、例えばパターンＤｅにおける隣接文字間の接合点に相当する。ブロック２４３０の段階はこのプログラムの１セクシヨンにおいて実施される。この特性が見い出された場合（ブロック２４３０のＦＯＵＮＤ分岐）、次の段階は識別された点においてイメージを垂直に分割し、この２つの分割イメージに対して新しい箱を構成することである（ブロック２４２０）、そうでない場合（ブロック２４３０のＮｏＴＦＯＵＮＤ分岐）、次の段階は頂部列高さにおける緩やかな立ち上がりを探すことである（ブロック２４４０）、この特性は、例えばパターンｒｔにおける２つの隣接文字間の接合点に相当する。ブロック２４４０の段階はこのプログラムの１セクシヨンにおいて実施される。斯かる特性が見い出された場合（ブロック２４４０のＦＯＵＮＤ分岐）、次の段階はこの様に識別された点においてイメージを垂直に分割し、その結果得られた分割イメージに対して新しいイメージ箱を構成することである（ブロック２４２０）。そうでない場合（ブロック２４４０のＮＯＴ　ＦＯＵＮＤ分岐）、次の段階は列高さにおける２激な立ち上がりを探すことである（ブロック２４５０）。斯かる特性は例えばパターンｇ１又はｋｈにおける隣接文字間の接合点に相当する。ブロック２４５０の段階はこのプログラムの１セクシヲンにおいて実施される。この特性が見い出された場合（ブロック２４５０のＦＯＵＮＤ分岐）、次の段階はブロック２４２０の折箱構成段階である。そうでない場合（ブロック２４５０のＮＯＴ　ＦＯＵＮＤ分岐）、次の段階はこれらの列の底部の定位における急激な立ち上がりを探すことである（第２４図のブロック２４６０）。斯かる特性は例えばパターン９ｕ又はｇａにおける隣接文字間の接合点に相当する。ブロック２４６０の段階はこのプログラムの１セクシヨンにおいて実施される。斯かる特性が見い出された場合（ブロック２４６０のＦＯＵＮＤ分岐）、次の段階はブロック２４２０の折箱構成段階である。そうでない場合（ブロック２４６０のＮＯＴ　ＦＯＵＮＤ分岐）、この最後の段階が失敗した場合、第２４図の雑分割プロセスは失敗し、第１５図の接触文字分離プロセスの全体の失敗を合図する（第１５図のブロック１５５５）。

第１５図のブロック１５１０乃至１５５０の各後続の分割プロセスにおける文字イメージの前記の幾何学的特徴に関する照会はブロック１５１０乃至１５５０のプロセスの先行するプロセスの前の照会の結果にのみ鑑みた明白な意味を有する。極端な例として、ブロック１５５０の雑分割プロセスにおいてなされた幾何学的特性に関する照会は、恐らくブロック１５１０乃至１５４５の８個の先行する文字分割プロセスの結果無しには有意な情報をもたらさないであろう。その必然的結果は、前の８個のプロセス（ブロック１５１０乃至１５４５）による多数の可能性の解消により先行のプロセスにおいて探索されない文字分割定位の雑可能性の全てを探し出すためにブロック１５５０の最終プロセスにおいてなされなければならない照会を大幅に簡略化することである。斯くして、第１５図の接触文字分離オペレーションを含む９個の文字分割プロセス（ブロック１５１０乃至１５４５）の結果は、分離を受け易い隣接文字の全ての可能なパターンの論理的に漸進的な解消であり、これによりブロック１５５０の雑分割プロセスによるその他の場合の解消という結果をもたらす。

飯血導戊段旧第１６図乃至２４図の９個のプロセスの各々は折箱構成段階で終る。この段階は第２５図に言及して詳細に述べられよう、第１６図乃至２４図の９個のプロセスのプログラムの９個のそれぞれのセクションにおける実施はプログラムの別のセクションにおいて定義されるルーチンを呼ぶことにより折箱構成段階を達成する。このルーチンは第２５図のプロセスの実施であり、第１６図乃至２４図の９個のプロセスの各々の１つにおける折箱構成段階によって達成される。第２５図の折箱構成プロセスは文字イメージが垂直に分割されるべき点の識別に応答しその境界（「箱」〕が適切に定義されている新しい対のイメージを形成する。第２５図の折箱構成プロセスにおける第１段階は規定された点においてイメージを垂直に分割することにより形成された対のイメージの各々の寸法を決定し、各折しいイメージの寸法が所定の最小しきい寸法より大きいことを確認することである（第２５図のブロック２５１０）。好ましい実施例において、この決定は新しいイメージの各々の高さが元の分割イメージの幅の少なくとも３５％であるか否かを照会することによりなされる。このテストは文字Ｊがその中間から下が垂直に分割されたかを検出する。ブロック２５１０の段階はこのプログラムの１セクシヨンにおいて実施される。両方の新しいイメージが標準にかなわない場合（ブロック２５１０のＮｏ分岐）、イメージはこの点において分割されず、第１５図の接触文字分離オペレーションは現在達成されている９個の文字分割プロセスのこのプロセスのＦＡＩＬ分岐をとり次のプロセスを開始する。そうでない場合（ブロック２５１０ＹＥＳ分岐）、次の段階は元のイメージから分割された新しいイメージの対の各々の１つが垂直に連続していることを確認することである（第２５図のブロック２５２０）、ブロック２５２０の段階はこのプログラムの１セクシヨンにおいて実施される０本質的に、ブロック２５２００段階は、互いに接続されていないイメージの頂部及び底部に対象が存在しないことを確認する。この段階は例えば文字Ｃのその中間の下の分割を検出する。２つの分割イメージにおける文字が連続しない場合（ブロック２５２０のＮｏ分岐）、元のイメージは上記で論じられたブロック２５１０のＮｏ分岐の様式でもうてこの点において分割されない。そうでない場合（ブロック２５２０のＹＥＳ分岐）、次の段階はイメージのベースラインから上昇ライン高さ即ち頂部まで全てにわたって延びていない薄い対象が存在するかを決定することである（ブロック２５３０）。この段階はこのプログラムの１セクシヨンにおいて実施される０本質的に、ブロック２５３０の段階はその高さに対して相対的な分割イメージの対のどちらかにおける対象の幅が文字ｒｌＪを示すようなものであるかを決定する。斯かる対象がイメージの頂部（上昇ライン高さ）まで全てにわたって延びていないと見い出された場合（ブロック２５３０のＹＥＳ分岐）、元のイメージは、上記で論じられたブロック２５１０のＮｏ分岐の様式でもってこの点では分割されない、斯かる特性が見い出されない場合（ブロック２５３０のＮｏ分岐）、提案された分割点は正しいと考えられる。次の段階は、イメージを分割することにより形成された各分割イメージの境界の近くの破片をきれいに取り去ることである。斯かる破片は例えば、大文字Ｉのセリフの右端を小χを含む分割文字に取り入れるべく隣接文字パターンｌｘが分割される時に形成され得る。斯かるまちがいの結果は、文字χとχ から大きなスペースでもって分離されたイメージの左端のχの上の小さな斑点を含むイメージであろう、ブロック２５４００段階はこの小斑点を捨て、イメージの頂部境界をそれがこの例において文字Ｘの頂部に隣接するまで下げることにより空のスペースを解消する。斯かる空のスペースを解消するために、ブロック２５４０の段階はイメージにおける空の行又は列を探す、ブロック２５４００段階はこのプログラムの１セクシヨンにおいて実施される。次の段階は、元のイメージを分割することにより形成された折箱詰文字イメージを発生することである（ブロック２５５０）、ブロック２５５０の段階はこのプログラムの１セクシヨンにおいて実施される。

分葱検査工旦皇込第２５図の折箱構成プロセスの完了の後、第１５図の接触文字分離オペレーションによって達成される次の段階は新しい対の分割イメージを１度に１つずつ神経！１ｉ１３２０にフィードバックしく第１５図のブロック１５６５）、次に神経網によって発生された結果を用いて、前に論しられたように、イメージが不適切に分割されているかを決定することである〔第１５図のブロック１５７０）、ブロック】５７０の分割検査プロセスは第２６図に詳細に示されている。第２６図の分割検査プロセスの目的は第１５図の９個の文字分割プロセスがどれも単一の有効記号を２つの意味のない又は誤解に導く対象に分割しないように保護することである。第１５図の９個のプロセスの各々に構築された保護手段（ブロック１５１゜乃至１５５０）の全ては、元の文字イメージが実際２つの文字を含んでいると仮定した。斯くして、実際に１つの文字しか含んでいない文字イメージの分解から保護するためには付加的な保護手段が必要となる。この保護手段は、第２６図に示されている第１５図のブロック１５７０の分割検査プロセスによって提供される。

第２６図の分割検査プロセスは元の（未分割）文字イメージのアスペクト比が所定の大きさより大きい（かなり広いイメージを示す）かを決定することによりブロック２６００のブロックにおいて開始する。そうでない場合、イメージの分割は有効であると考えられ（ブロック２６００のＹＥＳ分岐）、これ以上の検査は達成されない。一般的に、所定のアスペクト比は、神経網が分割イメージの１つをｍ又はＷとして識別する場合は２．　１であり、そうでない場合は１．５である。　（好ましくは文字イメージが文字イメージに重なる３つの水平ラインの３つの垂直交差を有する場合はこれは恐らく「ｍ」であり、アスペクト比は２．１に設定される。また、文字イメージの幅が頂部から底部まで連続的に減少すると見い出される場合、この文字は恐らく「ｗ」であり、アスペクト比は２．１に設定される。）アスペクト比がこの大きさに達することができない場合（ブロック２６００のＮｏ分岐）、次の段階は一般検査プロセスである（ブロック２６１０）。

ブロック２６１０の一般検査プロセスにおいて、イメージのこの２つの新しいイメージへの分割は、この２つの新しいイメージのどちらかに対して、神経網によってなされた最高及び第２最高得点記号選択の点の比が所定のしきい値より小さい場合は拒否される。好ましい実施例では、このしきい値は５０である。すると、ブロック２６１０の一般的検査プロセスは元の（未分割）イメージに対して神経網３３０によってなされた最高得点記号選択をそれが接触文字分離器３４８（第３図）に送られる前に、元のイメージが第２７図に示されている分割選択パターンでもって分割される２つの新しいイメージに対して神経網３２０によってなされた２つの記号選択と比較する。例えば、元のイメージが神経網によって文字Ｕとして識別され、２つの分割イメージがここで神経網３３０によって例えばＬ及びＪとして識別される場合、第２７図の分割選択パターンの１つとの一致が見い出され、分割は拒否される。このプロセスは第１５図の９個の分割プロセス（即ちブロック１５１０乃至１５５０）の任意の１つによってなされ易い予想可能な１組のまちがいが１つの記号を２つ以上の対象に分割することのないように保護する。第２７図の分割選択パターンの任意が識別される場合（ブロック２６１０のＦＡＩＬ分岐）、分割は拒否される。ブロック２６１０の一般的検査プロセスはＣ言語プログラムにおいて実施される。

２つの分割イメージが一般的検査プロセスによって達成された前記のテストの全てを合格した場合（ブロック２６１０のＰＡＳＳ分岐）、次の段階は第１５図のブロック１５１０乃至１５５０の９個のプロセスのどれが元のイメージが分割された点を識別したかに応して、ブロック２６２０における９個の個別検査プロセスの１つを達成することである。この９個の個別検査プロセスはブロック２６２０内で１．２．３．４．５．６．７．８及び９のラヘルを付けられている。ブロック２６１０の一般的検査プロセスは第１５図の全ての９個の分割プロセスに共通な単一文字分割のまちがいから保護するが、ブロック２６２０の９個の個別検査プロセスの目的は第１５図の９個の分割プロセスの個別の１つに独特の単一文字分割のまちがいから保護することである。ブロック２６２０の９個の個別検査プロセスの１つの形がこのプログラムの１セクシヨンにおいて実施される。本質的に、９個の個別検査プロセスの適用可能な１つは先ず分割イメージのどちらかがその点が第２最高得点記号選択より大きな最小因子より小さな神経網３３０（第３図）によって成される記号選択を生成する任意の分割を拒否する。この因子の大きさは、ブロック２６２０の９個の個別検査プロセスのどれが含まれるかに依る。好ましい実施例において、この因子はブロック２６２０の検査プロセス１乃至８に対しては５０であり、第１５図のブロック１５５０の雑分割プロセスに割り当てられた個別検査プロセス９に対しては１００である。イメージ対の分割がこのテストを通過すると仮定すると、ブロック２６２０（Ｄ個別検査プロセスｌ乃至９の各々の１つにおける次の段階は第２７図に示されているプロセスに類似している。詳細には、元の（未分割）イメージに対して神経網３３０によって前になされた記号選択及び元のイメージから分割されたイメージの対に対して神経網３３０によってここでなされた２つの記号選択は第２７図の表と類似の分割記号選択の９個の表の１つに３つの要員組として比較されると考えられる。これらの表の各１つはブロック２６２０の９個の個別検査プロセスの対応する１つに対して独特であり、第１５図のブロック１５７５の表１乃至９として考えられ得る。

好ましい実施例における各表の内容はブロック２６２ｏに属するプログラムのセクションから容易に推論し得るが、この９個の表の各１つの内容が以下に発生するかを説明する方が有用である。第１５図について説明すると、表１は分割プロセスの第１のプロセス、卯ちブロック１５１ｏの底部分割プロセスに割り当てられた個別検査プロセスに関連している。表１の内容は、各文字のイメージを完全な文字の形で１００回程多く入力し、文字イメージがブロック１５１ｏの底部分割プロセスによって分割された時は必ず神経網の出力を観察（ブロックｌ　５６５）することにより発生する、このように観察された優勢な分割選択は表１にマツプされる。例えば、ブロック１５１０の底部分割プロセスが文字Ａを神経網によって識別された一対の記号にＰ及び７として１００回の内５０回分割する場合、Ｐ及び７にマツプされたＡは表１に記録されたパターンである。第１５図の９個のプロセスの全てに対して同一のルーチンがとられ、それらの観測された分割記号選択は記号組の全体が１度に１つの記号ずつ試験される時に９個の個別表の対応する１つに記録される。

実際のオペレーションの期間中、元のイメージ及び分割イメージによって生成された分割記号選択パターンはブロック２６２ｏの９個の個別検査プロセスの対応する１つによって呼ばれた実際の表の内容と比較される。一致が見い出された場合（ブロック２６３０のＹＥＳ分岐）、分割が拒否される。そうでない場合（ブロック２６３０のＮｏ分岐）、分割は有効であると考えられる。

利点及だ工呈的庭里性本発明は媒体上の印刷された書類又は機械印刷された文字を読み出すための光学的文字認識システムとして有用である。

θθ勿１ツ１特表千５−５０６１１４　（１Ｂ）Ｇ　Ｇ；、（Ｄ　ｒＲＪ＼請１分升誘羞分麺誤是分饅誤差分頻゛　・　４ｎ−システム要約書所定組の記号を認識するように訓練された神経網に送られるようになっているされる。後置プロセッサは神経網によってなされた誤りの記号識別を補正する。

後置プロセッサは文字正常化に続いて神経網によって識別可能でない特殊記号及び記号ケースを識別する。低得点でもって神経網によって識別された文字に対しては、後置プロセッサは飾り付けられた隣接文字及び接触している文字を見い出に基づいて神経網によって識別される第２又は第３最高得点記号のどちらかを選択する。

手続補正書風１、事件の表示ＰＣＴ／ＵＳ９１１００６５１平成　３年特許願第５０４４８１号２、発明の名称機械印刷文字用光学的文字認識神経網システム３、補正をする者事件との関係　特許出願人住所名称　イーストマン・コダック・カンパニー４、代理人住　所　東京都千代田区大手町二丁目２番１号新大手町ビル　２０６区電　話　３２７０−６６４１〜６６４６国際調査報告

Claims

【特許請求の範囲】１．光学的文字認識システムにおいて、所定の組の記号を認識するように訓練され且つ入力及び出力であって上記入力に転送された各文字イメージが上記組における上記記号の各々の１つに対する個別の得点を与えられる入力及び出力を有する神経網、上記神経網に結合され且つ書類イメージにおける複数の連続「オン」画素を別々の対象と呼び且つ上記書類イメージからの上記対象を個別文字イメージとして分割するための手段を含む前置プロセッサ、上記神経網出力に結合され且つ上記神経網の出力に応答する手段であって所定の組の神経網出力条件の少なくとも１つに合致し上記神経網の出力を直すための手段を含む後置プロセッサを特徴とする光学的文字認識システム。２．上記前置プロセッサが、上記文字イメージの元の形を正常化するための且つ上記文字イメージの正常化された形を上記神経網入力に転送するための手段を更に特徴とする請求項１のシステム。３．上記所定組の神経網出力条件が、上記神経網出力における最高得点が上記前置プロセッサによって正常化された時のその文字イメージが上記神経網によって他の記号から区別不可能である所定組の記号の１つに相当する条件を含むことを特徴とする請求項２のシステム。４．上記他の記号が上記１つの記号の上及び下ケース形の１つであり且つ上記補正手段が、上記文字イメージの上記元の形の寸法から上記記号の上及び下ケース形のどちらが上記文字イメージによって表わされるかを決定するための手段によって更に特徴付けられていることを特徴とする請求項３のシステム。５．上記所定組の神経網出力条件が、上記出力における最高得点が不十分に高いという条件を含んでおり、上記補正手段が、上記文字イメージの元の形がその正常化された文字イメージがそこから区別不可能な上記所定記号組に含まれていない１組の特殊記号に相当する所定の小寸法より小さいか否かを検出するための手段、及び上記文字イメージから上記文字イメージによって表わされる上記特殊記号の１つの識別を決定するための手段を特徴とすることを特徴とする請求項２のシステム。６．上記前置プロセッサが飾り付けられている上記書類イメージにおける隣接記号のイメージを分離することを特徴とする請求項１の光学的文字認識システム。７．上記呼称手段が、上記書類イメージの前に走査された部分における２つの別々に呼称された対象が上記イメージの別の後に走査された部分において結合されると必ず応答してこれにより上記２つの対象を１つのより大きな対象として呼称し且つ上記２つの対象の各々の寸法を覚え、上記呼称手段は更に、唯１つのより大きな対象として呼称された複数の対象の１つが所定しきい値寸法より大きな寸法を有すると必ず応答して、これにより上記より大きな対象から上記１つの対象を分離し、これにより上記書類イメージにおける接触文字を分離することを特徴とする請求項６の光学的文字認識システム。８．上記所定しきい値寸法が上記書類イメージにおける記号の平均寸法の当りであることを特徴とする請求項７のシステム。９．光学的文字認識システムにおいて、所定組の記号を認識するように訓練され且つ入力及び出力であって上記入力に転送された各イメージに上記組における上記記号の各々の１つのための個別の得点が与えられる入力及び出力を有する神経網、上記神経網に接続され且つ書類イメージから個別文字イメージを分割するための分割手段及び上記文字イメージの元の形から上記文字イメージの正常化された形を発生するための正常化手段を含む前置プロセッサ、上記神経網出力に且つ上記正常化手段の入力に接続され且つ上記神経網出力における最高得点が複数の漸進的により時間消費的な試みの継続を達成するのに不十分である時は必ず応答して上記不十分な点に相当する選択より信頼性の高い記号選択を推論する手段を含む後置プロセッサを特徴とする光学的文字認識システム。１０．上記後置プロセッサが、その正常化された文字イメージが別の記号のイメージに対して曖昧である記号を上記文字イメージにおいて識別することにより上記試みの最初の１つを達成するための正常化補償プロセッサ手段、及び上記曖昧さ正常化プロセッサが上記文字イメージを首尾良く識別できない時は必ず、上記文字イメージにおいて共に飾り付けられている２つの記号のイメージを分離することにより上記試みの第２の１つを達成するための脱飾プロセッサ手段を更に特徴とする請求項９のシステム。１１．上記後置プロセッサが、上記脱飾プロセッサ手段が上記文字イメージを首尾良く分離することができない時は必ず、上記文字イメージにおける互いに接触している２つの記号のイメージを分離することにより上記試みの第３の１つを達成するための接触文字プロセッサ手段を更に特徴とすることを特徴とする請求項１０のシステム。１２．推測プロセッサ手段であって、（１）幾つかの低得点記号のどれが上記文字イメージの上記元の形の高さに一番近い高さを有するか、（２）上記の幾つかの低得点記号の全てが上記文字イメージに高さの点で近いと必ず、上記神経網出力において識別された上記低得点記号のどれが最高得点記号に上記神経網によって混同される可能性が一番高いかの１つに応じて、最高得点記号の代わりに上記神経網の出力において識別された幾つかの低得点記号の１つを選択するための推測プロセッサ手段を更に特徴とすることを特徴とする請求項１１のシステム。１３．上記正常化プロセッサ手段が上記神経網出力において識別された最高得点記号がその正常化された文字イメージが上記記号の上及び下ケース形に対して同じである記号である時は必ず上記元の文字イメージから上記文字イメージのケースを識別するためのケース補正手段を特徴とすることを特徴とする請求項１０のシステム。１４．上記前置プロセッサの上記分割手段は上記書類イメージにおける「オン」画素を度数分布し上記書類イメージを「オン」画素が欠けたその中の画素の行及び列に沿って分割することにより上記文字イメージを分離し、且つ上記脱飾プロセッサ手段が上記文字イメージに対して接続成分分析を達成することにより上記文字イメージにおける飾り付けられた記号を分離することを特徴とする請求項１０のシステム。１５．上記接触文字プロセッサ手段が一連の文字分離試行プロセスを所定の順序で達成するための手段であって、上記試行プロセスの各々が上記プロセスの次のプロセスにおいて不在であると仮定されている対応の組の可能な接触記号対を探索する手段によって特徴付けられることを特徴とする請求項１１のシステム。１６．上記接触文字プロセッサ手段が、（１）上記文字イメージを２つの隣接記号の底部において分離することを試み、（２）左手円弧を有する記号を隣接記号から分離するように試み、（３）頂部水平ラインを有する記号を隣接記号から分離するように試み、（４）上記文字イメージを２つの隣接記号の頂部において分離するように試み、（５）上記文字イメージをその頂部及びその底部の両方において分離することを試み、（６）互いに反対に傾斜している対角線を含む記号を隣接記号から分離するように試み、（７）隣接円弧を有する一対の記号を分離するように試み、（８）小文字ｆを隣接記号から分離するように試み、及び（９）上記の（１）乃至（８）において試みられなかった隣接記号を分離することを試みるための手段によって特徴付けられることを特徴とする請求項１４のシステム。１７．上記脱飾プロセッサ手段及び上記接触文字分離プロセッサ手段が各々、上記正常化プロセッサに上記文字イメージを分離することにより形成された一対のイメージを転送するための手段を含むことを特徴とする請求項１１のシステム。１８．上記接触文字プロセッサは、上記神経網出力に第２パターンを得るべく上記正常化プロセッサに上記文字イメージを分離することにより形成された一対のイメージを転送するための手段、及び上記神経網の上記出力における上記第２パターンを単一の既知記号の文字イメージを分割する上記一連の試行プロセスの対応の１つに典型的な所定の出力パターンと比較するための誤差検査手段を更に特徴とすることを特徴とする請求項１５のシステム。１９．上記所定出力パターンが、上記試行プロセスの対応の１つによって分離された単一記号の連続イメージを上記神経網入力に転送することにより確立された１組の所定出力パターンの１つであることを特徴とする請求項１８のシステム。２０．上記接触文字プロセッサが、１組の既知一般誤差パターンと、（ａ）上記文字イメージに対して上記神経網によって識別された最高得点記号及び（ｂ）上記文字イメージを分離することにより形成された上記対のイメージに対して上記神経網によって識別された記号を含むパターンを比較するための一般的検査手段によって更に特徴付けられることを特徴とする請求項１８のシステム。２１．上記組の既知一般的誤差パターンが既知シンボルの２つの部分への分割に相当することを特徴とする請求項２０のシステム。２２．所定組の記号を認識するように訓練され且つ入力及び出力であって上記入力に転送された名文字イメージに上記組における上記記号の各々の１つに対して個別得点が与えられる入力及び出力を有する神経網を含む光学的文字認識システムにおける、光学的文字認識を達成するための方法であって、書類イメージにおける複数の連続「オン」画素を別々の対象として呼称し且つ上記書類イメージからの上記対象を個別文字イメージとして分割することを更に特徴とする前置処理段階、上記神経網の出力が所定の組の神経網出力条件の少なくとも１つに合致した時は必ず検知し、上記検知手段に応答して上記神経網の出力を補正することを更に特徴とする後置処理段階を特徴とする方法。２３．上記前置処理段階が、上記文字イメージの元の形を正常化し、上記文字イメージの正常化された形を上記神経網入力に転送することを更に特徴とする請求項２２の方法。２４．上記所定組の神経網出力条件が、上記神経網出力における最高得点が上記前置プロセッサによって正常化されている時のその文字イメージが他の記号から上記神経網によって区別不可能である所定組の記号の１つに相当するという条件を含むことを特徴とする請求項２３の方法。２５．上記他の記号が上記一方の記号の上及び下ケース形の一方であり且つ上記補正段階が上記記号の上記上及び下ケース形のどれが上記文字イメージによって表わされるかを上記文字イメージの上記元の形の寸法から決定することを含むことを特徴とする請求項２４の方法。２６．上記所定組の神経網出力条件が上記出力における最高得点が不十分に高いという条件を含んでおり、上記補正段階が、上記文字イメージの元の形がその正常化文字イメージがそこから区別不可能である上記所定記号に含まれていない１組の特殊記号に相当する所定の小寸法より小さいかを検出すること、及び上記文字イメージによって表わされる上記特殊記号の１つの識別を上記文字イメージから決定することに特徴付けられることを特徴とする請求項２３の方法。２７．上記前置処理段階が飾り付けられている上記書類イメージにおける隣接記号のイメージを分離することを更に特徴とすることを特徴とする請求項２２の方法。２８．上記呼称段階が、上記書類イメージの前に走査された部分における２つの別々に呼称された対象が上記イメージの別の後に走査された部分において結合される時の第１の検知、上記第１検知段階に応答して上記２つの対象を１つのより大きな対象として呼称すること、上記２つの対象の各々の寸法を覚えること、１つのより大きな対象として呼称されている複数の対象の１つが所定しきい寸法より大きな寸法を有する時の第２の検知、及び上記第２検知段階に応答して上記より大きな対象から上記１つの対象を分離してこれにより上記書類イメージにおいて接触文字を分離することを更に特徴とすることを特徴とする請求項２７の方法。２９．上記所定しきい寸法が上記書類イメージにおける記号の平均寸法の当りであることを特徴とする請求項２８の方法。３０．所定組の記号を認識するように訓練され且つ入力及び出力であって上記入力に転送された各イメージに上記組における上記記号の各々の１つのための個別の得点が与えられる入力及び出力を有する神経網を特徴とする光学的文字認識システムにおける、光学文字認識を達成するための方法であって、個別文字イメージを書類イメージから分割し且つ上記文字イメージの正常化された形を上記文字イメージの元の形から発生し且つ上記正常化さた形を上記神経網の上記入力に転送することを含む前置処理段階、上記神経網出力における最高点が不十分である時は必ず検知することを含む後置処理段階、及び上記検知段階に応答して上記不十分な点に対応する選択より信頼性の高い記号選択を推論するために複数の漸次により時間消費的な試みの継続を達成する段階を含むことを特徴とする方法。３１．上記後置処理段階の上記達成段階が、その正常化された文字イメージが別の記号のイメージに対して曖昧である記号を上記文字イメージにおいて識別することにより上記試みの第１の試みを達成すること、及び上記第１の試みが上記文字イメージを首尾良く識別することに失敗した時は必ず上記文字イメージにおいて共に飾り付けられている２つの記号のイメージを先ず分離することにより上記試みの第２の試みを達成することを更に特徴とすることを特徴とする請求項３０の方法。３２．上記後置処理段階が、上記第１分離段階が上記文字イメージを首尾良く分離することに失敗したときは必ず上記文字イメージにおいて互いに接触している２つの記号のイメージを第２に分離することにより上記試みの第３の試みを達成することを更に特徴とすることを特徴とする請求項３１の方法。３３．推測処理段階であって、（１）低得点記号のどれが上記文字イメージの上記元の形の高さに最も近い高さを有すか、（２）幾つかの低得点記号の全てが上記文字イメージに高さの点で近い場合、上記神経網出力において識別された上記低得点記号のどれが上記最高得点記号と上記神経網によって混同される可能性が大きいかに応じて、最高得点記号の代わりに上記神経網の出力において識別された上記幾つかの低得点記号の１つを選択することを特徴とする推測処理段階を更に特徴とする請求項３２の方法。３４．上記試みの第１の試みを達成する段階が、上記神経網出力において識別された最高得点記号がその正常化された文字イメージが上記記号の上及び下ケース形に対して同一である記号である時は必ず上記元の文字イメージから上記文字イメージのケースを識別することを特徴とすることを特徴とする請求項３１の方法。３５．上記分割段階が、上記書類イメージにおいて「オン」画素を度数分布し「オン」画素が欠けているその中の画素の行及び列に沿って上記書類イメージを分割することを更に特徴とし、及び上記第１分離段階が上記文字イメージに対して接続成分分析を達成することを特徴とすることを特徴とする請求項３１の方法。３６．上記第２分離段階が、一連の文字分離試行プロセスを所定の順序で達成することを特徴とし、上記試行プロセスの各々が上記試行プロセスの次のプロセスにおいて不在であると仮定された対応する組の可能な接触記号対を探索することを含むことを特徴とする請求項３２の方法。３７．上記一連の試行プロセスが、（１）２つの隣接記号の底部において、上記文字イメージを分離することを試みること、（２）隣接記号から左手円弧を有する記号を分離することを試みること、（３）隣接記号から頂部水平ラインを有する記号を分離することを試みること、（４）２つの隣接記号の頂部において上記文字イメージを分離することを試みること、（５）その頂部及びその底部の両方において上記文字イメージを分離することを試みること、（６）隣接記号から互いに反対に傾斜している対角線を含む記号を分離することを試みること、（７）隣接する円弧を有する一対の記号を分離することを試みること、（８）隣接記号から小文字ｆを分離することを試みること、及び（９）上記の段階（１）乃至（８）において試みられていない隣接記号を分離することを試みることを特徴とすることを特徴とする請求項３５の方法。３８．上記第１及び第２分離段階が各々、上記文字イメージを分離することにより形成される一対のイメージを正常化し且つ上記神経網入力に転送することを更に特徴とすることを特徴とする請求項３２の方法。３９．上記第２分離段階が、上記神経網出力に第２パターンを得るべく上記文字イメージを分離することにより形成された一対のイメージを正常化し且つ上記神経網入力に転送すること、及び上記神経網の上記出力における上記第２パターンを単一の既知記号の文字イメージを分割する上記一連の試行プロセスの対応するプロセスに典型的な所定の出力パターンと比較することを特徴とする誤差検査プロセスを更に含むことを特徴とする請求項３６の方法。４０．上記所定出力パターンが上記試行プロセスの対応する１つによって分離される１つの記号の連続イメージを上記神経網入力に転送することにより確立された１組の所定出力パターンの１つであることを特徴とする請求項３９の方法。４１．上記第２分離段階が、１組の既知の一般的誤差パターンと（ａ）上記文字イメージに対して上記神経網によって識別される最高得点記号及び（ｂ）上記文字イメージを分離することにより形成される上記イメージの対に対して上記神経網によって識別される記号を含むパターンとを比較することを含む一般的検査段階を更に特徴とすることを特徴とする請求項３９の方法。４２．上記組の既知の一般的誤差パターンが既知記号を２つの部分に分割することに相当することを特徴とする請求項４１の方法。