JPS60167074A - 文字認識の方法および装置 - Google Patents

文字認識の方法および装置

Info

Publication number
JPS60167074A
JPS60167074A JP59176542A JP17654284A JPS60167074A JP S60167074 A JPS60167074 A JP S60167074A JP 59176542 A JP59176542 A JP 59176542A JP 17654284 A JP17654284 A JP 17654284A JP S60167074 A JPS60167074 A JP S60167074A
Authority
JP
Japan
Prior art keywords
character
test
parameters
characters
microprocessor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59176542A
Other languages
English (en)
Inventor
ワーナー シー・スコツト
スチーブン エヌ・ピーターセン
ケイス エイ・ブラントン
ラモン ヘルムズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Texas Instruments Inc
Original Assignee
Texas Instruments Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Texas Instruments Inc filed Critical Texas Instruments Inc
Publication of JPS60167074A publication Critical patent/JPS60167074A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 この発明は光学式文字認識(OOR)の分野に関するも
のである。
一般に譲渡されているタイプされたテキストを読む方法
を説明する関連出願は次の通りである。
発明者ワーナー・シー・スコツト(Warnar O。
Boott)による1980年1月28日出願の出願第
115,986号;発明者ワーナー・シー・スコツトに
よる1980年5月27日出願の出願第153,342
号;発明者ワーナー・シー・スコツトによる1986年
6月1日出願の出願第501,037号;発明者ワーナ
ー・シー・スコツトによる1986年8月26日出願の
出願第527,152号;発明者ワーナー・シー・スコ
ツト、ケイス・ニー・シラントン(Ksith A。
Blanton )、スチーデン・ビーターソ:/ (
Stevsnpeterson)、およびジーンーヘル
ムス(Gene■θ和θ)による1986年8月26日
出願の出願第527,702号;発明者スチーデン・ピ
ークーンン、ケイス拳テラントンおヨヒシーンーヘルム
スによる出願第527,151号;発明者ケイス・プラ
ントン、ステーデン・−一ダーリンおよびジーン・ヘル
ムスによる1983年B月26F3出Hの出願第527
,150号;発明者ダイス・シラントン、スチーデン・
ビーターンンおよびジーン◆ヘルムスによる1986年
8月26日出願の出願第527,731号;発明者スチ
ーデン・ピーダーリン、ケイス・プラントンおよびジー
ン・ヘルムスによる1986年8月26日出願の出願第
527,155号;発明者チャールスやレイ(OhIL
r’les Wray)による1986年8月26日出
願の出願第527,155号;発明者ワーナー・シー・
スコツトによるTl−9218;発明者ワーナー−シー
・スコツトによるTl−10204;発明者ワーナー−
シー・スコツトによるTニー10193゜上記出願は一
般に譲渡されており、ここに参考のため包含される。
現在市販されているOOR装置には多くの不利な点があ
る。それらは極めて高価で、7,000ドルから100
,000 )”ルに及び、また大量の電子ハードウェア
を使用する。また多くは時間のかかる文字調和法を使用
する。バイテクノロジー誌の1986年2月号の第65
負から第40頁までに1ハープ−ゾロディ(Hθrb 
Brody)は[質の向上を読む機械」という件名の記
事でOOR装置を検討している。
現在市販されているOOR装置は、ドツト・マトリック
ス・プリントまたは質の悪い文字を読むのに効果的では
ない。ドツト・マトリックス伊プリントは多くの位置で
不連続であり、かつ標準のタイシライタでタイプされた
文字よりも認識について問題が多い。追加の問題は、質
の悪いプリントによりまたは何度も複写された文字t−
認識することにより生じる。質の悪いプリントまた紘何
度も複写された頁にある多くの文字は、その中に不連続
な部分がある。今日市販されているOOR装置は、ドツ
ト・マトリックス・プリント、質の悪いタイプ、および
極端に劣悪なコピーを適切に処理しない。
本発明の1つの目的は、不連続文字を読み得る改良され
たOCR機械を提供することである。
本発明のもう1つの目的は、ドツト・マトリックス・プ
リントを読む方法を提供することである。
本発明のもう1つの目的は、多くの位置で不連続な質の
悪いテキストまたは何度も複写された質の悪いテキスト
を読む方法を提供することである。
本発明のもう1つの目的は、本発明の方法を実行し得る
改良され九〇OR機械を提供するととである。
本発明のもう1つの目的は、タイプライタ・テキスト、
ドツト・マトリ・ツクス・プリント、質の悪いテキスト
および複写されたテキストを含む多くの形式のテキスト
ヲ高速かつ正確に処理し得る改良され九〇OR装置を提
供することである。
感光走査器を用いて印刷済のテキストを読み、走査され
た頁をバッファ記憶装置に入力する装置および方法が開
示されている。バッファ記憶装置は、記憶されたデータ
を分析しかつ頁にある各文字、数字また線字についてA
301工コード文字を出力するマイクロプロセッサ装置
によって呼び出される。かくて、タイプされた頁は語処
理その他のコンピュータ記憶装置に入力され、手動タイ
ぎングを必要としない。
本発明は光学式文字認識(OCR)用のデータを発生さ
せる方法に特に指向されている。文字はイメージヤによ
って受けられ、ディジタル化されて、バッファ記憶装置
に送られる。バッファ記憶装置内のデータは、試験文字
を巡回する順序で読まれる。。文字の周囲を表わすデー
タのみが読まれる。
巡回の際、高さ、幅、周囲、面積、カリパス、プログラ
ム可能ペネトレータおよび波形のような文字パラメータ
がめられる。文字パラメータは基準文字パラメータと比
較されて、文字と調和する基準文字のkBOXエコード
が出力として提供される。
印刷済の頁の文字は高さと幅とを持つ二次元文字でおる
が、上から見たとき奥行はない。2つの寸法は相互に関
して変化するので、各文字の曲線および形状は1つの寸
法の増減に対応し、その間他の寸法は同じに保たれて、
増減する。例えば、1つの側が平らで他の部分が湾曲し
ている文字rBJの形状は、高さが平らな側に沿って変
化しかつ高さと幅が相互に湾曲した場所で変化するので
、幅の寸法を一定にすることによって決定される。文字
を表わす2つの寸法は、文字を表わす1組の一次元機能
に変換される高さはただ1つの一次元機能として隔離さ
れる。幅もただ1つの一次元機能として隔離される。文
字の2つの寸法がその文字で変化するにつれてその寸法
間の関係を表わす1つの寸法アレイである1組の輪郭番
号が決定される。本発明の1つの実施例では、文字の二
次元機能は光学式文字認識(OOR)を実行し得るよう
に対応する一次元機能に変換される。二次元機能を一次
元アレイに変換する本発明の1つの実施例は、文字の周
囲を巡回することによる。巡回からめられたパラメータ
は、各基準文字の独自な1組のパラメータを供給するよ
うに一次元アレイに配列される。
00R用のデータを発生させる1つの特定な方法は、調
査される文字の周囲のみを調べることによって行われる
。文字の周囲を表わすデータのみが英語に現在利用され
るすべての字体のあらゆる可能な文字を完全に定めるよ
うに調査されかつ試験される必要のあるすべてのデータ
であるような新しい方法が提供される。文字の周囲から
のデータは、調査を受ける文字に関するパラメータを提
供するようにいく通りにも使用される。これらのパラメ
ータは、今後使用する基準文字を定めるティーチング・
セット(teaching 5et)として使用される
ことがある。これらのパラメータは、OCRの最終段階
の一部として調査中の文字を識別するために基準文字と
比較するのにも使用されることがある。試験文字の周囲
に関するデータのみを試験する新しい方法は巡回でおる
。巡回法は重要な時間節約およびノ・−ドウニア加法で
おり、しかも巡回される文字に関する大量のデータを抽
出するのに極めて強力である。
不連続文字の巡回を行う新しい方法が提供される。文字
を量化するピクセルによって定められる通り文字に不適
当なギャップその他の切断があるとき、文字は不連続と
考えられる。ここに使用されるOODイメージヤにより
、ピクセルはブラックまたはホワイトのいずれかでおり
、ブラック・ピクセルはドツト・マツプに1として表わ
され、ホワイト・ピクセルは0として表わされる。本発
明の状況では、ブラックは文字の色でありかつホワイト
は文字が印刷されたり書かれたりする背景頁の色である
○CDイメージヤが頁からデータを入力するとき、の量
はぎクセルがシラツクであるという表示をトリガするに
は余りにも少なく、シたがってホワイト・ピクセルはこ
の位置から入れられる。これは全境界に沿って実際に連
続な文字に多くのイヤツゾを起こさせる。追加の1つの
問題は、文字が実際に不連続であってヤヤツゾが頁の印
刷された文字に起こるときに生じる。不連続テキストが
走査器によって読まれるとき、ギャップはホワイトとし
て示され、文字の部分としては示されない。ビット・マ
ツプ内のセルの対応するアドレス位置は、頁にきれいな
文字が印刷されたときに文字が置かれる場合の1ではな
く、0によって表わされる。
このように不連続なテキストを読む新しい方法が提供さ
れる。しばしば不連続である特定な形のテキストは、ド
ツト・マトリックス・プリントでおる。ドツト・マトリ
ックス・プリントが他の質の悪いテキストと同じく良好
に読まれる方法が提供される。
増加した試験セル領域を用いる巡回は、ドツト・マトリ
ックス・ゾリンクによって印刷されたもののようなビッ
ト・マツプに記憶された不連続文字からのデータを果状
するのに用いられる。試験セル領域はピクセルをさがす
ために増加され、それが最小許容ぎクセル・ヤヤツゾ範
囲にあれば、それを同じ文字の一部と考える。試験の順
序は、各可能ぎクセルを読みかつ巡回中にエンドレス◆
ルーゾに入らないように設計されなければならない。
試験の1つの順序は、基準セルに隣接する行にあるセル
から始めて基準セルに隣接する列にあるセルを試験し始
め、そして最小許容ぎクセル・ギャップ範囲による列に
あるセルの所望数が試験され終るまで、列全体に清って
最も新しく試験されたセルに隣接するセルを試験するこ
とである。最も新しく試験されたセルに隣接する各列は
、所望数の列が最小許容ヤヤツゾ間隔をえるように試験
され終るまで説明された順序で試験される。試験される
セルの最後の組は、基準セルに隣接するセルで始まりか
つ最も新しく読まれたセルに隣接する各セルを試験する
基準セルと同じ行にある。これは、−ット・マトリック
ス・プリントまたは質の悪いプリントのような不連続テ
キストを認識し得る方法で多る。本発明の方法を実行す
る装置は光学走査器、記憶装置、テンプレート基準文字
、および出力装置を含み、認識されたサンプル文字のA
SOエエコードを与える。
本発明の方法により提供されるもう1つの新しい機能は
、巡回法を使用して文字の輪郭の形状を表わす輪郭番号
を発生させることである。本発明は、高さ、幅、周囲、
および周囲の面積のようないろいろなパラメータが文字
の周囲からのデータのみを用いてめられ、また文字の巡
回中に果状されたデータを用いてめられる方法をも提供
している。
本発明の別の実施例では、各側の選択された位置で9個
のカリパス番号が決められ、合計56個のカリパス番号
が決められる。試験されている文字の66個のカリパス
番号は基準文字の66個のカリパス番号と比較され、各
番号間の差は重み付きの値を与えられ、比較の結果は適
当に重みを付けられた66個のカリパス番号のすべての
間の差を表わす数値の出力として提供される。最低値を
持つ基準文字は、試験されている文字と調和されるもの
と決定される。本発明の実施例では、第1組のパラメー
タは試験される文字の高さおよび幅のみから成り、第2
組のパラメータは66個のカリパス番号から成る。この
代替実施例では、文字の周囲、周囲内の面積またはディ
ジタル波形は利用されていない。
この発明のもう1つの代替実施例は、プログラム可能な
ペネトV−夕の決定である。プログラム可能ペネトレー
タは、アルファベットの1個の文字ごとに異なるカリパ
ス操作として操作員によってめられ、かつその文字を第
1組のパラメータの試験が終った後で混同されるおそれ
のある任意な他の文字から区別するに足る1回のカリパ
ス試験にすぎない。プログラム可能ペネトレータは、高
さ、幅、周囲、および周囲内の面積の4個のパラメータ
の後で第2組のパラメータとして使用される。
言うまでもなく、これら5組の各パラメータは相互に独
立して使用されたり、他の組の任意なパラメータと組み
合わせて使用され、完全な文字認識を実行する。好適と
思われるパラメータの組合せは、試験される文字の組、
調査されるプリントの質、文字認識のために許容される
時間、組の中にある文字の数、および多くの他の可変機
能に左右されるであろう。英語のアルファベットその他
の言語における異なる字体については、パラン〜りの異
なる組合せが一段と有効であることが判明している。
本発明の方法は数段階から構成されている。これらの段
階の若干は単独で使用されたり、他の段階といろいろに
組み合わせて使用されたりして、00R法に役立つデー
タを作る。文字の巡回からのデータは、例えにティーチ
ング・セット、すなわち試験セット、または新しい基準
文字データとして、多くの事柄について役立つことがお
る。このモードでは、作られたデータは試験文字km識
するのに用いられず、00Rに関連のある他の目的で使
用される。別のモードで社、作られたデータL文字認識
のためKは不十分かもしれないが、それでも極めて役に
立つことがある。例えば、段階は文字の高さを規定し得
るとともに、どの文字が調査されているかにりいては判
然としないがそれでもすべての文字または異なる字体を
除去する場合のような多くの面で極めて役に立つデータ
を与える。同様に、1回のカリパス試験からのデータは
、どの文字が調査されているかについては判然としない
が調査されていない文字を除去するのには利用される。
回路および作動方法を含む特定の実施例に関する本発明
の詳細な説明が以下に与えられる。実施例の多くが1択
的に示されているのは、おのおのが異なる使用または状
況で有利なことがあるからである。言うまでもなく、各
実施例は他によっては特定の状況で与えることのできな
い利点を備えている。
本発明のハードウェアは適応性を念頭に置いて設計され
ている。これは本発明の回路の利点の1つである。これ
は、文字U識の多くの異なる方法がこの回路構造または
それによく似た回路構造によって実行されることを意味
する。例えば、本回路設計は高さ、面積、周囲、および
幅、またはディジタル波形や、カリパスや、プログラム
可能ペネトレータや、その任意な組合せを用いて文字認
識を与え、回路またはハードウェア配線を少しも変える
必要がない。これは、その使用がハードウェア回路に直
接関連される多くの先行技術の装置にはるかに勝る。こ
こに説明されるハードウェア回路は特にソフトウェアに
適合する。例えば、この回路はここには説明されないが
0Oft用のマトリックス調和法を実行するのKおそら
く使用されるであろう。OOR’i実行する多くの方法
で本回路の普遍的な有効さは特に重要でおる。
第1図は光学式文字認識装置を示すブロック図である。
平面走査器140は、マルチプレクサ40を経てピクセ
ル・バッファ28ムおよび28Bに直結されている。ピ
クセル・バッファ28ムおよび28Bは、本実施例では
TM139995であるマイクロプロセッサ90に接続
されている。マイクロプロセッサ90は、端子144お
よびプログラム記憶装置146に接続されている。マイ
クロプロセッサ90は、インターフェース98’e経て
第2マイクロプロセツサ148にも接続されている。本
実施例では第2マイクロゾロセツサ148はTMS 3
20であり、プログラム記憶装置116およびテンゾレ
ート記憶装置118に接続されている。第1図は、第1
図に示される通り第2図から第5図までにさらに詳しく
示されている。
第1図の装置は次の通り作動する。平面走査器からのデ
ータはディジタル化されて、次にマルチプレクサ40に
よって迦択される通りピクセル・バッファRAM 28
ムまたは28Bに送られる。マイクロプロセッサ90は
そのとき情報を含むRAMを呼び出し、マイクロプロセ
ッサ90が1つのピクセル・バッファから読出している
間マルチプレクサは書込みと読出しとが相互に同時に可
能となるように書込み用の他のピクセル・バッファを選
択するであろう。マルチプレクサはマイクロゾロセッサ
90と共動して、1つのぎクセル・バッファに書き込む
間にマイクロプロセッサ90がいつでも他のピクセル・
バッファから読み出すようにする交互する。マイクロプ
ロセッサ90は端子144により制御され、プログラム
記憶装置とインターフェース接続する端子144によっ
て変えられるプログラム記憶ステップを有することがで
きる。マイクロプロセッサ90は、プログラムによって
制御されるような試験文字の高さ、幅、周囲、周囲内の
面積、波形などを含むことがある所望のパラメータを計
算する。所望の情報がピクセル・バッファ内の文字から
全部抽出されてから、マイクロプロセッサ90はインタ
ーフェースRAM98をパラメータでロードするととも
に1データのそのプログラムを開始するようにマイクロ
プロセッサ148に信号を送る。マイクロプロセッサ1
48はインターフェース98から試験文字のパラメータ
・データを受けるとともに、ゾログラムによって命じら
れた通シ一定の機能を果たす。マイクロプロセッサ14
8は基準文字として後で使用するデータを記憶すること
ができ、またマイクロプロセッサ148はテンプレート
記憶を変更する他の基準文字との比較のためにそれを記
憶することができ、またはマイクロプロセッサ148は
ることができる。試験文字がテンゾレート記憶装置11
8の中の基準文字と調和されるようなゾログラムである
ならば、マイクロプロセッサ148はその文字のA80
エエコードをインターフェース98に送り返して、比較
の結果がインターフェースにロードされた旨の信号全マ
イクロプロセッサ90に送る。マイクロプロセッサ14
8が出方を供給するために試験文字からのデータを比較
していた間、マイクロプロセッサは次の試験文字の高さ
、幅、周囲などのような所望のパラメータを計算してい
た。マイクロプロセッサ9oは次の文字を完成して、そ
のデータをインターフェース記憶装置に転送し、次に試
験したばかりの文字のhsoxxコードを検索する。か
くて、マイp a 7’ 。
セッサ90は平面走査器14o1マルチプレクサ40を
含む装置の全部品に関するタイミングおよび転送を制御
するとともに、インターフェース98およびピクセル・
バッファによる情報の送出を制御する。マイクロプロセ
ッサ9oがインターフェース9Bから文字のA日0工I
コードを受信すると、それは走査中のテキスト行にその
位置を持つ文字と調和しかつそれを行中の他のすべての
文字が読み出されて識別されるにつれてそれらの文字と
の正しい位置関係により配列されるそれらの端子バッフ
ァに送る。第1テキスト行がマイクロプロセッサ90に
よって走査された後に、平面走査器はデータ全マルチゾ
レクサに入れ続け、次のテキスト行は同じステップで読
まれる。この工程社全頁が読まれるまで継続される。
装置および回路の作動は、第2図から第5図までに示さ
れる通りこれから詳しく説明さ瓦る。
平面走査器140は、その上に置かれる頁に印刷された
文字がライトによって走査されかつそれらの像がOOD
アレイおよび作像装置150に表ゎされるように、ライ
トおよびミラーの装置を持つ既知の方法を用いて作られ
ている。OGD作像装置はタイプTO101の、テキサ
ス・インスツルメンツ社により販売されかつ追録Iとし
て添付されここに参考として包含される添付明細書に詳
しく説明されるような1728X100D線形像センサ
であることができる。走査機械装置151はOOD作像
装置150に接続されている。COD作像装置150の
出力は、第2図に示されるような構成部品および構造物
を有する回路152によって、2進データに変換される
。回路152は、図示のような適当な位置に接続される
抵抗器およびコンデンサを持つトランジスタ154を含
む。トランジスタ154は、トランジスタ160に接続
される抵抗器R5に給電するトランジスタ156および
158に接続されている。トランジスタ160はインバ
ータ162および164に接続されて出力を供給する。
インバータ162の出力は、OOD作像装置150によ
って走査された像を表わす2進コードを提供するD7リ
ング・70ツブ166に供給される。D71Jツブ・7
0ツブ166は、図示のようなROKから来るライン1
68にも接続されている。その出力はライン110に供
給され、また反転出力はライン171に供給される。回
路152u、所望の場合使用できるアナログ出力112
をも供給する。回路152は、クロックからの接続、X
OKと反転XOK、 ROKと反転ROICのようなc
an作像装置150の部分をも示す。トランジスタ15
8は、外部回路のポテンショメータR8にも接続されて
いるのが示されている。装置に使用された抵抗器の値は
次の通りである:R1=IK。
R2=0.5に、R3=2.7に、R4=0.47K。
R5=2.2K 、R6=I K 、R8=10にポテ
ンショメータ、 R9=0.1に、回路152の出力は
、第6図に示される通りライン20でピクセル・バッフ
ァに供給されかつマルチプレクサ40によって制御され
るデータとして、平面走査器から提供される。
第6a図から第6f図までは、第1図に第3a図〜第6
f図と標示された部分に対応する詳細な回路を示す。す
べての品目の中の2′)が点線内に示されていることも
注目すべきである。例えばアドレス・レジスタを持つ唯
一のピクセル−バッファが図示されているが、それぞれ
のアドレス・レジスタとマルチプレクサ40に対する接
続を備えた同一の第2tクセル・バッファがちし、これ
らの部品を点線によって示される。適当なアドレス・レ
ジスタおよびマルチプレクサ40に対する同じ2つのピ
クセル−バッファの接続は、この組の図面第6a図から
第5f図までによって完全に示されるので、回路は普通
の技術練度の人によって作ることができる。
第6a図から第6f図までの回路接続および作動がこれ
から説明される。ライン22に現われる走査器からのク
ロックはDフリツゾφフロップ24に接続されるので、
クロックがハイになるとき、データはピクセル・バッフ
ァ28ムまたは2flBのいずれかに対してライン26
により供給され、それによりピクセル・バッファはマル
チプレクサ40によって選択される。1組3個のアドレ
ス・Vジメタ38A、38Bおよび380はピクセル−
バッファに接続され、またデータがピクセル・バッファ
に書き込まれるにつれて自動的に増分される。すなわち
、ピクセル・バッファへのデータの書込みはXアドレス
を自動的に増分するので、データはピクセル・バッファ
に絶えず書き込まれ、かくてデータがピクセル・バッフ
ァに書き込まれるにつれて個々のX場所をアrレス指定
する時間が大幅に省かれる。垂直プロジェクションRA
M 30は2進レジスタであり、これは垂直性にどんな
ぎクセルでも存在する場合、すなわちビクセル−バッフ
ァにX列がある場合にハイである。
1つのプラック・ピクセルがX列に送り込まれる場合で
も、垂直プロジェクションは1である。水平プロジェク
ション・カウンタ32は、マルチプレクサ40から来る
ライン42に現われるクロックΦパルスによってパック
728ムの走査ラインにブラックライン・ぎクセルが書
き込まれる度に増分される。マルチプレクサ40は、プ
ラック瘤tクセルがピクセル・バッファに書き込まれる
ときのみライン42のクロックを増分するので、水平プ
ロジェクション・カウンタ32はその行にあるブラック
・ぜクセルの正確な数を示す。
水平プロジェクション・カウンタ32は、その中の水平
プロジェクションを表わすブラック・ピクセル・カウン
トが超過する場合、すなわち水平プロジェクションがこ
の特定のカウンタ32で行当たり256ピクセルを越え
る場合にセットされるあふれDフリップ・フロップ33
を持っている。
Dフリップ・フロップ33は、ブラック・ピクセル・カ
ウントのあぶれを示す出力をライン35により工10レ
ジスタ54に送る。レジスタ52゜54および56はマ
イクロプロセッサ90に信号用接続を供給する一ットエ
10コミュニゲーティング・レジスタ・ユニット(oR
tT )でおる。各走査線の終りに、走査アクチブ34
はローとなり、これはマイクロプロセッサ90にカウン
タ32の値を読む割込みサービス・ルーチンを実行させ
る割込み回路36とインターフェース接続される。
割込みサービス・ルーチンの部分として、マイクロフロ
セッサ90は28AのYアドレスをも増分するので、次
の走査線は28Aの次行に送り込まれるであろう。RA
M 30は垂直プロジェクションを記憶するのに用いら
れる。1列にあるどんなピクセルでもブラックであるな
らば、垂直プロジェクションはローである。xpuoM
44はNANDデート46を経て水平プロジェクション
用のホワイト・アウトとして働き、水平プロジェクショ
ン・カウンタ32が書込み中にピクセルの所定の最初の
数と最後の数について増分されるのを防止する。同様に
、FROM 48は走査0と65についてデータがバッ
ファ28ムに書き込まれている間に垂直プロジェクショ
ンのホワイト争アウト機能を果たす。
各走査線のいずれかの縁におけるピクセルが読まれてい
る文字に対応するデータを含まないのは、それらが紙の
ごく縁にありかつ紙の縁からちょうど離れている像にも
対応することがあるからでおる。lPROM 44およ
びFROM 4 Bがホワイ・ドアウドするピクセルの
数は、機械の応用ならびに感度により変えることができ
る。第1ピクセル・バック728人への書込みは、テキ
ストの行が隔離されるまで続く。第1ピクセル・バッフ
ァが隔離されたテキスト行を持つことをマイクロプロセ
ッサ90が検出するとき、それは書き込む次のぎクセル
・バッファ28Bを選択する信号をライン50により工
1052からマルチプレクサ40に送る。
ライン50はHAND pt”−) 60および62な
らびにインバータ58にも給電するので、回路のすべて
の他の部品はデータを他のピクセル・バッファに供給し
かつその機能を制御するように適当にスイッチされる。
ピクセル・バッファの二重部分および必要なアドレス・
レジスタは第6a図から第3f図において点線で示され
ている。
マイクロプロセッサ90は第1ピクセル・バッファから
読出しを開始する準備をいま整えているが、第2ピクセ
ル・バッファ28Bは書き込まれている。マイクロプロ
セッサ90がピクセル・バッファから読出しを開始する
と、それはマルチプレクサ40をライン70に沿ってI
/ Oレジスタ54を通る正しいピクセル・バッファと
インターフェース接続するようKする。ピクセル・バッ
ファ1!!FROM 44およびFROM 4 f3が
らの読出LcMc、書込み順序の際ホワイト・アウトさ
れたものと同じ境界線上のぎクセルがホワイト・アウト
される。
ロード可能な比較器64は、現在のYアドレスをぜ口水
平プロジェクションによって示されるような読まれた前
のYアドレスと比較し、またYアドレスを比較器64に
ラッチする。そのとき比較器64は、ピクセル・バッフ
ァの終りで使用されない走査線のホワイト・アウトとし
て働く。テキスト行は、その上の水平プロジェクション
がゼロとなるまで完全に走査され、次にマイクロプロセ
ッサ90はデータの次の行を読み始める信号を工10レ
ジスタ52を経てライン50に送ることによって次のバ
ッファ・ラインを選択する。データはマルチプレクサ4
0、ライン70、工1054、および工10レジスタ5
4を経てマイクロプロセッサ90に供給される。垂直プ
ロジェクションは各ぎクセル・バッファ・ライン用のラ
イン12に沿って供給される。続出順序XおよびYレジ
スタ38ならびに37は、ビクセル・バッファ内の個々
のビクセルを呼び出す。
XおよびYビクセル・アドレス・レジスタは特定のXお
よびY位置から個へのビクセルを一度に1バイトを読む
必要はなく1ビツトを読み出すように%に設計されてい
る。この重要な機能は、マイクロプロセッサ90に個々
のピットを試験させることができる。またそれらによっ
て、ビクセル・バッファは自らの中の任意な前のXおよ
びY位置から任意なXおよびYにアドレス指定すること
ができる。これは本発明の1つの実施例の重要な機能で
ある。第8図から第10図までおよび付随の説明に示さ
れる通り、1つのビクセルから次のビクセルに至る試験
は、コンパス方位に左右されるそのぎクセルを囲む8つ
の位置のどれでも1つであることができる。XおよびY
レジスタは任意な位置を任意な順序でアドレス指定させ
、かくて試験文字を巡る重要な援助装置である。例えば
、試験すべき次のビクセルはX″&たはYレジスタのい
ずれかを増分する必要があり、あるいは両レジスタを同
時に増分する必要があるかもしれ々い。さらに、1つの
セルから次のセルに至る試験はXまたはYのいずれかを
減分して同時に他のレジスタを増分する必要があるかも
しれない。さらにカリパスが測定されているとき、マイ
クロプロセッサはアドレス指定されたばかりの前のXお
よびY位置に関係のないXおよびY位置を呼び出すこと
を要求される。ビクセル・バッファは、任意の特定なデ
ータ点に対する呼出しがマイクロプロセッサの記憶スペ
ースに記憶されているビクセルによって常時可能な速度
よりもはるかに速くなるように設計されている。
XおよびXアドレス・レジスタは次の通り作動する。マ
イクロプロセッサ90は、後で説明される通り特定のセ
ルに対する指令および前の試験結果に伴って変更される
X用の外部ワークスペース・レジスタROおよびY用の
R1によるこれらのレジスタの変更を制御する。現在の
基準セルのXおよびY位置は、プログラム記憶装置14
6の中にあるRAM 74に記憶される。マイクロプロ
セッサがもう1つのビクセルを読む準備を整えるとき、
それは所望のXおよびY位置をアドレス指定するために
ROまたはR1’もしくはその両方を変更する。この位
置は呼出レジスタ3Tおよび38に書き込まれて、ぎク
セル・バッファ内のセルの特定なアドレスをさがすとと
もに、ライン70がハイまたはローであるにかかわらず
そのライン上にその位置の出力を供給する。呼出レジス
タ37および38はロード可能カウンタである。これに
よってマイクロプロセッサ90はXおよびY座標にらる
アげレス・レジスタに対応する所望のアドレスを個々の
XおよびY呼出し用のレジスタ3Tならびに38にロー
ドすることができる。ビクセル・バッファ28Aおよび
28Bは、8個の16KX1KRAMによって構成され
ている。RAMはすべて相互に接続されているので、デ
コーダ39はXアドレス・レジスタによって指令される
通り呼出用の任意の特定なRAMを選択することができ
る。
これによって、アドレス・レジスタ36A−oが使用し
た共通入力ラインにより選択されたRAM ’i呼び出
すことができる。第6e図に示される通り、Xアドレス
・レジスタ37からのデータ・ラインの6本はアドレス
を決定する際に最上位3ビツトとしてRAMのアドレス
に供給される。Xアドレス・レジスタ用の11本のアド
レス・ラインは、アドレス位置を決定する際に最下位1
1ビツトとして供給される。Xアドレス・レジスタの1
つだけの増分は新しい行の開始に相当するので、Xアド
レス・レジスタの最下位11桁はゼロで始まり順次Xア
ドレス・レジスタの各増分に進む新しいデータ位置のア
ドレス位置を開始することができる。
Xアドレス・レジスタの最下位6ピツトが1であるよう
にXアドレス・レジスタが増分されたとき、増分はデー
タ・バッファをアドレス指定する次のRAM ’i選択
する。Xアドレス・レジスタの最下位6桁は、第3e図
および第3f図に示される通りRAMアドレスの最上位
3桁を与えるように接続されている。
RAMのこの特定な設計は、供給される各走査ライン用
の適当な行を提供する本発明と共に使用されるぎクセル
・イメージヤに特に好適である。
00Dイメージヤは、ピクセル・バッファにらるX位置
の行に1対1の対応を示す各走査ライン用の1728ビ
クセルを供給する。全部で2048個のXアドレス位置
が各行に供給されるので、走査ラインの各行におけるデ
ータに必ず適当な数のアドレスが供給される。Yアドレ
ス・レジスタはそのとき次の走査線について一度だけ増
分されるので、イメージヤ金読むピクセルの各後続行に
1つの完全な走査線が置かれる。任意な所望のCODイ
メージヤが本発明に使用されることを知るべきである。
ある場合には、より多くのデータ点を得るために走査紛
当たりにより多くのピクセルを持つ著しく解像度の高い
CODイメージヤ金使用することが望ましいかもしれな
い。また異なるタイプのイメージヤ金使用したり、走査
器/イメージヤが望ましい場合は磁気ピックアップさえ
使用したりすることが望ましいかもしれない。第6e図
および第6f図に示されるような回路構造は、Yアドレ
スの増分の有無にかかわらず任意なXアドレススの増分
の有無にかかわらず任意なYアドレスを呼び出すことが
できる新しいハードウェア構造である。さらに、呼出速
度は、XおよびYの両アドレスが回路のハードウェア構
造により変更される必要がある場合でも遅くされない。
この結果、本発明に説明されるような巡回動作を実行す
る際に明白な利点を生じる。
マイクロプロセッサ90は、もし試験のおる段階で必要
ならば、現在の基準位置XおよびYを読むために146
においてRAMに戻ることがある。
レジスタγ6はピクセル・アドレスeレジスタ37およ
び38用のアドレス・デコーダであり、マイクロプロセ
ッサ90に接続されている。デコーダ80は所望ならば
読出しの際にXまたはYをクロック・アップあるいはク
ロック・ダウンすることができる。デコーダ80は所望
ならば工10レジスタ52からのライン82のXまたは
Y位置を自動増分するようにターン・オンすることがで
きる。このモード中の読出しはずっと速く、また自動増
分装置82が使用されるときはマイクロプロセッサ90
は読み、読み、読みのモードにあり、各ピクセルの読出
しを続行して異なるレジスタを増分する必要はない。
パルス同期装置84は、そのクロックを他のすべてのク
ロックと同期させることによって垂直プロジェクション
RAM 30の誤まった書込み全防止する。
この実施では9900;リーズとしてテキサス・インス
ツルメンツ社製のTMS 9995でおるマイクロプロ
セッサ90を示す第1図をこれから詳しく調べてみる。
任意な他の適当なマイクロプロセッサを使用することが
できる。TMS 9995の説明書はここに追録■とし
て添付されており、参考のため包含される。マイクロプ
ロセッサ90は巡回装置、走査器、ピクセル・バッファ
、および回路の他の部品を制御する。マイクロプロセッ
サ90はいろいろなデコーダ、アドレス・レジスタ、R
AM 、出力端子、および追録■に示されるような他の
部品を包含する。これらのいろいろな回路部品はボック
ス90によって表わされ、またマイクロプロセッサ90
およびその支持回路とし一括して参照される。
マイクロプロセッサ90はピクセル・バッファにわる完
全な試験文字を巡回して、マイクロプロセッサ90の特
定なプログラム・モード次第で、高さ、幅、周囲、周囲
内の面積、波形および各Yにおける最大ならびに最小x
1各Xにおける最大ならびに最小Yのような所望のパラ
メータを抽出する。マイクロプロセッサ148は、パラ
メータがマイクロプロセッサ90によってすべて抽出さ
れるまで、それらのパラメータについての比較を行わな
い。いったん文字が完全に巡回されてすべてのパラメー
タが決定されると、マイクロプロセッサ90はデータを
基準文字として記憶したり、基準文字と比較したりする
ためにマイクロプロセッサ148に転送する用意を整え
る。マイクロプロセッサ90は?−夕をマイクロプロセ
ッサ148に送るため2個のインターフェース・レジス
タ99Atたt198Bのどちらか1つを選択する。
インターフェース−レジスタ98Aおよび98Bは同一
であり、相互に機能を果たすことができる。
インターフェース壷レジスタはデータをマイクロプロセ
ッサ90からマイクロプロセッサ148に送すかつマイ
クロプロセッサ148からマイクロプロセッサ90に送
り戻すのに使用される。各インターフェースはRAM 
102と104、アドレス−バッファ106と108、
およびデータ・バッファ110と112を備えている。
どのインターフェース・レジスタを使用するかの選択は
、工1052からの出力ビットでマイクロプロセッサ9
0によって決定される。フリツノ・フロップ114は、
マイクロプロセッサ148が比較機能の用意を整えてい
るときセットされる。マイクロプロセッサ148は、テ
キサス・インスツルメンツ社製のTMS 320である
マイクロプロセッサ148はプログラム記憶装はロード
可能な自動増分アドレス・レジスタ120を経てマイク
ロプロセッサ148によってアドレス指定される。ロー
ド可能な自動増分レジスタ122は、インター7二−ス
・レジスタ98Aおよび98Bをアドレス指定するのに
用いられる。
マイクロプロセッサ14Bは工10選択信号発生回路1
24および126を備えている。マイクロプロセッサ1
48に対するデータ・バッファリングは、バッファ12
8および130によって行われる。データはマイクロプ
ロセッサ90から常時8ビツト・バイトで読み出され、
マイクロプロセッサ148は本実施例において16ピツ
NfFtt使用し、したがってゼロ・アウト・レジスタ
132がマイクロプロセッサ148に接続されて、その
16げット=の他の8ビツトがゼロにされかつ他の8ビ
ツトがマイクロプロセッサ90からのビットに対応する
ことが確認される。
マイクロプロセッサ148はインターフェース・ユニッ
トから文字のパラメータ・データを受けて、そのデータ
を基準文字のパラメータと比較するために適当な位置に
ロードする。次にマイクロゾロセッサ148は第1文字
パラメータを選択して、基準文字を選択するテンプレー
ト記憶装置に進み、基準文字の対応するパラメータを試
験される文字の対応するパラメータと比較する。マイク
ロゾロセッサ148は、後で説明される通り、プログラ
ム記憶装置によって指定された基準文字パラメータに対
する文字パラメータの比較を続行する。マイクロプロセ
ッサ14Bは、その特定の文字について調和が発見され
たことをプログラムが示すまで、テンプレート記憶装置
から基準文字を選択し続ける。次にマイクロプロセッサ
14Bはそのテンプレート記憶装置からその文字のAS
Oエエコードを供給し、その八日CIエコーFをマイク
ロプロセッサ90に送り返すためにインターフェース・
レジスタ98に置く。その文字のAS○工Iコードは、
マイクロプロセッサ90がそのASOエエコードヲ検索
する用意を整えかつそれを出力バッファに供給するまで
、インターフェース98に残るであろう。
マイクロプロセッサ148は、基準文字のAsCエエコ
ードがインターフェース98に置かれると同時にマイク
ロプロセッサ90に信号を送り、次の文字が比較されか
つ正しい基準文字が選択されるようにインターフェース
・ユニット内に置かれる新しい試験文字パラメータを待
機する。マイクロプロセッサ90は、それがインターフ
ェース・ユニットに試験用の新しい文字パラメータを供
給したり、マイクロプロセッサ148に転送されると同
時に、認識された文字のムSOIエコードを検索する。
別の実施例では、マイクジプロセッサ14Bはそれ自身
のテンプレート記憶装置を提供して基準文字用のパラメ
ータを記憶するようにプログラムすることができる。こ
のモードでは、文字パラメータはパラメータが調和する
文字を表わす180エエコードと共にマイクロプロセッ
サ148に転送される。次にマイクロプロセッサ148
はこれらのパラメータをプログラムが指定したそのテン
プレート記憶装置内に置き、それによってマイクロプロ
セッサ148はそのテンプレート記憶装置内にいま含ま
れていない新しい基準文字を教えられる。
この機能は操作艮に、テンプレート記憶装置内にいま記
憶されていない文字の光学式文字認識を実行する新しい
基準文字金持つ全く新しいテンプレート記憶装置を提供
する。
マイクロプロセッサ90は、インターフェース−ユニッ
ト9Bから認識されたばかりの文字のAEIOエエコー
ドを検索するとともに、そのAgoエエコードをその文
字が現われたテキスト行の出力バッファに置く。文字の
全テキスト行は、バッファの内容が出力として供給され
る前に、出力バッファ内に配列される。マイクロプロセ
ッサ90は、各文字間のピクセル数fi−調べて文字間
の正しい間隔をも決定し、また出カバソファに適当な間
隔を置く。本実施例では、マイクロプロセッサ90は左
から右に始まり、文字がマイクロプロセッサ148から
受信された順序で文字を配列するが、その理由はマイク
ロプロセッサ90がテキスト行の最初から始めて左から
右へ文字のパラメータを供給し始めるようにそのゾログ
ラム記憶装置によって指定されたからでおる。マイクロ
プロセッサ90がテキスト行の各文字のパラメータを送
って、マイクロプロセッサ14Bから試験文字のパラメ
ータに調和するパラメータを持つ対応する基準文字のA
BCエエコーy+受けた後、完全な出力バッファは1つ
の完全なテキスト行をロードされる。次にマイクロプロ
セッサ90は、ゾログラム記憶装置により指定された文
脈規則を用いて最終的な間隔決定および文字認識を実行
する。これらの段階の若干は、認識された文字が出力バ
ッファに供給されるにつれて実行される。例えばアポス
トロフィが調和する文字として受信されるとき、マイク
ロプロセッサ90は出力バッファ内の隣接文字もアボス
トロフイであるかどうかを決定するためKそれを読む。
もし2個のアポストロフィが相互に隣接して発見されか
つスペースの限界値未満で隔離されているならば、マイ
クロプロセッサ90は2個の各アポストロフィ用のAS
Oエエコードに代わって引用符のAEIOエエコードを
置くであろう。マイクロプロセッサ90は、後で説明さ
れる通り、プログラム記憶装置により指定された他の文
字と共に同様な文脈試験を実行することができる。出力
バッファ内の完全な試験性が正しく配列されたとき、マ
イクロプロセッサ90は工10端子からそれと接続され
る任意な所望の出カ装置にテキスト行を出力する。次に
マイクロプロセッサ9oはピクセル・バッファに進み、
プログラム記憶装置により指定された行に6る最初の文
字で始まる次のテキスト行を読み始め、テキスト行の読
みを続行しかつ頁の各文字が出力として認識されて供給
されるまで出力バッファに出力としてそれらを供給し続
ける。
文字をg論する方法を、第8図から第13図までについ
てこれから説明する。
第8a図は本発明の文字認識装置の作動方法の流れ図で
ある。この流れ図は試験に使用されかつ文字の認識を行
って良好な結果が得られた1つの特定な実施例である。
言うまでもなく、流れ図のいるいろな部分は異なるパラ
メータが文字の試験に使用されたり、パラメータが異な
る順序で比較されたり、する場合に変更される。例えば
1つの実施例では、基準文字比較において5個のカリパ
スが計算されずかつ使用されない。別の実施例では、デ
ィジタル波形は計算されず、プログラム可能なベネトレ
ータまたは1組のカリパス、例えば36個のカリパスに
よって置き換えられる。流れ囚は、テンプレート記憶装
置に記憶された基準文字として用いる文字からのパラメ
ータの抽出を示すようにも変更される。
流れ図に示されるような本発明の作動をこれから詳しく
説明する。第8図の流れ図はテキスト行の隔離、テキス
ト行内の文字の隔離、文字からのパラメータ抽出、その
組のパラメータのマイクロプロセッサ148に対する転
送、出力バッファ内に文字を置くマイクロプロセッサ9
0に対して試験済の文字を調和させる文字用のA80エ
エコードの復帰を示すとともに、出力バッファを通って
端子に至る出力としてテキスト行を供給する前に、各文
字が正しく識別されたかどうかを決定するために文脈規
則を実行する。
mBa図は、全体の装置の流れ図を記入するとき頁の走
査を始めるマイクロプロセッサを示す。
マイクロゾロセラ・y90は、走査器が頁の下に移fI
h−jる速度およびビクセル・バッファが走査器からデ
ータを供給される速度を制御する。マイクロプロセッサ
90は、回路のすべての部品を1つ形またはもう1つの
形で制御し、回路用の中央処理ユニットとして働く。走
査された頁からの走査線がピクセル書バッファに供給さ
れるにつれて、1本の走査線は頁の薄い水平断面を横切
る完全な行を表わす。又は左から右に増加する。この同
じX座標はビクセル・バッファのアドレス用に使用され
るので、ビクセル・バッファ内のXアドレスは用紙上の
走査線内の任意な1つのビクセルのX位置に応じてこの
X位置を示す。各走査線はY値を与えられる。Yは頁の
上部から下部へと増加し、これはYの標準表示法と反対
である。したがって、負のYは決して存在せず、むしろ
YOは頁の最初の走査線となり、Yは頁の下部に下がっ
て走査線を増すであろう。文字の色は黒で表わされ、1
の値を与えられる。背景の色は白で表わされ、0の値を
与えられる。
負および文字に関するOODイメージヤの寸法は、平均
文字が約15−30ピクセルの高さで約10−22ピク
セルの幅となるような寸法である。読まれている文字の
各ビクセルは、ピクセル−バッファ内の1つの対応する
XおよびXアドレスを与えられる。読まれている頁にブ
ラックΦピクセルが存在するので、正確な位置を持つビ
クセル・バッファ内に記憶されるビクセルの同一かつ対
応する数が存在するであろう。その結果、マイクロプロ
セッサはビクセル・バッファ内の1の数を決定すること
ができ、これはブランク・ビクセルの数および読まれた
文字の上のそれらの位置に正確に対応するであろう。同
様に1マイク目プロセツサはビクセル・バッファ内のア
ドレス位置を巡回することによって、文字の周囲のビク
セルのみを表わすアドレス位置の値を試験することがで
きる。
これは試験を受ける文字を巡回することに等しく、かつ
ビクセル内の文字の高さおよび幅とビクセル・バッファ
を通じているいろなアドレス位置に記憶された文字の高
さおよび幅との間に一致を生じる。同様罠、文字の面積
、周囲、カリパス、およびディジタル波形のような他の
すべてのパラメータは、走査されている頁のビクセル位
置に対応するアドレス位置を調べることによって決定す
ることができる。北、南、東および西の方角はそれぞれ
頁の上下右左の読みに対応する。しかしビクセルeバッ
ファ内のアドレス位置は用紙の頁と同じ構造パターンで
配列されず、むしろ16KXIKRAM K配列される
。そのとき、言うまでもなく、北に対する運動は頁の1
本の走査線を上に襲動しかつその特定な運動方向忙対応
するビクセル・バッファ内のアドレス位置を決めること
に相当する。
これは、読出し用の次のXおよびX座標な選択するよう
にアドレス位置を定めるXまたはYアドレス嘩ピットの
多くの変更を要求することがある。
前述の通り、アドレス自レジスタおよびビクセル・z?
 ソファは、この方法でビクセル・バッファを迅速かつ
容易に呼び出せるよ5に%別に設計されている。
マイクロプロセッサが第8a図に示される遡り読みおよ
び文字認識プログラムを記入すると、それは走査器にビ
クセル・バッファを埋め始めさせる。マイクロプロセッ
サはまず、可変文字カウントをゼロ忙等しくセットする
マイクロプロセッサは最初、ビクセル・バッファからの
データを読み始めない。データがビクセル龜バッファに
供給されるにつれて、各行のブランク・ビクセルの数は
説明された通り、カウンタ32に送られる。マイクロプ
ロセッサ90はまず、重要な走査線にどんなデータでも
存在するかどうかを知るために各走査線の水平プロジェ
クション釦進む。これが本発明の重要な時間節約機能で
ある。マイクログ4七ツサはビクセル・バッファからの
データを読まないし、またはビクセル・/マッファのア
ドレス指定さえもしない。これは、ビクセル・バッファ
内の各位置のアドレス指定および読出しが非常に時間の
かかる問題であるという点で、大きな時間節約機構であ
る。各走査線の水平プロジェクションは、その走査線が
ビクセル・7′?ソフアに供給されるにつれて、記憶レ
ジスタに記憶された。水平プロジェクションは、走査線
である行の中にあるブラック・ピクセル数の表示である
。マイクロプロセッサ90は、限界価を超える水平プロ
ジェクションを持つ走査線が発見されるまで、水平プロ
ジェクションを読むことによって一度に1つだけ走査線
をステップQダウンする。
これは記憶装置内の水平プロジェクションを読むことに
よって行われる。ビクセル・7マツフア内のデータは読
まれない。この水平プロジェクションの限界値は可変感
度にセットすることができ、最したがってゼロを越える
すべての値はプログラムの次のステップをトリガし、ま
た限界値がより大きな整数値にセットされるときのより
低い感度は5または10となり、したがってその最も厚
い部分の文字または1組の文字のみがプログラムの次の
ステップをトリガするであろう。
マイクロプロセッサ90は、それが所定の水平プロジェ
クション限界値を越える限界値を持つ走査線を発見する
ために走査線の水平プロジェクションを極めて迅速にス
テップ・ダウンするまで、ビクセル・バッファ内のデー
タを病査しないであロウ。次にマイクロプロセッサは、
限界価を下回る水平プロジェクションを持つ走査線が発
見されるまで、水平プロジェクションのみを読むことに
よって走査線をステップΦダウンし続ける。次にマイク
ロプロセッサは、TOPYに等しい水平プロジェクショ
ンの限界値よりも大きい最初の走査線をセットし、また
BOTTOM Yとして限界値を下回る水平プロジェク
ションを持つ走査線を伴う限界値を越える最後の走査線
をセットする。もしマイクロプロセッサが限界値を越え
る水平プロジェクションをさがしてなにも発見しないな
らば、頁は兄全に読み終っており、マイクロプロセッサ
は新しい頁が走査器に供給されるまで読みを停止する。
マイクロプロセッサが最初のテキスト行を頁の上KfM
いたとき、ブランク行カウントはゼロに等しくセットさ
れ、頁の上部と凄初のテキスト行との間のブランク行の
数は走査線の数を用いて決足される。すべての以後のテ
キスト行間の距離は、各テキスト行間の走査線の数を用
いて算出される。
適浩なブランク行が次のテキスト行間に置かれる。
マイクロプロセッサ90はいま、テキスト行内の個々の
文字な飼ぺ始める準備な製えている。マイクロブ覧セッ
サ90は、各列の走査線用にRAM30に記憶されてい
る垂直プロジェクションを調べる。垂直走査線はテキス
ト行を構成する走査線に対するものである。、垂直プロ
ジェクションは水平プロジェクションに似ているが、た
だしそれは垂直プロジェクションが列を表わしかつどん
なシラツク譬ピクセルでもテキスト行の垂直寸法にある
列の中に置かれている点で垂直である。1の垂直プロジ
ェクションは、最低1個のブラック・ビクセルが指定さ
れた面積内に、この場合はテキスト行内にある垂直走査
線に置かれていることを表わす。0の垂直プロジェクシ
ョンは、その列内にブラック・ビクセルがないことを表
ゎj。垂直プロジェクションはOまたは1のみでありそ
の行にあるビクセルの量を表わさず、本実施例に用いた
通りどんなビクセルでもブラックであるかどうかのみを
示す。マイクロ7°tlIセン290は、テキスト行の
中のどんなブラック・ビクセルでもその列に含まれてい
るかどうかを示す垂直プロジェクションを読み、ビクセ
ル−バッファからのどんなデータをもアドレス指定した
り読んだりしない。これはテキスト行の中の個々の文字
をさがすのに著しい時間を省き、テキスト行の中の多く
のブラック・ビクセルを読まなければならないマイクロ
プロセッサの負相を軽減する。マイクロプロセッサは、
有意義なデータが置かれてそのデータの限界がセットさ
れるまで、ビクセル9バツフアからのデータをアドレス
指定したり読んだりしない。
マイクロプロセッサは、頁の左側で始まり左から右に進
む列走査線用の垂直プロジェクションを読み、かつ1の
垂直プロジェクションを持ちこの位置をXL、すなわち
Xローとしてラベル表示する最初の列が見つかるまで読
み進む。マイクロプロセラt90は、0に等しい垂直プ
ロジェクションを持つ列が見つかるまで右に進みながら
各走査線の垂直プロジェクションを読み続け、この位置
をXH,すなわちXハイとしてセットする。次にマイク
ロプロセッサはXH−XL+1を計算して、この差がブ
リッジ幅制限に等しいかそれよりも大きければ文字は1
個の文字としては幅が広すぎることが分かり、マイクロ
プロセッサはビクセル・バッファからどんなデータでも
読む前にその文字を解体する。文字は、その文字を始め
るXLからの所定の距離である新しいXEを作りかつこ
の解体される。この値は、1つの特定な字体で16ビク
セルであるがもちろん任意な値を持つことができる文字
の平均幅となるように選択されている。
ブリッジ幅制限は、多重文字が間にブランク・スペース
を持たずに相互に接触しているときのみそれを越えかつ
任意な1個の文字を決して越えないように十分大きくセ
ットされている。
マイクロプロセッサが水平プロジェクションを用いてテ
キスト行の上下走査線を設定しかつ垂直プロジェクショ
ンを用いて文字を形成する左右列走査線を設定したとき
、マイクロプロセッサはビクセル・バッファからのデー
タを含む1個のアドレスをまだ読んでいない。文字はビ
クセル・バッファ内のデータ以外のデータφセットを用
いて極めて迅速に完全隔離される。これらのデータ・セ
ットは、文字データがビクセル・バッファに供給される
とき決定され、追加の時間を必要としない。
マイクロプロセッサはいま、ビクセル・バッファからの
データをアドレス指定しかつ読み始める準備を整えてい
る、マイクロプロセッサはXL十XHを2で割ることに
よって文字の中心を計算し、YBOTTOM走査線でこ
のX位置で始まり、ビクセル・バッファ内のデータをア
ドレス指定することによってブラック・ビクセルをさが
しながら一度に1ビクセルをステップ・アンプする。マ
イクロプロセッサが最初のブラック・ビクセルをさがし
当てると、後で説明される通り記憶装置により指定され
たプログラムを用いながらこのビクセルで始まり完全文
字が巡回される。
マイクロプロセッサは、文字の底で始まるとき、必ず左
右を見るとともに最初の西のコンパス方位番号を使用す
る。異なるコンパス方位番号は所望の場合使用され、ま
た文字の上部から始まる場合は安定した方位番号は東で
あるが、言うまでもなく最初のコンパス方位番号の選択
は自由である。
文字が巡回されるにつれて、マイクロプロセッサは後で
説明するコンパス方位番号のベクトル和の角度であるデ
ィジタル波形、周囲内の面積、周囲、最/JSおよび最
大のX5ならびに最小および最大のYを抽出する。文字
の面積が最大仕様面積の限界値に等しいかまたはそれよ
り小さいならば、物体は文字として余りにも小さすぎる
と考えられ、そこでマイクロプロセッサは次の文字が見
つかって頁のその仕様を廃棄するまで、垂直走査線の垂
直プロジェクションでのみ調べることによってテキスト
行の次の文字をさがし始める。最大仕様面積の限界値は
ゴシック12の字体について8個のビクセルでセットさ
れているが、面積は異なる字体について変わることがあ
り、面積が小であるほど物体は大きく、マイクロプロセ
ッサ9oはすべてのパラメータ・データを抽出して、文
字飴跪用のマイクロプロセッサ148にこれらのパラメ
ータを供給する。面積が最大仕様面積の限界値より大き
い場合は、マイクロプロセッサはその文字のカリパスを
計算する。マイクロプロセッサは、後で説明するがカリ
パスの5.36、その他任意な所望の数を計算すること
ができる。次にマイクロプロセッサは文字の周囲を最大
2部分文字周囲の限界値と比較して、物体が2部分文字
の下方部分であるかどうかを決定する。周囲がゴシック
12の字体について37にセットされたこの限界値より
も小である場合は、マイクロプロセッサは文字の上部か
らテキスト行の上部を表わすものとて前に定められたY
TOPまでの列(XL+XH)/2にあるすべての走査
線をさがす。ブラック・ビクセルが見当たらなければ、
文字は2部分文字ではなく請求められたパラメータはマ
イクロプロセッサ148によって処理・比較するために
インターフェース拳ユニット98に送られる。しかしブ
ラック・ビクセルがあった場合は、マイクロプロセッサ
は文字の第2部分を巡回し、プログラム記憶装置がすべ
ての文字について指定するような文字のこのセグメント
用の同じパラメータの組を計算し、そして文字の他の部
分と比較するためにこれらのパラメータを提供する。2
部分文字の例は「?」、「!」、「:」である。
文字パラメータが決定されてマイクロプロセッサ148
に送られると、それは後で説明する調和文字を選択し、
その文字のABCエエコードヲマイクロプロセッサ90
に返す。返される文字がアボストロフイであるならば、
マイクロプロセッサ90は出力バツ7アに置かれた最後
の文字を読み、またそれがアポストロフィでありかつ2
文字間の走査線の数がゴシック12の字体で10である
最大アポストロフィ分離の限界値より小であるならば、
マイクロプロセッサは2個の接近したアポストロフィを
出力バッファのその位置における引用符のASOエエコ
ードに代える。マイクロプロセッサ90は適当な間隔を
持つ文字を出力バッファの中に置(。
マイクロプロセラt90が巡回を終って、テキスト行の
最初の文字からパラメータ・データを抽出した後で、そ
のパラメータ・データはマイクロプロセッサ148のイ
ンターンエース・ユニットに送られ、またマイクロゾロ
セラ?90はテキスト行の次の文字をさがし始める。マ
イクロプロセッサは、垂直走査線の文字情報を表わす垂
直プロジェクションのみを読み、次の文字か置かれる場
所を決定するためにビクセル・バッファ内にデータとし
て記憶されたような個々のビクセルを読まないことによ
って、テキスト行の次の文字をさが丁。これも重要な時
間節約の要素である。マイクロプロセラt90は最初の
文字をさがすのに用いた方法と同じ方法を用いて、すな
わち1の垂直プロジエクシヨンを持つ列走査線を見つけ
て、これを文字の最初の列走査線xLとして定め、さら
に垂直プロジェクションが0になるまで各垂直走査線の
垂直プロジェクションを読み続け、そして次の文字の終
りとしてその列走査線を設定しこれをXHに等しくセッ
トすることによって、テキスト行の以後の文字をさがす
。マイクロプロセッサ90は次に、ビクセル・バッファ
を再びアドレス指定して、前述のような方法でその文字
を巡回する。マイクロプロセッサ90は次の文字のパラ
メータ・データを抽出するが、マイクロプロセッサ14
8は調和を定めるために前の文字からの文字パラメータ
を比較する。マイクロプロセッサ90は、垂直プロジェ
クションのみを調べることにより、かつ完全なテキスト
行を読み終るまで文字が特定のテキスト行の中に置かれ
るときのみビク七ルΦバッファ内のデータを読むことに
よって、テキスト行をステップ・ダウンし続ける。マイ
クロプロセラf90は、文字のhsaxエコードを完全
なテキスト行用の出力バッファに1出カを伊、給する前
にロードする。テキスト行は文字の文脈について調査さ
れ、すべての文字が正しいかどうかが決定される。例え
ば文字rOJおよび数字「o」について、ゼロは文脈規
則を用いて決定される。隣接文字がアルファベット順、
A−Z 、a ++ z、 。
または“であるならば、その文字は文字「o」および任
意な数f’OJであり、ゼロは文字r’0Jlc変えら
れるが、これらの条件が満足されない場合は、すべての
文字「o」はゼロに変えられてゼロはぜ目のままである
完全なテキスト行が認識されて、出カバッ77内に置か
れ、文脈を修正されたとき、マイクロプロセッサ90は
テキスト行を出方する用意を整えている。完全テキスト
行は、端子144を通して任意に接続されたインターフ
ェースに出方とじて供給される。
次にマイクロプロセッサ90は、次のテキスト行の初め
が見つかってテキスト行の終りが前述の通りになるまで
、以後の走査線の水平プロジェクションを読み始める。
マイクロプロセッサ90は、水平プロジェクションと垂
直プロジェクションのみを用い、文字装置かれているビ
クセル・バッファをアドレス指定し、文字を巡回し、パ
ラメータをめ、マイクロプロセッサ148から認識され
た文字のAEIOエエコードヲ受け、出カバソファをロ
ードし、文脈試験を実行し、そして完全な頁を読み終る
までテキスト行の出力を供給しながら、テキスト行と文
字とを隔離し続ける。
巡回方法およびパラメ〜り抽出を第5a図から第5j図
、第6a図から第6bfg、第7a図からi70図、第
8a図から第8d図、第9e図から第9f図、第10a
rg!Jから第100図、および第11a図から第11
d図までについてこれから詳しく説明する。第5a図は
3個のセルすなわちピクセルのみを持つ文字を表わすよ
うに示されている。もちろん、これは極めて小さいので
、それは紙上で飛点としてのみ見られるが、これはマイ
クロプロセッサ90が文字を巡回するように文字の全周
を少しずつ回る方法を示す一例を与える。第10a図は
ずっと大きな文字を示し、試験を受ける文字を表わす多
数のセルがマイクロプロセッサ゛90によって決して読
まれないことを立鉦する。
第5a図から&5j図までの3セル・サンプル文字は各
セルが試験されるほどl」\さいが、言うまでもな(、
大部分の文字は幅が10セルと22セルとの間、高さが
15セルから30セルまでであり、かつピリオツドおよ
びコンマさえセルの有効数から構成されている。第5a
図から第5j図までは単にこの発明の方法を示すために
用いられる。
第8b図および第5a図から第5j図までを一緒に見る
と、第5a図においてマイクロプロセッサは巡回方法を
始めることが分かる。第8b図およびisa図から第5
j図までから見られる通り、マイクロプロセッサは「必
ず左を見る」規則を用いて文字の回りを少しずつ巡回す
る。言うまでもなく、「必ず右を見る」規則も同じく実
行される。
これは、マイクロプロセッサがその現在のコンパス方位
を見るとともに、すぐ先に看かれかつ現在基準セルとし
て用いられているセルの左に置かれるセルを試験するこ
とを意味する。この点で、コンパス方位番号は基準セル
と次に試験されるセルとの関係を決定し、現在の基準セ
ルに関して試験すべき次のセルの正確なX、!位置を決
定する補助手段である。ピクセI−・バッファのような
外部記憶装置に記憶されたそのXおよびY座標による1
ビツト飴の位置、DPAは巡回されている文字の面積を
記憶するのに用いられるレジスタを表わし、DPLは請
求積計の可変長さを記憶するのに用いられかつ調査中の
文字の面積をめるためにDPAと共に使用されるレジス
タを表わし、Paは巡回中にコンパス方位が不変である
MW移動の数を記憶しかつ周囲をめるためKPMと共に
使用されるレジスタを表わし、PMは巡回中にコンパス
方位番号が出会う回転数を記録するのに用いられかつ周
囲をめるためにpsと共に使用されるレジスタを表わし
、OMPSは巡回中の瞬間コンパス方位を表わす2ビッ
ト語でありかつ本実施例では流れ図の異なる位置に示さ
れる通りoo−東、01−北、1〇−西、11−南であ
る。
VEtO(N)は0M1’Sの最も新しい値の最大Nを
保持する2ビット語の一次元アレイであり、MVはVB
Oにどれだけ多くの値が現在記憶されているかを表わす
カウントであり、VXおよびVYはv]lG。
の現在の内容のベクトル和を表わす2個の4ビット個で
あり、NXおよびNYはVBOに現在記憶されている東
/西および北/南変換の絶対数をそれぞれ表わす2個の
変数であり、WVFM(WF)はVBO叫および探索表
を用いて決定された巡回中の文字の輪郭の形を表わす8
ピット語の一次元アレイであり、ただしWFはどれだけ
多くの飴がWVFM K現在記憶されているかを表わす
カウンタである。YLおよびYHは巡回中のその点に出
会った最小のYと最大のYをそれぞれ表わし、XLおよ
びXHは巡回中のその点に出会った最小のXと最大のX
Yそれぞれ表わし、Xll!およびYlは積計のあるビ
クセルでありかつ調査中の文字の面積をめるためにDP
Aと共に使用されるピクセルを表わし、psは巡回が光
子することを表わし、Oleは巡回が光子するコンパス
方位番号を表わす。
Xl、Yiは巡回中に試験すべき次のビクセルのアドレ
スを表わし、K2、K2はXl、Ylがホワイトである
場合に試験すべき第2ビクセルを表わし、XS、YSは
開始ビクセルのXおよびYアドレス位置を表わす、−5
sb図の一査上のボックスに示される通り、波形、面積
、および他の変数のような多くのパラメータは0にセッ
トされる。
出会った第1セルのXおよびY位置は記憶されて、その
涜で出会った最大および最/JSのXならひにYとして
セットされる。第8b図に示される通り、マイクロプロ
セッサは次のセルがブラックであるかホワイトであるか
を決定するために読まれる次のセルを選択する。本例で
は、現在読まれているセルの位置、すなわちセルAは基
準セルと呼ばれる。基準セルと読むべき次のセルとの関
係は、コンパス方位によって決定される。本例では、最
初方法は示される通り異なるコンパス方位が選択されて
も全く同じ働きをする。
コンパス方位番号は2ピツ)IIであるので、コンパス
方位の増分は方向を、例えば北に変えるのに用いられ、
減分は例えば南を選択するのに用いられる。コンパス方
位が0であるならは、減分は6を表わすコンパス方位を
選択するので、コンパス方位の方向は巡回を通じて所望
通り維持される。
第8b図は、本例において束、北、西および南として示
される4つの各コンパス方位について、マイクロプロセ
ラt90の実行に対応する4個のボックスを示す。各ボ
ックスにあるVYおよびVXはVHOの現在の内容のベ
クトル和を表わす4ビット語を示す。VEO(N)はコ
ンパス方位番号の最も新しい値のnを保持する2ビツト
飴の一次元アレイである。本実施例では、Nは6にセッ
トされたがデータの量および/または所望の円滑化次第
で任意な数に容易にセットされる。コンパス方位が本実
施例では0である東のときは、試験すべき次のセル、x
l、Ylは!+1.Y−IK置カレ、xl、Ylがホワ
イトである場合は試験すべき第2セルはセルX2 、x
 2とラベル標示されてx十L ’yでセットされる。
面積をめるのに用いられるDPLレジスタは増分される
。vxおよびVNは巡回中のこの点で増分されるが、m
Bb図の流れ図の別のボックスに示される通り、VXお
よびNXは波形がめられてからその原価に戻るように減
分される。
第8b図に示される通り、コンパス方位が北であるとき
、VYは減分されかつNYは増分され、Xl−X−1、
Yl−Y−1、およびK2−x1Y2−Y−1となる。
文字の面積を表わすDPAは、第10a図および第10
b図にも示される通りDPLの値によって減分される。
また第8b図に示される通り、コンパス方位が流れ図の
後の点で北であるとき、VYは増分されかつNYは減分
されて、その原価に戻るようにされる。第8blNに示
される通りコンパス方位が西であるときは、VXは減分
されてNXは増分され、K1−X−1,Yl−Y十i、
およびX2=wz−1、K2−Yとなる。
DPTJは減分される。プログラムの別の点で、VXは
増分されてNX、は減分され、その原価に戻るようにさ
れる。第8b図に示される通りコンパス方位が阿である
とき、VYは増分されて!JYも増分され、X i−X
+ 1、Y l−”l+ 1およびK2−X% K2−
y+1となる。DPAはDPItレジスタの値によって
増分される。プログラムの別の点で、VYおよびNYは
減分され、その原価に戻るようにされる。
マイクロプロセッサが第5b図に示されるこの最初の例
では西であるコンパス方位番号によって指定された適当
なレジスタ内の伯を変更した後、マイクロプロセッサ9
0は第5&図から第5j図までに示される通り試験文字
の巡回を続行する用意を整える。マイクロプロセラT9
0は、VF+Oにコンパス方位の番号を記憶しかつvm
a内の過当な位置に現在のコンパス方位を記憶するカウ
ンタを増分する。マイクロプロセッサは、本実施例では
7として示されるN個のコンパス方位かコンパス方位番
号のベクトル和をいま取り出すべきかとうかを決定する
ために記憶されるかどうかを見るためにチェックする。
これが本例で出会った最初のセルであるならば、それは
巡回が終ったときをめるのに用いる最後のX、Yおよび
コンパス方位番号として功在のX%Yおよびコンパス方
位をセットする。コンパス方位番号の限界数Nが置かれ
るように十分な数のセルが基準セルとして用いられる場
合、マイクロプロセッサ90は第9a図から第9f図に
示される通りかつ後で説明される通り、最も新しいN個
のコンパス方位番号のベクトル和をめる。
最初のセルがそのコンパス方位番号によって復帰されな
い場合は、マイクロプロセッサはセルがブラックである
かホワイトであるかを知るためにXl、Ylに置かれる
セルを試験する。第5b図の例に示される通り、Xl、
Ylに置かれるセルはホワイトであり、X2、Y2に置
かれるセルもホワイトである。したがってマイクロプロ
セッサは、第5C図に示される通り北を指すようにコン
パス方位を回転させてmBb図の流れ図の最上部に戻り
、コンパス方位番号として北を使用しながら新しい1組
の試、験を始めるように、第8b図に示される通りコン
パス方位を減分しかつPNを増分する。
第9c図はコンパス方位の北、すなわちコンパス方位番
号1に関するxl、YlおよびX2.Y2の位置を示す
。マイクロプロセッサは、aも勅しいものとして新しい
方位番号を使用しかつ波形に記憶するだめのベクトル和
の新しい角度ヲ作りながら、方位番号の最新のベクトル
和を試験する第8b図に示される機能を果たす。次にマ
イクロプロセッサは、セルx1.y1を試験するが、第
5C図ではこのセルはホワイトであり、したがってそれ
はX2、Y2に置かれるセルを試験し、このセルもホワ
イトであり、したがってそれはコンパス方位番号を減分
し、周囲計算機能PNへの移行を示し、またいま0すな
わち東である新しいコンパス方位番号の開始点に戻る。
前述のようなコンパス方位番号の束に関する試験が第5
d図に示されており、覗孔のコンパス方位のすぐ前方の
左にあるセルはXl、Ylおよび!2.Y2として選択
され、コンパス方位のすぐ前に置かれている。
第9d図は、コンパス方位が東であり、したがって試験
のためにセルX1、YlおよびX2、Y2を選択するこ
とを示す。X1%Y1に置かれるセルはセルBであり、
それはブラック・セルであるので、マイクロプロセッサ
はコンパス方位番号を増分し、変化PNを表わす周囲番
号に1を加え、新しい基準セルX、YとしてボックスX
i、Ylを七ッ卜し、全く古い基準セルを廃棄すること
によって、xl、y1用のブランク試駆の下のボックス
に示されるような機能を果たす。
巡回中に出会った各セルの記憶位置が保持されないよう
に新しい基準セルが置かれる度に、各基準セルの位置が
保持されないことは注意すべき重要な事項である。すべ
ての所要パラメータ・データは巡回中にめられるので、
著しい記憶スペースが節約される。また、巡回から見ら
れる通り、試験文字の周囲に接触していない文字を表わ
すセルはそれらの状態を決して試験されない。これは時
間と記憶スペースの著しい節約であり、先行技術よりも
著しく有利である。
マイクロプロセッサ9oが穎【、い基準セルを決定した
後で、それは新しい最大または最小のXあるいはYがあ
るかどうかを定めるためにその基準セルのXおよびYを
試験し、そしてもしそうならばXまたはYを新しい最大
または最小のXあるいはYとして記憶する。次にマイク
ロプロセッサは、コンパス方位番号が第8b図に示され
る通り新しい基準セルから試験用の新しいXおよびYを
決定する虞まで戻る。第9θ図において、新しいコンパ
ス方位番号は北、すなわち1を表わし、したがってマイ
クロプロセッサは内容のベクトル和を更新する北を持つ
ボックスに示されるような機能を果たしかつ次のブラッ
クまたはポヮイトヲ試験されるセルを選択する。
第5e図はコンパス方位の北すなわちコンパス方位番号
1に胸するxl、YlおよびX2、Y2の位置を示す。
マイクロプロセッサは、新しい方位番号を最も新しいも
のとして使用し、波形に記憶するためのベクトル和の新
しい角度を作りながら、最も新しいN個の方位番号のベ
クトル和を試験する第8b図に示される機能を果たす。
次罠マイクロプロセッサはセルx1、ylを試験する力
(第5e図ではこのセルはホワイトであり、したがって
それはX2.Y2に置かれるセルを試験するがこのセル
もホワイトである。したがってそれはコンパス方位番号
を減分し、周囲計算機能への移行を表わし、いま0″1
″なわち東である新しいコンパス方位番号の開始点に戻
る。前述の通りコンパス方位番号東に関する試験は第5
f図に示されており、現在のコンパス方位のすぐ前の左
にあるセルがXl、Ylとして選され、X2、Y2はコ
ンパス方位のすぐ前に置かれる。
第5f図はXl、YlおよびX2、Y2の両方がホワイ
トであり、したがってコンパス方位番号が再び減分され
、これはm58図に示される通り南の方向を表わす6を
提供する。次にマイクロプロセッサは、それが新しいコ
ンパス方位番号ン試に対して新しい値X1.Y1および
X2、Y2を指定するその機能点まで戻る。コンパス方
位番号が南である本例では、試験されるセルx 1−X
+1およびYl−Y+1、x2−xおよびY2−Y+1
は試験すべき新しいセルとしてロードされる。
次にマイクロプロセッサは前述の通りディジタル波形を
更新し、最も坊しいN個のコンパス方位番号のベクトル
和に関する右しい角度を供給する。
見られる通り、コンパス方位番号は、たとえ坊しい基準
セルがまだ決定されていなくても、運動の方向が更新さ
れる度に供給される。
第5g図に示される通り、セルXi、Y1はホワイトで
あるが、!2.Y2はブラックであり、したがってマイ
クロプロセッサは新しい基準セルとしてセルX2、Y2
を選択し、周囲機能を更新し、新しい最大または最/J
SのXあるいはYがいままでに現われたかどうかを見る
ためにチェックする。新しいセルのコンパス方位番号は
第8b図に示される通り前の基準セルと同じに保たれる
第5b図はブランク・セル0からコンパス方位番号とし
て南を使用する新しい試験セルまでの試験を示すが、マ
イクロプロセッサは面積およびディジタル波形を更新す
る所要機能を来た1−0第5h図において、xl、Yl
およびx2、Y2はともにホワイトであり、したがって
マイクロプロセッサはコンパス方位番号を2すなわち西
まで減分し、新コンパス方位番号が第51図に示される
通り試験すべき次のセルを選択するのに用いられるその
機能点まで戻る。西方向では、試験すべき次ノセルはX
l−X−1、Yi−y+ iおよびX2−X−1,Y2
−Yである。マイクロプロセッサはDPLレジスタを1
つだけ減分して、後で説明する通りディジタル波形の角
を計算する機能を果たす。第51図からの試験はセルX
1、YlかホワイトであるがX2、Y2がブラックであ
ることを示し、したがってマイクロプロセッサは新しい
基準セルとしてAを用い、周囲レジスタを増分し、コン
パス方位番号をそのままにする。
第51図は、基準セルAが最初の基準セルと同じであり
かつコンパス方位番号が同じであることを示す。コンパ
ス方位番号の最後の状態は第5j図に示されており、こ
こで最初のX% Yおよびコンパス方位番号に戻される
。この点で、文字の巡回は完成され、所望のパラメータ
を定める所要のデータは適当なレジスタに記憶される。
第8c図は、多くの点で第8b図に示される流れ図に似
た巡回を行う別の方法を示す。第8b図と第8C図の主
な相違は、ディジタル波形の決定である。第8b図に見
られる通り、ディジタル波形が読まれて最も新しいN個
のコンパス方位番号のベクトル和の周間を表わした適当
な位置に記憶されるように、Nが限界値より大きいかど
うかを知るために多くの変数が設定される。第8c図は
、後で説明する通りディジタル波形を抽出1別の方法を
用いる巡回を示す。
第12図から第15図までに示される本発明の方法も、
不連続文字としてビット・マツプに現われる印刷された
文字の文字=mを可能にする。
不連続テキストは2つの別な異なる問題によつて生じる
ことがある。不連続テキストの第1の原因は、紙上に印
刷されたテキスト自体が実際に不連続なことである。こ
の種のテキストはドツト・マトリックス中プリント、質
の悪いコピー、マタはある種の手書き文字によく見られ
る。不連続テキストのm2の原因は、CODイメージヤ
がビクセルをブラックとして表わすように走査されてい
る文字のビクセルにある十分なデータを受けない場合で
ある。これは完全孜字を囲む境界に晋逍起こり、頁の背
景に対して文字が始まる場所と終る場所を描くのに使用
される。しかし文字の中央の一部分は薄く着色されるこ
とがあり、この虞で文字が連続であってもタイプが十分
強くなかったり・、コピーの質が悪いので、CODイメ
ージヤはブラックであるビクセルな表わす十分な係号を
受けず、したがってこの位置でホワイト・ビクセルを供
給する。マイクロプロセッサが巡回を行っているとき、
このビクセルはホワイト・ビクセルとして現われ、ちょ
うど文字がこわれたように不連続文字に見える。使用さ
れるCODイメージヤの形式またはいるいろなマイクロ
プロセッサあるいは記憶装置とのインターフェース次第
で、巡回を行うマイクロプロセッサにとって実際に連続
の文字を1つ以上の位置で不連続にする他の問題が起こ
るかもしれない。
文字を表わすビット−マツプ内に記憶されたデータが1
つだ間隙または切断を持っとき、文字は本実施例で不連
続と考えられる。すなわち、ここに示される実施例で文
字が連続ならは、1が記憶されると思われる場所に0が
置かれる。
[L + 1 、 : 、 jのような2部分文字は不
連続とは考えられず、ここに説明される方法で認識され
る。飴「不連続文字」は2部分文字を含まず、それはド
ツト会マトリックス印刷文字のような完全に作られたと
きでも分離部分を有する文字を含む。またそれは、文字
の一部が暗ではなく明である質の悪い文字または徐写文
字を含む。
不連続またはCOD作像の間融があるテキスト自体に起
因する不連続テキストの条件の下で、第5a図から第5
j図までに示されたような巡回は文字を「不良にする」
であろう。第12図は、第5a図から第5j図までに示
されたノー・ギャップ・ピクセル公差を用いる文字10
08の巡回を示す。
第12図に示されるような0ビクセル・ギャップ公差を
持つ巡回が文字の切断1012に出会うとき、巡回はこ
のギャップ1012L「不良にし」、文字の内周をトレ
ースし、ギャップから逆に登り、そして矢印1010で
標示された通路をたどりながら巡回の#!膚までの旅を
終える。残念ながら、その特定文字についてめられる面
積の答は全く不正確であり、しばしば余りにも4・さく
、周囲はしばしば余りにも大きすぎる。文字にある多重
ギャップは問題を一層面倒にし、文字はしばしば2つま
たは6つの別々な文字として見られる。また「1.t、
cおよびetc jのような内部面積のない文字にギャ
ップが起こるとき、文字の任意な部分のギャップは文字
の認識を完全に妨害し、2個の異なる文字として現われ
るようにする。
この「不良化」はタイプライタでタイプされた文1.ま
たは極めて上質なコピーでは間魁になることが少ないが
、それはドツト・マトリックス・プリンタで作られたテ
キストでは極めて共通している。さらに、この問題は複
写機で1回以上コピーされたテキストのような質の悪い
テキストでも極めて共通している。ドツト−マトリック
ス・プリントは、像が1個の文字として目に読まれや1
いブラック・ドツトの集束として作られるが実際には多
くのlトさなドツトの集まりであるので、特に多くのギ
ャップをそこに持ちやすい、 CODイメージヤまたビ
ット・マツプを作る他の任意な種類のイメージヤによっ
て見られるとき、多数の1大きな」ギャップがドツト・
マトリックス・プリントで印刷された文字に見受けられ
る。
この問題は、第5a図から第5j図までに示されるもの
より試験セルの領域を拡大1−ることによって克服する
ことができる。試験セルの領域を別のサイズに拡大する
ことは、第13a図から第13d図までおよび第14図
に示されている。拡大された試験セルの領域は、基準子
ルの行または列に隣接しない列または行にあるセルを含
む。第13a図はセ゛口・ギャップ公差を持つ試験セル
領域を示す。第13a図に示されるような試験セル領域
は、第5a図から第5j図までに示されかつ説明された
ものと同一である、第13tt図は、1ビクセル・ギャ
ップ公差を持つ試験セル領域を示す。第130図は、2
ビクセル会ギヤツプ公差を持つ試験セル領域を示す。第
13c1図は、3ビクセル・ヤヤツプ公差を持つ試験セ
ル領域を示す。
試験セル領域は、ビクセルが与えられた基準セルからブ
ラックであるかホワイトであるかを知るために試験され
るビクセルを表わすすべてのセルを含むもとと定義され
る。試験セル領域は通常、完全文字のセル数よりも少な
いセル数を有し、これは巡回を用いる際に時間節約の要
素となる。試験セル領域にあるセルが全部は試験される
ことは重要である。ブラック・セルが試験順序中に置か
れているとき、それは新しい基準セルとして選択され、
試験セル領域はそれKしたかつて変化する。
したがってこのブランク・セルの後で試験されるすべて
のセルは試験されない。それらが「無関心」にブラック
φセルが置かれているからである。試験セル領域にある
セルを全部は試験しないで済むことによっても著しい時
間が節約される。
拡大された試験セル領域の使用によって、文字の周囲に
ギャップがある場合でも、文字の周囲を巡回することが
できる。ドツト・マトリックス印刷による文字または他
の質の悪い文字の文脈における周囲は、ホワイ)−αク
セルに隣接する各ビクセルに沿5ビクセルごとのステッ
プではなく文字の一般輪郭を含む。第5a図から第5j
図までの試麿セル領域を用いて、ホワイトeビクセルに
隣接するすべてのビクセルが置かれ、巡回中に基準ビク
セルとなる。しか(7、拡大された試験セル領域は第1
2図において0の周囲を巡(ロ)し、内部には入らない
。これは、ビクセル・ギャップか「飛び越され」、文字
の周囲および内部の大部分は飛び越されないことを意味
する。
各基準セルが首かれる後で「無関心」な位置にあるすべ
てのセルは、文字の周囲の部分と考えられる。この点で
、巡回は1つの基準セルから次のセルへ、文字の周囲を
めぐって歩く。「無関心」な位置のビクセルによって囲
まれる面積は、文字などの面積の一部として含まれる。
したがって周囲は、間にNより大きくないビクセル囃ヤ
ヤップを持つ文字の外縁を含むものと定義される。すべ
ての基準セルは文字の周囲にあり、文字の周囲にあるセ
ルのみが基準セルとなる。
第13a図から第13f1図までに示されるセル内の数
字は、試験セルが好適な実施例で読まれるノ1序を示す
。第13a図から第13a図までおよび第14図に示さ
れる試験セルを読む順序は、好イ(笑施では特定な方向
およびコンパス方位である。
コンパス方位が異なる場合は、行および列は正確に90
°回転されるので、第13a図から第13d図までの列
は行となり、行は列となる。列と行はコンパス方位次第
で互換されることは本発明の説明において理解すべぎで
ある。コンパス方位番号を変えることによる試験セルの
同じ順序は、第5a図から第5j図までに説明された順
序と同様である。第15a図から第13a図までおよび
第14図で説明されるものは、エンドレスOルーツに入
らなかったり可能なブラック・ビクセルを逃がしたりし
ないような所望の順序で試験セル領域ビクセルを読む方
法ならびにその好適実施例である。
ビクセル−ギャップ公差は任意な所望のレベルにセット
される。試験セル領域を法定する際の特定のビクセル・
ギャップ公差の幾何学的パターンは次の通りである。N
ビクセツル拳ギャップン許容するために、両軸に沿って
わたるN+1ピクセルの試験セル領域が試験されなげれ
ばならない。
これは、正負両方向で完全基準ビクセルの圓りのあらゆ
る方向に21J+3X2N+3個の完全試験セル領域を
作る。すなわち、基準セルから両軸に沿う正負両方向の
N+[は、第15a図から抛134図までに示された通
り中心で始まる。ブランクであることが知られている中
心セルの除外は、試験セル領域が(2N+3戸−1に最
も近く、4つの可能なコンパス方位により導かれる04
対称が下記公式を生じ、各コンパス方位用の試験セルの
所要数を決定する。
(2N+3)”−1 コンパス方位当たりの試験セル−4 ただしNは許容ビクセル・ギャップ公差である。
許容ビクセルΦギャップ公称Nは操作員によってセント
されたり、特定な形のテキストについてプリセットさl
″Lる。N−0、すなわち0ビクセル・ギヤツブ公にで
は、試験セルの数は2個である。
これは第5a図ρ)ら第5j図までおよび第13a図に
示されている。H−1、すなわち1ピクセル・ギャップ
公差では、読まれなければならない試験セルの数は第1
3b図に示される通り6個である。同様にN−2につい
て上記公式を用いると、試験セルの数は第130図に示
される通り12個であり、以下同様である。
最初のコンパス方位が束で始まるとき、第14図に示さ
れる試験順序が守られなければならない。
コンパス方位が北、南または西のような異なる方向で始
まるときは、第14図に指定される順序はセルを読むべ
き正しい順序を示すように回転されセルが置かれる列に
瞬接1−る列、および試験セルが置かれる行に間接する
行に必すある。束のコンパス方位では、適当な[1ii
J始セルは矢印1022によって示される通り基準セル
が置かれる行の上に隣接する行にある。列は矢印102
2の尾によって示される通り基準セルが置かれる夕1」
の右にある。
これは、次の基準セルを巡IP!I順序に置くために、
セル絖みの始めに読まれる最初のセルである。試験され
るセルがブランクであるときは必す、このセルは現在の
基準セルとし℃示され、コンパス方位はそれにしたがっ
てここに説明される通り増分されるので、勅しい試験セ
ル領域は勅しい基準セルのために提供される。もし試験
された最初のセルがホワイトであるならば、試験は一度
に1個ずつセルを読みながら、同じ列のセルでしかも最
も新しく試験されたセルにli4接するセルを試験する
ことによって続行される。その列のいま試験されたばか
りのセルに瞬接する各セルは、その列にある所定数のセ
ルが試験されるまで読まれる。これはN%jなわち規定
のビクセル・ギャップ公差によって決定される。この列
にブラック拳セルが見当たらない場合、およびその場合
にかぎり、最も新しく試験された列に@接する次の列が
試験のためにアドレス指定される。
各列の試験は基準セルが置かれる行に隣接する行で始ま
り、矢印1024で示される通り最も新しく試験された
セルに隣接する同じ列にあるセルを試験しながら一度に
1個のセルを増す、セットされたビクセル・ギャップ公
差により、所望通り多くの列について試験が続行される
。第13a図から第13d図までは最大6ピクセルΦギ
ヤツプ公差を示した。多くの場合、より大きなビクセル
・ギャップ公差が所望されることは注目すべき重要なこ
とである。例えば、不ビクセルを持りOODイメージヤ
が使用されると、ドントφマトリックス・プリンタでは
その特定のCODイメージヤの場合の3よりも大きい極
めて幅の広いビクセル−ギャップを生じさせることが可
能である。同様に、テキストの質が極めて悪いと、異な
るスタイルのプリントすなわちドツト・マトリックスの
変化および解像度は本発明が容易に認識するはるかに大
きなビクセル・ギャップを生せしめることがある。
第14図は、矢印1026および1030が基準セル1
021の置かれる行に隣接する行で始まって一番上のセ
ルの試験が終るまでその夕1」内の隣接する上のセルま
で増分しながら、それらが読む列N+1およびNを示す
試験矢印1026ならびに1030を示す。試験された
最後の列N十の次は矢印1030によって示され、基準
セルの置かれる行に直交する最後の列である。丁べ又の
タリが試験された後に、試験されたセルの最後の順PP
法矢印1032によって示される基準セルに瞬接するセ
ルで始まる基準セルの置かる行の順序である。
試験セル領域内の所望数のセルが試験された後、もしす
べてのセルがホワイトであるならば、コンパス方位は第
5a図から第5j図までについての説明で示された通り
変えられるので、II+シい1組の試験セルがいま試験
セル領域内に存在する。異なるコンパス方位について試
験領域の回転を理解するために、第13a図から第13
d図までおよび第14図は第5a図から第5j図までと
共に見る必要がある。特に注目すべき重要なことは、コ
ンパス方位が実際の読みの方向を変えるとともに、読ま
れている列または行をも変えることである。
これは第13a図から第134図までおよび第14図と
共に第5b図を見ることによって明らかにされる。、X
が左から右に増加し、またYか上から下に増加すること
を思い出すべきである。第5b図は、試験すべき第1セ
ルX1%Y1が位置X−1,y+1にあることを示す。
これは、コンパス方位が西だからである。もしm13a
iから第13a図までおよび第14図に示されるような
試験順序が西のコンパス方位を持つ第5b図に使用され
たならば、試験すべき第1セルは夕IJ X 71およ
び行y+1にあるだろうし、次のセルは同じ列x−1、
行y+2にあり、その次のセルは同じ列、行Y+3にあ
るだろう。この全列がホワイトならば、次の列の読みは
X7−2である。列は行Y+1で始まる。
コンパス方位が第5C図に示される通り北に変えられる
と、基準セルと試験セル領域との関係は変わる。この場
合、第14図に示される矢印1022は試験セル領域と
共に(ロ)転されて゛、列X−1、行Y−1のセルの試
験を始める。試験すべき次のセルは列X−2、行Y−i
にあり、その次は同じ行Y−1、列x−2にある。北の
コンパス方位を持つこの特定の例では、行にある各セル
がまず試験され、最後の列はすべての所望の行か試験さ
れるまで試験されない。試験される最後の列は、基準セ
ルがある列である。これは、セルの行と列が90’回転
されてスイッチされる方法を示す。第5a図から第5j
図までと第13a図から第13d図までおよび第14図
との比較は、試験の所望7a序および方法を示し、それ
によって列または行がどちらか先に試験される。
もしギャップ公差が大きすぎると、造画はしばしば1つ
の文字から次の文字まで飛び越し、4接文字を1個の文
字として読むことが考えられる。
操作員は読まれているコピーの質またはドツト・マトリ
ックス争プリントの形式により、所望のピクセル・ギャ
ップ公差をセットすることができる。
2個の隣接文字が1個の文字として読まれるとき、2個
の文字を解体するここに説明される方法か使用される。
1個の文字として巡回された2個の隣接文字を解体する
1つの方法は、テキスト行および文字分離の見出しの下
でここに説明されている。
ここに説明される方法は、文字に予想される最大幅であ
るブリッジ幅制限の限界値をセントする方法である。、
1個の文字としてはムチぎる文字が見いだされると、マ
イクロプロセッサはその文字を解体して、いま別々にさ
れた文字について認識を行うことができる。これは垂直
プロジェクションと共に行われたり、垂直プロジェクシ
ョンを用いない実施例にも使用される。
注目すべき重要なことは、この方法が発8A省ケイス・
プラント7 (Keith Blanton)、スチー
プン拳ビーターンン(Stsven Peterson
)およびシーンeへ/l/ ムス(Gene Helm
a)による1986年8月26日出願の同時係属出Ij
fA第527.7.51号に記載された方法に等しく適
用されることである。この特定の説明された実施例は、
ここに説明される特定の詳細を君子使用せずに、多くの
形の文字fliMff&法に使用される。
この方法は不連続文字を読むの効果があるが判明してい
る、前述の通り、不連続文字はドッI−−マトリックス
・プリンタによって印刷されたもの、質の悪いコピーか
らまたは特殊00Dイメージヤから生じたものである。
実験的試験が行われ、この方法がドツト・マトリックス
・プリントおよび他の不連続文字な院むのに有効である
ことが立証された。200ビクセル/インチの解像度を
用いるドツト鳴マトリックス・プリントについては、2
ビクセル・ギャップ公差が最適であることが判明した。
ここに説明される方法を用いて読まれたトン)−マトリ
ックス・プリントの特定な頁が第15頁に示されている
ドツト・マトリックス・プリンタにより印刷された0の
人間の目による粗略な検査は、001)イメージヤによ
り走査されたときの多数の可能なギヤツゾを示す。0は
、ここでは文字の中のギャップの数と大きさをでついて
可能的に「悪化の場合」の条部を表わすものとして示さ
れる。使用されるドツト・マトリックスの形式により、
0その他の文字は入間の目で容易に見られる多数のギャ
ップをそこに持つであろう。第15図に示される頁のほ
どA7どすべての文字のギャップは2個以上であり、各
ギャップは1個または211!Iのピクセルである。
第15図に示されるサンプルの頁は80芋の60行を含
むが、OODイメージヤは最上部の1行半と第80列の
一部を入力として供給させない。
これは、得られるデーターベースをb8×7ソすなわち
4582字まで減らした。さらに、左ふちの4個の文字
は紙の3個の穴に接して破鯉された。
これは試験データーベースの文字の4578個の良好な
像を捨てた。Tl−850ドツト・マトリックス・プリ
ンタから得たOのこの特殊頁に使用された試験セル領域
は、2ギヤツプ公差試験領域であった。履行された通り
、それは任意の与えられた文字において最大2ビクセル
幅のヤヤツゾな許す。しかしこれは、それが1個の文字
として2ビクセル以下のビクセル・ギャップによって分
離される任意な2個の文字を処理することをも意味する
試験結果は次の通りであった。4556字は良好に識別
され、22字は11体VC「重複」され、6字は1体に
「三重複コされた。これは、韻りを修正する巡回のみを
用いて0.55%の誤り率に相当する。多重文字のすべ
ての場合に、巡(ロ)された一体文字は正しい高さを有
し、かつ1個の0の平均幅、面積および周囲を正確に重
抄したり、1つの場合には三重検した。一体文字が重複
された点の視覚検査は、文字間ギャップが実際にわずか
2ビクセル幅であった1つの場所を示す。これらの結果
はここで前に説明された多重文字解体のための最小ブリ
ッジ幅制限を使用せずに達成された。
正しい場所で文字を解体する最小ブリッジ幅その他の方
法の使用は、パラメータの決定および文字の認識に先立
って、重複文字を正しい数の文字に解体するのに極めて
有効である。注目すべきことは、「1981年TI特許
部受領」と標示しているTI特許事務所の印が文字認識
の行われた後で頁に押されたことである。
ここに説明された方法により、不連続テキストはOCR
法を用いて読むことができる。ここに開示された他のテ
キストを読むのに用いられる同じ装置は、この方法によ
り使用することができる。注目すべき重要なことは、本
発明の装置はどれも不連続テキストの読みを実行するた
めに変更を必要としないことである。ドツト・マトリッ
クス・プリントおよび他の不連続テキストの読みは、O
CR分野では重要な問題であった。これはその間地に対
する1つの解答である。この解答は、極めて迅速でしか
も正確な文字認識を可能にする。さらに、ドツト・マト
リックスまたは不連続文字は連続文字と同じ頁にあるこ
とができ、試験順序の特別な変更は不要であり、完全頁
は所望の場合拡大試験セル領域で試験することができる
文字が巡回された後で、マイクロプロセッサは実行され
ている実施例により、その文字に関するパラメータのい
ろいろな組を決定する。注目すべき重要なことは、パラ
メータのこれらの各組がOCR機能を果たすために他と
無関係に使用されることである。例えば、1つの実施で
は、マイクロプロセッサは文字のパラメータの1組とし
て高さ、幅、周囲、および周囲内の面積を決定する。ま
たマイクロプロセッサはパラメータの第2組として文字
の輪郭を表わす1組の輪郭番号から成るディジタル波形
を決定する。もう1つの実施例では、マイクロプロセッ
サは巡回中に出会いかつここに説明されたようなプログ
ラム可能ペネトレータとして用いられる各Yでの最大お
よび最小X5ならびに各Xでの最大および最小Yを決定
する。マイクロプロセッサは各YおよびXでのそれぞれ
最大および最小XならびにYから成るパラメータの追加
の組を供給することができたり、特定のYまたはXの値
を選択することができ、また後で説明する通り実行され
ている実施例によりパラメータのその組としてこれらの
中の少しだけを供給することができる。これらの各パラ
メータは他のパラメ−タと組み合わせて使用されたり、
それらはOOR機能を果たすために他と無関係に使用さ
れる。パラメータの追加の組は、試験されている文字の
巡回忙関係なく決定される。
マタマイクロプロセッサは、いま巡回を終ったばかりの
文字の全幅および高さを決定するために、完全な巡回の
際に出会った最大および最小のXならびにYをも使用す
る。ピクセル内の文字の幅は、最大Xから最小Xを引い
て1を加えること、すなわちXH−XIJ+1によって
められる。文字の高さは最大Yから最小Yを引いて1を
加えること、すなわちYH−YL+1によってめられ、
文字の全高さが与えられる。
巡回された文字の周囲は次の通りめられる。
1つの基準セルから次の基準セルへの運動がコンパス方
位の変更を要求しない度に、その運動は1つのセルから
次のセルへの直線運動と言われる。
しかしコンパス方位番号が増分または減分によって変わ
るときは必ずこれは回転と呼はれる。コンパス方位は、
回転を生ぜしめる1つのセルから次のセルへの運動によ
り、または同じ基準セルを保ちかつ次の試験のための新
しいセルを提供するように回転することKよって、変更
することができる。第5a図から第5j図までは、コン
パス方位番号が直線に進むと思われる回数、およびそれ
が説明された通り回転と思われる回数を明示する。
周囲は次の公式を用いて計算される。
PBR−PS十K PN ただしFIRは周囲、Paは直線変換の回数、すなわち
新しい基準セルが選択されたがコンパス方位番号は不変
圧保たれた回数、Kは定数、PNは回転の数、すなわち
文字が巡回されたときのコンパス方位の変化の回数であ
る。本実施例ではに一1/、I!であり、これはtlぼ
に一?□・/10である。この公式は20〜30ピクセ
ル以上の大きな文字体で一層正確な周囲となり、面積が
大きければ大きいほど近似値は正確になる。
調査中の文字に含まれる面積は、ビクセルeバッファに
記憶された試験される文字の周囲のみの使用を要求しか
つ請求積計と呼ばれる新しい方法によってめられる。順
次求められた基準セル間の関係がこれらの基準セルによ
って囲まれる面積をめるのに用いられる方法は、巡回中
に使用される。文字の面積は、ブラック・セルの周囲の
境界内に置かれるビクセルの数に対応する。
したがって、rtJ、「、」およびrOJはおのおの、
文字の周囲内にあるホワイトまたはブラックのビクセル
数を表わすその文字の周囲内の面積−を持つ。面は次の
通りめられる。2個のレジスタ、・すなわち面積レジス
タDPAおよび長さレジスタDPLがセットアツプされ
、これらは第8bll、に向けられるときDPLレジス
タは増分される。運動が南に向けられるときDPLレジ
スタはDPムレジスタに加えられ、運動が西に向けられ
るときDPLレジスタは減分され、また運動が北に向け
られるときDPLレジスタはDPAレジスタから引かれ
る。
巡回が終ると、 DPAレジスタはセル内の文字の周囲
内の面積を含む。
第9a図から第9f図まではn個の最も新しいコンパス
方位番号のベクトル和の角度のめ方を示す。各ボックス
において、VYおよびVXはVVOの現在の内容のベク
トル和を表わす4ビット語を示す。VBO(N)は、コ
ンパス方位番号の最も新しい値のNを保つ2ビツト暗の
一次元アレイである。本実施例では% Nは6にセット
されているが、所望のデータ量次第で1から10までの
任意な数に容易にセットされる。
第9a図に示される通り、円の中心は星印を持つボック
スによって示され、ボックスに標示される各角度が中心
を囲む。第11a図に示される通り、束は0で表わされ
、北は64、西は128、そして当然用は192で表わ
されるので、完全な円は0から255まで256単位か
ら構成される。
第9a図は本実施例のために特別に設計されているので
、もしコンパス方位が5未満であれは、波形が与えられ
ず、これらの角度は第9図の左にはずれるが、コンパス
方位番号の別の番号が試験された場合は波形が与えられ
る。第9btWは、5っのコンパス方位がめられてから
第9a図に示される探索表からの角度の選択をグラフで
示し、ベクトル和の角度がめられる。第1コンパス方位
番号は当然北の64、次の2つは西の128.4番目は
北、そして5番は西であったし、104の角度がベクト
ル和の角度として抽出されることか分かる6第9C図に
示される例における次のコンパス方位番号は北であり、
北であった最も古いコンパス方位番号は終り奢消され、
新しいコンパス方位は最も新しいコンパス方位の終点に
その丸を置かれるので、ベクトル和はもう一度104で
ある。第9d図は次のめられたコンパス方位番号として
北のコンパス方位を示し、これはその先端に尾を置き最
も古い残っているコンパス方位を消すことによって最も
新しいコンパス方位の上に加えられ、本例では最も古い
コンパス方位は西であったので次のコンパス方位角は8
8である。
第9θ図は北としてめられた次のコンパス方位番号を示
し、これは前のコンパス方位に加えられ、西であった最
も古い方位は消されて74の角ディジタル波形の最終の
形を示す第9f図のグラフに1単位の長さの線が示され
ている。本例から分かる通り、マイクロプロセッサ90
が試験される文字の輪郭の回りをステップするにつれて
、コンパス方位のベクトル和の角度はその文字の輪郭の
実際の形状に相当する。ディジタル波形は、ベクトル和
を作るコンパス方位番号を増減することによって多少敏
感にされる。ITJのディジタル波形はしたがって、一
番上の線を横切る東への運動を表わすOの長いストリン
グと、中央に戻る西への運動を表わす128の短いスト
リングと、マイクロプロセッサがTの底に南へステップ
働ダウンするときの192の長いストリングと、それに
続いてマイクロプロセッサが頂部まで北にステップ・ア
ップするときの64の長いストリングとによって構成さ
れ、128のもう1つの短いストリングで終る。
第8c図に示される通り、ディジタル波形は第8b図お
よびいま詳しく説明されたばかりの第・9a図から第9
e図までに示される方法と違った方法を用いて巡回中に
抽出することかできる。この代替実施例では、均在の基
準セルがXまたはYのいずれかの方向に輪郭番号が抽出
された最後の基準セルから離れた2つの基準セルである
ときにかぎり輪郭番号が抽出される。第8C図ではXO
LDおよびMOLDは、輪郭番号かめられた最後の基準
セルのXおよびYアドレスを表わす。X −IOLDの
絶対値が2に等しいかそれより大きいとき、またはY−
YOLDの絶対価が2に等しいかそれより大きいとき、
新しい輪郭番号が選択され℃、第9a図から第9e図ま
でについて説明された探索表をアドレス指定することに
よりディジタル波形の一部として直列に加えられる。
第8c図の方法と第11a図の方法との主な相違は、第
8C図の方法がコンパス方位番号のベクトル和の角度を
めるためにX、Yとl0LD。
YOLDとの間のコンパス方位番号のみを使用すること
である。その結果、わずか2個または3個のコンパス方
位番号が相互にベクトル加算されて、第11a図から第
11e図までに示されるような5個または6個の従来の
コンパス方位番号を使用せずに角度がめられる。したが
って、第11a図の角度の図はそれに対応してより小さ
く1.7第80図の流れ図を用いて得られる可能な角度
より小さい。しかし一般角度方向は両者とも同じである
もう1つの相違は、第8c図に示される方法がディジタ
ル波形において多数の輪郭番号のわずか半分を生じるが
、その理由は輪郭番号がせいぜい他のすべての基準セル
についてめられかつおそらく第8b図の流れ図で行われ
また第11a図から第11e図までについて説明された
通り、各基準セルを読むのではな(第3基準セルのみに
ついてめられるからである。第8C図から生じるディジ
タル波形は必然的に第8b図の方法を用いて生じるもの
と違った形になるが、文字の一般輪郭はいずれによって
も抽出され、両波形の組で同様となる。第8b図または
第8c図の方法は、読まれている文体または文字あるい
は所望の応用次第で相互に互換される。
巡回にかかわらずめられるパラメータの1組はカリパス
である。カリパスは、選択された位置の文字の縁と同じ
側に沿う文字の最大延長との間のビクセルの数を表わす
1個の数である。すなわち、文字な完全に囲むボックス
の縁と特定位置における第1ブラツク・ビクセルとの間
のホワイト・セルの数がそのカリパス数の値である。1
つの実施例では、5個のカリパス数がめられまた別の実
施例では36のカリパス数がいま説明された通りめられ
る。
注目すべき重要なことは、5個のカリパス数は文字認識
を行う別の方法釦用いられることであり、次に36個の
カリパス数は基準文字のカリパス数と比較してここに説
明された。
第8a図および第7a図は、巡回が終ってから5個のカ
リパスをめる方法を示す。5個のカリパスは次のように
められる。文字のその側で文字の最大延長を表わす最外
部の境界を正確に囲むボックスが描かれる。これは最大
および最小のXならびに最大および最小のYから巡回中
にめられる。この実施例では、カリパス1および2は一
番のセルから1個のセルだけ下に、すなわち南方向に置
かれて、それぞれ第7a図に示される通りカリパスの値
をめるために東および西に向って進む。カリパスはボッ
クスの縁で始まり、ブラック・セルに出会うまで内方に
カウントし、ブラック・セルが置かれる前に出会ったホ
ワイト・セルの数をその値として与える。カリパス2は
同様に、東側7)sら西に向って進み、ブラック・セル
が見つかるまで出会ったビクセルの数をカウントする。
第7a図に示される通り、カリパス1および2は数値を
与えられら、文字rKJの例では矢印で示される通りカ
リパス1は0でありカリパス2は1である。この実施例
では、カリパス3および4は西ならびに東側でボックス
の中央に正確に置かれ、ブラック争ピクセルが見つかる
まで出会ったホワイト・ビクセルの数をカウントしなが
らかつそのホワイト・ビクセルの数をそれぞれのカリパ
ス数どして出力しながら、それぞれ束および西に向って
進む。カリパス3は0の数字を与えられ、カリパス4は
9の数値を与えられ、おのおのは文字のその側にある最
も端のブラック・ビクセルと第7a図に示される通り試
験されている位置のブラック・ビクセルとの間のホワイ
ト・ビクセルの数を示す。本実施例では、カリパス5は
南、スナわちボックスの中央の底に置かれて、ブラック
拳ビクセルに出会うまで上方に進み、本例では6である
出会ったホワイト・ビクセルの数を出力する。
したがってカリパスは、その完全な文字について出会っ
た特定のXまたはYの値と最大あるいは!&/トのXま
たはY17)値との差を表わす数である。
る。これは、文字の特定な側のブラック・ビクセルの最
大延長で始めることによってかつブラック・ビクセルが
カリパスにより調査されている特定のXまたはY座標に
置かれるまでその最も外に延びたブラック・ビクセルか
らカウント・インすることによって表わされる。カリパ
スがその点に沿い文字の最大延長で調査されている場合
は、カリパスは第7a図に示される通り0の値を持つ。
これらの5個のカリパスのδI11定は、追加のデータ
を供給するのに用いられる本発明の1つの実施例である
。より多くのデータが所望される場合は、所望の感度次
第で5個のカリパスな各側に置いたり、片側に1個だけ
のカリパスを用いたりすることができる。文字認識のた
めに役立つパラメータ・データを供給し得る本発明の範
囲内でいろいろにカリパス数が変えられる。
第7b図は、1組5個のカリパス数ではなく1組36個
のカリパス数を作るように各文字について、合計36個
のカリパスがめられる。mZb図のカリパスは本発明の
実施例に使用されかつ特に有効であることが判明し、次
の通り文字の回りに置かれる。9個のカリパスは次の通
り各個についてめられる。2個のカリパスは第7b図に
示される通り各側の最大延長から1ビクセル内に置かれ
る。残りの7個のカリパスはいずれかの端で2個のカリ
パス間に一様に隔離される。カリパスはマイクロプロセ
ッサ9oによりなるべく一様に隔離されるが、言うまで
もなく7個のカリパスの配置はマイクロプロセッサが7
個のカリパスを等分に隔離しようとするが文字の高さお
よび幅により文字ごとに多少違うかもしれない。第7b
図に示されるような結果は、次の通り上側で一連9個の
カリパスである:15,10,1 、o、口、1゜5.
10,15゜同様な1組のカリパス数が第7b・図に示
される通り文字の他の4つの各個についてめられる。3
6個のカリパス数の組は巡回と関係なく使用され、巡回
されている文字にかかわらずめられる。他の実施例では
、66個のカリパス数は巡回後および高さと幅がめられ
た後でめられる。
1つの特定実施例では、文字は巡回され、パラメータの
高さおよび幅のみはパラメータの第1組に含まれる。パ
ラメータの第2組は36個のカリパス数から成っている
。本実施例では、周囲内の面積および周囲はめられない
。文字は高さと幅とから成る第1組のパラメータおよび
66個のカリパス数から成る第2組のパラメータによっ
て形とが弔」明した。
巡回中、マイクロプロセッサ90は各XおよびYについ
てそれぞれ出会った最大および最小のXおよびYを記憶
するようにプログラムされる。このデータはプログラム
可能なペネトレータ試験を実行するのに用いられる。注
目1′べき重要なことは、マイクロプロセッサ90が位
置を迭択したり、プログラム可能なペネトヤータ試験を
実行したりしないことである。むしろ、マイクロプロセ
ッサ90は巡回中に出会った各Yについて最大および最
大のX、ならびに巡回中に出会った各Xについて最大お
よび最小のYをめかつ記憶する。このデータは1組の中
に置かれて、インターフエース中ユニットに転送される
ので、マイクロプロセッサ148はここでさらに完全に
説明される通りプログラム可能なペネトレータ操作を実
行することができる。
マイクロプロセッサ90にJって多くのパラメータをめ
る方法が説明されてきた。これらのパラメータは第1組
、第2組、第3組または第4組のパラメータを与えるよ
うにいろいろな組に置かれてまとめられる。説明された
パラメータは次の通りである:高さ、幅、周囲内の面積
、周囲、ディジタル波形、5個のカリパス、36個のカ
リパスおよびプログラム可能なペネトレータ・データ。
これらのパラメータは次の通りいろいろな組にまとめら
れる=1紐は各個のパラメータのみとして構成され、例
えば1組は高さとして構成され、もう1組は幅として構
成され、もう1組は波形として構成され、以下同様であ
る。またパラメータは各組の中で多Iパラメータをひと
まとめにされ、例えば1組は高さおよび幅から成り、も
う1組は高さ、幅、周囲内の面積および周囲から成り、
もう1組は高さ、幅および5個のカリパスから成り、以
下同様である。パラメータが組の中にまとめられてから
、それらは第1組、第2組などにより、それらが基準文
字と比較される順序に関して配列される。パラメータの
組について使用されたいろいろな実施例は次の通りであ
る:高さ、幅、周囲内の面積および周囲から成る第1組
、波形から成る第2組;高さ、幅、周囲内の面積および
周囲から成る第1組、5個のカリパスから成るM2組、
波形から成る第3組;高さ、幅、周囲内の面積および周
囲から成る第1組、プログラム可能なペネトレータから
成る第2組;高さと幅とから成る第1組、66個のカリ
パスから成る栗2組。パラメータは調食されている文字
の組により異なる順序でいろいろな組に組み合わされる
。例えは、幅から成る第1組は36個のカリパスまたは
ディジタル波形を伴うことがある5個のカリパスから成
る第2組を伴うことがあり;別法としてパラメータの第
1mは5個のカリパスから成りかつ第2組はプログラム
可能なペネトレータまたはディジタル波形から成ること
がある。言うまでもなく、各パラメータは組の中で相互
にパラドールに使用されたり、文字Mlltieを行う
ように直列に配列されたりjる。マイクロゾロセラ?9
0のプログラムは各文字から抽出されるパラメータを指
定するので、適当なパラメータが比較のためにマイクロ
プロセン+j148に供給される。
文字の各側で9個のカリパスを使用することは特に有効
である。文字を&Rするために各側で5個、6個、7個
、8個、9個、10個、1″1個などのカリパスを用い
て多くの試験が行われた。奇数個のカリパスが偶数個の
カリパスよりも正確であることが判明した。1つの側に
沿ってカリパスを置くと、文字を認除する際にカリパス
の精度に影響を及ぼすことも判明した。さらに、使用す
るカリパスの数が多くなるほどOORを実行する次擬時
間が長くなった。例えはある字体の1つの実施例では、
1つの側に11個のカリパスを使うと時間がかかったが
文字を開織する精度はほんの少し良くなったに過ぎない
。異なる位置に任意な数のカリパスを置くことができる
が、ここに説明された間隔で各偶に9個、合計66個の
カリノ々スを使用すると、使用されている8つの字体で
英語のアルファベット文字のOORな行うのに特に好適
であることが判明した。
マイクロプロセッサは次の方法で各基準文字のがビクセ
ル・バッファに文字を置くことができるように所望の字
体の印刷された文字を供給する。
操作員はそのとき、端子を通してマイクロプロセッサに
、パラメータが特定の文字についてめられるべきことを
示し、またどの文字からこれらのパラメータが得られる
かを示す。次にマイクロプロセッサは、高さ、幅、周囲
、周囲内の面積、ディジタル波形、カリパス、および各
XとYとにおけるそれぞれの最大ならびに最小のXとY
のような前述のパラメータを抽出し、これらをそのタイ
プの字体の文字を表わす記憶位置に置く。操作員は次に
1その特定文字用の基準文字テンプレートを作るのにマ
イクロプロセッサが使用する10.000文字をしばし
ば越える同じタイプの字体でこの文字の例をもつ゛と多
く供給する。基準文字テンプレートにいま記憶されてい
る文字と同じである別の文字が読まれるにつれて、マイ
クロノロセッサはテンプレート記憶装置を更新する。
例えば、マイクロプロセッサは何千というrAJを読む
であろうが、最初のrAJが読まれるとき、基準文字r
AJ’に対応するその高さ、幅、周囲などのパラメータ
を置くであろう。次のAが読まれるとき、マイクロプロ
セッサは最も新しく読まれた基準文字の高さ、幅、その
他の任意なパラメータが記憶装置内の基準文字のパラメ
ータより大であったり/11である場合、基準文字の記
憶を更新するであろう。多くの文字が読まれた後で、マ
イクロプロセッサはすべての「A」について出会ったr
AJの最大高さを設定するであろうし、またすべてのr
AJについて出会った最小高さをも設定するであろう。
同様にマイクロプロセッサは、幅、周囲内の面積、およ
びカリパス数のような各パラメータについてアルファベ
ットの各文字で出会った最大および最小値を設定するで
あろう。テンプレート記憶装置内の各文字は、その文字
を独自に形成する1組のパラメータによって形成される
であろう。基準文字のテンプレート記憶装置はある範囲
により定められる各パラメータのために記憶された最大
および最小値を持つと思われるので、文字は特定文字用
のパラメータの許容範囲内に入るがどうかを決定する試
験を受けるであろう。
マイクロプロセッサは各文字のディジタル波形をめ、こ
の波形を基準文字としてテンプレート記憶装置に入れる
であろう。
この方法で、マイクロプロセッサは任意な字体の任意な
文字を知らされ、その特定の文字のパラメータは極めて
容易に更新することができる。基準文字記憶装置を構成
するように供給される基準文字が多いほど、テンプレー
ト記憶装置は一層標準化されるであろうが、言うまでも
なく、OGRを開始するために適当な基準文字記憶装置
を具備すべきマイクロプロセッサにとって必要なすべて
は、各文字のIIんの二、三の例である。
基準文字テンプレート記憶装置は、巡回を行うマイクロ
プロセッサにより供給されるほか、多くの他の装置によ
って供給される。例えば、笑顔に用いられた1つの実施
例は、次に各文字の巡回を行いかつ操作員によって知ら
される形と同じ形の多くの文字を読むことから基準文字
テンプレート記憶装置を供給する大形コンピュータに試
験文字パラメータを送り込むものである。大形コンピュ
ータの基準文字テンプレート記憶装置が形成された後、
コンピュータはlPROM% ROM 、 またはその
データバンクに記憶したテンプレート記憶装置から成る
他のある永久記憶装置を作るように出力を供給すること
ができる。この方法で、大形コンピュータは多くの異な
る字体のタイプおよび多くの異なる書体のアルファベッ
ト文字を読むとともに、これらの異なる各アルファベッ
ト書体の基準文字パラメータを持つテンプレート記憶装
置を供給するのに用いられる。
OCRに用いられるもう1組のパラメータは、プログラ
ム可能なペネトレータと呼ばれる。プログラム可能なペ
ネトレータは、試験される個別文字に専用な特定文字の
一定パラメータの独特なサンプリングである。プログラ
ム可能なペネトレータは、巡回中にめられた各Xおよび
Xにおけるそれぞれの最大および最小のXおよびYから
のデータを用いてめられる。ペネトレータは、1つの準
大手のその同じ側のブラック・ビクセルの最大延長との
差を測定する点でカリパスに似てい”るが、それらはプ
ログラム可能でありかつアルファベットの各文字につい
て変えられまた多くの文字はプログラム可能なペネトレ
ータを持たないので、それらはカリパスと大きく違う。
プログラム可能なペネトレータは、第1組のパラメータ
が事情により大多数の文字を除去した後に、混乱するお
それのある他の文字から1つの文字を区別するのに用い
られる。字体に左右されるアルファベットの多くの文字
は、高さ、幅、周囲、および周囲内の面積から成る第1
組のパラメータが使用されるときのみ任意な他の文字と
混同されることはない。例えば文字[Jは高さ、幅、周
囲、および周囲内の面積から成る第1組のパラメータの
みによって独自に形成される。同様に、「。」および「
、」はこれら4個のパラメータのみによって独自に形成
される。アルファベットの多くの他の文字は、高さおよ
び幅の制限が他の文字には同じ高さと幅とがなくまた周
囲もその文字の境界内の面積もないような制限であるな
らば、独自に形成される。
これら4個のパラメータのみによって独自に形成される
これらの文字はプログラム可能なペネトレータを持たず
、むしろその代わりに、文字が4個のパラメータのみに
よって独自に形成されることの表示をテンプレート記憶
装置に記憶したと思われるので、マイクロプロセツサは
これら第1組4個のパラメータの全8回の試験が完了す
ると同時に試験文字とこれら基準文字の1つとの間の調
和を示すことができる。
すべての可能な基準文字を除去するのにm1組のパラメ
ータを使用することが本発明の重要な1つの要素である
のは、この比較が基準文字テンプレートにある各文字に
関する時間のかかる比較法の使用を省くことができるか
らである。数多い試験および多くの字体の読みによって
、高さ、幅、周囲、および周囲内の面積から成る第1組
のパラメータを使用することにより特定字体の他の文字
と混同される文字をめることができる。例えば、文字「
rn」はアルファベットの1つの字体であるゴシック1
2において文字r−Jとのみ静間されることがある。文
字「B、LL、V、Xおよび2」は文字rnJの4個の
基本パラメータを通すことができる。文字rhJはその
基本の第1組のパラメータ試験の4つをすべて通ること
ができる英脂のアルファベットの1つの字体、すなわち
ゴシック12で多くの文字を持ち、これらの文字は[2
゜51510 t B t IPs 13 p Jt 
Kt R) ” p UpV 、 X 、 Z 、 k
、 、 aおよびす」テある。文字rhJで見られる通
り、アルファベット文字の有効数字はこの文字がその基
本パラメータ試験を通過し得る多くの他の文字を持つ場
合でも考慮から除外される。第1組のデータのこれら4
回の試験を使用すれば、文字rhJでさえも著しい時間
が節約されるであろう。
注目すべき重要なことは、第1組のパラメータを用いて
多くの基準文字が極めて迅速に考慮外に除かれ、また次
に第2組のパラメータを用いて各文字を一段と正確に足
め得ることである。通常第2組のほうが時間がかかるが
、第1組よりもずっと正確である。前述の通り、パラメ
ータのいろいろな組が使用される順序はいろいろな応用
で変わることがあるが、変化する速度と文字認識能力と
を持ついろいろな組のパラメータの使用は本発明の特徴
の1つである。
どの文字がその第1組のパラメータを通過し得るかはア
ルファベットの各文字についてめら札これらの文字は各
文字のプログラム可能なペネトレータをめるのに使用さ
れる。プログラム可能なペネトレータは、次の操作の1
つ、すなわち最も近いブラック・ビクセルまでの距離を
める4つの側のどれからでものペネトレータまたは文字
の任意な部分から同じ座標線に沿って一緒に来る1組2
個のペネトレータ、を提供するように各文字について特
別に設計されている。これらのプログラム可能な各ペネ
トレータは、各XおよびYでのそれぞれ最大および最小
のXならびにYから成るデータからめられる。例えば文
字rmJは、高さ、幅、周囲内の面積、および周囲から
成る第混同されることがある。操作員は、例えば上の側
から下り左側から5ピクセルまたは6ビクセル上のペネ
トレータの値(これはrmJの場合0,1゜2でなげれ
ばならず決して第7C図に示される通り6を越えてはな
らない)をめることによって得られる文字rmJのプロ
グラム可能なペネトレータをめることができる。しかし
rWJの場合は、左側から5ピクセルまたは6ビクセル
中のX位置で上側から下るペネトレータは平均10ない
し15の範囲となり、悪くても決して5未満とはならな
い。かくて、このペネトレータはrmJをrWJから区
別するプログラム可能なペネトレータとして操作員によ
り選択され、かつ1組のパラメータがすべての他の文字
を考慮から除外した後でのみ使用されるであろう。
同様に、操作員は同じくその4つの基本パラメータ試験
を通過することができる他の任意な文字からそれを区別
するアルファベットの各文字についてプログラム可能な
ペネトレータをめることができる。例えば、「nJIc
関するプログラム可能なペネトレータは下側から上の#
景ぼ中央に進み、かつ「n」に関するプログラム可能ペ
ネトレータ試験を通過するように下側の上の少なくとも
7〜10ビクセルに第1ブラック−ビクセルが置かれる
ことを要求する。n、「θ、U%v、x、zJのm1組
のパラメータを通す文字から分る通り、この特定のペネ
トレータはすべてのこれらの文字から文字rnJを区別
する。アルファベットの各文字に関するプログラム可能
なペネトレータはここには与えられおらず、使用された
例は実際に用いられたり、用いられるかもしれないプロ
グラム可能なペネトレータの形式を説明するものにすぎ
ない。プログラム可能なペネトレータの決定は、境界が
個々の操作員によってセットされるにつれて、特定の字
体のその文字に関するm1組のパラメータ試験Zも通過
し得る文字にM接関係があると思われる。注目すべき重
要なことは、本実施例においてプログラム可能なペネト
レータはアルファベットの他のすべての文字からある特
定の文字を区別するのに用いられるが、前記試験文字に
比較されかつある点で前述のように似ていると思われる
他の文字の制限された1組から特定の文字を区別するの
に用いられるにすぎないということである。
もう1つの実施例では、プログラム可能なペネトレータ
は任意な他の組のペネトレータを使わずにアルファベッ
トの各文字音独自に定めるのに使用することもできる。
完全な基準文字記憶が与えられると、マイクロプロセッ
サはOCRを開始する準備を整える。認識すべき多くの
文字が印刷された、仕事の書簡、証書その他の報告書の
ようなものの頁は、頁の像を供給してそれをマイクロプ
ロセッサがパラメータをめ始めるビクセル−バッファに
送るイメージヤの上に置かれる。マイクロプロセッサは
mBa図について説明した順序で文字を読む。次にパラ
メータは前述の方法でビクセル・バッフ7から各文字に
ついて抽出される。
言うまでもな(、マイクロプロセッサは文字昭職を実行
する際にすべての他を除外して1組または2組のパラメ
ータのみを使用するようにプログラムされたり、所望な
らばすべての組のパラメータを一緒に使用したりするこ
とができる。例えは、1つの文字がこの1組のパラメー
タによって独自に形成されるだけの情報をディジタル波
形のみが含むことができる。しかしこれは前述の通り時
間のかかる試験であり、OCRの一部として小文字から
ブベての大文字のような極端に違った文字を除くために
、この試験を他の組のパラメータと共に使用してはるか
に高速にすることがしはしば望まれる。同様に、プログ
ラム可能なペネトレータは4個の基本巡回パラメータと
共に、ディジタル波形と共に、5個のカリパスと共に、
あるいはその任意な組合せで使用することができる。あ
る場合には、組の中の多数の文字が相互によく似ている
ならば、すべての組のパラメータを使用することが望ま
しいかもしれない。各組のパラメータを一緒に使用する
と極めて敏感になり、数百または数千といった文字から
成る極めて大きな文字の組でも、相互によく似た個々の
文字を独自に定めることができる。1つの実施例では、
菖1組のパラメータは高さと幅とから成り、第2組のパ
ラメータは36個のカリパスから成る。別の実施例では
、第1組のパラメータは高さ、幅、周囲内の面積、およ
び周囲から成り、第2組のパラメータはディジタル波形
から成る。もう1つの実施例では、第11i4のパラメ
ータは高さ、幅、周囲内の面積、および周囲から成る。
第2組のパラメータは5個のカリパスから成り、第3組
のパラメータはディジタル波形から成る。
パラメータが抽出されると、パラメータは基準文字との
比較のためおよびその文字と特定の基準文字との調和な
卸るために、マイクロプロセッサ148に送られる。マ
イクロプロセッサはFA。
B、0Jrzどのような任意な文字との比較を開始し、
すべての大文字に進み、次に小文字、さらに数字および
記号に進むことができ、またはマイクロプロセッサは英
語のアルファベットで最もよく使用される文字で始まり
、次に[e 、 t 、 a、o。
1、n」などのような任意な所望の文字に進むようにプ
ログラムされる。
マイクロプロセッサ148は、操作負やプログラムによ
って制御されるようなプログラム指定の順序で、試験文
字のパラメータを基準文字の対応するパラメータと比較
し始めるであろう。1つの実施例では、第1組のパラメ
ータは文字の高さと幅のみから成る。もう1つの実施例
では、第1組のパラメータは文字の高さ、幅、周囲、お
よび周囲内の面積から成る。
高さ、幅、周囲内の面積、および周囲は次のように比較
される。比較すべき第1組にある第1パラメータが試験
文字の高さである場合は、マイクロプロセッサは試験文
字の高さを基準文字の最大高さと比較し、試験文の高さ
が基準文字の最大高さに等しいかそれより小さければ試
験文字はその基準文字の最大高さ試験を通過するといわ
れる。
次に試験文字の高さはその基準文字の最小高さと比較さ
れる。試験文字の高さが基準文字のl&手高さより大き
ければ、試験文字は基準文字の最小高さ試験を通過する
といわれる。しかし試験文字の高さが基準文字の最大高
さより大きければ試験文字は基準文字の最大高さ試験に
合格せず、パラメータ試験の1つ忙合格しない不調和と
してその点で却下される。試験文字が基準文字の最大高
さ試験を通過しても基準文字の最小高さ試験に合格しな
ければ、基準文字は試験文字と不調和であるとして却下
され、次の基準文字が比較のために選択される。高さ、
幅、周囲、および周囲内の面積の4個の各パラメータに
ついては2つの試験があり、各試験文字は第1組のパラ
メータを合格させるために8回の基準文字試験を通過し
なげればならない、試験文字が第1組で8回の試験のど
れでも1つに合格しないときは、基準文字はその試験文
字と不■和として却下され、次の基準文字のパラメータ
がその試験文字と比較されて、その試験文字がその次の
基準文字の81組にある4個のパラメータのすべて通す
かどうかが調べられる。マイクロプロセッサ148は、
基準文字が第1組のすべてのパラメータ試験を通過する
まで、現在の基準文字が第1組のどんなパラメータ釦も
調和しないと速やかにそのテングレート記憶装置から基
準像。
字を選択し続ける。この点で、第2組のパラメータは基
準文字の対応するパラメータを通すものと比較される。
基準文字が最大および最小高さの価の範囲同tこある場
合は、試験文字の幅はその基準文字の最大幅と比較され
、次にその基準文字の最小幅と比較され、もしそれが最
大および最手の両境界内に入るならば、それはその基準
文字の幅試験を通過するといわれる。1つの実施例では
、66個のカリパスを用いるパラメータの次の組が各文
字を認識するために次に使用される、しかしもう1つの
実施例では、試験文字はその特定の2!!:準′5c字
の周囲および周囲内の面積の最大および最小値と比較さ
れる。言うまでもなく、試験文字は周囲、次に昧次に周
囲内の面積といった任意な1臓序であるいは、任意な所
望の順序で、基準文字と比較される。
1〜たがって試験文字はまず、基準文字についてめられ
た4個の各パラメータの最大および最小値から成る8回
の試験を用いる基準文字のパラメータと比較される。試
験文字がその基準文字の8つの試験のどれでも1つに合
格しなければ、マイクロプロセッサ148はその基準文
字を不λ14和としてすぐに却下し、8つの各試験の比
較を始めるように次の基準文字を提供する。これら8つ
の試験は、マイクロプロセッサ148によって極めて迅
速に実行されかつ試験文字が小文字であるときすべての
大文字をただちに考慮外に除去するのに極めて効果的で
あり、その逆も成り立つ。
多くの場合、4個のパラメータは、試験文字が最初の8
つの試験によって完全に足められかっ他のどんな基準文
字の試験でも通過できずまたは他のどんな試験文字でも
その基準文字の試験を通過できないようなパラメータで
ある。例えば、「0」、rQJおよび「、」はこれらの
文字を完全に定めるある字体の独特な1組の4個の基本
パラメータを持つ。「o」はそのノ」\さな高さと幅で
極めて大きな面積を有し、アルファペントの他の文字は
「oJK関する高さおよび幅の試験を通過することはで
きず、まKその彫/J%面積試験をも通過することはで
きないので、4個のパラメータに関する最初の8つの試
験はこの文字を独特に定める。マイクロプロセッサ14
8が第1組のパラメータによって独特に定められる基準
文字と一和するとき、マイクロプロセッサは試験文字に
調和するものとしてその基準文字のASOエエコードな
出力する。
試験文字が基準文字の第1組のパラメータを完全に通す
ことをマイクロプロセッサ148が決定すると、マイク
ロプロセッサは次にその試験文字のパラメータをその基
準文字の第2組のパラメータと比較し、その後テンプレ
ート記憶装置にある他の基準文字の第1組のパラメータ
とさらにどんな比較でも行われる。第2組のパラメータ
は文字のディジタル波形や、文字の5個のカリパスや、
文字のプログラム可能なペネトレータや、36個のカリ
パスや、その任意な組合せから成ることができる。これ
らの各組のパラメータは、試験文字のパラメータか基準
文字のパラメータと比較される方法において独特であり
、おのおのは特定の詳細ど共に説明される。
東8a図に示される実施例では、基準文字パラメータと
比較される次の組の試験文字パラメータは5個のカリパ
スである。この実施例では、vS験文字の5@のカリパ
スは下記の方法で基準文字の5個のカリパスと比較され
る。5個の各カリパスについて、各基準文字用のその特
定カリパスの最大および最小値はテンプレート記憶装置
罠記憶される。試験文字の対応するカリパスは基準文字
のカリパスと比較されて、2つの試験が各カリパスにつ
いて行われるようにその特定カリパスの最大および最小
値の境界内にそれがあるかどうかが決定される。試験文
字が5個のカリパス用の最大および最小値を表わす10
回のカリパス試験のどれでも1つに合格しないならば、
基準文字は試験に調和しないものとして却下され、次の
基準文字が比較のために選択される。36個のカリパス
が比較されるここに説明される方法は前述の5つのカリ
パス試験とは大きく違う。
ディジタル波形および36個のカリパスの比較ブ、cら
びに基準文字調和法は、相互にかつ他のパラメータ試験
と大きく違う。試験文字の波形または66個のカリパス
と比較される各基準文字は、その基準文字に関して省か
れるスコアを与えられる。
すべての基準文字が試験文字の波形または36個のカリ
パスと比較された後で、マイクロプロセッサ148はそ
の組のパラメータの通過文字として「最良の」スコアを
持つ基準文字を選択する。この点で、多数の文字を考慮
から除去するために第1組のパラメータの合格または不
合格の組の1つを使用すること、次に調5fllをめる
ために波形または66個のカリパスを用いて第1組を通
す各基準文字を比較すること、は著しい時間節約の方法
である。
1つの実施例では、第1組のパラメータが前述のように
試験文字を独自に定めない場合は第2組のパラメータの
みがめられるであろう。この例では、最低1個の他の基
準文字がその試験文字の第1組のパラメータ試験をも通
過し得ることは確実である。マイクロプロセッサは、そ
の試験文字の第1組のパラメータと比較するためにテン
プレート記憶装置にある各基準文字を選択するであろう
。マイクロプロセッサは、第1組のパラメータ試験のす
べてを通過する文字が見つかるまで、試験文字の第1f
fiのパラメータを比較し続けるであろう。次にマイク
ロプロセッサは、ディジタル波形の比vを行いかつここ
に説明される方法で曲線間の面積の積分を与えるであろ
う。この積分はその基準文字のスコアとして省かれるで
あろう。次にマイクロプロセッサは、試験文字の第1組
のパラメータをテンプレート記憶装置にあるすべての基
準文字と比較し続け、第1組のパラメータを通すテンプ
レート記憶装置にある各文字用の曲線間の面積の積分を
める。
すべての基準文字が調査された後で、マイクロプロセッ
サは請求められて記憶装置に記憶された各基準文字の曲
線の下の面積の積分を比較する。
マイクロプロセッサは、通過する積分として最低値金持
つ積分を選択しかつその試験文字の第1および第2組の
両パラメータ金通すものとしてその基準文字を提供する
でちろう。例えば、文字rs+u、V、!および2」は
文字rnJの第1組のパラメータを通すことができるが
、「B」のディジタル波形はrnJのディジタル波形と
大きく違うので、曲線間の面積の積分は極めて大きくな
るであろう。ディジタル波形間の面積の積分は、試験さ
れている文字と同じでない各文字では著しく大きい。デ
ィジタル波形法は時間がかかり、かつ第1組のパラメー
タをめることに比べると多数の計算を必要とする。した
がってマイクロプロセッサは第1組のパラメータが試験
された後で混同される文字のみをえり分け、次に相互に
混同されることがおる二、三の残りの文字についてディ
ジタル波形または66個のカリパス試験を実行するほう
が効果的である。
試験文字のディジタル波形が基準文字のディジタル波形
と比較される方法をこれから説明する。
相互に著しく異なる3つの異なる比較方法が決定された
。これらの各方法を特に詳しく説明する。
最も簡単な方法で、アルファベット形の文字を読むのに
第811図で示されている実施例に用いられている方法
は、第8d図の流れ図によって示される。第8d図の流
れ図において変数は下記を意味する: W O(N)は
文字の波形を含む輪郭番号連を表わし、ここでNは波形
内の規定位置における特定の輪郭番号であり;WT(N
)はテンプレート記憶装置に記憶された基準文字のディ
ジタル波形を含む輪郭番号連であり、ただしNは波形内
の特定の輪郭番号を表わし; OLOおよびTLOはそ
れぞれw O(N)ならびにW T (N)の中で比較
を開始する場所を示し;OH工およびTH工はそれぞれ
ディジタル波形No(N)ならびにWT(N)の終る場
所を知らせ; SUMは波形比較におけるその点までの
積分の蓄積を表わす語でありかつ比較の終りに認識スコ
アである全積分を含み;SMは積分の瞬時値を表わす語
であり; DXOおよびDI’l’はそれぞれ文字なら
びにテンプレートの「ヤード尺」として用いられる語で
あり;NOおよびNTはそれぞれWO(N)ならびにW
T(N)の輪郭を表わす語であり;xOおよびXTはそ
れぞれの文字および基準文字の波形全通る累積進行を表
わす語であり;XLは2個のディジタル波形を比較する
ために全積分を運ぶ進行の累積表示子を表わす語でちり
;FLAGはプログラムが平常通りステップしながら続
くことを示すためにローにセットされたり、プログラム
内の異なるステップの運動をフラグするためにハイにセ
ットされる状態語である。
試験文字および基準文字のディジタル波形はそれぞれ第
10a図ならびに第10b図に示されている。ディジタ
ル波形は、2つの波形の比較を実行する際に行われたよ
うに、第100図に相互の上部に置かれているのが示さ
れている。ディジタル波形のスコアは、2つの曲線間に
ある面積の積分でおる。第1Oo図に示される通り、2
つのディジタル波形は相互の上に置かれ、面積の一定量
はこれらの2つの波形間に存在する。波形間の相違は、
2つの波形の境界および第10c図に示されるボックス
の端によってセットされる曲線内の面積として示されて
いる。
波形の比較は、2つの曲線間の面積の積分をとることに
よって第8a図に示される通り行われる。
最初、各値は所望の開始点にセットされ、曲線間の面積
の絶対値は全積分がSUMレジスタに記憶されるように
全長に&って積分される。第10c図から見られる通り
、ディジタル波形が相互に似ているとき、曲線間の面積
は極めて小さく、理想的には0である。しかし面積がほ
とんど0でガいのは、2つの文字がしばしば全く同じビ
クセル・パターンで構成されないからである。
本発明のこの実施例では、ディジタル波形の比較は2つ
の波形と積分としてめられたスコアとの間で行われ、次
に文字の波形は最初の開始位置から右の6つの点に循環
移動され、全積分が再びめられる。3つのスコアの中の
最低のものは、テンプレート記憶装置からの特定な基準
文字用の最良のスコアとして取られる。
この移動は、2つの波形間のどんなずれでも補償するた
めに行われる。前述の通り、ディジタル波形は文字の輪
郭の全曲率の一般表示である。したがってrnJおよび
ruJのディジタル波形は相互に正反対であり、それら
が相互に比較される度に極めて大きな積分値を与えるで
あろう。同様に、アルファベットのすべての他の文字は
アルファベットの任意な他の文字よりもその輪郭の値が
著しく異なり、前述および第8d図に示される通り2−
′)の曲線間の面積の最低の積分を持つ基準文字を調和
として選択するととKよって簡単に相互に区別すること
ができる。
例えば手書きが比較されているとき、ディジタル波形を
もつと詳細に比較することがある場合に望ましいかもし
れない。詳細な比較が望まれるときに使用される新しい
方法をとれから説明する。
言うまでもなく、これらの方法は印刷済のテキスト金認
識するのにも使用される。
第9f図は前述の通υ第9a図から第9e図までに示さ
れた文字の回りのステップから作られるディジタル波形
を示す。完全な文字が巡回されてディジタル波形がめら
れると、波形は第10a図に示されるものに似ている。
第10a図では、試験文字は下部で00角度および上部
で255の角度を持つ文字用コンパス方位番号のベクト
ル和の角度を表わす1組のけわしいステラfを有する。
ディジタル波形は各位置で不連続な角度値を有し、その
値は数字の出力としても供給されかつ輪郭番号といわれ
る。
試験文字のディジタル波形を基準文字のディジタル波形
に比較する第1ステツプは、2つの値の大きさを正規化
することである。これは試験文字にある輪郭番号の数を
めて、この数を基準文字のディジタル波形におる輪郭番
号の数と掛は合わせ、次に基準文字におる輪郭番号の数
を試験文字にある輪郭番号の数と掛は合わせることによ
って行われるが、これは第10c図に示されるような2
つのディジタル波形の最小公分母を与えるために普通性
われるものである。ディジタル波形の大きさが相互に正
規化されてから、マイクロプロセッサ148は第11a
図から第11fL図までに示される通り相互に文字のデ
ィジタル波形を整列させる。
試験文字と基準文字のディジタル波形を整列させる2つ
の異なる方法を、第11a図から第11d図までについ
てこれから説明する。第1の方法では、第11a図に示
される通り、2つの文字は前述のように相互にまず大き
さが正規化され、次にマイクロプロセッサ14Bが試験
文字および基準文字にある一次ブイをさがす。最初の一
次ブイは、最短距離にわたって1′)の角度から次の角
度まで最大の増加を有するディジタル波形の部分として
められる。マイクロプロセッサは、すべての位置でディ
ジタル波形の導関数をとることによって最も急な変化金
持つ角度をめ、最大の導関数を持つディジタル波形の部
分は最もけわしい傾斜を有しかつ各ディジタル波形の第
1−次プイとしてめられるであろう。次にマイクロゾロ
セッサは、基準文字の第1−次デイを試験文字の第1−
次プイと調和させるが、それは第11&図に示される通
り輪郭番号の限界数以内にある。次にマイクロプロセッ
サは、各ディジタル波形の第2の最大急激変化を持つ第
2−次デイ金さがす。
第11b図は、基準文字および試験文字の相互の上部で
正確に整列された一次デイで調和された試験文字を示す
。第11b図から見られる通り、これも−次ブイが相互
に整列するように文字のある点で大きさの正規化を要求
する。−次デイが相互に整列されかつディのいずれかの
側のディジタル波形の大きさが相互に正規化されると、
マイクロプロセッサはそのときディジタル波形の次の最
も急激な変化で始まる二次ブイをさがしてそれられ相互
に調和させ、そしてブイの所望数にしたがってディジタ
ル波形の急激な変化を相互に調和させ続ける。
調和されるブイの数は、ディジタル波形の導関数の限界
値によってセットされる。すなわち、波形の導関数が一
定の限界値以下に降下すると、マイクロプロセッサは限
界値よりも大きい傾斜を持つブイの一定数をめて、それ
らf:2つの波形で相互に調和させる。この限界値は所
望通り少なかったり多かったりする波形を供給するよう
にセットされ、作業モデルの示したところによれば、文
字を所望通9相互に調和させるには8〜15の値が適切
でおる。
第11o図は説明を簡単にするために4個のブイだけが
使用された文字の調和を示すが、言うまでもなく大部分
の文字はさらに多くのブイを持つディジタル波形にずっ
と多くのデータを備えている。ブイをめる導関数の限界
値はマイクロプロセッサによって変えられる。置かれる
ディの数が一定数より小さく、例えば8より小でちるな
らば、マイクロプロセッサは限界を自動的に下げていま
下げられた導関数の限界値を上回る追加ディをめる。同
様にマイクロゾロセッサがディ調和を完了して導関数の
限界値に達し、かつディジタル波形用の15デイを越え
て置かれていることを見つければ、マイクロプロセッサ
は導関数用の限界値全自動的に上げて導関数の比較なら
びにディ調和・ を再度行うので、ディの最大数より少
ないものがいま供給される。
ブイが第11c図に示される通り相互に調和されてから
、マイクロプロセッサは次に基準文字に関する試験文字
の傾斜をチェックするが、これはディジタル波形におい
て直流バイアスとしてのみ示すであろう。これは文字認
識の他の形に勝るディジタル波形の大きな利点である。
文字が著しく傾斜されたり、横にさえなると、マイクロ
プロセッサは文字の正確な形状を与えるディジタル波形
を受け、傾斜は直流バイアスまたはオフセットとしての
み示すが、その理由は輪郭番号が自らに関して文字の曲
率を表わしかつ各輪郭番号がその文字を越える前の所定
距離に関する文字の曲率の平均だからである。輪郭番号
は上、下、その他の外部ソースについてめられず、自ら
に関する文字の曲率についてのみめられる。したがって
マイクロプロセッサ148は、第11c図および第11
eL図に示されるようにどんな直流バイアスでも除去す
ることによって相互に傾斜される同様な文字の波形を調
和させることができる。直流バイアスが除去されると、
ディジタル波形は第11a図に示される通り相互の上部
に正確に置かれるであろう。相互に正確に調和されない
位置は、ブイがめられずかつ相互に整列されない点であ
る。
言うまでもなく、ディジタル波形の多くの部分はブイと
なるほど重要ではなく、シたがって文字のディジタル波
形は第11a図に示されるようにいろいろな場所で相互
にずれを有する。
マイクロプロセッサはいま、試験文字に関するこの基準
文字のスコアをめる準備ができている。
マイクロプロセッサは、第116L図に示されている2
つの曲線間の面積を積分することによってスコアをめる
。その結果、マイクロノロセッサは全ディジタル波形に
わたってすべての位置で2つの曲線間の差の積分をめる
ことに々る。ディジタル波形が第114図の一部に示さ
れる通り相互の上部に正確にある場合、2つの曲線間の
面積の積分は極めて小であるが、ある点では曲線内の面
積を表わす差の積分は著しくなるであろう。マイクロプ
ロセッサは曲線の全長について曲線間の全面積の積分を
める。この積分は、ディジタル波形実施例において第2
組のパラメータを表わす試験文字に関する基準文字のス
コアである。
ディジタル波形を相互に調和させる別の方法をこれから
説明する。ディジタル波形は第11c図および第11a
図に示される通り相互に大きさが正規化されるが、マイ
クロプロセッサは一次または二次ブイをさがさない。本
実施例では、マイクロプロセッサはディジタル波形の一
端で始まり、曲線に涜う各点でディジタル波形の導関数
を計算する。ディジタル波形が所定の限界量を越えると
、マイクロプロセッサはこれを第1ブイとしてめる。マ
イクロプロセッサは、ブイの所定数が置かれ、通常4個
になるまで、ディジタル波形の導関数をめ続ける。次に
マイクロプロセッサは2つのディジタル波形に関してダ
イナミック・プログラミングとして知られる機能を果た
すであろう。
マイクロプロセッサ社名曲線にある第1ブイ金相互Kp
4和させて、ディジタル波形のその点まで曲線の下の面
積をめるであろう。マイクロプロセッサは次に、試験文
字の第1デイ″ft基準文字の第2シイに調和させて、
もう1つの積分をめるであろう。
マイクロプロセッサは、試験文字の第1ブイを、通常4
にセットされるが操作代によって定められる任意な値に
変えられる所定数までの基準文字の各ブイと調和し続け
るであろう。これらの各調和について、マイクロプロセ
ッサはディジタル波形のその点まで曲線間の差の面積の
積分をめる。
次にマイクロプロセッサは第2ブイを基準文字の第2ブ
イと調和させる一方、各波形の第1ブイを相互に調和さ
せて曲線のこの点における積分をめる。次にマイクロプ
ロセッサは、試験文字の第1ブイを基準文字の第2ブイ
と調和させるが、これは試験文字の第2ブイが基準文字
の第2ブイと調和されることができず第3、第4デイな
どと調和されなければならないこと全意味する。次にマ
イクロノロセッサは、基準文字の第2ブイを基準文字の
第6、第4ブイなどと調和させることによってこれらの
各調和の差の面積を積分し、これらの各調和について曲
線の下の面積の積分をめる。
次にマイクロプロセッサは試験文字の第3ブイから始め
てこれを基準文字の各ブイと調和させ、さらに試験文字
の第3ブイを基準ブイの第4、第5シイなどと調和させ
かつ試験文字の第4ブイをセット内の基準文字の他の未
調和ブイの1つと調和させながら、試験文字の第1ブイ
を基準文字の第6プイと調和させることを含む他の組合
せをも提供する。
4個のディについて、相互に調和するブイの多数の組合
せがめられ、かつこれらのゾ(’に調和させる各方法で
曲線の下の面積の積分がめられる。その結果は、N個の
ディが相互に1組に置かれて、基準文字のN個のブイと
調和され、その組は2つの曲線間の面積の積分が完全な
第1組についてめられた後で一度に1個のブイを波形の
下に移すであろう。最低の積分だけが、ブイの可能な正
しい調和として省かれるであろう。例えば、最低9個の
積分が省かれ、操作で処理されるが、最低9個ではない
第1組の積分は放棄され、その組は他の組との比較には
使用されないであろうが、その理由は比較がディジタル
波形の下に移動して行われるからである。
ダイナミック・プログラミングとして知られるこの方法
は、最低の可能な積分を与える波形の部分を相互に正し
く調和させる本発明の極めて価値のある方法である。こ
れが本発明の重要な方法であるのは、15個のような多
数のディがめられるとき、試験文字波形にある各ブイを
基準文字波形にある各ディと調和させかつ可能な各組合
せについて曲線の下の面積の積分をめることがおびただ
しい量の時間を要するからである。しかしこの方法では
、ディジタル波形が比較されて積分はある1組の中のN
個のシイの小さな部分組について与えられ、その組の中
の最低積分のみが保有され、他のブイ調和は相互に1組
の中に入らない稲のブイとは行われない。可能な各組合
せの積分がめられると、次の組からの積分は前の組の対
応見られない調和として放棄される最高値を有するもう
1組の積分が供給される。
最後の組がめられると、最低値を持つ積分は基準文字の
ディジタル波形に対する試験文字のディジタル波形のデ
ィの正しい調和といわれるであろう。波形のブイを相互
に調和させるこの方法は、走り書きの手書きまたは手省
きプリントで行われるような多くの異なる形の文字が使
用される場合に役立つ。この方法は、手書き文字で普通
性われるような特定文字の著しい変化があるときの好適
な実施例である。しかし言うまでもなく、前述の一次プ
イと二次シイをさがして調和させる方法は手書き文字ま
たはタイツライタがらの印刷文字についても使用される
各基準文字用の各文字のディジタル波形のスコアが節約
され、相互に比較される。最低値を持つ積分は前述の通
り試験文字t−a和させるものとして提供される。
文字の波形を相互に比較する6つの方法が説明された。
2つの方法は特殊な整列法を必要としたが1つの方法は
どんな誤整列をも調節するために波形を相互に回転させ
た。言うまでもなく、これらの方法はどれも、印刷され
たテキスト、手書きのテキスト、または中国語、ドイツ
語、ロシア語などのような他の言値の文字分析に役立つ
。認識される文字次第で、ある方法が他の方法よりも役
立つことがある。
第1組の後でパラメータの第2組として置き換えられる
もう1組のパラメータは、36個のカリパスである。1
つの実施例では、パラメータの第1組は文字の高さと幅
とからのみ成り、第2組は66個のカリパスから成る。
5個のカリパスの後で36個のカリパスを使用できるの
は、比較方法が相互に大きく違うからである。試験文字
の66個の々リパスを基準文字の66個のカリパスに調
和させるのは次のように行われる。
カリパス番号は、1つの側の文字の最大延長と文字のそ
の側にあるカリパスの位置との間のぎクセル差を表わす
1組66個ある。マイクロプロセッサ線、基準文字の第
1カリパス番号を試験文字の第1カリパス番号と比較し
て、両番号の差を出力として供給する。36個の各カリ
パス番号間の差の和がスコアとして供給される。試験文
字が基準文字と調和するとき、各カリパス用の出力の和
であるスコアは理想としては0でちるが実際にはごく低
い数である。しかし試験文字と基準文字が調和しないと
きは、スコアは調和するときよりも著しく大きくなる。
各基準文字用のスコアは節約され、最低スコアを持つ文
字が調和として促進される。第1組のパラメータは前述
のような合格壷不合格試験であり、第1組を合格する基
準文字のみがカリパス番号と比較される。これは著しい
時間節約の特徴である。36個のカリパスまたは波形法
のいずれかが第2組のパラメータとして用いられ、マイ
クロプロセッサ148が特定の試験文字と調和するよう
な基準文字のASOIエコーyt出力し得るように完全
な調和を与える。36個のカリパスおよび波形はいずれ
も、各基準文字用のスコアをめ、試験文字と比較され、
最良のスコアを持つ基準文字が合格するものとして選択
される。
66個のカリパスが文字の4つの各側に9個ずつ供給さ
れる前述の実施例では、各カリパス番号を計量する装置
が使用された。
66個のカリパスについて計量係数が使用されるトキ、
マイクロプロセッサ148はカリパス番号の理想値およ
びそのカリパスを受け入れることができる範囲をテンプ
レート記憶装置内に供給される。カリパス番号が範囲内
に入るとき、番号間の差は4倍される。例えばカリパス
番号1が4の理想値および基準文字テンプV−)記憶装
置に記憶された2の範囲を持つ場合、次に6の値を持つ
カリパスがそのカリパスと比較される場合、比較からの
出力は2つの番号の差を表わす1となる。
しかしこの第1カリパスと比較されたカリパスが9の値
を持つ場合は、マイクロプロセッサは2つの値の比較の
結果として5ではなく14を供給する。14という数字
は、2つの番号間の差をその範囲の外側の数について番
号4と6のための2の範囲内の2としてカウントするこ
とによって導かれる。範囲外の番号の差はペナルティ係
数4を掛けられるので、結は12シラス2で合計14に
なる。本実施例では、理想のカリパス番号は、数千の試
験文字の平均をとりかつこれを理想のカリパス番号とし
て用い、次に受入れられる文字が見いだされる範囲をめ
ることによってめられる。
調和を与えるように相互に同じく対応しなければならな
い文字の部分では範囲は0となるが、文字から文字へ変
化する文字の部分では範囲は実に20にも及ぶことがあ
る。カリパス比較を与えるこの実施例は、高さと幅とか
ら成る第1組のパラメータと共に用いられるとき特に有
効であることが判明している。
前述のもう1組のパラメータはプログラム可能なペネト
レータである。試験文字のプログラム可能ペネトレータ
は、カリパスまたはディジタル波形比較法と著しく違う
独自の方法で基準文字と比較される。プログラム可能ペ
ネトレータはここに説明された方法で各文字についてめ
られ、基準文字テンプレート記憶装置に記憶された。し
かしプログラム可能ペネトレータの位置が巡回中に試験
文字についてめられなかったのは、巡回を行ったマイク
ロプロセッサ90が値を取るペネトレータを知らなかっ
たからである。むしろ、イクロゾロセツサ90は各Xお
よびYについてそれぞれ最大および最小のXならびにY
を供給しかつこれらの数を前述の通り巡回中に記憶レジ
スタに記憶した。
マイクロプロセッサ90はこれらの数を、基準文字のパ
ラメータにより指定されたプログラム可能ペネトレータ
の位置をめるマイクロプロセッサ148に供給する。プ
ログラム可能ペネトレータ試験は合格または不合格試験
であり、特定の基準文字がその試験文字と調和するかど
うかを知るために極めて迅速に行われる。各文字のプロ
グラム可能ペネトレータの位置は異なり、前述の通り操
作代によっておらかしめめられるであろう。
第1組のパラメータによって独自に定められる文字はプ
ログラム可能ペネトレータを持たず、むしろマイクロプ
ロセッサは基準文字が第1組の各パラメータ試験を通過
すると同時に調和出力としてこれらの文字のASOエエ
コードを供給するであろう。しかし多くの基準文字は、
試験文字の高さ、幅、周囲、および周囲内の面積から第
1組のパラメータが構成されるとき、1つの試験文字用
の第1組のパラメータを通すであろう。
プログラム可能ペネ)l/−夕は、第1組のパラメータ
の試験を相互に通過し得る二、三の文字間のみを特に区
別するように選択されるであろう。
文字rnJが試験文字として読まれているものと想定す
る。文字ruJは完全な第1組のパラメータ試験を通過
し、マイクロプロセッサはその文字が文字ruJでおる
かどうかを知るためにその文字の試験を続行するでおろ
う。マイクロプロセッサ148はプログラム可能ペネト
レータを、各基準文字用のテンプレート記憶装置により
指定された第2組のパラメータとして働かすであろう。
「u」のプログラム可能ペネトV−夕は、文字のほぼ上
部中央でX値用の最小Y値として選択されるかもしれな
い。これは第1ブラツク・ビクセルをさがしながら文字
の上部からまつすぐ下方にペネトV−夕を挿入すること
に等しい。
マイクロプロセッサ90がとのピクセル・カウント動作
を行わなかったり、巡回の際に文字の回りに窓を作らな
かった抄することは意義がある。
むしろ、マイクロプロセッサ90は文字の各X値忙つい
て最大および最小のY値を単に供給し、またマイクロプ
ロセッサ148はどの最小Y値がその点におるかを知る
ためにその特定のX (K fi−選択するであろう。
文字ruJの場合、最小Y値は必ず8を越えなければな
らず、おそらく10であろう。次にマイクロプロセッサ
は文字を試験して、その最小Y値のどれがプログラム可
能ペネトレータ位置としてテンプレート記憶装置によっ
てめられたX値であるかをめる。その値が8より大であ
れば、マイクロプロセッサはそれ以上比較を行わず、「
U」であるとしてこの文字の出力としてAEIOエエコ
ードを供給するであろう。しかし本例では、実際に読ま
れる文字がrnJでおるので、値はおそらく0であり、
最大でも2の値となるであろう。マイクロプロセッサは
次にこの文字がruJでないことを認識し、試験された
値のどれでもをすぐには記憶せずにその基準文字を却下
して、第1組のパラメータと比較するために次の基準文
字に進むであろう。かくて合格・不合格試験が行われる
。本例では、試験文字の第1組のパラメータを通すパラ
メータを有する次の基準文字は「z」であるかもしれな
い。「z」のプログラム可能ペネトレータはおそらく、
試験文字のすぐ隣りの下側に置かれるX値での最大Y値
をめるとともに、この値が11として調和するために2
より小であることを要求するであろう。この試験がrn
Jについて行われるとき、その値は約8−10となり、
「2」のプログラム可能ペネトレータ試験に合格しない
であろう。次にマイクロプロセッサはこの基準文字を不
良として却下し、「n」に関する基準文字のパラメータ
が試験文字用の第1組の試験を通過するまで次の基準文
字に続くであろう。
次にマイクロプロセッサは、試験文字の下側〜の中央に
置かれるX値での最大Y値眞関する試験によって構成さ
れると思われる試験文字にっ騒て基準文字のテンプレー
ト記憶装置により指定されたrnJのプログラム可能ペ
ネトレータを働かせ、かつ文字がrnJとして認識され
るようにこの値が8を越えることを要求するであろう。
このゾログラム可能ペネトレータ試験が所望のX位置で
試験文字の最小Y値を読むことにより実行されるとき、
マイクロプロセッサは試験文字が[nJ:′cあること
をめ、それ以上どんな比較試験も行わずに調和文字とし
てrnJのASOエエコーyt出カするであろう。
プログラム可能ペネトレータは、任意な他のXまたはY
値での任意なXあるいはY値をチェックしたり、特定の
Y値での最大および最小の両X値をめまたは特定のX値
での最大および最小の両Y値をめるピンチ操作を提供し
たりするように設計される。ピンチ法は例えば[vJを
ruJから区別するのに役立つ。
プログラム可能ペネトレータ動作が36個のカリパスの
波形と著しく違うのは、他の基準文字との任意な他の比
較を行わずに基準文字が調和するかどうかについてイエ
スまたはノーの出方が供給されるからである。ディジタ
ル波形またはカリパスが第2組のパラメータとして使用
されるとき、マイクロプロセッサは第1組のパラメータ
を通るテンプレート記憶装置内の各基準文字にりbで第
2組のパラメータをめなければならず、次にこれらすべ
ての文字のどれが前述の通り基準文字と試験文字の第2
組のパラメータとの最も近い調和を持つかをめなければ
ならない。
ここに説明された文字認識の方法は、多くの他のハード
ウェア装置に使用される。1つの実例では、IBMパー
ソナル・コンピュータ、Tエパーソナル・コンピュータ
、その他同様な装置が文字認w&ヲ行うのに使用される
。走査器およびピクセル・バッファはコンピュータに接
続され、ことに説明された方法は文字を認識するこれら
のコンピュータによって行われる。これらの方法は必ず
しもこむに説明された特定qハードウェアで使用するよ
うに制限されない。
言うまでもなく、この動作の方法はここに説明された装
置に加えて多くの他の装置でも極めて役に立つであろう
。異なるマイクロプロセッサおよび異なる読み方がここ
に説明された方法と共に使用される。同様に、ここに説
明された装置は異なる方法を用いて作動することができ
る。本発明の範囲はここに与えられた例または説明によ
ってどんな方法でも制限きれず、前記特許請求の範囲に
入るどんな方法または装置でも包含することになる。
【図面の簡単な説明】
第1図は回路のゾロツク図、第2図は平面走査器内のO
OD作像装置、第6a図から第3f図までは第1図に示
されたような詳細な回路図、第4a図から第4d図まで
は第1図に示されたような本発明のもう1つの部分の回
路図、第5a図から第5j図までは巡回の使用方法、第
6a図および第6b図はサンプル文字の回りに使用され
る巡回およびその文字の面積のめ方、第7a図から第7
C図まではカリパス数およびプログラム可能ペネトレー
タのめ方、第8a図から第Ba図までは本発明の方法の
流れ図、第9a図から第9f図までは1組の輪郭番号を
作る例、第10a図から第100図までは試験文字の波
形が基準文字の波形に対して正規化される方法、第11
a図から第11c1図まではディを整列しかつ比較の前
にすべての傾斜を除去することによって試験文字の波形
が基準文字の波形と比較される方法。第12図はギャッ
プを持つサンプル文字、第13a図から第16a、図ま
では試験ぎクセルの順序およびいろいろな許容ギャップ
間隔に関するその順序の使用、第14図はぎクセルが許
容ヤヤツゾ間隔まで試験される順序の1つの実施例、第
15図は本発明の方法および装置を用いて読まれるドツ
ト・マトリックス・プリンタで印刷された0の頁を示す
。 符号の説明: 2BAI28B・・・ピクセル・バッファRAM ; 
40・・・マルチプレクサ;90.148・・・マイク
ロプロセッサ:98・・・インターフェースRAM ;
 11 B 。 146・・・プログラム記憶装置;118・・・テンプ
レート記憶装置;140・・・平面走査器;144・・
・工10端子;150・・・OGD作像装置代理人 浅
 村 皓 図面の浄書(内容に変更なし) Ft’g、 Jグ I =−* 1111 ’1 1q歳+10も 11+r 1 bり5σ F/夕、51) Fit)、5c Ft’y、5d F/ν:5e Ftり5f a外9 Ftν5/′ F々、6a ocパ髪aL堆蜆ジ亀に図 Ftν、み〃ノ 預 回 Tパイゾタル但形比較 第1頁の続き 優先権主張 0198坪11月17日[相]米国(U 
S)[相]552956@発 明 者 ケイス エイ・
プラン アメリカ合衆国トン 1201 @発明者 ラモン ヘルムズ アメリカ合衆国イブ 2
520 テキサス州プラノ、ジョシュア トリーテキサス州プラ
ノ、フラッグストン ドラ手続補正書(自発) 昭和59年1°月12日 特許庁長官殿 1、事件の表示 昭和59年特許願第176542号 2、発明の名称 文字認識の方法および装置 3、補正をする者 事件との関係 特許出願人 4、代理人 5、補正命令の日付 昭和 年 月 日 6、補正により増加する発明の数 明細書の浄書(内容に変更なし) 方式 手続補正書(方式) 昭和60年3り/7日 特 1、事件 昭和4年特許願第7241仁λ 号 2、発明・ 3、補正をする者 事件との関係 特許出願人 4、代理人 5、補正6 昭和Jう2年ノア月コ2日 6、補正により増加する発明の数 つ対象 \− &補正の

Claims (1)

  1. 【特許請求の範囲】 +1) 文字認識の方法でらって、 (IL) 試験文字全表わすデータを第1記憶装置に記
    憶する段階と、 (b) 前記データから第1組の試験文字パラメータを
    める段階と、 (C) 前記データから第2組の試験文字パラメータを
    める段階と、 (d)1組の基準文字およびそれらのパラメータを供給
    する段階と、 (e) 前記第1組の試験文字パラメータを第1基準文
    字の対応するパラメータに比較する段階と、 (fl 通過しない前記第1基準文字を却下する段階お
    よび前記第1組の試験文字パラメータが前記基準文字の
    対応するパラメータを通過させないときに前記第1組の
    パラメータを次の基準文字のパラメータに比較する段階
    と、(g) 前記第1組の試験文字パラメータが対応す
    る基準文字パラメータを通過させるとき前記第2組の試
    験文字パラメータを前記基準文字の対応するパラメータ
    と比較する段階と、(h) 前記試験文字と前記第2組
    のパラメータを通過させる基準文字との調和を表示する
    段階と、 +1) ill和が見つかったり前記線におるすべての
    基準文字からのパラメータが比較され終るまで段階eか
    ら段階1までを繰り返す段階と、(j) 前記基準文字
    のパラメータと前記試験文字のパラメータとの間の調和
    が表示されるとき前記基準文字を表わす数を出力する段
    階と、を含むことを特徴とする前記方法。 (2、特許請求の範囲第1項記載による方法において、
    前記第1組のパラメータが前記試験文字の高さおよび幅
    に対応するデータから成ることを特徴とする前記方法。 (3)特許請求の範囲第1項記載による方法において、
    前記第1組のパラメータが試験文字の高さ、幅、周囲、
    および周囲内の面積に対応するデータから成ることを特
    徴とする前記方法。 (4)特許請求の範囲第2項記載による方法において、
    前記第2組のパラメータは1つの側に沿う任意な点にお
    ける前記文字の周囲とその同じ側に浦う前記文字の最大
    延長との間のぎクセル差を表わす1組のカリパス番号か
    ら成ることを特徴とする前記方法。 (5)特許請求の範囲第4項記載による方法において、
    前記第2組のパラメータを比較する前記段階は (、L) 前記試験文字と前記基準文字との対応するカ
    リパス番号の差をめる段階と、 (+)) すべてのカリパス番号についてその差を加算
    する段階と、 (0) 各基準文字に関する前記和を他のすべての基準
    文字の各相と比較する段階と、 (a) 最低の和を持つ前記第2組のパラメータを通過
    させる基準文字を出力する段階と、から成ることを特徴
    とする前記方法。 (6)特許請求の範囲第5項記載による方法であって、
    さらに (a) カリパス番号間の受け入れられる差の範囲をめ
    る段階と、 (b) 前記範囲より大きな差の部分に前記加算段階の
    前にペナルティ・ファクタを掛ける段階と、 を含むことを特徴とする前記方法。 (7)特許請求の範囲第6項記載による方法において、
    前記ペナルティ・ファクタが4であることを特徴とする
    前記方法。 (8)特許請求の範囲第5項記載による方法において、
    前記差が5個のカリパス番号についてめられることを特
    徴とする前記方法。 (9)%許請求の範囲第6項記載による方法において、
    前記差が66個のカリパス番号についてめられることを
    特徴とする前記方法。 叫 特許請求の範囲第9項記載による方法において、前
    記66個のカリパス番号は各端から1V!クセル離れて
    置かれる2個のカリパスとその間に相互に一様に隔離さ
    れる他の7個のカリパスとを持つ前記文字の各側の9個
    から成ることを特徴とする前記方法。 (1υ 特許請求の範囲第1項記載による方法において
    、前記第2組のパラメータは試験文字の周囲の形状を表
    わす1組の輪郭番号から成ることを特徴とする前記方法
    。 (1渇 特許請求の範囲第11項記載による方法におい
    て、試験文字の波形および基準文字の波形は前記波形を
    相互に比較する前に大きさが正規化されることを特徴と
    する前記方法。 a沸 特許請求の範囲第11項記載による方法において
    、前記第2比較段階は (a) 各基準文字について前記試験文字の波形と前記
    基準文字の波形との差の積分をめる段階と、 (1)) 前記各基準文字の前記積分全相互に比較する
    段階と、 (0) 最低の積分を持つ基準文字を通過するものとし
    て出力する段階と から成ることを特徴とする前記方法。 I 特許請求の範囲第16項記載による方法であって、
    さらK (a) 前記試験文字の最初の輪郭番号を前記基準文字
    の最初の輪郭番号と整列させかつ前記試験文字の最後の
    輪郭番号を前記基準文字の最後の輪郭番号と整列させて
    から2つの間の差の積分をめる段階 を含むことを特徴とする前記方法。 (151特許請求の範囲第14項記載による方法であっ
    て、さらに (a) 波形を相互に輪郭番号の所定数だけ第1の方向
    に回転させて積分をめる段階と、 (b) 波形を輪郭番号の所定数だけ反対方向に回転さ
    せて積分をめる段階と、 (Q) 試験文字の波形と基準文字の波形との差の積分
    として最低である6つの積分の1つを選 4、択する段
    階と、 を含むことを特徴とする前記方法。 (IB 特許請求の範囲第11項記載による方法でおっ
    て、さらに (a) 第3組の試験文字パラメータを前記データから
    める段階と、 (kll 前記第2組の試験文字パラメータを比較する
    段階の前に前記第6組の試験文字パラメータを前記基準
    文字の対応するパラメータに比較する段階と、 全含むことを特徴とする前記方法。 (17) 特許請求の範囲第16項記載による方法にお
    いて、前記第6組のパラメータは1組のカリパス番号か
    ら成ること全特徴とする前記方法。 Ql 特許請求の範囲第1項記載による方法において、
    前記第1組の各基準文字パラメータは試験文字の第1組
    のパラメータに対応するパラメータの最大および最小許
    容値から成ることを特徴とする前記方法。 uI 試験文字のパラメータの第1組を基準文字のパラ
    メータの第1組に比較する特許請求の範囲第18項記載
    による方法であって、 (a) 前記基準文字の最大および最小許容値を対応す
    るパラメータの試験文字の値に比較する段階と、 (1)) 前記試験文字のパラメータが基準文字の最大
    許容値を越えたり基準文字の最小許容値未満であったり
    するとき前記基準文字を通過させないものとして却下す
    る段階と、 を含むことを特徴とする前記方法。 翰 特許請求の範囲第19項記載による方法において、
    パラメータの前記第1組が高さ、幅、周囲内の面積、周
    囲、および5個のカリパス番号から成ることを特徴とす
    る前記方法。 ■υ 特許請求の範囲第1項記載による方法であって、
    さらに (&) 前記試験文字と、前記第1組のパラメータが前
    記基準文字を独自に形成するとき前記第1組のパラメー
    タを通過させる基準文字との調和を表示する段階 を含むことを特徴とする前記方法。 C23特許請求の範囲第16項記載による方法において
    、前記試験文字のどんな相対傾斜でも前記積分をめる前
    に修正されることを特徴とする前記方法。 (ハ)特許請求の範囲第16項記載による方法において
    、前記波形は前記試験文字の周囲を巡回する順序で前記
    試験文字データを読むことによってめられることを特徴
    とする前記方法。 (1!荀 特許請求の範囲第23項記載による方法にお
    いて、各輪郭番号は前記文字の周囲に隣接して置かれる
    ピクセル間の空間間係を表わす1組の数のベクトル和の
    角度でおることを特徴とする前記方法。 (ハ)特許請求の範囲第1項記載による方法において、
    前記第2組のパラメータは前記試験文字の各Yに関する
    最大および最小のXならびに各Xに関する最大および最
    小のYから成ることを特徴とする前記方法。 (ハ)特許請求の範囲第25項記載による方法であって
    、さらに、特定のX値を贅沢する段階と、前記試験文字
    の最大または最小のY値を前記基準文字のそのXにおけ
    る対応する最大または最小のY値と比較する段階とを含
    むことを特徴とする前記方法。 (5)特許請求の範囲第25項記載による方法でおって
    、さらに、特定のY値を選択する段階と、前記試験文字
    の最大または最小のX値を前記基準文字のそのYにおけ
    る対応する最大または最小のX値と比較する段階とを含
    むことを特徴とする前記方法。 (ハ)特許請求の範囲第25項記載による方法であって
    、さらに、特定のX値を選択する段階と、そのXの最大
    および最小のIをそのXにおける基準文字の最大および
    最小のY値と比較する段階とを含むことを特徴とする前
    記方法。 翰 特許請求の範囲第25項記載による方法であって、
    さらに、特定のY値を選択する段階と、そのYにおける
    最大および最小のX値を前記基準文字のそのYにおける
    X値と比較する段階とを含むことを特徴とする前記方法
    。 (至)特許請求の範囲第25項記載による方法において
    、比較するXおよびY値は1つの比較が前記各基準文字
    を独自忙定めるように選択されることを特徴とする前記
    方法。 Gυ 文字の組の独自なパラメータをめる方法であって
    、 (a) 文字を表わす列Xおよび行Yに配列された第1
    記憶装置内にデータを記憶する段階と、(b) 各Y値
    に関する最大および最小のX値を記憶する段階と、 (0) 各X値に関する最大および最小のY値全記憶す
    る段階と、 (dl 組の各文字について段階aから段階Cまでを繰
    り返す段階と、 (e) 組の各文字に関するそれぞれの最大および最小
    のY値とX値が独特である1群のX値あるいはY値もし
    くはその両方をめる段階と、を含むことを特徴とする前
    記方法。 0り 特許請求の範囲第51項記載による方法で6って
    、さらに (a) 各Yでの最大および最小のXと文字全体の最大
    および最小のXとの関係をめる段階と、(b)各Xでの
    最大および最小のYと文字全体の最大および最小のYと
    の関係をめる段階と、を含むことを特徴とする前記方法
    。 (至)特許請求の範囲第61項記載による方法でおって
    、さらに、文字を巡回する順序で前記データを読む段階
    を含むことを特徴とする前記方法。 (財)不連続文字を認識する方法であって、(a) 文
    字の少なくとも一部で不連続な文字を表わすデータを入
    力する段階と、 (1)) 文字の正体の表示を出力する段階と、を含む
    ことを特徴とする前記方法。 0つ 特許請求の範囲第64項記載による方法において
    、前記不連続文字はドツト・マトリックス・プリンタに
    よって印刷されたものであることを特徴とする前記方法
    。 (至)特許請求の範囲第64項記載による方法において
    、前記不連続文字は質の悪い文字であることを特徴とす
    る前記方法。 C1?> 文字認識の方法であって、 (a) 少なくとも一部が不連続な文字をイメージヤで
    走査する段階と、 (1)) 文字を表わすデータを発生させて不連続な部
    分を含む前記データを記憶装置に記憶する段階と、 (Q) 文字の周囲を巡回する順序で前記データを試験
    する段階と、 (d) 前記巡回からパラメータ・データを発生させる
    段階と、 (el サンプル文字の正体の表示を出力する段階と、 を含むことを特徴とする前記方法。 (至)特許請求の範囲第67項記載による方法において
    、2より大きな試験セル領域が試験順序に使用されるこ
    とを特徴とする前記方法。 OI 特許請求の範囲第67項記載による方法において
    、基準セルが置かれている行または列に隣接しない行ま
    たは列にセルを含む試験セル領域が使用されることを特
    徴とする前記方法。 (4(I 特許請求の範囲第67項記載による方法にお
    いて、試験されない試験セル領域のすべてのセルがブラ
    ックでありかつ文字の周囲の部分であると考えられるこ
    とを特徴とする前記方法。 (4υ 不連続文字を巡回する方法であって、(I!L
    ) 前記不連続文字を表わすデータをビット・マツプに
    記憶する段階と、 (b) 前記不連続文字のブラック・ビクセルを表わす
    ブラック・セルが見つかるまで前記記憶装置からの前記
    データを試験する段階と、(Q) 現在のブラック・セ
    ルのアドレスを基準セルとして記憶する段階と、 (a) 基準セルが置かれる列に隣接する列に置かれた
    ビクセルに対応するアドレス位置を持つセルを試験し、
    かつセルがブラックであるかホワイトであるかをめた基
    準セルが置かれる行に隣接するセルの試験を開始する段
    階と、(e) PFr定数のセルについて所望数のセル
    に関し隣接する列にある各セルを試験する段階と、(f
    ) 所定数の列について読まれたばかりの列の次の隣接
    列に関し段階dおよび段階eを繰り返す段階と、 唸)基準セルに隣接するセルで始まる基準セルと同じ行
    にある各セルを試験し、かつ所定数のセルのその行にあ
    る最も新しく試験されたセルに隣接する次のセルを試験
    する段階と、(h) ブラック・セルが試験順序中に置
    かれるとき必ず、ブラック・セルを基準セルとして使用
    しかつ段階Cから段階gまでを繰り返す段階と、 (1) 試験順序が完了しかつブラック・セルが置かれ
    なかったとき、新しい1組の行と列を提供し、基準セル
    に関して行がいま列でありかつ列がいま行であるように
    、基準座標を90度回転して段階aから段階りまでを繰
    り返す段階と、 (j) 最初試験されたセルが基準セルとして戻された
    ときに文字の巡回が終ったことの表示を出力する段階と
    、 會含むことを特徴とする前記方法。 q2 不連続文字全試験する装置であって、(a) 不
    連続な文字を受ける入力装置と、(b) 前記文字を表
    わすデータを記憶する装置と、(Q) 前記不連続文字
    を表わすデータを発生させる装置と、 (改) 不連続なサンプル文字を認識する装置と、(e
    ) 認識されたサンプル文字の正体の表示を提供する出
    力装置と、 を含むことを特徴とする前記試験装置。 (4:1 特許請求の範囲第42項記載による装置にお
    いて、前記不連続なサンプル文字がドツト・マトリック
    ス・プリンタを用いて作られたものであることを特徴と
    する前記装置。
JP59176542A 1983-08-26 1984-08-24 文字認識の方法および装置 Pending JPS60167074A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US52770283A 1983-08-26 1983-08-26
US527702 1983-08-26
US552956 1983-11-17

Publications (1)

Publication Number Publication Date
JPS60167074A true JPS60167074A (ja) 1985-08-30

Family

ID=24102574

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59176542A Pending JPS60167074A (ja) 1983-08-26 1984-08-24 文字認識の方法および装置

Country Status (1)

Country Link
JP (1) JPS60167074A (ja)

Similar Documents

Publication Publication Date Title
US4680805A (en) Method and apparatus for recognition of discontinuous text
CA1160347A (en) Method for recognizing a machine encoded character
Spitz Determination of the script and language content of document images
US4864628A (en) Method of optical character recognition
EP0539106A2 (en) Electronic information delivery system
JP2007042126A (ja) ラスタ画像表示用ハイブリッドデータ構造生成方法及び装置
JPH06203138A (ja) 画像編集システム
US6614929B1 (en) Apparatus and method of detecting character writing area in document, and document format generating apparatus
JP2003242441A (ja) 帳票処理方法および装置並びにプログラム
JPS60167074A (ja) 文字認識の方法および装置
US7142733B1 (en) Document processing method, recording medium recording document processing program and document processing device
KR20010015963A (ko) 한자의 일자대조에 의한 교정 시스템
JPH11219409A (ja) 文書読取装置
JPH0333990A (ja) マスク処理を用いる光学式文字認識装置及び方法
Suchenwirth et al. Optical recognition of Chinese characters
JPS58125183A (ja) 光学文字読取装置における認識不能文字表示方法
JPH09120430A (ja) 画像処理装置
JP2901525B2 (ja) 文字作成方式
JPH06149888A (ja) 電子ファイリングシステム
JP2976990B2 (ja) 文字認識装置
JPH0434655A (ja) 図面読取装置
JPH07192081A (ja) 手書き文字入力装置
JP2958803B2 (ja) アウトライン文字フォント作成装置
JP2002366134A (ja) 手書き文字フォント作成装置及び手書き文字フォント作成プログラム
JPH08202818A (ja) フォーマット情報処理装置