JPH0239389A - 文字認識用の決定ツリー生成方法 - Google Patents

文字認識用の決定ツリー生成方法

Info

Publication number
JPH0239389A
JPH0239389A JP1124574A JP12457489A JPH0239389A JP H0239389 A JPH0239389 A JP H0239389A JP 1124574 A JP1124574 A JP 1124574A JP 12457489 A JP12457489 A JP 12457489A JP H0239389 A JPH0239389 A JP H0239389A
Authority
JP
Japan
Prior art keywords
pixel
probability
character
black
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1124574A
Other languages
English (en)
Other versions
JPH0682401B2 (ja
Inventor
Richard G Casey
リチヤード・ジヨージ・ケイシイ
Kottappuram M Mohiuddin
コータプラン・モハメダリ・モージユデイン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH0239389A publication Critical patent/JPH0239389A/ja
Publication of JPH0682401B2 publication Critical patent/JPH0682401B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 A、産業上の利用分野 本発明はOCR装置用の決定ツリー(デシジョン・ツリ
ー)の設計に関し、さらに詳しくは、OCR決定ツリー
を生成するのに有用な、特定の画素についての色値率を
設定することに関する。
B、従来技術及びその問題点 文字認識の1つの方法は決定ツリーを確立することであ
る。決定ツリーでは、様々な画素が相次いで試験され、
そして、画素を試験するたびに、該画素が黒であるか白
であるかに応じて、技が選択される。このような決定ツ
リーは公知であり、文献にも記されている。
一般的に、OCR装置は、該OCR装置が認識できるよ
うに訓練されたフォントで印刷された文字を認識するこ
とができるだけである。普通、OCR装置は、メーカー
によって、少数の共通タイプ・フォントを認識できるよ
うにプログラムされている。しかし、レーザ・プリンタ
が普及して多数のタイプ・フォントを生成できるように
なるにつれて、多くのユーザーが、自分たちのOCR装
置を訓練してメーカーが準備したものとは異なる新たな
フォントの文字を識別できるようになることを望んでい
る。
OCR装置が特定のフォントの文字を認識するための決
定ツリーを設計するためには、所与の文字について、該
文字を表わす画素ブロック中の所与の画素が黒であるこ
との確率が必要とされる。
当該文字をその他の文字と区別するのに有用な画素を識
別するためである。決定ツリーの設計法の1つが、Ca
5ey等著の、”Decision Tree Des
ignUsing a Probabilistic 
Model、” IEt!ETransactions
 on Information Theory、 V
ow。
IT−30、No、1. pp、 93−99 (19
84年)に記載されている。
なお、ここで“文字”なる語は、OCR装置による認識
の対象となる、印刷されたまたは書がれたシンボルを指
している。文字は、典型的には字や数字であり、その他
のシンボルであってもよい。
また、“文字”は、シンボルのクラスを指すこともある
ことに注意されたい。数字の“1”と小文字の“1”の
ように2つのシンボルが極めて似ていてOCR決定ロジ
ックが必ずしも両者を区別しない場合が例としてあげら
れる。また、以下の説明では黒と白の画素について言及
しているけれども、これと異なる区別可能な色の組合せ
も用い得る。さらに、黒画素・白画素の文豚の中で、黒
画素及び黒の確率に基づいて方法・装置を説明するけれ
ども、決定ツリー・ロジックは、白画素及び白の確率に
基づかせることもできる。
従来は、各文字の個々の画素について黒の確率を得るた
めに、当該フォントの各文字につき、数百ものサンプル
を試験しなければならなかった。
サンプルの収集・識別は多くの時間と費用を必要とする
。加えて、上記のような多数のサンプルを集められない
こともしばしばある。
したがって、各文字について訓練用のサンプルをできる
だけ少なくしつつ(理想的には1つにする) 、OCR
決定ツリーを設計できる方法が望まれていた。
第7図は、従来の決定ツリー生成プロセスを示字または
文字クラスの各々について、当該文字または文字クラス
のすべてのサンプルがスーパーインポーズされる。特定
の画素が黒である確率は、これらのサンプルのうちで該
画素が黒であった回数をサンプル数で割って計算される
。この確率に基づいて、該フォントの文字識別用決定ツ
リーを生成する際に使われる一定の画素を選択すること
ができる。このようなやり方では、正確な文字認識を行
おうとすると、文字または文字クラスの各々について、
典型的には100ないし200のオーダーの、多数のサ
ンプルを必要とする。
C0問題点を解決するための手段 本発明は、多数の文字サンプルを試験することなしに、
ある特定画素の色の確率を確実に評価する方法に関する
。本発明の方法では、画素がある色を有する確率がその
近傍状態の関数として確実に評価できるという、予期し
なかった実験観察を利用している。ここで、ある特定画
素の近傍状態とは、考慮対象の当該画素の直近の画素値
の加重和として求まる。
本発明による、文字認識装置を教育して未知のフォント
の文字を認識できるようにする方法には、該未知フォン
トで印刷された文書をスキャンして画素アレイを生成す
ることが含まれる。アレイ中の各画素について、直近の
画素を分析することにより、該画素のいわゆる近傍状態
を計算することができる。文字を表わす画素ブロックが
識別される。該ブロック中の画素が選択されると、該選
択された画素の近傍状態に基づいてメモリがアドレスさ
れる。該メモリは、その中に確率テーブルをストアして
いる。確率テーブルは、第1の未知フォントとは異なる
第2のフォントの場合にも、画素が黒である確率をその
近傍状態の関数として提供する。選択された画素の近傍
状態に関連する黒の確率がメモリから読み出されて、当
該確率が当該選択された画素に割り当てられる。そして
、当該割り当てられた黒の確率を使って、未知のフォン
トのために決定ツリーが生成される。
D、実施例 画素ブロック中の画素の色は、該画素の属するキャラク
タ・クラスに依存する。予期しなかったことが、発明者
は、画素の色が画素の近傍状態(neighborho
od 5tate)の関数としてのみ予測することがで
き、画素の属するキャラクタ・クラスを全く知らなくて
もよいことを発見した。
測することができる。第2図を例にとって説明しよう。
第2A図では、未知の色を持つ画素Xが8個の隣接画素
に囲まれている。隣接画素の各々は、(白色を示す)値
Oを有している。中央画素Xがしかし 白(値0)である確率は非常に高いン城(は必ずしも1
.00でない。というのは、そのような点にあっても迷
い(ストレイ)ドツトというものはあり得るからである
。同様に、第2B図にあっては、中央画素Xが黒である
(値が1である)確率は非常に高い。というのは、これ
を囲む8個の近傍画素が黒だからである。
近傍の半分が黒で半分が白であるような画素Xの例が第
2C図に示されている。かかる近傍を持つ中心画素Xの
値が1である確からしさは、多数の例を調べることによ
って統計的に決定することができる。近傍画素の色が与
えられている画素の色を予測する能力の試験についての
記載が、次の文献に見られる。
Mohiuddin、 et at、、 ”Lossl
ess Binary ImageCompressi
on Ba5ed on Pattern Match
ing。
International  Conference
 on Computers。
System  and  Signal  Proc
essing、Bangalore。
India(Dec、9−12.1984)画素近傍は
、水平及び垂直方向の所定数の周辺近隣画素によって構
成される。したがって、画素とその近傍によって、グリ
ッドまたは画素のマトリックスが形成される。図示した
例では、8個の周辺隣接画素によって近傍が構成されて
おり、したがって3×3の正方形グリッドが形成される
異なる配列も可能である。近傍が正方形である必要はな
い。
画素の状態は、その近傍の要素に重み付けした値の和と
して規定することができる。例えば、第3図に示される
ように、勝手に、近傍画素に対して、西隣りのものを起
点として時計回りに番号を付すことができる。西隣りに
は値2°(=1)が割り当てられる。北西方向の隣りに
は値2’(=2)が割り当てられる。以下同様の割当が
行われ、南西画素には値2’(= 128)が割り当て
られる。
実際のナンバリング自体は重要ではない。というのは、
ナンバリングは、あり得る近傍状態の各々を一意に識別
できるようにすることのみを目的としているからである
。近隣には8つのメンバーがあるので、合計256の異
なる状態があり得る。
近傍状態は、黒である近傍の値の和を求めることによっ
て得られる。したがって、第3図に示されるようなナン
バリング・システムを用いると、第2A図に示される画
素近傍の状態つまり値は0となり、一方、第2B図の場
合には近傍状態値が255になる。第2C図の近傍では
、近傍状態値は30、つまり21 + ll Z + 
23 + 24になる。
テキストの走査を通じて、近傍状態の各々の発生回数を
定めることができ、同様にその発生回数のうち中央画素
が黒である回数も定めることができる。したがって、当
該近傍状態の下で中央画素がある値を持つ確率を定める
ことができる。これは、当該近傍を伴う画素が黒である
回数を、当該近傍状態の発生回数で割ることによって達
成される。このようにして、256の可能な近傍状態ご
とに黒の確率のエントリイを持つテーブルを生成するこ
とができる。
第4図は、かかる確率テーブルを生成してストアしてお
くのに適した装置のブロック図を示す。
スキャナIfは、統計データが取り出される参照テキス
トをスキャンして、2進画素アレイを近傍状態・確率計
算ロジック13へ供給する。アレイの画素毎に、ロジッ
ク13は、黒の近傍画素に割り当てられた値を足し合わ
せ、当該画素についての近傍状態値を得る。検討対象の
画素の色も決定される。そのような統計が集まると、各
近傍状態値について、中央画素が黒であった回数のパー
センテージが直ちに決定される。当該パーセンテージは
、該近傍状態値の場合における黒の確率を表わす。した
がって、ロジック13は、画素アレイの試験時に様々な
カウントを一時的に蓄えるためのメモリを有している。
近傍状態の関数として計算された黒の確率(確率テーブ
ル)は、メモリ15に読み込まれて後の用に供される。
予期しなかったことだが、本出願の発明者は、上述の如
くして求まる、ある近傍状態における画素が黒である確
率が、当該画素の位置する文字クラスに関係なく実質的
に不変であることを発見した。したがって、確率テーブ
ルもまた試験対象のフォントと無関係である。非常に異
なるフォント同士の間において、あるいは違う言語を表
現するフォント同士の間でさえも、確率テーブルは実質
的に一定である。それゆえ、以前にあるフォントについ
て生成されストアされた確率は、新たなフォントを認識
するようOCR装置を教えるのに使うことができる。
この結果、確率テーブル生成に用いたフォントとは異な
る新たなフォントのために決定ツリーを生育するためで
あっても、あるフォントについて既に生成されている確
率テーブルを使うことができるので、OCRマシンが新
たなフォントを学習しそのための決定ツリーを生育する
のに十分な統計を生成するのに必要なシンボルまたは文
字の数と時間が大幅に減少する。さらに、新たなフォン
トでのある文字の多数の例が集まらなくてもよい。
この場合、画素の色の確率を通常の方法によっては評価
することはできない。結果として、従来の手段を用いて
新たなフォントの光学的文字認識を実行することはでき
ないのである。
第1図は新たなOCR決定ロジックを生成するのに適し
たマシンのブロック図である。新たなOCR決定ロジッ
クを生成するのに用いられる第1図の装置は、確率テー
ブルの生育に用いられる第4図のものと同じであってよ
い。スキャナ21は第4図のシステムのものと同じであ
ってよい。ロジック25の近傍状態計算部は、第4図に
示された近傍状態・確率計算ロジック13と同じであっ
てよい。確率テーブルをストアするメモリ15は、第4
図において元々確率テーブルがストアされているメモリ
と同じであってよい。OCR決定ツリー・ロジックを生
成する上で、第1図では近傍状態計算と決定ツリー生成
を実行するためにメモリ15とロジック250間の2方
向通信が行われる。
しかるに、第4図のシステムでは、近傍状態・確率計算
ロジックがデータをメモリ15に書き込めることだけが
要求されており、メモリからデータを読み取る必要はな
い。
スキャナ21は、未知のフォントで印刷された、識別さ
れるべき、あるいはマシンに教え込まれるべき、教育用
の文書(ドキュメント)をスキャンする。スキャナ21
は、通常のやり方でドキュメントを画素アレイに変換す
る。各画素は黒または白である。各画素は、メモリにス
トアされている確率テーブルを生育するのに用いられた
タイプの近傍を有する。各画素の周囲について、確率テ
ーブルを生育するのに用いられたのと同じ近傍が、対応
する近傍画素には同一の値を割り当てて、用いられる。
このように、教育用ドキュメントの画素及び確率テーブ
ル生成に用いられた参照ドキュメントの画素は、どちら
も同じ場所・色の画素で囲まれたならば、同一の近傍状
態値を持つことになる。第3図のナンバリング法を用い
るなら、試験対象の画素を囲む8つの画素が該画素の近
傍になる。近傍画素には、第3図に示されるような値が
割り当てられる。つまり、西隣りの画素には値2°=1
、北西の隣りには21=2、・・・、南西の隣りには2
’=128、といった具合である。
各ブロックが文字を表わす、そういった画素のフロック
つまりクラスタは、スキャンされたベージを表わす画素
アレイの中で識別される。文字“A”を表現する画素の
文字パターンの1例が第5図に示されている。このよう
なパターンは例えば1辺が20画素の正方形であって、
合計400画素からなるクラスタを構成する。
試験対象の画素は文字パターンの中から選ばれる。ロジ
ック・ユニット25の近傍状態計算部は、メモリ15に
ストアされている確率テーブルを生成するのに用いたの
と同じ数値割当法を使って、当該画素の近傍値を決定す
る。当該画素について近傍状態つまり値が確定すると、
該近傍値を使って、メモリ15に先にストアされている
確率テーブルがアドレスされる。当該近傍状態について
ストアされている関連する確率がメモリから読み出され
る。ストアされている確率テーブルから読まれた確率は
、新しいフォントの当該文字についての文字ブロック中
の選択された画素に割り当てられる。当該割り当てられ
た確率は、新しいフォントについての決定ツリーを生成
する際に、当該画素が黒である確率として用いられる。
決定ツリー・ロジック・デザインでは、新しいフォント
のドキュメントが与えられたときに、どの画素を試験す
べきかを決定するために、様々な文字画素ブロック中の
様々な画素についての様々な黒の確率が用いられる。目
的は、異なる認識対象文字を区別するのに有用な画素を
見つけることにある。かかる確率統計を用いる適当な決
定ツリー設計方法が、Ca5ey及びNagy著、De
cisionTree Design Using a
 Probabilistic Model、”TEE
E Transactions on Informa
tion Theory。
Vol、I7 30. No、1. pp、 93−9
9 (1984年1月)に記載されている。
教育用ドキュメント中にある文字について2つ以上のサ
ンプルが登場し、かつサンプルが同一ではない場合、近
傍状態決定に関係する近傍画素の色を確立するために、
平均あるいは該文字の理想的代表あるいは当該文字を表
現する画素ブロックが用いられる。
文字の平均化には、当該文字の異なる発生を比較するこ
と、及び文字ブロック中の画素ごとに、該画素が黒の頻
度が白より高いかあるいは白の頻度が黒より高いかを決
定することが含まれる。黒である頻度の方が高い(少な
くとも50%である)画素は、当該画素ブロック内の画
素の近傍状態を決定するために、当該画素が近傍である
という目的において、黒であると言われる。同様に、白
である確率が50%を越える画素は、近傍値を決定する
上で、白であると言われる。
第6図は、本発明を用いて、新フォントを識別するべく
OCR装置を教育するプロセスを示す。
この流れ図の記述は、既述の良好な実施例の説明を要約
したものである。
任意のフォントのテキストの参照ドキュメントがスキャ
ンされる。ある近傍状態の下で、画素が黒である頻度が
カウントされ、その結果、画素が黒である確率を近傍状
態の関数として与える確率テーブルが求められる。確率
テーブル生成ファンクションは1度だけ行えばよいので
あり、新しいフォントのドキュメントがスキャンされる
たびに繰り返す必要はない。
新フォント用に決定ツリー・ロジックを生成するときに
は、当該新フォントで印刷されたドキュメントがスキャ
ンされる。クラスタ、あるいは画素ブロック、あるいは
様々なキャラクタを表わす文字パターン、あるいは文字
クラスが識別される。
文字の代表が2つ以上に識別される場合は、それらの代
表を平均してキャラクタ代表を得る。
該キャラクタ代表を使って、各キャラクタ・ブロックの
画素についての画素確率が生成される。
この確率を使って、ツリーデザイン・ロジックは適当な
OCR決定ツリー・ロジックを生成することができる。
本発明によると、確率テーブルの生成(第6図の破線よ
り左の部分)は、文字認識ツリーの生成(第6図の破線
より右の部分)とは異なるマシンで行うことができる。
したがって、本発明を使うと、OCR装置のメーカーは
、装置メモリに確率テーブルをストアしておくとともに
、多くの場合には装置に少数のキャラクタ認識決定ツリ
ーだけをストアしておくことができる。メーカーは、O
CRデバイス中に、画素確率統計に基づいて文字識別決
定ツリーの生成を可能たらしめるのに必要なプログラム
をもストアする。そうすると、ユーザが該OCR装置に
よる新たなフォント(メーカーがストアした何れのもの
とも異なるフォント)の識別を欲した場合に、ユーザは
OCR装置に新フォント用の新決定ツリーを生成させる
ことができる。
本発明を使うと、新しいフォントの各文字について、代
表は1つだけ必要とされるOCR装置は、この単一の代
表に基づいて、ツリー・デザイン・ロジックが新フォン
ト用の決定ツリーを生成するのに必要である画素色確率
を生成することができる。
E0発明の効果 本発明によれば、新しいフォントを識別するために新し
い決定ツリーを生成することが大幅に簡略化され、かつ
スピード・アップされるゆ
【図面の簡単な説明】
第1図は、本発明による、新しいOCR決定ロジックを
生成するのに適した装置のブロック図である。 第2A図、第2B図、及び第2C図は、それぞれ画素の
近傍の例を説明するための図である。 第3図は、画素の近傍状態を決定するためのナンバリン
グ法の1例の説明図である。 第4図は、画素色確率テーブルの生成に適した装置のブ
ロック図である。 第5図は、文字を表わす画素のクラスタつまりブロック
の説明図である。 第6図は、本発明を用いた、OCR決定ツリー生成のフ
ロー・チャートである。 第7図は、従来の決定ツリー生育プロセスのフロー・チ
ャートである。 X1 第2C図 汐数Q:J!:定ツソ− 20X  24 第3図

Claims (1)

  1. 【特許請求の範囲】  文字認識用の決定ツリーをフオントに応じて生成する
    方法であつて、 すべての画素に共通に適用される近傍画素の範囲を確定
    しておき、 1つのフオントで印刷された文書を走査して一連の画素
    の色情報を求め、 上記一連の画素の各々を選択し、当該選択画素の色情報
    と、当該選択画素の近傍画素の色情報に基づいて近傍状
    態値を求めることを繰り返すことによつて、近傍状態値
    毎に決まる選択画素の色の確率情報を求め、 上記確率情報を近傍状態値によつてアドレスできるよう
    にメモリにストアし、 任意のフオントについて、該フオントで印刷された文書
    を走査して得られた一連の画素に基づいて、複数個の文
    字クラスタを識別し、 上記複数個の文字クラスタの各々について、当該文字ク
    ラスタの画素の各々を選択し、当該選択画素についてそ
    の近傍状態値を求め、該求まつた近傍状態値に基づいて
    上記メモリをアドレスして関連する確率情報を読み取り
    、 上記文字クラスタの各画素に対応して読み取られた確率
    情報に基づいて、当該フオント用の決定ツリーを生成す
    る ことを特徴とする方法。
JP1124574A 1988-07-19 1989-05-19 文字認識用の決定ツリー生成方法 Expired - Lifetime JPH0682401B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/221,164 US4831657A (en) 1988-07-19 1988-07-19 Method and apparatus for establishing pixel color probabilities for use in OCR logic
US221164 1988-07-19

Publications (2)

Publication Number Publication Date
JPH0239389A true JPH0239389A (ja) 1990-02-08
JPH0682401B2 JPH0682401B2 (ja) 1994-10-19

Family

ID=22826628

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1124574A Expired - Lifetime JPH0682401B2 (ja) 1988-07-19 1989-05-19 文字認識用の決定ツリー生成方法

Country Status (5)

Country Link
US (1) US4831657A (ja)
EP (1) EP0352011B1 (ja)
JP (1) JPH0682401B2 (ja)
CA (1) CA1313266C (ja)
DE (1) DE68925312T2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5067088A (en) * 1990-02-16 1991-11-19 Johnson & Quin, Inc. Apparatus and method for assembling mass mail items
US5020121A (en) * 1990-08-16 1991-05-28 Hewlett-Packard Company Neighborhood block prediction bit compression
WO1992008198A1 (en) * 1990-11-05 1992-05-14 Johnson & Quin, Inc. Document control and audit apparatus and method
US5253307A (en) * 1991-07-30 1993-10-12 Xerox Corporation Image analysis to obtain typeface information
US5875261A (en) * 1991-12-20 1999-02-23 International Business Machines Corporation Method of and apparatus for optical character recognition based on geometric and color attribute hypothesis testing
US5396564A (en) * 1991-12-20 1995-03-07 International Business Machines Corporation Method of and apparatus for recognizing predominate and non-predominate color code characters for optical character recognition
US5406640A (en) * 1991-12-20 1995-04-11 International Business Machines Corporation Method of and apparatus for producing predominate and non-predominate color coded characters for optical character recognition
FR2685795B1 (fr) * 1991-12-26 1994-02-25 Thomson Csf Procede de segmentation polytomique.
JP3106021B2 (ja) * 1992-11-30 2000-11-06 キヤノン株式会社 パターンデータの圧縮方法及び装置と出力方法及び装置
IL172678A0 (en) * 2005-12-19 2006-04-10 Aharon Topper Method, system and computer program for encoding and decoding a pixelized target graphic symbol
US20130039589A1 (en) * 2011-08-11 2013-02-14 I. R. I. S. Pattern recognition process, computer program product and mobile terminal
RU2598300C2 (ru) 2015-01-27 2016-09-20 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы автоматического распознавания символов с использованием дерева решений

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3839702A (en) * 1973-10-25 1974-10-01 Ibm Bayesian online numeric discriminant
US3964591A (en) * 1975-06-10 1976-06-22 International Business Machines Corporation Font selection system
US4274079A (en) * 1979-07-12 1981-06-16 Burroughs Corporation Apparatus and method for dynamic font switching
US4499596A (en) * 1982-06-28 1985-02-12 International Business Machines Corporation Adaptive facsimile compression using a dynamic extendable decision network
US4589142A (en) * 1983-12-28 1986-05-13 International Business Machines Corp. (Ibm) Method and apparatus for character recognition based upon the frequency of occurrence of said characters
JPS60262290A (ja) * 1984-06-08 1985-12-25 Hitachi Ltd 情報認識システム
JPH0727543B2 (ja) * 1988-04-28 1995-03-29 インターナシヨナル・ビジネス・マシーンズ・コーポレーション 文字認識装置

Also Published As

Publication number Publication date
DE68925312D1 (de) 1996-02-15
EP0352011A3 (en) 1992-02-05
JPH0682401B2 (ja) 1994-10-19
DE68925312T2 (de) 1996-07-11
EP0352011A2 (en) 1990-01-24
EP0352011B1 (en) 1996-01-03
CA1313266C (en) 1993-01-26
US4831657A (en) 1989-05-16

Similar Documents

Publication Publication Date Title
CN107194400B (zh) 一种财务报销全票据图片识别处理方法
EP1146472A2 (en) Loose-gray-scale template matching
CN100517461C (zh) 图像处理设备和方法
US4524454A (en) Method of assigning direction code to boundary picture element in character recognition system
US4499596A (en) Adaptive facsimile compression using a dynamic extendable decision network
US5590220A (en) Bending point extraction method for optical character recognition system
JPH0239389A (ja) 文字認識用の決定ツリー生成方法
GB2190778A (en) Character recognition with variable subdivision of a character region
WO1998035314A2 (en) System and method for pattern recognition
JPH06187497A (ja) 文字認識方法
US9589185B2 (en) Symbol recognition using decision forests
Bomba Alpha-numeric character recognition using local operations
WO1995010820A1 (en) Methods and apparatus for classification of images using distribution maps
WO2002019248A9 (en) Character recognition system
JPH0139265B2 (ja)
JPH06282686A (ja) 文字認識方法
CN111914846A (zh) 版面数据合成方法、设备及存储介质
RU2582064C1 (ru) Способы и системы эффективного автоматического распознавания символов с использованием леса решений
JPH0333990A (ja) マスク処理を用いる光学式文字認識装置及び方法
CN109886276B (zh) 一种表盘滚动数字字符的半字判断方法
Pornpanomchai et al. Printed Thai character recognition by genetic algorithm
Rodrigues et al. Character feature extraction using polygonal projection sweep (contour detection)
Tissing Automatic Grading of CITO Mathematics Tests
JPH11120291A (ja) パタン認識システム
JP3197464B2 (ja) 文字認識方法および文字認識装置