JPH0239389A - 文字認識用の決定ツリー生成方法 - Google Patents
文字認識用の決定ツリー生成方法Info
- Publication number
- JPH0239389A JPH0239389A JP1124574A JP12457489A JPH0239389A JP H0239389 A JPH0239389 A JP H0239389A JP 1124574 A JP1124574 A JP 1124574A JP 12457489 A JP12457489 A JP 12457489A JP H0239389 A JPH0239389 A JP H0239389A
- Authority
- JP
- Japan
- Prior art keywords
- pixel
- probability
- character
- black
- pixels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003066 decision tree Methods 0.000 claims description 32
- 238000000034 method Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 abstract description 6
- 238000012360 testing method Methods 0.000 abstract description 6
- 238000012015 optical character recognition Methods 0.000 description 24
- 238000013461 design Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 4
- 238000012935 Averaging Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 244000144992 flock Species 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
A、産業上の利用分野
本発明はOCR装置用の決定ツリー(デシジョン・ツリ
ー)の設計に関し、さらに詳しくは、OCR決定ツリー
を生成するのに有用な、特定の画素についての色値率を
設定することに関する。
ー)の設計に関し、さらに詳しくは、OCR決定ツリー
を生成するのに有用な、特定の画素についての色値率を
設定することに関する。
B、従来技術及びその問題点
文字認識の1つの方法は決定ツリーを確立することであ
る。決定ツリーでは、様々な画素が相次いで試験され、
そして、画素を試験するたびに、該画素が黒であるか白
であるかに応じて、技が選択される。このような決定ツ
リーは公知であり、文献にも記されている。
る。決定ツリーでは、様々な画素が相次いで試験され、
そして、画素を試験するたびに、該画素が黒であるか白
であるかに応じて、技が選択される。このような決定ツ
リーは公知であり、文献にも記されている。
一般的に、OCR装置は、該OCR装置が認識できるよ
うに訓練されたフォントで印刷された文字を認識するこ
とができるだけである。普通、OCR装置は、メーカー
によって、少数の共通タイプ・フォントを認識できるよ
うにプログラムされている。しかし、レーザ・プリンタ
が普及して多数のタイプ・フォントを生成できるように
なるにつれて、多くのユーザーが、自分たちのOCR装
置を訓練してメーカーが準備したものとは異なる新たな
フォントの文字を識別できるようになることを望んでい
る。
うに訓練されたフォントで印刷された文字を認識するこ
とができるだけである。普通、OCR装置は、メーカー
によって、少数の共通タイプ・フォントを認識できるよ
うにプログラムされている。しかし、レーザ・プリンタ
が普及して多数のタイプ・フォントを生成できるように
なるにつれて、多くのユーザーが、自分たちのOCR装
置を訓練してメーカーが準備したものとは異なる新たな
フォントの文字を識別できるようになることを望んでい
る。
OCR装置が特定のフォントの文字を認識するための決
定ツリーを設計するためには、所与の文字について、該
文字を表わす画素ブロック中の所与の画素が黒であるこ
との確率が必要とされる。
定ツリーを設計するためには、所与の文字について、該
文字を表わす画素ブロック中の所与の画素が黒であるこ
との確率が必要とされる。
当該文字をその他の文字と区別するのに有用な画素を識
別するためである。決定ツリーの設計法の1つが、Ca
5ey等著の、”Decision Tree Des
ignUsing a Probabilistic
Model、” IEt!ETransactions
on Information Theory、 V
ow。
別するためである。決定ツリーの設計法の1つが、Ca
5ey等著の、”Decision Tree Des
ignUsing a Probabilistic
Model、” IEt!ETransactions
on Information Theory、 V
ow。
IT−30、No、1. pp、 93−99 (19
84年)に記載されている。
84年)に記載されている。
なお、ここで“文字”なる語は、OCR装置による認識
の対象となる、印刷されたまたは書がれたシンボルを指
している。文字は、典型的には字や数字であり、その他
のシンボルであってもよい。
の対象となる、印刷されたまたは書がれたシンボルを指
している。文字は、典型的には字や数字であり、その他
のシンボルであってもよい。
また、“文字”は、シンボルのクラスを指すこともある
ことに注意されたい。数字の“1”と小文字の“1”の
ように2つのシンボルが極めて似ていてOCR決定ロジ
ックが必ずしも両者を区別しない場合が例としてあげら
れる。また、以下の説明では黒と白の画素について言及
しているけれども、これと異なる区別可能な色の組合せ
も用い得る。さらに、黒画素・白画素の文豚の中で、黒
画素及び黒の確率に基づいて方法・装置を説明するけれ
ども、決定ツリー・ロジックは、白画素及び白の確率に
基づかせることもできる。
ことに注意されたい。数字の“1”と小文字の“1”の
ように2つのシンボルが極めて似ていてOCR決定ロジ
ックが必ずしも両者を区別しない場合が例としてあげら
れる。また、以下の説明では黒と白の画素について言及
しているけれども、これと異なる区別可能な色の組合せ
も用い得る。さらに、黒画素・白画素の文豚の中で、黒
画素及び黒の確率に基づいて方法・装置を説明するけれ
ども、決定ツリー・ロジックは、白画素及び白の確率に
基づかせることもできる。
従来は、各文字の個々の画素について黒の確率を得るた
めに、当該フォントの各文字につき、数百ものサンプル
を試験しなければならなかった。
めに、当該フォントの各文字につき、数百ものサンプル
を試験しなければならなかった。
サンプルの収集・識別は多くの時間と費用を必要とする
。加えて、上記のような多数のサンプルを集められない
こともしばしばある。
。加えて、上記のような多数のサンプルを集められない
こともしばしばある。
したがって、各文字について訓練用のサンプルをできる
だけ少なくしつつ(理想的には1つにする) 、OCR
決定ツリーを設計できる方法が望まれていた。
だけ少なくしつつ(理想的には1つにする) 、OCR
決定ツリーを設計できる方法が望まれていた。
第7図は、従来の決定ツリー生成プロセスを示字または
文字クラスの各々について、当該文字または文字クラス
のすべてのサンプルがスーパーインポーズされる。特定
の画素が黒である確率は、これらのサンプルのうちで該
画素が黒であった回数をサンプル数で割って計算される
。この確率に基づいて、該フォントの文字識別用決定ツ
リーを生成する際に使われる一定の画素を選択すること
ができる。このようなやり方では、正確な文字認識を行
おうとすると、文字または文字クラスの各々について、
典型的には100ないし200のオーダーの、多数のサ
ンプルを必要とする。
文字クラスの各々について、当該文字または文字クラス
のすべてのサンプルがスーパーインポーズされる。特定
の画素が黒である確率は、これらのサンプルのうちで該
画素が黒であった回数をサンプル数で割って計算される
。この確率に基づいて、該フォントの文字識別用決定ツ
リーを生成する際に使われる一定の画素を選択すること
ができる。このようなやり方では、正確な文字認識を行
おうとすると、文字または文字クラスの各々について、
典型的には100ないし200のオーダーの、多数のサ
ンプルを必要とする。
C0問題点を解決するための手段
本発明は、多数の文字サンプルを試験することなしに、
ある特定画素の色の確率を確実に評価する方法に関する
。本発明の方法では、画素がある色を有する確率がその
近傍状態の関数として確実に評価できるという、予期し
なかった実験観察を利用している。ここで、ある特定画
素の近傍状態とは、考慮対象の当該画素の直近の画素値
の加重和として求まる。
ある特定画素の色の確率を確実に評価する方法に関する
。本発明の方法では、画素がある色を有する確率がその
近傍状態の関数として確実に評価できるという、予期し
なかった実験観察を利用している。ここで、ある特定画
素の近傍状態とは、考慮対象の当該画素の直近の画素値
の加重和として求まる。
本発明による、文字認識装置を教育して未知のフォント
の文字を認識できるようにする方法には、該未知フォン
トで印刷された文書をスキャンして画素アレイを生成す
ることが含まれる。アレイ中の各画素について、直近の
画素を分析することにより、該画素のいわゆる近傍状態
を計算することができる。文字を表わす画素ブロックが
識別される。該ブロック中の画素が選択されると、該選
択された画素の近傍状態に基づいてメモリがアドレスさ
れる。該メモリは、その中に確率テーブルをストアして
いる。確率テーブルは、第1の未知フォントとは異なる
第2のフォントの場合にも、画素が黒である確率をその
近傍状態の関数として提供する。選択された画素の近傍
状態に関連する黒の確率がメモリから読み出されて、当
該確率が当該選択された画素に割り当てられる。そして
、当該割り当てられた黒の確率を使って、未知のフォン
トのために決定ツリーが生成される。
の文字を認識できるようにする方法には、該未知フォン
トで印刷された文書をスキャンして画素アレイを生成す
ることが含まれる。アレイ中の各画素について、直近の
画素を分析することにより、該画素のいわゆる近傍状態
を計算することができる。文字を表わす画素ブロックが
識別される。該ブロック中の画素が選択されると、該選
択された画素の近傍状態に基づいてメモリがアドレスさ
れる。該メモリは、その中に確率テーブルをストアして
いる。確率テーブルは、第1の未知フォントとは異なる
第2のフォントの場合にも、画素が黒である確率をその
近傍状態の関数として提供する。選択された画素の近傍
状態に関連する黒の確率がメモリから読み出されて、当
該確率が当該選択された画素に割り当てられる。そして
、当該割り当てられた黒の確率を使って、未知のフォン
トのために決定ツリーが生成される。
D、実施例
画素ブロック中の画素の色は、該画素の属するキャラク
タ・クラスに依存する。予期しなかったことが、発明者
は、画素の色が画素の近傍状態(neighborho
od 5tate)の関数としてのみ予測することがで
き、画素の属するキャラクタ・クラスを全く知らなくて
もよいことを発見した。
タ・クラスに依存する。予期しなかったことが、発明者
は、画素の色が画素の近傍状態(neighborho
od 5tate)の関数としてのみ予測することがで
き、画素の属するキャラクタ・クラスを全く知らなくて
もよいことを発見した。
測することができる。第2図を例にとって説明しよう。
第2A図では、未知の色を持つ画素Xが8個の隣接画素
に囲まれている。隣接画素の各々は、(白色を示す)値
Oを有している。中央画素Xがしかし 白(値0)である確率は非常に高いン城(は必ずしも1
.00でない。というのは、そのような点にあっても迷
い(ストレイ)ドツトというものはあり得るからである
。同様に、第2B図にあっては、中央画素Xが黒である
(値が1である)確率は非常に高い。というのは、これ
を囲む8個の近傍画素が黒だからである。
に囲まれている。隣接画素の各々は、(白色を示す)値
Oを有している。中央画素Xがしかし 白(値0)である確率は非常に高いン城(は必ずしも1
.00でない。というのは、そのような点にあっても迷
い(ストレイ)ドツトというものはあり得るからである
。同様に、第2B図にあっては、中央画素Xが黒である
(値が1である)確率は非常に高い。というのは、これ
を囲む8個の近傍画素が黒だからである。
近傍の半分が黒で半分が白であるような画素Xの例が第
2C図に示されている。かかる近傍を持つ中心画素Xの
値が1である確からしさは、多数の例を調べることによ
って統計的に決定することができる。近傍画素の色が与
えられている画素の色を予測する能力の試験についての
記載が、次の文献に見られる。
2C図に示されている。かかる近傍を持つ中心画素Xの
値が1である確からしさは、多数の例を調べることによ
って統計的に決定することができる。近傍画素の色が与
えられている画素の色を予測する能力の試験についての
記載が、次の文献に見られる。
Mohiuddin、 et at、、 ”Lossl
ess Binary ImageCompressi
on Ba5ed on Pattern Match
ing。
ess Binary ImageCompressi
on Ba5ed on Pattern Match
ing。
International Conference
on Computers。
on Computers。
System and Signal Proc
essing、Bangalore。
essing、Bangalore。
India(Dec、9−12.1984)画素近傍は
、水平及び垂直方向の所定数の周辺近隣画素によって構
成される。したがって、画素とその近傍によって、グリ
ッドまたは画素のマトリックスが形成される。図示した
例では、8個の周辺隣接画素によって近傍が構成されて
おり、したがって3×3の正方形グリッドが形成される
。
、水平及び垂直方向の所定数の周辺近隣画素によって構
成される。したがって、画素とその近傍によって、グリ
ッドまたは画素のマトリックスが形成される。図示した
例では、8個の周辺隣接画素によって近傍が構成されて
おり、したがって3×3の正方形グリッドが形成される
。
異なる配列も可能である。近傍が正方形である必要はな
い。
い。
画素の状態は、その近傍の要素に重み付けした値の和と
して規定することができる。例えば、第3図に示される
ように、勝手に、近傍画素に対して、西隣りのものを起
点として時計回りに番号を付すことができる。西隣りに
は値2°(=1)が割り当てられる。北西方向の隣りに
は値2’(=2)が割り当てられる。以下同様の割当が
行われ、南西画素には値2’(= 128)が割り当て
られる。
して規定することができる。例えば、第3図に示される
ように、勝手に、近傍画素に対して、西隣りのものを起
点として時計回りに番号を付すことができる。西隣りに
は値2°(=1)が割り当てられる。北西方向の隣りに
は値2’(=2)が割り当てられる。以下同様の割当が
行われ、南西画素には値2’(= 128)が割り当て
られる。
実際のナンバリング自体は重要ではない。というのは、
ナンバリングは、あり得る近傍状態の各々を一意に識別
できるようにすることのみを目的としているからである
。近隣には8つのメンバーがあるので、合計256の異
なる状態があり得る。
ナンバリングは、あり得る近傍状態の各々を一意に識別
できるようにすることのみを目的としているからである
。近隣には8つのメンバーがあるので、合計256の異
なる状態があり得る。
近傍状態は、黒である近傍の値の和を求めることによっ
て得られる。したがって、第3図に示されるようなナン
バリング・システムを用いると、第2A図に示される画
素近傍の状態つまり値は0となり、一方、第2B図の場
合には近傍状態値が255になる。第2C図の近傍では
、近傍状態値は30、つまり21 + ll Z +
23 + 24になる。
て得られる。したがって、第3図に示されるようなナン
バリング・システムを用いると、第2A図に示される画
素近傍の状態つまり値は0となり、一方、第2B図の場
合には近傍状態値が255になる。第2C図の近傍では
、近傍状態値は30、つまり21 + ll Z +
23 + 24になる。
テキストの走査を通じて、近傍状態の各々の発生回数を
定めることができ、同様にその発生回数のうち中央画素
が黒である回数も定めることができる。したがって、当
該近傍状態の下で中央画素がある値を持つ確率を定める
ことができる。これは、当該近傍を伴う画素が黒である
回数を、当該近傍状態の発生回数で割ることによって達
成される。このようにして、256の可能な近傍状態ご
とに黒の確率のエントリイを持つテーブルを生成するこ
とができる。
定めることができ、同様にその発生回数のうち中央画素
が黒である回数も定めることができる。したがって、当
該近傍状態の下で中央画素がある値を持つ確率を定める
ことができる。これは、当該近傍を伴う画素が黒である
回数を、当該近傍状態の発生回数で割ることによって達
成される。このようにして、256の可能な近傍状態ご
とに黒の確率のエントリイを持つテーブルを生成するこ
とができる。
第4図は、かかる確率テーブルを生成してストアしてお
くのに適した装置のブロック図を示す。
くのに適した装置のブロック図を示す。
スキャナIfは、統計データが取り出される参照テキス
トをスキャンして、2進画素アレイを近傍状態・確率計
算ロジック13へ供給する。アレイの画素毎に、ロジッ
ク13は、黒の近傍画素に割り当てられた値を足し合わ
せ、当該画素についての近傍状態値を得る。検討対象の
画素の色も決定される。そのような統計が集まると、各
近傍状態値について、中央画素が黒であった回数のパー
センテージが直ちに決定される。当該パーセンテージは
、該近傍状態値の場合における黒の確率を表わす。した
がって、ロジック13は、画素アレイの試験時に様々な
カウントを一時的に蓄えるためのメモリを有している。
トをスキャンして、2進画素アレイを近傍状態・確率計
算ロジック13へ供給する。アレイの画素毎に、ロジッ
ク13は、黒の近傍画素に割り当てられた値を足し合わ
せ、当該画素についての近傍状態値を得る。検討対象の
画素の色も決定される。そのような統計が集まると、各
近傍状態値について、中央画素が黒であった回数のパー
センテージが直ちに決定される。当該パーセンテージは
、該近傍状態値の場合における黒の確率を表わす。した
がって、ロジック13は、画素アレイの試験時に様々な
カウントを一時的に蓄えるためのメモリを有している。
近傍状態の関数として計算された黒の確率(確率テーブ
ル)は、メモリ15に読み込まれて後の用に供される。
ル)は、メモリ15に読み込まれて後の用に供される。
予期しなかったことだが、本出願の発明者は、上述の如
くして求まる、ある近傍状態における画素が黒である確
率が、当該画素の位置する文字クラスに関係なく実質的
に不変であることを発見した。したがって、確率テーブ
ルもまた試験対象のフォントと無関係である。非常に異
なるフォント同士の間において、あるいは違う言語を表
現するフォント同士の間でさえも、確率テーブルは実質
的に一定である。それゆえ、以前にあるフォントについ
て生成されストアされた確率は、新たなフォントを認識
するようOCR装置を教えるのに使うことができる。
くして求まる、ある近傍状態における画素が黒である確
率が、当該画素の位置する文字クラスに関係なく実質的
に不変であることを発見した。したがって、確率テーブ
ルもまた試験対象のフォントと無関係である。非常に異
なるフォント同士の間において、あるいは違う言語を表
現するフォント同士の間でさえも、確率テーブルは実質
的に一定である。それゆえ、以前にあるフォントについ
て生成されストアされた確率は、新たなフォントを認識
するようOCR装置を教えるのに使うことができる。
この結果、確率テーブル生成に用いたフォントとは異な
る新たなフォントのために決定ツリーを生育するためで
あっても、あるフォントについて既に生成されている確
率テーブルを使うことができるので、OCRマシンが新
たなフォントを学習しそのための決定ツリーを生育する
のに十分な統計を生成するのに必要なシンボルまたは文
字の数と時間が大幅に減少する。さらに、新たなフォン
トでのある文字の多数の例が集まらなくてもよい。
る新たなフォントのために決定ツリーを生育するためで
あっても、あるフォントについて既に生成されている確
率テーブルを使うことができるので、OCRマシンが新
たなフォントを学習しそのための決定ツリーを生育する
のに十分な統計を生成するのに必要なシンボルまたは文
字の数と時間が大幅に減少する。さらに、新たなフォン
トでのある文字の多数の例が集まらなくてもよい。
この場合、画素の色の確率を通常の方法によっては評価
することはできない。結果として、従来の手段を用いて
新たなフォントの光学的文字認識を実行することはでき
ないのである。
することはできない。結果として、従来の手段を用いて
新たなフォントの光学的文字認識を実行することはでき
ないのである。
第1図は新たなOCR決定ロジックを生成するのに適し
たマシンのブロック図である。新たなOCR決定ロジッ
クを生成するのに用いられる第1図の装置は、確率テー
ブルの生育に用いられる第4図のものと同じであってよ
い。スキャナ21は第4図のシステムのものと同じであ
ってよい。ロジック25の近傍状態計算部は、第4図に
示された近傍状態・確率計算ロジック13と同じであっ
てよい。確率テーブルをストアするメモリ15は、第4
図において元々確率テーブルがストアされているメモリ
と同じであってよい。OCR決定ツリー・ロジックを生
成する上で、第1図では近傍状態計算と決定ツリー生成
を実行するためにメモリ15とロジック250間の2方
向通信が行われる。
たマシンのブロック図である。新たなOCR決定ロジッ
クを生成するのに用いられる第1図の装置は、確率テー
ブルの生育に用いられる第4図のものと同じであってよ
い。スキャナ21は第4図のシステムのものと同じであ
ってよい。ロジック25の近傍状態計算部は、第4図に
示された近傍状態・確率計算ロジック13と同じであっ
てよい。確率テーブルをストアするメモリ15は、第4
図において元々確率テーブルがストアされているメモリ
と同じであってよい。OCR決定ツリー・ロジックを生
成する上で、第1図では近傍状態計算と決定ツリー生成
を実行するためにメモリ15とロジック250間の2方
向通信が行われる。
しかるに、第4図のシステムでは、近傍状態・確率計算
ロジックがデータをメモリ15に書き込めることだけが
要求されており、メモリからデータを読み取る必要はな
い。
ロジックがデータをメモリ15に書き込めることだけが
要求されており、メモリからデータを読み取る必要はな
い。
スキャナ21は、未知のフォントで印刷された、識別さ
れるべき、あるいはマシンに教え込まれるべき、教育用
の文書(ドキュメント)をスキャンする。スキャナ21
は、通常のやり方でドキュメントを画素アレイに変換す
る。各画素は黒または白である。各画素は、メモリにス
トアされている確率テーブルを生育するのに用いられた
タイプの近傍を有する。各画素の周囲について、確率テ
ーブルを生育するのに用いられたのと同じ近傍が、対応
する近傍画素には同一の値を割り当てて、用いられる。
れるべき、あるいはマシンに教え込まれるべき、教育用
の文書(ドキュメント)をスキャンする。スキャナ21
は、通常のやり方でドキュメントを画素アレイに変換す
る。各画素は黒または白である。各画素は、メモリにス
トアされている確率テーブルを生育するのに用いられた
タイプの近傍を有する。各画素の周囲について、確率テ
ーブルを生育するのに用いられたのと同じ近傍が、対応
する近傍画素には同一の値を割り当てて、用いられる。
このように、教育用ドキュメントの画素及び確率テーブ
ル生成に用いられた参照ドキュメントの画素は、どちら
も同じ場所・色の画素で囲まれたならば、同一の近傍状
態値を持つことになる。第3図のナンバリング法を用い
るなら、試験対象の画素を囲む8つの画素が該画素の近
傍になる。近傍画素には、第3図に示されるような値が
割り当てられる。つまり、西隣りの画素には値2°=1
、北西の隣りには21=2、・・・、南西の隣りには2
’=128、といった具合である。
ル生成に用いられた参照ドキュメントの画素は、どちら
も同じ場所・色の画素で囲まれたならば、同一の近傍状
態値を持つことになる。第3図のナンバリング法を用い
るなら、試験対象の画素を囲む8つの画素が該画素の近
傍になる。近傍画素には、第3図に示されるような値が
割り当てられる。つまり、西隣りの画素には値2°=1
、北西の隣りには21=2、・・・、南西の隣りには2
’=128、といった具合である。
各ブロックが文字を表わす、そういった画素のフロック
つまりクラスタは、スキャンされたベージを表わす画素
アレイの中で識別される。文字“A”を表現する画素の
文字パターンの1例が第5図に示されている。このよう
なパターンは例えば1辺が20画素の正方形であって、
合計400画素からなるクラスタを構成する。
つまりクラスタは、スキャンされたベージを表わす画素
アレイの中で識別される。文字“A”を表現する画素の
文字パターンの1例が第5図に示されている。このよう
なパターンは例えば1辺が20画素の正方形であって、
合計400画素からなるクラスタを構成する。
試験対象の画素は文字パターンの中から選ばれる。ロジ
ック・ユニット25の近傍状態計算部は、メモリ15に
ストアされている確率テーブルを生成するのに用いたの
と同じ数値割当法を使って、当該画素の近傍値を決定す
る。当該画素について近傍状態つまり値が確定すると、
該近傍値を使って、メモリ15に先にストアされている
確率テーブルがアドレスされる。当該近傍状態について
ストアされている関連する確率がメモリから読み出され
る。ストアされている確率テーブルから読まれた確率は
、新しいフォントの当該文字についての文字ブロック中
の選択された画素に割り当てられる。当該割り当てられ
た確率は、新しいフォントについての決定ツリーを生成
する際に、当該画素が黒である確率として用いられる。
ック・ユニット25の近傍状態計算部は、メモリ15に
ストアされている確率テーブルを生成するのに用いたの
と同じ数値割当法を使って、当該画素の近傍値を決定す
る。当該画素について近傍状態つまり値が確定すると、
該近傍値を使って、メモリ15に先にストアされている
確率テーブルがアドレスされる。当該近傍状態について
ストアされている関連する確率がメモリから読み出され
る。ストアされている確率テーブルから読まれた確率は
、新しいフォントの当該文字についての文字ブロック中
の選択された画素に割り当てられる。当該割り当てられ
た確率は、新しいフォントについての決定ツリーを生成
する際に、当該画素が黒である確率として用いられる。
決定ツリー・ロジック・デザインでは、新しいフォント
のドキュメントが与えられたときに、どの画素を試験す
べきかを決定するために、様々な文字画素ブロック中の
様々な画素についての様々な黒の確率が用いられる。目
的は、異なる認識対象文字を区別するのに有用な画素を
見つけることにある。かかる確率統計を用いる適当な決
定ツリー設計方法が、Ca5ey及びNagy著、De
cisionTree Design Using a
Probabilistic Model、”TEE
E Transactions on Informa
tion Theory。
のドキュメントが与えられたときに、どの画素を試験す
べきかを決定するために、様々な文字画素ブロック中の
様々な画素についての様々な黒の確率が用いられる。目
的は、異なる認識対象文字を区別するのに有用な画素を
見つけることにある。かかる確率統計を用いる適当な決
定ツリー設計方法が、Ca5ey及びNagy著、De
cisionTree Design Using a
Probabilistic Model、”TEE
E Transactions on Informa
tion Theory。
Vol、I7 30. No、1. pp、 93−9
9 (1984年1月)に記載されている。
9 (1984年1月)に記載されている。
教育用ドキュメント中にある文字について2つ以上のサ
ンプルが登場し、かつサンプルが同一ではない場合、近
傍状態決定に関係する近傍画素の色を確立するために、
平均あるいは該文字の理想的代表あるいは当該文字を表
現する画素ブロックが用いられる。
ンプルが登場し、かつサンプルが同一ではない場合、近
傍状態決定に関係する近傍画素の色を確立するために、
平均あるいは該文字の理想的代表あるいは当該文字を表
現する画素ブロックが用いられる。
文字の平均化には、当該文字の異なる発生を比較するこ
と、及び文字ブロック中の画素ごとに、該画素が黒の頻
度が白より高いかあるいは白の頻度が黒より高いかを決
定することが含まれる。黒である頻度の方が高い(少な
くとも50%である)画素は、当該画素ブロック内の画
素の近傍状態を決定するために、当該画素が近傍である
という目的において、黒であると言われる。同様に、白
である確率が50%を越える画素は、近傍値を決定する
上で、白であると言われる。
と、及び文字ブロック中の画素ごとに、該画素が黒の頻
度が白より高いかあるいは白の頻度が黒より高いかを決
定することが含まれる。黒である頻度の方が高い(少な
くとも50%である)画素は、当該画素ブロック内の画
素の近傍状態を決定するために、当該画素が近傍である
という目的において、黒であると言われる。同様に、白
である確率が50%を越える画素は、近傍値を決定する
上で、白であると言われる。
第6図は、本発明を用いて、新フォントを識別するべく
OCR装置を教育するプロセスを示す。
OCR装置を教育するプロセスを示す。
この流れ図の記述は、既述の良好な実施例の説明を要約
したものである。
したものである。
任意のフォントのテキストの参照ドキュメントがスキャ
ンされる。ある近傍状態の下で、画素が黒である頻度が
カウントされ、その結果、画素が黒である確率を近傍状
態の関数として与える確率テーブルが求められる。確率
テーブル生成ファンクションは1度だけ行えばよいので
あり、新しいフォントのドキュメントがスキャンされる
たびに繰り返す必要はない。
ンされる。ある近傍状態の下で、画素が黒である頻度が
カウントされ、その結果、画素が黒である確率を近傍状
態の関数として与える確率テーブルが求められる。確率
テーブル生成ファンクションは1度だけ行えばよいので
あり、新しいフォントのドキュメントがスキャンされる
たびに繰り返す必要はない。
新フォント用に決定ツリー・ロジックを生成するときに
は、当該新フォントで印刷されたドキュメントがスキャ
ンされる。クラスタ、あるいは画素ブロック、あるいは
様々なキャラクタを表わす文字パターン、あるいは文字
クラスが識別される。
は、当該新フォントで印刷されたドキュメントがスキャ
ンされる。クラスタ、あるいは画素ブロック、あるいは
様々なキャラクタを表わす文字パターン、あるいは文字
クラスが識別される。
文字の代表が2つ以上に識別される場合は、それらの代
表を平均してキャラクタ代表を得る。
表を平均してキャラクタ代表を得る。
該キャラクタ代表を使って、各キャラクタ・ブロックの
画素についての画素確率が生成される。
画素についての画素確率が生成される。
この確率を使って、ツリーデザイン・ロジックは適当な
OCR決定ツリー・ロジックを生成することができる。
OCR決定ツリー・ロジックを生成することができる。
本発明によると、確率テーブルの生成(第6図の破線よ
り左の部分)は、文字認識ツリーの生成(第6図の破線
より右の部分)とは異なるマシンで行うことができる。
り左の部分)は、文字認識ツリーの生成(第6図の破線
より右の部分)とは異なるマシンで行うことができる。
したがって、本発明を使うと、OCR装置のメーカーは
、装置メモリに確率テーブルをストアしておくとともに
、多くの場合には装置に少数のキャラクタ認識決定ツリ
ーだけをストアしておくことができる。メーカーは、O
CRデバイス中に、画素確率統計に基づいて文字識別決
定ツリーの生成を可能たらしめるのに必要なプログラム
をもストアする。そうすると、ユーザが該OCR装置に
よる新たなフォント(メーカーがストアした何れのもの
とも異なるフォント)の識別を欲した場合に、ユーザは
OCR装置に新フォント用の新決定ツリーを生成させる
ことができる。
、装置メモリに確率テーブルをストアしておくとともに
、多くの場合には装置に少数のキャラクタ認識決定ツリ
ーだけをストアしておくことができる。メーカーは、O
CRデバイス中に、画素確率統計に基づいて文字識別決
定ツリーの生成を可能たらしめるのに必要なプログラム
をもストアする。そうすると、ユーザが該OCR装置に
よる新たなフォント(メーカーがストアした何れのもの
とも異なるフォント)の識別を欲した場合に、ユーザは
OCR装置に新フォント用の新決定ツリーを生成させる
ことができる。
本発明を使うと、新しいフォントの各文字について、代
表は1つだけ必要とされるOCR装置は、この単一の代
表に基づいて、ツリー・デザイン・ロジックが新フォン
ト用の決定ツリーを生成するのに必要である画素色確率
を生成することができる。
表は1つだけ必要とされるOCR装置は、この単一の代
表に基づいて、ツリー・デザイン・ロジックが新フォン
ト用の決定ツリーを生成するのに必要である画素色確率
を生成することができる。
E0発明の効果
本発明によれば、新しいフォントを識別するために新し
い決定ツリーを生成することが大幅に簡略化され、かつ
スピード・アップされるゆ
い決定ツリーを生成することが大幅に簡略化され、かつ
スピード・アップされるゆ
第1図は、本発明による、新しいOCR決定ロジックを
生成するのに適した装置のブロック図である。 第2A図、第2B図、及び第2C図は、それぞれ画素の
近傍の例を説明するための図である。 第3図は、画素の近傍状態を決定するためのナンバリン
グ法の1例の説明図である。 第4図は、画素色確率テーブルの生成に適した装置のブ
ロック図である。 第5図は、文字を表わす画素のクラスタつまりブロック
の説明図である。 第6図は、本発明を用いた、OCR決定ツリー生成のフ
ロー・チャートである。 第7図は、従来の決定ツリー生育プロセスのフロー・チ
ャートである。 X1 第2C図 汐数Q:J!:定ツソ− 20X 24 第3図
生成するのに適した装置のブロック図である。 第2A図、第2B図、及び第2C図は、それぞれ画素の
近傍の例を説明するための図である。 第3図は、画素の近傍状態を決定するためのナンバリン
グ法の1例の説明図である。 第4図は、画素色確率テーブルの生成に適した装置のブ
ロック図である。 第5図は、文字を表わす画素のクラスタつまりブロック
の説明図である。 第6図は、本発明を用いた、OCR決定ツリー生成のフ
ロー・チャートである。 第7図は、従来の決定ツリー生育プロセスのフロー・チ
ャートである。 X1 第2C図 汐数Q:J!:定ツソ− 20X 24 第3図
Claims (1)
- 【特許請求の範囲】 文字認識用の決定ツリーをフオントに応じて生成する
方法であつて、 すべての画素に共通に適用される近傍画素の範囲を確定
しておき、 1つのフオントで印刷された文書を走査して一連の画素
の色情報を求め、 上記一連の画素の各々を選択し、当該選択画素の色情報
と、当該選択画素の近傍画素の色情報に基づいて近傍状
態値を求めることを繰り返すことによつて、近傍状態値
毎に決まる選択画素の色の確率情報を求め、 上記確率情報を近傍状態値によつてアドレスできるよう
にメモリにストアし、 任意のフオントについて、該フオントで印刷された文書
を走査して得られた一連の画素に基づいて、複数個の文
字クラスタを識別し、 上記複数個の文字クラスタの各々について、当該文字ク
ラスタの画素の各々を選択し、当該選択画素についてそ
の近傍状態値を求め、該求まつた近傍状態値に基づいて
上記メモリをアドレスして関連する確率情報を読み取り
、 上記文字クラスタの各画素に対応して読み取られた確率
情報に基づいて、当該フオント用の決定ツリーを生成す
る ことを特徴とする方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/221,164 US4831657A (en) | 1988-07-19 | 1988-07-19 | Method and apparatus for establishing pixel color probabilities for use in OCR logic |
US221164 | 1988-07-19 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0239389A true JPH0239389A (ja) | 1990-02-08 |
JPH0682401B2 JPH0682401B2 (ja) | 1994-10-19 |
Family
ID=22826628
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1124574A Expired - Lifetime JPH0682401B2 (ja) | 1988-07-19 | 1989-05-19 | 文字認識用の決定ツリー生成方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US4831657A (ja) |
EP (1) | EP0352011B1 (ja) |
JP (1) | JPH0682401B2 (ja) |
CA (1) | CA1313266C (ja) |
DE (1) | DE68925312T2 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5067088A (en) * | 1990-02-16 | 1991-11-19 | Johnson & Quin, Inc. | Apparatus and method for assembling mass mail items |
US5020121A (en) * | 1990-08-16 | 1991-05-28 | Hewlett-Packard Company | Neighborhood block prediction bit compression |
WO1992008198A1 (en) * | 1990-11-05 | 1992-05-14 | Johnson & Quin, Inc. | Document control and audit apparatus and method |
US5253307A (en) * | 1991-07-30 | 1993-10-12 | Xerox Corporation | Image analysis to obtain typeface information |
US5875261A (en) * | 1991-12-20 | 1999-02-23 | International Business Machines Corporation | Method of and apparatus for optical character recognition based on geometric and color attribute hypothesis testing |
US5396564A (en) * | 1991-12-20 | 1995-03-07 | International Business Machines Corporation | Method of and apparatus for recognizing predominate and non-predominate color code characters for optical character recognition |
US5406640A (en) * | 1991-12-20 | 1995-04-11 | International Business Machines Corporation | Method of and apparatus for producing predominate and non-predominate color coded characters for optical character recognition |
FR2685795B1 (fr) * | 1991-12-26 | 1994-02-25 | Thomson Csf | Procede de segmentation polytomique. |
JP3106021B2 (ja) * | 1992-11-30 | 2000-11-06 | キヤノン株式会社 | パターンデータの圧縮方法及び装置と出力方法及び装置 |
IL172678A0 (en) * | 2005-12-19 | 2006-04-10 | Aharon Topper | Method, system and computer program for encoding and decoding a pixelized target graphic symbol |
US20130039589A1 (en) * | 2011-08-11 | 2013-02-14 | I. R. I. S. | Pattern recognition process, computer program product and mobile terminal |
RU2598300C2 (ru) | 2015-01-27 | 2016-09-20 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способы и системы автоматического распознавания символов с использованием дерева решений |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3839702A (en) * | 1973-10-25 | 1974-10-01 | Ibm | Bayesian online numeric discriminant |
US3964591A (en) * | 1975-06-10 | 1976-06-22 | International Business Machines Corporation | Font selection system |
US4274079A (en) * | 1979-07-12 | 1981-06-16 | Burroughs Corporation | Apparatus and method for dynamic font switching |
US4499596A (en) * | 1982-06-28 | 1985-02-12 | International Business Machines Corporation | Adaptive facsimile compression using a dynamic extendable decision network |
US4589142A (en) * | 1983-12-28 | 1986-05-13 | International Business Machines Corp. (Ibm) | Method and apparatus for character recognition based upon the frequency of occurrence of said characters |
JPS60262290A (ja) * | 1984-06-08 | 1985-12-25 | Hitachi Ltd | 情報認識システム |
JPH0727543B2 (ja) * | 1988-04-28 | 1995-03-29 | インターナシヨナル・ビジネス・マシーンズ・コーポレーション | 文字認識装置 |
-
1988
- 1988-07-19 US US07/221,164 patent/US4831657A/en not_active Expired - Fee Related
-
1989
- 1989-05-18 CA CA000600083A patent/CA1313266C/en not_active Expired - Fee Related
- 1989-05-19 JP JP1124574A patent/JPH0682401B2/ja not_active Expired - Lifetime
- 1989-07-12 EP EP89307074A patent/EP0352011B1/en not_active Expired - Lifetime
- 1989-07-12 DE DE68925312T patent/DE68925312T2/de not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
DE68925312D1 (de) | 1996-02-15 |
EP0352011A3 (en) | 1992-02-05 |
JPH0682401B2 (ja) | 1994-10-19 |
DE68925312T2 (de) | 1996-07-11 |
EP0352011A2 (en) | 1990-01-24 |
EP0352011B1 (en) | 1996-01-03 |
CA1313266C (en) | 1993-01-26 |
US4831657A (en) | 1989-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107194400B (zh) | 一种财务报销全票据图片识别处理方法 | |
EP1146472A2 (en) | Loose-gray-scale template matching | |
CN100517461C (zh) | 图像处理设备和方法 | |
US4524454A (en) | Method of assigning direction code to boundary picture element in character recognition system | |
US4499596A (en) | Adaptive facsimile compression using a dynamic extendable decision network | |
US5590220A (en) | Bending point extraction method for optical character recognition system | |
JPH0239389A (ja) | 文字認識用の決定ツリー生成方法 | |
GB2190778A (en) | Character recognition with variable subdivision of a character region | |
WO1998035314A2 (en) | System and method for pattern recognition | |
JPH06187497A (ja) | 文字認識方法 | |
US9589185B2 (en) | Symbol recognition using decision forests | |
Bomba | Alpha-numeric character recognition using local operations | |
WO1995010820A1 (en) | Methods and apparatus for classification of images using distribution maps | |
WO2002019248A9 (en) | Character recognition system | |
JPH0139265B2 (ja) | ||
JPH06282686A (ja) | 文字認識方法 | |
CN111914846A (zh) | 版面数据合成方法、设备及存储介质 | |
RU2582064C1 (ru) | Способы и системы эффективного автоматического распознавания символов с использованием леса решений | |
JPH0333990A (ja) | マスク処理を用いる光学式文字認識装置及び方法 | |
CN109886276B (zh) | 一种表盘滚动数字字符的半字判断方法 | |
Pornpanomchai et al. | Printed Thai character recognition by genetic algorithm | |
Rodrigues et al. | Character feature extraction using polygonal projection sweep (contour detection) | |
Tissing | Automatic Grading of CITO Mathematics Tests | |
JPH11120291A (ja) | パタン認識システム | |
JP3197464B2 (ja) | 文字認識方法および文字認識装置 |