JPH0682401B2 - 文字認識用の決定ツリー生成方法 - Google Patents

文字認識用の決定ツリー生成方法

Info

Publication number
JPH0682401B2
JPH0682401B2 JP1124574A JP12457489A JPH0682401B2 JP H0682401 B2 JPH0682401 B2 JP H0682401B2 JP 1124574 A JP1124574 A JP 1124574A JP 12457489 A JP12457489 A JP 12457489A JP H0682401 B2 JPH0682401 B2 JP H0682401B2
Authority
JP
Japan
Prior art keywords
pixel
pixels
character
probability
neighborhood
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1124574A
Other languages
English (en)
Other versions
JPH0239389A (ja
Inventor
リチヤード・ジヨージ・ケイシイ
コータプラン・モハメダリ・モージユデイン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH0239389A publication Critical patent/JPH0239389A/ja
Publication of JPH0682401B2 publication Critical patent/JPH0682401B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Description

【発明の詳細な説明】 A.産業上の利用分野 本発明はOCR装置用の決定ツリー(デシジヨン・ツリ
ー)の設計に関し、さらに詳しくは、OCR決定ツリーを
生成するのに有用な、特定の画素についての色確率を設
定することに関する。
B.従来技術及びその問題点 文字認識の1つの方法は決定ツリーを確立することであ
る。決定ツリーでは、様々な画素が相次いで試験され、
そして、画素を試験するたびに、該画素が黒であるか白
であるかに応じて、技が選択される。このような決定ツ
リーは公知であり、文献にも記されている。
一般的に、OCR装置は、該OCR装置が認識できるように訓
練されたフオントで印刷された文字を認識することがで
きるだけである。普通、OCR装置は、メーカーによつ
て、少数の共通タイプ・フオントを認識できるようにプ
ログラムされている。しかし、レーザ・プリンタが普及
して多数のタイプ・フオントを生成できるようになるに
つれて、多くのユーザーが、自分たちのOCR装置を訓練
してメーカーが準備したものとは異なる新たなフオント
の文字を識別できるようになることを望んでいる。
OCR装置が特定のフオントの文字を認識するための決定
ツリーを設計するためには、所与の文字について、該文
字を表わす画素ブロツク中の所与の画素が黒であること
の確率が必要とされる。当該文字をその他の文字と区別
するのに有用な画素を識別するためである。決定ツリー
の設計法の1つが、Casey等著の、“Decision Tree D
esign Using a Probabilistic Model,"IEEE Tran
sactions on Information Theory,Vol.IT−30.No1,p
p.93−99(1984年)に記載されている。
なお、ここで“文字”なる語は、OCR装置による認識の
対象となる、印刷されたまたは書かれたシンボルを指し
ている。文字は、典型的には字や数字であり、その他の
シンボルであつてもよい。また、“文字”は、シンボル
のクラスを指すこともあることに注意されたい。数字の
“1"と小文字の“l"のように2つのシンボルが極めて似
ていてOCR決定ロジツクが必ずしも両者を区別しない場
合が例としてあげられる。また、以下の説明では黒と白
の画素について言及しているけれども、これと異なる区
別可能な色の組合せも用い得る。さらに、黒画素・白画
素の文脈の中で、黒画素及び黒の確率に基づいて方法・
装置を説明するけれども、決定ツリー・ロジツクは、白
画素及び白の確率に基づかせることもできる。
従来は、各文字の個々の画素について黒の確率を得るた
めに、当該フオントの各文字につき、数百ものサンプル
を試験しなければならなかつた。サンプルの収集・識別
は多くの時間と費用を必要とする。加えて、上記のよう
な多数のサンプルを集められないこともしばしばある。
したがつて、各文字について訓練用のサンプルをできる
だけ少なくしつつ(理想的には1つにする)、OCR決定
ツリーを設定できる方法が望まれていた。
第7図は、従来の決定ツリー生成プロセスを示す。サン
プルがスキヤン(走査)されると、画素のアレイ(列)
が生成される。認識対象となる文字または文字クラスの
各々について、当該文字または文字クラスのすべてのサ
ンプルがスーパーインポーズされる。特定の画素が黒で
ある確率は、これらのサンプルのうちで該画素が黒であ
つた回数をサンプル数で割つて計算される。この確率に
基づいて、該フオントの文字識別用決定ツリーを生成す
る際に使われる一定の画素を選択することができる。こ
のようなやり方では、正確な文字認識を行おうとする
と、文字または文字クラスの各々について、典型的には
100ないし200のオーダーの、多数のサンプルを必要とす
る。
C.問題点を解決するための手段 本発明は、多数の文字サンプルを試験することなしに、
ある特定画素の色の確率を確実に評価する方法に関す
る。本発明の方法では、画素がある色を有する確率がそ
の近傍状態の関数として確実に評価できるという、予期
しなかつた実験観察を利用している。ここで、ある特定
画素の近傍状態とは、考慮対象の当該画素の直近の画素
値の加重和として求まる。
本発明による、文字認識装置を教育して未知のフオント
の文字を認識できるようにする方法には、該未知フオン
トで印刷された文書をスキヤンして画素アレイを生成す
ることが含まれる。アレイ中の各画素について、直近の
画素を分析することにより、該画素のいわゆる近傍状態
を計算することができる。文字を表わす画素ブロツクが
識別される。該ブロツク中の画素が選択されると、該選
択された画素の近傍状態に基づいてメモリがアドレスさ
れる。該メモリは、その中に確率テーブルをストアして
いる。確率テーブルは、第1の未知フオントとは異なる
第2のフオントの場合にも、画素が黒である確率をその
近傍状態の関数として提供する。選択された画素の近傍
状態に関連する黒の確率がメモリから読み出されて、当
該確率が当該選択された画素に割り当てられる。そし
て、当該割り当てられた黒の確率を使つて、未知のフオ
ントのために決定ツリーが生成される。
D.実施例 画素ブロツク中の画素の色は、該画素の属するキヤラク
タ・クラスに依存する。予期しなかつたことが、発明者
は、画素の色が画素の近傍状態(neighborhood stat
e)の関数としてのみ予測することができ、画素の属す
るキヤラクタ・クラスを全く知らなくてもよいことを発
見した。
あるフオントにおいて、2進画素パターン中の画素の色
を、近傍画素の色を与えておいた上で予測することがで
きる。第2図を例にとつて説明しよう。第2A図では、未
知の色を持つ画素Xが8個の隣接画素に囲まれている。
隣接画素の各々は、(白色を示す)値0を有している。
中央画素Xが白(値0)である確率は非常に高い。しか
し、確率は必ずしも1.00でない。というのは、そのよう
な点にあつても迷い(ストレイ)ドツトというものはあ
り得るからである。同様に、第2B図にあつては、中央画
素Xが黒である(値が1である)確率は非常に高い。と
いうのは、これを囲む8個の近傍画素が黒だからであ
る。
近傍の半分が黒で半分が白であるような画素Xの例が第
2C図に示されている。かかる近傍を持つ中心画素Xの値
が1である確からしさは、多数の例を調べることによつ
て統計的に決定することができる。近傍画素の色が与え
られている画素の色を予測する能力の試験についての記
載が、次の文献に見られる。
Mohiuddin,et al.,“Lossless Binary Image Compr
ession Based on Pattern Matching,"Internationa
l Conference on Computers,Sistem and Signal
Processing,Bangalore,India(Dec.9−12,1984) 画素近傍は、水平及び垂直方向の所定数の周辺近隣画素
によつて構成される。したがつて、画素とその近傍によ
つて、グリツドまたは画素のマトリツクスが形成され
る。図示した例では、8個の周辺隣接画素によつて近傍
が構成されており、したがつて3×3の正方形グリツド
が形成される。異なる配列も可能である。近傍が正方形
である必要はない。
画素の状態は、その近傍の要素に重み付けした値の和と
して規定することができる。例えば、第3図に示される
ように、勝手に、近傍画素に対して、西隣りのものを起
点として時計回りに番号を付すことができる。西隣りに
は値20(=1)が割り当てられる。北西方向の隣りには
値21(=2)が割り当てられる。以下同様の割当が行わ
れ、南西画素には値27(=128)が割り当てられる。実
際のナンバリング自体は重要ではない。というのは、ナ
ンバリングは、あり得る近傍状態の各々を一意に識別で
きるようにすることのみを目的としているからである。
近隣には8つのメンバーがあるので、合計256の異なる
状態があり得る。
近傍状態は、黒である近傍の値の和を求めることによつ
て得られる。したがつて、第3図に示されるようなナン
バリング・システムを用いると、第2A図に示される画素
近傍の状態つまり値は0となり、一方、第2B図の場合に
は近傍状態値が255になる。第2C図の近傍では、近傍状
態値は30、つまり21+22+23+24になる。
テキストの走査を通じて、近傍状態の各々の発生回数を
定めることができ、同様にその発生回数のうち中央画素
が黒である回数も定めることができる。したがつて、当
該近傍状態の下で中央画素がある値を持つ確率を定める
ことができる。これは、当該近傍を伴う画素が黒である
回数を、当該近傍状態の発生回数で割ることによつて達
成される。このようにして、256の可能な近傍状態ごと
に黒の確率のエントリイを持つテーブルを生成すること
ができる。
第4図は、かかる確率テーブルを生成してストアしてお
くのに適した装置のブロツク図を示す。スキヤナ11は、
統計データが取り出される参照テキストをスキヤンし
て、2進画素アレイを近傍状態・確率計算ロジツク13へ
供給する。アレイの画素毎に、ロジツク13は、黒の近傍
画素に割り当てられた値を足し合わせ、当該画素につい
ての近傍状態値を得る。検討対象の画素の色も決定され
る。そのような統計が集まると、各近傍状態値につい
て、中央画素が黒であつた回数のパーセンテージが直ち
に決定される。当該パーセンテージは、該近傍状態値の
場合における黒の確率を表わす。したがつて、ロジツク
13は、画素アレイの試験時に様々なカウントを一時的に
蓄えるためのメモリを有している。近傍状態の関数とし
て計算された黒の確率(確率テーブル)は、メモリ15に
読み込まれて後の用に供される。
予期しなかつたことだが、本出願の発明者は、上述の如
くして求まる、ある近傍状態における画素が黒である確
率が、当該画素の位置する文字クラスに関係なく実質的
に不変であることを発見した。したがつて、確率テーブ
ルもまた試験対象のフオントと無関係である。非常に異
なるフオント同士の間において、あるいは違う言語を表
現するフオント同士の間でさえも、確率テーブルは実質
的に一定である。それゆえ、以前にあるフオントについ
て生成されストアされた確率は、新たなフオントを認識
するようOCR装置を教えるのに使うことができる。
この結果、確率テーブル生成に用いたフオントとは異な
る新たなフオントのために決定ツリーを生育するためで
あつても、あるフオントについて既に生成されている確
率テーブルを使うことができるので、OCRマシンが新た
なフオントを学習しそのための決定ツリーを生育するの
に十分な統計を生成するのに必要なシンボルまたは文字
の数と時間が大幅に減少する。さらに、新たなフオント
でのある文字の多数の例が集まらなくてもよい。この場
合、画素の色の確率を通常の方法によつては評価するこ
とはできない。結果として、従来の手段を用いた新たな
フオントの光学的文字認識を実行することはできないの
である。
第1図は新たなOCR決定ロジツクを生成するのに適した
マシンのブロツク図である。新たなOCR決定ロジツクを
生成するのに用いられる第1図の装置は、確率テーブル
の生育に用いられる第4図のものと同じであつてよい。
スキヤナ21は第4図のシステムのものと同じであつてよ
い。ロジツク25の近傍状態計算部は、第4図に示された
近傍状態・確率計算ロジツク13と同じであつてよい。確
率テーブルをストアするメモリ15は、第4図において元
々確率テーブルがストアされているメモリと同じであつ
てよい。OCR決定ツリー・ロジツクを生成する上で、第
1図では近傍状態計算と決定ツリー生成を実行するため
にメモリ15とロジツク25の間の2方向通信が行われる。
しかるに、第4図のシステムでは、近傍状態・確率計算
ロジツクがデータをメモリ15に書き込めることだけが要
求されており、メモリからデータを読み取る必要はな
い。
スキヤナ21は、未知のフオントで印刷された、識別され
るべき、あるいはマシンに教え込まれるべき、教育用の
文書(ドキユメント)をスキヤンする。スキヤナ21は、
通常のやり方でドキユメントを画素アレイに変換する。
各画素は黒または白である。各画素は、メモリにストア
されている確率テーブルを生育するのに用いられたタイ
プの近傍を有する。各画素の周囲について、確率テーブ
ルを生育するのに用いられたのと同じ近傍が、対応する
近傍画素には同一の値を割り当てて、用いられる。この
ように、教育用ドキユメントの画素及び確率テーブル生
成に用いられた参照ドキユメントの画素は、どちらも同
じ場所・色の画素で囲まれたならば、同一の近傍状態値
を持つことになる。第3図のナンバリング法を用いるな
ら、試験対象の画素を囲む8つの画素が該画素の近傍に
なる。近傍画素には、第3図に示されるような値が割り
当てられる。つまり、西隣りの画素には値20=1、北西
の隣りには21=2、…、南西の隣りには27=128、とい
つた具合である。
各ブロツクが文字を表わす、そういつた画素のブロツク
つまりクラスタは、スキヤンされたページを表わす画素
アレイの中で識別される。文字“A"を表現する画素の文
字パターンの1例が第5図に示されている。このような
パターンは例えば1辺が20画素の正方形であつて、合計
400画素からなるクラスタを構成する。
試験対象の画素は文字パターンの中から選ばれる。ロジ
ツク・ユニツト25の近傍状態計算部は、メモリ15にスト
アされている確率テーブルを生成するのに用いたのと同
じ数値割当法を使つて、当該画素の近傍値を決定する。
当該画素について近傍状態つまり値が決定すると、該近
傍値を使つて、メモリ15に先にストアされている確率テ
ーブルがアドレスされる。当該近傍状態についてストア
されている関連する確率がメモリから読み出される。ス
トアされている確率テーブルから読まれた確率は、新し
いフオントの当該文字についての文字ブロツク中の選択
された画素に割り当てられる。当該割り当てられた確率
は、新しいフオントについての決定ツリーを生成する際
に、当該画素が黒である確率として用いられる。
決定ツリー・ロジツク・デザインでは、新しいフオント
のドキユメントが与えられたときに、どの画素を試験す
べきかを決定するために、様々な文字画素ブロツク中の
様々な画素についての様々な黒の確率が用いられる。目
的は、異なる認識対象文字を区別するのに有用な画素を
見つけることにある。かかる確率統計を用いる適当な決
定ツリー設計方法が、Casey及びNagy著、“Decision T
ree Design Using a Probabilistic Model,"IEEE
Transactions on Information Theory,Vol.IT−3
0.No1,pp.93−99(1984年1月)に記載されている。
教育用ドキユメント中にある文字について2つ以上のサ
ンプルが登場し、かつサンプルが同一ではない場合、近
傍状態決定に関係する近傍画素の色を確立するために、
平均あるいは該文字の理想的代表あるいは当該文字を表
現する画素ブロツクが用いられる。
文字の平均化には、当該文字の異なる発生を比較するこ
と、及び文字ブロツク中の画素ごとに、該画素が黒の頻
度が白より高いかあるいは白の頻度が黒より高いかを決
定することが含まれる。黒である頻度の方が高い(少な
くとも50%である)画素は、当該画素ブロツク内の画素
の近傍状態を決定するために、当該画素が近傍であると
いう目的において、黒であると言われる。同様に、白で
ある確率が50%を越える画素は、近傍値を決定する上
で、白であると言われる。
第6図は、本発明を用いて、新フオントを識別するべく
OCR装置を教育するプロセスを示す。この流れ図の記述
は、既述の良好な実施例の説明を要約したものである。
任意のフオントのテキストの参照ドキユメントがスキヤ
ンされる。ある近傍状態の下で、画素が黒である頻度が
カウントされ、その結果、画素が黒である確率を近傍状
態の関数として与える確率テーブルが求められる。確率
テーブル生成フアンクシヨンは1度だけ行えばよいので
あり、新しいフオントのドキユメントがスキヤンされる
たびに繰り返す必要はない。
新フオント用に決定ツリー・ロジツクを生成するときに
は、当該新フオントで印刷されたドキユメントがスキヤ
ンされる。クラスタ、あるいは画素ブロツク、あるいは
様々なキヤラクタを表わす文字パターン、あるいは文字
クラスが識別される。文字の代表が2つ以上に識別され
る場合は、それらの代表を平均してキヤラクタ代表を得
る。
該キヤラクタ代表を使つて、各キヤラクタ・ブロツクの
画素についての画素確率が生成される。この確率を使つ
て、ツリーデザイン・ロジツクは適当なOCR決定ツリー
・ロジツクを生成することができる。
本発明によると、確率テーブルの生成(第6図の破線よ
り左の部分)は、文字認識ツリーの生成(第6図の破線
より右の部分)とは異なるマシンで行うことができる。
したがつて、本発明を使うと、OCR装置のメーカーは、
装置メモリに確率テーブルをストアしておくとともに、
多くの場合には装置に少数のキヤラクタ認識決定ツリー
だけをストアしておくことができる。メーカーは、OCR
デバイス中に、画素確率統計に基づいて文字識別決定ツ
リーの生成を可能たらしめるのに必要なプログラムをも
ストアする。そうすると、ユーザが該OCR装置による新
たなフオント(メーカーがストアした何れのものとも異
なるフオント)の識別を欲した場合に、ユーザはOCR装
置に新フオント用の新決定ツリーを生成させることがで
きる。
本発明を使うと、新しいフオントの各文字について、代
表は1つだけ必要とされるOCR装置は、この単一の代表
に基づいて、ツリー・デザイン・ロジツクが新フオント
用の決定ツリーを生成するのに必要である画素色確率を
生成することができる。
E.発明の効果 本発明によれば、新しいフオントを識別するために新し
い決定ツリーを生成することが大幅に簡略化され、かつ
スピード・アツプされる。
【図面の簡単な説明】
第1図は、本発明による、新しいOCR決定ロジツクを生
成するのに適した装置のブロツク図である。 第2A図、第2B図、及び第2C図は、それぞれ画素の近傍の
例を説明するための図である。 第3図は、画素の近傍状態を決定するためのナンバリン
グ法の1例の説明図である。 第4図は、画素色確率テーブルの生成に適した装置のブ
ロツク図である。 第5図は、文字を表わす画素のクラスタつまりブロツク
の説明図である。 第6図は、本発明を用いた、OCR決定ツリー生成のフロ
ー・チヤートである。 第7図は、従来の決定ツリー生育プロセスのフロー・チ
ヤートである。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭63−104469(JP,A) 米国特許4499596(US,A) IBM Technical Disc losure Bulletin vo l.22 No.3(1979−8)PP.1189 −1190

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】文字認識用の決定ツリーをフオントに応じ
    て生成する方法であつて、 すべての画素に共通に適用される近傍画素の範囲を確定
    しておき、 1つのフオントで印刷された文書を走査して一連の画素
    の色情報を求め、 上記一連の画素の各々を選択し、当該選択画素の色情報
    と、当該選択画素の近傍画素の色情報に基づいて近傍状
    態値を求めることを繰り返すことによつて、近傍状態値
    毎に決まる選択画素の色の確率情報を求め、 上記確率情報を近傍状態値によつてアドレスできるよう
    にメモリにストアし、 任意のフオントについて、該フオントで印刷された文書
    を走査して得られた一連の画素に基づいて、複数個の文
    字クラスタを識別し、 上記複数個の文字クラスタの各々について、当該文字ク
    ラスタの画素の各々を選択し、当該選択画素についてそ
    の近傍状態値を求め、該求まつた近傍状態値に基づいて
    上記メモリをアドレスして関連する確率情報を読み取
    り、 上記文字クラスタの各画素に対応して読み取られた確率
    情報に基づいて、当該フオント用の決定ツリーを生成す
    る ことを特徴とする方法。
JP1124574A 1988-07-19 1989-05-19 文字認識用の決定ツリー生成方法 Expired - Lifetime JPH0682401B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/221,164 US4831657A (en) 1988-07-19 1988-07-19 Method and apparatus for establishing pixel color probabilities for use in OCR logic
US221164 1988-07-19

Publications (2)

Publication Number Publication Date
JPH0239389A JPH0239389A (ja) 1990-02-08
JPH0682401B2 true JPH0682401B2 (ja) 1994-10-19

Family

ID=22826628

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1124574A Expired - Lifetime JPH0682401B2 (ja) 1988-07-19 1989-05-19 文字認識用の決定ツリー生成方法

Country Status (5)

Country Link
US (1) US4831657A (ja)
EP (1) EP0352011B1 (ja)
JP (1) JPH0682401B2 (ja)
CA (1) CA1313266C (ja)
DE (1) DE68925312T2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5067088A (en) * 1990-02-16 1991-11-19 Johnson & Quin, Inc. Apparatus and method for assembling mass mail items
US5020121A (en) * 1990-08-16 1991-05-28 Hewlett-Packard Company Neighborhood block prediction bit compression
WO1992008198A1 (en) * 1990-11-05 1992-05-14 Johnson & Quin, Inc. Document control and audit apparatus and method
US5253307A (en) * 1991-07-30 1993-10-12 Xerox Corporation Image analysis to obtain typeface information
US5875261A (en) * 1991-12-20 1999-02-23 International Business Machines Corporation Method of and apparatus for optical character recognition based on geometric and color attribute hypothesis testing
US5396564A (en) * 1991-12-20 1995-03-07 International Business Machines Corporation Method of and apparatus for recognizing predominate and non-predominate color code characters for optical character recognition
US5406640A (en) * 1991-12-20 1995-04-11 International Business Machines Corporation Method of and apparatus for producing predominate and non-predominate color coded characters for optical character recognition
FR2685795B1 (fr) * 1991-12-26 1994-02-25 Thomson Csf Procede de segmentation polytomique.
JP3106021B2 (ja) * 1992-11-30 2000-11-06 キヤノン株式会社 パターンデータの圧縮方法及び装置と出力方法及び装置
IL172678A0 (en) * 2005-12-19 2006-04-10 Aharon Topper Method, system and computer program for encoding and decoding a pixelized target graphic symbol
US20130039589A1 (en) * 2011-08-11 2013-02-14 I. R. I. S. Pattern recognition process, computer program product and mobile terminal
RU2598300C2 (ru) 2015-01-27 2016-09-20 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы автоматического распознавания символов с использованием дерева решений

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3839702A (en) * 1973-10-25 1974-10-01 Ibm Bayesian online numeric discriminant
US3964591A (en) * 1975-06-10 1976-06-22 International Business Machines Corporation Font selection system
US4274079A (en) * 1979-07-12 1981-06-16 Burroughs Corporation Apparatus and method for dynamic font switching
US4499596A (en) * 1982-06-28 1985-02-12 International Business Machines Corporation Adaptive facsimile compression using a dynamic extendable decision network
US4589142A (en) * 1983-12-28 1986-05-13 International Business Machines Corp. (Ibm) Method and apparatus for character recognition based upon the frequency of occurrence of said characters
JPS60262290A (ja) * 1984-06-08 1985-12-25 Hitachi Ltd 情報認識システム
JPH0727543B2 (ja) * 1988-04-28 1995-03-29 インターナシヨナル・ビジネス・マシーンズ・コーポレーション 文字認識装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
IBMTechnicalDisclosureBulletinvol.22No.3(1979−8)PP.1189−1190

Also Published As

Publication number Publication date
DE68925312D1 (de) 1996-02-15
EP0352011A3 (en) 1992-02-05
JPH0239389A (ja) 1990-02-08
DE68925312T2 (de) 1996-07-11
EP0352011A2 (en) 1990-01-24
EP0352011B1 (en) 1996-01-03
CA1313266C (en) 1993-01-26
US4831657A (en) 1989-05-16

Similar Documents

Publication Publication Date Title
JP3133403B2 (ja) 近隣ブロック予測ビット圧縮法
CA1209244A (en) Compaction and decompaction of non-coded information bearing signals
CN110942074B (zh) 字符切分识别方法、装置、电子设备、存储介质
US4903312A (en) Character recognition with variable subdivisions of a character region
US4680805A (en) Method and apparatus for recognition of discontinuous text
US5073953A (en) System and method for automatic document segmentation
US4750209A (en) System for processing an image having both letter and photographic information
US4524454A (en) Method of assigning direction code to boundary picture element in character recognition system
JP3359433B2 (ja) 文書イメージ品質改善方法
US4499596A (en) Adaptive facsimile compression using a dynamic extendable decision network
JPH0682401B2 (ja) 文字認識用の決定ツリー生成方法
JPS6118381B2 (ja)
EP0649113A2 (en) Multifont optical character recognition using a box connectivity approach
US5394484A (en) Image recognition apparatus
JPH06187497A (ja) 文字認識方法
JPH07203199A (ja) 印刷強化用の自動化テンプレート設計方法
JP4077919B2 (ja) 画像処理方法及び装置及びその記憶媒体
JPH0139265B2 (ja)
JPH06282686A (ja) 文字認識方法
US5835625A (en) Method and apparatus for optical character recognition utilizing proportional nonpredominant color analysis
JPH0333990A (ja) マスク処理を用いる光学式文字認識装置及び方法
Arias et al. Interpreting and representing tabular documents
JP3056950B2 (ja) 文字認識装置及び方法
JPH11120291A (ja) パタン認識システム
JP2626084B2 (ja) 文字認識装置