JPH06187497A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPH06187497A
JPH06187497A JP4124580A JP12458092A JPH06187497A JP H06187497 A JPH06187497 A JP H06187497A JP 4124580 A JP4124580 A JP 4124580A JP 12458092 A JP12458092 A JP 12458092A JP H06187497 A JPH06187497 A JP H06187497A
Authority
JP
Japan
Prior art keywords
character
characters
stage
recognition
logic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4124580A
Other languages
English (en)
Other versions
JP2661459B2 (ja
Inventor
Gregory M Bednar
グレゴリー・マーチン・ベッドナー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH06187497A publication Critical patent/JPH06187497A/ja
Application granted granted Critical
Publication of JP2661459B2 publication Critical patent/JP2661459B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 光学的文字認識装置における認識精度および
認識効率を向上させる。 【構成】 既知の文字を出現頻度に基づいて複数の文字
グループ分け、第1ステージの弁別検査において、出現
頻度の高い順に各文字グループに関して弁別検査を行
い、認識されなかった文字に対しては、第2ステージの
弁別検査において第1ステージとは異なる弁別論理で同
様に各文字グループに関して弁別検査を行う。 【効果】 発生頻度の高い文字が速く且つ確実に行わ
れ、文字認識の効率が向上する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はデータを構成する文字ま
たは記号を識別するため光学式走査装置から得られたデ
ータを処理する方法に係る。更に詳細に説明すれば、本
発明は、高い出現頻度を有する文字を最初に認識する弁
別検査の連続実施を通じて認識性能と処理時間の両者を
最適化するデータ処理方法に係る。
【0002】
【従来の技術】光学式文字認識(OCR)の装置は30
年以上にわたって存在している。その間、OCRの性能
と信頼性の改善、価格の低減は、主として装置の改善の
結果である。OCRのデータ処理方法は、従来は、すべ
ての記号を一様に重要であるとみなして、既知の文字セ
ットから未知の文字を認識していた。一般に、OCRの
データ処理方法は、すべての可能な記号を、直列的より
も並列に他のすべての記号から見分ける方法を利用して
いる。
【0003】図3に部分的に示された従来の代表的なデ
シジョン・トリーでは、未知の文字を表すイメージ・デ
ータは、デシジョン・トリーの頂点、すなわちノード1
1に供給され、ノード11〜30で示すように、一連の
論理検査が適用される。(説明の都合上、ノードの一部
分のみを図示している。)これは、イメージ・データを
評価する十分な弁別検査を行い、既知の文字セットにお
けるすべての他の文字から区別される1つの出力文字に
そのイメージ・データの特性を関連づけるものである。
必要な検査数は、区別されるべき出力文字の数の指数関
数である。従って、滅多にしか出現しない文字を認識す
るには、あらゆる未知の文字をすべての可能な候補から
区別即ち識別するため大量の処理時間とエネルギが消費
される。
【0004】図3はまた、出現頻度に基づいた文字サブ
セットだけの認識とは対照的に、そのセットにある全文
字の認識に関して後続の各判断がいかに先行の判断によ
り左右されるかを示す。図示の"点"は、デシジョン・ト
リーの"分岐"を形成する判断論理の継続を表す。最下位
の分岐だけが継続を示しているが、必要により、すべて
の分岐の拡張が可能である。
【0005】図3のデシジョン・トリー論理では、通常
の言語使用における個々の記号の出現頻度とは無関係
に、単一のプロセスで、単一の認識論理によってすべて
の記号を認識しようと試みている。特に、文字のイメー
ジ・データは、デシジョン・トリーを形成する2進検査
の連続によって漸進的に検査される。この場合、各検査
は、ノードとして表され、基準または特徴として既知の
個々のイメージ・ビットまたは集合的なイメージ・デー
タに対して行われる。検査は、定義された文字セットの
中の特定の文字が、ノード27におけるように、明白に
識別されるまで続けられる。識別されないデータは、そ
れが識別されるか、または該データが識別されなかった
ことを知らせる拒絶コードが生成されるまで、デシジョ
ン・トリーの中を進行する。更に、より包括的な検査が
適用されることがあり、再びすべての可能な文字から識
別する試みがなされる。
【0006】
【発明が解決しようとする課題】このようなデシジョン
・トリー論理システムの設計、データ処理の方法、およ
びこのような方法を実現する装置は、認識率や認識精度
の向上に伴って、費用や複雑さが指数関数的に増大す
る。更に、個々のサブセットの特性よりも文字の母集団
の特性に合わせることが、デシジョン・トリー論理の固
有の特性である。出現頻度に基づいた文字サブセットの
みの認識とは対照的に、文字セット全部の認識を試みる
場合には、後続の各検査は先行の検査に左右される。従
って、出現頻度の低い文字を認識する場合には、計算時
間を過大に消費したり、または装置を過度に使用したり
することがある。そのために、計算機の使用効率は著し
く低下し、認識率、精度または性能は殆ど改善されな
い。このようなデシジョン・トリー論理の例は、IBM
技術開示公告第23巻、第8号、1981年1月に開示
されている。
【0007】本発明の目的は、精度とスループットの向
上により光学式文字認識効率を改善するデータ処理方法
を提供することであり、更に、文字の出現頻度に基づい
て既知の文字セットから未知の文字を認識するデータ処
理方法を提供するものであり、更に、イメージ・データ
の認識に弁別検査の一連の段階を実施することにより、
既知の文字セットから未知の文字を認識するデータ処理
方法を提供することである。
【0008】
【課題を解決するための手段】前述の問題点は、弁別検
査を文字の出現頻度に基づいて且つ複数のステージで行
うことにより既知の文字セットから未知の文字を認識す
る本発明のデータ処理の方法によって解決される。この
方法は、未知の文字のイメージ・データを記憶し、次い
で、第1ステージの弁別検査として、該データが第1の
文字グループに属するかどうかを識別して該イメージ・
データを認識するための第1の弁別検査を行う。第1の
文字グループは高い出現頻度を有し、全文字の一部分を
含む。認識されなかった文字に第2の弁別検査が逐次適
用されて第1の検査の場合と同様にイメージ・データを
認識・識別するが、それら文字は第1の文字グループよ
りも低い出現頻度を有する第2の文字グループに属する
ものとして検査される。このように、文字の出現頻度に
従って分けられた各文字グループに関して第1ステージ
における弁別検査が行われ、その結果その未知の文字を
認識できなかった時、第1ステージとは異なる弁別論理
に基づいて第2ステージの弁別検査が同様に行われる。
このように、前のステージにおける各弁別検査でその文
字の認識ができなかった時、弁別論理の異なる次のステ
ージにおける弁別検査が行われる。
【0009】
【作用】本発明は、従来の代表的なデシジョン・トリー
論理における並列方式よりも、斬新な順序の認識論理セ
ットの連続を利用する。論理セットの各々は、選択され
た文字グループ、すなわち全文字の中のそのサブセット
のみの特性を認識するように構成されている。従って、
検査セットの各々は、先行する検査セットに左右され
ず、文字の全母集団の特性のすべてを考慮に入れなくて
もよい。これによって認識性能および処理時間は共に最
適化される。更に、多数の記号を有する文字セットの場
合、この方法および装置は、該文字セットをサブセット
に分解する便利な装置を提供するので、問題は小さくな
り、適切な動作が行われる。また、認識セットを小さく
することにより、識別論理の設計者にとって、認識問題
は処理し易い仕事になり、かつ、認識ステップ数は大幅
に減少する。
【0010】
【実施例】本発明の、出現頻度が最大の記号を最も重要
なものとみなす新しいデータ処理の方法について以下説
明する。一定順序の認識ステップのシーケンスが、未知
の文字を表すデータに適用され、最初に、高い出現頻度
を有するグループの文字のみを認識する。低い出現頻度
の文字グループはその後に認識される。これは、完全な
文字セットの代わりに、いくつかの小さい文字セットで
データを識別することにより、より少ないステップで同
じ認識結果が得られるから、マイクロプロセッサで実施
するのに理想的な方法であって、例えば、最初に最大の
出現頻度を有する小さい文字セットを認識することによ
り、平均認識ステップ数は相当減少する。本発明の方法
は、特に、日本語の片仮名または英語のテキストのよう
に多数の記号を含む文字フォントを認識するのに適して
いる。
【0011】本発明の方法には、一定の文字記号サブセ
ットの出現頻度に基づいて動作するように配列されてい
る一定順序の独立した弁別検査セットの連続使用が含ま
れている。これは、前述の、従来のデシジョン・トリー
論理と対照的である。
【0012】図2は、光学式走査装置によって生成され
た未知の文字を表すデータが認識されて出力されるまで
の概要を表す。走査装置の構造および動作は既知のもの
である。一般に、文書1は読取り方向に並行して文字を
走査される。第2図は、横書きの文字行の水平走査を表
す。走査装置2は、適切な幅の視野を選択し、文書1ま
たは走査装置2を移動することにより、文書の全長と幅
全体にわたって走査する。走査によって生成されたデー
タは文字バッファ3に書き込まれ、文字認識装置4に供
給される。
【0013】文字認識装置4は各種の順序の弁別論理検
査シーケンスを使用し、イメージ・データを個々の文字
として認識する。文字認識装置4からの出力5は一般
に、特定の文字を表すイメージ・データの認識の成否を
表示し、失敗した場合には拒絶またはエラー・コードを
生成する。
【0014】図1は、個別の論理検査セットの連結を利
用する本発明のデータ処理方法を示す。図示のように、
この方法は、論理検査の個別の"セット"の直列使用を含
む。"セット"の水平ロー(row)は、"ステージ"1〜
Jと呼ばれ、"セット"の垂直カラム(column)
は"グループ"1〜Iと呼ばれる。
【0015】各ステージ内の個々の論理セットは、各セ
ットによって認識された文字サブセットの頻度に基づい
た順序に配列されている。例えば、セット1,1は文字
セットの最も出現頻度の大きい記号のみを認識する。セ
ット2,1は、次に最も大きい出現頻度の記号しか認識
しない。同様に、セットI,1のような後続セットは、
更に小さい出現頻度の記号を認識する。この配列は全文
字が含まれるに至るまで続く。未知の文字を表すイメー
ジ・データはセット1,1に供給され、セット1,1に
よる該データの弁別検査が行われる。必要または希望に
応じてオプションの照合装置(verifier)を使
用し、検査によって生成された出力を確認できる。検査
は、イメージ・データが出現頻度のより高い最初の文字
グループに属するかどうかを見分け、イメージ・データ
を文字として認識する。認識された文字を表すデータは
出口"認識"から出力されるが、認識されなかった文字を
表すデータは出口"失敗"から出力され、セット2,1に
供給される。認識されない文字を表すデータは、本来な
らば認識できたのに、雑音等により認識されなかった文
字を表すデータや、後のセットで認識されることになっ
ているが、現在のセットでは認識されない文字を表すデ
ータを含む。
【0016】セット2,1では、セット1,1の検査と
無関係な次の弁別検査の集まりが、認識されていないイ
メージ・データに適用される。これらの検査は、認識さ
れていないデータが、最初の文字グループよりも出現頻
度の低い次の文字グループに属するかどうかを見分け、
該データを文字として認識する。前と同様に、認識され
た文字を表すデータは出口"認識"から出力され、認識さ
れなかった文字を表すデータは出口"失敗"から出力さ
れ、次の論理セットに供給される。この弁別検査の順次
適用は、必要または希望に応じて継続される。例えば、
ステージ1にある連続セットが、特定の文字セットの全
文字を認識するのに十分なことがある。
【0017】前記方法および構成には次の利点がある。
第1に、セット1,1で認識される文字は、最も少ない
時間で認識方法および装置から抜出る。これらは最も出
現頻度が大きい文字であるので、認識率を最適化しなが
ら、マイクロプロセッサまたは他の装置の使用を最小限
にする。第2に、セット1,1は、出現頻度の少ない文
字に対するセットよりも多くの、記号当りの認識論理を
含むように調整できるので、セット1,1の認識性能お
よび精度は向上される。このセットは出現頻度最大の文
字を認識するので、装置全体の認識率は最適化される。
第3に、個々の文字のイメージ・データを認識するのに
必要な計算を実行するだけでよく、該イメージ・データ
が表すかもしれない他のすべての可能な文字の認識は試
みなくてもよい。
【0018】図1において、処理方法が、一定順序のシ
ーケンスでいくつかの論理検査のステージ − 各ステ
ージはセット列から成る − の使用を含むことがあ
る。各ステージは、最初または先行するステージで使用
されたものと異なる論理検査を順次に実行し、各ステー
ジの検査またはセットは、ステージ1の検査セットのす
べての使用後に、最高の非認識頻度を有する文字を最初
に認識するように調整されていることがある。例えば、
ステージ1がI個のセットを含むものと仮定すると、I
個のセットは文字セットの全文字を続けて識別できる。
最初のステージの全セットは、一定の方法を利用してこ
れらの文字を認識するように設計できる。あるデータ、
すなわち文字はステージ全体の使用後でさえも認識され
ずにいることもありうるので、該データは、ステージ2
の順次検査、すなわちセット1,2、セット2,2、・
・・・、セットI,2に供給され、更に該文字をイメー
ジ・データから識別する試みがなされる。ステージ2の
弁別論理検査のセットは、特に、ステージ1で認識に失
敗した文字パターンを認識するように設計されており、
異なった論理的方法を利用して、前記データが表す文字
の認識を最適化できる。更に第1図に示すように、利用
されるステージ数は必要または希望に応じて変更し、希
望する認識目標に対応できる。このように、セットとス
テージを最適化し、希望する認識率を得るとともに、認
識に必要な費用や装置に関する制限にも対応できる。更
に、ステージとセットの各々を調整して一定の文字を識
別し、または前のセット、ステージまたはグループによ
って認識されなかった文字を識別する試みとして完全に
独立した方法を利用する柔軟性と能力もある。
【0019】表1は、日本語の片仮名文字の出現頻度別
の分類で、日本名の使用に基づいて作成されたものであ
る。本明細書では日本語の片仮名文字を引用している
が、本発明はどんなアルファベットまたは定義された文
字セットにも適用できる。
【表1】 グループ1は頻度60%を有する14文字を含む。グル
ープ2は頻度18%の13文字を含む。グループ3は頻
度14%の15文字を含む。グループ4は頻度8%の3
3文字を含む。処理方法を最適化し、出現頻度最大の文
字、すなわちグループ1の認識率を改善することによ
り、費用への影響を最小限にして実効認識性能を高める
ことができる。更に、これは、グループ2、3および4
の日本語文字を識別するのに利用される弁別論理検査と
無関係に行うことができる。第2表はグループごとの仮
定認識率に基づいた実効性能を示す。
【表2】 表2に示すように、合計認識率は (87×0.6)+(84×0.18)+(78×0.
14)+(60×0.08)=83% である。明らかに、グループ1の文字の認識率を改善す
ることにより、グループ4の文字の認識率を改善するよ
りも、実効認識性能をかなりよく改善できる。
【0020】どの文字データをどのステージまたはセッ
トで認識検査するかを決めた後は、必要な弁別検査を開
発する仕事は、コンピュータ・プログラミングまたは光
学式文字認識にかかわる当業者の能力の範囲内で十分に
まかなえる。それには、1つの文字を表すデータと、別
の文字を表すデータとを識別する既知の方法が使用され
る。
【0021】本発明を実行する装置は、論理判断を実行
できるマイクロプロセッサまたは他のコンピュータを含
むことがある。
【0022】
【発明の効果】本発明の方法は、全文字セットの中の制
御されたサブセットの識別に独特の適応性を有する複数
の独立した文字認識論理セットの使用を可能にする。従
って、装置使用と処理時間を最適化し、出現頻度の大き
い文字の高い認識率を短時間に得ることができる。認識
論理を、従来のデシジョン・トリー論理に課された制約
から解放することにより、出現頻度最大の文字の認識に
焦点を合わせるとともに論理ステップの量を最小限にす
る。更に、記憶領域を増加せずに認識精度およびスルー
プットが増大する。外見的に果てしなく、かつ相互関係
を有する、縦続する検査セットよりも、簡単で個別的な
認識論理セットも使用できる。従って、出現頻度が最大
の文字サブセットに努力の大半を傾注して、異なったサ
ブセットを認識する各種の論理セットを最適化できる。
例えば、出現頻度が大きい文字の認識率の正確さは、検
査を追加することにより改善できるが、このような追加
検査は、出現頻度が小さい文字の認識率の正確さの改善
には必要ではなく、望ましくもない。
【0023】更に、処理方法を特定の要求に合わせるこ
ともできる。例えば、日常の文書で英語を使用する場
合、文字X、YおよびZは最も出現頻度の小さい文字に
含まれることがあるが、これらの文字は、科学または数
学の文献では最も出現頻度が大きいことがある。本発明
の方法は、このような変化に適応する柔軟性を有する。
認識論理セットは水平、垂直方向のどちらか一方または
両方向に連結できるので、本発明の方法および装置の処
理能力は更に増大する。
【図面の簡単な説明】
【図1】データ認識のため縦続配列された種々のステー
ジおよびグループによる、本発明のデータ処理の方法を
示す図、
【図2】代表的な光学式文字認識装置におけるデータ処
理のステップを示すブロック図、
【図3】出現頻度とは無関係にすべての記号を認識する
ように設計された従来の代表的なデシジョン・トリー論
理を示す図である。
【符号の説明】
1 文書 2 走査装置 3 文字バッファ 4 文字認識装置 5 出力

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】文字の出現頻度に基づいて未知の文字を既
    知の文字のセットから認識するための方法であって、 認識されるべき未知の文字のイメージ・データを記憶手
    段に記憶し、 前記既知の文字のセットにおけるすべての文字に関して
    未知の文字を認識するための弁別論理検査を少なくとも
    2つの独立したステージに分け、該ステージの各々が、
    前記既知の文字のセットを構成する複数の文字グループ
    に関して未知の文字を認識するための複数の弁別論理検
    査を含むようにし、 前記ステージのうちの第1ステージにおいて、前記複数
    の文字グループのうち出現頻度の最も高い文字を有する
    第1文字グループに関して前記記憶されたイメージ・デ
    ータの弁別論理検査を行い、 前記第1ステージにおける弁別論理検査によって認識さ
    れなかったイメージ・データに対して、前記ステージの
    うちの前記第1ステージの弁別論理検査とは論理的に異
    なる第2ステージの弁別論理検査を前記第1文字グルー
    プに関して行う、ことを特徴とする文字認識方法。
  2. 【請求項2】前記第1ステージにおける弁別論理検査
    は、前記第1ステージにおける前記第1文字グループに
    関して認識されなかったイメージ・データの弁別論理検
    査を、前記第1文字グループの文字よりも低い出現頻度
    を有し且つ前記第1文字グループにない文字を含む第2
    文字グループに関して行うことを特徴とする請求項1に
    記載の文字認識方法。
JP4124580A 1983-12-28 1992-05-18 文字認識方法 Expired - Lifetime JP2661459B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US566636 1983-12-28
US06/566,636 US4589142A (en) 1983-12-28 1983-12-28 Method and apparatus for character recognition based upon the frequency of occurrence of said characters

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP59242565A Division JPS60142793A (ja) 1983-12-28 1984-11-19 文字認識方法

Publications (2)

Publication Number Publication Date
JPH06187497A true JPH06187497A (ja) 1994-07-08
JP2661459B2 JP2661459B2 (ja) 1997-10-08

Family

ID=24263740

Family Applications (2)

Application Number Title Priority Date Filing Date
JP59242565A Granted JPS60142793A (ja) 1983-12-28 1984-11-19 文字認識方法
JP4124580A Expired - Lifetime JP2661459B2 (ja) 1983-12-28 1992-05-18 文字認識方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP59242565A Granted JPS60142793A (ja) 1983-12-28 1984-11-19 文字認識方法

Country Status (8)

Country Link
US (1) US4589142A (ja)
EP (1) EP0147657B1 (ja)
JP (2) JPS60142793A (ja)
AU (1) AU565704B2 (ja)
BR (1) BR8406532A (ja)
CA (1) CA1213060A (ja)
DE (1) DE3486272T2 (ja)
ES (1) ES536652A0 (ja)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5297222A (en) * 1982-05-04 1994-03-22 Hitachi, Ltd. Image processing apparatus
JPS6145372A (ja) * 1984-08-10 1986-03-05 Canon Inc 画像文字認識装置
US5060277A (en) * 1985-10-10 1991-10-22 Palantir Corporation Pattern classification means using feature vector regions preconstructed from reference data
US5077807A (en) * 1985-10-10 1991-12-31 Palantir Corp. Preprocessing means for use in a pattern classification system
US4773099A (en) * 1985-10-10 1988-09-20 The Palantir Corporation Pattern classification means for use in a pattern recognition system
JPH0664631B2 (ja) * 1987-09-09 1994-08-22 インターナショナル・ビジネス・マシーンズ・コーポレーション 文字認識装置
US4852173A (en) * 1987-10-29 1989-07-25 International Business Machines Corporation Design and construction of a binary-tree system for language modelling
JP2553608B2 (ja) * 1988-01-04 1996-11-13 住友電気工業 株式会社 光学文字読取装置
JPH01246678A (ja) * 1988-03-29 1989-10-02 Toshiba Corp パターン認識装置
US4975975A (en) * 1988-05-26 1990-12-04 Gtx Corporation Hierarchical parametric apparatus and method for recognizing drawn characters
US4831657A (en) * 1988-07-19 1989-05-16 International Business Machines Corporation Method and apparatus for establishing pixel color probabilities for use in OCR logic
US5131053A (en) * 1988-08-10 1992-07-14 Caere Corporation Optical character recognition method and apparatus
US5265174A (en) * 1989-03-03 1993-11-23 Canon Kabushiki Kaisha Pattern recognition apparatus
JPH0331981A (ja) * 1989-06-29 1991-02-12 Canon Inc 文字認識装置
US5228133A (en) * 1990-10-01 1993-07-13 Carl Oppedahl Method to perform text search in application programs in computer by selecting a character and scanning the text string to/from the selected character offset position
US5151950A (en) * 1990-10-31 1992-09-29 Go Corporation Method for recognizing handwritten characters using shape and context analysis
JPH0772906B2 (ja) * 1991-07-10 1995-08-02 富士ゼロックス株式会社 文書認識装置
US5251268A (en) * 1991-08-09 1993-10-05 Electric Power Research Institute, Inc. Integrated method and apparatus for character and symbol recognition
JPH05233623A (ja) * 1991-11-27 1993-09-10 Internatl Business Mach Corp <Ibm> ストローク構文入力装置
US5305396A (en) * 1992-04-17 1994-04-19 International Business Machines Corporation Data processing system and method for selecting customized character recognition processes and coded data repair processes for scanned images of document forms
DE69332555D1 (de) * 1992-09-04 2003-01-23 Canon Kk Verfahren und Vorrichtung zur Anzeige von Zeichen
US5377280A (en) * 1993-04-19 1994-12-27 Xerox Corporation Method and apparatus for automatic language determination of European script documents
JP3466689B2 (ja) * 1994-01-26 2003-11-17 キヤノン株式会社 手書き文字認識方法及びその装置
IL109268A (en) * 1994-04-10 1999-01-26 Advanced Recognition Tech Method and system for image recognition
US5661763A (en) * 1995-07-28 1997-08-26 Adtran, Inc. Apparatus and method for detecting programmable length bit pattern in serial digital data stream
US5917941A (en) * 1995-08-08 1999-06-29 Apple Computer, Inc. Character segmentation technique with integrated word search for handwriting recognition
US6144771A (en) 1996-06-28 2000-11-07 Competitive Technologies Of Pa, Inc. Method and apparatus for encoding and decoding images
US5881169A (en) * 1996-09-13 1999-03-09 Ericsson Inc. Apparatus and method for presenting and gathering text entries in a pen-based input device
JP3427692B2 (ja) * 1996-11-20 2003-07-22 松下電器産業株式会社 文字認識方法および文字認識装置
US5881172A (en) * 1996-12-09 1999-03-09 Mitek Systems, Inc. Hierarchical character recognition system
US6111985A (en) * 1997-06-06 2000-08-29 Microsoft Corporation Method and mechanism for providing partial results in full context handwriting recognition
US6061472A (en) * 1997-06-06 2000-05-09 Microsoft Corporation Method and mechanism to reduce handwriting recognizer errors using multiple decision trees
US7254269B2 (en) * 2000-08-31 2007-08-07 Hewlett-Packard Development Company, L.P. Character recognition system
JP4674778B2 (ja) * 2000-08-31 2011-04-20 ヒューレット・パッカード・カンパニー 文字認識システム
US7167587B2 (en) * 2002-08-30 2007-01-23 Lockheed Martin Corporation Sequential classifier for use in pattern recognition system
US20040086185A1 (en) * 2002-10-31 2004-05-06 Eastman Kodak Company Method and system for multiple cue integration
RU2598300C2 (ru) * 2015-01-27 2016-09-20 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы автоматического распознавания символов с использованием дерева решений

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS50156321A (ja) * 1974-06-05 1975-12-17
JPS511100A (en) * 1974-06-22 1976-01-07 Kyodo Printing Co Ltd Pasuhoototoniokeru kaoshashinhyojisho
JPS5612255U (ja) * 1979-07-04 1981-02-02
JPS5680787A (en) * 1979-12-04 1981-07-02 Fujitsu Ltd Pattern recognition device
JPS5824976A (ja) * 1981-08-06 1983-02-15 Fujitsu Ltd 光学文字読取装置の読取り方式
JPS5843069A (ja) * 1981-09-07 1983-03-12 Toshiba Corp 文字認識装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3601802A (en) * 1966-09-09 1971-08-24 Kokusai Denshin Denwa Co Ltd Pattern matching character recognition system
US3675203A (en) * 1969-04-09 1972-07-04 Dwight M B Baumann Automatic pattern recognition with weighted area scanning
US3755780A (en) * 1971-06-28 1973-08-28 Pattern Analysis & Recognition Method for recognizing characters
JPS5313840A (en) * 1976-07-23 1978-02-07 Hitachi Ltd Analogy calculator
US4157532A (en) * 1977-03-07 1979-06-05 Grete Grunwald Method of machine reading documents
US4180799A (en) * 1978-04-21 1979-12-25 Caere Corporation Apparatus and method for recognizing characters
JPS60711B2 (ja) * 1980-04-22 1985-01-09 日本電気株式会社 図形認識装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS50156321A (ja) * 1974-06-05 1975-12-17
JPS511100A (en) * 1974-06-22 1976-01-07 Kyodo Printing Co Ltd Pasuhoototoniokeru kaoshashinhyojisho
JPS5612255U (ja) * 1979-07-04 1981-02-02
JPS5680787A (en) * 1979-12-04 1981-07-02 Fujitsu Ltd Pattern recognition device
JPS5824976A (ja) * 1981-08-06 1983-02-15 Fujitsu Ltd 光学文字読取装置の読取り方式
JPS5843069A (ja) * 1981-09-07 1983-03-12 Toshiba Corp 文字認識装置

Also Published As

Publication number Publication date
DE3486272T2 (de) 1994-08-11
BR8406532A (pt) 1985-10-15
EP0147657A3 (en) 1988-07-20
JPH0340433B2 (ja) 1991-06-18
JP2661459B2 (ja) 1997-10-08
EP0147657A2 (en) 1985-07-10
AU565704B2 (en) 1987-09-24
ES8601515A1 (es) 1985-10-16
JPS60142793A (ja) 1985-07-27
EP0147657B1 (en) 1994-02-09
DE3486272D1 (de) 1994-03-24
AU3454084A (en) 1985-07-04
ES536652A0 (es) 1985-10-16
US4589142A (en) 1986-05-13
CA1213060A (en) 1986-10-21

Similar Documents

Publication Publication Date Title
JP2661459B2 (ja) 文字認識方法
EP0307111B1 (en) Character recognition apparatus
US6370269B1 (en) Optical character recognition of handwritten or cursive text in multiple languages
JPH0142028B2 (ja)
Kim et al. Bankcheck recognition using cross validation between legal and courtesy amounts
US4831657A (en) Method and apparatus for establishing pixel color probabilities for use in OCR logic
JPH07160822A (ja) パターン認識方法
JPS60153574A (ja) 文字読取方法
EP0593844B1 (en) Character recognition system
RU2582064C1 (ru) Способы и системы эффективного автоматического распознавания символов с использованием леса решений
JP3208340B2 (ja) 続け書きテキストを認識する方法
El Yacoubi et al. Conjoined location and recognition of street names within a postal address delivery line
CN111651960A (zh) 一种从合同简体迁移到繁体的光学字符联合训练及识别方法
JPH11184976A (ja) 辞書学習方式および文字認識装置
JPH08221254A (ja) マージソート方法及びマージソート装置
JPS59158482A (ja) 文字認識装置
JPH08161432A (ja) 文字切り出し方法および文字切り出し装置
CN1110002C (zh) 提高单词辨识率系统与方法
JPH07271920A (ja) 文字認識装置
JPS61272887A (ja) 文字認識方式
JPS63249282A (ja) マルチフオント印刷文字読取り装置
JPH0254386A (ja) 光学的文字読取装置の文字認識装置
JPS6191780A (ja) 文字認識装置
JPH11175661A (ja) 統合性能評価方法及びシステム並びに情報記録媒体
JPH03166678A (ja) 手書き文字の認識装置