JPH0682403B2 - 光学式文字読取装置 - Google Patents

光学式文字読取装置

Info

Publication number
JPH0682403B2
JPH0682403B2 JP61063973A JP6397386A JPH0682403B2 JP H0682403 B2 JPH0682403 B2 JP H0682403B2 JP 61063973 A JP61063973 A JP 61063973A JP 6397386 A JP6397386 A JP 6397386A JP H0682403 B2 JPH0682403 B2 JP H0682403B2
Authority
JP
Japan
Prior art keywords
word
character
characters
extracted
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61063973A
Other languages
English (en)
Other versions
JPS62221088A (ja
Inventor
彦士 長沢
和郎 伊藤
茂 堀井
克秀 田野島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP61063973A priority Critical patent/JPH0682403B2/ja
Priority to US07/027,408 priority patent/US4799271A/en
Priority to DE87104288T priority patent/DE3786816T2/de
Priority to EP87104288A priority patent/EP0239061B1/en
Publication of JPS62221088A publication Critical patent/JPS62221088A/ja
Publication of JPH0682403B2 publication Critical patent/JPH0682403B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は光学式文字読取装置に関し、更に詳細には光学
式文字読取装置(以下、OCRと略す)の単語照合方式に
関する。
(従来の技術) 第3図はOCRを示すブロック図である。同図において、
1は英語等の文字が手書または印刷されている帳票、2
は予め定められたフォーマットに従って帳票1を搬送す
る搬送機構、3は後述する照明用ランプ11から照射され
た光が帳票1に当って反射した光を後述する光電変換セ
ンサ4に結像させる結像レンズ、4は帳票1からの反射
光を電気信号に光電変換する光電変換センサ、5は光電
変換センサ4からの電気信号を2値化して2値化画像信
号を得、1文字分の画像を切出す前処理回路、6は予め
定められた手順に従い文字の特徴等を抽出する特徴抽出
回路、7は文字の特徴データを予め登録してある後述す
る辞書メモリ8と特徴抽出回路6の出力である特徴デー
タとの照合を行ない、一致した文字の文字コードを出力
する文字判定回路、8は文字の特徴データをその文字の
文字コードと対応させて予め登録してある辞書メモリ、
9は文字判定回路7の判定結果に対応して編集、出力制
御等を司どる後処理回路、10は出力端子、11は照明用ラ
ンプである。
次に、第3図のOCRの動作について説明する。
まず、帳票1を搬送機構2により走行させ、照明用ラン
プ11により帳票を照射し、その反射光を結像レンズ3を
通して光電変換センサ4へ結像せしめこのセンサ出力と
して帳票1上の画像信号を電気信号の形で得るようにし
てある。図示しない制御回路によって搬送機構2を制御
し、帳票1の所定の領域分の画像信号が前処理回路5の
図示しない行画像バッファメモリへ書き込まれる。
次に、前処理回路5は得られた行画像から1文字分の画
像を切出し、特徴抽出回路6に送出する。特徴抽出回路
6では予め定められた手順に従い、文字線の形状又は背
景部分の特徴などを抽出するいわゆる認識アルゴリズム
を実行する。そして、文字判定回路7は予め登録してあ
る文字認識用の辞書メモリ8と、得られた特徴との照合
を行い、一致した文字コードを後処理回路9へ出力す
る。この出力内容としては複数個の文字コードが上がる
場合、1つだけの文字コードが上がる場合又は1つも文
字コードが上がらない場合の3種類が考えられる。これ
らに対して後処理回路9は次のように動作する。即ち、
1つだけの文字コードが上がった時は首尾良く当該文字
が認識できた訳でこの文字コードを出力端子10から外部
へ出力する。1つも文字コードが上がらなかった時は前
記辞書メモリ8に当該文字を認識する辞書がなかったと
いうことであり、出力端子10からは認識不能コードが出
力される。
次に、複数の文字コードが上がった場合であるが、これ
は当該文字パタンが他の文字パタンと良く似ている時に
頻度多く発生しやすく、少なくとも1つの文字コードに
固定することが出来ず複数の文字候補が上がったという
事に他ならない。これから1つの文字コードに絞る手法
の1つとして前後関係を用いてある文字とある文字は決
して、相隣りあって記載されることはないと言うあらか
じめ得られる知識によって他の文字候補を棄却する方法
がある。例えば英文などで“U(ユー)”と“V(ブ
イ)”が文字候補として上がり、その前の文字が“Z
(ゼット)”であった場合“Z"の後の文字として“V"が
有り得ないとすれば“U"が選択され出力端子10からは
“U"のコードが出力されることになる。なお、これらの
知識情報はテーブルとして記憶しておくことにより実現
できる。
しかしながら、上記方法は言語の連接関係上許容できる
か否かによって判断するものであるため、明らかに禁止
できる連接関係の場合は有効であるが、これ以外の場合
は候補文字を選択できないことになるという欠点があ
る。そこで、そのほかに、英語の文字列の特徴を表現す
る方法として隣接した2文字又は3文字に着目し、その
文字組合わせの発生頻度(これは各々2-gram,3-gram、
一般にn-gramと呼ばれ、公知の手法である。)を予め知
っておき、これによって候補文字を調べる方法もある
が、生起頻度が似通っている場合には判断できないこと
になる。そこで、この欠点を解決するために、単語を予
め記憶しておき、文字の連接関係からの判定を一歩進め
て単語レベルでの判定により候補文字を選択する方法が
ある。この照合単語を記憶するためにはかなり大きい規
模の記憶素子が必要であるが、近年の大規模集積回路の
目覚ましい発展により、比較的簡単に実現できるように
なって来ている。
この方法の動作について以下に説明する。
まず、前提条件として英文書などは単語の間にスペース
を開けるという構成になっているため、スペースとスペ
ースで挟まれた文字群を1つの単語として切出すことが
できるとする。第4図(a)は読取結果を格納するメモリ
のテーブルのフォーマットを示す図である。同図におい
て、20は英文書上等の1つの単語として記入されている
文字群を前述した手順によりOCRにて読取った読取結果
を格納するメモリのテーブル、21-1,21-2,…,21-i,
…,21-Nは単語を形成する各文字の読取結果を格納する
領域であり、各々C0,C1,…,Ci,…,CNは格納の内容を示
す。Nは単語の文字数を表す。なお、iはテーブル20の
文字番号を示すポインタである。
また、第4図(b)は英文等の単語を予め記憶してある単
語テーブルのフォーマットを示す図である。同図におい
て、30はテーブル、31-1,…,31-k,…,31-Mはテーブ
ル30に登録してある単語の格納位置を示す。よって、こ
のテーブル30はM個の単語を登録していることになる。
今、k番目の単語31-kに着目すると、この単語はN文字
から構成され、各構成文字はW0k,W1k,…,Wik,…,WNkで
示す。ここで、Wikは単語テーブルに登録されたk番目
の単語の第i番目の構成文字ということを表現してい
る。
なお、第4図にはN文字で構成される単語テーブルのみ
を図示したが、単語を構成する文字数はいろいろあるの
で構成文字数に応じた単語テーブルがこの他にあり、こ
れらは図示していない。よって、読取結果の文字数Nに
応じてこれに対応した単語テーブルが選択されて動作す
ることになる。
ここで、第5図はこの単語照合方法による単語照合回路
を示すブロック図である。同図において、12は単語照合
回路、13は単語辞書メモリ、14は単語照合制御部、15は
単語テーブル選択部、16は候補単語検索部、17は単語照
合部である。また、第6図は第5図の単語照合回路12の
動作を示すフローチャートである。
次に、単語照合回路の動作を第5図及び第6図に基づい
て説明する。
先ず、文字判定回路7からの読取結果に基づいて後処理
回路9ではスペースとスペースで挟まれた文字群を単語
として単語を抽出して単語照合回路12の単語照合制御部
14に出力する。この単語がN文字で構成されているとす
ると、単語テーブル選択部15により単語辞書メモリ13の
N文字の単語テーブルを選択する(ステップ100)。そ
して、単語照合部17で文字ポインタi、単語ポインタk
および各単語内で単語を構成するi番目の文字と読取結
果のi番目の文字を照合し、一致した時に歩進される一
致数カウンタ“COIN"を初期化する(ステップ101,10
2)。次に、候補単語検索部16で読取結果のi番目の文
字Ciを取出し、取り出したCiの属性を判断する(ステッ
プ103,104)。
ここで、属性とは前述した、読取結果として上がる文字
コードの数を指しておりこの数をsで表現している。こ
の値は図示していないが読取時に文字毎に分るのでこれ
を保存しておくものとする。以下、上記のように上がっ
た候補単語と読取結果との判定を行なう。ステップ104
の結果、s=0の属性下である(これは候補単語が1個
も上がらなかったことを示す)ならば後述するステップ
107へ進む。また、s=1の属性下である(これは候補
単語が1個だけ上がったことを示す)ならば読取結果Ci
と単語テーブルのk番目の単語の第i番目の構成文字Wi
kと一致チェックを行い(ステップ105)、一致していれ
ば一致数カウンタ“COIN"の歩進を行い(ステップ10
6)、一致していなければステップ107へ到る。さらに、
候補単語検索部16において、s≠0,s≠1の場合、読取
結果として複数の文字コードが上がったということであ
り、複数の候補数をl=0からsまでサーチする(ステ
ップ108,109,111)。この中に一致したコードがあれば
一致数カウンタ“COIN"を歩進させ(ステップ110)、な
ければステップ107へ到る。ステップ107では文字数カウ
ンタiをカウントアップしてN文字未満であればステッ
プ103にもどり、次の文字を同様の動作で判定すること
になる。これにより、1単語内の構成文字のすべてにつ
いて実施することになる。
次に、一致数カウンタCOINの内容を調べ、ある常数D1
比較し(ステップ112)、これ未満であればステップ114
へ、これ以上であれば“COIN"の内容とkを保存する
(ステップ113)。ステップ112,113での動作の意味は一
致数の少ない単語をこの時点で棄却してしまうという思
想に基づいている。ここで、保存されたkの値は一致し
た単語の番号であり、この単語が一応今までの判定をク
リアした候補単語の1つとして登録されたことを意味す
る。又、この保存するエリアは複数であり、常数D1以上
の一致数があった単語についてはすべて登録するように
構成してあり、この値は高々10個程度で良い。また、D1
は常数としたが、単語構成文字数Nの関数として都度ダ
イナミックに可変とすることも可能である。そして、こ
れまでの動作を当該単語テーブルの全単語について実施
したか否かを判定し(ステップ114)、未実施であれば
ステップ102へ、終了したならばステップ115へ遷移す
る。
次に、ステップ115,116では当該単語テーブルと読取結
果の単語レベルの照合チェックが終了し、一致数がD1
上である単語の当該単語テーブルの単語番号と一致数が
保存されていることになる。よって、この保存されてい
る候補単語群の中から一致数が最も多い単語番号を選び
出し(ステップ115)、これに対応する単語名を後処理
回路9を介して外部へ送出する(ステップ116)。
ここで、この一致数が最も多い単語番号が唯一つに定ま
らない時は、単語照合が不成功であったことになり、読
取結果をそのまま出力するか、又は一致数の多い単語を
複数出力するか、又は双方を出力するか等の方法があ
り、最終的にオペレータに判断させるという事も可能で
ある。
ところで、一致数カウンタ“COIN"は共通に歩進させる
としたが、sという属性によってはそのカウンタに加算
すべき値に重みをつけてカウントアップすることも有効
である。即ち、ステップ104での上がった文字コード=
1においては例えば+3、ステップ104での上がった文
字コードが複数の場合は+1などである。さらに、ステ
ップ104で1個も文字コードの上がらなかった場合はペ
ナルティを施して−1する等の方法もある。これらはた
だ1つの読取結果が上がった場合を優先して採用すべく
得失点の合計によって判断するという1つの方法であ
る。
(発明が解決しようとする問題点) しかしながら、上記の方法では照合すべき単語の数が膨
大であるので、構成文字数の多い単語になると照合処理
に費やす時間が非常にかかるという欠点があった。
本発明はこの問題点に鑑みなされたもので、単語の照合
処理時間の短いOCRを提供することを目的とする。
(問題点を解決するための手段) 本発明は前記問題点を解決するために、帳票上の文字を
光源により照射して帳票からの反射光を電気信号に光電
変換することにより画像信号を得、この画像信号より1
文字毎に文字を切出して各文字の特徴を抽出し、辞書メ
モリに予め登録してある文字パターンと照合することに
より文字認識を行ない、さらにスペースとスペースで挟
まれた文字群を単語として抽出し、抽出した単語と、単
語を構成する文字数毎に分けて単語辞書メモリの単語テ
ーブルに予め登録してある単語とを照合して帳票上の単
語を認識する光学式文字読取装置において、抽出した単
語を構成する文字数に応じて単語辞書メモリ内の単語テ
ーブルを選択する単語テーブル選択部と、抽出した単語
を構成する文字数が所定数より大きいか否かを判定する
単語構成文字数判定部と、この単語構成文字数判定部で
抽出した単語を構成する文字数が所定数より大のとき、
抽出した単語の各構成文字が母音であるか否かを判定
し、母音であれば母音と判定された構成文字を照合対象
から除外する母音判定部と、この母音判定部を経由後の
抽出した単語と単語テーブル選択部で選択された単語テ
ーブルの各単語の構成文字同士を比較照合して一致文字
数を算出する単語照合部と、この単語照合部における一
致文字数が最も多い候補単語を選出する候補単語検索部
と、この候補単語検索部により選出された候補単語を外
部に出力するように処理する後処理部とを具備してい
る。
(作用) 以上のような構成を有する本発明によれば、単語テーブ
ル選択部により抽出した単語を構成する文字数に応じた
単語辞書メモリ内の単語テーブルが選択される。そし
て、単語構成文字数判定部では抽出した単語を構成する
文字数が所定数より大きいか否かを判定する。その判定
の結果、抽出した単語を構成する文字数が所定数より大
きいときには母音判定部で抽出した単語の各構成文字に
対して母音であるか否かが判定される。そして、母音で
あると判定された構成文字は単語照合部での照合対象か
ら除外される。よって、単語照合部では母音判定部を介
して母音である構成文字が照合対象から除外された単語
と、選択された単語テーブルの各単語の構成文字同志が
比較照合されて一致文字数が算出される。その結果、候
補単語検索部は単語照合部における一致文字数がもっと
も多い単語を候補単語として選出し、この候補単語は後
処理部により外部に出力される。
したがって、本発明は前記問題点を解決することがで
き、単語の照合判定に費やす時間を短縮できるOCRを提
供できる。
(実施例) 以下、本発明の一実施例を図面に基づいて説明する。
第1図は本発明の一実施例を示すブロック図である。同
図において、第3図及び第5図と同じ参照番号は同一構
成要素を示す。異なる構成要素として、18は単語構成文
字数判定部、19は母音判定部である。単語構成文字数判
定部18は、読取結果の単語構成文字数Nと常数D2と比較
してN<D2の場合何もせずして候補単語検索部16及び単
語照合部17へ遷移し、N≧D2の場合ポインタ文字の母音
判定部15へ遷移する。母音判定部19はポインタ文字Ciが
母音であるか否か判定して母音でなければ何もせずして
候補単語検索部16及び単語照合部17へ遷移し、母音であ
れば単語照合部17において、母音と判定されたポインタ
文字Ciは照合対象から除外される。
第2図は本実施例の動作を示すフローチャートである。
ここで、第6図と異なるフローは同図のステップ200,20
1という判断ステップをステップ103とステップ104の間
に設けた点であり、それらに伴って第6図のステップ11
6に代ったステップ202の処理内容が若干異なる。
次に、本実施例の動作を第1図及び第2図に基づいて説
明する。
はじめに、ステップ100〜103のi番目の文字Ciを取り出
す所までは従来技術と同様である。そして、単語構成文
字数判定部18で読取結果の単語構成文字数Nと常数D2
比較することにより当該単語の構成文字数の多少を判断
し(ステップ200)、少ない場合にはステップ104へつま
り従来技術と全く同じルートで処理して行く。また、単
語構成文字数NがD2より多い場合にはステップ201へ到
る。そして、母音判定部19で読取結果のi番目の文字Ci
が母音であるか否かを判定し(ステップ210)、母音で
なければ従来技術で説明したステップ104へ遷移する。
一方、母音であれば従来技術のCiの属性としてs=0即
ち候補文字なしと同じ扱いにして、つまりその文字を照
合対象から除外してステップ107へ到る。
さらに、ステップ107〜ステップ115は従来技術で説明し
た処理と全く同一の動作を行い、最終的にステップ202
へ到る。そのステップ202では基本的にはステップ115で
求めた最大一致数を持つ“COIN"カウンタに対応する単
語を出力するということにおいては従来の方法と変りは
ないが、この単語が1つに定まらない時には母音を含め
た単語構成の全文字につき照合を行う処理が付加されて
いる。
(発明の効果) 以上説明したように、本発明によれば、読取結果が所定
の単語構成文字数以上であるならばその読取結果の構成
文字の母音を除いて登録単語との照合を行なうことによ
り、単語の照合処理に費やす時間を短くできるOCRを提
供できる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
本実施例の動作を示すフローチャート、第3図はOCRを
示すブロック図、第4図は単語照合におけるメモリの単
語テーブルを示す図、第5図は従来の単語判定回路を示
すブロック図、第6図は従来の単語判定回路の動作を示
すフローチャートである。 1……帳票、2……搬送機構、 3……結像レンズ、4……光電変換センサ、 5……前処理回路、6……特徴抽出回路、 7……文字判定回路、8……辞書メモリ、 9……後処理回路、10……出力端子、 11……照明用ランプ、12……単語照合回路、 13……単語辞書メモリ、14……単語照合制御部、 15……単語テーブル選択部、 16……候補単語検索部、17……単語照合部、 18……単語構成文字数判定部、 19……母音判定部。
フロントページの続き (72)発明者 田野島 克秀 東京都港区虎ノ門1丁目7番12号 沖電気 工業株式会社内 (56)参考文献 特開 昭60−233782(JP,A)

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】帳票上の文字を光源により照射して帳票か
    らの反射光を電気信号に光電変換することにより画像信
    号を得、該画像信号より1文字毎に文字を切出して各文
    字の特徴を抽出し、辞書メモリに予め登録してある文字
    パターンと照合することにより文字認識を行ない、さら
    にスペースとスペースで挟まれた文字群を単語として抽
    出し、抽出した単語と、単語を構成する文字数毎に分け
    て単語辞書メモリの単語テーブルに予め登録してある単
    語とを照合して帳票上の単語を認識する光学式文字読取
    装置において、 抽出した単語を構成する文字数に応じて前記単語辞書メ
    モリ内の単語テーブルを選択する単語テーブル選択部
    と、 抽出した単語を構成する文字数が所定数より大きいか否
    かを判定する単語構成文字数判定部と、 該単語構成文字数判定部で抽出した単語を構成する文字
    数が所定数より大のとき、抽出した単語の各構成文字が
    母音であるか否かを判定し、母音であれば母音と判定さ
    れた構成文字を照合対象から除外する母音判定部と、 該母音判定部を経由後の抽出した単語と前記単語テーブ
    ル選択部で選択された単語テーブルの各単語の構成文字
    同志を比較照合して一致文字数を算出する単語照合部
    と、 該単語照合部における一致文字数が最も多い候補単語を
    選出する候補単語検索部と、 該候補単語検索部により選出された候補単語を外部に出
    力するように処理する後処理部とを具備することを特徴
    とする光学式文字読取装置。
JP61063973A 1986-03-24 1986-03-24 光学式文字読取装置 Expired - Lifetime JPH0682403B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP61063973A JPH0682403B2 (ja) 1986-03-24 1986-03-24 光学式文字読取装置
US07/027,408 US4799271A (en) 1986-03-24 1987-03-18 Optical character reader apparatus
DE87104288T DE3786816T2 (de) 1986-03-24 1987-03-24 Optische Zeichenerkennungsvorrichtung und optisches Zeichenerkennungsverfahren.
EP87104288A EP0239061B1 (en) 1986-03-24 1987-03-24 Optical character reader apparatus and optical character reading method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61063973A JPH0682403B2 (ja) 1986-03-24 1986-03-24 光学式文字読取装置

Publications (2)

Publication Number Publication Date
JPS62221088A JPS62221088A (ja) 1987-09-29
JPH0682403B2 true JPH0682403B2 (ja) 1994-10-19

Family

ID=13244736

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61063973A Expired - Lifetime JPH0682403B2 (ja) 1986-03-24 1986-03-24 光学式文字読取装置

Country Status (4)

Country Link
US (1) US4799271A (ja)
EP (1) EP0239061B1 (ja)
JP (1) JPH0682403B2 (ja)
DE (1) DE3786816T2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0312905B1 (de) * 1987-10-16 1992-04-29 Computer Gesellschaft Konstanz Mbh Verfahren zur automatischen Zeichenerkennung
JPH05159118A (ja) * 1991-12-05 1993-06-25 Mitsubishi Electric Corp 可搬型記憶装置、可搬型記憶装置の認証装置及び認証方法
US5329598A (en) * 1992-07-10 1994-07-12 The United States Of America As Represented By The Secretary Of Commerce Method and apparatus for analyzing character strings
US5321768A (en) * 1992-09-22 1994-06-14 The Research Foundation, State University Of New York At Buffalo System for recognizing handwritten character strings containing overlapping and/or broken characters
US5392212A (en) * 1993-07-07 1995-02-21 The United States Of America As Represented By The Secretary Of Commerce Apparatus for identifying unknown words by comparison to known words
US5465309A (en) * 1993-12-10 1995-11-07 International Business Machines Corporation Method of and apparatus for character recognition through related spelling heuristics
US5774588A (en) * 1995-06-07 1998-06-30 United Parcel Service Of America, Inc. Method and system for comparing strings with entries of a lexicon
US5764799A (en) * 1995-06-26 1998-06-09 Research Foundation Of State Of State Of New York OCR method and apparatus using image equivalents
JPH1011434A (ja) * 1996-06-21 1998-01-16 Nec Corp 情報認識装置
EP0859332A1 (en) * 1997-02-12 1998-08-19 STMicroelectronics S.r.l. Word recognition device and method
JP3558493B2 (ja) * 1997-06-10 2004-08-25 富士通株式会社 用紙位置合わせ装置、用紙位置合わせ方法及び用紙位置合わせプログラムを記録したコンピュータ読み取り可能な記録媒体
US7721948B1 (en) * 1999-05-25 2010-05-25 Silverbrook Research Pty Ltd Method and system for online payments
US7680649B2 (en) * 2002-06-17 2010-03-16 International Business Machines Corporation System, method, program product, and networking use for recognizing words and their parts of speech in one or more natural languages
US8620083B2 (en) * 2004-12-03 2013-12-31 Google Inc. Method and system for character recognition

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR1543777A (fr) * 1966-12-23 1900-01-01 Ibm Identification des caractères par utilisation du contexte
US4058795A (en) * 1972-10-03 1977-11-15 International Business Machines Corporation Method and apparatus for context-aided recognition
US3925761A (en) * 1974-08-02 1975-12-09 Ibm Binary reference matrix for a character recognition machine
JPS5729745B2 (ja) * 1974-09-25 1982-06-24
US3995254A (en) * 1975-07-16 1976-11-30 International Business Machines Corporation Digital reference matrix for word verification
US4328561A (en) * 1979-12-28 1982-05-04 International Business Machines Corp. Alpha content match prescan method for automatic spelling error correction
JPS57105088A (en) * 1980-12-22 1982-06-30 Toshiba Corp Character reader
JPS584424A (ja) * 1981-07-01 1983-01-11 Toshiba Corp 日本語入力装置
JPS5818777A (ja) * 1981-07-24 1983-02-03 Fujitsu Ltd 文字認識方式
US4468809A (en) * 1981-12-23 1984-08-28 Ncr Corporation Multiple font OCR reader
US4556951A (en) * 1982-06-06 1985-12-03 Digital Equipment Corporation Central processor with instructions for processing sequences of characters

Also Published As

Publication number Publication date
US4799271A (en) 1989-01-17
DE3786816D1 (de) 1993-09-09
EP0239061A3 (en) 1991-04-24
EP0239061A2 (en) 1987-09-30
EP0239061B1 (en) 1993-08-04
JPS62221088A (ja) 1987-09-29
DE3786816T2 (de) 1994-03-24

Similar Documents

Publication Publication Date Title
JP3427692B2 (ja) 文字認識方法および文字認識装置
US5768451A (en) Character recognition method and apparatus
JP2001505330A (ja) テキストストリーム中の単語の切れ目を与える方法及び装置
JP4772817B2 (ja) 画像文書処理装置および画像文書処理方法
JPH0682403B2 (ja) 光学式文字読取装置
US5621818A (en) Document recognition apparatus
CN111782892B (zh) 基于前缀树的相似字符识别方法、设备、装置和存储介质
Lehal et al. A shape based post processor for Gurmukhi OCR
JPH08263478A (ja) 中国語簡繁体字文書変換装置
JP3975825B2 (ja) 文字認識誤り訂正方法、装置及びプログラム
JPH0528324A (ja) 英文字認識装置
JPH08272813A (ja) ファイリング装置
JP2827066B2 (ja) 数字列混在文書の文字認識の後処理方法
JPH09185674A (ja) 誤認識文字検出装置、誤認識文字訂正装置、誤認識文字検出方法、および、誤認識文字訂正方法
JPH07200734A (ja) 光学的文字読取装置
JP2939945B2 (ja) ローマ字住所認識装置
JPH07114622A (ja) 文字認識装置の後処理方法
JP2845463B2 (ja) パターン認識装置
JPH076212A (ja) 光学文字読取装置の知識処理装置
JPH07122890B2 (ja) 分離文字処理機能を持つ文書リーダ装置
JP3139624B2 (ja) 形態素解析装置
JPS60138689A (ja) 文字認識方法
JPH0614375B2 (ja) 文字入力装置
JPH0262659A (ja) 日本文訂正候補文字抽出装置
JPH0514953B2 (ja)