JPH02103690A - 文字読取り装置 - Google Patents

文字読取り装置

Info

Publication number
JPH02103690A
JPH02103690A JP63256195A JP25619588A JPH02103690A JP H02103690 A JPH02103690 A JP H02103690A JP 63256195 A JP63256195 A JP 63256195A JP 25619588 A JP25619588 A JP 25619588A JP H02103690 A JPH02103690 A JP H02103690A
Authority
JP
Japan
Prior art keywords
character
type
character type
candidate
reliability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63256195A
Other languages
English (en)
Inventor
Yoshifumi Tsuji
善文 辻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63256195A priority Critical patent/JPH02103690A/ja
Publication of JPH02103690A publication Critical patent/JPH02103690A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、紙面上に記載された文字列イメージを個々の
文字に分離し、認識する光学的文字読取り装置(以下、
rOcRJと呼ぶ)に係わり、特に文字フィールドを識
別することによって一連の文字列の認識率を向上させる
ようにしたOCR装置に係わる。
(従来の技術) 英文文書や郵便物紙面上の住所名なとの印刷物は、大文
字で印刷されたり、小文字で印刷されることが多い。ま
た、1つの文字フィールド(例えば単語)では、先頭が
大文字であり、残りがすべて小文字である場合もしばし
ば見られる。このような場合、大文字や小文字間のよう
な異なる文字種間で類似字形(例えば、大文字“O”、
小文字“0”や小文字“1”と数字“1″など)が存在
することや認識対象の文字数が増加することによって文
字認識率の低下を招くことが生じる。
そこで、文字フィールド内の文字種を識別することは、
上述した文字認識率を向モさせるために、非常に有用な
ものである。また、通常、用語辞書などを用いてOCR
から出力された一連の文字列を全体的に誤り訂正を行う
機能を実施する上で、上記文字フィールド識別機能によ
る文字認識精度の向上は、有効な前処理であると見なす
こともできる。
従来、このような文字フィールド識別機能に関して、例
えば特願昭51−144075号「大文字及び小文字フ
ィールド識別装置」に開示されているように、予め、算
出された文字中に出現する大文字・小文字の生起確率及
び大文字(又は小文字)が小文字(又は大文字)に誤る
混同確率に従って文字フィールドを識別する方式が知ら
れている。
(発明が解決しようとする問題点) 上記従来方式を文字フィールドの識別に適用する場合、
予め混同確率及び生起確率を計算する必dかある。ここ
で、上述した文字の生起確率及び混同確率は、対象物に
より異なる可能性があり、この変動を吸収するためには
、膨大なデータを処理する必要が生じ、その結果として
得られる確率は、単に平均的な意味しか持たないため、
種々なケースには柔軟に対応できなくなり、従ってコン
スパフォーマンスが十分に得られないという問題点が生
じる。そこで、文書や郵便物等の異なる対象物にも即時
に適用できる文字フィールドの識別処理が必要となる。
次に、英字フィールドの先頭文字の文字種を決定する場
合、先頭文字種が大文字で、それ以外が小文字であるケ
ースは、通常の印刷物では、しばしば見られる。そこで
、先頭文字の文字認識率向上のためには、上述した先頭
文字を除く文字フィールドの識別結果(例えば、先頭文
字が小文字でそれ以外は大文字である英字フィールドは
ほとんど存在しない)と共に、文章のバラグラフの最初
に見られる空白や英字フィールドに存在する特殊記号(
例えばピリオツド“、”)の存在などの文章上のレイア
ウト規則情報も利用して先頭文字の文字種を決定し、上
記問題点の解決をはかることが考えられる。そこで本願
発明の目的は、従来の上記問題点を解決すべく、文字イ
メージの認識結果として出力される複数個の候補文字と
その信頼度に対して、異なる文字種間で存在する類似字
形を予め記憶された文字種置換テーブルによって候補文
字の追加及び信頼度の更新を行った後、1つの文字フィ
ールドの文字種識別を上記信頼度を基にして行なうよう
にした文字読取り装置を提供することにある。
本発明の他の目的は、上述した文字フィールドの文字種
識別情報と共に、文字フィールド間の文章上のレイアウ
ト規則情報も利用して文字フィールド王の所定位置の文
字認識精度を向上させるようにした文字読取り装置を提
供することにある。
本発明の他の目的は、文書や郵便物などのような多様な
印刷物にも柔軟に対応できるようにした文字読取り装置
を提供することにある。
(問題点を解決するための手段) 前述の問題点を確実にするために本願の第1の発明が提
供する文字読取り装置は、紙面上に記載された文字列イ
メージを個々の文字に分離し、予め用意された標準辞書
と照合して複数個の候補文字とその信頼度を得る文字認
識手段と、文字フィールドに対応する一連の前記複数個
の候補文字を文字種毎に分類し、その信頼度に従って所
定の位置に記憶する文字種別データ記憶手段と、異なる
文字柱間で文字形状か類似する文字群を予め記憶する文
字種置換テーブルと、第1の文字種候補文字か第2の文
字種候補文字に置き換え可能か否かを前記文字種置換テ
ーブルを参照して検査し、前記文字種別データ記憶手段
に、前記第1の文字種候補文字とその信頼度を前記第2
の文字種候補文字として登録もしくは前記第2の文字種
候補文字の信頼度を更新する類似字形処理手段と、最も
高い信頼度を持つ一連の候補文字を読出し、前記−連の
候補文字の信頼度の累積和を文字種毎に算出する手段と
、文字種毎に算出されたiij記累積和に従って前記文
字フィールドの文字種を識別し、連の複数個の候補文字
から一連の特定な文字を決定する手段とから成る。
前述の問題点を解決するために本願の第2の発明が提供
する文字読取り装置は、紙面上に記載された文字列イメ
ージを個々の文字に分離し、予め用意された標準辞Mと
照合して複数個の候補文字とその信頼度を得る文字認識
手段と、文字フィールドに対応する一連の前記複数個の
候補文字を文字種毎に分類し、その信頼度に従って所定
の位置に記憶する文字種別データ記憶手段と、異なる文
字種間で文字形状が類似する文字群を予め記憶する文字
種置換テーブルと、第1の文字種候補文字か第2の文字
種候補文字に置き換え可能か否かを前記文字種置換テー
ブルを参照して検査し、前記文字種別のデータ記憶手段
に前記第1の文字種候補文字として登録もしくは面記第
2の文字種候補文字の信頼度を更新する類似字形処理手
段と、最も高い信頼度を持つ一連の候補文字を読み出し
、前記一連の候補文字の信頼度の累積和を文字種毎に算
出し、前記累積和に従って前記文字フィールドの文字種
を識別する文字フィールド識別手段と、前記文字フィー
ルドの文字種識別結果に加えて前記文字フィールドに隣
接する空白及び句読点等の特殊記号の認識結果に従って
前記文字フィールドの所定位置に存在する複数個の候補
文字から特定な文字を決定する手段とから成る。
(実施例) 以下本願発明の実施例について図面を参照しながら説明
する。
第1図は、文字種間の類似字形を処理するために用いら
れる文字種置換テーブルの一例を示した図である。図に
おいて、例えば、英文字i1 C′′と英小文字“C”
は文字種間の類似字形として−tめ記憶される。
第2図は、先頭文字以外かすべて小文字から成る入力文
字列“Word”に対するOCRの出力文字列とその信
頼度(図中記号I〕1.は、第1番目の入力文字に対す
る第j番目の大文字候補文字の信頼度を示し、記号d 
+jは第1番目の入力文字に対する第j番目の小文字候
補文字の信頼度である)を示している。尚、図中“?”
は入力文字“d”に対する大文字の第−位候補文字の信
頼度D 41がかなり低下しているために、大文字とし
ては読取り不能となったことを示している。
第3図は、第2図に示すOCRの出力文字列上その信頼
度に対して、文字種間の類似字形を処理して得られる各
文字種毎の候補文字とその信頼度の一例を示している。
そこで、第2図及び第3図を用いて、文字種間の類似字
形の処理した後、文字フィールドの識別する方法につい
て説明する。
尚、第2図及び第3図の一例では、入力文字フィールド
は英字であるため、文字フィールドの決定は、先頭の文
字を除く文字列、即ち“ord”を対象とする。また、
類似字形の処理対象は、大文字及び小文字毎に認識結果
を分類した時、各文字種毎の第−位候補のみを対象とし
て行っても良いし、また、信頼度(大きい方が信頼度は
高いとする)が一定基準以上ある第1位候補(n≧2)
までを対象として行っても良いとする。以Fの説明では
信頼度が一定基準以上ある第n候補までを対象として類
似字形処理を行うものとする。更に第2図及び第3図で
は類似字形として大文字“O”と小文字“0”、大文字
“C“と小文字“C”が文字種置換テーブルに登録され
ているとする。
第2図において、入力文字“0”に対して、大文字認識
結果“0”と“D”が得られている。ここで大文字“0
”は小文字“0”に置き換え可能となるため、入力文字
“0”に対する小文字認識結果には、”C”と“e“の
みが候補文字となっているため、小文字認識結束へ小文
字“0”とその信頼度として値021が登録されること
になる。
第3図の例では信頼度D21が信頼度d21より大きい
場合である。ここで、第3図の入力文字“0”の小文字
認識結果に小文字“0″が含まれている場合には、その
信頼度と上記類似字形処理によって得られる信頼度D2
1とが比較され信頼度D 21が大きければ、その値D
21によって信頼度が更新されることになる。
同様に、入力文字“0”に対する小文字認識結束“C”
も大文字に置き換え可能であるため、第3図の如く、大
文字認識結果として大文字“C”とその信頼度d21が
登録されることになる。
次に文字フィールド“ord”の識別は、各文字種毎の
第−位候補文字の信頼度の加算和に従って行われる。即
ち、第3図における、大文字候補(“0”T″、′?”
)の信頼度の累積和はD 2+ + D *++ D 
41であり、小文字候補文字(“0”  u r”d”
)の信頼度の累積和は、D2゜+d3++d4+となり
、その大小比較によって人文字フィールドであるか小文
字フィールドであるかを識別する。第3図の場合には、
上述した類似字形処理によって入力文字列“0”に対す
る両方の信頼度は同一となるため、入力文字“r”と“
d”の大文字、小文字に対する信頼度の和で決定される
ことになり、結果的に小文字フィールドと見なされる。
それ故、入力文字列“ord”の認識結果として、小文
字の第−位候補文字のみ選択すると、小文字列“0”r
”d”が得られる。
ここで、第1番目の入力文字“W”については、大文字
“W”か小文字“W”かを上記文字フィールド識別結果
からは、判別できないため、それらの信頼度D 11、
dllの大小比較によって決定することが考えられるが
、後述する第4図(b)及び(C)で示したようにその
文字の以前に認識された文字情報も有効に利用できる。
第4図は、英文字フィールドの先頭文字種を決定するの
に有効となる文章レイアウト規則の一例を示したもので
ある。
第4図(a)では前述した文字フィールド識別で図中矢
印の部分か英大文字と判明すれば、先頭文字種は大文字
と見なしても良いため、大文字の認識結果から候補文字
(例えば第−位侯M)を選択することができる。
第4図(b)は、文章上に見られるバラグラフの先頭部
分を示しており、通常図中点線の矩形枠で示した空白が
存在する。また、第4図(C)で示したように、文の終
rにはピリオツド“、”か使用される。第4図(b)又
は(C)のような場合には、図中矢印で示す文字フィー
ルドが小文字であっても、図中矩形で示した文字“T”
は通常大文字であると見なすことができる。
そこで、英字フィールドの先頭文字の如く、大文字か小
文字かが判明しない場合、前述した文字フィールドの識
別結果と共に、それに隣接する文字フィールドに於ける
空白や特殊記号の存在も加味して上記英字フィールドの
先頭文字の文字種決定を行うことができる。
第5図は、本願第1の発明の具体的実施例を示す機能ブ
ロック図である。尚、以下の説明において信号線の末尾
に記号Sを付けることによってその信号を表すこととす
る。
図において、1は文字読取部であり、紙面上に記載され
た文字列イメージを個々の文字に分離し、予め用意され
た標準パターンと照合して複数個の候補文字と信頼度を
出力する。文字読取部1は、公知の技術を用いて実現さ
れ、第2図で示したように、文字種毎に分けて、文字フ
ィールドに対する一連の複数個の候補文字と信頼度を第
1文字種認識結果記憶部5内の文字名記憶部51及び信
頼度記憶部52、第2文字種認識結果記憶部θ内の文字
名記憶部61及び信頼度記憶部62にそれぞれ転送する
文字種置換テーブル2は、異なる文字種間の類似字形を
持つ文字名ペアを第1図で示した如く、予め記憶する。
3は、第2文字種認識結果に作用する類似字形処理部で
あり、比較部34、選択部33、登録部32、信頼度更
新部31から構成される。4は、第1文字種認識結果に
作用する類似字形処理部であり、比較部44、選択部4
3、登録部42、信頼度更新部41から構成される。
ここで、類似字形処理部及び4は、処理対象が異なるの
みで第3図で示すような機能を両者ともに実行するため
、互いに並列的に処理を実行することができる。そこで
、類似字形処理について説明する。
比較部34は、第1文字種の認識結果である文字名記憶
部51に格納された候補文字を順次読み出し、その候補
文字か類似字形であり、第2文字種に置き換え可能か否
かを文字種置換テーブル2を参照しながら検査を行う。
比較部34において、文字名記憶部51に格納された前
記候補文字が置き換え可能であれば、選択部33は、そ
の候補文字が第2文字種候補文字として文字名記憶部6
1に既に格納されているか否かを検査し、格納されてい
なければ登録部32を、また既に格納されていれば、信
頼度更新部31を起動する。登録部32は、文字種置換
テーブル2によって第1文字種として認識された候補文
字の類似字形とじて得られた第2文字種の候補文字及び
前記第1文字種として認識された候補文字の信頼度をそ
れぞれ文字名記憶部61及び信頼度記憶部62の所定の
位置に格納する。一方、信頼度更新部31は、文字名記
憶部61に格納され且つ第2文字種として認識された候
補文字の信頼度を信頼度記憶部62より読み出し、最初
に選択部33より出力される第1文字種として認識され
且つ第2文字種に置き換え可能であると判断された第1
文字種の候補文字の信頼度と比較する。その結果、選択
部33より出力された第1文字種の候補文字の信頼度が
信頼度記憶部62の所定の位置に格納された信頼度より
大きければ、前記第1文字種の候補文字の信頼度を第2
文字種として認識された候補文字の信頼度として前述し
た信頼度62の所定の位置に転送する。
同様な類似字形の処理は比較部44、選択部43、登録
部42、信頼度更新部41においても行われる。ここで
、類似字形処理部3は、第1文字種として認識された候
補文字が第2文字種に置き換え可能か否かを検査するこ
とによって、第2文字種として認識された候補文字及び
その信頼度について新たな候補文字とその信頼度の登録
又は信頼度の更新を行う。一方、類似字形処理部4は、
第2文字種として認識された候補文字が第1文字種に置
き換え可能か否かを検査し、第1文字種として認識され
た候補文字及びその信頼度について上記登録又は信頼度
の更新を行なう点のみが類似字形処理3と異なる。
以上の述べた類似字形処理部3.4によって第3図に示
すように第1文字種及び第2文字種の認識結果記憶部5
及び6の内容が修正されることになる。
次に、1つの文字フィールド(英文の時は先頭文字を除
く)に対する第1文字種として認識された一連の第−位
候補文字の信頼度を信頼度記憶部52より読み出し、順
次累積和算出部71に転送する。累積和算出部71は一
連の第−位候補文字の信頼度を加算し、その値を比較部
8に転送する。同様に、第2文字種として認識された一
連の第−位候補文字の信頼度を信頼度記憶部62より読
み出し、順次累積和算出部72に転送する。累積和算出
部72は、一連の第−位候補文字の信頼度を加算し、そ
の値を比較部8に転送する。比較部8は、累積和算出部
71と累積和算出部72とのそれぞれの値を比較し、累
積和算出部71の値の方が大きければ、その出力信号8
1sに“1”を出力することによって、前記文字フィー
ルドか第1文字種であると判断される。一方、累積和算
出部72の値の方が大きければ、その出力信号81sに
“0”を出力することによって、前記文字フィールドが
第2文字種であると判断される。選択部9は、比較部9
より出力される文字種判定結果に従って、第1文字種の
記憶認識結果を記憶した記憶部5の内容又は第2文字種
の認識結果を記憶した記憶部6の内容を出力データ記憶
部10へ転送する。
尚、選択部9では、それぞれの文字種の第−位候補文字
のみを出力データ記憶部10へ転送するようにしても良
い。また、文字フィールドの先頭文字については、第1
文字種及び第2文字種の候補文字とも出力しても良い。
第8図は、本願筒2の発明の具体的実施例を示す機能ブ
ロック図である。図において、文字読取部1、文字種置
換テーブル2、第1文字種認識結果記憶部5、第2文字
種認識結果記憶部6、類似字形処理部3及び4、それら
を構成する比較部34及び44、選択部33及び43、
登録部32及び42、信頼度更新部31及び41、累積
和算出部71及び72、比較部8は第5図で説明した同
等な機能を有する。尚、第6図で示す本願筒2の発明で
は、前述した類似字形処理部3及び4において、文字フ
ィールドの先頭文字における候補文字に対する類似字形
処理も実行されるとする。また、出力データ記憶部10
には、1つ前に得られた一連の文字認識結果も格納され
ているとする。
そこで出力データ記憶部10から1つ前に得られた一連
の文字認識結果から最後の候補文字を読み取り、先頭文
字種条件判定部11に転送する。また、図面上では省略
するが、文字読取部1より出力された文字列を文字フィ
ールド毎に分けて出力する時、その文字フィールドが文
章の最初の文字フィールドかを識別した際に得られた空
白情報も同時に先頭文字種条件判定部11に転送されて
いるとする。先頭文字種条件判定部11は、出力データ
記憶部10から転送された候補文字がピリオツド“、”
であるか、あるいは文字読取部1から直接転送される空
白情報が転送されるか否かを検査することによって、第
4図(b)及び(C)で示した如く、上記先頭文字が隣
接する文字フィールドの特殊記号や空白情報より大文字
(ここでは第1文字種とする)であるか否かを判断し、
大文字即ち第1文字種であればその出力信号111Sを
“l”にする。選択部12は、比較部8において判定さ
れた実行中の文字フィールドの識別結果(信号81sか
ら“1”が出力されれば第1文字種、′0”が出力され
れば第2文字種)及び先頭文字種条件判定部11からの
出力信号111S(即ち、出力信号111Sに“1”が
出力されれば、文字フィールドの文字種識別結果に関係
なく、先頭文字種は第1文字種と見なされる)の値に従
って、第1文字種の認識結果を記憶した記憶部5の内容
又は第2文字種の認識結果を記憶した記憶部6の内容を
出力データ記憶部10へ転送する。
(発明の効果) 以上に説明したように、本願発明の文字読取装置によれ
ば、1つの文字フィールドの文字認識結果に対して、異
なる文字種間の類似字形を考慮して各候補文字の追加及
び信頼度の更新を行った後、文字種の識別や更に句読点
等の情報も加味した特定位置の文字種識別を行うことに
よって容易にしかも安定に文字読取り精度の向上をはが
ることかできる。
【図面の簡単な説明】
第1図は、異なる文字種間の類似字形を記憶した文字種
置換テーブルの一例を示す図、第2図は、文字読取装置
から得られる候補文字とその信頼度の一例を示す図、第
3図は、第2図に対して文字種間の類似字形を処理して
得られる候補文字とその信頼度の一例を示す図、第4図
は、英文字フィールドの先頭文字種を決定するのに有効
となる文章レイアウト規則の一例を示した図、第5図は
、本願の第1の発明の実施例を示す機能プロ。 り図、第6図は本願の第2の発明の実施例を示す機能ブ
ロック図である。図において、1は文字読取部、2は文
字種置換テーブル、3及び4は、類似字形処理部、31
及び41は信頼度更新部、32及び42は登録部、33
及び43は選択部、34及び44は比較部、5は第1文
字種認識結果記憶部、6は第2文字種認識結果記憶部、
51及び61は文字名記憶部、52及び62は信頼度記
憶部、71及び72は累積和算出部、8は比較部、9は
選択部、10は出力データ記憶部、11は先頭文字種条
件判定部、12は選択部である。

Claims (2)

    【特許請求の範囲】
  1. (1)紙面上に記載された文字列イメージを個々の文字
    に分離し、予め用意された標準辞書と照合して複数個の
    候補文字とその信頼度を得る文字認識手段と、文字フィ
    ールドに対応する一連の前記複数個の候補文字を文字種
    毎に分類し、その信頼度に従って所定の位置に記憶する
    文字種別データ記憶手段と、異なる文字種間で文字形状
    が類似する文字群を予め記憶する文字種置換テーブルと
    、第1の文字種候補文字が第2の文字種候補文字に置き
    換え可能か否かを前記文字種置換テーブルを参照して検
    査し、前記文字種別データ記憶手段に、前記第1の文字
    種候補文字とその信頼度を前記第2の文字種候補文字と
    して登録もしくは前記第2の文字種候補文字の信頼度を
    更新する類似字形処理手段と、最も高い信頼度を持つ一
    連の候補文字を読出し、前記一連の候補文字の信頼度の
    累積和を文字種毎に算出する手段と、文字種毎に算出さ
    れた前記累積和に従って前記文字フィールドの文字種を
    識別し、一連の複数個の候補文字から一連の特定な文字
    を決定する手段とを具備することを特徴とする文字読取
    り装置。
  2. (2)紙面上に記載された文字列イメージを個々の文字
    に分離し、予め用意された標準辞書と照合して複数個の
    候補文字とその信頼度を得る文字認識手段と、文字フィ
    ールドに対応する一連の前記複数個の候補文字を文字種
    毎に分類し、その信頼度に従って所定の位置に記憶する
    文字種別データ記憶手段と、異なる文字種間で文字形状
    が類似する文字群を予め記憶する文字種置換テーブルと
    、第1の文字種候補文字が第2の文字種候補文字に置き
    換え可能か否かを前記文字種置換テーブルを参照して検
    査し、前記文字種別のデータ記憶手段に前記第1の文字
    種候補文字として登録もしくは前記第2の文字種候補文
    字の信頼度を更新する類似字形処理手段と、最も高い信
    頼度を持つ一連の候補文字を読み出し、前記一連の候補
    文字の信頼度の累積和を文字種毎に算出し、前記累積和
    に従って前記文字フィールドの文字種を識別する文字フ
    ィールド識別手段と、前記文字フィールドの文字種識別
    結果に加えて前記文字フィールドに隣接する空白及び句
    読点等の特殊記号の認識結果に従って前記文字フィール
    ドの所定位置に存在する複数個の候補文字から特定な文
    字を決定する手段とを具備することを特徴とする文字読
    取り装置。
JP63256195A 1988-10-11 1988-10-11 文字読取り装置 Pending JPH02103690A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63256195A JPH02103690A (ja) 1988-10-11 1988-10-11 文字読取り装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63256195A JPH02103690A (ja) 1988-10-11 1988-10-11 文字読取り装置

Publications (1)

Publication Number Publication Date
JPH02103690A true JPH02103690A (ja) 1990-04-16

Family

ID=17289232

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63256195A Pending JPH02103690A (ja) 1988-10-11 1988-10-11 文字読取り装置

Country Status (1)

Country Link
JP (1) JPH02103690A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020119290A (ja) * 2019-01-24 2020-08-06 富士ゼロックス株式会社 情報処理装置及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020119290A (ja) * 2019-01-24 2020-08-06 富士ゼロックス株式会社 情報処理装置及びプログラム

Similar Documents

Publication Publication Date Title
US5161245A (en) Pattern recognition system having inter-pattern spacing correction
US7415171B2 (en) Multigraph optical character reader enhancement systems and methods
JP2734386B2 (ja) 文字列読み取り装置
US9754176B2 (en) Method and system for data extraction from images of semi-structured documents
US10963717B1 (en) Auto-correction of pattern defined strings
JPH0684006A (ja) オンライン手書き文字認識方法
US11663408B1 (en) OCR error correction
KR101016544B1 (ko) 단어 인식 방법 및 기록 매체
JPH02103690A (ja) 文字読取り装置
JP5252487B2 (ja) 情報処理装置、その制御方法、制御プログラム、および記録媒体
JP3455643B2 (ja) 文字認識装置における学習辞書の更新方法及び文字認識装置
JP2697790B2 (ja) 文字タイプ決定方法
JP2908132B2 (ja) 文字認識結果の後処理方法
JPH0258187A (ja) 文字認識装置
JP2000132635A (ja) 認識データ確認方法
JP2529421B2 (ja) 文字認識装置
JP4261831B2 (ja) 文字認識処理方法、文字認識処理装置、文字認識プログラム
JP2000251017A (ja) 単語辞書作成装置および単語認識装置
JPH04123185A (ja) 文書認識方式
JPH0277988A (ja) 文字認識装置
JP2839515B2 (ja) 文字読取システム
JPH11120294A (ja) 文字認識装置および媒体
JPH04278664A (ja) 住所解析処理装置
Belaid et al. Generic approach for OCR performance evaluation
JPH04256193A (ja) 認識文字の単語登録処理方式