JPH08235304A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH08235304A
JPH08235304A JP7037419A JP3741995A JPH08235304A JP H08235304 A JPH08235304 A JP H08235304A JP 7037419 A JP7037419 A JP 7037419A JP 3741995 A JP3741995 A JP 3741995A JP H08235304 A JPH08235304 A JP H08235304A
Authority
JP
Japan
Prior art keywords
character
recognition
recognition result
dictionary
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP7037419A
Other languages
English (en)
Inventor
Masaharu Nagata
政晴 永田
Koichi Higuchi
浩一 樋口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP7037419A priority Critical patent/JPH08235304A/ja
Publication of JPH08235304A publication Critical patent/JPH08235304A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 文字認識部で認識した結果中にある誤認識結
果をオペレータの負担が少なくかつ精度良く高速に再度
認識出来る文字認識装置を提供する。 【構成】 オペレータによって誤認識と判定された認識
結果があった場合に動作する第2の文字認識部20であ
って、該オペレータによって指定された修正文字に対応
する辞書に前記誤認識結果を得る過程で使用した特徴を
追加して作成され、再度の文字認識終了後に初期化され
る追加辞書部21と、該追加辞書部21および前記誤認
識結果に対応する文字用の辞書との双方を用い、前記誤
認識結果となった文字および該誤認識結果と同じ認識結
果を持つ文字(特定文字)に再度文字認識処理をする制
御部22とを具える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、読取対象の文書、帳
票等(以下、被読取媒体という。)上の、文字や記号等
(これを文字という。)を認識する文字認識装置に関す
るものである。
【0002】
【従来の技術】文字認識装置では、一般に、文字から文
字パタンを得、該文字パタンから特徴抽出を行ない、そ
こで得られた特徴と予め用意した標準パタンの特徴との
照合を行ない文字を認識する。ここで用いる辞書は、一
般に、一文字に対して変形を考慮した複数の辞書とされ
る。具体例で説明すれば、文字ごとに、例えば、:つ
ぶれ対応、:かすれ対応、:明朝体対応、:ゴシ
ック体対応等の各辞書マスクが用意されこれらで各文字
ごとの辞書が構成されるのである。しかし、このように
しても、文字パタンの品質が悪い場合や、辞書に用意さ
れていない変形のある文字パタンが入力された場合等
は、誤認識(誤読)が生じる場合が多い。そこで、この
ような誤認識の発生を少しでも低減するため、誤認識し
た文字を辞書にその都度登録して認識精度を向上させる
ようにした文字認識装置がある。いわゆる辞書に学習を
させつつ文字認識を行う装置である。
【0003】
【発明が解決しようとする課題】しかしながら、学習し
た辞書は場合によって、他の類似文字の認識精度を低下
させてしまう場合がある。
【0004】また、誤認識文字を辞書に学習させて再度
認識することにより誤読文字を削減できるが、その場合
被読取媒体全体を再度認識する必要があるため、文字認
識処理のための時間がかかるという問題もある。
【0005】また、認識結果中の誤認識結果をオペレー
タが逐次修正することも考えられるが、その場合、オペ
レータは認識対象の文書の認識結果全部を注意深く観測
しその認識結果中から誤認識結果を検索し修正する必要
があるので、修正に時間がかかり、またオペレータの負
担は極めて大きなものとなってしまう。
【0006】また、誤認識が特定の文字において生じ易
いことを利用して、例えば、文献I((株)メディアド
ライブ研究所カタログ「WinReader Plus
v.2.0」(1994.6.17 )に記載の様に、該特定文
字の認識結果を一括検索しかつそれらを正しい文字のも
のに一括修正する方法もある。しかし、この場合は、特
に、被読取媒体が類似の形であるが異なる意味を持つ2
種類以上の文字を含む文書例えば図6に示した様な漢字
の「工」とカタカナの「エ」とが混在している文書Pで
ある場合、次のような問題が生じる。文字認識が終了し
た後に、図7に示す様に、「工数」は正確に『工数』と
認識できたが「エラー」が『工ラー』というようにカタ
カナの「エ」の部分が漢字の『工』と認識された場合
(図7中、41〜44で示す。)、漢字の『工』を特定
文字として一括検索しこれをカタカナの『エ』に置換す
ると、『工(漢字)ラー』は「エ(カタカナ)ラー」と
修正出来るが、正確に認識されていた『工数』における
漢字の「工」の部分45〜48が「エ(カタカナ)」に
誤修正されてしまうのである。
【0007】
【課題を解決するための手段】そこで、この出願の文字
認識装置によれば、文字から文字パタンを得、該文字パ
タンから特徴を抽出し、該抽出した特徴と辞書とを照合
して前記文字の認識を行なう文字認識部を有する文字認
識装置において、オペレータによって誤認識と判定され
た認識結果があった場合に動作する第2の文字認識部で
あって、該オペレータによって指定された修正文字に対
応する辞書に前記誤認識結果を得る過程で使用した特徴
を追加して追加辞書を作成し、該追加辞書と該誤認識結
果に対応する文字用の辞書との双方を用い、前記誤認識
結果となった文字および該誤認識結果と同じ認識結果を
持つ文字に再度文字認識処理をし、該再度の文字認識処
理終了後は、前記追加辞書を初期化する、第2の文字認
識部をさらに具えたことを特徴とする。
【0008】
【作用】この発明の構成によれば、第2の文字認識部
は、オペレータによって誤認識と判定された認識結果と
同じ認識結果を持つ文字についてのみ再度の文字認識処
理を行う。しかも、この再度の文字認識では、オペレー
タによって指示された修正文字の特徴が加味された追加
辞書と、誤認識結果を得た辞書との2つを用い再度の文
字認識がなされる。このように2つの辞書を用いると、
本当に誤認識である文字は追加の辞書により本来の文字
として正しく認識され、一方、オペレータによって誤認
識と判定された認識結果と同じ認識結果ではあるがそも
そもその結果自体が正当である認識結果はそのまま維持
される。また、追加の辞書は再度の文字認識処理が終了
した後は初期化されるので、いま再度の文字認識をした
文字に類似した文字について後に再度の文字認識が必要
になった場合でもいま使用している追加辞書が後に再度
の文字認識をする際に悪影響することはなく、その都度
再度の文字認識に適した適正な追加辞書が作成される。
【0009】
【実施例】以下、図面を参照してこの発明の実施例につ
いてそれぞれ説明する。ただし、いずれの図もこの発明
を理解出来る程度に概略的に示してある。また、説明に
用いる各図において同様な構成成分については同一の番
号を付し、その重複する説明を省略することもある。
【0010】1.構成の説明 図1は実施例の文字認識装置の構成を示すブロック図で
ある。この文字認識装置は、文字認識部10と、第2の
文字認識部20と、キーボード31と、表示部33とで
構成してある。
【0011】文字認識部10は、被読取媒体(例えば図
6に示したもの。)上の文字から文字パタンを得、該文
字パタンから特徴を抽出し、該抽出した特徴と辞書とを
照合して前記文字の認識を行なうものである。この実施
例の文字認識部10は、被読取媒体からイメージを取り
込む走査部11と、走査部11により取り込まれたイメ
ージを記憶するイメージ記憶部12と、該イメージ記憶
部12に記憶されているイメージから1文字単位に文字
パタンを切り出す文字切り出し部13と、文字切り出し
部13から得られた文字パタンの特徴を抽出する特徴抽
出部14と、標準文字パタンの特徴が記憶されている辞
書部15と、特徴抽出部14で得た特徴および辞書部1
5の標準文字パタンの特徴を照合し文字識別を行なう識
別部16とを具えたものとしてある。ここで、走査部1
1、イメージ記憶部12、文字切り出し部13、特徴抽
出部14、辞書部15および識別部16それぞれは、従
来公知の任意のもので構成出来る。したがって、特徴抽
出部14も、文字パタンの特徴を抽出できるものであれ
ばいかなる特徴抽出法を実施するものでも構わないが、
この実施例では、特徴マトリクスを抽出するものとして
いる。具体的には、図2に示した様に、文字切り出し部
13から切り出されて特徴抽出部14に入力されてくる
入力文字パタンを格納するパタンレジスタ14aと、入
力文字パタンの線幅を計算する線幅計算部14bと、入
力文字パタンからサブパタンを抽出するサブパタン抽出
部14cと、入力文字パタンに対する文字枠を検出する
文字枠検出部14dと、この検出された文字枠を複数領
域に分割する文字枠分割決定部14eと、特徴マトリク
ス抽出部14fとを具えるものとしている。
【0012】また、第2の文字認識部20は、オペレー
タによって誤認識と判定された認識結果があった場合に
動作し、該オペレータによって指定された修正文字に対
応する辞書に前記誤認識結果を得る過程で使用した特徴
を追加して追加辞書を作成し、該追加辞書と該誤認識結
果に対応する文字用の辞書との双方を用い、前記誤認識
結果となった文字および該誤認識結果と同じ認識結果を
持つ文字(これらの文字を以下「特定文字」と称するこ
ともある。)に再度文字認識処理をし、該再度の文字認
識処理終了後は、前記追加辞書を初期化するものであ
る。この第2の文字認識部20を、この実施例では、オ
ペレータによって指定された修正文字に対応する辞書に
前記誤認識結果を得る過程で使用した特徴を追加して作
成され、再度の文字認識終了後に初期化される追加辞書
(追加辞書部ともいう。)21と、該追加辞書21およ
び前記誤認識結果に対応する文字用の辞書との双方を用
い、特定文字に再度文字認識処理をする制御部22と、
文字認識部で得た認識結果を記憶するためのメモリ23
とを具えたものとしてある。
【0013】なお、表示部33には認識結果が表示さ
れ、これをオペレータが観測して誤認識を発見できる構
成としてある。ただし、詳細は後述するが、この発明で
は、認識結果中の同一の誤認識結果については少なくと
も1つ発見すれば良い。また、誤認識に対するオペレー
タによる修正情報は、キーボード31から入力できる構
成としてある。
【0014】2.動作の説明 次に、この実施例の文字認識装置の理解を深める為にそ
の動作について説明する。なお、この動作説明において
は、被読取媒体を図6に示した文書Pとした例で説明す
る。また、この説明を図1〜図5を参照して行なう。こ
こで、図3は被読取媒体P中のカタカナの「エ」の特徴
抽出手順を示した図、図4は被読取媒体P中の漢字の
「工」の特徴抽出手順を示した図である。また、図5
は、第2の文字認識部20の動作手順(再度の文字認識
手順)を示した流れ図である。
【0015】走査部11は、被読取媒体Pを光学的に走
査しそのイメージをイメージ記憶部12に格納する。走
査部11より被読取媒体Pのイメージがイメージ記憶部
12に格納されると、文字切り出し部13では、格納さ
れたイメージから一文字単位の文字パタンを抽出する。
図3および図4各々での(A)図は、それぞれ「エ」、
「工」の原パタン(入力文字パタン)を示している。
【0016】文字切り出し部13で抽出された文字パタ
ンは特徴抽出部14のパタンレジスタ14aに入力され
る。特徴抽出部14は、この入力された文字パタンの特
徴を以下に説明する様に抽出する。
【0017】文字切り出し部13から入力された文字パ
タン(入力文字パタン)の線幅Wを、線幅計算部14b
は計算する。この実施例では線幅計算部14bは例えば
周知のフィルタ回路と同様にシフトレジスタ構成となっ
ており、入力文字パタンを受けて2×2段の窓のすべて
の画素が黒ビットとなる状態の個数Qと入力文字パタン
の黒ビット和Aを計数し、下記に示す周知式で線幅Wを
算出する。
【0018】W=A/(A−Q) この線幅はパタンレジスタ14aを走査して全黒ビット
数を求めることで得られる。またサブパタン抽出部14
cは、パタンレジスタ14aについて垂直スキャンを全
面行い、そして垂直方向での黒ビットの連続長さと線幅
計算部において計算された線幅Wとの関係より垂直サブ
パタン(以下、VSPともいう)を抽出する。さらにサ
ブパタン抽出部14cは、パタンレジスタ14aについ
て水平スキャンを全面行ない、そして水平方向での黒ビ
ットの連続長さと線幅計算部において計算された線幅W
との関係より水平サブパタン(以下、HSPともい
う。)を抽出する。さらにサブパタン抽出部14cは、
パタンレジスタ14aについて右斜め45°スキャンを
全面行ない、そして右斜め45°方向での黒ビットの連
続長さと線幅計算部において計算された線幅Wとの関係
より右斜め45°サブパタン(以下、RSPともい
う。)を抽出する。さらにサブパタン抽出部14cは、
パタンレジスタ14aについて左斜め45°スキャンを
全面行ない、そして左斜め45°方向での黒ビットの連
続長さと線幅計算部において計算された線幅Wとの関係
より左斜め45°サブパタン(以下、LSPともい
う。)を抽出する。図3(B)〜(E)に、カタカナの
「エ」の文字パタンから抽出したVSP、HSP、RS
PおよびLSPをそれぞれ示した。また、図4(B)〜
(E)に、漢字の「工」の文字パタンから抽出したVS
P、HSP、RSPおよびLSPをそれぞれ示した。
【0019】文字枠検出部14dは、パタンレジスタ1
4a内の文字パタンに外接する文字枠を検出し、その結
果を文字枠分割決定部14eへ送る。
【0020】文字枠分割決定部14eは、文字枠検出部
14dより検出された文字枠内を(N×M)の領域
(N,Mは定数であり、この実施例ではN=M=5)に
分割するためのX軸、Y軸上の分割点座標を決定する。
ただし、ここでは文字枠の水平方向に当たる軸をX軸、
垂直方向に当たる軸をY軸としている。
【0021】特徴マトリクス抽出部14fは、文字枠分
割決定部24により決定された分割点座標により、VS
P、HSP、RSPおよびLSPの各サブパタンの文字
枠領域を(N×M)の領域にそれぞれ分割する。さらに
各領域ごとの黒ビット数Bijを計数し、さらにこの黒ビ
ット数Bijと線幅Wとを用いて下記の(1)式より文字
線長Lijを示す特徴を計算して、(N×M)×4次元の
特徴マトリクスをそれぞれ作成する。
【0022】Lij=Bij/W ・・・(1) ただし、VSPに関する特徴マトリクスは文字枠のY方
向の長さΔYで、またHSPに関する特徴マトリクスは
文字枠のX方向の長さΔXで、またRSPおよびLSP
に関する各特徴マトリクスは[(ΔX)2 +(ΔY)
21/2 で、それぞれ正規化し、最終的に(N×M)×
4次元の特徴マトリクスをそれぞれ作成する。図3
(F)〜(I)に、カタカナの「エ」の文字パタンから
抽出した(N×M)×4次元の特徴マトリクスを示し
た。また、図4(F)〜(I)に、漢字の「工」の文字
パタンから抽出した(N×M)×4次元の特徴マトリク
スを示した。このように抽出された特徴マトリクスは認
識部16に入力される。
【0023】認識部16は、特徴抽出部14で作成され
た文字パタンの特徴マトリクスfiと辞書部14にある
予め用意された標準文字パタンの特徴マトリクスfm
を用い周知の下記式(2)で与えられる距離Dを求め、
該距離Dが最少のものから順番付けを行い、距離Dの小
さい順からn個(本実施例ではn=1)までの文字名を
認識結果としてメモリ23に記憶させる。
【0024】 D=[Σ(fm −fi21/2 ・・・(2) 文字切り出し部13による文字パタンの切り出し処理か
らメモリ23へ認識結果を記憶させるまでの一連の処理
を、被読取媒体の文字数分だけ繰り返す。
【0025】続いて、認識結果に誤認識があるか否かの
検索処理と誤認識があった場合の特定文字の再度の文字
認識処理について説明する。
【0026】メモリ23に記憶された被読取媒体の認識
結果を表示部33に表示する(図5のステップS1)。
オペレータは表示部33に表示された認識結果の中に誤
認識文字があるか否かを調べる。ただし、この発明で
は、一つの文字については誤認識個所を1個所見つける
だけで良い。すなわち、ある文字について1個所誤認識
個所を見つけたならこれと同じ文字についての誤認識個
所は気にせず他の文字についての誤認識の有無を調べれ
ば良い。なぜなら、詳細は後述するが、同じ誤認識文字
については後に自動的に検索できるからである。次に、
オペレータはキーボードから修正情報を入力する(図5
のステップS2)。ここで修正情報とは、誤認識結果が
なかった旨の情報、或は誤認識結果があった場合の情報
および誤認識結果があった場合は再度の文字認識が必要
な旨と修正すべき正しい文字の情報等である。第2の文
字認識部20の制御部22は修正情報を解析して誤認識
結果があつたか否か(再度の文字認識が必要か否か)を
判別する(図5のステップS3)。誤認識結果がなく従
って文字の再度の認識の必要がない場合、文字認識装置
は認識結果を外部に出力する(図5のステップS4)。
しかし、この実施例では被読取媒体Pに対し図7に示し
た様な認識結果Q、すなわち本来はカタカナの「エ」と
認識されるべき部分41〜44がすべて漢字の『工』と
誤認識された認識結果が得られている場合を考える。こ
のため、オペレータはこの認識結果Qから誤認識個所を
発見することとなり、そして誤認識個所のうちの1個
所、例えば誤認識個所42を発見したとする。したがっ
てオペレータは、キーボード31から再度の文字認識を
行なう必要がある旨および修正すべき正しい文字を入力
する。これに応じ第2の文字認識部20は、オペレータ
によって指定された修正文字に対応する辞書に前記誤認
識結果を得る過程で使用した特徴を追加して追加辞書を
作成する(図5のステップS5)。すなわち、この例の
場合では、修正文字がカタカナの「エ」であるので、認
識対象文字の認識過程で抽出され漢字の「工」と誤認識
される原因となった特徴を、カタカナの「エ」の文字の
辞書に追加して追加辞書を作成するのである。また、第
2の文字認識部20は、認識結果記憶部21に記憶され
ている被読取媒体Pの全認識結果中の、誤認識個所42
での認識結果と同じ認識結果を持つ文字パタンを検索す
る(図5のステップS6)。もちろん、ステップS5の
処理とステップS6の処理の順番は上記例の逆に行なっ
ても良く、或は同時に行なっても良い。
【0027】次に、第2の文字認識部20は、誤認識個
所42での認識結果と同じ認識結果を持つ文字パタン
(以下、特定文字のパタンともいう。)について、上記
追加辞書と誤認識結果に対応する文字の辞書との2つの
辞書を用い、文字認識部10の認識部16での手順と同
様な手順で、再度の文字認識をする(図5のステップS
7)。これについて具体的に説明すると、この図7の例
では正式に認識されている漢字の『工』の文字45〜4
8と、本来はカタカナの「エ」と認識されるべきところ
を漢字の「工」と誤認識されている文字41〜44とが
特定文字にあたり、追加の辞書はカタカナの「エ」の文
字用の辞書に誤認識結果の特徴が追加されたものであ
り、誤認識結果に対応する文字の辞書とは漢字の「工」
の文字用の辞書である。このように2つの辞書を用い再
度の文字認識を行なうと、正式に漢字の「工」と認識さ
れている文字パタン45〜48は再度の文字認識におい
ても漢字の「工」の文字用の辞書により認識される確立
が極めて高く、一方、本来はカタカナの「エ」と認識さ
れるべきところを漢字の「工」と認識されている文字パ
タン41〜44は再度の文字認識においてはこの文字パ
タン自体の特徴が追加されている追加辞書により認識さ
れる確立が極めて高くなる。このため、漢字の「工」は
漢字の「工」として、また、漢字の「工」として誤認識
されていたカタカナの「エ」はカタカナの「エ」として
再認識され易くなるのである。
【0028】次に、特定文字の残りが未だあるか否かの
判定がされ(図5のステップS8)、特定文字の残りが
ある場合はステップS7に戻る。特定文字の残りがない
場合すなわち特定文字の再度の文字認識処理が修了した
場合は、追加辞書を初期化する(図5のステップS
9)。なお、この追加辞書の初期化処理を行なうタイミ
ングはこの例に限られない。例えば追加辞書の作成前に
行っても良い。
【0029】また、図7の例では他の文字についての誤
認識はないが、もし他にも誤認識がある場合、オペレー
タは上述の操作を繰り返し(図5ステップS9、S
1)、そして、文字認識装置は自動的に上記同様にこの
他の誤認識についても再度の文字認識処理を実施する
(図5のS2〜S9)。
【0030】上述においてはこの発明の文字認識装置の
実施例について説明したが、この発明は上述の実施例に
限られない。
【0031】例えば、上述の実施例では再度の文字認識
をする必要のある文字が1種すなわち漢字の「工」とし
た例を説明したが、再度の文字認識をする必要のある文
字種が2種以上の場合もこの発明は適用出来る。また、
被読取媒体は複数頁であっても或は1つの媒体上の一部
領域が入力対象の場合でもこの発明は適用出来る。ま
た、オペレータからの指示信号の入力手段としてキボー
ドを用いる例を示したが、入力手段はこれに限られず例
えばマウス等任意好適な他のものでも良い。表示手段も
他の任意の手段例えばプリンタなどとしても良い。
【0032】
【発明の効果】上述した説明から明らかなように、この
発明の文字認識装置によれば、オペレータによって誤認
識と判定された認識結果があった場合に動作し、該オペ
レータによって指定された修正文字に対応する辞書に前
記誤認識結果を得る過程で使用した特徴を追加して追加
辞書を作成し、該追加辞書と該誤認識結果に対応する文
字用の辞書との双方を用い、前記誤認識結果となった文
字および該誤認識結果と同じ認識結果を持つ文字(特定
文字)に再度文字認識処理をし、該再度の文字認識処理
終了後は、前記追加辞書を初期化する、第2の文字認識
部を具えている。このため、オペレータが誤認識文字を
1つ発見するとそれと同じ認識結果となっている文字に
ついて上記所定の2つの辞書による再度の文字認識を自
動的に行なえるので、オペレータの負担を軽減しつつ文
字認識精度を一層向上させることができる。然も、この
再度の文字認識処理は特定文字に対してのみ行われるの
で、再度の文字認識を行う場合も処理時間の増加は少な
くて済む。また、追加辞書はその都度初期化するので、
いま使用している追加辞書が後に再度の文字認識をする
際に悪影響することはない。これらのことから、従来に
比べ簡易にかつ精度良く文字認識が可能な文字認識装置
を提供出来る。
【図面の簡単な説明】
【図1】実施例の文字認識装置の説明図である。
【図2】特徴抽出部の内部構成例を示す図である。
【図3】カタカナの「エ」のサブパタンおよび特徴マト
リクスの説明図である。
【図4】漢字「工」のサブパタンおよび特徴マトリクス
の説明図である。
【図5】第2の文字認識部20の動作説明に供する図で
ある。
【図6】本実施例での被読取媒体を示した図である。
【図7】本実施例における認識結果(ただし、修正や再
度の文字認識前のもの)を示した図である。
【符号の説明】
10:文字認識部 20:第2の文字認識部 21:追加辞書部 22:制御部 23:メモリ

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 文字から文字パタンを得、該文字パタン
    から特徴を抽出し、該抽出した特徴と辞書とを照合して
    前記文字の認識を行なう文字認識部を有する文字認識装
    置において、 オペレータによって誤認識と判定された認識結果があっ
    た場合に動作する第2の文字認識部であって、該オペレ
    ータによって指定された修正文字に対応する辞書に前記
    誤認識結果を得る過程で使用した特徴を追加して追加辞
    書を作成し、該追加辞書と該誤認識結果に対応する文字
    用の辞書との双方を用い、前記誤認識結果となった文字
    および該誤認識結果と同じ認識結果を持つ文字に再度文
    字認識処理をし、該再度の文字認識処理終了後は、前記
    追加辞書を初期化する、第2の文字認識部をさらに具え
    たことを特徴とする文字認識装置。
  2. 【請求項2】 文字から文字パタンを得、該文字パタン
    から特徴を抽出し、該抽出した特徴と辞書とを照合して
    前記文字の認識を行なう文字認識部を有する文字認識装
    置において、 オペレータによって誤認識と判定された認識結果があっ
    た場合に動作する第2の文字認識部であって、 該オペレータによって指定された修正文字に対応する辞
    書に前記誤認識結果を得る過程で使用した特徴を追加し
    て作成され、再度の文字認識終了後に初期化される追加
    辞書と、 該追加辞書および前記誤認識結果に対応する文字用の辞
    書との双方を用い、前記誤認識結果となった文字および
    該誤認識結果と同じ認識結果を持つ文字に再度文字認識
    処理をする制御部とを具える第2の文字認識部をさらに
    具えたことを特徴とする文字認識装置。
JP7037419A 1995-02-24 1995-02-24 文字認識装置 Withdrawn JPH08235304A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7037419A JPH08235304A (ja) 1995-02-24 1995-02-24 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7037419A JPH08235304A (ja) 1995-02-24 1995-02-24 文字認識装置

Publications (1)

Publication Number Publication Date
JPH08235304A true JPH08235304A (ja) 1996-09-13

Family

ID=12497012

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7037419A Withdrawn JPH08235304A (ja) 1995-02-24 1995-02-24 文字認識装置

Country Status (1)

Country Link
JP (1) JPH08235304A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0955600A2 (en) * 1998-05-07 1999-11-10 International Business Machines Corporation Process and equipment for recognition of a pattern on an item presented

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0955600A2 (en) * 1998-05-07 1999-11-10 International Business Machines Corporation Process and equipment for recognition of a pattern on an item presented
DE19820353A1 (de) * 1998-05-07 1999-11-11 Ibm Verfahren und Vorrichtung zur Erkennung eines Musters auf einer Vorlage
DE19820353C2 (de) * 1998-05-07 2001-06-13 Ibm Verfahren und Vorrichtung zur Erkennung eines Musters auf einer Vorlage
EP0955600A3 (en) * 1998-05-07 2002-06-12 International Business Machines Corporation Process and equipment for recognition of a pattern on an item presented

Similar Documents

Publication Publication Date Title
US5764799A (en) OCR method and apparatus using image equivalents
EP0163377B1 (en) Pattern recognition system
US5410611A (en) Method for identifying word bounding boxes in text
JPH05242292A (ja) 分離方法
US7088873B2 (en) Bit-mapped image multi-stage analysis method
JP2000315247A (ja) 文字認識装置
EP2138959B1 (en) Word recognizing method and word recognizing program
JPH08235304A (ja) 文字認識装置
JPH08235303A (ja) 文字認識装置
JP3457376B2 (ja) 光学式読み取り装置における文字修正方法
JPH0728935A (ja) 文書画像処理装置
JP3074691B2 (ja) 文字認識装置
KR100332752B1 (ko) 문자인식방법
JP2000322514A (ja) パターン抽出装置及び文字切り出し装置
JPH07319880A (ja) キーワード抽出・検索装置
JP2002207960A (ja) 認識文字修正方法及び認識文字修正プログラム
JPH08161426A (ja) 手書き文字ストローク切出し装置
JP2963474B2 (ja) 類似文字識別方法
JP3419418B2 (ja) 文字読取方法および装置
JP3151866B2 (ja) 英文字認識方法
JP2002074262A (ja) 認識文字修正方法
JP2001297306A (ja) 文字認識装置
JPH0934987A (ja) 文字認識結果修正方法および文字認識装置
JPH05298488A (ja) 光学的文字読取装置
JPH1021337A (ja) 文字認識装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20020507