JP3481850B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP3481850B2
JP3481850B2 JP04183298A JP4183298A JP3481850B2 JP 3481850 B2 JP3481850 B2 JP 3481850B2 JP 04183298 A JP04183298 A JP 04183298A JP 4183298 A JP4183298 A JP 4183298A JP 3481850 B2 JP3481850 B2 JP 3481850B2
Authority
JP
Japan
Prior art keywords
dictionary
character
recognition
result
recognizing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP04183298A
Other languages
English (en)
Other versions
JPH11238101A (ja
Inventor
保直 伊崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Ltd
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, Fujitsu Frontech Ltd filed Critical Fujitsu Ltd
Priority to JP04183298A priority Critical patent/JP3481850B2/ja
Publication of JPH11238101A publication Critical patent/JPH11238101A/ja
Application granted granted Critical
Publication of JP3481850B2 publication Critical patent/JP3481850B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力文字列、特に
住所文字列の下位部分、具体的には丁目、番地、号、部
屋番号など、数字文字列で記入される部分を高精度で認
識する文字認識装置に関する。近年、文字認識装置の適
用分野が広まるに伴って、文字認識装置は様々な業務に
使われてきている。例えば、申込書のように不特定記入
者が手書き漢字で記入するような場合が増えてきてい
る。そこでは漢字に記入されるため漢字を含む3000
字種以上の文字を認識する必要があり、住所の知識処理
が適用しにくい数字の文字列を高精度で認識することが
必要になってきている。
【0002】
【従来の技術】従来の文字認識装置としては、例えば図
23に示すようなものがある。図23において、まず、
入力の文字列aはイメージメモリ101内に格納され
る。次に、定義体メモリ102内に格納された予め定義
体と呼ばれる、認識対象の入力文字列aが記入される文
字枠の帳票上の位置座標が格納された情報によって記入
された文字を文字切り出し部103で1文字ずつ検出、
切り出してそれを1文字ずつ認識して候補文字を出力す
る。住所の場合だと住所単語を使った知識処理をこれら
の候補文字にかける処理が知識処理部104で一般に行
なわれている。この中の1文字の認識は次のように行な
われる。多数の不特定の筆記者により予め決められた書
式に従って記入された文字を収集し、この文字から認識
方式に依存する特徴を特徴抽出部105を抽出し、統計
的な手法等により標準パターンを作成する。例えば、標
準パターンは収集した文字から平均パターンとして作成
されることもある。手書き文字の場合には、記入者によ
り大きな字形変形が生じるため各字種に複数の標準パタ
ーンを持つ。通常一つのパターンをテンプレートと呼
び、これらを格納する辞書106が複数テンプレート辞
書である。一般に住所のような漢字を含む文字列を認識
する場合3000字種以上の字種が辞書106に格納さ
れている。辞書照合方法は、入力文字列aから切り出し
た一文字から特徴を抽出し、この特徴と標準パターンの
辞書106とのあいだでマッチング部107により類似
度計算あるいは距離計算を行い、最大の類似度をもつカ
テゴリあるいは最小の距離となるテンプレートのカテゴ
リを認識結果としている。候補文字は距離の小さい順に
例えば8位までをとって候補文字列としている。
【0003】マッチング部107でマッチングして得ら
れた候補文字列は、候補文字列バッファメモリ108内
に格納される。次に、前記知識処理部104による知識
処理は記入文字列とその候補文字列を対象として、知識
処理対象の知識辞書109の単語文字列がその候補文字
列の中に存在するかどうかを照らし合わせて候補の順位
などで得点をつけて最も妥当な単語を知識処理結果とす
ることで行なわれる。
【0004】認識結果は、認識結果メモリ110内に格
納される。なお、103〜105,107で示す各部は
ソフトウェアによる処理を示し、101,102,10
6,108〜110で示すものはハードウェアよりな
る。
【0005】
【発明が解決しようとする課題】このような従来の文字
認識装置にあっては、住所文字列を認識する場合、住所
単語を知識辞書として持ち認識候補文字列と照らし合わ
せて最も確からしい住所単語を認識結果としている。し
かし次のような問題点があった。第1の問題点は住所単
語としてもてるのは丁目番地の直前までの住所文字列で
あり、丁目番地以降の数字文字列は単語辞書としてもつ
ことはない。この理由は数字文字列は組み合わせとして
いくらでも作ることができ、例えば4桁の数字文字列で
は1111から9999までありうる。
【0006】また第2の問題点は数字文字列を単語とし
て全て持ったとして知識処理をかけた場合、数字の個々
の認識精度が高くなければ結果的にどれかの数字文字列
ともマッチングしてしまい誤った数字文字列となってし
まうことになりやすい。第2の問題点は1文字を認識す
る方法と関係があり、認識処理は標準パターンからなる
辞書とマッチングするわけであるが辞書の容量が大きく
なればなるほど認識処理に時間がかかり、現実に装置と
して実現するには容量に制限が加わる。容量一定と考え
た場合、認識する対象の字種が多いほど1字種当たりの
容量は少なくなり文字の変形の多様性を反映できなくな
る。これは具体的にはテンプレート数が少なくなること
に相当する。逆に認識対象字種が少ないほど1字種当た
りの辞書容量を増やすことができ文字の変形の多様性を
反映できる。
【0007】これらの結果、住所文字列を認識する場
合、3000字種もの辞書で文字列の最初から最後まで
認識すると知識処理のきかない数字文字列部分の認識精
度が相対的に低くなってしまう。本発明は、このような
従来の問題点に鑑みてなされたものであって、住所など
の下位部分の数字文字列を高い精度で認識することがで
きる文字認識装置を提供することを目的とする。
【0008】
【課題を解決するための手段】この目的を達成するため
に、本発明は、次のように構成する(図1、参照)。請
求項1の発明は、全認識対象字種を格納した第1辞書1
2を用いて入力文字列を認識して候補文字列を求める文
字認識装置において、数字だけを認識するための数字字
種を格納した第2辞書13と、英数カナだけを認識する
ための英数カナ字種を格納した第3辞書14と、第1の
辞書〜第3辞書12〜14を用いて入力文字列を認識処
理した後に第2辞書13で認識した結果と第3辞書14
で認識した結果が認識可能であったか認識不能であった
かを判別する判別手段20と、認識可能であったとき両
認識結果を比較する比較手段21と、該比較手段21で
比較した比較結果が一致したとき、前記第1辞書12で
認識した結果を該比較結果で置き換える置き換え手段2
2と、を備える。
【0009】請求項2の発明は、全認識対象字種を格納
した第1辞書12を用いて入力文字列を認識して候補文
字列を求める文字認識装置において、数字だけを認識す
るための数字字種を格納した第2辞書13と、英数カナ
だけを認識するための英数カナ字種を格納した第3辞書
14と、第1の辞書〜第3辞書12〜14を用いて入力
文字列を認識処理した後に第2辞書13で認識した結果
と第3辞書14で認識した結果が認識可能であったか認
識不能であったかを判別する判別手段20と、認識可能
であったとき両認識結果を比較する比較手段21と、前
記第1辞書12で認識した候補文字に数字が現われたと
き、該比較手段21で比較した比較結果が一致した場合
には、1番上位に現われた候補文字の数字を該比較結果
で置き換え、前記1番上位に現われた数字で下位の数字
を置き換える置き換え手段と、を備える。
【0010】請求項3の発明は、全認識対象字種を格納
した第1辞書12を用いて入力文字列を認識して候補文
字列を求める文字認識装置において、数字だけを認識す
るための数字字種を格納した第2辞書13と、英数カナ
だけを認識するための英数カナ字種を格納した第3辞書
14と、最初に第2辞書13と第3辞書14を用いて数
字および英数カナの認識処理を行った後に第2辞書13
で認識した結果と第3辞書14で認識した結果が認識可
能であったか認識不能であったかを判別する判別手段
と、認識可能であったとき両認識結果を比較する比較手
段と、該比較手段で比較した比較結果が一致しないと
き、第1辞書で認識し候補文字列を求め、比較結果が一
致したときはその比較結果を候補文字列の1位に設定す
る設定手段と、を備える。
【0011】請求項4の発明は、請求項1,2記載の文
字認識装置において、前記第2辞書13および第3辞書
14による両認識結果が認識可能であって一致するが前
記第1辞書12の認識結果とは一致しないときは、該当
する入力文字パターンを前記第1辞書12に追加する辞
書追加手段を設けた。このような構成を備えた本発明に
よれば、第1の辞書〜第3の辞書12〜14を用いて入
力文字列を認識処理した後に第2辞書13で認識した結
果と第3辞書14で認識した結果が認識可能であったか
認識不能であったかを判別し、認識可能であったとき両
認識結果を比較し、比較結果が一致したとき、第1辞書
12で認識した結果を比較結果で置き換えるので、入力
文字列、特に住所文字列の丁目、番地、号、部屋番号な
どの数字文字列を高精度で認識することができる。
【0012】また、第1辞書で認識した候補文字に数字
が現われたとき、比較結果が一致した場合には1番上位
に現われた候補文字の数字を比較結果で置き換え、1番
上位に現われた数字で下位の数字に置き換えるので、前
記と同様に住所文字列の数字文字列を高精度で認識する
ことができる。また、最初に第2辞書13と第3辞書1
4を用いて数字および英数カナの認識処理を行った後に
第2辞書13で認識した結果と第3辞書14で認識した
結果とを比較し、比較結果が一致しないとき、第1辞書
12で認識し候補文字列を求め、比較結果が一致したと
きはその比較結果を候補文字列の1位に設定する場合に
も、前記と同様な効果を得ることができる。
【0013】また、第2辞書13および第3辞書14に
よる両認識結果が認識可能であって一致するが、第1辞
書12の認識結果とは一致しないときは、該当する入力
文字パターンを第1辞書12に追加するので、全字種を
認識するための第1辞書12による認識精度を高めるこ
とができる。
【0014】
【発明の実施の形態】図2は本発明の第1の実施形態を
示す全体構成図である。図2において、aは帳票に記入
された入力文字列、例えば、住所文字列であり、入力文
字列aは、スキャナ(図外)により読み取られてイメー
ジメモリ1内に格納される。入力文字列aは定義体メモ
リ2内に格納された定義体を参照して文字切り出し部3
により一文字ずつ切り出される。
【0015】定義体は、手書き、活字、字種の指定、読
取り領域(行位置、フィールド左右端位置)の指定、知
識処理の指定を行う。例えば、図3に示すように、例え
ば、OMRマーク領域4、イメージ読取り領域5、クリ
アエリア6、手書き文字枠7、活字文字枠8、IDフィ
ールド9などの指定、行マーク10で示す行位置などの
指定を行う。文字切り出し部3で切り出された文字は、
特徴抽出部11により特徴を抽出する。
【0016】12は第1辞書であり、第1辞書12内に
は住所文字列において、全字種を認識するために、約3
000の字種が予め格納されている。第1辞書12には
字種ごとに複数のテンプレートが格納されている。13
は第2辞書であり、第2辞書13内には数字だけを認識
するために、字種としての数字文字が予め格納されてい
る。14は第3辞書であり、第3辞書14内には英数カ
ナだけを認識するために字種としての英数カナ文字が予
め格納されている。
【0017】マッチング部15は特徴抽出部11で抽出
した特徴から全文字種を認識するための第1辞書12を
用いて認識を行い、候補文字列を求める。すなわち、マ
ッチング部15は、抽出した特徴と第1辞書12とのあ
いだで類似度計算または距離計算を行い、最大の類似度
をもつカテゴリまたは最小の距離となるテンプレートの
カテゴリを認識結果として候補文字列とする。また、同
様に数字だけを認識するための第2辞書13を用いて認
識を行い、数字の認識結果を求める。また、同様に英数
カナだけを認識するための第3辞書14を用いて認識を
行い、英数カナの認識結果を求める。
【0018】第1辞書12を用いて全字種の認識を行っ
て求めた候補文字列は、第1辞書候補列バッファメモリ
16内に格納される。第2辞書13を用いて数字の認識
を行って求めた認識結果は、第2辞書結果バッファメモ
リ17内に格納される。第3辞書14を用いて英数カナ
の認識を行って求めた認識結果は、第3辞書結果バッフ
ァメモリ18内に格納される。
【0019】認識結果修正部19は、第1,2,3辞書
12,13,14を使った認識結果から判断し、第1辞
書12を使った候補文字列を修正する。数字を認識する
場合、第1辞書12を使って認識するより第2,第3辞
書13,14を使ったほうが認識精度は高いし、また認
識対象以外の文字パターン、すなわち第2辞書13では
数字以外、第3辞書14では英数カナ以外の文字は認識
不能(リジェクト)となる可能性が高いため、第2,第
3結果が一致して認識不能ではないとき、この結果は第
1辞書12を使って認識した結果の数字よりも精度が高
くなる。
【0020】認識結果修正部19は、図4に示すよう
に、判別手段としての判別部20、比較手段としての比
較部21および置き換え手段としての置き換え部22に
より構成される。判別部20は第1辞書〜第3辞書1
2,13,14を用いて入力文字列aを認識処理した後
に第2辞書13で認識した結果と第3辞書14で認識し
た結果が認識可能であったか認識不能であったかを判別
する。比較部21は認識可能であったとき両認識結果を
比較する。置き換え部22は比較部21で比較した比較
結果が一致したとき、第1辞書12で認識した結果を比
較結果で置き換える。
【0021】知識処理部23は、住所単語を格納した知
識辞書24を用いて、修正された候補文字列に知識処理
を施し、最も妥当な単語を知識処理結果とする。この知
識処理結果は、認識結果として認識結果メモリ25内に
格納される。なお、3,11,15,19,23で示す
各部はソフトウェアによる処理を示し、1,2,12〜
14,16〜18,24,25で示すものは、ハードウ
ェアよりなる。
【0022】図5は入力文字列と候補文字列の例を示す
図である。図5において、入力文字列aは、例えば「ア
パート17」であるとする。この入力文字列aを文字切
り出し部3により文字切り出しを行い、特徴抽出部11
で特徴を抽出し、マッチング部15により全文字種を認
識するための第1辞書12を用いて認識処理を行うこと
で、候補文字列bが8位まで求められる。求めた候補文
字列bは、第1辞書候補列バッファメモリ16内に格納
される。候補文字列bは1位は例えば「アパート1ク」
であり、候補文字列bの最後の文字cが「ク」になって
おり、入力文字列aの最後の文字「7」と一致しない。
【0023】図6は第2,第3辞書13,14による認
識結果を示す。図6において、数字だけを認識する第2
辞書13を用いて入力文字列aを一文字ごとに認識した
認識結果dは、例えば「???417」となる。この認
識結果dのうちの「?」は認識結果dが認識不能であっ
たことを示している。英数カナだけを認識する第3辞書
14を用いて入力文字列aを一文字ごとに認識した認識
結果eは、例えば「ア?ート17」となる。この認識結
果eのうちの「?」は認識結果eが認識不能であったこ
とを表わしている。認識結果dと認識結果eを比較し、
一致すれば、一致した数字を1位の候補文字列bに置き
換える。候補結果dと認識結果eを比較すると「17」
が一致しているので、「17」を1位の候補文字列bに
置き換える。この場合、元の候補文字列bの順位を1つ
下へ移動する。この際1位に入れた結果と同じものが候
補文字列bにあればそれを取り除く。候補文字列bの一
位は、「アパート17」となり、入力文字列aと同じに
なる。図5の候補文字列bの最後の文字「ク7フタグタ
フラ」は、図7のfに示すように「7クフタグタフラ」
に変更される。
【0024】図8は図2の動作を説明するフローチャー
トである。図8において、まず、ステップS1で第1辞
書12で入力文字列を認識し、候補文字列を求める。例
えば、入力文字列が図5のaに示すように、「アパート
17」であるとき、第1辞書12により図5のbに示す
ように、1位から8位までの候補文字列を求めて第1辞
書候補列バッファメモリ16に格納する。
【0025】次に、ステップS2で第2辞書13を用い
て数字だけを認識し、認識結果を求める。例えば、入力
文字列が図5のaに示すように「アパート17」である
とき、第2辞書13を用いた認識結果は、図6のdに示
すように「???417」となり、これらが第2辞書結
果バッファメモリ17内に格納される。次に、ステップ
S3で第3辞書14を用いて英数カナだけを認識し、認
識結果を求める。例えば、入力文字列が図5のaに示す
ように「アパート17」であるとき、第3辞書14を用
いた認識結果は、図6のeに示すように「ア?ート1
7」となり、これらが第3辞書結果バッファメモリ18
内に格納される。
【0026】次に、ステップS4で第2辞書13による
認識結果が認識不能であったかを判別する。認識不能で
あったときは、ステップS8に進み、認識可能であった
ときは、ステップS5に進む。図6の認識結果dは最初
の3文字は「?」であるから、認識不能であり、残りの
3文字「417」は認識可能である。次に、ステップS
5で第3辞書14による認識結果が認識不能であったか
を判別する。認識不能であったときは、ステップS8に
進み、認識可能であったときは、ステップS6に進む。
図6の認識結果eは、2番目の文字が「?」で認識不能
であり、残りの文字は「アート17」で認識可能であ
る。
【0027】次に、ステップS6で第2辞書13による
認識結果と第3辞書14による認識結果を比較し、一致
しているか判別する。第2辞書13による数字だけの認
識結果dは、「???417」であり、第3辞書14に
よる英数カナだけの認識結果eは、「ア?ート17」で
あり、5番目と6番目の文字「17」が一致し、他は一
致していない。一致しているときは、ステップS7に進
み、一致していないときは、ステップS8に進む。
【0028】ステップS7では、一致している5番目の
文字が「1」のときは、候補文字列bの5番目の文字が
「1」であり、同じであるから、置き換えずに、「1」
を残す。一致している6番目の文字が「7」のときは、
候補文字列bの6番目の第1の文字「ク」に一致した認
識結果dに「7」を入れ、候補文字列bを順次下位に1
つ移動させる。図7に示すように、2位には「ク」が入
り、その際、認識結果dの「7」と同じものがあれば取
り除く。
【0029】次に、ステップS8で入力文字列の文字数
分一文字ごとに前記処理を繰り返して行い、最後の文字
の処理が終了していないときは、ステップS4に戻り、
最後の文字を処理して終了とする。こうして、修正され
た候補文字列bとして例えば「アパート17」が得られ
る。この修正した候補文字列bは、入力文字列aと一致
している。このように、入力文字列aが住所文字列のと
き、丁目、番地、号、部屋番号などの数字文字列を高精
度に認識することができる。
【0030】図9は本発明の第2の実施形態に係る認識
結果修正部を示す図である。本発明の第2の実施形態に
おいては、図2の認識結果修正部19の代りに、図9の
認識結果修正部19Aを用いる。その他の構成は図2と
同様である。図9において、第2の実施形態に係る認識
結果修正部19Aは、判別手段としての判別部20、比
較手段としての比較部21および置き換え手段としての
第2の置き換え部22Aにより構成される。
【0031】比較部21は、第1辞書〜第3辞書12,
13,14を用いて入力文字列aを認識処理した後に第
2辞書13で認識した結果と第3辞書で認識した結果が
認識可能であったか認識不能であったかを判別する。比
較部21は認識可能であったとき両認識結果を比較す
る。第2の置き換え部22Aは第1辞書12で認識した
候補文字に数字が現われたとき、比較部21で比較した
比較結果が一致した場合には1番上位に現われた候補文
字の数字を得られた比較結果で置き換え、1番上位に現
われた数字で下位の数字を置き換える。
【0032】図10に示すように、1位から5位まで
「9クフ7タ」という候補文字があったとき、候補文字
の中の数字を入れ換える。比較部21で比較して得られ
た比較結果が「7」のとき、候補文字の中の1位の数字
「9」については「7」を入れ、4位の「7」は1位で
あった「9」を入れる。したがって、1位の候補文字列
bは「アパート17」になる。
【0033】図11は本発明の第2の実施形態の動作を
説明するフローチャートである。
【0034】本フローチャートは、第1の実施形態の動
作を説明する図8のフローチャートとは、ステップS7
がステップ7Aに変わっているだけで他のステップS1
〜S6,S8は同じである。ステップS7Aにおいて
は、比較結果が一致したとき、候補文字列bの中の数字
について、一致した結果を1番上位に入れ、候補文字の
一番上位の数字を下位の数字の位置へ移す。図10に示
すように、1位から5位の候補文字「9クフ7タ」を
「7クフ9タ」に修正する。本実施形態においても、求
めた候補文字列bは入力文字列a、特に住所文字列の丁
目、号、部屋番号などの数字文字列を精度よく認識する
ことができる。
【0035】図12は本発明の第3の実施形態を示す全
体構成図である。図12において、本発明の第1の実施
形態を示す図2に対して、認識処理順制御部26が設け
られ、また、図2の認識結果修正部19とは内容が異な
る認識結果修正部19Bをもつ。認識処理順制御部26
は、最初に第2辞書13と第3辞書14を用いて数字お
よび英数カナの認識処理を行うように認識処理順を制御
する。また、第2辞書13による認識結果dと第3辞書
14による認識結果eが一致しないときは、第1辞書1
2を用いて認識処理を行い、候補文字列bを求める。
【0036】認識結果修正部19Bは、図13に示すよ
うに、判別手段としての判別部20と、比較手段として
の比較部21と、設定手段としての設定部27により構
成される。判別部20は、第2辞書13で認識した結果
と第3辞書14で認識した結果が認識可能であったか認
識不能であったかを判別する。
【0037】比較部21は認識可能であったとき第2辞
書13で認識した結果と第3辞書14で認識した結果と
を比較する。設定部27は比較部21で比較した比較結
果が一致しないとき、第1辞書12で認識し候補文字列
bを求め、比較結果が一致したときはその比較結果を候
補文字列bの1位に設定する。
【0038】図14は図12の動作を説明するフローチ
ャートである。図14において、まず、ステップS11
で第2辞書13を用いて入力文字列aを認識処理し、数
字の認識結果dを求める。次に、ステップS12で第3
辞書14を用いて入力文字列aを認識処理し、英数カナ
の認識結果eを求める。次に、ステップS12Aで第2
辞書13による認識結果dが認識不能であったかを判別
し、認識不能であったときはステップS14に進み、認
識可能であったときはステップS12Bに進む。次に、
ステップS12Bで第3辞書14による認識結果eが認
識不能であったかを判別し、認識不能であったときはス
テップS14に進み、認識可能であったときはステップ
S13に進む。
【0039】次に、ステップS13で第2辞書13によ
る認識結果dと第3辞書14による認識結果eとを比較
し、一致しないときは、ステップS14に進み、一致し
たときはステップS15に進む。比較した結果が一致し
ないときは、ステップS14で第1辞書12を用いて入
力文字列aを全字種について認識処理し、候補文字列b
を求め、ステップS17に進む。
【0040】第2辞書13による認識結果dおよび第3
辞書14による認識結果eが図6に示すようなものであ
るとすると、第1番目の文字から第4番目の文字まで不
一致であるから、図5の候補文字列bの1位では、第1
番目から第4番目の文字の候補文字列は「アパート」に
なる。比較した結果が一致したときは、ステップS15
で一致した認識結果dを候補文字列bの1位とする。
【0041】図6に示すように、認識結果dと認識結果
eを比較すると、第5番目の「1」と、第6番目の
「7」が一致するから、「17」を候補文字列bの1位
とする。したがって、1位の候補文字列bとしては、
「アパート17」が求められる。次に、ステップS16
で第1辞書12で全字種について認識処理を行い、2位
以降の候補とする。例えば、図5の5番目と6番目の文
字で示すように、「17」、「メフ」、「ヅタ」、「ヅ
グ」、「メタ」、「ブフ」、「ブラ」が第2位〜第8位
の候補文字となる。次に、ステップS17で入力文字列
aの文字数分繰り返して前記のような処理を行い、すべ
ての文字の処理が終了するまで処理を行う。本実施形態
においても、前記実施形態と同様に入力文字列a、特に
住所文字列の丁目、番地、号、部屋番号などの数字文字
列を精度良く認識することができる。
【0042】図15は本発明の第4の実施形態を示す全
体構成図である。図15において、本発明の第1の実施
形態を示す図2に対して、特徴バッファメモリ28と、
辞書追加手段としての辞書追加部29が設けられてい
る。認識結果修正部19において、第2辞書13による
数字の認識結果dと第3辞書14による英数カナの認識
結果eとが一致し、全字種の第1辞書12による最上位
の数字候補が一致しないとき、特徴抽出部11で抽出し
たその該当文字パターンを特徴バッファメモリ28に格
納し、辞書追加部29により、格納した該当文字パター
ンを第1辞書12に追加する。
【0043】図16に示すように、例えば第1辞書12
の字種xがテンプレート1,2,3よりなるとき、数
字、英数カナだけを認識したとき、認識結果が一致し、
全字種の第1辞書12で認識したとき最上位の数字候補
と一致しないとき、その該当文字を特徴抽出部11で抽
出した該当文字パターンとして特徴バッファメモリ28
に格納し、これを字種xのテンプレート4として第1辞
書12に追加する。
【0044】図17は図15の動作を説明するフローチ
ャートである。図17において、ステップS21で第2
辞書13による認識結果dは認識不能であったか判別す
る。認識不能であったときは、処理を終了とし、認識可
能であったときは、ステップS22に進む。ステップS
22では、第3辞書14による認識結果eは、認識不能
であったか判別し、認識不能であったときは、処理を終
了とし、認識可能であったときは、ステップS23に進
む。ステップS23では第2辞書13による認識辞書d
と第3辞書14による認識結果eとを比較し、等しいか
判別する。等しいときは処理を終了とし、等しくないと
きはステップS25に進む。
【0045】ステップS25では、第2辞書13による
認識結果dと第3辞書14による認識結果eが等しい
が、第1辞書12による認識結果とは等しくないときの
当該文字の特徴を特徴抽出部11で抽出して、特徴バッ
ファメモリ28に格納し、格納した当該文字パターンを
辞書追加部29により第1辞書12に追加する。例え
ば、図16に示すように、字種xとして数字「7」のテ
ンプレート1,2,3が第1辞書12に格納されている
とき、特徴バッファメモリ28に格納された当該文字パ
ターンを字種「7」のテンプレート4として第1辞書1
2に格納する。
【0046】このように、本実施形態においては、全字
種の第1辞書12で正しく認識できなかった数字文字を
追加することができ、第1辞書12による数字文字の認
識精度をさらに高めることができる。図18は本発明の
第5の実施形態を示す全体構成図である。図18におい
て、図15に対して、蓄積処理手段としての蓄積処理部
30、蓄積バッファメモリ31およびパターン作成手段
としてのパターン作成部32が追加して設けられてい
る。その他の構成は、図15と同様になっている。
【0047】蓄積処理部30は、認識結果修正部19に
おいて、第2,第3辞書13,14による認識結果が認
識可能であって、第2辞書13による認識結果dと第3
辞書14による認識結果eが等しく、第1辞書12によ
る認識結果が等しくないとき、文字パターンが格納され
ている特徴バッファメモリ28から当該文字パターンを
取り出して、所定数、例えば10文字になるまで蓄積バ
ッファメモリ31に蓄積処理する。例えば図19に示す
ように、蓄積バッファメモリ31には1字種で10文字
パターンになるまで、蓄積する。パターン作成部32
は、蓄積された文字パターンが所定数になると、各字種
ごとに平均パターンを作成し、辞書追加部29により、
作成された平均パターンを字種ごとに第2辞書12に追
加する。
【0048】図20は図18の動作を説明するフローチ
ャートである。図20のフローチャートは、図17のフ
ローチャートに対して、ステップS24Aおよびステッ
プS24Bが追加して設けられており、他のステップS
21〜24,ステップS25は同じになっている。ステ
ップS24Aでは、第2,第3辞書13,14による認
識結果d,eが認識可能であって、両者を比較した比較
結果が等しいが、第1辞書12による認識結果とは等し
くないときは、特徴を抽出して当該文字パターンを字種
ごとに蓄積バッファメモリ31に蓄積しておく。
【0049】次に、ステップS24Bで蓄積バッファメ
モリ31に蓄積した文字パターンが、図19に示すよう
に、例えば一字種ごとに10文字パターンになったら、
パターン作成部32により平均を作成し、ステップS2
5で作成した平均パターンを辞書追加部29により第1
辞書12に追加する。このように、第5の実施形態にお
いては、全字種の第1辞書12で正しく認識できなかっ
た数字文字を第2辞書12に追加するとき、該当文字パ
ターンを所定数になるまで蓄積しておいて平均パターン
を作成して追加するため、追加する文字パターンの精度
を高めることができ、その結果、数字文字をさらに精度
良く認識することができる。
【0050】図21は本発明の第6の実施形態を示す全
体構成図である。図21において、本発明の第4の実施
形態を示す図15に対して、入力処理手段としての表示
入力処理部33が追加して設けられている。その他の構
成は、図15と同様になっている。表示入力処理部33
は、追加する該当文字を表示部34に表示し、オペレー
タが入力部35から追加を指示したときは、辞書追加部
29で該当文字パターンを第1辞書12に追加するよう
に入力処理する。
【0051】図22は図21の動作を説明するフローチ
ャートである。図22のフローチャートは、図17のフ
ローチャートに対して、ステップS24Cおよびステッ
プS24Dが追加して設けられており、その他のステッ
プS21〜24、ステップS25は同様になっている。
ステップS24Cでは、認識結果メモリ25内に認識結
果が得られた後に、認識結果修正部19による修正があ
るとき、特徴バッファメモリ28の文字パターンを表示
入力処理部33により表示部34に表示する。この際、
特徴バッファメモリ28には判断を容易にするために、
文字切り出し部3によって切り出された文字パターンも
格納してある。
【0052】次に、ステップS24Dでオペレータは表
示部34に表示された文字パターンを見て辞書に追加す
るか否かを判断し、追加するときは入力部35から追加
を指示する。入力部35からの追加指示によりステップ
S25で表示入力処理部33は辞書追加部29で第1辞
書12への文字パターンを追加するように入力処理す
る。
【0053】第6の実施形態においては、第1辞書12
への追加を表示入力処理部33を通じてオペレータが指
示するため、追加する文字パターンの精度がさらに良く
なり、数字文字列をさらに精度良く認識することができ
る。
【0054】
【発明の効果】以上説明してきたように、本発明によれ
ば、第1辞書〜第3辞書を用いて入力文字列を認識処理
した後に第2辞書で認識した結果と第3辞書で認識した
結果が認識可能であったか認識不能であったかを判別
し、認識可能であったとき両認識結果を比較し、比較結
果が一致したとき、第1辞書で認識した結果を比較結果
で置き換えるため、入力文字列、特に住所文字列の丁
目、番地、号、部屋番号などの数字文字列を高精度で認
識することができる。
【0055】また、第1辞書で認識した候補文字に数字
が現われたとき、比較結果が一致した場合には、1番上
位に現われた候補文字の数字を比較結果で置き換え、1
番上位に現われた数字で下位の数字を置き換えるため、
前記と同様に住所文字列の数字文字列を高精度で認識す
ることができる。また、最初に第2辞書と第3辞書を用
いて数字および英数カナの認識処理を行った後に第2辞
書で認識した結果と第3辞書で認識した結果とを比較
し、比較結果が一致しないとき、第1辞書で認識し候補
文字列を求め、比較結果が一致したときはその比較結果
を候補文字列の1位に設定する場合にも、前記と同様な
効果を得ることができる。
【0056】また、第2辞書および第3辞書による両認
識結果が認識可能であって一致するが、第1辞書の認識
結果とは一致しないときは、該当する入力文字パターン
を第1辞書に追加するため、全字種を認識するための第
1辞書による認識精度を高めることができる。
【図面の簡単な説明】
【図1】本発明の原理説明図
【図2】本発明の第1の実施形態を示す全体構成図
【図3】定義体の説明図
【図4】認識結果修正部の構成例を示す図
【図5】入力文字列と候補文字列の例を示す図
【図6】第2,第3辞書による認識結果の例を示す図
【図7】修正された候補文字列の例を示す図
【図8】図2の動作を説明するフローチャート
【図9】本発明の第2の実施形態に係る認識結果修正部
の例を示す図
【図10】修正された候補文字の例を示す図
【図11】本発明の第2の実施形態の動作を説明するフ
ローチャート
【図12】本発明の第3の実施形態を示す全体構成図
【図13】図13の認識結果修正部の構成例を示す図
【図14】図13の動作を説明するフローチャート
【図15】本発明の第4の実施形態を示す全体構成図
【図16】第1辞書への追加の説明図
【図17】図16の動作を説明するフローチャート
【図18】本発明の第5の実施形態を示す全体構成図
【図19】蓄積バッファメモリの格納例を示す図
【図20】図19の動作を説明するフローチャート
【図21】本発明の第6の実施形態を示す全体構成図
【図22】図22の動作を説明するフローチャート
【図23】従来例を示す図
【符号の説明】
1:イメージメモリ 2:定義体メモリ 3:文字切り出し部 4:OMRマーク領域 5:イメージ読取り領域 6:クリアエリア 7:手書き文字枠 8:活字文字枠 9:IDフィールド 10:行マーク 12:第1辞書 13:第2辞書 14:第3辞書 15:マッチング部 16:第1辞書候補列バッファメモリ 17:第2辞書結果バッファメモリ 18:第3辞書結果バッファメモリ 19,19A,19B:認識結果修正部 20:判別部(判別手段) 21:比較部(比較手段) 22:置き換え部(置き換え手段) 22A:第2の置き換え部(置き換え手段) 23:知識処理部 24:知識辞書 25:認識結果メモリ 26:認識処理順制御部 27:設定部(設定手段) 28:特徴バッファメモリ 29:辞書追加部(辞書追加手段) 30:蓄積処理部(蓄積処理手段) 31:蓄積バッファメモリ 32:パターン作成部(パターン作成手段) 33:表示入力処理部(表示入力処理手段) 34:表示部 35:入力部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/76

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】全認識対象字種を格納した第1辞書を用い
    て入力文字列を認識して候補文字列を求める文字認識装
    置において、 数字だけを認識するための数字字種を格納した第2辞書
    と、 英数カナだけを認識するための英数カナ字種を格納した
    第3辞書と、 第1の辞書〜第3辞書を用いて入力文字列を認識処理し
    た後に第2辞書で認識した結果と第3辞書で認識した結
    果が認識可能であったか認識不能であったかを判別する
    判別手段と、 認識可能であったとき両認識結果を比較する比較手段
    と、 該比較手段で比較した比較結果が一致したとき、前記第
    1辞書で認識した結果を該比較結果で置き換える置き換
    え手段と、を備えたことを特徴とする文字認識装置。
  2. 【請求項2】全認識対象字種を格納した第1辞書を用い
    て入力文字列を認識して候補文字列を求める文字認識装
    置において、 数字だけを認識するための数字字種を格納した第2辞書
    と、 英数カナだけを認識するための英数カナ字種を格納した
    第3辞書と、 第1の辞書〜第3辞書を用いて入力文字列を認識処理し
    た後に第2辞書で認識した結果と第3辞書で認識した結
    果が認識可能であったか認識不能であったかを判別する
    判別手段と、 認識可能であったとき両認識結果を比較する比較手段
    と、 前記第1辞書で認識した候補文字に数字が現われたと
    き、該比較手段で比較した比較結果が一致した場合に
    は、1番上位に現われた候補文字の数字を該比較結果で
    置き換え、前記1番上位に現われた数字で下位の数字を
    置き換える置き換え手段と、を備えたことを特徴とする
    文字認識装置。
  3. 【請求項3】全認識対象字種を格納した第1辞書を用い
    て入力文字列を認識して候補文字列を求める文字認識装
    置において、 数字だけを認識するための数字字種を格納した第2辞書
    と、 英数カナだけを認識するための英数カナ字種を格納した
    第3辞書と、 最初に第2辞書と第3辞書を用いて数字および英数カナ
    の認識処理を行った後に第2辞書で認識した結果と第3
    辞書で認識した結果が認識可能であったか認識不能であ
    ったかを判別する判別手段と、 認識可能であったとき第2辞書で認識した結果と第3辞
    書で認識した結果とを比較する比較手段と、 該比較手段で比較した比較結果が一致しないとき、第1
    辞書で認識し候補文字列を求め、比較結果が一致したと
    きはその比較結果を候補文字列の1位に設定する設定手
    段と、を備えたことを特徴とする文字認識装置。
  4. 【請求項4】請求項1,2記載の文字認識装置におい
    て、 前記第2辞書および第3辞書による両認識結果が認識可
    能であって一致するが前記第1辞書の認識結果とは一致
    しないときは、該当する入力文字パターンを前記第1辞
    書に追加する辞書追加手段を設けたことを特徴とする文
    字認識装置。
JP04183298A 1998-02-24 1998-02-24 文字認識装置 Expired - Fee Related JP3481850B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04183298A JP3481850B2 (ja) 1998-02-24 1998-02-24 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04183298A JP3481850B2 (ja) 1998-02-24 1998-02-24 文字認識装置

Publications (2)

Publication Number Publication Date
JPH11238101A JPH11238101A (ja) 1999-08-31
JP3481850B2 true JP3481850B2 (ja) 2003-12-22

Family

ID=12619247

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04183298A Expired - Fee Related JP3481850B2 (ja) 1998-02-24 1998-02-24 文字認識装置

Country Status (1)

Country Link
JP (1) JP3481850B2 (ja)

Also Published As

Publication number Publication date
JPH11238101A (ja) 1999-08-31

Similar Documents

Publication Publication Date Title
EP0844583B1 (en) Method and apparatus for character recognition
JP2726568B2 (ja) 文字認識方法及び装置
JP2973944B2 (ja) 文書処理装置および文書処理方法
JP3452774B2 (ja) 文字認識方法
US5787197A (en) Post-processing error correction scheme using a dictionary for on-line handwriting recognition
KR19980018029A (ko) 문자 인식 장치
US6035062A (en) Character recognition method and apparatus
JPS59106085A (ja) 認識装置の辞書更新方法
JPH0423185A (ja) 自動セル属性判定機能を有する表読取装置
JP3481850B2 (ja) 文字認識装置
JP3975825B2 (ja) 文字認識誤り訂正方法、装置及びプログラム
JP2002063197A (ja) 検索装置、記録媒体およびプログラム
JP3274014B2 (ja) 文字認識装置および文字認識方法
JPH1055409A (ja) 手書き入力情報処理装置
JP3419251B2 (ja) 文字認識装置及び文字認識方法
JP3233803B2 (ja) 難読漢字検索装置
JP2002189985A (ja) 手書文字処理装置および方法、ならびに手書文字処理プログラムを記録した機械読取可能な記録媒体
JP2906758B2 (ja) 文字読取装置
JP3128357B2 (ja) 文字認識処理装置
JPH06215197A (ja) 文字認識方法および装置
JP2677271B2 (ja) 文字認識装置
JP3444561B2 (ja) 文字認識方法及び文字認識装置
JP3033554B2 (ja) 文字認識装置
JPS6059487A (ja) 手書文字認識装置
JP2851865B2 (ja) 文字認識装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030909

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071010

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081010

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081010

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091010

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees