JP3457094B2 - 文字認識装置及び文字認識方法 - Google Patents

文字認識装置及び文字認識方法

Info

Publication number
JP3457094B2
JP3457094B2 JP09667195A JP9667195A JP3457094B2 JP 3457094 B2 JP3457094 B2 JP 3457094B2 JP 09667195 A JP09667195 A JP 09667195A JP 9667195 A JP9667195 A JP 9667195A JP 3457094 B2 JP3457094 B2 JP 3457094B2
Authority
JP
Japan
Prior art keywords
character
circumscribing
information
candidate
similar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP09667195A
Other languages
English (en)
Other versions
JPH08293002A (ja
Inventor
一郎 中尾
磨理子 竹之内
穂 高倉
里志 江村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP09667195A priority Critical patent/JP3457094B2/ja
Priority to US08/608,179 priority patent/US5999647A/en
Publication of JPH08293002A publication Critical patent/JPH08293002A/ja
Priority to US09/187,131 priority patent/US6141443A/en
Priority to US09/186,943 priority patent/US6064769A/en
Application granted granted Critical
Publication of JP3457094B2 publication Critical patent/JP3457094B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字認識装置に関し、特
に文字の認識においてパターンマッチング法により認識
の困難な文字の認識精度向上に関する。
【0002】
【従来の技術】近年、文字認識装置が普及し、イメージ
スキャナで読み込んだ文書画像における活字を文字認識
する文字認識装置が広く用いられつつある。従来の文字
認識装置では、辞書パターンとのマッチングだけでは判
別が困難な相似形文字(例えば英文における大文字と小
文字)等においては、以下のような文字認識処理を行っ
ている。例えば特開昭63−216189号公報にその
方法が示される。即ち、先ず、切り出された文字画像に
対して認識処理部が文字認識の処理を行い、どの文字で
あるかを示す認識結果を出力する。次に認識結果が、予
め定められた誤認識し易い相似形の大文字小文字(例え
ばOとo、Vとv)である場合はさらに以下の処理を行
う。文字画像の上端又は下端が、その文字画像を含む文
字列を幾何学的に包含する文字行矩形において占める垂
直方向の座標位置を予め定められた基準値と比較するこ
とによって当該文字画像の文字が大文字であるか小文字
であるかを判定する。このように判定した結果が、認識
処理部の認識結果と矛盾する場合、例えば認識結果は小
文字vであるのに判定した結果が大文字Vであった場合
等は、当該認識結果を対応する相似形文字である大文字
Vに修正する。
【0003】
【発明が解決しようとする課題】しかしながら上記従来
技術では、文字画像の上端又は下端が、文字行矩形にお
いて占める垂直方向の座標位置を基準値と比較すること
により判定を行っているため、垂直方向の座標位置が同
じである誤認識し易い類似文字(例えばlとI、wと
m)については判定を行うことが出来ない。そのため実
際は小文字のlであるのに認識処理にて大文字のIと誤
認識した場合や、実際は小文字のwであるのに小文字の
mと誤認識した場合などであっても上記従来技術は何ら
判定を行わない。従って、認識処理部が類似文字につい
て誤認識した場合は誤りが修正されることはない。
【0004】また、誤認識し易い相似形の大小文字に関
しても、一律に固定的な基準値を適用するので、判定の
精度があまり良くない。このように認識処理が誤認識し
た場合であっても判定を行わない場合があり、判定自体
の精度の良くないので文字認識装置の認識精度が良くな
いという問題点があった。
【0005】本発明は上記問題点に鑑み、相似形文字や
類似文字を含む文書での文字の認識の精度を向上させる
文字認識装置及び文字認識方法を提供することを目的と
する。
【0006】
【課題を解決するための手段】上記目的を達成するた
め、請求項1における発明では、文書画像中から各文字
画像を切り出す文字切り出し手段と、前記文字切り出し
手段において切り出された文字画像が認識対象文字のい
ずれの文字に該当するかを識別し該当する複数の候補文
字と当該候補文字ごとの認識評価値を出力する認識処理
手段と、前記文字切り出し手段において切り出された文
字画像の外接する図形が、当該文字画像を含む文字列に
外接する矩形である文字行矩形内において占める相対高
さ及び大きさの情報である文字外接図形情報を抽出する
文字外接図形情報抽出手段と、認識対象とする全ての文
字に対して、それぞれの文字に外接する図形が文字行矩
形において占める標準的な相対高さ及び大きさの情報で
ある文字外接図形情報を予め記憶しておく文字外接図形
情報辞書手段と、前記文字外接図形情報抽出手段で抽出
された文字外接図形情報を、前記認識処理手段において
出力された当該文字画像の各候補文字に対する前記文字
外接図形情報辞書手段の文字外接図形情報と照合し、各
候補文字ごとに外接図形評価値を算出する文字外接図形
評価手段と、前記認識処理手段において出力された候補
文字ごとの認識評価値と、前記文字外接図形評価手段に
おいて算出された候補文字ごとの外接図形評価値とに基
づいて、前記認識処理手段で出力された複数の候補文字
から最適文字を決定する文字決定手段とを備えたことを
特徴とする。
【0007】請求項2における発明では、前記文字外接
図形情報抽出手段は、前記文字切り出し手段で切り出さ
れた文字画像の外接する図形が、上記文字行矩形内にお
いて占める相対高さ及び大きさの情報である相対位置情
報を抽出する相対位置情報抽出部と、上記相対位置情報
を用いて前記文字切り出し手段で切り出された文字画像
を、下部に突き出でいる文字である下部突出文字あるい
は上部文字に分類する文字分類部と、前記文字分類部で
上部文字と分類された文字画像の下端位置の平均値を基
準下端位置として算出する文字行基準下端位算出部と、
前記文字分類部で上部文字と分類された文字画像のなか
で最も高さの高い文字画像の高さを基準文字高さとして
算出する基準文字高さ算出部と、前記相対位置情報抽出
部で算出された相対位置情報を、前記文字行基準下端位
置算出部で算出された基準下端位置および基準文字高さ
算出部で算出された基準文字高さに基づいて、正規化し
た情報である文字外接図形情報を算出する文字形状情報
算出部とを備えたことを特徴とする。
【0008】請求項3における発明では、前記文字行基
準下端位置算出部の代わりに、左隣の文字画像の下端位
置と当該文字画像の下端位置の差に基づいて、各文字画
像毎に基準下端位置を算出する文字基準下端位置算出部
を備え、前記文字形状情報算出部は、前記相対位置情報
抽出部で算出された相対位置情報を、前記文字基準下端
位置算出部で算出された基準下端位置および基準文字高
さ算出部で算出された基準文字高さに基づいて、正規化
した情報である文字外接図形情報を算出することを特徴
とする。
【0009】請求項4における発明では、前記文字外接
図形評価手段は、前記認識処理手段が認識対象とする全
ての文字に対して、各文字に対応する相似形文字又は類
似文字が存在するか否かの存否情報を記憶している相似
類似文字存否情報記憶部と、前記認識処理部で出力され
た候補文字に対応する相似形文字又は類似文字が存在す
るか否かを、前記相似類似文字存否情報記憶部に記憶さ
れている存否情報を参照することにより判定する相似類
似文字存否判定部とを備え、すべての候補文字につい
て、前記相似類似文字存否判定部で相似形文字等が存在
しないと判定されたときは外接図形評価値を算出せず、
すべての候補文字のなかで一つでも前記相似類似文字存
否判定部で相似形文字等が存在すると判定されたときは
各候補文字ごとに外接図形評価値を算出し、前記文字決
定手段は、前記文字外接図形評価手段で外接図形評価値
が算出されなかったときは、認識評価値のみに基づい
て、前記認識処理手段で出力された複数の候補文字から
認識文字を決定することを特徴とする。
【0010】請求項5における発明では、前記文字外接
図形評価手段は、前記認識処理手段で出力された認識評
価値のうち最小値をとる第1位候補文字について、前記
相似類似文字存否判定部で相似形文字等が存在しないと
判定されたときはすべての候補文字について外接図形評
価値を算出せず、第1位候補文字について、前記相似類
似文字存否判定部で相似形文字等が存在すると判定され
たときは各候補文字ごとに外接図形評価値を算出するこ
とを備えたことを特徴とする。
【0011】請求項6における発明では、前記文字認識
装置は、さらに、前記切り出し手段で切り出された各文
字画像間の間隔に基づいて区切られた文字列に外接する
矩形である部分文字行矩形を抽出する部分文字行矩形抽
出手段を備え、前記文字外接図形情報抽出手段は、前記
文字切り出し手段において切り出された文字画像におい
て、前記部分文字行矩形抽出手段で抽出された部分文字
行矩形内に対する文字外接図形情報を抽出することを特
徴とする。
【0012】請求項7における発明では、文書画像中か
ら各文字画像を切り出す文字切り出しステップと、切り
出された文字画像に対して認識対象文字のいずれかであ
るかを識別し複数の候補文字と当該候補文字ごとの認識
評価値を出力する認識処理ステップと、切り出された文
字画像の外接する図形が、当該文字画像を含む文字列に
外接する矩形である文字行矩形内において占める相対高
さ及び大きさの情報である文字外接図形情報を抽出する
文字外接図形情報抽出ステップと、当該文字画像の各候
補文字に対する文字外接図形情報を前記文字外接図形情
報辞書手段から取り出す文字外接図形情報取り出しステ
ップと、前記文字外接図形情報取り出しステップで取り
出された各候補文字に対する文字外接図形情報と、上記
文字外接図形情報とを照合し、各候補文字ごとに外接図
形評価値を算出する文字形状評価ステップと、前記認識
処理ステップにおいて出力された候補文字ごとの認識評
価値と、前記文字形状評価ステップにおいて算出された
候補文字ごとの外接図形評価値とに基づいて、前記認識
処理手段で出力された複数の候補文字から認識文字を決
定する文字決定ステップとを備えたことを特徴とする。
【0013】
【作用】上記請求項1の発明によれば、認識処理手段
は、各候補文字ごとの認識評価値を出力する。一方、文
字外接図形評価手段は、文字外接図形情報抽出手段で抽
出された文字外接図形情報と、各候補文字に対する文字
外接図形情報辞書手段のそれぞれの文字外接図形情報と
を照合し各候補文字ごとに外接図形評価値を算出する。
文字決定手段は、候補文字ごとの認識評価値と、候補文
字ごとの外接図形評価値とに基づいて、認識処理手段で
出力された複数の候補文字から最適文字を決定する。
【0014】請求項2の発明によれば、文字行内の各文
字画像の相対位置を抽出した後に、各文字画像を下部突
出文字または上部文字に分類する。下部突出文字を除い
た文字に基づいて基準下端位置および基準文字高さを求
め、文字行矩形内の各文字画像の相対位置を正規化して
文字外接図形情報を算出する。請求項3の発明によれ
ば、文字基準下端位置算出部は、基準下端位置を、左隣
の文字画像の下端位置と当該文字画像の下端位置の差に
基づいてもとめるので、文字行矩形内の基準下端位置が
1文字画像毎に補正される。
【0015】請求項4の発明によれば、相似類似文字存
否判定部は、候補文字に対応する相似形文字等が存在す
るか否かを、前記相似類似文字存否情報記憶部に記憶さ
れている存否情報を参照することにより判定する。文字
外接図形評価手段は、すべての候補文字について、前記
相似類似文字存否判定部で相似形文字等が存在しないと
判定されたときは外接図形評価値を算出しない。文字決
定手段は、文字外接図形評価手段で外接図形評価値が算
出されなかったときは、認識評価値のみに基づいて、前
記認識処理手段で出力された複数の候補文字から最適文
字を決定する。
【0016】請求項5の発明によれば、第1位候補文字
について、前記相似類似文字存否判定部で相似形文字等
が存在しないと判定されたときはすべての候補文字につ
いて外接図形評価値を算出しない。請求項6の発明によ
れば、部分文字行矩形抽出手段は、切り出し手段で切り
出された各文字画像間の間隔に基づいて部分文字行矩形
を抽出する。文字外接図形情報抽出手段は、文字切り出
し手段において切り出された文字画像において、部分文
字行矩形抽出手段で抽出された部分文字行矩形内に対す
る文字外接図形情報を抽出する。
【0017】請求項7の発明は、請求項1の発明と同様
の作用をなす。
【0018】
【実施例】図1は、本発明の第1の実施例における文字
認識装置の構成図を示す。当該文字認識装置は、文字行
画像入力受付部11と文字切り出し部12と部分文字行
矩形抽出部13と認識処理部14と文字形状抽出部15
と文字形状辞書記憶部16と文字形状評価部17と文字
決定部18とから構成されている。
【0019】文字行画像入力受付部11は、スキャナ等
で読み込んだ文書の文書画像から抽出された文字行画像
を受け付ける。図2(a)は、入力された文字行画像の
例を示す図である。文字切り出し部12は、文字行画像
入力受付部11で受け付けた文字行画像から1文字毎の
文字画像を切り出し、さらに各文字画像ごとの文字画像
矩形及びその位置を抽出する。例えば図2(a)に示す
文字行画像21において、各文字画像を切り出し、さら
に各文字画像ごとの文字画像矩形22を抽出する。
【0020】部分文字行矩形抽出部13は、文字切り出
し部12で切り出された各文字画像矩形間の間隔及び位
置に基づいて、1個以上の部分文字行矩形を抽出する。
ここで部分文字行矩形とは、文字行画像内の近接してい
る文字画像の集まりにおいて、当該文字画像の集まりに
外接する矩形である。例えば図2(a)の文字画像矩形
22から抽出された部分文字行矩形は、図2(b)に示
す部分文字行矩形25、26である。当該部分文字行矩
形抽出部13において、部分文字行矩形を抽出するのは
以下ようにして行われる。文字切り出し部12で抽出さ
れた各文字画像矩形において、隣接する文字画像矩形と
のx方向の間隔(図2(a)の23、24等)を算出す
る。次にその算出した間隔が、所定の基準値(例えば文
字行画像の高さの1/2等)以上の間隔が存在するか否
かを判断する。所定の基準値以上の間隔があれば、当該
場所までの文字画像矩形に外接する矩形を、部分文字行
矩形として求める。図2(b)の二つの部分文字行矩形
25、26は、図2(a)に示す文字画像矩形22にお
いて、間隔24が基準値以上であると判断されたので、
当該間隔24の場所に基づいて部分文字行矩形を抽出し
た状態を示している。
【0021】認識処理部14は、部分文字行矩形抽出部
13で抽出された部分文字行矩形内に存在する各文字画
像に対し、認識対象各文字のいずれであるかを識別し、
複数の候補文字と当該候補文字ごとの認識評価値を出力
する。本実施例では、認識対象文字はアルファベットの
A〜Z及a〜zとする。当該認識処理部14は、具体的
には以下の処理を行う。例えば図3の部分文字行矩形3
7内の各文字画像矩形31、32、…、36の文字に対
して認識処理を行ったとすると、図4に示すように候補
文字と評価値を出力する。この例では、評価値の値の小
さい方がより順位の高い候補文字であることを意味す
る。図4において、行41は、文字画像矩形31の1番
目の候補文字である第1位候補文字は、小文字「s」で
ありその評価値は428であることを示し、同様に第2
位候補文字は、大文字「S」でありその評価値は430
であることを示し、第3位候補文字は、大文字「G」で
ありその評価値は510であることを示している。他の
行42、43…46についても、図4に示される通りで
ある。また、当該認識処理部14は公知技術であり、技
術文献として、現代自動制御双書11 「パターン認識
とその応用」 中田和男 編 コロナ社 1978年
や、特許公報として、特開昭61−188681があげ
られる。
【0022】文字形状抽出部15は、文字切り出し部1
2で切り出された文字画像矩形の部分文字行矩形に対す
る相対位置および大きさの情報である文字形状抽出情報
を抽出する。ここで文字形状抽出情報は図7に示すよう
な情報であり、文字画像矩形の上端y座標701、下端
y座標702、高さ703、幅704の情報からなる。
詳細は後述する。当該文字形状抽出部15は、文字形状
抽出情報を算出するため、図6に示すように、相対位置
情報抽出部151と文字分類部152と文字行基準下端
位置算出部153と基準文字高さ算出部154と文字形
状抽出情報算出部155とから構成される。以下、各部
について説明する。
【0023】相対位置情報抽出部151は、部分文字行
矩形抽出部13で抽出された部分文字行矩形における各
文字画像矩形の相対位置の情報である相対位置情報を抽
出する。例えば図3に示す各文字画像矩形31、…、3
6の部分文字行矩形37に対する相対位置情報を抽出す
る。相対位置情報は具体的には図5に示すように文字画
像矩形における上端y座標511と下端y座標512と
高さ513と幅514との情報からなる。これは、部分
文字行矩形の左下の座標をx=0、y=0としx座標は
右方向が正、y座標は上方向が正とした場合において、
それぞれ各文字画像矩形の上端のy座標が上端y座標5
11であり、下端のy座標が下端y座標512であり、
高さが高さ513であり、幅が幅514であることを示
している。図3に示す部分文字行矩形37中の各文字画
像矩形31、32、…、36の文字形状抽出情報は、図
5の行501〜506に示されるような値となる。
【0024】文字分類部152は、相対位置情報抽出部
151において抽出された各文字画像矩形の相対位置情
報に基づき文字画像矩形を下部突出文字または上部文字
のいずれかに分類する。ここで上部文字は、部分文字行
の下端から一定以上の間隔のある文字をいう。例えば、
「S」「a」「m」等である。次に下部突出文字は、部
分文字行の下端から一定以上の間隔がない文字をいう。
例えば、「p」「g」等である。当該文字分類部152
は以下の基準により分類を行っている。部分文字行矩形
内の各文字画像矩形の下端y座標が部分文字矩形行の下
端(y=0)から一定以上の間隔がある場合に上部文字
と分類し、同様に部分文字行矩形の下端位置と一定以上
の間隔がない場合に下部突出文字として分類する。例え
ば、文字行矩形の高さ(図3の例では 43)の20%
以上の空白があるものを下部突出文字それ以外を上部文
字とする。すると下端y座標が8.6(高さ43の20
%)未満の文字画像矩形の文字が下部突出文字、それ以
外が上部文字となる。従って図3の各文字画像矩形に基
づき、下部突出文字は文字画像矩形34の文字、上部文
字は文字画像矩形31、32、33、35、36の文字
となる。これは、図5の分類結果515に示す列に、下
部突出文字を「下」、上部文字を「上」として示してい
る。なお、部分文字行矩形内のすべての文字が下部突出
文字であった場合には、部分文字行矩形内のすべての文
字を上部文字であるとする。
【0025】文字行基準下端位置算出部153は、上部
文字に分類された各文字領域の下端y座標の平均位置を
標準下端位置として算出する。図5の例では、上部文字
の下端y座標は、行501の14と行502の15と行
503の14と行505の14と行506の13である
ので、平均は14となる。従って標準下端位置は14と
なる。
【0026】基準文字高さ算出部154は、上部文字に
分類された文字の文字画像矩形のなかで最も高さの高い
文字画像矩形の高さを基準文字高さとして算出する。図
3の例では最も高さの高い文字画像矩形34又は文字画
像矩形35の高さ29を基準文字高さとする。文字形状
抽出情報算出部155は、相対位置情報抽出部151に
おいて抽出された各文字画像矩形の相対位置情報を、文
字行基準下端位置算出部153で算出された標準下端位
置および基準文字高さ算出部154で算出された基準文
字高さに基づき、正規化した情報である文字形状抽出情
報を算出する。具体的には、標準下端位置y座標を0、
文字の標準高さが100となるように正規化する。
【0027】ここで標準下端位置をSy(図3の例では
Sy=14)、基準文字高さH(図3の例ではH=2
9)、文字画像矩形の上端y座標をUy、下端y座標を
Ly、幅をWとする。算出する文字画像矩形の文字形状
抽出情報は、上端y座標701と下端y座標702と高
さ703と幅704の要素からなる。これらの要素は以
下の演算式で求められる。
【0028】 上端y座標701=100*(Uy−Sy)/H 下端y座標702=100*(Ly−Sy)/H 高さ703=100*(Ly−Uy)/H 幅704=100*W/H このような演算式を用いて図5に示す相対位置情報を演
算することにより図7に示すような文字形状抽出情報を
算出する。図7において、行711は、図3における文
字画像矩形31に対する文字形状抽出情報であり、同様
に行712〜行716はそれぞれ文字画像矩形32〜3
6に対する文字形状抽出情報である。
【0029】文字形状辞書記憶部16は、認識処理部1
4が認識対象とするすべての認識対象文字に関して、当
該認識対象文字の文字画像矩形の標準的な相対位置及び
大きさの情報である文字形状辞書情報を記憶している。
認識対象とするすべての文字は、具体的には図8の列8
00に示すように英語のアルファベットの大文字A〜Z
までと小文字のa〜zまでの文字である。文字形状辞書
情報とは、具体的には、前記認識対象文字の文字画像矩
形の上端y座標801と下端y座標802と高さ803
と幅804との情報からなり、後述する文字形状評価部
17が評価を行うために用いるものである。当該文字形
状辞書情報の要素は、前述した文字形状抽出部15で抽
出された文字形状抽出情報と同じである。例えば文字
「A」に対しては、値として上端y座標801は98、
下端y座標802は0、高さ803は100及び幅80
4は90が記憶されている。
【0030】文字形状評価部17は、認識処理部14が
出力した候補文字に対応する文字形状辞書情報を文字形
状辞書記憶部16から取り出し、文字形状抽出部15に
おいて抽出された文字形状抽出情報との照合を行い各候
補文字毎の形状評価値を算出する。形状評価値は、文字
画像矩形の文字形状抽出情報の各要素から候補文字に対
応する文字形状辞書情報の各要素を引いた値を合計した
値である。具体的に文字形状抽出情報における上端のy
座標と文字形状辞書情報におけ上端のy座標の差と、同
様に下端のy座標の差と、高さの差と、幅の差とのすべ
ての合計である。例えば、図3の文字画像矩形31に関
しては、図4に示すように候補文字s、S、Gに対する
文字形状辞書情報と、図7の行711に示す文字形状抽
出情報との照合が行われる。
【0031】候補文字sに対しては図8の行83に示す
文字形状辞書情報と、図7の行711に示す文字形状抽
出情報とを以下に示すように照合する。 |96.6−67|+|0.0−0|+|96.6−6
7|+|62.1−58|=63.3 従って候補文字sの形状評価値は63.3である。
【0032】候補文字Sに対しても同様に図8の行82
に示す文字形状辞書情報と、図7の行711に示す文字
形状抽出情報とを以下に示すように照合する。 |96.6−98|+|0.0−(−2)|+|96.
6−100|+|62.1−83|=27.7 従って候補文字Sの形状評価値は27.7である。
【0033】候補文字Sに対しても同様に図8の行81
に示す文字形状辞書情報と、図7の行711に示す文字
形状抽出情報とを以下に示すように照合する。 |96.6−98|+|0.0−(−2)|+|96.
6−100|+|62.1−83|=39.7 従って候補文字Gの形状評価値は39.7である。
【0034】文字決定部18は、認識処理部14で得ら
れた各候補文字に対応する認識評価値と形状評価値を合
わせた値により最終認識結果を決定する。具体的には、
認識処理部14によって得られた候補文字との認識評価
値をXとし、文字形状評価部17によって得られた形状
評価値をYとすると各評価値を X+a・Y (aは予め定めた定数、例えばa=1.0)と加算する
ことにより最も値の小さい値を選択することにより最終
認識結果を決定し出力する。例えば図3の文字画像矩形
31の候補文字「s」「S」「G」に対しては、認識評
価値がそれぞれ428、430、510であり、形状評
価値はそれぞれ63.3、27.7、39.7である。
各候補文字の認識評価値と形状評価値を足した値は、そ
れぞれ、491.3、457.7、549.7となる。
よって、最も値の小さいのは、候補文字「S」の45
7.7となり、最終認識結果は、「S」となる。
【0035】以上のように構成された文字認識装置につ
いて、図9に示すフローチャートを用いて動作を説明す
る。先ず、文字画像を切り出し文字画像矩形を抽出し、
さらに部分文字行矩形を抽出する(ステップS901、
ステップS902)。図3は、抽出された文字画像矩形
31、…、36と、部分文字行矩形37を示す。先ず一
つの文字画像に対して認識処理を行い、複数の候補文字
と当該文字候補毎の認識評価値を出力する(ステップS
903)。例えば図4の行41に示すように、文字画像
矩形31の文字画像に対応する候補文字「s」「S」
「G」とその評価値428、430、510が出力され
る。当該出力によると、実際は「S」であるのに、誤っ
て「s」と誤認識していることが分かる。次に、部分文
字行矩形37における文字画像矩形31の文字形状抽出
情報を図7の行711に示すように抽出する(ステップ
S904)。一方、複数の候補文字である「s」「S」
「G」に対応する文字形状辞書情報を候補文字ごとに取
り出す(ステップS905)。当該情報は、図8におけ
る行83、行82、行81に示す部分である。次に、候
補文字毎の文字形状辞書情報それぞれに、文字形状抽出
情報を照合し、候補文字毎の形状表価値を算出する(ス
テップS906)。候補文字「s」「S」「G」の形状
評価値は、それぞれ63.3、27.7、39.7とな
る。次に、候補文字ごとの認識評価値と形状評価値の和
を計算し、その和が最小となる候補文字を最終認識結果
として出力する(ステップS907)。具体的には、候
補文字「s」「S」「G」に関する認識評価値と形状評
価値の和は、それぞれ491.3、457.7、54
9.7となるので、その和が最小となる候補文字「S」
を最終認識結果として出力する。従って「S」を「s」
とする誤認識が修正されたことが分かる。同様の処理を
他の文字画像矩形32〜36について繰り返し、最終認
識結果としてそれぞれ「ample」が出力される(ス
テップS901〜ステップS908)。最初の「S」を
含めると認識結果として「Sample」が出力され
る。
【0036】なお、文字形状評価部17は、さらに評価
の対象とする文字に相似形文字や類似文字が存在するか
否かの存否情報を記憶している相似類似文字存否情報記
憶部を備えている構成であってもよい。当該類似文字存
否情報記憶部は、図10に示すように認識対象とするす
べての文字(A〜Z、a〜z)のそれぞれについて相似
形文字や類似文字が存在するか否かの存否情報を記憶し
ている。文字形状評価部17は、認識処理部14におい
て得られたすべての候補候補文字について相似類似文字
存否記憶部に記憶されている存否情報を参照する。参照
した結果、候補文字の一つにでも対応する相似形文字又
は類似文字が存在する場合は、通常通り全ての候補文字
について形状評価値を算出する。存否情報を参照し、す
べての候補文字について対応する相似形文字又は類似文
字が存在しない場合は、形状評価値を算出しない。この
場合は、すべて候補文字に対する形状評価値をすべて0
にするとするという構成をであってもよい。
【0037】また、前述した文字形状評価部17はすべ
ての候補文字に対して相似形文字等が存在するかどうか
を判定していたが、すべての候補文字に対して判定を行
わず第1位候補文字に対してのみ行うという構成であっ
てもよい。例えば図4の例において、文字画像矩形31
に対する第1位候補文字は「s」であるとする。この
「s」は、図10の102行に示すように相似形文字等
が存在するため、文字形状評価部17は通常通り形状評
価値を算出する。一方、文字画像矩形32の第1位候補
文字は「a」である。当該第1位候補文字「a」に対す
る相似形文字等は、図10の101行に示すように存在
しないため、各候補文字に対する形状評価値の算出は行
わない。この場合、すべての候補文字の形状評価値をを
0とすることによって認識処理部14の第1位候補文字
が最終認識結果となる。
【0038】なお、実施例において形状評価値を求める
際、上端/下端/高さ/幅の差を演算式として用いた
が、上端/下端/高さのみを用いてもよい。さらに、実
施例において文字決定部18において、認識評価値と形
状評価値とを加算するものとしたが、両評価値の積等も
用いてもよい。次に本発明の第2の実施例について説明
する。第2の実施例は、処理すべき文字画像が斜めずれ
ている場合、例えば図12に示すように文字画像矩形1
21、122、…、126が右にいくほと上にずれてい
る場合においても文字画像を処理する文字認識装置であ
る。
【0039】図11は本発明の第2の実施例の文字認識
装置における文字形状抽出部の構成図である。本実施例
は第1の実施例の構成要素とほぼ同じであるが文字形状
抽出部15の代わりに図11に示す文字形状抽出部が用
いられている点のみが第1の実施例における文字認識装
置と異なる。図11に示すように本実施例における文字
形状抽出部は、相対位置情報抽出部111、文字分類部
112と、文字基準下端位置算出部113と、基準文字
高さ算出部114と、文字形状抽出情報算出部115と
から構成されている。
【0040】相対位置情報抽出部111は、第1の実施
例における相対位置情報抽出部151と同様である。当
該相対位置情報抽出部111が抽出した相対位置情報
は、図13に示される。図9に示す文字画像矩形が右に
行くほど上がっているので、図13における下端y座標
も行134の下端y座標をのぞき、値が大きくなってい
る。
【0041】文字分類部112は、第1の実施例におけ
る文字分類部152と同様である。当該文字分類部11
2は、図13の行131と行134に示すように図12
の文字画像矩形121と文字画像矩形124を下部突出
文字として分類している。文字基準下端位置算出部11
3は、左隣の文字画像矩形の下端y座標と当該文字画像
矩形の下端y座標と標準下端位置の初期値とをもちい
て、左から順に標準下端位置を算出する。具体的には、
左隣の文字画像矩形の下端y座標と当該文字画像矩形の
下端y座標との差が所定値(例えば部分文字行矩形の高
さの10%)以内の場合は、当該文字画像矩形の下端y
座標を標準下端位置とする。例えば、図12の文字画像
矩形122の標準下端位置は、以下のようにして求めら
れる。文字画像矩形122の下端y座標は図13の行1
32に示すように9であり、その左隣の文字画像矩形1
21の下端y座標は行131に示すように7であるの
で、その差は2である。部分文字行矩形の高さは図12
に示すように40でありその10%は4であるので、そ
の差は所定値以内である。従って当該文字画像矩形12
2の標準下端位置は9と算出される。一方、差が所定値
以上の場合は、標準下端位置の初期値を当該文字画像矩
形の標準下端位置とする。ここで標準下端位置の初期値
は、上部文字に分類された文字の中で最も左側に位置す
る文字画像矩形の下端y座標とする。例えば、図13に
おいて上部文字に分類された文字の中で最も左側に位置
するのは文字画像矩形122であるので、行132に示
すように当該下端y座標である9を初期値とする。な
お、上部文字に分類された文字画像矩形が存在しない場
合は下部突出文字のもっとの左側の文字画像矩形の下端
y座標を標準下端位置の初期値とする。この場合に、例
えば、図12の文字画像矩形124の標準下端位置は、
以下のようにして求められる。文字画像矩形124の下
端y座標は図13の行134に示すように0であり、そ
の左隣の文字画像矩形123の下端y座標は行133に
示すように9であるので、その差は9である。その差は
所定値である4以上であるので、当該文字画像矩形12
4の標準下端位置は、標準下端位置の初期値である9と
算出される。文字基準下端位置算出部113によって算
出された文字画像矩形121、…、126の標準下端位
置は、それぞれ図13の列137に示される。
【0042】基準文字高さ算出部114は、第1の実施
例における基準文字高さ算出部154と同様、上部文字
の内、最も高さの高い文字画像矩形の高さを基準文字高
さとする。図13の例では、29となる。文字形状抽出
情報算出部115は、相対位置情報抽出部111におい
て抽出された各文字画像矩形の相対位置情報を、文字基
準下端位置算出部113で算出された標準下端位置及び
基準文字高さ算出部114で算出された基準文字高さに
基づき、正規化した情報である文字形状抽出情報を算出
する。図14は、算出された文字形状抽出情報である。
当該文字形状抽出情報における各文字画像矩形の下端y
座標は、文字画像矩形124を除いてすべて値0に修正
されていることが分かる。
【0043】
【発明の効果】以上のように請求項1の発明によれば、
認識処理部から出力される認識評価値のみならず、文字
形状評価部から出力される外接図形評価値とを用い総合
的に判断することができるので、相似形文字や類似文字
を含む文書での文字の認識の精度を向上させることがで
きる。
【0044】請求項2の発明によれば、文字行内の各文
字画像の相対位置情報を抽出した後に、各文字画像を下
部突出文字または上部文字に分類し、下部突出文字を除
いた文字に基づいて基準下端位置および基準文字高さを
求め、文字行矩形内の各文字画像の相対位置を正規化し
て文字外接図形情報を算出するので、相似形文字や類似
文字を含む文書での文字の認識の精度を向上させること
ができる。
【0045】請求項3の発明によれば、文字基準下端位
置算出部により文字行矩形内の基準下端位置が1文字画
像毎に補正されるので、傾いて入力された文字画像に対
しても傾きの影響を除去し精度よく文字外接図形情報の
抽出が行えるので、相似形文字や類似文字を含む文書で
の文字の認識の精度を向上させることができる。請求項
4の発明によれば、認識処理手段で出力された候補文字
に対して相似形文字が存在しない場合は外接図形評価値
を算出しないので、相似形文字や類似文字を含む文書で
の文字の認識の精度を低下させることなく処理速度を向
上させることができる。
【0046】請求項5の発明によれば、第1位候補文字
について、前記相似類似文字存否判定部で相似形文字等
が存在しないと判定されたときはすべての候補文字につ
いて外接図形評価値を算出しないので、相似形文字や類
似文字を含む文書での文字の認識の精度を低下させるこ
となく処理速度を向上させることができる。請求項6の
発明によれば、部分文字行矩形抽出手段は、切り出し手
段で切り出された各文字画像間の間隔に基づいて部分文
字行矩形を抽出し、文字外接図形情報抽出手段は、文字
切り出し手段において切り出された文字画像において、
部分文字行矩形抽出手段で抽出された部分文字行矩形内
に対する文字外接図形情報を抽出するので、文書画像中
に文字サイズが異なる複数の文字列が存在する場合であ
っても、相似形文字や類似文字を含む文書での文字の認
識の精度を向上させることができる。
【0047】請求項7の発明は、請求項1の発明と同様
の効果をなす。
【図面の簡単な説明】
【図1】第1の実施例における文字認識装置の構成図で
ある。
【図2】入力された文字行画像、部分文字行矩形の例を
示す図である。
【図3】文字画像矩形及び部分文字行矩形の例を示す図
である。
【図4】認識処理部14の出力内容を示す図である。
【図5】相対位置情報抽出部151が抽出した相対位置
情報等の内容を示す図である。
【図6】第1の実施例における文字形状抽出部15の構
成図である。
【図7】第1の実施例における文字形状抽出部が抽出し
た文字形状抽出情報の内容を示す図である。
【図8】文字形状辞書記憶部16の記憶している文字形
状辞書情報の内容を示す図である。
【図9】文字認識装置の動作フロー図である。
【図10】類似文字存否情報記憶部の記憶している存否
情報の内容を示す図である。
【図11】第2の実施例における文字形状抽出部の構成
図である。
【図12】文字画像矩形及び部分文字行矩形の例を示す
図である。
【図13】認識処理部14の出力内容を示す図である。
【図14】相対位置情報抽出部111が抽出した相対位
置情報等の内容を示す図である。
【符号の説明】
11 文字行画像入力受付部 12 文字切り出し部 13 部分文字行矩形抽出部 14 認識処理部 15 文字形状抽出部 151 相対位置情報抽出部 152 文字分類部 153 文字行基準下端位置算出部 154 基準文字高さ算出部 155 文字形状抽出情報算出部 16 文字形状辞書記憶部 17 文字形状評価部 18 文字決定部 111 相対位置情報抽出部 112 文字分類部 113 文字基準下端位置算出部 114 基準文字高さ算出部 115 文字形状抽出情報算出部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 江村 里志 大阪府門真市大字門真1006番地 松下電 器産業株式会社内 (56)参考文献 特開 平5−166007(JP,A) 特開 平5−120484(JP,A) 特開 平5−73723(JP,A) 特開 平5−298494(JP,A) 特開 平6−180771(JP,A) 特開 平5−282493(JP,A) 特開 平3−111983(JP,A) 特開 平2−288989(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】 文書画像中から各文字画像を切り出す文
    字切り出し手段と、 前記文字切り出し手段において切り出された文字画像が
    認識対象文字のいずれの文字に該当するかを識別し該当
    する複数の候補文字と当該候補文字ごとの認識評価値を
    出力する認識処理手段と、 前記文字切り出し手段において切り出された文字画像の
    外接する図形が、当該文字画像を含む文字列に外接する
    矩形である文字行矩形内において占める相対高さ及び大
    きさの情報である文字外接図形情報を抽出する文字外接
    図形情報抽出手段と、 認識対象とする全ての文字に対して、それぞれの文字に
    外接する図形が文字行矩形において占める標準的な相対
    高さ及び大きさの情報である文字外接図形情報を予め記
    憶しておく文字外接図形情報辞書手段と、 前記文字外接図形情報抽出手段で抽出された文字外接図
    形情報を、前記認識処理手段において出力された当該文
    字画像の各候補文字に対する前記文字外接図形情報辞書
    手段の文字外接図形情報と照合し、各候補文字ごとに外
    接図形評価値を算出する文字外接図形評価手段と、 前記認識処理手段において出力された候補文字ごとの認
    識評価値と、前記文字外接図形評価手段において算出さ
    れた候補文字ごとの外接図形評価値とに基づいて、前記
    認識処理手段で出力された複数の候補文字から最適文字
    を決定する文字決定手段とを備えたことを特徴とする文
    字認識装置。
  2. 【請求項2】 前記文字外接図形情報抽出手段は、 前記文字切り出し手段で切り出された文字画像の外接す
    る図形が、上記文字行矩形内において占める相対高さ及
    び大きさの情報である相対位置情報を抽出する相対位置
    情報抽出部と、 上記相対位置情報を用いて前記文字切り出し手段で切り
    出された文字画像を、下部に突き出でいる文字である下
    部突出文字あるいは上部文字に分類する文字分類部と、 前記文字分類部で上部文字と分類された文字画像の下端
    位置の平均値を基準下端位置として算出する文字行基準
    下端位算出部と、 前記文字分類部で上部文字と分類された文字画像のなか
    で最も高さの高い文字画像の高さを基準文字高さとして
    算出する基準文字高さ算出部と、 前記相対位置情報抽出部で算出された相対位置情報を、
    前記文字行基準下端位置算出部で算出された基準下端位
    置および基準文字高さ算出部で算出された基準文字高さ
    に基づいて、正規化した情報である文字外接図形情報を
    算出する文字形状情報算出部とを備えたことを特徴とす
    る請求項1記載の文字認識装置。
  3. 【請求項3】 前記文字行基準下端位置算出部の代わり
    に、 左隣の文字画像の下端位置と当該文字画像の下端位置の
    差に基づいて、各文字画像毎に基準下端位置を算出する
    文字基準下端位置算出部を備え、 前記文字形状情報算出部は、前記相対位置情報抽出部で
    算出された相対位置情報を、前記文字基準下端位置算出
    部で算出された基準下端位置および基準文字高さ算出部
    で算出された基準文字高さに基づいて、正規化した情報
    である文字外接図形情報を算出することを特徴とする請
    求項2記載の文字認識装置。
  4. 【請求項4】 前記文字外接図形評価手段は、 前記認識処理手段が認識対象とする全ての文字に対し
    て、各文字に対応する相似形文字又は類似文字が存在す
    るか否かの存否情報を記憶している相似類似文字存否情
    報記憶部と、 前記認識処理部で出力された候補文字に対応する相似形
    文字又は類似文字が存在するか否かを、前記相似類似文
    字存否情報記憶部に記憶されている存否情報を参照する
    ことにより判定する相似類似文字存否判定部とを備え、 すべての候補文字について、前記相似類似文字存否判定
    部で相似形文字等が存在しないと判定されたときは外接
    図形評価値を算出せず、すべての候補文字のなかで一つ
    でも前記相似類似文字存否判定部で相似形文字等が存在
    すると判定されたときは各候補文字ごとに外接図形評価
    値を算出し、 前記文字決定手段は、 前記文字外接図形評価手段で外接図形評価値が算出され
    なかったときは、認識評価値のみに基づいて、前記認識
    処理手段で出力された複数の候補文字から認識文字を決
    定することを特徴とする請求項1乃至請求項3何れか記
    載の文字認識装置。
  5. 【請求項5】 前記文字外接図形評価手段は、 前記認識処理手段で出力された認識評価値のうち最小値
    をとる第1位候補文字について、前記相似類似文字存否
    判定部で相似形文字等が存在しないと判定されたときは
    すべての候補文字について外接図形評価値を算出せず、
    第1位候補文字について、前記相似類似文字存否判定部
    で相似形文字等が存在すると判定されたときは各候補文
    字ごとに外接図形評価値を算出することを備えたことを
    特徴とする請求項4記載の文字認識装置。
  6. 【請求項6】 前記文字認識装置は、さらに、 前記切り出し手段で切り出された各文字画像間の間隔に
    基づいて区切られた文字列に外接する矩形である部分文
    字行矩形を抽出する部分文字行矩形抽出手段を備え、 前記文字外接図形情報抽出手段は、 前記文字切り出し手段において切り出された文字画像に
    おいて、前記部分文字行矩形抽出手段で抽出された部分
    文字行矩形内に対する文字外接図形情報を抽出すること
    を特徴とする請求項1乃至請求項5何れか記載の文字認
    識装置。
  7. 【請求項7】 認識処理において認識対象とする全ての
    文字に対して、標準的な相対高さ及び大きさの情報であ
    る文字外接図形情報を予め記憶しておく文字外接図形情
    報辞書手段を用いた文字認識方法であって、 文書画像中から各文字画像を切り出す文字切り出しステ
    ップと、 切り出された文字画像に対して認識対象文字のいずれか
    であるかを識別し複数の候補文字と当該候補文字ごとの
    認識評価値を出力する認識処理ステップと、 切り出された文字画像の外接する図形が、当該文字画像
    を含む文字列に外接する矩形である文字行矩形内におい
    て占める相対高さ及び大きさの情報である文字外接図形
    情報を抽出する文字外接図形情報抽出ステップと、 当該文字画像の各候補文字に対する文字外接図形情報を
    前記文字外接図形情報辞書手段から取り出す文字外接図
    形情報取り出しステップと、 前記文字外接図形情報取り出しステップで取り出された
    各候補文字に対する文字外接図形情報と、上記文字外接
    図形情報とを照合し、各候補文字ごとに外接図形評価値
    を算出する文字形状評価ステップと、 前記認識処理ステップにおいて出力された候補文字ごと
    の認識評価値と、前記文字形状評価ステップにおいて算
    出された候補文字ごとの外接図形評価値とに基づいて、
    前記認識処理手段で出力された複数の候補文字から認識
    文字を決定する文字決定ステップとを備えたことを特徴
    とする文字認識方法。
JP09667195A 1995-04-21 1995-04-21 文字認識装置及び文字認識方法 Expired - Lifetime JP3457094B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP09667195A JP3457094B2 (ja) 1995-04-21 1995-04-21 文字認識装置及び文字認識方法
US08/608,179 US5999647A (en) 1995-04-21 1996-02-28 Character extraction apparatus for extracting character data from a text image
US09/187,131 US6141443A (en) 1995-04-21 1998-11-05 Character extraction apparatus, dictionary production apparatus, and character recognition apparatus using both apparatuses
US09/186,943 US6064769A (en) 1995-04-21 1998-11-05 Character extraction apparatus, dictionary production apparatus and character recognition apparatus, using both apparatuses

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09667195A JP3457094B2 (ja) 1995-04-21 1995-04-21 文字認識装置及び文字認識方法

Publications (2)

Publication Number Publication Date
JPH08293002A JPH08293002A (ja) 1996-11-05
JP3457094B2 true JP3457094B2 (ja) 2003-10-14

Family

ID=14171275

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09667195A Expired - Lifetime JP3457094B2 (ja) 1995-04-21 1995-04-21 文字認識装置及び文字認識方法

Country Status (1)

Country Link
JP (1) JP3457094B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3754536B2 (ja) * 1997-07-29 2006-03-15 やすゑ 豆崎 送受信装置
JP5298830B2 (ja) * 2008-12-19 2013-09-25 富士ゼロックス株式会社 画像処理プログラム、画像処理装置及び画像処理システム
JP6003705B2 (ja) * 2013-02-14 2016-10-05 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム

Also Published As

Publication number Publication date
JPH08293002A (ja) 1996-11-05

Similar Documents

Publication Publication Date Title
JP3452774B2 (ja) 文字認識方法
JP4280355B2 (ja) 文字認識装置
JP3457094B2 (ja) 文字認識装置及び文字認識方法
Bushofa et al. Segmentation of Arabic characters using their contour information
JP4194020B2 (ja) 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置
US7133556B1 (en) Character recognition device and method for detecting erroneously read characters, and computer readable medium to implement character recognition
JPH06180771A (ja) 英文字認識装置
Mitra et al. Character segmentation for handwritten Bangla words using image processing
JPH02116987A (ja) 文字認識装置
JP2917427B2 (ja) 図面読取装置
JP2000331122A (ja) 文字認識方法および装置
JP4136257B2 (ja) 文字認識装置、文字認識方法および記憶媒体
JPH0728935A (ja) 文書画像処理装置
Airphaiboon et al. Recognition of handprinted Thai characters using loop structures
JPH06348911A (ja) 英文字認識装置
JPH07271921A (ja) 文字認識装置および文字認識方法
JP3428504B2 (ja) 文字認識装置
JP2974396B2 (ja) 画像処理方法及び装置
JP2974145B2 (ja) 文字認識結果の修正方法
JP2982221B2 (ja) 文字読み取り装置
JP3151866B2 (ja) 英文字認識方法
JP2930996B2 (ja) 画像認識方法および画像認識装置
JP3245241B2 (ja) 文字認識装置および方法
JP3033904B2 (ja) 文字認識後処理方法
JP2963474B2 (ja) 類似文字識別方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070801

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080801

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080801

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090801

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090801

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100801

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110801

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110801

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120801

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130801

Year of fee payment: 10

EXPY Cancellation because of completion of term