JP3442206B2 - 文字認識方法及び文字認識装置 - Google Patents

文字認識方法及び文字認識装置

Info

Publication number
JP3442206B2
JP3442206B2 JP26336895A JP26336895A JP3442206B2 JP 3442206 B2 JP3442206 B2 JP 3442206B2 JP 26336895 A JP26336895 A JP 26336895A JP 26336895 A JP26336895 A JP 26336895A JP 3442206 B2 JP3442206 B2 JP 3442206B2
Authority
JP
Japan
Prior art keywords
character
image
result
rectangle
polygonal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP26336895A
Other languages
English (en)
Other versions
JPH09106441A (ja
Inventor
秀明 山形
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP26336895A priority Critical patent/JP3442206B2/ja
Publication of JPH09106441A publication Critical patent/JPH09106441A/ja
Application granted granted Critical
Publication of JP3442206B2 publication Critical patent/JP3442206B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は文字認識方法及び文
字認識装置に係り,特に,文字切り出し結果の不確定な
部分について,同一画像について文字切り出し結果を伝
搬させることにより,また,文字切り出し結果が確定し
ている画像との位置関係を用いて,文字切り出し結果が
不確定な画像の文字切り出し結果を確定することによ
り,文字切り出し結果の確度を向上させた文字認識方法
及び文字認識装置に関する。
【0002】
【従来の技術】従来より,OCR(Optical Character
Reader;光学式文字読取装置)においては,文字画像の
分離や接続のために文字の切り出しがうまく動作しない
場合がある。このように文字の切り出しが正常に動作し
ない場合には,認識結果を誤るだけでなく,認識結果の
修正作業も複雑となり,ユーザに対する負担の増加が著
しい。
【0003】このような文字切り出しの問題に対処する
従来技術としては,例えば特開平1−114992号公
報に開示されているものがある。文字の行(列)方向に
対し垂直方向に投影を取り,黒画素の存在部分を矩形と
して切り出したサブ文字パターンを,所定の標準文字サ
イズを基に統合,分解処理して文字を切り出すものであ
る。このように,従来の分離/接続している文字画像を
統合/分割する文字切り出し方法としては,この従来例
のように画像の大きさを見て判断する方法が多い。
【0004】
【発明が解決しようとする課題】このように上記従来の
文字切り出し方法にあっては,文字画像の大きさを見る
だけで統合/分割の判断を行う手法であるが,実際に
は,複数の画像を統合するかまたは統合しないか,或い
は,1つの画像を分割するかまたは分割しないかといっ
た判断は文字画像の大きさからだけでは判断できない場
合が多く,結果として,文字切り出し結果が不確定とな
る部分が多く,文字認識装置において正確な文字認識が
できないという問題点があった。
【0005】本発明は,上記従来の問題点に鑑みてなさ
れたものであって,文字切り出し結果の不確定な部分に
ついて,同一画像について文字切り出し結果を伝搬させ
ることにより,文字切り出し結果の確度を向上させた文
字認識方法及び文字認識装置を提供することを目的とし
ている。
【0006】また本発明の他の目的は,文字切り出し結
果が確定している画像との位置関係を用いて,文字切り
出し結果が不確定な画像の文字切り出し結果を確定する
ことにより,文字切り出し結果の確度を向上させた文字
認識方法及び文字認識装置を提供することである。
【0007】
【課題を解決するための手段】上記課題を解決するため
に,本発明の第1の特徴の文字認識方法は,入力した文
書画像について,同一種画素の連結成分を抽出し,該連
結成分と外接し閉包する多角形領域を定める領域抽出ス
テップと,隣接または重合する前記複数の多角形領域に
ついて,該多角形領域の幾何学的な相対関係と所定規則
に基づいて前記複数の多角形領域の統合または分離を判
断し,該判断結果に基づいて多角形領域及び該多角形領
域に含まれる画素成分を文字切り出し結果の確定した画
像か不確定な画像かを判断する文字切り出しステップ
と,を具備し,前記文字切り出しステップでは,文字切
り出し結果の確定した画像と同一形状の画像の文字切り
出し結果について,文字切り出し結果の確定した画像と
して判断するものである。
【0008】また,第2の特徴の文字認識方法は,入力
した文書画像について,同一種画素の連結成分を抽出
し,該連結成分と外接し閉包する多角形領域を定める領
域抽出ステップと,前記領域抽出ステップで定められた
多角形領域を参照して,行として該行内に含まれる多角
形領域を全て包含する行矩形,または,列として該列内
に含まれる多角形領域を全て包含する列矩形を抽出する
行または列切り出しステップと,前記行または列切り出
しステップで抽出された行矩形または列矩形に含まれ,
隣接または重合する前記複数の多角形領域について,該
多角形領域の幾何学的な相対関係と所定規則に基づいて
前記複数の多角形領域の統合または分離を判断し,該判
断結果に基づいて多角形領域及び該多角形領域に含まれ
る画素成分を文字切り出し結果の確定した画像か不確定
な画像かを判断する文字切り出しステップと,を具備
し,前記文字切り出しステップでは,文字切り出し結果
の確定した画像と同一形状の画像の文字切り出し結果に
ついて,文字切り出し結果の確定した画像として判断す
るものである。
【0009】また,第3の特徴の文字認識方法は,請求
項1または2記載の文字認識方法において,前記文字切
り出しステップでは,文字切り出し結果の不確定な画像
について,該文字切り出し結果の不確定な画像と文字切
り出し結果の確定した画像との相対的位置関係に基づい
て,文字切り出し結果の確定した画像か不確定な画像か
を判断するものである。
【0010】また,第4の特徴の文字認識方法は,請求
項1,2または3記載の文字認識方法において,前記文
字切り出しステップでは,文字切り出し結果の不確定な
画像について,該文字切り出し結果の不確定な画像の両
側が文字切り出し結果の確定した画像である場合には,
該文字切り出し結果の不確定な画像を文字切り出し結果
の確定した画像として判断するものである。
【0011】また,第5の特徴の文字認識方法は,請求
項2,3または4記載の文字認識方法において,前記文
字切り出しステップでは,文字切り出し結果の不確定な
画像について,該文字切り出し結果の不確定な画像が前
記行矩形または前記列矩形の端部に位置し,一方の側が
文字切り出し結果の確定した画像である場合には,該文
字切り出し結果の不確定な画像を文字切り出し結果の確
定した画像として判断するものである。
【0012】また,第6の特徴の文字認識方法は,請求
項1,2,3,4または5記載の文字認識方法におい
て,前記文字切り出しステップでは,文字切り出し結果
の確定した画像と同一形状の画像の文字切り出し結果に
ついて文字切り出し結果の確定した画像として判断する
際の同一形状の判断を,形状の大きさ,重心の位置及び
または複雑さに基づく類似度で行うものである。
【0013】更に,第7の特徴の文字認識方法は,請求
項1,2,3,4,5または6記載の文字認識方法にお
いて,前記文字切り出しステップでは,文字切り出し結
果の確定した画像か不確定な画像かを判断を繰り返し行
い,新たに確定される文字切り出し結果の画像が無くな
ったときに該繰り返し処理を終了するものである。
【0014】また,第1の特徴の文字認識装置は,入力
した文書画像について,同一種画素の連結成分を抽出
し,該連結成分と外接し閉包する多角形領域を定める領
域抽出手段と,隣接または重合する前記複数の多角形領
域について,該多角形領域の幾何学的な相対関係と所定
規則に基づいて前記複数の多角形領域の統合または分離
を判断し,該判断結果に基づいて多角形領域及び該多角
形領域に含まれる画素成分を文字切り出し結果の確定し
た画像か不確定な画像かを判断する文字切り出し手段
と,を具備し,前記文字切り出し手段は,文字切り出し
結果の確定した画像と同一形状の画像の文字切り出し結
果について,文字切り出し結果の確定した画像として判
断するものである。
【0015】更に,第2の特徴の文字認識装置は,入力
した文書画像について,同一種画素の連結成分を抽出
し,該連結成分と外接し閉包する多角形領域を定める領
域抽出手段と,前記領域抽出手段で定められた多角形領
域を参照して,行として該行内に含まれる多角形領域を
全て包含する行矩形,または,列として該列内に含まれ
る多角形領域を全て包含する列矩形を抽出する行または
列切り出し手段と,前記行または列切り出し手段で抽出
された行矩形または列矩形に含まれ,隣接または重合す
る前記複数の多角形領域について,該多角形領域の幾何
学的な相対関係と所定規則に基づいて前記複数の多角形
領域の統合または分離を判断し,該判断結果に基づいて
多角形領域及び該多角形領域に含まれる画素成分を文字
切り出し結果の確定した画像か不確定な画像かを判断す
る文字切り出し手段と,を具備し,前記文字切り出し手
段は,文字切り出し結果の確定した画像と同一形状の画
像の文字切り出し結果について,文字切り出し結果の確
定した画像として判断するものである。
【0016】
【発明の実施の形態】以下,本発明の文字認識方法及び
文字認識装置の概要について,並びに,本発明の文字認
識方法及び文字認識装置の一実施例について,順に図面
を参照して詳細に説明する。
【0017】〔本発明の文字認識方法及び文字認識装置
の概要〕図1は本発明に係る文字認識装置の原理説明図
であり,図2は本発明に係る文字認識方法の処理手順を
説明する概略フローチャートである。尚,図2において
は,多角形領域を文字矩形とし,行として該行内に含ま
れる文字矩形を全て包含する行矩形のみを取り扱うもの
としている。
【0018】本発明の第1の特徴の文字認識方法及び第
1の特徴の文字認識装置では,図1及び図2に示す如
く,先ず領域抽出ステップS201または領域抽出手段
101において,入力した文書画像111について,同
一種画素の連結成分を抽出し,該連結成分と外接し閉包
する多角形領域(文字矩形)を定め,次に文字切り出し
ステップS203〜211または文字切り出し手段10
3において,隣接または重合する複数の多角形領域(文
字矩形)について,幾何学的な相対関係と所定規則に基
づいて多角形領域(文字矩形)の統合または分離を判断
(ステップS206)する(後に図3および図4を使っ
て詳述する)。また,該判断結果に基づいて多角形領域
及び該多角形領域に含まれる画素成分を文字切り出し結
果の確定した画像か不確定な画像かを判断するように
し,また,文字切り出し結果の確定した画像と同一形状
の画像の文字切り出し結果について,文字切り出し結果
の確定した画像として判断する(ステップS208及び
S209)ようにしている(後に図6ないし図9を使っ
て詳述する)
【0019】このように,幾何学的な相対関係と所定規
則に基づいて多角形領域(文字矩形)の統合または分離
を判断した後,文字切り出し結果の不確定な画像につい
ては,同一形状の画像について確定した文字切り出し結
果の画像を伝搬させ,また,文字切り出し結果が確定し
た画像との位置関係を用いて,文字切り出し結果が不確
定な画像の文字切り出し結果を確定していくことによ
り,文字切り出し結果の確度を向上させることができ
る。
【0020】また,第2の特徴の文字認識方法及び第2
の特徴の文字認識装置では,図1及び図2に示す如く,
先ず領域抽出ステップS201または領域抽出手段10
1において,入力した文書画像について,同一種画素の
連結成分を抽出し,該連結成分と外接し閉包する多角形
領域(文字矩形)を定め,次に行または列切り出しステ
ップS202または行または列切り出し手段102にお
いて,領域抽出ステップS201または領域抽出手段1
01で定められた多角形領域(文字矩形)を参照して,
行として該行内に含まれる多角形領域(文字矩形)を全
て包含する行矩形,または,列として該列内に含まれる
多角形領域(文字矩形)を全て包含する列矩形を抽出
し,次に文字切り出しステップS203〜S211また
は文字切り出し手段103において,行または列切り出
しステップS202または行または列切り出し手段10
2で抽出された行矩形または列矩形に含まれ,隣接また
は重合する複数の多角形領域(文字矩形)について,幾
何学的な相対関係と所定規則に基づいて多角形領域(文
字矩形)の統合または分離を判断し,該判断結果に基づ
いて多角形領域及び該多角形領域に含まれる画素成分を
文字切り出し結果の確定した画像か不確定な画像かを判
断するようにし,また,文字切り出し結果の確定した画
像と同一形状の画像の文字切り出し結果について,文字
切り出し結果の確定した画像として判断する(ステップ
S208及びS209)ようにしている。
【0021】このように,幾何学的な相対関係と所定規
則に基づいて多角形領域(文字矩形)の統合または分離
を判断した後,行矩形または列矩形内で文字切り出し結
果の不確定な画像については,同一形状の画像について
確定した文字切り出し結果の画像を伝搬させ,また,文
字切り出し結果が確定した画像との位置関係を用いて,
文字切り出し結果が不確定な画像の文字切り出し結果を
確定していくことにより,文字切り出し結果の確度を向
上させることができる。
【0022】また,第3の特徴の文字認識方法では,図
2に示す如く,文字切り出しステップS203〜S21
1において,文字切り出し結果の不確定な画像につい
て,該文字切り出し結果の不確定な画像と文字切り出し
結果の確定した画像との相対的位置関係に基づいて,文
字切り出し結果の確定した画像か不確定な画像かを判断
する(ステップS208)のが望ましい。
【0023】また,第4の特徴の文字認識方法では,図
2に示す如く,文字切り出しステップS203〜S21
1において,文字切り出し結果の不確定な画像につい
て,該文字切り出し結果の不確定な画像の両側が文字切
り出し結果の確定した画像である場合には,該文字切り
出し結果の不確定な画像を文字切り出し結果の確定した
画像として判断する(ステップS208)のが望まし
い。
【0024】また,第5の特徴の文字認識方法では,図
2に示す如く,文字切り出しステップS203〜S21
1において,文字切り出し結果の不確定な画像につい
て,該文字切り出し結果の不確定な画像が前記行矩形ま
たは前記列矩形の端部に位置し,一方の側が文字切り出
し結果の確定した画像である場合には,該文字切り出し
結果の不確定な画像を文字切り出し結果の確定した画像
として判断する(ステップS208)のが望ましい。
【0025】また,第6の特徴の文字認識方法では,図
2に示す如く,文字切り出しステップS203〜S21
1において,文字切り出し結果の確定した画像と同一形
状の画像の文字切り出し結果について文字切り出し結果
の確定した画像として判断する際の同一形状の判断を,
形状の大きさ,重心の位置及びまたは複雑さに基づく類
似度で行う(ステップS208)のが望ましい。
【0026】更に,第7の特徴の文字認識方法では,図
2に示す如く,文字切り出しステップS203〜S21
1において,文字切り出し結果の確定した画像か不確定
な画像かを判断を繰り返し行い,新たに確定される文字
切り出し結果の画像が無くなったときに該繰り返し処理
を終了する(ステップS210,S211)のが望まし
い。
【0027】〔実施例〕図1は本発明の一実施例に係る
文字認識装置の構成図である。同図において,本実施例
の文字認識装置は,矩形抽出部101,行切り出し部1
02,文字切り出し部103,文字認識部104,パス
選択部105及びパターン辞書メモリ106を備えて構
成されている。
【0028】矩形抽出部(領域抽出手段)101は,入
力した文書画像111について,同一種画素の連結成分
を抽出し,該連結成分と外接し閉包する矩形領域(文字
矩形)を定める。
【0029】また行切り出し部(行または列切り出し手
段)102は,領域抽出手段101で定められた文字矩
形を参照して,行として該行内に含まれる文字矩形を全
て包含する行矩形を抽出する。
【0030】また文字切り出し部(文字切り出し手段)
103は,行切り出し部102で抽出された行矩形に含
まれ,隣接または重合する文字矩形について,幾何学的
な相対関係と所定規則に基づいて文字矩形の統合または
分離を判断し,該判断結果に基づいて文字切り出し結果
の確定した画像か不確定な画像かを判断する。
【0031】また文字認識部104は,切り出された文
字画像について,パターン辞書メモリ106を参照し
て,パターンマッチングを行う。更にパス選択部は,文
字切り出し結果の確定していない文字画像の認識結果を
参照して,一番もっともらしい組合せの認識結果を選択
する。
【0032】以下では,本発明の特徴的な部分である文
字切り出し部103の動作を中心に,図2に示す概略フ
ローチャート及び各処理における具体例を参照しなが
ら,詳細に説明する。
【0033】図2において,先ず,領域抽出ステップS
201では,入力した文書画像111について,黒画素
の連結成分を抽出し,該連結成分と外接する文字矩形を
求める。次に,行切り出しステップS202では,求め
られた文字矩形を参照して,行として該行内に含まれる
文字矩形を全て包含する行矩形を抽出する。
【0034】次に,文字切り出しステップS203〜S
211では,行切り出しステップS202で抽出された
行矩形に含まれ,隣接または重合する文字矩形について
幾何学的な相対関係と所定規則に基づき統合/分離の判
断(以下,行内矩形の統合処理という;ステップS20
3〜S207)を行い,該判断結果に基づいて文字切り
出し結果の確定した文字矩形か不確定な文字矩形かを判
断すると共に,確定した文字矩形を行矩形内で伝搬させ
ていく(以下,確定文字矩形の伝搬処理という;ステッ
プS208〜S210)。
【0035】先ず,行内矩形の統合処理ステップS20
3〜S207について説明する。ステップS203にお
いては,それぞれの文字矩形がどの行矩形に存在するか
を求める。具体的には,画像の左上を原点として,行矩
形Liの左上の座標を(Lxs,Lys),右下の座標
を(Lxe,Lye),文字矩形の左上座標を(Rx
s,Rys),右下の座標を(Rxe,Rye)とする
とき,次の条件式を全て満たす場合に,該文字矩形は行
矩形Liに属すると判断する。 Lxs<Rxs Lxe>Rxe Lys<Rys Lye>Rye (1)
【0036】次にステップS204において,統合数カ
ウンタCiを”0”にリセットする。そしてステップS
205では,同一行矩形Li内の文字矩形について,行
方向の重なりの度合を計算する。重なりの度合OLap
は,2つの文字矩形の行方向での重なりvと,2つの文
字矩形の行方向の幅の小さい方の値であるWから,次式
で算出される。 OLap=v/W (2)
【0037】次に,ステップS206において,各文字
矩形の統合/分離が判断される。ここで,先ず2つの文
字矩形の重なり度合から,以下の3通りの統合矩形を生
成する。
【0038】[重なりの度合が小さい場合]重なり度合
の下限をOLthLowとするとき, OLap≦OLthLow (3) を満たす場合には,2つの文字矩形を統合せず,そのま
まの文字矩形を統合矩形とした分離矩形とする。また,
ここで文字矩形の縦横比をAs,縦横比Asの下限をA
sthLow,縦横比Asの上限をAsthUpとする
とき, AsthLow<As<AsthUp (4) を満たす場合には,該統合矩形を確定文字矩形とする。
【0039】[重なりの度合が中程度の場合]重なり度
合の上限をOLthUpとするとき, OLthLow<OLap<OLthUp (5) を満たす場合には,統合矩形と分離矩形の両方を統合矩
形とし,統合数カウンタCiをインクリメントする。
【0040】[重なりの度合が大きい場合] OLthUp≦OLap (6) を満たす場合には,統合矩形のみを統合矩形とし,統合
数カウンタCiをインクリメントする。
【0041】次にステップS207においては,ステッ
プS206の処理結果により統合数カウンタCiが”
0”でない場合には,ステップS204に戻り,”0”
である(新たに統合が行われなかった)場合には,確定
文字矩形の伝搬処理に進む。
【0042】ここで,図3に示す具体例を参照して,行
内矩形の統合処理を具体的に説明する。文字矩形の抽出
結果が図3(a)であったとする。先ず図3(b−イ)
に示す如く,文字画像「い」については,文字矩形31
5及び316の重なりは無く(v=−18),重なり度
合が小さい場合に相当して,文字矩形315及び316
は分離矩形とされる。
【0043】また文字画像「お」については,図3(b
−ロ)に示す如く,行方向の重なりv=6で,W=11
であるため, OLap=6/11>OLapUp(0.5) となって,重なり度合が大きい場合に相当して,文字矩
形325及び326は統合されて,統合矩形327が生
成される。
【0044】更に文字画像「か」については,図3(b
−ニ)に示す如く,行方向の重なりv=1で,W=18
であるため, OLap=1/18<OLapUp(0.5) となって,重なり度合が中程度の場合に相当して,文字
矩形335及び336がそれぞれ分離矩形とされると共
に,統合矩形337も生成される。
【0045】以上の行内矩形の統合処理において,3つ
の場合分けを行うのは,同じ文字画像が,場合によって
(例えば,位置関係における1画素のずれで)統合され
たり分離されたり不確定となるのを防ぐためである。つ
まり,図4に示すように,重なり度合OLapの値で統
合/分離の2つの場合分けを行ったときには,図4(b
−イ)に示すように,本来同一画像と見なされるべきも
のが同一画像として扱われないといった不具合が発生す
る恐れがある。これに対して,上記3つの場合分けを行
う方法では,このような場合に対しても,図4(b−
ロ)に示す如く,確実に対処することができる。
【0046】次に,確定文字矩形の伝搬処理ステップS
208〜S210について説明する。同一行矩形内で両
隣の文字矩形が確定文字矩形である場合に,挟まれてい
る文字矩形を確定文字矩形と判断できる。また,確定文
字矩形と判断された文字矩形と同一形状の文字矩形も確
定文字矩形と判断できる。これらの判断処理を繰り返す
ことで,原稿(文書画像)上のより多くの文字矩形を確
定文字矩形として抽出することができる。
【0047】先ず第1に,文字矩形の統合処理におい
て,統合された文字矩形と分離されたままの文字矩形の
両方を統合矩形として備えている文字画像について,統
合矩形または分離矩形の一方或いは何れかが確定文字矩
形と判断されている場合には,以下の条件に基づいて,
統合矩形または分離矩形の何れかを削除する。
【0048】[条件A]:統合された統合矩形を削除す
る場合 統合された統合矩形が確定文字矩形ではなく,分離され
たままの統合矩形が1つでも確定文字矩形のとき,或い
は,統合された統合矩形が確定文字矩形であって,且
つ,分離されたままの統合矩形が全て確定文字矩形のと
き,統合された統合矩形を削除する。
【0049】例えば,図5(d)では,分離されたまま
の統合矩形525が確定文字矩形であるので,条件Aが
適用されて統合された統合矩形527は削除される。ま
た,図5(e)では,統合された統合矩形527が確定
文字矩形であって,且つ,分離されたままの統合矩形5
25及び526が確定文字矩形であるので,統合された
統合矩形527は削除される。
【0050】[条件B]:分離されたままの統合矩形を
削除する場合 分離されたままの統合矩形と統合された統合矩形の何れ
か一方或いは両方が確定文字矩形で,条件Aに適合しな
いとき,分離されたままの統合矩形を削除する。
【0051】例えば,図5(b)では,分離されたまま
の統合矩形516と統合された統合矩形517が確定文
字矩形であるので,条件Bが適用されて分離されたまま
の統合矩形515及び516は削除される。また,図5
(c)では,統合された統合矩形517が確定文字矩形
であって,分離されたままの統合矩形515及び516
が不確定文字矩形であるので,分離されたままの統合矩
形515及び516は削除される。尚,図5(a)の場
合には,条件A及び条件B共に適合せず,何れの統合矩
形も削除されない。
【0052】次に第2の処理として,同一行矩形内で,
両隣の文字矩形が確定文字矩形である文字矩形を探す。
原稿上に該当する文字矩形が1つも存在しない場合に
は,以下の処理は行わない。尚,図2においては,処理
手順を分かり易くするために,ステップS210で新た
に確定した文字矩形があるか否かの判断で確定文字矩形
の伝搬処理の終了判断を行うようにしているが,当該第
2の処理のように前もって終了判断を行うとしてもよ
く,本質的な差異はない。
【0053】次に第3の処理として,同一行矩形内で,
両隣の文字矩形が確定文字矩形である文字矩形を確定文
字矩形とする。
【0054】次に第4の処理として,確定文字矩形と判
断された文字矩形と同一形状を持つ文字矩形で,単純矩
形でないものを確定文字矩形とし,第1の処理に戻る。
【0055】ここで先ず,文字矩形が同一形状か否かの
判断について説明する。本実施例では以下の3つの判断
基準により同一/非同一の判断を行う。
【0056】[判断基準1]:文字矩形の高さの差また
は幅の差の何れかが,高幅差のしきい値WDthよりも
大きい場合には,2つの文字画像は非同一とする。
【0057】[判断基準2]:それぞれの文字画像の重
心を求め,画像の左上を基準とした重心の位置の差が,
重心差のしきい値STthよりも大きい場合には,2つ
の文字画像は非同一とする。
【0058】[判断基準3]:2つの文字画像の画像の
重心を合わせて排他的論理和を取った画像(EOR画像
という)を作成し,該EOR画像に対して,2×2のマ
スク処理を行い,2×2の領域内に3画素以上の黒画素
(2つの画像の画素値が異なる画素)が検出されたなら
2つの画像は非同一とし,また全ての2×2の領域につ
いて検出されなければ2つの文字画像は同一と判断す
る。
【0059】またここで,単純矩形か否かの判断基準
は,以下の通りである。尚,単純矩形の場合には,確定
文字矩形の伝搬処理を行わないのは,単純矩形の場合,
確定文字矩形で文字として出現する場合と,統合されて
文字として出現する場合とが混在する可能性が高いから
である。例えば,文字画像「一」と「三」における横棒
などが典型的な例である。
【0060】[単純矩形の判断基準]文字矩形の幅/高
さの大きい方をLrとし,文字矩形内の縦方向/横方向
のラインでランが2つ以上あるラインの数の合計をNr
unとし,しきい値をSplthとしたとき,次式を満
たすものは,単純矩形である。 Nrun<Lr×Splth (7)
【0061】次に,図6から図11までに示す具体例を
参照して,確定文字矩形の伝搬処理を説明する。尚,図
2の処理手順では,行単位で行矩形の統合処理及び確定
文字矩形の伝搬処理を行うようになっているが,以下で
は,文書単位で行矩形の統合処理の結果が得られたもの
として,確定文字矩形の伝搬処理を行う。後者の方が,
同一文字矩形の検出についてより効率的となる。
【0062】先ず,図6は行矩形の統合処理によって得
られた結果である。不確定な文字矩形として,602,
608,609,611,615,621,626,6
29,631,634及び639を含んでいる。
【0063】図7において,文字矩形602の文字画像
「4」は,両側が確定文字矩形であるので,確定文字矩
形として判断される。また,文字矩形611の文字画像
「ト」は,行末であって一方の側が確定文字矩形610
であるので,確定文字矩形と判断される。更に,文字画
像「4」については,同一形状の画像が存在するので,
これらの文字矩形613及び639を確定文字矩形とす
る。尚,確定文字矩形と他の文字矩形との組み合わせと
なっている統合矩形615及び639について削除す
る。
【0064】次に図8において,新たに文字矩形614
の文字画像「3」及び文字矩形637の文字画像「3」
が,両側が確定文字矩形となるので,これらを確定文字
矩形とする。
【0065】更に図9において,文字矩形608の文字
画像「メ」,文字矩形609の文字画像「リ」について
は,他に統合矩形がないので,1文字の文字矩形として
確定する。また,文字画像「約」,「能」,「詳」及び
「くは」については,複数の統合矩形が重なり合ってい
るので,パス選択部105によるパス選択処理を行う。
【0066】図10は,本具体例の文字画像「約」につ
いてのパス選択処理の説明図である。それぞれの文字矩
形619,620及び621に含まれる文字画像につい
て,文字認識部104のパターン辞書メモリ106に基
づく認識処理が行われ,認識結果及び類似度が得られ
る。これらの類似度平均を算出し,分けた場合の類似度
平均よりも統合した場合の類似度が大きいので,統合し
たパスが選択され,認識結果”約”が選択されることと
なる。
【0067】他の文字画像についても,同様のパス選択
処理がなされ,図11に示すような結果が得られる。
【0068】
【発明の効果】以上説明したように,本発明の第1の特
徴の文字認識方法及び第1の特徴の文字認識装置によれ
ば,先ず領域抽出ステップまたは領域抽出手段におい
て,入力した文書画像について,同一種画素の連結成分
を抽出し,該連結成分と外接し閉包する多角形領域を定
め,次に文字切り出しステップまたは文字切り出し手段
において,隣接または重合する複数の多角形領域につい
て,幾何学的な相対関係と所定規則に基づいて多角形領
域の統合または分離を判断し,該判断結果に基づいて多
角形領域及び該多角形領域に含まれる画素成分を文字切
り出し結果の確定した画像か不確定な画像かを判断する
ようにし,また,文字切り出し結果の確定した画像と同
一形状の画像の文字切り出し結果について,文字切り出
し結果の確定した画像として判断することとし,幾何学
的な相対関係と所定規則に基づいて多角形領域の統合ま
たは分離を判断した後,文字切り出し結果の不確定な画
像については,同一形状の画像について確定した文字切
り出し結果の画像を伝搬させ,また,文字切り出し結果
が確定した画像との位置関係を用いて,文字切り出し結
果が不確定な画像の文字切り出し結果を確定していくこ
ととしたので,文字切り出し結果の確度を向上させ得る
文字認識方法及び文字認識装置を提供することができ
る。
【0069】また,第2の特徴の文字認識方法及び第2
の特徴の文字認識装置によれば,先ず領域抽出ステップ
または領域抽出手段において,入力した文書画像につい
て,同一種画素の連結成分を抽出し,該連結成分と外接
し閉包する多角形領域を定め,次に行または列切り出し
ステップまたは行または列切り出し手段において,領域
抽出ステップまたは領域抽出手段で定められた多角形領
域を参照して,行として該行内に含まれる多角形領域を
全て包含する行矩形,または,列として該列内に含まれ
る多角形領域を全て包含する列矩形を抽出し,次に文字
切り出しステップまたは文字切り出し手段において,行
または列切り出しステップまたは行または列切り出し手
段で抽出された行矩形または列矩形に含まれ,隣接また
は重合する複数の多角形領域について,幾何学的な相対
関係と所定規則に基づいて多角形領域の統合または分離
を判断し,該判断結果に基づいて多角形領域及び該多角
形領域に含まれる画素成分を文字切り出し結果の確定し
た画像か不確定な画像かを判断するようにし,また,文
字切り出し結果の確定した画像と同一形状の画像の文字
切り出し結果について,文字切り出し結果の確定した画
像として判断することとし,幾何学的な相対関係と所定
規則に基づいて多角形領域の統合または分離を判断した
後,行矩形または列矩形内で文字切り出し結果の不確定
な画像については,同一形状の画像について確定した文
字切り出し結果の画像を伝搬させ,また,文字切り出し
結果が確定した画像との位置関係を用いて,文字切り出
し結果が不確定な画像の文字切り出し結果を確定してい
くこととしたので,文字切り出し結果の確度を向上させ
得る文字認識方法及び文字認識装置を提供することがで
きる。
【0070】また,第3の特徴の文字認識方法によれ
ば,文字切り出し結果の不確定な画像について,該文字
切り出し結果の不確定な画像と文字切り出し結果の確定
した画像との相対的位置関係に基づいて,文字切り出し
結果の確定した画像か不確定な画像かを判断することと
したので,文字切り出し結果の確度をより向上させ得る
文字認識方法を提供することができる。
【0071】また,第4の特徴の文字認識方法によれ
ば,文字切り出し結果の不確定な画像について,該文字
切り出し結果の不確定な画像の両側が文字切り出し結果
の確定した画像である場合には,該文字切り出し結果の
不確定な画像を文字切り出し結果の確定した画像として
判断することとしたので,文字切り出し結果の確度をよ
り向上させ得る文字認識方法を提供することができる。
【0072】また,第5の特徴の文字認識方法によれ
ば,,文字切り出し結果の不確定な画像について,該文
字切り出し結果の不確定な画像が行矩形または列矩形の
端部に位置し,一方の側が文字切り出し結果の確定した
画像である場合には,該文字切り出し結果の不確定な画
像を文字切り出し結果の確定した画像として判断するこ
ととしたので,文字切り出し結果の確度をより向上させ
得る文字認識方法を提供することができる。
【0073】また,第6の特徴の文字認識方法によれ
ば,文字切り出し結果の確定した画像と同一形状の画像
の文字切り出し結果について文字切り出し結果の確定し
た画像として判断する際の同一形状の判断を,形状の大
きさ,重心の位置及びまたは複雑さに基づく類似度で行
うこととしたので,文字切り出し結果の確度をより向上
させ得る文字認識方法を提供することができる。
【0074】更に,第7の特徴の文字認識方法によれ
ば,文字切り出し結果の確定した画像か不確定な画像か
を判断を繰り返し行い,新たに確定される文字切り出し
結果の画像が無くなったときに該繰り返し処理を終了す
ることとしたので,文字切り出し結果の確度をより向上
させ得る文字認識方法を提供することができる。
【図面の簡単な説明】
【図1】本発明に係る文字認識装置の原理説明図であ
り,本発明の一実施例に係る文字認識装置の構成図であ
る。
【図2】本発明に係る文字認識方法の処理手順を説明す
る概略フローチャートである。
【図3】実施例における行内矩形の統合処理を具体的に
説明する説明図である。
【図4】行内矩形の統合処理において3つの場合分けを
行う理由を説明する説明図である。
【図5】統合された統合矩形を削除する場合及び分離さ
れたままの統合矩形を削除する場合の具体例を説明する
説明図である。
【図6】確定文字矩形の伝搬処理の説明図(その1)で
あり,行矩形の統合処理によって得られた結果である。
【図7】確定文字矩形の伝搬処理の説明図(その2)で
ある。
【図8】確定文字矩形の伝搬処理の説明図(その3)で
ある。
【図9】確定文字矩形の伝搬処理の説明図(その4)で
ある。
【図10】パス選択処理を説明する説明図である。
【図11】確定文字矩形の伝搬処理の説明図(その5)
であり,認識結果である。
【符号の説明】
101 矩形抽出部(領域抽出手段) 102 行切り出し部(行または列切り出し手段) 103 文字切り出し部(文字切り出し手段) 104 文字認識部 105 パス選択部 106 パターン辞書メモリ 111 文書画像入力 112 認識結果出力

Claims (9)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力した文書画像について,同一種画素
    の連結成分を抽出し,該連結成分と外接し閉包する多角
    形領域を定める領域抽出ステップと,隣接または重合す
    る前記複数の多角形領域について,該多角形領域の幾何
    学的な相対関係と所定規則に基づいて前記複数の多角形
    領域の統合または分離を判断し,該判断結果に基づいて
    多角形領域及び該多角形領域に含まれる画素成分を文字
    切り出し結果の確定した画像か不確定な画像かを判断す
    る文字切り出しステップと,を有し,前記文字切り出し
    ステップでは,文字切り出し結果の確定した画像と同一
    形状の画像の文字切り出し結果について,文字切り出し
    結果の確定した画像として判断することを特徴とする文
    字認識方法。
  2. 【請求項2】 入力した文書画像について,同一種画素
    の連結成分を抽出し,該連結成分と外接し閉包する多角
    形領域を定める領域抽出ステップと,前記領域抽出ステ
    ップで定められた多角形領域を参照して,行として該行
    内に含まれる多角形領域を全て包含する行矩形,また
    は,列として該列内に含まれる多角形領域を全て包含す
    る列矩形を抽出する行または列切り出しステップと,前
    記行または列切り出しステップで抽出された行矩形また
    は列矩形に含まれ,隣接または重合する前記複数の多角
    形領域について,該多角形領域の幾何学的な相対関係と
    所定規則に基づいて前記複数の多角形領域の統合または
    分離を判断し,該判断結果に基づいて多角形領域及び該
    多角形領域に含まれる画素成分を文字切り出し結果の確
    定した画像か不確定な画像かを判断する文字切り出しス
    テップと,を有し,前記文字切り出しステップでは,文
    字切り出し結果の確定した画像と同一形状の画像の文字
    切り出し結果について,文字切り出し結果の確定した画
    像として判断することを特徴とする文字認識方法。
  3. 【請求項3】 前記文字切り出しステップでは,文字切
    り出し結果の不確定な画像について,該文字切り出し結
    果の不確定な画像と文字切り出し結果の確定した画像と
    の相対的位置関係に基づいて,文字切り出し結果の確定
    した画像か不確定な画像かを判断することを特徴とする
    請求項1または2記載の文字認識方法。
  4. 【請求項4】 前記文字切り出しステップでは,文字切
    り出し結果の不確定な画像について,該文字切り出し結
    果の不確定な画像の両側が文字切り出し結果の確定した
    画像である場合には,該文字切り出し結果の不確定な画
    像を文字切り出し結果の確定した画像として判断するこ
    とを特徴とする請求項1,2または3記載の文字認識方
    法。
  5. 【請求項5】 前記文字切り出しステップでは,文字切
    り出し結果の不確定な画像について,該文字切り出し結
    果の不確定な画像が前記行矩形または前記列矩形の端部
    に位置し,一方の側が文字切り出し結果の確定した画像
    である場合には,該文字切り出し結果の不確定な画像を
    文字切り出し結果の確定した画像として判断することを
    特徴とする請求項2,3または4記載の文字認識方法。
  6. 【請求項6】 前記文字切り出しステップでは,文字切
    り出し結果の確定した画像と同一形状の画像の文字切り
    出し結果について文字切り出し結果の確定した画像とし
    て判断する際の同一形状の判断を,形状の大きさ,重心
    の位置及びまたは複雑さに基づく類似度で行うことを特
    徴とする請求項1,2,3,4または5記載の文字認識
    方法。
  7. 【請求項7】 前記文字切り出しステップでは,文字切
    り出し結果の確定した画像か不確定な画像かを判断を繰
    り返し行い,新たに確定される文字切り出し結果の画像
    が無くなったときに該繰り返し処理を終了することを特
    徴とする請求項1,2,3,4,5または6記載の文字
    認識方法。
  8. 【請求項8】 入力した文書画像について,同一種画素
    の連結成分を抽出し,該連結成分と外接し閉包する多角
    形領域を定める領域抽出手段と,隣接または重合する前
    記複数の多角形領域について,該多角形領域の幾何学的
    な相対関係と所定規則に基づいて前記複数の多角形領域
    の統合または分離を判断し,該判断結果に基づいて多角
    形領域及び該多角形領域に含まれる画素成分を文字切り
    出し結果の確定した画像か不確定な画像かを判断する文
    字切り出し手段と,を有し,前記文字切り出し手段は,
    文字切り出し結果の確定した画像と同一形状の画像の文
    字切り出し結果について,文字切り出し結果の確定した
    画像として判断することを特徴とする文字認識装置。
  9. 【請求項9】 入力した文書画像について,同一種画素
    の連結成分を抽出し,該連結成分と外接し閉包する多角
    形領域を定める領域抽出手段と,前記領域抽出手段で定
    められた多角形領域を参照して,行として該行内に含ま
    れる多角形領域を全て包含する行矩形,または,列とし
    て該列内に含まれる多角形領域を全て包含する列矩形を
    抽出する行または列切り出し手段と,前記行または列切
    り出し手段で抽出された行矩形または列矩形に含まれ,
    隣接または重合する前記複数の多角形領域について,該
    多角形領域の幾何学的な相対関係と所定規則に基づいて
    前記複数の多角形領域の統合または分離を判断し,該判
    断結果に基づいて多角形領域及び該多角形領域に含まれ
    る画素成分を文字切り出し結果の確定した画像か不確定
    な画像かを判断する文字切り出し手段と,を有し,前記
    文字切り出し手段は,文字切り出し結果の確定した画像
    と同一形状の画像の文字切り出し結果について,文字切
    り出し結果の確定した画像として判断することを特徴と
    する文字認識装置。
JP26336895A 1995-10-11 1995-10-11 文字認識方法及び文字認識装置 Expired - Lifetime JP3442206B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26336895A JP3442206B2 (ja) 1995-10-11 1995-10-11 文字認識方法及び文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26336895A JP3442206B2 (ja) 1995-10-11 1995-10-11 文字認識方法及び文字認識装置

Publications (2)

Publication Number Publication Date
JPH09106441A JPH09106441A (ja) 1997-04-22
JP3442206B2 true JP3442206B2 (ja) 2003-09-02

Family

ID=17388526

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26336895A Expired - Lifetime JP3442206B2 (ja) 1995-10-11 1995-10-11 文字認識方法及び文字認識装置

Country Status (1)

Country Link
JP (1) JP3442206B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5561102B2 (ja) * 2009-12-14 2014-07-30 富士通株式会社 文字認識装置、文字認識プログラムおよび文字認識方法
CN111488870A (zh) * 2019-01-28 2020-08-04 富士通株式会社 文字识别方法和文字识别装置

Also Published As

Publication number Publication date
JPH09106441A (ja) 1997-04-22

Similar Documents

Publication Publication Date Title
EP0854434A1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
JPH0620092A (ja) 文書画像の領域識別方法
JPH09179937A (ja) 文書画像のセンテンスの境界の自動識別方法
JPH09179942A (ja) Ocrを利用しない文書画像中のドロップワードの自動認識方法
JP3615333B2 (ja) 罫線消去装置
JP3442206B2 (ja) 文字認識方法及び文字認識装置
JP3187895B2 (ja) 文字領域抽出方法
JP3848792B2 (ja) 文字列認識方法及び記録媒体
JP3548234B2 (ja) 文字認識方法及び装置
JPS61117670A (ja) 文字切り出し処理方式
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JP2728086B2 (ja) 文字切り出し方法
JPH05128308A (ja) 文字認識装置
JP4580520B2 (ja) 文字認識方法および文字認識装置
JP3665435B2 (ja) 文字認識装置および文字認識方法
JPH09106437A (ja) 文字切出し装置および文字切出し方法
JP2001266070A (ja) 文字認識装置、文字認識方法および記憶媒体
JP2728085B2 (ja) 文字切り出し方法
JP2683116B2 (ja) 罫線の除去方法
JP3653156B2 (ja) 文書画像領域抽出方法
JPH10134145A (ja) 文字切り出し方法およびそれを用いた文字認識装置と、その文字切り出し方法を実行するプログラムを格納した、コンピュータが読取可能な記憶媒体
JPH1069522A (ja) 文字認識装置及び文字認識方法並びに文字認識方法を記録した記録媒体
JP2000222524A (ja) 罫線除去方法及び装置、記録媒体
JPH06251197A (ja) 文字切り出し装置
JPH11232386A (ja) 画像処理方法および記録媒体

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080620

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090620

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090620

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100620

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110620

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110620

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120620

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130620

Year of fee payment: 10

EXPY Cancellation because of completion of term