JP2003281468A - 文字認識装置および文字認識方法 - Google Patents

文字認識装置および文字認識方法

Info

Publication number
JP2003281468A
JP2003281468A JP2002079137A JP2002079137A JP2003281468A JP 2003281468 A JP2003281468 A JP 2003281468A JP 2002079137 A JP2002079137 A JP 2002079137A JP 2002079137 A JP2002079137 A JP 2002079137A JP 2003281468 A JP2003281468 A JP 2003281468A
Authority
JP
Japan
Prior art keywords
character
line
black pixel
pixel connected
connected component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002079137A
Other languages
English (en)
Inventor
Shunji Ariyoshi
俊二 有吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2002079137A priority Critical patent/JP2003281468A/ja
Publication of JP2003281468A publication Critical patent/JP2003281468A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】隣接する文字行に属する文字同士が接触した
り、文字行の近くにノイズが存在したりする場合にも、
正しく文字行を検出することを可能にし、結果的に文字
認識性能の向上が図れる文字認識装置および文字認識方
法を提供する。 【解決手段】スキャナにより帳票全体の画像を取込み、
この取込んだ画像全体から、あらかじめ定められた読取
領域を検出し、この検出した読取領域内において、あら
かじめ定められた方向の文字行を検出し、この検出した
各文字行から文字を1つずつ検出し、この検出した各文
字を認識する文字認識装置の行検出において、黒画素連
結成分の統合による行の検出と、検出した各行内で大き
すぎる黒画素連結成分の除去を繰り返し行なうことによ
り、文字接触があっても正しく行検出を行なう。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、たとえば、帳票上
の画像をスキャナで取込み、帳票上に記載された文字を
パターン認識技術を用いて読取る文字認識装置および文
字認識方法に関する。
【0002】
【従来の技術】従来、文字認識装置で読取るべき帳票に
は、ひとつひとつの文字ごとに所定色の文字枠が印刷さ
れており、この文字枠を利用することで簡単に個々の文
字を抽出することができるように工夫されていた。しか
し、近年では、文字認識装置専用の帳票以外の一般の帳
票も文字認識装置で読取ることが行なわれるようになっ
てきた。そのため、文字枠や行枠のない自由に記載され
た文字列を認識する必要が生じてきた。
【0003】このような自由記載帳票の読取りを行なう
文字認識装置は、スキャナにより帳票全体の画像を取込
み、この取込んだ画像全体から、あらかじめ定められた
読取領域を検出し、この検出した読取領域内において、
あらかじめ定められた方向の文字行を検出し、この検出
した各文字行から文字を1つずつ検出し、この検出した
各文字を認識するようになっている。このような従来の
文字認識装置における文字行の検出(切出し)は、検出
された読取領域内の画像を2値化し、この2値化した画
像から黒画素連結成分を抽出し、近接した黒画素連結成
分同士を統合することにより行を生成している。
【0004】
【発明が解決しようとする課題】上記したように、従来
の文字認識装置においては、文字行を検出するにあたっ
て、黒画素連結成分を統合して文字行を構成する方法が
用いられていた。しかし、この方法では、隣接する文字
行に属する文字同士が接触して、1つの黒画素連結成分
となっているような場合には、誤った文字行の検出結果
が得られ、正しく文字認識を行なうことができなくなる
という問題がある。同様に、この方法では、大きなノイ
ズが文字行の近くにある場合には、誤った文字行の検出
結果が得られ、正しく文字認識を行なうことができなく
なるという問題がある。
【0005】そこで、本発明は、隣接する文字行に属す
る文字同士が接触したり、文字行の近くにノイズが存在
したりする場合にも、正しく文字行を検出することを可
能にし、結果的に文字認識性能の向上が図れる文字認識
装置および文字認識方法を提供することを目的とする。
【0006】
【課題を解決するための手段】本発明の文字認識装置
は、複数の文字行が記載された被読取物の画像を入力す
る画像入力手段と、この画像入力手段により入力された
画像から読取る領域を検出する領域検出手段と、この領
域検出手段により検出された読取領域から前記文字行を
検出する行検出手段と、この行検出手段により検出され
た文字行に対し1文字ごとに文字認識を行なう文字認識
手段とを有する文字認識装置であって、前記行検出手段
は、前記検出された読取領域内の画像を2値化する2値
化手段と、この2値化手段により2値化された画像から
黒画素連結成分を抽出する黒画素連結成分抽出手段と、
この黒画素連結成分抽出手段により抽出された黒画素連
結成分のうち近接する黒画素連結成分同士を統合するこ
とにより文字行を生成する行生成手段と、この行生成手
段により生成された各文字行に対し平均的な文字の大き
さを推定する文字大きさ推定手段と、この文字大きさ推
定手段の推定結果に基づき、前記行生成手段により生成
された各文字行の黒画素連結成分のうち平均的な文字の
大きさと比べて所定量よりも大きいものを接触文字とみ
なして無効にする無効化手段と、この無効化手段により
無効とされた黒画素連結成分が存在する場合、前記行生
成手段の文字行生成処理に戻り、順次、前記文字大きさ
推定手段の処理および前記無効化手段の処理を再度行な
わせる制御手段と、前記行生成手段により生成された各
文字行と前記無効化手段により無効とされた黒画素連結
成分の位置関係に基づき、前記行生成手段により生成さ
れた各文字行の位置を補正する行補正手段とを具備して
いる。
【0007】また、本発明の文字認識方法は、複数の文
字行が記載された被読取物の画像を入力する画像入力ス
テップと、この画像入力ステップにより入力された画像
から読取る領域を検出する領域検出ステップと、この領
域検出ステップにより検出された読取領域から前記文字
行を検出する行検出ステップと、この行検出ステップに
より検出された文字行に対し1文字ごとに文字認識を行
なう文字認識ステップとを有する文字認識方法であっ
て、前記行検出ステップは、前記検出された読取領域内
の画像を2値化する2値化ステップと、この2値化ステ
ップにより2値化された画像から黒画素連結成分を抽出
する黒画素連結成分抽出ステップと、この黒画素連結成
分抽出ステップにより抽出された黒画素連結成分のうち
近接する黒画素連結成分同士を統合することにより文字
行を生成する行生成ステップと、この行生成ステップに
より生成された各文字行に対し平均的な文字の大きさを
推定する文字大きさ推定ステップと、この文字大きさ推
定ステップの推定結果に基づき、前記行生成ステップに
より生成された各文字行の黒画素連結成分のうち平均的
な文字の大きさと比べて所定量よりも大きいものを接触
文字とみなして無効にする無効化ステップと、この無効
化ステップにより無効とされた黒画素連結成分が存在す
る場合、前記行生成ステップの文字行生成処理に戻り、
順次、前記文字大きさ推定ステップの処理および前記無
効化ステップの処理を再度行なわせる制御ステップと、
前記行生成ステップにより生成された各文字行と前記無
効化ステップにより無効とされた黒画素連結成分の位置
関係に基づき、前記行生成ステップにより生成された各
文字行の位置を補正する行補正ステップとを具備してい
る。
【0008】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して説明する。図1は、本実施の形態に係
る文字認識装置の構成を概略的に示すものである。図1
において、画像入力手段としてのスキャナ11および画
像入力部12は、被読取物としての帳票P上の全体の画
像を光学的な走査により取込み、デジタル画像データと
して入力する。なお、帳票P上には、複数の文字行が記
載されているものとする。
【0009】領域検出手段としての領域検出部13は、
画像入力部12により入力された画像全体から、あらか
じめ定められた読取る領域を検出する。これは、たとえ
ば、読取領域の座標を当該帳票Pのフォーマットとして
あらかじめ登録しておき、入力画像から指定された座標
の部分を切出すことにより、容易に実現できる。
【0010】行検出手段としての行検出部14は、領域
検出部13により検出された読取領域内において、あら
かじめ定められた方向の文字行を検出する。なお、本機
能の詳細は後で述べる。文字検出手段としての文字検出
部15は、行検出部14により検出された各文字行から
文字を1つずつ検出する(切出す)。文字の検出に関し
ては、画像の射影を求めて、射影の値が極小になる位置
で文字を切出すなどの手法を取ればよい。
【0011】文字認識手段としての文字認識部16は、
文字検出部15により検出された各文字を認識する。文
字認識に関しては、たとえば、複合類似度法やニューラ
ルネットなどの周知の文字認識手法を使用すればよい。
出力部17は、文字認識部16により認識された結果を
出力する。この出力は、たとえば、ファイル(メモリ)
へ書き出すなどの方法で実現できる。以上の処理の流れ
をフローチャートにしたものが図2である。
【0012】次に、行検出部14における行検出処理の
流れについて、図3に示すフローチャートを参照して詳
細に説明する。まず、領域検出部13により検出された
読取領域内の画像を2値化する(ステップS1、2値化
手段)。2値化の方法は、判別分析法やPタイル法な
ど、様々な公知技術が存在するので、画像の性質に応じ
て適宜それらを使用すればよい。
【0013】次に、2値化された画像から黒画素連結成
分を抽出する(ステップS2、黒画素連結成分抽出手
段)。ここで、黒画素連結成分とは、2値化の結果、黒
画素と判定された部分がひとつながりとなった領域であ
る。黒画素連結成分の抽出は、通常「ラベリング」と呼
ばれおり、公知の方法で実現できる。たとえば、入力さ
れた画像が図4(a)に示すものであったとすると、そ
の2値化画像からは図4(b)に示すような黒画素連結
成分が得られる。この図では、黒画素連結成分は、それ
を囲む外接長方形で表現している。なお、以下の説明で
は、図4のように文字行の長手方向の座標をX軸、短手
方向の座標をY軸として述べる。
【0014】次に、近接した黒画素連結成分同士を統合
することにより文字行を生成し、生成した文字行の数を
Nとする(ステップS3、行生成手段)。黒画素連結成
分を統合して文字行を生成する処理は、以下のようにし
て行なう。まず、黒画素連結成分のそれぞれについて
(着目する黒画素連結成分aについて)、図5(a)に
示すような統合範囲bを設定する。ここで、X方向の統
合範囲サイズαとY方向の統合範囲サイズβは、あらか
じめ定められているものとする。
【0015】次に、ある黒画素連結成分のX方向の統合
範囲について重なりを持ち、かつ、Y方向の統合範囲に
完全に包含されている他の黒画素連結成分が存在したと
すると、その黒画素連結成分は統合可能と判断する。た
とえば、図5(b)において、黒画素連結成分A,Bは
上記条件を満たすため、着目する黒画素連結成分aに統
合可能である。一方、黒画素連結成分Cは、Y方向の統
合範囲に完全に包含されていないため、統合可能でな
い。
【0016】以上の判断を全ての黒画素連結成分に対し
て行ない、統合可能な黒画素連結成分を全てまとめて、
行検出結果とする。これによって、たとえば、図4
(c)に示すように、行検出結果が得られる。なお、後
述するように、無効と判定された黒画素連結成分は統合
の対象としない。
【0017】次に、行番号Iを「0」に設定するととも
に、接触文字数Cを「0」に設定する(ステップS
4)。次に、行番号IがステップS3で生成された文字
行数Nよりも小さいか否かを判定し(ステップS5)、
小さければ、ステップS3で生成された各文字行につい
て、平均的な文字の大きさを推定する(ステップS6、
文字大きさ推定手段)。ここで、平均的な文字の大きさ
の推定は、たとえば、当該文字行に統合された黒画素連
結成分のY方向の大きさの平均値や中央値を用いればよ
い。
【0018】次に、ステップS6で推定された文字の大
きさの推定結果に基づき、ステップS3で生成された各
文字行の黒画素連結成分のうち、平均的な文字の大きさ
と比べて大きすぎるものを接触文字とみなして検出する
(ステップS7)。この場合、大きさの判定基準として
は、たとえば、ステップS6で計算された平均的な文字
の大きさの1.5倍以上のY方向サイズを持つ黒画素連
結成分を、平均的な文字の大きさと比べて大きすぎるも
のとみなし、接触文字とする。次に、接触文字数Cを
「+1」する(ステップS8)とともに、行番号Iを
「+1」して(ステップS9)、ステップS5に戻り、
上記同様な動作を繰り返す。
【0019】そして、全ての文字行について、ステップ
S5〜S9の処理が終了すると、すなわち、ステップS
5において「I<N」の条件が成立しなくなると、接触
文字数Cが「0」よりも大きいか否かを判定し(ステッ
プS10)、大きければ、各文字行について、その文字
行に含まれる黒画素連結成分のうちで大きすぎるもの
(接触文字)を無効にする(ステップS11、無効化手
段)。すなわち、ステップS7で検出された平均的な文
字の大きさの1.5倍以上のY方向サイズを持つ黒画素
連結成分を、平均的な文字の大きさと比べて大きすぎる
接触文字とみなし、これを無効にすればよい。ステップ
S11の処理が終了すると、ステップS3に戻り、上記
同様な動作を繰り返す。
【0020】そして、サイズが大きすぎる黒画素連結成
分(接触文字)が検出されなくなると、すなわち、ステ
ップS10において「C>0」の条件が成立しなくなる
と、無効にされた黒画素連結成分の位置を調べ、行検出
結果を補正する(ステップS12、行補正手段)。行補
正処理は、接触文字によって文字行が分断された場合に
修復する処理であり、この行補正処理については後で具
体例に基づき詳細に説明する。こうして行補正処理が終
了すると、現在の繰り返し処理で得られた行検出結果を
確定し、その行検出結果を文字検出処理へ渡す。
【0021】以下、具体的な処理例をあげて更に詳細に
説明する。図6(a)は、隣接する文字行に属する文字
同士が接触(符号cの部分)した場合の画像の例であ
る。これを2値化して黒画素連結成分を抽出したものが
図6(b)である。隣接する行に属する文字同士が接触
した場合には、接触した文字cが1つの黒画素連結成分
dとなる。最初は、全ての黒画素連結成分に付随する有
効フラグ(たとえば、行検出部14内のメモリに設けら
れており、図示省略)をオンにしておく。
【0022】次に、黒画素連結成分を統合して文字行を
生成する。統合する際には、黒画素連結成分に付随する
有効フラグがオンのもののみを統合の対象とする。今の
例の場合、接触した文字cがあって1つの黒画素連結成
分dとなるため、図7(a)に示すように、隣接する2
つの文字行(1行目と2行目)が誤って1行に統合され
てしまう。
【0023】次に、検出された各文字行について、平均
的な文字の大きさを推定する。ここでは、各文字行に含
まれる黒画素連結成分の高さ(Y軸方向寸法)の平均値
を求め、これを平均的な文字の大きさとする。次に、各
文字行について、平均的な文字の大きさの1.5倍を閾
値として、閾値以上の高さを持つ黒画素連結成分、たと
えば、図6(b)の例の場合、黒画素連結成分dを接触
文字と判定して無効にする。具体的には、当該黒画素連
結成分に付随する有効フラグをオフにする。
【0024】次に、無効とされた黒画素連結成分が存在
するので、黒画素連結成分を統合して文字行を生成する
処理を再度やり直す。今回の場合は、接触文字cに対応
する黒画素連結成分dが無効になったため、正しく文字
行を検出できる(図7(b)参照)。次に、再度処理が
繰り返され、もう一度、検出された各文字行について平
均的な文字の大きさを推定する。同様に、再び、接触文
字を判定するが、今回は無効と判定される黒画素連結成
分dは存在しないので、繰り返し処理を終了する。
【0025】最後に、以上で検出された文字行と無効と
判定された黒画素連結成分dの位置関係を調べて、行検
出結果を補正する。この行補正処理は、たとえば、図8
に示すように文字行の左端に接触文字eが存在する場合
や、図9に示すように接触文字の大きなかたまりfが存
在する場合に、その部分で文字行が切断される可能性が
あるため、これを修正することを目的とする。
【0026】以下、行補正処理の流れを図10に示すフ
ローチャートを参照して説明する。まず、検出された文
字行の数Nを設定した後(ステップS21)、行番号I
を「0」に設定する(ステップS22)。次に、行番号
Iが文字行数Nよりも小さいか否かを判定し(ステップ
S23)、小さければ、検出された各文字行に対して、
文字行の左右端近くを探索領域として設定し(ステップ
S24)、この設定された探索領域内に無効と判定され
た黒画素連結成分が存在するかどうか確認する(ステッ
プS25,S26)。
【0027】この確認の結果、無効な黒画素連結成分が
存在すれば、当該文字行の座標を所定値拡大し(ステッ
プS27)、行番号Iを「+1」して(ステップS2
8)、ステップS23に戻り、上記同様な動作を繰り返
す。すなわち、たとえば、図11(a)に示すように、
着目している文字行gのX方向に大きさα′の探索領域
(統合範囲)hl,hrを設定し、この探索領域hl,
hr内に無効な黒画素連結成分dl,drが存在すれ
ば、図11(b)に示すように、その位置まで文字行g
のX座標を延長する。この行座標拡大処理によって、図
8(b)に示すように途切れた文字行(接触文字eによ
り文字行の左端部が切断されている)を、図8(c)に
示すように正規の文字行として回復できる。
【0028】こうして、全ての文字行について、ステッ
プS23〜S28の処理が終了すると、すなわち、ステ
ップS23において「I<N」の条件が成立しなくなる
と、オーバーラップする文字行が存在すれば、それらの
文字行を統合する(ステップS29)。すなわち、図1
2(a)〜(c)に示すように、図11と同様な処理を
行なった結果、オーバーラップする文字行g1,g2が存
在する場合、図12(c)のようにオーバーラップした
文字行を統合して1つの文字行にする。このオーバーラ
ップ行統合処理によって、図9(b)に示すように途切
れた文字行(接触文字fにより文字行の中途部が切断さ
れている)を、図9(c)に示すように正規の文字行と
して回復できる。
【0029】次に、接触文字ではなく、ノイズが存在す
る場合の例について説明する。図13(a)〜(b)および
図14(a)〜(b)は、接触文字cではなく、ノイズnが
存在する場合の例を示しており、上述した図6(a)〜
(b)および図7(a)〜(b)と同様な処理によって正しく
文字行を検出すことができる。
【0030】この場合、さらに、無効と判定された黒画
素連結成分が接触文字cかノイズnかを判定する機能を
追加して、ノイズnは行補正処理の対象としないように
すれば、ノイズnを各文字行に統合することも防止でき
る。接触文字cかノイズnかの判定は、たとえば、黒画
素連結成分のX軸方向の寸法があらかじめ定められた閾
値以下ならばノイズnとするような方法が考えられる。
【0031】
【発明の効果】以上詳述したように本発明によれば、隣
接する文字行に属する文字同士が接触したり、文字行の
近くにノイズが存在したりする場合にも、正しく文字行
を検出することを可能にし、結果的に文字認識性能の向
上が図れる文字認識装置および文字認識方法を提供でき
る。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る文字認識装置の構成
を概略的に示すブロック図。
【図2】文字認識処理の流れを説明するフローチャー
ト。
【図3】行検出処理の流れを説明するフローチャート。
【図4】行検出処理を説明するための模式図。
【図5】黒画素連結成分を統合して行を生成する処理を
説明するための模式図。
【図6】接触文字が存在する場合の行検出処理を説明す
るための模式図。
【図7】接触文字が存在する場合の行検出処理を説明す
るための模式図。
【図8】文字行の端に接触文字がある場合の行補正処理
を説明するための模式図。
【図9】文字行の途中に接触文字のかたまりがある場合
の補正処理を説明するための模式図。
【図10】行補正処理の流れを説明するフローチャー
ト。
【図11】行補正処理の拡大処理を説明するための模式
図。
【図12】行補正処理の統合処理を説明するための模式
図。
【図13】文字行の端にノイズが存在する場合の行補正
処理を説明するための模式図。
【図14】文字行の端にノイズが存在する場合の行補正
処理を説明するための模式図。
【符号の説明】
P…帳票(被読取物)、11…スキャナ(画像入力手
段)、12…画像入力部(画像入力手段)、13…領域
検出部(領域検出手段)、14…行検出部(行検出手
段)、15…文字検出部(文字検出手段)、16…文字
認識部(文字認識手段)、17…出力部。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 複数の文字行が記載された被読取物の画
    像を入力する画像入力手段と、 この画像入力手段により入力された画像から読取る領域
    を検出する領域検出手段と、 この領域検出手段により検出された読取領域から前記文
    字行を検出する行検出手段と、 この行検出手段により検出された文字行に対し1文字ご
    とに文字認識を行なう文字認識手段とを有する文字認識
    装置であって、 前記行検出手段は、 前記検出された読取領域内の画像を2値化する2値化手
    段と、 この2値化手段により2値化された画像から黒画素連結
    成分を抽出する黒画素連結成分抽出手段と、 この黒画素連結成分抽出手段により抽出された黒画素連
    結成分のうち近接する黒画素連結成分同士を統合するこ
    とにより文字行を生成する行生成手段と、 この行生成手段により生成された各文字行に対し平均的
    な文字の大きさを推定する文字大きさ推定手段と、 この文字大きさ推定手段の推定結果に基づき、前記行生
    成手段により生成された各文字行の黒画素連結成分のう
    ち平均的な文字の大きさと比べて所定量よりも大きいも
    のを接触文字とみなして無効にする無効化手段と、 この無効化手段により無効とされた黒画素連結成分が存
    在する場合、前記行生成手段の文字行生成処理に戻り、
    順次、前記文字大きさ推定手段の処理および前記無効化
    手段の処理を再度行なわせる制御手段と、 前記行生成手段により生成された各文字行と前記無効化
    手段により無効とされた黒画素連結成分の位置関係に基
    づき、前記行生成手段により生成された各文字行の位置
    を補正する行補正手段と、 を具備したことを特徴とする文字認識装置。
  2. 【請求項2】 前記行補正手段は、前記行生成手段によ
    り生成された各文字行に対して、当該文字行の端部近傍
    に無効と判定された黒画素連結成分が存在するか否かを
    確認し、あらかじめ定められた統合範囲内に無効な黒画
    素連結成分が存在すれば、その位置まで当該文字行の端
    部を延長することで各文字行を補正することを特徴とす
    る請求項1記載の文字認識装置。
  3. 【請求項3】 複数の文字行が記載された被読取物の画
    像を入力する画像入力ステップと、 この画像入力ステップにより入力された画像から読取る
    領域を検出する領域検出ステップと、 この領域検出ステップにより検出された読取領域から前
    記文字行を検出する行検出ステップと、 この行検出ステップにより検出された文字行に対し1文
    字ごとに文字認識を行なう文字認識ステップとを有する
    文字認識方法であって、 前記行検出ステップは、 前記検出された読取領域内の画像を2値化する2値化ス
    テップと、 この2値化ステップにより2値化された画像から黒画素
    連結成分を抽出する黒画素連結成分抽出ステップと、 この黒画素連結成分抽出ステップにより抽出された黒画
    素連結成分のうち近接する黒画素連結成分同士を統合す
    ることにより文字行を生成する行生成ステップと、 この行生成ステップにより生成された各文字行に対し平
    均的な文字の大きさを推定する文字大きさ推定ステップ
    と、 この文字大きさ推定ステップの推定結果に基づき、前記
    行生成ステップにより生成された各文字行の黒画素連結
    成分のうち平均的な文字の大きさと比べて所定量よりも
    大きいものを接触文字とみなして無効にする無効化ステ
    ップと、 この無効化ステップにより無効とされた黒画素連結成分
    が存在する場合、前記行生成ステップの文字行生成処理
    に戻り、順次、前記文字大きさ推定ステップの処理およ
    び前記無効化ステップの処理を再度行なわせる制御ステ
    ップと、 前記行生成ステップにより生成された各文字行と前記無
    効化ステップにより無効とされた黒画素連結成分の位置
    関係に基づき、前記行生成ステップにより生成された各
    文字行の位置を補正する行補正ステップと、 を具備したことを特徴とする文字認識方法。
  4. 【請求項4】 前記行補正ステップは、前記行生成ステ
    ップにより生成された各文字行に対して、当該文字行の
    端部近傍に無効と判定された黒画素連結成分が存在する
    か否かを確認し、あらかじめ定められた統合範囲内に無
    効な黒画素連結成分が存在すれば、その位置まで当該文
    字行の端部を延長することで各文字行を補正することを
    特徴とする請求項1記載の文字認識方法。
JP2002079137A 2002-03-20 2002-03-20 文字認識装置および文字認識方法 Pending JP2003281468A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002079137A JP2003281468A (ja) 2002-03-20 2002-03-20 文字認識装置および文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002079137A JP2003281468A (ja) 2002-03-20 2002-03-20 文字認識装置および文字認識方法

Publications (1)

Publication Number Publication Date
JP2003281468A true JP2003281468A (ja) 2003-10-03

Family

ID=29228729

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002079137A Pending JP2003281468A (ja) 2002-03-20 2002-03-20 文字認識装置および文字認識方法

Country Status (1)

Country Link
JP (1) JP2003281468A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007073048A (ja) * 2005-09-05 2007-03-22 Fujitsu Ltd 文字列イメージを垂直に分離するプログラム、方法及び装置、指定文字列を抽出するプログラム、方法及び装置
JP2019102061A (ja) * 2017-11-30 2019-06-24 コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド テキスト線の区分化方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007073048A (ja) * 2005-09-05 2007-03-22 Fujitsu Ltd 文字列イメージを垂直に分離するプログラム、方法及び装置、指定文字列を抽出するプログラム、方法及び装置
JP2019102061A (ja) * 2017-11-30 2019-06-24 コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド テキスト線の区分化方法
JP7132050B2 (ja) 2017-11-30 2022-09-06 コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド テキスト行の区分化方法

Similar Documents

Publication Publication Date Title
JP4525787B2 (ja) 画像抽出装置、及び画像抽出プログラム
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JP6080259B2 (ja) 文字切り出し装置及び文字切り出し方法
KR100322982B1 (ko) 얼굴화상처리장치
CN101896920A (zh) 基于移动扫描的图像处理方法及装置
JP5322517B2 (ja) 画像処理装置および方法
JP4011646B2 (ja) 行検出方法および文字認識装置
JP4565396B2 (ja) 画像処理装置および画像処理プログラム
JP2006155126A (ja) 車両番号認識装置
JP2003281468A (ja) 文字認識装置および文字認識方法
JPH08190690A (ja) ナンバープレート決定方法
JP4492258B2 (ja) 文字・図形の認識方法および検査方法
JP2985935B2 (ja) 手書文字・図形読取装置
JP2868134B2 (ja) 画像処理方法及び装置
JP2002133424A (ja) 文書の傾き角度及び境界の検出方法
JP2871590B2 (ja) 画像抽出方式
JP2011018175A (ja) 文字認識装置及び文字認識方法
JP4078045B2 (ja) 画像処理装置、方法、プログラム、及び記憶媒体
JP4731748B2 (ja) 画像処理装置、方法、プログラム及び記憶媒体
JP4254008B2 (ja) パターン検出装置及び方法
JPH11316797A (ja) 文書画像の領域識別方法および装置
JP2006215964A (ja) 文字認識装置
JP2023034823A (ja) 画像処理装置、画像処理装置の制御方法およびプログラム
JP2004110369A (ja) 文字認識方法および文字認識装置
JP2004152048A (ja) 車両ナンバー読み取り装置