JP4439054B2 - 文字認識装置及び文字枠線の検出方法 - Google Patents
文字認識装置及び文字枠線の検出方法 Download PDFInfo
- Publication number
- JP4439054B2 JP4439054B2 JP33999099A JP33999099A JP4439054B2 JP 4439054 B2 JP4439054 B2 JP 4439054B2 JP 33999099 A JP33999099 A JP 33999099A JP 33999099 A JP33999099 A JP 33999099A JP 4439054 B2 JP4439054 B2 JP 4439054B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- field
- line
- frame line
- black
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Description
【発明の属する技術分野】
本発明は文字認識装置に関し、特に、原稿読み取り時の文字枠や罫線(以下、文字枠線と記す)の検出技術に関する。
【0002】
【従来の技術】
光学的文字読取装置(OCR)では帳票や原稿上の文字を読み取って電気信号に変換し文字イメージを出力するが、帳票には、通常、文字枠線が印刷されており文字は文字枠線内に収まるように印刷或いは記入されるので、読み取りの邪魔にならないように文字枠線は記入者に認識できるが装置には検出できないドロップアウトカラーで印刷されている場合が多い。これにより、文字認識の際に悪影響を及ぼす文字枠を消した状態にすることができ、装置は文字イメージのみを読み取ることができる。
【0003】
しかし、文字枠線をドロップアウトカラーで印刷した帳票には、特殊な色のため帳票の印刷コストが高くなる点や、色が淡いので記入者にとって見づらい点、多くの場合、装置によって一色に決まっているので帳票の種類による色分けができない点等の不都合がある。
【0004】
一方、上述したような不具合を解消するため文字枠線を非ドロップアウトカラーで印刷した帳票を光学的に読み取って文字認識を行う文字認識装置があるが、このような文字認識装置では、通常、文字認識を行う前段処理として文字枠線を検出し除去する枠線除去処理を行う場合が多い。
【0005】
【発明が解決しようとする課題】
上記枠線除去処理で文字枠線を検出する方法として、従来の方法は、(1)縦横の黒画素ヒストグラムを作成し、閾値以上の個所を文字枠線として検出する方法、(2)黒画素をブロック化し、ブロックの縦横比など形状と特徴によって文字枠線を検出する方法に大別することができる。
【0006】
これら従来の方法のうち、(1)の方法では、文字枠線のイメージは水平、垂直でなければならず、また、文字枠線がカスレたり、破線状になっている場合には文字枠線部分の黒画素ヒストグラム値が十分大きくならず、文字枠線を検出できない場合が生ずるといった問題点があり、(2)の方法では、文字枠線のイメージはある程度傾いていても問題ないが、文字枠線がカスレたり破線状の場合はブロックが分断されてしまい、文字枠線を検出できない場合が生ずるといった問題点があった。
【0007】
本発明は、上記問題点に鑑みてなされたものであり、文字枠線の傾きや、実線、破線など枠線の線種にかかわりなく文字枠線を検出できる文字認識装置及び文字枠線の検出方法の提供を目的とする。
【0008】
【課題を解決するための手段】
上記課題を解決するために、請求項1に記載の発明では、原稿を読み取ってイメージに変換する原稿読み取り手段と、この原稿読み取り手段によって読み取られた原稿イメージから文字枠線イメージを取り除く文字枠線除去手段と、この文字枠線除去手段によって文字枠線が取り除かれた文字イメージから1文字ずつ文字イメージを切り出す切り出し手段と、この切り出された文字イメージの認識処理を行う文字認識手段と、を備えた文字認識装置において、原稿読み取り手段は、原稿の傾きを検出する傾き検出手段を備え、文字枠線除去手段は、原稿イメージからフィールドイメージを切り出すフィールドイメージ切り出し手段と、フィールドイメージ切り出し手段によって切り出されたフィールドイメージに対して、主走査方向を傾き検出手段によって検出された原稿の傾き角度θだけ傾けて主走査を行うと共に、副走査方向を傾けることなく副走査を行いながら画素値を取得し、次いで、主走査方向を傾けることなく主走査を行うと共に、副走査方向を取得した傾き角度θだけ傾けて走査して取得した画素値を再配置することによりフィールドイメージの傾きを補正する傾き補正手段と、傾き補正手段による補正後のフィールドイメージからフィールドを構成する文字枠線の線種を検出する文字枠線検出手段と、この文字枠線検出手段によって検出された文字枠線の線種に応じてその文字枠線を消去する文字枠線消去手段と、を備えたことを特徴とする文字認識装置を提供する。
【0009】
また、請求項2に記載の発明では、文字枠線検出手段は、傾き補正手段による補正後のフィールドイメージを主走査方向および副走査方向に走査して取得した主走査方向、副走査方向の黒画素数を基に縦、横の黒画素ヒストグラムを作成し、縦、横の黒画素ヒストグラムから縦方向および横方向のフィールド区切り線候補領域をそれぞれ検出し、これらフィールド区切り線候補領域の黒画素連続数をカウントし、黒画素連続数が実線閾値より大きいフィールド区切り線候補領域のうち、最大の黒画素連続数のフィールド区切り線候補領域をフィールド枠線として検出するフィールド枠線検出手段と、フィールド枠線検出手段によって検出されたフィールド枠内を主走査方向および副走査方向に走査して黒画素から白画素および白画素から黒画素への変化点を累積した画素変化累積配列を作成して1文字ずつの記入領域を区画する縦線左右の輪郭位置を検出する動作を1フィールド分の走査が終わるまで繰り返し、1フィールド分の走査が終了すると、1フィールド分の画素変化累積配列を大きい順にソートし、ソート済みの画素変化累積配列の1〜n番目の要素について黒画素変化累積配列数および白黒画素変化累積配列と閾値αとの比較および輪郭位置と期待値との差と閾値βとの比較結果を基に縦線が実線か破線かを決定する文字区切り線検出手段を有する、ことを特徴とする請求項1に記載の文字認識装置を提供する。
【0010】
また、請求項3に記載の発明では、文字枠線検出手段は、更に、フィールド枠線検出手段によって検出されたフィールド枠線の下側の枠線から短く直立し、該フィールド内で1文字ずつの記入領域を区画する縦線からなるひげ線を検出するひげ線検出手段を含むことを特徴とする請求項1記載の文字認識装置を提供する。
【0011】
また、請求項4に記載の発明では、フィールド枠線検出手段は、主走査方向の走査時に白画素の連続数をそれぞれカウントし、白画素の連続数のカウント値がカスレ閾値以内の場合はカスレとみなし白画素の連続数のカウント値をゼロクリアすると共に対応する主走査方向の黒画素の連続数のカウント値に1を加え、副走査方向の走査時に白画素の連続数をそれぞれカウントし、白画素の連続数がカスレ閾値以内の場合はカスレとみなし白画素の連続数のカウント値をゼロクリアすると共に対応する副走査方向の黒画素の連続数のカウント値に1を加える手段、を含むことを特徴とする請求項2記載の文字認識装置を提供する。
【0012】
また、請求項5に記載の発明では、原稿の読み取りイメージから検出した文字枠線を取り除いて1文字ずつ文字イメージを切り出して文字認識を行う文字認識装置において、フィールドイメージ切り出し手段によって切り出されたフィールドイメージに対して、主走査方向を傾き検出手段によって検出された原稿の傾き角度θだけ傾けて主走査を行うと共に、副走査方向を傾けることなく副走査を行いながら画素値を取得し、次いで、主走査方向を傾けることなく主走査を行うと共に、副走査方向を取得した傾き角度θだけ傾けて走査して取得した画素値を再配置することによりフィールドイメージの傾きを補正し、傾き補正後のフィールドイメージからフィールドを構成する文字枠線を検出する、ことを特徴とする文字枠線の検出方法を提供する。
【0013】
また、請求項6に記載の発明では、フィールド枠線の検出後に、該フィールド枠線内において、主走査方向および副走査方向に走査して黒画素から白画素および白画素から黒画素への変化点を累積した画素変化累積配列を作成して1文字ずつの記入領域を区画する縦線左右の輪郭位置を検出する動作を1フィールド分の走査が終わるまで繰り返し、1フィールド分の走査が終了すると、1フィールド分の画素変化累積配列を大きい順にソートし、ソート済みの画素変化累積配列の1〜n番目の要素について黒画素変化累積配列数および白黒画素変化累積配列と閾値αとの比較および輪郭位置と期待値との差と閾値βとの比較結果を基に縦線の線種を決定する、ことを特徴とする請求項5記載の文字枠線の検出方法を提供する。
【0014】
【発明の実施の形態】
[文字認識装置の構成例]
図1は文字認識装置の一実施例の構成を示すブロック図であり、図1(a)は全体構成図、図1(b)は枠線除去部の構成例を示すブロック図である。
図1(a)で、文字認識装置1は、読取部10、枠線除去部20、文字切り出し部30、認識部40から構成されている。なお、図示していないが文字認識装置1は、CPUおよびその周辺回路からなり上述の各構成部分の動作の制御及び文字認識装置全体の動作を制御する制御部を備えている。
【0015】
読取部10は原稿上の文字を光学的に読み取って電気信号に変換し、文字イメージを出力する。また、枠線除去部20は読取部10で読み取った読み込みイメージ(帳票(原稿)イメージ)から文字枠線(罫線又は枠線(実線、破線、ひげ線等)を検出して文字枠線のイメージを除去した文字イメージを取得する。文字切り出し部30は、枠線除去部20によって文字枠線が除去されたイメージから1文字ずつ文字イメージを切り出して、切り出し文字イメージを取得する。認識部40は辞書部を備え、特徴検出を行った後、辞書部に登録された標準的な特徴量との距離計算等を行って文字認識を行い、認識文字コード又は棄却コードを出力する。
【0016】
[枠線除去部の構成例]
図1(b)で、枠線除去部21はフィールドイメージ切り出し部21、フィールドイメージ回転補正部22、文字枠線検出部23及び文字枠線消去部24を備えており、フィールドイメージ切り出し部21はフィールド情報を基に帳票(原稿)イメージからフィールドの領域座標を算出し、フィールドイメージを切り出す。また、フィールドイメージ回転補正部22は後述するようにフィールドイメージを帳票(原稿)の傾きに応じて回転し、文字枠線が水平(垂直)な状態に補正する。また、文字枠線検出部23は後述するようにフィールドを構成する文字枠線の線種(例えば、フィールド枠線(フィールド区切り線)、文字区切り線、ひげ線)を検出する。また、文字枠線消去部24は文字枠線検出部23によって検出された線種の性質に応じてその文字枠線を消去する。
【0017】
[フィールドイメージ回転補正部]
図2はフィールドイメージ回転補正部22によるフィールドイメージ回転方法の説明図であり、図2(a)は傾き補正前のフィールドイメージを示し、図2(b)は傾き補正後のフィールドイメージを示す。
図2で、帳票イメージ全体の傾きθは読み取り時に傾きセンサ等によって予め検出されている。したがって、図2(a)に示すような傾き補正前のフィールドイメージ224では文字枠線222がθだけ傾いている。フィールドイメージ回転補正部22はこの文字枠線222を水平・垂直な状態に補正するために以下の処理を行う。
【0018】
まず、傾き補正前のフィールドイメージ224(図2(a))を、主走査を主走査線221,223,225のようにX軸から+θだけ傾けた線で行い、副走査を副走査線226のようにY軸に平行な線で行いながら画素値を取得し、次いで、傾き補正後のフィールドイメージ224’(図2(b))のように、主走査を主走査線221’,223’,225’のようにX軸に平行な線で行い、副走査を副走査線226’のようにY軸から−θだけ傾けた線で行いながら、画素値を配置していく。また、走査点の座標の算出は、例えば、よく知られているプレゼンハムのアルゴリズムを用いて行うことができる(プレゼンハムのアルゴリズムでは全て整数で演算を行うので、座標点の算出を高速に行うことができる)。
【0019】
[文字枠線検出部]
図3は文字枠線検出部23の一実施例の構成を示すブロック図であり、文字枠線検出部23はフィールド枠線検出部231、文字区切り線検出部232及びひげ線検出部233を備えており、図4に示すような線種の文字枠線をその性質に応じて図6,7の例に示すように検出する。すなわち、フィールド枠線検出部231によりフィールドを構成する文字枠線の一種であるフィールド枠線(フィールド区切り線)を検出し、文字区切り線検出部232はフィールド枠線検出部231によって検出されたフィールド区切り線を基準としてフィールドを構成する文字枠線の一種である文字区切り線(図4(a))を検出する。また、ひげ線検出部233はフィールド枠線検出部231によって検出されたフィールド区切り線を基準としてフィールドを構成する文字枠線の一種であるひげ線(図4(b))を検出する。
【0020】
図4は文字枠線検出部23の検出対象である枠線の線種の例を示す図であり、図4(a)はフィールド枠線及び文字区切り線の説明図であり、図4(b)はひげ線の説明図である。
図4でフィールド枠線41はフィールド区切り線からなり、フィールド境界四辺を区切る枠線である(以下、説明上、実線で示す)。また、文字区切り線42は文字を記入するフィールド内で1文字ずつの記入領域を区画する縦線である(以下、説明上、実線又は破線で示す)。また、ひげ線43はフィールド内で1文字ずつの記入領域を区画し、下側のフィールド区切り線から短く(例えば、1〜2mm程度)直立している縦線である(以下、説明上、実線で示す)。また、それぞれの線の、本数、太さ、長さ及び位置は読み取り前に設定されるフォーマット情報に含まれるフィールド情報によって得ることができる。
【0021】
1.フィールド枠線検出部
図5はフィールド枠線検出部231の一実施例の構成を示すブロック図であり、フィールド枠線検出部231は、黒画素ヒストグラム作成部51、候補線領域検出部52、実線判定部53、フィールド区切り線検出部54からなっている。図5で、黒画素ヒストグラム作成部51はフィールドイメージ回転補正部22によって傾き補正されたフィールドイメージ(図2(b))から縦横の黒画素ヒストグラムを作成し、縦の黒画素ヒストグラム(図6)からは縦のフィールド区切り線を検出し、横の黒画素ヒストグラムからは横のフィールド区切り線を検出する。候補線領域検出部52は後述(図8)するように黒画素ヒストグラムから縦横の候補線領域を検出する。実線判定部53は後述(図7、図8)するように縦横の候補線領域のイメージを調べ、実線か否かを判定する。また、フィールド区切り線検出部54は縦横の候補線領域からそれぞれ縦横のフィールド区切り線(実線)を検出する。
【0022】
(フィールド枠線検出部の動作例)
図6は候補線領域検出部52による候補線領域検出方法の説明図であり、図7は実線判定部53による実線判定方法の説明図である。
また、図8はフィールド枠線検出部231の動作例を示すフローチャートであり、ステップS1、S2は黒画素ヒストグラム作成部51の動作に、S3、S4は候補線領域検出部52の動作に、S5〜S8は実線判定部53の動作に、S9、S10の動作はフィールド区切り線検出部54の動作に相当する。
【0023】
ステップS1:(縦の黒画素ヒストグラムの作成)
黒画素ヒストグラム作成部51はフィールドイメージ回転補正部22によって傾きが補正されたフィールドイメージの全領域について主走査方向をY軸方向、副走査方向をX軸方向として走査し、副走査座標毎に黒画素の数を集計し、縦の黒画素ヒストグラムを作成する。
【0024】
ステップS2:(横の黒画素ヒストグラムの作成)
同様に、黒画素ヒストグラム作成部51は傾きが補正されたフィールドイメージの全領域について主走査方向をX軸方向、副走査方向をY軸方向として走査し、副走査座標毎に黒画素の数を集計し、横の黒画素ヒストグラムを作成する。
【0025】
ステップS3:(縦方向の候補線領域検出)
候補線領域検出部52は上記ステップS1で作成した縦の黒画素ヒストグラムから図6に示すような頂点Pを検出する。次に、頂点Pの前後の一定範囲について黒画素ヒストグラムにおける差分を調べ、最大の差分を有する個所(最大差分個所)Ma、Mbを検出する。
次に、最大差分個所Ma、Mbからそれぞれ、頂点Pから反対側に(つまり、頂点Pの前後に)差分を調べていき、差分の変動が閾値以下となる個所を検出し、そこを候補線領域の仮境界個所Ta、Tbと仮定する。
【0026】
最後に、仮境界個所Ta、Tbの間隔(距離)rが検出すべきフィールド区切り線の線幅r’の許容範囲内(|r−r’|<γ:γは閾値)であれば縦方向のフィールド区切り線の候補線領域として検出する。
【0027】
なお、縦方向のフィールド区切り線は通常2本(枠が印刷されている場合、枠線は、通常、縦方向に2本、横方向に2本のフィールド区切り線からなる(複数の枠が印刷されている場合は2本以上からなる))ので、縦の黒ヒストグラムは通常2つ生じ、頂点Pは2つ得られる。頂点Pが複数の場合、候補線領域検出部52は各頂点について上述したような最大差分個所を検出し、最大差分個所について頂点Pから反対側に(つまり、頂点の前後に)差分を調べていき、差分の変動が閾値以下となる個所を検出し、そこを候補線領域の仮境界個所と仮定し、仮境界個所の間隔(距離)rが検出すべきフィールド区切り線の線幅の許容範囲内であれば縦方向のフィールド区切り線の候補線領域として検出する。つまり、フィールドに1つの枠が印刷されている場合には通常2つの縦方向のフィールド区切り線の候補線領域が得られることとなる。
【0028】
ステップS4:(横方向の候補線領域検出)
同様に、候補線領域検出部52は上記ステップS2で作成した横の黒画素ヒストグラムからそれぞれ頂点を検出し、各頂点の前後の一定範囲について黒画素ヒストグラムにおける差分を調べ、最大の差分を有する個所(最大差分個所)を検出し、最大差分個所からそれぞれ、頂点から反対側に差分を調べていき、差分の変動が閾値以下となる個所を検出し、そこを候補線領域の仮境界個所と仮定し、仮境界個所の間隔(距離)が検出すべきフィールド区切り線の線幅の許容範囲内であれば横方向のフィールド区切り線の候補線領域として検出する。また、頂点が複数の場合の動作も上記ステップS3と同様であり、フィールドに1つの枠が印刷されている場合には通常2つの横方向のフィールド区切り線の候補線領域が得られることとなる。
【0029】
ステップS5:(縦方向の候補線領域の連続画素数カウント)
実線判定部53は縦方向の候補線領域のイメージを線に垂直な方向を主走査m、水平な方向を副走査sとして走査し画素値Q(m,s)を取得する。また、黒連続カウンタB、白連続カウンタW、黒連続数保持エリア、白連続数保持エリアを初期化(ゼロクリア)する。次に、主走査線上に黒画素が一つでもあれば黒フラグFをオンにし、黒フラグFがオンの場合には黒連続カウンタBに1を加え、白連続カウンタWをゼロクリアする。また、黒フラグFがオフの場合には白連続カウンタWに1を加え、さらに、白連続カウンタWの値が閾値Wthに達している場合には白画素連続(つまり、線がない部分)とみなして黒連続カウンタの値と黒連続数保持エリアに格納されている値を比較し、黒連続カウンタの値が大きい場合にはその値を黒連続数保持エリアに上書きしてから黒連続カウンタBをクリアし、白連続カウンタWの値が閾値Wth未満の場合にはカスレとみなして白連続カウンタWをクリアし、黒連続カウンタBに1を加える(つまり、カスレた部分も含めて1つの線分とみなす)。なお、この場合、黒連続カウンタBに白連続カウンタWの値を加えてから白連続カウンタWをクリアするようにしてもよい。
【0030】
ステップS6:(縦方向の候補線領域の実線判定)
実線判定部53は上記ステップS5で得た最大の黒連続数Bmax(つまり、黒連続カウンタの現在の値と黒連続数保持エリアに保持されている値のうちの大きいほう)と閾値Bthを比較し、Bmax>Bthのときその候補線領域を実線と判定する。
また、上記S5、S6の動作は上記ステップS4で得た縦方向の候補線領域数に等しい回数分繰り返される。
【0031】
ステップS7:(横方向の候補線領域の連続画素数カウント)
上記ステップS5と同様に、実線判定部53は横方向の候補線領域のイメージを線に垂直な方向を主走査、水平な方向を副走査として走査し画素値を取得し、各カウンタを初期化する。次に、主走査線上に黒画素が一つでもあれば黒フラグFをオンにし、黒フラグFがオンの場合には黒連続カウンタBに1を加え、白連続カウンタWをゼロクリアする。また、黒フラグFがオフの場合には白連続カウンタWに1を加え、さらに、白連続カウンタWの値が閾値Wthに達している場合には白画素連続とみなして黒連続カウンタの値と黒連続数保持エリアに格納されている値を比較し、黒連続カウンタの値が大きい場合にはその値を黒連続数保持エリアに上書きしてから黒連続カウンタBをクリアし、白連続カウンタWの値が閾値Wth未満の場合にはカスレとみなして白連続カウンタWをクリアし、黒連続カウンタBに1を加える。なお、この場合、黒連続カウンタBに白連続カウンタWの値を加えてから白連続カウンタWをクリアするようにしてもよい。
【0032】
ステップS8:(横方向の候補線領域の実線判定及び検出)
実線判定部53は上記ステップS7で得た最大の黒連続数と閾値を比較し、最大の黒連続数>閾値のときその候補線領域を実線と判定する。
また、上記S7、S8の動作は上記ステップS4で得た横方向の候補線領域数に等しい回数分繰り返される。
【0033】
ステップS9:(縦方向のフィールド区切り線の検出)
フィールド区切り線検出部54は上記ステップS6で実線と判定した縦方向の候補線領域の全ての組み合わせについてそれぞれ間隔(距離)を算出し間隔検出すべきフィールド区切り線の横方向の間隔の許容範囲内に入っていればその候補線の組(対)を縦方向のフィールド区切り線として検出する。なお、縦方向のフィールド区切り線として検出可能な縦方向の候補線領域の組み合わせが複数ある場合には横方向の特定の位置(例えば、左側のフィールド区切り線位置)が期待位置に近い組み合わせを選びその組を縦方向のフィールド区切り線として検出する。
また、フィールド区切り線の横方向の間隔は読み取り開始前に帳票(原稿)のフォーマット情報として設定され、縦方向のフィールド区切り線の期待位置は設定されたフォーマット情報を基に求めることができる。
【0034】
ステップS10:(横方向のフィールド区切り線の検出)
同様に、フィールド区切り線検出部54は上記ステップS7で実線と判定した横方向の候補線領域の全ての組み合わせについてそれぞれ間隔(距離)を算出し間隔検出すべきフィールド区切り線の縦方向の間隔の許容範囲内に入っていればその候補線の組(対)を横方向のフィールド区切り線として検出する。なお、横方向のフィールド区切り線として検出可能な横方向の候補線領域の組み合わせが複数ある場合には縦方向の特定の位置(例えば、上側のフィールド区切り線位置)が期待位置に近い組み合わせを選びその組を縦方向のフィールド区切り線として検出する。
また、フィールド区切り線の縦方向の間隔は同様に読み取り開始前に帳票(原稿)のフォーマット情報として設定され、横方向のフィールド区切り線の期待位置は設定されたフォーマット情報を基に求めることができる。
上記構成によりフィールド枠線検出部231は縦横のフィールド区切り線からなるフィールド枠線を検出することができる。
【0035】
2.文字区切り線(破線)検出部
図9は文字区切り線検出部232の一実施例の構成を示すブロック図であり、文字区切り線検出部232は、文字区切り線検出領域設定部61、変化点累積配列作成部62、文字区切り線決定部63からなっている。
また、図10は変化点累積配列の説明図であり、図11は文字区切り線検出部232の動作例を示すフローチャートである。
【0036】
ステップT1:(文字区切り線検出領域の設定)
図11で、文字区切り線検出領域設定部61は原稿読み取り開始前に設定されたフォーマット情報を基にフィールド枠線検出部231によって検出されたフィールド区切り線(例えば、左側のフィールド区切り線)を基準として文字区切り線(破線)検出領域を設定する。
【0037】
ステップT2:(白→黒変化点累積配列の作成)
変化点累積配列作成部62は上記ステップT1で設定した文字区切り線検出領域101内のイメージ102をX方向を主走査方向、Y方向を副走査方向として走査し、図10に示すように白から黒の変化点が発生したX座標を累積した白→黒変化累積配列104(図10(b))を作成する。
ここで、白→黒変化累積配列104は図10(a)に示すようにイメージ102を横に走査していき走査線103上で画素値が白から黒に変化した黒画素のX座標に該当する配列要素の数を1つ数えることにより作成する。白→黒変化累積配列104は枠線の左側の輪郭位置を検出するために用いる。
【0038】
ステップT3:(黒→白変化点累積配列の作成)
同様にして、変化点累積配列作成部62は黒から白の変化点が発生したX座標を累積した黒→白変化累積配列105(図10(c))を作成する。また、黒→白変化累積配列105はイメージ102を横に走査していき走査線103上で画素値が黒から白に変化した黒画素のX座標に該当する配列要素の数を1つ数えることにより作成する。黒→白変化累積配列105は枠線の右側の輪郭位置を検出するために用いる(変化点累積配列は黒画素ヒストグラムに比べ、文字区切り線が破線でも線としての特徴が現れやすく、破線の検出が簡単にできる)。上記T2、T3の動作は1フィールド分の走査が終わるまで繰り返される。
【0039】
ステップT4:(変化点累積配列のソート)
1フィールド分の走査が修了すると、文字区切り線決定部63は上記ステップT2、T3で得た白→黒変化累積配列S[i]および黒→白変化累積配列E[j]を大きい順にソート(SORT:並べ替え)する。
【0040】
ステップT5:(文字区切り線領域の決定)
文字区切り線決定部63は、上記ステップT4で得たソート済みの両配列S[i],E[j]の1番目の要素について値がS[i],E[j]ともに閾値α以上であり、位置についてはiはjより小さく、期待値eとの差について|e−i|、|e−j|ともに閾値β以下である場合、iとjとの間を文字区切り線領域(破線の実線部分)と決定する。また、1番目の値で決定できなかった場合には両配列の1〜2番目の要素について同様に判定を行い、それでも決定できない場合には1〜3番目の要素について同様の判定を行い、この判定で決定できない場合には文字区切り線(=破線)なしと決定する(実施例では1〜3番目の要素までとしたがこれに限定されない)。
【0041】
3.ひげ線検出部
図12はひげ線検出部233の一実施例の構成を示すブロック図であり、ひげ線検出部233は、ひげ線検出領域設定部71、黒画素ヒストグラム作成部72、ひげ線範囲検出部73からなっている。
また、図13はひげ線横範囲検出の説明図であり、図14はひげ線縦範囲検出の説明図である。また、図15はひげ線検出部233の動作例を示すフローチャートである。
【0042】
ステップU1:(ひげ線検出領域の設定)
ひげ線検出領域設定部71はフィールド枠線検出部231によって検出されているフィールド区切り線(例えば、左側と下側のフィールド区切り線)を基準としてひげ線検出領域を設定する。
【0043】
ステップU2:(黒画素ヒストグラムの作成)
黒画素ヒストグラム作成部72は上記ステップU1で設定したひげ線検出領域のイメージから縦の黒画素ヒストグラムを作成する。
【0044】
ステップU3:(ひげ線横範囲の検出)
ひげ線範囲検出部73は上記ステップU2で作成した縦の黒画素ヒストグラムから図13に示すようにしてひげ線の横範囲を検出する。
すなわち、図13(a)に示すように縦の黒画素ヒストグラムから高さが閾値tha以上の有効範囲を検出し、図13(b)に示すように有効範囲内の黒画素ヒストグラムの高さh1が閾値thb以上で且つ直前のヒストグラムとの高さh0との差が閾値thc以上の個所を、ひげ線横範囲の始点として検出する。また、次に現れた有効範囲内の黒画素ヒストグラムから高さh2が閾値thb以上で且つ直前のヒストグラムの高さh3との差が閾値thc以上の個所を、ひげ線横範囲の終点として検出する。そして、検出された始点、終点の間隔が検出すべきひげ線の線幅の許容範囲内であれば、ひげ線の横範囲と決定する。なお、閾値tha、thb及びthcは読み取り開始前に設定されるフォーマット情報から得られる検出すべきひげ線の長さに応じて設定する。
【0045】
ステップU4:(ひげ線縦範囲(ひげ線の長さ)の検出)
ひげ線範囲検出部73は上記ステップU3で検出したようなひげ線の横範囲のイメージ(図14(a)で矩形の破線で囲って示した数字「7」の脚部近傍)を下から上に輪郭追跡し、追跡できなくなるか又はX(線幅)の変移量が一定値以上になった場合、そこで追跡を終了する。このときのY変移量(縦方向の長さ)が閾値H以上であればひげ線縦範囲として検出する。また、閾値は読み取り開始前に設定されるフォーマット情報から得られる検出すべきひげ線の長さに応じて設定される。
また、上記ステップU3、U4でひげ線が文字ストロークと交差接触していてひげ線の範囲が検出できない場合は3回まで再検出を繰り返す(3回に限定されない)。3回まで再検出を繰り返す場合は、2回目はひげ線検出領域の上半分で、3回目はひげ線検出領域の下半分で検出を繰り返す。
【0046】
また、フィールドイメージ回転補正部22によって回転補正されたフィールドイメージと、文字枠線検出部232によって検出されたフィールド区切り線、文字区切り線、及びひげ線等の文字枠情報は図1(b)に示すように文字枠消去部24による文字枠消去処理に用いられる。
【0047】
以上、本発明の一実施例について説明したが本発明は上記実施例に限定されるものではなく、種々の変形実施が可能であることはいうまでもない。
【0048】
【発明の効果】
上記説明したように、第1〜第4の発明の文字認識装置および第5、第6の発明の文字枠線検出方法によれば、読み取った原稿イメージが傾いていてもフィールドの傾きを補正して文字枠線の検出を補正できるので縦横の黒画素ヒストグラムを作成しても従来のように傾きによって黒画素値の検出ができないといったようなことがないので、文字枠線を高精度に検出することができる。
【0049】
また、第4の発明の文字認識装置および第6の発明の文字枠線検出方法によれば、上記効果に加えて、カスレ部分を判定しカスレ部分を空白部分とはみなさないので、実線部分の一部がかすれていても連続した部分とみなして実線判定を行うことができるので、文字枠線がかすれていても文字枠線を高精度に検出することができる。
【図面の簡単な説明】
【図1】文字認識装置の一実施例の構成を示すブロック図である。
【図2】フィールドイメージ回転補正部によるフィールドイメージ回転方法の説明図である。
【図3】文字枠線検出部の一実施例の構成を示すブロック図である。
【図4】文字枠線検出部の検出対象である枠線の線種の例を示す図である。
【図5】フィールド枠線検出部の一実施例の構成を示すブロック図である。
【図6】候補線領域検出部による候補線領域検出方法の説明図である。
【図7】実線判定部による実線判定方法の説明図である。
【図8】フィールド枠線検出部の動作例を示すフローチャートである。
【図9】文字区切り線検出部の一実施例の構成を示すブロック図である。
【図10】変化点累積配列の説明図である。
【図11】文字区切り線検出部の動作例を示すフローチャートである。
【図12】ひげ線検出部の一実施例の構成を示すブロック図である。
【図13】ひげ線横範囲検出の説明図である。
【図14】ひげ線縦範囲検出の説明図である。
【図15】ひげ線検出部の動作例を示すフローチャートである。
【符号の説明】
1 文字認識装置
20 文字枠線除去部(文字枠線除去手段)
30 文字切り出し部(文字切り出し手段)
40 認識部(文字認識手段)
21 フィールドイメージ切り出し部(フィールドイメージ切り出し手段)
22 フィールドイメージ回転補正部(傾き補正手段)
23 文字枠線検出部(文字枠線検出手段)
24 文字枠線消去部(文字枠線消去手段)
51 黒画素ヒストグラム作成部(候補線領域設定手段)
52 候補線領域検出部(候補線領域設定手段)
52 実線判定部(カウント手段、カスレ判定手段、実線判定手段)
231 フィールド枠線検出部(フィールド枠線検出手段)
232 文字区切り線検出部(文字区切り線検出手段)
233 ひげ線検出部(ひげ線検出手段)
Claims (6)
- 原稿を読み取ってイメージに変換する原稿読み取り手段と、
この原稿読み取り手段によって読み取られた原稿イメージから文字枠線イメージを取り除く文字枠線除去手段と、
この文字枠線除去手段によって文字枠線が取り除かれた文字イメージから1文字ずつ文字イメージを切り出す切り出し手段と、
この切り出された文字イメージの認識処理を行う文字認識手段と、
を備えた文字認識装置において、
前記原稿読み取り手段は、
原稿の傾きを検出する傾き検出手段を備え、
前記文字枠線除去手段は、
前記原稿イメージからフィールドイメージを切り出すフィールドイメージ切り出し手段と、
前記フィールドイメージ切り出し手段によって切り出されたフィールドイメージに対して、主走査方向を前記傾き検出手段によって検出された原稿の傾き角度θだけ傾けて主走査を行うと共に、副走査方向を傾けることなく副走査を行いながら画素値を取得し、次いで、主走査方向を傾けることなく主走査を行うと共に、副走査方向を前記取得した傾き角度θだけ傾けて走査して前記取得した画素値を再配置することによりフィールドイメージの傾きを補正する傾き補正手段と、
前記傾き補正手段による補正後のフィールドイメージからフィールドを構成する文字枠線の線種を検出する文字枠線検出手段と、
この文字枠線検出手段によって検出された文字枠線を消去する文字枠線消去手段と、
を備えたことを特徴とする文字認識装置。 - 前記文字枠線検出手段は、
前記傾き補正手段による補正後のフィールドイメージを主走査方向および副走査方向に走査して取得した主走査方向、副走査方向の黒画素数を基に縦、横の黒画素ヒストグラムを作成し、縦、横の黒画素ヒストグラムから縦方向および横方向のフィールド区切り線候補領域をそれぞれ検出し、これらフィールド区切り線候補領域の黒画素連続数をカウントし、黒画素連続数が実線閾値より大きいフィールド区切り線候補領域のうち、最大の黒画素連続数のフィールド区切り線候補領域をフィールド枠線として検出するフィールド枠線検出手段と、
前記フィールド枠線検出手段によって検出されたフィールド枠内を主走査方向および副走査方向に走査して黒画素から白画素および白画素から黒画素への変化点を累積した画素変化累積配列を作成して1文字ずつの記入領域を区画する縦線左右の輪郭位置を検出する動作を1フィールド分の走査が終わるまで繰り返し、1フィールド分の走査が終了すると、1フィールド分の画素変化累積配列を大きい順にソートし、ソート済みの画素変化累積配列の1〜n番目の要素について黒画素変化累積配列数および白黒画素変化累積配列と閾値αとの比較および輪郭位置と期待値との差と閾値βとの比較結果を基に前記縦線が実線か破線かを決定する文字区切り線検出手段を有する、
ことを特徴とする請求項1に記載の文字認識装置。 - 前記文字枠線検出手段は、更に、前記フィールド枠線検出手段によって検出された前記フィールド枠線の下側の枠線から短く直立し、該フィールド内で1文字ずつの記入領域を区画する縦線からなるひげ線を検出するひげ線検出手段を含むことを特徴とする請求項1記載の文字認識装置。
- 前記フィールド枠線検出手段は、
前記主走査方向の走査時に白画素の連続数をそれぞれカウントし、白画素の連続数のカウント値がカスレ閾値以内の場合はカスレとみなし白画素の連続数のカウント値をゼロクリアすると共に対応する主走査方向の黒画素の連続数のカウント値に1を加え、
前記副走査方向の走査時に白画素の連続数をそれぞれカウントし、白画素の連続数がカスレ閾値以内の場合はカスレとみなし白画素の連続数のカウント値をゼロクリアすると共に対応する副走査方向の黒画素の連続数のカウント値に1を加える手段、
を含むことを特徴とする請求項2記載の文字認識装置。 - 原稿の読み取りイメージから検出した文字枠線を取り除いて1文字ずつ文字イメージを切り出して文字認識を行う文字認識装置において、
前記フィールドイメージ切り出し手段によって切り出されたフィールドイメージに対して、主走査方向を前記傾き検出手段によって検出された原稿の傾き角度θだけ傾けて主走査を行うと共に、副走査方向を傾けることなく副走査を行いながら画素値を取得し、次いで、主走査方向を傾けることなく主走査を行うと共に、副走査方向を前記取得した傾き角度θだけ傾けて走査して前記取得した画素値を再配置することによりフィールドイメージの傾きを補正し、傾き補正後のフィールドイメージからフィールドを構成する文字枠線を検出する、ことを特徴とする文字枠線の検出方法。 - 前記フィールド枠線の検出後に、該フィールド枠線内において、主走査方向および副走査方向に走査して黒画素から白画素および白画素から黒画素への変化点を累積した画素変化累積配列を作成して1文字ずつの記入領域を区画する縦線左右の輪郭位置を検出する動作を1フィールド分の走査が終わるまで繰り返し、1フィールド分の走査が終了すると、1フィールド分の画素変化累積配列を大きい順にソートし、ソート済みの画素変化累積配列の1〜n番目の要素について黒画素変化累積配列数および白黒画素変化累積配列と閾値αとの比較および輪郭位置と期待値との差と閾値βとの比較結果を基に前記縦線の線種を決定する、
ことを特徴とする請求項5記載の文字枠線の検出方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP33999099A JP4439054B2 (ja) | 1999-11-30 | 1999-11-30 | 文字認識装置及び文字枠線の検出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP33999099A JP4439054B2 (ja) | 1999-11-30 | 1999-11-30 | 文字認識装置及び文字枠線の検出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001155113A JP2001155113A (ja) | 2001-06-08 |
JP4439054B2 true JP4439054B2 (ja) | 2010-03-24 |
Family
ID=18332698
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP33999099A Expired - Lifetime JP4439054B2 (ja) | 1999-11-30 | 1999-11-30 | 文字認識装置及び文字枠線の検出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4439054B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008017053A (ja) * | 2006-07-04 | 2008-01-24 | Tokyo Soft Kk | 帳票処理装置 |
-
1999
- 1999-11-30 JP JP33999099A patent/JP4439054B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2001155113A (ja) | 2001-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4525787B2 (ja) | 画像抽出装置、及び画像抽出プログラム | |
EP0543593B1 (en) | Method for determining boundaries of words in text | |
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
JP4821869B2 (ja) | 文字認識装置、画像読取装置、およびプログラム | |
JPH05233873A (ja) | 領域分割方法 | |
US5841905A (en) | Business form image identification using projected profiles of graphical lines and text string lines | |
US8229214B2 (en) | Image processing apparatus and image processing method | |
JPH04270485A (ja) | 印刷文字認識装置 | |
JP4439054B2 (ja) | 文字認識装置及び文字枠線の検出方法 | |
JP4322041B2 (ja) | 画像処理装置、画像処理方法、画像処理プログラムおよびそのプログラムを記録したコンピュータ読取可能な記録媒体 | |
JP2868134B2 (ja) | 画像処理方法及び装置 | |
JPS6325391B2 (ja) | ||
JPH11288453A (ja) | 再生用のスキャン環境における原稿画像のスキュ―角度および黒い境界線を検出する方法およびシステム | |
JP3710164B2 (ja) | 画像処理装置及び方法 | |
EP0446630A2 (en) | Method and apparatus for segmenting characters in an amount field on a financial document | |
US6142374A (en) | Optical character reader | |
JPH05135204A (ja) | 文字認識装置 | |
JP2964980B2 (ja) | 光学的文字認識における直線成分検出方法及び装置 | |
JP3381803B2 (ja) | 傾き角検出装置 | |
JP2004152048A (ja) | 車両ナンバー読み取り装置 | |
JPH10233930A (ja) | 画像処理装置 | |
JPH05266250A (ja) | 文字列検出装置 | |
JP2918363B2 (ja) | 文字分類方法及び文字認識装置 | |
JP3277977B2 (ja) | 文字認識方法 | |
JPH0676108A (ja) | 文書画像の傾き検出方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20040608 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20040608 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061117 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090716 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090728 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090924 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091222 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100105 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130115 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4439054 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160115 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |