JP3311551B2 - イメージデータ入力処理方法およびその装置 - Google Patents

イメージデータ入力処理方法およびその装置

Info

Publication number
JP3311551B2
JP3311551B2 JP24764495A JP24764495A JP3311551B2 JP 3311551 B2 JP3311551 B2 JP 3311551B2 JP 24764495 A JP24764495 A JP 24764495A JP 24764495 A JP24764495 A JP 24764495A JP 3311551 B2 JP3311551 B2 JP 3311551B2
Authority
JP
Japan
Prior art keywords
horizontal ruled
image data
ruled line
ruled lines
reference horizontal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP24764495A
Other languages
English (en)
Other versions
JPH0991376A (ja
Inventor
修 中村
公知 小林
季樹 松村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP24764495A priority Critical patent/JP3311551B2/ja
Publication of JPH0991376A publication Critical patent/JPH0991376A/ja
Application granted granted Critical
Publication of JP3311551B2 publication Critical patent/JP3311551B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、スキャナやファク
シミリから帳票等をイメージデータとして入力する処理
に関し、特に、罫線枠を配置した帳票を入力する場合の
傾斜や蛇行を補正することによって、後の文字認識のた
めの文字イメージデータの切り出しの高精度化を実現す
るようにしたイメージデータ入力処理方法およびその装
置に関する。
【0002】
【従来の技術】スキャナやFAXから入力された文字イ
メージデータを、テキストデータとして計算機が処理可
能な文字コードへ変換するための文字認識技術は、人手
による文字入力稼働を削減する点で有用な技術と考えら
れている。
【0003】文字認識技術では、予め学習させた文字パ
タンとの類似性によって、入力された文字イメージデー
タがいずれの文字であるかを識別することを処理の基本
としている。従って、入力イメージデータ中の文字領域
を正確に切り出すことが、精度良く文字認識を行うため
の第一条件となる。
【0004】文字領域を切り出すための技術は大別して
2つの方法に分類される。第一の方法は、予め文字位置
に関する情報(書式情報)を定義しておき、文字切り出
しをこの書式定義情報に従って行う方法である。第二の
方法は、書式情報を一切使用せずに任意に配置された文
字領域を切り出す方法である。
【0005】これらの内、第二の方法は最終的な目標と
なる理想の方法ではあるが技術的に解決困難な問題が多
いため、もっぱら第一の方法に基づく文字切り出し方法
が考案されてきた。
【0006】書式定義情報を利用する第一の方法では、
入力された帳票イメージデータがいずれの帳票形式であ
るかを識別する技術、あるいは、予め定義した書式と合
致しているかを判定する技術が重要となる。
【0007】従来、これらのために、帳票上に識別マー
クを印刷しておく方法が用いられてきたが、帳票上のス
ペース使用効率が悪い、マークの印刷に特別な技術が必
要等の問題があった。そこで、特別な識別マークを使用
せずに、帳票中の罫線を検出することにより書式識別を
行う方法が有効と考えられてきた。
【0008】
【発明が解決しようとする課題】上述のとおり正確な文
字切り出しを行うための書式識別のために、帳票中の罫
線を用いる方法が有望であるが、この方法では基準とす
る縦または横方向に設けられた罫線を正確に検出できる
ことが条件となる。一般にスキャナやFAXから入力さ
れたイメージデータは傾斜したり蛇行している場合が多
く、この場合には正しく罫線の検出を行うことができな
いという問題があった。
【0009】本発明は上記事情に鑑みてなされたもの
で、その目的とするところは、従来の技術における上述
の如き問題を解消し、入力イメージデータの傾斜や蛇行
を補正することが可能なイメージデータ入力処理方法お
よびその装置を提供することにある。
【0010】
【課題を解決するための手段】本発明は、罫線枠を配置
した帳票イメージデータを入力する処理において、副走
査方向を1個以上の領域に分割し、各分割領域において
最長の横罫線の検出および該横罫線の傾斜角度を推定し
この横罫線を基準横罫線とし、隣接する2本の基準横罫
線が平行でない場合には、これらの基準横罫線を延長し
て交差する点を回転中心座標とし、これらの2本の基準
横罫線に挟まれる領域のイメージデータを回転中心座標
を基準として水平に位置補正を行う処理を全分割領域に
対して繰り返し、隣接する2本の基準横罫線が平行な場
合には、これら2本の基準横罫線によって挟まれる領域
のイメージデータを対応する推定傾斜角度に基づき傾斜
の補正を行う処理を全分割領域に対して繰り返すことを
特徴としている。
【0011】本発明においては、スキャナやFAXから
入力されたイメージデータの傾斜や蛇行を精度良く補正
することが可能となり、記入枠等の罫線検出に基づく書
式識別ならびに文字イメージデータの切り出しの高精度
化を実現することができる。
【0012】
【発明の実施の形態】以下、図面を用いて本発明の実施
例を説明する。図1は、本発明の一実施例に係わるイメ
ージデータ入力処理方法および装置の処理ブロック図で
ある。
【0013】図において、101は入力イメージデータ
を分割する領域分割処理ブロック、102は分割した各
イメージデータにおいて包含する横罫線の検出および傾
斜角度を推定する傾斜角度推定処理ブロック、103は
隣接する分割領域で検出された横罫線の推定傾斜角度か
らこれらの横罫線の延長上の交差点すなわちイメージデ
ータの蛇行発生時における回転中心座標を算出する回転
中心座標推定処理ブロック、104は回転中心座標を基
準にイメージデータ中の画素の位置を補正する回転補正
処理ブロックである。
【0014】これらの処理ブロックによる、入力イメー
ジデータの傾斜ならびに蛇行を補正する手順を以下に説
明する。領域分割処理ブロック101は、スキャナまた
はFAXから入力されたイメージデータを既定の分割数
nに分割する。分割する方向は、分割境界がイメージデ
ータの主走査方向(横方向)となる方向である。このイ
メージデータ領域の分割は、横罫線をその長さに依らず
イメージデータ中全面に渡って不足なく検出することを
目的に行う。
【0015】すなわち、領域分割を行わずに全領域を対
象として既定の長さ以上の横罫線の検出を行う方法で
は、例えばイメージデータの上端付近に比較的長い横罫
線が集中しイメージデータ下端付近に比較的短い横罫線
が集中した場合には、上端付近の横罫線のみが検出さ
れ、イメージデータの傾斜や蛇行の状況を正しく推定す
ることができないという問題が生じるためである。
【0016】傾斜角度推定処理ブロック102では、領
域分割処理ブロック101で分割した各イメージデータ
領域について横罫線の検出および検出罫線の傾斜角度の
推定を行う。横罫線の検出および傾斜角度の推定に当た
っては、例えば、横罫線の検出は、一定方向に連続する
黒画素の追跡や、黒画素分布のピークを検出するなどの
方法により実現できる。また、傾斜角度の推定は、検出
した横罫線の連続方向の推定や、黒画素との距離分布が
最大となる平行線の推定などの方法により実現できる。
これらの具体的な実施例については、後に図3を用いて
詳細に説明する。
【0017】傾斜角度推定処理ブロック102では、各
分割領域における最大長の横罫線を選択し、最終的にこ
の最大長の横罫線の傾斜角度を推定傾斜角度とする。
尚、以降の説明においてはこの選択された横罫線を基準
横罫線と呼ぶことにする。
【0018】回転中心座標推定処理ブロック103で
は、隣接する分割領域から検出された基準横罫線の推定
傾斜角度に応じて2つの処理モードで傾斜および蛇行を
補正するための補正基準座標を算出する。
【0019】まず第1の処理モードは、隣接する2つの
分割領域の基準横罫線が平行な場合の処理モードであ
る。この場合には、回転中心座標推定処理ブロック10
3は2本の基準横罫線で囲まれたイメージデータが単純
に傾斜していると判断する。
【0020】第2の処理モードは、隣接する2つの分割
領域の基準横罫線が平行でない場合の処理モードであ
る。この場合には、回転中心座標推定処理ブロック10
3は2本の基準横罫線で囲まれたイメージデータが蛇行
していると判断し、これら2本の基準横罫線を延長して
交差する点の座標を回転中心座標として算出する。
【0021】回転補正処理ブロック104では、回転中
心座標推定処理ブロック103での処理モード判定結果
に基づき以下の補正処理を行う。まず、着目する基準横
罫線間のイメージデータが単純に傾斜していた場合に
は、推定傾斜角度に基づき傾斜の補正を行う。ここでは
傾斜補正の具体的な方法については説明を省略するが、
例えば任意の1点を中心に補正対象となるイメージデー
タを傾斜とは逆方向に推定傾斜角度だけ回転させる方法
などによって実現できる。
【0022】また、着目する基準横罫線間のイメージデ
ータが蛇行していた場合には、回転中心座標推定処理ブ
ロック103によって推定した回転中心座標を中心とし
て、補正対象イメージデータ中の各画素の座標によって
定まる回転角度で、蛇行すなわち着目座標の画素の回転
とは逆方向へ回転させることにより補正を行う。尚、こ
の蛇行の補正方法については、後に図5および図6を用
いて詳細に説明する。
【0023】図2は、図1に示した領域分割処理ブロッ
ク101によって行う入力イメージデータの領域分割の
模様を具体的に説明するための図面である。図2におい
て、201は、入力イメージデータ全体を示している。
一般に、FAX等から入力される入力イメージデータ2
01の横方向は主走査方向と呼ばれ、縦方向は副走査方
向と呼ばれる。図2中のnは分割数を表し、任意に設定
可能な数値である。例えば、nの値として、4〜10程
度の数値を指定することで、入力イメージデータの全領
域から万遍なく横罫線を検出という領域分割の目的を達
成することができる。
【0024】図3は、図1で示した傾斜角度推定処理ブ
ロック102を詳細に説明するためのサブ処理ブロック
図面である。図3において、301は横罫線検出を行う
サブ処理ブロック、302は最長横罫線を選択するため
のサブ処理ブロック、303は最長横罫線上の2点の座
標を抽出するためのサブ処理ブロック、304は最長横
罫線上の2点の座標からtanθの値を計算するための
サブ処理ブロックである。
【0025】以下図3を用いて、分割対象領域に対する
傾斜角度推定を行う具体的な方法の一例を説明する。横
罫線検出サブ処理ブロック301では、対象分割領域中
に含まれる横罫線の検出を行う。横罫線の検出には各種
の方法を用いることができ、例えば、一定方向に連続す
る黒画素を探索し既定の長さ以上の連なりを横罫線とす
る方法や、種々の傾斜を持たせた基準とする罫線に対し
て垂直距離が等しくなる黒画素数の分布をとり、それら
の分布の中で最大の画素数分布を示す部分を横罫線とす
るなどの方法により実現できる。
【0026】サブ処理ブロック302では、サブ処理ブ
ロック301で検出された横罫線の内、各検出罫線の方
向において最長となる横罫線を選択する。サブ処理ブロ
ック303では、検出した最長横罫線上の任意の2点の
座標を抽出する。これは、直線上の2点から、その直線
の傾斜角度を推定するための処理である。サブ処理ブロ
ック304では、抽出した最長横罫線上の2点の座標か
らtanθの値を算出する。このtanθの値は、傾斜
角度と等価な意味を持ち、後の傾斜補正や蛇行補正に使
用する。
【0027】図4は、図1で示した回転中心座標推定処
理ブロック103による回転中心座標の推定の原理を説
明するための図面である。尚、図4では、隣接する基準
横罫線が全て平行ではなく、入力イメージデータが蛇行
している場合の例を示している。
【0028】図4において、401〜403は第1〜第
3までの分割領域から検出された基準横罫線、404と
405とは、罫線401と罫線402とからおよび罫線
402と罫線403とからそれぞれ推定された回転中心
点を示している。補正対象領域1は基準横罫線402の
延長線から入力イメージデータ201の上端までの全領
域であり、補正対象領域2は基準横罫線402と403
との延長線で囲まれた領域である。補正対象領域の設定
の方法は、入力イメージデータが単純に傾斜している場
合と蛇行の場合とで同様である。
【0029】図4に示したとおり、まず回転中心点は隣
接する基準横罫線を延長して交差する点として算出する
ことができる。また、隣接する基準横罫線が平行で補正
対象領域が単純に傾斜している場合には、着目する補正
対象領域内のイメージデータが全て一様な傾斜角度で傾
斜していると考えることができる。
【0030】補正対象領域は、図4の例のように回転中
心点404については入力イメージデータの上端から基
準横罫線402の延長線までの領域を、回転中心点40
5については基準横罫線402と403との延長線で囲
まれた領域を設定する。
【0031】図5は、図1で示した回転補正処理ブロッ
ク104による回転補正の具体的な手順を説明するため
の図面である。図5中の501は補正の基準とする副走
査方向アドレスを決定するサブ処理ブロック、502は
補正アドレスを決定するサブ処理ブロック、503は補
正後の座標へ対象黒画素を移動するサブ処理ブロックで
ある。尚、図5は、1つの回転中心点(図5では原点O
n)に基づく蛇行補正の手順例を示している。
【0032】以下に図5を用いて回転補正の具体的な手
順を説明する。サブ処理ブロック501では、補正対象
とする画素と原点Onとを結ぶ直線上にある入力イメー
ジデータの右端または左端の画素のY座標(Ey)を算
出する。サブ処理ブロック502では、原点Onの座標
(Ox,Oy)と、補正対象画素の座標(Px,P
y)、およびEyから、蛇行補正後の座標(Xc,Y
c)を算出する。実際の算出式は、例えば原点Onが入
力イメージデータの右側にある場合には、式(1) ,(2)
のとおりである。
【0033】 Xc=Px+(Ox−Px)−((Ox−Px)2 +(Oy−Py)2 1/2 ・・・式(1) Yc=Ey ・・・式(2) 算出サブ処理ブロック503では、補正対象の画素を補
正後の座標へ移動する。
【0034】図6は、図5で示した回転補正の原理を説
明する図面である。図6中、601は原点On、602
は入力イメージデータの右端、603〜605は補正対
象の画素と原点Onとを結ぶ直線の例を示している。図
6では、中央の矢印から上方の図が補正前の画素の例
を、中央の矢印から下方の図が補正後の画素の例を示し
ている。また、中央矢印より上方の図の画素の例では、
説明を簡便にするため、直線603、604上の画素と
右端の画素以外の記述を省略している。
【0035】以下に、直線603上の画素を補正対象と
した場合の回転補正の手順を説明する。まず、補正対象
とする直線603上の画素の補正後のY座標は全て、直
線602と603とが交差する点のY座標とする。補正
後のX座標については、前記の式(1) を用いて算出す
る。
【0036】図6の例では、直線603上の画素が直線
604上の位置へ補正される。図6の中央の矢印より下
部の画素は、上記の直線603上の画素の補正に相当す
る処理を繰り返した場合の補正後の画素の様子を示して
いる。つまり、図6の例では、原点Onと、イメージデ
ータ右端602上に縦方向に並ぶ画素とを結ぶ直線の延
長上に存在する画素の補正を順次行い、補正後の画素を
積み上げていくことで蛇行補正を行うことができる。
【0037】
【発明の効果】以上、詳細に説明した如く、本発明によ
れば、スキャナやFAXから入力されたイメージデータ
について、包含する横罫線の検出、これら横罫線の傾斜
角度の推定、および蛇行の回転中心座標の推定を行い、
これらの推定結果より、入力イメージデータの傾斜や蛇
行を精度良く補正することが可能なイメージデータ入力
処理方法およびその装置を実現できるという顕著な効果
を奏するものである。
【図面の簡単な説明】
【図1】イメージデータ入力処理方法および装置の処理
ブロックを説明する図である。
【図2】入力イメージデータの領域分割の模様を具体的
に説明するための図である。
【図3】傾斜角度推定処理ブロック102を詳細に説明
するための図である。
【図4】回転中心座標の推定の原理を説明する図であ
る。
【図5】回転補正の具体的な手順を説明するための図で
ある。
【図6】回転補正の原理を説明するための図である。
【符号の説明】
101 領域分割処理ブロック 102 傾斜角度推定処理ブロック 103 回転中心座標推定処理ブロック 104 回転補正処理ブロック 201 入力イメージデータ 301 横罫線検出サブ処理ブロック 302 最長横罫線を選択するサブ処理ブロック 303 最長横罫線上の2点の座標を抽出するサブ処理
ブロック 304 tanθの値を計算するサブ処理ブロック 401〜403 検出された基準横罫線 404〜405 回転中心点 501 基準副走査方向アドレスを決定するサブ処理ブ
ロック 502 補正対象画素の主走査・副走査方向の補正座標
を決定するサブ処理ブロック 503 補正座標へ画素を移動するサブ処理ブロック 601 回転中心点 602 入力イメージデータ右端 603〜605 原点Onと入力イメージデータ右端の
画素を結んだ直線
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平8−44819(JP,A) 特開 平6−245032(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 罫線枠を配置した帳票イメージデータを
    入力する処理において、 副走査方向を1個以上の領域に分割し、 各分割領域において最長の横罫線の検出および該横罫線
    の傾斜角度を推定しこの横罫線を基準横罫線とし、 隣接する2本の基準横罫線が平行でない場合には、これ
    らの基準横罫線を延長して交差する点を回転中心座標と
    し、これらの2本の基準横罫線に挟まれる領域のイメー
    ジデータを回転中心座標を基準として水平に位置補正を
    行う処理を全分割領域に対して繰り返し、 隣接する2本の基準横罫線が平行な場合には、これら2
    本の基準横罫線によって挟まれる領域のイメージデータ
    を対応する推定傾斜角度に基づき傾斜の補正を行う処理
    を全分割領域に対して繰り返すことを特徴とするイメー
    ジデータ入力処理方法。
  2. 【請求項2】 罫線枠を配置した帳票イメージデータを
    入力する装置において、 副走査方向を1個以上の領域に分割し、 各分割領域において最長の横罫線の検出および該横罫線
    の傾斜角度を推定しこの横罫線を基準横罫線とする手段
    と、 隣接する2本の基準横罫線が平行でない場合には、これ
    らの基準横罫線を延長して交差する点を回転中心座標と
    し、これらの2本の基準横罫線に挟まれる領域のイメー
    ジデータを回転中心座標を基準として水平に位置補正を
    行う処理を全分割領域に対して繰り返す手段と、 隣接する2本の基準横罫線が平行な場合には、これら2
    本の基準横罫線によって挟まれる領域のイメージデータ
    を対応する推定傾斜角度に基づき傾斜の補正を行う処理
    を全分割領域に対して繰り返す手段とを備えることを特
    徴とするイメージデータ入力処理装置。
JP24764495A 1995-09-26 1995-09-26 イメージデータ入力処理方法およびその装置 Expired - Lifetime JP3311551B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP24764495A JP3311551B2 (ja) 1995-09-26 1995-09-26 イメージデータ入力処理方法およびその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24764495A JP3311551B2 (ja) 1995-09-26 1995-09-26 イメージデータ入力処理方法およびその装置

Publications (2)

Publication Number Publication Date
JPH0991376A JPH0991376A (ja) 1997-04-04
JP3311551B2 true JP3311551B2 (ja) 2002-08-05

Family

ID=17166567

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24764495A Expired - Lifetime JP3311551B2 (ja) 1995-09-26 1995-09-26 イメージデータ入力処理方法およびその装置

Country Status (1)

Country Link
JP (1) JP3311551B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5744806B2 (ja) * 2012-08-29 2015-07-08 富士通フロンテック株式会社 文字認識装置、プログラム、及び方法
JP6200040B1 (ja) 2016-06-17 2017-09-20 株式会社Pfu 画像処理装置、画像処理方法、および、プログラム
CN114943973B (zh) * 2021-02-09 2024-10-18 广州视源电子科技股份有限公司 一种文本校正方法、装置、计算机设备及存储介质
CN114577310A (zh) * 2022-01-21 2022-06-03 北京信息科技大学 一种用于微孔板液位的检测系统

Also Published As

Publication number Publication date
JPH0991376A (ja) 1997-04-04

Similar Documents

Publication Publication Date Title
CN106251341B (zh) 一种印刷品质量检测方法
US6778703B1 (en) Form recognition using reference areas
JP2761467B2 (ja) 画像切り出し装置及び文字認識装置
CN110288040B (zh) 一种基于拓扑验证的图像相似评判方法及设备
JP2000251082A (ja) 文書画像傾き検出装置
JP3311551B2 (ja) イメージデータ入力処理方法およびその装置
JPH09311905A (ja) 行検出方法および文字認識装置
JP2004536300A (ja) 画像装置の位置の迅速な判断を可能にする基準のしるしの選択
JP2004536300A5 (ja)
JP3006466B2 (ja) 文字入力装置
JP3460356B2 (ja) 円ないし楕円の検出方法およびその装置
JP3303246B2 (ja) 画像処理装置
JP2010091525A (ja) 電子部品のパターンマッチング方法
JP3058791B2 (ja) 画像認識装置の図形の切出し方法
JPH06311333A (ja) 画像処理装置
JP2669661B2 (ja) 文書画像処理方法
JP4070486B2 (ja) 画像処理装置、画像処理方法及び同方法の実行に用いるプログラム
JP3077929B2 (ja) 文字切出し方式
JP3095470B2 (ja) 文字認識装置
WO2023068034A1 (ja) 画像処理装置
JPH09179982A (ja) 特定パターン検出方法
JP2982221B2 (ja) 文字読み取り装置
JP2000251075A (ja) 画像処理方法、画像処理装置および記録媒体
JP2856465B2 (ja) 画像生成処理方法
JP2001109826A (ja) 帳票処理装置及び帳票処理方法及びコンピュータ読み取り可能な記憶媒体

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090524

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090524

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100524

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100524

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110524

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120524

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130524

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140524

Year of fee payment: 12

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term