JP4108910B2 - 画像処理装置、画像処理方法および記録媒体 - Google Patents

画像処理装置、画像処理方法および記録媒体 Download PDF

Info

Publication number
JP4108910B2
JP4108910B2 JP2000265831A JP2000265831A JP4108910B2 JP 4108910 B2 JP4108910 B2 JP 4108910B2 JP 2000265831 A JP2000265831 A JP 2000265831A JP 2000265831 A JP2000265831 A JP 2000265831A JP 4108910 B2 JP4108910 B2 JP 4108910B2
Authority
JP
Japan
Prior art keywords
run
ruled line
ruled
image processing
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000265831A
Other languages
English (en)
Other versions
JP2002074264A (ja
Inventor
史裕 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2000265831A priority Critical patent/JP4108910B2/ja
Publication of JP2002074264A publication Critical patent/JP2002074264A/ja
Application granted granted Critical
Publication of JP4108910B2 publication Critical patent/JP4108910B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Processing (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、画像データの認識の妨げとなる罫線を精度よく消去することが可能な画像処理装置画像処理方法、およびそのプログラムを格納した記媒体に関する。
【0002】
【従来の技術】
従来、認識の妨げとなる罫線を消去する方法には、罫線を構成する長い黒ラン(連続して存在する黒画素列)を手がかりにするものが主であった。特開平10−171922号公報でも、罫線方向(長手方向)のある程度以上長い黒ランを抽出することをまず行い、抽出されたランの長さの総和を黒ランの方向に対し垂直な方向の座標毎に求め、これらの和を複数のブロックに分け、ブロックが1つであればそれらを罫線として認めて消去し、2つ以上ある場合には、複数のブロックのうちで最も大きな黒ラン長の総和値を持つブロックを罫線を構成する黒ラン群と認め、これらを消去するというもので、罫線と紛らわしい文字の誤消去を防ぐ工夫がなされている。
しかしながら、この方法では罫線に接触していない文字の誤消去を防ぐことはできるが、文字と罫線が交差している場合には、交差部分が文字の構成要素であっても罫線とともに消去されてしまう。また、画像の状態が悪く、罫線がかすれている場合には、罫線方向の黒ランが短く切れてしまい、長い黒ランの抽出が難しくなるため、罫線の消え残りが多くなる。さらに、長い黒ランが必要なため、点線罫線の消去も難しい。
【0003】
【発明が解決しようとする課題】
上述のごとく、従来の文字認識の妨げとなる罫線除去の画像処理方法およびそのような装置では、黒ランの線長によって罫線を認識しているため、罫線がかすれている場合や点線罫線の場合は消去が難しかった。また、文字と罫線が交差している場合には、文字の構成要素を罫線とともに消去してしまうという問題があった。
本発明は、比較的簡単な方法でこの問題を解決して、罫線と文字とが交差している場合でも誤って文字を消すようなことがなく、罫線にかすれがあった場合や、点線罫線の場合でも精度良く罫線消去が可能な画像処理装置および画像処理方法および画像処理方法をコンピュータに実行させるプログラムを記憶する記憶媒体の実現を課題とする。
【0004】
【課題を解決するための手段】
上記課題を達成するため、本発明に係る画像処理装置は、前記画像データから複数のランを罫線候補として抽出するラン抽出手段と、抽出された前記罫線候補を編集し、前記画像データの罫線を構成するランを抽出する編集手段と、を備え、前記編集手段は、罫線候補の複数のランから算出される回帰直線と複数の前記ランの中心との距離を夫々算出し、算出された距離の最大値が所定の閾値以上の場合に、最大値が算出されるランを該罫線候補から除去し、該罫線候補のランを更新する一連の処理を前記閾値以上の距離が算出されるランがなくなるまで繰り返し行うことにより、罫線を構成するランを抽出することを特徴とする。
ここで、前記画像データ中の罫線の位置を推定する罫線位置推定手段を備え、前記ラン抽出手段は、前記罫線位置推定手段で推定された罫線の推定位置付近で前記罫線と垂直な方向のランを、前記画像データの罫線候補として抽出することが好ましい。
また、前記ラン抽出手段により抽出された複数のランにかかる長さの分布を示すヒストグラムを求めるヒストグラム算出手段を備え、前記ラン抽出手段は、求められた前記ヒストグラムの最頻値と大きく異なる長さをもつラン以外のランを罫線候補として抽出することが好適である。
【0005】
なお、本発明では、光学的文字認識を実行する画像処理装置において、処理対象の画像を取り込む画像入力手段と、この画像入力手段が取り込んだ画像データを格納する画像データ格納手段と、この画像データ格納手段に格納された前記画像データ中の罫線の位置を推定する罫線位置推定手段と、この罫線位置推定手段で推定された罫線の推定位置付近で前記罫線と垂直な方向の黒ランを抽出する垂直方向ラン抽出手段と、この垂直方向ラン抽出手段で抽出されたランを格納しておくランデータ格納手段と、前記垂直方向ラン抽出手段で抽出されたランデータの中心を通る回帰直線を求める回帰直線算出手段と、この回帰直線算出手段で算出された回帰直線と前記ランデータの距離を求めるラン直線間距離算出手段と、このラン直線間距離算出手段で算出された距離の最大値とあらかじめ定めておいた閾値とを比較する距離最大値吟味手段と、この距離最大値吟味手段での比較によって前記最大値があらかじめ定めておいた前記閾値以上である場合にこの最大値を与えるランデータを除外するランデータ編集手段と、前記最大値があらかじめ定めておいた閾値未満である場合に前記ランデータ格納手段に格納されているランデータの位置に相当する部分を画像上で白画素に置き換えるラン消去手段とを具備してもよい。
また、光学的文字認識を実行する画像処理装置において、処理対象の画像を取り込む画像入力手段と、この画像入力手段が取り込んだ画像データを格納する画像データ格納手段と、この画像データ格納手段に格納された前記画像データ中の罫線の位置を推定する罫線位置推定手段と、この罫線位置推定手段で推定された罫線の推定位置付近で前記罫線と垂直な方向の黒ランを抽出する垂直方向ラン抽出手段と、この垂直方向ラン抽出手段で抽出されたランを格納しておくランデータ格納手段と、前記垂直方向ラン抽出手段で抽出されたランデータの長さの分布を示すヒストグラムを求めるラン長ヒストグラム算出手段と、このラン長ヒストグラム算出手段が求めたヒストグラムの中から長さの最頻値を求めるラン長最頻値算出手段と、このラン長最頻値算出手段が求めた長さの最頻値と大きく異なる長さを持つランをデータから除外する異長ランデータ除外手段と、この異長ランデータ除外手段で除外されなかった前記画像データ格納手段に格納されている前記ランデータの中心を通る回帰直線を求める回帰直線算出手段と、この回帰直線算出手段で算出された回帰直線と前記ランデータの距離を求めるラン直線間距離算出手段と、このラン直線間距離算出手段で算出された距離の最大値とあらかじめ定めておいた閾値とを比較する距離最大値吟味手段と、この距離最大値吟味手段での比較によって前記最大値があらかじめ定めておいた前記閾値以上である場合にこの最大値を与えるランデータを除外するランデータ編集手段と、前記最大値があらかじめ定めておいた閾値未満である場合に前記ランデータ格納手段に格納されているランデータの位置に相当する部分を画像上で白画素に置き換えるラン消去手段とを具備してもよい。これらにより、文字認識の妨げとなる罫線を、罫線と文字とが交差している場合でも誤って文字を消すようなことがなく、罫線にかすれがあった場合や、点線罫線の場合でも精度良く消去することが可能な画像処理装置を実現することができる。
【0006】
上記課題を達成するため、本発明に係る画像処理方法は、画像データから複数のランを罫線候補として抽出するラン抽出ステップと、抽出された前記罫線候補を編集し、前記画像データの罫線を構成するランを抽出する編集ステップとを有し、前記編集ステップは、罫線候補の複数のランから算出される回帰直線と複数の前記ランの中心との距離を夫々算出し、算出された距離の最大値が所定の閾値以上の場合に、最大値が算出されるランを該罫線候補から除去し、該罫線候補のランを更新する一連の処理を前記閾値以上の距離が算出されるランがなくなるまで繰り返し行うことにより、罫線を構成するランを抽出することを特徴とする。
ここで、前記画像データ中の罫線の位置を推定する罫線位置推定ステップを有し、前記ラン抽出ステップは、前記罫線位置推定ステップで推定された罫線の推定位置付近で前記罫線と垂直な方向のランを、前記画像データの罫線候補として抽出することが好ましい。
また、前記ラン抽出ステップにより抽出された複数のランにかかる長さの分布を示すヒストグラムを求めるヒストグラム算出ステップを有し、前記ラン抽出ステップは、求められた前記ヒストグラムの最頻値と大きく異なる長さをもつラン以外のランを罫線候補として抽出することが好適である。
【0007】
なお、本発明では、光学的文字認識を実行する画像処理方法において、処理対象の画像を取り込む画像入力過程と、この画像入力過程で取り込んだ画像データを格納する画像データ格納過程と、この画像データ格納過程で格納された前記画像データ中の罫線の位置を推定する罫線位置推定過程と、この罫線位置推定過程で推定された罫線の推定位置付近で前記罫線と垂直な方向の黒ランを抽出する垂直方向ラン抽出過程と、この垂直方向ラン抽出過程で抽出されたランを格納しておくランデータ格納過程と、前記垂直方向ラン抽出過程で抽出されたランデータの中心を通る回帰直線を求める回帰直線算出過程と、この回帰直線算出過程で算出された回帰直線と前記ランデータの距離を求めるラン直線間距離算出過程と、このラン直線間距離算出過程で算出された距離の最大値とあらかじめ定めておいた閾値とを比較する距離最大値吟味過程と、この距離最大値吟味過程での比較によって前記最大値があらかじめ定めておいた前記閾値以上である場合にこの最大値を与えるランデータを除外するランデータ編集過程と、前記最大値があらかじめ定めておいた閾値未満である場合に前記ランデータ格納過程に格納されているランデータの位置に相当する部分を画像上で白画素に置き換えるラン消去過程とを具備してもよい。
また、光学的文字認識を実行する画像処理方法において、処理対象の画像を取り込む画像入力過程と、この画像入力過程で取り込んだ画像データを格納する画像データ格納過程と、この画像データ格納過程で格納された前記画像データ中の罫線の位置を推定する罫線位置推定過程と、この罫線位置推定過程で推定された罫線の推定位置付近で前記罫線と垂直な方向の黒ランを抽出する垂直方向ラン抽出過程と、この垂直方向ラン抽出過程で抽出されたランを格納しておくランデータ格納過程と、前記垂直方向ラン抽出過程で抽出されたランデータの長さの分布を示すヒストグラムを求めるラン長ヒストグラム算出過程と、このラン長ヒストグラム算出過程が求めたヒストグラムの中から長さの最頻値を求めるラン長最頻値算出過程と、このラン長最頻値算出過程が求めた長さの最頻値と大きく異なる長さを持つランをデータから除外する異長ランデータ除外過程と、この異長ランデータ除外過程で除外されなかった前記画像データ格納過程に格納されている前記ランデータの中心を通る回帰直線を求める回帰直線算出過程と、この回帰直線算出過程で算出された回帰直線と前記ランデータの距離を求めるラン直線間距離算出過程と、このラン直線間距離算出過程で算出された距離の最大値とあらかじめ定めておいた閾値とを比較する距離最大値吟味過程と、この距離最大値吟味過程での比較によって前記最大値があらかじめ定めておいた前記閾値以上である場合にこの最大値を与えるランデータを除外するランデータ編集過程と、前記最大値があらかじめ定めておいた閾値未満である場合に前記ランデータ格納過程に格納されているランデータの位置に相当する部分を画像上で白画素に置き換えるラン消去過程とを具備してもよい。これらにより、文字認識の妨げとなる罫線を、罫線と文字とが交差している場合でも誤って文字を消すようなことがなく、罫線にかすれがあった場合や、点線罫線の場合でも精度良く消去することが可能な画像処理方法を実現することができる。
【0008】
上記課題を達成するため、本発明に係るコンピュータ読み取り可能な記録媒体は、前記本発明に係る画像処理方法をコンピュータに実行させるためのプログラムを記録したことを特徴とする。
【0009】
なお、本発明では、光学的文字認識を実行する処理方法をコンピュータに実現させるプログラムを格納しコンピュータから読み取り可能な記録媒体において、処理対象の画像を取り込む画像入力機能と、この画像入力機能で取り込んだ画像データを格納する画像データ格納機能と、この画像データ格納機能で格納された前記画像データ中の罫線の位置を推定する罫線位置推定機能と、この罫線位置推定機能で推定された罫線の推定位置付近で前記罫線と垂直な方向の黒ランを抽出する垂直方向ラン抽出機能と、この垂直方向ラン抽出機能で抽出されたランを格納しておくランデータ格納機能と、前記垂直方向ラン抽出機能で抽出されたランデータの中心を通る回帰直線を求める回帰直線算出機能と、この回帰直線算出機能で算出された回帰直線と前記ランデータの距離を求めるラン直線間距離算出機能と、このラン直線間距離算出機能で算出された距離の最大値とあらかじめ定めておいた閾値とを比較する距離最大値吟味機能と、この距離最大値吟味機能での比較によって前記最大値があらかじめ定めておいた前記閾値以上である場合にこの最大値を与えるランデータを除外するランデータ編集機能と、前記最大値があらかじめ定めておいた閾値未満である場合に前記ランデータ格納機能に格納されているランデータの位置に相当する部分を画像上で白画素に置き換えるラン消去機能とを具備してもよい。
また、光学的文字認識を実行する処理方法をコンピュータに実現させるプログラムを格納しコンピュータから読み取り可能な記録媒体において、処理対象の画像を取り込む画像入力機能と、この画像入力機能で取り込んだ画像データを格納する画像データ格納機能と、この画像データ格納機能で格納された前記画像データ中の罫線の位置を推定する罫線位置推定機能と、この罫線位置推定機能で推定された罫線の推定位置付近で前記罫線と垂直な方向の黒ランを抽出する垂直方向ラン抽出機能と、この垂直方向ラン抽出機能で抽出されたランを格納しておくランデータ格納機能と、前記垂直方向ラン抽出機能で抽出されたランデータの長さの分布を示すヒストグラムを求めるラン長ヒストグラム算出機能と、このラン長ヒストグラム算出機能で求めたヒストグラムの中から長さの最頻値を求めるラン長最頻値算出機能と、このラン長最頻値算出機能で求めた長さの最頻値と大きく異なる長さを持つランをデータから除外する異長ランデータ除外機能と、この異長ランデータ除外機能で除外されなかった前記画像データ格納機能に格納されている前記ランデータの中心を通る回帰直線を求める回帰直線算出機能と、この回帰直線算出機能で算出された回帰直線と前記ランデータの距離を求めるラン直線間距離算出機能と、このラン直線間距離算出機能で算出された距離の最大値とあらかじめ定めておいた閾値とを比較する距離最大値吟味機能と、この距離最大値吟味機能での比較によって前記最大値があらかじめ定めておいた前記閾値以上である場合にこの最大値を与えるランデータを除外するランデータ編集機能と、前記最大値があらかじめ定めておいた閾値未満である場合に前記ランデータ格納機能に格納されているランデータの位置に相当する部分を画像上で白画素に置き換えるラン消去機能とを具備してもよい。これらにより、文字認識の妨げとなる罫線を、罫線と文字とが交差している場合でも誤って文字を消すようなことがなく、罫線にかすれがあった場合や、点線罫線の場合でも精度良く消去することが可能な画像処理方法をコンピュータに実現させるプログラムを格納したコンピュータから読み取り可能な記録媒体を実現することができる。
【0010】
【発明の実施の形態】
以下、本発明にかかる画像処理方法、画像処理装置を添付図面を参照にして詳細に説明する。
【0011】
図1は本発明の画像処理装置の第1の実施の形態の構成を示すブロック図である。図1において、符号1は処理対象の画像を取り込むスキャナ等の画像入力手段、符号2は入ってきた画像を格納する画像格納手段、符号3は画像中の消去すべき罫線の位置をおおよそに定める罫線位置推定手段、符号4は罫線付近の罫線とは垂直な方向の黒ランを抽出する垂直方向ラン抽出手段、符号5は抽出されたランデータを格納するランデータ格納手段、符号6はランの中心を通る回帰直線を求める回帰直線算出手段、符号7はランデータに基づいて画像上からランを消去するラン消去手段、符号8は各ランデータと回帰直線の距離を求めるラン直線間距離算出手段、符号9は格納されているランデータの削除を行うランデータ編集手段、符号10はランと回帰直線の距離の最大値を吟味し、後段の処理を決定する距離最大値吟味手段である。
【0012】
図2に、本実施の形態の処理動作を示すフローチャートである。処理対象の二値画像を画像入力手段1により取り込み、画像データ格納手段2に格納する(ステツプ101)。次に消去すべき罫線の位置の推定を罫線位置推定手段3によって行う(ステップ102)。罫線位置推定には様々な方法が考えられるが、例えば、特開平10−91783号公報にあるように、未記入の同一フォーマットの帳票画像との位置あわせを行い、この画像上の位置座標値で定義された文字記入欄から処理対象の画像上の文字記入欄の位置を推定し、その周囲を罫線の存在する範囲とする方法などを用いる。
罫線の存在する範囲が求められたら罫線の向きとは垂直な方向の黒ランを垂直方向ラン抽出手段4により求め(ステップ103)、ランデータ格納手段5にランデータを格納する。
【0013】
この場合、図3に示すようにラン抽出は罫線があると推定された位置より少し広い範囲で行い、抽出漏れがないようにするが、もしここで抽出されたランをすべて消去した場合には、文字の一部も消去されてしまい、後段の文字認識処理に悪影響を及ぼす。
図4に示すように、罫線から独立している部分や、文字が交差している部分は、ランの中心が回帰直線から離れている傾向がある。そこで、回帰直線から遠いランを除外し、残ったランデータ部分を用いて罫線消去すれば良いのだが、罫線でないランデータも回帰直線の計算に使用しているので、一度に複数のランを除外すると、本来罫線であるべきランまで除外してしまう恐れがある。そこで、回帰直線から最も遠いランをひとつだけ除外し、改めて回帰直線を求めて再び各ランとの距離を計算することで、罫線を通る回帰直線の精度を高めることができる。これを繰り返せば、罫線を構成するランだけがデータに残ることになり、精度良く罫線の消去が行えることになる。
【0014】
このために、つぎの段階として、回帰直線算出手段6でランの中心を通る回帰直線を求める(ステップ104)。
回帰直線は次のように求める。主走査方向、副走査方向をそれぞれX方向、Y方向とすれば、主走査方向罫線の場合、回帰直線の式を
【0015】
y=a+bx
とし、ランの中心座標を
【0016】
(Xi,Yi) (i=1,2,3,…N)(Nはランの総数)
とおくと、省略記号
【0017】
【数1】
Figure 0004108910
【0018】
を用いて、係数a、bは
【0019】
【数2】
Figure 0004108910
【0020】
と書くことができる。副走査方向にも同様にして、回帰曲線
【0021】
x=c+dy
の係数c、dは
【0022】
【数3】
Figure 0004108910
【0023】
で求められる。
【0024】
次にラン直線間距離算出手段8で、各ランと回帰直線との間の距離の最大値を求め(ステップ105)、距離最大値吟味手段10におくる。ここでは、あらかじめ定めておいた値と、最大値との比較を行い(ステツプ106)、最大値の方が大きかったら、最大値を与えるランをランデータ編集手段9で除外し(ステップ107)、残ったランで再び回帰直線を求めるステップ104に戻る。もし最大値のほうが小さければ、格納されているランデータの情報をもとに、ラン消去手段7で画面上のランデータの部分を白画素で置き換える(ステップ108)。
この操作をすべての処理対象罫線について行い(ステップ109)、終了したなら結果画像を出力して(ステップ110)処理を終える。
【0025】
なお、図では消去対象の罫線は実線であるが、点線でも全く同じ方法で罫線消去を行うことができる。また、この方法では罫線方向のラン情報を用いていないことから、罫線がかすれて短く切れていても消去の精度低下が罫線方向のラン情報を用いる場合に比べて少ない。
【0026】
図5のように、文字が交差している場合でも、罫線の探索範囲の幅を超えているランがあった場合、ランの中心が偶然回帰直線付近に来てしまい、文字の一部であるにも関わらず、誤って消去対象になってしまう場合がある。これを避けるためには、探索範囲の幅を広げ、ランがこの幅を超えないようにすれば良いが、幅が広がるとラン抽出や距離計算などに時間がかかってしまう。
そこで、以下に示すようにまずランのヒストグラムの最頻値から罫線の幅を推定し、そこからある程度離れた長さを持つランを、回帰曲線の計算の前にあらかじめ除外しておけば、処理時間をさほど増大させることなく、誤消去を防ぐことができる。
【0027】
図6は本発明の第2の実施の形態の構成を示すブロック図である。基本的には第1の実施の形態と同一であるが、図の左側の部分が本実施の形態で加わった部分である。図6において、符号1から符号10までの部分は図1と同一である。符号21は、ランデータをもとに、ランの長さのヒストグラムを求めるラン長ヒストグラム算出手段、符号22はヒストグラムの最頻値を求めるラン長最頻値算出手段、符号23は最頻のラン長から大きく異なったランデータを選び、ランデータから削除する異長ランデータ除外手段である。
【0028】
図7は、本実施の形態の処理動作を示すフローチャートである。これも、大きな流れは図2のフローチャートと同一であり、ステップ103とステップ104の間に新たなステップが加わる形であるので、追加部分だけを記してある。
まず、ステップ103で、罫線と垂直方向のランを抽出した後、ラン長ヒストグラム算出手段21でランの長さのヒストグラムを求める(ステップ201)。次に、求めたヒストグラムをもとに、ラン長最頻値算出手段22でランの長さの最頻値を求める(ステップ202)。これは罫線の幅を代表する値であると考えられるので、ランの長さがこの幅と掛け離れたものは罫線では無いと考え、異長ランデータ除外手段23で、あらかじめ定めておいた値以上の長さ差があるランを、以降の処理には用いないようにランデータから除外することにする(ステップ203)。
図7に示した以上の処理を加えることによって、図8に示すように、長さのことなるランは、回帰直線の計算に初めから含まれないため、誤って消去されることがなくなる。
【0029】
図9に、本発明の第3の実施の形態の構成を表すブロック図を示す。この構成は、本発明をソフトウェアで実現する場合の構成である。図9において、符号31はCPU、符号32はメモリ、符号33はハードディスク、符号34は入力装置、符号35はCD−ROMドライブ、符号36はディスプレイ、符号37はCD−ROMなどの記録媒体である。この構成では、汎用の処理装置を用い、記録媒体37には、本発明の罫線消去の処理機能や処理手順を実現させるためのプログラムが記憶されている。処理対象の原稿画像は、例えば、ハードディスク33などに格納されている。CPU31は、記録媒体37から罫線消去の処理機能や処理手順を実現させるプログラムを読み出して実行し、罫線消去をおこなった結果をディスプレイ36などに出力する。
【0030】
以上説明したように本発明は精度よく罫線消去可能となる。
【図面の簡単な説明】
【図1】本発明の画像処理装置の一実施の形態の構成を示すブロック図。
【図2】図1の実施の形態の処理動作を示すフローチャート。
【図3】図1の実施の形態の罫線消去動作を示す説明図。
【図4】図1の実施の形態の罫線消去動作を示す説明図。
【図5】図1の実施の形態の罫線消去動作を示す説明図。
【図6】本発明の画像処理装置の他の実施の形態の構成を示すブロック図。
【図7】図6の実施の形態の処理動作の図2に対する追加分を示すフローチャート。
【図8】図6の実施の形態の罫線消去動作を示す説明図。
【図9】本発明のさらに他の実施の形態の構成を表すブロック図。
【符号の説明】
1 画像入力手段
2 画像格納手段
3 罫線位置推定手段
4 垂直方向ラン抽出手段
5 ランデータ格納手段
6 回帰直線算出手段
7 ラン消去手段
8 ラン直線間距離算出手段
9 ランデータ編集手段
10 距離最大値吟味手段
21 ラン長ヒストグラム算出手段
22 ラン長最頻値算出手段
23 異長ランデータ除外手段
31 CPU
32 メモリ
33 ハードディスク
34 入力装置
35 CD−ROMドライブ
36 ディスプレイ
37 記録媒体

Claims (7)

  1. 画像データから罫線を削除する画像処理装置において、
    前記画像データから複数のランを罫線候補として抽出するラン抽出手段と、
    抽出された前記罫線候補を編集し、前記画像データの罫線を構成するランを抽出する編集手段と、
    を備え、
    前記編集手段は、罫線候補の複数のランから算出される回帰直線と複数の前記ランの中心との距離を夫々算出し、算出された距離の最大値が所定の閾値以上の場合に、最大値が算出されるランを該罫線候補から除去し、該罫線候補のランを更新する一連の処理を前記閾値以上の距離が算出されるランがなくなるまで繰り返し行うことにより、罫線を構成するランを抽出することを特徴とする画像処理装置。
  2. 前記画像データ中の罫線の位置を推定する罫線位置推定手段を備え、
    前記ラン抽出手段は、前記罫線位置推定手段で推定された罫線の推定位置付近で前記罫線と垂直な方向のランを、前記画像データの罫線候補として抽出することを特徴とする請求項1に記載の画像処理装置。
  3. 前記ラン抽出手段により抽出された複数のランにかかる長さの分布を示すヒストグラムを求めるヒストグラム算出手段を備え、
    前記ラン抽出手段は、求められた前記ヒストグラムの最頻値と大きく異なる長さをもつラン以外のランを罫線候補として抽出することを特徴とする請求項1または2に記載の画像処理装置。
  4. 画像データから罫線を削除する画像処理方法において、
    前記画像データから複数のランを罫線候補として抽出するラン抽出ステップと、
    抽出された前記罫線候補を編集し、前記画像データの罫線を構成するランを抽出する編集ステップと、
    を有し、
    前記編集ステップは、罫線候補の複数のランから算出される回帰直線と複数の前記ランの中心との距離を夫々算出し、算出された距離の最大値が所定の閾値以上の場合に、最大値が算出されるランを該罫線候補から除去し、該罫線候補のランを更新する一連の処理を前記閾値以上の距離が算出されるランがなくなるまで繰り返し行うことにより、罫線を構成するランを抽出することを特徴とする画像処理方法。
  5. 前記画像データ中の罫線の位置を推定する罫線位置推定ステップを有し、
    前記ラン抽出ステップは、前記罫線位置推定ステップで推定された罫線の推定位置付近で前記罫線と垂直な方向のランを、前記画像データの罫線候補として抽出することを特徴とする請求項4に記載の画像処理方法。
  6. 前記ラン抽出ステップにより抽出された複数のランにかかる長さの分布を示すヒストグラムを求めるヒストグラム算出ステップを有し、
    前記ラン抽出ステップは、求められた前記ヒストグラムの最頻値と大きく異なる長さをもつラン以外のランを罫線候補として抽出することを特徴とする請求項4または5に記載の画像処理方法。
  7. 請求項4乃至6のいずれかに記載の画像処理方法をコンピュータに実行させるためのプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP2000265831A 2000-09-01 2000-09-01 画像処理装置、画像処理方法および記録媒体 Expired - Fee Related JP4108910B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000265831A JP4108910B2 (ja) 2000-09-01 2000-09-01 画像処理装置、画像処理方法および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000265831A JP4108910B2 (ja) 2000-09-01 2000-09-01 画像処理装置、画像処理方法および記録媒体

Publications (2)

Publication Number Publication Date
JP2002074264A JP2002074264A (ja) 2002-03-15
JP4108910B2 true JP4108910B2 (ja) 2008-06-25

Family

ID=18753034

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000265831A Expired - Fee Related JP4108910B2 (ja) 2000-09-01 2000-09-01 画像処理装置、画像処理方法および記録媒体

Country Status (1)

Country Link
JP (1) JP4108910B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102251781B (zh) * 2011-04-27 2013-07-17 中铁二局股份有限公司 散粒体围岩隧道导向水平旋喷桩预支护施工方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5724454B2 (ja) 2011-02-25 2015-05-27 村田機械株式会社 画像処理装置及び画像処理方法
US9235755B2 (en) * 2013-08-15 2016-01-12 Konica Minolta Laboratory U.S.A., Inc. Removal of underlines and table lines in document images while preserving intersecting character strokes
JP6072148B2 (ja) * 2015-07-08 2017-02-01 株式会社東芝 手書き文書処理装置、方法およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102251781B (zh) * 2011-04-27 2013-07-17 中铁二局股份有限公司 散粒体围岩隧道导向水平旋喷桩预支护施工方法

Also Published As

Publication number Publication date
JP2002074264A (ja) 2002-03-15

Similar Documents

Publication Publication Date Title
US8965103B2 (en) Image processing apparatus and image processing method
US8306288B2 (en) Automatic identification of fingerprint inpainting target areas
US8791998B2 (en) Image processing apparatus and method for displaying images
JP6268023B2 (ja) 文字認識装置およびその文字切り出し方法
US20040101209A1 (en) Image processing device, image processing method, and record medium on which the same is recorded
JP2001092919A (ja) 2次元バーコードのねじれ角決定法
JP3204245B2 (ja) 罫線除去方法および装置
US7630572B2 (en) Image processing apparatus, image processing method, and computer program
JP2008011484A (ja) 文字図形列抽出装置,文字図形列抽出方法,その方法を実行するプログラム,そのプログラムを記録した記録媒体
JP3615333B2 (ja) 罫線消去装置
JP4108910B2 (ja) 画像処理装置、画像処理方法および記録媒体
US20100172595A1 (en) Image processing method, image processing apparatus, and computer program
JP3090070B2 (ja) 帳票識別方法及び装置
JP2796561B2 (ja) 表形式文書認識方式
JP4040231B2 (ja) 文字抽出方法及び装置並びに記憶媒体
JP2019045924A (ja) 指紋特徴抽出装置及び指紋特徴抽出方法
US20240029213A1 (en) Document-occluding artifact removal
JP4116179B2 (ja) 画像処理方法、画像処理装置および記録媒体
JP2001236464A (ja) 文字抽出方法、文字抽出装置及び記憶媒体
US20220406083A1 (en) Image processing apparatus, control method thereof, and storage medium
JP2005352623A (ja) パターン照合装置、画像品質検証方法及び画像品質検証プログラム
JP2010258627A (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP3077929B2 (ja) 文字切出し方式
JPH07120392B2 (ja) 文字パターン切り出し装置
JP4094359B2 (ja) 画像処理装置、画像処理方法、及びその方法をコンピュータに実行させるプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041221

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050117

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070809

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070814

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080401

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080403

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110411

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120411

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130411

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140411

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees