JP3814334B2 - 画像処理装置及びその方法 - Google Patents
画像処理装置及びその方法 Download PDFInfo
- Publication number
- JP3814334B2 JP3814334B2 JP09840396A JP9840396A JP3814334B2 JP 3814334 B2 JP3814334 B2 JP 3814334B2 JP 09840396 A JP09840396 A JP 09840396A JP 9840396 A JP9840396 A JP 9840396A JP 3814334 B2 JP3814334 B2 JP 3814334B2
- Authority
- JP
- Japan
- Prior art keywords
- ruled line
- key
- ruled
- extracted
- extracting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Description
【発明の属する技術分野】
本発明は、入力された原稿画像に存在する罫線を抽出する画像処理装置及びその方法に関するものである。
【0002】
【従来の技術】
従来の画像処理装置においては複数の罫線を有する原稿画像に対し、その原稿画像に存在する罫線を抽出する場合は、その原稿画像の濃度ヒストグラムを算出し、その算出された濃度ヒストグラムに基づいて罫線を抽出したり、あるいは原稿画像に存在する画素の連続性から罫線を抽出していた。
【0003】
【発明が解決しようとする課題】
しかしながら、上記従来の画像処理装置では、原稿画像に存在する罫線の傾斜、かすれ、位置のずれ、大きさの違い等の要因があると罫線の抽出が正確にできかったり、文字列等を罫線として誤って抽出してしまうという問題点があった。また、固有のフォーマットを有する原稿画像に存在する罫線の抽出を、そのフォーマットから罫線の位置を示す情報を獲得することで、罫線の抽出の精度を向上する方法もあるが、この場合、固有のフォーマットを有する原稿画像以外の原稿画像には適用できなかった。
【0004】
本発明は上記の問題点に鑑みてなされたものであり、複数種類のフォーマットを有する原稿画像を識別することができ、その識別されたフォーマットに基づいて、原稿画像に存在する罫線を抽出することで、罫線を精度良く抽出できる画像処理装置及びその方法を提供することを目的としている。
【0005】
【課題を解決するための手段】
入力された原稿画像に存在する罫線を抽出する画像処理装置であって、
複数種類のフォーマットに関し、各フォーマットに存在する罫線に関する罫線情報と各フォーマットを識別するためのキー罫線に関するキー罫線情報とを記憶する記憶手段と、
前記入力された原稿画像からキー罫線を抽出するキー罫線抽出手段と、
当該抽出されたキー罫線と前記記憶手段に記憶されたキー罫線情報とに基づいて、該原稿画像のフォーマットを識別する識別手段と、
前記識別手段で識別されたフォーマットに関する罫線情報と各キー罫線に基づいて定められる検索範囲とに基づいて、前記原稿画像に存在する罫線の位置を推測し、当該推測された位置に存在する罫線を前記原稿画像から抽出する抽出手段と
を備える。
【0006】
また、好ましくは、前記入力された原稿画像の傾斜を補正する補正手段を
更に備える。
また、好ましくは、前記キー罫線抽出手段は、前記原稿画像から抽出された罫線の内、所定の長さ以上の罫線をキー罫線候補として抽出し、当該抽出されたキー罫線候補の長さ及び位置関係に基づいて前記キー罫線を抽出する。
また、好ましくは、前記キー罫線抽出手段で抽出されるキー罫線は、第1の方向の罫線であり、前記抽出手段で抽出される罫線は第2の方向の罫線である。
【0007】
また、好ましくは、前記抽出手段は、前記識別手段で識別されたフォーマットに関する罫線情報と各キー罫線に基づいて定められる検索範囲とに基づいて、前記原稿画像に存在する罫線の位置を推測し、前記検索範囲内の濃度ヒストグラムに基づいて当該推測された位置に存在する罫線を前記原稿画像から抽出する。
【0008】
また、好ましくは、前記識別手段で識別されたフォーマットに関するキー罫線の内、前記キー罫線抽出手段で抽出されていないキー罫線があると判断した場合、当該フォーマットのキー罫線に関する罫線情報に基づいて、前記原稿画像内のキー罫線を再抽出する再抽出手段を更に備え、
前記抽出手段は、前記識別されたフォーマットの罫線情報と、前記キー罫線抽出手段で抽出されたキー罫線と前記再抽出手段で再抽出されたキー罫線とに基づいて定められる検索範囲とに基づいて、前記原稿画像に存在する罫線の位置を推測し、当該推測された位置に存在する罫線を前記原稿画像から抽出する。
【0009】
上記の目的を達成するための本発明による画像処理方法は以下の構成を備える。即ち、
入力された原稿画像に存在する罫線を抽出する画像処理方法であって、
前記入力された原稿画像からキー罫線を抽出するキー罫線抽出工程と、
各フォーマットを識別するためのキー罫線に関するキー罫線情報とを記憶する記憶手段を参照して、前記キー罫線抽出工程で抽出されたキー罫線と前記記憶手段に記憶されたキー罫線情報とに基づいて、該原稿画像のフォーマットを識別する識別工程と、
前記識別工程で識別されたフォーマットに関する罫線情報と各キー罫線に基づいて定められる検索範囲とに基づいて、前記原稿画像に存在する罫線の位置を推測し、当該推測された位置に存在する罫線を前記原稿画像から抽出する抽出工程と
を備える。
【0010】
また、好ましくは、前記入力された原稿画像の傾斜を補正する補正工程を
更に備える。
また、好ましくは、前記キー罫線抽出工程は、前記原稿画像から抽出された罫線の内、所定の長さ以上の罫線をキー罫線候補として抽出し、当該抽出されたキー罫線候補の長さ及び位置関係に基づいて前記キー罫線を抽出する。
また、好ましくは、前記キー罫線抽出工程で抽出されるキー罫線は、第1の方向の罫線であり、前記抽出工程で抽出される罫線は第2の方向の罫線である。
【0011】
また、好ましくは、前記抽出工程は、前記識別工程で識別されたフォーマットに関する罫線情報と各キー罫線に基づいて定められる検索範囲とに基づいて、前記原稿画像に存在する罫線の位置を推測し、前記検索範囲内の濃度ヒストグラムに基づいて当該推測された位置に存在する罫線を前記原稿画像から抽出する。
【0012】
また、好ましくは、前記識別工程で識別されたフォーマットに関するキー罫線の内、前記キー罫線抽出工程で抽出されていないキー罫線があると判断した場合、当該フォーマットのキー罫線に関する罫線情報に基づいて、前記原稿画像内のキー罫線を再抽出する再抽出工程を更に備え、
前記抽出工程は、前記識別されたフォーマットの罫線情報と、前記キー罫線抽出工程で抽出されたキー罫線と前記再抽出工程で再抽出されたキー罫線とに基づいて定められる検索範囲とに基づいて、前記原稿画像に存在する罫線の位置を推測し、当該推測された位置に存在する罫線を前記原稿画像から抽出する。
【0013】
【発明の実施の形態】
以下、図面を参照して本発明の好適な実施形態を詳細に説明する。
図1は本実施形態の画像処理装置の機能構成を示すブロック図である。
図1において、101はスキャナであり、原稿画像に光を照射し、その反射光を読み取り電気信号に変換する。また、スキャナ101より読み込まれた原稿画像は、イメージデータとしてRAM107の所定アドレスエリアが割り当てられているVRAM領域に格納される。102はスキャナインターフェースであり、スキャナ101で得られた電気信号を2値のデジタル電気信号に変換し、他の装置構成要素に伝送する。103はポインティングデバイスとして機能するマウスである。104はマウスインタフェースであり、マウス103からの信号を受け、それを他の装置構成要素に伝送する。114はKB(キーボード)であり、キーボードを介してデータの入力や命令の実行を行う。113はKBインターフェースであり、KB114からの信号を受け、それを他の装置構成要素に伝送する。
【0014】
105はCPUであり、装置全体の制御及び後述する罫線抽出処理等の本発明で説明される処理や認識処理を実行する。106はROMであり、CPU105が実行する制御プログラム、各種処理プログラムやフォントデータ等の各種データを格納している。また、後述する文書フォーマット識別処理で戸籍文書のフォーマットを識別するためのキー罫線に関する情報と、罫線位置推測抽出処理で縦罫線を抽出するための情報を罫線情報として格納している。107はRAMであり、原稿画像の展開や罫線抽出処理のための作業領域等として用いる。また、スキャナ101より読み込まれたイメージデータ(2値画像データ)を格納するための所定の記憶領域としてVRAM領域を持つ。108はディスプレイであり、RAM107のVRAM領域に格納されているイメージデータや本実施の形態で実行される罫線抽出処理結果等を表示する。109はディスプレイインターフェースである。
【0015】
110はHDD(ハードディスクドライブ)であり、HDを装着しデータの読み書きが可能である。また、装着されたHD(不図示)に後述する処理フローのプログラムを書き込み、該プログラムを本装置のRAM107に読み込むことで処理を実行させることができる。111はHDDインタフェースである。そして、112は各装置構成要素を接続するバスである。
【0016】
次に本実施形態で実行される処理について、図2のフローチャートを用いて説明する。
図2は本実施形態で実行される処理の処理フローを示すフローチャートである。
尚、本実施形態で実行される処理は、あらかじめ原稿画像を構成する罫線で囲まれる領域(以下、この領域を項目と呼ぶ)が決まっているような、例えば、図3に示すような戸籍文書等に適用した場合について説明するが、これに限定されるものではない。例えば、構成が決まっている原稿画像であるならば、どのようなものでも良い。
【0017】
まず、ステップS201で、原稿画像をスキャナ101で読み込み2値画像データに変換する。ステップS202で、得られた2値画像データに対して、2値画像の傾斜角度を算出する。そして、傾斜角度が所定の閾値Ts以上である場合は、その傾斜角度がなくなるように2値画像データを補正する傾斜補正処理を行う。
【0018】
次に、ステップS203で、2値画像データに含まれるキーとなるキー罫線の抽出するキー罫線抽出処理を行う。そして、抽出したキー罫線の座標データ等の各種情報を罫線データとして図4のように管理する。尚、キー罫線は、図3の戸籍文書の構成を示すフォーマットを識別するためのキーとなる横罫線であり、この詳細について後述する。
【0019】
ここで図4に示される罫線データについて説明する。
図4は本実施形態の罫線データの構成を示す図である。
図4は、RAM107に展開される2値画像データに含まれるキー罫線の位置を示すための始点座標(X1,Y1)、終点座標(X2,Y2)、罫線方向、無効フラグ、キー罫線フラグの情報を格納する。始点座標は、図3に示される戸籍文書に存在する横罫線の右端の位置座標、終点座標は、対応する横罫線の左端の位置座標を示す。罫線方向は、横罫線、あるいは縦罫線を示す。例えば、横罫線の場合は「0」、縦罫線の場合は「1」を格納する。無効フラグは、抽出された横罫線が無効であるか否かを示す。例えば、無効である場合は「1」、無効でない場合は「0」を格納する。キー罫線フラグは、抽出された横罫線がキー罫線候補であるか否かを示す。例えば、キー罫線候補である場合は「1」、キー罫線候補でない場合は「0」を格納する。
【0020】
尚、装置起動時では、罫線データの無効フラグ及びキー罫線フラグは0で初期化する。
次、ステップS203で実行されるキー罫線抽出処理を具体的に説明する。
まず、2値画像データに対し、x方向(ここでは、横方向)に連続する画素を検索し、所定閾値Ta以上の連続画素を持つ2値画像データにを1つの横罫線として抽出する。そして、抽出された横罫線の相対的な位置関係を調べ、y座標が同一で、x方向の距離が所定閾値Tbドット以下の横罫線同士は1つの横罫線として抽出する。その際、一方の横罫線の罫線データの始点座標と終点座標を更新し、もう一方の横罫線の罫線データの無効フラグを「1」を格納して、その横罫線を無効とする。
【0021】
次に、横罫線の内、長さが所定閾値Tc以上の横罫線はキー罫線候補として、その横罫線の罫線データのキー罫線フラグを「1」とする。
次に、キー罫線候補の長さ及び位置関係から各キー罫線候補を、戸籍文書の「上端」のキーとなるキー罫線、「下端」のキーとなるキー罫線、「本籍番地欄」のキーとなるキー罫線、「編成事項の欄」のキーとなるキー罫線、「入籍等の記載欄」及び「父母、出生等の記載欄」のキーとなるキー罫線、「続柄」のキーとなるキー罫線のいずれかに分類し、図5に示すようなキー罫線データテーブルに格納する。
【0022】
例えば、図3の戸籍文書に対し、キー罫線抽出処理を実行すると、図6に示すような太線で示される長さが所定閾値Tc以上のキー罫線候補が抽出され、各々の位置関係から、戸籍文書の上端の2重線と下端の2重線の各々内側のキー罫線候補604、605をそれぞれ「上端」のキー罫線及び「下端」のキー罫線とし、キー罫線候補601を「本籍番地欄」のキー罫線とし、キー罫線候補602を「編成事項の欄」のキー罫線とし、キー罫線候補603を「入籍等の記載欄」及び「父母、出生等の記載欄」のキー罫線とし、キー罫線候補606を「続柄」のキー罫線としてキー罫線データテーブルに格納する。
【0023】
以上のようして、キー罫線が抽出される。
次に、ステップS204で、キー罫線データテーブルに格納されている内容と、ROM106に格納されている罫線情報を比較することで、戸籍文書の構成を示すフォーマットを識別する文書フォーマット識別処理を行う。
具体的には、キー罫線データテーブルを参照し、「本籍番地欄」のキー罫線や「編成事項の欄」のキー罫線が存在するか、あるいは「入籍等の記載欄」及び「父母、出生等の記載欄」のキー罫線の長さが「上端」や「下端」のキー罫線の長さとほぼ同じであれば、その戸籍文書のフォーマットは(以下、ページタイプと呼ぶ)は筆頭者が記載されている「筆頭者タイプ」であると識別する。一方、「本籍番地欄」のキー罫線や、「編成事項の欄」のキー罫線が存在しない、あるいは「入籍等の記載欄」及び「父母、出生等の記載欄」のキー罫線の長さが、「上端」や「下端」のキー罫線の長さの2/3以下であれば、そのページタイプは筆頭者が記載されていない「非筆頭者タイプ」のフォーマットであると識別される。
【0024】
例えば、図6に示されるようなキー罫線が抽出された場合は、「本籍番地欄」のキー罫線601があり、「編成事項の欄」のキー罫線602が存在するので、そのページタイプは「筆頭者タイプ」であることがわかる。また、「入籍等の記載欄」及び「父母、出生等の記載欄」のキー罫線603の長さが、上端のキー罫線604または下端のキー罫線605の長さの2/3以下であることからも、そのページタイプは「筆頭者タイプ」であることがわかる。
【0025】
次に、ステップS205で、抽出されたキー罫線に基づいて、戸籍文書に存在する縦罫線の位置を推測し、推測された位置に存在する縦罫線を抽出する罫線位置推測処理を行う。
まず、例えば、図6に示されるキー罫線の抽出結果では、キー罫線601が「本籍番地欄」のキー罫線であることから、ROM106に記憶される罫線情報より、その両端に縦罫線があると推測する。そして、その両端の縦罫線を抽出するための画素の検索範囲である罫線抽出範囲を設定する。例えば、キー罫線601の左端のx座標がxbL、右端のx座標がXbRであるとすると、左端の近傍に存在する縦罫線を抽出するためのx方向の罫線抽出範囲をxbL−dx≦x≦xbL+dxとして設定する。また、y方向の罫線抽出範囲をY2<y<Y1として設定する。ここで、Y1は「上端」のキー罫線のy座標、Y2は「下端」のキー罫線のy座標である。そして、その範囲内に存在する画素の濃度ヒストグラムを算出し、濃度ヒストグラムのピークに対応する位置を図7に示すような縦罫線701が存在する位置として推測し、その位置に存在する罫線を縦罫線701として抽出する。
【0026】
尚、dxは罫線601の左端のずれ、かすれ等を考慮した検索範囲を設定するために設けられる値である。
同様にして、右端の近傍に存在する縦罫線を抽出するためのx方向の罫線抽出範囲xbR−dx≦x≦xbR+dxを設定し、罫線702を抽出する。
また、キー罫線602が「編成事項の欄」のキー罫線であることから、ROM106に記憶される罫線情報より、そのキー罫線602を4等分する縦罫線が3本と、キー罫線602の両端の縦罫線2本を含めた5本の縦罫線があると推測する。そして、キー罫線602を4等分する縦罫線とその両端の縦罫線を抽出するための画素の検索範囲である罫線抽出範囲を設定する。例えば、キー罫線602の左端のx座標がxfL、右端のx座標がXfRであるとすると、左端の近傍に存在する縦罫線を抽出するためのx方向の罫線抽出範囲をxfL−dx≦x≦xfL+dxとして設定する。また、y方向の罫線抽出範囲をY2<y<Y1として設定する。ここで、Y1は「上端」のキー罫線のy座標、Y2は「下端」のキー罫線のy座標である。そして、その範囲内に存在する画素の濃度ヒストグラムを算出し、濃度ヒストグラムのピークに対応する位置を図7に示すような縦罫線703が存在する位置として推測し、その位置に存在する罫線を縦罫線703として抽出する。
【0027】
次に、抽出された縦罫線703の隣にあるキー罫線602を4等分する縦罫線のひとつを抽出するためのx方向の罫線抽出範囲を設定する。そこで、まず、キー罫線602を4等分した長さdwを以下の式によって算出する。
dw=|xfR−xfL|×1/4
そして、算出されたdwと抽出された縦罫線703のx座標xhを用いて、x方向の罫線抽出範囲xh+dw−dx≦x≦xh+dw+dxを設定し、y方向の罫線抽出範囲Y2<y<Y1を設定する。そして、抽出された縦罫線703の隣にあるキー罫線602を4等分する縦罫線のひとつを抽出する。
【0028】
同様にして、残りの3本の縦罫線を抽出する。その結果、キー罫線602を4等分する縦罫線3本と縦罫線703、縦罫線701が抽出される。
また、キー罫線603が「入籍等の記載欄」のキー罫線であることから、ROM106に記憶される罫線情報より、そのキー罫線602を10等分する縦罫線が9本と、キー罫線603の両端の縦罫線2本を含めた11本の縦罫線があると推測する。そして、キー罫線603を10等分する縦罫線とその両端の縦罫線を抽出するための画素の検索範囲である罫線抽出範囲を設定する。例えば、キー罫線603の左端のx座標がxgL、右端のx座標がXgRであるとすると、左端の近傍に存在する縦罫線を抽出するためのx方向の罫線抽出範囲をxgL−dx≦x≦xgL+dxとして設定する。また、y方向の罫線抽出範囲をY2<y<Y1として設定する。ここで、Y1は「上端」のキー罫線のy座標、Y2は「下端」のキー罫線のy座標である。そして、その範囲内に存在する画素の濃度ヒストグラムを算出し、濃度ヒストグラムのピークに対応する位置を図7に示すような縦罫線704が存在する位置として推測し、その位置に存在する罫線を縦罫線704として抽出する。
【0029】
次に、抽出された縦罫線703の隣にあるキー罫線603を10等分する縦罫線のひとつを抽出するためのx方向の罫線抽出範囲を設定する。そこで、まず、キー罫線603を10等分した長さdwを以下の式によって算出する。
dw=|xfR−xfL|×1/10
そして、算出されたdwと抽出された縦罫線704のx座標xgを用いて、x方向の罫線抽出範囲xg+dw−dx≦x≦xg+dw+dxを設定し、y方向の罫線抽出範囲Y2<y<Y1を設定する。ここで、Y1は「上端」のキー罫線のy座標、Y2は「入籍等の記載欄」のキー罫線のy座標である。そして、抽出された縦罫線703の隣にあるキー罫線603を10等分する縦罫線のひとつである縦罫線707を抽出する。
【0030】
同様にして、キー罫線603を10等分する縦罫線の残りの8本の縦罫線を抽出する。ここで、キー罫線603の右端にある縦罫線703は抽出済みなので、処理を行わない。その結果、キー罫線603を10等分する縦罫線704を含む縦罫線9本と縦罫線704が抽出される。
また、キー罫線603は「父母、出生等の記載欄」のキー罫線でもあるので、ROM106に記憶される罫線情報より、キー罫線603とキー罫線605の間にある縦罫線を推測する。
【0031】
この際、罫線抽出範囲がキー罫線603とキー罫線605の間に限定されるので、「入籍等の記載欄」の影響を受けることなく、縦罫線を抽出することができる。
キー罫線603の左端のX座標xgLと、右端のxgRから、x方向の罫線抽出範囲をxgL−dx≦x≦xgL+dxとして設定する。そして、その範囲内に存在する画素の濃度ヒストグラムを算出し、濃度ヒストグラムのピークとなる位置を罫線の存在する位置として推測し、その位置に存在する罫線を抽出する。
【0032】
この時、抽出される縦罫線の本数によって、養父、養母等が記載されているか否かが判定できる。例えば、抽出される縦罫線が7本であれば、養父、養母ともに記載されているタイプのフォーマットである。これによって、養父と養母の間の縦罫線、及び父と母の間の縦罫線は「続柄」のキー罫線までで止まると定義できる。また、抽出される縦罫線が6本であれば、養父または養母のどちらか一方のみが記載されているタイプのフォーマットである。これによって、父と母の間の縦罫線は「続柄」のキー罫線までで止まると定義できる。更に、抽出される縦罫線が5本であれば、養父、養母共に記載されていないタイプのフォーマットである。これによって、父と母の間の縦罫線は「続柄」キー罫線までで止まると定義できる。
【0033】
図6の場合、キー罫線603とキー罫線602の間にある縦罫線は7本であるので、養父、養母共に記載されているタイプのフォーマットであることがわかるこれによって、縦罫線705と縦罫線706だけはキー罫線606より下にはでないことがわかるので、それらの縦罫線のy座標をキー罫線606と同じy座標に修正する。
【0034】
以上のようにして、戸籍文書を構成する横罫線と縦罫線が抽出される。
以上説明したように、本実施形態によれば、戸籍文書に含まれるキー罫線を抽出することで、複数種類ある戸籍文書のフォーマットのいずれかに識別することができる。また、識別されたフォーマットに基づいて、縦罫線の位置を推測して縦罫線を抽出するので、より精度良く縦罫線を抽出することができる。
【0035】
また、傾斜補正処理と、キー罫線抽出処理と、文書フォーマット識別処理と、罫線位置推測抽出処理とを設けることにより、傾斜、かすれ、位置のずれ、大きさの違い等の要因があっても罫線の抽出が可能となり、テキスト等を誤って罫線としてしまうことを減らす等の効果がはかれる。
また、本実施形態で説明される処理に対し、図8に示すようなキー罫線再抽出処理(図8のステップS806)を付加することで、キー罫線が抽出されたか否かを判定することができ、抽出されなかったキー罫線を再抽出することができる。
【0036】
図8は本実施形態の他の構成によって実行される処理の処理フローを示すフローチャートである。
まず、ステップS801で、原稿画像をスキャナ101で読み込み2値画像データに変換する。ステップS802で、得られた2値画像データに対して、2値画像の傾斜角度を算出する。そして、傾斜角度が所定の閾値Ts以上である場合は、その傾斜角度がなくなるように2値画像データを補正する傾斜補正処理を行う。
【0037】
次に、ステップS803で、2値画像データに含まれるキーとなるキー罫線の抽出するキー罫線抽出処理を行う。ステップS804で、戸籍文書の構成を示すフォーマットを識別する文書フォーマット識別処理を行う。
ステップS805で、識別された戸籍文書のフォーマットのキー罫線が抽出されているか否かを判定する。抽出されている場合(ステップS805でYES)、ステップS807に進む。一方、抽出されていない場合(ステップS805でNO)、ステップS806に進む。
【0038】
ステップS806で、抽出されていないキー罫線の位置を推測し、推測された位置にある罫線をキー罫線として再抽出するキー罫線再抽出処理を行う。ステップS807で、抽出されたキー罫線に基づいて、戸籍文書に存在する縦罫線の位置を推測し、推測された位置に存在する縦罫線を抽出する罫線位置推測処理を行う。
【0039】
以上の構成によって、例えば、図6のキー罫線602がかすれていて抽出されなかった場合、先にキー罫線601やキー罫線603が抽出されていれば、それらのキー罫線から図6の戸籍文書のフォーマットが「筆頭者タイプ」であることが判別でき、その後にキー罫線602の位置を推定し再抽出し直すことも可能となる。
【0040】
尚、本発明は、複数の機器(例えばホストコンピュータ、インタフェース機器、リーダ、プリンタ等)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置等)に適用してもよい。
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
【0041】
この場合、記憶媒体から読出されたプログラムコード自体が上述した実施の形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
プログラムコードを供給するための記憶媒体としては、例えば、フロッピディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
【0042】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施の形態の機能が実現される場合も含まれることは言うまでもない。
【0043】
更に、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0044】
本発明を上記記憶媒体に適用する場合、その記憶媒体には、先に説明したフローチャートに対応するプログラムコードを格納することになるが、簡単に説明すると、図9のメモリマップ例に示す各モジュールを記憶媒体に格納することになる。
すなわち、少なくとも「記憶モジュール」、「識別モジュール」および「抽出モジュール」の各モジュールのプログラムコードを記憶媒体に格納すればよい。
【0045】
尚、「記憶モジュール」は、複数種類のフォーマットに関し、各フォーマットを有する原稿画像に存在する罫線に関する罫線情報を記憶媒体に記憶する。「識別モジュール」は、入力された原稿画像に存在する連続画素に基づいて、該原稿画像のフォーマットを記憶媒体に記憶されるフォーマットのいずれかに識別する。「抽出モジュール」は、識別されたフォーマットの罫線情報に基づいて、前記入力された原稿画像に存在する罫線を抽出する。
【0046】
【発明の効果】
以上説明したように、本発明によれば、複数種類のフォーマットを有する原稿画像を識別することができ、その識別されたフォーマットに基づいて、原稿画像に存在する罫線を抽出することで、罫線を精度良く抽出できる画像処理装置及びその方法を提供できる。
【図面の簡単な説明】
【図1】本実施形態の画像処理装置の機能構成を示すブロック図である。
【図2】本実施形態で実行される処理の処理フローを示すフローチャートである。
【図3】 本実施形態の原稿画像の例を示すである。
【図4】本実施形態の罫線データの構成を示す図である。
【図5】本実施形態のキー罫線データテーブルの構成を示す図である。
【図6】本実施形態の原稿画像に対して実行したキー罫線抽出処理の処理結果を示す図である。
【図7】本実施形態の原稿画像に対して実行した罫線位置推測抽出処理の処理結果を示す図である。
【図8】本実施形態の他の構成によって実行される処理の処理フローを示すフローチャートである。
【図9】本発明で実行される処理フローのプログラムを記憶させたHDのメモリマップの構造を示す図である。
【符号の説明】
101 スキャナ
102 スキャナインタフェース
103 マウス
104 マウスインタフェース
105 CPU
106 ROM
107 RAM
108 ディスプレイ
109 ディスプレイインタフェース
110 HDD
111 HDDインタフェース
112 バス
113 KBインタフェース
114 KB
Claims (12)
- 入力された原稿画像に存在する罫線を抽出する画像処理装置であって、
複数種類のフォーマットに関し、各フォーマットに存在する罫線に関する罫線情報と各フォーマットを識別するためのキー罫線に関するキー罫線情報とを記憶する記憶手段と、
前記入力された原稿画像からキー罫線を抽出するキー罫線抽出手段と、
当該抽出されたキー罫線と前記記憶手段に記憶されたキー罫線情報とに基づいて、該原稿画像のフォーマットを識別する識別手段と、
前記識別手段で識別されたフォーマットに関する罫線情報と各キー罫線に基づいて定められる検索範囲とに基づいて、前記原稿画像に存在する罫線の位置を推測し、当該推測された位置に存在する罫線を前記原稿画像から抽出する抽出手段と
を備えることを特徴とする画像処理装置。 - 前記入力された原稿画像の傾斜を補正する補正手段を
更に備えることを特徴とする請求項1に記載の画像処理装置。 - 前記キー罫線抽出手段は、前記原稿画像から抽出された罫線の内、所定の長さ以上の罫線をキー罫線候補として抽出し、当該抽出されたキー罫線候補の長さ及び位置関係に基づいて前記キー罫線を抽出する
ことを特徴とする請求項1に記載の画像処理装置。 - 前記キー罫線抽出手段で抽出されるキー罫線は、第1の方向の罫線であり、前記抽出手段で抽出される罫線は第2の方向の罫線である
ことを特徴とする請求項1に記載の画像処理装置。 - 前記抽出手段は、前記識別手段で識別されたフォーマットに関する罫線情報と各キー罫線に基づいて定められる検索範囲とに基づいて、前記原稿画像に存在する罫線の位置を推測し、前記検索範囲内の濃度ヒストグラムに基づいて当該推測された位置に存在する罫線を前記原稿画像から抽出する
ことを特徴とする請求項1に記載の画像処理装置。 - 前記識別手段で識別されたフォーマットに関するキー罫線の内、前記キー罫線抽出手段で抽出されていないキー罫線があると判断した場合、当該フォーマットのキー罫線に関する罫線情報に基づいて、前記原稿画像内のキー罫線を再抽出する再抽出手段を更に備え、
前記抽出手段は、前記識別されたフォーマットの罫線情報と、前記キー罫線抽出手段で抽出されたキー罫線と前記再抽出手段で再抽出されたキー罫線とに基づいて定められる検索範囲とに基づいて、前記原稿画像に存在する罫線の位置を推測し、当該推測された位置に存在する罫線を前記原稿画像から抽出する
ことを特徴とする請求項1に記載の画像処理装置。 - 入力された原稿画像に存在する罫線を抽出する画像処理方法であって、
前記入力された原稿画像からキー罫線を抽出するキー罫線抽出工程と、
各フォーマットを識別するためのキー罫線に関するキー罫線情報とを記憶する記憶手段を参照して、前記キー罫線抽出工程で抽出されたキー罫線と前記記憶手段に記憶されたキー罫線情報とに基づいて、該原稿画像のフォーマットを識別する識別工程と、
前記識別工程で識別されたフォーマットに関する罫線情報と各キー罫線に基づいて定められる検索範囲とに基づいて、前記原稿画像に存在する罫線の位置を推測し、当該推測された位置に存在する罫線を前記原稿画像から抽出する抽出工程と
を備えることを特徴とする画像処理方法。 - 前記入力された原稿画像の傾斜を補正する補正工程を
更に備えることを特徴とする請求項7に記載の画像処理方法。 - 前記キー罫線抽出工程は、前記原稿画像から抽出された罫線の内、所定の長さ以上の罫線をキー罫線候補として抽出し、当該抽出されたキー罫線候補の長さ及び位置関係に基づいて前記キー罫線を抽出する
ことを特徴とする請求項7に記載の画像処理方法。 - 前記キー罫線抽出工程で抽出されるキー罫線は、第1の方向の罫線であり、前記抽出工程で抽出される罫線は第2の方向の罫線である
ことを特徴とする請求項7に記載の画像処理方法。 - 前記抽出工程は、前記識別工程で識別されたフォーマットに関する罫線情報と各キー罫線に基づいて定められる検索範囲とに基づいて、前記原稿画像に存在する罫線の位置を推測し、前記検索範囲内の濃度ヒストグラムに基づいて当該推測された位置に存在する罫線を前記原稿画像から抽出する
ことを特徴とする請求項7に記載の画像処理方法。 - 前記識別工程で識別されたフォーマットに関するキー罫線の内、前記キー罫線抽出工程で抽出されていないキー罫線があると判断した場合、当該フォーマットのキー罫線に関する罫線情報に基づいて、前記原稿画像内のキー罫線を再抽出する再抽出工程を更に備え、
前記抽出工程は、前記識別されたフォーマットの罫線情報と、前記キー罫線抽出工程で抽出されたキー罫線と前記再抽出工程で再抽出されたキー罫線とに基づいて定められる検索範囲とに基づいて、前記原稿画像に存在する罫線の位置を推測し、当該推測された位置に存在する罫線を前記原稿画像から抽出する
ことを特徴とする請求項7に記載の画像処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09840396A JP3814334B2 (ja) | 1996-04-19 | 1996-04-19 | 画像処理装置及びその方法 |
US08/826,688 US6330360B1 (en) | 1996-04-19 | 1997-04-07 | Image processing apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09840396A JP3814334B2 (ja) | 1996-04-19 | 1996-04-19 | 画像処理装置及びその方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09288728A JPH09288728A (ja) | 1997-11-04 |
JP3814334B2 true JP3814334B2 (ja) | 2006-08-30 |
Family
ID=14218876
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP09840396A Expired - Fee Related JP3814334B2 (ja) | 1996-04-19 | 1996-04-19 | 画像処理装置及びその方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6330360B1 (ja) |
JP (1) | JP3814334B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6834120B1 (en) * | 2000-11-15 | 2004-12-21 | Sri International | Method and system for estimating the accuracy of inference algorithms using the self-consistency methodology |
JP3925112B2 (ja) * | 2001-06-20 | 2007-06-06 | 富士ゼロックス株式会社 | 画像処理装置 |
JP4940270B2 (ja) * | 2009-07-06 | 2012-05-30 | シャープ株式会社 | 画像形成装置 |
USD977386S1 (en) | 2020-09-22 | 2023-02-07 | Positec Power Tools (Suzhou) Co., Ltd. | Battery pack |
US20220245377A1 (en) * | 2021-01-29 | 2022-08-04 | Intuit Inc. | Automated text information extraction from electronic documents |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07107694B2 (ja) * | 1984-08-31 | 1995-11-15 | 株式会社日立製作所 | 文書処理装置 |
US5101448A (en) * | 1988-08-24 | 1992-03-31 | Hitachi, Ltd. | Method and apparatus for processing a document by utilizing an image |
US5129012A (en) * | 1989-03-25 | 1992-07-07 | Sony Corporation | Detecting line segments and predetermined patterns in an optically scanned document |
JP2812982B2 (ja) * | 1989-04-05 | 1998-10-22 | 株式会社リコー | 表認識方法 |
US5159667A (en) * | 1989-05-31 | 1992-10-27 | Borrey Roland G | Document identification by characteristics matching |
JP2940936B2 (ja) * | 1989-06-06 | 1999-08-25 | 株式会社リコー | 表領域識別方法 |
-
1996
- 1996-04-19 JP JP09840396A patent/JP3814334B2/ja not_active Expired - Fee Related
-
1997
- 1997-04-07 US US08/826,688 patent/US6330360B1/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US6330360B1 (en) | 2001-12-11 |
JPH09288728A (ja) | 1997-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5748809A (en) | Active area identification on a machine readable form using form landmarks | |
US6614929B1 (en) | Apparatus and method of detecting character writing area in document, and document format generating apparatus | |
KR101685473B1 (ko) | 화상 처리 장치 및 화상 처리 방법 | |
JP4594952B2 (ja) | 文字認識装置及び文字認識方法 | |
US6947596B2 (en) | Character recognition method, program and recording medium | |
CN114663897A (zh) | 表格提取方法与表格提取系统 | |
JP3814334B2 (ja) | 画像処理装置及びその方法 | |
JP2008108114A (ja) | 文書処理装置および文書処理方法 | |
JP3171626B2 (ja) | 文字認識の処理領域・処理条件指定方法 | |
JPH11187231A (ja) | 画像検索装置及び画像検索方法 | |
JP3412998B2 (ja) | 画像処理装置及びその方法 | |
JPH0830725A (ja) | 画像処理装置及び方法 | |
JP2010258627A (ja) | 画像処理装置、画像処理方法、プログラム及び記憶媒体 | |
JP7231844B2 (ja) | 情報処理装置、情報処理方法、プログラム | |
JP5361315B2 (ja) | 情報処理装置及び情報処理方法 | |
JP2000339407A (ja) | 画像処理装置及び画像処理方法及びコンピュータ読み取り可能な記憶媒体 | |
JP2009193170A (ja) | 文字認識装置及び文字認識方法 | |
JPH11242716A (ja) | 画像処理方法および記録媒体 | |
JP3060248B2 (ja) | 表認識装置 | |
JP6471796B2 (ja) | 情報処理装置、情報処理装置の制御方法、およびプログラム | |
JP2003016385A (ja) | 画像処理装置、方法、プログラム、及び記憶媒体 | |
JP3880091B2 (ja) | 情報処理装置及び方法 | |
JP5383022B2 (ja) | 画像検出装置及び方法 | |
JPH09146947A (ja) | 文字領域の順序付け方法及び装置 | |
JP3045086B2 (ja) | 光学式文字読取方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060310 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060509 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060529 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060605 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |