JP6409423B2 - 画像処理装置及び画像処理プログラム - Google Patents
画像処理装置及び画像処理プログラム Download PDFInfo
- Publication number
- JP6409423B2 JP6409423B2 JP2014179037A JP2014179037A JP6409423B2 JP 6409423 B2 JP6409423 B2 JP 6409423B2 JP 2014179037 A JP2014179037 A JP 2014179037A JP 2014179037 A JP2014179037 A JP 2014179037A JP 6409423 B2 JP6409423 B2 JP 6409423B2
- Authority
- JP
- Japan
- Prior art keywords
- cell
- image
- row
- column
- bias
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
- Document Processing Apparatus (AREA)
- Image Analysis (AREA)
Description
請求項1の発明は、表画像内のセルを抽出するセル抽出手段と、前記セル抽出手段により抽出されたセル毎のオブジェクトの領域情報を抽出する第1の抽出手段と、前記表画像の行または列方向に連なるセル群を部分領域として抽出する第2の抽出手段と、前記部分領域毎における第1の抽出手段により抽出されたオブジェクトの領域情報の偏りに対しの特異なセルを抽出する第3の抽出手段と、前記第3の抽出手段によって抽出されたセル内の画像を、該セルを含む部分領域の領域情報の偏りにあわせて変更する変更手段を具備することを特徴とする画像処理装置である。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
画像読込モジュール110が読み込む画像内の表には、雑音的描画(ノイズともいわれる。以下、雑音部という)が含まれていることがある。例えば、スキャン時の変動や2値化処理により文字以外の空白部に雑音部が散見される。
また、パス設定モジュール140は、部分領域として行又は列を抽出してもよい。
また、パス設定モジュール140は、複数のセルによって構成されるL字型の部分領域、又は複数のセルによって構成される構造が同じであるセル群(入れ子構造)を、部分領域として抽出するようにしてもよい。「L字型」とは、ある1つのセルから右方向又は左方向のうちのいずれか一方に連なるセル群とそのセルから上方向又は下方向のうちいずれか一方に連なるセル群によって構成されるものである。典型的な例として、表の第1行(最上行)と第1列(最左列)によって構成されるセル群がある。
また、パス設定モジュール140は、列又は行が1つのセルで構成されている場合は、直交する行又は列の部分領域として抽出するようにしてもよい。
具体的には、部分領域を行又は列とした場合、表構造解析モジュール120による解析結果である表構造データ(セルの座標位置等)を参考にして、行方向又は列方向に隣接セルを辿るパスの一覧を作成する。このパスデータには、各セル内のオブジェクトの特徴抽出結果を含んでいてもよい。
また、偏り検出モジュール150は、パス設定モジュール140によって抽出された部分領域内における各オブジェクトのセル内での位置の分布による偏りを判別し、その偏りのある分布以外の分布を有しているセルを特異点のセルとして抽出するようにしてもよい。
また、パス設定モジュール140が、部分領域として行又は列を抽出した場合は、偏り検出モジュール150は、特異点のセルがある第1の行又は列に対して直交する、そのセルを含む第2の列又は行において、そのセルが特異点ではない場合は、そのセルを第1の行又は列において特異点ではないとするようにしてもよい。なお、「第1の行又は列」と「第2の列又は行」の関係は、一方が列である場合は他方は行であり、一方が行である場合は他方は列である。詳細については、図10、11の例を用いて後述する。
また、偏り検出モジュール150によって検出された部分領域の特異点のセル、又は文字領域補正モジュール160によって削除対象となった領域を、液晶ディスプレイ等の表示装置に表示するようにしてもよい。例えば、文字画像の切り出しをユーザーが行う場合に、その切り出しの補助とするためである。
画像処理装置100は、具体的には、例えば、表構造の構造上関連のある部分で類似する位置に文字が並びやすいことを利用して、セル単位の文字の領域を確からしい範囲に狭めるようにしている。
ステップS202では、画像読込モジュール110が、画像を読み込む。この画像内には、表画像が含まれている。また、画像から表画像の領域だけを抽出してもよい。例えば、図3に示す表300が含まれている画像を読み込む。この読み込みによって、雑音部が発生し得る。例えば、図4に示す表画像400(表300を読み込んだ結果である表画像400)のように、スキャンノイズ410、スキャンノイズ420が発生し得る。
ステップS204では、表構造解析モジュール120が、画像内の表を対象として、構造を解析する。具体的には、各セルの位置を認識する。
例えば、図8に示す表画像400のパス810では、ほぼ同じ位置に同じサイズの外接矩形がある。つまり、パス810内のセル内オブジェクト外接矩形510、512、514、516では、各セル内において、その左端の座標、右端の座標、上端の座標、下端の座標、サイズが、予め定められた範囲内に含まれている。なお、「予め定められた範囲内に含まれている」か否かの判断は、対象としている特徴でソートを行い、1位のものと最下位のものとのその特徴での差分が予め定められた閾値未満又は以下であるか否かの判断としてもよい。したがって、パス810は偏りがあり、特異点のセルはないと判断する。一方、パス820では、セル内オブジェクト外接矩形522、524では、各セル内において、そのオブジェクトの左端の座標、右端の座標、上端の座標、下端の座標、サイズが、予め定められた範囲内に含まれているので、偏りがあると判断される。例えば、予め定められた範囲内に含まれているセルの割合(そのセル数を分子とし、そのパスにおける全てのセル数を分母とした場合の割合)が予め定められた閾値より大きい又は以上である場合に、偏りがあると判断してもよい。そして、予め定められた範囲内に含まれていないセルを特異点のセルとしてもよい。図8の例の場合、パス820は偏りがあり、セル内オブジェクト外接矩形520、セル内オブジェクト外接矩形526は特異点であると判断される。他のパス830、パス840についても、パス810と同様に偏りがあり、特異点のセルはないと判断する。
前述の例では、セル内オブジェクト外接矩形520、セル内オブジェクト外接矩形526が特異点であると判断されたので、修正対象となる。例えば、偏りがあるセル内オブジェクト外接矩形522、セル内オブジェクト外接矩形524のサイズに合わせて、セル内オブジェクト外接矩形520、セル内オブジェクト外接矩形526を修正すればよい。この場合は、セル内オブジェクト外接矩形520、セル内オブジェクト外接矩形526内のオブジェクトを画素塊に分割して、偏りがあるセル内オブジェクト外接矩形522、セル内オブジェクト外接矩形524のサイズと同等になる画素塊を選択すればよい。ここで画素塊とは、4連結又は8連結で接続している同じ色の画素(例えば黒画素)の塊である。そして、修正することによってオブジェクトから削除される画素塊の面積が予め定められた閾値未満又は以下であることを条件としてもよい。この閾値は、削除対象とする雑音部の大きさを設定すればよい。この結果、セル内オブジェクト外接矩形520に対しては、スキャンノイズ410と数字画像「1」に分割され、スキャンノイズ410を削除して、数字画像「1」を残す修正を行う。セル内オブジェクト外接矩形526に対しては、数字画像「8」、「0」とスキャンノイズ420に分割され、スキャンノイズ420を削除して、数字画像「8」、「0」を残す修正を行う。つまり、図9の例に示すように、セル内オブジェクト外接矩形520をセル内オブジェクト外接矩形920に修正し、セル内オブジェクト外接矩形526をセル内オブジェクト外接矩形926に修正している。他のオブジェクトに対しては修正は行われていない。ここでは、オブジェクトの特徴としてサイズを用いて修正したが、オブジェクトの左端の座標、右端の座標、上端の座標、下端の座標を用いてもよい。そして、これら(サイズを含む)の組み合わせを用いて修正してもよい。また、修正対象のオブジェクトは、画素塊が1つである場合は、修正を行わないようにしてもよい。また、修正対象のオブジェクトは、画素塊が1つであり、その面積が予め定められた閾値未満又は以下である場合(修正対象のオブジェクトが雑音部だけである場合)は、削除するようにしてもよい。
なお、ステップS210において、前述の「予め定められた範囲」によっては、セル内オブジェクト外接矩形530、セル内オブジェクト外接矩形540も、パス830、パス840における特異点であると判断される可能性がある。ステップS212では、修正対象のオブジェクトが1つの画素塊である場合は、修正を行わないので、パス830、パス840に対して修正は行われない。
ステップS1002では、パス設定モジュール140が、横方向と縦方向のパスを設定する。図11(a)の例に示す表700のパス710〜740は、図7の例に示すパスと同様に横方向にパスを設定したものである。図11(b)に示す例は、同じ表700に対して縦方向にパス(パス1110、パス1120、パス1130、パス1140)を設置したものである。
ステップS1008では、偏り検出モジュール150が、そのセルは特異点のセルではないとする。前述の例では、パス1110、1120、1130、1140の第1行のセルは特異点のセルではないとする。
表内のデータの種類によっては、その記載位置で左寄せ、中央寄せ、右寄せ等の形式がある。外接矩形のセル内に占める領域の位置(左端、右端、上端、下端のセル内の座標位置)における座標分布の偏りの強さから、変更する雑音部の除去範囲(又はオブジェクトとして残す範囲)を強め〜弱めに変更することにより除去してはいけない文字本体を残せるようにする。
例えば、図12に示すように、第1列を左寄せとし、第2列を中央寄せとし、第3列を右寄せとした表画像1200を対象とする。
この場合、第1列(左寄せ)では、横方向のパス(例えば、セル内オブジェクト外接矩形1210、1212、1214)で、上端、下端のセル内の座標位置の偏りは強めとなる。縦方向のパス(例えば、セル内オブジェクト外接矩形1210、1220、1230、1240)で、左端のセル内の座標位置の偏りは強めとなる。そして、右端のセル内の座標位置の偏りは弱めとなる。図12の例に示すように、4桁までの数字ならば4つの多峰性を持つ分布となる。
第2列(中央寄せ)では、横方向のパス(例えば、セル内オブジェクト外接矩形1210、1212、1214)で、上端、下端のセル内の座標位置の偏りは強めとなる。縦方向のパス(例えば、セル内オブジェクト外接矩形1212、1222、1232、1242)で、左端、右端ともに偏りは弱めとなる。図12の例に示すように、4桁までの数字ならば8つの多峰性を持つ分布となる。
第3列(右寄せ)では、横方向のパス(例えば、セル内オブジェクト外接矩形1210、1212、1214)で、上端、下端のセル内の座標位置の偏りは強めとなる。縦方向のパス(例えば、セル内オブジェクト外接矩形1214、1224、1234、1244)で、右端のセル内の座標位置の偏りは強めとなる。そして、左端のセル内の座標位置の偏りは弱めとなる。図12の例に示すように、4桁までの数字ならば4つの多峰性を持つ分布となる。
そこで、偏りの強い端(外接矩形の辺)においては、分布のピークに対して、予め定められた範囲A(例えば、数ピクセル)を超えたものは削除する変更を行う。これによって、例えば、図12の第1列で、「1」の左にある雑音部は、近くても削除の対象となる。
一方、偏りの弱い端(外接矩形の辺)においては、分布の裾野の端にある峰に対して、予め定められた範囲B(例えば、数ピクセル)を超えたものは削除する変更を行う。これによって、例えば、図12の第1列で、セル内オブジェクト外接矩形1230の「3」の右にある雑音部は、近くても削除の対象となる。ここでの範囲Aは、範囲Bより小さい又は以下とする。
なお、偏りの強弱は、グラフにおける尖度と予め定められた閾値との比較によって判断すればよい。具体的には、尖度が予め定められた閾値Cより大きい又は以上である場合は、偏りが強いと判断し、尖度が予め定められた閾値D未満又は以下である場合は、偏りが弱いと判断する。ここでの閾値Cと閾値Dは同じ値であってもよいし、異なる値であってもよい(一般的には、閾値Cは閾値Dより大きい値とする)。
各部分領域(入れ子構造1410、入れ子構造1420、入れ子構造1430)をパスとして、図2の例に示すフローチャートにおけるステップS210以降の処理を行えばよい。つまり、各パスにおいて文字種別の偏りがあれば、その中の特異点であるセルを補正の対象にする。
また、隣合った部分領域(パス)における偏りを参考にして、偏りを決定するようにしてもよい。例えば、対象としている部分領域での偏りを決定する際に、隣合った部分領域でも同じ文字種別の偏りであることを条件としてもよい。隣合った部分領域は、既に偏りが決定されたものとし、2つ目以降の部分領域の判定の際に、その条件を課すようにしてもよい。また、表の予め定められた部分領域(例えば、第1行、第1列等)以外の部分領域を対象としてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
110…画像読込モジュール
120…表構造解析モジュール
130…セル画像特徴抽出モジュール
140…パス設定モジュール
150…偏り検出モジュール
160…文字領域補正モジュール
Claims (6)
- 表画像内のセルを抽出するセル抽出手段と、
前記セル抽出手段により抽出されたセル毎のオブジェクトの領域情報を抽出する第1の抽出手段と、
前記表画像の行または列方向に連なるセル群を部分領域として抽出する第2の抽出手段と、
前記部分領域毎における第1の抽出手段により抽出されたオブジェクトの領域情報の偏りに対し特異なセルを抽出する第3の抽出手段と、
前記第3の抽出手段によって抽出されたセル内の画像を、該セルを含む部分領域の領域情報の偏りにあわせて変更する変更手段
を具備することを特徴とする画像処理装置。 - 前記第3の抽出手段は、前記部分領域内における各オブジェクトのセル内での位置の分布による偏りを判別し、該偏りのある分布以外の分布を有しているセルを特異なセルとして抽出する
ことを特徴とする請求項1に記載の画像処理装置。 - 前記第2の抽出手段は、前記部分領域として行又は列を抽出し、
前記第3の抽出手段は、特異なセルがある第1の行又は列に対して直交する、該セルを含む第2の列又は行において、該セルが特異ではない場合は、該セルを第1の行又は列において特異ではないとする
ことを特徴とする請求項1又は2に記載の画像処理装置。 - 前記第2の抽出手段は、複数のセルによって構成されるL字型の部分領域、又は複数のセルによって構成される構造が同じであるセル群を、部分領域として抽出する
ことを特徴とする請求項1又は2に記載の画像処理装置。 - 前記第2の抽出手段は、列又は行が1つのセルで構成されている場合は、直交する行又は列の部分領域として抽出する
ことを特徴とする請求項1又は2に記載の画像処理装置。 - コンピュータを、
表画像内のセルを抽出するセル抽出手段と、
前記セル抽出手段により抽出されたセル毎のオブジェクトの領域情報を抽出する第1の抽出手段と、
前記表画像の行または列方向に連なるセル群を部分領域として抽出する第2の抽出手段と、
前記部分領域毎における第1の抽出手段により抽出されたオブジェクトの領域情報の偏りに対し特異なセルを抽出する第3の抽出手段と、
前記第3の抽出手段によって抽出されたセル内の画像を、該セルを含む部分領域の領域情報の偏りにあわせて変更する変更手段
として機能させるための画像処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014179037A JP6409423B2 (ja) | 2014-09-03 | 2014-09-03 | 画像処理装置及び画像処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014179037A JP6409423B2 (ja) | 2014-09-03 | 2014-09-03 | 画像処理装置及び画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016053800A JP2016053800A (ja) | 2016-04-14 |
JP6409423B2 true JP6409423B2 (ja) | 2018-10-24 |
Family
ID=55744772
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014179037A Expired - Fee Related JP6409423B2 (ja) | 2014-09-03 | 2014-09-03 | 画像処理装置及び画像処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6409423B2 (ja) |
-
2014
- 2014-09-03 JP JP2014179037A patent/JP6409423B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2016053800A (ja) | 2016-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8768052B2 (en) | Image processing apparatus, image processing method, and non-transitory computer readable medium | |
US10740899B2 (en) | Image processing apparatus for identifying region within image, information processing method, and storage medium | |
JP6119952B2 (ja) | 画像処理装置及び画像処理プログラム | |
US10643097B2 (en) | Image processing apparatuses and non-transitory computer readable medium | |
JP4626777B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP5601027B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2009251872A (ja) | 情報処理装置及び情報処理プログラム | |
JP6221220B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6409423B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2010136006A (ja) | 画像処理装置及び画像処理プログラム | |
JP5489894B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2012175220A (ja) | 画像処理装置及び画像処理プログラム | |
JP5262778B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6187307B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2017010187A (ja) | 画像処理装置及び画像処理プログラム | |
JP6003375B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5821648B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP5640645B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2010039810A (ja) | 画像処理装置及び画像処理プログラム | |
JP5928714B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6241311B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5062076B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2016053797A (ja) | 画像処理装置及び画像処理プログラム | |
JP2010049336A (ja) | 画像処理装置及び画像処理プログラム | |
JP4670916B2 (ja) | 画像処理装置及び画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170825 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180814 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180828 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180910 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6409423 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |