JP6409423B2 - 画像処理装置及び画像処理プログラム - Google Patents

画像処理装置及び画像処理プログラム Download PDF

Info

Publication number
JP6409423B2
JP6409423B2 JP2014179037A JP2014179037A JP6409423B2 JP 6409423 B2 JP6409423 B2 JP 6409423B2 JP 2014179037 A JP2014179037 A JP 2014179037A JP 2014179037 A JP2014179037 A JP 2014179037A JP 6409423 B2 JP6409423 B2 JP 6409423B2
Authority
JP
Japan
Prior art keywords
cell
image
row
column
bias
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014179037A
Other languages
English (en)
Other versions
JP2016053800A (ja
Inventor
正和 福永
正和 福永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2014179037A priority Critical patent/JP6409423B2/ja
Publication of JP2016053800A publication Critical patent/JP2016053800A/ja
Application granted granted Critical
Publication of JP6409423B2 publication Critical patent/JP6409423B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Document Processing Apparatus (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像処理装置及び画像処理プログラムに関する。
特許文献1には、付着物により変形した文字画像の正確な文字領域を求めることを課題とし、与えられた文字列の2値化画像に対し、連結領域毎の幾何情報を求め、文字画像として切り出す文字切り出し手段と、切り出された文字画像に対し、文字認識処理を施して文字類似度を求める文字認識手段と、切り出された文字画像の幾何情報と、求められた文字類似度とを用いて、与えられた文字列の参照文字幾何情報の推定を行う参照文字幾何情報推定手段と、推定された参照文字幾何情報と、求められた文字類似度とを用いて、真の文字領域の外側の付着物により変形した変形文字画像に対して、当該付着物の位置を特定して真の文字領域を求める文字領域特定手段とを備えることが開示されている。
特許文献2には、文字の特徴マトリクスを抽出して該文字の識別を行う文字認識装置において、ノイズに影響されない該特徴マトリクスを作成し、文字認識率を向上させることを課題とし、光電変換部を介して文字パタンがパタンレジスタに格納され、該文字パタンを各所定方に走査した複数のサブパタンがサブパタン抽出部によって抽出されてサブパタン記憶部に記憶され、AQ計数部は、各サブパタンにノイズが含まれているか否かを示すための該各サブパタンの黒点数等の値を計数し、マトリクス抽出部は、AQ計数部の計数結果に基づき、各サブパタンにおけるノイズを除去した状態での特徴マトリクスを作成し、識別部により、その特徴マトリクスと辞書部に予め格納された標準文字を表すマトリクスとの比較が行われ、文字が識別されることが開示されている。
特開平11−110483号公報 特開平11−154200号公報
従来であるとスキャン入力系のケースでは特にスキャン時の変動や2値化処理により文字以外の空白部に雑音的描画(以下、ノイズと記述する)が散見される。しかしながら、ノイズを自動的に正確に取り除くのは現状では困難である。
本発明は、表画像内のオブジェクトにノイズがあったとしても精度よくノイズを除去するようにした画像処理装置及び画像処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、表画像内のセルを抽出するセル抽出手段と、前記セル抽出手段により抽出されたセル毎のオブジェクトの領域情報を抽出する第1の抽出手段と、前記表画像の行または列方向に連なるセル群を部分領域として抽出する第2の抽出手段と、前記部分領域毎における第1の抽出手段により抽出されたオブジェクトの領域情報の偏りに対しの特異なセルを抽出する第3の抽出手段と、前記第3の抽出手段によって抽出されたセル内の画像を、該セルを含む部分領域の領域情報の偏りにあわせて変更する変更手段を具備することを特徴とする画像処理装置である。
請求項2の発明は、前記第3の抽出手段は、前記部分領域内における各オブジェクトのセル内での位置の分布による偏りを判別し、該偏りのある分布以外の分布を有しているセルを特異なセルとして抽出することを特徴とする請求項1に記載の画像処理装置である。
請求項3の発明は、前記第2の抽出手段は、前記部分領域として行又は列を抽出し、前記第3の抽出手段は、特異なセルがある第1の行又は列に対して直交する、該セルを含む第2の列又は行において、該セルが特異ではない場合は、該セルを第1の行又は列において特異ではないとすることを特徴とする請求項1又は2に記載の画像処理装置である。
請求項4の発明は、前記第2の抽出手段は、複数のセルによって構成されるL字型の部分領域、又は複数のセルによって構成される構造が同じであるセル群を、部分領域として抽出することを特徴とする請求項1又は2に記載の画像処理装置である。
請求項5の発明は、前記第2の抽出手段は、列又は行が1つのセルで構成されている場合は、直交する行又は列の部分領域として抽出することを特徴とする請求項1又は2に記載の画像処理装置である。
請求項6の発明は、コンピュータを、表画像内のセルを抽出するセル抽出手段と、前記セル抽出手段により抽出されたセル毎のオブジェクトの領域情報を抽出する第1の抽出手段と、前記表画像の行または列方向に連なるセル群を部分領域として抽出する第2の抽出手段と、前記部分領域毎における第1の抽出手段により抽出されたオブジェクトの領域情報の偏りに対しの特異なセルを抽出する第3の抽出手段と、前記第3の抽出手段によって抽出されたセル内の画像を、該セルを含む部分領域の領域情報の偏りにあわせて変更する変更手段として機能させるための画像処理プログラムである。
請求項1の画像処理装置によれば、表画像内のオブジェクトにノイズがあったとしても精度よくノイズを除去することができる。
請求項2の画像処理装置によれば、部分領域内における各オブジェクトのセル内での位置の分布による偏りを判別し、その偏りのある分布以外の分布を有しているセルを特異なセルとして抽出することができる。
請求項3の画像処理装置によれば、第1の行(列)において特異なセルであったとしても、直交する第2の列(行)において特異でない場合は、第1の行(列)においても特異ではないとすることができる。
請求項4の画像処理装置によれば、L字型の部分領域又は構造が同じセル群を、部分領域として抽出することができる。
請求項5の画像処理装置によれば、列又は行が1つのセルで構成されている場合は、直交する行又は列の部分領域として抽出することができる。
請求項6の画像処理プログラムによれば、表画像内のオブジェクトにノイズがあったとしても精度よくノイズを除去することができる。
本実施の形態の構成例についての概念的なモジュール構成図である。 本実施の形態による処理例を示すフローチャートである。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示すフローチャートである。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
本実施の形態である画像処理装置100は、表画像内のオブジェクトを変更するものであって、図1の例に示すように、画像読込モジュール110、表構造解析モジュール120、セル画像特徴抽出モジュール130、パス設定モジュール140、偏り検出モジュール150、文字領域補正モジュール160を有している。
画像読込モジュール110は、表構造解析モジュール120と接続されている。画像読込モジュール110は、対象となる画像を読み込む。画像を読み込むとは、例えば、スキャナ、カメラ(スマートフォンを含む携帯電話に付属しているカメラを含む)等で画像を読み込むこと、ファックス等で通信回線を介して外部機器から画像を受信すること、ハードディスク(コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている画像を読み出すこと等が含まれる。画像は、2値画像、多値画像(カラー画像を含む)であってもよい。受け付ける画像は、1枚であってもよいし、複数枚であってもよい。また、画像の内容として、表画像が含まれていれば、ビジネスに用いられる文書、広告宣伝用のパンフレット等であってもよい。
画像読込モジュール110が読み込む画像内の表には、雑音的描画(ノイズともいわれる。以下、雑音部という)が含まれていることがある。例えば、スキャン時の変動や2値化処理により文字以外の空白部に雑音部が散見される。
表構造解析モジュール120は、画像読込モジュール110、セル画像特徴抽出モジュール130、パス設定モジュール140、文字領域補正モジュール160と接続されている。表構造解析モジュール120は、画像読込モジュール110が読み込んだ画像内から表画像を抽出し、その表画像の構造を解析する。公知の技術を用いて、罫線を検出する。そして、その表画像内のセルを抽出する。例えば、解析結果として、N行、M列の表であること、各セルの座標位置(例えば、矩形の左上角のXY座標と幅と縦長)等を解析結果とする。なお、表を構成するマス(表内の罫線で囲まれた最小の矩形)1つ1つのことをセルという。そして、セル内のオブジェクトを抽出する。ここで「オブジェクト」とは、セル内の画像であって、一般的には文字画像が含まれる。場合によっては、雑音部も含まれることになる。
セル画像特徴抽出モジュール130は、表構造解析モジュール120、パス設定モジュール140と接続されている。セル画像特徴抽出モジュール130は、表構造解析モジュール120によって抽出された表画像内のセル毎のオブジェクトの特徴(領域情報)を抽出する。「オブジェクトの特徴」として、例えば、セル内における位置、サイズ等の幾何的、物理的特徴量が含まれる。位置として、例えば、オブジェクトの外接矩形を生成し、その外接矩形のセル内に占める領域の位置(左端、右端、上端、下端のセル内の座標位置)がある。また、セル内のX軸(横軸)又はY軸(縦軸)における黒画素の分布(いわゆるヒストグラム)であってもよい。また、特徴として、セル内でのオブジェクトの重心(X座標、Y座標のいずれか1つ、組み合わせ)、オブジェクトの幅、高さ等を用いてもよい。
パス設定モジュール140は、表構造解析モジュール120、セル画像特徴抽出モジュール130、偏り検出モジュール150と接続されている。パス設定モジュール140は、対象としている表画像の部分領域(以下、パスともいう)を抽出する。ここで「部分領域」は、複数のセルによって構成されており、表の構造上関連のある部分である。「部分領域」は、表画像の行または列方向に連なるセル群であるとしてもよい。
また、パス設定モジュール140は、部分領域として行又は列を抽出してもよい。
また、パス設定モジュール140は、複数のセルによって構成されるL字型の部分領域、又は複数のセルによって構成される構造が同じであるセル群(入れ子構造)を、部分領域として抽出するようにしてもよい。「L字型」とは、ある1つのセルから右方向又は左方向のうちのいずれか一方に連なるセル群とそのセルから上方向又は下方向のうちいずれか一方に連なるセル群によって構成されるものである。典型的な例として、表の第1行(最上行)と第1列(最左列)によって構成されるセル群がある。
また、パス設定モジュール140は、列又は行が1つのセルで構成されている場合は、直交する行又は列の部分領域として抽出するようにしてもよい。
具体的には、部分領域を行又は列とした場合、表構造解析モジュール120による解析結果である表構造データ(セルの座標位置等)を参考にして、行方向又は列方向に隣接セルを辿るパスの一覧を作成する。このパスデータには、各セル内のオブジェクトの特徴抽出結果を含んでいてもよい。
偏り検出モジュール150は、パス設定モジュール140、文字領域補正モジュール160と接続されている。偏り検出モジュール150は、部分領域毎におけるオブジェクトの特徴(領域情報)の偏りがある部分領域におけるオブジェクトの特徴の特異点であるセルを抽出する。なお、以下、特異である箇所を特異点ともいう。偏り検出モジュール150は、部分領域毎におけるセル画像特徴抽出モジュール130により抽出されたオブジェクトの領域情報の偏りに対し特異なセルを抽出する。偏り検出モジュール150は、部分領域毎のオブジェクトの特徴の偏りを判別し、その偏りがある部分領域におけるオブジェクトの特徴の特異点であるセルを抽出する。
また、偏り検出モジュール150は、パス設定モジュール140によって抽出された部分領域内における各オブジェクトのセル内での位置の分布による偏りを判別し、その偏りのある分布以外の分布を有しているセルを特異点のセルとして抽出するようにしてもよい。
また、パス設定モジュール140が、部分領域として行又は列を抽出した場合は、偏り検出モジュール150は、特異点のセルがある第1の行又は列に対して直交する、そのセルを含む第2の列又は行において、そのセルが特異点ではない場合は、そのセルを第1の行又は列において特異点ではないとするようにしてもよい。なお、「第1の行又は列」と「第2の列又は行」の関係は、一方が列である場合は他方は行であり、一方が行である場合は他方は列である。詳細については、図10、11の例を用いて後述する。
文字領域補正モジュール160は、表構造解析モジュール120、偏り検出モジュール150と接続されている。文字領域補正モジュール160は、偏り検出モジュール150によって抽出されたセル内の画像を、そのセルを含む部分領域の領域情報の偏りにあわせて変更する。ここで「セル内の画像を変更する」とは、例えば、偏りのあるセル内のオブジェクトの大きさ(A)に合わせて、特異点のセル内のオブジェクトの大きさ(B)を変更することである。一般的には、オブジェクトの大きさ(A)は、オブジェクトの大きさ(B)よりも小さいので、オブジェクトの大きさ(B)を小さくすることになる。そして、オブジェクトの大きさ(B)を小さくするために、セル内の画像を一部を除去することになるが、その除去する部分にあるオブジェクトは、そのセル内にある他のオブジェクトよりも小さいものとする。結果として、例えば、セル内から雑音部を除去すること等となる。もちろんのことながら、オブジェクトの大きさだけでなく、オブジェクトの位置(又はオブジェクトの外接矩形の位置)等を用いて、オブジェクトの変更を行ってもよい。なお、この変更においては、その部分領域における偏りが強くなる方向に、特異点のセル内のオブジェクトに変更を施すようにする。
そして、セル内の画像を変更した後の画像を用いて、セル毎の文字認識処理等を行う。この場合、文字認識のために、セル内から文字画像を切り出すことが必要であるが、雑音部を含まずに文字を切り出すことができるようになる。
また、偏り検出モジュール150によって検出された部分領域の特異点のセル、又は文字領域補正モジュール160によって削除対象となった領域を、液晶ディスプレイ等の表示装置に表示するようにしてもよい。例えば、文字画像の切り出しをユーザーが行う場合に、その切り出しの補助とするためである。
画像処理装置100は、具体的には、例えば、表構造の構造上関連のある部分で類似する位置に文字が並びやすいことを利用して、セル単位の文字の領域を確からしい範囲に狭めるようにしている。
図2は、本実施の形態による処理例を示すフローチャートである。ここでは、文字領域として、行のパス(表の横に並ぶセル群)を用いた例を示して説明する。
ステップS202では、画像読込モジュール110が、画像を読み込む。この画像内には、表画像が含まれている。また、画像から表画像の領域だけを抽出してもよい。例えば、図3に示す表300が含まれている画像を読み込む。この読み込みによって、雑音部が発生し得る。例えば、図4に示す表画像400(表300を読み込んだ結果である表画像400)のように、スキャンノイズ410、スキャンノイズ420が発生し得る。
ステップS204では、表構造解析モジュール120が、画像内の表を対象として、構造を解析する。具体的には、各セルの位置を認識する。
ステップS206では、セル画像特徴抽出モジュール130が、表内の各セル内のオブジェクトを対象として、特徴抽出を行う。例えば、図5に示す表画像400は、各セルのオブジェクトの外接矩形(各セル内のオブジェクト外接矩形510〜546)を抽出した結果を示している。セル内オブジェクト外接矩形520内には数字「1」の他にスキャンノイズ410が含まれている。そして、セル内オブジェクト外接矩形526内には数字「80」の他にスキャンノイズ420が含まれている。なお、これらセル内オブジェクト外接矩形510等に対して文字認識を行った結果(本実施の形態による処理が行われなかった場合に対する文字認識結果)は、図6の例のようになる。セル内オブジェクト外接矩形520は「’1」と認識され、セル内オブジェクト外接矩形526は「80’」と認識される。これらは、スキャンノイズ410、スキャンノイズ420があるためである。他のセル内オブジェクト外接矩形510等については、認識誤りは発生していない。
ステップS208では、パス設定モジュール140が、表構造の解析結果を利用して、表内のパスを設定する。具体的には、各セルの座標位置を用いて、行、列、L型、同じ構造を有しているセル群を抽出する。例えば、図7に示す表700内のパス710(第1行)、パス720(第2行)、パス730(第3行)、パス740(第4行)を設定する。具体的には、図5の例に示した表画像400に対して、図8の例に示すようにパス810、820、830、840の4本のパスを設定している。パス810には、セル内オブジェクト外接矩形510、セル内オブジェクト外接矩形512、セル内オブジェクト外接矩形514、セル内オブジェクト外接矩形516が含まれており、パス820には、セル内オブジェクト外接矩形520、セル内オブジェクト外接矩形522、セル内オブジェクト外接矩形524、セル内オブジェクト外接矩形526が含まれており、パス830には、セル内オブジェクト外接矩形530、セル内オブジェクト外接矩形532、セル内オブジェクト外接矩形534、セル内オブジェクト外接矩形536が含まれており、パス840には、セル内オブジェクト外接矩形540、セル内オブジェクト外接矩形542、セル内オブジェクト外接矩形544、セル内オブジェクト外接矩形546が含まれている。
ステップS210では、偏り検出モジュール150が、各パスについて、オブジェクトの特徴の偏り/特異点を検出する。オブジェクトの特徴の偏りがあるか否かを判断し、そして、偏りがある場合は、特異点のセルを抽出する。
例えば、図8に示す表画像400のパス810では、ほぼ同じ位置に同じサイズの外接矩形がある。つまり、パス810内のセル内オブジェクト外接矩形510、512、514、516では、各セル内において、その左端の座標、右端の座標、上端の座標、下端の座標、サイズが、予め定められた範囲内に含まれている。なお、「予め定められた範囲内に含まれている」か否かの判断は、対象としている特徴でソートを行い、1位のものと最下位のものとのその特徴での差分が予め定められた閾値未満又は以下であるか否かの判断としてもよい。したがって、パス810は偏りがあり、特異点のセルはないと判断する。一方、パス820では、セル内オブジェクト外接矩形522、524では、各セル内において、そのオブジェクトの左端の座標、右端の座標、上端の座標、下端の座標、サイズが、予め定められた範囲内に含まれているので、偏りがあると判断される。例えば、予め定められた範囲内に含まれているセルの割合(そのセル数を分子とし、そのパスにおける全てのセル数を分母とした場合の割合)が予め定められた閾値より大きい又は以上である場合に、偏りがあると判断してもよい。そして、予め定められた範囲内に含まれていないセルを特異点のセルとしてもよい。図8の例の場合、パス820は偏りがあり、セル内オブジェクト外接矩形520、セル内オブジェクト外接矩形526は特異点であると判断される。他のパス830、パス840についても、パス810と同様に偏りがあり、特異点のセルはないと判断する。
ステップS212では、文字領域補正モジュール160が、偏りがある特徴量にしたがって、特異点であるオブジェクトを修正する。例えば、偏りがある特徴量である左端の座標、右端の座標、上端の座標、下端の座標、サイズのいずれか1つ以上に合わせて、特異点のオブジェクトを修正する。
前述の例では、セル内オブジェクト外接矩形520、セル内オブジェクト外接矩形526が特異点であると判断されたので、修正対象となる。例えば、偏りがあるセル内オブジェクト外接矩形522、セル内オブジェクト外接矩形524のサイズに合わせて、セル内オブジェクト外接矩形520、セル内オブジェクト外接矩形526を修正すればよい。この場合は、セル内オブジェクト外接矩形520、セル内オブジェクト外接矩形526内のオブジェクトを画素塊に分割して、偏りがあるセル内オブジェクト外接矩形522、セル内オブジェクト外接矩形524のサイズと同等になる画素塊を選択すればよい。ここで画素塊とは、4連結又は8連結で接続している同じ色の画素(例えば黒画素)の塊である。そして、修正することによってオブジェクトから削除される画素塊の面積が予め定められた閾値未満又は以下であることを条件としてもよい。この閾値は、削除対象とする雑音部の大きさを設定すればよい。この結果、セル内オブジェクト外接矩形520に対しては、スキャンノイズ410と数字画像「1」に分割され、スキャンノイズ410を削除して、数字画像「1」を残す修正を行う。セル内オブジェクト外接矩形526に対しては、数字画像「8」、「0」とスキャンノイズ420に分割され、スキャンノイズ420を削除して、数字画像「8」、「0」を残す修正を行う。つまり、図9の例に示すように、セル内オブジェクト外接矩形520をセル内オブジェクト外接矩形920に修正し、セル内オブジェクト外接矩形526をセル内オブジェクト外接矩形926に修正している。他のオブジェクトに対しては修正は行われていない。ここでは、オブジェクトの特徴としてサイズを用いて修正したが、オブジェクトの左端の座標、右端の座標、上端の座標、下端の座標を用いてもよい。そして、これら(サイズを含む)の組み合わせを用いて修正してもよい。また、修正対象のオブジェクトは、画素塊が1つである場合は、修正を行わないようにしてもよい。また、修正対象のオブジェクトは、画素塊が1つであり、その面積が予め定められた閾値未満又は以下である場合(修正対象のオブジェクトが雑音部だけである場合)は、削除するようにしてもよい。
なお、ステップS210において、前述の「予め定められた範囲」によっては、セル内オブジェクト外接矩形530、セル内オブジェクト外接矩形540も、パス830、パス840における特異点であると判断される可能性がある。ステップS212では、修正対象のオブジェクトが1つの画素塊である場合は、修正を行わないので、パス830、パス840に対して修正は行われない。
図10は、本実施の形態による処理例を示すフローチャートである。図10の例に示すフローチャートは、図2に例に示すフローチャートのステップS208、ステップS210の処理を置き換えたものである。ここでは、文字領域として、行と列の両方を用いた例を示している。
ステップS1002では、パス設定モジュール140が、横方向と縦方向のパスを設定する。図11(a)の例に示す表700のパス710〜740は、図7の例に示すパスと同様に横方向にパスを設定したものである。図11(b)に示す例は、同じ表700に対して縦方向にパス(パス1110、パス1120、パス1130、パス1140)を設置したものである。
ステップS1004では、偏り検出モジュール150が、各パスについて、オブジェクトの特徴の偏り/特異点を検出する。図11(a)に示す例で前述したように、パス710では、偏りがあり、特異点はなしと判定される。パス720では、偏りがあり、パス720の第1列と第4列が特異点であると判定される。パス730では、偏りがあり、特異点はなしと判定される。パス740では、偏りがあり、特異点はなしと判定される。図11(b)に示す例では、パス1110は、偏りがあり、パス1110の第1行と第2行が特異点であると判定される。パス1120では、偏りがあり、パス1120の第1行が特異点であると判定される。パス1130では、偏りがあり、パス1130の第1行が特異点であると判定される。パス1140では、偏りがあり、パス1140の第1行と第2行が特異点であると判定される。
ステップS1006では、偏り検出モジュール150が、一方のパスの特異点のセルは、直交するパスにおいて、偏りに寄与しているセルであるか否かを判断し、偏りに寄与しているセルである場合はステップS1008へ進み、それ以外の場合は処理を終了する(ステップS1099)。パス720の第1列のセルは特異点であり、パス1110では偏りに寄与していないので、そのセルは特異点である。同様に、パス720の第4列のセルは特異点であり、パス1140では偏りに寄与していないので、そのセルは特異点である。パス1110の第1行のセルは特異点であるが、パス710では偏りに寄与しているので、そのセルは特異点ではないとする(ステップS1008)。同様に、パス1120、1130、1140の第1行のセルは特異点であるが、パス710では偏りに寄与しているので、そのセルは特異点ではないとする(ステップS1008)。なお、他方のパスにおいて偏りに寄与しているセルであるという条件に加えて、他方のパスにおける偏りの割合は予め定められた閾値以上であることとしてもよい。ここでの閾値は、ステップS210で偏りを判定するための閾値よりも高い値とする。
ステップS1008では、偏り検出モジュール150が、そのセルは特異点のセルではないとする。前述の例では、パス1110、1120、1130、1140の第1行のセルは特異点のセルではないとする。
図12は、本実施の形態による処理例を示す説明図である。
表内のデータの種類によっては、その記載位置で左寄せ、中央寄せ、右寄せ等の形式がある。外接矩形のセル内に占める領域の位置(左端、右端、上端、下端のセル内の座標位置)における座標分布の偏りの強さから、変更する雑音部の除去範囲(又はオブジェクトとして残す範囲)を強め〜弱めに変更することにより除去してはいけない文字本体を残せるようにする。
例えば、図12に示すように、第1列を左寄せとし、第2列を中央寄せとし、第3列を右寄せとした表画像1200を対象とする。
この場合、第1列(左寄せ)では、横方向のパス(例えば、セル内オブジェクト外接矩形1210、1212、1214)で、上端、下端のセル内の座標位置の偏りは強めとなる。縦方向のパス(例えば、セル内オブジェクト外接矩形1210、1220、1230、1240)で、左端のセル内の座標位置の偏りは強めとなる。そして、右端のセル内の座標位置の偏りは弱めとなる。図12の例に示すように、4桁までの数字ならば4つの多峰性を持つ分布となる。
第2列(中央寄せ)では、横方向のパス(例えば、セル内オブジェクト外接矩形1210、1212、1214)で、上端、下端のセル内の座標位置の偏りは強めとなる。縦方向のパス(例えば、セル内オブジェクト外接矩形1212、1222、1232、1242)で、左端、右端ともに偏りは弱めとなる。図12の例に示すように、4桁までの数字ならば8つの多峰性を持つ分布となる。
第3列(右寄せ)では、横方向のパス(例えば、セル内オブジェクト外接矩形1210、1212、1214)で、上端、下端のセル内の座標位置の偏りは強めとなる。縦方向のパス(例えば、セル内オブジェクト外接矩形1214、1224、1234、1244)で、右端のセル内の座標位置の偏りは強めとなる。そして、左端のセル内の座標位置の偏りは弱めとなる。図12の例に示すように、4桁までの数字ならば4つの多峰性を持つ分布となる。
そこで、偏りの強い端(外接矩形の辺)においては、分布のピークに対して、予め定められた範囲A(例えば、数ピクセル)を超えたものは削除する変更を行う。これによって、例えば、図12の第1列で、「1」の左にある雑音部は、近くても削除の対象となる。
一方、偏りの弱い端(外接矩形の辺)においては、分布の裾野の端にある峰に対して、予め定められた範囲B(例えば、数ピクセル)を超えたものは削除する変更を行う。これによって、例えば、図12の第1列で、セル内オブジェクト外接矩形1230の「3」の右にある雑音部は、近くても削除の対象となる。ここでの範囲Aは、範囲Bより小さい又は以下とする。
なお、偏りの強弱は、グラフにおける尖度と予め定められた閾値との比較によって判断すればよい。具体的には、尖度が予め定められた閾値Cより大きい又は以上である場合は、偏りが強いと判断し、尖度が予め定められた閾値D未満又は以下である場合は、偏りが弱いと判断する。ここでの閾値Cと閾値Dは同じ値であってもよいし、異なる値であってもよい(一般的には、閾値Cは閾値Dより大きい値とする)。
図13は、本実施の形態(主にパス設定モジュール140)による処理例を示す説明図である。図13の例に示す表1300は、第2列が1つのセル(統合セル)となっている表である。ここでの横方向のパスとして、統合された同一のセルを通過する。つまり、列又は行が1つのセルで構成されている場合は、直行する行又は列のパスとして、その1つのセルを含むようにパスを構成する。もちろんのことながら、列が1つのセルで構成されている場合は、直行する行のパスとして、その列の1つのセルを含むようにパスを構成し、行が1つのセルで構成されている場合は、直行する列のパスとして、その行の1つのセルを含むようにパスを構成する。具体的には、パス1310は、セル1311、セル1352、セル1313、セル1314、セル1315によって構成され、パス1320は、セル1321、セル1352、セル1323、セル1324、セル1325によって構成され、パス1330は、セル1331、セル1352、セル1333、セル1334、セル1335によって構成され、パス1340は、セル1341、セル1352、セル1343、セル1344、セル1345によって構成されている。縦方向のパスとして、第2列は1つのセル(セル1352)だけのパスになる。したがって、第2列のパスの偏り度合は最大となる。そのため、行方向のパス上では2列目のセル(セル1352)は評価に含めないこととなる。
図14は、本実施の形態(主にパス設定モジュール140)による処理例を示す説明図である。図14の例に示す表1400に対して、パス設定モジュール140は、そのセルの大きさ、互いのセルの位置関係に基づいて、同一構造の入れ子になっている入れ子構造1410、入れ子構造1420、入れ子構造1430を設定する。例えば、表内のセルの大きさが異なっている場合は、最も大きいセルAを選択し、そのセルAと接しているセルB(複数あってもよい)を抽出する。セルAと同じ大きさのセルCがあれば、そのセルCと接しているセルD(複数あってもよい)を抽出して、セルAとセルBの位置関係と、セルCとセルDの位置関係が同じあれば、部分領域(パス)として抽出する。具体的には、最も大きいセル1411を選択し、セル1411に接しているセル1412、セル1413、セル1414を抽出し、位置関係(セル1411の下にセル1412、セル1413、セル1414がある)を解析する。セル1411と同じ大きさであるセル1421を選択し、セル1421に接しているセル1412、セル1413、セル1414、セル1422、セル1423、セル1424を抽出し、位置関係(セル1421の上にセル1412、セル1413、セル1414があり、セル1421の下にセル1422、セル1423、セル1424がある)を解析する。ここで、セル1411とセル1412、セル1413、セル1414との位置関係と、セル1421とセル1422、セル1423、セル1424との位置関係は同じであるので、セル1411、セル1412、セル1413、セル1414によって構成される入れ子構造1410と、セル1421、セル1422、セル1423、セル1424によって構成される入れ子構造1420を部分領域として設定する。同様に、入れ子構造1430も部分領域として設定する。
各部分領域(入れ子構造1410、入れ子構造1420、入れ子構造1430)をパスとして、図2の例に示すフローチャートにおけるステップS210以降の処理を行えばよい。つまり、各パスにおいて文字種別の偏りがあれば、その中の特異点であるセルを補正の対象にする。
図15を参照して、本実施の形態の画像処理装置のハードウェア構成例について説明する。図15に示す構成は、例えばパーソナルコンピュータ(PC)等によって構成されるものであり、スキャナ等のデータ読み取り部1517と、プリンタ等のデータ出力部1518を備えたハードウェア構成例を示している。
CPU(Central Processing Unit)1501は、前述の実施の形態において説明した各種のモジュール、すなわち、画像読込モジュール110、表構造解析モジュール120、セル画像特徴抽出モジュール130、パス設定モジュール140、偏り検出モジュール150、文字領域補正モジュール160等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)1502は、CPU1501が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)1503は、CPU1501の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバス等から構成されるホストバス1504により相互に接続されている。
ホストバス1504は、ブリッジ1505を介して、PCI(Peripheral Component Interconnect/Interface)バス等の外部バス1506に接続されている。
キーボード1508、マウス等のポインティングデバイス1509は、操作者により操作される入力デバイスである。ディスプレイ1510は、液晶表示装置又はCRT(Cathode Ray Tube)等があり、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)1511は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU1501によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、対象としている画像(表画像)、解析結果、各セル内のオブジェクトの特徴抽出結果等が格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
ドライブ1512は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1513に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1507、外部バス1506、ブリッジ1505、及びホストバス1504を介して接続されているRAM1503に供給する。リムーバブル記録媒体1513も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート1514は、外部接続機器1515を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1514は、インタフェース1507、及び外部バス1506、ブリッジ1505、ホストバス1504等を介してCPU1501等に接続されている。通信部1516は、通信回線に接続され、外部とのデータ通信処理を実行する。データ読み取り部1517は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部1518は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図15に示す画像処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図15に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図15に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)等に組み込まれていてもよい。
また、前述の実施の形態の説明において、予め定められた値との比較において、「以上」、「以下」、「より大きい」、「より小さい(未満)」としたものは、その組み合わせに矛盾が生じない限り、それぞれ「より大きい」、「より小さい(未満)」、「以上」、「以下」としてもよい。
また、隣合った部分領域(パス)における偏りを参考にして、偏りを決定するようにしてもよい。例えば、対象としている部分領域での偏りを決定する際に、隣合った部分領域でも同じ文字種別の偏りであることを条件としてもよい。隣合った部分領域は、既に偏りが決定されたものとし、2つ目以降の部分領域の判定の際に、その条件を課すようにしてもよい。また、表の予め定められた部分領域(例えば、第1行、第1列等)以外の部分領域を対象としてもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
100…画像処理装置
110…画像読込モジュール
120…表構造解析モジュール
130…セル画像特徴抽出モジュール
140…パス設定モジュール
150…偏り検出モジュール
160…文字領域補正モジュール

Claims (6)

  1. 表画像内のセルを抽出するセル抽出手段と、
    前記セル抽出手段により抽出されたセル毎のオブジェクトの領域情報を抽出する第1の抽出手段と、
    前記表画像の行または列方向に連なるセル群を部分領域として抽出する第2の抽出手段と、
    前記部分領域毎における第1の抽出手段により抽出されたオブジェクトの領域情報の偏りに対し特異なセルを抽出する第3の抽出手段と、
    前記第3の抽出手段によって抽出されたセル内の画像を、該セルを含む部分領域の領域情報の偏りにあわせて変更する変更手段
    を具備することを特徴とする画像処理装置。
  2. 前記第3の抽出手段は、前記部分領域内における各オブジェクトのセル内での位置の分布による偏りを判別し、該偏りのある分布以外の分布を有しているセルを特異なセルとして抽出する
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記第2の抽出手段は、前記部分領域として行又は列を抽出し、
    前記第3の抽出手段は、特異なセルがある第1の行又は列に対して直交する、該セルを含む第2の列又は行において、該セルが特異ではない場合は、該セルを第1の行又は列において特異ではないとする
    ことを特徴とする請求項1又は2に記載の画像処理装置。
  4. 前記第2の抽出手段は、複数のセルによって構成されるL字型の部分領域、又は複数のセルによって構成される構造が同じであるセル群を、部分領域として抽出する
    ことを特徴とする請求項1又は2に記載の画像処理装置。
  5. 前記第2の抽出手段は、列又は行が1つのセルで構成されている場合は、直交する行又は列の部分領域として抽出する
    ことを特徴とする請求項1又は2に記載の画像処理装置。
  6. コンピュータを、
    表画像内のセルを抽出するセル抽出手段と、
    前記セル抽出手段により抽出されたセル毎のオブジェクトの領域情報を抽出する第1の抽出手段と、
    前記表画像の行または列方向に連なるセル群を部分領域として抽出する第2の抽出手段と、
    前記部分領域毎における第1の抽出手段により抽出されたオブジェクトの領域情報の偏りに対し特異なセルを抽出する第3の抽出手段と、
    前記第3の抽出手段によって抽出されたセル内の画像を、該セルを含む部分領域の領域情報の偏りにあわせて変更する変更手段
    として機能させるための画像処理プログラム。
JP2014179037A 2014-09-03 2014-09-03 画像処理装置及び画像処理プログラム Expired - Fee Related JP6409423B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014179037A JP6409423B2 (ja) 2014-09-03 2014-09-03 画像処理装置及び画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014179037A JP6409423B2 (ja) 2014-09-03 2014-09-03 画像処理装置及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2016053800A JP2016053800A (ja) 2016-04-14
JP6409423B2 true JP6409423B2 (ja) 2018-10-24

Family

ID=55744772

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014179037A Expired - Fee Related JP6409423B2 (ja) 2014-09-03 2014-09-03 画像処理装置及び画像処理プログラム

Country Status (1)

Country Link
JP (1) JP6409423B2 (ja)

Also Published As

Publication number Publication date
JP2016053800A (ja) 2016-04-14

Similar Documents

Publication Publication Date Title
US8768052B2 (en) Image processing apparatus, image processing method, and non-transitory computer readable medium
US10740899B2 (en) Image processing apparatus for identifying region within image, information processing method, and storage medium
JP6119952B2 (ja) 画像処理装置及び画像処理プログラム
US10643097B2 (en) Image processing apparatuses and non-transitory computer readable medium
JP4626777B2 (ja) 情報処理装置及び情報処理プログラム
JP5601027B2 (ja) 画像処理装置及び画像処理プログラム
JP2009251872A (ja) 情報処理装置及び情報処理プログラム
JP6221220B2 (ja) 画像処理装置及び画像処理プログラム
JP6409423B2 (ja) 画像処理装置及び画像処理プログラム
JP2010136006A (ja) 画像処理装置及び画像処理プログラム
JP5489894B2 (ja) 画像処理装置及び画像処理プログラム
JP2012175220A (ja) 画像処理装置及び画像処理プログラム
JP5262778B2 (ja) 画像処理装置及び画像処理プログラム
JP6187307B2 (ja) 画像処理装置及び画像処理プログラム
JP2017010187A (ja) 画像処理装置及び画像処理プログラム
JP6003375B2 (ja) 画像処理装置及び画像処理プログラム
JP5821648B2 (ja) 情報処理装置及び情報処理プログラム
JP5640645B2 (ja) 画像処理装置及び画像処理プログラム
JP2010039810A (ja) 画像処理装置及び画像処理プログラム
JP5928714B2 (ja) 情報処理装置及び情報処理プログラム
JP6241311B2 (ja) 画像処理装置及び画像処理プログラム
JP5062076B2 (ja) 情報処理装置及び情報処理プログラム
JP2016053797A (ja) 画像処理装置及び画像処理プログラム
JP2010049336A (ja) 画像処理装置及び画像処理プログラム
JP4670916B2 (ja) 画像処理装置及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170825

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180814

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180828

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180910

R150 Certificate of patent or registration of utility model

Ref document number: 6409423

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees