JP5262778B2 - 画像処理装置及び画像処理プログラム - Google Patents
画像処理装置及び画像処理プログラム Download PDFInfo
- Publication number
- JP5262778B2 JP5262778B2 JP2009024443A JP2009024443A JP5262778B2 JP 5262778 B2 JP5262778 B2 JP 5262778B2 JP 2009024443 A JP2009024443 A JP 2009024443A JP 2009024443 A JP2009024443 A JP 2009024443A JP 5262778 B2 JP5262778 B2 JP 5262778B2
- Authority
- JP
- Japan
- Prior art keywords
- ruled line
- module
- image
- ruled
- filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
Description
請求項1の発明は、画像内の画素数を計数し、該計数した画素数を閾値と比較して罫線を抽出する罫線抽出手段と、前記罫線抽出手段によって抽出された罫線の太さ及び前記閾値に基づいて、前記罫線抽出手段によって抽出された罫線内の雑音成分を識別する雑音成分識別手段を具備し、前記雑音成分識別手段は、雑音成分よりも大きな大きさを有する濾波器を生成し、該濾波器によって雑音成分を識別し、該濾波器は矩形であり、該矩形の一方の辺の長さは、前記罫線抽出手段によって抽出された罫線の太さに1以上の係数を乗算して定め、該矩形の他方の辺の長さは、前記閾値に1未満の係数を乗算して定めることを特徴とする画像処理装置である。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能にほぼ一対一に対応しているが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。
なお、ここで、抽出する罫線は罫線の候補であり、ノイズ識別・除去モジュール130によって、識別されて除去されるべき雑音成分(罫線ではないにもかかわらず、罫線として抽出されたもの)が含まれている場合がある。
また、罫線抽出モジュール110が計数する対象の画素は、黒画素又は白画素のいずれか一方であるが、本実施の形態では、黒画素の数を計数する例を示す。つまり、罫線が黒である表を対象とする。
画素数と比較する閾値は、予め定められた値である。前述のように「予め定められた」とは、罫線を抽出するために閾値と比較する前であれば、いつでもよいが、特に、黒画素数を計数した後に、その計数した黒画素数に応じて閾値を定めるようにしてもよい。例えば、計数した黒画素数のうちの最大値に対して予め定められた割合を掛けて、閾値を定めるようにしてもよい。また、計数した黒画素数で大きいものから順に選択して、予め定められた数まで選択した場合における黒画素数から閾値を定めるようにしてもよい。また、黒画素数でソートし、対象の黒画素数と次の黒画素数が予め定められた数以上の差があったときに、その対象の黒画素数から閾値を定めるようにしてもよい。
なお、実線化モジュール120はなくてもよい。例えば、点線、破線等の罫線がない場合(罫線が実線だけで構成されている場合)は、実線化モジュール120による処理は不要である。
罫線幅抽出モジュール144は、罫線抽出モジュール110が抽出した罫線の幅(縦罫線の場合は水平方向に計測した横幅、横罫線の場合は垂直方向に計測した縦幅)を抽出する。縦罫線又は横罫線の幅のうちからその幅の大きいものを抽出してもよい。例えば、その幅のうち最大値のものを抽出してもよい。また、縦罫線、横罫線のそれぞれの幅の最大値を抽出してもよい。
また、前述のフィルタ処理モジュール150は、フィルタの外枠の位置にある画素が全て白である場合は、そのフィルタ内の画像はノイズであるとして除去しているが、除去するのではなく、ノイズの候補として識別するようにしてもよい。つまり、フィルタ処理モジュール150は、ノイズと決定するのではなくて、あくまでノイズの候補として残しておき、ノイズ候補であることを示すマークだけを行う(印(しるし)付けだけを行う)。そして、他のノイズ識別手法(例えば、単なるパタンマッチングによる短線分検出等)によるノイズ候補の識別結果を得て、両方の結果でノイズ候補と判断された箇所のみを最終的にノイズと決定するようにしてもよい。また、ノイズ識別手法の代わりに、公知の点線破線検出手法を用いて、点線破線として検出しなかったものをノイズ候補とし、両方の結果でノイズ候補と判断された箇所のみを最終的にノイズと決定するようにしてもよい。そして、この決定されたノイズを除去する。より正確なノイズ除去を行う場合に、ここで示した他のノイズ識別手法又は点線破線検出手法を併用する。以下、フィルタの外枠の位置にある画素が全て白である場合は、そのフィルタ内の画像はノイズであるとして除去する手法を用いて説明するが、他の手法を併用するようにしてもよい。
画像処理装置全体は、画像受付モジュール210、オブジェクト分離モジュール220、表領域抽出モジュール230、表罫線補正モジュール240、上書きモジュール250、文字認識モジュール260、情報構成モジュール270、出力モジュール280を備えている。
また、画像受付モジュール210は、受け付けた画像に対して、ノイズ除去、傾き補正、正規化等の前処理を行うようにしてもよい。
部分画像への分離は、画像から空白等で区切られた領域(部分画像)を抽出することによって行う。この部分画像に分離する処理は、例えば、画像受付モジュール210によって受け付けられた画像から白画素の領域が一定の長さ(あるいは面積)以上あるところによって区切る。そのように区切ると、黒画素の領域(例えば、矩形)を抽出することができる。さらに、その黒画素の領域の画像としての特徴(例えば、面積、縦又は横の大きさ、形状、黒画素塊の存在位置等)を抽出し、文字領域、図形領域、表領域、写真領域等の種別を判別することができる。もちろん他の既存の方法で部分画像を抽出してもよい。
例えば、図5の例に示す表画像500が該当する。表画像500は、横罫線520から526、縦罫線530から538によって構成されている。また、図5の例に示すように、表画像500内の各セルには文字が記載されている。
ステップS316では、ノイズ識別・除去モジュール130が、実線化された縦罫線からノイズを除去する。詳細な処理については、図4の例に示すフローチャートを用いて後述する。
ステップS356では、ノイズ識別・除去モジュール130が、実線化された横罫線からノイズを除去する。詳細な処理については、図4の例に示すフローチャートを用いて後述する。
ステップS382では、罫線画像生成モジュール160が、ステップS380で生成した罫線画像を上書きモジュール250に出力する。
そして、上書きモジュール250は、画像受付モジュール210が受け付けた元の画像に表罫線補正モジュール240から受け取った罫線画像(点線、破線等の罫線が実線化され、ノイズが除去されたもの)を上書きする。例えば、図5の例に示した表画像500は、図12の例に示すような表画像1200に変換されることになる。つまり、表のセル内の文字はそのままで、罫線は実線化されている。
ステップS404では、罫線幅抽出モジュール144が、罫線抽出モジュール110が抽出した罫線の幅を抽出する。例えば、図9の例に示すように、図9(a)に示す横罫線820から826と誤認識ノイズ828(図8(b)に示した例と同じものである)は、横方向に黒画素数を計数した数が閾値TH_H以上になっている箇所のそれぞれの画素幅(a画素幅920からd画素幅926まで)を抽出する。より具体的には、閾値TH_H以上になっている頻度分布(黒画素数)の連続している回数を計数して線幅を抽出する。なお、a画素幅920は横罫線820、b画素幅922は横罫線822、c画素幅924は横罫線824と誤認識ノイズ828、d画素幅926は横罫線826のそれぞれの線幅である。例えば、この中で、線幅が最も幅の広いものをフィルタを生成するための罫線幅として抽出してもよい。
例えば、横罫線内のノイズを除去するためのフィルタの横幅M、縦長Nは次に示す数式(1)、(2)によって定めてもよい。
M=閾値×α (1)
N=罫線幅×β (2)
なお、α、βはフィルタサイズを調整するためのパラメータである。横罫線内のノイズを除去するためのフィルタの場合、α<1、β≧1である。つまり、横幅Mは横罫線を抽出するための閾値よりも小であり、縦長Nは罫線幅以上である。これは、ノイズは1つのセルに収まる大きさであり、その線幅は抽出された罫線幅を超えることはないことから、横罫線と認められる長さの最短の長さ(つまり閾値)よりも短い横幅Mの辺と、罫線幅よりも長い縦長Nの辺とで構成されるフィルタを生成するためである。ただし、αは、ノイズとして除去したいものの線長以上になるように定める。
M=罫線幅×β (3)
N=閾値×α (4)
なお、α、βはフィルタサイズを調整するためのパラメータである。縦罫線内のノイズを除去するためのフィルタの場合、α<1、β≧1である。つまり、横幅Mは罫線幅以上であり、縦長Nは縦罫線を抽出するための閾値よりも小である。これは、ノイズは1つのセルに収まる大きさであり、その線幅は抽出された罫線幅を超えることはないことから、罫線幅よりも長い横幅Mの辺と、縦罫線と認められる長さの最短の長さ(つまり閾値)よりも短い縦長Nの辺とで構成されるフィルタを生成するためである。ただし、αは、ノイズとして除去したいものの線長以上になるように定める。
また、図3の例に示したフローチャートでは、ステップS300からステップS310とステップS350の処理に分かれたが、ステップS310からステップS316までの処理を行った後に、受け付けられた画像を90度回転して、再度ステップS310からステップS316までの処理を行うようにしてもよい。
また、前記実施の形態の説明において、「以上」、「以下」、「より大きい」、「より小さい(未満)」としたものは、その組み合わせに矛盾が生じない限り、それぞれ「より大きい」、「より小さい(未満)」、「以上」、「以下」としてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
120…実線化モジュール
130…ノイズ識別・除去モジュール
140…フィルタ生成モジュール
142…閾値取得モジュール
144…罫線幅抽出モジュール
150…フィルタ処理モジュール
160…罫線画像生成モジュール
210…画像受付モジュール
220…オブジェクト分離モジュール
230…表領域抽出モジュール
240…表罫線補正モジュール
250…上書きモジュール
260…文字認識モジュール
270…情報構成モジュール
280…出力モジュール
Claims (3)
- 画像内の画素数を計数し、該計数した画素数を閾値と比較して罫線を抽出する罫線抽出手段と、
前記罫線抽出手段によって抽出された罫線の太さ及び前記閾値に基づいて、前記罫線抽出手段によって抽出された罫線内の雑音成分を識別する雑音成分識別手段
を具備し、
前記雑音成分識別手段は、雑音成分よりも大きな大きさを有する濾波器を生成し、該濾波器によって雑音成分を識別し、該濾波器は矩形であり、該矩形の一方の辺の長さは、前記罫線抽出手段によって抽出された罫線の太さに1以上の係数を乗算して定め、該矩形の他方の辺の長さは、前記閾値に1未満の係数を乗算して定める
ことを特徴とする画像処理装置。 - 前記罫線抽出手段によって抽出された罫線を実線に変換する実線化手段
をさらに具備し、
前記雑音成分識別手段は、前記実線化手段によって実線に変換された罫線内の雑音成分を識別する
ことを特徴とする請求項1に記載の画像処理装置。 - コンピュータを、
画像内の画素数を計数し、該計数した画素数を閾値と比較して罫線を抽出する罫線抽出手段と、
前記罫線抽出手段によって抽出された罫線の太さ及び前記閾値に基づいて、前記罫線抽出手段によって抽出された罫線内の雑音成分を識別する雑音成分識別手段
として機能させ、
前記雑音成分識別手段は、雑音成分よりも大きな大きさを有する濾波器を生成し、該濾波器によって雑音成分を識別し、該濾波器は矩形であり、該矩形の一方の辺の長さは、前記罫線抽出手段によって抽出された罫線の太さに1以上の係数を乗算して定め、該矩形の他方の辺の長さは、前記閾値に1未満の係数を乗算して定める
ことを特徴とする画像処理プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009024443A JP5262778B2 (ja) | 2009-02-05 | 2009-02-05 | 画像処理装置及び画像処理プログラム |
US12/552,627 US8542931B2 (en) | 2009-02-05 | 2009-09-02 | Ruled line extraction technique based on comparision results and indentifying noise based on line thickness |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009024443A JP5262778B2 (ja) | 2009-02-05 | 2009-02-05 | 画像処理装置及び画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010182052A JP2010182052A (ja) | 2010-08-19 |
JP5262778B2 true JP5262778B2 (ja) | 2013-08-14 |
Family
ID=42397770
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009024443A Expired - Fee Related JP5262778B2 (ja) | 2009-02-05 | 2009-02-05 | 画像処理装置及び画像処理プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8542931B2 (ja) |
JP (1) | JP5262778B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI461656B (zh) * | 2011-12-01 | 2014-11-21 | Ind Tech Res Inst | 距離感測裝置及距離感測方法 |
US10417489B2 (en) * | 2015-11-19 | 2019-09-17 | Captricity, Inc. | Aligning grid lines of a table in an image of a filled-out paper form with grid lines of a reference table in an image of a template of the filled-out paper form |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2890306B2 (ja) | 1988-07-12 | 1999-05-10 | 富士ゼロックス株式会社 | 表領域分離装置および表領域分離方法 |
JPH0554189A (ja) | 1991-08-28 | 1993-03-05 | N T T Data Tsushin Kk | 画像情報処理装置 |
JPH0696274A (ja) | 1991-08-29 | 1994-04-08 | Nippon Steel Corp | 文字等の認識方法 |
US5594815A (en) * | 1992-10-19 | 1997-01-14 | Fast; Bruce B. | OCR image preprocessing method for image enhancement of scanned documents |
JPH09282414A (ja) * | 1996-04-10 | 1997-10-31 | Fujitsu Ltd | パターン抽出装置 |
US5923782A (en) * | 1996-08-01 | 1999-07-13 | Nynex Science & Technology, Inc. | System for detecting and identifying substantially linear horizontal and vertical lines of engineering drawings |
JPH1049676A (ja) | 1996-08-06 | 1998-02-20 | Ricoh Co Ltd | 罫線認識方法 |
US6226402B1 (en) * | 1996-12-20 | 2001-05-01 | Fujitsu Limited | Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof |
US6327387B1 (en) * | 1996-12-27 | 2001-12-04 | Fujitsu Limited | Apparatus and method for extracting management information from image |
JPH11242716A (ja) | 1998-02-25 | 1999-09-07 | Ricoh Co Ltd | 画像処理方法および記録媒体 |
JP2000082110A (ja) * | 1998-07-02 | 2000-03-21 | Ricoh Co Ltd | 罫線消去装置および文字画像抽出装置および罫線消去方法および文字画像抽出方法および記録媒体 |
JP2000048121A (ja) | 1998-08-03 | 2000-02-18 | Ricoh Co Ltd | 表罫線認識方法及び表罫線認識プログラムを記録した媒体 |
KR100657385B1 (ko) * | 1998-12-16 | 2006-12-19 | 후지쯔 가부시끼가이샤 | 표 화상 처리 장치, 그 처리 프로그램을 저장하는 기억 매체 및 표 관리 처리 방법 |
JP4089849B2 (ja) | 1999-02-01 | 2008-05-28 | 株式会社リコー | 罫線処理装置および記録媒体 |
JP2000259826A (ja) | 1999-03-12 | 2000-09-22 | Ricoh Co Ltd | 罫線抽出方法、装置および記録媒体 |
JP2001060247A (ja) * | 1999-06-14 | 2001-03-06 | Fuji Xerox Co Ltd | 画像処理装置および画像処理方法 |
-
2009
- 2009-02-05 JP JP2009024443A patent/JP5262778B2/ja not_active Expired - Fee Related
- 2009-09-02 US US12/552,627 patent/US8542931B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20100195915A1 (en) | 2010-08-05 |
US8542931B2 (en) | 2013-09-24 |
JP2010182052A (ja) | 2010-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5206503B2 (ja) | 画像処理装置及び画像処理プログラム | |
KR101248449B1 (ko) | 정보 처리 장치, 정보 처리 방법 및 컴퓨터 판독 가능한 기억 매체 | |
US8805076B2 (en) | Image processing apparatus, image processing method and computer readable medium | |
US8503774B2 (en) | Apparatus, method and computer readable medium for performing solid-line conversion from lines having breaks | |
JP5262778B2 (ja) | 画像処理装置及び画像処理プログラム | |
US8977044B2 (en) | Image processing apparatus for area separation of images, image processing method, and computer readable medium | |
JP4780184B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5742283B2 (ja) | 画像処理装置及び画像処理プログラム | |
US8494272B2 (en) | Image processing device, image processing method, and computer readable medium for judging if images are matched | |
JP5489894B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2017010187A (ja) | 画像処理装置及び画像処理プログラム | |
JP2012175597A (ja) | 画像処理装置及び画像処理プログラム | |
JP4872780B2 (ja) | 画像処理システム及び画像処理プログラム | |
JP4995507B2 (ja) | 画像処理システム、文字認識システムおよび画像処理プログラム | |
JP6606885B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6409423B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4670916B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2013161158A (ja) | 画像処理装置及び画像処理プログラム | |
JP6252091B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2010039810A (ja) | 画像処理装置及び画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120123 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121016 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121023 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121114 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130402 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130415 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 5262778 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |