JP5267364B2 - 画像処理装置およびプログラム - Google Patents
画像処理装置およびプログラム Download PDFInfo
- Publication number
- JP5267364B2 JP5267364B2 JP2009163704A JP2009163704A JP5267364B2 JP 5267364 B2 JP5267364 B2 JP 5267364B2 JP 2009163704 A JP2009163704 A JP 2009163704A JP 2009163704 A JP2009163704 A JP 2009163704A JP 5267364 B2 JP5267364 B2 JP 5267364B2
- Authority
- JP
- Japan
- Prior art keywords
- line segment
- line
- graphic
- specifying
- specified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Description
本発明の請求項2に係る発明によれば、特定線分以外の線分を全て用いて表領域であるか否かを判定するものと比較して、表領域ではない領域が表領域として判定されることを少なくすることができる。
本発明の請求項3、6に係る発明によれば、本構成を有さないものと比較して、表領域ではない領域が表領域として判定されることを少なくすることができる。
本発明の請求項4に係る発明によれば、目盛り線と判定された線分が交差している線分以外の線分を全て用いて表領域であるか否かを判定するものと比較して、表領域ではない領域が表領域として判定されることを少なくすることができる。
(実施形態の構成)
図1は、本発明の一実施形態に係るコンピュータ装置1のハードウェア構成を示したブロック図である。本実施形態においてコンピュータ装置1は、所謂PC(Personal Computer)であり、図1に示したように、各部は、バス101に接続され、このバス101を介して各部間で情報のやり取りを行う。
操作部106は、コンピュータ装置1を操作するためのキーボードやマウスを備えている。ユーザがこのキーボードやマウスを操作することにより、コンピュータ装置1に対する各種指示の入力や各種設定が行われる。
画像取得部108は、スキャナが接続されるインターフェースであり、紙面の画像を読み取り、読み取った画像の画像データを生成するスキャナと通信を行い、スキャナから画像データを取得する。
ROM(Read Only Memory)103は、IPL(Initial Program Loader)を記憶しており、CPU(Central Processing Unit)102は、ROM103に記憶されているIPLを読み出して実行する。IPLが実行されると、記憶部105からオペレーティングシステムの機能を実現させるプログラムが読み出されて実行される。また、オペレーティングシステムの機能を実現させるプログラムが実行されると、CPU102により画像処理プログラムを実行することが可能となる。そして、CPU102により画像処理プログラムが実行されると、コンピュータ装置1は、画像データが示す画像を処理する画像処理装置として機能し、画像中にある表の領域を特定する機能が実現する。
二値化部200は、画像取得部108で取得された画像データが表す画像を白黒の画像に二値化するブロックであり、二値化された画像(以下、二値化画像と称する)を得る取得手段の一例である。本実施形態においては、二値化画像は、画素の値を1ビットで表しており、黒の画素を「1」、白の画素を「0」とし、白画素が画像の背景を表している。なお、二値化画像は、黒の画素を「0」、白の画素を「1」で表してもよい。
図形特定部201は、二値化画像中の図形の部分を特定するブロックである。画像から図形の部分を特定する技術としては、例えば、特開平3−102964号公報に記載されている技術など公知の技術を採用できる。なお、画像から図形の部分を特定する技術は、特開平3−102964号公報に記載されている技術に限定されず、他の技術を採用してもよい。
線分特定部202は、図形特定部201で特定された図形部分にある線分を特定するブロックである。線分を特定する技術としては、例えば、特開平2−210586号公報に記載されている技術のように、二値化画像を走査し、予め定められた閾値以上に黒画素が連続している部分を線分として特定するという手法など公知の様々な技術を採用できる。なお、図形部分にある線分を特定する技術は、特開平2−210586号公報に記載されている技術に限定されず、他の技術を採用してもよい。
特定線分抽出部204は、線分特定部202で特定された線分の端部の形状を判定し、端部の形状が予め定められた特定形状である線分を抽出するブロックである。なお、特定線分抽出部204は、線分の端部の形状を例えばパターンマッチング、統計的識別法、構造識別法などの技術により認識し、線分の形状を判定する。
表領域判定部205は、交差判定部203において他の線分と交わっていないと判定された線分と、特定線分抽出部204において抽出された線分を、表を構成する線分ではないと判定し、これらの線分以外の線分が表を構成しているか否か判定するブロックである。複数の線分から表の領域を判定する技術としては、例えば特開平8−249419号公報に記載されている技術のように、図形領域内にある線分の黒画素数を、当該領域内で表を構成する線分と判定された線分の黒画素数で除して得た値により、複数の線分が表を表しているか否か判定してもよい。なお、複数の線分から表の領域を判定する技術は、特開平8−249419号公報に記載されている技術に限定されず、他の技術を採用してもよい。
以下、本実施形態の動作例について説明する。まず、ユーザが画像取得部108に接続されたスキャナに画像が描かれた紙をセットし、紙面の画像の読み取りを行わせると、紙面の画像を表す画像データがスキャナにおいて生成される。次に、ユーザが、スキャナで生成された画像データの取得を指示する操作を操作部106において行うと、画像取得部108がスキャナと通信を行い、スキャナで生成された画像データが取得されて記憶部105に記憶される。
例えば、図形識別子が「1」である画像G10の部分について、線分L110が特定され、この線分の座標として(x1,y1)(x1,y2)が特定され、線分L110に対して「Li110」というラベル番号が生成されると、図示したように、図形識別子の「1」に対応付けて、ラベル番号「Li110」と、座標(x1,y1)(x1,y2)が格納される。
また、例えば、図形識別子が「2」である画像G11の部分について、線分L120が特定され、この線分の座標として(x11,y11)(x11,y12)が特定され、線分L120に対して「Li120」というラベル番号が生成されると、図示したように、図形識別子の「2」に対応付けて、ラベル番号「Li120」、座標(x11,y11)(x11,y12)が対応付けて格納される。
例えば、図4の画像の場合、線分L110については、線分L115,L116,L117が交差しているため、線分L110のラベル番号「Li110」に対応付けて、線分L115〜L117のラベル番号であるLi115,Li116およびLi117が図5に示したように格納される。また、線分L120については、線分L125,L126,L127が交差するため、線分L120のラベル番号「Li120」に対応付けて、線分L125〜L127のラベル番号であるLi125,Li126およびLi127が図5に示したように格納される。
なお、表を構成する線分ではない特定線分として抽出される線分は、端部の形状が矢印形状のものに限定されず、端部の幅が他の部分(例えば、線分の中点部分)の幅と異なる線分や、端部が複数本の線分に分岐した形状の線分、端部が円形や楕円形の線分、端部が他の部分より幅の広い多角形の形状となっている線分などの端部形状が特定形状の特定線分についても、特定線分として抽出してもよい。
ここで、図形識別子が「1」である部分においては、この部分にある黒画素の数の総和は、線分L110〜112と線分L115〜L117を表す黒画素の総和である。また、当該部分で表を構成する線分と判定された線分の黒画素の数の総和は、線分L111,L112,L115,L116を表す黒画素の数の総和である。線分L111,L112,L115,L116を表す黒画素の数の総和を、線分L110〜112と線分L115〜L117を表す黒画素の数の総和で除して得られる値が、予め定められた閾値(例えば0.9)未満であると、CPU102は、図形識別子が「1」である部分については表領域ではないと判定する。なお、閾値を0.9としたのは一例であり、閾値は、他の値であってもよい。
ここで図形領域内にある全線分の黒画素数を、当該領域内で表を構成する線分と判定された線分の黒画素数で除して得た値は、予め定められた閾値(例えば0.9)以上であるため、CPU102は、図形識別子が「2」である部分については表領域であると判定する。
以上説明したように本実施形態によれば、グラフのように表ではない領域は表と認識しないため、表の認識率を高めることができる。
(実施形態の構成)
次に、本発明の第2実施形態に係るコンピュータ装置1について説明する。なお、本実施形態に係るコンピュータ装置1は、ハードウェア構成は第1実施形態と同じであり、CPU102により実行される画像処理プログラムと、画像処理プログラムを実行したCPU102が行う処理が第1実施形態と異なる。このため、以下、第1実施形態と同じであるハードウェア構成については説明を省略し、第1実施形態と異なる点について説明する。
まず、本実施形態においても、スキャナから画像取得部108によって画像データが取得され、画像処理プログラムを実行したCPU102により、取得された画像データから二値化画像が生成される(図9:ステップSA1)。ここで、図10は、二値化処理により得られた画像の一例を示した図である。図10において画像G20は、グラフの画像であり、グラフの目盛りを表す線分L141〜L148がある。
なお、本動作例においては、図10の画像の場合、線分L130〜L132に対しては、ラベル番号「Li130」〜ラベル番号「Li132」が生成される。また、線分L135〜L137に対しては、ラベル番号「Li135」〜ラベル番号「Li137」が生成される。また線分L141〜L148に対しては、ラベル番号「Li141」〜ラベル番号「Li148」が生成される。
CPU102は、ステップSA4の処理が終了すると、ラベル番号が付けられた各線分を参照し、線分同士の交差関係を判定する(ステップSA5)。そして、一の線分に交差する他の線分のラベル番号を、線分テーブルTB10に格納する。これにより、図11に示した線分テーブルTB10が得られる。
具体的には、CPU102は、一の線分にしか交差していない線分が交差している線分を、目盛り線が交差している線分として特定する。また、一の線分にしか交差していない線分を目盛り線として特定する。
例えば、ラベル番号が「Li130」である線分L130については、交差する線分として、Li135〜Li137,Li141〜Li144のラベル番号の線分、つまり、線分L135〜L137および線分L141〜L144が交差している。交差する線分の各ラベル番号の行を線分テーブルTB10において見ると、Li141〜Li144の行においては、交差する線分がいずれも一つのみである。よって、CPU102は、ラベル番号が「Li130」である線分については、目盛り線が交差している線分として特定する。なお、CPU102は、ラベル番号が「Li137」である線分についても、目盛り線が交差していると判定する。また、CPU102は、ラベル番号がLi141〜Li148の線分については、一の線分にしか交差していないため、目盛り線として特定する。
ここで、図10の画像の場合、線分L141〜L148に対応するラベル番号「Li141」〜「Li148」が格納されている行が線分テーブルTB10から削除される。
また、線分L130に対応するラベル番号Li130が格納されている行と、線分L137に対応するラベル番号Li137が格納されている行が線分テーブルTB10から削除され、これにより、図12に示した線分テーブルTB10が得られる。なお、本実施形態においても、交差する線分が無い線分のラベル番号が格納されている行を線分テーブルTB10から削除してもよい。
ここで、画像G20の部分においては、この部分にある黒画素の数の総和は、線分L130〜132,線分L135〜L137,線分L141〜L148を表す黒画素の数の総和である。
また、当該部分で表を構成する線分と判定された線分の黒画素の数の総和は、線分L131,L132,L135,L136を表す黒画素の数の総和である。
線分L131,L132,L135,L136を表す黒画素の数の総和を、線分L130〜132,線分L135〜L137,線分L141〜L148を表す黒画素の数の総和で除して得られる値が、予め定められた閾値(例えば0.9)未満であると、CPU102は、図10に示した画像については表領域ではないと判定する。
以上説明したように本実施形態によれば、グラフのように表ではない領域は表と認識しないため、表の認識率を高めることができる。
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されることなく、他の様々な形態で実施可能である。例えば、上述の実施形態を以下のように変形して本発明を実施してもよい。なお、上述した実施形態及び以下の変形例は、各々を組み合わせてもよい。
上述した第1実施形態においては、端部の形状が矢印形状の線分を特定した場合、この特定した線分がある領域は表領域ではないと判定してもよい。
また、上述した第2実施形態においては、目盛り線が交差している線分を特定した場合、この特定した線分がある領域は表領域ではないと判定してもよい。
また、上述した実施形態においては、線分テーブルTB10に格納されている線分で矩形が形成されているか否か判定し、矩形の形成に関わっていない線分の行を線分テーブルTBから削除するようにしてもよい。例えば、図11に示した画像の場合、線分L160〜L163と、線分L164〜L167は、矩形を形成しているため、これらの線分のラベル番号と座標は画像テーブルTBに格納される。一方、線分L150〜L152については、矩形を形成していないため、これらの線分のラベル番号と座標は線分テーブルTB10から削除される。この結果、図11に示した画像については、CPU102は、線分L160〜L167が表を構成しているか否か判定する。
Claims (6)
- 画素値が第1値の第1画素と、画素値が第2値の第2画素とで表された二値化画像を取得する取得手段と、
前記取得手段で取得された二値化画像中の図形部分を特定する図形特定手段と、
前記図形特定手段で特定された部分にある線分を特定する線分特定手段と、
前記線分特定手段で特定された線分の端部の形状が特定形状であるか否かを判定し、特定形状である場合に該線分を特定線分として抽出する特定線分抽出手段と、
前記線分特定手段で特定された線分のうち前記特定線分抽出手段において抽出された特定線分以外の線分を用いて、前記図形特定手段で特定された図形部分が表領域であるか否か判定する表領域判定手段と
を有する画像処理装置。 - 前記線分特定手段で特定された各線分の交差関係を判定する交差判定手段を有し、
前記表領域判定手段は、前記特定線分として抽出された線分以外の線分のうち、前記交差判定手段において、他の線分と交差していると判定された線分を用いて、前記図形特定手段で特定された部分が表領域であるか否か判定すること
を特徴とする請求項1に記載の画像処理装置。 - 画素値が第1値の第1画素と、画素値が第2値の第2画素とで表された二値化画像を取得する取得手段と、
前記取得手段で取得された二値化画像中の図形部分を特定する図形特定手段と、
前記図形特定手段で特定された部分にある線分を特定する線分特定手段と、
前記線分特定手段で特定された線分のうち、目盛り線を判定する目盛り線判定手段と、
前記線分特定手段で特定された各線分の交差関係を判定する交差判定手段と、
前記線分特定手段で特定された線分のうち、前記目盛り線判定手段において目盛り線と判定された線分以外の線分であって、該目盛り線と判定された線分が交差している線分以外の線分を用いて、前記図形特定手段で特定された図形部分が表領域であるか否か判定する表領域判定手段と
を有する画像処理装置。 - 前記表領域判定手段は、前記目盛り線と判定された線分が交差している線分以外の線分のうち、前記交差判定手段において、他の線分と交差していると判定された線分を用いて、前記図形特定手段で特定された部分が表領域であるか否か判定すること
を特徴とする請求項3に記載の画像処理装置。 - コンピュータを、
画素値が第1値の第1画素と、画素値が第2値の第2画素とで表された二値化画像を取得する取得手段と、
前記取得手段で取得された二値化画像中の図形部分を特定する図形特定手段と、
前記図形特定手段で特定された部分にある線分を特定する線分特定手段と、
前記線分特定手段で特定された線分の端部の形状が特定形状であるか否かを判定し、特定形状である場合に該線分を特定線分として抽出する特定線分抽出手段と、
前記線分特定手段で特定された線分のうち前記特定線分抽出手段において抽出された特定線分以外の線分を用いて、前記図形特定手段で特定された図形部分が表領域であるか否か判定する表領域判定手段
として機能させるためのプログラム。 - コンピュータを、
画素値が第1値の第1画素と、画素値が第2値の第2画素とで表された二値化画像を取得する取得手段と、
前記取得手段で取得された二値化画像中の図形部分を特定する図形特定手段と、
前記図形特定手段で特定された部分にある線分を特定する線分特定手段と、
前記線分特定手段で特定された線分のうち、目盛り線を判定する目盛り線判定手段と、
前記線分特定手段で特定された各線分の交差関係を判定する交差判定手段と、
前記線分特定手段で特定された線分のうち、前記目盛り線判定手段において目盛り線と判定された線分以外の線分であって、該目盛り線と判定された線分が交差している線分以外の線分を用いて、前記図形特定手段で特定された図形部分が表領域であるか否か判定する表領域判定手段
として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009163704A JP5267364B2 (ja) | 2009-07-10 | 2009-07-10 | 画像処理装置およびプログラム |
US12/702,707 US8483482B2 (en) | 2009-07-10 | 2010-02-09 | Image processing device, image processing method and computer-readable medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009163704A JP5267364B2 (ja) | 2009-07-10 | 2009-07-10 | 画像処理装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011018274A JP2011018274A (ja) | 2011-01-27 |
JP5267364B2 true JP5267364B2 (ja) | 2013-08-21 |
Family
ID=43427512
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009163704A Expired - Fee Related JP5267364B2 (ja) | 2009-07-10 | 2009-07-10 | 画像処理装置およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8483482B2 (ja) |
JP (1) | JP5267364B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679024B (zh) * | 2017-09-11 | 2023-04-18 | 畅捷通信息技术股份有限公司 | 识别表格的方法、系统、计算机设备、可读存储介质 |
CN108470350B (zh) * | 2018-02-26 | 2021-08-24 | 阿博茨德(北京)科技有限公司 | 折线图中的折线分割方法及装置 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2890306B2 (ja) | 1988-07-12 | 1999-05-10 | 富士ゼロックス株式会社 | 表領域分離装置および表領域分離方法 |
JP2890317B2 (ja) | 1989-09-18 | 1999-05-10 | 富士ゼロックス株式会社 | 文字/図形分離装置 |
JPH0481071A (ja) * | 1990-07-20 | 1992-03-13 | Ricoh Co Ltd | デジタル複写装置 |
JP3068131B2 (ja) * | 1995-02-03 | 2000-07-24 | 富士ゼロックス株式会社 | 文書処理装置 |
JPH08249419A (ja) | 1995-03-10 | 1996-09-27 | Fuji Xerox Co Ltd | 表領域判定装置 |
WO1997005561A1 (fr) * | 1995-07-31 | 1997-02-13 | Fujitsu Limited | Processeur de supports et procede de traitement de supports |
JP4040046B2 (ja) * | 2003-03-14 | 2008-01-30 | 富士通株式会社 | ポインタ領域検出装置、方法及びプログラム、画像の対応付け装置、方法及びプログラム、並びにコンテンツ配信サーバ、コンテンツ配信方法 |
JP2005190094A (ja) | 2003-12-25 | 2005-07-14 | Hitachi Ltd | 図面編集方法および装置 |
JP4628278B2 (ja) | 2006-02-08 | 2011-02-09 | 富士通株式会社 | 表認識装置、及びコンピュータプログラム |
JP4569622B2 (ja) * | 2007-12-18 | 2010-10-27 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
JP5206525B2 (ja) * | 2009-03-19 | 2013-06-12 | 富士ゼロックス株式会社 | 画像処理装置、画像読取装置、画像形成装置及びプログラム |
-
2009
- 2009-07-10 JP JP2009163704A patent/JP5267364B2/ja not_active Expired - Fee Related
-
2010
- 2010-02-09 US US12/702,707 patent/US8483482B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20110007972A1 (en) | 2011-01-13 |
US8483482B2 (en) | 2013-07-09 |
JP2011018274A (ja) | 2011-01-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2019515374A (ja) | 画像内の文字領域を認識するための方法及び装置 | |
JP3950777B2 (ja) | 画像処理方法、画像処理装置および画像処理プログラム | |
JP2011081556A (ja) | 情報処理装置、情報処理方法、プログラムおよびサーバ | |
TW201020970A (en) | Pixel region-based image segmentation method and system | |
JP5267364B2 (ja) | 画像処理装置およびプログラム | |
JP2012194879A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2010123002A (ja) | 文書画像レイアウト装置 | |
JP5182902B2 (ja) | 文書イメージ出力装置 | |
JP2011081557A (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP2007156741A (ja) | 文字抽出方法、文字抽出装置およびプログラム | |
JP4868139B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5418064B2 (ja) | 画像処理装置およびプログラム | |
JP5159588B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP2015215637A (ja) | 画像形成装置、画像処理装置およびプログラム | |
JP2018137509A (ja) | 画像処理装置、画像読み取り装置、および、プログラム | |
JP2003046746A (ja) | 画像処理方法及び画像処理装置 | |
JP2007295210A (ja) | 画像処理装置、画像処理方法、画像処理プログラム、およびこれを記録した記録媒体 | |
JP6294572B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2006277149A (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
JP6056309B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2009193170A (ja) | 文字認識装置及び文字認識方法 | |
JP4890425B2 (ja) | マンガのコマ画像のためのマスク画像の作成方法及びプログラム | |
JP2011018997A (ja) | 画像処理装置およびプログラム | |
JP4738645B2 (ja) | 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体 | |
JP4241820B2 (ja) | 文字認識方法および文字認識システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120620 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130312 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130409 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130422 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5267364 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |