JP5267364B2 - 画像処理装置およびプログラム - Google Patents

画像処理装置およびプログラム Download PDF

Info

Publication number
JP5267364B2
JP5267364B2 JP2009163704A JP2009163704A JP5267364B2 JP 5267364 B2 JP5267364 B2 JP 5267364B2 JP 2009163704 A JP2009163704 A JP 2009163704A JP 2009163704 A JP2009163704 A JP 2009163704A JP 5267364 B2 JP5267364 B2 JP 5267364B2
Authority
JP
Japan
Prior art keywords
line segment
line
graphic
specifying
specified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009163704A
Other languages
English (en)
Other versions
JP2011018274A (ja
Inventor
正和 福永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2009163704A priority Critical patent/JP5267364B2/ja
Priority to US12/702,707 priority patent/US8483482B2/en
Publication of JP2011018274A publication Critical patent/JP2011018274A/ja
Application granted granted Critical
Publication of JP5267364B2 publication Critical patent/JP5267364B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Description

本発明は、画像処理装置およびプログラムに関する。
画像中の表領域を認識する装置としては、例えば、特許文献1に開示された装置がある。この装置は、画像からセル領域の候補領域を特定し、複数の候補領域について表を構成することが可能な組み合わせ候補を選定する。そして、組み合わせの候補毎に表を構成する可能性の度合いを示す評価値を算出し、算出した度合いが最大の候補を選択して表を構成する。
特開2007−213255号公報
本発明は、表領域ではない領域が表領域として判定されることを少なくする技術を提供することを目的とする。
本発明の請求項1に係る画像処理装置は、画素値が第1値の第1画素と、画素値が第2値の第2画素とで表された二値化画像を取得する取得手段と、前記取得手段で取得された二値化画像中の図形部分を特定する図形特定手段と、前記図形特定手段で特定された部分にある線分を特定する線分特定手段と、前記線分特定手段で特定された線分の端部の形状が特定形状であるか否かを判定し、特定形状である場合に該線分を特定線分として抽出する特定線分抽出手段と、前記線分特定手段で特定された線分のうち前記特定線分抽出手段において抽出された特定線分以外の線分を用いて、前記図形特定手段で特定された図形部分が表領域であるか否か判定する表領域判定手段とを有する。
本発明の請求項2に係る画像処理装置は、請求項1に記載の画像処理装置において、前記線分特定手段で特定された各線分の交差関係を判定する交差判定手段を有し、前記表領域判定手段は、前記特定線分として抽出された線分以外の線分のうち、前記交差判定手段において、他の線分と交差していると判定された線分を用いて、前記図形特定手段で特定された部分が表領域であるか否か判定することを特徴とする。
本発明の請求項3に係る画像処理装置は、画素値が第1値の第1画素と、画素値が第2値の第2画素とで表された二値化画像を取得する取得手段と、前記取得手段で取得された二値化画像中の図形部分を特定する図形特定手段と、前記図形特定手段で特定された部分にある線分を特定する線分特定手段と、前記線分特定手段で特定された線分のうち、目盛り線を判定する目盛り線判定手段と、前記線分特定手段で特定された各線分の交差関係を判定する交差判定手段と、前記線分特定手段で特定された線分のうち、前記目盛り線判定手段において目盛り線と判定された線分以外の線分であって、該目盛り線と判定された線分が交差している線分以外の線分を用いて、前記図形特定手段で特定された図形部分が表領域であるか否か判定する表領域判定手段とを有する。
本発明の請求項4に係る画像処理装置は、請求項3に記載の画像処理装置において、前記表領域判定手段は、前記目盛り線と判定された線分が交差している線分以外の線分のうち、前記交差判定手段において、他の線分と交差していると判定された線分を用いて、前記図形特定手段で特定された部分が表領域であるか否か判定することを特徴とする。
本発明の請求項5に係るプログラムは、コンピュータを、画素値が第1値の第1画素と、画素値が第2値の第2画素とで表された二値化画像を取得する取得手段と、前記取得手段で取得された二値化画像中の図形部分を特定する図形特定手段と、前記図形特定手段で特定された部分にある線分を特定する線分特定手段と、前記線分特定手段で特定された線分の端部の形状が特定形状であるか否かを判定し、特定形状である場合に該線分を特定線分として抽出する特定線分抽出手段と、前記線分特定手段で特定された線分のうち前記特定線分抽出手段において抽出された特定線分以外の線分を用いて、前記図形特定手段で特定された図形部分が表領域であるか否か判定する表領域判定手段として機能させるためのプログラムである。
本発明の請求項6に係るプログラムは、コンピュータを、画素値が第1値の第1画素と、画素値が第2値の第2画素とで表された二値化画像を取得する取得手段と、前記取得手段で取得された二値化画像中の図形部分を特定する図形特定手段と、前記図形特定手段で特定された部分にある線分を特定する線分特定手段と、前記線分特定手段で特定された線分のうち、目盛り線を判定する目盛り線判定手段と、前記線分特定手段で特定された各線分の交差関係を判定する交差判定手段と、前記線分特定手段で特定された線分のうち、前記目盛り線判定手段において目盛り線と判定された線分以外の線分であって、該目盛り線と判定された線分が交差している線分以外の線分を用いて、前記図形特定手段で特定された図形部分が表領域であるか否か判定する表領域判定手段として機能させるためのプログラムである。
本発明の請求項1、5に係る発明によれば、本構成を有さないものと比較して、表領域ではない領域が表領域として判定されることを少なくすることができる。
本発明の請求項2に係る発明によれば、特定線分以外の線分を全て用いて表領域であるか否かを判定するものと比較して、表領域ではない領域が表領域として判定されることを少なくすることができる。
本発明の請求項3、6に係る発明によれば、本構成を有さないものと比較して、表領域ではない領域が表領域として判定されることを少なくすることができる。
本発明の請求項4に係る発明によれば、目盛り線と判定された線分が交差している線分以外の線分を全て用いて表領域であるか否かを判定するものと比較して、表領域ではない領域が表領域として判定されることを少なくすることができる。
コンピュータ装置1のハードウェア構成を示したブロック図。 コンピュータ装置1において実現する機能ブロックを示した図。 CPU102が行う処理の流れを示したフローチャート。 二値化画像の一例を示した図。 線分テーブルTB10のフォーマットを示した図。 ラベル番号を削除した後の線分テーブルTB10を示した図。 表領域の特定結果を示した図。 コンピュータ装置1において実現する機能ブロックを示した図。 CPU102が行う処理の流れを示したフローチャート。 二値化画像の一例を示した図。 第2実施形態に係る線分テーブルTB10の内容を示した図。 ラベル番号を削除した後の線分テーブルTB10を示した図。 二値化画像の一例を示した図。
[実施形態]
(実施形態の構成)
図1は、本発明の一実施形態に係るコンピュータ装置1のハードウェア構成を示したブロック図である。本実施形態においてコンピュータ装置1は、所謂PC(Personal Computer)であり、図1に示したように、各部は、バス101に接続され、このバス101を介して各部間で情報のやり取りを行う。
表示部107は、画像を表示する表示装置として液晶ディスプレイを備えており、CPU102の制御の下、コンピュータ装置1を操作するためのメニュー画面や各種メッセージ等を表示する。なお、表示装置は液晶ディスプレイに限定されるものではなく、CRT(Cathode Ray Tube)やEL(electroluminescence)を用いたディスプレイなど他の表示装置であってもよい。
操作部106は、コンピュータ装置1を操作するためのキーボードやマウスを備えている。ユーザがこのキーボードやマウスを操作することにより、コンピュータ装置1に対する各種指示の入力や各種設定が行われる。
画像取得部108は、スキャナが接続されるインターフェースであり、紙面の画像を読み取り、読み取った画像の画像データを生成するスキャナと通信を行い、スキャナから画像データを取得する。
記憶部105はハードディスク装置を具備しており、コンピュータ装置1にオペレーティングシステムの機能を実現させるプログラムや、画像データが示す画像に画像処理を施す画像処理プログラム、スキャナから取得した画像データなどを記憶する。
ROM(Read Only Memory)103は、IPL(Initial Program Loader)を記憶しており、CPU(Central Processing Unit)102は、ROM103に記憶されているIPLを読み出して実行する。IPLが実行されると、記憶部105からオペレーティングシステムの機能を実現させるプログラムが読み出されて実行される。また、オペレーティングシステムの機能を実現させるプログラムが実行されると、CPU102により画像処理プログラムを実行することが可能となる。そして、CPU102により画像処理プログラムが実行されると、コンピュータ装置1は、画像データが示す画像を処理する画像処理装置として機能し、画像中にある表の領域を特定する機能が実現する。
図2は、画像処理プログラムをCPU102が実行したことにより実現する機能ブロックを示した図である。
二値化部200は、画像取得部108で取得された画像データが表す画像を白黒の画像に二値化するブロックであり、二値化された画像(以下、二値化画像と称する)を得る取得手段の一例である。本実施形態においては、二値化画像は、画素の値を1ビットで表しており、黒の画素を「1」、白の画素を「0」とし、白画素が画像の背景を表している。なお、二値化画像は、黒の画素を「0」、白の画素を「1」で表してもよい。
図形特定部201は、二値化画像中の図形の部分を特定するブロックである。画像から図形の部分を特定する技術としては、例えば、特開平3−102964号公報に記載されている技術など公知の技術を採用できる。なお、画像から図形の部分を特定する技術は、特開平3−102964号公報に記載されている技術に限定されず、他の技術を採用してもよい。
線分特定部202は、図形特定部201で特定された図形部分にある線分を特定するブロックである。線分を特定する技術としては、例えば、特開平2−210586号公報に記載されている技術のように、二値化画像を走査し、予め定められた閾値以上に黒画素が連続している部分を線分として特定するという手法など公知の様々な技術を採用できる。なお、図形部分にある線分を特定する技術は、特開平2−210586号公報に記載されている技術に限定されず、他の技術を採用してもよい。
交差判定部203は、線分特定部202で特定された線分同士の交差関係を判定するブロックであり、線分の始点、終点および長さなどから、線分同士が交差しているか否か判定する。
特定線分抽出部204は、線分特定部202で特定された線分の端部の形状を判定し、端部の形状が予め定められた特定形状である線分を抽出するブロックである。なお、特定線分抽出部204は、線分の端部の形状を例えばパターンマッチング、統計的識別法、構造識別法などの技術により認識し、線分の形状を判定する。
表領域判定部205は、交差判定部203において他の線分と交わっていないと判定された線分と、特定線分抽出部204において抽出された線分を、表を構成する線分ではないと判定し、これらの線分以外の線分が表を構成しているか否か判定するブロックである。複数の線分から表の領域を判定する技術としては、例えば特開平8−249419号公報に記載されている技術のように、図形領域内にある線分の黒画素数を、当該領域内で表を構成する線分と判定された線分の黒画素数で除して得た値により、複数の線分が表を表しているか否か判定してもよい。なお、複数の線分から表の領域を判定する技術は、特開平8−249419号公報に記載されている技術に限定されず、他の技術を採用してもよい。
(実施形態の動作)
以下、本実施形態の動作例について説明する。まず、ユーザが画像取得部108に接続されたスキャナに画像が描かれた紙をセットし、紙面の画像の読み取りを行わせると、紙面の画像を表す画像データがスキャナにおいて生成される。次に、ユーザが、スキャナで生成された画像データの取得を指示する操作を操作部106において行うと、画像取得部108がスキャナと通信を行い、スキャナで生成された画像データが取得されて記憶部105に記憶される。
また、ユーザが、画像処理プログラムの実行を指示する操作を操作部106において行うと、画像処理プログラムがCPU102により実行される。次に、記憶部105に記憶された画像データを指定し、この指定した画像データに対して画像処理を行うように指示する操作をユーザが操作部106において行うと、CPU102は、画像処理プログラムに従って図3に示した処理を実行する。
具体的には、まず、CPU102は、ユーザにより指定された画像データの画像を二値化する処理(ステップSA1)を行う。ここで、図4は、二値化処理により得られた画像の一例を示した図である。図4において画像G10は、グラフの画像であり、画像G11は、複数の線分で構成された表の画像である。また、画像G12の部分は、文字列の画像である。なお、ここで、CPU102は、画像データの画像を二値化しているため、二値化部200として機能している。
CPU102は、二値化処理が終了すると二値化画像を解析し、二値化画像中の図形の部分を特定する(ステップSA2)。例えば、図4の二値化画像の場合、画像G10と画像G11の部分が図形の部分として特定され、文字列の画像G12の部分は図形の部分として特定されないこととなる。CPU102は、二値化画像中の図形部分を特定すると、各図形部分を一意に識別する図形識別子を生成し、例えば、画像G10の部分に対して「1」、画像G11の部分に対して「2」という図形識別子を生成する。なお、ここでCPU102は、二値化画像中にある図形部分を特定しているため、図形特定部201として機能している。
次にCPU102は、二値化画像を走査し、特定した図形部分にある線分を特定し、各線分の座標を特定する(ステップSA3)。例えば、図4の二値化画像の場合、画像G10の部分からは、図において縦方向に描かれた線分L110〜L112と、図において横方向に描かれた線分L115〜L117とが特定される。また、画像G11の部分からは、図において縦方向に描かれた線分L120〜L122と、図において横方向に描かれた線分L125〜L127とが特定される。また、線分の座標としては、例えば、画像の左下隅を原点として、原点から横方向にx座標、原点から縦方向にy座標をとった場合の座標が特定される。なお、ここでCPU102は、図形部分にある線分の特定をしているため、線分特定部202として機能している。
CPU102は、各図形部分にある線分を特定すると、各線分を一意に示すラベル番号を各線分に付ける。そして、図形部分に付けられた図形識別子と、この図形識別子で特定される部分にある各線分のラベル番号、各線分の両端の座標を対応付け、RAM(Random Access Memory)104に設けられる線分テーブルTB10に格納する(ステップSA4)。ここで、図5は、線分テーブルTB10のフォーマットの一例である。線分テーブルTB10は、図形識別子、ラベル番号、線分の両端の座標、交差する他の線分のラベル番号の列を有している。
例えば、図形識別子が「1」である画像G10の部分について、線分L110が特定され、この線分の座標として(x1,y1)(x1,y2)が特定され、線分L110に対して「Li110」というラベル番号が生成されると、図示したように、図形識別子の「1」に対応付けて、ラベル番号「Li110」と、座標(x1,y1)(x1,y2)が格納される。
また、例えば、図形識別子が「2」である画像G11の部分について、線分L120が特定され、この線分の座標として(x11,y11)(x11,y12)が特定され、線分L120に対して「Li120」というラベル番号が生成されると、図示したように、図形識別子の「2」に対応付けて、ラベル番号「Li120」、座標(x11,y11)(x11,y12)が対応付けて格納される。
なお、本動作例においては、図4の画像の場合、図5に示したように、線分L111に対しては、ラベル番号「Li111」、線分L112に対しては、ラベル番号「Li112」が生成されている。また、線分L115に対しては、ラベル番号「Li115」、線分L116に対しては、ラベル番号「Li116」、線分L117に対しては、ラベル番号「Li117」が生成されている。また、本動作例においては、図4の画像の場合、図5に示したように、線分L121に対しては、ラベル番号「Li121」、線分L122に対しては、ラベル番号「Li122」が生成されている。また、線分L125に対しては、ラベル番号「Li125」、線分L126に対しては、ラベル番号「Li126」、線分L127に対しては、ラベル番号「Li127」が生成されている。
CPU102は、ステップSA4の処理が終了すると、ラベル番号が付けられた各線分を参照し、線分同士の交差関係を判定する(ステップSA5)。そして、一の線分に交差する他の線分のラベル番号を、線分テーブルTB10に格納する。つまり、ここでCPU102は、線分同士の交差関係を判定する交差判定部203として機能する。
例えば、図4の画像の場合、線分L110については、線分L115,L116,L117が交差しているため、線分L110のラベル番号「Li110」に対応付けて、線分L115〜L117のラベル番号であるLi115,Li116およびLi117が図5に示したように格納される。また、線分L120については、線分L125,L126,L127が交差するため、線分L120のラベル番号「Li120」に対応付けて、線分L125〜L127のラベル番号であるLi125,Li126およびLi127が図5に示したように格納される。
CPU102は、一の線分に交差する他の線分を特定し終えると、各線分の端部の形状を判定し、端部の形状が特定形状の線分を抽出する(ステップSA6)。例えば、図4の画像においては、線分L110の一方の端部は、矢印の形状となっている。CPU102は、このように端部の形状が予め定められた特定の矢印形状の線分(特定線分)については、表を構成する線分ではないものとして抽出する。また、線分L117についても、一方の端部は、矢印の形状となっているため、この線分は表を構成する線分ではないものとして抽出する。つまり、ここでCPU102は、特定線分抽出部204として機能する。なお、画像G11を構成する線分においては、各線分の外形はいずれも矩形であるため、各線分は表を構成する線分であると判定される。
なお、表を構成する線分ではない特定線分として抽出される線分は、端部の形状が矢印形状のものに限定されず、端部の幅が他の部分(例えば、線分の中点部分)の幅と異なる線分や、端部が複数本の線分に分岐した形状の線分、端部が円形や楕円形の線分、端部が他の部分より幅の広い多角形の形状となっている線分などの端部形状が特定形状の特定線分についても、特定線分として抽出してもよい。
次に、CPU102は、ステップSA6で特定線分として抽出された線分のラベル番号が格納されている行を、線分テーブルTB10から削除する(ステップSA7)。この結果、図5の線分テーブルTB10は、図6に示したように、図形識別子として「1」が格納されている行については、ラベル番号L110とラベル番号L117の行が削除されたものとなる。なお、本実施形態においては、交差する線分が無い線分のラベル番号が格納されている行を線分テーブルTB10から削除してもよい。
CPU102は、図6の線分テーブルTB10を得ると、この線分テーブルTB10に格納されている座標で特定される線分が表を構成しているか否か判定する(ステップSA8)。つまり、ここで、CPU102は、表領域判定部205として機能する。例えば、図形識別子が「1」である部分については、CPU102は、線分L111,L112,L115,L116の線分で表が構成されているか否かを判定する。
ここで、図形識別子が「1」である部分においては、この部分にある黒画素の数の総和は、線分L110〜112と線分L115〜L117を表す黒画素の総和である。また、当該部分で表を構成する線分と判定された線分の黒画素の数の総和は、線分L111,L112,L115,L116を表す黒画素の数の総和である。線分L111,L112,L115,L116を表す黒画素の数の総和を、線分L110〜112と線分L115〜L117を表す黒画素の数の総和で除して得られる値が、予め定められた閾値(例えば0.9)未満であると、CPU102は、図形識別子が「1」である部分については表領域ではないと判定する。なお、閾値を0.9としたのは一例であり、閾値は、他の値であってもよい。
一方、図形識別子が「2」である部分については、CPU102は、線分L120〜122,L125〜L127の線分で表が構成されているか否かを判定する。この場合、図形識別子が「2」である部分においては、この部分にある黒画素の数の総和は、線分L120〜122と線分L125〜L127を示す黒画素の数の総和である。また、当該領域内で表を構成する線分と判定された線分の黒画素の数の総和も、線分L120〜L122と、線分L125〜L127を示す黒画素数の総和である。
ここで図形領域内にある全線分の黒画素数を、当該領域内で表を構成する線分と判定された線分の黒画素数で除して得た値は、予め定められた閾値(例えば0.9)以上であるため、CPU102は、図形識別子が「2」である部分については表領域であると判定する。
CPU102は、二値化画像中の表の領域を判定すると、例えば、図7に示したように表と判定された領域、即ち、画像G11の部分を黒く塗りつぶした画像を表示部107に表示し、表と判定された領域をユーザに知らせる。なお、表と判定された領域をユーザに示す方法は、この方法に限定されるものではなく、例えば、表の領域を矩形で囲った画像を生成して表示するなど他の方法であってもよい。
以上説明したように本実施形態によれば、グラフのように表ではない領域は表と認識しないため、表の認識率を高めることができる。
[第2実施形態]
(実施形態の構成)
次に、本発明の第2実施形態に係るコンピュータ装置1について説明する。なお、本実施形態に係るコンピュータ装置1は、ハードウェア構成は第1実施形態と同じであり、CPU102により実行される画像処理プログラムと、画像処理プログラムを実行したCPU102が行う処理が第1実施形態と異なる。このため、以下、第1実施形態と同じであるハードウェア構成については説明を省略し、第1実施形態と異なる点について説明する。
図8は、本実施形態に係る画像処理プログラムをCPU102が実行したことにより実現する機能ブロックを示した図である。本実施形態においては、画像処理プログラムを実行すると、特定線分抽出部204に替えて、目盛り線判定部206が実現する。目盛り線判定部206は、グラフにおいて目盛りとなっている線を判定するブロックである。
(実施形態の動作)
まず、本実施形態においても、スキャナから画像取得部108によって画像データが取得され、画像処理プログラムを実行したCPU102により、取得された画像データから二値化画像が生成される(図9:ステップSA1)。ここで、図10は、二値化処理により得られた画像の一例を示した図である。図10において画像G20は、グラフの画像であり、グラフの目盛りを表す線分L141〜L148がある。
CPU102は、二値化処理が終了すると二値化画像を解析し、二値化画像中の図形の部分を特定する(ステップSA2)。次にCPU102は、二値化画像を走査し、特定した図形部分にある線分と、この線分の座標を特定する(ステップSA3)。例えば、図10の二値化画像の場合、画像G20の部分からは、図において縦方向に描かれた線分L130〜L132、横方向に描かれた線分L135〜L137、グラフの目盛りを表す線分L141〜L148が特定される。また、線分の座標としては、例えば、画像の左下隅を原点として、原点から横方向にx座標、原点から縦方向にy座標をとった場合の座標が特定される。
CPU102は、各図形部分にある線分を特定すると、各線分を一意に示すラベル番号を各線分に付ける。そして、図形部分に付けられた図形識別子と、この図形識別子で特定される部分にある線分のラベル番号、各線分の両端の座標を対応付け、RAM104に設けられる線分テーブルTB10に格納する(ステップSA4)。
なお、本動作例においては、図10の画像の場合、線分L130〜L132に対しては、ラベル番号「Li130」〜ラベル番号「Li132」が生成される。また、線分L135〜L137に対しては、ラベル番号「Li135」〜ラベル番号「Li137」が生成される。また線分L141〜L148に対しては、ラベル番号「Li141」〜ラベル番号「Li148」が生成される。
CPU102は、ステップSA4の処理が終了すると、ラベル番号が付けられた各線分を参照し、線分同士の交差関係を判定する(ステップSA5)。そして、一の線分に交差する他の線分のラベル番号を、線分テーブルTB10に格納する。これにより、図11に示した線分テーブルTB10が得られる。
CPU102は、一の線分に交差する他の線分を特定し終えると、目盛り線が交差している線分と目盛り線を特定する(ステップSA6A)。
具体的には、CPU102は、一の線分にしか交差していない線分が交差している線分を、目盛り線が交差している線分として特定する。また、一の線分にしか交差していない線分を目盛り線として特定する。
例えば、ラベル番号が「Li130」である線分L130については、交差する線分として、Li135〜Li137,Li141〜Li144のラベル番号の線分、つまり、線分L135〜L137および線分L141〜L144が交差している。交差する線分の各ラベル番号の行を線分テーブルTB10において見ると、Li141〜Li144の行においては、交差する線分がいずれも一つのみである。よって、CPU102は、ラベル番号が「Li130」である線分については、目盛り線が交差している線分として特定する。なお、CPU102は、ラベル番号が「Li137」である線分についても、目盛り線が交差していると判定する。また、CPU102は、ラベル番号がLi141〜Li148の線分については、一の線分にしか交差していないため、目盛り線として特定する。
次に、CPU102は、ステップSA6Aで目盛り線が交差している線分と特定された線分のラベル番号と、目盛り線と判定された線分のラベル番号が格納されている行を、線分テーブルTB10から削除する(ステップSA7A)。
ここで、図10の画像の場合、線分L141〜L148に対応するラベル番号「Li141」〜「Li148」が格納されている行が線分テーブルTB10から削除される。
また、線分L130に対応するラベル番号Li130が格納されている行と、線分L137に対応するラベル番号Li137が格納されている行が線分テーブルTB10から削除され、これにより、図12に示した線分テーブルTB10が得られる。なお、本実施形態においても、交差する線分が無い線分のラベル番号が格納されている行を線分テーブルTB10から削除してもよい。
CPU102は、ステップSA7Aの処理が終了すると、線分テーブルTB10に格納されている座標で特定される線分が表を構成しているか否か判定する(ステップSA8)。
ここで、画像G20の部分においては、この部分にある黒画素の数の総和は、線分L130〜132,線分L135〜L137,線分L141〜L148を表す黒画素の数の総和である。
また、当該部分で表を構成する線分と判定された線分の黒画素の数の総和は、線分L131,L132,L135,L136を表す黒画素の数の総和である。
線分L131,L132,L135,L136を表す黒画素の数の総和を、線分L130〜132,線分L135〜L137,線分L141〜L148を表す黒画素の数の総和で除して得られる値が、予め定められた閾値(例えば0.9)未満であると、CPU102は、図10に示した画像については表領域ではないと判定する。
以上説明したように本実施形態によれば、グラフのように表ではない領域は表と認識しないため、表の認識率を高めることができる。
[変形例]
以上、本発明の実施形態について説明したが、本発明は上述した実施形態に限定されることなく、他の様々な形態で実施可能である。例えば、上述の実施形態を以下のように変形して本発明を実施してもよい。なお、上述した実施形態及び以下の変形例は、各々を組み合わせてもよい。
上述した第1実施形態と第2実施形態を組み合わせ、画像処理プログラムを実行したCPU102は、図3の処理と図9の処理の両方を行うようにしてもよい。
上述した第1実施形態においては、端部の形状が矢印形状の線分を特定した場合、この特定した線分がある領域は表領域ではないと判定してもよい。
また、上述した第2実施形態においては、目盛り線が交差している線分を特定した場合、この特定した線分がある領域は表領域ではないと判定してもよい。
また、上述した実施形態においては、線分テーブルTB10に格納されている線分で矩形が形成されているか否か判定し、矩形の形成に関わっていない線分の行を線分テーブルTBから削除するようにしてもよい。例えば、図11に示した画像の場合、線分L160〜L163と、線分L164〜L167は、矩形を形成しているため、これらの線分のラベル番号と座標は画像テーブルTBに格納される。一方、線分L150〜L152については、矩形を形成していないため、これらの線分のラベル番号と座標は線分テーブルTB10から削除される。この結果、図11に示した画像については、CPU102は、線分L160〜L167が表を構成しているか否か判定する。
上述した実施形態においては、CPU102が画像処理プログラムを実行することにより、CPU102が画像データを処理し、画像データ中の表の領域を特定しているが、画像データの画像に上述した画像処理を施す構成は、この構成に限定されるものではない。例えば、上述した第1実施形態や第2実施形態の処理を行うDSP(Digital Signal Processor)やプログラマブルロジックデバイスなどのハードウェアをバス101に接続し、画像データを、このハードウェアに供給することにより、ハードウェアで第1実施形態や第2実施形態の処理を行うようにしてもよい。
上述した画像処理プログラムは、磁気記録媒体(磁気テープ、磁気ディスク(HDD(Hard Disk Drive)、FD(Flexible Disk))など)、光記録媒体(光ディスク(CD(Compact Disc)、DVD(Digital Versatile Disk))など)、光磁気記録媒体、半導体メモリなどのコンピュータ読取り可能な記録媒体に記憶した状態で提供し、コンピュータ装置1にインストールしてもよい。また、通信回線を介してダウンロードしてインストールしてもよい。
上述した実施形態においては、PCが画像処理プログラムを実行しているが、PC以外のコンピュータ装置が画像処理プログラムを実行してもよく、例えば、複写機能やスキャナの機能を有する画像形成装置が画像処理プログラムを実行し、上述した第1実施形態や第2実施形態の処理を画像形成装置が行うようにしてもよい。
1・・・コンピュータ装置、101・・・バス、102・・・CPU、103・・・ROM、104・・・RAM、105・・・記憶部、106・・・操作部、107・・・表示部、108・・・画像取得部、200・・・二値化部、201・・・図形特定部、202・・・線分特定部、203・・・交差判定部、204・・・特定線分抽出部、205・・・表領域判定部、206・・・目盛り線判定部

Claims (6)

  1. 画素値が第1値の第1画素と、画素値が第2値の第2画素とで表された二値化画像を取得する取得手段と、
    前記取得手段で取得された二値化画像中の図形部分を特定する図形特定手段と、
    前記図形特定手段で特定された部分にある線分を特定する線分特定手段と、
    前記線分特定手段で特定された線分の端部の形状が特定形状であるか否かを判定し、特定形状である場合に該線分を特定線分として抽出する特定線分抽出手段と、
    前記線分特定手段で特定された線分のうち前記特定線分抽出手段において抽出された特定線分以外の線分を用いて、前記図形特定手段で特定された図形部分が表領域であるか否か判定する表領域判定手段と
    を有する画像処理装置。
  2. 前記線分特定手段で特定された各線分の交差関係を判定する交差判定手段を有し、
    前記表領域判定手段は、前記特定線分として抽出された線分以外の線分のうち、前記交差判定手段において、他の線分と交差していると判定された線分を用いて、前記図形特定手段で特定された部分が表領域であるか否か判定すること
    を特徴とする請求項1に記載の画像処理装置。
  3. 画素値が第1値の第1画素と、画素値が第2値の第2画素とで表された二値化画像を取得する取得手段と、
    前記取得手段で取得された二値化画像中の図形部分を特定する図形特定手段と、
    前記図形特定手段で特定された部分にある線分を特定する線分特定手段と、
    前記線分特定手段で特定された線分のうち、目盛り線を判定する目盛り線判定手段と、
    前記線分特定手段で特定された各線分の交差関係を判定する交差判定手段と、
    前記線分特定手段で特定された線分のうち、前記目盛り線判定手段において目盛り線と判定された線分以外の線分であって、該目盛り線と判定された線分が交差している線分以外の線分を用いて、前記図形特定手段で特定された図形部分が表領域であるか否か判定する表領域判定手段と
    を有する画像処理装置。
  4. 前記表領域判定手段は、前記目盛り線と判定された線分が交差している線分以外の線分のうち、前記交差判定手段において、他の線分と交差していると判定された線分を用いて、前記図形特定手段で特定された部分が表領域であるか否か判定すること
    を特徴とする請求項3に記載の画像処理装置。
  5. コンピュータを、
    画素値が第1値の第1画素と、画素値が第2値の第2画素とで表された二値化画像を取得する取得手段と、
    前記取得手段で取得された二値化画像中の図形部分を特定する図形特定手段と、
    前記図形特定手段で特定された部分にある線分を特定する線分特定手段と、
    前記線分特定手段で特定された線分の端部の形状が特定形状であるか否かを判定し、特定形状である場合に該線分を特定線分として抽出する特定線分抽出手段と、
    前記線分特定手段で特定された線分のうち前記特定線分抽出手段において抽出された特定線分以外の線分を用いて、前記図形特定手段で特定された図形部分が表領域であるか否か判定する表領域判定手段
    として機能させるためのプログラム。
  6. コンピュータを、
    画素値が第1値の第1画素と、画素値が第2値の第2画素とで表された二値化画像を取得する取得手段と、
    前記取得手段で取得された二値化画像中の図形部分を特定する図形特定手段と、
    前記図形特定手段で特定された部分にある線分を特定する線分特定手段と、
    前記線分特定手段で特定された線分のうち、目盛り線を判定する目盛り線判定手段と、
    前記線分特定手段で特定された各線分の交差関係を判定する交差判定手段と、
    前記線分特定手段で特定された線分のうち、前記目盛り線判定手段において目盛り線と判定された線分以外の線分であって、該目盛り線と判定された線分が交差している線分以外の線分を用いて、前記図形特定手段で特定された図形部分が表領域であるか否か判定する表領域判定手段
    として機能させるためのプログラム。
JP2009163704A 2009-07-10 2009-07-10 画像処理装置およびプログラム Expired - Fee Related JP5267364B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009163704A JP5267364B2 (ja) 2009-07-10 2009-07-10 画像処理装置およびプログラム
US12/702,707 US8483482B2 (en) 2009-07-10 2010-02-09 Image processing device, image processing method and computer-readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009163704A JP5267364B2 (ja) 2009-07-10 2009-07-10 画像処理装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2011018274A JP2011018274A (ja) 2011-01-27
JP5267364B2 true JP5267364B2 (ja) 2013-08-21

Family

ID=43427512

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009163704A Expired - Fee Related JP5267364B2 (ja) 2009-07-10 2009-07-10 画像処理装置およびプログラム

Country Status (2)

Country Link
US (1) US8483482B2 (ja)
JP (1) JP5267364B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679024B (zh) * 2017-09-11 2023-04-18 畅捷通信息技术股份有限公司 识别表格的方法、系统、计算机设备、可读存储介质
CN108470350B (zh) * 2018-02-26 2021-08-24 阿博茨德(北京)科技有限公司 折线图中的折线分割方法及装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2890306B2 (ja) 1988-07-12 1999-05-10 富士ゼロックス株式会社 表領域分離装置および表領域分離方法
JP2890317B2 (ja) 1989-09-18 1999-05-10 富士ゼロックス株式会社 文字/図形分離装置
JPH0481071A (ja) * 1990-07-20 1992-03-13 Ricoh Co Ltd デジタル複写装置
JP3068131B2 (ja) * 1995-02-03 2000-07-24 富士ゼロックス株式会社 文書処理装置
JPH08249419A (ja) 1995-03-10 1996-09-27 Fuji Xerox Co Ltd 表領域判定装置
WO1997005561A1 (fr) * 1995-07-31 1997-02-13 Fujitsu Limited Processeur de supports et procede de traitement de supports
JP4040046B2 (ja) * 2003-03-14 2008-01-30 富士通株式会社 ポインタ領域検出装置、方法及びプログラム、画像の対応付け装置、方法及びプログラム、並びにコンテンツ配信サーバ、コンテンツ配信方法
JP2005190094A (ja) 2003-12-25 2005-07-14 Hitachi Ltd 図面編集方法および装置
JP4628278B2 (ja) 2006-02-08 2011-02-09 富士通株式会社 表認識装置、及びコンピュータプログラム
JP4569622B2 (ja) * 2007-12-18 2010-10-27 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP5206525B2 (ja) * 2009-03-19 2013-06-12 富士ゼロックス株式会社 画像処理装置、画像読取装置、画像形成装置及びプログラム

Also Published As

Publication number Publication date
US20110007972A1 (en) 2011-01-13
US8483482B2 (en) 2013-07-09
JP2011018274A (ja) 2011-01-27

Similar Documents

Publication Publication Date Title
JP2019515374A (ja) 画像内の文字領域を認識するための方法及び装置
JP3950777B2 (ja) 画像処理方法、画像処理装置および画像処理プログラム
JP2011081556A (ja) 情報処理装置、情報処理方法、プログラムおよびサーバ
TW201020970A (en) Pixel region-based image segmentation method and system
JP5267364B2 (ja) 画像処理装置およびプログラム
JP2012194879A (ja) 情報処理装置、情報処理方法及びプログラム
JP2010123002A (ja) 文書画像レイアウト装置
JP5182902B2 (ja) 文書イメージ出力装置
JP2011081557A (ja) 情報処理装置、情報処理方法およびプログラム
JP2007156741A (ja) 文字抽出方法、文字抽出装置およびプログラム
JP4868139B2 (ja) 画像処理装置及び画像処理プログラム
JP5418064B2 (ja) 画像処理装置およびプログラム
JP5159588B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2015215637A (ja) 画像形成装置、画像処理装置およびプログラム
JP2018137509A (ja) 画像処理装置、画像読み取り装置、および、プログラム
JP2003046746A (ja) 画像処理方法及び画像処理装置
JP2007295210A (ja) 画像処理装置、画像処理方法、画像処理プログラム、およびこれを記録した記録媒体
JP6294572B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP2006277149A (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP6056309B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2009193170A (ja) 文字認識装置及び文字認識方法
JP4890425B2 (ja) マンガのコマ画像のためのマスク画像の作成方法及びプログラム
JP2011018997A (ja) 画像処理装置およびプログラム
JP4738645B2 (ja) 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体
JP4241820B2 (ja) 文字認識方法および文字認識システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120620

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130312

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130409

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130422

R150 Certificate of patent or registration of utility model

Ref document number: 5267364

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees