JP2009070242A - 領域分割方法及び装置、並びにプログラム - Google Patents
領域分割方法及び装置、並びにプログラム Download PDFInfo
- Publication number
- JP2009070242A JP2009070242A JP2007239484A JP2007239484A JP2009070242A JP 2009070242 A JP2009070242 A JP 2009070242A JP 2007239484 A JP2007239484 A JP 2007239484A JP 2007239484 A JP2007239484 A JP 2007239484A JP 2009070242 A JP2009070242 A JP 2009070242A
- Authority
- JP
- Japan
- Prior art keywords
- region
- area
- user
- extracting
- extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Input (AREA)
Abstract
【解決手段】ステップS1で文書を読み取って画像入力を行い、ステップS2で文書の画像を表示する。ステップS3で、識別したい領域の一部をポインティングデバイスによりおおまかに指定し、ステップS4で指定領域を表示する。ステップS5でユーザー指定領域をCPU2で扱いやすい領域に変換し、ステップS6でユーザー指定領域の内部の情報抽出を行う。ステップS7でその情報を利用して領域分割を行い、ステップS8で領域分割の結果を表示する。
【選択図】 図2
Description
請求項2の発明は、請求項1記載の領域分割方法において、前記抽出を行う工程は、前記ユーザー指定領域の内部及び近接している周辺の情報を抽出する特徴抽出工程と、該抽出された情報に基づいて、前記ユーザー指定領域を文字候補、表候補、図又は写真候補に分類する属性分類工程と、分類された各候補に応じた領域抽出処理を行う工程とを有することを特徴とする。
請求項3の発明は、請求項1記載の領域分割方法において、前記抽出を行う工程は、前記一部の領域の内部及び近接している周辺の情報を抽出する特徴抽出工程と、該抽出された情報に基づいて、前記ユーザー指定領域の位置情報を探索するのに、2つ以上の領域分割手法から適当な手法を割り当て、領域抽出処理を行う工程とを有することを特徴とする。
請求項4の発明は、請求項2記載の領域分割方法において、前記特徴抽出工程は、二値画像から黒画素或いは白画素の連結成分矩形を抽出する矩形抽出工程と、罫線を抽出する罫線抽出工程とを有し、前記属性分類工程は、これらの抽出結果から予め定められた特徴量空間のどのカテゴリに最も近いかで属性の分類結果を得ることを特徴とする。
請求項5の発明は、請求項2記載の領域分割方法において、前記領域抽出処理を行う工程は、前記属性分類工程にて表候補となった領域に対して、ユーザー指定領域に含まれる画素の連結成分から連結がなくなる位置まで成長させ、最大の連結矩形である領域をユーザー指定の表領域とすることを特徴とする。
請求項6の発明は、請求項2記載の領域分割方法において、前記領域抽出処理を行う工程は、前記属性分類工程にて表候補となった領域に対して、ユーザー指定領域に含まれる罫線、及び近接している罫線を抽出する罫線抽出工程と、それらの罫線と連結しているとみなせる罫線を抽出する罫線連結判定工程と、前記罫線連結判定工程により罫線が連結しているとみなされた罫線が存在する範囲を取得する連結罫線領域抽出工程とを有し、該連結罫線領域抽出工程によって得られた領域をユーザー指定の表領域とすることを特徴とする。
請求項7の発明は、領域分割装置のコンピュータに、請求項1〜6のいずれかに記載された領域分割方法の各工程を実行させるためのプログラムである。
請求項8の発明は、請求項7記載のプログラムがインストールされたコンピュータを有する領域分割装置である。
本発明によれば、ユーザーは、表示されている文書画像の識別対象領域の一部の領域をおおまかに指定し、領域分割装置が、その一部の領域内の画像情報に基づいて、識別対象領域の抽出を行う。
[第1の実施形態]
図1は本発明の第1の実施形態の領域分割装置の構成を示す概略ブロック図である。この領域分割装置は、領域分割処理をマイクロプロセッサ等のデジタル処理により実行し得るように構成したものである。
まずステップS1で画像入力を行う。ここでは、図3に示すサンプル文書11をスキャナ1にセットする。スキャナ1から出力されたサンプル文書11の文書画像データは、ステップS2でディスプレイ4に送られ、サンプル文書11の画像が表示される。
図6は本発明の第2の実施形態の領域分割装置の動作を示すフローチャートである。この図において、図2と同一又は対応するステップには、図2と同じ符号を付した。なお、本実施形態及び後述する第3乃至第5の実施形態の領域分割装置の概略構成のブロック図は第1の実施形態(図1)と同じである。さらに、本実施形態及び後述する第3乃至第5の実施形態にて、スキャナ1から読み取る文書も第1の実施形態と同じサンプル文書11であり、ユーザー指定領域も第1の実施形態と同じ、丸12である。
まずステップS21でユーザー指定領域の画像データを入力し、次いでステップS22で画像データを二値化する。ただし、ユーザー指定領域の画像データが二値である場合、この二値化処理は行わない。
図8に示すように、ユーザー指定領域内に4本ずつの横罫線21及び縦罫線22からなる表の一部が存在し、それらの罫線により区画された9個(横3個×縦3個)のセルのうち、上段のセルに文字「XXX」、「YYY」、「ZZZ」が記入されているものとする。
図11は本発明の第3の実施形態の領域分割装置の動作を示すフローチャートである。この図において、図6(第2の実施形態)と同一又は対応するステップには図6と同じ符号を付した。
図13は本発明の第4の実施形態の領域分割装置の動作を示すフローチャートである。この図において、図6(第2の実施形態)と同一又は対応するステップには図6と同じ符号を付した。
ステップS31で文書画像データをワークエリアRAM8に読み込み、ステップS32で文書画像の全面から前景色で罫線抽出を行う。この罫線抽出の方法は、ハフ変換を利用するものや画素連続(ランと呼ぶ)のうち、閾値以上の長いものだけを利用して連結成分を求めることで罫線候補を作成するなど、既存のものを利用して構わない。
図16は本発明の第5の実施形態の領域分割装置の動作を説明するための図である。本実施形態の領域分割装置の基本的な動作のフローは図6(第2の実施形態)と同じであり、分類結果(ステップS11の属性判別)で表と判定されたときの、領域範囲の求め方(ステップS12に対応)についての発明である。
Claims (8)
- 文書画像を表示する工程と、ユーザーにより指定された、表示されている文書画像の分割対象領域の一部であるユーザー指定領域の位置情報を取得する工程と、前記ユーザー指定領域中の文書画像データに基づいて、前記分割対象領域の抽出を行う工程とを有することを特徴とする領域分割方法。
- 請求項1記載の領域分割方法において、
前記抽出を行う工程は、前記ユーザー指定領域の内部及び近接している周辺の情報を抽出する特徴抽出工程と、該抽出された情報に基づいて、前記ユーザー指定領域を文字候補、表候補、図又は写真候補に分類する属性分類工程と、分類された各候補に応じた領域抽出処理を行う工程とを有することを特徴とする領域分割方法。 - 請求項1記載の領域分割方法において、
前記抽出を行う工程は、前記一部の領域の内部及び近接している周辺の情報を抽出する特徴抽出工程と、該抽出された情報に基づいて、前記ユーザー指定領域の位置情報を探索するのに、2つ以上の領域分割手法から適当な手法を割り当て、領域抽出処理を行う工程とを有することを特徴とする領域分割方法。 - 請求項2記載の領域分割方法において、
前記特徴抽出工程は、二値画像から黒画素或いは白画素の連結成分矩形を抽出する矩形抽出工程と、罫線を抽出する罫線抽出工程とを有し、前記属性分類工程は、これらの抽出結果から予め定められた特徴量空間のどのカテゴリに最も近いかで属性の分類結果を得ることを特徴とする領域分割方法。 - 請求項2記載の領域分割方法において、
前記領域抽出処理を行う工程は、前記属性分類工程にて表候補となった領域に対して、ユーザー指定領域に含まれる画素の連結成分から連結がなくなる位置まで成長させ、最大の連結矩形である領域をユーザー指定の表領域とすることを特徴とする領域分割方法。 - 請求項2記載の領域分割方法において、
前記領域抽出処理を行う工程は、前記属性分類工程にて表候補となった領域に対して、ユーザー指定領域に含まれる罫線、及び近接している罫線を抽出する罫線抽出工程と、それらの罫線と連結しているとみなせる罫線を抽出する罫線連結判定工程と、前記罫線連結判定工程により罫線が連結しているとみなされた罫線が存在する範囲を取得する連結罫線領域抽出工程とを有し、該連結罫線領域抽出工程によって得られた領域をユーザー指定の表領域とすることを特徴とする領域分割方法。 - 領域分割装置のコンピュータに、請求項1〜6のいずれかに記載された領域分割方法の各工程を実行させるためのプログラム。
- 請求項7記載のプログラムがインストールされたコンピュータを有する領域分割装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007239484A JP4974367B2 (ja) | 2007-09-14 | 2007-09-14 | 領域分割方法及び装置、並びにプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007239484A JP4974367B2 (ja) | 2007-09-14 | 2007-09-14 | 領域分割方法及び装置、並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009070242A true JP2009070242A (ja) | 2009-04-02 |
JP4974367B2 JP4974367B2 (ja) | 2012-07-11 |
Family
ID=40606404
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007239484A Expired - Fee Related JP4974367B2 (ja) | 2007-09-14 | 2007-09-14 | 領域分割方法及び装置、並びにプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4974367B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012181708A (ja) * | 2011-03-01 | 2012-09-20 | Ubiquitous Entertainment Inc | スプレッドシート制御プログラム、スプレッドシート制御装置及びスプレッドシートの制御方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01196657A (ja) * | 1988-02-01 | 1989-08-08 | Nippon Telegr & Teleph Corp <Ntt> | 文書構造認識方法 |
JPH0363882A (ja) * | 1989-08-02 | 1991-03-19 | Fuji Xerox Co Ltd | 画像処理装置 |
JPH03204781A (ja) * | 1990-01-08 | 1991-09-06 | Ricoh Co Ltd | 領域指定方法および領域指定装置 |
JPH06131111A (ja) * | 1992-10-22 | 1994-05-13 | Matsushita Electric Ind Co Ltd | 文字認識装置及び文字認識方法 |
JPH0737036A (ja) * | 1993-06-25 | 1995-02-07 | Ricoh Co Ltd | 矩形分類方法 |
JPH0822507A (ja) * | 1994-07-08 | 1996-01-23 | Matsushita Electric Ind Co Ltd | 文書認識装置 |
JPH09128479A (ja) * | 1995-11-01 | 1997-05-16 | Ricoh Co Ltd | 領域分割方法及び領域分割装置 |
JP2001216468A (ja) * | 2000-02-03 | 2001-08-10 | Oki Electric Ind Co Ltd | 文字認識装置 |
JP2006227768A (ja) * | 2005-02-16 | 2006-08-31 | Hitachi Omron Terminal Solutions Corp | 携帯端末における文字認識のための方法およびプログラム |
-
2007
- 2007-09-14 JP JP2007239484A patent/JP4974367B2/ja not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01196657A (ja) * | 1988-02-01 | 1989-08-08 | Nippon Telegr & Teleph Corp <Ntt> | 文書構造認識方法 |
JPH0363882A (ja) * | 1989-08-02 | 1991-03-19 | Fuji Xerox Co Ltd | 画像処理装置 |
JPH03204781A (ja) * | 1990-01-08 | 1991-09-06 | Ricoh Co Ltd | 領域指定方法および領域指定装置 |
JPH06131111A (ja) * | 1992-10-22 | 1994-05-13 | Matsushita Electric Ind Co Ltd | 文字認識装置及び文字認識方法 |
JPH0737036A (ja) * | 1993-06-25 | 1995-02-07 | Ricoh Co Ltd | 矩形分類方法 |
JPH0822507A (ja) * | 1994-07-08 | 1996-01-23 | Matsushita Electric Ind Co Ltd | 文書認識装置 |
JPH09128479A (ja) * | 1995-11-01 | 1997-05-16 | Ricoh Co Ltd | 領域分割方法及び領域分割装置 |
JP2001216468A (ja) * | 2000-02-03 | 2001-08-10 | Oki Electric Ind Co Ltd | 文字認識装置 |
JP2006227768A (ja) * | 2005-02-16 | 2006-08-31 | Hitachi Omron Terminal Solutions Corp | 携帯端末における文字認識のための方法およびプログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012181708A (ja) * | 2011-03-01 | 2012-09-20 | Ubiquitous Entertainment Inc | スプレッドシート制御プログラム、スプレッドシート制御装置及びスプレッドシートの制御方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4974367B2 (ja) | 2012-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8428356B2 (en) | Image processing device and image processing method for generating electronic document with a table line determination portion | |
JP5455038B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP5616308B2 (ja) | 文字の形状特徴を使用した文字比較による文書改変検知方法 | |
JP5337563B2 (ja) | 帳票認識方法および装置 | |
JP2005073015A (ja) | 画像処理装置及び画像処理方法及びコンピュータプログラム | |
KR101248449B1 (ko) | 정보 처리 장치, 정보 처리 방법 및 컴퓨터 판독 가능한 기억 매체 | |
JP2002015280A (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
US20190057276A1 (en) | Image analysis apparatus, image analysis method, and non-transitory computer readable medium | |
JP2009251872A (ja) | 情報処理装置及び情報処理プログラム | |
JP2010074342A (ja) | 画像処理装置、画像形成装置、及びプログラム | |
JP4780184B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP4998176B2 (ja) | 翻訳装置及びプログラム | |
JP4974367B2 (ja) | 領域分割方法及び装置、並びにプログラム | |
JP2017174031A (ja) | 画像処理装置及び画像処理プログラム | |
JP7301529B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP2007081882A (ja) | 原稿読取装置および原稿読取方法 | |
JP5109548B2 (ja) | 画像処理装置及びプログラム | |
JP2019195117A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP4866184B2 (ja) | 画像処理装置、画像方向判別方法、および画像方向判別プログラム | |
JP2006268180A (ja) | 画像処理システム | |
JP2006072839A (ja) | 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体 | |
JP6613625B2 (ja) | 画像処理プログラム、画像処理装置、及び画像処理方法 | |
JP4810995B2 (ja) | 画像処理装置、方法及びプログラム | |
JP7520605B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP2007011528A (ja) | Ocr処理における認識対象項目の位置探索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100406 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110825 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110830 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111019 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120406 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120409 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4974367 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150420 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |