JP2007213255A - 表認識装置、及びコンピュータプログラム - Google Patents
表認識装置、及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2007213255A JP2007213255A JP2006031581A JP2006031581A JP2007213255A JP 2007213255 A JP2007213255 A JP 2007213255A JP 2006031581 A JP2006031581 A JP 2006031581A JP 2006031581 A JP2006031581 A JP 2006031581A JP 2007213255 A JP2007213255 A JP 2007213255A
- Authority
- JP
- Japan
- Prior art keywords
- candidate
- combination
- evaluation value
- areas
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
【解決手段】画像に含まれる表を構成する領域を、画像から抽出された罫線に基づいて認識する。表を含む画像を取得し、取得した画像から抽出された罫線で囲まれた閉領域として構成される複数の候補領域を、罫線の縦横方向に沿って設定してあるx−y座標系にて特定し、特定された前記候補領域の頂点の二次元座標値に基づいて、互いに隣接する候補領域の組み合わせ候補及び離れている候補領域の組み合わせ候補を選定する。組み合わせ候補ごとに、候補領域の組み合わせが表を構成する可能性の度合を示す評価値を算出し、算出した評価値に基づいて組み合わせ候補を選択して表を構成して出力する。
【選択図】図2
Description
図1は、本発明の実施の形態1に係る表認識装置1の構成を示すブロック図である。表認識装置1は、装置全体を制御するCPU等の制御手段11、本発明の実施の形態1に係る表認識装置1で実行可能なコンピュータプログラム101及びデータ等の各種情報を記録したCD−ROM等の記録媒体102から各種情報を読み取るCD−ROMドライブ等の補助記憶手段12、補助記憶手段12により読み取った各種情報を記録するハードディスク等の記録手段13を備えている。そして記録手段13から本発明に係るコンピュータプログラム101及びデータ等の各種情報を読み取り、情報を一時的に記憶するRAM等の記憶手段14に記憶させてコンピュータプログラム101に含まれる各種手順を制御手段11により実行することで、コンピュータは、本発明に係る表認識装置1として動作する。
以下、本発明の実施の形態2に係る表認識装置1について図面を参照しながら説明する。実施の形態2に係る表認識装置1の構成は、実施の形態1と同様であることから、同一の符号を付することで詳細な説明を省略する。本実施の形態2では、セル領域を探索する領域を限定し、候補領域の組み合わせ候補の数を減少させることにより、セル領域の候補領域の最適な組み合わせ候補を、より効率的に求めることができる点で実施の形態1と相違する。
以下、本発明の実施の形態3に係る表認識装置1について図面を参照しながら説明する。実施の形態3に係る表認識装置1の構成は、実施の形態1と同様であることから、同一の符号を付することで詳細な説明を省略する。本実施の形態3では、セル領域が確定していない領域のみ候補領域の組み合わせ候補を生成する点で実施の形態1と相違する。
以下、本発明の実施の形態4に係る表認識装置1について図面を参照しながら説明する。実施の形態4に係る表認識装置1の構成は、実施の形態1と同様であることから、同一の符号を付することで詳細な説明を省略する。本実施の形態4では、セル領域の候補領域が隣接しているか、重複しているか、離れているかについて、実施の形態1で用いた格子テーブルを利用する点に特徴を有する。
画像に含まれる表を構成する領域を、画像から抽出された罫線に基づいて認識する表認識装置において、
表を含む画像を取得する画像取得手段と、
取得した画像から抽出された罫線で囲まれた閉領域として構成される複数の候補領域を、罫線の縦横方向に沿って設定してあるx−y座標系にて特定する候補領域特定手段と、
特定された前記候補領域の頂点の二次元座標値に基づいて、互いに隣接する候補領域の組み合わせ候補及び離れている候補領域の組み合わせ候補を選定する組み合わせ候補選定手段と、
組み合わせ候補ごとに、候補領域の組み合わせが表を構成する可能性の度合を示す評価値を算出する評価値算出手段と、
算出した評価値に基づいて組み合わせ候補を選択して表を構成して出力する表構成出力手段と
を備えることを特徴とする表認識装置。
前記候補領域が矩形であるか否かを判定する手段を備え、
該手段で矩形であると判定された場合、矩形でないと判定された場合より評価値を高く算出するようにしてあることを特徴とする付記1記載の表認識装置。
前記組み合わせ候補に係る隣り合う候補領域の形状及びサイズが同一であるか否かを判定する手段を備え、
該手段で同一であると判定された場合、同一でないと判定された場合より評価値を高く算出するようにしてあることを特徴とする付記1又は2記載の表認識装置。
前記組み合わせ候補選定手段は、
画像の上方からy座標ごとに前記候補領域の組み合わせ候補を選定するようにしてあり、
前記評価値算出手段は、
既に選択された組み合わせ候補を記憶手段に記憶しておき、
既に組み合わせ候補を選定した領域と未だ選定していない領域とを区分する探索境界を設定し、設定された探索境界で特定された候補領域の集合が互いに一致するか否かを判定し、
一致すると判定された場合には、一致した候補領域の集合を含む複数の組み合わせ候補ごとに前記評価値を算出するようにしてあり、
前記表構成手段は、算出された評価値が最大である組み合わせ候補以外の組み合わせ候補を前記記憶手段から削除した後、組み合わせ候補を選択するようにしてあることを特徴とする付記1乃至3のいずれか一項に記載の表認識装置。
前記組み合わせ候補選定手段により選定された組み合わせ候補が単一である領域と複数である領域とに分離し、
複数である領域のみ、前記評価値算出手段により算出した評価値に基づいて組み合わせ候補を選択するようにしてあることを特徴とする付記1乃至3のいずれか一項に記載の表認識装置。
縦横の罫線で区切った矩形領域の集合として前記候補領域を特定する手段と、
2つの候補領域間で同一の矩形領域を含むか否かを判断する手段と
を備え、
該手段で同一の矩形領域を含むと判断された場合、該2つの矩形領域を互いに隣接する候補領域の組み合わせ候補として選定するようにしてあることを特徴とする付記1乃至3のいずれか一項に記載の表認識装置。
縦方向の罫線のx座標値が所定の範囲内である縦罫線を1つの縦罫線グループとしてグループ化する縦方向グループ化手段と、
横方向の罫線のy座標値が所定の範囲内である横罫線を1つの横罫線グループとしてグループ化する横方向グループ化手段と、
前記縦罫線グループと前記横罫線グループとが交差する領域を前記矩形領域として特定する手段と
を備えることを特徴とする付記6記載の表認識装置。
画像に含まれる表を構成する領域を、画像から抽出された罫線に基づいて認識する表認識方法において、
表を含む画像を取得し、
取得した画像から抽出された罫線で囲まれた閉領域として構成される複数の候補領域を、罫線の縦横方向に沿って設定してあるx−y座標系にて特定し、
特定された前記候補領域の頂点の二次元座標値に基づいて、互いに隣接する候補領域の組み合わせ候補及び離れている候補領域の組み合わせ候補を選定し、
組み合わせ候補ごとに、候補領域の組み合わせが表を構成する可能性の度合を示す評価値を算出し、
算出した評価値に基づいて組み合わせ候補を選択して表を構成して出力することを特徴とする表認識方法。
前記候補領域が矩形であるか否かを判定し、
矩形であると判定された場合、矩形でないと判定された場合より評価値を高く算出することを特徴とする付記8記載の表認識方法。
前記組み合わせ候補に係る隣り合う候補領域の形状及びサイズが同一であるか否かを判定し、
同一であると判定された場合、同一でないと判定された場合より評価値を高く算出することを特徴とする付記8又は9記載の表認識方法。
画像の上方からy座標ごとに前記候補領域の組み合わせ候補を選定し、
既に選択された組み合わせ候補を記憶手段に記憶し、
既に組み合わせ候補を選定した領域と未だ選定していない領域とを区分する探索境界を設定し、設定された探索境界で特定された候補領域の集合が互いに一致するか否かを判定し、
一致すると判定された場合には、一致した候補領域の集合を含む複数の組み合わせ候補ごとに前記評価値を算出し、
算出された評価値が最大である組み合わせ候補以外の組み合わせ候補を前記記憶手段から削除した後、組み合わせ候補を選択することを特徴とする付記8乃至10のいずれか一項に記載の表認識方法。
選定された組み合わせ候補が単一である領域と複数である領域とに分離し、
複数である領域のみ、前記評価値算出手段により算出した評価値に基づいて組み合わせ候補を選択することを特徴とする付記8乃至10のいずれか一項に記載の表認識方法。
縦横の罫線で区切った矩形領域の集合として前記候補領域を特定し、
2つの候補領域間で同一の矩形領域を含むか否かを判断し、
同一の矩形領域を含むと判断された場合、該2つの矩形領域を互いに隣接する候補領域の組み合わせ候補として選定することを特徴とする付記8乃至10のいずれか一項に記載の表認識方法。
縦方向の罫線のx座標値が所定の範囲内である縦罫線を1つの縦罫線グループとしてグループ化し、
横方向の罫線のy座標値が所定の範囲内である横罫線を1つの横罫線グループとしてグループ化し、
前記縦罫線グループと前記横罫線グループとが交差する領域を前記矩形領域として特定することを特徴とする付記13記載の表認識方法。
画像に含まれる表を構成する領域を、画像から抽出された罫線に基づいて認識するコンピュータで実行することが可能なコンピュータプログラムにおいて、
前記コンピュータを、
表を含む画像を取得する画像取得手段、
取得した画像から抽出された罫線で囲まれた閉領域として構成される複数の候補領域を、罫線の縦横方向に沿って設定してあるx−y座標系にて特定する候補領域特定手段、
特定された前記候補領域の頂点の二次元座標値に基づいて、互いに隣接する候補領域の組み合わせ候補及び離れている候補領域の組み合わせ候補を選定する組み合わせ候補選定手段、
組み合わせ候補ごとに、候補領域の組み合わせが表を構成する可能性の度合を示す評価値を算出する評価値算出手段、及び
算出した評価値に基づいて組み合わせ候補を選択して表を構成して出力する表構成出力手段
として機能させることを特徴とするコンピュータプログラム。
前記コンピュータを、
前記候補領域が矩形であるか否かを判定する手段、及び
該手段で矩形であると判定された場合、矩形でないと判定された場合より評価値を高く算出する手段
として機能させることを特徴とする付記15記載のコンピュータプログラム。
前記コンピュータを、
前記組み合わせ候補に係る隣り合う候補領域の形状及びサイズが同一であるか否かを判定する手段、及び
該手段で同一であると判定された場合、同一でないと判定された場合より評価値を高く算出する手段
として機能させることを特徴とする付記15又は16記載のコンピュータプログラム。
前記コンピュータを、
画像の上方からy座標ごとに前記候補領域の組み合わせ候補を選定する手段、
既に選択された組み合わせ候補を記憶手段に記憶する手段、
既に組み合わせ候補を選定した領域と未だ選定していない領域とを区分する探索境界を設定する手段、
設定された探索境界で特定された候補領域の集合が互いに一致するか否かを判定する手段、
該手段で一致すると判定された場合には、一致した候補領域の集合を含む複数の組み合わせ候補ごとに前記評価値を算出する手段、及び
算出された評価値が最大である組み合わせ候補以外の組み合わせ候補を前記記憶手段から削除した後、組み合わせ候補を選択する手段
として機能させることを特徴とする付記15乃至17のいずれか一項に記載のコンピュータプログラム。
前記コンピュータを、
前記組み合わせ候補選定手段により選定された組み合わせ候補が単一である領域と複数である領域とに分離する手段、及び
複数である領域のみ、前記評価値算出手段により算出した評価値に基づいて組み合わせ候補を選択する手段
として機能させることを特徴とする付記15乃至17のいずれか一項に記載のコンピュータプログラム。
前記コンピュータを、
縦横の罫線で区切った矩形領域の集合として前記候補領域を特定する手段、
2つの候補領域間で同一の矩形領域を含むか否かを判断する手段、及び
該手段で同一の矩形領域を含むと判断された場合、該2つの矩形領域を互いに隣接する候補領域の組み合わせ候補として選定する手段
として機能させることを特徴とする付記15乃至17のいずれか一項に記載のコンピュータプログラム。
前記コンピュータを、
縦方向の罫線のx座標値が所定の範囲内である縦罫線を1つの縦罫線グループとしてグループ化する縦方向グループ化手段、
横方向の罫線のy座標値が所定の範囲内である横罫線を1つの横罫線グループとしてグループ化する横方向グループ化手段、及び
前記縦罫線グループと前記横罫線グループとが交差する領域を前記矩形領域として特定する手段
として機能させることを特徴とする付記20記載のコンピュータプログラム。
11 制御手段
14 記憶手段
18 画像入力手段
101 コンピュータプログラム
102 記録媒体
Claims (5)
- 画像に含まれる表を構成する領域を、画像から抽出された罫線に基づいて認識する表認識装置において、
表を含む画像を取得する画像取得手段と、
取得した画像から抽出された罫線で囲まれた閉領域として構成される複数の候補領域を、罫線の縦横方向に沿って設定してあるx−y座標系にて特定する候補領域特定手段と、
特定された前記候補領域の頂点の二次元座標値に基づいて、互いに隣接する候補領域の組み合わせ候補及び離れている候補領域の組み合わせ候補を選定する組み合わせ候補選定手段と、
組み合わせ候補ごとに、候補領域の組み合わせが表を構成する可能性の度合を示す評価値を算出する評価値算出手段と、
算出した評価値に基づいて組み合わせ候補を選択して表を構成して出力する表構成出力手段と
を備えることを特徴とする表認識装置。 - 前記候補領域が矩形であるか否かを判定する手段を備え、
該手段で矩形であると判定された場合、矩形でないと判定された場合より評価値を高く算出するようにしてあることを特徴とする請求項1記載の表認識装置。 - 前記組み合わせ候補に係る隣り合う候補領域の形状及びサイズが同一であるか否かを判定する手段を備え、
該手段で同一であると判定された場合、同一でないと判定された場合より評価値を高く算出するようにしてあることを特徴とする請求項1又は2記載の表認識装置。 - 前記組み合わせ候補選定手段は、
画像の上方からy座標ごとに前記候補領域の組み合わせ候補を選定するようにしてあり、
前記評価値算出手段は、
既に選択された組み合わせ候補を記憶手段に記憶しておき、
既に組み合わせ候補を選定した領域と未だ選定していない領域とを区分する探索境界を設定し、設定された探索境界で特定された候補領域の集合が互いに一致するか否かを判定し、
一致すると判定された場合には、一致した候補領域の集合を含む複数の組み合わせ候補ごとに前記評価値を算出するようにしてあり、
前記表構成手段は、算出された評価値が最大である組み合わせ候補以外の組み合わせ候補を前記記憶手段から削除した後、組み合わせ候補を選択するようにしてあることを特徴とする請求項1乃至3のいずれか一項に記載の表認識装置。 - 画像に含まれる表を構成する領域を、画像から抽出された罫線に基づいて認識するコンピュータで実行することが可能なコンピュータプログラムにおいて、
前記コンピュータを、
表を含む画像を取得する画像取得手段、
取得した画像から抽出された罫線で囲まれた閉領域として構成される複数の候補領域を、罫線の縦横方向に沿って設定してあるx−y座標系にて特定する候補領域特定手段、
特定された前記候補領域の頂点の二次元座標値に基づいて、互いに隣接する候補領域の組み合わせ候補及び離れている候補領域の組み合わせ候補を選定する組み合わせ候補選定手段、
組み合わせ候補ごとに、候補領域の組み合わせが表を構成する可能性の度合を示す評価値を算出する評価値算出手段、及び
算出した評価値に基づいて組み合わせ候補を選択して表を構成して出力する表構成出力手段
として機能させることを特徴とするコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006031581A JP4628278B2 (ja) | 2006-02-08 | 2006-02-08 | 表認識装置、及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006031581A JP4628278B2 (ja) | 2006-02-08 | 2006-02-08 | 表認識装置、及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007213255A true JP2007213255A (ja) | 2007-08-23 |
JP4628278B2 JP4628278B2 (ja) | 2011-02-09 |
Family
ID=38491641
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006031581A Expired - Fee Related JP4628278B2 (ja) | 2006-02-08 | 2006-02-08 | 表認識装置、及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4628278B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8452104B2 (en) | 2010-08-09 | 2013-05-28 | Fuji Xerox Co., Ltd. | Image determination apparatus, computer readable medium storing program, and method |
US8483482B2 (en) | 2009-07-10 | 2013-07-09 | Fuji Xerox Co., Ltd. | Image processing device, image processing method and computer-readable medium |
JP2021096543A (ja) * | 2019-12-16 | 2021-06-24 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理方法、プログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1153466A (ja) * | 1997-07-31 | 1999-02-26 | Hitachi Ltd | 表認識方法 |
-
2006
- 2006-02-08 JP JP2006031581A patent/JP4628278B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1153466A (ja) * | 1997-07-31 | 1999-02-26 | Hitachi Ltd | 表認識方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8483482B2 (en) | 2009-07-10 | 2013-07-09 | Fuji Xerox Co., Ltd. | Image processing device, image processing method and computer-readable medium |
US8452104B2 (en) | 2010-08-09 | 2013-05-28 | Fuji Xerox Co., Ltd. | Image determination apparatus, computer readable medium storing program, and method |
JP2021096543A (ja) * | 2019-12-16 | 2021-06-24 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理方法、プログラム |
JP7425288B2 (ja) | 2019-12-16 | 2024-01-31 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理方法、プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4628278B2 (ja) | 2011-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12019675B2 (en) | Recognizing text in image data | |
US20210150088A1 (en) | Building information model (bim) element extraction from floor plan drawings using machine learning | |
JP4973063B2 (ja) | 表データ処理方法及び装置 | |
US20200065601A1 (en) | Method and system for transforming handwritten text to digital ink | |
JP4918776B2 (ja) | 電子文書比較プログラム、電子文書比較装置および電子文書比較方法 | |
CN105574524B (zh) | 基于对白和分镜联合识别的漫画图像版面识别方法和系统 | |
JPS61267177A (ja) | 文書画像追加情報の蓄積方法 | |
JP6900164B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2004139484A (ja) | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム | |
JP4785655B2 (ja) | 文書処理装置及び文書処理方法 | |
JP2011192274A (ja) | フォームテンプレートを定義する方法及び装置 | |
JP2005173730A (ja) | 帳票ocrプログラム、方法及び装置 | |
US11449706B2 (en) | Information processing method and information processing system | |
CN103995816A (zh) | 信息处理设备和信息处理方法 | |
JP4628278B2 (ja) | 表認識装置、及びコンピュータプログラム | |
JP2008108114A (ja) | 文書処理装置および文書処理方法 | |
JP4983526B2 (ja) | データ処理装置及びデータ処理プログラム | |
JP6680052B2 (ja) | 表データ変換方法、プログラム、画像読取装置 | |
JP2018055256A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2009031937A (ja) | 帳票画像処理装置及び帳票画像処理プログラム | |
JPH08320914A (ja) | 表認識方法および装置 | |
JP3726442B2 (ja) | 画像特徴量比較装置および画像特徴量比較プログラムを記録した記録媒体 | |
JP5206525B2 (ja) | 画像処理装置、画像読取装置、画像形成装置及びプログラム | |
JP5134383B2 (ja) | Ocr装置、証跡管理装置及び証跡管理システム | |
JP2010102734A (ja) | 画像処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080411 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101025 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101109 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101109 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131119 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4628278 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |