JP2010205122A - レイアウト構造解析装置及びレイアウト構造解析方法 - Google Patents
レイアウト構造解析装置及びレイアウト構造解析方法 Download PDFInfo
- Publication number
- JP2010205122A JP2010205122A JP2009051790A JP2009051790A JP2010205122A JP 2010205122 A JP2010205122 A JP 2010205122A JP 2009051790 A JP2009051790 A JP 2009051790A JP 2009051790 A JP2009051790 A JP 2009051790A JP 2010205122 A JP2010205122 A JP 2010205122A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- layout
- feature amount
- attribute
- description element
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
【解決手段】本発明のレイアウト構造解析装置10は、名刺上の各文字列のレイアウト情報とタグとからなる第1の画像特徴量を記憶するレイアウト辞書18と、名刺から読み取った入力画像のレイアウト情報を取得するレイアウト解析部14と、文字認識結果などに基づいて記載要素毎の属性を暫定的に判定するタグ判定部15と、判定された記載要素毎のタグとレイアウト解析により得られたレイアウト情報とを関連付けた第2の画像特徴量を生成する特徴量生成部16と、第1及び第2の画像特徴量の比較結果に基づいて、入力画像の記載要素毎のタグを確定させるタグ確定部17と、を備える。
【選択図】図1
Description
[第1の実施の形態]
図1は、本発明の第1の実施形態に係るレイアウト構造解析装置10の構成を機能的に示すブロック図である。図2は、レイアウト構造解析装置10が備えたレイアウト解析部14による処理を概念的に示す図である。
(f1,f2…f30)Tを主成分分析することで特徴ベクトルA=(a1,a2…a30)Tを求め、さらにこれを記憶させたクラスA用のクラス辞書18aを作成した態様を例示している。
(p1,p2…p30)Tが生成される過程を示しており、さらに、入力画像P中における六番目の行の文字列(Eメールアドレス)のタグが不明となっている態様を例示している。
RA1を算出する。
p30に対し、特徴ベクトルA=(a1,a2…a30)Tにおける成分a30のEメールアドレスを表すタグ「6」を割り当てる(タグを確定させる)。また、本実施形態の判定結果補正部17cは、判定エラーになっていない他の行の文字列については、タグ判定部15により暫定的に判定されたタグを、そのまま最終的に特定すべきタグとして確定させる。
次に、本発明の第2の実施形態を図7〜図9に基づき説明する。ここで、図7は、第2の実施形態に係るレイアウト構造解析装置30の構成を機能的に示すブロック図である。また、図8は、レイアウト構造解析装置30により暫定的にタグを判定してからタグを確定するまでの処理を概念的に示す図である。さらに、図9は、レイアウト構造解析装置30によるレイアウト構造解析方法の流れを示すフローチャートである。なお、図7及び図8において、第1の実施形態で説明した図1及び図5中の構成要素と同一の構成要素については、同一の符号を付与しその説明を省略する。
Claims (7)
- 任意の書式で記載された書面上の複数の記載要素それぞれのレイアウトを表すレイアウト情報と、前記記載要素毎に各々対応する属性と、を予め関連付けて登録した第1の特徴量を記憶する特徴量記憶部と、
構造解析の対象となる書面の画像を入力画像として取り込む画像入力部と、
前記画像入力部により取り込まれた前記入力画像のレイアウト解析を行い、この入力画像を構成する複数の記載要素を各々抽出すると共にこの抽出された記載要素毎のレイアウトを表すレイアウト情報を取得するレイアウト解析部と、
前記レイアウト解析部により抽出された少なくとも各記載要素を文字認識した結果に基づいて、当該抽出された記載要素毎の属性を暫定的に判定する属性判定部と、
前記属性判定部により判定された記載要素毎の属性と前記レイアウト解析部により取得された記載要素毎のレイアウト情報とを互いに関連付けた第2の特徴量を生成する特徴量生成部と、
前記特徴量生成部により生成された前記第2の特徴量と前記特徴量記憶部に予め記憶された前記第1の特徴量とを比較した結果に基づいて、前記入力画像を構成する記載要素毎の属性を確定させる属性確定部と、
を具備することを特徴とするレイアウト構造解析装置。 - 前記特徴量記憶部は、書式の異なる複数の種類の書面に各々対応した複数の種類の第1の特徴量を記憶し、
前記属性確定部は、
前記複数の種類の第1の特徴量と前記特徴量生成部により生成された前記第2の特徴量との類似性を各々比較する類似性比較部と、
前記類似性比較部による比較結果に基づいて、前記第2の特徴量との類似性が最も高い第1の特徴量を選出する特徴量選出部と、
前記特徴量選出部により選出された前記類似性が最も高い第1の特徴量に基づいて、前記属性判定部による判定結果を補正し、前記入力画像を構成する記載要素毎の属性を確定させる判定結果補正部と、
を具備することを特徴とする請求項1記載のレイアウト構造解析装置。 - 前記属性判定部は、
前記レイアウト解析部により抽出された各記載要素を文字認識する文字認識部と、
前記文字認識部により文字認識結果として得られた記載要素毎の文字列と、前記特徴量記憶部に予め登録されている属性毎に各々分類された複数の種類の被照合用の文字列と、をそれぞれ照合する文字列照合部と、
少なくとも、前記文字列照合部による照合結果に基づいて、属性の判定を前記記載要素毎に保留することが可能な判定保留部と、
を備え、
前記類似性比較部は、前記判定保留部によって少なくとも一つの記載要素についての属性の判定が保留された場合に、前記複数の種類の第1の特徴量と前記第2の特徴量との類似性を各々比較し、
さらに、前記判定結果補正部は、前記類似性が最も高い第1の特徴量のうちの、前記判定の保留された記載要素とレイアウト情報が対応する記載要素の属性を、当該判定の保留された記載要素に対して割り当てる、
ことを特徴とする請求項2記載のレイアウト構造解析装置。 - 前記特徴量生成部は、前記判定保留部にて属性の判定の保留された記載要素に対し代替用の属性を表す情報を補完することにより前記第2の特徴量を生成することが可能であり、
さらに、前記類似性比較部は、当該第2の特徴量から前記代替用の属性を表す情報を除外した特徴量と前記複数の種類の第1の特徴量との類似性を各々比較する、
ことを特徴とする請求項3記載のレイアウト構造解析装置。 - 前記判定結果補正部は、前記第2の特徴量側の記載要素毎の各属性と、当該第2の特徴量との類似性が最も高い第1の特徴量側の記載要素毎の各属性と、を互いのレイアウト情報の対応関係を揃えて比較した結果、属性が不一致となった記載要素が存在した場合、前記類似性が最も高い第1の特徴量側の属性の登録内容を優先させて、当該不一致となった記載要素の属性を確定させる、
ことを特徴とする請求項2記載のレイアウト構造解析装置。 - 前記特徴量記憶部は、前記書面の書式に各々対応した複数の前記第1の特徴量を種類毎にクラス分けして記憶する複数のクラス別記憶部を備え、
前記特徴量生成部により生成された前記第2の特徴量と前記判定結果補正部による属性の判定を補正した結果とに基づいて、当該第2の特徴量との類似性が最も高い第1の特徴量を記憶したクラス別記憶部内の記憶内容を更新する特徴量更新部、
をさらに具備することを特徴とする請求項2ないし5のいずれか1項に記載のレイアウト構造解析装置。 - 任意の書式で記載された書面上の複数の記載要素それぞれのレイアウトを表すレイアウト情報と、前記記載要素毎に各々対応する属性と、を予め関連付けて登録した第1の特徴量を特徴量記憶部が記憶するステップと、
構造解析の対象となる書面の画像を画像入力部が入力画像として取り込むステップと、
前記画像入力部により取り込まれた前記入力画像のレイアウト解析を行うことにより、レイアウト解析部が、前記入力画像を構成する複数の記載要素を抽出すると共にこの抽出された記載要素毎のレイアウトを表すレイアウト情報を取得するステップと、
前記レイアウト解析部により抽出された少なくとも各記載要素を文字認識した結果に基づいて、当該抽出された記載要素毎の属性を属性判定部が暫定的に判定するステップと、
前記属性判定部により判定された記載要素毎の属性と前記レイアウト解析部により取得された記載要素毎のレイアウト情報とを互いに関連付けた第2の特徴量を特徴量生成部が生成するステップと、
前記特徴量生成部により生成された前記第2の特徴量と前記特徴量記憶部に予め記憶された前記第1の特徴量とを比較した結果に基づいて、前記入力画像を構成する記載要素毎の属性を属性確定部が確定させるステップと、
を有することを特徴とするレイアウト構造解析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009051790A JP2010205122A (ja) | 2009-03-05 | 2009-03-05 | レイアウト構造解析装置及びレイアウト構造解析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009051790A JP2010205122A (ja) | 2009-03-05 | 2009-03-05 | レイアウト構造解析装置及びレイアウト構造解析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010205122A true JP2010205122A (ja) | 2010-09-16 |
Family
ID=42966510
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009051790A Pending JP2010205122A (ja) | 2009-03-05 | 2009-03-05 | レイアウト構造解析装置及びレイアウト構造解析方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010205122A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150141122A (ko) * | 2014-05-13 | 2015-12-17 | 시아오미 아이엔씨. | 프라이버시 정보 은닉방법, 장치, 프로그램 및 기록매체 |
JP2019091250A (ja) * | 2017-11-15 | 2019-06-13 | 三菱電機ビルテクノサービス株式会社 | 来訪者受付システム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09204422A (ja) * | 1996-01-26 | 1997-08-05 | Casio Comput Co Ltd | 読み取りデータ処理装置 |
JP2001344562A (ja) * | 2000-05-31 | 2001-12-14 | Toshiba Corp | 文書読取装置および文書読取方法 |
-
2009
- 2009-03-05 JP JP2009051790A patent/JP2010205122A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09204422A (ja) * | 1996-01-26 | 1997-08-05 | Casio Comput Co Ltd | 読み取りデータ処理装置 |
JP2001344562A (ja) * | 2000-05-31 | 2001-12-14 | Toshiba Corp | 文書読取装置および文書読取方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20150141122A (ko) * | 2014-05-13 | 2015-12-17 | 시아오미 아이엔씨. | 프라이버시 정보 은닉방법, 장치, 프로그램 및 기록매체 |
KR101657231B1 (ko) * | 2014-05-13 | 2016-09-13 | 시아오미 아이엔씨. | 프라이버시 정보 은닉방법, 장치, 프로그램 및 기록매체 |
JP2019091250A (ja) * | 2017-11-15 | 2019-06-13 | 三菱電機ビルテクノサービス株式会社 | 来訪者受付システム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7668372B2 (en) | Method and system for collecting data from a plurality of machine readable documents | |
US8843494B1 (en) | Method and system for using keywords to merge document clusters | |
US6996295B2 (en) | Automatic document reading system for technical drawings | |
US9158833B2 (en) | System and method for obtaining document information | |
US9396540B1 (en) | Method and system for identifying anchors for fields using optical character recognition data | |
JP2004139484A (ja) | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム | |
JP4661921B2 (ja) | 文書処理装置およびプログラム | |
US20120086963A1 (en) | Information processing device to generate information for distinguishing forms | |
US20090226090A1 (en) | Information processing system, information processing apparatus, information processing method, and storage medium | |
WO2010114478A1 (en) | Apparatus and methods for analysing goods cartons | |
JP6357621B1 (ja) | 会計処理装置、会計処理システム、会計処理方法及びプログラム | |
JP2015146075A (ja) | 会計データ入力支援システム、方法およびプログラム | |
EP2092463A1 (en) | Automated generation of form definitions from hard-copy forms | |
US8832108B1 (en) | Method and system for classifying documents that have different scales | |
WO2000052645A1 (fr) | Dispositif de traitement d'image document, procede d'extraction de titre de document et procede d'information d'etiquetage de document | |
JP2005173730A (ja) | 帳票ocrプログラム、方法及び装置 | |
US11321558B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
US20150310269A1 (en) | System and Method of Using Dynamic Variance Networks | |
JP4782346B2 (ja) | 電子ドキュメントを処理する方法および装置 | |
JP2014182477A (ja) | プログラム及び帳票処理装置 | |
JP2015069256A (ja) | 文字識別システム | |
JP6856916B1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
KR101486495B1 (ko) | 사후 광학 문자 인식 처리에서의 형상 클러스터링 기법 | |
WO2014068770A1 (ja) | データ抽出方法、データ抽出装置及びそのプログラム | |
JP2010205122A (ja) | レイアウト構造解析装置及びレイアウト構造解析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110411 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110419 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110620 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20110620 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110823 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20111227 |