JP5253788B2 - 画像認識装置、画像認識プログラムおよび画像認識方法 - Google Patents
画像認識装置、画像認識プログラムおよび画像認識方法 Download PDFInfo
- Publication number
- JP5253788B2 JP5253788B2 JP2007284295A JP2007284295A JP5253788B2 JP 5253788 B2 JP5253788 B2 JP 5253788B2 JP 2007284295 A JP2007284295 A JP 2007284295A JP 2007284295 A JP2007284295 A JP 2007284295A JP 5253788 B2 JP5253788 B2 JP 5253788B2
- Authority
- JP
- Japan
- Prior art keywords
- logical structure
- image
- structure model
- updated
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Description
まず最初に、以下の実施例で用いる主要な用語を説明する。以下の実施例で用いる「画像」とは、所定の論理構造を構成する複数の論理要素各々として文字列各々が記載されている画像のことであり、例えば、帳票画像のことである。ここで、帳票画像に、本人情報として、『名前』、『住所』および『電話番号』を記入させる項目があり、職場情報として、『住所』および『電話番号』を記入させる項目があり、複数の項目各々に文字列各々が記載されているとする。このような帳票画像において、「論理構造」とは、『本人情報』の下の階層に、『名前』、『住所』および『電話番号』があり、『職場情報』の下の階層に、『住所』および『電話番号』があり、『本人情報』の階層と『職場情報』の階層とが同じ階層である、といった構造のことをいう。また、『名前』、『住所』、『電話番号』等が、「論理構造」を構成する複数の「論理要素」各々のことである。言い換えると、「論理構造」や「論理要素」とは、例えば、帳票画像のフォーマットを作成する作成者によって当該帳票画像のフォーマットが作成される際に、(意識的か無意識的かに関わらず)複数の項目が形成する構造として「論理構造」が設定され、複数の項目各々が「論理要素」として設定されるものであるといえる。一方、画像認識装置が当該帳票画像について処理を行う際には、当該帳票画像において複数の項目が形成する構造を「論理構造」として扱い、複数の項目各々を「論理要素」として扱うことになる。なお、「画像」は、帳票画像に限られず、複数の質問各々に回答を記入させるアンケートの画像等、複数の項目各々に文字列各々が記載されている画像であれば、いずれでもよい。
続いて、図1を用いて、実施例1に係る画像認識装置の概要および特徴を説明する。図1は、実施例1に係る画像認識装置の概要および特徴を説明するための図である。
次に、図2〜12を用いて、実施例1に係る画像認識装置を説明する。図2は、実施例1に係る画像認識装置の構成を示すブロック図であり、図3は、帳票画像記憶部を説明するための図であり、図4は、一般論理構造モデル記憶部を説明するための図であり、図5は、論理構造認識結果記憶部を説明するための図であり、図6は、テスト入力データ記憶部を説明するための図であり、図7〜9は、更新後一般論理構造モデル記憶部を説明するための図であり、図10および11は、論理構造認識結果比較結果記憶部を説明するための図であり、図12は、警告出力部を説明するための図である。
従来、紙の帳票をスキャンして得られた帳票画像データの中から必要なデータを抽出するには、予め、その帳票のレイアウトを定義しておく必要があった。つまり、どの領域に何が書かれているのかについて記述された『レイアウト定義体』を作成し、該当する領域に書かれた文字列を認識することによって、データの抽出が行われてきた。しかし、『レイアウト定義体』は人手で作成しなければならないことから、様々な帳票を扱う場合には、個々の『レイアウト定義体』を作成しなければならない結果、コストが高くなる。
入力部11は、帳票画像を入力する部である。具体的には、入力部11は、画像認識装置10の認識対象となる帳票画像を入力し、帳票画像記憶部21に記憶させる。この場合、例えば、入力部11は、スキャナ装置によって実現される。また、入力部11は、画像認識装置10の認識結果等を確認する利用者の操作を入力する部である。この場合、例えば、入力部11は、マウスやキーボードなどによって実現される。
次に、図13を用いて、実施例1に係る画像認識装置による処理の手順を説明する。図13は、実施例1に係る画像認識装置による処理の手順を示すフローチャート(運用フェーズ)であり、図14は、実施例1に係る画像認識装置による処理の手順を示すフローチャート(検証フェーズ)である。
まず、画像認識装置10は、帳票画像の入力を受け付けると(ステップS130肯定)、帳票画像記憶部21に記憶させ、次に、レイアウト解析部31が、帳票画像記憶部21に記憶された帳票画像のレイアウトを解析する(ステップS131)。
まず、一般論理構造モデル更新検出部35が、一般論理構造モデルの更新を検出すると(ステップS140肯定)、画像認識装置10は、レイアウト定義体レス帳票自動認識を実行する(ステップS141)。
上記してきたように、実施例1によれば、一般論理構造モデルの更新に伴う不都合の発生を利用者に回避させることが可能になる。
上記してきたように、実施例2によれば、テスト入力データを効率的かつ網羅的に収集することが可能になる。
上記してきたように、実施例3によれば、論理構造認識の計算時間が短くなり、また、メモリ容量を削減することが可能になる。
さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。
実施例1〜3においては、テスト入力データを収集する手段と、収集されたテスト入力データに基づいて検証する手段とが、同じ装置で実現される事例について説明してきたが、これに限られるものではない。すなわち、例えば、いわゆる運用フェーズで利用される画像認識装置が、レイアウト定義体レス帳票自動認識部とテスト入力データ収集部とテスト入力データ記憶部と通信部とを備え、いわゆる検証フェーズで利用される画像認識装置が、レイアウト定義体レス帳票自動認識部と更新後一般論理構造モデル記憶部と論理構造認識結果比較結果記憶部と一般論理構造モデル更新検出部と論理構造認識結果比較部と警告出力部と通信部とを備える構成であってもよい。この場合には、運用フェーズで利用される画像認識装置がテスト入力データ記憶部に格納したテスト入力データを、当該画像認識装置が通信部を介して検証フェーズで利用される画像認識装置に送信し、検証フェーズで利用される画像認識装置の通信部がこれを受信して、検証に利用するなどする。このような構成は、例えば、一方の画像認識装置が東京に設置され、他方の画像認識装置が大阪に設置されるなど、画像認識装置各々が遠隔地に設置される場合にも有効である。
上記の実施例で説明した各種の処理は、予め用意されたプログラムやパーソナル・コンピュータやワークステーションなどのコンピュータで実行することによって実現することができる。そこで、以下では、図17を用いて、上記の実施例1と同様の機能を有する画像認識プログラムを実行するコンピュータの一例を説明する。図17は、画像認識プログラムを実行するコンピュータを示す図である。
11 入力部
12 出力部
13 入出力制御I/F部
20 記憶部
21 帳票画像記憶部
22 一般論理構造モデル記憶部
23 論理構造認識結果記憶部
24 テスト入力データ記憶部
25 更新後一般論理構造モデル記憶部
26 論理構造認識結果比較結果記憶部
30 制御部
31 レイアウト解析部
32 文字認識部
33 論理構造認識部
34 テスト入力データ収集部
35 一般論理構造モデル更新検出部
36 論理構造認識結果比較部
37 警告出力部
Claims (5)
- 論理構造を構成する複数の論理要素各々として文字列各々が記載されている画像について、当該論理構造に対応するように設定された論理構造モデルに基づいて当該論理要素各々を認識する画像認識装置であって、
対応済みの論理構造に関する情報を収集する収集手段と、
前記対応済みの論理構造の画像に加え、新たに追加される論理構造の画像への対応が求められる前記論理構造モデルについて、新たな論理構造の追加に応じて論理要素と文字列との対応関係に変化を加える更新がなされると、前記収集手段によって収集された情報であって前記対応済みの論理構造に関する情報を当該更新後の論理構造モデルにて処理することで、当該対応済みの論理構造の画像を当該更新後の論理構造モデルに基づいて認識した場合の認識結果を取得する更新後認識結果取得手段と、
前記対応済みの論理構造の画像が更新前の論理構造モデルに基づいて認識された場合の認識結果と、当該対応済みの論理構造の画像が更新後の論理構造モデルに基づいて認識された場合の認識結果とが、一致するか否かを比較する比較手段と、
前記比較手段による比較の結果が不一致である場合に、当該更新後の論理構造モデルについて警告することを示す警告情報を出力部に出力する警告出力手段と、
を備えたことを特徴とする画像認識装置。 - 前記収集手段は、新たな論理構造に対応するように論理構造モデルが更新された際に、当該新たな論理構造に関する情報を、前記対応済みの論理構造に関する情報として累積して収集することを特徴とする請求項1に記載の画像認識装置。
- 論理構造を構成する複数の論理要素各々として文字列各々が記載されている画像について、当該論理構造に対応するように設定された論理構造モデルに基づいて当該論理要素各々を認識する方法をコンピュータに実行させる画像認識プログラムであって、
対応済みの論理構造に関する情報を収集する収集手順と、
前記対応済みの論理構造の画像に加え、新たに追加される論理構造の画像への対応が求められる前記論理構造モデルについて、新たな論理構造の追加に応じて論理要素と文字列との対応関係に変化を加える更新がなされると、前記収集手順によって収集された情報であって前記対応済みの論理構造に関する情報を当該更新後の論理構造モデルにて処理することで、当該対応済みの論理構造の画像を当該更新後の論理構造モデルに基づいて認識した場合の認識結果を取得する更新後認識結果取得手順と、
前記対応済みの論理構造の画像が更新前の論理構造モデルに基づいて認識された場合の認識結果と、当該対応済みの論理構造の画像が更新後の論理構造モデルに基づいて認識された場合の認識結果とが、一致するか否かを比較する比較手順と、
前記比較手順による比較の結果が不一致である場合に、当該更新後の論理構造モデルについて警告することを示す警告情報を出力部に出力する警告出力手順と、
をコンピュータに実行させることを特徴とする画像認識プログラム。 - 論理構造を構成する複数の論理要素各々として文字列各々が記載されている画像について、当該論理構造に対応するように設定された論理構造モデルに基づいて当該論理要素各々を認識する画像認識方法であって、
対応済みの論理構造に関する情報を収集する収集工程と、
前記対応済みの論理構造の画像に加え、新たに追加される論理構造の画像への対応が求められる前記論理構造モデルについて、新たな論理構造の追加に応じて論理要素と文字列との対応関係に変化を加える更新がなされると、前記収集工程によって収集された情報であって前記対応済みの論理構造に関する情報を当該更新後の論理構造モデルにて処理することで、当該対応済みの論理構造の画像を当該更新後の論理構造モデルに基づいて認識した場合の認識結果を取得する更新後認識結果取得工程と、
前記対応済みの論理構造の画像が更新前の論理構造モデルに基づいて認識された場合の認識結果と、当該対応済みの論理構造の画像が更新後の論理構造モデルに基づいて認識された場合の認識結果とが、一致するか否かを比較する比較工程と、
前記比較工程による比較の結果が不一致である場合に、当該更新後の論理構造モデルについて警告することを示す警告情報を出力部に出力する警告出力工程と、
を含んだことを特徴とする画像認識方法。 - 論理構造を構成する複数の論理要素各々として文字列各々が記載されている画像について、当該論理構造に対応するように設定された論理構造モデルに基づいて当該論理要素各々を認識する画像認識装置であって、
対応済みの論理構造の画像に加え、新たに追加される論理構造の画像への対応が求められる前記論理構造モデルについて、新たな論理構造の追加に応じて論理要素と文字列との対応関係に変化を加える更新がなされると、前記対応済みの論理構造に関する情報を当該更新後の論理構造モデルにて処理することで、当該対応済みの論理構造の画像を当該更新後の論理構造モデルに基づいて認識した場合の認識結果を取得する更新後認識結果取得手段と、
前記対応済みの論理構造の画像が更新前の論理構造モデルに基づいて認識された場合の認識結果と、当該対応済みの論理構造の画像が更新後の論理構造モデルに基づいて認識された場合の認識結果とが、一致するか否かを比較する比較手段と、
前記比較手段による比較の結果が不一致である場合に、当該更新後の論理構造モデルについて警告することを示す警告情報を出力部に出力する警告出力手段と、
を備えたことを特徴とする画像認識装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007284295A JP5253788B2 (ja) | 2007-10-31 | 2007-10-31 | 画像認識装置、画像認識プログラムおよび画像認識方法 |
US12/258,896 US8234254B2 (en) | 2007-10-31 | 2008-10-27 | Image recognition apparatus, method and system for realizing changes in logical structure models |
CN2008101749820A CN101425141B (zh) | 2007-10-31 | 2008-10-31 | 图像识别装置和图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007284295A JP5253788B2 (ja) | 2007-10-31 | 2007-10-31 | 画像認識装置、画像認識プログラムおよび画像認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009110445A JP2009110445A (ja) | 2009-05-21 |
JP5253788B2 true JP5253788B2 (ja) | 2013-07-31 |
Family
ID=40582916
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007284295A Expired - Fee Related JP5253788B2 (ja) | 2007-10-31 | 2007-10-31 | 画像認識装置、画像認識プログラムおよび画像認識方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US8234254B2 (ja) |
JP (1) | JP5253788B2 (ja) |
CN (1) | CN101425141B (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102385707A (zh) | 2010-08-30 | 2012-03-21 | 阿里巴巴集团控股有限公司 | 一种数字图像识别的方法、装置及爬虫服务器 |
CN108200060B (zh) * | 2018-01-03 | 2020-07-14 | 深圳壹账通智能科技有限公司 | 基于web子系统的单点登录验证方法、服务器及存储介质 |
CN112395439B (zh) * | 2020-11-17 | 2024-03-01 | 林铭 | 一种图像数据库实现方法及其系统和网络通信设备 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3469345B2 (ja) * | 1995-03-16 | 2003-11-25 | 株式会社東芝 | 画像のファイリング装置及びファイリング方法 |
JP3463008B2 (ja) * | 1995-07-31 | 2003-11-05 | 富士通株式会社 | 媒体処理方法及び媒体処理装置 |
JPH1063744A (ja) * | 1996-07-18 | 1998-03-06 | Internatl Business Mach Corp <Ibm> | 文書のレイアウト解析方法及びシステム |
US6327387B1 (en) * | 1996-12-27 | 2001-12-04 | Fujitsu Limited | Apparatus and method for extracting management information from image |
JPH11184894A (ja) * | 1997-10-07 | 1999-07-09 | Ricoh Co Ltd | 論理要素抽出方法および記録媒体 |
JPH11328306A (ja) * | 1998-03-09 | 1999-11-30 | Ricoh Co Ltd | 文書画像の論理要素抽出方法、装置および記録媒体 |
JP2000322502A (ja) * | 1999-05-13 | 2000-11-24 | Toshiba Corp | 帳票検査装置、帳票検査方法及び記憶媒体 |
MC2491A1 (fr) * | 1999-06-21 | 1999-11-22 | Stringa Luigi | Reconnaissance automatique de caractères sur fond structuré par combinaison des modèles du fond et des caractères |
JP4742404B2 (ja) * | 2000-05-17 | 2011-08-10 | コニカミノルタビジネステクノロジーズ株式会社 | 画像認識装置、画像形成装置、画像認識方法および画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体 |
JP2004139484A (ja) * | 2002-10-21 | 2004-05-13 | Hitachi Ltd | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム |
CN1238816C (zh) * | 2003-03-14 | 2006-01-25 | 清华大学 | 基于单个汉字字符的字体识别方法 |
CN1619583B (zh) * | 2003-11-20 | 2010-05-05 | 摩托罗拉公司 | 手写识别的方法和系统 |
US7904801B2 (en) * | 2004-12-15 | 2011-03-08 | Microsoft Corporation | Recursive sections in electronic forms |
CN100412885C (zh) * | 2005-05-23 | 2008-08-20 | 株式会社东芝 | 图像识别装置及其方法 |
JP2006352290A (ja) | 2005-06-14 | 2006-12-28 | Nec Commun Syst Ltd | シナリオ作成装置、試験システム、シナリオ作成方法及びプログラム |
WO2008033439A2 (en) * | 2006-09-13 | 2008-03-20 | Aurilab, Llc | Robust pattern recognition system and method using socratic agents |
JP5012900B2 (ja) * | 2007-07-27 | 2012-08-29 | 富士通株式会社 | 更新管理システム |
-
2007
- 2007-10-31 JP JP2007284295A patent/JP5253788B2/ja not_active Expired - Fee Related
-
2008
- 2008-10-27 US US12/258,896 patent/US8234254B2/en not_active Expired - Fee Related
- 2008-10-31 CN CN2008101749820A patent/CN101425141B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20090110280A1 (en) | 2009-04-30 |
JP2009110445A (ja) | 2009-05-21 |
CN101425141B (zh) | 2012-06-13 |
US8234254B2 (en) | 2012-07-31 |
CN101425141A (zh) | 2009-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5338063B2 (ja) | 画像認識プログラム、画像認識装置および画像認識方法 | |
JP4998219B2 (ja) | 帳票認識プログラム、帳票認識装置および帳票認識方法 | |
JP2012083951A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP4733577B2 (ja) | 帳票認識装置及び帳票認識プログラム | |
US20110161303A1 (en) | System and method for analyzing official notices of electronically filed patent applications | |
EP3757881A1 (en) | Documentation determination device and documentation determination program | |
JP5253788B2 (ja) | 画像認識装置、画像認識プログラムおよび画像認識方法 | |
JP2007128450A (ja) | ソフトウェア再利用部品管理システム | |
JP4172478B2 (ja) | 文書管理装置及び文書管理方法 | |
JP2004013813A (ja) | 情報管理システムおよび情報管理方法 | |
JP2004252881A (ja) | テキストデータ修正方法 | |
JP6217407B2 (ja) | 情報処理システム、情報処理装置及びプログラム | |
JP2009230618A (ja) | 設計書作成プログラム、該装置、及び該方法 | |
JP7122896B2 (ja) | 帳票情報処理装置、帳票情報構造化処理方法及び帳票情報構造化処理プログラム | |
JP5357711B2 (ja) | 文書処理装置 | |
JPWO2004068407A1 (ja) | アプリケーション間のデータ連携支援方法 | |
JP4160206B2 (ja) | 文字認識装置を利用したデータベース登録方法 | |
JP5670156B2 (ja) | テスト結果照合システム、方法、及びプログラム | |
US10331948B1 (en) | Rules based data extraction | |
JP2011154602A (ja) | 文字列管理装置、文字列登録方法、文字列検索方法および文字列管理プログラム | |
WO2020044537A1 (ja) | 画像照合装置、画像照合方法、及びプログラム | |
WO2020158374A1 (ja) | 準拠性判定装置及びその方法 | |
JP2004234402A (ja) | Web画面作成ツール及び用語チェックツール | |
JP2010061449A (ja) | 原画像探索装置及び原画像探索プログラム | |
JP7364998B2 (ja) | 文書分類システムおよび文書分類プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100616 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110811 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110823 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111024 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120417 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120625 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20120703 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20120817 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130417 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160426 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |