JP5703191B2 - 文書認識支援装置、文書検索装置及び文書管理方法 - Google Patents
文書認識支援装置、文書検索装置及び文書管理方法 Download PDFInfo
- Publication number
- JP5703191B2 JP5703191B2 JP2011240762A JP2011240762A JP5703191B2 JP 5703191 B2 JP5703191 B2 JP 5703191B2 JP 2011240762 A JP2011240762 A JP 2011240762A JP 2011240762 A JP2011240762 A JP 2011240762A JP 5703191 B2 JP5703191 B2 JP 5703191B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- item
- document
- relationship
- correspondence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
Description
文書認識支援システム400は、画像読取部401、表枠検出部402、文字列認識部403、項目名記憶部404、項目枠・データ枠判別部405、項目‐データ関係推定部406、項目‐データ関係決定部407、データパターン記憶部408、データパターン尤度計算部409、項目関係記憶部410、項目関係尤度計算部411、項目‐データ関係評価部412、入出力制御部413、入出力部414を有する。
図5は、本実施例の文書認識支援システム400において、図1における文書100の表101を認識する処理を説明するフローチャートの例である。ステップ500では、画像読取部401が、文書100を読み取って、画像文書データを生成する。
ステップ502では、文字列認識部403が、ステップ501で検出した各表枠内から、文字列を認識する。
ステップ503では、項目枠・データ枠判別部405が、ステップ502で認識した各表枠内の文字列と、項目名記憶部404の項目名テーブルの各項目名とを照合し、照合できた表枠を項目枠、照合できなかった表枠をデータ枠と判別する。
図5は、本実施例の文書認識支援システム400において、図1における文書100の表101を認識する処理を説明するフローチャートの例である。ステップ500では、画像読取部401が、文書100を読み取って、画像文書データを生成する。
ステップ502では、文字列認識部403が、ステップ501で検出した各表枠内から、文字列を認識する。
ステップ503では、項目枠・データ枠判別部405が、ステップ502で認識した各表枠内の文字列と、項目名記憶部404の項目名テーブルの各項目名とを照合し、照合できた表枠を項目枠、照合できなかった表枠をデータ枠と判別する。
以上の一連の処理の後、本実施例の文書認識支援システムの処理を終了する。
ステップ900では、データパターン尤度計算部409が、データパターン記憶部408のデータパターンテーブルの内容を読み込む。
以上の一連の処理の後、当該項目‐データ関係に関してデータパターン尤度を計算する処理(ステップ506)を終了する。
ステップ1100では、項目関係尤度計算部411が、項目関係記憶部410の項目関係テーブルから、ステップ504までの処理の結果推定された全項目‐データ関係と、関係αとが一致する項目関係を抽出する。
以上の一連の処理の後、当該項目‐データ関係に関して項目関係尤度を計算する処理(ステップ507)を終了する。
以上の一連の処理の後、当該項目‐データ関係に関して項目‐データ関係を決定する処理(ステップ508)を終了する。
文書管理システム1400は、文書受付部1401、文書記憶部1402、項目名表記箇所判別部1403、項目名記憶部404、項目‐データ関係推定部406、項目‐データ関係決定部407、データパターン記憶部408、データパターン尤度計算部409、項目関係記憶部410、項目関係尤度計算部411、項目‐データ関係評価部412、項目‐データ関係記憶部1404、項目‐データ関係保存部1405、入出力部414、項目‐データ関係検索部1406を有する。
図15は、本実施例の文書管理システム1400において、図13における文書1300の箇条書き1301を認識し、さらに利用者からの検索条件の入力を受け付け、項目‐データ関係を検索条件として文書を検索する処理を説明するフローチャートの例である。
図16は、本実施例の文書管理システム1400において、文書を登録する処理を説明するフローチャートの例である。
ステップ1600では、文書受付部1401が、文書1300を受け付け、文書に固有のID(例えば「0001」)を付与して文書記憶部1402に保存する。
ステップ1601では、項目名表記箇所判別部1403が、ステップ1401で受け付けた文書の文字列と、項目名記憶部404に記憶した項目名とを照合し、項目名と一致した箇所を項目名表記箇所と判別する。
ステップ506〜ステップ510は実施例1と同様であるため、ここでの説明は省略する。
ステップ1602では、項目‐データ関係保存部1405が、ステップ509で決定した項目‐データ関係を、文書IDと共に記憶する。
以上の一連の処理の後、当該文書を受け付ける処理(ステップ1500)を終了する。
ステップ1800では、入出力部414が、利用者から入力された文書検索条件を受け付け、入力された検索条件に基づく検索結果を利用者に提供する。
以上の一連の処理の後、利用者から入力された検索条件を受け付け、項目とデータの対応関係を検索する処理(ステップ1500)を終了する。
408 データパターン記憶部
409 データパターン尤度計算部
410 項目関係記憶部
411 項目関係尤度計算部
412 項目−データ関係評価部
600 認識結果提供画面
601 項目名フィールド
602 項目名フィールド
603 データフィールド
604 データ候補リスト
607 データ入力欄
608 保存ボタン
Claims (12)
- 文書に記載された情報の項目と、前記項目に対応するデータとの関係を認識する文書認識支援装置であって、
文書に記載された項目とデータの対応関係を記憶するデータパターン記憶部と、
前記データパターン記憶部に記憶された項目とデータの対応関係を用いて、入力された文書に記載された項目と対応するデータの候補を決定する項目-データ関係決定部と、
前記項目-データ関係決定部により決定された項目と対応するデータの候補を出力する出力部と、
文書に記載された項目とデータの対応関係の組み合わせを記憶する項目関係記憶部を備え、
前記項目-データ関係決定部は、前記データパターン記憶部に記憶された項目とデータの対応関係および前記項目関係記憶部に記憶された項目とデータの対応関係の組み合わせを用いて、入力された文書に記載された項目と対応するデータの候補を決定することを特徴とする文書認識支援装置。 - 請求項1に記載の文書認識支援装置であって、
前記出力部から出力された項目と対応するデータの候補から、利用者が選択した結果を入力する入力部を備えることを特徴とする文書認識支援装置。 - 請求項1に記載の文書認識支援装置であって、
前記出力部から出力される入力された文書の項目と対応するデータの候補は、一つの項目に対し、複数のデータが候補としてあげられ、ユーザが複数のデータから1つを選択可能としたことを特徴とする文書認識支援装置。 - 請求項1に記載の文書認識支援装置であって、
前記出力部から出力された項目と対応するデータの候補から、利用者が選択した項目と対応するデータの対応関係は、前記データパターン記憶部に保存されることを特徴とする文書認識支援装置。 - 請求項1に記載の文書認識支援装置であって、
前記出力部から出力された項目と対応するデータの候補から、利用者が選択した項目と対応するデータの対応関係の組み合わせは、前記項目関係記憶部に保存されることを特徴とする文書認識支援装置。 - 請求項1に記載の文書認識支援装置であって、
文書に記載された項目とデータの対応関係を推定する項目-データ関係推定部を備え、
前記項目-データ関係決定部は、
前記データパターン記憶部が記憶する項目とデータの対応関係に基づき、前記データパターン間の距離を算出し、前記推定された各項目とデータの対応関係が妥当であるかを示すデータパターン尤度を計算するデータパターン尤度計算部と、
前記項目関係記憶部が記憶する項目とデータの対応関係の組み合わせに基づき、前記データ関係間の距離を算出し、前記推定された各項目とデータの対応関係が妥当であるかを示す項目関係尤度を計算する項目関係尤度計算部と、
前記データパターン尤度計算部で計算したデータパターン尤度、および前記項目関係尤度計算で計算した項目関係尤度に基づき、項目とデータの対応関係を決定する項目-データ関係評価部とを備えることを特徴とする文書認識支援装置。 - 項目と、前記項目に対応するデータとを有する複数の文書から所望の文書を検索する文書検索装置であって、
文書に記載された項目とデータの対応関係を記憶するデータパターン記憶部と、
前記データパターン記憶部に記憶された項目とデータの対応関係を用いて、入力された文書に記載された項目と対応するデータの候補を決定する項目-データ関係決定部と、
前記項目-データ関係決定部により決定された項目と対応するデータの候補を出力する出力部と、
前記出力部から出力された項目と対応するデータの候補から利用者が選択した項目と対応するデータの対応関係及び入力された文書のIDが保存される項目-データ関係保存部と、
文書に記載された項目とデータの対応関係の組み合わせを記憶する項目関係記憶部を備え、
前記項目-データ関係決定部は、前記データパターン記憶部に記憶された項目とデータの対応関係および前記項目関係記憶部に記憶された項目とデータの対応関係の組み合わせを用いて、入力された文書に記載された項目と対応するデータの候補を決定することを特徴とする文書検索装置。 - 請求項7に記載された文書検索装置であって、
検索条件として項目名及び当該項目に対応するデータを用いて検索する場合、前記項目-データ関係保存部に保存されたデータと検索条件との照合を行うことで文書を検索することを特徴とする文書検索装置。 - 文書に記載された情報の項目と、前記項目に対応するデータとの関係を認識し、文書の管理を行う文書管理方法であって、
管理する文書を受け付するステップと、
受け付けた文書を記憶するステップと、
文書に記載された項目とデータの対応関係を記憶するデータパターン記憶部に記憶された項目とデータの対応関係を用いて、前記受け付けた文書に記載された項目と対応するデータの候補を決定し、出力するステップと、
前記出力された項目と対応するデータの候補から利用者により選択された項目と対応するデータの対応関係を前記データパターン記憶部に保存するステップと、
を備えるとともに、
前記受け付けた文書に記載された項目と対応するデータの候補を決定し、出力するにあたり、さらに、文書に記載された項目とデータの対応関係の組み合わせを記憶する項目関係記憶部に記憶された項目とデータの対応関係の組み合わせを用いて、前記受け付けた文書に記載された項目と対応するデータの候補を決定し、
利用者により選択された項目と対応するデータの対応関係の組み合わせは、前記項目関係記憶部に保存することを特徴とする文書管理方法。 - 請求項9に記載の文書管理方法であって、
前記受け付けた文書に記載された項目とデータの対応関係を推定するステップと、
前記データパターン記憶部が記憶する項目とデータの対応関係に基づき、前記推定された各項目とデータの対応関係が妥当であるかを示すデータパターン尤度を計算するステップと、
前記項目関係記憶部が記憶する項目とデータの対応関係の組み合わせに基づき、前記推定された各項目とデータの対応関係が妥当であるかを示す項目関係尤度を計算するステップと、
計算されたデータパターン尤度、および前記項目関係尤度計算で計算した項目関係尤度に基づき、項目とデータの対応関係を決定するステップとを備えることを特徴とする文書管理方法。 - 請求項10に記載の文書管理方法であって、
利用者により選択された項目と対応するデータの対応関係は、受付された文書のIDとともに蓄積されることを特徴とする文書管理方法。 - 請求項11に記載の文書管理方法であって、
検索条件として項目及び当該項目に対応するデータを指定するステップと、
前記蓄積された情報から、指定された項目及び当該項目に対応するデータを有する文書IDを出力するステップとを備えることを特徴とする文書管理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011240762A JP5703191B2 (ja) | 2011-11-02 | 2011-11-02 | 文書認識支援装置、文書検索装置及び文書管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011240762A JP5703191B2 (ja) | 2011-11-02 | 2011-11-02 | 文書認識支援装置、文書検索装置及び文書管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013097633A JP2013097633A (ja) | 2013-05-20 |
JP5703191B2 true JP5703191B2 (ja) | 2015-04-15 |
Family
ID=48619499
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011240762A Expired - Fee Related JP5703191B2 (ja) | 2011-11-02 | 2011-11-02 | 文書認識支援装置、文書検索装置及び文書管理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5703191B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110389714B (zh) * | 2018-04-20 | 2022-12-23 | 伊姆西Ip控股有限责任公司 | 用于数据输入输出的方法、装置和计算机存储介质 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06325148A (ja) * | 1993-05-14 | 1994-11-25 | Toshiba Syst Technol Kk | 発電プラント文書管理装置 |
JP2985813B2 (ja) * | 1997-01-13 | 1999-12-06 | 日本電気株式会社 | 文字列認識装置および知識データベース学習方法 |
JP2004283697A (ja) * | 2003-03-20 | 2004-10-14 | Toshiba Corp | 区分装置、データベース作成方法および文字列判定方法 |
JP2006085583A (ja) * | 2004-09-17 | 2006-03-30 | Fuji Xerox Co Ltd | 文書処理装置およびプログラム |
JP4733577B2 (ja) * | 2006-07-12 | 2011-07-27 | 日立コンピュータ機器株式会社 | 帳票認識装置及び帳票認識プログラム |
JP4712629B2 (ja) * | 2006-07-20 | 2011-06-29 | 三菱電機株式会社 | 設備仕様入力装置 |
JP4871889B2 (ja) * | 2008-01-18 | 2012-02-08 | 株式会社日立ソリューションズ | 表認識方法及び表認識装置 |
JP2010140402A (ja) * | 2008-12-15 | 2010-06-24 | Toshiba Corp | 帳票処理装置、及び方法 |
-
2011
- 2011-11-02 JP JP2011240762A patent/JP5703191B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013097633A (ja) | 2013-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9697193B2 (en) | Associating captured image data with a spreadsheet | |
RU2679209C2 (ru) | Обработка электронных документов для распознавания инвойсов | |
US20170323170A1 (en) | Method and system for data extraction from images of semi-structured documents | |
JP2734386B2 (ja) | 文字列読み取り装置 | |
US8023740B2 (en) | Systems and methods for notes detection | |
EP3779783A1 (en) | Image processing device, image processing method, and storage medium storing program | |
JP2019185141A (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP5810568B2 (ja) | 情報処理装置、プログラム、およびデータの抽出方法 | |
US8750571B2 (en) | Methods of object search and recognition | |
JP5703191B2 (ja) | 文書認識支援装置、文書検索装置及び文書管理方法 | |
JP5669041B2 (ja) | 文書処理装置及び文書処理方法 | |
US20160092729A1 (en) | Information processing device, information processing method, and computer program product | |
JP2020095374A (ja) | 文字認識システム、文字認識装置、プログラム及び文字認識方法 | |
US20160283458A1 (en) | Input assistance system, input assistance method, and input assistance program | |
JP5594134B2 (ja) | 文字列検索装置,文字列検索方法および文字列検索プログラム | |
JP2019148859A (ja) | フローダイアグラムを用いたモデル開発環境におけるデザインパターンの発見を支援する装置および方法 | |
JP6551026B2 (ja) | 候補語評価装置、候補語評価システム、プログラム及び候補語評価方法 | |
US20110172991A1 (en) | Sentence extracting method, sentence extracting apparatus, and non-transitory computer readable record medium storing sentence extracting program | |
JP5752073B2 (ja) | データ修正装置 | |
JP2003242446A (ja) | 文字列予測装置及び方法並びに当該方法を具現化するコンピュータ実行可能なプログラム | |
US9483463B2 (en) | Method and system for motif extraction in electronic documents | |
JP2010237909A (ja) | 知識補正プログラム、知識補正装置および知識補正方法 | |
JP6425989B2 (ja) | 文字認識支援プログラム、文字認識支援方法及び文字認識支援装置 | |
JP6083819B2 (ja) | 入力支援システム、入力支援方法および入力支援プログラム | |
JP5272664B2 (ja) | 情報処理装置、画像検索方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140123 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141027 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141104 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150127 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150223 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5703191 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |