JP4227057B2 - 階層型データベース入力装置および方法 - Google Patents
階層型データベース入力装置および方法 Download PDFInfo
- Publication number
- JP4227057B2 JP4227057B2 JP2004094977A JP2004094977A JP4227057B2 JP 4227057 B2 JP4227057 B2 JP 4227057B2 JP 2004094977 A JP2004094977 A JP 2004094977A JP 2004094977 A JP2004094977 A JP 2004094977A JP 4227057 B2 JP4227057 B2 JP 4227057B2
- Authority
- JP
- Japan
- Prior art keywords
- attribute
- classification
- hierarchical database
- input
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
また、入力フォームと文書管理を検索するためのインデックスとなる値が記述されている文書様式中のエリア(すなわち文書画像において値が記述されている領域の絶対位置)を登録しておくことにより、スキャナ等で読み込んだ用紙のインデックスデータを自動登録できるようにしている(例えば、特許文献3参照)。しかし、この発明ではあらかじめ入力される可能性のある様式毎にエリアを登録しておく必要がある。また、この発明では、登録先のインデックスはフラットな構造で格納されており、階層型データベースに適用することはできない。
また、データベースの分類および属性も変更されることがあり、これら双方に変更が加えられた場合、再び関連付け或いはプログラミングの修正が必要という問題があった。
この発明は、データの格納先を正確に指定することができる階層型データベース入力装置および方法を提供することを目的とする。また、この発明は、データベースの分類および属性の双方に変更が加えられても、再び関連付け或いはプログラミングの修正が必要ない階層型データベース入力装置を提供することを目的とする。
また、装置または方法に係る本発明は、コンピュータに当該発明に相当する手段を実行させるための(あるいはコンピュータを当該発明に相当する手段として機能させるための、あるいはコンピュータに当該発明に相当する機能を実現させるための)プログラムとしても成立し、該プログラムを記録したコンピュータ読み取り可能な記録媒体としても成立する。
図1は、本発明の第1の実施形態に係る階層型データベース入力装置の基本構成を機能ブロックで示した図である。
図1において、階層型データベース入力装置1は、画像データ読込部101,画像パターン解析部102,格納情報抽出部103,DBアクセス部104から構成されている。
ID−値識別ルール107cは、画像パターン解析部102で認識した文字やマークの情報から、分類や属性を特定するためのIDと、このIDに対応する値を抽出するための抽出方法をルール化したデータあり、格納情報抽出部103に入力されている。
格納情報抽出部103は、ID−値識別ルール107cから入力されたルールから、画像パターン解析部102で認識した文字やマークの情報からIDおよび値の抽出方法を取得する。そしてこの抽出方法によって格納情報抽出部103は、画像パターン解析部102で認識した文字やマークの情報から階層型データベース105へ登録するために必要となる分類や属性を特定するためのIDと、このIDに対応する値を抽出する。
DBアクセス部104は、分類属性情報105aへアクセスし、格納情報抽出部103で抽出した分類や属性を特定するためのIDによって適切なコンテンツの格納箇所を検索する。そしてDBアクセス部104は、この検索により得られたコンテンツ105bの格納箇所に、格納情報抽出部103で抽出した格納すべきデータを登録する。このようにして階層型データベース105に入力用紙106のデータが登録される。
識別ルール登録部107bは、ユーザにより入力部107aから入力された新たな識別ルールを、ID−値識別ルール107cに登録する。これにより、ユーザはID−値識別ルール107cを拡張することができる。
分類属性名パターン検索部203は、分類属性名パターン202bから入力された分類属性名パターンによって、IDマッピング201cから例えば図13に示すIDマッピングを読み出し、分類名や属性名に適切な分類IDや属性IDを割り当てる。
例えば、入力用紙Aの様式には「名前」、「住所」という2つの欄が存在し、入力用紙Bの様式には「ふりがな」、「名前」、「TEL」という3つの欄が存在しているものとする。また、分類属性名パターン202bには「名前」、「住所」の組合せはマッピンググループA’、「ふりがな」、「名前」、「TEL」の組合せはマッピンググループB’として登録されているものとする。
出力フォーム204bには、任意の様式を持つ出力用の用紙に関する情報が記録されている。この情報には、出力用の用紙の背景となるビットマップと、IDや値を出力すべき位置や領域を示す情報とが記録されている。
属性IDは、属性コードと当該属性コードが定義された分類IDとから構成される。
図4は、入力用紙106の様式の一例を示す図である。
図3に示す分類体系の階層型データベースに図4の様式で記述されたデータを読み込ませようとした場合、一枚の用紙に書かれた内容は一つの分類に全て格納されるわけではなく、分類をまたがって複数の分類に格納される場合がある。図4の例の場合一枚の用紙に書かれた内容は、分類「顧客情報」,分類「PC利用状況」,分類「PCトラブル状況」の3つの分類に格納される。
まず、画像データ読込部101により、図5の入力用紙106の画像を読み込み、画像パターン解析部102により文字や図形を認識する(ステップS901)。
次に、格納情報抽出部103により、ステップS901によって認識した文字や図形から分類IDと属性IDを抽出する(ステップS902)。本例では先に図3を用いて説明した通り、分類IDや属性IDは2つの文字列の固まりをピリオドで結んだものである。
図8に、図7の入力用紙の場合のID−値識別ルールの一例を示す。図8において、例えばルールNo.1は、分類IDは「文字.文字」で表されることがルール化されている。ルールNo.2は、属性IDは「文字.文字.文字」で表されることがルール化されている。また、ルールNo.3,4,6では、分類ID,属性ID,値は楕円(長円形)の内側に記載されていることがルール化されている。また、ルールNo.5では、値は矩形(長方形)の内側に記載されていることがルール化されている。IDと値を識別するためのルール、例えば「長方形に囲まれている」,「距離が最も近い」,・・・が定められていて、これらルールの条件のうち、より多くの条件を満たしていればいるほど、IDとその値の組み合わせである可能性が高く、識別がより正確なものであると考えることができる。ID−値識別ルールは、コンピュータが処理するためのプログラムにルールが書かれていても良い。
ユーザの確認の結果、ユーザが新しいルールを付け加える必要があると判断した場合には、ユーザに新しいルールを付け加えさせ(ステップS1104)、先のステップS1103の処理へ戻る。新しいルールの付け加えについては入力部107a,ID−値識別ルール登録部107bにより付け加えさせる。この図10に示した例の場合は、下線上に記述している文字列を値とするルールを新たにステップS1104で追加させる。
ユーザは、まず階層型データベース入力装置を、分類、属性情報からIDをマッピングさせるためのモードにする。このモードにおいてIDマッピング登録部201bはGUI機能を持ち、抽出されたIDや値をID候補表示部201aへ表示させる機能を有している。
次に、ステップS1201によって認識した文字や図形のデータは、格納情報抽出部103およびDBアクセス部104を介してID候補表示部201aに入力される。
IDマッピング登録部201bは、ステップS1205の次に、ユーザにより全てのマッピングが終了したことを示す入力がIDマッピング登録部201bの入力部から行われるか否かを判断する(ステップS1206)。
図15は、階層型データベース入力装置が、階層型データベースのデータベースを表示する際に表示様式を既存の入力用紙を与えることによって決定するときの動作を説明するためのフローチャートである。
次に、ステップS1501の解析により、分類IDと属性IDを取得する(ステップS1502)。
次に、出力様式のイメージ情報と、値の出力エリアを抽出する(ステップS1503)。
次に、検索条件を与えてデータを検索する(ステップS1504)。
次に、出力イメージ上の値の出力エリアにデータを書き込む(ステップS1505)。
次に、ユーザに登録するか否か問い合わせる(ステップS1506)。
ステップS1506の問い合わせの結果、登録するのであれば出力イメージと出力エリアの情報を出力フォーム204bに登録してから終了し(ステップS1507)、登録しないのであれば即終了する。
次に、ステップS1601の解析により、分類IDと属性IDを取得する(ステップS1602)。
次に、属性IDに対応する値を抽出する(ステップS1603)。
次に、この分類ID・属性IDに対応するアプリケーションIDを抽出する(ステップS1604)。
図17を用いてアプリケーションIDの一例を示す。図17はアプリケーションIDを説明するための入力用紙106の一例である。この図17は入力用紙106の一部を示している。
図18にアプリケーション情報105cの例を示す。アプリケーション情報の処理の記述は、WSDL(Web Services Description Language)などのスタンダードを用いることが望ましい。引数として、関係する属性IDとその値を与える。
まず、図9のステップS901〜S904を実行することにより、入力用紙106から読み込んだデータを階層型データベース105に登録する(ステップS1901)。
まず、管理者はコンテンツの確認、修正を行う(ステップS2101)。
次に、管理者が自動入力の記録を消去することを指示した場合、自動入力記録206aから当該コンテンツのデータを削除する。
入力用紙106を読み込むことによるデータ登録に加えて、紙に記述することが困難な情報、例えば画像や音声、動画などのマルチメディア情報は、携帯電話やPDMを利用し、階層型データベース105に登録する。
受信サーバ2202は、通信の受け口となるSMTPサーバ2203aあるいはWebサーバ2203bで受け付けた要求を、データベースサーバ2204に渡す機能を有する。
携帯端末2201は、2次元バーコード読取機能を持たせてもよい。
今、図5に示すアンケートである入力用紙106において、トラブルの症状の属性IDである「A_1.A02_2.P01」に写真を貼り付ける場合を例に説明する。
Claims (5)
- 下位分類が上位分類の属性を継承し、分類のIDは分類コードと当該分類を定めた団体を識別するコードによって構成され、分類が保有している属性のIDは属性コードと当該属性が定義された分類のIDとから構成されている階層構造を持つデータベースにデータを入力する階層型データベース入力装置において、
分類および属性を識別するための文字または記号と、前記分類および前記属性に割り当てられたデータとが記述された用紙を読み込む画像情報読込手段と、
この画像情報読込手段により読み込んだ画像情報から、文字またはマークを認識する画像パターン解析部と、
前記画像パターン解析部で認識した文字やマークの情報から、分類や属性を特定するためのIDの特徴情報と、このIDに対応する値の特徴情報を抽出するための抽出方法をルール化したID−値識別ルールと、
1)前記ID−値識別ルールから、前記画像パターン解析部で認識した文字やマークの特徴情報からIDおよび値の抽出方法を取得し、2)取得した前記抽出方法によって、前記分類および属性のIDと、前記分類および前記属性に割り当てに対応して前記各IDに割り当てられるデータとの組を抽出する抽出手段と、
この抽出手段により抽出された各分類および各属性のIDに対応付けて、前記各IDに割り当てられるデータを階層型データベースに登録する登録手段とを備えたことを特徴とする階層型データベース入力装置。 - 更に、前記ID−値識別ルールを新たに追加するルール登録手段を備えたことを特徴とする請求項1に記載の階層型データベース入力装置。
- 更に、前記属性のIDと前記各IDに割り当てられるデータとの組が電子データとして通信路を介して入力される受信部と、
この受信部により受信された前記各IDに割り当てられるデータを、前記属性のIDに対応付けて階層型データベースへ登録する登録手段とを備えたことを特徴とする請求項1乃至2のいずれか1項に記載の階層型データベース入力装置。 - 更に、前記用紙にはアプリケーションを識別するためのアプリケーション識別情報が記載されており、
前記画像パターン解析部の認識結果から前記アプリケーション識別情報を抽出するアプリケーション識別情報抽出手段と、
前記各IDに割り当てられるデータに関して、前記アプリケーション識別情報に応じた処理を実行するアプリケーション実行手段とを備え、
前記登録手段は、
前記各IDに割り当てられるデータに代え、前記アプリケーション識別情報に応じた処理を実行した値を階層型データベースに登録することを特徴とする請求項1乃至3のいずれか1項に記載の階層型データベース入力装置。 - 下位分類が上位分類の属性を継承し、分類のIDは分類コードと当該分類を定めた団体を識別するコードによって構成され、分類が保有している属性のIDは属性コードと当該属性が定義された分類のIDとから構成されている階層構造を持つデータベースにデータを入力する階層型データベース入力方法において、
画像情報読込手段が、分類および属性を識別するための文字または記号と、前記分類および前記属性に割り当てられたデータとが記述された用紙を読み込み、
画像パターン解析部が、この画像情報読込手段により読み込んだ画像情報から、文字またはマークを認識し、
抽出手段が、1)前記画像パターン解析部で認識した文字やマークの情報から、分類や属性を特定するためのIDの特徴情報と、このIDに対応する値の特徴情報を抽出するための抽出方法をルール化したID−値識別ルールから、前記画像パターン解析部で認識した文字やマークの特徴情報からIDおよび値の抽出方法を取得し、2)取得した前記抽出方法によって、前記分類および属性のIDと、前記分類および前記属性に割り当てに対応して前記各IDに割り当てられるデータとの組を抽出し、
登録手段が、この抽出手段により抽出された各分類および各属性のIDに対応付けて、前記各IDに割り当てられるデータを階層型データベースに登録することを特徴とする階層型データベース入力方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004094977A JP4227057B2 (ja) | 2004-03-29 | 2004-03-29 | 階層型データベース入力装置および方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004094977A JP4227057B2 (ja) | 2004-03-29 | 2004-03-29 | 階層型データベース入力装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005284501A JP2005284501A (ja) | 2005-10-13 |
JP4227057B2 true JP4227057B2 (ja) | 2009-02-18 |
Family
ID=35182834
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004094977A Expired - Fee Related JP4227057B2 (ja) | 2004-03-29 | 2004-03-29 | 階層型データベース入力装置および方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4227057B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007148913A (ja) | 2005-11-29 | 2007-06-14 | Toshiba Corp | データ作成支援システム、データ作成支援装置およびデータ作成支援プログラム |
JP5233213B2 (ja) * | 2007-09-11 | 2013-07-10 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理装置、画像処理方法および画像処理プログラム |
JP5595149B2 (ja) * | 2010-07-05 | 2014-09-24 | キヤノン株式会社 | 文書管理システム、画像処理装置、それらの制御方法及びプログラム |
-
2004
- 2004-03-29 JP JP2004094977A patent/JP4227057B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005284501A (ja) | 2005-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8189920B2 (en) | Image processing system, image processing method, and image processing program | |
US8107727B2 (en) | Document processing apparatus, document processing method, and computer program product | |
US7991778B2 (en) | Triggering actions with captured input in a mixed media environment | |
US20060045340A1 (en) | Character recognition apparatus and character recognition method | |
JP4991407B2 (ja) | 情報処理装置、その制御プログラムおよび該制御プログラムを記録したコンピュータ読み取り可能な記録媒体、ならびに制御方法 | |
JP2007025980A (ja) | 情報指定システム、情報指定方法、サーバ装置、情報指定装置及び情報指定プログラム | |
JP6786658B2 (ja) | 書類読取システム | |
JP6253354B2 (ja) | 帳票読取装置、プログラムおよび帳票読取システム | |
JP4227057B2 (ja) | 階層型データベース入力装置および方法 | |
US20150261735A1 (en) | Document processing system, document processing apparatus, and document processing method | |
JP2014006758A (ja) | 保存文書出庫管理システム及び保存文書出庫管理方法 | |
JP4673542B2 (ja) | 書類引継装置、書類引継システム及び書類引継方法 | |
JP4964080B2 (ja) | 画像処理システム、画像処理方法、画像処理プログラム | |
JP3768743B2 (ja) | ドキュメント画像処理装置及びドキュメント画像処理方法 | |
JP5445740B2 (ja) | 画像処理装置、画像処理システムおよび処理プログラム | |
JP4054453B2 (ja) | 文字認識装置およびプログラム記録媒体 | |
KR20180008382A (ko) | 정보 링크 시스템, 정보 링크 프로그램, 및 정보 링크 시스템의 운용 방법 | |
JP4372750B2 (ja) | エントリデータ管理装置及びエントリデータ管理方法、プログラム、並びに記録媒体 | |
CN110909723B (zh) | 信息处理装置及计算机可读存储介质 | |
JPWO2020240820A1 (ja) | ファイル管理装置、ファイル管理方法、及びプログラム | |
JP2008176625A (ja) | 文字認識結果の管理装置およびその方法並びにコンピュータプログラム | |
JP7377565B2 (ja) | 図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム | |
JP2014063457A (ja) | 注釈の管理システム及びその管理システムをコンピュータに実行させるためのプログラム。 | |
EP4125026A1 (en) | Product identification assistance techniques in an electronic marketplace application | |
JP7271987B2 (ja) | 情報処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080229 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080603 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080731 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080826 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081027 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081125 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081127 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111205 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111205 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |