JP4227057B2 - 階層型データベース入力装置および方法 - Google Patents

階層型データベース入力装置および方法 Download PDF

Info

Publication number
JP4227057B2
JP4227057B2 JP2004094977A JP2004094977A JP4227057B2 JP 4227057 B2 JP4227057 B2 JP 4227057B2 JP 2004094977 A JP2004094977 A JP 2004094977A JP 2004094977 A JP2004094977 A JP 2004094977A JP 4227057 B2 JP4227057 B2 JP 4227057B2
Authority
JP
Japan
Prior art keywords
attribute
classification
hierarchical database
input
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004094977A
Other languages
English (en)
Other versions
JP2005284501A (ja
Inventor
祐美子 下郡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2004094977A priority Critical patent/JP4227057B2/ja
Publication of JP2005284501A publication Critical patent/JP2005284501A/ja
Application granted granted Critical
Publication of JP4227057B2 publication Critical patent/JP4227057B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

この発明は、データベースへの入力装置および方法に関し、特に、階層型データベースへデータを入力する階層型データベース入力装置および方法に関する。
従来のデータベースシステムにおいて、データベースへのデータの登録には、キーボードから文字入力することにより登録しなければならなかった。また、登録したいデータが写真などのイメージデータの場合、デジタルカメラ等で撮ったイメージデータを一旦ファイルとして保存した後、入力端末を操作することによりデータベースに登録する作業を行う必要があった。
実際にはデータベースに登録したいデータの中にはペーパーベースのものも多い。そこで用紙に書かれた文字情報をOCR(Optical Character Recognition:光学式文字認識)装置によってイメージから文字認識(文字コードに変換)したデータをレコード形式に変換し、データベースシステムに登録するシステムが提案されている。
さらに、予め決められた様式において定まる属性、例えば、品名や会社名などを対応させ、OCR装置で文字認識したデータをデータベースに登録するシステムが提案されている。しかし、このシステムは用紙の書式を予め登録しておく必要があり、用紙に書式変更があるとプログラム部分の変更が必要になる。この問題を解決するために、読み込んだイメージファイルに対して登録する値の範囲指定、データベースの属性の指定をサポートするシステムが提案されている(例えば、特許文献1参照)。
また、用紙にマーキングを施すことによって、用紙の書式に依存せずに読むべき値の範囲を特定する技術が提案されている(例えば、特許文献2参照)。
また、入力フォームと文書管理を検索するためのインデックスとなる値が記述されている文書様式中のエリア(すなわち文書画像において値が記述されている領域の絶対位置)を登録しておくことにより、スキャナ等で読み込んだ用紙のインデックスデータを自動登録できるようにしている(例えば、特許文献3参照)。しかし、この発明ではあらかじめ入力される可能性のある様式毎にエリアを登録しておく必要がある。また、この発明では、登録先のインデックスはフラットな構造で格納されており、階層型データベースに適用することはできない。
特開平11−283000号公報 特開平10−149410号公報 特開2003−85187公報
本発明が前提としている階層型データベースにおいては、格納先に分類があり、一つの用紙に記述されているデータが必ずしも一つの分類とは限らず、データの格納先を確実に指定することが必要となる。
しかし、従来はデータの格納先を正確に指定することができないという問題があった。
また、データベースの分類および属性も変更されることがあり、これら双方に変更が加えられた場合、再び関連付け或いはプログラミングの修正が必要という問題があった。
また、特許文献3では様式毎に値のエリアと登録先を関連付けているため、入力用紙の様式の変更のたびに関連付けの変更が生じるという問題があった。
この発明は、データの格納先を正確に指定することができる階層型データベース入力装置および方法を提供することを目的とする。また、この発明は、データベースの分類および属性の双方に変更が加えられても、再び関連付け或いはプログラミングの修正が必要ない階層型データベース入力装置を提供することを目的とする。
上記の目的を達成するために、この発明の階層型データベース入力装置においては、下位分類が上位分類の属性を継承し、分類のIDは分類コードと当該分類を定めた団体を識別するコードによって構成され、分類が保有している属性のIDは属性コードと当該属性が定義された分類のIDとから構成されている階層構造を持つデータベースにデータを入力する階層型データベース入力装置において、分類および属性を識別するための文字または記号と、前記分類および前記属性に割り当てられたデータとが記述された用紙を読み込む画像情報読込手段と、この画像情報読込手段により読み込んだ画像情報を認識する画像パターン解析部と、前記画像パターン解析部の認識結果から前記分類および属性のIDと、前記分類および前記属性に割り当てに対応して前記各IDに割り当てられるデータとの組を抽出する抽出手段と、この抽出手段により抽出された各分類および各属性のIDに対応付けて、前記各IDに割り当てられるデータを階層型データベースに登録する登録手段とを備えたことを特徴とする。
また、上記の目的を達成するために、この発明の階層型データベース入力方法においては、下位分類が上位分類の属性を継承し、分類のIDは分類コードと当該分類を定めた団体を識別するコードによって構成され、分類が保有している属性のIDは属性コードと当該属性が定義された分類のIDとから構成されている階層構造を持つデータベースにデータを入力する階層型データベース入力方法において、画像情報読込手段により、分類および属性を識別するための文字または記号と、前記分類および前記属性に割り当てられたデータとが記述された用紙を読み込み、画像パターン解析部により、この画像情報読込手段により読み込んだ画像情報を認識し、抽出手段により、前記画像パターン解析部の認識結果から前記分類および属性のIDと、前記分類および前記属性に割り当てに対応して前記各IDに割り当てられるデータとの組を抽出し、登録手段により、この抽出手段により抽出された各分類および各属性のIDに対応付けて、前記各IDに割り当てられるデータを階層型データベースに登録することを特徴とする。
なお、装置に係る本発明は方法に係る発明としても成立し、方法に係る本発明は装置に係る発明としても成立する。
また、装置または方法に係る本発明は、コンピュータに当該発明に相当する手段を実行させるための(あるいはコンピュータを当該発明に相当する手段として機能させるための、あるいはコンピュータに当該発明に相当する機能を実現させるための)プログラムとしても成立し、該プログラムを記録したコンピュータ読み取り可能な記録媒体としても成立する。
この発明の階層型データベース入力装置および方法によれば、用紙に記述された情報を、用紙の様式に制約を受けることなくより正確で簡単に階層化データベースに登録することができる。また、出力についても既存の用紙を入力するだけで、階層化データベース内の情報を簡単にその様式に従って出力することができる。
以下、図面を参照しながら本発明の実施の形態について説明する。
図1は、本発明の第1の実施形態に係る階層型データベース入力装置の基本構成を機能ブロックで示した図である。
図1において、階層型データベース入力装置1は、画像データ読込部101,画像パターン解析部102,格納情報抽出部103,DBアクセス部104から構成されている。
画像データ読込部101は、スキャナあるいはファクシミリ(FAX)で、入力用紙106の画像データをセンサにより読み込む。なお、入力用紙106の画像データについては、電子カメラで読み込むようにしてもよい。
画像パターン解析部102は、画像データ読込部101により読み込んだ画像をOCRなどの解析ソフトを用いて文字やマークを認識する。
ID−値識別ルール107cは、画像パターン解析部102で認識した文字やマークの情報から、分類や属性を特定するためのIDと、このIDに対応する値を抽出するための抽出方法をルール化したデータあり、格納情報抽出部103に入力されている。
なお、この値としては、文字である必要はなく、記号,コードの他、図形、画像等のイメージであってもよい。
格納情報抽出部103は、ID−値識別ルール107cから入力されたルールから、画像パターン解析部102で認識した文字やマークの情報からIDおよび値の抽出方法を取得する。そしてこの抽出方法によって格納情報抽出部103は、画像パターン解析部102で認識した文字やマークの情報から階層型データベース105へ登録するために必要となる分類や属性を特定するためのIDと、このIDに対応する値を抽出する。
この画像情報を認識する技術については従来種々知られている画像認識技術を用いればよい。
DBアクセス部104は、分類属性情報105aへアクセスし、格納情報抽出部103で抽出した分類や属性を特定するためのIDによって適切なコンテンツの格納箇所を検索する。そしてDBアクセス部104は、この検索により得られたコンテンツ105bの格納箇所に、格納情報抽出部103で抽出した格納すべきデータを登録する。このようにして階層型データベース105に入力用紙106のデータが登録される。
このように本発明の階層型データベース入力装置は、IDの特徴を抽出することによって、このIDに対応する値の場所を相対的に取得するため、フォーマット毎に値が記述されているエリアを登録する必要はない。
図2は、図1の階層型データベース入力装置の基本構成の周辺に、新たな機能ブロックを追加した構成を示す図である。なお、図1と同じ機能ブロックには同一番号を付している。
格納情報抽出部103は、分類や属性を特定するためのIDの抽出方法や、値の抽出方法をプログラムに埋め込んでも良い。望ましくは識別方法を拡張できるようにルール化し、格納情報抽出部103のプログラムの機能を追加修正できるようにした方が良い。
入力部107aおよび識別ルール登録部107bは、ユーザにID−値識別ルール107cを拡張する機能を提供するために設けられたものである。
識別ルール登録部107bは、ユーザにより入力部107aから入力された新たな識別ルールを、ID−値識別ルール107cに登録する。これにより、ユーザはID−値識別ルール107cを拡張することができる。
IDマッピング時に、ID候補表示部201aは、入力用紙106に実際に記述されている分類名称/属性名称から、分類属性情報105aに格納されている、分類/属性の名称として使われている名称である分類名/属性名やそのシノニム名称から該当する候補の分類ID/属性IDを表示する。
IDマッピング登録部201bは、このユーザの指定に応じて、入力用紙106における分類名/属性名と分類ID/属性IDとのマッピングをIDマッピング201cに登録する。
分類属性名パターン登録部202aは、入力用紙106に存在している分類属性名パターン(分類属性名の組合せ)を、IDマッピンググループと関連付けて分類属性名パターン202bに格納する。
なお、分類属性名パターンについては、図14を用いて後で詳細に説明する。また、IDマッピンググループについては、図13を用いて後で詳細に説明する。
分類属性名パターン検索部203は、分類属性名パターン202bから入力された分類属性名パターンによって、IDマッピング201cから例えば図13に示すIDマッピングを読み出し、分類名や属性名に適切な分類IDや属性IDを割り当てる。
分類属性名パターン202bに、IDマッピンググループと関連付けて格納するのは分類属性名パターンだけでもよいが、更に、入力用紙106のイメージファイルも分類属性名パターン202bに格納するようにしてもよい。そして同じ分類属性名パターンが存在していた場合に、格納している入力用紙106のイメージファイルとの差分をとり、より差分が小さい方の入力用紙のマッピンググループであるとみなすことで、より正確に入力用紙106に対応するIDマッピングを取得することが可能となる。
本発明では、分類属性名パターンにより入力用紙106の様式がどの様式であるかを検出し、この検出結果に基づいて分類IDや属性IDをマッピングしている。
例えば、入力用紙Aの様式には「名前」、「住所」という2つの欄が存在し、入力用紙Bの様式には「ふりがな」、「名前」、「TEL」という3つの欄が存在しているものとする。また、分類属性名パターン202bには「名前」、「住所」の組合せはマッピンググループA’、「ふりがな」、「名前」、「TEL」の組合せはマッピンググループB’として登録されているものとする。
一方、IDマッピング201cにおいて、マッピンググループA’の「名前」は「A.U.P1」にマッピングされており、マッピンググループB’の「名前」は属性ID「B.U’.P2」にマッピングされているとします。
このとき入力用紙106のイメージを認識した結果「名前」、「住所」という2つの欄が存在していた場合には、まず入力用紙Aの様式であると判断され、「名前」の値は属性ID「A.U.P1」として階層化データベース105に登録される。また、入力用紙106のイメージを認識した結果「ふりがな」、「名前」、「TEL」という3つの欄が存在していた場合には、まず入力用紙Bの様式であると判断され、「名前」の値は属性ID「B.U’.P2」として階層化データベース105に登録される。
このように、入力用紙AとBにおいては同じ「名前」であっても、データ(値)の格納先を変えることができる。
出力フォーム204bには、任意の様式を持つ出力用の用紙に関する情報が記録されている。この情報には、出力用の用紙の背景となるビットマップと、IDや値を出力すべき位置や領域を示す情報とが記録されている。
出力フォーム取得部204aは、出力フォーム204bから出力用の用紙の背景となるビットマップと、IDや値を表示すべき位置や領域を示す情報と、値の表示エリアを取得する。
表示整形部204cは、DBアクセス部104から取得したデータを、出力フォーム取得部204aから取得した情報に基づいて、表示部204dや出力用紙204eへ出力する。この出力については、出力用の用紙の背景となるビットマップ上の指定の位置や領域に、IDや値を重ねて表示する。
階層型データベース105には、更に、分類属性情報105a,コンテンツ105bの他に、アプリケーション情報105cが設けられている。このアプリケーション情報105cには、例えば図18に示すようにアプリケーションIDに対応付けてアプリケーションにより実行する処理が格納されている。
アプリケーション管理部205aは、アプリケーション情報105cに格納されているアプリケーションIDおよびアプリケーションの起動方法を取得し、格納情報抽出部103により抽出された値に、任意の情報処理部205bによる処理を施し、この処理を施した値を階層型データベース105内のコンテンツ105bに格納する。
本発明の自動読取によって値が階層型データベース105に格納されたとき、DBアクセス部104は、この格納した値のコンテンツを識別できる情報を自動入力記録206aに格納する。自動読取データ管理部206cは、自動入力記録206aを参照し、表示部206cに階層型データベースに自動的に登録されたデータを表示する。これによりユーザは自動的に階層型データベース15に登録されたコンテンツが何であるかを知ることができる。
図3は、階層型データベースに格納される分類、属性およびコンテンツの構造を説明するための概念図である。以下、属性については、“[”,“]”で囲んで記す。
分類は、階層を持ち、例えば分類「ユーザ情報」の子分類には、分類「顧客」,分類「営業」,分類「サービス」という分類により、分類「ユーザ情報」を特殊化している。このように下位の階層に行けば行くほど、分類は特殊化されていく。特殊化するとより詳細な属性が必要になるので属性は追加されていき、下位は上位の汎用的な属性を継承する。
図3の例で分類「顧客」は、上位の分類「ユーザ情報」で定義されている[ユーザID],[名前]という2つの属性を継承し、更に[住所],[電話番号]という属性を新たに定義する。
また、分類「PC利用状況」のように上位の2つの分類(分類「ユーザ情報」および分類「アンケート」)の属性を併せ持つこともある。分類「PC利用状況」は、上位の分類「ユーザ情報」の属性で定義されている[ユーザID],[名前]という2つの属性,上位の分類「アンケート」の属性で定義されている[調査日付]という3つの属性を継承し、更に、[メーカー],[モデル],[シリアル番号],[OS]という4つの属性を継承している。
ISO13584において、分類IDは、SupplierBSUと呼ばれるその分類を定義した団体を識別するコードと、ClassBSUと呼ばれる分類を識別するための分類コードの2つによって表され、これら2つのコードは必須である。属性IDは、上記した分類IDに加えて、属性コードが必須である。なお、より一層細かな指定をするために、分類体系全体にコードをつけたり、分類や属性にバージョンをつけたりしても良い。
図3の例では、分類IDは団体を識別するコードと、分類コードをピリオド“.”で連結している。例えば分類「顧客」の分類IDは、団体の識別コード“A”と、分類コード“U01_1”をピリオド“.”で連結し、“A.U01_1”と表現されている。
また、属性IDは、分類コードと属性コードとをピリオド“.”で連結している。例えば分類「顧客」の属性IDは、分類「顧客」の分類IDである“A.U01_1”に、属性IDである属性コードである“P01”(住所),“P02”(電話番号)をピリオド“.”で連結し、住所と電話番号をそれぞれ“A.U01_1.P01”、“A.U01_1.P02”と表現されている。
本発明においては、「ユーザ情報」等の分類、および「ユーザID」等の属性は、標準化団体や企業において定められた特定の言語的意味をもたないIDによって記述される。
分類IDは、分類を定めた団体を識別するコードと、分類コードとから構成される。
属性IDは、属性コードと当該属性コードが定義された分類IDとから構成される。
図4は、入力用紙106の様式の一例を示す図である。
図3に示す分類体系の階層型データベースに図4の様式で記述されたデータを読み込ませようとした場合、一枚の用紙に書かれた内容は一つの分類に全て格納されるわけではなく、分類をまたがって複数の分類に格納される場合がある。図4の例の場合一枚の用紙に書かれた内容は、分類「顧客情報」,分類「PC利用状況」,分類「PCトラブル状況」の3つの分類に格納される。
図5は、図4の入力用紙106中に、図3に示した分類IDと属性IDとが加えて記載された用紙である。各分類名や属性名の下または右に、分類IDや属性IDを加えて記載されている。
この図5に示した入力用紙106が入力されたときの階層型データベース入力装置の基本的なデータの登録動作を、図9のフローチャートを用いて詳細に説明する。
まず、画像データ読込部101により、図5の入力用紙106の画像を読み込み、画像パターン解析部102により文字や図形を認識する(ステップS901)。
次に、格納情報抽出部103により、ステップS901によって認識した文字や図形から分類IDと属性IDを抽出する(ステップS902)。本例では先に図3を用いて説明した通り、分類IDや属性IDは2つの文字列の固まりをピリオドで結んだものである。
次に、格納情報抽出部103により、ステップS902で得た分類IDと属性IDを用いて、ステップS901によって認識した文字や図形から属性IDに対応する値を抽出する(ステップS903)。本例では、属性IDに最も距離の近い矩形内の文字列を値とする。また、矩形がテーブル型に配置され、一行目の各列に属性IDが記述されている場合に、二行目以下をテーブル形式の値として認識する。例えば、図5に示した入力用紙106の電話番号の属性ID「A.U01.P02」は、テーブルの形式として認識し、この属性ID「A.U01.P02」に対応する値として、「xxx−xxxx−xxxx」を抽出する。
次に、DBアクセス部104により、ステップS902,S903で得た挿入先の分類、格納すべき属性とその属性に対応する値を階層型データベース105に格納する(ステップS904)。
図5では分類IDは文字であったがこれに限定しない。分類IDは図6に示すように2次元コード化して付与しもよいし、1次元コード(バーコード)のような記号であってもよい。また、分類IDは図7に示すように、既にある入力用紙に手書きで属性IDや分類IDを登録しても良い。さらに図7の例に示すように、IDや対応する値をより正確に抽出するために予めユーザによって丸で囲む等の印をつけるようにしておき、このルールに基づいてIDや対応する値を抽出するようにしてもよい。これにより、より正確にIDや対応する値を抽出することができる。
このようにIDや対応する値を抽出するための識別ルールを追加できるように図2の構成では、ID−値識別ルール107cを拡張できるようにデータ化している。
図8に、図7の入力用紙の場合のID−値識別ルールの一例を示す。図8において、例えばルールNo.1は、分類IDは「文字.文字」で表されることがルール化されている。ルールNo.2は、属性IDは「文字.文字.文字」で表されることがルール化されている。また、ルールNo.3,4,6では、分類ID,属性ID,値は楕円(長円形)の内側に記載されていることがルール化されている。また、ルールNo.5では、値は矩形(長方形)の内側に記載されていることがルール化されている。IDと値を識別するためのルール、例えば「長方形に囲まれている」,「距離が最も近い」,・・・が定められていて、これらルールの条件のうち、より多くの条件を満たしていればいるほど、IDとその値の組み合わせである可能性が高く、識別がより正確なものであると考えることができる。ID−値識別ルールは、コンピュータが処理するためのプログラムにルールが書かれていても良い。
例えば、図8のルールには、値は矩形かまたは楕円で囲まれていると記述してあるが、入力用紙106の様式によっては図10の例に示したように値が下線の上に記述されてある場合がある。
以下、ID−値識別ルール107cに新たに下線の上に値が記載されているルールを付け加える場合の階層型データベース入力装置の動作を、図11のフローチャートを用いて詳細に説明する。
ユーザは、まず階層型データベース入力装置を、ID−値識別ルール107cに新たにルールを付け加えるモードにする。このモードにおいては、格納情報抽出部103は、ルール登録用のGUI機能を持ち、抽出された値を表示部204d等へ表示させる機能を有している。
まず、画像データ読込部101により、図10の入力用紙106の画像を読み込み、画像パターン解析部102により文字や図形を認識する(ステップS1101)。
次に、格納情報抽出部103により、ステップS1101によって認識した文字や図形から分類IDと属性IDを抽出する(ステップS1102)。本例では先に図3を用いて説明した通り、分類IDや属性IDは2つの文字列の固まりをピリオドで結んだものである。
格納情報抽出部103に抽出された値を表示部204d等へ表示させ、ユーザに対して目的の値が抽出できたかどうかを確認させる(ステップS1103)。
ユーザの確認の結果、ユーザが新しいルールを付け加える必要があると判断した場合には、ユーザに新しいルールを付け加えさせ(ステップS1104)、先のステップS1103の処理へ戻る。新しいルールの付け加えについては入力部107a,ID−値識別ルール登録部107bにより付け加えさせる。この図10に示した例の場合は、下線上に記述している文字列を値とするルールを新たにステップS1104で追加させる。
ステップS1103でユーザの確認の結果、ユーザが新しいルールを付け加える必要がないと判断した場合には、値を識別するための新しいルールをID−値識別ルール登録部107bに登録する。
このように本発明の階層型データベース入力装置は、格納情報抽出部が参照する属性IDと値の配置に関するルールを識別ルール登録部107bから追加することができる。
図12は、図4のように入力用紙106に分類IDおよび属性IDが記述されていない入力用紙106に対して、階層型データベースに格納された分類、属性情報からIDをマッピングさせるための動作を説明するためのフローチャートである。
図4に示した入力用紙106が入力されたときの階層型データベース入力装置のデータの登録動作を、図12のフローチャートを用いて詳細に説明する。
ユーザは、まず階層型データベース入力装置を、分類、属性情報からIDをマッピングさせるためのモードにする。このモードにおいてIDマッピング登録部201bはGUI機能を持ち、抽出されたIDや値をID候補表示部201aへ表示させる機能を有している。
まず、画像データ読込部101により、図4の入力用紙106の画像を読み込み、画像パターン解析部102により文字や図形を認識する(ステップS1201)。
次に、ステップS1201によって認識した文字や図形のデータは、格納情報抽出部103およびDBアクセス部104を介してID候補表示部201aに入力される。
ID候補表示部201aは、この入力された文字や図形のデータから、ユーザによって指示された分類ID/属性IDを付与したい単語から分類属性情報の名称およびシノニム名称を部分検索して分類IDの候補,属性IDの候補を抽出し、ユーザに選択させるために表示する(ステップS1202)。
次に、ユーザに分類IDの候補,属性IDの候補が正しいか否かを決定させる(ステップS1203のYES)。この分類ID,属性IDの決定の入力については、IDマッピング登録部201bの図示しない入力部により入力され、例えば複数の分類IDの候補,属性IDの候補がある場合には複数の分類IDの候補,属性IDの候補の中から、それぞれ正しい1つの分類ID,属性IDを選択させる。
もし、分類IDの候補,属性IDの候補からはもれているが、分類、属性情報の値が存在している場合には(ステップS1203のNO)、この存在している値の分類ID、属性IDをIDマッピング登録部201bの入力部によって手動で入力させ(ステップS1204)、この後ステップS1203で決定させる。
ステップS1203の次に、IDマッピング登録部201bは、分類名/属性名と分類ID/属性IDとを関連付けて、IDマッピング201cに登録する(ステップS1205)。この分類名/属性名とは、入力用紙106に実際に記載されている分類名/属性名の名前のことである。例えば、図3,4で属性名「お名前」は、属性ID「A.U01.P02」に関連付けられる。このときのIDマッピング201cに登録されるIDマッピングの例を図13に示す。
図13に示したIDマッピングのデータは、入力用紙106におけるIDマッピンググループ「図4」において、属性名「お名前」は属性ID「A.U01.P02」,属性名「ご住所」は属性ID「A.U01_1.P01」,属性名「電話番号」は属性ID「A.U01_1.P02」,分類名「ユーザ情報」は分類ID「A.U01_1」,属性名「メーカー」は属性ID「A_1.A02_1.P01」であることを示している。
このIDマッピンググループとは、IDマッピングを行ったときの入力用紙の様式を識別するためのものである。
IDマッピング登録部201bは、ステップS1205の次に、ユーザにより全てのマッピングが終了したことを示す入力がIDマッピング登録部201bの入力部から行われるか否かを判断する(ステップS1206)。
ステップS1206で入力用紙106の全ての分類名/属性名について分類ID/属性IDとのマッピング(分類名/属性名と分類ID/属性IDとの関連付け)が終了したことを示す入力が行われなければステップS1202に戻り、全ての分類名/属性名について分類ID/属性IDとのマッピングが終了したことを示す入力が行われれば、IDマッピング登録部201bは、IDマッピングの情報をIDマッピング201cに登録すると共に、IDマッピング201cおよび格納情報抽出部103を介して分類属性名パターン登録部202aを制御し、例えば図14に示すような分類属性名のパターンをマッピンググループに対応付けて分類属性名パターン202bに登録させる(ステップS1207)。図14の例では、マッピングを行った分類名/属性名と、IDマッピングのグループを保存している。
図4の入力用紙106で図12の手順でIDマッピングを行った後、階層型データベース入力装置は、「お名前」、「ご住所」、「電話番号」、「メーカー」、「モデル」、「シリアル番号」、「OS」、「症状」、「対処」、「ユーザ情報」というキーワードを含む入力用紙106を読み込んだとき、分類属性名パターン202bからIDマッピンググループである「図4」という値を取得する。そしてこのIDマッピング201c中のIDマッピンググループが「図4」であるIDマッピングデータに格納された分類ID/属性IDを適用した後、図9のステップS903およびステップS904の処理を行う。これにより図4の入力用紙106であっても、階層型データベース入力装置に図9と同一の動作を行わせることができる。
このように本発明の階層型データベース入力装置は、マッピングされた情報を後から再利用可能となっている。
図15は、階層型データベース入力装置が、階層型データベースのデータベースを表示する際に表示様式を既存の入力用紙を与えることによって決定するときの動作を説明するためのフローチャートである。
図15において、画像データ読取部101によって出力様式となる入力用紙106の画像を読み込み、文字や図形を解析する(ステップS1501)。
次に、ステップS1501の解析により、分類IDと属性IDを取得する(ステップS1502)。
次に、出力様式のイメージ情報と、値の出力エリアを抽出する(ステップS1503)。
次に、検索条件を与えてデータを検索する(ステップS1504)。
次に、出力イメージ上の値の出力エリアにデータを書き込む(ステップS1505)。
次に、ユーザに登録するか否か問い合わせる(ステップS1506)。
ステップS1506の問い合わせの結果、登録するのであれば出力イメージと出力エリアの情報を出力フォーム204bに登録してから終了し(ステップS1507)、登録しないのであれば即終了する。
このように本発明の階層型データベース入力装置は、今後もその出力フォームを再利用したい場合は、出力フォームに出力イメージおよび出力エリアの情報を格納することができる。
図16は、階層型データベース入力装置が、値を登録する際に入力用紙106に記述されている値に特定の処理を行って階層型データベース105に登録するときの動作を説明するためのフローチャートである。この処理についてはDBアクセス部104が処理を行っても、或いは図示しないプロセッサ等から構成される処理装置により処理させてもよい。
まず、画像データ読取部101によって入力用紙106の画像を読み込み、文字や図形を解析する(ステップS1601)。
次に、ステップS1601の解析により、分類IDと属性IDを取得する(ステップS1602)。
次に、属性IDに対応する値を抽出する(ステップS1603)。
次に、この分類ID・属性IDに対応するアプリケーションIDを抽出する(ステップS1604)。
図17を用いてアプリケーションIDの一例を示す。図17はアプリケーションIDを説明するための入力用紙106の一例である。この図17は入力用紙106の一部を示している。
図17の例では、「温度(℃)」は属性名であり、「A.C01.P02_A」は属性IDであり、「A.AP01」はアプリケーションID、「26」は値である。この値「26」は、アプリケーションID「A.AP01」がマッピングされている処理(図18で説明する)に与える値である。
アプリケーションIDは、その発行団体とアプリケーションを識別するコードで構成され、アプリケーションを実行する対象を絞るために分類IDや属性IDに用いられない文字、あるいは記号によって連結している。この図17に示した例では、“-”はコードとして利用しないため(ISO13584)、属性IDに対して処理を行うアプリケーションIDを“-”で連結している。
次に、ステップS1604によって得られたアプリケーションIDのアプリケーションをアプリケーション情報105cから検索する(ステップS1605)。
図18にアプリケーション情報105cの例を示す。アプリケーション情報の処理の記述は、WSDL(Web Services Description Language)などのスタンダードを用いることが望ましい。引数として、関係する属性IDとその値を与える。
ステップS1604の次に、階層型データベース入力装置は、ステップS1605で取得したアプリケーションを実行可能か否かを判定する(ステップS1606)。この実行可能か否かの判定については、図18に示すアプリケーション情報105cを解析することにより実行可能か判定すればよい。
階層型データベース入力装置は、ステップS1606で実行可能と判定されればこのアプリケーションを実行し(ステップS1607)、このアプリケーションの処理を施した値を階層型データベース105に登録する(ステップS1608)。図17および図18の例の場合、ステップS1605で取得したアプリケーションを実行可能と判定し、このアプリケーション http://www.A.com/o1?A.C01.P02_A=26 を実行(この場合にはURLへアクセス)し、取得した値を階層型データベース105に登録する。
以上説明してきたように入力用紙106の画像を読み込んで、データを階層型データベース105に自動登録した場合、OCRによる文字認識は100%の精度というわけではないため、後で管理者がデータの正確さをチェックしたりする必要がある。また、データを確認していない場合において、ユーザにそのデータが100%でないという情報を知らせる必要がある。
このように本発明の階層型データベース入力装置は、格納情報抽出部103でアプリケーションIDを抽出し、アプリケーション管理部205aでアプリケーション情報から検索されたアプリケーションの実行を行うことができる。
図19は、OCRによる文字認識を用いた自動登録による入力であることを自動入力記録206aに記録する動作を説明するためのフローチャートである。
まず、図9のステップS901〜S904を実行することにより、入力用紙106から読み込んだデータを階層型データベース105に登録する(ステップS1901)。
次に、自動入力記録206aに、分類IDに対応付けてコンテンツを一意に特定するためのIDであるコンテンツ内部IDを登録する(ステップS1902)。この自動入力記録206aの一例を図20に示す。
また、図21は管理者がデータを確認し、自動入力記録から情報を削除するときの動作を説明するためのフローチャートである。
まず、管理者はコンテンツの確認、修正を行う(ステップS2101)。
次に、管理者が自動入力の記録を消去することを指示した場合、自動入力記録206aから当該コンテンツのデータを削除する。
入力用紙106を読み込むことによるデータ登録に加えて、紙に記述することが困難な情報、例えば画像や音声、動画などのマルチメディア情報は、携帯電話やPDMを利用し、階層型データベース105に登録する。
図22は、このような場合に対応できるよう紙入力と携帯端末を組み合わせた構成の例である。 入力用紙106は、Faxやスキャナ等から構成される画像データ読込部101で画像読み込み、この読み込んだデータを遠隔地にある受信サーバ2203へ送る。このとき画像データ読込部101内のスキャナに接続されたクライアントPCで画像処理を行い、IDと値を抽出してから受信サーバ2203へ送信してもよいし、画像情報のまま受信サーバ2203へ送信してもよい。
入力用紙106の画像情報を、画像データ読込部101内のファクシミリからファクシミリ2202に一旦送信し、ファクシミリ2202が画像データを受信サーバ2203に送信する方法もある。この場合、このファクシミリ2202はファクシミリとして受信した画像情報を紙に出力するのではなく、画像情報の電子ファイルとしてサーバ5へ送信する。スキャナ機能を持った複合機であればこのような送信機能を通常有しているので、ファクシミリ2202としてはスキャナ機能を持った複合機とすればよい。
携帯電話等の移動電話やPDA等の携帯端末2201は、通信機能を持ち、メールあるいはURLによる通信が可能である。
受信サーバ2202は、通信の受け口となるSMTPサーバ2203aあるいはWebサーバ2203bで受け付けた要求を、データベースサーバ2204に渡す機能を有する。
データベースサーバ2204は、受信サーバ2202で受け取ったデータを、階層型データベース105に登録する。
携帯端末2201は、2次元バーコード読取機能を持たせてもよい。
今、図5に示すアンケートである入力用紙106において、トラブルの症状の属性IDである「A_1.A02_2.P01」に写真を貼り付ける場合を例に説明する。
ユーザは、階層型データベース105を登録するためのメールアドレスを携帯端末2201のメールアドレスに入力し、属性IDである「A_1.A02_2.P01」をメールの表題や本文等に入力すると共に携帯端末2201で撮った写真を添付して受信サーバ2203へメールを送信する。
すると受信サーバ2203内のSMTPサーバ2203a上のプログラムが携帯端末2201から受信したメールを解析し、階層型データベース105にデータを登録する命令をデータベースサーバ2204へ送る。データベースサーバ2204は、データを新たに登録する。
なお、入力用紙106が図6の場合、携帯端末2201に2次元コードリーダを取り付けるか或いは携帯端末2201に設けられた電子カメラにより2次元コードリーダの機能によって2次元コードを読み込ませ、2次元コードから分離ID/属性IDを入力するようにしてもよい。これにより、ユーザは分類IDや属性IDを入力ボタンにより打ち込む必要をなくすことができる。
また、例えばシリアル番号が2次元コード或いはバーコードであって、このコードが印刷されたシールがパーソナルコンピュータ本体に貼り付けてあるような場合、図6に示した入力用紙106の分類IDや属性IDの2次元コードと、パーソナルコンピュータ本体のシリアル番号を示す2次元コード或いはバーコードを読ませることにより、ユーザの入力負荷は大幅に削減することができる。また、入力エラーも削減することができる。
更には、入力用紙106の一部に、階層型データベースへの登録用URLあるいはメールアドレスを2次元コードにエンコードし、これを携帯端末2201に読み込ませるようにしてもよい。これにより、更に階層型データベースへの登録用URLあるいはメールアドレスについても入力する手間を削減することができる。
以上説明した通り本発明の階層型データベース入力装置は、URLやメールを利用してデータベースに画像、動画、音声等のマルチメディア情報を登録することができる。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
本発明の基本構成を説明するための図。 本発明の構成の一例を示す図。 分類、属性の一例を示す図。 入力用紙の一例を示す図。 入力用紙の一例を示す図。 入力用紙の一例を示す図。 入力用紙の一例を示す図。 ID−識別ルールの一例を示す図。 図5に示した入力用紙106が入力されたときの階層型データベース入力装置の基本的なデータの登録動作を説明するためのフローチャート。 入力用紙の一例を示す図。 ID−値識別ルール107cに新たに下線の上に値が記載されているルールを付け加える場合の階層型データベース入力装置の動作を説明するためのフローチャート。 図4のように入力用紙106に分類IDおよび属性IDが記述されていない入力用紙106に対して、階層型データベースに格納された分類、属性情報からIDをマッピングさせるための動作を説明するためのフローチャート。 IDマッピングの一例を示す図。 分類属性名パターンの一例を示す図。 階層型データベース入力装置が、階層型データベースのデータベースを表示する際に表示様式を既存の入力用紙を与えることによって決定するときの動作を説明するためのフローチャート。 階層型データベース入力装置が、値を登録する際に入力用紙106に記述されている値に特定の処理を行って階層型データベース105に登録するときの動作を説明するためのフローチャート。 アプリケーションIDの一例を説明するための図。 アプリケーション情報の一例を示す図。 OCRによる文字認識を用いた自動登録による入力であることを自動入力記録206aに記録する動作を説明するためのフローチャート。 自動入力記録の一例を示す図。 管理者がデータを確認し、自動入力記録から情報を削除するときの動作を説明するためのフローチャート。 本発明の構成の一例を示す図。
符号の説明
1…階層型データベース入力装置、101…画像データ読込部、102…画像パターン解析部、103…格納情報抽出部、104…DBアクセス部、105…階層型データベース、105a…分類属性情報、105b…コンテンツ、105c…アプリケーション情報、106…入力用紙、107a…入力部、107b…識別ルール登録部、107c…ID−値識別ルール、201a…ID候補表示部、201b…IDマッピング登録部、201c…IDマッピング、202a…分類属性名パターン登録部、202b…分類属性名パターン、203…分類属性名パターン検索部、204a…出力フォーム取得部、204b…出力フォーム、204c…表示整形部、204e…出力用紙、204d…表示部、205a…アプリケーション管理部、205b…任意の情報処理部、206a…自動入力記録、206b…自動読取データ管理部、206c…表示部206c、2201…形態端末、2202…ファクシミリ、2203…受信サーバ、2203a…SMTPサーバ、2203b…Webサーバ、2204…データベースサーバ、2205…階層型データベース。

Claims (5)

  1. 下位分類が上位分類の属性を継承し、分類のIDは分類コードと当該分類を定めた団体を識別するコードによって構成され、分類が保有している属性のIDは属性コードと当該属性が定義された分類のIDとから構成されている階層構造を持つデータベースにデータを入力する階層型データベース入力装置において、
    分類および属性を識別するための文字または記号と、前記分類および前記属性に割り当てられたデータとが記述された用紙を読み込む画像情報読込手段と、
    この画像情報読込手段により読み込んだ画像情報から、文字またはマークを認識する画像パターン解析部と、
    前記画像パターン解析部で認識した文字やマークの情報から、分類や属性を特定するためのIDの特徴情報と、このIDに対応する値の特徴情報を抽出するための抽出方法をルール化したID−値識別ルールと、
    1)前記ID−値識別ルールから、前記画像パターン解析部で認識した文字やマークの特徴情報からIDおよび値の抽出方法を取得し、2)取得した前記抽出方法によって、前記分類および属性のIDと、前記分類および前記属性に割り当てに対応して前記各IDに割り当てられるデータとの組を抽出する抽出手段と、
    この抽出手段により抽出された各分類および各属性のIDに対応付けて、前記各IDに割り当てられるデータを階層型データベースに登録する登録手段とを備えたことを特徴とする階層型データベース入力装置。
  2. 更に、前記ID−値識別ルールを新たに追加するルール登録手段を備えたことを特徴とする請求項1に記載の階層型データベース入力装置。
  3. 更に、前記属性のIDと前記各IDに割り当てられるデータとの組が電子データとして通信路を介して入力される受信部と、
    この受信部により受信された前記各IDに割り当てられるデータを、前記属性のIDに対応付けて階層型データベースへ登録する登録手段とを備えたことを特徴とする請求項1乃至2のいずれか1項に記載の階層型データベース入力装置。
  4. 更に、前記用紙にはアプリケーションを識別するためのアプリケーション識別情報が記載されており、
    前記画像パターン解析部の認識結果から前記アプリケーション識別情報を抽出するアプリケーション識別情報抽出手段と、
    前記各IDに割り当てられるデータに関して、前記アプリケーション識別情報に応じた処理を実行するアプリケーション実行手段とを備え、
    前記登録手段は、
    前記各IDに割り当てられるデータに代え、前記アプリケーション識別情報に応じた処理を実行した値を階層型データベースに登録することを特徴とする請求項1乃至3のいずれか1項に記載の階層型データベース入力装置。
  5. 下位分類が上位分類の属性を継承し、分類のIDは分類コードと当該分類を定めた団体を識別するコードによって構成され、分類が保有している属性のIDは属性コードと当該属性が定義された分類のIDとから構成されている階層構造を持つデータベースにデータを入力する階層型データベース入力方法において、
    画像情報読込手段が、分類および属性を識別するための文字または記号と、前記分類および前記属性に割り当てられたデータとが記述された用紙を読み込み、
    画像パターン解析部が、この画像情報読込手段により読み込んだ画像情報から、文字またはマークを認識し、
    抽出手段が、1)前記画像パターン解析部で認識した文字やマークの情報から、分類や属性を特定するためのIDの特徴情報と、このIDに対応する値の特徴情報を抽出するための抽出方法をルール化したID−値識別ルールから、前記画像パターン解析部で認識した文字やマークの特徴情報からIDおよび値の抽出方法を取得し、2)取得した前記抽出方法によって、前記分類および属性のIDと、前記分類および前記属性に割り当てに対応して前記各IDに割り当てられるデータとの組を抽出し、
    登録手段が、この抽出手段により抽出された各分類および各属性のIDに対応付けて、前記各IDに割り当てられるデータを階層型データベースに登録することを特徴とする階層型データベース入力方法。
JP2004094977A 2004-03-29 2004-03-29 階層型データベース入力装置および方法 Expired - Fee Related JP4227057B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004094977A JP4227057B2 (ja) 2004-03-29 2004-03-29 階層型データベース入力装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004094977A JP4227057B2 (ja) 2004-03-29 2004-03-29 階層型データベース入力装置および方法

Publications (2)

Publication Number Publication Date
JP2005284501A JP2005284501A (ja) 2005-10-13
JP4227057B2 true JP4227057B2 (ja) 2009-02-18

Family

ID=35182834

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004094977A Expired - Fee Related JP4227057B2 (ja) 2004-03-29 2004-03-29 階層型データベース入力装置および方法

Country Status (1)

Country Link
JP (1) JP4227057B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007148913A (ja) 2005-11-29 2007-06-14 Toshiba Corp データ作成支援システム、データ作成支援装置およびデータ作成支援プログラム
JP5233213B2 (ja) * 2007-09-11 2013-07-10 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置、画像処理方法および画像処理プログラム
JP5595149B2 (ja) * 2010-07-05 2014-09-24 キヤノン株式会社 文書管理システム、画像処理装置、それらの制御方法及びプログラム

Also Published As

Publication number Publication date
JP2005284501A (ja) 2005-10-13

Similar Documents

Publication Publication Date Title
US8189920B2 (en) Image processing system, image processing method, and image processing program
US8107727B2 (en) Document processing apparatus, document processing method, and computer program product
US7991778B2 (en) Triggering actions with captured input in a mixed media environment
US20060045340A1 (en) Character recognition apparatus and character recognition method
JP4991407B2 (ja) 情報処理装置、その制御プログラムおよび該制御プログラムを記録したコンピュータ読み取り可能な記録媒体、ならびに制御方法
JP2007025980A (ja) 情報指定システム、情報指定方法、サーバ装置、情報指定装置及び情報指定プログラム
JP6786658B2 (ja) 書類読取システム
JP6253354B2 (ja) 帳票読取装置、プログラムおよび帳票読取システム
JP4227057B2 (ja) 階層型データベース入力装置および方法
US20150261735A1 (en) Document processing system, document processing apparatus, and document processing method
JP2014006758A (ja) 保存文書出庫管理システム及び保存文書出庫管理方法
JP4673542B2 (ja) 書類引継装置、書類引継システム及び書類引継方法
JP4964080B2 (ja) 画像処理システム、画像処理方法、画像処理プログラム
JP3768743B2 (ja) ドキュメント画像処理装置及びドキュメント画像処理方法
JP5445740B2 (ja) 画像処理装置、画像処理システムおよび処理プログラム
JP4054453B2 (ja) 文字認識装置およびプログラム記録媒体
KR20180008382A (ko) 정보 링크 시스템, 정보 링크 프로그램, 및 정보 링크 시스템의 운용 방법
JP4372750B2 (ja) エントリデータ管理装置及びエントリデータ管理方法、プログラム、並びに記録媒体
CN110909723B (zh) 信息处理装置及计算机可读存储介质
JPWO2020240820A1 (ja) ファイル管理装置、ファイル管理方法、及びプログラム
JP2008176625A (ja) 文字認識結果の管理装置およびその方法並びにコンピュータプログラム
JP7377565B2 (ja) 図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム
JP2014063457A (ja) 注釈の管理システム及びその管理システムをコンピュータに実行させるためのプログラム。
EP4125026A1 (en) Product identification assistance techniques in an electronic marketplace application
JP7271987B2 (ja) 情報処理装置及びプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080229

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080603

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080731

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080826

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081027

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081125

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081127

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111205

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111205

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees