JP3939477B2 - Database search system and method, recording medium - Google Patents

Database search system and method, recording medium Download PDF

Info

Publication number
JP3939477B2
JP3939477B2 JP33170399A JP33170399A JP3939477B2 JP 3939477 B2 JP3939477 B2 JP 3939477B2 JP 33170399 A JP33170399 A JP 33170399A JP 33170399 A JP33170399 A JP 33170399A JP 3939477 B2 JP3939477 B2 JP 3939477B2
Authority
JP
Japan
Prior art keywords
data
metadata
information
user terminal
provided data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP33170399A
Other languages
Japanese (ja)
Other versions
JP2001147941A (en
Inventor
一仁 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NS Solutions Corp
Original Assignee
NS Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NS Solutions Corp filed Critical NS Solutions Corp
Priority to JP33170399A priority Critical patent/JP3939477B2/en
Publication of JP2001147941A publication Critical patent/JP2001147941A/en
Application granted granted Critical
Publication of JP3939477B2 publication Critical patent/JP3939477B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明はデータベース検索システムおよび方法、更にはこれらをソフトウェアの機能で実現するためのプログラムを格納した記録媒体に関し、特に、分散化された複数のデータベースから所望のデータを探し出す検索システムに用いて好適なものである。
【0002】
【従来の技術】
近年、コンピュータネットワークが急速に発達し、それに伴ってデータベースも分散化されることが多く見られるようになってきた。例えば、インターネットでは、それぞれデータを保持する複数のコンピュータがサーバあるいはクライアントとして世界中に分散され、言うなれば分散型のデータベースとして構成されている。このようなインターネットに限らず、膨大なデータを扱うシステムではデータベースが分散化される傾向にある。
【0003】
このように分散化されたデータベースから所望の情報を読み出そうとする場合に、ユーザは読み出そうとする情報が分散化しているデータベースのどこに格納されているか分からないことが多いので、それぞれのデータベース毎に対応して設けられたデータサービスサーバを順にアクセスし、所望の情報が見つかるまで検索を繰り返し行わなければならない。このように、各データベースを個々に管理する全てのデータサービスサーバに対して検索を順次行うのは、非常に多くの時間と多くの労力とを必要とする。
【0004】
また、ユーザがデータサービスサーバの在り処(インターネットのURL(Uniform Resource Locator)等のようなアドレス情報)を全て把握していなければ、全てのデータサービスサーバに対して検索を行うことは不可能である。しかしながら、分散化されたデータサービスサーバは、絶えずデータの登録や削除を行う可能性があり、また、サーバ自体のネットワークへの接続・切断も絶えず行われる可能性がある。したがって、これらのことをユーザが全て把握することは極めて困難であり、正確な情報の検索を行うことは困難となる。
【0005】
このような不便さを解消するために、例えばインターネットでは検索エンジンと呼ばれるアドレス検索サービスが存在する。この検索エンジンには、大きく分けて、メタデータとして登録したホームページのタイトル、URL、コメント等の検索用情報をもとにこれと合致するホームページを検索するタイプと、インターネット上の各ホームページにあるテキスト全文を対象として合致するホームページを検索するタイプとがある。
【0006】
前者のタイプは更に、人手によって検索用情報を登録するタイプの手動型検索エンジンと、自動的にリンクを辿ってそれぞれのデータサービスサーバから必要な情報を収集し、それを検索用情報として登録するタイプのいわゆるロボット型検索エンジンとに分けられる。
【0007】
上記ロボット型、手動型の何れのタイプの検索エンジンも、自動的あるいは手動で収集した検索用情報をもとに、例えばキーワードの入力によって必要なURLの検索を行うことができる。例を挙げると、「特許」というキーワードについて検索を行うと、そのキーワードを含む検索用情報が登録されているデータサービスサーバのURLが検索結果として出力される。ユーザは、この検索結果に含まれるURLにアクセスすることで、所望の情報を探し出すことができる。
【0008】
図6は、上記ロボット型検索エンジンを用いた従来のデータベース検索システムの構成例を示すブロック図である。図6において、データソース51は、テキストデータ、画像データ、音声データ等の各種生データを格納したデータベースである。データ加工部52は、上記データソース51の生データに様々な加工を加え、インターネット上への提供データを生成するものである。
【0009】
上記データ加工部52は、例えば、テキストデータ、画像データ、音声データを融合したホームページのデータを生成する場合は、ウェブサイトを表現するための代表的な形式であるHTMLフォーマットに従って提供データを生成する。すなわち、このHTMLフォーマットのデータ中には、テキストデータのみが記述され、画像データや音声データは、そのファイル名などがテキストデータの形で埋め込まれ、そこから生データに対してハイパーリンクが引かれる。
【0010】
また、データ加工部52は、生データとして与えられた統計データを加工してグラフ化することにより、グラフデータをインターネット上への提供データとして生成することもある。データ加工部52は、ここに挙げた例以外にも、生データであるデータソース51に対して様々な加工を施し、提供データを生成する。生成された提供データは、データサービスサーバ53に登録される。
【0011】
データサービスサーバ53は、上記データ加工部52により生成された提供データやアプリケーションをインターネット上のユーザ端末58に提供するものである。すなわち、データサービスサーバ53は、ユーザ端末58からのアクセスに応じて、要求された提供データまたはサービス等をユーザに提供する。なお、データ加工部52を備えるユーザ端末自体が、データまたはサービスを受けるユーザ端末58にもなり得る。
【0012】
なお、ここではデータソース51、データ加工部52、データサービスサーバ53およびユーザ端末58を1つずつ示しているが、インターネット上にはこれらが多数存在している。
【0013】
メタデータサーバ(検索エンジン)54は、メタデータ生成部55と、メタDB56と、検索部57とを備えている。メタデータ生成部55は、データサービスサーバ53に登録された提供データ中に張られたリンクを辿りながら、複数のデータサービスサーバ53から必要な情報(ホームページのタイトル、URL、単語、コメント文、日付等の情報)を収集し、それを検索用情報(メタデータ)としてメタDB56に登録するものである。
【0014】
検索部57は、ユーザ端末58からの検索要求に応じてメタDB56内のメタデータを検索し、その結果をユーザ端末58に返すものである。例えば、検索部57は、ユーザ端末58から検索条件として与えられたキーワードを含むメタデータをメタDB56上で検索し、この検索条件に合致するメタデータに対応する提供データを管理しているデータサービスサーバ53のURLを検索結果としてユーザ端末58に返す。これによりユーザは、インターネット上に存在する多数のデータサービスサーバ53の中から、所望の情報が含まれると思われるデータサービスサーバ53のURLを検索結果として得ることができる。
【0015】
【発明が解決しようとする課題】
しかしながら、上記図6に示した従来のデータベース検索システムでは、検索エンジン54は、データソース51の生データをもとに生成された提供データを管理しているデータサービスサーバ53から検索用情報(メタデータ)を収集していた。このとき、ロボット型の検索エンジン54は、データサービスサーバ53に登録されているコンテンツ内のURL情報を次々に辿って、提供データ中からメタデータを取り出しているだけであった。
【0016】
例えば、提供データが上述のHTMLフォーマットのデータとして登録されている場合は、ロボット型検索エンジン54は、このテキストデータ内に存在する単語やコメント文、日付などを読み取ってメタデータとして自分のメタDB56に登録したり、他ファイルへのリンクタグが存在すればそのファイル内の所在を自分のメタDB56に登録したりしているだけである。
【0017】
したがって、提供データが通常のテキストデータやHTMLフォーマットのデータであればそこからメタデータを取り出すことが可能であるが、これ以外の画像データ、音声データ、グラフデータ、CGデータ等の様々な形式のデータについてはメタデータを取り出すことができなかった。また、提供データがテキストデータの形式であっても、それがデータソース51の生データそのものではなく、例えば生データの内容を要約したような加工データである場合には、その加工データの中からしかメタデータの抽出は行うことができなかった。
【0018】
そのため、所望の画像データ、音声データ、グラフデータあるいはCGデータ等を含む情報を探し出したい場合でも、それに対応するメタデータがメタDB56上に登録されていないため、検索部57による検索によって該当するデータサービスサーバ53を見つけることはできなかった。また、生データ中には含まれていた単語であっても、要約された加工データ中にその単語が含まれていないと、その単語をキーワードとして検索した場合に、本来は該当するデータサービスサーバ53が検索結果から洩れてしまうことがあった。
【0019】
本発明は、このような問題を解決するために成されたものであり、様々な形式の生データを表したきめ細かなメタデータを登録できるようにすることにより、ユーザが要求する情報により近い回答を与えることが可能な検索エンジン(データベース検索システム)を提供することを目的とする。
【0020】
【課題を解決するための手段】
本発明のデータベース検索システムは、少なくとも1つの生データをデータソースから読み出して提供データを生成する提供データ生成手段と、上記データソース及び当該データソースを基に上記提供データ生成手段によって生成された提供データから情報を抽出して、上記提供データの所在情報を含むメタデータを生成するメタデータ生成手段と、上記メタデータを保持するメタデータ保持手段と、上記提供データを保持してユーザ端末からの要求に応じて提供データを当該ユーザ端末に提供する提供データ管理手段と、ユーザ端末からの要求に応じて上記メタデータ保持手段に保持されているメタデータを検索し、その検索結果として上記提供データ管理手段により保持されている提供データの所在情報を当該ユーザ端末に返す検索手段とを備えたことを特徴とする。
【0021】
本発明の他の態様では、上記メタデータ生成手段と上記メタデータ保持手段との間をつなぐ通信インタフェースを、上記メタデータに関する標準仕様に基づくインタフェースにより構成したことを特徴とする。
本発明のその他の態様では、上記メタデータ生成手段により上記データソースの生データから上記メタデータを抽出する対象を指定するための生成対象指定手段を備えたことを特徴とする。
本発明のその他の態様では、上記メタデータ生成手段により生成されるメタデータに対して、上記提供データ管理手段により管理されている提供データの公開に関する時限情報を付加する時限情報設定手段を備えたことを特徴とする。
本発明のその他の態様では、上記メタデータ生成手段により生成されるメタデータに対して、上記提供データ管理手段により管理されている提供データへのアクセスに関するセキュリティ情報を付加するセキュリティ情報設定手段を備えたことを特徴とする。
【0022】
また、本発明のデータベース検索方法は、ユーザ端末とネットワークで接続され、提供データ生成手段、メタデータ生成手段、メタデータ保持手段、提供データ管理手段及び検索手段を有したデータベース検索システムにおいて前記ユーザ端末からの要求に応じてデータを検索するデータベース検索方法であって、上記提供データ生成手段が、少なくとも1つの生データをデータソースから読み出して提供データを生成する工程と、上記メタデータ生成手段が、上記データソース及び当該データソースを基に上記提供データ生成手段によって生成された提供データから情報を抽出して、上記提供データの所在情報を含むメタデータを生成する工程と、上記メタデータ保持手段が、上記メタデータを保持する工程と、上記提供データ管理手段が、上記提供データを保持してユーザ端末からの要求に応じて提供データを当該ユーザ端末に提供する工程と、上記検索手段が、ユーザ端末からの要求に応じて上記メタデータ保持手段に保持されているメタデータを検索し、その検索結果として上記提供データ管理手段により保持されている提供データの所在情報を当該ユーザ端末に返す工程と、を有することを特徴とする。
【0023】
本発明の他の態様では、上記データソースの生データから上記メタデータを抽出する対象を指定可能としたことを特徴とする。
本発明のその他の態様では、上記生成されるメタデータに対して、上記提供データの公開に関する時限情報を付加することを可能としたことを特徴とする。
本発明のその他の態様では、上記生成されるメタデータに対して、上記提供データへのアクセスに関するセキュリティ情報を付加することを可能としたことを特徴とする。
【0024】
また、本発明のコンピュータ読み取り可能な記録媒体は、請求項1〜5の何れか1項に記載の各手段としてコンピュータを機能させるためのプログラムを記録したことを特徴とする。
本発明の他の態様では、請求項6〜9の何れか1項に記載のデータベース検索方法の処理手順をコンピュータに実行させるためのプログラムを記録したことを特徴とする。
【0025】
【発明の実施の形態】
以下、本発明の一実施形態を図面に基づいて説明する。
図1は、ロボット型検索エンジンを用いた本実施形態によるデータベース検索システムの構成例を示すブロック図である。
【0026】
図1において、データソース1は、テキストデータ、画像データ、音声データ、CGデータ等の各種生データを格納したデータベースである。データ生成部2は、上記データソース1の生データからインターネット上への提供データおよび検索用情報としてのメタデータを生成するものである。このデータ生成部2は、提供データ生成部21、メタデータ生成部22、データ生成制御部23、提供データ用I/F部24およびメタデータ用I/F部25を備えている。
【0027】
上記提供データ生成部21は、データソース1の生データに様々な加工を加え、インターネット上への提供データを生成する。例えば、テキストデータ、画像データ、音声データを融合したホームページのデータを生成する場合、提供データ生成部21は、ウェブサイトを表現するための代表的な形式であるHTMLフォーマットに従って提供データを生成する。
【0028】
また、提供データ生成部21は、生データとして与えられた統計データを加工してグラフ化することにより、グラフデータを上記提供データとして生成することもある。提供データ生成部21は、ここに挙げた例以外にも、生データであるデータソース1に対して様々な加工を施し、提供データを生成する。生成された提供データは、提供データ用I/F部24を介してデータサービスサーバ3に与えられ、登録される。
【0029】
メタデータ生成部22は、データソース1の生データそのもの、および提供データ生成部21により生成される提供データから必要な情報を抽出し、それをメタデータとして生成するものである。上述したように、データソース1中には、テキストデータだけでなく、画像データ、音声データ、CGデータ等の様々な形式の生データを含んでいる。本実施形態のメタデータ生成部22は、これらのテキストデータ以外の生データからもメタデータを抽出して生成する。
【0030】
例えば、メタデータの生成対象とするデータソース1がテキストデータの場合、メタデータ生成部22は、そのテキストデータの中から単語やコメント文を抽出し、あるいはそのテキストデータの作成日付、作者名、ファイル名等の情報を抽出してそれをメタデータとして生成する。
【0031】
また、メタデータの生成対象とするデータソース1が画像データ、音声データ、CGデータ等のテキスト以外のデータの場合、メタデータ生成部22は、それらのデータの作成日付、作者名、ファイル名等の情報を抽出してそれをメタデータとして生成する。
【0032】
また、写真やイラスト等と共にその解説文が記述された図書などがデータソース1となる場合には、それをイメージスキャナを用いて取り込み、その解説文をOCR(Optical Character Reader)によりテキストデータ化する。そして、その解説文のテキストデータ中から単語やコメント文を抽出してそれをメタデータとして生成することも可能である。
【0033】
さらに、提供データ生成部21によりテキストデータ、画像データ、音声データ、CGデータ等の各種データを融合したホームページのデータをHTML形式で生成した場合、メタデータ生成部22は、そのHTML形式のテキストデータ中から単語やコメント文を抽出し、あるいはそのテキストデータの作成日付、作者名、ファイル名、ホームページのタイトル、URL等の情報を抽出してそれをメタデータとして生成する。
【0034】
また、データソース1の中から複数の画像データを集めてそれぞれをサムネイル化した画像一覧のデータを提供データ生成部21で生成したような場合、メタデータ生成部22は、画像一覧データの作成日付、作者名、ファイル名等の情報や、上記画像一覧データの生成元となった複数の画像データの作成日付、作者名、ファイル名等の情報を抽出してそれをメタデータとして生成する。
【0035】
なお、以上に説明した各メタデータは、あくまでも一例を示したに過ぎないものであり、データソース1の生データあるいは提供データ中からテキストデータとして抽出可能な情報であれば、他の情報をメタデータとして生成するようにしても良い。このようにして生成されたメタデータは、メタデータ用I/F部25を介してメタデータサーバ4に与えられ、登録される。
【0036】
データ生成制御部23は、上記提供データ生成部21による提供データの生成処理、および上記メタデータ生成部22によるメタデータの生成処理を制御するものである。このデータ生成制御部23は、生成対象指定部26、時限情報付加部27およびセキュリティ情報付加部28を備えている。
【0037】
上記生成対象指定部26は、データソース1の生データ上で提供データを生成する対象、あるいはメタデータを生成する対象をユーザが任意に指定するためのものである。例えば、提供データ生成部21により提供データを生成する場合、複数ある生データのうちどれを用いて提供データを生成するか、あるいは生データ内のどの部分を用いて提供データを生成するか等について、ユーザは生成対象指定部26を用いて任意に指定することが可能である。
【0038】
また、メタデータ生成部22によりメタデータを生成する場合、複数ある生データのうちどれを用いてメタデータを生成するか、生データ中に含まれるテキストデータのどの部分から単語やコメント文を抽出するか、あるいはその生データの作成日付、作者名、ファイル名等の各種情報のうちどの情報をメタデータとして抽出するかなどについて、ユーザは生成対象指定部26を用いて任意に指定することが可能である。また、OCRを用いて取り込んだ画像とその解説文とから成るデータのうち、どの部分をメタデータとして抽出するかについても任意に指定することが可能である。
【0039】
時限情報付加部27は、メタデータ生成部22により生成されるメタデータに対して、提供データの公開時期を制限する時限情報を付加するものである。例えば、「○○○まで公開」あるいは「○○○から公開」などの提供データの公開有効期限をメタデータに設定することが可能である。ここで、インターネットは世界中を繋ぐ広域なネットワークであるので、メタデータを生成あるいは利用する場所で時差が生じることがある。そこで、時限情報としては、グリニッジ標準時で標記すると良い。また、そのメタデータに対応する生データが時限到達前に消去された場合に、当該メタデータを自動的に消去するようにしても良い。
【0040】
セキュリティ情報付加部28は、メタデータ生成部22により生成されるメタデータに対して、提供データの提供先を制限するセキュリティ情報を付加するものである。例えば、「○○○のみアクセスを可能にする」などのアクセス権情報をメタデータに設定することが可能である。これにより、提供データを見せる範囲を、データソース1の提供側で任意に設定することが可能である。
【0041】
次いで、データサービスサーバ3は、上記提供データ生成部21により生成された提供データを登録して管理し、それをインターネット上のユーザ端末5に提供するものである。このデータサービスサーバ3は、本発明の提供データ管理手段に対応する。このデータサービスサーバ3は、データ生成部2とのI/F部31と、与えられた提供データを保持する提供データDB32とを備えている。そして、ユーザ端末5からのアクセスに応じて、要求された提供データを提供データDB32から取り出してユーザに提供し、あるいは提供データを用いて所定のサービスをユーザに提供する。
【0042】
また、メタデータサーバ(検索エンジン)4は、上記メタデータ生成部22により生成されたメタデータを登録して管理するものであり、本発明のメタデータ保持手段と検索手段とを備えている。すなわち、このメタデータサーバ4は、データ生成部2とのI/F部41、メタDB42および検索部43とを備えている。このメタデータサーバ4が備えるI/F部41とデータ生成部2が備えるメタデータ用I/F部25は、従来はメタデータ生成部が検索エンジン内に備えられていたのを(図6参照)検索エンジンの外部に出し、データソース1に近いところに設けたために必要となったものである。
【0043】
上記I/F部25,41は、メタデータに関して今最も注目されている標準仕様であるXML(eXtensible Markup Language)&RDF(Resource Description Framework)のフォーマットであれば受け入れるオープンなI/Fである。このようなI/Fを用いることにより、従来のようにテキストの提供データから生成されるメタデータだけでなく、本実施形態のメタデータ生成部22により様々な形式のデータから生成されるメタデータを全てメタDB42に登録することが可能となる。
【0044】
検索部43は、ユーザ端末5からの検索要求に応じてメタDB42内のメタデータを検索し、その結果をユーザ端末5に返すものである。例えば、検索部43は、ユーザ端末5から検索条件として与えられたキーワードを含むメタデータをメタDB42上で検索し、この検索条件に合致するメタデータに対応する提供データを管理しているデータサービスサーバ3のURL等を検索結果としてユーザ端末5に返す。これによりユーザは、インターネット上に存在する多数のデータサービスサーバ3の中から、所望の情報が含まれると思われるデータサービスサーバ3のURLを検索結果として得ることができる。
【0045】
本実施形態の検索部43は、上述のようなメタデータの検索処理を実行する際に、メタデータ中に時限情報やセキュリティ情報が含まれているかどうかを判定し、含まれている場合にはその時限情報やセキュリティ情報に従って検索を実行する。例えば、時限情報として「○○○まで公開」あるいは「○○○から公開」などの情報がメタデータ中に含まれていた場合は、そのメタデータが検索条件に合致していても、時限情報により許容されていない時期においては、対応するデータサービスサーバ3のURLを検索結果の中に含ませないようにする。
【0046】
また、「○○○のみアクセスを可能にする」などのアクセス権情報がメタデータ中に含まれていた場合は、ユーザ端末5から送られてくる検索要求中に含まれるユーザ情報とそのアクセス権情報とを照らし合わせる。そして、情報を公開する者として許可されたユーザ以外には、メタデータが検索条件に合致しても、それに対応するデータサービスサーバ3のURLを検索結果の中に含ませないようにする。
【0047】
なお、以上説明した図1の構成では、データソース1、データ生成部2、データサービスサーバ3、メタデータサーバ4およびユーザ端末5を1つずつ示しているが、インターネット上にはこれらが多数存在している。このとき、データソース1は、他の構成要素とネットワーク的に繋がっていても良いし、繋がっていなくても良い。
【0048】
次に、上記図1のように構成した本実施形態によるデータベース検索システムの動作を、以下に示す様々な具体例に沿って説明する。
まず最初に、簡単な例として、テキストデータのみから成るファイルがデータソース1として与えられ、このようなデータソース1からメタデータを生成する場合について説明する。
【0049】
図2は、テキストデータのみから成るデータソース1を提供データ生成部21により加工して提供データを生成する様子を示す図であり、(a)は生データであるデータソース1の例を示し、(b)は生成された提供データの例を示している。図2(a)に示すように、データソース1は、複数のテキストファイルa1 〜an を含んでいる。それぞれのテキストファイルa1 〜an は、毎日の天気、気温、湿度をテキストデータの形で記述したものであるとする。
【0050】
提供データ生成部21は、これら複数のテキストファイルa1 〜an を用いて加工を施し、例えば図2(b)に示すように、気温や湿度の1ヵ月間の推移を表したグラフデータを生成する。このとき、この1ヵ月間の天候を要約したコメント文として、例えば「1月は晴れが多く、気温の平均は8℃」のようなテキストデータを追加するようにしても良い。このようにして生成された提供データファイルAは、I/F部24,31を介してデータサービスサーバ3に与えられ、提供データDB32に登録される。
【0051】
一方、メタデータ生成部22は、データソース1から図2(a)に示すような複数のテキストファイルa1 〜an を読み取り、それぞれのテキストファイルa1 〜an 中にタグが含まれていれば(テキストファイルa1 〜an がHTML形式の場合)、そのタグを除去する。そして、各テキストファイルa1 〜an 中からメタデータを抽出する。例えば、図2(a)に示した例の場合、“晴”“曇”“雨”などの単語、“10℃”“6℃”“7℃”などの気温、“60%”“50%”“70%”などの湿度をメタデータとして抽出することが可能である。
【0052】
さらに、メタデータ生成部22は、各テキストファイルa1 〜an の付加情報をメタデータとして抽出することも可能である。付加情報とは、各テキストファイルa1 〜an のファイル名、作成日、サイズ、拡張子等の属性情報、メタデータ生成部22がデータソース1にアクセスしたときの動作条件、アクセスしたデータソース1の作成元となったデータの情報などを示す。例えば、あるテキストファイルai が元々複数のファイルai-1 ,ai-2 ,ai-3 ,…から作られたものである場合には、その元のファイルファイルai-1 ,ai-2 ,ai-3 ,…の情報をもメタデータとして抽出することが可能である。
【0053】
上記メタデータ生成部22は、データソース1である各テキストファイルa1 〜an の他に、提供データ生成部21により生成された図2(b)のような提供データファイルAを読み取り、その中からもメタデータを抽出する。例えば、図2(b)に示した例の場合、“1月”“晴れ”などの単語、“8℃”などの気温、「1月は晴れが多く、気温の平均は8℃」のようなコメント文そのものをメタデータとして抽出することが可能である。提供データファイルAのファイル名や作成日などをメタデータとして抽出することも可能である。
【0054】
このようにメタデータ生成部22によりメタデータを抽出する際、ユーザは、生成対象指定部26を用いて、データソース1の生データや提供データからメタデータを抽出する対象部分を任意に指定することが可能である。例えば、どの生データからメタデータを抽出するか、生データに含まれるテキストデータのどの部分からメタデータを抽出するか、あるいはその生データのファイル名、作成日、作者名等の属性情報のうちどの情報をメタデータとして抽出するかなどについて、ユーザは生成対象指定部26を用いて任意に指定することが可能である。
【0055】
また、ユーザは、時限情報付加部27を用いて、メタデータ生成部22により生成されるメタデータに対して、提供データの公開に関する時限情報を付加することも可能であるし、セキュリティ情報付加部28を用いて、メタデータ生成部22により生成されるメタデータに対して、提供データへのアクセスに関するセキュリティ情報を付加することも可能である。
【0056】
このようにしてメタデータ生成部22により生成されたメタデータは、I/F部25,41を介してメタデータサーバ4に与えられ、当該メタデータに対応する提供データが登録されたデータサービスサーバ3のURL情報等と共にメタDB42に登録される。その後、ユーザ端末5からメタデータサーバ4に対して検索要求が与えられると、検索部43は、ユーザ端末5からの検索要求に応じてメタDB42内のメタデータを検索し、その検索結果をユーザ端末5に返す。
【0057】
例えば、検索部43は、ユーザ端末5から検索条件として与えられたキーワードを含むメタデータをメタDB42上で検索し、この検索条件に合致するメタデータに対応する提供データを管理しているデータサービスサーバ3のURL等を検索結果としてユーザ端末5に返す。これによりユーザは、インターネット上に存在する多数のデータサービスサーバ3の中から、所望の情報が含まれると思われるデータサービスサーバ3のURLを検索結果として得ることができる。
【0058】
その後、このようにして得たURLを頼りに、ユーザ端末5からデータサービスサーバ3に対して情報取得要求のアクセスを行うと、その要求に対する応答として、提供データDB32に登録されている図2(b)のような提供データがデータサービスサーバ3からユーザ端末5に与えられ、ユーザ端末5の表示画面上に表示される。
【0059】
以上のように、本実施形態のデータベース検索システムにおいては、データソース1の提供者とは別の場所で運営されることが多いメタデータサーバ4からメタデータ生成部22を分離し、これをデータソース1の提供者側に設けているので、従来のように提供データからだけでなく、その提供データを生成する元となった生データからもメタデータを生成することができる。
【0060】
また、本実施形態によれば、生データに対する付加情報もメタデータとして抽出することができる。この生データやその付加情報は、データソース1を作成したユーザが知り得る情報である。したがって、本実施形態のようにメタデータ生成部22をデータソース1の提供者側に設けることで、データソース提供者が生成対象指定部26を用いて抽出条件を適当に設定することにより、生データとの関連性が高い情報をメタデータに含ませることができる。
【0061】
これにより、例えば所望の単語を含む情報を探し出したい場合に、加工された提供データ中には含まれていない単語であっても、生データ中に含まれていた単語がメタデータとして抽出されていれば、その単語をキーワードとして検索した場合に該当するデータサービスサーバ3のURLを確実に得ることができ、検索結果内にユーザが望む情報をより的確に反映することができる。
【0062】
例えば図2の例で、従来であれば“1月”“晴れ”などの単語、“8℃”などの気温、“A”などのファイル名、“990201”などの提供データファイルAの作成日をキーワードとした場合にのみメタデータの検索条件が合致していた。これに対して本実施形態によれば、これ以外にも、“曇”“雨”などの単語、“10℃”“6℃”“7℃”などの気温、“60%”“50%”“70%”などの湿度、各テキストファイルa1 〜an のファイル名、作成日などをキーワードとして検索を行ってもその検索条件に合致し、該当するデータサービスサーバ3のURLを確実に得ることができる。
【0063】
この場合、例えば“10℃”の気温をキーワードとして検索を行い、その検索結果として得られたURLを頼りにデータサービスサーバ3にアクセスした場合に、その要求に対する応答としてユーザ端末5の表示画面に表示されるのは、図2(b)のような提供データである。この図2(b)の画面上には“10℃”という文字は見当たらないが、気温が“10℃”に当たる部分がグラフ中に含まれており、これもユーザがキーワードとして与えた情報を含んだ情報である。このように本実施形態によれば、提供データだけからは得られないメタデータの抽出によって、一見すると見逃しがちなデータサービスサーバ3のURLも確実に検索結果として得ることができ、検索洩れを少なくすることができる。
【0064】
また、本実施形態では、生成対象指定部26を用いてメタデータを抽出する対象部分をユーザが任意に指定できるようにしているので、メタデータの生成対象をデータソース1の提供者側で任意に設定することが可能となり、ユーザから与えられる検索条件に合致させるあるいは合致させないメタデータをデータソース1の提供者側で自由に決めることができるようになる。また、メタデータを生成する際に、生データ等から不要な情報を無闇に取得しなくても済むようになる。
【0065】
また、本実施形態では、時限情報付加部27を用いてメタデータに対して時限情報を付加することができるようにしているので、データソース1から生成される提供データを公開する時期や期間をデータソース1の提供者が任意に設定することができる。また、本実施形態では、セキュリティ情報付加部28を用いてメタデータに対してセキュリティ情報を付加することができるようにしているので、データソース1から生成される提供データを公開する相手をデータソース1の提供者が任意に設定することができる。
【0066】
次に、別の例として、画像データのみから成るファイルがデータソース1として与えられ、このようなデータソース1からメタデータを生成する場合について説明する。
【0067】
図3は、あるテーマについての画像ファイルがデータソース1としてn枚存在し、提供データ生成部21がこれらn枚の画像をそれぞれ縮小して1画面中にタイル状に配置した一覧表示ファイルAを提供データとして生成する様子を示した図であり、(a)は生データであるデータソース1の例を示し、(b)は生成された提供データの例を示している。
【0068】
図3(a)に示すように、データソース1は、複数の画像ファイルa1 〜an を含んでおり、それぞれにファイル名、作成日などの属性情報が与えられている。提供データ生成部21は、データソース1からこれら複数の画像ファイルa1 〜an を読み取り、図3(b)に示すように、各画像を縮小してタイル状に並べた一覧表示ファイル(サムネイル)Aを提供データとして生成する。このようにして生成された一覧表示ファイルAは、I/F部24,31を介してデータサービスサーバ3に与えられ、提供データDB32に登録される。
【0069】
一方、メタデータ生成部22は、データソース1から複数の画像ファイルa1 〜an を読み取る。そして、読み取った各画像ファイルa1 〜an のファイル名、作成日、サイズ、拡張子などの付加情報、メタデータ生成部22がデータソース1にアクセスしたときの動作条件、アクセスしたデータソース1の作成元となったデータの情報などをメタデータとして抽出する。
【0070】
上記メタデータ生成部22は、データソース1である各画像ファイルa1 〜an の他に、提供データ生成部21により生成された提供データである図3(b)のような一覧表示ファイルAを読み取り、その中からもメタデータを抽出する。例えば、図3(b)に示した例の場合、一覧表示ファイルAのファイル名や作成日などの属性情報、各画像を集めたテーマ名が与えられていればそのテーマ名などをメタデータとして抽出する。
【0071】
このようにメタデータ生成部22によりメタデータを抽出する際、ユーザは、生成対象指定部26を用いて、データソース1の生データや提供データからメタデータを抽出する対象部分を任意に指定することが可能である。また、ユーザは、時限情報付加部27を用いて、メタデータ生成部22により生成されるメタデータに対して時限情報を付加することも可能であるし、セキュリティ情報付加部28を用いて、メタデータ生成部22により生成されるメタデータに対してセキュリティ情報を付加することも可能である。
【0072】
このようにしてメタデータ生成部22により生成されたメタデータは、I/F部25,41を介してメタデータサーバ4に与えられ、当該メタデータに対応する提供データが登録されたデータサービスサーバ3のURL情報等と共にメタDB42に登録される。その後、ユーザ端末5からメタデータサーバ4に対して検索要求が与えられると、検索部43は、ユーザ端末5からの検索要求に応じてメタDB42内のメタデータを検索し、その検索結果をユーザ端末5に返す。
【0073】
例えば、検索部43は、ユーザ端末5から検索条件として与えられたキーワードを含むメタデータをメタDB42上で検索し、この検索条件に合致するメタデータに対応する提供データを管理しているデータサービスサーバ3のURL等を検索結果としてユーザ端末5に返す。これによりユーザは、インターネット上に存在する多数のデータサービスサーバ3の中から、所望の情報が含まれると思われるデータサービスサーバ3のURLを検索結果として得ることができる。
【0074】
その後、このようにして得たURLを頼りに、ユーザ端末5からデータサービスサーバ3に対して情報取得要求のアクセスを行うと、その要求に対する応答として、提供データDB32に登録されている図3(b)のような提供データがデータサービスサーバ3からユーザ端末5に与えられ、ユーザ端末5の表示画面上に表示される。
【0075】
従来であれば、提供データ生成部21により提供データとして生成された一覧表示ファイルAの“A”というファイル名、“991105”という一覧表示ファイルAの作成日、あるいはテーマ名などを検索条件としたときのみメタデータが検索条件にヒットしていた。
【0076】
これに対して本実施形態によれば、これ以外にも、元画像ファイルa1 〜an のファイル名、作成日などをキーワードとして検索を行ってもその検索条件に合致し、該当するデータサービスサーバ3のURLを確実に得ることができる。これにより、複数の画像ファイルa1 〜an をまとめて生成した一覧表示ファイルAだけが提供データとして公開されている場合に、個々の画像データa1 〜an に関する情報を検索条件として検索を行っても該当する情報を確実に得ることができる。つまり、検索結果内にユーザが望む情報をより的確に反映することができ、検索洩れを少なくすることができる。
【0077】
次に、さらに別の例として、画像データとテキストデータとが混在したファイルがデータソース1として与えられ、このようなデータソース1からメタデータを生成する場合について説明する。
【0078】
図4は、n個の画像データa1 〜an に対してそれぞれコメント文がテキストデータb1 〜bn の形で付されたファイルをもとに、画像データa1 〜an の部分をそれぞれ縮小して1画面中にタイル状に配置した一覧表示ファイルAを提供データとして生成する様子を示した図であり、(a)は生データであるデータソース1の例を示し、(b)は生成された提供データの例を示している。コメント文は、例えば画像の作者名、その画像の分野、解説などである。
【0079】
提供データ生成部21は、図4(a)に示すデータソース1から複数の画像テキスト混合ファイルa1 +b1 〜an +bn を読み取り、図4(b)に示すように、その中に含まれる各画像データa1 〜an を縮小してタイル状に並べた一覧表示ファイル(サムネイル)Aを提供データとして生成する。このようにして生成された一覧表示ファイルAは、I/F部24,31を介してデータサービスサーバ3に与えられ、提供データDB32に登録される。
【0080】
一方、メタデータ生成部22は、データソース1から複数の画像テキスト混合ファイルa1 +b1 〜an +bn を読み取る。そして、読み取った各ファイルa1 +b1 〜an +bn 中に含まれるテキストデータb1 〜bn からメタデータを抽出する。さらに、メタデータ生成部22は、各ファイルa1 +b1 〜an +bn のファイル名、作成日、サイズ、拡張子などの付加情報、メタデータ生成部22がデータソース1にアクセスしたときの動作条件、アクセスしたデータソース1の作成元となったデータの情報などもメタデータとして抽出する。
【0081】
上記メタデータ生成部22は、データソース1である各画像テキスト混合ファイルa1 +b1 〜an +bn の他に、提供データ生成部21により生成された提供データである図4(b)のような一覧表示ファイルAを読み取り、その中からもメタデータを抽出する。例えば、図4(b)に示した例の場合、一覧表示ファイルAのファイル名や作成日などの属性情報、各画像を集めたテーマ名が与えられていればそのテーマ名などをメタデータとして抽出する。
【0082】
このようにメタデータ生成部22によりメタデータを抽出する際、ユーザは、生成対象指定部26を用いて、データソース1の生データや提供データからメタデータを抽出する対象部分を任意に指定することが可能である。また、ユーザは、時限情報付加部27を用いて、メタデータ生成部22により生成されるメタデータに対して時限情報を付加することも可能であるし、セキュリティ情報付加部28を用いて、メタデータ生成部22により生成されるメタデータに対してセキュリティ情報を付加することも可能である。
【0083】
このようにしてメタデータ生成部22により生成されたメタデータは、I/F部25,41を介してメタデータサーバ4に与えられ、当該メタデータに対応する提供データが登録されたデータサービスサーバ3のURL情報等と共にメタDB42に登録される。その後、ユーザ端末5からメタデータサーバ4に対して検索要求が与えられると、検索部43は、ユーザ端末5からの検索要求に応じてメタDB42内のメタデータを検索し、その検索結果をユーザ端末5に返す。
【0084】
例えば、検索部43は、ユーザ端末5から検索条件として与えられたキーワードを含むメタデータをメタDB42上で検索し、この検索条件に合致するメタデータに対応する提供データを管理しているデータサービスサーバ3のURL等を検索結果としてユーザ端末5に返す。これによりユーザは、インターネット上に存在する多数のデータサービスサーバ3の中から、所望の情報が含まれると思われるデータサービスサーバ3のURLを検索結果として得ることができる。
【0085】
その後、このようにして得たURLを頼りに、ユーザ端末5からデータサービスサーバ3に対して情報取得要求のアクセスを行うと、その要求に対する応答として、提供データDB32に登録されている図4(b)のような提供データがデータサービスサーバ3からユーザ端末5に与えられ、ユーザ端末5の表示画面上に表示される。
【0086】
従来であれば、提供データ生成部21により提供データとして生成された一覧表示ファイルAの“A”というファイル名、“991105”という一覧表示ファイルAの作成日、あるいはテーマ名などを検索条件としたときのみメタデータが検索条件にヒットしていた。
【0087】
これに対して本実施形態によれば、これ以外にも、画像の作者名、分野、解説などのコメント文に含まれる単語、あるいは元ファイルa1 +b1 〜an +bn のファイル名、作成日などをキーワードとして検索を行ってもその検索条件に合致し、該当するデータサービスサーバ3のURLを確実に得ることができる。これにより、一覧表示ファイルAだけが提供データとして公開されている場合に、個々の画像データa1 〜an に関する情報や、それに対応して付されたテキストデータb1 〜bn に関する情報を検索条件として検索を行っても該当する情報を確実に得ることができる。つまり、検索結果内にユーザが望む情報をより的確に反映することができ、検索洩れを少なくすることができる。
【0088】
以上図2〜図4に示した例では、提供データ生成部21により、データソース1として存在する複数の生データファイルから1つの提供データファイルを生成する場合を例にとって説明した。以下に示す図5の例では、これとは逆に、テキストデータとして様々な情報を含む1つのファイルがデータソース1として与えられ、この1つの生データファイルから複数の提供データファイルを生成する場合のメタデータの生成について説明する。
【0089】
図5は、複数の情報x11,x12,x21,x30,…を含む1つのテキストファイルxをもとに、提供データ生成部21が必要な情報を取り出して2つのテキストファイルX1 ,X2 を提供データとして生成する様子を示した図であり、(a)は生データであるデータソース1の例を示し、(b)は生成された提供データの例を示している。
【0090】
この場合、提供データ生成部21は、図5(a)に示すデータソース1から1つのテキストファイルxを読み取り、図5(b)に示すように、その中に含まれる各情報を適宜取り出して2つの提供データファイルX1 ,X2 を提供データとして生成する。図5の例では、テキストファイルxから情報x11,x12,x30,…を取り出して提供データファイルX1 を生成し、テキストファイルxから情報x21,x30,…を取り出して提供データファイルX2 を生成している。
【0091】
このようにして生成された提供データファイルX1 ,X2 は、それぞれI/F部24,31を介してデータサービスサーバ3に与えられ、提供データDB32に登録される。このとき、上記2つの提供データファイルX1 ,X2 は、異なるデータサービスサーバ3上に登録されることもある。
【0092】
一方、メタデータ生成部22は、データソース1から1つテキストファイルxを読み取る。そして、読み取ったテキストファイルx中に含まれる情報からメタデータを抽出する。この場合、x11,x12,x21,x30,…などの個々の情報をメタデータとして抽出することが可能である。さらに、メタデータ生成部22は、上記テキストファイルxのファイル名、作成日、サイズ、拡張子などの付加情報、メタデータ生成部22がデータソース1にアクセスしたときの動作条件、アクセスしたデータソース1の作成元となったデータの情報などもメタデータとして抽出する。
【0093】
上記メタデータ生成部22は、データソース1であるテキストファイルxの他に、提供データ生成部21により生成された図5(b)のような提供データファイルX1 ,X2 を読み取り、その中からもメタデータを抽出する。例えば、図5(b)に示した例の場合、一方の提供データファイルX1 からx11,x12,x30,…などの情報をファイルX1 用のメタデータとして抽出する。また、他方の提供データファイルX2 からx21,x30,…などの情報をファイルX2 用のメタデータとして抽出する。さらに、メタデータ生成部22は、各提供データファイルX1 ,X2 のファイル名や作成日などの属性情報などもメタデータとして抽出する。
【0094】
このようにメタデータ生成部22によりメタデータを抽出する際、ユーザは、生成対象指定部26を用いて、データソース1の生データや提供データからメタデータを抽出する対象部分を任意に指定することが可能である。また、ユーザは、時限情報付加部27を用いて、メタデータ生成部22により生成されるメタデータに対して時限情報を付加することも可能であるし、セキュリティ情報付加部28を用いて、メタデータ生成部22により生成されるメタデータに対してセキュリティ情報を付加することも可能である。
【0095】
このようにしてメタデータ生成部22により生成されたメタデータは、I/F部25,41を介してメタデータサーバ4に与えられ、当該メタデータに対応する提供データが登録されたデータサービスサーバ3のURL情報等と共にメタDB42に登録される。その後、ユーザ端末5からメタデータサーバ4に対して検索要求が与えられると、検索部43は、ユーザ端末5からの検索要求に応じてメタDB42内のメタデータを検索し、その検索結果をユーザ端末5に返す。
【0096】
例えば、検索部43は、ユーザ端末5から検索条件として与えられたキーワードを含むメタデータをメタDB42上で検索し、この検索条件に合致するメタデータに対応する提供データを管理しているデータサービスサーバ3のURL等を検索結果としてユーザ端末5に返す。これによりユーザは、インターネット上に存在する多数のデータサービスサーバ3の中から、所望の情報が含まれると思われるデータサービスサーバ3のURLを検索結果として得ることができる。
【0097】
その後、このようにして得たURLを頼りに、ユーザ端末5からデータサービスサーバ3に対して情報取得要求のアクセスを行うと、その要求に対する応答として、提供データDB32に登録されている図5(b)のような提供データがデータサービスサーバ3からユーザ端末5に与えられ、ユーザ端末5の表示画面上に表示される。
【0098】
このとき、例えば“x11”の情報をキーワードとして検索をかけると、メタDB42内には“x11”というメタデータが登録されているので検索条件にヒットする。この場合は、その“x11”の情報を含む提供データファイルX1 を管理しているデータサービスサーバ3のURLが検索結果として返される。また、“x30”の情報をキーワードとして検索をかけた場合も検索条件にヒットするが、この場合は、その“x30”の情報は2つの提供データファイルX1 ,X2 の双方に含まれている。
【0099】
この場合は、例えばセキュリティ情報付加部28によりメタデータに付加されたセキュリティ情報によって検索者へのアクセスが許可されている方の提供データファイルを管理しているデータサービスサーバ3のURLを検索結果として返すようにすることが可能である。また、両方ともアクセスが許可されている場合は、提供データファイルX1 ,X2 を管理しているデータサービスサーバ3のURLを共に検索結果として返すようにする。
【0100】
このように、本実施形態のデータベース検索システムによれば、図2〜図4のようにデータソースと提供データとがn:1の関係にあるときだけでなく、図5のようにデータソースと提供データとが1:mの関係にあるときにも、生データからメタデータを生成することができる。もちろん、データソースと提供データとがn:mの関係にあるときにも、生データからメタデータを生成することが可能である。すなわち、従来は1つのデータソースからは1つの体系のメタデータしか生成できなかったが、本実施形態によれば、複数個のデータソースから複数個のメタデータ体系を生成することができるようになる。
【0101】
なお、以上の説明では、データソース1がテキストデータ、画像データあるいはその混合データである場合について説明したが、データソース1は音声データ、CGデータ等の他の形式のデータであっても良い。
【0102】
また、1つのトップページから階層的に複数のサブページを持たせたホームページにおいては、実際のサービスの内容はトップページよりもサブページの方に記述されていることが多い。そこで、各サブページの生データ中からメタデータを抽出し、それをホームページ全体のメタデータとしてメタDB42に登録しておくようにしても良い。
【0103】
このようにすれば、検索ロボットがトップページよりも下の階層のサブページには入れないようにセキュリティが設定されていても、サブページに記述された内容をキーワードとした検索によって該当するページのURLを得ることができる。この場合、提供データとしてトップページや所望のサブページを設定しておけば、検索条件に合致したキーワードが含まれるサブページがどれであるかに関わらず、最初は提供データとして指定したページを必ず開くような仕組みを提供することができる。
【0104】
また、本実施形態では、特定のアプリケーションで作成されたデータの中身をメタデータとして抽出するようにしても良い。例えば、URLが“http://www.ei.nsc.co.jp/...../991101.doc”である場合、従来であればこのファイルの中身までは検索できないが、メタデータの登録時にこのファイルの中身の文書からメタデータを抽出して登録しておくことにより、ファイルの中身の情報をキーワードとして検索することができる。
【0105】
また、上記図1の構成において、メタデータ生成部22をメタデータサーバ4内に設けることも可能であるが、この場合にはデータ生成部2からメタデータサーバ4に対して生データそのものを送る必要がある。これに対して、図1に示したようにメタデータ生成部22をデータ生成部2内に設ければ、生データ自体をメタデータサーバ4に送る必要がなく、通信トラフィックを小さく抑えることができる。また、データソース1にアクセスして提供データ生成部21により提供データを生成する際にメタデータも生成することができ、提供データの生成とメタデータ生成とを効率的に行うことができる。
【0106】
以上に説明した本実施形態のデータベース検索システムは、コンピュータのCPUあるいはMPU、RAM、ROMなどで構成されるものであり、RAMやROMに記憶されたプログラムが動作することによって実現できる。したがって、コンピュータが上記機能を果たすように動作させるプログラムを、例えばCD−ROMのような記録媒体に記録し、コンピュータに読み込ませることによって実現できるものである。上記プログラムを記録する記録媒体としては、CD−ROM以外に、フロッピーディスク、ハードディスク、磁気テープ、光磁気ディスク、不揮発性メモリカード等を用いることができる。
【0107】
また、コンピュータが供給されたプログラムを実行することにより上述の実施形態の機能が実現されるだけでなく、そのプログラムがコンピュータにおいて稼働しているOS(オペレーティングシステム)あるいは他のアプリケーションソフト等と共同して上述の実施形態の機能が実現される場合や、供給されたプログラムの処理の全てあるいは一部がコンピュータの機能拡張ボードや機能拡張ユニットにより行われて上述の実施形態の機能が実現される場合も、かかるプログラムは本発明の実施形態に含まれる。
【0108】
上記に説明した実施形態は、何れも本発明を実施するにあたっての具体化の一例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその精神、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。
【0109】
【発明の効果】
本発明は上述したように、メタデータ保持手段(メタデータサーバ)からメタデータ生成手段を分離し、これをデータソースの近くに設けてメタデータをデータソースの生データ自体から生成するようにしたので、従来のように提供データからだけでなく、その提供データを生成する元となった生データからもメタデータを得ることができる。これにより、生データとの関連性が高い情報をメタデータに含ませることができ、このメタデータを用いた検索結果の中にユーザが望む情報をより的確に反映させることができる。したがって、所望の情報を含む提供データ管理手段(データサービスサーバ)の所在情報をより確実に検索結果として得ることができるようになり、検索洩れを少なくすることができる。
【0110】
また、本発明の他の特徴によれば、データソースの生データからメタデータを抽出する対象を指定するための生成対象指定手段を設けたので、メタデータの生成対象をデータソースの提供者側で任意に設定することが可能となり、ユーザから与えられる検索条件に合致させるあるいは合致させないメタデータをデータソース提供者側で自由に決めることができるようになる。
【0111】
また、本発明のその他の特徴によれば、提供データの公開に関する時限情報をメタデータに付加する時限情報設定手段を設けたので、提供データの公開を許可する時期や期間以外では、与えられた検索条件自体には合致していても、提供データ管理手段(データサービスサーバ)の所在情報を検索結果として出力しないようにすることができ、提供データを公開する時期や期間をデータソースの提供者が任意に設定することができる。
【0112】
また、本発明のその他の特徴によれば、提供データへのアクセスに関するセキュリティ情報をメタデータに付加するセキュリティ情報設定手段を設けたので、提供データへのアクセスを許可するユーザ以外には提供データ管理手段(データサービスサーバ)の所在情報を検索結果として出力しないようにすることができ、提供データを公開するユーザをデータソースの提供者が任意に設定することができる。
【図面の簡単な説明】
【図1】ロボット型検索エンジンを用いた本実施形態によるデータベース検索システムの構成例を示すブロック図である。
【図2】テキストデータのみから成るデータソースを加工して提供データを生成する様子を示す図である。
【図3】画像データのみから成るデータソースを加工して提供データを生成する様子を示す図である。
【図4】テキストデータと画像データとが混在したデータソースを加工して提供データを生成する様子を示す図である。
【図5】複数の情報を含む1つのテキストファイルを加工して複数の提供データを生成する様子を示す図である。
【図6】ロボット型検索エンジンを用いた従来のデータベース検索システムの構成例を示すブロック図である。
【符号の説明】
1 データソース
2 データ生成部
3 データサービスサーバ
4 メタデータサーバ(検索エンジン)
5 ユーザ端末
21 提供データ生成部
22 メタデータ生成部
23 データ生成制御部
24 提供データ用I/F部
25 メタデータ用I/F部
26 生成対象指定部
27 時限情報付加部
28 セキュリティ情報付加部
31 提供データ用I/F部
32 提供データDB
41 メタデータ用I/F部
42 メタDB
43 検索部
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a database search system and method, and further to a recording medium storing a program for realizing these functions with software functions, and is particularly suitable for use in a search system for searching for desired data from a plurality of distributed databases. It is a thing.
[0002]
[Prior art]
In recent years, computer networks have rapidly developed, and along with this, it has been often seen that databases are also distributed. For example, on the Internet, a plurality of computers each holding data are distributed as servers or clients all over the world, in other words, configured as a distributed database. Databases tend to be distributed not only in the Internet but also in systems that handle huge amounts of data.
[0003]
When trying to read desired information from a database distributed in this way, users often do not know where the information to be read is stored in the distributed database. The data service server provided for each database is accessed in order, and the search must be repeated until the desired information is found. As described above, it takes a lot of time and a lot of labor to sequentially search all the data service servers that manage each database individually.
[0004]
In addition, if the user does not know all the location of the data service server (address information such as Internet URL (Uniform Resource Locator)), it is impossible to search all data service servers. is there. However, the distributed data service server may constantly register and delete data, and the server itself may also be continuously connected to and disconnected from the network. Therefore, it is extremely difficult for the user to grasp all of these things, and it is difficult to search for accurate information.
[0005]
In order to eliminate such inconvenience, for example, the Internet has an address search service called a search engine. This search engine is broadly divided into a type that searches for a home page that matches the search information such as the title, URL, and comment of the home page registered as metadata, and a text on each home page on the Internet. There is a type that searches for a matching home page in the full text.
[0006]
The former type is a manual search engine that manually registers search information, and automatically collects necessary information from each data service server by following links and registers it as search information. It is divided into so-called robot type search engines.
[0007]
Both the robot type and manual type search engines can search for necessary URLs by inputting keywords, for example, based on search information collected automatically or manually. For example, when a search is performed for the keyword “patent”, the URL of the data service server in which search information including the keyword is registered is output as a search result. The user can search for desired information by accessing the URL included in the search result.
[0008]
FIG. 6 is a block diagram showing a configuration example of a conventional database search system using the robot type search engine. In FIG. 6, a data source 51 is a database that stores various raw data such as text data, image data, and audio data. The data processing unit 52 performs various processing on the raw data of the data source 51 to generate data provided on the Internet.
[0009]
For example, in the case of generating homepage data in which text data, image data, and audio data are merged, the data processing unit 52 generates provided data in accordance with an HTML format that is a typical format for representing a website. . In other words, only text data is described in the HTML format data, and the file name of image data and audio data is embedded in the form of text data, and a hyperlink is drawn from the raw data. .
[0010]
In addition, the data processing unit 52 may generate graph data as data to be provided on the Internet by processing the statistical data given as raw data into a graph. In addition to the examples given here, the data processing unit 52 performs various processes on the data source 51 that is raw data to generate provided data. The generated provision data is registered in the data service server 53.
[0011]
The data service server 53 provides the provided data and applications generated by the data processing unit 52 to the user terminal 58 on the Internet. That is, the data service server 53 provides the requested provided data or service to the user in response to access from the user terminal 58. Note that the user terminal itself provided with the data processing unit 52 can also be a user terminal 58 that receives data or services.
[0012]
Here, one data source 51, one data processing unit 52, one data service server 53, and one user terminal 58 are shown, but there are many of them on the Internet.
[0013]
The metadata server (search engine) 54 includes a metadata generation unit 55, a meta DB 56, and a search unit 57. The metadata generation unit 55 follows necessary links (homepage titles, URLs, words, comment sentences, dates) from a plurality of data service servers 53 while following links provided in the provided data registered in the data service server 53. Are registered in the meta DB 56 as search information (metadata).
[0014]
The search unit 57 searches for metadata in the meta DB 56 in response to a search request from the user terminal 58 and returns the result to the user terminal 58. For example, the search unit 57 searches the metadata including a keyword given as a search condition from the user terminal 58 on the meta DB 56, and manages the provided data corresponding to the metadata that matches the search condition. The URL of the server 53 is returned to the user terminal 58 as a search result. As a result, the user can obtain the URL of the data service server 53 that is supposed to contain the desired information from among a large number of data service servers 53 existing on the Internet as a search result.
[0015]
[Problems to be solved by the invention]
However, in the conventional database search system shown in FIG. 6, the search engine 54 retrieves search information (metadata) from the data service server 53 that manages the provided data generated based on the raw data of the data source 51. Data). At this time, the robot-type search engine 54 only traces the URL information in the content registered in the data service server 53 and extracts metadata from the provided data.
[0016]
For example, when the provided data is registered as data in the above-described HTML format, the robot-type search engine 54 reads words, comment sentences, dates, etc. existing in the text data and uses its own meta DB 56 as metadata. If there is a link tag to another file, the location in the file is only registered in its own meta DB 56.
[0017]
Therefore, if the provided data is normal text data or HTML format data, it is possible to extract metadata from the text data, but other formats such as image data, audio data, graph data, CG data, etc. For data, metadata could not be retrieved. Further, even if the provided data is in the form of text data, if the provided data is not the raw data itself of the data source 51 but is, for example, processed data that summarizes the contents of the raw data, the processed data is selected from the processed data. However, the metadata could not be extracted.
[0018]
For this reason, even if it is desired to search for information including desired image data, audio data, graph data, CG data, etc., the corresponding data is not registered in the meta DB 56, so that the corresponding data is searched by the search unit 57. The service server 53 could not be found. In addition, even if the word is included in the raw data, if the word is not included in the summarized processed data, when the word is searched as a keyword, the corresponding data service server 53 sometimes leaked from the search results.
[0019]
The present invention has been made to solve such problems, and by making it possible to register fine-grained metadata representing various types of raw data, an answer closer to the information requested by the user. It is an object to provide a search engine (database search system) capable of providing
[0020]
[Means for Solving the Problems]
The database search system according to the present invention includes provision data generation means for reading out at least one raw data from a data source and generating provision data, and the provision generated by the provision data generation means based on the data source and the data source. Extracting information from the data and generating metadata including location information of the provided data, metadata holding means for holding the metadata, and holding the provided data from the user terminal The provided data management means for providing the provided data to the user terminal in response to the request, and the metadata held in the metadata holding means in response to the request from the user terminal, and the provided data as the search result Retrieval means for returning location information of provided data held by the management means to the user terminal Characterized by comprising a.
[0021]
In another aspect of the present invention, the communication interface connecting the metadata generation means and the metadata holding means is configured by an interface based on a standard specification related to the metadata.
In another aspect of the present invention, a generation target designating unit for designating a target for extracting the metadata from the raw data of the data source by the metadata generation unit is provided.
In another aspect of the present invention, there is provided time limit information setting means for adding to the metadata generated by the metadata generation means time limit information related to the release of the provided data managed by the provided data management means. It is characterized by that.
In another aspect of the present invention, security information setting means for adding security information related to access to the provided data managed by the provided data managing means to the metadata generated by the metadata generating means is provided. It is characterized by that.
[0022]
The database search method of the present invention is connected to a user terminal through a network, and the user terminal in a database search system having provided data generation means, metadata generation means, metadata holding means, provided data management means, and search means. A database search method for searching for data in response to a request from the step, wherein the provided data generation means reads at least one raw data from a data source to generate provided data, and the metadata generation means includes: Extracting the information from the data source and the provision data generated by the provision data generation unit based on the data source to generate metadata including the location information of the provision data; and the metadata holding unit, , The step of holding the metadata, and the provided data management means The step of holding the provided data and providing the provided data to the user terminal in response to a request from the user terminal, and the search means are held in the metadata holding means in response to a request from the user terminal And searching for metadata and returning the location information of the provided data held by the provided data management means to the user terminal as a search result.
[0023]
In another aspect of the present invention, it is possible to specify a target for extracting the metadata from the raw data of the data source.
Another aspect of the present invention is characterized in that it is possible to add time limit information related to the disclosure of the provided data to the generated metadata.
In another aspect of the present invention, security information relating to access to the provided data can be added to the generated metadata.
[0024]
A computer-readable recording medium according to the present invention is characterized in that a program for causing a computer to function as each means according to any one of claims 1 to 5 is recorded.
In another aspect of the present invention, a program for causing a computer to execute the processing procedure of the database search method according to any one of claims 6 to 9 is recorded.
[0025]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram showing a configuration example of a database search system according to this embodiment using a robot type search engine.
[0026]
In FIG. 1, a data source 1 is a database that stores various raw data such as text data, image data, audio data, and CG data. The data generation unit 2 generates data provided on the Internet and metadata as search information from the raw data of the data source 1. The data generation unit 2 includes a provision data generation unit 21, a metadata generation unit 22, a data generation control unit 23, a provision data I / F unit 24, and a metadata I / F unit 25.
[0027]
The provided data generation unit 21 performs various processes on the raw data of the data source 1 to generate provided data on the Internet. For example, when generating homepage data in which text data, image data, and audio data are merged, the provision data generation unit 21 generates provision data in accordance with an HTML format that is a typical format for representing a website.
[0028]
Further, the provision data generation unit 21 may generate graph data as the provision data by processing the statistical data given as raw data into a graph. In addition to the examples given here, the provided data generation unit 21 performs various processes on the data source 1 that is raw data to generate provided data. The provided provision data is given to the data service server 3 via the provision data I / F unit 24 and registered.
[0029]
The metadata generation unit 22 extracts necessary information from the raw data itself of the data source 1 and the provision data generated by the provision data generation unit 21, and generates it as metadata. As described above, the data source 1 includes not only text data but also raw data in various formats such as image data, audio data, and CG data. The metadata generation unit 22 of the present embodiment extracts and generates metadata from raw data other than the text data.
[0030]
For example, when the data source 1 that is the generation target of metadata is text data, the metadata generation unit 22 extracts words or comment sentences from the text data, or the creation date, author name, Information such as a file name is extracted and generated as metadata.
[0031]
In addition, when the data source 1 that is the generation target of metadata is data other than text such as image data, audio data, and CG data, the metadata generation unit 22 creates the creation date, author name, file name, and the like of the data. Is extracted and generated as metadata.
[0032]
In addition, when a data source 1 is a book in which the description text is described together with a photo, an illustration, etc., it is captured using an image scanner, and the description text is converted into text data using an OCR (Optical Character Reader). . It is also possible to extract words and comment sentences from the text data of the commentary sentences and generate them as metadata.
[0033]
Furthermore, when the provided data generation unit 21 generates home page data in which various types of data such as text data, image data, audio data, and CG data are merged in the HTML format, the metadata generation unit 22 displays the HTML format text data. Words or comment sentences are extracted from the information, or information such as the creation date, author name, file name, home page title, URL, etc. of the text data is extracted and generated as metadata.
[0034]
When the provided data generation unit 21 generates image list data in which a plurality of image data is collected from the data source 1 and converted into thumbnails, the metadata generation unit 22 generates the image list data creation date. The information such as the author name and the file name, and the creation date, the author name, and the file name of the plurality of image data that is the generation source of the image list data are extracted and generated as metadata.
[0035]
Note that each of the metadata described above is merely an example. If the information can be extracted as text data from the raw data or provided data of the data source 1, the other information is meta-data. It may be generated as data. The metadata generated in this way is given to the metadata server 4 via the metadata I / F unit 25 and registered.
[0036]
The data generation control unit 23 controls provision data generation processing by the provision data generation unit 21 and metadata generation processing by the metadata generation unit 22. The data generation control unit 23 includes a generation target specifying unit 26, a time limit information adding unit 27, and a security information adding unit 28.
[0037]
The generation target specifying unit 26 is used by the user to arbitrarily specify a target for generating provided data on the raw data of the data source 1 or a target for generating metadata. For example, when the provision data is generated by the provision data generation unit 21, which of the plurality of raw data is used to generate the provision data, which part of the raw data is used to generate the provision data, etc. The user can arbitrarily specify using the generation target specifying unit 26.
[0038]
In addition, when generating metadata by the metadata generation unit 22, which of the plurality of raw data is used to generate the metadata, and from which part of the text data included in the raw data, words and comment sentences are extracted The user can arbitrarily specify, using the generation target specifying unit 26, which information to extract as metadata among various information such as the creation date, author name, and file name of the raw data. Is possible. In addition, it is possible to arbitrarily specify which part of the data composed of the image captured using the OCR and its explanatory text is to be extracted as metadata.
[0039]
The time information adding unit 27 adds time information for limiting the disclosure time of the provided data to the metadata generated by the metadata generating unit 22. For example, it is possible to set the publication expiration date of the provided data such as “Publish to XXX” or “Publish from XXX” in the metadata. Here, since the Internet is a wide-area network that connects the world, there may be a time difference between places where metadata is generated or used. Therefore, the time limit information may be indicated by Greenwich Mean Time. Further, when the raw data corresponding to the metadata is deleted before reaching the time limit, the metadata may be automatically deleted.
[0040]
The security information adding unit 28 adds security information that restricts the provision destination of the provided data to the metadata generated by the metadata generating unit 22. For example, it is possible to set access right information such as “allow access only to XXX” in the metadata. As a result, the range in which the provided data can be viewed can be arbitrarily set on the providing side of the data source 1.
[0041]
Next, the data service server 3 registers and manages the provision data generated by the provision data generation unit 21 and provides it to the user terminal 5 on the Internet. This data service server 3 corresponds to the provided data management means of the present invention. The data service server 3 includes an I / F unit 31 with the data generation unit 2 and a provision data DB 32 that holds the provided provision data. Then, in response to access from the user terminal 5, the requested provision data is extracted from the provision data DB 32 and provided to the user, or a predetermined service is provided to the user using the provision data.
[0042]
The metadata server (search engine) 4 registers and manages the metadata generated by the metadata generation unit 22 and includes the metadata holding means and the search means of the present invention. That is, the metadata server 4 includes an I / F unit 41 with the data generation unit 2, a meta DB 42, and a search unit 43. The I / F unit 41 included in the metadata server 4 and the metadata I / F unit 25 included in the data generation unit 2 are conventionally provided with a metadata generation unit in the search engine (see FIG. 6). ) It was necessary because it was placed outside the search engine and placed near the data source 1.
[0043]
The I / F units 25 and 41 are open I / Fs that accept XML (eXtensible Markup Language) & RDF (Resource Description Framework) format, which is a standard specification that is currently attracting the most attention regarding metadata. By using such an I / F, not only metadata generated from text provision data as in the past, but also metadata generated from various types of data by the metadata generation unit 22 of the present embodiment. Can be registered in the meta DB 42.
[0044]
The search unit 43 searches for metadata in the meta DB 42 in response to a search request from the user terminal 5 and returns the result to the user terminal 5. For example, the search unit 43 searches the meta DB 42 for metadata including a keyword given as a search condition from the user terminal 5 and manages the provided data corresponding to the metadata that matches the search condition. The URL of the server 3 is returned to the user terminal 5 as a search result. As a result, the user can obtain the URL of the data service server 3 that is considered to contain the desired information from among a large number of data service servers 3 existing on the Internet as a search result.
[0045]
The search unit 43 according to the present embodiment determines whether or not the metadata includes time limit information or security information when performing the metadata search process as described above. The search is executed according to the time limit information and security information. For example, if information such as “publish until XXX” or “publish from XXX” is included in the metadata as the time information, the time information will be displayed even if the metadata matches the search conditions. In the period not permitted by the above, the URL of the corresponding data service server 3 is not included in the search result.
[0046]
In addition, when access right information such as “only access is allowed” is included in the metadata, the user information included in the search request sent from the user terminal 5 and its access right Check information. In addition, even if the metadata matches the search condition, the URL of the data service server 3 corresponding to the metadata is not included in the search result except for a user who is permitted as a person who discloses information.
[0047]
In the configuration of FIG. 1 described above, the data source 1, the data generation unit 2, the data service server 3, the metadata server 4, and the user terminal 5 are shown one by one, but there are many of these on the Internet. is doing. At this time, the data source 1 may or may not be connected to other components in a network.
[0048]
Next, the operation of the database search system according to the present embodiment configured as shown in FIG. 1 will be described according to various specific examples shown below.
First, as a simple example, a case where a file consisting only of text data is given as the data source 1 and metadata is generated from the data source 1 will be described.
[0049]
FIG. 2 is a diagram showing a state in which provided data is generated by processing the data source 1 consisting only of text data by the provided data generation unit 21, and (a) shows an example of the data source 1 that is raw data. (B) has shown the example of the provision data produced | generated. As shown in FIG. 2A, the data source 1 includes a plurality of text files a 1 ~ A n Is included. Each text file a 1 ~ A n Is a description of daily weather, temperature, and humidity in the form of text data.
[0050]
The provided data generation unit 21 uses the plurality of text files a 1 ~ A n For example, as shown in FIG. 2B, graph data representing the transition of temperature and humidity over one month is generated. At this time, for example, text data such as “January is sunny and the average temperature is 8 ° C.” may be added as a comment sentence summarizing the weather for one month. The provision data file A generated in this way is given to the data service server 3 via the I / F units 24 and 31 and registered in the provision data DB 32.
[0051]
On the other hand, the metadata generation unit 22 receives a plurality of text files a from the data source 1 as shown in FIG. 1 ~ A n Read each text file a 1 ~ A n If the tag is included in (text file a 1 ~ A n Is in HTML format), the tag is removed. And each text file a 1 ~ A n Extract metadata from inside. For example, in the example shown in FIG. 2A, words such as “clear”, “cloudy”, and “rain”, temperatures such as “10 ° C.”, “6 ° C.”, and “7 ° C.”, “60%”, “50%” Humidity such as “70%” can be extracted as metadata.
[0052]
Further, the metadata generation unit 22 sends each text file a 1 ~ A n It is also possible to extract the additional information as metadata. Additional information refers to each text file a 1 ~ A n Attribute information such as file name, creation date, size, extension, etc., operating conditions when the metadata generation unit 22 accesses the data source 1, information on the data that is the creation source of the accessed data source 1, and the like . For example, a text file a i Originally has multiple files a i-1 , A i-2 , A i-3 ,..., The original file file a i-1 , A i-2 , A i-3 ,... Can also be extracted as metadata.
[0053]
The metadata generation unit 22 receives each text file a that is the data source 1. 1 ~ A n In addition, the provided data file A as shown in FIG. 2B generated by the provided data generation unit 21 is read, and metadata is extracted from the read data file A. For example, in the example shown in FIG. 2B, a word such as “January” or “sunny”, an air temperature such as “8 ° C.”, “January is sunny and the average temperature is 8 ° C.” Comment text itself can be extracted as metadata. The file name and creation date of the provided data file A can be extracted as metadata.
[0054]
Thus, when extracting metadata by the metadata generation unit 22, the user uses the generation target specification unit 26 to arbitrarily specify a target portion from which metadata is extracted from raw data or provided data of the data source 1. It is possible. For example, from which raw data the metadata is extracted, from which part of the text data included in the raw data the metadata is extracted, or among the attribute information such as the file name, creation date, author name, etc. of the raw data The user can arbitrarily specify which information is extracted as metadata using the generation target specifying unit 26.
[0055]
In addition, the user can add time information regarding the disclosure of the provided data to the metadata generated by the metadata generation unit 22 using the time information addition unit 27, and the security information addition unit 28, it is also possible to add security information related to access to the provided data to the metadata generated by the metadata generation unit 22.
[0056]
The metadata generated by the metadata generation unit 22 in this way is provided to the metadata server 4 via the I / F units 25 and 41, and the data service server in which the provision data corresponding to the metadata is registered. 3 is registered in the meta DB 42 together with the URL information 3. Thereafter, when a search request is given from the user terminal 5 to the metadata server 4, the search unit 43 searches the metadata in the meta DB 42 in response to the search request from the user terminal 5, and the search result is sent to the user. Return to terminal 5.
[0057]
For example, the search unit 43 searches the meta DB 42 for metadata including a keyword given as a search condition from the user terminal 5 and manages the provided data corresponding to the metadata that matches the search condition. The URL of the server 3 is returned to the user terminal 5 as a search result. As a result, the user can obtain the URL of the data service server 3 that is considered to contain the desired information from among a large number of data service servers 3 existing on the Internet as a search result.
[0058]
Thereafter, when the information acquisition request is accessed from the user terminal 5 to the data service server 3 based on the URL obtained in this manner, FIG. 2 (FIG. 2) registered in the provision data DB 32 as a response to the request. Provided data such as b) is given from the data service server 3 to the user terminal 5 and displayed on the display screen of the user terminal 5.
[0059]
As described above, in the database search system of the present embodiment, the metadata generation unit 22 is separated from the metadata server 4 that is often operated at a place different from the provider of the data source 1, and this is used as data. Since it is provided on the provider side of the source 1, metadata can be generated not only from the provided data as in the prior art but also from the raw data from which the provided data is generated.
[0060]
Further, according to the present embodiment, additional information for raw data can also be extracted as metadata. This raw data and its additional information are information that the user who created the data source 1 can know. Therefore, by providing the metadata generation unit 22 on the provider side of the data source 1 as in the present embodiment, the data source provider appropriately sets the extraction condition using the generation target specification unit 26, thereby generating the live data. Information that is highly relevant to data can be included in the metadata.
[0061]
Thus, for example, when searching for information including a desired word, even if the word is not included in the processed provided data, the word included in the raw data is extracted as metadata. Then, the URL of the corresponding data service server 3 can be obtained with certainty when the word is searched for as a keyword, and the information desired by the user can be more accurately reflected in the search result.
[0062]
For example, in the example of FIG. 2, in the past, words such as “January” and “clear”, temperature such as “8 ° C.”, file name such as “A”, creation date of provided data file A such as “990201” The metadata search condition was met only when the keyword was used. On the other hand, according to the present embodiment, in addition to this, words such as “cloudy” and “rain”, temperatures such as “10 ° C.”, “6 ° C.”, and “7 ° C.”, “60%” “50%” Humidity such as “70%”, each text file a 1 ~ A n Even if a search is performed using the file name, creation date, and the like as keywords, the search condition is met and the URL of the corresponding data service server 3 can be obtained reliably.
[0063]
In this case, for example, when a search is performed using the temperature of “10 ° C.” as a keyword and the data service server 3 is accessed using the URL obtained as a result of the search, a response to the request is displayed on the display screen of the user terminal 5. The provided data as shown in FIG. 2B is displayed. The character “10 ° C.” is not found on the screen of FIG. 2B, but the portion where the temperature corresponds to “10 ° C.” is included in the graph, and this also includes information given by the user as a keyword. It is information. As described above, according to the present embodiment, by extracting metadata that cannot be obtained only from the provided data, the URL of the data service server 3 that tends to be overlooked at a glance can be reliably obtained as a search result, and search omissions can be reduced. can do.
[0064]
In the present embodiment, since the user can arbitrarily specify the target portion from which the metadata is extracted using the generation target specifying unit 26, the metadata generation target can be arbitrarily specified on the provider side of the data source 1. Thus, metadata that matches or does not match the search condition given by the user can be freely determined on the provider side of the data source 1. Further, when generating metadata, unnecessary information need not be acquired from raw data or the like.
[0065]
In the present embodiment, the time information adding unit 27 can be used to add time information to the metadata. Therefore, the timing and period for publishing the provided data generated from the data source 1 can be determined. The provider of the data source 1 can arbitrarily set. Further, in the present embodiment, security information can be added to the metadata using the security information adding unit 28, so that the other party who releases the provided data generated from the data source 1 is the data source. One provider can arbitrarily set.
[0066]
Next, as another example, a case where a file consisting only of image data is given as the data source 1 and metadata is generated from the data source 1 will be described.
[0067]
FIG. 3 shows a list display file A in which n image files for a certain theme exist as data source 1 and provided data generation unit 21 reduces these n images and arranges them in a tile on one screen. It is the figure which showed a mode that it produced | generated as provision data, (a) shows the example of the data source 1 which is raw data, (b) has shown the example of the produced | generated provision data.
[0068]
As shown in FIG. 3A, the data source 1 includes a plurality of image files a. 1 ~ A n , And attribute information such as file name and creation date is given to each. The provided data generation unit 21 receives the plurality of image files a from the data source 1. 1 ~ A n As shown in FIG. 3B, a list display file (thumbnail) A in which each image is reduced and arranged in a tile shape is generated as provided data. The list display file A generated in this way is given to the data service server 3 via the I / F units 24 and 31, and is registered in the provided data DB 32.
[0069]
On the other hand, the metadata generation unit 22 receives a plurality of image files a from the data source 1. 1 ~ A n Read. Each read image file a 1 ~ A n Additional information such as file name, creation date, size, extension, etc., operating conditions when the metadata generation unit 22 accesses the data source 1, information on the data from which the accessed data source 1 was created, etc. Extract as data.
[0070]
The metadata generation unit 22 includes each image file a that is the data source 1. 1 ~ A n Besides, the list display file A as shown in FIG. 3B which is the provision data generated by the provision data generation unit 21 is read, and the metadata is extracted from the list display file A. For example, in the case of the example shown in FIG. 3B, attribute information such as the file name and creation date of the list display file A, and the theme name where each image is collected are given as metadata. Extract.
[0071]
Thus, when extracting metadata by the metadata generation unit 22, the user uses the generation target specification unit 26 to arbitrarily specify a target portion from which metadata is extracted from raw data or provided data of the data source 1. It is possible. In addition, the user can add time information to the metadata generated by the metadata generation unit 22 using the time information addition unit 27, and can use the security information addition unit 28 to add metadata. It is also possible to add security information to the metadata generated by the data generation unit 22.
[0072]
The metadata generated by the metadata generation unit 22 in this way is provided to the metadata server 4 via the I / F units 25 and 41, and the data service server in which the provision data corresponding to the metadata is registered. 3 is registered in the meta DB 42 together with the URL information 3. Thereafter, when a search request is given from the user terminal 5 to the metadata server 4, the search unit 43 searches the metadata in the meta DB 42 in response to the search request from the user terminal 5, and the search result is sent to the user. Return to terminal 5.
[0073]
For example, the search unit 43 searches the meta DB 42 for metadata including a keyword given as a search condition from the user terminal 5 and manages the provided data corresponding to the metadata that matches the search condition. The URL of the server 3 is returned to the user terminal 5 as a search result. As a result, the user can obtain the URL of the data service server 3 that is considered to contain the desired information from among a large number of data service servers 3 existing on the Internet as a search result.
[0074]
Thereafter, when the information acquisition request is accessed from the user terminal 5 to the data service server 3 based on the URL obtained in this way, FIG. 3 (FIG. 3) registered in the provision data DB 32 as a response to the request. Provided data such as b) is given from the data service server 3 to the user terminal 5 and displayed on the display screen of the user terminal 5.
[0075]
Conventionally, the search condition is the file name “A” of the list display file A generated as the provided data by the provided data generation unit 21, the creation date of the list display file A “991105”, or the theme name. Only when metadata hit the search criteria.
[0076]
On the other hand, according to the present embodiment, the original image file a 1 ~ A n Even if a search is performed using the file name, creation date, and the like as keywords, the search condition is met and the URL of the corresponding data service server 3 can be obtained reliably. As a result, a plurality of image files a 1 ~ A n When only the list display file A generated collectively is disclosed as provided data, individual image data a 1 ~ A n Relevant information can be obtained reliably even if a search is performed using the information regarding the search condition. That is, the information desired by the user can be more accurately reflected in the search result, and search omission can be reduced.
[0077]
Next, as another example, a case where a file in which image data and text data are mixed is given as the data source 1 and metadata is generated from the data source 1 will be described.
[0078]
FIG. 4 shows n pieces of image data a 1 ~ A n Comment text for each text data b 1 ~ B n Based on the file attached in the form of 1 ~ A n Is a diagram showing how list display files A arranged in tiles on one screen are reduced and provided as provided data, (a) shows an example of data source 1 that is raw data, (B) has shown the example of the provision data produced | generated. The comment text is, for example, the name of the author of the image, the field of the image, and a description.
[0079]
The provided data generation unit 21 receives a plurality of image text mixed files a from the data source 1 shown in FIG. 1 + B 1 ~ A n + B n As shown in FIG. 4B, each image data a included therein is read. 1 ~ A n A list display file (thumbnail) A arranged in a tiled form is reduced as provided data. The list display file A generated in this way is given to the data service server 3 via the I / F units 24 and 31, and is registered in the provided data DB 32.
[0080]
On the other hand, the metadata generation unit 22 receives a plurality of image text mixed files a from the data source 1. 1 + B 1 ~ A n + B n Read. And each read file a 1 + B 1 ~ A n + B n Text data included in b 1 ~ B n Extract metadata from. In addition, the metadata generation unit 22 sends each file a 1 + B 1 ~ A n + B n Additional information such as the file name, creation date, size, extension, etc., the operating conditions when the metadata generation unit 22 accesses the data source 1, the information on the data from which the accessed data source 1 was created, etc. Extract as data.
[0081]
The metadata generation unit 22 receives each image text mixed file a that is the data source 1. 1 + B 1 ~ A n + B n In addition, the list display file A as shown in FIG. 4B, which is the provision data generated by the provision data generation unit 21, is read, and metadata is extracted from the list display file A. For example, in the case of the example shown in FIG. 4B, attribute information such as the file name and creation date of the list display file A, and a theme name that collects each image are given as metadata. Extract.
[0082]
Thus, when extracting metadata by the metadata generation unit 22, the user uses the generation target specification unit 26 to arbitrarily specify a target portion from which metadata is extracted from raw data or provided data of the data source 1. It is possible. In addition, the user can add time information to the metadata generated by the metadata generation unit 22 using the time information addition unit 27, and can use the security information addition unit 28 to add metadata. It is also possible to add security information to the metadata generated by the data generation unit 22.
[0083]
The metadata generated by the metadata generation unit 22 in this way is provided to the metadata server 4 via the I / F units 25 and 41, and the data service server in which the provision data corresponding to the metadata is registered. 3 is registered in the meta DB 42 together with the URL information 3. Thereafter, when a search request is given from the user terminal 5 to the metadata server 4, the search unit 43 searches the metadata in the meta DB 42 in response to the search request from the user terminal 5, and the search result is sent to the user. Return to terminal 5.
[0084]
For example, the search unit 43 searches the meta DB 42 for metadata including a keyword given as a search condition from the user terminal 5 and manages the provided data corresponding to the metadata that matches the search condition. The URL of the server 3 is returned to the user terminal 5 as a search result. As a result, the user can obtain the URL of the data service server 3 that is considered to contain the desired information from among a large number of data service servers 3 existing on the Internet as a search result.
[0085]
Thereafter, when the information acquisition request is accessed from the user terminal 5 to the data service server 3 based on the URL obtained in this way, FIG. 4 (FIG. 4) registered in the provision data DB 32 as a response to the request. Provided data such as b) is given from the data service server 3 to the user terminal 5 and displayed on the display screen of the user terminal 5.
[0086]
Conventionally, the search condition is the file name “A” of the list display file A generated as the provided data by the provided data generation unit 21, the creation date of the list display file A “991105”, or the theme name. Only when metadata hit the search criteria.
[0087]
On the other hand, according to the present embodiment, in addition to this, the word included in the comment sentence such as the author name, field, and description of the image, or the original file a 1 + B 1 ~ A n + B n Even if a search is performed using the file name, creation date, and the like as keywords, the search condition is met and the URL of the corresponding data service server 3 can be obtained reliably. As a result, when only the list display file A is disclosed as provided data, individual image data a 1 ~ A n Information about text and text data attached to it 1 ~ B n Relevant information can be obtained reliably even if a search is performed using the information regarding the search condition. That is, the information desired by the user can be more accurately reflected in the search result, and search omission can be reduced.
[0088]
In the examples shown in FIGS. 2 to 4, the case where the provision data generation unit 21 generates one provision data file from a plurality of raw data files existing as the data source 1 has been described as an example. In the example of FIG. 5 shown below, on the contrary, one file including various information as text data is given as the data source 1, and a plurality of provided data files are generated from this one raw data file. The generation of metadata will be described.
[0089]
FIG. 5 shows a plurality of pieces of information x 11 , X 12 , X twenty one , X 30 ,... Based on one text file x, the provided data generation unit 21 extracts necessary information and two text files X 1 , X 2 Are shown as provided data, (a) shows an example of data source 1 which is raw data, and (b) shows an example of generated provided data.
[0090]
In this case, the provided data generation unit 21 reads one text file x from the data source 1 shown in FIG. 5A, and appropriately extracts each piece of information contained therein as shown in FIG. 5B. Two provided data files X 1 , X 2 Is generated as provided data. In the example of FIG. 5, the information x from the text file x 11 , X 12 , X 30 , ... is extracted and provided data file X 1 To generate information x from text file x twenty one , X 30 , ... is extracted and provided data file X 2 Is generated.
[0091]
Provided data file X generated in this way 1 , X 2 Are provided to the data service server 3 via the I / F units 24 and 31, respectively, and registered in the provided data DB 32. At this time, the two provided data files X 1 , X 2 May be registered on different data service servers 3.
[0092]
On the other hand, the metadata generation unit 22 reads one text file x from the data source 1. Then, metadata is extracted from the information included in the read text file x. In this case, x 11 , X 12 , X twenty one , X 30 It is possible to extract individual information such as... As metadata. Further, the metadata generation unit 22 includes additional information such as the file name, creation date, size, and extension of the text file x, operating conditions when the metadata generation unit 22 accesses the data source 1, and the accessed data source. Information of data that is the creation source of 1 is also extracted as metadata.
[0093]
In addition to the text file x that is the data source 1, the metadata generation unit 22 provides the provided data file X as shown in FIG. 5B generated by the provided data generation unit 21. 1 , X 2 And extract metadata from it. For example, in the case of the example shown in FIG. 5B, one provided data file X 1 To x 11 , X 12 , X 30 File X 1 Extract as metadata for use. The other provided data file X 2 To x twenty one , X 30 File X 2 Extract as metadata for use. Further, the metadata generation unit 22 sends each provided data file X 1 , X 2 Attribute information such as file name and creation date is also extracted as metadata.
[0094]
Thus, when extracting metadata by the metadata generation unit 22, the user uses the generation target specification unit 26 to arbitrarily specify a target portion from which metadata is extracted from raw data or provided data of the data source 1. It is possible. In addition, the user can add time information to the metadata generated by the metadata generation unit 22 using the time information addition unit 27, and can use the security information addition unit 28 to add metadata. It is also possible to add security information to the metadata generated by the data generation unit 22.
[0095]
The metadata generated by the metadata generation unit 22 in this way is provided to the metadata server 4 via the I / F units 25 and 41, and the data service server in which the provision data corresponding to the metadata is registered. 3 is registered in the meta DB 42 together with the URL information 3. Thereafter, when a search request is given from the user terminal 5 to the metadata server 4, the search unit 43 searches the metadata in the meta DB 42 in response to the search request from the user terminal 5, and the search result is sent to the user. Return to terminal 5.
[0096]
For example, the search unit 43 searches the meta DB 42 for metadata including a keyword given as a search condition from the user terminal 5 and manages the provided data corresponding to the metadata that matches the search condition. The URL of the server 3 is returned to the user terminal 5 as a search result. As a result, the user can obtain the URL of the data service server 3 that is considered to contain the desired information from among a large number of data service servers 3 existing on the Internet as a search result.
[0097]
Thereafter, when the information acquisition request is accessed from the user terminal 5 to the data service server 3 based on the URL obtained in this manner, FIG. 5 (FIG. 5) registered in the provision data DB 32 as a response to the request. Provided data such as b) is given from the data service server 3 to the user terminal 5 and displayed on the display screen of the user terminal 5.
[0098]
At this time, for example, “x 11 When a search is performed using the information "" as a keyword, "x 11 ”Is registered, so the search condition is hit. In this case, the“ x ” 11 Data file X that contains " 1 The URL of the data service server 3 that manages the URL is returned as a search result. Also, “x 30 The search condition is also hit when a search is performed using the information "" as a keyword. In this case, the "x" 30 "Is the two provided data files X 1 , X 2 Are included in both.
[0099]
In this case, for example, the URL of the data service server 3 that manages the provided data file that is permitted to access the searcher by the security information added to the metadata by the security information adding unit 28 is used as the search result. It is possible to return it. If both are allowed access, the provided data file X 1 , X 2 The URL of the data service server 3 that manages the URL is returned as a search result.
[0100]
As described above, according to the database search system of the present embodiment, not only when the data source and the provided data have an n: 1 relationship as shown in FIGS. Even when the provided data is in a 1: m relationship, metadata can be generated from the raw data. Of course, it is possible to generate metadata from raw data even when the data source and the provided data have an n: m relationship. That is, conventionally, only one system of metadata can be generated from one data source. However, according to the present embodiment, a plurality of metadata systems can be generated from a plurality of data sources. Become.
[0101]
In the above description, the case where the data source 1 is text data, image data, or mixed data thereof has been described. However, the data source 1 may be data of other formats such as audio data and CG data.
[0102]
Further, in a homepage that has a plurality of subpages hierarchically from one top page, the actual service content is often described in the subpage rather than the top page. Therefore, metadata may be extracted from the raw data of each subpage and registered in the meta DB 42 as metadata of the entire home page.
[0103]
In this way, even if the security is set so that the search robot does not enter the sub-pages below the top page, the search for the corresponding page can be performed by using the content described in the sub-page as a keyword. URL can be obtained. In this case, if the top page or the desired subpage is set as the provided data, the page specified as the provided data is always the first regardless of which subpage contains the keyword that matches the search conditions. An open mechanism can be provided.
[0104]
In the present embodiment, the contents of data created by a specific application may be extracted as metadata. For example, if the URL is “http://www.ei.nsc.co.jp/...../991101.doc”, the contents of this file cannot be searched conventionally, but the metadata By extracting and registering metadata from the documents in the file at the time of registration, the information in the file can be searched as a keyword.
[0105]
In the configuration of FIG. 1, the metadata generation unit 22 can be provided in the metadata server 4. In this case, the raw data itself is sent from the data generation unit 2 to the metadata server 4. There is a need. On the other hand, if the metadata generation unit 22 is provided in the data generation unit 2 as shown in FIG. 1, it is not necessary to send the raw data itself to the metadata server 4, and communication traffic can be kept small. . Further, when the provided data is generated by the provided data generation unit 21 by accessing the data source 1, metadata can also be generated, and generation of provided data and generation of metadata can be performed efficiently.
[0106]
The database search system of the present embodiment described above is constituted by a computer CPU or MPU, RAM, ROM, etc., and can be realized by operating a program stored in the RAM or ROM. Therefore, the program that causes the computer to perform the above functions can be realized by recording the program on a recording medium such as a CD-ROM and causing the computer to read the program. As a recording medium for recording the program, a floppy disk, a hard disk, a magnetic tape, a magneto-optical disk, a nonvolatile memory card, or the like can be used in addition to the CD-ROM.
[0107]
In addition, the functions of the above-described embodiments are realized by executing a program supplied by a computer, and the program is used in cooperation with an OS (operating system) or other application software running on the computer. When the functions of the above-described embodiment are realized, or when all or part of the processing of the supplied program is performed by a function expansion board or a function expansion unit of the computer, the function of the above-described embodiment is realized. Such a program is included in the embodiment of the present invention.
[0108]
Each of the embodiments described above is merely an example of the embodiment for carrying out the present invention, and the technical scope of the present invention should not be construed as being limited thereto. In other words, the present invention can be implemented in various forms without departing from the spirit or main features thereof.
[0109]
【The invention's effect】
In the present invention, as described above, the metadata generation means is separated from the metadata holding means (metadata server) and is provided near the data source so that the metadata is generated from the raw data itself of the data source. Therefore, the metadata can be obtained not only from the provided data as in the prior art, but also from the raw data from which the provided data is generated. As a result, information that is highly relevant to the raw data can be included in the metadata, and the information desired by the user can be more accurately reflected in the search results using the metadata. Therefore, the location information of the provided data management means (data service server) including the desired information can be obtained more reliably as a search result, and search omissions can be reduced.
[0110]
According to another aspect of the present invention, since the generation target specifying means for specifying the target for extracting the metadata from the raw data of the data source is provided, the generation target of the metadata is set as the data source provider side. Thus, it is possible to arbitrarily set metadata, and the data source provider can freely determine metadata that matches or does not match the search condition given by the user.
[0111]
Further, according to another feature of the present invention, since the time information setting means for adding the time information related to the release of the provided data to the metadata is provided, the time information is given except for the time and period when the provided data is allowed to be released. Even if the search condition itself is met, the location information of the provided data management means (data service server) can be prevented from being output as a search result, and the data source provider can specify the time and period for disclosing the provided data. Can be set arbitrarily.
[0112]
According to another feature of the present invention, security information setting means for adding security information related to access to provided data to metadata is provided, so that provided data management can be performed only for users who permit access to provided data. The location information of the means (data service server) can be prevented from being output as the search result, and the provider of the data source can arbitrarily set the user who discloses the provided data.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration example of a database search system according to an embodiment using a robot type search engine.
FIG. 2 is a diagram illustrating a state in which provided data is generated by processing a data source including only text data.
FIG. 3 is a diagram illustrating a state in which provided data is generated by processing a data source including only image data.
FIG. 4 is a diagram illustrating a state in which provided data is generated by processing a data source in which text data and image data are mixed.
FIG. 5 is a diagram showing a state in which a single text file including a plurality of information is processed to generate a plurality of provided data.
FIG. 6 is a block diagram showing a configuration example of a conventional database search system using a robot type search engine.
[Explanation of symbols]
1 Data source
2 Data generator
3 Data service server
4 Metadata server (search engine)
5 User terminal
21 Provided data generator
22 Metadata generator
23 Data generation controller
24 Provided data I / F section
25 I / F section for metadata
26 Generation target specification part
27 Time information addition part
28 Security information addition part
31 Provided data I / F section
32 Provided data DB
41 I / F section for metadata
42 Meta DB
43 Search part

Claims (11)

少なくとも1つの生データをデータソースから読み出して提供データを生成する提供データ生成手段と、
上記データソース及び当該データソースを基に上記提供データ生成手段によって生成された提供データから情報を抽出して、上記提供データの所在情報を含むメタデータを生成するメタデータ生成手段と、
上記メタデータを保持するメタデータ保持手段と、
上記提供データを保持してユーザ端末からの要求に応じて提供データを当該ユーザ端末に提供する提供データ管理手段と、
ユーザ端末からの要求に応じて上記メタデータ保持手段に保持されているメタデータを検索し、その検索結果として上記提供データ管理手段により保持されている提供データの所在情報を当該ユーザ端末に返す検索手段と
を備えたことを特徴とするデータベース検索システム。
Provided data generation means for reading the at least one raw data from the data source and generating the provided data;
Metadata generating means for extracting information from the data source and provided data generated by the provided data generating means based on the data source, and generating metadata including location information of the provided data;
Metadata holding means for holding the metadata;
Provision data management means for holding the provision data and providing the provision data to the user terminal in response to a request from the user terminal;
Search for metadata held in the metadata holding means in response to a request from the user terminal, and return the location information of the provided data held by the provided data management means to the user terminal as the search result A database search system comprising: means.
上記メタデータ生成手段と上記メタデータ保持手段との間をつなぐ通信インタフェースを、上記メタデータに関する標準仕様に基づくインタフェースにより構成したことを特徴とする請求項1に記載のデータベース検索システム。  2. The database search system according to claim 1, wherein a communication interface that connects between the metadata generation means and the metadata holding means is configured by an interface based on a standard specification related to the metadata. 上記メタデータ生成手段により上記データソースの生データから上記メタデータを抽出する対象を指定するための生成対象指定手段を備えたことを特徴とする請求項1または2に記載のデータベース検索システム。  3. The database search system according to claim 1, further comprising generation target specifying means for specifying a target for extracting the metadata from the raw data of the data source by the metadata generation means. 上記メタデータ生成手段により生成されるメタデータに対して、上記提供データ管理手段により管理されている提供データの公開に関する時限情報を付加する時限情報設定手段を備えたことを特徴とする請求項1〜3の何れか1項に記載のデータベース検索システム。  2. A time information setting unit for adding time information related to the release of provided data managed by the provided data management unit to the metadata generated by the metadata generating unit. The database search system according to any one of to 3. 上記メタデータ生成手段により生成されるメタデータに対して、上記提供データ管理手段により管理されている提供データへのアクセスに関するセキュリティ情報を付加するセキュリティ情報設定手段を備えたことを特徴とする請求項1〜4の何れか1項に記載のデータベース検索システム。  The security information setting means for adding security information relating to access to the provided data managed by the provided data managing means to the metadata generated by the metadata generating means. The database search system according to any one of 1 to 4. ユーザ端末とネットワークで接続され、提供データ生成手段、メタデータ生成手段、メタデータ保持手段、提供データ管理手段及び検索手段を有したデータベース検索システムにおいて前記ユーザ端末からの要求に応じてデータを検索するデータベース検索方法であって、
上記提供データ生成手段が、少なくとも1つの生データをデータソースから読み出して提供データを生成する工程と、
上記メタデータ生成手段が、上記データソース及び当該データソースを基に上記提供データ生成手段によって生成された提供データから情報を抽出して、上記提供データの所在情報を含むメタデータを生成する工程と、
上記メタデータ保持手段が、上記メタデータを保持する工程と、
上記提供データ管理手段が、上記提供データを保持してユーザ端末からの要求に応じて提供データを当該ユーザ端末に提供する工程と、
上記検索手段が、ユーザ端末からの要求に応じて上記メタデータ保持手段に保持されているメタデータを検索し、その検索結果として上記提供データ管理手段により保持されている提供データの所在情報を当該ユーザ端末に返す工程と、
を有することを特徴とするデータベース検索方法。
Data is searched in response to a request from the user terminal in a database search system connected to the user terminal via a network and having provided data generation means, metadata generation means, metadata holding means, provided data management means, and search means. A database search method,
The provision data generation means reads at least one raw data from the data source to generate the provision data;
The metadata generating means extracting information from the data source and the provided data generated by the provided data generating means based on the data source, and generating metadata including location information of the provided data; ,
The metadata holding means holding the metadata;
The providing data management means holding the providing data and providing the providing data to the user terminal in response to a request from the user terminal;
The search means searches the metadata held in the metadata holding means in response to a request from the user terminal, and the location information of the provided data held by the provided data management means as the search result Returning to the user terminal;
A database search method characterized by comprising:
上記データソースの生データから上記メタデータを抽出する対象を指定可能としたことを特徴とする請求項6に記載のデータベース検索方法。  The database search method according to claim 6, wherein a target for extracting the metadata from the raw data of the data source can be specified. 上記生成されるメタデータに対して、上記提供データの公開に関する時限情報を付加することを可能としたことを特徴とする請求項6または7に記載のデータベース検索方法。  8. The database search method according to claim 6, wherein time information related to the release of the provided data can be added to the generated metadata. 上記生成されるメタデータに対して、上記提供データへのアクセスに関するセキュリティ情報を付加することを可能としたことを特徴とする請求項6〜8の何れか1項に記載のデータベース検索方法。  9. The database search method according to claim 6, wherein security information regarding access to the provided data can be added to the generated metadata. 請求項1〜5の何れか1項に記載のデータベース検索システムの各手段としてコンピュータを機能させるためのプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。  A computer-readable recording medium on which a program for causing a computer to function as each means of the database search system according to any one of claims 1 to 5 is recorded. 請求項6〜9の何れか1項に記載のデータベース検索方法の処理手順をコンピュータに実行させるためのプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。  A computer-readable recording medium having recorded thereon a program for causing a computer to execute the processing procedure of the database search method according to any one of claims 6 to 9.
JP33170399A 1999-11-22 1999-11-22 Database search system and method, recording medium Expired - Fee Related JP3939477B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP33170399A JP3939477B2 (en) 1999-11-22 1999-11-22 Database search system and method, recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33170399A JP3939477B2 (en) 1999-11-22 1999-11-22 Database search system and method, recording medium

Publications (2)

Publication Number Publication Date
JP2001147941A JP2001147941A (en) 2001-05-29
JP3939477B2 true JP3939477B2 (en) 2007-07-04

Family

ID=18246653

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33170399A Expired - Fee Related JP3939477B2 (en) 1999-11-22 1999-11-22 Database search system and method, recording medium

Country Status (1)

Country Link
JP (1) JP3939477B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4496672B2 (en) * 2001-06-06 2010-07-07 日本ビクター株式会社 Image information recording apparatus and image information recording system
JP4168606B2 (en) * 2001-06-28 2008-10-22 ソニー株式会社 Information processing apparatus and method, recording medium, and program
JP2003036333A (en) * 2001-07-24 2003-02-07 Japan Science & Technology Corp International disaster information providing system
JP4002150B2 (en) * 2002-07-30 2007-10-31 ソニー株式会社 Information communication apparatus and information communication method, information exchange / human relationship formation support system, information exchange / human relationship formation support method, and computer program
US7603620B2 (en) * 2004-12-20 2009-10-13 Ricoh Co., Ltd. Creating visualizations of documents

Also Published As

Publication number Publication date
JP2001147941A (en) 2001-05-29

Similar Documents

Publication Publication Date Title
US7725451B2 (en) Generating clusters of images for search results
US6883001B2 (en) Document information search apparatus and method and recording medium storing document information search program therein
US7072983B1 (en) Scheme for systemically registering meta-data with respect to various types of data
CN101452470B (en) Summary-style network search engine system and search method and uses
JP5105802B2 (en) Information processing device
US7617195B2 (en) Optimizing the performance of duplicate identification by content
US7809710B2 (en) System and method for extracting content for submission to a search engine
US6401118B1 (en) Method and computer program product for an online monitoring search engine
US7401078B2 (en) Information processing apparatus, document search method, program, and storage medium
KR101653268B1 (en) Processing method of tagged information and the client-server system for the same
JP5121194B2 (en) Organization information retrieval system and organization information retrieval program
JP2009500719A (en) Query search by image (query-by-imagesearch) and search system
US20080068651A1 (en) Methods and apparatuses for publication of unconsciously captured documents
JP2006309515A (en) Information delivery method and information delivery server
JP2003519844A (en) Method and apparatus for indexing structured documents based on style sheets
JP2006099341A (en) Update history generation device and program
US20110252313A1 (en) Document information selection method and computer program product
US20060143242A1 (en) Content management device
JP5447484B2 (en) Information processing device
JP3939477B2 (en) Database search system and method, recording medium
US20060116992A1 (en) Internet search environment number system
JPH11143885A (en) Method and device for information retrieval, storage medium for storing information retrieval program, method and device for information transmission, and storage medium for storing information transmission program
JP2008102790A (en) Retrieval system
Shen et al. Publishing distributed files as Linked Data
JP7272540B2 (en) Information provision system, information provision method, and data structure

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060919

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061219

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070227

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070328

R150 Certificate of patent or registration of utility model

Ref document number: 3939477

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110406

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120406

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130406

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130406

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140406

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees