JP3939477B2 - Database search system and method, recording medium - Google Patents
Database search system and method, recording medium Download PDFInfo
- Publication number
- JP3939477B2 JP3939477B2 JP33170399A JP33170399A JP3939477B2 JP 3939477 B2 JP3939477 B2 JP 3939477B2 JP 33170399 A JP33170399 A JP 33170399A JP 33170399 A JP33170399 A JP 33170399A JP 3939477 B2 JP3939477 B2 JP 3939477B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- metadata
- information
- user terminal
- provided data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【0001】
【発明の属する技術分野】
本発明はデータベース検索システムおよび方法、更にはこれらをソフトウェアの機能で実現するためのプログラムを格納した記録媒体に関し、特に、分散化された複数のデータベースから所望のデータを探し出す検索システムに用いて好適なものである。
【0002】
【従来の技術】
近年、コンピュータネットワークが急速に発達し、それに伴ってデータベースも分散化されることが多く見られるようになってきた。例えば、インターネットでは、それぞれデータを保持する複数のコンピュータがサーバあるいはクライアントとして世界中に分散され、言うなれば分散型のデータベースとして構成されている。このようなインターネットに限らず、膨大なデータを扱うシステムではデータベースが分散化される傾向にある。
【0003】
このように分散化されたデータベースから所望の情報を読み出そうとする場合に、ユーザは読み出そうとする情報が分散化しているデータベースのどこに格納されているか分からないことが多いので、それぞれのデータベース毎に対応して設けられたデータサービスサーバを順にアクセスし、所望の情報が見つかるまで検索を繰り返し行わなければならない。このように、各データベースを個々に管理する全てのデータサービスサーバに対して検索を順次行うのは、非常に多くの時間と多くの労力とを必要とする。
【0004】
また、ユーザがデータサービスサーバの在り処(インターネットのURL(Uniform Resource Locator)等のようなアドレス情報)を全て把握していなければ、全てのデータサービスサーバに対して検索を行うことは不可能である。しかしながら、分散化されたデータサービスサーバは、絶えずデータの登録や削除を行う可能性があり、また、サーバ自体のネットワークへの接続・切断も絶えず行われる可能性がある。したがって、これらのことをユーザが全て把握することは極めて困難であり、正確な情報の検索を行うことは困難となる。
【0005】
このような不便さを解消するために、例えばインターネットでは検索エンジンと呼ばれるアドレス検索サービスが存在する。この検索エンジンには、大きく分けて、メタデータとして登録したホームページのタイトル、URL、コメント等の検索用情報をもとにこれと合致するホームページを検索するタイプと、インターネット上の各ホームページにあるテキスト全文を対象として合致するホームページを検索するタイプとがある。
【0006】
前者のタイプは更に、人手によって検索用情報を登録するタイプの手動型検索エンジンと、自動的にリンクを辿ってそれぞれのデータサービスサーバから必要な情報を収集し、それを検索用情報として登録するタイプのいわゆるロボット型検索エンジンとに分けられる。
【0007】
上記ロボット型、手動型の何れのタイプの検索エンジンも、自動的あるいは手動で収集した検索用情報をもとに、例えばキーワードの入力によって必要なURLの検索を行うことができる。例を挙げると、「特許」というキーワードについて検索を行うと、そのキーワードを含む検索用情報が登録されているデータサービスサーバのURLが検索結果として出力される。ユーザは、この検索結果に含まれるURLにアクセスすることで、所望の情報を探し出すことができる。
【0008】
図6は、上記ロボット型検索エンジンを用いた従来のデータベース検索システムの構成例を示すブロック図である。図6において、データソース51は、テキストデータ、画像データ、音声データ等の各種生データを格納したデータベースである。データ加工部52は、上記データソース51の生データに様々な加工を加え、インターネット上への提供データを生成するものである。
【0009】
上記データ加工部52は、例えば、テキストデータ、画像データ、音声データを融合したホームページのデータを生成する場合は、ウェブサイトを表現するための代表的な形式であるHTMLフォーマットに従って提供データを生成する。すなわち、このHTMLフォーマットのデータ中には、テキストデータのみが記述され、画像データや音声データは、そのファイル名などがテキストデータの形で埋め込まれ、そこから生データに対してハイパーリンクが引かれる。
【0010】
また、データ加工部52は、生データとして与えられた統計データを加工してグラフ化することにより、グラフデータをインターネット上への提供データとして生成することもある。データ加工部52は、ここに挙げた例以外にも、生データであるデータソース51に対して様々な加工を施し、提供データを生成する。生成された提供データは、データサービスサーバ53に登録される。
【0011】
データサービスサーバ53は、上記データ加工部52により生成された提供データやアプリケーションをインターネット上のユーザ端末58に提供するものである。すなわち、データサービスサーバ53は、ユーザ端末58からのアクセスに応じて、要求された提供データまたはサービス等をユーザに提供する。なお、データ加工部52を備えるユーザ端末自体が、データまたはサービスを受けるユーザ端末58にもなり得る。
【0012】
なお、ここではデータソース51、データ加工部52、データサービスサーバ53およびユーザ端末58を1つずつ示しているが、インターネット上にはこれらが多数存在している。
【0013】
メタデータサーバ(検索エンジン)54は、メタデータ生成部55と、メタDB56と、検索部57とを備えている。メタデータ生成部55は、データサービスサーバ53に登録された提供データ中に張られたリンクを辿りながら、複数のデータサービスサーバ53から必要な情報(ホームページのタイトル、URL、単語、コメント文、日付等の情報)を収集し、それを検索用情報(メタデータ)としてメタDB56に登録するものである。
【0014】
検索部57は、ユーザ端末58からの検索要求に応じてメタDB56内のメタデータを検索し、その結果をユーザ端末58に返すものである。例えば、検索部57は、ユーザ端末58から検索条件として与えられたキーワードを含むメタデータをメタDB56上で検索し、この検索条件に合致するメタデータに対応する提供データを管理しているデータサービスサーバ53のURLを検索結果としてユーザ端末58に返す。これによりユーザは、インターネット上に存在する多数のデータサービスサーバ53の中から、所望の情報が含まれると思われるデータサービスサーバ53のURLを検索結果として得ることができる。
【0015】
【発明が解決しようとする課題】
しかしながら、上記図6に示した従来のデータベース検索システムでは、検索エンジン54は、データソース51の生データをもとに生成された提供データを管理しているデータサービスサーバ53から検索用情報(メタデータ)を収集していた。このとき、ロボット型の検索エンジン54は、データサービスサーバ53に登録されているコンテンツ内のURL情報を次々に辿って、提供データ中からメタデータを取り出しているだけであった。
【0016】
例えば、提供データが上述のHTMLフォーマットのデータとして登録されている場合は、ロボット型検索エンジン54は、このテキストデータ内に存在する単語やコメント文、日付などを読み取ってメタデータとして自分のメタDB56に登録したり、他ファイルへのリンクタグが存在すればそのファイル内の所在を自分のメタDB56に登録したりしているだけである。
【0017】
したがって、提供データが通常のテキストデータやHTMLフォーマットのデータであればそこからメタデータを取り出すことが可能であるが、これ以外の画像データ、音声データ、グラフデータ、CGデータ等の様々な形式のデータについてはメタデータを取り出すことができなかった。また、提供データがテキストデータの形式であっても、それがデータソース51の生データそのものではなく、例えば生データの内容を要約したような加工データである場合には、その加工データの中からしかメタデータの抽出は行うことができなかった。
【0018】
そのため、所望の画像データ、音声データ、グラフデータあるいはCGデータ等を含む情報を探し出したい場合でも、それに対応するメタデータがメタDB56上に登録されていないため、検索部57による検索によって該当するデータサービスサーバ53を見つけることはできなかった。また、生データ中には含まれていた単語であっても、要約された加工データ中にその単語が含まれていないと、その単語をキーワードとして検索した場合に、本来は該当するデータサービスサーバ53が検索結果から洩れてしまうことがあった。
【0019】
本発明は、このような問題を解決するために成されたものであり、様々な形式の生データを表したきめ細かなメタデータを登録できるようにすることにより、ユーザが要求する情報により近い回答を与えることが可能な検索エンジン(データベース検索システム)を提供することを目的とする。
【0020】
【課題を解決するための手段】
本発明のデータベース検索システムは、少なくとも1つの生データをデータソースから読み出して提供データを生成する提供データ生成手段と、上記データソース及び当該データソースを基に上記提供データ生成手段によって生成された提供データから情報を抽出して、上記提供データの所在情報を含むメタデータを生成するメタデータ生成手段と、上記メタデータを保持するメタデータ保持手段と、上記提供データを保持してユーザ端末からの要求に応じて提供データを当該ユーザ端末に提供する提供データ管理手段と、ユーザ端末からの要求に応じて上記メタデータ保持手段に保持されているメタデータを検索し、その検索結果として上記提供データ管理手段により保持されている提供データの所在情報を当該ユーザ端末に返す検索手段とを備えたことを特徴とする。
【0021】
本発明の他の態様では、上記メタデータ生成手段と上記メタデータ保持手段との間をつなぐ通信インタフェースを、上記メタデータに関する標準仕様に基づくインタフェースにより構成したことを特徴とする。
本発明のその他の態様では、上記メタデータ生成手段により上記データソースの生データから上記メタデータを抽出する対象を指定するための生成対象指定手段を備えたことを特徴とする。
本発明のその他の態様では、上記メタデータ生成手段により生成されるメタデータに対して、上記提供データ管理手段により管理されている提供データの公開に関する時限情報を付加する時限情報設定手段を備えたことを特徴とする。
本発明のその他の態様では、上記メタデータ生成手段により生成されるメタデータに対して、上記提供データ管理手段により管理されている提供データへのアクセスに関するセキュリティ情報を付加するセキュリティ情報設定手段を備えたことを特徴とする。
【0022】
また、本発明のデータベース検索方法は、ユーザ端末とネットワークで接続され、提供データ生成手段、メタデータ生成手段、メタデータ保持手段、提供データ管理手段及び検索手段を有したデータベース検索システムにおいて前記ユーザ端末からの要求に応じてデータを検索するデータベース検索方法であって、上記提供データ生成手段が、少なくとも1つの生データをデータソースから読み出して提供データを生成する工程と、上記メタデータ生成手段が、上記データソース及び当該データソースを基に上記提供データ生成手段によって生成された提供データから情報を抽出して、上記提供データの所在情報を含むメタデータを生成する工程と、上記メタデータ保持手段が、上記メタデータを保持する工程と、上記提供データ管理手段が、上記提供データを保持してユーザ端末からの要求に応じて提供データを当該ユーザ端末に提供する工程と、上記検索手段が、ユーザ端末からの要求に応じて上記メタデータ保持手段に保持されているメタデータを検索し、その検索結果として上記提供データ管理手段により保持されている提供データの所在情報を当該ユーザ端末に返す工程と、を有することを特徴とする。
【0023】
本発明の他の態様では、上記データソースの生データから上記メタデータを抽出する対象を指定可能としたことを特徴とする。
本発明のその他の態様では、上記生成されるメタデータに対して、上記提供データの公開に関する時限情報を付加することを可能としたことを特徴とする。
本発明のその他の態様では、上記生成されるメタデータに対して、上記提供データへのアクセスに関するセキュリティ情報を付加することを可能としたことを特徴とする。
【0024】
また、本発明のコンピュータ読み取り可能な記録媒体は、請求項1〜5の何れか1項に記載の各手段としてコンピュータを機能させるためのプログラムを記録したことを特徴とする。
本発明の他の態様では、請求項6〜9の何れか1項に記載のデータベース検索方法の処理手順をコンピュータに実行させるためのプログラムを記録したことを特徴とする。
【0025】
【発明の実施の形態】
以下、本発明の一実施形態を図面に基づいて説明する。
図1は、ロボット型検索エンジンを用いた本実施形態によるデータベース検索システムの構成例を示すブロック図である。
【0026】
図1において、データソース1は、テキストデータ、画像データ、音声データ、CGデータ等の各種生データを格納したデータベースである。データ生成部2は、上記データソース1の生データからインターネット上への提供データおよび検索用情報としてのメタデータを生成するものである。このデータ生成部2は、提供データ生成部21、メタデータ生成部22、データ生成制御部23、提供データ用I/F部24およびメタデータ用I/F部25を備えている。
【0027】
上記提供データ生成部21は、データソース1の生データに様々な加工を加え、インターネット上への提供データを生成する。例えば、テキストデータ、画像データ、音声データを融合したホームページのデータを生成する場合、提供データ生成部21は、ウェブサイトを表現するための代表的な形式であるHTMLフォーマットに従って提供データを生成する。
【0028】
また、提供データ生成部21は、生データとして与えられた統計データを加工してグラフ化することにより、グラフデータを上記提供データとして生成することもある。提供データ生成部21は、ここに挙げた例以外にも、生データであるデータソース1に対して様々な加工を施し、提供データを生成する。生成された提供データは、提供データ用I/F部24を介してデータサービスサーバ3に与えられ、登録される。
【0029】
メタデータ生成部22は、データソース1の生データそのもの、および提供データ生成部21により生成される提供データから必要な情報を抽出し、それをメタデータとして生成するものである。上述したように、データソース1中には、テキストデータだけでなく、画像データ、音声データ、CGデータ等の様々な形式の生データを含んでいる。本実施形態のメタデータ生成部22は、これらのテキストデータ以外の生データからもメタデータを抽出して生成する。
【0030】
例えば、メタデータの生成対象とするデータソース1がテキストデータの場合、メタデータ生成部22は、そのテキストデータの中から単語やコメント文を抽出し、あるいはそのテキストデータの作成日付、作者名、ファイル名等の情報を抽出してそれをメタデータとして生成する。
【0031】
また、メタデータの生成対象とするデータソース1が画像データ、音声データ、CGデータ等のテキスト以外のデータの場合、メタデータ生成部22は、それらのデータの作成日付、作者名、ファイル名等の情報を抽出してそれをメタデータとして生成する。
【0032】
また、写真やイラスト等と共にその解説文が記述された図書などがデータソース1となる場合には、それをイメージスキャナを用いて取り込み、その解説文をOCR(Optical Character Reader)によりテキストデータ化する。そして、その解説文のテキストデータ中から単語やコメント文を抽出してそれをメタデータとして生成することも可能である。
【0033】
さらに、提供データ生成部21によりテキストデータ、画像データ、音声データ、CGデータ等の各種データを融合したホームページのデータをHTML形式で生成した場合、メタデータ生成部22は、そのHTML形式のテキストデータ中から単語やコメント文を抽出し、あるいはそのテキストデータの作成日付、作者名、ファイル名、ホームページのタイトル、URL等の情報を抽出してそれをメタデータとして生成する。
【0034】
また、データソース1の中から複数の画像データを集めてそれぞれをサムネイル化した画像一覧のデータを提供データ生成部21で生成したような場合、メタデータ生成部22は、画像一覧データの作成日付、作者名、ファイル名等の情報や、上記画像一覧データの生成元となった複数の画像データの作成日付、作者名、ファイル名等の情報を抽出してそれをメタデータとして生成する。
【0035】
なお、以上に説明した各メタデータは、あくまでも一例を示したに過ぎないものであり、データソース1の生データあるいは提供データ中からテキストデータとして抽出可能な情報であれば、他の情報をメタデータとして生成するようにしても良い。このようにして生成されたメタデータは、メタデータ用I/F部25を介してメタデータサーバ4に与えられ、登録される。
【0036】
データ生成制御部23は、上記提供データ生成部21による提供データの生成処理、および上記メタデータ生成部22によるメタデータの生成処理を制御するものである。このデータ生成制御部23は、生成対象指定部26、時限情報付加部27およびセキュリティ情報付加部28を備えている。
【0037】
上記生成対象指定部26は、データソース1の生データ上で提供データを生成する対象、あるいはメタデータを生成する対象をユーザが任意に指定するためのものである。例えば、提供データ生成部21により提供データを生成する場合、複数ある生データのうちどれを用いて提供データを生成するか、あるいは生データ内のどの部分を用いて提供データを生成するか等について、ユーザは生成対象指定部26を用いて任意に指定することが可能である。
【0038】
また、メタデータ生成部22によりメタデータを生成する場合、複数ある生データのうちどれを用いてメタデータを生成するか、生データ中に含まれるテキストデータのどの部分から単語やコメント文を抽出するか、あるいはその生データの作成日付、作者名、ファイル名等の各種情報のうちどの情報をメタデータとして抽出するかなどについて、ユーザは生成対象指定部26を用いて任意に指定することが可能である。また、OCRを用いて取り込んだ画像とその解説文とから成るデータのうち、どの部分をメタデータとして抽出するかについても任意に指定することが可能である。
【0039】
時限情報付加部27は、メタデータ生成部22により生成されるメタデータに対して、提供データの公開時期を制限する時限情報を付加するものである。例えば、「○○○まで公開」あるいは「○○○から公開」などの提供データの公開有効期限をメタデータに設定することが可能である。ここで、インターネットは世界中を繋ぐ広域なネットワークであるので、メタデータを生成あるいは利用する場所で時差が生じることがある。そこで、時限情報としては、グリニッジ標準時で標記すると良い。また、そのメタデータに対応する生データが時限到達前に消去された場合に、当該メタデータを自動的に消去するようにしても良い。
【0040】
セキュリティ情報付加部28は、メタデータ生成部22により生成されるメタデータに対して、提供データの提供先を制限するセキュリティ情報を付加するものである。例えば、「○○○のみアクセスを可能にする」などのアクセス権情報をメタデータに設定することが可能である。これにより、提供データを見せる範囲を、データソース1の提供側で任意に設定することが可能である。
【0041】
次いで、データサービスサーバ3は、上記提供データ生成部21により生成された提供データを登録して管理し、それをインターネット上のユーザ端末5に提供するものである。このデータサービスサーバ3は、本発明の提供データ管理手段に対応する。このデータサービスサーバ3は、データ生成部2とのI/F部31と、与えられた提供データを保持する提供データDB32とを備えている。そして、ユーザ端末5からのアクセスに応じて、要求された提供データを提供データDB32から取り出してユーザに提供し、あるいは提供データを用いて所定のサービスをユーザに提供する。
【0042】
また、メタデータサーバ(検索エンジン)4は、上記メタデータ生成部22により生成されたメタデータを登録して管理するものであり、本発明のメタデータ保持手段と検索手段とを備えている。すなわち、このメタデータサーバ4は、データ生成部2とのI/F部41、メタDB42および検索部43とを備えている。このメタデータサーバ4が備えるI/F部41とデータ生成部2が備えるメタデータ用I/F部25は、従来はメタデータ生成部が検索エンジン内に備えられていたのを(図6参照)検索エンジンの外部に出し、データソース1に近いところに設けたために必要となったものである。
【0043】
上記I/F部25,41は、メタデータに関して今最も注目されている標準仕様であるXML(eXtensible Markup Language)&RDF(Resource Description Framework)のフォーマットであれば受け入れるオープンなI/Fである。このようなI/Fを用いることにより、従来のようにテキストの提供データから生成されるメタデータだけでなく、本実施形態のメタデータ生成部22により様々な形式のデータから生成されるメタデータを全てメタDB42に登録することが可能となる。
【0044】
検索部43は、ユーザ端末5からの検索要求に応じてメタDB42内のメタデータを検索し、その結果をユーザ端末5に返すものである。例えば、検索部43は、ユーザ端末5から検索条件として与えられたキーワードを含むメタデータをメタDB42上で検索し、この検索条件に合致するメタデータに対応する提供データを管理しているデータサービスサーバ3のURL等を検索結果としてユーザ端末5に返す。これによりユーザは、インターネット上に存在する多数のデータサービスサーバ3の中から、所望の情報が含まれると思われるデータサービスサーバ3のURLを検索結果として得ることができる。
【0045】
本実施形態の検索部43は、上述のようなメタデータの検索処理を実行する際に、メタデータ中に時限情報やセキュリティ情報が含まれているかどうかを判定し、含まれている場合にはその時限情報やセキュリティ情報に従って検索を実行する。例えば、時限情報として「○○○まで公開」あるいは「○○○から公開」などの情報がメタデータ中に含まれていた場合は、そのメタデータが検索条件に合致していても、時限情報により許容されていない時期においては、対応するデータサービスサーバ3のURLを検索結果の中に含ませないようにする。
【0046】
また、「○○○のみアクセスを可能にする」などのアクセス権情報がメタデータ中に含まれていた場合は、ユーザ端末5から送られてくる検索要求中に含まれるユーザ情報とそのアクセス権情報とを照らし合わせる。そして、情報を公開する者として許可されたユーザ以外には、メタデータが検索条件に合致しても、それに対応するデータサービスサーバ3のURLを検索結果の中に含ませないようにする。
【0047】
なお、以上説明した図1の構成では、データソース1、データ生成部2、データサービスサーバ3、メタデータサーバ4およびユーザ端末5を1つずつ示しているが、インターネット上にはこれらが多数存在している。このとき、データソース1は、他の構成要素とネットワーク的に繋がっていても良いし、繋がっていなくても良い。
【0048】
次に、上記図1のように構成した本実施形態によるデータベース検索システムの動作を、以下に示す様々な具体例に沿って説明する。
まず最初に、簡単な例として、テキストデータのみから成るファイルがデータソース1として与えられ、このようなデータソース1からメタデータを生成する場合について説明する。
【0049】
図2は、テキストデータのみから成るデータソース1を提供データ生成部21により加工して提供データを生成する様子を示す図であり、(a)は生データであるデータソース1の例を示し、(b)は生成された提供データの例を示している。図2(a)に示すように、データソース1は、複数のテキストファイルa1 〜an を含んでいる。それぞれのテキストファイルa1 〜an は、毎日の天気、気温、湿度をテキストデータの形で記述したものであるとする。
【0050】
提供データ生成部21は、これら複数のテキストファイルa1 〜an を用いて加工を施し、例えば図2(b)に示すように、気温や湿度の1ヵ月間の推移を表したグラフデータを生成する。このとき、この1ヵ月間の天候を要約したコメント文として、例えば「1月は晴れが多く、気温の平均は8℃」のようなテキストデータを追加するようにしても良い。このようにして生成された提供データファイルAは、I/F部24,31を介してデータサービスサーバ3に与えられ、提供データDB32に登録される。
【0051】
一方、メタデータ生成部22は、データソース1から図2(a)に示すような複数のテキストファイルa1 〜an を読み取り、それぞれのテキストファイルa1 〜an 中にタグが含まれていれば(テキストファイルa1 〜an がHTML形式の場合)、そのタグを除去する。そして、各テキストファイルa1 〜an 中からメタデータを抽出する。例えば、図2(a)に示した例の場合、“晴”“曇”“雨”などの単語、“10℃”“6℃”“7℃”などの気温、“60%”“50%”“70%”などの湿度をメタデータとして抽出することが可能である。
【0052】
さらに、メタデータ生成部22は、各テキストファイルa1 〜an の付加情報をメタデータとして抽出することも可能である。付加情報とは、各テキストファイルa1 〜an のファイル名、作成日、サイズ、拡張子等の属性情報、メタデータ生成部22がデータソース1にアクセスしたときの動作条件、アクセスしたデータソース1の作成元となったデータの情報などを示す。例えば、あるテキストファイルai が元々複数のファイルai-1 ,ai-2 ,ai-3 ,…から作られたものである場合には、その元のファイルファイルai-1 ,ai-2 ,ai-3 ,…の情報をもメタデータとして抽出することが可能である。
【0053】
上記メタデータ生成部22は、データソース1である各テキストファイルa1 〜an の他に、提供データ生成部21により生成された図2(b)のような提供データファイルAを読み取り、その中からもメタデータを抽出する。例えば、図2(b)に示した例の場合、“1月”“晴れ”などの単語、“8℃”などの気温、「1月は晴れが多く、気温の平均は8℃」のようなコメント文そのものをメタデータとして抽出することが可能である。提供データファイルAのファイル名や作成日などをメタデータとして抽出することも可能である。
【0054】
このようにメタデータ生成部22によりメタデータを抽出する際、ユーザは、生成対象指定部26を用いて、データソース1の生データや提供データからメタデータを抽出する対象部分を任意に指定することが可能である。例えば、どの生データからメタデータを抽出するか、生データに含まれるテキストデータのどの部分からメタデータを抽出するか、あるいはその生データのファイル名、作成日、作者名等の属性情報のうちどの情報をメタデータとして抽出するかなどについて、ユーザは生成対象指定部26を用いて任意に指定することが可能である。
【0055】
また、ユーザは、時限情報付加部27を用いて、メタデータ生成部22により生成されるメタデータに対して、提供データの公開に関する時限情報を付加することも可能であるし、セキュリティ情報付加部28を用いて、メタデータ生成部22により生成されるメタデータに対して、提供データへのアクセスに関するセキュリティ情報を付加することも可能である。
【0056】
このようにしてメタデータ生成部22により生成されたメタデータは、I/F部25,41を介してメタデータサーバ4に与えられ、当該メタデータに対応する提供データが登録されたデータサービスサーバ3のURL情報等と共にメタDB42に登録される。その後、ユーザ端末5からメタデータサーバ4に対して検索要求が与えられると、検索部43は、ユーザ端末5からの検索要求に応じてメタDB42内のメタデータを検索し、その検索結果をユーザ端末5に返す。
【0057】
例えば、検索部43は、ユーザ端末5から検索条件として与えられたキーワードを含むメタデータをメタDB42上で検索し、この検索条件に合致するメタデータに対応する提供データを管理しているデータサービスサーバ3のURL等を検索結果としてユーザ端末5に返す。これによりユーザは、インターネット上に存在する多数のデータサービスサーバ3の中から、所望の情報が含まれると思われるデータサービスサーバ3のURLを検索結果として得ることができる。
【0058】
その後、このようにして得たURLを頼りに、ユーザ端末5からデータサービスサーバ3に対して情報取得要求のアクセスを行うと、その要求に対する応答として、提供データDB32に登録されている図2(b)のような提供データがデータサービスサーバ3からユーザ端末5に与えられ、ユーザ端末5の表示画面上に表示される。
【0059】
以上のように、本実施形態のデータベース検索システムにおいては、データソース1の提供者とは別の場所で運営されることが多いメタデータサーバ4からメタデータ生成部22を分離し、これをデータソース1の提供者側に設けているので、従来のように提供データからだけでなく、その提供データを生成する元となった生データからもメタデータを生成することができる。
【0060】
また、本実施形態によれば、生データに対する付加情報もメタデータとして抽出することができる。この生データやその付加情報は、データソース1を作成したユーザが知り得る情報である。したがって、本実施形態のようにメタデータ生成部22をデータソース1の提供者側に設けることで、データソース提供者が生成対象指定部26を用いて抽出条件を適当に設定することにより、生データとの関連性が高い情報をメタデータに含ませることができる。
【0061】
これにより、例えば所望の単語を含む情報を探し出したい場合に、加工された提供データ中には含まれていない単語であっても、生データ中に含まれていた単語がメタデータとして抽出されていれば、その単語をキーワードとして検索した場合に該当するデータサービスサーバ3のURLを確実に得ることができ、検索結果内にユーザが望む情報をより的確に反映することができる。
【0062】
例えば図2の例で、従来であれば“1月”“晴れ”などの単語、“8℃”などの気温、“A”などのファイル名、“990201”などの提供データファイルAの作成日をキーワードとした場合にのみメタデータの検索条件が合致していた。これに対して本実施形態によれば、これ以外にも、“曇”“雨”などの単語、“10℃”“6℃”“7℃”などの気温、“60%”“50%”“70%”などの湿度、各テキストファイルa1 〜an のファイル名、作成日などをキーワードとして検索を行ってもその検索条件に合致し、該当するデータサービスサーバ3のURLを確実に得ることができる。
【0063】
この場合、例えば“10℃”の気温をキーワードとして検索を行い、その検索結果として得られたURLを頼りにデータサービスサーバ3にアクセスした場合に、その要求に対する応答としてユーザ端末5の表示画面に表示されるのは、図2(b)のような提供データである。この図2(b)の画面上には“10℃”という文字は見当たらないが、気温が“10℃”に当たる部分がグラフ中に含まれており、これもユーザがキーワードとして与えた情報を含んだ情報である。このように本実施形態によれば、提供データだけからは得られないメタデータの抽出によって、一見すると見逃しがちなデータサービスサーバ3のURLも確実に検索結果として得ることができ、検索洩れを少なくすることができる。
【0064】
また、本実施形態では、生成対象指定部26を用いてメタデータを抽出する対象部分をユーザが任意に指定できるようにしているので、メタデータの生成対象をデータソース1の提供者側で任意に設定することが可能となり、ユーザから与えられる検索条件に合致させるあるいは合致させないメタデータをデータソース1の提供者側で自由に決めることができるようになる。また、メタデータを生成する際に、生データ等から不要な情報を無闇に取得しなくても済むようになる。
【0065】
また、本実施形態では、時限情報付加部27を用いてメタデータに対して時限情報を付加することができるようにしているので、データソース1から生成される提供データを公開する時期や期間をデータソース1の提供者が任意に設定することができる。また、本実施形態では、セキュリティ情報付加部28を用いてメタデータに対してセキュリティ情報を付加することができるようにしているので、データソース1から生成される提供データを公開する相手をデータソース1の提供者が任意に設定することができる。
【0066】
次に、別の例として、画像データのみから成るファイルがデータソース1として与えられ、このようなデータソース1からメタデータを生成する場合について説明する。
【0067】
図3は、あるテーマについての画像ファイルがデータソース1としてn枚存在し、提供データ生成部21がこれらn枚の画像をそれぞれ縮小して1画面中にタイル状に配置した一覧表示ファイルAを提供データとして生成する様子を示した図であり、(a)は生データであるデータソース1の例を示し、(b)は生成された提供データの例を示している。
【0068】
図3(a)に示すように、データソース1は、複数の画像ファイルa1 〜an を含んでおり、それぞれにファイル名、作成日などの属性情報が与えられている。提供データ生成部21は、データソース1からこれら複数の画像ファイルa1 〜an を読み取り、図3(b)に示すように、各画像を縮小してタイル状に並べた一覧表示ファイル(サムネイル)Aを提供データとして生成する。このようにして生成された一覧表示ファイルAは、I/F部24,31を介してデータサービスサーバ3に与えられ、提供データDB32に登録される。
【0069】
一方、メタデータ生成部22は、データソース1から複数の画像ファイルa1 〜an を読み取る。そして、読み取った各画像ファイルa1 〜an のファイル名、作成日、サイズ、拡張子などの付加情報、メタデータ生成部22がデータソース1にアクセスしたときの動作条件、アクセスしたデータソース1の作成元となったデータの情報などをメタデータとして抽出する。
【0070】
上記メタデータ生成部22は、データソース1である各画像ファイルa1 〜an の他に、提供データ生成部21により生成された提供データである図3(b)のような一覧表示ファイルAを読み取り、その中からもメタデータを抽出する。例えば、図3(b)に示した例の場合、一覧表示ファイルAのファイル名や作成日などの属性情報、各画像を集めたテーマ名が与えられていればそのテーマ名などをメタデータとして抽出する。
【0071】
このようにメタデータ生成部22によりメタデータを抽出する際、ユーザは、生成対象指定部26を用いて、データソース1の生データや提供データからメタデータを抽出する対象部分を任意に指定することが可能である。また、ユーザは、時限情報付加部27を用いて、メタデータ生成部22により生成されるメタデータに対して時限情報を付加することも可能であるし、セキュリティ情報付加部28を用いて、メタデータ生成部22により生成されるメタデータに対してセキュリティ情報を付加することも可能である。
【0072】
このようにしてメタデータ生成部22により生成されたメタデータは、I/F部25,41を介してメタデータサーバ4に与えられ、当該メタデータに対応する提供データが登録されたデータサービスサーバ3のURL情報等と共にメタDB42に登録される。その後、ユーザ端末5からメタデータサーバ4に対して検索要求が与えられると、検索部43は、ユーザ端末5からの検索要求に応じてメタDB42内のメタデータを検索し、その検索結果をユーザ端末5に返す。
【0073】
例えば、検索部43は、ユーザ端末5から検索条件として与えられたキーワードを含むメタデータをメタDB42上で検索し、この検索条件に合致するメタデータに対応する提供データを管理しているデータサービスサーバ3のURL等を検索結果としてユーザ端末5に返す。これによりユーザは、インターネット上に存在する多数のデータサービスサーバ3の中から、所望の情報が含まれると思われるデータサービスサーバ3のURLを検索結果として得ることができる。
【0074】
その後、このようにして得たURLを頼りに、ユーザ端末5からデータサービスサーバ3に対して情報取得要求のアクセスを行うと、その要求に対する応答として、提供データDB32に登録されている図3(b)のような提供データがデータサービスサーバ3からユーザ端末5に与えられ、ユーザ端末5の表示画面上に表示される。
【0075】
従来であれば、提供データ生成部21により提供データとして生成された一覧表示ファイルAの“A”というファイル名、“991105”という一覧表示ファイルAの作成日、あるいはテーマ名などを検索条件としたときのみメタデータが検索条件にヒットしていた。
【0076】
これに対して本実施形態によれば、これ以外にも、元画像ファイルa1 〜an のファイル名、作成日などをキーワードとして検索を行ってもその検索条件に合致し、該当するデータサービスサーバ3のURLを確実に得ることができる。これにより、複数の画像ファイルa1 〜an をまとめて生成した一覧表示ファイルAだけが提供データとして公開されている場合に、個々の画像データa1 〜an に関する情報を検索条件として検索を行っても該当する情報を確実に得ることができる。つまり、検索結果内にユーザが望む情報をより的確に反映することができ、検索洩れを少なくすることができる。
【0077】
次に、さらに別の例として、画像データとテキストデータとが混在したファイルがデータソース1として与えられ、このようなデータソース1からメタデータを生成する場合について説明する。
【0078】
図4は、n個の画像データa1 〜an に対してそれぞれコメント文がテキストデータb1 〜bn の形で付されたファイルをもとに、画像データa1 〜an の部分をそれぞれ縮小して1画面中にタイル状に配置した一覧表示ファイルAを提供データとして生成する様子を示した図であり、(a)は生データであるデータソース1の例を示し、(b)は生成された提供データの例を示している。コメント文は、例えば画像の作者名、その画像の分野、解説などである。
【0079】
提供データ生成部21は、図4(a)に示すデータソース1から複数の画像テキスト混合ファイルa1 +b1 〜an +bn を読み取り、図4(b)に示すように、その中に含まれる各画像データa1 〜an を縮小してタイル状に並べた一覧表示ファイル(サムネイル)Aを提供データとして生成する。このようにして生成された一覧表示ファイルAは、I/F部24,31を介してデータサービスサーバ3に与えられ、提供データDB32に登録される。
【0080】
一方、メタデータ生成部22は、データソース1から複数の画像テキスト混合ファイルa1 +b1 〜an +bn を読み取る。そして、読み取った各ファイルa1 +b1 〜an +bn 中に含まれるテキストデータb1 〜bn からメタデータを抽出する。さらに、メタデータ生成部22は、各ファイルa1 +b1 〜an +bn のファイル名、作成日、サイズ、拡張子などの付加情報、メタデータ生成部22がデータソース1にアクセスしたときの動作条件、アクセスしたデータソース1の作成元となったデータの情報などもメタデータとして抽出する。
【0081】
上記メタデータ生成部22は、データソース1である各画像テキスト混合ファイルa1 +b1 〜an +bn の他に、提供データ生成部21により生成された提供データである図4(b)のような一覧表示ファイルAを読み取り、その中からもメタデータを抽出する。例えば、図4(b)に示した例の場合、一覧表示ファイルAのファイル名や作成日などの属性情報、各画像を集めたテーマ名が与えられていればそのテーマ名などをメタデータとして抽出する。
【0082】
このようにメタデータ生成部22によりメタデータを抽出する際、ユーザは、生成対象指定部26を用いて、データソース1の生データや提供データからメタデータを抽出する対象部分を任意に指定することが可能である。また、ユーザは、時限情報付加部27を用いて、メタデータ生成部22により生成されるメタデータに対して時限情報を付加することも可能であるし、セキュリティ情報付加部28を用いて、メタデータ生成部22により生成されるメタデータに対してセキュリティ情報を付加することも可能である。
【0083】
このようにしてメタデータ生成部22により生成されたメタデータは、I/F部25,41を介してメタデータサーバ4に与えられ、当該メタデータに対応する提供データが登録されたデータサービスサーバ3のURL情報等と共にメタDB42に登録される。その後、ユーザ端末5からメタデータサーバ4に対して検索要求が与えられると、検索部43は、ユーザ端末5からの検索要求に応じてメタDB42内のメタデータを検索し、その検索結果をユーザ端末5に返す。
【0084】
例えば、検索部43は、ユーザ端末5から検索条件として与えられたキーワードを含むメタデータをメタDB42上で検索し、この検索条件に合致するメタデータに対応する提供データを管理しているデータサービスサーバ3のURL等を検索結果としてユーザ端末5に返す。これによりユーザは、インターネット上に存在する多数のデータサービスサーバ3の中から、所望の情報が含まれると思われるデータサービスサーバ3のURLを検索結果として得ることができる。
【0085】
その後、このようにして得たURLを頼りに、ユーザ端末5からデータサービスサーバ3に対して情報取得要求のアクセスを行うと、その要求に対する応答として、提供データDB32に登録されている図4(b)のような提供データがデータサービスサーバ3からユーザ端末5に与えられ、ユーザ端末5の表示画面上に表示される。
【0086】
従来であれば、提供データ生成部21により提供データとして生成された一覧表示ファイルAの“A”というファイル名、“991105”という一覧表示ファイルAの作成日、あるいはテーマ名などを検索条件としたときのみメタデータが検索条件にヒットしていた。
【0087】
これに対して本実施形態によれば、これ以外にも、画像の作者名、分野、解説などのコメント文に含まれる単語、あるいは元ファイルa1 +b1 〜an +bn のファイル名、作成日などをキーワードとして検索を行ってもその検索条件に合致し、該当するデータサービスサーバ3のURLを確実に得ることができる。これにより、一覧表示ファイルAだけが提供データとして公開されている場合に、個々の画像データa1 〜an に関する情報や、それに対応して付されたテキストデータb1 〜bn に関する情報を検索条件として検索を行っても該当する情報を確実に得ることができる。つまり、検索結果内にユーザが望む情報をより的確に反映することができ、検索洩れを少なくすることができる。
【0088】
以上図2〜図4に示した例では、提供データ生成部21により、データソース1として存在する複数の生データファイルから1つの提供データファイルを生成する場合を例にとって説明した。以下に示す図5の例では、これとは逆に、テキストデータとして様々な情報を含む1つのファイルがデータソース1として与えられ、この1つの生データファイルから複数の提供データファイルを生成する場合のメタデータの生成について説明する。
【0089】
図5は、複数の情報x11,x12,x21,x30,…を含む1つのテキストファイルxをもとに、提供データ生成部21が必要な情報を取り出して2つのテキストファイルX1 ,X2 を提供データとして生成する様子を示した図であり、(a)は生データであるデータソース1の例を示し、(b)は生成された提供データの例を示している。
【0090】
この場合、提供データ生成部21は、図5(a)に示すデータソース1から1つのテキストファイルxを読み取り、図5(b)に示すように、その中に含まれる各情報を適宜取り出して2つの提供データファイルX1 ,X2 を提供データとして生成する。図5の例では、テキストファイルxから情報x11,x12,x30,…を取り出して提供データファイルX1 を生成し、テキストファイルxから情報x21,x30,…を取り出して提供データファイルX2 を生成している。
【0091】
このようにして生成された提供データファイルX1 ,X2 は、それぞれI/F部24,31を介してデータサービスサーバ3に与えられ、提供データDB32に登録される。このとき、上記2つの提供データファイルX1 ,X2 は、異なるデータサービスサーバ3上に登録されることもある。
【0092】
一方、メタデータ生成部22は、データソース1から1つテキストファイルxを読み取る。そして、読み取ったテキストファイルx中に含まれる情報からメタデータを抽出する。この場合、x11,x12,x21,x30,…などの個々の情報をメタデータとして抽出することが可能である。さらに、メタデータ生成部22は、上記テキストファイルxのファイル名、作成日、サイズ、拡張子などの付加情報、メタデータ生成部22がデータソース1にアクセスしたときの動作条件、アクセスしたデータソース1の作成元となったデータの情報などもメタデータとして抽出する。
【0093】
上記メタデータ生成部22は、データソース1であるテキストファイルxの他に、提供データ生成部21により生成された図5(b)のような提供データファイルX1 ,X2 を読み取り、その中からもメタデータを抽出する。例えば、図5(b)に示した例の場合、一方の提供データファイルX1 からx11,x12,x30,…などの情報をファイルX1 用のメタデータとして抽出する。また、他方の提供データファイルX2 からx21,x30,…などの情報をファイルX2 用のメタデータとして抽出する。さらに、メタデータ生成部22は、各提供データファイルX1 ,X2 のファイル名や作成日などの属性情報などもメタデータとして抽出する。
【0094】
このようにメタデータ生成部22によりメタデータを抽出する際、ユーザは、生成対象指定部26を用いて、データソース1の生データや提供データからメタデータを抽出する対象部分を任意に指定することが可能である。また、ユーザは、時限情報付加部27を用いて、メタデータ生成部22により生成されるメタデータに対して時限情報を付加することも可能であるし、セキュリティ情報付加部28を用いて、メタデータ生成部22により生成されるメタデータに対してセキュリティ情報を付加することも可能である。
【0095】
このようにしてメタデータ生成部22により生成されたメタデータは、I/F部25,41を介してメタデータサーバ4に与えられ、当該メタデータに対応する提供データが登録されたデータサービスサーバ3のURL情報等と共にメタDB42に登録される。その後、ユーザ端末5からメタデータサーバ4に対して検索要求が与えられると、検索部43は、ユーザ端末5からの検索要求に応じてメタDB42内のメタデータを検索し、その検索結果をユーザ端末5に返す。
【0096】
例えば、検索部43は、ユーザ端末5から検索条件として与えられたキーワードを含むメタデータをメタDB42上で検索し、この検索条件に合致するメタデータに対応する提供データを管理しているデータサービスサーバ3のURL等を検索結果としてユーザ端末5に返す。これによりユーザは、インターネット上に存在する多数のデータサービスサーバ3の中から、所望の情報が含まれると思われるデータサービスサーバ3のURLを検索結果として得ることができる。
【0097】
その後、このようにして得たURLを頼りに、ユーザ端末5からデータサービスサーバ3に対して情報取得要求のアクセスを行うと、その要求に対する応答として、提供データDB32に登録されている図5(b)のような提供データがデータサービスサーバ3からユーザ端末5に与えられ、ユーザ端末5の表示画面上に表示される。
【0098】
このとき、例えば“x11”の情報をキーワードとして検索をかけると、メタDB42内には“x11”というメタデータが登録されているので検索条件にヒットする。この場合は、その“x11”の情報を含む提供データファイルX1 を管理しているデータサービスサーバ3のURLが検索結果として返される。また、“x30”の情報をキーワードとして検索をかけた場合も検索条件にヒットするが、この場合は、その“x30”の情報は2つの提供データファイルX1 ,X2 の双方に含まれている。
【0099】
この場合は、例えばセキュリティ情報付加部28によりメタデータに付加されたセキュリティ情報によって検索者へのアクセスが許可されている方の提供データファイルを管理しているデータサービスサーバ3のURLを検索結果として返すようにすることが可能である。また、両方ともアクセスが許可されている場合は、提供データファイルX1 ,X2 を管理しているデータサービスサーバ3のURLを共に検索結果として返すようにする。
【0100】
このように、本実施形態のデータベース検索システムによれば、図2〜図4のようにデータソースと提供データとがn:1の関係にあるときだけでなく、図5のようにデータソースと提供データとが1:mの関係にあるときにも、生データからメタデータを生成することができる。もちろん、データソースと提供データとがn:mの関係にあるときにも、生データからメタデータを生成することが可能である。すなわち、従来は1つのデータソースからは1つの体系のメタデータしか生成できなかったが、本実施形態によれば、複数個のデータソースから複数個のメタデータ体系を生成することができるようになる。
【0101】
なお、以上の説明では、データソース1がテキストデータ、画像データあるいはその混合データである場合について説明したが、データソース1は音声データ、CGデータ等の他の形式のデータであっても良い。
【0102】
また、1つのトップページから階層的に複数のサブページを持たせたホームページにおいては、実際のサービスの内容はトップページよりもサブページの方に記述されていることが多い。そこで、各サブページの生データ中からメタデータを抽出し、それをホームページ全体のメタデータとしてメタDB42に登録しておくようにしても良い。
【0103】
このようにすれば、検索ロボットがトップページよりも下の階層のサブページには入れないようにセキュリティが設定されていても、サブページに記述された内容をキーワードとした検索によって該当するページのURLを得ることができる。この場合、提供データとしてトップページや所望のサブページを設定しておけば、検索条件に合致したキーワードが含まれるサブページがどれであるかに関わらず、最初は提供データとして指定したページを必ず開くような仕組みを提供することができる。
【0104】
また、本実施形態では、特定のアプリケーションで作成されたデータの中身をメタデータとして抽出するようにしても良い。例えば、URLが“http://www.ei.nsc.co.jp/...../991101.doc”である場合、従来であればこのファイルの中身までは検索できないが、メタデータの登録時にこのファイルの中身の文書からメタデータを抽出して登録しておくことにより、ファイルの中身の情報をキーワードとして検索することができる。
【0105】
また、上記図1の構成において、メタデータ生成部22をメタデータサーバ4内に設けることも可能であるが、この場合にはデータ生成部2からメタデータサーバ4に対して生データそのものを送る必要がある。これに対して、図1に示したようにメタデータ生成部22をデータ生成部2内に設ければ、生データ自体をメタデータサーバ4に送る必要がなく、通信トラフィックを小さく抑えることができる。また、データソース1にアクセスして提供データ生成部21により提供データを生成する際にメタデータも生成することができ、提供データの生成とメタデータ生成とを効率的に行うことができる。
【0106】
以上に説明した本実施形態のデータベース検索システムは、コンピュータのCPUあるいはMPU、RAM、ROMなどで構成されるものであり、RAMやROMに記憶されたプログラムが動作することによって実現できる。したがって、コンピュータが上記機能を果たすように動作させるプログラムを、例えばCD−ROMのような記録媒体に記録し、コンピュータに読み込ませることによって実現できるものである。上記プログラムを記録する記録媒体としては、CD−ROM以外に、フロッピーディスク、ハードディスク、磁気テープ、光磁気ディスク、不揮発性メモリカード等を用いることができる。
【0107】
また、コンピュータが供給されたプログラムを実行することにより上述の実施形態の機能が実現されるだけでなく、そのプログラムがコンピュータにおいて稼働しているOS(オペレーティングシステム)あるいは他のアプリケーションソフト等と共同して上述の実施形態の機能が実現される場合や、供給されたプログラムの処理の全てあるいは一部がコンピュータの機能拡張ボードや機能拡張ユニットにより行われて上述の実施形態の機能が実現される場合も、かかるプログラムは本発明の実施形態に含まれる。
【0108】
上記に説明した実施形態は、何れも本発明を実施するにあたっての具体化の一例を示したものに過ぎず、これらによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその精神、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。
【0109】
【発明の効果】
本発明は上述したように、メタデータ保持手段(メタデータサーバ)からメタデータ生成手段を分離し、これをデータソースの近くに設けてメタデータをデータソースの生データ自体から生成するようにしたので、従来のように提供データからだけでなく、その提供データを生成する元となった生データからもメタデータを得ることができる。これにより、生データとの関連性が高い情報をメタデータに含ませることができ、このメタデータを用いた検索結果の中にユーザが望む情報をより的確に反映させることができる。したがって、所望の情報を含む提供データ管理手段(データサービスサーバ)の所在情報をより確実に検索結果として得ることができるようになり、検索洩れを少なくすることができる。
【0110】
また、本発明の他の特徴によれば、データソースの生データからメタデータを抽出する対象を指定するための生成対象指定手段を設けたので、メタデータの生成対象をデータソースの提供者側で任意に設定することが可能となり、ユーザから与えられる検索条件に合致させるあるいは合致させないメタデータをデータソース提供者側で自由に決めることができるようになる。
【0111】
また、本発明のその他の特徴によれば、提供データの公開に関する時限情報をメタデータに付加する時限情報設定手段を設けたので、提供データの公開を許可する時期や期間以外では、与えられた検索条件自体には合致していても、提供データ管理手段(データサービスサーバ)の所在情報を検索結果として出力しないようにすることができ、提供データを公開する時期や期間をデータソースの提供者が任意に設定することができる。
【0112】
また、本発明のその他の特徴によれば、提供データへのアクセスに関するセキュリティ情報をメタデータに付加するセキュリティ情報設定手段を設けたので、提供データへのアクセスを許可するユーザ以外には提供データ管理手段(データサービスサーバ)の所在情報を検索結果として出力しないようにすることができ、提供データを公開するユーザをデータソースの提供者が任意に設定することができる。
【図面の簡単な説明】
【図1】ロボット型検索エンジンを用いた本実施形態によるデータベース検索システムの構成例を示すブロック図である。
【図2】テキストデータのみから成るデータソースを加工して提供データを生成する様子を示す図である。
【図3】画像データのみから成るデータソースを加工して提供データを生成する様子を示す図である。
【図4】テキストデータと画像データとが混在したデータソースを加工して提供データを生成する様子を示す図である。
【図5】複数の情報を含む1つのテキストファイルを加工して複数の提供データを生成する様子を示す図である。
【図6】ロボット型検索エンジンを用いた従来のデータベース検索システムの構成例を示すブロック図である。
【符号の説明】
1 データソース
2 データ生成部
3 データサービスサーバ
4 メタデータサーバ(検索エンジン)
5 ユーザ端末
21 提供データ生成部
22 メタデータ生成部
23 データ生成制御部
24 提供データ用I/F部
25 メタデータ用I/F部
26 生成対象指定部
27 時限情報付加部
28 セキュリティ情報付加部
31 提供データ用I/F部
32 提供データDB
41 メタデータ用I/F部
42 メタDB
43 検索部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a database search system and method, and further to a recording medium storing a program for realizing these functions with software functions, and is particularly suitable for use in a search system for searching for desired data from a plurality of distributed databases. It is a thing.
[0002]
[Prior art]
In recent years, computer networks have rapidly developed, and along with this, it has been often seen that databases are also distributed. For example, on the Internet, a plurality of computers each holding data are distributed as servers or clients all over the world, in other words, configured as a distributed database. Databases tend to be distributed not only in the Internet but also in systems that handle huge amounts of data.
[0003]
When trying to read desired information from a database distributed in this way, users often do not know where the information to be read is stored in the distributed database. The data service server provided for each database is accessed in order, and the search must be repeated until the desired information is found. As described above, it takes a lot of time and a lot of labor to sequentially search all the data service servers that manage each database individually.
[0004]
In addition, if the user does not know all the location of the data service server (address information such as Internet URL (Uniform Resource Locator)), it is impossible to search all data service servers. is there. However, the distributed data service server may constantly register and delete data, and the server itself may also be continuously connected to and disconnected from the network. Therefore, it is extremely difficult for the user to grasp all of these things, and it is difficult to search for accurate information.
[0005]
In order to eliminate such inconvenience, for example, the Internet has an address search service called a search engine. This search engine is broadly divided into a type that searches for a home page that matches the search information such as the title, URL, and comment of the home page registered as metadata, and a text on each home page on the Internet. There is a type that searches for a matching home page in the full text.
[0006]
The former type is a manual search engine that manually registers search information, and automatically collects necessary information from each data service server by following links and registers it as search information. It is divided into so-called robot type search engines.
[0007]
Both the robot type and manual type search engines can search for necessary URLs by inputting keywords, for example, based on search information collected automatically or manually. For example, when a search is performed for the keyword “patent”, the URL of the data service server in which search information including the keyword is registered is output as a search result. The user can search for desired information by accessing the URL included in the search result.
[0008]
FIG. 6 is a block diagram showing a configuration example of a conventional database search system using the robot type search engine. In FIG. 6, a
[0009]
For example, in the case of generating homepage data in which text data, image data, and audio data are merged, the
[0010]
In addition, the
[0011]
The
[0012]
Here, one
[0013]
The metadata server (search engine) 54 includes a
[0014]
The
[0015]
[Problems to be solved by the invention]
However, in the conventional database search system shown in FIG. 6, the
[0016]
For example, when the provided data is registered as data in the above-described HTML format, the robot-
[0017]
Therefore, if the provided data is normal text data or HTML format data, it is possible to extract metadata from the text data, but other formats such as image data, audio data, graph data, CG data, etc. For data, metadata could not be retrieved. Further, even if the provided data is in the form of text data, if the provided data is not the raw data itself of the
[0018]
For this reason, even if it is desired to search for information including desired image data, audio data, graph data, CG data, etc., the corresponding data is not registered in the
[0019]
The present invention has been made to solve such problems, and by making it possible to register fine-grained metadata representing various types of raw data, an answer closer to the information requested by the user. It is an object to provide a search engine (database search system) capable of providing
[0020]
[Means for Solving the Problems]
The database search system according to the present invention includes provision data generation means for reading out at least one raw data from a data source and generating provision data, and the provision generated by the provision data generation means based on the data source and the data source. Extracting information from the data and generating metadata including location information of the provided data, metadata holding means for holding the metadata, and holding the provided data from the user terminal The provided data management means for providing the provided data to the user terminal in response to the request, and the metadata held in the metadata holding means in response to the request from the user terminal, and the provided data as the search result Retrieval means for returning location information of provided data held by the management means to the user terminal Characterized by comprising a.
[0021]
In another aspect of the present invention, the communication interface connecting the metadata generation means and the metadata holding means is configured by an interface based on a standard specification related to the metadata.
In another aspect of the present invention, a generation target designating unit for designating a target for extracting the metadata from the raw data of the data source by the metadata generation unit is provided.
In another aspect of the present invention, there is provided time limit information setting means for adding to the metadata generated by the metadata generation means time limit information related to the release of the provided data managed by the provided data management means. It is characterized by that.
In another aspect of the present invention, security information setting means for adding security information related to access to the provided data managed by the provided data managing means to the metadata generated by the metadata generating means is provided. It is characterized by that.
[0022]
The database search method of the present invention is connected to a user terminal through a network, and the user terminal in a database search system having provided data generation means, metadata generation means, metadata holding means, provided data management means, and search means. A database search method for searching for data in response to a request from the step, wherein the provided data generation means reads at least one raw data from a data source to generate provided data, and the metadata generation means includes: Extracting the information from the data source and the provision data generated by the provision data generation unit based on the data source to generate metadata including the location information of the provision data; and the metadata holding unit, , The step of holding the metadata, and the provided data management means The step of holding the provided data and providing the provided data to the user terminal in response to a request from the user terminal, and the search means are held in the metadata holding means in response to a request from the user terminal And searching for metadata and returning the location information of the provided data held by the provided data management means to the user terminal as a search result.
[0023]
In another aspect of the present invention, it is possible to specify a target for extracting the metadata from the raw data of the data source.
Another aspect of the present invention is characterized in that it is possible to add time limit information related to the disclosure of the provided data to the generated metadata.
In another aspect of the present invention, security information relating to access to the provided data can be added to the generated metadata.
[0024]
A computer-readable recording medium according to the present invention is characterized in that a program for causing a computer to function as each means according to any one of claims 1 to 5 is recorded.
In another aspect of the present invention, a program for causing a computer to execute the processing procedure of the database search method according to any one of claims 6 to 9 is recorded.
[0025]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram showing a configuration example of a database search system according to this embodiment using a robot type search engine.
[0026]
In FIG. 1, a data source 1 is a database that stores various raw data such as text data, image data, audio data, and CG data. The
[0027]
The provided
[0028]
Further, the provision
[0029]
The
[0030]
For example, when the data source 1 that is the generation target of metadata is text data, the
[0031]
In addition, when the data source 1 that is the generation target of metadata is data other than text such as image data, audio data, and CG data, the
[0032]
In addition, when a data source 1 is a book in which the description text is described together with a photo, an illustration, etc., it is captured using an image scanner, and the description text is converted into text data using an OCR (Optical Character Reader). . It is also possible to extract words and comment sentences from the text data of the commentary sentences and generate them as metadata.
[0033]
Furthermore, when the provided
[0034]
When the provided
[0035]
Note that each of the metadata described above is merely an example. If the information can be extracted as text data from the raw data or provided data of the data source 1, the other information is meta-data. It may be generated as data. The metadata generated in this way is given to the
[0036]
The data
[0037]
The generation
[0038]
In addition, when generating metadata by the
[0039]
The time
[0040]
The security
[0041]
Next, the data service server 3 registers and manages the provision data generated by the provision
[0042]
The metadata server (search engine) 4 registers and manages the metadata generated by the
[0043]
The I /
[0044]
The search unit 43 searches for metadata in the
[0045]
The search unit 43 according to the present embodiment determines whether or not the metadata includes time limit information or security information when performing the metadata search process as described above. The search is executed according to the time limit information and security information. For example, if information such as “publish until XXX” or “publish from XXX” is included in the metadata as the time information, the time information will be displayed even if the metadata matches the search conditions. In the period not permitted by the above, the URL of the corresponding data service server 3 is not included in the search result.
[0046]
In addition, when access right information such as “only access is allowed” is included in the metadata, the user information included in the search request sent from the
[0047]
In the configuration of FIG. 1 described above, the data source 1, the
[0048]
Next, the operation of the database search system according to the present embodiment configured as shown in FIG. 1 will be described according to various specific examples shown below.
First, as a simple example, a case where a file consisting only of text data is given as the data source 1 and metadata is generated from the data source 1 will be described.
[0049]
FIG. 2 is a diagram showing a state in which provided data is generated by processing the data source 1 consisting only of text data by the provided
[0050]
The provided
[0051]
On the other hand, the
[0052]
Further, the
[0053]
The
[0054]
Thus, when extracting metadata by the
[0055]
In addition, the user can add time information regarding the disclosure of the provided data to the metadata generated by the
[0056]
The metadata generated by the
[0057]
For example, the search unit 43 searches the
[0058]
Thereafter, when the information acquisition request is accessed from the
[0059]
As described above, in the database search system of the present embodiment, the
[0060]
Further, according to the present embodiment, additional information for raw data can also be extracted as metadata. This raw data and its additional information are information that the user who created the data source 1 can know. Therefore, by providing the
[0061]
Thus, for example, when searching for information including a desired word, even if the word is not included in the processed provided data, the word included in the raw data is extracted as metadata. Then, the URL of the corresponding data service server 3 can be obtained with certainty when the word is searched for as a keyword, and the information desired by the user can be more accurately reflected in the search result.
[0062]
For example, in the example of FIG. 2, in the past, words such as “January” and “clear”, temperature such as “8 ° C.”, file name such as “A”, creation date of provided data file A such as “990201” The metadata search condition was met only when the keyword was used. On the other hand, according to the present embodiment, in addition to this, words such as “cloudy” and “rain”, temperatures such as “10 ° C.”, “6 ° C.”, and “7 ° C.”, “60%” “50%” Humidity such as “70%”, each text file a 1 ~ A n Even if a search is performed using the file name, creation date, and the like as keywords, the search condition is met and the URL of the corresponding data service server 3 can be obtained reliably.
[0063]
In this case, for example, when a search is performed using the temperature of “10 ° C.” as a keyword and the data service server 3 is accessed using the URL obtained as a result of the search, a response to the request is displayed on the display screen of the
[0064]
In the present embodiment, since the user can arbitrarily specify the target portion from which the metadata is extracted using the generation
[0065]
In the present embodiment, the time
[0066]
Next, as another example, a case where a file consisting only of image data is given as the data source 1 and metadata is generated from the data source 1 will be described.
[0067]
FIG. 3 shows a list display file A in which n image files for a certain theme exist as data source 1 and provided
[0068]
As shown in FIG. 3A, the data source 1 includes a plurality of image files a. 1 ~ A n , And attribute information such as file name and creation date is given to each. The provided
[0069]
On the other hand, the
[0070]
The
[0071]
Thus, when extracting metadata by the
[0072]
The metadata generated by the
[0073]
For example, the search unit 43 searches the
[0074]
Thereafter, when the information acquisition request is accessed from the
[0075]
Conventionally, the search condition is the file name “A” of the list display file A generated as the provided data by the provided
[0076]
On the other hand, according to the present embodiment, the original image file a 1 ~ A n Even if a search is performed using the file name, creation date, and the like as keywords, the search condition is met and the URL of the corresponding data service server 3 can be obtained reliably. As a result, a plurality of image files a 1 ~ A n When only the list display file A generated collectively is disclosed as provided data, individual image data a 1 ~ A n Relevant information can be obtained reliably even if a search is performed using the information regarding the search condition. That is, the information desired by the user can be more accurately reflected in the search result, and search omission can be reduced.
[0077]
Next, as another example, a case where a file in which image data and text data are mixed is given as the data source 1 and metadata is generated from the data source 1 will be described.
[0078]
FIG. 4 shows n pieces of image data a 1 ~ A n Comment text for each text data b 1 ~ B n Based on the file attached in the form of 1 ~ A n Is a diagram showing how list display files A arranged in tiles on one screen are reduced and provided as provided data, (a) shows an example of data source 1 that is raw data, (B) has shown the example of the provision data produced | generated. The comment text is, for example, the name of the author of the image, the field of the image, and a description.
[0079]
The provided
[0080]
On the other hand, the
[0081]
The
[0082]
Thus, when extracting metadata by the
[0083]
The metadata generated by the
[0084]
For example, the search unit 43 searches the
[0085]
Thereafter, when the information acquisition request is accessed from the
[0086]
Conventionally, the search condition is the file name “A” of the list display file A generated as the provided data by the provided
[0087]
On the other hand, according to the present embodiment, in addition to this, the word included in the comment sentence such as the author name, field, and description of the image, or the original file a 1 + B 1 ~ A n + B n Even if a search is performed using the file name, creation date, and the like as keywords, the search condition is met and the URL of the corresponding data service server 3 can be obtained reliably. As a result, when only the list display file A is disclosed as provided data, individual image data a 1 ~ A n Information about text and text data attached to it 1 ~ B n Relevant information can be obtained reliably even if a search is performed using the information regarding the search condition. That is, the information desired by the user can be more accurately reflected in the search result, and search omission can be reduced.
[0088]
In the examples shown in FIGS. 2 to 4, the case where the provision
[0089]
FIG. 5 shows a plurality of pieces of information x 11 , X 12 , X twenty one , X 30 ,... Based on one text file x, the provided
[0090]
In this case, the provided
[0091]
Provided data file X generated in this way 1 , X 2 Are provided to the data service server 3 via the I /
[0092]
On the other hand, the
[0093]
In addition to the text file x that is the data source 1, the
[0094]
Thus, when extracting metadata by the
[0095]
The metadata generated by the
[0096]
For example, the search unit 43 searches the
[0097]
Thereafter, when the information acquisition request is accessed from the
[0098]
At this time, for example, “x 11 When a search is performed using the information "" as a keyword, "x 11 ”Is registered, so the search condition is hit. In this case, the“ x ” 11 Data file X that contains " 1 The URL of the data service server 3 that manages the URL is returned as a search result. Also, “x 30 The search condition is also hit when a search is performed using the information "" as a keyword. In this case, the "x" 30 "Is the two provided data files X 1 , X 2 Are included in both.
[0099]
In this case, for example, the URL of the data service server 3 that manages the provided data file that is permitted to access the searcher by the security information added to the metadata by the security
[0100]
As described above, according to the database search system of the present embodiment, not only when the data source and the provided data have an n: 1 relationship as shown in FIGS. Even when the provided data is in a 1: m relationship, metadata can be generated from the raw data. Of course, it is possible to generate metadata from raw data even when the data source and the provided data have an n: m relationship. That is, conventionally, only one system of metadata can be generated from one data source. However, according to the present embodiment, a plurality of metadata systems can be generated from a plurality of data sources. Become.
[0101]
In the above description, the case where the data source 1 is text data, image data, or mixed data thereof has been described. However, the data source 1 may be data of other formats such as audio data and CG data.
[0102]
Further, in a homepage that has a plurality of subpages hierarchically from one top page, the actual service content is often described in the subpage rather than the top page. Therefore, metadata may be extracted from the raw data of each subpage and registered in the
[0103]
In this way, even if the security is set so that the search robot does not enter the sub-pages below the top page, the search for the corresponding page can be performed by using the content described in the sub-page as a keyword. URL can be obtained. In this case, if the top page or the desired subpage is set as the provided data, the page specified as the provided data is always the first regardless of which subpage contains the keyword that matches the search conditions. An open mechanism can be provided.
[0104]
In the present embodiment, the contents of data created by a specific application may be extracted as metadata. For example, if the URL is “http://www.ei.nsc.co.jp/...../991101.doc”, the contents of this file cannot be searched conventionally, but the metadata By extracting and registering metadata from the documents in the file at the time of registration, the information in the file can be searched as a keyword.
[0105]
In the configuration of FIG. 1, the
[0106]
The database search system of the present embodiment described above is constituted by a computer CPU or MPU, RAM, ROM, etc., and can be realized by operating a program stored in the RAM or ROM. Therefore, the program that causes the computer to perform the above functions can be realized by recording the program on a recording medium such as a CD-ROM and causing the computer to read the program. As a recording medium for recording the program, a floppy disk, a hard disk, a magnetic tape, a magneto-optical disk, a nonvolatile memory card, or the like can be used in addition to the CD-ROM.
[0107]
In addition, the functions of the above-described embodiments are realized by executing a program supplied by a computer, and the program is used in cooperation with an OS (operating system) or other application software running on the computer. When the functions of the above-described embodiment are realized, or when all or part of the processing of the supplied program is performed by a function expansion board or a function expansion unit of the computer, the function of the above-described embodiment is realized. Such a program is included in the embodiment of the present invention.
[0108]
Each of the embodiments described above is merely an example of the embodiment for carrying out the present invention, and the technical scope of the present invention should not be construed as being limited thereto. In other words, the present invention can be implemented in various forms without departing from the spirit or main features thereof.
[0109]
【The invention's effect】
In the present invention, as described above, the metadata generation means is separated from the metadata holding means (metadata server) and is provided near the data source so that the metadata is generated from the raw data itself of the data source. Therefore, the metadata can be obtained not only from the provided data as in the prior art, but also from the raw data from which the provided data is generated. As a result, information that is highly relevant to the raw data can be included in the metadata, and the information desired by the user can be more accurately reflected in the search results using the metadata. Therefore, the location information of the provided data management means (data service server) including the desired information can be obtained more reliably as a search result, and search omissions can be reduced.
[0110]
According to another aspect of the present invention, since the generation target specifying means for specifying the target for extracting the metadata from the raw data of the data source is provided, the generation target of the metadata is set as the data source provider side. Thus, it is possible to arbitrarily set metadata, and the data source provider can freely determine metadata that matches or does not match the search condition given by the user.
[0111]
Further, according to another feature of the present invention, since the time information setting means for adding the time information related to the release of the provided data to the metadata is provided, the time information is given except for the time and period when the provided data is allowed to be released. Even if the search condition itself is met, the location information of the provided data management means (data service server) can be prevented from being output as a search result, and the data source provider can specify the time and period for disclosing the provided data. Can be set arbitrarily.
[0112]
According to another feature of the present invention, security information setting means for adding security information related to access to provided data to metadata is provided, so that provided data management can be performed only for users who permit access to provided data. The location information of the means (data service server) can be prevented from being output as the search result, and the provider of the data source can arbitrarily set the user who discloses the provided data.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration example of a database search system according to an embodiment using a robot type search engine.
FIG. 2 is a diagram illustrating a state in which provided data is generated by processing a data source including only text data.
FIG. 3 is a diagram illustrating a state in which provided data is generated by processing a data source including only image data.
FIG. 4 is a diagram illustrating a state in which provided data is generated by processing a data source in which text data and image data are mixed.
FIG. 5 is a diagram showing a state in which a single text file including a plurality of information is processed to generate a plurality of provided data.
FIG. 6 is a block diagram showing a configuration example of a conventional database search system using a robot type search engine.
[Explanation of symbols]
1 Data source
2 Data generator
3 Data service server
4 Metadata server (search engine)
5 User terminal
21 Provided data generator
22 Metadata generator
23 Data generation controller
24 Provided data I / F section
25 I / F section for metadata
26 Generation target specification part
27 Time information addition part
28 Security information addition part
31 Provided data I / F section
32 Provided data DB
41 I / F section for metadata
42 Meta DB
43 Search part
Claims (11)
上記データソース及び当該データソースを基に上記提供データ生成手段によって生成された提供データから情報を抽出して、上記提供データの所在情報を含むメタデータを生成するメタデータ生成手段と、
上記メタデータを保持するメタデータ保持手段と、
上記提供データを保持してユーザ端末からの要求に応じて提供データを当該ユーザ端末に提供する提供データ管理手段と、
ユーザ端末からの要求に応じて上記メタデータ保持手段に保持されているメタデータを検索し、その検索結果として上記提供データ管理手段により保持されている提供データの所在情報を当該ユーザ端末に返す検索手段と
を備えたことを特徴とするデータベース検索システム。Provided data generation means for reading the at least one raw data from the data source and generating the provided data;
Metadata generating means for extracting information from the data source and provided data generated by the provided data generating means based on the data source, and generating metadata including location information of the provided data;
Metadata holding means for holding the metadata;
Provision data management means for holding the provision data and providing the provision data to the user terminal in response to a request from the user terminal;
Search for metadata held in the metadata holding means in response to a request from the user terminal, and return the location information of the provided data held by the provided data management means to the user terminal as the search result A database search system comprising: means.
上記提供データ生成手段が、少なくとも1つの生データをデータソースから読み出して提供データを生成する工程と、
上記メタデータ生成手段が、上記データソース及び当該データソースを基に上記提供データ生成手段によって生成された提供データから情報を抽出して、上記提供データの所在情報を含むメタデータを生成する工程と、
上記メタデータ保持手段が、上記メタデータを保持する工程と、
上記提供データ管理手段が、上記提供データを保持してユーザ端末からの要求に応じて提供データを当該ユーザ端末に提供する工程と、
上記検索手段が、ユーザ端末からの要求に応じて上記メタデータ保持手段に保持されているメタデータを検索し、その検索結果として上記提供データ管理手段により保持されている提供データの所在情報を当該ユーザ端末に返す工程と、
を有することを特徴とするデータベース検索方法。Data is searched in response to a request from the user terminal in a database search system connected to the user terminal via a network and having provided data generation means, metadata generation means, metadata holding means, provided data management means, and search means. A database search method,
The provision data generation means reads at least one raw data from the data source to generate the provision data;
The metadata generating means extracting information from the data source and the provided data generated by the provided data generating means based on the data source, and generating metadata including location information of the provided data; ,
The metadata holding means holding the metadata;
The providing data management means holding the providing data and providing the providing data to the user terminal in response to a request from the user terminal;
The search means searches the metadata held in the metadata holding means in response to a request from the user terminal, and the location information of the provided data held by the provided data management means as the search result Returning to the user terminal;
A database search method characterized by comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP33170399A JP3939477B2 (en) | 1999-11-22 | 1999-11-22 | Database search system and method, recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP33170399A JP3939477B2 (en) | 1999-11-22 | 1999-11-22 | Database search system and method, recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001147941A JP2001147941A (en) | 2001-05-29 |
JP3939477B2 true JP3939477B2 (en) | 2007-07-04 |
Family
ID=18246653
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP33170399A Expired - Fee Related JP3939477B2 (en) | 1999-11-22 | 1999-11-22 | Database search system and method, recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3939477B2 (en) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4496672B2 (en) * | 2001-06-06 | 2010-07-07 | 日本ビクター株式会社 | Image information recording apparatus and image information recording system |
JP4168606B2 (en) * | 2001-06-28 | 2008-10-22 | ソニー株式会社 | Information processing apparatus and method, recording medium, and program |
JP2003036333A (en) * | 2001-07-24 | 2003-02-07 | Japan Science & Technology Corp | International disaster information providing system |
JP4002150B2 (en) * | 2002-07-30 | 2007-10-31 | ソニー株式会社 | Information communication apparatus and information communication method, information exchange / human relationship formation support system, information exchange / human relationship formation support method, and computer program |
US7603620B2 (en) * | 2004-12-20 | 2009-10-13 | Ricoh Co., Ltd. | Creating visualizations of documents |
-
1999
- 1999-11-22 JP JP33170399A patent/JP3939477B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2001147941A (en) | 2001-05-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7725451B2 (en) | Generating clusters of images for search results | |
US6883001B2 (en) | Document information search apparatus and method and recording medium storing document information search program therein | |
US7072983B1 (en) | Scheme for systemically registering meta-data with respect to various types of data | |
CN101452470B (en) | Summary-style network search engine system and search method and uses | |
JP5105802B2 (en) | Information processing device | |
US7617195B2 (en) | Optimizing the performance of duplicate identification by content | |
US7809710B2 (en) | System and method for extracting content for submission to a search engine | |
US6401118B1 (en) | Method and computer program product for an online monitoring search engine | |
US7401078B2 (en) | Information processing apparatus, document search method, program, and storage medium | |
KR101653268B1 (en) | Processing method of tagged information and the client-server system for the same | |
JP5121194B2 (en) | Organization information retrieval system and organization information retrieval program | |
JP2009500719A (en) | Query search by image (query-by-imagesearch) and search system | |
US20080068651A1 (en) | Methods and apparatuses for publication of unconsciously captured documents | |
JP2006309515A (en) | Information delivery method and information delivery server | |
JP2003519844A (en) | Method and apparatus for indexing structured documents based on style sheets | |
JP2006099341A (en) | Update history generation device and program | |
US20110252313A1 (en) | Document information selection method and computer program product | |
US20060143242A1 (en) | Content management device | |
JP5447484B2 (en) | Information processing device | |
JP3939477B2 (en) | Database search system and method, recording medium | |
US20060116992A1 (en) | Internet search environment number system | |
JPH11143885A (en) | Method and device for information retrieval, storage medium for storing information retrieval program, method and device for information transmission, and storage medium for storing information transmission program | |
JP2008102790A (en) | Retrieval system | |
Shen et al. | Publishing distributed files as Linked Data | |
JP7272540B2 (en) | Information provision system, information provision method, and data structure |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060919 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061120 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061219 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070227 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070328 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3939477 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110406 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120406 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130406 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130406 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140406 Year of fee payment: 7 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |