JP2005025561A - 検索システム及び検索方法 - Google Patents

検索システム及び検索方法 Download PDF

Info

Publication number
JP2005025561A
JP2005025561A JP2003191102A JP2003191102A JP2005025561A JP 2005025561 A JP2005025561 A JP 2005025561A JP 2003191102 A JP2003191102 A JP 2003191102A JP 2003191102 A JP2003191102 A JP 2003191102A JP 2005025561 A JP2005025561 A JP 2005025561A
Authority
JP
Japan
Prior art keywords
search
classification information
search target
metadata
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003191102A
Other languages
English (en)
Inventor
Eiji Komata
栄治 小俣
Hiromitsu Sumino
宏光 角野
Norihiro Ishikawa
憲洋 石川
Tsuyoshi Kato
剛志 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2003191102A priority Critical patent/JP2005025561A/ja
Publication of JP2005025561A publication Critical patent/JP2005025561A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】検索対象データベースにおける検索に際し、不要な検索処理を削減し、より高速な検索を行う。
【解決手段】検索の対象となる検索対象データを分類情報に基づいて分類するとともに、当該検索対象データの特性を示す属性情報を付して、検索対象データを格納するメタデータデータベースと、分類情報及び属性情報を含む検索要求を受信する検索要求受信部32と、メタデータデータベース37に格納された分類情報及び検索要求に含まれた分類情報を不可逆な一方向関数により符号化する変換処理部33と、符号化された分類情報同士を比較し、この比較結果に基づいてメタデータデータベース37から検索対象を検索する比較部36とを有する。
【選択図】 図2

Description

【0001】
【発明の属する技術分野】
本発明は、通信ネットワーク上に分散配置され、相互に接続された検索サーバ装置によって検索を行う検索システム及び検索方法に関する。
【0002】
【従来の技術】
従来より、インターネット等の通信ネットワーク上に分散配置された複数の検索サーバ装置を相互に接続し、各検索サーバ装置が連携してキーワード検索を行う分散型検索システムがあり、このような検索システムでは、検索条件として与えられるキーワードと検索対象のテキストを構成する文字列とのマッチングを行っている。
【0003】
このマッチングを行う装置としては、テキスト検索や自動分類に際し、例えば、シソーラスと呼ばれる単語間の上位/下位関係及び類義語を定義した辞書を利用する方式がある。このテキスト検索においては、ユーザの入力した表現が検索対象中の表現と一致しない場合が生じるため、例えば、類義語や上位/下位語を含めた検索を行い、検索された内容のヒット率を確保する方式が提案されている(例えば、特許文献1参照)。
【0004】
また、この上位/下位語を含めた検索としては、メタデータを用いる方式がある。ここでメタデータとは、データの特性に関する情報を記述したデータであり、各検索対象データのクラス(分類)、プロパティ(属性)とプロパティバリュー(属性内容)という構造を持つデータを指している。例としてレストランというクラスにおいて、「場所」というプロパティを持ち、「渋谷」というプロパティバリューを持つメタデータは「渋谷にあるレストラン」を示している。これは「渋谷」が、人名や商品名ではなく、地名を指す属性であるということを表している。
【0005】
このようにプロパティに対してプロパティバリューを付与することにより、意味情報を示すことが可能となっている。検索結果を得るためには、ユーザが入力した検索条件(クラス,プロパティとプロパティバリュー)と検索対象のメタデータを比較することとなる。その際に、検索対象のデータベースに先ず検索条件として指定されているクラスのメタデータが存在するかを調べる必要がある。その場合、対象のデータベースに存在するメタデータ全てと比較を行うこととなる。検索対象のクラスのメタデータが存在している場合には、次にプロパティに比較を行い、さらにプロパティバリューの比較を行う。
【0006】
図7は、従来のメタデータ検索の方法を説明する図である。ユーザは検索条件を入力し、ノードAに対して検索要求を送信する。検索要求を受けたノードAは、検索条件のクラスを満たすメタデータを保持しているかを調べる。その際、検索条件クラスの文字列と保有メタデータのクラス文字列を、個々にマッチングする必要がある。全てのメタデータとのマッチング終了後に、検索対象クラスが存在していた場合は、プロパティ、プロパティバリューの順にマッチングを行う。検索条件と合うメタデータが存在していた場合、そのメタデータをユーザに送信する。検索対象クラスが存在していない場合は、そこで対象メタデータが存在しない旨を、ユーザに対して送信する。
【0007】
【特許文献1】
特開平9−44507号公報
【0008】
【発明が解決しようとする課題】
しかしながら、上述した従来法のキーワード検索では、検索条件と検索対象ノード(ノードA)が保有しているメタデータ全てのクラスとのマッチングを終了しなければ、そのノードが検索対象のメタデータを持っているかを把握することはできない。すなわち、クラスの異なるメタデータに対して検索しても、ユーザの要求条件に合致したメタデータを発見することはできず、その間の検索時間が不要に浪費されることとなる。
【0009】
そこで、本発明は、上記のような問題を解決するものであり、検索対象データベースにおける検索に際し、不要な検索処理を削減し、より高速な検索を行うことのできる検索システム及び検索方法を提供することを目的とする。
【0010】
【課題を解決するための手段】
上記課題を解決するために本発明は、通信ネットワーク上に分散配置された検索サーバ装置によりデータの検索を行う検索システムであって、検索の対象となる検索対象データを分類情報に基づいて分類するとともに、検索対象データの特性を示す属性情報を付して、検索対象データを格納する検索対象データベースと、分類情報及び属性情報を含む検索要求を受信する検索要求受信部と、検索対象データベースに格納された分類情報及び検索要求に含まれた分類情報を不可逆な一方向関数により符号化する変換処理部と、符号化された分類情報同士を比較し、この比較結果に基づいて検索対象データベースから検索対象を検索する比較部とを有する。
【0011】
このような請求項1に係る検索システムによれば、検索要求があった際に、検索対象の分類情報と、検索要求に含まれる分類情報とを比較し、分類情報が一致した場合にのみ検索対象データを検索することができ、不要な検索処理を削減することができ、検索処理の高速化を図ることができる。さらに、本発明では、分類情報は符号化されていることから、高速での比較が可能となる。
【0012】
請求項2に係る発明の検索システムにおいて、検索対象データの分類情報は、検索対象が格納された検索対象データベース上におけるアドレス情報と関連付けられたテーブルデータに格納され、比較部は、テーブルデータに基づいて、検索対象データベースの検索を行うことが好ましい。このような請求項2に係る検索システムによれば、分類情報の比較の際に、検索対象データの格納先をも検出することができるため、より高速な検索が可能となる。
【0013】
請求項3に係る発明の検索システムにおいて、不可逆な一方向関数は、ハッシュ関数であることが好ましい。このような請求項3に係る検索システムによれば、ハッシュ値に基づく高度な分類情報の検索が可能となる。
【0014】
請求項4に係る検索方法は、通信ネットワーク上に分散配置された検索サーバ装置によりデータの検索を行う検索方法であって、検索の対象となる検索対象データを分類情報に基づいて分類するとともに、検索対象データの特性を示す属性情報を付して、検索対象データを検索対象データベースに格納するステップと、分類情報及び属性情報を含む検索要求を受信するステップと、検索対象データベースに格納された分類情報及び検索要求に含まれた分類情報を不可逆な一方向関数により符号化するステップと、符号化された分類情報同士を比較し、この比較結果に基づいて検索対象データベースから検索対象を検索するステップとを有する。
【0015】
このような請求項4に係る検索方法によれば、検索要求があった際に、検索対象の分類情報と、検索要求に含まれる分類情報とを比較し、分類情報が一致した場合にのみ検索対象データを検索することができるため、不要な検索処理を削減することができ、検索処理の高速化を図ることができる。
【0016】
【発明の実施の形態】
以下に添付図面を参照して、本発明に係る検索方式の実施形態を詳細に説明する。図1は、本実施形態に係る検索システムの全体構成を示す概念図である。
【0017】
図1に示すように、通信ネットワーク20には、ユーザが使用するユーザ端末10と、複数のノード装置(検索サーバ装置)30が分散配置されて接続されており、ユーザは、ユーザ端末10から、通信ネットワーク20を介して、検索要求を任意のノード装置に送信し、その要求に応じて検索を実行したノード装置30が、検索結果をユーザ端末10に返信する。
【0018】
図2は、本実施形態に係るノード装置の内部構造を示すブロック図である。同図に示すように、各ノード装置30は、登録メタデータ受信部31と、検索要求受信部32と、変換処理部33と、登録部34と、検索結果送信部35と、比較部36と、検索対象データベースであるメタデータデータベース37と、ハッシュ値を格納するハッシュテーブルデータベース38とを備えている。
【0019】
登録メタデータ受信部31は、ユーザがメタデータの登録を行う際に、ユーザからの登録要求を受けるモジュールであり、登録メタデータ受信部31で受けたメタデータは変換処理部33に送出される。また、検索要求受信部32は、検索を実行する際に、通信ネットワーク20を通じてユーザ端末10から登録要求を受けるモジュールであり、検索要求受信部32で受けた検索要求は、変換処理部33に送出される。
【0020】
変換処理部33は、登録メタデータ受信部31で入力されたメタデータの分類情報であるクラス名を、ハッシュ関数によりハッシュ値に変換し、登録部34に出力するモジュールである。また、この変換処理部33は、検索要求受信部32から入力された検索要求に含まれる検索条件クラスをハッシュ関数によりハッシュ化し、比較部36へ出力する。
【0021】
登録部34は、変換処理部33から受信したメタデータをメタデータデータベース37に登録するとともに、変換したハッシュ値を、メタデータの格納先のアドレス情報に対応付けてハッシュテーブルとしてハッシュテーブルデータベース38に格納する。なお、本実施形態においてノード装置30が保有するハッシュテーブルの大きさは、任意の長さである。
【0022】
比較部36は、受信した検索条件クラスのハッシュ値と、ハッシュテーブルとの比較を行い、メタデータデータベース37に検索条件クラスのメタデータが存在するかを調べる。そこで検索対象メタデータが存在する場合、比較部36は、検索条件プロパティ、プロパティバリューとメタデータデータベース37が持つメタデータとの比較を行う。
【0023】
検索結果送信部35は、通信ネットワーク20を通じて検索要求送信元であるユーザ端末10に検索結果を送信するモジュールであり、当該ノード装置30が検索条件を満たすメタデータを保有している場合はそのメタデータを、保有していなければ検索結果がない旨を検索要求送信者に対して送信する。
【0024】
(登録処理)
ここで、登録部34によるハッシュ値の登録処理手順について説明する。図3は、登録処理手順を示すフローチャート図である。
【0025】
図3に示すように、先ず、変換処理部33から出力されたハッシュ値とクラス名(テキスト)が、登録部34により受信される(ステップS301)。受信された新たなハッシュ値とハッシュテーブルを比較して、受信したハッシュ値が既に登録されているか否かを確認する(ステップS302)。登録されていない場合は、受信したハッシュ値をハッシュテーブルに登録する(ステップS303)。登録されている場合、既にメタデータデータベースに同様のクラスメタデータが存在しているため、登録処理は行わない(ステップS304)。そして、受信したメタデータは、メタデータデータベースに登録される(ステップS305)。
【0026】
このようにメタデータの登録時に、メタデータの登録だけではなく、クラス名をハッシュ値に変換し、ハッシュテーブルとして登録しておくことにより、検索実行時に検索条件で指定されているクラスメタデータを保有しているか否かを高速に確認することができ、検索時にあっては、不要な検索を削減し、高速なマッチングが可能となる。
【0027】
図4は、上記登録処理におけるデータの流れを示す説明図である。なお、図4では、登録するメタデータのクラスが未登録である場合を登録処理(1)として、一方、登録済みの場合を登録処理(2)として示している。
【0028】
先ず登録処理(1)では、変換処理部33からメタデータとハッシュ値XXXを受信する(S401)。そこで受信したハッシュ値XXXが、ハッシュテーブルに登録されているかを確認する(S402)。ステップS402の処理によりハッシュ値XXXは登録されていないことが確認された場合、現在の登録対象のハッシュ値をハッシュテーブルに登録する(S403)。ハッシュ値の登録終了後、メタデータをメタデータデータベースに登録する(S404)。
【0029】
一方、登録処理(2)の場合にも、登録処理(1)同様に変換装置からメタデータとハッシュ値XXXを受信し(S401)、受信したハッシュ値XXXが、ハッシュテーブルに登録されているかを確認する(S402)。ここで確認を行った結果、ハッシュ値XXXが既に登録されていた場合は、特にハッシュ値の登録処理は行わずに、メタデータの登録処理を行う(S404)。
【0030】
(比較処理)
次に、検索要求時における検索条件とハッシュテーブルとを比較する処理について説明する。図5は、検索要求時における比較処理を示すフローチャート図である。
【0031】
図5に示すように、先ず、変換処理部33より検索条件のクラスハッシュ値並びに検索条件文字列を受信する(ステップS501)。受信した検索条件クラスハッシュ値と、ハッシュテーブルの比較を行う(ステップS502)。ここで、検索条件クラスハッシュ値と同様の値がハッシュテーブルに登録されていた場合は、続いて検索条件文字列とメタデータデータベースが保持するメタデータとの比較を行う(ステップS503)。また、検索条件クラスハッシュ値と同様の値がハッシュテーブルに登録れていない場合には、検索結果送信部に対して検索結果無を通知する(ステップS504)。
【0032】
さらに、ステップS503にて行った比較の結果、メタデータデータベースに検索条件を満たすメタデータが存在していた場合、検索結果送信部に対して検索結果メタデータを送信する(ステップS505)。ここで検索条件を満たすメタデータが存在していない場合は、検索結果送信部に対して、検索結果無を通知する。
【0033】
図6は、上記検索処理におけるデータの流れを示す説明図である。なお、図6では、検索対象であるメタデータが存在する場合を比較処理(1)として、一方、存在しない場合を比較処理(2)として示している。
【0034】
先ず、比較処理(1)では、変換装置から検索条件文字列(クラス・プロパティ・プロパティバリュー)とハッシュ値XXXを受信する(ステップS601)。そこで受信したハッシュ値XXXが、ハッシュテーブルに登録されているかを確認する(ステップS602)。
【0035】
ステップS602の処理によりハッシュ値XXXは登録されていることが確認された場合、検索条件文字列とメタデータデータベースの比較を行う(ステップS603)。(ステップS604)の処理により、検索条件に適合するメタデータが得られた場合、そのメタデータを検索結果送信部に送信する(ステップS604)。
【0036】
さらに、比較処理(2)の場合にも、比較処理(1)同様に、変換装置から検索条件文字列とハッシュ値XXXを受信し(ステップS601)、受信したハッシュ値XXXが、ハッシュテーブルに登録されているかを確認する(ステップS602)。この確認を行った結果、ハッシュ値XXXが登録されていないことが確認された場合、検索結果送信部に検索結果無しの通知を行う(ステップS604)。
【0037】
このように、検索に際し、先ずハッシュ値によるメタデータの有無確認を行うことにより、無駄な検索を避けることができ、高速な検索が可能となる効果を奏する。
【0038】
【発明の効果】
以上述べたように、この発明によれば、各検索サーバ装置が、保有する検索対象データの分類情報を符号化した上で登録し、検索に際しては、先ず分類情報のマッチングを行い、分類情報が存在する場合にのみ検索対象データの検索を行うため、不要な検索処理の削減による処理の高速化を図ることが可能となる。
【図面の簡単な説明】
【図1】実施形態に係る検索システムの全体構成を示す概念図である。
【図2】実施形態に係るノード装置の内部構造を示すブロック図である。
【図3】実施形態における登録処理手順を示すフローチャート図である。
【図4】実施形態に係る登録処理におけるデータの流れを示す説明図である。
【図5】実施形態に係る検索要求時における比較処理を示すフローチャート図である。
【図6】実施形態に係る検索処理におけるデータの流れを示す説明図である。
【図7】従来のメタデータ検索の方法を説明する図である。
【符号の説明】
10…ユーザ端末
20…通信ネットワーク
30…ノード装置
31…登録メタデータ受信部
32…検索要求受信部
33…変換処理部
34…登録部
35…検索結果送信部
36…比較部
37…メタデータデータベース
38…ハッシュテーブルデータベース

Claims (4)

  1. 通信ネットワーク上に分散配置された検索サーバ装置によりデータの検索を行う検索システムであって、
    検索の対象となる検索対象データを分類情報に基づいて分類するとともに、当該検索対象データの特性を示す属性情報を付して、該検索対象データを格納する検索対象データベースと、
    前記分類情報及び属性情報を含む検索要求を受信する検索要求受信部と、
    前記検索対象データベースに格納された分類情報及び前記検索要求に含まれた分類情報を不可逆な一方向関数により符号化する変換処理部と、
    前記符号化された分類情報同士を比較し、この比較結果に基づいて前記検索対象データベースから前記検索対象を検索する比較部と
    を有することを特徴とする検索システム。
  2. 前記検索対象データの分類情報は、当該検索対象が格納された前記検索対象データベース上におけるアドレス情報と関連付けられたテーブルデータに格納され、
    前記比較部は、前記テーブルデータに基づいて、前記検索対象データベースの検索を行うことを特徴とする請求項1に記載の検索システム。
  3. 前記不可逆な一方向関数は、ハッシュ関数であることを特徴とする請求項1又は2に記載の検索システム。
  4. 通信ネットワーク上に分散配置された検索サーバ装置によりデータの検索を行う検索方法であって、
    検索の対象となる検索対象データを分類情報に基づいて分類するとともに、当該検索対象データの特性を示す属性情報を付して、該検索対象データを検索対象データベースに格納するステップと、
    前記分類情報及び属性情報を含む検索要求を受信するステップと、
    前記検索対象データベースに格納された分類情報及び前記検索要求に含まれた分類情報を不可逆な一方向関数により符号化するステップと、
    前記符号化された分類情報同士を比較し、この比較結果に基づいて前記検索対象データベースから前記検索対象を検索するステップと
    を有することを特徴とする検索方法。
JP2003191102A 2003-07-03 2003-07-03 検索システム及び検索方法 Pending JP2005025561A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003191102A JP2005025561A (ja) 2003-07-03 2003-07-03 検索システム及び検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003191102A JP2005025561A (ja) 2003-07-03 2003-07-03 検索システム及び検索方法

Publications (1)

Publication Number Publication Date
JP2005025561A true JP2005025561A (ja) 2005-01-27

Family

ID=34188813

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003191102A Pending JP2005025561A (ja) 2003-07-03 2003-07-03 検索システム及び検索方法

Country Status (1)

Country Link
JP (1) JP2005025561A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008003771A (ja) * 2006-06-21 2008-01-10 Denso Corp 興味情報検索システム、車載器および車外器
JP2009543489A (ja) * 2006-07-10 2009-12-03 ジェムアルト エスアー 匿名の機密データを管理するためのサーバ
CN109684331A (zh) * 2018-12-20 2019-04-26 浪潮软件股份有限公司 一种基于Kudu的对象存储元数据管理装置及方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008003771A (ja) * 2006-06-21 2008-01-10 Denso Corp 興味情報検索システム、車載器および車外器
JP2009543489A (ja) * 2006-07-10 2009-12-03 ジェムアルト エスアー 匿名の機密データを管理するためのサーバ
CN109684331A (zh) * 2018-12-20 2019-04-26 浪潮软件股份有限公司 一种基于Kudu的对象存储元数据管理装置及方法

Similar Documents

Publication Publication Date Title
US7599922B1 (en) System and method for federated searching
US10282369B2 (en) Fast indexing and searching of encoded documents
CN104919522B (zh) 分布式nlu/nlp
CN102105879B (zh) 联合团体搜索
EP1396799A1 (en) Content management system
US20120310926A1 (en) System and method for evaluating results of a search query in a network environment
KR101467716B1 (ko) 발행된 메시지를 분배하는 방법 및 장치
US20090083024A1 (en) Apparatus, method, computer program product, and system for machine translation
KR20080031696A (ko) 음성 검색 쿼리를 이용한 컨텐트 검색
CN104052661A (zh) 容器名服务器和容器名解析方法
CN106021510A (zh) 对于由移动设备的用户启动的查询进行处理的方法和系统
WO2003017023A2 (en) System and method for extracting content for submission to a search engine
WO2014154096A1 (zh) 信息推荐方法、装置及信息资源推荐系统
CN107209757A (zh) 自然语言理解缓存器
US7366710B2 (en) Apparatus for retrieving and presenting digital data
JP2009251686A (ja) 文書検索装置
US20030236864A1 (en) File downloading system and method
KR101596307B1 (ko) 전문가 지식 기반의 검색 서비스 제공 시스템 및 방법
JP5290041B2 (ja) 情報検索装置及び情報検索方法
US20200327283A1 (en) Information processing apparatus, computer program product, and computer readable medium
JP2005025561A (ja) 検索システム及び検索方法
KR20080049428A (ko) 질의어 분석을 이용한 유사 검색 서비스 제공 방법 및 장치
CN103646034B (zh) 一种基于内容可信的Web搜索引擎系统及搜索方法
KR20080049452A (ko) 시멘틱 웹을 이용한 목적지 검색 서비스 제공 방법 및시스템
US11057470B2 (en) Communication device and communication method for processing meta data