JP4103905B2 - 統合化検索システム - Google Patents

統合化検索システム Download PDF

Info

Publication number
JP4103905B2
JP4103905B2 JP2005213896A JP2005213896A JP4103905B2 JP 4103905 B2 JP4103905 B2 JP 4103905B2 JP 2005213896 A JP2005213896 A JP 2005213896A JP 2005213896 A JP2005213896 A JP 2005213896A JP 4103905 B2 JP4103905 B2 JP 4103905B2
Authority
JP
Japan
Prior art keywords
search
keyword
data
input
search device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005213896A
Other languages
English (en)
Other versions
JP2005327316A (ja
Inventor
俊明 安藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2005213896A priority Critical patent/JP4103905B2/ja
Publication of JP2005327316A publication Critical patent/JP2005327316A/ja
Application granted granted Critical
Publication of JP4103905B2 publication Critical patent/JP4103905B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、複数の検索装置を利用して、指定されたキーワードに基づいてデータを検索する統合化検索システムに関する。
従来より、テキストデータ等といったデータとキーワードとを対応付けてデータベースに登録し、指定されたキーワードに基づいてデータを検索する検索装置(データベースシステム)が知られている。
このような検索装置は、目的に応じて或いはユーザ毎といったように備えられており、例えば、同一の処理端末装置内、或いは同一のネットワーク内に複数存在している場合がある。
そして、上記した複数存在する検索装置を有効利用することを目的として、複数の検索装置を統合化するといったことが行われている。
例えば、特許公告公報昭60-58492号に記載された発明には、同種類の複数のデータベースに対してデータを検索するデータベース検索方式が開示されている。また、公開特許公報昭60-195653号に記載された発明には、複数の分散しているデータベースを統合して管理するデータベース統合化法が開示されている。
ここで、検索装置が有するデータベースでは、論理構造の定義(所謂、スキーマ)を規定することによって、データに関する属性の表現を統一するとともに同一属性に属するデータのデータ型を統一し、さらに、同様な意味を持つデータを同じデータ値で表現することによって、データの同値性を確保している。例えば、金額を表す属性としての「単価」においては、データは数値型データとして定義され、当該属性中でのデータの単位を「円」としている場合には、当該「単価」の属性中には、「ドル」や「千円」といった単位のデータが混在していることはない。
しかしながら、テキストデータについては、文字型や文字列型のデータとして統一した定義がされているものの、テキストデータには同じ意味を表す言葉が複数存在し、表現は様々であるために、同様の意味を有するデータが同じデータ値(語句)で表されているとは限らない。例えば、外来語をカタカナ表記する場合には、同じ意味の語句であっても表現の仕方の違いによって複数存在してしまうことがある。
ここで、検索装置によってテキストデータに対応付けられたキーワードとしては、テキストデータ中の語句そのままの場合や、テキストデータに関連し、付与された語句の場合等があり、検索装置によって検索がなされる場合には、ユーザ等から指定されたキーワードが前記テキストデータに対応付けられたキーワードと一致するか否かが判断される。
したがって、上記したようなテキストデータを検索する場合には、ユーザ等が指定したキーワードと同様な意味を有する語句がテキストデータのキーワードとして対応付けられていながら一致しないときには、当該テキストデータは検索対象として検出されず、ユーザが必要とするデータを適切に検出することができないといったデータ値に関する問題が生じてしまう。
この問題を解決する方法としては、同じ意味を持つ複数の語句を1つの語句(統制語)に統一して扱う第一の方法と、指定されたキーワードを展開(例えば、同義語展開)する第二の方法とが知られている。
第一の方法では、管理/登録された統制語をテキストデータに対応付けるキーワードとするとともに、データを検索する際にユーザが指定するキーワードとしても統制語を利用することによって、所望のデータを適切に検出することができる。一方、テキストデータを登録する際や検索する際には、キーワードとなる統制語を統制語集合の中から選ばなければならない。
第二の方法では、テキストデータを登録する際には、ユーザにキーワードを入力させ、入力されたキーワードを複数の同義語に展開して、当該複数の同義語をテキストデータに対応付けておくことによって、以降にユーザが指定したキーワードと、データに対応付けられたキーワードとが効果的に一致するようにしている。また、検索する際には、ユーザに自由にキーワードを選択させ、選択されたキーワードを複数の同義語のキーワードに展開し、当該展開した複数のキーワードに従ってテキストデータを検索することによって、ユーザーの必要とするデータを検出することができる。なお、同義語を利用したキーワード展開機能を検索装置に実現するためには、同義語辞書と同義語辞書に対する検索を行う機能を必要とする。
この2つのいずれかの方法を複数の検索装置に適用することによって、上記したデータ値に関する問題を解消することができる。しかしながら、第一の方法を適用した場合には、複数の検索装置において使用する統制語集合を統一しておかなければならない。また、第二の方法を適用した場合には、複数の検索装置それぞれにキーワード展開機能を備えなければならずコストがかかってしまう。
更に、複数の検索装置に対して登録或いは検索等といった処理を行う場合には、各検索装置において、扱うデータや扱う状況等といった目的が違うために、例えば、構造型データベース、関係型データベースといったようにデータベースの構成が異なっていたり、データベースの構成が同じであってもスキーマが異なっているといった状況が生じており、同一の手順では各検索装置を利用できないという問題が生じていた。
このデータベースの構成の違いを解決する方法としては、ユーザが指定した検索式を検索装置毎に適した検索式や操作コマンド列に変換する方法がある。例えば、公開特許公報平2-67682号に掲載された発明では、SQL(構造化照会言語)でユーザが書いた検索式をDML(データベース操作言語)に変換することで、構造型データベースを検索できるようにしている。すなわち、構造型データベースシステム上に関係データベースシステムを構築することで、ユーザが構造型データベースを関係データベースシステムと同等な手順でアクセスできるようにしている。
また、複数の検索装置の構成が関係型データベースシステムである場合において、スキーマの違いに関するシステム差異を解決する方法としては、連邦データベースがあり、この連邦データベースは、スキーマの異なる複数の関係データベースを、1つのスキーマに従う関係データベースとして検索可能にするための技術として知られている。
すなわち、「Federated Database Systems for Managing Distributed, Heterogeneous, and Autonomous Databases」, ACM Computing surveys, Vol.22, No.3, September 1990の3.1節Methodology for Developing a Federated Database System(pp215 - 218)に紹介されているスキーマ・インテグレーションを利用することによって、複数のデータベースを1つのデータベースのようにユーザに見せることができる。なお、スキーマ・インテグレーションを利用するためには、各データベース上の異なるスキーマを1つのスキーマに対応させる情報(データ辞書)と、情報に基づいて変換するための機能とを用意する必要がある。
上記した2つの方法を組み合わせることによって、データベースの構成の違いやスキーマの違いといったシステム差異を吸収することができ、ユーザは複数の検索装置を同一の手順で利用できる。
例えば、スキーマ・インテグレーションを利用した検索装置の統合を図15を参照して説明する。同図は、スキーマ・インテグレーションによって属性「商品名」「種別」といったスキーマを持つ検索装置aと、属性「製品名」「種別」といったスキーマを持つ検索装置bとが、属性「プロダクト」「タイプ」といったスキーマに統合された図であり、検索装置aの属性「商品名」と検索装置bの属性「製品名」が属性「プロダクト」に統合され、同様に、検索装置a及びbの属性「種別」が「タイプ」に統合されている。
したがって、ユーザが検索を行う場合には、統合されたスキーマに従った検索を行うことによって検索装置a及びbに対して検索することができる。
なお、複数の検索装置を統合して、検索等の手順を同一にすることができたとしても、各検索装置がキーワード展開機能等を有していない場合には、依然として前述したデータ値に関する問題が残っている。
すなわち、検索装置aの属性「タイプ」の値として通常の用語(例えば「関係データベース管理システム」等)が使用し、検索装置bの属性「タイプ」の値として省略形の用語(例えば、「RDBMS」等)を使用している場合において、「タイプ=RDBMS」と指定して該当すプロダクトを検索しても、「RDBMS」と同様な意味を持つ検索装置a内の「関係データベース管理システム」については、データ値が一致しないために検出されず、当該「関係データベース管理システム」に対応する「○×リレーショナル」といったプロダクトをユーザが取得することができない。したがって、検索装置毎に的確なキーワードを設定しなければ、必要とするデータを適切に検索することができない。
なお、公開特許公報平6-35784号に記載された発明には、データ構造の異なるデータベースから、任意のデータを有意情報として複数の端末に出力するシステムが開示されている。
上記したように、複数の検索装置を備えた統合化検索装置において、ユーザが必要とするデータを適切に検索する方法としては、検索装置毎にキーワード展開機能を備える方法があるが、この場合には、複数の検索装置にキーワード展開機能を備えなければならずコストがかかってしまう。
また、他の方法としては、各検索装置において統制語を使用する方法もあるが、この方法では各検索装置毎に使用する統制語の集合が異なってしまう場合もあり、この場合には、検索対象の検索装置毎に設定されている統制語を検索時のキーワードとしてユーザが指定しなければならないといった手間が発生していた。
本発明は、上記した従来の事情に鑑みなされたもので、コストをかけることなく、個々の検索装置の構成をユーザが考慮することなく容易に利用でき、ユーザの必要とするデータを適切に検索することのできる統合化検索システム及びキーワード展開方法を提供することを目的としている。
上記目的を達成するために本発明に係る統合化検索システムは、データとキーワードとを対応付けてデータベースに登録し、指定されたキーワードに基づいてデータを検索する検索装置を複数備えた統合化検索装置において、登録するデータに対するキーワードを入力する入力手段と、入力されたキーワードを関連するキーワードに展開するキーワード展開手段と、展開されたキーワードに基づいたキーワードをデータに対応付けて所定の検索装置へ登録させるデータ登録制御手段と、を備えたことを特徴とする。
ここで、入力されたキーワードを関連するキーワードに展開するとは、例えば、
或るキーワードの同義語、或るキーワードと概念を共通とする語句、或るキーワードと関連が深い語句、或るキーワードがアルファベット表記であれば頭文字を大文字或いは小文字に変換させるための手順、或るキーワードがカタカナ表記であれば同一の意味を表す他のカタカナ表記へ変換させるための手順等といった知識を保持した知識ベース(例えば、辞書)に基づいて、入力されたキーワードに関連する語句を取り出すことをいう。
また、展開されたキーワードに基づいたキーワードをデータに対応付けるとは、
展開されたキーワードの中の少なくとも一つをデータに対応付けることだけでなく、展開されたキーワードの少なくとも一つに加え、入力されたキーワードをデータに対応付けることも含んでいる。
上記した統合化検索システムでは、入力手段によってキーワードが入力されると、キーワード展開手段が入力されたキーワードを関連するキーワードに展開し、データ登録制御手段が展開されたキーワードに基づいたキーワードをデータに対応付けて所定の検索装置へ登録させる。
したがって、検索装置にデータを格納する際に、入力されたキーワードに関連するキーワードをデータに対応付けることができるので、入力されたキーワードに関連する複数のキーワードをデータに対応させることができ、検索時には必要なデータを適切に検索することができる。また、統制語を利用した検索装置にデータを登録する際であっても、入力されたキーワードを展開することによって統制語に該当するキーワードを得ることができ、ユーザが格納先の検索装置でのデータに対応付ける統制語を調べるといった手間を省くことができる。
本発明に係る統合化検索システムは、データとキーワードとを対応付けてデータベースに登録し、指定されたキーワードに基づいてデータを検索する検索装置を複数備えた統合化検索装置において、検索するデータに関するキーワードを入力する入力手段と、入力されたキーワードを関連するキーワードに展開するキーワード展開手段と、展開されたキーワードに基づいて、所定の検索装置にデータを検索させるデータ検索制御手段と、を備えたことを特徴とする。
ここで、展開されたキーワードに基づいて検索させるとは、展開されたキーワードの中の少なくとも一つを使用して検索させることことだけでなく、展開されたキーワードの少なくとも一つに加え、入力されたキーワードを使用して検索させることも含んでいる。
上記した統合化検索システムでは、入力手段によって検索するデータに関するキーワードが入力されると、キーワード展開手段が入力されたキーワードを関連するキーワードに展開し、データ検索制御手段が展開されたキーワードに基づいて所定の検索装置にデータを検索させる。
したがって、検索装置を検索する際に、入力されたキーワードに関連するキーワードによって検索が行われるために、入力されたキーワードに関連する複数のキーワード群を使用して検索することができ、必要なデータを適切に検索することができる。また、統制語を利用した検索装置を検索する際には、入力されたキーワードを展開することによって統制語に該当するキーワードを得ることができ、ユーザが検索の際に目的とするデータの統制語を調べるといった手間を省くことができる。
本発明に係る統合化検索システムは、データとキーワードとを対応付けてデータベースに登録し、指定されたキーワードに基づいてデータを検索する検索装置を複数備えた統合化検索装置において、検索するデータに関するキーワードを入力する入力手段と、入力されたキーワードに基づいて、検索装置にデータを検索させる予備検索制御手段と、検索結果から入力されたキーワードに関連するキーワードを予め設定された規則に従って抽出する抽出手段と、抽出されたキーワードに基づいて、所定の検索装置にデータを検索させるデータ検索制御手段と、を備えたことを特徴とする。
ここで、予め設定された規則に従って抽出するとは、例えば、検索結果のデータに付与されたキーワードを抽出すること、検索結果のデータ中の入力されたキーワードと同一文章内のキーワードを抽出すること、検索結果のデータ内で入力されたキーワードに近接するキーワードを抽出すること、検索結果のデータ内の入力したキーワードと同種の文書構造を持ったキーワードを抽出すること、検索結果のデータ内の入力したキーワードと、主語述語の関係、修飾被修飾の関係、並列関係等といった文法的或いは意味的な関係を有するキーワードを抽出することを意味している。
また、抽出されたキーワードに基づいて検索させるとは、抽出されたキーワードの中の少なくとも一つを使用して検索させることだけでなく、抽出されたキーワードの少なくとも一つに加え、入力されたキーワードを使用して検索させることも含んでいる。
上記した統合化検索システムでは、入力手段によって検索するデータに関するキーワードが入力されると、予備検索制御手段が入力されたキーワードに基づいて、検索装置にデータを検索させ、抽出手段が検索結果から入力されたキーワードに関連するキーワードを予め設定された規則に従って抽出し、抽出されたキーワードに基づいて、データ検索制御手段が所定の検索装置にデータを検索させる。
したがって、知識ベースを備えていなくとも、入力されたキーワードに関連するキーワードを得ることができるために、当該得られたキーワードに基づいて検索することによって、必要なデータを適切に検索することができる。また、知識ベースを備えていなくとも、統制語を利用した検索装置を検索する際において、入力されたキーワードに関連するキーワードを得ることによって統制語に該当するキーワードを得ることができ、ユーザが目的とするデータの統制語を調べるといった手間を省くことができる。
本発明に係る統合化検索システムは、データとキーワードとを対応付けてデータベースに登録し、指定されたキーワードに基づいてデータを検索する検索装置を複数備えた統合化検索装置において、登録するデータに対するキーワードを入力する入力手段と、入力されたキーワードに基づいて、検索装置にデータを検索させる予備検索制御手段と、検索結果から入力されたキーワードに関連するキーワードを予め設定された規則に従って抽出する抽出手段と、抽出されたキーワードに基づいたキーワードをデータに対応付けて所定の検索装置へ登録させるデータ登録制御手段と、を備えたことを特徴とする。
ここで、抽出されたキーワードに基づいたキーワードをデータに対応付けるとは、抽出されたキーワードの中の少なくとも一つをデータに対応付けることだけでなく、抽出されたキーワードの少なくとも一つに加え、入力されたキーワードをデータに対応付けることも含んでいる。
上記した統合化検索システムでは、入力手段によってキーワードが入力されると、予備検索制御手段が入力されたキーワードに基づいて、検索装置にデータを検索させ、抽出手段が検索結果から入力されたキーワードに関連するキーワードを予め設定された規則に従って抽出し、抽出されたキーワードに基づいて、データ検索制御手段が所定の検索装置にデータを検索させる。
したがって、知識ベースを備えていなくとも、検索装置にデータを格納する際に、入力されたキーワードに関連するキーワードをデータに対応付けることができ、検索時に必要なデータを適切に検索することができる。また、知識ベースを備えていなくとも、統制語を利用した検索装置にデータを登録する際には、入力されたキーワードを展開することによって統制語に該当するキーワードを得ることができ、ユーザがデータに対応付ける格納対象の検索装置の統制語を調べるといった手間を省くことができる。
また、上記の各請求項の記載から明らかなように、本発明はデータベース検索に用いるキーワードを関連するキーワードに展開する方法でもあり、キーワード展開機能を有する検索装置によりキーワードを関連するキーワードに展開し、この展開されたキーワードを他の検索装置に提供して、当該他の検索装置におけるキーワード登録又はキーワード検索と言ったデータベース検索用に、当該提供されたキーワードを利用するデータベース検索用キーワードの展開方法である。
以上説明したように、本発明に係る統合化検索システムによると、検索装置にデータを登録する際に、ユーザから入力されたキーワードを展開し、当該展開されたキーワードに基づいたキーワードをデータに対応させて登録するようにしたために、入力されたキーワードに関連する複数のキーワードをデータに対応させることができ、検索時にはキーワードを展開する機能を有していない検索装置であっても、キーワードの展開機能を有している検索装置と同様な適切なデータの検索を行うことができる。また、統制語を利用した検索装置にデータを登録する際であっても、ユーザがデータに対応付ける統制語を意識する必要がなく、統制語を調べるといった手間を省くことができる。
また、本発明に係る統合化検索システムによると、検索装置からデータを検索する際に、ユーザから入力されたキーワードを展開し、当該展開されたキーワードに基づいて検索するようにしたために、キーワード展開機能を有していない検索装置であっても、キーワード検索機能を有している検索装置と同様に適切なデータの検索を行うことができる。また、統制語を利用した検索装置からデータを検索する際であっても、ユーザが統制語を意識しなくとも適切な検索を行うことができ、ユーザが検索対象の検索装置の統制語を調べるといった手間を省くことができる。
さらに、本発明に係る統合化検索システムによると、ユーザから入力されたキーワードに基づいて検索装置を予備検索し、当該検索結果からユーザの入力したキーワードに関連するキーワードを抽出するようにしたために、知識ベースを備えていなくとも、キーワードの展開を行うことができ、当該展開されたキーワードを検索装置へのデータの登録或いは検索装置からのデータの検索に使用することができる。
本発明の第一実施例に係る統合化検索システムを図1及び図2を参照して説明する。
この統合化検索装置は、検索装置A及びBと、登録仲介手段1と、データ登録手段2と、プロファイル記憶手段3と、を備えている。
検索装置Aは、データとデータの内容に関するキーワードとを格納するデータベースを有しており、データを登録する際には、データとデータに関するキーワードとを対応付けて登録する一方、データを検索する際には、指定されたキーワードに対応付られたデータを検索して検出する。
また、検索装置Aは、図2に示すような同義語表(辞書)に基づいてキーワード展開を行う機能を有しており、展開対象のキーワードを受け取ると、当該キーワードを同義語に展開して展開結果を出力する。
検索装置Bは、キーワードとして統制語を扱う検索装置であり、データとデータの内容に関する統制語とを格納するデータベースを有しており、データを登録する際には、データとデータに関する統制語とを対応付けて登録する一方、データを検索する際には、指定された統制語に対応付られたデータを検索して検出する。なお、検索装置Bは、統制語の集合を図2に示すような統制語表として有している。
登録仲介手段1は、接続している検索装置A、Bをアクセスするための情報を備え、検索装置固有の接続手順やアクセス手順を用いて、データ登録手段2と各検索装置A、Bとの間の通信を仲介する。
データ登録手段2は、登録するデータ、データに対応付けるキーワード、及び、登録先の検索装置を入力する入力手段2aと、キーワード展開機能を有する検索装置を選択する検索装置選択手段2bと、検索装置のキーワード展開機能を利用してキーワードを展開させるキーワード展開手段2cと、入力されたデータとキーワード展開手段2cから渡されたキーワードとを対応付けて格納対象の検索装置に登録させるデータ登録制御手段2dと、を有している。
入力手段2aは、マウス、キーボードといった入力装置を有し、登録するデータ、データに対応付けるキーワード、格納先の検索装置等といったユーザからの入力を受け付ける。なお、格納先の検索装置を入力する際には、本実施例では、プロファイル記憶手段3に登録されている検索装置から選択できるようになっている。
ここで、登録するデータの入力とは、入力装置から直接データを入力することだけでなく、入力装置からデータを識別する名称を入力し、データ本体を記憶装置から入力するといったことも含んでいる。また、ユーザから入力されるキーワードとしては、直接ユーザが入力するキーワードに限らず、例えば、ユーザの入力したデータから自立語辞書等によって抽出されたキーワードであってもよい。
検索装置選択手段2bは、キーワードを展開する際に、プロファイル記憶手段3のプロファイルからキーワード展開機能を有する検索装置を選択してキーワード展開手段2cに通知する。なお、複数の検索装置がキーワード展開機能を有するときは、任意に選択させることができる。
キーワード展開手段2cは、検索装置選択手段2bから通知された検索装置が有するキーワード展開機能を利用するためのコマンドをプロファイル記憶手段3から取得する。そして、取得したコマンドとともに、入力されたキーワードを前記検索装置に渡すことによってキーワード展開させ、展開されたキーワード群を前記検索装置から取得してデータ登録制御手段2dに渡す。
データ登録制御手段2dは、キーワード展開手段2cから受け取ったキーワード群を入力されたデータに対応付けて登録対象の検索装置へ登録させる。
なお、プロファイル記憶手段3から登録対象の検索装置が統制語を扱っている検索装置であるか否か検出して、統制語を扱っている検索装置の場合には、キーワード展開手段2cから受け取ったキーワード群の中から、検索装置の有している統制語表に基づいて、統制語となっているキーワードを取り出し、取り出したキーワードを入力されたデータに対応付けて登録対象の検索装置に登録させることもできる。
プロファイル記憶手段3は、磁気ディスク等といった記憶装置を備え、当該記憶装置に検索装置A及びBの特徴を検索可能にプロファイルとして格納する。このプロファイルは、図3に示すように、各検索装置毎に、キーワード展開機能の有無と、キーワード展開機能を有する場合にはキーワード展開機能を使用する際のコマンド等といった機能呼出方法の情報と、検索装置が統制語を使用している否かの情報を有している。なお、このプロファイルの情報は予め統合化検索装置の管理者などが設定している。
ここで、請求項1に言うキーワード展開手段は、上記したキーワード展開手段2cと、検索装置のキーワード展開機能とが供働することによって構成される。
次に、第一実施例に係る統合化検索システムの動作を図4を参照して説明する。
まず、検索装置に格納するデータ及び当該データに関連付けるキーワードといったユーザからの入力を入力手段2aが受け付け(ステップS1、S2)、更に、格納先の検索装置に対する選択入力を受け付け(ステップS3)、選択された検索装置に関するプロファイル情報をプロファイル記憶手段3から取得し(ステップS4)、当該格納先の検索装置がキーワード展開機能を有しているか否かを検出する(ステップS5)。
そして、格納先の検索装置がキーワード展開機能を有している場合には、登録する際にキーワード展開を行っても、検索時において得られる効果が少ないのでキーワード展開は行わず、データ登録制御手段2dがユーザに入力されたキーワードとデータとを対応付けて格納先の検索装置に登録させる(ステップS6)。
一方、登録先の検索装置がキーワード検索機能を有していない場合には、後述するキーワード展開処理を行う(ステップS7)。
このキーワード展開処理では、検索装置選択手段2bがプロファイル記憶手段3から全検索装置のキーワード展開に関するプロファイル情報を取得し、当該プロファイル情報からキーワード展開機能を有した検索装置を選択する。キーワード展開機能を有した検索装置が選択されると、キーワード展開手段2cが選択された検索装置が有するキーワード展開機能を利用するためのアクセス方法をプロファイル記憶手段3から取得し、取得したアクセス方法に従って、入力されたキーワードを検索装置に渡すことによってキーワード展開させ、展開されたキーワード群を検索装置から取得してデータ登録制御手段2dに渡す。
キーワード展開処理が終わった場合には、キーワード展開手段2cが他に入力されたキーワードが存在するか否かを検出し(ステップS8)、存在する場合には、上記したキーワード展開処理(ステップS7)を当該キーワードに対しても同様に行う。
そして、ユーザが入力したすべてのキーワードに対して、キーワード展開処理を終了した場合には、データ登録制御手段2dがキーワード展開処理によって展開されたキーワード群を、データに対応させて検索装置に登録させる制御を行う(ステップS6)。
ここで、上記した動作の一例として検索装置Bにデータを登録する場合を図2を参照して説明する。なお、各検索装置内の点線の四角は格納されたデータを表し、データ中の単語は当該データに対応付けられたキーワードを表している。
まず、格納対象のデータを入力するとともに、キーワード「ドキュメント」をユーザが入力した場合には、プロファイル情報が参照され、検索装置Aのキーワード展開機能が利用されることとなり、キーワード展開によってキーワード「ドキュメント」がキーワード「ドキュメント」、「文書」、「document」に展開される。この結果、ユーザが選択した格納先の検索装置Bには、格納対象のデータがキーワード「文書」「ドキュメント」「document」に基づいたキーワードを対応付けられて格納されることになる。
ここで、検索装置Bは統制語を使用している検索装置なので、データに対しては統制語でないキーワード「ドキュメント」「document」が登録されず、キーワード「文書」が対応付けられて格納される。
なお、上記した例において、格納先の検索装置が統制語を使用していない場合には、データに対して「文書」「ドキュメント」「document」といった複数の関連するキーワードが対応付けられる。
このように、ユーザが入力したキーワードを展開したキーワードに基づいた複数のキーワードをデータに対応させて登録することができるので、検索する際には、新たにキーワード展開するといったことをしなくともユーザが必要とするデータを適切に検索することができる。
また、登録する検索装置が統制語を使用している場合には、ユーザが統制語と異なるキーワードを入力したとしても、入力したキーワードが展開されることによって検索装置には関連する統制語が登録されるので、ユーザはデータに対応付ける統制語を意識してキーワード入力する必要がなく、統制語を調べるといった手間を省くことができる。
なお、既存の検索装置を統合する場合においては、複数の検索装置の中のいずれか一つがキーワード展開機能を有していれば上記した効果を得ることができる。
上記した検索装置選択手段2bでは、キーワード展開を行わせる検索装置を任意に決定するようにしていたが、例えば、予め各検索装置毎のキーワード展開機能が有している語彙数或いは展開処理の速度等といった情報に基づいて適した検索装置を選択するようにしてもよい。
本発明の第二実施例に係る統合化検索システムを図5及び図6を参照して説明する。
この統合化検索装置は、検索装置C及びDと、検索仲介手段4と、データ検索手段5と、プロファイル記憶手段6と、検索結果併合手段7と、を備えている。
検索装置C及びDは、データとデータの内容に関するキーワードとを格納するデータベースを有しており、データを登録する際には、データとデータに関するキーワードとを対応付けて登録する一方、データを検索する際には、指定されたキーワードに対応付られたデータを検索して検出する。なお、検索装置CとDとでは、データを検索する際の検索式の形式及び検索結果の形式が異なっている。
また、検索装置Cは、図6に示すような同義語表(辞書)に基づいてキーワード展開を行う機能を有しており、展開対象のキーワードを受け取ると、当該キーワードを同義語に展開して展開結果を出力する。
検索仲介手段4は、接続している検索装置C、Dをアクセスするための情報を備え、検索装置固有の接続手順やアクセス手順を用いてデータ検索手段5と各検索装置C、Dとの間の通信を仲介する。
データ検索手段5は、検索するデータに関するキーワードを検索式として入力する入力手段5aと、入力された検索式を解釈してキーワードを検出する検索式解釈手段5bと、キーワード展開機能を有する検索装置を選択する検索装置選択手段5cと、検索装置のキーワード展開機能を利用してキーワードを展開させるキーワード展開手段5dと、展開されたキーワードに基づいて検索式を生成する検索式生成手段5eと、生成された検索式を利用して検索対象の検索装置にデータを検索させるデータ検索制御手段5fと、を有している。
入力手段5aは、マウス、キーボードといった入力装置を有し、検索するデータに関するキーワードを含む検索式と、格納先の検索装置等のユーザからの入力を受け付ける。なお、検索先の検索装置を入力する際には、本実施例では、プロファイル記憶手段6に登録されている検索装置から選択でき、複数の検索装置を選択することもできる。
なお、入力される検索式の形式は、例えば、簡単な形式の検索式とする、或いは、ユーザが使い慣れている検索装置に関する検索式とするといったように、検索対象の検索装置に関わらず統一した形式となっている。
検索式解釈手段5bは、プロファイル記憶手段6に予め設定されている検索式の形式情報に基づいてユーザが指定した検索式を解釈してキーワードを検出する。なお、検索式を解釈するにあたっては、検索式内のキーワードの位置、キーワードの組み合わせ方法、キーワードによる論理式等といったユーザが指定した検索式の情報を把握しており、当該把握された情報は検索式生成手段5eへ通知される。
検索装置選択手段5cは、キーワード展開を行う際に、プロファイル記憶手段3のプロファイル情報からキーワード展開機能を有する検索装置を選択してキーワード展開手段5dに通知する。なお、複数の検索装置がキーワード展開機能を有するときは、任意に選択させることができる。
キーワード展開手段5dは、検索装置選択手段5cから通知された検索装置のキーワード展開機能を利用するためのコマンドをプロファイル記憶手段6から取得する。そして、取得したコマンドとともに、検索式解釈手段5bによって検出されたキーワードを前記検索装置に渡すことによってキーワード展開させ、展開されたキーワード群を前記検索装置から取得して検索式生成手段5eに渡す。
例えば、検索装置Cのキーワード展開機能(同義語展開機能)を利用してキーワード「ドキュメント」を展開する場合には、「find ドキュメント」というコマンドを生成して検索装置Cに渡す。
検索式生成手段5eは、展開されたキーワード群、プロファイル記憶手段6の検索式の形式に関する情報、ユーザの入力した検索式を利用して、検索対象の検索装置に適した検索式を作成する。
例えば、ユーザの入力した検索式がキーワード「ドキュメント」であり、展開されたキーワード群が「ドキュメント」、「文書」、「document」である場合において、検索装置Dに適した検索式を作成する場合には、プロファイル情報から書式に関する情報であるキーワードの演算子を参照して、「ドキュメント or 文書 or document」という論理和を表す検索式が作成される。
データ検索制御手段5fは、検索式生成手段5eに作成された検索式を使用して、検索対象の検索装置へ検索式に該当するデータを検索させる。
プロファイル記憶手段6は、磁気ディスク等といった記憶装置を備え、当該記憶装置に検索装置C及びDの特徴を検索可能にプロファイルとして格納する。このプロファイルは、図7に示すように、各検索装置毎に、キーワード展開機能の有無と、キーワード展開機能を有する場合にはキーワード展開機能を使用する際のコマンド等といった機能呼出方法の情報と、検索式の形式に関する情報と、検索結果の出力形式に関する情報と、を有している。
検索形式に関する情報としては、検索式の種類、意味、検索式中のキーワードの位置等といった情報があり、検索式の解釈及び変換に利用される。
例えば、或る検索装置の検索式が、キーワードを並びで表現し、指定されたキーワードのいずれかを含むデータを検索するといった意味を持つ場合には、当該検索式がキーワードの論理和を意味しているので、検索形式に関する情報の論理和の演算子としてキーワードを区切る記号が設定される。また、或る検索装置がキーワードの論理和や論理積を検索式として指定できる場合には、キーワードの論理和や論理積を表す部分式の形式として、木構造などのデータ表現を使ってキーワードと演算子との組合せ方法が設定される。なお、本実施例のプロファイル情報は、各検索装置に対する検索式の論理和や論理積の形式が同一である場合の設定となっており、論理和演算子と、論理積演算子とが設定されている。
検索結果の出力形式に関する情報としては、変換コマンド列、変換スクリプト、正規表現等といったパターンであり、例えば、検索結果中においてデータを表す識別子又は名前、或いは当該データに関連するキーワードを特定するための情報等といったものがあり、検索結果の解釈に利用される。
なお、このプロファイルの情報は予め統合化検索装置の管理者などが設定している。
検索結果併合手段7は、複数の検索装置に対してユーザが検索を指定した場合には、各検索装置からの検索結果を受け取ると、プロファイル記憶手段6のプロファイル情報に基づいて、各検索装置毎の形式の異なる検索結果を解釈して、統一した検索結果にまとめる。本実施例では、各検索装置からの検索結果を受け取ると、各当該検索装置のプロファイル情報中の検索結果の取り出しパターンに基づいて各検索装置の検索結果中からデータを表す識別子を取り出してまとめている。
ここで、請求項2に言うキーワード展開手段は、上記したキーワード展開手段5dと、検索装置のキーワード展開機能とが供働することによって構成される。
次に、上記した第二実施例に係る統合化検索システムの動作を図8を参照して説明する。
まず、入力手段5aがユーザから所望のデータに関するキーワードを含む検索式の入力を受け付けると(ステップS9)、入力手段5aは当該検索式を検索式解釈手段5bに渡し、検索解釈手段5bが検索式を解釈してキーワードを検出する(ステップS10、S11)。
次いで、検索装置選択手段5cがキーワード展開を行わせる検索装置をプロファイル記憶手段6のプロファイル情報に基づいて選択する(ステップS12)。
キーワード展開を行わせる検索装置が選択されると、キーワード展開手段5dが選択された検索装置のキーワード展開機能を利用するためのアクセス方法をプロファイル記憶手段6から取得し、取得したアクセス方法に従って、検索式解釈手段5bによって検出されたキーワードを検索装置に渡すことによってキーワード展開させ、展開されたキーワード群を検索装置から取得して検索式生成手段5eに渡す(ステップS13)。
なお、例えば、キーワード展開によって所定数のキーワードが得られないといった場合には、キーワード展開が不十分であるので、再度、別のキーワード展開機能を有する検索装置に対して、上記したステップS13を繰り返す(ステップS14)。
そして、キーワード群をキーワード展開手段5dから受け取った場合には、検索式生成手段5eは、当該キーワード群と、ユーザが入力した検索式と、プロファイル記憶手段6のプロファイル情報中の検索装置の検索式の形式に関する情報とに基づいて、後述して説明する検索式生成処理を行って、検索検索対象の検索装置毎の検索式を生成する(ステップS15)。
検索式が生成されると、データ検索制御手段5fが検索仲介手段4を介して、各検索装置に各検索装置毎の検索式を使用して該当するデータの検索をさせる(ステップS16)。そして、検索結果併合手段7が各検索装置からの検索結果を受け取り、プロファイル記憶手段6のプロファイル情報を参照して、検索結果中の検索されたデータを特定して、すべての検索対象の検索装置によって検索されたデータをまとめる(ステップS17)。
次に、検索式生成手段5eによる検索式生成処理を図9を参照して説明する。
検索式生成手段5eは、検索式解釈手段5bからユーザが指定した検索式の構成等といった情報を受け取り(ステップS18)、プロファイル記憶手段6から検索対象の検索装置の検索式の構成、形式といった情報を取得する(ステップS19)。
そして、検索対象の検索装置での検索式がキーワードの論理和を表現できるか否かを検出する(ステップS20)。
論理和を表現できる場合には、キーワード展開手段5dから渡されたキーワード群を一つの検査式としてまとめることができるので、まず、キーワード群を論理和でまとめ(ステップS21)、当該論理和でまとめられたキーワード群をユーザが入力した検索式のキーワード部分と置き換え(ステップS22)、前記取得した検索対象の検索装置の検索式の情報に基づいて、置き換えられた検索式を検索対象の検索装置に対する検索式へ変換する(ステップS23)。
一方、対象とする検索装置の検索式がキーワードの論理和を表現できないときには、キーワード群を1つの検索式にまとめることができないので、キーワード群の各キーワード毎に以下の処理を行う。
すなわち、キーワード群中の各キーワードをユーザが入力した検索式のキーワード部分と置き換え(ステップS24)、前記取得した検索対象の検索装置での検索式の形式に関する情報に基づいて、置き換えられた検索式を検索対象の検索装置に対する検索式へ変換する(ステップS25)。そして、残りのキーワードに対しても同様に上記した処理(ステップS24、S25)を繰り返し行う(ステップS26)。
ここで、第二実施例に係る統合化検索システムにおいて、検索装置C及びDからデータ検索する場合を例にとって図6を参照して説明する。なお、検索装置内の点線の四角は格納されたデータを表し、データ中の単語は当該データに関連付けられたキーワードを表している。
まず、ユーザによってキーワード「ドキュメント」から成る検索式が入力されると、キーワード展開によってキーワード「ドキュメント」、「文書」、「document」を取得し、当該キーワード群を論理和とした検索式を各検索装置毎の形式の検索式に変換し、当該検索式を使用して各検索装置を検索して、検索結果を統合する。
したがって、ユーザが入力したキーワードが「ドキュメント」である場合でも、展開された「ドキュメント」、「文書」、「document」といったキーワード群から成る検索式によって検索され、従来には検索装置Dから検出することのできなかった、「文書」や「document」といったキーワードが対応付けられたデータも検出することができる。
このように、キーワード展開機能を有さない検索装置であっても、キーワード展開機能を有する検索装置と同様な検索を行うことができる。また、複数の検索装置を同時に検索する場合においても、各検索装置の特徴を区別することなく、容易にデータを検索することができる。また、統制語を利用した検索装置からデータを検索する際であっても、ユーザが統制語を意識しなくとも適切な検索を行うことができ、ユーザが検索対象の検索装置の統制語を調べるといった手間を省くことができる。
なお、既存の検索装置を統合する場合においては、複数の検索装置の中のいずれか一つがキーワード展開機能を有していれば上記した効果を得ることができる。
なお、上記した検索装置選択手段5cでは、キーワード展開を行わせる検索装置を任意に決定するようにしていたが、例えば、予め各検索装置毎のキーワード展開機能が有している語彙数或いは展開処理の速度等といった情報に基づいて適した検索装置を選択するようにしてもよい。
なお、上記した第一実施例及び第二実施例では、検索装置の有しているキーワード展開機能を使用するようにしていたが、検索装置とは別の構成としてキーワード展開機能を備えるようにしてもよく、この場合には、すべての検索装置がキーワード展開機能を有していなくてもよい。
次に、本発明の第三実施例に係る統合化検索システムを図10を参照して説明する。なお、上記した第二実施例と同様な部分には同一番号を付し、重複する説明は省略する。
この統合化検索装置は、検索装置E及びFと、検索仲介手段4と、データ検索手段8と、プロファイル記憶手段9と、検索結果併合手段7と、を備えている。
検索装置E及びFは、データとデータの内容に関するキーワードとを格納するデータベースを有しており、データを登録する際には、データとデータに関するキーワードとを対応付けて登録する一方、データを検索する際には、指定されたキーワードに対応付られたデータを検索して検出する。なお、検索装置EとFとでは、データを検索する際の検索式の形式及び検索結果の形式が異なっている。
データ検索手段8は、検索するデータに関するキーワードを検索式として入力する入力手段5aと、入力された検索式を解釈してキーワードを検出する検索式解釈手段5bと、キーワードの展開に必要な情報を取得するために利用する検索装置を選択する検索装置選択手段8aと、前記検索装置の情報に基づいてキーワードの展開を行うキーワード展開手段8bと、キーワードに基づいて検索式を生成する検索式生成手段5eと、検索式を利用して検索対象の検索装置にデータを検索させるデータ検索制御手段5fと、を有している。
検索装置選択手段8aは、プロファイル記憶手段9のプロファイルに基づいて、検索したデータから当該データに関するキーワード群を取得することのできる検索装置、例えば、統制語を使用していない検索装置を選択し、選択した検索装置をキーワード展開手段8bに通知する。なお、複数の検索装置が選択できる場合には、任意に選択させることができる。
キーワード展開手段8bは、検索装置選択手段8aによって選択された検索装置から、ユーザによって入力された検索式中のキーワードに関連するデータを予備検索をして取得する予備検索制御手段8cと、予備検索制御手段8cが取得したデータから前記キーワードに関連するキーワードを抽出することによってキーワード展開を行う抽出手段としてのキーワード選定手段8dと、を有している。
予備検索制御手段8cは、検索式解釈手段5bが検出したキーワードを検索式生成手段5eに渡し、検索式生成手段5eに検索式選択手段8aによって選択された検索装置における、前記キーワードに対応付けられたデータを検索するための検索式を生成させ、当該検索式を使用して前記検索装置に検索させて、検索結果を受け取る。次いで、受け取った検索結果をキーワード選定手段8dに渡す。
キーワード選定手段8dは、受け取った検索結果からプロファイル記憶手段9のプロファイル情報のキーワード取り出しパターンに従ってキーワード候補群を取り出す。そして、当該取り出したキーワード候補群から検索式検出手段5bによって検出されたキーワード(ユーザが入力したキーワード)と関連が深いものをキーワードとして抽出する。
ここで、キーワードを抽出する際に関連が深いか否かの基準としては、例えば、ユーザが入力したキーワードに対する検索結果中での、文法、字面、位置等の関係、検索結果中でのキーワードの出現頻度、検索装置全体におけるキーワードの割合と検索結果中におけるキーワードの割合との関係等がある。
なお、検索装置全体におけるキーワードの割合と検索結果中におけるキーワードの割合との関係を基準として使用する場合には、検索装置全体に含まれる割合が低く、検索結果に含まれる割合が高いほど、関連が深いキーワードとして扱っている。
プロファイル記憶手段9は、磁気ディスク等といった記憶装置を備え、当該記憶装置に検索装置E及びFの特徴を検索可能にプロファイルとして格納する。このプロファイルは、図11に示すように、各検索装置毎に、データに関連するキーワード群を取得できるか否かの情報と、検索式の形式に関する情報と、検索結果の出力形式に関する情報と、検索結果のキーワード情報に関する情報と、を有している。なお、このプロファイルの情報は予め統合化検索装置の管理者などが設定している。
次に、第三実施例に係る統合化検索システムの動作を図面を参照して説明する。
なお、ここでは、上述した第二実施例と異っている、キーワードを展開するまでの動作について図12を参照して説明する。
まず、データ入力手段5aがユーザから所望のデータに関するキーワードを含む検索式の入力を受け付けると、入力手段5aは当該検索式を検索式解釈手段5bに渡し、検索解釈手段5bが検索式を解釈してキーワードを検出する。
そして、検索装置選択手段8aが検索することによって検索したデータから当該データに関するキーワード群を取得することのできる予備検索対象の検索装置をプロファイル記憶手段9のプロファイル情報に基づいて選択する。
一方、予備検索制御手段8cは検索式解釈手段5bが検出したキーワードを検索式生成手段5eに渡し、キーワードを渡された検索式生成手段5eは、予備検索対象の検索装置での検索式に関する情報をプロファイル記憶手段9から取得し(ステップS27)、当該検索式に関する情報に基づいて、前記キーワードから検索式を生成する(ステップS28)。
次いで、予備検索制御手段8cが、生成された検索式を使用して予備検索対象の検索装置に検索を行わせ、検索結果を取得してキーワード選定手段8dに渡す(ステップS29)。
検索結果を受け取ると、キーワード選定手段8dは、プロファイル記憶手段9のプロファイル情報のキーワード取り出しパターンに従って解釈し(ステップS30)、キーワード候補群を取り出す(ステップS31)。次いで、取り出したキーワード候補群からユーザが入力したキーワードと関連の深いものをキーワード群として抽出する(ステップS33)。
これによって、ユーザが検索式中に含めたキーワードを関連するキーワード群へ展開することができる。なお、これ以降の処理は、第二実施例におけるキーワード展開後の動作と同様である。
ここで、検索装置E及びFから検索を行う場合を例にとって図13を参照して説明する。なお、検索装置内の点線の四角は格納されたデータを表し、データ中の単語は当該データに関連付けられたキーワードを表している。
まず、ユーザが検索式内でキーワード「ドキュメント」を指定した場合には、検索式が解析され、キーワード「ドキュメント」が検出され、プロファイル情報に基づいて予備検索対象の検索装置として検索装置Eが選択される。そして、キーワード「ドキュメント」を利用して検索装置Eのデータを検索し、検索結果として「ドキュメント、文書」、「ドキュメント、管理」「文書、ドキュメント」等といったキーワードが対応付けられているデータが得られる。次いで、プロファイル情報に基づいて、得られたデータに対応付けられている「ドキュメント」、「文書」、「管理」といったキーワード候補が取り出され、後続する検索動作において使用するキーワードとして「ドキュメント」、「文書」が抽出される。なお、この実施例においては、出現回数が1回となっているキーワード候補については、検索を行う際のキーワードとして使用しないこととしているので、「管理」はキーワードとして抽出されていない。
そして、プロファイル情報に基づいて検索対象の検索装置E及びFに対する抽出されたキーワード群を含む検索式が生成される。例えば、検索装置Eに対する検索式として「ドキュメント|文書」が、検索装置Fに対する検索式として「ドキュメント or 文書」が生成される。次いで、生成した検索式を利用して、各検索装置が検索され、各検索装置による検索の結果からプロファイル情報に基づいてデータの識別子、名前等といった検索結果を取り出して、各検索装置からの検索結果を統一した形式としてまとめて、例えば、ディスプレイ装置等といった出力装置に出力する。
上記した検索動作を行うことによって、従来に検索式として「ドキュメント」を指定して検索装置Fを検索した場合には得られなかったデータを得ることができる。すなわち、「ドキュメント」と関連の深い「文書」といったキーワードの対応付けられているデータを検索して得ることができる。
このように、キーワードと関連のあるキーワードを格納した知識ベースを備えずとも、キーワードを関連するキーワード群に展開することができ、当該キーワード群を使用した検索によって、ユーザが所望しているデータを検出する頻度が増加し、効率よく検索を行うことができる。
また、統制語を利用した検索装置からデータを検索する際であっても、ユーザが統制語を意識しなくとも適切な検索を行うことができ、ユーザが検索対象の検索装置での統制語を調べるといった手間を省くことができる。
なお、上記した第三実施例では、ユーザが指定した検索式がキーワードの論理積である場合には、以下に示す手順で検索式を作成すると検索結果をより精査することができる。すなわち、ユーザが指定したキーワードをk1、k2、…、knとした場合に、まず、キーワードki(0≦i≦n)から展開されたキーワード群をKi(kiは含まず)とし、Kiの各キーワードを論理和で結合した式Oiを作成し、当該式Oiと、ユーザの入力した検索式からキーワードkiの部分を除いた論理積の式Aiとの論理積の部分検索式を作成する。次いで、ユーザが入力した検索式と、各キーワードに対するn個の部分検索式とを論理和で結合して検索式とする。これによって、ユーザが入力した各キーワードから展開されたキーワード群を各入力されたキーワード毎に論理和で結合し、当該結合したもの同士を論理積で結合した検索式とした場合よりも、ユーザの所望していないデータが検索されるといった事態を減少させることができる。
次に、本発明の第四実施例に係る統合化検索システムを図14を参照して説明する。なお、上記した実施例と同様な部分には同一番号を付し、重複する説明は省略する。
この統合化検索装置は、第三実施例の統合化検索装置での予備検索によるキーワードの展開と、第一実施例の統合化検索装置でのデータ登録における動作とを組み合わせた動作を行う統合化検索装置であり、検索装置G及びHと、登録仲介手段1と、検索仲介手段4と、データ登録手段10と、プロファイル記憶手段11と、を有している。
検索装置G及びHは、データとデータの内容に関するキーワードとを格納するデータベースを有しており、データを登録する際には、データとデータに関するキーワードとを対応付けて登録する一方、データを検索する際には、指定されたキーワードに対応付られたデータを検索して検出する。なお、検索装置G及びHは、キーワード展開機能を有していない。
データ登録手段10は、入力手段2aと、検索式生成手段5eと、キーワード展開手段8bと、データ登録制御手段2dとを有している。
キーワード展開手段8bは、予備検索制御手段8cと、キーワード選定手段8dとを有している。
プロファイル記憶手段11は、第一実施例におけるプロファイル記憶手段3のプロファイル情報に、データに関連するキーワード群を取得できるか否かの情報と、検索式の形式に関する情報と、検索結果のキーワード情報に関する情報と、を更に有している。
この統合化検索システムでは、入力手段2aによって入力されたユーザのキーワードに対して、第三実施例で示した予備検索を使用したキーワードの展開動作を行い、この展開動作によって得られたキーワード群を、第一実施例で示したデータの登録の動作を行うことによって、データと対応付けて格納対象の検索装置に登録する。
したがって、キーワードと関連のあるキーワードを格納した知識ベースを備えずとも、キーワードを関連するキーワード群に展開することができ、当該キーワード群に基づいたキーワードをデータに対応させて登録することができるので、検索する際には、新たにキーワード展開するといったことをしなくともユーザが必要とするデータを適切に検索をすることができる。
また、登録する検索装置が統制語を使用している場合に、ユーザが統制語と異なるキーワードを入力したとしても、入力したキーワードが展開されることによって検索装置には関連する統制語が登録されるので、ユーザはデータに対応付ける統制語を意識してキーワードを入力する必要がなく、統制語を調べるといった手間を省くことができる。
なお、上記した第一乃至第四実施例では、統合化検索装置は2つの検索装置を備えていたが、これに限らず2つ以上の複数の検索装置を備えてもよい。
なお、本実施形態では、上記した各機能手段はプロセッサが(ROM等に予め格納された)制御プログラムを実行することにより構成されるが、本発明ではこれら機能手段を独立したハードウエア回路として構成してもよい。
本発明の第一実施例に係る統合化検索システムの構成図である。 本発明の第一実施例に係る統合化検索システムの各検索装置を説明する図である。 本発明の第一実施例に係るプロファイル情報を示した図である。 本発明の第一実施例に係る統合化検索システムの動作を説明する図である。 本発明の第二実施例に係る統合化検索システムの構成図である。 本発明の第二実施例に係る統合化検索システムの各検索装置を説明する図である。 本発明の第二実施例に係るプロファイル情報を示した図である。 本発明の第二実施例に係る統合化検索システムの動作を説明する図である。 本発明の第二実施例に係る統合化検索システムの検索式作成処理を説明する図である。 本発明の第三実施例に係る統合化検索システムの構成図である。 本発明の第三実施例に係る統合化検索システムの各検索装置を説明する図である。 本発明の第三実施例に係るプロファイル情報を示した図である。 本発明の第三実施例に係る統合化検索システムの動作を説明する図である。 本発明の第四実施例に係る統合化検索システムの構成図である。 従来例に係る検索装置の統合を説明する図である。
符号の説明
A、B、C、D、E、F、G、H・・検索装置、
2a、5a・・入力手段、
2c、5d・・キーワード展開手段、
2d・・データ登録制御手段、
5f・・データ検索制御手段、
8c・・予備検索制御手段、
8d・・キーワード選定手段

Claims (3)

  1. 複数の検索装置を利用して、指定されたキーワードに基づいてデータを検索させる統合化検索システムにおいて、
    検索するキーワードが入力される入力手段と、
    複数の検索装置について、前記入力されたキーワードを関連するキーワードに展開する所要のキーワード展開機能を有するか否かの管理情報を管理するプロファイル管理手段と、
    前記プロファイル管理手段の管理情報に基づいてキーワード展開機能を有する検索装置を選択して、当該検索装置に前記入力されたキーワードを関連するキーワードに展開させる検索装置選択手段と、
    前記展開されたキーワードに基づいて所定の検索装置にデータを検索させるデータ検索制御手段と、を備えたことを特徴とする統合化検索システム。
  2. 請求項1に記載の統合化検索システムにおいて、
    前記入力手段から入力されたキーワードに基づいて、検索装置にデータを検索させる予備検索制御手段と、
    前記検索の結果から、前記入力手段から入力されたキーワードに関連するキーワードを予め設定された規則に従って抽出する抽出手段と、を更に備え、
    前記データ検索制御手段は、抽出されたキーワードに基づいて所定の検索装置にデータを検索させることを特徴とする統合化検索システム。
  3. プロファイル管理手段と、検索装置選択手段と、データ検索制御手段とにより、複数の検索装置を利用して、指定されたキーワードに基づいてデータを検索させる統合化検索方法であって、
    前記プロファイル管理手段が、複数の検索装置について、入力されたキーワードを関連するキーワードに展開する所要のキーワード展開機能を有するか否かの管理情報を管理しており、
    前記検索装置選択手段が、前記プロファイル管理手段の管理情報に基づいてキーワード展開機能を有する検索装置を選択して、当該検索装置により前記入力されたキーワードを関連するキーワードに展開させ、
    前記データ検索制御手段が、前記展開されたキーワードに基づいて所定の検索装置に検索させることを特徴とする統合化検索方法。
JP2005213896A 2005-07-25 2005-07-25 統合化検索システム Expired - Fee Related JP4103905B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005213896A JP4103905B2 (ja) 2005-07-25 2005-07-25 統合化検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005213896A JP4103905B2 (ja) 2005-07-25 2005-07-25 統合化検索システム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP34063296A Division JP3747542B2 (ja) 1996-12-05 1996-12-05 統合化検索装置

Publications (2)

Publication Number Publication Date
JP2005327316A JP2005327316A (ja) 2005-11-24
JP4103905B2 true JP4103905B2 (ja) 2008-06-18

Family

ID=35473561

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005213896A Expired - Fee Related JP4103905B2 (ja) 2005-07-25 2005-07-25 統合化検索システム

Country Status (1)

Country Link
JP (1) JP4103905B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009116413A (ja) * 2007-11-01 2009-05-28 Hitachi Software Eng Co Ltd ファイル検索システム、プログラム、及びコンピュータ読み取り可能な記録媒体
JP5266761B2 (ja) * 2008-01-10 2013-08-21 日産自動車株式会社 情報案内システムおよびその認識辞書データベース更新方法
JP5506427B2 (ja) * 2010-01-26 2014-05-28 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム
JP5178813B2 (ja) * 2010-12-16 2013-04-10 ヤフー株式会社 検索システム及び方法

Also Published As

Publication number Publication date
JP2005327316A (ja) 2005-11-24

Similar Documents

Publication Publication Date Title
US9280535B2 (en) Natural language querying with cascaded conditional random fields
US7174507B2 (en) System method and computer program product for obtaining structured data from text
US7548933B2 (en) System and method for exploiting semantic annotations in executing keyword queries over a collection of text documents
US7613602B2 (en) Structured document processing apparatus, structured document search apparatus, structured document system, method, and program
US9317552B2 (en) Reusing existing query plans in a database system
US20170308607A1 (en) Method and System for a Semantic Search Engine
US7664773B2 (en) Structured data storage method, structured data storage apparatus, and retrieval method
KR101661198B1 (ko) 단문/복문 구조의 자연어 질의에 대한 검색 및 정보 제공 방법 및 시스템
US20050060306A1 (en) Apparatus, method, and program for retrieving structured documents
JP2001167087A (ja) 構造化文書検索装置,構造化文書検索方法,構造化文書検索用プログラム記録媒体および構造化文書検索用インデックス作成方法
US20090125542A1 (en) Systems and Methods for Modular Information Extraction
JP2012073951A (ja) 文字列比較プログラム、文字列比較装置及び文字列比較方法
KR101709055B1 (ko) 오픈 웹 질의응답을 위한 질문분석 장치 및 방법
JP4103905B2 (ja) 統合化検索システム
US20050144153A1 (en) Structured data retrieval apparatus, method, and computer readable medium
JP2003256455A (ja) Xml文書格納/検索装置及びそれに用いるxml文書格納/検索方法並びにそのプログラム
JP3596210B2 (ja) 関連語辞書作成装置
US20070150458A1 (en) System for extending data query using ontology, and method therefor
JP3612769B2 (ja) 情報検索装置および情報検索方法
WO2012091541A1 (en) A semantic web constructor system and a method thereof
CN113297251A (zh) 多源数据检索方法、装置、设备及存储介质
JP4185399B2 (ja) 顧客データ管理装置、顧客データ管理方法および顧客データ管理用プログラムならびに顧客データ管理用プログラムを格納した記録媒体
JP3747542B2 (ja) 統合化検索装置
US20040093333A1 (en) Structured data retrieval apparatus, method, and program
KR20130131657A (ko) 브랜드 네이밍 방법 및 네이밍 시스템, 그 기록매체

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050824

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050824

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070928

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071024

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080304

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080317

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110404

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120404

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130404

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140404

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees