JP2003108597A - 情報検索システム、情報検索方法及び情報検索プログラム - Google Patents

情報検索システム、情報検索方法及び情報検索プログラム

Info

Publication number
JP2003108597A
JP2003108597A JP2001296554A JP2001296554A JP2003108597A JP 2003108597 A JP2003108597 A JP 2003108597A JP 2001296554 A JP2001296554 A JP 2001296554A JP 2001296554 A JP2001296554 A JP 2001296554A JP 2003108597 A JP2003108597 A JP 2003108597A
Authority
JP
Japan
Prior art keywords
search
search request
information
request
ontology
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001296554A
Other languages
English (en)
Inventor
Yumi Ichimura
由美 市村
Ryohei Orihara
良平 折原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001296554A priority Critical patent/JP2003108597A/ja
Publication of JP2003108597A publication Critical patent/JP2003108597A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】ユーザの評価情報を検索に有効に反映させる。 【解決手段】検索要求拡張部104はオントロジー保持
部108のオントロジーを用いて検索要求記憶部102
の検索要求を拡張する。検索部103は拡張された検索
要求を用いて検索対象データ保持部110内の文書を検
索し、検索結果を表示部109の画面上に表示させる。
ユーザは検索結果を見ながら、評価情報入力部105に
よって評価情報を入力する。この評価情報に基づいて、
検索要求修正部106は検索要求を修正する。また、オ
ントロジー修正部107は、ユーザの評価情報に基づく
検索要求修正前後の検索要求を用いて、オントロジーの
関連度を修正する。これにより、ユーザの評価情報が次
回以降の検索に有効に反映される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ユーザの検索要求
に基づきテキスト等の情報を検索する情報検索システ
ム、情報検索方法及び情報検索プログラムに関する。
【0002】
【従来の技術】近年、WWW(ワールド・ワイド・ウェ
ブ)の普及等に伴い、大量の文書情報にアクセスするこ
とが可能になってきた。アクセス可能な情報量が増大す
るのに伴い、必要な情報を効率良く、精度良く検索する
ための検索技術が求められている。
【0003】一般に、検索システムに対する検索要求
(検索質問)は、ユーザがキーワードを入力することに
よって行われる。検索システムは、キーワード入力によ
り行われた検索要求に対して、適合する文書を探す。し
かし、文章表現の多様さゆえに、ユーザが検索対象文書
中で用いられる表現に一致したキーワードを入力するこ
とができるとは限らない。
【0004】例えば、「コンピューターの売上」に関す
る文書を検索しようとするものとする。この場合には、
ユーザが、例えば「コンピューター、売上」という検索
要求を入力することが考えられる。しかし、「コンピュ
ーター」を表す表現は、他にも「コンピュータ」、「P
C」、「パソコン」等があり、同様に、「売上」を表す
表現も「売り上げ」、「売れゆき」、「売れ具合」等が
挙げられる。従って、検索対象文書中にユーザが検索を
希望する文書が含まれていたとしても、入力したキーワ
ードと異なる表現が用いられている文書については検索
されないという問題がある。
【0005】このような問題を解決するために、語が他
の語とどのような関係にあるかという知識を記述したオ
ントロジー(シソーラス又は概念体系とも呼ばれる)を
用いて検索要求を補うという方法が提案されている。こ
の方法は、情報検索の分野では「検索要求拡張(query
expansion)」と呼ばれている。検索要求拡張について
は、例えば、文献1「情報検索と言語処理」(徳永健伸
著、東京大学出版会)等に詳述されている。
【0006】オントロジーを用いた検索要求拡張によっ
て、検索要求中に用いられる語と検索対象文書中に用い
られる語の不一致によって発生する検索漏れを回避する
ことが可能となる。しかし逆に、本来検索要求には関係
がない文書についても、多数検索されてしまうという不
具合も生じる。
【0007】分野毎に関係する語の内容や関連度が異な
ることを考慮すると、検索要求拡張の精度を向上させる
ためには、分野毎のオントロジーを構築する必要があ
る。しかし、このようなオントロジー構築は、多大の労
力を要し、分野依存まで十分に考慮されたオントロジー
は構築されていない。このため、オントロジーを用いた
検索要求拡張によって再現率は向上する一方、分野によ
っては精度が大幅に低下することもある。
【0008】また、検索可能な文書情報は極めて膨大で
多種多様であり、ユーザ自身が必要とする情報を検索前
に完全に認識することができているとは限らない。この
ため、例え検索要求拡張が採用されている場合でも、キ
ーワード入力に応じた文書を検索するという機械的な処
理だけでは、ユーザの求める文書を得ることが困難なこ
とがある。
【0009】そこで、ユーザに検索結果を提示して、ユ
ーザの意見を反映させて検索を繰返す適合性フィードバ
ック(relevance feedback)と呼ばれる手法が採用される
ことがある。ユーザは検索結果を見て、システムの挙動
を変化させるようにシステムのパラメータを調整するの
である。例えば、複数の検索結果についてユーザが有用
であるか否かの重み付けを付す方法等が考えられる。
【0010】即ち、先ず、1回目の検索を行い、この検
索結果をユーザに評価させ、評価情報を利用して検索要
求を修正する。次に、修正された検索要求によって再検
索することにより、1回目の検索結果よりもユーザが有
用と考える検索結果を得るのである。このように、適合
性フィードバックを採用すると、ユーザが自分の検索要
求を明確に定義することが難しい場合でも、個々の検索
結果に対して例えば有用,不要等の個別の判断を行うこ
とにより、検索システムにユーザの要求を細かく設定す
ることが可能になる。
【0011】しかしながら、適合性フィードバックは、
同じ検索要求が入力された場合や連続した検索セッショ
ンにおいて適用される。従って、検索セッションが異な
る場合等においては、適合性フィードバックの結果は利
用されず、ユーザの評価は反映されない。なお、ユーザ
毎に適合性フィードバックの結果を記憶しておくことも
あるが、この場合でも他のユーザが異なる検索要求を入
力した場合には、適合性フィードバックの結果は初期化
されてしまう。
【0012】
【発明が解決しようとする課題】このように、従来、分
野依存まで十分に考慮したオントロジーが構築されてい
ないことから、検索要求拡張を採用した場合でも、分野
によっては検索精度が著しく低下することがあるという
問題点があった。また、適合性フィードバックの結果が
十分に利用されておらず、検索システムにユーザの要求
を細かく設定することが困難であることがあるという問
題点もあった。
【0013】本発明は、ユーザの適合性フィードバック
の結果をオントロジーに反映させることにより、検索要
求拡張の精度を向上させることができる情報検索システ
ム、情報検索方法及び情報検索プログラムを提供するこ
とを目的とする。
【0014】
【課題を解決するための手段】本発明の請求項1に係る
情報検索システムは、検索要求を記憶する記憶手段と、
語同士の関連が格納された知識データベースと、前記記
憶手段に記憶されている検索要求を用いて、検索対象の
データベースを検索する検索手段と、前記検索手段の検
索結果に対する適合性の評価を示す評価情報が入力さ
れ、この評価情報に基づいて、前記記憶手段に記憶され
ている検索要求を修正する検索要求修正手段と、前記検
索要求修正手段による修正後の検索要求を用いて前記知
識データベースを修正する知識データベース修正手段と
を具備したものであり、本発明の請求項7に係る情報検
索方法は、検索要求を用いて、検索対象のデータベース
を検索し、この検索結果に対する適合性の評価を示す評
価情報が与えられて、前記検索要求を修正し、この検索
要求修正による修正後の検索要求を用いて、語同士の関
連が格納された知識データベースを修正するものであ
り、本発明の請求項8に係る情報検索プログラムは、コ
ンピュータに、検索要求を用いて、検索対象のデータベ
ースを検索する検索処理と、前記検索処理の検索結果に
対する適合性の評価を示す評価情報が入力され、この評
価情報に基づいて、前記検索要求を修正する検索要求修
正処理と、前記検索要求修正処理による修正後の検索要
求を用いて、語同士の関連が格納された知識データベー
スを修正する知識データベース修正処理とを実行させる
ものである。
【0015】本発明の請求項1において、検索手段は、
記憶手段に記憶されている検索要求を用いて、検索対象
のデータベースを検索する。検索要求修正手段は、検索
手段の検索結果に対する適合性の評価を示す評価情報が
入力され、入力された評価情報に基づいて、検索要求を
修正する。知識データベース修正手段は、検索要求修正
手段による修正後の検索要求を用いて知識データベース
を修正する。
【0016】本発明の請求項7においては、検索要求を
用いて検索対象のデータベースの検索が行われる。検索
処理の検索結果に対する適合性の評価を示す評価情報に
基づいて、検索要求が修正され、修正後の検索要求を用
いて、語同士の関連が格納された知識データベースが修
正される。
【0017】本発明の請求項8において、コンピュータ
は、検索要求を用いて、検索対象のデータベースを検索
する検索処理と、前記検索処理の検索結果に対する適合
性の評価を示す評価情報が入力され、この評価情報に基
づいて、前記検索要求を修正する検索要求修正処理と、
前記検索要求修正処理による修正後の検索要求を用い
て、語同士の関連が格納された知識データベースを修正
する知識データベース修正処理とを実行する。
【0018】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態について詳細に説明する。図1は本発明の一実
施の形態に係る情報検索システムを示すブロック図であ
る。
【0019】本実施の形態は、検索要求拡張(検索質問
拡張)及び適合性フィードバックを適用して得た検索要
求に基づいて、知識データベースとしてのオントロジー
を修正することにより、検索精度を向上させるものであ
る。
【0020】図1において、検索要求入力部101は、
キーボードやマウス等の入力装置によって構成されてお
り、ユーザがどのような情報を求めているかを受け付け
る。検索要求としては、ユーザが想起した検索キーワー
ドや、検索キーワードをANDやOR等で連結した論理
式、あるいは「○○の△△について知りたい」といった
自然言語文等が考えられる。また、検索要求入力部10
1は、予め用意したトピックリストを選択したり、「こ
の文書と似ている文書」といったように文書自身を検索
要求として受け付けることもできる。
【0021】このような検索要求の入力方法や検索要求
の表現形式については種々の方法を採用することがで
き、情報検索の分野で利用されている公知の技術を適宜
用いることができる。
【0022】ユーザの検索要求は、検索要求入力部10
1から検索要求記憶部102に与えられる。検索要求記
憶部102は、メモリやハードディスク等の記憶装置に
よって構成されており、入力された検索要求を記憶す
る。検索要求記憶部102に記憶される検索要求は、検
索要求拡張部104及び検索要求修正部106によって
修正されるようになっている。
【0023】検索部103は、検索要求記憶部102に
記憶されている検索要求が与えられ、検索対象のデータ
ベースである検索対象データ保持部110にアクセスし
て、入力された検索要求に適合する情報を検索する。検
索部103は検索対象データ保持部110から取得した
検索結果を、情報の順位付けされたリスト形式等の表示
データに変換して、表示部109に出力する。表示部1
09は、CRTディスプレイや液晶ディスプレイ等の表
示画面に相当し、入力された表示データに基づいて検索
結果表示を表示するようになっている。
【0024】なお、検索部103の検索アルゴリズムと
しては種々の方法が考えられる。例えば、検索部103
は、ベクトル空間法を用いた検索アルゴリズムを採用し
てもよい。
【0025】また、検索対象データ保持部110として
は、例えば、特許データベース、新聞記事データベース
等が考えられる。また、検索対象データ保持部110と
しては、WWW上のデータ等を利用可能な装置であって
もよい。
【0026】検索要求拡張部104は、検索要求記憶部
102に記憶されている検索要求を、オントロジー保持
部108のオントロジーを参照して拡張する。オントロ
ジーは、情報検索システムのプログラムやプログラムが
実行時に参照するデータに相当する。オントロジー保持
部108は、例えば、オントロジーとして、見出し、関
連語、関連度の3要素から構成される表形式のデータを
格納する。
【0027】検索要求拡張部104は、例えば、検索要
求として指定された検索キーワードがオントロジー保持
部108のオントロジーの見出しと一致する場合には、
その見出しの関連語に関連度に応じた重みを付けて、検
索要求として設定する。検索要求拡張部104によって
拡張された検索要求は、再び検索要求記憶部102に記
憶されるようになっている。
【0028】なお、オントロジー保持部108に格納さ
れるオントロジーの内容、例えば、関係の種類や関連度
の算出方法等については種々のものが考えられる。ま
た、オントロジーの表現形式についても、ツリー構造、
テーブル形式等自由に設定可能である。
【0029】評価情報入力部105は、キーボードやマ
ウス等の入力装置によって構成されており、表示部10
9によって提示された検索結果に対するユーザの評価が
評価情報として入力される。評価情報としては、例え
ば、検索結果リスト中の個々の情報が有用であるか否
か、あるいはどの程度有用であるかを示す評価値等が考
えられる。なお、評価の仕方としては種々の方法を採用
することができ、情報検索の分野で利用されている公知
の技術を適宜用いることができる。
【0030】評価情報入力部105は、ユーザによって
入力された評価情報を検索要求修正部106に出力す
る。検索要求修正部106は、入力された評価情報を用
いて、ユーザの検索要求に対して適合性フィードバック
を行う。なお、検索要求修正部106は、適合性フィー
ドバックの具体的アルゴリズムとして種々のものを採用
することができ、例えば、上述した文献1に開示されて
いる技術等を用いればよい。
【0031】例えば、検索要求修正部106は、検索要
求記憶部102に記憶されている検索要求を読み出し、
読み出した検索要求に含まれる各単語の重み付けの値
を、提示された検索結果の文書内の各単語の重み付けの
値及び評価情報に基づいて修正する。検索要求修正部1
06によって修正された検索要求は、再度検索要求記憶
部102に供給されて記憶される。検索要求修正部10
6は、検索部103に再検索を指示する。
【0032】検索部103は、検索要求修正部106の
検索指示に従って再度検索を行う。そして、検索部10
3は、修正された検索要求に基づく新しい検索結果を表
示部109に出力して表示させるようになっている。
【0033】オントロジー修正部107には、ユーザの
初期の検索要求に対して検索要求拡張を行った1回目の
検索要求と、検索要求修正部106によって修正された
検索要求とが与えられる。
【0034】本実施の形態においては、オントロジー修
正部107は、ユーザの初期の検索要求に対して検索要
求拡張を行った1回目の検索要求と、評価情報に基いて
修正された検索要求とを比較して、後述する方法によっ
てオントロジーの修正情報を作成し、その結果をオント
ロジー保持部108に与えて記憶させるようになってい
る。オントロジー修正部107は、評価情報に基づいて
オントロジーを修正するので、以後の検索要求に対して
ユーザの評価を反映させた検索が可能となる。
【0035】次に、このように構成された実施の形態の
作用について図2、図6、図11及び図16のフローチ
ャート並びに図3乃至図5、図7乃至図10、図12乃
至図15及び図17の説明図を参照して説明する。図2
は検索処理フローを示し、図6は検索要求拡張処理フロ
ーを示し、図11は検索要求修正処理フローを示し、図
16はオントロジー修正処理フローを示している。
【0036】上述したように、検索部103の検索アル
ゴリズムとしては種々の方法を採用することができる。
検索要求の表現方法等は検索アルゴリズムに応じたもの
にする必要がある。検索対象データとして文書データそ
のものを利用するものとすると、文書量が膨大になり、
検索処理に長時間を要することが考えられる。そこで、
検索対象データに含まれる各文書データをインデックス
化することにより、検索処理時間を短縮するようにした
ベクトル空間法が採用されることがある。
【0037】以下、検索アルゴリズムとして上記文献1
に開示されているベクトル空間法を採用した例について
説明する。
【0038】先ず、ユーザは、検索対象データ保持部1
10の検索対象データに含まれる文書を検索するため
に、検索要求入力部101から検索要求として例えば検
索キーワードを入力する。
【0039】図3乃至図5はベクトル空間法による検索
要求の表現方法及び文書の検索方法を説明するためのも
のである。
【0040】ベクトル空間法では、検索対象となる文書
及び検索要求をn次元のベクトルで表現する。ベクトル
の各要素は、予め選んだn個の語、即ち、検索対象デー
タ内に含まれる語に対応する。図3はベクトルの各次元
(word 1,word 2,word 3,…)を四角の升で表し、升
内の数字によって各次元の要素を示している。例えば、
ユーザがword 3及びword 5の2つの語を検索語(キーワ
ード)として指定した場合には、図3に示すように、検
索要求ベクトルの要素の値は、3番目の次元(word 3)
と5番目の次元(word 5)のみが1となる。
【0041】ベクトル空間法では、検索対象データもベ
クトルで表される。図4は検索対象データの文書ベクト
ルを示している。文書ベクトルの各要素の値は、語の文
書内における頻度等の統計量により決定する。ベクトル
空間法でよく用いられる統計量としては、(語の文書内
頻度)× log(文書総数/語の出現する文書数)が挙げ
られる。
【0042】このように、ベクトル空間法では、検索要
求及び検索対象文書をベクトルで表現していることか
ら、検索要求に対する各文書の適合度は、両者の内積等
のベクトル演算によって容易に求めることができる。例
えば、内積値の大きい順に適合度が高いものと判断する
ことが可能である。
【0043】いま、説明を容易とするために、検索要求
拡張及び適合性フィードバックを行わずに、ユーザの検
索要求のみに基づく検索を行うものとする。
【0044】検索要求入力部101からの検索要求は、
検索要求記憶部102に記憶される。検索部103は図
2のステップS201 において、検索要求記憶部102か
ら検索要求を読み出す。検索部103は、ステップS20
2 において、検索要求に基づく図3の検索要求ベクトル
と検索対象データ保持部110から読み出した図4の文
書ベクトルとを用いて、検索要求に適合する情報を検索
する。次のステップS203 において、検索部103は、
検索結果を情報の順位付けされたリスト形式等の表示デ
ータに変換して、表示部109に出力する。こうして、
表示部109の表示画面上において、検索結果が表示さ
れる。
【0045】図5は図3に示す検索要求ベクトルと図4
に示す文書ベクトルとの内積によって求めた検索結果の
表示例を示している。図5の例では、検索対象データ保
持部110内の文書A、文書B、文書C、文書D、文書
Eの順で、適合度が高いことを示している。
【0046】次に、検索要求拡張を行った場合の検索処
理について説明する。図6は検索要求拡張部104の検
索要求拡張処理を示している。
【0047】検索要求記憶部102には、ユーザ入力に
基づく例えば自然言語文の検索要求が記憶されている。
検索要求拡張部104は、図6のステップS601 におい
て、図示しないメモリ等に設けられた検索語バッファを
クリアする。次に、検索要求拡張部104は、ステップ
S602 において、検索要求記憶部102に記憶されてい
る自然言語文の検索要求を読み出す。次に、検索要求拡
張部104は、ステップS603 において、読み出した自
然言語文を解析することにより検索語を取り出し、検索
語とその重みを検索語バッファにセットする。
【0048】図7はユーザ入力である自然言語文の一例
を示している。図8は検索語バッファの情報の一例であ
り、図7に示す文から取り出された検索語(東芝、パソ
コン、価格)とその重みを示している。即ち、図8の例
では、自然言語文から全ての名詞を取り出し、その出現
頻度を重みとしている。
【0049】検索要求拡張部104は、図6のステップ
S604 において変数Nに検索語数をセットし、変数iに
初期値1をセットする(ステップS605 )。次に、検索
要求拡張部104は、オントロジー保持部108を参照
して、i番目の検索語の関連語を取り出し、関連語とそ
の関連度を検索語バッファに追加する(ステップS606
)。
【0050】図9はオントロジー保持部108内のオン
トロジーの一例を示している。図9の例では、見出し
「パソコン」に対して、「PC」、「コンピュータ」、
「コンピューター」が関連語として関連付けられてお
り、関連度がいずれも1であることが示されている。ま
た、図9では、見出し「価格」に対して、「値段」が関
連度1の関連語として関連付けられていることが示され
ている。
【0051】次に、検索要求拡張部104は、ステップ
S607 において、iを1だけインクリメントし、i≦N
であるか否かを判定する(ステップS608 )。iがN以
下又はNを越えていない場合には、ステップS606 の処
理を繰返す。こうして、全ての検索語について、関連語
とその関連度の情報を検索語バッファに追加する。最後
に、ステップS609 において、検索要求拡張部104
は、検索バッファの情報を検索要求記憶部102に与え
て記憶させる。
【0052】図10は図8に示す検索語バッファの情報
を、図9に示すオントロジーの情報を用いて検索要求拡
張を行った場合の検索語バッファ内の情報を示してい
る。ユーザ入力に基づく検索語に、「PC」、「コンピ
ュータ」、「コンピューター」及び「値段」が追加され
ている。図10の例では、オントロジーの関連度を重み
としている。
【0053】検索要求拡張後の検索処理についても、図
2と同一のフローが採用される。例えば、検索要求記憶
部102に図3に示すword 3及びword 5を含む自然言語
文が記憶されており、オントロジー保持部108に図1
2に示すオントロジーが記憶されているものとする。こ
の場合には、検索要求拡張部104によって、word 1、
word 3、word 4及びword 5を含む検索語が検索要求記憶
部102に記憶される。
【0054】検索部103は、検索要求記憶部102に
記憶された検索要求を読み出して、図13に示す検索要
求ベクトルを生成する。検索部103は図13の検索要
求ベクトルと図4に示す文書ベクトルとの内積によっ
て、図14に示す検索結果を得る。図14に示す検索結
果においては、文書D、文書C、文書E、文書A及び文
書Bの順で適合度が高いことを示している。
【0055】次に、検索要求修正(適合性フィードバッ
ク)を行った場合の検索処理について説明する。図11
は検索要求修正部106の検索要求修正処理を示してい
る。検索要求修正を行う場合には、例えば図14の検索
結果を表示部109の表示画面上に表示させた状態で、
ユーザの評価入力を受ける。図14の評価情報の欄は、
ユーザの評価入力を示している。図14の例では、検索
結果の順位が1位,4位の文書D,Aについてはユーザ
が有用であると判断し、他の文書C,E,Bについては
ユーザが不要であると判断した場合の評価入力結果を示
している。
【0056】検索要求修正部106は、図11のステッ
プS1101において、評価情報入力部105内の図示しな
い評価情報記憶部からユーザ入力による評価結果を受け
取ると共に、検索要求記憶部102から検索要求を読み
出す(ステップS1102)。なお、この場合には、図13
に示す検索要求拡張後の検索要求が検索要求記憶部10
2に記憶されているものとして説明する。
【0057】検索要求修正部106は、ステップS1103
において、受け取った評価情報を基に検索要求を修正す
る。例えば、検索要求修正部106は、評価情報に基づ
いて各文書の適合度の目標値を設定し、検索対象データ
保持部110内の各文書A,B,C,…の文書ベクトル
との内積によって適合度の目標値が得られるように、図
13の検索要求ベクトルを修正する。
【0058】図15は図14に示す評価情報を用いて、
図13の検索要求を修正した修正結果の一例を示してい
る。検索要求修正部106は、図15に示す修正後の検
索要求を検索要求記憶部102に格納する(ステップS
1104)。最後に、検索要求修正部106は、検索要求を
修正したことを検索部103に通知して再検索を促す
(S1105)。
【0059】評価情報に基づく検索要求修正後の検索処
理についても、図2と同一のフローが採用される。即
ち、この場合には、検索部103は、図15の検索要求
ベクトルと図4の文書ベクトルとの内積によって、各文
書の適合度を求める。
【0060】本実施の形態においては、検索要求修正部
106の出力はオントロジー修正部107にも供給され
ており、オントロジー修正部107は、評価情報に基づ
く検索要求修正後の検索要求に応じて、オントロジーを
修正する。図16はオントロジー修正部107によるオ
ントロジーの修正処理を示している。
【0061】オントロジー修正部107は、先ず、評価
情報に基づく検索要求修正前の検索要求Q1を検索要求
記憶部102から取り出す。この場合には、検索要求Q
1は、検索要求拡張後の図13に示すものである。オン
トロジー修正部107による修正が複数回繰返される場
合には、検索要求Q1は前回の検索要求修正後のものと
なる。オントロジー修正部107は、語j(図13の例
ではjは1,2,…N(N次元の場合)で、word 1,wo
rd 2,…)に対応する要素w1(j)(図13の例で
は、w1(1)=w1(3)=w1(4)=w1(5)
=1で、他は0)をセットする(ステップS1601)。
【0062】次に、オントロジー修正部107は、検索
要求記憶部102から最新の検索要求Q2を取り出し、
検索要求Q2における語jに対応する要素w2(j)を
セットする(ステップS1602)。検索要求Q1が図13
に示すものである場合には、検索要求Q2は図15に示
すものとなる。即ち、w2(1)=1.8,w2(2)
=0,w2(3)=0.4,w2(4)=−0.3,…
となる。
【0063】次に、オントロジー修正部107は、ステ
ップS1603において、変数Nにベクトルの次元数をセッ
トし、変数jに初期値1をセットする(ステップS160
4)。次のステップS1605においては、オントロジー修
正部107は、語j(j=1)がオントロジーの見出し
語であるか否かを判定する。この時点におけるオントロ
ジーは、図12に示すものである。word 1は、見出し語
ではないので、ステップS1610に移行してjをインクリ
メントする。次に、ステップS1611から処理をステップ
S1605に戻して、次の語j(j=2)について見出し語
であるか否かを判定する。同様にして処理を繰返し、図
12の例では語j(j=3)で処理をステップS1606に
移行する。
【0064】語jがオントロジーの見出し語である場合
には、ステップS1606において、変数kに初期値1をセ
ットする。次に、オントロジー修正部107は、ステッ
プS1607において、オントロジー中の語k(k=1)が
語j(j=3)の関連語であるか否かを判定する。図1
2に示すように、word 1は見出し語word 3の関連語であ
るので、処理をステップS1612に移行する。
【0065】なお、語kが語jの関連語でない場合に
は、ステップS1608においてkをインクリメントし、ス
テップS1609を介してステップS1607に処理を戻し、次
の語kが語jの関連語であるか否かを判定する。こうし
て、ステップS1605〜ステップS1611において、全ての
見出し語毎に全ての関連語について、ステップS1612以
降の処理が行われる。
【0066】オントロジー修正部107は、ステップS
1612において、検索要求Q1内の関連語についての要素
と見出し語についての要素との比較を行う。k=1,j
=3の場合には、図13に示すように、w1(1)=1
で、w1(3)=1であるので、処理をステップS1614
に移行して、見出し語と関連語との要素の比r1=w1
(j)/w1(k)を求める。仮に、ステップS1612に
おいて、|w1(k)|<|w2(j)|である場合に
は、処理をステップS1613に移行して、関連語と見出し
語との要素の比r1=w1(k)/w1(j)を求め
る。即ち、比r1はいずれの場合も、検索要求Q1につ
いて見出し語と関連語の要素同士の比が−1と1の間の
数になるように設定される。なお、図13の例では、k
=1,j=3の場合には、r1=1である。
【0067】次に、オントロジー修正部107は、ステ
ップS1615〜ステップS1617において、検索要求Q2内
の関連語についての要素と見出し語についての要素との
比r2を、1よりも小さい値となるように求める。k=
1,j=3の場合には、図15に示すように、w2
(1)=1.8,w2(3)=0.4であり、r2=2
/9である。
【0068】見出し語と関連語との関連度は、−1〜1
の値をとり、1で関連の度合いが最も強く、−1で負の
関連が最も強い。また、見出し語と関連語との関連度が
強ければ、両者の要素は略同様の値をとるものと考える
ことができる。両者の要素の値が異なるほど関連度は弱
いものと考えることができる。即ち、比r1,r2は見
出し語と関連語との関連度に相当する値となり、見出し
語と関連語との間の関連度が強ければ、r1,r2は1
に近い値となる。
【0069】比r2は、ユーザの評価情報の入力によっ
て修正された検索要求の要素から得たものである。従っ
て、この比r2を新たな関連度としてオントロジーに反
映させることで、以後、ユーザの評価情報の結果を利用
した検索処理が可能である。しかし、比r2のみを用い
て関連度を修正すると、評価情報による影響が大きすぎ
て、検索結果に悪影響を及ぼす可能性がある。そこで、
本実施の形態においては、前回の検索要求の要素から得
た比r1と最新の検索要求の要素から得た比r2との比
によって、関連度を修正する。
【0070】即ち、オントロジー修正部107は、次の
ステップS1618において、先ず、|r1|<|r2|であ
るか否かを判定する。|r1|<|r2|である場合に
は、ステップS1619においてr=r1/r2を求めて、
そうでない場合には、ステップS1620においてr=r2
/r1を求める。図13及び図15の例において、k=
1,j=3の場合には、r1=1で、r2=2/9であ
るので、ステップS1620において、r=2/9≒0.2
が求められる。
【0071】オントロジー修正部107は、次のステッ
プS1621において、求めたrを語jの関連語kの関連度
として、オントロジー保持部108のオントロジーを修
正する。次に、ステップS1608に処理を戻してkをイン
クリメントする。以後同様の処理が繰返されて、全ての
見出し語について、各関連語の関連度が求められ、オン
トロジーが修正される。
【0072】図17は図13に示す検索要求Q1と図1
5に示す検索要求Q2を用いたオントロジーの修正結果
を示している。
【0073】このように本実施の形態においては、オン
トロジーを用いた検索要求拡張及びユーザの評価情報に
基づく検索要求修正を行って、検索精度を向上させると
共に、ユーザの評価情報に基づく検索要求修正前後の検
索要求を用いて、オントロジーの関連度を修正してお
り、ユーザの評価結果を利用した検索処理を可能にし
て、検索精度を一層向上させることができる。オントロ
ジーそのものを修正していることから、異なるユーザで
あっても、また、検索セッションが変化した場合でも、
適合性フィードバックの結果を確実に利用して、検索要
求拡張の精度を向上させることができる。
【0074】なお、本実施の形態は、専用のハードウエ
アを用いずとも、汎用のプロセッサを用いたソフトウエ
アによる処理で実現することができる。例えば、図2、
図6、図11、図16の処理はコンピュータプログラム
を用いて実現することができ、これをFD、MO、CD
−ROM等の記録媒体を通じてコンピュータに導入して
実行させることにより、上記実施の形態を実現すること
ができる。
【0075】また、上記実施の形態では、テキスト情報
を対象とした検索を例に説明したが、テキスト情報に限
らず種々の情報、例えば、音声、画像等の検索結果に対
する適合度が判定可能なあらゆる情報を検索対象とする
ことが可能である。
【0076】
【発明の効果】以上説明したように本発明によれば、ユ
ーザの適合性フィードバックの結果をオントロジーに反
映させることにより、検索要求拡張の精度を向上させる
ことができるという効果を有する。
【図面の簡単な説明】
【図1】本発明の一実施の形態に係る情報検索システム
を示すブロック図。
【図2】検索処理フローを示すフローチャート。
【図3】ベクトル空間法による検索要求の表現方法及び
文書の検索方法を説明するための説明図。
【図4】ベクトル空間法による検索要求の表現方法及び
文書の検索方法を説明するための説明図。
【図5】ベクトル空間法による検索要求の表現方法及び
文書の検索方法を説明するための説明図。
【図6】検索要求拡張処理を示すフローチャート。
【図7】ユーザ入力である自然言語文の一例を示す説明
図。
【図8】検索語バッファの情報の一例を示す説明図。
【図9】オントロジー保持部108内のオントロジーの
一例を示す説明図。
【図10】図8に示す検索語バッファの情報を、図9に
示すオントロジーの情報を用いて検索要求拡張を行った
場合の検索語バッファ内の情報を示す説明図。
【図11】検索要求修正処理を示すフローチャート。
【図12】オントロジーの一例を示す説明図。
【図13】検索要求ベクトルの一例を示す説明図。
【図14】図13の検索要求ベクトルと図4に示す文書
ベクトルとの内積によって得られる検索結果の一例を示
す説明図。
【図15】図14に示す評価情報を用いて、図13の検
索要求を修正した修正結果の一例を示す説明図。
【図16】オントロジー修正処理を示すフローチャー
ト。
【図17】図13に示す検索要求Q1と図15に示す検
索要求Q2を用いたオントロジーの修正結果を示す説明
図。
【符号の説明】
102…検索要求記憶部、103…検索部、104…検
索要求拡張部、106…検索要求修正部、107…オン
トロジー修正部、108…オントロジー保持部、110
…検索対象データ保持部。

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 検索要求を記憶する記憶手段と、 語同士の関連が格納された知識データベースと、 前記記憶手段に記憶されている検索要求を用いて、検索
    対象のデータベースを検索する検索手段と、 前記検索手段の検索結果に対する適合性の評価を示す評
    価情報が入力され、この評価情報に基づいて、前記記憶
    手段に記憶されている検索要求を修正する検索要求修正
    手段と、 前記検索要求修正手段による修正後の検索要求を用いて
    前記知識データベースを修正する知識データベース修正
    手段とを具備したことを特徴とする情報検索システム。
  2. 【請求項2】 前記知識データベースを用いて、前記記
    憶手段に記憶されている検索要求を拡張する検索要求拡
    張手段を更に具備したことを特徴とする請求項1に記載
    の情報検索システム。
  3. 【請求項3】 前記検索要求修正手段は、前記検索要求
    拡張手段によって拡張された検索要求を用いた検索結果
    に対する評価情報に基づいて、前記記憶手段に記憶され
    ている拡張された検索要求を修正することを特徴とする
    請求項2に記載の情報検索システム。
  4. 【請求項4】 前記知識データベース修正手段は、前記
    検索要求修正手段による修正前後の検索要求を用いて前
    記知識データベースを修正することを特徴とする請求項
    1又は3のいずれか一方に記載の情報検索システム。
  5. 【請求項5】 前記検索手段は、ベクトル空間法による
    検索アルゴリズムを採用し、 前記知識データベース修正手段は、ベクトル空間法にお
    ける検索要求ベクトルの要素の値の比によって、前記知
    識データベースを修正することを特徴とする請求項1又
    は4のいずれか一方に記載の情報検索システム。
  6. 【請求項6】 前記知識データベースは、語と語の関係
    及び語同士の関連度の情報を含むことを特徴とする請求
    項1に記載の情報検索システム。
  7. 【請求項7】 検索要求を用いて、検索対象のデータベ
    ースを検索し、 この検索結果に対する適合性の評価を示す評価情報が与
    えられて、前記検索要求を修正し、 この検索要求修正による修正後の検索要求を用いて、語
    同士の関連が格納された知識データベースを修正するこ
    とを特徴とする情報検索方法。
  8. 【請求項8】 コンピュータに、 検索要求を用いて、検索対象のデータベースを検索する
    検索処理と、 前記検索処理の検索結果に対する適合性の評価を示す評
    価情報が入力され、この評価情報に基づいて、前記検索
    要求を修正する検索要求修正処理と、 前記検索要求修正処理による修正後の検索要求を用い
    て、語同士の関連が格納された知識データベースを修正
    する知識データベース修正処理とを実行させるための情
    報検索プログラム。
JP2001296554A 2001-09-27 2001-09-27 情報検索システム、情報検索方法及び情報検索プログラム Pending JP2003108597A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001296554A JP2003108597A (ja) 2001-09-27 2001-09-27 情報検索システム、情報検索方法及び情報検索プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001296554A JP2003108597A (ja) 2001-09-27 2001-09-27 情報検索システム、情報検索方法及び情報検索プログラム

Publications (1)

Publication Number Publication Date
JP2003108597A true JP2003108597A (ja) 2003-04-11

Family

ID=19117772

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001296554A Pending JP2003108597A (ja) 2001-09-27 2001-09-27 情報検索システム、情報検索方法及び情報検索プログラム

Country Status (1)

Country Link
JP (1) JP2003108597A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007018389A (ja) * 2005-07-08 2007-01-25 Just Syst Corp データ検索装置、データ検索方法、データ検索プログラムおよびコンピュータに読み取り可能な記録媒体
WO2011013191A1 (ja) * 2009-07-27 2011-02-03 株式会社 東芝 関連性提示装置、方法およびプログラム
JP2011086043A (ja) * 2009-10-14 2011-04-28 Kddi Corp 単語テーマ関連度算出装置、単語テーマ関連度算出用プログラムおよび情報検索装置
JP2013200862A (ja) * 2012-03-23 2013-10-03 Nec (China) Co Ltd クエリ結果を多様化するための方法および装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007018389A (ja) * 2005-07-08 2007-01-25 Just Syst Corp データ検索装置、データ検索方法、データ検索プログラムおよびコンピュータに読み取り可能な記録媒体
JP4711761B2 (ja) * 2005-07-08 2011-06-29 株式会社ジャストシステム データ検索装置、データ検索方法、データ検索プログラムおよびコンピュータに読み取り可能な記録媒体
WO2011013191A1 (ja) * 2009-07-27 2011-02-03 株式会社 東芝 関連性提示装置、方法およびプログラム
US8452760B2 (en) 2009-07-27 2013-05-28 Kabushiki Kaisha Toshiba Relevancy presentation apparatus, method, and program
JP5289573B2 (ja) * 2009-07-27 2013-09-11 株式会社東芝 関連性提示装置、方法およびプログラム
JP2011086043A (ja) * 2009-10-14 2011-04-28 Kddi Corp 単語テーマ関連度算出装置、単語テーマ関連度算出用プログラムおよび情報検索装置
JP2013200862A (ja) * 2012-03-23 2013-10-03 Nec (China) Co Ltd クエリ結果を多様化するための方法および装置

Similar Documents

Publication Publication Date Title
US7769771B2 (en) Searching a document using relevance feedback
US6678677B2 (en) Apparatus and method for information retrieval using self-appending semantic lattice
JP3717808B2 (ja) 情報検索システム
US7383262B2 (en) Ranking database query results using probabilistic models from information retrieval
US20060195435A1 (en) System and method for providing query assistance
US8250092B2 (en) Search result diversification
US20180081880A1 (en) Method And Apparatus For Ranking Electronic Information By Similarity Association
US20050108200A1 (en) Category based, extensible and interactive system for document retrieval
WO2008106667A1 (en) Searching heterogeneous interrelated entities
US20080172380A1 (en) Information retrieval based on information location in the information space.
KR20070101217A (ko) 개인 웹에서의 문서의 검색, 항행, 및 순위 부여를 위한방법, 시스템, 컴퓨터 프로그램 제품
JP2009528628A (ja) ラベル付きドキュメントからラベルなしドキュメントへの関連度の伝播
US12105762B2 (en) Methods and servers for ranking digital documents in response to a query
JP2015060243A (ja) 検索装置、検索方法、およびプログラム
US7325010B1 (en) Information modeling method and database searching method using the information modeling method
JP3023943B2 (ja) 文書検索装置
KR20210137643A (ko) 쇼핑 검색을 위한 상품 속성 추출 방법
JPH11345233A (ja) 文書処理方法および装置ならびに記録媒体
JP2000200281A (ja) 情報検索装置および情報検索方法ならびに情報検索プログラムを記録した記録媒体
JP3024045B2 (ja) 自然言語に基づくデータ検索装置
JPH1145267A (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003108597A (ja) 情報検索システム、情報検索方法及び情報検索プログラム
WO2020263182A1 (en) Method and system for conducting a brainstorming session with a virtual expert
JP2001265774A (ja) 情報検索方法、装置、および情報検索プログラムを記録した記録媒体、ハイパーテキスト情報検索システム
KR20200109515A (ko) 빅데이터를 이용한 교육 콘텐츠 생성 방법