JP2003330952A - 情報検索支援システムおよびプログラム - Google Patents

情報検索支援システムおよびプログラム

Info

Publication number
JP2003330952A
JP2003330952A JP2002140440A JP2002140440A JP2003330952A JP 2003330952 A JP2003330952 A JP 2003330952A JP 2002140440 A JP2002140440 A JP 2002140440A JP 2002140440 A JP2002140440 A JP 2002140440A JP 2003330952 A JP2003330952 A JP 2003330952A
Authority
JP
Japan
Prior art keywords
path
concept
keyword
vector
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002140440A
Other languages
English (en)
Inventor
Tomohiro Takagi
友博 高木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meiji University
Original Assignee
Meiji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meiji University filed Critical Meiji University
Priority to JP2002140440A priority Critical patent/JP2003330952A/ja
Publication of JP2003330952A publication Critical patent/JP2003330952A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 メニュー検索方式を基本とする検索におい
て、目的とする情報を効率良く検索する。 【解決手段】 入力装置1を介して情報検索のためのキ
ーワードを入力し、このキーワードを概念変換部5でキ
ーワードを表す概念のベクトルに変換する。マッチング
部6は、パスデータベース3に格納された階層メニュー
のパスを表す概念のベクトルと、概念変換部5で変換さ
れたキーワードを表す概念のベクトルとのマッチング度
を計算し、求められたマッチング度に基づいて最適パス
を決定する。この最適パスを表示装置2に表示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、インターネットに
よるWeb検索等の用途に適した情報検索支援システム
及びプログラムに関する。
【0002】
【従来の技術】従来より、膨大な情報ソースから目的と
する情報を効率良く検索するための情報検索方式とし
て、キーワードによるマッチングで所望とする情報を検
索するキーワード検索方式と、メニューから所望とする
情報を探索していくメニュー検索方式とが知られてい
る。キーワード検索方式による検索は、検索が簡単でキ
ーワードを含む情報を速やかに検索することができると
いう利点がある反面、キーワードの設定の仕方が難し
く、キーワードが1字でも異なれば目的とする情報が検
索されないという可能性がある。これに対し、メニュー
検索方式は、階層メニューを上位の分類項目から辿って
いくことにより、目的とする情報を見つけ出していく方
式であるため、関連した情報を複数参照しながら最適な
パスを探索していくことができるという利点がある。し
かし、このメニュー検索方式では、上位の分類項目を選
択する段階で、それらの分類項目の下位の分類項目が分
からないと、どのパスを辿って良いのかを判断すること
ができず、最適パスを見つけ出すまでに時間がかかると
いう問題がある。
【0003】
【発明が解決しようとする課題】このように、従来のキ
ーワード検索方式、メニュー検索方式のいずれの情報検
索方式においても情報を検索するまでに時間がかかり、
効率の良い検索ができないという問題がある。
【0004】本発明は、このような点に鑑みなされたも
ので、メニュー検索方式を基本とする検索において、目
的とする情報を効率良く検索することができる情報検索
支援システムおよびプログラムを提供することを目的と
する。
【0005】
【課題を解決するための手段】本発明に係る情報検索支
援システムは、検索対象となる情報を分類するための分
類項目を階層メニューのパスとして記憶すると共に、前
記階層メニューのパスを表示することにより、前記階層
メニューのパスから前記検索対象となる情報の探索を可
能にする情報検索支援システムにおいて、前記検索対象
となる情報を検索するためのキーワードを入力する入力
手段と、前記階層メニューのパスを記憶するパスデータ
記憶手段と、前記入力されたキーワードと前記パスデー
タ記憶手段に記憶された階層メニューのパスとのマッチ
ング度を求めると共に求められたマッチング度に基づい
て最適パスを決定するマッチング手段と、このマッチン
グ手段で決定された最適パスを前記階層メニューのパス
として表示する表示手段とを備えてなることを特徴とす
る。
【0006】本発明に係る情報検索支援プログラムは、
検索対象となる情報を分類するための分類項目を階層メ
ニューのパスとして記憶すると共に、前記階層メニュー
のパスを表示することにより、前記階層メニューのパス
から前記検索対象となる情報の探索を可能にする情報検
索支援プログラムであって、前記検索対象となる情報を
検索するためのキーワードを入力するステップと、この
入力されたキーワードと前記記憶された階層メニューの
パスとのマッチング度を求めると共に求められたマッチ
ング度に基づいて最適パスを決定するステップと、決定
された最適パスを前記階層メニューのパスとして表示す
るステップとをコンピュータに実行させるように構成さ
れたものである。
【0007】本発明によれば、検索対象となる情報を検
索するためのキーワードを入力し、このキーワードと階
層メニューのパスとのマッチング度を計算して、求めら
れたマッチング度に基づいて最適パスを決定し、この最
適パスを表示するようにしているので、表示された最適
パスを辿っていけば、キーワードを含む情報及びそれに
関連する情報を効率よく探索することができる。
【0008】なお、本発明の一つの実施形態において
は、入力されたキーワードから当該キーワードを表す概
念のベクトルを出力する概念変換手段を更に備え、パス
データ記憶手段が、階層メニューの全てのパスに対し
て、各パスを表す概念のベクトルを記憶したものであ
り、マッチング手段は、キーワードを表す概念のベクト
ルとパスを表す概念のベクトルとの内積をマッチング度
として算出する。このようにキーワードやパスの概念を
ベクトルという形で拡張することにより、より総合的で
広い観点からキーワードとパスの概念のマッチング度を
求めることができる。
【0009】なお、キーワードを表す概念のベクトル
は、例えば当該キーワードと概念との関連の深さを各概
念毎にスコアで示すベクトルである。この場合、概念変
換手段は、複数のキーワードが入力されたときに、例え
ば各キーワードを表す概念のベクトルの同一概念のスコ
アのうち大きい方のスコアを選択することにより、複数
のキーワードを表す概念のベクトルを算出し出力するよ
うに構成することができる。
【0010】また、パスを表す概念のベクトルは、例え
ば当該パスを構成する各分類項目を表す概念のベクトル
を全分類項目について合成したベクトルであり、各分類
項目を表すベクトルは、例えば当該分類項目と概念との
関連の深さを各概念毎にスコアで示すベクトルである。
更に、パスを表す概念のベクトルは、例えば当該パスを
構成する各分類項目を表す概念のベクトルの同一概念の
スコアのうち大きい方のスコアを選択することにより、
各分類項目を表すベクトルを全分類項目について合成し
たものである。
【0011】更に、パスを表す概念のベクトルは、例え
ば当該パスを構成する各分類項目を表す概念のベクトル
を、階層メニューの下位の分類項目ほど大きな重みを与
えて全分類項目について合成したものである。このよう
に合成時に各分類項目に重み付けを行うと、よりキーワ
ードに近い、具体的な概念の重みが大きくなり、実情を
反映した最適パスを得ることができる。
【0012】
【発明の実施の形態】以下、図面を参照しながら、本発
明の一実施形態を詳細に説明する。図1は、本実施形態
に係る情報検索支援システムの構成を示す図である。こ
の情報検索支援システムは、マウス、キーボード等の入
力装置1と、CRTディスプレイ、LCDディスプレイ
等の表示装置2と、ハードディスク装置などの記憶装置
からなるパスデータベース3と、CPUおよび必要な情
報検索支援プログラムによって実現されるユーザインタ
フェース4、概念変換部5及びマッチング部6とを備え
て構成されている。
【0013】入力装置1とユーザインタフェース4の一
部の機能とが、情報検索のためのキーワードを入力する
ための入力手段を構成する。パスデータベース3は、検
索対象となる情報を分類する分類項目を階層化してなる
階層メニューの全てのパスを記憶するパスデータ記憶手
段であり、より具体的には、階層メニューの全てのパス
に対して、各パスを表す概念のベクトルに拡張したもの
を記憶している。概念変換部5は、内部に概念辞書を有
し、入力されたキーワードに対して、そのキーワードを
表す概念をワードベクトルの形態に拡張して出力する。
マッチング部6は、概念変換部5から出力されたキーワ
ードを表す概念のベクトルと、パスデータベース3に記
憶された階層メニューのパスを表す概念のベクトルとの
内積をマッチング度として求め、このマッチング度が高
いパス、例えばマッチング度が高い順に抽出した所定個
のパス、又はマッチング度が所定値よりも高いパスを最
適パスとして出力する。これら最適パスはユーザインタ
フェース4を介して表示装置2に表示される。
【0014】次に、このように構成された情報検索支援
システムの動作を説明する。図2は、階層メニューのパ
スの一例を示す図である。この階層メニューは、Yah
oo(商標:ヤフー株式会社)のWeb検索画面のメニ
ューの例であり、そのうちの一部のパスが例示されてい
る。左側が最も高い階層、右側が最も低い階層を示して
おり、“>”が階層の区切りを示している。
【0015】ここで、例えば「パソコン」及び「本」に
関連するサイトを検索しようとする場合、階層メニュー
の上位の階層から下位の階層を辿る操作で最適なパスを
見つけ出すことはかなりの慣れも必要であるし、探索に
要する時間もかかる。一方、「パソコン」、「本」をキ
ーワードとしてサイトを検索する場合、検索されたサイ
トに関連はするが、そのキーワードを含まないサイトに
ついては検索結果として抽出されない。そこで、このシ
ステムでは、「パソコン」、「本」をキーワードとして
入力した場合、図2に示すような階層メニューの全パス
から、入力されたキーワードに最も適したパスを最適パ
スとして抽出し、これを表示装置2に表示する。図2の
例では、Aが第1順位の最適パス、Bが第2順位の最適
パスを示している。以下、最適パスの抽出方法について
説明する。
【0016】図3は、本実施形態の情報検索支援プログ
ラムのフローチャートである。まず、入力装置1および
ユーザインタフェース4を介してキーワード、例えば
「パソコン」、「本」が入力されると(S1)、概念変
換部5は、入力された「キーワード」を、「そのキーワ
ードを示す概念」に拡張する(S2)。すなわち、概念
変換部5には、図4に示すような概念辞書が備えられて
いる。概念辞書には、例えば、「インターネット」とい
うキーワードに対して「インターネット 1.0/パソコン
0.9/通信 0.8/電話 0.8/携帯 0.8/Eメール 0.9/…」の
ような概念のワードベクトルが登録され、「エンターテ
インメント」というキーワードに対して「エンターテイ
ンメント 1.0/エンターテイメント 1.0/遊び 0.8/娯楽
0.8/…」のような概念のワードベクトルが登録されてい
る。ここで、各概念の後ろに付された0.0〜1.0の数値
は、キーワードと概念の関連の深さを示すスコアであ
る。このような概念辞書は、CFS(Conceptual Fuzzy
Sets:概念ファジィ集合)の概念体系により適宜作成
することができる。
【0017】図5は、1又は複数のキーワードから1つ
の概念のベクトルを生成するためのスコアテーブルを示
す図である。スコアテーブルには、概念辞書に登録され
た各キーワードA,B,C,…に対して概念a,b,
c,…のスコアのベクトルが登録されている。キーワー
ドA,B,C,…と概念a,b,c,…とは、同一のワ
ードの集合でも良いし、異なるワードの集合でも良い。
例えばキーワードAと概念aとがたまたま同じワードで
ある場合、両者の関連を示すスコアは当然ながら最高値
である1.0を示す。キーワード「A」が入力された場合
には、1段目のベクトルV1(1.0,0.3,0.1,…)が
そのままキーワードを表す概念のベクトル出力となる。
また、図示のように複数のキーワード「A」、「C」が
入力された場合には、各キーワード「A」、「C」に対
応したベクトルV1,V2の対応する概念a,b,c,
…のスコアのうち数値の高いほうのスコアが採用されて
出力ベクトルVoが構成される。これにより、1つでも
キーワードと関連性の高い概念のスコアを高い値に維持
しておくことができる。なお、出力ベクトルVoの合成
法としては、この方法に限らず、例えば合成するスコア
の加算平均をとるようにすることも考えられる。図6
は、「パソコン」、「本」というキーワードに対して生
成された概念のベクトルの例を示している。
【0018】一方、パスデータベース3には、図2に示
した階層メニューの全パスについて上記と同様の方法で
作成された概念のベクトルが記憶されている。この場
合、パスを構成する「芸術と人文」、「ビジネスと経
済」、…のような分類項目をそれぞれキーワードとして
概念のベクトルへの拡張を行う。但し、階層メニューの
場合、上位の階層よりも下位の階層の分類項目の方が、
よりキーワードとの関連性が高いということが言えるの
で、例えば
【0019】ビジネスと経済(*1/5)>企業(*2/5)>本(*
3/5)>書店(*4/5)>コンピュータ(*5/5)
【0020】のように、各分類項目に重みを待たせ、こ
れら重みを各概念のスコアに乗算することにより、更に
精度の高い検索が可能になる。図7は、「ビジネスと経
済>企業>本>コンピュータ」のパスから拡張された概
念のベクトルの一例を示す図、図8は、「コンピュータ
とインターネット>企業>本」のパスから拡張された概
念のベクトルの一例を示している。
【0021】このようにして拡張されたキーワードを表
す概念とパスを表す概念とは、マッチング部6において
マッチング処理される(S3)。マッチング処理は、両
ベクトルの内積をマッチング度として求め、得られたマ
ッチング度が高い順に全パスをソートし、マッチング度
が高いほうから例えば2つのパスを選択する(S4)。
図2のA,Bは、このようにして選択された2つの最適
パスを示している。従って、この2つの最適パスを表示
装置2に表示させる(S5)ことにより、最も適切なパ
スの周辺から探索を開始させることができる。
【0022】なお、上記実施形態では、キーワードとパ
スの両方を概念のベクトルに拡張した後に両者のマッチ
ング度を求めたが、いずれか一方のみを概念のベクトル
に拡張しても良いし、また両方とも拡張せずに、そのま
まマッチング度を求めるようにしてもよい。
【0023】
【発明の効果】以上述べたように本発明によれば、検索
対象となる情報を検索するためのキーワードを入力し、
このキーワードと階層メニューのパスとのマッチング度
を計算して、求められたマッチング度に基づいて最適パ
スを決定し、この最適パスを表示するようにしているの
で、表示された最適パスを辿っていけば、キーワードを
含む情報及びそれに関連する情報を効率よく探索するこ
とができるという効果を奏する。
【図面の簡単な説明】
【図1】 本発明の一実施形態に係る情報検索支援シス
テムの構成を示すブロック図である。
【図2】 同システムで探索の対象とする階層メニュー
のパスの例を示す図である。
【図3】 同システムを実現する情報検索支援プログラ
ムの処理を示すフローチャートである。
【図4】 同システムにおける概念変換部で使用される
概念辞書の一例を示す図である。
【図5】 同概念辞書を用いたキーワードの拡張変換の
例を示す図である。
【図6】 キーワードの拡張結果の一例を示す図であ
る。
【図7】 パスの拡張結果の一例を示す図である。
【図8】 パスの拡張結果の他の例を示す図である。
【符号の説明】
1…入力装置 2…表示装置 3…パスデータベース 4…ユーザインタフェース 5…概念変換部 6…マッチング部

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 検索対象となる情報を分類するための分
    類項目を階層メニューのパスとして記憶すると共に、前
    記階層メニューのパスを表示することにより、前記階層
    メニューのパスから前記検索対象となる情報の探索を可
    能にする情報検索支援システムにおいて、 前記検索対象となる情報を検索するためのキーワードを
    入力する入力手段と、 前記階層メニューのパスを記憶するパスデータ記憶手段
    と、 前記入力されたキーワードと前記パスデータ記憶手段に
    記憶された階層メニューのパスとのマッチング度を求め
    ると共に求められたマッチング度に基づいて最適パスを
    決定するマッチング手段と、 このマッチング手段で決定された最適パスを前記階層メ
    ニューのパスとして表示する表示手段とを備えてなるこ
    とを特徴とする情報検索支援システム。
  2. 【請求項2】 前記入力されたキーワードから当該キー
    ワードを表す概念のベクトルを出力する概念変換手段を
    更に備え、 前記パスデータ記憶手段は、前記階層メニューの全ての
    パスに対して、各パスを表す概念のベクトルを記憶した
    ものであり、 前記マッチング手段は、前記キーワードを表す概念のベ
    クトルと前記パスを表す概念のベクトルとの内積をマッ
    チング度として算出するものであることを特徴とする請
    求項1記載の情報検索支援システム。
  3. 【請求項3】 前記キーワードを表す概念のベクトル
    は、当該キーワードと概念との関連の深さを各概念毎に
    スコアで示すベクトルであることを特徴とする請求項2
    記載の情報検索支援システム。
  4. 【請求項4】 前記概念変換手段は、複数のキーワード
    が入力されたときに各キーワードを表す概念のベクトル
    の同一概念のスコアのうち大きい方のスコアを選択する
    ことにより、前記複数のキーワードを表す概念のベクト
    ルを算出し出力するものであることを特徴とする請求項
    3記載の情報検索支援システム。
  5. 【請求項5】 前記パスを表す概念のベクトルは、当該
    パスを構成する各分類項目を表す概念のベクトルを全分
    類項目について合成したベクトルであり、前記各分類項
    目を表すベクトルは、当該分類項目と概念との関連の深
    さを各概念毎にスコアで示すベクトルであることを特徴
    とする請求項2〜4のいずれか1項記載の情報検索支援
    システム。
  6. 【請求項6】 前記パスを表す概念のベクトルは、当該
    パスを構成する各分類項目を表す概念のベクトルの同一
    概念のスコアのうち大きい方のスコアを選択することに
    より、前記各分類項目を表すベクトルを全分類項目につ
    いて合成したものであることを特徴とする請求項5記載
    の情報検索支援システム。
  7. 【請求項7】 前記パスを表す概念のベクトルは、当該
    パスを構成する各分類項目を表す概念のベクトルを、前
    記階層メニューの下位の分類項目ほど大きな重みを与え
    て全分類項目について合成したものであることを特徴と
    する請求項5記載の情報検索支援システム。
  8. 【請求項8】 前記マッチング手段は、算出されたマッ
    チング度が高い順から所定数のパスのみを最適パスとし
    て出力するものであることを特徴とする請求項1〜7の
    いずれか1項記載の情報検索支援システム。
  9. 【請求項9】 検索対象となる情報を分類するための分
    類項目を階層メニューのパスとして記憶すると共に、前
    記階層メニューのパスを表示することにより、前記階層
    メニューのパスから前記検索対象となる情報の探索を可
    能にする情報検索支援プログラムであって、 前記検索対象となる情報を検索するためのキーワードを
    入力するステップと、 この入力されたキーワードと前記記憶された階層メニュ
    ーのパスとのマッチング度を求めると共に求められたマ
    ッチング度に基づいて最適パスを決定するステップと、 決定された最適パスを前記階層メニューのパスとして表
    示するステップとをコンピュータに実行させるように構
    成された情報検索支援プログラム。
JP2002140440A 2002-05-15 2002-05-15 情報検索支援システムおよびプログラム Pending JP2003330952A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002140440A JP2003330952A (ja) 2002-05-15 2002-05-15 情報検索支援システムおよびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002140440A JP2003330952A (ja) 2002-05-15 2002-05-15 情報検索支援システムおよびプログラム

Publications (1)

Publication Number Publication Date
JP2003330952A true JP2003330952A (ja) 2003-11-21

Family

ID=29701326

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002140440A Pending JP2003330952A (ja) 2002-05-15 2002-05-15 情報検索支援システムおよびプログラム

Country Status (1)

Country Link
JP (1) JP2003330952A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006106962A (ja) * 2004-10-01 2006-04-20 Ntt Docomo Inc インタラクション制御システムおよび端末装置並びにインタラクション制御方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006106962A (ja) * 2004-10-01 2006-04-20 Ntt Docomo Inc インタラクション制御システムおよび端末装置並びにインタラクション制御方法
JP4489552B2 (ja) * 2004-10-01 2010-06-23 株式会社エヌ・ティ・ティ・ドコモ システムおよび端末装置並び方法

Similar Documents

Publication Publication Date Title
JP3347088B2 (ja) 関連情報検索方法およびシステム
US8356041B2 (en) Phrase builder
US7769752B1 (en) Method and system for updating display of a hierarchy of categories for a document repository
US20050165819A1 (en) Document tabulation method and apparatus and medium for storing computer program therefor
US20120323905A1 (en) Ranking data utilizing attributes associated with semantic sub-keys
US20110119261A1 (en) Searching using semantic keys
US20120317141A1 (en) System and method for ordering of semantic sub-keys
JP3024045B2 (ja) 自然言語に基づくデータ検索装置
JP2004178421A (ja) 文書検索装置、文書検索方法、プログラムおよび記録媒体
US9875298B2 (en) Automatic generation of a search query
JP2006178599A (ja) 文書検索装置および方法
JP2010092357A (ja) 施設関連情報検索方法および施設関連情報検索システム
JP3930168B2 (ja) 文書検索方法、装置および文書検索プログラムを記録した記録媒体
JP5050599B2 (ja) 情報検索システム、情報検索装置、情報検索方法、及びそのプログラム。
JP2012141681A (ja) クエリセグメント位置決定装置
JP2003330952A (ja) 情報検索支援システムおよびプログラム
US20120317103A1 (en) Ranking data utilizing multiple semantic keys in a search query
JPH0581326A (ja) データベース検索装置
JP3162907B2 (ja) 文書データ検索装置
JP2018073309A (ja) 文書検索方法及び装置
CN112100399B (zh) 基于知识体系的知识图谱模型的创建方法及图谱检索方法
JP3444223B2 (ja) データベース登録装置
JP2001134584A (ja) 類似データの検索方法,検索装置および類似データ検索プログラム記録媒体
JP2003178057A (ja) フレーズ生成装置、フレーズ生成方法、及びプログラム
JP7309669B2 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム