JP2002373174A - 情報検索システムおよび情報検索プログラム - Google Patents

情報検索システムおよび情報検索プログラム

Info

Publication number
JP2002373174A
JP2002373174A JP2001182122A JP2001182122A JP2002373174A JP 2002373174 A JP2002373174 A JP 2002373174A JP 2001182122 A JP2001182122 A JP 2001182122A JP 2001182122 A JP2001182122 A JP 2001182122A JP 2002373174 A JP2002373174 A JP 2002373174A
Authority
JP
Japan
Prior art keywords
search
keyword
components
information
search result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001182122A
Other languages
English (en)
Inventor
Tetsuji Miyazaki
哲司 宮崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2001182122A priority Critical patent/JP2002373174A/ja
Publication of JP2002373174A publication Critical patent/JP2002373174A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 インターネットの初心者であっても、必要と
する情報のありかを短時間のうちに容易に知ることので
きる情報検索システムを提供すること。 【解決手段】 センテンスとして入力されたキーワード
をキーワード分析手段6で構文解析することによって主
要な構成要素と他の構成要素とに分割し、まず、最初の
段階で主要な構成要素のみをキーワードとして検索手段
7による検索を実行して検索対象とする母集合を求めて
検索結果一覧テーブル11に一時記憶する。その後、検
索結果を絞り込むためのキーワードの一部を構成する他
の構成要素およびこれに代替可能な置換可能要素を用い
て母集合の範囲内で検索を実行することで、大容量のイ
ンデックス10が再検索される無駄をなくし、詳細な検
索条件を利用したキーワード検索を短時間で実施できる
ようにする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報検索システム
および情報検索プログラムの改良、特に、目的とする情
報を短時間で容易に取得するための改良に関する。
【0002】
【従来の技術】家庭へのパーソナルコンピュータの普及
に伴ってインターネットの利用者の数も順調に伸びてき
ている。インターネットを利用することにより世界中の
情報にアクセスできるようになったが、その反面、本当
に必要な情報を探すのも大変になってしまった。
【0003】
【発明が解決しようとする課題】現在の情報検索システ
ムおよび情報検索プログラムであっても、熟練者が使用
すれば必要な情報に簡単にアクセスすることができる。
しかし、初心者の場合には、必要とする情報を代表する
キーワードを的確に設定して検索を行ったつもりでも、
実際に表示される検索結果が多過ぎて、目的とする情報
を取得するのに手間取るといったケースが多い。
【0004】このような問題を解消するため、目的語や
述語からなる簡単なセンテンスを利用して情報検索を行
うシステムが、例えば、特開平5−81326号公報,
特開平5−108721号公報,特開平6−12451
号公報等として既に提案されている。しかし、これらの
ものは、基本的に、センテンスを構成する構成要素の全
てをアンド条件として検索を行う構成であるため、検索
結果が思わしくないような場合には、改めてセンテンス
を構成し直して最初から検索作業を実行しなければなら
ず、特に、インターネットのように情報が過多である環
境下では、検索が完了するまでの所要時間が非常に長く
なってしまうといった問題が生じる可能性がある。
【0005】
【発明の目的】そこで、本発明の目的は、前記従来技術
の欠点を解消し、インターネットの初心者であっても、
必要とする情報のありかを短時間のうちに容易に知るこ
とのできる情報検索システムおよび情報検索プログラム
を提供することにある。
【0006】
【課題を解決するための手段】本発明の情報検索システ
ムは、情報のありかとキーワードとを対応させて記憶し
たインデックスを利用し、入力されたキーワードに対応
する情報のありかを検索して提示する情報検索システム
であり、前記目的を達成するため、特に、センテンスと
して入力されたキーワードを構文解析して主要な構成要
素と他の構成要素とに分割するキーワード分析手段と、
前記主要な構成要素のみをキーワードとして前記インデ
ックスを検索することにより検索対象の母集合となる検
索結果を求めて検索結果一覧テーブルに一時記憶させる
と共に、前記他の構成要素および該他の構成要素に代え
て利用することのできる幾つかの置換可能要素をキーワ
ードとして前記検索結果一覧テーブルを検索して前記検
索結果一覧テーブル内の検索結果をグループ化する検索
手段と、前記他の構成要素および前記幾つかの置換可能
要素の内から択一的に要素を選択するための入力手段
と、前記入力手段によって選択された要素に対応してグ
ループ化されている検索結果の一覧を提示する検索結果
確定手段とを備えたことを特徴とする構成を有する。
【0007】このような構成によれば、センテンスとし
て入力されたキーワードがキーワード分析手段によって
構文解析されて主要な構成要素と他の構成要素とに分割
され、まず、最初の段階で、主要な構成要素のみをキー
ワードとして検索手段による検索が行われ、その検索結
果が母集合として検索結果一覧テーブルに一時記憶され
る。その後、検索結果を絞り込むために、主要な構成要
素を除く他の構成要素および該他の構成要素に代えて利
用することのできる幾つかの置換可能要素を用いた検索
が前記検索手段によって行われ、その検索結果が、これ
らの他の構成要素および幾つかの置換可能要素に対応し
てグループ化される。この検索作業は、その検索範囲が
検索結果一覧テーブルに限定されるため、短時間で行う
ことが可能である。ユーザは、この情報検索システムに
設けられた入力手段を用いて、前記他の構成要素および
前記幾つかの置換可能要素の内から択一的に要素を選択
し、当該システムの検索結果確定手段に、選択した要素
を認識させる。これを受けた検索結果確定手段は、選択
された要素に対応してグループ化されている検索結果の
一覧をユーザに提示する。このように、センテンスから
なるキーワードの主要な構成要素を利用して所望する情
報が存在する可能性のある範囲を母集合として特定し、
更に、キーワードに含まれる他の構成要素、例えば、述
語や修飾語等を利用した絞り込みのための検索が行われ
るので、インターネットの初心者であっても、必要とす
る情報のありかを短時間のうちに容易に知ることができ
る。また、絞り込みによって適切な情報が得られなかっ
た場合には、再び前記他の構成要素あるいは前記幾つか
の置換可能要素の内から別の要素を選択して絞り込みを
行うことによって新たな情報の提示を求めることになる
が、この段階では既に前記他の構成要素および前記幾つ
かの置換可能要素に対応する検索結果のグループ化が完
了しているので、検索結果確定手段は、単に、ユーザが
選択した要素に対応するグループの検索結果を検索結果
一覧テーブルから読み込んで提示するだけでよく、実質
的な検索処理は不要である。従って、特に、適切な情報
が得られずに何回も絞り込みの操作を繰り返し実行する
ような状況下において、絞り込みの都度インデックス全
体を最初から再検索する従来の情報検索システムに比
べ、極めて高速の処理が可能である。更に、絞り込みの
操作に適したキーワードが置換可能要素としてシステム
の側から自動的に提供されるので、検索作業に不慣れな
ユーザであっても検索システムを容易に使いこなすこと
ができる。
【0008】前述した置換可能要素は、前記検索手段に
併設された置換可能要素記憶手段内に前記他の構成要素
と対応させて記憶させることが可能である。
【0009】この場合、前記検索手段は、キーワード分
析手段によって分割された他の構成要素毎に置換可能要
素記憶手段を参照し、前記構成要素に代えて利用するこ
とのできる幾つかの置換可能要素を求めて検索結果一覧
テーブルを検索し、前記検索結果一覧テーブル内の検索
結果をグループ化する。
【0010】また、前記キーワード分析手段には、名詞
および固有名詞を主要な構成要素として認識する主要構
成要素認識機能を設けることができる。
【0011】一般に、センテンスとして入力されたキー
ワードに含まれる構成要素のうち、名詞および固有名詞
が最も端的に目的とする情報の属性を表すので、これら
のものをセンテンス中の主要な構成要素として認識する
のが妥当である。
【0012】更に、検索結果確定手段には、検索手段の
作動終了時に前記他の構成要素を自動的に選択する最適
検索結果提示機能を備えることが望ましい。
【0013】このような構成を適用すれば、グループ化
された複数の検索結果のうち、まず最初に、ユーザが指
定したセンテンスに含まれる構成要素に対応した検索結
果が提示されるので、高い確率で所望する情報のありか
を引き当てることが可能となる。
【0014】また、前記検索手段には、分割された前記
他の構成要素毎に検索優先度を判定し、検索優先度が高
い前記他の構成要素およびこの構成要素に代えて利用す
ることのできる幾つかの置換可能要素のみをキーワード
として前記検索結果一覧テーブルを検索して検索結果一
覧テーブル内の検索結果をグループ化する検索条件最適
化機能を設けることができる。
【0015】このような構成を適用することにより、セ
ンテンスとして入力されたキーワードのうち優先度の高
い構成要素とこの構成要素に関連する置換可能要素のみ
をキーワードとして検索およびグループ化の処理が行わ
れるので、無駄な検索作業の実行が未然に防止され、高
速な検索作業が達成される。
【0016】また、前記入力手段には、前記他の構成要
素および前記幾つかの置換可能要素を並列してモニタ上
に表示する選択可能要素一括表示機能を配備することが
できる。
【0017】グループ化による検索結果の絞り込みに利
用されたキーワードの一覧がユーザに明示されるので、
再検索のためのキーワードの設定に不慣れなユーザであ
っても検索システムを容易に使いこなすことができるよ
うになる。
【0018】本発明の情報検索プログラムは、情報のあ
りかとキーワードとを対応させて記憶したインデックス
を利用し、入力されたキーワードに対応する情報のあり
かを検索して提示する情報検索システムの主要部を構成
するコンピュータに設置される情報検索プログラムであ
り、前記目的を達成するため、特に、前記コンピュータ
にセンテンスとして入力されたキーワードを構文解析し
て主要な構成要素と他の構成要素とに分割するキーワー
ド分析機能と、前記主要な構成要素のみをキーワードと
して前記インデックスを検索することにより検索対象の
母集合となる検索結果を求めて検索結果一覧テーブルに
一時記憶させると共に、前記他の構成要素および該他の
構成要素に代えて利用することのできる幾つかの置換可
能要素をキーワードとして前記検索結果一覧テーブルを
検索して前記検索結果一覧テーブル内の検索結果をグル
ープ化する検索機能と、入力手段または情報伝達経路を
介して入力される指令に応じて前記他の構成要素および
前記幾つかの置換可能要素の内から択一的に要素を選択
し、該選択した要素に対応してグループ化されている検
索結果の一覧を出力する検索結果確定機能とを備えたこ
とを特徴とする構成を有する。
【0019】このプログラムを設置することにより、通
常のコンピュータを情報検索システムの主要部として利
用することが可能となる。その機能に関しては、既に述
べた通りである。
【0020】
【発明の実施の形態】以下、図面を参照して本発明の実
施形態について詳細に説明する。図1は本発明を適用し
た一実施形態の情報検索システム1の主要部を簡略化し
て示した機能ブロック図である。
【0021】図1に示されるように、この情報検索シス
テム1は、概略において、データ処理装置2とキーボー
ド等の入力手段3、および、モニタあるいはプリンタ等
によって構成される出力装置4と、ハードディスクおよ
びRAM等からなる記憶装置5によって構成される。
【0022】このうち、データ処理装置2の部分は通常
のパーソナルコンピュータあるいはワークステーション
等のコンピュータによって構成されており、このコンピ
ュータに設置(インストール)された情報検索プログラ
ムとCPUとによって、キーワード分析手段6と検索手
段7および検索結果確定手段8の機能が達成される。
【0023】図1の例では入力手段3をキーボード、ま
た、出力装置4をモニタあるいはプリンタ等としている
が、入出力装置は、これらのものに限定される必要はな
く、データ処理装置2をウェブ上に設置して検索サーバ
として利用するような場合においては、末端のユーザが
操作する別のパーソナルコンピュータのキーボードやマ
ウスがインターネット等の情報伝達経路を介して実質的
な入力手段3として利用され、また、末端のユーザが操
作する別のパーソナルコンピュータのモニタがインター
ネット等の情報伝達経路を介して実質的な出力装置4と
して利用されることになる。
【0024】記憶装置5には、データ処理装置2が構文
解析に際して試用する辞書を格納した辞書記憶部9と、
情報のありかをキーワードに対応させて記憶したインデ
ックス10、および、検索結果を記憶するための検索結
果一覧テーブル11(RAM内)と、各種の単語(述
語,修飾語等)とこれに置き換えて利用することができ
る同種の単語とを対応させて記憶した置換可能要素記憶
部12とが設けられている。
【0025】インデックス10には、データ処理装置2
あるいは他の情報収集用コンピュータが通常の処理の空
き時間を利用してウェブ上で実行するロボット検索等の
情報収集処理によって、莫大な数のデータ、たとえば、
ウェブ上のURLの値等がキーワードに関連付けて記憶
されている。
【0026】図7は、置換可能要素記憶部12に記憶さ
れた置き換え可能な単語(置換可能要素)の一例を示す
概念図であり、この例では、例えば、述語の一種である
「見る」,「する」,「買う」が相互に置き換え可能な単語と
して定義され、また、修飾語の一種である「今日」,「明
日」,「あさって」が相互に置き換え可能な単語として定
義されている。
【0027】置き換え可能な単語の定義は、日本語の文
法を満たすように設定してもよいし、また、その他の事
情を考慮して必ずしも日本語の文法にはとらわれずに設
定しても構わない。
【0028】次に、データ処理装置2のCPUが実行す
る情報検索処理(情報検索プログラム)の内容を示した
図2〜図5のフローチャートを参照してキーワード分析
手段6,検索手段7,検索結果確定手段8等の機能につ
いて詳細に説明する。
【0029】まず、センテンスからなるキーワードを入
力してユーザがデータ処理装置2に検索処理を命じる
と、キーワード分析手段6としてのCPUは、この入力
操作をステップs1の判定処理によって検出する。
【0030】この実施形態では、一例として、「今日、
サッカーを見る」というキーワードが入力された場合を
例にとって説明するものとする。
【0031】キーワードの入力を検知したCPUは、次
いで、辞書記憶部9を参照して、このセンテンスを構文
解析し、構成要素の単位にまで分割する(ステップs
2)。構文解析自体については既に公知であるので説明
を省略する。
【0032】この構文解析の結果、「今日、サッカーを
見る」のセンテンスは、図8のs2,s3に示されるよ
うに、「今日/、/サッカー/を/見る」という5つの構
成要素に分割されることになる。
【0033】次いで、キーワード分析手段6としてのC
PUは、これらの構成要素の配列状態をテンプレートに
記憶し(ステップs3)、更に、予め設定された検索優
先度に従って、これらの構成要素の並べ替えを実行する
(ステップs4)。
【0034】図6は本実施形態において適用した検索優
先度について説明した概念図である。図6に示されるよ
うに、この実施形態では、「名詞と固有名詞」,「述語」,
「修飾語」,・・・,「助詞」,・・・,「句読点」といった
順で検索優先度が決められており、最も検索優先度の高
い「名詞と固有名詞」が自動的に主要な構成要素として認
識され(主要構成要素認識機能)、また、「名詞と固有
名詞」を除いたものが自動的に他の構成要素として認識
される。また、このうち、「助詞」と「助詞」よりも検索優
先度の低いものが実質的に検索の必要のない他の構成要
素として認識されるようになっている。以上は一例であ
って、例えば、修飾語を更に形容詞と副詞とに分類して
検索優先度を設定するといったことも技術的には可能で
ある。
【0035】この実施形態においては、図6の検索優先
度に従って、「今日/、/サッカー/を/見る」の配列
が、図8のs4に示されるように「サッカー/見る/今
日/を/、」の順に並べ替えられることになる。
【0036】次いで、CPUは、分割された構成要素の
数を構成要素数記憶レジスタnに記憶し(ステップs
5)、構成要素選択指標iに初期値1を設定する(ステ
ップs6)。この場合、図8のs4に示されるようにn
の値は5である。
【0037】そして、CPUは、構成要素選択指標iの
現在値に基き、並べ替え実行後の配列から第i番目の構
成要素を読み込み(ステップs7)、この構成要素が検
索対象外のものであるか否か、要するに、「助詞」または
「助詞」よりも検索優先度の低いものであるか否かを判定
する(ステップs8)。
【0038】この段階ではi=1であり、最初に読み込
まれるのは「名詞」からなる主要な構成要素「サッカー」で
あるから、ステップs8の判定結果は偽となる。
【0039】よって、CPUは、構成要素選択指標iの
値を1インクリメントし(ステップs9)、該指標iの
現在値が構成要素の数nを越えているか否かを判定する
(ステップs10)。
【0040】この例では、i=2,n=5であるからス
テップs10の判定結果は偽となり、CPUは、再び該
指標iの現在値に基き、前記と同様にして、並べ替え実
行後の配列から第i番目の構成要素を読み込む(ステッ
プs7)。
【0041】ここで読み込まれるのは「述語」からなる
「見る」であり、その検索優先度は「助詞」よりも高い。従
って、その後の処理結果に関しては前記と同様である。
【0042】このようにして、順次インクリメントされ
る構成要素選択指標iの値に基いて、更に、「修飾語」か
らなる「今日」と、「助詞」からなる「を」がステップs7の
処理で繰り返して読み込まれ、その時点における構成要
素選択指標iの値は、図8のs6〜s10で示されると
おり4となる。
【0043】「助詞」である「を」が読み込まれた段階でス
テップs8の判定結果は真となり、CPUは、構成要素
選択指標iの値を1ディクリメントして、この値を構成
要素数記憶レジスタnに更新して記憶する(ステップs
11)。図8のs6〜s10で示されるとおり、構成要
素選択指標iの現在値は4であるから、nの値は、図8
のs11に示されるとおり3となる。
【0044】以上に述べたようにしてステップs7〜ス
テップs10の処理を繰り返し実行することにより、実
際に検索の対象とする必要のある構成要素が、並べ替え
実行後の配列の先頭から何番目までに位置しているかが
求められる。これが、本実施形態における検索条件最適
化機能の主要部である。図8のs6〜s10およびs1
1に示されるように、「助詞」または「助詞」よりも検索優
先度の低い構成要素が検出されたときの構成要素選択指
標iの値から1を減じた値が、実際に検索の対象とする
必要のある構成要素の数であり、この例では、その値は
n=3である。
【0045】なお、このような処理を繰り返す間にステ
ップs10の判定結果が真となった場合、つまり、全て
の構成要素が検索の必要のある対象として判定された場
合には、最初にステップs5の処理で設定されたnの値
には何らの変更操作も加えられないので、構成要素の数
それ自体が検索の必要の有る要素数として認識されるこ
とになる。
【0046】次いで、CPUは、構成要素選択指標iの
値を再び1に初期化し(ステップs12)、構成要素選
択指標iの現在値に基いて、並べ替え実行後の配列から
第i番目の構成要素を読み込み(ステップs13)、構
成要素選択指標iの現在値が1であるか否か、つまり、
現時点で読み込まれている構成要素が最も検索優先度の
高い「名詞または固有名詞」、要するに、主要な構成要素
であるか否かを判定する(ステップs14)。
【0047】この段階ではi=1であり、読み込まれる
のは「名詞」からなる「サッカー」であるから、主要構成要
素認識機能実現手段としてのCPUは、「サッカー」を主
要な構成要素として認識し、更に、検索手段7としての
CPUが、主要な構成要素である「サッカー」のみをキー
ワードとしてインデックス10の全領域を検索する(ス
テップs15)。
【0048】次いで、検索手段7としてのCPUは、
「サッカー」をキーワードとする情報のありかがインデッ
クス10に登録されているか否かを判定し(ステップs
16)、検索結果が存在しない場合には、出力装置4に
エラーを出力して検索が失敗したことをユーザに知らせ
(ステップs36)、この情報検索処理を終了する。
【0049】一方、主要な構成要素である「サッカー」を
キーワードとする情報のありかがインデックス10に登
録されている場合には、検索手段7としてのCPUは、
その検索結果全体を検索結果一覧テーブル11に転送
し、検索対象の母集合として一時記憶させる(ステップ
s17)。これ以降の検索作業は検索結果一覧テーブル
11(RAM)に記憶された母集合に対してのみ行われ
ることになるので、インデックス10全体を検索する場
合と比べて遥かに高速である。
【0050】次いで、CPUは構成要素数記憶レジスタ
nの値が1であるか否かを判定する(ステップs1
8)。
【0051】ステップs18の判定結果が真となった場
合には、最初にセンテンス入力されたキーワードが「名
詞または固有名詞」からなる主要な構成要素のみによっ
て構成されているか、あるいは、主要な構成要素を除く
他の構成要素の全ての検索優先度が「助詞」よりも低く、
主要な構成要素を除く他の構成要素に関連する検索処理
が不要であることを意味するので、これ以上の検索処理
を行っても意味が無い。
【0052】従って、この場合、検索結果確定手段8と
してのCPUは、検索結果一覧テーブル11に一時記憶
された全ての検索結果を出力装置4に出力してユーザに
提示し(ステップs37)、この情報検索処理を終了す
る。
【0053】また、ステップs18の判定結果が偽とな
った場合には、主要な構成要素を除く他の構成要素が存
在し、しかも、そのうち1つ以上のものが検索の対象と
する必要のある構成要素であことを意味するので、CP
Uは、更に、構成要素選択指標iの値を1インクリメン
トし(ステップs19)、該指標iの現在値に基いて、
前記と同様にして、並べ替え実行後の配列から第i番目
の構成要素を読み込む(ステップs13)。
【0054】i=2の現時点で読み込まれる構成要素は
「述語」からなる「見る」であるから、ステップs14の判
定結果は必然的に偽となる。
【0055】従って、検索手段7としてのCPUは、検
索を必要とする他の構成要素の1つである「見る」のみを
キーワードとして、ステップs17の処理で記憶された
全体の検索結果、つまり、検索結果一覧テーブル11
(RAM)の母集合のみを検索する(ステップs2
0)。
【0056】次いで、CPUは、「見る」をキーワードと
する情報のありかが検索結果一覧テーブル11に記憶さ
れているか否かを判定し(ステップs21)、検索結果
が存在すれば、検索条件最適化機能実現手段としてのC
PUは、並べ替え実行後の配列における第i番目の構成
要素に置き換えて利用することができる同種の単語(置
換可能要素)を図7の置換可能要素記憶部12から求
め、その単語を第i番目の構成要素と共に記憶する(ス
テップs22)。
【0057】ここでは構成要素選択指標i=2の値に応
じて「見る」が選択されているので、図7の置換可能要素
記憶部12を参照して、「する」という単語と「買う」とい
う単語が一時記憶されることになる。
【0058】次いで、CPUは、構成要素選択指標iの
値を1インクリメントし(ステップs23)、該指標i
の値が構成要素数記憶レジスタnの値を超えているか、
つまり、検索の対象となる他の構成要素が未だ残ってい
るか否かを判定する(ステップs24)。
【0059】この段階では構成要素選択指標iの現在値
は3であり、構成要素数記憶レジスタnの値である3を
越えてはいないので、CPUは、構成要素選択指標iの
値に基いて、再び、並べ替え実行後の配列からi=3番
目の構成要素、つまり、「修飾語」である「今日」を読み込
み(ステップs13)、ステップs14の判定処理を実
行した後、検索を必要とする他の構成要素の1つである
「今日」のみをキーワードとして、検索結果一覧テーブル
11(RAM)の母集合のみを検索する(ステップs2
0)。
【0060】次いで、CPUは、「今日」をキーワードと
する情報のありかが検索結果一覧テーブル11に記憶さ
れているか否かを判定し(ステップs21)、検索結果
が存在すれば、検索条件最適化機能実現手段としてのC
PUは、並べ替え実行後の配列における第i番目の構成
要素に置き換えて利用することができる同種の単語(置
換可能要素)を図7の置換可能要素記憶部12から求
め、その単語を第i番目の構成要素と共に記憶する(ス
テップs22)。
【0061】ここでは構成要素選択指標i=3の値に応
じて「今日」が選択されているので、図7の置換可能要素
記憶部12を参照して、「明日」という単語と「あさって」
と言う単語が一時記憶されることになる。
【0062】次いで、CPUは、構成要素選択指標iの
値を1インクリメントし(ステップs23)、該指標i
の値が構成要素数記憶レジスタnの値を超えているか、
要するに、検索の対象となる他の構成要素が未だ残って
いるか否かを判定する(ステップs24)。
【0063】この段階では構成要素選択指標iの現在値
は4であり、構成要素数記憶レジスタnの値である3を
越えているので、CPUは、構成要素選択指標iに構成
要素数記憶レジスタnの値を再設定して、構成要素選択
指標iの値を検索結果が存在する構成要素の数、言い換
えれば、検索結果の表示が可能な構成要素の数に合わせ
る(ステップs26)。
【0064】一方、このような処理を繰り返し実行する
間にステップs21の判定結果が偽となった場合には、
並べ替え実行後の配列の第i番目から読み込まれた構成
要素に対応する検索結果が存在しないことを意味する。
この場合、CPUは、指標iの現在値から1を減じ、そ
の値を構成要素選択指標iに再設定して、構成要素選択
指標iの値を検索結果が存在する構成要素の数に合わせ
る(ステップs25)。仮に、第3番目の構成要素であ
る「今日」に対応する検索結果が存在しなかったとすれ
ば、3−1=2であり、検索結果が存在する構成要素は
2つのみとなる。
【0065】次いで、検索手段7としてのCPUは、並
べ替え実行後の配列における第2番目の構成要素および
これに対応して記憶された置換可能な同種の単語と、並
べ替え実行後の配列における第3番目の構成要素および
これに対応して記憶された置換可能な同種の単語と、・
・・、並べ替え実行後の配列における第i番目の構成要
素およびこれに対応して記憶された置換可能な同種の単
語との組み合わせによって生成される全てのキーワード
を用いて検索結果一覧テーブル11(RAM)に記憶さ
れた母集合に対して検索処理を実行し、キーワード毎に
検索結果をグループ化する(ステップs27)。
【0066】従って、この例では、第2番目の構成要素
およびこれに対応して記憶された置換可能な同種の単語
である「見る」,「する」,「買う」と、第i=3番目の構成
要素およびこれに対応して記憶された置換可能な同種の
単語である「今日」,「明日」,「あさって」との組み合わせ
により、図9および図10に示されるように3×3=9
種のキーワードが生成され、検索結果一覧テーブル11
(RAM)の内容がキーワード毎に9種のグループに分
けられることになる。但し、検索結果一覧テーブル11
の内容は既に「サッカー」を含むものに限定されているの
で、ここでいうキーワードには、全てのキーワードに共
通する並べ替え実行後の配列上における第1番目の構成
要素(主要な構成要素)である「サッカー」は含まれな
い。
【0067】次いで、CPUは、並べ替え実行後の配列
上における第2番目から第i番目に至る構成要素を選択
可能な状態として、各構成要素の各々を、ステップs3
で記憶したテンプレートに沿って、並べ替え実行前の位
置でモニタ等の出力装置4に表示し(ステップs2
8)、まず最初に、最適検索結果提示機能実現手段とし
てのCPUが、並べ替え実行後の配列における第2番目
の構成要素と、並べ替え実行後の配列における第3番目
の構成要素と、・・・、第i番目の構成要素とによって
生成されたキーワード、つまり、最初にユーザがセンテ
ンス入力したキーワードに相当するグループの検索結果
を出力装置4に表示する(ステップs29)。
【0068】図11は出力装置4上での表示状態の一例
を示した概念図である。このように、出力装置4上に
は、前述した検索処理の要不要とは関係なく、構成要素
の全てが、ステップs3で記憶したテンプレートに沿っ
て「今日/、/サッカー/を/見る」の順序で表示され、
このうち、並べ替え実行後の配列における第2番目〜第
i=3番目(但し、iの値は最終値)までの構成要素で
ある「見る」と「今日」の部分が他の単語と選択的に置き換
え可能とされる。
【0069】ここで、仮に、「今日」に対応する検索結果
が存在していなかったとするなら、iの値は2となるか
ら、「見る」の構成要素のみが選択可能な状態で表示され
ることになる。
【0070】次いで、CPUは、選択可能な構成要素に
対してユーザによるマウスクリック操作等が行われるか
(ステップs30)、あるいは、ユーザからの検索終了
指令が入力されるのを待つ待機状態に入る(ステップs
35)。
【0071】そして、選択可能な構成要素に対して入力
手段3を介してマウスクリック操作等が行われた場合に
は(ステップs30)、選択可能要素一括表示機能実現
手段としてのCPUが、選択された構成要素に対応する
置き換え可能な単語(置換可能要素)の情報を内包した
ポップアップメニューを表示して(ステップs31)、
ユーザからの選択操作を待機する(ステップs32)。
【0072】図12は、図11に示されるような出力装
置4の表示状態において、ユーザが構成要素「見る」をク
リックした場合の画面変化の一例を示した概念図であ
る。この場合、「見る」に対応して記憶された置き換え可
能な単語(置換可能要素)である「する」と「買う」がポッ
プアップメニュー上に並列して一括表示され、選択可能
な要素としてユーザに提示されることになる。
【0073】ついで、ユーザが入力手段3を介してマウ
スクリック操作等を実行し、置き換え可能な単語の何れ
かを選択すると(ステップs32)、CPUは、新たに
選択された置き換え可能な単語(置換可能要素)を当該
ポップアップメニューの基部位置に書き替えて表示し
(ステップs33)、検索結果確定手段8としてのCP
Uが、現時点で出力装置4に表示されている要素の組み
合わせキーワードに対応してグループ化されている検索
結果の内容を出力装置4に表示してユーザに提示する
(ステップs34)。
【0074】図13は、図12に示されるような出力装
置4の表示状態において、ユーザが要素「する」をクリッ
クした場合の画面変化の一例を示した概念図である。こ
の場合、構成要素「見る」に代えて置き換え可能な単語
(置換可能要素)「する」が選択されることになるので、
それまでユーザに提示されていた「サッカー/見る/今
日」(今日、サッカーを見る)に対応するグループの検
索結果に代えて、「サッカー/する/今日」(今日、サッ
カーをする)に対応するグループの検索結果が更新して
表示されることになる。
【0075】その後、CPUは、再び、選択可能な構成
要素に対するマウスクリック操作、あるいは、検索終了
指令の入力を待つ待機状態に戻る(ステップs30,ス
テップs35)。
【0076】そして、ユーザが入力手段3を介して再び
マウスクリック操作等を実行すると、CPUは、前記と
同様の処理を繰り返し実行し、改めて生成された要素の
組み合わせキーワードに対応してグループ分けされてい
る検索結果の内容を出力装置4に表示してユーザに提示
する。
【0077】このように、要素の組み合わせによるキー
ワードの変更は何度でも可能であり、その都度、このキ
ーワードに対応するグループの検索結果が表示されるこ
とになるが、検索結果のグループ分けに関連した処理は
既にステップs27の時点で完了しており、ステップs
30〜ステップs35に至る再検索処理では、単に、グ
ループ化された検索結果の内容を表示するだけでよいの
で、再検索および再表示に関連する処理は極めて短時間
で行うことができる。
【0078】しかも、絞り込みの検索に利用するための
キーワード(要素)はポップアップメニューによって一
括してユーザに提示されるので、検索結果の絞り込みに
使用するキーワードの設定に不慣れなユーザであって
も、絞り込みを利用した検索を容易に実行することがで
きる。
【0079】最終的に、ユーザが入力手段3を介して検
索終了指令を入力した段階で(ステップs35)、この
情報検索処理は終了する。
【0080】
【発明の効果】本発明の情報検索システムおよび情報検
索プログラムは、センテンスとして入力されたキーワー
ドをキーワード分析手段で構文解析することによって主
要な構成要素と他の構成要素とに分割し、まず、最初の
段階で主要な構成要素のみをキーワードとして検索手段
による検索を実行して検索対象とする母集合を求めて検
索結果一覧テーブルに一時記憶し、その後、検索結果を
絞り込むためのキーワードの一部を構成する他の構成要
素およびこれに代替可能な置換可能要素を用いて母集合
の範囲内で検索を実行するようにしているので、検索結
果の絞り込みを行う際に大容量のインデックスが再検索
されることはなく、詳細な検索条件を利用したキーワー
ド検索を短時間のうちに実施することができる。また、
検索結果を絞り込むためのキーワードとなる他の構成要
素およびこれに代替可能な置換可能要素に関連する検索
結果は検索処理によって予めグループ化され、その後、
他の構成要素および置換可能要素の組み合わせを利用し
たキーワードでグループを選択することによって自由に
検索結果を読み出すことができるので、重複した再検索
作業を何度も行う必要がなく、所望するキーワードに対
応する情報のありかを短時間のうちに知ることができ
る。しかも、絞り込みの操作に適したキーワードが置換
可能要素としてシステムの側から自動的に提供されるの
で、検索作業に不慣れなユーザであっても検索システム
を容易に使いこなすことができる。
【0081】更に、検索手段の作動終了時にはユーザが
センテンス入力したキーワードと同等の構成要素の組み
合わせに対応した検索結果が最初に提示されるので、高
い確率で所望する情報のありかを引き当てることが可能
である。
【0082】また、分割された他の構成要素毎に検索優
先度を判定し、検索優先度が高い他の構成要素およびこ
れに対応する置換可能要素のみをキーワードとして検索
結果をグループ化するようにしているので、絞り込み検
索に効果の少ない無意味な単語によるグループ化処理が
未然に禁止され、グループ化処理を含む全体の検索作業
の所要時間の短縮が実現される。
【0083】更に、グループ化による検索結果の絞り込
みに利用されたキーワードの一覧、つまり、他の構成要
素と幾つかの置換可能要素の一覧がユーザに明示される
構成であるため、再検索のためのキーワードの設定に不
慣れなユーザであっても、提示された単語を選択するだ
けの簡単な操作で検索システムを容易に使いこなすこと
ができる。
【図面の簡単な説明】
【図1】本発明を適用した一実施形態の情報検索システ
ムの主要部を簡略化して示した機能ブロック図である。
【図2】データ処理装置のCPUが実行する情報検索処
理の内容を示したフローチャートである。
【図3】データ処理装置のCPUが実行する情報検索処
理の内容を示したフローチャートの続きである。
【図4】データ処理装置のCPUが実行する情報検索処
理の内容を示したフローチャートの続きである。
【図5】データ処理装置のCPUが実行する情報検索処
理の内容を示したフローチャートの続きである。
【図6】検索優先度の一例について説明した概念図であ
る。
【図7】置換可能要素記憶部に記憶された置き換え可能
な単語の一例を示した概念図である。
【図8】構文解析の一例について示した概念図である。
【図9】グループ分けのキーワードの一例を示した概念
図である。
【図10】グループ分けのキーワードと情報の有りかと
の対応関係の一例を示した概念図である。
【図11】出力装置上での表示状態の一例を示した概念
図である。
【図12】ユーザが構成要素をクリックした場合の画面
変化の一例を示した概念図である。
【図13】ユーザが構成要素をクリックして検索条件を
変更した場合の画面変化の一例を示した概念図である。
【符号の説明】
1 情報検索システム 2 データ処理装置(コンピュータ) 3 入力手段 4 出力装置 5 記憶装置 6 キーワード分析手段 7 検索手段 8 検索結果確定手段 9 辞書記憶部 10 インデックス 11 検索結果一覧テーブル 12 置換可能要素記憶部

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 情報のありかとキーワードとを対応させ
    て記憶したインデックスを利用し、入力されたキーワー
    ドに対応する情報のありかを検索して提示する情報検索
    システムであって、 センテンスとして入力されたキーワードを構文解析して
    主要な構成要素と他の構成要素とに分割するキーワード
    分析手段と、 前記主要な構成要素のみをキーワードとして前記インデ
    ックスを検索することにより検索対象の母集合となる検
    索結果を求めて検索結果一覧テーブルに一時記憶させる
    と共に、前記他の構成要素および該他の構成要素に代え
    て利用することのできる幾つかの置換可能要素をキーワ
    ードとして前記検索結果一覧テーブルを検索して前記検
    索結果一覧テーブル内の検索結果をグループ化する検索
    手段と、 前記他の構成要素および前記幾つかの置換可能要素の内
    から択一的に要素を選択するための入力手段と、 前記入力手段によって選択された要素に対応してグルー
    プ化されている検索結果の一覧を提示する検索結果確定
    手段とを備えたことを特徴とする情報検索システム。
  2. 【請求項2】 前記幾つかの置換可能要素を前記他の構
    成要素に対応させて記憶した置換可能要素記憶手段を前
    記検索手段に併設したことを特徴とする請求項1記載の
    情報検索システム。
  3. 【請求項3】 前記キーワード分析手段は、名詞および
    固有名詞を主要な構成要素として認識する主要構成要素
    認識機能を備えていることを特徴とする請求項1または
    請求項2記載の情報検索システム。
  4. 【請求項4】 前記検索結果確定手段は、前記検索手段
    の作動終了時に、前記他の構成要素を自動的に前記要素
    として選択する最適検索結果提示機能を備えていること
    を特徴とする請求項1,請求項2または請求項3記載の
    情報検索システム。
  5. 【請求項5】 前記検索手段は、分割された前記他の構
    成要素毎に検索優先度を判定し、検索優先度が高い前記
    他の構成要素およびこの構成要素に代えて利用すること
    のできる幾つかの置換可能要素のみをキーワードとして
    前記検索結果一覧テーブルを検索して検索結果一覧テー
    ブル内の検索結果をグループ化する検索条件最適化機能
    を備えていることを特徴とする請求項1,請求項2,請
    求項3または請求項4記載の情報検索システム。
  6. 【請求項6】 前記入力手段は、前記他の構成要素およ
    び前記幾つかの置換可能要素を並列してモニタ上に表示
    する選択可能要素一括表示機能を備えていることを特徴
    とする請求項1,請求項2,請求項3,請求項4または
    請求項5記載の情報検索システム。
  7. 【請求項7】 情報のありかとキーワードとを対応させ
    て記憶したインデックスを利用し、入力されたキーワー
    ドに対応する情報のありかを検索して提示する情報検索
    システムの主要部を構成するコンピュータに設置される
    情報検索プログラムであって、 前記コンピュータにセンテンスとして入力されたキーワ
    ードを構文解析して主要な構成要素と他の構成要素とに
    分割するキーワード分析機能と、 前記主要な構成要素のみをキーワードとして前記インデ
    ックスを検索することにより検索対象の母集合となる検
    索結果を求めて検索結果一覧テーブルに一時記憶させる
    と共に、前記他の構成要素および該他の構成要素に代え
    て利用することのできる幾つかの置換可能要素をキーワ
    ードとして前記検索結果一覧テーブルを検索して前記検
    索結果一覧テーブル内の検索結果をグループ化する検索
    機能と、 入力手段または情報伝達経路を介して入力される指令に
    応じて前記他の構成要素および前記幾つかの置換可能要
    素の内から択一的に要素を選択し、該選択した要素に対
    応してグループ化されている検索結果の一覧を出力する
    検索結果確定機能とを前記コンピュータによって実現す
    るための情報検索プログラム。
JP2001182122A 2001-06-15 2001-06-15 情報検索システムおよび情報検索プログラム Pending JP2002373174A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001182122A JP2002373174A (ja) 2001-06-15 2001-06-15 情報検索システムおよび情報検索プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001182122A JP2002373174A (ja) 2001-06-15 2001-06-15 情報検索システムおよび情報検索プログラム

Publications (1)

Publication Number Publication Date
JP2002373174A true JP2002373174A (ja) 2002-12-26

Family

ID=19022282

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001182122A Pending JP2002373174A (ja) 2001-06-15 2001-06-15 情報検索システムおよび情報検索プログラム

Country Status (1)

Country Link
JP (1) JP2002373174A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7340450B2 (en) 2003-03-14 2008-03-04 Hewlett-Packard Development Company, L.P. Data search system and data search method using a global unique identifier
KR20220032194A (ko) * 2020-09-07 2022-03-15 주식회사 한글과컴퓨터 검색 키워드 분석을 통해 전자 문서에 대한 상세 검색을 지원하는 전자 장치 및 그 동작 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07282087A (ja) * 1994-04-07 1995-10-27 Fuji Xerox Co Ltd 情報構造化表示装置
JP2001005830A (ja) * 1999-06-23 2001-01-12 Canon Inc 情報処理装置及びその方法、コンピュータ可読メモリ

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07282087A (ja) * 1994-04-07 1995-10-27 Fuji Xerox Co Ltd 情報構造化表示装置
JP2001005830A (ja) * 1999-06-23 2001-01-12 Canon Inc 情報処理装置及びその方法、コンピュータ可読メモリ

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7340450B2 (en) 2003-03-14 2008-03-04 Hewlett-Packard Development Company, L.P. Data search system and data search method using a global unique identifier
KR20220032194A (ko) * 2020-09-07 2022-03-15 주식회사 한글과컴퓨터 검색 키워드 분석을 통해 전자 문서에 대한 상세 검색을 지원하는 전자 장치 및 그 동작 방법
KR102395674B1 (ko) 2020-09-07 2022-05-09 주식회사 한글과컴퓨터 검색 키워드 분석을 통해 전자 문서에 대한 상세 검색을 지원하는 전자 장치 및 그 동작 방법

Similar Documents

Publication Publication Date Title
JP3429184B2 (ja) テキスト構造解析装置および抄録装置、並びにプログラム記録媒体
US6983271B2 (en) Answer wizard drop-down control
KR100341339B1 (ko) 디스플레이 스크린 크기 및 윈도우 크기와 관련된 웹 페이지 적응 시스템
US7992085B2 (en) Lightweight reference user interface
US7085761B2 (en) Program for changing search results rank, recording medium for recording such a program, and content search processing method
US20060122997A1 (en) System and method for text searching using weighted keywords
US20080021887A1 (en) Data product search using related concepts
US20070168344A1 (en) Data product search using related concepts
JP2005182280A (ja) 情報検索システム、検索結果加工システム及び情報検索方法並びにプログラム
JPH11102374A (ja) データベースの文書表示方法およびその装置
JPH06266780A (ja) 意味パターン認識による文字列検索方法及びその装置
JP2001216316A (ja) 電子マニュアル検索システム、方法、及び記録媒体
US11010360B2 (en) Extending tags for information resources
JPH11161682A (ja) 情報検索装置、情報検索方法及び記録媒体
US7765201B2 (en) System and method of making search for document in accordance with query of natural language
JPH08255172A (ja) 文書検索システム
US8321198B2 (en) Data extraction system, terminal, server, programs, and media for extracting data via a morphological analysis
KR20010104873A (ko) 메타 검색엔진을 이용한 인터넷 사이트 검색 서비스 시스템
JP4179858B2 (ja) 文書検索装置、文書検索方法、プログラムおよび記録媒体
US20070294367A1 (en) System and method for delivering data
JPH11296537A (ja) 情報検索システム、情報提供装置、情報検索端末装置、情報検索方法および記憶媒体
JP2002373174A (ja) 情報検索システムおよび情報検索プログラム
JPH0962684A (ja) 情報検索方法及び情報検索装置と、情報案内方法及び情報案内装置
JPH1115841A (ja) 情報検索装置及び情報検索プログラムを記録した媒体
JP2004348239A (ja) テキスト分類プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050818

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050823

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051018

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051220