JPH07210565A - 情報検索方法及び装置 - Google Patents

情報検索方法及び装置

Info

Publication number
JPH07210565A
JPH07210565A JP6005197A JP519794A JPH07210565A JP H07210565 A JPH07210565 A JP H07210565A JP 6005197 A JP6005197 A JP 6005197A JP 519794 A JP519794 A JP 519794A JP H07210565 A JPH07210565 A JP H07210565A
Authority
JP
Japan
Prior art keywords
keyword
associative
word
words
associative word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6005197A
Other languages
English (en)
Inventor
Atsushi Nochida
淳 後田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP6005197A priority Critical patent/JPH07210565A/ja
Publication of JPH07210565A publication Critical patent/JPH07210565A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 指示入力したキーワードそのもののみでな
く、それに関連する語句でも検索を行なうことで、本来
のキーワードを知らなくても予想通りの検索を行なえる
ことを可能にする。 【構成】 キーワード入力装置1からキーワードが入力
されると度に、それから連想される連想語を連想語辞書
2より抽出する。そして、複数のキーワードが入力され
た場合、各々のキーワードに対応する連想語の中で共通
する鵜連想語を共通連想語抽出装置5で抽出し、それを
キーワードとしてデータベース検索装置8がデータベー
ス7を検索する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は情報検索方法及び装置、
詳しくはキーワードに基づいて情報の検索を行う方法及
び装置に関するものである。
【0002】
【従来の技術】通常、データベースにおいてファイルを
検索する場合には、検索者(操作者)が指示入力したキ
ーワードを、各ファイルに付けられたインデックスと比
較することにより行なっている。
【0003】
【発明が解決しようとする課題】従って、当然のことな
がら、柔軟な検索を行なわせるためには、各ファイルを
装置に登録する際、あらゆる視点からとらえた多数のイ
ンデックスを付ける必要がある。
【0004】
【課題を解決するための手段】本発明はかかる従来技術
に鑑みなされたものであり、指示入力したキーワードそ
のもののみでなく、それに関連する語句でも検索を行な
うことで、本来のキーワードを知らなくても予想通りの
検索を行なえることを可能にする情報検索方法及び装置
を提供しようとするものである。
【0005】この課題を解決するため、本発明の情報処
理検索方法は以下に示す手順に従って動作する。すなわ
ち、情報検索にかかる少なくとも1つのキーワードを入
力し、予め記憶されたキーワードと当該キーワードに基
づいて連想される複数の連想語で構成される辞書を参照
することで、入力されたそれぞれのキーワードに対応す
る連想語群を抽出し、抽出された連想語群に基づいて連
想語を絞り込み、絞り込んだ連想語をキーワードとして
検索する。
【0006】また、本発明の情報処理装置は以下に示す
構成を備える。すなわち、情報検索にかかる少なくとも
1つのキーワードを入力する入力手段と、予め記憶され
たキーワードと当該キーワードに基づいて連想される複
数の連想語で構成される辞書と、入力されたそれぞれの
キーワードに対応する連想語群を前記辞書を参照するこ
とで抽出する抽出手段と、抽出された連想語群に基づい
て連想語を絞り込む絞り込み手段と、絞り込んだ連想語
をキーワードとして検索する検索手段とを備える。
【0007】
【作用】かかる本発明の工程或は構成において、キーワ
ードがいくつか入力された場合、各々のキーワードに対
応する連想語群を抽出し、抽出された連想語群から実際
に検索するためのキーワードとしての連想語を絞り込
む。そして、絞り込んだ連想語を用いて情報の検索を行
う。
【0008】
【実施例】以下、添付図面に従って本発明に係る実施例
を詳細に説明する。
【0009】図1は実施例の装置のブロック構成図を示
している。同図において、1はキーワードを入力する入
力装置(例えばキーボード)、2はキーワードとそのキ
ーワードから連想される単語のリストを持つ連想語辞
書、3は連想語辞書2を検索しキーワードから連想され
る単語のリスト(以下、連想語リストという)を生成す
る連想語生成装置、4は複数のキーワードから生成され
た複数の連想語リストおよびそれを保持する記憶装置、
5は複数のの連想語リストから共通する連想語を抽出す
る共通連想語抽出装置である。また、6は共通連想語抽
出装置5により抽出された共通連想語およびそれを保持
する記憶装置、7はデータベース、8はデータベースか
ら共通連想語に対応するファイルを検索する検索装置、
9は検索結果を出力する出力装置である。
【0010】図2はデータベース検索の手順を示す流れ
図である。図3は連想語辞書の一例であり、図示の如
く、1つのキーワード10に対して、連想される単語1
1が複数個対応付けられて記憶されている。図4はデー
タベースの一例であり、同図において12は各ファイル
につけられたインデックス、13は各ファイルである。
以下、図2,図3,図4を用いて検索手順を具体的に説
明する。
【0011】先ず、ステップS21において、第1のキ
ーワードとしてキー1を入力する。この入力があると、
次にステップS22に進んで、連想語生成装置3は連想
語辞書2よりキー1に対応する(連想される)単語で構
成される連想語リスト16を生成する。例えば、ワード
A、ワードB、ワードCの3単語からなる連想語リスト
を生成する。つぎに、ステップ23で共通連想語抽出装
置5は共通連想語ワードA,ワードB,ワードCを抽出
する。つぎに、ステップ24で共通連想語のしぼり込み
を終了するかどうかに対し、NOを指定すると新たなキ
ーの入力のためにステップ21に戻る。
【0012】ここで、第2のキーワードとしてキー3を
入力し、ステップ22で連想語生成装置3が連想語辞書
よりキー3に対応するワードB,ワードD,ワードEの
3単語からなる連想語リスト17を生成した場合、つぎ
にステップ23において、共通連想語抽出装置は連想語
リスト16および17から共通連想語ワードBを出力す
る。共通連想語が一つにしぼられたので、つぎのステッ
プ24ではYESを指定する。
【0013】以上の結果、例えば目的の単語が明確に分
からなくても、それに関連した(或は連想される)キー
をいくつか入力することで、装置内部で目的単語にまで
絞り込むことが可能になる。
【0014】さて、処理がステップ25に進むと、デー
タベース検索装置8はワードB対応するインデックスを
もつファイル2を検索し、ステップ26でファイル2を
出力する。
【0015】図5は以上の説明におけるキーワード,連
想語リスト,共通連想語を図示したものであり、同図に
おいて、14は第1のキーワード、15は第2のキーワ
ード、16は第1のキーワードに対する連想語リスト、
17は第2のキーワードに対する連想語リスト、18は
共通連想語である。
【0016】以上説明したように本実施例によれば、キ
ーワードから連想される単語をインデックスとして持つ
ファイルを検索することが可能となる。
【0017】尚、実施例の装置の具体的な構成例を示せ
ば、図8の通りである。図示において、100は装置全
体の制御を司り、図1における連想語生成装置3、共通
連想語抽出装置5、データベース検索装置8として機能
する。101はブートプログラム及びフォントデータを
記憶したROM、102はOSや情報検索に係るプログ
ラムをロードしたり、各種ワークエリアとして使用され
るRAMである。103は先に説明した検索処理手順
(プログラム)や検索対象のデータを記憶している外部
記憶装置(例えばハードディスク装置)である。104
は検索に係る各種指示やキーワードを入力するためのキ
ーボード、105は情報を表示するための表示装置CR
Tであり、106は表示情報を展開するVRAMであ
る。
【0018】かかる構成において、本装置に電源が投入
されると、ROM101に格納されているブートプログ
ラムに従い、OSを外部記憶装置103からRAM10
2に読み込むとともに、検索プログラムもRAM102
にロードして上述した処理を行うことになる。
【0019】<他の実施例の説明>上記実施例(第1の
実施例)においては、連想語のしぼり込みを各連想語リ
ストに共通する連想語を抽出することにより行うとした
が、これを別の方法によっても本発明の主旨を損なうも
のではない。例えば、連想語辞書2の各単語に重み係数
を設定し、重み係数の合計によりしぼり込みを行うこと
もできる。
【0020】図6は重み付き連想語辞書の一例であり、
同図における19が各単語の重み係数である。尚、符号
10、11は図3のそれと同じ意味である。
【0021】図7はキーワードとしてキー1およびキー
3を指定した場合の連想語しぼり込みを示す図である。
キー1およびキー3よりそれぞれ連想語リストが得られ
る。共通する連想語はワードBとワードCであるが、重
み係数の合計はワードBが8、ワードCが4であること
から、共通連想語はワードBにしぼり込まれる。尚、重
み係数の設定は、インデックスを登録する際、そのイン
デックスを関連させるキー毎に、重み係数値を設定する
ことでなされる。
【0022】例えば、図7においては、ワードBの重み
係数はキー1に対しては“3”であるのに対し、キー2
に対しては“5”になっている。
【0023】以上説明したように本実施例によれば、連
想語に重みづけを行うことにより、より高速な連想語の
しぼり込みを行うことが可能になり、大規模なデータベ
ースへの対応が可能となる。
【0024】尚、上記説明の如く、本発明は、複数の機
器から構成されるシステムに適用しても1つの機器から
成る装置に適用しても良い。また、本発明は、システム
或は装置にプログラムを供給することによって達成され
る場合にも適用できることはいうまでもない。
【0025】
【発明の効果】以上説明したように本発明によれば、指
示入力したキーワードそのもののみでなく、それに関連
する語句でも検索を行なうことで、本来のキーワードを
知らなくても予想通りの検索を行なえることが可能にな
る。
【0026】
【図面の簡単な説明】
【図1】実施例の装置の構成概念図である。
【図2】実施例の検索処理の手順を示すフローチャート
である。
【図3】実施例の連想語辞書の構造概念図である。
【図4】実施例のデータベースの構造概念図である。
【図5】実施例の絞り込み処理の動作を説明するための
図である。
【図6】他の実施例における連想語辞書の構造概念図で
ある。
【図7】他の実施例における絞り込み動作を説明するた
めの図である。
【図8】実施例の装置の具体的構成を示す図である。
【符号の説明】
1 キーワード入力装置 2 連想語辞書 3 連想語生成装置 4 連想語リスト 5 共通連想語抽出装置 6 共通連想語 7 データベース 8 データベース検索装置 9 検索結果

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 情報検索にかかる少なくとも1つのキー
    ワードを入力し、 予め記憶されたキーワードと当該キーワードに基づいて
    連想される複数の連想語で構成される辞書を参照するこ
    とで、入力されたそれぞれのキーワードに対応する連想
    語群を抽出し、 抽出された連想語群に基づいて連想語を絞り込み、 絞り込んだ連想語をキーワードとして検索することを特
    徴とする情報検索方法。
  2. 【請求項2】 連想語を絞りこむ工程は、各入力キーワ
    ードに共通な連想語を検索するキーワードとして絞りこ
    むことを特徴とする請求項第1項に記載の情報検索方
    法。
  3. 【請求項3】 前記辞書内に記憶されている連想語に
    は、入力キーワード毎に重み係数値が設定されており、 前記連想語絞りこみ工程は、各入力キーワードに対応す
    る連想語の重み計数値の合計値の大きい連想語を検索す
    るキーワードとして絞りこむことを特徴とする請求項第
    1項に記載の情報検索方法。
  4. 【請求項4】 情報検索にかかる少なくとも1つのキー
    ワードを入力する入力手段と、 予め記憶されたキーワードと当該キーワードに基づいて
    連想される複数の連想語で構成される辞書と、 入力されたそれぞれのキーワードに対応する連想語群を
    前記辞書を参照することで抽出する抽出手段と、 抽出された連想語群に基づいて連想語を絞り込む絞り込
    み手段と、 絞り込んだ連想語をキーワードとして検索する検索手段
    とを備えることを特徴とする情報検索装置。
  5. 【請求項5】 絞り込み手段は、各入力キーワードに共
    通な連想語を検索するキーワードとして絞りこむことを
    特徴とする請求項第4項に記載の情報検索装置。
  6. 【請求項6】 前記辞書内に記憶されている連想語に
    は、入力キーワード毎に重み係数値が設定されており、 前記絞り込み手段は、各入力キーワードに対応する連想
    語の重み計数値の合計値の大きい連想語を検索するキー
    ワードとして絞りこむことを特徴とする請求項第4項に
    記載の情報検索装置。
JP6005197A 1994-01-21 1994-01-21 情報検索方法及び装置 Pending JPH07210565A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6005197A JPH07210565A (ja) 1994-01-21 1994-01-21 情報検索方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6005197A JPH07210565A (ja) 1994-01-21 1994-01-21 情報検索方法及び装置

Publications (1)

Publication Number Publication Date
JPH07210565A true JPH07210565A (ja) 1995-08-11

Family

ID=11604487

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6005197A Pending JPH07210565A (ja) 1994-01-21 1994-01-21 情報検索方法及び装置

Country Status (1)

Country Link
JP (1) JPH07210565A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10124522A (ja) * 1996-10-22 1998-05-15 Fujitsu Ltd 情報検索装置
JP2004021763A (ja) * 2002-06-19 2004-01-22 Hitachi Ltd テキストマイニングプログラム、方法、及び装置
JP2009048408A (ja) * 2007-08-20 2009-03-05 Ricoh Co Ltd ドキュメント作成システム、ユーザ端末、サーバ装置、およびプログラム
JP2016048527A (ja) * 2014-08-28 2016-04-07 ヤフー株式会社 抽出装置、抽出方法および抽出プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10124522A (ja) * 1996-10-22 1998-05-15 Fujitsu Ltd 情報検索装置
JP2004021763A (ja) * 2002-06-19 2004-01-22 Hitachi Ltd テキストマイニングプログラム、方法、及び装置
JP2009048408A (ja) * 2007-08-20 2009-03-05 Ricoh Co Ltd ドキュメント作成システム、ユーザ端末、サーバ装置、およびプログラム
JP2016048527A (ja) * 2014-08-28 2016-04-07 ヤフー株式会社 抽出装置、抽出方法および抽出プログラム

Similar Documents

Publication Publication Date Title
US7440947B2 (en) System and method for identifying query-relevant keywords in documents with latent semantic analysis
JP2832988B2 (ja) データ検索システム
JPH08255172A (ja) 文書検索システム
JP3173411B2 (ja) 関連文書検索装置及び関連文書検索プログラムを記録した記録媒体
JPH1145274A (ja) 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000132560A (ja) 中国語テレテキスト処理方法及び装置
JPH0844771A (ja) 情報検索装置
JPH07210565A (ja) 情報検索方法及び装置
JPH0773197A (ja) 異表記語辞書作成支援装置
JP3007375B2 (ja) 文書情報検索装置
JPH09198396A (ja) 文書検索装置
JP3558267B2 (ja) 文書検索装置
JPH07134720A (ja) 文章作成システムにおける関連情報提示方法及び装置
JP2004334602A (ja) 文書検索装置、文書検索処理プログラム及び記録媒体
JP2002117043A (ja) 文書検索装置、文書検索方法およびその方法を実施するためのプログラムを記録した記録媒体
JPH10143530A (ja) 文書検索システムおよび文書検索方法
JP4282381B2 (ja) 文書検索装置、プログラムおよび記録媒体
JPH04290158A (ja) 文書作成装置
JPH08137841A (ja) 文書処理装置及び方法
JPH09198393A (ja) 文書検索装置
JPH10307839A (ja) テキスト検索装置及び方法
JPH05313971A (ja) リレーショナル・データベースにおけるキーワード管理方式
JPH06215041A (ja) 文書検索装置及びその方法
JP2537991B2 (ja) 文字入力装置および方法
JPH0934897A (ja) 図書管理システム

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030613