JPH03252767A - キーワード連想生成装置 - Google Patents

キーワード連想生成装置

Info

Publication number
JPH03252767A
JPH03252767A JP2049536A JP4953690A JPH03252767A JP H03252767 A JPH03252767 A JP H03252767A JP 2049536 A JP2049536 A JP 2049536A JP 4953690 A JP4953690 A JP 4953690A JP H03252767 A JPH03252767 A JP H03252767A
Authority
JP
Japan
Prior art keywords
retrieval
key word
thesaurus
document
terms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2049536A
Other languages
English (en)
Inventor
Toshinori Iwadera
巖寺 俊哲
Haruo Kimoto
木本 晴夫
Yoshinori Kishida
岸田 芳典
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2049536A priority Critical patent/JPH03252767A/ja
Publication of JPH03252767A publication Critical patent/JPH03252767A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、文書検索装置に係わり、特に、利用者が入力
する検索用キーワードに利用者の検索対象文書を検索す
るのに最適な情報を補完するためのキーワード群である
連想キーワードを自動的に生成する装置であるキーワー
ド連想生成装置に関するものである。
(従来の技術) 一般に文書を入手することを目的としたキーワードを使
用した検索では、利用者の判断によって検索用キーワー
ドを入力するために不必要な情報が検索されたり、必要
な情報が検索されなかったりする検索誤差が発生する。
この種の誤差は、検索対象文書を検索することに関して
必要十分な情報を持つキーワードを利用者が知らないこ
とによる不適切なキーワードや不必要なキーワードや情
報の不十分なキーワード等の使用によって開発する。
(発明が解決しようとする課wn) 従来、利用者が入力した検索用キーワードを直接、文書
検索装置に入力して検索を行い、その検索結果を利用者
自信が判断し、検索用キーワードを変更していた。しか
し、この方法では、必要な文書が検索されなかったり不
必要な文書が検索されてしまうため、検索の目的に必要
十分に適合した文書を手に入れるまで、検索用キーワー
ドを変更し、検索を繰り返す作業を行う必要があり、非
効率的であった。
本発明の目的は、利用者の入力した検索用キーワードに
検索対象文書を検索するのに最適な情報を補完する連想
キーワードを生成する装置を提供することにある。
[発明の構成] (課題を解決するための手段) この発明のキーワード連想生成装置は、キーワードとな
り得る用語をその同義語や密接な類語とともに集めたシ
ソーラスと、利用者が人力したサンプル文書からキーワ
ードとなり得る用語を抽出する手段と、同一サンプル文
書から抽出された複数の用語を前記シソーラスにおいて
同一文書関連用語としてリンクさせる手段と、利用者が
入力したキーワードについて、その用語の同義語や密接
な類語を前記シソーラスから引き出すとともに、それら
各用語の同一文書関連用語としてリンクされた各用語、
およびその同義語や密接な類語を前記シソーラスから引
き出す手段とを備えたことを要旨とする。
(作用) 前記シソーラスに用語A、、A2 、A3が同義語およ
び密接な関連語として登録され、同様に用語B、、B2
.B3および用語c、、c2.c3が登録されていると
すると、また、利用者が入力した1つのサンプル文書か
ら3つの用語A。
B2.C3が抽出され、これらが同一文書関連用語とし
てリンクされたとする。ここで利用者か用語A2をキー
ワードとして人力したとすると、A2の同義語および密
接な関連語としてA、、A3が引き出されるとともに、
A、の同一文書関連用語としてB2.C3が引き出され
、さらにB2からB、、B3が、またC3かc、、c2
が引き出され、これら用語A、、A3.B、、B2.B
3゜c、、c2.c3がキーワードA2の連想キーワー
ドとなる。
(実施例) 第1図は本発明の基本構成例である。1は利用者によっ
て提供されるサンプル文書からキーワードとキーワード
間関係情報より構成される文書情報を抽出する文書情報
抽出部、2はキーワードに成り得る各−語に対応してい
るノードと、同義語、上位語、下位語、関連語といった
ノードに対応している各語間の相互関係を示しノードと
ノードを結合しているリンクから成るシソーラス、3は
シソーラスに、文書情報を使用して生成したリンクを付
加した動的シソーラスを作成するシソーラスリンク生成
部、4は利用者からの検索用キーワードの入力を受は付
ける検索用キーワード入力部、5は動的シソーラスを使
用して利用者によって人力された検索用キーワードに対
応するノードからリンクで結合しているノードを次々と
検索用キーワードに最適な情報を補完する連想キーワー
ドとして生成する連想キーワード生成部である。
次に本装置の動作の流れを第2図の例に従って説明する
第2図において、6は利用者が人力したサンプル文書で
あり、これは利用者が検索することによって手に入れた
い文書と同じ内容傾向の文書である。このサンプル文書
6を文書情報抽出部]が解析し、「米国」 「リビア」
 「テロ」という3つの用語を抽出し、これらが同一文
書関連用語であることを示す文書情報7を作成する。
なお、第2図の8はシソーラス2の内容の1部を示すも
ので、「テロ」 「テロリズム」 「テロリスト」なる
用語が同義語や類語として登録され、「リビア」 「カ
ダフィ」なる用語が関連して登録され、「アメリカ合衆
国」 「米国」 「米」 「レーガン」なる用語が関連
して登録されている。
シソーラスリンク生成部3は、文書情報7として示され
た同一文書関連用語「米国」 「リビア」「テロ」の3
つをシソーラス2上でリンクさせた動的シソーラス9を
作成する。
次の動作として利用者が「米国」なる用語をキ−ワード
10として人力すると、連想キーワード生成部5は、動
的シソーラス9上において「米国」につながっているリ
ンクを次々とたどり、「米」「アメリカ合衆国」 「レ
ーガン」 「リビア」 「カダフィ」 「テロ」 「テ
ロリスト」 「テロリズム」の各用語を連想キーワード
として引き出す。このように、動的シソーラスを使用し
て利用者の入力した検索用キーワードに自動的に検索対
象文書を検索するのに最適な情報を補完する連想キーワ
ードを生成している。
[発明の効果] 以上で説明したように本発明のキーワード連想生成装置
は、従来のように目的の文書を入手するまで入手によっ
て入力された検索用キーワードの変更を繰り返す方式と
は異なり、検索用キーワードに自動的に情報を補完した
適切な検索用キーワードである連想キーワードを生成す
る。この連想キーワードを使用して検索を行うことによ
り、従来までの人手で検索用キーワードを変更して検索
を繰り返すという作業がなくなり、検索作業時間が1/
10以下に短縮され、かつ、検索された全文書中に含ま
れる検索対象文書の割合と全検索対象文書の内で実際に
検索された検索対象文書の割合とからなる検索精度か3
倍以上に向上するという効果がある。
【図面の簡単な説明】
第1図は本発明の一実施例によるキーワード連想生成装
置の概略構成図、第2図は同上装置の動作の流れを示す
説明図である。

Claims (1)

    【特許請求の範囲】
  1. キーワードとなり得る用語をその同義語や密接な類語と
    ともに集めたシソーラスと、利用者が入力したサンプル
    文書からキーワードとなり得る用語を抽出する手段と、
    同一サンプル文書から抽出された複数の用語を前記シソ
    ーラスにおいて同一文書関連用語としてリンクさせる手
    段と、利用者が入力したキーワードについて、その用語
    の同義語や密接な類語を前記シソーラスから引き出すと
    ともに、それら各用語の同一文書関連用語としてリンク
    された各用語、およびその同義語や密接な類語を前記シ
    ソーラスから引き出す手段とを備えたことを特徴とする
    キーワード連想生成装置。
JP2049536A 1990-03-02 1990-03-02 キーワード連想生成装置 Pending JPH03252767A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2049536A JPH03252767A (ja) 1990-03-02 1990-03-02 キーワード連想生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2049536A JPH03252767A (ja) 1990-03-02 1990-03-02 キーワード連想生成装置

Publications (1)

Publication Number Publication Date
JPH03252767A true JPH03252767A (ja) 1991-11-12

Family

ID=12833897

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2049536A Pending JPH03252767A (ja) 1990-03-02 1990-03-02 キーワード連想生成装置

Country Status (1)

Country Link
JP (1) JPH03252767A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008282322A (ja) * 2007-05-14 2008-11-20 Sony Ericsson Mobilecommunications Japan Inc 情報処理装置及び情報処理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6057464A (ja) * 1983-09-08 1985-04-03 Sanyo Electric Co Ltd 保険調剤請求業務用計算機における項目指定検索方式
JPS63101963A (ja) * 1986-10-20 1988-05-06 Fujitsu Ltd 検索システム
JPH021057A (ja) * 1988-01-20 1990-01-05 Ricoh Co Ltd 文書検索装置
JPH0256068A (ja) * 1988-08-20 1990-02-26 Nec Corp 関連語の連鎖探索方式

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6057464A (ja) * 1983-09-08 1985-04-03 Sanyo Electric Co Ltd 保険調剤請求業務用計算機における項目指定検索方式
JPS63101963A (ja) * 1986-10-20 1988-05-06 Fujitsu Ltd 検索システム
JPH021057A (ja) * 1988-01-20 1990-01-05 Ricoh Co Ltd 文書検索装置
JPH0256068A (ja) * 1988-08-20 1990-02-26 Nec Corp 関連語の連鎖探索方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008282322A (ja) * 2007-05-14 2008-11-20 Sony Ericsson Mobilecommunications Japan Inc 情報処理装置及び情報処理方法

Similar Documents

Publication Publication Date Title
Ahonen et al. Applying data mining techniques for descriptive phrase extraction in digital document collections
KR100594512B1 (ko) 지식 창조 능력을 가지는 문서 의미 분석/선택 시스템 및그 방법
US6289342B1 (en) Autonomous citation indexing and literature browsing using citation context
US20020138528A1 (en) Text summarization using relevance measures and latent semantic analysis
JPH0242572A (ja) 共起関係辞書生成保守方法
US5893094A (en) Method and apparatus using run length encoding to evaluate a database
JPH0424869A (ja) 文書処理システム
US20030154068A1 (en) Computer-assisted memory translation scheme based on template automaton and latent semantic index principle
JP2002007467A (ja) 多段式知能的文字列比較方法
US20040122660A1 (en) Creating taxonomies and training data in multiple languages
JPH10260972A (ja) 関連文書検索装置及び関連文書検索プログラムを記録した記録媒体
Robertson et al. Information retrieval research
JPH08339378A (ja) 類似文字列の展開方法、検索方法及びそれらの装置
JPH1049543A (ja) 文書検索装置
JP2883153B2 (ja) キーワード抽出装置
Chandrasekar et al. Institute for Research in Cognitive Science
Chandrasekar et al. Gleaning information from the web: Using syntax to filter out irrelevant information
CN106570058A (zh) 一种搜索方法和搜索引擎
JP4103905B2 (ja) 統合化検索システム
Lecoeuche Finding comparatively important concepts between texts
JPH03252767A (ja) キーワード連想生成装置
JP2894301B2 (ja) 文脈情報を用いた文書検索方法および装置
US20040093322A1 (en) Method and system for information aggregation and filtering
JP3747542B2 (ja) 統合化検索装置
JPH09185632A (ja) 情報検索・編集方法及び装置