JPH03252767A - キーワード連想生成装置 - Google Patents
キーワード連想生成装置Info
- Publication number
- JPH03252767A JPH03252767A JP2049536A JP4953690A JPH03252767A JP H03252767 A JPH03252767 A JP H03252767A JP 2049536 A JP2049536 A JP 2049536A JP 4953690 A JP4953690 A JP 4953690A JP H03252767 A JPH03252767 A JP H03252767A
- Authority
- JP
- Japan
- Prior art keywords
- retrieval
- key word
- thesaurus
- document
- terms
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000000295 complement effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000001502 supplementing effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000034 method Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[発明の目的]
(産業上の利用分野)
本発明は、文書検索装置に係わり、特に、利用者が入力
する検索用キーワードに利用者の検索対象文書を検索す
るのに最適な情報を補完するためのキーワード群である
連想キーワードを自動的に生成する装置であるキーワー
ド連想生成装置に関するものである。
する検索用キーワードに利用者の検索対象文書を検索す
るのに最適な情報を補完するためのキーワード群である
連想キーワードを自動的に生成する装置であるキーワー
ド連想生成装置に関するものである。
(従来の技術)
一般に文書を入手することを目的としたキーワードを使
用した検索では、利用者の判断によって検索用キーワー
ドを入力するために不必要な情報が検索されたり、必要
な情報が検索されなかったりする検索誤差が発生する。
用した検索では、利用者の判断によって検索用キーワー
ドを入力するために不必要な情報が検索されたり、必要
な情報が検索されなかったりする検索誤差が発生する。
この種の誤差は、検索対象文書を検索することに関して
必要十分な情報を持つキーワードを利用者が知らないこ
とによる不適切なキーワードや不必要なキーワードや情
報の不十分なキーワード等の使用によって開発する。
必要十分な情報を持つキーワードを利用者が知らないこ
とによる不適切なキーワードや不必要なキーワードや情
報の不十分なキーワード等の使用によって開発する。
(発明が解決しようとする課wn)
従来、利用者が入力した検索用キーワードを直接、文書
検索装置に入力して検索を行い、その検索結果を利用者
自信が判断し、検索用キーワードを変更していた。しか
し、この方法では、必要な文書が検索されなかったり不
必要な文書が検索されてしまうため、検索の目的に必要
十分に適合した文書を手に入れるまで、検索用キーワー
ドを変更し、検索を繰り返す作業を行う必要があり、非
効率的であった。
検索装置に入力して検索を行い、その検索結果を利用者
自信が判断し、検索用キーワードを変更していた。しか
し、この方法では、必要な文書が検索されなかったり不
必要な文書が検索されてしまうため、検索の目的に必要
十分に適合した文書を手に入れるまで、検索用キーワー
ドを変更し、検索を繰り返す作業を行う必要があり、非
効率的であった。
本発明の目的は、利用者の入力した検索用キーワードに
検索対象文書を検索するのに最適な情報を補完する連想
キーワードを生成する装置を提供することにある。
検索対象文書を検索するのに最適な情報を補完する連想
キーワードを生成する装置を提供することにある。
[発明の構成]
(課題を解決するための手段)
この発明のキーワード連想生成装置は、キーワードとな
り得る用語をその同義語や密接な類語とともに集めたシ
ソーラスと、利用者が人力したサンプル文書からキーワ
ードとなり得る用語を抽出する手段と、同一サンプル文
書から抽出された複数の用語を前記シソーラスにおいて
同一文書関連用語としてリンクさせる手段と、利用者が
入力したキーワードについて、その用語の同義語や密接
な類語を前記シソーラスから引き出すとともに、それら
各用語の同一文書関連用語としてリンクされた各用語、
およびその同義語や密接な類語を前記シソーラスから引
き出す手段とを備えたことを要旨とする。
り得る用語をその同義語や密接な類語とともに集めたシ
ソーラスと、利用者が人力したサンプル文書からキーワ
ードとなり得る用語を抽出する手段と、同一サンプル文
書から抽出された複数の用語を前記シソーラスにおいて
同一文書関連用語としてリンクさせる手段と、利用者が
入力したキーワードについて、その用語の同義語や密接
な類語を前記シソーラスから引き出すとともに、それら
各用語の同一文書関連用語としてリンクされた各用語、
およびその同義語や密接な類語を前記シソーラスから引
き出す手段とを備えたことを要旨とする。
(作用)
前記シソーラスに用語A、、A2 、A3が同義語およ
び密接な関連語として登録され、同様に用語B、、B2
.B3および用語c、、c2.c3が登録されていると
すると、また、利用者が入力した1つのサンプル文書か
ら3つの用語A。
び密接な関連語として登録され、同様に用語B、、B2
.B3および用語c、、c2.c3が登録されていると
すると、また、利用者が入力した1つのサンプル文書か
ら3つの用語A。
B2.C3が抽出され、これらが同一文書関連用語とし
てリンクされたとする。ここで利用者か用語A2をキー
ワードとして人力したとすると、A2の同義語および密
接な関連語としてA、、A3が引き出されるとともに、
A、の同一文書関連用語としてB2.C3が引き出され
、さらにB2からB、、B3が、またC3かc、、c2
が引き出され、これら用語A、、A3.B、、B2.B
3゜c、、c2.c3がキーワードA2の連想キーワー
ドとなる。
てリンクされたとする。ここで利用者か用語A2をキー
ワードとして人力したとすると、A2の同義語および密
接な関連語としてA、、A3が引き出されるとともに、
A、の同一文書関連用語としてB2.C3が引き出され
、さらにB2からB、、B3が、またC3かc、、c2
が引き出され、これら用語A、、A3.B、、B2.B
3゜c、、c2.c3がキーワードA2の連想キーワー
ドとなる。
(実施例)
第1図は本発明の基本構成例である。1は利用者によっ
て提供されるサンプル文書からキーワードとキーワード
間関係情報より構成される文書情報を抽出する文書情報
抽出部、2はキーワードに成り得る各−語に対応してい
るノードと、同義語、上位語、下位語、関連語といった
ノードに対応している各語間の相互関係を示しノードと
ノードを結合しているリンクから成るシソーラス、3は
シソーラスに、文書情報を使用して生成したリンクを付
加した動的シソーラスを作成するシソーラスリンク生成
部、4は利用者からの検索用キーワードの入力を受は付
ける検索用キーワード入力部、5は動的シソーラスを使
用して利用者によって人力された検索用キーワードに対
応するノードからリンクで結合しているノードを次々と
検索用キーワードに最適な情報を補完する連想キーワー
ドとして生成する連想キーワード生成部である。
て提供されるサンプル文書からキーワードとキーワード
間関係情報より構成される文書情報を抽出する文書情報
抽出部、2はキーワードに成り得る各−語に対応してい
るノードと、同義語、上位語、下位語、関連語といった
ノードに対応している各語間の相互関係を示しノードと
ノードを結合しているリンクから成るシソーラス、3は
シソーラスに、文書情報を使用して生成したリンクを付
加した動的シソーラスを作成するシソーラスリンク生成
部、4は利用者からの検索用キーワードの入力を受は付
ける検索用キーワード入力部、5は動的シソーラスを使
用して利用者によって人力された検索用キーワードに対
応するノードからリンクで結合しているノードを次々と
検索用キーワードに最適な情報を補完する連想キーワー
ドとして生成する連想キーワード生成部である。
次に本装置の動作の流れを第2図の例に従って説明する
。
。
第2図において、6は利用者が人力したサンプル文書で
あり、これは利用者が検索することによって手に入れた
い文書と同じ内容傾向の文書である。このサンプル文書
6を文書情報抽出部]が解析し、「米国」 「リビア」
「テロ」という3つの用語を抽出し、これらが同一文
書関連用語であることを示す文書情報7を作成する。
あり、これは利用者が検索することによって手に入れた
い文書と同じ内容傾向の文書である。このサンプル文書
6を文書情報抽出部]が解析し、「米国」 「リビア」
「テロ」という3つの用語を抽出し、これらが同一文
書関連用語であることを示す文書情報7を作成する。
なお、第2図の8はシソーラス2の内容の1部を示すも
ので、「テロ」 「テロリズム」 「テロリスト」なる
用語が同義語や類語として登録され、「リビア」 「カ
ダフィ」なる用語が関連して登録され、「アメリカ合衆
国」 「米国」 「米」 「レーガン」なる用語が関連
して登録されている。
ので、「テロ」 「テロリズム」 「テロリスト」なる
用語が同義語や類語として登録され、「リビア」 「カ
ダフィ」なる用語が関連して登録され、「アメリカ合衆
国」 「米国」 「米」 「レーガン」なる用語が関連
して登録されている。
シソーラスリンク生成部3は、文書情報7として示され
た同一文書関連用語「米国」 「リビア」「テロ」の3
つをシソーラス2上でリンクさせた動的シソーラス9を
作成する。
た同一文書関連用語「米国」 「リビア」「テロ」の3
つをシソーラス2上でリンクさせた動的シソーラス9を
作成する。
次の動作として利用者が「米国」なる用語をキ−ワード
10として人力すると、連想キーワード生成部5は、動
的シソーラス9上において「米国」につながっているリ
ンクを次々とたどり、「米」「アメリカ合衆国」 「レ
ーガン」 「リビア」 「カダフィ」 「テロ」 「テ
ロリスト」 「テロリズム」の各用語を連想キーワード
として引き出す。このように、動的シソーラスを使用し
て利用者の入力した検索用キーワードに自動的に検索対
象文書を検索するのに最適な情報を補完する連想キーワ
ードを生成している。
10として人力すると、連想キーワード生成部5は、動
的シソーラス9上において「米国」につながっているリ
ンクを次々とたどり、「米」「アメリカ合衆国」 「レ
ーガン」 「リビア」 「カダフィ」 「テロ」 「テ
ロリスト」 「テロリズム」の各用語を連想キーワード
として引き出す。このように、動的シソーラスを使用し
て利用者の入力した検索用キーワードに自動的に検索対
象文書を検索するのに最適な情報を補完する連想キーワ
ードを生成している。
[発明の効果]
以上で説明したように本発明のキーワード連想生成装置
は、従来のように目的の文書を入手するまで入手によっ
て入力された検索用キーワードの変更を繰り返す方式と
は異なり、検索用キーワードに自動的に情報を補完した
適切な検索用キーワードである連想キーワードを生成す
る。この連想キーワードを使用して検索を行うことによ
り、従来までの人手で検索用キーワードを変更して検索
を繰り返すという作業がなくなり、検索作業時間が1/
10以下に短縮され、かつ、検索された全文書中に含ま
れる検索対象文書の割合と全検索対象文書の内で実際に
検索された検索対象文書の割合とからなる検索精度か3
倍以上に向上するという効果がある。
は、従来のように目的の文書を入手するまで入手によっ
て入力された検索用キーワードの変更を繰り返す方式と
は異なり、検索用キーワードに自動的に情報を補完した
適切な検索用キーワードである連想キーワードを生成す
る。この連想キーワードを使用して検索を行うことによ
り、従来までの人手で検索用キーワードを変更して検索
を繰り返すという作業がなくなり、検索作業時間が1/
10以下に短縮され、かつ、検索された全文書中に含ま
れる検索対象文書の割合と全検索対象文書の内で実際に
検索された検索対象文書の割合とからなる検索精度か3
倍以上に向上するという効果がある。
第1図は本発明の一実施例によるキーワード連想生成装
置の概略構成図、第2図は同上装置の動作の流れを示す
説明図である。
置の概略構成図、第2図は同上装置の動作の流れを示す
説明図である。
Claims (1)
- キーワードとなり得る用語をその同義語や密接な類語と
ともに集めたシソーラスと、利用者が入力したサンプル
文書からキーワードとなり得る用語を抽出する手段と、
同一サンプル文書から抽出された複数の用語を前記シソ
ーラスにおいて同一文書関連用語としてリンクさせる手
段と、利用者が入力したキーワードについて、その用語
の同義語や密接な類語を前記シソーラスから引き出すと
ともに、それら各用語の同一文書関連用語としてリンク
された各用語、およびその同義語や密接な類語を前記シ
ソーラスから引き出す手段とを備えたことを特徴とする
キーワード連想生成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2049536A JPH03252767A (ja) | 1990-03-02 | 1990-03-02 | キーワード連想生成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2049536A JPH03252767A (ja) | 1990-03-02 | 1990-03-02 | キーワード連想生成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH03252767A true JPH03252767A (ja) | 1991-11-12 |
Family
ID=12833897
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2049536A Pending JPH03252767A (ja) | 1990-03-02 | 1990-03-02 | キーワード連想生成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH03252767A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008282322A (ja) * | 2007-05-14 | 2008-11-20 | Sony Ericsson Mobilecommunications Japan Inc | 情報処理装置及び情報処理方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6057464A (ja) * | 1983-09-08 | 1985-04-03 | Sanyo Electric Co Ltd | 保険調剤請求業務用計算機における項目指定検索方式 |
JPS63101963A (ja) * | 1986-10-20 | 1988-05-06 | Fujitsu Ltd | 検索システム |
JPH021057A (ja) * | 1988-01-20 | 1990-01-05 | Ricoh Co Ltd | 文書検索装置 |
JPH0256068A (ja) * | 1988-08-20 | 1990-02-26 | Nec Corp | 関連語の連鎖探索方式 |
-
1990
- 1990-03-02 JP JP2049536A patent/JPH03252767A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6057464A (ja) * | 1983-09-08 | 1985-04-03 | Sanyo Electric Co Ltd | 保険調剤請求業務用計算機における項目指定検索方式 |
JPS63101963A (ja) * | 1986-10-20 | 1988-05-06 | Fujitsu Ltd | 検索システム |
JPH021057A (ja) * | 1988-01-20 | 1990-01-05 | Ricoh Co Ltd | 文書検索装置 |
JPH0256068A (ja) * | 1988-08-20 | 1990-02-26 | Nec Corp | 関連語の連鎖探索方式 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008282322A (ja) * | 2007-05-14 | 2008-11-20 | Sony Ericsson Mobilecommunications Japan Inc | 情報処理装置及び情報処理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ahonen et al. | Applying data mining techniques for descriptive phrase extraction in digital document collections | |
KR100594512B1 (ko) | 지식 창조 능력을 가지는 문서 의미 분석/선택 시스템 및그 방법 | |
US6289342B1 (en) | Autonomous citation indexing and literature browsing using citation context | |
JP2002197096A (ja) | 文書の一般テキストサマリを作成する方法およびシステム | |
US5893094A (en) | Method and apparatus using run length encoding to evaluate a database | |
JPH0424869A (ja) | 文書処理システム | |
JP2000315216A (ja) | 自然言語検索方法および装置 | |
JP2006506692A (ja) | テンプレート・オートマトンとレイテント・セマンティック・インデックス原理に基づく新しいコンピュータ支援メモリ翻訳スキーム | |
US20040122660A1 (en) | Creating taxonomies and training data in multiple languages | |
JPH10260972A (ja) | 関連文書検索装置及び関連文書検索プログラムを記録した記録媒体 | |
Robertson et al. | Information retrieval research | |
JPH08339378A (ja) | 類似文字列の展開方法、検索方法及びそれらの装置 | |
JPH1049543A (ja) | 文書検索装置 | |
JP2883153B2 (ja) | キーワード抽出装置 | |
Chandrasekar et al. | Gleaning information from the web: Using syntax to filter out irrelevant information | |
Chandrasekar et al. | Institute for Research in Cognitive Science | |
CN106570058A (zh) | 一种搜索方法和搜索引擎 | |
JP4103905B2 (ja) | 統合化検索システム | |
Lecoeuche | Finding comparatively important concepts between texts | |
JPH03252767A (ja) | キーワード連想生成装置 | |
JPH10149370A (ja) | 文脈情報を用いた文書検索方法および装置 | |
US20040093322A1 (en) | Method and system for information aggregation and filtering | |
JP3747542B2 (ja) | 統合化検索装置 | |
JPH09185632A (ja) | 情報検索・編集方法及び装置 | |
Robertson et al. | On the marriage of information retrieval and information extraction |