JP2519121B2 - 情報検索装置 - Google Patents

情報検索装置

Info

Publication number
JP2519121B2
JP2519121B2 JP2256660A JP25666090A JP2519121B2 JP 2519121 B2 JP2519121 B2 JP 2519121B2 JP 2256660 A JP2256660 A JP 2256660A JP 25666090 A JP25666090 A JP 25666090A JP 2519121 B2 JP2519121 B2 JP 2519121B2
Authority
JP
Japan
Prior art keywords
keyword
search
information
words
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2256660A
Other languages
English (en)
Other versions
JPH04133173A (ja
Inventor
保 岩渕
幹夫 荒井
健司 大友
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TELEMATIC KOKUSAI KENKYUSHO
Original Assignee
TELEMATIC KOKUSAI KENKYUSHO
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TELEMATIC KOKUSAI KENKYUSHO filed Critical TELEMATIC KOKUSAI KENKYUSHO
Priority to JP2256660A priority Critical patent/JP2519121B2/ja
Publication of JPH04133173A publication Critical patent/JPH04133173A/ja
Application granted granted Critical
Publication of JP2519121B2 publication Critical patent/JP2519121B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文献検索に利用するに適する。本発明は、
学術論文、書籍、特許明細書、その他言葉により記述さ
れた情報の検索に関する。
〔概 要〕
入力された質問文からキーワードを抽出し、そのキー
ワードにより情報検索を行う装置において、 提供要求用語辞書およびキーワード辞書を備え、質問
文から切り出された単語のうち提供要求用語を除去し、
キーワードを合理的に設定することにより、 被検索情報に合理的に接近できるようにしたものであ
る。
〔従来の技術〕
現在、データベースを利用した多数の情報検索装置が
商業的に稼働しており、学術論文、書籍、特許明細書そ
の他の検索に利用されている。
このような情報検索装置において、データベースに蓄
積された情報の検索は、キーワードを入力することによ
って行われる。一般的な商用データベースでは、キーワ
ードの一覧表を利用者に配布しておき、利用者は、この
一覧表を参照しながら、キーワードを表す符号を入力す
る。キーワードは情報毎にその内容に関連して付与され
ており、キーワードおよびその組み合わせを適切に選べ
ば、データベースから所望の情報を抽出できる。
〔発明が解決しようとする課題〕
しかし、従来の情報検索装置は、キーワードの入力方
法が複雑であり、しかも、データベースに蓄積された情
報に対してどのようなキーワードがどのように付与され
ているか、利用者にわかり難い欠点があった。
本発明は、このような課題を解決し、自然会話文によ
る情報の検索が可能な情報検索装置を提供することを目
的とする。
〔課題を解決するための手段〕
本発明の情報検索装置は、きわめて多数の情報が蓄積
された記憶装置と、この記憶装置をアクセスしキーワー
ドにしたがって情報の検索を行う検索手段と、この検索
手段にキーワードを与える入力手段と、検索手段の検索
手段を表示する表示手段とを備え、入力手段は、文字入
力手段と、キーワードとして用いられる単語があらかじ
め登録されたキーワード辞書と、文字入力手段に入力さ
れた質問文を取込み、単語に分解する手段と、この手段
により分解された単語からキーワード候補を採用する手
段と、キーワード辞書を参照して採用する手段により採
用されたキーワード候補の内からキーワードを決定して
検索手段に与えるキーワード決定手段とを含む情報検索
装置において、自然会話文による検索を行うためにデー
タベース情報の提供者とデータベース情報の入手要求者
との間で用いられる自立語用語であり、検索しようとす
る情報の主題を構成するキーワードとは別の自立語用語
である提供要求用語があらかじめ登録された提供要求用
語辞書を備え、採用する手段は、提供要求用語辞書を参
照して、検索文に含まれる提供要求用語を除去する手段
を含むことを特徴とする。
ここで「提供要求用語」とは、データベース情報の提
供者およびデータベース情報の入手要求(検索)者が取
り交わす会話で、自立語のなかの狭義のキーワード、す
なわち情報の主題を構成すると判断されて付与されたキ
ーワードではない自立語用語をいう。また、この提供要
求用語の語彙辞書を「提供要求用語辞書」という。
提供要求用語を大別すると、二次(絞り込み)検索用
語と、非キーワードとになる。二次検索用語には、例え
ば使用言語、発行国、著者所属機関などが含まれる。非
キーワードには、情報、資料、ニュース、論文、文献な
どが含まれる。
キーワード決定手段は、キーワード候補のうち、キー
ワード辞書にある語と完全に一致する語(完全一致)お
よびキーワード辞書にある語を包括する語(包括一致)
については無条件にキーワードとして作用する手段と、
キーワード候補のうち、キーワード辞書にある語と部分
的に一致する語(部分一致)についてはいったん表示手
段に表示して操作者の選択によりキーワードとしての採
否を決定する手段とを含むことが望ましい。
また、シソーラス辞書を備え、キーワード決定手段
は、このシソーラス辞書を参照し、すでに採用されたキ
ーワードの関連語、同義語、上位語および下位語を表示
手段に表示させ操作者に選択させる手段と、この手段に
より選択された語をキーワードとして追加採用する手段
とを含むことが望ましい。
提供要求用語を除去する手段には、提供要求用語辞書
にある後であっても、その後につづいて助詞「に」があ
る場合には、その語を提供要求用語として除去すること
を禁止する手段を含むことが望ましい。
検索手段の検索結果をその検索対象情報の中に含まれ
る当該キーワードの数の多い順にその情報の表示部分を
表示手段に表示させる概念検索手段を備えることが望ま
しい。
この概念検索手段は、その検索結果をその検索対象情
報の中に含まれる当該キーワードの数の多い順に、表示
手段の画面の中央から外に向けてうずまき状に配列して
表示させる手段を含むことが望ましい。
概念検索手段には、キーワードの重みを文字入力手段
からの操作により変更する手段と、検索されたデータの
それぞれについてそのデータに付与されたすべてのキー
ワードの重みの和を求める手段と、データの出力順をこ
の和の大きい順に並び変える手段とを含むことが望まし
い。
〔作 用〕
自然会話文により情報検索を行うためには、その文に
含まれる単語から、情報検索のためのキーワードを抽出
する必要がある。
キーワード抽出の簡単な方法としては、キーワード辞
書に登録された単語との一致を調べる方法が考えられ
る。しかしこの方法では、実際にデータベースで使用さ
れているキーワードしか抽出できない。このため、自然
会話文とはいえ正確なキーワードを入力する必要があ
り、従来と同様にキーワードの一覧を参照しながら質問
文を入力する必要がある。
そこで本発明では、入力された質問文から、まず、検
索キーワードとはなり得ない単語、すなわち提供要求用
語を取り除く。このとき残った単語がキーワードの候補
となる。この単語を以下「候補語」という。候補語に
は、実際に使用されているキーワード(キーワード辞書
に登録されている単語)に含まれる単語(包括一致
語)、キーワードと完全に一致する単語(完全一致
語)、一部分が一致する単語(部分一致語)、キーワー
ドと意味が似ている単語(近隣語)などが含まれる。こ
れらの単語から、実際に検索に使用する単語を選択す
る。
具体的に説明すると、包括一致語については、キーワ
ード辞書に登録されている単語をキーワードとして採用
する。例えば、キーワード辞書に「キーワード」が登録
されている場合の候補語「キー」については、「キーワ
ード」を実際のキーワードとして採用する。完全一致語
については、そのままキーワードとして採用する。部分
一致語および近接語については、キーワード辞書の単語
を表示し、操作者に採用または不採用を選択させる。キ
ーワード辞書の用語に候補語と一致するものがない場合
には、その候補語は破棄する。
また、すでに採用されたキーワードの近隣語を表示し
て操作者に選択させることにより、どのようなキーワー
ドが付与されているかを知らない操作者でも、とりあえ
ず考えついたキーワードを入力すれば、その後の操作で
最適なキーワードを選択できる。
提供要求用語であっても、その語に続いて助詞「に」
がある場合には、その前の自立語が対象や関連を意味し
ている可能性がある。そこで、そのような自立語をキー
ワードの候補語とし、その候補語がキーワードであると
判定された場合には、それを絞り込み検索を行うための
二次検索用語として使用する。
森田良行、松本正恵、共著、「日本語表現文型」、
(株)アルク出版、第7頁から第14頁に示されているよ
うに、格助詞の働きをする複合辞の意味と用法のなか
で、対象や関連を示す複合辞としては、 について/につき/に関(して、する)/にたいし
(て)/をめぐって/をめぐり/にかけて(は、も)/
にかけると/にかけても/につけ(て) がある。ここで、「をめぐって」、「をめぐり」以外は
すべて「に」から始まっている。自然会話での検索の場
合、「をめぐって」、「をめぐり」は特殊ないいまわし
であり、本発明では「に」付きの複合辞のみを採用する
ことにした。したがって、「に」の前の自立語を提供要
求用語とは判断せず、キーワードの候補語とする。
〔実施例〕
第1図は本発明実施例情報検索装置のブロック構成図
である。ここでは、文献情報の検索に本発明を実施する
場合を例に説明する。
この情報検索装置は、きわめて多数の情報が蓄積され
た記憶装置としてデータベース記憶装置6を備え、この
データベース記憶装置6をアクセスしキーワードにした
がって情報の検索を行う検索手段として検索処理部5を
備え、この検索処理部5にキーワードを与える入力手段
としてキーボード1、入出力処理部3および辞書記憶部
4を備え、検索処理部5の検索結果を表示する表示手段
として、入出力処理部3に接続された表示部2を備え
る。
ここで本実施例の特徴とするところは、文字入力手段
としてキーボード1を備え、辞書記憶部4にはキーワー
ド辞書、提供要求用語辞書およびシソーラス辞書が蓄え
られ、入出力処理部3には、自然会話文による検索、近
隣語検索、概念検索の三つの処理を行う制御手段が設け
られたことにある。
第2図は自然会話文による検索を行うための構文解析
の処理の流れを示す。
入出力処理部3は、まず、キーボード1に入力された
質問文を取込み、それを単語に分解する。続いて、この
分解された単語のうち提供要求用語辞書を参照して提供
要求用語を除去し、残りの単語をキーワード候補として
採用し、このキーワード候補の内からキーワードを決定
して検索処理部5に与える。第2図には、個々の単語に
対して順番に処理を行う場合を示したが、個々の処理で
すべての単語を一括して処理することもできる。
単語分解の処理では、入力された自然会話文から、ひ
ら仮名を除く文字種で2文字以上の単語を切り出して検
索キーワード候補とする。
提供要求用語か否かの判断は、単語分解の処理で切り
出された単語群と、提供要求用語との突き合わせ処理を
行い、その一致または不一致により判断する。ただし、
単語の直後にひら仮名の「に」(助詞)があるときに
は、その語を提供要求用語として除去することを禁止
し、それをキーワード候補として扱う。また、提供要求
用語であっても、二次(絞り込み)検索用語である使用
言語、発行国または著者所属機関であれば、確定したキ
ーワードと共に使用し、検索実行時の絞り込み検索に使
用する。それ以外は非キーワードとして切り捨てる。
例えば、「…に関する日本語の(で表記された)文献
が乾しい。」という質問文であれば、「日本語」、「文
献」が提供要求用語として除去される。これに対して、
「日本語(の言語学上の特徴)に関する文献が欲し
い。」という質問文であれば、「日本語」はキーワード
となる。
提供要求用語ではないと判断された単語(以下「候補
語」という)については、キーワード辞書を参照し、キ
ーワード辞書にある後と完全に一致する後(完全一致)
およびキーワード辞書にある語を包括する語(包括一
致)については無条件にキーワードとして採用し、キー
ワード辞書にある語と部分的に一致する語(部分一致)
についてはいったん表示部2に表示して操作者の選択に
よりキーワードとしての採否を決定する。
さらに詳しく説明すると、候補語とキーワード辞書に
ある語との一致を包括一致、完全一致、部分一致、2文
字包括一致、1文字包括一致の順で調べる。この流れを
第3図に示す。
候補語が包括されるキーワードを最優先で採用し、続
いて、候補語がキーワードと完全に一致した場合にもそ
れをキーワードとして採用する。これらの場合には、そ
のキーワードと採用したメッセージとを表示部2に表示
する。候補語と3文字以上が一致するキーワードがある
場合には、そのキーワードを採用するか否かを操作者に
選択させる。候補語の2文字または1文字を含むキーワ
ードがある場合には、それを表示部2に順番に表示し、
操作者に、採用または不採用、さらには候補キーワード
の表示の中止を選択させる。候補語がまったくキーワー
ド辞書の用語と一致採用キーワードなしのメッセージを
表示する。
第4図ないし第8図に構文解析による表示例を示す。
第4図ないし第7図は、「自動分類と自動索引法と自
動抄録に関する情報がほしい。」という質問文に対する
応答を示し、それぞれの図で、「自動索引法」および
「自動分類」が完全一致で採用され、「情報」が要求用
語なので削除され、「自動抄訳法」が包括一致で採用さ
れたことを示す。
また、第8図は、「岩淵に関する全てを知りたい。」
という質問文に対する応答を示す。この例では、「岩
淵」の「岩」を含む「岩石学」をキーワードとするかど
うかについて、操作者に入力を要求している。
第9図は近隣語検索の処理の流れ図である。
データベースの利用者にとって、「そのデータベース
で、どのようなキーワードが、どのように付与されてい
るか」についての知識はないのが一般的である。このた
め、とりあえず考え付いたキーワードを入力せざるを得
ない。そこで本実施例では、利用者(操作者)の本来の
意図を誘導するため、また、再現率を最大にするため
に、近隣語検索処理を行う。
この処理では、シソーラス辞書を参照し、すでに採用
されたキーワードの関連語、同義語、上位語および下位
語を表示部2に表示して操作者に選択させ、このとき選
択された語をキーワードとして追加採用する。
すなわち、構文解析の処理で確定したキーワードに対
して、その近隣語をシソーラス辞書と突き合わすことに
より取得し、キーワードと取得した近隣語とのそれぞれ
が付与された文献の件数をデータベースにアクセスして
調べ、その結果を表示部2に表示する。このとき、二つ
のキーワードについて同時表示し、その一方を参照しな
がら、他方のキーワードを再入力できる。
第10図は近隣語検索時の表示フォーマットを示し、第
11図および第12図はその表示例を示す。第11図および第
12図における三角の印は、表示されていない上位語がま
だあることを示す。
このように近似語検索を行うことにより、利用者が意
図する検索キーワードが、試行錯誤により、複数個組み
合わせて決定できる。
第13図は概念検索の処理の流れを示す。
この処理では、検索処理部5による検索結果をその検
索対象情報の中に含まれる当該キーワードの数の多い順
にその情報の表示部分を表示手段に表示させる。
すなわち、検索された文献情報について、それぞれに
付与されているキーワード部分を切り出し、そのキーワ
ード毎にその出現回数を計数する。さらに、この出現回
数の多い順に、表示部2の画面の中央から外に向けてう
ずまき状に配列して表示させる。この表示例を第14図に
示す。
さらに、この状態で、操作者によるキーワードの重み
付けを受け付ける。このとき操作者は、自分の検索意図
にしたがって、キーワードに重みを付けることができ
る。また、前に付けた重みを変更することもできる。
操作者による重み付けが終了すると、文献毎にその重
み(重要度係数)を計算し、その係数の大きい文献情報
から順に出力する。
このようにして、検索されたデータ群に対してそのキ
ーワードに重みをもたせ、重要なキーワードを多く含む
データから順に出力させる。したがって、利用者の要求
に適合したデータが初期に得られる可能性が高くなる。
〔発明の効果〕
以上説明したように、本発明の情報検索装置は、提供
要求用語辞書を用いて非キーワードを同定すことによ
り、自然会話文の検索が可能となり、二次検索も容易と
なる効果がある。
また、近隣語検索により、関連する多くのデータを得
ることができ、漏れのない検索が可能となる効果があ
る。
さらに、概念検索により、必要性の高いデータを得る
可能性が高くなる効果がある。
【図面の簡単な説明】
第1図は本発明実施例情報検索装置のブロック構成図。 第2図は構文解析の処理の流れ図。 第3図はキーワード判定および採用の処理の流れ図。 第4図ないし第8図は構文解析による表示例を示す図。 第9図は近隣語検索の処理の流れ図。 第10図は近隣語検索時の表示フォーマットを示す図。 第11図および第12図は近隣語検索時の表示例を示す図。 第13図は概念検索の処理の流れ図。 第14図は概念検索におけるキーワードの表示例を示す
図。 1……キーボード、2……表示部、3……入出力処理
部、4……辞書記憶部、5……検索処理部、6……デー
タベース記憶装置。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平1−217623(JP,A) 特開 平1−112331(JP,A) 特開 昭57−182279(JP,A)

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】きわめて多数の情報が蓄積された記憶装置
    と、この記憶装置をアクセスしキーワードにしたがって
    前記情報の検索を行う検索手段と、この検索手段にキー
    ワードを与える入力手段と、前記検索手段の検索手段を
    表示する表示手段とを備え、 前記入力手段は、 文字入力手段と、 キーワードとして用いられる単語があらかじめ登録され
    たキーワード辞書と、 前記文字入力手段に入力された質問文を取込み、単語に
    分解する手段と、 この手段により分解された単語からキーワード候補を採
    用する手段と、 前記キーワード辞書を参照して前記採用する手段により
    採用されたキーワード候補の内からキーワードを決定し
    て前記検索手段に与えるキーワード決定手段と を含む 情報検索装置において、 自然会話文による検索を行うためにデータベース情報の
    提供者とデータベース情報の入手要求者との間で用いら
    れる自立語用語であり、検索しようとする情報の主題を
    構成するキーワードとは別の自立語用語である提供要求
    用語があらかじめ登録された提供要求用語辞書を備え、 前記採用する手段は、前記提供要求用語辞書を参照し
    て、検索文に含まれる提供要求用語を除去する手段を含
    む ことを特徴とする情報検索装置。
  2. 【請求項2】シソーラス辞書を備え、 前記キーワード決定手段は、このシソーラス辞書を参照
    し、すでに採用されたキーワードの関連語、同義語、上
    位語および下位語を前記表示手段に表示させ操作者に選
    択させる手段と、この手段により選択された語をキーワ
    ードとして追加採用する手段とを含み、 前記選択させる手段は、前記関連語、同義語、上位語お
    よび下位語のすべてを同一画面上に同時に表示する手段
    を含む 請求項1記載の情報検索装置。
  3. 【請求項3】前記提供要求用語を除去する手段には、前
    記提供要求用語辞書にある語であっても、その語に続い
    て助詞「に」がある場合には、その語を提供要求用語と
    して除去することを禁止する手段を含む請求項1記載の
    情報検索装置。
  4. 【請求項4】前記検索手段の検索結果から利用者の要求
    に適合したデータを得るための概念検索手段を備え、 この概念検索手段は、前記検索手段の検索結果につい
    て、その検索対象情報の表示部分を、その検索対象情報
    の中に含まれる当該キーワードの数の多い順に、前記表
    示手段の画面の中央から外に向けてうずまき状に配列し
    て表示させる手段を含む 請求項1記載の情報検索装置。
  5. 【請求項5】前記概念検索手段には、キーワードの重み
    を前記文字入力手段からの操作により変更する手段と、
    検索されたデータのそれぞれについてそのデータに付与
    されたすべてのキーワードの重みの和を求める手段と、
    データの出力順をこの和の大きい順に並び変える手段と
    を含む請求項4記載の情報検索装置。
JP2256660A 1990-09-25 1990-09-25 情報検索装置 Expired - Lifetime JP2519121B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2256660A JP2519121B2 (ja) 1990-09-25 1990-09-25 情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2256660A JP2519121B2 (ja) 1990-09-25 1990-09-25 情報検索装置

Publications (2)

Publication Number Publication Date
JPH04133173A JPH04133173A (ja) 1992-05-07
JP2519121B2 true JP2519121B2 (ja) 1996-07-31

Family

ID=17295704

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2256660A Expired - Lifetime JP2519121B2 (ja) 1990-09-25 1990-09-25 情報検索装置

Country Status (1)

Country Link
JP (1) JP2519121B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06162079A (ja) * 1992-11-20 1994-06-10 Matsushita Electric Ind Co Ltd 対訳検索装置
JP3460171B2 (ja) * 1997-03-14 2003-10-27 大日本スクリーン製造株式会社 データ検索方法
JP5334214B2 (ja) * 2011-04-01 2013-11-06 Necシステムテクノロジー株式会社 組織内ソーシャルマップ作成システム及び組織内ソーシャルマップ作成方法
JP7139631B2 (ja) * 2018-03-13 2022-09-21 富士通株式会社 情報処理プログラム、情報処理方法、および情報処理装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57182279A (en) * 1981-05-02 1982-11-10 Canon Inc Character processor
JPH0740275B2 (ja) * 1987-10-26 1995-05-01 日本電信電話株式会社 キーワード重要度自動評価装置
JPH01217623A (ja) * 1988-02-26 1989-08-31 Nippon Telegr & Teleph Corp <Ntt> キーワード自動生成装置

Also Published As

Publication number Publication date
JPH04133173A (ja) 1992-05-07

Similar Documents

Publication Publication Date Title
US6876998B2 (en) Method for cross-linguistic document retrieval
US7783644B1 (en) Query-independent entity importance in books
US5940624A (en) Text management system
US20050203900A1 (en) Associative retrieval system and associative retrieval method
KR20040025642A (ko) 확인 문장을 검색하기 위한 방법 및 시스템
KR20160060253A (ko) 자연어 질의 응답 시스템 및 방법
JPH03172966A (ja) 類似文書検索装置
KR100396826B1 (ko) 정보검색에서 질의어 처리를 위한 단어 클러스터 관리장치 및 그 방법
JP3847273B2 (ja) 単語分類装置、単語分類方法及び単語分類プログラム
KR20020072092A (ko) 단락 단위의 실시간 응답 색인을 이용한 자연어 질의-응답검색시스템
Leveling et al. On metonymy recognition for geographic information retrieval
JP2519121B2 (ja) 情報検索装置
Tenopir et al. DIALOG and Mead join the relevance ranks
JP4499179B1 (ja) 端末装置
JPH0944523A (ja) 関連語提示装置
JP4428703B2 (ja) 情報検索方法及びそのシステム並びにコンピュータプログラム
KR20030006201A (ko) 홈페이지 자동 검색을 위한 통합형 자연어 질의-응답시스템
Dittenbach et al. What customers really want to know from tourism information systems but never dared to ask
JP2001101207A (ja) 文書要約装置
Berger et al. Querying tourism information systems in natural language
AU668073B2 (en) A text management system
Mohamed et al. Information Retrieval Systems: Between Morphological Analyzers and Systemming Algorithms
JP4049967B2 (ja) データベース処理装置
JP2004287696A (ja) 検索システム及び検索プログラム
KR100657016B1 (ko) 문서에서 연관성 있는 구문 검출을 위한 증거소스 결합과,증거소스 결합을 통한 질의 검색방법