JP2001202389A

JP2001202389A - 文書検索装置及び文書検索方法

Info

Publication number: JP2001202389A
Application number: JP2000376596A
Authority: JP
Inventors: Seiji Miike; 誠司三池; Kenji Ono; 顕司小野; Kazuo Sumita; 一男住田; Yoichi Takebayashi; 洋一竹林
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2000-12-11
Filing date: 2000-12-11
Publication date: 2001-07-27
Anticipated expiration: 2017-05-13
Also published as: JP3281361B2

Abstract

(57)【要約】【目的】本発明は、多くの文書の中から所望する文書を
簡単に入手することができる文書検索装置を提供する。【構成】本発明は、複数の文書を文書格納手段１５に格
納しておき、キーワード抽出手段１４４によりこの格納
された文書を要約し、この要約された文書からキーワー
ドを抽出する。そして、入力部１１より文書検索のため
のキーワードを入力させると、検索手段１８はこのキー
ワードとキーワード抽出手段の抽出キーワードとを比較
し、前記文書格納手段より該当する文書を検索する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、複数の文書を格納
した文書データベースから所望の文書を検索する文書検
索装置及び文書検索方法に関するものである。

【０００２】

【従来の技術】近年、ワープロや計算機の普及を始めと
して、電子ニュ−スや電子メールの普及により、これま
で紙の上でしか得られなかった情報について、ＣＤ‐Ｒ
ＯＭによる出版（辞書、百科辞典など）など、文書の電
子化が進みつつある。今後、このような文書の電子化は
加速的に進んでいくと予測される。

【０００３】これにともない、蓄積した文書を有効利用
するため、大量の文書から所望の文書を検索する情報検
索システムが注目されている。

【０００４】しかして、従来より実用化されている文書
検索システムとして、キーワードをＡＮＤ、ＯＲ、ＮＯ
Ｔなどの論理演算子あるいはキーワード間に存在する文
字・文・段落の数を指定する近接演算子と組み合わせ
て、そのキーワードを含有する文書を検索するものが知
られている。

【０００５】しかし、このような従来の文書検索システ
ムによると、必ずしも利用者が所望する文書を検索でき
るわけではなかった。これは論理演算子を用いた検索式
で、例えば「計算機ＡＮＤ設計」と指定すると、
「計算機を使って設計する」という内容の文書も、「計
算機自体を設計する」という内容の文書も同様に検索さ
れてしまう。近接演算子を用いた検索式でも、キーワー
ド間の物理的な距離を判定するのみであり、必ずしも適
切な文書を検索できるわけでなかった。

【０００６】

【発明が解決しようとする課題】このように従来の文書
検索システムにあっては、検索結果に利用者が所望する
文書でない文書が多く含まれるため、所望する文書を見
落としてしまうような検索もれを防ぐため、所望する文
書に関連すると思われるキーワードを多く用いて検索式
を作成する。しかしこの検索式に基づいて文書検索をす
ると、非常に多くの検索ノイズ、ゴミが検索結果に含ま
れてしまう。

【０００７】このため、検索した結果が所望の文書であ
るか否かを利用者が判定する作業に多大な時間が必要で
あった。逆に、検索ノイズを少なくするために、キーワ
ードの数を少なくして検索式を作成し検索した場合に
は、検索もれを起こしてしまう可能性が高い。

【０００８】このため、従来のキーワード検索において
は、検索もれを起こさず検索ノイズを少なくするには、
どのような文書にどのようなキーワードが付与されてい
るかを熟知した人間でなければ難しく、このような知識
のない利用者にとっては極めて扱いにくいものであっ
た。

【０００９】本発明は、上記事情に鑑みてなされたもの
で、多くの文書の中から所望する文書を簡単に入手する
ことができる文書検索装置及び文書検索方法を提供する
ことを目的とする。

【００１０】

【課題を解決するための手段】上記目的を達成するた
め、本発明は、文書検索のためのキーワードを入力させ
る手段と、複数の文書を格納した文書格納手段と、この
文書格納手段に格納された文書を要約し、この要約され
た文書からキーワードを抽出するキーワード抽出手段
と、このキーワード抽出手段より抽出されたキーワード
と前記入力手段より入力されたキーワードとを比較し前
記文書格納手段より該当する文書を検索する検索手段と
を具備したことを特徴とする。

【００１１】

【作用】本発明は、複数の文書を格納した文書格納手段
の文書を要約し、この要約された文書からキーワードを
抽出する。そして、文書検索のためのキーワードを入力
すると、この入力されたキーワードと前記抽出されたキ
ーワードとを比較することにより、前記文書格納手段よ
り該当する文書を検索する。

【００１２】この結果、多くの文書の中から利用者が所
望する文書を容易に入手できるようになる。

【００１３】

【実施例】以下、本発明の実施例を図面に従い説明す
る。

【００１４】（第１実施例）図１は、第１実施例の概略
構成を示している。図において、１は中央処理手段で、
この中央処理手段１には、記憶手段２を接続し、また、
表示コントローラ３を介して表示手段４を接続するとと
もに、入力コントローラ５を介して入力手段６を接続し
ている。

【００１５】ここで、中央処理手段１は、入力解析、検
索処理や主題解析などの処理を行うものである。記憶手
段２は、文書などを記憶しておくもので、半導体メモ
リ、固定磁気ディスク、光磁気ディスクなどからなって
いる。表示手段４は、表示コントローラ３の表示制御に
従って検索結果である文書のテキストや、それに含まれ
るグラフィックス、オーディオ、音声などを表示または
出力するようにしている。そして、入力手段６は、検索
命令の入力などを行うキーボードやマウスからなるもの
で、入力コントローラ５により入力制御されるようにな
っている。

【００１６】なお、図１において、入力解析、検索処理
や主題解析などの処理を行う中央処理手段１や文書を格
納しておく記憶手段２は、単数の構成ではなく、複数を
有する構成であっても構わない。これらが、パスやネッ
トワークなどを介した形で、本実施例を実施することは
容易である。

【００１７】次に、図２は、第１実施例の機能構成を示
している。この場合、自然言語文を入力する入力部１
１、その入力文を形態素解析、構文解析および意味解析
する入力解析部１２、入力文から抽出したキーワードか
ら検索式を作成し、検索式と入力文の構文意味解析結果
に従って文書を検索する検索処理部１３、検索した個々
の文書の要約文を生成する主題解析部１４、文書データ
ベースを格納しておく文書格納部１５、検索した文書な
どを格納する個人情報格納部１６、入力解析部、検索処
理部や主題解析部などで解析した結果に基づいて表示を
行う検索結果表示部１７、そして、入力部１１、入力解
析部１２、検索処理部１３、主題解析部１４、検索結果
表示部１７などの制御や利用者との対話管理を行う検索
制御部１８から構成される。

【００１８】ここで、文書格納部１５ならびに個人情報
格納部１６は、図１における記憶手段２の一部に設定さ
れ、入力部１１、入力解析部１２、検索処理部１３、主
題解析部１４、検索結果表示部１７および検索制御部１
８は、図１における中央処理手段１に設定される。

【００１９】また、図２において、太線はデータ線を表
し、細線は制御線を表している。

【００２０】このような構成において、検索制御部１８
は、以下述べる処理が順次実行されるように各処理モジ
ュールを起動していく。

【００２１】図３に、この処理の流れを示している。ま
ず、入力部１１に入力された文字列は入力解析部１２に
転送される。入力解析部１２では、入力された文字列を
形態素解析、構文解析および意味解析し、その結果を個
人情報格納部１６に格納する（ステップ３０１）。

【００２２】次に、検索制御部１８は検索処理部１３を
起動する。検索処理部１３は個人情報格納部１６に格納
されたキーワードから論理演算子などを用いて演算式を
作成し（ステップ３０２）、この演算式に従って文書格
納部１５に格納された文書データベースを検索する（ス
テップ３０３）。

【００２３】また、検索処理部１３は検索した文書集合
を個人情報格納部１６に格納する。さらに検索処理部１
３は、個人情報格納部１６に入力文字列の構文意味解析
結果が格納されているか判断し（ステップ３０４）、格
納されている場合に、個人情報格納部１６に格納された
文書集合に基づいて、文書格納部１５に格納された各文
書の構文意味解析と当該の入力文字列の構文意味解析結
果とを照合する（ステップ３０５）。そして、検索処理
部１３は照合に成功した文書集合を個人情報格納部１６
に格納する。

【００２４】次に、検索制御部１８は、個人情報格納部
１６に格納された文書集合に基づいて、文書格納部１５
に格納されている原文書を取り出し、個々の原文書につ
いて主題解析部１４を起動する。主題解析部１４では、
原文書から要約文を生成し個人情報記憶部１６に格納す
る。次に、主題解析部１４は、個人情報格納部１６に格
納された各文書について、キーワードまたは構文意味解
析結果が各文書の要約文に含まれるか否かの照合を行い
（ステップ３０６）、その結果を個人情報格納部１６に
格納する。そして、これらの一連の処理が終了した段階
で、検索制御部１８により、検索結果表示部１７を起動
し、各文書の文書名または要約文を所定の優先順序で表
示する（ステップ３０７）。

【００２５】この場合、検索結果表示部１７は、個人情
報格納部１６に格納されている情報を、入力部１から入
力される利用者の指示に従って表示、変更できるように
している。

【００２６】次に、各処理モジュールにおける動作につ
いて説明する。

【００２７】図４は、検索制御部１８での制御の流れを
示している。この場合、検索制御部１８は、入力部１１
からの入力待ちから（ステップ４０１）、入力部１１に
文字列が入力されたことを検知して、入力解析部１２を
起動する（ステップ４０２）。次に、入力解析部１２の
処理が終了したことを検知して（ステップ４０３）、検
索処理部１３を起動する（ステップ４０４）。さらに、
検索処理部１３の処理待ちの後（ステップ４０５）、処
理が終了したことを検知して、主題解析部１４を起動す
る（ステップ４０６）。最後に、主題解析部１４での処
理待ちの後（ステップ４０７）、主題解析部１４の処理
が終了したことを検知して、検索結果表示部１７を起動
し（ステップ４０８）、検索結果表示部１７の処理待ち
となる。

【００２８】図５は、入力解析部１２の機能構成を示
し、図６に入力解析部１２の処理の流れを示している。

【００２９】この場合、入力解析部１２は、形態素解析
部１２０、構文解析部１２１、意味解析部１２２、不要
表現規則適用部１２３、自立語抽出部１２４、検索式作
成部１２５、解析用辞書１２６、解析用文法１２７、不
要表現規則辞書１２８、関連語辞書１２９から構成して
いる。

【００３０】しかして、まず、入力文に対して形態素解
析部１２０で形態素解析を行ない（ステップ６０１）、
解析用辞書１２６を用いて単語ごとに分割する。次に、
解析用辞書１２６と解析用文法１２７を用いて構文解析
部１２１と意味解析部１２２で構文解析および意味解析
を行う（ステップ６０２，６０３）。ここで、形態素解
析・構文解析の手法については、本願の主旨ではなく、
例えば、文献１（「自然言語処理の基礎技術」、野村浩
郷、電子情報通信学会編）などに開示されている手法を
流用すれば良い。

【００３１】さらに、構文意味解析結果に対して、不要
表現規則適用部１２３により不要表現規則辞書１２８中
の不要表現規則を適用し、不要表現規則中の表現に一致
するものがあれば、その構造を削除し（ステップ６０
４）、得られた構造を個人情報格納部に格納するととも
に（ステップ６０５）、得られた構造から自立語抽出部
１２４で自立語を抽出し（ステップ６０６）、検索式作
成部１２５により検索式を作成する（ステップ６０
８）。ここで、検索式を作成する際には、関連語辞書を
参照し、該当する関連語も検索語とする（ステップ６０
８）。そして、全ての検索式を個人情報格納部に格納す
る（ステップ６０９）。

【００３２】図７は、このような入力解析部１２の入力
例、ならびにその入力の解析結果を説明するものであ
る。

【００３３】この場合、同図（ａ）に示す入力文に対し
て形態素解析を行うと、この形態素解析結果として同図
（ｂ）に示すように入力文は単語単位に分割される。次
に、構文解析を行うと、この構文解析結果として同図
（ｃ）に示すように構文構造を表す木構造が生成され、
さらに意味解析を行うと、この意味解析結果として同図
（ｄ）に示すように意味構造を表す木構造が生成され
る。ここでの意味解析には、例えば図８に示すような解
析用辞書中の意味解析に用いる規則が適用される。この
規則は、適用前の構文構造として示しているように、
「用いる」という単語が名詞の単語とサ変名詞の単語の
間に出現している場合に、適用後の意味構造として示し
ているように、当該名詞の単語と当該サ変名詞の単語は
道具格（ｉｎｓｔｒｕｍｅｎｔ）の関係の意味構造に変
化する規則である。同様な規則が「使用する」「援用す
る」などについても記述されている。なお、図７におけ
るｏｂｊｅｃｔは対象格の関係を表している。

【００３４】次いで、不要表現規則辞書中の規則を適用
して、同図（ｅ）に示すように一致する部分構造を削除
する。ここでの不要表現規則適用結果は個人情報格納部
に格納される。そして、不要表現規則適用結果から同図
（Ｆ）に示すような自立語を抽出し、この抽出した自立
語から、論理演算子の＋を用いて同図（ｇ）に示す検索
式を作成し、個人情報格納部に格納されるようになる。
なお、図９は、不要表現規則辞書中の規則の一例を示し
ているが、この不要表現規則辞書中の規則は、部分意味
構造だけでなく、単語でもよい。

【００３５】次に、図１０は、検索処理部１３の機能構
成を示し、図１１に検索処理部１３での処理の流れを示
している。

【００３６】この場合、検索処理部１３は、キーワード
インデックス照合部１３１、意味構造照合部１３２、文
書ファィル集合計算部１３３から構成している。

【００３７】しかして、キーワードインデックス照合部
１３１では、個人情報格納部１６から検索式を取り出し
（ステップ１１０１）、この検索式により後述するキー
ワードインデックス記憶部を検索し、検索式中のキーワ
ードを含む文書を求める（ステップ１１０２）。そし
て、文書ファイル集合計算部１３３により検索された文
書について検索式にしたがって集合演算を行い、その結
果を個人情報格納部１６に格納する（ステップ１１０
３）。さらに、意味構造照合部１３２により個人情報格
納部１６に１つ以上の文書が検索され、かつ、入力文字
列から構文意味解析結果が抽出されているか判断し（ス
テップ１１０４）、ここでＹＥＳの場合に、個人情報格
納部１６から入力文字列の意味構造を取り出し（ステッ
プ１１０５）、意味構造で意味構造インデックス記憶部
を検索し（ステップ１１０６）、得られた結果を個人情
報格納部１６に格納するようになる（ステップ１１０
７）。

【００３８】図１２は、キーワードインデックス記憶部
の内容の一例を示し、図１３、図１４は、キーワードイ
ンデックス照合部１３１での処理の流れを示している。

【００３９】この場合、文書データベース中のキーワー
ドは、ＴＲＥＥ構造の形式でキーワードインデックス記
憶部に格納している。このキーワードインデックス記憶
部は、文書格納部１５に含まれる。また、ＴＲＥＥ構造
は、記憶容量ならびに検索の手間を削減するため、各キ
ーワードのうち同じ文字列を共有化して記憶している。
このようにしたキーワードインデックス記憶部では、各
キーワードを構成する文字とその文字の間のリンク情報
を格納している。例えば、「機械」というキーワードに
対応して、文字「機」のリンク情報には「００９３５」
というリンク情報がある。このリンク情報は、文字
「械」の格納されているアドレスを表している。そして
アドレス「００９３５」に格納されている文字「械」に
は、キーワード「機械」を含む文書データが、「ｆｉｌ
ｅ４」であること、さらに「機械」を前２文字の部分文
字列として含む別のキーワード、「機械翻訳」について
のリンク情報として、「０１２０１」が格納されてい
る。このリンク情報をたどることにより、「機械翻訳」
をキーワードとする文書データが、「ｆｉｌｅ２５」と
「ｆｉｌｅ２１」であることがわかる（「ｆｉｌｅ４」
などは文書データが格納されている文書ファイル名を表
している）。

【００４０】また、キーワード「実例」と「実験」のよ
うに、前方に同じ文字列を含むキーワードは、文字
「実」のリンク情報に格納されている二つのアドレス
「０１００３」と「０１００４」が、それぞれ「験」と
「例」の格納されているアドレスを表している。

【００４１】なお、リンク情報における「０」は、アド
レスや文書データのセパレータを表している。また、す
べてのキーワードの一文字目については、一定の連続す
る記憶領域にＪＩＳコード順などの順序でソートされて
格納されている。

【００４２】しかして、キーワードインデックス照合部
１３１では、検索語の集合を入力として、キーワードイ
ンデックス記憶部を参照し、各検索語について対応する
文書ファイルを求めるようになる。

【００４３】図１３、図１４において、まず、初期化処
理として変数ｉ、Ｎをそれぞれ１、検索語の個数に設定
する（ステップ１３０１）。ここで、変数ｉは対象とす
る検索語を示すインデックスを表している。

【００４４】そして、変数ｉが変数Ｎより小さい間、検
索語ｉの一文字目の文字について「一文字目の文字の格
納領域」を検索し、その文字が格納されているブロック
を求め、そのブロックをブロックＡとする（ステップ１
３０２，１３０３）。ここで、「一文字目の文字の格納
領域」には、文字がソートされて格納されているので、
文字が格納されているブロックを求めるためには、バイ
ナリサーチによって求めることができる。

【００４５】次に、変数ｋに２を格納する（ステップ１
３０４）。この変数ｋは、検索語ｉのうち着目している
文字位置を表す。変数ｋに格納されている値が、検索語
ｉの文字列長より小さい間、各ブロックに格納されてい
る文字と、検索語の各文字の照合を行い対応するブロッ
クを求める（ステップ１３０５，１３０６）。

【００４６】そして、最終的に、検索語に対応する文書
データが存在する場合、それに対応して、キーワードイ
ンデックス中のブロックが検出できることになる。その
ブロックのリンク情報に格納されている文書ファイル名
を文書ファイル集合ｉに設定する（ステップ１３０７，
１３０８）。このような処理を、すべての検索語に対し
て行うことにより、文書ファイル集合１から文書ファイ
ル集合Ｎには、それぞれの検索語に対応する文書ファイ
ル集合が設定されるようになる（ステップ１３０９，１
３１０）。

【００４７】このようにして、すべての文書ファィル集
合についての共通部分を、集合演算により求めて最終的
な文書ファイル集合とする。

【００４８】一方、意味構造照合部１３２は、意味構造
インデックス記憶部を参照し、入力文字列の構文意味解
析結果と一致する意味構造を含む文書を求める処理を行
う。

【００４９】次に、図１５に意味構造照合部１３２の処
理の流れを示し、図１６に意味構造インデックス記憶部
の内容の一例を示している。

【００５０】ここで、意味構造インデックス記憶部に格
納される情報は、予め次のように作成されている。この
場合、文書格納部１５に格納されている各文書を対象と
し、各文書に含まれる文について入力解析を行う。そし
て、この処理の結果得られた意味構造と、それを含む文
の番号とファイル名を格納するようにしている。なお、
入力解析の処理において、複数の解析結果が得られた場
合には、それらすべての解析結果を格納するようにして
いる。また、意味構造インデックス記憶部は、文書格納
部１５に含まれる。

【００５１】しかして、意味構造照合部１３２では、入
力文字列の意味構造の係り先の単語で意味構造インデッ
クス記憶部の係り先の単語を引く（ステップ１５０
１）。そして、一致する係り先の単語があったか判断す
る（ステップ１５０２）。ここで、一致する係り先の単
語があれば関係記号を照合し（ステップ１５０３）、さ
らに一致する関係記号があったか判断する（ステップ１
５０４）。ここでも一致する関係記号があれば、係り元
の単語を照合し（ステップ１５０５）、次いで、一致す
る係り元の単語があったか判断する（ステップ１５０
６）。そして、一致する係り元の単語があれば意味構造
と、ファイル名および文番号を個人情報格納部１６に格
納するようになる。

【００５２】次に、図１７は、主題解析部１４の概略構
成を示している。

【００５３】この場合、主題解析部１４は、文書構造解
析部１４１、文脈構造解析部１４２、キーセンテンス判
定部１４３、文章再構成部１４４から構成している。こ
こで、文書構造解析部１４１は、文書の章や節を表すタ
イトル情報を抽出し、文書の章立ての構造を解析する。
文脈構造解析部１４２は、文章中で用いられている修辞
的な表現を抽出し、各章あるいは節の文章部分の論理的
な構造を解析する。キーセンテンス判定部１４３は、解
析した文書構造ならびに文脈構造に基づいてキーセンテ
ンスを判定する。そして、文章再構成部１４４は、キー
センテンス判定部１４３での判定結果から要約文を生成
するようにしている。

【００５４】この場合、文書構造解析部１４１における
処理自体は、本願の発明の主旨ではない。例えば文献２
（文書自動レイアウトシステム、岩井、東芝レビュー）
で開示されている方法を用いることができる。この処理
により対象とする文書についての章や節の構成を解析す
ることができる。

【００５５】また、文脈構造解析部１４２における処理
自体も、本願の発明の主旨ではない。例えば文献３（Ａ
ＤｉｓｃｏｕｓｅＳｔｒｕｃｔｕｒｅＡｎａｌｙ
ｚｅｒｆｏｒＪａｐａｎｅｓｅＴｅｘｔ．Ｋ．Ｓｕ
ｍｉｔａ，Ｉｎｔ．Ｃｏｎｆ．ｏｎＦｉｆｔｈＧｅ
ｎｅｒａｔｉｏｎＣｏｍｐｕｔｅｒ‘９２）で開示さ
れている方法を用いることができる。

【００５６】このような処理により、図１８（ｂ）に示
す文章に対して、同図（ａ）に示す文脈構造を得ること
ができる。ここで図示した文脈構造は、第２文が第１文
に対して「展開」という関係にあり、さらに第３文が第
１文と第２文に対して「予定」という関係にあることを
表している。

【００５７】なお、文脈構造は、図１９に示すデータ構
造で記憶される。ここでのデータ構造は、そのノードの
持つ関係（文脈構造．Ｒｅｌ）と、左右のノードへのリ
ンク（文脈構造．Ｌ、文脈構造．Ｒ）を表現している。
ただし、終端ノードの場合、文脈構造．Ｒｅｌには、対
応する文へのポインタを、文脈構造．Ｌと文脈構造．Ｒ
には、それぞれ−１を格納している。

【００５８】次に、図２０は、キーセンテンス判定部１
４３の処理の流れを示している。この場合、キーセンテ
ンス判定部１４３は、ペナルティ計算を再起的に行うこ
とにより処理を進める（ステップ２００１）。そして、
処理が終わった段階でペナルティの小さい終端ノード
が、より重要であることになる。

【００５９】図２１は、ペナルティ計算による処理の流
れを示している。この場合、文脈構造解析部で解析した
文脈構造、ならびにペナルティの初期値を入力とする。
始めに、文脈構造が終端ノードか否かを判定する（ステ
ップ２１０１）。

【００６０】ここで、文脈構造．Ｌに格納されている値
が−１である場合は、終端ノードであるので、入力され
たペナルティを文脈構造．Ｐに設定する（ステップ２１
０２）。一方、文脈構造．Ｌに格納されている値が−１
でなければ場合終端ノードではなく、非終端ノードであ
る。この場合、文脈構造．Ｒｅｌに格納されている関係
が右重点型か左重点型か、あるいはそのいずれでもない
かの判定を行う（ステップ２１０３）。この判定は、あ
らかじめ記憶しておいた関係テーブルに基づいて行う。
ここで、関係テーブルの一例を示すと下記のようにな
る。

【００６１】順接右重点型予定左重点型例示左重点型ここでの関係テーブルは、「順接」という関係が右重点
型であることを表している。

【００６２】そして、文脈構造．Ｒｅｌに格納されてい
る関係が右重点型である場合、右ノードの方が重要であ
るから、ペナルティＰにペナルティＰ１を足し合わせた
値を左ノードの側のペナルティ計算に与え、ペナルティ
Ｐを右ノードの側のペナルティ計算に与える（ステップ
２１０４，２１０５）。

【００６３】逆に、文脈構造．Ｒｅｌに格納されている
関係が右重点型でなく、左重点型である場合（ステップ
２１０６）、左ノードが重要であるので、ペナルティＰ
を左ノードの側のペナルティ計算に与え、ペナルティＰ
にペナルティＰ１を足し合わせた値を右ノードの側のペ
ナルティ計算に与える（ステップ２１０７，２１０
８）。また、文脈構造．Ｒｅｌに格納されている関係が
右重点型でも左重点型でもない場合、左右のノードそれ
ぞれについてのペナルティ計算には、ペナルティＰがそ
のまま引き渡される（ステップ２１０９，２１１０）。

【００６４】このようにしてペナルティ計算を再起的に
行うことにより、重要度の高い文のペナルティには小さ
い値が、逆に、重要度の低い文のペナルティには大きい
値が設定されることになる。

【００６５】そして、このキーセンテンス判定部１４３
の処理に用いられている関係テーブルに格納される情報
を変えることにより、重要度のペナルティの設定の具合
を変えることが可能である。したがって、この関連テー
ブルにおいていずれかの関係が右重点型か左重点型かを
利用者が定義することにより利用者の所望する視点での
要約文を生成することができる。

【００６６】次に、図２２は、文書再構成部１４４の処
理の流れを示している。

【００６７】この場合、文書再構成部１４４は、キーセ
ンテンス判定部１４３で求めたすべての文のペナルティ
を参照し、あらかじめ定めたペナルティＰ２以下の文を
取り出し（ステップ２２０１）、接続表現の変更を行い
（２２０２）、要約文を生成する。

【００６８】例えば、次のような文章を仮定する（ここ
で１、２、３は文を表現している）。

【００６９】１よい建築物を作るためにはよい材料が
必要である。

【００７０】２しかし、よい道具も必要である。

【００７１】３つまり、材料だけではダメである。

【００７２】そして、この文章に対応する文脈構造が次
のような構造であること。

【００７３】（１＜逆接＞（２＜重複＞３））さらに、キーセンテンス判定部により文１と文３がキー
センテンスとして選択されたものと仮定する。

【００７４】しかして、文１と文３を単純につなげた場
合、原文と論理的に異なる次のような文章が生成され
る。

【００７５】よい建築物を作るためにはよい材料が必要
である。

【００７６】つまり、材料だけではダメである。

【００７７】そこで、接続表現の変更では、キーセンテ
ンスと判定された文間の最も上位の関係に対応する接続
表現に付け代える。

【００７８】上記の例では、文１と文３の間の最も上位
の関係は、＜逆接＞であるので、この関係に対応する接
続表現「しかし」に置き換えることにより、次のような
文章を生成する。

【００７９】よい建築物を作るためにはよい材料が必要
である。

【００８０】しかし、材料だけではダメである。

【００８１】このようにして文書再構成部１４４では、
原文と論理的に整合性のある要約文が生成される。ま
た、文書再構成部１４４におけるペナルティＰ２の値を
変化させることにより、要約文として生成する文の量を
制御することができる。したがって、利用者がこのペナ
ルティＰ２を設定し直すことにより、表示される要約文
の量を制御することが可能である。

【００８２】次に、図２３は要約文と原文との対応を記
憶した要約文章記憶部を示している。この場合、記憶デ
ータは、原文へのポインタ、要約文へのポインタ、要約
文文番号からなっている。そして、連続する記憶領域
に、原文へのポインタと要約文へのポインタを格納する
ことにより、それらの対応情報を記憶している。要約文
文番号には、要約文を構成している文の文番号が格納さ
れている。これらの情報は、図２に示した個人情報格納
部１６に含まれている。

【００８３】図２に示す検索制御部１８では、検索処理
部１３により実行されて個人情報格納部１６に格納され
た検索式と入力文の構文意味解析とによる検索結果と、
主題解析部１４により実行されて個人情報格納部１６に
格納された要約文書の情報を用いて、検索結果の文書の
表示優先順序を決定する。

【００８４】この場合、図２４に示す表示優先規則辞書
に格納された優先順位の条件に従って表示優先順位を決
定する。そして、この決定された表示優先順位に従って
検索結果の文書のタイトルを優先順位とともに検索結果
表示部１７に表示させる。

【００８５】図２５は、個人情報格納部１６の一例を示
し、その内容に対して表示優先順位規則に従って設定さ
れた表示優先順位を図２６に示している。

【００８６】なお、検索処理部１３は、文書ごとに該文
書が検索された回数を文書格納部１５に蓄積しておき、
ある検索処理の結果、表示優先順位が同じである文書が
存在した場合には、文書集合の中で文書格納部１５に蓄
積された検索回数の多いものから表示する。図３７は図
２６の検索結果に対応する文書データを図示している。
図３８は、図２６の検索結果に従って画面表示した一例
である。

【００８７】（第２実施例）上述の第１実施例では、入
力解析部の入力文字列の形態素解析、構文解析および意
味解析において、解析結果に曖昧性がない場合について
説明したが、第２実施例では、入力文字列の形態素解
析、構文解析または意味解析の結果に曖昧性がある場合
について説明する。

【００８８】この場合、図２で述べた検索制御部１８
は、以前の検索において利用者が選択した入力文字列の
解析結果を格納しておく解析結果学習辞書を有してい
る。図２７に解析結果学習辞書の一例を示している。ま
た、検索処理部１３における意味構造インデックス記憶
部は、文書中の文を構文意味解析した際に複数の解析結
果がえられた場合に、それらすべての解析結果を対応付
けて格納するようにしている。その他は、上述した第１
実施例の考えと同様である。

【００８９】図２８は、第２実施例における処理の流れ
を示している。

【００９０】いま、図２９に示すような入力解析部解析
結果が得られたものとし、かかる入力解析において構文
意味解析の結果に曖昧性があったような場合（ステップ
２８０１）、図２に示す入力解析部１２では、それら複
数の解析結果を個人情報格納部１６に格納し、検索制御
部１８にシグナルを送る。

【００９１】検索制御部１８は、入力解析部１２からの
シグナルを受けとると、個人情報格納部１６に格納され
た複数の解析結果とそれに対応する入力文字列の部分を
取り出し、次いで、当該入力文字列の部分で解析結果学
習辞書を検索し、さらに各々の構文意味解析結果で意味
構造インデックス記憶部を検索する（ステップ２８０
２，２８０３）。そして、それらの検索結果とメッセー
ジを複数の解析結果とともに検索結果表示部１７に表示
する（ステップ２８０４）。すなわち、解析結果学習辞
書に入力文字列の部分と一致する文字列が存在した場合
には、それに対応する解析結果に当該解析結果が過去に
選択された旨のメッセージを付与し、意味構造インデッ
クス記憶部に一致する意味構造が存在した場合には、文
書格納部の中に当該意味構造を含む文書が存在する旨の
メッセージを付与して検索結果表示部１７から表示す
る。

【００９２】そして、利用者により、表示された複数の
解析結果の中から適切な解析結果が選択されるのを待つ
（ステップ２８０５）。ここで、適切な解析結果がない
場合には、解析結果の中の一つを修正して選択すること
ができる。

【００９３】そして、曖昧性のある解析結果の中の一つ
が選択された場合（ステップ２８０６）、「選択されな
かった解析結果は意味構造インデックス記憶部から削除
するか否か」のメッセージを表示し（ステップ２８０
７）、「削除する」を選択すると（ステップ２８０
８）、選択されなかった解析結果を意味構造インデック
ス記憶部から削除し（ステップ２８０９）、選択された
解析結果を解析結果学習辞書と個人情報格納部１６に格
納する（ステップ２８１０）。

【００９４】図３０は、第２実施例における意味構造イ
ンデックス記憶部を説明するもので、同図（ａ）では、
利用者が選択する前で曖昧性のある解析結果が複数存在
する場合を示し、同図（ｂ）では、利用者が「計算機…
ｏｂｊｅｃｔ…設計」の意味構造を画面上で選択した後
の状態を示している。

【００９５】図３１は検索制御部１８での処理の流れを
示すものである。この場合、検索制御部１８は、個人情
報格納部１６に格納された解析結果を取り出し、解析結
果学習辞書に格納し入力解析部１２にシグナルを送る。
入力解析部１２は、個人情報格納部１６に格納された入
力文字列の構文意味解析結果から検索式を取り出す（ス
テップ３１０１）。この場合、構文意味解析結果として
は、上述の意味構造インデックス記憶部を検索した結果
が用いられる。そして、この検索語にしたがってキーワ
ードインデックス記憶部を検索し（ステップ３１０
２）、検索された文書について検索式にしたがって集合
計算を行い、その結果を個人情報格納部１６に格納する
（ステップ３１０３）。

【００９６】（第３実施例）上述した第１実施例では、
自然言語文を入力文字列としていたが、この第３実施例
では、論理式との組合せで入力することができる。

【００９７】この場合、図２に示す入力解析部１２にお
いて、入力文字列に論理式演算子が用いられていた場
合、論理式解釈処理を行うようになる。

【００９８】図３２は、論理式演算子の＋を用いて入力
した場合であり、論理式解釈処理の結果として４つに展
開され、各々の検索結果の文書集合の和集合が最終的な
検索結果とされる。

【００９９】また、図３３は、「何か」という単語は記
号「？」に変換される場合で、当該記号は任意の単語に
一致すると解釈されて検索処理が行われる。なお、同図
においてｇｏａｌは目的の関係を表す記号である。

【０１００】（第４実施例）上述した第１実施例では、
タイトル、作者、作成日付などの書誌事項が明示されて
いない文書を全文検索したが、この第４実施例では、検
索の対象となる文書がタイトル、作者、作成日付などの
書誌事項が明示されている文書である場合に、入力文字
列に応じて当該の書誌事項を利用して検索するようにし
ている。

【０１０１】図３４は、第４実施例での入力解析部解析
結果を示すもので、図３５に示す書誌事項解析規則を適
用して、検索処理部１３は書誌事項中の発行年が「１９
８０年」以降であり、書誌事項中の著者に「田中誠」を
含む文書を検索するようになる。そして、図３４により
得られた入力解析部解析の結果に従って、「機械翻訳」
という検索語でキーワードインデックス記憶部を検索す
る。ここでは図３６に示した不要表現規則により論文は
検索語とされていない。なお、検索処理については、第
１実施例と同じ方法をとればよいので、説明を省略す
る。

【０１０２】（第５実施例）上述した第１実施例では、
主題解析部１４において、文書の本文の要訳を作成して
検索結果の文書に重み付けを行ったが、この第５実施例
では、本文の要訳文とともに、タイトル、目次、索引、
参考文献などの文書の構造を解析した結果を用いて、表
示優先得点を設定し文書の重み付けを行なうようにして
いる。

【０１０３】図３９は、表示優先得点の一例を示すもの
で、かかる表示優先得点に従って、検索語または意味構
造が該当する条件の中で最も高い得点を文書に与え、こ
れを合計して文書の得点とすることにより、得点の多い
文書から優先的に表示するようにしている。

【０１０４】（第６実施例）上述した第１実施例では、
検索結果表示部１７から検索された文書のタイトルと表
示優先順位が表示されるのみであったが、この第６実施
例では、図２に示す文書格納部１５に格納された文書と
検索された文書について利用者の操作により各種の情報
を表示するようにしている。

【０１０５】この場合、検索処理部１３は、入力部１１
からの利用者の指示に従って、検索式中の２単語が意味
構造インデックス記憶部の係り先の単語と係り元の単語
に一致する場合に、当該単語と関係記号の組を検索結果
表示部１７に一覧表示する。例えば、図４０に示すよう
な意味構造インデックス記憶部の場合、「計算機」と
「設計」の関係が異なる文書が存在することが示される
と、検索処理部１３では、入力部１１からの利用者の指
示に従って、検索式中の１単語が意味構造インデックス
記憶部の係り先または係り元の単語に一致すると、当該
単語、関係記号、他方の単語の組を検索結果表示部１７
に一覧表示する。また、図４１に示すような意味構造イ
ンデックス記憶部の場合、「実例」が他の単語とどのよ
うな関係にあるかが示されると、利用者はこれらの表示
により文書格納部に格納された文書にどのような意味構
造が含まれているかを知ることができる。

【０１０６】しかして、検索処理部１３は、検索式に従
ってキーワード検索を行なった後、入力部１１からの利
用者の指示により、当該キーワード検索の結果得られた
文書について、そのファイル名で意味構造インデックス
記憶部を検索し、文書ごとに文書名と当該文書に含まれ
ているすべての意味構造、すなわち係り先の単語、関係
記号および係り元の単語を検索結果表示部１７に表示す
る。このとき、検索式中の検索語は強調表示したり、意
味構造ごとにまとめて当該意味構造と当該意味構造を含
む文書を一覧表示することにより、利用者は、これらキ
ーワード検索の結果得られた文書にどのような意味構造
が含まれているかを知ることができるようになる。

【０１０７】同様に、検索処理部１３は、入力文字列の
構文意味解析結果に基づく検索を行なった後に、入力部
１１からの利用者の指示に従って、当該検索の結果得ら
れた文書について、そのファイル名で意味構造インデッ
クス記憶部を検索し、文書ごとに文書名と当該文書に含
まれているすべての意味構造、すなわち係り先の単語、
関係記号および係り元の単語を検索結果表示部１７に表
示する。このとき、検索式中の検索語は強調表示した
り、意味構造ごとに当該意味構造と当該意味構造を含む
文書を一覧表示することにより、利用者はこれにより検
索文書の内容を予想することもできる。

【０１０８】検索制御部１８は、主題解析部１４の処理
を行なった後に、検索文書の要約文章や、要約文と意味
構造の対応などを検索結果表示部１７に表示することが
でき、これにより利用者は、検索文書の内容等を知るこ
ともできる。

【０１０９】（第７実施例）上述した第１実施例では、
入力文字列が一文であり、２単語の関係を解析し検索可
能にしている。

【０１１０】この第７実施例では、一文に限らず二文以
上でもよく、特定の文書を検索することを目的に作成さ
れた文や文章ではない任意の文字列でもよい。さらに、
３単語以上の単語間の関係も解析し検索する。図４２
は、第７実施例における意味構造インデックス記憶部の
一例を示している。

【０１１１】（第８実施例）上述した第１実施例では、
入力文字列の形態素解析、構文解析および意味解析を行
なった後にキーワード検索と意味構造に基づく検索を行
っているが、この第８実施例では、形態素解析を行なっ
てキーワード検索を行ない、次に入力文の構文解析と意
味解析を行なって意味構造に基づく検索を行なうように
している。

【０１１２】この場合、図２に示す入力解析部１２は検
索語抽出規則辞書をもち、この検索語抽出規則辞書に格
納された規則に適合する自立語を抽出する。利用者は当
該辞書の規則を修正、削除、追加することができる。こ
こで、図４３は、検索語抽出規則辞書の一例を示してい
る。

【０１１３】また、図４４は、第８実施例の入力解析お
よび検索処理の流れを示している。この場合、図２に示
す入力解析部１２において、文または文章などの入力文
字列の形態素解析を行ない、その結果を個人情報格納部
１６に格納する（ステップ４４０１）。次に、形態素解
析結果から検索語抽出規則辞書と不要語辞書を用いて自
立語を検索語として抽出する。この場合、図４３に示し
た検索語抽出規則辞書中の規則から、品詞が名詞または
動詞である単語を抽出し、次いで当該単語で不要語辞書
を検索して不要語辞書に存在しない自立語を検索語とす
る（ステップ４４０２，４４０３）。

【０１１４】次に、検索語と、論理演算子または近接演
算子等を用いて検索式を作成し（ステップ４４０４）、
個人情報格納部に格納する。また、自立語で関連語辞書
を引くことにより自立語を関連語で置き換えた検索式も
作成する（ステップ４４０５）。

【０１１５】そして、これらの検索式に従って、キーワ
ードインデックス記憶部を検索し（ステップ４４０
６）、検索された文書について検索式にしたがって集合
演算を行い、その結果を個人情報格納部１６に格納する
（ステップ４４０７）。

【０１１６】さらに、個人情報格納部１６に１つ以上の
文書が格納されており、２つ以上の検索語を含む文があ
るか判断する（ステップ４４０８）。

【０１１７】そして、当該文書が存在する場合のみに、
入力解析部１２が個人情報格納部１６から形態素解析結
果を取り出し、構文解析と意味解析を行なう（ステップ
４４０９，４４１０）。さらに、不要表現規則中の構造
に一致する構造があれば、その構造を削除し（ステップ
４４１１）、次に、意味構造を得られたか判断し（ステ
ップ４４１２）、意味構造を得られた場合に、当該意味
構造で意味構造インデックス記憶部を検索し、その結果
を個人情報格納部に格納する（ステップ４４１３，４４
１４）。

【０１１８】（第９実施例）上述した第１実施例、第８
実施例では、文書格納部１５に格納されている文書はあ
らかじめ形態素解析、構文解析および意味解析されて意
味構造インデックス記憶部が作成されていたが、この第
９実施例では、当該文書をあらかじめ形態素解析、構文
解析および意味解析していない場合を示している。

【０１１９】この場合、図２に示す検索処理部１３で
は、入力解析部１２で作成され個人情報格納部１６に格
納された検索式に従ってキーワード検索を行なう。そし
て、当該キーワード検索の結果１つ以上の文書が得られ
た場合に、当該キーワード検索で得られた文書のファイ
ル名と検索語を含む文の文番号の集合から、２つ以上の
検索語を含む文が１つ以上存在している文書が存在する
か否かを検査する。そして、当該文書が存在する場合
に、その文書に含まれる文を形態素解析、構文解析およ
び意味解析し、その結果を個人情報格納部１６に格納す
る。

【０１２０】また、入力解析部１２は、個人情報格納部
１６に格納されている入力文字列の形態素解析結果を取
り出し、さらに構文解析と意味解析を行なう。構文意味
解析結果を得られた場合に、当該構文意味解析結果と、
個人情報格納部１６に格納された文書の構文意味解析結
果とを照合し、その結果を個人情報格納部１６に格納す
る。

【０１２１】このとき、「計算機を用いた設計自動化体
制」の名詞句の照合などのように構造が完全に一致しな
い場合でも検索結果に含める。ただし、検索結果にこの
情報も付随させて個人情報格納部１６に格納する。この
情報は表示優先順位の設定で用いられ、同じ表示優先順
位の文書の中でこの情報をもたない文書が、この情報を
もつ文書より表示優先順位が高くされる。

【０１２２】図４５の（ａ）は、入力文字列の解析によ
って得られた意味構造を表し、同図（ｂ）は、文書の中
に「計算機を用いた設計自動化体制」のような表現があ
り、当該表現を解析して得られた意味構造である。

【０１２３】ここで、（ｂ）の意味構造は、（ａ）の意
味構造そのものを含まないが、（ｂ）の意味構造の中
に、「計算機」と関係ｉｎｓｔｒｕｍｅｎｔ、および
「設計」を含んでいるので、（ｂ）の文書は検索結果の
中に含められる。

【０１２４】（第１０実施例）上述した第１実施例、第
８実施例、第９実施例では、キーワード検索、構文意味
解析結果による検索および主題解析を連続して行なった
が、この第１０実施例では、利用者がキーワード検索、
構文意味解析結果による検索および主題解析の順序を指
定できるとともに、当該検索または主題解析の後にその
後の処理を行なうかどうかを指定することができるよう
にしている。

【０１２５】この場合、利用者は、複数の文書格納部か
ら任意の文書格納部を選択することが可能であり、選択
した文書格納部や特定の検索の対象の文書などに応じて
検索や主題解析の選択を行なうことができるようにな
る。

【０１２６】（第１１実施例）上述した第１実施例で
は、主題解析部１４において、要約文の生成についての
情報がなかったが、この第１１実施例では、要約文の生
成の手がかりに用いた修辞表現の数や比率などを表示し
て要約文の信頼度を明示するようにしている。

【０１２７】この場合、「例えば」、「背景には」など
のような修辞表現の数や、当該修辞表現の文書全体の文
節数に対する比率、あるいは当該修辞表現の文書全体に
対する文字数比を文書あるいは要約文に付随させて表示
する。図４６は、このような場合の表示画面の一例を示
している。

【０１２８】（第１２実施例）上述した第１実施例で
は、検索語などの情報を記憶しなかったが、この第１２
実施例では、検索語などの情報を記憶するようにしてい
る。

【０１２９】この場合、検索制御部は、主題解析部によ
り作成された要約文に含まれていた検索語または意味構
造を、当該要約文の元の文書に付随させて文書格納部に
格納する。検索処理部は、文書に付随した検索語または
意味構造が存在する場合、これを利用してキーワード検
索または意味構造に基づく検索のみを行なう。なお、検
索語または意味構造を文書に付随させるのではなく、当
該検索語および意味構造のための、主題解析キーワード
インデックス記憶部および主題解析意味構造インデック
ス記憶部を作成しこれを検索することもできる。

【０１３０】（第１３実施例）上述した第１実施例で
は、検索の後に主題解析を行なったが、この第１３実施
例では、あらかじめ文書格納部の文書について主題解析
を行ない、その結果に従って、要約文に含まれていた単
語および意味構造のみをキーワードインデックス記憶部
および意味構造インデックス記憶部に登録するようにし
ている。この場合、検索処理部はキーワード検索および
入力文の構文意味解析結果に基づく検索のみを行なう。

【０１３１】（第１４実施例）上述した第１実施例で
は、意味構造に単語を用いていたが、この第１４実施例
では、単語ではなく単語の表す意味に設定した記号また
は番号を用いるようにしている。

【０１３２】この場合、図２に示す入力解析部１２で
は、単語の意味の記述とその記号または番号を格納した
解析用単語辞書を保持する。そして、入力文字列中の単
語が多義語である場合は、検索結果表示部１７に単語の
意味を表示することで、利用者に該当する意味を選択さ
せることができる。また、入力解析部１２は、選択され
た意味に対応する記号または番号を単語とともに解析結
果記憶部と個人情報記憶部１６に格納する。検索処理部
１３および主題解析部１７においても、単語ではなく単
語の表す意味に設定した記号または番号を用いて処理を
行うようになる。

【０１３３】なお、本発明は上述した各実施例にのみ限
定されず、要旨を変更しない範囲で適宜変形して実施で
きる。例えば、第１実施例では、主題解析部で要約文生
成を検索時に随時行うようにしたが、記憶容量に余裕が
あるシステムを構築する場合は、要約文を文書格納部に
格納しておくように変形することができる。さらに、生
成した要約文をテキストとしては記憶しておかず、解析
した文書構造ならびに文脈構造だけを記憶しておき、そ
の文書構造ならびに文脈構造からキーセンテンス判定
部、文章再構成部により、随時、要約文を求めるように
変形することも可能である。

【０１３４】

【発明の効果】本発明によれば、より多くの文書の中か
ら利用者が所望する文書を優先的に表示して、利用者が
容易に所望する文書を手に入れることができる。

【図面の簡単な説明】

【図１】本発明の第１実施例の概略構成を示す図。

【図２】第１実施例の機能構成を示す図。

【図３】第１実施例の処理の流れを示す図。

【図４】第１実施例の検索制御部での処理の流れを示す
図。

【図５】第１実施例の入力解析部の機能構成を示す図。

【図６】第１実施例の入力解析部での処理の流れを示す
図。

【図７】第１実施例の入力解析部での解析結果の例を示
す図。

【図８】第１実施例の解析用辞書中の規則の例を示す
図。

【図９】第１実施例の不要表現規則辞書中の規則の例を
示す図。

【図１０】第１実施例の検索処理部の機能構成を示す
図。

【図１１】第１実施例の検索処理部での処理の流れを示
す図。

【図１２】第１実施例のキーワードインデックス記憶部
の内容の一例を示す図。

【図１３】第１実施例のキーワード照合の処理の流れを
示す図。

【図１４】第１実施例のキーワード照合の処理の流れを
示す図。

【図１５】第１実施例の意味構造インデックス記憶部で
の処理の流れを示す図。

【図１６】第１実施例の意味構造インデックス記憶部の
内容の一例を示す図。

【図１７】第１実施例の主題解析部の機能構成を示す
図。

【図１８】第１実施例の文脈構造の一例を説明するため
の図。

【図１９】第１実施例の文脈構造のデータ構造を示す
図。

【図２０】第１実施例のキーセンテンス判定部の処理の
流れを示す図。

【図２１】第１実施例のキ−センテンス判定部の処理の
流れを示す図。

【図２２】第１実施例の文章再構成部での処理の流れを
示す図。

【図２３】第１実施例の要約文章記憶部を示す図。

【図２４】第１実施例の表示優先順位規則辞書の内容の
一例を示す図。

【図２５】第１実施例の個人情報記憶部の一例を示す
図。

【図２６】第１実施例の表示優先順位の一例を示す図。

【図２７】本発明の第２実施例の解析結果学習辞書の一
例を示す図。

【図２８】第２実施例の処理の流れを示す図。

【図２９】第２実施例の入力解析部解析結果を示す図。

【図３０】第２実施例の意味構造インデックス記憶部を
示す図。

【図３１】第２実施例の検索制御部での処理の流れを示
す図。

【図３２】本発明の第３実施例における入力解析部解析
結果を示す図。

【図３３】第３実施例における入力文を示す図。

【図３４】本発明の第４実施例における入力解析部解析
結果を示す図。

【図３５】第４実施例の書誌事項解析規則を示す図。

【図３６】第４実施例の不要表現規則を示す図。

【図３７】第１実施例のファイル名と文書の対応表を示
す図。

【図３８】第１実施例の画面表示の一例を示す図。

【図３９】本発明の第５実施例での表示優先得点の一例
を示す図。

【図４０】本発明の第６実施例の意味構造インデックス
記憶部の第一例を示す図。

【図４１】第６実施例の意味構造インデックス記憶部の
第二例を示す図。

【図４２】本発明の第７実施例の意味構造インデックス
記憶部を示す図。

【図４３】本発明の第８実施例の検索語抽出規則辞書を
示す図。

【図４４】第８実施例の入力解析および検索処理の流れ
を示す図。

【図４５】本発明の第９実施例の意味構造の例を示す
図。

【図４６】本発明の第１１実施例の画面表示の一例を示
す図。

【符号の説明】

１…中央処理手段、２…記憶手段、３…表示コントロー
ラ、４…表示手段、５…入力コントローラ、６…入力手
段、１１…入力部、１２…入力解析部、１３…検索処理
部、１４…主題解析部、１５…文書格納部、１６…個人
情報格納部、１７…検索結果表示部、１８…検索制御
部、１２０…形態素解析部、１２１…構文解析部、１２
２…意味解析部、１２３…不要表現規則適用部、１２４
…自立語抽出部、１２５…検索式作成部、１２６…解析
用辞書、１２７…解析用文法、１２８…不要表現規則辞
書、１２９…関連語辞書、１３１…キーワードインデッ
クス照合部、１３２…意味構造照合部、１３３…文書フ
ァイル集合計算部、１４１…文書構造解析部、１４２…
文脈構造解析部、１４３…キーセンテンス判定部、１４
４…文章再構成部。

───────────────────────────────────────────────────── フロントページの続き (72)発明者住田一男神奈川県川崎市幸区小向東芝町１番地株式会社東芝研究開発センター内 (72)発明者竹林洋一神奈川県川崎市幸区小向東芝町１番地株式会社東芝研究開発センター内

Claims

【特許請求の範囲】

【請求項１】文書検索のためのキーワードを入力させる
手段と、複数の文書を格納した文書格納手段と、この文書格納手段に格納された文書を要約し、この要約
された文書からキーワードを抽出するキーワード抽出手
段と、このキーワード抽出手段より抽出されたキーワードと前
記入力手段より入力されたキーワードとを比較し前記文
書格納手段より該当する文書を検索する検索手段とを具
備したことを特徴とする文書検索装置。
【請求項２】文書検索のためのキーワードを入力させ、複数の文書を格納した文書格納手段の文書を要約しこの
要約された文書からキーワードを抽出し、抽出されたキーワードと入力されたキーワードとを比較
し、前記文書格納手段より該当する文書を検索すること
を特徴とする文書検索方法。