JPH0635971A

JPH0635971A - 文書検索装置

Info

Publication number: JPH0635971A
Application number: JP4189631A
Authority: JP
Inventors: Yasuo Tanosaki; 康雄田野崎; Masato Yajima; 真人矢島; Kenichi Nogami; 謙一野上; Yukio Nakamoto; 幸夫中本
Original assignee: Toshiba Corp; Toshiba Computer Engineering Corp
Current assignee: Toshiba Corp; Toshiba Computer Engineering Corp
Priority date: 1992-07-16
Filing date: 1992-07-16
Publication date: 1994-02-10

Abstract

(57)【要約】【目的】文書において著者が言わんとしている事項の
例えば目的、特徴、意見など、文書を理解する上で重要
な部分を自動的に検索してユーザに掲示する。【構成】データ読み込み部202 にて一文ずつ文書デー
タを読み込み、係り受け解析部203 により一文の文書デ
ータの単語間の受け係り関係の解析を行う。この後注目
点マッチング部204 により解析結果と注目点辞書７に格
納された各注目点との照合を行う。解析結果がある注目
点と一致すれば、著者情報処理部205 によりこの注目点
に対応する著者情報を一文に付与し、この一文データお
よび著者情報（著者情報ボタン）をそれぞれ文書データ
表示部207 および著者情報表示部208 によって表示装置
３に表示する。そしてユーザにより任意の著者情報ボタ
ンが指定されると、この著者情報の付与された文書デー
タが反転表示などにより画面上で強調して表示され、他
の文書データとの識別表示が行われる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、記憶装置に保存された
文書に対するデータ検索を行う文書検索装置に関する。

【０００２】

【従来の技術】一般に、技術文献等の文書に書かれてい
る内容を把握するためには、文書全体に目を通し、話の
ポイントとなっている箇所を抜け目なく見付け出すこと
が必要である。ところが、文書が膨大な量になってくる
と、時間的な制約などからすべてのページに目を通すわ
けには行かなくなり、文書に書かれている事柄の背景や
特徴、著者の意見などを的確に捕えることは難しくな
る。また、文書の内容が難解なものになればなる程、そ
の内容を理解するのに何度もの読み直しが必要となり、
時間の浪費が甚だしくなる。

【０００３】そこで、読者の文書理解を何らかのかたち
でサポートできるようなシステムが現在求められてい
る。しかし現状においては、特にこれと言った装置は開
発されるに至っていない。

【０００４】

【発明が解決しようとする課題】本発明はこうした要望
に応じるべくなされたものであり、文書において著者が
言わんとしている事項の例えば目的、特徴、意見など、
文書を理解する上で重要な部分を自動的に検索してユー
ザに掲示することのできる文書検索装置の提供を目的と
している。

【０００５】

【課題を解決するための手段】本発明の文書検索装置は
上記した目的を達成するために、文書データを格納する
文書データ格納手段と、前記文書データ格納手段より一
文ずつ文書データを読み込む読み込み手段と、読み込ん
だ一文の文書データの単語間の受け係り関係を解析する
解析手段と、特定単語を含む一文における単語間の受け
係り関係の注目点情報を、前記特定単語の情報と対応付
けて複数格納した辞書と、前記解析手段の解析結果と前
記辞書に格納された各注目点情報とを照合する照合手段
と、前記照合手段により前記解析結果が前記辞書内のあ
る注目点情報と一致することが判断された場合、この注
目点情報に対応する特定単語情報を前記一文の文書デー
タに付与し、この文書データを前記文書データ格納手段
に格納する特定単語情報付与手段と、前記文書データ格
納手段に格納された文書データをこの文書データに付与
された特定単語情報と共に表示する表示手段と、表示さ
れた任意の特定単語情報が指定されたとき、この特定単
語情報の付与された文書データを他の文書データと識別
できるよう強調して表示する強調表示手段とを具備して
いる。

【０００６】また本発明の文書検索装置は上記した目的
を達成するために、文書データを格納する文書データ格
納手段と、前記文書データ格納手段より一文ずつ文書デ
ータを読み込む読み込み手段と、読み込んだ一文の文書
データの単語間の受け係り関係を解析する解析手段と、
特定単語を含む一文における単語間の受け係り関係の注
目点情報を、前記一文中から前記特定単語に関わる文字
列を抽出するための規則と共に、前記特定単語の情報と
対応付けて複数記憶した辞書と、前記解析手段の解析結
果と前記辞書に記憶された各注目点情報とを照合する照
合手段と、前記照合手段により前記解析結果が前記辞書
内のある注目点情報と一致することが判断された場合、
この注目点情報に対して定義された規則に従って前記一
文の文書データから前記特定単語に関わる文字列を抽出
する文字列抽出手段と、前記文字列抽出手段により抽出
された文字列を表示する表示手段とを具備している。

【０００７】

【作用】第１の発明では、まず読み込み手段にて文書デ
ータ格納手段より一文ずつ文書データを読み込み、続い
て解析手段により、読み込んだ一文の文書データの単語
間の受け係り関係の解析を行う。この後、照合手段によ
り解析結果と辞書に格納された各注目点情報、例えば文
書内容を理解する上で重要な“目的”“特徴”“意見”
などの特定単語を含む単語間の受け係り関係の注目点情
報、との照合を行う。この結果、解析結果が辞書内のあ
る注目点情報と一致することが判断された場合は、特定
単語情報付与手段により、この注目点情報に対応する特
定単語情報を一文の文書データに付与し、この文書デー
タを特定単語情報と共に文書データ格納手段に格納す
る。その後、文書データ格納手段に格納された文書デー
タおよび特定単語情報は表示手段によって表示される。
そしてユーザにより任意の特定単語情報が指定される
と、この特定単語情報の付与された文書データが反転表
示などにより画面上で強調して表示され、他の文書デー
タとの識別表示がなされる。

【０００８】したがって、この発明により、文書内容を
理解する上で重要な文を自動的に検索してユーザに表示
することができ、ユーザの文書理解を有効に支援するこ
とができる。

【０００９】第２の発明では、照合手段により解析結果
と辞書に格納された各注目点情報との照合を行い、解析
結果が辞書内のある注目点情報と一致することが判断さ
れた場合は、文字列抽出手段により、この注目点情報に
対して定義された規則に従って、該当する一文の文書デ
ータからその中の特定単語に関わる文字列を抽出する。
この後、抽出された文字列は、例えば注目点情報に対応
付けられた特定単語情報などと共に表示手段により表示
される。

【００１０】したがって、特定単語を例えば“目的”と
するならば、この特定単語に関わる文字列として“目
的”の内容そのものを表す単語や単語列（例えば“効率
向上”など）を全体の文書データの中から抽出してユー
ザに表示することができ、これによりユーザは文書全体
に目を通さなくても、大まかな文書内容を把握すること
ができるようになる。

【００１１】

【実施例】以下、本発明の実施例を図面を参照しながら
説明する。図１は本発明に係る一実施例の文書検索装置
の全体的な構成を示すブロック図である。同図に示すよ
うに、この文書検索装置は、ＣＰＵおよびメモリーを有
して構成される制御装置１、キーボードなどの入力装置
２、テキストデータ（文書データ）などを表示するＣＲ
Ｔなどの表示装置３、テキストデータなどを格納する外
部記憶装置４、著者情報コードテーブル５、解析辞書６
および注目点辞書７を有して構成されている。

【００１２】制御装置１は、図２に示すように、初期化
部２０１、データ読み込み部２０２、係り受け解析部２
０３、注目点マッチング部２０４、著者情報読み込み部
２０５、著者情報処理部２０６、文書データ表示部２０
７、著者情報表示部２０８および著者情報付与文修飾部
２０９の各処理部と、データバッファ部２１０、解析結
果保存バッファ部２１１、作業バッファ部２１２の各バ
ッファ部とから構成されている。

【００１３】初期化部２０１は、各バッファ部２１０、
２１１、２１２の初期化処理を行う。データ読み込み
部２０２は、外部記憶装置４から著者情報コード付与前
のテキストデータもしくは著者情報コード付与後のテキ
ストデータを読み込んで、データバッファ部２１０に格
納する処理を行う。

【００１４】係り受け解析部２０３は、データバッファ
部２１０に格納された、著者情報コード付与前の一文の
テキストデータにおける単語間の係り受け関係を解析辞
書６を用いて解析し、その解析結果を解析結果保存バッ
ファ部２１１に格納する。

【００１５】注目点マッチング部２０４は、係り受け解
析部２０３の解析結果と注目点辞書７に格納された注目
点（文書内容を理解する上で重要な特定単語例えば“目
的”“特徴”“意見”などを含む一文における単語間の
受け係り関係）との照合を行う。そして、解析結果があ
る注目点と一致する場合は、この注目点の著者情報名と
著者情報コードテーブル５の上で対応付けられた著者情
報コードを、解析が行われた一文のテキストデータに付
与する。

【００１６】著者情報読み込み部２０５は、データバッ
ファ部２１０から著者情報コード付きのテキストデータ
を一文ずつ読み込み、これを制御装置１内のメモリーに
格納する処理を行う。

【００１７】著者情報処理部２０６は、制御装置１内の
メモリーに格納された一文のテキストデータに付与され
ている著者情報コードが、文修飾（強調表示）の対象と
して有効な著者情報コードであるか否かを判断する。有
効な著者情報コードが付与されていない場合はその一文
の文番号と表示始点座標を、有効な著者情報コードが付
与されている場合はその一文の著者情報、文番号および
表示始点座標を制御装置１内のメモリーに格納する。

【００１８】文書データ表示部２０７は、データバッフ
ァ部２１０に格納されたテキストデータを表示装置３に
表示する処理を行う。

【００１９】著者情報表示部２０８は、有効な著者情報
コードとしてテキストデータに付与された著者情報の文
字列である“目的”“特徴”“意見”などを、ユーザの
カーソル指定を受付けることのできる著者情報ボタンと
して表示装置３の画面に表示する処理を行う。

【００２０】著者情報付与文修飾部２０９は、任意の著
者情報ボタンがユーザによって指定されたとき、この著
者情報ボタンに対応する著者情報コードの付与されたテ
キストデータを表示装置３の画面上で反転表示するなど
の文字修飾処理を行う。

【００２１】次に本実施例の文書検索装置の動作を説明
する。本実施例の文書検索装置では前処理として次のよ
うな著者情報コード付与処理を行う。図３はこの処理の
手順を示すフローチャートである。

【００２２】まず初期化部２０１を起動し、各バッファ
部２１０、２１１、２１２の初期化を行う（ステップ３
０１）。

【００２３】次にデータ読み込み部２０２を起動し、外
部記憶装置４から著者情報コード付与前のテキストデー
タを一文ずつ読み込んで、これをデータバッファ部２１
０に格納する（ステップ３０２）。

【００２４】この後、係り受け解析部２０３が起動され
る。係り受け解析部２０３はデータバッファ部２１０に
格納された一文のテキストデータを対象に単語間の係り
受け関係を解析辞書６を参照して解析し、その解析結果
を解析結果保存バッファ部２１１に格納する（ステップ
３０３）。

【００２５】続いて注目点マッチング部２０４が起動さ
れる。注目点マッチング部２０４は解析結果保存バッフ
ァ部２１１に格納された解析結果と、注目点辞書７に格
納された各注目点との照合を行う。これにより、解析さ
れた一文が文書においてどのような内容（例えば目的、
特徴、意見など）を表しているものであるかを判断す
る。その具体例を次に説明する。図４は注目点辞書７の
内容の一部を示す図である。同図に示すように、注目点
辞書７には、文書内容を理解する上で重要な単語として
例えば“目的”“特徴”“意見”などの特定単語を含む
一文における単語間の受け係り関係が注目点７１の情報
として格納されている。そしてこの注目点辞書７はこの
注目点７１に、前記の各特定単語にそれぞれ対応する著
者情報名７２を対応付けてなっている。ここで、図５に
示すように、「本システムの目的は、文書の検索であ
る。」と言う一文５１に対する解析結果５２を得た場合
を想定する。この場合、注目点マッチング部２０４は、
注目点辞書７内に格納されたすべての注目点の中から解
析結果５２と一致するものとして注目点１（５３）を見
付け出し、この注目点１に対応する著者情報名として
“目的”を判断する（ステップ３０４）。

【００２６】この後、注目点マッチング部２０４は、図
６に示す著者情報コードテーブル５を参照して当該著者
情報名に対応する著者情報コードを求める。例えば、著
者情報名が“目的”の場合は“１”、著者情報名が“特
徴”の場合は“２”、著者情報名が“意見”の場合は
“３”の著者情報コードがそれぞれ求められる。そして
図７に示すように、この、これをデータバッファ部２１
０に格納する（ステップ３０５）。なお、著者情報名が
抽出されなかった文に対しては著者情報コードとして
“０”が一文に付与される。

【００２７】こうして一文書すべてのテキストデータに
著者情報コードを付与し終えたならば（ステップ３０
６）、その一文書のテキストデータを外部記憶装置４に
転送、記憶する（ステップ３０７）。

【００２８】次に本実施例装置での文書検索の手順を図
８のフローチャートを用いて説明する。

【００２９】まずデータ読み込み部２０２を起動して外
部記憶装置４から著者情報コードの付与されたテキスト
データを読み込み、このテキストデータを、図９に示す
ように、一文ごとに文番号を付加してデータバッファ部
２１０に格納する（ステップ８０１）。

【００３０】次に著者情報読み込み部２０５が起動され
る。著者情報読み込み部２０５は、データバッファ部２
１０に著者情報コード付きのテキストデータが存在して
いることを確認すると（ステップ８０２）、データバッ
ファ部２１０からテキストデータを先頭の文番号のもの
から順番に一文ずつ読み込み制御装置１内のメモリーに
格納する（ステップ８０３）。

【００３１】この後、著者情報処理部２０６が起動され
る。著者情報処理部２０６は、制御装置１内のメモリー
に格納されている一文のテキストデータに付与されてい
る著者情報コードをチェックし、これが文修飾（強調表
示）の対象として有効な著者情報コードであるかどうか
を判断する（ステップ８０４）。ここで文修飾の対象と
して有効な著者情報コードは“０”以外のすべてのコー
ド、無効な著者情報コードとは“０”とされている。

【００３２】このチェックの結果、一文のテキストデー
タに文修飾の対象として有効な著者情報コードが付与さ
れていた場合、著者情報処理部２０６は、図１０に示す
ように、その著者情報コードに対応する著者情報、文番
号、および表示始点座標をそれぞれ対応付けて制御装置
１のメモリーに格納する（ステップ８０５）。続いて文
書データ表示部２０７が起動されて当該テキストデータ
の表示が行われる（ステップ８０６）。

【００３３】またステップ８０４のチェックの結果、一
文のテキストデータに文修飾の対象としては無効の著者
情報コードが付与されていた場合、著者情報処理部２０
６は、図１０に示すように、そのテキストデータの文番
号と表示始点座標だけを制御装置１のメモリーに格納す
る（ステップ８０７）。その後、文書データ表示部２０
７が起動されて当該テキストデータの表示が行われる
（ステップ８０６）。

【００３４】こうしてデータバッファ部２１０に格納さ
れたすべてのテキストデータについて著者情報処理部２
０６による処理を終えると（ステップ８０２）、著者情
報表示部２０８が起動される。著者情報表示部２０８
は、制御装置１のメモリーに格納された著者情報を読み
込み、これらの著者情報をその種類ごとに表示装置３の
画面上に著者情報ボタンとして表示する（ステップ８０
８）。

【００３５】図１１はテキストデータおよび著者情報ボ
タンの表示の様子を示す図である。同図に示すように、
表示画面はテキストデータを表示する領域Ａと、ユーザ
のカーソル指定入力を受け付ける著者情報ボタンＢ１、
Ｂ２および終了ボタンＢｎを表示する領域Ｂに区分され
る。著者情報ボタンの表示領域Ｂにおいて、各著者情報
ボタンは“目的”“特徴”のようにそのままユーザが認
識できるような文字列として表示される。

【００３６】この後、ユーザにより各著者情報ボタンＢ
１、Ｂ２のいずれかが指定されると（ステップ８１
０）、著者情報処理部２０６は、指定された著者情報ボ
タンの著者情報に対応した著者情報コードを図６の著者
情報コードテーブル５から求め、求めた著者情報コード
を持つ文番号を図９に示すデータバッファ部２１０の内
容が判断し、さらにこの文番号に対応する表示始点座標
を図１０に示す制御装置１のメモリー内容より調べてこ
れらの情報を著者情報付与文修飾部２０９に入力する。

【００３７】すると著者情報付与文修飾部２０９は、入
力した表示始点座標から次の文番号の表示始点座標の直
前までの範囲に表示されているテキストデータを判断
し、このテキストデータに対して例えば反転表示などの
修飾処理を施すことにより当該テキストデータを強調表
示する（ステップ８１１）。

【００３８】例えば図１２に示すように、“特徴”の著
者情報ボタンＢ２が指定された場合、著者情報処理部２
０６は、まず、指定された著者情報に対応する著者情報
コードとして著者情報コードテーブル５から“２”を求
める。次に“２”の著者情報コードを持つ文番号として
データバッファ部２１０の内容から“６”を判断する。
そしてこの“６”の文番号に対応する表示始点座標とし
て制御装置１のメモリーの内容より（５，２３）を求め
る。これにより、著者情報付与文修飾部２０９は、この
表示始点座標（５，２３）から次の文番号の表示始点座
標（７，２１）の直前つまり（７，２０）までの範囲に
表示されているテキストデータを反転表示等によって強
調して表示する。

【００３９】その後、終了ボタンＢｎが指定されること
により（ステップ８０９）、テスキトデータの表示を含
む文書検索の処理が終了する。

【００４０】かくして本実施例の文書検索装置によれ
ば、文書において著者が言わんとしている事項の例えば
目的、特徴、意見など、文書を理解する上で重要な部分
を自動的に検索して、この部分を画面上でユーザが一目
で識別できるよう反転表示などにより強調して表示する
ことができる。

【００４１】次に本発明の他の実施例を説明する。図１
３はこの実施例の文書検索装置の全体的な構成を示すブ
ロック図である。同図に示すように、この文書検索装置
は、ＣＰＵおよびメモリーを有して構成される制御装置
１１、キーボードなどの入力装置１２、テキストデータ
（文書データ）などを表示するＣＲＴなどの表示装置１
３、テキストデータなどを格納する外部記憶装置１４、
著者情報ファイル１５、解析辞書１６および注目点辞書
１７を有して構成されている。

【００４２】制御装置１１は、図１４に示すように、初
期化部１１０１、注目点読み込み部１１０２、一文書デ
ータ読み込み部１１０３、一文データ読み込み部１１０
４、係り受け解析部１１０５、注目点マッチング部１１
０６、属性付けデータ保存部１１０７および表示部１１
０８の各処理部と、注目点バッファ部１１０９、一文書
バッファ部１１１０、一文バッファ部１１１１、解析結
果保存バッファ部１１１２および作業バッファ部１１１
３の各バッファ部とから構成されている。

【００４３】初期化部１１０１は、各バッファ部１１０
９〜１１１３の初期化処理を行う。注目点読み込み部１
１０２は、注目点辞書１７からすべての注目点（文書内
容を理解する上で重要な特定単語例えば“目的”“特
徴”“意見”などを含む一文における単語間の受け係り
関係）を注目点バッファ部１１０９に格納する。

【００４４】一文書データ読み込み部１１０３は、外部
記憶装置１４より一文書のテキストデータを読み込み、
これを一文書バッファ部１１１０に格納する処理を行
う。

【００４５】一文データ読み込み部１１０４は、一文書
バッファ部１１１０よりテキストデータを一文ずつ先頭
のものから順番に読み込み、この一文のテキストデータ
を一文バッファ部１１１１に格納する処理を行う。

【００４６】係り受け解析部１１０５は、一文バッファ
部１１１１に格納された一文のテキストデータの単語間
の係り受け関係を解析辞書１６を用いて解析し、その解
析結果を解析結果保存バッファ部１１１２に格納する。

【００４７】注目点マッチング部１１０６は、解析結果
保存バッファ部１１１２に格納された解析結果と注目点
辞書１７に格納された注目点（文書内容を理解する上で
重要な特定単語例えば“目的”“特徴”“意見”などを
含む一文における単語間の受け係り関係）との照合を行
う。

【００４８】属性付けデータ保存部１１０７は、照合の
結果、解析結果がある注目点と一致する場合に、一文バ
ッファ部１１１１に格納された一文のテキストデータの
中から、この注目点に対して注目点辞書１７内で定義さ
れた規則に従って文字列の抽出を行う。そして注目点辞
書１７内で当該注目点と対応付けられている著者情報を
文字列に属性として付与し、この著者情報と文字列との
対を著者情報ファイル１５に保存する。

【００４９】表示部１１０８は、著者情報ファイル１５
に格納された著者情報および文字列を表示装置１３に表
示する処理を行う。

【００５０】次にこの文書作成装置の動作を説明する。
本実施例の文書検索装置ではまず次のようにして著者情
報ファイル１５の作成を行う。図１５はこの処理の手順
を示すフローチャートである。

【００５１】まず初期化部１１０１を起動し、各バッフ
ァ部１１０９〜１１１３の初期化を行う（ステップ１５
０１）。

【００５２】次に注目点読み込み部１１０２を起動し、
注目点辞書１７からすべての注目点の情報を注目点バッ
ファ部１１０９に格納する（ステップ１５０２）。

【００５３】ここで注目点は、図１６に示すように、文
書内容を理解する上で重要な単語として例えば“特徴”
“意見”などの特定単語を含む一文の単語間の受け係り
関係を表したものである。また各注目点にはそれぞれ、
特定単語に係わる文字列を抽出するための規則が定義さ
れている。そしてこれらの注目点は、注目点辞書１７内
において特定単語を示す著者情報とそれぞれ対応付けて
格納されている。

【００５４】この後、一文書データ読み込み部１１０３
が起動される。一文書データ読み込み部１１０３は外部
記憶装置１４より一文書のテキストデータを読み込み、
これを一文書バッファ部１１１０に格納する（ステップ
１５０３）。

【００５５】次に一文データ読み込み部１１０４が起動
される。一文データ読み込み部１１０４は一文書バッフ
ァ部１１１０よりテキストデータを一文ずつ先頭のもの
から順番に読み込み、この一文のテキストデータを一文
バッファ部１１１１に格納する（ステップ１５０５）。

【００５６】続いて係り受け解析部１１０５が起動され
る。係り受け解析部１１０５は一文バッファ部１１１１
に格納された一文のテキストデータを対象に、単語間の
係り受け関係を解析辞書１６を参照して解析し、その解
析結果を解析結果保存バッファ部１１１２に格納する
（ステップ１５０６）。

【００５７】次に注目点マッチング部１１０６が起動さ
れる。注目点マッチング部１１０６は注目点バッファ部
１１０９から一つずつ注目点の情報を取り出し、この注
目点の情報と解析結果保存バッファ部１１１２に格納さ
れた解析結果とを照合する（ステップ１５０７、１５０
８）。

【００５８】この結果、一致した場合は属性付けデータ
保存部１１０７が起動される。属性付けデータ保存部１
１０７は、まず、解析した一文のテキストデータの中か
ら、照合で一致した注目点にて定義されている規則に従
って文字列の抽出を行う。続いて注目点辞書１７内で当
該注目点と対応付けられている著者情報を調べ、この著
者情報を文字列に属性として付与し、この著者情報と文
字列との対を著者情報ファイル１５に保存する（ステッ
プ１５０９）。

【００５９】その具体例を次に説明する。図１７に示す
ように、「本システムの特徴は性能向上である。」と言
う一文１７１に対する解析結果１７２を得た場合を想定
する。この場合、図１６に示した注目点辞書１７の中か
ら著者情報が“特徴”の注目点１７３が、解析結果１７
２と一致するものとして判定される。続いてこの注目点
１７３に定義された文字列抽出規則から、「である」に
対し目的語接続された“性能向上”なる文字列１７４が
抽出される。そしてこの文字列１７４に、注目点１７３
に対応付けられた著者情報として“特徴”が属性として
付与され、図１８に示すように、この著者情報と文字列
との対が著者情報ファイル１５に保存される。

【００６０】またステップ１５０７、１５０８の結果、
解析結果と注目点とが不一致の場合は、ステップ１５０
４を介してステップ１５０５に戻り、再び一文書バッフ
ァ部１１１０からの一文のテキストデータの読み込みを
行う。そして一文書バッファ部１１１０に格納されたす
べてのテキストデータについてステップ１５０６から１
５０９までの処理を終了したならば、著者情報ファイル
作成処理を終了とする。しかる後、ユーザより所定の
コマンドが入力装置１２を介して制御装置１１に入力さ
れると、次のようにして著者情報ファイル１５の内容を
表示する処理が開始される。

【００６１】図１９はこの表示処理の手順を示すフロー
チャートである。まず初期化部１１０１が起動され、各
バッファ部１１０９〜１１１３の初期化が行われる（ス
テップ１９０１）。

【００６２】この後、データ読み込み部１１０３が起動
される。データ読み込み部１１０３は著者情報ファイル
１５のすべての内容を読み込み、これを作業バッファ部
１１１３に格納する（ステップ１９０２）。

【００６３】次に表示部１１０８が起動される。表示部
１１０８は作業バッファ部１１１３に格納された著者情
報と文字列の対をすべて取り出して、これらを図２０に
示すように。表示装置１３の画面上に表示する（ステッ
プ１９０３）。

【００６４】この後、入力装置１２を通して、表示画面
上に著者情報および文字列と共に表示された終了ボタン
２０１をユーザがカーソル指定することなどによって
（ステップ１９０４）、著者情報ファイル表示処理が終
了する（ステップ１９０５）。かくしてこの実施例の文
書検索装置によれば、テキストデータの内容を理解する
上で重要な部分だけを抽出してユーザに表示することが
できる。したがって、ユーザはテキストデータの全体に
目を通さなくても、このテキストデータの大まかな内容
を把握することが可能になる。

【００６５】

【発明の効果】以上説明したように本発明の文書検索装
置によれば、文書において著者が言わんとしている事項
の例えば目的、特徴、意見など、文書を理解する上で重
要な部分を自動的に検索してユーザに掲示することがで
きる。したがって、ユーザはテキストデータの全体に目
を通さなくても、このテキストデータの大まかな内容を
把握することが可能になる。

【図面の簡単な説明】

【図１】本発明に係る一実施例の文書検索装置の全体的
な構成を示すブロック図である。

【図２】図１における制御装置の構成を示す図である。

【図３】図１の文書検索装置における著者情報コード付
与処理の手順を示すフローチャートである。

【図４】図１における注目点辞書の内容の一部を示す図
である。

【図５】図４の注目点辞書を用いた係り受け解析処理に
ついて説明するための図である。

【図６】図１における著者情報コードテーブルの内容を
示す図である。

【図７】一文ごとに著者情報コードの付与されたテキス
トデータを示す図である。

【図８】図１の文書検索装置における文書検索の手順を
示すフローチャートである。

【図９】一文ごとに文番号が付与されたデータバッファ
部内のテキストデータを示す図である。

【図１０】制御装置のメモリーに格納された著者情報、
文番号および表示始点座標を示す図である。

【図１１】テキストデータおよび著者情報ボタンの表示
の様子を示す図である。

【図１２】テキストデータの修飾表示の様子を示す図で
ある。

【図１３】本発明に係る他の実施例の文書検索装置の全
体的な構成を示すブロック図である。

【図１４】図１３における制御装置の構成を示す図であ
る。

【図１５】図１３の文書検索装置における著者情報ファ
イル作成の手順を示すフローチャートである。

【図１６】図１３における注目点辞書の内容の一部を示
す図である。

【図１７】図１６の注目点辞書を用いた係り受け解析処
理の具体列を説明するための図である。

【図１８】図１３における著者情報ファイルの内容を示
す図である。

【図１９】図１８に示す著者情報ファイル内容の表示処
理の手順を示すフローチャートである。

【図２０】図１８に示す著者情報ファイル内容の表示の
様子を示す図である。

【符号の説明】

１、１１…制御装置、２、１２…入力装置、３、１３…
表示装置、４、１４…外部記憶装置、５…著者情報コー
ドテーブル、１５…著者情報ファイル、６、１６…解析
辞書、７、１７…注目点辞書、２０１、１１０１…初期
化部、２０２…データ読み込み部、２０３、１１０５…
係り受け解析部、２０４、１１０６…注目点マッチング
部、２０５…著者情報読み込み部、２０６…著者情報処
理部、２０７…文書データ表示部、２０８…著者情報表
示部、２０９…著者情報付与文修飾部、２１０…データ
バッファ部、２１１、１１１２…解析結果保存バッファ
部、２１２、１１１３…作業バッファ部、１１０２…注
目点読み込み部、１１０３…一文書データ読み込み部、
１１０４…一文データ読み込み部、１１０７…属性付け
データ保存部、１１０８…表示部、１１０９…注目点バ
ッファ部、１１１０…一文書バッファ部、１１１１…一
文バッファ部。

フロントページの続き (72)発明者矢島真人神奈川県川崎市幸区柳町70番地株式会社東芝柳町工場内 (72)発明者野上謙一東京都青梅市新町1381番地１東芝コンピュータエンジニアリング株式会社内 (72)発明者中本幸夫東京都青梅市新町1381番地１東芝コンピュータエンジニアリング株式会社内

Claims

【特許請求の範囲】

【請求項１】文書データを格納する文書データ格納手
段と、前記文書データ格納手段より一文ずつ文書データを読み
込む読み込み手段と、読み込んだ一文の文書データの単語間の受け係り関係を
解析する解析手段と、特定単語を含む一文における単語間の受け係り関係の注
目点情報を、前記特定単語の情報と対応付けて複数格納
した辞書と、前記解析手段の解析結果と前記辞書に格納された各注目
点情報とを照合する照合手段と、前記照合手段により前記解析結果が前記辞書内のある注
目点情報と一致することが判断された場合、この注目点
情報に対応する特定単語情報を前記一文の文書データに
付与し、この文書データを前記文書データ格納手段に格
納する特定単語情報付与手段と、前記文書データ格納手段に格納された文書データをこの
文書データに付与された特定単語情報と共に表示する表
示手段と、表示された任意の特定単語情報が指定されたとき、この
特定単語情報の付与された文書データを他の文書データ
と識別できるよう強調して表示する強調表示手段とを具
備することを特徴とする文書検索装置。
【請求項２】文書データを格納する文書データ格納手
段と、前記文書データ格納手段より一文ずつ文書データを読み
込む読み込み手段と、読み込んだ一文の文書データの単語間の受け係り関係を
解析する解析手段と、特定単語を含む一文における単語間の受け係り関係の注
目点情報を、前記一文中から前記特定単語に関わる文字
列を抽出するための規則と共に、前記特定単語の情報と
対応付けて複数記憶した辞書と、前記解析手段の解析結果と前記辞書に記憶された各注目
点情報とを照合する照合手段と、前記照合手段により前記解析結果が前記辞書内のある注
目点情報と一致することが判断された場合、この注目点
情報に対して定義された規則に従って前記一文の文書デ
ータから前記特定単語に関わる文字列を抽出する文字列
抽出手段と、前記文字列抽出手段により抽出された文字列を表示する
表示手段とを具備することを特徴とする文書検索装置。
【請求項３】請求項２記載の文書検索装置において、前記表示手段は、前記文字列抽出手段により抽出された
文字列を前記注目点情報に対応付けられた特定単語情報
と共に表示することを特徴とする文書検索装置。