JPH0635971A - 文書検索装置 - Google Patents

文書検索装置

Info

Publication number
JPH0635971A
JPH0635971A JP4189631A JP18963192A JPH0635971A JP H0635971 A JPH0635971 A JP H0635971A JP 4189631 A JP4189631 A JP 4189631A JP 18963192 A JP18963192 A JP 18963192A JP H0635971 A JPH0635971 A JP H0635971A
Authority
JP
Japan
Prior art keywords
document data
sentence
document
information
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4189631A
Other languages
English (en)
Inventor
Yasuo Tanosaki
康雄 田野崎
Masato Yajima
真人 矢島
Kenichi Nogami
謙一 野上
Yukio Nakamoto
幸夫 中本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Computer Engineering Corp
Original Assignee
Toshiba Corp
Toshiba Computer Engineering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Computer Engineering Corp filed Critical Toshiba Corp
Priority to JP4189631A priority Critical patent/JPH0635971A/ja
Publication of JPH0635971A publication Critical patent/JPH0635971A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 文書において著者が言わんとしている事項の
例えば目的、特徴、意見など、文書を理解する上で重要
な部分を自動的に検索してユーザに掲示する。 【構成】 データ読み込み部202 にて一文ずつ文書デー
タを読み込み、係り受け解析部203 により一文の文書デ
ータの単語間の受け係り関係の解析を行う。この後注目
点マッチング部204 により解析結果と注目点辞書7に格
納された各注目点との照合を行う。解析結果がある注目
点と一致すれば、著者情報処理部205 によりこの注目点
に対応する著者情報を一文に付与し、この一文データお
よび著者情報(著者情報ボタン)をそれぞれ文書データ
表示部207 および著者情報表示部208 によって表示装置
3に表示する。そしてユーザにより任意の著者情報ボタ
ンが指定されると、この著者情報の付与された文書デー
タが反転表示などにより画面上で強調して表示され、他
の文書データとの識別表示が行われる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、記憶装置に保存された
文書に対するデータ検索を行う文書検索装置に関する。
【0002】
【従来の技術】一般に、技術文献等の文書に書かれてい
る内容を把握するためには、文書全体に目を通し、話の
ポイントとなっている箇所を抜け目なく見付け出すこと
が必要である。ところが、文書が膨大な量になってくる
と、時間的な制約などからすべてのページに目を通すわ
けには行かなくなり、文書に書かれている事柄の背景や
特徴、著者の意見などを的確に捕えることは難しくな
る。また、文書の内容が難解なものになればなる程、そ
の内容を理解するのに何度もの読み直しが必要となり、
時間の浪費が甚だしくなる。
【0003】そこで、読者の文書理解を何らかのかたち
でサポートできるようなシステムが現在求められてい
る。しかし現状においては、特にこれと言った装置は開
発されるに至っていない。
【0004】
【発明が解決しようとする課題】本発明はこうした要望
に応じるべくなされたものであり、文書において著者が
言わんとしている事項の例えば目的、特徴、意見など、
文書を理解する上で重要な部分を自動的に検索してユー
ザに掲示することのできる文書検索装置の提供を目的と
している。
【0005】
【課題を解決するための手段】本発明の文書検索装置は
上記した目的を達成するために、文書データを格納する
文書データ格納手段と、前記文書データ格納手段より一
文ずつ文書データを読み込む読み込み手段と、読み込ん
だ一文の文書データの単語間の受け係り関係を解析する
解析手段と、特定単語を含む一文における単語間の受け
係り関係の注目点情報を、前記特定単語の情報と対応付
けて複数格納した辞書と、前記解析手段の解析結果と前
記辞書に格納された各注目点情報とを照合する照合手段
と、前記照合手段により前記解析結果が前記辞書内のあ
る注目点情報と一致することが判断された場合、この注
目点情報に対応する特定単語情報を前記一文の文書デー
タに付与し、この文書データを前記文書データ格納手段
に格納する特定単語情報付与手段と、前記文書データ格
納手段に格納された文書データをこの文書データに付与
された特定単語情報と共に表示する表示手段と、表示さ
れた任意の特定単語情報が指定されたとき、この特定単
語情報の付与された文書データを他の文書データと識別
できるよう強調して表示する強調表示手段とを具備して
いる。
【0006】また本発明の文書検索装置は上記した目的
を達成するために、文書データを格納する文書データ格
納手段と、前記文書データ格納手段より一文ずつ文書デ
ータを読み込む読み込み手段と、読み込んだ一文の文書
データの単語間の受け係り関係を解析する解析手段と、
特定単語を含む一文における単語間の受け係り関係の注
目点情報を、前記一文中から前記特定単語に関わる文字
列を抽出するための規則と共に、前記特定単語の情報と
対応付けて複数記憶した辞書と、前記解析手段の解析結
果と前記辞書に記憶された各注目点情報とを照合する照
合手段と、前記照合手段により前記解析結果が前記辞書
内のある注目点情報と一致することが判断された場合、
この注目点情報に対して定義された規則に従って前記一
文の文書データから前記特定単語に関わる文字列を抽出
する文字列抽出手段と、前記文字列抽出手段により抽出
された文字列を表示する表示手段とを具備している。
【0007】
【作用】第1の発明では、まず読み込み手段にて文書デ
ータ格納手段より一文ずつ文書データを読み込み、続い
て解析手段により、読み込んだ一文の文書データの単語
間の受け係り関係の解析を行う。この後、照合手段によ
り解析結果と辞書に格納された各注目点情報、例えば文
書内容を理解する上で重要な“目的”“特徴”“意見”
などの特定単語を含む単語間の受け係り関係の注目点情
報、との照合を行う。この結果、解析結果が辞書内のあ
る注目点情報と一致することが判断された場合は、特定
単語情報付与手段により、この注目点情報に対応する特
定単語情報を一文の文書データに付与し、この文書デー
タを特定単語情報と共に文書データ格納手段に格納す
る。その後、文書データ格納手段に格納された文書デー
タおよび特定単語情報は表示手段によって表示される。
そしてユーザにより任意の特定単語情報が指定される
と、この特定単語情報の付与された文書データが反転表
示などにより画面上で強調して表示され、他の文書デー
タとの識別表示がなされる。
【0008】したがって、この発明により、文書内容を
理解する上で重要な文を自動的に検索してユーザに表示
することができ、ユーザの文書理解を有効に支援するこ
とができる。
【0009】第2の発明では、照合手段により解析結果
と辞書に格納された各注目点情報との照合を行い、解析
結果が辞書内のある注目点情報と一致することが判断さ
れた場合は、文字列抽出手段により、この注目点情報に
対して定義された規則に従って、該当する一文の文書デ
ータからその中の特定単語に関わる文字列を抽出する。
この後、抽出された文字列は、例えば注目点情報に対応
付けられた特定単語情報などと共に表示手段により表示
される。
【0010】したがって、特定単語を例えば“目的”と
するならば、この特定単語に関わる文字列として“目
的”の内容そのものを表す単語や単語列(例えば“効率
向上”など)を全体の文書データの中から抽出してユー
ザに表示することができ、これによりユーザは文書全体
に目を通さなくても、大まかな文書内容を把握すること
ができるようになる。
【0011】
【実施例】以下、本発明の実施例を図面を参照しながら
説明する。図1は本発明に係る一実施例の文書検索装置
の全体的な構成を示すブロック図である。同図に示すよ
うに、この文書検索装置は、CPUおよびメモリーを有
して構成される制御装置1、キーボードなどの入力装置
2、テキストデータ(文書データ)などを表示するCR
Tなどの表示装置3、テキストデータなどを格納する外
部記憶装置4、著者情報コードテーブル5、解析辞書6
および注目点辞書7を有して構成されている。
【0012】制御装置1は、図2に示すように、初期化
部201、データ読み込み部202、係り受け解析部2
03、注目点マッチング部204、著者情報読み込み部
205、著者情報処理部206、文書データ表示部20
7、著者情報表示部208および著者情報付与文修飾部
209の各処理部と、データバッファ部210、解析結
果保存バッファ部211、作業バッファ部212の各バ
ッファ部とから構成されている。
【0013】初期化部201は、各バッファ部210、
211、212の初期化処理を行う。 データ読み込み
部202は、外部記憶装置4から著者情報コード付与前
のテキストデータもしくは著者情報コード付与後のテキ
ストデータを読み込んで、データバッファ部210に格
納する処理を行う。
【0014】係り受け解析部203は、データバッファ
部210に格納された、著者情報コード付与前の一文の
テキストデータにおける単語間の係り受け関係を解析辞
書6を用いて解析し、その解析結果を解析結果保存バッ
ファ部211に格納する。
【0015】注目点マッチング部204は、係り受け解
析部203の解析結果と注目点辞書7に格納された注目
点(文書内容を理解する上で重要な特定単語例えば“目
的”“特徴”“意見”などを含む一文における単語間の
受け係り関係)との照合を行う。そして、解析結果があ
る注目点と一致する場合は、この注目点の著者情報名と
著者情報コードテーブル5の上で対応付けられた著者情
報コードを、解析が行われた一文のテキストデータに付
与する。
【0016】著者情報読み込み部205は、データバッ
ファ部210から著者情報コード付きのテキストデータ
を一文ずつ読み込み、これを制御装置1内のメモリーに
格納する処理を行う。
【0017】著者情報処理部206は、制御装置1内の
メモリーに格納された一文のテキストデータに付与され
ている著者情報コードが、文修飾(強調表示)の対象と
して有効な著者情報コードであるか否かを判断する。有
効な著者情報コードが付与されていない場合はその一文
の文番号と表示始点座標を、有効な著者情報コードが付
与されている場合はその一文の著者情報、文番号および
表示始点座標を制御装置1内のメモリーに格納する。
【0018】文書データ表示部207は、データバッフ
ァ部210に格納されたテキストデータを表示装置3に
表示する処理を行う。
【0019】著者情報表示部208は、有効な著者情報
コードとしてテキストデータに付与された著者情報の文
字列である“目的”“特徴”“意見”などを、ユーザの
カーソル指定を受付けることのできる著者情報ボタンと
して表示装置3の画面に表示する処理を行う。
【0020】著者情報付与文修飾部209は、任意の著
者情報ボタンがユーザによって指定されたとき、この著
者情報ボタンに対応する著者情報コードの付与されたテ
キストデータを表示装置3の画面上で反転表示するなど
の文字修飾処理を行う。
【0021】次に本実施例の文書検索装置の動作を説明
する。本実施例の文書検索装置では前処理として次のよ
うな著者情報コード付与処理を行う。図3はこの処理の
手順を示すフローチャートである。
【0022】まず初期化部201を起動し、各バッファ
部210、211、212の初期化を行う(ステップ3
01)。
【0023】次にデータ読み込み部202を起動し、外
部記憶装置4から著者情報コード付与前のテキストデー
タを一文ずつ読み込んで、これをデータバッファ部21
0に格納する(ステップ302)。
【0024】この後、係り受け解析部203が起動され
る。係り受け解析部203はデータバッファ部210に
格納された一文のテキストデータを対象に単語間の係り
受け関係を解析辞書6を参照して解析し、その解析結果
を解析結果保存バッファ部211に格納する(ステップ
303)。
【0025】続いて注目点マッチング部204が起動さ
れる。注目点マッチング部204は解析結果保存バッフ
ァ部211に格納された解析結果と、注目点辞書7に格
納された各注目点との照合を行う。これにより、解析さ
れた一文が文書においてどのような内容(例えば目的、
特徴、意見など)を表しているものであるかを判断す
る。その具体例を次に説明する。図4は注目点辞書7の
内容の一部を示す図である。同図に示すように、注目点
辞書7には、文書内容を理解する上で重要な単語として
例えば“目的”“特徴”“意見”などの特定単語を含む
一文における単語間の受け係り関係が注目点71の情報
として格納されている。そしてこの注目点辞書7はこの
注目点71に、前記の各特定単語にそれぞれ対応する著
者情報名72を対応付けてなっている。ここで、図5に
示すように、「本システムの目的は、文書の検索であ
る。」と言う一文51に対する解析結果52を得た場合
を想定する。この場合、注目点マッチング部204は、
注目点辞書7内に格納されたすべての注目点の中から解
析結果52と一致するものとして注目点1(53)を見
付け出し、この注目点1に対応する著者情報名として
“目的”を判断する(ステップ304)。
【0026】この後、注目点マッチング部204は、図
6に示す著者情報コードテーブル5を参照して当該著者
情報名に対応する著者情報コードを求める。例えば、著
者情報名が“目的”の場合は“1”、著者情報名が“特
徴”の場合は“2”、著者情報名が“意見”の場合は
“3”の著者情報コードがそれぞれ求められる。そして
図7に示すように、この、これをデータバッファ部21
0に格納する(ステップ305)。なお、著者情報名が
抽出されなかった文に対しては著者情報コードとして
“0”が一文に付与される。
【0027】こうして一文書すべてのテキストデータに
著者情報コードを付与し終えたならば(ステップ30
6)、その一文書のテキストデータを外部記憶装置4に
転送、記憶する(ステップ307)。
【0028】次に本実施例装置での文書検索の手順を図
8のフローチャートを用いて説明する。
【0029】まずデータ読み込み部202を起動して外
部記憶装置4から著者情報コードの付与されたテキスト
データを読み込み、このテキストデータを、図9に示す
ように、一文ごとに文番号を付加してデータバッファ部
210に格納する(ステップ801)。
【0030】次に著者情報読み込み部205が起動され
る。著者情報読み込み部205は、データバッファ部2
10に著者情報コード付きのテキストデータが存在して
いることを確認すると(ステップ802)、データバッ
ファ部210からテキストデータを先頭の文番号のもの
から順番に一文ずつ読み込み制御装置1内のメモリーに
格納する(ステップ803)。
【0031】この後、著者情報処理部206が起動され
る。著者情報処理部206は、制御装置1内のメモリー
に格納されている一文のテキストデータに付与されてい
る著者情報コードをチェックし、これが文修飾(強調表
示)の対象として有効な著者情報コードであるかどうか
を判断する(ステップ804)。ここで文修飾の対象と
して有効な著者情報コードは“0”以外のすべてのコー
ド、無効な著者情報コードとは“0”とされている。
【0032】このチェックの結果、一文のテキストデー
タに文修飾の対象として有効な著者情報コードが付与さ
れていた場合、著者情報処理部206は、図10に示す
ように、その著者情報コードに対応する著者情報、文番
号、および表示始点座標をそれぞれ対応付けて制御装置
1のメモリーに格納する(ステップ805)。続いて文
書データ表示部207が起動されて当該テキストデータ
の表示が行われる(ステップ806)。
【0033】またステップ804のチェックの結果、一
文のテキストデータに文修飾の対象としては無効の著者
情報コードが付与されていた場合、著者情報処理部20
6は、図10に示すように、そのテキストデータの文番
号と表示始点座標だけを制御装置1のメモリーに格納す
る(ステップ807)。その後、文書データ表示部20
7が起動されて当該テキストデータの表示が行われる
(ステップ806)。
【0034】こうしてデータバッファ部210に格納さ
れたすべてのテキストデータについて著者情報処理部2
06による処理を終えると(ステップ802)、著者情
報表示部208が起動される。著者情報表示部208
は、制御装置1のメモリーに格納された著者情報を読み
込み、これらの著者情報をその種類ごとに表示装置3の
画面上に著者情報ボタンとして表示する(ステップ80
8)。
【0035】図11はテキストデータおよび著者情報ボ
タンの表示の様子を示す図である。同図に示すように、
表示画面はテキストデータを表示する領域Aと、ユーザ
のカーソル指定入力を受け付ける著者情報ボタンB1、
B2および終了ボタンBnを表示する領域Bに区分され
る。著者情報ボタンの表示領域Bにおいて、各著者情報
ボタンは“目的”“特徴”のようにそのままユーザが認
識できるような文字列として表示される。
【0036】この後、ユーザにより各著者情報ボタンB
1、B2のいずれかが指定されると(ステップ81
0)、著者情報処理部206は、指定された著者情報ボ
タンの著者情報に対応した著者情報コードを図6の著者
情報コードテーブル5から求め、求めた著者情報コード
を持つ文番号を図9に示すデータバッファ部210の内
容が判断し、さらにこの文番号に対応する表示始点座標
を図10に示す制御装置1のメモリー内容より調べてこ
れらの情報を著者情報付与文修飾部209に入力する。
【0037】すると著者情報付与文修飾部209は、入
力した表示始点座標から次の文番号の表示始点座標の直
前までの範囲に表示されているテキストデータを判断
し、このテキストデータに対して例えば反転表示などの
修飾処理を施すことにより当該テキストデータを強調表
示する(ステップ811)。
【0038】例えば図12に示すように、“特徴”の著
者情報ボタンB2が指定された場合、著者情報処理部2
06は、まず、指定された著者情報に対応する著者情報
コードとして著者情報コードテーブル5から“2”を求
める。次に“2”の著者情報コードを持つ文番号として
データバッファ部210の内容から“6”を判断する。
そしてこの“6”の文番号に対応する表示始点座標とし
て制御装置1のメモリーの内容より(5,23)を求め
る。これにより、著者情報付与文修飾部209は、この
表示始点座標(5,23)から次の文番号の表示始点座
標(7,21)の直前つまり(7,20)までの範囲に
表示されているテキストデータを反転表示等によって強
調して表示する。
【0039】その後、終了ボタンBnが指定されること
により(ステップ809)、テスキトデータの表示を含
む文書検索の処理が終了する。
【0040】かくして本実施例の文書検索装置によれ
ば、文書において著者が言わんとしている事項の例えば
目的、特徴、意見など、文書を理解する上で重要な部分
を自動的に検索して、この部分を画面上でユーザが一目
で識別できるよう反転表示などにより強調して表示する
ことができる。
【0041】次に本発明の他の実施例を説明する。図1
3はこの実施例の文書検索装置の全体的な構成を示すブ
ロック図である。同図に示すように、この文書検索装置
は、CPUおよびメモリーを有して構成される制御装置
11、キーボードなどの入力装置12、テキストデータ
(文書データ)などを表示するCRTなどの表示装置1
3、テキストデータなどを格納する外部記憶装置14、
著者情報ファイル15、解析辞書16および注目点辞書
17を有して構成されている。
【0042】制御装置11は、図14に示すように、初
期化部1101、注目点読み込み部1102、一文書デ
ータ読み込み部1103、一文データ読み込み部110
4、係り受け解析部1105、注目点マッチング部11
06、属性付けデータ保存部1107および表示部11
08の各処理部と、注目点バッファ部1109、一文書
バッファ部1110、一文バッファ部1111、解析結
果保存バッファ部1112および作業バッファ部111
3の各バッファ部とから構成されている。
【0043】初期化部1101は、各バッファ部110
9〜1113の初期化処理を行う。注目点読み込み部1
102は、注目点辞書17からすべての注目点(文書内
容を理解する上で重要な特定単語例えば“目的”“特
徴”“意見”などを含む一文における単語間の受け係り
関係)を注目点バッファ部1109に格納する。
【0044】一文書データ読み込み部1103は、外部
記憶装置14より一文書のテキストデータを読み込み、
これを一文書バッファ部1110に格納する処理を行
う。
【0045】一文データ読み込み部1104は、一文書
バッファ部1110よりテキストデータを一文ずつ先頭
のものから順番に読み込み、この一文のテキストデータ
を一文バッファ部1111に格納する処理を行う。
【0046】係り受け解析部1105は、一文バッファ
部1111に格納された一文のテキストデータの単語間
の係り受け関係を解析辞書16を用いて解析し、その解
析結果を解析結果保存バッファ部1112に格納する。
【0047】注目点マッチング部1106は、解析結果
保存バッファ部1112に格納された解析結果と注目点
辞書17に格納された注目点(文書内容を理解する上で
重要な特定単語例えば“目的”“特徴”“意見”などを
含む一文における単語間の受け係り関係)との照合を行
う。
【0048】属性付けデータ保存部1107は、照合の
結果、解析結果がある注目点と一致する場合に、一文バ
ッファ部1111に格納された一文のテキストデータの
中から、この注目点に対して注目点辞書17内で定義さ
れた規則に従って文字列の抽出を行う。そして注目点辞
書17内で当該注目点と対応付けられている著者情報を
文字列に属性として付与し、この著者情報と文字列との
対を著者情報ファイル15に保存する。
【0049】表示部1108は、著者情報ファイル15
に格納された著者情報および文字列を表示装置13に表
示する処理を行う。
【0050】次にこの文書作成装置の動作を説明する。
本実施例の文書検索装置ではまず次のようにして著者情
報ファイル15の作成を行う。図15はこの処理の手順
を示すフローチャートである。
【0051】まず初期化部1101を起動し、各バッフ
ァ部1109〜1113の初期化を行う(ステップ15
01)。
【0052】次に注目点読み込み部1102を起動し、
注目点辞書17からすべての注目点の情報を注目点バッ
ファ部1109に格納する(ステップ1502)。
【0053】ここで注目点は、図16に示すように、文
書内容を理解する上で重要な単語として例えば“特徴”
“意見”などの特定単語を含む一文の単語間の受け係り
関係を表したものである。また各注目点にはそれぞれ、
特定単語に係わる文字列を抽出するための規則が定義さ
れている。そしてこれらの注目点は、注目点辞書17内
において特定単語を示す著者情報とそれぞれ対応付けて
格納されている。
【0054】この後、一文書データ読み込み部1103
が起動される。一文書データ読み込み部1103は外部
記憶装置14より一文書のテキストデータを読み込み、
これを一文書バッファ部1110に格納する(ステップ
1503)。
【0055】次に一文データ読み込み部1104が起動
される。一文データ読み込み部1104は一文書バッフ
ァ部1110よりテキストデータを一文ずつ先頭のもの
から順番に読み込み、この一文のテキストデータを一文
バッファ部1111に格納する(ステップ1505)。
【0056】続いて係り受け解析部1105が起動され
る。係り受け解析部1105は一文バッファ部1111
に格納された一文のテキストデータを対象に、単語間の
係り受け関係を解析辞書16を参照して解析し、その解
析結果を解析結果保存バッファ部1112に格納する
(ステップ1506)。
【0057】次に注目点マッチング部1106が起動さ
れる。注目点マッチング部1106は注目点バッファ部
1109から一つずつ注目点の情報を取り出し、この注
目点の情報と解析結果保存バッファ部1112に格納さ
れた解析結果とを照合する(ステップ1507、150
8)。
【0058】この結果、一致した場合は属性付けデータ
保存部1107が起動される。属性付けデータ保存部1
107は、まず、解析した一文のテキストデータの中か
ら、照合で一致した注目点にて定義されている規則に従
って文字列の抽出を行う。続いて注目点辞書17内で当
該注目点と対応付けられている著者情報を調べ、この著
者情報を文字列に属性として付与し、この著者情報と文
字列との対を著者情報ファイル15に保存する(ステッ
プ1509)。
【0059】その具体例を次に説明する。図17に示す
ように、「本システムの特徴は性能向上である。」と言
う一文171に対する解析結果172を得た場合を想定
する。この場合、図16に示した注目点辞書17の中か
ら著者情報が“特徴”の注目点173が、解析結果17
2と一致するものとして判定される。続いてこの注目点
173に定義された文字列抽出規則から、「である」に
対し目的語接続された“性能向上”なる文字列174が
抽出される。そしてこの文字列174に、注目点173
に対応付けられた著者情報として“特徴”が属性として
付与され、図18に示すように、この著者情報と文字列
との対が著者情報ファイル15に保存される。
【0060】またステップ1507、1508の結果、
解析結果と注目点とが不一致の場合は、ステップ150
4を介してステップ1505に戻り、再び一文書バッフ
ァ部1110からの一文のテキストデータの読み込みを
行う。そして一文書バッファ部1110に格納されたす
べてのテキストデータについてステップ1506から1
509までの処理を終了したならば、著者情報ファイル
作成処理を終了とする。 しかる後、ユーザより所定の
コマンドが入力装置12を介して制御装置11に入力さ
れると、次のようにして著者情報ファイル15の内容を
表示する処理が開始される。
【0061】図19はこの表示処理の手順を示すフロー
チャートである。まず初期化部1101が起動され、各
バッファ部1109〜1113の初期化が行われる(ス
テップ1901)。
【0062】この後、データ読み込み部1103が起動
される。データ読み込み部1103は著者情報ファイル
15のすべての内容を読み込み、これを作業バッファ部
1113に格納する(ステップ1902)。
【0063】次に表示部1108が起動される。表示部
1108は作業バッファ部1113に格納された著者情
報と文字列の対をすべて取り出して、これらを図20に
示すように。表示装置13の画面上に表示する(ステッ
プ1903)。
【0064】この後、入力装置12を通して、表示画面
上に著者情報および文字列と共に表示された終了ボタン
201をユーザがカーソル指定することなどによって
(ステップ1904)、著者情報ファイル表示処理が終
了する(ステップ1905)。かくしてこの実施例の文
書検索装置によれば、テキストデータの内容を理解する
上で重要な部分だけを抽出してユーザに表示することが
できる。したがって、ユーザはテキストデータの全体に
目を通さなくても、このテキストデータの大まかな内容
を把握することが可能になる。
【0065】
【発明の効果】以上説明したように本発明の文書検索装
置によれば、文書において著者が言わんとしている事項
の例えば目的、特徴、意見など、文書を理解する上で重
要な部分を自動的に検索してユーザに掲示することがで
きる。したがって、ユーザはテキストデータの全体に目
を通さなくても、このテキストデータの大まかな内容を
把握することが可能になる。
【図面の簡単な説明】
【図1】本発明に係る一実施例の文書検索装置の全体的
な構成を示すブロック図である。
【図2】図1における制御装置の構成を示す図である。
【図3】図1の文書検索装置における著者情報コード付
与処理の手順を示すフローチャートである。
【図4】図1における注目点辞書の内容の一部を示す図
である。
【図5】図4の注目点辞書を用いた係り受け解析処理に
ついて説明するための図である。
【図6】図1における著者情報コードテーブルの内容を
示す図である。
【図7】一文ごとに著者情報コードの付与されたテキス
トデータを示す図である。
【図8】図1の文書検索装置における文書検索の手順を
示すフローチャートである。
【図9】一文ごとに文番号が付与されたデータバッファ
部内のテキストデータを示す図である。
【図10】制御装置のメモリーに格納された著者情報、
文番号および表示始点座標を示す図である。
【図11】テキストデータおよび著者情報ボタンの表示
の様子を示す図である。
【図12】テキストデータの修飾表示の様子を示す図で
ある。
【図13】本発明に係る他の実施例の文書検索装置の全
体的な構成を示すブロック図である。
【図14】図13における制御装置の構成を示す図であ
る。
【図15】図13の文書検索装置における著者情報ファ
イル作成の手順を示すフローチャートである。
【図16】図13における注目点辞書の内容の一部を示
す図である。
【図17】図16の注目点辞書を用いた係り受け解析処
理の具体列を説明するための図である。
【図18】図13における著者情報ファイルの内容を示
す図である。
【図19】図18に示す著者情報ファイル内容の表示処
理の手順を示すフローチャートである。
【図20】図18に示す著者情報ファイル内容の表示の
様子を示す図である。
【符号の説明】
1、11…制御装置、2、12…入力装置、3、13…
表示装置、4、14…外部記憶装置、5…著者情報コー
ドテーブル、15…著者情報ファイル、6、16…解析
辞書、7、17…注目点辞書、201、1101…初期
化部、202…データ読み込み部、203、1105…
係り受け解析部、204、1106…注目点マッチング
部、205…著者情報読み込み部、206…著者情報処
理部、207…文書データ表示部、208…著者情報表
示部、209…著者情報付与文修飾部、210…データ
バッファ部、211、1112…解析結果保存バッファ
部、212、1113…作業バッファ部、1102…注
目点読み込み部、1103…一文書データ読み込み部、
1104…一文データ読み込み部、1107…属性付け
データ保存部、1108…表示部、1109…注目点バ
ッファ部、1110…一文書バッファ部、1111…一
文バッファ部。
フロントページの続き (72)発明者 矢島 真人 神奈川県川崎市幸区柳町70番地 株式会社 東芝柳町工場内 (72)発明者 野上 謙一 東京都青梅市新町1381番地1 東芝コンピ ュータエンジニアリング株式会社内 (72)発明者 中本 幸夫 東京都青梅市新町1381番地1 東芝コンピ ュータエンジニアリング株式会社内

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 文書データを格納する文書データ格納手
    段と、 前記文書データ格納手段より一文ずつ文書データを読み
    込む読み込み手段と、 読み込んだ一文の文書データの単語間の受け係り関係を
    解析する解析手段と、 特定単語を含む一文における単語間の受け係り関係の注
    目点情報を、前記特定単語の情報と対応付けて複数格納
    した辞書と、 前記解析手段の解析結果と前記辞書に格納された各注目
    点情報とを照合する照合手段と、 前記照合手段により前記解析結果が前記辞書内のある注
    目点情報と一致することが判断された場合、この注目点
    情報に対応する特定単語情報を前記一文の文書データに
    付与し、この文書データを前記文書データ格納手段に格
    納する特定単語情報付与手段と、 前記文書データ格納手段に格納された文書データをこの
    文書データに付与された特定単語情報と共に表示する表
    示手段と、 表示された任意の特定単語情報が指定されたとき、この
    特定単語情報の付与された文書データを他の文書データ
    と識別できるよう強調して表示する強調表示手段とを具
    備することを特徴とする文書検索装置。
  2. 【請求項2】 文書データを格納する文書データ格納手
    段と、 前記文書データ格納手段より一文ずつ文書データを読み
    込む読み込み手段と、 読み込んだ一文の文書データの単語間の受け係り関係を
    解析する解析手段と、 特定単語を含む一文における単語間の受け係り関係の注
    目点情報を、前記一文中から前記特定単語に関わる文字
    列を抽出するための規則と共に、前記特定単語の情報と
    対応付けて複数記憶した辞書と、 前記解析手段の解析結果と前記辞書に記憶された各注目
    点情報とを照合する照合手段と、 前記照合手段により前記解析結果が前記辞書内のある注
    目点情報と一致することが判断された場合、この注目点
    情報に対して定義された規則に従って前記一文の文書デ
    ータから前記特定単語に関わる文字列を抽出する文字列
    抽出手段と、 前記文字列抽出手段により抽出された文字列を表示する
    表示手段とを具備することを特徴とする文書検索装置。
  3. 【請求項3】 請求項2記載の文書検索装置において、 前記表示手段は、前記文字列抽出手段により抽出された
    文字列を前記注目点情報に対応付けられた特定単語情報
    と共に表示することを特徴とする文書検索装置。
JP4189631A 1992-07-16 1992-07-16 文書検索装置 Withdrawn JPH0635971A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4189631A JPH0635971A (ja) 1992-07-16 1992-07-16 文書検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4189631A JPH0635971A (ja) 1992-07-16 1992-07-16 文書検索装置

Publications (1)

Publication Number Publication Date
JPH0635971A true JPH0635971A (ja) 1994-02-10

Family

ID=16244532

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4189631A Withdrawn JPH0635971A (ja) 1992-07-16 1992-07-16 文書検索装置

Country Status (1)

Country Link
JP (1) JPH0635971A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08255172A (ja) * 1995-03-16 1996-10-01 Toshiba Corp 文書検索システム
JPH11272686A (ja) * 1998-03-19 1999-10-08 Nippon Telegr & Teleph Corp <Ntt> 文書重要文抽出方法、文書重要文抽出装置及び文書重要文抽出プログラムを記録した記録媒体
US6912536B1 (en) 1998-12-04 2005-06-28 Fujitsu Limited Apparatus and method for presenting document data
CN103324653A (zh) * 2012-03-21 2013-09-25 株式会社东芝 要点抽出装置以及要点抽出方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08255172A (ja) * 1995-03-16 1996-10-01 Toshiba Corp 文書検索システム
JPH11272686A (ja) * 1998-03-19 1999-10-08 Nippon Telegr & Teleph Corp <Ntt> 文書重要文抽出方法、文書重要文抽出装置及び文書重要文抽出プログラムを記録した記録媒体
US6912536B1 (en) 1998-12-04 2005-06-28 Fujitsu Limited Apparatus and method for presenting document data
CN103324653A (zh) * 2012-03-21 2013-09-25 株式会社东芝 要点抽出装置以及要点抽出方法
JP2013196504A (ja) * 2012-03-21 2013-09-30 Toshiba Corp 要点抽出装置およびプログラム
CN103324653B (zh) * 2012-03-21 2016-12-28 株式会社东芝 要点抽出装置以及要点抽出方法

Similar Documents

Publication Publication Date Title
US5745745A (en) Text search method and apparatus for structured documents
US5850561A (en) Glossary construction tool
JP2783558B2 (ja) 要約生成方法および要約生成装置
JPH11110416A (ja) データベースからドキュメントを検索するための方法および装置
JPH0765035A (ja) 構造化文書検索装置
JPH0525138B2 (ja)
US5890182A (en) Sentence processing method and apparatus
JP3022539B1 (ja) 文書検索装置
JP2002132791A (ja) 地名情報抽出装置、その抽出方法及び抽出プログラムを記録した記録媒体、地図情報検索装置
JP2957875B2 (ja) 文書情報検索装置及び文書検索結果表示方法
JPH08147311A (ja) 構造化文書検索方法及び装置
JPH0635971A (ja) 文書検索装置
JPH0785080A (ja) 全文書検索システム
JPS61248160A (ja) 文書情報登録方式
JPH09101969A (ja) 適合フィードバックを用いた全文検索方法および装置
JPH08212230A (ja) 文書検索方法及び文書検索装置
JP3210842B2 (ja) 情報処理装置
JP3056810B2 (ja) 文書検索方法および装置
JP3470930B2 (ja) 自然語解析方法及び装置
JPH07296005A (ja) 日本語テキスト登録・検索装置
JPS6175952A (ja) 文書入力処理方式
JPH08115330A (ja) 類似文書検索方法および装置
JP3187671B2 (ja) 電子辞書表示装置
JPH0793345A (ja) 文書検索装置
JPH02253474A (ja) テキストベース検索方法

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19991005