JPH0635961A - 文書要約装置 - Google Patents

文書要約装置

Info

Publication number
JPH0635961A
JPH0635961A JP4190343A JP19034392A JPH0635961A JP H0635961 A JPH0635961 A JP H0635961A JP 4190343 A JP4190343 A JP 4190343A JP 19034392 A JP19034392 A JP 19034392A JP H0635961 A JPH0635961 A JP H0635961A
Authority
JP
Japan
Prior art keywords
sentence
modifier
level
input
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4190343A
Other languages
English (en)
Inventor
Keizo Sato
圭三 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP4190343A priority Critical patent/JPH0635961A/ja
Publication of JPH0635961A publication Critical patent/JPH0635961A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】従来の文要約装置のようなキーワードを抽出す
る手法ではなく、修飾語を削除する手法により、文にお
ける修飾語を省き、文を短く要約することで、文の概要
を効率よく理解できるようにする。 【構成】文を入力、記憶、および表示を行う構成要素に
加え、文の解析結果と修飾語句ごとのレベルを出力する
解析部5と、ユーザの指定操作と修飾語のレベルにより
抑制すべき修飾語のレベルを演算するレベル演算部7を
構成要素としたものであり、入力手段1によりユーザが
修飾語抑制指示を行った場合、レベル演算部7により出
力されたレベル以上の修飾語を抑制して文を表示手段8
に再表示する。ここで、修飾語レベルとは、単に修飾語
であるものはレベル1、修飾語をさらに修飾するものは
レベル2のようになる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力された文の概要を
出力する文書要約装置に関するものである。
【0002】
【従来の技術】文書要約装置は文の概要を効率よく理解
するための装置として用いられている。ここでは、英文
要約装置において、英文「I gave a man whom I saw in
the library the interesting book which she showed
me yesterday.」を要約する場合を考える。
【0003】まず、要約しようとする文の分野をあらか
じめ決定しておき、その分野におけるキーワードになり
えるような項目の予想をつける。たとえば、仮に要約し
ようとする文があるコンピュータの説明をする文であっ
た場合、「名前」、「CPUは何であるか」、「いつ開
発されたか」、「何処で開発されたか」などの項目がキ
ーワードとなり得ることが予想される。
【0004】次に、入力文の解析を行う。まず入力を単
語ごとに分割する。上の例では、“I ”、“gave”、
“a ”、“man ”、“ whom ”、“I ”、“saw ”、
“ in ”、“the ”、“library ”、“the ”、“ int
eresting”、“book”、“ which”、“she ”、“show
ed”、“me”、“ yesterday”となる。次に、これらの
分割された英単語に対して単語辞書を参照し、各単語に
関する品詞などの情報を取り出す。各単語に対する情報
を図9に示す。そして、解析部はルール辞書を参照し、
入力された文がどのような構文であったかを認識する
(以降、構文解析と呼ぶ)。
【0005】上の例では、まず (1) “I ”が主語、“gave”が述部、“a man ”が直接
目的語、“the interesting book”が間接目的である。
構文としてSVO12 構文である、(2) 関係代名詞
“whom”以降は埋め込み文であり、埋め込み文の主語は
“I ”、述部は“saw ”、目的語は“whom”で代替され
ている。また、前置詞句“in the library”をともなっ
ている。構文として、SVO構文である、(3) 関係代名
詞“which ”以降は埋め込み文であり、埋め込み文の主
語は“she ”、述部は“showed”、直接目的は“me”、
間接目的語は“which ”で代替され、副詞句“yesterda
y ”をともなっている。構文として、SVO12 構文
である、のように構文解析を行う。構文解析に使用した
ルールを図10に示す。
【0006】さらに、動詞の格フレームと呼ばれる情報
(動詞に対して、その動詞に隣接する名詞などがどのよ
うな関係にあるかという情報)を参照し、格(動詞に対
する関係、たとえば、主語は「動作手」、目的語は「対
象」のようなもの)を決定する(以下、意味解析と呼
ぶ)。各動詞に対する格フレーム情報を図11に示す。そ
して、各単語間の係受け関係を決定する。
【0007】(1) 動詞“gave”に対して、主語が「動作
主」、直接目的語が「受け手」、間接目的語が「対象」
であり、また、形容詞“interesting ”は、“book”を
修飾している、(2) 動詞“saw ”に対して、主語が「動
作主」、関係代名詞により代替されている目的語は「対
象」、前置詞句が「場所格」であり、また、この文は
“man ”を修飾している、(3) 動詞“showed”に対し
て、主語が「動作主」、直接目的語が「受け手」、関係
代名詞により代替されている間接目的語が「対象」、副
詞句が「時間格」であり、また、この文は“book”を修
飾している、のように意味解析する。意味解析に使用し
たルールを図12に示す。
【0008】以上のように解析された文は、一般的に依
存構造と呼ばれる木構造で表わす。木構造は、枝(アー
ク)と節(ノード)により構成される。木構造のノード
には単語を置き、そして、ノードをアークにより結ぶこ
とで係り受け関係を表現する。つまり、ノードの上下関
係が係り受け関係を表現し、上が受ける側で下が係る側
になる。また、依存構造は、意味解析によって得られた
動詞とその動詞に対する格の関係も上下関係により表わ
す。つまり、動詞を頂点として各々の格となる語が動詞
の下のノードになる。
【0009】したがって、例文では (1) 動詞“gave”の下にその格“I ”、“man ”と“bo
ok”が置かれ、アークで結ばれる、(2) 動詞“saw ”の
下にその格“I ”、“library ”が置かれ、アークで結
ばれる、(3) 動詞“showed”の下にその格“she ”、
“me”、“yesterday ”が置かれ、アークで結ばれる、
(4) “man ”を修飾する“saw ”を頂点とする木構造
は、“man ”の下に置かれ、アークで結ばれる。また、
“book”を修飾する“show”を頂点とする木構造と“in
teresting ”は、“book”の下に置かれアークで結ばれ
る、のような動詞とその格の関係、および修飾被修飾関
係が木構造により示される。図13に実際の木構造を示
す。
【0010】以上のように意味解析を行えば、格が明確
になるため先に説明したような項目にしたがい、キーワ
ードの抽出が行える。これらの抽出したキーワードをた
とえば表形式のようなユーザに分かりやすい表示形式で
表示する。
【0011】
【発明が解決しようとする課題】以上説明した従来の英
文要約装置では、キーワードを抽出することを目的とし
ている。このため格と呼ばれる情報が消えてしまう場合
が多々ある。通常、文というものは、動詞とその動詞の
格により構成され、修飾語句がそれらの格を修飾してい
ると考えられる。したがって、格は重要なものである可
能性は高く、その格が消えてしまうことは、大きな問題
である。また、これら抽出したキーワード群から文を生
成することが困難である。そこで、ユーザに文の概要を
理解させるためには表示形式に工夫を凝らす必要があ
る。
【0012】本発明は、上記の問題を解決するもので、
従来の文要約装置のようなキーワードを抽出する手法で
はなく、修飾語を削除する手法をとる文書要約装置を提
供することを目的とするものである。
【0013】
【課題を解決するための手段】上記課題を解決するため
に本発明の文書要約装置は、文を解析して修飾語と認定
された語の修飾語句のレベルを出力する解析部と、ユー
ザの指定操作の回数と修飾語と修飾語のレベルにより抑
制すべき修飾語のレベルを演算するレベル演算部と、ユ
ーザの表示操作により、修飾語を抑制して文を表示する
表示部を備えたものである。ここで、修飾語レベルと
は、単に修飾語であるものはレベル1、修飾語をさらに
修飾するものはレベル2のようになる。たとえば、“ve
ry big apple”のような名詞句では、“big ”は“appl
e ”を修飾する修飾語であるからレベル1、“very”は
修飾語“big ”を修飾する修飾語であるのでレベル2の
ようになる。
【0014】
【作用】上記構成により、ユーザが修飾語句の抑制操作
を行えば、修飾語を抑制して、要約文を表示できるよう
になる。
【0015】
【実施例】以下、本発明の一実施例について図面を参照
しながら説明する。図1は本発明の一実施例における文
書要約装置の機能ブロック図であり、1は文の入力、要
約指示(修飾語抑制指示)を行う入力手段、2は入力手
段1より入力された文を解析して修飾語と認定された語
の修飾語レベル、および入力手段1によりユーザが修飾
語抑制指示を行った場合、現在の抑制指示を記憶する文
情報管理テーブル、3は文を解析するのに必要な単語に
関する文法的情報、動詞の格情報(この動詞に対して主
語や目的語がどのような関係にあるかという情報)を格
納した単語辞書、4は英文における文法規則を記憶した
ルール辞書、5は入力手段1より入力された原文を前記
単語辞書と前記ルール辞書を参照して解析を行い、ま
た、各修飾語句ごとのレベルを出力する解析部、6は文
情報管理テーブル2に記憶された文の要約を行う要約実
行部、7は文情報管理テーブル2に記憶された情報によ
り「修飾語レベルの最大値+1−修飾語抑制指示」のよ
うな演算、つまり抑制すべき修飾語のレベルを出力する
レベル演算部、8は入力手段1によりユーザが修飾語抑
制指示を行った場合、前記レベル演算部7により出力さ
れたレベル以上の修飾語を抑制して文を再表示する表示
手段、である。
【0016】図2は本実施例の文書要約装置の回路ブロ
ック図であり、9はキーボード、10は中央処理装置(以
下、CPUと略称する)、11は陰極線管ディスプレイ
(以下、CRTと略称する)、12はリードオンリーメモ
リ(以下、ROMと略称する。)、13はランダムアクセ
スメモリ(以下、RAMと略称する)である。
【0017】図1に示した入力手段1はキーボード9に
より、文情報管理テーブル2はRAM13により、単語辞
書3、ルール辞書4はROM12により、解析部5、要約
実行部6、レベル演算部7はCPU10がROM12および
RAM13とデータのやりとりを行いながらROM12に記
憶されたプログラムを実行することにより、表示手段8
はCRT11により実現されている。
【0018】上記のように構成された本発明の一実施例
における英文要約装置について、以下その動作を図3の
フローチャートにもとづき説明する。まず、ステップA
で、ユーザが入力手段1から英文を入力する。入力され
た英文は、要約実行部6によって文情報管理テーブル2
に記憶され、表示部8へ表示される。
【0019】ここでは、従来の技術で用いた英文と同様
の文“I gave a man whom I saw in the library the i
nteresting bookwhich she showed me yesterday.”が
入力されたこととして説明する。このときの画面の様子
を図4に示す。
【0020】ステップBでは、要約実行部6が解析部5
を動作させ、単語辞書3、ルール辞書4を用いて、従来
通り英文の構文解析、意味解析を行い、依存構造を出力
する。依存構造を構成するノードの上下関係は、修飾被
修飾関係を表現しているということを考えると、原文中
における修飾語のレベルというものを表現できる。たと
えば、格を表現しているノードの1段下のノードは修飾
語レベル1,2段下のノードは修飾語レベル2、…、n
段下のノードは修飾語レベルnと表わすことができる。
ただし、動詞とその動詞の一段下は、動詞とその格の関
係を表わしており、修飾被修飾を表わしているのではな
い。そして、この修飾語レベルを文情報管理テーブル2
へ記憶し、ステップCへ進む。
【0021】例文も従来と同様、解析部5が図9〜図12
の単語情報、構文解析ルール、格フレーム情報、および
意味解析ルールを用いて構文解析、意味解析を行い、依
存構造を出力する。要約実行部6は、この依存構造によ
り、“interesting ”、および関係詞節がそれぞれ修飾
語レベル1となることを判断し、文情報管理テーブル2
に記憶する。このときの文情報管理テーブル2の様子を
図5に示す。
【0022】ステップCでは、入力手段1により修飾語
抑制指示があれば、ステップEへ進む。なければ文要約
処理を終了する。ステップDでは、ステップCでユーザ
が入力手段1により修飾語抑制指示を行う都度、その回
数をインクメントする。つまり、現在行われた修飾語抑
制指示が何回目の抑制指示であったかを認識し、要約実
行部6が文情報管理テーブル2に記憶する。そして、ス
テップEへ進む。ユーザが行った抑制指示の回数が1度
目であった場合の文情報管理テーブル2の様子を図6に
示す。
【0023】ステップEでは、要約実行部6が文情報管
理テーブル2に記憶された修飾語レベルの最大値とユー
ザにより指示された修飾語抑制指示の回数を比較し、前
者の方が大きければ、抑制すべき修飾語が存在すると判
断され、ステップFへ、そうでなければステップGへ進
む。ステップAで入力手段1により入力された文が再表
示される。
【0024】ステップFでは、レベル演算部7が、文情
報管理テーブル2に記憶された情報「修飾語レベルの最
大数+1−修飾語抑制指示」の演算、つまり抑制すべき
修飾語のレベルの演算を行い、要約実行部6がこの演算
結果以上のレベルの修飾語を抑制して文を表示手段8に
再表示する。つまり、英文中から修飾語を一時的に見え
ないようにする。そして、ステップCへ戻り、修飾語抑
制処理を繰り返す。この例では、一度ユーザが入力手段
1により修飾語抑制指定を一度行えば、レベル1の修飾
語が文中から抑制される。このときの画面の様子を図7
に示す。
【0025】なお、この例文ではレベル1の修飾語しか
もちえないが、仮に、“very interesting book ”のよ
うな原文であったとすると、“very”は“interesting
”を修飾、“interesting ”は“book”を修飾、つま
り、“very”はレベル2、“interesting ”はレベル1
の修飾語と言うことになる。したがって、1度目の修飾
語抑制指示により、「interesting book」、2度目の修
飾語抑制指示により「book」と表示する。
【0026】ステップGでは、ステップCでユーザが入
力手段1により抑制指示をさらに行い、ステップEで、
修飾語削除指示の回数が修飾語レベルの最大数より大き
くなれば、修飾語を削除しない英文、すなわち入力され
たままの英文を表示し文情報管理テーブル2の修飾語削
除指示回数を0へ戻し、ステップCへ戻り、ユーザの修
飾語削除指示を待つ。この際、ユーザにはこれ以上抑制
すべき修飾語がないという警告を示す。本実施例では、
図8に示すようなメッセージを画面に表示することによ
り、この警告をユーザへ知らせる。
【0027】
【発明の効果】以上説明したように、本発明によれば、
解析部が出力する文中の修飾語をレベルづけして、文中
に現れる修飾語の数を抑制することで、入力された文を
短く、つまり要約することができ、このように文を要約
することにより、ユーザは効率よく文の概要を理解でき
る。また、ユーザの指示により、抑制すべき修飾語を限
定することが可能である。したがって、要約された文の
情報が落ちてしまうことを妨げることができる。
【図面の簡単な説明】
【図1】本発明の一実施例における文要約装置の機能を
示す機能ブロック図である。
【図2】本発明の一実施例における文要約装置の回路を
示す回路ブロック図である。
【図3】本発明の一実施例における文書要約装置の動作
の概略を示すフローチャート図である。
【図4】本発明の一実施例における文書要約装置の表示
画面の様子を示す表示画面の図である。
【図5】本発明の一実施例における文書要約装置の文情
報管理テーブルの様子を示す情報管理テーブルの図であ
る。
【図6】本発明の一実施例における文書要約装置の文情
報管理テーブルの様子を示す情報管理テーブルの図であ
る。
【図7】本発明の一実施例における文書要約装置の表示
画面の様子を示す表示画面の図である。
【図8】本発明の一実施例における文書要約装置の表示
画面の様子を示す表示画面の図である。
【図9】従来の技術における単語に対する情報を示す単
語情報図である。
【図10】従来の技術における構文解析に使用するルール
を示す構文解析ルール図である。
【図11】従来の技術における動詞の格フレーム情報を示
す格フレーム図である。
【図12】従来の技術における意味解析に使用するルール
を示す意味解析ルール図である。
【図13】従来の技術における文書要約装置の依存構造を
表現する木構造の図である。
【符号の説明】
1 入力手段 2 文情報管理テーブル 3 単語辞書 4 ルール辞書 5 解析部 6 要約実行部 7 レベル演算部 8 表示手段

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 文の入力、要約指示(修飾語抑制指示)
    を行う入力手段と、 前記入力手段より入力された文を解析して修飾語と認定
    された語の修飾語レベル、および前記入力手段によりユ
    ーザが修飾語抑制指示を行った場合、現在の抑制指示を
    記憶する文情報管理テーブルと、 文を解析するのに必要な単語に関する文法的情報、動詞
    の格情報(この動詞に対して主語や目的語がどのような
    関係にあるかという情報)を格納した単語辞書と、 前記入力手段により入力された言語における文法規則を
    記憶したルール辞書と、 前記入力手段より入力された原文を前記単語辞書と前記
    ルール辞書を参照して解析を行い、また、各修飾語句ご
    とのレベルを出力する解析部と、 前記文情報管理テーブルに記憶された文の要約を行う要
    約実行部と、 前記文情報管理テーブルに記憶された情報により「修飾
    語レベルの最大値+1−修飾語抑制指示」のような演
    算、つまり抑制すべき修飾語のレベルを出力するレベル
    演算部と、 前記入力手段によりユーザが修飾語抑制指示を行った場
    合、前記レベル演算部により出力されたレベル以上の修
    飾語を抑制して文を再表示する表示手段と、 を備えたことを特徴とする文書要約装置。
JP4190343A 1992-07-17 1992-07-17 文書要約装置 Pending JPH0635961A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4190343A JPH0635961A (ja) 1992-07-17 1992-07-17 文書要約装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4190343A JPH0635961A (ja) 1992-07-17 1992-07-17 文書要約装置

Publications (1)

Publication Number Publication Date
JPH0635961A true JPH0635961A (ja) 1994-02-10

Family

ID=16256621

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4190343A Pending JPH0635961A (ja) 1992-07-17 1992-07-17 文書要約装置

Country Status (1)

Country Link
JP (1) JPH0635961A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0741364A1 (en) * 1995-05-01 1996-11-06 Xerox Corporation Automatic method of selecting multi-word key phrases from a document
JP2000003126A (ja) * 1998-03-23 2000-01-07 Xerox Corp 音声部を使用するテキスト要約方法
JP2002024215A (ja) * 2000-07-03 2002-01-25 Hitachi System & Services Ltd 日本語処理装置および日本語処理方法
JP2002524799A (ja) * 1998-09-09 2002-08-06 インベンション・マシーン・コーポレーション 知識創造可能性を有するドキュメントの意味論的分析及び選択
JP2003186388A (ja) * 2001-11-14 2003-07-04 Fuji Xerox Co Ltd ダイナミック個別読解指導方法、ダイナミック個別読解指導システム、及び制御プログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0741364A1 (en) * 1995-05-01 1996-11-06 Xerox Corporation Automatic method of selecting multi-word key phrases from a document
US5745602A (en) * 1995-05-01 1998-04-28 Xerox Corporation Automatic method of selecting multi-word key phrases from a document
JP2000003126A (ja) * 1998-03-23 2000-01-07 Xerox Corp 音声部を使用するテキスト要約方法
JP2002524799A (ja) * 1998-09-09 2002-08-06 インベンション・マシーン・コーポレーション 知識創造可能性を有するドキュメントの意味論的分析及び選択
JP2002024215A (ja) * 2000-07-03 2002-01-25 Hitachi System & Services Ltd 日本語処理装置および日本語処理方法
JP2003186388A (ja) * 2001-11-14 2003-07-04 Fuji Xerox Co Ltd ダイナミック個別読解指導方法、ダイナミック個別読解指導システム、及び制御プログラム
JP4517568B2 (ja) * 2001-11-14 2010-08-04 富士ゼロックス株式会社 ダイナミック個別読解指導方法、ダイナミック個別読解指導システム、及び制御プログラム

Similar Documents

Publication Publication Date Title
JP2654001B2 (ja) 機械翻訳方法
JPS62163173A (ja) 機械翻訳方法
JP2944346B2 (ja) 文書要約装置
JPS638864A (ja) 翻訳装置
JPH0261763A (ja) 機械翻訳装置
JPH0635961A (ja) 文書要約装置
JPH03222065A (ja) 機械翻訳装置
JPS6180362A (ja) 翻訳装置
JP3113257B2 (ja) 機械翻訳装置
JP2859661B2 (ja) 機械翻訳装置
JP2719453B2 (ja) 機械翻訳装置
JPH0635963A (ja) 機械翻訳装置
JP2939348B2 (ja) 画像処理装置
JP2915225B2 (ja) 文書作成装置
JP2794919B2 (ja) 機械翻訳装置
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JPH06162080A (ja) 機械翻訳装置
JPS61260367A (ja) 機械翻訳システム
JP3253311B2 (ja) 言語処理装置および言語処理方法
JPH0332105B2 (ja)
JPH04152458A (ja) 文書作成装置
JP2004199519A (ja) 機械翻訳方法、機械翻訳装置、および機械翻訳プログラム
JPS6190268A (ja) 翻訳方式
JPH04130577A (ja) 自然言語処理装置
JPH0439109B2 (ja)