JPH05314173A - 文章要約支援装置 - Google Patents

文章要約支援装置

Info

Publication number
JPH05314173A
JPH05314173A JP4120652A JP12065292A JPH05314173A JP H05314173 A JPH05314173 A JP H05314173A JP 4120652 A JP4120652 A JP 4120652A JP 12065292 A JP12065292 A JP 12065292A JP H05314173 A JPH05314173 A JP H05314173A
Authority
JP
Japan
Prior art keywords
sentence
unit
sentences
phrases
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4120652A
Other languages
English (en)
Inventor
Satoshi Shirai
諭 白井
Hajime Uchino
一 内野
Yoichi Sakai
陽一 坂井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP4120652A priority Critical patent/JPH05314173A/ja
Publication of JPH05314173A publication Critical patent/JPH05314173A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 文章の要約を行なう作業者の負担を軽減する
文章要約支援装置を提供する。 【構成】 表示部1は記憶部4に記憶されている文章を
表示する。利用者は表示部1に表示されている文章を見
ながら、重要だと思われる文字や語句を入力部2を用い
てマークする。文切り出し部3はマークされた文字や語
句を含む1文を切り出す。単位文検出部5は切り出され
た1文を解析用辞書6を用いて自然言語解析し、1つの
述語を中心とするまとまりである単位文の範囲を決定
し、マークされた文字や語句を含む単位文を記憶部4に
格納する。出力部7はマークされた全ての文字や語句に
ついて文切り出し部3と単位文検出部5による処理が終
了すると、記憶部4に格納されている全ての単位文を文
章要約の元となる要約文作成用データとして出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力された文章を要約
する際に利用者の手助けをする文章要約支援装置に関す
る。
【0002】
【従来の技術】人間が文章を要約する際には、文章を読
みながら重要な箇所をマークし、しかる後にマークした
箇所を抜き出して、それを基に要約文を組み立てるとい
う手順を取るのが一般的である。
【0003】この手順のうち、マークした箇所を自動的
に抜き出して要約文の元となる文を生成することができ
ればすこぶる便利である。
【0004】従来、文章の自動要約についてはいくつか
の研究成果が発表されている。これらは、文章中に現れ
るキーワードを抽出し、キーワードを多く含む文を1文
単位で重要な文として取り出すというのが基本的な考え
方である。
【0005】
【発明が解決しようとする課題】従来の自動要約の考え
方では、文が長くなるとそれだけキーワードを含む確率
が高くなり、修飾語句を多く含む文が抽出される割合が
比較的高くなる。また、キーワードを1個しか含まない
文は抽出されにくいという問題もある。このため、自動
要約といっても現実には要約の基本データの抽出装置に
過ぎず、最終的な要約文を作成するには、人間による、
抽出した文章の確認や抽出漏れの救済や抽出した文の加
工が不可欠である。
【0006】本発明はこうした事情に鑑みてなされたも
ので、その目的は、文章の要約を行なう利用者の負担を
軽減するような文章要約支援装置を提供することにあ
る。
【0007】
【課題を解決するための手段】上記目的を達成するため
に、本発明の文章要約支援装置は、電子化されている文
章を表示する表示部と、表示部に表示されている文章中
の文字や語句を指定する位置指定を利用者が入力するた
めの入力部と、利用者から入力された位置指定で指定さ
れた文字や語句を含む1文を切り出す文切り出し部と、
記憶部と、解析用辞書と、切り出された文の構造を前記
解析用辞書を用いて解析し、指定された文字や語句を含
む、1つの述語を中心とするまとまりである単位文を取
り出して前記記憶部に格納する単位文検出部と、利用者
により入力された全ての位置指定に対して前記文切り出
し部と前記単位文検出部による処理が終了すると、前記
記憶部に格納されている全ての単位文を前記文章の要約
の元となる要約文作成用データとして出力する出力部と
を有する。
【0008】
【作用】本発明は、要約文を作成しようとして文章中か
ら、利用者が指定した文字や語句を含む単位文(1つの
述語を中心とするまとまり)を抽出するので、利用者は
抽出された単位文から従来に比べて容易に要約文を作成
することができる。
【0009】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。
【0010】図1は本発明の一実施例の文章要約支援装
置の構成を示すブロック図、図2は文切り出し部3の処
理を示す流れ図、図3は単位文検出部5の処理を示す流
れ図である。
【0011】本実施例の文章要約支援装置は、図1に示
すように、表示部1と入力部2と文切り出し部3と記憶
部4と単位文検出部5と解析用辞書6と出力部7とで構
成されている。
【0012】記憶部4には要約したい文章が記憶されて
いる。表示部1は例えばCRTディスプレイで、記憶部
4に記憶されている文章を表示する。入力部2はマウ
ス、タッチキーなどで、利用者は表示部1に表示されて
いる文章を見ながら、重要だと思われる文字や語句を入
力部2を用いてマーク(位置指定)する。文切り出し部
3は、図2に示すように、マークから文章の先頭方向へ
向かって文と文の境界を探し、その位置を「S」とし
(ステップ11)、次にマークから文章の末尾方向へ向
かって文と文の境界を探し、その位置を「E」として
(ステップ12)、最後にSからEまでの範囲を1文と
して切り出す(ステップ13)。単位文検出部5は、図
3に示すように、文切り出し部3で切り出された文を解
析用辞書6を用いて自然言語解析し(参考文献:長尾真
監修「日本語情報処理」(電子通信学会,1985))
(ステップ21)、1つの述語を中心とするまとまりで
ある単位文の範囲を決定し(ステップ22)、マークさ
れた文字や語句を含む単位文を検出し、記憶部4に格納
する(ステップ23)。出力部7は、例えばプリンタ
で、全てのマークについて文切り出し部3と単位文検出
部5による処理が終了すると、記憶部4に格納されてい
る全ての単位文を文章要約の元となる要約文作成用デー
タとして出力する。
【0013】次に、本実施例の文章要約支援装置の動作
を、次に示す文章が要約対象である場合について説明す
る。
【0014】「製品の取扱説明書作成大手の十印は英文
マニュアルを日本文に直す機械翻訳システムを実用化
し、作成工程で導入した。英日機械翻訳作業をコンピュ
ーターが自動的にこなすため、人手に比べ納期が半減す
るうえ、翻訳レベルも一定になる。業務用の本格的なシ
ステムは珍しく、すでに外資系企業の日本向け製品の技
術マニュアルに絞って同システムの運用を始めた。一年
後には月間一万ページの体制を整える。
【0015】開発したシステムはTDMS。英文の技術
マニュアルを対象に運用開始し、米国の電子部品、通信
機メーカー数社から受注している。同事業を推進するた
め、このほど専門セクションの「機械翻訳部」を設置し
た。
【0016】同システムでは、英文の原稿をフロッピー
ディスクなどの磁気媒体で受け取り、書式を設定する事
前前編集から翻訳、版下制作などの一連の作業をコンピ
ューターで処理する。人間による翻訳作業はほとんど排
除して、機械が翻訳できなかっが箇所をチェックした
り、自然な日本語にするためのリライト部分に翻訳者が
手を加えるだけにした。
【0017】翻訳者一人が一ヶ月かかる仕事を機械翻訳
だと四時間で済むという。マニュアルの中の数字や単位
など訳す必要のない部分には手を加えず、日本語化の際
にデータの入力ミスを防いでいる。また、原文の印刷ス
タイルも日本語にしてそのまま再現できる。」(以下
略;日本経済新聞1991年7月1日の記事より)利用
者は表示部1に表示されている上記文章を見ながらアン
ダラインで示された箇所を入力部2によりマークしたも
のとする。文切り出し部3は、利用者によるマークの入
力を契機として文の切り出しを開始する。例えば、第1
行の「機械翻訳」のマークに対しては、図2の流れ図に
従って、まず前方へ文の境界を探しにいき、文章の先頭
に至るので、文章の先頭、すなわち「製品の取扱説明書
…」を文の開始位置Sとする。次いで後方へ文と文の境
界を探しにいき、2行目半ばの「…作成工程で導入し
た。」の句点が境界となるので、ここを文の終了位置E
とする。このようにしてマークされた語句を含む1文を
順に切り出していく。
【0018】単位文検出部5では、文切り出し部3で切
り出された文を対象として、図3の流れ図に従って単位
文の抽出を行なう。まず、切り出された文の自然言語解
析を行ない、文の構造を決定する。図4は、この解析に
よって得られる文の構造の例を示している。この構造に
よって得られる1つの述語を中心とするまとまりを単位
文として図5(1),(2)のような各単位文の範囲を
決定し、単位文中に利用者によりマークされた語句を含
むものを順に抽出する。この例では「機械翻訳」の部分
にマークがあるので、述語”実用化する”を中心とする
まとまり「製品の取扱説明書作成大手の十印は英文マニ
ュアルを日本語に直す機械翻訳システムを実用化し」の
部分が抽出される。このようにして次のような要約文生
成用データが得られる。これらは記憶部4に格納された
後、出力部7により出力される。
【0019】要約文作成用データ 製品の取扱説明書作成大手の十印は英文マニュアルを
日本文に直す機械翻訳システムを実用化した。人手に
比べ納期が半減するうえ、翻訳レベルも一定になる。
一年後には月間一万ページの体制を整える。開発した
システムはTDMS。英文の技術マニュアルを対象に
運用開始した。米国の電子部品、通信機メーカー数社
から受注している。翻訳者一人が一ヶ月かかる仕事を
機械翻訳だと四時間で済むという。
【0020】これらの要約文作成用データは、利用者が
マークした文字や語句を含む必要最小限の要素から構成
される文であるので、これらを適宜組み合わせることに
より、次のような要約文を利用者が容易に作成すること
ができる。この例では、のシステム名との「技術マ
ニュアル」に着目して、この2文をに組み合わせて表
現し、そのほかの文の順序を前後させている。
【0021】要約文の作成例 「製品の取扱説明書作成大手の十印は英文技術マニュア
ルを日本文に直す機械翻訳システム「TDMS」を実用
化した。米国の電子部品、通信機メーカー数社から受注
している。翻訳者一人が一ヶ月かかる仕事を機械翻訳だ
と四時間で済むという。人手に比べ納期が半減するう
え、翻訳レベルも一定になる。一年後には月間一万ペー
ジの体制を整える。」
【0022】
【発明の効果】以上説明したように本発明は、電子化さ
れた文章をディスプレイ等に表示し、利用者からの位置
指定を契機として文章中から指定された文字や語句を含
む1文を切り出し、自然言語解析によってその文の構造
を解析し、指定された文字や語句を含む単位文を取り出
して記憶しておき、利用者による一連の位置指定が終了
すれば、記憶されている単位文を要約文作成用データと
して出力することにより、利用者は出力された単位文か
ら要約文を容易に作成することができる効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例の文章要約支援装置の構成を
示すブロック図である。
【図2】文切り出し部3の処理を示す流れ図である。
【図3】単位文検出部5の処理を示す流れ図である。
【図4】単位文検出部5による自然言語解析の解析結果
の例を示す図である。
【図5】単位文検出部5による自然言語解析によって得
られる単位文の範囲の例を示す図である。
【符号の説明】
1 表示部 2 入力部 3 文切り出し部 4 記憶部 5 単位文検出部 6 解析用辞書 7 出力部 11〜13,21〜23 ステップ

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 電子化された文章を表示する表示部と、 前記表示部に表示されている文章中の文字や語句を指定
    する位置指定を利用者が入力するための入力部と、 利用者から入力された位置指定で指定された文字や語句
    を含む1文を切り出す文切り出し部と、 記憶部と、 解析用辞書と、 切り出された文の構造を前記解析用辞書を用いて解析
    し、指定された文字や語句を含む、1つの述語を中心と
    するまとまりである単位文を取り出して前記記憶部に格
    納する単位文検出部と、 利用者により入力された全ての位置指定に対して前記文
    切り出し部と前記単位文検出部による処理が終了する
    と、前記記憶部に格納されている全ての単位文を前記文
    章の要約の元となる要約文作成用データとして出力する
    出力部とを有する文章要約支援装置。
JP4120652A 1992-05-13 1992-05-13 文章要約支援装置 Pending JPH05314173A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4120652A JPH05314173A (ja) 1992-05-13 1992-05-13 文章要約支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4120652A JPH05314173A (ja) 1992-05-13 1992-05-13 文章要約支援装置

Publications (1)

Publication Number Publication Date
JPH05314173A true JPH05314173A (ja) 1993-11-26

Family

ID=14791536

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4120652A Pending JPH05314173A (ja) 1992-05-13 1992-05-13 文章要約支援装置

Country Status (1)

Country Link
JP (1) JPH05314173A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0293866A (ja) * 1988-09-30 1990-04-04 Toshiba Corp 要約生成方法および要約生成装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0293866A (ja) * 1988-09-30 1990-04-04 Toshiba Corp 要約生成方法および要約生成装置

Similar Documents

Publication Publication Date Title
JP2783558B2 (ja) 要約生成方法および要約生成装置
JP3691844B2 (ja) 文書処理方法
JP3220560B2 (ja) 機械翻訳装置
JPH09190449A (ja) 索引自動生成方法とその利用方法
JPH0981566A (ja) 翻訳装置及び翻訳方法
JPH05158401A (ja) 文書速読支援表示方式並びに文書処理装置及び文書検索装置
JP2848729B2 (ja) 翻訳方法および翻訳装置
JPH0442704B2 (ja)
JPH08212216A (ja) 自然言語処理装置および自然言語処理方法
JPH05314173A (ja) 文章要約支援装置
JPH0883280A (ja) 文書処理装置
JP2003006191A (ja) 外国語文書作成支援装置及び外国語文書作成支援方法並びにプログラム記録媒体
JP2000250913A (ja) 実例型自然言語翻訳方法、対訳用例集作成方法および装置とそのプログラムを記録した記録媒体
JPH08329059A (ja) 汎用参照装置
JP2893239B2 (ja) 翻訳支援辞書検索表示システム
JPH08297675A (ja) 翻訳支援装置
JPS62203268A (ja) 機械翻訳システム
JP2928246B2 (ja) 翻訳支援装置
JP2894064B2 (ja) 機械翻訳装置
JPS62203274A (ja) 機械翻訳システム
JPS5995672A (ja) 翻訳編集方式
JPS59200329A (ja) 辞書登録装置
JP3147947B2 (ja) 機械翻訳装置
JPH06266753A (ja) 文書作成装置
JPH0612453A (ja) 未知語抽出登録装置