JPH0612447A - 要約文章作成装置 - Google Patents

要約文章作成装置

Info

Publication number
JPH0612447A
JPH0612447A JP5056172A JP5617293A JPH0612447A JP H0612447 A JPH0612447 A JP H0612447A JP 5056172 A JP5056172 A JP 5056172A JP 5617293 A JP5617293 A JP 5617293A JP H0612447 A JPH0612447 A JP H0612447A
Authority
JP
Japan
Prior art keywords
sentence
processing
information
result
chapter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5056172A
Other languages
English (en)
Inventor
Kazuo Sumita
一男 住田
Teruhiko Ukita
輝彦 浮田
Tetsuro Chino
哲朗 知野
Kenji Ono
顕司 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5056172A priority Critical patent/JPH0612447A/ja
Publication of JPH0612447A publication Critical patent/JPH0612447A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 目的とする要約文書を作成することのできる
要約文章作成装置を提供すること。 【構成】 複数の章や節から構成される自然言語文書を
入力として、要約文書を作成する。まず始めに、原文の
章立てを書誌事項解析部において解析し、その結果を文
書構造記憶部に格納する。次に要約処理制御部が、各章
・節ごとに要約処理を行うか否かを要約制御規則に基づ
いて判定し、要約処理を起動する。その結果を要約結果
記憶部に格納し、出力部に出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、自然言語文章の要約文
を生成する要約文章作成装置に関する。
【0002】
【従来の技術】近年、ワードプロセッサなどのOA機器
の普及や、やネットワーク通信などの情報処理技術の進
歩に伴い、ユーザが大量のテキスト情報を利用できるよ
うになってきている。このような状況の下、各ユーザ
が、必要とする情報に迅速かつ適切にアクセスすること
を支援するため自然言語文章の自動要約への要求が高ま
ってきている。
【0003】このような自然言語文章の要約文書の自動
作成への要求に対し、従来、文章中でのキーワードの出
現やその頻度をもとに、キーセンテンスと呼ばれる文を
抜き出す手法などが考えられてきていた。しかし、キー
センテンスを抜き出す従来の方法では、文章としてのま
とまりを持った出力を得ることが不可能である。そのた
め、自然言語文章から要約文章を自動生成することはで
きないという問題があった。
【0004】この問題に対し、文章の「文脈構造」を利
用した手法が提案されている。この手法では、自然言語
文章に対して、その接続表現や文末表現などに関する解
析をほどこすことによって、各文の間の修辞的な依存関
係を「文脈構造」として抽出し、この文脈構造に基づい
て要約文章を生成するものである。ここで言う、修辞的
な依存関係(文脈構造)の抽出とは、たとえば、「Aで
ある。また、Bである。よって、Cである。」という3
つの文からなる原文章に対して、「((第一文)[並
列](第二文))[順接](第三文)」といった構造を
取り出すことである。これは、第一文「Aである。 」
と第二文「 また、Bである。」が並列関係を持ってお
り、この2つの文が根拠となって第三文「よって、Cで
ある。」を導いていることを表している。つまり、この
ようにして得られた文脈構造に基づいて、各文の取捨選
択を行ない、要約文章を作成するものである。
【0005】このような従来の要約文章作成装置にあっ
ては、原文章の書誌的な事項に関わらず、文章本体に対
して要約処理を施している。このため、原文書中におい
て、「あらまし」や「概要」というようなタイトルを付
されている要約部分などの要約処理を必要としない部分
に対しても、要約処理を行ってしまうという不都合があ
った。すなわち、「あらまし」のような部分は、要約処
理を施すと重要な部分が抜け落ちてしまい、不適当な要
約文章となってしまうという結果となる。更に、要約出
力する文書のある与えられたスペースへまとめる方法が
知られていないため、ある与えられた文字数や頁数にま
とめることができなかった。
【0006】
【発明が解決しようとする課題】本発明はこのような事
情を考慮してなされたもので、原文書の書誌的事項を解
析することにより、要約処理を施す部分を的確に判定す
る。これにより、目的とする要約文書を作成することの
できる要約文章作成装置を提供することを目的とする。
さらに本発明は,文書の見透しの悪さを改善し,文書の
構成内容を一目瞭然に提示する文書要約の提供を目的と
する.
【0007】
【課題を解決するための手段】本発明では、自然言語文
章を解析し、章立てなどの書誌的事項を解析する書誌的
事項解析手段を持つ。また、この解析結果に結果に基づ
いて、要約処理を施すか否かを判定し、その判定結果に
基づいて要約処理手段を起動する要約処理制御手段を持
つ。さらに、実際の要約処理を行う要約処理手段を持つ
ものである。
【0008】書誌的事項解析手段では、自然言語文章に
おいて各章や節に付与されているタイトルなどを解析す
ることにより、要約、謝辞、参考文献、付録などを含む
章立てを認識する。
【0009】要約処理制御手段は、書誌的事項解析手段
が解析した結果に基づいて、要約処理を施すか否かを判
定し、要約が必要な部分については要約処理手段を起動
する。また、要約処理を必要としない部分についても、
要約結果に出力すべきか、あるいはその部分を捨て去る
べきかを判定する。あるいは所与の文字数以下にに要約
結果を縮退させる。そして、要約処理手段から得られた
結果、ならびに要約結果に出力すべき原文書の原文部分
をマージし、原文書の見出しや本文のフォント情報を保
持した形式で出力することにより所望の要約結果を得る
ことができる。
【0010】
【作用】本発明によれば、原文書の書誌的事項を解析す
ることで、要約処理の必要な部分についてのみ必要な量
への要約処理が行われ、効果的な要約結果を作成するこ
とが可能となる。
【0011】
【実施例】以下、図面を参照して本発明の一実施例に関
わる要約文章作成装置につき説明する。図1は、実施例
を構成する上で必要となる機器の構成を示す構成図であ
る。CPU1、半導体メモリや磁気ディスク、光ディス
クなどの記憶手段2、CRTディスプレイや液晶ディス
プレイ、プラズマディスプレイなどのディスプレイまた
はプリンタなどの表示手段4、表示を制御する表示コン
トローラ3からなる。
【0012】図2は、実施例における機能構成を示した
ブロック図である。入力部1、書誌事項解析部2、要約
処理制御部3、要約処理部4、出力部5、文書構造記憶
部6、要約結果記憶部7、要約制御規則記憶部8から構
成される。さらに、要約処理部4は、単文解析部41、
接続関係抽出記憶部42、文情報記憶部43、文脈構造
解析部44、文脈情報記憶部45、文抽出可否決定部4
6、文抽出情報記憶部47、要約文章生成部48、暗黙
接続表現記憶部49からなる。
【0013】図2において、入力部1から、要約処理対
象である複数の章や節からなる自然言語文書データが入
力されると、 書誌事項解析部2は、章立てなどの解析
を行う。文書データは、記憶手段2にあらかじめ格納さ
れているデータ、またはOCRやキーボードから入力さ
れたデータである。
【0014】図3乃至図5に書誌事項解析部2の処理の
流れを示す。書誌事項は、書誌事項検出パタンに基づい
て解析を行う。検出パタンの一例を図6に示す。パタン
は、レベル0として文書の章タイトルを検出するパタ
ン、レベル1として章を構成する節タイトルを検出する
パタン、さらには、より下位のレベルの節のタイトルを
検出するパタンをあらかじ設定しておく。
【0015】図6において、記号“^”は行の先頭、
“$number ”は数字、“$string ”は任意の文字列、
“\n”は改行、それぞれ照合することを意味している。
例えば、レベル0の検出パタン“^[$number ] $stri
ng\n”は、行の先頭に“[1]はじめに”という文字列
の行が存在した場合、その行と照合が成功することにな
る。また、解析した結果は、例えば図7に示す形式の文
書構造記憶部6に格納する。
【0016】書誌事項解析部2では、まず始めに、文書
が格納されているバッファの先頭アドレスへのポインタ
をP、文字数をN、タイトルの検出レベルを0として処
理を始める。章カウンタを0と設定するとともに、Pな
らびにNをそれぞれ、文書構造記憶部のタイトルポイン
タおよび文字数に格納する。
【0017】検出パタンと照合する文字列が存在する位
置を探す。最初に、検出パタンと照合した文字列の先頭
アドレスを本文ポインタとして本文ポインタ(章カウン
タ+1)に格納する。そして、章カウンタの値を1だけ
増やす。順次、この処理を繰り返すことにより、本文ポ
インタ1、本文ポインタ2、本文ポインタ3へ、それぞ
れ章の先頭アドレスを格納していく。文書が格納されて
いるバッファ文字数Nに対して処理が終了すると、文書
構造記憶部に章の数が章カウンタ、それぞれの章への先
頭アドレスが、本文ポインタ1から本文ポインタnへ格
納されている。本文ポインタ1の指す最初の章から、処
理を行う。本文ポインタTの値をタイトルポインタTに
格納する。さらに、本文ポインタT+1との差から文字
数を求め、文字数Tに格納する。その後、タイトルポイ
ンタTのアドレスを本文ポインタTに格納する。章カウ
ンタTの値は0と設定する。
【0018】レベル1の検出パタンに照合する文字列が
存在する位置を探す。検出パタンと照合する文字列の先
頭アドレスを本文ポインタ(T,章カウンタ+1)に格
納し、章カウンタTを1増やす。これを繰り返すことに
より、節構造を得る。章Tに対して、章カウンタTの値
が0であった場合は、節が存在しなかったことを意味し
ている。そこでその場合は、章のタイトルの次の文字の
アドレスを本文ポインタ(T,1)に格納する。すべて
の章について以上の処理を行うことにより、章−節構造
を得る。
【0019】図3乃至図5は、節の下位構成まで解析す
る場合の流れを示している。(例えば、“2.3.4”
というような章番号のタイトルを持つレベルまでの解析
処理)書誌事項解析部2で解析した文書構造は、文書構
造記憶部6に格納される。例えば、図8に示すような文
書の場合、書誌事項解析部2において処理を行うと、文
書構造記憶部6には、図9に示すような値がそれぞれ設
定される。
【0020】要約処理制御部3は、文書構造記憶部6に
格納されている文書構造に基づいて、要約処理を施すか
否かを判定するとともに、要約処理部4の結果を文書構
造に基づいてマージし、出力部5に出力する。
【0021】図10乃至図11に、要約処理制御部3の
処理の流れを示す。まず始めに、要約結果記憶部7に文
書構造記憶部6の内容をコピーする。要約結果記憶部7
内の記憶形式を図12に示す。図に示すように要約結果
記憶部7の形式は、文書構造記憶部6の形式と同じであ
り、要約結果記憶部7の各要約ポインタは、文書構造記
憶部6の本文ポインタに対応する。文書構造記憶部6で
は、各本文ポインタは本文中のアドレス、または文書構
造記憶部6内のアドレスが格納されている。要約結果記
憶部7へのコピーに当たっては、文書構造記憶部6内の
アドレスに相当する内容は、要約結果記憶部7の対応す
るアドレスに置き換えてコピーする。
【0022】次に、要約処理制御部3は、章−節−副節
の階層に沿って処理を行う。章−節−副節の各タイトル
に対して、要約処理の可・否・省略を判定する。例え
ば、タイトルが“概要”である場合は、要約処理を省略
し、対応する要約ポインタには対応する本文ポインタ内
の値を格納する。タイトルが“謝辞”などの場合は、要
約は“否”であるとして、対応する要約ポインタには0
を格納する(0は要約結果として出力すべきデータがな
いことを意味する)。それ以外の場合は、要約処理を起
動し、その結果を指すアドレスを対応する要約ポインタ
に格納する。
【0023】タイトルと要約処理の可・否・省略は、要
約制御規則8に格納されている規則に基づいて判定す
る。要約制御規則8には、例えば“概要→省略”、“謝
辞→否”というような対応情報があらかじめ格納されて
いる。
【0024】単文解析部41は、要約処理制御部3から
入力される自然言語文章データの各文を、接続関係抽出
規則記憶部42を参照して解析し、各文の先行する文に
対する接続関係を抽出する。また、文内に分離可能な接
続表現が含まれる場合には、接続表現部分と文内容部分
に分離して、文情報記憶部43に記憶するようにしてい
る。文内に分離可能な接続表現が含まれない場合にはそ
の文の全体を、文内容部分に文情報記憶部43に記録す
る。
【0025】ここで言う接続関係とは、連続する、文と
文、あるいは連続する文の集まりの間の修辞的な依存関
係を表しており、図13に、接続関係の例が列挙されて
いる。図13において、記号”[”と記号”]”で囲ま
れているのが接続関係名である。また、各接続関係名に
続いて示されているのが、典型的な文章例であり、ここ
で記号”<”と記号”>”で囲まれいるのが、各接続関
係の手がかりとなる接続表現である。つまり、例えば、
「天気が良い。したがって、外出できる。」という文章
例では、「したがって、」という接続表現を手がかりと
して、第一文と第二文との間の修辞的な接続関係が[順
接]であることがわかり、これによって第一文の内容が
第二文の内容の根拠となっていることがわかることにな
る。
【0026】接続関係抽出規則記憶部42は、図14に
示すように、単文解析部41で利用する各種情報が、A
表層接続表現情報、B接続表現位置情報、C接続関係情
報、D分離可否情報などというように分類登録されてい
る。なお、Eは格納アドレス情報である。
【0027】ここで、接続関係抽出規則記憶部42の各
エントリの、A表層接続表現情報には、図15に示すよ
うに自然言語文章の各文から接続関係を抽出する手がか
りとなる接続詞などの表層表現のパターンが記録されて
いる。また、B接続表現位置情報には、各文においてA
表層接続表現情報が現れる位置に関する制約が記録され
ている。C接続関係情報には、そのエントリのB接続表
現位置情報の制約を満たしながらA表層接続表現情報が
マッチした文の解析結果として与えられるべき接続関係
が記録されている。また、D分離可否情報には、そのエ
ントリのマッチした文から、A表層接続表現情報と一致
する部分をその文の接続表現部分として分離することが
可能であるかどうかの情報が記録されている。
【0028】文情報記憶部43は、単文解析部41によ
って、解析した各文の情報が、図16に示すように、A
文番号情報、B接続関係情報、C接続表現部分情報、D
文内容情報などが、分類記録されるようにしてある。な
お、Eは格納アドレス情報である。
【0029】文情報記録部43の各エントリにおいて、
A文番号情報には、各文の原自然言語文章での順番を表
す文番号が記録され、B接続関係情報には、抽出された
接続関係名が記録される。なお、明示的な接続関係が抽
出できなかった場合には[ε]が記録される。また、C
接続表現部分情報には、単文解析部41において接続表
現部分と文内容部分が分離出来た文については、分離さ
れた接続表現部分が記録され、分離出来なかった場合に
は”空”を表す記号「−」が記録されるようにしてい
る。また、D文内容部分情報には、文解析部2において
接続表現部分と文内容部分がが分離出来た文について
は、分離された文内容部分が記録され、分離出来なかっ
た場合にはその文の全体の内容が記録されるようにして
いる。なお文章の最初の文(第一文)に関しては、無条
件に接続表現が抽出できなかったものとみなし、C接続
表現部分情報には記号「−」が記録され、D文内容部分
情報には、文の全体がに記録されるようにしている。
【0030】文脈構造解析部44は、入力部1から文情
報記憶部43の内容を参照し, 特願平2−203865
号に示したように文脈構造解析と同様の処理を行なうこ
とによって、各文間の修辞的な依存関係を木構造で表現
した図17に示すような文脈構造を生成し、文脈情報記
憶部へと記録するようにしている。
【0031】図18に、自然言語文章例(図15に図
示)の文脈構造解析結果の例を示す。図17(a)に示
した文脈構造は、各文の修辞的な依存関係を表してお
り、以下に述べるような情報を表現している。まず、文
脈構造の木構造において、葉(s1〜s6)は各文を表
している。さらに、文1と文2の間の接続関係が[例
示]であり、文2の内容が文1の内容の例であることを
示している。また、文3と文4の間の関係もまた[例
示]となっており、文4も文3の例であることを示して
いる。さらに、文5と文6の間の関係は[順接]であ
り、文6の内容がが文5から導かれる帰結であることを
示している。以上のような接続関係によって結びつけら
れた文の集まりを、ノードと呼ぶことにする。また、接
続関係を持つノードあるいは文の組もまた再帰的にノー
ドを構成する。そして、この文脈構造では、文と文の関
係のみではなく、文や、ノードの間の接続関係も表現さ
れており、これが再帰的に表現されている。例えば、文
1と文2からなるノード(n3)と、文3と文4からな
るノード(n4)の間の接続関係が、[並列]であるこ
とや、この文1〜文4からなるノード(n1)と、文5
と文6からなるノード(n2)の間の接続関係が逆接で
あり、これがルートノード(n0)を構成していること
も表現されている。また、図17(b)は、括弧を利用
して図17(a)の文脈構造と同じを表現したものであ
る。
【0032】文脈情報記憶部45は、文脈構造解析部4
4によって自然言語文章を解析した結果を、図18に示
すように、Aノードタイプ情報、B文番号情報、C左部
分木格納アドレス情報、D右部分木格納アドレス情報、
などが分類記憶されるようにしている。なお、Eは格納
アドレス情報である。
【0033】図18に示した文脈情報記憶部45の内容
例は、図17に示した文脈構造の例を表したものであ
り、分類記録された各情報のうち、ノードタイプ情報A
には、ルートノード(n0)に対応するエントリに関し
ては「ルート」が格納さる。同様に、中間ノード(n1
〜n4)に対応するエントリに関しては「中間」が格納
され、文を表す(s1〜s6)に対応するエントリに関
しては「文」の値が格納されるようにしている。文番号
情報Bには、ルートノードや中間ノードに対応するエン
トリに関しては、ドント・ケアを表す記号「−」が格納
され、文に対応するエントリに関しては対応する文の文
番号を格納するようにしている。左部分木アドレス情報
Cには、ルートノードか中間ノードに対応するエントリ
に関してはそのエントリの表すノードの左部分木に対応
するエントリの格納アドレスが格納され、文に対応する
エントリに関してはドント・ケアを表す記号「−」が格
納されるようにしている。つまり、以上のように構成し
た情報記憶部に、文脈構造解析部44によって抽出され
た自然言語文章の文脈構造を記録することによって、文
脈構造を表現することができるようにしている。
【0034】文抽出可否決定部46は、文脈情報記憶部
45の内容を参照し、特願平2−203865号に示し
たように文脈構造解析と同様の処理を行なうことによっ
て、各文の要約文章への採用の可否を決定し、その結果
を文抽出情報記憶部47に記録する。
【0035】文抽出情報記憶部47は、図19に示すよ
うに、A文番号情報、B文抽出情報などが分類記録され
るようにしている。なお、Cは格納アドレス情報であ
る。文抽出情報記憶部8の各エントリの、A文番号情報
には、文番号が記録される。そして、文抽出情報には、
文抽出可否決定部46によって要約文章への抽出が決定
された文はついては「抽出」が、要約文章への抽出しな
いことが決定された文については「非抽出」が記録され
る。
【0036】要約文章生成部48は、文情報記憶部4
3、文脈情報記憶部45、文抽出情報記憶部47、およ
び、暗黙接続表現記憶部49を参照して、後述の手続き
に基づいて要約文章を生成する。
【0037】暗黙接続表現記憶部49は、図20に示す
ように、A接続関係名情報、B暗黙接続表現情報などが
分類記録されている。なお、Cは格納アドレス情報であ
る。暗黙接続表現記憶部49の各エントリにおいて、A
接続関係名情報には、接続関係が記録されており、B暗
黙接続表現には、そのエントリのA接続関係名に記録さ
れている接続関係を要約文章で表現する場合に利用でき
る典型的な表層接続表現が記録されている。
【0038】出力部5は、要約結果記憶部7の結果を出
力表示する。なお、要約文章生成部48では、図17
(a)に示したような文脈構造にそって、以下のような
再帰的なアルゴリズムによって要約文章が生成される。
【0039】要約文章生成のアルゴリズム 文脈構造のルートノードに対して処理Aを行なう。 ・処理Aのアルゴリズム A1 処理中のノードXが文脈構造のノードタイプを
調べ、ノードXがルートノードか、中間ノードである場
合は、A2〜A5の処理を行ない、ノードXが葉ノード
である場は、A6〜A7の処理を行なう。
【0040】A2 ノードXの左部分木Lについて再
帰的に処理Aを行なう。 A3 さらに、ノードXについて、接続表現に関する
処理Bを行なう。 A4 さらに、ノードXの右部分木Rについて再帰的
に処理Aを行う。
【0041】A5 ノードXに関する処理Aを終了す
る。 A6 ノードXに対応する文Sの文抽出情報が「抽
出」である場合は、文Sの文内容部分情報を要約処理制
御部へ出力する。
【0042】A7 ノードXに関する処理Aを終了す
る。 ・処理Bのアルゴリズム B1 処理中のノードYの左部分木Lに、要約文章に
抽出すべき文が含まれているかどうかを、左部分木Lに
対する処理Cによって調べる。
【0043】B2a B1の処理の結果、「抽出」さ
れるべき文に対応する葉ノードが発見できなかった場合
は、このノードYに関する処理Bは終了。 B2b そうでなく、左部分木Lに、少なくとも1つ
以上の抽出すべき文が含まれる場合は、処理中のノード
Yの右部分木Rに、要約文章に抽出すべき文が含まれて
いるかどうかを、右部分木Rに対する処理Cによって調
べる。
【0044】B3a B2.の処理の結果、「抽出」
されるべき文に対応する葉ノードが発見できなかった場
合は、このノードYに関する処理Bは終了。 B3b そうでなく、左部分木Lと右部分木Rのどち
らにも、少なくとも1つ以上の抽出すべき文が含まれる
場合、処理Dの手続きによって、処理中のノードYの接
続関係の元となった文に対応する文情報記憶部43のエ
ントリEを探す。
【0045】B4a 処理Dの結果得られた情報記録
部43のエントリEの接続表現部分情報を調べ、その内
容が記号「−」でない場合、接続表現部分情報をの内容
を、出力部11へ出力し、ノードYに対する処理Bを終
了する。
【0046】B4b 処理Dの結果得られた情報記録
部43のエントリEの接続表現部分情報を調べ、その内
容が記号「−」である場合、このエントリEの接続関係
情報に登録されている接続関係Fを含む、暗黙接続表現
記憶部10のエントリGを検索し、そのエントリGの暗
黙接続表現情報の内容を要約処理制御部3へ出力し、ノ
ードYに対する処理Bを終了する。 ・処理Cのアルゴリズム C1 部分木Pが、文脈構造の木構造の葉ノードで
あり、そのPに対応する文Sが、要約文章への抽出すべ
き文である場合は、「部分木Pに抽出すべき文が存在す
る」としてし、部分木Pに対する処理Cを終了する。
【0047】C2 部分木Pが、文脈構造の木構造
の葉ノードであり、そのPに対応する文Sが、要約文章
への抽出すべきでない非抽出の文である場合は、「部分
木Pに抽出すべき文が存在しない」として、部分木Pに
対する処理Cを終了する。
【0048】C3 部分木Pが、文脈構造の木構造
のルートノードか中間ノードであり、そのノードPの左
部分木Lと、右部分木Rに対して、再帰的に処理Cを施
す。 C4a C3の処理の結果「左部分木Lに抽出すべき
文が存在する」ことか、「右部分木Rに抽出すべき文が
存在することが判明した場合には、「部分木Pに抽出す
べき文が存在する」として部分木Pに対する処理Cを終
了する。
【0049】C4b C3の処理の結果、「左部分木
Lに抽出すべき文が存在しない」こと、「右部分木Rに
抽出すべき文が存在しない」ことが判明した「場合に
は、「部分木Pに抽出すべき文が存在しないとして部分
木Pに対する処理Cを終了する。 ・処理Dのアルゴリズム D1a 処理しているノードZの右部文木Rが、文脈
構造部の葉ノードである場合は、この葉ノードRに対応
する文情報記憶部43のエントリEを処理Bに返し、ノ
ードZに対する処理Dを終了する。
【0050】D1b そうでない場合、処理している
ノードZの右部分木Rの、左端の葉ノードWを、ノード
Rから左部分木へのリンクのみを進むことによって検索
し、この左端のノードWに対応する文情報記憶部43の
エントリFを処理Bへ返し、ノードZに対する処理Dを
終了する。
【0051】上述のアルゴリズムは、自然言語文章の文
脈構造の木構造をルートノードから推移しながら再帰的
に要約文章を生成するものである。このアルゴリズムに
よって起動される処理Aは、文脈構造のあるノードに対
する要約文章の再帰的な生成手続きを表している。さら
に、この処理Aから起動される処理Bは、文脈構造のあ
るノードに対応する接続表現の生成手続きを表してい
る。この処理Bから起動される処理Cは、文脈構造のあ
るノードに対応する接続表現を、要約文章に組み入れる
べきかを決定するために、そのノードの左右の部分木に
要約文章へ抽出すべき文が含まれるかどうかを再帰的に
調べる手続きとなっている。また、同様に処理Bから起
動される処理Dは、そのノードの接続関係を与える接続
表現を持つ文を探すための再帰的な手続きとなってい
る。
【0052】以上示したアルゴリズムは、要約文章生成
部48で行なわれる以下の手続きによって実現される。 ・要約文章生成部48の処理手続き (1)文脈情報記憶部45から、Aノードタイプ情報が
「ルート」である。
【0053】エントリXを探す。 (2)見つけられたエントリXについて、処理Aの手続
き行なう。 図2に示した出力部5においては、要約結果を表示手段
に表示出力する。
【0054】以上が本実施例の構成とその機能である。
なお、本実施例で説明した要約処理部は、タイトルなど
を含まない文章に対して要約結果を作成する要約処理機
能を持つものと置き換えることが可能である。例えば、
自然言語文に現れる重要文を指定する特定の表現に基づ
いて重要な文を抽出するような要約処理なども考えられ
る。
【0055】要約処理制御部では、要約の可・否・省略
の判定を要約制御規則に基づいて行っているので、要約
制御規則に格納されている内容を変更することによっ
て、要約処理の指示が変更できる。従って、特定の用途
として“はじめに”の部分の要約のみを必要とする場合
にも、要約制御規則に“はじめに→可”と設定し、“*
→否”(*は任意の文字列を意味する)と設定しておく
ことにより、対処することができる。
【0056】また、実施例の書誌事項解析部では、ワー
ドプロセッサなどで入力された文書のように、タイトル
部分が改行などの記号により他の文章の部分と区別でき
る文書形式を対象としている。しかしながら、例えばL
atexやSGMLなどで扱われる文書のように、章や
節のタイトルや本文部分の位置を、特殊な文字列で指定
する文書形式を持つものがある。このような文書を扱え
るように、章や節のタイトルを指定する文字列により、
書誌事項を解析するように変形することは容易である。
【0057】また、図21に示すように、図表選択判定
部9をさらに追加した構成とすることも可能である。す
なわち、一般の文書では、自然言語だけでは説明が容易
でない場合に図表を用いて説明を行う場合がある。文書
に図表が含まれている場合、その文書に対して要約文書
を作成した場合、要約文書中で参照される図表と参照さ
れない図表の区別が出てくる。そこで図表選択判定部9
では、要約結果の自然言語文を解析し、図表の参照を解
析する(例えば“図1に、…。”というような表現を検
出する)。そして、参照した図表のみを要約結果として
出力部に送ることにより、参照されている図表だけを要
約結果に付加する機能を具現することができる。
【0058】また、図2に示した実施例では、要約結果
をそのまま表示するものであるが、例えば、文書構造記
憶部6、要約結果記憶部7、文抽出情報記憶部47に格
納された情報に基づいて、次のような機能を持つように
変形させることは容易である。すなわち、表示されてい
る画面上の要約文書の位置を利用者がキーボードやマウ
スなどの入力手段で指示することにより、出力されてい
る要約結果から、原文を表示させるように指示すること
ができる。指示された文書中の文字位置から要約文書中
のどの章、または節、または文が指定されたかを検出し
た後、章や節が指定された場合は、対応する文書構造記
憶部6のポインタ情報から原文の文字列を取り出すこと
ができ、それにより原文を表示手段に出力することがで
きる。また、文が指定された場合、文抽出情報記憶部4
7を参照することにより、原文中のどの段落から抽出さ
れた文であるかが求められるので、その情報に基づいて
原文中の対応する段落を表示することができる。
【0059】続いて本発明の他の実施例について説明す
る。本実施例では,図2の書誌事項解析部2において,
すでに説明した章立ての文書構造情報の他にフォントの
情報やレイアウトの情報を書式情報として抽出する。す
なわち,図3乃至図5における書誌事項抽出処理におい
て,処理開始直後において,文書の段組などの文書全体
の書式情報を抽出し,文書構造記憶部6に記憶する。次
に図3乃至図5において,新しい章が見つかる度に章見
出しとその章の本文のフォントやインデント・センタリ
ングの有無などの修飾情報を取り出して同じく文書構造
記憶部6に記憶する。以上のように本実施例における書
誌事項解析部においては,太字・下線などの文字の修飾
情報やフォントの指定情報,さらに段組やセンタリング
などのレイアウト情報を取り出す.このようにして抽出
した書誌事項の例を図22に示す。
【0060】次に本実施例では既に説明した要約処理の
ための文脈構造解析を行い,要約文章を生成する。本実
施例の文抽出可否決定は,既に述べた特願平2−203
865号に示された方式で生成すべき要約の最大文字数
を考えて各文の抽出の可否を決定する。生成すべき各章
要約文章の文字数は,要約処理制御部3において決定す
る。まず文書全体の文字数を文書構造記憶部のデータか
ら算出する。そして出力文書として別途指示される文字
数や頁数から出力する文書における各章の最大文字数を
計算する。もっとも簡単な方法は原文書の各章の文字数
に比例して出力文書の各章の最大文字数を決める方法で
ある。さらに許される最大文字数に限度を設け,ある文
字数以下になるようならその章は省略するようにもでき
る。またまえがきやまとめの部分には他の章と比べて多
くの文字数を割り当てる。すなわち非均一な文字数割り
当ても可能である。このように文字数が割り当てられる
ことにより,文抽出可否決定部46では,選択対象の文
の文字数を章ごとに算出し、許された最大文字数を越え
ないように文の抽出処理を制御する。
【0061】次に本実施例における要約文章生成部48
の処理を説明する。要約文章生成部では,生成すべき文
書のフォントやレイアウトなどを管理し,利用者から指
示される大きさの文書を作成する。利用者から指示され
たレイアウトや原文書のレイアウトに従って要約文書を
作成する。ここで要約文書の形式として本文部分を2段
組で作成することを操作できることはいうまでもない.
このような処理により,例えば図23に示すような文書
を原文書の形式を保存したまま一覧できる要約文書を生
成することが可能になる。
【0062】次に第2の実施例について説明する。本実
施例は、上記実施例中の単文解析部、文脈構造解析部に
関するバリエーションの1つである。列挙表現の扱いを
例に、これらの処理部の動作について説明する。これら
以外の処理部に関しては上記特許願の実施例1と同様で
あるので、特に言及しない。本実施例では文脈構造解析
部は図24のように、セグメンテーション処理部、構造
候補生成・評価部及び構造評価ルール記憶部とから構成
される。
【0063】セグメンテーション処理部100は、セグ
メンテーション処理とは、文書の修辞的な手がかりから
文脈構造に関する情報、−例えばこの文とこの文はまと
まって一つの内容を構成している、とか、この文からこ
の文まではこの例示部分であるとか−を抽出する処理で
あり、本出願人による特願平4−151274号記載の
セグメンテーション処理と同様の処理を行うものであ
る。これら内容的にまとまる(連続した)一連の文をセ
グメントと呼ぶ。セグメンテーション処理部100は、
個々の修辞表現(2文以上にわたることもある)を処理
する個別のルール(“セグメンテーションルール”と呼
ぶ)を記憶するセグメンテーションルール記憶部102
を、これらのセグメンテーションルールを単文解析結果
に対して適応するルールインタプリタであるセグメンテ
ーションルール適用部101とからなっている。
【0064】文情報記憶部43から渡される原文の表層
文字列、形態素列、構文構造のデータはセグメンテーシ
ョン処理部100にわたされ、それら全体に対してセグ
メンテーション記憶部102に記憶されている各セグメ
ンテーションルールが適用される。ルールの適用によっ
て抽出された構造情報は、構造候補生成・評価部103
にわたされ、抽出された情報に反しない範囲で文脈構造
候補が生成される。生成された構造候補はそれぞれ構造
評価ルール記憶部104に記憶された構造評価ルールで
評価され、上位規定個(通常1個)の文脈構造がその文
章の文脈構造として出力される。
【0065】以下列挙表現の扱いを例に、列挙表現を扱
うセグメンテーションルールの例について説明する。典
型的な列挙表現は、以下の5種類である。
【0066】1.(1)(2)(3) ,一二三,(a)(b)(c) 等の
記号による呈示 2.‘・’等、単一記号の連用によるマーキング 3.“…。第一に…。第二に…。第三に…。” 4.“…。まず…。次に…。さらに…。…も…。最後に
…。” 5.“…には、A,B,Cがある。Aは…。Bは…。” (A,B,Cは名詞句) 1.〜4.で用いられている修辞的表現を以下シーケン
シング表現と呼ぶことにする。処理上問題となるのは次
の点である。
【0067】a) 1.に関して、章や節の見出しと間
違える。 b) 2.に関して、文中に2ヵ所以上この種の列挙表
現があった場合、混同してしまう。
【0068】c) 4.に関して、“次に…を述べ
る。”といった列挙表現でない表現と区別しないといけ
ない。また“最後に”という表現は、文章全体の結語と
して使われている場合もあるので、区別しなくてはなら
ない。助詞「も」の添加的な文脈機能は文の構文構造に
影響されるので、その判定も必要である。
【0069】e) 5.に関して、列挙表現を示すマー
カが他と違って固定でないので、話題解析結果を利用し
た特別の処理が必要てある。 f) 最後の列挙要素の叙述範囲(スコープ)の決定 g) 各列挙要素のスコープの中の文脈構造に関して:
通常最初の文が独立していて、その説明が以降続く。
【0070】この構造的な特徴を接続系列中に反映しな
ければならない。 h) “…には次の3つがある。第一は…。第二は
…。”のような、列挙文の前に予告的な文がある場合の
文脈構造上の措置。
【0071】i) “図*に…を示す。…。表*に…を
示す。”といった図表の参照表現は、列挙的な場合があ
る。段落の先頭にそういった表現がある場合は以降にそ
の図表の説明が続くが、段落の最後にあった場合はそれ
までの説明の補足であることが多い。このような構造的
な違いを処理しなくてはならない。このことは、“第1
章では…について述べる。…。第2章では…について述
べる。…。”といった前書きの中の表現にもあてはま
る。
【0072】j) 字下げ、改段落されている部分の影
響:これは、最終要素のスコープ決定や、図表の参照表
現のスコープ決定への影響が大きい。
【0073】列挙表現に対する接続関係抽出規則記憶部
(単文解析用辞書)の登録内容の例を図25に示す。図
14に記したものに比べて、形態素列の条件が指定でき
ること、および表層/形態素列の記述に正規表現が使用
できること、などが拡張されている。
【0074】表中の記号‘.*’は正規表現である。正
規表現とは、UNIXでよく用いられる、文字列を指定する
記法の1つである。不定部分を含む文字列を表現するこ
とや、部分的に異なる文字列をまとめて表現すること等
が簡単にできる。
【0075】表の第2フィールドは、登録された表現の
文中の出現場所に関する条件を示す。文頭(BUNTOP) ,
文末(BUNEND),文の先頭の節の末尾(TERMEND) 、などが
指定できる。第3フィールドは形態素列に対する条件で
ある。記述がある場合のみ、チェックされる。
【0076】表中3行目の登録は、“第一に…”,“第
一の…”,第一は…”といった表現にマッチする。もし
このテンプレートが助詞‘に’‘の’‘は’を含まない
ものであると、“…。第一彼は未成年だ。”といった、
「そもそも」という意味の表現と誤マッチしてしまう。
6行目の登録には品詞条件が書かれているので、“まず
いのは、…”といった表現に誤マッチすることがない。
【0077】最後の数登録は、不定部分“.*”を含む
ものである。“最初に話したいことは、…”“最初に問
題になるのは、…”といった表現を検出するためのもの
である。これらは2番目の登録と重複するので接続関係
の判定には不要だが、抄録生成部で文の接続表現部分を
取り除く処理をする際に接続表現の部分を正確に切り出
す必要があり、その為の登録である。文中の同じ箇所に
複数の登録がマッチしたときは長い方を優先するので、
2番目の登録よりも優先される。
【0078】単文解析辞書には“…を述べる。”といっ
た文末表現を捉える登録も存在する。複数の登録が同じ
文に対してマッチした場合、優先順序はマッチした文中
の位置に従って、文頭→文末→文の先頭の節の末尾→そ
の他、となっている。従って、d)のような問題は自動
的に回避される。
【0079】TERMEND 条件を位置条件に持つ登録には、
‘添加’の助詞‘も’などがある。この条件により、
“…。ダイアナ妃も使っているシャネルの香水は、
…。”といった文にはマッチしないが、“…。彼も働い
た。”のような文にはマッチする。
【0080】このような工夫により、c)やd)の問題
に対処している。次に、f)の処理を例として、列挙表
現を処理するセグメンテーションルールについて説明す
る。以下の4ケースに分けて処理される。
【0081】1 )シーケンシング表現を含む文で段落
が終わっている場合: 1−a) 次の文(次の段落の先頭文)に“以上”など
概括的な表現がある場合→スコープはその文まで: 1−b) それ以外→スコープは次の段落の最後まで 2) 1)以外の場合 2−a) “以上”のような概括的な表現を含む文が段
落内にある場合→スコープはその文の前まで。
【0082】2−b) 2−a)以外の場合→スコープ
はその段落の終わりまで。 同様のヒューリスティックにより、b),g)〜j)の
問題を処理している。このように、セグメンテーション
処理では、段落の境界を目印とした文の相対的位置関係
が重要である。これらの指定をしやすいように、ルール
の記述方法は工夫されている。
【0083】a)は、本稿で説明しなかったが、単文解
析部の前処理である書式解析部で処理される。e)は、
話題解析結果を利用したセグメンテーションルールで処
理される。
【0084】次に、セグメンテーションルールの記述形
式について述べる。図26は譲歩表現(“確かに…。・
・・しかし…”)を扱う為のルールの一つである。
【0085】‘IN’の欄はコメント行であり、想定する
典型的な入力パターン(修辞表現例)を記述する。4行
目以降は、縦の欄のそれぞれが、1つの文に対する条件
に対応している。空欄は無条件である。
【0086】‘OUT ’欄には、マッチした場合の出力パ
ターンを記述する。抽出された構造情報を構造制約記号
を用いて表現する。数字は各欄で指定された文と対応し
ている。使用できる構造制約記号は以下の通りである。 (1) ‘[’および‘]’ ‘[’と‘]’で囲まれた部分が1つの部分構造を構成
することを示す。文章の部分的なまとまりを示す制約で
ある。 (2) ‘(’および‘)’ ‘(’は、その箇所から始まる部分構造(話、叙述)が
存在ることを示す。
【0087】‘)’は、その箇所で終わる部分構造が存
在することを示す。 (3) ‘@’ その箇所で終わるような部分構造が存在しないことを示
す。ある事柄の叙述が1文で叙述しきれず、次の文にま
で及んでいるような箇所に挿入する。つまり、後続する
文ないしセグメントが、直前の文、ないしは前接するセ
グメントの内容と直接関係している場合、用いる。
【0088】各文に対する条件としては、図27に示す
ものが記述できる。正規表現は否定条件の記述能力に弱
いので、否定条件を明示的に記述できるフィールドを設
けてある。通常の正条件の記述と組み合わせることによ
って、単一の正規表現で書けないような条件も書くこと
ができる。
【0089】図28,29,30,31に別のセグメン
テーションルールの記述例を示す。図28は上記(1−
a)、図29は上記(1−b)、図30は上記(2−
a)、図31は上記(2−b)に対応するルールであ
る。OUT 欄の構造制約記号は、g)の対処を含んでい
る。これによって、各列挙項目についてはシーケンシン
グ表現を含む先頭文のみが要約文に残るように文抽出可
否決定部はコントロールされる。接続関係“ラスト”
は、“最後に”や、“…は3つある。”という表現から
後ろに現れる“第3に”等、最後の列挙要素であること
を示す接続関係である。
【0090】図32,33に単文解析部およびセグメン
テーションルール適用部のフローチャートを示す。単文
解析部では文章中の各文に対し、辞書登録された表現が
含まれていないか、位置条件と併せてチェックする。形
態素列の指定のある辞書登録については、その条件も調
べる。マッチした登録の接続関係(登録の第1フィール
ド部分)をその文の接続関係と判定する。
【0091】1文中に2つ以上の登録がマッチした場合
は、マッチした箇所に関する優先規則(文頭→文末→タ
ーム末→その他)によって決定する。同じ箇所に複数の
登録がマッチした場合は、長い方を優先する。
【0092】1つもマッチしなかった場合は、接続関係
‘ε’(明示的な接続関係がないことを示す接続関係)
をその文に対して割り当てる。このようにして、各接続
関係を決定する。
【0093】こうして抽出された接続関係を並べて、接
続(関係)系列が生成される。セグメンテーション処理
は、この接続系列に対する構造制約記号の付加という形
で行われる。
【0094】セグメンテーション処理部では、セグメン
テーションルールに組として登録されている修辞表現が
文章中に出現するか調べる。具体的には、以下の手順で
処理を行う。
【0095】1.ルール中の文単位の指定(指定された
接続関係/表層文字列を持つ、指定された位置条件を満
たす文:ルール中の縦割りにされた部分の、各縦の条件
をANDしたもの(sstフィールドを除く)を調べ、
条件に合う文をすべてピックアップする。すべての文単
位の指定に対し、これを行う。
【0096】2.ピックアップされた文の組に対し、文
間の相対位置条件(sst条件)を満たす文の組をすべ
て生成する。ただし、1つの文に対し相対位置条件を満
たす文が2つあった場合は、より近いものを優先する。
【0097】3.手順2で生成した全ての文の組に対し
て、OUT フィールドで指定されたアクション(構造構造
制約信号の付加、接続関係の変更)を行う。 4.以上の手順を、登録された全てのセグメンテーショ
ンルールに対して行う。
【0098】以下、図*の譲歩構文に関するセグメンテ
ーションルールを例に上述の処理を説明する以下のよう
な文章があったとする。「…。確かに…。しかし…。
[改段落]しかし…。むろん…。…。[改段落]しかし
…。」この文章の単文解析結果(接続系列)は以下のよ
うなものである。
【0099】[1 補足 2 逆接 3 逆接 4 補
足 5 ε 6 逆接 7]セグメンテーションルール
の文指定1にマッチする文は、文2,5である。ルール
の文指定2にマッチする文は、文3,4,7である。こ
れらより、手順2に従って、文の組(2,3)および
(5,7)が生成される。
【0100】((2,7),(5,3),(5,4)は
sst条件を満たさないので廃却される。(2,4)は
sst条件を満たすが、(2,3)が優先するので廃却
される。)これらの文の組に対してoutフィールドに
記載されたアクションを行うと、接続系列は以下のよう
になる。 [ 補足([2]逆接 3 逆接 4 補足([5 ε
6]逆接 7]このようにしてセグメンテーション処
理は行われる。
【0101】
【発明の効果】以上説明したように、本発明によれば、
要約処理を施す必要のない部分を書誌的事項を解析する
ことにより判定することができる。これにより、「あら
まし」などのように要約処理を施す必要のない部分は、
原文書のまま要約結果に反映させ、また、「謝辞」や
「付録」などのように要約結果に出力すべきでない部分
については、効果的に捨て去ることができる。さらに、
要約を必要とする本文については要約処理が施されるた
め、それらをマージすることにより、高品質な要約文書
を得ることができる。
【0102】また原文書の構造情報・フォント情報・レ
イアウト情報を利用することにより,原文書の書類イメ
ージに従った要約文書を作成することができる.例え
ば,原文書のタイトルや章見出しが本文に比べて太く大
きなフォントで書かれていれば,要約文書のタイトル・
証明なども同様のフォントで提示することができる.ま
た原文書の本文が2段組で数頁書かれている際に,同じ
く2段組の1頁にまとめることができ、効果的な結果を
出力でする。
【図面の簡単な説明】
【図1】 機器構成図
【図2】 全体の構成図
【図3】 書誌事項解析部の処理の流れ図
【図4】 書誌事項解析部の処理の流れ図
【図5】 書誌事項解析部の処理の流れ図
【図6】 書誌事項検出パタン例を示す図
【図7】 文書構造記憶部の形式を示す図
【図8】 入力文書例を示す図
【図9】 文書構造記憶部の内容の例を示す図
【図10】 要約処理制御部の処理の流れ図
【図11】 要約処理制御部の処理の流れ図
【図12】 要約結果記憶部の形式を示す図
【図13】 接続関係の例の図
【図14】 接続関係抽出規則記憶部の内容例を示す図
【図15】 自然言語文章の例を示す図
【図16】 文情報記憶部の内容例を示す図
【図17】 文脈構造解析結果の例を示す図
【図18】 文脈情報記憶部の内容の例を示す図
【図19】 文抽出情報記憶部の内容の例を示す図
【図20】 暗黙接続表現記憶部の内容の例を示す図
【図21】 変形例の全体の構成図
【図22】 他の実施例における文書構造データの例を
示す図
【図23】 他の実施例における文書の要約処理の例を
示す図
【図24】 文脈構造解析部の例を示す図
【図25】 接続関係抽出規則記憶部の内容を示す図
【図26】 譲歩表現を扱う為のルールを示す図
【図27】 文に対する条件を示す図
【図28】 セグメンテーションルールを示す図
【図29】 セグメンテーションルールを示す図
【図30】 セグメンテーションルールを示す図
【図31】 セグメンテーションルールを示す図
【図32】 単文解析部のフローチャート
【図33】 セグメンテーションルール適用部のフロー
チャート
───────────────────────────────────────────────────── フロントページの続き (72)発明者 小野 顕司 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】原文章の書誌的事項を抽出し、その抽出結
    果を利用して要約文章を作成することを特徴とする要約
    文章作成装置。
  2. 【請求項2】原文の要約処理を行う要約処理手段と、 前記原文のタイトル情報から章立ての構造を解析する解
    析手段と、 この解析手段により解析した章立ての構造に基づいて各
    章・節ごとに原文の要約処理を行うか、原文のままを要
    約結果とするかを判定するとともに、その判定結果に基
    づいて起動する要約処理の結果を章立ての構造に基づい
    て再構成する要約処理制御手段とを有することを特徴と
    する要約文章作成装置。
  3. 【請求項3】原文の要約処理を行う要約処理手段と、 前記原文のタイトル情報から章立ての構造を解析する解
    析手段と、 この解析手段により解析した章立ての構造に基づいて各
    章・節ごとに原文の要約文字数を決定し、要約処理の結
    果を章立ての構造に基づいて再構成する要約処理制御手
    段とを有することを特徴とする要約文章作成装置。
  4. 【請求項4】原文の要約処理を行う要約処理手段と、 前記原文のタイトル情報から章立ての構造とレイアウト
    やフォント情報を解析する解析手段と、 要約処理の結果を章立ての構造に基づいて再構成する要
    約処理制御手段とを有することを特徴とする要約文章作
    成装置。
JP5056172A 1992-03-31 1993-03-16 要約文章作成装置 Pending JPH0612447A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5056172A JPH0612447A (ja) 1992-03-31 1993-03-16 要約文章作成装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP10394092 1992-03-31
JP4-103940 1992-03-31
JP5056172A JPH0612447A (ja) 1992-03-31 1993-03-16 要約文章作成装置

Publications (1)

Publication Number Publication Date
JPH0612447A true JPH0612447A (ja) 1994-01-21

Family

ID=26397103

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5056172A Pending JPH0612447A (ja) 1992-03-31 1993-03-16 要約文章作成装置

Country Status (1)

Country Link
JP (1) JPH0612447A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0855132A (ja) * 1994-08-16 1996-02-27 Nippon Telegr & Teleph Corp <Ntt> テキスト検索結果提示方法およびテキスト検索装置
JPH0954775A (ja) * 1995-08-14 1997-02-25 Toshiba Corp 翻訳方法及び機械翻訳装置
JPH09218872A (ja) * 1996-02-09 1997-08-19 Sharp Corp 文書処理装置
JPH10187720A (ja) * 1996-12-24 1998-07-21 Tec Corp 文書要約合成装置
JPH10274997A (ja) * 1997-03-31 1998-10-13 Sanyo Electric Co Ltd 文書読み上げ装置
JPH11167398A (ja) * 1997-12-04 1999-06-22 Mitsubishi Electric Corp 音声合成装置
WO1999011621A3 (en) * 1997-09-03 1999-07-01 American Home Prod Thiourea for increasing hdl-cholesterol levels, which are useful as anti-atherosclerotic agents
JP2001275058A (ja) * 2000-01-21 2001-10-05 Jisedai Joho Hoso System Kenkyusho:Kk 映像内容の説明文生成方法、映像内容説明文生成装置、ダイジェスト映像の番組化方法、ダイジェスト映像の番組化装置およびその方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
WO2022009253A1 (ja) * 2020-07-06 2022-01-13 日本電気株式会社 情報処理装置、情報処理方法、及び、記録媒体

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02188870A (ja) * 1989-01-18 1990-07-24 Agency Of Ind Science & Technol 文脈処理装置
JPH0424869A (ja) * 1990-05-21 1992-01-28 Toshiba Corp 文書処理システム
JPH0474259A (ja) * 1990-07-17 1992-03-09 Agency Of Ind Science & Technol 文書要約装置
JPH0490055A (ja) * 1990-08-02 1992-03-24 Agency Of Ind Science & Technol 要約文生成方式

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02188870A (ja) * 1989-01-18 1990-07-24 Agency Of Ind Science & Technol 文脈処理装置
JPH0424869A (ja) * 1990-05-21 1992-01-28 Toshiba Corp 文書処理システム
JPH0474259A (ja) * 1990-07-17 1992-03-09 Agency Of Ind Science & Technol 文書要約装置
JPH0490055A (ja) * 1990-08-02 1992-03-24 Agency Of Ind Science & Technol 要約文生成方式

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0855132A (ja) * 1994-08-16 1996-02-27 Nippon Telegr & Teleph Corp <Ntt> テキスト検索結果提示方法およびテキスト検索装置
JPH0954775A (ja) * 1995-08-14 1997-02-25 Toshiba Corp 翻訳方法及び機械翻訳装置
JPH09218872A (ja) * 1996-02-09 1997-08-19 Sharp Corp 文書処理装置
JPH10187720A (ja) * 1996-12-24 1998-07-21 Tec Corp 文書要約合成装置
JPH10274997A (ja) * 1997-03-31 1998-10-13 Sanyo Electric Co Ltd 文書読み上げ装置
WO1999011621A3 (en) * 1997-09-03 1999-07-01 American Home Prod Thiourea for increasing hdl-cholesterol levels, which are useful as anti-atherosclerotic agents
JPH11167398A (ja) * 1997-12-04 1999-06-22 Mitsubishi Electric Corp 音声合成装置
JP2001275058A (ja) * 2000-01-21 2001-10-05 Jisedai Joho Hoso System Kenkyusho:Kk 映像内容の説明文生成方法、映像内容説明文生成装置、ダイジェスト映像の番組化方法、ダイジェスト映像の番組化装置およびその方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
WO2022009253A1 (ja) * 2020-07-06 2022-01-13 日本電気株式会社 情報処理装置、情報処理方法、及び、記録媒体

Similar Documents

Publication Publication Date Title
EP0645720B1 (en) Dictionary creation supporting system
EP0971294A2 (en) Method and apparatus for automated search and retrieval processing
WO1997004405A9 (en) Method and apparatus for automated search and retrieval processing
JPH1153384A (ja) キーワード抽出装置及びキーワード抽出方法並びにキーワード抽出プログラムを格納したコンピュータ読み取り可能な記録媒体
JP2001101185A (ja) 辞書の自動切り換えが可能な機械翻訳方法および装置並びにそのような機械翻訳方法を実行するためのプログラムを記憶したプログラム記憶媒体
JP2007122403A (ja) 文書タイトルおよび関連情報の自動抽出装置、抽出方法および抽出プログラム
JPH0612447A (ja) 要約文章作成装置
JP3594701B2 (ja) キーセンテンス抽出装置
JPH08147311A (ja) 構造化文書検索方法及び装置
JPH0844771A (ja) 情報検索装置
WO2009113289A1 (ja) 新規事例生成装置、新規事例生成方法及び新規事例生成用プログラム
JP2000250908A (ja) 電子書籍の作成支援装置
JP4301879B2 (ja) 抄録作成支援システム及び特許文献検索システム
JPH0877196A (ja) 文書情報抽出装置
JP3693734B2 (ja) 情報検索装置およびその情報検索方法
JP3698454B2 (ja) 並列句解析装置および学習データ自動作成装置
JPH0561902A (ja) 機械翻訳システム
JP3680489B2 (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2009075748A (ja) 機械翻訳装置及びプログラム
Osenova et al. Learning a token classification from a large corpus.(A case study in abbreviations)
JPH06290209A (ja) 文切り装置
JP2682570B2 (ja) 文書レイアウト方法
JP2005189955A (ja) 文書処理方法、文書処理装置、制御プログラム及び記録媒体
JP2856775B2 (ja) 文書作成装置
JPS6366665A (ja) 文書解析整形装置