JPH10134066A - 文章集約装置 - Google Patents

文章集約装置

Info

Publication number
JPH10134066A
JPH10134066A JP8286991A JP28699196A JPH10134066A JP H10134066 A JPH10134066 A JP H10134066A JP 8286991 A JP8286991 A JP 8286991A JP 28699196 A JP28699196 A JP 28699196A JP H10134066 A JPH10134066 A JP H10134066A
Authority
JP
Japan
Prior art keywords
sentence
sentences
representative
unit
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8286991A
Other languages
English (en)
Inventor
Ryuichi Shiomi
隆一 塩見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP8286991A priority Critical patent/JPH10134066A/ja
Publication of JPH10134066A publication Critical patent/JPH10134066A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 類似した複数の文章から1つの集約した文章
を作成する。 【解決手段】 類似文章抽出部104は、一の文章が指
定されると類似する文章を抽出する。グループ作成部1
06は、抽出された複数の類似した文章中の類似してい
る文を1つのグループに分類する。代表文作成部108
は、グループの文から1つの代表文を作成する。重要度
計算部109は、代表文の重要度を計算する。重要文選
択部111は、重要度の高い代表文を選択し、表示文章
作成部112は、集約された文章を表示させる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、類似した複数の文
章を集約して1つの文章を作成する文章集約装置に関す
る。
【0002】
【従来の技術】近年、テレビ放送やラジオ放送の文字多
重放送が一般化され、大量の文字情報が転送され、容易
にそれらを見たり読んだりすることができる。この文字
多重放送には、文字放送ニュースがあり、この文字放送
ニュースは、複数の新聞社等が作成し、放送局が送信し
ている。したがって、視聴者は、複数の新聞社等の作成
したニュースを得ることができる。
【0003】
【発明が解決しようとする課題】ところが、文字放送ニ
ュースを見ている視聴者は、同一事件や出来事に関して
複数の新聞社等の作成した類似記事を何度も見ることに
なる。同一事件や出来事については、一つの集約された
記事を見れば十分である。しかし、一つの新聞社のニュ
ース以外を削除するようにすると、重要な部分を見落と
すこともある。
【0004】本発明は、このような課題を解決するため
に、視聴者が文字放送ニュースの内容に過不足がなく、
かつ見やすい記事を表示可能とする文章集約装置を提供
することを目的とする。
【0005】
【課題を解決するための手段】上記課題を解決するため
に、本発明は、単語、単文、複文、重文或いはそれらの
文を組み合わせて構成された文章を複数、記憶手段に記
憶し、そのうちの一部の文章若しくは全ての文章を表示
手段にて表示する装置における文章集約装置であって、
前記記憶手段の文章から一の文章を操作により指定する
文章指定操作手段と、指定された文章を第1のルールを
用いて指定された文章に類似した文章を前記記憶手段中
の文章群から抽出する類似文章抽出手段と、指定された
文章及び抽出された文章に含まれる全ての文を第2のル
ールを用いて類似する文同士を一グループにまとめる分
類を行うグループ分類手段と、分類された各グループ中
の所定の文を参照して代表文を作成する代表文作成手段
と、作成された代表文を用いて、指定された文章及びそ
れに類似する文章を一の文章に集約する類似文章集約手
段と、を備えることとしている。これによって、複数の
類似した文章があるとき、文章中の類似している文から
1つの代表文を作成し、この代表文を集合して集約文章
を作成するので、一の集約した文章を読めば、類似した
複数の文章を全部読むのと同等の情報を得ることができ
る。
【0006】
【発明の実施の形態】以下、本発明に係る文章集約装置
の実施の形態について、図面を参照して説明する。 (実施の形態1)図1は、本発明に係る文章集約装置の
実施の形態1の構成図である。
【0007】この文章集約装置は、データ記憶部101
と、表示部102と、入力操作部103と、類似文章抽
出部104と、文章記憶部105と、グループ作成部1
06と、グループ記憶部107と、代表文作成部108
と、重要度計算部109と、文章量指定部110と、重
要文選択部111と表示文章作成部112と、制御部1
13とを備えている。
【0008】データ記憶部101は、磁気ディスクやR
AM等からなり、受信部(図示せず)が受信した文字放
送データを制御部113の制御のもと記憶している。図
2は、このデータ記憶部101に記憶されている文字放
送データ200の一例を示している。この文字放送デー
タ200は複数の文章を含み、1つの文章には1つ以上
の文が含まれている。文字放送データ200中の文章2
01、202、203、204、211、221、23
1、241は、複数の新聞社が作成したニュース情報で
ある。
【0009】ここで文章とは、単語、単文、複文、重文
或いはそれらの文を組み合わせて構成されたものをい
う。表示部102は、ディスプレイからなり、制御部1
13の制御によってデータ記憶部101に記憶されてい
る文字放送データを表示文章作成部112の制御によっ
て集約された文章を表示する。
【0010】入力操作部103は、図3に示すようなキ
ーボード301からなり、視聴者からの操作を受け付
け、その操作内容を制御部113に通知する。キーボー
ド301は、「↑」キー302と「↓」キー303と集
約すべき文章を指定する「実行」キー304とからな
る。今、図2に示す文字放送データ200がデータ記憶
部101に記憶されている場合に、この文章集約装置が
起動されると、制御部113は、データ記憶部101か
ら文字放送データ200を読み出し、図4に示すように
表示部102に表示する。ここでカーソル401は、デ
フォルト状態で最初の文章201の先頭位置に表示され
ている。視聴者が「↓」キー303を押下すると、制御
部113は、その操作内容の通知を入力操作部103か
ら受け、図5に示すようにカーソル401の表示位置を
その下方の2番目の文章202の先頭位置に移動させ
る。更に「↓」キー303が押下されると、表示部10
2に表示されている文章を下方にスクロールさせる。ま
た図5に示す状態で「↑」キー302が押下されると、
図4の状態にカーソルの表示を戻す。
【0011】図5の状態で「実行」キーが押下される
と、制御部113は、カーソル401が表示されている
集約すべき文章202を類似文章抽出部104に通知す
る。類似文章抽出部104は、制御部113から集約す
べき文章202を通知されると、その文章202を図6
に示すように、文章記憶部105に記憶させる。類似文
章抽出部104は、文章記憶部105に記憶された文章
202を形態素解析等を行い単語分割する。図7は、文
章202の単語分割が終了した状態での文章記憶部10
5の記憶内容を示している。ここで、分割した単語の区
切りは「/」で示している。
【0012】次に、類似文章抽出部104は、データ記
憶部101に記憶されている文字放送データ200の最
初の文章201から順に集約すべき指定された文章を除
いて順次1つずつ抽出し、単語分割し、文章202と類
似するか否かを判定し、類似しているときは、文章記憶
部105に記憶させる。文字放送データ200の全ての
文章241まで類似の判定が終わると、制御部113に
処理終了を通知する。
【0013】ここで、文章同士が類似するか否かは、単
語分割した単語の一致数で判断する。なお、このときコ
ロン、句読点、助詞などは比較の対象から除外する。例
えば、図8に示す文章211の「ニュース」、「台風5
号」、「九州」、「上陸」、「九州」の5単語と集約す
べき文章202の単語とが一致する。ここでは、一致し
ている単語数が「3」以上のとき、両文章が類似すると
判定するので、この文章211は文章記憶部105に図
9に示すように記憶させる。
【0014】ここでは、一致している単語数「3」以上
を類似する文章の判定基準としたけれども、取り扱う文
章の性質により適宜変更するようにする。文章記憶部1
05は、磁気ディスクやRAMからなり、指定された文
章に類似する文章を図10に示すように記憶している。
即ち、指定された集約すべき文章202と、文章21
1、221、231、241とは類似する文章である。
【0015】グループ作成部106は、類似文章抽出部
104から類似の判定が終了した旨の通知を受けた制御
部113によって起動される。グループ作成部106
は、文章記憶部105に記憶されている各文章を文に分
割してグループ記憶部107に図11に示すように記憶
させる。この文の分割は、文章中の句点「。」やコロン
「:」の記号を文の終端を表す文字と判断することによ
りする。なお、各文1101〜1119は、類似文章抽
出部104でされた単語分割の情報をそのまま保持して
いる。
【0016】次に、グループ作成部107は、グループ
記憶部107に記憶されている各文同士が類似している
か否かを判定し、類似する文を同一グループに分類す
る。この文の類似の判定は、上述した類似文章抽出部と
同様に比較する両文を構成する単語の一致数で判定す
る。この基準となる単語の一致数は「2」とする。ま
た、ここで対象とする単語からは句読点や記号、助詞等
を除くのは上述の場合と同様であり、類似の判定基準を
「2」以上としたことも、取り扱う文の性質等によって
適宜変更するのも上記と同様である。
【0017】図11に示した具体例で説明すると、グル
ープ作成部106は、グループ記憶部107の記憶内容
の文1101に注目する。文1101と、各文1102
〜1119とを順に一致する単語数を数えて、「2」以
上一致していると類似していると判定して同じグループ
にまとめる。文1101は、2つの単語「A新聞」「ニ
ュース」で構成され、文1105、1108、110
2、1116で、1つの単語「ニュース」が一致するだ
けであり、類似する文はない。文1101は、1文で1
グループを構成することになる。グループ化が終了した
文には、文頭(文の先頭位置)にグループ番号を付与す
る。図12は、文1101にグループ番号「(1)」が
付与された状態を表す。
【0018】次に、グループ作成部106は、グループ
記憶部107よりグループ化が終了していない文110
2に注目する。上記と同様、文1102と、グループ化
が終了していない文1103〜1119とを順に比較
し、類似していると判定されれば、同じグループにまと
める。ここで、文1102と文1106は、3つの単語
「台風5号」「九州」「上陸」が一致するので類似して
いると判定される。同様に、文1109、文1113、
文1117が文1102と類似した文と判定されグルー
プに加えられる。グループに加えられた文の文頭には同
一のグループ番号が付与される。図13は、文110
2、1107、1109、1113、1117の文頭に
グループ番号「(2)」が付与された状態を示す。
【0019】グループ作成部106は、順次グループ化
されていない文に注目し、グループ化を行う。グループ
化が終了していない文がなくなるまでこれを繰り返す。
図14は、すべての文のグループ化が終了したときの、
グループ記憶部107の状態を示し、12のグループが
作成されている。
【0020】ここで、グループ番号を文頭に付与しグル
ープ化されていることを示しているけれども、文がどの
グループに属しているかが判別できれば、どのようにし
てもかまわない。例えば文末にマークを付与する方法
や、文の記憶順をグループの順に並び換え、グループの
間に区切り記号を挿入してもよい。グループ作成部10
6は、グループの作成が終了すると制御部113に処理
終了を通知する。制御部113はそれを受けて代表文作
成部108を起動する。
【0021】グループ記憶部107は、磁気ディスクな
どからなり、グループ作成部106によってグループ化
された文を図14に示すように記憶している。また、後
述する代表文作成部108、重要度計算部109、代表
文選択部110とによって、代表文を示す記号や重要度
等を書き込まれる。代表文作成部108は、制御部11
3に起動されると、グループ記憶部107に記憶されて
いる各グループの文から単語の個数の最大のものを代表
文に決定し、文頭に「*」を記録する。したがって、グ
ループの中に文が1文しかない場合は、そのままその文
が代表文に決定される。
【0022】図15は、代表文の作成が終了したときの
グループ記憶部107の記憶内容を示している。なお、
ここで代表文のマークは、グループ番号同様、この形態
以外でも、代表文が識別できるものであればよい。
「*」以外の記号を用いてもよく、また、文末に記述し
てもよく、また、代表文記憶部を新たに設けて、代表文
だけを記憶してもよい。
【0023】なお、代表文の作成方法は、この方法を含
めて、以下の方法をとることができる。 (A)グループの中の文の共通部分を抽出して文を作成
する。 (B)グループ中の文に含まれる情報すべてを合成して
文を作成する。 (C)グループ中の文を1つ選択し代表文とする方法。
【0024】たとえば、(A)の方法を適用してグルー
プ(2)の代表文を作成すると、グループ(2)の5文
に共通な単語「台風5号」「九州」「上陸」を抽出す
る。このまま接続して文「台風5号九州上陸」としても
よい。また、より自然な文とするため、グループの任意
の1文から3つの単語を含む文節を抽出して文を作成す
ることもできる。文1113「大型の台風5号が九州上
陸。」を任意の1文として選択すると、3つの単語を含
む文節部分のみを残し、文「台風5号が九州上陸。」を
作成することができる。
【0025】また、(B)の方法を適用すると、グルー
プ(2)の5文からすべての文節を抽出する。ただし、
ここで、文節中の自立語が等しいものは削除する。ここ
ではグループ(2)からは、「台風5号が」「九州」
「上陸」「大型の」を抽出する。より自然な文とするた
め、多くの文節を含む文を抽出して、その文節の並びに
基づいて文を作成する。文1113「大型の台風5号が
九州上陸。」が4つの文節を含むので、これをもとに文
「大型の台風5号が九州上陸。」を作成することができ
る。
【0026】更に、(C)の方法を適用しようとする
と、文の選択方法がいくつかあり、最初の1文、ランダ
ムに選択する方法などもあるが、重要な文を選択できれ
ばよりよい代表文を作成できる。重要な文の選択方法に
は、(C1)文に含まれる単語の個数が多い文、あるい
は文字数の多い文、(C2)グループ中の文で共通に現
れる単語が過不足なく含まれ、余分な単語が少ない文、
(C3)文に含まれる単語の個数が少ない文、あるいは
文字数の少ない文、等がある。
【0027】(C1)に示す文の選択方法は、多くの情
報を持つ文を代表文とする方法で上述の(B)に近い。
(C2)に示す文の選択方法は、グループの文の共通部
分を表現し、上述の(A)に近い。(C3)に示す文の
選択方法は、簡潔な文を選択するという意味がある。グ
ループ(2)に対して(C1)の方法を適用すると、単
語数の一番多い文1113が選択される。グループ
(2)に対して(C2)の方法を適用すると、すべての
文に共通する3つの単語「台風5号」、「九州」、「上
陸」を過不足なく含み、余分な単語を持たない文110
2、1106、1109、1117のいずれかが選択さ
れる。グループ(2)に対して(C3)の方法を適用す
ると、文字数の一番少ない文1102、1106、11
09、1117のいずれかが選択される。このように代
表文の作成方法は多種多様に考えられるが、本実施の形
態では、(C1)の方法を採用している。
【0028】ここで、代表文作成方法選択部を設けて、
代表文の作成方法の切り替えができるようにすることも
可能である。代表文作成部108は、代表文の作成が終
了すると制御部113に処理終了を通知する。制御部1
13はその旨の通知を受けると、重要度計算部109を
起動する。
【0029】重要度計算部109は、制御部113に起
動されると、グループ記憶部107に記憶されている作
成された代表文の重要度を計算する。本実施の形態で
は、代表文に対応するグループに含まれる文の数を計数
して代表文の重要度とする。重要度計算部109は、代
表文が属する同一グループの文の数をカウントし、重要
度としてグループ記憶部107の代表文の文頭に書き込
む。図16は、重要度計算部109が重要度の計算結果
をグループ記憶部107に記憶したときのグループ記憶
部107の状態を示す。重要度計算部109は、重要度
の計算が終了すると、制御部113に処理終了を通知す
る。
【0030】なお、ここで重要度は、グループ番号同
様、この代表文の文頭に文の数を書き込むこと以外で
も、重要度が識別できる形態であればよい。文末に記述
してもよく、また、代表文記憶部を新たに設けて、代表
文と重要度を組にして記憶してもよい。本実施の形態で
は、代表文はグループに含まれる文を代表するので、そ
の文の個数で重要度を表すものである。具体的には、
「頻出する文は重要」という概念で、「重要度=文数」
とする方法である。この方法は、以下に述べる(D1)
の方法に比べ、単語重要度を用いないことから少ない計
算量で代表文の重要度を得ることができる。
【0031】なお、重要度の計算は、本実施の形態以外
の以下の方法を用いてもよい。 (D1)あらかじめ単語の重要度を定義しておき、単語
の重要度の和を用いる方法。 (D2)本実施の形態と(D1)との2つの方法を併用
する方法。 (D1)の方法では、あらかじめ単語に対する重要度を
定義した単語重要度辞書を用意する。ただし、すべての
単語に網羅的に重要度を与えるのは辞書が大きくなるこ
と、辞書の作成に多くの工数が必要なことから、重要単
語、非重用単語のみを定義することも可能である。ま
た、データ記憶部101、文章記憶部105、グループ
記憶部107にある単語の出現頻度を用いて単語の重要
度を算出することも可能である。例えば、「頻出する単
語は重要」という概念で、「重要度=出現回数」とする
方法や、逆に、「頻出する単語は重要でない一般語であ
る」という概念で、「重要度=1/出現回数」とする方
法などがある。こうして決定した単語重要度をもとに、
代表文中の単語の重要度の和(あるいは積など)を計算
し、文の重要度とする。
【0032】(D2)の方法では、本実施の形態と(D
1)との2つの重要度の両方を算出し、また、2つの尺
度に優劣を設ける。これにより1つの尺度の重要度が等
しいとき、もうひとつの尺度の重要度で大小比較をする
ことができる。ここで、重要度計算手法指定部を設け、
上記の計算手法を切り替えるようにしてもよい。
【0033】文章量指定部110は、前記入力操作部1
01で指定された集約すべき文章を集約した一の文章の
文章量を予め指定している。図17は、この文章量指定
部110に記憶されている内容を示すものであり、集約
した一の文章の総量が「3」行以内であることを示して
いる。なお、本実施の形態では、この文章量の指定を表
示部102で表示できる行数としたけれども、他の実施
の形態としては、文字数で指定してもよいし、又、予め
指定せずに、視聴者が指定できるようにしてもよい。
【0034】重要文選択部111は、代表文作成部10
8から処理終了の通知を受けた制御部113に起動され
ると、文章量指定部110に記憶されている集約すべき
文章の文章量を読み出す。次に、グループ記憶部107
に記憶されている代表文1101、1103、…等の文
頭に記録されている重要度を読み出し、その重要度の大
きい代表文から順に指定された文章量になるまで重要文
として選択する。選択した重要文の文頭に「+」記号を
書き込む。文章量指定部110で指定された文章量まで
重要文の選択が終了すると、制御部113に処理終了を
通知する。
【0035】なお、文章量指定部110で文字数で文章
量が指定されているときは、重要文選択部111は、選
択した重要文の文字数を計数し、指定された文字数を超
えない範囲で重要文を選択する。具体例で述べると、グ
ループ記憶部107に図16に示すグループ化された文
1101〜1109の「*」で示された代表文1101
等に重要度の数値が記録されている場合に、文章量指定
部110で図17に示すように「3」行と文章量が指定
されているときには、重要文選択部111は、代表文1
113の文頭に記録された重要度の最大値「5」を見つ
け、その文頭に記号「+」を記録して重要文として選択
する。
【0036】次に重要度の値が「3」の代表文1114
を選択する。これで2つの重要文1113、1114即
ち、2行分の重要文が選択されたことになり、まだ指定
された文章量「3」行に満たない。更に、重要度の値が
「2」の代表文1118を選択する。これで指定された
文章量「3」に達するので重要文の選択を終了する。こ
のようにして重要文が選択されると、グループ記憶部1
07の記憶内容は図18に示すようになっている。
【0037】表示文章作成部112は、重要文選択部1
11から重要文の選択終了の通知を受けた制御部113
によって起動されると、グループ記憶部107に記憶さ
れている重要文を読み出して表示部102に表示させ
る。例えば、グループ記憶部107に図18に示す内容
が記憶されているときには、図19に示すように集約し
た文章を表示部102に表示させる。ここでは、グルー
プ記憶部107の重要文1113、1114、1118
の記憶順に表示している。
【0038】また、本実施の形態では、この記憶順と重
要度の順とが一致しているけれども、もし一致していな
いときには表示文章作成部112は、重要度順に重要文
を読み出して、その順番で表示部102に表示させるよ
うにしてもよい。また、グループ記憶部107に文章を
文に分割して記憶させる際に、各文がもとのどの文章に
含まれていたかを明示しておくようにし、新たに基本文
章指定部(図示せず)を設けるようにしてもよい。基本
文章指定部は、視聴者の基本文章を指定する旨の指示を
受け付けると、表示文章作成部112に基本文章を選択
するよう指示する。表示文章作成部112は、グループ
記憶部107に記憶されている文章(図2、又は図10
に示した各文章であり、各文がどの文章に含まれていた
かが明示されている。)で、選択された重要文と同一グ
ループの文を最も多く含む文章を基本文章として選択す
る。
【0039】具体的に図18を参照して説明すると、文
1101〜1104は文章202に、文1105〜11
08は文章211に、文1108〜1111は文章22
1に、文1112〜1115は文章231に、文111
6〜1119は文章241に含まれていたことが明示さ
れている。表示文章作成部112は、重要文1113,
1114,1118と同一グループ(2),(4),
(8)の文を含む文章を見つける。この結果、基本文章
として、文章241が選択される。この基本文章の文の
グループの記憶順に重要文を並び替えて、表示部102
に表示させる。
【0040】即ち、グループ(2)に含まれる重要文
「大型の台風5号が九州上陸。」1113、グループ
(8)に含まれる重要文「鹿児島で河川決壊、5000
戸が浸水。」1118、グループ(4)に含まれる重要
文「明朝には近畿直撃。」1114の順に配列する。こ
のようにすると、表示部102には、図20に示すよう
に集約された文章が表示される。この集約された文章
は、基本文章241に沿って作成されたため、基本文章
241と同様に文が時系列的に並んで、より自然で読み
やすく、理解しやすくなっている。
【0041】また、表示文章作成部112は、読み出し
た重要文を表示部102に表示させるためにビットマッ
プデータに展開する際、その重要文の重要度に応じて重
要文を強調するための文字修飾を施す。例えば、重要文
のうち最も重要度の高いものの表示を反転表示とした
り、一定の重要度以上のものに下線を施す。図21は、
図20で示した集約された文章中の最も重要度の高い重
要文「大型の台風5号が九州上陸。」を反転表示して表
示部102に表示させたものである。これによって視聴
者は、集約された文章中でどの文が特に重要であるかを
一目で知ることができる。
【0042】また、最重要な重要文だけでなく、一定の
重要度(例えば重要度「3」)以上の重要文に修飾を施
してもよい。図22は、修飾として下線を施したもので
あり、この結果、視聴者は、集約された文章のさらにエ
ッセンスを読むことができる。なお、重要文の強調のた
めに本実施の形態では、反転表示や下線表示を施したけ
れども表示部102がカラー表示可能であれば、強調す
べき重要文を他の重要文の表示色と変えるようにしても
よい。勿論、文字修飾が網掛等の他の文字修飾であって
もよい。
【0043】また、本実施の形態の変形例として文章量
指定部110に替えて、不要文辞書部を設けるようにし
てもよい。不要文辞書部は、RAM等からなり、図23
に示すように、集約された文章に含ませる必要のない文
を予め登録している。重要文選択部111は、代表文作
成部108で作成され、グループ記憶部107に記憶さ
れている各代表文が不要文辞書部に登録されている各文
に不一致であれば重要文として選択し、その文頭に
「+」記号を書き込む。図24は、このようにして重要
文が選択されたときのグループ記憶部107の記憶内容
を示している。
【0044】表示文作成部112は、重要文選択部11
1で選択された図25に示す重要文を集約された文章と
して順次読み出し、表示部102の表示領域に制限があ
るときには、図26(a)に示すように最初の3行を先
ず表示し、入力操作部103の「↓」キー303の押下
の通知を受けて、図26(b)に示すように順次重要文
をスクロール表示させるようにする。
【0045】この結果、上記実施の形態では、文章量指
定部110の文章量の指定によっては、文(情報)を削
除しすぎる場合も多いけれども、本変形例では、できる
限り多くの情報を重複しないで集約された文章に含めて
表示することができる。制御部113は、上記したよう
に本装置の全体の動作の制御をする。次に、本実施の形
態の動作を図27、図28に示すフローチャートを用い
て説明する。
【0046】先ず、制御部113は、表示部102にデ
ータ記憶部101に記憶されている文字放送データを表
示させる。(S2702)。入力操作部103におい
て、視聴者によって、「実行」キー304で文章が指定
されると、制御部113は、類似文章抽出部104を起
動する。類似文章抽出部104は、指定された文章を形
態素解析などを行い単語分割する(S2704)。
【0047】次に、類似文章抽出部104は、データ記
憶部101に記憶されている指定された文章以外の文章
を1つ取り出し、単語分割し、指定された文章とこの文
章とを構成する単語の一致数が「3」以上で有るか否か
を判定し(S2706)、以上で有れば、類似している
文章と判断し、文章記憶部105に記憶させる(S27
08)。これをデータ記憶部101に記憶されているす
べての文章に対して行う(ステップS2710)。
【0048】類似文章の抽出が終了したら制御部113
はグループ作成部106を起動する。グループ作成部1
06は、文章記憶部105に記憶されている各文章を文
に分割し、グループ記憶部108に記憶させる(S27
12)。次に、グループ作成部106は、グループ記憶
部107に記憶されているグループ化されていない文に
注目する(S2714)。注目した文と他のグループ化
されていない文とを構成する単語の一致数が「2」以上
有るかを判定し(S2716)、一致した単語数が
「2」以上であれば、同じグループにまとめる(S27
18)。これを注目した文と比較されていない文がなく
なるまで繰り返す(S2720)。更に、グループ化さ
れていない文がなくなるまで繰り返す(S2722)。
グループの作成が終了すると、制御部113は、代表文
作成部108を起動する。代表文作成部108は、各グ
ループの文から最長の文を選択して代表文とする(S2
802)。
【0049】代表文の作成が終了すると制御部113
は、重要度計算部109を起動する。重要度計算部10
9は、代表文が属するグループの文の数を重要度とする
(S2804)。重要度の計算が終了すると制御部11
3は重要文選択部111を起動する。重要文選択部11
1は、グループ記憶部107を参照し、まだ選択されて
いない代表文から重要度の最も高い文に注目する(S2
806)。次に、既に重要文として選択した代表文と注
目している代表文の総文章量(行数)を計算し(S28
08)、文章量指定部110で指定された文章量の範囲
内であるか否かを判定する(S2810)。範囲内であ
るときは、注目している代表文を重要文として選択する
(S2812)。これを総文章量が文章量指定部111
で指定された文章量に納まる間は繰り返す。
【0050】指定された文章量の範囲を超えると、制御
部113は表示文章作成部112を起動する。表示文章
作成部112は、グループ記憶部107を参照し選択さ
れた重要文を順次、表示部102に表示させ(S281
4)、処理を終了する。なお、本実施の形態では、デー
タ記憶部101は受信部の受信した文字放送データを記
憶しているものとしたけれども、文字データがフロッピ
ーディスクや光磁気ディスク等に記憶され、これを読み
出すドライブで構成されていてもよい。
【0051】(実施の形態2)図29は、本発明に係る
文章集約装置の実施の形態2の構成図である。この文章
集約装置は、データ記憶部101と、表示部102と、
入力操作部103と、類似文章抽出部104と、文章記
憶部105と、事象抽出部2901と、グループ作成部
2902と、グループ記憶部107と、代表文作成部2
903と、重要度計算部109と、文章量指定部110
と、重要文選択部111と、表示文章作成部112と、
制御部2904とを備えている。
【0052】なお、上記実施の形態1と同様の構成を有
する各部分については同一の番号を付してその説明を省
略する。事象抽出部2901は、類似文章抽出部104
の類似文章の抽出が終了した旨の通知を受けた制御部2
904によって起動されると、文章記憶部105に記憶
されている各文章をコロンや句点に着目して文に分割
し、自身のメモリに記憶する。また、事象抽出部290
1は、形態素辞書(図示せず)等を内蔵し、記憶してい
る各文の構文解析をして、事象を抽出し、グループ記憶
部107に記憶させる。記憶している各文から事象の抽
出がすべて終了すると制御部2904に事象の抽出が終
了したことを通知する。
【0053】ここで、事象とは、「いつ、どこで、だれ
が、何を、どうした」という事柄を表現したものであ
る。例えば、文「台風5号が九州上陸」からは、事象
「いつ=NULL、どこで=九州、だれが=台風5号、
何を=NULL、どうした=上陸」が抽出される。「N
ULL」は何もないことを示している。この事象の抽出
は、公知の方法である格文法を用いた構文解析を行う。
この詳細については、「bit別冊機械翻訳、p78〜
80、共立出版、1988.9」等に記載されている。
その概略を簡単に説明すると、文中の動詞に着目し、そ
の動詞に対して、その動作を行う主格(事象の「だれ
が」に相当)、動作の対象となる対象格(事象の「何
を」に相当)、その動作を行う時間を表す時格(事象の
「いつ」に相当)、動作が行われた場所を表す場所格
(事象の「どこで」に相当)などを、単語の意味や文節
中の助詞を用いて抽出する。上記した文「台風5号が九
州上陸」の事象の抽出では、動作を表す「上陸」に対し
て、助詞「が」を持つ文節の単語「台風5号」が主格と
して抽出される。また「九州」は形態素辞書を参照して
「地名」であることから場所格として抽出される。1文
中で複数の動詞がある場合は、文中の動詞と格候補の位
置などを用いて、動詞と格の関係を決定する。ここでの
事象は格文法の動作を表す単語と、その格要素の組であ
ると考えることができる。
【0054】なお、格文法の格には、主格、対象格、場
所格、時格以外にも多数の格があり、これらを事象に含
めることも可能である。今、データ記憶部101に図3
0に示すような文字放送データ3000を記憶していた
場合に、文章3002が視聴者によって入力操作部10
3で指定されたとき、文章記憶部105には、図31に
示す文章3002に類似する文章3011,3021,
3031,3041が類似文章抽出部104によって抽
出されて記憶されている。
【0055】事象抽出部2901のメモリには、図32
に示すように各文章3002等を分割した文3201〜
3216が記憶されており、更に格文法を用いた構文解
析の結果、グループ記憶部107には、図33に示すよ
うな抽出された事象3301〜3321が記憶されてい
る。各事象3301〜3321は、「いつ」3331、
「どこで」3332、「だれが」3333、「何を」3
334、「どうした」3335の各欄に分けて記載され
ている。ここで空欄は、上記した「NULL」を示して
いる。
【0056】グループ作成部2902は、事象抽出部2
901から終了通知を受けた制御部2904によって起
動されると、グループ記憶部107に記憶されている各
事象について類似する事象を1つのグループに分類す
る。ここで事象が類似するか否かの判定は、比較する両
事象の各要素の一致する個数で判定する。ここでは、
「2」以上の要素が同一であれば両事象は類似する事象
であるとする。各事象について、グループ化が全て終了
すると、制御部2904にグループ化が終了した旨の通
知をする。
【0057】具体例に基づいて説明すると、グループ記
憶部107に図33に示す各事象3301〜3321が
記憶されている場合には、グループ作成部2902は、
先ず、事象3301に注目し、事象3302〜3321
が同一グループに分類されるか否かを判定する。しか
し、事象3301の要素「だれが=A新聞ニュース」は
1つしかないので、事象3302〜3321の要素と
「2」以上の要素が一致することはないので、一致する
事象はない。したがって、事象3301は、単独で1グ
ループに分類され、図34に示すようにグループ番号欄
3401に「1」が書き込まれる。
【0058】次に、グループ作成部2902は、グルー
プ記憶部107に記憶されているグループに分類されて
いない事象3302に注目する。事象3302の要素
「どこで=九州」、「だれが=台風5号」、「どうした
=上陸」と一致する要素の数が「2」以上の事象を事象
3303以下を順次比較して見つけると、事象330
7,3310,3315,3318が類似する事象に分
類できる。そこで、図35に示すように、グループ番号
欄3401にグループ番号「2」を書き込む。
【0059】更に、グループ作成部2902は、グルー
プ記憶部108に記憶されている事象のグループ化され
ていない事象に順次注目し、グループ化をする。図36
は、すべての事象についてグループ化が終了したときの
グループ記憶部108の記憶内容を示している。代表文
作成部2903はグループ作成部2902のグループ化
の終了通知を受けた制御部2904によって起動される
と、グループ記憶部107に記憶されている各事象ごと
に構成する要素から助詞を補い文を作成する。次に、得
られた文のうち同一グループに分類された最長の文を選
択して代表文とし、グループ番号欄3401の後に
「*」を書き込む。
【0060】このようにして、図36に示した各事象3
301〜3321から図37に示すような文3301〜
3321が作成され、グループごとに代表文が図38に
示すように選択される。制御部2904は、上記したよ
うに本装置全体の動作の制御をする。次に、本実施の形
態の動作を図39、図40に示すフローチャートを用い
て説明する。
【0061】なお、上記実施の形態1と同様の動作につ
いては、同一のステップ番号を付してその説明を省略
し、本実施の形態固有の動作だけを説明する。類似文章
の抽出が終了すると、制御部2904は、事象抽出部2
901を起動する。事象抽出部2901は、文章記憶部
105に記憶されている文章を文に分割し、格文法を用
いた構文解析をして事象を抽出し、グループ記憶部10
7に記憶させる(S3912)。
【0062】事象の抽出が終了すると、制御部2904
はグループ作成部2902を起動する。グループ作成部
2902は、グループ記憶部107に記憶されているグ
ループ化されていない事象に注目し(S3914)、注
目した事象と他のグループ化されていない事象とを構成
する要素の一致数が「2」以上あるか否かを判定する
(S3916)。「2」以上有るときは、同じグループ
にまとめる(S3918)。その後又は、否のときは、
まだ比較されていない事象があるか否かを判定し(S3
920)、有るときはS3916に戻り、ないときはグ
ループ化されていない事象がまだ有るか否かを判定する
(S3922)。有るときにはS3914に戻り、ない
ときには、制御部2904は代表文作成部2903を起
動する。代表文作成部2903は、すべての事象から文
を作成し、各グループの文から最長の文を選択して代表
文とする(S4002)。
【0063】本実施の形態は、文章に含まれる文が複文
や重文等の長文の場合に特に有効であり、上記実施の形
態1の欠点を補うものである。なお、上記実施の形態
1、2では、図1、図29に示したような構成で本発明
に係る文章集約装置を実現したけれども、本発明はプロ
グラムによって実現し、これをフロッピーディスク等の
記録媒体に記録して移送することにより、最近実現され
た文字多重放送を受信できるコンピュータ・システムで
容易に実施することができる。図41は、これをフロッ
ピーディスクで実施する場合を説明する図である。
【0064】記録媒体本体であるフロッピーディスク4
101の物理フォーマットは、同心円上に外周から内周
に向かってトラック1、2、…、80を作成し、角度方
向に16のセクタに分割している。このように割り当て
られた領域に従って、プログラムを記録する。このフロ
ッピーディスク4101は、ケース4102に収納さ
れ、これによって、ディスクを埃や外部からの衝撃から
守り、安全に移送することができる。
【0065】図42は、フロッピーディスク4101に
プログラムの記録再生を行うことを説明する図である。
図示のようにコンピュータ・システム4201にフロッ
ピーディスクドライブ4202を接続することにより、
ディスク4101に対してプログラムを記録再生するこ
とが可能となる。ディスク4101はフロッピーディス
クドライブ4202に、挿入口4203を介して組込
み、および取り出しがなされる。記録する場合はコンピ
ュータ・システム4201からプログラムをフロッピー
ディスクドライブ4202によってディスク4101に
記録する。再生する場合は、フロッピーディスクドライ
ブ4202がプログラムをディスク4101から読み出
し、コンピュータ・システム4201に転送する。
【0066】なお、この実施の形態においては、記録媒
体としてフロッピーディスクを用いて説明を行ったが、
光ディスクを用いても同様に行うことができる。また記
録媒体はこれらに限られず、ICカード、ROMカセッ
ト等、プログラムを記録できるものであれば、同様に実
施することができる。なお、本実施の形態では、特に文
字放送ニュースを対象としたが、特許抄録などの文章デ
ータに対しても適用可能である。
【0067】
【発明の効果】以上説明したように本発明によれば、単
語、単文、複文、重文或いはそれらの文を組み合わせて
構成された文章を複数、記憶手段に記憶し、そのうちの
一部の文章若しくは全ての文章を表示手段にて表示する
装置における文章集約装置であって、前記記憶手段の文
章から一の文章を操作により指定する文章指定操作手段
と、指定された文章を第1のルールを用いて指定された
文章に類似した文章を前記記憶手段中の文章群から抽出
する類似文章抽出手段と、指定された文章及び抽出され
た文章に含まれる全ての文を第2のルールを用いて類似
する文同士を一グループにまとめる分類を行うグループ
分類手段と、分類された各グループ中の所定の文を参照
して代表文を作成する代表文作成手段と、作成された代
表文を用いて、指定された文章及びそれに類似する文章
を一の文章に集約する類似文章集約手段とを備えたの
で、複数の類似した文章があるとき、文章中の類似して
いる文から一の代表文を作成し、この文の集合から集約
した文章を作成できる。この結果、視聴者は、類似した
複数の文章をすべて読まなくても、この集約した文章を
読むことで、類似した複数の文章を読むことと同等の情
報を短い時間で得ることができる。
【0068】また、類似文章抽出手段の適用する第1の
ルール又はグループ分類手段の適用る第2のルールは、
対象とする両文章又は両文を構成する所定の単語の一致
数が一定数より大きいときに類似する文章又は文とする
ルールであることとしたので、指定された文章に類似す
る文章や文章を構成する類似する文を容易にひとまとめ
にするとができる。
【0069】また、グループ分類手段は、第2のルール
の適用に先立ち全ての文を格文法を用いて構文解析し、
「いつ、どこで、だれが、何を、どうした」を要素とす
る事象に分割し、類似する事象からなるグループに分類
する事象分類部を有し、前記代表文作成手段は、前記事
象分類部で分類された一のグループから代表文を作成す
ることとしたので、文中の事象を抽出し、類似している
事象から一の代表文を作成し、この文の集合から集約文
章を作成できる。このため、複文や重文など複雑な文で
も、より精度の高い集約された文章を作成できる。
【0070】また、前記事象分類部の適用する第2ノル
ールは、対象とする両事象を構成する要素の一致数が一
定数より大きいときに類似する事象とするルールである
こととしたので、類似する事象を容易にひとまとめにす
ることができる。また、前記代表文作成手段で作成され
た代表文の重要度を判定する重要度判定手段を備え、前
記類似文章集約手段は、前記重要度判定手段で重要度が
高いと判定された代表文を含めることとしたので、重要
度の高い文を含めて集約された文章を作成することがで
きる。このため、重要な情報を容易に得ることができ
る。
【0071】また、前記重要度判定手段は、前記グルー
プ分類手段でグループに分類したときの同一グループに
分類された文の数を計数して、その数を重要度とするこ
ととしたので、代表文の重要度が容易に判定できる。ま
た、前記重要度判定手段は、代表文中に含まれる所定の
単語の出現回数を計数して、その数を基に重要度とする
こととしたので、代表文の重要度が容易に判定できる。
【0072】また、前記類似文章集約手段で一の文章に
集約する際の文章量を指定する文章量指定手段を備え、
前記類似文章集約手段は、前記文章量指定手段で指定さ
れた文章量となるよう重要度判定手段で重要度が高いと
判定された代表文から順に一の文章に集約することとし
たので、集約された文章を一定の量に納めることによ
り、限られた表示領域に重要な情報だけを見やすく表示
することができる。
【0073】また、前記類似文章集約手段で一の文章に
集約された代表文のうち、前記重要度判定手段で判定さ
れた重要度に応じてその代表文の表示の際に、代表文に
修飾を施す表示制御手段を備えることとしたので、集約
された文章に含まれる代表文を、その代表文の重要度に
応じた修飾を施すことができ、視聴者は、特に重要な内
容を一見して知ることができる。
【0074】また、前記表示制御手段は、前記類似文章
集約手段で一の文章に集約された代表文を全て含む前記
文章記憶手段に記憶されている文章の文の並びに対応し
て代表文を表示させることとしたので、集約された文章
中の代表文の並びをもとの文章の順序と同じにすること
により、自然な流れの文章にできる。このため、より読
みやすく理解しやすい集約された文章を作成するとがで
きる。
【0075】また、前記代表文作成手段は、グループに
分類された文のうち最長の文を代表文として選択するこ
ととしたので、情報量の多い代表文を得ることができ
る。また、前記代表文作成手段は、グループに分類され
た各文に共通する文節を抽出して代表文を作成すること
としたので、とくに重要な部分のみで代表文を作成でき
るので、集約された文章全体を短くすることができる。
【0076】また、前記文章記憶手段は、文字多重放送
で受信した文字放送ニュースを記憶していることとした
ので、文字放送ニュースの情報を短時間で漏れなく見る
ことができる。更に、コンピュータを単語、単文、複
文、重文或いはそれらの文を組み合わせて構成された文
章を複数、記憶手段に記憶し、そのうちの一部の文章若
しくは全ての文章を表示手段にて表示する装置における
文章集約装置として機能させるためであって、表示され
ている文章から一の文章を操作により指定する文章指定
操作手段と、指定された文章を第1のルールを用いて指
定された文章に類似した文章を前記記憶手段中の文章群
から抽出する類似文章抽出手段と、指定された文章及び
抽出れた文章に含まれる全ての文を第2のルールを用い
て類似する文同士を一グループにまとめる分類を行うグ
ループ分類手段と、分類された各グループ中の所定の文
を参照して代表文を作成する代表文作成手段と、作成さ
れた代表文を用いて、指定された文章及びそれに類似す
る文章を一の文章に集約する類似文章集約手段として機
能させるためのプログラムを記録した記録媒体としたの
で、文章集約機能を有しない他のパーソナルコンピュー
タと相俟って、上記文字認識装置と同様の効果が得られ
る。
【図面の簡単な説明】
【図1】本発明に係る文章集約装置の実施の形態1の構
成図である。
【図2】本実施の形態のデータ記憶部に記憶されている
文字放送データの一例を示す図である。
【図3】本実施の形態の入力操作部の一例を示す図であ
る。
【図4】本実施の形態の表示部の一表示例を示す図であ
る。
【図5】本実施の形態の表示部の他の表示例を示す図で
ある。
【図6】本実施の形態の文章記憶部の記憶内容の一例を
示す図である。
【図7】本実施の形態の文章記憶部の記憶内容の一例を
示す図である。
【図8】本実施の形態の文章が単語に分割された様子を
示す図である。
【図9】本実施の形態の文章記憶部の記憶内容の一例を
示す図である。
【図10】本実施の形態の文章記憶部の記憶内容の一例
を示す図である。
【図11】本実施の形態のグループ記憶部の記憶内容の
一例を示す図である。
【図12】本実施の形態のグループ記憶部の記憶内容の
一例を示す図である。
【図13】本実施の形態のグループ記憶部の記憶内容の
一例を示す図である。
【図14】本実施の形態のグループ記憶部の記憶内容の
一例を示す図である。
【図15】本実施の形態のグループ記憶部の記憶内容の
一例を示す図である。
【図16】本実施の形態のグループ記憶部の記憶内容の
一例を示す図である。
【図17】本実施の形態の文章量指定部の記憶内容の一
例を示す図である。
【図18】本実施の形態のグループ記憶部の記憶内容の
一例を示す図である。
【図19】本実施の形態の表示部の一表示例を示す図で
ある。
【図20】本実施の形態の表示部の一表示例を示す図で
ある。
【図21】本実施の形態の表示部の一表示例を示す図で
ある。
【図22】本実施の形態の表示部の一表示例を示す図で
ある。
【図23】本実施の形態の変形例の不要文辞書部の記憶
内容を示す図である。
【図24】本実施の形態の変形例のグループ記憶部の記
憶内容を示す図である。
【図25】本実施の形態の変形例の表示部に表示予定の
集約された文章の一例を示す図である。
【図26】本実施の形態の変形例の表示部の表示例を示
す図である。
【図27】本実施の形態の動作を説明するフローチャー
トである。
【図28】本実施の形態の動作を説明するフローチャー
トである。
【図29】本発明に係る文章集約装置の実施の形態2の
構成図である。
【図30】本実施の形態のデータ記憶部に記憶されてい
る文字放送データの一例を示す図である。
【図31】本実施の形態の文章記憶部の記憶内容の一例
を示す図である。
【図32】本実施の形態の事象抽出部の記憶内容を示す
図である。
【図33】本実施の形態のグループ記憶部の記憶内容の
一例を示す図である。
【図34】本実施の形態のグループ記憶部の記憶内容の
一例を示す図である。
【図35】本実施の形態のグループ記憶部の記憶内容の
一例を示す図である。
【図36】本実施の形態のグループ記憶部の記憶内容の
一例を示す図である。
【図37】本実施の形態のグループ記憶部の記憶内容の
一例を示す図である。
【図38】本実施の形態のグループ記憶部の記憶内容の
一例を示す図である。
【図39】本実施の形態の動作を説明するフローチャー
トである。
【図40】本実施の形態の動作を説明するフローチャー
トである。
【図41】上記実施の形態1又は2で説明した文章集約
装置の各構成要素の機能を実現するプログラムを記録し
た記録媒体の説明図である。
【図42】上記記録媒体のコンピュータシステムへの装
着を説明する図である。
【符号の説明】
101 データ記憶部 102 表示部 103 入力操作部 104 類似文章抽出部 105 文章記憶部 106、2902 グループ作成部 107 グループ記憶部 108、2903 代表文作成部 109 重要度計算部 110 文章量指定部 111 重要文選択部 112 表示文章作成部 113、2904 制御部 2901 事象抽出部

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 単語、単文、複文、重文或いはそれらの
    文を組み合わせて構成された文章を複数、記憶手段に記
    憶し、そのうちの一部の文章若しくは全ての文章を表示
    手段にて表示する装置における文章集約装置であって、 前記記憶手段の文章から一の文章を操作により指定する
    文章指定操作手段と、 指定された文章を第1のルールを用いて指定された文章
    に類似した文章を前記記憶手段中の文章群から抽出する
    類似文章抽出手段と、 指定された文章及び抽出された文章に含まれる全ての文
    を第2のルールを用いて類似する文同士を一グループに
    まとめる分類を行うグループ分類手段と、 分類された各グループ中の所定の文を参照して代表文を
    作成する代表文作成手段と、 作成された代表文を用いて、指定された文章及びそれに
    類似する文章を一の文章に集約する類似文章集約手段
    と、 を備えたことを特徴とする文章集約装置。
  2. 【請求項2】 類似文章抽出手段の適用する第1のルー
    ル又はグループ分類手段の適用する第2のルールは、対
    象とする両文章又は両文を構成する所定の単語の一致数
    が一定数より大きいときに類似する文章又は文とするル
    ールであることを特徴とする請求項1記載の文章集約装
    置。
  3. 【請求項3】 請求項1記載のグループ分類手段は、 第2のルールの適用に先立ち全ての文を格文法を用いて
    構文解析し、「いつ、どこで、だれが、何を、どうし
    た」を要素とする事象に分割し、類似する事象からなる
    グループに分類する事象分類部を有し、 前記代表文作成手段は、前記事象分類部で分類された一
    のグループから代表文を作成することを特徴とする文章
    集約装置。
  4. 【請求項4】 前記事象分類部の適用する第2のルール
    は、対象とする両事象を構成する要素の一致数が一定数
    より大きいときに類似する事象とするルールであること
    を特徴とする請求項3記載の文章集約装置。
  5. 【請求項5】 前記代表文作成手段で作成された代表文
    の重要度を判定する重要度判定手段を備え、 前記類似文章集約手段は、前記重要度判定手段で重要度
    が高いと判定された代表文を含めることを特徴とする請
    求項1、2、3又は4記載の文章集約装置。
  6. 【請求項6】 前記重要度判定手段は、 前記グループ分類手段でグループに分類したときの同一
    グループに分類された文の数を計数して、その数を重要
    度とすることを特徴とする請求項5記載の文章集約装
    置。
  7. 【請求項7】 前記重要度判定手段は、 代表文中に含まれる所定の単語の出現回数を計数して、
    その数を基に重要度とすることを特徴とする請求項5記
    載の文章集約装置。
  8. 【請求項8】 前記類似文章集約手段で一の文章に集約
    する際の文章量を指定する文章量指定手段を備え、 前記類似文章集約手段は、前記文章量指定手段で指定さ
    れた文章量となるよう重要度判定手段で重要度が高いと
    判定された代表文から順に一の文章に集約することを特
    徴とする請求項5、6又は7記載の文章集約装置。
  9. 【請求項9】 前記類似文章集約手段で一の文章に集約
    された代表文のうち、前記重要度判定手段で判定された
    重要度に応じてその代表文の表示の際に、代表文に修飾
    を施す表示制御手段を備えることを特徴とする請求項8
    記載の文章集約装置。
  10. 【請求項10】 前記表示制御手段は、 前記類似文章集約手段で一の文章に集約された代表文を
    全て含む前記文章記憶手段に記憶されている文章の文の
    並びに対応して代表文を表示させることを特徴とする請
    求項1又は2記載の文章集約装置。
  11. 【請求項11】 前記代表文作成手段は、グループに分
    類された文のうち最長の文を代表文として選択すること
    を特徴とする請求項1又は2記載の文章集約装置。
  12. 【請求項12】 前記代表文作成手段は、グループに分
    類された各文に共通する文節を抽出して代表文を作成す
    ることを特徴とする請求項1又は2記載の文章集約装
    置。
  13. 【請求項13】 前記文章記憶手段は、文字多重放送で
    受信した文字放送ニュースを記憶していることを特徴と
    する請求項1、2、3、4、5、6、7、8、9、1
    0、11又は12記載の文章集約装置。
  14. 【請求項14】 コンピュータを単語、単文、複文、重
    文或いはそれらの文を組み合わせて構成された文章を複
    数、記憶手段に記憶し、そのうちの一部の文章若しくは
    全ての文章を表示手段にて表示する装置における文章集
    約装置として機能させるためであって、 表示されている文章から一の文章を操作により指定する
    文章指定操作手段と、 指定された文章を第1のルールを用いて指定された文章
    に類似した文章を前記記憶手段中の文章群から抽出する
    類似文章抽出手段と、 指定された文章及び抽出れた文章に含まれる全ての文を
    第2のルールを用いて類似する文同士を一グループにま
    とめる分類を行うグループ分類手段と、 分類された各グループ中の所定の文を参照して代表文を
    作成する代表文作成手段と、 作成された代表文を用いて、指定された文章及びそれに
    類似する文章を一の文章に集約する類似文章集約手段と
    して機能させるためのプログラムを記録したことを特徴
    とする記録媒体。
JP8286991A 1996-10-29 1996-10-29 文章集約装置 Pending JPH10134066A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8286991A JPH10134066A (ja) 1996-10-29 1996-10-29 文章集約装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8286991A JPH10134066A (ja) 1996-10-29 1996-10-29 文章集約装置

Publications (1)

Publication Number Publication Date
JPH10134066A true JPH10134066A (ja) 1998-05-22

Family

ID=17711612

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8286991A Pending JPH10134066A (ja) 1996-10-29 1996-10-29 文章集約装置

Country Status (1)

Country Link
JP (1) JPH10134066A (ja)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000011003A (ja) * 1998-06-26 2000-01-14 Nippon Telegr & Teleph Corp <Ntt> 公開文書要約装置およびそのためのプログラムを記録した記録媒体
JP2002049632A (ja) * 2000-08-03 2002-02-15 Nec Corp 要約システムとその要約方法、及び要約プログラムを記録した記録媒体
US6493663B1 (en) 1998-12-17 2002-12-10 Fuji Xerox Co., Ltd. Document summarizing apparatus, document summarizing method and recording medium carrying a document summarizing program
JP2003167893A (ja) * 2001-11-29 2003-06-13 Hitachi Tohoku Software Ltd 特許文献の理解支援システムおよび特許文献の理解支援プログラム
JP2004030021A (ja) * 2002-06-24 2004-01-29 Oki Electric Ind Co Ltd 文書処理装置および方法
JP2008243024A (ja) * 2007-03-28 2008-10-09 Kyushu Institute Of Technology 情報取得装置、そのプログラム及び方法
JP2008243126A (ja) * 2007-03-29 2008-10-09 Chuden Cti Co Ltd 入力情報分析装置
JP2010277409A (ja) * 2009-05-29 2010-12-09 Toshiba Corp 代表文抽出装置およびプログラム
JP2011085986A (ja) * 2009-10-13 2011-04-28 Nippon Telegr & Teleph Corp <Ntt> テキスト要約方法、その装置およびプログラム
JPWO2010041420A1 (ja) * 2008-10-10 2012-03-01 日本電気株式会社 情報分析装置、情報分析方法、及びプログラム
JP2013120547A (ja) * 2011-12-08 2013-06-17 Nomura Research Institute Ltd 談話要約テンプレート作成システムおよび談話要約テンプレート作成プログラム
WO2013145004A1 (ja) 2012-03-28 2013-10-03 富士通株式会社 情報処理装置、情報処理方法および情報処理システム
JP2013254321A (ja) * 2012-06-06 2013-12-19 Canon Inc 画像処理装置、画像処理方法及びプログラム
JP2016110165A (ja) * 2014-12-02 2016-06-20 日本電信電話株式会社 イベント情報抽出装置、イベント情報抽出方法及びイベント情報抽出プログラム
JP2018147411A (ja) * 2017-03-08 2018-09-20 株式会社Spectee データ処理装置、データ処理方法、データ処理システム及びプログラム
JP2020064457A (ja) * 2018-10-17 2020-04-23 富士通株式会社 修正内容特定プログラムおよびレポート修正内容特定装置
JP2020086895A (ja) * 2018-11-26 2020-06-04 株式会社富士通ゼネラル 入力支援装置

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000011003A (ja) * 1998-06-26 2000-01-14 Nippon Telegr & Teleph Corp <Ntt> 公開文書要約装置およびそのためのプログラムを記録した記録媒体
US6493663B1 (en) 1998-12-17 2002-12-10 Fuji Xerox Co., Ltd. Document summarizing apparatus, document summarizing method and recording medium carrying a document summarizing program
JP2002049632A (ja) * 2000-08-03 2002-02-15 Nec Corp 要約システムとその要約方法、及び要約プログラムを記録した記録媒体
JP2003167893A (ja) * 2001-11-29 2003-06-13 Hitachi Tohoku Software Ltd 特許文献の理解支援システムおよび特許文献の理解支援プログラム
JP2004030021A (ja) * 2002-06-24 2004-01-29 Oki Electric Ind Co Ltd 文書処理装置および方法
JP2008243024A (ja) * 2007-03-28 2008-10-09 Kyushu Institute Of Technology 情報取得装置、そのプログラム及び方法
JP2008243126A (ja) * 2007-03-29 2008-10-09 Chuden Cti Co Ltd 入力情報分析装置
JP5527548B2 (ja) * 2008-10-10 2014-06-18 日本電気株式会社 情報分析装置、情報分析方法、及びプログラム
JPWO2010041420A1 (ja) * 2008-10-10 2012-03-01 日本電気株式会社 情報分析装置、情報分析方法、及びプログラム
JP2010277409A (ja) * 2009-05-29 2010-12-09 Toshiba Corp 代表文抽出装置およびプログラム
JP2011085986A (ja) * 2009-10-13 2011-04-28 Nippon Telegr & Teleph Corp <Ntt> テキスト要約方法、その装置およびプログラム
JP2013120547A (ja) * 2011-12-08 2013-06-17 Nomura Research Institute Ltd 談話要約テンプレート作成システムおよび談話要約テンプレート作成プログラム
WO2013145004A1 (ja) 2012-03-28 2013-10-03 富士通株式会社 情報処理装置、情報処理方法および情報処理システム
US9843627B2 (en) 2012-03-28 2017-12-12 Fujitsu Limited Information processing method, information processing device, and storage medium
JP2013254321A (ja) * 2012-06-06 2013-12-19 Canon Inc 画像処理装置、画像処理方法及びプログラム
JP2016110165A (ja) * 2014-12-02 2016-06-20 日本電信電話株式会社 イベント情報抽出装置、イベント情報抽出方法及びイベント情報抽出プログラム
JP2018147411A (ja) * 2017-03-08 2018-09-20 株式会社Spectee データ処理装置、データ処理方法、データ処理システム及びプログラム
JP2020064457A (ja) * 2018-10-17 2020-04-23 富士通株式会社 修正内容特定プログラムおよびレポート修正内容特定装置
JP2020086895A (ja) * 2018-11-26 2020-06-04 株式会社富士通ゼネラル 入力支援装置

Similar Documents

Publication Publication Date Title
JPH10134066A (ja) 文章集約装置
Pavel et al. Sceneskim: Searching and browsing movies using synchronized captions, scripts and plot summaries
Qi et al. Integrating visual, audio and text analysis for news video
USRE40731E1 (en) System and method for linking streams of multimedia data to reference material for display
KR100785927B1 (ko) 데이터 요약 생성 방법 및 장치
EP0568161A1 (en) Interctive desktop system
EP0182460A1 (en) Multi-image communications system
TW330286B (en) Multi-language recording media and playing apparatus thereof
JPH10507555A (ja) デジタル・オーディオとビデオ・データを走り読みするための方法とそのシステム
KR100340373B1 (ko) 프레임시퀀스압축방법및장치와,프레임시퀀스의압축표현표시방법
MXPA06003785A (es) Medio de almacenamiento de informacion que almacena subtitulo basado en texto y aparato y metodo para procesar subtitulo basado en texto.
CN102217320A (zh) 节目信息显示装置及方法
CN1864220B (zh) 处理基于文本的字幕的设备
US5289376A (en) Apparatus for displaying dictionary information in dictionary and apparatus for editing the dictionary by using the above apparatus
US6620207B1 (en) Method and apparatus for processing chinese teletext
JP6603929B1 (ja) 動画編集サーバおよびプログラム
KR100243350B1 (ko) 뉴스 비디오 자막 추출 및 인식 방법
JP2001502858A (ja) ディジタル音声及び画像情報の符号化データのデータベースを有したディジタル画像システム
Christel Accessing news video libraries through dynamic information extraction, summarization, and visualization
DE69933500T2 (de) Textinformationswiedergabegerät
EP0795863A2 (en) Data recording method and apparatus
JPH06231179A (ja) 情報検索方式
JPH11203305A (ja) 文書画像処理方法および記録媒体
US7349846B2 (en) Information processing apparatus, method, program, and storage medium for inputting a pronunciation symbol
JP2001184351A (ja) 文書情報抽出装置および文書分類装置