JPH06332893A - 文章加工装置 - Google Patents

文章加工装置

Info

Publication number
JPH06332893A
JPH06332893A JP5119541A JP11954193A JPH06332893A JP H06332893 A JPH06332893 A JP H06332893A JP 5119541 A JP5119541 A JP 5119541A JP 11954193 A JP11954193 A JP 11954193A JP H06332893 A JPH06332893 A JP H06332893A
Authority
JP
Japan
Prior art keywords
sentence
text
processing
original
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5119541A
Other languages
English (en)
Inventor
Hisao Mase
久雄 間瀬
Hiroshi Tsuji
洋 辻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP5119541A priority Critical patent/JPH06332893A/ja
Publication of JPH06332893A publication Critical patent/JPH06332893A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 文章を、出力時間、出力速度の指定に応じて
加工し、出力する。 【構成】 出力時間、出力速度から加工文字数を算出す
る加工文字数算出手段と、原文章を自然言語解析する自
然言語解析手段と、利用者の指定したパラメータ設定に
よって原文章を加工する加工処理手段からなる。 【効果】 出力速度、出力時間を入力すると加工文字数
を算出し、加工し、出力するので、文字数の計算が不要
である。また、実際の出力との時間的ずれを少なくしつ
つ、出力速度を変えて出力でき、高齢者や視聴覚障害者
がリアルタイムに、かつ、快適に読み聴きできる。さら
に、利用者の意図や利用環境を反映した加工文章を作成
できる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、自然言語で書かれた文
章を利用者の要求に応じて加工する文章加工装置に係
り、特に、出力速度および出力時間についての利用者の
要求に応じて文章を加工する文章加工装置に関する。
【0002】
【従来の技術】これまでに試作されている文章加工装置
としては、文章推敲支援装置や、文章要約(支援)装置
などがある。文章要約(支援)装置については、情報処
理学会誌Vol.30のNo.10や情報処理学会第4
5回全国大会講演論文集6G−9に記載されているシス
テムなど多くの公知例がある。一方、出力速度を変化さ
せる方式としては、テレビやラジオの音声の出力速度を
制御可能にする変換装置等が公知である。
【0003】
【発明が解決しようとする課題】テレビやラジオのニュ
ース放送や字幕・文字放送、新幹線やビル等のテロップ
では、一ニュースに割り当てられた出力(放映)時間が
決まっていることが多く、読み上げられる文字数あるい
は表示される文字数が限定される。一方、高齢者や視聴
覚障害者などに対しては、ゆっくり聴いたり読んだりで
きるように出力方法を工夫する必要がある。しかし、出
力内容を変えないまま、出力速度を遅くすると、実際の
出力との間に時間的ずれが生じる。この課題を解決する
ためには、原文章の原稿を加工して適切に短くし、短く
した分だけゆっくりと出力する方法が有効となる。これ
により、高齢者や視聴覚障害者がニュースを快適に聴い
たり読んだりできる。
【0004】本発明の一つの目的は、ニュース原稿など
の文章を、出力時間、出力速度等の指定に応じて加工
し、出力することを可能とする文章加工装置を提供する
ことにある。また、文章加工の方法は、利用環境や文章
の形態や分野によって異なる。さらに、加工した文章の
善し悪しは主観的な要素が多分に含まれる。本発明の他
の目的は、利用者の意図を反映した加工文章を作成する
ことを可能とする文章加工装置を提供することにある。
【0005】
【課題を解決するための手段】本発明によれば、入力手
段が加工文章の出力速度および出力時間を入力し、加工
文章出力速度および加工文章出力時間および原文章の文
字数から加工文章の文字数を算出する加工文字数算出手
段と、その文字数に基づいて原文章を加工する加工処理
手段とを備えた文章加工装置を提供することにより、上
記課題を解決する。また、本発明によれば、入力手段が
原文章の出力時間および加工文章の出力時間を入力し、
原文章出力時間および加工文章出力時間および原文章の
文字数から加工文章の文字数を算出する加工文字数算出
手段と、その文字数に基づいて原文章を加工する加工処
理手段とを備えた文章加工装置を提供することにより、
上記課題を解決する。
【0006】さらに、本発明によれば、入力手段が原文
章の出力速度および加工文章の出力速度を入力し、原文
章出力速度および加工文章出力速度および原文章の文字
数から加工文章の文字数を算出する加工文字数算出手段
と、その文字数に基づいて原文章を加工する加工処理手
段とを備えた文章加工装置を提供することにより、上記
課題を解決する。さらに、本発明によれば、入力手段が
原文章の出力時間および原文章出力時間に対する加工文
章の相対出力時間を入力し、原文章出力時間および加工
文章相対出力時間および原文章の文字数から加工文章の
文字数を算出する加工文字数算出手段と、その文字数に
基づいて原文章を加工する加工処理手段とを備えた文章
加工装置を提供することにより、上記課題を解決する。
【0007】さらに、本発明によれば、入力手段が原文
章の出力速度および原文章出力速度に対する加工文章の
相対出力速度を入力し、原文章出力速度および加工文章
相対出力速度および原文章の文字数から加工文章の文字
数を算出する加工文字数算出手段と、その文字数に基づ
いて原文章を加工する加工処理手段とを備えた文章加工
装置を提供することにより、上記課題を解決する。さら
に、本発明によれば、原文章から抽出あるいは削除する
語句を規定する一種類以上のパラメータと、利用者から
の前記パラメータに対する指定に基づいて前記原文章を
加工する手段を備えることにより、上記課題を解決す
る。
【0008】
【作用】上記方法によれば、出力の速度、時間に関する
制約を入力すると自動的に加工すべき文字数を算出し、
原文章を加工するので、文字数計算をしなくて済む。ま
た、上記方法によれば、例えば、原文章の出力時間が3
分であるニュース文を放送する場合、「出力時間=1
分」あるいは「出力時間=33%」というように指定す
ることにより、原文章は3分の1の文字数に加工され、
時間内に収まる所望の加工文章を得られる。また、「出
力速度=標準の80%」などと指定すれば、原文章は文
字数が80%になるように加工され、それを80%の速
度で出力することにより、実際の出力とのずれなく、実
際の出力よりもゆっくりと出力できる。なお、ここでい
う文章の「加工」とは、文章中の語句の削除(要約)や
言い換え、語句の補填等の自然言語処理の総称である。
【0009】
【実施例】以下、本発明の実施例を図面を用いて詳細に
説明する。本実施例は、ニュース原稿を要約して合成音
声で出力するシステムについて述べる。本実施例で述べ
たことは、テレビやラジオのニュース番組の放送や、字
幕放送、文字放送、テロップ表示等にも適用できる。
【0010】図1は、本実施例で述べるシステムの概要
を表した図である。まず、要約文の出力方法に関する情
報を入出力部1より入力する。すなわち、要約文の出力
速度と出力時間(放映時間)、あるいは、原文章による
出力時間と要約文による出力時間、あるいは、原文章の
出力速度と要約文の出力速度、あるいは、原文章の出力
時間とそれに対する要約文の出力時間の割合、あるい
は、原文章の出力速度とそれに対する要約文の出力速度
の割合、のうちの少なくともどれか一組の情報を入力す
る。次に、要約したいニュース原稿を入出力部1より入
力する。入力手段には、キーボードによる入力や音声認
識装置による入力、文字認識装置による入力等がある
が、結果的にニュース原稿が計算機に格納されればよい
ので、どの手段であっても構わない。次に、要約文の作
成方法に関するパラメータを設定する。これは、図9に
示すようなパラメータの各々について、利用環境あるい
は利用者の好みに合わせて選択することにより、利用者
の意図にかなった要約文を作成する。
【0011】以上の入力を基にして以下の手順で要約を
作成する。まず、要約文字数算出部2において、利用者
の入力した出力方法に関する情報を基にして要約文の文
字数を算出する。例えば、要約文の出力時間を50秒、
出力速度を2文字/秒と設定したならば、50×2=1
00文字と算出する。次に、自然言語解析部3におい
て、入力されたニュース原稿を自然言語解析する。すな
わち、単語辞書4、文法辞書5を参照してニュース原稿
を単語分割し、各単語の品詞情報や活用情報、意味属性
情報等を単語辞書4から取得する。
【0012】次に、要約処理部6において、利用者の設
定したパラメータの値に基づいて原文章から重要な部分
および不要な部分を認定し、要約文字数算出部2で算出
された要約文字数からなる要約文を作成する。重要な部
分を認定する際には、各パラメータの適用条件を記述し
た要約用辞書7を参照する。要約処理部6で作成された
要約文は音声合成処理部8において、合成音声に変換す
る。すなわち、音節やアクセント、音節の接続条件等を
記述した音声辞書9を用いて要約文を音節列に変換す
る。そして、音声合成装置により音声波形に変換し出力
する。既に公知の音声合成装置では、出力速度を自由に
切り替えることが可能である。日本語文字列を入力とし
て合成音声を生成する技術に関しては、既に公知である
ので、本実施例ではこれ以上言及しない。
【0013】本実施例では、音声合成装置を用いて要約
文を出力するが、その他にも文字放送のように要約文を
モニタ画面に表示したり、字幕放送のように画面の一部
として表示したり、テロップのように要約文を少しずつ
順番に出力させる方法等でもよい。
【0014】図1から明らかなように、入出力部1、要
約文字数算出部2、自然言語解析部3、要約処理部6、
音声合成処理部8は処理を示し、単語辞書4、文法辞書
5、要約用辞書7、音声辞書9はファイル(テーブル)
を示している。このように、本実施例によれば、各機能
ブロックがプログラム論理によって構成されている。そ
のため、各機能ブロック単位にLSI化が可能であり、
文章加工(要約)装置として、処理の高速化を図ること
ができる。
【0015】図2は、本実施例のハードウェア構成の概
要を示した図である。30は文字認識装置,40はキー
ボード,50は音声合成装置,60は処理装置,70は
記憶装置である。記憶装置70は、次の記憶部からな
る。すなわち、ワーキングエリア71,要約文字数算出
部格納エリア72,自然言語解析部格納エリア73,要
約処理部格納エリア74,音声合成処理部格納エリア7
5,単語辞書格納エリア76,文法辞書格納エリア7
7,要約用辞書格納エリア78,音声辞書格納エリア7
9からなる。記憶装置70は、各種プログラムおよびデ
ータを格納する。処理装置60は、記憶装置70に格納
されているプログラムを実行し、必要に応じて入出力装
置を通じてデータの入出力を行いながら処理を行う。
【0016】図3および図4は、「出力方法に関する情
報」の設定の一例を示した図である。本実施例における
「出力方法に関する情報」とは、原文章あるいは要約文
の出力速度および出力時間を指し、その入力は、絶対的
な値の入力と相対的な値(割合)の入力とがある。図3
では、要約文章出力時間と要約文章出力速度を、それぞ
れ、45秒,2文字/秒と絶対的な値で入力し、図4で
は、原文章出力速度に対する要約文章出力速度の割合を
75%と相対的な値で入力している。本実施例では、こ
れらの情報をキーボードから入力するが、音声認識装置
や文字認識装置30などを用いても構わない。なお、入
力した情報はワーキングエリア71に格納する。
【0017】「出力方法に関する情報」の設定は、実際
に出力する際の音声合成装置を制御するためだけでな
く、要約文の文字数を自動的に算出するためにも行う。
本実施例では、少なくとも次の5組の「出力方法に関す
る情報」のうちのどれか一組の入力情報から要約文の文
字数を算出する。
【0018】(1)要約文の出力速度と出力時間 (2)原文章の出力速度と要約文の出力速度 (3)原文章の出力速度と、その速度に対する要約文の
出力速度の割合 (4)原文章の出力時間と要約文の出力時間 (5)原文章の出力時間と、その時間に対する要約文の
出力時間の割合 もちろん、これらの入力情報が重複しても構わない。こ
れらの情報を基に要約文字数算出部2において要約文字
数を算出する。
【0019】図5は、本実施例の要約文字数算出部2の
流れ図を示した図である。まず、原文章の文字数(TN
UM)を算出する(ステップ201)。文字列の文字数
を算出することは、多くのプログラミング言語で関数と
して提供されているので容易にできる。次に、要約文の
出力速度(VA)と要約文の出力時間(TA)が利用者
からともに入力されているか否かを判別し(ステップ2
02)、入力されている場合は、VAとTAの積を要約
文字数(ANUM)として保持し(ステップ203)、
処理を終了する。
【0020】ステップ202で入力されていない場合
は、原文章の出力速度(VT)と要約文の出力速度(V
A)が利用者からともに入力されているか否かを判別し
(ステップ204)、入力されている場合は、VAをV
Tで割った商と原文章文字数(TNUM)の積を要約文
字数(ANUM)として保持し(ステップ205)、処
理を終了する。ステップ204で入力されていない場合
は、原文章の出力速度(VT)に対する要約文の出力速
度の割合(VAR)が利用者からともに入力されている
か否かを判別し(ステップ206)、入力されている場
合は、原文章文字数(TNUM)とVARの積を要約文
字数(ANUM)として保持し(ステップ207)、処
理を終了する。
【0021】ステップ206で入力されていない場合
は、原文章の出力時間(TT)と要約文の出力時間(T
A)が利用者からともに入力されているか否かを判別し
(ステップ208)、入力されている場合は、TAをT
Tで割った商と原文章文字数(TNUM)の積を要約文
字数(ANUM)として保持し(ステップ209)、処
理を終了する。ステップ208で入力されていない場合
は、原文章の出力時間(TT)に対する要約文の出力時
間の割合(TAR)が利用者からともに入力されている
か否かを判別し(ステップ210)、入力されている場
合は、原文章文字数(TNUM)とTARの積を要約文
字数(ANUM)として保持し(ステップ211)、処
理を終了する。
【0022】要約文字数算出部2により、図3の入力に
対しては、ステップ202を満たすので、ステップ20
3により、両者の積90文字を要約文字数(ANUM)
として保持する。また、図4の入力に対しては、ステッ
プ206を満たすので、ステップ207により、原文章
文字数(TNUM)と75%との積を要約文字数(AN
UM)として保持する。本実施例では、原文章として図
6の文章を用いる。よって、図4の場合、要約文字数を
199*0.75=149文字として保持する。
【0023】図6は、本実施例で用いる原文章を示した
図である。図6には題名が記述されていないが、記述さ
れていても構わない。要約文字数算出部2で要約文字数
を算出した後、自然言語解析部3において原文章を解析
する。自然言語処理部3は、要約文字数算出部2よりも
先に行ってもよい。自然言語解析部3では、単語の属性
を登録した単語辞書4、単語分割に関する文法情報を定
義した文法辞書5を参照して原文章を単語分割し、各単
語の品詞情報や活用情報、意味属性等を取得する。単語
分割技術に関しては、例えば情報処理学会第44回全国
大会4P−7記載の形態素解析ツール等により既に公知
であるので、これ以上言及しない。
【0024】図7は、図6の原文章を自然言語解析部3
によって単語分割した結果を示した図である。図7でス
ラッシュ「/」は、単語の境界を示している。段落冒頭
のスペースや句読点も一単語とみなす。図8は、自然言
語解析部3の出力である単語テーブルの構成を示した図
である。
【0025】文No1001は、冒頭から何番目の文であ
るかを表したものである。単語No1002は、その文の
冒頭から何番目の単語であるかを表したものである。こ
れらはカウンタを設けることにより容易に取得できる。
見出し1003は、各単語文字列をそのまま格納する。
語幹1004は、活用する単語については、語幹文字列
を、活用しない単語については、見出し1003の文字
列を格納する。品詞1005は、その単語の品詞を格納
する。活用種1006は、活用する単語の活用の種類
(五段、上一段、サ変等)を格納する。活用行1007
は、活用する単語の活用行(ア行、カ行等)を格納す
る。活用形1008は、活用する単語の活用形(未然、
連用、終止、連体、仮定、命令)を格納する。意味分類
1009は、その単語が属する意味的なカテゴリに関す
る情報を格納する。語幹1004、品詞1005、活用
種1006、活用行1007、活用形1008、意味分
類1009については、単語辞書4に見出しに対応付け
て格納されているので、抽出は容易である。意味分類1
009については、単語辞書4に格納しておいても良い
し、シソーラス辞書や概念辞書等を利用することも可能
である。重要度1010は、各単語の重要さを数値化し
たものであり、最初は0に初期化されている。自然言語
解析部3の結果として出力された単語テーブルの情報を
基に、要約処理部6において要約文を作成する。要約処
理部6では、利用者の指定した情報から算出した要約文
字数と、利用者の設定したパラメータの情報と、各パラ
メータを適用するための条件を定義した要約用辞書7と
を利用して要約文を作成する。
【0026】図9は、要約処理部6で参照するパラメー
タを示した図である。利用者はこれらのパラメータを設
定することにより、自分の意図に合った要約文を作成で
きる。
【0027】本実施例では、8種類のパラメータを用意
しているが、8という数には何の意味もないので、パラ
メータの数は増やしたり減らしたりしても問題ない。本
実施例で扱うパラメータは次の8種類である。
【0028】(1)冒頭文パラメータ1101 (2)段落冒頭文パラメータ1102 (3)キーワードパラメータ1103 (4)例示文パラメータ1104 (5)主張文パラメータ1105 (6)前提部分パラメータ1106 (7)冗長表現パラメータ1107 (8)括弧パラメータ1108 この他にも、会話文の扱い、原因を表す文の扱い、結果
を表す文の扱い、体言止め表現や丁寧表現の適用、長い
語句の言い換え等のパラメータを定義してもよい。 各
パラメータには、次の4種類の選択肢1112があり、
それぞれのパラメータについて1種類ずつ選択できる。
【0029】(a)当該パラメータを満たす部分のみを
要約文として抽出する (b)当該パラメータを満たす部分を要約文として抽出
する (c)当該パラメータを満たす部分を要約文から削除す
る (d)当該パラメータを適用しない もちろん、これよりも選択肢を多くしたり少なくしたり
することは可能である。
【0030】各パラメータの各選択肢には重み1113
が付与されている。原文章中のある部分が、あるパラメ
ータの適用条件を満たすとき、対応する重み1113を
特定の単語の重要度1010に加算する。すべてのパラ
メータについてこの重み加算を実行し、最終的に得られ
る重要度1010の高い単語ほど要約文として抽出すべ
き単語とみなす。重みは、抽出することを表す選択肢に
は正数を付与し、削除することを表す選択肢には負数を
付与し、適用しないことを表す選択肢には0を付与す
る。これらの重みは、システム固有の値として保持して
も良いし、利用者が設定することを可能にしても良い。
【0031】図10は、要約用辞書7の構成を示した図
である。要約用辞書7には、各パラメータを適用するた
めの条件を定義する。1201はパラメータの分類であ
り、パラメータの名称を記述する。1202は対象単語
からの距離であり、その条件がどの単語に対して成り立
てばよいかを相対的に示すものである。各条件を適用す
る際には、冒頭の単語から順に、各パラメータの各条件
を満たすか否かをチェックする。チェックは、その対象
となる単語(対象単語と呼ぶ)について行うが、場合に
よっては、対象単語の前後の単語がある条件を満たさな
ければならない場合がある。対象単語からの距離という
のは、対象単語から前後にいくつの単語だけ離れた単語
についてその条件をチェックするのかを示したものであ
る。図10で、主張文に関する条件1215について
は、「語幹==”そう”」「活用形=連用」という二つ
の条件が定義されているが、前者の条件については、対
象単語からの距離が0であるので、対象単語そのものに
ついての条件である。それに対して後者の条件は、対象
単語からの距離が−1であるので、対象単語の一つ前の
単語についての条件である。つまり条件1215は、
「単語の語幹が”そう”であり、かつ、その直前の単語
の活用形が連用である」という条件を記述している。
【0032】1203は、項目名であり、チェックの対
象となる項目を記述する。項目名として、図8の単語テ
ーブルを構成する項目を記述できる。1204は、項目
値であり、チェックの対象となる項目名1203のとる
べき値を記述する。項目名1203のとる値の型によ
り、数値、文字列のほか、変数名(最初に$をつける)
を記述できる。数値、文字列については、その値を図8
の単語テーブルの値と比較することにより、条件を満た
すか否かをチェックできる。変数名については、その変
数に相当する値に置き換えた後に比較することにより、
条件を満たすか否かをチェックできる。変数の展開は、
C言語等の言語によれば容易に実現できるので、ここで
は言及しない。1205は、関係であり、項目名120
3と項目値1204との間の関係がどうあるべきかを記
述する。本実施例では、関係として、同等「==」、非
同等「!=」、以上「>=」、以下「<=」、より以上
「>>」、未満「<<」を定義可能とする。項目名12
03の型と、関係1205が何であるかを踏まえて、そ
の組み合わせに対応させて比較することは容易に実現可
能である。要約用辞書7は、システム提供者が予め定義
しておいても良いし、利用者が自由に定義できるように
しても良い。
【0033】図11は、要約処理部6の流れ図を示した
図である。まず、図8の単語テーブルの重要度1010
をすべて0に初期化する(ステップ601)。次のステ
ップ602からステップ609までで、各パラメータが
適用できるか否かを判定する。ステップ602では、冒
頭文パラメータについてパラメータ判定処理1を実行す
る。ステップ603では、段落冒頭文パラメータについ
てパラメータ判定処理1を実行する。ステップ604で
は、キーワードパラメータについてパラメータ判定処理
1を実行する。キーワードパラメータで使用するキーワ
ードは、原文章の自然言語解析部3の結果である単語テ
ーブルにおいて、語幹1004の頻度を数え、予め与え
たしきい値以上の頻度である単語をキーワードにする、
あるいは、高頻度の単語の上位いくつかをキーワードに
するといった方法で取得できる。ステップ605では、
例示文パラメータについてパラメータ判定処理1を実行
する。ステップ606では、主張文パラメータについて
パラメータ判定処理部1を実行する。ステップ607で
は、前提部分パラメータについてパラメータ判定処理部
2を実行する。ステップ608では、冗長表現パラメー
タについてパラメータ判定処理部3を実行する。ステッ
プ609では、括弧パラメータについてパラメータ判定
処理4を実行する。パラメータ判定処理が4種類に分か
れているのは、パラメータの条件を満たした場合に、重
みをどの単語の重要度に付与するのかの違いによる。
【0034】ステップ609までで、重要度1010の
計算が終了するので、ステップ610で、要約文の文字
数が要約文字数算出部2で算出した要約文字数に最も近
くなるような重要度1010のボーダー値を算出し、そ
のボーダー値以上の単語を要約文として抽出する。
【0035】図12は、要約処理部6におけるパラメー
タ判定処理1の流れ図を示した図である。まず、ポイン
タを冒頭の文に設定する(ステップ6011)。次に、
要約用辞書7に記述された当該パラメータの条件を満た
す部分が当該文に含まれているか否かを判別し(ステッ
プ6012)、含まれている場合は、当該文を構成する
各単語の重要度に当該パラメータの設定選択肢に対応す
る重みを加算する(ステップ6013)。ステップ60
12で含まれていない場合、また、ステップ6013の
後、ポインタを次の文の先頭に進める(ステップ601
4)。そして、文章が終わったか否かを判別し(ステッ
プ6015)、終わった場合は、処理を終了し、終わっ
ていない場合は、ステップ6012に戻って処理を繰り
返す。
【0036】図13は、要約処理部6におけるパラメー
タ判定処理2の流れ図を示した図である。パラメータ判
定処理2の処理内容は、パラメータ判定処理1と似てい
るが、ステップ6023で、重みを加算する対象となる
単語が、文頭から条件を満たした対象単語までの間の単
語である点が異なる。
【0037】図14は、要約処理部6におけるパラメー
タ判定処理3の流れ図を示した図である。パラメータ判
定処理3の処理内容は、パラメータ判定処理1と似てい
るが、ステップ6033で、重みを加算する対象となる
単語が、その条件を満たした単語(対象単語)だけであ
る点が異なる。また、ステップ6034では、ポインタ
が文単位ではなく、単語単位で移動する。
【0038】図15は、要約処理部6におけるパラメー
タ判定処理4の流れ図を示した図である。パラメータ判
定処理4の処理内容は、パラメータ判定処理3と似てい
るが、ステップ6043で、重みを加算する対象となる
単語が、その条件を満たした単語から閉じ括弧までであ
る点が異なる。
【0039】図16は、図6の原文章に対する重み配分
を示した図である。ステップ602で冒頭文パラメータ
に関する条件1211を満たす部分をチェックする。条
件1211は、「文番号==1」が条件なので、ステッ
プ6013により、該当する単語に重み8(図9の11
01による)を付与すると1301のようになる。空白
部分は0である。
【0040】ステップ603で段落冒頭文パラメータに
関する条件1212を満たす部分をチェックする。条件
1212は、「単語No==1」かつ「品詞==スペー
ス」が条件なので、ステップ6013により、該当する
単語に重み0(図9の1102による)を付与する(1
302)。
【0041】ステップ604でキーワードパラメータに
関する条件1213を満たす部分をチェックする。条件
1213は、「語幹==$キーワード」が条件である。
記号$により変数「キーワード」を展開する。本実施例
では、頻度3以上の名詞をキーワードとみなすとする
と、図8の単語テーブルの語幹1004を参照すること
により、キーワードを「海洋」「投棄」「ゴミ」「規
制」とすることができる。よって、条件は、「語幹==
「海洋」or「投棄」or「ゴミ」or「規制」」となる。ス
テップ6013により、該当する単語に重み2(図9の
1103による)を付与すると1303のようになる。
この例では、すべての文がキーワードを含むので、すべ
ての単語に重みが付与されている。
【0042】ステップ605で例示文パラメータに関す
る条件1214を満たす部分をチェックする。条件12
14は、「見出し==”例えば”」が条件なので、ステ
ップ6013により、該当する単語に重み(−16)
(図9の1104による)を付与すると1304のよう
になる。この例では、この条件を満たす文はない。
【0043】ステップ606で主張文パラメータに関す
る条件1215を満たす部分をチェックする。条件12
15は、「語幹==”そう”」かつ「その直前の単語の
活用形==連用」が条件なので、ステップ6013によ
り、該当する単語に重み2(図9の1105による)を
付与すると1305のようになる。この例では、”なり
そう”の部分がこの条件を満たすので、この文を構成す
る単語に重みを付与する。 ステップ607で前提部分
パラメータに関する条件1216あるいは1217を満
たす部分をチェックする。条件1216は、「見出し=
=”による”」かつ「その直後の単語の見出し==”
と”」かつ「その直後の単語の見出し==”、”」が条
件であり、条件1217は、「活用形==連用」かつ
「直後の単語の語幹==”い”」かつ「その直後の単語
の見出し==”ます”」かつ「その活用形==終止」が
条件であるので、ステップ6023により、該当する単
語に重み(−8)(図9の1106による)を付与する
と1306のようになる。
【0044】ステップ608で冗長表現パラメータに関
する条件1218あるいは条件1219あるいは122
0を満たす部分をチェックする。条件1218は、「品
詞==副詞」が条件であり、条件1219は、「品詞=
=接続詞」が条件であり、条件1220は、「品詞==
形容動詞」かつ「活用形==連用」が条件であるので、
ステップ6033により、該当する単語に重み(−1
0)(図9の1107による)を付与すると1307の
ようになる。この例では、形容動詞の連用形”大幅に”
が条件を満たしている。
【0045】ステップ609で括弧パラメータに関する
条件1221を満たす部分をチェックする。条件122
1は、「見出し==”(”」が条件であるので、ステッ
プ6043により、該当する単語に重み(−8)(図9
の1108による)を付与すると1308のようにな
る。この例では、括弧は存在しない。
【0046】以上の重みを付与した結果、各単語は図1
6の重要度1010を持つことになる。最後にステップ
610により、要約文を抽出する。図3の指定であると
きには、要約文字数算出部2により、要約文字数(AN
UM)が90文字と算出されるので、重要度の高い順に
90文字に最も近くなるように単語を抽出する。図16
において、重要度が4以上の単語の文字数が92文字で
あり、最も近いので、重要度4以上の単語からなる文を
要約文として抽出する。図17はその要約文を示した図
である。
【0047】一方、図4の指定であるときには、要約文
字数(ANUM)が149字と算出される。重要度が2
以上の単語の文字数が149字であり、最も近いので、
重要度2以上の単語からなる文を要約文として抽出す
る。図18はその要約文を示した図である。
【0048】要約処理部6で作成した要約文を音声合成
処理部8でアクセント等の音声情報を付加し、音声合成
装置によって合成音声波形に変換して出力する。合成音
声の出力速度が指定されている場合、すなわち、図5の
ステップ202またはステップ204を満たしている場
合には、その出力速度で出力する。ステップ206を満
たしている場合には、VTとVARとの積により出力速
度が求まる。ステップ208およびステップ210を満
たしている場合には、出力速度は指定されていないの
で、予め指定した標準速度(デフォルトの速度)を出力
速度とする。
【0049】なお、ここでいう出力速度は、単位時間に
出力される日本語文字列の文字数であってもよいし、日
本語文字列をひらがなに展開したときのひらがな文字数
であってもよいし、日本語文字列を音節に展開したとき
の音節数であってもよい。音声辞書には、各日本語に対
応する音節情報を含んでおり、その単語が何音節からな
るかに関する情報を格納しているので、その数を計算す
ることにより実現できる。音節数、ひらがな数、日本語
文字列数の順で、実際の放映時間との時間的ずれは小さ
くなる。日本語文字列を入力とした音声合成技術に関し
ては、すでに公知であるので、ここでは言及しない。
【0050】このように、本実施例によれば、出力速
度、出力時間といった出力要求に応じて文章を適切に加
工(要約)し、出力することができる。これによって、
同じ内容の文章をいろいろな速度、時間で出力すること
が可能となり、視聴覚障害者や高齢者の読み聴きしやす
い速度でニュース等を放映することができる。また、利
用者が要約の方法(どの部分を抽出し、どの部分を削除
するか)を指定することができ、さらに、抽出あるいは
削除の条件を要約辞書に定義できるので、利用者の好み
や利用環境に応じた要約文章を作成できる。
【0051】
【発明の効果】本発明によれば、文章の出力速度、出力
時間に関する制約を入力すると自動的に加工すべき文字
数を算出し、原文章を加工し、出力するので、文字数の
計算をしなくて済む。また、本発明によれば、実際の出
力との時間的ずれを少なくしつつ、出力速度を遅くして
出力することができるので、高齢者や視聴覚障害者がリ
アルタイムにかつ、快適に聴いたり読んだりできる。さ
らに、本発明によれば、利用者の意図や利用環境を反映
した要約文を作成することができる。
【図面の簡単な説明】
【図1】本実施例の概要を示した図である。
【図2】本実施例のハードウェア構成の概要を示した図
である。
【図3】本実施例における出力方法に関する情報の設定
の一例を示した構成図である。
【図4】本実施例における出力方法に関する情報の設定
の他の一例を示した構成図である。
【図5】本実施例の要約文字数算出部の流れ図である。
【図6】本実施例で用いる原文章の構成図である。
【図7】本実施例で用いる原文章の自然言語解析の結果
を示した図である。
【図8】本実施例の自然言語解析部の解析結果の構成の
一部を示した図である。
【図9】本実施例で用いるパラメータの構成例である。
【図10】本実施例における要約用辞書の構成を示した
図である。
【図11】本実施例の要約処理部の流れ図である。
【図12】本実施例の要約処理部におけるパラメータ判
定処理1の流れ図である。
【図13】本実施例の要約処理部におけるパラメータ判
定処理2の流れ図である。
【図14】本実施例の要約処理部におけるパラメータ判
定処理3の流れ図である。
【図15】本実施例の要約処理部におけるパラメータ判
定処理4の流れ図である。
【図16】図6の原文章に対する重み配分の一部を示し
た構成図である。
【図17】図3の指定により要約処理を施した結果を示
した図である。
【図18】図4の指定により要約処理を施した結果を示
した図である。
【符号の説明】
1…出力情報や原文章を入力し、また、要約文を出力す
る入出力部、2…出力情報および原文章から要約文字数
を算出する要約文字数算出部、3…原文章を自然言語解
析する自然言語解析部、4…各単語の形態素情報を格納
した単語辞書、5…文法に関するルールを格納した文法
辞書、6…利用者のパラメータ設定等に応じて要約文を
作成する要約処理部、7…各パラメータを適用するため
の条件を記述した要約用辞書、8…要約文を合成音声に
変換する音声合成処理部、9…音声情報を格納した音声
辞書。

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】原文章を入力する入力手段と、 前記入力された原文章を自然言語解析する自然言語解析
    手段と、 前記自然言語解析結果に基づいて前記原文章を加工する
    加工処理手段と、 前記加工文章を出力する出力手段とを備えた文章加工装
    置において、 前記入力手段が前記加工文章の出力速度を入力し、 前記入力手段が前記加工文章の出力時間を入力し、 前記入力された加工文章出力速度および前記入力された
    加工文章出力時間および前記原文章の文字数から前記加
    工文章の文字数を算出する加工文字数算出手段と、 前記文字数に基づいて前記原文章を加工する加工処理手
    段とを備えたことを特徴とする文章加工装置。
  2. 【請求項2】原文章を入力する入力手段と、 前記入力された原文章を自然言語解析する自然言語解析
    手段と、 前記自然言語解析結果に基づいて前記原文章を加工する
    加工処理手段と、 前記加工文章を出力する出力手段とを備えた文章加工装
    置において、 前記入力手段が前記原文章の出力時間を入力し、 前記入力手段が前記加工文章の出力時間を入力し、 前記入力された原文章出力時間および前記入力された加
    工文章出力時間および前記原文章の文字数から前記加工
    文章の文字数を算出する加工文字数算出手段と、 前記
    文字数に基づいて前記原文章を加工する加工処理手段と
    を備えたことを特徴とする文章加工装置。
  3. 【請求項3】原文章を入力する入力手段と、 前記入力された原文章を自然言語解析する自然言語解析
    手段と、 前記自然言語解析結果に基づいて前記原文章を加工する
    加工処理手段と、 前記加工文章を出力する出力手段とを備えた文章加工装
    置において、 前記入力手段が前記原文章の出力速度を入力し、 前記入力手段が前記加工文章の出力速度を入力し、 前記入力された原文章出力速度および前記入力された加
    工文章出力速度および前記原文章の文字数から前記加工
    文章の文字数を算出する加工文字数算出手段と、 前記
    文字数に基づいて前記原文章を加工する加工処理手段と
    を備えたことを特徴とする文章加工装置。
  4. 【請求項4】原文章を入力する入力手段と、 前記入力された原文章を自然言語解析する自然言語解析
    手段と、 前記自然言語解析結果に基づいて前記原文章を加工する
    加工処理手段と、 前記加工文章を出力する出力手段とを備えた文章加工装
    置において、 前記入力手段が前記原文章の出力時間を入力し、 前記入力手段が前記原文章出力時間に対する前記加工文
    章の相対出力時間を入力し、 前記入力された原文章出力時間および前記入力された加
    工文章相対出力時間および前記原文章の文字数から前記
    加工文章の文字数を算出する加工文字数算出手段と、 前記文字数に基づいて前記原文章を加工する加工処理手
    段とを備えたことを特徴とする文章加工装置。
  5. 【請求項5】原文章を入力する入力手段と、 前記入力された原文章を自然言語解析する自然言語解析
    手段と、 前記自然言語解析結果に基づいて前記原文章を加工する
    原文章加工手段と、 前記加工文章を出力する出力手段とを備えた文章加工装
    置において、 前記入力手段が前記原文章の出力速度を入力し、 前記入力手段が前記原文章出力速度に対する前記加工文
    章の相対出力速度を入力し、 前記入力された原文章出力速度および前記入力された加
    工文章相対出力速度および前記原文章の文字数から前記
    加工文章の文字数を算出する加工文字数算出手段と、 前記文字数に基づいて前記原文章を加工する加工処理手
    段とを備えたことを特徴とする文章加工装置。
  6. 【請求項6】請求項1から請求項5までに記載の文章加
    工装置における加工処理方法であって、前記原文章から
    抽出あるいは削除する部分を規定するパラメータを一種
    類以上備え、前記パラメータに対する利用者による指定
    に基づいて前記原文章を加工することを特徴とする文章
    加工方法。
  7. 【請求項7】請求項6記載の文章加工方法において、前
    記パラメータは当該パラメータを満たす部分のみを加工
    文章として抽出する選択肢と、当該パラメータを満たす
    部分を抽出する選択肢と、当該パラメータを満たす部分
    を削除する選択肢と、当該パラメータを適用しない選択
    肢を含むことを特徴とする文章加工方法。
  8. 【請求項8】請求項1から請求項5までに記載の文章加
    工装置において、前記加工処理手段は、前記原文章から
    抽出あるいは削除する語句を規定する一種類以上のパラ
    メータと、利用者からの前記選択肢に対する指定に基づ
    いて前記原文章を加工する手段とからなることを特徴と
    する文章加工装置。
  9. 【請求項9】請求項8記載の文章加工装置において、前
    記パラメータは当該パラメータを満たす部分のみを加工
    文章として抽出する選択肢と、当該パラメータを満たす
    部分を抽出する選択肢と、当該パラメータを満たす部分
    を削除する選択肢と、当該パラメータを適用しない選択
    肢を含むことを特徴とする文章加工装置。
JP5119541A 1993-05-21 1993-05-21 文章加工装置 Pending JPH06332893A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5119541A JPH06332893A (ja) 1993-05-21 1993-05-21 文章加工装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5119541A JPH06332893A (ja) 1993-05-21 1993-05-21 文章加工装置

Publications (1)

Publication Number Publication Date
JPH06332893A true JPH06332893A (ja) 1994-12-02

Family

ID=14763851

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5119541A Pending JPH06332893A (ja) 1993-05-21 1993-05-21 文章加工装置

Country Status (1)

Country Link
JP (1) JPH06332893A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08340519A (ja) * 1995-06-13 1996-12-24 Matsushita Electric Ind Co Ltd 情報抽出装置及び情報抽出機能付き文字放送受信装置
JPH1039846A (ja) * 1996-07-19 1998-02-13 Nippon Telegr & Teleph Corp <Ntt> マルチメディア情報提示装置および蓄積装置
JPH10207891A (ja) * 1997-01-17 1998-08-07 Fujitsu Ltd 文書要約装置およびその方法
JPH1125091A (ja) * 1997-07-09 1999-01-29 Just Syst Corp 文書要約支援装置およびその装置としてコンピュータを機能させるためのコンピュータ読み取り可能な記録媒体
JPH11167398A (ja) * 1997-12-04 1999-06-22 Mitsubishi Electric Corp 音声合成装置
JPH11259521A (ja) * 1998-03-13 1999-09-24 Fujitsu Ltd 文書理解支援装置、要約文生成方法、並びに文書理解支援プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000003126A (ja) * 1998-03-23 2000-01-07 Xerox Corp 音声部を使用するテキスト要約方法
JP2006099428A (ja) * 2004-09-29 2006-04-13 Toshiba Corp 文書要約作成システム、方法、及びプログラム
JP2007220093A (ja) * 2006-01-13 2007-08-30 Ricoh Co Ltd ナビゲーションパスの計算方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08340519A (ja) * 1995-06-13 1996-12-24 Matsushita Electric Ind Co Ltd 情報抽出装置及び情報抽出機能付き文字放送受信装置
JPH1039846A (ja) * 1996-07-19 1998-02-13 Nippon Telegr & Teleph Corp <Ntt> マルチメディア情報提示装置および蓄積装置
JPH10207891A (ja) * 1997-01-17 1998-08-07 Fujitsu Ltd 文書要約装置およびその方法
JPH1125091A (ja) * 1997-07-09 1999-01-29 Just Syst Corp 文書要約支援装置およびその装置としてコンピュータを機能させるためのコンピュータ読み取り可能な記録媒体
JPH11167398A (ja) * 1997-12-04 1999-06-22 Mitsubishi Electric Corp 音声合成装置
JPH11259521A (ja) * 1998-03-13 1999-09-24 Fujitsu Ltd 文書理解支援装置、要約文生成方法、並びに文書理解支援プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000003126A (ja) * 1998-03-23 2000-01-07 Xerox Corp 音声部を使用するテキスト要約方法
JP2006099428A (ja) * 2004-09-29 2006-04-13 Toshiba Corp 文書要約作成システム、方法、及びプログラム
JP2007220093A (ja) * 2006-01-13 2007-08-30 Ricoh Co Ltd ナビゲーションパスの計算方法

Similar Documents

Publication Publication Date Title
EP1086450B1 (en) Intelligent text-to-speech synthesis
Copestake Augmented and alternative NLP techniques for augmentative and alternative communication
EP1482414B1 (en) Translating method for emphasised words
JP2008522332A (ja) 自動的に文書を拡充するシステムおよび方法
JPS6140673A (ja) 外国語作文用翻訳方法、および翻訳機
JPH06332893A (ja) 文章加工装置
Carlson et al. Linguistic processing in the KTH multi-lingual text-to-speech system
WO2009107441A1 (ja) 音声合成装置、テキスト生成装置およびその方法並びにプログラム
CN113360004A (zh) 输入法候选词推荐方法及装置
GB2378877A (en) Prosodic boundary markup mechanism
JP3009636B2 (ja) 音声言語解析装置
JPH0682376B2 (ja) 感情情報抽出装置
CN112101005B (zh) 一种快速表达力测试题目生成和动态调整方法
JP2001060194A (ja) 企画支援装置、企画支援方法および企画支援プログラムを格納したコンピュータ読取り可能な記録媒体
JP4033093B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
JP3085394B2 (ja) 複数文翻訳における訳語選択方法およびこれを用いた機械翻訳システム
JP2004151527A (ja) 音声合成装置、スタイル判定装置、音声合成方法、スタイル判定方法、およびプログラム
JPH02297157A (ja) 文章要約装置
JP2003044072A (ja) 音声読み上げ設定装置、音声読み上げ装置、音声読み上げ設定方法、音声読み上げ設定プログラム及び記録媒体
JP2001282815A (ja) 要約読み上げ装置
JPH0561902A (ja) 機械翻訳システム
JP2023150605A (ja) 情報処理装置及び情報処理方法
JPH11272673A (ja) 文書処理方法および文書処理装置ならびに文書処理のためのコンピュータプログラムを記録した記録媒体
JP3267168B2 (ja) 自然言語変換システム
JP2021179673A (ja) 文生成装置、文生成方法および文生成プログラム