JPH04199421A - 文書読上げ装置 - Google Patents

文書読上げ装置

Info

Publication number
JPH04199421A
JPH04199421A JP2333072A JP33307290A JPH04199421A JP H04199421 A JPH04199421 A JP H04199421A JP 2333072 A JP2333072 A JP 2333072A JP 33307290 A JP33307290 A JP 33307290A JP H04199421 A JPH04199421 A JP H04199421A
Authority
JP
Japan
Prior art keywords
document
document data
data
voice
aloud
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2333072A
Other languages
English (en)
Inventor
Hiromi Saito
斉藤 裕美
Kenichiro Kobayashi
賢一郎 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba AVE Co Ltd
Original Assignee
Toshiba Corp
Toshiba AVE Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba AVE Co Ltd filed Critical Toshiba Corp
Priority to JP2333072A priority Critical patent/JPH04199421A/ja
Publication of JPH04199421A publication Critical patent/JPH04199421A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は情報処理装置上で作成された文書データを効果
的に音声出力することのできる文書読上げ装置に関する
(従来の技術) 近時、情報処理機器の発展に伴い、ワードプロセッサ機
能を利用して種々の文書をテキストデータの形式で文書
作成する二とか盛んに行われている。この種の文書デー
タは、所定の情報処理機器にて取扱い可能な文字コード
の列として作成されるものであり、例えばプリンタを介
して印字出力されたり、所定のデイスプレィに表示され
てそのモニタリングに供される。
ところで最近、優れたマンマシン・インターフェースを
実現する手法として、音声合成の技術か種々開発されて
いる。この音声合成の技術は、例えば文字コート列とし
て与えられる文書データを、単語や文節等を単位として
所定の規則に基づいて音声合成して出力するものである
そこでこのような音声合成の技術を利用し、前述した如
く所定の情報処理機器上で作成された文書データを音声
合成して出力することて、所謂文書の読上げを行うこと
が試みられている。このような文書の読上げ装置によれ
ば、例えば目の不自由な人に対して、点字に変わる文書
情報の提供手段を実現することかできる等の種々の利点
かある。
ところが従来−船釣な文書読上げ装置は、文字コード列
で示される文書データを言語的に解析し、その解析結果
に従って音声データを生成して音声合成しているたけで
ある。この為、例えば文書データに強調表示等の属性が
付されていても、これを強調して音声合成することがで
きないと云う不具合かあった。
またニュースのアナウンスや朗読を行うような場合、そ
の文書の読上げを一定の時間内に行うことか要求される
ことか多々ある。しかし文書データに基づいて上述した
ように音声合成していくたけでは、その読上げか所定の
時間内に終了するか否かか分からないことか多くあると
云う不具合かある。
(発明が解決しようとする課題) このように従来にあっては、単に文字コード列にて示さ
れる文書データに従って音声を合成出力しているだけな
ので、仮にその文字コード列に強調表現を示す属性情報
が付されていても、これを通常の文字コード列と同様に
音声変換しているたけなので、合成されて出力される音
声か、所謂棒読みになり易かった。しかも予め指定され
た時間内に文書データを読上げることも非常に困難であ
ると云う問題があった。
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、予め指定された時間内に文書デ
ータを自然性良く、正確に読上げるで音声出力すること
のできる文書読上げ装置を提供することにある。
[発明の構成] (課題を解決するための手段) 本発明に係る文書読上げ装置は、所定の情報処理装置上
で処理可能な形式で表現された文書データを言語的に解
析し、この解析結果に従って前記文書データから生成さ
れる音声データに基づいて音声を合成出力する手段を備
え、 予め指定された文書データの読上げ時間と、文書データ
中の休みの長さ、および上記文書データの総拍数とに従
って与信当り読上げ単位時間を求めて音声合成による文
書データの読上げ速度を制御する手段を設けたことを特
徴とするものである。
(作 用) 本発明によれば、予め指定された文書データの読上げ時
間に従い、その文書データ中における休みの長さと文書
データの総拍数とに従って与信当り読上げ単位時間を求
め、この単位時間に従って音声合成による文書データの
読上げ速度を制御するので、前述した如く指定された時
間内に、その時間を有効に活かして文書データを自然性
良く、適切な発話速度で音声合成出力することか可能と
なる。
(実施例) 以下、図面を参照して本発明の一実施例に係る文書読上
げ装置について説明する。
第1図は実施例装置の概略構成図であり、第2図は実施
例装置の全体的な処理の流れを示す図である。
第1図において文書データメモリlは、所定の情報処理
機器(計算機)により取扱い処理可能な形式で作成され
た複数の文書データを格納するものである。これらの文
書データはワードプロセッサ等の文書作成装置にて作成
されたり、或いはOCR等により読み込まれて文字コー
ド変換された情報等からなる。
制御装置2は、例えばキーボードからなる入力装置3か
らの指示を受けて文書の読上げ処理を起動し、前記入力
装置3から指示された文書のデータを前記文書データメ
モリlから読み出す(ステップa)。このとき、どのよ
うにして文書データを読上げるかを示す各種の制御情報
か前記人力装置3から指示入力される(ステップb)。
このような制御情報の入力や前記文書の指定は、例えば
表示装置4に表示されているコマンドを手掛かりとして
行うようにすることも可能である。
しかして上述した如く入力された制御情報は設定バッフ
ァ5に格納される。この状態で前記制御装置2は前記文
書データメモリ1から選択的に読み出した文書データを
文書解析部6に与える。すると文書解析部6は、単語辞
書メモリ7に予め格納されている各種の単語についての
形態情報や読みの情報、アクセント位置等に従って前記
文書データを形態的・構文的・意味的に解析処理する(
ステップC)。そしてその解析結果に従い、例えば前記
文書データを単語単位に切り分け、各単語についての情
報をまとめて解析結果バッファ8に格納する。この際、
文書解析部6は、文書データ中に強調文字や下線等の属
性情報が付加されている場合には、その情報を該当する
単語に付属させて前記解析結果メモリ8に格納する。
このようにして文書データに対する解析処理か終了する
と、次に前記制御装置2は音声データ生成部9を起動す
る。するとこの音声データ生成部9は音声データ生成規
則メモリ10に格納されている生成規則に従い、前記文
書データから音声合成の為の音声データを生成し、これ
を音声データメモリ11に格納する(ステップd)。こ
の音声データの生成に際し、単語に前述した強調文字や
下線等の属性情報か付加されている場合には、音声デー
タ生成部9は、前述した設定バッファ5に設定されてい
る条件に従い、その強調文字部分をとのように強調して
音声合成するかの情報を付加する(ステップe、f、g
)。
以上のようにして音声データか作成された後、音声合成
装置12が起動され、前記設定バッファ5に格納されて
いる音声合成の設定条件の情報が音声合成装置12に与
えられる(ステップh)。この際、設定バッファ5に読
上げについての時間情報か設定されている場合には読上
げ速度設定部3が起動され、どの程度の速度で音声合成
による前記音声データの出力を行うかの演算がなされる
(ステップi、j)。この演算は、基本的には文書デー
タの量と指定された読上げ時間とから、その読上げ速度
を算出する二とによってなされる。
このように読上げ速度か算出される場合には、音声合成
装置12はその算出された読上げ速度にて音声合成処理
を実行し、前記音声データを音声変換して音声出力器(
スピーカ) 14から出力する。
このような音声データの合成出力に際して、表示データ
作成部15は前記文書データに基ついて、例えば出力音
声の区切りゃアクセント位置を示す情報を付加してなる
表示データを作成し、これを表示データメモ1JIBに
格納する(ステップk)。
そしてこの表示データメモリ16に格納されに表示デー
タを、前記音声データの合成出力に連動して前記表示装
置4に表示する(ステップg)。
次に上述した如く構成された本装置の具体的な処理動作
について、第3図に示すようにr仏は失且、本を読みま
した。」 なる文書データを音声合成して読上げる場合を例に説明
する。この例では単語[今日]について下線が付され、
強調すべき単語である旨の情報が与えられている。
このの場合、例えば前記表示装置4に表示されている指
示コマンドに従い、前記入力装置3がら文書データに対
する読上げの条件が設定入力される。この読上げ条件は
、例えば読上げ速度、音質。
高さ1強さ、読上げ終了の時間1強調文字の特殊読みの
有無、特種読みの変更点、読上げの有無。
休みの長さ等の項目からなり、例えば第4図に示すよう
な形式で設定バッファ5に設定登録される。
一方、指定された文書データは文書解析部6に与えられ
る。文書解析部6は、例えば第5図に示すような、見出
しに対して品詞、読み、アクセント型、意味等を記述し
た単語辞書を参照し、上記文書データを形態的、ti構
文的意味的に解析する。
そして上記文書データ単語毎に分割し、その解析結果を
第6図に示すようなデータ構造として前記解析結果バッ
ファ8に格納する。
このとき、文書解析部6は文書データ中の拡大文字や反
転文字、下線が付された文字等の強調文字を検出し、前
記解析結果バッファ8に対してその文字か強調表現され
る旨を示す属性を記述する。
この強調文字の属性は、予め定められた制御コードかそ
の対象文字の直前に挿入される等して表現される。
このような文書データの解析か終了すると、次に文書デ
ータ生成部9が起動される。文書データ生成部9は、例
えば第7図に示すような音声デ−夕の生成規則を参照し
て前記文書データから音声データを生成するもので、こ
の音声データは第8図に示すような形式として求められ
る。即ち、第7図に示す音声データの生成規則は、[三
段動詞でアクセント型かOてない場合であって、その活
用形が未然形である場合、アクセント型を0として音声
データを生成する]と云う規則を示している。
音声データはこのような規則を参照しながら第8図に示
すような 「速度;音質;高さ:読み上げ文字列:]と云うフォー
マットで作成される。上述した「私は今日、本を読みま
した。」と云う文書データの場合、強調読上げの有無に
応じて、第8図に示すようにその音声データか異なって
生成される。尚、第8図において[−]アクセントの位
置を示し、[・]は休みの位置を示している。
しかして解析結果バッファ8に格納されているデータに
強調文字を表す属性がある場合には、例えばその単語の
区切りに速度の変更や音質の変更、強さの変更を指示す
る為の制御データか挿入される。このような制御データ
によって音声合成の条件か、その時点で変更される。尚
、制御データの変更がない場合には、最初に設定された
制御データに従ってそのまま音声合成か進められること
になる。
その後、前述した音声合成装置12か起動される。
二のとき読上げ速度設定部13ては、前述した如く設定
されている読上げ終了時間に従い、前記文書データの読
上げ速度を算出する。具体的には先ず前記音声データか
ら文章中の総拍数を算出し、更にその文書中の休みの数
を考慮して与信に要する音声合成の単位時間を算出し、
この単位時間に基づいて音声合成の発話速度を計算する
二こでの拍とは発音の最小単位であり、例えば[学校(
かつこう)]なる単語は4拍、[社会(しゃかい)]な
る単語は3拍であることを示している。従って前述した
文書の場合、全体で14拍となる。
しかして読上げ速度設定部13は、例えば1500拍の
文書に対してその読上げ時間か5分として設定され、上
記文書に出現する100個の休みの長さか10ミリ秒と
して定められている場合には、その文章を読上げる速度
を、 ([ioX 5−(100X O,01) )÷150
0−0.199として計算する。そして1拍当り0.1
99秒の時間で音声合成すれば良いことを、その読上げ
の速度制御情報として求める。
このようにして計算される発話速度に従い、前記音声合
成装置12は前記音声データを所定の合成規則に従い、
前述した各種の制御データ(音質。
高さ1強さ等)に従って音声合成する。
この結果、強調文字がない場合には、最初に設定された
制御データに従ってそのまま音声合成がなされ、強調文
字の指定がある場合には、その該当箇所で発話の速度や
音質、高さ1強さ等の変更かなされて音声合成か行われ
る。
そして二のようにして音声合成出力による文書データの
読上げが行われるとき、第9図に示すようにその文書デ
ータの音声記号化した表示か行われる。この音声記号化
による表示は、その読みに対してアクセント記号を付加
したり、第9図(b)に示すように音声の出力タイミン
グに合わせてその文字の表示位置をシフトしたり、音声
データの出力に対応させて該当文字を着色3反転、下線
付加等により識別表示しながら行われる。
尚、前記設定バッファ5に読上げの有無の情報として[
無]か設定されている場合には、上述した第9図に示す
ような表示だけを行う。そしてこのような表示の情報に
基づいてオペレータによる読上げを行えば、前述した如
く設定した時間で正しいアクセントでの前記文書データ
の読上げ、つまり朗読を行う二とか可能となる。
このように本装置によれば、文書データを単純に音声合
成するのではなく、文書データに付加された属性情報に
従って強調すべき単語等を、その音声出力の条件を変え
ることによって強調することかできる。この結果、文書
内容に応じて適宜出力音声を強調した音声出力を得るこ
とが可能となり、文書データ内容が持つ雰囲気を反映し
た内容表現の豊かな自然性の高い文書音声を得ることか
可能となる。
尚、本発明は上述した実施例に限定されるものではない
。文書データの強調表現の仕方としは、発話速度をえる
ことのみならず、音声の高さや音質を変えても良く、こ
れらを適宜組み合わせることにより、音声出力の雰囲気
を変更することにより実現しても良い。また文書データ
の解析の仕方や音声データの生成の手法も適宜変更可能
である。
その他、本発明はその要旨を逸脱しない範囲で種々変形
して実施することができる。
[発明の構成コ 以上説明したように本発明によれば、予め設定される文
書読上げ時間に従って、文書データの総拍数、および文
書中の休みの長さに基づいて1拍当りの音声合成に要す
る単位時間を算出して文書データの音声合成出力を制御
するので、文書データを自然性良く、決められた時間内
で読上げることかできる等、種々の文書出力に実用上多
大なる効果が奏せられる。
【図面の簡単な説明】
図は本発明の一実施例に係る文書読上げ装置について示
すもので、第1図は実施例装置の概略構成図、第2図は
実施例装置の概略的な処理手続きの流れを示す図、第3
図は文書データの例を示す図、第4図は音声出力の設定
条件を示す図である。 また第5図は文書解析に用いられる単語辞書の構成例を
示す図、第6図は文書データの解析結果を示す図、第7
図は音冷データの変換規則の例を示す図、第8図は音声
データの変換結果の例を示す図、第9図は音声データの
表示例を示す図である。 ■・・・文書データメモリ、2・・・制御装置、3・・
人力装置、4・・・表示装置、5・・・設定バッファ、
6・・・文書解析部、7・・・単語辞書メモリ、8・・
・解析結果バッファ、9・・・音声データ生成部、10
・・・音声データ生成規則メモリ、11・・音声データ
メモリ、12・・・音声合成装置、13・・読上げ速度
設定部、14・・・表示データ作成部、15・・表示デ
ータメモリ。 第1図 第2図 第3図 第4図 第6図 第7図

Claims (1)

    【特許請求の範囲】
  1. 所定の情報処理装置上で処理可能な形式で表現された文
    書データを言語的に解析する手段と、この解析結果に従
    って前記文書データから音声データを生成する手段と、
    生成された音声データに基づいて音声を合成出力する手
    段と、予め指定された文書データの読上げ時間と文書中
    の休みの長さ、および前記文書データの総拍数とに基づ
    いて各拍に要する単位時間を算出して上記音声の合成出
    力による前記文書データの読上げ速度を制御する手段と
    を具備したことを特徴とする文書読上げ装置。
JP2333072A 1990-11-29 1990-11-29 文書読上げ装置 Pending JPH04199421A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2333072A JPH04199421A (ja) 1990-11-29 1990-11-29 文書読上げ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2333072A JPH04199421A (ja) 1990-11-29 1990-11-29 文書読上げ装置

Publications (1)

Publication Number Publication Date
JPH04199421A true JPH04199421A (ja) 1992-07-20

Family

ID=18261952

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2333072A Pending JPH04199421A (ja) 1990-11-29 1990-11-29 文書読上げ装置

Country Status (1)

Country Link
JP (1) JPH04199421A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR960042521A (ko) * 1995-05-31 1996-12-21 다까노 야스아끼 음성 합성 장치 및 낭독 시간 연산 장치
JP2000132179A (ja) * 1998-10-27 2000-05-12 Nippon Telegr & Teleph Corp <Ntt> 録音音声データベース話速均一化方法及び装置及び話速均一化プログラムを格納した記憶媒体
JP2016012315A (ja) * 2014-06-30 2016-01-21 シナノケンシ株式会社 テキストデータの分かち書き単位分割プログラム及び電子図書再生装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR960042521A (ko) * 1995-05-31 1996-12-21 다까노 야스아끼 음성 합성 장치 및 낭독 시간 연산 장치
JP2000132179A (ja) * 1998-10-27 2000-05-12 Nippon Telegr & Teleph Corp <Ntt> 録音音声データベース話速均一化方法及び装置及び話速均一化プログラムを格納した記憶媒体
JP2016012315A (ja) * 2014-06-30 2016-01-21 シナノケンシ株式会社 テキストデータの分かち書き単位分割プログラム及び電子図書再生装置

Similar Documents

Publication Publication Date Title
US6810378B2 (en) Method and apparatus for controlling a speech synthesis system to provide multiple styles of speech
US5615300A (en) Text-to-speech synthesis with controllable processing time and speech quality
US7010489B1 (en) Method for guiding text-to-speech output timing using speech recognition markers
WO2009021183A1 (en) System-effected text annotation for expressive prosody in speech synthesis and recognition
JP3616250B2 (ja) 合成音声メッセージ作成方法、その装置及びその方法を記録した記録媒体
JPH07181992A (ja) 文書読上げ装置及び方法
JPH04199421A (ja) 文書読上げ装置
van Rijnsoever A multilingual text-to-speech system
JPH04199420A (ja) 文書読上げ装置
JPH05134691A (ja) 音声合成方法および装置
JP2002123281A (ja) 音声合成装置
JPH03245192A (ja) 外国語単語の発音決定方法
JPH11296193A (ja) 音声合成装置
JP2966954B2 (ja) 文書読上げ指示装置
JPH0229797A (ja) テキスト音声変換装置
JP3308402B2 (ja) 音声出力装置
JP2888847B2 (ja) 文章読み上げ装置とその方法及び言語処理装置とその方法
JP3088211B2 (ja) 基本周波数パタン生成装置
JPH07134713A (ja) 音声合成装置
FalDessai Development of a Text to Speech System for Devanagari Konkani
JPH07140999A (ja) 音声合成装置及び音声合成方法
JPH02234198A (ja) テキスト音声合成システム
JPH01216399A (ja) 音声合成装置
JPH08328578A (ja) テキスト音声合成装置
JPH02137899A (ja) 規則合成装置の文字表示方法