JP2000172284A - 文書読み上げ装置および方法 - Google Patents

文書読み上げ装置および方法

Info

Publication number
JP2000172284A
JP2000172284A JP10346339A JP34633998A JP2000172284A JP 2000172284 A JP2000172284 A JP 2000172284A JP 10346339 A JP10346339 A JP 10346339A JP 34633998 A JP34633998 A JP 34633998A JP 2000172284 A JP2000172284 A JP 2000172284A
Authority
JP
Japan
Prior art keywords
speech synthesis
time
document
speech
voice synthetic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10346339A
Other languages
English (en)
Inventor
Tsuneto Tsushima
常人 對馬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP10346339A priority Critical patent/JP2000172284A/ja
Publication of JP2000172284A publication Critical patent/JP2000172284A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 従来の文書読み上げ装置では、文書の読み上
げ時間を総音節数に1音節当たりの平均所要時間を乗じ
て求めていたが、総ての音節で所要時間が一定というわ
けではないため、正確な読み上げ時間の算出がされてい
なかった。 【解決手段】 本発明では、生成された音声合成データ
のサイズからサンプリングデータサイズとサンプリング
周波数に基づいて文書の読み上げ時間を算出するように
構成することで、音声合成方式に依存せず正確な読み上
げ時間の算出を実現することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声合成システムに
おいて、生成された音声合成データの読み上げ時間を算
出して表示する文書読み上げ装置および方法に関するも
のである。
【0002】
【従来の技術】以下に、図4のブロック図を用いて従来
の文書読み上げ装置について説明する。
【0003】404の読み上げ時間算出手段は、401
の形態素解析手段で求められた文書の全音節数(使用す
る音声合成方式に依存する)に予め定められた1音節あ
たりの平均所要時間を乗じることで文書の読み上げ時間
を求めていた。
【0004】例えば、「あした」という文書の読み上げ
において、「あ」、「し」、「た」と3音節に分割する
音声合成方式を用いた場合には、音節数3に予め定めた
1音節あたりの平均所要時間xを乗じた3xという時間
を文書の読み上げ時間としていた。
【0005】
【発明が解決しようとする課題】しかしながら、文書を
音節に分けたときの音節数や引き続く音節の結合方法や
アクセント部分の加工方法などは一般に音声合成方式に
よって異なる。
【0006】例えば、「あした」という文書の読み上げ
を例にとると、ある音声合成方式では「あ」、「し」、
「た」の3音節に分割するが、別の音声合成方式では
「あし(ashi)」、「いた(ita)」の2音節に
分割される場合がある。
【0007】後者の音声合成方式では、第1音節「あし
(ashi)」の最後の母音部「i」と第2音節「いた
(ita)」の最初の母音部「i」が重なるように結合
する。
【0008】従って、予め定められた1音節あたりの平
均所要時間をyとし、重なり部分の読み上げ時間をzと
すると2y−zが読み上げ時間となる。
【0009】以上のように、従来の文書読み上げ装置で
算出される読み上げ時間は音声合成方式によって異な
る。
【0010】また、どの音声合成方式であっても、1音
節の読み上げ時間が全ての音節で一定ではなく、単純に
音節数に1音節あたりの平均所要時間を乗じる算出方法
では誤差が生じて正確な読み上げ時間を算出することが
できなかった。
【0011】
【課題を解決するための手段】上記課題を解決するため
に、本発明では、生成された音声合成データのサイズか
らサンプリングデータサイズとサンプリング周波数に基
づいて音声合成データの読み上げ時間を算出するように
構成することで、音声合成方式に依存しない正確な読み
上げ時間の算出方法を提供することができる。
【0012】
【発明の実施の形態】請求項1記載の文書読み上げ装置
は、文書に対応する音声合成データを生成する音声合成
手段と、生成された音声合成データのサイズとサンプリ
ングデータサイズとサンプリング周波数とから文書に対
する読み上げ時間を算出する読み上げ時間算出手段から
構成され、音声合成方式に依存しない正確な読み上げ時
間を計算することができる。
【0013】また、請求項2記載の文書読み上げ装置
は、請求項1記載の文書読み上げ装置において算出した
読み上げ時間を表示する読み上げ時間表示手段を設ける
ことでユーザーに読み上げ時間を予め通知することがで
きる。
【0014】(実施の形態1)以下に、本発明の一実施
の形態を図1、図2および図3を用いて説明する。
【0015】図1は、本実施の形態のシステム構成を示
すブロック図である。図1で、101は文書を音節に分
ける形態素解析手段であり、102は形態素解析手段1
01が分けた音節から音声合成データを生成する音声合
成データ生成手段であり、103は音声合成データ生成
手段102が生成した音声合成データを出力する音声出
力手段であり、104は音声合成データ生成手段102
が生成した音声合成データからサンプリングデータサイ
ズとサンプリング周波数に基づいて読み上げ時間を算出
する読み上げ時間算出手段であり、105は読み上げ時
間算出手段104が算出した読み上げ時間を表示する読
み上げ時間表示手段である。
【0016】以下に、図3に示した仕様の音声合成シス
テムにおいて、「こんにちは」という文書の読み上げ時
間を表示する処理フローを図2のフローチャートを用い
て説明する。
【0017】ステップ201で、「こんにちは」という
文書から音声合成データを生成する。
【0018】以下では、生成された音声合成データのサ
イズが72Kbyteとして説明する。
【0019】ステップ202で、音声合成データサイズ
(72Kbyte) をもとにサンプリングデータ処理
回数を以下の手順で算出する。
【0020】式(1)にサンプリングデータサイズと音
声合成データサイズの関係を示す。 1(回):2(byte)=a(回):72(Kbyte) … 式(1) 式(2)の計算によって、72Kbyteの音声合成デ
ータでは36864回のサンプリングデータ処理を要す
ることが分かる。
【0021】 a=(72×1024×1)/2=36864(回) … 式(2) ステップ203で、ステップ202で求めたサンプリン
グデータ処理回数をもとに読み上げ時間を以下の手順で
算出する。
【0022】式(3)に、サンプリング周波数と読み上
げ時間の関係を示す。 1(秒):12000(回)=b(秒):36864(回) … 式(3) 式(4)の計算によって、36864回のサンプリング
データ処理には3.072秒の時間を要することが分か
る。
【0023】 b=(36864×1)/12000=3.072(秒) … 式(4) ステップ204で、式(4)で算出された読み上げ時間
を読み上げ時間表示手段105に表示する。
【0024】
【発明の効果】以上詳述したように、本発明によれば、
生成された音声合成データのサイズからサンプリングデ
ータサイズとサンプリング周波数に基づいて音声合成デ
ータの読み上げ時間を算出することで、音声合成方式に
依存せず正確に文書の読み上げ時間を算出することがで
きる。
【図面の簡単な説明】
【図1】本発明の一実施の形態に係る文書読み上げ装置
のシステム構成を示すブロック図
【図2】本発明の一実施の形態における文書の読み上げ
時間を表示する処理の流れを示すフローチャート
【図3】本発明の一実施の形態における音声合成システ
ムの仕様を示す図
【図4】従来例に係る文書読み上げ装置のシステム構成
を示すブロック図
【符号の説明】
101 形態素解析手段 102 音声合成データ生成手段 103 音声出力手段 104 読み上げ時間算出手段 105 読み上げ時間表示手段 401 形態素解析手段 402 音声合成データ生成手段 403 音声出力手段 404 読み上げ時間算出手段 405 読み上げ時間表示手段

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】文書に対応する音声合成データを生成する
    音声合成手段と、前記音声合成手段により生成された音
    声合成データのサイズとサンプリングデータサイズとサ
    ンプリング周波数とから前記音声合成手段により生成さ
    れた音声合成データの読み上げ時間を算出する読み上げ
    時間算出手段を有する文書読み上げ装置。
  2. 【請求項2】算出する読み上げ時間算出手段が算出した
    読み上げ時間を表示する読み上げ時間表示手段を有する
    請求項1記載の文書読み上げ装置。
  3. 【請求項3】文書に対応する音声合成データを生成する
    音声合成手順と、前記音声合成手順により生成された音
    声合成データのサイズとサンプリングデータサイズとサ
    ンプリング周波数とから前記音声合成手順により生成さ
    れた音声合成データの読み上げ時間を算出する読み上げ
    時間算出手順から成る文書読み上げ方法。
  4. 【請求項4】算出する読み上げ時間算出手順が算出した
    読み上げ時間を表示する読み上げ時間表示手順を有する
    請求項3記載の文書読み上げ方法。
JP10346339A 1998-12-07 1998-12-07 文書読み上げ装置および方法 Pending JP2000172284A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10346339A JP2000172284A (ja) 1998-12-07 1998-12-07 文書読み上げ装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10346339A JP2000172284A (ja) 1998-12-07 1998-12-07 文書読み上げ装置および方法

Publications (1)

Publication Number Publication Date
JP2000172284A true JP2000172284A (ja) 2000-06-23

Family

ID=18382750

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10346339A Pending JP2000172284A (ja) 1998-12-07 1998-12-07 文書読み上げ装置および方法

Country Status (1)

Country Link
JP (1) JP2000172284A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1619587A1 (en) * 2003-04-30 2006-01-25 International Business Machines Corporation Content creation system, content creation method, computer-executable program for executing the content creation method, computer-readable recording medium containing the program, graphical user interface system, and display control method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1619587A1 (en) * 2003-04-30 2006-01-25 International Business Machines Corporation Content creation system, content creation method, computer-executable program for executing the content creation method, computer-readable recording medium containing the program, graphical user interface system, and display control method
EP1619587A4 (en) * 2003-04-30 2008-01-02 Ibm CONTENT CREATION SYSTEM, CONTENT CREATION METHOD, COMPUTER EXECUTABLE PROGRAM FOR EXECUTING THE CONTENT CREATION METHOD, COMPUTER READABLE RECORDING MEDIUM CONTAINING THE PROGRAM, GRAPHICAL USER INTERFACE SYSTEM, AND AFFICHA CONTROL METHOD

Similar Documents

Publication Publication Date Title
US8924216B2 (en) System and method for synchronizing sound and manually transcribed text
JPH09114495A (ja) ピッチ輪郭を決定するためのシステムおよび方法
JP5029168B2 (ja) 音声読み上げのための装置、プログラム及び方法
US20140244262A1 (en) Voice synthesizing method, voice synthesizing apparatus and computer-readable recording medium
JP3728173B2 (ja) 音声合成方法、装置および記憶媒体
JP2000172284A (ja) 文書読み上げ装置および方法
JP5518621B2 (ja) 音声合成装置およびコンピュータプログラム
JP2002525663A (ja) ディジタル音声処理装置及び方法
JP6197523B2 (ja) 音声合成装置、言語辞書修正方法及び言語辞書修正用コンピュータプログラム
JP2680643B2 (ja) 規則合成装置の文字表示方法
JPH08248993A (ja) 音韻時間長制御方法
JP2000310995A (ja) 音声合成方法及び音声合成装置、並びに音声合成装置を備えた電話機
JP2658109B2 (ja) 音声合成装置
JP2001265374A (ja) 音声合成装置及び記録媒体
JP2010224392A (ja) 発話補助装置、方法及びプログラム
JPH05210482A (ja) 発音辞書管理方法
JPH01216399A (ja) 音声合成装置
JP2573586B2 (ja) 規則型音声合成装置
JP2956936B2 (ja) 音声合成装置の発声速度制御回路
JP3303428B2 (ja) 音声合成装置のアクセント成分基本テーブルの作成方法
JPH06195094A (ja) 表音文字列表示方法及び音声合成装置
JP2601302B2 (ja) 音声合成装置におけるピッチ周波数生成装置
JPH08160983A (ja) 音声合成装置
JPH06131148A (ja) 音声合成装置
JP2624708B2 (ja) 音声合成装置