JPH08146994A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH08146994A
JPH08146994A JP6280694A JP28069494A JPH08146994A JP H08146994 A JPH08146994 A JP H08146994A JP 6280694 A JP6280694 A JP 6280694A JP 28069494 A JP28069494 A JP 28069494A JP H08146994 A JPH08146994 A JP H08146994A
Authority
JP
Japan
Prior art keywords
sentence
model
length
prosody
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6280694A
Other languages
English (en)
Other versions
JP2910587B2 (ja
Inventor
Kazuhiko Iwata
和彦 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP6280694A priority Critical patent/JP2910587B2/ja
Publication of JPH08146994A publication Critical patent/JPH08146994A/ja
Application granted granted Critical
Publication of JP2910587B2 publication Critical patent/JP2910587B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 どのような長さの文に対しても、その文に適
した自然な韻律パタンを生成することを可能にする。 【構成】 韻律生成部101は、文入力端子100を通
して、合成音声で読み上げるべき文を受け取る。文長算
出部104は、予め定めておいた単位によって受け取っ
た文の長さを算出し、切替スイッチ105に送る。韻律
生成モデル106−1〜106−nは、文の長さに応じ
て予め用意しておいた韻律パタンの生成モデルである。
切替スイッチ105は、文長算出部104が算出した文
の長さに基づいて、入力文の韻律パタンを生成するのに
適した韻律生成モデルを韻律生成モデル106−1〜1
06−nの中から選択し、選択した韻律生成モデルに入
力文を送る。韻律生成モデルは受け取った文に適した韻
律パタンを生成し、音声合成部102に送る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力された文のリズム
やイントネーションといった韻律パタンを生成し、音声
で読み上げる音声合成装置に関する。
【0002】
【従来の技術】入力された文に基づいて、継続時間長や
ピッチ周波数、振幅などの韻律のパタンを生成する音声
合成装置では、従来、それぞれの韻律パラメータ(継続
時間長、ピッチ周波数、振幅など)ごとにモデルを1つ
用意して、それぞれのパタンを生成していた。
【0003】例えば、従来の技術として、日本音響学会
平成5年度秋季研究発表会講演論文集2−8−13「パ
ソコン向けソフトウェア日本語テキスト音声合成」(文
献1)が知られている。その構成を図2に示す。
【0004】図2の音声合成装置では、まず、合成音声
で読み上げるべき入力文が、文入力端子100を通して
韻律生成部201に入力される。韻律生成部201に
は、韻律パタンを生成するための韻律生成モデル206
が、韻律の各要因(継続時間長、ピッチ周波数、振幅な
ど)ごとに1つ用意されている。したがって実際には、
韻律生成モデル206は、継続時間長生成モデル、ピッ
チ周波数パタン生成モデルなど、それぞれの要因ごとの
生成モデルに相当することになるが、以下では説明を簡
単にするために、それらを総称した韻律生成モデルとし
て説明を行う。韻律生成モデル206は、入力文を発声
するのに適した韻律パタンを生成し、音声合成部102
に送る。音声合成部102は、その韻律パタンに基づい
て合成音声を生成し、合成音声出力端子103に出力す
る。
【0005】
【発明が解決しようとする課題】しかしながら、合成す
べき文の長さによって韻律パタンの特徴は大きく異な
る。このため、上記した従来の音声合成装置のように、
あらゆる長さの文に対して、その韻律を1つのモデルで
生成しようとすると、そのモデルが文長を考慮した韻律
パタンを生成する仕組みを有している場合でも、必ずし
もどの長さの文に対しても十分に自然な韻律パタンを生
成できるとは限らないという問題点があった。
【0006】本発明は上記した問題点を解決するため、
どのような長さの文に対してもその文に適した自然な韻
律パタンを生成することを目的とする。
【0007】
【課題を解決するための手段】第1の発明の音声合成装
置は、合成音声で読み上げるべき入力文を入力する文入
力端子と、前記入力文の韻律パタンを生成する韻律生成
手段と、前記韻律パタンにしたがって音声を合成する音
声合成手段とを有する音声合成装置において、前記韻律
生成手段が、予め定めた単位に基づいて前記入力文の長
さを算出する文長算出手段と、文長に応じた複数の韻律
生成モデルと、前記複数の韻律生成モデルの中から前記
文長算出手段が算出した文長に応じて使用する韻律生成
モデルを選択する韻律生成モデル選択手段を有し、前記
韻律生成モデル選択手段が選択した韻律生成モデルによ
って前記入力文の韻律パタンを生成することを特徴とす
る第2の発明の音声合成装置は、第1の発明において、
文長算出手段が文節数を単位として文長を算出すること
を特徴とする。
【0008】第3の発明の音声合成装置は、第1の発明
において、文長算出手段がモーラ数を単位として文長を
算出することを特徴とする。
【0009】第4の発明の音声合成装置は、第1の発明
において、文長算出手段が文節数とモーラ数との組み合
わせによって文長を算出することを特徴とする。
【0010】
【作用】本発明ではまず、合成音声で読み上げるべき文
を受け取り、その文の長さを算出する。次に、その文の
長さに適した韻律パタンを生成することができるモデル
を、予め用意しておいた複数の韻律生成モデルの中から
選択する。ここで選択した韻律生成モデルを用いて、入
力文を合成音声で読み上げる際の韻律パタンを生成す
る。このことにより、どのような長さの入力文に対して
も、その長さに応じた適切な韻律パタンを生成すること
が可能となる。
【0011】
【実施例】本発明の第1の発明の一実施例について図面
を参照して説明する。
【0012】図1は、第1の発明による音声合成装置の
一実施例を示すブロック図である。
【0013】韻律生成部101は、文入力端子100を
通して、合成音声で読み上げるべき文を受け取る。ここ
で、文の情報の表現形式としては、単語の読みやアクセ
ント、文節の区切りなどが付与された発音記号文字列に
相当するものを想定している。その他、漢字かな混じり
文字列であっても構わないが、その場合は、文入力端子
100と韻律生成部101との間に漢字かな混じり文に
読みを与えるための解析部が必要となる。しかし、これ
は本発明が提供する技術の範囲を越えるので省略してあ
る。
【0014】韻律生成部101には、文の長さに応じて
用意された韻律生成モデル106−1〜106−nが用
意してある。これらの韻律生成モデル106−1〜10
6−nは、生成する韻律パタンが音素の継続時間長であ
れば継続時間長生成モデル、ピッチ周波数パタンであれ
ばピッチ周波数パタン生成モデル、に相当するわけであ
るが、説明を簡単にするために、ここではそれらを総称
した韻律生成モデルとして説明を行う。
【0015】韻律生成部101の内部では、受け取った
文が、まず文長算出部104に送られる。文長算出部1
04は、予め定めておいた単位(文節数、モーラ数な
ど)によって文の長さを算出し、切替スイッチ105に
送る。切替スイッチ105は、文長算出部104が算出
した文の長さに基づいて、入力文の韻律パタンを生成す
るのに適した韻律生成モデルを韻律生成モデル106−
1〜106−nの中から選択し、選択した韻律生成モデ
ルに入力文を送る。韻律生成モデルは受け取った文に適
した韻律パタンを生成し、音声合成部102に送る。
【0016】音声合成部102は、韻律生成部101が
生成した韻律パタンに基づいて合成音声を生成し、合成
音声出力端子103に出力する。
【0017】次に、第2の発明の一実施例を説明する。
第2の発明は、第1の発明の一実施例における韻律生成
モデル106−1〜106−nを文の文節数に応じて用
意し、文長算出部104が入力文の長さを文節数を単位
として算出する。
【0018】例えば、以下のような韻律生成モデルM1
〜M4を用意する。
【0019】モデルM1:1文節のみからなる文の韻律
パタンを生成するモデル モデルM2:2〜3文節からなる文の韻律パタンを生成
するモデル モデルM3:4〜9文節からなる文の韻律パタンを生成
するモデル モデルM4:10文節以上からなる文の韻律パタンを生
成するモデル 各モデルは、それぞれの文長に適した韻律パタンを生成
できるように設計しておく。そして、入力文の文節数を
算出し、その文長の文の韻律パタンを生成するのに適し
たモデルを選択する。例えば 文1:「今日はとても良い天気です。」 という4文節からなる文が入力された場合は、上記のモ
デルM3を使って韻律パタンを生成する。
【0020】さらに、第3の発明の一実施例を説明す
る。第3の発明は第1の発明の一実施例における韻律生
成モデル106−1〜106−nを文のモーラ数に応じ
て用意し、文長算出部104が入力文の長さをモーラ数
を単位として算出する。
【0021】例えば、 文2:「赤い花です。」 文3:「日本語テキスト音声合成装置のデモンストレー
ションです。」 といった同じ2文節からなる、2つの文を比較すると、
韻律パタンの特徴に大きな違いがあり、1つのモデルで
表現することは困難である。そこで、韻律生成モデルと
して、例えば、 モデルN1:1〜4モーラからなる文の韻律パタンを生
成するモデル モデルN2:5〜9モーラからなる文の韻律パタンを生
成するモデル モデルN3:10〜19モーラからなる文の韻律パタン
を生成するモデル モデルN4:20〜29モーラからなる文の韻律パタン
を生成するモデル モデルN5:30〜39モーラからなる文の韻律パタン
を生成するモデル モデルN6:40モーラ以上からなる文の韻律パタンを
生成するモデル のようなモデルを用意する。各モデルは、それぞれの文
長に適した韻律パタンを生成できるように設計してお
く。そして、入力文のモーラ数を算出し、その文長の文
の韻律パタンを生成するのに適したモデルを選択する。
上記の文2は7モーラ、文3は31モーラからなってい
る。そこで、文2はモデルN2、文3はモデルN5を、
それぞれ使用して韻律パタンを生成する。
【0022】さらに、第4の発明の一実施例を説明す
る。第4の発明は第1の発明の一実施例における韻律生
成モデル106−1〜106−nを、文の文節数とモー
ラ数とを組み合わせて分類した文長ごと用意したもので
ある。
【0023】文節数の少ない文では、モーラ数の違いが
韻律パタンの違いに大きな影響を及ぼす。逆に、ある程
度文節数が多くなれば、モーラ数の違いが韻律パタンに
及ぼす影響は小さくなる。そこで、韻律生成モデルとし
て、例えば、 モデルO1:1文節のみからなり、かつ1〜4モーラか
らなる文の韻律パタンを生成するモデル モデルO2:1文節のみからなり、かつ5〜9モーラか
らなる文の韻律パタンを生成するモデル モデルO3:1文節のみからなり、かつ10モーラ以上
からなる文の韻律パタンを生成するモデル モデルO4:2〜3文節からなり、かつ9モーラ以下か
らなる文の韻律パタンを生成するモデル モデルO5:2〜3文節からなり、かつ10〜29モー
ラからなる文の韻律パタンを生成するモデル モデルO6:2〜3文節からなり、かつ30モーラ以上
からなる文の韻律パタンを生成するモデル モデルO7:4〜9文節からなる文の韻律パタンを生成
するモデル モデルO8:10文節以上からなる文の韻律パタンを生
成するモデル のようなモデルを用意しておく。このような場合、上記
の文1、文2、及び文3の韻律パタンの生成には、モデ
ルO7、O4、及びO6をそれぞれ用いれば良い。
【0024】以上のことにより、どのような長さの入力
文に対してもその長さに応じた適切な韻律パタンを生成
することが可能である。
【0025】本発明では、韻律パタンを生成するモデル
を、入力文の長さに応じて複数用意しておく。このと
き、モデルの種類としては同じもの(例えば、線形結合
を利用したモデル、あるいはニューラル・ネットワーク
によるモデル、など)を用い、様々な文長ごとにモデル
の制御パラメータの設定を変えたものを複数用意する方
法がある。また、文長ごとに異なるモデルを用いて韻律
生成モデルを構築する方法(例えば、短い文には線形結
合を利用したモデルを用い、長い文にはニューラル・ネ
ットワークによるモデルを用いる、など)も考えられ
る。さらに、これら2通りの方法を組み合わせても良
い。具体的には、文献1に述べられているような韻律生
成のモデルによって、本発明が提供する複数の韻律生成
モデルの、個々のモデルを構成することが可能である。
また、この他にも、従来の音声合成装置で一般的に用い
られている継続時間長生成モデルやピッチ周波数パタン
生成モデルを利用することも可能である。
【0026】
【発明の効果】以上述べてきたように、本発明によれ
ば、どのような長さの文に対しても、その文の長さに適
した韻律パタンを生成することが可能になる。したがっ
て、様々な長さの文を含む大量のテキストを読み上げる
必要がある音声合成装置などに極めて有効である。
【図面の簡単な説明】
【図1】本発明による音声合成装置の一実施例を示すブ
ロック図である。
【図2】従来技術による音声合成装置の一実施例を示す
ブロック図である。
【符号の説明】
100 文入力端子 101,201 韻律生成部 102 音声合成部 103 合成音声出力端子 104 文長算出部 105 切替スイッチ 106−1〜106−n,206 韻律生成モデル

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】合成音声で読み上げるべき入力文を入力す
    る文入力端子と、前記入力文の韻律パタンを生成する韻
    律生成手段と、前記韻律パタンにしたがって音声を合成
    する音声合成手段とを有する音声合成装置において、 前記韻律生成手段が、予め定めた単位に基づいて前記入
    力文の長さを算出する文長算出手段と、前記入力文の文
    長に応じた複数の韻律生成モデルと、前記複数の韻律生
    成モデルの中から前記文長算出手段が算出した文長に応
    じて使用する韻律生成モデルを選択する韻律生成モデル
    選択手段を有し、前記韻律生成モデル選択手段が選択し
    た韻律生成モデルによって前記入力文の韻律パタンを生
    成することを特徴とする音声合成装置。
  2. 【請求項2】前記文長算出手段が、前記入力文の文節数
    を単位として文長を算出することを特徴とする請求項1
    に記載のテキスト音声合成装置。
  3. 【請求項3】前記文長算出手段が、前記入力文のモーラ
    数を単位として文長を算出することを特徴とする請求項
    1に記載のテキスト音声合成装置。
  4. 【請求項4】前記文長算出手段が、前記入力文の文節数
    とモーラ数との組み合わせによって文長を算出すること
    を特徴とする請求項1に記載のテキスト音声合成装置。
JP6280694A 1994-11-15 1994-11-15 音声合成装置 Expired - Lifetime JP2910587B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6280694A JP2910587B2 (ja) 1994-11-15 1994-11-15 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6280694A JP2910587B2 (ja) 1994-11-15 1994-11-15 音声合成装置

Publications (2)

Publication Number Publication Date
JPH08146994A true JPH08146994A (ja) 1996-06-07
JP2910587B2 JP2910587B2 (ja) 1999-06-23

Family

ID=17628650

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6280694A Expired - Lifetime JP2910587B2 (ja) 1994-11-15 1994-11-15 音声合成装置

Country Status (1)

Country Link
JP (1) JP2910587B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014232145A (ja) * 2013-05-28 2014-12-11 日本電信電話株式会社 ポーズ付与モデル選択装置とポーズ付与装置とそれらの方法とプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH056191A (ja) * 1991-06-27 1993-01-14 Matsushita Electric Ind Co Ltd 音声合成装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH056191A (ja) * 1991-06-27 1993-01-14 Matsushita Electric Ind Co Ltd 音声合成装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014232145A (ja) * 2013-05-28 2014-12-11 日本電信電話株式会社 ポーズ付与モデル選択装置とポーズ付与装置とそれらの方法とプログラム

Also Published As

Publication number Publication date
JP2910587B2 (ja) 1999-06-23

Similar Documents

Publication Publication Date Title
US8219398B2 (en) Computerized speech synthesizer for synthesizing speech from text
US20020049594A1 (en) Speech synthesis
Macon et al. Concatenation-based midi-to-singing voice synthesis
JPH05113795A (ja) 音声合成装置
JP2910587B2 (ja) 音声合成装置
CN100508025C (zh) 合成语音的方法和设备及分析语音的方法和设备
JP3094622B2 (ja) テキスト音声合成装置
KR0134707B1 (ko) 다이폰 단위를 이용한 엘에스피(lsp)방식의 음성 합성 방법
KR20040015605A (ko) 가상노래 합성장치 및 방법
KR970003093B1 (ko) 고품질 한국어 문장음성 변환을 위한 합성단위(cdu)작성방법
JP3310217B2 (ja) 音声合成方法とその装置
Hoffmann et al. An interactive tutorial on text-to-speech synthesis from diphones in time domain.
JP2000010581A (ja) 音声合成装置
JP2658109B2 (ja) 音声合成装置
JPH0227397A (ja) 音声合成歌唱装置
Lai F0 control model for mandarin singing voice synthesis
JPH01321496A (ja) 音声合成装置
Eady et al. Pitch assignment rules for speech synthesis by word concatenation
Muralishankar et al. Human touch to Tamil speech synthesizer
JP2581130B2 (ja) 音韻継続時間長決定装置
JPH09292897A (ja) 音声合成装置
JP2000066695A (ja) 素片辞書、音声合成方法及び装置
JP2573585B2 (ja) 音声スペクトルパタン生成装置
Ren et al. Emotional speech synthesis and its application to pervasive E-learning
JPH08211896A (ja) 音声合成編集方式および装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990309