JP3310217B2 - 音声合成方法とその装置 - Google Patents
音声合成方法とその装置Info
- Publication number
- JP3310217B2 JP3310217B2 JP08720698A JP8720698A JP3310217B2 JP 3310217 B2 JP3310217 B2 JP 3310217B2 JP 08720698 A JP08720698 A JP 08720698A JP 8720698 A JP8720698 A JP 8720698A JP 3310217 B2 JP3310217 B2 JP 3310217B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- phoneme
- information
- prosody
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
【0001】
【発明の属する技術分野】本発明は、音声合成方法とそ
の装置に関し、特に音声片を変形、接続して音声を合成
する音声合成方法とその装置に関する。
の装置に関し、特に音声片を変形、接続して音声を合成
する音声合成方法とその装置に関する。
【0002】
【従来の技術】従来、音声片を変形、接続して音声を合
成するには、特開平10−39865号公報に記載され
ているように、全ての音声片について音韻情報と韻律情
報をそれぞれ保存していた。
成するには、特開平10−39865号公報に記載され
ているように、全ての音声片について音韻情報と韻律情
報をそれぞれ保存していた。
【0003】
【発明が解決しようとする課題】しかしながら、滑らか
な音声を合成できるように、音声片の音韻連鎖の長さを
CVからVCV、VCVからCVCVのように長くする
と、音声片の種類が指数関数的に増加し、それに伴い音
声片のデータ容量が非常に大きくなるという問題があっ
た。
な音声を合成できるように、音声片の音韻連鎖の長さを
CVからVCV、VCVからCVCVのように長くする
と、音声片の種類が指数関数的に増加し、それに伴い音
声片のデータ容量が非常に大きくなるという問題があっ
た。
【0004】本発明は、滑らかな合成音声を作るために
音声片の単位を長くした場合でも、従来のように音声片
のデータ容量が指数関数的に増大しない音声合成方法と
その装置を提供することを目的とする。
音声片の単位を長くした場合でも、従来のように音声片
のデータ容量が指数関数的に増大しない音声合成方法と
その装置を提供することを目的とする。
【0005】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、周波数パワースペクトルやピッチ波形の
比較的データ容量が大きい音韻情報のための音声片と、
音の高さのパターンや音韻時間長のパターンの比較的デ
ータ容量が小さい韻律情報のための音声片とを別々に設
け、比較的データ容量の小さい韻律情報用音声片の音韻
連鎖の長さを、音韻情報用の音声片の長さよりも長くす
ることにより、滑らかな韻律を生成できるようにし、ま
た、比較的データ容量の大きい音韻情報のための音声片
の音韻連鎖の長さを、韻律情報のための音声片の音韻連
鎖の長さよりも短く設定することにより、音声片データ
ベース全体のデータ容量の増加を抑えながらも滑らかな
音声を合成できるようにしたものである。
に、本発明は、周波数パワースペクトルやピッチ波形の
比較的データ容量が大きい音韻情報のための音声片と、
音の高さのパターンや音韻時間長のパターンの比較的デ
ータ容量が小さい韻律情報のための音声片とを別々に設
け、比較的データ容量の小さい韻律情報用音声片の音韻
連鎖の長さを、音韻情報用の音声片の長さよりも長くす
ることにより、滑らかな韻律を生成できるようにし、ま
た、比較的データ容量の大きい音韻情報のための音声片
の音韻連鎖の長さを、韻律情報のための音声片の音韻連
鎖の長さよりも短く設定することにより、音声片データ
ベース全体のデータ容量の増加を抑えながらも滑らかな
音声を合成できるようにしたものである。
【0006】
【発明の実施の形態】本発明は、VCV、CV/VC
V、CV/VCの音韻連鎖を単位とする音声片の音の高
さや時間長を変更し、この変更した音声片を接続して任
意の音声を合成する音声合成方法において、周波数パワ
ースペクトルやピッチ波形の音韻情報のための音声片
と、音の高さのパターンや音韻による時間長のパターン
の韻律情報のための音声片とを別々に用意し、韻律情報
のための音声片の音韻連鎖の長さを、音韻情報のための
音声片の音韻連鎖の長さよりも長くすることを特徴とし
た音声合成方法であり、韻律情報用音声片の単位を長く
することで、より滑らかな韻律を設定することができる
ので、高音質の合成音声を得ることができるという作用
を有する。
V、CV/VCの音韻連鎖を単位とする音声片の音の高
さや時間長を変更し、この変更した音声片を接続して任
意の音声を合成する音声合成方法において、周波数パワ
ースペクトルやピッチ波形の音韻情報のための音声片
と、音の高さのパターンや音韻による時間長のパターン
の韻律情報のための音声片とを別々に用意し、韻律情報
のための音声片の音韻連鎖の長さを、音韻情報のための
音声片の音韻連鎖の長さよりも長くすることを特徴とし
た音声合成方法であり、韻律情報用音声片の単位を長く
することで、より滑らかな韻律を設定することができる
ので、高音質の合成音声を得ることができるという作用
を有する。
【0007】本発明は、合成しようとする音声の読みを
入力する読み入力手段と、音の高さのパターンや音韻継
続時間長のパターンの韻律情報を保存した韻律情報用音
声片データベースと、韻律情報用音声片データベースを
用いて合成する音声の韻律を決定する韻律決定手段と、
周波数パワースペクトルやピッチ波形の音韻情報を保存
した音韻情報用音声片データベースと、韻律決定手段で
決定した韻律に従って音韻情報用音声片の韻律を変更す
る韻律変更手段と、韻律を変更した音声片を接続する音
声片接続手段と、音韻情報用音声片を接続して得られた
合成音声を出力する合成音声出力手段とを備えた音声合
成装置であり、韻律情報用の音声片の音韻連鎖長を長く
して音質の向上を図っても、比較的データ容量が多い音
韻情報用の音声片データベースが増加しないので、音声
片データベースの容量の増加を少なくすることができる
という作用を有する。
入力する読み入力手段と、音の高さのパターンや音韻継
続時間長のパターンの韻律情報を保存した韻律情報用音
声片データベースと、韻律情報用音声片データベースを
用いて合成する音声の韻律を決定する韻律決定手段と、
周波数パワースペクトルやピッチ波形の音韻情報を保存
した音韻情報用音声片データベースと、韻律決定手段で
決定した韻律に従って音韻情報用音声片の韻律を変更す
る韻律変更手段と、韻律を変更した音声片を接続する音
声片接続手段と、音韻情報用音声片を接続して得られた
合成音声を出力する合成音声出力手段とを備えた音声合
成装置であり、韻律情報用の音声片の音韻連鎖長を長く
して音質の向上を図っても、比較的データ容量が多い音
韻情報用の音声片データベースが増加しないので、音声
片データベースの容量の増加を少なくすることができる
という作用を有する。
【0008】また上記音声合成装置は、韻律情報を保存
する韻律情報用音声片データベースを音韻カテゴリーの
連鎖が等しい音声片毎に分類し、音韻カテゴリー連鎖毎
に韻律情報を保存することを特徴とした音声合成装置で
あり、韻律用の音声片データベースの種類を少なくする
ことができるので、韻律用音声片データベースの容量を
小さくすることができるという作用を有する。
する韻律情報用音声片データベースを音韻カテゴリーの
連鎖が等しい音声片毎に分類し、音韻カテゴリー連鎖毎
に韻律情報を保存することを特徴とした音声合成装置で
あり、韻律用の音声片データベースの種類を少なくする
ことができるので、韻律用音声片データベースの容量を
小さくすることができるという作用を有する。
【0009】本発明は、VCV、CV/VCV、CV/
VCの音韻連鎖を単位とする音声片の音の高さや時間長
を変更し、この変更した音声片を接続して任意の音声を
合成する音声合成方法において、ピッチ波形とピッチパ
ターンを保存する音声片と、パワーのパターンと音韻継
続時間長のパターンを保存する音声片とを別々に用意
し、パワーパターンと音韻継続時間長用の音声片の音韻
連鎖の長さを、ピッチ波形とピッチパターンを保存する
音声片の音韻連鎖の長さよりも長くすることを特徴とし
た音声合成方法であり、ピッチ変更を行なう際には、元
のピッチパターンを考慮しながらなるべく元のピッチパ
ターンを保存するようにしてピッチ変更に伴う音質劣化
を抑えるようにし、また、パワー制御と時間長制御に関
しては、なるべく音韻連鎖が長い音声片の音韻継続時間
長を利用することにより、滑らかなパワーパターンと音
韻環境を考慮した音韻継続時間長に制御することがで
き、従来より自然な音声を合成することができるという
作用を有する。
VCの音韻連鎖を単位とする音声片の音の高さや時間長
を変更し、この変更した音声片を接続して任意の音声を
合成する音声合成方法において、ピッチ波形とピッチパ
ターンを保存する音声片と、パワーのパターンと音韻継
続時間長のパターンを保存する音声片とを別々に用意
し、パワーパターンと音韻継続時間長用の音声片の音韻
連鎖の長さを、ピッチ波形とピッチパターンを保存する
音声片の音韻連鎖の長さよりも長くすることを特徴とし
た音声合成方法であり、ピッチ変更を行なう際には、元
のピッチパターンを考慮しながらなるべく元のピッチパ
ターンを保存するようにしてピッチ変更に伴う音質劣化
を抑えるようにし、また、パワー制御と時間長制御に関
しては、なるべく音韻連鎖が長い音声片の音韻継続時間
長を利用することにより、滑らかなパワーパターンと音
韻環境を考慮した音韻継続時間長に制御することがで
き、従来より自然な音声を合成することができるという
作用を有する。
【0010】以下、本発明の実施の形態について、図1
から図9を用いて説明する。(実施の形態1)まず、本
発明の実施の形態1について説明する。図1は本実施の
形態1における音声合成方法の概念図であり、単語「み
どりがおか」を合成する場合を例にして説明する。図1
において、101〜105は韻律情報用の音声片であ
り、音韻継続時間長の情報とピッチ変動の情報とパワー
変動の情報が保存してある。107〜112は音韻情報
用の音声片で、無声音部分ではその波形をそのまま保存
し、有声音部分では窓関数で切り出したピッチ波形を保
存している。106は目的とする合成音声「みどりがお
か」を表している。本実施の形態では、韻律情報用音声
片の音韻連鎖がCVCVC単位で、音韻情報用音声片の
音韻連鎖がVCV単位の場合である。
から図9を用いて説明する。(実施の形態1)まず、本
発明の実施の形態1について説明する。図1は本実施の
形態1における音声合成方法の概念図であり、単語「み
どりがおか」を合成する場合を例にして説明する。図1
において、101〜105は韻律情報用の音声片であ
り、音韻継続時間長の情報とピッチ変動の情報とパワー
変動の情報が保存してある。107〜112は音韻情報
用の音声片で、無声音部分ではその波形をそのまま保存
し、有声音部分では窓関数で切り出したピッチ波形を保
存している。106は目的とする合成音声「みどりがお
か」を表している。本実施の形態では、韻律情報用音声
片の音韻連鎖がCVCVC単位で、音韻情報用音声片の
音韻連鎖がVCV単位の場合である。
【0011】次に、本実施の形態1の動作について説明
する。はじめに音韻継続時間長の決定方法について説明
する。まず、合成しようとする音声の先頭部分の音韻並
びと同じ音韻並びの韻律情報用音声片を準備する。図1
では101に当たる。そしてこの韻律情報用音声片の先
頭からCVC部分までの音韻継続時間長をそのまま利用
することにより、合成音声の先頭からCVC部分までの
音韻継続時間長を決定する。図1では「みどりがおか」
の「み」の部分と「ど」の子音部分の音韻継続時間長を
決定したことになる。次に先頭のCVCVC音韻連鎖に
おける後方のVの部分が、CVCVC音韻連鎖における
前方のVの部分になる音韻連鎖の韻律情報用音声片を準
備し、この両者のVの部分の中央が一致するように配置
し、図1のようにしてこの部分の母音の継続時間長を決
定する。ここまでの手順で「みど」の部分の音韻継続時
間長を決定したことになる。そして、CVCVC音韻連
鎖の音声片102における中央のCの音韻継続時間長を
そのまま利用することにより、この部分の子音の音韻継
続時間長を決定する。図1では、ここまでの操作で「み
ど」と「り」の子音部分までの音韻継続時間長を決定し
たことになる。以降は上記の手順を同ように繰り返すこ
とにより全ての音韻継続時間長を決定することができ
る。このようにして、音韻連鎖が長い音声片の韻律情報
を利用することにより、音韻環境を考慮した音韻継続時
間長を決定することができる。
する。はじめに音韻継続時間長の決定方法について説明
する。まず、合成しようとする音声の先頭部分の音韻並
びと同じ音韻並びの韻律情報用音声片を準備する。図1
では101に当たる。そしてこの韻律情報用音声片の先
頭からCVC部分までの音韻継続時間長をそのまま利用
することにより、合成音声の先頭からCVC部分までの
音韻継続時間長を決定する。図1では「みどりがおか」
の「み」の部分と「ど」の子音部分の音韻継続時間長を
決定したことになる。次に先頭のCVCVC音韻連鎖に
おける後方のVの部分が、CVCVC音韻連鎖における
前方のVの部分になる音韻連鎖の韻律情報用音声片を準
備し、この両者のVの部分の中央が一致するように配置
し、図1のようにしてこの部分の母音の継続時間長を決
定する。ここまでの手順で「みど」の部分の音韻継続時
間長を決定したことになる。そして、CVCVC音韻連
鎖の音声片102における中央のCの音韻継続時間長を
そのまま利用することにより、この部分の子音の音韻継
続時間長を決定する。図1では、ここまでの操作で「み
ど」と「り」の子音部分までの音韻継続時間長を決定し
たことになる。以降は上記の手順を同ように繰り返すこ
とにより全ての音韻継続時間長を決定することができ
る。このようにして、音韻連鎖が長い音声片の韻律情報
を利用することにより、音韻環境を考慮した音韻継続時
間長を決定することができる。
【0012】次に、ピッチパターンの決定方法について
説明する。まず、韻律情報用音声片には、アクセント成
分やフレーズ成分を取り除いたピッチ変動のパターンを
格納しておく。一方では従来と同ように藤崎モデルやピ
ッチパターンテンプレートなどにより、フレーズ成分と
アクセント成分からなるピッチパターンの概略を表した
ものを準備する。そして、この概略のピッチパターンに
韻律情報用音声片に保存してあるピッチ変動のパターン
を足しあわせて、音韻による変動までを考慮したピッチ
パターンを決定する。このようにすれば音韻環境を考慮
したピッチパターンを決定することができる。
説明する。まず、韻律情報用音声片には、アクセント成
分やフレーズ成分を取り除いたピッチ変動のパターンを
格納しておく。一方では従来と同ように藤崎モデルやピ
ッチパターンテンプレートなどにより、フレーズ成分と
アクセント成分からなるピッチパターンの概略を表した
ものを準備する。そして、この概略のピッチパターンに
韻律情報用音声片に保存してあるピッチ変動のパターン
を足しあわせて、音韻による変動までを考慮したピッチ
パターンを決定する。このようにすれば音韻環境を考慮
したピッチパターンを決定することができる。
【0013】次に、パワーパターンの決定方法について
説明する。韻律情報用音声片には、ピッチ波形毎の最大
振幅値を保存しておき、その値をそのまま利用してパワ
ーパターンを決定する。ただし、接続部分ではパワーパ
ターンが滑らかになるようにクロスフェードを行なう。
以上のようにして決定した韻律にしたがって、音韻情報
用音声片の音韻継続時間長とピッチパターンとパワーパ
ターンを変更し、これらを接続して目的の音声を合成す
る。
説明する。韻律情報用音声片には、ピッチ波形毎の最大
振幅値を保存しておき、その値をそのまま利用してパワ
ーパターンを決定する。ただし、接続部分ではパワーパ
ターンが滑らかになるようにクロスフェードを行なう。
以上のようにして決定した韻律にしたがって、音韻情報
用音声片の音韻継続時間長とピッチパターンとパワーパ
ターンを変更し、これらを接続して目的の音声を合成す
る。
【0014】このように、本実施の形態1によれば、音
韻情報用音声片の音韻連鎖の単位が短くても、韻律情報
用音声片の音韻連鎖を長い単位にすれば、音韻環境を考
慮した韻律を決定できるので、高音質の音声を合成する
ことができる。
韻情報用音声片の音韻連鎖の単位が短くても、韻律情報
用音声片の音韻連鎖を長い単位にすれば、音韻環境を考
慮した韻律を決定できるので、高音質の音声を合成する
ことができる。
【0015】(実施の形態2)次に、本発明の実施の形
態2について説明する。図2は本実施の形態2における
音声合成装置のブロック図である。図2において、20
1は合成しようとする音声の発音を表す文字列を入力す
る読み入力手段、202は韻律情報用音声片データベー
ス(以下、DBと略す。)、203は韻律情報用音声片
DBを用いて音韻環境を考慮した韻律を決定する韻律決
定手段、204は音韻情報用音声片DB、205は韻律
決定手段203で決定した韻律に従って音韻情報用音声
片の韻律を変更する韻律変更手段、206は韻律変更手
段205で韻律を変更した音声片を接続する音声片接続
手段、207は音声片接続手段206で接続した合成音
声を出力する合成音声出力手段である。韻律情報用音声
片DB202は、音韻継続時間長DB2021、ピッチ
変動パターンDB2022、パワーパターンDB202
3から構成される。音韻継続時間長DB2021には、
全てのCVCVC音韻連鎖について、その音韻継続時間
長を保存しておく。その構成を図3に示す。ピッチ変動
パターンDB2022には、全てのCVCVC音韻連鎖
について、ピッチパターンから概略となるフレーズ成分
とアクセント成分を取り除き、音韻に依存するピッチ変
動のパターンを各音韻毎に5つ程度保存しておく。その
構成を図4に示す。パワーパターンDB2023には、
全ての音韻連鎖について、音韻に依存するパワー変動の
パターンを各音韻毎に5つ程度保存しておく。その構成
を図5に示す。
態2について説明する。図2は本実施の形態2における
音声合成装置のブロック図である。図2において、20
1は合成しようとする音声の発音を表す文字列を入力す
る読み入力手段、202は韻律情報用音声片データベー
ス(以下、DBと略す。)、203は韻律情報用音声片
DBを用いて音韻環境を考慮した韻律を決定する韻律決
定手段、204は音韻情報用音声片DB、205は韻律
決定手段203で決定した韻律に従って音韻情報用音声
片の韻律を変更する韻律変更手段、206は韻律変更手
段205で韻律を変更した音声片を接続する音声片接続
手段、207は音声片接続手段206で接続した合成音
声を出力する合成音声出力手段である。韻律情報用音声
片DB202は、音韻継続時間長DB2021、ピッチ
変動パターンDB2022、パワーパターンDB202
3から構成される。音韻継続時間長DB2021には、
全てのCVCVC音韻連鎖について、その音韻継続時間
長を保存しておく。その構成を図3に示す。ピッチ変動
パターンDB2022には、全てのCVCVC音韻連鎖
について、ピッチパターンから概略となるフレーズ成分
とアクセント成分を取り除き、音韻に依存するピッチ変
動のパターンを各音韻毎に5つ程度保存しておく。その
構成を図4に示す。パワーパターンDB2023には、
全ての音韻連鎖について、音韻に依存するパワー変動の
パターンを各音韻毎に5つ程度保存しておく。その構成
を図5に示す。
【0016】このように、本実施の形態2によれば、音
声合成装置を上記のように構成したので、自然な韻律の
合成音声を出力するために音声片の音韻連鎖の単位を長
くしても、データ容量が大きい音韻情報用音声片DBの
容量は増加しないので、音声片DB全体の容量の増加を
抑えたまま、自然な韻律の合成音声を出力する音声合成
装置を提供することができる。
声合成装置を上記のように構成したので、自然な韻律の
合成音声を出力するために音声片の音韻連鎖の単位を長
くしても、データ容量が大きい音韻情報用音声片DBの
容量は増加しないので、音声片DB全体の容量の増加を
抑えたまま、自然な韻律の合成音声を出力する音声合成
装置を提供することができる。
【0017】(実施の形態3)次に、本発明の実施の形
態3について説明する。本実施の形態3における音声合
成装置の構成は図2に示した実施の形態2と同じであ
る。図6は本実施の形態3における韻律情報用音声片の
音韻を分類する音韻カテゴリー表の一覧図、図7は本実
施の形態3における韻律情報用音声片DBの音韻継続時
間長DBの構成図である。まず、図6に示すように、全
ての音韻を音韻カテゴリーに分類する。図6では母音と
撥音を1種類の母音(V)として分類し、子音(C)を
8種類に分類した場合の例である。この場合、CVCV
C音韻連鎖の種類は512種類(=83・11)にな
る。そして、図7に示すように、512種類の音韻連鎖
毎に各音韻カテゴリーの音韻継続時間長を決定する。ピ
ッチ変動パターン、パワーパターンについても同様に音
韻カテゴリー毎にピッチ変動パターンDBとパワーパタ
ーンDBを作成する。もし、すべての音韻についてCV
CVC音韻連鎖の種類を揃えようとすると、子音(C)
が20種類で母音が6種類としたら288000種類
(=203・62)にもなり、音声片DBとして非常に
大きな数になってしまうが、図3のような音韻カテゴリ
ーに分類すれば500種類程度の数にまとめることがで
きる。
態3について説明する。本実施の形態3における音声合
成装置の構成は図2に示した実施の形態2と同じであ
る。図6は本実施の形態3における韻律情報用音声片の
音韻を分類する音韻カテゴリー表の一覧図、図7は本実
施の形態3における韻律情報用音声片DBの音韻継続時
間長DBの構成図である。まず、図6に示すように、全
ての音韻を音韻カテゴリーに分類する。図6では母音と
撥音を1種類の母音(V)として分類し、子音(C)を
8種類に分類した場合の例である。この場合、CVCV
C音韻連鎖の種類は512種類(=83・11)にな
る。そして、図7に示すように、512種類の音韻連鎖
毎に各音韻カテゴリーの音韻継続時間長を決定する。ピ
ッチ変動パターン、パワーパターンについても同様に音
韻カテゴリー毎にピッチ変動パターンDBとパワーパタ
ーンDBを作成する。もし、すべての音韻についてCV
CVC音韻連鎖の種類を揃えようとすると、子音(C)
が20種類で母音が6種類としたら288000種類
(=203・62)にもなり、音声片DBとして非常に
大きな数になってしまうが、図3のような音韻カテゴリ
ーに分類すれば500種類程度の数にまとめることがで
きる。
【0018】このように、本実施の形態3によれば、音
韻カテゴリー連鎖で分類して韻律情報用音声片DBを構
成することにより、CVCVCのような長い音韻連鎖で
あっても、音韻カテゴリー毎に韻律の特徴を保存した韻
律情報用音声片DBを、比較的少ないデータ容量で実現
することができる。
韻カテゴリー連鎖で分類して韻律情報用音声片DBを構
成することにより、CVCVCのような長い音韻連鎖で
あっても、音韻カテゴリー毎に韻律の特徴を保存した韻
律情報用音声片DBを、比較的少ないデータ容量で実現
することができる。
【0019】(実施の形態4)次に、本発明の実施の形
態4について説明する。図8は本実施の形態4における
音声合成方法の概念図であり、単語「みどりがおか」を
合成する場合を例にして説明する。図8において、80
1〜805は音韻継続時間長とパワーパターン用の音声
片であり、807〜812はピッチ波形とその間隔のデ
ータを保存した音声片である。806は目的とする合成
音声「みどりがおか」のピッチパターンの概略を示して
いる。本実施の形態は音韻継続時間長とパワーパターン
用の音声片の音韻連鎖がCVCVC単位で、ピッチ波形
とその間隔のデータを保存した音声片の音韻連鎖がVC
V単位の場合である。
態4について説明する。図8は本実施の形態4における
音声合成方法の概念図であり、単語「みどりがおか」を
合成する場合を例にして説明する。図8において、80
1〜805は音韻継続時間長とパワーパターン用の音声
片であり、807〜812はピッチ波形とその間隔のデ
ータを保存した音声片である。806は目的とする合成
音声「みどりがおか」のピッチパターンの概略を示して
いる。本実施の形態は音韻継続時間長とパワーパターン
用の音声片の音韻連鎖がCVCVC単位で、ピッチ波形
とその間隔のデータを保存した音声片の音韻連鎖がVC
V単位の場合である。
【0020】次に、本実施の形態の動作について説明す
る。合成音声の音韻継続時間長とパワーパターンについ
ては、実施の形態1と同様に音韻連鎖を考慮した音韻継
続時間長を決定する。次に、藤崎モデルやピッチパター
ンテンプレートなどにより、フレーズ成分とアクセント
成分からなるピッチパターンの概略を表したものを準備
する。図8ではピッチパターン806に当たる。そし
て、波形情報用音声片の音声片の時間長とピッチパター
ンを変更する。時間長は、既に決定した音韻継続時間長
に合うようにし、ピッチパターンについては、波形情報
用音声片の音声片を元のピッチパターンの揺らぎを保存
したまま、ピッチパターン806に沿うようにピッチ変
更を行なう。このようにして時間長とピッチパターンと
変更した音声片を接続した後にパワーパターンを調整す
る。
る。合成音声の音韻継続時間長とパワーパターンについ
ては、実施の形態1と同様に音韻連鎖を考慮した音韻継
続時間長を決定する。次に、藤崎モデルやピッチパター
ンテンプレートなどにより、フレーズ成分とアクセント
成分からなるピッチパターンの概略を表したものを準備
する。図8ではピッチパターン806に当たる。そし
て、波形情報用音声片の音声片の時間長とピッチパター
ンを変更する。時間長は、既に決定した音韻継続時間長
に合うようにし、ピッチパターンについては、波形情報
用音声片の音声片を元のピッチパターンの揺らぎを保存
したまま、ピッチパターン806に沿うようにピッチ変
更を行なう。このようにして時間長とピッチパターンと
変更した音声片を接続した後にパワーパターンを調整す
る。
【0021】このように、本実施の形態4によれば、音
韻継続時間長とパワーパターンは音韻環境を考慮して決
定することができ、ピッチパターンについては元の素片
のピッチパターンをなるべく保存して、ピッチ変更によ
る音質劣化を抑えた合成音声を作成することができるの
で、高音質の音声を合成することができる。
韻継続時間長とパワーパターンは音韻環境を考慮して決
定することができ、ピッチパターンについては元の素片
のピッチパターンをなるべく保存して、ピッチ変更によ
る音質劣化を抑えた合成音声を作成することができるの
で、高音質の音声を合成することができる。
【0022】
【発明の効果】本発明は、上記実施の形態から明らかな
ように、音韻情報と韻律情報を保存しておく音声片を別
々に用意し、それぞれ必要な情報のみを保存するため、
韻律情報用音声片の音韻連鎖の長さを長くしても、音声
片データベースの増加を少なくすることが出来るという
効果が得られる。
ように、音韻情報と韻律情報を保存しておく音声片を別
々に用意し、それぞれ必要な情報のみを保存するため、
韻律情報用音声片の音韻連鎖の長さを長くしても、音声
片データベースの増加を少なくすることが出来るという
効果が得られる。
【図1】本発明の実施の形態1における音声合成方法の
概念図
概念図
【図2】本発明の実施の形態2における音声合成装置の
構成図
構成図
【図3】本発明の実施の形態2における音韻継続時間長
DBの構成図
DBの構成図
【図4】本発明の実施の形態2におけるピッチ変動パタ
ーンDBの構成図
ーンDBの構成図
【図5】本発明の実施の形態2におけるパワーパターン
DBの構成図
DBの構成図
【図6】本発明の実施の形態3における音韻カテゴリー
の分類一覧図
の分類一覧図
【図7】本発明の実施の形態3における音韻継続時間長
DBの構成図
DBの構成図
【図8】本発明の実施の形態4における音声合成方法の
概念図
概念図
101〜105 韻律情報用音声片 106 合成音声 107〜112 音韻情報用音声片 201 読み入力手段 202 韻律情報用音声片DB 203 韻律決定手段 204 音韻情報用音声片DB 205 韻律変更手段 206 音声片接続手段 207 合成音声出力手段
───────────────────────────────────────────────────── フロントページの続き (72)発明者 新 居 康 彦 神奈川県横浜市港北区綱島東四丁目3番 1号 松下通信工業株式会社内 (56)参考文献 特開 平1−284898(JP,A) 特開 平7−181995(JP,A) 特開 平8−160990(JP,A) 特開 平9−244678(JP,A) 特開 平6−236197(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 13/08
Claims (3)
- 【請求項1】 VCV、CV/VCV、CV/VCの音
韻連鎖を単位とする音声片の音の高さや時間長を変更
し、この変更した音声片を接続して任意の音声を合成す
る音声合成方法において、周波数パワースペクトルやピ
ッチ波形の音韻情報のための音声片と、音の高さのパタ
ーンや音韻による時間長のパターンの韻律情報のための
音声片とを別々に用意し、韻律情報のための音声片の音
韻連鎖の長さを、音韻情報のための音声片の音韻連鎖の
長さよりも長くすることを特徴とした音声合成方法。 - 【請求項2】 合成しようとする音声の読みを入力する
読み入力手段と、音の高さのパターンや音韻継続時間長
のパターンの韻律情報を保存した韻律情報用音声片デー
タベースと、前記韻律情報用音声片データベースを用い
て合成する音声の韻律を決定する韻律決定手段と、周波
数パワースペクトルやピッチ波形の音韻情報を保存した
音韻情報用音声片データベースと、前記韻律決定手段で
決定した韻律に従って音韻情報用音声片の韻律を変更す
る韻律変更手段と、韻律を変更した音声片を接続する音
声片接続手段と、音韻情報用音声片を接続して得られた
合成音声を出力する合成音声出力手段とを備え、前記韻
律情報用音声片データベースは、音韻の種類によって分
類した音韻カテゴリーの並び方を等しい音声片毎に分類
し、音韻カテゴリーの並び方を表す音韻カテゴリー連鎖
毎に韻律情報を保存することを特徴とする音声合成装
置。 - 【請求項3】 VCV、CV/VCV、CV/VCの音
韻連鎖を単位とする音声片の音の高さや時間長を変更
し、この変更した音声片を接続して任意の音声を合成す
る音声合成方法において、ピッチ波形とピッチパターン
を保存する音声片と、パワーのパターンと音韻継続時間
長のパターンを保存する音声片とを別々に用意し、パワ
ーパターンと音韻継続時間長用の音声片の音韻連鎖の長
さを、ピッチ波形とピッチパターンを保存する音声片の
音韻連鎖の長さよりも長くすることを特徴とした音声合
成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP08720698A JP3310217B2 (ja) | 1998-03-31 | 1998-03-31 | 音声合成方法とその装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP08720698A JP3310217B2 (ja) | 1998-03-31 | 1998-03-31 | 音声合成方法とその装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11282493A JPH11282493A (ja) | 1999-10-15 |
JP3310217B2 true JP3310217B2 (ja) | 2002-08-05 |
Family
ID=13908495
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP08720698A Expired - Fee Related JP3310217B2 (ja) | 1998-03-31 | 1998-03-31 | 音声合成方法とその装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3310217B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5471858B2 (ja) * | 2009-07-02 | 2014-04-16 | ヤマハ株式会社 | 歌唱合成用データベース生成装置、およびピッチカーブ生成装置 |
-
1998
- 1998-03-31 JP JP08720698A patent/JP3310217B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH11282493A (ja) | 1999-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6778962B1 (en) | Speech synthesis with prosodic model data and accent type | |
JP3078205B2 (ja) | 波形の連結及び部分的重複化による音声合成方法 | |
US7565291B2 (en) | Synthesis-based pre-selection of suitable units for concatenative speech | |
JP2000163088A (ja) | 音声合成方法および装置 | |
JPH031200A (ja) | 規則型音声合成装置 | |
US6424937B1 (en) | Fundamental frequency pattern generator, method and program | |
KR101016978B1 (ko) | 소리 신호 합성 방법, 컴퓨터 판독가능 저장 매체 및 컴퓨터 시스템 | |
JP5175422B2 (ja) | 音声合成における時間幅を制御する方法 | |
JP3310217B2 (ja) | 音声合成方法とその装置 | |
JP3233036B2 (ja) | 歌唱音合成装置 | |
JPH09179576A (ja) | 音声合成方法 | |
JP3081300B2 (ja) | 残差駆動型音声合成装置 | |
JP3113101B2 (ja) | 音声合成装置 | |
JP3241582B2 (ja) | 韻律制御装置及び方法 | |
JP3515268B2 (ja) | 音声合成装置 | |
JP3437472B2 (ja) | 音声合成方法とその装置 | |
JP2910587B2 (ja) | 音声合成装置 | |
JP2573586B2 (ja) | 規則型音声合成装置 | |
JP2573585B2 (ja) | 音声スペクトルパタン生成装置 | |
JPH1091191A (ja) | 音声合成方法 | |
JPH06138894A (ja) | 音声合成装置及び音声合成方法 | |
JPH0756599B2 (ja) | 音声フアイル作成方法 | |
JPS60153099A (ja) | 規則型音声合成装置 | |
US20060074675A1 (en) | Method of synthesizing creaky voice | |
JPH04281495A (ja) | 音声波形ファイル装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090524 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |