JP2000010581A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JP2000010581A
JP2000010581A JP10173175A JP17317598A JP2000010581A JP 2000010581 A JP2000010581 A JP 2000010581A JP 10173175 A JP10173175 A JP 10173175A JP 17317598 A JP17317598 A JP 17317598A JP 2000010581 A JP2000010581 A JP 2000010581A
Authority
JP
Japan
Prior art keywords
pitch
generating
pitch pattern
pattern
input text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10173175A
Other languages
English (en)
Inventor
Reishi Kondou
玲史 近藤
Yukio Mitome
幸夫 三留
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP10173175A priority Critical patent/JP2000010581A/ja
Publication of JP2000010581A publication Critical patent/JP2000010581A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】ピッチパタンの細かな構造を効率よく生成し、
生成する合成音声の自然性や個人性を向上する音声合成
装置の提供。 【解決手段】入力テキスト11に対する継続時間長情報
12を生成する継続時間長生成部41と、入力テキスト
11から数点のピッチ制御点で表現される第1段ピッチ
パタン21を生成するピッチパタン第1段生成部31
と、第1ピッチパタン21を用いてより詳細な第2段ピ
ッチパタン22を生成するピッチパタン第2段生成部3
2と、第2段ピッチパタン22を用いてより詳細な第3
段ピッチパタン23を生成するピッチパタン第3段生成
部33と、第3段ピッチパタン23から滑らかな平滑化
ピッチパタン24を生成するピッチパタン平滑部34
と、音韻情報13を生成する音韻選択部42と、平滑化
ピッチパタン24と継続時間長情報12と音韻情報13
から、音声波形14を生成する波形生成部43を備え
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声の規則合成装
置に関し、特にピッチパタンの生成技術に関する。
【0002】
【従来の技術】音声の規則合成を行う際、音声の自然性
や個人性を向上させるためにはピッチパタンが重要な役
割を担っていることが知られている。従来、規則合成の
ためのピッチパタンを生成するためには、点ピッチを決
定して、その間を規則により直線補間する方法が知られ
ている。この手法の一例として、例えば文献(1)(岩
田、三留「発話テンポに依存しない韻律構造のモデル
化」(1994年電子情報通信学会春季大会SA−5−
2、1994年3月))には、アクセント句のピッチを
代表する点正規化ピッチパタンとして3点求め、それに
対してアクセント句のピッチパタンモデルを当てはめる
方法が開示されている。
【0003】また、ピッチパタンを生成する別の方法と
して、例えば文献(2)(特開昭63−85797号公
報)に開示されているように、入力テキストからフレー
ズ指令とアクセント指令を生成し、臨界制動2次線形系
のインパルス応答とステップ応答のモデルでピッチパタ
ンを表現する方法も多く用いられている。
【0004】また、この種の方法として、フレーズ指令
とアクセント指令の生成方式によって自然なピッチパタ
ンを得る方法も提案されており、例えば文献(3)(特
開平4−51099号公報)には、隣接する単語間の係
受け強度によって、文節間の結合強度を求め、ピッチパ
タンに反映させる方法が開示されている。
【0005】
【発明が解決しようとする課題】しかしながら、上記し
た従来のピッチパタン生成の方法では、ピッチパタンの
細かな構造を効率よく再現することが難しく、このた
め、生成する合成音声の自然性や個人特性の再現性を向
上することが困難であった。
【0006】したがって、本発明は、上記問題点に鑑み
てなされたものであって、その目的は、ピッチパタンの
細かな構造を効率よく再現し、合成音声の自然性や個人
特性の再現性を向上する、音声合成装置を提供すること
にある。
【0007】
【課題を解決するための手段】前記目的を達成するた
め、本願第1発明は、少なくとも3段階以上の階層的に
ピッチの制御点を生成し、各ピッチ制御点の間を滑らか
に結ぶことでピッチパタンを生成する。
【0008】本願第2発明は、第1発明において、第1
段階でアクセント句の代表ピッチをピッチ制御点として
生成し、第2段階で該アクセント句の代表ピッチを用い
て音節の代表ピッチをピッチ制御点として生成し、第3
段階で音節内の複数のピッチ制御点を生成するものであ
る。
【0009】本願第3発明は、第2発明において、第2
段階の音節の代表ピッチに代えて音素の代表ピッチをピ
ッチ制御点として生成する。
【0010】本願第4発明は、第2又は第3発明におい
て、アクセント句より長い単位に対して代表ピッチを決
定し、それを用いてアクセント句の代表ピッチを生成す
る。
【0011】本願第5発明は、第1乃至第4発明におい
て、求めたピッチパタンの部分あるいは全体に対して、
別にマイクロプロソディを選択し、重畳する。
【0012】
【発明の実施の形態】本発明の実施の形態について以下
に説明する。本発明の音声合成装置は、その好ましい一
実施の形態において、少なくとも3段階以上の階層的に
ピッチの制御点を生成する手段を備え、各ピッチ制御点
の間を滑らかに結ぶことでピッチパタンを生成する。よ
り詳細には、本発明の一実施の形態は、入力テキスト
(図1の11)に対する継続時間長情報(図1の12)
を生成する継続時間長生成部(図1の41)と、入力テ
キストから数点のピッチ制御点で表現される第1段ピッ
チパタン(図1の21)を生成するピッチパタン第1段
生成部(図1の31)と、入力テキスト、継続時間長情
報、第1ピッチパタンを用いてより詳細な第2段ピッチ
パタン(図1の22)を生成するピッチパタン第2段生
成部(図1の32)と、第2段ピッチパタンを用いてよ
り詳細な第3段ピッチパタン(図1の23)を生成する
ピッチパタン第3段生成部(図1の33)と、第3段ピ
ッチパタンから滑らかな平滑化ピッチパタン(図1の2
4)を生成するピッチパタン平滑部(図1の34)と、
音韻情報(図1の13)を生成する音韻選択部(図1の
42)と、平滑化ピッチパタンと継続時間長情報と音韻
情報とから音声波形(図1の14)を生成する波形生成
部(図1の43)を備える(第1発明に対応)。
【0013】本発明は、第2の実施の形態において、第
1段階でアクセント句の代表ピッチをピッチ制御点とし
て生成する手段(図3の35)と、この代表ピッチを用
いて音節の代表ピッチをピッチ制御点として生成する手
段(図3の36)と、第3段階で音節内の複数のピッチ
制御点を生成する手段(図3の37)と、を備える(第
2発明に対応)。
【0014】また本発明の第3の実施の形態において、
第2段階の音節の代表ピッチに代えて、音素の代表ピッ
チをピッチ制御点として生成する手段(図5の38)を
備えた構成としてもよい(第3発明に対応)。
【0015】本発明は、第4の実施の形態において、ア
クセント句よりも長い単位に対して代表ピッチを決定す
る手段(図6の39)、これを用いてアクセント句の代
表ピッチを生成する手段(図6の35)を備える(第4
発明に対応)。
【0016】本発明は、第5の実施の形態において、平
滑化したピッチパタンの部分あるいは全体に対して、別
にマイクロプロソディを選択して重畳する手段(図8の
51)を備える(第5発明に対応)。以下、本発明の実
施の形態について更に詳細に説明すべく、本発明の実施
例について図面を参照して説明する。
【0017】
【実施例】図1は、本発明の第1の実施例の構成を示す
図である。また、図2は、この実施例において生成され
る各ピッチパタンの一例を示す図である。
【0018】図1を参照すると、継続時間長生成部41
は、入力テキスト11に対する各アクセント句、各音
節、各音素などに対応する継続時間長情報12を生成す
る。
【0019】ピッチパタン第1段生成部31は、入力テ
キスト11と継続時間長情報12から、第1段ピッチパ
タン21を生成する。
【0020】第1段ピッチパタン21は、与えられた入
力テキスト11の中の数点のピッチ周波数で表現され
る。この点の数は、与えられた入力テキスト11に依存
し、ピッチパタン第1段生成部31に予め内蔵されたア
ルゴリズムによって決められる。
【0021】本実施例では、入力テキスト11は、1つ
の文であり(例えば図2(a)の入力情報「今日は、雨
です。」)、これに対して、始端と終端の2つのピッチ
周波数を、テーブルを引くことによって、決定し、この
2つのピッチ制御点の集まりが、第1段ピッチパタン2
1である(図2(b)の×印参照)。テーブルをひく際
には、そのインデックスとして、例えば入力テキストか
らわかる文のモーラ長、平叙文や疑問文などの文型など
を用いる。
【0022】ピッチパタン第2段生成部32は、入力テ
キスト11と継続時間長情報12と第1段ピッチパタン
21とから、第2段ピッチパタン22を生成する。
【0023】第2段ピッチパタン22は、与えられた入
力テキスト11の中の数点のピッチ周波数で表現され、
その数は、第1段ピッチパタン21の数と等しいかまた
は多く設定される。この点の数は、与えられた入力テキ
スト11に依存し、ピッチパタン第2段生成部32に予
め内蔵されたアルゴリズムによって決められる。
【0024】本実施例では、入力テキスト11中に2つ
存在するアクセント句のそれぞれに対して3点、合計6
点のピッチ周波数を、テーブルを引くことによって決定
し、これらの6点のピッチ制御点の集まりが第2段ピッ
チパタン22である(図2(c)の○印参照)。テーブ
ルをひく際には、そのインデックスとして、例えば各ア
クセント句内に含まれる音節数とアクセント型を用い
る。
【0025】第1段ピッチパタン21のピッチ制御点
は、第2段ピッチパタン22のピッチ制御点を求める際
に用いるが、第2段ピッチパタン22のピッチ制御点の
集合は、必ずしも第1段ピッチパタン21のピッチ制御
点を全て含んでいる必要はない。
【0026】ピッチパタン第3段生成部33は、入力テ
キスト11と継続時間長情報12と第2段ピッチパタン
22から、第3段ピッチパタン23を生成する。
【0027】第3段ピッチパタン23は、与えられた入
力テキスト11の中の数点のピッチ周波数で表現され、
その数は、第2段ピッチパタン22の数と等しいかまた
は多く設定される。この点の数は、与えられた入力テキ
スト11に依存し、ピッチパタン第3段生成部33に予
め内蔵された処理手順(アルゴリズム)によって決めら
れる。
【0028】本実施例では、第2段ピッチパタン22で
生成した音節毎のピッチパタンに対して2点づつのピッ
チ周波数を、テーブルを引くことによって決定し、第3
段ピッチパタン23としている(図2(d)の黒丸参
照)。テーブルをひく際には、そのインデックスとし
て、例えば各音節の種類や、音節をカテゴリ分類したカ
テゴリ番号を用いる。
【0029】第2段ピッチパタン22のピッチ制御点
は、第3段ピッチパタン23のピッチ制御点を求める際
に用いるが、第3段ピッチパタン23のピッチ制御点の
集合は、必ずしも第2段ピッチパタン22のピッチ制御
点を全て含んでいる必要はない。
【0030】ピッチパタン平滑部34は、第3段ピッチ
パタン23を滑らかに結んだ曲線平滑化ピッチパタン2
4を生成する(図2(e)参照)。
【0031】本実施例では、第3段ピッチパタン23の
各ピッチ制御点を通る3次スプライン曲線を与えてい
る。
【0032】また、与えられた入力テキスト11からア
クセント句の境界などを検出することで、第3段ピッチ
パタン23の各ピッチ制御点の全ての点を結ぶだけでな
く、必要な点の間は結ばない処理を施すこともできる。
【0033】また、文献(4)(市田、吉元、「シリー
ズ新しい応用の数学 20 スプライン関数とその応
用」(教育出版)、第86−92頁)に示される方法
で、第3段ピッチパタン23の各ピッチ制御点をデータ
点と見なして平滑化した曲線を得ることにより、平滑化
ピッチパタン24とすることもできる。この場合は、第
3段ピッチパタン23の各ピッチ制御点を全て通るわけ
ではないが、より滑らかな曲線を得ることができる。
【0034】音韻選択部42は、入力テキスト11から
音韻情報13を生成する。波形生成部43は、平滑化ピ
ッチパタン24と継続時間長情報12と音韻情報13か
ら、音声波形14を生成する。
【0035】上記した実施例では、ピッチパタン第1段
生成部31、ピッチパタン第2段生成部32、ピッチパ
タン第3段生成部33はそれぞれテーブルを引くことに
よりピッチ制御点を求めているが、これに代えて、例え
ば文献(5)(特開昭63−46497号公報)に記載
されているように、入力テキストから得られる定性的パ
ラメータ(モーラ数、音韻系列など)から、数量化I類
解析を行うことによってピッチ周波数を求めてもよい。
【0036】また、本実施例では、3段階の階層的にピ
ッチ制御点を求めることでピッチパタンを生成している
が、4段階以上としても同様にピッチパタンを生成可能
である。
【0037】次に本発明の第2の実施例について説明す
る。図3は、本発明の第2の実施例の構成を示す図であ
る。図4は、本実施例において生成される各ピッチパタ
ンの一例を示す図である。
【0038】図3を参照すると、本発明の第2の実施例
は、図1に示した前記第1の実施例におけるピッチパタ
ン第1段生成部31、ピッチパタン第2段生成部32、
ピッチパタン第3段生成部33に代えて、それぞれ、ア
クセント句ラフピッチパタン生成部35、アクセント句
内ピッチパタン生成部36、音節内ピッチパタン生成部
37を備えたものである。
【0039】アクセント句ラフピッチパタン生成部35
は、入力テキスト11から、アクセント句ラフピッチパ
タン25を生成する。アクセント句ラフピッチパタン2
5は、与えられた入力テキスト11の中の各アクセント
句について、予め決められた一定数のピッチ制御点を求
める。
【0040】本実施例では、1アクセント句について、
アクセント句の始端周波数、最高周波数、終端周波数の
3点を求め、アクセント句ラフピッチパタン25とする
(図4(b)参照)。これらの3点の周波数は、アクセ
ント句に対応しており、実際の時刻には対応していな
い。
【0041】アクセント句内ピッチパタン生成部36
は、入力テキスト11と継続時間長情報12とアクセン
ト句ラフピッチパタン25から、アクセント句内ピッチ
パタン26を生成する。ここでは、各アクセント句につ
いて、音節毎のピッチ制御点をテーブルを引くことで求
め、アクセント句内ピッチパタン26とする(図4
(c)参照)。
【0042】音節内ピッチパタン生成部37は、入力テ
キスト11と継続時間長情報12とアクセント句内ピッ
チパタン26から、音節内ピッチパタン27を生成する
(図4(d)参照)。本実施例では、各音節について、
数点のピッチ制御点をテーブルを引くことで求める。音
節毎に求められるピッチ制御点の数は、音節の種類、位
置、前後の音節との関係によって異なるが、この数も上
記したテーブルを参照して求める。
【0043】次に本発明の第3の実施例について説明す
る。図5は、本発明の第3の実施例の構成を示す図であ
る。図5を参照すると、本発明の第3の実施例において
は、図3に示した前記第2の実施例における音節内ピッ
チパタン生成部37に代えて、音素内ピッチパタン生成
部38を備えたものである。
【0044】アクセント句内ピッチパタン生成部36
は、前記第2の実施例におけるアクセント句内ピッチパ
タン生成部36と同様に、アクセント句内の各音素につ
いて1点のピッチ周波数を求める。但し、「s」や
「t」などの無声音素に関しては、ピッチ周波数を求め
ない。
【0045】音素内ピッチパタン生成部38は、前記第
2の実施例における音節内ピッチパタン生成部37と同
様に、各音素について数点のピッチ制御点を、テーブル
を引くことで求める。音素毎に求められるピッチ制御点
の数は、音素の種類、位置、前後の音素との関係によっ
て異なるが、この数も上記テーブルを引くことで求め
る。
【0046】次に本発明の第4の実施例について説明す
る。図6は、本発明の第4の実施例の構成を示す図であ
る。図7は、本発明の第4の実施例において生成される
各ピッチパタンの一例を示す図である。
【0047】図6を参照すると、本発明の第4の実施例
においては、前記第2の実施例の構成に加えて、呼気段
落ラフピッチパタン生成部39を備える。
【0048】呼気段落ラフピッチパタン生成部39は、
入力テキスト11から、呼気段落ラフピッチパタン29
を生成する。
【0049】呼気段落ラフピッチパタン29は、与えら
れた入力テキスト11の中の各呼気段落について、予め
決められた一定数のピッチ制御点を求める。本実施例で
は、1呼気段落について、始端周波数、終端周波数の2
点を求め、呼気段落ラフピッチパタン29とする(図7
(b)参照)。これらの2点の周波数は、呼気段落に対
応しており、実際の時刻には対応していない。
【0050】アクセント句ラフピッチパタン生成部35
は、前記第2の実施例におけるアクセント句ラフピッチ
パタン生成部35とは相違して、入力テキスト11と呼
気段落ラフピッチパタン29から、アクセント句ラフピ
ッチパタン25を生成する(図7(c)参照)。
【0051】次に本発明の第5の実施例について説明す
る。図8は、本発明の第5の実施例の構成を示す図であ
る。図9は、本発明の第5の実施例において生成される
各ピッチパタンの一例を示す図である。
【0052】図8を参照すると、本発明の第5の実施例
においては、図3を参照して説明した前記第2の実施例
に加えて、マイクロプロソディ重畳部51を備える。
【0053】マイクロプロソディ重畳部51は、入力テ
キスト11と継続時間長情報12と平滑化ピッチパタン
24から、マイクロプロソディを生成し、平滑化ピッチ
パタン24(図9(a)参照)に重畳する。
【0054】マイクロプロソディ重畳部51がマイクロ
プロソディを生成する手順は、以下のようになる。
【0055】最初に、入力テキスト11から、予め決め
られた探索規則によって、マイクロプロソディを重畳す
べき箇所を探索する。本実施例では、音素「r」に対応
する点について検索されたマイクロプロソディ(図9
(c)参照)を重畳することとする。
【0056】次に、継続時間長情報12から、マイクロ
プロソディを重畳する箇所の時間長と時刻を求める。
【0057】その後、重畳する箇所の前後の音素環境か
ら、予め決められたマイクロプロソディのパタンを選択
し、重畳する時間長にあわせて線形伸縮してマイクロプ
ロソディパタンを生成する(図9(d)参照)。
【0058】マイクロプロソディ重畳部51は、先に求
めた重畳する時刻から、重畳する時間長だけ、平滑化ピ
ッチパタン24に対してマイクロプロソディパタンを加
算し(図9(e)参照)、詳細ピッチパタン52を得
る。
【0059】波形生成部43は、詳細ピッチパタン52
と継続時間長情報12と音韻情報13から、音声波形1
4を生成する。
【0060】
【発明の効果】以上説明したように、本発明によれば下
記記載の効果を奏する。
【0061】本願第1発明の効果は、ピッチ周波数を階
層的に生成することにより、与えられた文あるいは単語
などの全体の構造を生かしたまま、詳細なピッチパタン
を生成することでき、自然性が高く個人性をよく表した
合成音声を生成することができる、ということである。
【0062】本願第2発明の効果は、音節を単位とし
て、詳細なピッチパタンを生成することでき、自然性が
高く個人性をよく表した合成音声を生成することができ
る、ということである。
【0063】本願第3発明の効果は、音素を単位とし
て、詳細なピッチパタンを生成することでき、自然性が
高く個人性をよく表した合成音声を生成することができ
る、ということである。
【0064】本願第4発明の効果は、与えられた文全体
の中での呼気段落の影響を反映させた合成音声を生成す
ることができる、ということである。
【0065】本願第5発明の効果は、ピッチが急変する
部分をより詳細に表現したピッチパタンを持つ、合成音
声を生成することができる、ということである。
【図面の簡単な説明】
【図1】本発明の第1の実施例の構成を示す図である。
【図2】本発明の第1の実施例における、各段で生成さ
れるピッチパタンの例を説明する図である。
【図3】本発明の第2の実施例の構成を示す図である。
【図4】本発明の第2の実施例における、各段で生成さ
れるピッチパタンの例を説明する図である。
【図5】本発明の第3の実施例の構成を示す図である。
【図6】本発明の第4の実施例の構成を示す図である。
【図7】本発明の第4の実施例における、各段で生成さ
れるピッチパタンの例を説明する図である。
【図8】本発明の第5の実施例の構成を示す図である。
【図9】本発明の第5の実施例における、各段で生成さ
れるピッチパタンの例を説明する図。
【符号の説明】
11 入力テキスト 12 継続時間長情報 13 音韻情報 14 音声波形 21 第1段ピッチパタン 22 第2段ピッチパタン 23 第3段ピッチパタン 24 平滑化ピッチパタン 25 アクセント句ラフピッチパタン 26 アクセント句内ピッチパタン 27 音節内ピッチパタン 28 音素内ピッチパタン 29 呼気段落ラフピッチパタン 31 ピッチパタン第1段生成部 32 ピッチパタン第2段生成部 33 ピッチパタン第3段生成部 34 ピッチパタン平滑部 35 アクセント句ラフピッチパタン生成部 36 アクセント句内ピッチパタン生成部 37 音節内ピッチパタン生成部 38 音素内ピッチパタン生成部 39 呼気段落ラフピッチパタン生成部 41 継続時間長生成部 42 音韻選択部 43 波形生成部 51 マイクロプロソディ重畳部 52 詳細ピッチパタン

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】少なくとも3段階以上階層的にピッチの制
    御点を生成する手段と、 前記各ピッチ制御点の間を滑らかに結ぶことでピッチパ
    タンを生成する手段と、を備えたことを特徴とする音声
    合成装置。
  2. 【請求項2】第1段階でアクセント句の代表ピッチをピ
    ッチ制御点として生成する手段と、 第2段階で該アクセント句の代表ピッチを用いて音節の
    代表ピッチをピッチ制御点として生成する手段と、 前記第3段階で音節内の複数のピッチ制御点を生成する
    手段と、 を備えたことを特徴とする請求項1記載の音声合成装
    置。
  3. 【請求項3】第2段階の音節内の代表ピッチに代えて、
    音素の代表ピッチをピッチ制御点として生成する手段を
    備えたことを特徴とする請求項1又は2記載の音声合成
    装置。
  4. 【請求項4】アクセント句より長い単位に対して代表ピ
    ッチを決定する手段と、 これを用いてアクセント句の代表ピッチを生成する手段
    と、 を備えたことを特徴とする請求項2又は3記載の音声合
    成装置。
  5. 【請求項5】求めたピッチパタンの部分あるいは全体に
    対して、別にマイクロプロソディを選択し、重畳する手
    段を備えたことを特徴とする請求項1乃至4のいずれか
    一に記載の音声合成装置。
  6. 【請求項6】入力テキストに対する継続時間長情報を生
    成する手段と、 前記入力テキストから数点のピッチ制御点で表現される
    第1段ピッチパタンを生成する手段と、 前記入力テキスト、前記継続時間長情報、前記第1段ピ
    ッチパタンを用いて、より詳細な第2段ピッチパタンを
    生成する手段と、 前記入力テキスト、前記継続時間長情報、前記第2段ピ
    ッチパタンを用いて、より詳細な第3段ピッチパタンを
    生成する手段と、 前記第3段ピッチパタンから滑らかな平滑化ピッチパタ
    ンを生成する手段と、 前記入力テキストから音韻情報を生成する音韻選択手段
    と、 前記平滑化ピッチパタンと前記継続時間長情報と前記音
    韻情報とから音声波形を生成する手段と、 を備えたことを特徴とする音声合成装置。
  7. 【請求項7】入力テキストに対する継続時間長情報を生
    成する手段と、 入力テキストからの中の各アクセント句について予め定
    められた一定数のピッチ制御点を求めアクセント句ラフ
    ピッチパタンを生成する手段と、 前記入力テキストと継続時間長情報と前記アクセント句
    ラフピッチパタンとから、前記アクセント句内の代表ピ
    ッチを用いて音節の代表ピッチをピッチ制御点として求
    めアクセント句内ピッチパタンを生成する手段と、 前記入力テキストと前記継続時間長情報と前記アクセン
    ト句内ピッチパタンとから音節内の複数のピッチ制御点
    を求め音節内ピッチパタンを生成する手段と、 前記音節内ピッチパタンから滑らかな平滑化ピッチパタ
    ンを生成する手段と、 前記入力テキストから音韻情報を生成する音韻選択手段
    と、 前記平滑化ピッチパタンと前記継続時間長情報と前記音
    韻情報とから音声波形を生成する手段と、 を備えたことを特徴とする音声合成装置。
  8. 【請求項8】入力テキストに対する継続時間長情報を生
    成する手段と、 入力テキストからの中の各アクセント句について予め定
    められた一定数のピッチ制御点を求めアクセント句ラフ
    ピッチパタンを生成する手段と、 前記入力テキストと継続時間長情報と前記アクセント句
    ラフピッチパタンとから、前記アクセント句内の代表ピ
    ッチを用いて音節の代表ピッチをピッチ制御点として求
    めアクセント句内ピッチパタンを生成する手段と、 前記入力テキストと前記継続時間長情報と前記アクセン
    ト句内ピッチパタンとから音素の代表ピッチをピッチ制
    御点として生成する手段と、 前記音素内ピッチパタンから滑らかな平滑化ピッチパタ
    ンを生成する手段と、 前記入力テキストから音韻情報を生成する音韻選択手段
    と、 前記平滑化ピッチパタンと前記継続時間長情報と前記音
    韻情報とから音声波形を生成する手段と、 を備えたことを特徴とする音声合成装置。
  9. 【請求項9】入力テキストに対する継続時間長情報を生
    成する手段と、 入力テキストからの中の各アクセント句について予め定
    められた一定数のピッチ制御点を求めアクセント句ラフ
    ピッチパタンを生成する手段と、 前記入力テキストと継続時間長情報と前記アクセント句
    ラフピッチパタンとから、前記アクセント句内の代表ピ
    ッチを用いて音節の代表ピッチをピッチ制御点として求
    めアクセント句内ピッチパタンを生成する手段と、 前記入力テキストと前記継続時間長情報と前記アクセン
    ト句内ピッチパタンとから音節内の複数のピッチ制御点
    を求め音節内ピッチパタンを生成する手段と、 前記音節内ピッチパタンから滑らかな平滑化ピッチパタ
    ンを生成する手段と、 前記入力テキストから音韻情報を生成する音韻選択手段
    と、 前記平滑化ピッチパタンと前記継続時間長情報と前記音
    韻情報とから音声波形を生成する手段と、 を備えたことを特徴とする音声合成装置。
  10. 【請求項10】入力テキストに対する継続時間長情報を
    生成する手段と、 入力テキストの中の各呼気段落について、予め定められ
    た一定数のピッチ制御点を求め呼気段落ラフピッチパタ
    ンを生成する手段と、 前記入力テキストと前記呼気段落ラフピッチパタンか
    ら、アクセント句ラフピッチパタンを生成する手段と、 前記入力テキストと前記継続時間長情報と前記アクセン
    ト句ラフピッチパタンとから、前記アクセント句内の代
    表ピッチを用いて音節の代表ピッチをピッチ制御点とし
    て求めアクセント句内ピッチパタンを生成する手段と、 前記入力テキストと前記継続時間長情報と前記アクセン
    ト句内ピッチパタンから音節内の複数のピッチ制御点を
    求め音節内ピッチパタンを生成する手段と、 前記音節内ピッチパタンから滑らかな平滑化ピッチパタ
    ンを生成する手段と、 前記入力テキストから音韻情報を生成する音韻選択手段
    と、 前記平滑化ピッチパタンと前記継続時間長情報と前記音
    韻情報とから音声波形を生成する手段と、 を備えたことを特徴とする音声合成装置。
  11. 【請求項11】入力テキストに対する継続時間長情報を
    生成する手段と、 入力テキストからの中の各アクセント句について予め定
    められた一定数のピッチ制御点を求めアクセント句ラフ
    ピッチパタンを生成する手段と、 前記入力テキストと前記継続時間長情報と前記アクセン
    ト句ラフピッチパタンとから、前記アクセント句内の代
    表ピッチを用いて音節の代表ピッチをピッチ制御点とし
    て求めアクセント句内ピッチパタンを生成する手段と、 前記入力テキストと前記継続時間長情報と前記アクセン
    ト句内ピッチパタンから音節内の複数のピッチ制御点を
    求め音節内ピッチパタンを生成する手段と、 前記音節内ピッチパタンから滑らかな平滑化ピッチパタ
    ンを生成する手段と、 前記入力テキストから音韻情報を生成する音韻選択手段
    と、 前記入力テキストと前記継続時間長情報と前記平滑化ピ
    ッチパタンから、マイクロプロソディを生成し前記平滑
    化ピッチパタンに重畳して詳細ピッチパタンを生成する
    手段と、 前記詳細ピッチパタンと前記継続時間長情報と前記音韻
    情報から音声波形を生成する手段と、 を備えたことを特徴とする音声合成装置。
JP10173175A 1998-06-19 1998-06-19 音声合成装置 Pending JP2000010581A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10173175A JP2000010581A (ja) 1998-06-19 1998-06-19 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10173175A JP2000010581A (ja) 1998-06-19 1998-06-19 音声合成装置

Publications (1)

Publication Number Publication Date
JP2000010581A true JP2000010581A (ja) 2000-01-14

Family

ID=15955492

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10173175A Pending JP2000010581A (ja) 1998-06-19 1998-06-19 音声合成装置

Country Status (1)

Country Link
JP (1) JP2000010581A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002073595A1 (fr) * 2001-03-08 2002-09-19 Matsushita Electric Industrial Co., Ltd. Dispositif generateur de prosodie, procede de generation de prosodie, et programme
US7526430B2 (en) 2004-06-04 2009-04-28 Panasonic Corporation Speech synthesis apparatus
JP2014215302A (ja) * 2013-04-22 2014-11-17 カシオ計算機株式会社 音声翻訳装置、音声翻訳方法及びプログラム
JP2016118722A (ja) * 2014-12-22 2016-06-30 カシオ計算機株式会社 音声合成装置、方法、およびプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002073595A1 (fr) * 2001-03-08 2002-09-19 Matsushita Electric Industrial Co., Ltd. Dispositif generateur de prosodie, procede de generation de prosodie, et programme
US7200558B2 (en) 2001-03-08 2007-04-03 Matsushita Electric Industrial Co., Ltd. Prosody generating device, prosody generating method, and program
US8738381B2 (en) 2001-03-08 2014-05-27 Panasonic Corporation Prosody generating devise, prosody generating method, and program
US7526430B2 (en) 2004-06-04 2009-04-28 Panasonic Corporation Speech synthesis apparatus
JP2014215302A (ja) * 2013-04-22 2014-11-17 カシオ計算機株式会社 音声翻訳装置、音声翻訳方法及びプログラム
JP2016118722A (ja) * 2014-12-22 2016-06-30 カシオ計算機株式会社 音声合成装置、方法、およびプログラム

Similar Documents

Publication Publication Date Title
JP4551803B2 (ja) 音声合成装置及びそのプログラム
JP3838039B2 (ja) 音声合成装置
JP2007249212A (ja) テキスト音声合成のための方法、コンピュータプログラム及びプロセッサ
JP2008545995A (ja) ハイブリッド音声合成装置、方法および用途
JPH031200A (ja) 規則型音声合成装置
KR20200092505A (ko) 심층 합성곱 신경망 인공지능을 기반으로 한 미세조정을 통해 소량의 샘플로 화자 적합된 음성합성 모델을 생성하는 방법
JP2002358090A (ja) 音声合成方法、音声合成装置及び記録媒体
CN1787072B (zh) 基于韵律模型和参数选音的语音合成方法
JP3728173B2 (ja) 音声合成方法、装置および記憶媒体
JP2001242882A (ja) 音声合成方法及び音声合成装置
JP2000010581A (ja) 音声合成装置
KR0146549B1 (ko) 한국어 텍스트/음성 변환 방법
Tsirulnik et al. Singing voice database
JPH08335096A (ja) テキスト音声合成装置
JP4353174B2 (ja) 音声合成装置
KR0173340B1 (ko) 텍스트/음성변환기에서 억양패턴 정규화와 신경망 학습을 이용한 억양 생성 방법
Hinterleitner et al. Speech synthesis
JP3437472B2 (ja) 音声合成方法とその装置
JP2003330482A (ja) 基本周波数パターン生成方法、基本周波数パターン生成装置、音声合成方法、音声合成装置、基本周波数パターン生成プログラムおよび音声合成プログラム
JP2910587B2 (ja) 音声合成装置
JP3310217B2 (ja) 音声合成方法とその装置
KR20220125005A (ko) 화자 적합성이 향상된 음성합성 모델 생성방법
Muralishankar et al. Human touch to Tamil speech synthesizer
JPH06250685A (ja) 音声合成方式および規則合成装置
JP3515268B2 (ja) 音声合成装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20010717