JPH06118991A - 音声合成方法 - Google Patents

音声合成方法

Info

Publication number
JPH06118991A
JPH06118991A JP4265059A JP26505992A JPH06118991A JP H06118991 A JPH06118991 A JP H06118991A JP 4265059 A JP4265059 A JP 4265059A JP 26505992 A JP26505992 A JP 26505992A JP H06118991 A JPH06118991 A JP H06118991A
Authority
JP
Japan
Prior art keywords
information
power
speech
vowel
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4265059A
Other languages
English (en)
Inventor
Kenzo Ito
憲三 伊藤
Yamato Sato
大和 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP4265059A priority Critical patent/JPH06118991A/ja
Publication of JPH06118991A publication Critical patent/JPH06118991A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 音声単位を接続して連続音声を合成するにあ
たり、連続的で滑らかな音声パワーとなるようにする。 【構成】 音声合成すべきテキストを端子10から入力
する。テキスト解析部20は入力テキストを解析して音
韻系列情報や形態素情報を得る。情報格納メモリ30
は、合成用の各種情報(国語辞書、アクセント辞書、パ
ワー情報など)を蓄積している。韻律情報生成部40
は、テキスト解析部20の出力情報と情報格納メモリ3
0の情報を参照し、韻律情報を生成する。母音パワー設
定部51は、音韻環境情報やピッチ情報をもとに母音の
音声パワーを求める。母音以外パワー設定部52は、求
まった母音パワーを利用し、母音に挟まれた音韻のパワ
ー包絡を決定する。音声合成部60は音声単位の接続を
し、端末70より合成音声を出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、規則や合成用各種情報
テーブルによって任意の音声を合成する方法の改良に関
する。
【0002】
【従来の技術】種々の音声単位を接続して連続音声を合
成する装置において、品質の良い合成音声を自動的に生
成するためには、種々の制御規則が重要となる。特に、
音声情報の中で韻律情報に関する制御規則が合成音声の
品質におよばず影響は大きい。従来、この韻律規則の中
では、ピッチパタン生成規則や音韻継続時間制御規則に
関するものが多かったが、合成音声の品質の向上が要求
されるに従って、これまで制御の対象となっていなかっ
た音声単位(例えば音素)のパワーに関する規則が重要
視されるようになってきた。この場合、例えば三木他、
音声研究会資料、SP91−4、1991年4月、また
は、伊藤他、音声研究会資料、SP91−12、199
1年12月に記載されているように、従来はパワー制御
を音声単位で独立に行っていた。
【0003】
【発明が解決しようとする課題】従来の音声単位パワー
の制御技術では、図3(a)に示すように、得られた合
成音声パワーの連続性が保証されず、このような不連続
な合成音声パワーで連続音声を合成した場合には、品質
に劣化をきたす問題があった。
【0004】本発明の目的は、音声単位のパワーを積極
的に制御する必要のある高品質の規則合成法において、
連続的で滑らかな音声パワーとなるように制御できる音
声合成方法を提供することにある。
【0005】
【課題を解決するための手段】上記目的を達成するた
め、本発明は、合成すべき母音の音声パワーは規則や情
報テーブルによって求め、母音に挟まれる母音以外の音
韻のパワーは、既に求めた両側の母音パワーを利用して
包絡曲線で近似表現することを特徴とするものである。
【0006】
【作用】本発明では、まず、合成すべき母音の音声パワ
ーは従来法で求め、次に、母音に挟まれる母音以外の音
韻のパワーを、既に求まっている母音のパワー情報から
求める。すなわち、まず、精度の高い母音音声パワー推
定法等によって、合成すべき音韻系列に従って母音部分
の音声パワーを求め、この得られた母音パワーを参考に
して、順次、母音に隣接する音韻のパワー包絡を決定す
る。これにより、従来法で考慮されていない各音声単位
間のパワーの連続性が保証されると共に、音声単位パワ
ーの推定が母音だけで済む利点がある。従って、特別な
補間処理を施さないで、滑らかで自然性に富む合成音声
を生成することができる。
【0007】
【実施例】以下、本発明の一実施例について図面により
説明する。
【0008】図1は本発明の一実施例の構成図で、本発
明をテキストから音声を合成する装置例に適用したもの
である。図において、音声パワー設定部50内の母音以
外パワー設定部52が本発明にかかるもので、その他の
構成は従来と基本的に同様である。情報格納メモリ30
には、音声合成に用いる各種情報、例えば、国語辞書、
アクセント辞書(単語や句に対するアクセント情報)、
音声単位、3組音韻に関連する各種音韻の継続時間長や
音韻の持つパワー情報などが格納されている。
【0009】まず、合成すべきテキストを合成テキスト
入力端子10に与える。このテキストは、通常、漢字と
仮名で表記されたものであるが、他の情報(例えば句切
り記号)が付加されたテキスト情報などもあり得る。テ
キスト解析部20では、入力されたテキストを情報格納
メモリ30に格納されている情報(例えば国語辞書な
ど)を用いて解析し、テキストの読みの情報(例えば音
韻記号列に代表されるような音韻系列情報、形態素情報
など)、その他韻律生成に必要な情報などを得る。韻律
情報生成部40では、テキスト解析部40の出力情報
(音韻系列情報、形態素情報など)と、情報格納メモリ
30に格納されている情報(例えば、単語や句に対する
アクセント情報、3組音韻に関連する各種音韻の継続時
間長や音韻の持つパワー情報)などを参照して、合成す
べきテキストに対応する基本周期系列(ピッチパタ
ン)、入力音韻系列に対する各音韻の継続時間長を生成
する。
【0010】音声パワー設定部50では音声単位パワー
の設定を行うが、これを母音区間とそれ以外の音韻区間
に分けて行う。すなわち、母音区間は、母音パワー設定
部51において、情報格納メモリ30に格納されている
情報(合成に用いる音声単位、パワー情報など)を参照
し、韻律情報生成部40で生成された音韻環境情報とピ
ッチ情報を最適併用する従来法で音声単位パワーの設定
を行う。それ以外の音韻区間は、母音以外パワー設定部
52において、上記母音パワー設定部51であらかじめ
設定された隣接する母音パワー情報を利用して、間に挟
まれた音声単位のパワーを設定する。
【0011】図2に母音以外パワー設定部52での処理
の概要を示す。この図2は、母音V1と母音V2に挟ま
れた有声子音Cvの音声パワーを、音韻パワー包絡Fp
(i)として、 Fp(i)=1-{0.5(1-cos(2πi/L))}β+{i(Pv2-Pv1)/Pv2}/L (1) の式で求めることを示している。ここで、Pv1とPv
2は母音V1と母音V2の接続点近傍におけるパワー、
Lはパワー制御する音声区間長、βは重み形状を示す係
数で、音韻の種類によって0.0〜1.0の間で決め
る。
【0012】上記パワー制御はピッチ同期で行い、音声
合成部60で音声単位の接続をすることで、合成音声出
力端子70から合成音声を得る。図3(b)は、出力端
子70から得られる本発明によって合成された音声パワ
ーパタンの概念図であり、各音声単位間のパワーの連続
性が保証されていることを示している。
【0013】なお、無声音のパワーも、本発明で設定で
きるが、具体的なパワー制御処理はピッチ非同期処理で
行えばよい。
【0014】
【発明の効果】以上説明したように、本発明によれば、
母音以外の音韻区間のパワーを隣接する母音パワー情報
を用いて効率良く、しかも、精度良く制御できるため、
波形合成型の音声合成法など、特に品質の高い合成法に
おいてその効果がおおいに期待でき、肉声に近い高品質
の合成音声を容易に得ることが可能になる。また、本発
明は、波形合成型の音声合成法に限らず、音響パラメー
タを利用する高能率の音声分析合成方式を基本とする種
々の音声合成装置にも当然適用可能であり、その効果も
大きい。
【図面の簡単な説明】
【図1】本発明の一実施例を示す構成図である。
【図2】本発明により母音に挟まれた音韻のパワー包絡
を求める概念図である。
【図3】従来法と本発明によって合成された音声パワー
パタンを示す概念図である。
【符号の説明】
20 テキスト解析部 30 情報格納メモリ 40 韻律情報生成部 50 音声パワー設定部 52 母音以外パワー設定部 60 音声合成部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 音声単位を接続して連続音声を合成する
    方法において、合成すべき母音の音声パワーは規則や情
    報テーブルによって求め、母音に挟まれる母音以外の音
    韻のパワーは、既に求めた両側の母音パワーを利用して
    包絡曲線で近似表現することを特徴とする音声合成方
    法。
JP4265059A 1992-10-02 1992-10-02 音声合成方法 Pending JPH06118991A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4265059A JPH06118991A (ja) 1992-10-02 1992-10-02 音声合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4265059A JPH06118991A (ja) 1992-10-02 1992-10-02 音声合成方法

Publications (1)

Publication Number Publication Date
JPH06118991A true JPH06118991A (ja) 1994-04-28

Family

ID=17412016

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4265059A Pending JPH06118991A (ja) 1992-10-02 1992-10-02 音声合成方法

Country Status (1)

Country Link
JP (1) JPH06118991A (ja)

Similar Documents

Publication Publication Date Title
US5790978A (en) System and method for determining pitch contours
JP2000163088A (ja) 音声合成方法および装置
JPH08335096A (ja) テキスト音声合成装置
JP2894447B2 (ja) 複合音声単位を用いた音声合成装置
JPH06118991A (ja) 音声合成方法
Repe et al. Prosody model for marathi language TTS synthesis with unit search and selection speech database
Dessai et al. Development of Konkani TTS system using concatenative synthesis
JP2995814B2 (ja) 音声合成方法
Taylor Synthesizing intonation using the RFC model.
Eady et al. Pitch assignment rules for speech synthesis by word concatenation
JP2573586B2 (ja) 規則型音声合成装置
JP3308875B2 (ja) 音声合成方法および装置
JPH06149283A (ja) 音声合成装置
Butler et al. Articulatory constraints on vocal tract area functions and their acoustic implications
JPH06138894A (ja) 音声合成装置及び音声合成方法
JP2573585B2 (ja) 音声スペクトルパタン生成装置
May et al. Speech synthesis using allophones
JPH06167989A (ja) 音声合成装置
JPS58168096A (ja) 複数言語音声合成装置
JP2601302B2 (ja) 音声合成装置におけるピッチ周波数生成装置
JPH08160990A (ja) 音声合成装置
Sorace The dialogue terminal
JPH07140999A (ja) 音声合成装置及び音声合成方法
Randolph et al. Synthesis of continuous speech by concatenation of isolated words
Yea et al. Formant synthesis: Technique to account for source/tract interaction