JPS6295599A - 残差駆動型音声合成方式 - Google Patents
残差駆動型音声合成方式Info
- Publication number
- JPS6295599A JPS6295599A JP60236929A JP23692985A JPS6295599A JP S6295599 A JPS6295599 A JP S6295599A JP 60236929 A JP60236929 A JP 60236929A JP 23692985 A JP23692985 A JP 23692985A JP S6295599 A JPS6295599 A JP S6295599A
- Authority
- JP
- Japan
- Prior art keywords
- waveform
- sound source
- speech
- residual
- synthesis method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Audible-Bandwidth Dynamoelectric Transducers Other Than Pickups (AREA)
- Selective Calling Equipment (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
技術分野
本発明は残差駆動による音声合成方式、より詳細には、
高品質の合成音声を得るための駆動波形生成方式に関す
る。
高品質の合成音声を得るための駆動波形生成方式に関す
る。
従来技術
音声の分析合成方式においては、その生成モデルに基づ
き、スペクトルパラメータ (LPC、PARCOR。
き、スペクトルパラメータ (LPC、PARCOR。
LSPなど)と音源信号を音声合成フィルタに与えて合
成音声を得ている。スペクトルパラメータは。
成音声を得ている。スペクトルパラメータは。
声道特性を全極モデルで近似することによって得られる
ものであり、このモデルに立脚すれば残差波形のスペク
トルは白色化される。従って、有声音部の音源信号には
インパルス列、無声音部の音源信号には白色雑音が多く
用いられてきた。
ものであり、このモデルに立脚すれば残差波形のスペク
トルは白色化される。従って、有声音部の音源信号には
インパルス列、無声音部の音源信号には白色雑音が多く
用いられてきた。
しかしながら、実際の音声生成過程は、全極モデルとは
一致しないため、残差波形のスペクトルは、完全に白色
化されることなく、有声音部の音源としてインパルス列
を用いた場合、十分な音質が得られないという欠点があ
る。
一致しないため、残差波形のスペクトルは、完全に白色
化されることなく、有声音部の音源としてインパルス列
を用いた場合、十分な音質が得られないという欠点があ
る。
目 的
本発明は、上述のごとき実情に鑑みてなされたもので、
特に、駆動音源に残差から抽出される対称波を用いるこ
とによって、高品質な合成音声を得ることを目的とする
ものである。
特に、駆動音源に残差から抽出される対称波を用いるこ
とによって、高品質な合成音声を得ることを目的とする
ものである。
構 成
本発明は、上記目的を達成するために、音声の生成モデ
ルに基づき、スペクトル情報と音源情報とから音声を合
成する音声分析合成方式において、合成音声の少なくと
も有声音部は、合成器の逆フィルタから抽出される残差
波形を整形して得られる対称波を音源として用いる残差
駆動型音声合成方式を特徴としたものである。以下、本
発明の実施例に基づいて説明する。
ルに基づき、スペクトル情報と音源情報とから音声を合
成する音声分析合成方式において、合成音声の少なくと
も有声音部は、合成器の逆フィルタから抽出される残差
波形を整形して得られる対称波を音源として用いる残差
駆動型音声合成方式を特徴としたものである。以下、本
発明の実施例に基づいて説明する。
第1図は、逆フィルタから抽出される有声音部の残差波
形から、長時間平均型カスベクトルを求め、これに位相
処理を施すことによって対称波を生成し、音声合成フィ
ルタの駆動音源として用いるようにした駆動波生成過程
の一実施例を説明するための図で、図中、1は残差波形
部、2は窓かけ部、3はFET、4は位相処理部、5は
逆FET、6は駆動音源部で、まず、母音定常部等の有
声音部の残差波形(A)を逆フィルタを通すことによっ
て求める。この残差にハミング等の窓(B)かけ処理を
施し、一定時間長の波形を切り出す。
形から、長時間平均型カスベクトルを求め、これに位相
処理を施すことによって対称波を生成し、音声合成フィ
ルタの駆動音源として用いるようにした駆動波生成過程
の一実施例を説明するための図で、図中、1は残差波形
部、2は窓かけ部、3はFET、4は位相処理部、5は
逆FET、6は駆動音源部で、まず、母音定常部等の有
声音部の残差波形(A)を逆フィルタを通すことによっ
て求める。この残差にハミング等の窓(B)かけ処理を
施し、一定時間長の波形を切り出す。
次に、この切り出された波形をフーリエ変換してスペク
トルを求めた後1位相処理(C)又は(E)を行い、逆
フーリエ変換によって対称波(D)又は(F)を生成す
る。対称波を得るための位相処理には、0位相(C)つ
まりスペクトルをCOS成分のみにする方法(線対称化
)と、π/2位相化(F)つまりスペクトルをsin成
分のみにする方法(点対称化)がある。フーリエ変換、
逆フーリエ変換は、FFT、逆FFTにより高速に実行
することが可能である。なお、駆動音源となる対称波は
、1つの合成系に1種類である必要はなく、5母音に対
してそれぞれ独立のものを求める等、合成時に必要とさ
れる複数の波形を用意してもよい。
トルを求めた後1位相処理(C)又は(E)を行い、逆
フーリエ変換によって対称波(D)又は(F)を生成す
る。対称波を得るための位相処理には、0位相(C)つ
まりスペクトルをCOS成分のみにする方法(線対称化
)と、π/2位相化(F)つまりスペクトルをsin成
分のみにする方法(点対称化)がある。フーリエ変換、
逆フーリエ変換は、FFT、逆FFTにより高速に実行
することが可能である。なお、駆動音源となる対称波は
、1つの合成系に1種類である必要はなく、5母音に対
してそれぞれ独立のものを求める等、合成時に必要とさ
れる複数の波形を用意してもよい。
更に、本発明においては、上記目的を達成するために、
前記のスペクトルの位相処理に加えて、分析に使用した
音声のピッチ成分の除去処理を行い、ピッチ成分を含ま
ない対称波を生成し、音声合成フィルタの駆動音源とし
て用いるようにしている。
前記のスペクトルの位相処理に加えて、分析に使用した
音声のピッチ成分の除去処理を行い、ピッチ成分を含ま
ない対称波を生成し、音声合成フィルタの駆動音源とし
て用いるようにしている。
第2図は、前記ピッチ成分除去処理の実施例を示す図で
、図中、11は対数変換部、12は逆FET、13はリ
フタリング、14はFET、15は指数変換部で、窓か
けされた残差波形のスペクトルに位相処理を施した後、
対数変換と逆フーリエ変換によって、残差のスケブトラ
ムを求める。この操作により、スケブトラムの高次の項
に分離されたピッチ成分をリフタリングにより取り除き
、フーリエ変換と指数変換によってピッチ成分の除去さ
れた残差のスペクトルを得る。対称波は、この残差スペ
クトルを逆フーリエ変換することにより得られる。第2
図において、Aは、この実施例により生成された対称波
である。
、図中、11は対数変換部、12は逆FET、13はリ
フタリング、14はFET、15は指数変換部で、窓か
けされた残差波形のスペクトルに位相処理を施した後、
対数変換と逆フーリエ変換によって、残差のスケブトラ
ムを求める。この操作により、スケブトラムの高次の項
に分離されたピッチ成分をリフタリングにより取り除き
、フーリエ変換と指数変換によってピッチ成分の除去さ
れた残差のスペクトルを得る。対称波は、この残差スペ
クトルを逆フーリエ変換することにより得られる。第2
図において、Aは、この実施例により生成された対称波
である。
第3図は、本発明の他の実施例を説明するための図で、
この実施例ではスペクトルの位相処理のみによって生成
された対称波(a)に窓かけ(b)を行うことによって
、ピッチ成分の除去(c)を行っている。なお、このと
きの窓長はピッチ周期の2倍以下に設定する。
この実施例ではスペクトルの位相処理のみによって生成
された対称波(a)に窓かけ(b)を行うことによって
、ピッチ成分の除去(c)を行っている。なお、このと
きの窓長はピッチ周期の2倍以下に設定する。
第4図は、以上のようにして生成された対称波から、ピ
ッチ情報に基づいて生成された駆動音源の例を示す図で
、(a)は対称波、(b)はピッチ周期(λ)の短い場
合の駆動音源、(。)はピッチ周期(λl)の長い場合
の駆動音源の例を示しており、ピッチ周期がかなり短い
場合でも、対称波の接続は、パワーの充分小さい部分で
行われるため、接続部における歪みはほとんど問題とな
らない。ピッチ周期を極端に長くする場合(原音ピッチ
の2倍以上)には、対称波に含、まれるピッチ成分が悪
影響を及ぼすので、ピッチ成分の除去された対称波を利
用する必要がある。
ッチ情報に基づいて生成された駆動音源の例を示す図で
、(a)は対称波、(b)はピッチ周期(λ)の短い場
合の駆動音源、(。)はピッチ周期(λl)の長い場合
の駆動音源の例を示しており、ピッチ周期がかなり短い
場合でも、対称波の接続は、パワーの充分小さい部分で
行われるため、接続部における歪みはほとんど問題とな
らない。ピッチ周期を極端に長くする場合(原音ピッチ
の2倍以上)には、対称波に含、まれるピッチ成分が悪
影響を及ぼすので、ピッチ成分の除去された対称波を利
用する必要がある。
効 果
以上の説明から明らかなように、本発明によると、残差
波形に含まれるスペクトル情報が駆動音源に保存される
ため、従来のインパルス駆動に比較して、より明瞭性、
自然性に優れた高品質の合成音声を得ることができる。
波形に含まれるスペクトル情報が駆動音源に保存される
ため、従来のインパルス駆動に比較して、より明瞭性、
自然性に優れた高品質の合成音声を得ることができる。
第1図は、本発明による音声合成方式の一実施例を説明
するための図、第2図は、ピッチ成分除去処理の一例を
説明するための図、第3図は、ピッチ成分除去処理の他
の例を説明するための図、第4図は、本発明によって生
成された駆動音源の例を説明するための図である。 1・・・残差波形部、2・・・窓かけ部、3・・・FE
T、4・・・位相処理部、5・・・逆FET、6・・・
駆動音源部。 特許出願人 株式会社 リコー 第 1 凹 第2図 厄3図 県4図 −)−′ λ
するための図、第2図は、ピッチ成分除去処理の一例を
説明するための図、第3図は、ピッチ成分除去処理の他
の例を説明するための図、第4図は、本発明によって生
成された駆動音源の例を説明するための図である。 1・・・残差波形部、2・・・窓かけ部、3・・・FE
T、4・・・位相処理部、5・・・逆FET、6・・・
駆動音源部。 特許出願人 株式会社 リコー 第 1 凹 第2図 厄3図 県4図 −)−′ λ
Claims (5)
- (1)、音声の生成モデルに基づき、スペクトル情報と
音源情報とから音声を合成する音声分析合成方式におい
て、合成音声の少なくとも有声音部は、合成器の逆フィ
ルタから抽出される残差波形を整形して得られる対称波
を音源として用いることを特徴とする残差駆動型音声合
成方式。 - (2)、残差波形をフーリエ変換し、そのスペクトルの
位相成分を0としてcos成分のみの偶関数とした後、
逆フーリエ変換して時間軸の原点に対して線対称化され
た波形を駆動音源として用いることを特徴とする特許請
求の範囲第(1)項に記載の音声合成方式。 - (3)、残差波形をフーリエ変換し、そのスペクトルの
位相成分をπ/2としてsin成分のみの奇関数とした
後、逆フーリエ変換して時間軸の原点に対して点対称化
された波形を駆動音源として用いることを特徴とする特
許請求の範囲第(1)項に記載の音声合成方式。 - (4)、残差波形のスペクトルに位相処理を施した後、
対数変換、逆フーリエ変換、リフタリング、フーリエ変
換、指数変換を順次行ってピッチ成分を除去し、逆フー
リエ変換によって得られる1ピッチ分のみの対称化され
た波形を駆動音源として用いることを特徴とする特許請
求の範囲第(2)項又は第(3)項に記載の音声合成方
式。 - (5)、残差波形の位相処理によって抽出される対称波
形に窓かけ処理を施し、ピッチ成分を除去した波形を駆
動音源として用いることを特徴とする特許請求の範囲第
(2)項又は第(3)項に記載の音声合成方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60236929A JPS6295599A (ja) | 1985-10-23 | 1985-10-23 | 残差駆動型音声合成方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60236929A JPS6295599A (ja) | 1985-10-23 | 1985-10-23 | 残差駆動型音声合成方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6295599A true JPS6295599A (ja) | 1987-05-02 |
Family
ID=17007842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60236929A Pending JPS6295599A (ja) | 1985-10-23 | 1985-10-23 | 残差駆動型音声合成方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6295599A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7228272B2 (en) | 2001-06-29 | 2007-06-05 | Microsoft Corporation | Continuous time warping for low bit-rate CELP coding |
-
1985
- 1985-10-23 JP JP60236929A patent/JPS6295599A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7228272B2 (en) | 2001-06-29 | 2007-06-05 | Microsoft Corporation | Continuous time warping for low bit-rate CELP coding |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rao et al. | Prosody modification using instants of significant excitation | |
JP3294604B2 (ja) | 波形の加算重畳による音声合成のための処理装置 | |
US8719030B2 (en) | System and method for speech synthesis | |
US6741960B2 (en) | Harmonic-noise speech coding algorithm and coder using cepstrum analysis method | |
Bonada et al. | Synthesis of the singing voice by performance sampling and spectral models | |
Moulines et al. | Time-domain and frequency-domain techniques for prosodic modification of speech | |
JPS62160495A (ja) | 音声合成装置 | |
JPH031200A (ja) | 規則型音声合成装置 | |
US20100217584A1 (en) | Speech analysis device, speech analysis and synthesis device, correction rule information generation device, speech analysis system, speech analysis method, correction rule information generation method, and program | |
Roebel | A shape-invariant phase vocoder for speech transformation | |
Ferreira et al. | A holistic glotal phase related feature | |
JP2904279B2 (ja) | 音声合成方法および装置 | |
Kannan et al. | Voice conversion using spectral mapping and TD-PSOLA | |
Wen et al. | Pitch-scaled spectrum based excitation model for HMM-based speech synthesis | |
JPS6295599A (ja) | 残差駆動型音声合成方式 | |
JP2612869B2 (ja) | 声質変換方法 | |
JP3089940B2 (ja) | 音声合成装置 | |
JP2866086B2 (ja) | 残差駆動型音声合成方式 | |
JPH07261798A (ja) | 音声分析合成装置 | |
Bonada et al. | Improvements to a sample-concatenation based singing voice synthesizer | |
JPS61259300A (ja) | 音声合成方式 | |
JP2987089B2 (ja) | 音声素片作成方法および音声合成方法とその装置 | |
JPS5965895A (ja) | 音声合成方法 | |
Reddy et al. | Neutral to joyous happy emotion conversion | |
JPS6228800A (ja) | 規則音声合成用駆動信号生成方法 |