JPS6295599A

JPS6295599A - 残差駆動型音声合成方式

Info

Publication number: JPS6295599A
Application number: JP60236929A
Authority: JP
Inventors: 博雄北川; 佐々部　昭一
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1985-10-23
Filing date: 1985-10-23
Publication date: 1987-05-02

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】技術分野本発明は残差駆動による音声合成方式、より詳細には、
高品質の合成音声を得るための駆動波形生成方式に関す
る。

従来技術音声の分析合成方式においては、その生成モデルに基づ
き、スペクトルパラメータ　（ＬＰＣ、ＰＡＲＣＯＲ。

ＬＳＰなど）と音源信号を音声合成フィルタに与えて合
成音声を得ている。スペクトルパラメータは。

声道特性を全極モデルで近似することによって得られる
ものであり、このモデルに立脚すれば残差波形のスペク
トルは白色化される。従って、有声音部の音源信号には
インパルス列、無声音部の音源信号には白色雑音が多く
用いられてきた。

しかしながら、実際の音声生成過程は、全極モデルとは
一致しないため、残差波形のスペクトルは、完全に白色
化されることなく、有声音部の音源としてインパルス列
を用いた場合、十分な音質が得られないという欠点があ
る。

目　　　　　的本発明は、上述のごとき実情に鑑みてなされたもので、
特に、駆動音源に残差から抽出される対称波を用いるこ
とによって、高品質な合成音声を得ることを目的とする
ものである。

構　　　成本発明は、上記目的を達成するために、音声の生成モデ
ルに基づき、スペクトル情報と音源情報とから音声を合
成する音声分析合成方式において、合成音声の少なくと
も有声音部は、合成器の逆フィルタから抽出される残差
波形を整形して得られる対称波を音源として用いる残差
駆動型音声合成方式を特徴としたものである。以下、本
発明の実施例に基づいて説明する。

第１図は、逆フィルタから抽出される有声音部の残差波
形から、長時間平均型カスベクトルを求め、これに位相
処理を施すことによって対称波を生成し、音声合成フィ
ルタの駆動音源として用いるようにした駆動波生成過程
の一実施例を説明するための図で、図中、１は残差波形
部、２は窓かけ部、３はＦＥＴ、４は位相処理部、５は
逆ＦＥＴ、６は駆動音源部で、まず、母音定常部等の有
声音部の残差波形（Ａ）を逆フィルタを通すことによっ
て求める。この残差にハミング等の窓（Ｂ）かけ処理を
施し、一定時間長の波形を切り出す。

次に、この切り出された波形をフーリエ変換してスペク
トルを求めた後１位相処理（Ｃ）又は（Ｅ）を行い、逆
フーリエ変換によって対称波（Ｄ）又は（Ｆ）を生成す
る。対称波を得るための位相処理には、０位相（Ｃ）つ
まりスペクトルをＣＯＳ成分のみにする方法（線対称化
）と、π／２位相化（Ｆ）つまりスペクトルをｓｉｎ成
分のみにする方法（点対称化）がある。フーリエ変換、
逆フーリエ変換は、ＦＦＴ、逆ＦＦＴにより高速に実行
することが可能である。なお、駆動音源となる対称波は
、１つの合成系に１種類である必要はなく、５母音に対
してそれぞれ独立のものを求める等、合成時に必要とさ
れる複数の波形を用意してもよい。

更に、本発明においては、上記目的を達成するために、
前記のスペクトルの位相処理に加えて、分析に使用した
音声のピッチ成分の除去処理を行い、ピッチ成分を含ま
ない対称波を生成し、音声合成フィルタの駆動音源とし
て用いるようにしている。

第２図は、前記ピッチ成分除去処理の実施例を示す図で
、図中、１１は対数変換部、１２は逆ＦＥＴ、１３はリ
フタリング、１４はＦＥＴ、１５は指数変換部で、窓か
けされた残差波形のスペクトルに位相処理を施した後、
対数変換と逆フーリエ変換によって、残差のスケブトラ
ムを求める。この操作により、スケブトラムの高次の項
に分離されたピッチ成分をリフタリングにより取り除き
、フーリエ変換と指数変換によってピッチ成分の除去さ
れた残差のスペクトルを得る。対称波は、この残差スペ
クトルを逆フーリエ変換することにより得られる。第２
図において、Ａは、この実施例により生成された対称波
である。

第３図は、本発明の他の実施例を説明するための図で、
この実施例ではスペクトルの位相処理のみによって生成
された対称波（ａ）に窓かけ（ｂ）を行うことによって
、ピッチ成分の除去（ｃ）を行っている。なお、このと
きの窓長はピッチ周期の２倍以下に設定する。

第４図は、以上のようにして生成された対称波から、ピ
ッチ情報に基づいて生成された駆動音源の例を示す図で
、（ａ）は対称波、（ｂ）はピッチ周期（λ）の短い場
合の駆動音源、（。）はピッチ周期（λｌ）の長い場合
の駆動音源の例を示しており、ピッチ周期がかなり短い
場合でも、対称波の接続は、パワーの充分小さい部分で
行われるため、接続部における歪みはほとんど問題とな
らない。ピッチ周期を極端に長くする場合（原音ピッチ
の２倍以上）には、対称波に含、まれるピッチ成分が悪
影響を及ぼすので、ピッチ成分の除去された対称波を利
用する必要がある。

効　　　果以上の説明から明らかなように、本発明によると、残差
波形に含まれるスペクトル情報が駆動音源に保存される
ため、従来のインパルス駆動に比較して、より明瞭性、
自然性に優れた高品質の合成音声を得ることができる。

【図面の簡単な説明】

第１図は、本発明による音声合成方式の一実施例を説明
するための図、第２図は、ピッチ成分除去処理の一例を
説明するための図、第３図は、ピッチ成分除去処理の他
の例を説明するための図、第４図は、本発明によって生
成された駆動音源の例を説明するための図である。１・・・残差波形部、２・・・窓かけ部、３・・・ＦＥ
Ｔ、４・・・位相処理部、５・・・逆ＦＥＴ、６・・・
駆動音源部。特許出願人　　　株式会社　リコー第　１　　凹第２図　　　厄３図県４図 −）−′ λ

Claims

【特許請求の範囲】

（１）、音声の生成モデルに基づき、スペクトル情報と
音源情報とから音声を合成する音声分析合成方式におい
て、合成音声の少なくとも有声音部は、合成器の逆フィ
ルタから抽出される残差波形を整形して得られる対称波
を音源として用いることを特徴とする残差駆動型音声合
成方式。
（２）、残差波形をフーリエ変換し、そのスペクトルの
位相成分を０としてｃｏｓ成分のみの偶関数とした後、
逆フーリエ変換して時間軸の原点に対して線対称化され
た波形を駆動音源として用いることを特徴とする特許請
求の範囲第（１）項に記載の音声合成方式。
（３）、残差波形をフーリエ変換し、そのスペクトルの
位相成分をπ／２としてｓｉｎ成分のみの奇関数とした
後、逆フーリエ変換して時間軸の原点に対して点対称化
された波形を駆動音源として用いることを特徴とする特
許請求の範囲第（１）項に記載の音声合成方式。
（４）、残差波形のスペクトルに位相処理を施した後、
対数変換、逆フーリエ変換、リフタリング、フーリエ変
換、指数変換を順次行ってピッチ成分を除去し、逆フー
リエ変換によって得られる１ピッチ分のみの対称化され
た波形を駆動音源として用いることを特徴とする特許請
求の範囲第（２）項又は第（３）項に記載の音声合成方
式。
（５）、残差波形の位相処理によって抽出される対称波
形に窓かけ処理を施し、ピッチ成分を除去した波形を駆
動音源として用いることを特徴とする特許請求の範囲第
（２）項又は第（３）項に記載の音声合成方式。