JPH01224800A - 残差駆動型音声合成装置 - Google Patents

残差駆動型音声合成装置

Info

Publication number
JPH01224800A
JPH01224800A JP63052168A JP5216888A JPH01224800A JP H01224800 A JPH01224800 A JP H01224800A JP 63052168 A JP63052168 A JP 63052168A JP 5216888 A JP5216888 A JP 5216888A JP H01224800 A JPH01224800 A JP H01224800A
Authority
JP
Japan
Prior art keywords
residual
interpolation
phoneme
waveform
frequency spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63052168A
Other languages
English (en)
Inventor
Kazuhiko Iwata
和彦 岩田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63052168A priority Critical patent/JPH01224800A/ja
Publication of JPH01224800A publication Critical patent/JPH01224800A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は残差駆動型音声合成装置に関し、特に線形予測
等のパラメータ分析を行った際の予測残差を音源として
用いる残差駆動型音声合成装置に関する。
〔従来の技術〕
線形予測分析等を行って得られたパラメータを用いた音
声合成における合成音声の品質を向上するための方法と
して、音源にパラメータ分析を行った際の予測誤差であ
る残差を用いる方法がある。
例えば、子音区間に対しては残差をそのまま用い、母音
区間では代表的な1ピッチ分の残差を用いる方法や、あ
るいは残差を零位相化した波形を用いる方法等が知られ
ている。このような従来技術については、日本音響学会
音声研究会資料883−65 (1984−01)r素
片編集型規則合成システムにおける素片の選択と補間法
j等で詳述されている。
〔発明が解決しようとする課題〕
上述した従来の方法では、音素あるいは合成の基本単位
となる素片の境界において一定の長さの補間区間を設け
、その中で直線補間等の補間方法により合成に用いる線
形予測係数等のパラメータを補間し、前後の音素あるい
は素片が滑らかに接続されるようにしていた。一方、音
源に関しては補間は行わず、前後それぞれの音素あるい
は素片から抽出された残差を補間区間の途中で切り換え
て用いていた。
しかしながら、実際にはパラメータの変化とともに残差
のスペクトルも徐々に変化しており、このような変化を
考慮せず音素あるいは素片の境界で音源を急変させるこ
とは、合成される音声の品質劣化の原因となる。また、
前後の音素あるいは素片のスペルトルが大きく異なる場
合には、音素あるいは素片の接続部分の短い一定区間に
おいてのみ補間を施しても、スペクトル変化は急峻にな
り、実際の音声とは異なってしまう。
これに対して本発明は、音素あるいは素片の境界部分を
中心とした前後の区間において、劣化の少ない滑らかな
合成音声を生成することが可能な残差駆動型音声合成装
置を提供することを目的としている。
〔課題を解決するための手段〕 本発明の残差駆動型音声合成装置は、線形予測等のパラ
メータ分析を行った際の予測残差波形を音源として用い
る音声合成装置において、音素ごとに残差波形を記憶し
ておく手段と、前記残差波形の周波数スペクタルを求め
る手段と、前後の音素の組み合せごとに音素境界を中心
として予め定められた長さの区間において曲記残差波形
の周波数スペクトルを各周波数成分ごとに補間する手段
と、前記補間を施した残差波形の周波数スペクトルを時
間波形に変換する手段と、前記時間波形を音源として音
声を合成する手段とを有することを特徴、とする。
〔作用〕
まず、音素あるいは素片の境界を中心とする前後の残差
の周波数スペクトルをフーリエ変換等によってそれぞれ
求める。音素あるいは素片の境界を中心とした前後の区
間において周波数スペクトルが連続的に変化するよう、
フーリエ変換後の各周波数成分ごとに直線補間等の補間
方法によって補間部分に用いる音源の周波数スペクトル
を生成する。補間区間の長さは、前後の音素あるいは素
片の組み合せに応じて予め決められた長さを用いる。こ
の補間区間長は、例えば前後の音素あるいは素片の残差
スペクトルの差が大きい場合には長く、小さければ短く
取るようにする6次に、補間によって得られた周波数ス
ペクトルを逆フーリエ変換等によって時間領域に変換し
、得られた時間波形を駆動音源として用いる。
このようにして、音素あるいは素片の境界を中心とした
前後の区間において、パラメータだけでなく音源となる
残差も補間によってその周波数スペクトルを連続的かつ
緩やかに変化させることによって、音素あるいは素片の
接続区間の付近においても劣化の少ない合成音声を得る
ことが可能となる。
〔実施例〕
次に本発明の実施例について図面を参照して説明する。
第1図は本発明の残差駆動型音声合成装置の一実施例を
示すブロック図である。
まず、音素情報入力端子101から傘成されるべき音声
の音素情報が入力され、補間区間決定部104、残差記
憶部105及びパラメータ記憶部109に送られる。音
素あるいは素片の境界位置は補間位置入力端子102を
通して補間区間決定部104に入力される。補間区間決
定部104は前記入力された音素情報に基づき、前後の
音素あるいは素片の組み合せに応じて補間区間の長さを
決定し、前記入力された補間位置を中心として補間区間
の位置を定める。決定された補間区間長及び補間位置は
残差補間部107及びパラメータ補間部、110に送ら
れる。
韻律情報入力端子103からは音素の継続時間長、音源
振幅、ピッチバタン等の韻律制御情報が入力され、合成
フィルタ部111に送られる。残差補間部107は補間
区間決定部104から送られてくる補間区間長及び補間
位置の情報に基づいて、補間に必要な残差波形を読み出
すための続出し信号を残差記憶部105に送る。残差記
憶部105は前記入力された音素情報に応じて各音素で
音源として用いる残差波形を取り出し、合成フィルタ部
111に送る。また、残差補間部107からの読出信号
に応じて補間に必要な残差を取り出し、フーリエ変換部
106に送る。フーリエ変換部106は前記残差波形を
フーリエ変換によって周波数スペクトルに変換し、残差
補間部107に送る。残差補間部107は前記残差の周
波数スペクトルを用い、補間区間において用いる音源の
周波数スペクトルを補間区間決定部104から入力され
た補間区間長に基づいて生成し、逆フーリエ変換部10
8に送る。逆フーリエ変換部108は補間によって生成
された前記周波数スペクトルを逆フーリエ変換によって
時間領域の波形に変換し、合成フィルタ部111に送る
一方、パラメータ補間部110は補間区間決定部104
から送られてくる補間区間長及び補間位1の情報に基づ
いて、補間に必要なパラメータを読み出すための読出信
号をパラメータ記憶部109に送る。パラメータ記憶部
109は前記入力された音素情報に応じて各音素の合成
パラメータを取り出し、音声合成フィルタ部111に送
る。また、パラメータ補間部110からの読出信号に応
じて補間に必要なパラメータを取り出し、パラメータ補
間部110に送る。パラメータ補間部110は補間区間
決定部104から入力された補間区間長に基づき、補間
区間で用いるパラメータを生成し、合成フィルタ部11
1に送る。
合成フィルタ部111は前記韻律情報、パラメータ、時
間領域波形及び残差を用いて音声波形を合成し、音声出
力端子112から出力する。
以上述べた構成は、あくまでも本発明の一実施例に過ぎ
ず、種々の変形も可能である。例えば、音源の周波数ス
ペクトルを求める手段としては、コサイン変換、KL変
換等の他の周知の方法を用いることができる。
〔発明の効果〕
以上説明したように本発明によれば、音素あるいは素片
の境界部分を中心とした前後の区間においても劣化の少
ない合成音声を生成することが可能であり、品質の高い
音声を合成できる残差駆動型音声合成装置を実現するこ
とができる効果がある。
【図面の簡単な説明】
第1図は本発明の残差駆動型音声合成装置の一実施例を
示すブロック図である。 101・・・音素情報入力端子、102・・・補間位置
入力端子、103・・・韻律情報入力端子、104・・
・補間区間決定部、105・・・残差記憶部、106・
・・フーリエ変換部、107・・・残差補間部、108
・・・逆フーリエ変換部、109・・・パラメータ記憶
部、110・・・パラメータ補間部、111・・・合成
フィルタ部、112・・・音声出力端子。

Claims (1)

    【特許請求の範囲】
  1. 線形予測等のパラメータ分析を行った際の予測残差波形
    を音源として用いる音声合成装置において、音素ごとに
    残差波形を記憶しておく手段と、前記残差波形の周波数
    スペクタルを求める手段と、前後の音素の組み合せごと
    に音素境界を中心として予め定められた長さの区間にお
    いて前記残差波形の周波数スペクトルを各周波数成分ご
    とに補間する手段と、前記補間を施した残差波形の周波
    数スペクトルを時間波形に変換する手段と、前記時間波
    形を音源として音声を合成する手段とを有することを特
    徴とする残差駆動型音声合成装置。
JP63052168A 1988-03-04 1988-03-04 残差駆動型音声合成装置 Pending JPH01224800A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63052168A JPH01224800A (ja) 1988-03-04 1988-03-04 残差駆動型音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63052168A JPH01224800A (ja) 1988-03-04 1988-03-04 残差駆動型音声合成装置

Publications (1)

Publication Number Publication Date
JPH01224800A true JPH01224800A (ja) 1989-09-07

Family

ID=12907297

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63052168A Pending JPH01224800A (ja) 1988-03-04 1988-03-04 残差駆動型音声合成装置

Country Status (1)

Country Link
JP (1) JPH01224800A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005274917A (ja) * 2004-03-24 2005-10-06 Mitsubishi Electric Corp 音声復号装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005274917A (ja) * 2004-03-24 2005-10-06 Mitsubishi Electric Corp 音声復号装置

Similar Documents

Publication Publication Date Title
JP2782147B2 (ja) 波形編集型音声合成装置
JP4132109B2 (ja) 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置
JP3328080B2 (ja) コード励振線形予測復号器
US5682502A (en) Syllable-beat-point synchronized rule-based speech synthesis from coded utterance-speed-independent phoneme combination parameters
KR970003109A (ko) 음성 신호의 재생 방법 및 장치와 그 전송 방법
US5987413A (en) Envelope-invariant analytical speech resynthesis using periodic signals derived from reharmonized frame spectrum
US6950798B1 (en) Employing speech models in concatenative speech synthesis
US5787398A (en) Apparatus for synthesizing speech by varying pitch
JPH08254993A (ja) 音声合成装置
KR20020076144A (ko) 음성합성방법, 음성합성장치 및 기록매체
JP2600384B2 (ja) 音声合成方法
JPH01224800A (ja) 残差駆動型音声合成装置
JPS6239758B2 (ja)
Edgington et al. Residual-based speech modification algorithms for text-to-speech synthesis
JPH07261798A (ja) 音声分析合成装置
JPH01283600A (ja) 残差駆動型音声合成装置
JPS5925239B2 (ja) パラメ−タ補間方式
WO1995026024A1 (en) Speech synthesis
JP2709198B2 (ja) 音声合成方法
JPH08160991A (ja) 音声素片作成方法および音声合成方法、装置
JP4826580B2 (ja) 音声信号の再生方法及び装置
JPH0266600A (ja) 音声合成方式
JPH0772897A (ja) 音声合成方法および装置
JPH09258796A (ja) 音声合成方法
JPS5915996A (ja) 音声合成装置