JP3063088B2 - 音声分析合成装置、音声分析装置及び音声合成装置 - Google Patents

音声分析合成装置、音声分析装置及び音声合成装置

Info

Publication number
JP3063088B2
JP3063088B2 JP63133478A JP13347888A JP3063088B2 JP 3063088 B2 JP3063088 B2 JP 3063088B2 JP 63133478 A JP63133478 A JP 63133478A JP 13347888 A JP13347888 A JP 13347888A JP 3063088 B2 JP3063088 B2 JP 3063088B2
Authority
JP
Japan
Prior art keywords
spectrum
cepstrum
unit
sound source
source signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63133478A
Other languages
English (en)
Other versions
JPH01302299A (ja
Inventor
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63133478A priority Critical patent/JP3063088B2/ja
Priority to US07/358,104 priority patent/US5029211A/en
Publication of JPH01302299A publication Critical patent/JPH01302299A/ja
Application granted granted Critical
Publication of JP3063088B2 publication Critical patent/JP3063088B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、ケプストラムをもとにして分析したスペク
トルパラメータとそれにより求めた音源信号とを、合成
に用いる複数個(例えばCV、VC等数100個)の単位音声
毎に分析して格納し、音源信号の韻律(ピッチ、振幅、
時間長など)を制御し、前記音源信号を用いて合成フィ
ルタを駆動して音声を合成する音声する音声分析合成方
式との装置に関する。
(従来の技術) 任意語音声合成の方式として、単位音声に対して線形
予測分析等による線形予測係数をスペクトルパラメータ
として用い、これを単位音声に用いて分析した予測残差
信号の一部を音源信号として用い、この音源信号によ
り、線形予測係数から構成される合成フィルタを駆動し
て音声を合成する方式が知られている。この方式は、例
えば、佐藤氏による“CVCと音源要素にもとずく(SYMPL
E)合音声成”(日本音響学会音声研究会資料S83−69、
1984年)(文献1)と題した論文に詳細に記載されてい
る。文献1の方式では、線形予測係数としてLSP係数を
用い、無声音区間では、元の単位音声から線形予測分析
して得られた予測残差信号を音源信号として用い、有声
音区間では、母音区間の代表的な1ピッチ周期区間から
切り出した予測残差信号を有声音区間の音源として使用
して、合成フィルタを駆動して音声を合成している。こ
の方式では、音源として、有声音区間ではインパルス
列、無声音区間では雑音信号を用いる方式と比べ、音質
が改善されるとしている。
(発明が解決しようとする問題点) 音声合成、特に任意語合成では、単位音声を接続し音
声を合成するわけであるが、人間が発話の際に行ってい
るような自然な抑揚をつけるために、韻律情報あるい
は、韻律規則に従い、音声信号あるいは音源信号のピッ
チ周期を変化させる必要がある。然るに前記文献1の方
式では、有声区間の音源である残差信号のピッチ周期を
変化させたときに、合成フィルタの係数を分析したもと
の単位音声のピッチ周期と、合成すぺき音声のピッチ周
期が異なるために、残差信号の変更したピッチと合成フ
ィルタのスペクトル包絡とでミスマッチングが発生し、
合成音声のスペクトルが大きく歪むため、合成音声が大
きく歪み雑音が重畳したり、明瞭度が大幅に低下すると
いう大きな問題点があった。また、この問題点は、ピッ
チ周期の短い女声話者において、ピッチ周期を大きく変
化させたときに特に顕著であるという第1の問題点があ
った。
さらに、前記文献1でも同様であるが、従来は音声信
号のスペクトル包絡を表すスペクトルパラメータの分析
にLPC分析を用いることが多かった。LPC分析法は原理的
に、推定したスペクトル包絡が分析すべき音声信号のピ
ッチ構造に影響され易いという問題点がある。この問題
点は特にピッチ周波数の高い女声話者において、第1ホ
ルマント周波数とピッチ周波数が接近している母音
(イ、ウ、オ等)や鼻子音などにおいて顕著であり、LP
C分析ではホルマントの推定がピッチ周波数に影響さ
れ、ホルマント周波数のシフトやバンド幅の過小推定な
どの発生していた。このため、特に女性音声において、
ピッチを変化させて合成させたときに大きな音質劣化が
生じるという第2の問題点があった。
さらに、前記文献1の方法では、母音区間では、同一
母音区間の代表的な1ピッチ区間の予測残信号を、基本
的には繰り返し使用しているので母音区間での残差信号
のスペクトル及び位相の時間的な変化を十分に表すこと
ができず、母音区間で音質が劣化するという第3の問題
点があった。
第1の問題点については、スペクトル包絡の低域のホ
ルマントのピークを、合成するときのピッチ周波数の位
置に一致させるようにピーク位置をずらすことによりあ
る程度改善する方法が知られており、具体的には例え
ば、匂坂氏らによる“ピッチ構造を考慮したスペクトル
包絡の合成法”(日本音響学会講演論文集501−502頁、
1979年10月)(文献2)と題した論文を参照できる。し
かしながら前記文献2の方法では、ホルマントのピーク
位置を、変更したピッチ周波数の位置にずらしてしまう
ために、本質的な改善法ではなく、ホルマント位置の移
動によって明瞭性、音質が劣化するという問題点が新た
に発生していた。
また、第2の問題点については、ピッチ構造の影響を
うけにくい分析法として、ケプストラム法や、前述のLP
C分析とケプストラム法の中間的な分析法としてLPCケプ
ストラム分析法や、ケプストラム法をさらに改善した改
良ケプストラム法などが提案されており、それらのケプ
ストラム係数を用いて合成フィルタを直接的に構成する
方法も提案されている。ケプストラム法については、例
えば、オッペンハイム氏らによる“Homomorphic analys
is of speech,"(IEEE Trans.Audio & Electroacousti
cs,AU−16,p.221,1968)と題した論文(文献3)などが
あり、LPCケプストラム法については、LPC分析で求めた
線形予測係数からケプストラムに変換する方法が知られ
ており、例えば、アタル氏らによる“Effectiveness of
Iinear prediction characteristics of the speech w
ave for automatic speaker identification and verfi
cation"(J.Acoustical Soc.America,pp.1304−1312,19
74)と題した論文(文献4)などを参照できる。また、
改良ケプストラム法については例えば、今井氏らによる
“改良ケプストラム法によるスペクトル包絡の抽出”
(電子通信学会論文誌J62−A、pp.217〜223,1979)と
題した論文(文献5)などがあり、ケプストラム係数を
直接的に用いる合成フィルタの構成法については、例え
ば、今井氏らによる“ディジタルフィルタの対数伝達特
性の直接近似”(電子通信学論文誌J59−A、p.157〜16
4,1976)と題した論文(文献6)などがあるのでここで
は説明を省略する。しかしながら、ケプストラム、ある
いは改良ケプストラム分析法は、前述のLPC分析の問題
点を改善することができるものの、これらの係数を直接
的に用いる合成フィルタの構成が、LPC係数により構成
されるLPC合成フィルタにくらべ著しく複雑で演算量、
遅延が多いため、装置化が容易ではないという問題点あ
った。
本発明の目的は、単位音声を分析してスペクトルパラ
メータと音源信号を求め、これらを接続して音声を合成
する音声分析合成方式において、従来の問題点を改善
し、音源信号のピッチ周期を変化させて合成フィルタを
駆動して音声を合成した際に母音区間でも子音区間でも
自然に良好な音質が得られ、合成フィルタの構成の容易
なる音声分析合成方式とその装置を提供することにあ
る。
(問題点を解決するための手段) 本発明による音声分析合成装置は、音声合成に供する
単位音声信号からケプストラムを基にして求めたスペク
トルパラメータを用いて前記単位音声区間全体の音源信
号を求める手段と、前記音源信号と前記スペクトルパラ
メータを前記単位音声について格納する手段と、前記音
源信号の韻律情報を制御しながら前記スペクトルパラメ
ータを用いて音声を合成する手段と、前記合成音声のス
ペクトルをケプストラムをもとにして補正するフィルタ
とを有することを特徴とする。
本発明による音声分析装置は、音声合成に供する単位
音声信号から予め定められた時間長毎にあるいは前記単
位音声から抽出したピッチパラメータに応じた時間長毎
にケプストラムをもとにした分析を行いスペクトルパラ
メータを計算して格納するスペクトルパラメータ計算回
路と、前記ピッチパラメータに応じた時間区間毎あるい
は予め定められた時間区間毎に前記スペクトルパラメー
タをもとに線形予測係数による逆フィルタを行い前記単
位音声全体の音源信号を求めて格納する音源信号計算回
路とを有することを特徴とする。
本発明による音声合成装置は、単位音声毎に音源信号
を格納する音源信号格納回路と、前記単位音声毎にケプ
ストラムをもとにして求めたスペクトルパラメータを格
納するスペクトルパラメータ格納回路と、前記音源信号
の韻律を制御する韻律制御回路と、前記韻律を制御され
た音源信号と前記スペクトルパラメータを用いて音声を
合成する合成回路と、前記スペクトルパラメータからケ
プストラムを介してパワスペクトルを求め、前記合成信
号からスペクトルパラメータを求めケプストラムを介し
てパワスペクトルを求め、両者のパワスペクトルの比か
ら補正用スペクトルパラメータを計算する補正用スペク
トルパラメータ回路と、前記補正用スペクトルパラメー
タを用いて、前記合成音声のスペクトルを補正する補正
フィルタ回路とを有することを特徴とする。
(作用) 本発明は、音声信号のスペクトル分析法として、前記
文献2〜4に示したようにピッチ構造の影響をうけにく
いケプストラム法、LPCケプストラム法や改良ケプスト
ラム法を用いて得たスペクトル包絡を、LPC係数により
近似する手法をとる。このようにすると、分析、合成フ
ィルタともにLPCフィルタが使用できるのでフィルタの
構成を簡略化できる。そしてケプストラムをもとにして
求めたLPC係数を用いて単位音声を分析し、予測残差信
号を求めこれを音源信号とする。さらに、音源信号を単
位音声では、有声音、無声音を問わず全区間に対して有
するとともに、合成フィルタとしては構成の容易なLPC
合成フィルタを用いる。さらに、音源信号のピッチを変
化させて音声を合成したときに発生するスペクトル歪を
補正するために、前述の分析法と同様に、ケプストラ
ム、LPCケプストラムあるいは改良ケプストラムをもと
にして得たスペクトル包絡をLPC係数により近似して、
スペクトルの歪を補正するための補正フィルタをLPC合
成フィルタにより構成することを特徴とする。
本発明の作用を示す第2図に置いて、分析側(第2図
(a))では、合成に用いる単位音声信号(例えば、C
V、VCなど)を端子100から入力し、ケプストラム計算部
120は、予め定められた時間間隔、あるいは母音区間で
は別途計算したピッチ周期毎に、ケプストラムを計算す
る。この計算法としては、FFTを用いる方法、LPC分析に
より求めた線形予測係数からLPCケプストラムに変換す
る方法、改良ケプストラム分析法を用いる方法などが考
えられる。具体的な方法は前記文献3〜5を参照できる
のでここでは説明を省略する。以下では改良ケプストラ
ム分析法を用いるものとして説明を進める。
LPC変換部150では、ケプストラム計算部120で求めた
ケプストラムc(i)(i=0〜P;Pは次数)をLPC変換
部150は入力して線形予測係数a(i)を計算する。具
体的には、ケプストラムを一旦、FFT(例えば256点)し
て平滑化対数スペクトルを求め、これを指数変換して平
滑化スペクトルに変換する。そしてこれを逆FFT(例え
ば256点)すると、自己相関関数が求められる。自己相
関関数からLPC係数を求める。LPC係数としては種々のも
の(線形予測係数、PARCOR、LSPなど)が知られている
が、ここでは線形予測係数を用いるものとする。自己相
関関数からは衆知の方法(例えばダービン法など)を用
いて再帰的に線形予測係数a(i)(i=1〜M)を求
めることができる。求めた線形予測係数はスペクトルパ
ラメータ格納部260へ単位音声毎に格納される。
LPC逆フィルタ部200では、線形予測係数を用いて単位
音声を逆フィルタし、単位音声信号の全区間に対して予
測残差信号を音源信号として求め、音源信号格納部250
に単位音声毎に蓄積する。また、予測残差信号の母音区
間では、各ピッチ毎の開始位置も格納しておく。
一方、合成側(第2図(b))では、音源信号格納部
250は、端子270から入力した制御情報にもとづき、必要
な単位音声を選択しこれに対応する予測残差信号を出力
する。
ピッチ制御部300では、前記制御情報のうち、ピッチ
を変化させるための情報を用いて、母音区間では、前記
ピッチの開始位置にもとづいてピッチ区間毎に残差信号
のピッチの伸縮を行う。具体的な方法については、前記
文献1に記載されているらように、ピッチ周期を長くす
るときはピッチ区間の後ろに零を詰め、ピッチ周期を短
くするときはピッチ区間の後ろからサンプルを切り詰め
る。また母音区間の時間長は、前記制御情報により指定
された時間長を用いて、ピッチ単位で調整する。
スペクトルパラメータ格納部260は、前記制御情報に
従い、単位音声を選択しこれに対応するLPCパラメータa
iを出力する。
LPC合成フィルタ350は、下式の伝達特性をもち、 ピッチを変化させた予測残差信号とLPCパラメータとを
用いて合成した音声x(n)を出力する。
補正用スペクトルパラメータ計算部370は、LPCパラメ
ータ計算部370は、LPCパラメータaiと合成音声x(n)
をもちいて、ピッチを変化させたときに合成音声に発生
するスペクトル歪を補正するための、補正用スペクトル
パラメータbiをケプストラムをもとにして計算する。ケ
プストラムとしては、前述のように種々のものが考えら
れるが、ここでは、LPC係数から変換の容易なLPCケプス
トラムを用いる。具体的には以下のように行う。まず、
aiを用いて前述文献5の方法に基づきLPCケプストラム
c′(i)に変換し、以下のパワスペクトルH2(Z)を
計算する。
次に、合成音声x(n)の有声音区間についてあらか
じめ定められた区間長毎に、あるいはピッチ同期にLPC
分析を行ない、スペクトルパラメータai′を計算し、こ
れをLPCケプストラムc″(i)に変換し以下のパワス
ペクトルF2(z)を計算する。
次に、(2)式(3)の比を以下のように求める。
G2(z)=H2(z)/F2(z) (4) そして、(4)式を逆フーリエ変換して自己相関関数
R(m)を求め、R(m)からLPC分析により補正用ス
ペクトルパラメータbiを計算する。なお、(2)、
(3)式はFFTを用いて計算することができる。また、
(3)式の計算はLPCケプストラムを基に行ったが、ケ
プストラムや改良ケプストラムを基に計算することもで
きる。
LPC補正フィルタ380は、以下の伝達特性Q(z)を持
ち、 合成音声x(n)を入力し、補正用スペクトルパラメー
タbiを用いて、スペクトル歪を補正した合成音声x′
(n)を端子390へ出力する。
以上で本発明の作用に関する説明を終える。
(実施例) 第1図に本発明の一実施例の構成を示すブロック図を
示す。
第1図(a)は本発明による音声分析装置、第1図
(b)は本発明による音声合成装置の実施例を示す。
分析側では、入力端子400から単位音声信号を入力
し、分析回路410で、あらかじめ定められた時間区間毎
にあるいは、母音区間ではピッチ周期に等しい区間ごと
に、一旦、LPC分析を行なった後にLPCケプストラムに変
換する。改良ケプストラム計算回路420では、LPCケプス
トラムを初期値として前記作用の項で述べたように、改
良ケプストラム法を用いて、音声のピッチの影響を受け
にくい改良ケプストラムをあらかじめ定められた次数だ
け求める。なお、ここではLPCケプストラムを初期値と
したが、FFTにより求めたケプストラムを初期値として
ともよい。
LPC変換回路430では、改良ケプストラムにより表した
スペクトル包絡をLPC係数により近似する。具体的な方
法は前記作用の項を参照できる。LPC係数としては線形
予測係数を用いる。予め定められた次数の線形予測係数
は前記単位音声の全区間に対してスペクトルパラメータ
格納回路460へ格納される。
LPC逆フィルタ440は、予め定められた次数の線形予測
係数を入力し、前記単位音声信号を逆フィルタして、前
記単位音声の全区間に対して予測残差信号を求める。
ピッチ分割回路445は、単位音声の有声区間では、予
測残差信号に対してピッチ分割位置を求め、予測残差信
号を音源信号としてピッチ分割位置と共に音源信号格納
回路450へ格納する。なお、ピッチ分割位置の求め方と
しては、例えば、特願昭62−210690(文献6)や他の良
好な方法を用いることがきる。
合成側では、制御部510は、端子500から韻律制御(ピ
ッチ、時間長、振幅)情報、単位音声の接続情報を入力
し、音源格納回路550、スペクトルパラメータ格納回路5
80、ピッチ変更回路560、振幅制御回路570へ出力する。
音源格納回路550は、単位音声の接続情報を入力し、
その単位音声に対応する予測残差信号を出力する。ピッ
チ変更回路560は、ピッチ制御情報を入力し、母音区間
においてあらかじめ指定されているピッチ分割位置を用
いて、予測残差信号のピッチの変更を行なう。ピッチを
変更するための具体的な方法は、前記作用の項で説明し
た方法や、他の衆知な方法を用いることができる。
次に、振幅制御回路570は、振幅制御情報を入力し、
それに従い、予測残差信号の振幅を制御しe(n)を出
力する。スペクトルパラメータ格納回路580は、単位音
声の接続情報を入力し、その単位音声に対応するスペク
トルパラメータ系列を出力する。ここでは、前記作用の
項と同様にスペクトルパラメータとして、LPC係数ai
用いることにするが、他の衆知なパラメータを用いるこ
とができる。
合成とフィルタ回路600は、前記作用の項の(1)式
の特性を有しており、ピッチを変更した予測残差信号を
入力して係数aiを用いて次式に従い合成音声x(n)を
計算する。
振幅制御回路710は、合成音声X(N)にゲインGを
かけて出力する。ゲインGはケイン計算回路700から入
力する。ゲイン計算回路700の動作は後述する。
LPCケプストラム計算回路605は、LPC係数をLPCケプス
トラムc′(i)に変換する。
FFT計算回路610は、c′(i)を入力し、あらかじめ
定められた点数(例えば256点)のFFT(高速フーリエ変
換)を行い、前記(2)式で定義したパワスペクトルH2
(z)を計算し出力する。なお、FFTの計算は、例えばO
ppenheim氏らによる“Digital Signal Processing"(Pr
entice−Hall,1975年)と題した単行本の第6章(文献
7)に記載されているのでここでは説明を省略する。
LPC分析回路640は、ピッチ周期を変更して得た合成音
声x(n)の母音区間において、LPC分析を行い、LPC係
数ai′を計算する。このとき、作用の項で述べたよう
に、LPC分析をピッチ同期で行なってもよいし、固定長
フレーム区間毎に行なってもよい。
LPCケプストラム計算回路645はLPC係数をLPCケプスト
ラムc″(i)に変換する。
FFT計算回路630は係数c″(i)を入力し、前記
(3)式で定めたパワスペクトルF2(z)を計算し出力
する。なお、前記作用の項で述べたように、LPCケプス
トラムを用いてもよいし、ケプストラムや改良ケプスト
ラムを用いることもできる。
補正用スペクトルパラメータ計算回路620は、H
2(z)、F2(z)を用いて、(4)式に従いG2(z)
を計算する。さらに、これを逆FFTして自己相関関数R
(m)を求め、LPC分析してLPC係数biを求める。
補正用フィルタ650は、係数biを用い、振幅制御回路7
10の出力を入力して、スペクトル歪を補正した合成音声
x′(n)を下式に従い計算する。
(7)式でG・x(n)は補正用フィルタ650の入力
信号を示す。
ゲイン計算回路700は、ピッチを変化させた区間で、
x(n)とx′(n)のピッチ毎の平均電力を等しくす
るためのゲインGを計算する。これは、補正用フィルタ
650のゲインGが1ではないからである。具体的には、
ピッチを変化させた区間で、ピッチ毎にx(n)とx′
(n)の平均電力を下式に従い計算する。
ここでNはピッチ区間のサンプル数を示す。そしてゲ
インGを下式から求める。
このゲインGがかけられた、最終的な合成音声信号
x′(n)は端子660を通して出力される。
以上本発明の一実施例に対する説明を終える。上記実
施例は、あくまでも本発明の一構成にすぎず、種々の変
形も可能である。
本実施例では、単位音声の全区間について、音源信号
として、線形予測分析して得られた予測残差信号を用い
たが、演算量、メモリ量の低減のために、有声区間、特
に母音区間では、代表的な1ピッチ区間の予測残差信号
を用いて、これの振幅、ピッチを制御しながら繰り返し
て用いてもよい。
また、音源信号としては、線形予測分析して得られる
予測残差信号のみならず他の良好な音源信号、例えば、
零位相化信号、位相等化信号、マルチパルス音源などを
用いることができる。
また、格納するスペクトルパラメータとしては、実施
例方法以外に他の良好なスペクトルパラメータ、例え
ば、ホルマント、ARMA、PSE、LSP、PARCOR、メルケプス
トラム、一般化ケプストラム、メル一般化ケプストラム
などを用いることができる。
また、スペクトルパラメータとしてLPC係数をスペク
トルパラメータ格納回路260に格納したが、ケプストラ
ムや改良ケプストラムを格納するようにすることもでき
る。ただしこのようにすると合成側でもLPC合成フィル
タの前にLPC変換回路が必要となる。
補正用フィルタのスペクトルパラメータも本実施例の
方法以外に、他の良好なパラメータ、例えば、ホルマン
ト、ARMA、PSE、LSP、PARCOR、メルケプストラム、一般
化ケプストラム、メル一般化ケプストラムなどを用いる
ことができる。
また、補正用フィルタの構成としては、(5)式で示
したような全極形フィルタを用いたが、極−零形フィル
タや、FIRフィルタを用いる構成としてもよい。但しこ
のようにすると、演算量がかなり増大する。
また、演算量低減化のために、振幅制御回路710、ゲ
イン計算回路700を省略することもできる。ただしこの
ようにすると、合成音声x′(n)のレベルが多少変化
するおそれがある。
また、振幅制御回路570は、残差信号のパワーを制御
するのではなく、ゲイン計算回路700、振幅制御回路710
と同一の構成とし、合成音声x(n)のパワーを制御す
るようにしてもよい。ただしこのときは、制御信部510
から入力する制御信号は、残差信号のピッチ毎の単位パ
ワーではなく、合成音声のピッチ毎の単位パワーとする
必要がある。
また、振幅制御回路570、710、ゲイン回路700は簡略
化のために省略することもできるる また、分析側で、ピッチ分割は行わないで、合成時に
制御情報として与えるようにしてもよい。このようにす
ると、ピッチ分割回路445は不要となる。
また、本実施例では、韻律制御情報を端子500を通し
て入力する構成としたが、韻律制御に関しては、アクセ
ント情報、イントネーション情報を入力して、規則によ
り韻律制御情報を発生するようにしてもよい。
また、演算量低減のために、補正用フィルタの計算
は、ピッチ制御回路560において、ピッチの変化が大き
いときにのみ計算するような構成としてもよい。
また、各単位音声毎に、ピッチの変化量に応じて補正
用スペクトルパラメータをコードブックとして有してお
くか、あるいはスペクトルパラメータの変化自体をコー
ドブックあるいはテーブルとして予め有しておき、スペ
クトルパラメータの最適な変化を参照するようにしても
よい。このようにすると、前者の場合では補正用フィル
タの計算が簡略化される、後者の場合ては補正用フィル
タの計算が不要となる。
(発明の効果) 以上説明したように、本発明によれば、単位音声の全
ての区間について音源信号とスペクトルパラメータを有
しており、これらを用いて音声を合成しているので、子
音区間のみならず、従来音質が劣化していた母音区間で
も良好な音質の合成音得ることができるという大きな効
果がある。また、本発明によれば、スペクトルパラメー
タ及びスペクトル補正の計算にピッチの影響を受けにく
い分析法を用いていると共に、音源信号のピッチ周期
を、あらかじめ分析して格納しておいた音源信号のピッ
チ周期に比べ大きく変化させて合成しても、それにより
発生するスペクトル歪を補正する補正フィルタを有して
いるので、音質劣化のほとんどない音声を合成すること
ができるという効果がある。またこの効果は、ピッチ周
期の短い女性話者について特に顕著である。
【図面の簡単な説明】
第1図は、本発明の1実施例を示すブロック図、第2図
は本発明の作用を示すブロック図である。 図において、120、410……ケプストラム計算部、150、4
30……LPC変換回路、200、440……LPC逆フィルタ、25
0、450……音源信号格納回路、300、560……ピッチ制御
回路、350、600……合成フィルタ、300、650……補正用
フィルタ、370、620……補正用スペクトルパラメータ計
算回路、260、460……スペクトルパラメータ格納回路、
420……改良ケプストラム計算部、570、710……振幅制
御回路、605、645……LPCケプストラム計算回路、610、
630……FFT計算回路、640……LPC分析回路、700……ゲ
イン計算回路。

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】ケプストラム計算部(120)、スペクトル
    パラメータ変換手段(150)、逆フィルタ(200)、音源
    信号格納部(250)、スペクトルパラメータ格納部(26
    0)を備える音声分析装置であって、 ケプストラム計算部(120)は、入力される単位音声か
    らケプストラムを求め、 スペクトルパラメータ変換手段(150)は、ケプストラ
    ム計算部(120)のケプストラムをスペクトルパラメー
    タに変換し、 逆フィルタ(200)は、スペクトルパラメータを用いて
    入力される単位音声を逆フィルタして音源信号を求め、 音源信号格納部(250)は、単位音声毎に音源信号を格
    納し、 スペクトルパラメータ格納部(260)は、単位音声毎に
    スペクトルパラメータを格納する 音声分析装置。
  2. 【請求項2】音源信号格納部(250)、スペクトルパラ
    メータ格納部(260)、韻律制御部(300)、合成フィル
    タ(350)、補正用スペクトルパラメータ計算部(37
    0)、補正フィルタ(380)を備える音声合成装置であっ
    て、 音源信号格納部(250)は、単位音声毎の音源信号を格
    納すると共に、韻律制御情報に基づいて音源信号を出力
    し、 スペクトルパラメータ格納部(260)は、単位音声毎の
    スペクトルパラメータを格納すると共に、韻律制御信号
    に基づいてスペクトルパラメータを出力し、 韻律制御部(300)は、音源信号格納部(250)が出力す
    る音源信号を韻律制御信号に基づいて韻律制御し、 合成フィルタ(350)は、韻律制御された音源信号、ス
    ペクトルパラメータ格納部(260)が出力するスペクト
    ルパラメータに基づいて合成音声を出力し、 補正用スペクトルパラメータ計算部(370)は、スペク
    トルパラメータ格納部(260)が出力するスペクトルパ
    ラメータからケプストラムを介して第1パワスペクトル
    を求め、合成音声からスペクトルパラメータを求め、求
    めたスペクトルパラメータからケプストラムを介して第
    2パワスペクトルを求め、第1パワスペクトルと第2パ
    ワスペクトルの比に基づいて補正用スペクトルパラメー
    タを求め、 補正フィルタ(380)は、補正用スペクトルパラメータ
    に基づいて合成音声のスペクトルを補正して出力する 音声合成装置。
  3. 【請求項3】ケプストラム計算部(120)、スペクトル
    パラメータ変換手段(150)、逆フィルタ(200)、音源
    信号格納部(250)、スペクトルパラメータ格納部(26
    0)、韻律制御部(300)、合成フィルタ(350)、補正
    用スペクトルパラメータ計算部(370)、補正フィルタ
    (380)を備える音声分析合成装置であって、 ケプストラム計算部(120)は、入力される単位音声か
    らケプストラムを求め、 スペクトルパラメータ変換手段(150)は、ケプストラ
    ム計算部(120)のケプストラムをスペクトルパラメー
    タに変換し、 逆フィルタ(200)は、スペクトルパラメータを用いて
    入力される単位音声を逆フィルタして音源信号を求め、 音源信号格納部(250)は、単位音声毎の音源信号を格
    納すると共に、韻律制御情報に基づいて音源信号を出力
    し、 スペクトルパラメータ格納部(260)は、単位音声毎の
    スペクトルパラメータを格納すると共に、韻律制御信号
    に基づいてスペクトルパラメータを出力し、 韻律制御部(300)は、音源信号格納部(250)が出力す
    る音源信号を韻律制御信号に基づいて韻律制御し、 合成フィルタ(350)は、韻律制御された音源信号、ス
    ペクトルパラメータ格納部(260)が出力するスペクト
    ルパラメータに基づいて合成音声を出力し、 補正用スペクトルパラメータ計算部(370)は、スペク
    トルパラメータ格納部(260)が出力するスペクトルパ
    ラメータからケプストラムを介して第1パワスペクトル
    を求め、合成音声からスペクトルパラメータを求め、求
    めたスペクトルパラメータからケプストラムを介して第
    2パワスペクトルを求め、第1パワスペクトルと第2パ
    ワスペクトルの比に基づいて補正用スペクトルパラメー
    タを求め、 補正フィルタ(380)は、補正用スペクトルパラメータ
    に基づいて合成音声のスペクトルを補正して出力する 音声分析合成装置。
JP63133478A 1988-05-30 1988-05-30 音声分析合成装置、音声分析装置及び音声合成装置 Expired - Lifetime JP3063088B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP63133478A JP3063088B2 (ja) 1988-05-30 1988-05-30 音声分析合成装置、音声分析装置及び音声合成装置
US07/358,104 US5029211A (en) 1988-05-30 1989-05-30 Speech analysis and synthesis system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63133478A JP3063088B2 (ja) 1988-05-30 1988-05-30 音声分析合成装置、音声分析装置及び音声合成装置

Publications (2)

Publication Number Publication Date
JPH01302299A JPH01302299A (ja) 1989-12-06
JP3063088B2 true JP3063088B2 (ja) 2000-07-12

Family

ID=15105715

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63133478A Expired - Lifetime JP3063088B2 (ja) 1988-05-30 1988-05-30 音声分析合成装置、音声分析装置及び音声合成装置

Country Status (1)

Country Link
JP (1) JP3063088B2 (ja)

Also Published As

Publication number Publication date
JPH01302299A (ja) 1989-12-06

Similar Documents

Publication Publication Date Title
US5029211A (en) Speech analysis and synthesis system
JP3566652B2 (ja) 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法
US6427135B1 (en) Method for encoding speech wherein pitch periods are changed based upon input speech signal
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
JP3678519B2 (ja) オーディオ周波数信号の線形予測解析方法およびその応用を含むオーディオ周波数信号のコーディングならびにデコーディングの方法
RU2257556C2 (ru) Квантование коэффициентов усиления для речевого кодера линейного прогнозирования с кодовым возбуждением
JP3653826B2 (ja) 音声復号化方法及び装置
EP0673013B1 (en) Signal encoding and decoding system
DE69934608T2 (de) Adaptive kompensation der spektralen verzerrung eines synthetisierten sprachresiduums
US20030088418A1 (en) Speech synthesis method
JPH0863196A (ja) ポストフィルタ
JPH10124088A (ja) 音声帯域幅拡張装置及び方法
Kornagel Techniques for artificial bandwidth extension of telephone speech
US4720865A (en) Multi-pulse type vocoder
JPH10319996A (ja) 雑音の効率的分解と波形補間における周期信号波形
US20080215330A1 (en) Audio Signal Modification
JP3426871B2 (ja) 音声信号のスペクトル形状調整方法および装置
JPH10124089A (ja) 音声信号処理装置及び方法、並びに、音声帯域幅拡張装置及び方法
JP2600384B2 (ja) 音声合成方法
JP3063088B2 (ja) 音声分析合成装置、音声分析装置及び音声合成装置
JP2615856B2 (ja) 音声合成方法とその装置
JP3138574B2 (ja) 線形予測係数補間装置
JP3552201B2 (ja) 音声符号化方法および装置
JP3510168B2 (ja) 音声符号化方法及び音声復号化方法
KR20050061579A (ko) 트랜스코더 및 부호변환방법