JPH01302299A - 音声分析合成装置、音声分析装置及び音声合成装置 - Google Patents

音声分析合成装置、音声分析装置及び音声合成装置

Info

Publication number
JPH01302299A
JPH01302299A JP63133478A JP13347888A JPH01302299A JP H01302299 A JPH01302299 A JP H01302299A JP 63133478 A JP63133478 A JP 63133478A JP 13347888 A JP13347888 A JP 13347888A JP H01302299 A JPH01302299 A JP H01302299A
Authority
JP
Japan
Prior art keywords
speech
sound source
cepstrum
source signal
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63133478A
Other languages
English (en)
Other versions
JP3063088B2 (ja
Inventor
Kazunori Ozawa
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63133478A priority Critical patent/JP3063088B2/ja
Priority to US07/358,104 priority patent/US5029211A/en
Publication of JPH01302299A publication Critical patent/JPH01302299A/ja
Application granted granted Critical
Publication of JP3063088B2 publication Critical patent/JP3063088B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、ケプストラムをもとにして分析したスペクト
ルパラメータとそれにより求めた音源信号とを、合成に
用いる複数個(例えばC■、VC等数100個)の単位
音声毎に分析して格納し、音源信号の韻律(ピッチ、振
幅、時間長など)を制御し、前記音源信号を用いて合成
フィルタを駆動して音声を合成する音声する音声分析合
成方式との装置に関する。
(従来の技術) 任意語音声合成の方式として、単位音声に対して線形予
測分析等による線形予測係数をスペクトルパラメータと
して用い、これを単位音声に用いて分析した予測残差信
号の一部を音源信号として用い、この音源信号により、
線形予測係数から構成される合成フィルタを駆動して音
声を合成する方式が知られている。この方式は、例えば
、佐藤氏による“CVCと音源要素にもとず< (SY
MPLE)合音声成“(日本音響学会音声研究会資料8
83−69.1984年)(文献1)と題した論文に詳
細に記載されている。文献1の方式では、線形予測係数
としてLSP係数を用い、無声音区間では、元の単位音
声から線形予測分析して得られた予測残差信号を音源信
号として用い、有声音区間では、母音区間の代表的な1
ピッチ周期区間から切り出した予測残差信号を有声音区
間の音源として使用して、合成フィルタを駆動して音声
を合成している。この方式では、音源として、有声音区
間ではインパルス列、無声音区間では雑音信号を用いる
方式と比べ、音質が改善されるとしている。
(発明が解決しようとする問題点) 音声合成、特に任意語合成では、単位音声を接続し音声
を合成するわけであるが、人間が発話の際に行っている
ような自然な抑揚をつけるために、韻律情報あるいは、
韻律規則に従い、音声信号あるいは音源信号のピッチ周
期を変化させる必要がある。然るに前記文献1の方式で
は、有声区間の音源である残差信号のピッチ周期を変化
させたときに、合成フィルタの係数を分析したもとの単
位音声のピンチ周期と、合成すべき音声のピッチ周期が
異なるために、残差信号の変更したピッチと合成フィル
タのスペクトル包絡とでミスマツチングが発生し、合成
音声のスペクトルが大きく歪むため、合成音声が大きく
歪み雑音が重畳したり、明瞭度が大幅に低下するという
大きな問題点があった。また、この問題点は、ピッチ周
期の短い女声話者において、ピッチ周期を大きく変化さ
せたときに特に顕著であるという第1の問題点があった
さらに、前記文献1でも同様であるが、従来は音声信号
のスペクトル包絡を表すスペクトルパラメータの分析に
LPC分析を用いることが多かった。
LPG分析法は原理的に、推定したスペクトル包絡が分
析すべき音声信号のピッチ構造に影響され易いという問
題点がある。この問題点は特にピッチ周波数の高い女声
話者において、第1ホルマント周波数とピッチ周波数が
接近している母音(イ、つ、オ等)や鼻子音などにおい
て顕著であり、LPC分析ではホルマントの推定がピッ
チ周波数に影響され、ホルマント周波数のシフトやバン
ド幅の過小推定などの発生していた。このため、特に女
性音声において、ピッチを変化させて合成させたときに
犬きな音質劣化が生じるという第2の問題点があった。
さらに、前記文献1の方法では、母音区間では、同一母
音区間の代表的な1ピッチ区間の予測残信号を、基本的
には繰り返し使用しているので母音区間での残差信号の
スペクトル及び位相の時間的な変化を十分に表すことが
できず、母音区間で音質が劣化するという第3の問題点
があった。
第1の問題点については、スペクトル包絡の低域のホル
マントのピークを、合成するときのピッチ周波数の位置
に一致させるようにピーク位置をずらすことによりある
程度改善する方法が知られており、具体的には例えば、
匂坂氏らによる″ピッチ構造を考慮したスペクトル包絡
の合成法″(日本音響学会講演論文集501−502頁
、1979年10月)(文献2)と題した論文を参照で
きる。しかしながら前記文献2の方法では、ホルマント
のピーク位置を、変更したピッチ周波数の位置にずらし
てしまうために、本質的な改善法ではなく、ホルマント
位置の移動によって明瞭性、音質が劣化するという問題
点が新たに発生していた。
また、第2の問題点については、ピッチ構造の影響をう
けにくい分析法として、ケプストラム法や、前述のLP
G分析とケプストラム法の中間的な分析法としてLPC
ケプストラム分析法や、ケプストラム法をさらに改善し
た改良ケプストラム法などが提案されており、それらの
ケプストラム係数を用いて合成フィルタを直接的に構成
する方法も提案されている。ケプストラム法については
、例えば、オッペンハイム氏らによる”Homomor
phicanalysis of 5peech、”(
IEEE Trans、 Audio &Electr
oacoustics、 AU−16,p、221.1
968)と題した論文(文献3)などがあり、LPCケ
プストラム法については、LPG分析で求めた線形予測
係数からケプストラムに変換する方法が知られており、
例えば、アタル氏らによる”Effectivenes
s of l1near predictioncha
racteristics of the 5peec
h wave for automaticspeak
er 1dentification and ver
fication”(J、 AcousticalSo
c、 America、 pp、1304−1312.
1974)と題した論文(文献4)などを参照できる。
また、改良ケプストラム法については例えば、今井氏ら
による″改良ケプストラム法によるスペクトル包絡の抽
出″(電子通信学会論文誌J62−A、 pp、217
〜223.1979)と題した論文(文献5)などがあ
り、ケプストラム係数を直接的に用いる直接近似″(電
子通信学論文誌J59−A、p、157〜164.19
76)と題した論文(文献6)などがあるのでここでは
説明を省略する。しかしながら、ケプストラム、あるい
は改良ケプストラム分析法は、前述のLPG分析の問題
点を改善することができるものの、これらの係数を直接
的に用いる合成フィルタの構成が、LPG係数により構
成されるLPG合成フィルタにくらべ著しく複雑で演算
量、遅延が多いため、装置化が容易ではないという問題
点あった。
本発明の目的は、単位音声を分析してスペクトルパラメ
ータと音源信号を求め、これらを接続して音声を合成す
る音声分析合成方式において、従来の問題点を改善し、
音源信号のピッチ周期を変化させて合成フィルタを駆動
して音声を合成した際に母音区間でも子音区間でも自然
に良好な音質が得られ、合成フィルタの構成の容易なる
音声分析合成方式とその装置を提供することにある。
(問題点を解決するための手段) 本発明による音声分析合成方式は、音声合成に供する単
位音声信号からケプストラムを基にして求めたスペクト
ルパラメータを用いて前記単位音声区間全体の音源信号
を求め、前記音源信号と前記スペクトルパラメータを前
記単位音声について格納し、前記音源信号の韻律情報を
制御しながら前記スペクトルパラメータを用いて音声を
合成し、前記合成音声のスペクトルをケプストラムをも
とにして補正するフィルタとを有することを特徴とする
本発明による音声分析装置は、音声合成に供する単位音
声信号から予め定められた時間長毎にあるいは前記単位
音声から抽出したピッチパラメータに応じた時間長毎に
ケプストラムをもとにした分析を行いスペクトルパラメ
ータを計算して格納するスペクトルパラメータ計算回路
と、前記ピッチパラメータに応じた時間区間毎あるいは
予め定められた時間区間毎に前記スペクトルパラメータ
をもとに線形予測係数による逆フィルタを行い前記単位
音声全体の音源信号を求めて格納する音源信号計算回路
とを有することを特徴とする。
本発明による音声合成装置は、単位音声毎に音源信号を
格納する音源信号格納回路と、前記単位音声毎にケプス
トラムをもとにして求めたスペクトルパラメータを格納
するスペクトルパラメータ格納回路と、前記音源信号の
韻律を制御する韻律制御回路と、前記韻律を制御された
音源信号と前記スペクトルパラメータを用いて音声を合
成する合成回路と、前記スペクトルパラメータと前記合
成音声からケプストラムをもとにして求めたスペクトル
パラメータとを用いて前記合成音声のスペクトルを補正
するフィルタ回路とを有することを特徴とする。
(作用) 本発明は、音声信号のスペクトル分析法として、前記文
献2〜4に示したようにピッチ構造の影響をうけにくい
ケプストラム法、LPCケプストラム法や改良ケプスト
ラム法を用いて得たスペクトル包絡を、LPC係数によ
り近似する手法をとる。このようにすると、分析、合成
フィルタともにLPCフィルタが使用できるのでフィル
タの構成を簡略化できる。そしてケプストラムをもとに
して求めたLPG係数を用いて単位音声を分析し、予測
残差信号を求めこれを音源信号とする。さらに、音源信
号を単位音声では、有声音、無声音を問わず全区間に対
して有するとともに、合成フィルタとしては構成の容易
なLPG合成フィルタを用いる。さらに、音源信号のピ
ッチを変化させて音声を合成したときに発生するスペク
トル歪を補正するために、前述の分析法と同様に、ケプ
ストラム、LPCケプストラムあるいは改良ケプストラ
ムをもとにして得たスペクトル包絡をLPG係数により
近似して、スペクトルの歪を補正するための補正フィル
タをLPG合成フィルタにより構成することを特徴する
本発明の作用を示す第2図に置いて、分析側(第2図(
a))では、合成に用いる単位音声信号(例えば、cv
、vcなど)を端子100から入力し、ケプストラム計
算部120は、予め定められた時間間隔、あるいは母音
区間では別途計算したピッチ周期毎に、ケプストラムを
計算する。この計算法としては、FFTを用いる方法、
LPC分析により求めた線形予測係数からLPCケプス
トラムに変換する方法、改良ケプストラム分析法を用い
る方法などが考えられる。具体的な方法は前記文献3〜
5を参照できるのでここでは説明を省略する。以下では
改良ケプストラム分析法を用いるものとして説明を進め
る。
LPC変換部150では、ケプストラム計算部120で
求めたケプストラムc(iXi = 0〜P;Pは次数
)をLPG変換部150は人力して線形予測係数a(i
)を計算する。
具体的には、ケプストラムを一旦、FFT(例えば25
6点)して平滑化対数スペクトルを求め、これを指数変
換して平滑化スペクトルに変換する。そしてこれを逆F
FT(例えば256点)すると、自己相関関数が求めら
れる。自己相関関数からLPG係数を求める。LPG係
数としては種々のもの(線形予測係数、PARCOR,
LSPなど)が知られているが、ここでは線形予測係数
を用いるものとする。自己相関関数からは衆知の方法(
例えばグービン法など)を用いて再帰的に線形予測係数
a(i)(i=1〜M)を求めることができる。求めた
線形予測係数はスペクトルパラメータ格納部260へ単
位音声毎に格納される。
LPC逆フィルタ部200では、線形予測係数を用いて
単位音声を逆フィルタし、単位音声信号の全区間に対し
て予測残差信号を音源信号として求め、音源信号格納部
250に単位音声毎に蓄積する。また、予測残差信号の
母音区間では、各ピッチ毎の開始位置も格納しておく。
一方、合成側(第2図(b))では、音源信号格納部・
250は、端子270から入力した制御情報にもとづき
、必要な単位音声を選択しこれに対応する予測残差信号
を出力する。
ピッチ制御部300では、前記制御情報のうち、ピンチ
を変化させるための情報を用いて、母音区間では、前記
ピッチの開始位置にもとづいてピッチ区間毎に残差信号
のピッチの伸縮を行う。具体的な方法については、前記
文献1に記載されているらように、ピッチ周期を長くす
るときはピッチ区間の後ろに零を詰め、ピッチ周期を短
くするときはピッチ区間の後ろからサンプルを切り詰め
る。
また母音区間の時間長は、前記制御情報により指定され
た時間長を用いて、ピッチ単位で調整する。
スペクトルパラメータ格納部260は、前記制御情報に
従い、単位音声を選択しこれに対応するLPCパラメー
タ町を出力する。
LPC合成フィルタ350は、下式の伝達特性をもピッ
チを変化させた予測残差信号とLPGパラメータとを用
いて合成した音声x(n)を出力する。
補正用スペクトルパラメータ計算部370は、LPGパ
ラメータ計算部370は、LPGパラメータa1と合成
音声x(n)をもちいて、ピッチを変化させたときに合
成音声に発生するスペクトル歪を補正するなめの、補正
用スペクトルパラメータb、をケプストラムをもとにし
て計算する。ケプストラムとしては、前述のように種々
のものが考えられるが、ここでは、LPC係数から変換
の容易なLPCケプストラムを用いる。具体的には以下
のように行う。まず、alを用いて前述文献5の方法に
基づきLPCケプストラムc’(i)に変換し、以下の
パワスペクトルH2(Z)を計算する。
H2(Z)=exp(Σc’(i)Z−リ      
        (2)次に、合成音声x(n)の有声
音区間についてあらかじめ定められた区間長毎に、ある
いはピッチ同期にLPG分析を行ない、スペクトルパラ
メータa11を計算し、これをLPCケプストラムc1
1(i)に変換し以下のパワスペクトルF2(z)を計
算する。
F2(z)=exp(Σc”(i)z’)      
         (3)次に、(2)式(3)式の比
を以下のように求める。
G”(z)= H2(z)/F2(z)       
   (4)そして、(3)式を逆フーリエ変換して自
己相関関数R(m)を求め、R(m)からLPG分析に
より補正用スペクトルパラメータbiを計算する。なお
、(2)、(3)式はFFTを用いて計算することがで
きる。また、(3)式の計算はLPCケプストラムを基
に行ったが、ケプストラムや改良ケプストラムを基に計
算することもできる。
LPG補正フィルタ380は、以下の伝達特性Q(Z)
を持ち、 Q(Z) = 1/(1−Σb、z−’)      
   (5)合成音声x(n)を人力し、補正用スペク
トルパラメータbiを用いて、スペクトル歪を補正した
合成音声x’(n)を端子390へ出力する。
以上で本発明の作用に関する説明を終える。
(実施例) 第1図に本発明の一実施例の構成を示すブロック図を示
す。
第1図(a)は本発明による音声分析装置、第1図(b
)は本発明による音声合成装置の実施例を示す。
分析側では、入力端子400から単位音声信号を入力し
、分析回路410で、あらかじめ定められた時間区間毎
にあるいは、母音区間ではピッチ周期に等しい区間ごと
に、−旦、LPG分析を行なった後にLPCケプストラ
ムに変換する。改良ケプストラム計算回路420では、
LPCケプストラムを初期値として前記作用の項で述べ
たように、改良ケプストラム法を用いて、音声のピッチ
の影響を受けにくい改良ケプストラムをあらかじめ定め
られた次数だけ求める。なお、ここではLPCケプスト
ラムを初期値としたが、FFTにより求めたケプストラ
ムを初期値としてともよい。
LPG変換回路430では、改良ケプストラムにより表
したスペクトル包絡をLPC係数により近似する。
具体的な方法は前記作用の項を参照できる。LPG係数
としては線形予測係数を用いる。予め定められた次数の
線形予測係数は前記単位音声の全区間に対してスペクト
ルパラメータ格納回路460へ格納される。
LPC逆フィルタ440は、予め定められた次数の線形
予測係数を入力し、前記単位音声信号を逆フィルタして
、前記単位音声の全区間に対して予測残差信号を求める
ピッチ分割回路445は、単位音声の有声区間では、予
測残差信号に対してピンチ分割位置を求め、予測残差信
号を音源信号としてピンチ分割位置と共に音源信号格納
回路450へ格納する。なお、ピッチ分割位置の求め方
としては、例えば、特願昭62−210690(文献6
)や他の良好な方法を用いることがきる。
合成側では、制(雄部510は、端子500から韻律制
御(ピンチ、時間長、振幅)情報、単位音声の接続情報
を入力し、音源格納回路550、スペクトルパラメータ
格納回路580、ピッチ変更回路560、振幅制御回路
570へ出力する。
音源格納回路550は、単位音声の接続情報を人力し、
その単位音声に対応する予測残差信号を出力する。ピッ
チ変更回路560は、ピンチ制御情報を人力し、母音区
間においてあらかじめ指定されているピンチ分割位置を
用いて、予測残差信号のピッチの変更を行なう。ピッチ
を変更するための具体的な方法は、前記作用の項で説明
した方法や、他の衆知な方法を用いることができる。
次に、振幅制御回路570は、振幅制御情報を人力し、
それに従い、予測残差信号の振幅を制御しe(n)を出
力する。スペクトルパラメータ格納回路580は、単位
音声の接続情報を人力し、その単位音声に対応するスペ
クトルパラメータ系列を出力する。ここでは、前記作用
の項と同様にスペクトルパラメータとして、LPG係数
a1を用いることにするが、他の衆知なパラメータを用
いることができる。
合成とフィルタ回路600は、前記作用の項の(1)式
の特性を有しており、ピッチを変更した予測残差信号を
人力して係数a1を用いて次式に従い合成音声x(n)
を計算する。
X(n) = e(n)十Σa、・x(n−i)   
      (6)振幅制御回路710は、合成音声X
(N)にゲインGをかけて出力する。ゲインGはゲイン
計算回路700から人力する。ゲイン計算回路700の
動作は後述する。
LPCケプストラム計算回路605は、LPG係数をL
PCケプストラムc’(i)に変換する。
FFT計算回路610は、c’(i)を人力し、あらか
じめ定められた点数(例えば256点)のFFT(高速
フーリエ変換)を行い、前記(2)式で定義したパワス
ペクトルH2(z)を計算し出力する。なお、FFTの
計算は、例えば○ppenheim氏らによる”Dig
ital SignalProcessing”(Pr
entice−Hall、1975年)と題した単行本
の第6章(文献7)に記載されているのでここでは説明
を省略する。
LPG分析回路640は、ピッチ周期を変更して得た合
成音声x(n)の母音区間において、LPC分析を行い
、LPG係数a、′を計算する。このとき、作用の項で
述べたように、LPG分析をピッチ同期で行なってもよ
いし、固定長フレーム区間毎に行なってもよい。
LPCケプストラム計算回路645はLPC係数をLP
Cケプストラムc11(i)に変換する。
FFT計算回路630は係数C”′(i)を人力し、前
記(3)式で定めたパワスペクトルF2(z)を計算し
出力する。
なお、前記作用の項で述べたように、LPCケプストラ
ムを用いてもよいし、ケプストラムや改良ケプストラム
を用いることもできる。
補正用スペクトルパラメータ計算回路620は、H2(
z)、F2(z)を用いて、(4)式に従いG2(z)
を計算す 。
る。さらに、これを逆FFT して自己相関関数R(m
)を求め、LPG分析してLPC係数biを求める。
補正用フィルタ650は、係数biを用い、振幅制御回
路710の出力を人力して、スペクトル歪を補正した合
成音声x’(n)を下式に従い計算する。
x’(n) = G−x(n)+Σbi−x’(n−i
)      (7)(7)式でG−x(n)は補正用
フィルタ650の入力信号を示す。
ゲイン計算回路700は、ピッチを変化させた区間で、
x(n)とx’(n)のピッチ毎の平均電力を等しくす
るためのゲインGを計算する。これは、補正用フィルタ
650のゲインGが1ではないからである。具体的には
、ピッチを変化させた区間で、ピッチ毎にx(n)とx
’(n)の平均電力を下式に従い計算する。
PL = 1/N・Σx2(n)          
(8a)F2 : 1/N−Σx2(n)      
    (8b)ここでNはピッチ区間のサンプル数を
示す。そしてゲインGを下式から求める。
Gゴf呵7#           <9>このゲイン
Gがかけられた、最終的な合成音声信号X”(n)は端
子660を通して出力される。
以上本発明の一実施例に対する説明を終える。
上記実施例は、あくまでも本発明の一構成にすぎず、種
々の変形も可能である。
本実施例では、単位音声の全区間について、音源信号と
して、線形予測分析して得られた予測残差信号を用いた
が、演算量、メモリ量の低減のために、有声区間、特に
母音区間では、代表的な1ピッチ区間の予測残差信号を
用いて、これの振幅、ピッチを制御しながら繰り返して
用いてもよい。
また、音源信号としては、線形予測分析して得られる予
測残差信号のみならず他の良好な音源信号、例えば、零
位相化信号、位相等化信号、マルチパルス音源などを用
いることができる。
また、格納するスペクトルパラメータとしては、実施例
方法以外に他の良好なスペクトルパラメータ、例えば、
ホルマント、ARMA、 PSE、LSP、 PARC
OR,メルケプストラム、−膜化ケプストラム、メル一
般化ケプストラムなどを用いることができる。
また、スペクトルパラメータとしてLPC係数をスペク
トルパラメータ格納回路260に格納したが、ケプスト
ラムや改良ケプストラムを格納するようにすることもで
きる。ただしこのようにすると合成側でもLPC合成フ
ィルタの前にLPC変換回路が必要となる。
補正用フィルタのスペクトルパラメータも本実施例の方
法以外に、他の良好なパラメータ、例えば、ホルマント
、ARMA、 PSESLSP、 PARCOR。
メルケプストラム、−膜化ケプストラム、メルー般化ケ
プストラムなどを用いることができる。
また、補正用フィルタの構成としては、(5)式で示し
たような全極形フィルタを用いたが、極−雰形フィルタ
や、FIRフィルタを用いる構成としてもよい。但しこ
のようにすると、演算量がかなり増大する。
また、演算量低減化のために、振幅制御回路710、ゲ
イン計算回路700を省略するこ、ともできる。ただし
このようにすると、合成音声x’(n)のレベルが多少
変化するおそれがある。
また、振幅制御回路570は、残差信号のパワーを制御
するのではなく、ゲイン計算回路700、振幅制御回路
710と同一の構成とし、合成音声x(n)のパワーを
制御するようにしてもよい。ただしこのときは、制御化
部510から入力する制御信号は、残差信号のピッチ毎
の単位パワーではなく、合成音声のピンチ毎の単位パワ
ーとする必要がある。
また、振幅制御回路570.710、ゲイン回路700
は簡略化のために省略することもできるるまた、分析側
で、ピッチ分割は行わないで、合成時に制御情報として
与えるようにしてもよい。
このようにすると、ピッチ分割回路445は不要となる
また、本実施例では、韻律制御情報を端子500を通し
て入力する構成としたが、韻律制御に関しては、アクセ
ント情報、イントネーション情報を入力して、規則によ
り韻律制御情報を発生するようにしてもよい。
また、演算量低減のために、補正用フィルタの計算は、
ピッチ制御回路560において、ピッチの変化が太きい
ときにのみ計算するような構成としてもよい。
また、各単位音声毎に、ピッチの変化量に応じて補正用
スペクトルパラメータをコードブックとして有しておく
か、あるいはスペクトルパラメータの変化自体をコード
ブックあるいはテーブルとして予め有しておき、スペク
トルパラメータの最適な変化を参照するようにしてもよ
い。このようにすると、前者の場合では補正用フィルタ
の計算が簡略化される、後者の場合では補正用フィルタ
の計算が不要となる。
(発明の効果) 以上説明したように、本発明によれば、単位音声の全て
の区間について音源信号とスペクトルパラメータを有し
ており、これらを用いて音声を合成しているので、子音
区間のみならず、従来音質が劣化していた母音区間でも
良好な音質の合成音得ることができるという大きな効果
がある。また、本発明によれば、スペクトルパラメータ
及びスペクトル補正の計算にピンチの影響を受けにくい
分析法を用いていると共に、音源信号のピッチ周期を、
あらかじめ分析して格納しておいた音源信号のピッチ周
期に比べ大きく変化させて合成しても、それにより発生
するスペクトル歪を補正する補正フィルタを有している
ので、音質劣化のほとんどない音声を合成することがで
きるという効果がある。またこの効果は、ピンチ周期の
短い女性話者について特に顕著である。
【図面の簡単な説明】
第1図は、本発明の1実施例を示すブロック図、第2図
は本発明の作用を示すブロック図である。 図において、120.410・・・ケプストラム計算部
、150.430・・・LPC変換回路、200.44
0・・・LPC逆フィルタ、250.450・・・音源
信号格納回路、300.56090.ピッチ制御回路、
350.600・・・合成フィルタ、300.650・
・・補正用フィルタ、370.620・・・補正用スペ
クトルパラメータ計算回路、260.460・・・スペ
クトルパラメータ格納回路、420.・・改良ケプスト
ラム計算部、570.710・・・振幅制御回路、60
5.645・・・LPCケプストラム計算回路、610
.630・・・FFT計算回路、640、LPC分析回
路、700・・・ゲイン計算回路。

Claims (3)

    【特許請求の範囲】
  1. (1)音声合成に供する単位音声信号からケプストラム
    を基にして求めたスペクトルパラメータを用いて前記単
    位音声区間全体の音源信号を求め、前記音源信号と前記
    スペクトルパラメータを前記単位音声について格納し、
    前記音源信号の韻律情報を制御しながら前記スペクトル
    パラメータを用いて音声を合成し、前記合成音声のスペ
    クトルをケプストラムをもとにして補正するフィルタと
    を有することを特徴とする音声分析合成方式。
  2. (2)音声合成に供する単位音声信号から予め定められ
    た時間長毎にあるいは前記単位音声から抽出したピッチ
    パラメータに応じた時間長毎にケプストラムをもとにし
    た分析を行いスペクトルパラメータを計算して格納する
    スペクトルパラメータ計算回路と、前記ピッチパラメー
    タに応じた時間区間毎あるいは予め定められた時間区間
    毎に前記スペクトルパラメータをもとに線形予測係数に
    よる逆フィルタを行い前記単位音声全体の音源信号を求
    めて格納する音源信号計算回路とを有することを特徴と
    する音声分析装置。
  3. (3)単位音声毎に音源信号を格納する音源信号格納回
    路と、前記単位音声毎にケプストラムをもとにして求め
    たスペクトルパラメータを格納するスペクトルパラメー
    タ格納回路と、前記音源信号の韻律を制御する韻律制御
    回路と、前記韻律を制御された音源信号と前記スペクト
    ルパラメータを用いて音声を合成する合成回路と、前記
    スペクトルパラメータと前記合成音声からケプストラム
    をもとにして求めたスペクトルパラメータとを用いて前
    記合成音声のスペクトルを補正するフィルタ回路とを有
    することを特徴とする音声合成装置。
JP63133478A 1988-05-30 1988-05-30 音声分析合成装置、音声分析装置及び音声合成装置 Expired - Lifetime JP3063088B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP63133478A JP3063088B2 (ja) 1988-05-30 1988-05-30 音声分析合成装置、音声分析装置及び音声合成装置
US07/358,104 US5029211A (en) 1988-05-30 1989-05-30 Speech analysis and synthesis system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63133478A JP3063088B2 (ja) 1988-05-30 1988-05-30 音声分析合成装置、音声分析装置及び音声合成装置

Publications (2)

Publication Number Publication Date
JPH01302299A true JPH01302299A (ja) 1989-12-06
JP3063088B2 JP3063088B2 (ja) 2000-07-12

Family

ID=15105715

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63133478A Expired - Lifetime JP3063088B2 (ja) 1988-05-30 1988-05-30 音声分析合成装置、音声分析装置及び音声合成装置

Country Status (1)

Country Link
JP (1) JP3063088B2 (ja)

Also Published As

Publication number Publication date
JP3063088B2 (ja) 2000-07-12

Similar Documents

Publication Publication Date Title
US5029211A (en) Speech analysis and synthesis system
US8271292B2 (en) Signal bandwidth expanding apparatus
JPH10124088A (ja) 音声帯域幅拡張装置及び方法
EP1006510A2 (en) Signal encoding and decoding system
JPH09127996A (ja) 音声復号化方法及び装置
WO2018003849A1 (ja) 音声合成装置および音声合成方法
JP3430985B2 (ja) 合成音生成装置
US20080215330A1 (en) Audio Signal Modification
JP3732793B2 (ja) 音声合成方法、音声合成装置及び記録媒体
JPH0193795A (ja) 音声の発声速度変換方法
JP3426871B2 (ja) 音声信号のスペクトル形状調整方法および装置
CN102118675A (zh) 带有自适应反馈补偿装置的助听器
JPH10124089A (ja) 音声信号処理装置及び方法、並びに、音声帯域幅拡張装置及び方法
US7596497B2 (en) Speech synthesis apparatus and speech synthesis method
US5864791A (en) Pitch extracting method for a speech processing unit
JP2904279B2 (ja) 音声合成方法および装置
JP6011039B2 (ja) 音声合成装置および音声合成方法
JP2600384B2 (ja) 音声合成方法
JP3462464B2 (ja) 音声符号化方法、音声復号化方法及び電子装置
JP3197975B2 (ja) ピッチ制御方法及び装置
JP2615856B2 (ja) 音声合成方法とその装置
JP2612867B2 (ja) 音声ピッチ変換方法
JPH01302299A (ja) 音声分析合成装置、音声分析装置及び音声合成装置
JP4433668B2 (ja) 帯域拡張装置及び方法
Lawlor A novel efficient algorithm for voice gender conversion