JPH01304500A - 音声合成方式とその装置 - Google Patents

音声合成方式とその装置

Info

Publication number
JPH01304500A
JPH01304500A JP63136970A JP13697088A JPH01304500A JP H01304500 A JPH01304500 A JP H01304500A JP 63136970 A JP63136970 A JP 63136970A JP 13697088 A JP13697088 A JP 13697088A JP H01304500 A JPH01304500 A JP H01304500A
Authority
JP
Japan
Prior art keywords
sound source
pitch
source signal
speech
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63136970A
Other languages
English (en)
Inventor
Kazunori Ozawa
小沢 一範
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63136970A priority Critical patent/JPH01304500A/ja
Publication of JPH01304500A publication Critical patent/JPH01304500A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音源信号とスペクトルパラメータを格納し、
音源信号の韻律(ピッチ、振幅1時間長など)を制御し
、前記音源信号を用いて合成フィルタを駆動して音声を
合成する音声合成方式とその装置に関する。
〔従来の技術〕
任意語音声合成の方式として、線形予測分析等を用いて
得られた予測残差信号の一部を音源信号として用い、こ
の音源信号により線形予測係数から構成される合成フィ
ルタを駆動して音声を合成する方式が知られている。こ
の方式は例えば、左藤氏による“”cvcと音源要素に
もとづく(SYM P L E )音声合成″(日本音
響学会音声研究会資料 383−69.1984年)と
題した論文(文献1)に詳細に記載されている。文献1
の方式においては、無声音区間では元の音声から線形予
測分析して得られた予測残差信号を音源信号として用い
、有声音区間では母音区間の代表的な1ピッチ周期区間
から切り出した予測残差信号を有声音区間の音源として
使用して、合成フィルタを駆動して音声を合成している
。この方式では、音源として有声音区間ではインパルス
列を、無声音区間では雑音信号を用いる方式と比べて音
質が改善されるとしている。
〔発明が解決しようとする課題〕
音声合成、特に任意語合成では、単位音声を接続して音
声を合成するわけであるが、人間が発話の際に行ってい
るような自然な抑揚をつけるために、韻律制御情報ある
いは韻律規則に従い、音声信号あるいは音源信号のピッ
チ周期を変化させる必要がある。しかるに前記文献1の
方式では、有声区間の音源である予測残差信号のピッチ
周期を変化させたときに、合成フィルタの係数を分析し
た元の音声のピッチ周期とき成すべき音声のピッチ周期
が異なるので、残差信号の変更したピッチと合成フィル
タのスペクトル包絡とでミスマツチングが発生して合成
音声のスペクトルが大きく歪むため、合成音声が大きく
歪んだり明瞭度が大幅に低下するという大きな問題点が
あった。また、この問題点は、ピッチ周期の短い女声話
者においてピッチ周期を大きく変化させたときに特にm
著であった。
この問題点については、スペクトル包絡の低域のホルマ
ントのピークを、合成するときのピッチ周波数の位置に
一致させるようにピーク位置をずらすことによりある程
度改善する方法が知られており、具体的には例えば、匂
坂氏らによる゛′ピッチ構造を考慮したスペクトル包絡
の合成法パ(日本音響学会講演論文集 501−502
頁、1979年10月〉と題した論文(文献2)を参照
できる。しかしながら前記文献2の方法では、ホルマン
トのピーク位置を、変更したピッチ周波数の位置にずら
してしまうので、本質的に改善法ではなく、ホルマント
位置の移動によって明瞭性および音質が劣化するという
問題点が新たに発生していた。
さらに、前記文献1の方式では、母音区間では、同一母
音区間の代表的な1ピッチ区間の予測残差信号を基本的
には繰り返して使用しているので、母音区間での残差信
号のスペクトル及び位相の時間的な変化を十分に表すこ
とができず、母音区間で音質が劣化していた。
本発明の目的は、音源信号のピッチ周期を変化させて合
成フィルタを駆動して音声を合成する際に、従来の問題
点を改善するのみならず、母音区間でも良好な音質の得
られる音声合成方式とその装置を提供することにある。
〔課題を解決するための手段〕
本発明の音声合成方式は、音源信号とスベクI・ルパラ
メータを単位音声について格納し、前記音源信号の韻律
を制御しながら前記スペクトルパラメータを用いて音声
を合成する音声合成方式において、フィルタにより前記
韻律を制御した音源信号のスベク1〜ルを補正するフィ
ルタを有することを特徴とする。
また、本発明の音声合成装置は、単位音声毎に音源信号
を格納する音源信号格納回路と、前記単位音声毎にスペ
クトル特性を表すスペクトルパラメータを格納するスペ
クトルパラメータ格納回路と、前記音源信号の韻律を制
御する韻律制御回路と、前記音源信号から求めたスペク
トルパラメータと前記韻律を制御された音源信号から求
めたスペクトルパラメータとを用いて前記韻律を制御さ
れた音源信号のスペクトルを補正する補正フィルタと、
前記スペクトルを補正された音源信号と前記スペクトル
パラメータとを用いて音声を合成する合成回路とを有す
ることを特徴とする。
〔作用〕
本発明は、音源信号を単位音声区間では、有音声、無音
声を問わず全区間に対して有するとともに、音源信号の
ピッチを変化させて音声を合成したときに生ずるスペク
トルの歪を補正するための補正用フィルタをピッチを変
化させた音源信号に対して用いることを特徴とする。
第2図は本発明の作用を示すブロック図で、音源信号記
憶部110は単位音声(例えばCV、VCなど)毎に音
声信号を分析して音源信号を求め、この音源信号を単位
音声毎に記憶しておく。また分析して求めたスペクトル
パラメータをスペクトルパラメータ記憶部350に格納
しておく。ここでは、分析法としては周知の線形予測分
析(LPG)を用い、音源信号として線形予測分析して
得られた予測残差信号を用いるものとして説明を進める
。ただし、スペクトルパラメータ、音源信号としては、
周知の他の良好なものを用いることもできる。また、予
測残差信号の母音区間では、各ピッチ毎にピッチの開始
位置も格納しておく。スペクトルパラメータとしては線
形予測パラメータとして種種のものが考えられるが、こ
こではLPCパラメータを用いることにする。これ以外
にもLSP、PARCOR,ポルマントなど、他の周知
のパラメータを用いることができる。分析は、あらかじ
め定められた固定長フレーム(5あるいは10m5)で
もよいし、母音区間ではピッチ周期に同期したピッチ同
期分析を用いることもできる。
音源信号記憶部110は端子100から入力した制御情
報にもとづき、必要な単位音声をj讐択してこれに対応
する予測残差信号を出力する。
ピッチ制御部150では前記制御情報のうちピッチを変
化させるための情報を用いて、母音区間では前記ピッチ
の開始位置にもとづいてピッチ区間毎に残差信号のピッ
チの伸縮を行う。具体的な方法については、例えば前記
文献1に記載されているように、ピッチ周期を長くする
ときはピッチ区間の後ろに零を詰め、ピッチ周期を短く
するときはピッチ区間の後ろからサンプルを切り詰める
また母音区間の時間長は前記制御情報により指定された
時間長を用いてピッチ単位で調整する。
スペクトルパラメータ記憶部350は、あらかじめ線形
予測分析により求めたL P Gパラメータを各単位音
声について記憶しておく。そして前記制御情報に従い、
単位音声を選択しこれに対応するLPCパラメータat
(Mt次)を出力する。
補正用スペクトルパラメータ計算部300は予測残差信
号のピッチを変化させたときに発生するスペクトル歪を
補正するための補正用スペクトルパラメータb、を計算
する。具体的には以下のように行う。ピッチを変化させ
る前の予Jll残差信号の有声区間から、予算残差信号
のスペクトル包絡全表すスペクトルパラメータC1(M
2次)を、あらかじめ定められた区間毎にあるいはピッ
チ同期にLPG分析により求める。次に、C1を用いて
以下のパワスペクトルH2(Z)を計算するOH2(z
)=□ ・・・・・・(1) 次に、ピッチを変化させた予測残差信号の有声音区間に
ついて、あらかじめ定められた区間長毎に、あるいはピ
ッチ同期にLPC分析を行い、スペクトルパラメータa
l′ (M2次)ご計算し、これを用いて以下のパワス
ペクトルF2 (z)を計算する。
・・・・・・(2) 次に、(1)式と(2)式の比を以下のように求める。
そして、(3)式を逆フーリエ変換して自己相関関数R
(m)を求め、R(m)からr、 p c分析により補
正用スペクトルパラメータb+(M3次〉を計算する。
なお、(1) 、 (2)式はフーリエ変換を用いて計
算することができる。
補正用フィルタ250は以下の伝達特性Q <z)を持
ち、 Q(z)=□   ・・・・・・(4)1−Σb、z−
’ 1=1 ピッチを変fヒさせた予測残差信号e(n、)を入力し
、補正用スペクトルパラメータbl を用いて、スペク
トル歪を補正した予測残差信号e′ (n)を出力する
合成フィルタ200は下式の伝達特性を持ち、5(z)
−□−・・・・・・(5) ピッチを変化させスペクトルを補正した予測残差信号e
′ (n)とL I−’ Cパラメータalとを用いて
合成した合成音声x(n)を出力する。
〔実施例〕
次に本発明について第1図を参照して詳細に説明する。
第1図は本発明の一実施例の構成を示すブロック図であ
る。制御回路510は端子500から韻律制御(ピッチ
、時間長、振幅)情報、単位音声の接続情報を入力し、
音源記憶回路550.スペクトルパラ、メータ記憶回路
580.ピッチ制御回路560.振幅制御回路570へ
出力する。音源記憶回路550は惧位音声の接続情報を
入力し、その単位音声に対応する予測残差信号を出力す
る。
ピッチ制御回路560はピッチ制御情報を入力し、母音
区間においてあらかじめ指定されているピッチ分割位置
を用いて予測残差信号のピッチの変更を行う。ピッチを
変更するための具体的な方法は、前記IY用の項で説明
した方法や他の周知の方法を用いることができる。
次に、振幅制御回路570は振幅制御情報を入力し、そ
れに従って予測残差信号の振幅を制御して予測残差信号
e (n)を出力する。スペクトルパラメータ記憶回路
580は単位音声の接続情報を入力し、その単位音声に
対応するスペクトルパラメータ系列を出力する。ここで
は、前記作用の項と同様にスペクトルパラメータとして
、L P G係数81を用いることにするが、他の周知
のパラメータを用いることができる。
振幅制御回路710はピッチを変更した予測残差信号e
(n)にゲインGをかけて出力する。ゲインGはゲイン
計算回路700から入力する。なお、ゲイン計算回路7
00の動作は後述する。
1、 P C分析回路640はピッチを変更する前の予
測残差信号及びピッチを変更した後の予測残差信号を入
力し、これへの母音区間において、あらかじめ定められ
た固定フレーム区間長毎あるいはピッチ同期にLPC分
析を行い、それぞれの信号に対するL P G係数C1
,a′lと計算する。
FFT計算回路610はLPC係数CI + ”’1を
入力し、あらかじめ定められた点数(例えば256点)
のFFT(高速フーリエ変換)を行い、前記(1) 、
 (2)式で定義したパワスペク1〜ルト■2(Z)、
F2 (Z)を計算して出力する。なお、F F Tの
計算法は、例えばOppenheim氏らによる”Di
giLal  Signal  Processing
 ”   (PrenLice−1−1a11.197
5年)と題した単行本の第6章(文献3)に記載されて
いるのでここでは説明を省略する。
補正用スペクI−ルパラメータ計算回路620はパワー
スペクIヘルH2(z)、F2 (z)を用いて、(3
)式に従い比G2 (z)を計算する。さらに、これを
逆FFTして自己相関関数R(m、)を求め、R(m)
を用いてLPC分析してL P C係数b1を求める。
補正用フィルタ650は係数す、を用い振幅制御回路7
10の出力を入力して、ピッチを変更したことにより発
生するスペクトル歪を補正した予測残差信号e’  (
n>を下式に従い計算する。
e′ (n)=G−e (n) (6)式てG−e(n)は補正用フィルタ650の入力
信号を示す。
合成フィルタ回路600は(5)式の特性を有しており
、ピッチを変更しスペクトル歪を補正した予測残差信号
e′ (n)を入力してLPG係数a1を用いて次式に
従い合成音声x (n)を計算する。
・・・・・(7) ゲイン計算回路700はピッチを変化させた区間で、予
測残差信号e (n)とe’  (n)のピッチ毎の平
均電力を等しくするためのゲインGを計算する。これは
、補正用フィルタ650のゲインが1ではないからであ
る。具体的には、ピッチを変化させた区間で、ピッチ毎
に予測残差信号e(n)とe’  (n)の平均電力を
下式に従い計算する。
ここでN1.N2はピッチ区間のサンプル数を示す。そ
してゲインGを下式から求める。
a= i〒77丁       ・・・・・・(9)こ
のゲインGがかけられた最終的な合成音声信号x(n>
は端子660を通して出力される。
上記実施例は、あくまでも本発明の一構成例にすぎず、
種種の変形も可能である。
すなわち、本実施例では単位音声の全区間について、音
源信号として線形予測分析して得られた予測残差信号を
用いたが、演算量、メモリ量の低減のために、有声区間
、特に母音区間では代表的な1ピッチ区間の予測残差信
号を用いて、これの振幅、ピッチを制御しながら繰り返
して用いてもよい。
また、音源信号としては、線形予測分析して得られる予
測残差信号のみならず、他の良好な音源信号、例えば零
位相化信号9位相等化信号、マルチパルス音源などを用
いることができる。
また、スペクトルパラメータとしては、LPC以外に他
の良好なスペクトルパラメータ、例えばLSP、ホルマ
ント、ケプストラムなどを用いることができる。
また、補正用フィルタのスペクトルパラメータもLPC
以外に、他の良好なパラメータ、例えばLSP、ホルマ
ント、ケプストラムなどを用いることができる。
また、補正用フィルタの構成としては、(4)式で示し
たような全極形フィルタを用いたが、極−雲形フィルタ
やFIRフィルタを用いる構成としてもよい。ただしこ
のようにすると演算量ががなり増大する。
また、演算量低減化のために、振幅制御回路710、ゲ
イン計算回路700を省略することもできる。ただしこ
のようにすると合成音声x (n>のレベルか多少変化
するおそれがある。
また、振幅制御回路570は残差信号のパワを制御する
のではなく、ゲイン計算回路700.振幅制御回路71
0と同一の構成とし、合成音声X(n)のパワを制御す
るようにしてもよい。ただしこのときは、制御回路51
0から入力する制御信号は残差信号のピッチ毎の単位パ
ワではなく、合成音声のピッチ毎の単位パワとする必要
がある。
また、本実施例では韻律制御情報を端子500を通して
入力する構成としたが、韻律制御に関しては、アクセン
ト情報、イントネーション情報を入力して、規則により
韻律制御情報を発生するようにしてもよい。
また、演算量低減のために、補正用スペクトルパラメー
タ、補正用フィルタの計算はピッチ制御回路560にお
いてピッチの変化が大きいときにのみ計算するような構
成としてもよい。
〔発明の効果〕
以上説明したように本発明によれば、単位音声のすべて
の区間について音源信号とスペクトルパラメータを有し
ており、これらを用いて音声を合成しているので、子音
区間のみならず、従来音質が劣化していた母音区間でも
良好な音質の合成音を得ることができるという大きな効
果が得られる。
また、本発明によれば、音源信号のピッチ周期をあらか
じめ分析して格納しておいた音源信号のピッチ周期に比
べ大きく変化させて合成しても、それにより発生するス
ペクトル歪を補正することが可能であるので、音質劣化
のほとんどない音声を合成することができるという効果
が得られる。まなこの効果は、ピッチ周期の短い女性話
者について特に顕著である。
【図面の簡単な説明】
第1図は本発明の一実施例の構成を示すブロック図、第
2図は本発明の作用を示すブロック図である。 110・・・音源信号記憶部、150・・・ピッチ制御
部、200,600・・・合成フィルタ、250,65
0・・・補正用フィルタ、300・・・補正用スペクト
ルパラメータ記憶部、350・・・スペクトルパラメー
タ記憶部、510・・・制御回路、550・・・音源記
憶回路、560・・・ピッチ制御回路、570,710
・・振福制御回路、580・・・スペクトルパラメータ
記憶回路、620・・・補正用スペクトルパラメータ計
算回路、630・・・FFT計算回路、640・・・L
PG分析回路、700・・・ゲイン計算回路。

Claims (2)

    【特許請求の範囲】
  1. (1)音源信号とスペクトルパラメータを単位音声につ
    いて格納し、前記音源信号の韻律を制御しながら前記ス
    ペクトルパラメータを用いて音声を合成する音声合成方
    式において、フィルタにより前記韻律を制御した音源信
    号のスペクトルを補正することを特徴とする音声合成方
    式。
  2. (2)単位音声毎に音源信号を格納する音源信号格納回
    路と、前記単位音声毎にスペクトル特性を表すスペクト
    ルパラメータを格納するスペクトルパラメータ格納回路
    と、前記音源信号の韻律を制御する韻律制御回路と、前
    記音源信号から求められたスペクトルパラメータと前記
    韻律を制御された音源信号から求めたスペクトルパラメ
    ータとを用いて前記韻律を制御された音源信号のスペク
    トルを補正する補正フィルタと、前記スペクトルを補正
    された音源信号と前記スペクトルパラメータとを用いて
    音声を合成する合成回路とを有することを特徴とする音
    声合成装置。
JP63136970A 1988-06-02 1988-06-02 音声合成方式とその装置 Pending JPH01304500A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63136970A JPH01304500A (ja) 1988-06-02 1988-06-02 音声合成方式とその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63136970A JPH01304500A (ja) 1988-06-02 1988-06-02 音声合成方式とその装置

Publications (1)

Publication Number Publication Date
JPH01304500A true JPH01304500A (ja) 1989-12-08

Family

ID=15187737

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63136970A Pending JPH01304500A (ja) 1988-06-02 1988-06-02 音声合成方式とその装置

Country Status (1)

Country Link
JP (1) JPH01304500A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011237826A (ja) * 2011-08-05 2011-11-24 Toshiba Corp 復号装置およびスペクトル整形方法
JP2012003277A (ja) * 2011-08-05 2012-01-05 Toshiba Corp 復号装置およびスペクトル整形方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011237826A (ja) * 2011-08-05 2011-11-24 Toshiba Corp 復号装置およびスペクトル整形方法
JP2012003277A (ja) * 2011-08-05 2012-01-05 Toshiba Corp 復号装置およびスペクトル整形方法

Similar Documents

Publication Publication Date Title
US5029211A (en) Speech analysis and synthesis system
KR940002854B1 (ko) 음성 합성시스팀의 음성단편 코딩 및 그의 피치조절 방법과 그의 유성음 합성장치
JP3294604B2 (ja) 波形の加算重畳による音声合成のための処理装置
US5987413A (en) Envelope-invariant analytical speech resynthesis using periodic signals derived from reharmonized frame spectrum
WO2018003849A1 (ja) 音声合成装置および音声合成方法
JP3732793B2 (ja) 音声合成方法、音声合成装置及び記録媒体
US20080215330A1 (en) Audio Signal Modification
US20020138253A1 (en) Speech synthesis method and speech synthesizer
US7596497B2 (en) Speech synthesis apparatus and speech synthesis method
JP2600384B2 (ja) 音声合成方法
JP2904279B2 (ja) 音声合成方法および装置
JPH01304500A (ja) 音声合成方式とその装置
JP2612867B2 (ja) 音声ピッチ変換方法
JP2615856B2 (ja) 音声合成方法とその装置
JP3197975B2 (ja) ピッチ制御方法及び装置
EP1093111B1 (en) Amplitude control for speech synthesis
JP2000259164A (ja) 音声データ作成装置および声質変換方法
JP3063088B2 (ja) 音声分析合成装置、音声分析装置及び音声合成装置
JP2001312300A (ja) 音声合成装置
JP3284634B2 (ja) 規則音声合成装置
JPS5965895A (ja) 音声合成方法
JPH06250685A (ja) 音声合成方式および規則合成装置
JPH0594199A (ja) 残差駆動型音声合成装置
JP5915264B2 (ja) 音声合成装置
JPH07129194A (ja) 音声合成方法及び音声合成装置