JPH0670752B2 - 極零分析装置 - Google Patents

極零分析装置

Info

Publication number
JPH0670752B2
JPH0670752B2 JP62057330A JP5733087A JPH0670752B2 JP H0670752 B2 JPH0670752 B2 JP H0670752B2 JP 62057330 A JP62057330 A JP 62057330A JP 5733087 A JP5733087 A JP 5733087A JP H0670752 B2 JPH0670752 B2 JP H0670752B2
Authority
JP
Japan
Prior art keywords
pole
filter
zero
cepstrum
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62057330A
Other languages
English (en)
Other versions
JPS63221398A (ja
Inventor
昌子 市川
幸夫 三留
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP62057330A priority Critical patent/JPH0670752B2/ja
Priority to US07/167,275 priority patent/US4899386A/en
Publication of JPS63221398A publication Critical patent/JPS63221398A/ja
Publication of JPH0670752B2 publication Critical patent/JPH0670752B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Filters That Use Time-Delay Elements (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は極零分析装置に関し、特に音声等の信号のスペ
クトルを近似する極零パラメータの値を抽出する極零分
析装置に関するものである。
〔従来の技術〕
音声合成や音声認識の分野では、音声のスペクトルを近
似するパラメータの値を抽出することが重要である。さ
らに、一般の信号についても、そのスペクトルを近似す
るパラメータの値を抽出することが必要になる場合があ
る。
音声等の信号(以下、単に音声等と記す)のスペクトル
を近似するパラメータとしては、極あるい極零がしばし
ば用いられる。これは、極や零はその物理的意味が明確
である等の特徴があり、応用上有利であるためである。
従来、音声等のスペクトルを近似する極パラメータの値
を抽出するものとして、音声等から抽出された線形予測
係数を係数とする高次代数方程式を例えばニュートン・
ラプソン法等の逐次近似法を用いて解く方法が知られて
いる。この第一の従来例は、例えばジェイ.ディー.マ
ーケルとエイ,エイチ.グレイ(J.D.Markel and A.H.G
ray)の著書「音声の線形予測(鈴木訳)」(Linear Pr
e-diction of Speech)の第7章に示されている。
極パラメータの値を抽出する第二の従来例として、自己
相関領域において逆フィルタリングするものが、伏木田
による論文「自己相関領域で逆フィルタリングを用いた
ホルマントの多段推定方式」(日本音響学会音声研究会
資料S81−41)に示されている。この第二の従来例で
は、音声の生成モデルの極パラメータに対応する係数を
用いて、入力信号の自己相関値を逐次逆フィルタリング
してエラーパワーを求める。あらかじめ、極パラメータ
値のテーブルを用意しておき、それから各段の係数を求
めて上記のエラーパワーを算出する。種々の極パラメー
タ値の候補に対してエラーパワーの最小値を与えたもの
を最適な近似を与える極パラメータの値として出力す
る。
一方、極零パラメータの値を抽出する第三の従来例とし
て、シー.ティー.マリスとアール.エイ.ロバーツ
(C.T.Mullis and R.A.Roberts)によるアイイーイーイ
ートランザクション(IEEE Transaction)エイエスエス
ピー24(ASSP−24),No.3のページ226から238に掲載の
論文、「ザ ユース オブ セカンドオーダ インフォ
メーション イン ザ アプロクシメイション オブ
ディスクリートタイム リニアー システムズ(The Us
e of Second-Order Infor mation in the Approximatio
n of Discrete-Time Linear Systems)」に示されたも
のがある。
これは、音声のスペクトル包絡H(ejω)を、伝達関数
が次式で表される極零システムによって近似するもので
ある。
但しa0=1 ここにnは分母多項式の次数すなわち極回路の次数で、
mは分子多項式の次数すなわち零回路の次数である。
この方法は次式の値を最小にするaiおよびqkが最適な近
似を与えるという原理に基づいている。
これは、時間領域においては、音声等の入力信号の自己
相関値と、それに関連したインパルス応答から決定され
る値を係数とし、aiを未知数とする連立方程式を解くこ
とに対応する。
自己相関値およびインパルス応答の値は例えばnあるい
はmよりも高い次数の線形予測法、すなわち第一の従来
例の方法によって容易に求めることができる。そのとき
には、高次代数方程式の根を求める必要はなく、単にイ
ンパルス応答さえ求めればよい。
第三の従来例では、伝達関数の分母多項式と分子多項式
の係数aiとqkが得られる。これから極零パラメータの値
を得るためには第一の従来例と同様に高次(n次もしく
はm次)代数方程式の根を求める必要がある。
〔発明が解決しようとする問題点〕 上述した従来例のうち、第一の従来例、即ち線形予測係
数を係数とする高次代数方程式を解くものは、高次代数
方程式を解く際に多くの演算を必要とすることや、極の
周波数やバンド幅を安定に求めることが困難であるとい
った問題点があった。
また第二の従来例では、あらかじめ音声等のスペクトル
を表す極パラメータとして妥当と思われる候補の中から
最適な値を抽出するので安定に求められるが、多くの演
算を必要とするといった問題点があった。
更に、これら第一,第二の従来例では極パラメータの値
しか得られないので、音声等のスペクトルの形状によっ
ては比較的低い次数では最適な近似を与えるパラメータ
値とはならず、逆にそのような場合には高い次数のパラ
メータを求めなければならず、いっそう多くの演算が必
要になるといった問題点があった。
第三の従来例、即ちマリスとロバーツによるものは、極
パラメータと零パラメータの値が得られるので、比較的
低い次数で最適な近似を与えるパラメータ値となるが、
第一の従来例と同様に高次代数方程式を解かねばならず
第一の従来例と同様の問題点があった。この点は、音声
の場合には零の数は少ないので問題とならないが、極の
次数は少なくとも10次程度必要であり問題となる。
本発明の目的は、音声等の信号のスペクトルを近似する
極零パラメータの値を比較的少ない演算量で抽出できる
極零分析装置を提供することにある。
〔問題点を解決するための手段〕
第2図は本発明の構成を説明するための図であり、第2
図(a)は基本フィルタのブロック図、第2図(b)は基本フ
ィルタを構成要素とする並列フィルタのブロック図であ
る。
本発明の極零分析装置は、入力音声の時間窓内のケプス
トラムを算出して一時記憶する手段と、音源波形のケプ
ストラムをあらかじめ記憶したテーブルと、第2図(a)
に示すように二次の極回路と一次の零回路からなるフィ
ルタを基本フィルタとし、第2図(b)に示すように音声
の生成モデルの極回路の数の基本フィルタを並列接続し
て構成する第一のフィルタと、生成モデルの零回路の数
の基本フィルタを並列接続して構成する第二のフィルタ
と、前記第一のフィルタの出力と前記第二のフィルタの
出力との差に係数を乗じた値を出力とする分析フィルタ
と、前記分析フィルタのインパルス応答と入力音声のケ
プストラムとの差の二乗和をあらかじめ定められたサン
プル数だけ算出する手段と、生成モデルの極パラメータ
値を基本フィルタの極零パラメータ値に変換し、零パラ
メータ値を前記基本フィルタの極零パラメータ値に変換
する極零パラメータ変換テーブルを有し、フォーカシン
グ制御を行なって前記極零パラメータ変換テーブルから
前記ケプストラムの差の二乗和が最小になる極零パラメ
ータの値と最適な音源ケプストラムテーブルの値を抽出
する手段とから構成される。
〔作用〕
本発明の原理は、次の式(3)で与えられる対数スペクト
ルの二乗誤差rを最小にするようにして最適な極零パラ
メータを求めることである。
これは時間領域においては音声から抽出されたケプスト
ラムと、音声生成モデルのケプストラムの二乗誤差を最
小にすることに等価である。音声のスペクトル包絡を表
すケプストラムは、数10次以下の成分であるから、二乗
誤差を評価する場合にもその程度の成分のみでよい。
あらかじめ決められた時間窓内の音声のケプストラムの
値は従来よく知られているように、高速フーリエ変換器
などを用いて容易に算出することができる。これに対し
音声の生成モデルのケプストラムを同様に高速フーリエ
変換器を用いて算出しようとするならば、極零パラメー
タの推定値を設定し、合成音声を生成しそれのケプスト
ラムを高速フーリエ変換器によって求めなければならな
いので膨大な演算を必要とする。
しかし本発明では、音声の生成モデルが極零モデルであ
る場合には、構成要素に示した分析フィルタのインパル
ス応答に時間の逆数を掛けた値がその音声生成モデルの
ケプストラムと等価であることを利用し演算量を低減し
ている。このときの基本フィルタの係数は次式で与えら
れる。
ここに、pは生成モデルの極または零の絶対値、θはそ
の偏角である。係数a,b,cはそれぞれ第2図(a)に示す基
本フィルタの乗算器203,204,205の係数にそれぞれ対応
する。
フォーカシング制御の手法としては例えば「音声研究会
資料S81−41(1980年10月)」に「自己相関領域で逆フ
ィルタリングを用いたホルマントの多段推定方式」と題
して発表された論文に示されたFocusing Methodを用い
ることができる。この手法は、あらかじめ有限個のパラ
メータ候補テーブルを用意しておき、テーブルを多段分
割し、粗い推定から細かい推定へと次第にフォーカシン
グさせる方法である。
〔実施例〕
次に、図面を用いて本発明の実施例について説明する。
第1図は本発明の一実施例を示すブロック図である。
音声信号は信号線21を介してケプストラム算出回路2に
入力される。ケプストラム算出回路2において信号線22
の制御信号を受けて算出されたケプストラムは、信号線
23を介してケプストラムメモリ3に記憶される。
音源ケプストラムテーブル12はあらかじめ様々な形の音
源波形から求めたケプストラムを記憶しており、信号線
40を介して制御回路部1から送られる信号に対応するケ
プストラムを信号線41を介して加算器10へ送る。
インパルス発生器4は信号線24の制御信号を受けてイン
パルスを発生し、発生したインパルスは信号線25により
第一並列回路部5へ、信号線26により第二並列回路部6
へ送られる。
極零パラメータは信号線27の制御信号を受けて極零パラ
メータテーブル7から、信号線28により第一並列回路部
5へ、信号線29により第二並列回路部6へ送られる。
信号線30の第一並列回路部5の出力と信号線31の第二並
列回路部6の出力との差を加算器8で求め、信号線35の
制御信号を受けて信号線32の第一並列回路部5の出力と
第二並列回路部6の出力との差と係数の積を乗算器9で
求める。
信号線33の制御信号を受けてケプストラムメモリ3から
取り出した信号線34で示すケプストラムと、信号線36で
示す乗算器9の出力と、信号線41の音源ケプストラムを
符号をつけて加算器10で加算する。加算器10の出力は信
号線37を介して二乗和演算部11へ送られる。二乗和演算
部11で算出された値は信号線38を介して制御回路部1へ
送られる。
制御回路部1ではフォーカシング制御を行なって極零パ
ラメータテーブル7から二乗和が最小になるような極零
値及び音源波形テーブルを求め、信号線39を介して出力
する。
〔発明の効果〕
以上説明したように本発明によれば、極パラメータ値と
零パラメータ値の両方を得ることができ、代数方程式を
解く必要もなく、インパルス応答を求める必要もないた
め、演算量が少なく、解を安定に求められるという効果
がある。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
本発明の構成を説明するための図であり、第2図(a)は
基本フィルタのブロック図、第2図(b)は基本フィルタ
を構成要素とする並列フィルタのブロック図である。 1……制御回路部、2……ケプストラム算出回路、3…
…ケプストラムメモリ、4……インパルス発生器、5…
…第一並列回路部、6……第二並列回路部、7……極零
パラメータ変換テーブル、11……二乗和算出部、12……
音源ケプストラムテーブル、201,202……遅延要素、20
3,204……極回路の係数乗算器、205……零回路の係数乗
算器。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】音源と声道の極零型の音声の生成モデルに
    基づく極零分析装置において、入力音声の時間窓内のケ
    プストラムを算出して一時記憶する手段と、音源波形の
    ケプストラムをあらかじめ記憶したテーブルと、二次の
    極回路と一次の零回路からなるフィルタを基本フィルタ
    とし、音声の生成モデルの極回路の数の基本フィルタを
    並列接続して構成する第一のフィルタと、生成モデルの
    零回路の数の基本フィルタを並列接続して構成する第二
    のフィルタと、前記第一のフィルタの出力と前記第二の
    フィルタの出力との差に係数を乗じた値を出力とする分
    析フィルタと、前記分析フィルタのインパルス応答と入
    力音声のケプストラムとの差の二乗和をあらかじめ定め
    られたサンプル数だけ算出する手段と、生成モデルの極
    パラメータ値を基本フィルタの極零パラメータ値に変換
    し、零パラメータ値を前記基本フィルタの極零パラメー
    タ値に変換する極零パラメータ変換テーブルを有し、フ
    ォーカシング制御を行なって前記極零パラメータ変換テ
    ーブルから前記ケプストラムの差の二乗和が最小になる
    極零パラメータの値と最適な音源ケプストラムテーブル
    の値を抽出する手段とから構成されることを特徴とする
    極零分析装置。
JP62057330A 1987-03-11 1987-03-11 極零分析装置 Expired - Lifetime JPH0670752B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP62057330A JPH0670752B2 (ja) 1987-03-11 1987-03-11 極零分析装置
US07/167,275 US4899386A (en) 1987-03-11 1988-03-11 Device for deciding pole-zero parameters approximating spectrum of an input signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62057330A JPH0670752B2 (ja) 1987-03-11 1987-03-11 極零分析装置

Publications (2)

Publication Number Publication Date
JPS63221398A JPS63221398A (ja) 1988-09-14
JPH0670752B2 true JPH0670752B2 (ja) 1994-09-07

Family

ID=13052561

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62057330A Expired - Lifetime JPH0670752B2 (ja) 1987-03-11 1987-03-11 極零分析装置

Country Status (1)

Country Link
JP (1) JPH0670752B2 (ja)

Also Published As

Publication number Publication date
JPS63221398A (ja) 1988-09-14

Similar Documents

Publication Publication Date Title
JP5275612B2 (ja) 周期信号処理方法、周期信号変換方法および周期信号処理装置ならびに周期信号の分析方法
Watanabe Formant estimation method using inverse-filter control
Wong et al. Least squares glottal inverse filtering from the acoustic speech waveform
Kawahara et al. Tandem-STRAIGHT: A temporally stable power spectral representation for periodic signals and applications to interference-free spectrum, F0, and aperiodicity estimation
Kopec et al. Speech analysis homomorphic prediction
US8412526B2 (en) Restoration of high-order Mel frequency cepstral coefficients
JP5908472B2 (ja) 信号を解析し、瞬時周波数および短時間フーリエ変換を提供するための方法、ならびに信号を解析するためのデバイス
JPH02239293A (ja) 音声処理方法
JPS60194499A (ja) 音声分析方式
CN109473091A (zh) 一种语音样本生成方法及装置
JPH0225518B2 (ja)
JPH0754440B2 (ja) 音声分析合成装置
CA1164569A (en) System for extraction of pole/zero parameter values
US20040199381A1 (en) Restoration of high-order Mel Frequency Cepstral Coefficients
JPH0670752B2 (ja) 極零分析装置
JPH0670753B2 (ja) 極零分析装置
JPH0777979A (ja) 音声制御音響変調装置
JPH0670754B2 (ja) 極零分析装置
JP3472046B2 (ja) 信号分離装置
US4845754A (en) Pole-zero analyzer
JPH0235992B2 (ja)
US4899386A (en) Device for deciding pole-zero parameters approximating spectrum of an input signal
JPH0644197B2 (ja) 極零分析装置
JPH0644198B2 (ja) 極零分析装置
JPH06202695A (ja) 音声信号処理装置