JPS6197700A - 音声分析方式 - Google Patents
音声分析方式Info
- Publication number
- JPS6197700A JPS6197700A JP59218928A JP21892884A JPS6197700A JP S6197700 A JPS6197700 A JP S6197700A JP 59218928 A JP59218928 A JP 59218928A JP 21892884 A JP21892884 A JP 21892884A JP S6197700 A JPS6197700 A JP S6197700A
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- formant
- frequency
- circuit
- line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Selective Calling Equipment (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は音声生成フィルぞの係数を実際の音声のスペク
トル包絡を最適近似するフィルタ係数として抽出する音
声分析方式に係り、音声生成フィルタとして2次フィル
タの縦続接続構成を仮定し、各2次フィルタの係数を抽
出する音声分析方式に関する。
トル包絡を最適近似するフィルタ係数として抽出する音
声分析方式に係り、音声生成フィルタとして2次フィル
タの縦続接続構成を仮定し、各2次フィルタの係数を抽
出する音声分析方式に関する。
現在、音声認識は限定車W!認識を中心に実用化されて
いる。これをさらに大語い認識へと発展させ、利用分野
を広けて行く喪めKは認識単位は単語から音節あるいは
音韻等の小さな単位とする必要がある。認識単位を音韻
としたとき、音韻の特徴はそのスペクトル包絡にもっと
もよく反映されていることから、スペクトル包絡の特徴
を表すホルマント、零点は特に重要なパラメータである
。
いる。これをさらに大語い認識へと発展させ、利用分野
を広けて行く喪めKは認識単位は単語から音節あるいは
音韻等の小さな単位とする必要がある。認識単位を音韻
としたとき、音韻の特徴はそのスペクトル包絡にもっと
もよく反映されていることから、スペクトル包絡の特徴
を表すホルマント、零点は特に重要なパラメータである
。
1つの音韻は通常、複数個のホルマント、零点をもち、
その各々のホルマント、零点は1個の2次フィルタに対
応する。したがって、ホルマント又は零点は2次フィル
タの係数で記述することができ、ホルマント又は零点を
与える伝達関数は2次フィルタの縦続接続で仮定できる
。
その各々のホルマント、零点は1個の2次フィルタに対
応する。したがって、ホルマント又は零点は2次フィル
タの係数で記述することができ、ホルマント又は零点を
与える伝達関数は2次フィルタの縦続接続で仮定できる
。
ホルマントは音声のスペクトル包絡上の特異点の1つで
あり、伝達関数の極に対応する。極は1つの2次フィル
タで与えることができ、したがって、ホルマントは2次
フィルタの係数で表すことができる。2次フィルタの係
数は周波数特性上の中心周波数および減衰特性(帯域幅
)を与え、それらはホルマント周波数、ホルマント帯域
幅に対応する。本抽出法において、ホルマント周波数は
スペクトル包絡の極大点の周波数として抽出され、ホル
マント帯域幅はホルマント周波数近傍の音声(#)スペ
クトルを最適に近似する2似フイルタの帯域幅(インパ
ルス応答の減衰率)として抽出さまた。音声は通常、複
数個のホルマントをもち、音声のスペクトル包絡を与え
る音声生成フィルタはホルマン)K対応する複数個の2
次フィルタに分解して表すことができる。
あり、伝達関数の極に対応する。極は1つの2次フィル
タで与えることができ、したがって、ホルマントは2次
フィルタの係数で表すことができる。2次フィルタの係
数は周波数特性上の中心周波数および減衰特性(帯域幅
)を与え、それらはホルマント周波数、ホルマント帯域
幅に対応する。本抽出法において、ホルマント周波数は
スペクトル包絡の極大点の周波数として抽出され、ホル
マント帯域幅はホルマント周波数近傍の音声(#)スペ
クトルを最適に近似する2似フイルタの帯域幅(インパ
ルス応答の減衰率)として抽出さまた。音声は通常、複
数個のホルマントをもち、音声のスペクトル包絡を与え
る音声生成フィルタはホルマン)K対応する複数個の2
次フィルタに分解して表すことができる。
まず、パワースペクトル包絡の計算法の1例について説
明する。
明する。
音声のパワースペクトルの計算に無限長の区間を積分区
間として用いることはできない。有限な区間についてパ
ワースペクトルを計算するならば、得られるパワースペ
クトルは必然的に線スペクトルとなる。この積分区間の
長さに有声音ではピッチTP、無声音では任意の区間長
Tpを選ぶ。このとき、自己相関関数R(lT)のフ−
リュ変換はωp(2π/Tp )間隔のパワー線スペク
トルとなる。
間として用いることはできない。有限な区間についてパ
ワースペクトルを計算するならば、得られるパワースペ
クトルは必然的に線スペクトルとなる。この積分区間の
長さに有声音ではピッチTP、無声音では任意の区間長
Tpを選ぶ。このとき、自己相関関数R(lT)のフ−
リュ変換はωp(2π/Tp )間隔のパワー線スペク
トルとなる。
標本化周期Tにおいて、パワー線スペクトル5(kFp
)はω、=2πFp k=0.1,2.・・・、(N−1) (1)’で与え
られる。ただし、 N=To/ T (2
)’である。また、パワースペクトル包絡は矩形慾関数
のフーリエ変換F (f)とのたたみ込み積分として与
えられ。
)はω、=2πFp k=0.1,2.・・・、(N−1) (1)’で与え
られる。ただし、 N=To/ T (2
)’である。また、パワースペクトル包絡は矩形慾関数
のフーリエ変換F (f)とのたたみ込み積分として与
えられ。
S (f)=Σ5(kFp)F(ω−kF’p)
(3)’に−l と表わされる。即ちS (f))を補間することKより
てパワースペクトル包絡が求まる。
(3)’に−l と表わされる。即ちS (f))を補間することKより
てパワースペクトル包絡が求まる。
そして式(3)′を全帯域にわたって、必要な精度の間
隔で計算し、その最大値を与える周波数をピーク点とし
ている。
隔で計算し、その最大値を与える周波数をピーク点とし
ている。
一例として、第4図に図示するようなピッチ周XI]5
ミlJ秒を有し、200ヘルツおよびその高調波に対し
てそれぞれパワースペクトルP1乃至PlOを有する擬
似音声波形にハミング窓関数を採用し、積分区間T8を
32きり秒に設定してフーリエ変換を行うと、16ミリ
秒を周期とする周波数およびその高調波に対するパワー
スペクトルP1ゝ乃至P32 ′が出力端子13から出
力される。
ミlJ秒を有し、200ヘルツおよびその高調波に対し
てそれぞれパワースペクトルP1乃至PlOを有する擬
似音声波形にハミング窓関数を採用し、積分区間T8を
32きり秒に設定してフーリエ変換を行うと、16ミリ
秒を周期とする周波数およびその高調波に対するパワー
スペクトルP1ゝ乃至P32 ′が出力端子13から出
力される。
所望のパワースペクトル包絡は、得られたパワースペク
トルP11乃至P32 ′から推定する。
トルP11乃至P32 ′から推定する。
ポル1ントはそのスペクトル包絡のピークとして求めら
れ、零点は高域周波数帯あるいは低域周波数帯における
線スペクトルから、基準線スペクトルを例えば最高周波
数の線スペクトルと定め、この基準線スペクトルより小
さい線スペクトルの近傍のスペクトル包絡の最小点とし
て求められる0ホルマントあるいは零点周波数が決まる
と、この近傍のスペクトルを近似する2次フィルタの減
衰率を何んらかの方法で定めればよい。
れ、零点は高域周波数帯あるいは低域周波数帯における
線スペクトルから、基準線スペクトルを例えば最高周波
数の線スペクトルと定め、この基準線スペクトルより小
さい線スペクトルの近傍のスペクトル包絡の最小点とし
て求められる0ホルマントあるいは零点周波数が決まる
と、この近傍のスペクトルを近似する2次フィルタの減
衰率を何んらかの方法で定めればよい。
その方法の例として
■ 小さな減衰率を固定的に与え、広帯域の2次フィル
タを1つのホルマントあるいは零点に繰返し適用するこ
とによりて、ホルマントあるいは零点を複数個の2次フ
ィルタで表わす。
タを1つのホルマントあるいは零点に繰返し適用するこ
とによりて、ホルマントあるいは零点を複数個の2次フ
ィルタで表わす。
■ ホルマントあるいは零点付近の線スペクトルだけ(
零点の場合は零点検出用基準線スペクトルを含む)を近
似するように減衰率を求めるものがある〇 即ち■の方法は、音声生成フィルタを2次フィルタの縦
続接続と仮定し、スペクトル包絡の最適近似により各フ
ィルタの係数を抽出する6tず。
零点の場合は零点検出用基準線スペクトルを含む)を近
似するように減衰率を求めるものがある〇 即ち■の方法は、音声生成フィルタを2次フィルタの縦
続接続と仮定し、スペクトル包絡の最適近似により各フ
ィルタの係数を抽出する6tず。
2次フィルタを
A:利得 JLlsbi:減衰率
と仮定する。このフィルタの与えるスペクトル包絡と実
際の音声のスペクトル包絡との誤差が全帯域について鍛
小となるように係数を決めるのである。これは、音声の
全帯域について誤差が最小になるという点において最適
である。
際の音声のスペクトル包絡との誤差が全帯域について鍛
小となるように係数を決めるのである。これは、音声の
全帯域について誤差が最小になるという点において最適
である。
以上の説明から明らかな如く、従、来あるパワースペク
トル包絡抽出方式においては、積分区間Tskより定ま
る周波数およびその高調波におけるパワースペクトルか
ら推定するものであり、分析対象となる音声波形が本来
有するパワースペクトル包絡を必ずしも近似していない
。なお、積分区間Ts ’tt延長することkより分析
精度を向上することも可能であるが、音−波形が本来有
するパワースペクトル以外に多数のパワースペクトルを
不必要に算出することとなる◎また通常の音声波形は刻
々変化し、同一の音声波形が継続する期間は精々数十i
17秒程度と称されている。従りて積分区間Taとし
ては30ξり程度度以上延長することは困難であり、得
られる分析精度にも限界がある0また、式(3)の帯域
をFllzとしたとき、ピーク点の検出精度がfbなら
は、F/f個の点について式(3)を計算する必要が生
じる。たとえば、帯域を4 kHz %精度を1liz
とすると、4000点もの多くの標本点について計算が
必要となる0精度を上げるためにはさらに多くの標本点
について計算しなけれにならない。
トル包絡抽出方式においては、積分区間Tskより定ま
る周波数およびその高調波におけるパワースペクトルか
ら推定するものであり、分析対象となる音声波形が本来
有するパワースペクトル包絡を必ずしも近似していない
。なお、積分区間Ts ’tt延長することkより分析
精度を向上することも可能であるが、音−波形が本来有
するパワースペクトル以外に多数のパワースペクトルを
不必要に算出することとなる◎また通常の音声波形は刻
々変化し、同一の音声波形が継続する期間は精々数十i
17秒程度と称されている。従りて積分区間Taとし
ては30ξり程度度以上延長することは困難であり、得
られる分析精度にも限界がある0また、式(3)の帯域
をFllzとしたとき、ピーク点の検出精度がfbなら
は、F/f個の点について式(3)を計算する必要が生
じる。たとえば、帯域を4 kHz %精度を1liz
とすると、4000点もの多くの標本点について計算が
必要となる0精度を上げるためにはさらに多くの標本点
について計算しなけれにならない。
また、第(5)弐における誤差をできるだけ小さくする
ためにはフィルタF(6)の次数を実際の音声がもつと
予想される次数よりも大きくする必要があり、このとき
、F(6)の各2次フィルタが与えるホルマント中零点
はgA際のそれと異なったものとなり、各2次フィルタ
の係数のもつ物理的な意味が不明確になるという欠点が
ある0また、スペクトル包絡の近似が全帯域にわたりて
平均的に行われるため、音声のスペクトル上の重要な特
徴であるホルマントや零点近辺の近似に限定した場合、
必ずしも最適な近似になっていない場合もある。
ためにはフィルタF(6)の次数を実際の音声がもつと
予想される次数よりも大きくする必要があり、このとき
、F(6)の各2次フィルタが与えるホルマント中零点
はgA際のそれと異なったものとなり、各2次フィルタ
の係数のもつ物理的な意味が不明確になるという欠点が
ある0また、スペクトル包絡の近似が全帯域にわたりて
平均的に行われるため、音声のスペクトル上の重要な特
徴であるホルマントや零点近辺の近似に限定した場合、
必ずしも最適な近似になっていない場合もある。
さらに、上記■についてはもちろん、1つのホルマント
あるいは零点について複数個の2次フィルタが対応して
いる。■についても、ホルマントあるいは零点が複数個
あれば、スペクトルはそれらを与える2次フィルタの周
波数特性を総合したものであるから、1つのホルマント
あるいは零点は他のホルマントや零点の影響を受け、中
心周波数や減衰率は誤差をもってしか抽出されていない
。
あるいは零点について複数個の2次フィルタが対応して
いる。■についても、ホルマントあるいは零点が複数個
あれば、スペクトルはそれらを与える2次フィルタの周
波数特性を総合したものであるから、1つのホルマント
あるいは零点は他のホルマントや零点の影響を受け、中
心周波数や減衰率は誤差をもってしか抽出されていない
。
そのため、ホルマントあるいは零点を検出し、逆周波数
特性を乗じてもホルマントあるいは零点は完全に取除か
れることはない。この除去残は他のホルマントあるいは
零点の抽出を行っているうj ち
、再びホルマントあるいは零点として検出されることも
起る0すなわち、同一のホルマントあるいは零点を複数
個の2次フィルタで表わすことになる。 − これは音声の特徴はできるだけ少ないパラメータで表わ
すことが望ましく、1つのホルマントあるいは零点を複
数個の2次フィルタで表わすことを利用の面において不
利となる。
特性を乗じてもホルマントあるいは零点は完全に取除か
れることはない。この除去残は他のホルマントあるいは
零点の抽出を行っているうj ち
、再びホルマントあるいは零点として検出されることも
起る0すなわち、同一のホルマントあるいは零点を複数
個の2次フィルタで表わすことになる。 − これは音声の特徴はできるだけ少ないパラメータで表わ
すことが望ましく、1つのホルマントあるいは零点を複
数個の2次フィルタで表わすことを利用の面において不
利となる。
本発明は上記問題点を解決することを目的としており、
そのため互いに肢立な線スペクトルを補間し、スペクト
ル包絡を算出する第1の手段と。
そのため互いに肢立な線スペクトルを補間し、スペクト
ル包絡を算出する第1の手段と。
ホルマ/)Kありてはスペクトル包絡のピーク、零点に
あっては該線スペクトルから定めた基準線スペクトルよ
り小さい線スペクトル近傍のスペクトル包絡の最小値を
検出する第2の手段と、該第1の手段で検出したピーク
近傍の該線スペクトルあるいは最小値近傍の該線スペク
トルと基準線スペクトルを近似する2次フィルタの係数
を抽出する第3の手段と、該第3の手段で得られた2次
フィルタの逆周波数特性を該腺スペクトルに乗じ、新ら
九な線スペクトルを算出する第4の手段とを有し、有声
音にあってはピッチあるいはその整数倍無声音にちって
はあらかじめ定めた時間長をフーリエ交換の積分区間と
して求めた互いに独立な線スペクトルを用いて、前記第
1.2.3.4 の手段における演算を繰返すことによ
抄、2次フィルタの係数抽出を行い、音声生成フィルタ
を2次フィルタの縦続接続として分析するものである。
あっては該線スペクトルから定めた基準線スペクトルよ
り小さい線スペクトル近傍のスペクトル包絡の最小値を
検出する第2の手段と、該第1の手段で検出したピーク
近傍の該線スペクトルあるいは最小値近傍の該線スペク
トルと基準線スペクトルを近似する2次フィルタの係数
を抽出する第3の手段と、該第3の手段で得られた2次
フィルタの逆周波数特性を該腺スペクトルに乗じ、新ら
九な線スペクトルを算出する第4の手段とを有し、有声
音にあってはピッチあるいはその整数倍無声音にちって
はあらかじめ定めた時間長をフーリエ交換の積分区間と
して求めた互いに独立な線スペクトルを用いて、前記第
1.2.3.4 の手段における演算を繰返すことによ
抄、2次フィルタの係数抽出を行い、音声生成フィルタ
を2次フィルタの縦続接続として分析するものである。
本発明の音声分析方式におけるホルマント、零点の自動
抽出法の1つとして、音声の自己相関関数のピッチ同期
分析から求めた音声(線)スペクトルを補間して得たス
ペクトル包絡の極大点の近傍だけを最適近似する2次フ
ィルタの逐次抽出によりて、ホルマント、零点を自動抽
出する「スペクトルの局所近似によるホルマント及び零
点抽出法−について検討する。
抽出法の1つとして、音声の自己相関関数のピッチ同期
分析から求めた音声(線)スペクトルを補間して得たス
ペクトル包絡の極大点の近傍だけを最適近似する2次フ
ィルタの逐次抽出によりて、ホルマント、零点を自動抽
出する「スペクトルの局所近似によるホルマント及び零
点抽出法−について検討する。
とのホルマント及び零点抽出法は以下の特徴をもつ。
(1) 音声(線)スペクトルは自己相関関数のピッ
チ同期分析から求められること。
チ同期分析から求められること。
(2)ホルマント周波数は得られた音声スペクトルを周
波数軸上で補間して得たスペクトル包絡の極大点から抽
出されること。
波数軸上で補間して得たスペクトル包絡の極大点から抽
出されること。
(3) ホルマント、零点帯域幅はホルマント、零点
周波数近傍の音声スペクトルを局所的に近似する2次フ
ィルタの係数を未知数とする3次方程式から求められる
こと。
周波数近傍の音声スペクトルを局所的に近似する2次フ
ィルタの係数を未知数とする3次方程式から求められる
こと。
(4) 平均ホルマント帯域幅の計算KM数平均法を
用いること。
用いること。
(5)ホルマント帯式
ィルタの縦続接続として逐次的に抽出されること。
(6) 音声に混入した外来白色付加雑音はスペクト
ル計算の際KjI!!り隙かれること。
ル計算の際KjI!!り隙かれること。
(7) ホルマント遷移に関す本情報が得られること
。
。
また、この抽出法はつぎに示す3つの部分(l) ホ
ルマント周波数(スペクトル包絡)の抽出。
ルマント周波数(スペクトル包絡)の抽出。
(2)ホルマント帯域11(減衰率)の抽出。
(3) ホルマント遷移情報の抽出。
から構成される。以下%拳を追って説明する。
音声生成過程は通常、第2図のようなモデルで表される
。このとき、音声波形は音源1と音声生成フィルタ2の
インパルス応答とのたたみ込み積分で与えられる。音源
1は有声音と無声音で異なり、有声音ではピッチTpを
周期とするインパルス列、無声音では白色雑音と仮定さ
れる。したがって、音源1のスペクトルは有声音では一
様な振幅の周波数間隔Fp (1/Tp)の線スペクト
ル、無声音では一様な振幅の連続スペクトルで表される
。
。このとき、音声波形は音源1と音声生成フィルタ2の
インパルス応答とのたたみ込み積分で与えられる。音源
1は有声音と無声音で異なり、有声音ではピッチTpを
周期とするインパルス列、無声音では白色雑音と仮定さ
れる。したがって、音源1のスペクトルは有声音では一
様な振幅の周波数間隔Fp (1/Tp)の線スペクト
ル、無声音では一様な振幅の連続スペクトルで表される
。
時間領域におけるたたみ込み積分は周波数領域では単な
る積に置き換えることができる。したがって、有声音の
場合、そのスペクトルは音声生成フィルタ2のスペクト
ル包絡の周波数間隔Fpの標本胆、すなわち線スペクト
ルとなる。無声音の場合はそのスペクトルは音声生成フ
ィルタのスペクトル包絡そのものであり、連続スペクト
ルとなる。ところが、無声音においても有限な区間に区
切って計算するならば、得られるスペクトルは有声音と
同様、#J!スペクトルと考えることができる。
る積に置き換えることができる。したがって、有声音の
場合、そのスペクトルは音声生成フィルタ2のスペクト
ル包絡の周波数間隔Fpの標本胆、すなわち線スペクト
ルとなる。無声音の場合はそのスペクトルは音声生成フ
ィルタのスペクトル包絡そのものであり、連続スペクト
ルとなる。ところが、無声音においても有限な区間に区
切って計算するならば、得られるスペクトルは有声音と
同様、#J!スペクトルと考えることができる。
結局、音声のスペクトルは有声音、無声音の別なくすべ
て線スペクトルとして統一的に取り扱うことができる。
て線スペクトルとして統一的に取り扱うことができる。
本発明では、音声生成フィルタの構成として2次フィル
タの縦続接続を仮定し1、それらを逐次的に抽出する方
法をとる。第3図に本発明におけ右ホルiント抽出法の
フローを示す。なを零点忙ついても同様である。
タの縦続接続を仮定し1、それらを逐次的に抽出する方
法をとる。第3図に本発明におけ右ホルiント抽出法の
フローを示す。なを零点忙ついても同様である。
本抽出法では音声生成フィルタのスペクトル包絡の極大
点からホルマント周波数を抽出する。ところが、音声の
スペクトルは□有声音、無声音とも、一定周波数間隔の
独立な線スペクトルとしてしか求められない。したがっ
て、線スペクトルである音声スペクトルからホルマント
周波数を抽出するならば、その抽出精度はこの線スペク
トル間隔以上に高くとることはできない。また、特に有
声音の場合、この間隔はピッチTpの関数(周波数間隔
Fp = 1 /Tp)となり、同じ音韻であってもホ
ルマント周波数はピッチによって変動し、異なる値をと
るという問題が生じる。
点からホルマント周波数を抽出する。ところが、音声の
スペクトルは□有声音、無声音とも、一定周波数間隔の
独立な線スペクトルとしてしか求められない。したがっ
て、線スペクトルである音声スペクトルからホルマント
周波数を抽出するならば、その抽出精度はこの線スペク
トル間隔以上に高くとることはできない。また、特に有
声音の場合、この間隔はピッチTpの関数(周波数間隔
Fp = 1 /Tp)となり、同じ音韻であってもホ
ルマント周波数はピッチによって変動し、異なる値をと
るという問題が生じる。
ところが、得られた音声のスペクトルは音声生成フィル
タのスペクトル包絡の一定間隔の標本値と壜っており、
補間によってもとのスペクトル包絡を再生することは可
能である。
タのスペクトル包絡の一定間隔の標本値と壜っており、
補間によってもとのスペクトル包絡を再生することは可
能である。
したがって、ホルマント周波数をこの再生スペクトル包
絡から抽出するならば、上記問題は解決される。以下、
音声(線)スペクトルの抽出法とその補間法について説
明する。
絡から抽出するならば、上記問題は解決される。以下、
音声(線)スペクトルの抽出法とその補間法について説
明する。
音声スペクトルの抽出法には様々な方法がある。
そのうち、もっとも簡単な方法は7−y工変換法であろ
う。これにはまず、積分区間の設定が必要である。無声
音の場合、そのスペクトルは連続スペクトルであること
から、フーリエ変換における積分区間は抽出精度に合わ
せて任意に設定することができる。そして、その精度は
積分区間長に比例して向上する。
う。これにはまず、積分区間の設定が必要である。無声
音の場合、そのスペクトルは連続スペクトルであること
から、フーリエ変換における積分区間は抽出精度に合わ
せて任意に設定することができる。そして、その精度は
積分区間長に比例して向上する。
有声音では、積分区間が有限であっても積分区間の設定
の仕方によってスペクトルの抽出誤差を0とすることが
できる。
の仕方によってスペクトルの抽出誤差を0とすることが
できる。
す橙わち、ピッチ同期分析である。ピッチ同期分析の原
理は周期関数のフーリ゛工級数展開にある。
理は周期関数のフーリ゛工級数展開にある。
有声音はピッチを周期とする周期関数であり、したがっ
て、有声音は7一リエ級数展開によって、ピッチTpの
逆数Fpを基本周波数とする高調波成分5(kFp)に
−展開することができる(ただし、k= −ao 、・
・・、−1,0,1,2,・、oa )。
て、有声音は7一リエ級数展開によって、ピッチTpの
逆数Fpを基本周波数とする高調波成分5(kFp)に
−展開することができる(ただし、k= −ao 、・
・・、−1,0,1,2,・、oa )。
すなわち、有声音のスペクトルは線スペクトルとして与
えられ、そのスペクトル5(kFp)は音声生成フィル
タのスペクトル包絡の標本値に一致する0このとき、各
高調波成分5(kFp)、すなわちフ−リュ係数は積分
区間をピッチに等しく選んだフ−リュ変換から正確に求
めることができる。反面、音声波形の1ピッチ分の自動
的な切出しが難しいという問題が発生する。
えられ、そのスペクトル5(kFp)は音声生成フィル
タのスペクトル包絡の標本値に一致する0このとき、各
高調波成分5(kFp)、すなわちフ−リュ係数は積分
区間をピッチに等しく選んだフ−リュ変換から正確に求
めることができる。反面、音声波形の1ピッチ分の自動
的な切出しが難しいという問題が発生する。
そこで、ピッチ検出に使用した音声の自己相関関数をピ
ッチ同期分析に用いることを考える。ピッチを特定でき
た自己相関関数から1ピッチ分を切出すことは簡単であ
る。その場合、音声の固定位相情報は失われることにな
るが、失った情報は音韻認識にとって重要ではない。逆
に、7F−ルマ/トの遷移に関する情報が得られるとい
う利点を得ることかできる(詳細は後述)。
ッチ同期分析に用いることを考える。ピッチを特定でき
た自己相関関数から1ピッチ分を切出すことは簡単であ
る。その場合、音声の固定位相情報は失われることにな
るが、失った情報は音韻認識にとって重要ではない。逆
に、7F−ルマ/トの遷移に関する情報が得られるとい
う利点を得ることかできる(詳細は後述)。
ピッチ同期分析によれば、標本化周期をTとするとき、
音声スペクトル5(kFP)は自己相関関数R(iT)
の1ピッチ分を積分区間(l=θ〜N−1)とするフー
リエ余弦変換 S (kFp)= X fL (iT) COs (k
ωp iT ) (1)N=Tp/T 、ωp
=2πFp から求められる(無声音□の場合にはα−ミンク窓等の
適当な窓関数を使用してもよい)。
音声スペクトル5(kFP)は自己相関関数R(iT)
の1ピッチ分を積分区間(l=θ〜N−1)とするフー
リエ余弦変換 S (kFp)= X fL (iT) COs (k
ωp iT ) (1)N=Tp/T 、ωp
=2πFp から求められる(無声音□の場合にはα−ミンク窓等の
適当な窓関数を使用してもよい)。
ここで、白色付加雑音が音声に混入した場合について考
える。ピッチTpを周期とする周期関数においては が成り立つ。したがって、上記式(1)の積分区間をi
−1−Nとおいても同じ結果を得ることができる。さ
らに、白色雑音は相関をもたず、その自己相関関数はR
(0)においてkけ電力に等しい値をもち、他は0とな
る。ここで、積分区間を1=1〜N2おけイ、混い1え
白色雑音は取りよう、れ、音声のスペクトルだけが得ら
れる。以下、積分区間を1=1=−Nとおいて計算する
。
える。ピッチTpを周期とする周期関数においては が成り立つ。したがって、上記式(1)の積分区間をi
−1−Nとおいても同じ結果を得ることができる。さ
らに、白色雑音は相関をもたず、その自己相関関数はR
(0)においてkけ電力に等しい値をもち、他は0とな
る。ここで、積分区間を1=1〜N2おけイ、混い1え
白色雑音は取りよう、れ、音声のスペクトルだけが得ら
れる。以下、積分区間を1=1=−Nとおいて計算する
。
一方、標本化周期をTとする波形の離散的処理では高調
波周波数に上限が生じる。上限は標本化周波数F(=1
/T)の1/2で決まる。上限を幻)とおけば、にの上
限には に≦F/ 2 Fp =Tp / 2 T=N/ 2
(3)と求められる。丁度、Nの半分であ
る。このとき。
波周波数に上限が生じる。上限は標本化周波数F(=1
/T)の1/2で決まる。上限を幻)とおけば、にの上
限には に≦F/ 2 Fp =Tp / 2 T=N/ 2
(3)と求められる。丁度、Nの半分であ
る。このとき。
kは
に=−に、・・・・、−1,0,1,・・・・、K
(4)の範囲の値をとる。
(4)の範囲の値をとる。
さらに、標本化周波数Fで標本化した波形のスペクトル
は標本化周波数Fを周期とする周波数領域周期関数とな
るため、その一周期分の周波数帯域(−F/2 、 F
/2 )は同じ一周期分の帯域〔0゜F〕との鍵き換え
が可能である。また、周波数Fは直流と等価であるから
、結局、kの範囲はに=o、1.・・・・、N−1(5
) とおくことができる。直流の計算処理上、この方が使い
やすい。このとき、自己相関関数R(iT)は次式で表
される。
は標本化周波数Fを周期とする周波数領域周期関数とな
るため、その一周期分の周波数帯域(−F/2 、 F
/2 )は同じ一周期分の帯域〔0゜F〕との鍵き換え
が可能である。また、周波数Fは直流と等価であるから
、結局、kの範囲はに=o、1.・・・・、N−1(5
) とおくことができる。直流の計算処理上、この方が使い
やすい。このとき、自己相関関数R(iT)は次式で表
される。
さて、自己相関関数は理論上、式(6)に示されるよう
な余弦波成分だけからなる関数として表される。そして
、1/2ピッチ点において対称であり、正弦波成分が含
まれることはない。しかしながら、実際の音声(連続発
声音声)について自己相関関数を求め°た場合には、1
/2ピッチ点において非対称となり、正弦波成分が発生
することが多い。
な余弦波成分だけからなる関数として表される。そして
、1/2ピッチ点において対称であり、正弦波成分が含
まれることはない。しかしながら、実際の音声(連続発
声音声)について自己相関関数を求め°た場合には、1
/2ピッチ点において非対称となり、正弦波成分が発生
することが多い。
図5は図4に示す実際の連続発声音声(有声音)から計
算した自己相関関数である(F=8kHz)。
算した自己相関関数である(F=8kHz)。
図中の破線はピッチ点を表し、1/2ピッチ点において
非対称となっていることがわかる。
非対称となっていることがわかる。
この非対称の原因は、音韻の変化にともなうホルマント
遷移によりて引き起される音声の周波数変調(位相変調
)で説明することができる。ピッチ同期分析において音
声波形を直接用いえ場合には、このホルマント遷移に関
する情報を導出することは難しい。この遷移情報の抽出
はピッチ同期分析に自己相関関数を用いたために得られ
た利点の1りである。
遷移によりて引き起される音声の周波数変調(位相変調
)で説明することができる。ピッチ同期分析において音
声波形を直接用いえ場合には、このホルマント遷移に関
する情報を導出することは難しい。この遷移情報の抽出
はピッチ同期分析に自己相関関数を用いたために得られ
た利点の1りである。
このとき、音声スペクトル5(kFp)は自己相関関数
の余弦波成分Re(iT)のフーリエ変換5c(kFp
)と正弦波成分Ra(iT)のフーリエ変換Ss(kF
p )とから S (kFp) = v’sc”(kFp)+8g”
(kFP) (7)am(kFP)=ΣR(i
T) sia (ka+p iT )1・嵐 と計算される0フ−リュ変換の性質から、これらは互い
に直交し、独立である。
の余弦波成分Re(iT)のフーリエ変換5c(kFp
)と正弦波成分Ra(iT)のフーリエ変換Ss(kF
p )とから S (kFp) = v’sc”(kFp)+8g”
(kFP) (7)am(kFP)=ΣR(i
T) sia (ka+p iT )1・嵐 と計算される0フ−リュ変換の性質から、これらは互い
に直交し、独立である。
第6図は第5図に示す自己相関関数から式(7)、(8
)を用いて計算した音声(#)スペクトルである。
)を用いて計算した音声(#)スペクトルである。
(ただし、電力で正規化した値で示している)こζで得
られた図に示すスペクトルからホルマントは(2Fp)
、(19FP)付近にあると推定することができる。本
抽出法によれば、(4FP)付近にも1つのホルマント
があることが示されるが、この図だけからではこのホル
マントの存在は明確ではない。すなわち、得られた線ス
ペクトルからホルマントを抽出する場合には、先にあげ
た問題点(2)度、ピッチによる変動)の#1かK、近
接したホルマントの分離が難しいという問題も起こる0
ホルマント抽出のためには音声生成フィルタのもクスペ
クトル包絡の抽出が必要である。
られた図に示すスペクトルからホルマントは(2Fp)
、(19FP)付近にあると推定することができる。本
抽出法によれば、(4FP)付近にも1つのホルマント
があることが示されるが、この図だけからではこのホル
マントの存在は明確ではない。すなわち、得られた線ス
ペクトルからホルマントを抽出する場合には、先にあげ
た問題点(2)度、ピッチによる変動)の#1かK、近
接したホルマントの分離が難しいという問題も起こる0
ホルマント抽出のためには音声生成フィルタのもクスペ
クトル包絡の抽出が必要である。
標本化周期Tで標本化された波形のスペクトルは標本化
周波数F(1/T)を周期とする周波数領域周期関数と
なる。
周波数F(1/T)を周期とする周波数領域周期関数と
なる。
S (f)=S(f+p)
(10)このような周期関数は標本化周波数Fを一
周期(その間の位相変動が2π)とする基本振動とその
整数倍の振動(その間の位相変動は12πである。ただ
し%l =−oo、 ・・・・、−1,0,1,2,”
” 、” )の和に展開することができる。さらにその
振動は余弦波成分と正弦波成分、5c(f)と5s(f
)に分けて、つぎのように表すことができる。
(10)このような周期関数は標本化周波数Fを一
周期(その間の位相変動が2π)とする基本振動とその
整数倍の振動(その間の位相変動は12πである。ただ
し%l =−oo、 ・・・・、−1,0,1,2,”
” 、” )の和に展開することができる。さらにその
振動は余弦波成分と正弦波成分、5c(f)と5s(f
)に分けて、つぎのように表すことができる。
ω;2πf
Ai、Bi:振動の大きさ
一方、スペクトル包絡5(f)を周波数間隔Fpで標本
化し、その標本値5(kFp)からスペクトル包絡5(
f)を再生するとき、隣接標本間で±πを越える位相変
動を与える振動は再生されない。それは時間額域におい
て標本化周期Tで標本化したとき、その隣接標本間での
位相変動が±πとなる振動、すなわち士F/2以上の周
波数成分は再生されないのと同じことである0 生成されるスペクトルが線スペクトルである有声音では
、その発声時においてすでにこの上限以上のスペクトル
包絡の振動成分は失われている0発声によって与えられ
たスペクトル包絡の標本値から、すでに失われているこ
の上限以上のスペクトル包絡の振動成分を再生すること
は、いかなる方法をもってしても不可能なことである口
したがって、音声生成フィルタのスペクトル包絡にはこ
の上限振動以上の振動は存在しないか、音韻の認識には
不必要な成分であると考えられる。
化し、その標本値5(kFp)からスペクトル包絡5(
f)を再生するとき、隣接標本間で±πを越える位相変
動を与える振動は再生されない。それは時間額域におい
て標本化周期Tで標本化したとき、その隣接標本間での
位相変動が±πとなる振動、すなわち士F/2以上の周
波数成分は再生されないのと同じことである0 生成されるスペクトルが線スペクトルである有声音では
、その発声時においてすでにこの上限以上のスペクトル
包絡の振動成分は失われている0発声によって与えられ
たスペクトル包絡の標本値から、すでに失われているこ
の上限以上のスペクトル包絡の振動成分を再生すること
は、いかなる方法をもってしても不可能なことである口
したがって、音声生成フィルタのスペクトル包絡にはこ
の上限振動以上の振動は存在しないか、音韻の認識には
不必要な成分であると考えられる。
スペクトル包絡5(f)の再生可能な振動の上限は式(
11)の位相12πFp/Fの上限を±にとおいて 1≦±F / 2 F’p冨±Tp/2T=±K
(12)と求められるot7’h、スペクトル包絡
5(f)の周期性から一π〜πの位相変動は余弦波成分
、正弦波成分とも0〜2にの位相変動に置き換えること
ができる。そとで、位相変動の上限を2πとおいて1式
(12)と同様にして l≦F/Fp = ’rp / T =N
(13)と表すこともできる口したがって、式(
11)はと書き換えられる。ただし、1/F=Tとおい
た。
11)の位相12πFp/Fの上限を±にとおいて 1≦±F / 2 F’p冨±Tp/2T=±K
(12)と求められるot7’h、スペクトル包絡
5(f)の周期性から一π〜πの位相変動は余弦波成分
、正弦波成分とも0〜2にの位相変動に置き換えること
ができる。そとで、位相変動の上限を2πとおいて1式
(12)と同様にして l≦F/Fp = ’rp / T =N
(13)と表すこともできる口したがって、式(
11)はと書き換えられる。ただし、1/F=Tとおい
た。
上式(14)のf t kFPとおいた5c(kFp)
、 5s(kFp)はスペクトル包絡5(f)の標本値
、音声スペクトルに等しい0 これらは式(8)で与えられ の関係が成り立つ。すなわち、自己相関関数は周波数領
域におけるスペクトルの振動成分の大きさに等しい0こ
のとき、式(14)は式(15)を用いて次式のように
表される0 本抽出法ではホルマントは逐次的に抽出される。
、 5s(kFp)はスペクトル包絡5(f)の標本値
、音声スペクトルに等しい0 これらは式(8)で与えられ の関係が成り立つ。すなわち、自己相関関数は周波数領
域におけるスペクトルの振動成分の大きさに等しい0こ
のとき、式(14)は式(15)を用いて次式のように
表される0 本抽出法ではホルマントは逐次的に抽出される。
したがって、ホルマント周波数の抽出に使用するスペク
トル包絡はホルマント抽出のたびに再計算が必要となる
。この場合、線スペクトルS (kFp )の補間から
スペクトル包絡5(f)を求め、周波数領域内だけで処
理する方が簡単である。
トル包絡はホルマント抽出のたびに再計算が必要となる
。この場合、線スペクトルS (kFp )の補間から
スペクトル包絡5(f)を求め、周波数領域内だけで処
理する方が簡単である。
そこで、式(9)を式(16)に代入し、処理するとた
だし。
だし。
Fc(ff)cFP)=Σcos(a+±にωp)IT
トリ FS(ffkFp)=Σ5ii(ω±にωP)iT1轄
鳳 が得られる。また、音声は実関数であることから、が成
り立ち、式(17) 、 (18)はと整理される。
トリ FS(ffkFp)=Σ5ii(ω±にωP)iT1轄
鳳 が得られる。また、音声は実関数であることから、が成
り立ち、式(17) 、 (18)はと整理される。
さらに2式(22)の成分5c(kFp)Fc (f−
kFp)およびSs (kFP ) Fs (f−kF
p )は互いに直交し、独立である。したがって、スペ
クトル包絡5(f)は式(7)で与えられる線スペクト
ル5(kFp)とFc (f−1cFp)、Fs(f−
kFp)の自乗の和の平方根F(f−kFp)=4/F
c”(f−kFp)+Fs”(f−kFp) (z3
)すなわち、 とのたたみ込み積分で与えられ、スペクトル包絡S(f
)は 5(f)=ΣS (kFp) F (f−kFp)
(25)−O と求められる。これKよって、ホルマント周波数はスペ
クトル包絡5(f)の極大点から求めることが可能とな
り、音源のスペクトルが取り除かれる。
kFp)およびSs (kFP ) Fs (f−kF
p )は互いに直交し、独立である。したがって、スペ
クトル包絡5(f)は式(7)で与えられる線スペクト
ル5(kFp)とFc (f−1cFp)、Fs(f−
kFp)の自乗の和の平方根F(f−kFp)=4/F
c”(f−kFp)+Fs”(f−kFp) (z3
)すなわち、 とのたたみ込み積分で与えられ、スペクトル包絡S(f
)は 5(f)=ΣS (kFp) F (f−kFp)
(25)−O と求められる。これKよって、ホルマント周波数はスペ
クトル包絡5(f)の極大点から求めることが可能とな
り、音源のスペクトルが取り除かれる。
そして、精度およびピッチによるホルマント周波数の変
動の問題は解決される。
動の問題は解決される。
第7図に第5図の自己相関関数から求めたスペクトル包
絡の例を示す。図中のF、−F、はホルマントと推定さ
れる。
絡の例を示す。図中のF、−F、はホルマントと推定さ
れる。
次に、
第8図において、入力端子lに到着した音声波形は自己
相関関数生成回路2に伝達される。自己相関関数生成回
路2は、受信した音声波形の自己相関関数R(i)を公
知の方法により算出する。自己相関関数生成回路2は、
算定した自己相関関数R+i+をピッチ抽出回路3およ
び乗算器4に伝達する。
相関関数生成回路2に伝達される。自己相関関数生成回
路2は、受信した音声波形の自己相関関数R(i)を公
知の方法により算出する。自己相関関数生成回路2は、
算定した自己相関関数R+i+をピッチ抽出回路3およ
び乗算器4に伝達する。
な詔ピッチ抽出回路3へは音声波形を直接人力しても以
下同様である。有声音に対する自己相関関数R(ilは
、時間iTがピッチ周期に等しくなった場合に1に近い
値となり、夫以外の場合には1より充分小さい儂となる
性質を有する。ピッチ抽出回路3は、かかる自己相関関
数R(i)の性質を利用して自己相関関数生成回路2か
ら伝達される自己相関関数R(ilを予め定められた閾
値と比較し、所定時間以内に前記閾値より大きい自己相
関関数几(i)が検出された場合には有声音と判定し、
更に自己相関関数几(ilが1に近い値となる時間iT
を音声波形のピッチ周期と見做す。また前記閾値より大
きい自己相関関数R(ilが検出されぬ場合には無声音
と判定する。ピッチ抽出回路15は、有声音の場合には
検出されたピッチ周期T2無声音の場合には予め定めら
れた時間長、例えばT、に基づ@N=T、/TfeXめ
てパワースペクトル包絡生成回路5Iこ伝達すると共に
、係数2/Nを算定して乗算器4に伝達する。−万乗算
器4は、自己相関関数生成回j82から伝達された自己
相関関数R(ilに係数2/Nを乗することにより、補
正された自己相関関数R,、(ilを算出し、パワース
ペクトル包絡生成回路5に伝達する。パワースペクトル
包絡生成回路5は、乗算器4から伝達された補正された
自己相関関数R、(’1、並びにピッチ抽出回路13か
ら伝達された数Nに基づき(9)式および(7)式、
(24)式、(25)式の演算を行い、パワースペクト
ル包絡5fflを出力端子6に出力する。なおピッチ抽
出回路3の出力情報は、パワースペクトル包絡生成回路
5の積分器へ人力されると共に、余弦核発生回路および
正弦核発生回路へも入力処理される。
下同様である。有声音に対する自己相関関数R(ilは
、時間iTがピッチ周期に等しくなった場合に1に近い
値となり、夫以外の場合には1より充分小さい儂となる
性質を有する。ピッチ抽出回路3は、かかる自己相関関
数R(i)の性質を利用して自己相関関数生成回路2か
ら伝達される自己相関関数R(ilを予め定められた閾
値と比較し、所定時間以内に前記閾値より大きい自己相
関関数几(i)が検出された場合には有声音と判定し、
更に自己相関関数几(ilが1に近い値となる時間iT
を音声波形のピッチ周期と見做す。また前記閾値より大
きい自己相関関数R(ilが検出されぬ場合には無声音
と判定する。ピッチ抽出回路15は、有声音の場合には
検出されたピッチ周期T2無声音の場合には予め定めら
れた時間長、例えばT、に基づ@N=T、/TfeXめ
てパワースペクトル包絡生成回路5Iこ伝達すると共に
、係数2/Nを算定して乗算器4に伝達する。−万乗算
器4は、自己相関関数生成回j82から伝達された自己
相関関数R(ilに係数2/Nを乗することにより、補
正された自己相関関数R,、(ilを算出し、パワース
ペクトル包絡生成回路5に伝達する。パワースペクトル
包絡生成回路5は、乗算器4から伝達された補正された
自己相関関数R、(’1、並びにピッチ抽出回路13か
ら伝達された数Nに基づき(9)式および(7)式、
(24)式、(25)式の演算を行い、パワースペクト
ル包絡5fflを出力端子6に出力する。なおピッチ抽
出回路3の出力情報は、パワースペクトル包絡生成回路
5の積分器へ人力されると共に、余弦核発生回路および
正弦核発生回路へも入力処理される。
以上の説明から明らかな如く、本実施例によれば、前述
の(9)式および(71、(24)、 (25)式に基
づき正確なパワースペクトル包絡8(f)が算出され次
に、第7図に示されたスペクトル包絡からホルマント周
波数を求めるためのピーク検出方法について説明する。
の(9)式および(71、(24)、 (25)式に基
づき正確なパワースペクトル包絡8(f)が算出され次
に、第7図に示されたスペクトル包絡からホルマント周
波数を求めるためのピーク検出方法について説明する。
式25を全帯域にわたって目標とする精度で細かく計算
することは計算量を多くするから、まず、粗い間隔でこ
れを計算しておおよその見当をつけ、順に間隔を細かく
して精度を上げる方法をとる。
することは計算量を多くするから、まず、粗い間隔でこ
れを計算しておおよその見当をつけ、順に間隔を細かく
して精度を上げる方法をとる。
この間隔はあまり粗いとピークを逃がす恐れがあり、む
やみには粗くできない。
やみには粗くできない。
ところで、ピークを与えるパワースペクトル包絡の変動
の細かさには上限がある。この上限はスペクトル包絡の
独立な標本点である線スペクトル8 (k Fp)の間
隔において、変動の与える位相が十πとなる変動である
。したがって、1つの線スペクトルがピークを与えたと
き、その両隣りの線スペクトルがピークとなることはな
い。すなわち、Fp間隔以下の狭い間隔でパワースペク
トル包絡の標本値を求めるならば、ピークを逃がすこと
はない。ピークは最大の標本値をはさむ両隣りの標本点
間に必ず含まれている。
の細かさには上限がある。この上限はスペクトル包絡の
独立な標本点である線スペクトル8 (k Fp)の間
隔において、変動の与える位相が十πとなる変動である
。したがって、1つの線スペクトルがピークを与えたと
き、その両隣りの線スペクトルがピークとなることはな
い。すなわち、Fp間隔以下の狭い間隔でパワースペク
トル包絡の標本値を求めるならば、ピークを逃がすこと
はない。ピークは最大の標本値をはさむ両隣りの標本点
間に必ず含まれている。
次に、ピークは最大の標本値をはさむ標本点間にあるこ
とがわかりだので、この区間を適当な間隔で区切り、そ
れらの点について式(25)を計算し、最大値を求めれ
ばさらにピークに接近する。
とがわかりだので、この区間を適当な間隔で区切り、そ
れらの点について式(25)を計算し、最大値を求めれ
ばさらにピークに接近する。
以下、得られた最大点をはさむ区間について同様の計算
を繰返せば、求めるピークにさらに斬近する。これによ
りて、計算量は大幅に減少し、たとえば、帯域を4KH
zとし、IHzの精度でピークを求めるならば、400
0点もの多くの標本点について計算する必要があるが、
本方式によれば線スペクトル間隔が100 Hzの場合
、第1段階で40点。
を繰返せば、求めるピークにさらに斬近する。これによ
りて、計算量は大幅に減少し、たとえば、帯域を4KH
zとし、IHzの精度でピークを求めるならば、400
0点もの多くの標本点について計算する必要があるが、
本方式によれば線スペクトル間隔が100 Hzの場合
、第1段階で40点。
第2段階を1QHz間隔として20点、第3段階をI
Hz間隔とすると同じく20点、計80点の計算で済む
。
Hz間隔とすると同じく20点、計80点の計算で済む
。
また、式(25)をωで微分し、(25)式に代入する
ととなり、パワースペクトル包絡の傾きS(ω)は 8/ (fl =Σ S(k浄) F’ (f−kKp
) (25) ’に− と求められる。すなわち、パワースペクトル包絡の最大
の標本点におけるスペクトル包絡の側きを式(25)’
によりて求めるならば、その傾きによってピーク点がそ
の最大標本点のどちら側にあるか判別することができ、
その判明した醐の区間について同様の演算を繰返すなら
ば、最大点を求める区間がそれぞれの段階で半減し、さ
らに計算量を削減することができる。もちろん、パワー
スペクトル包絡の傾きは、式(25)’で求める必然性
はなく、他の手段によっても同様である。
ととなり、パワースペクトル包絡の傾きS(ω)は 8/ (fl =Σ S(k浄) F’ (f−kKp
) (25) ’に− と求められる。すなわち、パワースペクトル包絡の最大
の標本点におけるスペクトル包絡の側きを式(25)’
によりて求めるならば、その傾きによってピーク点がそ
の最大標本点のどちら側にあるか判別することができ、
その判明した醐の区間について同様の演算を繰返すなら
ば、最大点を求める区間がそれぞれの段階で半減し、さ
らに計算量を削減することができる。もちろん、パワー
スペクトル包絡の傾きは、式(25)’で求める必然性
はなく、他の手段によっても同様である。
第9図に上記ピーク検出方式の実施例を示す。
端子7は入力端子であり、音声が入力する。S(KFp
)計算回路8はパワー線スペクトル8(kFp)の計算
回路であり、その計算結果はスイッチ9とスペクトル包
絡傾き電比回路12と標本値算出回路14回路へ送られ
る。スイッチ9は初めは5(KFp)算出回路8g4に
継がっており、最大値算出回路lOは5(kPp)の最
大値を求める。その結果はスペクトル包絡傾き算出回路
13へ送られ、その最大値を与える標本点におけるパワ
ースペクトル包絡の傾きを計算する。傾きの正負とその
標本点位置はピーク区間決定回路13へ送られ、ピーク
の存在する区間が決定される。傾きが正ならばその標本
点と1つ高周波側の標本点間を区間と定め、傾きが負な
らばそめ標本点と1つ低周波側の標本点間を区間と定め
、標本値算出回路14へ伝送する。標本値算出回路14
はピーク区間決定回路13で決定した区間中の適当な間
隔で8(KFp)計算回路8で得られたパワー線スペク
トルを用いてパワースペクトル包絡の標本値を計算する
。そのとき以後スイッチ9は標本値算出回路14側に切
換えられ、標本値算出回路14で得られた標本値につい
て、前回と同様の計算を繰返し、適当な精度でピーク点
が得られた所で出力端子itより結果を出力する。
)計算回路8はパワー線スペクトル8(kFp)の計算
回路であり、その計算結果はスイッチ9とスペクトル包
絡傾き電比回路12と標本値算出回路14回路へ送られ
る。スイッチ9は初めは5(KFp)算出回路8g4に
継がっており、最大値算出回路lOは5(kPp)の最
大値を求める。その結果はスペクトル包絡傾き算出回路
13へ送られ、その最大値を与える標本点におけるパワ
ースペクトル包絡の傾きを計算する。傾きの正負とその
標本点位置はピーク区間決定回路13へ送られ、ピーク
の存在する区間が決定される。傾きが正ならばその標本
点と1つ高周波側の標本点間を区間と定め、傾きが負な
らばそめ標本点と1つ低周波側の標本点間を区間と定め
、標本値算出回路14へ伝送する。標本値算出回路14
はピーク区間決定回路13で決定した区間中の適当な間
隔で8(KFp)計算回路8で得られたパワー線スペク
トルを用いてパワースペクトル包絡の標本値を計算する
。そのとき以後スイッチ9は標本値算出回路14側に切
換えられ、標本値算出回路14で得られた標本値につい
て、前回と同様の計算を繰返し、適当な精度でピーク点
が得られた所で出力端子itより結果を出力する。
第10図には別の実施例を示す。入力端子7から人力し
た音声は8(KFp)計算回路8でパワー線スペクトル
5(kFp)が計算される0ここで得られたパワー線ス
ペクトルは最大値算出回路lOとスペクトル包絡傾き亘
出12へ送られる。最大値算出回路lOは8 (KFp
)計算回路8で得たパワー線スペクトルから最大のもの
を選び、これをF、とする。またF、に隣接するパワー
線スペクトルの周波数F、およびF、を抽出する。この
とき、F。
た音声は8(KFp)計算回路8でパワー線スペクトル
5(kFp)が計算される0ここで得られたパワー線ス
ペクトルは最大値算出回路lOとスペクトル包絡傾き亘
出12へ送られる。最大値算出回路lOは8 (KFp
)計算回路8で得たパワー線スペクトルから最大のもの
を選び、これをF、とする。またF、に隣接するパワー
線スペクトルの周波数F、およびF、を抽出する。この
とき、F。
の高周波側をFlu低周波側をF、とする。最大値算出
回路10はこのF、、F、、F、をスイッチ9を通して
スペクトル包絡傾き算出回路12へ伝送する。スペクト
ル包絡傾き算出回路12は5(KFp)計算回路8から
得たパワー線スペクトルを用いて、F、におけるパワー
スペクトル包絡の傾きを計算し、その結果とF、 、
F、 、 F、を判定回路15へ送る。
回路10はこのF、、F、、F、をスイッチ9を通して
スペクトル包絡傾き算出回路12へ伝送する。スペクト
ル包絡傾き算出回路12は5(KFp)計算回路8から
得たパワー線スペクトルを用いて、F、におけるパワー
スペクトル包絡の傾きを計算し、その結果とF、 、
F、 、 F、を判定回路15へ送る。
判定回路15はF、における傾きから、傾きが正ならば
F、=F、とおき、負ならばF、= F、ととおいて平
均値算出回路16へ伝送する。平均値算出回路16は、
p、=(p、+p言)/2を計算し、スイッチ9を介し
てスペクトル包絡傾き算出回路12へF、、F、、F、
を送る。スイッチ9このとき以降平均値算出回路16側
に接続される。以下、回路32〜34は同様の動作を繰
返せば、F!はピーク点に斬近し、出力端子11より、
ある精度をもってピーク点が出力される。
F、=F、とおき、負ならばF、= F、ととおいて平
均値算出回路16へ伝送する。平均値算出回路16は、
p、=(p、+p言)/2を計算し、スイッチ9を介し
てスペクトル包絡傾き算出回路12へF、、F、、F、
を送る。スイッチ9このとき以降平均値算出回路16側
に接続される。以下、回路32〜34は同様の動作を繰
返せば、F!はピーク点に斬近し、出力端子11より、
ある精度をもってピーク点が出力される。
次に別の実施例について述べる。
■ パワースペクトル包絡の最大の標本値を与える角周
波数をF、とすれば、パワースペクトル包絡の傾き8′
(ち)の正負によって、ピークがω1の高周波側にある
か、低周波側にあるか判定することができるついま、低
周波側の隣接標本点をに!。
波数をF、とすれば、パワースペクトル包絡の傾き8′
(ち)の正負によって、ピークがω1の高周波側にある
か、低周波側にあるか判定することができるついま、低
周波側の隣接標本点をに!。
高周波側のそれをFsとすると、区間(Fl 、Fl
)あるいは(Fl 、 Fs)のいずれかの区間にピー
クがあることになる。
)あるいは(Fl 、 Fs)のいずれかの区間にピー
クがあることになる。
■ 傾きS’(PI)の正負により、ピークの存在がわ
かった区間を新しく区間(Fx、Fs)とおいて、この
区間内の任意の点をF、とし、上記■の判定を行なえば
、さらに狭くなりた区間(Ft、Fs)が得られる。
かった区間を新しく区間(Fx、Fs)とおいて、この
区間内の任意の点をF、とし、上記■の判定を行なえば
、さらに狭くなりた区間(Ft、Fs)が得られる。
■ ここで得られた区間がF072以下の間隔となった
とき、第11図で示す接線Yl、y宜が得られる〇この
接線の交点は常に8(F)の上方にあり、この交点F、
を通る接線もまた8(11の上方にある。
とき、第11図で示す接線Yl、y宜が得られる〇この
接線の交点は常に8(F)の上方にあり、この交点F、
を通る接線もまた8(11の上方にある。
■ そこで、再び、交点F1 における接線の傾き8’
(Fl)を求めるなら、ピークが、その交点のどちら側
にあるか判明し、ピークを含む区間をさらにせばめるこ
とができる。
(Fl)を求めるなら、ピークが、その交点のどちら側
にあるか判明し、ピークを含む区間をさらにせばめるこ
とができる。
以上の操作を繰返すならば、常に交点は2点Fl。
F、の間にあることから、交点はピーク点に漸近する。
もちろん、傾きS’(Fl)が零となったとき、F、が
ピーク点を表わしている。
ピーク点を表わしている。
入力端子7より入力した音声は8(KFp)算出回路8
でスペクトル包絡のFp/2ごとの標本値が計算され、
その結果は最大値算出回路lOと交点算出回路17.ス
ペクトル包絡算出回路12へ送られる。これらの回路へ
送られる標本値はbごとである。最大値算出回路lOは
それらの標本値から最大のものを選択し、スイッチ9を
介してスペクトル包絡傾き算出回路12へ結果を伝送す
る。伝送後スイッチ9は交点算出回路17側に切換えら
れる。スペクトル包絡傾き算出回路12はS■)計算回
路五8から送られた標本値からスイッチ9を介して送ら
れた標本点におけるスペクトル包絡の傾きを計算し、ピ
ーク区間決定回路13へその結果を伝送する。ピーク区
間決定回路13はスペクトル包絡の傾きからピークの存
在が予想される区間を決定し交点算出回路17へ送る。
でスペクトル包絡のFp/2ごとの標本値が計算され、
その結果は最大値算出回路lOと交点算出回路17.ス
ペクトル包絡算出回路12へ送られる。これらの回路へ
送られる標本値はbごとである。最大値算出回路lOは
それらの標本値から最大のものを選択し、スイッチ9を
介してスペクトル包絡傾き算出回路12へ結果を伝送す
る。伝送後スイッチ9は交点算出回路17側に切換えら
れる。スペクトル包絡傾き算出回路12はS■)計算回
路五8から送られた標本値からスイッチ9を介して送ら
れた標本点におけるスペクトル包絡の傾きを計算し、ピ
ーク区間決定回路13へその結果を伝送する。ピーク区
間決定回路13はスペクトル包絡の傾きからピークの存
在が予想される区間を決定し交点算出回路17へ送る。
交点算出回路回路17はピーク区間決定回路13で得た
区間の両端における接線の交点を5(KFp)計算回路
8で得たスペクトル包絡のFpごとの標本値から計算す
る。そして、その交点をスイッチ9を介してスペクトル
包絡傾き算出回路12へ伝送し、以下、同様の演算を繰
返し、過当な精度となった所で、交点を出力端子11よ
りピーク点として出力する。
区間の両端における接線の交点を5(KFp)計算回路
8で得たスペクトル包絡のFpごとの標本値から計算す
る。そして、その交点をスイッチ9を介してスペクトル
包絡傾き算出回路12へ伝送し、以下、同様の演算を繰
返し、過当な精度となった所で、交点を出力端子11よ
りピーク点として出力する。
以上のようにして、スペクトル包絡線上のピーク点が求
められホルマント周波数が求められる。
められホルマント周波数が求められる。
次にホルマントに対して、零点の描出方法について説明
する。零点は鼻音、鼻音化母音の&!識において重要で
あり、その描出方法はホルマントの場合とほぼ同じであ
る。
する。零点は鼻音、鼻音化母音の&!識において重要で
あり、その描出方法はホルマントの場合とほぼ同じであ
る。
即ちホルマントの周波数特性そ上凸の特性とすれば零点
はその逆の下に凸の周波数特性を音源の周波特性に与え
ることになる。零点周状数はこの下に凸の最低点を与え
る周波数を抽出することに等しい。
はその逆の下に凸の周波数特性を音源の周波特性に与え
ることになる。零点周状数はこの下に凸の最低点を与え
る周波数を抽出することに等しい。
ところが、ここに1つの問題が発生する。それは、下に
凸の周波数特性はそこに零点がなくても、2つの極(そ
れぞれ異なる2次フィルタのスペクトルの極)にはさま
れた周波数域でも生じることである。零点の抽出にはこ
のようにして生じた下に凸の特性なのか真に零点の発生
によって生じた下に凸の特性であるのか、区別する必要
がある。
凸の周波数特性はそこに零点がなくても、2つの極(そ
れぞれ異なる2次フィルタのスペクトルの極)にはさま
れた周波数域でも生じることである。零点の抽出にはこ
のようにして生じた下に凸の特性なのか真に零点の発生
によって生じた下に凸の特性であるのか、区別する必要
がある。
それには基準となる値が必要である。
一方、音声波形を標本化周期Tで標本化する場合、標本
化周波数F=l/Tの半分の周波数F3以上の周波数成
分は除去されていなければならない。
化周波数F=l/Tの半分の周波数F3以上の周波数成
分は除去されていなければならない。
このため屹使用する低域フィルタはできるだけ1通過帯
域での利得が1.阻止域でO」となる理想フィルタに近
いものであることが望ましい。理想フィルタは現実には
不可能であるので、適轟な妥協が行われ、実際に使用さ
れるフィルタの特性はFSより低い周波数より減衰が始
まり、FSにおいて十分な減衰量となるように設計され
るのが普通である。すなわち、FSに近い同波数域には
ホルマントは存在しないと考えられ、もつとも音源のス
ベクトル(2次フィルタの影響が少ない)をよく表わし
ている周波数域と言える。したがりて、この周波数域の
線スペクトルを基準スペクトルとして選び、零点の判定
に用いることは、他の周波数域の線スペクトルを用いる
よりもその判定に誤りが少ないと言える。また、直流付
近(周波数0)の周波数もカットされている場合が多く
、この近辺の線スペクトルも基準線スペクトルとして用
いる仁とができる。あるいは、基準線スペクトルとして
、付近の線スペクトルの平均として与えてもよい。
域での利得が1.阻止域でO」となる理想フィルタに近
いものであることが望ましい。理想フィルタは現実には
不可能であるので、適轟な妥協が行われ、実際に使用さ
れるフィルタの特性はFSより低い周波数より減衰が始
まり、FSにおいて十分な減衰量となるように設計され
るのが普通である。すなわち、FSに近い同波数域には
ホルマントは存在しないと考えられ、もつとも音源のス
ベクトル(2次フィルタの影響が少ない)をよく表わし
ている周波数域と言える。したがりて、この周波数域の
線スペクトルを基準スペクトルとして選び、零点の判定
に用いることは、他の周波数域の線スペクトルを用いる
よりもその判定に誤りが少ないと言える。また、直流付
近(周波数0)の周波数もカットされている場合が多く
、この近辺の線スペクトルも基準線スペクトルとして用
いる仁とができる。あるいは、基準線スペクトルとして
、付近の線スペクトルの平均として与えてもよい。
基準が与えられれば零点周波数の抽出は簡単である。零
点はこの基準線スペクトルより小さい線スペクトル近辺
のスペクトル包絡の最小値を与える点として抽出するこ
とができ、零点周波数はその点の周波数として求められ
る@ スペクトル包絡の最小点を求める方法はホルマントの場
合と同様である。その異体例をい(つかあげ、簡単に説
明する。
点はこの基準線スペクトルより小さい線スペクトル近辺
のスペクトル包絡の最小値を与える点として抽出するこ
とができ、零点周波数はその点の周波数として求められ
る@ スペクトル包絡の最小点を求める方法はホルマントの場
合と同様である。その異体例をい(つかあげ、簡単に説
明する。
■ スペクトル包絡のFo間隔以下の間隔で標本値を求
め、基準値より小さい標本値で最小のものを選び、その
標本[’2はさむ標本点間をさらに狭い間隔でスペクト
ル包絡の標本値を求め、その最小の標本値をはさむ標本
点間をさらに狭い間隔で標本化することを繰返し、漸近
的に零点周aaを求める方法。
め、基準値より小さい標本値で最小のものを選び、その
標本[’2はさむ標本点間をさらに狭い間隔でスペクト
ル包絡の標本値を求め、その最小の標本値をはさむ標本
点間をさらに狭い間隔で標本化することを繰返し、漸近
的に零点周aaを求める方法。
■ 上記方法において、最小の標本点におけるスペクト
ル包絡の傾きによりて、その最小の標本点に隣接する標
本点を1つ選び、その2つの標本点間iこついて同様の
演算を繰返す方法。
ル包絡の傾きによりて、その最小の標本点に隣接する標
本点を1つ選び、その2つの標本点間iこついて同様の
演算を繰返す方法。
■ スペクトル包絡のFO間隔以下の間隔で標本1直を
求め、基準値より小さい標本値で最小のものを選び、そ
の標本点におけるスペクトル包絡の傾きから、もう1つ
の隣接する標本点を選ぶ。その2標本点間について、任
意の1点を選び、この点に怠けるスペクトル包絡の傾き
から、もとの2つの標本点のうちから1点を選び、新シ
い標本点間とする。以下、同様に、この新しい標点間に
ついて演算を繰返せば、零点周波数は漸近的にボめられ
る。ただし、スペクトル包絡の煩きが0となりた時点で
演算を中止し、この点を零点周数数とすることも可能で
ある。
求め、基準値より小さい標本値で最小のものを選び、そ
の標本点におけるスペクトル包絡の傾きから、もう1つ
の隣接する標本点を選ぶ。その2標本点間について、任
意の1点を選び、この点に怠けるスペクトル包絡の傾き
から、もとの2つの標本点のうちから1点を選び、新シ
い標本点間とする。以下、同様に、この新しい標点間に
ついて演算を繰返せば、零点周波数は漸近的にボめられ
る。ただし、スペクトル包絡の煩きが0となりた時点で
演算を中止し、この点を零点周数数とすることも可能で
ある。
■ 上記■の2標本点間の任意の1点の定め方として、
2標本点を通るスペクトル包絡の接線の交点とする方法
。
2標本点を通るスペクトル包絡の接線の交点とする方法
。
等がある。
これらの方法はホルマント(ピーク検出)周波数を求め
る場合と同じであるので詳細は省略する。
る場合と同じであるので詳細は省略する。
第13図に零点周波数抽出の具体例を示す。入力端子7
より入力した音声はピッチ検出回路18、自己相関関数
算出回路19へ送られる。ピッチ検出回路18はピッチ
検出を行い、ピッチ検出に成功した有声音についてはピ
ッチを、失敗した無声音についてはあらかじめ定められ
た区間を線スペクトル算出回路20へ送る。自己相関関
数算出回路20は音声の自己相関関数の計算を行う。線
スペクトル算出回路20は回路18.19の結果を受け
て自己相関関数のフ−リュ変換により締スペクトルを計
算し、その結果を基準線スペクトル設定回路21.判定
回路31.最小点検出回路32へ送る。基準線スペクト
ル設定回路21はその線スペクトルの中から基準となる
線スペクトルを選び、判定回路22はその基準線スペク
トルより小さい線スペクトルを検出し、最小点検出回路
23へ送る・検出できなかりた場合は未検出信号を最小
点検出回路23を通て出力端子11へ送る。最小点検出
回路23は検出された場合のみ動作し、スペクトル包絡
の最小点を抽出し、端子11よりその5結果を出力する
。
より入力した音声はピッチ検出回路18、自己相関関数
算出回路19へ送られる。ピッチ検出回路18はピッチ
検出を行い、ピッチ検出に成功した有声音についてはピ
ッチを、失敗した無声音についてはあらかじめ定められ
た区間を線スペクトル算出回路20へ送る。自己相関関
数算出回路20は音声の自己相関関数の計算を行う。線
スペクトル算出回路20は回路18.19の結果を受け
て自己相関関数のフ−リュ変換により締スペクトルを計
算し、その結果を基準線スペクトル設定回路21.判定
回路31.最小点検出回路32へ送る。基準線スペクト
ル設定回路21はその線スペクトルの中から基準となる
線スペクトルを選び、判定回路22はその基準線スペク
トルより小さい線スペクトルを検出し、最小点検出回路
23へ送る・検出できなかりた場合は未検出信号を最小
点検出回路23を通て出力端子11へ送る。最小点検出
回路23は検出された場合のみ動作し、スペクトル包絡
の最小点を抽出し、端子11よりその5結果を出力する
。
次にホルマント帯域幅(減*@(減衰率)抽出方法につ
いて説明する@ 逐次抽出における第1段目の2次フィルタが与えるホル
マントの帯域幅はスペクトル包絡上の最大の極大点周波
数近傍(例えば第7図のF)の音声スペクトルだけを最
適近似する周波数特性をもつ2次フィルタの係数として
抽出される。すなわち−スペクトルの局所近似によるホ
ルマント抽出である。
いて説明する@ 逐次抽出における第1段目の2次フィルタが与えるホル
マントの帯域幅はスペクトル包絡上の最大の極大点周波
数近傍(例えば第7図のF)の音声スペクトルだけを最
適近似する周波数特性をもつ2次フィルタの係数として
抽出される。すなわち−スペクトルの局所近似によるホ
ルマント抽出である。
帯域幅を与える2次フィルタ係数の抽出はホルマント周
波数近傍の2つの線スペクトルについて減衰率を未知数
とする3次方程式をたて、これを −解くことによ
って行うことができる。得られた係数はこの計glこ用
いた2Iljlスペクトルの近似に2いて最適である。
波数近傍の2つの線スペクトルについて減衰率を未知数
とする3次方程式をたて、これを −解くことによ
って行うことができる。得られた係数はこの計glこ用
いた2Iljlスペクトルの近似に2いて最適である。
この3医方程式はカルダンの公式を用いて簡単に解(こ
とができる。
とができる。
ところが、そこで得られた2次フィルタの周波数特性は
ホルマント近傍の他の線スベク)7しについても最適な
近似を与えるとは限らない。このためには、他の線スペ
クトルについても同様の計算を行い1これらの平均から
ホルマント近傍の線スペクトル全体を平均的に近似する
周波数特性を与える係数を求めることが必要である。そ
の場合、!1t31Efる線スペクトルはホルマント周
波数の両側に同数となるようにとる。このとき、他のホ
ルマントの周波数特性はホルマント周波数の両側で逆の
作用となって働き、他のホルマントの影響は相殺される
。ここでは、この平均法として、「級数平均法」を用い
る。ここでいう級数平均法とは「ホルマント帯域幅を与
える2次フィルタのインパルス応答の減衰率を等比とす
る等比級数の平均から平均等比を求める方法」である。
ホルマント近傍の他の線スベク)7しについても最適な
近似を与えるとは限らない。このためには、他の線スペ
クトルについても同様の計算を行い1これらの平均から
ホルマント近傍の線スペクトル全体を平均的に近似する
周波数特性を与える係数を求めることが必要である。そ
の場合、!1t31Efる線スペクトルはホルマント周
波数の両側に同数となるようにとる。このとき、他のホ
ルマントの周波数特性はホルマント周波数の両側で逆の
作用となって働き、他のホルマントの影響は相殺される
。ここでは、この平均法として、「級数平均法」を用い
る。ここでいう級数平均法とは「ホルマント帯域幅を与
える2次フィルタのインパルス応答の減衰率を等比とす
る等比級数の平均から平均等比を求める方法」である。
ホルマント周波数近傍の2線スペクトルを通る周波数特
性を与える2次フィルタ係数の抽出のための具体的な計
算は以下のように行う。
性を与える2次フィルタ係数の抽出のための具体的な計
算は以下のように行う。
減衰風(帯域幅)は中心周波数近傍のスペクトルを最適
近似する2次フィルタの減衰率から求められる。それに
はまず、2次フィルタの構成を決める必要がある。2次
フィルタの構成にはいくつかの種類がある。ここでは、
インパルス不変なりニア←線型)型2次フィルタを用い
る。
近似する2次フィルタの減衰率から求められる。それに
はまず、2次フィルタの構成を決める必要がある。2次
フィルタの構成にはいくつかの種類がある。ここでは、
インパルス不変なりニア←線型)型2次フィルタを用い
る。
この2次フィルタは中心周波数から離れたところでの減
衰特性があまり大きくならず、かつ平担に近いという特
徴をもつ。この特徴は音声生成フィルタを2次フィルタ
の縦続接続で表し、これを逐次抽出する場合において、
窺1接ホルマントへの影響が少ないといろ点で好都合で
ある。LBLWBR型2次フィルタの伝達関数FIZa
kよび周波数特性F(flは ωs = 2πFs A:利得B:減衰率FS:中心周波数 と表される。
衰特性があまり大きくならず、かつ平担に近いという特
徴をもつ。この特徴は音声生成フィルタを2次フィルタ
の縦続接続で表し、これを逐次抽出する場合において、
窺1接ホルマントへの影響が少ないといろ点で好都合で
ある。LBLWBR型2次フィルタの伝達関数FIZa
kよび周波数特性F(flは ωs = 2πFs A:利得B:減衰率FS:中心周波数 と表される。
式(27)において周波数特性とホルマント周波数Fs
はすでに求められており、未知数は減衰率Bと利得人の
2つであるoしたがって、未知数が2つの方程式(27
)はホルマント周波数近傍の2周波数点lζおけるスペ
クトル包絡の値を与えればこれを解くことができる。2
周波数点をFa、Fbにの点におけるスペクトル包絡の
値をS (Fa)、 8(Fb)。その比をRとすると
、利得人が消去され、Bを未知数とする方程式 %式%(28) が得られる。さらにこれを減衰率Bについて整理して、 CaB”+ Cb B2+Cc B+Cd = OC@
=Rcoslla−cos& cbと(1−R)(1+2cosθb CO8θ西Cc
= (R−2) cos19m+(2R−1) co
sl)bCd=1−R なる3次方糧式が得られる。これを解いて得られた係数
A、Bは8 (Fa) 、8 (i’b)を通る周波数
特性をもつ中心周波数Fmの2次フィルタを与える。
はすでに求められており、未知数は減衰率Bと利得人の
2つであるoしたがって、未知数が2つの方程式(27
)はホルマント周波数近傍の2周波数点lζおけるスペ
クトル包絡の値を与えればこれを解くことができる。2
周波数点をFa、Fbにの点におけるスペクトル包絡の
値をS (Fa)、 8(Fb)。その比をRとすると
、利得人が消去され、Bを未知数とする方程式 %式%(28) が得られる。さらにこれを減衰率Bについて整理して、 CaB”+ Cb B2+Cc B+Cd = OC@
=Rcoslla−cos& cbと(1−R)(1+2cosθb CO8θ西Cc
= (R−2) cos19m+(2R−1) co
sl)bCd=1−R なる3次方糧式が得られる。これを解いて得られた係数
A、Bは8 (Fa) 、8 (i’b)を通る周波数
特性をもつ中心周波数Fmの2次フィルタを与える。
このとき、8 (Fi) 、8 (Fb)は線スペクト
ルに限られる。その理由を以下に示す。
ルに限られる。その理由を以下に示す。
2次フィルタの周波数特性、式(27)は積分区間を無
限大とした場合の周波数特性である。この特性を周波数
軸上のスペクトルの撮動で表すならば、それは式(11
)に示す1=−00〜Ooの振動成分に分解することが
できる。−万1積分区間を有限とすれば、求めうるスペ
クトルの振動には上限が発生し、その上限以上の振動成
分は求めることかで缶ない。すなわち、ここで得られた
周波数特性と上記周波数特性きは一致しない。ところが
、ナでに述べたように積分区間が有限であっても・積分
区間長で決まる一定間隔ごとの線スペクトルだけは上記
周波数特性に一致する。したがって、この線スペクトル
についての近似を考えるならば、積分区間を無限大々し
た周波数特性をそのまま近似に用いることができる。
限大とした場合の周波数特性である。この特性を周波数
軸上のスペクトルの撮動で表すならば、それは式(11
)に示す1=−00〜Ooの振動成分に分解することが
できる。−万1積分区間を有限とすれば、求めうるスペ
クトルの振動には上限が発生し、その上限以上の振動成
分は求めることかで缶ない。すなわち、ここで得られた
周波数特性と上記周波数特性きは一致しない。ところが
、ナでに述べたように積分区間が有限であっても・積分
区間長で決まる一定間隔ごとの線スペクトルだけは上記
周波数特性に一致する。したがって、この線スペクトル
についての近似を考えるならば、積分区間を無限大々し
た周波数特性をそのまま近似に用いることができる。
第14図に上記3次方糧式を屏いて得られた2次フィル
タの周波数特性をスペクトル包絡に重ねて示す。図に示
す2次フィルタの周波数特性は線スペクシル■(8(P
a) 、S (Fb) ) 、■(8(Fa)18 (
Fc) )を通る2次フィルタの周波特性として、式(
30)の3次方糧式を解いて求めた2次フィルタの周波
数特性である。
タの周波数特性をスペクトル包絡に重ねて示す。図に示
す2次フィルタの周波数特性は線スペクシル■(8(P
a) 、S (Fb) ) 、■(8(Fa)18 (
Fc) )を通る2次フィルタの周波特性として、式(
30)の3次方糧式を解いて求めた2次フィルタの周波
数特性である。
第15図にホルマント帯域幅抽出の異体例を示す。入力
端子7より入力した音声はピッ、チ検出回路18および
自己相関関数算出回路19へ入力し、自己相関関数算出
回路19は入力した音声の自己相関関数を計算する。ピ
ッチ検出回路18は音声のピッチを検出し、とツチ検出
に成功した音声音についてはピッチを、失敗した無声音
についてはあらかじめ定められた区間長を線スペクトル
算出回路20へ伝送する。線スペクトル算出回路20は
ピッチ検出回路1g、自己相関関数算出回路19で得た
結果をもとに7−リム変換を行い、線スペクトルを求め
る。スペクトル包絡算出回路24はその線スペクトルか
らスペクトル包絡を計算し、ピーク検出回路25はその
包絡のピークを検出し、そのピーク近傍の線スペクトル
を2つ選び、方程式作成回路26へ送る。方程式作成回
路26は2次フィルタの周波数特性を与える式にピーク
検出回路25で得た線スペクトルを用いて連立方程式を
たて、掛算出力回路27はその連立方程式を解いて、0
〜lの範囲内にある実根をもって減衰率とし・出力端子
11より一力する・ −7−丈た、同様にして
、零点の帯域幅を求めることができろう即ち第15図の
回路は零点帯域幅を求めるためにも適用できる。入力端
子7より入力した音声はピッチ回路18および自己相関
関数算出回路19へ入力し、自己相関関数算出回路19
は入力した音声の自己相関関数を計算する。ピッチ検出
回路18は音声のピッチを検出し、ピッチ検出に成功し
た有声音についてはピッチを、失敗した無声音について
はあらかじめ定められた区間長を線スペクトル算出回路
zOへ伝送する。線スペクトル算出回路20はピッチ検
出回路1B、自己相関関数算出回路19で得た結果をも
とにフーリエ変換を行い、線スペクトルを求める。スペ
クトル包絡算出回路24はその線スペクトルからスペク
トル包絡を計算し、ピーク検出回路25は基準線スペク
トルより小さい線スペクトルの近くのスペクトル色落か
ら最小値を検出し、その周波数を零点周波数としてまた
その近辺の線スペクトルを選び、方程式作成回路26へ
送る方程式回路26は2次フィルタの周波数特性を与え
る式に基準スペクトルおよび零点周波数とその近くの線
スペクトルを用いて連立方程式をたて、掛算出回路27
はそれを解いて、0〜lの範囲内にある実根を選んで減
衰率とし、出力端子1.loより出力するロスに、別の
方法によるホルマント帯域幅を求める方法について説明
する。
端子7より入力した音声はピッ、チ検出回路18および
自己相関関数算出回路19へ入力し、自己相関関数算出
回路19は入力した音声の自己相関関数を計算する。ピ
ッチ検出回路18は音声のピッチを検出し、とツチ検出
に成功した音声音についてはピッチを、失敗した無声音
についてはあらかじめ定められた区間長を線スペクトル
算出回路20へ伝送する。線スペクトル算出回路20は
ピッチ検出回路1g、自己相関関数算出回路19で得た
結果をもとに7−リム変換を行い、線スペクトルを求め
る。スペクトル包絡算出回路24はその線スペクトルか
らスペクトル包絡を計算し、ピーク検出回路25はその
包絡のピークを検出し、そのピーク近傍の線スペクトル
を2つ選び、方程式作成回路26へ送る。方程式作成回
路26は2次フィルタの周波数特性を与える式にピーク
検出回路25で得た線スペクトルを用いて連立方程式を
たて、掛算出力回路27はその連立方程式を解いて、0
〜lの範囲内にある実根をもって減衰率とし・出力端子
11より一力する・ −7−丈た、同様にして
、零点の帯域幅を求めることができろう即ち第15図の
回路は零点帯域幅を求めるためにも適用できる。入力端
子7より入力した音声はピッチ回路18および自己相関
関数算出回路19へ入力し、自己相関関数算出回路19
は入力した音声の自己相関関数を計算する。ピッチ検出
回路18は音声のピッチを検出し、ピッチ検出に成功し
た有声音についてはピッチを、失敗した無声音について
はあらかじめ定められた区間長を線スペクトル算出回路
zOへ伝送する。線スペクトル算出回路20はピッチ検
出回路1B、自己相関関数算出回路19で得た結果をも
とにフーリエ変換を行い、線スペクトルを求める。スペ
クトル包絡算出回路24はその線スペクトルからスペク
トル包絡を計算し、ピーク検出回路25は基準線スペク
トルより小さい線スペクトルの近くのスペクトル色落か
ら最小値を検出し、その周波数を零点周波数としてまた
その近辺の線スペクトルを選び、方程式作成回路26へ
送る方程式回路26は2次フィルタの周波数特性を与え
る式に基準スペクトルおよび零点周波数とその近くの線
スペクトルを用いて連立方程式をたて、掛算出回路27
はそれを解いて、0〜lの範囲内にある実根を選んで減
衰率とし、出力端子1.loより出力するロスに、別の
方法によるホルマント帯域幅を求める方法について説明
する。
まずスペクトル包絡から2次フィルタの中心周波数を決
め、仁の近傍の線スペクトルから2点を選ぶ。その角周
波数を611.ω、とにおいて減衰率Bを仮定する。
め、仁の近傍の線スペクトルから2点を選ぶ。その角周
波数を611.ω、とにおいて減衰率Bを仮定する。
0(B(1
内の任意の値B、を選び、式27に代入すると、より人
が決まる。次にこのA、 B、を用いてF(61m )
を計算し、 S(町)〈F(ω、) ならば、減衰’aBtが小さいことがわかるのでB、(
B(1 の任意の値を選び、 S(ωt)>F(ω、) ならば o(B(B。
が決まる。次にこのA、 B、を用いてF(61m )
を計算し、 S(町)〈F(ω、) ならば、減衰’aBtが小さいことがわかるのでB、(
B(1 の任意の値を選び、 S(ωt)>F(ω、) ならば o(B(B。
の任意の値を選び、ここで得られたB、について、同様
の演算を繰返せば、Bi i =1.2 、3 ・・・
・・・はBに収束して行く。もちろん、BLにおいてS
(ωり謹F(ω、) となりだとき、演算を打切り1 B = B + として減衰率を決定する。
の演算を繰返せば、Bi i =1.2 、3 ・・・
・・・はBに収束して行く。もちろん、BLにおいてS
(ωり謹F(ω、) となりだとき、演算を打切り1 B = B + として減衰率を決定する。
第16図に具体例を示す。入力端子7より入力した音声
はピッチ検出口$18詔よび自己相関関数算出回路19
へ入力し、自己相関関数算出回路19は入力した音声の
自己相関関数を計算する。
はピッチ検出口$18詔よび自己相関関数算出回路19
へ入力し、自己相関関数算出回路19は入力した音声の
自己相関関数を計算する。
ピッチ検出回路18は音声のピッチを検出し、ピッチ検
出に成功した有声音についてはピッチを、失敗した無声
音につい【はあらかじめ定められた区間長を線スペクト
ル算出回路20へ伝送する。
出に成功した有声音についてはピッチを、失敗した無声
音につい【はあらかじめ定められた区間長を線スペクト
ル算出回路20へ伝送する。
線スペクトル算出回路2Gは回路18.19で得た結果
をもとにフーリ、変換を行い、線スペクトルを求める。
をもとにフーリ、変換を行い、線スペクトルを求める。
その結果はスペクトル包絡算出回路24とピーク検出回
路25へ送られる。スペクトル包絡算出回路24は線ス
ペクトルからスペクトル包絡を計算し、ピーク検出回路
25はそのスペクトル包絡のピークを検出して、その近
傍の線スペクトルS(ω1)、8(ω1)を選び、減衰
率の初期値Bと合せてスイッチ9を介し、利得算出回路
28へ送る。スイッチ9の初期状態はピーク検出回路2
5側にあり、ピーク検出回路25からのデータを通過さ
せた後は範囲設定回路31側に切換えられる。
路25へ送られる。スペクトル包絡算出回路24は線ス
ペクトルからスペクトル包絡を計算し、ピーク検出回路
25はそのスペクトル包絡のピークを検出して、その近
傍の線スペクトルS(ω1)、8(ω1)を選び、減衰
率の初期値Bと合せてスイッチ9を介し、利得算出回路
28へ送る。スイッチ9の初期状態はピーク検出回路2
5側にあり、ピーク検出回路25からのデータを通過さ
せた後は範囲設定回路31側に切換えられる。
利得算出回路28は2次フィルタの周波数特性を与える
式に、P(ωI)+ωItB中心周波中心周波数人3、
利得人を求める。F(ω、)算出回路29はその利得人
1周波数ω7.ωSおよびBから周波数ω、に怠ける1
次フィルタの周波数特性の11F(ω、)を計算し、比
破口路30へ送る。比較回路30はF(ωz)、8(”
m)を比較し、その比較結果を受けて範囲設定回路31
は減衰率の予想範囲を決定し、その範囲内の任意の点、
例えば中心を新しいBとおいて、スイッチ9を介し、利
得算出回路28で始まる演算ループへ伝送するつこの繰
作をあらか゛じめ定めた回数だけ繰返せば、Bは真の値
に漸近し、出力端子11よりその結果を得ることができ
る。また同様の方法により、零点帯域幅を求めることが
できる。
式に、P(ωI)+ωItB中心周波中心周波数人3、
利得人を求める。F(ω、)算出回路29はその利得人
1周波数ω7.ωSおよびBから周波数ω、に怠ける1
次フィルタの周波数特性の11F(ω、)を計算し、比
破口路30へ送る。比較回路30はF(ωz)、8(”
m)を比較し、その比較結果を受けて範囲設定回路31
は減衰率の予想範囲を決定し、その範囲内の任意の点、
例えば中心を新しいBとおいて、スイッチ9を介し、利
得算出回路28で始まる演算ループへ伝送するつこの繰
作をあらか゛じめ定めた回数だけ繰返せば、Bは真の値
に漸近し、出力端子11よりその結果を得ることができ
る。また同様の方法により、零点帯域幅を求めることが
できる。
第17図にその具体例を示す。入力端子7より入力した
音声は回路18および19へ入力し、回路19は入力し
た音声の自己相関関数を計算する。
音声は回路18および19へ入力し、回路19は入力し
た音声の自己相関関数を計算する。
回路18は音声のピッチを検出し、ピッチ検出に成功し
た有声音についてはピッチを、失敗した無声音について
はあらかじめ定められた区間長を回路20へ伝送する。
た有声音についてはピッチを、失敗した無声音について
はあらかじめ定められた区間長を回路20へ伝送する。
回路20は回路is、lsで得た結果をもとにフーリ為
変換を行い、線スペクトルを求める。その結果は回路2
4.23へ送られる。
変換を行い、線スペクトルを求める。その結果は回路2
4.23へ送られる。
回路24は線スペクトルからスペクトル包1188cω
)を計算し、回路32は高周波域あるいは低周波域の1
つの線スペクトル、たとえば最高周波数の線スペクトル
5(−)を基準とし、それより小さい線スペクトル近辺
のパワースペクトル包絡S(ω)の最小値を検出し、こ
れを零点周波数ωSとする@さらに、零点周波数付近の
1つの線スペクトルS(ω、)を選び、これらを回路2
8へ伝送する。スイッチ9は初期状態は初期減衰率B、
側にあり、回路32よりデータが回路28へ送られた後
は回路43儒化切換えられる。回路28はスイッチ9を
介して入力する減衰率、零点周波数および線スペクトル
S(ωI)、(ω雪)のいずれか一方を用いて2次フィ
ルタの周a数特性を与える式(27)より、利得人を計
算する。回路29はその利得人を用いて同じく式(27
)より、もう一方の線スペクトル周波数における周波数
特性の値を計算する。回路30はその結果と七〇線スペ
クトルの大きさを比較し、回路33はその比較結果から
減衰率の予想値を決定し−それを再びスイッチ20を介
し、回路28で始まる演算レープへ伝送する。この演算
をあらかじめ定めた回数だけ繰返すならば、回路33で
得られる予想値の値に漸近し、出力端子11より、その
結果を得ることができる。
)を計算し、回路32は高周波域あるいは低周波域の1
つの線スペクトル、たとえば最高周波数の線スペクトル
5(−)を基準とし、それより小さい線スペクトル近辺
のパワースペクトル包絡S(ω)の最小値を検出し、こ
れを零点周波数ωSとする@さらに、零点周波数付近の
1つの線スペクトルS(ω、)を選び、これらを回路2
8へ伝送する。スイッチ9は初期状態は初期減衰率B、
側にあり、回路32よりデータが回路28へ送られた後
は回路43儒化切換えられる。回路28はスイッチ9を
介して入力する減衰率、零点周波数および線スペクトル
S(ωI)、(ω雪)のいずれか一方を用いて2次フィ
ルタの周a数特性を与える式(27)より、利得人を計
算する。回路29はその利得人を用いて同じく式(27
)より、もう一方の線スペクトル周波数における周波数
特性の値を計算する。回路30はその結果と七〇線スペ
クトルの大きさを比較し、回路33はその比較結果から
減衰率の予想値を決定し−それを再びスイッチ20を介
し、回路28で始まる演算レープへ伝送する。この演算
をあらかじめ定めた回数だけ繰返すならば、回路33で
得られる予想値の値に漸近し、出力端子11より、その
結果を得ることができる。
しかしながら、以上のよう処して得られた2次フィルタ
は計算に使用した24!スペクトルについては最適近似
であると言えるけれども、ホルマント近傍の他の線スペ
クトルについても最適であるとは限らない(第18図参
照)。ホルマント近傍の線スペクトル全体な平均的シζ
近似するためには、それらの線スペクトルについ【求め
た2次フィルタの周波数特性の平均周波数特性を与える
2次フィルタを求める必要がある。この計算法を以下に
示す。
は計算に使用した24!スペクトルについては最適近似
であると言えるけれども、ホルマント近傍の他の線スペ
クトルについても最適であるとは限らない(第18図参
照)。ホルマント近傍の線スペクトル全体な平均的シζ
近似するためには、それらの線スペクトルについ【求め
た2次フィルタの周波数特性の平均周波数特性を与える
2次フィルタを求める必要がある。この計算法を以下に
示す。
2次フィルタの中心周波数はホルマント近傍の線スペク
トルについて立てた各方程式に共通であるから、これを
直流まで平行移動しても減衰特性は変わらない。そこで
、簡単のため、中心周波数が直流の低域フィルタとして
最適化することを考える。このとき、低域フィルタのイ
ンパルス応答は等化数列で表される。さらに、ここでは
時間領域における最適化を考える。
トルについて立てた各方程式に共通であるから、これを
直流まで平行移動しても減衰特性は変わらない。そこで
、簡単のため、中心周波数が直流の低域フィルタとして
最適化することを考える。このとき、低域フィルタのイ
ンパルス応答は等化数列で表される。さらに、ここでは
時間領域における最適化を考える。
さて、ホルマント近傍のいくつかの線スペクトルについ
【得られた3個の2次フィルタの係数かGj (nT)
= AJ BJ (31
)J=1.・・・・・・、J Aj;利得(インパルス応答の初期値)Bj:減衰*(
インパルス応答の等比)なるインパルス応答を得る。こ
の3個のインパルス応答を最適近似する平均関数は各時
点における平均値列 G(nT)=ΣGj (nT) /J (
32)sal で与えられる。さらに1この平均値列関数G(nT)を
最適近似する利得Ao、減衰率Boのインパルス応答を
つぎのよ5におく。
【得られた3個の2次フィルタの係数かGj (nT)
= AJ BJ (31
)J=1.・・・・・・、J Aj;利得(インパルス応答の初期値)Bj:減衰*(
インパルス応答の等比)なるインパルス応答を得る。こ
の3個のインパルス応答を最適近似する平均関数は各時
点における平均値列 G(nT)=ΣGj (nT) /J (
32)sal で与えられる。さらに1この平均値列関数G(nT)を
最適近似する利得Ao、減衰率Boのインパルス応答を
つぎのよ5におく。
Go (nT) wAoBo’ (
33)このとき、区間n=o〜N−Lにおける平均値列
関数G(nT)をGo (nT)で近似するならば、こ
の区間における部分和は等しくなければならない。した
がって、その両関数の部分和を等しいとおいてが得られ
る。利得Aoは式(34)においてN=Oとおいた各2
次フィルタの利得の平均 Ao=ΣAj/J (35)z
l から求められる。減衰率Boはこれを式(34)に代入
し、減衰率BoKついて計算すれば求めることができる
。また、N=−とおけば、全区間における平均、最適化
とし?Ao、Boは 均 Bo=ΣBj/J (37)J
=1 は全利得A1を等しいとおいた、N=1の場合の式(3
7)の計算に等しい。
33)このとき、区間n=o〜N−Lにおける平均値列
関数G(nT)をGo (nT)で近似するならば、こ
の区間における部分和は等しくなければならない。した
がって、その両関数の部分和を等しいとおいてが得られ
る。利得Aoは式(34)においてN=Oとおいた各2
次フィルタの利得の平均 Ao=ΣAj/J (35)z
l から求められる。減衰率Boはこれを式(34)に代入
し、減衰率BoKついて計算すれば求めることができる
。また、N=−とおけば、全区間における平均、最適化
とし?Ao、Boは 均 Bo=ΣBj/J (37)J
=1 は全利得A1を等しいとおいた、N=1の場合の式(3
7)の計算に等しい。
第19図に第18図のスペクトル包絡におけるホルマン
ト近傍の31!スペクトルの組合せ、■(S (Fa)
、 S (Fb) )、■(S (Fa) 、 S (
Fc) )について求めた低域フィルタのインパルス応
答の平均応答■を示す。図から平均り答が求められてい
ることがわかる。第20図はその平均インパルス応答を
もつ2次フィルタの周波数特性である。
ト近傍の31!スペクトルの組合せ、■(S (Fa)
、 S (Fb) )、■(S (Fa) 、 S (
Fc) )について求めた低域フィルタのインパルス応
答の平均応答■を示す。図から平均り答が求められてい
ることがわかる。第20図はその平均インパルス応答を
もつ2次フィルタの周波数特性である。
第21図は上記方法の具体例である。六方端子7より入
力した音声は自己相関関数の1ピッチ分のツーり瓢変換
として線スペクトル算出回路20により線スペクトルに
変換される。得られた線スペクトルは回路24.34.
35へ送られ、スペクトル包絡算出回路24では線スペ
クトルからスペクトル包絡が計算される。ホルマント・
零点抽出回路34はスペクトル包絡のピークとしてホル
マントな、基msスペクトルより小さいlスペクトル近
辺のスペクトル包絡の最小値として零点を抽出し、利得
・減衰率算出回路35へ送る。回路35はホルマントあ
るいは零点近傍の線スペクトルをいくつか選び、それら
について2次フィルタの利得および減衰率を計算する。
力した音声は自己相関関数の1ピッチ分のツーり瓢変換
として線スペクトル算出回路20により線スペクトルに
変換される。得られた線スペクトルは回路24.34.
35へ送られ、スペクトル包絡算出回路24では線スペ
クトルからスペクトル包絡が計算される。ホルマント・
零点抽出回路34はスペクトル包絡のピークとしてホル
マントな、基msスペクトルより小さいlスペクトル近
辺のスペクトル包絡の最小値として零点を抽出し、利得
・減衰率算出回路35へ送る。回路35はホルマントあ
るいは零点近傍の線スペクトルをいくつか選び、それら
について2次フィルタの利得および減衰率を計算する。
平均減衰率算出回路36は初項を利得1等化を減状フと
する等比数列の和の平均に等しい等比数列の等比な(3
5)式。
する等比数列の和の平均に等しい等比数列の等比な(3
5)式。
(36)式より計算し、出力端子11より平均減衰率と
して出力する。
して出力する。
次に音声のスペクトル上の21i要な特徴であるホルマ
ントや零点付近だけを近似する2次フィルタ、それもあ
らかじめ定めた減衰率をもつ2次フィルタの縦続接続で
音声生成フィルタを表わし、おおまかな近似だけでホル
マントや零点を抽出することにより、簡易な、しかしホ
ルマントや零点と対応する2次フィルタとして抽出可能
な方法について述べる。
ントや零点付近だけを近似する2次フィルタ、それもあ
らかじめ定めた減衰率をもつ2次フィルタの縦続接続で
音声生成フィルタを表わし、おおまかな近似だけでホル
マントや零点を抽出することにより、簡易な、しかしホ
ルマントや零点と対応する2次フィルタとして抽出可能
な方法について述べる。
ホルマントおよび零点周波数が決まると、この近傍のス
ペクトルを近似する2次フィルタの減衰富を定めればよ
い。そこで、減衰率を小さなある値に固定しておけば、
このホルマントあるいは零点を近似する2次フィルタが
得られる。この2次フィルタの逆周波数特性を先に求め
た線スペクトルS (KFp) VC乗じると、ホルマ
ントあるいは零点付近のスペクトルに固定した減荻率に
応じた平坦化が行われる。この平坦化されたスペクトル
について同様の演算を行なえば平坦化は徐々に進み、つ
いKは他のホルマントや零点が検出されるようになる。
ペクトルを近似する2次フィルタの減衰富を定めればよ
い。そこで、減衰率を小さなある値に固定しておけば、
このホルマントあるいは零点を近似する2次フィルタが
得られる。この2次フィルタの逆周波数特性を先に求め
た線スペクトルS (KFp) VC乗じると、ホルマ
ントあるいは零点付近のスペクトルに固定した減荻率に
応じた平坦化が行われる。この平坦化されたスペクトル
について同様の演算を行なえば平坦化は徐々に進み、つ
いKは他のホルマントや零点が検出されるようになる。
これについても同様の演算を繰返せば、スペクトル上の
特異点は徐々に平坦化され分析が行われる。このとき、
1つのホルマントあるいは零点は1つ以上の2次フィル
タの縦続接続で表わされろう また、減衰率は1つに固定する以外にいくつか用意して
おき、ホルマントあるいは零点付近の線スペクトルの大
きさから選択してもよい。
特異点は徐々に平坦化され分析が行われる。このとき、
1つのホルマントあるいは零点は1つ以上の2次フィル
タの縦続接続で表わされろう また、減衰率は1つに固定する以外にいくつか用意して
おき、ホルマントあるいは零点付近の線スペクトルの大
きさから選択してもよい。
第21図はその具体例である。入力端子7より入力した
音声は自己相関関数の1ピッチ分のフーリ&変換により
、線スペクトル算出回路20で線スペクトルに変換され
る。その結果はスイッチ9を介して回路24.34.3
7へ送られる。スイッチ9の初期状態は線スペクトル算
出回路209111にあり、線スペクトル算出回路20
から線スペクトルが転送された後は乗nIal路37へ
切換えられる。
音声は自己相関関数の1ピッチ分のフーリ&変換により
、線スペクトル算出回路20で線スペクトルに変換され
る。その結果はスイッチ9を介して回路24.34.3
7へ送られる。スイッチ9の初期状態は線スペクトル算
出回路209111にあり、線スペクトル算出回路20
から線スペクトルが転送された後は乗nIal路37へ
切換えられる。
スペクトル包絡算出回路24は線スペクトルからスペク
トル包絡を計算し、回路34はホルマント周訳数、零点
周波数を抽出する。乗算回路37はそれを受けて2次フ
ィルタの逆周波数特性な線スペクトルに乗じ、スイッチ
9を介して回路24゜34そして自分自身へ転送する。
トル包絡を計算し、回路34はホルマント周訳数、零点
周波数を抽出する。乗算回路37はそれを受けて2次フ
ィルタの逆周波数特性な線スペクトルに乗じ、スイッチ
9を介して回路24゜34そして自分自身へ転送する。
回路31.32゜33の演算を繰返せば、ホルマントあ
るいは零点を近似する2次フィルタが出力端子11から
得られる。
るいは零点を近似する2次フィルタが出力端子11から
得られる。
スペクトル包絡における最大の極大点を中心周波数とす
る第1段目の2次フィルタは以上の手順で抽出される。
る第1段目の2次フィルタは以上の手順で抽出される。
ここで得られた2次フィルタの逆周波数特性を音声(社
)スペクトルに乗じるならば。
)スペクトルに乗じるならば。
この2次フィルタが与えるホルマントは抑圧され、2段
目以降の2次フィルタが与えるつぎに大きいホルマント
がスペクトル包絡における最大の極大点として検出され
る。このホルマント忙ついても同様の演算を繰り返すな
らば、ホルマントは順次抽出することができる。ただし
、逆周波数特性を乗じるスペクトルはスペクトル包絡で
はなくて、線スペクトルであるととに注意が必要である
。
目以降の2次フィルタが与えるつぎに大きいホルマント
がスペクトル包絡における最大の極大点として検出され
る。このホルマント忙ついても同様の演算を繰り返すな
らば、ホルマントは順次抽出することができる。ただし
、逆周波数特性を乗じるスペクトルはスペクトル包絡で
はなくて、線スペクトルであるととに注意が必要である
。
第23−に上記2次フィルタの逆周波数特性を乗じて得
られた2段目以降のフィルタが与えるスペクトル包絡を
示す。この図かう、近接した2つのホルマン) F、
、 F、が本抽出法によってよく分離され、そして抽出
されることがよく分る。ただし、この図においCLER
NER型の2次フィルタでは表すことができない高いQ
の2次フィルタについては減衰率を1とおいて平均して
いる。
られた2段目以降のフィルタが与えるスペクトル包絡を
示す。この図かう、近接した2つのホルマン) F、
、 F、が本抽出法によってよく分離され、そして抽出
されることがよく分る。ただし、この図においCLER
NER型の2次フィルタでは表すことができない高いQ
の2次フィルタについては減衰率を1とおいて平均して
いる。
さて、複数個のホルマントを含むスペクトル包絡からホ
ルマントの遂次抽出を行えば、それぞれのホルマントは
他のホルマントの周波数特性の影響を受けていることか
ら、抽出した係数と真のホルマント係数との間には誤差
の発生が予想される。
ルマントの遂次抽出を行えば、それぞれのホルマントは
他のホルマントの周波数特性の影響を受けていることか
ら、抽出した係数と真のホルマント係数との間には誤差
の発生が予想される。
しかしながら、そのwA差は前記級数平均法によりて相
殺されるため、遂次抽出の影響は小さい。また、必要な
らば抽出後の補正も可能である口補正は遂次抽出によっ
て再抽出された同じホルマントを与える2次フィルタを
前記平均法を用いてLつの2次フィルタとして統一する
ことKより笑行することができる。誤差は徐々に補正さ
れ、2次フィルタ係数は真のホルマント係数に両辺する
。零点くついても同様である。
殺されるため、遂次抽出の影響は小さい。また、必要な
らば抽出後の補正も可能である口補正は遂次抽出によっ
て再抽出された同じホルマントを与える2次フィルタを
前記平均法を用いてLつの2次フィルタとして統一する
ことKより笑行することができる。誤差は徐々に補正さ
れ、2次フィルタ係数は真のホルマント係数に両辺する
。零点くついても同様である。
第1図は本発明の音声分析方式の一実施例である。入力
端子7より入力した音声は線スペクトル算出回路20に
より自己相関関数のlピッチ分のフーリュ変換から互い
に独立な線スペクトル5(kFo)が計算される。その
結果はスイッチ9を介して回路24.34.35および
38へ送られる。スイッチ9の初期状態は線スペクトル
算出回路20側にあり、回路30からS (kFo)が
送られた後は乗算回路37側に切換えられる。スペクト
ル回路算出回路24は線スペクトルS (kFo)から
スペクトル包絡S (F)を計算し、ホルマント・零点
周波数算出回路34はS (F)からホルマントあるい
は零点周波数を検出し、回路35へ転送する。回路35
はホルマントあるいは零点付近の線スペクトル利得・減
衰本算出回路を抽出し、零点の場合は零点検出基準線ス
ペクトルと併せて、ホルマントあるいは零点付近のスペ
クトルと近似する2次フィルタの利得および減衰率を算
出する。最適化回路3Bはそれを受けてホルマントある
いは零点付近のスペクトルをもっともよく近似する2次
フィルタの減衰率を回路35で得られた利得および減f
l藁で表わされる等比数列の和の平均から求める。乗算
回路37は最適化回路38で得られた減衰率を持つ2次
フィルタの逆周波数特性を線スペクトル5(kFo)に
乗じスイッチ9を介して回路24゜34.35および自
分自身に転送し、上述の演算を繰返す。この演算の繰返
しととに出力端子LIKはホルマントあるいは零点を表
わす中心周波数および減衰惠が出力され分析が行なわれ
る。
端子7より入力した音声は線スペクトル算出回路20に
より自己相関関数のlピッチ分のフーリュ変換から互い
に独立な線スペクトル5(kFo)が計算される。その
結果はスイッチ9を介して回路24.34.35および
38へ送られる。スイッチ9の初期状態は線スペクトル
算出回路20側にあり、回路30からS (kFo)が
送られた後は乗算回路37側に切換えられる。スペクト
ル回路算出回路24は線スペクトルS (kFo)から
スペクトル包絡S (F)を計算し、ホルマント・零点
周波数算出回路34はS (F)からホルマントあるい
は零点周波数を検出し、回路35へ転送する。回路35
はホルマントあるいは零点付近の線スペクトル利得・減
衰本算出回路を抽出し、零点の場合は零点検出基準線ス
ペクトルと併せて、ホルマントあるいは零点付近のスペ
クトルと近似する2次フィルタの利得および減衰率を算
出する。最適化回路3Bはそれを受けてホルマントある
いは零点付近のスペクトルをもっともよく近似する2次
フィルタの減衰率を回路35で得られた利得および減f
l藁で表わされる等比数列の和の平均から求める。乗算
回路37は最適化回路38で得られた減衰率を持つ2次
フィルタの逆周波数特性を線スペクトル5(kFo)に
乗じスイッチ9を介して回路24゜34.35および自
分自身に転送し、上述の演算を繰返す。この演算の繰返
しととに出力端子LIKはホルマントあるいは零点を表
わす中心周波数および減衰惠が出力され分析が行なわれ
る。
次に1つのホルマントあるいは零点を表わす2次フィル
タが複数個ある場合にこれを1つの2次フィルタに総合
して、パラメータの表現を簡素化する方法について述べ
る。
タが複数個ある場合にこれを1つの2次フィルタに総合
して、パラメータの表現を簡素化する方法について述べ
る。
ある1つの周波数付近に複数個の2次フィルタが抽出さ
れ、これを1つの2次フィルタに総合するKは、その得
られた複数個の2次フィルタの周波数特性の積を1つの
2次フィルタの周波数特性で近似すればよい。
れ、これを1つの2次フィルタに総合するKは、その得
られた複数個の2次フィルタの周波数特性の積を1つの
2次フィルタの周波数特性で近似すればよい。
例をあげて説明する。複数個の2次フィルタで表わされ
る周波数軸上の!f#徴点がホルマントであるとし、2
次フィ゛ルタの構成Y第(26)式よりB:減衰率
A:利得 ω、:中心周波数 と仮定する。もちろん他の傅成であっても同様である。
る周波数軸上の!f#徴点がホルマントであるとし、2
次フィ゛ルタの構成Y第(26)式よりB:減衰率
A:利得 ω、:中心周波数 と仮定する。もちろん他の傅成であっても同様である。
この2次フィルタの周波数特性は(27)式%式%
さて、得られた複数個の2次フィルタの与える総合周波
数特性S(ω)を求められると、たとえば、七のピーク
周波数をfosビーク値のl/2となる周波数なf、と
すると、 なる減衰率Bを未知数とする2次方程式が得られる。こ
れを解けばS Cf’)を近似する1つの2次フィルタ
が得られる。もちろん他方の方法によって5(f)を近
似する2次フィルタを求めてもよい。
数特性S(ω)を求められると、たとえば、七のピーク
周波数をfosビーク値のl/2となる周波数なf、と
すると、 なる減衰率Bを未知数とする2次方程式が得られる。こ
れを解けばS Cf’)を近似する1つの2次フィルタ
が得られる。もちろん他方の方法によって5(f)を近
似する2次フィルタを求めてもよい。
たとえば、
■ビークイ東の172となる周波数がピークの左右で異
なる場合、左右のIM波数ω8.ω、よりとする。
なる場合、左右のIM波数ω8.ω、よりとする。
■S (j”)の複数の周波数点5(fl)について(
30)大同様の計算を行い減衰率aの平均減衰率を求め
る。
30)大同様の計算を行い減衰率aの平均減衰率を求め
る。
等としてもよい。また、得られた複数個の2次フィルタ
が零点を表わす場合についても式(30)の分子1分母
が入換るだけであり、同様の演算により2次フィルタを
総合することができる。
が零点を表わす場合についても式(30)の分子1分母
が入換るだけであり、同様の演算により2次フィルタを
総合することができる。
第24図は上記の方法の具体例である。入力端子LOよ
り入力した複数個の2次フィルタの係数より、変換回路
38で総合周波数特性に変換される。回路39は、総合
周波数特性からピーク周波数とピーク1.s(ω0)お
よび他の任意の周波数ω1における値S(ω、)を抽出
する。減衰車算出回蕗40はS(ω。)、S(ω、)よ
り式(30)を用いて減衰藁Bを計算する。利得Aを求
める場合は式(27)においてω、=ω。、F、(ω。
り入力した複数個の2次フィルタの係数より、変換回路
38で総合周波数特性に変換される。回路39は、総合
周波数特性からピーク周波数とピーク1.s(ω0)お
よび他の任意の周波数ω1における値S(ω、)を抽出
する。減衰車算出回蕗40はS(ω。)、S(ω、)よ
り式(30)を用いて減衰藁Bを計算する。利得Aを求
める場合は式(27)においてω、=ω。、F、(ω。
)=S(ω。)および求めたBを代入して計算する。出
力端子11から総合2次フィルタの係数ω。、Bおよび
人が出力される。
力端子11から総合2次フィルタの係数ω。、Bおよび
人が出力される。
ここで自己相関関数のピッチ同期分析から、ホルマント
遷移に関する情報を得ることができることを説明する。
遷移に関する情報を得ることができることを説明する。
自己相関関数R(IT)は原信号の周期性を保存したま
ま、位相情報を落としたものである。本来、それは余弦
波の集合で表すことができる。したがつて、有声音の場
合には自己相関関数R(iT)は1/2ピッチ点におい
て、対称となる。ところが、実際の音声(連続発声蓄声
)では対称とならない場合が多い。すなわら、正弦波成
分を含む。第6図に示す例も1/2ピッチ点において非
対称となっている。この原因はホルマントの遷移で説明
することができる。
ま、位相情報を落としたものである。本来、それは余弦
波の集合で表すことができる。したがつて、有声音の場
合には自己相関関数R(iT)は1/2ピッチ点におい
て、対称となる。ところが、実際の音声(連続発声蓄声
)では対称とならない場合が多い。すなわら、正弦波成
分を含む。第6図に示す例も1/2ピッチ点において非
対称となっている。この原因はホルマントの遷移で説明
することができる。
ホルマントを与える2次フィルタのインパルス応答を
v (nT) =Bco@(ω、nT+α)(38)α
;位相偏差 とおく。ここで、ホルマントに遷移が起こり、ホルマン
ト周波fiFsに変化が生じると、この変化はインパル
ス応答に周波数変調を引き起す。周波数変調は角度菱調
であり、これtt位相変調に置き換えて考えることもで
きる。ホルマントの遷移によって生じた位相変動なθ(
nT)とおけば、位相変調インパルス応答として式(3
B)は v (nT)= B cot (IJ 、 nT+α十
〇(nT) ) (39)と表わすことができる。
;位相偏差 とおく。ここで、ホルマントに遷移が起こり、ホルマン
ト周波fiFsに変化が生じると、この変化はインパル
ス応答に周波数変調を引き起す。周波数変調は角度菱調
であり、これtt位相変調に置き換えて考えることもで
きる。ホルマントの遷移によって生じた位相変動なθ(
nT)とおけば、位相変調インパルス応答として式(3
B)は v (nT)= B cot (IJ 、 nT+α十
〇(nT) ) (39)と表わすことができる。
ホルマント周波移はこのθ(nT)K等価である。すな
わち、θ(n T)を求めれば、ホルマント遷移の詳細
を知ることができる。
わち、θ(n T)を求めれば、ホルマント遷移の詳細
を知ることができる。
インパルス応答、式(39)の自己相関関数R(iT)
はこれを正規化自己相関関数で表すならば、から計算す
ることができる。ここで、v(nT)は窓関数である。
はこれを正規化自己相関関数で表すならば、から計算す
ることができる。ここで、v(nT)は窓関数である。
これを整理すれば
R(lT)=HcriT)cosω5iT−Hs(IT
)ainωsiT (41)が得られる。ここで、H
s(iT)が0となって正弦波成分が0となるのは θ(nT) + l T)−〇(nT)=0
(44)となるとき、すなわちホルマントが遷
移しないときに限られる。ホルマント周波数の遷移は自
己相関関数(スペクトルに等価であり、以下、スペクト
ルとして説明する)K正弦波成分を発生させる。
)ainωsiT (41)が得られる。ここで、H
s(iT)が0となって正弦波成分が0となるのは θ(nT) + l T)−〇(nT)=0
(44)となるとき、すなわちホルマントが遷
移しないときに限られる。ホルマント周波数の遷移は自
己相関関数(スペクトルに等価であり、以下、スペクト
ルとして説明する)K正弦波成分を発生させる。
実際の音声においては複数個のホルマントが存在し、し
かも遷移は同時に起こることもあり、得られた正弦波成
分がどのホルマントの、どのような遷移によって引き起
こされたのかを明確な形で見出すことは難しい。そこで
、簡単な擬似せ声を使用して1つのホルマントにaυを
与え、どのような遷移がどのような正弦波成分を発生さ
せるかを整理し、明確化したのち、この結果を用いて実
際の音声におけるホルマントの遷移とスペクトルの正弦
波成分との関係を調べ、確かめる方が簡単である。
かも遷移は同時に起こることもあり、得られた正弦波成
分がどのホルマントの、どのような遷移によって引き起
こされたのかを明確な形で見出すことは難しい。そこで
、簡単な擬似せ声を使用して1つのホルマントにaυを
与え、どのような遷移がどのような正弦波成分を発生さ
せるかを整理し、明確化したのち、この結果を用いて実
際の音声におけるホルマントの遷移とスペクトルの正弦
波成分との関係を調べ、確かめる方が簡単である。
itK、擬似音声のパラメータを、第25図にそのスペ
クトルを示す。表りの擬似音声において、ホルマント周
波数1000Hz、減衰IKO,975つホルマントに
変化を与えたときのスペクトルの正弦波成分の現れ方を
調べたのがつぎの第26図〜14である。第26図はホ
ルマント周波数が1ピッチ間でLOOHzだけ高い方へ
移動した場合の例。嬉27図はホルマント周波数が1ピ
ッチ間で100Hzだけ低い方へ移動した場合、さらに
、第28図は減衰率が1ピッチ間で0.0kHzだけ増
加した場合、WcZ s図は減衰率が1ピッチ間でO,
0IHzだけ減少した場合の例である。
クトルを示す。表りの擬似音声において、ホルマント周
波数1000Hz、減衰IKO,975つホルマントに
変化を与えたときのスペクトルの正弦波成分の現れ方を
調べたのがつぎの第26図〜14である。第26図はホ
ルマント周波数が1ピッチ間でLOOHzだけ高い方へ
移動した場合の例。嬉27図はホルマント周波数が1ピ
ッチ間で100Hzだけ低い方へ移動した場合、さらに
、第28図は減衰率が1ピッチ間で0.0kHzだけ増
加した場合、WcZ s図は減衰率が1ピッチ間でO,
0IHzだけ減少した場合の例である。
第26図〜29の結果から、ホルマントや遷移はホルマ
ント帯域幅の増加(スペクトルの拡散)をもたらし、ホ
ルマント遷移によって生じたスペクトルの正弦波成分は
その正負により、表2に示すようなスペクトiI/の遷
移方向を表すことがわかる。さらに、表2 K示したス
ペクトルの正弦波成分と遷移方向の規則から、第26図
〜z9に示すスペクトルの正弦波成分の分布とホルマン
ト遷移の関係を整理したのが鉄3である。
ント帯域幅の増加(スペクトルの拡散)をもたらし、ホ
ルマント遷移によって生じたスペクトルの正弦波成分は
その正負により、表2に示すようなスペクトiI/の遷
移方向を表すことがわかる。さらに、表2 K示したス
ペクトルの正弦波成分と遷移方向の規則から、第26図
〜z9に示すスペクトルの正弦波成分の分布とホルマン
ト遷移の関係を整理したのが鉄3である。
第30因は上記遷移情報の抽出の具体例である。
入力端子7から入力した音声は自己相関関数算出回路1
9により自己相関関数R(iT)が計算される。積分区
間設定回路41は自己相関関数のフーリ、変換で、その
積分区間は有声音の場合はlピ、チ、無声音の場合は適
当な時間長とする。回路42はフーリ、変換結果から再
び自己相関関数を余弦波成分Rc、(iT)と正弦波成
分Rs(iT)IC分けて算出する。移動情報算出回路
43ではより位相情報、すなわちホルマントそして零点
の移動情報を算出する。出力端子11より結果を出力す
る。
9により自己相関関数R(iT)が計算される。積分区
間設定回路41は自己相関関数のフーリ、変換で、その
積分区間は有声音の場合はlピ、チ、無声音の場合は適
当な時間長とする。回路42はフーリ、変換結果から再
び自己相関関数を余弦波成分Rc、(iT)と正弦波成
分Rs(iT)IC分けて算出する。移動情報算出回路
43ではより位相情報、すなわちホルマントそして零点
の移動情報を算出する。出力端子11より結果を出力す
る。
ここで、これらの結果を実際の音声の例である図5に適
用する。まず、第7図の例におけるスペクトルの正弦波
成分の分布′9tllE31図に示す。表2のスペクト
ル遷移と正弦波成分の関係を用いて、第31図からつぎ
の各項が推定される。
用する。まず、第7図の例におけるスペクトルの正弦波
成分の分布′9tllE31図に示す。表2のスペクト
ル遷移と正弦波成分の関係を用いて、第31図からつぎ
の各項が推定される。
(ml第一ホルマント付近のスペクトルは低域側へ移動
する傾向にあり、したがって、第一ホルマントは低域側
へ移動する傾向にあることがわかる。以下、同様にして Qll)第二ホルマントは高域側へ移動する傾向にある
(61第一ホルマントとの境にあるスペクトルは低域側
へ移動する傾向にある。
する傾向にあり、したがって、第一ホルマントは低域側
へ移動する傾向にあることがわかる。以下、同様にして Qll)第二ホルマントは高域側へ移動する傾向にある
(61第一ホルマントとの境にあるスペクトルは低域側
へ移動する傾向にある。
(d)シたがって、第一ホルマントと第二ホルマントは
分離する (e)第三ホルマントは高域側へ移動する傾向にあり、
その帯域幅は増加する。
分離する (e)第三ホルマントは高域側へ移動する傾向にあり、
その帯域幅は増加する。
(2))第三ホルマントの一部は低域側へ移動し、第二
ホルマントと第三ホルマント間のスペクトルが高域側へ
移動することにより、第三ホルマントの低域側に新しい
ホルマントが発生する。
ホルマントと第三ホルマント間のスペクトルが高域側へ
移動することにより、第三ホルマントの低域側に新しい
ホルマントが発生する。
図中の矢印はスペクトルの遷移方向を表わす。
第3211g1K第7図に示す音声の64サンプル後の
スペクトル包絡を示す(ピッチTp=77T)。
スペクトル包絡を示す(ピッチTp=77T)。
この図から上記推定が正しいことがわかる。すなわち、
上記擬似音声について得られたホルマント遷移に関する
ff21c示す規則は実際の音声についても成り立ち、
自己相関関数(スペクトル)の正弦波成分の分布からホ
ルマント遷移の詳細を推定することができる。
上記擬似音声について得られたホルマント遷移に関する
ff21c示す規則は実際の音声についても成り立ち、
自己相関関数(スペクトル)の正弦波成分の分布からホ
ルマント遷移の詳細を推定することができる。
以上、本発明によれば音声の自己相関関数のピッチ同期
分析から正確な綜スペクトルが得られ、これを補間した
スペクトル包絡からホルマント及び零点周波数が抽出で
きること。帯域幅はホルマント周波数零点側波数近傍の
独立な線スペク小ルを用いて連立方程式をたて、これを
解いて得られた等比級数の等比の平均として抽出できる
こと。
分析から正確な綜スペクトルが得られ、これを補間した
スペクトル包絡からホルマント及び零点周波数が抽出で
きること。帯域幅はホルマント周波数零点側波数近傍の
独立な線スペク小ルを用いて連立方程式をたて、これを
解いて得られた等比級数の等比の平均として抽出できる
こと。
得られた2次フィルタの逆周波数特性を独立な線スペク
トルに乗じ、抽出したホルマント零点を遂次的に除去す
る操作な繰り返すととKよって、音声生成フィルタは2
次フィルタの縦続接続として抽出できること。また、簡
単な擬似音声について、ホルマント遷移と自己相関関数
(スペクトル)の正弦波成分との関係を求め、これを実
際の音声に適用して、スペクトルの正弦波成分の分布か
らホルマント遷移の詳細を推定できる、等の効果がある
。
トルに乗じ、抽出したホルマント零点を遂次的に除去す
る操作な繰り返すととKよって、音声生成フィルタは2
次フィルタの縦続接続として抽出できること。また、簡
単な擬似音声について、ホルマント遷移と自己相関関数
(スペクトル)の正弦波成分との関係を求め、これを実
際の音声に適用して、スペクトルの正弦波成分の分布か
らホルマント遷移の詳細を推定できる、等の効果がある
。
第1図は本発明における音声分析方式の一実施例を示す
ブロック図、 第2図は音声生成過程のモデル図、 第3図はホルマント零点抽出の処理フロー、第4図は連
続発声音声波形の一例、 第5図は第4図の音声波形の自己相関関数の一例、 第6図は音声スペクトルの一例、 tXT図はスペクトル包絡の一例、 第8図はスペクトル包絡生成のブロック構成図、第9.
10.12図はピーク検出のブロック構成図、 第11図はスペクトル包絡の接線によるピーク検出方式
を説明するための図、 第13図は零点周波数抽出のブロック構成図、第14■
は3次方程式により求められた2次フィルタの周波数特
性を示すグラフ、 第15@はホルマント及び零点帯域幅抽出のブロック構
成図、 第16図はホルマント帯域幅抽出の別の手法によるブロ
ック構成図、 第17図は零点帯域幅抽出の他の手法によるブロック構
成図、 第18図はホルマント近傍を近似する2次フィルタの周
波数特性を示すグラフ ICl3図はインパルス厄答の平均5答を示すグラフ、 第20図は第11図による2次フィルタの周波数特性を
示すグラフ、 第21図は平均周波数特性を与える2次フィルタを求め
るためのブロック構成図、 第22図は部品化された2次フィルタを求めるためのブ
ロック構成図、 第23図は2段以降の2次フィIレメが与えるスペクト
ル包絡を示すグラフ 第24図は複数fj2次フィルタの総合化を図るための
ブロック構成図、 第25図は擬似音声スペクトル、
■第26図〜第29図はホルマント周波数
の変化によるスペクトルの正弦波成分の現われ方を説明
するだめの図、 第30図は遷移情報抽出のためのブロック図、第31図
はスペクトルの正弦波成分の分布図、第32図は第7図
の音声の64サンプル後のスペクトル包絡を示す図であ
る。 革2 回 草3 g 革4 q 茎5図 茶2因 草7ば 蕃2G 革22図 表! 第24阿 $Zz因 革22廚 革2り区 蓼31図 4.72 @ 手続補正書(方式) 昭和60年λ月λCII 」ζL亙」L式V−〜−−−−− 3、補正をする者 (522)名弥富士通株式会社 1)本願明細書第55頁第5行目「(第18図参照)」
とあるのを「(第14図参照)」と補正する。 2)本願明細書第57頁第19行目「第19図に第18
囚」とあるのtr第18図に第14図」と補正する。 3)本願明細書第58頁第4行目「第20図」とあるの
を「第19図」と補正する。 4)本願明細書第58頁第6行目「第21図」とあるの
を「第20図」と補正する。 5)本鴫明+yant第61頁第20行目r第23図J
トあるのを[第22図Jと補正する。 6)本願明細書第67頁第3行目「第24図」とあるの
を「第23図」と補正する。 7)本願明細書第70頁第17行目と第18行目との間
尺次の「表1」を挿入する。 表1 8)本願明細書第70頁第18行目「第25図」とある
のt−r第24図」と補正する。 9)本願明細書第71頁第2行目「第26図〜14」と
あるのt−r第25図〜第28@」と補正する。 10)本願明細書第71頁第3行目「第26図」とある
のを「第25図」と補正する。 11)本願間!@書第71頁第5行目「27図」とある
のを「26図」と補正する。 12)本願明細書第71頁第6行目「第28」とあるの
を「第27」と補正する。 13)本願明細書第71頁第8行目「第29図」とある
のを「第28図」と補正する。 14)本願明細書第70頁第10行目「第26図〜29
」とあるのを「第25図〜第28図」と補正する。 15)本願明細書第58頁第6行目「第26図〜29」
とあるのを[第25図〜g28図」と補正する016)
本願明細書筒18行目と第19行目の間に次の「表2」
と「表3」を挿入する。 表 2 表3 17)本Jalla書@71j[ls行目rg30図」
とあるのを「第29図」と補正する。 18)本願明細11’!72j[14行0r図5J と
6るのt−r第5図]と補正する。 19)本願明細書第72頁第15行目「第31図」とあ
るのt−r第30図」と補正する。 20)本願明細書第72頁第17行目「第31図」とあ
るのtrHao口」と補正する。 21)本願明細@第73頁第14行目「第32図」とあ
るのを「第31図」と補正する。 22)本願明細書第76頁及び第77頁を次のように補
正する。 [よるブロック構成図、 第17図は零点帯域幅抽出の他の手法によるブロック構
成図、 第18図はインパルス応答の平均応答を示すグラフ、 第19図は第11図による2次フィルタの周波数特性を
示すグラフ、 第20図は平均周波数特性を与える2次フィルタを求め
るためのブロック構成図、 第21図は簡易化された2次フィルタを求めるためのブ
ロック構成図、 第22図は2段以降の2次フィルタが与えるスためのブ
ロック構成口、 第24図は擬似音声スペクトル、 第25図〜第28図はホルマント周波数の変化によるス
ペクトルの正弦波成分の現われ方を説明するための図、 @29図は遷移情報抽出のためのブロック図、第30図
はスペクトルの正弦波成分の分布図、第31崗は第7図
の音声の64サンプル後のスペクトル包絡を示す図であ
る。 1、 ゛ ′ 23)l’WW第32図を削除し、第14図、及び第1
8図〜f431図を別紙のように補正する@4I4−2
fI2] j#22目 亭24図 岑251fJ ・ 尊27図 賽23目 事29呂 革3θ図 隼31図
ブロック図、 第2図は音声生成過程のモデル図、 第3図はホルマント零点抽出の処理フロー、第4図は連
続発声音声波形の一例、 第5図は第4図の音声波形の自己相関関数の一例、 第6図は音声スペクトルの一例、 tXT図はスペクトル包絡の一例、 第8図はスペクトル包絡生成のブロック構成図、第9.
10.12図はピーク検出のブロック構成図、 第11図はスペクトル包絡の接線によるピーク検出方式
を説明するための図、 第13図は零点周波数抽出のブロック構成図、第14■
は3次方程式により求められた2次フィルタの周波数特
性を示すグラフ、 第15@はホルマント及び零点帯域幅抽出のブロック構
成図、 第16図はホルマント帯域幅抽出の別の手法によるブロ
ック構成図、 第17図は零点帯域幅抽出の他の手法によるブロック構
成図、 第18図はホルマント近傍を近似する2次フィルタの周
波数特性を示すグラフ ICl3図はインパルス厄答の平均5答を示すグラフ、 第20図は第11図による2次フィルタの周波数特性を
示すグラフ、 第21図は平均周波数特性を与える2次フィルタを求め
るためのブロック構成図、 第22図は部品化された2次フィルタを求めるためのブ
ロック構成図、 第23図は2段以降の2次フィIレメが与えるスペクト
ル包絡を示すグラフ 第24図は複数fj2次フィルタの総合化を図るための
ブロック構成図、 第25図は擬似音声スペクトル、
■第26図〜第29図はホルマント周波数
の変化によるスペクトルの正弦波成分の現われ方を説明
するだめの図、 第30図は遷移情報抽出のためのブロック図、第31図
はスペクトルの正弦波成分の分布図、第32図は第7図
の音声の64サンプル後のスペクトル包絡を示す図であ
る。 革2 回 草3 g 革4 q 茎5図 茶2因 草7ば 蕃2G 革22図 表! 第24阿 $Zz因 革22廚 革2り区 蓼31図 4.72 @ 手続補正書(方式) 昭和60年λ月λCII 」ζL亙」L式V−〜−−−−− 3、補正をする者 (522)名弥富士通株式会社 1)本願明細書第55頁第5行目「(第18図参照)」
とあるのを「(第14図参照)」と補正する。 2)本願明細書第57頁第19行目「第19図に第18
囚」とあるのtr第18図に第14図」と補正する。 3)本願明細書第58頁第4行目「第20図」とあるの
を「第19図」と補正する。 4)本願明細書第58頁第6行目「第21図」とあるの
を「第20図」と補正する。 5)本鴫明+yant第61頁第20行目r第23図J
トあるのを[第22図Jと補正する。 6)本願明細書第67頁第3行目「第24図」とあるの
を「第23図」と補正する。 7)本願明細書第70頁第17行目と第18行目との間
尺次の「表1」を挿入する。 表1 8)本願明細書第70頁第18行目「第25図」とある
のt−r第24図」と補正する。 9)本願明細書第71頁第2行目「第26図〜14」と
あるのt−r第25図〜第28@」と補正する。 10)本願明細書第71頁第3行目「第26図」とある
のを「第25図」と補正する。 11)本願間!@書第71頁第5行目「27図」とある
のを「26図」と補正する。 12)本願明細書第71頁第6行目「第28」とあるの
を「第27」と補正する。 13)本願明細書第71頁第8行目「第29図」とある
のを「第28図」と補正する。 14)本願明細書第70頁第10行目「第26図〜29
」とあるのを「第25図〜第28図」と補正する。 15)本願明細書第58頁第6行目「第26図〜29」
とあるのを[第25図〜g28図」と補正する016)
本願明細書筒18行目と第19行目の間に次の「表2」
と「表3」を挿入する。 表 2 表3 17)本Jalla書@71j[ls行目rg30図」
とあるのを「第29図」と補正する。 18)本願明細11’!72j[14行0r図5J と
6るのt−r第5図]と補正する。 19)本願明細書第72頁第15行目「第31図」とあ
るのt−r第30図」と補正する。 20)本願明細書第72頁第17行目「第31図」とあ
るのtrHao口」と補正する。 21)本願明細@第73頁第14行目「第32図」とあ
るのを「第31図」と補正する。 22)本願明細書第76頁及び第77頁を次のように補
正する。 [よるブロック構成図、 第17図は零点帯域幅抽出の他の手法によるブロック構
成図、 第18図はインパルス応答の平均応答を示すグラフ、 第19図は第11図による2次フィルタの周波数特性を
示すグラフ、 第20図は平均周波数特性を与える2次フィルタを求め
るためのブロック構成図、 第21図は簡易化された2次フィルタを求めるためのブ
ロック構成図、 第22図は2段以降の2次フィルタが与えるスためのブ
ロック構成口、 第24図は擬似音声スペクトル、 第25図〜第28図はホルマント周波数の変化によるス
ペクトルの正弦波成分の現われ方を説明するための図、 @29図は遷移情報抽出のためのブロック図、第30図
はスペクトルの正弦波成分の分布図、第31崗は第7図
の音声の64サンプル後のスペクトル包絡を示す図であ
る。 1、 ゛ ′ 23)l’WW第32図を削除し、第14図、及び第1
8図〜f431図を別紙のように補正する@4I4−2
fI2] j#22目 亭24図 岑251fJ ・ 尊27図 賽23目 事29呂 革3θ図 隼31図
Claims (1)
- 音声の特徴を2次フィルタの係数として抽出し、音声生
成フィルタを2次フィルタの縦続接続として分析する音
声分析方式であって、互いに独立な線スペクトルを補間
し、スペクトル包絡を算出する第1の手段と、ホルマン
トにあってはスペクトル包絡のピーク、零点にあっては
該線スペクトルから定めた基準線スペクトルより小さい
線スペクトル近傍のスペクトル包絡の最小値を検出する
第2の手段と、該第1の手段で検出したピーク近傍の該
線スペクトルあるいは最小値近傍の該線スペクトルと基
準線スペクトルを近似する2次フィルタの係数を抽出す
る第3の手段と、該第3の手段で得られた2次フィルタ
の逆周波数特性を該線スペクトルに乗じ、新らたな線ス
ペクトルを算出する第4の手段とを有し、有声音にあっ
てはピッチあるいはその整数倍無声音にあってはあらか
じめ定めた時間長をフ−リュ変換の積分区間として求め
た互いに独立な線スペクトルを用いて、前記第1、2、
3、4の手段における演算を繰返すことにより、2次フ
ィルタの係数抽出を行い、音声生成フィルタを2次フィ
ルタの縦続接続として分析することを特徴とする音声分
析方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59218928A JPS6197700A (ja) | 1984-10-18 | 1984-10-18 | 音声分析方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59218928A JPS6197700A (ja) | 1984-10-18 | 1984-10-18 | 音声分析方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6197700A true JPS6197700A (ja) | 1986-05-16 |
Family
ID=16727512
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59218928A Pending JPS6197700A (ja) | 1984-10-18 | 1984-10-18 | 音声分析方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6197700A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005318526A (ja) * | 2004-03-30 | 2005-11-10 | Univ Waseda | ハウリング周波数成分強調方法およびその装置、ハウリング検出方法およびその装置、ハウリング抑圧方法およびその装置、ピーク周波数成分強調方法およびその装置 |
-
1984
- 1984-10-18 JP JP59218928A patent/JPS6197700A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005318526A (ja) * | 2004-03-30 | 2005-11-10 | Univ Waseda | ハウリング周波数成分強調方法およびその装置、ハウリング検出方法およびその装置、ハウリング抑圧方法およびその装置、ピーク周波数成分強調方法およびその装置 |
JP4630956B2 (ja) * | 2004-03-30 | 2011-02-09 | 学校法人早稲田大学 | ハウリング周波数成分強調方法およびその装置、ハウリング検出方法およびその装置、ハウリング抑圧方法およびその装置、ピーク周波数成分強調方法およびその装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Steiglitz | Digital Signal Processing Primer | |
Van Immerseel et al. | Pitch and voiced/unvoiced determination with an auditory model | |
Průša et al. | A noniterative method for reconstruction of phase from STFT magnitude | |
Noll | Short‐time spectrum and “cepstrum” techniques for vocal‐pitch detection | |
Malah | Time-domain algorithms for harmonic bandwidth reduction and time scaling of speech signals | |
Søndergaard et al. | The linear time frequency analysis toolbox | |
Rao et al. | On decomposing speech into modulated components | |
US5029509A (en) | Musical synthesizer combining deterministic and stochastic waveforms | |
Allen et al. | A unified approach to short-time Fourier analysis and synthesis | |
Evangelista | Pitch-synchronous wavelet representations of speech and music signals | |
EP0853309B1 (en) | Method and apparatus for signal analysis | |
Ganapathy et al. | Robust feature extraction using modulation filtering of autoregressive models | |
US10204076B2 (en) | Method for analyzing signals providing instantaneous frequencies and sliding Fourier transforms, and device for analyzing signals | |
JP2009134260A (ja) | 音声楽音擬似広帯域化装置と音声楽音擬似広帯域化方法、及びそのプログラムとその記録媒体 | |
Fuemmeler et al. | Techniques for the regeneration of wideband speech from narrowband speech | |
Fitz et al. | A unified theory of time-frequency reassignment | |
EP0553906B1 (en) | Method and apparatus for sound enhancement with envelopes of multiband passed signals feeding comb filters | |
Carson et al. | Sample Rate Independent Recurrent Neural Networks for Audio Effects Processing | |
Slaney | Pattern playback from 1950 to 1995 | |
JPH05281996A (ja) | ピッチ抽出装置 | |
JPS6197700A (ja) | 音声分析方式 | |
Ferreira | An odd-DFT based approach to time-scale expansion of audio signals | |
Průša et al. | Non-iterative filter bank phase (re) construction | |
JP2006505818A (ja) | オーディオ成分を生成する方法および装置 | |
US20050137730A1 (en) | Time-scale modification of audio using separated frequency bands |