JP3012272B2 - 基本周波数抽出方法 - Google Patents
基本周波数抽出方法Info
- Publication number
- JP3012272B2 JP3012272B2 JP2065914A JP6591490A JP3012272B2 JP 3012272 B2 JP3012272 B2 JP 3012272B2 JP 2065914 A JP2065914 A JP 2065914A JP 6591490 A JP6591490 A JP 6591490A JP 3012272 B2 JP3012272 B2 JP 3012272B2
- Authority
- JP
- Japan
- Prior art keywords
- fundamental frequency
- analysis
- time
- cepstrum
- window
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Description
【発明の詳細な説明】 (産業上の利用分野) 本発明は、音声や機械音等の信号波形に含まれる基本
周波数を抽出するための基本周波数抽出方法に関するも
のである。
周波数を抽出するための基本周波数抽出方法に関するも
のである。
(従来の技術) 従来、例えば音声信号の基本周波数抽出方法として
は、渡邊・正田・矢田編「マイクロコンピュータハンド
ブック」第1版(昭60−12−25)オーム社、P.904−912
に記載されるものがあった。以下、その方法を図を用い
て説明する。
は、渡邊・正田・矢田編「マイクロコンピュータハンド
ブック」第1版(昭60−12−25)オーム社、P.904−912
に記載されるものがあった。以下、その方法を図を用い
て説明する。
第2図は、従来の基本周波数抽出方法の一例を説明す
るための図である。
るための図である。
第2図において、10は信号波形、11は時間軸、12は分
析窓を示す。13は周波数軸、14はスペクトラム軸であ
る。15は信号波形の周波数成分であってスペクトル分析
の結果を示し、15aは基本周波数、15bは第2高調波、15
cは第3高調波である。16はケフレンシ軸、17はケプス
トラム軸、18は信号波形のケプストラム成分であってケ
プストラム分析の結果を示す。19は信号波形のケプスト
ラム成分のピークを示す。
析窓を示す。13は周波数軸、14はスペクトラム軸であ
る。15は信号波形の周波数成分であってスペクトル分析
の結果を示し、15aは基本周波数、15bは第2高調波、15
cは第3高調波である。16はケフレンシ軸、17はケプス
トラム軸、18は信号波形のケプストラム成分であってケ
プストラム分析の結果を示す。19は信号波形のケプスト
ラム成分のピークを示す。
従来の基本周波数抽出方法では、第2図に示すよう
に、先ず信号波形10に分析窓(一度に分析する音声の範
囲。例えば、ハニング窓)12を乗じ、離散的フーリエ変
換(以下、DTFという)を施してスペクトルの絶対値の
対数をとることで、信号波形10のスペクトル成分15を得
る。さらに、このスペクトル成分15に対して、再度DFT
を行ない、信号波形10のケプストラム成分(信号のパワ
ースペクトルの対数のフーリエ変換成分)18を得る。こ
の信号波形10のケプストラム成分18のピーク19に対応し
たケプストラムをTとし、次式で基本周波数Fを計算す
る。
に、先ず信号波形10に分析窓(一度に分析する音声の範
囲。例えば、ハニング窓)12を乗じ、離散的フーリエ変
換(以下、DTFという)を施してスペクトルの絶対値の
対数をとることで、信号波形10のスペクトル成分15を得
る。さらに、このスペクトル成分15に対して、再度DFT
を行ない、信号波形10のケプストラム成分(信号のパワ
ースペクトルの対数のフーリエ変換成分)18を得る。こ
の信号波形10のケプストラム成分18のピーク19に対応し
たケプストラムをTとし、次式で基本周波数Fを計算す
る。
F=1/T ……(1) このように、従来のケプストラムによる基本周波数抽
出方法では、基本周波数(第2図の15a)とその高調波
成分(第2図の第2高調波15b、第3高調波15c等)がス
ペクトル上に明確に現れるように分析窓12の長さは、少
なくとも基本周期の3倍以上の大きさのものを用いてDF
Tを行なう。そして、その対数化したものをさらにDFTに
よってケプストラム成分18を求め、このケプストラム成
分18のピーク19の位置から、基本周波数Fを抽出してい
た。
出方法では、基本周波数(第2図の15a)とその高調波
成分(第2図の第2高調波15b、第3高調波15c等)がス
ペクトル上に明確に現れるように分析窓12の長さは、少
なくとも基本周期の3倍以上の大きさのものを用いてDF
Tを行なう。そして、その対数化したものをさらにDFTに
よってケプストラム成分18を求め、このケプストラム成
分18のピーク19の位置から、基本周波数Fを抽出してい
た。
(発明が解決しようとする課題) しかしながら、従来の基本周波数抽出方法では、基本
周波数Fのわずかな変動が抽出できないという問題があ
った。即ち、従来の方法では、ケプストラム法により、
基本周波数Fを抽出していたため、信号波形10のピーク
に相当するものが窓関数の中心部に少なくとも2つ存在
し(第2図の分析窓12内における信号波形10のピーク数
は4つ)、スペクトル上に基本周波数(第2図の15a)
とその高調波成分(第2図の15b,15c等)が明確に現れ
ていなければならなかった。そのため、分析窓12の長さ
は、少なくとも基本周波数の3倍以上なければ基本周波
数Fを安定に求められない。従って、長い分析窓を用い
るため、基本周波数Fが急激に変化している場合には、
その変化の様子を忠実に分析することができず、それを
解決することが困難であった。
周波数Fのわずかな変動が抽出できないという問題があ
った。即ち、従来の方法では、ケプストラム法により、
基本周波数Fを抽出していたため、信号波形10のピーク
に相当するものが窓関数の中心部に少なくとも2つ存在
し(第2図の分析窓12内における信号波形10のピーク数
は4つ)、スペクトル上に基本周波数(第2図の15a)
とその高調波成分(第2図の15b,15c等)が明確に現れ
ていなければならなかった。そのため、分析窓12の長さ
は、少なくとも基本周波数の3倍以上なければ基本周波
数Fを安定に求められない。従って、長い分析窓を用い
るため、基本周波数Fが急激に変化している場合には、
その変化の様子を忠実に分析することができず、それを
解決することが困難であった。
本発明は、前記従来技術が持っていた課題として、基
本周波数の変化の様子を忠実に分析できないという点に
ついて解決した基本周波数抽出方法を提供するものであ
る。
本周波数の変化の様子を忠実に分析できないという点に
ついて解決した基本周波数抽出方法を提供するものであ
る。
(課題を解決するための手段) 前記課題を解決するために、第1の発明は、信号波形
を分析窓を用いて分析し、該信号波形に含まれる基本周
波数を抽出する基本周波数抽出方法において、比較的長
い第1の時間区間で求めた基本周波数のもとに、分析窓
関数を設定し、この分析窓関数を用いた短い第2の時間
区間においてケプストラム分析を行い、僅かに時刻を移
動させながら分析を繰り返し、推定した基本周波数成分
に相応するケプストラム成分が極小となるような分析窓
の中心の時刻を駆動インパルス基準時刻とし、該駆動イ
ンパルス基準時刻の間隔から基本周波数成分を抽出する
ものである。
を分析窓を用いて分析し、該信号波形に含まれる基本周
波数を抽出する基本周波数抽出方法において、比較的長
い第1の時間区間で求めた基本周波数のもとに、分析窓
関数を設定し、この分析窓関数を用いた短い第2の時間
区間においてケプストラム分析を行い、僅かに時刻を移
動させながら分析を繰り返し、推定した基本周波数成分
に相応するケプストラム成分が極小となるような分析窓
の中心の時刻を駆動インパルス基準時刻とし、該駆動イ
ンパルス基準時刻の間隔から基本周波数成分を抽出する
ものである。
第2の発明では、第1の発明において、前記分析の繰
り返しを行う上で、移動量は最初は大きな値に初期設定
しておき、大まかな駆動インパルス基準時刻を求めた後
に、移動量を徐々に小さくしてゆくことにより、駆動イ
ンパルス基準時刻を求めるようにしたものである。
り返しを行う上で、移動量は最初は大きな値に初期設定
しておき、大まかな駆動インパルス基準時刻を求めた後
に、移動量を徐々に小さくしてゆくことにより、駆動イ
ンパルス基準時刻を求めるようにしたものである。
第3の発明では、第1の発明において、前記分析の繰
り返しを行う上で、最初に求めた駆動インパルス基準時
刻から次の駆動インパルス基準時刻の位置を予測し、分
析を行う時刻の移動範囲を予測した位置の周辺に限定し
たものである。
り返しを行う上で、最初に求めた駆動インパルス基準時
刻から次の駆動インパルス基準時刻の位置を予測し、分
析を行う時刻の移動範囲を予測した位置の周辺に限定し
たものである。
(作 用) 第1の発明によれば、以上のように基本周波数抽出方
法を構成したので、信号波形の基本周波数を抽出する場
合、比較的長い第1の時間区間で求めた基本周波数を求
め、その基本周波数に基づき、分析窓関数を設定する。
この基本周波数を求める方法には、ケプストラム法、自
己相関法等の種々の方法を用いることができる。
法を構成したので、信号波形の基本周波数を抽出する場
合、比較的長い第1の時間区間で求めた基本周波数を求
め、その基本周波数に基づき、分析窓関数を設定する。
この基本周波数を求める方法には、ケプストラム法、自
己相関法等の種々の方法を用いることができる。
例えば、ケプストラム法を用いる場合、まず最初に、
比較的長い時間区間の窓関数を用いてケプストラム分析
を行ない、精度の低い分析を行う。例えば音声信号の場
合には、およそ50Hzから500Hzを想定して考えうる最も
長い基本周期の4倍程度の時間区間の窓関数を用いたDF
Tを行う。さらに、スペクトラムの対数をとり、再度DFT
を行い、ケプストラムを求めれば、比較的長い第1の時
間区間の基本周波数が基まる。基本周期に対応したケプ
ストラム成分には、ピークが生ずるので、このピークを
検出し、そのケフレンシ位置の例えば2倍の長さの分析
窓を用いることにより、分析窓関数の設定を行なう。
比較的長い時間区間の窓関数を用いてケプストラム分析
を行ない、精度の低い分析を行う。例えば音声信号の場
合には、およそ50Hzから500Hzを想定して考えうる最も
長い基本周期の4倍程度の時間区間の窓関数を用いたDF
Tを行う。さらに、スペクトラムの対数をとり、再度DFT
を行い、ケプストラムを求めれば、比較的長い第1の時
間区間の基本周波数が基まる。基本周期に対応したケプ
ストラム成分には、ピークが生ずるので、このピークを
検出し、そのケフレンシ位置の例えば2倍の長さの分析
窓を用いることにより、分析窓関数の設定を行なう。
次に、前記で求めた分析窓関数を用いた短い第2の時
間区間においてケプストラム分析を行い、基本周波数成
分を抽出する。具体的には、例えば前記の基本周期に対
応した分析窓の中心時刻をずらしながら、前記と同様の
ケプストラム分析を行い、推定した基本周波数成分に相
当するケプストラム成分が最小となるように調整する。
この時刻を駆動インパルス基準時刻とし、前後の駆動イ
ンパルス基準時刻についても同様な方法で時刻を求め、
その間隔から基本周波数を求めれば、信号波形の基本周
波数が急激に変化している場合にも、その変化の様子を
忠実に分析することが可能となる。
間区間においてケプストラム分析を行い、基本周波数成
分を抽出する。具体的には、例えば前記の基本周期に対
応した分析窓の中心時刻をずらしながら、前記と同様の
ケプストラム分析を行い、推定した基本周波数成分に相
当するケプストラム成分が最小となるように調整する。
この時刻を駆動インパルス基準時刻とし、前後の駆動イ
ンパルス基準時刻についても同様な方法で時刻を求め、
その間隔から基本周波数を求めれば、信号波形の基本周
波数が急激に変化している場合にも、その変化の様子を
忠実に分析することが可能となる。
第2の発明では、第1の発明に於ける分析の繰り返し
を行う上で、移動量を最初は大きな値に設定しておき、
大まかな駆動インパルス基準時刻を求めた後に、移動量
を徐々に小さくしていくことにより、分析のための計算
量の低減化が図れる。
を行う上で、移動量を最初は大きな値に設定しておき、
大まかな駆動インパルス基準時刻を求めた後に、移動量
を徐々に小さくしていくことにより、分析のための計算
量の低減化が図れる。
第3の発明では、第1の発明における分析の繰り返し
を行う上で、最初に求めた駆動インパルス基準時刻から
次の駆動インパルス基準時刻の位置を予測し、分析を行
なう時刻の移動範囲を予測した位置の周辺に限定するこ
とにより、基本周波数の高調波の影響を受けることな
く、正確な基本周波数の抽出が可能となる。
を行う上で、最初に求めた駆動インパルス基準時刻から
次の駆動インパルス基準時刻の位置を予測し、分析を行
なう時刻の移動範囲を予測した位置の周辺に限定するこ
とにより、基本周波数の高調波の影響を受けることな
く、正確な基本周波数の抽出が可能となる。
従って、前記課題を解決できるのである。
(実施例) 第1図(1),(2)は、本発明の第1の実施例を示
す音声の基本周波数抽出方法を説明するための図であ
り、この図を参照しつつ本実施例の基本周波数抽出方法
を説明する。
す音声の基本周波数抽出方法を説明するための図であ
り、この図を参照しつつ本実施例の基本周波数抽出方法
を説明する。
先ず、音声信号の波形を入力し、この入力波形を例え
ば12.5KHzのサンプリング周期でディジタル値に変換す
る。次に、音声の基本周波数の最低値が50Hz程度である
ことを考え合わせ、その基本周期の4倍程度の時間窓を
予備的にコンピュータ等で計算する。以降、この時間窓
を「仮時間窓」と称する。本実施例では、例えば256サ
ンプルのハニング窓を仮時間窓として用いる。音声波形
及び窓関数の一例が第1図(1)(a)に示されてい
る。ここで、第1図(1)(a)の100は音声波形、110
は仮時間窓である。
ば12.5KHzのサンプリング周期でディジタル値に変換す
る。次に、音声の基本周波数の最低値が50Hz程度である
ことを考え合わせ、その基本周期の4倍程度の時間窓を
予備的にコンピュータ等で計算する。以降、この時間窓
を「仮時間窓」と称する。本実施例では、例えば256サ
ンプルのハニング窓を仮時間窓として用いる。音声波形
及び窓関数の一例が第1図(1)(a)に示されてい
る。ここで、第1図(1)(a)の100は音声波形、110
は仮時間窓である。
このときの仮時間窓110の窓関数Wは、次式で求めら
れる。
れる。
W=0.5+0.5×cos(i/(Ip+2))(-Ip/2<i<Ip/2) =0(i<−Ip/2,i>Ip/2) ……(2) この仮時間窓110を入力波形である音声波形100と乗
じ、仮時間窓110の例えば4倍の長さのサンプル数に対
するDFTを行う。本実施例では、例えば1024のサンプル
数のDFTを高速フーリエ変換(以下、FFTという)アルゴ
リズムを用いて行う。
じ、仮時間窓110の例えば4倍の長さのサンプル数に対
するDFTを行う。本実施例では、例えば1024のサンプル
数のDFTを高速フーリエ変換(以下、FFTという)アルゴ
リズムを用いて行う。
DFTによって得られた複数スペクトラムの絶対値を対
数化したものが第1図(1)(b)に示されている。こ
の第1図(1)(b)の対数化スペクトラムをさらにDF
Tし、複素ケプストラムを求める。この複素ケプストラ
ムの絶対値をとったものが第1図(1)(c)に示され
ている。ここで、音声の基本周期として考え得る範囲の
ケプストラム成分の中で最も大きなものを仮の基本周期
Tpとする。
数化したものが第1図(1)(b)に示されている。こ
の第1図(1)(b)の対数化スペクトラムをさらにDF
Tし、複素ケプストラムを求める。この複素ケプストラ
ムの絶対値をとったものが第1図(1)(c)に示され
ている。ここで、音声の基本周期として考え得る範囲の
ケプストラム成分の中で最も大きなものを仮の基本周期
Tpとする。
ここまでの処理では、ケプストラム分析による基本周
波数の抽出方法を用いたが、自己相関法や線形予測法
(LPC)等の他の方法を用いてもよい。
波数の抽出方法を用いたが、自己相関法や線形予測法
(LPC)等の他の方法を用いてもよい。
次に、前記仮の基本周期Tpの例えば2倍の幅の窓関数
を、詳細な分析を行なうための窓関数として決定する。
以降、この時間窓を「掃引時間窓」と称する。掃引時間
窓の窓関数Wpも、前記の仮時間窓110と同様に、次式で
求められる。
を、詳細な分析を行なうための窓関数として決定する。
以降、この時間窓を「掃引時間窓」と称する。掃引時間
窓の窓関数Wpも、前記の仮時間窓110と同様に、次式で
求められる。
Wp=0.5+0.5×cos(i/(Tp+2))(-Tp/2<i<Ip/2) =0(i<−Tp/2,i>Tp/2) ……(3) この掃引時間窓を用いて、時間軸上のある窓の位置に
おけるケプストラム分析を行う。この分析方法を第1図
(2)を用いて以下説明する。
おけるケプストラム分析を行う。この分析方法を第1図
(2)を用いて以下説明する。
第1図(2)において、200は時間軸、201は入力波形
である音声波形、202は周波数軸、203はスペクトラム
軸、204はケフレンシ軸、205はケプストラム軸を示す。
また、第1図(2)(a)の210は、現在分析している
掃引時間窓を示す。
である音声波形、202は周波数軸、203はスペクトラム
軸、204はケフレンシ軸、205はケプストラム軸を示す。
また、第1図(2)(a)の210は、現在分析している
掃引時間窓を示す。
本実施例では、この第1図(2)(a)の掃引時間窓
210より大きな例えば1024のサンプル数のDFTをFFTアル
ゴリズムを用いて行う。DFTによって得られた複素スペ
クトラムの絶対値を対数化したものが符号213に示され
ている。この対数化スペクトル213をさらにDFTし、複素
ケプストラムを求める。この複素ケプストラムの絶対値
をとったものが符号214に示されている。
210より大きな例えば1024のサンプル数のDFTをFFTアル
ゴリズムを用いて行う。DFTによって得られた複素スペ
クトラムの絶対値を対数化したものが符号213に示され
ている。この対数化スペクトル213をさらにDFTし、複素
ケプストラムを求める。この複素ケプストラムの絶対値
をとったものが符号214に示されている。
ここで、第1図(2)(a)に対応する仮の基本周期
Tp付近に相当するケプストラム成分の最大値をLm(0)
とする。本実施例では、基本周期Tpの上下1サンプルの
範囲内での最大値をとる。
Tp付近に相当するケプストラム成分の最大値をLm(0)
とする。本実施例では、基本周期Tpの上下1サンプルの
範囲内での最大値をとる。
次に、第1図(2)(b)に示すように、掃引時間窓
210の位置を1サンプルだけ時間的に後方に移動させて
同様の分析を行ない、仮の基本周波数Tp付近に相当する
ケプストラム成分の最大値をLm(1)とする。このよう
な処理を、第1図(2)(c),(B−1)に示すよう
に、所望の分析区間(サンプル数N)の総てにわたって
行い、ケプストラムLm(i)(i=1,2,……,N)を得
る。このようにして求められたケプストラムLm(i)の
一例が第1図(2)の符号295で示されている。
210の位置を1サンプルだけ時間的に後方に移動させて
同様の分析を行ない、仮の基本周波数Tp付近に相当する
ケプストラム成分の最大値をLm(1)とする。このよう
な処理を、第1図(2)(c),(B−1)に示すよう
に、所望の分析区間(サンプル数N)の総てにわたって
行い、ケプストラムLm(i)(i=1,2,……,N)を得
る。このようにして求められたケプストラムLm(i)の
一例が第1図(2)の符号295で示されている。
第1図(2)において、290は移動量軸、291はケプス
トラム成分の最大値の軸を示す。第1図(2)(b)に
示すように、掃引時間窓210の中心に分析波形のピーク
が一致した時には、掃引窓関数の内部の波形の周期性は
最も小さくなり、基本周波数に対応するケフレンシにお
けるケプストラムLmは極小値を示す。このときの掃引時
間窓210の中心の時刻を仮に「インパルス基準時刻」と
称する。
トラム成分の最大値の軸を示す。第1図(2)(b)に
示すように、掃引時間窓210の中心に分析波形のピーク
が一致した時には、掃引窓関数の内部の波形の周期性は
最も小さくなり、基本周波数に対応するケフレンシにお
けるケプストラムLmは極小値を示す。このときの掃引時
間窓210の中心の時刻を仮に「インパルス基準時刻」と
称する。
一方、第1図(2)(a)(c)に示すように、前記
以外の位置に掃引時間窓210がある場合、掃引時間窓210
の内部には音声波形201の2つのピークが含まれるため
に、基本周波数に対応するケフレンシにおけるケプスト
ラムLmは大きな値をとる。従って、第1図(2)(b)
のインパルス基準時刻から、第1図(2)(b−1)に
示す次のインパルス基準時刻までのサンプル数Nxに相当
する時間が、この時点における精密な基本周期であり、
基本周波数Fxはその逆数として求められる。サンプル数
Nxから基本周波数Fxを求める計算式は、次のようにな
る。
以外の位置に掃引時間窓210がある場合、掃引時間窓210
の内部には音声波形201の2つのピークが含まれるため
に、基本周波数に対応するケフレンシにおけるケプスト
ラムLmは大きな値をとる。従って、第1図(2)(b)
のインパルス基準時刻から、第1図(2)(b−1)に
示す次のインパルス基準時刻までのサンプル数Nxに相当
する時間が、この時点における精密な基本周期であり、
基本周波数Fxはその逆数として求められる。サンプル数
Nxから基本周波数Fxを求める計算式は、次のようにな
る。
Fx=Fs/Nx ……(4) 但し、Fs;サンプリング周波数 以上のように、この第1の実施例では、比較的長い第
1の時間区間によって基本周波数を求めた後、その基本
周波数の2倍の第2の時間区間の入力波形から基本周波
数Fxを求めるので、音声波形100の基本周波数が急激に
変化している場合にも、その変化の様子を忠実に分析す
ることができ、基本周波数の高精度な抽出が行えるとい
う利点を有している。
1の時間区間によって基本周波数を求めた後、その基本
周波数の2倍の第2の時間区間の入力波形から基本周波
数Fxを求めるので、音声波形100の基本周波数が急激に
変化している場合にも、その変化の様子を忠実に分析す
ることができ、基本周波数の高精度な抽出が行えるとい
う利点を有している。
第3図は、本発明の第2の実施例を示す基本周波数抽
出方法を説明するための図である。
出方法を説明するための図である。
第3図において、300は移動量軸、310はケフレンシ成
分の最大値の軸、320は極小値の点、330はインパルス基
準位置を示す。
分の最大値の軸、320は極小値の点、330はインパルス基
準位置を示す。
第1の実施例では、掃引時間窓210の位置を1サンプ
ルだけ時間的に後方に移動させながら分析を行なった
が、分析を行ううえで、移動量を最初は大きな値に設定
しておき、大まかな駆動インパルス基準時刻を求めた後
に移動量を徐々に小さくしてゆくことが、分析のための
計算量を低減するために好適である。以下、この方法を
第3図を用いて説明する。
ルだけ時間的に後方に移動させながら分析を行なった
が、分析を行ううえで、移動量を最初は大きな値に設定
しておき、大まかな駆動インパルス基準時刻を求めた後
に移動量を徐々に小さくしてゆくことが、分析のための
計算量を低減するために好適である。以下、この方法を
第3図を用いて説明する。
まず、第3図(a)に示すように、仮の基本周波数Tp
から移動量の初期値M0を次式で求める。
から移動量の初期値M0を次式で求める。
M0=Tp/2 ……(5) この移動量の初期値M0を分析の間隔として第1回目の
インパルス基準時刻の推定を大まかな形で行なう。つま
り、ケプストラムLm(0)、Lm(M0)、Lm(2・M0)、
…を求める。このような処理を仮に「0番目のステージ
の処理」と称する。この処理で求められたケプストラム
Lmの系列が第3図(b)に示されている。
インパルス基準時刻の推定を大まかな形で行なう。つま
り、ケプストラムLm(0)、Lm(M0)、Lm(2・M0)、
…を求める。このような処理を仮に「0番目のステージ
の処理」と称する。この処理で求められたケプストラム
Lmの系列が第3図(b)に示されている。
前記系列のうち、極小値を示す点320を基準にし、次
のステージの処理を行う。ここで、探索の範囲を点320
を中心とした区間に限定するために、次式に示すよう
に、1番目のステージの移動量M1を前のステージの移動
量M0の半分とする。移動量M0が奇数の場合には、移動量
M1に0.5を加える。
のステージの処理を行う。ここで、探索の範囲を点320
を中心とした区間に限定するために、次式に示すよう
に、1番目のステージの移動量M1を前のステージの移動
量M0の半分とする。移動量M0が奇数の場合には、移動量
M1に0.5を加える。
M1=M0/2 M0:偶数 M1=M0/2+0.5 M0:奇数 ……(6) この移動量M1を用いて点320を中心にした2点におけ
るケフレンシ成分の最大値の推定を行う。つまり、ここ
で0番目のステージのケプストラムLm(2・M0)に極小
値が見られた場合には、ケプストラムLm(2・M0+M1)
とLm(2・M0−M1)を求める。そして、これら3点のう
ちで最も小さな値を持った点を中心にして、さらに移動
量を小さくした2番目のステージの処理を行なう。
るケフレンシ成分の最大値の推定を行う。つまり、ここ
で0番目のステージのケプストラムLm(2・M0)に極小
値が見られた場合には、ケプストラムLm(2・M0+M1)
とLm(2・M0−M1)を求める。そして、これら3点のう
ちで最も小さな値を持った点を中心にして、さらに移動
量を小さくした2番目のステージの処理を行なう。
以上のような処理を移動量Mj(j=0,1,2,……)が所
望の精度まで小さくなるまで続けることにより、所望の
精度でインパルス基準位置330が求まる。
望の精度まで小さくなるまで続けることにより、所望の
精度でインパルス基準位置330が求まる。
この第2の実施例の方法によれば、移動量1で総ての
サンプルにおける処理を行う場合に比べて、計算量を著
しく低減させることができる。
サンプルにおける処理を行う場合に比べて、計算量を著
しく低減させることができる。
第4図は、本発明の第3の実施例を示す基本周波数抽
出方法を説明するための図である。
出方法を説明するための図である。
第4図において、400は移動量軸、410はケフレンシ成
分の最大値の軸、420は最小値の点、430はインパルス基
準時刻を示す。
分の最大値の軸、420は最小値の点、430はインパルス基
準時刻を示す。
第1の実施例において、基本周波数を求めるうえで、
その基本周波数の高調波の影響を取り除くために、前記
分析の繰り返しを行う上で、最初に求めた駆動インパル
ス基準時刻から次の駆動インパルス駆動時刻の位置を予
測し、分析を行う時刻の移動範囲を予測した位置の周辺
に限定した処理を行なうのが好適である。以下、この方
法を第4図を参照しつつ説明する。
その基本周波数の高調波の影響を取り除くために、前記
分析の繰り返しを行う上で、最初に求めた駆動インパル
ス基準時刻から次の駆動インパルス駆動時刻の位置を予
測し、分析を行う時刻の移動範囲を予測した位置の周辺
に限定した処理を行なうのが好適である。以下、この方
法を第4図を参照しつつ説明する。
第4図において、最初に求めたインパルス基準時刻の
位置をQとする。この位置Qと仮の基本周波数Tpから、
次のインパルス基準時刻をQ+Tpと予測する。さらに、
分析の間隔として、隣接するインパルス基準時刻の推定
を大まかな形で行う。つまり、第4図(a)に示すよう
に、移動量A0を探索の幅として仮の基本周期Tpから次式
で計算する。
位置をQとする。この位置Qと仮の基本周波数Tpから、
次のインパルス基準時刻をQ+Tpと予測する。さらに、
分析の間隔として、隣接するインパルス基準時刻の推定
を大まかな形で行う。つまり、第4図(a)に示すよう
に、移動量A0を探索の幅として仮の基本周期Tpから次式
で計算する。
A0=R・Tp …(7) 但し、R:探索する範囲を決定する定数、本実施例では
0.25 この移動量A0を用いて、先ずケプストラムLm(Q+Tp
+A0)、Lm(Q+Tp)、Lm(Q+Tp−A0)を求める。こ
れらの処理を仮に「0番目のステージの処理」と称す
る。この処理で求められたケプストラムLmの系列が第4
図(b)に示されている。
0.25 この移動量A0を用いて、先ずケプストラムLm(Q+Tp
+A0)、Lm(Q+Tp)、Lm(Q+Tp−A0)を求める。こ
れらの処理を仮に「0番目のステージの処理」と称す
る。この処理で求められたケプストラムLmの系列が第4
図(b)に示されている。
前記系列のうち、最も値の小さな点420を基準にし、
次のステージの処理を行う。ここで、次式に示すよう
に、探索の範囲を点420を中心とした区間に限定するた
めに、1番目のステージの移動量A1を前のステージの移
動量A0の半分とする。移動量A0が奇数の場合には、移動
量A1に0.5を加える。
次のステージの処理を行う。ここで、次式に示すよう
に、探索の範囲を点420を中心とした区間に限定するた
めに、1番目のステージの移動量A1を前のステージの移
動量A0の半分とする。移動量A0が奇数の場合には、移動
量A1に0.5を加える。
A1=A0/2 A0;偶数 A1=A0/2+0.5 A0;奇数 ……(8) この移動量A1を用いて点420を中心にした2点におけ
るラグ成分の最大値の推定を行なう。つまり、ここで0
番目のステージのLm(Q+Tp)に極小値が見られた場合
には、Lm(Q+Tp−A1)とLm(Q+Tp+A1)を求める。
そして、これら3点のうちで最も小さな値を持った点を
中心にして、さらに移動量を小さくした2番目のステー
ジの処理を行う。
るラグ成分の最大値の推定を行なう。つまり、ここで0
番目のステージのLm(Q+Tp)に極小値が見られた場合
には、Lm(Q+Tp−A1)とLm(Q+Tp+A1)を求める。
そして、これら3点のうちで最も小さな値を持った点を
中心にして、さらに移動量を小さくした2番目のステー
ジの処理を行う。
以上のような処理を移動量Aj(j=0,1,2,……)が所
望の精度まで小さくなるまで続けることにより、所望の
精度でインパルス基準時刻430が求まる。
望の精度まで小さくなるまで続けることにより、所望の
精度でインパルス基準時刻430が求まる。
以上のような処理をこれ以降のインパルス基準時刻に
ついても行い、総てのインパルス基準時刻を求めること
により、その周期から正確な基本周波数を求めることが
できる。
ついても行い、総てのインパルス基準時刻を求めること
により、その周期から正確な基本周波数を求めることが
できる。
この第3の実施例の方法によれば、インパルス基準時
刻の探索範囲を基本周期付近に限定しているために、基
本周波数の高調波の影響を受けることなく、より正確な
基本周波数を求めることができる。
刻の探索範囲を基本周期付近に限定しているために、基
本周波数の高調波の影響を受けることなく、より正確な
基本周波数を求めることができる。
なお、本発明は図示の実施例に限定されず、種々の変
形が可能であり、さらに本発明を音声信号以外の機械音
等といった種々の信号波形における基本周波数の抽出に
適応可能である。
形が可能であり、さらに本発明を音声信号以外の機械音
等といった種々の信号波形における基本周波数の抽出に
適応可能である。
(発明の効果) 以上詳細に説明したように、第1の発明によれば、比
較的長い第1の時間区間を用いて基本周波数を求め、そ
の後、その基本周波数の所定倍の第2の時間区間の入力
波形から、基本周波数を求めるので、基本周波数が急激
に変化している場合にも、その変化の様子を忠実に分析
することができ、基本周波数の精度の高い抽出が行え
る。
較的長い第1の時間区間を用いて基本周波数を求め、そ
の後、その基本周波数の所定倍の第2の時間区間の入力
波形から、基本周波数を求めるので、基本周波数が急激
に変化している場合にも、その変化の様子を忠実に分析
することができ、基本周波数の精度の高い抽出が行え
る。
第2の発明によれば、分析の繰り返しを行う上で、移
動量を最初は大きな値に初期設定しておき、大まかな駆
動インパルス基準時刻を求めた後に、移動量を徐々に小
さくしてゆくことにより、移動量総てのサンプルにおけ
る処理を行う場合に比べ、分析の為の計算量を著しく低
減させることができる。
動量を最初は大きな値に初期設定しておき、大まかな駆
動インパルス基準時刻を求めた後に、移動量を徐々に小
さくしてゆくことにより、移動量総てのサンプルにおけ
る処理を行う場合に比べ、分析の為の計算量を著しく低
減させることができる。
第3の発明によれば、インパルス基準時刻の探索範囲
を基本周期付近に限定しているため、基本周波数の高調
波の影響を受けることなく、より正確な基本周波数の抽
出が行える。
を基本周期付近に限定しているため、基本周波数の高調
波の影響を受けることなく、より正確な基本周波数の抽
出が行える。
第1図(1),(2)は本発明の第1の実施例を示す基
本周波数抽出方法を説明するための図、第2図は従来の
基本周波数抽出方法を説明するための図、第3図及び第
4図は本発明の第2及び第3の実施例を示す基本周波数
抽出方法をそれぞれ説明するための図である。 100,201……音声波形、110……仮時間窓、210……掃引
時間窓、213……対数化スペクトル、214……複素スペク
トルの絶対値、330……インパルス基準位置、430……イ
ンパルス基準時刻、Tp……仮の基本周期。
本周波数抽出方法を説明するための図、第2図は従来の
基本周波数抽出方法を説明するための図、第3図及び第
4図は本発明の第2及び第3の実施例を示す基本周波数
抽出方法をそれぞれ説明するための図である。 100,201……音声波形、110……仮時間窓、210……掃引
時間窓、213……対数化スペクトル、214……複素スペク
トルの絶対値、330……インパルス基準位置、430……イ
ンパルス基準時刻、Tp……仮の基本周期。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 7/00 - 7/06 G10L 9/00 - 9/18
Claims (3)
- 【請求項1】信号波形を分析窓を用いて分析し、該信号
波形に含まれる基本周波数を抽出する基本周波数抽出方
法において、 第1の時間区間>第2の時間区間の関係にある該第1の
時間区間で求めた基本周波数をもとに、分析窓関数を設
定し、 この分析窓関数を用いた前記第2の時間区間においてケ
プストラム分析を行い、僅かに時刻を移動させながら分
析を繰り返し、推定した基本周波数成分に相応するケプ
ストラム成分が極小となるような分析窓の中心の時刻を
駆動インパルス基準時刻とし、該駆動インパルス基準時
刻の間隔から基本周波数成分を抽出することを特徴とす
る基本周波数抽出方法。 - 【請求項2】請求項1記載の基本周波数抽出方法におい
て、前記分析の繰り返しを行う上で、初期設定した移動
量に対する駆動インパルス基準時刻を求めた後、前記移
動量を徐々に小さくしてゆくことによりその移動量に対
する駆動インパルス基準時刻を求めることを特徴とする
基本周波数抽出方法。 - 【請求項3】請求項1記載の基本周波数抽出方法におい
て、 前記分析の繰り返しを行う上で、最初に求めた駆動イン
パルス基準時刻から次の駆動インパルス基準時刻の位置
を予測し、分析を行う時刻の移動範囲を予測した位置の
周辺に限定したことを特徴とする基本周波数抽出方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2065914A JP3012272B2 (ja) | 1990-03-16 | 1990-03-16 | 基本周波数抽出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2065914A JP3012272B2 (ja) | 1990-03-16 | 1990-03-16 | 基本周波数抽出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH03266900A JPH03266900A (ja) | 1991-11-27 |
JP3012272B2 true JP3012272B2 (ja) | 2000-02-21 |
Family
ID=13300715
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2065914A Expired - Fee Related JP3012272B2 (ja) | 1990-03-16 | 1990-03-16 | 基本周波数抽出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3012272B2 (ja) |
-
1990
- 1990-03-16 JP JP2065914A patent/JP3012272B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH03266900A (ja) | 1991-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101110141B1 (ko) | 주기 신호 처리 방법, 주기 신호 변환 방법, 주기 신호 처리 장치, 및 주기 신호의 분석 방법 | |
Plante et al. | Improvement of speech spectrogram accuracy by the method of reassignment | |
US7593847B2 (en) | Pitch detection method and apparatus | |
Sebastian et al. | Group delay based music source separation using deep recurrent neural networks | |
US8942977B2 (en) | System and method for speech recognition using pitch-synchronous spectral parameters | |
JP3251555B2 (ja) | 信号分析装置 | |
JP4217616B2 (ja) | 二段階ピッチ判断方法および装置 | |
Mitre et al. | Accurate and efficient fundamental frequency determination from precise partial estimates | |
JP3012272B2 (ja) | 基本周波数抽出方法 | |
Eyben et al. | Acoustic features and modelling | |
Niederjohn et al. | A zero-crossing consistency method for formant tracking of voiced speech in high noise levels | |
JP4571871B2 (ja) | 音声信号分析方法およびこの分析方法を実施する装置、この音声信号分析装置を用いた音声認識装置、この分析方法を実行するプログラムおよびその記憶媒体 | |
JP2007156337A (ja) | 音声信号分析装置、音声信号分析方法、音声信号分析プログラム、自動音声認識装置、自動音声認識方法及び自動音声認識プログラム | |
Indefrey et al. | Design and evaluation of double-transform pitch determination algorithms with nonlinear distortion in the frequency domain-preliminary results | |
JP2940835B2 (ja) | ピッチ周波数差分特徴量抽出法 | |
JP4419249B2 (ja) | 音響信号分析方法及び装置並びに音響信号処理方法及び装置 | |
Chowdhury et al. | Formant estimation from speech signal using the magnitude spectrum modified with group delay spectrum | |
CN112259063B (zh) | 一种基于音符瞬态字典和稳态字典的多音高估计方法 | |
Chang et al. | Pitch estimation of speech signal based on adaptive lattice notch filter | |
Derrien | A very low latency pitch tracker for audio to MIDI conversion | |
Bedoui et al. | Phase retrieval: Application to audio signal reconstruction | |
Daido et al. | A Fast and Accurate Fundamental Frequency Estimator Using Recursive Moving Average Filters. | |
Argenti et al. | Automatic music transcription: from monophonic to polyphonic | |
JPS6214839B2 (ja) | ||
Rajan et al. | Melody extraction from music using modified group delay functions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |