JP3605096B2 - 音声信号のピッチ周期抽出方法 - Google Patents
音声信号のピッチ周期抽出方法 Download PDFInfo
- Publication number
- JP3605096B2 JP3605096B2 JP2002190274A JP2002190274A JP3605096B2 JP 3605096 B2 JP3605096 B2 JP 3605096B2 JP 2002190274 A JP2002190274 A JP 2002190274A JP 2002190274 A JP2002190274 A JP 2002190274A JP 3605096 B2 JP3605096 B2 JP 3605096B2
- Authority
- JP
- Japan
- Prior art keywords
- section
- delay time
- sum
- pitch period
- autocorrelation coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Electrophonic Musical Instruments (AREA)
Description
【発明の属する技術分野】
この発明は、音声信号のピッチ周期抽出方法に関する。
【0002】
【従来の技術】
音声の特徴を表すパラメータの1つにピッチ周期がある。ピッチ周期を利用した音声符号化方式では、ピッチ周期をいかに正確に求めるかが再生音の品質を決定することになる。また、実時間性が要求される音声符号化方式では、処理時間が短いことが要求される。
【0003】
従来は、自己相関を用いたピッチ周期抽出方法が、ピッチ周期抽出の正確さ及び処理時間の短さの両者から見て、実時間に適したピッチ周期抽出方法の1つとされている。
【0004】
自己相関を用いたピッチ周期抽出法として、次の2つの方法が知られている。
【0005】
(1)第1方法
信号は時間制限されていると仮定し、その時間内だけに信号が存在し、その時間外では信号は常に零として自己相関(短時間自己相関)を求める。
【0006】
音声波形をデジタル音声データx(n)で表すと、短時間自己相関Rn(k)は、次式(1)で表される。
【0007】
【数1】
【0008】
ここで、Nは音声信号が存在すると仮定した時間区間であり、kは短時間自己相関Rn(k)を算出ときに音声波形を遅延させる際の遅延時間であり、N≧2kmax の関係がある。したがって、kmax =200である場合には、N≧400となる。そして、短時間自己相関Rn(k)が最大となるkの値がピッチ周期となる。
【0009】
(2)第2方法
信号は時間制限されていないと仮定し、時間長Tの基準となる区間と、ピッチ周期の存在が想定される範囲で時間のずれた時間長Tとの自己相関(変形短時間自己相関)を求める。
【0010】
音声波形をデジタル音声データx(n)で表すと、変形短時間自己相関Rn’(k)は、次式(2)で表される。
【0011】
【数2】
【0012】
ここで、Tは変形短時間自己相関Rn’(k)を算出する際の基準となる時間長であり、kは変形短時間自己相関Rn’(k)を算出ときに音声波形を遅延させる際の遅延時間であり、T≒kmax の関係がある。したがって、kmax =200である場合には、T≒200となる。そして、変形短時間自己相関Rn’(k)が最大となるkの値がピッチ周期となる。
【0013】
第1方法では、ピッチ周期を正確に抽出できるが、ピッチ周期を正確に抽出するためには、自己相関を算出する際の基準となる区間の時間長(N−1−k)を、少なくともピッチ周期の2倍以上に設定する必要があり、このため処理時間が長くなるという欠点がある。
【0014】
第2方法では、自己相関を算出する際の基準となる区間の時間長Tはピッチ周期程度とすればよく、第1方法に比べて自己相関を算出する際の基準となる区間の時間長を短くできるので、処理時間は短くなる。しかしながら、正しいピッチ周期の倍周期のピッチを、誤ってピッチ周期として抽出してしまうおそれがある。
【0015】
第1方法では、第2方法のように正しいピッチ周期の倍周期のピッチを、誤ってピッチ周期として抽出してしまうおそれは少ない。これは、第1方法では、長い周期(kが大きい)に対する自己相関係数ほど、積和区間(N−1−k)が小さくなるため、正しいピッチ周期に対する自己相関係数に比べて、その倍周期に対する自己相関係数が小さくなるからである。
【0016】
第1方法において、自己相関を算出する際の基準となる区間の時間長(N−1−k)をピッチ周期の2倍以上にする必要があるのは、ピッチ周期が短い場合(kが小さい場合)には積和区間(N−1−k)が極端に大きくなり、ピッチ周期が長い場合(kが大きい場合)には積和区間(N−1−k)が極端に小さくなるので、正しいピッチ周期が長い場合において、正しいピッチ周期に対する自己相関係数が、それより短いピッチ周期に対する自己相関係数よりも小さくならならいようにするためである。
【0017】
【発明が解決しようとする課題】
この発明は、処理時間が短くかつピッチ周期を正確に抽出できる音声信号のピッチ周期抽出方法を提供することを目的とする。
【0018】
【課題を解決する為の手段】
請求項1に記載の発明は、全遅延時間範囲を複数の区間に分割する第1ステッ プ、第1ステップで得られた各分割区間毎に、その区間の遅延時間範囲に応じて自己相関係数を算出する際の積和時間長をそれぞれ決定する第2ステップ、第1ステップで得られた各分割区間毎に、それに対して算出された積和時間長を用いて、その区間の遅延時間範囲内の遅延時間それぞれに対する自己相関係数を算出する第3ステップ、および第3ステップで算出された自己相関係数に基づいてピッチ周期を決定する第4ステップを備えた音声信号のピッチ周期抽出方法であって、第1ステップによって全遅延時間範囲が遅延時間の小さい第1区間と遅延時間がそれより大きな第2区間との2つに分割された場合には、第2ステップは、各分割区間の積和時間長を対応する分割区間の遅延時間範囲の最大値に近い値に設定するとともに、第1区間の積和時間長をT1、第2区間の積和時間長をT2とすると、2T1≒Tでかつ2T1>T2の関係が成り立つように各区間の積和時間長T1、T2を設定し、第3ステップにおいて算出される、第1区間の遅延時間kに対する自己相関係数をRn1(k)、第2区間の遅延時間kに対する自己相関係数をRn2(k)とすると、第4ステップは、Rn1(k)およびRn2(k)/2のうち、値が最大となるkをピッチ周期として決定することを特徴とする。
【0019】
請求項2に記載の発明は、全遅延時間範囲を複数の区間に分割する第1ステッ プ、第1ステップで得られた各分割区間毎に、その区間の遅延時間範囲に応じて自己相関係数を算出する際の積和時間長をそれぞれ決定する第2ステップ、第1ステップで得られた各分割区間毎に、それに対して算出された積和時間長を用いて、その区間の遅延時間範囲内の遅延時間それぞれに対する自己相関係数を算出する第3ステップ、および第3ステップで算出された自己相関係数に基づいてピッチ周期を決定する第4ステップ、を備えた音声信号のピッチ周期抽出方法であって、第1ステップによって全遅延時間範囲が遅延時間の小さい方から順に第1区間、第2区間および第3区間の3つの区間に分割された場合には、第2ステップは、各分割区間の積和時間長を対応する分割区間の遅延時間範囲の最大値に近い値に設定するとともに、第1区間の積和時間長をT1、第2区間の積和時間長をT2、第3区間の積和時間長をT3とすると、3T1≒2T2≒T3でかつ3T1>2T2>T3の関係が成り立つように各区間の積和時間長T1、T2、T3を設定し、第3ステップにおいて算出される、第1区間の遅延時間kに対する自己相関係数をRn1(k)、第2区間の遅延時間kに対する自己相関係数をRn2(k)、第3区間の遅延時間kに対する自己相関係数をRn3(k)とすると、第4ステップは、Rn1(k)、Rn2(k)/2およびRn3(k)/3のうち、値が最大となるkをピッチ周期として決定することを特徴とする。
【0020】
請求項3に記載の発明は、全遅延時間範囲を複数の区間に分割する第1ステッ プ、第1ステップで得られた各分割区間毎に、その区間の遅延時間範囲に応じて自己相関係数を算出する際の積和時間長をそれぞれ決定する第2ステップ、第1ステップで得られた各分割区間毎に、それに対して算出された積和時間長を用いて、その区間の遅延時間範囲内の遅延時間それぞれに対する自己相関係数を算出する第3ステップ、および第3ステップで算出された自己相関係数に基づいてピッチ周期を決定する第4ステップ、を備えた音声信号のピッチ周期抽出方法であって、第1ステップによって全遅延時間範囲が遅延時間の小さい方から順に第1区間、第2区間、第3区間および第4区間の4つの区間に分割された場合には、第2ステップは、各分割区間の積和時間長を対応する分割区間の遅延時間範囲の最大値に近い値に設定するとともに、第1区間の積和時間長をT1、第2区間の積和時間長をT2、第3区間の積和時間長をT3、第4区間の積和時間長をT4とすると、6T1≒3T2≒1.5T2≒T4でかつ6T1>3T2>1.5T3>T4の関係が成り立つように各区間の積和時間長T1、T2、T3、T4を設定し、第3ステップにおいて算出される、第1区間の遅延時間kに対する自己相関係数をRn1(k)、第2区間の遅延時間kに対する自己相関係数をRn2(k)、第3区間の遅延時間kに対する自己相関係数をRn3(k)、第4区間の遅延時間kに対する自己相関係数をRn4(k)とすると、第4ステップは、Rn1(k)、Rn2(k)/2、Rn3(k)/4およびRn3(k)/6のうち、値が最大となるkをピッチ周期として決定することを特徴とする。
【0021】
請求項4に記載の発明は、請求項1乃至3のいずれかに記載の音声信号のピッチ周期抽出方法において、第1ステップは、各分割区間の遅延時間の最大値が、当該区間の最小値の2倍より小さな値となるように、全遅延時間範囲を複数の区間に分割することを特徴とする。
【0024】
【発明の実施の形態】
【0025】
〔1〕本発明のピッチ周期抽出方法についての説明
【0026】
本発明のピッチ周期抽出方法について説明する。
【0027】
デジタル音声信号の自己相関係数を計算する際、全遅延時間範囲をピッチ周期の存在が想定される範囲で複数の区間に分割する。分割された各区間毎に、自己相関係数を算出する際の時間長(以下、積和時間長という)をそれぞれ決定する。そして、各区間毎に、それに対して決定された積和時間長を用いて、自己相関係数を算出し、その算出結果に基づいてピッチ周期を決定する。
【0028】
全遅延時間範囲を35≦k<200として、全遅延時間範囲を3つの区間に分割した場合を例にとって説明する。例えば、第1区間を35≦k<65とし、第2区間を65≦k<125とし、第3区間を125≦k<200とすると、各区間の自己相関係数Rn1(k)、Rn2(k)、Rn3(k)は、それぞれ次式(3)、(4)、(5)で表される。
【0029】
【数3】
【0030】
上記式(3)、(4)、(5)において、T1、T2、T3は、各区間における積和時間長を示している。
【0031】
全遅延時間範囲を分割する際には、1つの区間の遅延時間kの最大値が当該区間の遅延時間kの最小値の2倍より小さくなるように、各区間を決定する。例えば、上記第1区間であれば、その区間の遅延時間kの最大値が、当該区間の最小値35の2倍の値70より小さくなるように第1区間を決定する。
【0032】
これは、1つの区間において正しいピッチ周期とそれの2倍のピッチ周期との両方の自己相関係数を算出した場合には、正しいピッチ周期に対する自己相関係数に対して、そのピッチ周期の2倍のピッチ周期に対する自己相関係数が大きくなる可能性があるので、1つの区間において正しいピッチ周期とそのピッチ周期の2倍のピッチ周期との自己相関係数が算出されないようにするためである。
【0033】
遅延時間kの分割区間毎の積和時間長T1、T2、T3を、対応する区間の遅延時間kの最大値程度に設定するとともに、3T1≒2T2≒T3でかつ3T1>2T2>T3の関係が成り立つように設定する。上記の例では、例えば、T1=65、T2=125、T3=185となる。
【0034】
各区間の積和時間長をその区間のkの最大値程度としているのは、入力音声自己相関係数を算出する積和範囲内に、その区間での遅延時間kに対応するピッチ周期のほぼ2倍の波形が含まれるため、ピッチ周期が変化する場合にピッチ周期抽出精度が高くなるからである。
【0035】
上記3つの区間において、Rn1(k)、Rn2(k)、Rn3(k)を、その区間の各遅延時間kについて算出する。そして、Rn1(k)、Rn2(k)/2、Rn3(k)/3のうち、値が最大となるkをピッチ周期として抽出する。
【0036】
各区間の積和時間長を、3T1≒2T2≒T3でかつ3T1>2T2>T3の関係が成り立つように設定しているのは、正しいピッチ周期に対する自己相関係数がその倍周期に対する自己相関係数よりも大きくなるようにして、正しいピッチ周期の倍周期が正しいピッチ周期として誤って抽出されるのを防止するためである。
【0037】
図1および図2、図3および図4、ならびに図5および図6は、入力音声信号の波形が異なる3つの場合の具体例を示している。
【0038】
図1および図2は、遅延時間kが35≦k<200の範囲内の波形のピッチ周期Pが変化していない場合の具体例を示している。
【0039】
図1は従来手法を示し、35≦k<200の範囲に対応したLの範囲の中で、35≦k<200の範囲内の各kについて自己相関係数Rn(k)を算出している。これに対して、図2は、本発明手法を示している。
【0040】
図2(a)は上記式(3)によって表される第1区間での自己相関係数Rn1(k)の算出方法を、図2(b)は上記式(4)によって表される第2区間での自己相関係数Rn2(k)の算出方法を、図2(c)は上記式(5)によって表される第3区間での自己相関係数Rn3(k)の算出方法を、それぞれ示している。
【0041】
第1区間では、35≦k<65の範囲に対応した積和時間長T1で規定される区間L1の範囲内で、35≦k<65の範囲内の各kについて自己相関係数Rn1(k)を算出している。
【0042】
第2区間では、65≦k<125の範囲に対応した積和時間長T2で規定される区間L2の範囲内で、65≦k<125の範囲内の各kについて自己相関係数Rn2(k)を算出している。
【0043】
第3区間では、125≦k<200の範囲に対応した積和時間長T3で規定される区間L3の範囲内で、125≦k<200の範囲内の各kについて自己相関係数Rn3(k)を算出している。
【0044】
従来手法と本発明手法とを比較すると、本発明手法では、第1区間のkの範囲(35≦k<65)および第2区間のkの範囲(65≦k<125)については、自己相関係数の演算量が従来手法に比べて減っており、処理時間が短縮されることが理解できる。また、正しいピッチ周期の倍周期を、正しいピッチ周期として誤って抽出するといったことも防止できる。
【0045】
図2の例では、Rn1(k)、Rn2(k)/2、Rn3(k)/3の全ての中で、値が最大となるのは、第1区間中のk=Pの時のRn1(P)となる。したがって、ピッチ周期はPとなる。
【0046】
図3および図4は、遅延時間kが35≦k<200の範囲内の波形のピッチ周期が小(Ps)から大(Pm)に変化している場合の具体例を示している。
【0047】
図3は従来手法を示し、Lの範囲の中で、35≦k<200の範囲内の各kについて自己相関係数Rn(k)を算出している。このように、自己相関係数を算出する範囲L内に異なるピッチ周期の波形が含まれている場合には、kがピッチ周期PsまたはPmである場合に、自己相関係数Rn(k)が最大となるとは限らなくなるため、正しいピッチ周期を抽出できない可能性がある。Rn(Pm)が最大となって、ピッチ周期をPmとして抽出した場合、ピッチ周期Psの部分もピッチ周期Pmと誤認識するため、不都合が生じる。
【0048】
図4は、本発明手法を示している。図4(a)に示す第1区間では、積和時間長T1で規定される区間L1の範囲内で、35≦k<65の範囲内の各kについて自己相関係数Rn1(k)を算出している。
【0049】
図4(b)に示す第2区間では、積和時間長T2で規定される区間L2の範囲内で、65≦k<125の範囲内の各kについて自己相関係数Rn2(k)を算出している。
【0050】
図4(c)に示す第3区間では、積和時間長T3で規定される区間L3の範囲内で、125≦k<200の範囲内の各kについて自己相関係数Rn3(k)を算出している。
【0051】
図4の例では、Rn1(k)、Rn2(k)/2、Rn3(k)/3の全ての中で値が最大となるのは、自己相関係数を算出する範囲内にピッチ周期Psの波形がほぼ2つ含まれている第1区間中のk=Psの時のRn1(Ps)となる。したがって、ピッチ周期はPsとなる。したがって、ピッチ周期抽出精度が高くなる。
【0052】
図5および図6は、遅延時間kが35≦k<200の範囲内の波形のピッチ周期が大(Pm)から小(Ps)に変化している場合の具体例を示している。
【0053】
図5は従来手法を示し、Lの範囲の中で、35≦k<200の範囲内の各kについて自己相関係数Rn(k)を算出している。このように、自己相関係数を算出する範囲L内に異なるピッチ周期の波形が含まれている場合には、kがピッチ周期PsまたはPmである場合に、自己相関係数Rn(k)が最大となるとは限らなくなるため、正しいピッチ周期を抽出できない可能性がある。Rn(Ps)が最大となって、ピッチ周期をPsとして抽出した場合、ピッチ周期Pmの部分もピッチ周期Psと誤認識するため、不都合が生じる。
【0054】
図6は、本発明手法を示している。図6(a)に示す第1区間では、積和時間長T1で規定される区間L1の範囲内で、35≦k<65の範囲内の各kについて自己相関係数Rn1(k)を算出している。
【0055】
図6(b)に示す第2区間では、積和時間長T2で規定される区間L2の範囲内で、65≦k<125の範囲内の各kについて自己相関係数Rn2(k)を算出している。
【0056】
図6(c)に示す第3区間では、積和時間長T3で規定される区間L3の範囲内で、125≦k<200の範囲内の各kについて自己相関係数Rn3(k)を算出している。
【0057】
図6の例では、Rn1(k)、Rn2(k)/2、Rn3(k)/3の全ての中で値が最大となるのは、自己相関係数を算出する範囲内にピッチ周期Pmの波形がほぼ2つ含まれている第2区間中のk=Pmの時のRn2(Pm)となる。したがって、ピッチ周期はPmとなる。したがって、ピッチ周期抽出精度が高くなる。
【0058】
〔2〕ピッチ周期抽出装置の説明
【0059】
図7は、ピッチ周期抽出装置の構成を示している。
【0060】
入力音声信号は、A/D変換器1によってデジタルの音声信号に変換せしめられる。A/D変換器1によって得られたデジタル音声信号は、自己相関算出手段2に送られる。
【0061】
遅延時間分割手段3は、A/D変換器1のサンプリング周波数に基づいて、kの範囲を分割する。A/D変換器1のサンプリング周波数に基づいて、kの範囲を分割しているのは、A/D変換器1のサンプリング周波数が異なると、ピッチ周期の存在が想定されるピッチ周期範囲が同じであっても、それに対応する遅延時間kの範囲が変化するからである。
【0062】
積和時間長決定手段4は、遅延時間分割手段3によって分割された各区間に対する積和時間長(上記式(3)、(4)、(5)のT1、T2、T3に相当する)を決定する。
【0063】
自己相関算出手段2は、遅延時間分割手段3によって決定された各区間毎に、積和時間長決定手段4によって決定された積和時間長を用いて、自己相関係数を算出する。
【0064】
ピッチ周期検出手段5は、自己相関算出手段2によって算出された各区間での全ての自己相関係数に基づいて、ピッチ周期を求める。自己相関算出手段2が、上記式(3)、(4)、(5)で表されるRn1(k)、Rn2(k)、Rn3(k)を算出するものである場合には、ピッチ周期検出手段5は、Rn1(k)、Rn2(k)/2、Rn3(k)/3のうち、値が最大となるkをピッチ周期として検出する。
【0065】
〔3〕変形例の説明
【0066】
上記実施の形態では、遅延時間kの範囲を3つの区間に分割した場合の例を示したが、遅延時間を3以外の複数の区間に分割してもよい。
【0067】
〔3−1〕遅延時間kの範囲が55≦k<200である場合に、遅延時間kの範囲を2つの区間に分割する場合の例について説明する。
【0068】
例えば、第1区間を55≦k<105とし、第2区間を105≦k<200とすると、各区間の自己相関係数Rn1(k)、Rn2(k)は、それぞれ次式(6)、(7)で表される。
【0069】
【数4】
【0070】
上記式(6)、(7)において、T1、T2は、遅延時間kの各分割区間における積和時間長を示している。この場合には、遅延時間kの分割区間毎の積和時間長T1、T2を、対応する区間のkの最大値程度に設定するとともに、2T1≒T2でかつ2T1>T2の関係が成り立つように設定する。上記の例では、例えば、T1=95、T2=185となる。
【0071】
上記2つの区間において、Rn1(k)、Rn2(k)を、その区間の各遅延時間kについて算出する。そして、Rn1(k)、Rn2(k)/2のうち、値が最大となるkをピッチ周期として抽出する。
【0072】
〔3−2〕遅延時間kの範囲が29≦k<280である場合に、遅延時間kの範囲を4つの区間に分割する場合の例について説明する。
【0073】
例えば、第1区間を29≦k<53とし、第2区間を53≦k<101とし、第3区間を101≦k<197とし、第4区間を197≦k<280とすると、各区間の自己相関係数Rn1(k)、Rn2(k)は、それぞれ次式(8)、(9)、(10)、(11)で表される。
【0074】
【数5】
【0075】
上記式(8)、(9)、(10)、(11)において、T1、T2、T3、T4は、遅延時間kの各分割区間における積和時間長を示している。この場合には、遅延時間kの分割区間毎の積和時間長T1、T2、T3、T4を、対応する区間のkの最大値程度に設定するとともに、6T1≒3T2≒1.5T3≒T4でかつ6T1>3T2>1.5T3>T4の関係が成り立つように設定する。上記の例では、例えば、T1=50、T2=95、T3=185、T4=270となる。
【0076】
上記4つの区間において、Rn1(k)、Rn2(k)、Rn3(k)、Rn4(k)を、その区間の各遅延時間kについて算出する。そして、Rn1(k)、Rn2(k)/2、Rn3(k)/4、Rn4(k)/6のうち、値が最大となるkをピッチ周期として抽出する。
【0077】
【発明の効果】
この発明によれば、処理時間が短くかつピッチ周期を正確に抽出できるようになる。
【図面の簡単な説明】
【図1】遅延時間kが35≦k<200の範囲内の波形のピッチ周期Pが変化していない場合における従来手法による自己相関係数算出方法を説明するための模式図である。
【図2】入力音声信号波形が図1に示す波形である場合において、本発明手法による自己相関係数算出方法を説明するための模式図である。
【図3】遅延時間kが35≦k<200の範囲内の波形のピッチ周期が小(Ps)から大(Pm)に変化している場合における従来手法による自己相関係数算出方法を説明するための模式図である。
【図4】入力音声信号波形が図3に示す波形である場合において、本発明手法による自己相関係数算出方法を説明するための模式図である。
【図5】遅延時間kが35≦k<200の範囲内の波形のピッチ周期が大(Pm)から小(Ps)に変化している場合における従来手法による自己相関係数算出方法を説明するための模式図である。
【図6】入力音声信号波形が図5に示す波形である場合において、本発明手法による自己相関係数算出方法を説明するための模式図である。
【図7】ピッチ周期抽出装置の構成を示すブロック図である。
【符号の説明】
1 A/D変換器
2 自己相関算出手段
3 遅延時間分割手段
4 積和時間長決定手段
5 ピッチ周期検出手段
Claims (4)
- 全遅延時間範囲を複数の区間に分割する第1ステップ、
第1ステップで得られた各分割区間毎に、その区間の遅延時間範囲に応じて自 己相関係数を算出する際の積和時間長をそれぞれ決定する第2ステップ、
第1ステップで得られた各分割区間毎に、それに対して算出された積和時間長 を用いて、その区間の遅延時間範囲内の遅延時間それぞれに対する自己相関係数 を算出する第3ステップ、および
第3ステップで算出された自己相関係数に基づいてピッチ周期を決定する第4 ステップ、
を備えた音声信号のピッチ周期抽出方法であって、
第1ステップによって全遅延時間範囲が遅延時間の小さい第1区間と遅延時間がそれより大きな第2区間との2つに分割された場合には、
第2ステップは、各分割区間の積和時間長を対応する分割区間の遅延時間範囲の最大値に近い値に設定するとともに、第1区間の積和時間長をT1、第2区間の積和時間長をT2とすると、2T1≒Tでかつ2T1>T2の関係が成り立つように各区間の積和時間長T1、T2を設定し、
第3ステップにおいて算出される、第1区間の遅延時間kに対する自己相関係数をRn1(k)、第2区間の遅延時間kに対する自己相関係数をRn2(k)とすると、第4ステップは、Rn1(k)およびRn2(k)/2のうち、値が最大となるkをピッチ周期として決定することを特徴とする音声信号のピッチ周期抽出方法。 - 全遅延時間範囲を複数の区間に分割する第1ステップ、
第1ステップで得られた各分割区間毎に、その区間の遅延時間範囲に応じて自 己相関係数を算出する際の積和時間長をそれぞれ決定する第2ステップ、
第1ステップで得られた各分割区間毎に、それに対して算出された積和時間長 を用いて、その区間の遅延時間範囲内の遅延時間それぞれに対する自己相関係数 を算出する第3ステップ、および
第3ステップで算出された自己相関係数に基づいてピッチ周期を決定する第4 ステップ、
を備えた音声信号のピッチ周期抽出方法であって、
第1ステップによって全遅延時間範囲が遅延時間の小さい方から順に第1区間、第2区間および第3区間の3つの区間に分割された場合には、
第2ステップは、各分割区間の積和時間長を対応する分割区間の遅延時間範囲の最大値に近い値に設定するとともに、第1区間の積和時間長をT1、第2区間の積和時間長をT2、第3区間の積和時間長をT3とすると、3T1≒2T2≒T3でかつ3T1>2T2>T3の関係が成り立つように各区間の積和時間長T1、T2、T3を設定し、
第3ステップにおいて算出される、第1区間の遅延時間kに対する自己相関係数をRn1(k)、第2区間の遅延時間kに対する自己相関係数をRn2(k)、第3区間の遅延時間kに対する自己相関係数をRn3(k)とすると、第4ステップは、Rn1(k)、Rn2(k)/2およびRn3(k)/3のうち、値が最大となるkをピッチ周期として決定することを特徴とする音声信号のピッチ周期抽出方法。 - 全遅延時間範囲を複数の区間に分割する第1ステップ、
第1ステップで得られた各分割区間毎に、その区間の遅延時間範囲に応じて自 己相関係数を算出する際の積和時間長をそれぞれ決定する第2ステップ、
第1ステップで得られた各分割区間毎に、それに対して算出された積和時間長 を用いて、その区間の遅延時間範囲内の遅延時間それぞれに対する自己相関係数 を算出する第3ステップ、および
第3ステップで算出された自己相関係数に基づいてピッチ周期を決定する第4 ステップ、
を備えた音声信号のピッチ周期抽出方法であって、
第1ステップによって全遅延時間範囲が遅延時間の小さい方から順に第1区間、第2区 間、第3区間および第4区間の4つの区間に分割された場合には、
第2ステップは、各分割区間の積和時間長を対応する分割区間の遅延時間範囲の最大値に近い値に設定するとともに、第1区間の積和時間長をT1、第2区間の積和時間長をT2、第3区間の積和時間長をT3、第4区間の積和時間長をT4とすると、6T1≒3T2≒1.5T2≒T4でかつ6T1>3T2>1.5T3>T4の関係が成り立つように各区間の積和時間長T1、T2、T3、T4を設定し、
第3ステップにおいて算出される、第1区間の遅延時間kに対する自己相関係数をRn1(k)、第2区間の遅延時間kに対する自己相関係数をRn2(k)、第3区間の遅延時間kに対する自己相関係数をRn3(k)、第4区間の遅延時間kに対する自己相関係数をRn4(k)とすると、第4ステップは、Rn1(k)、Rn2(k)/2、Rn3(k)/4およびRn3(k)/6のうち、値が最大となるkをピッチ周期として決定することを特徴とする音声信号のピッチ周期抽出方法。 - 第1ステップは、各分割区間の遅延時間の最大値が、当該区間の最小値の2倍より小さな値となるように、全遅延時間範囲を複数の区間に分割することを特徴とする請求項1乃至3のいずれかに記載の音声信号のピッチ周期抽出方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002190274A JP3605096B2 (ja) | 2002-06-28 | 2002-06-28 | 音声信号のピッチ周期抽出方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002190274A JP3605096B2 (ja) | 2002-06-28 | 2002-06-28 | 音声信号のピッチ周期抽出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004037506A JP2004037506A (ja) | 2004-02-05 |
JP3605096B2 true JP3605096B2 (ja) | 2004-12-22 |
Family
ID=31700235
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002190274A Expired - Lifetime JP3605096B2 (ja) | 2002-06-28 | 2002-06-28 | 音声信号のピッチ周期抽出方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3605096B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101542589B (zh) * | 2006-10-13 | 2012-07-11 | 诺基亚公司 | 基音滞后估计的方法、设备和系统 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7705231B2 (en) * | 2007-09-07 | 2010-04-27 | Microsoft Corporation | Automatic accompaniment for vocal melodies |
JP2010237269A (ja) * | 2009-03-30 | 2010-10-21 | Toshiba Corp | 音声認識装置、その方法及びそのプログラム |
EP3306609A1 (en) | 2016-10-04 | 2018-04-11 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for determining a pitch information |
-
2002
- 2002-06-28 JP JP2002190274A patent/JP3605096B2/ja not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101542589B (zh) * | 2006-10-13 | 2012-07-11 | 诺基亚公司 | 基音滞后估计的方法、设备和系统 |
Also Published As
Publication number | Publication date |
---|---|
JP2004037506A (ja) | 2004-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5732994B2 (ja) | 楽曲検索装置および方法、プログラム、並びに記録媒体 | |
KR101670313B1 (ko) | 음원 분리를 위해 자동적으로 문턱치를 선택하는 신호 분리 시스템 및 방법 | |
US8892430B2 (en) | Noise detecting device and noise detecting method | |
EP1381030A1 (en) | Compression method and apparatus, decompression method and apparatus, compression/decompression system, peak detection method, program, and recording medium | |
US9002489B2 (en) | Signal processing apparatus, signal processing method, and program | |
JP2005227782A (ja) | 有声音および無声音の検出装置、並びにその方法 | |
JP2012516591A (ja) | オーディオ信号品質予測 | |
EP3979240A1 (en) | Signal extraction system, signal extraction learning method, and signal extraction learning program | |
US20050143981A1 (en) | Compressing method and apparatus, expanding method and apparatus, compression and expansion system, recorded medium, program | |
JP3605096B2 (ja) | 音声信号のピッチ周期抽出方法 | |
US5819209A (en) | Pitch period extracting apparatus of speech signal | |
US9185497B2 (en) | Method and computer program product of processing sound segment and hearing aid | |
US7398504B2 (en) | Program, method and apparatus for analyzing transmission signals | |
JP2010026323A (ja) | 話速検出装置 | |
US8306828B2 (en) | Method and apparatus for audio signal expansion and compression | |
JP2004158925A (ja) | ディジタルデータ処理装置およびディジタルデータ処理方法 | |
JP3147562B2 (ja) | 音声速度変換方法 | |
CN114007176B (zh) | 用于降低信号延时的音频信号处理方法、装置及存储介质 | |
US7337109B2 (en) | Multiple step adaptive method for time scaling | |
JP3074046B2 (ja) | 音声・楽音識別回路 | |
JP2005204020A (ja) | デジタル信号処理装置 | |
TW202226225A (zh) | 以零點交越檢測改進語音活動檢測之設備及方法 | |
AU2017438213B2 (en) | Method and apparatus for resampling audio signal | |
CN102263556A (zh) | 判断采样率的方法及其装置 | |
CN114155874A (zh) | 一种特征提取方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040615 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040622 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040823 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040921 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040930 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 3605096 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081008 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091008 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101008 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111008 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121008 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121008 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131008 Year of fee payment: 9 |
|
EXPY | Cancellation because of completion of term |