JP3605096B2 - 音声信号のピッチ周期抽出方法 - Google Patents

音声信号のピッチ周期抽出方法 Download PDF

Info

Publication number
JP3605096B2
JP3605096B2 JP2002190274A JP2002190274A JP3605096B2 JP 3605096 B2 JP3605096 B2 JP 3605096B2 JP 2002190274 A JP2002190274 A JP 2002190274A JP 2002190274 A JP2002190274 A JP 2002190274A JP 3605096 B2 JP3605096 B2 JP 3605096B2
Authority
JP
Japan
Prior art keywords
section
delay time
sum
pitch period
autocorrelation coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2002190274A
Other languages
English (en)
Other versions
JP2004037506A (ja
Inventor
健生 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2002190274A priority Critical patent/JP3605096B2/ja
Publication of JP2004037506A publication Critical patent/JP2004037506A/ja
Application granted granted Critical
Publication of JP3605096B2 publication Critical patent/JP3605096B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Electrophonic Musical Instruments (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、音声信号のピッチ周期抽出方法に関する。
【0002】
【従来の技術】
音声の特徴を表すパラメータの1つにピッチ周期がある。ピッチ周期を利用した音声符号化方式では、ピッチ周期をいかに正確に求めるかが再生音の品質を決定することになる。また、実時間性が要求される音声符号化方式では、処理時間が短いことが要求される。
【0003】
従来は、自己相関を用いたピッチ周期抽出方法が、ピッチ周期抽出の正確さ及び処理時間の短さの両者から見て、実時間に適したピッチ周期抽出方法の1つとされている。
【0004】
自己相関を用いたピッチ周期抽出法として、次の2つの方法が知られている。
【0005】
(1)第1方法
信号は時間制限されていると仮定し、その時間内だけに信号が存在し、その時間外では信号は常に零として自己相関(短時間自己相関)を求める。
【0006】
音声波形をデジタル音声データx(n)で表すと、短時間自己相関Rn(k)は、次式(1)で表される。
【0007】
【数1】
Figure 0003605096
【0008】
ここで、Nは音声信号が存在すると仮定した時間区間であり、kは短時間自己相関Rn(k)を算出ときに音声波形を遅延させる際の遅延時間であり、N≧2kmax の関係がある。したがって、kmax =200である場合には、N≧400となる。そして、短時間自己相関Rn(k)が最大となるkの値がピッチ周期となる。
【0009】
(2)第2方法
信号は時間制限されていないと仮定し、時間長Tの基準となる区間と、ピッチ周期の存在が想定される範囲で時間のずれた時間長Tとの自己相関(変形短時間自己相関)を求める。
【0010】
音声波形をデジタル音声データx(n)で表すと、変形短時間自己相関Rn’(k)は、次式(2)で表される。
【0011】
【数2】
Figure 0003605096
【0012】
ここで、Tは変形短時間自己相関Rn’(k)を算出する際の基準となる時間長であり、kは変形短時間自己相関Rn’(k)を算出ときに音声波形を遅延させる際の遅延時間であり、T≒kmax の関係がある。したがって、kmax =200である場合には、T≒200となる。そして、変形短時間自己相関Rn’(k)が最大となるkの値がピッチ周期となる。
【0013】
第1方法では、ピッチ周期を正確に抽出できるが、ピッチ周期を正確に抽出するためには、自己相関を算出する際の基準となる区間の時間長(N−1−k)を、少なくともピッチ周期の2倍以上に設定する必要があり、このため処理時間が長くなるという欠点がある。
【0014】
第2方法では、自己相関を算出する際の基準となる区間の時間長Tはピッチ周期程度とすればよく、第1方法に比べて自己相関を算出する際の基準となる区間の時間長を短くできるので、処理時間は短くなる。しかしながら、正しいピッチ周期の倍周期のピッチを、誤ってピッチ周期として抽出してしまうおそれがある。
【0015】
第1方法では、第2方法のように正しいピッチ周期の倍周期のピッチを、誤ってピッチ周期として抽出してしまうおそれは少ない。これは、第1方法では、長い周期(kが大きい)に対する自己相関係数ほど、積和区間(N−1−k)が小さくなるため、正しいピッチ周期に対する自己相関係数に比べて、その倍周期に対する自己相関係数が小さくなるからである。
【0016】
第1方法において、自己相関を算出する際の基準となる区間の時間長(N−1−k)をピッチ周期の2倍以上にする必要があるのは、ピッチ周期が短い場合(kが小さい場合)には積和区間(N−1−k)が極端に大きくなり、ピッチ周期が長い場合(kが大きい場合)には積和区間(N−1−k)が極端に小さくなるので、正しいピッチ周期が長い場合において、正しいピッチ周期に対する自己相関係数が、それより短いピッチ周期に対する自己相関係数よりも小さくならならいようにするためである。
【0017】
【発明が解決しようとする課題】
この発明は、処理時間が短くかつピッチ周期を正確に抽出できる音声信号のピッチ周期抽出方法を提供することを目的とする。
【0018】
【課題を解決する為の手段】
請求項1に記載の発明は、全遅延時間範囲を複数の区間に分割する第1ステッ プ、第1ステップで得られた各分割区間毎に、その区間の遅延時間範囲に応じて自己相関係数を算出する際の積和時間長をそれぞれ決定する第2ステップ、第1ステップで得られた各分割区間毎に、それに対して算出された積和時間長を用いて、その区間の遅延時間範囲内の遅延時間それぞれに対する自己相関係数を算出する第3ステップ、および第3ステップで算出された自己相関係数に基づいてピッチ周期を決定する第4ステップを備えた音声信号のピッチ周期抽出方法であって、第1ステップによって全遅延時間範囲が遅延時間の小さい第1区間と遅延時間がそれより大きな第2区間との2つに分割された場合には、第2ステップは、各分割区間の積和時間長を対応する分割区間の遅延時間範囲の最大値に近い値に設定するとともに、第1区間の積和時間長をT1、第2区間の積和時間長をT2とすると、2T1≒Tでかつ2T1>T2の関係が成り立つように各区間の積和時間長T1、T2を設定し、第3ステップにおいて算出される、第1区間の遅延時間kに対する自己相関係数をRn1(k)、第2区間の遅延時間kに対する自己相関係数をRn2(k)とすると、第4ステップは、Rn1(k)およびRn2(k)/2のうち、値が最大となるkをピッチ周期として決定することを特徴とする。
【0019】
請求項2に記載の発明は、全遅延時間範囲を複数の区間に分割する第1ステッ プ、第1ステップで得られた各分割区間毎に、その区間の遅延時間範囲に応じて自己相関係数を算出する際の積和時間長をそれぞれ決定する第2ステップ、第1ステップで得られた各分割区間毎に、それに対して算出された積和時間長を用いて、その区間の遅延時間範囲内の遅延時間それぞれに対する自己相関係数を算出する第3ステップ、および第3ステップで算出された自己相関係数に基づいてピッチ周期を決定する第4ステップ、を備えた音声信号のピッチ周期抽出方法であって、第1ステップによって全遅延時間範囲が遅延時間の小さい方から順に第1区間、第2区間および第3区間の3つの区間に分割された場合には、第2ステップは、各分割区間の積和時間長を対応する分割区間の遅延時間範囲の最大値に近い値に設定するとともに、第1区間の積和時間長をT1、第2区間の積和時間長をT2、第3区間の積和時間長をT3とすると、3T1≒2T2≒T3でかつ3T1>2T2>T3の関係が成り立つように各区間の積和時間長T1、T2、T3を設定し、第3ステップにおいて算出される、第1区間の遅延時間kに対する自己相関係数をRn1(k)、第2区間の遅延時間kに対する自己相関係数をRn2(k)、第3区間の遅延時間kに対する自己相関係数をRn3(k)とすると、第4ステップは、Rn1(k)、Rn2(k)/2およびRn3(k)/3のうち、値が最大となるkをピッチ周期として決定することを特徴とする。
【0020】
請求項3に記載の発明は、全遅延時間範囲を複数の区間に分割する第1ステッ プ、第1ステップで得られた各分割区間毎に、その区間の遅延時間範囲に応じて自己相関係数を算出する際の積和時間長をそれぞれ決定する第2ステップ、第1ステップで得られた各分割区間毎に、それに対して算出された積和時間長を用いて、その区間の遅延時間範囲内の遅延時間それぞれに対する自己相関係数を算出する第3ステップ、および第3ステップで算出された自己相関係数に基づいてピッチ周期を決定する第4ステップ、を備えた音声信号のピッチ周期抽出方法であって、第1ステップによって全遅延時間範囲が遅延時間の小さい方から順に第1区間、第2区間、第3区間および第4区間の4つの区間に分割された場合には、第2ステップは、各分割区間の積和時間長を対応する分割区間の遅延時間範囲の最大値に近い値に設定するとともに、第1区間の積和時間長をT1、第2区間の積和時間長をT2、第3区間の積和時間長をT3、第4区間の積和時間長をT4とすると、6T1≒3T2≒1.5T2≒T4でかつ6T1>3T2>1.5T3>T4の関係が成り立つように各区間の積和時間長T1、T2、T3、T4を設定し、第3ステップにおいて算出される、第1区間の遅延時間kに対する自己相関係数をRn1(k)、第2区間の遅延時間kに対する自己相関係数をRn2(k)、第3区間の遅延時間kに対する自己相関係数をRn3(k)、第4区間の遅延時間kに対する自己相関係数をRn4(k)とすると、第4ステップは、Rn1(k)、Rn2(k)/2、Rn3(k)/4およびRn3(k)/6のうち、値が最大となるkをピッチ周期として決定することを特徴とする。
【0021】
請求項4に記載の発明は、請求項1乃至3のいずれかに記載の音声信号のピッチ周期抽出方法において、第1ステップは、各分割区間の遅延時間の最大値が、当該区間の最小値の2倍より小さな値となるように、全遅延時間範囲を複数の区間に分割することを特徴とする。
【0024】
【発明の実施の形態】
【0025】
〔1〕本発明のピッチ周期抽出方法についての説明
【0026】
本発明のピッチ周期抽出方法について説明する。
【0027】
デジタル音声信号の自己相関係数を計算する際、全遅延時間範囲をピッチ周期の存在が想定される範囲で複数の区間に分割する。分割された各区間毎に、自己相関係数を算出する際の時間長(以下、積和時間長という)をそれぞれ決定する。そして、各区間毎に、それに対して決定された積和時間長を用いて、自己相関係数を算出し、その算出結果に基づいてピッチ周期を決定する。
【0028】
全遅延時間範囲を35≦k<200として、全遅延時間範囲を3つの区間に分割した場合を例にとって説明する。例えば、第1区間を35≦k<65とし、第2区間を65≦k<125とし、第3区間を125≦k<200とすると、各区間の自己相関係数Rn1(k)、Rn2(k)、Rn3(k)は、それぞれ次式(3)、(4)、(5)で表される。
【0029】
【数3】
Figure 0003605096
【0030】
上記式(3)、(4)、(5)において、T1、T2、T3は、各区間における積和時間長を示している。
【0031】
全遅延時間範囲を分割する際には、1つの区間の遅延時間kの最大値が当該区間の遅延時間kの最小値の2倍より小さくなるように、各区間を決定する。例えば、上記第1区間であれば、その区間の遅延時間kの最大値が、当該区間の最小値35の2倍の値70より小さくなるように第1区間を決定する。
【0032】
これは、1つの区間において正しいピッチ周期とそれの2倍のピッチ周期との両方の自己相関係数を算出した場合には、正しいピッチ周期に対する自己相関係数に対して、そのピッチ周期の2倍のピッチ周期に対する自己相関係数が大きくなる可能性があるので、1つの区間において正しいピッチ周期とそのピッチ周期の2倍のピッチ周期との自己相関係数が算出されないようにするためである。
【0033】
遅延時間kの分割区間毎の積和時間長T1、T2、T3を、対応する区間の遅延時間kの最大値程度に設定するとともに、3T1≒2T2≒T3でかつ3T1>2T2>T3の関係が成り立つように設定する。上記の例では、例えば、T1=65、T2=125、T3=185となる。
【0034】
各区間の積和時間長をその区間のkの最大値程度としているのは、入力音声自己相関係数を算出する積和範囲内に、その区間での遅延時間kに対応するピッチ周期のほぼ2倍の波形が含まれるため、ピッチ周期が変化する場合にピッチ周期抽出精度が高くなるからである。
【0035】
上記3つの区間において、Rn1(k)、Rn2(k)、Rn3(k)を、その区間の各遅延時間kについて算出する。そして、Rn1(k)、Rn2(k)/2、Rn3(k)/3のうち、値が最大となるkをピッチ周期として抽出する。
【0036】
各区間の積和時間長を、3T1≒2T2≒T3でかつ3T1>2T2>T3の関係が成り立つように設定しているのは、正しいピッチ周期に対する自己相関係数がその倍周期に対する自己相関係数よりも大きくなるようにして、正しいピッチ周期の倍周期が正しいピッチ周期として誤って抽出されるのを防止するためである。
【0037】
図1および図2、図3および図4、ならびに図5および図6は、入力音声信号の波形が異なる3つの場合の具体例を示している。
【0038】
図1および図2は、遅延時間kが35≦k<200の範囲内の波形のピッチ周期Pが変化していない場合の具体例を示している。
【0039】
図1は従来手法を示し、35≦k<200の範囲に対応したLの範囲の中で、35≦k<200の範囲内の各kについて自己相関係数Rn(k)を算出している。これに対して、図2は、本発明手法を示している。
【0040】
図2(a)は上記式(3)によって表される第1区間での自己相関係数Rn1(k)の算出方法を、図2(b)は上記式(4)によって表される第2区間での自己相関係数Rn2(k)の算出方法を、図2(c)は上記式(5)によって表される第3区間での自己相関係数Rn3(k)の算出方法を、それぞれ示している。
【0041】
第1区間では、35≦k<65の範囲に対応した積和時間長T1で規定される区間L1の範囲内で、35≦k<65の範囲内の各kについて自己相関係数Rn1(k)を算出している。
【0042】
第2区間では、65≦k<125の範囲に対応した積和時間長T2で規定される区間L2の範囲内で、65≦k<125の範囲内の各kについて自己相関係数Rn2(k)を算出している。
【0043】
第3区間では、125≦k<200の範囲に対応した積和時間長T3で規定される区間L3の範囲内で、125≦k<200の範囲内の各kについて自己相関係数Rn3(k)を算出している。
【0044】
従来手法と本発明手法とを比較すると、本発明手法では、第1区間のkの範囲(35≦k<65)および第2区間のkの範囲(65≦k<125)については、自己相関係数の演算量が従来手法に比べて減っており、処理時間が短縮されることが理解できる。また、正しいピッチ周期の倍周期を、正しいピッチ周期として誤って抽出するといったことも防止できる。
【0045】
図2の例では、Rn1(k)、Rn2(k)/2、Rn3(k)/3の全ての中で、値が最大となるのは、第1区間中のk=Pの時のRn1(P)となる。したがって、ピッチ周期はPとなる。
【0046】
図3および図4は、遅延時間kが35≦k<200の範囲内の波形のピッチ周期が小(Ps)から大(Pm)に変化している場合の具体例を示している。
【0047】
図3は従来手法を示し、Lの範囲の中で、35≦k<200の範囲内の各kについて自己相関係数Rn(k)を算出している。このように、自己相関係数を算出する範囲L内に異なるピッチ周期の波形が含まれている場合には、kがピッチ周期PsまたはPmである場合に、自己相関係数Rn(k)が最大となるとは限らなくなるため、正しいピッチ周期を抽出できない可能性がある。Rn(Pm)が最大となって、ピッチ周期をPmとして抽出した場合、ピッチ周期Psの部分もピッチ周期Pmと誤認識するため、不都合が生じる。
【0048】
図4は、本発明手法を示している。図4(a)に示す第1区間では、積和時間長T1で規定される区間L1の範囲内で、35≦k<65の範囲内の各kについて自己相関係数Rn1(k)を算出している。
【0049】
図4(b)に示す第2区間では、積和時間長T2で規定される区間L2の範囲内で、65≦k<125の範囲内の各kについて自己相関係数Rn2(k)を算出している。
【0050】
図4(c)に示す第3区間では、積和時間長T3で規定される区間L3の範囲内で、125≦k<200の範囲内の各kについて自己相関係数Rn3(k)を算出している。
【0051】
図4の例では、Rn1(k)、Rn2(k)/2、Rn3(k)/3の全ての中で値が最大となるのは、自己相関係数を算出する範囲内にピッチ周期Psの波形がほぼ2つ含まれている第1区間中のk=Psの時のRn1(Ps)となる。したがって、ピッチ周期はPsとなる。したがって、ピッチ周期抽出精度が高くなる。
【0052】
図5および図6は、遅延時間kが35≦k<200の範囲内の波形のピッチ周期が大(Pm)から小(Ps)に変化している場合の具体例を示している。
【0053】
図5は従来手法を示し、Lの範囲の中で、35≦k<200の範囲内の各kについて自己相関係数Rn(k)を算出している。このように、自己相関係数を算出する範囲L内に異なるピッチ周期の波形が含まれている場合には、kがピッチ周期PsまたはPmである場合に、自己相関係数Rn(k)が最大となるとは限らなくなるため、正しいピッチ周期を抽出できない可能性がある。Rn(Ps)が最大となって、ピッチ周期をPsとして抽出した場合、ピッチ周期Pmの部分もピッチ周期Psと誤認識するため、不都合が生じる。
【0054】
図6は、本発明手法を示している。図6(a)に示す第1区間では、積和時間長T1で規定される区間L1の範囲内で、35≦k<65の範囲内の各kについて自己相関係数Rn1(k)を算出している。
【0055】
図6(b)に示す第2区間では、積和時間長T2で規定される区間L2の範囲内で、65≦k<125の範囲内の各kについて自己相関係数Rn2(k)を算出している。
【0056】
図6(c)に示す第3区間では、積和時間長T3で規定される区間L3の範囲内で、125≦k<200の範囲内の各kについて自己相関係数Rn3(k)を算出している。
【0057】
図6の例では、Rn1(k)、Rn2(k)/2、Rn3(k)/3の全ての中で値が最大となるのは、自己相関係数を算出する範囲内にピッチ周期Pmの波形がほぼ2つ含まれている第2区間中のk=Pmの時のRn2(Pm)となる。したがって、ピッチ周期はPmとなる。したがって、ピッチ周期抽出精度が高くなる。
【0058】
〔2〕ピッチ周期抽出装置の説明
【0059】
図7は、ピッチ周期抽出装置の構成を示している。
【0060】
入力音声信号は、A/D変換器1によってデジタルの音声信号に変換せしめられる。A/D変換器1によって得られたデジタル音声信号は、自己相関算出手段2に送られる。
【0061】
遅延時間分割手段3は、A/D変換器1のサンプリング周波数に基づいて、kの範囲を分割する。A/D変換器1のサンプリング周波数に基づいて、kの範囲を分割しているのは、A/D変換器1のサンプリング周波数が異なると、ピッチ周期の存在が想定されるピッチ周期範囲が同じであっても、それに対応する遅延時間kの範囲が変化するからである。
【0062】
積和時間長決定手段4は、遅延時間分割手段3によって分割された各区間に対する積和時間長(上記式(3)、(4)、(5)のT1、T2、T3に相当する)を決定する。
【0063】
自己相関算出手段2は、遅延時間分割手段3によって決定された各区間毎に、積和時間長決定手段4によって決定された積和時間長を用いて、自己相関係数を算出する。
【0064】
ピッチ周期検出手段5は、自己相関算出手段2によって算出された各区間での全ての自己相関係数に基づいて、ピッチ周期を求める。自己相関算出手段2が、上記式(3)、(4)、(5)で表されるRn1(k)、Rn2(k)、Rn3(k)を算出するものである場合には、ピッチ周期検出手段5は、Rn1(k)、Rn2(k)/2、Rn3(k)/3のうち、値が最大となるkをピッチ周期として検出する。
【0065】
〔3〕変形例の説明
【0066】
上記実施の形態では、遅延時間kの範囲を3つの区間に分割した場合の例を示したが、遅延時間を3以外の複数の区間に分割してもよい。
【0067】
〔3−1〕遅延時間kの範囲が55≦k<200である場合に、遅延時間kの範囲を2つの区間に分割する場合の例について説明する。
【0068】
例えば、第1区間を55≦k<105とし、第2区間を105≦k<200とすると、各区間の自己相関係数Rn1(k)、Rn2(k)は、それぞれ次式(6)、(7)で表される。
【0069】
【数4】
Figure 0003605096
【0070】
上記式(6)、(7)において、T1、T2は、遅延時間kの各分割区間における積和時間長を示している。この場合には、遅延時間kの分割区間毎の積和時間長T1、T2を、対応する区間のkの最大値程度に設定するとともに、2T1≒T2でかつ2T1>T2の関係が成り立つように設定する。上記の例では、例えば、T1=95、T2=185となる。
【0071】
上記2つの区間において、Rn1(k)、Rn2(k)を、その区間の各遅延時間kについて算出する。そして、Rn1(k)、Rn2(k)/2のうち、値が最大となるkをピッチ周期として抽出する。
【0072】
〔3−2〕遅延時間kの範囲が29≦k<280である場合に、遅延時間kの範囲を4つの区間に分割する場合の例について説明する。
【0073】
例えば、第1区間を29≦k<53とし、第2区間を53≦k<101とし、第3区間を101≦k<197とし、第4区間を197≦k<280とすると、各区間の自己相関係数Rn1(k)、Rn2(k)は、それぞれ次式(8)、(9)、(10)、(11)で表される。
【0074】
【数5】
Figure 0003605096
【0075】
上記式(8)、(9)、(10)、(11)において、T1、T2、T3、T4は、遅延時間kの各分割区間における積和時間長を示している。この場合には、遅延時間kの分割区間毎の積和時間長T1、T2、T3、T4を、対応する区間のkの最大値程度に設定するとともに、6T1≒3T2≒1.5T3≒T4でかつ6T1>3T2>1.5T3>T4の関係が成り立つように設定する。上記の例では、例えば、T1=50、T2=95、T3=185、T4=270となる。
【0076】
上記4つの区間において、Rn1(k)、Rn2(k)、Rn3(k)、Rn4(k)を、その区間の各遅延時間kについて算出する。そして、Rn1(k)、Rn2(k)/2、Rn3(k)/4、Rn4(k)/6のうち、値が最大となるkをピッチ周期として抽出する。
【0077】
【発明の効果】
この発明によれば、処理時間が短くかつピッチ周期を正確に抽出できるようになる。
【図面の簡単な説明】
【図1】遅延時間kが35≦k<200の範囲内の波形のピッチ周期Pが変化していない場合における従来手法による自己相関係数算出方法を説明するための模式図である。
【図2】入力音声信号波形が図1に示す波形である場合において、本発明手法による自己相関係数算出方法を説明するための模式図である。
【図3】遅延時間kが35≦k<200の範囲内の波形のピッチ周期が小(Ps)から大(Pm)に変化している場合における従来手法による自己相関係数算出方法を説明するための模式図である。
【図4】入力音声信号波形が図3に示す波形である場合において、本発明手法による自己相関係数算出方法を説明するための模式図である。
【図5】遅延時間kが35≦k<200の範囲内の波形のピッチ周期が大(Pm)から小(Ps)に変化している場合における従来手法による自己相関係数算出方法を説明するための模式図である。
【図6】入力音声信号波形が図5に示す波形である場合において、本発明手法による自己相関係数算出方法を説明するための模式図である。
【図7】ピッチ周期抽出装置の構成を示すブロック図である。
【符号の説明】
1 A/D変換器
2 自己相関算出手段
3 遅延時間分割手段
4 積和時間長決定手段
5 ピッチ周期検出手段

Claims (4)

  1. 全遅延時間範囲を複数の区間に分割する第1ステップ、
    第1ステップで得られた各分割区間毎に、その区間の遅延時間範囲に応じて自 己相関係数を算出する際の積和時間長をそれぞれ決定する第2ステップ、
    第1ステップで得られた各分割区間毎に、それに対して算出された積和時間長 を用いて、その区間の遅延時間範囲内の遅延時間それぞれに対する自己相関係数 を算出する第3ステップ、および
    第3ステップで算出された自己相関係数に基づいてピッチ周期を決定する第4 ステップ、
    を備えた音声信号のピッチ周期抽出方法であって、
    第1ステップによって全遅延時間範囲が遅延時間の小さい第1区間と遅延時間がそれより大きな第2区間との2つに分割された場合には、
    第2ステップは、各分割区間の積和時間長を対応する分割区間の遅延時間範囲の最大値に近い値に設定するとともに、第1区間の積和時間長をT1、第2区間の積和時間長をT2とすると、2T1≒Tでかつ2T1>T2の関係が成り立つように各区間の積和時間長T1、T2を設定し、
    第3ステップにおいて算出される、第1区間の遅延時間kに対する自己相関係数をRn1(k)、第2区間の遅延時間kに対する自己相関係数をRn2(k)とすると、第4ステップは、Rn1(k)およびRn2(k)/2のうち、値が最大となるkをピッチ周期として決定することを特徴とする音声信号のピッチ周期抽出方法。
  2. 全遅延時間範囲を複数の区間に分割する第1ステップ、
    第1ステップで得られた各分割区間毎に、その区間の遅延時間範囲に応じて自 己相関係数を算出する際の積和時間長をそれぞれ決定する第2ステップ、
    第1ステップで得られた各分割区間毎に、それに対して算出された積和時間長 を用いて、その区間の遅延時間範囲内の遅延時間それぞれに対する自己相関係数 を算出する第3ステップ、および
    第3ステップで算出された自己相関係数に基づいてピッチ周期を決定する第4 ステップ、
    を備えた音声信号のピッチ周期抽出方法であって、
    第1ステップによって全遅延時間範囲が遅延時間の小さい方から順に第1区間、第2区間および第3区間の3つの区間に分割された場合には、
    第2ステップは、各分割区間の積和時間長を対応する分割区間の遅延時間範囲の最大値に近い値に設定するとともに、第1区間の積和時間長をT1、第2区間の積和時間長をT2、第3区間の積和時間長をT3とすると、3T1≒2T2≒T3でかつ3T1>2T2>T3の関係が成り立つように各区間の積和時間長T1、T2、T3を設定し、
    第3ステップにおいて算出される、第1区間の遅延時間kに対する自己相関係数をRn1(k)、第2区間の遅延時間kに対する自己相関係数をRn2(k)、第3区間の遅延時間kに対する自己相関係数をRn3(k)とすると、第4ステップは、Rn1(k)、Rn2(k)/2およびRn3(k)/3のうち、値が最大となるkをピッチ周期として決定することを特徴とする音声信号のピッチ周期抽出方法。
  3. 全遅延時間範囲を複数の区間に分割する第1ステップ、
    第1ステップで得られた各分割区間毎に、その区間の遅延時間範囲に応じて自 己相関係数を算出する際の積和時間長をそれぞれ決定する第2ステップ、
    第1ステップで得られた各分割区間毎に、それに対して算出された積和時間長 を用いて、その区間の遅延時間範囲内の遅延時間それぞれに対する自己相関係数 を算出する第3ステップ、および
    第3ステップで算出された自己相関係数に基づいてピッチ周期を決定する第4 ステップ、
    を備えた音声信号のピッチ周期抽出方法であって、
    第1ステップによって全遅延時間範囲が遅延時間の小さい方から順に第1区間、第2区 間、第3区間および第4区間の4つの区間に分割された場合には、
    第2ステップは、各分割区間の積和時間長を対応する分割区間の遅延時間範囲の最大値に近い値に設定するとともに、第1区間の積和時間長をT1、第2区間の積和時間長をT2、第3区間の積和時間長をT3、第4区間の積和時間長をT4とすると、6T1≒3T2≒1.5T2≒T4でかつ6T1>3T2>1.5T3>T4の関係が成り立つように各区間の積和時間長T1、T2、T3、T4を設定し、
    第3ステップにおいて算出される、第1区間の遅延時間kに対する自己相関係数をRn1(k)、第2区間の遅延時間kに対する自己相関係数をRn2(k)、第3区間の遅延時間kに対する自己相関係数をRn3(k)、第4区間の遅延時間kに対する自己相関係数をRn4(k)とすると、第4ステップは、Rn1(k)、Rn2(k)/2、Rn3(k)/4およびRn3(k)/6のうち、値が最大となるkをピッチ周期として決定することを特徴とする音声信号のピッチ周期抽出方法。
  4. 第1ステップは、各分割区間の遅延時間の最大値が、当該区間の最小値の2倍より小さな値となるように、全遅延時間範囲を複数の区間に分割することを特徴とする請求項1乃至3のいずれかに記載の音声信号のピッチ周期抽出方法。
JP2002190274A 2002-06-28 2002-06-28 音声信号のピッチ周期抽出方法 Expired - Lifetime JP3605096B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002190274A JP3605096B2 (ja) 2002-06-28 2002-06-28 音声信号のピッチ周期抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002190274A JP3605096B2 (ja) 2002-06-28 2002-06-28 音声信号のピッチ周期抽出方法

Publications (2)

Publication Number Publication Date
JP2004037506A JP2004037506A (ja) 2004-02-05
JP3605096B2 true JP3605096B2 (ja) 2004-12-22

Family

ID=31700235

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002190274A Expired - Lifetime JP3605096B2 (ja) 2002-06-28 2002-06-28 音声信号のピッチ周期抽出方法

Country Status (1)

Country Link
JP (1) JP3605096B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101542589B (zh) * 2006-10-13 2012-07-11 诺基亚公司 基音滞后估计的方法、设备和系统

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7705231B2 (en) * 2007-09-07 2010-04-27 Microsoft Corporation Automatic accompaniment for vocal melodies
JP2010237269A (ja) * 2009-03-30 2010-10-21 Toshiba Corp 音声認識装置、その方法及びそのプログラム
EP3306609A1 (en) 2016-10-04 2018-04-11 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for determining a pitch information

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101542589B (zh) * 2006-10-13 2012-07-11 诺基亚公司 基音滞后估计的方法、设备和系统

Also Published As

Publication number Publication date
JP2004037506A (ja) 2004-02-05

Similar Documents

Publication Publication Date Title
JP5732994B2 (ja) 楽曲検索装置および方法、プログラム、並びに記録媒体
KR101670313B1 (ko) 음원 분리를 위해 자동적으로 문턱치를 선택하는 신호 분리 시스템 및 방법
US8892430B2 (en) Noise detecting device and noise detecting method
EP1381030A1 (en) Compression method and apparatus, decompression method and apparatus, compression/decompression system, peak detection method, program, and recording medium
US9002489B2 (en) Signal processing apparatus, signal processing method, and program
JP2005227782A (ja) 有声音および無声音の検出装置、並びにその方法
JP2012516591A (ja) オーディオ信号品質予測
EP3979240A1 (en) Signal extraction system, signal extraction learning method, and signal extraction learning program
US20050143981A1 (en) Compressing method and apparatus, expanding method and apparatus, compression and expansion system, recorded medium, program
JP3605096B2 (ja) 音声信号のピッチ周期抽出方法
US5819209A (en) Pitch period extracting apparatus of speech signal
US9185497B2 (en) Method and computer program product of processing sound segment and hearing aid
US7398504B2 (en) Program, method and apparatus for analyzing transmission signals
JP2010026323A (ja) 話速検出装置
US8306828B2 (en) Method and apparatus for audio signal expansion and compression
JP2004158925A (ja) ディジタルデータ処理装置およびディジタルデータ処理方法
JP3147562B2 (ja) 音声速度変換方法
CN114007176B (zh) 用于降低信号延时的音频信号处理方法、装置及存储介质
US7337109B2 (en) Multiple step adaptive method for time scaling
JP3074046B2 (ja) 音声・楽音識別回路
JP2005204020A (ja) デジタル信号処理装置
TW202226225A (zh) 以零點交越檢測改進語音活動檢測之設備及方法
AU2017438213B2 (en) Method and apparatus for resampling audio signal
CN102263556A (zh) 判断采样率的方法及其装置
CN114155874A (zh) 一种特征提取方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040615

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040622

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040823

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040921

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040930

R151 Written notification of patent or utility model registration

Ref document number: 3605096

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081008

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091008

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101008

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111008

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121008

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121008

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131008

Year of fee payment: 9

EXPY Cancellation because of completion of term