JP5131172B2 - 周期特定装置およびプログラム - Google Patents

周期特定装置およびプログラム Download PDF

Info

Publication number
JP5131172B2
JP5131172B2 JP2008311865A JP2008311865A JP5131172B2 JP 5131172 B2 JP5131172 B2 JP 5131172B2 JP 2008311865 A JP2008311865 A JP 2008311865A JP 2008311865 A JP2008311865 A JP 2008311865A JP 5131172 B2 JP5131172 B2 JP 5131172B2
Authority
JP
Japan
Prior art keywords
intensity
peaks
peak
acoustic signal
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008311865A
Other languages
English (en)
Other versions
JP2010134319A (ja
Inventor
清人 黒岩
高康 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2008311865A priority Critical patent/JP5131172B2/ja
Publication of JP2010134319A publication Critical patent/JP2010134319A/ja
Application granted granted Critical
Publication of JP5131172B2 publication Critical patent/JP5131172B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、音声や楽音を表す音響信号のピッチ周期(基本周波数に対応する周期)を特定する技術に関する。
音響信号のピッチ周期(さらにはピッチ)を特定する技術が従来から提案されている。例えば特許文献1には、音響信号において時間軸上で相隣接する各ピークの間隔をピッチ周期として特定する技術が開示されている。
特開平7−110687号公報
しかし、音響信号の複数のピークには、ピッチの成分(基音成分)に対応するピークに加えて、倍音成分に対応するピークも含まれる。したがって、単純に各ピークの間隔をピッチ周期として特定する特許文献1の技術では、倍音成分の周波数に対応した周期がピッチ周期として誤検出される可能性がある。以上の事情を考慮して、本発明は、音響信号が倍音成分を含む場合でもピッチ周期を高精度に特定することを目的とする。
以上の課題を解決するために、本発明の第1の態様に係る周期特定装置は、音響信号の複数の正側ピークの各々の強度と複数の負側ピークの各々の強度とを特定するピーク検出手段と、複数の正側ピークのうち第n番目(nは自然数)および第(n-2)番目の正側ピークの強度の第1平均値(例えば数式(2)の平均値E_LP[n])と第(n-1)番目の正側ピークの強度との差分値の絶対値と、複数の負側ピークのうち第n番目および第(n-2)番目の負側ピークの強度の第2平均値(例えば数式(3)の平均値E_LM[n])と第(n-1)番目の負側ピークの強度との差分値の絶対値とを加算することで変化指標値を算定する指標算定手段と、変化指標値と閾値とを比較する比較手段と、変化指標値が閾値を下回る場合に、第(n-2)番目および第(n-1)番目の正側ピークの間隔(例えば図2の間隔ΔP[n-1])と、第(n-1)番目および第n番目の正側ピークの間隔(例えば図2の間隔ΔP[n])と、第(n-2)番目および第(n-1)番目の負側ピークの間隔(例えば図2の間隔ΔM[n-1])と、第(n-1)番目および第n番目の負側ピークの間隔(例えば図2の間隔ΔM[n])との少なくともひとつから音響信号のピッチ周期を特定し、変化指標値が閾値を上回る場合に、第(n-2)番目および第n番目の正側ピークの間隔(例えば図3の間隔ΔP)と、第(n-2)番目および第n番目の負側ピークの間隔(例えば図3の間隔ΔM)との少なくともひとつから音響信号のピッチ周期を特定する周期特定手段とを具備する。以上の構成においては、変化指標値が閾値を下回る場合(第(n-1)番目の正側ピークや負側ピークが基音成分である可能性が高い場合)には第(n-1)番目の正側ピークおよび負側ピークを考慮してピッチ周期が特定され、変化指標値が閾値を上回る場合(第(n-1)番目の正側ピークや負側ピークが倍音成分である可能性が高い場合)には第(n-1)番目の正側ピークおよび負側ピークを無視してピッチ周期が特定される。したがって、音響信号が倍音成分を含む場合であっても正確にピッチ周期を特定することが可能である。
本発明の好適な態様に係る周期特定装置は、第1平均値と第2平均値との差分値から閾値を算定する閾値設定手段を具備する。以上の態様においては、変化指標値と比較される閾値が音響信号の強度に応じて可変に設定されるから、閾値が所定値に固定された場合と比較すると、音響信号の特性(音量)に拘わらずピッチ周期を正確に特定できるという利点がある。
本発明の第2の態様に係る周期特定装置は、音響信号における同符号の複数のピークの各々の強度を特定するピーク検出手段と、複数のピークのうち第n番目(nは自然数)および第(n-2)番目のピークの強度の平均値と第(n-1)番目のピークの強度との差分値の絶対値に応じた変化指標値を算定する指標算定手段と、変化指標値と閾値とを比較する比較手段と、変化指標値が閾値を下回る場合に、第(n-2)番目および第(n-1)番目のピークの間隔と第(n-1)番目および第n番目のピークの間隔との少なくともひとつから音響信号のピッチ周期を特定し、変化指標値が閾値を上回る場合に、第(n-2)番目および第n番目のピークの間隔から音響信号のピッチ周期を特定する周期特定手段とを具備する。以上の構成においては、変化指標値が閾値を下回る場合(第(n-1)番目のピークが基音成分である可能性が高い場合)には第(n-1)番目のピークを考慮してピッチ周期が特定され、変化指標値が閾値を上回る場合(第(n-1)番目のピークが倍音成分である可能性が高い場合)には第(n-1)番目のピークを無視してピッチ周期が特定される。したがって、第1の態様に係る周期特定装置と同様に、音響信号が倍音成分を含む場合であっても正確にピッチ周期を特定することが可能である。
第1の態様および第2の態様の各々に係る周期特定装置において、周期特定手段は、例えば、音響信号の波形が立上がり状態と立下がり状態と安定状態との何れにも該当しない場合に、音響信号のピッチ周期の特定を停止する。以上の態様においては、所定の状態に該当しない場合にピッチ周期の特定が停止されるから、周期特定部によるピッチ周期の誤検出の可能性が抑制されるという利点がある。
また、以上の各態様に係る周期特定装置は、音響信号の処理に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)などの汎用の演算処理装置とプログラムとの協働によっても実現される。本発明の第1の態様に係るプログラムは、音響信号の複数の正側ピークの各々の強度と複数の負側ピークの各々の強度とを特定するピーク検出処理と、複数の正側ピークのうち第n番目(nは自然数)および第(n-2)番目の正側ピークの強度の第1平均値と第(n-1)番目の正側ピークの強度との差分値の絶対値と、複数の負側ピークのうち第n番目および第(n-2)番目の負側ピークの強度の第2平均値と第(n-1)番目の負側ピークの強度との差分値の絶対値とを加算することで変化指標値を算定する指標算定処理と、変化指標値と閾値とを比較する比較処理と、変化指標値が閾値を下回る場合に、第(n-2)番目および第(n-1)番目の正側ピークの間隔と、第(n-1)番目および第n番目の正側ピークの間隔と、第(n-2)番目および第(n-1)番目の負側ピークの間隔と、第(n-1)番目および第n番目の負側ピークの間隔との少なくともひとつから音響信号のピッチ周期を特定し、変化指標値が閾値を上回る場合に、第(n-2)番目および第n番目の正側ピークの間隔と、第(n-2)番目および第n番目の負側ピークの間隔との少なくともひとつから音響信号のピッチ周期を特定する周期特定処理とをコンピュータに実行させる。以上のプログラムによれば、第1の態様に係る周期特定装置と同様の作用および効果が実現される。
第2の態様に係るプログラムは、音響信号における同符号の複数のピークの各々の強度を特定するピーク検出処理と、複数のピークのうち第n番目(nは自然数)および第(n-2)番目のピークの強度の平均値と第(n-1)番目のピークの強度との差分値の絶対値に応じた変化指標値を算定する指標算定処理と、変化指標値と閾値とを比較する比較処理と、変化指標値が閾値を下回る場合に、第(n-2)番目および第(n-1)番目のピークの間隔と第(n-1)番目および第n番目のピークの間隔との少なくともひとつから音響信号のピッチ周期を特定し、変化指標値が閾値を上回る場合に、第(n-2)番目および第n番目のピークの間隔から音響信号のピッチ周期を特定する周期特定処理とをコンピュータに実行させる。以上のプログラムによれば、第2の態様に係る周期特定装置と同様の作用および効果が実現される。
なお、本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で利用者に提供されてコンピュータにインストールされるほか、通信網を介した配信の形態でサーバ装置から提供されてコンピュータにインストールされる。
<A:第1実施形態>
図1は、本発明の第1実施形態に係る周期特定装置のブロック図である。周期特定装置100には音響信号Aが供給される。音響信号Aは、音声や楽音などの音響の時間軸上の波形を表す信号値(音波の強度)の時系列である。音響信号Aの供給元(図示略)は、例えば、周囲の音響に応じた音響信号Aを生成する収音機器や、記録媒体から音響信号Aを取得して出力する再生装置である。周期特定装置100は、音響信号Aのピッチ周期Tpを特定して出力する。ピッチ周期Tpは、音響信号Aのピッチ(基本周波数)に対応した周期である。
図1に示すように、周期特定装置100は、演算処理装置12と記憶装置14とを含むコンピュータシステムで実現される。記憶装置14は、音響信号Aからピッチ周期Tpを特定するためのプログラムや各種のデータを記憶する。半導体記録媒体や磁気記録媒体などの公知の記録媒体が記憶装置14として任意に採用される。
演算処理装置12は、記憶装置14に格納されたプログラムを実行することで複数の要素(フィルタ部22、ピーク検出部24,演算部30,比較部42,周期特定部44)として機能する。なお、音響信号Aの処理に専用される電子回路(DSP)が演算処理装置12の各要素を実現する構成や、演算処理装置12の各要素を複数の集積回路に分散的に搭載した構成も採用される。
フィルタ部22は、音響信号Aの高域成分を抑制するローパスフィルタまたはバンドパスフィルタである。ピーク検出部24は、フィルタ部22による処理後の音響信号Aについて複数の局所的なピーク(極値点)を検出するとともに各ピークでの強度を特定する。図2に示すように、本形態のピーク検出部24は、複数の正側ピークQP(……,QP[n-2],QP[n-1],QP[n],QP[n+1],……)と複数の負側ピークQM(……,QM[n-2],QM[n-1],QM[n],QM[n+1],……)とを検出し、各正側ピークQPの強度LP(……,LP[n-2],LP[n-1],LP[n],LP[n+1],……)と各負側ピークQMの強度LM(……,LM[n-2],LM[n-1],LM[n],LM[n+1],……)とを特定する。正側ピークQPは、強度LPが正数(零点に対して正極性)となる極大点であり、負側ピークQMは、強度LMが負数(零点に対して負極性)となる極小点である。負側ピークQMは、実際には音響信号Aのディップ(極小点)に相当するが、本出願では便宜的にピーク(極値点)と把握して正側ピークQPと同等に取扱う。図2に示すように、強度LP[n](nは自然数)は、複数の正側ピークQPのうち第n番目の正側ピークQP[n]の強度LPを意味し、強度LM[n]は、複数の負側ピークQMのうち第n番目の負側ピークQM[n]の強度LMを意味する。
ピーク検出部24によるピークの検出には公知の技術が任意に採用される。例えば、音響信号Aの正側ピークQPの強度LPから経時的に減少する基準値と音響信号Aの強度とのうちの大きい方の軌跡の極大点を正側ピークQPとして検出し、音響信号Aの負側ピークQMの強度LMから経時的に増加する基準値と音響信号Aの強度とのうちの小さい方の軌跡の極小点を負側ピークQMとして検出する方法(例えば特開昭61−44330号公報に開示された方法)が好適に採用される。
図1の演算部30は、ピッチ周期Tpの算定に利用される変数を各正側ピークQPの強度LPと各負側ピークQMの強度LMとから算定する。演算部30は、指標算定部32と閾値設定部34とを含んで構成される。指標算定部32は、正側ピークQPと負側ピークQMとの対毎に変化指標値Fを算定する。変化指標値Fは、ひとつの正側ピークQPの強度LPとその前後の各正側ピークQPの強度LPとの相違の度合、および、ひとつの負側ピークQMの強度LMとその前後の各負側ピークQMの強度LMとの相違の度合の指標となる数値である。正側ピークQP[n]と負側ピークQM[n]との対に対応する変化指標値F[n]は、例えば数式(1)で定義される。数式(1)の演算子absは絶対値を意味する。
F[n]=abs(E_LP[n]−LP[n-1])+abs(E_LM[n]−LM[n-1]) ……(1)
数式(1)における変数E_LP[n]は、以下の数式(2)で定義されるように、正側ピークQP[n]の強度LP[n]と正側ピークQP[n-2]の強度LP[n-2]との平均値に相当する。同様に、数式(1)における変数E_LM[n]は、以下の数式(3)で定義されるように、負側ピークQM[n]の強度LM[n]と負側ピークQM[n-2]の強度LM[n-2]との平均値に相当する。
E_LP[n]=(LP[n]+LP[n-2])/2 ……(2)
E_LM[n]=(LM[n]+LM[n-2])/2 ……(3)
指標算定部32は、ピーク検出部24が検出した強度(LP[n-2]〜LP[n],LM[n-2]〜LM[n])について数式(1)から数式(3)の演算を実行することで変化指標値F[n]を算定する。以上の定義から理解されるように、第(n-1)番目の正側ピークQP[n-1]の強度LP[n-1]と前後の正側ピークQPの強度LP(LP[n],LP[n-2])の平均値E_LP[n]との相違(abs(E_LP[n]−LP[n-1]))が大きいほど変化指標値F[n]は大きい数値となり、負側ピークQM[n-1]の強度LM[n-1]と前後の負側ピークQMの強度LM(LM[n],LM[n-2])の平均値E_LM[n]との相違(abs(E_LM[n]−LM[n-1]))が大きいほど変化指標値F[n]は大きい数値となる。
図2に示すように正側ピークQP[n-1]の強度LP[n-1]とその前後の正側ピークQPの強度LP(LP[n],LP[n-2])との相違が大きい場合(例えば強度LP[n-1]が強度LP[n]や強度LP[n-2]と比較して相当に低い場合)、正側ピークQP[n-1]は音響信号Aの倍音成分である可能性が高い。同様に、強度LM[n-1]が強度LM[n]や強度LM[n-2]と比較して相当に高い場合には、負側ピークQM[n-1]は音響信号Aの倍音成分である可能性が高い。
一方、図3に示すように正側ピークQP[n-1]の強度LP[n-1]とその前後の正側ピークQPの強度LP(LP[n],LP[n-2])とが近似する場合、正側ピークQP[n-1]は音響信号Aの基音成分である可能性が高い。同様に、負側ピークQM[n-1]の強度LM[n-1]とその前後の負側ピークQMの強度LM(LM[n],LM[n-2])とが近似する場合、負側ピークQM[n-1]は音響信号Aの基音成分である可能性が高い。
以上のように、変化指標値F[n]が大きいほど、正側ピークQP[n-1]や負側ピークQM[n-1]が倍音成分である可能性が高い(すなわち、変化指標値F[n]が小さいほど正側ピークQP[n-1]や負側ピークQM[n-1]が基音成分である可能性が高い)という傾向がある。すなわち、変化指標値F[n]は、正側ピークQP[n-1]や負側ピークQM[n-1]が倍音成分に該当する可能性を示す指標値として把握される。以上の傾向を考慮して、本形態においては、変化指標値F[n]が閾値THを上回る場合には(図2)、正側ピークQP[n-1]や負側ピークQM[n-1]を無視してピッチ周期Tpを特定し、変化指標値F[n]が閾値THを下回る場合には(図3)、正側ピークQP[n-1]や負側ピークQM[n-1]を考慮してピッチ周期Tpを特定する。
図1の閾値設定部34は、閾値THを設定する要素である。閾値THは、変化指標値F[n]毎に(すなわち正側ピークQP[n]と負側ピークQM[n]との対毎に)順次に算定される。変化指標値F[n]と比較される閾値TH[n]は、閾値TH[n]を適用した判定(倍音成分に該当するか否かの判定)の対象となる正側ピークQP[n-1]の前後の正側ピークQPの強度(LP[n],LP[n-2])と、同じく閾値TH[n]を適用した判定の対象となる負側ピークQM[n-1]の前後の負側ピークQMの強度(LM[n],LM[n-2])とに応じて可変に設定される。具体的には、数式(2)の平均値E_LP[n]と数式(3)の平均値E_LM[n]とについて数式(4)の演算を実行することで閾値設定部34は閾値TH[n]を算定する。
TH[n]=(E_LP[n]−E_LM[n])×α ……(4)
数式(4)の係数αは所定の正数である。例えば、正側ピークQP[n-1]や負側ピークQM[n-1]が倍音成分に相当する場合に変化指標値F[n]が閾値TH[n]を上回り、正側ピークQP[n-1]や負側ピークQM[n-1]が基音成分に相当する場合に変化指標値F[n]が閾値TH[n]を下回るように、係数αは実験的または統計的に選定される。
図1の比較部42は、指標算定部32が算定した変化指標値F[n]と閾値設定部34が算定した閾値TH[n]とを比較する。周期特定部44は、比較部42による比較の結果に応じてピッチ周期Tpを特定する。周期特定部44の具体的な処理を以下に詳述する。
変化指標値F[n]が閾値TH[n]を上回る場合(すなわち、正側ピークQP[n-1]や負側ピークQM[n-1]が倍音成分に相当する場合)、周期特定部44は、正側ピークQP[n-1]および負側ピークQM[n-1]を無視してピッチ周期Tpを特定する。すなわち、周期特定部44は、図2に示すように、正側ピークQP[n-2]および正側ピークQP[n]の間隔ΔPと、負側ピークQM[n-2]および負側ピークQM[n]の間隔ΔMとの少なくともひとつからピッチ周期Tpを特定する。間隔ΔPおよび間隔ΔMからピッチ周期Tpを特定する具体的な方法は任意であるが、例えば、間隔ΔPと間隔ΔMとの平均値をピッチ周期Tpとする方法や、間隔ΔPおよび間隔ΔMの一方(例えば大きい方)をピッチ周期Tpとする方法が好適である。
変化指標値F[n]が閾値TH[n]を下回る場合(すなわち、正側ピークQP[n-1]や負側ピークQM[n-1]が基音成分に相当する場合)、周期特定部44は、正側ピークQP[n-1]および負側ピークQM[n-1]を考慮してピッチ周期Tpを特定する。すなわち、周期特定部44は、図3に示すように、正側ピークQP[n-2]および正側ピークQP[n-1]の間隔ΔP[n-1]と、正側ピークQP[n-1]および正側ピークQP[n]の間隔ΔP[n]と、負側ピークQM[n-2]および負側ピークQM[n-1]の間隔ΔM[n-1]と、負側ピークQM[n-1]および負側ピークQM[n]の間隔ΔM[n]との少なくともひとつからピッチ周期Tpを特定する。各間隔Δ(ΔP[n-1],ΔP[n],ΔM[n-1],ΔM[n])からピッチ周期Tpを特定する具体的な方法は任意であるが、例えば、4個の間隔Δ(ΔP[n-1],ΔP[n],ΔM[n-1],ΔM[n])の平均値をピッチ周期Tpとする方法や、4個の間隔Δの何れかひとつ(例えば最大値)をピッチ周期Tpとする方法が好適である。
以上の形態においては、正側ピークQP[n-1]および負側ピークQM[n-1]をピッチ周期Tpの特定に利用するか否か(すなわち、正側ピークQP[n-1]および負側ピークQM[n-1]が倍音成分に該当するか否か)が変化指標値F[n]に応じて判断されるから、音響信号Aが倍音成分を含む場合であってもピッチ周期Tpを正確に特定することが可能である。また、変化指標値F[n]と比較される閾値TH[n]が音響信号Aの強度(LP[n],LP[n-2],LM[n],LM[n-2])に応じて可変に設定されるから、閾値TH[n]が所定値に固定された構成と比較すると、音響信号Aの特性(音量)に拘わらずピッチ周期Tpを正確に特定できるという利点がある。
<B:第2実施形態>
次に、本発明の第2実施形態について説明する。なお、以下の各形態において作用や機能が第1実施形態と同等である要素については以上と同じ符号を付して各々の詳細な説明を適宜に省略する。
図2や図3においては、音響信号Aの振幅が安定した状態(以下「安定状態」という)を例示したが、図4のように音響信号Aの振幅が経時的に増加する状態(以下「立上がり状態」という)や、図5のように音響信号Aの振幅が経時的に減少する状態(以下「立下がり状態」という)も存在する。図4の立上がり状態は、例えば、音響信号Aのうち発音の開始の直後のアタック部に相当する。図2や図3の安定状態は、例えば、アタック部の経過後に強度が安定するサステイン部に相当する。また、図5の立下がり状態は、例えば、音響信号Aの強度が減衰するリリース部に相当する。
第1実施形態における変化指標値F[n]や閾値TH[n]は、強度LP[n-2]および強度LP[n]の平均値E_LP[n](数式(2))と強度LM[n-2]および強度LM[n]の平均値E_LM[n](数式(3))とに応じて可変に設定される。したがって、図4の立上がり状態や図5の立下がり状態においても、図2や図3の安定状態と同様にピッチ周期Tpが正確に特定される。一方、音響信号Aの波形が安定状態と立上がり状態と立下がり状態との何れにも該当しない場合には、周期特定部44の特定するピッチ周期Tpに誤差が発生する可能性がある。そこで、第2実施形態においては、音響信号Aの波形が安定状態と立上がり状態と立下がり状態の何れにも該当しない場合にはピッチ周期Tpの特定を停止する。
図6に示すように、第2実施形態の周期特定装置100は、第1実施形態の要素に状態判定部50を追加した構成である。状態判定部50は、音響信号Aの振幅の遷移(すなわち、正側ピークQPの強度LPの遷移や負側ピークQMの強度LMの遷移)の状態を判定する。図7は、状態判定部50および周期特定部44の動作のフローチャートである。ピーク検出部24が正側ピークQP[n]および負側ピークQM[n]を検出するたびに図7の処理が実行される。
状態判定部50は、音響信号Aのうち正側ピークQP[n]を終点とする過去の区間(以下「判定区間」という)が立上がり状態に該当するか否かを判定する(ステップS1)。判定区間は、正側ピークQP[n]4個前の正側ピークQP[n-4]と2個前の正側ピークQP[n-2]と正側ピークQP[n]とを含む区間である。状態判定部50は、正側ピークQP[n-4]の強度LP[n-4]と正側ピークQP[n-2]の強度LP[n-2]と正側ピークQP[n]の強度LP[n]とについて以下の数式(a)が成立するか否かを判定し、数式(a)が成立する場合には判定区間が立上がり状態に該当すると判定する一方、数式(a)が成立しない場合には判定区間が立上がり状態に該当しないと判定する。数式(a)の係数mは、音響信号Aの強度LPの揺れを考慮した所定の正数(例えば0.1)である。
LP[n-4]<LP[n-2]<LP[n]×(1−m) ……(a)
ステップS1の結果が否定である場合、状態判定部50は、音響信号Aの判定区間が立下がり状態に該当するか否かを判定する(ステップS2)。具体的には、状態判定部50は、判定区間内の各強度(LP[n-4],LP[n-2],LP[n])について数式(b)が成立するか否かを判定し、数式(b)が成立する場合には判定区間が立下がり状態に該当すると判定する一方、数式(b)が成立しない場合には判定区間が立下がり状態に該当しないと判定する。
LP[n-4]>LP[n-2]>LP[n]×(1+m) ……(b)
ステップS2の結果が否定である場合、状態判定部50は、音響信号Aの判定区間が安定状態に該当するか否かを判定する(ステップS3)。具体的には、状態判定部50は、判定区間内の各強度(LP[n-4],LP[n-2],LP[n])について数式(c1)および数式(c2)が成立するか否かを判定し、数式(c1)および数式(c2)の双方が成立する場合には判定区間が安定状態に該当すると判定する一方、数式(c1)および数式(c2)の少なくとも一方が成立しない場合には判定区間が安定状態に該当しないと判定する。すなわち、安定状態は、強度LP[n-4]および強度LP[n-2]の双方が、強度LP[n]を中心とした幅2mの範囲内に含まれる状態である。
LP[n]×(1−m)≦LP[n-4]≦LP[n]×(1+m) ……(c1)
LP[n]×(1−m)≦LP[n-2]≦LP[n]×(1+m) ……(c2)
ステップS1からステップS3の何れかの結果が肯定である場合(すなわち、判定区間が安定状態と立上がり状態と立下がり状態との何れかに該当する場合)、周期特定部44は、第1実施形態と同様の方法でピッチ周期Tpを特定する(ステップS4)。一方、ステップS1からステップS3の総ての結果が否定である場合(すなわち、判定区間が安定状態と立上がり状態と立下がり状態との何れにも該当しない場合)、周期特定部44は、ピッチ周期Tpの特定を停止する(ステップS5)。ピッチ周期Tpの特定を停止した場合、周期特定部44は、直前に特定したピッチ周期Tpを継続的に出力する。
第2実施形態においては、音響信号Aが安定状態と立上がり状態と立下がり状態との何れにも該当しない場合にピッチ周期Tpの特定が停止されるから、音響信号Aの状態に拘わらずピッチ周期Tpを検出する構成と比較して、ピッチ周期Tpを正確に特定できるという効果や、周期特定部44の処理の負荷が軽減されるという効果が実現される。
<C:第3実施形態>
第1実施形態においては、正側ピークQPの強度LPおよび負側ピークQMの強度LMの双方をピッチ周期Tpの特定に利用した。本発明の第3実施形態においては、正側ピークQPのみをピッチ周期Tpの特定に利用する。周期特定装置100の構成は第1実施形態(図1)と同様である。
ピーク検出部24は、音響信号Aの複数の正側ピークQPの各々の強度LPを特定する。演算部30の指標算定部32は、以下に例示する数式(1A)のように、正側ピークQP[n]および正側ピークQP[n-2]の強度LPの平均値E_LP[n](数式(2))と正側ピークQP[n-1]の強度LP[n-1]との差分値の絶対値に応じた変化指標値F[n]を算定する。閾値設定部34は、以下に例示する数式(4A)のように、平均値E_LP[n]に応じた閾値TH[n]を算定する。
F[n]=abs(E_LP[n]−LP[n-1]) ……(1A)
TH[n]=E_LP[n]×α ……(4A)
比較部42は、数式(1A)の変化指標値F[n]と数式(4A)の閾値TH[n]とを比較する。変化指標値F[n]が閾値TH[n]を上回る場合(すなわち、正側ピークQP[n-1]が倍音成分に相当する場合)、周期特定部44は、正側ピークQP[n-1]を無視した図2の間隔ΔPからピッチ周期Tpを特定する。例えば、周期特定部44は、間隔ΔPをピッチ周期Tpとして出力する。一方、変化指標値F[n]が閾値TH[n]を下回る場合(すなわち、正側ピークQP[n-1]が基音成分に相当する場合)、周期特定部44は、正側ピークQP[n-1]を考慮した図3の間隔ΔP[n-1]と間隔ΔP[n]とからピッチ周期Tpを特定する。例えば、間隔ΔP[n-1]および間隔ΔP[n]の平均値(あるいは一方の数値)がピッチ周期Tpとして出力される。
第3実施形態においては、正側ピークQP[n-1]をピッチ周期Tpの特定に適用するか否かが変化指標値F[n]に応じて判断されるから、第1実施形態と同様に、音響信号Aが倍音成分を含む場合であってもピッチ周期Tpを正確に特定することが可能である。また、負側ピークQMの強度LMについての演算が省略されるから、第1実施形態と比較して演算処理装置12の負荷が軽減されるという利点もある。もっとも、1実施形態においては、正側ピークQP[n-1]の強度LPおよび負側ピークQMの強度LMの双方が考慮されるから、第3実施形態と比較して正確なピッチ周期Tpを特定できるという利点がある。
なお、以上の例示においては正側ピークQPの強度LPのみからピッチ周期Tpを算定したが、負側ピークQMの強度LMのみからピッチ周期Tpを算定する構成も好適である。例えば、負側ピークQMの強度LM(LM[n-2]〜LM[n])から以下の数式(1B)および数式(4B)で算定される変化指標値F[n]と閾値TH[n]とを比較部42が比較する。変化指標値F[n]が閾値TH[n]を上回る場合、周期特定部44は、負側ピークQM[n-1]を無視した図2の間隔ΔMからピッチ周期Tpを特定する。一方、変化指標値F[n]が閾値TH[n]を下回る場合、周期特定部44は、負側ピークQM[n-1]を考慮した図3の間隔ΔM[n-1]と間隔ΔM[n]とからピッチ周期Tpを特定する。
F[n]=abs(E_LM[n]−LM[n-1]) ……(1B)
TH[n]=E_LM[n]×α ……(4B)
また、音響信号Aが所定の状態(安定状態,立上がり状態,立下がり状態)に該当しない場合にピッチ周期Tpの特定を停止する第2実施形態の構成は、正側ピークQPの強度LPおよび負側ピークQMの強度LMの一方のみからピッチ周期Tpを特定する第3実施形態にも同様に適用される。
<D:変形例>
以上に例示した各形態には様々な変形が加えられる。具体的な変形の態様を例示すれば以下の通りである。なお、以下の例示から2以上の態様を任意に選択して組合せてもよい。
(1)変形例1
以上の各形態においては、正側ピークQPの強度LPの平均値E_LP[n]や負側ピークQMの強度LMの平均値E_LM[n]に応じて閾値TH[n]を可変に設定したが(数式(4),数式(4A),数式(4B))、例えば音響信号Aの強度(LP,LM)の変化を考慮する必要がない場合(例えば音響信号Aの強度が所定の範囲内にあることが事前に判明している場合)には、閾値TH[n]を、強度LPや強度LMに依存しない固定値に設定した構成も採用される。
(2)変形例2
以上の各形態の周期特定装置100はピッチ周期Tpを出力するが、実際に出力および利用される情報はピッチ周期Tpに限定されない。例えば、周期特定部44が特定したピッチ周期Tpに対応するピッチ(基本周波数)を出力する構成や、ピッチ周期Tpに対応する音高を指定する番号(ノートナンバ)を出力する構成も好適である。
(3)変形例3
以上の各形態においては正側ピークQP[n]および負側ピークQM[n]の対毎にピッチ周期Tpを特定したが、ピッチ周期Tpを算定する周期は任意に変更される。例えば、正側ピークQPや負側ピークQMとは無関係に音響信号Aを時間軸上で区分した複数の区間の各々を単位として、以上の各形態にて例示した方法でピッチ周期Tpを特定する構成も好適である。
本発明の第1実施形態に係る周期特定装置のブロック図である。 音響信号の波形図である。 音響信号の波形図である。 立上がり状態にある音響信号の波形図である。 立下がり状態にある音響信号の波形図である。 第2実施形態に係る周期特定装置のブロック図である。 第2実施形態における動作のフローチャートである。
符号の説明
100……周期特定装置、12……演算処理装置、14……記憶装置、22……フィルタ部、24……ピーク検出部、30……演算部、32……指標算定部、34……閾値設定部、42……比較部、44……周期特定部、50……状態判定部。

Claims (6)

  1. 音響信号の複数の正側ピークの各々の強度と複数の負側ピークの各々の強度とを特定するピーク検出手段と、
    前記複数の正側ピークのうち第n番目(nは自然数)および第(n-2)番目の正側ピークの強度の第1平均値と第(n-1)番目の正側ピークの強度との差分値の絶対値と、前記複数の負側ピークのうち第n番目および第(n-2)番目の負側ピークの強度の第2平均値と第(n-1)番目の負側ピークの強度との差分値の絶対値とを加算することで変化指標値を算定する指標算定手段と、
    前記変化指標値と閾値とを比較する比較手段と、
    前記変化指標値が前記閾値を下回る場合に、第(n-2)番目および第(n-1)番目の正側ピークの間隔と、第(n-1)番目および第n番目の正側ピークの間隔と、第(n-2)番目および第(n-1)番目の負側ピークの間隔と、第(n-1)番目および第n番目の負側ピークの間隔との少なくともひとつから前記音響信号のピッチ周期を特定し、前記変化指標値が前記閾値を上回る場合に、第(n-2)番目および第n番目の正側ピークの間隔と、第(n-2)番目および第n番目の負側ピークの間隔との少なくともひとつから前記音響信号のピッチ周期を特定する周期特定手段と
    を具備する周期特定装置。
  2. 前記第1平均値と前記第2平均値との差分値から前記閾値を算定する閾値設定手段
    を具備する請求項1の周期特定装置。
  3. 音響信号における同符号の複数のピークの各々の強度を特定するピーク検出手段と、
    前記複数のピークのうち第n番目(nは自然数)および第(n-2)番目のピークの強度の平均値と第(n-1)番目のピークの強度との差分値の絶対値に応じた変化指標値を算定する指標算定手段と、
    前記変化指標値と閾値とを比較する比較手段と、
    前記変化指標値が前記閾値を下回る場合に、第(n-2)番目および第(n-1)番目のピークの間隔と第(n-1)番目および第n番目のピークの間隔との少なくともひとつから前記音響信号のピッチ周期を特定し、前記変化指標値が前記閾値を上回る場合に、第(n-2)番目および第n番目のピークの間隔から前記音響信号のピッチ周期を特定する周期特定手段と
    を具備する周期特定装置。
  4. 前記周期特定手段は、前記音響信号の波形が立上がり状態と立下がり状態と安定状態との何れにも該当しない場合に、前記音響信号のピッチ周期の特定を停止する
    請求項1から請求項3の何れかの周期特定装置。
  5. 音響信号の複数の正側ピークの各々の強度と複数の負側ピークの各々の強度とを特定するピーク検出処理と、
    前記複数の正側ピークのうち第n番目(nは自然数)および第(n-2)番目の正側ピークの強度の第1平均値と第(n-1)番目の正側ピークの強度との差分値の絶対値と、前記複数の負側ピークのうち第n番目および第(n-2)番目の負側ピークの強度の第2平均値と第(n-1)番目の負側ピークの強度との差分値の絶対値とを加算することで変化指標値を算定する指標算定処理と、
    前記変化指標値と閾値とを比較する比較処理と、
    前記変化指標値が前記閾値を下回る場合に、第(n-2)番目および第(n-1)番目の正側ピークの間隔と、第(n-1)番目および第n番目の正側ピークの間隔と、第(n-2)番目および第(n-1)番目の負側ピークの間隔と、第(n-1)番目および第n番目の負側ピークの間隔との少なくともひとつから前記音響信号のピッチ周期を特定し、前記変化指標値が前記閾値を上回る場合に、第(n-2)番目および第n番目の正側ピークの間隔と、第(n-2)番目および第n番目の負側ピークの間隔との少なくともひとつから前記音響信号のピッチ周期を特定する周期特定処理と
    をコンピュータに実行させるプログラム。
  6. 音響信号における同符号の複数のピークの各々の強度を特定するピーク検出処理と、
    前記複数のピークのうち第n番目(nは自然数)および第(n-2)番目のピークの強度の平均値と第(n-1)番目のピークの強度との差分値の絶対値に応じた変化指標値を算定する指標算定処理と、
    前記変化指標値と閾値とを比較する比較処理と、
    前記変化指標値が前記閾値を下回る場合に、第(n-2)番目および第(n-1)番目のピークの間隔と第(n-1)番目および第n番目のピークの間隔との少なくともひとつから前記音響信号のピッチ周期を特定し、前記変化指標値が前記閾値を上回る場合に、第(n-2)番目および第n番目のピークの間隔から前記音響信号のピッチ周期を特定する周期特定処理と
    をコンピュータに実行させるプログラム。
JP2008311865A 2008-12-08 2008-12-08 周期特定装置およびプログラム Expired - Fee Related JP5131172B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008311865A JP5131172B2 (ja) 2008-12-08 2008-12-08 周期特定装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008311865A JP5131172B2 (ja) 2008-12-08 2008-12-08 周期特定装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2010134319A JP2010134319A (ja) 2010-06-17
JP5131172B2 true JP5131172B2 (ja) 2013-01-30

Family

ID=42345655

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008311865A Expired - Fee Related JP5131172B2 (ja) 2008-12-08 2008-12-08 周期特定装置およびプログラム

Country Status (1)

Country Link
JP (1) JP5131172B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110060682A (zh) * 2019-04-28 2019-07-26 Oppo广东移动通信有限公司 音箱控制方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5479082A (en) * 1977-12-06 1979-06-23 Atsushi Hasegawa Tuner
JPS60175099A (ja) * 1984-02-21 1985-09-09 カシオ計算機株式会社 ピツチ抽出装置
JPS61185800A (ja) * 1985-02-13 1986-08-19 松下電器産業株式会社 音声ピツチ抽出装置
JPH01101600A (ja) * 1987-10-14 1989-04-19 Matsushita Electric Ind Co Ltd ピッチ周期抽出方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110060682A (zh) * 2019-04-28 2019-07-26 Oppo广东移动通信有限公司 音箱控制方法和装置
CN110060682B (zh) * 2019-04-28 2021-10-22 Oppo广东移动通信有限公司 音箱控制方法和装置

Also Published As

Publication number Publication date
JP2010134319A (ja) 2010-06-17

Similar Documents

Publication Publication Date Title
JP4630980B2 (ja) 音高推定装置、音高推定方法およびプログラム
US9837809B2 (en) Arc detection apparatus, arc detecting method, and power system
US10242697B2 (en) Pitch information generation device, pitch information generation method, and computer-readable recording medium therefor
JP5131172B2 (ja) 周期特定装置およびプログラム
JP4953068B2 (ja) 和音判別装置、和音判別方法およびプログラム
CN110321020B (zh) 一种压电传感器信号噪声去除方法及装置
CN111164684A (zh) 数字声音处理装置、数字声音处理方法及数字声音处理程序
WO2017002242A1 (ja) 電力対策支援システム、電力対策支援装置、電力対策支援方法及び電力対策支援プログラム
JP4630983B2 (ja) 音高推定装置、音高推定方法およびプログラム
JP5023794B2 (ja) デジタル音声処理装置及びデジタル音声処理プログラム
JP6462481B2 (ja) スキル評価装置、スキル評価方法、プログラム、及び記録媒体
JP4877076B2 (ja) 共鳴音付加装置および共鳴音付加プログラム
JP5513074B2 (ja) グリッド検出装置及びプログラム
JP2010107689A (ja) ピッチ情報検出装置およびプログラム
EP3291228B1 (en) Audio processing method, audio processing device, and audio processing program
US9779762B2 (en) Object sound period detection apparatus, noise estimating apparatus and SNR estimation apparatus
JP4630982B2 (ja) 音高推定装置、音高推定方法およびプログラム
JP7175395B2 (ja) 楽曲構造解析装置および楽曲構造解析プログラム
JP6438786B2 (ja) 信号中に含まれる正弦成分抽出装置、正弦成分抽出方法及びプログラム
JP7176113B2 (ja) 楽曲構造解析装置および楽曲構造解析プログラム
CN112908289B (zh) 节拍确定方法、装置、设备和存储介质
JP2009150920A (ja) エコーキャンセル装置、カラオケ装置、エコーキャンセル方法およびプログラム
JP2008209546A (ja) 音高推定装置、音高推定方法およびプログラム
JP2005217769A (ja) デジタルリミッタ回路
JP2020154149A (ja) オーディオ信号の処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111020

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121001

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121009

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121022

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151116

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5131172

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees