JP2005503580A - 二段階ピッチ判断方法および装置 - Google Patents

二段階ピッチ判断方法および装置 Download PDF

Info

Publication number
JP2005503580A
JP2005503580A JP2003522079A JP2003522079A JP2005503580A JP 2005503580 A JP2005503580 A JP 2005503580A JP 2003522079 A JP2003522079 A JP 2003522079A JP 2003522079 A JP2003522079 A JP 2003522079A JP 2005503580 A JP2005503580 A JP 2005503580A
Authority
JP
Japan
Prior art keywords
pitch
autocorrelation
error range
range
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003522079A
Other languages
English (en)
Other versions
JP4217616B2 (ja
Inventor
ジョン,ドイル
ソ,ハンソック
Original Assignee
アミューズテック カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アミューズテック カンパニー リミテッド filed Critical アミューズテック カンパニー リミテッド
Publication of JP2005503580A publication Critical patent/JP2005503580A/ja
Application granted granted Critical
Publication of JP4217616B2 publication Critical patent/JP4217616B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals

Abstract

本発明は、ピッチ判断方法および装置に関するものであって、外部から入力されるデジタル信号を周波数成分に分解した後、該周波数成分値に基づいてピッチ候補を導出するステップと、前記第ピッチ候補の誤差範囲と前記ピッチ候補の誤差範囲により算出された自己相関範囲に対する自己相関結果の誤差範囲とを比較するステップと、前記比較の結果、自己相関結果の誤差範囲がピッチ候補の誤差範囲以下である場合、前記デジタル信号の所定の時間領域に対する自己相関を行って周波数分析による周波数範囲と該周波数範囲内で自己相関値が最も大きな周波数範囲の交差領域を最終ピッチと決定するステップとを含むことを特徴とする。従って、外部から入力されるデジタル信号に対する周波数分析および自己相関を順に行ってピッチ判断結果に対する誤差範囲を減らすことで、より正確なピッチ判断結果が期待できる効果を奏する。

Description

【技術分野】
【0001】
本発明は、ピッチ判断方法および装置に関し、特に、外部から入力されるデジタル信号に対する周波数分析および自己相関を順に行うことにより、ピッチ判断結果の誤差範囲を減らすことを特徴とする二段階ピッチ判断方法および装置に関する。
【背景技術】
【0002】
リアルタイムで演奏される楽器の演奏音または人の声に関するピッチ(周波数)を判断する技術は、その楽器の演奏音または人の声に関する演奏情報データを抽出し、または、リアルタイム音楽との合奏などのために継続して研究が行われている。
【0003】
かかるピッチ判断のために通常使用される方法としては、デジタル信号に変換された演奏音または声に関する周波数を分析する方法、繰り返されるウェーブの周期計算のためのウェーブ波形のピーク(peak)またはゼロ交差(zero−crossing)周期計算方法、ウェーブ波形の自己相関を用いる方法などがある。
【0004】
ここで、前記周波数分析方法では、高周波帯域および低周波帯域における誤差は同じであるが、これを楽器のピッチ導出に用いる場合、音間周波数間隔が相対的に近い低周波帯域において誤差によるピッチ判断のエラー確率が大きくなるという短所がある。また、自己相関を用いる方法では、その計算の特性上、高周波帯域における誤差が大きいという問題点がある。
【0005】
なお、ピークまたはゼロ交差周期計算方法は、雑音(noise)などによって正確な周期を算出することが難しく、その結果が正確でないという問題点がある。
【発明の開示】
【0006】
本発明は、前述のような従来の問題点を解決するためになされたものであって、本発明の目的は、外部から入力されるデジタル信号に対して周波数分析を行った後、その周波数分析の結果に応じて選択された所定の時間領域に対する自己相関を行うことにより、より正確なピッチを導出することを特徴とする二段階ピッチ判断方法および装置を提供することにある。
【0007】
前述の目的を達成するための本発明に係る二段階ピッチ判断方法は、外部から入力されるデジタル信号を周波数成分に分解した後、該周波数成分値に基づいて第1のピッチ候補を導出する第1のステップと、前記第1のピッチ候補の誤差範囲と前記第1のピッチ候補の誤差範囲により算出された自己相関範囲に対する自己相関結果の誤差範囲とを比較する第2のステップと、前記比較の結果、自己相関結果の誤差範囲がピッチ候補の誤差範囲以下である場合、前記デジタル信号の所定の時間領域に対する自己相関を行ってピッチを導出する第3のステップとを含むことを特徴とする。
【0008】
また、前述の目的を達成するための本発明に係る二段階ピッチ判断装置は、外部から入力されるデジタル信号を周波数成分に分解した後、該周波数成分値に基づいて第1のピッチ候補を導出する周波数分析部と、前記第1のピッチ候補の誤差範囲と前記第1のピッチ候補の誤差範囲により算出された自己相関範囲に対する自己相関結果の誤差範囲とを比較する誤差範囲比較部と、前記前記誤差範囲比較部の比較結果、前記自己相関結果の誤差範囲が前記第1のピッチ候補の誤差範囲以下である場合、前記デジタル信号の所定の時間領域に対する自己相関を行って第2のピッチ候補を導出する自己相関計算部と、前記第1のピッチ候補の誤差範囲および前記第2のピッチ候補の誤差範囲に基づいてピッチを決定するピッチ決定部と、前記ピッチ決定部で決定されたピッチを出力する結果出力部とを備えることを特徴とする。
【発明を実施するための最良の形態】
【0009】
以下、本発明に係る二段階ピッチ判断方法および装置に係る好適な実施例を、添付の図面に基づいて詳細に説明する。
【0010】
図1は、本発明の一実施例に係る二段階ピッチ判断装置を示す概略的なブロック図である。同図に示されたように、本発明の実施例に係る二段階ピッチ判断装置は、音楽情報入力部(10)、音有無判別部(20)、周波数分析部(30)、誤差範囲比較部(40)、自己相関計算部(50)、ピッチ決定部(60)、結果出力部(70)を備えてなる。
【0011】
音楽情報入力部(10)は、マイクを介して入力されるアナログ信号をデジタル信号に変化し、または、既に変換過程を経て生成されたデジタル信号を受け取る。
【0012】
音有無判別部(20)は、音楽情報入力部(10)を介して受け取られた信号の強さを感知して音の有無を判断する。即ち、音楽情報入力部(10)を介して受け取られた信号の強さが、周辺環境などを考慮し、既に設定された雑音の強さより大きな場合は、音楽音の信号が入力されたものと判断する。
【0013】
周波数分析部(30)は、音有無判別部(20)を介して入力されるデジタル音響を周波数成分に分解した後、該周波数成分値に基づいて第1のピッチ候補を導出する。この時、周波数分析によるピッチ導出方法は、公知の技術であって、多様な方法の適用が可能であるが、例えば、周波数成分値を分析してピッチの位置を抽出した後、それらのピッチ間の間隔をピッチ候補として導出する方法や多数のピークのうち最大ピークの位置をピッチ候補として導出する方法などを適用することが可能である。なお、デジタル音響を周波数成分に分解する方法としては、一般に高速フーリエ変換(FFT)を用いるが、ウェーブレット(wavelet)変換のような他の方法を用いることも可能である。
【0014】
誤差範囲比較部(40)は、周波数分析部(30)を介して導出された第1のピッチ候補の誤差範囲(R1)と、該誤差範囲(R1)により算出された自己相関範囲(L1)に対する自己相関結果の誤差範囲(R2)とを比較する。この時、第1のピッチ候補の誤差範囲(R1)、自己相関範囲(L1)、自己相関範囲(L1)に対する自己相関結果の誤差範囲(R2)は、リアルタイムで算出されるか、または、予め計算されて分類格納された値を用いることを特徴とする。
【0015】
自己相関計算部(50)は、誤差範囲比較部(40)の比較結果、自己相関結果の誤差範囲(R2)が第1のピッチ候補の誤差範囲(R1)以下である場合、デジタル信号の所定の時間領域に対する自己相関を行って第2のピッチ候補を導出する。なお、所定の時間領域とは、誤差範囲比較部(40)で算出された自己相関範囲によって決定され、所定の範囲内で前記自己相関範囲を変化させて適用することも可能である。即ち、デジタル信号の根元(例えば、楽器の種類または人の音)や目的に応じて自己相関範囲を変化させて適用することができる。
【0016】
前述のように自己相関範囲が決定されると、自己相関計算部(50)は、当該範囲に対して自己相関を行った後、その自己相関係数が最高であるラグ(Lag)を導出し、該ラグにより当該デジタル信号に対する第2のピッチ候補を導出する。
【0017】
ピッチ決定部(60)は、第1のピッチ候補の誤差範囲および第2のピッチ候補の誤差範囲に基づいてピッチを決定するが、誤差範囲比較部(40)の比較結果を参照する。即ち、誤差範囲比較部(40)の比較結果、自己相関結果の誤差範囲が第1のピッチ候補の誤差範囲以下である場合、第2のピッチ候補の誤差範囲内でピッチを決定し、そうでない場合は、第1のピッチ候補の誤差範囲内でピッチを決定する。なお、前記第2のピッチ候補を導出するためのラグ(Lag)値が前記第1の候補の誤差範囲により算出された自己相関範囲の上限値または下限値である場合は、前記第1のピッチ候補の誤差範囲と第2のピッチ候補の誤差範囲との交差領域内でピッチを決定する。
【0018】
結果出力部(70)は、ピッチ決定部(60)で決定されたピッチを出力する。
【0019】
また、図2は、本発明の一実施例に係る二段階ピッチ判断方法を示す処理フローチャートであり、以下、同図を参照して本発明の一実施例に係る二段階ピッチ判断方法を説明する。
【0020】
先ず、外部からデジタル信号が入力されると(S210)、該信号のレベルと周辺環境などにより予め設定された雑音(noise)のレベルとを比較し、信号のレベルが雑音のレベルより高い場合、信号が入力されたものとみなして周波数分析を行う(S220)。即ち、入力されたデジタル信号に対する周波数分析を行って第1のピッチ候補を導出する。なお、周波数分析によりピッチ候補を導出するための具体的な方法および周波数変換方法は、公知の技術であり、図1の「周波数分析部(30)」に関連した部分で説明されているため、具体的な説明は、省略する。
【0021】
前述のように周波数分析による第1のピッチ候補が導出されると、該第1のピッチ候補に対する誤差範囲(R1)を算出し(S230)、該誤差範囲による自己相関範囲(Lag範囲)(L1)を算出した後(S240)、該自己相関範囲(Lag範囲)に対する自己相関結果の誤差範囲(R2)を算出する(S250)の一連の過程を行う。なお、前記第1のピッチ候補に対する誤差範囲(R1)、自己相関範囲(L1)および自己相関結果の誤差範囲(R2)は、予め計算された値を用いることもできる。この場合、前記ステップ(S230乃至S250)は、省略することができる。
【0022】
また、第1のピッチ候補の誤差範囲(R1)と自己相関結果の誤差範囲(R2)とを比較し(S260)、自己相関結果の誤差範囲(R2)がピッチ候補の誤差範囲(R1)以下の値である場合、該自己相関範囲(L1)により決定された所定の時間領域に対するデジタル信号の自己相関を行って第2のピッチ候補を導出する(S270)。また、第1のピッチ候補の誤差範囲と第2のピッチ候補の誤差範囲との交差領域でピッチを判断する(S280)。そうでない場合、即ち、自己相関結果の誤差範囲(R2)がピッチ候補の誤差範囲(R1)より大きな場合、周波数分析により導出された第1のピッチ候補をピッチと決定する(S290)。
【0023】
ここで、前記第1のピッチ候補の誤差範囲と第2のピッチ候補の誤差範囲との交差領域は、一般の場合は別に計算する必要がないが、前記第2のピッチ候補を導出するためのラグ値が、前記ステップS240により算出された自己相関範囲(Lag範囲)の上限値または下限値である場合、前記交差領域を別に計算するステップを経る必要がある。
本発明は、前述のように当該デジタル信号に対する周波数分析と自己相関を順に行うことにより、より正確なピッチを導出することが可能となる。
【0024】
以下、サンプリングレート(Sampling Rate)が22,050Hzで、FFT変換のためのウインドーサイズ(Window Size)が1024である場合、本発明によってピッチを導出するための処理過程を数式を参照して説明すると、次の通りである。
【0025】
先ず、前記条件により周波数分析を行う場合、FFT変換のための単位区間(以下、「index」という)内での周波数導出方法は、[数式1]で求められる。この時、FFT変換のためのindexは、FFT変換のためのウインドーサイズにより決定され、FFT変換のためのウインドーサイズが1024である場合、indexは、1〜1024内で決定される。
【0026】
【数1】
Figure 2005503580
【0027】
この時、実際周波数の範囲(FR)は、[数式2]により決定される。
【0028】
【数2】
Figure 2005503580
【0029】
従って、ピアノのC3ノートをFFT分析した結果、基本周波数に対するピークのindexが「7」である場合、その値と前記条件を[数式1]および[数式2]に代入してindexが「7」である場合、即ち、7番目周波数に対する周波数変換結果および実際周波数の範囲を求めると[数式3]および[数式4]となる。
【0030】
即ち、[数式3]は、周波数変換結果に対する計算結果を示し、[数式4]は、当該誤差範囲に対する計算結果を示す。
【0031】
【数3】
Figure 2005503580
【0032】
【数4】
Figure 2005503580
【0033】
従って、上記の条件により任意のデジタル信号に対するFFT変換結果、第1のピッチ候補は、139.96Hz(129.19〜150.73)となり、該第1のピッチ候補の誤差範囲(R1)は、その周波数範囲(FRFFT)により21.53Hz((150.73−129.19)となる。
【0034】
なお、かかる誤差範囲(R1)による自己相関範囲(L1)は、次の[数式5]により計算可能である。
【0035】
【数5】
Figure 2005503580
【0036】
上記の例では、周波数範囲の最大周波数(Maximum frequency)は、150.73であり、最小周波数(Minimum frequency)は、129.19Hzであるため、これらの値を[数式5]に適用して計算する場合、上記の例に対する自己相関範囲(L1)は、次の[数式6]となる。
【0037】
【数6】
Figure 2005503580
【0038】
=146.29~170.67
≒147~171
即ち、上記の例では、自己相関範囲は、147〜171となる。
【0039】
なお、自己相関による誤差範囲(R2)は、ラグ値により変動するが、自己相関により導出される周波数の範囲(FRCOR)は、[数式7]により計算することができる。
【0040】
【数7】
Figure 2005503580
【0041】
従って、前記自己相関範囲に相当するラグ値(147〜171)のうち最も低いラグ値が、最も大きな周波数範囲を有することとなる。ラグが147である時の周波数範囲は、[数式8]の通りである。
【0042】
【数8】
Figure 2005503580
【0043】
従って、上記の条件によりラグが147〜171である時のデジタル信号に対する自己相関結果導出される最も大きな誤差を有する周波数範囲は、(150.51〜149.49)Hzとなり、周波数の誤差範囲(R2)は、周波数の範囲(FRCOR)により1.02Hz(150.51〜149.49)となる。
【0044】
即ち、自己相関結果の誤差範囲(R2、1.02Hz)が周波数変換結果の誤差範囲(R1、21.53Hz)以下であることがわかる。従って、この場合、自己相関を適用してピッチを導出することとなる。
【0045】
たとえ、自己相関結果の誤差範囲(R2)が周波数変換結果の誤差範囲(R1)より大きな場合は、自己相関を行うことなく周波数変換値をピッチと決定する。換言すると、周波数変換結果の誤差範囲内でピッチ周波数を決定する。
【0046】
これらの値は、新しい音が入力され、これらに対するピッチ検出が要求される度にリアルタイムで算出することができ、予め設定されたサンプリングレート(Sampling Rate)およびFFT変換のためのウインドーサイズ(FFT Window Size)により予め計算して別の格納装置に格納することもできる。
【0047】
図3A乃至図3Dは、本発明の二段階ピッチ判断方法を説明するための例示的な波形図である。
【0048】
図3Aは、外部から入力されるウェーブ(wave)波形を示し、図3Bは、図3Aに示されたウェーブ波形を自己相関して示す結果を示し、図3Cは、図3Aに示されたウェーブ波形に対する周波数分析結果を示し、図3Dは、図3Aに対する周波数分析結果決定された自己相関範囲に対する自己相関結果を示す。
【0049】
即ち、図3Bは、外部から入力された波形全体に対する自己相関結果を示す図であって、この場合、ラグタイムが100〜200である地点の最高ピーク位置が実際ピッチであるにもかかわらず、ラグタイムが0〜100の地点で最高ピーク値を示す地点またはラグタイムが300〜400の地点で最高ピーク値を示す地点をピッチとして判別する間違いを犯すようになる。
【0050】
なお、図3Cは、外部から入力された波形に対する周波数分析結果を示す図であって、この場合は、二番目ピークがピッチであるにもかかわらず、当該ピッチの二倍数ハーモニック周波数である4番目ピークをピッチと判読する間違いを犯すようになる。
図3Dは、本発明の実施例において周波数分析結果により決定された自己相関範囲(即ち、ラグタイム)に対して自己相関を行った結果を示す図であって、この場合、正確なピッチを判読することが可能である。
【0051】
特に、図3Cおよび図3Dに示されたように、ピアノのC3音である場合に最も大きなピークのFFT indexは、7であり、ラグが171である場合に最も大きな自己相関値を有し、そのラグ値を[数式7]に代入すると、当該周波数範囲は、128.57〜129.32Hzであることがわかる。なお、[数式3]により前記ピアノC3音に対するFFT結果による周波数範囲は、129.19〜150.73Hzである。従って、ピアノC3音に対するFFT結果の周波数範囲と自己相関結果の周波数範囲との交差領域を求めると、最終ピッチの範囲は、129.19〜129.32Hzとなる。
【0052】
この時、FFT結果の周波数範囲と自己相関結果の周波数範囲に対する交差領域を求めることは、自己相関の時に参照されたラグ値が、ラグ範囲(147〜171)の上限値であるためである。
【0053】
前述の例では、ミディノートC3での基本周波数が130.8Hzである点から、使用されたピアノのチューニングが少し低くなっていることがわかり、通常、かかるピアノのチューニング状態での誤差により、ピアノのノートの基本周波数とミディノートの基本周波数とがある程度差異が出るのが一般である。従って、本発明によるピッチ導出において正確な結果値が得られる。
【0054】
以上、図面を参照して本発明の実施例を説明したが、これは、一例にすぎず、本発明の保護範囲は、前述の実施例に限定されるものではなく、特許請求の範囲を逸脱しない範囲内で種々の変更が可能である。例えば、本発明の実施例において具体的に示された各構成要素の形状および構造は、変更して実施することが可能である。
【産業上の利用可能性】
【0055】
以上のように、本発明によれば、外部から入力されるデジタル信号に対して周波数分析を行った後、該周波数分析の結果により選択された所定の時間領域に対する自己相関を選択的に行うことにより、低周波帯域において誤差によるピッチ導出の誤りが大きいという周波数分析方法の問題点および高周波帯域において誤差が大きいという自己相関方法の問題点を解決することができる。従って、本発明は、より正確なピッチを導出することができるという効果を奏する。
【0056】
また、自己相関を行う時、サンプルサイズの全体デジタル信号に対する自己相関係数を全て求めてその値を比較するのでなく、周波数分析結果により選択された所定の時間領域に対する自己相関係数を求めた後、その値を比較することで、自己相関係数を求め、それらのうちの最大値を求めることにかかる時間を減らすことができるという効果も得られる。
【図面の簡単な説明】
【0057】
【図1】図1は、本発明の一実施例に係る二段階ピッチ判断装置を示すブロック図である。
【図2】図2は、本発明の一実施例に係る二段階ピッチ判断方法を示す処理フローチャートである。
【図3A】図3Aは、本発明の二段階ピッチ判断方法を説明するための例示的な波形図である。
【図3B】図3Bは、本発明の二段階ピッチ判断方法を説明するための例示的な波形図である。
【図3C】図3Cは、本発明の二段階ピッチ判断方法を説明するための例示的な波形図である。
【図3D】図3Dは、本発明の二段階ピッチ判断方法を説明するための例示的な波形図である。

Claims (13)

  1. 外部から入力されるデジタル信号を周波数成分に分解した後、該周波数成分値に基づいて第1のピッチ候補を導出する第1のステップと、
    前記第1のピッチ候補の誤差範囲と前記第1のピッチ候補の誤差範囲により算出された自己相関範囲に対する自己相関結果の誤差範囲とを比較する第2のステップと、
    前記比較の結果、自己相関結果の誤差範囲がピッチ候補の誤差範囲以下である場合、前記デジタル信号の所定の時間領域に対する自己相関を行ってピッチを導出する第3のステップと、
    を含むことを特徴とする二段階ピッチ判断方法。
  2. 第1項において、前記第2のステップは、
    前記第1のピッチ候補の誤差範囲を算出する第2−1のステップと、
    前記第1のピッチ候補の誤差範囲によって前記デジタル信号に対する自己相関範囲を算出する第2−2のステップと、
    前記自己相関範囲に対する自己相関結果の誤差範囲を算出する第2−3のステップと、
    前記第1のピッチ候補の誤差範囲と前記自己相関結果の誤差範囲とを比較する第2−4のステップと、
    を含むことを特徴とする二段階ピッチ判断方法。
  3. 第1項または第2項において、前記第2のステップは、
    予め計算されて分類格納された情報に基づいて、周波数分析により決定された全ての周波数に対する誤差範囲と、該誤差範囲による自己相関範囲および自己相関結果値を導出することを特徴とする二段階ピッチ判断方法。
  4. 第1項において、前記第3のステップは、
    前記第2のステップで算出された自己相関範囲により決定された前記デジタル信号の所定の時間領域に対する自己相関を行う第3−1の過程と、
    前記自己相関の結果、自己相関係数が最高であるラグ(Lag)を導出する第3−2のステップと、
    前記ラグにより当該デジタル信号に対する第2のピッチ候補を導出した後、該第2のピッチ候補からピッチを導出する第3−3のステップと、
    を含むことを特徴とする二段階ピッチ判断方法。
  5. 第4項において、前記第3−1のステップは、
    前記デジタル信号に対する自己相関のための時間領域を所定の範囲内で変化させて適用することを特徴とする二段階ピッチ判断方法。
  6. 第4項において、前記第3−3のステップは、
    前記第3−2のステップで導出されたラグが前記第2のステップで算出された自己相関範囲の上限値または下限値である場合、前記第2のピッチ候補の誤差範囲と前記第1のピッチ候補の誤差範囲との交差領域でピッチを決定し、そうでない場合は、前記第2のピッチ候補の誤差範囲でピッチを決定することを特徴とする二段階ピッチ判断方法。
  7. 第1項または第4項または第5項または第6項において、前記第3のステップは、
    前記第2のステップでの比較結果、自己相関結果の誤差範囲が第1のピッチ候補の誤差範囲より大きな場合、前記第1のピッチ候補の誤差範囲領域でピッチを決定することを特徴とする二段階ピッチ判断方法。
  8. 外部から入力されるデジタル信号を周波数成分に分解した後、該周波数成分値に基づいて第1のピッチ候補を導出する周波数分析部と、
    前記第1のピッチ候補の誤差範囲と前記第1のピッチ候補の誤差範囲により算出された自己相関範囲に対する自己相関結果の誤差範囲とを比較する誤差範囲比較部と、
    前記誤差範囲比較部の比較結果、前記自己相関結果の誤差範囲が前記第1のピッチ候補の誤差範囲以下である場合、前記デジタル信号の所定の時間領域に対する自己相関を行って第2のピッチ候補を導出する自己相関計算部と、
    前記第1のピッチ候補の誤差範囲および前記第2のピッチ候補の誤差範囲に基づいてピッチを決定するピッチ決定部と、
    前記ピッチ決定部で決定されたピッチを出力する結果出力部と、
    を備えることを特徴とする二段階ピッチ判断装置。
  9. 第8項において、前記誤差範囲比較部は、
    予め計算されて分類格納された情報に基づいて、周波数分析により決定された全ての周波数に対する誤差範囲と、該誤差範囲による自己相関範囲および自己相関結果値を導出することを特徴とする二段階ピッチ判断装置。
  10. 第8項において、前記自己相関計算部は、
    前記誤差範囲比較部で算出された自己相関範囲により決定された前記デジタル信号の所定の時間領域に対する自己相関を行って自己相関係数が最高であるラグを導出した後、該ラグにより当該デジタル信号に対する第2のピッチ候補を導出することを特徴とする二段階ピッチ判断装置。
  11. 第10項において、前記自己相関計算部は、
    前記デジタル信号の自己相関範囲を所定の範囲内で変化させて適用することを特徴とする二段階ピッチ判断装置。
  12. 第8項において、前記ピッチ決定部は、
    前記誤差範囲比較部の比較結果、前記自己相関結果の誤差範囲が前記第1のピッチ候補の誤差範囲以下である場合、前記第1のピッチ候補および第2のピッチ候補に基づいてピッチを決定し、
    前記誤差範囲比較部の比較結果、前記自己相関結果の誤差範囲が前記第1のピッチ候補の誤差範囲より大きな場合、前記第1のピッチ候補の誤差範囲内でピッチを決定することを特徴とする二段階ピッチ判断装置。
  13. 第8項または第10項または第12項において、前記ピッチ決定部は、
    自己相関係数が最高であるラグが前記誤差範囲比較部で算出された自己相関範囲の上限値または下限値である場合、前記第2のピッチ候補の誤差範囲と前記第1のピッチ候補の誤差範囲との交差領域でピッチを決定し、そうでない場合は、前記第2のピッチ候補の誤差範囲でピッチを決定することを特徴とする二段階ピッチ判断装置。
JP2003522079A 2001-07-27 2002-07-26 二段階ピッチ判断方法および装置 Expired - Fee Related JP4217616B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2001-0045563A KR100393899B1 (ko) 2001-07-27 2001-07-27 2-단계 피치 판단 방법 및 장치
PCT/KR2002/001423 WO2003017250A1 (en) 2001-07-27 2002-07-26 2-phase pitch detection method and appartus

Publications (2)

Publication Number Publication Date
JP2005503580A true JP2005503580A (ja) 2005-02-03
JP4217616B2 JP4217616B2 (ja) 2009-02-04

Family

ID=19712642

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003522079A Expired - Fee Related JP4217616B2 (ja) 2001-07-27 2002-07-26 二段階ピッチ判断方法および装置

Country Status (8)

Country Link
US (1) US7012186B2 (ja)
EP (1) EP1436805B1 (ja)
JP (1) JP4217616B2 (ja)
KR (1) KR100393899B1 (ja)
CN (1) CN1216362C (ja)
AT (1) ATE338330T1 (ja)
DE (1) DE60214409T2 (ja)
WO (1) WO2003017250A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4755585B2 (ja) * 2003-03-31 2011-08-24 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声信号に関する周波数領域および時間領域の複合ピッチ抽出のための方法、分散音声認識システム及びコンピュータ可読媒体

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101199002B (zh) * 2005-06-09 2011-09-07 株式会社A.G.I. 检测音调频率的语音分析器和语音分析方法
US7563975B2 (en) * 2005-09-14 2009-07-21 Mattel, Inc. Music production system
US7752038B2 (en) * 2006-10-13 2010-07-06 Nokia Corporation Pitch lag estimation
KR100970446B1 (ko) * 2007-11-21 2010-07-16 한국전자통신연구원 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법
US8666734B2 (en) 2009-09-23 2014-03-04 University Of Maryland, College Park Systems and methods for multiple pitch tracking using a multidimensional function and strength values
CN104115220B (zh) 2011-12-21 2017-06-06 华为技术有限公司 非常短的基音周期检测和编码
CN103426441B (zh) 2012-05-18 2016-03-02 华为技术有限公司 检测基音周期的正确性的方法和装置
US10249209B2 (en) * 2017-06-12 2019-04-02 Harmony Helper, LLC Real-time pitch detection for creating, practicing and sharing of musical harmonies
US11282407B2 (en) 2017-06-12 2022-03-22 Harmony Helper, LLC Teaching vocal harmonies
CN109813264A (zh) * 2019-02-21 2019-05-28 重庆潍柴发动机有限公司 测量结果误差评估的方法及装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5226108A (en) * 1990-09-20 1993-07-06 Digital Voice Systems, Inc. Processing a speech signal with estimated pitch
US5127053A (en) * 1990-12-24 1992-06-30 General Electric Company Low-complexity method for improving the performance of autocorrelation-based pitch detectors
JP2940835B2 (ja) 1991-03-18 1999-08-25 日本電信電話株式会社 ピッチ周波数差分特徴量抽出法
JPH0736491A (ja) * 1993-07-22 1995-02-07 Matsushita Electric Ind Co Ltd ピッチ抽出装置
US5619004A (en) * 1995-06-07 1997-04-08 Virtual Dsp Corporation Method and device for determining the primary pitch of a music signal
JP3840684B2 (ja) 1996-02-01 2006-11-01 ソニー株式会社 ピッチ抽出装置及びピッチ抽出方法
US5864795A (en) * 1996-02-20 1999-01-26 Advanced Micro Devices, Inc. System and method for error correction in a correlation-based pitch estimator
KR100269216B1 (ko) 1998-04-16 2000-10-16 윤종용 스펙트로-템포럴 자기상관을 사용한 피치결정시스템 및 방법
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6124544A (en) * 1999-07-30 2000-09-26 Lyrrus Inc. Electronic music system for detecting pitch
US6917912B2 (en) * 2001-04-24 2005-07-12 Microsoft Corporation Method and apparatus for tracking pitch in audio analysis
US6653546B2 (en) * 2001-10-03 2003-11-25 Alto Research, Llc Voice-controlled electronic musical instrument

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4755585B2 (ja) * 2003-03-31 2011-08-24 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声信号に関する周波数領域および時間領域の複合ピッチ抽出のための方法、分散音声認識システム及びコンピュータ可読媒体

Also Published As

Publication number Publication date
JP4217616B2 (ja) 2009-02-04
CN1216362C (zh) 2005-08-24
WO2003017250A1 (en) 2003-02-27
EP1436805B1 (en) 2006-08-30
KR100393899B1 (ko) 2003-08-09
CN1552058A (zh) 2004-12-01
DE60214409T2 (de) 2007-09-20
US7012186B2 (en) 2006-03-14
US20040159220A1 (en) 2004-08-19
DE60214409D1 (de) 2006-10-12
EP1436805A4 (en) 2005-06-01
KR20030010898A (ko) 2003-02-06
EP1436805A1 (en) 2004-07-14
ATE338330T1 (de) 2006-09-15

Similar Documents

Publication Publication Date Title
McLeod et al. A smarter way to find pitch
Sukhostat et al. A comparative analysis of pitch detection methods under the influence of different noise conditions
CN111128213B (zh) 一种分频段进行处理的噪声抑制方法及其系统
JP2004538525A (ja) 周波数分析によるピッチ判断方法および装置
KR20060044629A (ko) 신경 회로망을 이용한 음성 신호 분리 시스템 및 방법과음성 신호 강화 시스템
JP4217616B2 (ja) 二段階ピッチ判断方法および装置
Sebastian et al. An analysis of the high resolution property of group delay function with applications to audio signal processing
Teixeira et al. Ulises: a agent-based system for timbre classification
Labied et al. An overview of automatic speech recognition preprocessing techniques
Benetos et al. Auditory spectrum-based pitched instrument onset detection
Nongpiur et al. Impulse-noise suppression in speech using the stationary wavelet transform
Jensen The timbre model
Ouzounov A robust feature for speech detection
Coyle et al. Onset detection using comb filters
Gu et al. A discrete-cepstrum based spectrum-envelope estimation scheme and its example application of voice transformation
Dziubinski et al. Octave error immune and instantaneous pitch detection algorithm
Dziubiński et al. High accuracy and octave error immune pitch detection algorithms
Glover et al. Real-time segmentation of the temporal evolution of musical sounds
Anoop et al. An approach for analysis and identification of Raga of Flute Music using Spectrogram
Prabha et al. Improving Performance of Speech Processing using Hybrid Pitch Estimation in Machine Learning
Kreutzer et al. A parametric model for spectral sound synthesis of musical sounds
NSKI et al. High accuracy and octave error immune pitch detection algorithms
Sarlin Pitch Detection Algorithms and their application on tom drums
JP2734526B2 (ja) ピッチ抽出装置
Triki et al. Perceptually motivated quasi-periodic signal selection for polyphonic music transcription

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050525

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081104

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081110

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111114

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111114

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121114

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees