JP2004538525A - 周波数分析によるピッチ判断方法および装置 - Google Patents
周波数分析によるピッチ判断方法および装置 Download PDFInfo
- Publication number
- JP2004538525A JP2004538525A JP2003519928A JP2003519928A JP2004538525A JP 2004538525 A JP2004538525 A JP 2004538525A JP 2003519928 A JP2003519928 A JP 2003519928A JP 2003519928 A JP2003519928 A JP 2003519928A JP 2004538525 A JP2004538525 A JP 2004538525A
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- frequency
- range
- peak
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 74
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000001514 detection method Methods 0.000 claims description 33
- 238000012790 confirmation Methods 0.000 claims description 4
- 235000006040 Prunus persica var persica Nutrition 0.000 claims description 3
- 240000006413 Prunus persica var. persica Species 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 11
- 238000005070 sampling Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 3
- 244000144730 Amygdalus persica Species 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Analysing Materials By The Use Of Radiation (AREA)
- Electrophonic Musical Instruments (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本発明は、周波数分析によるピッチ判断方法および装置に関するものであって、特に、外部から入力されるデジタル信号を所定の単位時間当りの周波数成分値に分解した後、該周波数成分値により当該信号のピーク位置を検出し、該ピーク位置のうち最大ピーク位置の周波数がピッチであるか、ピッチのn倍数ハーモニック周波数であるかを判別してピッチを決定し、検出されたピッチのハーモニック周波数の周波数範囲に基づいて前記ピッチの範囲を決定することを特徴とする。従って、本発明は、周波数分析方法で導出されたピッチの誤差範囲を最小化することによって、周波数分析方法によるピッチ判断において、より正確なピッチ判断結果が期待できるという効果を奏する。
Description
【技術分野】
【0001】
本発明は、ピッチ判断方法および装置に関し、特に、周波数分析で得られた最大ピークの周波数によってピッチを検出し、該ピッチのハーモニック周波数のうちのいずれかのハーモニック周波数範囲に基づいて当該ピッチの周波数範囲を決定することを特徴とするピッチ判断方法および装置に関する。
【背景技術】
【0002】
リアルタイムで演奏される楽器の演奏音または人の声に対するピッチ(ピッチ周波数)を判断する技術は、その楽器の演奏音または人の声に対する演奏情報データの抽出やリアルタイム音楽との合奏などのために開発が続けられている。
【0003】
ピッチを判断するために一般的に使用されるピッチ判断方法としては、デジタル信号に変換された演奏音または声に対する周波数を分析してピッチを判断する周波数分析方法、繰り返されるウェーブ波形のピーク(peak)またはゼロ交差(zero−crossing)周期を計算してウェーブの周期を計算し、その結果を分析してピッチを判断する周期計算方法、ウェーブ波形の自己相関関係を分析してピッチを判断する自己相関方法などが挙げられる。
【0004】
かかるピッチ判断方法のうちの一つである周波数分析方法では、デジタル信号を所定の単位時間間隔で分析するが、かかる単位時間間隔の大きさによって一定の誤差範囲をもってピッチが決定される。
【0005】
例えば、周波数分析方法において主に使用される高速フーリエ変換(FFT)の場合、所定の単位時間(以下、「index」という)毎に入力されたデジタル信号を周波数に変換するが、サンプリングレート(Sampling Rate)とFFT変換のためのウインドーサイズ(Window Size)が固定される場合、前記indexの範囲によって周波数の誤差範囲が決定される。これを、数式を参照して説明すると、次の通りである。
【0006】
先ず、FFT変換のためのサンプリングレートが22,050Hzであり、FFT変換のためのウインドーサイズが1024である場合、FFT変換により導出される周波数は、〔数式1〕の通りである。
【0007】
【数1】
【0008】
また、この際、実際周波数の範囲(FR)は、〔数式2〕により決定される。
【0009】
【数2】
【0010】
従って、ピアノのC3ノートをFFT分析した結果、基本周波数に対するピークのindexが7である場合、該値と前記条件(サンプリングレート、ウインドーサイズ)を〔数式1〕および〔数式2〕に代入してindexが7である場合、即ち、7番目周波数に対する周波数変換結果および実際周波数の範囲を求めると〔数式3〕および〔数式4〕となる。
【0011】
〔数式3〕は、周波数変換結果に対する計算結果を示し、〔数式4〕は、その誤差範囲に対する計算結果を示す。
【0012】
【数3】
【0013】
【数4】
【0014】
即ち、前記条件によりピアノのC3ノートの音をFFT変換した結果、導出された周波数は、139.96Hzであり、該周波数の実際周波数範囲は、(129.19〜150.73)Hzであって、およそ21.53Hz(150.73−129.19=21.53)の誤差範囲を有することとなる。
【0015】
従って、楽器のピッチを導出するためにFFT変換を用いる場合、音間の周波数間隔が21.53Hz以上である高周波帯域では、ピッチ判断の誤りが少なくなるが、音間の周波数間隔が相対的に近い低周波帯域では、かかる誤差範囲によるピッチ判断の誤り確率が大きくなるという短所がある。
【発明の開示】
【0016】
本発明は、前述のような従来の問題点を解決するために創案されたものであって、本発明の第1の目的は、周波数分析で得られた最大ピークの周波数がピッチであるか、ピッチのn倍数ハーモニック周波数であるかを判断し、その判断結果によってピッチを決定することにより、ピッチ判断の誤りを最小化することを特徴とするピッチ判断方法および装置を提供することにある。
【0017】
また、本発明の第2の目的は、ピッチのハーモニック周波数のうちピッチと所定間隔を維持するハーモニック周波数の周波数範囲に基づいてピッチの周波数範囲を決定することにより、ピッチの誤差範囲を減らすことを特徴とするピッチ判断方法および装置を提供することにある。
【0018】
上記第1の目的を達成するための本発明のピッチ判断方法は、外部から入力されるデジタル信号を所定の単位時間当りの周波数成分値に分解した後、該周波数成分値により当該信号のピーク位置を検出する第1のステップと、前記第1のステップで検出されたピーク位置のうちから最大ピーク位置を選択し、該最大ピーク位置の周波数がピッチであるか、ピッチのn倍数ハーモニック周波数であるかを判別し、これによってピッチを決定する第2のステップとを含むことを特徴とする。ここで、前記第2のステップは、前記第1のステップで検出されたピーク位置のうちから最大ピーク位置の周波数をピッチ候補と決定する第2−1のステップと、周波数分析開始点から前記ピッチ候補位置までの距離であるピッチ候補距離(d)をnで割ってピーク検出間隔(d/n)を算出した後、周波数分析開始点からピッチ候補位置まで前記ピーク検出間隔(d/n)でピークがあるか否かを確認する第2−2のステップと、前記第2−2のステップにおける確認結果、周波数分析開始点からピッチ候補位置まで前記ピーク検出間隔(d/n)でピークが存在すると、前記ピッチ候補が前記ピーチ候補距離(d)をnで割った位置(P)にあるピーク(P_Peak)のn倍数ハーモニック周波数であるものと判断する第2−3のステップと、前記位置(P)にあるピーク(P_Peak)をピッチ候補に変更した後、前記第2−2のステップ乃至第2−3のステップを繰り返して行う第2−4のステップと、前記第2−2のステップにおける確認結果、周波数分析開始点からピッチ候補位置まで前記ピーク検出間隔(d/n)でピークが存在しないと、前記ピッチ候補をピッチと決定する第2−5のステップとを含むことが好ましい。
【0019】
また、上記第1の目的を達成するための本発明のピッチ判断装置は、外部から入力されるデジタル信号を所定の単位時間当りの周波数成分値に分解した後、該周波数成分値により当該信号のピーク位置を検出する周波数分析部と、前記周波数分析部で検出されたピーク位置のうちから最大ピーク位置を選択してピッチ候補に設定し、該ピッチ候補がピッチであるか、ピッチのn倍数ハーモニック周波数であるかを判別し、前記最大ピーク位置の周波数がn倍数ハーモニック周波数である場合、周波数分析開始点から前記最大ピーク位置までの距離をnで割った位置の周波数をピッチと決定するピッチ決定部と、前記ピッチ決定部で決定されたピッチを出力する結果出力部とを備えることを特徴とする。
【0020】
なお、上記第2の目的を達成するための本発明のピッチ判断方法は、外部から入力されるデジタル信号を所定の時間単位当りの周波数成分値に分解した後、該周波数成分値に基づいてピッチを決定する第1のステップと、前記第1のステップで決定されたピッチのハーモニック周波数位置を検出し、該ハーモニック周波数の範囲に基づいて前記ピッチの範囲を決定する第2のステップとを含むことを特徴とする。ここで、前記第2のステップは、前記第1のステップで決定されたピッチの周波数範囲(F1)を算出した後、前記ピッチの検出可能なハーモニック周波数のうちピッチからh番目に位置するハーモニック周波数の周波数範囲をhで割った値(F2)と前記ピッチの周波数範囲(F1)との交差部分を前記ピッチの範囲に決定することが好ましい。
【0021】
また、上記第2の目的を達成するための本発明のピッチ判断装置は、外部から入力されるデジタル信号を所定の単位時間当りの周波数成分値に分解した後、該周波数成分値により当該信号のピーク位置を検出する周波数分析部と、前記周波数分析部で検出されたピーク位置のうちから最大ピーク位置を選択し、該最大ピーク位置の周波数がピッチであるか、ピッチのn倍数ハーモニック周波数であるかを判別し、これによってピッチを決定するピッチ決定部と、前記ピッチ決定部で決定されたピッチのハーモニック周波数位置を検出し、該ハーモニック周波数の範囲に基づいて当該ピッチ範囲を決定するピッチ範囲決定部と、前記ピッチ決定部で決定されたピッチを出力する結果出力部とを備えることを特徴とする。
【発明を実施するための最良の形態】
【0022】
以下、本発明に係るピッチ判断方法およびピッチ判断装置の好適な実施例を添付の図面に基づいて詳述する。
【0023】
図1は、本発明の実施例に係るピッチ判断装置を示す概略的なブロック図である。同図に示されたように、本発明の実施例に係るピッチ判断装置は、音楽情報入力部(100)、音有無判別部(200)、周波数分析部(300)、ピッチ決定部(400)、ピッチ範囲決定部(500)、結果出力部(600)を備えてなる。
【0024】
音楽情報入力部(100)は、マイクを介して入力されるアナログ信号をデジタル信号に変換し、または、変換過程を経て生成されたデジタル信号を受け取る。
【0025】
音有無判別部(200)は、音楽情報入力部(100)を介して受け取られた信号の強さを感知して音の有無を判断する。例えば、音楽情報入力部(100)を介して受け取られた信号の強さが、周辺環境などを考慮して既に設定された雑音(noise)の強さより大きな場合は、音楽音の信号が入力されたものと判断する。
【0026】
周波数分析部(300)は、音有無判別部(200)を介して入力されるデジタル音響を所定の時間単位当りの周波数成分値に分解した後、該周波数成分値に基づいて当該信号のピーク位置を検出する。この時、ピーク位置とは、ピーク周波数の位置をいう。なお、デジタル音響を周波数成分に分解する方法としては、一般に高速フーリエ変換(FFT)を用いるが、ウェーブレット(wavelet)変換のような他の方法を用いることも可能である。
【0027】
ピッチ決定部(400)は、周波数分析部(300)で検出されたピーク位置のうちから最大ピーク位置を選択してピッチ候補として設定する。なお、最大ピーク位置とは、最大ピーク周波数の位置をいう。次に、ピッチ決定部(400)は、該ピッチ候補の周波数がピッチであるか、ピッチのn倍数ハーモニック周波数であるかを判別し、最大ピーク位置の周波数がn倍数ハーモニック周波数である場合、周波数分析開始点から最大ピーク位置までの距離をnで割った位置の周波数をピッチと決定する。
【0028】
ピッチ候補がn倍数ハーモニックであるか否かを判別するため、ピッチ決定部(400)では、先ず、周波数分析開始点からピッチ候補までの距離(d)をnで割ってピーク検出間隔(d/n)を算出した後、周波数分析開始点からピッチ候補位置まで前記ピーク検出間隔(d/n)でピークがあるか否かを確認し、ピーク検出間隔(d/n)でピークが存在すると、ピーチ候補までの距離(d)をnで割った位置(P)にあるピーク(P_Peak)をピッチ候補に変更するステップ(step1)を行う。
【0029】
また、周波数分析開始点からピッチ候補位置まで前記ピーク検出間隔(d/n)でピックが存在する間、前記ステップ(step1)を繰り返して行う。もし、周波数分析開始点から前記ピッチ候補位置まで前記ピーク検出間隔(d/n)でピークが存在しない場合は、現ピッチ候補をピッチに決定する。この際、nは、ピッチ候補をn倍数ハーモニック周波数に判別するための「ピッチ候補性質係数」であって、所定範囲内の素数(2、3、5、7、11、13、・・・)を順次適用することが好ましい。選択的に、nは、所定範囲内の素数に限定せず、「2」以上の自然数を適用することが可能である。
【0030】
ピッチ範囲決定部(500)は、ピッチ決定部(400)で決定されたピッチのハーモニック周波数位置を検出し、該ハーモニック周波数の範囲に基づいて当該ピッチの範囲を決定する。即ち、ピッチ範囲決定部(500)は、ピッチ決定部(400)で決定されたピッチの周波数範囲(F1)を算出した後、前記ピッチの検出可能なハーモニック周波数のうちピッチからh番目に位置するハーモニック周波数の周波数範囲をhで割った値(F2)と前記ピッチの周波数範囲(F1)との交差部分を前記ピッチ範囲と決定する。この時、hは、ピッチ範囲を決定するためのピッチのハーモニック周波数選択を行うためのハーモニック周波数検出係数であって、「2」以上の自然数となる。
【0031】
結果出力部(600)は、最終決定されたピッチを出力する。
【0032】
図2は、本発明の実施例によってピッチを判断する方法を示す処理フローチャートである。同図に示されたように、本発明の実施例によってピッチを判断する方法は、次の通りである。
【0033】
先ず、外部からデジタル信号が入力されると(S100)、周波数分析を行って当該デジタル信号のピーク位置を検出する(S200)。図4Aは、外部から入力されるデジタル信号に対するウェーブ波形を示し、図4Bおよび図4Cは、かかるデジタル信号の周波数分析結果を示すもので、図4Bは、ピークと該ピークの周波数位置を示す図、図4Cは、ピークと該ピークのFFTインデックスの位置を示す図である。従って、かかる波形図によってピークの位置を検出することが可能となる。
【0034】
また、前記ピークを示す波形図を参照してピッチを決定する(S300)。即ち、最大ピーク位置を検出した後、当該ピークがピッチであるか、ピッチのn倍数ハーモニック周波数であるかを判別してピッチを決定する。
【0035】
また、前述のステップを経てピッチが決定されると、該ピッチの周波数範囲を決定する(S400)。この時、ピッチのハーモニック周波数によりピッチの周波数範囲を縮小するステップを行ってピッチの周波数範囲を決定し、最終決定されたピッチを示す(S500)。
【0036】
図2Aは、前記ピッチ決定ステップ(S300)を示す図である。同図に示されたように、本発明によってピッチを決定するためには、先ず、前記ステップ(S100)で検出されたピーク位置のうちから最大ピーク位置の周波数をピッチ候補として決定する(S310)。
【0037】
次いで、周波数分析開始点から当該ピッチ候補位置までの距離(以下、「ピッチ候補距離(d)」という)をnで割ってピーク検出間隔(d/n)を算出した後、周波数分析開始点からピッチ候補位置までピーク検出間隔(d/n)でピークがあるか否かを確認する。確認の結果、ピーク検出間隔(d/n)でピークが存在すれば、即ち、ピッチ候補距離(d)をnで割った位置(P)にピーク(P_Peak)が存在する場合は、現ピッチ候補を当該ピーク(P_Peak)のn倍数ハーモニック周波数と判別する。ここで、nは、ピッチ候補をn倍数ハーモニック周波数に判別するための「ピッチ候補性質決定係数」であって、所定範囲内の素数または自然数を順次適用することが好ましい。
【0038】
以下の例では、nを所定範囲内の素数として適用した場合について説明する。
【0039】
前述のようにピッチ候補をn倍数ハーモニック周波数と判別するには、先ず、ピッチ候補性質決定係数(以下、「n」という)を「2」に設定した後、周波数分析開始点から前記ピッチ候補位置までの距離であるピッチ候補距離(d)を2で割ってピーク検出間隔(d/2)を算出する。次に、周波数分析開始点からピッチ候補位置までピーク検出間隔(d/2)でピークがあるか否かを確認する(S330)。即ち、周波数分析開始点から前記ピッチ候補位置までの距離の1/2位置(P)にピークがあるか否かを確認する。
【0040】
次いで、当該位置(P)にピークがある場合は、前記ピッチ候補を前記位置(P)にあるピーク(P_Peak)の二倍数ハーモニック周波数に判別し、前記位置(P)にあるピーク(P_Peak)をピッチ候補に変更した後(S340)、前記ステップ(S320乃至S330)を繰り返す。
【0041】
また、ピッチ候補距離(d)を2で割った位置(P)にピークが存在しない場合は、nを2の次の素数である「3」に変更(S360)した後、上記のステップ(S330、S340)を繰り返して行う。即ち、周波数分析開始点から前記ピッチ候補位置までの距離であるピッチ候補距離(d)を3で割ってピーク検出間隔(d/3)を算出した後、周波数分析開始点からピッチ候補位置までピーク検出間隔(d/3)でピークがあるか否かを確認する(S330)。換言すれば、周波数分析開始点から前記ピッチ候補位置までの距離の1/3位置(P1)と、周波数分析開始点から前記ピッチ候補位置までの距離の2/3位置(P2)にピークがあるか否かを確認する。
【0042】
かかるステップを既に設定された素数の範囲内で繰り返して行う。即ち、素数の範囲が{2、3、5}のように設定されていると、nを2→3→5の順に変更しながら前述のステップ(S330、S340)を繰り返して行う。
【0043】
既に設定された範囲内の全ての素数について、周波数分析開始点からピッチ候補位置まで、ピーク検出間隔(d/n)でピークが存在しないと、当該ピッチ候補をピッチと決定する(S350、S370)。
【0044】
選択的に、上記の一連のステップを所定範囲の自然数、即ち、{2、3、4、5}の範囲内で2→3→4→5の順に変更しながら繰り返して行うことも可能である。
【0045】
なお、図2Bは、本発明によってピッチ範囲を決定するステップ(S400)を示す処理フローチャートである。本発明によってピッチ範囲を決定するためには、ピッチとして決定された周波数の周波数範囲(F1)を算出した後、当該ピッチの検出可能なハーモニック周波数のうちピッチからh番目に位置するハーモニック周波数の周波数範囲をhで割った値(F2)と現ピッチの周波数範囲(F1)との交差部分をピッチの範囲に決定する。図2Bに示されたように、先ず、現在ピッチとして決定されたピークの周波数範囲をピッチ範囲(F1)に設定した後(S410)、ピッチ範囲を決定するためのピッチのハーモニック周波数選択を行うためのハーモニック周波数検出係数(以下、「h」という)を「2」に設定する(S420)。
【0046】
次いで、ピッチの2番目ハーモニック周波数が存在する場合(S430)、2番目ハーモニック周波数範囲を2で割った値をピッチ範囲候補(F2)に決定した後(S440)、該ピッチ範囲候補(F2)と既に設定されたピッチ範囲(F1)との交差部分を再びピッチ候補(F1)に設定する(S450、S460)。
【0047】
また、前記h値を「1」増加させた後(S470)、前記ステップ(S430乃至S460)を繰り返して行う。
【0048】
即ち、hを「3」に設定した後、ピッチの3番目ハーモニック周波数がある場合(S430)、3番目ハーモニック周波数範囲を3で割った値をピッチ範囲候補(F2)に決定した後(S440)、該ピッチ範囲候補(F2)と既に設定されたピッチ範囲(F1)との交差部分を再びピッチ候補(F1)に設定する(S450、S460)。
【0049】
この際、ピッチ範囲候補(F2)と既に設定されたピッチ範囲(F1)との交差部分が存在しない場合は、現ピッチ範囲(F1)をピッチの周波数範囲に決定し、その結果を出力する(S480)。
【0050】
なお、上記のステップ(S430)でh番目ハーモニック周波数が検出されないか、その周波数の大きさが既に設定された値の以下である場合、現ピッチ範囲(F1)をピッチの周波数範囲に決定し、その結果を出力する(S480)。
【0051】
かかる一連のステップをより具体的に説明するため、以下、FFT変換のためのウインドーサイズ(Window Size)が「2048」であり、サンプリングレート(Sampling Rate)が「22,050(Hz)」であり、図4Cのような変換結果となる時におけるピッチを判断する方法を説明する。
【0052】
図4Cから、FFT変換の結果、多数のピークが発生し、それらのFFTインデックスの位置は、左側から「13、25、37、49、62、74、86、98、110、123、135、147、160、173、・・・」であることがわかる。
【0053】
また、これらのうちピーク値が最も大きな最大ピークは、FFTインデックスが「37」である位置に存在する。
【0054】
なお、〔数式5〕は、FFTインデックスにより周波数の範囲を決定する方法を示す計算式であって、FFTインデックス「37」を〔数式5〕に代入して周波数範囲を算出すると、〔数式6〕の結果となる。
【0055】
FFT Index周波数の範囲
【0056】
【数5】
【0057】
FFT Index周波数の範囲
【0058】
【数6】
【0059】
即ち、FFTインデックスが37である時、周波数の範囲は、(387.59〜398.36)Hzであり、これがピッチ候補となる。
【0060】
前述のようにピッチ候補が決定されると、これがピッチのn倍数ハーモニックであるか否かを判別する。このためには、該ピッチ候補をn値で割って当該位置にピークが存在するかを確認する必要がある。なお、n値としては、2→3→5→・・・を順次選択して決定することが好ましい。即ち、nを所定範囲の素数のうちから選択して決定することが好ましい。しかし、nは、所定範囲の素数に限定されるのではなく、nを所定範囲の自然数から選択して決定可能であることはいうまでもない。
【0061】
〔数式7〕は、nによるFFTインデックス計算式であり、〔数式8〕は、nが2である時におけるFFTインデックス計算式である。
【0062】
【数7】
【0063】
【数8】
【0064】
〔数式8〕のように、nが2である場合、nでピッチ候補を割ると、FFTインデックスは、18〜18.5となり、前記ピーク発生位置リスト(13、25、37、49、62、74、86、98、110、123、135、147、160、173、・・・)を参照すると、前記〔数式8〕で計算された位置にはピークが存在しないことがわかる。
【0065】
なお、〔数式9〕は、nが「3」である場合、FFTインデックスを計算した計算式である。
【0066】
【数9】
【0067】
〔数式9〕のように、nが3である場合、FFTインデックスは、「12〜12.33」と「24〜24.666」となり、前記ピーク発生位置リスト(13、25、37、49、62、74、86、98、110、123、135、147、160、173、・・・)を参照すると、12.33を切り上げた「13」と、24.666を切り上げた「25」にピークが発生し、n=3の場合、即ち、周波数分析開始点からピーク位置までの距離(37)の1/3位置である「13」と、周波数分析開始点からピーク位置までの距離(37)の2/3である「25」にピークが存在することがわかる。
【0068】
従って、FFTインデックスが37である周波数は、FFTインデックスが13である位置の周波数の3倍数ハーモニック周波数であることがわかる。即ち、本発明によって図4CのようなFFT変換の結果において、ピッチは、前記〔数式9〕で求められたFFTインデックス値(12〜12.33)を〔数式5〕に代入して計算した値(129.19〜132.78)Hzとなり、その計算式を〔数式10〕および〔数式11〕に示した。
【0069】
FFT Index周波数の範囲
【0070】
【数10】
【0071】
この時、導出されたピッチは、約3.59Hzの誤差範囲を有する。
【0072】
なお、かかる誤差範囲をさらに縮小させるため、本発明のピッチ範囲決定の過程を適用させると、先ず、現在決定されたピッチ(FFT indexが13である位置の周波数)から検出可能なハーモニック周波数情報は、前記ピーク発生位置リスト(13、25、37、49、62、74、86、98、110、123、135、147、160、173、・・・)から得られ、ハーモニック周波数検出係数が12に決定された場合、12番目ハーモニック周波数は、FFT indexが147である時の周波数である。
【0073】
従って、この時の周波数範囲を〔数式5〕によって計算すると、その結果は、〔数式11〕となる。
FFT Index周波数の範囲
【0074】
【数11】
【0075】
即ち、ピッチの12番目ハーモニック周波数の範囲は、(1571.9238〜1582.6904)Hzであり、従って、ピッチの周波数範囲は、〔数式12〕のように、これを12で割った値となる。
【0076】
ハーモニックを用いた基本周波数
【0077】
【数12】
【0078】
これは、前記〔数式10〕で得られた最初ピッチ範囲(129.18〜132.78)Hz内に存在する周波数範囲であって、この時の誤差範囲は、0.8972Hzである。これは、〔数式10〕で得られた最初ピッチ範囲の誤差範囲(約3.5Hz)に比べて遥かに小さな値である。従って、本発明のピッチ判断方法によれば、前述のように、より正確な周波数範囲を導出することが可能となる。
【0079】
ここで、〔数式12〕で得られたピッチの周波数範囲が(130.9937〜133.0)Hzであれば、最終ピッチの範囲は、該値と最初ピッチ範囲(129.18〜132.78)Hzとの交差部分である(130.9937〜132.78)Hzとなる。
【0080】
図3は、本発明によってピッチ範囲を決定するステップを説明するための周波数範囲の計算結果を示す図である。同図には、図4Cに示された各ピークのFFTインデックス位置(31)と、該FFTインデックス位置による周波数範囲(32)と、該周波数のh番目ハーモニック周波数により再計算された周波数範囲(33)と、該再計算された周波数範囲(33)と前ハーモニックにより決定されたピッチとの交差部分に最終決定されたピッチ範囲(34)とが示されている。この時、2番目ハーモニックに対して最終決定されたピッチ範囲(129.1992〜134.5825)(斜線で示す)は、1番目ハーモニックに対して最終決定されたピッチ範囲(129.1992〜139.9658)と2番目ハーモニックのハーモニック範囲により決定されたピッチの範囲(129.1992〜134.5825)との交差部分に決定される。3番目以後のハーモニックに対するピッチ範囲も、上記と同様な方式で決定される。ところで、最初ピッチの13番目ハーモニック周波数の場合(33)、前ハーモニックである12番目ハーモニックに対して最終決定されたピッチ範囲(131.3525〜131.5918)と、13番目ハーモニックのハーモニック範囲により決定されたピッチ範囲(131.6838〜132.5120)との間に交差部分がないため、以後のハーモニックに対しては計算しない。従って、12番目ハーモニックとの交差部分により決定されたピッチ範囲(131.3525〜131.5918)を結果として出力する。
【0081】
以上は、本発明の一実施例を説明したものにすぎず、本発明は、前述した実施例に限定されるものではなく、特許請求の範囲内で種々に変更して実施することが可能である。例えば、本発明の実施例に具体的に示した各構成要素の形状および構造は、変更して実施することができる。例えば、前述の例では、ピッチ候補性質決定係数を素数を例にして説明したが、当業者であれば、ピッチ候補性質決定係数を任意の自然数として適用することができる。
【産業上の利用可能性】
【0082】
以上のように、本発明のピッチ判断方法およびその装置は、周波数分析により得られた最大ピークの周波数がピッチであるか、ピッチのn倍数ハーモニック周波数であるかを判断し、その判断結果によってピッチを決定することにより、最大ピークの周波数を無条件的にピッチと判断することによるピッチ判断の誤りを最小化することができる。
また、本発明によれば、検出されたピッチのハーモニック周波数のうちピッチと所定間隔を維持するハーモニック周波数の周波数範囲に基づいてピッチの周波数範囲を決定することにより、ピッチの誤差範囲を減らしてピッチ判断結果の信頼度を向上させることができる。
【0083】
従って、本発明によれば、周波数分析によるピッチ判断に比べてより正確な判断結果が期待できるという効果を奏する。
【図面の簡単な説明】
【0084】
【図1】図1は、本発明の実施例に係るピッチ判断装置を示す概略的なブロック図である。
【図2】図2は、本発明の実施例によってピッチを判断する方法を示す処理フローチャートである。
【図2A】図2Aは、本発明の実施例によってピッチを決定する方法を示す処理フローチャートである。
【図2B】図2Bは、本発明の実施例によってピッチ範囲を決定する方法を示す処理フローチャートである。
【図3】図3は、本発明によってピッチ範囲を決定するステップを説明するための周波数範囲の計算結果を示す図である。
【図4A】図4Aは、本発明の実施例によってピッチを判断するステップを説明するための例示的な波形図である。
【図4B】図4Bは、本発明の実施例によってピッチを判断するステップを説明するための例示的な波形図である。
【図4C】図4Cは、本発明の実施例によってピッチを判断するステップを説明するための例示的な波形図である。
【0001】
本発明は、ピッチ判断方法および装置に関し、特に、周波数分析で得られた最大ピークの周波数によってピッチを検出し、該ピッチのハーモニック周波数のうちのいずれかのハーモニック周波数範囲に基づいて当該ピッチの周波数範囲を決定することを特徴とするピッチ判断方法および装置に関する。
【背景技術】
【0002】
リアルタイムで演奏される楽器の演奏音または人の声に対するピッチ(ピッチ周波数)を判断する技術は、その楽器の演奏音または人の声に対する演奏情報データの抽出やリアルタイム音楽との合奏などのために開発が続けられている。
【0003】
ピッチを判断するために一般的に使用されるピッチ判断方法としては、デジタル信号に変換された演奏音または声に対する周波数を分析してピッチを判断する周波数分析方法、繰り返されるウェーブ波形のピーク(peak)またはゼロ交差(zero−crossing)周期を計算してウェーブの周期を計算し、その結果を分析してピッチを判断する周期計算方法、ウェーブ波形の自己相関関係を分析してピッチを判断する自己相関方法などが挙げられる。
【0004】
かかるピッチ判断方法のうちの一つである周波数分析方法では、デジタル信号を所定の単位時間間隔で分析するが、かかる単位時間間隔の大きさによって一定の誤差範囲をもってピッチが決定される。
【0005】
例えば、周波数分析方法において主に使用される高速フーリエ変換(FFT)の場合、所定の単位時間(以下、「index」という)毎に入力されたデジタル信号を周波数に変換するが、サンプリングレート(Sampling Rate)とFFT変換のためのウインドーサイズ(Window Size)が固定される場合、前記indexの範囲によって周波数の誤差範囲が決定される。これを、数式を参照して説明すると、次の通りである。
【0006】
先ず、FFT変換のためのサンプリングレートが22,050Hzであり、FFT変換のためのウインドーサイズが1024である場合、FFT変換により導出される周波数は、〔数式1〕の通りである。
【0007】
【数1】
【0008】
また、この際、実際周波数の範囲(FR)は、〔数式2〕により決定される。
【0009】
【数2】
【0010】
従って、ピアノのC3ノートをFFT分析した結果、基本周波数に対するピークのindexが7である場合、該値と前記条件(サンプリングレート、ウインドーサイズ)を〔数式1〕および〔数式2〕に代入してindexが7である場合、即ち、7番目周波数に対する周波数変換結果および実際周波数の範囲を求めると〔数式3〕および〔数式4〕となる。
【0011】
〔数式3〕は、周波数変換結果に対する計算結果を示し、〔数式4〕は、その誤差範囲に対する計算結果を示す。
【0012】
【数3】
【0013】
【数4】
【0014】
即ち、前記条件によりピアノのC3ノートの音をFFT変換した結果、導出された周波数は、139.96Hzであり、該周波数の実際周波数範囲は、(129.19〜150.73)Hzであって、およそ21.53Hz(150.73−129.19=21.53)の誤差範囲を有することとなる。
【0015】
従って、楽器のピッチを導出するためにFFT変換を用いる場合、音間の周波数間隔が21.53Hz以上である高周波帯域では、ピッチ判断の誤りが少なくなるが、音間の周波数間隔が相対的に近い低周波帯域では、かかる誤差範囲によるピッチ判断の誤り確率が大きくなるという短所がある。
【発明の開示】
【0016】
本発明は、前述のような従来の問題点を解決するために創案されたものであって、本発明の第1の目的は、周波数分析で得られた最大ピークの周波数がピッチであるか、ピッチのn倍数ハーモニック周波数であるかを判断し、その判断結果によってピッチを決定することにより、ピッチ判断の誤りを最小化することを特徴とするピッチ判断方法および装置を提供することにある。
【0017】
また、本発明の第2の目的は、ピッチのハーモニック周波数のうちピッチと所定間隔を維持するハーモニック周波数の周波数範囲に基づいてピッチの周波数範囲を決定することにより、ピッチの誤差範囲を減らすことを特徴とするピッチ判断方法および装置を提供することにある。
【0018】
上記第1の目的を達成するための本発明のピッチ判断方法は、外部から入力されるデジタル信号を所定の単位時間当りの周波数成分値に分解した後、該周波数成分値により当該信号のピーク位置を検出する第1のステップと、前記第1のステップで検出されたピーク位置のうちから最大ピーク位置を選択し、該最大ピーク位置の周波数がピッチであるか、ピッチのn倍数ハーモニック周波数であるかを判別し、これによってピッチを決定する第2のステップとを含むことを特徴とする。ここで、前記第2のステップは、前記第1のステップで検出されたピーク位置のうちから最大ピーク位置の周波数をピッチ候補と決定する第2−1のステップと、周波数分析開始点から前記ピッチ候補位置までの距離であるピッチ候補距離(d)をnで割ってピーク検出間隔(d/n)を算出した後、周波数分析開始点からピッチ候補位置まで前記ピーク検出間隔(d/n)でピークがあるか否かを確認する第2−2のステップと、前記第2−2のステップにおける確認結果、周波数分析開始点からピッチ候補位置まで前記ピーク検出間隔(d/n)でピークが存在すると、前記ピッチ候補が前記ピーチ候補距離(d)をnで割った位置(P)にあるピーク(P_Peak)のn倍数ハーモニック周波数であるものと判断する第2−3のステップと、前記位置(P)にあるピーク(P_Peak)をピッチ候補に変更した後、前記第2−2のステップ乃至第2−3のステップを繰り返して行う第2−4のステップと、前記第2−2のステップにおける確認結果、周波数分析開始点からピッチ候補位置まで前記ピーク検出間隔(d/n)でピークが存在しないと、前記ピッチ候補をピッチと決定する第2−5のステップとを含むことが好ましい。
【0019】
また、上記第1の目的を達成するための本発明のピッチ判断装置は、外部から入力されるデジタル信号を所定の単位時間当りの周波数成分値に分解した後、該周波数成分値により当該信号のピーク位置を検出する周波数分析部と、前記周波数分析部で検出されたピーク位置のうちから最大ピーク位置を選択してピッチ候補に設定し、該ピッチ候補がピッチであるか、ピッチのn倍数ハーモニック周波数であるかを判別し、前記最大ピーク位置の周波数がn倍数ハーモニック周波数である場合、周波数分析開始点から前記最大ピーク位置までの距離をnで割った位置の周波数をピッチと決定するピッチ決定部と、前記ピッチ決定部で決定されたピッチを出力する結果出力部とを備えることを特徴とする。
【0020】
なお、上記第2の目的を達成するための本発明のピッチ判断方法は、外部から入力されるデジタル信号を所定の時間単位当りの周波数成分値に分解した後、該周波数成分値に基づいてピッチを決定する第1のステップと、前記第1のステップで決定されたピッチのハーモニック周波数位置を検出し、該ハーモニック周波数の範囲に基づいて前記ピッチの範囲を決定する第2のステップとを含むことを特徴とする。ここで、前記第2のステップは、前記第1のステップで決定されたピッチの周波数範囲(F1)を算出した後、前記ピッチの検出可能なハーモニック周波数のうちピッチからh番目に位置するハーモニック周波数の周波数範囲をhで割った値(F2)と前記ピッチの周波数範囲(F1)との交差部分を前記ピッチの範囲に決定することが好ましい。
【0021】
また、上記第2の目的を達成するための本発明のピッチ判断装置は、外部から入力されるデジタル信号を所定の単位時間当りの周波数成分値に分解した後、該周波数成分値により当該信号のピーク位置を検出する周波数分析部と、前記周波数分析部で検出されたピーク位置のうちから最大ピーク位置を選択し、該最大ピーク位置の周波数がピッチであるか、ピッチのn倍数ハーモニック周波数であるかを判別し、これによってピッチを決定するピッチ決定部と、前記ピッチ決定部で決定されたピッチのハーモニック周波数位置を検出し、該ハーモニック周波数の範囲に基づいて当該ピッチ範囲を決定するピッチ範囲決定部と、前記ピッチ決定部で決定されたピッチを出力する結果出力部とを備えることを特徴とする。
【発明を実施するための最良の形態】
【0022】
以下、本発明に係るピッチ判断方法およびピッチ判断装置の好適な実施例を添付の図面に基づいて詳述する。
【0023】
図1は、本発明の実施例に係るピッチ判断装置を示す概略的なブロック図である。同図に示されたように、本発明の実施例に係るピッチ判断装置は、音楽情報入力部(100)、音有無判別部(200)、周波数分析部(300)、ピッチ決定部(400)、ピッチ範囲決定部(500)、結果出力部(600)を備えてなる。
【0024】
音楽情報入力部(100)は、マイクを介して入力されるアナログ信号をデジタル信号に変換し、または、変換過程を経て生成されたデジタル信号を受け取る。
【0025】
音有無判別部(200)は、音楽情報入力部(100)を介して受け取られた信号の強さを感知して音の有無を判断する。例えば、音楽情報入力部(100)を介して受け取られた信号の強さが、周辺環境などを考慮して既に設定された雑音(noise)の強さより大きな場合は、音楽音の信号が入力されたものと判断する。
【0026】
周波数分析部(300)は、音有無判別部(200)を介して入力されるデジタル音響を所定の時間単位当りの周波数成分値に分解した後、該周波数成分値に基づいて当該信号のピーク位置を検出する。この時、ピーク位置とは、ピーク周波数の位置をいう。なお、デジタル音響を周波数成分に分解する方法としては、一般に高速フーリエ変換(FFT)を用いるが、ウェーブレット(wavelet)変換のような他の方法を用いることも可能である。
【0027】
ピッチ決定部(400)は、周波数分析部(300)で検出されたピーク位置のうちから最大ピーク位置を選択してピッチ候補として設定する。なお、最大ピーク位置とは、最大ピーク周波数の位置をいう。次に、ピッチ決定部(400)は、該ピッチ候補の周波数がピッチであるか、ピッチのn倍数ハーモニック周波数であるかを判別し、最大ピーク位置の周波数がn倍数ハーモニック周波数である場合、周波数分析開始点から最大ピーク位置までの距離をnで割った位置の周波数をピッチと決定する。
【0028】
ピッチ候補がn倍数ハーモニックであるか否かを判別するため、ピッチ決定部(400)では、先ず、周波数分析開始点からピッチ候補までの距離(d)をnで割ってピーク検出間隔(d/n)を算出した後、周波数分析開始点からピッチ候補位置まで前記ピーク検出間隔(d/n)でピークがあるか否かを確認し、ピーク検出間隔(d/n)でピークが存在すると、ピーチ候補までの距離(d)をnで割った位置(P)にあるピーク(P_Peak)をピッチ候補に変更するステップ(step1)を行う。
【0029】
また、周波数分析開始点からピッチ候補位置まで前記ピーク検出間隔(d/n)でピックが存在する間、前記ステップ(step1)を繰り返して行う。もし、周波数分析開始点から前記ピッチ候補位置まで前記ピーク検出間隔(d/n)でピークが存在しない場合は、現ピッチ候補をピッチに決定する。この際、nは、ピッチ候補をn倍数ハーモニック周波数に判別するための「ピッチ候補性質係数」であって、所定範囲内の素数(2、3、5、7、11、13、・・・)を順次適用することが好ましい。選択的に、nは、所定範囲内の素数に限定せず、「2」以上の自然数を適用することが可能である。
【0030】
ピッチ範囲決定部(500)は、ピッチ決定部(400)で決定されたピッチのハーモニック周波数位置を検出し、該ハーモニック周波数の範囲に基づいて当該ピッチの範囲を決定する。即ち、ピッチ範囲決定部(500)は、ピッチ決定部(400)で決定されたピッチの周波数範囲(F1)を算出した後、前記ピッチの検出可能なハーモニック周波数のうちピッチからh番目に位置するハーモニック周波数の周波数範囲をhで割った値(F2)と前記ピッチの周波数範囲(F1)との交差部分を前記ピッチ範囲と決定する。この時、hは、ピッチ範囲を決定するためのピッチのハーモニック周波数選択を行うためのハーモニック周波数検出係数であって、「2」以上の自然数となる。
【0031】
結果出力部(600)は、最終決定されたピッチを出力する。
【0032】
図2は、本発明の実施例によってピッチを判断する方法を示す処理フローチャートである。同図に示されたように、本発明の実施例によってピッチを判断する方法は、次の通りである。
【0033】
先ず、外部からデジタル信号が入力されると(S100)、周波数分析を行って当該デジタル信号のピーク位置を検出する(S200)。図4Aは、外部から入力されるデジタル信号に対するウェーブ波形を示し、図4Bおよび図4Cは、かかるデジタル信号の周波数分析結果を示すもので、図4Bは、ピークと該ピークの周波数位置を示す図、図4Cは、ピークと該ピークのFFTインデックスの位置を示す図である。従って、かかる波形図によってピークの位置を検出することが可能となる。
【0034】
また、前記ピークを示す波形図を参照してピッチを決定する(S300)。即ち、最大ピーク位置を検出した後、当該ピークがピッチであるか、ピッチのn倍数ハーモニック周波数であるかを判別してピッチを決定する。
【0035】
また、前述のステップを経てピッチが決定されると、該ピッチの周波数範囲を決定する(S400)。この時、ピッチのハーモニック周波数によりピッチの周波数範囲を縮小するステップを行ってピッチの周波数範囲を決定し、最終決定されたピッチを示す(S500)。
【0036】
図2Aは、前記ピッチ決定ステップ(S300)を示す図である。同図に示されたように、本発明によってピッチを決定するためには、先ず、前記ステップ(S100)で検出されたピーク位置のうちから最大ピーク位置の周波数をピッチ候補として決定する(S310)。
【0037】
次いで、周波数分析開始点から当該ピッチ候補位置までの距離(以下、「ピッチ候補距離(d)」という)をnで割ってピーク検出間隔(d/n)を算出した後、周波数分析開始点からピッチ候補位置までピーク検出間隔(d/n)でピークがあるか否かを確認する。確認の結果、ピーク検出間隔(d/n)でピークが存在すれば、即ち、ピッチ候補距離(d)をnで割った位置(P)にピーク(P_Peak)が存在する場合は、現ピッチ候補を当該ピーク(P_Peak)のn倍数ハーモニック周波数と判別する。ここで、nは、ピッチ候補をn倍数ハーモニック周波数に判別するための「ピッチ候補性質決定係数」であって、所定範囲内の素数または自然数を順次適用することが好ましい。
【0038】
以下の例では、nを所定範囲内の素数として適用した場合について説明する。
【0039】
前述のようにピッチ候補をn倍数ハーモニック周波数と判別するには、先ず、ピッチ候補性質決定係数(以下、「n」という)を「2」に設定した後、周波数分析開始点から前記ピッチ候補位置までの距離であるピッチ候補距離(d)を2で割ってピーク検出間隔(d/2)を算出する。次に、周波数分析開始点からピッチ候補位置までピーク検出間隔(d/2)でピークがあるか否かを確認する(S330)。即ち、周波数分析開始点から前記ピッチ候補位置までの距離の1/2位置(P)にピークがあるか否かを確認する。
【0040】
次いで、当該位置(P)にピークがある場合は、前記ピッチ候補を前記位置(P)にあるピーク(P_Peak)の二倍数ハーモニック周波数に判別し、前記位置(P)にあるピーク(P_Peak)をピッチ候補に変更した後(S340)、前記ステップ(S320乃至S330)を繰り返す。
【0041】
また、ピッチ候補距離(d)を2で割った位置(P)にピークが存在しない場合は、nを2の次の素数である「3」に変更(S360)した後、上記のステップ(S330、S340)を繰り返して行う。即ち、周波数分析開始点から前記ピッチ候補位置までの距離であるピッチ候補距離(d)を3で割ってピーク検出間隔(d/3)を算出した後、周波数分析開始点からピッチ候補位置までピーク検出間隔(d/3)でピークがあるか否かを確認する(S330)。換言すれば、周波数分析開始点から前記ピッチ候補位置までの距離の1/3位置(P1)と、周波数分析開始点から前記ピッチ候補位置までの距離の2/3位置(P2)にピークがあるか否かを確認する。
【0042】
かかるステップを既に設定された素数の範囲内で繰り返して行う。即ち、素数の範囲が{2、3、5}のように設定されていると、nを2→3→5の順に変更しながら前述のステップ(S330、S340)を繰り返して行う。
【0043】
既に設定された範囲内の全ての素数について、周波数分析開始点からピッチ候補位置まで、ピーク検出間隔(d/n)でピークが存在しないと、当該ピッチ候補をピッチと決定する(S350、S370)。
【0044】
選択的に、上記の一連のステップを所定範囲の自然数、即ち、{2、3、4、5}の範囲内で2→3→4→5の順に変更しながら繰り返して行うことも可能である。
【0045】
なお、図2Bは、本発明によってピッチ範囲を決定するステップ(S400)を示す処理フローチャートである。本発明によってピッチ範囲を決定するためには、ピッチとして決定された周波数の周波数範囲(F1)を算出した後、当該ピッチの検出可能なハーモニック周波数のうちピッチからh番目に位置するハーモニック周波数の周波数範囲をhで割った値(F2)と現ピッチの周波数範囲(F1)との交差部分をピッチの範囲に決定する。図2Bに示されたように、先ず、現在ピッチとして決定されたピークの周波数範囲をピッチ範囲(F1)に設定した後(S410)、ピッチ範囲を決定するためのピッチのハーモニック周波数選択を行うためのハーモニック周波数検出係数(以下、「h」という)を「2」に設定する(S420)。
【0046】
次いで、ピッチの2番目ハーモニック周波数が存在する場合(S430)、2番目ハーモニック周波数範囲を2で割った値をピッチ範囲候補(F2)に決定した後(S440)、該ピッチ範囲候補(F2)と既に設定されたピッチ範囲(F1)との交差部分を再びピッチ候補(F1)に設定する(S450、S460)。
【0047】
また、前記h値を「1」増加させた後(S470)、前記ステップ(S430乃至S460)を繰り返して行う。
【0048】
即ち、hを「3」に設定した後、ピッチの3番目ハーモニック周波数がある場合(S430)、3番目ハーモニック周波数範囲を3で割った値をピッチ範囲候補(F2)に決定した後(S440)、該ピッチ範囲候補(F2)と既に設定されたピッチ範囲(F1)との交差部分を再びピッチ候補(F1)に設定する(S450、S460)。
【0049】
この際、ピッチ範囲候補(F2)と既に設定されたピッチ範囲(F1)との交差部分が存在しない場合は、現ピッチ範囲(F1)をピッチの周波数範囲に決定し、その結果を出力する(S480)。
【0050】
なお、上記のステップ(S430)でh番目ハーモニック周波数が検出されないか、その周波数の大きさが既に設定された値の以下である場合、現ピッチ範囲(F1)をピッチの周波数範囲に決定し、その結果を出力する(S480)。
【0051】
かかる一連のステップをより具体的に説明するため、以下、FFT変換のためのウインドーサイズ(Window Size)が「2048」であり、サンプリングレート(Sampling Rate)が「22,050(Hz)」であり、図4Cのような変換結果となる時におけるピッチを判断する方法を説明する。
【0052】
図4Cから、FFT変換の結果、多数のピークが発生し、それらのFFTインデックスの位置は、左側から「13、25、37、49、62、74、86、98、110、123、135、147、160、173、・・・」であることがわかる。
【0053】
また、これらのうちピーク値が最も大きな最大ピークは、FFTインデックスが「37」である位置に存在する。
【0054】
なお、〔数式5〕は、FFTインデックスにより周波数の範囲を決定する方法を示す計算式であって、FFTインデックス「37」を〔数式5〕に代入して周波数範囲を算出すると、〔数式6〕の結果となる。
【0055】
FFT Index周波数の範囲
【0056】
【数5】
【0057】
FFT Index周波数の範囲
【0058】
【数6】
【0059】
即ち、FFTインデックスが37である時、周波数の範囲は、(387.59〜398.36)Hzであり、これがピッチ候補となる。
【0060】
前述のようにピッチ候補が決定されると、これがピッチのn倍数ハーモニックであるか否かを判別する。このためには、該ピッチ候補をn値で割って当該位置にピークが存在するかを確認する必要がある。なお、n値としては、2→3→5→・・・を順次選択して決定することが好ましい。即ち、nを所定範囲の素数のうちから選択して決定することが好ましい。しかし、nは、所定範囲の素数に限定されるのではなく、nを所定範囲の自然数から選択して決定可能であることはいうまでもない。
【0061】
〔数式7〕は、nによるFFTインデックス計算式であり、〔数式8〕は、nが2である時におけるFFTインデックス計算式である。
【0062】
【数7】
【0063】
【数8】
【0064】
〔数式8〕のように、nが2である場合、nでピッチ候補を割ると、FFTインデックスは、18〜18.5となり、前記ピーク発生位置リスト(13、25、37、49、62、74、86、98、110、123、135、147、160、173、・・・)を参照すると、前記〔数式8〕で計算された位置にはピークが存在しないことがわかる。
【0065】
なお、〔数式9〕は、nが「3」である場合、FFTインデックスを計算した計算式である。
【0066】
【数9】
【0067】
〔数式9〕のように、nが3である場合、FFTインデックスは、「12〜12.33」と「24〜24.666」となり、前記ピーク発生位置リスト(13、25、37、49、62、74、86、98、110、123、135、147、160、173、・・・)を参照すると、12.33を切り上げた「13」と、24.666を切り上げた「25」にピークが発生し、n=3の場合、即ち、周波数分析開始点からピーク位置までの距離(37)の1/3位置である「13」と、周波数分析開始点からピーク位置までの距離(37)の2/3である「25」にピークが存在することがわかる。
【0068】
従って、FFTインデックスが37である周波数は、FFTインデックスが13である位置の周波数の3倍数ハーモニック周波数であることがわかる。即ち、本発明によって図4CのようなFFT変換の結果において、ピッチは、前記〔数式9〕で求められたFFTインデックス値(12〜12.33)を〔数式5〕に代入して計算した値(129.19〜132.78)Hzとなり、その計算式を〔数式10〕および〔数式11〕に示した。
【0069】
FFT Index周波数の範囲
【0070】
【数10】
【0071】
この時、導出されたピッチは、約3.59Hzの誤差範囲を有する。
【0072】
なお、かかる誤差範囲をさらに縮小させるため、本発明のピッチ範囲決定の過程を適用させると、先ず、現在決定されたピッチ(FFT indexが13である位置の周波数)から検出可能なハーモニック周波数情報は、前記ピーク発生位置リスト(13、25、37、49、62、74、86、98、110、123、135、147、160、173、・・・)から得られ、ハーモニック周波数検出係数が12に決定された場合、12番目ハーモニック周波数は、FFT indexが147である時の周波数である。
【0073】
従って、この時の周波数範囲を〔数式5〕によって計算すると、その結果は、〔数式11〕となる。
FFT Index周波数の範囲
【0074】
【数11】
【0075】
即ち、ピッチの12番目ハーモニック周波数の範囲は、(1571.9238〜1582.6904)Hzであり、従って、ピッチの周波数範囲は、〔数式12〕のように、これを12で割った値となる。
【0076】
ハーモニックを用いた基本周波数
【0077】
【数12】
【0078】
これは、前記〔数式10〕で得られた最初ピッチ範囲(129.18〜132.78)Hz内に存在する周波数範囲であって、この時の誤差範囲は、0.8972Hzである。これは、〔数式10〕で得られた最初ピッチ範囲の誤差範囲(約3.5Hz)に比べて遥かに小さな値である。従って、本発明のピッチ判断方法によれば、前述のように、より正確な周波数範囲を導出することが可能となる。
【0079】
ここで、〔数式12〕で得られたピッチの周波数範囲が(130.9937〜133.0)Hzであれば、最終ピッチの範囲は、該値と最初ピッチ範囲(129.18〜132.78)Hzとの交差部分である(130.9937〜132.78)Hzとなる。
【0080】
図3は、本発明によってピッチ範囲を決定するステップを説明するための周波数範囲の計算結果を示す図である。同図には、図4Cに示された各ピークのFFTインデックス位置(31)と、該FFTインデックス位置による周波数範囲(32)と、該周波数のh番目ハーモニック周波数により再計算された周波数範囲(33)と、該再計算された周波数範囲(33)と前ハーモニックにより決定されたピッチとの交差部分に最終決定されたピッチ範囲(34)とが示されている。この時、2番目ハーモニックに対して最終決定されたピッチ範囲(129.1992〜134.5825)(斜線で示す)は、1番目ハーモニックに対して最終決定されたピッチ範囲(129.1992〜139.9658)と2番目ハーモニックのハーモニック範囲により決定されたピッチの範囲(129.1992〜134.5825)との交差部分に決定される。3番目以後のハーモニックに対するピッチ範囲も、上記と同様な方式で決定される。ところで、最初ピッチの13番目ハーモニック周波数の場合(33)、前ハーモニックである12番目ハーモニックに対して最終決定されたピッチ範囲(131.3525〜131.5918)と、13番目ハーモニックのハーモニック範囲により決定されたピッチ範囲(131.6838〜132.5120)との間に交差部分がないため、以後のハーモニックに対しては計算しない。従って、12番目ハーモニックとの交差部分により決定されたピッチ範囲(131.3525〜131.5918)を結果として出力する。
【0081】
以上は、本発明の一実施例を説明したものにすぎず、本発明は、前述した実施例に限定されるものではなく、特許請求の範囲内で種々に変更して実施することが可能である。例えば、本発明の実施例に具体的に示した各構成要素の形状および構造は、変更して実施することができる。例えば、前述の例では、ピッチ候補性質決定係数を素数を例にして説明したが、当業者であれば、ピッチ候補性質決定係数を任意の自然数として適用することができる。
【産業上の利用可能性】
【0082】
以上のように、本発明のピッチ判断方法およびその装置は、周波数分析により得られた最大ピークの周波数がピッチであるか、ピッチのn倍数ハーモニック周波数であるかを判断し、その判断結果によってピッチを決定することにより、最大ピークの周波数を無条件的にピッチと判断することによるピッチ判断の誤りを最小化することができる。
また、本発明によれば、検出されたピッチのハーモニック周波数のうちピッチと所定間隔を維持するハーモニック周波数の周波数範囲に基づいてピッチの周波数範囲を決定することにより、ピッチの誤差範囲を減らしてピッチ判断結果の信頼度を向上させることができる。
【0083】
従って、本発明によれば、周波数分析によるピッチ判断に比べてより正確な判断結果が期待できるという効果を奏する。
【図面の簡単な説明】
【0084】
【図1】図1は、本発明の実施例に係るピッチ判断装置を示す概略的なブロック図である。
【図2】図2は、本発明の実施例によってピッチを判断する方法を示す処理フローチャートである。
【図2A】図2Aは、本発明の実施例によってピッチを決定する方法を示す処理フローチャートである。
【図2B】図2Bは、本発明の実施例によってピッチ範囲を決定する方法を示す処理フローチャートである。
【図3】図3は、本発明によってピッチ範囲を決定するステップを説明するための周波数範囲の計算結果を示す図である。
【図4A】図4Aは、本発明の実施例によってピッチを判断するステップを説明するための例示的な波形図である。
【図4B】図4Bは、本発明の実施例によってピッチを判断するステップを説明するための例示的な波形図である。
【図4C】図4Cは、本発明の実施例によってピッチを判断するステップを説明するための例示的な波形図である。
Claims (20)
- 外部から入力されるデジタル信号を所定の単位時間当りの周波数成分値に分解した後、該周波数成分値により前記デジタル信号のピーク位置を検出する第1のステップと、
前記第1のステップで検出されたピーク位置のうちから最大ピーク位置を選択し、該最大ピーク位置の周波数がピッチであるか、ピッチのn倍数ハーモニック周波数であるかを判別し、これによってピッチを決定する第2のステップと、を含むことを特徴とする周波数分析によるピッチ判断方法。 - 第1項において、前記第2のステップは、
前記第1のステップで検出されたピーク位置のうちから最大ピーク位置の周波数をピッチ候補と決定する第2−1のステップと、
周波数分析開始点から前記ピッチ候補位置までの距離であるピッチ候補距離(d)をnで割ってピーク検出間隔(d/n)を算出した後、周波数分析開始点からピッチ候補位置まで前記ピーク検出間隔(d/n)でピークがあるか否かを確認する第2−2のステップと、
前記第2−2のステップの確認結果、周波数分析開始点からピッチ候補位置まで前記ピーク検出間隔(d/n)でピークが存在すると、前記ピッチ候補が前記ピーチ候補距離(d)をnで割った位置(P)にあるピーク(P_Peak)のn倍数ハーモニック周波数であるものと判断する第2−3のステップと、
前記位置(P)にあるピーク(P_Peak)をピッチ候補に変更した後、前記第2−2のステップ乃至第2−3のステップを繰り返して行う第2−4のステップと、
前記第2−2のステップの確認結果、周波数分析開始点からピッチ候補位置まで前記ピーク検出間隔(d/n)でピークが存在しないと、前記ピッチ候補をピッチと決定する第2−5のステップと、
を含むことを特徴とする周波数分析によるピッチ判断方法。 - 第1項または第2項において、前記nは、
前記ピッチ候補をn倍数ハーモニック周波数に判別するためのピッチ候補性質決定係数であって、所定範囲内の素数を順次適用することを特徴とする周波数分析によるピッチ判断方法。 - 第1項または第2項において、前記nは、
前記ピッチ候補をn倍数ハーモニック周波数に判別するためのピッチ候補性質決定係数であって、所定範囲内の自然数を順次適用することを特徴とする周波数分析によるピッチ判断方法。 - 第1項において、
前記第2のステップで決定されたピッチのハーモニック周波数位置を検出し、該ハーモニック周波数の範囲に基づいて当該ピッチ範囲を決定する第3のステップをさらに含むことを特徴とする周波数分析によるピッチ判断方法。 - 第5項において、前記第3のステップは、
前記第2のステップで決定されたピッチの周波数範囲(F1)を算出した後、前記ピッチの検出可能なハーモニック周波数のうちピッチからh番目に位置するハーモニック周波数の周波数範囲をhで割った値(F2)と前記ピッチの周波数範囲(F1)との交差部分を前記ピッチの範囲に決定することを特徴とする周波数分析によるピッチ判断方法。 - 第6項において、前記hは、
ピッチ範囲を決定するためのピッチのハーモニック周波数選択を行うためのハーモニック周波数検出係数であって、2以上の自然数であることを特徴とする周波数分析によるピッチ判断方法。 - 外部から入力されるデジタル信号を所定の時間単位当りの周波数成分値に分解した後、該周波数成分値に基づいてピッチを決定する第1のステップと、
前記第1のステップで決定されたピッチのハーモニック周波数位置を検出し、該ハーモニック周波数の範囲に基づいて前記ピッチの範囲を決定する第2のステップと、
を含むことを特徴とする周波数分析によるピッチ判断方法。 - 第8項において、前記第2のステップは、
前記第1のステップで決定されたピッチの周波数範囲(F1)を算出した後、前記ピッチの検出可能なハーモニック周波数のうちピッチからh番目に位置するハーモニック周波数の周波数範囲をhで割った値(F2)と前記ピッチの周波数範囲(F1)との交差部分を前記ピッチの範囲に決定することを特徴とする周波数分析によるピッチ判断方法。 - 第9項において、前記hは、
ピッチ範囲を決定するためのピッチのハーモニック周波数選択を行うためのハーモニック周波数検出係数であって、2以上の自然数であることを特徴とする周波数分析によるピッチ判断方法。 - 外部から入力されるデジタル信号を所定の単位時間当りの周波数成分値に分解した後、該周波数成分値により当該信号のピーク位置を検出する周波数分析部と、
前記周波数分析部で検出されたピーク位置のうちから最大ピーク位置を選択してピッチ候補に設定し、該ピッチ候補がピッチであるか、ピッチのn倍数ハーモニック周波数であるかを判別し、前記最大ピーク位置の周波数がn倍数ハーモニック周波数である場合、周波数分析開始点から前記最大ピーク位置までの距離をnで割った位置の周波数をピッチと決定するピッチ決定部と、
前記ピッチ決定部で決定されたピッチを出力する結果出力部と、
を備えることを特徴とする周波数分析によるピッチ判断装置。 - 第11項において、前記ピッチ決定部は、周波数分析開始点から前記ピッチ候補までの距離(d)をnで割ってピーク検出間隔(d/n)を算出した後、周波数分析開始点からピッチ候補位置まで前記ピーク検出間隔(d/n)でピークがあるか否かを確認し、前記ピーク検出間隔(d/n)でピークが存在すると、前記ピッチ候補までの距離(d)をnで割った位置(P)にあるピーク(P_Peak)をピッチ候補に変更するステップ(step1)を行った後、
前記周波数分析開始点から前記ピッチ候補位置まで前記ピーク検出間隔(d/n)でピークが存在する間、前記ステップ(step1)を繰り返して行い、
前記周波数分析開始点から前記ピッチ候補位置まで前記ピーク検出間隔(d/n)でピークが存在しないと、前記ピッチ候補をピッチと決定することを特徴とする周波数分析によるピッチ判断装置。 - 第12項において、前記nは、
前記ピッチ候補をn倍数ハーモニック周波数に判別するためのピッチ候補性質決定係数であって、所定範囲内の素数を順次適用することを特徴とする周波数分析によるピッチ判断装置。 - 第12項において、前記nは、
前記ピッチ候補をn倍数ハーモニック周波数に判別するためのピッチ候補性質決定係数であって、所定範囲内の自然数を順次適用することを特徴とする周波数分析によるピッチ判断装置。 - 第11項において、
前記ピッチ決定部で決定されたピッチのハーモニック周波数位置を検出し、該ハーモニック周波数の範囲に基づいて当該ピッチ範囲を決定するピッチ範囲決定部をさらに備えることを特徴とする周波数分析によるピッチ判断装置。 - 第15項において、前記ピッチ範囲決定部は、
前記ピッチ決定部で決定されたピッチの周波数範囲(F1)を算出した後、前記ピッチの検出可能なハーモニック周波数のうちピッチからh番目に位置するハーモニック周波数の周波数範囲をhで割った値(F2)と前記ピッチの周波数範囲(F1)との交差部分を前記ピッチの範囲に決定することを特徴とする周波数分析によるピッチ判断装置。 - 第16項において、前記hは、
ピッチ範囲を決定するためのピッチのハーモニック周波数選択を行うためのハーモニック周波数検出係数であって、2以上の自然数であることを特徴とする周波数分析によるピッチ判断装置。 - 外部から入力されるデジタル信号を所定の時間単位当りの周波数成分値に分解した後、該周波数成分値に基づいて当該信号のピーク位置を検出する周波数分析部と、
前記周波数分析部で検出されたピーク位置のうちから最大ピーク位置を選択し、該最大ピーク位置の周波数がピッチであるか、ピッチのn倍数ハーモニック周波数であるかを判別し、これによってピッチを決定するピッチ決定部と、
前記ピッチ決定部で決定されたピッチのハーモニック周波数位置を検出し、該ハーモニック周波数の範囲に基づいて当該ピッチの範囲を決定するピッチ範囲決定部と、
前記ピッチ決定部で決定されたピッチを出力する結果出力部と、
を備えることを特徴とする周波数分析によるピッチ判断装置。 - 第18項において、前記第ピッチ範囲決定部は、
前記ピッチ決定部で決定されたピッチの周波数範囲(F1)を算出した後、前記ピッチの検出可能なハーモニック周波数のうちピッチからh番目に位置するハーモニック周波数の周波数範囲をhで割った値(F2)と前記ピッチの周波数範囲(F1)との交差部分を前記ピッチの範囲に決定することを特徴とする周波数分析によるピッチ判断装置。 - 第19項において、前記hは、
ピッチ範囲を決定するためのピッチのハーモニック周波数選択を行うためのハーモニック周波数検出係数であって、2以上の自然数であることを特徴とする周波数分析によるピッチ判断装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020010047777A KR100347188B1 (en) | 2001-08-08 | 2001-08-08 | Method and apparatus for judging pitch according to frequency analysis |
PCT/KR2002/001498 WO2003015077A1 (en) | 2001-08-08 | 2002-08-08 | Pitch determination method and apparatus on spectral analysis |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004538525A true JP2004538525A (ja) | 2004-12-24 |
Family
ID=19712998
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003519928A Pending JP2004538525A (ja) | 2001-08-08 | 2002-08-08 | 周波数分析によるピッチ判断方法および装置 |
Country Status (8)
Country | Link |
---|---|
US (1) | US7493254B2 (ja) |
EP (1) | EP1425735B1 (ja) |
JP (1) | JP2004538525A (ja) |
KR (1) | KR100347188B1 (ja) |
CN (1) | CN1271594C (ja) |
AT (1) | ATE377821T1 (ja) |
DE (1) | DE60223391T2 (ja) |
WO (1) | WO2003015077A1 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011525256A (ja) * | 2008-06-20 | 2011-09-15 | クゥアルコム・インコーポレイテッド | 低ビットレート適用のための遷移音声フレームの符号化 |
JP2013532851A (ja) * | 2010-07-30 | 2013-08-19 | クゥアルコム・インコーポレイテッド | 高調波信号のコーディングのためのシステム、方法、装置、およびコンピュータ可読媒体 |
US8768690B2 (en) | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
CN105845149A (zh) * | 2016-03-18 | 2016-08-10 | 上海语知义信息技术有限公司 | 声音信号中主音高的获取方法及系统 |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100463417B1 (ko) * | 2002-10-10 | 2004-12-23 | 한국전자통신연구원 | 상관함수의 최대값과 그의 후보값의 비를 이용한 피치검출 방법 및 그 장치 |
KR100735343B1 (ko) * | 2006-04-11 | 2007-07-04 | 삼성전자주식회사 | 음성신호의 피치 정보 추출장치 및 방법 |
KR100827153B1 (ko) | 2006-04-17 | 2008-05-02 | 삼성전자주식회사 | 음성 신호의 유성음화 비율 검출 장치 및 방법 |
JP4882899B2 (ja) * | 2007-07-25 | 2012-02-22 | ソニー株式会社 | 音声解析装置、および音声解析方法、並びにコンピュータ・プログラム |
WO2011076284A1 (en) * | 2009-12-23 | 2011-06-30 | Nokia Corporation | An apparatus |
KR101093725B1 (ko) | 2010-01-06 | 2011-12-19 | 한국과학기술원 | 여러 음을 가진 오디오 신호에서 하모닉 구조 모델을 이용한 멜로디 피치 후보 추출 방법 |
KR101106185B1 (ko) * | 2010-01-19 | 2012-01-20 | 한국과학기술원 | 여러 음을 가진 오디오 신호에서 하모닉 구조 모델과 유동적인 길이를 갖는 분석 창을 이용한 멜로디 추출 방법 및 시스템 |
EP2526544A4 (en) | 2010-01-22 | 2015-07-15 | Si X Semiconductor Inc | TUNER FOR BATTERY AND BATTERY ASSEMBLY |
US11062615B1 (en) | 2011-03-01 | 2021-07-13 | Intelligibility Training LLC | Methods and systems for remote language learning in a pandemic-aware world |
US10019995B1 (en) | 2011-03-01 | 2018-07-10 | Alice J. Stiebel | Methods and systems for language learning based on a series of pitch patterns |
US9536523B2 (en) * | 2011-06-22 | 2017-01-03 | Vocalzoom Systems Ltd. | Method and system for identification of speech segments |
WO2013082250A1 (en) | 2011-11-30 | 2013-06-06 | Overtone Labs, Inc. | Drum and drum-set tuner |
US8949118B2 (en) * | 2012-03-19 | 2015-02-03 | Vocalzoom Systems Ltd. | System and method for robust estimation and tracking the fundamental frequency of pseudo periodic signals in the presence of noise |
US9153221B2 (en) | 2012-09-11 | 2015-10-06 | Overtone Labs, Inc. | Timpani tuning and pitch control system |
KR102088622B1 (ko) * | 2013-11-13 | 2020-03-13 | 현대모비스 주식회사 | Adc의 주파수 오차 저장 장치 및 adc의 주파수 오차 보정 장치 |
US10403307B2 (en) | 2016-03-31 | 2019-09-03 | OmniSpeech LLC | Pitch detection algorithm based on multiband PWVT of Teager energy operator |
IL253472B (en) * | 2017-07-13 | 2021-07-29 | Melotec Ltd | Method and system for performing melody recognition |
WO2020024003A1 (en) * | 2018-07-30 | 2020-02-06 | Juxtapus Pty Ltd | Apparatus and computer implemented methods for detecting, transcribing and augmenting the percussive and/or musical content of recorded audio. |
CN113808596A (zh) * | 2020-05-30 | 2021-12-17 | 华为技术有限公司 | 一种音频编码方法和音频编码装置 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL177950C (nl) * | 1978-12-14 | 1986-07-16 | Philips Nv | Spraakanalysesysteem voor het bepalen van de toonhoogte in menselijke spraak. |
NL8400552A (nl) * | 1984-02-22 | 1985-09-16 | Philips Nv | Systeem voor het analyseren van menselijke spraak. |
US5226108A (en) * | 1990-09-20 | 1993-07-06 | Digital Voice Systems, Inc. | Processing a speech signal with estimated pitch |
US5189701A (en) * | 1991-10-25 | 1993-02-23 | Micom Communications Corp. | Voice coder/decoder and methods of coding/decoding |
US5751905A (en) * | 1995-03-15 | 1998-05-12 | International Business Machines Corporation | Statistical acoustic processing method and apparatus for speech recognition using a toned phoneme system |
US5774837A (en) * | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
US5696873A (en) * | 1996-03-18 | 1997-12-09 | Advanced Micro Devices, Inc. | Vocoder system and method for performing pitch estimation using an adaptive correlation sample window |
US5774836A (en) * | 1996-04-01 | 1998-06-30 | Advanced Micro Devices, Inc. | System and method for performing pitch estimation and error checking on low estimated pitch values in a correlation based pitch estimator |
JPH10105195A (ja) | 1996-09-27 | 1998-04-24 | Sony Corp | ピッチ検出方法、音声信号符号化方法および装置 |
JP4121578B2 (ja) * | 1996-10-18 | 2008-07-23 | ソニー株式会社 | 音声分析方法、音声符号化方法および装置 |
KR19980032825U (ko) * | 1996-12-05 | 1998-09-05 | 김종진 | 회전전단기의 단차측정장치 |
US5973252A (en) * | 1997-10-27 | 1999-10-26 | Auburn Audio Technologies, Inc. | Pitch detection and intonation correction apparatus and method |
GB9811019D0 (en) * | 1998-05-21 | 1998-07-22 | Univ Surrey | Speech coders |
US6124544A (en) | 1999-07-30 | 2000-09-26 | Lyrrus Inc. | Electronic music system for detecting pitch |
US6912496B1 (en) * | 1999-10-26 | 2005-06-28 | Silicon Automation Systems | Preprocessing modules for quality enhancement of MBE coders and decoders for signals having transmission path characteristics |
US6627806B1 (en) * | 2000-04-12 | 2003-09-30 | David J. Carpenter | Note detection system and methods of using same |
US6587816B1 (en) * | 2000-07-14 | 2003-07-01 | International Business Machines Corporation | Fast frequency-domain pitch estimation |
GB2375028B (en) * | 2001-04-24 | 2003-05-28 | Motorola Inc | Processing speech signals |
-
2001
- 2001-08-08 KR KR1020010047777A patent/KR100347188B1/ko not_active IP Right Cessation
-
2002
- 2002-08-08 DE DE60223391T patent/DE60223391T2/de not_active Expired - Lifetime
- 2002-08-08 JP JP2003519928A patent/JP2004538525A/ja active Pending
- 2002-08-08 CN CNB028154789A patent/CN1271594C/zh not_active Expired - Fee Related
- 2002-08-08 AT AT02755953T patent/ATE377821T1/de not_active IP Right Cessation
- 2002-08-08 WO PCT/KR2002/001498 patent/WO2003015077A1/en active IP Right Grant
- 2002-08-08 US US10/486,065 patent/US7493254B2/en not_active Expired - Fee Related
- 2002-08-08 EP EP02755953A patent/EP1425735B1/en not_active Expired - Lifetime
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011525256A (ja) * | 2008-06-20 | 2011-09-15 | クゥアルコム・インコーポレイテッド | 低ビットレート適用のための遷移音声フレームの符号化 |
US8768690B2 (en) | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
JP2013532851A (ja) * | 2010-07-30 | 2013-08-19 | クゥアルコム・インコーポレイテッド | 高調波信号のコーディングのためのシステム、方法、装置、およびコンピュータ可読媒体 |
US8831933B2 (en) | 2010-07-30 | 2014-09-09 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for multi-stage shape vector quantization |
US8924222B2 (en) | 2010-07-30 | 2014-12-30 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for coding of harmonic signals |
US9236063B2 (en) | 2010-07-30 | 2016-01-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
CN105845149A (zh) * | 2016-03-18 | 2016-08-10 | 上海语知义信息技术有限公司 | 声音信号中主音高的获取方法及系统 |
CN105845149B (zh) * | 2016-03-18 | 2019-07-09 | 云知声(上海)智能科技有限公司 | 声音信号中主音高的获取方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
DE60223391D1 (de) | 2007-12-20 |
US7493254B2 (en) | 2009-02-17 |
WO2003015077A1 (en) | 2003-02-20 |
DE60223391T2 (de) | 2008-08-28 |
CN1539136A (zh) | 2004-10-20 |
US20040225493A1 (en) | 2004-11-11 |
KR100347188B1 (en) | 2002-08-03 |
ATE377821T1 (de) | 2007-11-15 |
EP1425735B1 (en) | 2007-11-07 |
EP1425735A1 (en) | 2004-06-09 |
CN1271594C (zh) | 2006-08-23 |
EP1425735A4 (en) | 2005-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2004538525A (ja) | 周波数分析によるピッチ判断方法および装置 | |
US6140568A (en) | System and method for automatically detecting a set of fundamental frequencies simultaneously present in an audio signal | |
US6124544A (en) | Electronic music system for detecting pitch | |
US8193436B2 (en) | Segmenting a humming signal into musical notes | |
US8543387B2 (en) | Estimating pitch by modeling audio as a weighted mixture of tone models for harmonic structures | |
Dressler | Pitch estimation by the pair-wise evaluation of spectral peaks | |
US20050091045A1 (en) | Pitch detection method and apparatus | |
JPS63500683A (ja) | 並列処理型ピッチ検出器 | |
US8431810B2 (en) | Tempo detection device, tempo detection method and program | |
CN107210029A (zh) | 用于处理一连串信号以进行复调音符辨识的方法和装置 | |
JP4217616B2 (ja) | 二段階ピッチ判断方法および装置 | |
Teixeira et al. | Ulises: a agent-based system for timbre classification | |
Benetos et al. | Auditory spectrum-based pitched instrument onset detection | |
Pratama et al. | Human vocal type classification using MFCC and convolutional neural network | |
JP4128848B2 (ja) | 音高音価決定方法およびその装置と、音高音価決定プログラムおよびそのプログラムを記録した記録媒体 | |
Dziubiński et al. | High accuracy and octave error immune pitch detection algorithms | |
JPH01219627A (ja) | 自動採譜方法及び装置 | |
Danayi et al. | A novel algorithm based on time-frequency analysis for extracting melody from human whistling | |
Glover et al. | Real-time segmentation of the temporal evolution of musical sounds | |
Teixeira et al. | Ulises: a agent-based system for timbre classification | |
NSKI et al. | High accuracy and octave error immune pitch detection algorithms | |
CN113516971A (zh) | 歌词转换点检测方法、装置、计算机设备及存储介质 | |
CN115472143A (zh) | 一种调性音乐音符起始点检测与音符解码方法及装置 | |
JPH01219622A (ja) | 自動採譜方法及び装置 | |
Amarasinghe et al. | Music search engine using audio input |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050708 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080610 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20081111 |