JP2008518270A - オーディオ信号中の音符を検出する方法、システム及びコンピュータプログラムプロダクト - Google Patents
オーディオ信号中の音符を検出する方法、システム及びコンピュータプログラムプロダクト Download PDFInfo
- Publication number
- JP2008518270A JP2008518270A JP2007538927A JP2007538927A JP2008518270A JP 2008518270 A JP2008518270 A JP 2008518270A JP 2007538927 A JP2007538927 A JP 2007538927A JP 2007538927 A JP2007538927 A JP 2007538927A JP 2008518270 A JP2008518270 A JP 2008518270A
- Authority
- JP
- Japan
- Prior art keywords
- edge
- detected
- edges
- time domain
- detecting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/0008—Associated control or indicating means
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/066—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for pitch analysis as part of wider processing for musical purposes, e.g. transcription, musical performance evaluation; Pitch recognition, e.g. in polyphonic sounds; Estimation or use of missing fundamental
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/086—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for transcription of raw audio or music data to a displayed or printed staff representation or to displayable MIDI-like note-oriented data, e.g. in pianoroll format
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Auxiliary Devices For Music (AREA)
- Electrophonic Musical Instruments (AREA)
Abstract
Description
Fraw(t)=S(t)+N(t)
式中、Fraw(t)はFFTデータの時間領域表現であり、S(t)は信号であり、N(t)はノイズである。自然対数のような対数は、下記の通り取得される。
Fln(ti)=ln(Fraw(ti))
自然対数の平均関数は下記の通り生成される。
Ffinal(ti)=(Fln(ti-1)+Fln(ti)+Fln(ti+1))/3
Claims (67)
- 音符を検出する方法であって、
長時間に亘ってオーディオ信号の複数個の周波数領域表現を生成するステップと、
前記複数個の周波数領域表現から時間領域表現を生成するステップと、
前記時間領域表現内で複数個のエッジを検出するステップと、
前記時間領域表現の特性に基づいて前記音符に対応するものとして前記複数個のエッジのうちの一つを選択することにより前記音符を検出するステップと、
を備える方法。 - 複数個の周波数領域表現を生成するステップが、各組が異なるピッチと関連付けられている、長時間に亘る前記オーディオデータ信号の周波数領域表現の複数の組を生成するステップを備え、
時間領域表現を生成するステップが、前記各組から、各時間領域表現が前記異なるピッチのうちの一つと関連付けられている、複数個の時間領域表現を生成するステップを備え、
複数個のエッジを検出するステップが少なくとも一つの前記時間領域表現内で複数個のエッジを検出するステップを備える、請求項1に記載の方法。 - 複数個のエッジを検出するステップが、少なくとも2個の前記時間領域表現内でエッジを検出するステップを備え、
音符を検出するステップが、
前記音符の基音に対応するものとして前記時間領域表現のうちの第1の時間領域表現内で前記エッジのうちの一つを特定するステップと、
前記音符の倍音に対応するものとして前記時間領域表現のうちの異なる時間領域表現内で前記エッジのうちの一つを特定するステップと、
を備える、請求項2に記載の方法。 - 音符を検出するステップが、
共通の関連した出現時間を有する異なるピッチと関連付けられた時間領域表現からのエッジをグループ分けするステップと、
前記グループ分けされたエッジと関連付けられた強度を決定するステップと、
ピッチの変化に伴う前記決定された強度の変化によって定められる勾配を決定するステップと、
前記決定された勾配に基づいて音符を検出するステップと、
を備える、請求項2に記載の方法。 - 音符を検出するステップが前記音符の長さを決定するステップをさらに備える、請求項2に記載の方法。
- 前記長さが前記音符を生成する機械的な作用と関連付けられている、請求項5に記載の方法。
- 前記機械的な作用が打鍵を含む、請求項6に記載の方法。
- 長時間に亘って前記オーディオ信号の周波数領域表現の複数の組を生成するステップが、
異なるピッチに対応する前記周波数領域表現の各組と関連付けられた周波数域を提供するために不均一な周波数境界を画定するステップと、
周波数領域表現の各組が前記周波数域のうちの対応する一つに基づいている前記周波数領域表現の組のうちのそれぞれの組について長時間に亘って周波数領域表現を生成するステップと、
を備える、請求項2に記載の方法。 - 不均一な周波数境界を画定するステップが、不均一な周波数境界を画定して、音符に対応する複数個の所定のピッチのそれぞれのための実質的に均一な分解能を提供するステップを備える、請求項8に記載の方法。
- 不均一な周波数境界を画定するステップが、不均一な周波数境界を画定して、音符の倍音に対応する複数個の所定のピッチのそれぞれのための周波数域を提供するステップをさらに備える、請求項9に記載の方法。
- 前記時間領域表現内で複数個のエッジを検出するステップが、
第1のエッジ検出データを提供するために第1のタイプのエッジ検出器を通じて前記時間領域表現を処理するステップと、
第2のエッジ検出データを提供するために前記第1のタイプのエッジ検出器とは異なる第2のタイプのエッジ検出器を通じて前記時間領域表現を処理するステップと、
を備え、
前記音符を検出するステップが、前記第1のエッジ検出データ及び前記第2のエッジ検出データに基づいて、前記音符に対応するものとして前記複数個のエッジのうちの一つを選択するステップを含む、請求項2に記載の方法。 - 前記音符を検出するステップが、前記第1のエッジ検出データにおいて検出されたエッジと前記第2のエッジ検出データにおいて検出されたエッジとの間の対応関係に基づいて、エッジが前記音符に対応する可能性を増大させるステップを備える、請求項11に記載の方法。
- 前記第1のタイプのエッジ検出器が、前記時間領域表現の一つにおけるエッジのエネルギーレベルに応答し、音符の勾配特性に合わせられ、前記第2のタイプのエッジ検出器が、前記時間領域表現の一つにおいてエッジの形状に応答するように正規化される、請求項12に記載の方法。
- 前記第1のタイプのエッジ検出器が音符の範囲を表す勾配特性に合わせられ、
複数個のエッジを検出するステップが共通の勾配特性を使用して前記時間領域表現のうちの異なる時間領域表現内で複数個のエッジを検出するステップを備える、請求項13に記載の方法。 - 前記第1のタイプのエッジ検出器が複数個の勾配特性に合わせられ、複数個の勾配特性のうちのそれぞれが異なる音符を表し、
複数個のエッジを検出するステップが前記複数個の勾配特性のうちの対応する勾配特性を使用して前記時間領域表現のうちの異なる時間領域表現内で複数個のエッジを検出するステップを備える、請求項13に記載の方法。 - 複数個のエッジを検出するステップが、検出されたエッジを前記検出されたエッジの開始とピークの中間にある点に対応する時間と関連付けるステップを備える、請求項13に記載の方法。
- 前記時間領域表現内で複数個のエッジを検出するステップが、第3のエッジ検出データを提供するために、前記第1のタイプのエッジ検出器に対応するが、前記第1のタイプのエッジ検出器より高いエネルギーレベル閾値に基づいてエッジを検出するように、より長時間の解析ウィンドウが関連付けられている、第3のエッジ検出器を通じて前記時間領域表現を処理するステップを備え、
前記音符を検出するステップが、前記第1のエッジ検出データ中で検出されたエッジと前記第3のエッジ検出データ中で検出されたエッジとの間の対応関係に基づいて、エッジが前記音符に対応する可能性を増大させるステップを備える、
請求項13に記載の方法。 - 前記より長時間の解析ウィンドウが前記音符を生成する楽器と関連付けられた特性的な長さと少なくとも同じ長さであるように選択される、請求項17に記載の方法。
- 前記より長時間の解析ウィンドウが300ミリ秒を有している、請求項18に記載の方法。
- 複数個のエッジを検出するステップが、
前記時間領域表現のうちのそれぞれの時間領域表現に基づいてエッジ検出信号を受信するステップと、
前記エッジ検出信号中のエッジ信号の強度を検出するステップと、
前記エッジ信号の前記強度が閾値規準を満たさないならば、エッジの指標として前記エッジ信号を考慮しないステップと、
を含む、請求項2に記載の方法。 - 前記閾値規準が前記音符を生成する楽器と関連付けられた最小強度に対応する、請求項20に記載の方法。
- 音符を検出するステップが、
前記時間領域表現のうちの一つにおいて前記検出された複数個のエッジのうちの一つと関連付けられた期間に前記時間領域表現のうちの前記一つと関連付けられた特性化パラメータを計算するステップと、
前記時間領域表現の前記計算された特性化パラメータに基づいて前記音符を検出するステップと、
を備える、請求項2に記載の方法。 - 前記時間領域表現のうちの一つにおいて前記検出された複数個のエッジの内の一つと関連付けられた期間に前記時間領域表現のうちの前記一つと関連付けられたパラメータを特性化するステップが、前記時間領域表現のうちの前記一つの滑らかさの尺度を計算するステップを含む、請求項22に記載の方法。
- 滑らかさの尺度を計算するステップが、
前記期間の少なくとも一部の間に前記時間領域表現のうちの前記一つの対数を計算するステップと、
前記時間領域表現のうちの前記一つの前記対数の移動平均関数を計算するステップと、
前記滑らかさの尺度を提供するために前記計算された対数と移動平均関数を比較するステップと、
を備える、請求項23に記載の方法。 - 前記計算された対数と移動平均関数を比較するステップが、
前記対数と前記移動平均関数との間の差を決定するステップと、
前記滑らかさの尺度を提供するために計算ウィンドウに亘って前記決定された差を加算するステップと、
を備える、請求項24に記載の方法。 - 計算された対数と移動平均関数を比較するステップは、前記検出された複数個のエッジのうちの前記一つに対応する対数において特定されたピークの周りのカウント時間ウィンドウ内での対数の勾配方向変化の個数を決定するステップをさらに備える、請求項25に記載の方法。
- 前記時間領域表現のうちの前記一つと関連付けられた特性化パラメータが、閾値規準を満たす前記滑らかさの尺度のランレングスと、前記時間領域表現のうちの前記一つの最大強度に対応するピーク点で始まる閾値規準を満たす前記滑らかさの尺度のピークランレングスと、最大強度と、長さと、波形形状特性と、最大強度と関連付けられた時間と、及び/又は、決定された最小ピーク時間強度値から決定された最大ピーク時間強度値への相対的な強度とのうちの少なくとも1つを含む、請求項22に記載の方法。
- 音符を検出するステップが、前記検出された複数のエッジのうちの一つと関連付けられた期間に前記時間領域表現のうちの前記一つに対応する前記エッジ検出信号のうちの一つと関連付けられた特性化パラメータを計算するステップをさらに備え、
前記音符を検出するステップが前記エッジ検出信号の前記計算された特性化パラメータに基づいて前記音符を検出するステップをさらに備える、
請求項27に記載の方法。 - 前記時間領域表現のうちの一つに対応する前記エッジ検出信号のうちの一つと関連付けられた前記特性化パラメータが、最大強度と、各方向における前記最大強度時間からの第1の所定の時間オフセットにおける強度と、各方向における前記最大強度時間からの前記第1の所定の時間オフセットとは異なる第2の所定の時間オフセットにおける強度と、及び/又は、勾配方向に変化がない各方向におけるピーク強度点からの前記エッジ検出信号の幅とのうちの少なくとも一つを含む、請求項28に記載の方法。
- より高い強度が関連付けられた前記検出されたエッジからずれた最小時間未満に前記第2のエッジ検出データ中に隣接エッジが検出されないとき、及び/又は、前記検出されたエッジと関連付けられた幅が閾値規準を満たさないとき、前記音符を検出するステップが検出されたエッジを前記第2のエッジ検出データ中に維持するステップを備える、請求項11に記載の方法。
- 前記音符を検出するステップが、
前記第1のエッジ検出データ中の検出エッジが前記第2のエッジ検出データ中に維持された検出エッジと対応するかどうかを決定するステップと、
前記第1のエッジ検出データ中の検出エッジが前記第2のエッジ検出データ中に維持された検出エッジに対応すると決定されたとき、前記第1のエッジ検出データ中の前記検出されたエッジの方が前記音符に対応している可能性が高いと決定するステップと、
を備える、請求項30に記載の方法。 - 前記音符を検出するステップが、検出されたエッジに対し、
前記検出されたエッジとほぼ同時に出現する前記複数個の検出されたエッジのうちの別の検出されたエッジが、前記検出されたエッジの前記時間領域表現と関連付けられたピッチのブリードと関連付けられたピッチに対応するかどうかを決定するステップと、
前記複数個の検出されたエッジのうちの前記別の検出されたエッジが前記検出されたエッジの前記時間領域表現と関連付けられた前記ピッチのブリードと関連付けられるべきであると決定されるならば、前記検出されたエッジと前記複数個の検出されたエッジのうちの前記別の検出されたエッジとの両者のうちの強度が低い方を廃棄するステップと、
を備える、請求項2に記載の方法。 - 前記音符を検出するステップが、検出されたエッジに対し、
前記検出されたエッジと共通の関連した出現時間を有する前記複数の検出されたエッジのうちのその他の検出されたエッジが前記検出されたエッジの前記時間領域表現と関連付けられた前記ピッチの倍音に対応するかどうかを決定するステップを備え、
前記複数の検出されたエッジのうちのその他の検出されたエッジが倍音に対応すると決定されたときに、前記検出されたエッジが前記音符に対応する可能性が高いと決定するステップとを備え、
前記複数の検出されたエッジのうちのその他の検出されたエッジの中に倍音に対応するエッジがないと決定されたときに、前記検出されたエッジが前記音符に対応する可能性が低いと決定するステップと、前記検出されたエッジが前記複数個の検出されたエッジのうちの別の検出されたエッジの倍音に対応すると決定されたときに、前記検出されたエッジが前記音符に対応する可能性が低いと決定するステップと、のうちの少なくとも1つのステップをさらに備える、
請求項2に記載の方法。 - 前記複数の検出されたエッジのうちのその他の検出されたエッジが前記検出されたエッジの前記時間領域表現と関連付けられた前記ピッチの倍音に対応するかどうかを決定するステップが、
前記複数個の検出されたエッジのうちのその他の検出されたエッジを、前記検出されたエッジと共通の関連した出現時間を有する異なるピッチと関連付けられた時間領域表現から、グループ分けするステップと、
前記グループ分けされたエッジと関連付けられた強度を決定するステップと、
ピッチの変化に伴う前記決定された強度の変化によって定められる勾配を決定するステップと、
前記複数個の検出されたエッジのうちの前記その他の検出されたエッジが前記決定された勾配に基づいて前記検出されたエッジの倍音に対応するかどうかを決定するステップと、
をさらに備える、請求項33に記載の方法。 - 前記音符を検出するステップが、前記検出された複数個のエッジのうちの前記一つに対し、
前記検出されたエッジが、前記時間領域表現のうちの前記一つと関連付けられた前記特性化パラメータに基づいて、音符ではなくノイズに対応するかどうかを決定するステップと、
ノイズに対応すると決定されたときに、前記検出されたエッジを廃棄するステップと、
を備える、請求項27に記載の方法。 - 前記検出されたエッジがノイズに対応するかどうかを決定するステップが、
前記時間領域表現のうちの前記一つと関連付けられた前記特性化パラメータが対応する閾値規準を満たすかどうかを決定するステップと、
それぞれの特性化パラメータに割り当てられた重み付け値に基づいて、対応する閾値規準を満たすことが決定された前記時間領域表現のうちの前記一つと関連付けられた前記特性化パラメータを重み付けするステップと、
前記重み付けされた特性化パラメータを加算するステップと、
前記加算され重み付けされた特性化パラメータが閾値規準を満たさないときに、前記検出されたエッジがノイズに対応すると決定するステップと、
を備える、請求項35に記載の方法。 - 前記検出されたエッジがノイズに対応するかどうかを決定するステップが、周知の音符から生成された基準特性化パラメータに基づいて生成されたルール決定木に基づいて、前記検出されたエッジがノイズに対応するかどうかを決定するステップを備える、請求項34に記載の方法。
- 前記音符を検出するステップが、
維持された検出エッジのピーク強度を同じ時間領域表現からの隣接する廃棄された検出エッジのピーク強度と比較するステップと、
前記隣接する廃棄された検出エッジが対応する維持された検出エッジより大きな強度を有するならば、前記隣接する廃棄された検出エッジを維持するステップと、
をさらに備える、請求項35に記載の方法。 - 前記音符を検出するステップが、
同じ時間領域表現内の前記検出されたエッジのそれぞれの出現時間及び長さを決定するステップと、
前記検出されたエッジの前記出現時間及び長さに基づいて検出されたエッジの重複を検出するステップと、
前記重複する検出されたエッジの中で音符に対応する可能性が高い方を決定するステップと、
音符に対応する可能性が高くない方の重複するエッジを廃棄するステップと、
をさらに備える、請求項2に記載の方法。 - 前記音符を検出するステップが、
前記時間領域表現のうちの一つにおいて前記検出された複数個のエッジのうちの一つと関連付けられた期間に前記時間領域表現のうちの前記一つと関連付けられた特性化パラメータを決定するステップと、
前記決定された特性化パラメータのうちの一つが前記音符を生成する機械的な作用の周知の特性に基づく関連付けられた閾値規準を満たさないならば、前記検出された複数個のエッジのうちの前記一つを廃棄するステップと、
をさらに備える、請求項2に記載の方法。 - 前記周知の特性がストライク速度を含み、
特性化パラメータを決定するステップが、
前記期間に前記時間領域表現のうちの前記一つと関連付けられたピーク強度を測定するステップと、
前記測定されたピーク強度に基づいて、前記音符を生成する前記機械的な作用の推定ストライク速度を決定するステップと、
を備え、
前記検出された複数個のエッジのうちの前記一つを廃棄するステップが、前記推定ストライク速度がゼロ未満であるならば、前記検出された複数個のエッジのうちの前記一つを廃棄するステップを備える、
請求項40に記載の方法。 - 前記周知の特性が前記音符を生成する楽器のピッチ範囲を含み、
特性化パラメータを決定するステップが前記時間領域表現のうちの前記一つと関連付けられたピッチを決定するステップを備え、
前記検出された複数個のエッジのうちの前記一つを廃棄するステップが、前記決定されたピッチが前記ピッチ範囲の外側にあるならば、前記検出された複数個のエッジのうちの前記一つを廃棄するステップを備える、
請求項40に記載の方法。 - 前記音符を検出するステップが、あらゆるその他のエッジ廃棄動作の後に続いて、倍音に対応する検出されたエッジを廃棄するステップをさらに備える、請求項33に記載の方法。
- 音符を検出するステップが楽譜と関連付けられた複数個の音符を検出するステップを備え、
前記楽譜のMIDIファイルを生成するステップをさらに備える、請求項2に記載の方法。 - 前記MIDIファイル内の前記音符のそれぞれが、長さ、音符ストライク速度及び/又は音符リリース速度のうちの少なくとも1つと、開始時間と、ピッチとによって特徴付けられる、請求項44に記載の方法。
- 前記音符ストライク速度が前記音符に対応する検出されたエッジのピーク強度値に基づき、前記音符リリース速度が前記音符ストライク速度及び前記長さに基づく、請求項45に記載の方法。
- 複数個の周波数領域表現を生成するステップが複数個の高速フーリエ変換(FFT)を生成するステップを備える、請求項2に記載の方法。
- 前記FFTが少なくとも約10ミリ秒の分解能を有する、請求項47に記載の方法。
- 周波数領域のための選択された時間ウィンドウに対し、エッジが検出された前記FFTの期待される音符と関連付けられた範囲が、前記音符の開始時間及び/又は長さをさらに評価するために、少なくとも約1ミリ秒の分解能を有するFFTに基づいてさらに評価される、請求項48に記載の方法。
- 音符を検出するシステムであって、
長時間に亘ってオーディオ信号の複数個の周波数領域表現を生成する周波数領域モジュールと、
前記複数個の周波数領域表現から時間領域表現を生成する時間領域モジュールと、
前記時間領域表現内で複数個のエッジを検出するエッジ検出モジュールと、
前記時間領域表現の特性に基づいて前記音符に対応するものとして前記複数個のエッジのうちの一つを選択することにより前記音符を検出する音符検出モジュールと、
を備えるシステム。 - コンピュータ読み取り可能なプログラムコードが内部に具現化されたコンピュータ読み取り可能な媒体を備える、音符を検出するコンピュータプログラムプロダクトであって、
前記コンピュータ読み取り可能なプログラムコードが、
長時間に亘ってオーディオ信号の複数個の周波数領域表現を生成するように構成されたコンピュータ読み取り可能なプログラムコードと、
前記複数個の周波数領域表現から時間領域表現を生成するように構成されたコンピュータ読み取り可能なプログラムコードと、
前記時間領域表現内で複数個のエッジを検出するように構成されたコンピュータ読み取り可能なプログラムコードと、
前記時間領域表現の特性に基づいて前記音符に対応するものとして前記複数個のエッジのうちの一つを選択することにより前記音符を検出するように構成されたコンピュータ読み取り可能なプログラムコードと、
を備える、コンピュータプログラムプロダクト。 - 音符を検出する方法であって、
各組が異なるピッチと関連付けられている、長時間に亘るオーディオ信号の周波数領域表現の複数の組を生成するステップと、
前記周波数領域表現の組に基づいて、各候補音符がピッチと関連付けられている複数個の候補音符を特定するステップと、
共通の関連した出現時間を有する異なるピッチをもつ前記候補音符をグループ分けするステップと、
前記グループ分けされた候補音符と関連付けられた強度を決定するステップと、
ピッチの変化に伴う前記決定された強度の変化によって定められた勾配を決定するステップと、
前記決定された勾配に基づいて前記音符を検出するステップと、
を備える方法。 - 音符を検出する方法であって、
異なるピッチに対応する複数個の周波数範囲を提供するために不均一な周波数境界を画定するステップと、
各組が前記異なるピッチのうちの一つのピッチと関連付けられている、長時間に亘るオーディオデータ信号の周波数領域表現の複数の組を生成するステップと、
前記周波数領域表現の複数の組に基づいて前記音符を検出するステップと、
を備える方法。 - 不均一な周波数境界を画定するステップが、音符に対応する複数個の所定のピッチ毎に実質的に均一な分解能を提供するために不均一な周波数境界を画定するステップを備える、請求項53に記載の方法。
- 不均一な周波数境界を画定するステップが、音符の倍音に対応する複数個の所定のピッチ毎に周波数範囲を提供するために不均一な周波数境界を画定するステップをさらに備える、請求項54に記載の方法。
- 信号エッジを検出する方法であって、
前記信号エッジ及びノイズによって生成されたエッジを含むデータ信号を受信するステップと、
第1のエッジ検出データを提供するために第1のタイプのエッジ検出器を通じて前記データ信号を処理するステップと、
第2のエッジ検出データを提供するために、前記第1のタイプのエッジ検出器とは異なる、第2のタイプのエッジ検出器を通じて前記データ信号を処理するステップと、
前記第1のエッジ検出データ及び前記第2のエッジ検出データに基づいて前記信号エッジとして前記データ信号中の前記エッジのうちの一つを選択するステップと、
を備える方法。 - 前記エッジのうちの一つを選択するステップが、前記第1のエッジ検出データ中で検出されたエッジと前記第2のエッジ検出データ中で検出されたエッジとの間の対応関係に基づいて、エッジが前記信号エッジに対応する可能性を増大させるステップを備える、請求項56に記載の方法。
- 前記第1のタイプのエッジ検出器が、前記データ信号中のエッジのエネルギーレベルに応答し、前記信号エッジの勾配特性に合わせられ、前記第2のタイプのエッジ検出器が前記データ信号中で検出されたエッジの形状に応答するように正規化される、請求項57に記載の方法。
- 前記信号エッジが複数個の異なるタイプの信号エッジのうちの一つであり、
前記第1のタイプのエッジ検出器が前記異なるタイプの信号エッジを表す共通勾配特性に合わせられ、
前記エッジのうちの一つを選択するステップが、前記共通勾配特性を使用して前記信号エッジとしてエッジのうちの一つを選択するステップを備える、
請求項58に記載の方法。 - 前記信号エッジが複数個の異なるタイプの信号エッジのうちの一つであり、
前記第1のタイプのエッジ検出器が、各勾配特性が異なるタイプの信号エッジを表す複数個の勾配特性に合わせられ、
前記エッジのうちの一つを選択するステップが、前記複数個の勾配特性のうちの対応する勾配特性を使用して前記信号エッジとして複数個のエッジを選択するステップを備える、
請求項58に記載の方法。 - 第3のエッジ検出データを提供するために、前記第1のタイプのエッジ検出器に対応するが、前記第1のタイプのエッジ検出器より高いエネルギーレベル閾値に基づいてエッジを検出するように、より長時間の解析ウィンドウが関連付けられている第3のエッジ検出器を通じて前記データ信号を処理するステップをさらに備え、
前記エッジのうちの一つを選択するステップが、前記第1のエッジ検出データ中で検出されたエッジと前記第3のエッジ検出データ中で検出されたエッジとの間の対応関係に基づいて、エッジが前記信号エッジに対応する可能性を増大させるステップを備える、
請求項58に記載の方法。 - 前記より長時間の解析ウィンドウが前記信号エッジと関連付けられた特性長さと少なくとも同じ長さであるように選択される、請求項61に記載の方法。
- 音符を検出する方法であって、
長時間に亘ってオーディオ信号の複数個の周波数領域表現を生成するステップと、
前記複数個の周波数領域表現から時間領域表現を生成するステップと、
前記時間領域表現の滑らかさの尺度を計算するステップと、
前記滑らかさの尺度に基づいて前記音符を検出するステップと、
を備える方法。 - 滑らかさの尺度を計算するステップが、
前記時間領域表現の対数を計算するステップと、
前記時間領域表現の前記対数の移動平均関数を計算するステップと、
前記滑らかさの尺度を提供するために前記計算された対数と移動平均関数を比較するステップと、
を備える、請求項63に記載の方法。 - 前記計算された対数と移動平均関数を比較するステップが、
前記対数と前記移動平均関数との間の差を決定するステップと、
前記滑らかさの尺度を提供するために、計算ウィンドウに亘って前記決定された差を加算するステップと、
を備える、請求項64に記載の方法。 - 前記計算された対数と移動平均関数を比較するステップが、前記対数中の特定されたピークの周りのカウント時間ウィンドウ内の前記対数の勾配方向変化の個数を決定するステップをさらに備える、請求項65に記載の方法。
- 音符を検出する方法であって、
長時間に亘ってオーディオ信号の複数個の周波数領域表現を生成するステップと、
前記複数個の周波数領域表現から時間領域表現を生成するステップと、
受信されたオーディオ信号に基づいてエッジ検出器から出力信号を生成するステップと、
前記時間領域表現と関連付けられた特性化パラメータを計算するステップと、
前記エッジ検出器からの前記出力信号と関連付けられた特性化パラメータを計算するステップと、
前記時間領域表現の前記計算された特性化パラメータと前記エッジ検出器からの前記出力信号とに基づいて前記音符を検出するステップと、
を備える方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/977,850 US7598447B2 (en) | 2004-10-29 | 2004-10-29 | Methods, systems and computer program products for detecting musical notes in an audio signal |
PCT/US2005/034527 WO2006049745A1 (en) | 2004-10-29 | 2005-09-27 | Methods, systems and computer program products for detecting musical notes in an audio signal |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008518270A true JP2008518270A (ja) | 2008-05-29 |
Family
ID=35632548
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007538927A Pending JP2008518270A (ja) | 2004-10-29 | 2005-09-27 | オーディオ信号中の音符を検出する方法、システム及びコンピュータプログラムプロダクト |
Country Status (5)
Country | Link |
---|---|
US (2) | US7598447B2 (ja) |
EP (1) | EP1805751A1 (ja) |
JP (1) | JP2008518270A (ja) |
CA (1) | CA2585467A1 (ja) |
WO (1) | WO2006049745A1 (ja) |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7598447B2 (en) * | 2004-10-29 | 2009-10-06 | Zenph Studios, Inc. | Methods, systems and computer program products for detecting musical notes in an audio signal |
US8093484B2 (en) * | 2004-10-29 | 2012-01-10 | Zenph Sound Innovations, Inc. | Methods, systems and computer program products for regenerating audio performances |
KR100735444B1 (ko) * | 2005-07-18 | 2007-07-04 | 삼성전자주식회사 | 오디오데이터 및 악보이미지 추출방법 |
JP4672474B2 (ja) * | 2005-07-22 | 2011-04-20 | 株式会社河合楽器製作所 | 自動採譜装置及びプログラム |
US8184835B2 (en) * | 2005-10-14 | 2012-05-22 | Creative Technology Ltd | Transducer array with nonuniform asymmetric spacing and method for configuring array |
WO2008095190A2 (en) * | 2007-02-01 | 2008-08-07 | Museami, Inc. | Music transcription |
US8067252B2 (en) * | 2007-02-13 | 2011-11-29 | Advanced Micro Devices, Inc. | Method for determining low-noise power spectral density for characterizing line edge roughness in semiconductor wafer processing |
US7838755B2 (en) * | 2007-02-14 | 2010-11-23 | Museami, Inc. | Music-based search engine |
US8494842B2 (en) * | 2007-11-02 | 2013-07-23 | Soundhound, Inc. | Vibrato detection modules in a system for automatic transcription of sung or hummed melodies |
US8494257B2 (en) | 2008-02-13 | 2013-07-23 | Museami, Inc. | Music score deconstruction |
DE102008013172B4 (de) * | 2008-03-07 | 2010-07-08 | Neubäcker, Peter | Verfahren zur klangobjektorientierten Analyse und zur notenobjektorientierten Bearbeitung polyphoner Klangaufnahmen |
WO2009117133A1 (en) * | 2008-03-20 | 2009-09-24 | Zenph Studios, Inc. | Methods, systems and computer program products for regenerating audio performances |
US9037474B2 (en) * | 2008-09-06 | 2015-05-19 | Huawei Technologies Co., Ltd. | Method for classifying audio signal into fast signal or slow signal |
US8358744B2 (en) | 2009-02-27 | 2013-01-22 | Centurylink Intellectual Property Llc | Teletypewriter (TTY) for communicating pre-stored emergency messages to public safety answering points (PSAPS) |
US8017854B2 (en) * | 2009-05-29 | 2011-09-13 | Harmonix Music Systems, Inc. | Dynamic musical part determination |
WO2011018095A1 (en) * | 2009-08-14 | 2011-02-17 | The Tc Group A/S | Polyphonic tuner |
WO2011090843A2 (en) * | 2010-01-22 | 2011-07-28 | Si X Semiconductor Inc. | Drum and drum-set tuner |
US8309834B2 (en) * | 2010-04-12 | 2012-11-13 | Apple Inc. | Polyphonic note detection |
US20130152767A1 (en) * | 2010-04-22 | 2013-06-20 | Jamrt Ltd | Generating pitched musical events corresponding to musical content |
US20120095729A1 (en) * | 2010-10-14 | 2012-04-19 | Electronics And Telecommunications Research Institute | Known information compression apparatus and method for separating sound source |
US10019995B1 (en) | 2011-03-01 | 2018-07-10 | Alice J. Stiebel | Methods and systems for language learning based on a series of pitch patterns |
US11062615B1 (en) | 2011-03-01 | 2021-07-13 | Intelligibility Training LLC | Methods and systems for remote language learning in a pandemic-aware world |
US20120294457A1 (en) * | 2011-05-17 | 2012-11-22 | Fender Musical Instruments Corporation | Audio System and Method of Using Adaptive Intelligence to Distinguish Information Content of Audio Signals and Control Signal Processing Function |
CN103890837A (zh) | 2011-11-30 | 2014-06-25 | 泛音实验室股份有限公司 | 鼓和架子鼓调谐装置 |
GB201202515D0 (en) | 2012-02-14 | 2012-03-28 | Spectral Efficiency Ltd | Method for giving feedback on a musical performance |
JP2013205830A (ja) * | 2012-03-29 | 2013-10-07 | Sony Corp | トーン成分検出方法、トーン成分検出装置およびプログラム |
US9263060B2 (en) * | 2012-08-21 | 2016-02-16 | Marian Mason Publishing Company, Llc | Artificial neural network based system for classification of the emotional content of digital music |
US9153221B2 (en) | 2012-09-11 | 2015-10-06 | Overtone Labs, Inc. | Timpani tuning and pitch control system |
US8921677B1 (en) | 2012-12-10 | 2014-12-30 | Frank Michael Severino | Technologies for aiding in music composition |
US9402173B2 (en) * | 2013-12-06 | 2016-07-26 | HTC Marketing Corp. | Methods and apparatus for providing access to emergency service providers |
US9552741B2 (en) * | 2014-08-09 | 2017-01-24 | Quantz Company, Llc | Systems and methods for quantifying a sound into dynamic pitch-based graphs |
CN105590629B (zh) * | 2014-11-18 | 2018-09-21 | 华为终端(东莞)有限公司 | 一种语音处理的方法及装置 |
WO2017058893A1 (en) * | 2015-09-29 | 2017-04-06 | Swineguard, Inc. | Warning system for animal farrowing operations |
US9711121B1 (en) * | 2015-12-28 | 2017-07-18 | Berggram Development Oy | Latency enhanced note recognition method in gaming |
US10249209B2 (en) | 2017-06-12 | 2019-04-02 | Harmony Helper, LLC | Real-time pitch detection for creating, practicing and sharing of musical harmonies |
US11282407B2 (en) | 2017-06-12 | 2022-03-22 | Harmony Helper, LLC | Teaching vocal harmonies |
US11627721B2 (en) * | 2017-12-29 | 2023-04-18 | Swinetech, Inc. | Improving detection, prevention, and reaction in a warning system for animal farrowing operations |
CN110599987A (zh) * | 2019-08-25 | 2019-12-20 | 南京理工大学 | 基于卷积神经网络的钢琴音符识别算法 |
CN111415681B (zh) * | 2020-03-17 | 2023-09-01 | 北京奇艺世纪科技有限公司 | 一种基于音频数据确定音符的方法及装置 |
CN113744760B (zh) * | 2020-05-28 | 2024-04-30 | 小叶子(北京)科技有限公司 | 一种音高识别方法、装置、电子设备及存储介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5585228A (en) * | 1978-12-22 | 1980-06-27 | Yokogawa Hokushin Electric Corp | Musical sound analyzer |
JPH04261592A (ja) * | 1991-01-07 | 1992-09-17 | Brother Ind Ltd | 自動採譜装置 |
JPH05273964A (ja) * | 1992-03-30 | 1993-10-22 | Brother Ind Ltd | 自動採譜装置等に用いられるアタック時刻検出装置 |
JP2001027895A (ja) * | 1999-07-14 | 2001-01-30 | Canon Inc | 信号分離方法及び装置 |
JP2001125562A (ja) * | 1999-10-27 | 2001-05-11 | Natl Inst Of Advanced Industrial Science & Technology Meti | 音高推定方法及び装置 |
JP2002278544A (ja) * | 2001-03-22 | 2002-09-27 | Yamaha Corp | 採譜方法および採譜装置 |
JP2003099067A (ja) * | 2001-09-21 | 2003-04-04 | Yamaha Corp | 波形データ編集方法、波形データ編集装置、プログラムおよび波形メモリの生産方法 |
JP2003162282A (ja) * | 2001-11-28 | 2003-06-06 | Yamaha Corp | 演奏情報生成方法、演奏情報生成装置およびプログラム |
JP2003255951A (ja) * | 2002-03-04 | 2003-09-10 | Yamaha Corp | 波形処理方法および装置 |
WO2003088534A1 (en) * | 2002-04-05 | 2003-10-23 | International Business Machines Corporation | Feature-based audio content identification |
JP2004021027A (ja) * | 2002-06-18 | 2004-01-22 | Yamaha Corp | 演奏音制御方法及び装置 |
JP2004526203A (ja) * | 2001-04-10 | 2004-08-26 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 音楽信号を音符基準表記に変換する方法及び装置、並びに、音楽信号をデータバンクに照会する方法及び装置 |
Family Cites Families (86)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4377961A (en) * | 1979-09-10 | 1983-03-29 | Bode Harald E W | Fundamental frequency extracting system |
US4273023A (en) * | 1979-12-26 | 1981-06-16 | Mercer Stanley L | Aural pitch recognition teaching device |
US4463650A (en) * | 1981-11-19 | 1984-08-07 | Rupert Robert E | System for converting oral music to instrumental music |
US4457203A (en) * | 1982-03-09 | 1984-07-03 | Wright-Malta Corporation | Sound signal automatic detection and display method and system |
US4633748A (en) * | 1983-02-27 | 1987-01-06 | Casio Computer Co., Ltd. | Electronic musical instrument |
US4479416A (en) * | 1983-08-25 | 1984-10-30 | Clague Kevin L | Apparatus and method for transcribing music |
US4665790A (en) * | 1985-10-09 | 1987-05-19 | Stanley Rothschild | Pitch identification device |
US4688464A (en) * | 1986-01-16 | 1987-08-25 | Ivl Technologies Ltd. | Pitch detection apparatus |
US5038658A (en) * | 1988-02-29 | 1991-08-13 | Nec Home Electronics Ltd. | Method for automatically transcribing music and apparatus therefore |
JP2775651B2 (ja) * | 1990-05-14 | 1998-07-16 | カシオ計算機株式会社 | 音階検出装置及びそれを用いた電子楽器 |
US5349130A (en) * | 1991-05-02 | 1994-09-20 | Casio Computer Co., Ltd. | Pitch extracting apparatus having means for measuring interval between zero-crossing points of a waveform |
US5210366A (en) * | 1991-06-10 | 1993-05-11 | Sykes Jr Richard O | Method and device for detecting and separating voices in a complex musical composition |
US5357045A (en) * | 1991-10-24 | 1994-10-18 | Nec Corporation | Repetitive PCM data developing device |
US5812688A (en) * | 1992-04-27 | 1998-09-22 | Gibson; David A. | Method and apparatus for using visual images to mix sound |
US5567901A (en) * | 1995-01-18 | 1996-10-22 | Ivl Technologies Ltd. | Method and apparatus for changing the timbre and/or pitch of audio signals |
US5719344A (en) * | 1995-04-18 | 1998-02-17 | Texas Instruments Incorporated | Method and system for karaoke scoring |
US5619004A (en) * | 1995-06-07 | 1997-04-08 | Virtual Dsp Corporation | Method and device for determining the primary pitch of a music signal |
JP3424787B2 (ja) * | 1996-03-12 | 2003-07-07 | ヤマハ株式会社 | 演奏情報検出装置 |
US5693903A (en) * | 1996-04-04 | 1997-12-02 | Coda Music Technology, Inc. | Apparatus and method for analyzing vocal audio data to provide accompaniment to a vocalist |
US7297856B2 (en) * | 1996-07-10 | 2007-11-20 | Sitrick David H | System and methodology for coordinating musical communication and display |
US7333863B1 (en) * | 1997-05-05 | 2008-02-19 | Warner Music Group, Inc. | Recording and playback control system |
JP3502247B2 (ja) * | 1997-10-28 | 2004-03-02 | ヤマハ株式会社 | 音声変換装置 |
US6140568A (en) * | 1997-11-06 | 2000-10-31 | Innovative Music Systems, Inc. | System and method for automatically detecting a set of fundamental frequencies simultaneously present in an audio signal |
US7162046B2 (en) * | 1998-05-04 | 2007-01-09 | Schwartz Stephen R | Microphone-tailored equalizing system |
US5986199A (en) * | 1998-05-29 | 1999-11-16 | Creative Technology, Ltd. | Device for acoustic entry of musical data |
TW430778B (en) * | 1998-06-15 | 2001-04-21 | Yamaha Corp | Voice converter with extraction and modification of attribute data |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US7096186B2 (en) * | 1998-09-01 | 2006-08-22 | Yamaha Corporation | Device and method for analyzing and representing sound signals in the musical notation |
US6725108B1 (en) * | 1999-01-28 | 2004-04-20 | International Business Machines Corporation | System and method for interpretation and visualization of acoustic spectra, particularly to discover the pitch and timbre of musical sounds |
US6787689B1 (en) * | 1999-04-01 | 2004-09-07 | Industrial Technology Research Institute Computer & Communication Research Laboratories | Fast beat counter with stability enhancement |
US6124544A (en) * | 1999-07-30 | 2000-09-26 | Lyrrus Inc. | Electronic music system for detecting pitch |
US6355869B1 (en) * | 1999-08-19 | 2002-03-12 | Duane Mitton | Method and system for creating musical scores from musical recordings |
AU2001243484A1 (en) * | 2000-03-08 | 2001-09-17 | Lyrrus Inc. Doing Business As G- Vox | On-line notation system |
US7317958B1 (en) * | 2000-03-08 | 2008-01-08 | The Regents Of The University Of California | Apparatus and method of additive synthesis of digital audio signals using a recursive digital oscillator |
JP4399961B2 (ja) * | 2000-06-21 | 2010-01-20 | ヤマハ株式会社 | 楽譜画面表示装置及び演奏装置 |
FI20001592A (fi) * | 2000-07-03 | 2002-04-11 | Elmorex Ltd Oy | Nuottipohjaisen koodin generointi |
US6856923B2 (en) * | 2000-12-05 | 2005-02-15 | Amusetec Co., Ltd. | Method for analyzing music using sounds instruments |
CA2742644C (en) * | 2001-02-20 | 2016-04-12 | Caron S. Ellis | Multiple radio signal processing and storing method and apparatus |
JP3744366B2 (ja) * | 2001-03-06 | 2006-02-08 | ヤマハ株式会社 | 楽曲データに基づく音楽記号自動決定装置、楽曲データに基づく楽譜表示制御装置、および、楽曲データに基づく音楽記号自動決定プログラム |
US7610205B2 (en) * | 2002-02-12 | 2009-10-27 | Dolby Laboratories Licensing Corporation | High quality time-scaling and pitch-scaling of audio signals |
KR100412196B1 (ko) * | 2001-05-21 | 2003-12-24 | 어뮤즈텍(주) | 악보 추적 방법 및 그 장치 |
AU2001270365A1 (en) * | 2001-06-11 | 2002-12-23 | Ivl Technologies Ltd. | Pitch candidate selection method for multi-channel pitch detectors |
US7314994B2 (en) * | 2001-11-19 | 2008-01-01 | Ricoh Company, Ltd. | Music processing printer |
KR100455751B1 (ko) * | 2001-12-18 | 2004-11-06 | 어뮤즈텍(주) | 연주악기의 소리정보를 이용한 음악분석장치 |
US7202407B2 (en) * | 2002-02-28 | 2007-04-10 | Yamaha Corporation | Tone material editing apparatus and tone material editing program |
US20030220787A1 (en) * | 2002-04-19 | 2003-11-27 | Henrik Svensson | Method of and apparatus for pitch period estimation |
US7366659B2 (en) * | 2002-06-07 | 2008-04-29 | Lucent Technologies Inc. | Methods and devices for selectively generating time-scaled sound signals |
EP1529279A1 (en) * | 2002-08-02 | 2005-05-11 | Koninklijke Philips Electronics N.V. | Method and apparatus to improve the reproduction of music content |
CN1703734A (zh) * | 2002-10-11 | 2005-11-30 | 松下电器产业株式会社 | 从声音确定音符的方法和装置 |
JP3891111B2 (ja) * | 2002-12-12 | 2007-03-14 | ソニー株式会社 | 音響信号処理装置及び方法、信号記録装置及び方法、並びにプログラム |
US7272551B2 (en) * | 2003-02-24 | 2007-09-18 | International Business Machines Corporation | Computational effectiveness enhancement of frequency domain pitch estimators |
US20040193429A1 (en) * | 2003-03-24 | 2004-09-30 | Suns-K Co., Ltd. | Music file generating apparatus, music file generating method, and recorded medium |
US7323629B2 (en) * | 2003-07-16 | 2008-01-29 | Univ Iowa State Res Found Inc | Real time music recognition and display system |
US20050047607A1 (en) * | 2003-09-03 | 2005-03-03 | Freiheit Ronald R. | System and method for sharing acoustical signal control among acoustical virtual environments |
SG120121A1 (en) * | 2003-09-26 | 2006-03-28 | St Microelectronics Asia | Pitch detection of speech signals |
US20050091044A1 (en) * | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for pitch contour quantization in audio coding |
KR100552693B1 (ko) * | 2003-10-25 | 2006-02-20 | 삼성전자주식회사 | 피치검출방법 및 장치 |
TWI282970B (en) * | 2003-11-28 | 2007-06-21 | Mediatek Inc | Method and apparatus for karaoke scoring |
US7442870B2 (en) * | 2004-01-02 | 2008-10-28 | Apple Inc. | Method and apparatus for enabling advanced manipulation of audio |
US20050222847A1 (en) * | 2004-03-18 | 2005-10-06 | Singhal Manoj K | System and method for time domain audio slow down, while maintaining pitch |
US20050209847A1 (en) * | 2004-03-18 | 2005-09-22 | Singhal Manoj K | System and method for time domain audio speed up, while maintaining pitch |
CN1998045A (zh) * | 2004-07-13 | 2007-07-11 | 松下电器产业株式会社 | 音调频率估计装置以及音调频率估计方法 |
KR100590561B1 (ko) * | 2004-10-12 | 2006-06-19 | 삼성전자주식회사 | 신호의 피치를 평가하는 방법 및 장치 |
US7949520B2 (en) * | 2004-10-26 | 2011-05-24 | QNX Software Sytems Co. | Adaptive filter pitch extraction |
JP4840141B2 (ja) * | 2004-10-27 | 2011-12-21 | ヤマハ株式会社 | ピッチ変換装置 |
US7598447B2 (en) | 2004-10-29 | 2009-10-06 | Zenph Studios, Inc. | Methods, systems and computer program products for detecting musical notes in an audio signal |
US8093484B2 (en) * | 2004-10-29 | 2012-01-10 | Zenph Sound Innovations, Inc. | Methods, systems and computer program products for regenerating audio performances |
US20060112812A1 (en) * | 2004-11-30 | 2006-06-01 | Anand Venkataraman | Method and apparatus for adapting original musical tracks for karaoke use |
US8476518B2 (en) * | 2004-11-30 | 2013-07-02 | Stmicroelectronics Asia Pacific Pte. Ltd. | System and method for generating audio wavetables |
KR100713366B1 (ko) * | 2005-07-11 | 2007-05-04 | 삼성전자주식회사 | 모폴로지를 이용한 오디오 신호의 피치 정보 추출 방법 및그 장치 |
KR100735444B1 (ko) * | 2005-07-18 | 2007-07-04 | 삼성전자주식회사 | 오디오데이터 및 악보이미지 추출방법 |
GB0523946D0 (en) * | 2005-11-24 | 2006-01-04 | King S College London | Audio signal processing method and system |
KR100724736B1 (ko) * | 2006-01-26 | 2007-06-04 | 삼성전자주식회사 | 스펙트럴 자기상관치를 이용한 피치 검출 방법 및 피치검출 장치 |
KR100653643B1 (ko) * | 2006-01-26 | 2006-12-05 | 삼성전자주식회사 | 하모닉과 비하모닉의 비율을 이용한 피치 검출 방법 및피치 검출 장치 |
US8874439B2 (en) * | 2006-03-01 | 2014-10-28 | The Regents Of The University Of California | Systems and methods for blind source signal separation |
KR100770839B1 (ko) * | 2006-04-04 | 2007-10-26 | 삼성전자주식회사 | 음성 신호의 하모닉 정보 및 스펙트럼 포락선 정보,유성음화 비율 추정 방법 및 장치 |
KR100735343B1 (ko) * | 2006-04-11 | 2007-07-04 | 삼성전자주식회사 | 음성신호의 피치 정보 추출장치 및 방법 |
US8010350B2 (en) * | 2006-08-03 | 2011-08-30 | Broadcom Corporation | Decimated bisectional pitch refinement |
US7514620B2 (en) * | 2006-08-25 | 2009-04-07 | Apple Inc. | Method for shifting pitches of audio signals to a desired pitch relationship |
US8036767B2 (en) * | 2006-09-20 | 2011-10-11 | Harman International Industries, Incorporated | System for extracting and changing the reverberant content of an audio input signal |
WO2008095190A2 (en) * | 2007-02-01 | 2008-08-07 | Museami, Inc. | Music transcription |
US8321211B2 (en) * | 2008-02-28 | 2012-11-27 | University Of Kansas-Ku Medical Center Research Institute | System and method for multi-channel pitch detection |
EP2107556A1 (en) * | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
CA2729744C (en) * | 2008-06-30 | 2017-01-03 | Constellation Productions, Inc. | Methods and systems for improved acoustic environment characterization |
US20100169085A1 (en) * | 2008-12-27 | 2010-07-01 | Tanla Solutions Limited | Model based real time pitch tracking system and singer evaluation method |
CN102016530B (zh) * | 2009-02-13 | 2012-11-14 | 华为技术有限公司 | 一种基音周期检测方法和装置 |
-
2004
- 2004-10-29 US US10/977,850 patent/US7598447B2/en active Active
-
2005
- 2005-09-27 CA CA002585467A patent/CA2585467A1/en not_active Abandoned
- 2005-09-27 EP EP05807553A patent/EP1805751A1/en not_active Withdrawn
- 2005-09-27 JP JP2007538927A patent/JP2008518270A/ja active Pending
- 2005-09-27 WO PCT/US2005/034527 patent/WO2006049745A1/en active Application Filing
-
2009
- 2009-09-10 US US12/556,926 patent/US8008566B2/en active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5585228A (en) * | 1978-12-22 | 1980-06-27 | Yokogawa Hokushin Electric Corp | Musical sound analyzer |
JPH04261592A (ja) * | 1991-01-07 | 1992-09-17 | Brother Ind Ltd | 自動採譜装置 |
JPH05273964A (ja) * | 1992-03-30 | 1993-10-22 | Brother Ind Ltd | 自動採譜装置等に用いられるアタック時刻検出装置 |
JP2001027895A (ja) * | 1999-07-14 | 2001-01-30 | Canon Inc | 信号分離方法及び装置 |
JP2001125562A (ja) * | 1999-10-27 | 2001-05-11 | Natl Inst Of Advanced Industrial Science & Technology Meti | 音高推定方法及び装置 |
JP2002278544A (ja) * | 2001-03-22 | 2002-09-27 | Yamaha Corp | 採譜方法および採譜装置 |
JP2004526203A (ja) * | 2001-04-10 | 2004-08-26 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 音楽信号を音符基準表記に変換する方法及び装置、並びに、音楽信号をデータバンクに照会する方法及び装置 |
JP2003099067A (ja) * | 2001-09-21 | 2003-04-04 | Yamaha Corp | 波形データ編集方法、波形データ編集装置、プログラムおよび波形メモリの生産方法 |
JP2003162282A (ja) * | 2001-11-28 | 2003-06-06 | Yamaha Corp | 演奏情報生成方法、演奏情報生成装置およびプログラム |
JP2003255951A (ja) * | 2002-03-04 | 2003-09-10 | Yamaha Corp | 波形処理方法および装置 |
WO2003088534A1 (en) * | 2002-04-05 | 2003-10-23 | International Business Machines Corporation | Feature-based audio content identification |
JP2004021027A (ja) * | 2002-06-18 | 2004-01-22 | Yamaha Corp | 演奏音制御方法及び装置 |
Non-Patent Citations (2)
Title |
---|
JPN6011023204; R. Keren, Y. Y. Zeevi, D. Chazan: 'Automatic Transcription of Polyphonic Music using the Multiresolution Fourier Transform' Proceedings of the 9th Mediterranean Electrotechnical Conference Vol.1, 19980518, p.654-657 * |
JPN6011023206; Toshiyuki Tanaka, Yasuyuki Tagami: 'Automatic MIDI Data Making from Music WAVE Data Performed by 2 Instruments using Blind Signal Separa' Proceedings of the 41st SICE Annual Conference Vol.1, 20020805, p.451-456 * |
Also Published As
Publication number | Publication date |
---|---|
WO2006049745A1 (en) | 2006-05-11 |
US20060095254A1 (en) | 2006-05-04 |
US8008566B2 (en) | 2011-08-30 |
CA2585467A1 (en) | 2006-05-11 |
US7598447B2 (en) | 2009-10-06 |
EP1805751A1 (en) | 2007-07-11 |
US20100000395A1 (en) | 2010-01-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2008518270A (ja) | オーディオ信号中の音符を検出する方法、システム及びコンピュータプログラムプロダクト | |
US8093484B2 (en) | Methods, systems and computer program products for regenerating audio performances | |
Brossier | Automatic annotation of musical audio for interactive applications | |
US8022286B2 (en) | Sound-object oriented analysis and note-object oriented processing of polyphonic sound recordings | |
EP2115732B1 (en) | Music transcription | |
US8592670B2 (en) | Polyphonic note detection | |
Marolt | A mid-level representation for melody-based retrieval in audio collections | |
US9779706B2 (en) | Context-dependent piano music transcription with convolutional sparse coding | |
US20060075883A1 (en) | Audio signal analysing method and apparatus | |
JP2004526203A (ja) | 音楽信号を音符基準表記に変換する方法及び装置、並びに、音楽信号をデータバンクに照会する方法及び装置 | |
WO2017057531A1 (ja) | 音響処理装置 | |
Barbancho et al. | Transcription of piano recordings | |
Hartquist | Real-time musical analysis of polyphonic guitar audio | |
JP6252421B2 (ja) | 採譜装置、及び採譜システム | |
Peterschmitt et al. | Pitch-based solo location | |
JP7224013B2 (ja) | コード認識方法、コード認識プログラム、及びコード認識システム | |
WO2009117133A1 (en) | Methods, systems and computer program products for regenerating audio performances | |
Wieczorkowska et al. | Playing in unison in the random forest | |
Han et al. | AUTOMATIC DRUM TRANSCRIPTION | |
Chaisri | Extraction of sound by instrument type and voice from music files |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080917 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110510 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110810 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110817 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110824 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120427 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120727 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130208 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130702 |