JP5100089B2 - 3d検索アルゴリズムを用いる楽曲情報検索 - Google Patents
3d検索アルゴリズムを用いる楽曲情報検索 Download PDFInfo
- Publication number
- JP5100089B2 JP5100089B2 JP2006303896A JP2006303896A JP5100089B2 JP 5100089 B2 JP5100089 B2 JP 5100089B2 JP 2006303896 A JP2006303896 A JP 2006303896A JP 2006303896 A JP2006303896 A JP 2006303896A JP 5100089 B2 JP5100089 B2 JP 5100089B2
- Authority
- JP
- Japan
- Prior art keywords
- music
- hypo
- melody
- character string
- lyrics
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000010845 search algorithm Methods 0.000 title claims abstract description 25
- 238000000034 method Methods 0.000 claims abstract description 60
- 238000011524 similarity measure Methods 0.000 claims abstract description 9
- 239000011159 matrix material Substances 0.000 claims description 68
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000012217 deletion Methods 0.000 claims description 10
- 230000037430 deletion Effects 0.000 claims description 10
- 238000003780 insertion Methods 0.000 claims description 9
- 230000037431 insertion Effects 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 20
- 230000000694 effects Effects 0.000 abstract description 4
- 230000033764 rhythmic process Effects 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 18
- 238000013138 pruning Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 230000005236 sound signal Effects 0.000 description 7
- 230000003993 interaction Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- 244000141353 Prunus domestica Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/0008—Associated control or indicating means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/632—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/632—Query formulation
- G06F16/634—Query by example, e.g. query by humming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/685—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2240/00—Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
- G10H2240/121—Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
- G10H2240/131—Library retrieval, i.e. searching a database or selecting a specific musical piece, segment, pattern, rule or parameter set
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2240/00—Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
- G10H2240/121—Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
- G10H2240/131—Library retrieval, i.e. searching a database or selecting a specific musical piece, segment, pattern, rule or parameter set
- G10H2240/135—Library retrieval index, i.e. using an indexing scheme to efficiently retrieve a music piece
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2240/00—Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
- G10H2240/121—Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
- G10H2240/131—Library retrieval, i.e. searching a database or selecting a specific musical piece, segment, pattern, rule or parameter set
- G10H2240/141—Library retrieval matching, i.e. any of the steps of matching an inputted segment or phrase with musical database contents, e.g. query by humming, singing or playing; the steps may include, e.g. musical analysis of the input, musical feature extraction, query formulation, or details of the retrieval process
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/005—Algorithms for electrophonic musical instruments or musical processing, e.g. for automatic composition or resource allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/005—Algorithms for electrophonic musical instruments or musical processing, e.g. for automatic composition or resource allocation
- G10H2250/015—Markov chains, e.g. hidden Markov models [HMM], for musical processing, e.g. musical analysis or musical composition
- G10H2250/021—Dynamic programming, e.g. Viterbi, for finding the most likely or most desirable sequence in music analysis, processing or composition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Electrophonic Musical Instruments (AREA)
Description
大容量データベースから楽曲情報を検索し、及びタイトルを選択するために、これまで、2つの技術が用いられてきた。1つの技術は、ユーザが発声したタイトルの名称を直接認識する音声認識である。しかしながら、音声認識は、誤認識率が比較的高い。一方、メロディの一部をユーザがハミングし(歌い又は口笛を吹き)、このメロディ自体を用いて、データベースに対する検索クエリを実行するハミング検索(query-by-humming)も研究されている。自動音声認識システム及びハミング検索システムは、適用された分類子の出力レベルにおいて、周知の重み付けスキームを用いて容易に組み合わせることができるが、この場合、幾つかの重み付け係数を決定する必要がある。しかしながら、このような手法では、2台の完全な認識システムが必要であり、最終段階で情報を併合するため、効率的な枝刈りができず、したがって、演算コストが高い。更に、このようなシステムは、両方のシステムが期待する種類の入力が行われなかった場合、例えば、単に歌詞を発声しただけで、ハミングしていない場合、又は、単にハミングしただけで、歌詞を発声していない場合等には、適切に動作しない。
メロディ仮定文字列の要素(U,D,S)は、上述の通りである。ここでも、他の適切な如何なる種類のコーディングによって音程を符号化してもよい。そして、システムは、(N−1)×(N−1)のアラインメント行列Dを用いて、記録されたオーディオシーケンス102のメロディと、データベース103、105に保存されている様々な音楽ファイルのメロディとの間の類似の度合いを示す類似尺度を算出する(S5c)。アラインメント行列Dは、k番目のメロディ仮定文字列a:=(音程1,・・・,音程N−1)T∈{U,D,S}N−1の文字インデクスiを列座標として有し、メロディ参照文字列b:=(音程1,・・・,音程N−1)T∈{U,D,S}N−1の文字インデクスjを行座標として有する。そして、類似値の降順にソートされた、データベース103、105に保存されているファイルの格付けされたリスト107を生成する(S5d)。
Claims (10)
- 音声入力(102、300a)に基づいて、楽曲情報を検索する楽曲情報検索方法において、
楽曲シーケンスの定義されたセットを、関連する情報と共に予め保存するステップ(S11a)と、
マイクロフォン(101)を用いて、音声及び楽曲情報の少なくとも1つを有するオディオ入力をレコードし、上記オディオ入力を表すコーディングを、第3の次元が時間(t)である3次元探索空間の第1の次元(S)及び第2の次元(H)として配列するステップ(S11c)であって、上記オディオ入力の上記第1次元のコーディングを得るために、自動アクスティック音声認識システム(104)によって上記オディオ入力からアクスティック音声特性を抽出し、上記オディオ入力の上記第2次元のコーディングを得るために、自動楽曲分類システム(100)によって上記オディオ入力から楽曲キー特性を抽出する、上記配列するステップ、
楽曲シーケンスのセットから、レコードされた上記オディオ入力に最も一致する楽曲シーケンスを検索するために、照合エンジン(106)によって上記3次元検索空間で検索を行うステップ(S11d)とを有し、
上記3次元検索空間での検索は、上記オディオ入力のアクスティック音声特性と上記楽曲キー特性を同期的に検索することである、楽曲情報検索方法。 - 上記入力された音声(400)及び/又は楽曲情報(102、300a)は、それぞれ、3次元探索空間のコーディングとして表される前に、個別に前処理される(S12)ことを特徴とする請求項1記載の楽曲情報検索方法。
- データベース(103、105)に予め保存されている音楽ファイルのメロディ及び歌詞に対する上記入力された音声及び楽曲情報の類似の度合いを示す類似尺度を算出するステップ(S9c)と、
それぞれの類似尺度に応じて音楽ファイルを格付けした上記音楽ファイルの格付けされたリスト(107)を生成するステップ(S9d)とを更に有する請求項1又は2記載の楽曲情報検索方法。 - Nを1以上の整数として、N個の音符及び/又は休符を含む歌われた又はハミングされた楽曲102及び/又は演奏されたメロディ300aを「メロディ参照文字列」(REF)である第1の文字列によって符号化するステップ(S5a)と、
楽譜がデータベース(103、105)に保存され、第2の文字列によって符号化されたN個の音符及び/又は休符からなる先に解析された符号化されたメロディを、「メロディ仮定文字列」(HYPO0,HYPO1,・・・,HYPOk,・・・,HYPOM−1)である複数(M個)の保存された文字列から検索するステップ(S5b)と、
記録された楽曲の歌詞102”の発話された部分400から認識された、Pを1以上の整数として、P個の音素からなる音素を「音声参照文字列」(REFs)である第1の文字列によって符号化し、該音声参照文字列(REFs)をメロディ参照文字列REFに結合し、結合された参照文字列(REFms)を生成するステップ(S9a)と、
P個の音素からなり、第2の文字列によって符号化された、先に解析された音声信号の音素を、「音声仮定文字列」(HYPOs0,HYPOs1,HYPOs2,・・・,HYPOs,k,・・・,HYPOs,Q−1)である複数(Q個)の予め保存されている文字列から検索し、該音声仮定文字列を上記メロディ仮定文字列に結合し、結合された仮定文字列(HYPOms0、HYPOms1、HYPOms2,HYPOms,k,・・・,HYPOms,M+Q−1)を生成するステップ(S9b)と、
列座標としてk番目の結合された仮定文字列(ams:=(音程1,・・・,音程N−1,音素1,・・・,音素p)T)の文字インデクスiを有し、行座標として結合された参照文字列(bms:=(音程1,・・・,音程N−1,音素1,・・・,音素P)T)の文字インデクスjを有する(N+P−1)×(N+P−1)のアラインメント行列(Dms)の形式で、単一の2次元探索空間を用いて、上記記録されたオーディオシーケンス102のメロディ及び歌詞と、上記データベースに保存された様々な音楽ファイルのメロディ及び歌詞との間の類似の度合いを示す類似尺度を算出するステップ(S9c)とを有する請求項3記載の楽曲情報検索方法。 - 上記類似尺度を算出するステップ(S9c)は、
k番目の仮定文字列(ams:=(音程1,・・・,音程N−1,音素1,・・・,音素p)T)の文字インデクスiを列座標として設定し、参照文字列(bms:=(音程1,・・・,音程N−1,音素1,・・・,音素P)T)の文字インデクスjを行座標として設定し(S6a1)、上記アラインメント行列(Dms)のセルに累加されたコスト係数(di,j=f(di−1,j,di,j−1,di−1,j−1,w(ai,bj)))を埋め込む埋込スキームに基づいて、該アラインメント行列の各要素(i,j)を算出及び設定して該アラインメント行列(Dms)を埋める(S6a2)ことによって、(N+P−1)×(N+P−1)のアラインメント行列(Dms)を作成するステップ(S10a)と、
ビタビ探索アルゴリズムに基づいて、結合された参照文字列(REFms)と、保存されている全てのメロディ及び歌詞の結合された仮定文字列(HYPOms0,HYPOms1,HYPOms2,・・・,HYPOms,k,・・・,HYPOms,M+Q−1)とを比較し、結合された参照文字列(REFms)のどの文字が、k番目の結合された仮定文字列(HYPOms,k)に密接に一致するかを示す文字列及び/又はコスト係数(w(ai,bj))のシーケンスを返すアラインメント関数を適用するステップ(S10b)と、
上記アラインメント関数によって導出された追跡パスに沿って、上記アラインメント行列(Dms)の最後の列の最低のコスト係数から開始され、該アラインメント行列の第1の行及び第1の列に向かって該アラインメント行列を戻る後方追跡アルゴリズムを実行するステップ(S10c)とを有することを特徴とする請求項4記載の楽曲情報検索方法。 -
ケース#1に基づくk番目の仮定文字列(HYPOms,k)の文字aiの削除に関連するコスト係数をw(ai,0)とし、
ケース#3に基づく結合された参照文字列(REFms)への文字bjの挿入に関連するコスト係数をw(0,bj)とし、
ケース#2に基づくk番目の結合された仮定文字列(HYPOms,k)の要素aiの結合された参照文字列(REFms)の要素bjへの置換に関連するコスト係数をw(ai,bj)とし、ai=bjの場合、w(ai,bj)を0に設定し、ai≠bjの場合、w(ai,bj)を0より大きな値に設定し、
初期条件を
- 音声入力(102、300a)に基づく楽曲情報検索システムにおいて、
楽曲シーケンスの定義されたセットを、関連する情報と共に予め保存する(S11a)データベース(103、105)と、
音声及び楽曲情報の少なくとも1つを有するオディオ入力を入力するマイクロフォン101と、
上記オディオ入力を表すコーディングを、第3の次元が時間(t)である3次元探索空間の第1の次元(S)及び第2の次元(H)として配列するコーディング手段(100’、104”)であって、上記第1次元のコーディングを得るために、自動アクスティック音声認識システム(104)によって上記オディオ入力からアクスティック音声特性を抽出し、上記第2次元のコーディングを得るために、自動楽曲分類システム(100)によって前記オディオ入力から楽曲キー特性を抽出する、上記コーディング手段と、
上記3次元探索空間の検索を実行し、楽曲シーケンスのセットから、上記入力されたオディオ入力に最も一致する楽曲シーケンスを検索する(S11d)照合手段(106)とを備え、
上記3次元検索空間での検索は、上記オディオ入力のアクスティック音声特性と上記楽曲キー特性を同期的に検索することである、音楽情報検索システム。 - 上記コーディング手段(100’、104”)は、
アナログオーディオシーケンス(102、300a)から、音楽的キー特性を抽出(S2a)、解析(S2b)及び認識(S2c)する自動楽曲認識システム(100’)と、
記録された楽曲の歌詞(102”)の発話された部分(400)から話者の声及び発音の音響音声学的音声特性を抽出(S4a)及び解析(S4b)し、該歌詞(102”)の構文及び意味を認識する(S4c)自動音声認識システム(104”)とを備えることを特徴とする請求項7記載の音楽情報検索システム。 - 上記照合手段(106)は、上記3次元探索空間に対してビタビ探索アルゴリズムを実行することによって、上記入力されたオーディオシーケンス(102、300a)のメロディ及び歌詞と、上記データベース(103、105)に保存された様々な音楽ファイルのメロディ及び歌詞との類似の度合いを示す類似尺度を算出し、上記音楽ファイルの格付けされたリスト(107)を生成する(S3b)演算手段(S3a)を備えることを特徴とする請求項7又は8記載の楽曲情報検索システム。
- コンピュータ装置上で実行されて、請求項1乃至6いずれか1項記載の楽曲情報検索方法を実現するコンピュータプログラムが格納されているコンピュータ読み取り可能な記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP05024429A EP1785891A1 (en) | 2005-11-09 | 2005-11-09 | Music information retrieval using a 3D search algorithm |
EP05024429.2 | 2005-11-09 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007183921A JP2007183921A (ja) | 2007-07-19 |
JP5100089B2 true JP5100089B2 (ja) | 2012-12-19 |
Family
ID=36001134
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006303896A Expired - Fee Related JP5100089B2 (ja) | 2005-11-09 | 2006-11-09 | 3d検索アルゴリズムを用いる楽曲情報検索 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7488886B2 (ja) |
EP (1) | EP1785891A1 (ja) |
JP (1) | JP5100089B2 (ja) |
Families Citing this family (112)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2004034375A1 (en) * | 2002-10-11 | 2004-04-22 | Matsushita Electric Industrial Co. Ltd. | Method and apparatus for determining musical notes from sounds |
US7271329B2 (en) * | 2004-05-28 | 2007-09-18 | Electronic Learning Products, Inc. | Computer-aided learning system employing a pitch tracking line |
DE102005005536A1 (de) * | 2005-02-07 | 2006-08-10 | Sick Ag | Codeleser |
EP1785891A1 (en) * | 2005-11-09 | 2007-05-16 | Sony Deutschland GmbH | Music information retrieval using a 3D search algorithm |
EP1955139A4 (en) * | 2005-11-10 | 2009-11-11 | Melodis Corp | SYSTEM AND METHOD FOR STORING AND RETRIEVING INFORMATION NOT BASED ON TEXT |
DE602006008570D1 (de) * | 2006-02-10 | 2009-10-01 | Harman Becker Automotive Sys | System für sprachgesteuerte Auswahl einer Audiodatei und Verfahren dafür |
KR100735820B1 (ko) * | 2006-03-02 | 2007-07-06 | 삼성전자주식회사 | 휴대 단말기에서 음성 인식에 의한 멀티미디어 데이터 검색방법 및 그 장치 |
US7459624B2 (en) | 2006-03-29 | 2008-12-02 | Harmonix Music Systems, Inc. | Game controller simulating a musical instrument |
US7772478B2 (en) * | 2006-04-12 | 2010-08-10 | Massachusetts Institute Of Technology | Understanding music |
US20070276668A1 (en) * | 2006-05-23 | 2007-11-29 | Creative Technology Ltd | Method and apparatus for accessing an audio file from a collection of audio files using tonal matching |
US20110208703A1 (en) * | 2006-05-24 | 2011-08-25 | Damien Fisher | Selectivity estimation |
WO2008030197A1 (en) * | 2006-09-07 | 2008-03-13 | Agency For Science, Technology And Research | Apparatus and methods for music signal analysis |
CN102610222B (zh) * | 2007-02-01 | 2014-08-20 | 缪斯亚米有限公司 | 音乐转录的方法,系统和装置 |
US20090288547A1 (en) * | 2007-02-05 | 2009-11-26 | U.S. Music Corporation | Method and Apparatus for Tuning a Stringed Instrument |
US7838755B2 (en) * | 2007-02-14 | 2010-11-23 | Museami, Inc. | Music-based search engine |
US8116746B2 (en) * | 2007-03-01 | 2012-02-14 | Microsoft Corporation | Technologies for finding ringtones that match a user's hummed rendition |
US8283546B2 (en) * | 2007-03-28 | 2012-10-09 | Van Os Jan L | Melody encoding and searching system |
EP1975866A1 (en) | 2007-03-31 | 2008-10-01 | Sony Deutschland Gmbh | Method and system for recommending content items |
US20090024388A1 (en) * | 2007-06-11 | 2009-01-22 | Pandiscio Jill A | Method and apparatus for searching a music database |
US7625284B2 (en) * | 2007-06-14 | 2009-12-01 | Harmonix Music Systems, Inc. | Systems and methods for indicating input actions in a rhythm-action game |
US8678896B2 (en) | 2007-06-14 | 2014-03-25 | Harmonix Music Systems, Inc. | Systems and methods for asynchronous band interaction in a rhythm action game |
US7945441B2 (en) * | 2007-08-07 | 2011-05-17 | Microsoft Corporation | Quantized feature index trajectory |
US8065293B2 (en) * | 2007-10-24 | 2011-11-22 | Microsoft Corporation | Self-compacting pattern indexer: storing, indexing and accessing information in a graph-like data structure |
JP5147389B2 (ja) * | 2007-12-28 | 2013-02-20 | 任天堂株式会社 | 楽曲提示装置、楽曲提示プログラム、楽曲提示システム、楽曲提示方法 |
US8084677B2 (en) * | 2007-12-31 | 2011-12-27 | Orpheus Media Research, Llc | System and method for adaptive melodic segmentation and motivic identification |
KR101504522B1 (ko) * | 2008-01-07 | 2015-03-23 | 삼성전자 주식회사 | 음악 저장/검색 장치 및 방법 |
US8494257B2 (en) | 2008-02-13 | 2013-07-23 | Museami, Inc. | Music score deconstruction |
EP2101501A1 (en) * | 2008-03-10 | 2009-09-16 | Sony Corporation | Method for recommendation of audio |
US8097801B2 (en) * | 2008-04-22 | 2012-01-17 | Peter Gannon | Systems and methods for composing music |
MX2011000165A (es) * | 2008-07-09 | 2011-04-26 | Xtreme Mobility Inc | Sistema y metodo para un deposito inalambrico seguro. |
US20100057452A1 (en) * | 2008-08-28 | 2010-03-04 | Microsoft Corporation | Speech interfaces |
US8392190B2 (en) | 2008-12-01 | 2013-03-05 | Educational Testing Service | Systems and methods for assessment of non-native spontaneous speech |
JP5593608B2 (ja) * | 2008-12-05 | 2014-09-24 | ソニー株式会社 | 情報処理装置、メロディーライン抽出方法、ベースライン抽出方法、及びプログラム |
JP5127982B2 (ja) * | 2009-02-27 | 2013-01-23 | 三菱電機株式会社 | 音楽検索装置 |
US8664501B2 (en) * | 2009-03-19 | 2014-03-04 | JCT Products, LLC | Vocal tuning device for microphones |
TWI385645B (zh) * | 2009-05-18 | 2013-02-11 | Chunghwa Telecom Co Ltd | The system and method of singing with the voice of the interactive voice interface |
US20100304810A1 (en) * | 2009-05-29 | 2010-12-02 | Harmonix Music Systems, Inc. | Displaying A Harmonically Relevant Pitch Guide |
US7982114B2 (en) * | 2009-05-29 | 2011-07-19 | Harmonix Music Systems, Inc. | Displaying an input at multiple octaves |
US8017854B2 (en) * | 2009-05-29 | 2011-09-13 | Harmonix Music Systems, Inc. | Dynamic musical part determination |
US7923620B2 (en) * | 2009-05-29 | 2011-04-12 | Harmonix Music Systems, Inc. | Practice mode for multiple musical parts |
US20100304811A1 (en) * | 2009-05-29 | 2010-12-02 | Harmonix Music Systems, Inc. | Scoring a Musical Performance Involving Multiple Parts |
US8026435B2 (en) * | 2009-05-29 | 2011-09-27 | Harmonix Music Systems, Inc. | Selectively displaying song lyrics |
US8076564B2 (en) * | 2009-05-29 | 2011-12-13 | Harmonix Music Systems, Inc. | Scoring a musical performance after a period of ambiguity |
US8080722B2 (en) * | 2009-05-29 | 2011-12-20 | Harmonix Music Systems, Inc. | Preventing an unintentional deploy of a bonus in a video game |
US8449360B2 (en) | 2009-05-29 | 2013-05-28 | Harmonix Music Systems, Inc. | Displaying song lyrics and vocal cues |
US7935880B2 (en) | 2009-05-29 | 2011-05-03 | Harmonix Music Systems, Inc. | Dynamically displaying a pitch range |
US8465366B2 (en) | 2009-05-29 | 2013-06-18 | Harmonix Music Systems, Inc. | Biasing a musical performance input to a part |
US10357714B2 (en) | 2009-10-27 | 2019-07-23 | Harmonix Music Systems, Inc. | Gesture-based user interface for navigating a menu |
US9981193B2 (en) | 2009-10-27 | 2018-05-29 | Harmonix Music Systems, Inc. | Movement based recognition and evaluation |
CN102074233A (zh) * | 2009-11-20 | 2011-05-25 | 鸿富锦精密工业(深圳)有限公司 | 乐曲辨识系统及方法 |
TWI467567B (zh) * | 2009-11-26 | 2015-01-01 | Hon Hai Prec Ind Co Ltd | 樂曲辨識系統及方法 |
US8442977B2 (en) * | 2010-02-16 | 2013-05-14 | Honeywell International Inc. | Distance-space embedding for multi-descriptor matching and retrieval |
US8874243B2 (en) | 2010-03-16 | 2014-10-28 | Harmonix Music Systems, Inc. | Simulating musical instruments |
US9280598B2 (en) * | 2010-05-04 | 2016-03-08 | Soundhound, Inc. | Systems and methods for sound recognition |
US9358456B1 (en) | 2010-06-11 | 2016-06-07 | Harmonix Music Systems, Inc. | Dance competition game |
EP2579955B1 (en) | 2010-06-11 | 2020-07-08 | Harmonix Music Systems, Inc. | Dance game and tutorial |
US8562403B2 (en) | 2010-06-11 | 2013-10-22 | Harmonix Music Systems, Inc. | Prompting a player of a dance game |
US8805683B1 (en) | 2012-02-24 | 2014-08-12 | Google Inc. | Real-time audio recognition protocol |
CN101930732B (zh) * | 2010-06-29 | 2013-11-06 | 中兴通讯股份有限公司 | 基于用户输入语音的乐曲生成方法及装置、智能终端 |
US8158870B2 (en) | 2010-06-29 | 2012-04-17 | Google Inc. | Intervalgram representation of audio for melody recognition |
KR20130106812A (ko) * | 2010-07-21 | 2013-09-30 | 스펙트랄마인드 게엠베하 | 미디어 아이템들을 편성하고 시각화하는 방법 및 시스템 |
US9024166B2 (en) | 2010-09-09 | 2015-05-05 | Harmonix Music Systems, Inc. | Preventing subtractive track separation |
JP5728888B2 (ja) * | 2010-10-29 | 2015-06-03 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
US8584197B2 (en) * | 2010-11-12 | 2013-11-12 | Google Inc. | Media rights management using melody identification |
US8584198B2 (en) * | 2010-11-12 | 2013-11-12 | Google Inc. | Syndication including melody recognition and opt out |
CA2724297C (en) | 2010-12-14 | 2013-11-12 | Xtreme Mobility Inc. | System and method for authenticating transactions through a mobile device |
US9596237B2 (en) | 2010-12-14 | 2017-03-14 | Salt Technology, Inc. | System and method for initiating transactions on a mobile device |
CN102541965B (zh) * | 2010-12-30 | 2015-05-20 | 国际商业机器公司 | 自动获得音乐文件中的特征片断的方法和系统 |
US8996557B2 (en) | 2011-05-18 | 2015-03-31 | Microsoft Technology Licensing, Llc | Query and matching for content recognition |
CN102497400A (zh) * | 2011-11-30 | 2012-06-13 | 上海博泰悦臻电子设备制造有限公司 | 车载收音设备的音乐媒体信息获取方法和系统 |
US9384734B1 (en) | 2012-02-24 | 2016-07-05 | Google Inc. | Real-time audio recognition using multiple recognizers |
US9208225B1 (en) | 2012-02-24 | 2015-12-08 | Google Inc. | Incentive-based check-in |
US9280599B1 (en) | 2012-02-24 | 2016-03-08 | Google Inc. | Interface for real-time audio recognition |
CA2909081C (en) | 2012-04-16 | 2022-05-10 | Salt Technology Inc. | Systems and methods for facilitating a transaction using a virtual card on a mobile device |
US20140032537A1 (en) * | 2012-07-30 | 2014-01-30 | Ajay Shekhawat | Apparatus, system, and method for music identification |
US8680383B1 (en) * | 2012-08-22 | 2014-03-25 | Henry P. Taylor | Electronic hymnal system |
CN103885949B (zh) * | 2012-12-19 | 2017-07-07 | 中国科学院声学研究所 | 一种基于歌词的歌曲检索系统及其检索方法 |
US20140229894A1 (en) * | 2013-02-12 | 2014-08-14 | Daisy, Llc | Systems and methods for generating playlists based on user feedback |
US20140344956A1 (en) * | 2013-05-19 | 2014-11-20 | Thomas Garben | System and method for processing song, music, and/or lyric information for copyright registration |
KR20150072597A (ko) * | 2013-12-20 | 2015-06-30 | 삼성전자주식회사 | 멀티미디어 장치 및 이의 음악 작곡 방법, 그리고 노래 보정 방법 |
US9672843B2 (en) * | 2014-05-29 | 2017-06-06 | Apple Inc. | Apparatus and method for improving an audio signal in the spectral domain |
US11132983B2 (en) | 2014-08-20 | 2021-09-28 | Steven Heckenlively | Music yielder with conformance to requisites |
US10587594B1 (en) * | 2014-09-23 | 2020-03-10 | Amazon Technologies, Inc. | Media based authentication |
US10133537B2 (en) | 2014-09-25 | 2018-11-20 | Honeywell International Inc. | Method of integrating a home entertainment system with life style systems which include searching and playing music using voice commands based upon humming or singing |
US9390695B2 (en) * | 2014-10-27 | 2016-07-12 | Northwestern University | Systems, methods, and apparatus to search audio synthesizers using vocal imitation |
CN104657438A (zh) * | 2015-02-02 | 2015-05-27 | 联想(北京)有限公司 | 信息处理方法及电子设备 |
US20180158469A1 (en) * | 2015-05-25 | 2018-06-07 | Guangzhou Kugou Computer Technology Co., Ltd. | Audio processing method and apparatus, and terminal |
CN106815230B (zh) | 2015-11-27 | 2019-05-14 | 腾讯科技(深圳)有限公司 | 歌词页面生成方法及装置 |
CN107203571B (zh) * | 2016-03-18 | 2019-08-06 | 腾讯科技(深圳)有限公司 | 歌曲旋律信息处理方法和装置 |
US11354510B2 (en) | 2016-12-01 | 2022-06-07 | Spotify Ab | System and method for semantic analysis of song lyrics in a media content environment |
US10360260B2 (en) * | 2016-12-01 | 2019-07-23 | Spotify Ab | System and method for semantic analysis of song lyrics in a media content environment |
WO2018173295A1 (ja) | 2017-03-24 | 2018-09-27 | ヤマハ株式会社 | ユーザインタフェース装置及び方法、並びに音操作システム |
CN107368609B (zh) * | 2017-08-10 | 2018-09-04 | 广州酷狗计算机科技有限公司 | 获取多媒体文件的方法、装置及计算机可读存储介质 |
CN107863095A (zh) * | 2017-11-21 | 2018-03-30 | 广州酷狗计算机科技有限公司 | 音频信号处理方法、装置和存储介质 |
CN108364656B (zh) * | 2018-03-08 | 2021-03-09 | 北京得意音通技术有限责任公司 | 一种用于语音重放检测的特征提取方法及装置 |
CN108922505B (zh) * | 2018-06-26 | 2023-11-21 | 联想(北京)有限公司 | 信息处理方法及装置 |
US10803242B2 (en) * | 2018-10-26 | 2020-10-13 | International Business Machines Corporation | Correction of misspellings in QA system |
CN109785859B (zh) * | 2019-01-31 | 2024-02-02 | 平安科技(深圳)有限公司 | 基于语音分析的管理音乐的方法、装置和计算机设备 |
CN111986698B (zh) * | 2019-05-24 | 2023-06-30 | 腾讯科技(深圳)有限公司 | 音频片段的匹配方法、装置、计算机可读介质及电子设备 |
US10891872B1 (en) * | 2019-06-18 | 2021-01-12 | School of Rock, LLC | Method and apparatus of music education |
CN110875057B (zh) * | 2019-08-26 | 2022-03-15 | 上海慧敏医疗器械有限公司 | 一种基于icf框架的构音语音功能损伤等级转换器 |
CN111078842A (zh) * | 2019-12-31 | 2020-04-28 | 北京每日优鲜电子商务有限公司 | 查询结果的确定方法、装置、服务器及存储介质 |
CN111737513B (zh) * | 2020-05-06 | 2022-03-25 | 华南理工大学 | 一种针对海量音乐数据的哼唱检索系统 |
CN111782864B (zh) * | 2020-06-30 | 2023-11-07 | 腾讯音乐娱乐科技(深圳)有限公司 | 演唱音频分类方法及计算机程序产品、服务器、存储介质 |
CN111863030A (zh) * | 2020-07-30 | 2020-10-30 | 广州酷狗计算机科技有限公司 | 音频检测方法及装置 |
CN112133266A (zh) * | 2020-09-21 | 2020-12-25 | 腾讯音乐娱乐科技(深圳)有限公司 | 歌词集合的生成方法及装置 |
CN113392262A (zh) * | 2020-11-26 | 2021-09-14 | 腾讯科技(北京)有限公司 | 音乐识别方法、推荐方法、装置、设备及存储介质 |
CN112712783B (zh) * | 2020-12-21 | 2023-09-29 | 北京百度网讯科技有限公司 | 生成音乐的方法和装置、计算机设备和介质 |
CN113744763B (zh) * | 2021-08-18 | 2024-02-23 | 北京达佳互联信息技术有限公司 | 确定相似旋律的方法和装置 |
CN115762546A (zh) * | 2021-09-03 | 2023-03-07 | 腾讯科技(深圳)有限公司 | 音频数据处理方法、装置、设备以及介质 |
EP4213145A1 (en) * | 2022-01-14 | 2023-07-19 | Vestel Elektronik Sanayi ve Ticaret A.S. | Device and method for triggering a music identification application |
CN115862603B (zh) * | 2022-11-09 | 2023-06-20 | 北京数美时代科技有限公司 | 一种歌曲语音识别方法、系统、存储介质和电子设备 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5874686A (en) * | 1995-10-31 | 1999-02-23 | Ghias; Asif U. | Apparatus and method for searching a melody |
JPH09212480A (ja) * | 1996-01-31 | 1997-08-15 | Yamaha Corp | 雰囲気情報生成装置およびカラオケ装置 |
US5739451A (en) * | 1996-12-27 | 1998-04-14 | Franklin Electronic Publishers, Incorporated | Hand held electronic music encyclopedia with text and note structure search |
US5963957A (en) * | 1997-04-28 | 1999-10-05 | Philips Electronics North America Corporation | Bibliographic music data base with normalized musical themes |
FI20002161A (fi) * | 2000-09-29 | 2002-03-30 | Nokia Mobile Phones Ltd | Menetelmä ja järjestelmä melodian tunnistamiseksi |
DE10058811A1 (de) * | 2000-11-27 | 2002-06-13 | Philips Corp Intellectual Pty | Verfahren zur Identifizierung von Musikstücken |
US7003515B1 (en) * | 2001-05-16 | 2006-02-21 | Pandora Media, Inc. | Consumer item matching method and system |
US6528715B1 (en) * | 2001-10-31 | 2003-03-04 | Hewlett-Packard Company | Music search by interactive graphical specification with audio feedback |
JP3798991B2 (ja) * | 2002-02-25 | 2006-07-19 | 日本電信電話株式会社 | 音声信号検索方法,音声信号検索装置,そのプログラムおよびそのプログラムの記録媒体 |
WO2004049188A1 (en) * | 2002-11-28 | 2004-06-10 | Agency For Science, Technology And Research | Summarizing digital audio data |
CN100454298C (zh) * | 2003-12-08 | 2009-01-21 | 皇家飞利浦电子股份有限公司 | 旋律数据库搜索 |
EP1785891A1 (en) * | 2005-11-09 | 2007-05-16 | Sony Deutschland GmbH | Music information retrieval using a 3D search algorithm |
JP4622829B2 (ja) * | 2005-11-29 | 2011-02-02 | 日本ビクター株式会社 | 楽曲検索再生装置、楽曲検索再生方法、印象語設定プログラム |
-
2005
- 2005-11-09 EP EP05024429A patent/EP1785891A1/en not_active Withdrawn
-
2006
- 2006-11-09 US US11/558,301 patent/US7488886B2/en not_active Expired - Fee Related
- 2006-11-09 JP JP2006303896A patent/JP5100089B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2007183921A (ja) | 2007-07-19 |
US20070131094A1 (en) | 2007-06-14 |
EP1785891A1 (en) | 2007-05-16 |
US7488886B2 (en) | 2009-02-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5100089B2 (ja) | 3d検索アルゴリズムを用いる楽曲情報検索 | |
Mesaros et al. | Automatic recognition of lyrics in singing | |
Serra et al. | Chroma binary similarity and local alignment applied to cover song identification | |
Gómez et al. | Melody description and extraction in the context of music content processing | |
US20100198760A1 (en) | Apparatus and methods for music signal analysis | |
Casey et al. | The importance of sequences in musical similarity | |
Unal et al. | Challenging uncertainty in query by humming systems: a fingerprinting approach | |
JP5326169B2 (ja) | 音声データ検索システム及び音声データ検索方法 | |
Mesaros et al. | Recognition of phonemes and words in singing | |
Osmalsky et al. | Neural networks for musical chords recognition | |
Khadkevich et al. | Use of Hidden Markov Models and Factored Language Models for Automatic Chord Recognition. | |
Wang et al. | Improving query-by-singing/humming by combining melody and lyric information | |
Putri et al. | Music information retrieval using Query-by-humming based on the dynamic time warping | |
Nakano et al. | A drum pattern retrieval method by voice percussion | |
Gajjar et al. | Computational musicology for raga analysis in Indian classical music: a critical review | |
Shih et al. | A statistical multidimensional humming transcription using phone level hidden Markov models for query by humming systems | |
Zhu et al. | Musical genre classification by instrumental features | |
Barthet et al. | Speech/music discrimination in audio podcast using structural segmentation and timbre recognition | |
Chen et al. | Popular song and lyrics synchronization and its application to music information retrieval | |
Lee | A system for acoustic chord transcription and key extraction from audio using hidden Markov models trained on synthesized audio | |
Valero-Mas et al. | Analyzing the influence of pitch quantization and note segmentation on singing voice alignment in the context of audio-based Query-by-Humming | |
Kharat et al. | A survey on query by singing/humming | |
Patel | Music Retrieval System Using Query-by-Humming | |
Wang et al. | Music information retrieval system using lyrics and melody information | |
Zhang et al. | Chord Recognition using Instrument Voicing Constraints. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20081002 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20081106 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090723 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110615 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111018 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120118 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120904 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120925 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151005 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |