JP4243682B2 - 音楽音響データ中のサビ区間を検出する方法及び装置並びに該方法を実行するためのプログラム - Google Patents
音楽音響データ中のサビ区間を検出する方法及び装置並びに該方法を実行するためのプログラム Download PDFInfo
- Publication number
- JP4243682B2 JP4243682B2 JP2003342676A JP2003342676A JP4243682B2 JP 4243682 B2 JP4243682 B2 JP 4243682B2 JP 2003342676 A JP2003342676 A JP 2003342676A JP 2003342676 A JP2003342676 A JP 2003342676A JP 4243682 B2 JP4243682 B2 JP 4243682B2
- Authority
- JP
- Japan
- Prior art keywords
- section
- repeated
- integrated
- music
- chorus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- JEIPFZHSYJVQDO-UHFFFAOYSA-N iron(III) oxide Inorganic materials O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 title claims description 82
- 241001342895 Chorus Species 0.000 claims abstract description 122
- HAORKNGNJCEJBX-UHFFFAOYSA-N cyprodinil Chemical compound N=1C(C)=CC(C2CC2)=NC=1NC1=CC=CC=C1 HAORKNGNJCEJBX-UHFFFAOYSA-N 0.000 claims abstract description 121
- 239000013598 vector Substances 0.000 claims description 56
- 238000004364 calculation method Methods 0.000 claims description 30
- 230000003252 repetitive effect Effects 0.000 claims description 29
- 238000000605 extraction Methods 0.000 claims description 19
- 230000001502 supplementing effect Effects 0.000 claims description 3
- 239000013589 supplement Substances 0.000 claims description 2
- 238000001514 detection method Methods 0.000 abstract description 25
- 230000010354 integration Effects 0.000 abstract description 14
- 230000008569 process Effects 0.000 description 13
- 238000012545 processing Methods 0.000 description 13
- 238000005070 sampling Methods 0.000 description 11
- 238000003860 storage Methods 0.000 description 8
- 238000010187 selection method Methods 0.000 description 7
- 230000005236 sound signal Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 5
- 238000007796 conventional method Methods 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 238000009499 grossing Methods 0.000 description 4
- 230000017105 transposition Effects 0.000 description 4
- 230000004069 differentiation Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000033458 reproduction Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 101100074187 Caenorhabditis elegans lag-1 gene Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Auxiliary Devices For Music (AREA)
- Electrophonic Musical Instruments (AREA)
Description
Logan,B.and Chu,S.:Music Summarization Using Key Phrases,Proc.of ICASSP 2000,II−749−752(2000). Bartsch,M.A.and Wakefield,G.H.:To Catch A Chorus:Using Chroma−based Representations for Audio Thumbnailing,Proc.of WASPAA 2001,15−18(2001). Foote,J.:Automatic Audio Segmentation Using A Measure of Audio Novelty,Proc.of ICME 2000,I−452−455(2000). Meek,C.and Birmingham,W.P.:Thematic Extractor,Proc.of ISMIR 2001,119−128(2001). 村松純:歌謡曲における「さび」の楽譜情報に基づく特徴抽出−小室哲哉の場合−,情処研報 音楽情報科学,2000−MUS−35−1,1−6(2000). 大津展之:判別および最小2乗規準に基づく自動しきい値選定法,信学論(D),J63−D,4,349−356(1980). Shepard,R.N.:Circularity in Judgments of Relative Pitch,J.Acoust.Soc.Am.,36,12,2346−2353(1964). Wakefield,G.H.:Mathematical Representation of Joint Time−Chroma Distributions,SPIE 1999,637−645(1999). Savitzky,A.and Golay,M.J.:Smoothing and Differentiation of Data by Simplified Least Squares Procedures,Analytical Chemistry,36,8,1627−1639(1964). 後藤真孝,橋口博樹,西村拓一,岡隆一:RWC研究用音楽データベース;ポピュラー音楽データベースと著作権切れ音楽データベース,情処研報 音楽情報科学,2001−MUS−42−6,35−42(2001). van Rijsbergen,C.J.:Information Retrieval,Butterworths,second edition(1979). 平田圭二,松田周:パピプーーン:GTTMに基づく音楽要約システム,情処研報 音楽情報科学,2002−MUS−46−5,29−36(2002).
{イントロ、サビ}
((→第1の序奏部分(Aメロ)〔→第2の序奏部分(Bメロ)〕)×n1→サビ)×n2
〔→間奏〕〔→第1の序奏部分(Aメロ)〕〔→第2の序奏部分(Bメロ)〕→サビ×n3
〔→間奏→サビ×n4 〕〔→エンディング〕
のようになっている。このようにサビは、他のメロディよりも繰り返し回数が多くなっている。ここで、{a,b}はaかbかのいずれか一方、〔a〕はaが省略可能であることを表す記号である。そしてn1 ,n2 ,n3 ,n4 は繰り返し回数を表す正の整数である(多くの場合、1≦n1 ≦2,1≦n2 ≦4,n3 ≧0,n4 ≧0)。イントロ(introduction)は前奏部分、Aメロ、Bメロ(verse A,verse B)は序奏部分を指す。
ある区間の音響信号とその区間の繰り返し区間と考えられる他の区間の音響信号とが完全に一致しない場合には、ある区間が繰り返されているということを判断するために、各区間から求めた特徴量相互間の類似度を判断しなければならない。その際、繰り返しがあると判断できるためには、繰り返す度にその区間内の音響信号の細部が多少異なっても(メロディーが変形したり、伴奏のベース、ドラム等が演奏されなくなったりしても)、各区間の特徴量間の類似度は高い必要がある。しかしながら、各区間のパワースペクトルを直接特徴量とした場合には、この類似度の判断が困難である。
類似度がどれくらい高ければ繰り返しとみなせるかという基準は、楽曲に依存して変わる。例えば、似た伴奏が多用される楽曲では、全体的に多くの部分の類似度が高くなる。そのため、比較する各区間の類似度がかなり高い類似度でなければ、それらの区間がサビに関連する繰り返し区間であると判断しない方がよい。逆に、サビが繰り返されるときに、伴奏が大きく変化するような楽曲では、比較する各区間の類似度がやや低くても繰り返し区間であると判断する方がよい。こうした基準を、ある楽曲に特化して人間が手作業で設定するのは容易である。しかしながら、幅広い楽曲からサビ区間を自動的に検出するためには、サビ区間の検出の基準を、現在処理中の楽曲に応じて自動的に変える必要がある。このことは、あるサビ区間の検出方法の性能を評価する場合に、その方法で数曲のサンプル曲についてサビ区間の検出ができたからといって、必ずしもその方法に汎用性があるとは限らないということを意味する。
サビ区間の長さ(区間長)は楽曲ごとに異なるため、各区間長と共に、どこからどこまでがサビであるかを推定しなければならない。その際、サビの前後の区間も一緒に繰り返すことがあるため、端点の推定は、楽曲中の様々な箇所の情報を統合して行う必要がある。例えば、(ABCBCC)のような構造の楽曲の場合(A,B,CはそれぞれAメロ、Bメロ、サビの区間とする)、単純に繰り返し区間を探すと、(BC)が一つのまとまった区間として見つかる。この場合、最後のCの繰り返し情報に基づいて、(BC)の内のCの区間の端点を推定する、といった処理が求められる。
転調後の区間は、一般に特徴量が大きく変わるために、転調前の区間との類似度が低くなり、繰り返し区間と判断するのが困難となる。特に、転調は曲の後半のサビの繰り返しで起きることが多く、そうした繰り返しを的確に判断することは、サビの検出において重要な課題である。
((→Aメロ〔→Bメロ〕)×n1 →サビ)×n2
に相当するような、長い繰り返しがある場合、その末尾の部分がサビである可能性が高い(図25参照)。
平均律の半音は100centに相当し、1オクターブは1200centに相当する。そのため、音名c(cは1≦c≦12の整数で、クロマに対応)、オクターブ位置h(ハイトに対応)の周波数Fc,hcentは、
Fc,h=1200h+100(c−1) …(2)
と表せる。
図14の右側の線図に示されるRall(t,l)中の十分に高いピークを、線分候補ピークとして検出する。まず、Rall(t,l)のlag軸方向のピークを、2次多項式適合による平滑化微分を用いたピーク検出〔非特許文献9〕により求める。具体的には、下記式(8)で求めるRall(t,l)の平滑化微分が正から負に変わる箇所をピークとする(KSize=0.32sec)。
σ2 B =ω1ω2(μ1−μ2)2 …(9)
を最大とする閾値を求める。ただし、ω1ω2は、閾値によって分けられた二つのクラスの生起確率(各クラスのピーク個数/全体のピーク個数)、μ1、μ2は、各クラスのピーク値の平均である。
図16に示すように、各線分候補ピークのlag軸上の位置lにおいて、類似度r(t,l)の時間軸方向を一次元関数とみなして、それが連続して十分高い区間を探索し、類似線分とする。
ほぼ同じ区間の類似線分を、一つのグループにまとめる。各グループφi=[[Tsi,Tei],Υi]は、区間[Tsi,Tei]と、類似線分(区間が決まれば、線分候補ピークと対応する)のlag値υijの集合Υi={υij|j=1,2,…,Mi}(Miはピークの個数)で表される。そして、この類似線分のグループφiの集合を、Φ={φi|i=1,2,…,N}(Nはグループの個数)とする。
グループφiごとに、区間[Tsi,Tei]内の類似度r(t,l)に基づいて、類似線分を改めて求めなおす。これにより、もれていた類似線分の検出ができ、例えば、図8で、ABCCの繰り返しに相当する長い類似線分上で、Cの繰り返しに相当する類似線分2か所が得られていなくても、この処理で検出されることが期待できる。
サビと無関係な類似線分からなるグループφi、あるいは、Υiの中で無関係な線分と考えられるピークを削除する。
Υiの中には、区間[Tsi,Tei]の一部分だけ類似度が高いピークが含まれることがあるため、そうした類似度の変動の大きいピークを削除する。そこで、当該区間のrsmooth(τ,l)の標準偏差を求め、ある閾値より大きいものはΥiから削除する。この閾値は、φiの中で、上記で求めた類似線分に対応する線分候補ピークは信頼できると考え、それらのピークでの上記標準偏差の最大値を定数倍(1.4倍)して定める。
繰り返し区間が重ならないようにするために、lag軸上で隣接する類似線分(線分候補ピーク)の間隔を、線分の長さTei−Tsi以上とする必要がある。そこで、線分の長さより狭い間隔を持つ二つのピークのいずれかを、全体として高いピーク集合が残るように削除し、すべての間隔が類似線分の長さ以上になるようにする。
Υiの各ピークについて、そのlag値υijだけの過去の区間[Tsi−υij,Tei−υij]のグループがあるかを探索し、発見したら統合する。統合処理では、発見したグループのすべてのピークを、対応するlag値の場所に持つように、Υiに線分候補ピークを追加する。発見したグループ自体は削除する。
v(t)≒Strv(t)´ …(11)
となる。
ここで、[Psij,Peij]=[Tsi−υij,Tei−υij]とし、信頼度λijは、対応する類似線分における類似度rtr(t,l)の平均とする。ただし、j=Mi+1のときは、下記式(15)のようになる。
仮定2で述べたAメロ〜サビに相当するような十分に長い統合繰り返し区間(50sec以上)を持つグループ(統合繰り返し区間列)φhに関して、その各区間の終了点Pehkとほぼ等しい終了点Peijを持つ区間が他のグループ(他の統合繰り返し区間列)にあるか探索する。発見されれば、発見されたその統合繰り返し区間がサビである可能性が高いと考え、その信頼度λijを2倍する。
サビとして適切な区間長の範囲(仮定1)の統合繰り返し区間[Psij,Peij]に関して、その区間の半分程度の短い統合繰り返し区間が前半と後半に一つずつ存在するか調べる。存在する場合には、それら二つの区間の信頼度の平均の半分を、元の区間の信頼度λijに加える。
上記で得られた信頼度に基づき、サビらしさを下記式(16)で算出する。
適合率(P)=正しく検出したサビ区間の長さの合計/検出した区間の長さの合計
F値=(β2+1)PR/(β2P+R) (β=1を使用)
ただし、転調を伴う場合には、相対的な調の移動幅が正解と一致したときだけ、正しく検出したと判断した。そして、F値が0.75以上のとき、その曲のサビ区間を正しく得られた(正答した)と判定した。
3 特徴量抽出手段
5 特徴量記憶手段
7 類似度演算手段
9 繰り返し区間リストアップ手段
11 リスト記憶手段
13 統合繰り返し区間決定手段
15 統合繰り返し区間記憶手段
17 サビ区間決定手段
18 表示手段
21 選択手段
23 再生手段
Claims (15)
- ある楽曲中で繰り返されるサビ区間を検出するためにその楽曲の音楽音響データ中からサビ区間に対応する部分を検出する方法であって、
前記音楽音響データから所定の時間単位で音響特徴量を順次求める特徴量抽出ステップと、
前記音楽音響データについて求めた複数の前記音響特徴量の相互間の類似度を求める類似度演算ステップと、
前記類似度に基づいて前記音楽音響データ中に繰り返し現れる複数の繰り返し区間をリストアップする繰り返し区間リストアップステップと、
リストアップされた前記複数の繰り返し区間の相互関係を調べ、時間軸上の共通区間にある1以上の前記繰り返し区間を時間軸上に統合して一つの統合繰り返し区間を決定し、決定した複数の前記統合繰り返し区間を複数種類の統合繰り返し区間列に分類化する統合繰り返し区間決定ステップと、
前記複数種類の統合繰り返し区間列から前記サビ区間を決定するサビ区間決定ステップとからなることを特徴とする音楽音響データ中のサビ区間を検出する方法。 - 前記特徴量抽出ステップで求める音響特徴量は、1オクターブの範囲に含まれる12の音名の周波数のパワーを複数のオクターブに渡ってそれぞれ加算して得た12次元クロマベクトルである請求項1に記載の音楽音響データ中のサビ区間を検出する方法。
- 前記類似度演算ステップでは、今回求めた前記音響特徴量と先に求めた全ての前記音響特徴量との間の前記類似度を求めることを特徴とする請求項2に記載の音楽音響データ中のサビ区間を検出する方法。
- 前記類似度演算ステップでは、時刻tの前記12次元クロマベクトルとそれよりラグl(0≦l<t)だけ過去の全ての前記12次元クロマベクトルとの前記類似度を求め、
前記繰り返し区間リストアップステップでは、一方の軸を時間軸とし他方の軸をラグ軸とし、予め定めた時間長さ以上前記類似度が予め定めた閾値以上ある場合には前記類似度が前記予め定めた閾値以上である部分の長さに対応する時間長さを有する類似線分を前記時間軸を基準にした前記繰り返し区間としてリストアップすることを特徴とする請求項3に記載の音楽音響データ中のサビ区間を検出する方法。 - 統合繰り返し区間決定ステップでは、前記時間軸の共通区間に存在するリストアップした前記類似線分どうしをそれぞれグルーピングにより統合して前記統合繰り返し区間と定め、
複数の前記統合繰り返し区間を、前記共通区間の前記時間軸上の存在位置及び長さとグルーピングされる前記類似線分の前記ラグ軸で見た位置関係とに基づいて前記複数種類の前記統合繰り返し区間列に分類することを特徴とする請求項4に記載の音楽音響データ中のサビ区間を検出する方法。 - 統合繰り返し区間決定ステップでは、前記統合繰り返し区間に含まれない最初の繰り返し区間を補足して前記統合繰り返し区間列を作成する請求項5に記載の音楽音響データ中のサビ区間を検出する方法。
- 前記楽曲は転調を含んでおり、
前記特徴量抽出ステップでは、前記12次元クロマベクトルからなる前記音響特徴量を1転調幅ずつ11転調幅までシフトして得た転調幅の異なる12種類の前記音響特徴量を求め、
前記類似度演算ステップでは、今回求めた前記音響特徴量と先に求めた全ての12種類の前記音響特徴量との間の前記類似度を、時刻tの今回の前記音響特徴量を表す前記クロマベクトルとそれよりラグl(0≦l<t)だけ過去の全ての12種類の前記音響特徴量を表す前記クロマベクトルとの間の類似度として演算し、
前記繰り返し区間リストアップステップでは、12種類の前記音響特徴量ごとに、一方の軸を時間軸tとし他方の軸をラグlとし、予め定めた時間長さ以上前記類似度が予め定めた閾値以上である部分の長さに対応する時間長さを有する類似線分を前記時間軸を基準にした前記繰り返し区間としてそれぞれ12種類のリストをリストアップすることを特徴とする請求項1に記載の音楽音響データ中のサビ区間を検出する方法。 - 統合繰り返し区間決定ステップでは、前記12種類のリストごとに、前記時間軸の共通区間に存在するリストアップした前記類似線分どうしをそれぞれグルーピングにより統合して統合繰り返し区間と定め、
さらに前記12種類のリストについて定めた複数の前記統合繰り返し区間を、前記共通区間の前記時間軸上の存在位置及び長さと、グルーピングされる前記類似線分の前記ラグ軸で見た位置関係とに基づいて前記複数種類の転調を考慮した前記複数種類の統合繰り返し区間列に分類化することを特徴とする請求項7に記載の音楽音響データ中のサビ区間を検出する方法。 - 前記サビ区間決定ステップでは、前記統合繰り返し区間列に含まれる前記統合繰り返し区間の前記類似度の平均と、数と長さとに基づいて該統合繰り返し区間列に含まれる前記統合繰り返し区間のサビらしさを求め、最もサビらしさの高い前記統合繰り返し区間列に含まれる前記統合繰り返し区間を前記サビ区間として決定することを特徴とする請求項1に記載の音楽音響データ中のサビ区間を検出する方法。
- ある楽曲中で繰り返されるサビ区間を検出するためにその楽曲の音楽音響データ中からサビ区間に対応する部分を検出して表示手段に表示する装置であって、
前記音楽音響データから所定の時間単位で音響特徴量を順次求める特徴量抽出手段と、 前記音楽音響データについて求めた複数の前記音響特徴量の相互間の類似度を求める類似度演算手段と、
前記類似度に基づいて前記音楽音響データ中に繰り返し現れる複数の繰り返し区間をリストアップする繰り返し区間リストアップ手段と、
リストアップされた前記複数の繰り返し区間の相互関係を調べ、時間軸上の共通区間にある1以上の前記繰り返し区間を統合して一つの統合繰り返し区間を決定し、決定した複数の前記統合繰り返し区間を複数種類の統合繰り返し区間列に分類化する統合繰り返し区間決定手段と、
前記複数種類の統合繰り返し区間列から前記サビ区間を決定するサビ区間決定手段とを具備し、
前記複数種類の統合繰り返し区間列が前記表示手段に表示され、
前記サビ区間を含む前記統合繰り返し区間列が他の前記統合繰り返し区間列とは異なる表示態様で表示されることを特徴とする音楽音響データ中のサビ区間を検出する装置。 - ある楽曲中で繰り返されるサビ区間を検出するためにその楽曲の音楽音響データ中からサビ区間に対応する部分を検出して表示手段に表示する装置であって、
前記音楽音響データから所定の時間単位で音響特徴量を順次求める特徴量抽出手段と、 前記音楽音響データについて求めた複数の前記音響特徴量の相互間の類似度を求める類似度演算手段と、
前記類似度に基づいて前記音楽音響データ中に繰り返し現れる複数の繰り返し区間をリストアップする繰り返し区間リストアップ手段と、
リストアップされた前記複数の繰り返し区間の相互関係を調べ、時間軸上の共通区間にある1以上の前記繰り返し区間を統合して一つの統合繰り返し区間を決定し、決定した複数の前記統合繰り返し区間を複数種類の統合繰り返し区間列に分類化する統合繰り返し区間決定手段と、
前記複数種類の統合繰り返し区間列から前記サビ区間を決定するサビ区間決定手段とを具備することを特徴とする音楽音響データ中のサビ区間を検出する装置。 - 統合繰り返し区間決定手段は、前記統合繰り返し区間に含まれない最初の繰り返し区間を補足して前記統合繰り返し区間列を作成するように構成されている請求項11に記載の音楽音響データ中のサビ区間を検出する装置。
- ある楽曲中で繰り返されるサビ区間を検出するためにその楽曲の音楽音響データ中からサビ区間に対応する部分を検出して前記サビ区間を再生手段により再生する装置であって、
前記音楽音響データから所定の時間単位で音響特徴量を順次求める特徴量抽出手段と、 前記音楽音響データについて求めた複数の前記音響特徴量の相互間の類似度を求める類似度演算手段と、
前記類似度に基づいて前記音楽音響データ中に繰り返し現れる複数の繰り返し区間をリストアップする繰り返し区間リストアップ手段と、
リストアップされた前記複数の繰り返し区間の相互関係を調べ、時間軸上の共通区間にある1以上の前記繰り返し区間を統合して一つの統合繰り返し区間を決定し、決定した複数の前記統合繰り返し区間を複数種類の統合繰り返し区間列に分類化する統合繰り返し区間決定手段と、
前記複数種類の統合繰り返し区間列から前記サビ区間を決定するサビ区間決定手段とを具備し、
前記複数種類の統合繰り返し区間列が選択的に前記再生手段で再生されることを特徴とする音楽音響データ中のサビ区間を検出する装置。 - ある楽曲中で繰り返されるサビ区間を検出するためにその楽曲の音楽音響データ中からサビ区間に対応する部分を検出する方法をコンピュータを用いて実現するために用いられるプログラムであって、
前記音楽音響データから所定の時間単位で音響特徴量を順次求める特徴量抽出ステップと、
前記音楽音響データについて求めた複数の前記音響特徴量の相互間の類似度を求める類似度演算ステップと、
前記類似度に基づいて前記音楽音響データ中に繰り返し現れる複数の繰り返し区間をリストアップする繰り返し区間リストアップステップと、
リストアップされた前記複数の繰り返し区間の相互関係を調べ、時間軸上の共通区間にある1以上の前記繰り返し区間を統合して一つの統合繰り返し区間を決定し、決定した複数の前記統合繰り返し区間を複数種類の統合繰り返し区間列に分類化する統合繰り返し区間決定ステップと、
前記複数種類の統合繰り返し区間列から前記サビ区間を決定するサビ区間決定ステップとを前記コンピュータに実行させるように構成されていることを特徴とするプログラム。 - 統合繰り返し区間決定ステップでは、前記統合繰り返し区間に含まれない最初の繰り返し区間を補足して前記統合繰り返し区間列を作成する請求項14に記載のプログラム。
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003342676A JP4243682B2 (ja) | 2002-10-24 | 2003-09-30 | 音楽音響データ中のサビ区間を検出する方法及び装置並びに該方法を実行するためのプログラム |
PCT/JP2003/013563 WO2004038694A1 (ja) | 2002-10-24 | 2003-10-23 | 楽曲再生方法及び装置並びに音楽音響データ中のサビ区間検出方法 |
KR1020057007022A KR100836574B1 (ko) | 2002-10-24 | 2003-10-23 | 악곡재생방법, 장치 및 음악음향데이터 중의 대표 모티프구간 검출방법 |
AU2003275618A AU2003275618A1 (en) | 2002-10-24 | 2003-10-23 | Musical composition reproduction method and device, and method for detecting a representative motif section in musical composition data |
US10/532,400 US7179982B2 (en) | 2002-10-24 | 2003-10-23 | Musical composition reproduction method and device, and method for detecting a representative motif section in musical composition data |
EP03758828A EP1577877B1 (en) | 2002-10-24 | 2003-10-23 | Musical composition reproduction method and device, and method for detecting a representative motif section in musical composition data |
AT03758828T ATE556404T1 (de) | 2002-10-24 | 2003-10-23 | Wiedergabeverfahren für musikalische kompositionen und einrichtung und verfahren zum erkennen eines repräsentativen motivteils in musikkompositionsdaten |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002309519 | 2002-10-24 | ||
JP2003342676A JP4243682B2 (ja) | 2002-10-24 | 2003-09-30 | 音楽音響データ中のサビ区間を検出する方法及び装置並びに該方法を実行するためのプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004233965A JP2004233965A (ja) | 2004-08-19 |
JP4243682B2 true JP4243682B2 (ja) | 2009-03-25 |
Family
ID=32964368
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003342676A Expired - Lifetime JP4243682B2 (ja) | 2002-10-24 | 2003-09-30 | 音楽音響データ中のサビ区間を検出する方法及び装置並びに該方法を実行するためのプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4243682B2 (ja) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102004047068A1 (de) * | 2004-09-28 | 2006-04-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Gruppieren von zeitlichen Segmenten eines Musikstücks |
DE102004047032A1 (de) * | 2004-09-28 | 2006-04-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Bezeichnen von verschiedenen Segmentklassen |
WO2006062064A1 (ja) * | 2004-12-10 | 2006-06-15 | Matsushita Electric Industrial Co., Ltd. | 楽曲処理装置 |
WO2006086556A2 (en) * | 2005-02-08 | 2006-08-17 | Landmark Digital Services Llc | Automatic identfication of repeated material in audio signals |
KR100869643B1 (ko) * | 2005-04-29 | 2008-11-21 | 에스케이 텔레콤주식회사 | 음악구조를 이용한 엠피쓰리 형식의 가요 음향에 대한 요약장치, 방법 및 이를 구현하기 위한 프로그램이 저장된기록매체 |
JP4940588B2 (ja) | 2005-07-27 | 2012-05-30 | ソニー株式会社 | ビート抽出装置および方法、音楽同期画像表示装置および方法、テンポ値検出装置および方法、リズムトラッキング装置および方法、音楽同期表示装置および方法 |
JP2007041234A (ja) * | 2005-08-02 | 2007-02-15 | Univ Of Tokyo | 音楽音響信号の調推定方法および調推定装置 |
US8069036B2 (en) * | 2005-09-30 | 2011-11-29 | Koninklijke Philips Electronics N.V. | Method and apparatus for processing audio for playback |
JP4465626B2 (ja) | 2005-11-08 | 2010-05-19 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
CN101326569B (zh) | 2005-12-09 | 2012-07-18 | 索尼株式会社 | 音乐编辑设备和音乐编辑方法 |
JP4949687B2 (ja) | 2006-01-25 | 2012-06-13 | ソニー株式会社 | ビート抽出装置及びビート抽出方法 |
JP4722738B2 (ja) * | 2006-03-14 | 2011-07-13 | 三菱電機株式会社 | 楽曲分析方法及び楽曲分析装置 |
JP4877811B2 (ja) * | 2007-04-12 | 2012-02-15 | 三洋電機株式会社 | 特定区間抽出装置、音楽記録再生装置、音楽配信システム |
JP2009015119A (ja) * | 2007-07-06 | 2009-01-22 | Sanyo Electric Co Ltd | サビ位置検出装置 |
JP5087415B2 (ja) * | 2008-01-22 | 2012-12-05 | 三洋電機株式会社 | 楽曲メタ情報配信システムにおけるクライアント側装置および音声データ出力装置 |
JP4973537B2 (ja) * | 2008-02-19 | 2012-07-11 | ヤマハ株式会社 | 音響処理装置およびプログラム |
JP5177657B2 (ja) | 2008-08-08 | 2013-04-03 | 国立大学法人九州工業大学 | 音響特性制御装置 |
JP5153517B2 (ja) * | 2008-08-26 | 2013-02-27 | 株式会社河合楽器製作所 | コード名検出装置及びコード名検出用コンピュータ・プログラム |
JP5391939B2 (ja) * | 2009-09-04 | 2014-01-15 | ヤマハ株式会社 | 音響処理装置およびプログラム |
CN102754159B (zh) | 2009-10-19 | 2016-08-24 | 杜比国际公司 | 指示音频对象的部分的元数据时间标记信息 |
JP5373552B2 (ja) * | 2009-10-28 | 2013-12-18 | 株式会社河合楽器製作所 | 盛り上がり検出装置及びプログラム |
MX2012009594A (es) | 2010-02-26 | 2012-09-28 | Sharp Kk | Dispositivo de reproduccion de contenido, receptor de television, metodo de reproduccion de contenido, programa de reproduccion de contenido y medio de grabacion. |
JP5672960B2 (ja) * | 2010-10-28 | 2015-02-18 | ヤマハ株式会社 | 音響処理装置 |
EP2791935B1 (en) * | 2011-12-12 | 2016-03-09 | Dolby Laboratories Licensing Corporation | Low complexity repetition detection in media data |
JP5851455B2 (ja) * | 2013-08-06 | 2016-02-03 | 日本電信電話株式会社 | 共通信号含有区間有無判定装置、方法、及びプログラム |
JP6424501B2 (ja) * | 2014-07-14 | 2018-11-21 | ヤマハ株式会社 | 演奏装置及び演奏プログラム |
WO2017168644A1 (ja) * | 2016-03-30 | 2017-10-05 | Pioneer DJ株式会社 | 楽曲展開解析装置、楽曲展開解析方法および楽曲展開解析プログラム |
GB201802440D0 (en) * | 2018-02-14 | 2018-03-28 | Jukedeck Ltd | A method of generating music data |
JP6733720B2 (ja) * | 2018-10-23 | 2020-08-05 | ヤマハ株式会社 | 演奏装置、演奏プログラム、及び演奏パターンデータ生成方法 |
CN109979418B (zh) * | 2019-03-06 | 2022-11-29 | 腾讯音乐娱乐科技(深圳)有限公司 | 音频处理方法、装置、电子设备及存储介质 |
JP7318253B2 (ja) * | 2019-03-22 | 2023-08-01 | ヤマハ株式会社 | 楽曲解析方法、楽曲解析装置およびプログラム |
JP2020035511A (ja) * | 2019-12-06 | 2020-03-05 | パイオニア株式会社 | コンテンツ評価装置 |
CN115294947B (zh) * | 2022-07-29 | 2024-06-11 | 腾讯科技(深圳)有限公司 | 音频数据处理方法、装置、电子设备及介质 |
-
2003
- 2003-09-30 JP JP2003342676A patent/JP4243682B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2004233965A (ja) | 2004-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4243682B2 (ja) | 音楽音響データ中のサビ区間を検出する方法及び装置並びに該方法を実行するためのプログラム | |
EP1577877B1 (en) | Musical composition reproduction method and device, and method for detecting a representative motif section in musical composition data | |
Casey et al. | Content-based music information retrieval: Current directions and future challenges | |
Tzanetakis et al. | Pitch histograms in audio and symbolic music information retrieval | |
Tzanetakis et al. | Marsyas: A framework for audio analysis | |
Turetsky et al. | Ground-truth transcriptions of real music from force-aligned midi syntheses | |
Peeters et al. | Toward automatic music audio summary generation from signal analysis | |
Dixon et al. | Towards Characterisation of Music via Rhythmic Patterns. | |
US7273978B2 (en) | Device and method for characterizing a tone signal | |
Peeters | Deriving musical structures from signal analysis for music audio summary generation:“sequence” and “state” approach | |
Chai et al. | Music thumbnailing via structural analysis | |
US20110225196A1 (en) | Moving image search device and moving image search program | |
Rocamora et al. | Comparing audio descriptors for singing voice detection in music audio files | |
Muller et al. | A robust fitness measure for capturing repetitions in music recordings with applications to audio thumbnailing | |
Hargreaves et al. | Structural segmentation of multitrack audio | |
Tzanetakis et al. | Audio information retrieval (AIR) tools | |
Ong | Structural analysis and segmentation of music signals | |
Rocha et al. | Segmentation and timbre-and rhythm-similarity in Electronic Dance Music | |
Tzanetakis et al. | A framework for audio analysis based on classification and temporal segmentation | |
Durand et al. | Downbeat Detection with Conditional Random Fields and Deep Learned Features. | |
Tian et al. | Towards music structural segmentation across genres: Features, structural hypotheses, and annotation principles | |
Papadopoulos | Joint estimation of musical content information from an audio signal | |
Müller et al. | Music structure analysis | |
CN116034421A (zh) | 乐曲构造解析装置及乐曲构造解析方法 | |
Lidy | Evaluation of new audio features and their utilization in novel music retrieval applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20051013 |
|
RD07 | Notification of extinguishment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7427 Effective date: 20051013 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051114 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20051020 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081209 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4243682 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |