JP5924968B2 - 楽譜位置推定装置、及び楽譜位置推定方法 - Google Patents
楽譜位置推定装置、及び楽譜位置推定方法 Download PDFInfo
- Publication number
- JP5924968B2 JP5924968B2 JP2012029802A JP2012029802A JP5924968B2 JP 5924968 B2 JP5924968 B2 JP 5924968B2 JP 2012029802 A JP2012029802 A JP 2012029802A JP 2012029802 A JP2012029802 A JP 2012029802A JP 5924968 B2 JP5924968 B2 JP 5924968B2
- Authority
- JP
- Japan
- Prior art keywords
- score
- particle
- frequency characteristic
- unit
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 123
- 238000009826 distribution Methods 0.000 claims description 163
- 238000004458 analytical method Methods 0.000 claims description 26
- 239000002245 particle Substances 0.000 description 478
- 238000004364 calculation method Methods 0.000 description 350
- 230000007704 transition Effects 0.000 description 123
- 239000013598 vector Substances 0.000 description 104
- 230000008569 process Effects 0.000 description 82
- 230000014509 gene expression Effects 0.000 description 40
- 230000006870 function Effects 0.000 description 30
- 239000000284 extract Substances 0.000 description 26
- 238000001914 filtration Methods 0.000 description 26
- 238000012952 Resampling Methods 0.000 description 25
- 238000010586 diagram Methods 0.000 description 17
- 238000013139 quantization Methods 0.000 description 14
- 238000003860 storage Methods 0.000 description 13
- 230000008859 change Effects 0.000 description 12
- 238000005070 sampling Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 10
- 230000005236 sound signal Effects 0.000 description 7
- 230000001186 cumulative effect Effects 0.000 description 6
- 230000007423 decrease Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- XFLPHFRVXZHTDQ-KXUCPTDWSA-N (3R,4R)-4-(hydroxymethyl)-3-[(1S)-1-hydroxy-4-methylpentyl]oxolan-2-one Chemical compound CC(C)CC[C@H](O)[C@H]1[C@H](CO)COC1=O XFLPHFRVXZHTDQ-KXUCPTDWSA-N 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- -1 e.g. Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Landscapes
- Auxiliary Devices For Music (AREA)
Description
本発明は上記の点に鑑みてなされたものであり、演奏された楽曲の楽譜上の位置をより頑健に推定できる楽譜位置推定装置及び楽譜位置推定方法を提供することを課題としている。
(1)、(4)に記載した態様によれば、楽譜情報に基づく第2の周波数成分に含まれる調波構造の周波数特性の変化、調波構造間の結合特性の変化に柔軟に対応できるので、音響信号に基づく第1の周波数特性との関連性をより的確に推定することができる。そのため、演奏された音楽に対する楽譜の位置をより正確に推定することが可能になる。
(2)、(5)に記載した態様によれば、音響信号に基づく第1の周波数特性の周波数毎の振幅と楽譜情報における音階に基づく第2の周波数特性の周波数毎の振幅が合致する度合いを鋭敏に検出することができる。そのため、演奏された音楽に対する楽譜の位置をより正確に推定することが可能になる。
(3)に記載した態様によれば、楽譜情報における音階が変化する楽譜の位置と、音響信号の振幅が変化する時刻が対応付けられる。そのため、周波数特性の周期性を表す拍間隔を正確に検知でき、ひいては演奏された音楽に対する楽譜の位置をより正確に推定することができる。
以下、図面を参照しながら本発明の第1の実施形態について説明する。
図1は、本実施形態に係る楽譜位置推定装置1の構成を示す概略図である。
楽譜位置推定装置1は、音響信号入力部101、音響特徴量生成部102、楽譜情報記憶部111、楽譜情報入力部112、関連度算出部121、楽譜位置探索部131、及び演奏情報出力部141を含んで構成される。
相関算出部104は、算出した自己相関を関連度算出部121の拍間隔重み算出部123及び楽譜位置探索部131の粒子遷移部132に出力する。相関算出部104は、音響スペクトログラムAf,tを粒子遷移部132に出力する。
相関算出部104は、距離値として、例えば式(2)で表されるΞf,tを算出してもよい。
相関算出部104は、線形領域で表された周波数fをメル尺度で表された周波数fmelに変換する。線形領域で表された周波数fと、メル尺度で表された周波数fmelとの関係は、式(4)で表される。
相関算出部104は、例えば式(7)を用いて距離値Ξf,tをフィルタリングする。
相関算出部104は、算出した距離値Ξf,t及び自己相関R(b,{Ξk’})を粒子遷移部132に出力する。
楽譜情報は、コードを示すコード情報np lを要素とするコードベクトル{np}=[np 1,np 2,…,np Lp]Tを、基本周波数ベクトル{μp}と対応付けて含んでいてもよい。音階A4、C4、及びE4を要素値として含むコードベクトルは、[A4,C4,E4]となる。
楽譜フレームは、1つの楽曲の楽譜情報において楽曲を時間分割する単位時間である。例えば、1拍、即ち四分音符の長さが12フレームである場合、楽譜情報の時間分解能(resolution)は十六分音符の三分の一である。
関連度算出部121は、例えば、周波数特性重み算出部122、拍間隔重み算出部123、及び粒子重み算出部124を含んで構成される。粒子重み算出部124は、上述の重み情報として、粒子重み情報を含んだ粒子情報を楽譜位置探索部131及び演奏情報出力部141に出力する。
拍間隔重み算出部123は、相関算出部104から入力された自己相関に基づいて拍間隔毎に音響信号の振幅周波数特性の関連度を表す拍間隔重み値を算出する。拍間隔重み算出部123は、拍間隔重み値を表す拍間隔重み情報を粒子重み算出部124に出力する。拍間隔重み算出部123のより詳細な構成については後述する。
粒子とは、楽譜位置を表す楽譜位置情報、拍間隔を表す拍間隔情報及び入力音響信号に対する観測値である重み情報の組を表す情報の単位である。粒子重み算出部124が生成した重み情報を粒子重み情報と呼び、楽譜位置情報、拍間隔情報及び粒子重み情報の組を粒子情報と呼ぶ。粒子情報は、後述するように粒子フィルタリング法により、楽譜位置、拍間隔の推定値を定めるために用いられる。
粒子フィルタリング法を用いる場合、粒子重み算出部124は、例えば、式(9)を用いて粒子重み情報として粒子i毎の重み値(以下、粒子重み値と呼ぶ)wi,kを算出する。
粒子重み算出部124は、入力された粒子i毎の粒子情報に含まれる粒子重み情報を、生成した粒子重み情報に置き換えることで粒子情報を更新する。
粒子重み算出部124は、更新した粒子情報を楽譜位置探索部131の再標本化部133、演奏情報出力部141の楽譜位置算出部142及び拍間隔算出部143に出力する。
図2は、粒子フィルタリング法の処理を表す概念図である。
粒子フィルタリング法は、I.遷移、II.重み算出、III.位置推定・再標本化、の各過程を有する。図2は、I.遷移、II.重み算出、III.位置推定・再標本化、の各過程における処理の概念を左から右へ順に表す。
中段の粒子を起点とし、下段の粒子を終点とする矢印は、中段の粒子を再標本化することを表す。濃く塗りつぶした粒子を終点とする太線の矢印は、起点の粒子の粒子重みが大きいために複数の粒子に分割・複製することを表す。×印を終点とする破線の矢印は、起点の粒子の粒子重みが小さいために、その粒子を棄却することを表す。即ち、再標本化部133が、粒子重みが大きい粒子を分割・複製し、粒子重みが小さい粒子ほど優先して棄却することを表す。これにより、楽譜位置及び拍間隔が妥当な粒子が残される。その後、I.遷移に戻り、I−IIIの過程を繰り返す。粒子遷移部132、再標本化部133の構成もしくは動作については後述する。
演奏情報出力部141は、例えば、楽譜位置算出部142、拍間隔算出部143、信頼度判定部144、及び楽譜位置出力部145を含んで構成される。
楽譜位置算出部142は、一部の粒子を考慮して推定楽譜位置<pk>を算出する際、一部の粒子についての粒子重み値の総和の他に、さらに全部の粒子についての粒子重み値の総和を算出する。楽譜位置算出部142は、一部の粒子についての粒子重み値の総和、全部の粒子についての粒子重み値の総和を信頼度判定部144に出力する。
信頼度判定部144は、現在のフィルタリングステップkにおける信頼度係数vkから前フィルタリングステップk−1における信頼度係数vk−1の差分vk−vk−1を算出する。信頼度判定部144は、差分vk−vk−1が予め定めた閾値−ηdec(例えば、−0.07)よりも小さい場合、楽譜位置算出部142から入力された推定楽譜位置情報を楽譜位置出力部145へ出力することを停止する。この場合、信頼度係数vk−1が急激に低下するため、信頼性に欠ける楽譜位置情報の出力が回避される。
信頼度判定部144は、差分vk−vk−1が予め定めた閾値ηinc(例えば、0.08)よりも大きい場合、楽譜位置算出部142から入力された推定楽譜位置情報を楽譜位置出力部145へ出力することを再開する。
拍間隔出力部146は、拍間隔算出部143から入力された推定拍間隔情報を楽譜位置推定装置1の外部に出力する。拍間隔出力部146は、推定拍間隔情報自体の代わりに推定拍間隔情報が表す推定拍間隔<bk>の逆数である推定テンポを出力するようにしてもよい。
図3は、本実施形態に係る楽譜位置推定処理を表すフローチャートである。
(ステップS101)楽譜位置推定装置1の各構成部は、処理に用いる変数やデータを初期設定する。例えば、粒子遷移部132は、粒子数I、粒子i毎の拍間隔bi k、楽譜位置pi k、粒子分布値q(pi k,bi k|{Ak},op,bi k)、状態遷移確率q(pi k,bi k|pi k−1,bi k−1)の初期値を定める。その後、ステップS102に進む。
粒子重み算出部124は、更新した粒子情報を再標本化部133、楽譜位置算出部142及び拍間隔算出部143に出力する。その後、ステップS109に進む。
信頼度判定部144は、現在のフィルタリングステップkにおける信頼度係数vkから前フィルタリングステップk−1における信頼度係数vk−1の差分vk−vk−1を算出する。その後、ステップS112に進む。
(ステップS113)信頼度判定部144は、楽譜位置算出部142から入力された推定楽譜位置情報<pk>の楽譜位置出力部145への出力を停止する。その後、ステップS114に進む。
(ステップS115)信頼度判定部144は、楽譜位置算出部142から入力された推定楽譜位置情報<pk>の楽譜位置出力部145への出力を再開する。その後、ステップS116に進む。
粒子遷移部132は、楽譜情報に含まれるテンポ情報、自己相関、粒子情報に基づいて拍間隔分布値を算出する。粒子遷移部132は、算出した拍間隔分布値に比例する確率で粒子iの拍間隔bi kを定める。粒子遷移部132は、オンセット情報、距離値、及び抽出した拍間隔bi kに基づいて楽譜位置分布値を算出し、算出した楽譜位置分布値に比例する確率で粒子iの楽譜位置pi kを定める。
粒子遷移部132は、粒子i毎の拍間隔分布値に、楽譜位置分布値を乗じて、粒子分布値q(pi k,bi k|{Ak},op,bi k)を算出する。
粒子遷移部132は、粒子毎に粒子情報に含まれる拍間隔情報及び楽譜位置情報を、抽出した拍間隔を表す拍間隔情報及び楽譜位置を表す楽譜位置情報にそれぞれ置き換える。粒子遷移部132は、置き換えた粒子情報を関連度算出部121の周波数特性重み算出部122、拍間隔重み算出部123、粒子重み算出部124に出力する。
粒子遷移部132は、算出した粒子毎の粒子分布値と状態遷移確率を粒子重み算出部124に出力する。その後、処理を終了する。
粒子遷移部132は、テンポ情報に基づいて拍間隔bに対する窓関数ψ(b|bs’)を算出する。窓関数ψ(b|bs’)は、例えば、テンポ情報が表すテンポ60/bs’を中心とする予め定めた範囲内|60/b−60/bs’|<60/bθでは1であり、その範囲外では0である。以下、60/bθをテンポ窓長(tempo window length)と呼ぶ。
なお、粒子遷移部132は、自己相関R(b,{Ξk’})が相関算出部104から入力された場合には、R(b,{Ak})の代わりにR(b,{Ξk’})を用いて分布値q(b|{Ak},bs’)を算出してもよい。
ここで、粒子遷移部132は、例えば式(12)を用いて分布値q(p|{Ak},op,bi k)を算出する。
即ち、式(12)は、探索範囲Pi kにオンセットが含まれる場合、分布値q(p|{Ak},op,bi k)は、オンセットを有する楽譜位置に対応する時刻における音響信号の振幅の累積値に比例する値であることを表す。探索範囲Pi kにオンセットが含まれない場合、1に比例する値であることを表す。楽譜位置pが、探索範囲Pi kの範囲外である場合には、分布値q(p|{Ak},op,bi k)は、ゼロであることを表す。
図4は、楽譜情報と音響信号の関係の一例を表す概念図である。
図4の上段は、楽譜情報を表す。楽譜情報は、左から順に、1拍の音階A4からなるコードd1、0.5拍のコードB4、F3からなるコードd2、0.5拍の音階B4、G3からなるコードd3を表す。この例では、音階B3を2つの0.5拍からなる音として扱う。図4の上下に延びる3本の破線は、各々オンセットを表す。図4では、オンセットを有する楽譜位置は、左端、左端から1拍、左端から1.5拍である。なお、各コードが継続する区間をセグメントといい、d1、d2、d3は、各コードのセグメントを表す。
これにより、粒子遷移部132は、分布値q(p|{Ak},op,bi k)を用いることで、楽譜情報に含まれるオンセットと音響信号の振幅が増加する部分の楽譜位置pi kが推定される確率を高くすることができる。
なお、上述の探索範囲Pi k−1(又はP)にオンセットが含まれない場合には、粒子遷移部132は、当該探索範囲からランダムに粒子iの楽譜位置pi kを抽出する。
粒子遷移部132は、粒子i毎に算出した拍間隔の分布値(拍間隔分布値)q(bi k|{Ak},bs’)に、楽譜位置の分布値(楽譜位置分布値)q(pi k|{Ak},op,bi k)を乗じて、粒子の分布値(粒子分布値)q(pi k,bi k|{Ak},op,bi k)を算出する。
粒子遷移部132は、粒子毎に粒子情報に含まれる拍間隔情報及び楽譜位置情報を、抽出した拍間隔を表す拍間隔情報及び楽譜位置を表す楽譜位置情報にそれぞれ置き換える。粒子遷移部132は、置き換えた粒子情報を関連度算出部121の周波数特性重み算出部122、拍間隔重み算出部123、粒子重み算出部124に出力する。
粒子遷移部132は、算出した粒子毎の粒子分布値q(pi k,bi k|{Ak},op,bi k)と状態遷移確率q(pi k,bi k|pi k−1,bi k−1)を粒子重み算出部124に出力する。
図5は、本実施形態に係る粒子遷移処理を表すフローチャートである。
(ステップS201)粒子遷移部132は、相関算出部104から距離値及び自己相関が、楽譜情報入力部112から入力された楽譜情報が、再標本化部133から粒子毎の粒子情報が入力される。粒子遷移部132は、入力された楽譜情報に基づいてオンセット情報を生成する。その後、ステップS202に進む。
(ステップS203)粒子遷移部132は、入力された粒子情報から、算出した拍間隔分布値q(b|{Ak},bs’)に比例する確率で粒子iの拍間隔bi kを抽出する。その後、ステップS204に進む。
粒子遷移部132は、算出した粒子毎の粒子分布値q(pi k,bi k|{Ak},op,bi k)と状態遷移確率q(pi k,bi k|pi k−1,bi k−1)を粒子重み算出部124に出力する。その後、処理を終了する。
再標本化部133は、入力された粒子情報に含まれる粒子重み情報が表す粒子重みに比例した確率で粒子を抽出する。再標本化部133は、粒子を抽出する際、例えばSIR(sampling importance resampling)法を用いる。
再標本化部133は、粒子i毎の粒子重み係数を、次式(16)を用いて規格化し、規格化粒子重み係数wi,k’を算出する。
再標本化部133は、算出した確率(規格化粒子重み係数wi,k’)で次回の粒子iを抽出する。ここで、再標本化部133は、抽出された各粒子の粒子重みは、各々等しい値(例えば、1/I)とし、抽出された各粒子の楽譜位置情報及び拍間隔情報は、対応する抽出前の粒子の楽譜位置情報及び拍間隔情報と同一とする。再標本化部133は、抽出した粒子毎の楽譜位置情報、拍間隔情報及び粒子重みを含む粒子情報を生成する。
再標本化部133は、これにより、粒子数Iよりも多い予め定めた数の粒子を抽出する。その後、再標本化部133は、増加した粒子数と同一の数だけ、粒子を棄却する。ここで、再標本化部133は、抽出前の粒子重みが小さい粒子ほど優先して、その粒子に基づいて抽出した粒子情報を棄却する。これにより、再標本化部133は、粒子数(粒子情報の数)を一定数Iに保つ。再標本化部133は、棄却されずに残った粒子の粒子情報を粒子遷移部132に出力する。
拍間隔重み算出部123は、粒子遷移部132から入力された粒子情報に含まれる拍間隔情報を粒子i毎に抽出する。拍間隔重み算出部123は、相関算出部104から入力された自己相関R(b,{Ak})又はR(b,{Ξk’})から抽出した拍間隔情報が表す拍間隔bi kに対応する値R(bi k,{Ak})又はR(bi k,{Ξk’})を拍間隔重み値wtm i,kと定める。拍間隔重み算出部123は、粒子i毎の拍間隔重み値wtm i,kを表す拍間隔重み情報を粒子重み算出部124に出力する。
本実施形態では、楽譜情報に基づく振幅周波数特性(例えば、楽譜スペクトログラム)が、既知の楽譜情報に含まれる楽譜位置毎の音階の基本周波数に基づく調波構造で表される成分を少なくとも1つ含むと仮定する。そこで、周波数特性重み算出部122は、観測値である音響信号に基づく振幅周波数特性(音響スペクトログラム)に対して尤度が最大となるように、調波構造毎の楽譜スペクトログラムへの寄与を表す変数の確率分布や、各調波構造に含まれる調波成分毎の当該調波構造への寄与を表す変数を変分パラメータとして算出する。周波数特性重み算出部122は、算出した変数が表す楽譜スペクトログラムが観測値として音響スペクトログラムが与えられているときの確率を算出し、算出した確率に基づいて周波数特性重み値wsp i,kを算出する。本実施形態では、上述の尤度が最大になるような周波数特性重み値wsp i,kを算出できればよいので、楽譜情報に基づく振幅周波数特性(楽譜スペクトログラム)を陽に合成しなくともよい。
LHA法は、入力された音響信号のスペクトログラムを観測値とし、この観測値を調波構造と成分として含み、調波構造の楽譜スペクトログラムに対する寄与を表す変数の確率分布、調波成分の調波構造への寄与を表す係数の確率分布として表す音源モデルである。調波構造は、基本周波数の成分と基本周波数の整数倍の周波数の成分(高調波)を調波成分として含む周波数特性を表す。従って、基本周波数、各次数の振幅(もしくは、基準値に対する比率)が、調波構造を表す変数に含まれる。
図6は、本実施形態に係る音源モデルの一例を表す概念図である。
図6の右上に示されるxnは、周波数を表す。xnを囲う二重円は、xnが観測変数であることを表す。znからxnに向かう矢印、μlからxnに向かう矢印及びΛlからxnに向かう矢印は、周波数xnの潜在変数(latent variable)zn、基本周波数μl及び精度(precision)Λlに対する尤度q(X|Z,{μ},{Λ})が仮定されていることを表す。X、Z、{μ}、{Λ}は、それぞれ変数xn、zn、μl、Λlの集合(セット)を表す。zn、Λlを囲う円は、zn、Λlがそれぞれ未知変数であることを示す。μlが円で囲まれていないことは、基本周波数μlが既知変数であることを表す。基本周波数μlは、楽譜情報の基本周波数ベクトルに含まれる各音階の基本周波数であるためである。
πdlからznに向かう矢印、θlmからznに向かう矢印、潜在変数znの確率πdl及び確率θlmに対する尤度q(Z|{π},{θ})が仮定されていることを表す。ここで、{π},{θ}は、それぞれ変数πdl、θlmの集合(セット)を表す。πdl、θlmを囲う円は、πdl、θlmがそれぞれ未知変数であることを示す。末端に示されている未知変数πdl、θlm、Λlに対して、それぞれ事前分布q({π})、q({θ})、q({Λ})が仮定されていることを表す。従って、LHA法では、確率分布q(X,Z,{π},{θ},{Λ})は、q(X|Z,{μ},{Λ})、q(X|Z,{μ},{Λ})、q({π})、q({θ})、q({Λ})の積で表される。
図7において、縦軸は確率を表し、横軸は周波数を表す。図7において、細い破線は調波構造lが、周波数μl,2μl,…,Mμlにおいて確率のピーク値θl1,θl2,…,θlMを有することを表す。一点破線は、ピーク値θl1,θl2,…,θlMを表す。周波数2μlを中心とする確率値の曲線(ガウス関数)を挟む2つの矢印の間隔は、精度Λlを表す。
図8の左上は、調波構造1を表すヒストグラムである。図8の左下は、調波構造lを現すヒストグラムである。図8の右側は、周波数xnの確率分布を表すヒストグラムである。これらのヒストグラムにおいて、縦軸は振幅を表し、横軸は周波数を表す。調波構造1の振幅は、周波数μ1、2μ1、3μ1、4μ1、5μ1、6μ1においてピークを有する。各ピーク値の大きさは、楽器の音色などに応じて異なる。調波構造lの振幅は、周波数μl、2μlにおいてピークを有する。図8に示す例では、周波数μlは周波数μ1よりも高く、周波数μlにおけるピーク値は、周波数μ1におけるピーク値よりも小さい。
調波構造1を表すヒストグラムの右側に表されているπd1は、調波構造1に対する確率を表す。調波構造lを表すヒストグラムの右側に表されているπdlは、調波構造lに対する確率を表す。図8の最左辺の上下に延びる括弧と「Ld個」の文字は、Ld個の調波構造lを確率πdlで重み付け加算して、図8の右側における周波数xnの確率分布を近似することを表す。
後述するように、例えば、式(19)で表される変分下限値(variational lower bound)L(q)が収束する変分パラメータを算出する。
そして、変分下限値L(q)を周波数特性重み値の対数値logwsp i,kとして算出する。変分下限値L(q)と変分事後分布q(Z,{π},{θ},{Λ})と確率分布q(Z,{π},{θ},{Λ}|X,pi k,{μ})の間のKL−divの和は、常に式(17)の右辺と一致するため、変分ベイズ法によりKL−divを最小化することで、式(17)の近似値として変分下限値L(q)を代用する。
変分ベイズ法では、変分パラメータの算出において式(20)、(21)に示す関係が仮定されている。これらの関係は、ともに変分事後分布q*({Z})、q*({π}、{θ}、{Λ})が最適であることを表す。
図9は、本実施形態に係る周波数特性重み算出部122の構成を表す概略図である。
周波数特性重み算出部122は、データ入力部1221、第1変分パラメータ算出部1222、第2変分パラメータ算出部1223、変分下限値算出部1224、収束判定部1225、及び重み算出部1226を含んで構成される。
データ入力部1221は、算出した量子化音響スペクトログラム[Af,t]から、粒子i毎の楽譜位置pi kに対応する時刻kΔTから楽譜位置pi k−bi kに対応する時刻までの区間の量子化音響スペクトログラム[Af,t]を抽出する。
データ入力部1221は、粒子i毎に抽出した区間の量子化音響スペクトログラム[Af,t]とセグメントd毎の基本周波数ベクトルμpを、第1変分パラメータ算出部1222、第2変分パラメータ算出部1223、及び変分下限値算出部1224に出力する。
第1変分パラメータ算出部1222は、入力されたパラメータを用いて、上述のVB−Eステップを実行する。即ち、第1変分パラメータ算出部1222は、例えば式(22)を用いて、d、n、l、m毎にパラメータρdnlmを算出する。
αd・は、αdlのlに対する総和Σlαdlである。β・lは、βdlのdに対する総和Σdβdlである。
次に、第1変分パラメータ算出部1222は、式(23)に基づいてd、n、l、m毎にパラメータρdnlmをパラメータρdn・・で除算して変分パラメータγdnlmを算出する。
変分パラメータγdnlmは、負担率とも呼ばれ、観測した周波数xnが調波構造lの第m高調波に対応するガウス分布の事後確率を表す。
なお、式(22)、(23)は、潜在変数{Z}の変分事後分布q*({Z})が、変分パラメータγdnlmのzdnlm乗の積からなる多項分布(式(24))に従うことを仮定して導出される。変分パラメータγdnlmのzdnlm乗の積は、変分パラメータγdnlmがzdnlm回発生する確率である。
第2変分パラメータ算出部1223は、入力されたパラメータを用いて、上述のVB−Mステップを実行する。ここで、第2変分パラメータ算出部1223は、例えば式(25)を用いて、d、l毎にパラメータα0lにパラメータγd・l・を加算して変分パラメータαdlを算出する。
第2変分パラメータ算出部1223は、例えば式(26)を用いて、l、m毎にパラメータβ0mにパラメータγ・・lmを加算して変分パラメータβlmを算出する。
第2変分パラメータ算出部1223は、例えば式(27)を用いて、l毎にパラメータa0にパラメータγ・・l・を加算して変分パラメータalを算出する。
第2変分パラメータ算出部1223は、例えば式(28)を用いて、変分パラメータblを算出する。
なお、式(25)は、未知変数{πd}の変分事後分布q*({π})が変分パラメータ{αd}に対するディリクレ分布の積(式(29))に従うことを仮定して導出される。
式(26)は、未知変数{θl}の変分事後分布q*({θ})が変分パラメータ{θl}に対するディリクレ分布の積(式(30))に従うことを仮定して導出される。
式(27)、(28)は、未知変数{Λ}の変分事後分布q*({Λ})が変分パラメータal、blに対するガンマ分布の積(式(31))に従うことを仮定して導出される。
第2変分パラメータ算出部1223は、算出した変分パラメータαdl、βlm、al、blと、第1変分パラメータ算出部1222から入力された変分パラメータγdnlmを変分下限値算出部1224に出力する。収束判定部1225から変分下限値L(q)が収束したことを表す変分下限値信号が入力されたとき、第2変分パラメータ算出部1223は、第1変分パラメータ算出部1222への変分パラメータαdl、βlm、al、blの出力を停止する。
式(32)において、q({θ})は、例えば、式(36)に示されるように変数{θl}のパラメータセット{β0}に対するディリクレ分布の積である。
式(32)において、q({Λ})は、例えば、式(37)に示されるように分散Λlのパラメータa0、b0に対するガンマ分布の積である。
変分下限値算出部1224は、入力された変分パラメータαdl、βlm、al、bl、γdnlmに基づいて、式(29)、(30)、(31)、(24)を用いて、変分事後分布q*({π})、q*({θ})、q*({Λ})、q*(Z)を算出する。変分下限値算出部1224は、算出したq*({π})、q*({θ})、q*({Λ})、q*(Z)の積をとり全未知変数についての変分事後分布q*(Z,π,θ,Λ)を算出する。
なお、変分事後分布q*({π})、q*({θ})、q*({Λ})、q*(Z)は、それぞれ式(29)、(30)、(31)、(24)で表され、確率分布q(X|Z,{μ},Λ)q(Z|{π},{θ})、q({π})、q({θ})、q({Λ})は、それぞれ式(33)、(34)、(35)、(36)、(37)で表される関数を仮定しているため、変分下限値算出部1224は、式(19)を用いて変分下限値L(q)を解析的に算出することができる。かかる仮定により、事前分布と変分分布の関数形は相似、即ち共役になる。
変分下限値算出部1224は、算出した粒子iの変分下限値L(q)を収束判定部1225に出力する。
収束判定部1225は、変分下限値L(q)が収束したと判断したとき、変分下限値L(q)が収束したことを表す変分下限値信号を第2変分パラメータ算出部1223に出力する。また、収束判定部1225は、粒子i毎の変分下限値L(q)を重み算出部1226に出力する。
図10は、本実施形態における周波数特性重み算出処理の一例を表すフローチャートである。
(ステップS301)データ入力部1221は、周波数特性分析部103から入力された音響スペクトログラムAf,tを予め定めた量子化幅ΔAで量子化して量子化音響スペクトログラム[Af,t]を算出する。
データ入力部1221は、粒子遷移部132から入力された粒子情報から粒子i毎に楽譜位置情報、拍間隔情報を抽出する。データ入力部1221は、楽譜情報入力部112から入力された楽譜情報から楽譜位置pi kから拍間隔bi k前の楽譜位置pi k−bi kまでの楽譜情報を抽出し、抽出した楽譜情報からセグメントd毎の基本周波数ベクトルμlを抽出する。
データ入力部1221は、粒子i毎に抽出した区間の量子化音響スペクトログラム[Af,t]とセグメントd毎の基本周波数ベクトルμpを、第1変分パラメータ算出部1222、第2変分パラメータ算出部1223、及び変分下限値算出部1224に出力する。その後、ステップS302に進む。
第1変分パラメータ算出部1222は、入力されたパラメータに基づいて、例えば式(22)を用いて、パラメータρdnlmを算出し、式(23)を用いて変分パラメータγdnlmを算出する。
第1変分パラメータ算出部1222は算出した変分パラメータγdnlmを第2変分パラメータ算出部1223に出力する。その後、ステップS303に進む。
変分下限値算出部1224は、算出した確率分布q(X,Z,{π},{θ},{Λ}|pi k,{μ})と変分事後分布q*(Z,π,θ,Λ)を、例えば式(19)を用いて粒子i毎の変分下限値L(q)を算出する
変分下限値算出部1224は、算出した粒子iの変分下限値L(q)を収束判定部1225に出力する。その後、ステップS305に進む。
変分下限値L(q)が収束していないと判断したとき(ステップS305 N)、ステップS302に進む。
また、本実施形態では、第2の周波数特性は少なくとも1つの調波構造を含み、調波構造に含まれる調波成分毎の調波構造への寄与を表す変数の確率分布と、調波構造毎の第2の周波数特性への寄与を表す変数の確率分布に基づいて第1の周波数特性についての尤度を最大にするように、重み値を算出する。そのため、楽譜情報に基づく第2の周波数成分に含まれる調波構造の周波数特性の変化、調波構造間の結合特性の変化に柔軟に対応できるので、音響信号に基づく第1の周波数特性との関連性をより的確に推定することができる。そのため、演奏された音楽に対する楽譜の位置をより正確に推定することが可能になる。
次に、本発明の第2の実施形態について説明する。第1の実施形態と同一の構成又は処理については、同一の番号を付す。以下、第1の実施形態との差異点を主として説明する。
図11は、本実施形態に係る楽譜位置推定装置2の構成を示す概略図である。
楽譜位置推定装置2は、楽譜位置推定装置1(図1)と同様に、音響信号入力部101、音響特徴量生成部102、楽譜情報記憶部111、楽譜情報入力部112、関連度算出部121、楽譜位置探索部131、及び演奏情報出力部141を含んで構成される。但し、関連度算出部121は、周波数特性重み算出部222、拍間隔重み算出部123、及び粒子重み算出部124を含んで構成される。即ち、楽譜位置推定装置2は、周波数特性重み算出部122の代わりに周波数特性重み算出部222を備える点で、楽譜位置推定装置1と異なる。
図12は、本実施形態に係る周波数特性重み算出部222の構成を表す概略図である。
周波数特性重み算出部122は、周波数特性量子化部2221、周波数特性合成部2222、振幅期待値算出部2223、振幅分布算出部2224及び重み算出部2225を含んで構成される。
周波数特性合成部2222は、例えば式(38)を用いて楽譜スペクトログラムA^f,pを生成する。
周波数特性合成部2222は、生成した楽譜スペクトログラムA^f,pを振幅期待値算出部2223に出力する。
振幅期待値算出部2223は、入力された粒子情報から粒子i毎に楽譜位置情報pi kを抽出する。振幅期待値算出部2223は、抽出した楽譜位置pi kを基準(例えば、楽譜位置pi kに対応する時刻τがkΔT)とした対応する時刻τ毎に、量子化音響スペクトログラム[Af,τ]の周波数fにわたった総和A・τを算出する。
振幅期待値算出部2223は、入力された楽譜スペクトログラムA^f,pを、対応する楽譜位置pに対応する時刻τ毎に算出した総和A・τを乗算して振幅期待値λf,τを算出する。振幅期待値算出部2223は、算出した振幅期待値λf,τを振幅分布算出部2224に出力する。
振幅分布算出部2224は、入力された粒子i毎の粒子情報に基づき楽譜位置pi kを基準とした対応する時刻τ及び周波数f毎に、振幅期待値λf,τの量子化音響スペクトログラム[Af,τ]に対するポアソン分布の関数値Poi([Af,τ]|λf,τ)を算出する。ポアソン分布は、式(40)で表される確率密度関数である。
算出した関数値は、ポアソン分布の性質により、周波数fにおける量子化音響スペクトログラム[Af,τ]の量子化した振幅が表す度数に対する楽譜スペクトログラムA^f,p(τ)に含まれる振幅の分布関数の値を表す。即ち、算出した関数値は、周波数fにおける楽譜スペクトログラムA^f,pの振幅が表す度数が、量子化音響スペクトログラム[Af,τ]の量子化した振幅が表す度数だけ発生する確率値を表す。
振幅分布算出部2224は、算出した振幅分布値を重み算出部2225に出力する。
図13は、本実施形態における周波数特性重み算出処理を表すフローチャートである。
(ステップS401)周波数特性量子化部2221は、周波数特性分析部103から入力された音響スペクトログラムAf,tを予め定めた量子化幅ΔAで量子化して量子化音響スペクトログラム[Af,t]を算出する。周波数特性量子化部2221は、算出した量子化音響スペクトログラム[Af,t]を振幅期待値算出部2223及び振幅分布算出部2224に出力する。その後、ステップS402に進む。
周波数特性合成部2222は、生成した楽譜スペクトログラムA^f,pを振幅期待値算出部2223に出力する。その後、ステップS403に進む。
振幅分布算出部2224は、粒子遷移部132から入力された粒子i毎の粒子情報に含まれる楽譜位置情報を抽出する。振幅分布算出部2224は、抽出した楽譜位置情報が表す楽譜位置pi kを基準とした対応する時刻τ及び周波数f毎に、振幅期待値λf,τの量子化音響スペクトログラム[Af,τ]に対するポアソン分布Poi([Af,τ]|λf,τ)の関数値を振幅分布値として算出する。
振幅分布算出部2224は、算出した振幅分布値を重み算出部2225に出力する。その後、ステップS405に進む。
これにより、音響信号に基づく第1の周波数特性の周波数毎の振幅と楽譜情報における音階に基づく第2の周波数特性の周波数毎の振幅が合致する度合いを鋭敏に検出することができる。そのため、演奏された音楽に対する楽譜の位置をより正確に推定することが可能になる。
次に、本発明の第3の実施形態について説明する。第1の実施形態と同一の構成又は処理については、同一の番号を付す。以下、第1の実施形態との差異点を主として説明する。
図14は、本実施形態に係る楽譜位置推定装置3の構成を示す概略図である。
楽譜位置推定装置3は、楽譜位置推定装置1(図1)と同様に、音響信号入力部101、音響特徴量生成部102、楽譜情報記憶部111、楽譜情報入力部112、関連度算出部121、楽譜位置探索部131、及び演奏情報出力部141を含んで構成される。
但し、音響特徴量生成部102は、周波数特性分析部103及び相関算出部104の他にクロマベクトル生成部305を備える点が楽譜位置推定装置1とは異なる。周波数特性分析部103は、算出した音響スペクトログラムAf,tをクロマベクトル生成部305に出力する。
クロマベクトル生成部305は、音響クロマベクトルct a=[ct,1 a,ct,2 a,…,ct,12 a]の音階j毎の要素ct,j aを、例えば、式(42)を用いて算出する。
クロマベクトル生成部305は、生成した音響クロマベクトルct aを、後述するクロマベクトル重み算出部325に出力する。
楽譜情報入力部112は、楽譜情報記憶部111から読み出した楽譜情報に含まれる楽譜クロマベクトルcp sをクロマベクトル重み算出部325に出力する。
なお、粒子遷移部132は、粒子i毎の粒子情報をクロマベクトル重み算出部325に出力する。粒子遷移部132は、粒子i毎の粒子分布値、状態遷移確率を粒子重み算出部324に出力する。
クロマベクトル重み算出部325は、粒子遷移部132から入力された粒子情報から粒子i毎に楽譜位置情報pi kを抽出する。クロマベクトル重み算出部325は、要素値を規格化した音響クロマベクトルcτ aと楽譜クロマベクトルcp(τ)’ sとの内積を、例えば式(45)を用いて平均して、粒子i毎のクロマベクトル重みwi,k chを算出する。内積は、ベクトル間の類似性を表す指標値である。
クロマベクトル重み算出部325は、算出した粒子i毎のクロマベクトル重みwi,k chを表すクロマベクトル重み情報を粒子重み算出部324に出力する。
粒子重み算出部324は、式(46)に示すように、周波数特性重み情報が表す周波数特性重み値、拍間隔重み情報が表す拍間隔重み値、クロマベクトル重み情報が表すクロマベクトル重み値、状態遷移確率を乗算し、さらに状態遷移確率で除算して、粒子i毎の重み値wi,kを算出する。
粒子重み算出部324は、粒子遷移部132から入力された粒子i毎の粒子情報に含まれる粒子重み情報を、生成した粒子重み情報に置き換えることで粒子情報を更新する。
粒子重み算出部324は、更新した粒子情報を再標本化部133、楽譜位置算出部142及び拍間隔算出部143に出力する。
なお、本実施形態に係る楽譜位置推定装置3は、周波数特性重み算出部122の代わりに周波数特性重み算出部222を備えてもよい。
図15は、本実施形態に係る楽譜位置推定処理を表すフローチャートである。
図15が示す楽譜位置推定処理は、ステップS101、S102−S105、S106、S107、S109−S117を有する点で、図3が示す楽譜位置推定処理と共通する。但し、ステップS101とステップS102の間でステップS401を実行し、ステップS105とステップS106の間でステップS402を実行し、ステップS108の代わりにステップS403、S404を実行する点が、図3が示す楽譜位置推定処理とは異なる。以下、処理が異なるステップについて説明する。
クロマベクトル生成部305は、生成した音響クロマベクトルct aをクロマベクトル重み算出部325に出力する。その後、ステップS106に進む。
クロマベクトル重み算出部325は、粒子遷移部132から入力された粒子情報から粒子i毎に楽譜位置情報を抽出する。クロマベクトル重み算出部325は、要素値を規格化した音響クロマベクトルcτ aと楽譜クロマベクトルcp(τ) sとの内積を、例えば式(45)を用いて抽出した楽譜位置情報が表す楽譜位置を基準とした観測区間Tkで平均する。これにより、クロマベクトル重み算出部325は、粒子i毎のクロマベクトル重みwi,k chを算出する。クロマベクトル重み算出部325は、算出した粒子i毎のクロマベクトル重みwi,k chを表すクロマベクトル重み情報を粒子重み算出部124に出力する。その後、ステップS404に進む。
粒子重み算出部324は、周波数特性重み情報が表す周波数特性重み値、拍間隔重み情報が表す拍間隔重み値、クロマベクトル重み情報が表すクロマベクトル重み値、状態遷移確率を乗算し、さらに状態遷移確率で除算して、粒子i毎の重み値wi,kを算出する。
粒子重み算出部324は、算出した重み値wi,kを表す粒子重み情報を生成する。
粒子重み算出部324は、粒子遷移部132から入力された粒子i毎の粒子情報に含まれる粒子重み情報を、生成した粒子重み情報に置き換えることで粒子情報を更新する。
粒子重み算出部324は、更新した粒子情報を楽譜位置探索部131の再標本化部133、演奏情報出力部141の楽譜位置算出部142及び拍間隔算出部143に出力する。その後、ステップS109に進む。以下、図3に示す楽譜位置推定処理と同様にステップS110−117を実行する。
なお、本実施形態に係る楽譜位置推定処理では、ステップS106において周波数特性重み算出部122が図10に示す周波数特性重み算出処理を実行する代わりに、周波数特性重み算出部222が図13に示す周波数特性重み算出処理を実行してもよい。
図16において、縦軸は、推定誤差、横軸は、楽曲の番号を表す。図15において、○印は、本実施形態による平均推定誤差、×印は、従来の楽譜位置推定システムであるAntescofoによる平均推定誤差を表す(例えば、Cont.A.:A Coupled Duration−Focused Architecture for Realtime Music to Score Alignment,IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.32,No.6,pp.974−987(2010))。Antescofoは、HSMM(Hidden Semi−Markov Model;隠れセミマルコフモデル)に基づいて楽譜位置を推定する処理を行う。○印、×印を中心として上下に延びるバーの上限と下限は、それぞれ平均推定誤差から標準偏差だけ大きい推定誤差と、平均推定誤差から標準偏差だけ小さい推定誤差を表す。即ち、バーは、推定誤差の信頼区間を表す。楽曲1−20は、各々テンポ及び演奏する楽器が異なる楽曲である。推定誤差は、式(11)を用いて算出した値である。
図17において、横軸と縦軸の関係は、図16と同様である。図17において、○印、×印、△印は、テンポ窓長60/bθが、それぞれ5、15、30(bpm)である場合の平均推定誤差を表す。○印、×印、△印を中心として上下に延びるバーは、平均推定誤差を中心とし、その長さが標準偏差の2倍である信頼区間を表す。
図17によれば、ほとんどの楽曲について、テンポ窓長が小さくなるほど平均推定誤差の絶対値が小さくなり、標準偏差も小さくなる傾向がある。即ち、テンポ窓長が小さいほど楽譜位置の推定精度が優れ、楽譜位置を安定して推定できることが示されている。
図18において、縦軸は、推定誤差の絶対値を表し、横軸は、楽曲の番号を表す。棒グラフは、推定処理又はシステム毎の平均推定誤差を表す。最も右側の網掛けの棒グラフは、第1の実施形態においてLHA法を用いて周波数特性重み値wi,k spを算出する処理を表す。右から2番目の縦縞で塗りつぶした棒グラフは、第2の実施形態においてPDAを用いて周波数特性重み値wi,k spを算出する処理を表す。左から2番目の横縞で塗りつぶした棒グラフは、第2の実施形態の構成においてPDAの代わりにカルバック・ライブラー情報量(KL−div)を用いて周波数特性重み値wi,k spを算出する処理を表す。最も左側の斜めの縞模様で塗りつぶした棒グラフは、Antescofoが採用するHSMMを表す。また、各棒グラフの頂上から上に伸びるエラーバーの長さは、標準偏差を表す。
図18によれば、楽曲1−10のいずれにおいても、LHA、PDA、KL−div、HSMMの順で、平均推定誤差、標準偏差が、ともに小さくなる。即ち、この順序で、楽譜位置の推定精度が優れ、安定して楽譜位置を推定できることが示される。
図19において、縦軸は対数尤度を、横軸は楽譜位置偏差を表す。図19が表す対数尤度は、ある区間の楽譜情報と、ある観測区間の音響信号との間の周波数特性重み値wi,k spの対数値に相当する値である。即ち、対数尤度は、音響信号と楽譜情報との関連性を表す指標値である。但し、図19に示す対数尤度は、計算精度を確保するために規格化されていない値である。楽譜位置偏差とは、楽譜情報の区間と対応する観測区間を基準とした、音響信号の観測区間のずれを、拍単位で表す値である。一点破線は、第1の実施形態においてLHA法を用いて周波数特性重み値wi,k spを算出する処理を表す。破線は、第2の実施形態においてPDAを用いて周波数特性重み値wi,k spを算出する処理を表す。実線は、KL−divを用いて周波数特性重み値wi,k spを算出する処理を表す。
表示形態が異なる3本の太線は、各々楽譜位置偏差毎の対数尤度を表し、3本の細線は、各々対数尤度の最大値を表す。いずれも、楽譜位置偏差が0の場合、対数尤度が最大になる。即ち、楽譜位置偏差が0とは、楽譜位置と音響信号の時刻の対応が取れている点であることを表す。
これにより、音響信号に基づく第1の周波数特性と、楽譜情報における音階に基づく第2の周波数特性が完全に合致していなくとも、両者の関連性を検出することができる。そのため、演奏された音楽に対する楽譜の位置をより頑健に推定することが可能になる。
これにより、楽譜情報における音階が変化する楽譜の位置と、音響信号の振幅が変化する時刻が対応付けられる。そのため、周波数特性の周期性を表す拍間隔を正確に検知でき、ひいては演奏された音楽に対する楽譜の位置をより正確に推定することができる。
また、上述した実施形態における楽譜位置推定装置1、2又は3の一部、または全部を、LSI(Large Scale Integration)等の集積回路として実現しても良い。楽譜位置推定装置1又は2の各機能ブロックは個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化しても良い。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現しても良い。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いても良い。
103…周波数特性分析部、104…相関算出部、305…クロマベクトル生成部
111…楽譜情報記憶部、112…楽譜情報入力部、
121…関連度算出部、122、222…周波数特性重み算出部、
1221…データ入力部、1222…第1変分パラメータ算出部、
1223…第2変分パラメータ算出部、1224…変分下限値算出部、
1225…収束判定部、1226…重み算出部、
2221…周波数特性量子化部、2222…周波数特性合成部、
2223…振幅期待値算出部、2224…振幅分布算出部、2225…重み算出部、
123…拍間隔重み算出部、124、324…粒子重み算出部、
325…クロマベクトル重み算出部
131…楽譜位置探索部、132…粒子遷移部、133…再標本化部、
141…演奏情報出力部、142…楽譜位置算出部、143…拍間隔算出部、
144…信頼度判定部、145…楽譜位置出力部、146…拍間隔出力部
Claims (5)
- 入力された音響信号の周波数特性を分析して第1の周波数特性を算出する周波数特性分析部と、
楽譜情報が表す楽譜の位置毎の音階に基づく周波数特性であって少なくとも1つの調波構造を含む第2の周波数特性と前記第1の周波数特性の関連度を表す重み値を、前記調波構造に含まれる調波成分毎の前記調波構造への寄与を表す変数の確率分布と、前記調波構造毎の前記第2の周波数特性への寄与を表す変数の確率分布に基づいて前記第1の周波数特性についての尤度を最大にするように、前記楽譜の位置毎に算出する関連度算出部と、
前記重み値に基づいて前記音響信号に対応する楽譜の位置を探索する楽譜位置探索部と、
を備えることを特徴とする楽譜位置推定装置。 - 入力された音響信号の周波数特性を分析して第1の周波数特性を算出する周波数特性分析部と、
楽譜情報が表す楽譜の位置毎の音階に基づく第2の周波数特性と前記第1の周波数特性の関連度を表す重み値を、前記第2の周波数特性に含まれる周波数毎の振幅が表す度数が、対応する周波数における前記第1の周波数特性の振幅が表す度数だけ発生する確率分布に基づいて前記楽譜の位置毎に算出する関連度算出部と、
前記重み値に基づいて前記音響信号に対応する楽譜の位置を探索する楽譜位置探索部と、
を備えることを特徴とする楽譜位置推定装置。 - 前記楽譜位置探索部は、
前記音階が変化する楽譜の位置に対応する時刻を含む観測区間における前記音響信号の自己相関に基づいて拍間隔を定め、定めた拍間隔に基づいて探索する楽譜の位置を更新することを特徴とする請求項1または請求項2に記載の楽譜位置推定装置。 - 楽譜位置推定装置における方法であって、
前記楽譜位置推定装置は、入力された音響信号の周波数特性を分析して第1の周波数特性を算出する過程と、
前記楽譜位置推定装置は、楽譜情報が表す楽譜の位置毎の音階に基づく周波数特性であって少なくとも1つの調波構造を含む第2の周波数特性と前記第1の周波数特性の関連度を表す重み値を、前記調波構造に含まれる調波成分毎の前記調波構造への寄与を表す変数の確率分布と、前記調波構造毎の前記第2の周波数特性への寄与を表す変数の確率分布に基づいて前記第1の周波数特性についての尤度を最大にするように、前記楽譜の位置毎に算出する過程と、
前記楽譜位置推定装置は、前記重み値に基づいて前記音響信号に対応する楽譜の位置を探索する過程と、
を有することを特徴とする楽譜位置推定方法。 - 楽譜位置推定装置における方法であって、
前記楽譜位置推定装置は、入力された音響信号の周波数特性を分析して第1の周波数特性を算出する過程と、
前記楽譜位置推定装置は、楽譜情報が表す楽譜の位置毎の音階に基づく第2の周波数特性と前記第1の周波数特性の関連度を表す重み値を、前記第2の周波数特性に含まれる周波数毎の振幅が表す度数が、対応する周波数における前記第1の周波数特性の振幅が表す度数だけ発生する確率分布に基づいて前記楽譜の位置毎に算出する過程と、
前記楽譜位置推定装置は、前記重み値に基づいて前記音響信号に対応する楽譜の位置を探索する過程と、
を有することを特徴とする楽譜位置推定方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161442499P | 2011-02-14 | 2011-02-14 | |
US61/442,499 | 2011-02-14 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012168538A JP2012168538A (ja) | 2012-09-06 |
JP5924968B2 true JP5924968B2 (ja) | 2016-05-25 |
Family
ID=46972690
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012029802A Expired - Fee Related JP5924968B2 (ja) | 2011-02-14 | 2012-02-14 | 楽譜位置推定装置、及び楽譜位置推定方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5924968B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6286933B2 (ja) * | 2013-08-21 | 2018-03-07 | カシオ計算機株式会社 | 小節間隔推定およびその推定のための特徴量抽出を行う装置、方法、およびプログラム |
WO2018016636A1 (ja) | 2016-07-22 | 2018-01-25 | ヤマハ株式会社 | タイミング予想方法、及び、タイミング予想装置 |
JP6838357B2 (ja) * | 2016-11-07 | 2021-03-03 | ヤマハ株式会社 | 音響解析方法および音響解析装置 |
JPWO2022202297A1 (ja) * | 2021-03-23 | 2022-09-29 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2636685B2 (ja) * | 1993-07-22 | 1997-07-30 | 日本電気株式会社 | 音楽イベントインデックス作成装置 |
KR100412196B1 (ko) * | 2001-05-21 | 2003-12-24 | 어뮤즈텍(주) | 악보 추적 방법 및 그 장치 |
JP4672613B2 (ja) * | 2006-08-09 | 2011-04-20 | 株式会社河合楽器製作所 | テンポ検出装置及びテンポ検出用コンピュータプログラム |
-
2012
- 2012-02-14 JP JP2012029802A patent/JP5924968B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012168538A (ja) | 2012-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8440901B2 (en) | Musical score position estimating apparatus, musical score position estimating method, and musical score position estimating program | |
US6124544A (en) | Electronic music system for detecting pitch | |
JP4660739B2 (ja) | 音分析装置およびプログラム | |
JP4465626B2 (ja) | 情報処理装置および方法、並びにプログラム | |
US7035742B2 (en) | Apparatus and method for characterizing an information signal | |
KR20140079369A (ko) | 사운드 신호를 주파수 처프 도메인으로 변환하는 것을 포함하는 사운드 신호 프로세싱 시스템 및 방법 | |
US20010045153A1 (en) | Apparatus for detecting the fundamental frequencies present in polyphonic music | |
JP5127982B2 (ja) | 音楽検索装置 | |
CN111680187A (zh) | 乐谱跟随路径的确定方法、装置、电子设备及存储介质 | |
JP2010054802A (ja) | 音楽音響信号からの単位リズムパターン抽出法、該方法を用いた楽曲構造の推定法、及び、音楽音響信号中の打楽器パターンの置換法 | |
JP5924968B2 (ja) | 楽譜位置推定装置、及び楽譜位置推定方法 | |
CN107210029B (zh) | 用于处理一连串信号以进行复调音符辨识的方法和装置 | |
JP2017161574A (ja) | 音信号処理方法および音信号処理装置 | |
JP2012506061A (ja) | デジタル音楽音響信号の分析方法 | |
Cogliati et al. | Piano music transcription modeling note temporal evolution | |
JP2012027196A (ja) | 信号分析装置、方法、及びプログラム | |
CN113066512B (zh) | 佛教音乐识别方法、装置、设备及存储介质 | |
JPH0675562A (ja) | 自動採譜装置 | |
KR20060081500A (ko) | 음악에서의 비브라토 자동 검출방법 | |
JP2017161572A (ja) | 音信号処理方法および音信号処理装置 | |
Szeto et al. | Source separation and analysis of piano music signals using instrument-specific sinusoidal model | |
JP3892379B2 (ja) | 調波構造区間推定方法及び装置、調波構造区間推定プログラム及びそのプログラムを記録した記録媒体、調波構造区間推定の閾値決定方法及び装置、調波構造区間推定の閾値決定プログラム及びそのプログラムを記録した記録媒体 | |
Pishdadian et al. | On the transcription of monophonic melodies in an instance-based pitch classification scenario | |
JP4625934B2 (ja) | 音分析装置およびプログラム | |
JP4625935B2 (ja) | 音分析装置およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141127 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150723 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150818 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151008 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160405 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160419 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5924968 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |