JP7072165B2 - モード分解装置、モード分解方法、プログラム - Google Patents

モード分解装置、モード分解方法、プログラム Download PDF

Info

Publication number
JP7072165B2
JP7072165B2 JP2018043193A JP2018043193A JP7072165B2 JP 7072165 B2 JP7072165 B2 JP 7072165B2 JP 2018043193 A JP2018043193 A JP 2018043193A JP 2018043193 A JP2018043193 A JP 2018043193A JP 7072165 B2 JP7072165 B2 JP 7072165B2
Authority
JP
Japan
Prior art keywords
mode
weight
frequency
index
tone signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018043193A
Other languages
English (en)
Other versions
JP2019159018A (ja
Inventor
靖広 及川
浩平 矢田部
翼 草野
義紀 升山
雄介 宮城
健 高橋
耕史 大石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Waseda University
Korg Inc
Original Assignee
Waseda University
Korg Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Waseda University, Korg Inc filed Critical Waseda University
Priority to JP2018043193A priority Critical patent/JP7072165B2/ja
Publication of JP2019159018A publication Critical patent/JP2019159018A/ja
Application granted granted Critical
Publication of JP7072165B2 publication Critical patent/JP7072165B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Auxiliary Devices For Music (AREA)

Description

特許法第30条第2項適用 (1) 発行日 平成29年9月11日 刊行物 「日本音響学会 2017年秋季研究発表会 講演論文集821頁~822頁」 発行者名 一般社団法人 日本音響学会 (2) 開催日 平成29年10月22日 集会名 「音楽音響研究会」 開催場所 アクトシティ浜松コングレスセンター 開催者名 一般社団法人 日本音響学会 音楽音響研究委員会
本発明は楽音信号を複数のモードに分解するモード分解装置、モード分解方法、プログラムに関する。
楽器音のモードの減衰特性は楽器の種類や音の高さ、強さによって異なり、音色に大きな影響を与える。そこで、楽器音に対してモードの減衰特性の解析が盛んに行われている(非特許文献1)。特に打楽器や撥弦楽器の各モードの減衰特性において、発音時の挙動は重要である。
T. Cheng, S. Dixon and M. Mauch, "Modelling the decay of piano sounds," Int. Conf. Acoust., Speech Signal Process. (ICASSP), pp. 594{598, Apr. 2015.
しかし、発音時に非調波成分が存在するため、各モードの発音時の挙動の解析は容易ではない。楽器音sをN個の中心周波数fi(i=1,...,N)の狭帯域なモードmiと非調波成分等の残差rに分解することを考える。このようなモード分解では一般にバンドパスフィルタが用いられる。しかし、フィルタの特性により各モードの振幅包絡が変化する他に、位相遅延やプリリンギングが発生する。因果的なフィルタを用いると、各モードに位相遅延が発生し、モードmi及び残差rの足し合わせと元の楽器音sが一致する完全再構成性が満たされない。一方、位相遅延のないフィルタを用いるとプリリンギングが発生し、因果性が満たされない。バンドパスフィルタ以外の手法として、短時間フーリエ変換(STFT, Short-Time Fourier Transform)や経験的モード分解(EMD, Empirical Mode Decomposition)を用いる手法も提案されているが、下表にまとめる通り、上記の課題をすべて解決するモード分解にはなっていない。
Figure 0007072165000001
そこで本発明では、振幅包絡が変化せず、因果性と完全再構成性を充たすモード分解ができるモード分解装置を提供することを目的とする。
本発明のモード分解装置は、楽音信号を各モードに分解するフィルタの振幅応答の逆特性と各モードの周波数成分のアダマール積と、楽音信号の周波数成分に関する最小二乗問題であって、完全再構成性と因果性を充たすことを制約とした制約付き最小二乗問題を解くことにより、楽音信号を各モードに分解する。
本発明のモード分解装置によれば、振幅包絡が変化せず、因果性と完全再構成性を充たすモード分解ができる。
実施例1のモード分解装置の構成を示すブロック図。 実施例1のモード分解装置の動作を示すフローチャート。 設計した共振フィルタ|h5|の振幅応答(上段左)、第1重みw5 (1)(上段右)、第2重みw5 (2)と残差重みwr(下段左)、第3重みw5(下段右)を示す図。 フィルタと提案手法によるモード分解の結果を示す図。 実施例2のモード分解装置の構成を示すブロック図。 実施例2のモード分解装置の動作を示すフローチャート。 実施例3のモード分解装置の構成を示すブロック図。 実施例3のモード分解装置の動作を示すフローチャート。
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
<理論>
以下、実施例1のモード分解装置1の基礎となる理論を説明する。因果的な線形フィルタを用いると、位相遅延が起こる。一方。このフィルタと同じ振幅応答|hi|を持つ位相遅延のないフィルタを考えると、フィルタ処理は
Figure 0007072165000002
と表せるが、プリリンギングが発生する。ただし、F,F-1,○はそれぞれ離散フーリエ変換、逆離散フーリエ変換、アダマール積を表す。そこで、式(1)で示したフィルタ処理を最小二乗法を用いて再定式化することで、フィルタ処理を拡張する。フィルタの振幅応答|hi|に逆特性|hi|-1が存在する時、式(1)を変形すると
Figure 0007072165000003
となる。式(2)を最小二乗問題に置き換えると
Figure 0007072165000004
と表せる。この問題の解は式(1)と一致するため、フィルタ処理は最小二乗問題の解として解釈できる。このように、最小二乗問題として定式化することで、制約や他のコスト関数の導入が可能である。
最小二乗問題(式(3))は各モードごとのフィルタ処理に対応し、完全再構成性、因果性は考慮されていない。そこで、これらを制約として、フィルタ処理に対応する最小二乗問題を解くことで、上記の性質を満たしたモード分解を実現する。すなわち、以下の制約付き最小二乗問題
Figure 0007072165000005
を解くことで、楽器音sをN個のモードxi及び残差rへ分解する。ただし、nは時間サンプルを、τは楽器の発音時刻に対応するサンプルを表す。また、λは残差の大きさを調整するパラメータである。この問題は凸なので、適当な凸最適化アルゴリズムで解くことができる。式(4)では、全てのモード及び残差を同時に扱い、下段左式の制約を導入することで、完全再構成性を考慮することができる。また、下段右式の制約は各モードxiの因果性を表す。これにより、得られた各モードxi及び残差rが上記の性質を同時に満たすモード分解が可能である。式(4)上段のコスト関数における周波数領域での重みwiを|hi|-1の拡張として考えると、コスト関数の最小化はフィルタ処理の一般化に対応する。
式(4)における重みwiは各モードxiが所望の周波数特性を持つように任意に作成することができる。楽器音のモード分解を考えるため、各モードxiが狭帯域かつ他のモードの成分の混入が少ない信号にする重みwiを作成する。ARモデルを用いて楽器音sを近似し、極の情報から共振周波数fiの共振フィルタを設計した。共振フィルタの振幅応答を|hi|とし、楽器音sのスペクトルのピークでモードmiに対応するピークの大きさをgiとする。これらの情報を利用し、各モードxiを中心周波数fiの狭帯域な信号にする第1の重みwi (1)と、他のモードの混入を防ぐ第2の重みwi (2)を作成する。これら2つの重みのアダマール積wi (1) wi (2)を式(4)の重みwi(第3の重み)とした(詳細は実施例1において後述)。
<理論に基づく本発明の装置の一般的表現>
すなわち、以下の実施例に記載するモード分解装置1は、楽音信号sを各モードm1,...,mN(あるいはx1,...,xN)に分解するフィルタの振幅応答|hi|の逆特性|hi|-1(第3の重みwiとして拡張)と各モードm1,...,mN(あるいはx1,...,xN)の周波数成分F(mi)(あるいはF(xi))のアダマール積と、楽音信号sの周波数成分F(s)に関する最小二乗問題であって、完全再構成性((4)下段左式)と因果性((4)下段右式)を充たすことを制約とした制約付き最小二乗問題を解くことにより、楽音信号を各モードに分解する装置であるといえる。
<モード分解装置1>
以下、図1を参照して実施例1のモード分解装置1の構成を説明する。同図に示すように、本実施例のモード分解装置1は、極取り出し部11と、第1重み推定部12と、第2重み推定部13と、残差重み推定部14と、モード分解部15を含む構成である。
以下、図2を参照して各部の動作について説明する。まず、極取り出し部11は、楽音信号sまたはその近似音から極を取り出す(S11)。
第1重み推定部12は、iを楽音信号sの各モードのインデックスとし、極の情報に基づいて定まるi番目の共振周波数fiの共振フィルタの振幅応答|hi|に基づいて、i番目の第1の重みwi (1)を推定する動作を各モードについて繰り返し実行する(S12)。具体的には、第1重み推定部12は、kをインデックスを表すものとし、ξ[k]をインデックスkに対応する周波数とし、μを上限を表すパラメータとし、i番目の第1の重みwi (1)[k]を、
Figure 0007072165000006
と推定する(S12)。
第2重み推定部13は、jをj≠iを満たす楽音信号sのモードのインデックスとし、j番目の共振周波数fjの共振フィルタの振幅応答|hj|に基づいて、i番目の第2の重みwi (2)を推定する動作を各モードについて繰り返し実行する(S13)。具体的には、第2重み推定部13は、kをインデックスを表すものとし、ξ[k]をインデックスkに対応する周波数とし、gjをj番目のモードxjに対応するピークの大きさとし、i番目の第2の重みwi (2)[k]を
Figure 0007072165000007
と推定する(S13)。
残差重み推定部14は、残差rに対する重みである残差重みwrを推定する(S14)。具体的には、残差重み推定部14は、kをインデックスを表すものとし、ξ[k]をインデックスkに対応する周波数とし、gjをj番目のモードxjに対応するピークの大きさとし、残差重みwr[k]を
Figure 0007072165000008
と推定する(S14)。
モード分解部15は、i番目の第1の重みwi (1)とi番目の第2の重みwi (2)のアダマール積であるi番目の第3の重みwiと、i番目のモードxiの周波数成分F(xi)と、楽音信号sの周波数成分F(s)と、パラメータλと、残差重みwrと、残差rの周波数成分F(r)に関する最小二乗問題
Figure 0007072165000009
の解を、完全再構成性と因果性を充たすこと、すなわち
Figure 0007072165000010
を制約として求めることにより、楽音信号sを各モードx1,...,xNに分解する(S15)。
<実験>
一例として、The University of Iowa Musical Instrument Samples (MIS)(参考非特許文献1)のbellsC5stereobrassを提案手法により解析した。ARモデルの次数を300とし、楽器音sの近似にはBurg法(参考非特許文献2)を用いた。また、重みwi (1)のパラメータをμ=10-3とした。制約付き最小二乗問題(式(4))は、λ=3×10-3とし、Over-relaxation Monotone Fast Iterative Shrinkage-Thresholding Algorithm (OMFISTA)(参考非特許文献3)により解いた。第5モードに対応する共振フィルタの振幅応答|h5|,第1重みw5 (1),第2重みw5 (2),第3重みwi,残差重みwrを図3に示す。
提案手法で得られた各モード及び残差の波形x1,x2,x3,x4,rと、式(1)で表される位相遅延のない共振フィルタを用いた場合の各モード及び残差の波形を図4に示す。共振フィルタでは,フィルタの特性により各モードの音の立ち上がりが鈍くなり、プリリンギングも発生している。一方、提案手法ではプリリンギングが発生せず、残差が発音時の非調波成分に集中している。また、OMFISTAを用いることで式(4)下段の制約は常に満たされるため、完全再構成性も必ず満たされる。
(参考非特許文献1:Electronic Music Studios School of Music University of Iowa,"the University of Iowa Electronic Music Studios," Samples, http://theremin.music.uiowa.edu/MIS.html)
(参考非特許文献2:S. Kay, Modern spectral estimation: Theory and application, Prentice Hall, New Jersey, 1988.)
(参考非特許文献3:M. Yamagishi and I. Yamada, "Over-relaxation of the fast iterative shrinkage-thresholding algorithm with variable stepsize" IOP Sci. Inv. Probl., vol.27, no. 10, p. 105008, Sep. 2011.)
<理論>
以下、実施例2のモード分解装置2の基礎となる理論を説明する。最小二乗問題(式(3))は各モードごとの線形なフィルタ処理に対応しているが、完全再構成性、因果性は必ずしも考慮されていない。そこで、完全再構成性及び因果性を制約とした上で、フィルタ処理に対応する最小二乗問題を解くことで、プリリンギングが発生せず位相遅延のないモード分解を実現した。
すなわち、以下の制約付き最小二乗問題
Figure 0007072165000011
を解くことで、楽器音sをN個のモードxiへ分解する。実施例1と同様、nは時間インデックスを、τは楽器の発音時刻に対応するサンプルを表す。式(8)上段のコスト関数における周波数領域での重みwiをフィルタの周波数特性の逆hi -1の拡張として考えると、上段のコスト関数の最小化はフィルタ処理の一般化に対応する。特に、重みwiが非負の実数ベクトルの時、零位相のフィルタによるフィルタ処理の拡張に対応する。
重みwiを非負の実数ベクトルにし、式(8)下段で完全再構成性を満たす制約を導入したことで位相遅延のないモード分解を実現する。また、式(8)下段の制約は各モードが発音時刻τより前に成分を持たないことを示している。これにより、プリリンギングの発生を防ぎ、各モードにおいて因果性を満たすことを示している。
式(8)における重みwiは各モードxiが所望の周波数特性を持つように任意に作成することができる。楽器音のモード分解を考えているため、各モードxiが狭帯域かつ他のモードの成分の混入が少ない信号にする重みwiを作成する。
まず、ARモデルを用いて楽器音sを近似し、ARモデルのパラメータから楽器音のモードmiに対応する極piを選ぶ。この時、極piの偏角は各モードの中心周波数fiを正規化したものに対応する。極piごとに極piとその複素共役pi のみを極に持つ共振フィルタを設計し、この共振フィルタの振幅応答を正規化したものを|hi~|とする。また、ARモデルで近似した楽器音sスペクトルで各モードの中心周波数fiにあたるピークの大きさをgiとする。
これらの情報を利用し、各モードxiを中心周波数fiの狭帯域な信号にする第1の重みwi (1)と、他のモードの混入を防ぐ第2の重みwi (2)を作成する。これら2つの重みのアダマール積wi (1) wi (2)を後述する式(14)の第3の重みwiとした。第1の重みwi (1)
Figure 0007072165000012
とした。これにより、第1の重みwi (1)のうち、モードの中心周波数fiへの重みは0になり急峻なディップを持つ。また、第2の重みwi (2)
Figure 0007072165000013
とする。これにより第2の重みwi (2)は他のモードの中心周波数fj≠iに対しピークを持つ。そのため、第3の重みwiはモードの中心周波数fiでディップを持ち、他のモード中心周波数fj≠iでピークを持つ。
式(8)の手法はフィルタ処理の一般化にあたるため、コスト関数でデータ忠実性を考慮している。これにより、各モードに他のモードの成分が混在するモードミキシングが発生してしまう。そこで本実施例では、フィルタ処理の一般化にあたるコスト関数ではなく、各モードの周波数領域で重み付けしたエネルギーをコスト関数にした問題を考える。そこで、楽器音のスペクトルs^、推定するモードのスペクトルをxi^を利用し、周波数領域での完全再構成性の制約のもと重み付けしたエネルギーの最小化問題
Figure 0007072165000014
を解くことで楽器音のスペクトルs^を各モードのスペクトルをxi^へ分解することを考える。但し、wi∈RLは各モードに対する重みを表す。離散フーリエ変換Fはユニタリ作用素であるため、周波数領域での完全再構成性が満たされる時、式(11)下段の周波数領域の完全再構成性制約の両辺に逆離散フーリエ変換F-1をかけた時間領域での完全再構成性も満たされる。式(11)上段のコスト関数は周波数インデックスξごとに独立であり、周波数インデックスξごとに考えることができる。式(11)を周波数インデックスξごとに考えると
Figure 0007072165000015
と書き換えることができる。ここで、全ての周波数サンプルξに対し複数のモードの重みwi[ξ]が同時に0でない時、式(12)の解は
Figure 0007072165000016
となる。式(13)は、式(11)の解xiが、周波数応答がGiとなるフィルタを楽器音sにかけたものと一致することを示している。つまり、式(11)はモードの周波数領域で重み付けしたエネルギーの最小化を考えていたが、完全再構成性を考慮した位相遅延のないフィルタバンクG1,...,Nを作成し、そのフィルタバンクを楽器音sにかけることと一致している。
Gi[ξ]は重みw1,...,N[ξ]どうしの比によって決まり、重みwi[ξ]=0の時、Gi[ξ]=1となり、Gi≠j[ξ]=0となる。そのため、周波数応答がGiで与えられるフィルタは各モードの成分を排他的にする性質がある。そのため、式(11)を解くことで、モードミキシングの少ないモード分解を実現することができる。
フィルタ処理を拡張した最適化問題によるモード分解より、周波数領域で重み付けした各モードのエネルギーの最小化によるモード分解(式(11))の方がモードミキシングが少ないことが式(11)の解析解(13)より分かった。しかし、式(11)では因果性を考慮していなかった。そこで、各モードの時間波形xiを変数とし、各モードの因果性を制約に加えた上で、周波数領域で重み付けした各モードのエネルギーの最小化問題
Figure 0007072165000017
を解くことによる楽器音のモード分解を考える。この問題は凸なので、適当な凸最適化アルゴリズムで解くことができる。
変数を各モードの時間波形xiで持ち、式(14)下段の各モードの因果性を表す制約を導入することで、各モードxiにおけるプリリンギングの発生を防ぐ。これにより、各モードxiが完全再構成性、因果性を同時に満たした位相遅延のないモード分解が可能である。
本実施例では式(14)をFast Iterative Shrinkage-Thresholding Algorithm (FISTA) を用いて解いた。FISTAを用いると式(14)の解は
Figure 0007072165000018
を反復することで求められる。但し、kは反復のインデックス、μはステップサイズを表し、作用素Tは
Figure 0007072165000019
を表している。また、T*は作用素Tの随伴作用素を表す。κCは式(14)の下段の完全再構成性と因果性表す制約を同時に満たすアフィン部分空間Cへの射影を表し、
Figure 0007072165000020
となる。式(17)の上段は各モードxiの足し合わせを楽器音sに一致させる効果があり、完全再構成性の制約に対応している。一方、下段はプリリンギングの発生を防ぐ効果があり、因果性の制約に対応している。FISTAでは、式(15)に示す通り、各反復ごとに各モードの時間波形xiに対し上記の制約を同時に満たすアフィン部分空間Cへの射影κCを行う。そのため、制約付き最小二乗問題(式(14))をFISTAを用いて解くことで、各反復においてモードxiは必ず完全再構成性と因果性を満たす。
<モード分解装置2>
図5を参照して、本実施例のモード分解装置2の構成について説明する。同図に示すように、本実施例のモード分解装置2は、極取り出し部21と、第1重み推定部22と、第2重み推定部23と、モード分解部24を含む。
図6を参照して各部の動作について説明する。極取り出し部21は、楽音信号sまたはその近似音から極を取り出す(S21)。
第1重み推定部22は、式(9)に基づいて、各モードxiを中心周波数fiの狭帯域な信号にする第1の重みwi (1)を推定する(S22)。
第2重み推定部23は、式(10)に基づいて、他のモードの混入を防ぐ第2の重みwi (2)を推定する(S23)。
モード分解部24は、式(14)の上段で表される最小二乗問題を、式(14)の下段に表す完全再構成性、因果性を充たすことを制約として、FISTAを用いて求めることにより、楽音信号sを各モードx1,...,xNに分解する(S24)。
<理論>
以下、実施例3のモード分解装置3の基礎となる理論を説明する。一般に、楽器音sから周波数応答がhn^である線形フィルタを用いてモードxnを推定することは、
Figure 0007072165000021
と表される。ただし、s^=Fsは楽器音sのスペクトルを表し、F、○はそれぞれ離散フーリエ変換、アダマール積を表す。フィルタの周波数応答hn^に逆特性hn -1^が存在する時、式(18)の解は最小二乗問題:
Figure 0007072165000022
の解と一致する。一般に知られている通り、線形なフィルタ処理では各モードの位相遅延とプリリンギングを同時に解消することができない。これらは分解されたモードの立ち上がりを変化させ、楽器音の立ち上がりの解析を困難にする。
そこで、式(19)に対し、(I)完全再構成・因果性を表す制約の導入、(II)制約のみによるデータ忠実性の考慮、(III)アタック成分の変数への組み込み、という3点の変更を加えたモード分解手法を提案した。(I)により位相遅延及びプリリンギングを明示的に解消し、(III)においてモード分解の残差をアタック成分とする。上記手法において、凸最適化問題:
Figure 0007072165000023
を解くことで、楽器音sをN個のモードxnとアタック成分xN+1に分解する。ただし、実施例1と同様、F-1は逆離散フーリエ変換、tは時間インデックス、τは楽器の発音時刻に対応するサンプルを表す。しかし、上記手法では、モード数が多く複数のモードの中心周波数が近い実楽器音に適用する場合、計算時間と分解性能が課題となっていた。そこで本実施例では、式(20)のADMM(Alternating Direction Method of Multipliers)を用いた高速な解法(後述)を利用し、分解性能向上のための重みwiを改善することで(後述)、上記の課題を解決する。
ADMMを用いることで、式(20)の高速な解法を実現する。式(20)の解はADMMを用いて任意の初期値z[0]^、u[0]^から
Figure 0007072165000024
を反復することで求められる。ただし、
Figure 0007072165000025
とし、xT^はx^の転置を、kは反復インデックスを表す。また、
Figure 0007072165000026
とする。ただし、C1、C2はそれぞれ完全再構成性と因果性を表す制約を満たす空間、χCは空間Cに対する指示関数、PC2は空間C2への距離射影、proxρ,fは関数fの近接作用素を表し、それぞれ
Figure 0007072165000027
で与えられる。式(28)は解析的に解くことができ
Figure 0007072165000028
と表せる。ただし、y^=z^-x^、ξは周波数インデックスを表す。すなわち、式(29)~(33)を用いて式(21)を計算し、式(26)、(27)を用いて式(22)を計算することが可能である。これにより、式(20)の解を効率的に求めることができる。
式(20)における重みwnは各モード及びアタック成分xnが所望の周波数特性を持つよう任意に作成することができる。本実施例では、自己回帰モデルを用いて楽器音sを近似し、各モードに対応する極の情報から共振フィルタを設計する。共振フィルタの正規化した振幅応答|hn~|及び振幅応答の最大値anを利用し、各モードxnを狭帯域な信号にする第1の重みwn dipと、他のモードの混入を防ぐ第2の重みwn peaksを作成する。式(20)の第3の重みwnを2つの重みのアダマール積wn dip wn peaksで表し、第1の重みwn dip、第2の重みwn peaksをそれぞれ
Figure 0007072165000029
とする。ただし、μ>0は第1の重みwn dipによって各モードxnをどれだけ狭帯域にするか調整するパラメータを表す。本実施例では第1の重みwn dip、第2の重みwn peaksはそれぞれ目的のモードの中心周波数に対する共振フィルタの振幅応答、他のモードの中心周波数に対するノッチフィルタの振幅応答の和に対応する。また、アタック成分に対する重みwN+1
Figure 0007072165000030
とし、λ>0はアタック成分の大きさを調整するパラメータを表す。
<モード分解装置3>
図7を参照して、本実施例のモード分解装置3の構成について説明する。同図に示すように、本実施例のモード分解装置3は、極取り出し部31と、第1重み推定部32と、第2重み推定部33と、アタック成分重み推定部34と、モード分解部35を含む。
図8を参照して各部の動作について説明する。極取り出し部31は、楽音信号sまたはその近似音から極を取り出す(S31)。
第1重み推定部32は、式(34)に基づいて、第1の重みwn dipを推定する(S32)。
第2重み推定部33は、式(35)に基づいて、第2の重みwn peaksを推定する(S33)。
アタック成分重み推定部34は、式(36)に基づいて、アタック成分重みwN+1を推定する(S34)。
モード分解部35は、式(20)の上段で表される最小二乗問題を、式(20)の下段に表す完全再構成性、因果性を充たすことを制約として、ADMMを用いて求めることにより、楽音信号sを各モードx1,...,xNとアタック成分xN+1に分解する(S35)。
<補記>
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD-ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている(外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくこととしてもよい)。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。
ハードウェアエンティティでは、外部記憶装置(あるいはROMなど)に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にCPUで解釈実行・処理される。その結果、CPUが所定の機能(上記、…部、…手段などと表した各構成要件)を実現する。
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
既述のように、上記実施形態において説明したハードウェアエンティティ(本発明の装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD-RAM(Random Access Memory)、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP-ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (5)

  1. 楽音信号を各モードに分解するフィルタの振幅応答の逆特性と各モードの周波数成分のアダマール積と、前記楽音信号の周波数成分に関する最小二乗問題であって、完全再構成性と因果性を充たすことを制約とした制約付き最小二乗問題を解くことにより、前記楽音信号を各モードに分解するモード分解装置であって、
    楽音信号sまたはその近似音から極を取り出す極取り出し部と、
    iを前記楽音信号sの各モードのインデックスとし、前記極の情報に基づいて定まるi番目の共振周波数fiの共振フィルタの振幅応答|hi|に基づいて、i番目の第1の重みwi (1)を推定する動作を各モードについて繰り返し実行する第1重み推定部と、
    jをj≠iを満たす楽音信号sのモードのインデックスとし、j番目の共振周波数fjの共振フィルタの振幅応答|hj|に基づいて、i番目の第2の重みwi (2)を推定する動作を各モードについて繰り返し実行する第2重み推定部と、
    残差rに対する重みである残差重みwrを推定する残差重み推定部と、
    前記i番目の第1の重みwi (1)と前記i番目の第2の重みwi (2)のアダマール積であるi番目の第3の重みwiと、i番目の前記モードxiの周波数成分F(xi)と、前記楽音信号sの周波数成分F(s)と、パラメータλと、前記残差重みwrと、前記残差rの周波数成分F(r)に関する最小二乗問題
    Figure 0007072165000031

    の解を、完全再構成性と因果性を充たすことを制約として求めることにより、前記楽音信号sを各モードx1,...,xNに分解するモード分解部
    含み、
    前記第1重み推定部は、
    kをインデックスを表すものとし、ξ[k]をインデックスkに対応する周波数とし、μをパラメータとし、i番目の第1の重みwi (1)[k]を、
    Figure 0007072165000032

    と推定し、
    前記第2重み推定部は、
    kをインデックスを表すものとし、ξ[k]をインデックスkに対応する周波数とし、gjをj番目のモードxjに対応するピークの大きさとし、i番目の第2の重みwi (2)[k]を
    Figure 0007072165000033

    と推定し、
    前記残差重み推定部は、
    kをインデックスを表すものとし、ξ[k]をインデックスkに対応する周波数とし、gjをj番目のモードxjに対応するピークの大きさとし、残差重みwr[k]を
    Figure 0007072165000034

    と推定する
    モード分解装置。
  2. i,jを楽音信号sの各モードのインデックスとし、
    ARモデルを用いて近似した楽音信号sから極piを取り出す極取り出し部と、
    極piとその複素共役pi のみを極に持つ共振フィルタの振幅応答を正規化したものを|hi~|とし、ξを周波数インデックスとして、
    Figure 0007072165000035

    に基づいて、各モードxiを中心周波数fiの狭帯域な信号にする第1の重みwi (1)を推定する第1重み推定部と、
    前記ARモデルで近似した楽器音sスペクトルで各モードの中心周波数fiにあたるピークの大きさをgiとし、j番目の共振周波数fjの共振フィルタの振幅応答を|hj|とし、
    Figure 0007072165000036

    に基づいて、他のモードの混入を防ぐ第2の重みwi (2)を推定する第2重み推定部と、
    前記i番目の第1の重みwi (1)と前記i番目の第2の重みwi (2)のアダマール積をi番目の第3の重みwiとし、i番目の前記モードxiの周波数成分F(xi)に関する最小二乗問題
    Figure 0007072165000037

    の解を、完全再構成性と因果性を充たすことを制約として、FISTAを用いて求めることにより、前記楽音信号sを各モードx1,...,xNに分解するモード分解部
    を含むモード分解装置。
  3. 楽音信号を各モードに分解するフィルタの振幅応答の逆特性と各モードの周波数成分のアダマール積と、前記楽音信号の周波数成分に関する最小二乗問題であって、完全再構成性と因果性を充たすことを制約とした制約付き最小二乗問題を解くことにより、前記楽音信号を各モードに分解する、モード分解装置が実行するモード分解方法であって、
    楽音信号sまたはその近似音から極を取り出す極取り出しステップと、
    iを前記楽音信号sの各モードのインデックスとし、前記極の情報に基づいて定まるi番目の共振周波数fiの共振フィルタの振幅応答|hi|に基づいて、i番目の第1の重みwi (1)を推定する動作を各モードについて繰り返し実行する第1重み推定ステップと、
    jをj≠iを満たす楽音信号sのモードのインデックスとし、j番目の共振周波数fjの共振フィルタの振幅応答|hj|に基づいて、i番目の第2の重みwi (2)を推定する動作を各モードについて繰り返し実行する第2重み推定ステップと、
    残差rに対する重みである残差重みwrを推定する残差重み推定ステップと、
    前記i番目の第1の重みwi (1)と前記i番目の第2の重みwi (2)のアダマール積であるi番目の第3の重みwiと、i番目の前記モードxiの周波数成分F(xi)と、前記楽音信号sの周波数成分F(s)と、パラメータλと、前記残差重みwrと、前記残差rの周波数成分F(r)に関する最小二乗問題
    Figure 0007072165000038

    の解を、完全再構成性と因果性を充たすことを制約として求めることにより、前記楽音信号sを各モードx1,...,xNに分解するモード分解ステップ
    含み、
    前記第1重み推定ステップは、
    kをインデックスを表すものとし、ξ[k]をインデックスkに対応する周波数とし、μをパラメータとし、i番目の第1の重みwi (1)[k]を、
    Figure 0007072165000039

    と推定し、
    前記第2重み推定ステップは、
    kをインデックスを表すものとし、ξ[k]をインデックスkに対応する周波数とし、gjをj番目のモードxjに対応するピークの大きさとし、i番目の第2の重みwi (2)[k]を
    Figure 0007072165000040

    と推定し、
    前記残差重み推定ステップは、
    kをインデックスを表すものとし、ξ[k]をインデックスkに対応する周波数とし、gjをj番目のモードxjに対応するピークの大きさとし、残差重みwr[k]を
    Figure 0007072165000041

    と推定する
    モード分解方法。
  4. モード分解装置が実行するモード分解方法であって、
    i,jを楽音信号sの各モードのインデックスとし、
    ARモデルを用いて近似した楽音信号sから極piを取り出す極取り出しステップと、
    極piとその複素共役pi のみを極に持つ共振フィルタの振幅応答を正規化したものを|hi~|とし、ξを周波数インデックスとして、
    Figure 0007072165000042

    に基づいて、各モードxiを中心周波数fiの狭帯域な信号にする第1の重みwi (1)を推定する第1重み推定ステップと、
    前記ARモデルで近似した楽器音sスペクトルで各モードの中心周波数fiにあたるピークの大きさをgiとし、j番目の共振周波数fjの共振フィルタの振幅応答を|hj|とし、
    Figure 0007072165000043

    に基づいて、他のモードの混入を防ぐ第2の重みwi (2)を推定する第2重み推定ステップと、
    前記i番目の第1の重みwi (1)と前記i番目の第2の重みwi (2)のアダマール積をi番目の第3の重みwiとし、i番目の前記モードxiの周波数成分F(xi)に関する最小二乗問題
    Figure 0007072165000044

    の解を、完全再構成性と因果性を充たすことを制約として、FISTAを用いて求めることにより、前記楽音信号sを各モードx1,...,xNに分解するモード分解ステップ
    を含むモード分解方法。
  5. コンピュータを請求項1または2に記載のモード分解装置として機能させるプログラム。
JP2018043193A 2018-03-09 2018-03-09 モード分解装置、モード分解方法、プログラム Active JP7072165B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018043193A JP7072165B2 (ja) 2018-03-09 2018-03-09 モード分解装置、モード分解方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018043193A JP7072165B2 (ja) 2018-03-09 2018-03-09 モード分解装置、モード分解方法、プログラム

Publications (2)

Publication Number Publication Date
JP2019159018A JP2019159018A (ja) 2019-09-19
JP7072165B2 true JP7072165B2 (ja) 2022-05-20

Family

ID=67994769

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018043193A Active JP7072165B2 (ja) 2018-03-09 2018-03-09 モード分解装置、モード分解方法、プログラム

Country Status (1)

Country Link
JP (1) JP7072165B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008209549A (ja) 2007-02-26 2008-09-11 National Institute Of Advanced Industrial & Technology 音モデル生成装置、音モデル生成方法およびプログラム
JP2013250357A (ja) 2012-05-30 2013-12-12 Yamaha Corp 音響解析装置およびプログラム
JP2016123841A (ja) 2015-01-08 2016-07-11 株式会社東芝 再構成装置、x線コンピュータ断層撮影装置及び再構成方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2766648B2 (ja) * 1988-07-29 1998-06-18 株式会社河合楽器製作所 高調波係数抽出装置、高調波係数合成装置、高調波係数抽出方法及び高調波係数合成方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008209549A (ja) 2007-02-26 2008-09-11 National Institute Of Advanced Industrial & Technology 音モデル生成装置、音モデル生成方法およびプログラム
JP2013250357A (ja) 2012-05-30 2013-12-12 Yamaha Corp 音響解析装置およびプログラム
JP2016123841A (ja) 2015-01-08 2016-07-11 株式会社東芝 再構成装置、x線コンピュータ断層撮影装置及び再構成方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
升山義紀 他,"交互方向乗数法を用いたモード分解による楽器音の解析",日本音響学会2018年春季研究発表会講演論文集CD-ROM,2018年02月27日,pp.793-794

Also Published As

Publication number Publication date
JP2019159018A (ja) 2019-09-19

Similar Documents

Publication Publication Date Title
US10564923B2 (en) Method, system and artificial neural network
JP4660739B2 (ja) 音分析装置およびプログラム
CN103999076A (zh) 包括将声音信号变换成频率调频域的处理声音信号的系统和方法
JP5846043B2 (ja) 音声処理装置
Aramaki et al. Analysis-synthesis of impact sounds by real-time dynamic filtering
Maia et al. Complex cepstrum for statistical parametric speech synthesis
Siedenburg et al. Persistent time-frequency shrinkage for audio denoising
Christensen et al. Joint fundamental frequency and order estimation using optimal filtering
Hood et al. Parametric representation of speech employing multi-component AFM signal model
Gabrielli et al. A digital waveguide-based approach for Clavinet modeling and synthesis
JP7072165B2 (ja) モード分解装置、モード分解方法、プログラム
Wildi et al. The trilemma between accuracy, timeliness and smoothness in real-time signal extraction
Wells Modal decompositions of impulse responses for parametric interaction
Vanhatalo et al. Neural Network-Based Virtual Analog Modeling
Masri et al. A review of time–frequency representations, with application to sound/music analysis–resynthesis
Lefèvre et al. A convex formulation for informed source separation in the single channel setting
Maestre et al. Constrained pole optimization for modal reverberation
WO2020162188A1 (ja) 潜在変数最適化装置、フィルタ係数最適化装置、潜在変数最適化方法、フィルタ係数最適化方法、プログラム
Kaloinen Neural modeling of the audio tape echo effect
Kemp On inharmonicity in bass guitar strings with application to tapered and lumped constructions
JP6790659B2 (ja) 音響処理装置および音響処理方法
JP2020030373A (ja) 音源強調装置、音源強調学習装置、音源強調方法、プログラム
Christensen Metrics for vector quantization-based parametric speech enhancement and separation
Hahn Expressive sampling synthesis. Learning extended source-filter models from instrument sound databases for expressive sample manipulations
Lependin et al. Speech Enhancement Based on Two-Stage Neural Network with Structured State Space for Sequence Transformation

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180312

A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20180328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190205

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210914

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211005

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220419

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220421

R150 Certificate of patent or registration of utility model

Ref document number: 7072165

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150