JP2008058753A - 音分析装置およびプログラム - Google Patents
音分析装置およびプログラム Download PDFInfo
- Publication number
- JP2008058753A JP2008058753A JP2006237269A JP2006237269A JP2008058753A JP 2008058753 A JP2008058753 A JP 2008058753A JP 2006237269 A JP2006237269 A JP 2006237269A JP 2006237269 A JP2006237269 A JP 2006237269A JP 2008058753 A JP2008058753 A JP 2008058753A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- fundamental frequency
- frequency
- types
- models
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】 音モデル補間処理5では、記憶装置に記憶された複数種類の音モデルに補間処理を施し、各音モデルの中間の基本周波数に対応した複数種類の音モデルを生成する。基本周波数の確率密度関数の推定41では、記憶された音モデルおよび補間処理により得られた音モデルを用いて、様々な基本周波数の音モデルの混合分布を構成し、この混合分布が入力音響信号の周波数成分の分布となるように、各音モデルに対する重み値を最適化し、最適化された各音モデルの重み値を音源の音の基本周波数の確率密度関数とする。
【選択図】図1
Description
特許文献1の技術では、同一基本周波数には1つの音モデルしか用意されていなかったが、実際には、ある基本周波数に、異なる高調波構造を持つ音が入れ替わり立ち替わり現れることがある。そこで、同一基本周波数に対して複数の音モデルを用意し、入力音響信号をそれらの混合分布としてモデル化した。
特許文献1の技術では、音モデルにおいて各高調波成分の大きさの比を固定していた(ある理想的な音モデルを仮定していた)。これは実世界の混合音中の高調波構造とは必ずしも一致しておらず、精度向上のためには洗練される余地が残されていた。そこで、音モデルの高調波成分の比率もモデルパラメータに加え、各時刻においてEMアルゴリズムにより推定するようにした。
特許文献1の技術では、音モデルの重み(基本周波数の確率密度関数)に関する事前知識は仮定していなかった。しかし、この基本周波数の推定技術の用途によっては、たとえ事前に基本周波数がどの周波数の近傍にあるかを与えてでも、より誤検出の少ない基本周波数を求めたいというような要求も発生し得る。例えば、演奏分析やビブラート分析等の目的では、楽曲をヘッドホン聴取しながらの歌唱や楽器演奏によって、各時刻におけるおおよその基本周波数を事前知識として用意しておき、実際の楽曲中のより正確な基本周波数を得ることが求められている。そこで、特許文献1におけるモデルパラメータ(音モデルに対する重み値)の最尤推定の枠組みを拡張し、モデルパラメータに関する事前分布に基づいて最大事後確率推定(MAP推定;Maximum A Posteriori Probability Estimation)を行うようにした。その際、<拡張2>においてモデルパラメータに加えた音モデルの高調波成分の大きさの比率に関する事前分布も導入した。
<全体構成>
図1は、この発明の第1実施形態による音分析プログラムの処理内容を示す図である。この音分析プログラムは、自然界から音響信号を取得する収音機能、CD等の記録媒体から音楽の音響信号を再生する再生機能またはネットワークを介して音楽の音響信号を取得する通信機能等の音響信号取得機能を備えたパーソナルコンピュータ等のコンピュータにインストールされて実行される。本実施形態による音分析プログラムを実行するコンピュータは、本実施形態による音分析装置として機能する。
この処理では、入力音響信号を複数のBPFからなるフィルタバンクに与え、フィルタバンクの各BPFの出力信号について、位相の時間微分である瞬時周波数(Flanagan, J.L. and Golden, R.M.: Phase Vocoder, The BellSystem
Technical J., Vol.45, pp.1493-1509 (1966)参照)を計算する。ここでは、上記Flanaganの手法を用い、短時間フーリエ変換(STFT)の出力をフィルタバンク出力と解釈して、効率良く瞬時周波数を計算する。入力音響信号x(t)に対する窓関数h(t)を用いたSTFTが式(3)および(4)により与えられるとき、瞬時周波数λ(ω,t)は式(5)により求めることができる。
ASSP, Vol.ASSP-35, No.3, pp. 356-372 (1987)、参照)を構成し、リアルタイムに実行可能という制約のもとで、ある程度妥当な時間周波数分解能を得る。
この処理では、フィルタの中心周波数からその瞬時周波数への写像に基づいて、周波数成分の候補を抽出する(Charpentier, F.J.: Pitch detection using the short-termphase spectrum,
Proc. of ICASSP 86, pp.113-116 (1986)参照)。あるSTFTフィルタの中心周波数ωからその出力の瞬時周波数λ(ω,t)への写像を考える。すると、もし周波数ψの周波数成分があるときには、ψがこの写像の不動点に位置し、その周辺の瞬時周波数の値はほぼ一定となる。つまり、全周波数成分の瞬時周波数Ψf (t)は、次式によって抽出することができる。
この処理では、抽出した周波数成分に重み付けすることで、周波数帯域を制限する。ここでは、メロディラインとベースライン用に、2種類のBPFを用意する。メロディライン用BPFは、典型的なメロディラインの主要な基本波成分および高調波成分の多くを通過させることができ、かつ、基本周波数付近の重複が頻繁に起きる周波数帯域をある程度遮断する。一方、ベースライン用BPFは、典型的なベースラインの主要な基本周波数成分および高調波成分の多くを通過させることができ、かつ、他の演奏パートがベースラインよりも優勢になるような周波数帯域をある程度遮断する。
この基本周波数の確率密度関数の推定41では、BPFを通過した周波数成分の候補に対し、各高調波構造が相対的にどれくらい優勢かを表す基本周波数の確率密度関数を求める。この基本周波数の確率密度関数の推定41の処理内容は、非特許文献1に開示された内容となっている。
基本周波数の確率密度関数において、同時に鳴っている音の基本周波数に対応する複数のピークが拮抗すると、それらのピークが確率密度関数の最大値として次々に選ばれてしまうことがあるため、このように単純に求めた結果は安定しないことがある。そこで、本実施形態における基本周波数推定手段としての処理では、大局的な観点から基本周波数を推定するために、基本周波数の確率密度関数の時間変化において複数のピークの軌跡を継時的に追跡し、その中で最も優勢で安定した基本周波数の軌跡を選択する。このような追跡処理を動的で柔軟に制御するために、マルチエージェントモデルを導入する。
一般に楽器から発音される音のスペクトル形状は音高(基本周波数)に依存して変化する。従って、基本周波数の推定精度を高めるためには、様々な基本周波数を持った音を楽器から収音し、これらの各音から作成した多くの音モデルを用いて、基本周波数の確率密度関数の推定41を実行した方が好ましい。しかし、そのような多数の音モデルを基本周波数の確率密度関数の推定41に用いるとなると、それらの多数の音モデルを作成するのには多大な工数を要し、また、多数の音モデルを記憶させるための記憶容量を音分析装置内に確保しなければならないという問題がある。そこで、本実施形態では、次のような改良が行われている。すなわち、音分析装置の記憶装置には、様々な基本周波数に対応した比較的少数の代表的な音モデルのみを各々の基本周波数と対応付けて記憶させ、音分析プログラムの実行時に、この記憶装置に記憶された比較的少数の代表的な音モデルから多数の音モデルを生成し、基本周波数の確率密度関数の推定41に引き渡すのである。
例えばギターでは、ある弦の最高フレットまでは倍音構造が連続的に変化するが、それより半音高い音を出すには、より高い音を発音しうる別の弦を奏さねばならず、ここで倍音構造が不連続となる。さらにいえば、弦の開放弦および低いフレット付近では倍音構造の変化は緩やかであり、高いフレット付近では1フレットの違いでも大きく倍音構造が変化するから、これを反映し、低域では粗い間隔で、高域になるほど密に、代表的な音モデルを作成する基本周波数を選ぶと有効である。また、ピアノでは最低音域は1本の弦、低音域は2本の弦、高音域は3本の弦、最高音域は、3本の弦であるが他と異なりミュート機構がない、といったように周波数帯域により弦構造が異なり、これに呼応して音色すなわち倍音構造も特定の周波数で不連続に変化する。そのような不連続点では代表的な音モデルを密に配置すれば、少ない数の音モデルでも、基本周波数の推定精度を高めることが可能となる。
上記第1実施形態では、基本周波数によって音のスペクトル形状が異なることを考慮し、比較的少ない代表的な音モデルからより多くの種類の基本周波数に対応した音モデルを補間処理により生成した。本実施形態では、基本周波数の確率密度関数の推定41において、各音モデル(代表的な音モデルおよび音モデル補間処理5により得られた音モデル)の種類毎に、当該音モデルが本来有していた基本周波数に合わせて、基本周波数の範囲を設定し、この設定した基本周波数の範囲外の周波数における当該音モデルに対する重み値を制限して、各音モデルに対する重み値の最適化を行う。さらに詳述すると、次の通りである。
以上、この発明の一実施形態について説明したが、この発明には他にも実施形態があり得る。例えば次の通りである。
Claims (4)
- 楽器から発音される複数種類の音の高調波構造を各々定義した複数種類の音モデルを記憶する記憶手段と、
前記記憶手段に記憶された複数種類の音モデルを各々の基本周波数に従って序列化し、序列化された複数種類の音モデルに対して、基本周波数に基づく補間処理を施し、序列化された各音モデルの中間の基本周波数に対応した複数種類の音モデルを生成する補間手段と、
前記記憶手段に記憶された複数種類の音モデルおよび前記補間手段により生成された複数種類の音モデルを用いて、各種の高調波構造および基本周波数を有する複数の音モデルを重み付け加算した混合分布を構成し、この混合分布が入力音響信号の周波数成分の分布となるように、各音モデルに対する重み値を最適化し、最適化された各音モデルの重み値を前記入力音響信号の元である音源の音の基本周波数の確率密度関数として推定する確率密度関数推定手段と、
前記基本周波数の確率密度関数に基づいて前記入力音響信号における1または複数の音源の音の基本周波数を推定して出力する基本周波数推定手段と
を具備することを特徴とする音分析装置。 - 前記確率密度推定手段は、各音モデルの種類毎に、当該音モデルが本来有していた基本周波数に合わせて、基本周波数の範囲を設定し、この設定した基本周波数の範囲外の周波数における当該音モデルに対する重み値を制限して、前記各音モデルに対する重み値の最適化を行うことを特徴とする請求項1に記載の音分析装置。
- 前記基本周波数推定手段は、前記確率密度関数におけるピークを複数検出し、各ピークの信頼度に基づき、信頼度が高くパワーの大きい基本周波数を出力することを特徴とする請求項1に記載の音分析装置。
- コンピュータを、
楽器から発音される複数種類の音の高調波構造を各々定義した複数種類の音モデルを記憶する記憶手段と、
前記記憶手段に記憶された複数種類の音モデルを各々の基本周波数に従って序列化し、序列化された複数種類の音モデルに対して、基本周波数に基づく補間処理を施し、序列化された各音モデルの中間の基本周波数に対応した複数種類の音モデルを生成する補間手段と、
前記記憶手段に記憶された複数種類の音モデルおよび前記補間手段により生成された複数種類の音モデルを用いて、各種の高調波構造および基本周波数を有する複数の音モデルを重み付け加算した混合分布を構成し、この混合分布が入力音響信号の周波数成分の分布となるように、各音モデルに対する重み値を最適化し、最適化された各音モデルの重み値を前記入力音響信号の元である音源の音の基本周波数の確率密度関数として推定する確率密度関数推定手段と、
前記基本周波数の確率密度関数に基づいて前記入力音響信号における1または複数の音源の音の基本周波数を推定して出力する基本周波数推定手段と
して機能させることを特徴とするコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006237269A JP4625933B2 (ja) | 2006-09-01 | 2006-09-01 | 音分析装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006237269A JP4625933B2 (ja) | 2006-09-01 | 2006-09-01 | 音分析装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008058753A true JP2008058753A (ja) | 2008-03-13 |
JP4625933B2 JP4625933B2 (ja) | 2011-02-02 |
Family
ID=39241531
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006237269A Expired - Fee Related JP4625933B2 (ja) | 2006-09-01 | 2006-09-01 | 音分析装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4625933B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008058885A (ja) * | 2006-09-04 | 2008-03-13 | National Institute Of Advanced Industrial & Technology | 音高推定装置、音高推定方法およびプログラム |
JP2008058755A (ja) * | 2006-09-01 | 2008-03-13 | National Institute Of Advanced Industrial & Technology | 音分析装置およびプログラム |
JP2008058886A (ja) * | 2006-09-04 | 2008-03-13 | National Institute Of Advanced Industrial & Technology | 音高推定装置、音高推定方法およびプログラム |
DE112016004046T5 (de) | 2015-09-07 | 2018-06-07 | Yamaha Corporation | Vorrichtung und Verfahren zur musikalischen Ausführungsunterstützung |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62242996A (ja) * | 1986-04-15 | 1987-10-23 | ヤマハ株式会社 | 楽音信号発生装置 |
JP2001083970A (ja) * | 2000-08-01 | 2001-03-30 | Casio Comput Co Ltd | 音声信号処理装置 |
JP3413634B2 (ja) * | 1999-10-27 | 2003-06-03 | 独立行政法人産業技術総合研究所 | 音高推定方法及び装置 |
JP2003233378A (ja) * | 2002-02-13 | 2003-08-22 | Yamaha Corp | 楽音生成装置および楽音生成方法 |
WO2005066927A1 (ja) * | 2004-01-09 | 2005-07-21 | Toudai Tlo, Ltd. | 多重音信号解析方法 |
-
2006
- 2006-09-01 JP JP2006237269A patent/JP4625933B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62242996A (ja) * | 1986-04-15 | 1987-10-23 | ヤマハ株式会社 | 楽音信号発生装置 |
JP3413634B2 (ja) * | 1999-10-27 | 2003-06-03 | 独立行政法人産業技術総合研究所 | 音高推定方法及び装置 |
JP2001083970A (ja) * | 2000-08-01 | 2001-03-30 | Casio Comput Co Ltd | 音声信号処理装置 |
JP2003233378A (ja) * | 2002-02-13 | 2003-08-22 | Yamaha Corp | 楽音生成装置および楽音生成方法 |
WO2005066927A1 (ja) * | 2004-01-09 | 2005-07-21 | Toudai Tlo, Ltd. | 多重音信号解析方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008058755A (ja) * | 2006-09-01 | 2008-03-13 | National Institute Of Advanced Industrial & Technology | 音分析装置およびプログラム |
JP4660739B2 (ja) * | 2006-09-01 | 2011-03-30 | 独立行政法人産業技術総合研究所 | 音分析装置およびプログラム |
JP2008058885A (ja) * | 2006-09-04 | 2008-03-13 | National Institute Of Advanced Industrial & Technology | 音高推定装置、音高推定方法およびプログラム |
JP2008058886A (ja) * | 2006-09-04 | 2008-03-13 | National Institute Of Advanced Industrial & Technology | 音高推定装置、音高推定方法およびプログラム |
JP4630979B2 (ja) * | 2006-09-04 | 2011-02-09 | 独立行政法人産業技術総合研究所 | 音高推定装置、音高推定方法およびプログラム |
JP4630980B2 (ja) * | 2006-09-04 | 2011-02-09 | 独立行政法人産業技術総合研究所 | 音高推定装置、音高推定方法およびプログラム |
DE112016004046T5 (de) | 2015-09-07 | 2018-06-07 | Yamaha Corporation | Vorrichtung und Verfahren zur musikalischen Ausführungsunterstützung |
US10403166B2 (en) | 2015-09-07 | 2019-09-03 | Yamaha Corporation | Musical performance assistance device and method |
DE112016004046B4 (de) | 2015-09-07 | 2022-05-05 | Yamaha Corporation | Vorrichtung und Verfahren zur musikalischen Ausführungsunterstützung und rechnerlesbares Speichermedium |
Also Published As
Publication number | Publication date |
---|---|
JP4625933B2 (ja) | 2011-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4322283B2 (ja) | 演奏判定装置およびプログラム | |
JP4660739B2 (ja) | 音分析装置およびプログラム | |
US9111526B2 (en) | Systems, method, apparatus, and computer-readable media for decomposition of a multichannel music signal | |
Klapuri | Automatic music transcription as we know it today | |
Salamon et al. | Melody extraction from polyphonic music signals: Approaches, applications, and challenges | |
JP3413634B2 (ja) | 音高推定方法及び装置 | |
KR101564151B1 (ko) | 시간 변화 정보를 갖는 기저 함수를 사용한 음악 신호의 분해 | |
JP5088030B2 (ja) | 演奏音の類似度を評価する方法、装置およびプログラム | |
US20120046771A1 (en) | Music audio signal generating system | |
WO2005066927A1 (ja) | 多重音信号解析方法 | |
US20170243571A1 (en) | Context-dependent piano music transcription with convolutional sparse coding | |
Argenti et al. | Automatic transcription of polyphonic music based on the constant-Q bispectral analysis | |
Jonason | The control-synthesis approach for making expressive and controllable neural music synthesizers | |
US20130339011A1 (en) | Systems, methods, apparatus, and computer-readable media for pitch trajectory analysis | |
JP4625933B2 (ja) | 音分析装置およびプログラム | |
Lerch | Software-based extraction of objective parameters from music performances | |
JP2005202354A (ja) | 信号解析方法 | |
Abeßer et al. | Parametric audio coding of bass guitar recordings using a tuned physical modeling algorithm | |
JP4625935B2 (ja) | 音分析装置およびプログラム | |
JP4625934B2 (ja) | 音分析装置およびプログラム | |
Paradzinets et al. | Use of continuous wavelet-like transform in automated music transcription | |
Pardo et al. | Applying source separation to music | |
Wiggins et al. | A Differentiable Acoustic Guitar Model for String-Specific Polyphonic Synthesis | |
Fonseca et al. | Low-latency f0 estimation for the finger plucked electric bass guitar using the absolute difference function | |
Müller et al. | Musically Informed Audio Decomposition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090617 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20090618 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100706 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100906 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101012 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101013 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131119 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4625933 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |