JP5560861B2 - 楽曲解析装置 - Google Patents

楽曲解析装置 Download PDF

Info

Publication number
JP5560861B2
JP5560861B2 JP2010088353A JP2010088353A JP5560861B2 JP 5560861 B2 JP5560861 B2 JP 5560861B2 JP 2010088353 A JP2010088353 A JP 2010088353A JP 2010088353 A JP2010088353 A JP 2010088353A JP 5560861 B2 JP5560861 B2 JP 5560861B2
Authority
JP
Japan
Prior art keywords
feature
analysis
acoustic signal
value
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010088353A
Other languages
English (en)
Other versions
JP2011221156A (ja
Inventor
慶太 有元
セバスチャン シュトライヒ
ビースァン オン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2010088353A priority Critical patent/JP5560861B2/ja
Priority to US13/081,337 priority patent/US8487175B2/en
Priority to EP11161256.0A priority patent/EP2375407B1/en
Publication of JP2011221156A publication Critical patent/JP2011221156A/ja
Application granted granted Critical
Publication of JP5560861B2 publication Critical patent/JP5560861B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/40Rhythm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/076Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction of timing, tempo; Beat detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/121Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
    • G10H2240/131Library retrieval, i.e. searching a database or selecting a specific musical piece, segment, pattern, rule or parameter set
    • G10H2240/141Library retrieval matching, i.e. any of the steps of matching an inputted segment or phrase with musical database contents, e.g. query by humming, singing or playing; the steps may include, e.g. musical analysis of the input, musical feature extraction, query formulation, or details of the retrieval process
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/131Mathematical functions for musical analysis, processing, synthesis or composition
    • G10H2250/215Transforms, i.e. mathematical transforms into domains appropriate for musical signal processing, coding or compression
    • G10H2250/235Fourier transform; Discrete Fourier Transform [DFT]; Fast Fourier Transform [FFT]

Description

本発明は、楽曲のリズムを解析する技術に関する。
楽曲の比較や検索の実現を目的として楽曲のリズム(各楽音の時間的な配列の構造)を解析する技術が従来から提案されている。例えば非特許文献1には、音響信号を所定の時間毎に区分した各単位期間(フレーム)の特徴量の時系列を、相異なる楽曲間で比較する技術が開示されている。楽曲間の特徴量の比較には、楽曲間で相互に対応する時間軸上の箇所を特定するDPマッチング(DTW:Dynamic Time Warping)技術が採用される。
Jouni Paulus and Anssi Klapuri, "Measuring the Similarity of Rhythmic Patterns", Proc. ISMIR 2002, p. 150-156
しかし、非特許文献1の技術では、音響信号の単位期間毎に抽出された特徴量が楽曲間のリズムの比較に利用されるから、楽曲の比較に必要なデータ量が大きいという問題がある。また、楽曲のテンポとは無関係に設定された単位期間毎に特徴量が抽出されるから、楽曲のリズムの比較には、前述のDPマッチングのような音響信号の伸縮処理が必須であり、処理の負荷が大きいという問題もある。以上の事情を考慮して、本発明は、楽曲のリズムの解析に必要なデータ量を削減するとともに楽曲間のリズムを比較する処理の負荷を軽減することを目的とする。
以上の課題を解決するために、本発明に係る楽曲解析装置は、楽曲の音響信号の単位期間毎にスペクトルを取得するスペクトル取得手段と、音響信号の拍点を特定する拍点特定手段と、複数の単位期間を含むように拍点の間隔を分割した複数の解析期間の各々と周波数軸上の複数の解析帯域の各々とに対応する解析単位毎に当該解析単位内のスペクトルの複数の成分値に応じた特徴値を算定する特徴算定手段を含み、解析単位毎の特徴値を含むリズム特徴量を生成する特徴量抽出手段とを具備する。
以上の構成においては、複数の単位期間を含む解析期間を時間軸上の単位としてリズム特徴量の特徴値が算定されるから、単位期間毎に特徴値を算定する構成と比較してリズム特徴量のデータ量が削減されるという利点がある。また、楽曲の拍点を基準として解析期間が画定されるから、複数の音響信号のテンポが相違する場合でも、双方を共通の時間軸のもとで対比することが可能である。したがって、比較の対象となる各音響信号の時間軸を整合させる必要がある非特許文献1の構成と比較して、楽曲間のリズムの比較に必要な処理の負荷が軽減されるという利点がある。なお、本発明における「楽曲」とは、時系列に配列された楽音や音声の集合を意味し、著作物として一体に創作された楽曲の全体であるか部分であるかは不問である。また、各解析帯域の帯域幅は任意であるが、例えば1オクターブに相当する帯域幅に設定した構成が好適である。
本発明の好適な態様に係る楽曲解析装置は、第1音響信号および第2音響信号の各々について特徴量抽出手段が生成したリズム特徴量を比較することで、第1音響信号と第2音響信号とのリズムの類否を示す類否指標値を算定する特徴比較手段を具備する。以上の態様においては、第1音響信号および第2音響信号の各々のリズム特徴量の比較で類否指標値が算定されるから、第1音響信号と第2音響信号とのリズムの類否を定量的に評価することが可能である。
本発明の第1態様において、特徴比較手段は、第1音響信号のリズム特徴量と第2音響信号のリズム特徴量との特徴値の差分に応じた要素値(例えば図6の要素値dA[m,n])を解析単位毎に算定する差分算定手段と、第1音響信号および第2音響信号の各々について、当該音響信号のリズム特徴量のうち相異なる解析帯域に対応する複数の特徴値(例えば図6の特徴値ri[1,n]〜ri[M,n])に応じた第1補正値(例えば図6の第1補正値aTi[n])を解析期間毎に算定する第1補正値算定手段と、第1音響信号および第2音響信号の各々について、当該音響信号のリズム特徴量のうち相異なる解析期間に対応する複数の特徴値(例えば図6の特徴値ri[m,1]〜ri[m,N])に応じた第2補正値(例えば図6の第2補正値aFi[m])を解析帯域毎に算定する第2補正値算定手段と、第1音響信号および第2音響信号の各々について生成された各解析期間の第1補正値を当該解析期間の要素値に作用させる第1補正手段と、第1音響信号および第2音響信号の各々について生成された各解析帯域の第2補正値を当該解析帯域の要素値に作用させる第2補正手段と、第1補正手段および第2補正手段による処理後の各要素値から類否指標値を算定する指標算定手段とを含んで構成される。第1態様の具体例は第1実施形態として後述される。
第1態様においては、第1音響信号のリズム特徴量と第2音響信号のリズム特徴量との特徴値の差分について、時間軸の方向の分布が第1補正値で補正され、周波数軸の方向の分布が第2補正値で補正される。したがって、例えば時間軸の方向の分布を強調するとともに周波数軸の方向の分布を平準化して類否指標値を算定するという具合に、多様な観点からリズムを比較することが可能である。なお、第1態様は、特徴比較手段が差分算定手段と第1補正値算定手段と第1補正手段と指標算定手段とを含む構成(第2補正値算定手段や第2補正手段の有無は不問)と、特徴比較手段が差分算定手段と第2補正値算定手段と第2補正手段と指標算定手段とを含む構成(第1補正値算定手段や第1補正手段の有無は不問)とに区分され得る。
本発明の第2態様において、特徴量抽出手段は、特徴算定手段が算定した特徴値のうち相異なる解析帯域に対応する複数の特徴値(例えば図8の特徴値rAi[1,n]〜rAi[M,n])に応じた第1補正値(例えば図8の第1補正値aTi[n])を解析期間毎に算定する第1補正値算定手段と、特徴算定手段が算定した特徴値のうち相異なる解析期間に対応する複数の特徴値(例えば図8の特徴値rAi[m,1]〜rAi[m,N])に応じた第2補正値(例えば図8の第2補正値aFi[m])を解析帯域毎に算定する第2補正値算定手段と、各解析期間の第1補正値を当該解析期間の各特徴値に作用させる第1補正手段と、各解析帯域の第2補正値を当該解析帯域の各特徴値に作用させる第2補正手段とを含んで構成される。第2態様の具体例は第2実施形態として後述される。
第2態様においては、特徴算定手段が算定した特徴値について、時間軸の方向の分布が第1補正値で補正され、周波数軸の方向の分布が第2補正値で補正される。したがって、例えば時間軸の方向の分布を強調するとともに周波数軸の方向の分布を平準化したリズム特徴量を算定するという具合に、多様な要求に沿ったリズム特徴量を生成することが可能となる。なお、第2態様は、特徴量抽出手段が第1補正値算定手段と第1補正手段とを含む構成(第2補正値算定手段や第2補正手段の有無は不問)と、特徴量抽出手段が第2補正値算定手段と第2補正手段とを含む構成(第1補正値算定手段や第1補正手段の有無は不問)とに区分され得る。
本発明は、以上の各形態で音響信号毎に生成されたリズム特徴量を相互に比較する楽曲解析装置としても特定され得る。楽曲間のリズムの比較に好適な楽曲解析装置は、楽曲の音響信号を区分した複数の単位期間を含むように当該楽曲の拍点の間隔を分割した複数の解析期間の各々と周波数軸上の複数の解析帯域の各々とに対応する解析単位毎に、音響信号の各単位期間のスペクトルのうち当該解析単位内の複数の成分値に応じた特徴値を配列したリズム特徴量を、第1音響信号および第2音響信号の各々について記憶する記憶手段と、第1音響信号および第2音響信号の各々のリズム特徴量を比較することで、第1音響信号と第2音響信号とのリズムの類否を示す類否指標値を算定する特徴比較手段とを具備する。以上の態様においては、複数の単位期間を含む解析期間を時間軸上の単位としてリズム特徴量の特徴値が算定されるから、単位期間毎に特徴値を算定する構成と比較して記憶手段に必要な容量が削減されるという利点がある。また、楽曲の拍点を基準として解析期間が画定されるから、複数の音響信号のテンポが相違する場合でも、双方を共通の時間軸のもとで対比することが可能である。したがって、特徴比較手段による処理の負荷が軽減されるという利点もある。
以上の各態様に係る楽曲解析装置は、楽曲の解析に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)などの汎用の演算処理装置とプログラムとの協働によっても実現される。本発明に係るプログラムは、楽曲の音響信号の単位期間毎にスペクトルを取得するスペクトル取得処理と、音響信号の拍点を特定する拍点特定処理と、複数の単位期間を含むように拍点の間隔を分割した複数の解析期間の各々と周波数軸上の複数の解析帯域の各々とに対応する解析単位毎に当該解析単位内のスペクトルの複数の成分値に応じた特徴値を算定する特徴算定処理を含み、解析単位毎の特徴値を配列したリズム特徴量を生成する特徴量抽出処理とをコンピュータに実行させる。以上のプログラムによれば、本発明に係る楽曲解析装置と同様の作用および効果が実現される。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で利用者に提供されてコンピュータにインストールされるほか、通信網を介した配信の形態でサーバ装置から提供されてコンピュータにインストールされる。
本発明の第1実施形態に係る楽曲解析装置のブロック図である。 信号解析部のブロック図である。 解析単位とリズム特徴量との関係を示す模式図である。 リズム画像の模式図である。 特徴比較部のブロック図である。 特徴比較部の動作の説明図である。 第2実施形態における信号解析部のブロック図である。 信号解析部の動作の説明図である。 特徴比較部のブロック図である。
<A:第1実施形態>
図1は、本発明の第1実施形態に係る楽曲解析装置100のブロック図である。楽曲解析装置100は、楽曲のリズム(各楽音の時間的な配列の構造)を解析する装置であり、演算処理装置12と記憶装置14と表示装置16とを具備するコンピュータシステムで実現される。
記憶装置14は、演算処理装置12が実行するプログラムPGMや演算処理装置12が使用する各種のデータを記憶する。半導体記録媒体や磁気記録媒体等の公知の記録媒体または複数種の記録媒体の組合せが記憶装置14として任意に採用され得る。
図1に示すように、記憶装置14は、音響信号X1および音響信号X2を記憶する。音響信号Xi(i=1,2)は、楽曲を構成する楽音(歌唱音や演奏音)の時間波形を表す信号であり、楽曲のうちリズムを特定可能な時間長の区間(例えば楽曲の小節の所定個分)について用意される。音響信号X1と音響信号X2とはリズムが相違し得る。例えば、音響信号X1と音響信号X2とは、リズムが相違する別個の楽曲の一部分を表す。ただし、音響信号X1と音響信号X2とが単一の楽曲内の別個の部分を表す構成や、音響信号Xiが楽曲の全体を表す構成も採用され得る。
演算処理装置12は、記憶装置14に記憶されたプログラムPGMの実行で、各音響信号Xiのリズムの解析や比較に必要な複数の機能(信号解析部22,表示制御部24,特徴比較部26)を実現する。信号解析部22は、音響信号Xiのリズムの特徴を示すリズム特徴量Ri(R1,R2)を生成する。表示制御部24は、信号解析部22が生成したリズム特徴量Riを表示装置16(例えば液晶表示装置)に画像として表示させる。特徴比較部26は、音響信号X1のリズム特徴量R1と音響信号X2のリズム特徴量R2とを比較する。なお、演算処理装置12の各機能を専用の電子回路(DSP)で実現した構成や、演算処理装置12の各機能を複数の集積回路に分散した構成も採用され得る。
図2は、信号解析部22のブロック図である。図2に示すように、信号解析部22は、スペクトル取得部32と拍点特定部34と特徴量抽出部36とを含んで構成される。スペクトル取得部32は、音響信号Xiを時間軸上で区分した所定長の単位期間(フレーム)FR毎に周波数領域のスペクトル(例えばパワースペクトル)PXを生成する。
図3の部分(A)は、スペクトル取得部32が生成するスペクトルPXの時系列(すなわちスペクトログラム)の模式図である。図3の部分(A)に示すように、音響信号Xiの各単位期間FRのスペクトルPXは、周波数軸上の相異なる周波数に対応する複数の成分値(パワー)cの数値列である。単位期間FR毎のスペクトルPXの生成には例えば短時間フーリエ変換等の公知の周波数分析が任意に採用され得る。
図2の拍点特定部34は、音響信号Xiの拍点Bを特定する。拍点Bは、楽曲のリズムの基礎となる時間軸上の時点であり、図3の部分(A)に示すように、基本的には時間軸上に等間隔に設定される。拍点Bの検出には公知の技術が任意に採用される。例えば、拍点特定部34は、時間軸上で音響信号Xiの音量が極大となる略等間隔の時点を拍点Bとして特定する。また、利用者が入力装置(図示略)の操作で音響信号Xi上の拍点Bを指定する構成も採用され得る。
図2の特徴量抽出部36は、スペクトル取得部32が生成した各スペクトルPXと拍点特定部34が特定した各拍点Bとを利用して音響信号Xiのリズム特徴量Riを生成する。リズム特徴量Riは、図3の部分(B)に示すように、特徴値ri[m,n](m=1〜M,n=1〜N)を縦M行×横N列にわたって配列した行列として表現される。第1実施形態の特徴量抽出部36は、特徴値ri[m,n](ri[1,1]〜ri[M,N])を算定する特徴算定部38を含んで構成される。
特徴算定部38は、図3の部分(A)に示すように、時間-周波数平面内にM×N個の行列状に配列する領域(以下「解析単位」という)U[1,1]〜U[M,N]を画定し、各解析単位U[m,n]についてリズム特徴量Riの特徴値ri[m,n](ri[1,1]〜ri[M,N])を算定する。解析単位U[m,n]は、周波数軸上に設定されたM個の帯域(以下「解析帯域」という)σF[1]〜σF[M]のうちの第m番目の解析帯域σF[m]と、時間軸上に設定されたN個の期間(以下「解析期間」という)σT[1]〜σT[N]のうちの第n番目の解析期間σT[n]との交差に対応する領域である。
図3の部分(A)に示すように、特徴算定部38は、各解析帯域σF[m]が1個のスペクトルPXの複数の成分値cを含むように周波数軸上にM個の解析帯域σF[1]〜σF[M]を設定する。具体的には、解析帯域σF[1]〜σF[M]の各々は、1オクターブに相当する帯域幅に設定される。なお、解析帯域σF[1]〜σF[M]の各々を1オクターブの整数倍や1オクターブの整数分の1の帯域幅に設定した構成も採用され得る。
また、特徴算定部38は、時間軸上で相前後する各拍点Bの間隔をk個(kは2以上の自然数)に等分することで時間軸上にN個の解析期間σT[1]〜σT[N]を設定する。したがって、解析期間σT[n]の総数Nは、拍点特定部34が特定した拍点Bの総数NBを利用して{(NB−1)×k}と表現される。図3の部分(A)に示すように、各解析期間σT[n]は、複数の単位期間FRを含んで構成される。
例えば、解析期間σT[1]〜σT[N]の各々は、音響信号Xiの各拍点Bの間隔を16等分(k=16)した期間長に設定される。相前後する各拍点Bの間隔が楽曲の4分音符の時間長に相当する場合を想定すると、各拍点Bの間隔の16等分で画定される1個の解析期間σT[n]は、楽曲の64分音符の時間長に相当する。したがって、解析期間σT[n]の時間長(解析期間σT[n]内の単位区間FRの個数)は、音響信号Xiが表す楽曲のテンポに応じて変化する。すなわち、楽曲のテンポが速い(各拍点Bの間隔が短い)ほど解析期間σT[n]は短い時間長に設定される。
図2の特徴算定部38は、音響信号XiのスペクトルPXの時系列のうち解析単位U[m,n]に属する複数の成分値cからリズム特徴量Riの特徴値ri[m,n](ri[1,1]〜ri[M,N])を算定する。具体的には、特徴算定部38は、解析期間σT[n]内の各単位期間FRのスペクトルPXのうち解析帯域σF[m]内の複数の成分値cの平均値(相加平均)を特徴値ri[m,n]として算定する。したがって、音響信号Xiのうち解析帯域σF[m]の成分の解析期間σT[n]での強度が高いほど特徴値ri[m,n]は大きい数値に設定される。
図1の信号解析部22は、音響信号X1および音響信号X2の各々について以上の手順でリズム特徴量Ri(R1,R2)を順次に生成する。信号解析部22が生成したリズム特徴量Riは記憶装置14に格納される。
表示制御部24は、信号解析部22が生成したリズム特徴量Ri(R1,R2)を模式的に表現した図4の画像(以下「リズム画像」という)Giを表示装置16に表示させる。図4に例示された各リズム画像Giは、各解析単位U[m,n]に対応する単位図形u[m,n]を、相互に直交する時間軸(横軸)と周波数軸(縦軸)とに沿って縦M行×横N列の行列状に配列した画像である。図4に示すように、音響信号X1のリズム特徴量R1のリズム画像G1と音響信号X2のリズム特徴量R2のリズム画像G2とが共通の時間軸のもとで並列に表示される。したがって、利用者は、音響信号X1と音響信号X2とのリズムの類否を視覚的に評価することが可能である。
各リズム画像Giにおいて第m行の第n列に位置する単位図形u[m,n]の表示態様(色相や階調)は、リズム特徴量Ri内の特徴値ri[m,n]に応じて可変に設定される。図4では、各特徴値ri[m,n]が単位図形u[m,n]の階調で便宜的に表現されている。以上のように、特徴値ri[m,n]を表現した単位図形u[m,n]が、時間-周波数平面での解析単位U[m,n]の配列に対応するように行列状に配置されるから、各解析帯域σF[n]内の楽音が発生する時点(解析期間σT[n])と楽音の強度(特徴値ri[m,n])との組合せ(すなわちリズムのパターン)を利用者が直感的に把握できるという利点がある。
また、特徴値ri[m,n]の時間軸上の単位となる解析期間σT[n]は楽曲の拍点Bを基準に設定されるから、音響信号X1と音響信号X2とで楽曲のテンポが相違する場合でも、時間軸の方向における各単位図形u[m,n]の位置や寸法(横幅)はリズム画像G1とリズム画像G2とで共通する。したがって、音響信号X1と音響信号X2とでテンポが相違する場合でも両者のリズムを容易に対比できるという利点がある。
図1の特徴比較部26は、音響信号X1のリズム特徴量R1(r1[1,1]〜r1[M,N])と音響信号X2のリズム特徴量R2(r2[1,1]〜r2[M,N])とを比較することで、音響信号X1と音響信号X2とのリズムの類否の尺度となる数値(以下「類否指標値」という)Qを算定する。図5は、特徴比較部26のブロック図であり、図6は、特徴比較部26の動作の説明図である。図5に示すように、特徴比較部26は、差分算定部42と第1補正値算定部44と第2補正値算定部46と第1補正部52と第2補正部54と指標算定部56とを含んで構成される。図6では、特徴比較部26の各要素の処理に該当する箇所に当該要素の符号が付記されている。
図5の差分算定部42は、リズム特徴量R1とリズム特徴量R2との差分に相当する差分値系列DAを生成する。差分値系列DAは、図6に示すように、要素値dA[1,1]〜dA[M,N]を縦M行×横N列にわたって配列した行列である。要素値dA[m,n]は、以下の数式(A1)に示すように、リズム特徴量R1の特徴値r1[m,n]とリズム特徴量R2の特徴値r2[m,n]との差分δ[m,n](δ[m,n]=r1[m,n]−r2[m,n])から平均値rA[m]を減算した数値の絶対値である。平均値rA[m]は、解析帯域σF[m]に対応するN個の差分δ[m,1]〜δ[m,N]の平均(時間平均)を意味する。
dA[m,n]=|δ[m,n]−rA[m]| ……(A1)
図5の第1補正値算定部44は、音響信号X1および音響信号X2の各々について補正値系列ATi(AT1,AT2)を生成する。図6に示すように、補正値系列ATiは、解析期間σT[1]〜σT[N]に対応するN個の補正値aTi[1]〜aTi[N]の数値列である。補正値系列ATiの第n番目の補正値aTi[n]は、音響信号Xiのリズム特徴量Riのうち解析期間σT[n]に対応するM個の特徴値ri[1,n]〜ri[M,n]に応じて算定される。例えば、M個の特徴値ri[1,n]〜ri[M,n]の加算値または平均値が補正値aTi[n]として算定される。したがって、音響信号Xiの全帯域にわたる解析期間σT[n]での強度(音量)が大きいほど補正値系列ATiの補正値aTi[n]は大きい数値となる。
図5の第2補正値算定部46は、音響信号X1および音響信号X2の各々について補正値系列AFi(AF1,AF2)を生成する。図6に示すように、補正値系列AFiは、解析帯域σF[1]〜σF[M]に対応するM個の補正値aFi[1]〜aFi[M]の数値列である。補正値系列AFiの第m番目の補正値aFi[m]は、音響信号Xiのリズム特徴量Riのうち解析帯域σF[m]に対応するN個の特徴値ri[m,1]〜ri[m,N]に応じて算定される。例えば、N個の特徴値ri[m,1]〜ri[m,N]の平均値rA1[m]を各々から減算したN個の数値(平均値rA1[m]との差分値の系列)ri'[m,1]〜ri'[m,N](ri'[m,n]=ri[m,n]−rA1[m])の絶対値の平均値または加算値が補正値aFi[m]として算定される。したがって、音響信号Xiの全期間にわたる解析帯域σF[m]内の成分の強度が大きいほど補正値系列AFiの補正値aFi[m]は大きい数値となる。
図5の第1補正部52は、第1補正値算定部44が生成した補正値系列AT1および補正値系列AT2を、差分算定部42が生成した差分値系列DAに作用させることで、差分値系列DB(要素値dB[1,1]〜dB[M,N]で構成される縦M行×横N列の行列)を生成する。具体的には、以下の数式(A2)および図6に示すように、差分値系列DBの第n列の各要素値dB[m,n]は、補正値系列AT1と補正値系列AT2との加算値(aT1[n]+aT2[n])を差分値系列DAの第n列の要素値dA[m,n]に乗算した数値に設定される。したがって、差分値系列DBの要素値dB[m,n]は、解析期間σT[n]における音響信号X1または音響信号X2の強度が高いほど、差分値系列DAの要素値dA[m,n]と比較して大きい数値に強調される。すなわち、第1補正部52は、時間軸の方向に配列する要素値dA[m,1]〜dA[m,N]の分布を補正する要素として機能する。
dB[m,n]=dA[m,n]×(aT1[n]+aT2[n]) ……(A2)
図5の第2補正部54は、第2補正値算定部46が生成した補正値系列AF1および補正値系列AF2を第1補正部52による補正後の差分値系列DBに作用させることで差分値系列DCを生成する。差分値系列DCは、図6に示すように、要素値dC[1,1]〜dC[M,N]で構成される縦M行×横N列の行列として表現される。以下の数式(A3)および図6に示すように、差分値系列DCの要素値dC[m,n]は、補正値系列AF1と補正値系列AF2の加算値(aF1[m]+aF2[m])で差分値系列DBの要素値dB[m,n]を除算した数値に設定される。したがって、差分値系列DCにおける解析帯域σF[m]毎の要素値dC[m,n]の相違(偏在)は、差分値系列DBの要素値dB[m,n]と比較して低減(平準化)される。すなわち、第2補正部54は、周波数軸の方向に配列する要素値dB[1,n]〜dB[M,n]の分布を補正する要素として機能する。
dC[m,n]=dB[m,n]/(aF1[m]+aF2[m]) ……(A3)
以上の説明から理解されるように、音響信号X1の特徴値r1[m,n]と音響信号X2の特徴値r2[m,n]との相違が大きいほど、第2補正部54による補正後の差分値系列DCの要素値dC[m,n]は大きい数値となる。しかも、差分値系列DCでは、各音響信号Xiの強度が高い解析期間σT[n]の要素値dC[m,n]ほど強調され、かつ、各音響信号Xiでの解析帯域σF[m]毎の強度の差異の影響が低減される。
図5の指標算定部56は、第2補正部54による補正後の差分値系列DC(要素値dC[1,1]〜dC[M,N])から類否指標値Qを算定する。具体的には、指標算定部56は、解析帯域σF[m]毎のN個の要素値dC[m,1]〜dC[m,N]の平均値(加算値)をM個の解析帯域σF[1]〜σF[M]について加算または平均することで類否指標値Q(1個のスカラ値)を算定する。以上の説明から理解されるように、音響信号X1のリズム特徴量R1と音響信号X2のリズム特徴量R2とが類似するほど類否指標値Qは小さい数値となる。指標算定部56が算定した類否指標値Qは、例えば表示装置16に表示される。利用者は、類否指標値Qを確認することで音響信号X1と音響信号X2とのリズムの類否を認識する。
以上の形態においては、複数の単位期間FRで構成される解析期間σT[n]を時間軸上の単位としてリズム特徴量RiのN個の特徴値ri[m,n](ri[m,1]〜ri[m,N])が算定されるから、単位期間FR毎にリズムの特徴値を算定する構成と比較してリズム特徴量Riのデータ量が削減されるという利点がある。しかも、解析期間σT[n]は楽曲の拍点Bを基準として(すなわち、各拍点Bの間隔の等分で)設定されるから、音響信号X1と音響信号X2とでテンポが相違する場合でも、リズム特徴量R1とリズム特徴量R2とを共通の時間軸のもとで対比することが可能である。すなわち、リズムの比較の対象となる各音響信号の時間軸を整合させるために非特許文献1の技術で必要となる音響信号の伸縮処理(例えばDPマッチング)は、第1実施形態では原理的には不要である。したがって、楽曲間のリズムの比較に必要な処理の負荷が軽減されるという利点がある。
また、以上の形態では、スペクトルPXの複数の成分値cを含む帯域幅の解析帯域σF[m]を周波数軸上の単位としてリズム特徴量RiのM個の特徴値ri[m,n](ri[1,n]〜ri[M,n])が算定されるから、周波数軸上の各成分値cをリズム特徴量Riとする構成と比較してデータ量が削減されるという利点がある。しかも、第1実施形態では解析帯域σF[m]が1オクターブに設定されるから、音域が相違する各楽器のリズムをリズム特徴量Riから容易に把握できるという利点がある。
<B:第2実施形態>
次に、本発明の第2実施形態について説明する。第1実施形態では、信号解析部22が生成したリズム特徴量Riを、特徴比較部26による比較時に補正値系列ATiおよび補正値系列AFiで補正した。第2実施形態では、補正値系列ATiおよび補正値系列AFiによる補正後のリズム特徴量Riを信号解析部22が生成する。なお、以下の各例示において作用や機能が第1実施形態と同等である要素については、以上で参照した符号を流用して各々の詳細な説明を適宜に省略する。
図7は、第2実施形態における特徴量抽出部36Aのブロック図であり、図8は、特徴量抽出部36Aの動作の説明図である。図7に示すように、第2実施形態の特徴量抽出部36Aは、第1補正値算定部62と第2補正値算定部64と第1補正部66と第2補正部68とを第1実施形態の特徴量抽出部36(特徴算定部38)に追加した構成である。特徴算定部38は、第1実施形態での特徴値ri[1,1]〜ri[M,N]の算定と同様の方法でリズム特徴量RAiの特徴値rAi[1,1]〜rAi[M,N]を生成する。第1実施形態のリズム特徴量Ri(特徴値ri[m,n])と第2実施形態のリズム特徴量RAi(特徴値rAi[m,n])とは同様であるが、説明の便宜のために形式的に符号を相違させている。
図7の第1補正値算定部62は、図8に示すように、第1実施形態の第1補正値算定部44と同様の方法で、リズム特徴量RAiに応じた補正値系列ATi(第1補正値aTi[1]〜aTi[N]の系列)を生成する。すなわち、補正値系列ATiの第n番目の補正値aTi[n]は、第1実施形態と同様に、リズム特徴量RAiの第n列のM個の特徴値rAi[1,n]〜rAi[M,n]の平均または加算で算定される。したがって、音響信号Xiの全帯域にわたる解析期間σT[n]での強度(音量)が大きいほど補正値系列ATiの補正値aTi[n]は大きい数値となる。
図7の第2補正値算定部64は、図8に示すように、第1実施形態の第2補正値算定部46と同様の方法で、リズム特徴量RAiに応じた補正値系列AFi(第2補正値aFi[1]〜aFi[M]の系列)を生成する。すなわち、補正値系列AFiの第m番目の補正値aFi[m]は、第1実施形態と同様に、リズム特徴量RAiの第m行のN個の特徴値rAi[m,1]〜rAi[m,N]の平均または加算で算定される。したがって、音響信号Xiの全期間にわたる解析帯域σF[m]の成分の強度が大きいほど補正値系列AFiの補正値aFi[m]は大きい数値となる。
図7の第1補正部66は、図8に示すように、第1補正値算定部62が生成した補正値系列ATiを特徴算定部38が生成したリズム特徴量RAiに作用させることでリズム特徴量RBi(特徴値rBi[1,1]〜rBi[M,N]で構成される縦M行×横N列の行列)を生成する。具体的には、リズム特徴量RBiの第n列の各特徴値rBi[m,n]は、補正値系列ATiの補正値aTi[n]をリズム特徴量RAiの第n列の特徴値rAi[m,n]に乗算した数値に設定される(rBi[m,n]=rAi[m,n]×aTi[n])。したがって、リズム特徴量RBiの特徴値rBi[m,n]は、解析期間σT[n]における音響信号Xiの強度が高いほど、リズム特徴量RAiの特徴値rAi[m,n]と比較して大きい数値に強調される。すなわち、第1補正部66は、リズム特徴量RAiにおける特徴値rAi[m,1]〜rAi[m,N]の分布を補正する要素として機能する。
図7の第2補正部68は、図8に示すように、第2補正値算定部64が生成した補正値系列AFiを第1補正部66による補正後のリズム特徴量RBiに作用させることでリズム特徴量Ri(特徴値ri[1,1]〜ri[M,N]で構成される縦M行×横N列の行列)を生成する。具体的には、リズム特徴量Riの第m行の各特徴値ri[m,n]は、リズム特徴量RBiの特徴値rBi[m,n]を補正値系列AFiの補正値aFi[m]で除算した数値に設定される(ri[m,n]=rBi[m,n]/aFi[m])。したがって、リズム特徴量Riにおける解析帯域σF[m]毎の特徴値ri[m,n]の相違は、リズム特徴量RBiの特徴値rBi[m,n]と比較して低減(平準化)される。すなわち、第2補正部68は、リズム特徴量RBiにおける特徴値rBi[1,n]〜rBi[M,n]の分布を補正する要素として機能する。
信号解析部22(特徴量抽出部36)が以上の手順で生成した音響信号X1のリズム特徴量R1および音響信号X2のリズム特徴量R2が記憶装置14に記憶される。表示制御部24は、各リズム特徴量Riに対応するリズム画像Gi(図4)を第1実施形態と同様に表示装置16に表示させる。また、特徴比較部26は、音響信号X1のリズム特徴量R1と音響信号X2のリズム特徴量R2との比較で類否指標値Qを算定する。
図9は、第2実施形態の特徴比較部26Aのブロック図である。図9に示すように、特徴比較部26Aは、差分算定部42と指標算定部56とを具備する。すなわち、第2実施形態の特徴比較部26Aは、第1補正値算定部44と第2補正値算定部46と第1補正部52と第2補正部54とを第1実施形態の特徴比較部26(図5)から省略した構成である。
図9の差分算定部42は、リズム特徴量R1とリズム特徴量R2との差分に相当する差分値系列DA(要素値dA[1,1]〜dA[M,N]で構成される縦M行×横N列の行列)を生成する。差分値系列DAの生成の方法は第1実施形態と同様である。指標算定部56は、差分算定部42が生成した差分値系列DAから類否指標値Qを算定する。具体的には、指標算定部56は、差分値系列DAにおける解析帯域σF[m]毎のN個の要素値dA[m,1]〜dA[m,N]の平均値(加算値)をM個の解析帯域σF[1]〜σF[M]について加算または平均することで類否指標値Qを算定する。したがって、第1実施形態と同様に、音響信号X1のリズム特徴量R1と音響信号X2のリズム特徴量R2とが類似するほど類否指標値Qは小さい数値となる。第2実施形態においても第1実施形態と同様の効果が実現される。
<C:変形例>
以上の各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
(1)変形例1
特徴算定部38による特徴値ri[m,n](第2実施形態では特徴値rAi[m,n])の算定の方法は、解析単位U[m,n]内の複数の成分値cの平均(相加平均)に限定されない。例えば、解析単位U[m,n]内の複数の成分値cの加重和や加算値や中央値を特徴値ri[m,n]として算定する構成も採用され得る。例えば、時間軸上で拍点Bに近い単位期間FRの成分値cほど加重値を大きい数値に設定して各成分値cの加重和を特徴値ri[m,n]として算定する構成によれば、拍点Bの近傍の楽音の影響を強調したリズム特徴量Riを生成できるという利点がある。以上の各例示から理解されるように、特徴算定部38は、解析単位U[m,n]内の複数の成分値cに応じた特徴値ri[m,n]を算定する要素として包括される。
(2)変形例2
補正値系列ATiを適用した補正の方法は以上の例示に限定されない。例えば、第1実施形態では、補正値系列ATiの第1補正値aTi[n](aT1[n]+aT2[n])を差分値系列DAの要素値dA[m,n]に加算する構成が採用され得る。第2実施形態でも同様に、補正値系列ATiの第1補正値aTi[n]をリズム特徴量RAiの特徴値rAi[m,n]に加算する構成が採用され得る。補正値系列AFiを適用した補正の方法も以上の例示に限定されない。例えば、第1実施形態では、補正値系列AFiの第2補正値aFi[m](aF1[m]+aF2[m])を差分値系列DBの要素値dB[m,n]から減算する構成が採用され得る。また、第2実施形態では、補正値系列AFiの第2補正値aFi[m]をリズム特徴量RBiの特徴値rBi[m,n]から減算する構成が採用され得る。
また、第1実施形態では、要素値dB[m,n]の解析帯域σF[m]毎の差異(偏在)を低減するために要素値dB[m,n]を第2補正値aFi[m]で除算したが、要素値dB[m,n]に対して第2補正値aFi[m]を乗算または加算することで、要素値dB[m,n]の解析帯域σF[m]毎の差異(偏在)を強調する構成も採用され得る。第2実施形態においても同様であり、例えば、リズム特徴量RBiの特徴値rBi[m,n]に第2補正値aFi[m]を乗算または加算することで、特徴値rBi[m,n]の解析帯域σF[m]毎の差異を強調する構成も採用され得る。
(3)変形例3
第1実施形態において、第1補正部52による補正(補正値系列ATiの乗算)と第2補正部54による補正(補正値系列AFiの除算)との順序は逆転され得る。また、補正値系列ATiを適用した補正(第1補正値算定部44および第1補正部52)と補正値系列AFiを適用した補正(第2補正値算定部46および第2補正部54)との片方または双方は省略され得る。第2実施形態においても同様に、第1補正部66と第2補正部68とを逆転させた構成や、補正値系列ATiによる補正および補正値系列AFiによる補正の片方または双方を省略した構成が採用され得る。
(4)変形例4
以上の各形態ではスペクトル取得部32が音響信号XiからスペクトルPXを生成したが、単位期間FR毎のスペクトルPXを取得する方法は任意である。例えば、音響信号Xiの単位期間FR毎のスペクトルPXが記憶装置14に格納された構成(したがって音響信号Xiの記憶は省略され得る)では、スペクトル取得部32は、記憶装置14から各スペクトルPXを取得する。なお、記憶装置14に音響信号Xiが記憶されない構成では、単位期間FR毎のスペクトルPXから音響信号Xiの拍点Bが特定され得る。
(5)変形例5
以上の各形態では、信号解析部22および特徴比較部26の双方を具備する楽曲解析装置100を例示したが、信号解析部22および特徴比較部26の片方のみを具備する楽曲解析装置としても本発明は実現され得る。すなわち、音響信号Xiのリズムの解析(リズム特徴量Riの生成)に利用される楽曲解析装置(以下「解析用装置」という)は、以上の各形態の信号解析部22を具備し、特徴比較部26を省略した構成である。他方、音響信号X1と音響信号X2とのリズムの比較(類否指標値Qの算定)に利用される楽曲解析装置(以下「比較用装置」という)は、以上の各形態の特徴比較部26を具備し、信号解析部22を省略した構成である。解析用装置の信号解析部22が生成したリズム特徴量Riは、例えば通信網や可搬型の記録媒体を介して、比較用装置に提供されて記憶装置14に格納される。比較用装置の特徴比較部26は、記憶装置14に記憶された各リズム特徴量Riの比較で類否指標値Qを算定する。
100……楽曲解析装置、12……演算処理装置、14……記憶装置、16……表示装置、22……信号解析部、24……表示制御部、26……特徴比較部、32……スペクトル取得部、34……拍点特定部、36……特徴量抽出部、38……特徴算定部、42……差分算定部、44,62……第1補正値算定部、46,64……第2補正値算定部、52、66……第1補正部、54,68……第2補正部、56……指標算定部。

Claims (4)

  1. 楽曲の音響信号の単位期間毎にスペクトルを取得するスペクトル取得手段と、
    前記音響信号の拍点を特定する拍点特定手段と、
    複数の前記単位期間を含むように前記拍点の間隔を分割した複数の解析期間の各々と周波数軸上の複数の解析帯域の各々とに対応する解析単位毎に当該解析単位内の前記スペクトルの複数の成分値に応じた特徴値を算定する特徴算定手段を含み、前記解析単位毎の特徴値を含むリズム特徴量を生成する特徴量抽出手段と
    第1音響信号および第2音響信号の各々について前記特徴量抽出手段が生成したリズム特徴量を比較することで、前記第1音響信号と前記第2音響信号とのリズムの類否を示す類否指標値を算定する特徴比較手段とを具備し、
    前記特徴比較手段は、
    前記第1音響信号のリズム特徴量と前記第2音響信号のリズム特徴量との特徴値の差分に応じた要素値を前記解析単位毎に算定する差分算定手段と、
    前記第1音響信号および前記第2音響信号の各々について、当該音響信号のリズム特徴量のうち相異なる解析帯域に対応する複数の特徴値に応じた第1補正値を解析期間毎に算定する第1補正値算定手段と、
    前記第1音響信号および前記第2音響信号の各々について生成された各解析期間の第1補正値を当該解析期間の前記要素値に作用させる第1補正手段と、
    前記第1補正手段による処理後の各要素値から前記類否指標値を算定する指標算定手段とを含む
    楽曲解析装置。
  2. 楽曲の音響信号の単位期間毎にスペクトルを取得するスペクトル取得手段と、
    前記音響信号の拍点を特定する拍点特定手段と、
    複数の前記単位期間を含むように前記拍点の間隔を分割した複数の解析期間の各々と周波数軸上の複数の解析帯域の各々とに対応する解析単位毎に当該解析単位内の前記スペクトルの複数の成分値に応じた特徴値を算定する特徴算定手段を含み、前記解析単位毎の特徴値を含むリズム特徴量を生成する特徴量抽出手段と
    第1音響信号および第2音響信号の各々について前記特徴量抽出手段が生成したリズム特徴量を比較することで、前記第1音響信号と前記第2音響信号とのリズムの類否を示す類否指標値を算定する特徴比較手段とを具備し、
    前記特徴比較手段は、
    前記第1音響信号のリズム特徴量と前記第2音響信号のリズム特徴量との特徴値の差分に応じた要素値を前記解析単位毎に算定する差分算定手段と、
    前記第1音響信号および前記第2音響信号の各々について、当該音響信号のリズム特徴量のうち相異なる解析期間に対応する複数の特徴値に応じた第2補正値を解析帯域毎に算定する第2補正値算定手段と、
    前記第1音響信号および前記第2音響信号の各々について生成された各解析帯域の第2補正値を当該解析帯域の前記要素値に作用させる第2補正手段と、
    前記第2補正手段による処理後の各要素値から前記類否指標値を算定する指標算定手段とを含む
    楽曲解析装置。
  3. 楽曲の音響信号の単位期間毎にスペクトルを取得するスペクトル取得手段と、
    前記音響信号の拍点を特定する拍点特定手段と、
    複数の前記単位期間を含むように前記拍点の間隔を分割した複数の解析期間の各々と周波数軸上の複数の解析帯域の各々とに対応する解析単位毎に当該解析単位内の前記スペクトルの複数の成分値に応じた特徴値を算定する特徴算定手段を含み、前記解析単位毎の特徴値を含むリズム特徴量を生成する特徴量抽出手段とを具備し、
    前記特徴量抽出手段は、
    前記特徴算定手段が算定した特徴値のうち相異なる解析帯域に対応する複数の特徴値に応じた第1補正値を解析期間毎に算定する第1補正値算定手段と、
    前記各解析期間の第1補正値を当該解析期間の各特徴値に作用させる第1補正手段とを含む
    楽曲解析装置。
  4. 楽曲の音響信号の単位期間毎にスペクトルを取得するスペクトル取得手段と、
    前記音響信号の拍点を特定する拍点特定手段と、
    複数の前記単位期間を含むように前記拍点の間隔を分割した複数の解析期間の各々と周波数軸上の複数の解析帯域の各々とに対応する解析単位毎に当該解析単位内の前記スペクトルの複数の成分値に応じた特徴値を算定する特徴算定手段を含み、前記解析単位毎の特徴値を含むリズム特徴量を生成する特徴量抽出手段とを具備し、
    前記特徴量抽出手段は、
    前記特徴算定手段が算定した特徴値のうち相異なる解析期間に対応する複数の特徴値に応じた第2補正値を解析帯域毎に算定する第2補正値算定手段と、
    前記各解析帯域の第2補正値を当該解析帯域の各特徴値に作用させる第2補正手段とを含む
    楽曲解析装置。
JP2010088353A 2010-04-07 2010-04-07 楽曲解析装置 Expired - Fee Related JP5560861B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2010088353A JP5560861B2 (ja) 2010-04-07 2010-04-07 楽曲解析装置
US13/081,337 US8487175B2 (en) 2010-04-07 2011-04-06 Music analysis apparatus
EP11161256.0A EP2375407B1 (en) 2010-04-07 2011-04-06 Music analysis apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010088353A JP5560861B2 (ja) 2010-04-07 2010-04-07 楽曲解析装置

Publications (2)

Publication Number Publication Date
JP2011221156A JP2011221156A (ja) 2011-11-04
JP5560861B2 true JP5560861B2 (ja) 2014-07-30

Family

ID=44278635

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010088353A Expired - Fee Related JP5560861B2 (ja) 2010-04-07 2010-04-07 楽曲解析装置

Country Status (3)

Country Link
US (1) US8487175B2 (ja)
EP (1) EP2375407B1 (ja)
JP (1) JP5560861B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102640211B (zh) * 2010-12-01 2013-11-20 雅马哈株式会社 根据与节奏模式的相似度搜索乐音数据组
JP5333517B2 (ja) * 2011-05-26 2013-11-06 ヤマハ株式会社 データ処理装置およびプログラム
JP5935503B2 (ja) * 2012-05-18 2016-06-15 ヤマハ株式会社 楽曲解析装置および楽曲解析方法
JP6743425B2 (ja) 2016-03-07 2020-08-19 ヤマハ株式会社 音信号処理方法および音信号処理装置
EP3220386A1 (en) * 2016-03-18 2017-09-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for harmonic-percussive-residual sound separation using a structure tensor on spectrograms
JP2018170678A (ja) * 2017-03-30 2018-11-01 株式会社ライブ・アース ライブ映像処理システム、ライブ映像処理方法及びプログラム
JP6708179B2 (ja) * 2017-07-25 2020-06-10 ヤマハ株式会社 情報処理方法、情報処理装置およびプログラム
US11024288B2 (en) * 2018-09-04 2021-06-01 Gracenote, Inc. Methods and apparatus to segment audio and determine audio segment similarities
CN110688518A (zh) * 2019-10-12 2020-01-14 广州酷狗计算机科技有限公司 节奏点的确定方法、装置、设备及存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6663491B2 (en) * 2000-02-18 2003-12-16 Namco Ltd. Game apparatus, storage medium and computer program that adjust tempo of sound
DE60041118D1 (de) * 2000-04-06 2009-01-29 Sony France Sa Extraktor von Rythmuseigenschaften
US20030205124A1 (en) * 2002-05-01 2003-11-06 Foote Jonathan T. Method and system for retrieving and sequencing music by rhythmic similarity
WO2007010637A1 (ja) 2005-07-19 2007-01-25 Kabushiki Kaisha Kawai Gakki Seisakusho テンポ検出装置、コード名検出装置及びプログラム
US7645929B2 (en) * 2006-09-11 2010-01-12 Hewlett-Packard Development Company, L.P. Computational music-tempo estimation
US7812241B2 (en) * 2006-09-27 2010-10-12 The Trustees Of Columbia University In The City Of New York Methods and systems for identifying similar songs
US7659471B2 (en) * 2007-03-28 2010-02-09 Nokia Corporation System and method for music data repetition functionality
JP4613923B2 (ja) * 2007-03-30 2011-01-19 ヤマハ株式会社 楽音処理装置およびプログラム
US20080300702A1 (en) * 2007-05-29 2008-12-04 Universitat Pompeu Fabra Music similarity systems and methods using descriptors
JP4973537B2 (ja) 2008-02-19 2012-07-11 ヤマハ株式会社 音響処理装置およびプログラム
JP2010032809A (ja) * 2008-07-29 2010-02-12 Kawai Musical Instr Mfg Co Ltd 自動演奏装置及び自動演奏用コンピュータ・プログラム
JP2010054802A (ja) * 2008-08-28 2010-03-11 Univ Of Tokyo 音楽音響信号からの単位リズムパターン抽出法、該方法を用いた楽曲構造の推定法、及び、音楽音響信号中の打楽器パターンの置換法

Also Published As

Publication number Publication date
US8487175B2 (en) 2013-07-16
JP2011221156A (ja) 2011-11-04
US20110271819A1 (en) 2011-11-10
EP2375407B1 (en) 2015-05-27
EP2375407A1 (en) 2011-10-12

Similar Documents

Publication Publication Date Title
JP5560861B2 (ja) 楽曲解析装置
JP5454317B2 (ja) 音響解析装置
US20110314995A1 (en) Intervalgram Representation of Audio for Melody Recognition
US9257111B2 (en) Music analysis apparatus
JP6019858B2 (ja) 楽曲解析装置および楽曲解析方法
Magron et al. Model-based STFT phase recovery for audio source separation
CN104395953A (zh) 来自音乐音频信号的拍子、和弦和强拍的评估
US20140020546A1 (en) Note Sequence Analysis Apparatus
JP2009031486A (ja) 演奏音の類似度を評価する方法、装置およびプログラム
Miron et al. Monaural score-informed source separation for classical music using convolutional neural networks
EP2650875B1 (en) Music tracks order determination using a table of correlations of beat positions between segments.
JP5141397B2 (ja) 音声処理装置およびプログラム
JP6197569B2 (ja) 音響解析装置
Song et al. CatNet: Music source separation system with mix-audio augmentation
CN107210029B (zh) 用于处理一连串信号以进行复调音符辨识的方法和装置
CN109584902B (zh) 一种音乐节奏确定方法、装置、设备及存储介质
Han et al. Reconstructing completely overlapped notes from musical mixtures
JP2015200685A (ja) アタック位置検出プログラムおよびアタック位置検出装置
Wang et al. Automatic music transcription dedicated to Chinese traditional plucked string instrument pipa using multi-string probabilistic latent component analysis models
Kirchhoff et al. Towards complex matrix decomposition of spectrograms based on the relative phase offsets of harmonic sounds
JP5879813B2 (ja) 複数音源の識別装置および複数音源に連動する情報処理装置
CN113557565A (zh) 乐曲解析方法及乐曲解析装置
JP6565529B2 (ja) 自動アレンジ装置及びプログラム
Finkelstein Music Segmentation Using Markov Chain Methods
Mallick et al. Using Musical Beats to Segment Videos of Bharatanatyam Adavus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140225

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140416

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140513

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140526

R150 Certificate of patent or registration of utility model

Ref document number: 5560861

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees