JP2008304610A - 信号特徴抽出方法、信号探索方法、信号特徴抽出装置、コンピュータプログラム、及び、記録媒体 - Google Patents

信号特徴抽出方法、信号探索方法、信号特徴抽出装置、コンピュータプログラム、及び、記録媒体 Download PDF

Info

Publication number
JP2008304610A
JP2008304610A JP2007150315A JP2007150315A JP2008304610A JP 2008304610 A JP2008304610 A JP 2008304610A JP 2007150315 A JP2007150315 A JP 2007150315A JP 2007150315 A JP2007150315 A JP 2007150315A JP 2008304610 A JP2008304610 A JP 2008304610A
Authority
JP
Japan
Prior art keywords
vector
similarity
frame
feature
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007150315A
Other languages
English (en)
Other versions
JP2008304610A5 (ja
JP4601643B2 (ja
Inventor
Tomonori Izumitani
知範 泉谷
Kunio Kayano
邦夫 柏野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2007150315A priority Critical patent/JP4601643B2/ja
Publication of JP2008304610A publication Critical patent/JP2008304610A/ja
Publication of JP2008304610A5 publication Critical patent/JP2008304610A5/ja
Application granted granted Critical
Publication of JP4601643B2 publication Critical patent/JP4601643B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】参照信号と蓄積信号が異なる調で演奏された場合でも1回の照合で正しい探索結果を出力し、また、演奏されるテンポが異なる場合にも正しく探索結果を出力する。
【解決手段】音響信号を短時間に分割した各フレームにおける各周波数のパワー値を表すベクトルを時間方向に並べて周波数特徴を生成し、生成した周波数特徴におけるあるフレームのベクトルと、当該フレームとは異なるフレームのベクトルとの類似度を算出し、算出した各類似度を要素とした自己類似度ベクトルを生成し、生成した自己類似度ベクトルを蓄積特徴ベクトル列としてデータベースに書き込む。また、参照音響信号について同様に自己類似度ベクトルを生成して参照特徴ベクトル列とする。参照特徴ベクトル列と、データベース内の蓄積特徴ベクトル列とをフレームを移動しながら照合して、照合スコアの高い楽曲および時刻を特定し、その楽曲に付随する情報と時刻を出力する。
【選択図】図1

Description

本発明は、信号特徴抽出方法、信号探索方法、信号特徴抽出装置、コンピュータプログラム、及び、記録媒体に関する。
参照音響信号と類似する箇所を蓄積音響信号の中を探索して検出する従来の方法には、特に、オリジナルが同一の信号ではなく、また、蓄積音響信号と参照音響信号のどちらか一方又は両方が単旋律ではなく、同時に複数の音が演奏される場合にも適用可能な方法として、特許文献1に記載されているような、12音階に対応する周波数のパワー値で音響特徴を表現して探索を行う手法が知られている。同様の考え方に基づく音響特徴の表現は、非特許文献1においても採用されており、同一曲内での類似箇所の検出に使われている。
また、非特許文献2では、同一楽曲内の2点間の音響特徴の類似度を用いて楽曲の音響的構造を表現する手法を提案しており、この手法を音楽探索に応用する方法も同時に提案している。
特開2003−44082号公報 M. Goto,"A chorus-section detecting method for musical audio signals",in Proc. of ICASSP,pp. 437-440,2003. J. Foote,"Visualizing music and audio using self-similarity",Proc. of ACM Multimedia,pp.77-80,1999.
上述する特許文献1や非特許文献1の方法を用いて、移調された音楽の探索を行う場合には、参照音響信号に対して、移調の可能性のある12種類の特徴ベクトルを算出し、それぞれを用いて12回の探索処理を行わなければならず、計算時間がかかるという問題があった。また、非特許文献2の方法では、参照音響信号の時刻と蓄積音響信号の時刻のすべての組み合わせについて周波数特徴の類似度を計算し、参照音響信号と蓄積音響信号の音響的類似度の構造を表現しているため、移調された音楽や時間的に伸縮した音楽の探索を行うことは困難である、という問題があった。
本発明は、このような事情に鑑みてなされたものであり、その目的は、参照信号と蓄積信号が異なる調で演奏された場合でも1回の照合で正しい探索結果を出力し、また、演奏されるテンポが異なる場合にも正しく探索結果を出力することができる信号特徴抽出方法、信号探索方法、信号特徴抽出装置、コンピュータプログラム、及び、記録媒体を提供することにある。
前記課題を解決するために、本発明は、音響信号の特徴を抽出する信号特徴抽出方法であって、音響信号を短時間に分割した各フレームにおける各周波数のパワー値を表すベクトルを時間方向に並べて周波数特徴を生成し、生成した周波数特徴におけるあるフレームのベクトルと、当該フレームとは異なるフレームのベクトルとの類似度を算出し、算出した各類似度を要素とした自己類似度ベクトルを前記音響信号の特徴を示す特徴ベクトルとして生成することを特徴とする信号特徴抽出方法である。
本発明によれば、2つの異なる時刻におけるスペクトル形状の類似度(自己類似度)を特徴ベクトルの要素とすることにより、同一の楽曲が異なる調で演奏された場合にも照合類似度が高くなるような特徴ベクトルを得ることができる。
また、本発明は、上述する信号特徴抽出方法であって、i番目のフレームのベクトルpと、当該フレームからN個先のフレームまでの各フレームp(i+1≦j≦N)との類似度pijを算出し、この算出した類似度pijを要素とした自己類似度ベクトルを特徴ベクトルとして生成する、ことを特徴とする。
また、本発明は、上述する信号特徴抽出方法であって、i番目のフレームのベクトルpと、当該フレームからN個先のフレームまでの各フレームp(i+1≦j≦N)との類似度pijを要素とした自己類似度ベクトルをsとしたとき、自己類似度ベクトルs(i≦k≦N−1)それぞれについて、1から(N−k)番目までの要素を取り出して三角領域を得、1つの領域に少なくとも1以上の自己類似度ベクトルの要素が含まれ、かつ、照合の始点となる要素s1iから時間的距離の長い自己類似度ベクトル、及び、同じ自己ベクトル内において時間的距離の長い要素がより大きな領域に含まれるよう前記三角領域をメッシュ状の複数の領域に分割し、分割した各領域に含まれる自己類似度ベクトルの要素の平均値を算出し、この算出した平均値を要素としたベクトルを特徴ベクトルとする、ことを特徴とする。
また、本発明によれば、時間方向に不均等なサイズの領域に分割するメッシュを用いた特徴計算用マスクを導入することにより、音響信号の時間方向の変動に対応した特徴ベクトルを得ることが可能となる。
また、本発明は、参照用に入力された音響信号に基づき、あらかじめデータベースの中に蓄積された音響信号の中を探索する信号探索方法であって、音響信号を短時間に分割した各フレームにおける各周波数のパワー値を表すベクトルを時間方向に並べて周波数特徴を生成し、生成した周波数特徴におけるあるフレームのベクトルと、当該フレームとは異なるフレームのベクトルとの類似度を算出し、算出した各類似度を要素とした自己類似度ベクトルを生成し、生成した自己類似度ベクトルを蓄積特徴ベクトル列としてデータベースに書き込む蓄積特徴ベクトル列計算過程と、参照用の音響信号である参照音響信号について自己類似度ベクトルを生成し、生成した自己類似度ベクトルを参照特徴ベクトル列とする参照特徴ベクトル列計算過程と、前記データベースから蓄積特徴ベクトル列を読み出し、連続したフレームの範囲を特定する窓をフレーム方向に移動させながら、前記蓄積特徴ベクトル列の当該窓の範囲より切り出した要素からなるベクトル列を得、得られたベクトル列と、前記参照特徴ベクトル列計算過程により生成された参照特徴ベクトル列との類似度または距離で定義される探索スコアを計算し、計算された探索スコアに基づいて類似する箇所を特定する照合過程と、前記照合過程により検出された類似する箇所を出力する探索結果出力過程とを有することを特徴とする信号探索方法である。
本発明によれば、照合過程において、参照信号と蓄積信号の特徴ベクトル列の類似度の計算を行うことにより照合を行い、照合類似度の高い楽曲の部分を出力する。従来の手法で用いられる短時間スペクトルの形状を特徴ベクトルとして利用すると、同一の楽曲が異なる調で演奏された場合などには高い類似度が得られず、正しい探索結果を得ることができない。一方、本発明では、蓄積特徴ベクトル列計算過程と参照特徴ベクトル列計算過程において、2つの異なる時刻におけるスペクトル形状の類似度(自己類似度)を特徴ベクトルの要素として利用することにより、同一の楽曲が異なる調で演奏された場合にも照合類似度が高くなるような特徴ベクトル列を得ることができ、正しい検索結果を得ることが可能となる。
また、本発明は、音響信号を短時間に分割した各フレームにおける各周波数のパワー値を表すベクトルを時間方向に並べて周波数特徴を生成し、生成した周波数特徴におけるあるフレームのベクトルと、当該フレームとは異なるフレームのベクトルとの類似度を算出し、算出した各類似度を要素とした自己類似度ベクトルを前記音響信号の特徴を示す特徴ベクトルとして生成する特徴ベクトル列計算手段を備えることを特徴とする信号特徴抽出装置である。
また、本発明は、音響信号を短時間に分割した各フレームにおける各周波数のパワー値を表すベクトルを時間方向に並べて周波数特徴を生成し、生成した周波数特徴におけるあるフレームのベクトルと、当該フレームとは異なるフレームのベクトルとの類似度を算出し、算出した各類似度を要素とした自己類似度ベクトルを生成し、生成した自己類似度ベクトルを蓄積特徴ベクトル列としてデータベースに書き込む蓄積特徴ベクトル列計算手段と、参照用の音響信号である参照音響信号について自己類似度ベクトルを生成し、生成した自己類似度ベクトルを参照特徴ベクトル列とする参照特徴ベクトル列計算手段と、前記データベースから蓄積特徴ベクトル列を読み出し、連続したフレームの範囲を特定する窓をフレーム方向に移動させながら、前記蓄積特徴ベクトル列の当該窓の範囲より切り出した要素からなるベクトル列を得、得られたベクトル列と、前記参照特徴ベクトル列計算手段が生成した参照特徴ベクトル列との類似度または距離で定義される探索スコアを計算し、計算された探索スコアに基づいて類似する箇所を特定する照合手段と、前記照合手段により検出された類似する箇所を出力する探索結果出力手段とを備えることを特徴とする信号特徴抽出装置である。
また、本発明は、信号特徴抽出装置として用いられるコンピュータを、音響信号を短時間に分割した各フレームにおける各周波数のパワー値を表すベクトルを時間方向に並べて周波数特徴を生成し、生成した周波数特徴におけるあるフレームのベクトルと、当該フレームとは異なるフレームのベクトルとの類似度を算出し、算出した各類似度を要素とした自己類似度ベクトルを前記音響信号の特徴を示す特徴ベクトルとして生成する特徴ベクトル列計算手段として動作させることを特徴とするコンピュータプログラムである。
また、本発明は、信号特徴抽出装置として用いられるコンピュータを、音響信号を短時間に分割した各フレームにおける各周波数のパワー値を表すベクトルを時間方向に並べて周波数特徴を生成し、生成した周波数特徴におけるあるフレームのベクトルと、当該フレームとは異なるフレームのベクトルとの類似度を算出し、算出した各類似度を要素とした自己類似度ベクトルを生成し、生成した自己類似度ベクトルを蓄積特徴ベクトル列としてデータベースに書き込む蓄積特徴ベクトル列計算手段、参照用の音響信号である参照音響信号について自己類似度ベクトルを生成し、生成した自己類似度ベクトルを参照特徴ベクトル列とする参照特徴ベクトル列計算手段、前記データベースから蓄積特徴ベクトル列を読み出し、連続したフレームの範囲を特定する窓をフレーム方向に移動させながら、前記蓄積特徴ベクトル列の当該窓の範囲より切り出した要素からなるベクトル列を得、得られたベクトル列と、前記参照特徴ベクトル列計算手段が生成した参照特徴ベクトル列との類似度または距離で定義される探索スコアを計算し、計算された探索スコアに基づいて類似する箇所を特定する照合手段、前記照合手段により検出された類似する箇所を出力する探索結果出力手段として動作させることを特徴とするコンピュータプログラムである。
また、本発明は、上述するコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体である。
本発明によれば、楽曲が移調された場合においても、2つの時刻間の音響特徴(周波数特徴)の類似度(自己類似度)は保存されやすい、という音楽音響信号の特性を利用し、自己類似度を利用した特徴ベクトル列を得ることができる。そして、このように生成された特徴ベクトル列を利用することにより、移調された音楽の探索を1回の照合処理で行うことが可能となる。
また、本発明によれば、自己類似度ベクトルに対し、時間的に離れた自己類似度ベクトル列の要素には大きなサイズの領域を与えるメッシュで覆い、各領域の自己類似度ベクトル列の要素の平均値を要素として持つ特徴ベクトル列を算出することで、時間的に伸縮した音楽の探索を可能とする特徴ベクトル列を得ることが可能となる。
このように、従来の技術とは、参照音響信号が蓄積音響信号の同一楽曲とは異なる調やピッチ、演奏速度などで演奏された場合にも、高い照合類似度を得ることが可能な特徴ベクトルを得、また、その特徴ベクトルを用いて一回で照合を行うことができる点が異なる。
以下、図面を用いて本発明の実施形態を説明する。
本実施の形態に示す信号検索方法について、音響信号を例に説明する。本実施の形態では、楽曲の断片が参照音響信号として与えられたときに、蓄積音響信号の中から参照音響信号に対応する部分を探索し、該当楽曲のタイトル等の情報(楽曲付随情報)と参照音響信号の出現時刻を出力するものである。
図1は、本発明の一実施の形態による信号特徴抽出装置としての音楽探索システムの概略動作を示す図である。
音楽探索システムは、複数の楽曲の音響信号の周波数解析を行い(ステップS1)、短時間フレームごとの特徴ベクトルを抽出し(ステップS2)、これを並べた特徴ベクトル列を予めデータベースに登録しておく。
そして、音響信号の断片が参照信号として提示されたときに、データベース作成時と同様の方法で特徴抽出を行い(ステップS3、S4)、参照信号の特徴ベクトルを計算する。音楽探索システムは、この計算した参照信号の特徴ベクトルと、データベースに登録されている楽曲の特徴ベクトルとを、フレームを移動しながら照合し、照合スコアの高い楽曲および時刻を特定し、その楽曲に付随する情報(タイトル、演奏者など)と時刻を出力する。
以下、本発明の詳細な実施形態について、図2〜図17の図面を使って説明する。
[第1の実施形態]
図2は、本発明の第1の実施形態による信号特徴抽出装置としての音楽探索システムの構成を示すブロック図である。同図において、音楽探索システムの構成は、データベース作成処理部10と探索処理部30およびデータベース20の3つの部分からなる。
データベース20は、蓄積信号DB(データベース)21と、蓄積特徴ベクトル列DB22と、楽曲付随情報DB23とで構成される。
データベース作成処理部10は、蓄積音響信号入力手段11と、蓄積特徴ベクトル列計算手段12と、楽曲付随情報入力手段13とで構成され、図1における蓄積特徴ベクトル列の作成を行う。蓄積音響信号入力手段11は、入力された音響信号を蓄積信号DB21に蓄積する。蓄積特徴ベクトル列計算手段12は、入力あるいは蓄積された音響信号から蓄積特徴ベクトル列を算出して蓄積特徴ベクトル列DB22に書き込む。楽曲付随情報入力手段13は、入力された楽曲付随情報を楽曲付随情報DB23に書き込む。
探索処理部30は、参照音響信号入力手段31と、参照特徴ベクトル列計算手段32と、照合手段33と、探索結果出力手段34とで構成され、図1における参照特徴ベクトル列の作成、蓄積特徴ベクトル列との照合を行う。参照音響信号入力手段31は、参照音響信号の入力を受ける。参照特徴ベクトル列計算手段32は、参照音響信号から参照特徴ベクトル列を算出する。照合手段33は、参照特徴ベクトル列と、蓄積特徴ベクトル列DB22内の蓄積特徴ベクトル列との照合処理を行う。探索結果出力手段34は、検出された蓄積特徴ベクトル列に対応する楽曲付随情報を楽曲付随情報DB23から読み出して出力する。
図3及び図4は、図2に示すデータベース作成処理部10の処理フローである。
図3において、まず、データベース作成処理部10に音響信号の入力を行うと(ステップS110)、蓄積音響信号入力手段11は、入力された音響信号を予め設定されたサンプリング周波数FHz(ヘルツ)でサンプリングし、蓄積信号DB21に保存する(ステップS120)。次に、蓄積特徴ベクトル列DB22は、この音響信号を使って蓄積特徴ベクトル列の計算を行う(ステップS140)。この計算に使う音響信号は、入力された信号を直接利用するか、事前に蓄積信号DB21に蓄積された信号を読み出して(ステップS130)使う。蓄積特徴ベクトル列計算手段12は、ここで得られた蓄積ベクトル列を蓄積特徴ベクトル列DB22に登録する(ステップS150)。
また、図3の処理とは独立の処理として、図4に示すように、データベース作成処理部10に音響信号に関連する、タイトル等の楽曲付随情報を入力し、楽曲付随情報入力手段13は、この入力された楽曲付随情報を楽曲付随情報DB23へ登録する(ステップS210)。
各楽曲には音響信号および楽曲付随情報の入力時に固有のID番号を付与し、蓄積信号DB21に蓄積されている音響信号と、蓄積特徴ベクトル列DB22に蓄積される特徴ベクトル列と、楽曲付随情報DB23内に蓄積される楽曲付随情報との対応関係を管理する。楽曲付随情報とは、各楽曲に関連する情報を含むデータ(例えば、タイトル名、アーティスト名などのテキストデータやレコードジャケット写真等の画像データ、プロモーションビデオなどの音響・映像データなど)のことである。
図6は、図3のステップS140における蓄積特徴ベクトル列計算処理フローの詳細を示したものである。まず、蓄積特徴ベクトル列計算手段12は、入力された音響信号が2つ以上のチャンネルを含んでいた場合には、各サンプリング時刻について平均値をとるなどしてモノラル信号に変換する(ステップS310)。次に、蓄積特徴ベクトル列計算手段12は、周波数特徴の計算を行う(ステップS320)。
周波数特徴は、音響信号を短時間に分割した各フレームにおける各周波数のパワー値を表すベクトルを時間方向に並べたベクトル列で表現される。周波数特徴の計算には、短時間フーリエ変換を利用したものなどが考えられるが、ここでは、以下の(式1)に定義する中心周波数F(k)Hzを持つ帯域フィルタバンクの出力を使う。
Figure 2008304610
各帯域フィルタ出力のパワー値は、短時間フレームごとに平均され、その対数を要素とするベクトルp(iはフレーム番号)を得る。なお、各ベクトルpは、その長さが1となるように正規化を行う。
次に、蓄積特徴ベクトル列計算手段12は、周波数特徴を用いて自己類似度ベクトル列を計算する(ステップS330)。図8はi番目のフレームにおける自己類似度ベクトルs=(s1i,s2i,…,sNiの算出方法を示すものである。自己類似度ベクトルsの算出には、ベクトルpの後に続くベクトルpi+1,pi+2,…,pi+NのNフレーム分の周波数特徴が使われる。自己類似度ベクトルsのj番目の要素sji(j=1,2,…,N)は、ベクトルpとベクトルpの類似度S(p,p)で定義される。これを自己類似度と呼ぶ。類似度S(p,p)には、例えば以下の(式2)または(式3)のような関数を用いる。
Figure 2008304610
音響信号末尾付近のフレームにおいては、後続のフレーム数がN未満となる場合があるが、このような場合には自己類似度は計算しないか、p=0として自己類似度を計算する。
蓄積特徴ベクトル列計算手段12は、各自己類似度ベクトルsを、蓄積特徴ベクトル列f として、蓄積特徴ベクトル列DB22に登録する(ステップS340)。つまり、f =sとする。
同じ楽曲が異なる調で演奏されたり、異なる楽器を用いて演奏されたりした場合においては、各時刻における周波数特徴などの音響特徴は変化する。そのため、これらの特徴を使って照合処理を行っても正しく検出することは困難である。しかし、ある時刻とそのΔt秒後(若しくはjフレーム後)の音響特徴の類似度(自己類似度)は、このような変動に対して保存されやすいという特徴を持つ。例えば、ある音の4拍後に同じ音が演奏された場合は、4拍後と間の自己類似度は、異なる楽器で演奏しても、それらの音が移調されたものであっても高くなる。したがって、自己類似度を特徴として利用することにより、調や楽器の変動について頑健な音楽探索が可能となる。
図5は、図2における探索処理部30の処理フローである。
まず、探索処理部30の参照音響信号入力手段31に参照音響信号が入力されると(ステップS410)、参照特徴ベクトル列計算手段32は、蓄積特徴ベクトル列計算手段12における蓄積特徴ベクトル列の計算と同じ方法を用いて参照特徴ベクトル列の計算を行う(ステップS420)。
次に、照合手段33は、蓄積特徴ベクトル列DB22から蓄積特徴ベクトル列を読み出して照合処理を行い、探索類似度の高い特徴ベクトル列内のフレームを検出する(ステップS430)。最後に、探索結果出力手段34は、検出された特徴ベクトル列に対応する楽曲付随情報を楽曲付随情報DB23から読み出し、検出されたフレーム番号に該当する時刻とともに出力する(ステップS440)。
図7は、図5におけるステップS420における参照特徴ベクトル列計算処理フローの詳細を示したものである。まず、参照特徴ベクトル列計算手段32は、入力された音響信号のサンプリング周波数が、蓄積音響信号のサンプリング周波数FHzと異なる場合には、低域通過フィルタを適用し、FHzを超える成分を除去した後にFHzで再サンプリングを行う。また、参照特徴ベクトル列計算手段32は、蓄積特徴ベクトル列の計算と同様に、入力された音響信号が2つ以上のチャンネルを含んでいた場合には各サンプリング時刻について平均値をとるなどしてモノラル信号に変換する(ステップS510)。次に、参照特徴ベクトル列計算手段32は、図6のステップS320と同様に周波数特徴の計算を行う(ステップS520)。参照特徴ベクトル列計算手段32は、蓄積特徴ベクトル列f の計算と同様の自己類似度ベクトル列計算を行い、得られた自己類似度ベクトル列を特徴ベクトル列f として照合手段33に渡す(ステップS530)。
図9は、図5のステップS430における照合処理の概要である。まず、照合手段33は、蓄積特徴ベクトル列に対して参照特徴ベクトル列の長さ(短時間フレームの数、Nとする)と同じ長さの窓をかけ、蓄積特徴ベクトル列の窓に含まれる部分を切り出す(ステップS610)。つまり、この窓とは、蓄積特徴ベクトル列において、連続したフレームの範囲を特定するものである。次に、照合手段33は、参照特徴ベクトル列と切り出された蓄積特徴ベクトル列との探索スコアを計算し、事前に設定された閾値Θを超える場合には、類似する箇所であると判断し、特徴ベクトル列の切り出した最初のフレーム番号を出力する(ステップS620)。照合手段33は、窓を1フレーム分だけ後の時刻にずらし(ステップS630)、ステップS610、S620の処理を特徴ベクトル列の末端に到達するまで繰り返す。なお、探索結果出力手段34は、フレーム番号が出力された参照ベクトル列のIDに対応した楽曲付随情報を楽曲付随情報DB23から読み出して出力するとともに、フレーム番号に該当する時刻を出力する。
探索スコアには、例えば、類似度または距離を用いることができ、以下の(式4)または(式5)のような関数を使うことができる。
Figure 2008304610
ここで、Fは参照特徴ベクトル列f を1列(または1行)に並べて出来るベクトル、Fは蓄積特徴ベクトル列f の長さNの窓で切り出された部分を1列(または1行)に並べて出来るベクトルであり、S(F,F)は、FとFの探索スコアである。また、「・」は内積を表す。
[第2の実施形態]
図10は、第2の実施形態による音楽探索システムの構成を示すブロック図である。同図において、第1の実施形態と同様の構成には同じ符号を付し、説明を省略する。
同図に示す音楽探索システムは、図2の音楽探索システムの構成に、参照音響信号の時間伸縮のバリエーションを吸収する手段である、時間伸縮対応手段40を加えた構成である。時間伸縮対応手段40は、蓄積特徴ベクトル列計算手段12および参照特徴ベクトル列計算手段32により呼び出される。
以下では、第1の実施形態との差分を中心に説明する。
本実施の形態によるデータベース作成処理部10の処理フローは図3及び図4と同様であるが、図3のステップS140における蓄積特徴ベクトル列計算においては、図6に示す処理の代わりに図11に示す処理を行う。
図11は、図10の構成における、蓄積特徴ベクトル列計算手段12の処理フローを示している。
同図において、モノラル化から自己類似度ベクトル列計算までのステップS710〜S730を実行し、自己類似度ベクトル列sを得るところまでは、図6に示すステップS310〜S330と同一の処理を行う。ここで、蓄積特徴ベクトル列計算手段12は、時間伸縮対応手段40を呼び出し、メッシュによる特徴ベクトル列計算を行い、自己類似度ベクトル列から蓄積特徴ベクトル列g を得る(ステップS740)。
図13及び図14に、i番目のフレームについてのメッシュによる特徴ベクトル列の計算方法を示す。
まず、時間伸縮対応手段40は、自己類似度ベクトル列s,si+1,…,si+N−1のN個の自己類似度ベクトルを用いて、自己類似度ベクトル列si+kについては最初のN−k個の要素、つまりs1(i+k),s2(i+k),…,s(N−k)(i+k)を取り出すことにより、図13の太線で囲まれた三角領域を抽出する。
次に、時間伸縮対応手段40は、図14に示すように、三角領域をメッシュで覆い、複数の領域に分割する。各領域には、少なくとも1つ以上の自己類似度ベクトルの要素が含まれるものとする。各領域には、R,R,…,Rのように名前を付ける(nは領域の総数を表す)。
入力される音響信号が時間的に伸縮した場合には、元の音楽の音響信号に対して、自己類似度ベクトル列は、時間方向と同時に、自己類似度ベクトルの要素番号の方向にも伸縮するという特性がある。つまり、時間伸縮した音響信号の時刻t’が元の音響信号における時刻tに対応しているとすると、元の音響信号内の時刻tとt+dの関係は、時間伸縮した音響信号内の時刻t’とt’+Cdとの関係に相当する。ここで、Cは伸縮率である。従って、dが大きくなるにつれて、2つの音響信号の対応する箇所が時間的に離れてしまい、元の音響信号の自己類似度ベクトルの要素sjiは、時間伸縮した音響信号の自己類似度ベクトルの要素s’(j+ε)i’に対応することになる。なお、ここでi’は元の音響信号のフレームiに対応する、時間伸縮した音響信号フレーム番号であり、εは伸縮率とjによって決まる正又は負の整数である。
音響信号の時間伸縮の程度Cの値は入力音響信号によって異なるため、εを決めることはできない。εの値はjが大きくなればなるほど大きくなるので、jの値が大きくなるにつれてそのサイズが大きくなるように領域R,…,Rを定義し、それぞれの領域からn次元のベクトルを計算し、特徴ベクトルとすることで、ずれを吸収する。自己類似度ベクトル列の時間方向についても、同様の時間伸縮の影響があるため、iから離れるにつれてそのサイズが大きくなるように領域R,…,Rを定義する。したがって、図13の三角領域において、R,…,Rは、最も左上の要素(s1i)の近くは小さなサイズを与え、最も左上の要素から離れた要素には大きな領域を与えることとなる。この処理により、音響信号の時間的な伸縮に頑健な特徴ベクトル列を得ることが可能となる。
各領域の縦および横のサイズは、最初領域の左上(図14おける領域A中の左上の網掛けされている要素)の位置によって決められる。ここでは、領域Aを例にとり、説明する。領域Aの左上の要素(網掛けされている要素)が特徴ベクトルsi+kのl番目の要素、つまり、sl(i+k)であるとする。領域Aの縦の長さLは以下の(式6)のように定義される。
Figure 2008304610
ここで、Mは予め設定された定数で、どの程度の時間伸縮Cを想定するかに関連する値で、領域の要素番号10前後の値が使われる。Lと同様の方法で、領域Aの横の長さLは以下の(式7)のように定義される。
Figure 2008304610
ある位置において、L、Lを算出したら領域の大きさが決定されるので、この領域に含まれるその他の自己類似度ベクトルの要素は領域の左上に位置しないので、L、Lの計算は行わない。
上記の方法で得られた領域R,R,…,Rについて、それぞれの領域に含まれる自己類似度ベクトルの要素の平均値を計算し、これらを要素とするn次元ベクトルを特徴ベクトルとする。
図13において、三角領域を右に1フレームずつ移動し、三角領域の右端が、自己類似度ベクトル列の右端に達するまで特徴ベクトルを計算することにより、蓄積特徴ベクトル列g を生成し、蓄積特徴ベクトル列DB22に保存する(図11:ステップS750)。
本実施の形態による探索処理部30の処理フローは図5と同様であるが、図5のステップS420における参照特徴ベクトル列計算においては、図7に示す処理の代わりに図12に示す処理を行う。
図12は、図10の構成における参照特徴ベクトル列計算手段32の処理フローを示している。同図において、モノラル化から自己類似度ベクトル列計算までのステップS810〜S830を実行し、特徴ベクトル列f を得るところまでは、図7に示すステップS510〜S530と同一の処理を行う。
ステップS840において、参照特徴ベクトル列計算手段32は、蓄積特徴ベクトル列の計算と同様の特徴ベクトルの計算により参照特徴ベクトル列g を生成し、照合手段33に渡す。
照合手段33では、第1の実施形態と同様、図9で示される処理により照合を行う。探索スコアは、第1の実施形態の照合手段33の蓄積特徴ベクトル列f の代わりに蓄積特徴ベクトル列g を、参照特徴ベクトル列f の代わりに参照特徴ベクトル列g を使って計算される。参照特徴ベクトル列g を1列(または1行)に並べて出来るベクトルをGとし、蓄積特徴ベクトル列g の長さNの窓で切り出された部分を1列(または1行)に並べて出来るベクトルをGとすると、探索スコアS(G,G)は以下の(式8)または(式9)のような関数で定義することができ、類似度または距離を用いることができる。
Figure 2008304610
ここで、「・」は内積を表す。
蓄積音響信号入力手段11、楽曲付随情報入力手段13、参照音響信号入力手段31、探索結果出力手段34で行われる処理は、第一の実施形態と同じである。
[第3の実施形態]
図15は、第3の実施形態による音楽探索システムの構成を示すブロック図である。同図において、第1の実施形態と同様の構成には同じ符号を付し、説明を省略する。
図2に示す第1の実施形態による照合手段33おいては、探索スコアの値のとる範囲は、参照音響信号の特性によってばらつきがあるため、図15のように、探索処理部30内に探索スコア補正手段35を導入し、照合手段33から呼び出すことで、このばらつきを補正することが可能となる。
以下では、第1の実施形態との差分を中心に説明する。
図17は探索スコア補正手段35を導入した場合の照合手段33の処理概要を示している。まず、ステップS910において、照合手段33は、図9の処理と同様に蓄積特徴ベクトル列に参照特徴ベクトル列と同じ長さの窓をかけ、フレームの切り出しを行い、そこに含まれる要素を並べたベクトルFを得る。同様に参照特徴ベクトル列に含まれる要素を並べたベクトルFも用意しておく。次に、ステップS920において、探索スコア補正手段35は、ベクトルFとFのユークリッド距離を計算し、これを、距離値zに代入する(iは蓄積特徴ベクトル列の切り出し窓の左端のフレーム番号を示している)。ステップS930において、探索スコア補正手段35は、蓄積特徴ベクトル列DB22に保存されているすべての蓄積特徴ベクトル列について、窓をシフトしながら距離値zを計算する。ステップS940において、探索スコア補正手段35は、距離値zを計算したすべてのフレームについて、その前後Wフレームの距離値の中で最小となる場合に、そのフレームを検出フレーム候補として、特徴ベクトル列の番号およびフレーム位置iと距離値zを探索処理部30内のバッファDへ保存する。ステップS950において、探索スコア補正手段35は、各フレームの探索スコアS(i)を、バッファDに含まれるフレームの距離値の平均z、標準偏差zを用いて、以下の(式10)のように算出する。
Figure 2008304610
最後に図9の処理と同様、照合手段33は、探索スコアS(i)が事前に設定した閾値Θを超えるフレームを探索結果として探索結果出力手段34へ渡す。閾値Θは標準偏差zに対する比率で表すことが可能となり設定が容易となる。
照合手段33以外の部分は第1の実施形態と同じである。
[第4の実施形態]
図16は、第4の実施形態による音楽探索システムの構成を示すブロック図である。同図において、第1または第2の実施形態と同様の構成には同じ符号を付し、説明を省略する。
図16は、第2の実施形態の探索処理部30に、第3の実施形態で記述した探索スコア補正手段35を導入した例である。照合手段33、探索スコア補正手段35は、第3の実施形態における、Fの代わりにGを、Fの代わりにGを用いて探索スコアS(i)の計算を行う。その他の構成要素は第2の実施形態と同じである。
上記実施形態によれば、照合手段33において、参照信号と蓄積信号の特徴ベクトル列の類似度の計算を行うことにより照合を行い、照合類似度の高い楽曲の部分を出力する。従来の手法で用いられる短時間スペクトルの形状を特徴ベクトルとして利用すると、同一の楽曲が異なる調で演奏された場合などには高い類似度が得られず、正しい探索結果を得ることができない。一方、本実施形態では、蓄積特徴ベクトル列計算手段12と参照特徴ベクトル列計算手段32において、2つの異なる時刻におけるスペクトル形状の類似度(自己類似度)を特徴ベクトルの要素として利用することにより、同一の楽曲が異なる調で演奏された場合にも照合類似度が高くなるような特徴ベクトル列を得ることができ、正しい検索結果を得ることが可能となる。
また、蓄積特徴ベクトル列計算手段12と参照特徴ベクトル列計算手段32において、特徴ベクトルを計算するために、時間方向に不均等なサイズの領域に分割するメッシュを用いた特徴計算用マスクを導入することにより、音響信号の時間方向の変動に対応することが可能となる。
このように、本実施形態によれば、以下の効果がある。
(1)参照信号と蓄積信号が異なる調で演奏された場合に1回の照合で正しい探索結果を出力することが出来ない問題や、演奏されるテンポが異なる場合には正しく探索結果を出力することが出来ないという問題を解決する。
(2)音響信号におけるある時刻の特徴量を、その時刻のスペクトル形状と後続の複数の時刻におけるスペクトル形状との類似度からなるベクトル(自己類似度ベクトル)で表現することで、参照音響信号と蓄積音響信号で演奏される調が異なる場合においても探索を可能とする。
(3)自己類似度ベクトルを時間方向に並べた自己類似度ベクトル列に対し、大きさの不均等な領域を持ったマスクを適用し、各領域内の自己類似度ベクトルの要素の値を平均したものを特徴ベクトルとして利用することにより、音響信号の時間軸上での伸縮にも対応することができる。
なお、上述の音楽探索システムは、内部にコンピュータシステムを有している。そして、音楽探索システムのデータベース作成処理部10、データベース20、探索処理部30及び時間伸縮対応手段40の動作の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータシステムが読み出して実行することによって、上記処理が行われる。ここでいうコンピュータシステムとは、CPU及び各種メモリやOS、周辺機器等のハードウェアを含むものである。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
本発明の一実施形態における音楽探索システムの処理を説明する概念図。 本発明の第1の実施形態における音楽探索システムの構成例を示すブロック図。 図2のデータベース作成処理部における処理の動作例を示すフローチャート。 図2のデータベース作成処理部における処理の動作例を示すフローチャート。 図2の探索処理部における処理の動作例を示すフローチャート。 図3における蓄積特徴ベクトル列計算処理の詳細を示すフローチャート。 図5における参照特徴ベクトル列計算処理の詳細を示すフローチャート。 図3、図7における自己類似度ベクトル列計算の処理を説明する図。 図5における照合処理の概要を示す図。 第2の実施形態による音楽探索システムの構成例を示すブロック図。 図10の蓄積特徴ベクトル列計算手段における処理の詳細を示すフローチャート。 図10の参照特徴ベクトル列計算手段における処理の詳細を示すフローチャート。 図11、図12におけるメッシュによる特徴ベクトル列計算処理の概要を示す図。 図11、図12におけるメッシュによる特徴ベクトル列計算処理の概要を示す図。 第3の実施形態による音楽探索システムの構成例を示すブロック図。 第4の実施形態による音楽探索システムの構成例を示すブロック図。 図15、図16における照合手段から探索スコア補正手段を呼び出した場合の照合処理の概要を示す図。
符号の説明
10…データベース作成処理部
11…蓄積音響信号入力手段
12…蓄積特徴ベクトル列計算手段
13…楽曲付随情報入力手段
20…データベース
21…蓄積信号DB
22…蓄積特徴ベクトル列DB
23…楽曲付随情報DB
30…探索処理部
31…参照音響信号入力手段
32…参照特徴ベクトル列計算手段
33…照合手段
34…探索結果出力手段
35…探索スコア補正手段
40…時間伸縮対応手段

Claims (9)

  1. 音響信号の特徴を抽出する信号特徴抽出方法であって、
    音響信号を短時間に分割した各フレームにおける各周波数のパワー値を表すベクトルを時間方向に並べて周波数特徴を生成し、
    生成した周波数特徴におけるあるフレームのベクトルと、当該フレームとは異なるフレームのベクトルとの類似度を算出し、算出した各類似度を要素とした自己類似度ベクトルを前記音響信号の特徴を示す特徴ベクトルとして生成する
    ことを特徴とする信号特徴抽出方法。
  2. i番目のフレームのベクトルpと、当該フレームからN個先のフレームまでの各フレームp(i+1≦j≦N)との類似度pijを算出し、この算出した類似度pijを要素とした自己類似度ベクトルを特徴ベクトルとして生成する、
    ことを特徴とする請求項1に記載の信号特徴抽出方法。
  3. i番目のフレームのベクトルpと、当該フレームからN個先のフレームまでの各フレームp(i+1≦j≦N)との類似度pijを要素とした自己類似度ベクトルをsとしたとき、
    自己類似度ベクトルs(i≦k≦N−1)それぞれについて、1から(N−k)番目までの要素を取り出して三角領域を得、
    1つの領域に少なくとも1以上の自己類似度ベクトルの要素が含まれ、かつ、照合の始点となる要素s1iから時間的距離の長い自己類似度ベクトル、及び、同じ自己ベクトル内において時間的距離の長い要素がより大きな領域に含まれるよう前記三角領域をメッシュ状の複数の領域に分割し、
    分割した各領域に含まれる自己類似度ベクトルの要素の平均値を算出し、この算出した平均値を要素としたベクトルを特徴ベクトルとする、
    ことを特徴とする請求項1に記載の信号特徴抽出方法。
  4. 参照用に入力された音響信号に基づき、あらかじめデータベースの中に蓄積された音響信号の中を探索する信号探索方法であって、
    音響信号を短時間に分割した各フレームにおける各周波数のパワー値を表すベクトルを時間方向に並べて周波数特徴を生成し、生成した周波数特徴におけるあるフレームのベクトルと、当該フレームとは異なるフレームのベクトルとの類似度を算出し、算出した各類似度を要素とした自己類似度ベクトルを生成し、生成した自己類似度ベクトルを蓄積特徴ベクトル列としてデータベースに書き込む蓄積特徴ベクトル列計算過程と、
    参照用の音響信号である参照音響信号について自己類似度ベクトルを生成し、生成した自己類似度ベクトルを参照特徴ベクトル列とする参照特徴ベクトル列計算過程と、
    前記データベースから蓄積特徴ベクトル列を読み出し、連続したフレームの範囲を特定する窓をフレーム方向に移動させながら、前記蓄積特徴ベクトル列の当該窓の範囲より切り出した要素からなるベクトル列を得、得られたベクトル列と、前記参照特徴ベクトル列計算過程により生成された参照特徴ベクトル列との類似度または距離で定義される探索スコアを計算し、計算された探索スコアに基づいて類似する箇所を特定する照合過程と、
    前記照合過程により検出された類似する箇所を出力する探索結果出力過程と
    を有することを特徴とする信号探索方法。
  5. 音響信号を短時間に分割した各フレームにおける各周波数のパワー値を表すベクトルを時間方向に並べて周波数特徴を生成し、生成した周波数特徴におけるあるフレームのベクトルと、当該フレームとは異なるフレームのベクトルとの類似度を算出し、算出した各類似度を要素とした自己類似度ベクトルを前記音響信号の特徴を示す特徴ベクトルとして生成する特徴ベクトル列計算手段
    を備えることを特徴とする信号特徴抽出装置。
  6. 音響信号を短時間に分割した各フレームにおける各周波数のパワー値を表すベクトルを時間方向に並べて周波数特徴を生成し、生成した周波数特徴におけるあるフレームのベクトルと、当該フレームとは異なるフレームのベクトルとの類似度を算出し、算出した各類似度を要素とした自己類似度ベクトルを生成し、生成した自己類似度ベクトルを蓄積特徴ベクトル列としてデータベースに書き込む蓄積特徴ベクトル列計算手段と、
    参照用の音響信号である参照音響信号について自己類似度ベクトルを生成し、生成した自己類似度ベクトルを参照特徴ベクトル列とする参照特徴ベクトル列計算手段と、
    前記データベースから蓄積特徴ベクトル列を読み出し、連続したフレームの範囲を特定する窓をフレーム方向に移動させながら、前記蓄積特徴ベクトル列の当該窓の範囲より切り出した要素からなるベクトル列を得、得られたベクトル列と、前記参照特徴ベクトル列計算手段が生成した参照特徴ベクトル列との類似度または距離で定義される探索スコアを計算し、計算された探索スコアに基づいて類似する箇所を特定する照合手段と、
    前記照合手段により検出された類似する箇所を出力する探索結果出力手段と
    を備えることを特徴とする信号特徴抽出装置。
  7. 信号特徴抽出装置として用いられるコンピュータを、
    音響信号を短時間に分割した各フレームにおける各周波数のパワー値を表すベクトルを時間方向に並べて周波数特徴を生成し、生成した周波数特徴におけるあるフレームのベクトルと、当該フレームとは異なるフレームのベクトルとの類似度を算出し、算出した各類似度を要素とした自己類似度ベクトルを前記音響信号の特徴を示す特徴ベクトルとして生成する特徴ベクトル列計算手段
    として動作させることを特徴とするコンピュータプログラム。
  8. 信号特徴抽出装置として用いられるコンピュータを、
    音響信号を短時間に分割した各フレームにおける各周波数のパワー値を表すベクトルを時間方向に並べて周波数特徴を生成し、生成した周波数特徴におけるあるフレームのベクトルと、当該フレームとは異なるフレームのベクトルとの類似度を算出し、算出した各類似度を要素とした自己類似度ベクトルを生成し、生成した自己類似度ベクトルを蓄積特徴ベクトル列としてデータベースに書き込む蓄積特徴ベクトル列計算手段、
    参照用の音響信号である参照音響信号について自己類似度ベクトルを生成し、生成した自己類似度ベクトルを参照特徴ベクトル列とする参照特徴ベクトル列計算手段、
    前記データベースから蓄積特徴ベクトル列を読み出し、連続したフレームの範囲を特定する窓をフレーム方向に移動させながら、前記蓄積特徴ベクトル列の当該窓の範囲より切り出した要素からなるベクトル列を得、得られたベクトル列と、前記参照特徴ベクトル列計算手段が生成した参照特徴ベクトル列との類似度または距離で定義される探索スコアを計算し、計算された探索スコアに基づいて類似する箇所を特定する照合手段、
    前記照合手段により検出された類似する箇所を出力する探索結果出力手段
    として動作させることを特徴とするコンピュータプログラム。
  9. 請求項7または8のコンピュータプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2007150315A 2007-06-06 2007-06-06 信号特徴抽出方法、信号探索方法、信号特徴抽出装置、コンピュータプログラム、及び、記録媒体 Active JP4601643B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007150315A JP4601643B2 (ja) 2007-06-06 2007-06-06 信号特徴抽出方法、信号探索方法、信号特徴抽出装置、コンピュータプログラム、及び、記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007150315A JP4601643B2 (ja) 2007-06-06 2007-06-06 信号特徴抽出方法、信号探索方法、信号特徴抽出装置、コンピュータプログラム、及び、記録媒体

Publications (3)

Publication Number Publication Date
JP2008304610A true JP2008304610A (ja) 2008-12-18
JP2008304610A5 JP2008304610A5 (ja) 2010-10-14
JP4601643B2 JP4601643B2 (ja) 2010-12-22

Family

ID=40233407

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007150315A Active JP4601643B2 (ja) 2007-06-06 2007-06-06 信号特徴抽出方法、信号探索方法、信号特徴抽出装置、コンピュータプログラム、及び、記録媒体

Country Status (1)

Country Link
JP (1) JP4601643B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012203382A (ja) * 2011-03-28 2012-10-22 Nippon Telegr & Teleph Corp <Ntt> 特定音響信号含有区間検出装置、方法、及びプログラム
JP2019020527A (ja) * 2017-07-13 2019-02-07 株式会社メガチップス 電子メロディ特定装置、プログラム、及び電子メロディ特定方法
JP2019020528A (ja) * 2017-07-13 2019-02-07 株式会社メガチップス 電子メロディ特定装置、プログラム、及び電子メロディ特定方法
CN112837680A (zh) * 2019-11-25 2021-05-25 马上消费金融股份有限公司 音频关键词检索方法、智能外呼方法及相关装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005004576A (ja) * 2003-06-13 2005-01-06 Sony Corp 音楽検索システムおよび方法、情報処理装置および方法、プログラム、並びに記録媒体
WO2007080764A1 (ja) * 2006-01-12 2007-07-19 Matsushita Electric Industrial Co., Ltd. 対象音分析装置、対象音分析方法および対象音分析プログラム
JP2009511980A (ja) * 2005-10-17 2009-03-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ入力信号についての特徴のセットを導出する方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005004576A (ja) * 2003-06-13 2005-01-06 Sony Corp 音楽検索システムおよび方法、情報処理装置および方法、プログラム、並びに記録媒体
JP2009511980A (ja) * 2005-10-17 2009-03-19 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ入力信号についての特徴のセットを導出する方法
WO2007080764A1 (ja) * 2006-01-12 2007-07-19 Matsushita Electric Industrial Co., Ltd. 対象音分析装置、対象音分析方法および対象音分析プログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012203382A (ja) * 2011-03-28 2012-10-22 Nippon Telegr & Teleph Corp <Ntt> 特定音響信号含有区間検出装置、方法、及びプログラム
JP2019020527A (ja) * 2017-07-13 2019-02-07 株式会社メガチップス 電子メロディ特定装置、プログラム、及び電子メロディ特定方法
JP2019020528A (ja) * 2017-07-13 2019-02-07 株式会社メガチップス 電子メロディ特定装置、プログラム、及び電子メロディ特定方法
JP7025145B2 (ja) 2017-07-13 2022-02-24 株式会社メガチップス 電子メロディ特定装置、プログラム、及び電子メロディ特定方法
JP7025144B2 (ja) 2017-07-13 2022-02-24 株式会社メガチップス 電子メロディ特定装置、プログラム、及び電子メロディ特定方法
CN112837680A (zh) * 2019-11-25 2021-05-25 马上消费金融股份有限公司 音频关键词检索方法、智能外呼方法及相关装置

Also Published As

Publication number Publication date
JP4601643B2 (ja) 2010-12-22

Similar Documents

Publication Publication Date Title
US20210256995A1 (en) Singing voice separation with deep u-net convolutional networks
US11568256B2 (en) Automatic isolation of multiple instruments from musical mixtures
US11816151B2 (en) Music cover identification with lyrics for search, compliance, and licensing
JP4640407B2 (ja) 信号処理装置、信号処理方法及びプログラム
US20150094835A1 (en) Audio analysis apparatus
EP4187405A1 (en) Music cover identification for search, compliance, and licensing
JP2002014691A (ja) ソース音声信号内の新規点の識別方法
US8548612B2 (en) Method of generating a footprint for an audio signal
JP4601643B2 (ja) 信号特徴抽出方法、信号探索方法、信号特徴抽出装置、コンピュータプログラム、及び、記録媒体
JP7337169B2 (ja) オーディオクリップのマッチング方法及びその装置、コンピュータプログラム並びに電子機器
US20230260531A1 (en) Intelligent audio procesing
JP5182892B2 (ja) 音声検索方法,音声検索装置および音声検索プログラム
JP2007072023A (ja) 情報処理装置及び情報処理方法
JP7428182B2 (ja) 情報処理装置および方法、並びにプログラム
JP2009014923A (ja) 演奏クロック生成装置、データ再生装置、演奏クロック生成方法、データ再生方法およびプログラム
JP2013088488A (ja) 音声検索装置、音声検索方法及びプログラム
JP6680029B2 (ja) 音響処理方法および音響処理装置
JP2008257020A (ja) メロディーの類似度算出方法及び類似度算出装置
Mallick et al. Using Musical Beats to Segment Videos of Bharatanatyam Adavus
JP2012159717A (ja) 楽曲データの変化点検出装置、楽曲データの変化点検出方法及び楽曲データの変化点検出プログラム
JP4621936B2 (ja) 音声合成装置、学習データ生成装置、ポーズ予測装置およびプログラム
US10297271B1 (en) Accurate extraction of chroma vectors from an audio signal
JP2007171772A (ja) 音楽情報処理装置、音楽情報処理方法および制御プログラム
JP4906565B2 (ja) メロディー推定方法及びメロディー推定装置
Subedi Audio-Based Retrieval of Musical Score Data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090717

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100827

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100914

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100928

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131008

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4601643

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131008

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350