JP2011141406A - 類似楽曲表示システム - Google Patents
類似楽曲表示システム Download PDFInfo
- Publication number
- JP2011141406A JP2011141406A JP2010001599A JP2010001599A JP2011141406A JP 2011141406 A JP2011141406 A JP 2011141406A JP 2010001599 A JP2010001599 A JP 2010001599A JP 2010001599 A JP2010001599 A JP 2010001599A JP 2011141406 A JP2011141406 A JP 2011141406A
- Authority
- JP
- Japan
- Prior art keywords
- music
- mel frequency
- songs
- spectrum
- coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Auxiliary Devices For Music (AREA)
- Electrophonic Musical Instruments (AREA)
Abstract
【課題】より人間の感覚に近い類似度を有する楽曲の表示子を近い座標位置に配置して表示させる。
【解決手段】複数の楽曲のそれぞれをフーリエ変換し、一曲全体としてのスペクトル分布を求めてメル周波数対数スペクトルに変換し、当該メル周波数対数スペクトルを離散コサイン変換してメル周波数ケプストラム係数を求める。そして、全楽曲のメル周波数ケプストラム係数の平均値と標準偏差を算出して正規化し、すべての楽曲分の正規化されたメル周波数ケプストラム係数を対象に主成分分析を行って主成分得点係数を算出し、上位複数の主成分を抽出して楽曲の座標位置を算出する。
【選択図】図2
【解決手段】複数の楽曲のそれぞれをフーリエ変換し、一曲全体としてのスペクトル分布を求めてメル周波数対数スペクトルに変換し、当該メル周波数対数スペクトルを離散コサイン変換してメル周波数ケプストラム係数を求める。そして、全楽曲のメル周波数ケプストラム係数の平均値と標準偏差を算出して正規化し、すべての楽曲分の正規化されたメル周波数ケプストラム係数を対象に主成分分析を行って主成分得点係数を算出し、上位複数の主成分を抽出して楽曲の座標位置を算出する。
【選択図】図2
Description
本発明は、複数の楽曲の表示子を二次元空間や三次元空間上に配置させるようにした類似楽曲表示システムに関するものであり、より詳しくは、類似した楽曲を座標空間上の近い位置に表示できるようにした類似楽曲表示システムに関するものである。
従来より、複数の楽曲を二次元空間や三次元空間上に表示子として配置し、その楽曲を選択して再生できるようにしたシステムが種々提案されている。このようなシステムは、楽曲の属する年代や音楽ジャンル・ムード・テンポ・音響的特徴などを基に、何らかの技術を用いて二次元空間や三次元空間上に表示子として表示し、その際、類似している楽曲の表示子を近い位置に表示させるようにしたものである。
このような表示子を表示させる技術に関しては、例えば、下記の特許文献1に記載されるような方法がある。この文献のシステムは、楽曲に対する主観的な印象に基づいて利用者の希望する楽曲を検索できるようにすることを目的とするものであり、楽曲の音響信号を処理フレーム毎にフーリエ変換し、各帯域の周波数の立ち上がり成分を検出してパワーを求めることでパワースペクトルを算出し、処理フレーム間のパワースペクトル変化量を算出してスペクトル変化度・平均発音数・発音非周期性・拍周期・拍周期比率・拍強度・拍強度比などを算出し、これを印象値(すなわち、楽曲の主観的な印象を表現する数量)に変換して主成分分析等の因子分析、線形重回帰分析などにより印象マップと呼ばれる二次元空間上に表示させるようにしたものである。このような方法によれば、例えば、横軸を「機械的・人間的」などの情動因子とし、縦軸を「にぎやか・静か」などの能動因子といった軸に設定することで、類似した楽曲を近い座標に配置させることができるというものである。
しかしながら、上記特許文献1による楽曲の表示方法では次のような問題がある。
すなわち、上記特許文献1の方法では、周波数の立ち上がり成分、すなわち、テンポやビートや発音数を解析することによって座標空間上に楽曲をマッピングする方法であるため、例えば、明らかに異なる楽器構成の2曲(例えば、ロックとジャズ)を解析して二次元空間や三次元空間に表示させる場合、通常では、これらの楽曲は楽器構成が全く異なっているため人間の感覚では「類似していない」と判断されるにもかかわらず、これら2曲のテンポやビート数や各帯域における発音数がたまたま近ければ、近い座標位置となるため「類似している」と解釈されてしまう。
また、同じような楽器構成の2曲、例えば、同じクラシック作曲家の旋律の雰囲気が似ている2曲であって片方はテンポが比較的速い曲、もう片方はテンポが比較的遅い曲を座標空間上に表示させる場合、楽器構成やメロディの雰囲気が似ていれば、人間の感覚では「似ている」と判断されるにもかかわらず、上記方法によればテンポや発音数に大きな差が出てしまい、遠い座標位置となるため「似ていない」と解釈されてしまう。すなわち、この特許文献1に記述される方法では、利用者の主観的な印象が反映されない結果となってしまうといった問題がある。
さらに、上記特許文献1では、二次元空間の横軸の定義を情動因子、すなわち楽曲が「機械的であるか人間的であるか」の度合いを示す尺度として定義しているが、一般に人間が楽曲の類似度を判断する場合、「リズムが機械的か人間的か」という観点よりも「音色そのものが機械的か人間的か」という観点で判断する。従って、従来技術のように「機械的か人間的か」との観点を印象マップの軸の定義とするのであれば、利用者の感覚と異なってしまうといった問題を生ずる結果になる。
そこで、本発明は上記課題に着目してなされたもので、より人間の感覚に近い類似度を有する楽曲の表示子を近い座標位置に配置して表示させることができるようにした類似楽曲表示システムを提供することを目的とするものである。
すなわち、本発明は上記課題を解決するために、複数の楽曲の表示子を座標空間上に表示させる類似楽曲表示システムにおいて、複数の楽曲のそれぞれをフーリエ変換し、楽曲全体のスペクトルの分布を求める周波数解析手段と、当該求められたスペクトルをメル周波数対数スペクトルに変換し、当該メル周波数対数スペクトルを離散コサイン変換してメル周波数ケプストラム係数を求める係数演算手段と、すべての楽曲のメル周波数ケプストラム係数の平均値と標準偏差を算出し、当該平均値と標準偏差を利用して個々の楽曲のメル周波数ケプストラム係数を正規化処理する正規化手段と、すべての楽曲分の正規化されたメル周波数ケプストラム係数を対象に主成分分析を行って主成分得点係数を算出し、上位複数の主成分を抽出して楽曲の座標位置を算出する座標演算手段と、当該座標演算手段によって算出された楽曲の表示子を座標空間上にマッピングするマッピング手段とを備えるようにしたものである。
具体的には、主成分分析により抽出される第一主成分から算出された値と、同じく主成分分析により抽出される第二主成分から算出された値を二次元空間の座標値として、この座標空間上にマッピングする。この二次元空間は楽曲の楽器構成の特徴を表現する特徴空間となり、楽曲の全体的な音色がシンセサイザーなどの人工的に作られた電子的な印象であるか、あるいは、その逆の人工的でない生楽器的な印象であるかを表す軸「電子度」と、楽曲の全体的な音色に含まれるノイズ成分の度合いが多いか少ないかを表す軸「ノイズ度」が横軸と縦軸に割り当てられる。
このようにすれば、メル周波数ケプストラム係数を求めることで、平均周波数スペクトルの包絡線形状の特徴を数値化することができ、楽曲の大まかな楽器構成の特徴を表すことができる。また、これを主成分分析することで、最も分離性能の高い二次元空間(または三次元空間)で楽曲の表示子を配置させることができる。すなわち、楽曲に対して人間が感じる印象、特徴・感覚を数値化して座標空間に表示させることができる。
また、このような発明において、ひとつの楽曲全体の平均スペクトル分布を求めて周波数解析を行うようにする。
このようにすれば、部分的にスペクトルを抽出して分析するよりも曲全体の特徴を把握することができるというメリットがある。
さらには、一定数の楽曲による平均値、標準偏差、および主成分分析により算出される主成分得点係数を事前に算出して記憶させておき、当該記憶された各値を用いて座標位置を算出できるようにする。
このようにすれば、楽曲が追加・削除された場合であっても、新たに膨大な演算を行う必要がないため、数万曲の楽曲を扱うような場合であっても、瞬時に楽曲の表示子を表示させることができるようになる。
加えて、事前に各楽曲に対して、その楽曲の属する音楽ジャンル、すなわち、ロックやクラッシック、ジャズなどの音楽ジャンルを付与しておき、座標空間上に表示子を表示させる場合、その音楽ジャンル毎に表示子の表示形態を変えて表示させるようにしてもよい。
このようにすれば、既定の音楽ジャンルが二次元空間のどの辺りに分布しているか分かりやすく表示することもできる。
本発明の類似楽曲表示システムでは、複数の楽曲のそれぞれをフーリエ変換し、一曲全体としてのスペクトル分布を求めてメル周波数対数スペクトルに変換し、当該メル周波数対数スペクトルを離散コサイン変換してメル周波数ケプストラム係数を求めるようにしたので、周波数スペクトル包絡線の形状の特徴を数値化することで、楽曲の楽器構成の特徴を把握することができるようになる。そして、このメル周波数ケプストラム係数を主成分分析することで、数値化された楽曲の楽器構成の特徴を次元圧縮し、最も楽曲の楽器構成の特徴を表す値へと変換するようにしたので、楽曲の表示子を座標空間上にマッピングすることができるようになる。これにより、楽曲構成が似ている楽曲を近い座標位置に集めることができるようになる。
以下、本発明の一実施の形態について図面を参照して説明する。この実施の形態は、パーソナルコンピュータやマイクロコンピュータ等の各種コンピュータあるいは携帯電話や携帯音楽プレイヤー等の端末装置(図1)を用いて類似楽曲表示システム1を実現するためのすべての機能を備えるようにしたものである。この端末装置には、所有する楽曲の表示子を二次元空間に表示させることのできる画面インターフェースを備えており、その表示子のうちのいずれかの表示子の選択を受け付けることによって、その楽曲を再生できるようにしている。なお、ここで「表示子」とは、座標空間におけるその楽曲の存在位置を表すものであって、ドットやアイコンなどによって表されるものである。
この類似楽曲表示システム1は、端末装置の他に複数のサーバーコンピュータを設け、各機能を分散させるような構成にしても良いが、この実施の形態では、入力された楽曲を処理してその楽曲の表示子を二次元空間に表示させるための処理、すなわち図2における、楽曲入力受付手段11から出力手段18までのすべての機能実現手段を端末装置に設けるようにしている。
これらの機能のうち、楽曲入力受付手段11は、ユーザーもしくはオペレーターによって楽曲の入力を受け付けるように構成される。この受け付けを行う場合、楽曲を格納したフォルダーおよびファイルの格納場所の入力を受け付け、その楽曲ファイルの選択入力を受け付けるようにする。このとき、楽曲ファイルのフォーマットとしては、現在のところ、WAVE形式、AAC形式、MP3形式などのフォーマットなど多種多様のフォーマットが存在するが、ここでは、可能な限り多くのフォーマット形式の楽曲ファイルを受け付けるようにしておく。このとき、楽曲ファイルを受け付けるだけでなく、その楽曲の曲名やアーティスト名やアルバム名や音楽ジャンルなどの楽曲情報の入力を受け付けて、それらの楽曲情報を楽曲ファイルと共に記憶させるようにしてもよいが、この実施形態においては、予め楽曲ファイルに付与されている楽曲情報を自動的に抽出して、その楽曲の曲名やアーティスト名やアルバム名や音楽ジャンルなどの情報を取得するようにしている。
この楽曲ファイルの入力を受け付けた端末装置は、前処理手段12を介して楽曲ファイルをあらかじめ定められたフォーマットに変換する。ここでは、入力された楽曲ファイルをWAVEファイルにフォーマット変換してPCMデータを取得する。取得したPCMデータの例を、横軸を時間軸、縦軸を振幅で表現して図3(a)に示す。
周波数解析手段13は、このようにして得られた図3(a)に示されるPCMデータを、時間軸方向に一定間隔にシフトさせながらフーリエ変換し、一つの楽曲についての各周波数の平均スペクトルを算出する。得られた楽曲平均スペクトルの例を、横軸を周波数、縦軸をその周波数の平均dbとして図3(b)に示す。ただし、楽曲が非常に長い場合は処理時間短縮のため、楽曲の長さに応じて所定の長さ分の平均スペクトルを算出するようにしてもよい。
ところで、このように得られたスペクトルは、周波数分布を示すものであるが、人間の聴感を基準とした場合、例えば、ピアノの中央のドの音(C4)は約261.63 Hzであり、その1オクターブ上のドの音(C5)は約523.25 Hzで、C4とC5の差は約261.63 Hz、さらにその1オクターブ上のドの音(C6)は約1046.5Hzで、C5 とC6の差は約523.25Hzというように、音程がオクターブ上昇するにつれて上昇後の周波数は上昇前の周波数の倍数となる。このため、オクターブ間の周波数差はどんどん広がって大きくなるのに対して、人間の聴感では音程がオクターブ上昇すると一定感覚の差であるように認識される。すなわち人間の聴感は高音域になればなるほど周波数間の解像度が粗くなる。そこで、周波数領域を人間の聴感に合わせるための尺度であるメル尺度に換算するために、図3(c)に示すような三角フィルタを用い、それぞれの三角フィルタと周波数スペクトルとを積算して加算する(すなわち積分する)。ここで、低音域三角フィルタについては、低音域では音の解像度が高いため、底辺が短い三角形状となっており、順次、音域が高くなる(周波数が大きくなる)につれて三角形の底辺が広くなる。そして、係数演算手段14では、それぞれの三角フィルタによって算出された値に対して自然対数をとって、メル周波数対数スペクトルを取得する。その後、この得られたメル周波数対数スペクトルを離散コサイン変換し、メル周波数ケプストラム係数(MFCC)を算出する。この処理では、図3(b)のように得られた周波数スペクトル包絡線に対して離散コサイン変換するものであり、周波数スペクトル包絡線の特徴を数値化するものであるため、一般的に周波数スペクトル包絡線の形状は楽曲の楽器構成の特徴を表すと仮定されることから、このようにすることによって楽曲の楽器構成の特徴そのものを複数の数値として表すことができる。この数値の数は、図3(c)に示す三角フィルタの数によって決定される。例えば、低音域、中音域、高音域というように3個の三角フィルタを用いる場合は、メル周波数ケプストラム係数としても3個の値が得られることになり、30個の三角フィルタを用いる場合は、メル周波数ケプストラム係数としても30個の値が得られることになる。何個のメル周波数ケプストラム係数を算出し、そのうち何個をその後の処理で利用するかに関しては、最終的に算出される二次元空間座標値を鑑みて考慮しても良い。
正規化手段15は、このようにして得られたメル周波数ケプストラム係数を対象に、全楽曲についての平均値と標準偏差を算出し、これによって得られた平均値や標準偏差を利用して、楽曲のメル周波数ケプストラム係数を正規化する(平均値が「0」、分散が「1」となるように正規化する)。この正規化処理は、図3(c)の三角フィルタ数分のメル周波数ケプストラム係数に対して処理を行う。
座標演算手段16は、あらかじめ楽曲全体に対してメル周波数ケプストラム係数の演算処理を行い、その結果を対象に主成分分析を行って、主成分得点係数を算出しておく。通常、楽曲が追加あるいは削除された場合は、全体の母数が変化しMFCCの平均値や標準偏差も変化するため、その度に全楽曲の平均値や標準偏差を再計算し、主成分分析をやり直す必要がある。しかしながら、このような方法では、楽曲数が増えれば増えるほど、演算処理の負担が高くなり、数万曲のオーダーとなると近年のパーソナルコンピュータによる処理能力をもってしても瞬時に算出できなくなってしまう。そのため、予め、分布バランスのよい楽曲、数万曲程度のMFCC平均値及び標準偏差、主成分得点係数を算出しておき、新たに楽曲が追加・削除された場合であっても、予め算出しておいたMFCC平均値、標準偏差、主成分得点係数を利用することで、瞬時に座標値を算出できるようにしておく。このように予め平均値、標準偏差、主成分得点係数を計算する方法としては、記憶手段に記憶されている楽曲数が所定の楽曲数に達したか否かを検出し、その楽曲数に達した場合に処理を行う方法を用いることもできる。
この座標演算手段16を用いて表示子の座標位置を算出する場合、まず、座標空間の次元数に対応した分の主成分を上位から抽出する。例えば、二次元空間で楽曲の表示子をマッピングする場合は上位2つ、三次元空間で楽曲をマッピングする場合は、上位3つを抽出し、すなわち上位2つ(あるいは3つ)までの主成分得点係数を正規化されたメル周波数ケプストラム係数に適用して、第一主成分を横軸、第二主成分を縦軸とし、その二次元空間においてその楽曲の表示子をマッピングする。この実施形態では、第一主成分(横軸)については、図4に示すように、楽曲の全体的な音色がシンセサイザーなどの人工的に作られた電子的な印象であるか、その逆の人工的でない生楽器的な印象であるかを表す軸として、軸の名称を「電子度」として表示上は「Electric」「Acoustic」の名称を用いる。第二主成分(縦軸)については、同じく図4に示すように、楽曲の全体的な音色に含まれるノイズ成分の度合いが多いか少ないかを表す軸として、軸の名称を「ノイズ度」として表示上は「Clean」「Noisy」の名称を用いる。このような二次元空間に表示子をマッピングする際は、マッピング手段17を介して、その楽曲の属する音楽ジャンル毎に表示形態を変え、例えば、ロック、ヒップホップ、クラッシック、ジャズなどごとに色彩や形状を変えて表示させてもよい。また、この表示子を表示させる場合は、楽曲ファイルとリンクさせておき、その表示子が選択されることによって、その楽曲ファイルを読み出して端末装置のスピーカーなどの出力手段18を介して出力させるようにする。
なお、このような二次元空間に楽曲を表示させる場合、楽曲数が多くなればなるほど表示子が混在して表示されることになり、特に、三次元空間で表示させるような場合は、画面上の奥行きを把握することが困難になる。そこで、楽曲の表示子が密接に表示されているような場合は、端末装置のマウスホイールの操作でズームインやズームアウトを可能にし、その際、一画面中で文字が重ならない程度に楽曲のタイトルやアーティストなどの情報を表示させるようにする。また、表示子にタイトルなどが表示されていない場合は、マウスホイールによる選択を受け付けることによって、その表示子のタイトルやアーティストなどを表示させるようにする。このとき、表示子が選択された場合は、その表示子に関連するアーティストの他の楽曲が選択される可能性が高いため、選択された表示子と同じアーティストに属する楽曲を検索し、そのアーティストに属する楽曲の表示子を他の表示子と区別して表示させる。この表示形態を区別して表示する方法としては、例えば、図5に示すように、その選択された表示子から放射状に線を引き出して他の表示子に連結させる方法の他、同じアーティストの表示子を大きくして表示する方法など、多種多様の方法が考えられる。
次に、このように構成された類似楽曲表示システム1を利用して楽曲を座標空間上にマッピングする場合の処理フローについて図6を用いて説明する。
まず、楽曲を記憶手段に格納する場合、格納対象となる楽曲を端末装置から入力し、その際、その楽曲の曲名やアーティスト名やアルバム名や音楽ジャンルなどの情報を楽曲ファイルから自動的に抽出して記憶させる(ステップS1)。
次に、前処理手段12によって、楽曲ファイル形式がWaveフォーマットでない場合はWaveフォーマットに変換し、PCMデータを取得する(ステップS2)。そして、その楽曲のPCMデータに対してフーリエ変換を行い、その楽曲一曲分に対する平均スペクトルを算出する(ステップS3)。そして、その平均スペクトルに対して三角フィルタを用い、メル周波数対数スペクトルに変換して離散コサイン変換を行ってメル周波数ケプストラム係数(MFCC)を算出する(ステップS4)。
次に、他の楽曲すべてについて得られたメル周波数ケプストラム係数を用いて平均値や標準偏差を求め、これらの値から平均値が「0」、分散が「1」となるように正規化し(ステップS5)、その正規化処理から出力された正規化メル周波数ケプストラム係数に対して主成分分析を行って、主成分得点係数を算出する(ステップS6)。すなわち、主成分分析の過程で得られる寄与率を参照し、寄与率の高い上位n個(二次元表示の場合:n=2、三次元表示の場合:n=3)までの主成分得点係数を正規化メル周波数ケプストラム係数に乗算し主成分得点を算出して、この第一主成分を横軸、第二主成分を縦軸、三次元表示する場合は、第三主成分を高さ軸と設定し、その楽曲の表示子をマッピング処理する(ステップS7)。
そして、そのマッピングされた座標空間上で、ユーザーによる表示子の選択を受け付けることによって(ステップS8)、楽曲の再生などの操作を受け付けられるようにする(ステップS9)。
このように上記実施の形態によれば、メル周波数ケプストラム係数を求めることで、周波数スペクトルの包絡線の特徴そのものを数値化することができ、楽曲の楽器構成の特徴を数値として表すことができるとともに、これを主成分分析することで、最も楽曲の特徴を反映する座標を算出して、二次元空間上に楽曲表示子として配置させることができ、さらに、楽曲表示子同士の距離が楽曲同士の類似度を表し、似ている楽曲表示子同士を近い座標位置に集めて表示することができるので、最終的に、多量の楽曲表示子がマッピングされた二次元空間上で、利用者は直感的に聴きたい雰囲気の楽曲を選択することができるようになる。
また、ひとつの楽曲における音響信号全体の平均スペクトル分布を求めて周波数解析を行うようにしたので、部分的にスペクトルを抽出して分析するよりも曲全体の特徴を把握することができる。
さらには、所定の楽曲数毎に平均値、標準偏差、主成分得点係数のすべてを算出して記憶させておき、当該記憶された各値を用いて座標位置を算出するようにしたので、楽曲が追加・削除された場合であっても、新たに膨大な演算を行う必要がないため、数万曲の楽曲を扱うような場合であっても、瞬時に楽曲の表示子を表示させることができるようになる。
加えて、事前に各楽曲に対して、その楽曲の属する音楽ジャンル、すなわち、ロックやクラッシック、ジャズなどの音楽ジャンルを付与しておき、座標空間上に表示子を表示させる場合、その音楽ジャンル毎に表示子の表示形態を変えて表示させることもできるようにしたので、この類似楽曲表示システム1を用いて楽曲をマッピングする場合、同じ音楽ジャンルに属する楽曲が近い位置に配置されているか否かを判断することもできるようになる。
なお、本発明は上記実施の形態に限定されることなく種々の態様で実施することができる。
例えば、上記実施の形態では、端末装置のみですべての機能を実現するようにしたが、端末装置の他にサーバーコンピュータを設けて複数の装置にこれらの機能を分散するようにしてもよい。
また、上記実施の形態では、所定の楽曲数毎に平均値や標準偏差や主成分得点係数を求めて演算処理の効率化を図ろうとしているが、楽曲数が少ない場合やコンピュータの演算処理が早くなった場合は、楽曲が追加・削除されるごとにこれらの値を再計算するようにしてもよい。
さらに、上記実施の形態では、横軸と縦軸をそれぞれ電子度・ノイズ度を示す軸としたが、このような表現に限定されるものではなく、音色も含めた種々の軸で表現することができる。
また、上記実施の形態では、楽曲の曲名やアーティスト名やアルバム名や音楽ジャンルなどの情報を自動取得させるようにしているが、これをサーバーコンピュータ側で機械検索を行って、自動取得するようにしてもよいし、端末装置で利用者が直接入力するようにしてもよい。
1 類似楽曲表示システム
11 楽曲入力受付手段
12 前処理手段
13 周波数解析手段
14 係数演算手段
15 正規化手段
16 座標演算手段
17 マッピング手段
18 出力手段
11 楽曲入力受付手段
12 前処理手段
13 周波数解析手段
14 係数演算手段
15 正規化手段
16 座標演算手段
17 マッピング手段
18 出力手段
Claims (5)
- 複数の楽曲の表示子を座標空間上に表示させる類似楽曲表示システムにおいて、
複数の楽曲のそれぞれをフーリエ変換し、スペクトル分布を求める周波数解析手段と、
当該求められたスペクトルをメル周波数対数スペクトルに変換し、当該メル周波数対数スペクトルを離散コサイン変換してメル周波数ケプストラム係数を求める係数演算手段と、
すべての楽曲のメル周波数ケプストラム係数の平均値と標準偏差を算出し、当該平均値と標準偏差を利用して個々の楽曲のメル周波数ケプストラム係数を正規化処理する正規化手段と、
すべての楽曲分の正規化されたメル周波数ケプストラム係数を対象に主成分分析を行って主成分得点係数を算出し、上位複数の主成分を抽出して楽曲の座標位置を算出する座標算出手段と、
当該座標算出手段によって算出された楽曲の表示子を座標空間上にマッピングするマッピング手段と、
を備えたことを特徴とする類似楽曲表示システム。 - 前記周波数解析手段が、ひとつの楽曲の音響信号全体の平均スペクトル分布を求めるものである請求項1に記載の類似楽曲表示システム。
- 前記正規化手段と座標算出手段が、所定の楽曲数毎に平均値、標準偏差、主成分得点係数のすべてを算出して記憶させておき、当該記憶された各値を用いて座標位置を算出するものである請求項1に記載の類似楽曲表示システム。
- 前記マッピング手段が、音楽ジャンルを示すデータの付与された楽曲に対し、当該音楽ジャンル毎に表示形態を変更してマッピングするものである請求項1に記載の類似楽曲表示システム。
- 複数の楽曲の表示子を座標空間上に表示させる類似楽曲表示方法において、
複数の楽曲のそれぞれをフーリエ変換し、スペクトル分布を求めるステップと、
当該求められたスペクトルをメル周波数対数スペクトルに変換し、当該メル周波数対数スペクトルを離散コサイン変換してメル周波数ケプストラム係数を求めるステップと、
すべての楽曲のメル周波数ケプストラム係数の平均値と標準偏差を算出し、当該平均値と標準偏差を利用して個々の楽曲のメル周波数ケプストラム係数を正規化処理するステップと、
すべての楽曲分の正規化されたメル周波数ケプストラム係数を対象に主成分分析を行って主成分得点係数を算出し、上位複数の主成分を抽出して楽曲の座標位置を算出するステップと、
当該座算出された楽曲の表示子を座標空間上にマッピングするステップと、
を備えたことを特徴とする楽曲表示方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010001599A JP2011141406A (ja) | 2010-01-06 | 2010-01-06 | 類似楽曲表示システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010001599A JP2011141406A (ja) | 2010-01-06 | 2010-01-06 | 類似楽曲表示システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011141406A true JP2011141406A (ja) | 2011-07-21 |
Family
ID=44457297
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010001599A Pending JP2011141406A (ja) | 2010-01-06 | 2010-01-06 | 類似楽曲表示システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011141406A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013206165A (ja) * | 2012-03-28 | 2013-10-07 | Xing Inc | 端末装置及び楽曲再生装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009186944A (ja) * | 2008-02-11 | 2009-08-20 | Ixicom Ltd | 類似音楽検索システム、および、類似音楽検索方法 |
JP2010527055A (ja) * | 2007-05-01 | 2010-08-05 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | コンテンツアイテムを組織する方法 |
-
2010
- 2010-01-06 JP JP2010001599A patent/JP2011141406A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010527055A (ja) * | 2007-05-01 | 2010-08-05 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | コンテンツアイテムを組織する方法 |
JP2009186944A (ja) * | 2008-02-11 | 2009-08-20 | Ixicom Ltd | 類似音楽検索システム、および、類似音楽検索方法 |
Non-Patent Citations (2)
Title |
---|
JPN6014004230; G.Tzanetakis, G.Essl, P.Cook: 'Automatic musical genre classification of audio signals' Proceedings of the 2nd International Conference on Music Information Retrieval ISMIR 2001 , 20011015 * |
JPN6014004231; '数万曲を1画面で可視化!聴きたい曲を簡単に「探せる」「買える」無料アプリ公開 -音楽"見える化"アプリ' ValuePress! , 20110325 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013206165A (ja) * | 2012-03-28 | 2013-10-07 | Xing Inc | 端末装置及び楽曲再生装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101645268A (zh) | 一种演唱和演奏的计算机实时分析系统 | |
JP2007322598A (ja) | 楽曲分類装置、楽曲分類方法、及び楽曲分類プログラム | |
JP4375810B1 (ja) | カラオケホスト装置及びプログラム | |
CN107481735A (zh) | 一种转换音频发声的方法、服务器及计算机可读存储介质 | |
WO2022089097A1 (zh) | 音频处理方法、装置及电子设备和计算机可读存储介质 | |
CN110010159B (zh) | 声音相似度确定方法及装置 | |
JPWO2009104269A1 (ja) | 楽曲判別装置、楽曲判別方法、楽曲判別プログラム及び記録媒体 | |
CN110377782A (zh) | 音频检索方法、装置和存储介质 | |
KR101813704B1 (ko) | 사용자 음색 분석 장치 및 음색 분석 방법 | |
CN113936629B (zh) | 音乐文件处理方法和装置、音乐演唱设备 | |
JP6288197B2 (ja) | 評価装置及びプログラム | |
WO2021106512A1 (ja) | 楽曲生成方法および楽曲生成システム | |
JP6102076B2 (ja) | 評価装置 | |
WO2014142200A1 (ja) | 音声処理装置 | |
JP4799333B2 (ja) | 楽曲分類方法、楽曲分類装置及びコンピュータプログラム | |
JP2006251697A (ja) | カラオケ装置 | |
JP2011141406A (ja) | 類似楽曲表示システム | |
JP5678935B2 (ja) | 楽器演奏評価装置、楽器演奏評価システム | |
JP4483561B2 (ja) | 音響信号分析装置、音響信号分析方法及び音響信号分析プログラム | |
CN115331682A (zh) | 修正音频的音高的方法和装置 | |
JP4268328B2 (ja) | 音響信号の符号化方法 | |
JP5805474B2 (ja) | 音声評価装置,音声評価方法,及びプログラム | |
JP4930608B2 (ja) | 音響信号分析装置、音響信号分析方法及び音響信号分析プログラム | |
JP2007140161A (ja) | カラオケ装置およびカラオケ装置用プログラム | |
Bader | Characterization of guitars through fractal correlation dimensions of initial transients |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121226 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20131111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140205 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140610 |