JP2009015535A - 類似音楽検索装置、類似音楽検索方法、類似音楽検索プログラム及びコンピュータで読み取り可能な記録媒体 - Google Patents

類似音楽検索装置、類似音楽検索方法、類似音楽検索プログラム及びコンピュータで読み取り可能な記録媒体 Download PDF

Info

Publication number
JP2009015535A
JP2009015535A JP2007175607A JP2007175607A JP2009015535A JP 2009015535 A JP2009015535 A JP 2009015535A JP 2007175607 A JP2007175607 A JP 2007175607A JP 2007175607 A JP2007175607 A JP 2007175607A JP 2009015535 A JP2009015535 A JP 2009015535A
Authority
JP
Japan
Prior art keywords
music
input
music data
piece
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007175607A
Other languages
English (en)
Inventor
Masamiki Shishibori
正幹 獅々堀
Kenji Kita
研二 北
Manabu Tsuge
覚 柘植
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NIPPON LABOATEC KK
Original Assignee
NIPPON LABOATEC KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NIPPON LABOATEC KK filed Critical NIPPON LABOATEC KK
Priority to JP2007175607A priority Critical patent/JP2009015535A/ja
Publication of JP2009015535A publication Critical patent/JP2009015535A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

【課題】EMDを用いて高い精度を維持しつつ、高速化を図る。
【解決手段】登録音楽データ蓄積手段32に蓄積された登録音楽データ及び入力音楽データ入力手段10から入力された入力音楽データを、各々固定長で一以上のメロディ片及び入力片に分割し、メロディ片及び入力片内に含まれる音符の出現時間、音長、音高推移情報を少なくとも含む特徴量に基づき、メロディ片及び入力片毎の音楽特徴量を算出する特徴量演算手段20と、入力片特徴量保持手段42に保持された入力音楽データに含まれる入力片の入力片特徴量と、メロディ片特徴量蓄積手段34に蓄積されたメロディ片毎の音楽特徴量について、供給地から需要地への最小輸送コストを計算するEMDの距離計算で得られた類似度を同じ距離尺度で比較することにより、入力音楽データと全体の曲調が類似した登録音楽データを抽出する類似度演算手段22と、検索結果出力手段50とを備える。
【選択図】図1

Description

本発明は、データベース等に記録された音楽,楽曲,歌等の音楽データ中から、所望の音楽データを検索するための類似音楽検索装置、類似音楽検索方法、類似音楽検索プログラム及びコンピュータで読み取り可能な記録媒体に関する。
近年、情報の電子化が進むと共に、蓄積された情報の分量が膨大となって、必要な情報を取り出すための検索システムが求められている。例えば、ローカルのハードディスク等の記録媒体に記録されたデータや、インターネット等のネットワーク接続されたシステムに記録されたデータの中から、所望のデータを抽出する検索システムの研究が進められている。このような検索システムとしては、テキスト検索や画像検索、音楽検索などが研究、実用化されている。この内、音楽データの検索システムについては、近年、HDDやコンパクトフラッシュ(登録商標)等の記憶装置の大容量化によって、音楽等のコンテンツを大量に蓄積しておくことができるようになったため、携帯音楽プレーヤーや携帯電話、HDDカーナビ等の登場によってCD・MD等のメディアを持ち運ばなくても大量の楽曲が聴けるようになっている。またインターネットの普及に伴い、楽曲配信サービスを行うサイトも多数出現し、ユーザは容易に様々な音楽データをダウンロードできるようになった。このように、極めて多数の音楽データの携帯が可能になったため、音楽をより簡単に検索できる検索システムが求められている。
しかしながら、音楽データの検索は容易でなく、従来は曲名、歌手名や歌詞等を入力するキーワード型の検索方式が一般的である。この方法では曲名や歌手、歌い出し等、少なくとも一部の情報をユーザが記憶している必要がある。また、曲名が同じでも異なる曲が存在したり、歌手や歌詞を指定しても所望の曲以外のデータが検索される等、使い勝手はよくない。例えば、音楽のダウンロード販売サイトの利用時において、膨大な音楽データから必要なデータのみを見つけ出すことは困難であり、音楽データに打する効率の良い検索手法が求められている。
これに対し、メロディやリズム等、音を直接入力して検索するコンテンツ型の検索方式は、より汎用的と考えられ、この分野での研究も進められている。例えばMIDI音楽データを対象とするコンテンツ型音楽検索手法としては、音楽データのリズムや音高の変化を特徴ベクトル化し、特徴ベクトル間の類似性をユークリッド距離を用いて判定する手法や、音楽データの音長、音高の変化の類似性を判定するDPマッチング手法が提案されている。また特許文献1には、図21のブロック図に示すリズム入力による音楽検索装置が開示される。ここでは、リズムデータ生成部202が、音楽データ蓄積部201から入力した音楽データを受け、音楽を検索するときの検索キーとして使用されるリズムデータを音楽毎に生成してリズムデータ蓄積部203に登録する。また時系列信号入力部205で、オン状態とオフ状態とを交互に繰り返す時系列信号を入力する。類似リズム検索部206は、時系列信号入力部205に入力された時系列信号と同一又は類似した変動パターンを有するリズムデータを、リズムデータ蓄積部203に蓄積されている複数のリズムデータの中から検索する。音楽付随情報蓄積部204は、リズムデータに対応する音楽に付随する音楽付随情報をリズムデータに対応付けて蓄積する。検索結果生成部207は、検索されたリズムデータに対応して記憶されている前記音楽付随情報(曲名などの情報)をもちいて検索結果を生成し、検索結果出力部208を介して出力する。しかしながら、これらいずれの方法においても、検索精度は実用上不十分といわざるを得ず、さらなる検索精度向上が求められていた。
そこで本発明者らは、距離尺度にEMD(Earth Mover's Distance)を用いたハミングによる類似音楽検索手法を先に提案した(非特許文献1)。この手法は、音長、音符の出現時間、音高差を特徴量として用い、輸送問題の解に基づきEMDを計算することにより、高精度な類似音楽検索を可能としている。EMDは輸送問題における輸送コストの最適解であり、輸送問題における各供給地が有する資源量を各音符の音長、輸送コストを各音符の出現時間と音高差情報から算出することで、音楽データが有するリズムと音程との類似度を同じ距離尺度で測り、全体の曲調が類似した音楽を検索する。
特開2006−106818号公報 大西泰代,獅々堀正幹,柘植覚,北研二「距離尺度にEarth Mover's Distanceを用いたハミングによる類似音楽検索手法」第4回情報科学技術フォーラム(電子情報処理学会)平成17年9月7日G−003
しかしながら、EMDを用いた検索処理では、検索精度が向上する反面、検索精度が遅いという欠点があり、実用化への妨げとなっていた。特にEMDの問題点として、計算量が音符数に対して指数関数的に増加するため、すべてのメロディ片に対して距離計算を行うと、多大な計算時間が必要になる。
本発明は、このような問題点に鑑みてなされたものであり、その主な目的は、EMDを用いて高い精度を維持しつつ、高速化を図ることで実用性を高めた類似音楽検索装置、類似音楽検索方法、類似音楽検索プログラム及びコンピュータで読み取り可能な記録媒体を提供することにある。
課題を解決するための手段及び発明の効果
上記の目的を達成するために、本発明の類似音楽検索装置は、検索対象となる登録音楽データを複数登録した登録音楽データ蓄積手段と、検索対象の入力音楽データを入力するための入力音楽データ入力手段と、前記登録音楽データ蓄積手段に蓄積された登録音楽データ及び前記音楽データ入力手段から入力された入力音楽データを、各々固定長で一以上のメロディ片及び入力片に分割し、メロディ片及び入力片内に含まれる音符の出現時間、音長、音高推移情報を少なくとも含む特徴量に基づき、メロディ片及び入力片毎の音楽特徴量を算出する特徴量演算手段と、前記特徴量演算手段で演算されたメロディ片毎の音楽特徴量を、元の音楽データと対応させて登録したメロディ片特徴量蓄積手段と、前記特徴量演算手段で演算された入力片の音楽特徴量を保持する入力片特徴量保持手段と、前記入力片特徴量保持手段に保持された入力音楽データに含まれる入力片の入力片特徴量と、前記メロディ片特徴量蓄積手段に蓄積されたメロディ片毎の音楽特徴量について、輸送問題の解法に基づき、供給地から需要地への最小輸送コストを計算するEMDの距離計算で得られた類似度を同じ距離尺度で比較することにより、入力音楽データと全体の曲調が類似した登録音楽データを抽出する類似度演算手段と、前記類似度演算手段で抽出された一以上の登録音楽データの検索結果をマージするマージ手段と、前記マージ手段でマージされた登録音楽データを検索結果として出力するための検索結果出力手段とを備える。これにより、EMDを利用したより高精度な類似音楽検索が可能となる。
また、第2の類似音楽検索装置は、メロディ片に含まれる音符の特徴量がさらに、2つ前の音符との音高差情報を含むことができる。これにより、基準音符間の音高差を特徴量に加えることで、メロディ片の長さを維持しつつ音楽特徴量内の音符数を削減することができるので、トータルの時間計算量の低減して高速化を図ることができる。
さらに、第3の類似音楽検索装置はさらに、前記登録音楽データ蓄積手段に蓄積された個々の登録音楽データに関する付随情報を、音楽データと関連付けて蓄積する付随情報蓄積手段を備え、前記検索結果出力手段がさらに、検索結果を表示する表示手段を備え、前記検索手段により検索された音楽データに対応して、前記付随情報蓄積手段に記憶されている付随情報を読み出し、読み出した付随情報を検索結果として、前記表示手段に表示させることができる。これにより、検索された音楽データの曲名、アーティスト名、歌詞、ジャケットイメージなどの、音楽データに関する付随情報を表示手段に表示させて、音楽そのものを再生せずとも検索された音楽をよりイメージしやすいよう、ユーザに提示できる。
さらにまた、第4の類似音楽検索装置はさらに、検索対象の音楽データをMIDIデータに変換する音楽データ変換手段を備えることができる。
さらにまた、第5の類似音楽検索装置は、前記特徴量演算手段が登録音楽データ及び入力音楽データをメロディ片に分割する際、一定長さのウインドウ長を、ウインドウ長より短いスライド幅でスライドさせて分割することができる。このようにスライディングウィンドウ方式にて分割することで、連続する分割されたメロディ片は互いに重なりのあるデータとなり、検索する部分に関して自由度が増す。さらに登録音楽データの情報量と、入力音楽データの情報量とを等しくすることで、効率よく類似度演算を行える。
さらにまた、第6の類似音楽検索装置は、前記登録音楽データ蓄積手段が、VP−treeに基づく索引化を施すことができる。これにより、距離空間内のデータを索引化することで検索速度の向上が図られる。
さらにまた、第7の類似音楽検索方法は、予め複数の登録音楽データが登録されると共に、各登録音楽データについて、固定長で一以上のメロディ片に分割して、各メロディ片に含まれる音符の出現時間、音長、音高推移情報を少なくとも含む特徴量に基づき、メロディ片毎の音楽特徴量を算出して、該メロディ片の音楽特徴量を元の音楽データと対応させてメロディ片特徴量蓄積手段に登録された類似音楽検索システムにおいて、該予め登録された登録音楽データの中から、入力された入力音楽データと類似する音楽データを検索する類似音楽検索方法であって、入力音楽データを固定長で一以上の入力片に分割する工程と、入力片内に含まれる音符の出現時間、音長、音高推移情報を少なくとも含む特徴量に基づき、メロディ片及び入力片毎の音楽特徴量を算出する工程と、入力音楽データに含まれる入力片の入力片特徴量と、前記メロディ片特徴量蓄積手段に蓄積されたメロディ片毎の音楽特徴量について、輸送問題の解法に基づき、供給地から需要地への最小輸送コストを計算するEMDの距離計算で得られた類似度を同じ距離尺度で比較することにより、入力音楽データと全体の曲調が類似した登録音楽データを抽出する工程と、抽出された一以上の登録音楽データの検索結果を出力する工程とを含むことができる。これにより、EMDを利用したより高精度な類似音楽検索が可能となる。
さらにまた、第8の類似音楽検索方法は、音楽特徴量としてさらに、2つ前の音符との音高差情報を含むことができる。これにより、基準音符間の音高差を特徴量に加えることで、メロディ片の長さを維持しつつ音楽特徴量内の音符数を削減することができるので、トータルの時間計算量の低減して高速化を図ることができる。
さらにまた、第9の類似音楽検索方法は、入力音楽データと類似する登録音楽データを抽出する工程において、音符間の最小輸送コストを計算する際、各音符の音楽特徴ベクトルの出現時間に重みパラメータを設定し、音符順番の差の大きい音符間の輸送コストを大きくするよう重みパラメータを調整することができる。これにより、EMDでトータルコストを計算する際、音符の出現時間に応じて時間軸方向の制約を強める。すなわち、音符順番の差の大きい音符間については、輸送コストを大きくするように音符間の分配フローに制御を加えることで、従来、出現時間が大きく異なる音符間に分配フローが生成される結果、誤ったメロディ片が検索されていた問題を解消でき、より高精度な類似音楽検索が実現される。
さらにまた、第10の類似音楽検索方法は、入力音楽データと類似する登録音楽データを抽出する工程において、分配フローを決定し、総輸送量計算時に音符順番の差に応じて、音符の順番の差が大きいほど大きくなるようなペナルティを付加することができる。これにより、音符の順番の差が大きいほどペナルティも大きく、すなわち給輸送量が大きくなるので、誤り曲のメロディ片とのEMDの値を大きくすることができ、誤検出を低減できる。
さらにまた、第11の類似音楽検索方法はさらに、入力音楽データと類似する登録音楽データを抽出する工程に続き、抽出された一以上の登録音楽データの検索結果を曲毎にマージし、さらにEMDの値に応じて全体の検索結果をマージすることができる。これにより、入力ハミングを分割してできる複数の部分入力片の検索結果において、正解曲のメロディ片が多く出現していることを利用し、正解曲を効率的に利用して精度を高めた類似音楽検索が実現される。
さらにまた、第12の類似音楽検索プログラムは、予め複数の登録音楽データが登録されると共に、各登録音楽データについて、固定長で一以上のメロディ片に分割して、各メロディ片に含まれる音符の出現時間、音長、音高推移情報を少なくとも含む特徴量に基づき、メロディ片毎の音楽特徴量を算出して、該メロディ片の音楽特徴量を元の音楽データと対応させてメロディ片特徴量蓄積手段に登録された類似音楽検索システムにおいて、該予め登録された登録音楽データの中から、入力された入力音楽データと類似する音楽データを検索する類似音楽検索プログラムであって、入力音楽データを固定長で一以上の入力片に分割する機能と、入力片内に含まれる音符の出現時間、音長、音高推移情報を少なくとも含む特徴量に基づき、メロディ片及び入力片毎の音楽特徴量を算出する機能と、入力音楽データに含まれる入力片の入力片特徴量と、前記メロディ片特徴量蓄積手段に蓄積されたメロディ片毎の音楽特徴量について、輸送問題の解法に基づき、供給地から需要地への最小輸送コストを計算するEMDの距離計算で得られた類似度を同じ距離尺度で比較することにより、入力音楽データと全体の曲調が類似した登録音楽データを抽出する機能と、抽出された一以上の登録音楽データの検索結果を出力する機能とをコンピュータに実現させることができる。これにより、EMDを利用したより高精度な類似音楽検索が可能となる。
また第13のコンピュータで読み取り可能な記録媒体は、上記プログラムを格納するものである。記録媒体には、CD−ROM、CD−R、CD−RWやフレキシブルディスク、磁気テープ、MO、DVD−ROM、DVD−RAM、DVD−R、DVD+R、DVD−RW、DVD+RW、Blu−ray、HD DVD(AOD)等の磁気ディスク、光ディスク、光磁気ディスク、半導体メモリその他のプログラムを格納可能な媒体が含まれる。またプログラムには、上記記録媒体に格納されて配布されるものの他、インターネット等のネットワーク回線を通じてダウンロードによって配布される形態のものも含まれる。さらに記録媒体にはプログラムを記録可能な機器、例えば上記プログラムがソフトウェアやファームウェア等の形態で実行可能な状態に実装された汎用もしくは専用機器を含む。さらにまたプログラムに含まれる各処理や機能は、コンピュータで実行可能なプログラムソフトウエアにより実行してもよいし、各部の処理を所定のゲートアレイ(FPGA、ASIC、DSP)等のハードウエア、又はプログラムソフトウエアとハードウェアの一部の要素を実現する部分的ハードウエアモジュールとが混在する形式で実現してもよい。
以下、本発明の実施の形態を図面に基づいて説明する。ただし、以下に示す実施の形態は、本発明の技術思想を具体化するための類似音楽検索装置、類似音楽検索方法、類似音楽検索プログラム及びコンピュータで読み取り可能な記録媒体を例示するものであって、本発明は類似音楽検索装置、類似音楽検索方法、類似音楽検索プログラム及びコンピュータで読み取り可能な記録媒体を以下のものに特定しない。また、本明細書は特許請求の範囲に示される部材を、実施の形態の部材に特定するものでは決してない。特に実施の形態に記載されている構成部品の寸法、材質、形状、その相対的配置等は特に特定的な記載がない限りは、本発明の範囲をそれのみに限定する趣旨ではなく、単なる説明例にすぎない。なお、各図面が示す部材の大きさや位置関係等は、説明を明確にするため誇張していることがある。さらに以下の説明において、同一の名称、符号については同一もしくは同質の部材を示しており、詳細説明を適宜省略する。さらに、本発明を構成する各要素は、複数の要素を同一の部材で構成して一の部材で複数の要素を兼用する態様としてもよいし、逆に一の部材の機能を複数の部材で分担して実現することもできる。
本明細書において類似音楽検索システムまたは類似音楽検索装置とこれに接続される操作、制御、入出力、表示、その他の処理等のためのコンピュータ、プリンタ、外部記憶装置その他の周辺機器との接続は、例えばIEEE1394、RS−232x、RS−422、RS−423、RS−485、USB等のシリアル接続、パラレル接続、あるいは10BASE−T、100BASE−TX、1000BASE−T等のネットワークを介して電気的に接続して通信を行う。接続は有線を使った物理的な接続に限られず、IEEE802.1x、OFDM方式等の無線LANやBluetooth(登録商標)等の電波、赤外線、光通信等を利用した無線接続等でもよい。さらに検索対象のテキストや画像データの保存やデータベース構築、検索等に関する設定の保存等を行うための記録媒体には、メモリカードや磁気ディスク、光ディスク、光磁気ディスク、半導体メモリ等が利用できる。
(類似音楽検索システム)
図1に、本発明の一実施の形態に係る類似音楽検索システムのブロック図を示す。この図に示す類似音楽検索システム100は、入力音楽データ入力手段10と、音楽データ変換手段12と、特徴量演算手段20と、登録音楽データ蓄積手段32と、メロディ片特徴量蓄積手段34と、付随情報蓄積手段36と、特徴量演算手段20と、メモリ手段40と、類似度演算手段22と、検索結果マージ手段24と、検索結果出力手段50とを備える。本実施の形態では、このような類似音楽検索システム100をスタンドアロンで構築する他、ネットワーク上で接続されたサーバ、クライアントシステムで構築することもできる。例えば、サーバ側プログラムで、予め登録された登録音楽データ中から、入力音楽データに類似するものを検索して出力する態様が利用できる。一例として、ユーザがインターネットサイト上で音楽をダウンロード購入する際に、ユーザが望む音楽を検索するために、携帯電話やパーソナルコンピュータなどの端末から、検索したい音楽の一部をハミングして入力し、検索結果をサーバから端末に返す。この場合、入力音楽データ入力手段10は、ユーザの携帯電話からインターネット、一般電話等のネットワーク回線を通じて、入力音楽データを取得する。音楽データ変換手段12は、入力音楽データをMIDI形式に変換する。特徴量演算手段20は、MIDI形式の入力音楽データを、固定長で一以上の入力片に分割し、さらに入力片内に含まれる各音符の出現時間、音長、音高推移情報、2つ前の音符との音高差情報等の特徴量に基づき、入力片毎の音楽特徴量を算出する。算出された入力片毎の音楽特徴量は、メモリ手段40の入力片特徴量保持手段42に保持される。
一方、検索対象の登録音楽データは、予め登録音楽データ蓄積手段32に蓄積されている。各音楽データは、同様に特徴量演算手段20によって、固定長で一以上のメロディ片に分割して、各メロディ片に含まれる音符の出現時間、音長、音高推移情報、2つ前の音符との音高差情報等の特徴量に基づき、メロディ片毎の音楽特徴量を算出して、これらメロディ片音楽特徴量は、メロディ片を含む元の音楽データと対応させて、メロディ片特徴量蓄積手段34に蓄積されている。そして類似度演算手段22が、入力片特徴量保持手段42に保持される入力片の音楽特徴量と、メロディ片特徴量蓄積手段34に蓄積されたメロディ片の音楽特徴量について、輸送問題の解法に基づき、供給地から需要地への最小輸送コストを計算するEMDの距離計算を行う。これにより得られたEMDを類似度として、同じ距離尺度で比較することにより、入力音楽データと全体の曲調が類似した登録音楽データを抽出する。このようにして抽出された複数の登録音楽データの検索結果は、必要に応じて検索結果マージ手段24によりマージされる。さらに、マージされた登録音楽データは、検索結果として検索結果出力手段50から出力される。例えば、表示手段52に検索結果を表示させたり、あるいは検索結果のデータを検索結果出力手段50がユーザの端末側に送信し、端末側のモニタに表示させる。
(登録音楽データ蓄積手段32;メロディ片特徴量蓄積手段34;付随情報蓄積手段36)
登録音楽データ蓄積手段32、メロディ片特徴量蓄積手段34、付随情報蓄積手段36は、いずれもデータベースで構成できる。登録音楽データ蓄積手段32は、検索対象となる登録音楽データを所定のフォーマットで記録する。例えばMIDI形式や、MPEG1 AUDIO Layer3形式、リニアPCM符号化音声形式、着信音楽の一種である「.mmf」形式の着信メロディ、音声データである「着うた(登録商標)」形式、SMAF形式の着信メロディなどの形式で音楽データを蓄積する機能を有する。またメロディ片特徴量蓄積手段34は、後述するメロディ片毎の特徴量を、メロディ片を含む元の登録音楽データと関連付けて記録する。さらに付随情報蓄積手段36は、個々の登録音楽データに関する付随情報を、音楽データと関連付けて蓄積している。付随情報としては、音楽データの曲名、演奏者名、作曲者名、曲の長さ、データサイズ、歌詞、ジャケットイメージなどの、音楽データに関する情報である。これら登録音楽データ蓄積手段32、メロディ片特徴量蓄積手段34、付随情報蓄積手段36は、例えばハードディスクやメモリ等の記録媒体により実現する。
(特徴量演算手段20)
特徴量演算手段20は、予め登録音楽データ蓄積手段32に蓄積された登録音楽データから、所定の特徴量を抽出する。ここでは、各登録音楽データを、固定長で一以上のメロディ片に分割し、メロディ片内に含まれる音符の特徴量に基づき、メロディ片の音楽特徴量を算出する。メロディ片への分割は、分割領域(ウィンドウ)を所定の間隔でずらすスライディングウィンドウ方式で行う。また特徴量としては、出現時間、音長、音高推移情報、2つ前の音符との音高差情報等の特徴量が利用できる。このようにして取得されたメロディ片特徴量は、上述したメロディ片特徴量蓄積手段34に記録される。メロディ片特徴量蓄積手段34に記録されたメロディ片特徴量は、登録音楽データ蓄積手段32に記録された登録音楽データの内、該メロディ片を含む元の登録音楽データと関連付けられる。関連付けは、ルックアップテーブルを利用するなど、既知の方法が適宜利用できる。これによって、後述するように類似するメロディ片がメロディ片特徴量蓄積手段34中から検索されると、該メロディ片を含む登録音楽データが登録音楽データ蓄積手段32から呼び出される。また必要に応じて、登録音楽データと更に関連付けられた付随情報を付随情報蓄積手段36から呼び出すことにより、検索された音楽データに関する詳細な情報も取得できる。
(入力音楽データ入力手段10)
ユーザは、検索したい音楽データを入力音楽データ入力手段10により入力する。例えば、ユーザが携帯電話やPDA、パーソナルコンピュータ等の端末から、ネットワークを介して類似音楽検索システムと接続し、端末のマイクロホンなどを用いて、ユーザが検索したい音楽の一部をハミングで入力する。マイクロホンは、メロディの音声波形を取得する。音声波形は、例えばリニアPCM符号化音声形式であるWAVEファイル等、適切なファイル形式に変換され、ネットワークを介して入力音楽データ入力手段10が入力音楽データとして取得する。ただ、この方法に限られず、例えばユーザの周囲で流れている音楽を、その音源にマイクロホンなどをかざして音を入力する方法や、鍵盤楽器などの演奏情報を入力する方法、例えばドレミファといったように文字列で階名を表記した音階列を入力する方式、音楽のコード進行(C、G7などの和声の系列)を入力することでそのコード進行を含む音楽を入力する方法等も適宜利用できる。また、ネットワーク接続を介した入力に限られず、スタンドアロンで類似音楽検索システムを構築している場合は、入力音楽データ入力手段10自体をマイクロホンとしてハミングを直接入力することもできる。
(音楽データ変換手段12)
音楽データ変換手段12は、入力音楽データ入力手段10で取得された入力音楽データを、適切な音声データ形式に変換する。本実施の形態においては、音声波形データをMIDI形式データに変換する。例えばWAVEファイルからMIDIデータを生成するには、音声のスペクトル分析をして機械的変換を行えばよく、例えばソフトウェアとしては、株式会社メディア・ナビゲーション製「鼻歌ミュージシャン2」、「MuseBook(R) Wav2Midi Version 1.0(http://www.musebook.com/?page=mbwav2midi)」、「採譜の達人」(http://www.pluto.dti.ne.jp/~araki/soft/)等で実施されている。
このようにして得られた入力音楽データを、同様に特徴量演算手段20で入力片に分割し、さらに入力片の特徴量を取得し、メモリ手段40に保持する。メモリ手段40は、一時的に入力片特徴量を保持する入力片特徴量保持手段42を有している。ここでは、メモリ手段40をRAMなどで構成し、入力片特徴量を保持する領域を確保している。以下、本実施の形態では、ハミングを入力してMIDI形式の音楽データを検索する類似音楽検索システムについて説明する。
(類似度演算手段22)
類似度演算手段22は、入力片であるハミング片の音楽特徴量及びメロディ片特徴量を比較し、EMDを用いた類似音楽検索を行う。具体的には、ハミング片特徴量とメロディ片特徴量を比較し、入力音楽データと全体の曲調が類似した登録音楽データを抽出する。抽出する登録音楽データの数は、例えば類似度の高い順に上位から所定の数を抽出したり、あるいは類似度が閾値を超えるものをすべて抽出するなどの方法が適宜利用できる。検索結果の登録音楽データは、必要に応じて付随情報蓄積手段36から付随情報を取得する。さらに、検索結果は必要に応じて検索結果マージ手段24でマージされる。これらの詳細については後述する。また、上述した特徴量演算手段20、類似度演算手段22、検索結果マージ手段24などは、例えばマイクロプロセッサ(MPU)やCPU、LSI、FPGAやASICといったゲートアレイ等のハードウエアや、ソフトウエア、あるいはこれらの混在により実現できる。また必ずしも各構成要素が図1に示した構成と同一でなくてもよく、その機能が実質的に同一であるもの、及び一つの要素が図1に示す構成における複数の要素の機能を備えるものは、本発明に含まれる。
(検索結果出力手段50)
このようにして抽出された複数の登録音楽データの検索結果を出力データとして、検索結果として検索結果出力手段50で出力する。例えば検索の問い合わせを行ったユーザの端末である携帯電話等に対し、テキスト情報として検索結果を送信したり、上位の登録音楽データを演奏する。
(類似音楽検索方法)
次に、類似音楽検索方法の概要を説明する。類似音楽検索手法では、ユーザが検索したい曲の特徴を入力し、これに類似した楽曲を検索する。ここでは、ユーザが曲の一部をハミングして入力する。図2に、類似音楽検索システム100の全体の流れを示す。この図に示すように、ユーザは検索したい曲の一部をハミングする。その後、ハミングを採譜ソフトでMIDI音楽データに変換した後、システムに入力する。一方、検索対象の登録音楽データに対しては、予め抽出した主旋律に対する登録音楽データ蓄積手段32を作成し、入力ハミングの音楽特徴量との距離計算を類似度演算手段22で行い、距離の近い類似したメロディを持つ曲を検索する。特に、登録音楽データの任意の部分を検索可能にするため、検索対象の登録音楽データを予めスライディングウインドウ方式によって分割しておく。スライディングウインドウ方式とは、図3のように、一定のウインドウ長を「拍」を単位として、所定量ずつスライドさせて分割する方法である。スライド幅をウインドウ長より短くすることで、連続する分割されたメロディ片は互いに重なりのあるデータとなり、検索する部分に関して自由度が増す。同様に入力音楽データも、スライディングウインドウ方式で分割する。このように、曲のデータを細かく分割して、それぞれを類似度演算の対象とすることで、類似音楽検索システムを構築することができる。また、登録音楽データ蓄積手段32内の各データが保持している情報量と、ハミング片から作られるデータが保持している情報量は「拍」を単位に等しくなるので、効率的な類似度演算が可能となる。
(類似音楽検索プログラム)
さらに、類似音楽検索プログラムのユーザインターフェース画面200の例を、図4〜図6に示す。ここでは、既に入力音楽データとしてMIDI音楽データとして予め複数収録されており、これらを選択することで、類似する登録音楽データを検索するシステムとして説明する。図4はシステムのスタート画面を示しており、左フレーム内の入力音楽データ指定欄210に収録済みのハミングデータが入力音楽データとして列挙される。また図5は、入力音楽データ指定欄210から「どんぐりころころ」を入力音楽データとして選択した際の画面例を示している。この画面から、上部の「試聴」ボタン220を押下すると「どんぐりころころ」のハミングデータが試聴できる。また、ハミングの全体検索欄には、「フレーズ形式検索」ボタン230と、「曲目形式検索」ボタン232が設けられている。「フレーズ形式検索」ボタン230は、ハミングを分割したフレーズ毎に検索し、結果をマージせずに、フレーズ毎の検索結果を出力する。また「曲目形式検索」ボタン232は、フレーズ毎に検索した結果を更にマージして、曲目毎の検索結果を出力する。さらに「ハミングの部分指定検索」欄240には、選択したハミングデータを複数のフレーズに分割したデータが列挙されており、いずれかのフレーズを押下すれば、そのフレーズだけを用いて検索する。さらに図6は、図5の画面から「曲目形式検索」ボタン232を押下した後の出力結果を示しており、検索結果表示欄250には検索結果上位から類似度順に登録音楽データ蓄積手段32内の曲目が表示される。
なお、この類似音楽検索プログラムのユーザインターフェース画面200の例において、各入力欄や各ボタン等の配置、形状、表示の仕方、サイズ、配色、模様等は適宜変更できることはいうまでもない。デザインの変更によってより見やすく、評価や判断が容易な表示としたり操作しやすいレイアウトとすることもできる。例えば検索結果を別ウィンドウで表示させる、複数画面を同一表示画面内で表示する等、適宜変更できる。またこれらのプログラムのユーザインターフェース画面において、仮想的に設けられたボタン類や入力欄に対するON/OFF操作、数値や命令入力等の指定は、類似音楽検索プログラムを組み込んだコンピュータに接続された入力部で行う。本明細書において「押下する」とは、ボタン類に物理的に触れて操作する他、入力部によりクリックあるいは選択して擬似的に押下することを含む。操作を行う入出力デバイスはコンピュータと有線もしくは無線で接続され、あるいはコンピュータ等に固定されている。一般的な入力部としては、例えばマウスやキーボード、スライドパッド、トラックポイント、タブレット、ジョイスティック、コンソール、ジョグダイヤル、デジタイザ、ライトペン、テンキー、タッチパッド、アキュポイント等の各種ポインティングデバイスが挙げられる。またこれらの入出力デバイスは、プログラムの操作のみに限られず、類似音楽検索装置等のハードウェアの操作にも利用できる。さらに、インターフェース画面を表示する表示手段のディスプレイ自体にタッチスクリーンやタッチパネルを利用して、画面上をユーザが手で直接触れることにより入力や操作を可能としたり、または音声入力その他の既存の入力手段を利用、あるいはこれらを併用することもできる。
本実施の形態においては、類似度演算のための距離尺度にEMD(Earth Mover's Distance)を用いる。この手法は、音長、音符の出現時間、音高差を特徴量として用い、輸送問題の解に基づきEMDを計算することにより、高精度な類似音楽検索を可能としている。EMDは輸送問題における輸送コストの最適解であり、本実施の形態においては、輸送問題における各供給地が有する資源量を各音符の音長、輸送コストを各音符の出現時間と音高情報から算出することで、音楽データが有するリズムと音程との類似度を同じ距離尺度で測り、全体の曲調が類似した音楽を検索する。ここでは、音楽データを固定長のメロディ片に分割した後、メロディ片内の各音符を供給地、音符の音長を供給地の資源量とみなし、各音符の出現時間、音高等の特徴量から輸送コストを算出する。この音楽特徴量をEMDで距離計算することで、リズムと音程との類似度を同じ距離尺度で計り、全体の曲調が類似したメロディを検索する。
(EMD)
ここで、EMDの詳細について説明する。EMDは、線形計画問題の一つである輸送問題における輸送コストの最適解を求めるアルゴリズムである。このようにEMDは、輸送問題の解に基づいて計算される距離尺度であり、2つの離散分布において、一方の分布を他方の分布に変換するための最小コストとして定義される。輸送問題とは、需要地の需要を満たすように供給地から需要地へ輸送を行う場合の最小輸送コストを解く問題である。ここでP、Qをそれぞれ供給地、需要地としてEMDを計算する場合を考える。はじめに、P、Qの各要素に対する単位輸送あたりの輸送コスト(dij)を計算すると、次式で表現できる。
本実施の形態においては、輸送距離として各ベクトル要素piとqjのユークリッド距離を用いる。つぎに、piとqjのすべての組み合わせを考慮し、総輸送コストを計貫する。総輸送コストは、PからQへの輸送量(フロー)(F={fij})を決定する以下の輸送問題の解を用いて計算する。ここで、任意の供給地・需要地の組み合わせによる総輸送量(WORK)は、次式で表現できる。
この目的関数は、i、j間の輸送量に単位輸送コストを乗算し、和をとることで総輸送コストが計算されることを示している。なお、ここでは総輸送コストを計算する場合、以下の制約条件1〜4(数3〜数6)を具備するものとする。
制約条件1:供給地から需要地の一方向にしか輸送されない
制約条件2:供給地iから供給できる容量は供給量ωpiを超過しない
制約条件3:需要地jが受け取れる容量はωqj以下である
制約条件4:供給地から移動する輸送量(総フロー)は、次式で表現される
最終的にEMD(P、Q)は、上記の輸送問題の最適値、すなわち総輸送コストの最小値として、WORK(P、Q)を総フローで除算し、次式で演算できる。
EMDの計算処理の例を図7に示す。図7の例では、2台のトラックを供給地、3個の枡目を需要地として、各々の図で示す荷物が割り当てられる。供給量、需要量の総和は、どちらも10個で同数である。供給地から需要地への経路は矢印の数字で示され、輸送経路を実線矢印で示している。また、それぞれの輸送コストも示している。図7でのEMDの計算は、次式で演算できる。
輸送コスト=距離×輸送量
EMD=総輸送コスト÷総輸送量
EMD=(9+2+5)÷10=1.6
(音楽特徴量)
EMDを類似音楽検索手法に適用するにあたり、スライディングウインドウ方式により分割されたメロディ片毎に特徴量を作成する。単作輸送コストを求めるための特徴量は、各音符のNote−on開始時刻、前音との音高差、音高推移特徴とした。図8に、EMDに適用する音楽特徴量の生成例として、(a)のようなメロディ片に対し、(a)4分音符を1拍とした音楽特徴量と、(b)8分音符を1拍とした音楽特徴量を、それぞれ示す。ここで、開始時間と音長は拍数で表し、音高差は半音高い音を1、半音低い音を−1としている。
図8(b)、(c)に示す音楽特徴量データにおいて、1行目はメロディ片内の音符の数を表し、2行目以降は、出現音符に対する特徴量を示している。すなわち、図8(a)の例では音符1〜4の4個の各音符に対して、(音長、出現時間、音高差、音高推移)が特徴量として表示される。例えば図8(b)は4分音符を1拍とした場合であり、第1音の音符1は、1:(音長、出現時間、音高差、音高推移)=(1、0、0、−1)となる。また図8(c)は8分音符を1拍とした場合であり、同じく音符1の特徴量は(音長、出現時間、音高差、音高推移)=(2、0、0、−1)となる。ここで、音高差は前音符との音高差であるため、第1音のように対応する前音が無い場合は、0とする。このようにして、個々の音符に対して、音長情報も考慮した特徴量が生成される。
抽出した音楽特徴量をEMDの定義に当てはめると、音長が供給量ωpi(需要量ωqj)となり、また開始時間、音高差、音高推移が供給地(需要地)を表す特徴ベクトルpi,qjとなる。またメロディ片間の距離EMDは、個々の音符を供給地、需要地と定義し、EMDの定義式に従い計算する。
(EMDを用いた検索処理の問題点)
ここで、EMDを用いた検索処理では、検索速度が遅いことが実用化において障害となる。検索速度が遅い理由としては、(1)距離計算回数が多い、(2)時間計算量が大きい、の2点が挙げられる。ここで、距離計算回数が多くなる理由は、メロディ片の数に起因する。すなわち、曲をメロディ片に分割しているため、1曲が複数のメロディ片に分割されることになる。その結果、メロディ片数は膨大になり、すべてのメロディ片に対して距離計算を行うと、多大な計算時間が必要となる。
また、時間計算量が大きくなる理由は、音符数に起因する。すなわち、EMDの計算には一般にシンプレックス法が用いられるため、音符数をNとすると、Nに対して指数関数的に時間計算量が増加する。メロディ片内には音符数が多く、多大な計算時間が必要となる(本発明の実験データでは、2小節のメロディ片内での平均音符数は約14であった)。そこで、これらの問題点の解決を図るため、検索手法に改良を加えた実施例について、以下順次説明する。
(実施例1 VP−treeを用いた距離計算回数の低減)
まず実施例1として、「距離計算回数が多い」問題に対しては、登録音楽データ蓄積手段32の索引化手法(インデキシング)を適用する。従来の音高推移特徴ベクトルを用いた手法では、ユークリッド空間内のデータを索引化するSR−treeを採用している。一方、EMDはユークリッド空間では表現されないため、同様の索引化手法は適用できない。そこで実施例1として、EMDが距離の3公理を満たす点に着目し、距離空間内のデータを索引化するVP−treeを採用した類似音楽検索とすることで、検索速度の向上が図られる。なお距離の3公理については、Yianilos, P.N.: Data structures and algorithms for nearest neighbor search in general metric spaces, Proc. of the ACM-SIAM SODA’93, pp. 311.321 (1993).に、VP−treeについては、Fu, A.W.-C., Chan, P.M.S., Cheung, Y.-L. and Moon, Y.S.: Dynamic vp-tree indexing for n-nearest neighbor search given pair-wise distances, VLDB Journal, pp.2.8 (2000).に、それぞれ説明されており、これらの技術を適用できる。
(実施例2 音楽特徴量内の音符数削減による時間計算量の低減)
次に、「時間計算量が大きい」問題に対しては、音楽特徴量内の音符数を削減する必要がある。音楽特徴量内の音符数を削減させるためには、メロディ片の長さを単に短くすることが考えられる。しかしながら、メロディ片を短くすると情報量が減少し、検索精度が低下することが容易に想像できる。そこで実施例2として、メロディ片の長さ(スライディングウィンドウのウインドウ長)を変化させずに、すなわちメロディ片内の情報量を減少させずに、音楽特徴量内の音符数だけを削減させた類似音楽検索システムとする。この手法では、図9に示すように、メロディ片の長さを変えずにスライディングウィンドウ内で偶数番目に出現する音符(スキップ音符)の特徴量を削除し、スキップ音符の音長を前の音符(基準音符)の音長に加算する。更に、スキップ音符が本来存在しなかったメロディ片と区別するため、輸送コストを求める特徴量に基準音符間の音高差、ここでは2つ前の音符との音高差を加える。最終的に各音符の特徴量を次式のように変更し、スキップ音符の特徴を補う音楽特徴量を作成する。
(基準音符の音長+スキップ音符の音長、基準音符の出現時間、基準音符とスキップ音符間の音高差、基準音符の音高推移、基準音符間の音高差)
このようにして音符数を削減し、検索システムの高速化を実現した。図9に示すように、ウインドウ長は変えずに偶数個めの音符(スキップ音符)の特徴量を削除し、重みだけを前の音符(基準音符)の重みに付加する。このときの特徴量としては、(音長、出現時間、音高差、音高推移)に加えて、2つ前の音符との音高差(基準音符間の音高差)を特徴量に加えることにより、スキップ音符の特徴を補うことができる。図9のメロディでは、改良後の音符は基準音符だけの特徴が残り、1:(2、0、0、−1、0)、2:(2、2、−2、2、−3)となるのでスキップ音符の要素が削減できている。また、スキップ音符の音長を重みとして、基準音符の音長に加えているため、重みの和は一定である。
(実施例2の評価)
このようにして、音符を削除して特徴量を削減し高速化を図った類似音楽検索システムを有用性を評価すべく、実験を行い、部分ハミング片の検索結果毎に分析した。その結果、誤検索が生じているものについては、EMDを計算する際、音符の順番が大きく異なる分配フローが生じる結果、誤検索を生じていることが判明した。音符の並びについては、輸送コストを計算する際、出現時間を音楽特徴量に加えることにより、音符の順番の近い音符に対して重み付けが分配できるように設定している。しかしながら、その他の特徴量、例えば音高差や音高推移の影響を強く受けた場合には、音符の順番が大きく異なるフローが生成されてしまい、部分ハミング片と誤り曲のメロディ片との間のEMDが、正解曲のメロディ片よりも小くなって、誤検出を生じていた。
図10に、すべての部分ハミング片(884個)の検索結果上位1位について、正解曲のメロディ片が検索できた場合と、誤検索となった場合のメロディ片において、分配フローが生成された音符間の出現順位の差(音符間距離)の分布を示す。この図より、正解曲のメロディ片に対しては、音符の順番の比較的近い音符について分配フローが生じていることが判る。これに対して、誤り曲のメロディ片に対しては、音符の順番の遠い音符への分配フローの割合が大きい。この結果から、音符の並びを重視した分配フロー決定の手法が必要であると考えられる。
(部分ハミング片OR検索方法)
図10で示した評価試験で適用した検索方法は、部分ハミング片OR検索方法を用いた。この検索方法では、入力ハミングhをスライディングウインドウ方式でm個に分割した部分ハミング片をhj、登録音楽データ蓄積手段32の曲aを同じくスライディングウインドウ方式でn個に分割した部分メロディ片をaiとした場合、曲aに対する距離D(a,h)は、次式で演算できる。
その他の曲に対しても同様に距離を計算し、その距離を用いて曲ごとの類似度を計算し、曲ごとの類似度を計算し、順位付けを行った。類似度は距離の逆数として計算した。この計算方法では、入力ハミングを分割した複数の部分ハミング片のうち、一つでも登録音楽データ蓄積手段32中の音楽データに含まれる部分メロディ片とのEMDが小さければ、類似度が高くなり、検索結果の上位にリストアップされることになる。このように、部分ハミング片OR検索方法は、複数ある部分ハミング片のうち一部分のみにしか着目していない検索方法であり、ハミング片全体を考慮していない。
上述した実施例2の評価試験で誤検索となった入力ハミングに対し、部分ハミング片ごとの検索結果上位50件の正解曲のメロディ片、および誤検索となった曲のメロディ片の割合を調査したところ、正解曲のメロディ片は検索結果の52%であり、検索結果1位(誤検索)である曲のメロディ片は35%であった。このことから、検索結果に多くの正解曲のメロディ片を含んでいたとしても、部分ハミング片の内、一つでも距離が小さいものが存在すると類似度が高くなってしまい、誤検索となることが判明した。よって、部分ハミング片OR検索方法は適切といえず、各曲の出現率も考慮した類似度計算が必要であると考えられる。
そこで、このような問題点を解決し、更なる精度向上を目的として鋭意研究した結果、音楽特徴量の追加、EMD計算の改良、類似度計算の改良が有効であることが判明した。以下、これらを順次説明する。
(実施例3 2つ前の音符との音高差を音楽特徴量として追加)
先の評価試験では、音楽特徴量として出現時間、音高差特徴量、音高推移特徴量を用いた。更なる精度向上のため、上述した2つ前の音符との音高差を音楽特徴量として更に追加する。この様子を、図11に示す。この図は、図8(a)のメロディ片と同じメロディ片図11(a)に対して、出現時間、前音との音高差、音高推移特徴に加えて、更に2つ前の音符との音高差を追加した音楽特徴量を示している。比較のため、図11(b)には先の評価試験での音楽特徴量を示し、図11(c)に実施例3に係る検索手法の音楽特徴量を示す。図11(c)は、8分音符を1拍とした場合の音楽特徴量を示しており、第1音である音符1は、(音長、出現時間、音高差、音高推移、2つ前の音符との音高差)=(2、0、0、−1、0)となる。なお第2音目までは、2つ前の音符が判らないので、特徴量は0とする。第3音目の2つ前の音との音高差は第1音との音高差であるので、−3となる。
(音符の並びを重視した分配フロー決定方法)
次に、音符の並びを考慮した分配フローの制限を加えたEMD計算方法として、以下の2つの実施例を説明する。
(実施例4 輸送コスト計算内重み付けEMD)
実施例4に係る類似音楽検索システムは、時間軸方向への制約を強める方法である。この方法は、音符順番の差の大きい音符間については、輸送コストを大きくする。音符間の輸送コストは、数1の音楽特徴ベクトルのユークリッド距離を計算して求める。そこで、各音符の音楽特徴ベクトルの出現時間に重みパラメータを設定し、パラメータを調整することで出現時間に応じて時間軸方向の制約を強め、音符順番の差の大きい音符間の輸送コストを大きくする。これは数1を、次式数9に改良することにより実現できる。
数9におけるαkの重みパラメータは、各音楽特徴量毎にベクトル内で設定する。
(実施例5 総輸送量計算内重み付けEMD)
上記の実施例4は、分配フロー決定処理内での改良であるのに対して、実施例5では分配フロー決定後、音符順番の差の大きい音符へフローができている場合に対して、ペナルティを加える方法である。この方法は、まず分配フローを決定し、総輸送量計算時に音符順番の差に応じたペナルティを付与する。音符の順番の差が大きいほど、ペナルティも大きくなり、その結果、給輸送量が大きくなる。誤り曲のメロディ片では、音符順番の差の大きい音符へ分配フローが多く生成されているので、この方法によれば誤り曲のメロディ片とのEMDの値を大きくすることができる。一方、正解曲のメロディ片に対しては、音符順番の差の小さい音符へ分配フローが生成される傾向が強いので、ペナルティが小さくなる。これは、上記数2で示した総輸送量計算を、次式数11に変更することにより実現できる。
上記数10においてβは、音符順番の差のペナルティ値である。数10では、音符の順番の差が大きくなるほど、総輸送量が大きくなる。図10に示したように、誤り曲のメロディ片に対しては、音符順番の差が大きい音符にフローが分配されていることが多く、本実施例5により、これらのフローに対しペナルティを加えることができる。その結果、誤り曲のメロディ片の順位を下げることができ、正解曲のメロディ片が上位にランクでき、検索精度を向上させることができる。
(実施例6 検索結果マージ方法)
次に実施例6として、検索結果上位のメロディ片内に正解曲のメロディ片が多く含まれていることに着目し、正解曲を効率的に利用するための検索結果のマージ方法を説明する。この検索結果マージ方法は、入力ハミングhをスライディングウインドウ方式でm個に分割した部分ハミング片を、hj毎にEMDの値が小さい上位l件を検索する。この検索結果に対して、部分ハミング片hjの曲aに対する距離dを、以下の式から求める。
その後、すべての部分ハミング片の曲毎の結果より、曲毎の類似度を次式で計算し、順位付けを行う。
(評価)
上記で説明した実施例4〜5の有効性を検証するための実験を行った。本実験では検索対象の登録音楽データ蓄積手段32として、童謡、J−pop、演歌等のジャンルが含まれるカラオケ用MIDI音楽データ483曲を使用した。これら市販のMIDI音楽データは、指定のチャネルに主旋律が格納されているため、機械的に主旋律のデータのみを自動抽出した。その後、主旋律のデータに対して、スライディングウインドウ方式を適用して、メロディ片を生成する。
ここでスライディングウインドウの条件としては、8分音符を1拍とし、ウインドウ長16拍、スライド長4拍として、計84554のメロディ片を生成した。メロディ片内の各音符に対しては、8分音符の長さを1とした音長、出現時間、音高差特徴量、音高差推移特徴量を用いて、特徴量演算手段20で音楽特徴量を作成した。
検索入力には、男女10名が歌ったハミングを、市販の採譜ソフトでMIDI形式に変換した50曲を用いた。採譜方法としては、ハミングの長さが最低でもウインドウ長を超える条件を義務付けた。なおハミングの際には、正確なハミングは要求せず、その曲を知っている人が聞いて分かるレベルの入力とした。そのため、入力ハミングにはリズム、音程のずれが生じた。
(実施例6の評価)
まず、実施例6に係る検索結果マージ方法の有効性を確認するため、本発明に係るEMDと、従来のDPマッチングに対して、各検索結果に対して部分ハミング片OR検索を用いた場合と、実施例6に係る検索結果マージ方法を用いた場合の検索結果を図12に示す。この図より、部分ハミングOR検索と、実施例6に係る手法の検索結果とを比較すると、EMDを用いた検索では、5位までの検索結果が86%から2%向上し、40位までにはすべてのハミングに対して正解の曲をすべて検索できた。この結果から、EMDを用いた検索では、実施例6の手法が有効であることが確認された。
ただ、DPマッチングにおいては、検索精度の向上はそれ程確認できなかった。この原因を分析するために、実施例6及びDPマッチングにおいて、それぞれ10位以内に正解曲を検索できなかった6曲のハミングについて、それらの検索結果を調査した。するとDPマッチングを用いた検索では、部分ハミング片の検索の上位に目的のメロディ片が全く検索できておらず、本実施の形態に係る検索結果マージ方法の効果が現れていなかった。特に、これらの部分ハミング片には音程の大きなズレが生じており、DPマッチングが大きな音程のズレに頑健でないために、検索結果の上位に正解曲が検索できなかったためと思われる。一方、EMDを用いた場合には、大きな音程のズレを局所的に含む入力ハミングに対しても、上位に目的のメロディ片を検索できていたため、実施例6に係る検索結果マージ方法を用いると精度が向上した。このことから、正解曲が上位に検索できている場合は、実施例6の検索結果マージ方法が有効に働くといえる。以下の評価試験では、実施例6に係る検索結果マージ方法を適用している。
(実施例4の評価)
次に、実施例4に係る輸送コスト計算内重み付けEMD改良手法の検索精度評価を行った。図13に、輸送コスト計算内重み付けEMDの精度比較グラフを示す。この図は、出現時間のパラメータの値をα=4で固定し、音高差特徴量、音高推移特徴量のパラメータの値をα=1としたときの検索精度である。また従来法での各特徴量のパラメータの値は、すべて1である。この図から、正解データを上位に検索できていることが確認できた。
次に、出現時間のパラメータαを変化させた場合の検索精度を評価する。図14に出現時間パラメータα=1〜3、図15にα=4〜6における、検索精度の変化をそれぞれ示す。図14によれば、出現時間のパラメータ値を大きくすることにより5位から20位までの検索精度が向上した。またいずれの図でも、20位以上の検索精度に変化がみられなかった。20位に正解曲が検索できなかったハミングは、各パラメータとも共通していた。検索できなかったハミング(2曲)について試聴し、正解曲と比較した締果、リズムに大きなズレが生じていることが判明した。リズムにズレが生じたハミングに対しては、出現時間を重視した実施例4に係る手法では輸送コスト計算に出現時間が反映できなかったためと考えられる。
また図15より、パラメータ値α=6の時の検索精度が一部において低下している。この原因として、出現時間のパラメータ値が大きくなったことによって、音高差特徴と音高推移特徴が反映されなかったものと考えられる。ここで、入力ハミングに対して詳細な分析を行った。表1に、従来(α=1)の入力ハミングの順位を基準に、各パラメータ毎の順位の向上曲数と下落曲数を示す。
この表より、順位が向上したデータはパラメータ値4で頭打ち(50曲中7件)となっており、下落したデータ数はパラメータ値が大きくなると増加している。このことから、出現時間パラメータの設定に際しては、音高差特徴量と音高推移特徴量も反映できるように考慮する。また、類似度演算手段22によりEMD計算内のパラメータの値の自動設定することもできる。
(実施例5の評価)
次に、実施例5に係る総輸送量計算内重み付けEMD改良手法に対する検索精度の評価を行う。図16に、総輸送量計算内重み付けEMDの精度を比較したグラフを示す。ここでは、総輸送量計算内での音符順番の差に対応したペナルティβを、1/5、1/2としたときの精度と、従来手法としてβ=0のときの精度を、各々比較している。この図から、ペナルティβを与えることによって、正解曲が上位に検索でき、精度が向上していることが確認できた。β=1/2では、検索件数25位までにすべての入力ハミングに対して正解曲が検索できた。
次に、ペナルティβの値の違いにおける精度を検証する。図17に、βを0、1/10、1/5、1/2、1と変更したときの検索精度を表している。この図より、βの値を変更すると、検索精度に違いが生じた。β=1/10では、従来手法のβ=0と比較すると検索精度は変化が少ない。これは、ペナルティの値が小さく総輸送量計算の際、ペナルティの影響が小さく検索精度にも影響しなかったためと考えられる。また、β=1/5、β=1/2では、従来手法より精度が向上したことが確認できた。
なお、ペナルティをβ=1にした際、検索精度は従来手法より低下した。これは、正解曲のメロディ片においても音符の差の大きいところに分配フローを生成しているため、正解曲のメロディ片に対してもペナルティが大きくなり、順位を下げる結果となったものと考えられる。このとき上位に上がったデータは、部分ハミング片に含まれる音符数がほぼ等しい、誤ったメロディ片が誤検索されていた。表2に、従来手法の入力ハミングの順位を基準に、各ペナルティ毎の順位の向上曲数と下落曲数を示す。
この表より、ペナルティを大きくすると順位が向上した曲が増えることが確認できる。実験によればペナルティ値β=1/2のとき、向上曲数が最大となった。また、β=1、β=2では下落した曲が向上曲数を上回る結果となり、図17からも判るようにペナルティが大き過ぎると精度低下の原因となる。本実験データに対しては、β=1/5、β=1/2がペナルティ値として最適であるといえる。
(実施例3の評価)
次に、EMD距離計算に用いる音楽特徴量として、出現時間、音高差特徴量、音高推移特徴量に加えて、2つ前の音符との音高差特徴量を用いて検索を行った実施例3に係る検索方法の精度を評価する。図18に、2つ前の音符との音高差を追加した際の検索精度を示している。この図より、検索順位5位までの検索精度は従来手法より6%向上した。音楽特徴量を追加することにより、正解メロディを正確に特定しやすくなったためと考えられる。
(実施例7の評価)
最後に、上記実施例3〜6の手法を組み合わせた実施例7として、その検索結果を従来手法と比較したグラフを図19に示す。この図より、実施例7に係る手法での上位5位までの検索精度は、従来手法の検索精度を86%から94%へ向上させており、実施例7の有用性が確認された。また、本実験で用いたハミングにおいては、検索順位25位までに正解曲を検索できた。これらの結果から、本発明に係る手法の有効性を確認することができた。
また図20に、楽曲は同じであるが、異なる人間がハミングした場合の検索精度の変化を示す。この図において、ハミングA、ハミングBは異なる人間が同じメロディをハミングしたものであり、異なる人間がハミングすると音長、音程にばらつきがあることがわかる。この2つのハミングを入力とし、DPマッチング、及び実施例7に係る手法を用いて検索を行った。DPマッチングを用いた検索では、ハミングAでは検索結果1位に正解のメロディを検索できたが、ハミングBでは検索結果50位までに正解メロディを模索できず、誤検索となった。これに対し、実施例7に係る手法ではハミングA、ハミングB共に検索結果1件に同じ正解メロディを検索できた。
DPマッチングにおいて誤検索となった原因としては、ハミングBでは音程のズレた音符が複数含まれているため、DPマッチング距離計算において、音程のずれた音符のペナルティが距離に加算されたためと考えられる。このことから、DPマッチングでは正確なハミングに対しては頑健な模索が可能であるが、音程のズレた音符が複数含まれるハミングに対しては検索が困難であるといえる。
一方、実施例7に係る手法では、音程のズレにも対応した検索が可能である。これは、音程のズレた音符の音長を、輸送コストが小さくなるように分配することで、音程のズレに対するコストの増加を抑えることができるためと考えられる。このように、EMDを用いた手法を改良することで、音長、音程のばらつきを考慮した柔軟な検索が可能であるといえる。
以上のように、距離尺度としてEMDを用いたハミングによる類似音楽検索を改良することで、検索精度を向上させることができる。特に、EMD計算内の改良と検索結果のマージ方法を適用することで、実際のハミングデータを用いた評価実験では、従来のEMDを用いた検索手法に比べ検索精度を向上できることが確認された。さらに、EMD計算内のパラメータの値を自動設定したり、輸送コスト計算内EMD改良手法と総輸送量計算内EMD改良手法の両方を組み合わせることでも、より高速化、高精度化を図ることが期待される。
本発明の類似音楽検索装置、類似音楽検索方法、類似音楽検索プログラム及びコンピュータで読み取り可能な記録媒体は、音楽ダウンロードサイトにおいて、ユーザが所望の音楽検索をする際にハミングで入力して、類似する音楽を検索する用途に好適に適用できる。
本発明の一実施の形態に係る類似音楽検索システムを示すブロック図である。 ハミング入力による類似音楽検索システムの全体の流れを示す概念図である。 スライディングウインドウ方式によりメロディを分割する様子を示す概念図である。 類似音楽検索プログラムの起動時のユーザインターフェース画面を示すイメージ図である。 類似音楽検索プログラムの検索時のユーザインターフェース画面を示すイメージ図である。 類似音楽検索プログラムの検索結果のユーザインターフェース画面を示すイメージ図である。 EMDの計算処理の例を示す概念図である。 EMDに適用する音楽特徴量の生成例を示す概念図である。 音楽特徴量内の音符数を削減する様子を示す概念図である。 分配フロー毎の音符間距離の分布を示すグラフである。 音楽特徴量として2つ前の音符との音高差を追加する例を示す概念図である。 実施例6に係る検索結果マージ方法と、従来のDPマッチングに部分ハミング片OR検索を用いた場合の検索結果を示すグラフである。 実施例4に係る輸送コスト計算内重み付けEMDの検索精度を従来例と比較したグラフである。 図13において出現時間パラメータαを1〜3に変化させた場合の検索精度を比較したグラフである。 図13において出現時間パラメータαを4〜6に変化させた場合の検索精度を比較したグラフである。 実施例5に係る総輸送量計算内重み付けEMD改良手法に対する検索精度を従来例と比較したグラフである。 ペナルティβを変化させた場合の検索精度を比較したグラフである。 実施例3に係る2つ前の音符との音高差特徴量を用いた検索方法の検索精度を従来例と比較したグラフである。 実施例7の検索結果を従来例と比較したグラフである。 同じ楽曲を異なる人間がハミングした場合の検索精度の変化を示す概念図である。 従来のリズム入力による音楽検索装置の構成を示すブロック図である。
符号の説明
100…類似音楽検索システム
200…類似音楽検索プログラムのユーザインターフェース画面
10…入力音楽データ入力手段
12…音楽データ変換手段
20…特徴量演算手段
22…類似度演算手段
24…検索結果マージ手段
32…登録音楽データ蓄積手段
34…メロディ片特徴量蓄積手段
36…付随情報蓄積手段
40…メモリ手段
42…入力片特徴量保持手段
50…検索結果出力手段
52…表示手段
201…音楽データ蓄積部
202…リズムデータ生成部
203…リズムデータ蓄積部
204…音楽付随情報蓄積部
205…時系列信号入力部
206…類似リズム検索部
207…検索結果生成部
208…検索結果出力部
210…入力音楽データ指定欄
220…「試聴」ボタン
230…「フレーズ形式検索」ボタン
232…「曲目形式検索」ボタン
240…「ハミングの部分指定検索」欄
250…検索結果表示欄

Claims (13)

  1. 検索対象となる登録音楽データを複数登録した登録音楽データ蓄積手段と、
    検索対象の入力音楽データを入力するための入力音楽データ入力手段と、
    前記登録音楽データ蓄積手段に蓄積された登録音楽データ及び前記音楽データ入力手段から入力された入力音楽データを、各々固定長で一以上のメロディ片及び入力片に分割し、メロディ片及び入力片内に含まれる音符の出現時間、音長、音高推移情報を少なくとも含む特徴量に基づき、メロディ片及び入力片毎の音楽特徴量を算出する特徴量演算手段と、
    前記特徴量演算手段で演算されたメロディ片毎の音楽特徴量を、元の音楽データと対応させて登録したメロディ片特徴量蓄積手段と、
    前記特徴量演算手段で演算された入力片の音楽特徴量を保持する入力片特徴量保持手段と、
    前記入力片特徴量保持手段に保持された入力音楽データに含まれる入力片の入力片特徴量と、前記メロディ片特徴量蓄積手段に蓄積されたメロディ片毎の音楽特徴量について、輸送問題の解法に基づき、供給地から需要地への最小輸送コストを計算するEMDの距離計算で得られた類似度を同じ距離尺度で比較することにより、入力音楽データと全体の曲調が類似した登録音楽データを抽出する類似度演算手段と、
    前記類似度演算手段で抽出された一以上の登録音楽データの検索結果をマージするマージ手段と、
    前記マージ手段でマージされた登録音楽データを検索結果として出力するための検索結果出力手段と、
    を備えることを特徴とする類似音楽検索装置。
  2. 請求項1に記載の類似音楽検索装置において、
    メロディ片に含まれる音符の特徴量がさらに、2つ前の音符との音高差情報を含むことを特徴とする類似音楽検索装置。
  3. 請求項1又は2に記載の類似音楽検索装置において、さらに、
    前記登録音楽データ蓄積手段に蓄積された個々の登録音楽データに関する付随情報を、音楽データと関連付けて蓄積する付随情報蓄積手段を備え、
    前記検索結果出力手段がさらに、検索結果を表示する表示手段を備え、
    前記検索手段により検索された音楽データに対応して、前記付随情報蓄積手段に記憶されている付随情報を読み出し、読み出した付随情報を検索結果として、前記表示手段に表示させてなることを特徴とする類似音楽検索装置。
  4. 請求項1から3のいずれか一に記載の類似音楽検索装置において、さらに、
    検索対象の音楽データをMIDIデータに変換する音楽データ変換手段を備えることを特徴とする類似音楽検索装置。
  5. 請求項1から4のいずれか一に記載の類似音楽検索装置において、
    前記特徴量演算手段が登録音楽データ及び入力音楽データをメロディ片に分割する際、一定長さのウインドウ長を、ウインドウ長より短いスライド幅でスライドさせて分割することを特徴とする類似音楽検索装置。
  6. 請求項1から5のいずれか一に記載の類似音楽検索装置において、
    前記登録音楽データ蓄積手段が、VP−treeに基づく索引化を施されてなることを特徴とする類似音楽検索装置。
  7. 予め複数の登録音楽データが登録されると共に、各登録音楽データについて、固定長で一以上のメロディ片に分割して、各メロディ片に含まれる音符の出現時間、音長、音高推移情報を少なくとも含む特徴量に基づき、メロディ片毎の音楽特徴量を算出して、該メロディ片の音楽特徴量を元の音楽データと対応させてメロディ片特徴量蓄積手段に登録された類似音楽検索システムにおいて、該予め登録された登録音楽データの中から、入力された入力音楽データと類似する音楽データを検索する類似音楽検索方法であって、
    入力音楽データを固定長で一以上の入力片に分割する工程と、
    入力片内に含まれる音符の出現時間、音長、音高推移情報を少なくとも含む特徴量に基づき、メロディ片及び入力片毎の音楽特徴量を算出する工程と、
    入力音楽データに含まれる入力片の入力片特徴量と、前記メロディ片特徴量蓄積手段に蓄積されたメロディ片毎の音楽特徴量について、輸送問題の解法に基づき、供給地から需要地への最小輸送コストを計算するEMDの距離計算で得られた類似度を同じ距離尺度で比較することにより、入力音楽データと全体の曲調が類似した登録音楽データを抽出する工程と、
    抽出された一以上の登録音楽データの検索結果を出力する工程と、
    を含むことを特徴とする類似音楽検索方法。
  8. 請求項7に記載の類似音楽検索方法において、
    音楽特徴量としてさらに、2つ前の音符との音高差情報を含むことを特徴とする類似音楽検索方法。
  9. 請求項7又は8に記載の類似音楽検索方法において、
    入力音楽データと類似する登録音楽データを抽出する工程において、音符間の最小輸送コストを計算する際、各音符の音楽特徴ベクトルの出現時間に重みパラメータを設定し、音符順番の差の大きい音符間の輸送コストを大きくするよう重みパラメータを調整することを特徴とする類似音楽検索方法。
  10. 請求項7から9のいずれか一に記載の類似音楽検索方法において、
    入力音楽データと類似する登録音楽データを抽出する工程において、
    分配フローを決定し、総輸送量計算時に音符順番の差に応じて、音符の順番の差が大きいほど大きくなるようなペナルティを付加することを特徴とする類似音楽検索方法。
  11. 請求項7から10のいずれか一に記載の類似音楽検索方法において、さらに、
    入力音楽データと類似する登録音楽データを抽出する工程に続き、
    抽出された一以上の登録音楽データの検索結果を曲毎にマージし、さらにEMDの値に応じて全体の検索結果をマージすることを特徴とする類似音楽検索方法。
  12. 予め複数の登録音楽データが登録されると共に、各登録音楽データについて、固定長で一以上のメロディ片に分割して、各メロディ片に含まれる音符の出現時間、音長、音高推移情報を少なくとも含む特徴量に基づき、メロディ片毎の音楽特徴量を算出して、該メロディ片の音楽特徴量を元の音楽データと対応させてメロディ片特徴量蓄積手段に登録された類似音楽検索システムにおいて、該予め登録された登録音楽データの中から、入力された入力音楽データと類似する音楽データを検索する類似音楽検索プログラムであって、
    入力音楽データを固定長で一以上の入力片に分割する機能と、
    入力片内に含まれる音符の出現時間、音長、音高推移情報を少なくとも含む特徴量に基づき、メロディ片及び入力片毎の音楽特徴量を算出する機能と、
    入力音楽データに含まれる入力片の入力片特徴量と、前記メロディ片特徴量蓄積手段に蓄積されたメロディ片毎の音楽特徴量について、輸送問題の解法に基づき、供給地から需要地への最小輸送コストを計算するEMDの距離計算で得られた類似度を同じ距離尺度で比較することにより、入力音楽データと全体の曲調が類似した登録音楽データを抽出する機能と、
    抽出された一以上の登録音楽データの検索結果を出力する機能と、
    をコンピュータに実現させることを特徴とする類似音楽検索プログラム。
  13. 請求項12に記載されるプログラムを格納したコンピュータで読み取り可能な記録媒体又は記録した機器。
JP2007175607A 2007-07-03 2007-07-03 類似音楽検索装置、類似音楽検索方法、類似音楽検索プログラム及びコンピュータで読み取り可能な記録媒体 Pending JP2009015535A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007175607A JP2009015535A (ja) 2007-07-03 2007-07-03 類似音楽検索装置、類似音楽検索方法、類似音楽検索プログラム及びコンピュータで読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007175607A JP2009015535A (ja) 2007-07-03 2007-07-03 類似音楽検索装置、類似音楽検索方法、類似音楽検索プログラム及びコンピュータで読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JP2009015535A true JP2009015535A (ja) 2009-01-22

Family

ID=40356374

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007175607A Pending JP2009015535A (ja) 2007-07-03 2007-07-03 類似音楽検索装置、類似音楽検索方法、類似音楽検索プログラム及びコンピュータで読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP2009015535A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010097870A1 (ja) * 2009-02-27 2010-09-02 三菱電機株式会社 音楽検索装置
WO2012011712A2 (en) * 2010-07-21 2012-01-26 Samsung Electronics Co., Ltd. Method and apparatus for sharing content
JP2012234397A (ja) * 2011-05-02 2012-11-29 Photonic System Solutions Inc ハミング空間検索装置、ハミング空間検索方法、ハミング空間検索プログラムおよび記録媒体
JP2013020482A (ja) * 2011-07-12 2013-01-31 Yamaha Corp 情報処理装置
KR20180088889A (ko) * 2016-03-18 2018-08-07 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 곡 멜로디 정보 처리 방법, 서버 및 저장 매체
JP2021101525A (ja) * 2019-12-24 2021-07-08 株式会社Jvcケンウッド 録画装置、動画システム、録画方法、及びプログラム
JP2021101528A (ja) * 2019-12-24 2021-07-08 株式会社Jvcケンウッド 録画装置、録画方法、及びプログラム
WO2024042962A1 (ja) * 2022-08-25 2024-02-29 ソニーグループ株式会社 情報処理装置、情報処理方法及び情報処理プログラム

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2010097870A1 (ja) * 2009-02-27 2012-08-30 三菱電機株式会社 音楽検索装置
WO2010097870A1 (ja) * 2009-02-27 2010-09-02 三菱電機株式会社 音楽検索装置
JP5127982B2 (ja) * 2009-02-27 2013-01-23 三菱電機株式会社 音楽検索装置
US10122773B2 (en) 2010-07-21 2018-11-06 Samsung Electronics Co., Ltd. Method and apparatus for sharing content
WO2012011712A3 (en) * 2010-07-21 2012-04-19 Samsung Electronics Co., Ltd. Method and apparatus for sharing content
US9032043B2 (en) 2010-07-21 2015-05-12 Samsung Electronics Co., Ltd. Method and apparatus for sharing content
US10848531B2 (en) 2010-07-21 2020-11-24 Samsung Electronics Co., Ltd. Method and apparatus for sharing content
US10104136B2 (en) 2010-07-21 2018-10-16 Samsung Electronics Co., Ltd. Method and apparatus for sharing content
WO2012011712A2 (en) * 2010-07-21 2012-01-26 Samsung Electronics Co., Ltd. Method and apparatus for sharing content
JP2012234397A (ja) * 2011-05-02 2012-11-29 Photonic System Solutions Inc ハミング空間検索装置、ハミング空間検索方法、ハミング空間検索プログラムおよび記録媒体
JP2013020482A (ja) * 2011-07-12 2013-01-31 Yamaha Corp 情報処理装置
KR102167520B1 (ko) * 2016-03-18 2020-10-19 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 곡 멜로디 정보 처리 방법, 서버 및 저장 매체
JP2019507912A (ja) * 2016-03-18 2019-03-22 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 歌曲メロディ情報処理方法、サーバ、および記憶媒体
KR20180088889A (ko) * 2016-03-18 2018-08-07 텐센트 테크놀로지(센젠) 컴퍼니 리미티드 곡 멜로디 정보 처리 방법, 서버 및 저장 매체
US11288309B2 (en) 2016-03-18 2022-03-29 Tencent Technology (Shenzhen) Company Limited Method, server, and storage medium for melody information processing
JP2021101525A (ja) * 2019-12-24 2021-07-08 株式会社Jvcケンウッド 録画装置、動画システム、録画方法、及びプログラム
JP2021101528A (ja) * 2019-12-24 2021-07-08 株式会社Jvcケンウッド 録画装置、録画方法、及びプログラム
JP7451999B2 (ja) 2019-12-24 2024-03-19 株式会社Jvcケンウッド 録画装置、動画システム、録画方法、及びプログラム
JP7452000B2 (ja) 2019-12-24 2024-03-19 株式会社Jvcケンウッド 録画装置、録画方法、及びプログラム
WO2024042962A1 (ja) * 2022-08-25 2024-02-29 ソニーグループ株式会社 情報処理装置、情報処理方法及び情報処理プログラム

Similar Documents

Publication Publication Date Title
US20170300567A1 (en) Media content items sequencing
US20230075074A1 (en) Method, system, and computer-readable medium for creating song mashups
Casey et al. Content-based music information retrieval: Current directions and future challenges
JP2009015535A (ja) 類似音楽検索装置、類似音楽検索方法、類似音楽検索プログラム及びコンピュータで読み取り可能な記録媒体
KR101082121B1 (ko) 비문자기반 정보를 저장하고 검색하는 시스템과 방법
EP3047484B1 (en) Recommending audio sample combinations
EP3047479B1 (en) Automatically expanding sets of audio samples
US20160267177A1 (en) Music steering with automatically detected musical attributes
JP4650270B2 (ja) 情報処理装置および方法、並びにプログラム
CN106095925B (zh) 一种基于声乐特征的个性化歌曲推荐方法
US7805389B2 (en) Information processing apparatus and method, program and recording medium
US20120125178A1 (en) Scalable music recommendation by search
US20090228799A1 (en) Method for visualizing audio data
Lu et al. A novel method for personalized music recommendation
Knees et al. Introduction to music similarity and retrieval
US20100063952A1 (en) Music Information Processing Apparatus, Music Delivering System, And Music Information Processing Method That Can Satisfy A Request From A User
WO2006137271A1 (ja) 楽曲検索装置、楽曲検索方法および楽曲検索プログラム
JP2008041043A (ja) 情報処理装置
Chambers Producing the self: Digitisation, music-making and subjectivity
Gurjar et al. Comparative Analysis of Music Similarity Measures in Music Information Retrieval Systems.
KR20140129443A (ko) 적응형 음원 추천 시스템 및 방법
JP5085577B2 (ja) プレイリスト作成装置、楽曲再生装置、プレイリスト作成方法およびプレイリスト作成プログラム
Liu Effective results ranking for mobile query by singing/humming using a hybrid recommendation mechanism
JP2003131674A (ja) 楽曲検索システム
CN101023427A (zh) 提供符合性信息的方法