JPWO2007097419A1 - 楽曲検索装置及び方法、並びにコンピュータプログラム - Google Patents

楽曲検索装置及び方法、並びにコンピュータプログラム

Info

Publication number
JPWO2007097419A1
JPWO2007097419A1 JP2008501763A JP2008501763A JPWO2007097419A1 JP WO2007097419 A1 JPWO2007097419 A1 JP WO2007097419A1 JP 2008501763 A JP2008501763 A JP 2008501763A JP 2008501763 A JP2008501763 A JP 2008501763A JP WO2007097419 A1 JPWO2007097419 A1 JP WO2007097419A1
Authority
JP
Japan
Prior art keywords
music
vector
word
words
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008501763A
Other languages
English (en)
Other versions
JP4792497B2 (ja
Inventor
泰輝 児玉
泰輝 児玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Corp
Original Assignee
Pioneer Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Corp filed Critical Pioneer Corp
Priority to JP2008501763A priority Critical patent/JP4792497B2/ja
Publication of JPWO2007097419A1 publication Critical patent/JPWO2007097419A1/ja
Application granted granted Critical
Publication of JP4792497B2 publication Critical patent/JP4792497B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/685Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using automatically derived transcript of audio data, e.g. lyrics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model

Abstract

楽曲検索装置(100)は、複数の楽曲において出現するn種類の単語(W1、W2、…、Wn)を、情報空間の座標軸にして、一の楽曲において、n種類の単語が夫々出現する頻度に基づいて、一の楽曲に対応される第1ベクトルを作成する第1作成手段(130)と、(i)n種類の単語のうち一の単語が、各単語と組み合わされて、一の楽曲において、夫々出現する一の頻度と、(ii)一の単語が、各単語と組み合わされて、他の楽曲において、夫々出現する他の頻度と、を加算した全体頻度に基づいて、一の単語に対応される第2ベクトルを作成する第2作成手段(140)と、第1ベクトルと、第2ベクトルとのベクトル差に基づいて、所望の楽曲を検索する検索手段(150、160等)とを備える。

Description

本発明は、例えばネットワークを介して配信されたり、データベースに格納されている複数の楽曲から、所望の楽曲を検索する楽曲検索装置及び方法、並びにコンピュータをこのような楽曲検索装置として機能させるコンピュータプログラムの技術分野に関する。
近年、通信カラオケやインターネット等のネットワークを介して楽曲のデータを配信することが盛んに行われている。このような楽曲のデータを配信する際、例えば情報配信装置に有されるデータベースに格納された楽曲の数量が増加するに従って、所望の楽曲を、より適切且つ迅速に検索することができる検索手法に対する必要性が高まっている。ここに、本願発明に係る「楽曲」とは、例えばロック、ポップス、演歌、ジャズ又はクラシックなど、そのジャンルを問わず、ユーザによって視聴され得る音楽及び音楽情報の全てを含む概念である。
このような複数の楽曲から、所望の楽曲を検索する手法として、ユーザが、文字列を入力し、その文字列が歌詞に含まれる楽曲を検索した結果とする手法、所謂、キーワードに基づく検索が一般的に行われている。しかしながら、この手法においては、ユーザが、歌詞に含まれる単語の表記と、同一の文字列を入力する必要があり、ユーザにとって、必ずしも利用の際の利便性が向上されなかった。
そこで、特許文献1等に記載されているように、複数の楽曲において、出現する単語を抽出して、複数の単語の出現頻度に基づいて、所望の楽曲を検索する手法が提案されている。具体的には、図13(a)に示されるように、楽曲「M1」を構成する、例えば「港」等の単語「W1」が、抽出されて、図13(b)に示されるような、複数の種類の単語の出現する頻度を示す値がテーブル形式(後述される出現語テーブル10)で、出力される。
特開2003−271160
しかしながら、上述した特許文献1等における、複数の単語の出現頻度に対して、主成分分析を行うだけでは、所望の楽曲を適切に検索することは困難であるという技術的な問題点が生じてしまう。具体的には、主成分分析の際に必要となる、例えば類義語辞書等の2次的に作成される分析データにおいて、例えば意味解釈における誤差が大きくなってしまい、所望の楽曲を適切に検索することは困難であるという技術的な問題点が生じてしまう。
本発明は、例えば上述した従来の問題点に鑑みなされたものであり、例えば複数の楽曲から、所望の楽曲を的確且つ迅速に検索することを可能とする楽曲検索装置及び方法、並びにコンピュータをこのような楽曲検索装置として機能させるコンピュータプログラムを提供することを課題とする。
(楽曲検索装置)
以下、本発明に係る楽曲検索装置について説明する。
上記課題を解決するために、本発明の楽曲検索装置は、複数の楽曲において出現するn種類(nは自然数)の単語(W1、W2、…、Wn)を、n次元の情報空間の座標軸にして、前記複数の楽曲のうち一の楽曲において、前記n種類の単語が夫々出現する頻度に基づいて、前記一の楽曲に対応されるn次元の第1ベクトル(一の楽曲に対応)を作成する第1作成手段と、前記n次元の情報空間において、(i)前記n種類の単語のうち一の単語が、前記n種類の単語のうちの各単語と組み合わされて、前記一の楽曲において、夫々出現する一の頻度と、(ii)前記一の単語が、前記各単語と組み合わされて、前記複数の楽曲のうち他の楽曲において、夫々出現する他の頻度と、を加算した全体頻度に基づいて、前記一の単語に対応されるn次元の第2ベクトル(一の単語に対応)を作成する第2作成手段と、前記第1ベクトルと、前記第2ベクトルとのベクトル差の大きさに基づいて、所望の楽曲を検索(又は選択)する検索手段と、を備える。
本発明の楽曲検索装置によれば、第1作成手段によって、複数の楽曲において出現するn種類(nは自然数)の単語(例えばW1、W2、…、Wn)を、n次元の情報空間の座標軸にして、複数の楽曲のうち一の楽曲(例えばW1)において、n種類の単語が夫々出現する頻度に基づいて、一の楽曲に対応されるn次元の第1ベクトルが作成される。ここに、本願発明に係るベクトルとは、例えばベクトルによって示される座標上の点や位置情報を意味するようにしてもよい。特に、このベクトルは、単位ベクトルによって、表現されていてもよいし、或いは、ノルムの正規化処理が施されていてもよい。
第1ベクトルの作成と同時に、又は、相前後して、第2作成手段によって、n次元の情報空間において、(i)n種類の単語のうち一の単語が、n種類の単語のうちの各単語と組み合わされて、一の楽曲において、夫々出現する一の頻度と、(ii)一の単語が、各単語と組み合わされて、複数の楽曲のうち他の楽曲において、夫々出現する他の頻度と、を加算した全体頻度に基づいて、一の単語に対応されるn次元の第2ベクトルが作成される。
次に、検索手段によって、第1ベクトルと、第2ベクトルとのベクトル差の大きさに基づいて、所望の楽曲が検索(又は選択)される。ここに、本願発明に係る、ベクトル差とは、ベクトル演算に基づく、差を意味する。このベクトル差の大きさを算出する際には、例えば2つのベクトルが夫々示す2点間のユークリッド距離に基づいて算出してもよい。また、本願発明に係る、検索とは、所定の条件や、所定の単語、所謂、検索語に基づいて、一義的に対応付けられる楽曲等の所定の情報を選択することを意味する。
具体的には、一の楽曲に対応される第1ベクトルと、一の単語に対応される第2ベクトルとのベクトル差の大きさが、相対的に小さい、即ち、n次元の情報空間において、他の単語に対応される他の第2ベクトルと比較して、相対的に近くに存在する場合、(i)一の楽曲によって形成されている言葉の世界(言い換えると、言葉によって世の中の人々が一般的に想像可能な世界)と、(ii)一の単語を基準にして各単語と組み合わせることによって形成されている言葉の世界とは類似性が高いと推定することが可能である。ここに本願発明に係る「類似性」とは、殆ど又は完全に等価である又は等しいとみなすことが可能な性質を意味する概念である。このように、一の単語が単独で使用されることによって形成される言葉の世界を考慮する場合と比較して、一の単語と各単語とを組み合わせて使用されることによって形成される言葉の世界を考慮する場合、言葉の意味解釈の違いをより効果的に反映させることができる。
より具体的には、(i)一の楽曲を構成するn種類の単語が夫々出現する頻度の値を要素とするn次元の第1ベクトルと、(ii)例えば公表されている大量の楽曲等の複数の楽曲において、一つの楽曲を単位として計測(カウント)された、一の単語が、この一の単語を含むn種類の単語と、組み合わされて夫々出現する頻度の合計値を要素とするn次元の第2ベクトルとが相対的に定量的及び定性的に類似であると推定することが可能である。
以上の結果、第1ベクトルと、第2ベクトルとのベクトル差の大きさに基づいて、的確且つ迅速に、所望の楽曲を検索することが可能である。
本発明の楽曲検索装置の一の態様では、前記ベクトル差の大きさが最小となる場合、前記第1ベクトルに対応する前記一の楽曲を代表する代表語を、前記一の単語として登録する代表語テーブルを作成する第3作成手段を更に備え、前記検索手段は、所望のキー単語と、前記代表語テーブルに登録された前記一の単語との比較に基づいて、前記所望の楽曲として、前記一の楽曲を検索する。
この態様によれば、代表語テーブルに登録された一の単語と、キー単語との比較に基づいて、所望のキー単語に対応される、所望の楽曲を、的確且つ、より迅速に検索することが可能である。加えて、一の楽曲を、代表語テーブルに登録された一の単語によって、代表させるので、複数の単語によって、代表させる場合と比較して、より迅速な検索を実現可能である。
本発明の楽曲検索装置の他の態様では、前記第1作成手段は、前記複数の楽曲に夫々対応される、複数の第1ベクトルをテーブル(出現語テーブル)形式で、更に作成し、前記第2作成手段は、前記n種類の単語に夫々対応される、複数の第2ベクトル(一の単語)をテーブル(共同出現語テーブル)形式で、更に作成し、前記検索手段は、所望のキー単語と同一性を有する、前記n種類の単語のうち一の単語に対応される、一の第2ベクトル(複数のうちの一の単語に対応)と、一の第1ベクトル(複数のうちの一の楽曲に対応)とのベクトル差の大きさが最小となる場合、前記所望の楽曲として、前記一の第1ベクトルに対応される一の楽曲を検索する。
この態様によれば、テーブル形式で作成された複数の第1ベクトルと、テーブル形式で作成された複数の第2ベクトルに基づいて、所望のキー単語と同一性を有する一の単語に対応される、所望の楽曲を、的確且つ、より迅速に検索することが可能である。ここに、本願発明に係る同一性とは、形式的に同一であるという性質を意味すると共に、実質的に同一であるという性質を意味する。
上述した検索手段に係る態様では、前記検索手段は、前記一の第2ベクトル(複数のうちの一の単語に対応)と、複数の第1ベクトルとのベクトル差の大きさが所定範囲にある場合、前記所望の楽曲として、前記複数の第1ベクトルに夫々対応される、複数の楽曲を検索するように構成してもよい。
このように構成すれば、所定範囲にあるベクトル差の大きさに基づいて、所望のキー単語と同一性を有する一の単語に対応される、所望される、複数の楽曲を、的確且つ、迅速に検索することが可能である。
上述した検索手段に係る態様では、前記検索手段は、(i)前記n種類の単語のうち他の単語に対応される、他の第2ベクトル(他の単語)と、他の第1ベクトル(他の楽曲)とのベクトル差の大きさが最小となる場合、前記所望の楽曲として、前記他の第1ベクトル(他の楽曲)に対応される他の楽曲を検索すると共に、(ii)前記一の第2ベクトル(一の単語)と、前記他の第2ベクトル(他の単語)とのベクトル差の大きさが所定範囲にある場合、前記所望の楽曲として、前記一又は他の楽曲を検索するように構成してもよい。
このように構成すれば、所定範囲にある、一の第2ベクトルと、他の第2ベクトルとのベクトル差の大きさに基づいて、所望のキー単語と同一性を有する一の単語に対応される、所望される、一又は他の楽曲を、的確且つ、迅速に検索することが可能である。
本発明の楽曲検索装置の他の態様では、所望のキー単語を入力する入力手段を更に備え、前記検索手段は、入力された前記キー単語と同一性を有する、前記一の単語に対応される、前記第2ベクトルと、前記第1ベクトルとのベクトル差の大きさに基づいて、前記所望の楽曲を検索する。
この態様によれば、入力されたキー単語と同一性を有する、一の単語に基づいて、所望の楽曲を、的確且つ、より迅速に検索することが可能である。
本発明の楽曲検索装置の他の態様では、(i)前記第1作成手段は、前記複数の楽曲における属性(ジャンル、時代、使用者)に基づいて、前記複数の楽曲をグループ化して、前記第1ベクトル(一の楽曲)を作成することに加えて、又は、代えて、(ii)前記第2作成手段は、前記n種類の単語における属性(ジャンル、時代、使用者)に基づいて、前記n種類の単語をグループ化して、前記第2ベクトル(一の単語)を作成する。
この態様によれば、複数の楽曲における、例えばジャンル、時代、使用者等の各種の属性、及び、n種類の単語における、例えばジャンル、時代、使用者等の各種の属性に基づいて、所望の楽曲を、的確且つ、より迅速に検索することが可能である。
本発明の楽曲検索装置の他の態様では、前記複数の楽曲を記憶する記憶手段と、記憶された前記複数の楽曲に出現する前記n種類の単語を抽出する抽出手段を更に備え、前記第1作成手段は、抽出された前記n種類の単語に基づいて、前記第1ベクトルを作成し、前記第2作成手段は、抽出された前記n種類の単語に基づいて、前記第2ベクトルを作成する。
この態様によれば、記憶手段、及び抽出手段に基づいて、所望のキー単語に対応される、所望の楽曲を、的確且つ、より迅速に検索することが可能である。
(楽曲検索方法)
以下、本発明に係る楽曲検索方法について説明する。
上記課題を解決するために、本発明の楽曲検索方法は、複数の楽曲において出現するn種類(nは自然数)の単語(W1、W2、…、Wn)を、n次元の情報空間の座標軸にして、前記複数の楽曲のうち一の楽曲において、前記n種類の単語が夫々出現する頻度に基づいて、前記一の楽曲に対応されるn次元の第1ベクトル(一の楽曲に対応)を作成する第1作成工程と、前記n次元の情報空間において、(i)前記n種類の単語のうち一の単語が、前記n種類の単語のうちの各単語と組み合わされて、前記一の楽曲において、夫々出現する一の頻度と、(ii)前記一の単語が、前記各単語と組み合わされて、前記複数の楽曲のうち他の楽曲において、夫々出現する他の頻度と、を加算した全体頻度に基づいて、前記一の単語に対応されるn次元の第2ベクトル(一の単語に対応)を作成する第2作成工程と、前記第1ベクトルと、前記第2ベクトルとのベクトル差の大きさに基づいて、所望の楽曲を検索(又は選択)する検索工程と、を備える。
本発明の楽曲検索方法によれば、上述した本発明の楽曲検索装置が有する各種利益を享受することが可能となる。
尚、上述した本発明の楽曲検索装置が有する各種態様に対応して、本発明の楽曲検索方法も各種態様を採ることが可能である。
(コンピュータプログラム)
以下、本発明に係るコンピュータプログラムについて説明する。
上記課題を解決するために、本発明の制御用のコンピュータプログラムは、上述した本発明の楽曲検索装置(但し、その各種態様を含む)に備えられたコンピュータを制御する制御用のコンピュータプログラムであって、該コンピュータを、前記第1作成手段、前記第2作成手段、及び前記検索手段のうち少なくとも一部として機能させる。
本発明に係るコンピュータプログラムによれば、当該コンピュータプログラムを格納するROM、CD−ROM、DVD−ROM、ハードディスク等の記録媒体から、当該コンピュータプログラムをコンピュータに読み込んで実行させれば、或いは、当該コンピュータプログラムを、通信手段を介してコンピュータにダウンロードさせた後に実行させれば、上述した本発明の楽曲検索装置を比較的簡単に実現できる。
尚、上述した本発明の楽曲検索装置における各種態様に対応して、本発明の各コンピュータプログラムも各種態様を採ることが可能である。
上記課題を解決するために、コンピュータ読取可能な媒体内のコンピュータプログラム製品は、上述した本発明の楽曲検索装置(但し、その各種態様を含む)に備えられたコンピュータにより実行可能なプログラム命令を明白に具現化し、該コンピュータを、前記第1作成手段、前記第2作成手段、及び前記検索手段のうち少なくとも一部として機能させる。
本発明のコンピュータプログラム製品によれば、当該コンピュータプログラム製品を格納するROM、CD−ROM、DVD−ROM、ハードディスク等の記録媒体から、当該コンピュータプログラム製品をコンピュータに読み込めば、或いは、例えば伝送波である当該コンピュータプログラム製品を、通信手段を介してコンピュータにダウンロードすれば、上述した本発明の楽曲検索装置を比較的容易に実施可能となる。更に具体的には、当該コンピュータプログラム製品は、上述した本発明の楽曲検索装置として機能させるコンピュータ読取可能なコード(或いはコンピュータ読取可能な命令)から構成されてよい。
本発明のこのような作用及び他の利得は次に説明する実施例から明らかにされる。
以上説明したように、本発明の楽曲検索装置及び方法によれば、第1作成手段、第2作成手段、及び検索手段を備える。この結果、第1ベクトルと、第2ベクトルとのベクトル差の大きさに基づいて、的確且つ迅速に、所望の楽曲を検索することが可能である。
また、本発明のコンピュータプログラムによれば、コンピュータを上述した本発明の楽曲検索装置として機能させるので、上述した楽曲検索装置をして、第1ベクトルと、第2ベクトルとのベクトル差の大きさに基づいて、的確且つ迅速に、所望の楽曲を検索することが可能である。
本実施例に係る、楽曲検索装置100の基本構成を示したブロック図である。 本実施例に係る、楽曲検索装置による、第1作成処理、及び、第2作成処理を含む、前段階の処理を示したフローチャートである。 本実施例に係る、複数の第1ベクトルの一具体例である出現語テーブルを示すテーブルである。 本実施例に係る、複数の第2ベクトルの一具体例である共同出現語テーブルを示すテーブルである。 本実施例に係る、複数の第2ベクトルの一具体例である共同出現語テーブルが作成される際の変遷を示した複数のテーブル(図5(a)、図5(b)、及び図5(c))である。 本実施例に係る、代表語テーブルの一具体例を示すテーブルである。 本実施例に係る、n次元の情報空間の一例として、2次元の情報空間を示したグラフ(図7(a))、2次元の情報空間に対応した出現語テーブル10を示したテーブル(図7(b))、及び、2次元の情報空間に対応した共同出現語テーブル20を示したテーブル(図7(c))である。 本実施例に係る、楽曲検索装置による、楽曲の検索の結果を表示する、後段階の処理を示したフローチャートである。 他の実施例に係る、楽曲検索装置100の基本構成を示したブロック図である。 他の実施例に係る、楽曲検索装置による、第1作成処理、及び、第2作成処理を含む、前段階の処理を示したフローチャートである。 他の実施例に係る、楽曲検索装置による、楽曲の検索の結果を表示する、後段階の処理を示したフローチャートである。 他の実施例に係る、出現語距離テーブルの一具体例を示すテーブルである。 一般的な手法における、楽曲を構成する単語が出現する概念を示す模式図(図13(a))及びテーブル(図13(b))である。
符号の説明
10 出現語テーブル
20 共同出現語テーブル
30 代表語テーブル
40 出現語距離テーブル
100 楽曲検索装置
110 記憶手段
120 抽出手段
130 第1作成手段
140 第2作成手段
150 算出手段
160 検索手段
170 入力手段
180 表示手段
以下、本発明を実施するための最良の形態について実施例毎に順に図面に基づいて説明する。
(1)楽曲検索装置の実施例
図1から図8を参照して、本発明に係る楽曲検索装置の実施例について説明する。
(1−1) 基本構成
先ず、図1を参照して、本実施例に係る楽曲検索装置100の基本構成について説明する。ここに、図1は、本実施例に係る、楽曲検索装置100の基本構成を示したブロック図である。
図1に示されるように、本実施例に係る楽曲検索装置100は、記憶手段110と、抽出手段120と、後述される出現語テーブルを作成する第1作成手段130と、後述される共同出現語テーブルを作成する第2作成手段140と、作成された出現語テーブルや共同出現語に基づいて、各種の算出処理を行う算出手段150(即ち、本発明に係る第3作成手段の一具体例)と、楽曲の検索を行う検索手段160と、ユーザの所望の単語を入力する入力手段170と、楽曲の検索の結果を表示する表示手段180とを備えて構成されている。特に、後述される第1及び第2ベクトルの作成する、前段階の処理は、主に、記憶手段110と、抽出手段120と、第1作成手段130と、第2作成手段140と、算出手段150とによって、行われる。加えて、後述される楽曲の検索の結果を表示する、後段階の処理は、主に、検索手段160と、入力手段170と、表示手段180とによって、行われる。特に、入力手段は、ユーザから単語が入力されてもよい。或いは、入力手段は、ユーザから楽曲の内容(図2中の楽曲S1を参照)そのものが入力され、記憶手段に出力するようにしてもよい。
尚、楽曲検索装置の一部は、例えば前段階の処理を行う、例えばインターネット等のネットワークを介して楽曲を配信する楽曲配信装置(所謂、楽曲配信サーバ)によって構成されていてもよい。加えて、楽曲検索装置の他部は、例えば後段階の処理を行う、例えば通信機能を有して楽曲を受信する楽曲再生装置によって構成されていてもよい。また、本実施例に係る楽曲検索装置は、オーディオ機器、車載用オーディオ機器、カーナビゲーション装置、又は携帯用音楽機器などの一部若しくは全体、又はそれらに機能を付加する外付けの機能拡張装置など多様な形態を採り得る。或いは、また、本実施例に係る楽曲検索装置に記憶される、複数の楽曲は、例えば、CDやDVDなどに予め記録された市販の音楽ソフトウェアに含まれる楽曲であってもよいし、インターネットなどのネットワークを介して、ユーザが所定のサーバなどからダウンロードした、或いは所定のサーバから配信された楽曲であってもよい。このようにダウンロード或いは配信されるなどしてユーザが取得した楽曲である場合には、これら楽曲は、ユーザ側において、適宜HD(Hard Disk)、CD−ROM、CD−RW、DVD−ROM、又はDVD−RAMなどの記録媒体に記録されて保存されていてもよい。
(1−2) 動作原理 − 第1及び第2ベクトルの作成する、前段階の処理−
次に、図2を参照して、本実施例に係る、楽曲検索装置100の動作原理として、第1ベクトルの一具体例である出現語テーブル10を作成する処理、及び、第2ベクトルの一具体例である共同出現語テーブル20を作成する処理を含む、前段階の処理について説明する。ここに、図2は、本実施例に係る、楽曲検索装置による、第1作成処理、及び、第2作成処理を含む、前段階の処理を示したフローチャートである。尚、図2中の実線の矢印は、処理の流れを示し、点線の矢印は、情報の流れを示す。また、説明の便宜上、各処理において、ステップ番号の末尾に「t」が付加されている処理は、記憶手段へのテーブルの入力又は出力を意味する。
図2に示されるように、本実施例に係る、楽曲検索装置100のCPU(Central Processing Unit)の制御下で、例えば公表されている殆ど全ての楽曲の歌詞が、記憶手段110に記憶され、収集される(ステップS101)。ここに、本実施例に係る歌詞とは、例えば人声等の、言葉によって表現された論理的な情報を構成する、連続して楽曲中に出現する複数の単語を意味する。
次に、CPUの制御下で、記憶された複数の楽曲の特徴量に基づいて、例えば静かな曲等の、音楽(所謂、インスツルメンツ)よりも、歌詞が中心と思われる楽曲を選別する(ステップS102)。ここに、本実施例に係る、特徴量とは、音声信号の音圧レベルの変化率や平均、和音変化率、1分当たりのビート数、及び音声信号の最大振幅等の楽曲の特徴を示す所定の物理的な変数である。尚、選別された全ての楽曲の歌詞を、本実施例に係る第1及び第2作成処理の対象とする。
次に、CPUの制御下で、選別された全ての楽曲の歌詞を、全て連結する。尚、この連結の際には、繰り返し出現する歌詞も含めて連結するようにしてもよい(ステップS103)。
次に、CPUの制御下で、抽出手段120によって、選別された全ての楽曲の歌詞において出現する全ての単語の抽出処理、所謂、形態素解析の処理が行われる(ステップS104)。ここに、本実施例に係る形態素解析の処理とは、入力されたテキスト情報を、単語の単位で、全て分解し、品詞を示す情報と共に、全ての単語を出力する情報処理を意味する。
次に、CPUの制御下で、例えば、出現する回数が所定の閾値より少ない単語や、意味を解析できない単語等の歌詞によって、構成される楽曲の特徴を表現していない単語が削除され、厳選される(ステップS105)。加えて、単語の組み合わせにより、明確に意味が異なる語をグループ化する等の処理が行われてもよい。具体的には、否定を示す助詞が直後にある単語等の、一の単語の前後に位置される他の単語との合わせて別の単語とするようにしてもよい。このことによって、後述される楽曲を代表する代表語をより明確且つ高精度に決定することが可能である。尚、厳選された全ての単語を、本実施例に係る第1及び第2作成処理の対象とする。
上述したステップS102からS105と同時に、又は、相前後して、CPUの制御下で、抽出手段120によって、一つの楽曲を単位として、出現する単語が抽出され、形態素解析が行われる(ステップS106)。特に、一つの楽曲において抽出される単語の数のばらつきによる影響を少なくするために、一つの楽曲において抽出される単語の総数を、一定値にしてもよい。
次に、CPUの制御下で、第1作成手段によって、本実施例に係る、第1ベクトルの一具体例である出現語テーブル10が作成され、記憶手段110によって、記憶される。(ステップS106t)。尚、出現語テーブル10の詳細については、後述される。
次に、CPUの制御下で、第2作成手段によって、本実施例に係る、第2ベクトルの一具体例である共同出現語テーブル20が作成される(ステップS107)。尚、共同出現語テーブル20の詳細については、後述される。
次に、CPUの制御下で、記憶手段110によって、共同出現語テーブル20が記憶される(ステップS108t)。
次に、CPUの制御下で、算出手段150によって、出現語テーブル10を構成する列ベクトル(後述される第1ベクトルの一具体例)と、共同出現語テーブル20を構成する列ベクトル(後述される第2ベクトルの一具体例)とのベクトル差の大きさが、算出される(ステップS109)。
次に、CPUの制御下で、算出手段150によって、算出されたベクトル差の大きさに基づいて、代表語テーブル30が作成される(ステップS111)。尚、代表語テーブル20の詳細については、後述される。
次に、CPUの制御下で、算出手段150によって、作成された、代表語テーブルが、例えば記憶手段110によって、記憶される(ステップS112t)。
(1−3) 複数の第1ベクトルの一具体例 − 出現語テーブル −
ここで、図3を参照して、本実施例に係る、複数の第1ベクトルの一具体例である出現語テーブルについて説明する。ここに、図3は、本実施例に係る、複数の第1ベクトルの一具体例である出現語テーブルを示すテーブルである。
図3に示されるように、出現語テーブル10は、「1行目」から「m行目(但し、mは自然数)」において、複数の楽曲に夫々対応する、複数の列ベクトルによって、構成されている。具体的には、出現語テーブル10の「1行目」において、曲ID(Identification Number)が「M1」である楽曲「M1」に対応されるn次元(但し、nは自然数)のベクトル、即ち、ベクトルM1(2、5、3、・・・、5)を有する。尚、このn次元のベクトルの要素は、一つの楽曲中において、n種類の単語(即ち、語IDが「W1」から「Wn」によって夫々示される単語「W1」から単語「Wn」)が、夫々出現する頻度を示す。また、本実施例の出現語テーブルに係るベクトルは、例えば大きさを「1」とする単位ベクトルによって、示されてもよい。或いは、ノルムの手法に基づいて、正規化されていてもよい。或いは、出現頻度の合計に基づいて決定される所定の係数が乗算されていてもよい。
続いて、出現語テーブル10の「2行目」において、楽曲「M2」に対応されるn次元のベクトルであるベクトルM2(1、8、2、・・・、4)を有する。出現語テーブル10の「3行目」において、楽曲「M3」に対応されるベクトルM3(1、2、6、・・・、3)を有する。以下、概ね同様にして、・・・、出現語テーブル10の「m行目」において、楽曲「Mm」に対応されるベクトルMm(5、4、3、・・・、1)を有する。
この出現語テーブルに基づいて、本実施例に係る、複数の第2ベクトルの一具体例である共同出現語テーブルが作成される。
(1−4) 複数の第2ベクトルの一具体例 − 共同出現語テーブル −
ここで、図4及び図5に加えて、前述した図3を適宜参照して、本実施例に係る、複数の第2ベクトルの一具体例である共同出現語テーブルについて説明する。ここに、図4は、本実施例に係る、複数の第2ベクトルの一具体例である共同出現語テーブルを示すテーブルである。
図4に示されるように、共同出現語テーブル20は、「1行目」から「n行目」において、n種類の単語に夫々対応する、複数の列ベクトルによって、構成されている。具体的には、共同出現語テーブル20は、「1行目」において、単語「W1」に対応されるn次元のベクトル、即ち、ベクトルW1(21、85、57、・・・、35)を有する。尚、このn次元のベクトルの要素は、n種類の単語のうち一の単語(例えば単語「W1」)がこのn種類の単語のうちの各単語(即ち、単語「W1」から単語「Wn」)と組み合わされて、1番目の楽曲(例えば楽曲「M1」)において夫々出現する1番目の頻度から、この一の単語が各単語と組み合わされて、m番目の楽曲において夫々出現するm番目の頻度まで、の全ての頻度を加算した合計値を示す。また、本実施例の共同出現語テーブルに係るベクトルも、前述したように、例えば大きさを「1」とする単位ベクトルによって、示されてもよい。或いは、ノルムの手法に基づいて、正規化されていてもよい。
(1−4−1) 共同出現語テーブルを作成する手法
ここで、図5に加えて、前述した図3を適宜参照して、この共同出現語テーブル20を、前述した出現語テーブル10に基づいて作成する手法について説明する。ここに、図5は、本実施例に係る、複数の第2ベクトルの一具体例である共同出現語テーブルが作成される際の変遷を示した複数のテーブル(図5(a)、図5(b)、及び図5(c))である。尚、共同出現語テーブル20を作成する手法においては、共同出現語テーブル20は、初期化されており、全ての要素は「0」であると仮定する。
図5(a)に示されるように、共同出現語テーブル20の「1行目」において、初期化されたベクトルW1(0、0、0、・・・、0)に有される最初の要素を、作成する際には、先ず、出現語テーブル10内のベクトルM1(2、5、3、・・・、5)の要素のうち、最初の要素に着目する。この最初の要素は、単語「W1」が出現する頻度「2」であるので、この2の自乗を、初期化されたベクトルW1(0、0、0、・・・、0)の最初の要素の値に加算し、ベクトルW1(+4、0、0、・・・、0)を作成する。
次に、図5(b)に示されるように、共同出現語テーブル20の「1行目」において、前述のベクトルW1(+4、0、0、・・・、0)に有される2番目の要素を、作成する際には、出現語テーブル10内のベクトルM1(2、5、3、・・・、5)の要素のうち、1番目の要素、及び、2番目の要素に着目する。これら1番目の要素と、2番目の要素とによって、単語「W1」と単語「W2」とが組み合わされて出現する頻度を算出できる。従って、1番目の要素の値「2」と、2番目の要素の値「5」との積の値「10(=2×5)」を、前述したベクトルW1(+4、0、0、・・・、0)の2番目の要素の値に加算し、ベクトルW1(+4、+10、0、・・・、0)を作成する。他方、見方を変えて、単語「W2」を基準にして、ベクトルM1(2、5、3、・・・、5)の2番目の要素と、1番目の要素とによって、単語「W2」と単語「W1」とが組み合わされて出現する頻度も算出できる。従って、2番目の要素の値「5」と、1番目の要素の値「2」との積の値「10(=2×5)」を、初期化されたベクトルW2(0、0、0、・・・、0)の1番目の要素の値に加算し、ベクトルW2(+10、0、0、・・・、0)を作成する。
加えて、図5(b)に示されるように、共同出現語テーブル20の「2行目」において、前述のベクトルW2(+10、0、0、・・・、0)に有される2番目の要素を、作成する際には、出現語テーブル10内のベクトルM1(2、5、3、・・・、5)の要素のうち、2番目の要素に着目する。この2番目の要素は、単語「W2」が出現する頻度「5」であるので、この5の自乗を、ベクトルW2(+10、0、0、・・・、0)の2番目の要素の値に加算し、ベクトルW1(+10、+25、0、・・・、0)を作成する。
この結果、図5(b)に示されるように、共同出現語テーブル20の「1行目」において、ベクトルW1(+4、+10、0、・・・、0)が作成される。と共に、共同出現語テーブル20の「2行目」において、ベクトルW2(+10、+25、0、・・・、0)が作成される。
次に、図5(c)に示されるように、共同出現語テーブル20の「1行目」において、前述のベクトルW1(+4、+10、0、・・・、0)に有される3番目の要素を、作成する際には、出現語テーブル10内のベクトルM1(2、5、3、・・・、5)の要素のうち、1番目の要素、及び、3番目の要素に着目する。これら1番目の要素と、3番目の要素とによって、単語「W1」と単語「W3」とが組み合わされて出現する頻度を算出できる。従って、1番目の要素の値「2」と、3番目の要素の値「3」との積の値「6(=2×3)」を、前述したベクトルW1(+4、+10、0、・・・、0)の3番目の要素の値に加算し、ベクトルW1(+4、+10、+6、・・・、0)を作成する。他方、見方を変えて、単語「W3」を基準にして、ベクトルM1(2、5、3、・・・、5)の3番目の要素と、1番目の要素とによって、単語「W3」と単語「W1」とが組み合わされて出現する頻度も算出できる。従って、3番目の要素の値「3」と、1番目の要素の値「2」との積の値「6(=3×2)」を、初期化されたベクトルW3(0、0、0、・・・、0)の1番目の要素の値に加算し、ベクトルW3(+6、0、0、・・・、0)を作成する。
概ね同様にして、図5(c)に示されるように、共同出現語テーブル20の「2行目」において、前述のベクトルW2(+10、+25、0、・・・、0)に有される3番目の要素を、作成する際には、出現語テーブル10内のベクトルM1(2、5、3、・・・、5)の要素のうち、2番目の要素、及び、3番目の要素に着目する。これら2番目の要素と、3番目の要素とによって、単語「W2」と単語「W3」とが組み合わされて出現する頻度を算出できる。従って、2番目の要素の値「5」と、3番目の要素の値「3」との積の値「15(=5×3)」を、前述したベクトルW2(+10、+25、0、・・・、0)の3番目の要素の値に加算し、ベクトルW2(+10、+25、+15、・・・、0)を作成する。他方、見方を変えて、単語「W3」を基準にして、ベクトルM1(2、5、3、・・・、5)の3番目の要素と、2番目の要素とによって、単語「W3」と単語「W2」とが組み合わされて出現する頻度も算出できる。従って、3番目の要素の値「3」と、2番目の要素の値「5」との積の値「15(=3×5)」を、前述のベクトルW3(+6、0、0、・・・、0)の2番目の要素の値に加算し、ベクトルW3(+6、+15、0、・・・、0)を作成する。
加えて、図5(c)に示されるように、共同出現語テーブル20の「3行目」において、前述のベクトルW3(+6、+15、0、・・・、0)に有される3番目の要素を、作成する際には、出現語テーブル10内のベクトルM1(2、5、3、・・・、5)の要素のうち、3番目の要素に着目する。この3番目の要素は、単語「W3」が出現する頻度「3」であるので、この3の自乗を、ベクトルW3(+6、+15、0、・・・、0)の3番目の要素の値に加算し、ベクトルW3(+6、+15、+9、・・・、0)を作成する。
この結果、図5(c)に示されるように、共同出現語テーブル20の「1行目」において、ベクトルW1(+4、+10、+6、・・・、0)が作成される。と共に、共同出現語テーブル20の「2行目」において、ベクトルW2(+10、+25、+15、・・・、0)が作成される。と共に、共同出現語テーブル20の「3行目」において、ベクトルW3(+6、+15、+9、・・・、0)が作成される。
以上のように算出した共同出現語テーブル20において、(Wx、Wy)と、(Wy、Wx)との値は等しくなるので、有効なデータ(又は必要なデータ)を少なくとも記憶手段に記録(記憶)すれば記憶容量を少なくすることができる。
(1−4) 複数の第2ベクトルの一具体例 − 共同出現語テーブル (続き)−
再び、図4に戻って、上述した手法に基づいて作成された、共同出現語テーブル20は、「2行目」において、単語「W2」に対応されるn次元のベクトルであるベクトルW2(85、43、160、・・・、60)を有する。共同出現語テーブル20は、「3行目」において、単語「W3」に対応されるベクトルW3(57、160、38、・・・、83)を有する。以下、概ね同様にして、・・・、共同出現語テーブル20は、「n行目」において、単語「Wn」に対応されるベクトルWn(35、60、83、・・・、93)を有する。
(1−5) 代表語テーブルの一具体例
次に、図6、及び図7を参照して、本実施例に係る、代表語テーブルの一具体例について説明する。ここに、図6は、本実施例に係る、代表語テーブルの一具体例を示すテーブルである。
図6に示されるように、前述した出現語テーブル10、及び、共同出現語テーブル20に基づいて、代表語テーブル30が作成される。この代表語テーブル30においては、楽曲を代表する代表語が登録される。この代表語を登録する手法は、先ず(i)出現語テーブル10に有される、複数の楽曲に夫々対応する、複数の列ベクトル(即ち、ベクトルM1からベクトルMmまで)のうちの「p番目(但し、pは自然数)」のベクトルと、(ii)共同出現語テーブル20に有される、n種類の単語に夫々対応する、複数の列ベクトル(即ち、ベクトルW1からベクトルWnまで)のうちの「q番目(但し、qは自然数)」のベクトルとのベクトル差の大きさが夫々比較される。次に、これら「p番目」のベクトルと、「q番目」のベクトルとのベクトル差の大きさが最小となる場合、「p番目」のベクトルと「q番目」のベクトルとが類似であると推定して、代表語テーブル30において、「p番目」のベクトルに対応する楽曲「Mp」を代表する代表語として、単語「Wq」を登録する。
具体的には、図6に示されるように、代表語テーブル30において、楽曲「M2」、楽曲「M12」、及び楽曲「M93」を代表する代表語として、単語「W1」が登録され、楽曲「M3」、及び楽曲「M29」を代表する代表語として、単語「W2」が登録されている。
(1−5−1) 代表語を決定する一手法
ここで、図7に加えて、前述した図3及び図4を適宜参照して、本実施例に係る、代表語を決定する一手法について説明する。ここに、図7は、本実施例に係る、n次元の情報空間の一例として、2次元の情報空間を示したグラフ(図7(a))、2次元の情報空間に対応した出現語テーブル10を示したテーブル(図7(b))、及び、2次元の情報空間に対応した共同出現語テーブル20を示したテーブル(図7(c))である。尚、図7(c)の共同出現語テーブル20においては、正規化のために、所定の係数「k(例えば「0.1」等)」が各値に乗算されている。また、図7(a)において、2次元のベクトルは、ベクトルの要素「W1」を横軸、即ち「W1軸」とし、ベクトルの要素「W2」を縦軸、即ち「W2軸」とする座標上において、示されている。
図7(a)に示されるように、出現語テーブル10における、2次元のベクトルM2(1、8)(図7(b)を参照)と、2次元のベクトルW1(21k、85k)とのベクトル差の大きさは、ベクトルW2(85k、21k)と比較して、最小であるので、代表語テーブル30において、ベクトルM2に対応する楽曲「M2」を代表する代表語として、単語「W1」を登録する。或いは、2次元のベクトルM2(1、8)と、2次元のベクトルW1(21k、85k)とのベクトル差の大きさは、所定範囲として、中心をベクトルM2とし、半径Rが「2」である円1の領域内にあるので、代表語テーブル30において、ベクトルM2に対応する楽曲「M2」を代表する代表語として、単語「W1」を登録する。
また、概ね同様にして、図7(a)に示されるように、出現語テーブル10における、2次元のベクトルM3(9、5)(図7(b)を参照)と、2次元のベクトルW2(85k、21k)とのベクトル差の大きさは、ベクトルW1(21k、85k)と比較して、最小であるので、代表語テーブル30において、ベクトルM3に対応する楽曲「M3」を代表する代表語として、単語「W2」を登録する。或いは、2次元のベクトルM3(9、5)と、2次元のベクトルW2(85k、21k)とのベクトル差の大きさは、所定範囲として、中心をベクトルM3とし、半径Rが「3.5」である円2の領域内にあるので、代表語テーブル30において、ベクトルM3に対応する楽曲「M3」を代表する代表語として、単語「W2」を登録する。
特に、代表語を決定する際には、共同出現語テーブルにおける、一の単語のベクトルと、他の単語のベクトルとのベクトル差が、所定範囲であるので、一の単語を代表語とする一の楽曲の代表語として、他の単語を登録するようにしてもよい。
(1−5) 代表語テーブルの一具体例 (続き)
再び、図6に戻って、上述した手法に基づいて代表語が登録された、代表語テーブル30において、楽曲「M81」を代表する代表語として、単語「W3」が登録され、楽曲「M34」、及び楽曲「M67」を代表する代表語として、単語「Wn」が登録されている。
この結果、検索手段は、代表語テーブルだけを保持していれば、複雑な処理を行う必要が殆ど又は完全にないので、例えば検索手段、表示手段、及び、入力手段が楽曲検索装置の端末等の他部として利用されている場合、この他部において、各種の処理を行う負荷を低減し、所望の楽曲をより迅速に検索することが可能である。
(1−6) 動作原理 − 楽曲の検索の結果を表示する、後段階の処理−
次に、図8を参照して、本実施例に係る、楽曲検索装置100の動作原理として、楽曲の検索の結果を表示する、後段階の処理について説明する。ここに、図8は、本実施例に係る、楽曲検索装置による、楽曲の検索の結果を表示する、後段階の処理を示したフローチャートである。尚、図8中の実線の矢印は、処理の流れを示し、点線の矢印は、情報の流れを示す。また、説明の便宜上、各処理において、ステップ番号の末尾に「t」が付加されている処理は、記憶手段へのテーブルの入力又は出力を意味する。
(1−6−1) 登録済みの楽曲と類似する楽曲の検索の場合
図8に示されるように、CPUの制御下で、入力手段170によって、記憶手段110に既に記憶されている楽曲のうち、例えばユーザが所望する楽曲を示す楽曲ID等の識別情報が入力される(ステップS201)。
次に、CPUの制御下で、検索手段によって、前述した、代表語テーブル30に基づいて、入力された楽曲の代表語に対応される、他の楽曲が検索されると共に、CPUの制御下で、表示手段180によって、ユーザに表示される(ステップS202)。
(1−6−2) 新規の楽曲と類似する楽曲の検索の場合
上述したステップS201と同時に、又は、相前後して、CPUの制御下で、入力手段170によって、例えば記憶手段に記憶されていない、新規の、ユーザが所望する楽曲が入力され、記憶手段によって記憶される(ステップS203)。
次に、前述した、ステップS106と概ね同様にして、CPUの制御下で、抽出手段120によって、一つの楽曲を単位として、出現する単語が抽出され、形態素解析が行われる(ステップS204)。
次に、前述した、ステップS111と概ね同様にして、CPUの制御下で、算出手段150によって、算出されたベクトル差の大きさに基づいて、新規の楽曲に対応される代表語が算出(決定)され、代表語テーブル30に追加される(ステップS205)。加えて、前述したステップS112tと概ね同様にして、CPUの制御下で、追加された、代表語テーブル30が、例えば記憶手段110によって、記憶される(ステップS112t)。
次に、CPUの制御下で、検索手段によって、追加された、代表語テーブル30に基づいて、入力された新規の楽曲の代表語に対応される、他の楽曲が検索されると共に、CPUの制御下で、表示手段180によって、ユーザに表示される(ステップS202)。
(1−6−3) 単語に基づく、楽曲の検索の場合
上述したステップS201と同時に、又は、相前後して、CPUの制御下で、入力手段170によって、例えばユーザが所望する、一又は複数の単語(所謂、検索語)が入力される(ステップS206)。
次に、前述した、ステップS111と概ね同様にして、CPUの制御下で、算出手段150によって、一又は複数の検索語と、代表語テーブル30に登録されている代表語との比較に基づいて、検索語に対応される代表語が算出(決定)される(ステップS207)。
次に、CPUの制御下で、検索手段によって、前述した、代表語テーブル30に基づいて、決定された代表語に対応される、楽曲が検索されると共に、CPUの制御下で、表示手段180によって、ユーザに表示される(ステップS202)。
特に、例えば単語「W1」、及び単語「W3」等の複数の検索語に対応されるベクトルMwに基づいて算出された、ベクトル差の大きさに基づいて、検索が代表語テーブルや、後述される出現語テーブルが作成されるようにしてもよい。具体的には、例えば単語「W1」に対応される要素、及び単語「W3」に対応される要素を夫々「1」とするベクトルMw(1、0、1、・・・、0)に基づいて、ベクトル差の大きさを算出するようにしてもよい。この結果、一の単語から連想される他の単語に基づいて、より適切に、所望の楽曲を検索することが可能となる。
(2)楽曲検索装置の他の実施例
図9から図12を参照して、本発明に係る楽曲検索装置の他の実施例について説明する。
(2−1) 基本構成、及び、動作原理
先ず、図9を参照して、他の実施例に係る楽曲検索装置100の基本構成について説明する。ここに、図9は、他の実施例に係る、楽曲検索装置100の基本構成を示したブロック図である。図10は、他の実施例に係る、楽曲検索装置による、第1作成処理、及び、第2作成処理を含む、前段階の処理を示したフローチャートである。図11は、他の実施例に係る、楽曲検索装置による、楽曲の検索の結果を表示する、後段階の処理を示したフローチャートである。
尚、他の実施例の基本構成において、上述した実施例と概ね同様の構成要素には、同様の符号番号を付し、それらの説明は適宜省略する。また、他の実施例の動作原理において、上述した実施例と概ね同様の処理には、同様のステップ番号を付し、それらの説明は適宜省略する。
図9に示されるように、他の実施例に係る算出手段150は、出現語距離テーブル40を作成する。尚、出現語距離テーブル40の詳細については、後述される。
図10に示されるように、前段階の処理においては、前述したステップS109を経て、CPUの制御下で、算出手段150によって、算出されたベクトル差の大きさに基づいて、出現語距離テーブル40が作成される(ステップS301t)。
図11に示されるように、後段階の処理においては、前述したステップS201を経て、CPUの制御下で、検索手段によって、後述の出現語距離テーブル40に基づいて、入力された楽曲の代表語と、所定範囲の距離にある他の代表語に対応される、複数の楽曲が検索されると共に、CPUの制御下で、表示手段180によって、ユーザに表示される(ステップS202)。
(2−2) 出現語距離テーブルの一具体例
次に、図12を参照して、他の実施例に係る、出現語距離テーブルの一具体例について説明する。ここに、図12は、他の実施例に係る、出現語距離テーブルの一具体例を示すテーブルである。
図12に示されるように、前述した共同出現語テーブル20に基づいて、出現語距離テーブル40が作成される。この出現語距離テーブル40においては、共同出現語テーブル20におけるn種類の単語「W1」から単語「Wn」のうちの2つの単語のベクトル差の大きさを示す値が登録される。具体的には、単語「W1」と単語「W2」との距離は、ベクトルW1(21、85、57、・・・、35)と、ベクトルW2(98、43、160、・・・、60)とのベクトル差の大きさに基づいて、「3」の値が、出現語距離テーブル40の行列(W1、W2)の要素と、行列(W2、W1)の要素となる。また、行数と列数が等しい行列(Wn、Wn)の要素は全て「0」の値を取る。以下、概ね同様にして、単語「W1」と単語「W3」との距離は、ベクトルW1(21、85、57、・・・、35)と、ベクトルW3(52、121、38、・・・、83)とのベクトル差の大きさに基づいて、「6」の値が、出現語距離テーブル40の行列(W1、W3)の要素と、行列(W3、W1)の要素となる。
以上のように算出した出現語距離テーブル40において、(Wx、Wy)と、(Wy、Wx)との値は等しくなる。また、(Wn、Wn)の要素も不要なデータなので、有効なデータ(又は必要なデータ)を少なくとも記録(記憶)すれば記憶容量を少なくすることができる。
この結果、出現語距離テーブル40に基づいて、迅速且つ的確に、所望の楽曲を検索することが可能となる。
本発明は、上述した実施例に限られるものではなく、請求の範囲及び明細書全体から読み取れる発明の要旨或いは思想に反しない範囲で適宜変更可能であり、そのような変更を伴う楽曲検索装置及び方法、並びに制御用のコンピュータプログラムもまた本発明の技術的範囲に含まれるものである。
本発明に係る楽曲検索装置及び方法、並びにコンピュータプログラムは、例えばネットワークを介して配信されたり、データベースに格納されている複数の楽曲から、所望の楽曲を検索する楽曲検索装置に利用可能である。また、例えば民生用或いは業務用の各種コンピュータ機器に搭載される又は各種コンピュータ機器に接続可能な楽曲検索装置等にも利用可能である。

Claims (10)

  1. 複数の楽曲において出現するn種類(nは自然数)の単語を、n次元の情報空間の座標軸にして、前記複数の楽曲のうち一の楽曲において、前記n種類の単語が夫々出現する頻度に基づいて、前記一の楽曲に対応されるn次元の第1ベクトルを作成する第1作成手段と、
    前記n次元の情報空間において、(i)前記n種類の単語のうち一の単語が、前記n種類の単語のうちの各単語と組み合わされて、前記一の楽曲において、夫々出現する一の頻度と、(ii)前記一の単語が、前記各単語と組み合わされて、前記複数の楽曲のうち他の楽曲において、夫々出現する他の頻度と、を加算した全体頻度に基づいて、前記一の単語に対応されるn次元の第2ベクトルを作成する第2作成手段と、
    前記第1ベクトルと、前記第2ベクトルとのベクトル差の大きさに基づいて、所望の楽曲を検索する検索手段と、
    を備えることを特徴とする楽曲検索装置。
  2. 前記ベクトル差の大きさが最小となる場合、前記第1ベクトルに対応する前記一の楽曲を代表する代表語を、前記一の単語として登録する代表語テーブルを作成する第3作成手段を更に備え、
    前記検索手段は、所望のキー単語と、前記代表語テーブルに登録された前記一の単語との比較に基づいて、前記所望の楽曲として、前記一の楽曲を検索することを特徴とする請求の範囲第1項に記載の楽曲検索装置。
  3. 前記第1作成手段は、前記複数の楽曲に夫々対応される、複数の第1ベクトルをテーブル形式で、更に作成し、
    前記第2作成手段は、前記n種類の単語に夫々対応される、複数の第2ベクトルをテーブル形式で、更に作成し、
    前記検索手段は、所望のキー単語と同一性を有する、前記n種類の単語のうち一の単語に対応される、一の第2ベクトルと、一の第1ベクトルとのベクトル差の大きさが最小となる場合、前記所望の楽曲として、前記一の第1ベクトルに対応される一の楽曲を検索することを特徴とする請求の範囲第1項に記載の楽曲検索装置。
  4. 前記検索手段は、前記一の第2ベクトルと、複数の第1ベクトルとのベクトル差の大きさが所定範囲にある場合、前記所望の楽曲として、前記複数の第1ベクトルに夫々対応される、複数の楽曲を検索することを特徴とする請求の範囲第3項に記載の楽曲検索装置。
  5. 前記検索手段は、(i)前記n種類の単語のうち他の単語に対応される、他の第2ベクトルと、他の第1ベクトルとのベクトル差の大きさが最小となる場合、前記所望の楽曲として、前記他の第1ベクトルに対応される他の楽曲を検索すると共に、(ii)前記一の第2ベクトルと、前記他の第2ベクトルとのベクトル差の大きさが所定範囲にある場合、前記所望の楽曲として、前記一又は他の楽曲を検索することを特徴とする請求の範囲第3項に記載の楽曲検索装置。
  6. 所望のキー単語を入力する入力手段を更に備え、
    前記検索手段は、入力された前記キー単語と同一性を有する、前記一の単語に対応される、前記第2ベクトルと、前記第1ベクトルとのベクトル差の大きさに基づいて、前記所望の楽曲を検索することを特徴とする請求の範囲第1項に記載の楽曲検索装置。
  7. (i)前記第1作成手段は、前記複数の楽曲における属性に基づいて、前記複数の楽曲をグループ化して、前記第1ベクトルを作成することに加えて、又は、代えて、(ii)前記第2作成手段は、前記n種類の単語における属性に基づいて、前記n種類の単語をグループ化して、前記第2ベクトルを作成することを特徴とする請求の範囲第1項に記載の楽曲検索装置。
  8. 前記複数の楽曲を記憶する記憶手段と、
    記憶された前記複数の楽曲に出現する前記n種類の単語を抽出する抽出手段を更に備え、
    前記第1作成手段は、抽出された前記n種類の単語に基づいて、前記第1ベクトルを作成し、
    前記第2作成手段は、抽出された前記n種類の単語に基づいて、前記第2ベクトルを作成することを特徴とする請求の範囲第1項に記載の楽曲検索装置。
  9. 複数の楽曲において出現するn種類(nは自然数)の単語を、n次元の情報空間の座標軸にして、前記複数の楽曲のうち一の楽曲において、前記n種類の単語が夫々出現する頻度に基づいて、前記一の楽曲に対応されるn次元の第1ベクトルを作成する第1作成工程と、
    前記n次元の情報空間において、(i)前記n種類の単語のうち一の単語が、前記n種類の単語のうちの各単語と組み合わされて、前記一の楽曲において、夫々出現する一の頻度と、(ii)前記一の単語が、前記各単語と組み合わされて、前記複数の楽曲のうち他の楽曲において、夫々出現する他の頻度と、を加算した全体頻度に基づいて、前記一の単語に対応されるn次元の第2ベクトルを作成する第2作成工程と、
    前記第1ベクトルと、前記第2ベクトルとのベクトル差の大きさに基づいて、所望の楽曲を検索する検索工程と、
    を備えることを特徴とする楽曲検索方法。
  10. 請求の範囲第1項に記載の楽曲検索装置に備えられたコンピュータを制御する制御用のコンピュータプログラムであって、該コンピュータを、前記第1作成手段、前記第2作成手段、及び前記検索手段のうち少なくとも一部として機能させることを特徴とするコンピュータプログラム。
JP2008501763A 2006-02-23 2007-02-23 楽曲検索装置及び方法、並びにコンピュータプログラム Expired - Fee Related JP4792497B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008501763A JP4792497B2 (ja) 2006-02-23 2007-02-23 楽曲検索装置及び方法、並びにコンピュータプログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2006047359 2006-02-23
JP2006047359 2006-02-23
JP2008501763A JP4792497B2 (ja) 2006-02-23 2007-02-23 楽曲検索装置及び方法、並びにコンピュータプログラム
PCT/JP2007/053393 WO2007097419A1 (ja) 2006-02-23 2007-02-23 楽曲検索装置及び方法、並びにコンピュータプログラム

Publications (2)

Publication Number Publication Date
JPWO2007097419A1 true JPWO2007097419A1 (ja) 2009-07-16
JP4792497B2 JP4792497B2 (ja) 2011-10-12

Family

ID=38437454

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008501763A Expired - Fee Related JP4792497B2 (ja) 2006-02-23 2007-02-23 楽曲検索装置及び方法、並びにコンピュータプログラム

Country Status (3)

Country Link
EP (1) EP1998264A4 (ja)
JP (1) JP4792497B2 (ja)
WO (1) WO2007097419A1 (ja)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07114572A (ja) * 1993-10-18 1995-05-02 Sharp Corp 文書分類装置
JPH086971A (ja) * 1994-06-16 1996-01-12 Xerox Corp シソーラス作成方法
JP2002123270A (ja) * 2000-10-12 2002-04-26 Pioneer Electronic Corp 楽曲検索装置及び楽曲検索方法
JP2002183194A (ja) * 2000-12-15 2002-06-28 Ricoh Co Ltd 検索式生成装置およびその方法
JP2003131674A (ja) * 2001-10-22 2003-05-09 Megafusion Corp 楽曲検索システム
JP2003132085A (ja) * 2001-10-19 2003-05-09 Pioneer Electronic Corp 情報選択装置及び方法、情報選択再生装置並びに情報選択のためのコンピュータプログラム
JP2003271160A (ja) * 2002-03-13 2003-09-25 Victor Co Of Japan Ltd 楽曲検索装置
JP2005222480A (ja) * 2004-02-09 2005-08-18 Oki Electric Ind Co Ltd 重要語抽出装置、重要語抽出方法、および重要語抽出プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4594701B2 (ja) * 2003-11-14 2010-12-08 パイオニア株式会社 情報検索装置、情報検索方法及び情報検索用プログラム並びに情報記録媒体

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07114572A (ja) * 1993-10-18 1995-05-02 Sharp Corp 文書分類装置
JPH086971A (ja) * 1994-06-16 1996-01-12 Xerox Corp シソーラス作成方法
JP2002123270A (ja) * 2000-10-12 2002-04-26 Pioneer Electronic Corp 楽曲検索装置及び楽曲検索方法
JP2002183194A (ja) * 2000-12-15 2002-06-28 Ricoh Co Ltd 検索式生成装置およびその方法
JP2003132085A (ja) * 2001-10-19 2003-05-09 Pioneer Electronic Corp 情報選択装置及び方法、情報選択再生装置並びに情報選択のためのコンピュータプログラム
JP2003131674A (ja) * 2001-10-22 2003-05-09 Megafusion Corp 楽曲検索システム
JP2003271160A (ja) * 2002-03-13 2003-09-25 Victor Co Of Japan Ltd 楽曲検索装置
JP2005222480A (ja) * 2004-02-09 2005-08-18 Oki Electric Ind Co Ltd 重要語抽出装置、重要語抽出方法、および重要語抽出プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BETH LOGAN、外2名: "Semantic Analysis of Song Lyrics", MULTIMEDIA AND EXPO, 2004. ICME'04. 2004 IEEE INTERNATIONAL CONFERENCE ON [ONLINE], vol. 第2巻, JPN6011012955, 30 June 2004 (2004-06-30), pages 827 - 830, ISSN: 0001959403 *
HINRICH SCHUTZE: "Dimensions of Meaning", SUPERCOMPUTING '92 PROCEEDINGS OF THE 1992 ACM/IEEE CONFERENCE ON SUPERCOMPUTING [ONLINE], JPN7011000819, 1992, pages 787 - 796, ISSN: 0001959404 *

Also Published As

Publication number Publication date
EP1998264A4 (en) 2010-12-15
WO2007097419A1 (ja) 2007-08-30
EP1998264A1 (en) 2008-12-03
JP4792497B2 (ja) 2011-10-12

Similar Documents

Publication Publication Date Title
US11461388B2 (en) Generating a playlist
US7788279B2 (en) System and method for storing and retrieving non-text-based information
US7805389B2 (en) Information processing apparatus and method, program and recording medium
US20060224260A1 (en) Scan shuffle for building playlists
CN111309965B (zh) 音频匹配方法、装置、计算机设备及存储介质
JP4179341B2 (ja) 情報処理装置および方法、プログラム、並びに記録媒体
WO2007077993A1 (ja) 情報処理装置および方法、並びに記録媒体
JP2009128508A (ja) 音声データ検索システム
KR101942459B1 (ko) 음원 컨텐츠 및 메타 정보를 이용한 플레이리스트 자동 생성 방법 및 시스템
JP4659755B2 (ja) コンテンツデータ検索装置
CN111445922B (zh) 音频匹配方法、装置、计算机设备及存储介质
JP2003316818A (ja) 情報検索方法及びその装置、コンピュータプログラム
JP4792497B2 (ja) 楽曲検索装置及び方法、並びにコンピュータプログラム
JP2009116593A (ja) 単語ベクトル生成装置、単語ベクトル生成方法、プログラムおよびプログラムを記録した記録媒体
TWI760004B (zh) 基於音樂知識圖譜與意圖辨識之音樂生成系統、方法及電腦可讀媒介
US7933853B2 (en) Computer-readable recording medium, apparatus and method for calculating scale-parameter
KR20190009821A (ko) 음원 컨텐츠 및 메타 정보를 이용한 플레이리스트 자동 생성 방법 및 시스템
JP2015141323A (ja) 情報収集方法、対話システム及び情報収集装置
JP7230085B2 (ja) 音声を処理するための方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム
JP7032650B2 (ja) 類似テキスト検索方法、類似テキスト検索装置および類似テキスト検索プログラム
JP4804299B2 (ja) 音楽提供装置
JP2007316830A (ja) 情報処理装置及びコンテンツ検索プログラム
JP2006195619A (ja) 情報検索装置および情報検索方法
JP2006119734A (ja) コンテンツ配信システム及び方法並びに情報処理装置及び方法
Phithak et al. A Machine Learning-based Approach for Strumming Pattern Recognition from Ukulele Songs

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110315

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110510

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110705

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110725

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140729

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees