JP2004110422A - 曲分類装置、曲分類方法、及びプログラム - Google Patents

曲分類装置、曲分類方法、及びプログラム Download PDF

Info

Publication number
JP2004110422A
JP2004110422A JP2002272188A JP2002272188A JP2004110422A JP 2004110422 A JP2004110422 A JP 2004110422A JP 2002272188 A JP2002272188 A JP 2002272188A JP 2002272188 A JP2002272188 A JP 2002272188A JP 2004110422 A JP2004110422 A JP 2004110422A
Authority
JP
Japan
Prior art keywords
classification
genre
music
genres
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002272188A
Other languages
English (en)
Inventor
Takehiko Ishiwatari
石渡 武彦
Yoshimitsu Takazawa
高澤 嘉光
Isoharu Nishiguchi
西口 磯春
Kazumichi Tokuhiro
徳弘 一路
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DOUBLE DIGIT Inc
Original Assignee
DOUBLE DIGIT Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DOUBLE DIGIT Inc filed Critical DOUBLE DIGIT Inc
Priority to JP2002272188A priority Critical patent/JP2004110422A/ja
Priority to AU2003264461A priority patent/AU2003264461A1/en
Priority to PCT/JP2003/011823 priority patent/WO2004027646A1/ja
Priority to US10/528,203 priority patent/US20060169126A1/en
Publication of JP2004110422A publication Critical patent/JP2004110422A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/036Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal of musical genre, i.e. analysing the style of musical pieces, usually for selection, filtering or classification

Abstract

【課題】ジャンルの分類に用いるパラメータをを適切に設定して、分類精度を上げる。
【解決手段】曲が属する可能性のあるジャンルである候補ジャンルを複数取得し、複数の候補ジャンルに基づいて、曲の特徴を示す複数のパラメータの種類から、曲が属するジャンルを判断するために用いるパラメータの種類である分類パラメータ種を選択するパラメータ選択部160と、曲の分類パラメータ種の値に基づいて、曲が複数の候補ジャンルのいずれに属するかを判断するジャンル判断部200とを備える。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、曲分類装置、曲分類方法、及び曲分類を行うプログラムに関する。特に本発明は、精度良く曲の分類を自動で行うための曲分類装置、曲分類方法、及び曲分類を行うプログラムに関する。
【0002】
【従来の技術】
曲を自動でジャンル別に分類する技術の開発が進められている。
例えば、第1の記録媒体に格納されている音楽ソフトのうち、予め指定された特徴部分を有する音楽ソフトを、第2の記録媒体に格納する技術がある(例えば特許文献1)。
また、曲のリズム、テンポ、調性、及びコード進行を検出し、検出した曲のリズム、テンポ、調性、及びコード進行に基づいて音楽ジャンルを判定する技術がある(例えば特許文献2)。
また、振幅揺らぎ、周波数揺らぎ、イベント揺らぎなどの揺らぎ特性に基づいて曲を自動で分類する技術がある(例えば非特許文献1及び2参照)。
【0003】
【特許文献1】
特開2000−268541
【特許文献2】
特開平10−161654
【非特許文献1】
田原 靖彦他3名「揺らぎ特性を用いた音環境評価の諸問題」日本音響学会講演論文集 平成8年9月 p721ー722
【非特許文献2】
田原 靖彦他3名「各種音楽・自然音の揺らぎ特性分析−回帰分析周波数範囲をパラメタとする検討−」日本音響学会講演論文集 平成9年3月 p791ー792
【0004】
【発明が解決しようとする課題】
曲の自動分類装置を実用化するには、分類精度を更に上げる必要がある。ここで、曲を特徴づけるパラメータは複数あるが、ジャンルの分類に用いるパラメータをを適切に設定しないと、人間の感性に沿った分類を行うことは難しい。
そこで本発明は、上記の課題を解決することのできる曲分類装置、曲分類方法、及び曲分類を行うプログラムを提供することを目的とする。この目的は特許請求の範囲における独立項に記載の特徴の組み合わせにより達成される。また従属項は本発明の更なる有利な具体例を規定する。
【0005】
【課題を解決するための手段】
即ち、本発明の第1の形態によると、曲を分類する曲分類装置であって、曲が属する可能性のあるジャンルである候補ジャンルを複数取得し、複数の候補ジャンルに基づいて、曲の特徴を示す複数のパラメータの種類から、曲が属するジャンルを判断するために用いるパラメータの種類である分類パラメータ種を選択するパラメータ選択部と、曲の分類パラメータ種の値に基づいて、曲が複数の候補ジャンルのいずれに属するかを判断するジャンル判断部とを備えることを特徴とする曲分類装置を提供する。
【0006】
上記曲分類装置において、複数のジャンルの組合せ毎に、分類パラメータ種を予め格納する分類パラメータ種格納部を更に備え、パラメータ選択部は、分類パラメータ種格納部において複数の候補ジャンルの組合せに対応する分類パラメータ種を、分類パラメータ種格納部から取得する構成としてもよい。
【0007】
ジャンル毎に、当該ジャンルの最も典型的なパラメータの値である代表値を複数のパラメータ毎に格納する代表値格納部を更に備え、ジャンル判断部は、曲における分類パラメータ種の値を算出し、代表値格納部から、複数の候補ジャンルのそれぞれの、分類パラメータ種の代表値を取得し、算出した分類パラメータ種の値と、取得した代表値との差分に基づいて曲が属するジャンルを判断する構成としてもよい。
この場合、複数のジャンルの組合せ毎に、2種類以上の分類パラメータ種、及び2種類以上の分類パラメータ種の間の重み付けを示す重み付け係数を予め格納する分類パラメータ種格納部を更に備え、ジャンル判断部は、複数のジャンル毎に、分類パラメータ種である2種類以上のパラメータのそれぞれの値を算出し、算出した値と代表値との差分を、分類パラメータ種格納部が格納する重み付け係数に従って加重平均し、当該加重平均の結果に基づいて曲が属するジャンルを判断してもよい。
【0008】
複数のジャンルを階層的に格納し、上位階層の複数のジャンルのそれぞれに、下位階層の複数のジャンルを対応づけて格納するジャンル格納部を更に備え、パラメータ選択部は、ジャンル判断部が、曲が属すべき上位階層のジャンルを判断した後、再度、当該上位階層のジャンルに対応する下位階層の複数のジャンルをジャンル格納部から取得し、下位階層の複数のジャンルに基づいて分類パラメータ種を選択し、ジャンル判断部は、再度、パラメータ選択部が選択した分類パラメータ種に基づいて、曲が属すべき下位階層のジャンルを判断してもよい。
また、ジャンル毎に、当該ジャンルの最も典型的なパラメータの値である代表値を複数のパラメータ毎に格納する代表値格納部を更に備え、パラメータ選択部は、ジャンル取得部が取得した複数のジャンルのそれぞれに対応する複数のパラメータ毎の代表値を、代表値格納部から取得し、複数のジャンル間で最も代表値のばらつきが大きいパラメータを、分類パラメータ種として選択してもよい。
【0009】
ジャンル判断部は、互いに異なる複数の周波数帯域毎に曲における分類パラメータ種の値を算出し、複数の周波数帯域毎の分類パラメータ種の値に基づいて曲を分類してもよい。
ジャンル毎に、当該ジャンルに属する曲が取りうるパラメータの範囲を複数のパラメータ毎に格納する範囲格納部を更に備え、ジャンル判断部は、算出した分類パラメータ種の値と、範囲格納部がジャンル別に格納する分類パラメータ種の範囲に基づいて、曲が属するジャンルを判断してもよい。
【0010】
本発明の第2の形態は、曲を分類する曲分類方法であって、コンピュータが、曲が属する可能性のあるジャンルである候補ジャンルを複数取得し、複数の候補ジャンルに基づいて、曲の特徴を示す複数のパラメータの種類から、曲が属するジャンルを判断するために用いるパラメータの種類である分類パラメータ種を選択し、コンピュータが、曲における分類パラメータ種の値に基づいて、曲が複数の候補ジャンルのいずれに属するかを判断することを特徴とする曲分類方法を提供する。
【0011】
本発明の第3の形態は、コンピュータに実行可能であり、曲を分類するためのプログラムであって、コンピュータに、曲が属する可能性のあるジャンルである候補ジャンルを複数取得し、複数の候補ジャンルに基づいて、曲の特徴を示す複数のパラメータの種類から、曲が属するジャンルを判断するために用いるパラメータの種類である分類パラメータ種を選択する機能と、曲における分類パラメータ種の値に基づいて、曲が複数の候補ジャンルのいずれに属するかを判断する機能とを実現させることを特徴とするプログラムを提供する。
【0012】
なお上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではなく、これらの特徴群のサブコンビネーションも又発明となりうる。
【0013】
【発明の実施の形態】
以下、発明の実施形態を通じて本発明を説明するが、実施形態は特許請求の範囲にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0014】
図1は、実施形態である曲分類装置100の構成を示すブロック図である。曲分類装置100は、入力された曲を自動でジャンル別に分類する装置である。このとき、曲が属する可能性のあるジャンルである複数の候補ジャンルに基づいて、曲が属すべきジャンルを判断するときに用いるパラメータの種類を選択する。
曲分類装置100は、分類パラメータ種格納部120、代表値格納部140、パラメータ選択部160、解析部180、及びジャンル分類部200を備える。分類パラメータ種格納部120は、ジャンル格納部を兼ねる。
【0015】
分類パラメータ種格納部120は、複数のジャンルの組合せと、当該複数のジャンルのいずれに曲が属すべきかを判断するときに用いるパラメータである分類パラメータ種を対応づけて格納する。
代表値格納部140は、ジャンル別に、当該ジャンルの最も典型的なパラメータの値である代表値を、複数のパラメータ毎に格納する。
【0016】
パラメータ選択部160は、曲分類装置100が曲のデータを取得すると、分類パラメータ種格納部120から、取得した曲が属する可能性のある複数の候補ジャンル、及び取得した複数の候補ジャンルに対応する分類パラメータ種を取得し、ジャンル分類部200に出力する。ここで、パラメータ選択部160は、複数の候補ジャンルを選択するときに、ジャンル分類部200が選択した上位階層のジャンル分類結果を用いる。
また、パラメータ選択部160は、取得した分類パラメータ種を解析部180に出力する。
【0017】
解析部180は、処理対象となる曲のデータを取得して解析し、当該曲の、複数のパラメータ毎の値を算出する。そして、算出した各パラメータの値をジャンル分類部200に出力する。
【0018】
ジャンル分類部200は、パラメータ選択部160から取得した複数のジャンル候補のそれぞれに対応する、分類パラメータ種の代表値を、代表値格納部140から取得する。そして、分類パラメータ種の代表値と、解析部180から取得した分類パラメータ種の値に基づき、曲が属するジャンルを判断し、判断結果を外部に出力する。ここで、ジャンル分類部200は、上位階層のジャンルを判断したときに、当該判断結果をパラメータ選択部160に出力する。
【0019】
すなわち、曲分類装置100によれば、曲が属する可能性がある複数の候補ジャンルに基づいて、判断に用いるパラメータの種類を選択する。従って、精度よく曲のジャンルを判断し、曲を分類することができる。また、判断に用いるパラメータの数を絞ることができるため、曲分類装置100にかかる負荷が小さくなる。
【0020】
図2は、分類パラメータ種格納部120のデータ構成をテーブル形式で示す図である。
分類パラメータ種格納部120は、複数の候補ジャンル毎に、複数の分類パラメータ種、及び各分類パラメータ種の重み付けを示す重み付け係数を格納する。すなわち、曲分類装置100のジャンル分類部200は、解析部180が算出した分類パラメータ種の値を、重み付け係数に従って加算処理し、この加算処理結果に基づいて曲の分類を行うことができる。
従って、重み付け係数を適切な値に設定することで、曲分類装置100は、さらに精度よく曲のジャンルを判断することができる。また、曲分類装置100は、必ず何れかのジャンルに曲を分類することができる。
【0021】
また、分類パラメータ種格納部120は、複数の候補ジャンルを、階層的に格納する。すなわち、上位階層の複数の候補ジャンルのそれぞれに、下位階層の複数の候補ジャンルを対応づけて格納する。
すなわち、曲分類装置100は、曲が属する上位階層に属する一の候補ジャンルを選択した後、再度、当該上位階層のジャンルに対応する下位階層の複数の候補ジャンルのうち、曲がいずれの下位階層の候補ジャンルに属するかを判断する。
従って、曲分類装置100は、候補ジャンルが多い場合でも、精度よく曲のジャンルを判断することができる。
【0022】
図3は、代表値格納部140のデータ構成をテーブル形式で示す図である。代表値格納部140は、ジャンル毎に、各パラメータの代表値を格納する。ここで、代表値格納部140は、複数の周波数帯域毎、例えば低域、中域、高域の3つの領域毎に同一種類のパラメータの代表値をそれぞれ格納する。低域は、例えば200ヘルツ以下、中域は、例えば200〜600ヘルツ、高域は、例えば600ヘルツ以上である。
ジャンルによっては、周波数帯域別に分けてパラメータの値を出すことで特徴が明確になる場合がある。従って、曲分類装置100は、さらに精度よく曲を分類することができる。
【0023】
図4は、曲分類装置100の動作を示すフローチャートである。解析部180が曲のデータを取得する(S20)と、解析部180が、曲データを解析して当該曲のパラメータ値を算出し(S40)、ジャンル分類部200が、算出したパラメータ値、及び複数の候補ジャンルに対応する代表値に基づいて、分類処理を実行する(S60)。そして、ジャンル分類部200、判断した分類結果を外部に出力する(S80)。
従って、曲分類装置100は、曲データを受信すると、当該曲データのジャンルを判断することができる。
【0024】
図5は、図4における曲解析処理(S40)の詳細を示すフローチャートである。
解析部180は、受信した曲データから、予め定められた部分をサンプリングする(S200)。予め定められた部分は、例えば曲のスタート時などの解析開始点から100秒間である。そして、サンプリングしたデータを、予め定められた数のフレームに等分割する(S220)。予め定められた数は、例えば2048である。そして、各フレームの先頭から予め定められた部分を取り出す(S240)。ここでの予め定められた部分は、例えば先頭から1024点であり、通常のCDに用いられているデータ形式、すなわち44.1kHzサンプリング、16ビット量子化、ステレオ形式においては、約46ミリ秒に相当する。
【0025】
そして、解析部180は、S240で取り出した部分をフーリエ変換し(S240)、フーリエ変換の結果を、予め定められた周波数帯域、例えば図3における低域、中域、及び高域に分割する(S280)。フーリエ変換は、例えば高速フーリエ/サイン/コサイン変換(FFT)である。
その後、各周波数帯域毎に積分することで、各フレームの帯域別パワーを算出し(S300)、最もパワーが大きい周波数帯域を、ピッチを定めるための各フレームのデータとする(S320)。このパワー及びピッチを定めるためのデータをフレーム順に並べると、パワーの時系列データ及びピッチを定めるための時系列データとなる。なお、S300で算出した帯域別のパワーは、パラメータの一つである。
【0026】
そして、周波数帯域別の、パワーの時系列データ及びピッチを定めるための時系列データを、それぞれフーリエ変換する(S340)。
そして、フーリエ変換の結果を、変数を周波数の逆数とした複数の(x,y)データとして扱い、当該複数の(x,y)データに対する回帰曲線を最小二乗法により求める。そして、周波数帯域別の回帰曲線の傾き及びy切片を、パラメータとして認識する(S360)。
【0027】
すなわち、解析部180は、複数の周波数帯域毎に、パワー、回帰曲線の傾き及びy切片をパラメータとして得る。従って、複数種類のパラメータを算出することができる。
【0028】
図6は、図4における分類処理(S60)の詳細を示すフローチャートである。まず、ジャンル分類部200は、パラメータ選択部160を介して分類パラメータ種格納部120から上位階層の複数の候補ジャンルを取得し(S400)、取得した複数の上位階層の候補ジャンルに対応するパラメータの種類を分類パラメータ種格納部120から取得することで、分類パラメータ種を選択する(S420)。そして、上位階層の複数の候補ジャンルにおける、分類パラメータ種の代表値を取得する(S440)。
【0029】
そして、取得した代表値と、S40で算出した値との差分を、ジャンル別にパラメータ毎に算出し(S460)、算出した差分を、分類パラメータ種格納部120が格納する重み付け係数に従って加重平均する(S480)。そして、加重平均した値が最も小さいジャンルを選択する(S500)。選択したジャンルが最も下位階層に属する場合は、曲を当該選択したジャンルに分類する(S540)。更に下位の階層がある場合は、選択したジャンルに対応する下位の複数のジャンルを取得し(S560)、S420に戻る。
【0030】
従って、曲分類装置100は、代表値との差分に基づいて曲が属すべきジャンルを判断することができる。
なお、図6において、ジャンル分類部200は、当該差分の二乗を重み付け係数に従って加重平均し、この平均値が最も小さいジャンルに曲を分類てもよい。また、当該差分の和が最も小さいジャンルに曲を分類してもよい。
【0031】
図7は、曲分類装置100の第1の変形例の構成を示すブロック図である。本例にかかる曲分類装置100は、パラメータ格納部120を備えない点、及び、パラメータ選択部160が、複数の候補ジャンル、及び代表値格納部140に格納されている情報に基づいて分類パラメータ種を定める点が、図1の曲分類装置100と異なる。
【0032】
図8は、第1の変形例にかかる曲分類装置100がジャンルを分類するときの動作(図4のS60)の詳細を示すフローチャートである。まず、パラメータ分類部160は複数の候補ジャンルを取得する(S600)と、当該複数の候補ジャンル毎に、各パラメータの代表値を代表値格納部140から取得する(S620)。そして、複数の候補ジャンルの間で最も代表値のばらつきが大きいパラメータを選択する(S640)。そして、分類対象となる曲の当該パラメータ種における値と、最も代表値が近いジャンルに、その曲を分類する(S660)、
【0033】
すなわち、本変形例において、曲分類装置100は、複数の候補ジャンルの間で最も代表値のばらつきが大きいパラメータの種類を、分類パラメータ種として選択する。従って、精度よく曲を分類することができる。
なお、本変形例において、複数の候補ジャンルは外部から入力されてもよいし、予めデータベースに格納されていてもよい。
【0034】
図9は、曲分類装置100の第2の変形例の構成を示すブロック図である。本変形例にかかる曲分類装置100は、代表値格納部160の代わりに範囲格納部150を有する点を除き、図1に示す曲分類装置100と同一である。すなわち、ジャンル分類部200は、解析部180が解析した曲のパラメータの値と、範囲格納部150が格納するデータに基づいて、曲を分類する。
【0035】
図10は、範囲格納部150のデータ構成をテーブル形式で示す図である。範囲格納部150は、ジャンル毎に、当該ジャンルに属する曲がとるべきパラメータの範囲をパラメータ別に格納する。
すなわち、ジャンル分類部200は、解析部180が算出したパラメータの値が、いずれのジャンルの範囲に含まれるかを判断し、この判断結果に従って曲を分類する。このとき、複数の候補ジャンル、及び用いるべき分類パラメータ種は、分類パラメータ種格納部120が格納するデータに従う。
【0036】
従って、第2の変形例にかかる曲分類装置100によれば、予め各ジャンル毎に、パラメータの範囲を適切に定めておくことで、精度よく曲を分類することができる。
【0037】
なお、本変形例において、複数の候補ジャンルを外部から取得する構成とするとき、ジャンル分類部200は、当該複数の候補ジャンルにおいて、範囲格納部150が格納する範囲が最もばらついているパラメータを分類パラメータ種として選択してもよい。
また、本変形例においても、代表値格納部140を備えていてもよい。この場合、曲分類装置100は、分類パラメータ種の値がどのジャンルの範囲にも入らない曲に対して、図6に示す処理を行うことで、曲の分類を行うことができる。
【0038】
なお、曲分類装置100は、コンピュータに、例えばリムーバブルメディアを介して所定のプログラムをインストールすることで実現する。当該プログラムは、通信網を介してコンピュータにダウンロードされてもよい。
【0039】
以上、本発明を実施形態を用いて説明したが、本発明の技術的範囲は上記実施形態に記載の範囲には限定されない。上記実施形態に、多様な変更または改良を加えることができる。そのような変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
【0040】
【発明の効果】
上記説明から明らかなように、本発明によれば精度よく曲を分類することができる。
【図面の簡単な説明】
【図1】実施形態である曲分類装置100の構成を示すブロック図である。
【図2】分類パラメータ種格納部120のデータ構成をテーブル形式で示す図である。
【図3】代表値格納部140のデータ構成をテーブル形式で示す図である。
【図4】曲分類装置100の動作を示すフローチャートである。
【図5】図4における曲解析処理(S40)の詳細を示すフローチャートである。
【図6】図4における分類処理(S60)の詳細を示すフローチャートである。
【図7】曲分類装置100の第1の変形例の構成を示すブロック図である。
【図8】第1の変形例にかかる曲分類装置100がジャンルを分類するときの動作(図4のS60)の詳細を示すフローチャートである。
【図9】曲分類装置100の第2の変形例の構成を示すブロック図である。
【図10】範囲格納部150のデータ構成をテーブル形式で示す図である。
【符号の説明】
120 分類パラメータ種格納部(ジャンル格納部)
140 代表値格納部
150 範囲格納部
160 パラメータ選択部
180 解析部
200 ジャンル判断部

Claims (10)

  1. 曲を分類する曲分類装置であって、
    前記曲が属する可能性のあるジャンルである候補ジャンルを複数取得し、前記複数の候補ジャンルに基づいて、曲の特徴を示す複数のパラメータの種類から、前記曲が属するジャンルを判断するために用いるパラメータの種類である分類パラメータ種を選択するパラメータ選択部と、
    前記曲の前記分類パラメータ種の値に基づいて、前記曲が前記複数の候補ジャンルのいずれに属するかを判断するジャンル判断部と
    を備えることを特徴とする曲分類装置。
  2. 複数のジャンルの組合せ毎に、前記分類パラメータ種を予め格納する分類パラメータ種格納部を更に備え、
    前記パラメータ選択部は、前記分類パラメータ種格納部において前記複数の候補ジャンルの組合せに対応する前記分類パラメータ種を、前記分類パラメータ種格納部から取得することを特徴とする請求項1に記載の曲分類装置。
  3. 前記ジャンル毎に、当該ジャンルの最も典型的な前記パラメータの値である代表値を前記複数のパラメータ毎に格納する代表値格納部を更に備え、
    前記ジャンル判断部は、
    前記曲における前記分類パラメータ種の値を算出し、
    前記代表値格納部から、前記複数の候補ジャンルのそれぞれの、前記分類パラメータ種の代表値を取得し、
    算出した前記分類パラメータ種の値と、取得した前記代表値との差分に基づいて前記曲が属するジャンルを判断することを特徴とする請求項1に記載の曲分類装置。
  4. 複数のジャンルの組合せ毎に、2種類以上の前記分類パラメータ種、及び前記2種類以上の分類パラメータ種の間の重み付けを示す重み付け係数を予め格納する分類パラメータ種格納部を更に備え、
    前記ジャンル判断部は、前記複数のジャンル毎に、前記分類パラメータ種である2種類以上のパラメータのそれぞれの値を算出し、算出した値と前記代表値との差分を、前記分類パラメータ種格納部が格納する重み付け係数に従って加重平均し、当該加重平均の結果に基づいて前記曲が属するジャンルを判断することを特徴とする請求項3に記載の曲分類装置。
  5. 前記複数のジャンルを階層的に格納し、上位階層の前記複数のジャンルのそれぞれに、下位階層の前記複数のジャンルを対応づけて格納するジャンル格納部を更に備え、
    前記パラメータ選択部は、前記ジャンル判断部が、前記曲が属すべき前記上位階層のジャンルを判断した後、再度、当該上位階層のジャンルに対応する前記下位階層の複数のジャンルを前記ジャンル格納部から取得し、前記下位階層の複数のジャンルに基づいて前記分類パラメータ種を選択し、
    前記ジャンル判断部は、再度、前記パラメータ選択部が選択した前記分類パラメータ種に基づいて、前記曲が属すべき前記下位階層のジャンルを判断することを特徴とする請求項1に記載の曲分類装置。
  6. 前記ジャンル毎に、当該ジャンルの最も典型的な前記パラメータの値である代表値を前記複数のパラメータ毎に格納する代表値格納部を更に備え、
    前記パラメータ選択部は、前記ジャンル取得部が取得した前記複数のジャンルのそれぞれに対応する前記複数のパラメータ毎の代表値を、前記代表値格納部から取得し、前記複数のジャンル間で最も前記代表値のばらつきが大きいパラメータを、前記分類パラメータ種として選択することを特徴とする請求項1に記載の曲分類装置。
  7. 前記ジャンル判断部は、互いに異なる複数の周波数帯域毎に前記曲における前記分類パラメータ種の値を算出し、前記複数の周波数帯域毎の前記分類パラメータ種の値に基づいて前記曲を分類することを特徴とする請求項1に記載の曲分類装置。
  8. 前記ジャンル毎に、当該ジャンルに属する曲が取りうる前記パラメータの範囲を前記複数のパラメータ毎に格納する範囲格納部を更に備え、
    前記ジャンル判断部は、算出した前記分類パラメータ種の値と、前記範囲格納部がジャンル別に格納する前記分類パラメータ種の範囲に基づいて、前記曲が属するジャンルを判断することを特徴とする請求項1に記載の曲分類装置。
  9. 曲を分類する曲分類方法であって、
    コンピュータが、前記曲が属する可能性のあるジャンルである候補ジャンルを複数取得し、前記複数の候補ジャンルに基づいて、曲の特徴を示す複数のパラメータの種類から、前記曲が属するジャンルを判断するために用いるパラメータの種類である分類パラメータ種を選択し、
    前記コンピュータが、前記曲における前記分類パラメータ種の値に基づいて、前記曲が前記複数の候補ジャンルのいずれに属するかを判断することを特徴とする曲分類方法。
  10. コンピュータに実行可能であり、曲を分類するためのプログラムであって、
    前記コンピュータに、
    前記曲が属する可能性のあるジャンルである候補ジャンルを複数取得し、前記複数の候補ジャンルに基づいて、曲の特徴を示す複数のパラメータの種類から、前記曲が属するジャンルを判断するために用いるパラメータの種類である分類パラメータ種を選択する機能と、
    前記曲における前記分類パラメータ種の値に基づいて、前記曲が前記複数の候補ジャンルのいずれに属するかを判断する機能と
    を実現させることを特徴とするプログラム。
JP2002272188A 2002-09-18 2002-09-18 曲分類装置、曲分類方法、及びプログラム Pending JP2004110422A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2002272188A JP2004110422A (ja) 2002-09-18 2002-09-18 曲分類装置、曲分類方法、及びプログラム
AU2003264461A AU2003264461A1 (en) 2002-09-18 2003-09-17 Music classification device, music classification method, and program
PCT/JP2003/011823 WO2004027646A1 (ja) 2002-09-18 2003-09-17 曲分類装置、曲分類方法、及びプログラム
US10/528,203 US20060169126A1 (en) 2002-09-18 2003-09-17 Music classification device, music classification method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002272188A JP2004110422A (ja) 2002-09-18 2002-09-18 曲分類装置、曲分類方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2004110422A true JP2004110422A (ja) 2004-04-08

Family

ID=32024902

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002272188A Pending JP2004110422A (ja) 2002-09-18 2002-09-18 曲分類装置、曲分類方法、及びプログラム

Country Status (4)

Country Link
US (1) US20060169126A1 (ja)
JP (1) JP2004110422A (ja)
AU (1) AU2003264461A1 (ja)
WO (1) WO2004027646A1 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006285439A (ja) * 2005-03-31 2006-10-19 Pioneer Electronic Corp 情報検索装置、情報検索方法、情報検索用プログラム、および記録媒体
JP2006318384A (ja) * 2005-05-16 2006-11-24 Sharp Corp 楽曲検索システムおよび楽曲検索方法
JP2006323008A (ja) * 2005-05-17 2006-11-30 Sharp Corp 楽曲検索装置および楽曲検索方法
JP2006323007A (ja) * 2005-05-17 2006-11-30 Sharp Corp 楽曲検索装置および楽曲検索方法
JP2006323438A (ja) * 2005-05-17 2006-11-30 Sharp Corp 楽曲検索システム
JP2007122442A (ja) * 2005-10-28 2007-05-17 Victor Co Of Japan Ltd 楽曲分類装置及び楽曲分類プログラム
JP2007241941A (ja) * 2006-03-13 2007-09-20 Kenwood Corp コンテンツ検索装置及びコンテンツ検索プログラム
WO2008001766A1 (fr) * 2006-06-30 2008-01-03 Konami Digital Entertainment Co., Ltd. Dispositif de jeu musical
JP2009162818A (ja) * 2007-12-28 2009-07-23 Nintendo Co Ltd 楽曲提示装置、楽曲提示プログラム
WO2012104915A1 (ja) * 2011-02-02 2012-08-09 パイオニア株式会社 楽曲処理装置
JP5000789B1 (ja) * 2011-02-02 2012-08-15 パイオニア株式会社 楽曲再生設定方法

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7899564B2 (en) * 2004-11-09 2011-03-01 Bang & Olufsen Procedure and apparatus for generating automatic replay of recordings
JP2007042069A (ja) * 2005-06-30 2007-02-15 Sony Corp 情報処理装置,情報処理方法および情報処理プログラム
KR101215937B1 (ko) * 2006-02-07 2012-12-27 엘지전자 주식회사 IOI 카운트(inter onset intervalcount) 기반 템포 추정 방법 및 이를 위한 템포 추정장치
JP4925749B2 (ja) * 2006-07-06 2012-05-09 パイオニア株式会社 コンテンツ再生制御装置、コンテンツ再生制御方法、コンテンツ再生制御プログラムおよび記録媒体
US8677243B2 (en) * 2006-09-01 2014-03-18 Nokia Corporation Media recommendation system and method
US9865240B2 (en) * 2006-12-29 2018-01-09 Harman International Industries, Incorporated Command interface for generating personalized audio content
EP2068255A3 (en) * 2007-12-07 2010-03-17 Magix Ag System and method for efficient generation and management of similarity playlists on portable devices
US9390167B2 (en) 2010-07-29 2016-07-12 Soundhound, Inc. System and methods for continuous audio matching
US8452586B2 (en) * 2008-12-02 2013-05-28 Soundhound, Inc. Identifying music from peaks of a reference sound fingerprint
US20100198926A1 (en) * 2009-02-05 2010-08-05 Bang & Olufsen A/S Method and an apparatus for providing more of the same
US9047371B2 (en) 2010-07-29 2015-06-02 Soundhound, Inc. System and method for matching a query against a broadcast stream
US9035163B1 (en) 2011-05-10 2015-05-19 Soundbound, Inc. System and method for targeting content based on identified audio and multimedia
US10957310B1 (en) 2012-07-23 2021-03-23 Soundhound, Inc. Integrated programming framework for speech and text understanding with meaning parsing
US9507849B2 (en) 2013-11-28 2016-11-29 Soundhound, Inc. Method for combining a query and a communication command in a natural language computer system
US9292488B2 (en) 2014-02-01 2016-03-22 Soundhound, Inc. Method for embedding voice mail in a spoken utterance using a natural language processing computer system
US11295730B1 (en) 2014-02-27 2022-04-05 Soundhound, Inc. Using phonetic variants in a local context to improve natural language understanding
US9564123B1 (en) 2014-05-12 2017-02-07 Soundhound, Inc. Method and system for building an integrated user profile
US20160070789A1 (en) * 2014-09-05 2016-03-10 Next Audio Labs, Llc System, method and software product for sorting audio data and playlist cloning

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6248946B1 (en) * 2000-03-01 2001-06-19 Ijockey, Inc. Multimedia content delivery system and method

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006285439A (ja) * 2005-03-31 2006-10-19 Pioneer Electronic Corp 情報検索装置、情報検索方法、情報検索用プログラム、および記録媒体
JP4573684B2 (ja) * 2005-03-31 2010-11-04 パイオニア株式会社 情報検索装置、情報検索方法、情報検索用プログラム、および記録媒体
JP2006318384A (ja) * 2005-05-16 2006-11-24 Sharp Corp 楽曲検索システムおよび楽曲検索方法
JP2006323007A (ja) * 2005-05-17 2006-11-30 Sharp Corp 楽曲検索装置および楽曲検索方法
JP2006323438A (ja) * 2005-05-17 2006-11-30 Sharp Corp 楽曲検索システム
JP2006323008A (ja) * 2005-05-17 2006-11-30 Sharp Corp 楽曲検索装置および楽曲検索方法
JP4607659B2 (ja) * 2005-05-17 2011-01-05 シャープ株式会社 楽曲検索装置および楽曲検索方法
JP4607660B2 (ja) * 2005-05-17 2011-01-05 シャープ株式会社 楽曲検索装置および楽曲検索方法
JP2007122442A (ja) * 2005-10-28 2007-05-17 Victor Co Of Japan Ltd 楽曲分類装置及び楽曲分類プログラム
JP4622808B2 (ja) * 2005-10-28 2011-02-02 日本ビクター株式会社 楽曲分類装置、楽曲分類方法、楽曲分類プログラム
JP2007241941A (ja) * 2006-03-13 2007-09-20 Kenwood Corp コンテンツ検索装置及びコンテンツ検索プログラム
WO2008001766A1 (fr) * 2006-06-30 2008-01-03 Konami Digital Entertainment Co., Ltd. Dispositif de jeu musical
JP2009162818A (ja) * 2007-12-28 2009-07-23 Nintendo Co Ltd 楽曲提示装置、楽曲提示プログラム
WO2012104915A1 (ja) * 2011-02-02 2012-08-09 パイオニア株式会社 楽曲処理装置
JP5000789B1 (ja) * 2011-02-02 2012-08-15 パイオニア株式会社 楽曲再生設定方法

Also Published As

Publication number Publication date
WO2004027646A1 (ja) 2004-04-01
AU2003264461A1 (en) 2004-04-08
US20060169126A1 (en) 2006-08-03

Similar Documents

Publication Publication Date Title
JP2004110422A (ja) 曲分類装置、曲分類方法、及びプログラム
Peeters et al. The timbre toolbox: Extracting audio descriptors from musical signals
US7908135B2 (en) Music-piece classification based on sustain regions
US7649137B2 (en) Signal processing apparatus and method, program, and recording medium
US10242097B2 (en) Music selection and organization using rhythm, texture and pitch
Ikemiya et al. Singing voice analysis and editing based on mutually dependent F0 estimation and source separation
US9875304B2 (en) Music selection and organization using audio fingerprints
EP1579419B1 (en) Audio signal analysing method and apparatus
JP5732994B2 (ja) 楽曲検索装置および方法、プログラム、並びに記録媒体
US10225328B2 (en) Music selection and organization using audio fingerprints
CN101189610B (zh) 用于确定内容项特性的方法和电子设备
US20080245215A1 (en) Signal Processing Apparatus and Method, Program, and Recording Medium
KR101637282B1 (ko) 음악 플레이리스트 생성방법, 및 음악 플레이리스트 생성장치
CN1985302A (zh) 用于对音乐进行分类的方法
Eggink et al. Instrument recognition in accompanied sonatas and concertos
WO2015114216A2 (en) Audio signal analysis
Wu et al. Polyphonic pitch estimation and instrument identification by joint modeling of sustained and attack sounds
JPWO2009104269A1 (ja) 楽曲判別装置、楽曲判別方法、楽曲判別プログラム及び記録媒体
WO2008157693A1 (en) System and method for predicting musical keys from an audio source representing a musical composition
Fraser et al. Toward real-time recognition of acoustic musical instruments
Jürgens et al. Recognizing guitar effects and their parameter settings
JP4722738B2 (ja) 楽曲分析方法及び楽曲分析装置
US20040158437A1 (en) Method and device for extracting a signal identifier, method and device for creating a database from signal identifiers and method and device for referencing a search time signal
Yoshii et al. Drum sound identification for polyphonic music using template adaptation and matching methods
Kumar et al. Comparative Analysis of Melodia and Time-Domain Adaptive Filtering based Model for Melody Extraction from Polyphonic Music