JP2006195384A - 楽曲調性算出装置および選曲装置 - Google Patents

楽曲調性算出装置および選曲装置 Download PDF

Info

Publication number
JP2006195384A
JP2006195384A JP2005009561A JP2005009561A JP2006195384A JP 2006195384 A JP2006195384 A JP 2006195384A JP 2005009561 A JP2005009561 A JP 2005009561A JP 2005009561 A JP2005009561 A JP 2005009561A JP 2006195384 A JP2006195384 A JP 2006195384A
Authority
JP
Japan
Prior art keywords
music
tonality
pitch name
unit
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005009561A
Other languages
English (en)
Inventor
Junichi Tagawa
潤一 田川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2005009561A priority Critical patent/JP2006195384A/ja
Publication of JP2006195384A publication Critical patent/JP2006195384A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Electrophonic Musical Instruments (AREA)
  • Auxiliary Devices For Music (AREA)

Abstract

【課題】 複数の楽器音が含まれる楽曲に対しても正確に調性を判定することが可能な楽曲調性判定装置を提供する。
【解決手段】 抽出部12は、ベース音を含む2以上の楽器音で構成される楽曲の音響信号から、ベース音を含む帯域の信号を抽出する。ベクトル算出部13は、抽出された信号について、各音名に相当する周波数におけるパワー値を要素とする音名ベクトルを算出する。頻度算出部15は、音名ベクトルを用いて各音名の出現頻度を算出する。調性算出部16は、出現頻度に基づいて楽曲の調性を算出する。
【選択図】 図1

Description

本発明は、楽曲調性算出装置および選曲装置に関し、より特定的には、長調/短調やスケールといった楽曲の調性を算出する楽曲調性算出装置、および、当該楽曲調性算出装置によって算出された調性を用いて楽曲の選曲を行う選曲装置に関する。
従来、楽曲の音響信号からその楽曲の調性(調やスケール等)を判定することは、音楽知識を持った専門家によって行われていた。すなわち、専門家が楽曲を聴取して楽譜化(採譜)し、得られた楽譜から楽曲の調性を判定することが一般的であった。
また、音響信号から楽曲の調性を自動的に算出することも考えられている(例えば、特許文献1参照)。特許文献1に記載の自動採譜装置では、上述のような音楽の専門化が行う調性判定のプロセスの一部を自動化している。具体的には、この自動採譜装置は、楽曲の音響信号を分析した結果から音符情報および和音候補を算出し、算出した和音候補の出現頻度に基づいて楽曲の調性を決定する。
特開平5−173557号公報
上記の自動採譜装置では、楽曲の音響信号を周波数分析することによって、音響信号の基本周波数、すなわちピッチを楽器音毎に推定して音符および和音候補を算出している。ここで、調性を判定する対象となる楽曲には、例えばポピュラー音楽のように、多数の楽器音から構成されているものがある。このような楽曲では、多数の楽器音が同時に発音されていたり、また、ドラムのように、ピッチが明確に現れない楽器の音が部分的に出現していたりする場合がある。したがって、このような楽曲について調性を判定する場合、従来の自動採譜装置では、抽出対象となる楽器音のピッチが他の楽器音によってマスキングされてしまい、音響信号から音符情報を正確に得ることができないおそれがある。正確な音符情報を得ることができなければ、和音候補も正確に算出することができず、調性を正しく算出することができない。以上のように、従来の自動採譜装置では、複数の楽器音が含まれる楽曲については、調性を正しく算出することができないおそれがあった。
それ故、本発明の目的は、複数の楽器音が含まれる楽曲に対しても正確に調性を判定することが可能な楽曲調性判定装置を提供することである。
上記課題を解決するために、本発明は以下の構成を採用した。
すなわち、第1の発明は、楽曲の調性を算出する楽曲調性算出装置である。楽曲調性算出装置は、抽出部と、ベクトル算出部と、頻度算出部と、調性算出部とを備えている。抽出部は、ベース音を含む2以上の楽器音で構成される楽曲の音響信号から、ベース音を含む帯域の信号を抽出する。ベクトル算出部は、抽出された信号について、各音名に相当する周波数におけるパワー値を要素とする音名ベクトルを算出する。頻度算出部は、音名ベクトルを用いて各音名の出現頻度を算出する。調性算出部は、出現頻度に基づいて楽曲の調性を算出する。
また、第2の発明においては、ベクトル算出部は、抽出された信号の所定時間分の長さ毎に音名ベクトルを算出してもよい。このとき、頻度算出部は、ベクトル算出部によって算出された複数の音名ベクトルを用いて各音名の出現頻度を算出する。
また、第3の発明においては、楽曲調性算出装置は、ベクトル選出部をさらに備えていてもよい。ベクトル選出部は、各要素のうちで値の大きさがn番目(nは所定の自然数)となる要素の値が所定値よりも小さい音名ベクトルを複数の音名ベクトルから選出する。頻度算出部は、ベクトル選出部によって選出された音名ベクトルのみを用いて各音名の出現頻度を算出する。
また、第4の発明においては、ベクトル選出部は、ソート部と、正規化部と、比較部と、特定部とを含んでいてもよい。ソート部は、ベクトル算出部によって算出された各音名ベクトルについて、音名ベクトルの各要素をパワーの大きい順にソートする。正規化部は、ソート部によるソート後の各音名ベクトルについて、音名ベクトルの各要素の値をその値が最大の要素の値で正規化する。比較部は、正規化部によって正規化された各音名ベクトルについて、n番目となる要素の値と所定値とを比較する。特定部は、比較部による比較の結果、n番目となる要素の値が所定値よりも小さい音名ベクトルを、選出すべき音名ベクトルとして特定する。
また、第5の発明は、複数の楽曲から選曲を行う選曲装置である。選曲装置は、調性算出部と、楽曲データ格納部と、要件受付部と、テーブル格納部と、変換部と、検索部と、出力部とを備えている。調性算出部は、複数の楽曲について楽曲の音響信号を用いて調性を算出する。楽曲データ格納部は、調性算出部によって調性が算出された楽曲について、楽曲の音響信号を示す楽曲データと当該調性を示す調性データとを関連付けて格納する。要件受付部は、選曲を行う要件を受け付ける。テーブル格納部は、選曲を行う要件とその要件に適合する調性を示す調性データとを関連付けたテーブルを格納する。変換部は、要件入力部で受け付けられた要件を、テーブルにおいて関連付けられている調性データに変換する。検索部は、変換部によって変換された調性データに合致する調性データと関連付けられている楽曲データの楽曲を楽曲データ格納部に格納されている楽曲の中から検索する。出力部は、検索部の検索結果として得られた楽曲に関する情報を出力する。ここで、調性算出部は、抽出部と、ベクトル算出部と、頻度算出部と、調性算出部とを含んでいる。抽出部は、ベース音を含む2以上の楽器音で構成される楽曲の音響信号から、ベース音を含む帯域の信号成分を抽出する。ベクトル算出部は、抽出された信号成分に基づいて、各音名に相当する周波数における当該信号成分のパワー値を要素とする音名ベクトルを算出する。頻度算出部は、音名ベクトルを用いて各音名の出現頻度を算出する。調性算出部は、出現頻度に基づいて楽曲の調性を算出する。
なお、本発明は、上記楽曲調性算出装置の機能を有する回路によって提供されてもよいし、上記楽曲調性算出装置における楽曲調性算出方法として提供されてもよい。さらに、本発明は、上記楽曲調性算出方法をコンピュータに実行させるためのプログラムまたはそれを記録した記録媒体として提供されてもよい。
本発明の楽曲調性算出装置によれば、一般的に調性を強く反映していると考えられるベース音の旋律で調性を判定することができるので、複数の楽器音が混在するような楽曲についても楽曲の調性を正確に算出することができる。また、ベース音は他の楽器音から分離しやすいので、ベース音以外の楽器音を容易に除去することができる。
また、楽曲調性算出装置がベクトル選出部をさらに備える場合には、ベース音の音階を正しく反映していない音名ベクトルは、楽曲の調性の判定に用いられない。つまり、楽曲の調性の判定を行うために適切な音名ベクトルのみが用いられるので、楽曲の調性をより正確に判定することができる。
また、本発明の選曲装置によれば、楽曲の音響信号からその楽曲の調性を自動的に抽出することができ、ユーザが楽曲を事前に聴取して調性を入力するといった分類作業を行わなくとも、ユーザのイメージに合った楽曲を正確に選曲することができる。
(実施の形態1)
図1は、本発明の実施の形態1に係る楽曲調性算出装置の構成を示すブロック図である。本楽曲調性算出装置は、周波数分析部11、抽出部12、ベクトル算出部13、ベクトル選出部14、頻度算出部15、および調性算出部16を備えている。本楽曲調性算出装置は、処理対象となる楽曲の音響信号を入力し、入力した音響信号から当該楽曲の調性(調やスケール等)を算出するものである。
なお、図1に示す各部は、パーソナルコンピュータのCPUが所定のプログラムを実行することによって実現されてもよいし、各部の機能を有する専用回路(例えば、集積回路)によって実現されてもよい。また、専用回路をチップ化してコンポ等のオーディオ機器に内蔵することによって楽曲調性算出装置を実現するようにしてもよい。
以下、実施の形態1に係る楽曲調性算出装置の動作を説明する。図2は、楽曲調性算出装置における処理の流れを示すフローチャートである。図2に示すフローチャートは、処理対象となる楽曲の音響信号が周波数分析部11に入力されることによって開始される。まずステップS1において、周波数分析部11は、入力された音響信号に対して周波数分析を行う。具体的には、周波数分析部11は、入力された音響信号について、所定時間分の長さ(1フレーム)の信号毎にFFT(高速フーリエ変換)を行う。実施の形態1では、サンプリング周波数を16kHzとし、処理フレーム長を4096サンプル(256ms)とし、シフトフレーム長を1280サンプル(80ms)として、FFTによって周波数分析処理を行う。これによって、入力される音響信号について80ms毎に、0Hzから8kHzまで3.9Hz間隔の各周波数帯域に含まれる信号パワーが算出される。ステップS1における周波数分析の結果得られた周波数スペクトラムは、抽出部12へ出力される。
ステップS2において、抽出部12は、周波数分析部11で周波数分析が行われた信号のうち、予め定めた上限周波数までの周波数帯域の信号を抽出する。すなわち、周波数分析部11によって得られた周波数スペクトラムから、上限周波数より高い周波数の成分を除去する。ここで、上限周波数は、ベース音を含む周波数帯域を通過させる値に設定される。つまり、抽出部12は、ベース音を含む2以上の楽器音で構成される楽曲の音響信号から、ベース音を含む周波数帯域の信号を抽出する。実施の形態1では、上限周波数は、ベース音の信号成分が主に含まれる周波数帯域である440Hzとする。抽出部12は、入力される信号のうちの440Hz以下の周波数帯域の信号のみを例えばローパスフィルタによって通過させる。また、抽出部12は、抽出処理を各フレームの信号毎に行う。ステップS2で上限周波数以下の周波数成分に制限された周波数スペクトラムは、ベクトル算出部13へ出力される。
なお、実施の形態1において複数の楽器音からベース音を抽出する理由は主に2つある。1つ目の理由は、ベース音の周波数成分は低域に偏っていることが一般的であるので、ベース音は他の楽器音から分離しやすいことである。これに対して、例えば、メロディとなるボーカル音の周波数成分は中低域に分布するので他の楽器音の周波数成分と重なるおそれがあり、メロディの音は他の楽器音から分離しにくいと考えられる。2つ目の理由は、ベースの旋律は他の楽器の旋律と比べて調性を強く反映していると考えられることである。つまり、ベースの旋律から調性を正確に判定することができるからである。
ステップS3において、ベクトル算出部13は、抽出部12によって上限周波数以下の周波数が抽出された信号について音名ベクトル(クロマベクトル)を算出する。ここで、音名ベクトルとは、音響信号のパワースペクトラムを周波数軸の代わりに音名で表したものである。つまり、音名ベクトルは、各音名に相当する周波数における音響信号のパワー値を各要素とするベクトルである。なお、実施の形態1では、音階を平均律とし、平均律の12音階(C〜B)の各音名に相当する周波数帯域の信号成分のパワーを12個の要素とするベクトルを音名ベクトルとする。
ステップS3の具体的な処理として、ベクトル算出部13は、まず第1処理を行った後で第2処理を行う。すなわち、まず、第1処理として、抽出部12から出力された周波数スペクトラムを、音階毎のパワーを示す周波数スペクトラムに変換する。ここで、上述のように、抽出部12から出力された周波数スペクトラムは、3.9Hz間隔で分けられた各周波数帯域に含まれる信号パワーを示しており、周波数スペクトラムをリニアスケールで表現した信号である。第1処理は、このようにリニアスケールで表現される周波数スペクトラムをログスケールに変換する処理である。図3は、周波数が110Hz〜415.3Hzの各音階の中心周波数を示す図である。ベクトル算出部13は、抽出部12から出力された周波数スペクトラムを、図3に示す各音階の中心周波数を含む周波数帯域に含まれる信号パワーを示す周波数スペクトラムに変換する。これによって、各音階名の周波数帯域における信号パワーを示す周波数スペクトラムが得られる。なお、この変換処理は、隣接する周波数帯域の線形補完等によって行われる。
次に第2処理として、ベクトル算出部13は、各音階のパワーを示す周波数スペクトラムから各音名のパワーを算出する。具体的には、各音階のパワーを示す周波数スペクトラムについて、音名毎、つまりオクターブ関係にある音階毎にパワーを加算する。例えば、図3に示す音階名A1とA2とはオクターブ関係にある同一の音名であるので、ベクトル算出部13は、音階名A1の周波数帯域の信号パワーと、音階名A2の周波数帯域の信号パワーとを加算する。他の11個の音名についても同様の加算処理を行うことによって、12個の各音名のパワーを示す音名ベクトルを得ることができる。また、上記第1処理および第2処理は、各フレームの信号毎に行われる。これによって、音名ベクトルは各フレームについて1つずつ算出される。
ステップS4において、ベクトル選出部14はベクトル選出処理を行う。ベクトル選出処理は、ステップS3で算出された音名ベクトルのうち、調性の判定に用いることが適切な音名ベクトルを選出する処理である。以下、ベクトル選出処理の詳細を図4〜図6を用いて説明する。
図4は、ベクトル選出部14の詳細な構成を示すブロック図である。図4において、ベクトル選出部14は、ソート部21、正規化部22、比較部23、および特定部24を備えている。ソート部21には、ステップS3でベクトル算出部13によって算出された各音名ベクトルが入力される。図5は、図2のステップS14の詳細な処理の流れを示すフローチャートである。まず、ステップS11において、ソート部21は、ベクトル算出部13によって算出された各音名ベクトルのうちの1つを選択する。具体的には、音響信号における時間が前のフレームに対応する音名ベクトルから順に選択される。続くステップS12において、ソート部21は、選択した音名ベクトルの12個の各要素を値(すなわち、信号パワー)の大きい順にソートする。ソートされた各要素には、値が大きいものから順に1から12までの要素番号が付される。ステップS11で各要素がソートされた音名ベクトルは、ソート部21から正規化部22へ出力される。
ステップS13において、正規化部22は、ソート部21から出力された音名ベクトルを、各要素のうちで値が最大の要素の値で正規化する。すなわち、当該最大の要素の値が基準値(ここでは、1とする)となり、かつ、各要素について変換前の値と変換後の値との割合が一定となるように、各要素の値を変換する。ステップS13で正規化された音名ベクトルは、正規化部22から比較部23へ出力される。
ステップS14において、比較部23は、ステップS13で正規化された音名ベクトルが、調性の判定に用いることが適切な音名ベクトルであるか否かを判定する。ここで、「調性の判定に用いることが適切な音名ベクトル」とは、ベース音が明確に出現している音名ベクトルである。ベース音は通常単音で演奏されるので、ベース音が明確に出現している場合には音名ベクトル中のある特定の音名において強いピークが出現する。したがって、調性の判定に用いることが適切な音名ベクトルを選出するためには、音名ベクトル中のある特定の音名において強いピークが出現している音名ベクトルを選出すればよい。図6は、正規化部22によって正規化された音名ベクトルの2つの例を示す図である。図6に示すグラフの横軸は音名ベクトルの各要素の要素番号を示し、縦軸は各要素の値を示している。図6において、音名ベクトルAは、要素番号が1である要素の値と他の要素の値とのレベル差が大きく、要素番号が大きくなるにつれて値が急峻に収束している。つまり、音名ベクトル中のある特定の音名(要素番号が“1”である要素に対応する音名)において強いピークが出現している。したがって、音名ベクトルAは、調性の判定に用いることが適切な音名ベクトルであると言える。一方、音名ベクトルBは、要素番号が“1”である要素の値と要素番号が“2”や“3”である要素の値とのレベル差が小さく、要素番号が大きくなるにつれて値がなだらかに収束している。したがって、音名ベクトル中のある特定の音名(要素番号が“1”である要素に対応する音名)において強いピークが出現しているとは言えず、音名ベクトルBは、調性の判定に用いることが不適切な音名ベクトルである。
実施の形態1では、上記ステップS14において、所定の要素の値と予め定めた所定のしきい値とを比較することによって、音名ベクトル中のある特定の音名において強いピークが出現しているか否か、すなわち、調性の判定に用いることが適切な音名ベクトルであるか否かを判定する。具体的には、比較部23は、正規化部22から出力された音名ベクトルの所定の要素の値と予め定めた所定のしきい値とを比較し、当該所定の要素の値が所定のしきい値を越えているか否かを判定する。ここで、所定の要素とは、音名ベクトルの各要素のうちで値の大きさがn番目(nは所定の自然数)の要素である。なお、実施の形態1では、要素番号が“THL_NUM(=5)”である要素の値と、所定のしきい値THL_VECとを比較する。例えば、図6に示す音名ベクトルAは、要素番号が“THL_NUM”である要素の値は、しきい値THL_VECよりも大きい。したがって、音名ベクトルAは、特定の音名において強いピークが出現していない、すなわち、調性の判定に用いることが不適切な音名ベクトルであると判定される。一方、音名ベクトルBは、要素番号が“THL_NUM”である要素の値は、しきい値THL_VECよりも大きい。したがって、音名ベクトルBは、特定の音名において強いピークが出現している、すなわち、調性の判定に用いることが適切な音名ベクトルであると判定される。
ステップS14における判定の結果、所定の要素の値が所定のしきい値を越えていると判定される場合、ステップS15の処理が行われる。一方、ステップS14における判定の結果、所定の要素の値が所定のしきい値を越えていないと判定される場合、ステップS16の処理が行われる。ステップS14の判定結果は、比較部23から特定部24へ出力される。
ステップS15において、特定部24は、ステップS11で選択された音名ベクトルを、調性の判定に用いることが不適切な音名ベクトルに設定する。一方、ステップS16においては、特定部24は、ステップS11で選択された音名ベクトルを、調性の判定に用いることが適切な音名ベクトルに設定する。ステップS15またはS16で音名ベクトルに設定された情報(適切であるか不適切であるかを示す情報。以下、適合情報と呼ぶ。)は、特定部24から頻度算出部15へ出力される。なお、音響信号のフレーム毎に算出された音名ベクトルには識別番号が付されるものとし、当該識別番号と適合情報とが関連付けられて特定部24から頻度算出部15へ出力される。
ステップS17において、特定部24は、すべての音名ベクトルについて適合情報が設定されたか否かを判定する。適合情報が設定されていない音名ベクトルが存在する場合、ステップS11の処理に戻り、すべての音名ベクトルについて適合情報が設定されるまでステップS11〜S17の処理を繰り返す。一方、すべての音名ベクトルについて適合情報が設定された場合、ベクトル選出処理が終了される。
図2に戻り、ステップS4の次のステップS5においては音名頻度算出処理が行われる。音名頻度算出処理とは、調性の判定に用いることが適切な音名ベクトルから音名頻度を算出する処理である。音名頻度とは、楽曲中において各音名が出現する頻度のことであり、音名頻度から楽曲の調性を算出することが可能である。以下、音名頻度算出処理の詳細を図7および図8を用いて説明する。
図7は、図2に示すステップS5の処理の詳細を示すフローチャートである。頻度算出部15には、ステップS3でベクトル算出部13によって算出された各音名ベクトルが入力される。まずステップS21において、頻度算出部15は、音名毎に用意されるカウンタの値を0に設定する。ここで、頻度算出部15には、各音名に対応する12個のカウンタが予め用意されている。続くステップS22において、頻度算出部15は、ステップS3で算出された音名ベクトルのうちの1つを選択する。このとき、音響信号における時間が前のフレームに対応する音名ベクトルから順に選択される。
ステップS23において、頻度算出部15は、ステップS22で選択した音名ベクトルが、調性の判定に用いることが適切な音名ベクトルであるか否かを判定する。ステップS23の判定は、ステップS15またはS16で設定された適合情報に基づいて行われる。ステップS23の判定において適切な音名ベクトルであると判定された場合、ステップS24の処理が行われる。すなわち、ステップS24において、頻度算出部15は、カウンタの値を加算する処理を行う。具体的には、ステップS22で選択された音名ベクトルの各要素のうちで値が最大の要素により示される音名を特定し、特定された音名に対応するカウンタの値を1加算する。一方、ステップS23の判定において不適切な音名ベクトルであると判定された場合、ステップS24の処理がスキップされてステップS25の処理が行われる。
ステップS25において、頻度算出部15は、ステップS22においてすべての音名ベクトルを選択したか否かを判定する。選択していない音名ベクトルが存在する場合、ステップS22の処理に戻り、すべての音名ベクトルを選択するまでステップS22〜S25の処理を繰り返す。一方、ステップS22においてすべての音名ベクトルを選択した場合、ステップS26の処理が行われる。
ステップS26において、頻度算出部15は、各カウンタの値を正規化する。すなわち、各カウンタうちの最大値を基準値(ここでは、1とする)とし、かつ、各カウンタについて変換前の値と変換後の値との割合が一定となるように、各カウンタの値を変換する。この変換によって得られる各カウンタ値が音名頻度となる。図8は、正規化された音名頻度を示す情報の一例を示す図である。図8では、音名“C”の出現頻度が最も高くなっている。頻度算出部15によって算出された音名頻度を示す情報は、調性算出部16へ出力される。以上のステップS26の完了により、音名頻度算出処理が終了される。
再び図2に戻り、ステップS5の次のステップS6において、調性算出部16は、ステップS5で算出された音名頻度に基づいて楽曲の調性を算出する。なお、音名頻度から楽曲の調性を算出する方法はどのような方法であってもよい。調性を算出する方法の一例として、例えば、特開昭63−80299号公報に記載されている方法がある。具体的には、この方法では重み付け表を予め用意しておき、音名頻度と重み付け表との積和を、1オクターブ12通りのそれぞれにつき長調および短調の両方について算出する(つまり24通りの積和計算を行う)。そして、算出された積和の値が最大になる音階および調を楽曲の調性として出力する。例えば、ある楽曲について図8に示す音名頻度が算出されたとすると、調性算出部16において、この楽曲は「ハ長調(Cmajor)」である、すなわち、長調でスケールは“C”であると算出される。なお、調性を算出する方法の他の例としては、理想的な音名頻度を示すテンプレートを調性毎に用意しておき、ステップS5で算出された音名頻度と各テンプレートを比較し、最も類似するテンプレートの調性を楽曲の調性とする方法がある。以上のステップS6の完了により、図2に示す処理が終了される。
以上のように、実施の形態1に係る楽曲調性算出装置によれば、楽曲の音響信号のベース音域に着目し、ベース音域について音名ベクトルを算出する。そして、音名ベクトルに基づいて楽曲の調性を算出する。したがって、一般的に調性を強く反映していると考えられるベース音の旋律で調性を判定することができるので、複数の楽器音が混在するような楽曲についても楽曲の調性を正確に算出することができる。また、ベース音は他の楽器音から分離しやすいので、抽出部12によってベース音以外の楽器音を容易に除去することができる。
さらに、実施の形態1に係る楽曲調性算出装置によれば、ベクトル選出部14において、明確にベース音の音階が現れている部分(フレーム)から算出される音名ベクトルを用いて調性の判定が行われる。ここで、抽出部12によって周波数帯域が制限された信号には、ベース音以外の楽器音が含まれているおそれがあり、他の楽器音が含まれているフレームから算出される音名ベクトルは、ベース音の音階を正しく反映していないおそれがある。したがって、このような音名ベクトルが楽曲の調性を判定するための音名ベクトルに含まれていると、楽曲の調性を正確に算出することができないおそれがある。これに対して、実施の形態1に係る楽曲調性算出装置によれば、ベース音の音階を正しく反映していない音名ベクトルは、不適切な音名ベクトルと判定される(ステップS15)結果、楽曲の調性の判定に用いられない。つまり、楽曲の調性の判定を行うために適切な音名ベクトルのみが用いられるので、楽曲の調性をより正確に判定することができる。
なお、実施の形態1においては、周波数分析部11による周波数分析を行った後、ベース音の周波数帯域を抽出するようにした。ここで、他の実施形態においては、抽出部12は、周波数分析前の音響信号を入力し、当該音響信号から図2に示す各音階の中心周波数を含む周波数帯域を抽出するバンドパスフィルタ群によって構成されてもよい。すなわち、抽出部12は、その通過帯域が音階の中心周波数をそれぞれ1つずつ含む複数のバンドパスフィルタとして構成されてもよい。また、このとき、ベクトル算出部13は、各バンドパスフィルタからの出力信号のパワーを音名ベクトルの各要素の値とする。
また、実施の形態1においては、楽曲の1曲全体の音響信号を入力し、1曲全体を対象として調性を算出した。ここで、他の実施形態においては、楽曲の一部、例えば楽曲の前半半分の部分やサビの部分等のみを対象として調性を算出してもよい。すなわち、楽曲調性算出装置は、楽曲の一部のみの音響信号を入力し、入力された音響信号から算出される音名ベクトルを用いて音名頻度を算出するようにしてもよい。
なお、実施の形態1に係る楽曲調性算出装置の出力結果(すなわち、調性の情報)は、例えば次のようにして用いることができる。すなわち、算出された調性の情報を表示装置に表示させることによって、楽曲の調性をユーザに提示することができる。また、例えば、予めデータが格納されている楽曲について調性を算出し、算出した調性の情報を当該楽曲のデータとともに格納することによって、調性の情報を楽曲の検索に用いることができる(後述する実施の形態2参照)。
(実施の形態2)
以下、実施の形態2に係る選曲装置について説明する。図9は、実施の形態2に係る選曲装置の構成を示すブロック図である。図9において、選曲装置は、楽曲データ格納部51、楽曲調性算出部52、要件受付部53、テーブル格納部54、変換部55、検索部56、および出力部57を備えている。本選曲装置は、実施の形態1に係る楽曲調性算出装置を用いて調性を判定した複数の楽曲から、ユーザの印象に合った楽曲を選出するものである。以下、各部の動作の詳細について説明する。
楽曲データ格納部51は、楽曲の音響信号データ、例えばPCM形式で符号化された音響信号データを格納する。また、楽曲データ格納部51には、楽曲の音響信号データと関連付けて、楽曲の属性情報が格納される。属性情報には、例えば調情報(長調/短調)およびスケール情報(C#等)といった調性情報、および、楽曲名やアーティスト名等の楽曲の書誌情報が含まれる。
楽曲調性算出部52は、実施の形態1に係る楽曲調性算出装置と同じ機能を有する。すなわち、楽曲調性算出部52は、楽曲の音響信号を入力し、その楽曲の調性、すなわち長調/短調およびスケール情報を算出する。実施の形態2においては、楽曲調性算出部52は、楽曲データ格納部51に格納されているすべての楽曲について調性を予め算出し、算出した結果を楽曲データ格納部51に格納しておく。
要件受付部53は、楽曲データ格納部51に格納されている楽曲を選曲する要件(選曲要件)を受け付ける。要件受付部53は、具体的には、キーボードやスイッチ等の入力デバイスによって構成される。なお実施の形態2においては、選曲要件は、例えば、「悲しい曲」や「楽しい曲」のように、楽曲の印象を表す語句であるとする。すなわち、ユーザは、「悲しい曲」のようにキーボードから文字列を入力したり、あるいは、予め用意された「悲しい曲ボタン」を押下したりすることによって、選曲を希望する楽曲に合った選曲要件を入力する。
テーブル格納部54は、上記選曲要件と調性データとを関連付けた選曲テーブルを格納する。図10は、選曲テーブルの一例を示す図である。図10に示すように、選曲テーブルには、選曲要件と、当該選曲要件に合致する調性を示す調性データとが関連付けられている。選曲要件とは、上述したように、「楽しい曲」や「悲しい曲」といった、楽曲の印象を表す語句である。調性データは、調性(調および/またはスケール)を示すデータであり、例えば、「長調」のように調を示すものであってもよいし、「調が“長調”であり、かつスケールが“C”」のように、調およびスケールを示すものであってもよい。
変換部55は、要件受付部53で受け付けられた選曲要件を、調性データに変換する。すなわち、変換部55は、選曲要件を、楽曲データ格納部51に格納されている楽曲を検索可能な形式に変換する。変換部55による変換は、上記選曲テーブルを用いて行われる。例えば、要件受付部53において「悲しい曲」という選曲要件が入力されると、変換部55は、図10に示す選曲テーブルを参照することによって、「悲しい曲」を、それに関連付けられた調性データである「短調」に変換する。
検索部56は、変換部55で変換された調性データに合致する調性を有する楽曲を楽曲データ格納部51の中から検索する。上記の例では、「短調」という属性が記録されている楽曲を楽曲データ格納部51から検索する。
出力部57は、表示装置やスピーカ等によって構成され、検索部56による検索結果を出力する。具体的には、検索結果の楽曲の楽曲名をディスプレイ上に表示したり、楽曲をスピーカによって再生したりする。
以上のように、実施の形態2によれば、ユーザは、楽曲のイメージを表す選曲要件を入力することによって楽曲の検索を行うことができるので、ユーザのイメージに合った楽曲を検索することができる。また、楽曲の調性データは楽曲調性算出部52によって予め算出されるので、ユーザが楽曲を聴取して調性を入力する等の分類作業を行わなくとも、ユーザのイメージに合った楽曲を正確に選曲することができる。
本発明に係る楽曲調性算出装置は、楽曲の調性を自動的に算出することが可能であるので、楽曲の選曲装置において楽曲の属性情報を自動的に付与したり、算出された調性を用いて自動採譜を行ったりすること等に利用することができる。
また、本発明に係る選曲装置は、楽曲を自動的に分類して選曲することができるので、車載用オーディオ再生装置、携帯用オーディオ再生装置、家庭用オーディオ再生装置等において利用することができる。
実施の形態1に係る楽曲調性算出装置の構成を示すブロック図 楽曲調性算出装置における処理の流れを示すフローチャート 周波数が110Hz〜415.3Hzの各音階の中心周波数を示す図 ベクトル選出部14の詳細な構成を示すブロック図 図2のステップS14の詳細な処理の流れを示すフローチャート 正規化部22によって正規化された音名ベクトルの2つの例を示す図 図2に示すステップS5の処理の詳細を示すフローチャート 正規化された音名頻度を示す情報の一例を示す図 実施の形態2に係る選曲装置の構成を示すブロック図 選曲テーブルの一例を示す図
符号の説明
11 周波数分析部
12 抽出部
13 ベクトル算出部
14 ベクトル選出部
15 頻度算出部
16 調性算出部
21 ソート部
22 正規化部
23 比較部
24 特定部
51 楽曲データ格納部
52 楽曲調性算出部
53 要件受付部
54 テーブル格納部
55 変換部
56 検索部
57 出力部

Claims (9)

  1. 楽曲の調性を算出する楽曲調性算出装置であって、
    ベース音を含む2以上の楽器音で構成される楽曲の音響信号から、ベース音を含む帯域の信号を抽出する抽出部と、
    前記抽出された信号について、各音名に相当する周波数におけるパワー値を要素とする音名ベクトルを算出するベクトル算出部と、
    前記音名ベクトルを用いて各音名の出現頻度を算出する頻度算出部と、
    前記出現頻度に基づいて楽曲の調性を算出する調性算出部とを備える、楽曲調性算出装置。
  2. 前記ベクトル算出部は、前記抽出された信号の所定時間分の長さ毎に前記音名ベクトルを算出し、
    前記頻度算出部は、前記ベクトル算出部によって算出された複数の音名ベクトルを用いて各音名の出現頻度を算出する、請求項1に記載の楽曲調性算出装置。
  3. 各要素のうちで値の大きさがn番目(nは所定の自然数)となる要素の値が所定値よりも小さい音名ベクトルを前記複数の音名ベクトルから選出するベクトル選出部をさらに備え、
    前記頻度算出部は、前記ベクトル選出部によって選出された音名ベクトルのみを用いて各音名の出現頻度を算出する、請求項2に記載の楽曲調性算出装置。
  4. 前記ベクトル選出部は、
    前記ベクトル算出部によって算出された各音名ベクトルについて、音名ベクトルの各要素をパワーの大きい順にソートするソート部と、
    前記ソート部によるソート後の各音名ベクトルについて、音名ベクトルの各要素の値をその値が最大の要素の値で正規化する正規化部と、
    前記正規化部によって正規化された各音名ベクトルについて、前記n番目となる要素の値と前記所定値とを比較する比較部と、
    前記比較部による比較の結果、前記n番目となる要素の値が前記所定値よりも小さい音名ベクトルを、選出すべき音名ベクトルとして特定する特定部とを含む、請求項3に記載の楽曲調性算出装置。
  5. 複数の楽曲から選曲を行う選曲装置であって、
    複数の楽曲について楽曲の音響信号を用いて調性を算出する調性算出部と、
    前記調性算出部によって調性が算出された楽曲について、楽曲の音響信号を示す楽曲データと当該調性を示す調性データとを関連付けて格納する楽曲データ格納部と、
    選曲を行う要件を受け付ける要件受付部と、
    選曲を行う要件とその要件に適合する調性を示す調性データとを関連付けたテーブルを格納するテーブル格納部と、
    前記要件入力部で受け付けられた要件を、前記テーブルにおいて関連付けられている調性データに変換する変換部と、
    前記変換部によって変換された調性データに合致する調性データと関連付けられている楽曲データの楽曲を前記楽曲データ格納部に格納されている楽曲の中から検索する検索部と、
    前記検索部の検索結果として得られた楽曲に関する情報を出力する出力部とを備え、
    前記調性算出部は、
    ベース音を含む2以上の楽器音で構成される楽曲の音響信号から、ベース音を含む帯域の信号成分を抽出する抽出部と、
    前記抽出された信号成分に基づいて、各音名に相当する周波数における当該信号成分のパワー値を要素とする音名ベクトルを算出するベクトル算出部と、
    前記音名ベクトルを用いて各音名の出現頻度を算出する頻度算出部と、
    前記出現頻度に基づいて楽曲の調性を算出する調性算出部とを含む、選曲装置。
  6. 楽曲の調性を算出する楽曲調性算出回路であって、
    ベース音を含む2以上の楽器音で構成される楽曲の音響信号を入力し、ベース音を含む帯域の信号を抽出する抽出部と、
    前記抽出された信号について、各音名に相当する周波数におけるパワー値を要素とする音名ベクトルを算出するベクトル算出部と、
    前記音名ベクトルを用いて各音名の出現頻度を算出する頻度算出部と、
    前記出現頻度に基づいて楽曲の調性を算出する調性算出部とを備える、楽曲調性算出回路。
  7. 楽曲の調性を算出する楽曲調性算出方法であって、
    ベース音を含む2以上の楽器音で構成される楽曲の音響信号から、ベース音を含む帯域の信号を抽出する抽出ステップと、
    前記抽出された信号について、各音名に相当する周波数におけるパワー値を要素とする音名ベクトルを算出するベクトル算出ステップと、
    前記音名ベクトルを用いて各音名の出現頻度を算出する頻度算出ステップと、
    前記出現頻度に基づいて楽曲の調性を算出する調性算出ステップとを備える、楽曲調性算出方法。
  8. 楽曲の調性を算出する楽曲調性算出装置のコンピュータに実行させるためのプログラムであって、
    ベース音を含む2以上の楽器音で構成される楽曲の音響信号から、ベース音を含む帯域の信号を抽出する抽出ステップと、
    前記抽出された信号について、各音名に相当する周波数におけるパワー値を要素とする音名ベクトルを算出するベクトル算出ステップと、
    前記音名ベクトルを用いて各音名の出現頻度を算出する頻度算出ステップと、
    前記出現頻度に基づいて楽曲の調性を算出する調性算出ステップとを前記コンピュータに実行させる、プログラム。
  9. 請求項8に記載のプログラムを記録した、コンピュータ読み取り可能な記録媒体。
JP2005009561A 2005-01-17 2005-01-17 楽曲調性算出装置および選曲装置 Withdrawn JP2006195384A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005009561A JP2006195384A (ja) 2005-01-17 2005-01-17 楽曲調性算出装置および選曲装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005009561A JP2006195384A (ja) 2005-01-17 2005-01-17 楽曲調性算出装置および選曲装置

Publications (1)

Publication Number Publication Date
JP2006195384A true JP2006195384A (ja) 2006-07-27

Family

ID=36801497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005009561A Withdrawn JP2006195384A (ja) 2005-01-17 2005-01-17 楽曲調性算出装置および選曲装置

Country Status (1)

Country Link
JP (1) JP2006195384A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008040283A (ja) * 2006-08-09 2008-02-21 Kawai Musical Instr Mfg Co Ltd コード名検出装置及びコード名検出用プログラム
JPWO2009104269A1 (ja) * 2008-02-22 2011-06-16 パイオニア株式会社 楽曲判別装置、楽曲判別方法、楽曲判別プログラム及び記録媒体
JP2018141899A (ja) * 2017-02-28 2018-09-13 株式会社Nttドコモ 楽器音認識装置及び楽器音認識プログラム
CN112435680A (zh) * 2019-08-08 2021-03-02 北京字节跳动网络技术有限公司 音频处理方法、装置、电子设备及计算机可读存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008040283A (ja) * 2006-08-09 2008-02-21 Kawai Musical Instr Mfg Co Ltd コード名検出装置及びコード名検出用プログラム
JPWO2009104269A1 (ja) * 2008-02-22 2011-06-16 パイオニア株式会社 楽曲判別装置、楽曲判別方法、楽曲判別プログラム及び記録媒体
JP2018141899A (ja) * 2017-02-28 2018-09-13 株式会社Nttドコモ 楽器音認識装置及び楽器音認識プログラム
CN112435680A (zh) * 2019-08-08 2021-03-02 北京字节跳动网络技术有限公司 音频处理方法、装置、电子设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
JP5282548B2 (ja) 情報処理装置、音素材の切り出し方法、及びプログラム
Cataltepe et al. Music genre classification using MIDI and audio features
JP4438144B2 (ja) 信号分類方法及び装置、記述子生成方法及び装置、信号検索方法及び装置
US9875304B2 (en) Music selection and organization using audio fingerprints
US20080300702A1 (en) Music similarity systems and methods using descriptors
CN112382257B (zh) 一种音频处理方法、装置、设备及介质
WO2004027646A1 (ja) 曲分類装置、曲分類方法、及びプログラム
JPH06290574A (ja) 楽曲検索装置
JP2010134290A (ja) 情報処理装置、メロディーライン抽出方法、ベースライン抽出方法、及びプログラム
JP5127982B2 (ja) 音楽検索装置
US20060075883A1 (en) Audio signal analysing method and apparatus
Osmalsky et al. Neural networks for musical chords recognition
JP2009210790A (ja) 選曲歌手分析推薦装置、その方法及びプログラム
KR101813704B1 (ko) 사용자 음색 분석 장치 및 음색 분석 방법
JP2000187671A (ja) ネットワ―クを利用した歌声による曲検索システム及び検索時に用いる歌声の入力端末装置
KR100512143B1 (ko) 멜로디 기반 음악 검색방법과 장치
Bergstra et al. Scalable Genre and Tag Prediction with Spectral Covariance.
JP2006195384A (ja) 楽曲調性算出装置および選曲装置
CN111859008A (zh) 一种推荐音乐的方法及终端
KR100702059B1 (ko) 고객 특성이 피드백 반영되는 질의 풀 기반의 유비쿼터스음악 정보 검색 시스템 및 방법
JP4722738B2 (ja) 楽曲分析方法及び楽曲分析装置
WO2019180830A1 (ja) 歌唱評価方法及び装置、プログラム
Jensen et al. Binary decision tree classification of musical sounds
Van Balen Automatic recognition of samples in musical audio
Sha et al. Singing voice timbre classification of Chinese popular music

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071127

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20080718