WO2009104269A1

WO2009104269A1 - 楽曲判別装置、楽曲判別方法、楽曲判別プログラム及び記録媒体

Info

Publication number: WO2009104269A1
Application number: PCT/JP2008/053031
Authority: WO
Inventors: 児玉泰輝; 莪山真一
Original assignee: パイオニア株式会社
Priority date: 2008-02-22
Filing date: 2008-02-22
Publication date: 2009-08-27
Also published as: JPWO2009104269A1; US20110011247A1

Abstract

　ユーザが望む楽曲及び楽曲情報を提供する楽曲判別装置、楽曲判別方法、楽曲判別プログラム及び記録媒体等を提供することを目的とする。　本願は、楽曲判別装置であって、システム制御部４は、楽曲データより楽曲が有するハーモニーに対応する音程パワー加算レベルを算出し、算出された音程パワー加算レベルに基いて、前記ハーモニーが聴感上明確に聞こえるか否かの度合いを示すハーモニー明瞭度を算出し、前記ハーモニー明瞭度を用いて、前記楽曲の曲調を判別する。

Description

楽曲判別装置、楽曲判別方法、楽曲判別プログラム及び記録媒体

　本願は、楽曲の曲調を判別することができる楽曲判別装置等の技術分野に関する。

　楽曲を検索する一つの手段として、楽曲の曲調を判別し、その曲調から楽曲を検索することが行われている。

　楽曲の曲調とは、楽曲を聴いた人間が感じるその楽曲に対する印象をいい、例えば、楽曲のスピード（テンポ）が早く、高い音で構成された楽曲は、明るく賑やかな曲調を示す。

　このように楽曲を曲調により特徴づけ、楽曲の検索に用いている。

　特許文献１では、楽曲が有する和音の種類を分類して楽曲の構成を解析する発明が開示されている。
特開平６－２９０５７４号公報

　しかし、楽曲に和音が用いられていても、他の激しく歪んだ音やリズム音（歪んだ音のエレキギター、ベース又はドラム等）も同時に用いられることによって、和音が明瞭に聞こえない場合がある。このような楽曲の曲調は、変化に富んでいて激しさや刺激的な印象をもつ。従って、楽曲に含まれる和音構成を指標に、楽曲の曲調を検索しても、ユーザの要望に合致した楽曲を選択することは出来なかった。

　また、特許文献１では、楽曲の和音構成の類似性を抽出することは出来ても、その楽曲の曲調までは知ることができない。従って、楽曲が有する和音構成をもとに、安らぎや落ち着きが与えられる楽曲を検索しようとしても、ユーザの要望に合致した楽曲を選択することは出来なかった。

　そこで、本願は、このような点の解消を課題の一つとし、ユーザが望む楽曲及び楽曲情報を提供する楽曲判別装置、楽曲判別方法、楽曲判別プログラム及び記録媒体等を提供することを目的とする。

　上記課題を解決するため、請求項１に記載の楽曲判別装置の発明は、入力された楽曲データから音程パワー加算レベルを算出する音程パワー加算レベル算出手段と、前記算出された音程パワー加算レベルに基いて、ハーモニーが聴感上明確に聞こえるか否かの度合いを示すハーモニー明瞭度を算出するハーモニー明瞭度算出手段と、前記ハーモニー明瞭度を用いて、前記楽曲の曲調を判別する曲調判別手段と、を備えることを特徴とする。

　請求項５に記載の曲調判別方法の発明は、入力された楽曲データから音程パワー加算レベルを算出する音程パワー加算レベル算出工程と、前記算出された音程パワー加算レベルに基いて、ハーモニーが聴感上明確に聞こえるか否かの度合いを示すハーモニー明瞭度を算出するハーモニー明瞭度算出工程と、前記ハーモニー明瞭度を用いて、前記楽曲の曲調を判別する曲調判別工程と、を備えることを特徴とする。

　請求項６に記載の楽曲判別プログラムの発明は、楽曲判別装置に含まれるコンピュータを、入力された楽曲データから音程パワー加算レベルを算出する音程パワー加算レベル算出手段、前記算出された音程パワー加算レベルに基いて、ハーモニーが聴感上明確に聞こえるか否かの度合いを示すハーモニー明瞭度を算出するハーモニー明瞭度算出手段、前記ハーモニー明瞭度を用いて、前記楽曲の曲調を判別する曲調判別手段、として機能させることを特徴とする。

ＦＦＴ変換後の楽曲データ（信号）及び音程パワー加算レベルＡＮＰ（ｐ）を示す図であり、（Ａ）はＦＦＴ変換後の楽曲データ（信号）を示す図であり、（Ｂ）は音程パワー加算レベルＡＮＰ（ｐ）を示す図である。楽曲データの一定時間における、各音程毎の音程パワー加算レベルの時間方向遷移を算出するイメージを示す図であり、（Ａ）-ｔ1は、微小時間ｔ1における各音程毎の音程パワー加算レベルを示す図であり、（Ａ）-ｔ２は、微小時間ｔ２における各音程毎の音程パワー加算レベルを示す図であり、（Ａ）－ｔは、微小時間ｔにおける各音程毎の音程パワー加算レベルを示す図である。楽曲データの一定時間における、各音程毎の音程パワー加算レベルを４つのパラメータを用いて示した図である。ハーモニー明瞭度（ＣＣＶ）の時間方向遷移を示す図である。楽曲データの一定時間における、各音程毎の音程パワー加算レベルの時間方向遷移を算出するイメージを示す図であり、（Ａ）-ｔ1は、微小時間ｔ1における各音程毎の音程パワー加算レベルを示す図であり、（Ａ）-ｔ２は、微小時間ｔ２における各音程毎の音程パワー加算レベルを示す図であり、（Ａ）－ｔは、微小時間ｔにおける各音程毎の音程パワー加算レベルを示す図である。楽曲データの一定時間における、各音程毎の音程パワー加算レベルを４つのパラメータを用いて示した図である。ハーモニー明瞭度（ＣＣＶ）の時間方向遷移を示す図である。情報再生装置Ｓの全体構成例を示すブロック図である。情報再生装置Ｓの動作を示すフローチャートである。ハーモニー明瞭度及び低域ビートレベルによる曲調判別を示すフローチャートである。楽曲Ａのハーモニー明瞭度及び低域ビートレベルの時系列変化を示す図である。楽曲Ｂのハーモニー明瞭度及び低域ビートレベルの時系列変化を示す図である。楽曲Ｃのハーモニー明瞭度及び低域ビートレベルの時系列変化を示す図である。楽曲Ｄのハーモニー明瞭度及び低域ビートレベルの時系列変化を示す図である。ハーモニー明瞭度及び低域ビートレベルを用いた曲調分類を示す図である。楽曲Ａにおいて、シグナルパワー（SignalPower）を約１００として再生した場合のハーモニー明瞭度及び低域ビートレベルの値を示す図である。シグナルパワー（SignalPower）を、半分の約５０程度まで下げた場合のハーモニー明瞭度及び低域ビートレベルの値を示す図である。楽曲Ａにおいて、シグナルパワー（SignalPower）を約２０として再生した場合のハーモニー明瞭度及び低域ビートレベルの値を示す図である。シグナルパワー（SignalPower）を、倍の約４０程度まで上げた場合のハーモニー明瞭度及び低域ビートレベルの値を示す図である。

符号の説明

　１　再生処理部
　２　外部出力部
　３　記憶部
　４　システム制御部
　５　通信部
　Ｓ　情報再生記録装置

　I）本願の原理について
　本願は、「ハーモニー明瞭度」を用いて、楽曲の曲調を判別することを提唱するものである。

　本願では、和音が聴感上明確に聞こえるか否かの度合いを示す指標として、「ハーモニー明瞭度」を定義する。

　一般に、ハーモニーが聴感上明瞭に聞こえる楽曲は、明瞭で美しい響きを有しており、それを聴く人間に安らぎと落ち着きを与える癒しの曲調を示し、ハーモニーが聴感上明瞭に聞こえない楽曲は、激しく迫力のある曲調を示すことが知られている。従って、本発明の発明者らは、ハーモニーが聴感上明瞭に聞こえるか否かによって、楽曲の曲調が異なることに着目し、ハーモニーが聴感上明確に聞こえるか否かの度合いを、「ハーモニー明瞭度」として定量化し、楽曲の曲調を示す新たな指標とし、ハーモニー明瞭度の示す値により楽曲の曲調を判別した。

　具体的には、ハーモニー明瞭度を定量化するために、楽曲データから各音程毎のパワー分布を算出し、算出されたパワー分布からハーモニー明瞭度等を算出し、算出されたハーモニー明瞭度等に基づいて楽曲の曲調を判別する。

　すなわち、入力された楽曲データに対して、ＦＦＴ変換等により所定帯域幅（Ｈｚ）の信号レベル（振幅）パワースペクトラムＦ（ｎ）を算出し、算出結果から、各音程（Ｈｚ）の音程パワーを算出する。そして、各音程の音程パワーを、1オクターブの範囲内において、重み付けして加算する、「音程パワー加算レベル」を算出する。

　そして、「音程パワー加算レベル」から、１オクターブ範囲内の偏差（算出された各音程の音程パワー加算レベルＡＮＰ（ｐ）の平均値との差）を算出する。

　以下、図１～図３を用いて、楽曲についてハーモニー明瞭度を算出した結果を具体的に述べる。まず、和音が聴感上明瞭に聞こえる楽曲について、ハーモニー明瞭度を算出する。この楽曲は、ピアノ、シンセサイザー又は弦楽器など、調波成分が際立つ楽器音が多く使用されており、聴感に明瞭さ、美しさ又は落ち着きを与え、ハーモニー（例えば、和音等）が耳にきれいに響く等の特色を有する。

　まず、音程パワーを算出するために、楽曲の楽曲データに対して、楽曲データにおけるある瞬間的な時間である微小時間（Δｔ）において、任意のポイント（本実施形態ではＮポイント）でＦＦＴ（Ｆａｓｔ　Ｆｏｕｒｉｅｒ　Ｔｒａｎｓｆｏｒｍ）変換を行う（以下、本実施形態におけるＦＦＴ変換結果を「ＮポイントのＦＦＴ」という）。ここで、ＦＦＴ変換とは、高速フーリエ変換のことであり、ある信号の中にどの周波数成分がどれだけ含まれているかを抽出する処理である。ＦＦＴ変換は公知の技術であるため詳しい説明は省略する。また、ポイントとは、楽曲データが有する全周波数成分において、所定帯域幅（Ｈｚ）で区切られた範囲のそれぞれを代表するポイントをいい、Ｎポイントとは、Ｎ個の所定帯域幅（Ｈｚ）で区切られた範囲において、それぞれの範囲を代表するポイントがＮ個あることを示す。

　図１（Ａ）はＦＦＴ変換後の楽曲データ（信号）を示す。横軸１０は、ＦＦＴ変換によって抽出された信号が属する周波数の範囲を、縦軸１１は、信号が周波数ごとに含んでいるエネルギーを示す、パワースペクトラムＦ（ｎ）をそれぞれ表す。

　次に、Ｍオクターブ範囲内で各音程の音程パワーを算出する。具体的には、変換されたＮポイントのＦＦＴが有する周波数範囲（Ｈｚ）に対して、任意の周波数範囲（Ｈｚ）を一つのオクターブとしたオクターブのグループに分け（本実施形態ではＭオクターブ）、グループに分けられたオクターブを更に任意のポイント（Ｈｚ）で分割し、分割したポイントを音程（Ｈｚ）とし、各音程における音程パワーを算出している。

　本実施形態では、ＮポイントのＦＦＴを、まず、任意の周波数範囲として周波数帯域２２０Ｈｚ～４２０Ｈｚを、一つのオクターブのグループに分け、このグループに分けられたオクターブを、任意のポイントとしてログスケール（周波数特性グラフにおけるスケール表示）において１２等分し、分割された各ポイントを音程とする。具体的には、２の１２乗根をｋとした場合、ある音程の周波数をｋ倍した値を次の音程の周波数とする。より詳しくは、音程Ａを２２０Ｈｚ、音程Ａ＃を２３３Ｈｚ(２２０＊ｋ)とし、音程Ｂを２４７Ｈｚ(２２０＊ｋ＾２)，音程Ｃを２６１Ｈｚ(２２０＊ｋ＾３)，音程Ｃ＃、音程Ｄ、音程Ｄ＃，音程Ｅ，音程Ｆ，音程Ｆ＃、音程Ｇとし、最後の音程Ｇ＃を４１５Ｈｚ(２２０＊ｋ＾１１)としている。同様にして、オクターブ２の音程Ａは４４０Ｈｚ(２２０＊ｋ＾１２＝２２０＊２)となり、順次、音程Ａ＃を４６６Ｈｚ(４４０＊ｋ)とし、音程Ｂを４９４Ｈｚ(４４０＊ｋ＾２)，音程Ｃを５２３Ｈｚ(４４０＊ｋ＾３)，音程Ｃ，音程Ｃ＃、音程Ｄ、音程Ｄ＃，音程Ｅ，音程Ｆ，音程Ｆ＃、音程Ｇとし、最後の音程Ｇ＃を８３０Ｈｚ(４４０＊ｋ＾１１)とする周波数ポイントで分類している。同様にして、オクターブ３の音程Ａは８８０Ｈｚ(４４０＊ｋ＾１２＝４４０＊２)となり、順次、各音程の周波数を規定し、各音程における音程パワーを検出している。そして、ＦＦＴ変換により抽出した全ての周波数範囲について同様の処理を行う。

　また、音程パワーは、例えば、式（１）で表される。

　ここで、F(p)はFFTポイントｐにおけるパワーを表し、fpos(m)は任意の音程ｍの周波数に相当するFFTポイントを表しているので、ＮＰ(m)は、任意の音程ｍでの音程パワーを表している。

　次に、音程パワー加算レベルの算出を行う。具体的には、上述したオクターブ毎に算出した各音程毎の音程パワーを、1オクターブの範囲内に、重み付けして加算する（以下、「音程パワー加算レベル」という。）。このようにして、1オクターブの範囲内に音程パワーが集約されることになる。

　具体的には、例えば、式（２）で表される。

　ここで、pは任意の各音程を、iは任意のオクターブ範囲を示す。また、Ｗ（i）は重み付けを表す。これは、高域周波数帯の雑音成分の悪影響を防ぐ効果がある。例えば、高域周波数帯では、高周波ノイズが含まれる可能性が高くなるため、重み付けを軽く（Ｗ（i）の値を小さく）する。また、重み付けは任意のオクターブ毎に規定されていてもよいし、例えば、整数オクターブ毎に加算しても良い。

　式（２）では、各音程毎に重み付けを乗じながら総和を求め、任意のオクターブにわたる音程パワーを１オクターブの範囲内に集約している。このようにして、音程パワー加算レベルＡＮＰ（ｐ）が各音程毎に算出される。この音程パワー加算レベルＡＮＰ（ｐ）が、各音程毎のパワーとなる。

　図１（Ｂ）は、音程パワー加算レベルＡＮＰ（ｐ）を示す。横軸１２は、各音程である音程Ａ～Ｇ＃を、縦軸１３は、音程パワー加算レベルＡＮＰ（ｐ）をそれぞれ表す。次に、ハーモニー明瞭度を算出する。

　具体的には、１オクターブ範囲内に集約された音程パワーの偏差を算出する。本実施形態では、１オクターブ範囲内に集約された音程パワーの偏差をハーモニー明瞭度ＣＣＶとしている。　　

　式（３）では、ハーモニー明瞭度、すなわち、算出された音程パワー加算レベルＡＮＰ（ｐ）における１オクターブ範囲内の偏差（算出された各音程の音程パワー加算レベルＡＮＰ（ｐ）の平均値との差の２乗の積算）を算出している。

　式（３）より、ハーモニー明瞭度である上記1オクターブ範囲内の偏差が大きければ、１オクターブ内に含まれるハーモニー（例えば、和音等）を構成する音程の音程パワー加算レベルＡＮＰ（ｐ）が突出して大きく、その他の音程の音程パワー加算レベルＡＮＰ（ｐ）が低くなるため、特定のハーモニーが目立って聞こえる。一方、上記1オクターブ範囲内の偏差が小さければ、１オクターブ内に含まれる各音程の音程加算レベルＡＮＰ（ｐ）の差がないため、ハーモニーが目立って聞こえない。従って、ハーモニー明瞭度は、ハーモニーが聴感上明確に聞こえるか否かの度合いを示す指標であることを表している。

　上記では、ハーモニー明瞭度を算出する際に、1オクターブ範囲内の偏差を用いているが、これに限定されるものではない。ハーモニー明瞭度は、ハーモニーが聴感上明確に聞こえるか否かの度合いを示す指標を意味するため、例えば、音程パワー加算レベルの偏差のみならず分散や、音程パワー加算レベルの相違度、差の激しさ又は変動の大きさや、突出して大きなパワーの音程パワー加算レベルが有るかどうかを表す指標であればよい。

　このハーモニー明瞭度の特色を示す例として、例えば、式（４）又は式（５）を用いてもよい。式（４）は、定数項を一般化し、音程パワー加算レベルＡＮＰ（ｐ）の平均値演算を省略化したものである。

　また、式（５）は、二乗演算を省略化したものである。

　ここで、ＣＣＶは、ハーモニー明瞭度を示す。

　ハーモニー明瞭度の精度を上げるため、以下に示すいくつかの方法も挙げることが出来る。

　ハーモニーを構成する音程の数は必ずしも一定ではない。ＣＣＶではハーモニーを構成する音程の数に応じて変動してしまう。したがって、式（６）のように、突出した音程パワーの平均値とそれ以外の音程パワーの平均値の差をハーモニー明瞭度としてもよい。UpAvrは突出した音程パワーの平均値、DnAvrはそれ以外の音程パワーの平均値である。

　次に、このＣＣＶは前述したように美しい和音が明確に聞こえるときに大きな値となるが、醜い和音が明確に聞こえるときも同様に大きな値となる。醜い和音というのはハーモニーとはいえないので、このような場合、式（７）に示す係数Ｘを用いてハーモニー明瞭度を小さくする必要がある。

　Ｘは０から１の範囲にあり、突出している音程の組に応じて決定される。突出している音程の組が、協和音などハーモニーといえる和音であるならＸは大きな値に、不協和音などハーモニーといえない和音であるならＸは小さな値に決定される。または、突出している音程の組と、全ての音楽理論的協和音とを比較して最も尤もらしい協和音を同定することで、この協和音以外の音程をハーモニーに対する雑音と考えることが出来る。したがって、この協和音以外の音程パワーの総和が大きい場合、Ｘを小さな値とし、小さい場合、Ｘを大きな値にする。

　次に、ハーモニー明瞭度の時間方向遷移を算出する。式（３）を用いて算出したハーモニー明瞭度は、楽曲データにおけるある瞬間的な値である。楽曲データの一定部分又は全体におけるハーモニー明瞭度を算出することにより、楽曲データ一定部分又は全体がどのような和音によって構成されているかを判別することができ、ひいては、その楽曲データ全体がどのような曲調を有するかを判別することができる。

　具体的には、楽曲データの一定時間におけるハーモニー明瞭度を算出し、その変化を算出（ハーモニー明瞭度の時間方向遷移を測定）する。

　図２（Ａ）～（Ｃ）は、ハーモニー明瞭度の時間方向遷移を示す。

　まず、楽曲データの一定時間における、各音程毎の音程パワー加算レベルの時間方向遷移を算出する。図２（Ａ）は、楽曲データの一定時間における、各音程毎の音程パワー加算レベルの時間方向遷移を算出するイメージを示す。図２（Ａ）-ｔ1では、微小時間ｔ1における各音程毎の音程パワー加算レベルを、例えば式（３）を用いて算出し、これを微小時間ｔまで算出する。これにより、一定期間ｔ1からｔまでの各音程毎の音程パワー加算レベルの時間方向遷移を算出する。

　図２（Ｂ）は、楽曲データの一定時間における、各音程毎の音程パワー加算レベルを４つのパラメータを用いて示す。横軸１４は時間を示しており、図１（Ａ）における微小時間ｔ1からｔまでの時間を表している。縦軸１５は各音程を示す。また、音程加算パワー加算レベル１６を濃淡表示で示し、濃度が薄いほど音程加算レベルが高く、濃度が低いほど音程加算レベルは低く表している。

　次に、ハーモニー明瞭度の時間方向遷移を算出する。ハーモニー明瞭度の時間方向遷移は、楽曲データの微小時間の各音程毎の音程パワー加算レベルの算出結果から、対応する微小時間のハーモニー明瞭度を例えば、式（３）を用いて算出する。これを、一定期間である微小時間ｔ1からｔまでのハーモニー明瞭度を算出することにより、ハーモニー明瞭度ｔの時間方向遷移を算出する。図２（Ｃ）は、ハーモニー明瞭度（ＣＣＶ）の時間方向遷移を示す。縦軸15は、ハーモニー明瞭度の大きさを表す。

　図２（Ｂ）から、ある音程の和音の音程パワー加算レベルＡＮＰ（ｐ）が突出して大きく、その他の音程の音程パワー加算レベルＡＮＰ（ｐ）が低くなるため、楽曲データの有する各音程毎の音程パワー加算レベルの標準偏差は大きくなることが予測される。そして、楽曲データの有する各音程毎の音程パワー加算レベルの標準偏差であるハーモニー明瞭度の算出結果も、図２（Ｃ）より、この予測どおり大きいことが表されている。

　以上のように、和音が聴感上明瞭であり、安らぎと落ち着きを与える癒しの曲調である楽曲についてハーモニー明瞭度を算出した結果、ハーモニー明瞭度は高い値を示した。上述した通り、ハーモニー明瞭度が高い楽曲は、ある和音が際立って聞こえるため、上記算出結果と実際に楽曲を聞いた聴感における楽曲の和音の印象は、一致することが立証された。

　次に、和音が聴感上明瞭に聞こえない楽曲について、ハーモニー明瞭度を算出する。この楽曲は、打楽器系又は、エフェクトの効いた電子楽器（エレキギター等）等の非波長成分あるいは雑音成分を多く含む楽器音が多く使用されており、曲調は、聴感に激しさ、煩さ又は迫力さを与え、ハーモニー感が少なく（和音が聴感上感じられず）、ノリやリズムが強調される等の特色を有する。

　算出する方法は上述したハーモニー明瞭度が大きい場合の時間方向遷移（図１（Ａ）～（Ｃ））と同様である。

　図３（Ａ）～（Ｃ）は、ハーモニー明瞭度の時間方向遷移を示す。各グラフの縦軸及び横軸は図２（Ａ）～（Ｃ）と同様である。図３（Ｂ）から、楽曲データの有する各音程毎の音程パワー加算レベルの標準偏差が小さいことが予想され、この予想を反映し、図３（Ｃ）の楽曲データのハーモニー明瞭度の時間方向遷移では、ハーモニー明瞭度が小さい値を維持している。

　以上のように、和音が聴感上明瞭に聞こえない楽曲についてハーモニー明瞭度を算出した結果、ハーモニー明瞭度は低い値を示した。上述した通り、ハーモニー明瞭度が低い楽曲は、和音が際立って聞こえないため、上記算出結果と実際に楽曲を聞いた聴感における楽曲の和音の印象は、一致することが立証された。

　以上のように、楽曲データについてハーモニー明瞭度の時間方向遷移を算出することにより、楽曲の曲調を知ることができる。従って、楽曲の曲調は、ハーモニー明瞭度の時間方向遷移の結果を用いて、「癒される」又は「激しい」等であると判別することができる。

　II）本願の最良の実施形態について
　以下、本願の最良の実施形態を添付図面に基づいて説明する。なお、以下に説明する実施の形態は、情報再生記録装置に対して本願を適用した場合の実施形態である。

　先ず、図４を参照して、本実施形態における情報再生記録装置の構成及び機能を説明する。図４は、本実施形態における情報再生記録装置の概要構成例を示す図である。

　図４に示すように、情報再生記録装置Ｓは、再生処理部１、外部出力部２、記録部３、システム制御部４、及び通信部５等を備えて構成される。

　再生処理部１は、システム制御部4の制御の下、ＣＤ（Ｃｏｍｐａｃｔ　Ｄｉｓｃ）、ＭＤ（Ｍｉｎｉ　Ｄｉｓｃ）、ＤＶＤ（Ｄｉｇｉｔａｌ　Ｖｅｒｓａｔｉｌｅ　Ｄｉｓｃ）、又はカード型記録媒体（例えば、メモリースティックやＳＤカード等）等の記録媒体に記録された楽曲のデータを再生し、当該楽曲のデータを外部出力部２へ出力する。

　外部出力部２は、ＤＳＰ（Ｄｉｇｉｔａｌ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｏｒ）、アンプ、及びスピーカ等を備えており、再生処理部１により再生された楽曲のデータに対して公知の音響処理を施し、アンプ及びスピーカを介して外部に音声出力する。

　記録部３は、例えばハードディスクドライブ等の記録装置等からなり、システム制御部４の制御の下、例えば再生処理部１から出力された楽曲のデータを例えば圧縮して、所定のファイル形式で記録すると共に、当該記録媒体に当該楽曲に付随する付随情報（例えば、楽曲ＩＤ（楽曲の識別情報）、楽曲名、楽曲が収録されているアルバムのアルバム名等を記録する。

　なお、楽曲のデータは、例えばインターネットに接続された楽曲配信サーバからその付随情報と共に通信部７を介してダウンロード可能になっている。また、上記付随情報は、例えば、楽曲のデータのそれぞれに対応するＴＯＣ（Table Of Contents）情報をキーとしてインターネットに接続されたＣＤＤＢ（ＣＤ　Ｄａｔａ　Ｂａｓｅ）を有するサーバからダウンロード可能になっている。

　システム制御部４は、演算機能を有するＣＰＵ、作業用ＲＡＭ、及び各種処理プログラム（本願の表示制御プログラムを含む）やデータを記憶するＲＯＭ等を備えており、前記ＣＰＵが前記ＲＯＭ等に記憶されたプログラムを実行することにより、情報再生記録装置Ｓ全体を統括制御し、楽曲のデータの記録及び再生制御等を行う。更に、システム制御部６は、本願の音程パワー加算レベル算出手段、ハーモニー明瞭度算出手段、低音ビートレベル検出手段及び曲調判別手段として機能する。

　より具体的には、システム制御部６は、再生処理部１又は記憶部３等から入力された楽曲データから音程パワー加算レベルを算出し、算出された音程パワー加算レベルからハーモニー明瞭度等を算出し、算出されたハーモニー明瞭度等に基づいて楽曲の曲調を判別する。

　また、システム制御部４は、入力された楽曲データに対して、ＦＦＴ変換等により所定帯域幅（Ｈｚ）の信号レベル（振幅）パワースペクトラムＦ（ｎ）パワースペクトラムＦ（ｎ）を算出し、算出結果から、各音程（Ｈｚ）の音程パワーを算出する。そして、各音程の音程パワーを、1オクターブの範囲内において、重み付けして加算する、「音程パワー加算レベル」を算出する。

　また、システム制御部４は、音程パワー加算レベル算出手段によって算出された「音程パワー加算レベル」から、１オクターブ範囲内の偏差（算出された各音程の音程パワー加算レベルＡＮＰ（ｐ）の平均値との差）を算出する。

　また、システム制御部４は、詳しくは後述するが、ハーモニー明瞭度等を用いて楽曲の曲調を判別する。

　（第一実施形態）ハーモニー明瞭度による曲調判別について
　次に図２を用いて、本実施形態における情報再生記録装置Ｓの動作を説明する。図２は、情報再生記録装置Ｓの動作を示すフローチャートである。

　再生処理部１等から楽曲データが入力されると（ステップＳ１）、システム制御部４は、楽曲データに対して、ＮポイントでＦＦＴ変換をする（ステップＳ２）。次に、Ｍオクターブ範囲内で各音程の音程パワーを算出し（ステップＳ３）、音程パワー加算レベルの算出を行う（ステップＳ４）。次に、ハーモニー明瞭度を算出し、（ステップＳ５）、最後に、ハーモニー明瞭度の時間方向遷移を算出する（ステップＳ６）。

　そして、算出されたハーモニー明瞭度に応じて曲調が判別される。このように判別された楽曲の曲調は、例えば、楽曲テーブルに楽曲に関連付けて記憶部３等に記憶される。そして、楽曲の検索時に、楽曲テーブルを参照することにより曲調が表示され、ユーザに識別可能とされる。

　（第二実施形態）ハーモニー明瞭度及び低域ビートレベルによる曲調判別について
　ハーモニー明瞭度と併せて、その他の特徴量、例えば、低域ビートレベルを用いて楽曲を解析することにより、詳細に楽曲の有する曲調を判別することができる。

　図６乃至図８を用いて、ハーモニー明瞭度及び低域ビートレベルを用いた曲調判別について説明する。図６は、ハーモニー明瞭度及び低域ビートレベルによる曲調判別を示すフローチャートである。図２に示す情報再生記録装置Ｓの動作を示すフローチャートに、曲調判別の新たな指標として、低域ビートレベルを加えた関係にある。

　まず、ステップＳ１１で、ハーモニー明瞭度を算出する。ハーモニー明瞭度の算出は、図２に示す情報再生記録装置Ｓの動作を示すフローチャートに記した通りである。

　次に、ステップＳ１２で、低域ビートレベルを算出する。低域ビートレベルとは、ドラム又はベース等、楽曲のリズムパートを構成する音量レベルを示す。一般的に、ドラム又はベース等の楽曲のリズムパートを構成する音は、他の音と比して低音域である。従って、ここではこれらの音量レベルを総称して低域ビートレベルという。なお、低域ビートレベルは、具体的には音楽の低域信号である。

　次に、ステップＳ１３で、算出したハーモニー明瞭度及び低域ビートレベルの時間方向遷移を算出する。この時間方向遷移の算出は、楽曲の全体でも一部分でもよい。図７（Ａ）～（Ｄ）は、４種類の楽曲のハーモニー明瞭度及び低域ビートレベルの時系列変化を表す。グラフの横軸１７は時間方向を、縦軸１８は、ハーモニー明瞭度及び低域ビートレベルの時間方向遷移を表す。縦軸の値は、任意の値で正規化した値で振っており、図７（Ａ）～（Ｄ）に示される楽曲毎に同様に正規化してあるため、これらの値は相対的に大小関係を比較可能としている。グラフの実線部１９はハーモニー明瞭度を、破線部２０は低域ビートレベルをそれぞれ示している。

　図７（Ａ）に示す楽曲Ａは、人間の聴感上は、にぎやかでノリのよいロック調の曲調として認識される。次に、ハーモニー明瞭度及び低域ビートレベルを用いて楽曲Ａの曲調を判別すると、楽曲Ａは、ハーモニー明瞭度が約３０近辺で推移し、低域ビートレベルは約８０近辺で推移することが算出される。ハーモニー明瞭度は低く、低域ビートレベルは高いことから、曲調として激しい印象を与えることが判別される。

　従って、聴感上認識される曲調と、ハーモニー明瞭度及び低域ビートレベルを算出することにより判別される曲調は一致する。

　図７（Ｂ）に示す楽曲Ｂは、楽曲の中盤以降までピアノとボーカルのみで構成されており、聴感上和音が際立って聞こえる曲である。曲の中盤以降に、ドラム等のリズムパートの演奏が入る構成となる。このような楽曲Ｂの構成を反映し、ハーモニー明瞭度は曲の中盤まで約８０と非常に高い値を示す。一方、低域ビートレベルは曲の中盤まで、約２０と低い値を示す。この間、楽曲Ｂは、和音の美しい響きを有しており、曲調として静かな印象を示す。

　曲の中盤以降に、ドラム等のリズムパートの演奏が入ると、ハーモニー明瞭度と低域ビートレベルの大小関係が逆転する。図７（Ｂ）では、ハーモニー明瞭度と低域ビートレベルの値が交差し、大小関係が入れ替わる。楽曲Ｂの中盤以降は、低域ビートレベルが際立ち、曲調として、激しい印象を示す。従って、聴感上認識される曲調と、ハーモニー明瞭度及び低域ビートレベルを用いて判別される曲調は一致する。

　図７（Ｃ）に示す楽曲Ｃは、ボーカル、キーボード、ドラム、ベース及びギター等多くの音構成要素を含むバンド演奏によって構成され、聴感上、リズミカルに認識される曲調を示す。楽曲Ｃのハーモニー明瞭度は、約６０と高めであり、低域ビートレベルも約６０と高めであるため、曲調としては、聞きやすくリズミカルな印象を示す。従って、聴感上認識される曲調と、ハーモニー明瞭度及び低域ビートレベルを算出することにより判別される曲調は一致する。

　図７（Ｄ）に示す楽曲Ｄは、ボーカルのみのアカペラで構成され、聴感上和音が際立って聞こえる曲である。楽曲Ｄは、楽曲Ａに比べ、ハーモニー明瞭度は同程度の値を示すが、低域ビートレベルは楽曲Ａに比べ非常に低い。ハーモニー明瞭度は同程度の値でも、低域ビートレベルの値により、曲調が楽曲Ａと異なることが判別できる。従って、聴感上認識される曲調と、ハーモニー明瞭度及び低域ビートレベルを用いて判別される曲調は一致する。

　以上より、楽曲の曲調判別において、ハーモニー明瞭度に加え、低域ビートレベルの値を考慮することにより、聴感上認識される曲調と差異がなく、更に正確で細かい楽曲の曲調分類が可能となることがわかる。

　図８は、ハーモニー明瞭度及び低域ビートレベルを用いた曲調分類を示す。横軸３０はハーモニー明瞭度を、縦軸３１は低域ビートレベルをそれぞれ示す。上述したように、楽曲の曲調は、ハーモニー明瞭度及び低域ビートレベルの値により分類することができる。図８に示すように、ハーモニー明瞭度及び低域ビートレベルが高い傾向にある楽曲は、聞きやすくリズミカルな曲調を示す。ハーモニー明瞭度が高い傾向にあり、低域ビートレベルが低い傾向にある楽曲は、静かな曲調を示す。また、ハーモニー明瞭度が低い傾向にあり、低域ビートレベルが高い傾向にある楽曲は、激しい曲調を示す。そして、ハーモニー明瞭度が低い傾向にあり、低域ビートレベルが低い傾向にある楽曲は、音が薄く、激しい曲調を示す。

　以上のように、ハーモニー明瞭度に併せて、その他の特徴量、例えば、低域ビートレベルを用いて楽曲を解析することにより、詳細に楽曲の有する曲調を判別することができる。

　III）シグナルパワー（SignalPower）を変更した場合のハーモニー明瞭度及び低域ビートレベルの時間方向遷移の例
　以上に示すように、ハーモニー明瞭度及び低域ビートレベルは、楽曲の曲調を判別する指標となる。従って、ハーモニー明瞭度及び低域ビートレベルは、楽曲のシグナルパワー（SignalPower）（ｄＢ）即ち、再生する際の音量の大きさによって左右されず、楽曲の曲調を判別する指標とならなければならない。以下、上記仮説について実証する。

　図９は、楽曲Ａにおいて、シグナルパワー（SignalPower）を下げた場合のハーモニー明瞭度及び低域ビートレベルの時間方向遷移の例を示す。グラフの横軸２１は時間方向を、縦軸２２は、ハーモニー明瞭度及び低域ビートレベルの時間方向遷移を表す。縦軸の値は、任意の値で正規化した値で振っており、図９（Ａ）～（Ｂ）に示される楽曲毎に同様に正規化してあるため、これらの値は相対的に大小関係を比較可能としている。グラフの実線部１９はハーモニー明瞭度を、破線部２０は低域ビートレベルを、一点鎖線部２１はSignalPowerをそれぞれ示している。

　楽曲Ａは、上述したとおり、ハーモニー明瞭度及び低域ビートレベルの算出により、激しい印象を示す曲調であると判別された楽曲である。仮説によれば、楽曲の曲調は、シグナルパワー（SignalPower）の大きさによっては変化しないはずである。

　図９（Ａ）は楽曲Ａにおいて、シグナルパワー（SignalPower）を約１００として再生した場合のハーモニー明瞭度及び低域ビートレベルの値を表している。図９（Ｂ）では、シグナルパワー（SignalPower）を、半分の約５０程度まで下げた場合のハーモニー明瞭度及び低域ビートレベルの値を表している。図９（Ａ）及び（Ｂ）において、ハーモニー明瞭度及び低域ビートレベルの値は、殆ど変化がない。従って、シグナルパワー（SignalPower）を下げた場合では、ハーモニー明瞭度及び低域ビートレベルの値はその影響を受けず、楽曲の曲調を反映しているといえる。よって、上記仮説は実証されたことを示している。

　図１０は、楽曲Ｂにおいて、シグナルパワー（SignalPower）を上げた場合のハーモニー明瞭度及び低域ビートレベルの時間方向遷移の例を示す。

　楽曲Ｂは、上述したとおり、ハーモニー明瞭度及び低域ビートレベルの算出により、楽曲Ｂの中盤までは、静かな印象を楽曲Ｂの中盤以降は、激しい印象を示すと判断された楽曲である。上記と同様に、楽曲の曲調は、シグナルパワー（SignalPower）の大きさによっては変化しないはずである。

　図１０（Ａ）は楽曲Ａにおいて、シグナルパワー（SignalPower）を約２０として再生した場合のハーモニー明瞭度及び低域ビートレベルの値を表している。図１０（Ｂ）では、シグナルパワー（SignalPower）を、倍の約４０程度まで上げた場合のハーモニー明瞭度及び低域ビートレベルの値を表している。図１０（Ａ）及び（Ｂ）において、ハーモニー明瞭度及び低域ビートレベルの値は、殆ど変化がない。従って、シグナルパワー（SignalPower）を上げた場合でも、ハーモニー明瞭度及び低域ビートレベルの値はその影響を受けず、楽曲の曲調を反映しているといえる。よって、上記仮説は実証されたことを示している。

　以上説明したように、上記実施形態によれば、入力された楽曲データから和音を算出し、算出された和音からハーモニー明瞭度等を算出し、算出されたハーモニー明瞭度等に基づいて楽曲の曲調を判別することにより、楽曲の曲調をより正確に判別することができ、曲調により楽曲を選曲することができる。

　また、ハーモニー明瞭度の時系列データを観察することにより、曲調の変化パターンを読み取ることも可能となる。これにより、曲の盛り上がりやアレンジなどが類似している曲や全く異なる曲などを検索することが出来る。

　また、楽曲の一部（例えば、イントロやサビ等、時系列データの安定している区間）のハーモニー明瞭度を算出し、算出されたハーモニー明瞭度に基づいて楽曲の曲調を判別することにより、曲の途中で曲調が変化する楽曲等の曲調をより正確に判別することができ、曲調により楽曲全体や一部を検索することができる。

　また、ハーモニー明瞭度に併せて、その他の特徴量、例えば、低域ビートレベルを用いて楽曲を解析することにより、詳細に楽曲の有する曲調をより正確に判別することができ、曲調により楽曲を選曲することができる。

　また、ハーモニー明瞭度そのもの（数値データ）を、レベル別に分類し楽曲のメタデータとして保存することにより、ハーモニー明瞭度そのものを指定することにより、楽曲の検索を行うこともできる。

　また、ハーモニー明瞭度等による曲調を決定するに当たっては、種々の方法によって行うことができる。例えば、多数の被験者による、主観的評価に基づいて行うこともできる。また、ユーザの任意の操作及び決定により行うこともできる。また、ユーザの楽曲に対する再生履歴や評価に応じて、曲調を自動的に決定するようにしてもよい。

　また、上記実施形態においては、本願を再生記録装置Ｓに対して適用した場合の例を説明したが、その他にも例えば、携帯電話機、パーソナルコンピュータ、及びその他車載用、家庭用等の電子機器に対しても適用可能である。

Claims

　入力された楽曲データから音程パワー加算レベルを算出する音程パワー加算レベル算出手段と、
　前記算出された音程パワーに基いて、ハーモニーが聴感上明確に聞こえるか否かの度合いを示すハーモニー明瞭度を算出するハーモニー明瞭度算出手段と、
　前記ハーモニー明瞭度を用いて、前記楽曲の曲調を判別する曲調判別手段と、
を備えることを特徴とする楽曲判別装置。
　請求項１に記載の楽曲判別装置において、
　前記ハーモニー明瞭度算出手段は、前記音程パワー加算レベルの偏差によって、前記ハーモニー明瞭度を算出することを特徴とする楽曲判別装置。
　請求項１又は２に記載の楽曲判別装置において、
　前記音程パワー算出手段は、前記楽曲の一部分の音程パワー加算レベルを算出し、
　前記ハーモニー明瞭度検出手段は、前記楽曲の一部分の音程パワー加算レベルに基づいて前記ハーモニー明瞭度を算出することを特徴とする楽曲判別装置。
　請求項１乃至３の何れか一項に記載の楽曲判別装置において、
　前記楽曲データの低域ビートレベルを検出する低域ビートレベル検出手段を更に備え、
　前記曲調判別手段は、前記ハーモニー明瞭度算出手段によって算出された値又は低域ビートレベル検出手段によって検出された値のうち少なくともいずれか一方の値を用いて前記曲調を判別することを特徴とする楽曲判別装置。
　入力された楽曲データから音程パワー加算レベルを算出する音程パワー加算レベル算出工程と、
　前記算出された音程パワー加算レベルに基いて、ハーモニーが聴感上明確に聞こえるか否かの度合いを示すハーモニー明瞭度を算出するハーモニー明瞭度算出工程と、
　前記ハーモニー明瞭度を用いて、前記楽曲の曲調を判別する曲調判別工程と、
を備えることを特徴とする楽曲判別方法。
　楽曲判別装置に含まれるコンピュータを、
　入力された楽曲データから音程パワー加算レベルを算出する音程パワー加算レベル算出手段、
　前記算出された音程パワー加算レベルに基いて、ハーモニーが聴感上明確に聞こえるか否かの度合いを示すハーモニー明瞭度を算出するハーモニー明瞭度算出手段、
　前記ハーモニー明瞭度を用いて、前記楽曲の曲調を判別する曲調判別手段、
として機能させることを特徴とする楽曲判別プログラム。
　請求項６に記載の楽曲判別プログラムがコンピュータに読み取り可能に記録されていることを特徴とする記録媒体。