JP4364838B2 - 楽曲リミックス可能な音楽再生装置ならびに楽曲リミックス方法およびプログラム - Google Patents

楽曲リミックス可能な音楽再生装置ならびに楽曲リミックス方法およびプログラム Download PDF

Info

Publication number
JP4364838B2
JP4364838B2 JP2005165456A JP2005165456A JP4364838B2 JP 4364838 B2 JP4364838 B2 JP 4364838B2 JP 2005165456 A JP2005165456 A JP 2005165456A JP 2005165456 A JP2005165456 A JP 2005165456A JP 4364838 B2 JP4364838 B2 JP 4364838B2
Authority
JP
Japan
Prior art keywords
music
remix
songs
unit
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005165456A
Other languages
English (en)
Other versions
JP2006337914A (ja
Inventor
啓一郎 帆足
勝博 上月
一則 松本
史昭 菅谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2005165456A priority Critical patent/JP4364838B2/ja
Publication of JP2006337914A publication Critical patent/JP2006337914A/ja
Application granted granted Critical
Publication of JP4364838B2 publication Critical patent/JP4364838B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

本発明は、ユーザの嗜好を取り込んだ上で自動的に楽曲のリミックスをすることが可能な音楽再生装置ならびにその楽曲リミックス方法およびプログラムに関する。
近年、HDD(ハードディスクドライブ)等を搭載した携帯型音楽再生機が急速に普及してきており、大量の音楽データを再生機に蓄積して音楽鑑賞することが広く行われるようになっている。このような音楽再生機は、HDD内に蓄積された多数の楽曲の中から聴きたい楽曲を選択した「プレイリスト」をユーザが準備しておいて、そのプレイリストに従ってユーザの好みの楽曲を好みの順番で再生できる機能を有している場合が多い。しかし、既存の音楽再生機では、通常ユーザ自らが手動でプレイリストを作成するようになっており、その作業はユーザにとって負担が大きいものとなっている。一方、ユーザの嗜好に適合した楽曲を自動的に検索する技術が既に開発されている(例えば、非特許文献1参照)ので、同技術を利用することによって、自動的にプレイリストを作成可能な音楽再生機を実現することもできると考えられる。
ところで、ラジオ番組やディスコなどにおいては、聴衆からのリクエストなどを参考にしてDJ(ディスクジョッキー)が聴衆の嗜好に合った複数の楽曲を選択し連続で再生させる場合に、楽曲間で異なるリズムやテンポを調整する目的で、再生速度を調節したり、スクラッチ音と呼ばれる一種のノイズを効果音として挿入したりすることが行われる。また、例えば楽曲の「サビ」の部分だけを抜き出してつなぎ合わせる「リミックス」も盛んに行われている。このように、DJが様々な手法を用いることで、楽曲の単なる連続再生とは異なる心地よさが聴衆に提供されている。
ラジオ番組等で使われているこうした効果的楽曲再生を個人でも楽しめるようにするため、最近では上記の音楽再生機等においてもそのような機能が実用化されつつある。例えば、ユーザ操作によりリミックスを行えるパソコン用ソフトウェアなどは既に市販がされており、これを使えば個人でも多様な音楽鑑賞方法を楽しむことが可能である。また、再生される楽曲と楽曲の間に、前の曲の再生音量を徐々に小さくしていくフェードアウトや、次の曲の再生音量を徐々に大きくしていくフェードインなど、簡単な効果を挿入することができる音楽再生機もある。
K. Hoashi, K. Matsumoto, N. Inoue: Personalization of user profiles for content-based music information retrieval based on relevance feedback, Proc. of ACM Multimedia 2003, pp. 110-119, 2003.
上述したように、既存の音楽再生機ではユーザ自らがプレイリストを手動で作成する必要があったが、非特許文献1に記載された技術を利用することによって、ユーザ嗜好に合った楽曲で構成されるプレイリストを自動的に構築することが可能となり、これによりユーザの負担を軽減できるようになる。
しかしながら、リミックスや効果音挿入などに関しては、これらを自動化するのは技術的に困難であるため、上記のとおりリミックス等が可能な音楽再生機やソフトウェアが商品化されているもののその操作はユーザが手動でしなければならなかった。しかも、リミックス等をするため音楽再生機などを操作する場合、その操作には専門的かつ高度な音楽的知識あるいは技術が要求されるため、ある程度その操作に対し習熟することが必要である。
このように、現状の音楽再生機等でリミックスなどを行うことは一般的なユーザにとっては必ずしも容易ではなく、敷居が高いものであるため、ラジオ番組やディスコで味わえる心地よい音楽体験を個人で気軽に楽しむことはできなかった。
この発明は上記の点に鑑みてなされたものであり、その目的は、特段の熟練を必要とすることなく手軽に音楽のリミックスをすることを可能とする音楽再生装置を提供することにある。また、そのような楽曲リミックス方法およびプログラムを提供することを目的とする。
本発明は上記の課題を解決するためになされたものであり、請求項1に記載の発明は、ユーザから音楽に関する嗜好情報を取り込むユーザ嗜好取り込み部と、複数の楽曲を格納する楽曲データベースに接続され、前記取り込んだ嗜好情報に基づいて、前記楽曲データベースから該ユーザの嗜好に適合した複数の楽曲をリミックス対象楽曲として選択するリミックス対象楽曲選択部と、前記リミックス対象楽曲をそれぞれの音響的特徴に基づいて分類した上で、その分類にしたがって楽曲の再生順序を決定する楽曲再生順序決定部と、あらかじめ用意され別個の特性を有した複数のエフェクトの中から、前記リミックス対象楽曲の音響的特長と前記各エフェクトの前記特性とに基づいて、前記決定した再生順序における各楽曲間に挿入するエフェクトを選択する挿入エフェクト選択部と、前記決定した再生順序で前記リミックス対象楽曲を接続し、その楽曲間に前記選択したエフェクトを挿入して、リミックス音楽の再生を行う楽曲再生部と、を備えることを特徴とする楽曲リミックス可能な音楽再生装置である。
また、請求項2に記載の発明は、請求項1に記載の楽曲リミックス可能な音楽再生装置において、前記音響的特長は、楽曲の音声データについて周波数特性を算出したものであり、前記楽曲再生順序決定部は、前記周波数特性の類似する楽曲をグループ化することにより分類を行い、各楽曲が前記分類されたグループの何れに所属するかという属性情報を用いて前記再生順序を決定することを特徴とする。
また、請求項3に記載の発明は、請求項1または請求項2に記載の楽曲リミックス可能な音楽再生装置において、前記リミックス対象楽曲を、音楽的な繰り返し単位となる一定区間に分割する楽曲分割部をさらに備え、前記繰り返し単位を対象として再生順序と挿入するエフェクトとを決定し、リミックス音楽を再生することを特徴とする。
また、請求項4に記載の発明は、請求項1から請求項3のいずれかの項に記載の楽曲リミックス可能な音楽再生装置において、前記楽曲再生部に代えて、若しくは前記楽曲再生部と共に、前記決定した再生順序で前記リミックス対象楽曲を接続し、その楽曲間に前記選択したエフェクトを挿入することにより生成されたリミックス音楽の音声データを外部出力する楽曲出力部を備えることを特徴とする。
また、請求項5に記載の発明は、請求項1から請求項4のいずれかの項に記載の楽曲リミックス可能な音楽再生装置において、前記楽曲再生部に代えて、若しくは前記楽曲再生部と共に、前記決定した再生順序および前記選択したエフェクトをメタ情報として外部出力する楽曲メタ情報出力部を備えることを特徴とする。
また、請求項6に記載の発明は、ユーザから音楽に関する嗜好情報を取り込むステップと、前記取り込んだ嗜好情報に基づいて、複数の楽曲を格納する楽曲データベースから該ユーザの嗜好に適合した少なくとも1つの楽曲をリミックス対象楽曲として選択するステップと、前記リミックス対象楽曲をそれぞれの音響的特徴に基づいて分類した上で、その分類にしたがって楽曲の再生順序を決定するステップと、あらかじめ用意され別個の特性を有した複数のエフェクトの中から、前記リミックス対象楽曲の音響的特長と前記各エフェクトの前記特性とに基づいて、前記決定した再生順序における各楽曲間に挿入するエフェクトを選択するステップと、からなることを特徴とする楽曲リミックス方法である。
また、請求項7に記載の発明は、コンピュータに、ユーザから音楽に関する嗜好情報を取り込むステップと、前記取り込んだ嗜好情報に基づいて、複数の楽曲を格納する楽曲データベースから該ユーザの嗜好に適合した少なくとも1つの楽曲をリミックス対象楽曲として選択するステップと、前記リミックス対象楽曲をそれぞれの音響的特徴に基づいて分類した上で、その分類にしたがって楽曲の再生順序を決定するステップと、あらかじめ用意され別個の特性を有した複数のエフェクトの中から、前記リミックス対象楽曲の音響的特長と前記各エフェクトの前記特性とに基づいて、前記決定した再生順序における各楽曲間に挿入するエフェクトを選択するステップと、を実行させるための楽曲リミックスプログラムである。
請求項1および請求項2に記載の発明によれば、入力されたユーザの嗜好情報に基づいてリミックスの対象となる楽曲が選択され、その上で自動的に当該楽曲の再生順序と挿入エフェクトを決定することができる。これにより、ユーザは手軽に音楽のリミックスを楽しむことが可能となる。
また、請求項3に記載の発明によれば、楽曲のイントロやサビなどの一部分のみを対象としてリミックスをすることができる。
また、請求項4および請求項5に記載の発明によれば、リミックスの結果を他の音楽再生装置に転送することができ、特に請求項5に記載の発明によれば、他人の著作権を侵害することなくリミックスの結果を利用することができる。
また、請求項6に記載の発明によれば、自動でリミックスを行いその結果を多数のユーザに頒布するコンテンツサービスを実現することができる。
また、請求項7に記載の発明によれば、専用の音楽再生機だけでなく、一般的なパソコン等においても自動でリミックスを楽しむことができる。
以下、この発明の実施の形態について図面を参照しながら説明する。
図1は、この発明の一実施の形態による音楽再生装置1の構成を示すブロック図である。この音楽再生装置1は、楽曲DB(データベース)2と、処理部3と、スピーカ4とから構成されている。
楽曲DB2は、多数の楽曲を蓄積できる記憶装置であり、ここではHDDが用いられているものとする。この楽曲DB2には、全部でk曲の楽曲X1、X2、…Xkが蓄積されており、この中にはユーザの好きな曲もそうでない曲も含まれている。なお、これらの楽曲は後述する「検索対象楽曲」となる。
スピーカ4は、リミックス楽曲再生部15で再生される音楽の音声出力装置である。
処理部3は、ユーザの嗜好に基づいて楽曲をリミックスする処理を担当している機能ブロックであり、ユーザ嗜好取り込み部11と、リミックス対象楽曲選択部12と、楽曲分割部13と、楽曲リミックス処理部14と、リミックス楽曲再生部15と、リミックス楽曲出力部16と、リミックス楽曲メタ情報出力部17とから構成される。
ユーザ嗜好取り込み部11は、ユーザから好きな楽曲や音楽ジャンルといった嗜好情報を取得する。
リミックス対象楽曲選択部12は、ユーザの前記嗜好情報に基づいて楽曲DB2内の検索対象楽曲からユーザの嗜好に合った楽曲を選択し、これをリミックス対象楽曲として楽曲分割部13へ出力する。
楽曲分割部13は、入力された前記リミックス対象楽曲を「イントロ」や「サビ」などの部分に細分化する処理を行う。
楽曲リミックス処理部14は、前記リミックス対象楽曲に対し、各楽曲を適切な順番に並び替えた上で楽曲間に適切な効果音を挿入するというリミックス処理を施す。なお、図1には示していないが、本楽曲リミックス処理部14は、後述するステップS5において楽曲の再生順序を決定する処理を担う楽曲再生順序決定部と、同じく後述するステップS6において楽曲間に挿入するエフェクトを選択する処理を担う挿入エフェクト選択部とからなっている。
リミックス楽曲再生部15は、リミックス処理された音楽の音声信号をスピーカ4に出力する。
リミックス楽曲出力部16は、リミックス処理された音楽を音声データとして他の音楽再生装置へ出力する。
リミックス楽曲メタ情報出力部17は、リミックス処理された音楽のメタ情報を他の音楽再生装置へ出力する。
次に、上記音楽再生装置1において行われる楽曲のリミックス処理の動作を、図2に示すフローチャートを参照して説明する。
まず、ユーザにより、音楽に関する嗜好情報がユーザ嗜好取り込み部11に入力される(ステップS1)。嗜好情報の入力は、聴きたい楽曲の例として、好きな楽曲あるいは好きな音楽ジャンルの代表的な楽曲を複数曲指定することによって行う。ここでは、m曲(数曲程度)の楽曲Mh1、Mh2、…Mhm(これらを集合Chとする)が指定されたものとする。なお、これらの楽曲は後述する「学習データ」となる。
また、嗜好情報の入力とあわせて、後述のステップS4で楽曲の細分化を行うか否か、さらに細分化する場合は細分化したどの部分(イントロ、サビ等)をリミックス対象とするか、といった設定入力も本ステップにて行う。
次に、リミックス対象楽曲選択部12が、前記ステップで入力された嗜好情報(好きな楽曲あるいは好きな音楽ジャンルの代表的な楽曲の例)に基づいて、ユーザの嗜好に合った楽曲を楽曲DB2から検索する(ステップS2)。すなわち本ステップでは、前ステップで指定された好きな楽曲例と曲調などが類似する楽曲を、リミックス対象楽曲として抽出する処理が行われる。その処理の詳細を図3から図5を参照して以下説明する。
図3は、リミックス対象楽曲選択部12の内部構成を示すブロック図である。同図に示すように、リミックス対象楽曲選択部12は、MFCC生成部21と、ツリー生成部22と、ベクトル化部23と、類似度算出部24と、検索結果リスト作成部25と、楽曲呼び出し部26とを有している。
ここで、MFCC生成部21は、入力した楽曲データから各フレーム区間のMFCC(後述)と音量を算出する。
ツリー生成部22は、学習データに基づいて、楽曲をベクトル量子化するためのツリーを生成する。
ベクトル化部23は、ツリー生成部22で生成されたツリーを用いて学習データおよび検索対象となる楽曲データのベクトル量子化を行う。
類似度算出部24は、ベクトル化部23により算出された2つのベクトルの類似度を算出する。
検索結果リスト作成部25は、類似度算出部24により算出された類似度に基づいて、検索対象となる楽曲データを順位付けし、その結果を記したリストを作成する。
楽曲呼び出し部26は、検索結果リスト作成部25により選出された楽曲の楽曲データを楽曲DB2から呼び出す。
図4は、リミックス対象楽曲選択部12によって行われる処理の詳細動作を示したフローチャートである。また、図5は楽曲データが順次処理されてベクトル化されていく様子を視覚的に表している図である。
まず、上述したステップS1で指定された学習データ(楽曲Mh1、Mh2、…Mhm)および楽曲DB2内の検索対象楽曲(楽曲X1、X2、…Xk)のそれぞれの楽曲の楽曲データが入力(ステップS201)されると、MFCC生成部21が各楽曲のフレーム区間毎にMFCCと音量を算出する(ステップS202)。
ここで、MFCC(mel−frequency cepstral coefficients)とは、楽曲の音声データ(図5(a))を12の帯域からなる周波数成分に分解したものに相当するパラメータである。また、フレーム区間は例えば0.1秒程度に設定される。
すなわち、ステップS202の処理(図5(b))は、楽曲の各フレームを13の要素(MFCC12要素と音量1要素)からなる13次元ベクトルに変換する処理である。そして、13次元ベクトルで表された各フレームが集合して楽曲全体ではMFCCフレーム群(図5(c))が形成されることになる。
次に、ツリー生成部22によって、上記算出された学習データの13次元ベクトルが分類されて、ベクトル量子化のためのツリーThが生成される(ステップS203)。このツリーTh(図5(d))は、学習データの13次元ベクトルの特徴に応じて所定のアルゴリズムにしたがい生成されるものであり、各楽曲の13次元ベクトルをある条件に基づいて分類するための分岐条件を模式的に表現したものである(後述のステップS204の説明を参照)。よって、その形状や分岐の仕方は学習データの選択(上述のステップS1)により異なるものとなる。なお、ここでは末端の枝の数はp本であるものとする。
次に、ベクトル化部23によって、学習データMh1、Mh2、…Mhmの各13次元ベクトルがツリーThに入力され、以下のアルゴリズムに従って学習データの集合Chを表すカテゴリベクトルVhが算出される(ステップS204)。すなわち、入力されたベクトルは、上述のようにツリーThの分岐点において分岐判断されて、最終的に末端の枝のいずれかに辿り着く。辿り着く枝は入力ベクトルによって異なる。すると、この操作を学習データの全ての13次元ベクトルに対して行って、各枝に辿り着いたベクトルの個数をカウントすることにより、ツリーThの各枝に対応したヒストグラム(図5(e))が形成されることになる。そして、得られたヒストグラムに、各ヒストグラムの度数を成分とする多次元のベクトルを対応させる。この多次元ベクトルがカテゴリベクトルVhである。ここで、末端の枝の数がp本である場合には、カテゴリベクトルVhはp次元のベクトルとなる。
続いて、ベクトル化部23によって、検索対象楽曲X1、X2、…Xkの各13次元ベクトルが楽曲毎にツリーThに入力され、前記ステップS204と同様のアルゴリズムに従って各楽曲のベクトル化が行われる(ステップS205)。ただし、本ステップは、検索対象楽曲を1曲入力する毎に当該楽曲に対応するベクトルXi(i=1〜k)が決定する点が前記ステップS204と相違している。なお、ここで得られるベクトルXiの次元数はカテゴリベクトルVhの次元数と同じである。
次に、類似度算出部24によって、上記算出されたカテゴリベクトルVhと検索対象楽曲の各ベクトルXiとの類似度Sim(Xi,Vh)が計算される(ステップS206)。ここで、Sim(Xi,Vh)の値は、各ベクトルXi、Vhを正規化した上で両者の余弦をとった値であるものとする。
次に、検索結果リスト作成部25が、Sim(Xi,Vh)の大きい順に検索対象楽曲X1、X2、…Xkを並べ替えてリスト化し、その上位N曲を特定する(ステップS207)。そして、楽曲呼び出し部26が、当該N曲の楽曲データを楽曲DBから呼び出して、楽曲分割部13へと出力する(ステップS208)。
こうして、ステップS2によるユーザ嗜好に合った楽曲の検索が完了する。
図2のフローチャートに戻って説明を続ける。
次に、ステップS1での設定入力に基づいて、楽曲分割部13で楽曲の分割を行うかどうかが判断される(ステップS3)。楽曲分割をしないとの設定をしていた場合(ステップS3の“No”)は、楽曲分割部13は、上記ステップS207において楽曲呼び出し部26から入力されたN曲の楽曲データをそのまま楽曲リミックス処理部14へ出力する。この場合は、楽曲分割がされることなく、一曲一曲全体を対象にリミックス処理(後述のステップS5、ステップS6)が行われる。
一方、ステップS1で楽曲分割をするとの設定をしていた場合(ステップS3の“Yes”)は、楽曲分割部13は、入力されたN曲の楽曲データをイントロやサビ等の部分に分割(ステップS4)した上で、分割後の楽曲データを楽曲リミックス処理部14へ出力する。
ここで、ステップS4における楽曲データの分割処理は、以下の手順により行われる。
まず楽曲分割部13は、入力された楽曲を所定の(0.1秒程度の)フレーム区間に細分化して、各フレームの音声データを高速フーリエ変換(FFT)により周波数成分に分解する。そして、得られた周波数成分を持ったベクトルを各フレームに対応させ、これらベクトル間の全ての組み合わせについて、ベクトルの類似度を計算する。この類似度は、ステップS205の類似度Sim(Xi,Vh)と同じく、2つのベクトルのなす角の余弦として定義する。これにより、各フレーム(ベクトル)間の類似度を表すn×n行列(Sマトリックスと呼ぶ)が得られることになる。ここでnは当該楽曲のフレーム分割数である。
次に、あらかじめ用意されたm×m行列(カーネルと呼ぶ。ただし、m<n)を前記Sマトリックスに作用させ、Sマトリックスとカーネルとの相関係数であるノベルティスコアを計算する。具体的には、Sマトリックスからその1つの対角要素を中心とするm×m行列を抽出し、抽出したm×m行列とカーネルの対応する各要素の積を全て足し合わせた値が、当該対角要素(楽曲内の時刻に相当する)のノベルティスコアである。そして、Sマトリックスの全ての対角要素に対してこの計算を行うことにより、楽曲の演奏時間の関数としてノベルティスコアを得ることができる。
ここで、上記カーネルは、Sマトリックスから抽出したm×m行列の非対角要素に負の値が多い場合にノベルティスコアが大きくなるような行列が選ばれている。また、Sマトリックスの非対角要素とは前記のとおり異なるフレーム間の類似度を表すものであり、その定義(2つのベクトルのなす角の余弦)から、当該フレーム間の類似度が低ければその値が負となる。したがって、ノベルティスコアが大きな値を持つのは、楽曲内のある時刻において、その前後の一定時間の音声データが他の一定時間の音声データと類似している度合いが低い場合ということになる。逆に、楽曲内の他の部分と音声データが似通っている場合には、ノベルティスコアは低い値を持つ。
こうして、楽曲のノベルティスコアを計算しその値が大きくなる時刻を算出することによって、当該楽曲の曲調が顕著に変化するポイント(例えばイントロからサビに移るポイント)が抽出され、当該ポイントにおいて楽曲の分割が行われる。なお、上記の楽曲分割方法は、公知の文献「J. Foote: Automatic Audio Segmentation Using A Measure of Audio Novelty, Proc. of ICME 2000, pp. 452-455, 2000.」に開示されている技術である。
次に、楽曲リミックス処理部14(楽曲再生順序決定部)が、楽曲分割部13から入力されたN曲のリミックス対象楽曲(ステップS4において楽曲分割されている場合は楽曲区間)を再生する際の再生順序を決定する(ステップS5)。その手順は以下のとおりである。
まず、事前処理として、楽曲DB2内の全楽曲を対象に楽曲データをベクトル化し、得られた楽曲ベクトルに基づいてk−means法による楽曲のクラスタリングを行う。クラスタリングの結果、各々の楽曲が属するクラスタが決定する。
ここで、上記ベクトル化は前述したステップS205と同様、ベクトル量子化ツリー(図5(d)参照)を利用する手法によって行う。なお、ツリー生成に用いる学習データは、前述のステップと同じく集合Ch(楽曲Mh1、Mh2、…Mhm)を使うものとする。ただし他の学習データを使ってもよい。
また、K−means法は多変量解析における代表的なクラスタリング手法の1つであり、その手法は、与えられたK個のクラスタの中心値と各解析データとの距離を計算し、最も近いクラスタ中心に解析データを配分してクラスタを更新する、という操作を全ての解析データとそれが属するクラスタの中心値との距離の合計が最小になるまで繰り返すものである。
上記事前処理により各楽曲の所属するクラスタが決定すると、次にN曲のリミックス対象楽曲について、同じクラスタに属する楽曲が接続されるようにその再生順序が決定される。ここで、楽曲の再生順序をこのようにしているのは、音響的特長が類似している楽曲同士を続けて再生することにより、リミックスによる違和感を軽減させるためである。
例えば、リミックス対象楽曲がP1〜P9の9曲(N=9)であり、クラスタリングの結果、これらが3つのクラスタC1〜C3に分類されて各々の所属クラスタが{P1,P2,P3}∈C1、{P4,P5,P6}∈C2、{P7,P8,P9}∈C3となっている場合、各楽曲はP1→P2→P3→P4→P5→P6→P7→P8→P9のように接続される。
また、ステップS4において楽曲分割がされている場合は、サビ部分あるいはイントロ部分などユーザの指示に基づいて特定の楽曲区間のみを選択して接続する。図6にその具体例を示す。同図(a)によれば、リミックス対象楽曲として楽曲A、B、…Cがあり、それぞれいくつかの区間に分割されている。サビ区間は、a1、a2、b1…等である。このとき、楽曲リミックス処理部14はサビ区間のみを選んでa1→a2→b1→b2→c1→c2のように接続する(同図(b))。なお、接続された各サビ区間の間には次に述べる効果音が挿入されている。
次に、楽曲リミックス処理部14(挿入エフェクト選択部)は、上記ステップS5で接続された楽曲間に挿入するエフェクト(効果音)を選択する(ステップS6)。この処理は以下の手順による。
まず、使用される全てのエフェクトは楽曲DB2に記憶されており、これらは各エフェクトの音響的な特性に基づいていくつかのグループに分類されている。また、分類された各エフェクトをどのような曲調の楽曲間に使用すると効果的か、というルールを定めたパターンデータも同じく楽曲DB2に記憶されている。
例えば、スクラッチ音やラジオノイズ音などのように再生中の音楽に対し割り込むような感じを与えるエフェクトは、音響的特長が大きく異なる楽曲を接続するのに効果的である。一方、波の音やシンセサイザ音などのように、ゆるやかで音長が長いエフェクトは静かな楽曲同士を接続するのに効果的である。パターンデータはこうした情報をあらかじめ設定して収録したものである。
そして、楽曲リミックス処理部14はエフェクトを挿入する前後の楽曲が所属するクラスタに基づいて、楽曲DB2内の上記パターンデータから最適なエフェクトを選択する。すなわち、例えば前述したクラスタC1〜C3のうち、C1が静かな楽曲のクラスタであり、C2とC3がにぎやかな楽曲のクラスタであるとする。この場合、P1→P2→P3のように静かな楽曲のクラスタに属する楽曲同士を接続する箇所には波の音エフェクトが選択される。一方、P3→P4などのように音響的特長が異なるクラスタに属する楽曲を接続する箇所にはスクラッチ音エフェクトが選択される。
以上のようにしてリミックス対象楽曲の再生順序と挿入エフェクトが決定すると、その結果にしたがって楽曲データの並べ替えとエフェクトデータの挿入が行われて、1つのリミックス済み楽曲データ(これは音声データである)が生成される(ステップS7)。また、楽曲の再生順序と挿入エフェクトをメタ情報として記録したリミックス結果メタ情報ファイルも生成される(同ステップ)。これにより楽曲リミックスが完了する。
上記のリミックス済み楽曲データは、本音楽再生装置1で再生する場合(ステップS8で“Yes”)はリミックス楽曲再生部15へ送られて再生され(ステップS9)、スピーカ4から音声が出力される。
一方、他の音楽再生装置で再生する場合(ステップS8で“No”)は、リミックス済み楽曲データはリミックス楽曲出力部16へ、リミックス結果メタ情報ファイルはリミックス楽曲メタ情報出力部17へ、それぞれ送られ、出力形態(音声データとして出力するか、メタ情報として出力するか)に合わせて他の音楽再生装置へ出力される(ステップS10〜ステップS12)。
ここで、リミックス楽曲出力部16からリミックス済み楽曲データを出力(ステップS11)したときは、他の音楽再生装置で同楽曲データがそのまま再生できる。一方、著作権の問題によりそのようなことが禁止される場合には、リミックス結果メタ情報ファイルをリミックス楽曲メタ情報出力部17から出力するようにする(ステップS12)。この場合、リミックス結果メタ情報ファイルを受け取った他ユーザの音楽再生装置では、リミックスした元の各楽曲を用意しておくことによって、同メタ情報からリミックスを行い、同じリミックス結果を楽しむことができる。
このように、上記の実施形態によれば、ユーザの嗜好に基づき楽曲データベースから楽曲を選択し、必要に応じて楽曲をサビやイントロなどの区間に分割し、各楽曲の音響的特長に基づいて楽曲相互間の類似度を比較することにより再生順序を決定し、各エフェクトと各楽曲の音響的特長に基づき楽曲間に挿入するエフェクトを選択している。したがって、好みの楽曲からなるプレイリストを自動的に作成できるだけでなく、楽曲をサビなど特定区間に自動的に分割した上で、リミックス処理(再生順序の決定とエフェクトの挿入)を自動的に行うことが可能である。しかも、このリミックス処理は、楽曲の音響的特長を比較することにより前後の曲が滑らかかつ違和感なく再生されるよう、再生順序とエフェクトを決定している。こうしたことから、ユーザは、特段の熟練を必要とすることなく手軽に音楽のリミックスをすることができて、ラジオ番組やディスコで味わえるような心地よい音楽体験を個人でも楽しむことができるようになる。
以上、図面を参照してこの発明の一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
例えば上記実施形態では、ユーザの嗜好情報の入力(ステップS1)は、聴きたい楽曲の例として好きな楽曲を複数曲指定することによって行っているが、そのように具体的な楽曲を指定する代わりに、「静かな曲」や「陽気な曲」などのような抽象的な選択肢をあらかじめ設定しておき、その中から選択を行うことで嗜好情報を入力できるようにしてもよい。なおこの場合は、ベクトル量子化ツリーとカテゴリベクトルはステップS203とステップS204において学習データから生成するのではなく、上記抽象的な選択肢と併せてあらかじめ設定しておくものとする。
また、その他の嗜好情報の入力方法として、楽曲DB2内の各楽曲にジャンル属性を持たせておき、ユーザは聴きたい音楽ジャンルを指定するようにしてもよい。さらに、聴きたい楽曲を直接指定できるようにしてもよい。
また、上記実施形態のステップS4において楽曲の分割方法を説明したが、その方法に代えて、例えば楽曲データの中に「サビ」が何処かということを示す信号をあらかじめ書き込んでおき、この信号を識別することによって分割を行うという方法を採ることも可能である。
また、上記実施形態においては、リミックス対象楽曲の再生順序は、リミックスによる違和感軽減のため同じクラスタに所属する楽曲が接続されるように決定されているが、その逆に、新たな音楽体験として敢えて違和感を生じさせる目的で、異なるクラスタに属する楽曲が接続されるように再生順序を決定してもよい。また、ユーザが再生順序を直接入力するという方法でもよい。
さらに、楽曲間に挿入するエフェクトとして、上記ステップS6で示したものの他、フェードイン・フェードアウトや、テンポが異なっている前後の楽曲の再生スピードを調整するエフェクトなどを用いることも可能である。
また、ステップS7で生成されたリミックス済み楽曲データを楽曲DB2に保存するようにし、次回以降の再生時にこれを呼び出して再生するようにしてもよい。また、リミックス済み楽曲データを生成するのではなく、リミックス再生の都度、決定した再生順序にしたがって楽曲DB2から楽曲を呼び出し、エフェクトを挿入して再生を行うようにしてもよい。
また、上記実施形態による音楽再生装置1は、処理部3にリミックス楽曲再生部15とリミックス楽曲出力部16とリミックス楽曲メタ情報出力部17の全てを備えているが、これら3つの部分のうち1つまたは2つだけを備えるようにしてもよい。すなわち、本装置1はリミックスされた楽曲を単に装置内で再生することだけしかできなくても構わないし、逆に、装置内で再生することなく外部の音楽再生装置にリミックス結果を出力するだけであっても構わない。なお、後者の場合はスピーカ4も不要となる。
また、楽曲DB2はHDDの他、フラッシュメモリ等の半導体メモリにより構成することもできる。また、楽曲DB2は外部に設けるようにしてもよい。
なお、ステップS5におけるクラスタリング手法として、K−means法以外の既知の手法を用いることができるのは当然である。
本発明は、HDD等の大容量記憶装置を備えた音楽再生装置や、音楽再生用ソフトウェアに用いて好適である。
この発明の一実施の形態による音楽再生装置の構成を示すブロック図である。 図1の音楽再生装置における楽曲リミックス処理の動作を示すフローチャートである。 リミックス対象楽曲選択部の内部構成を示すブロック図である。 リミックス対象楽曲選択部における処理の詳細動作を示したフローチャートである。 リミックス対象楽曲選択部において楽曲がベクトル化される様子を視覚的に表した図である。 楽曲が分割されサビ部分のみがリミックスされる様子を表した図である。
符号の説明
1…音楽再生装置 2…楽曲DB 3…処理部 4…スピーカ 11…ユーザ嗜好取り込み部 12…リミックス対象楽曲選択部 13…楽曲分割部 14…楽曲リミックス処理部 15…リミックス楽曲再生部 16…リミックス楽曲出力部 17…リミックス楽曲メタ情報出力部 21…MFCC生成部 22…ツリー生成部 23…ベクトル化部 24…類似度算出部 25…検索結果リスト作成部 26…楽曲呼び出し部

Claims (7)

  1. ユーザから音楽に関する嗜好情報を取り込むユーザ嗜好取り込み部と、
    複数の楽曲を格納する楽曲データベースに接続され、前記取り込んだ嗜好情報に基づいて、前記楽曲データベースから該ユーザの嗜好に適合した複数の楽曲をリミックス対象楽曲として選択するリミックス対象楽曲選択部と、
    前記楽曲データベースの各楽曲を周波数特性が類似する楽曲のグループに分類し、同じグループに所属する楽曲が接続されるように前記リミックス対象楽曲の再生順序を決定する楽曲再生順序決定部と、
    あらかじめ用意され別個の特性を有した複数のエフェクトの中から、前記リミックス対象楽曲の音響的特徴と前記各エフェクトの前記特性とに基づいて、前記決定した再生順序における各楽曲間に挿入するエフェクトを選択する挿入エフェクト選択部と、
    前記決定した再生順序で前記リミックス対象楽曲を接続し、その楽曲間に前記選択したエフェクトを挿入して、リミックス音楽の再生を行う楽曲再生部と、
    を備えることを特徴とする楽曲リミックス可能な音楽再生装置。
  2. 前記嗜好情報は楽曲を学習データとして指定した情報であり、
    前記リミックス対象楽曲選択部は、前記学習データにかかる楽曲の周波数特性と前記楽曲データベースの各楽曲の周波数特性との類似度を計算し、当該類似度に従って前記リミックス対象楽曲を選択する
    ことを特徴とする請求項1に記載の楽曲リミックス可能な音楽再生装置。
  3. 前記リミックス対象楽曲を、音楽的な繰り返し単位となる一定区間に分割する楽曲分割部をさらに備え、
    前記繰り返し単位を対象として再生順序と挿入するエフェクトとを決定し、リミックス音楽を再生する
    ことを特徴とする請求項1または請求項2に記載の楽曲リミックス可能な音楽再生装置。
  4. 前記楽曲再生部に代えて、若しくは前記楽曲再生部と共に、前記決定した再生順序で前記リミックス対象楽曲を接続し、その楽曲間に前記選択したエフェクトを挿入することにより生成されたリミックス音楽の音声データを外部出力する楽曲出力部を備える
    ことを特徴とする請求項1から請求項3のいずれかの項に記載の楽曲リミックス可能な音楽再生装置。
  5. 前記楽曲再生部に代えて、若しくは前記楽曲再生部と共に、前記決定した再生順序および前記選択したエフェクトを示す情報外部出力する情報出力部を備える
    ことを特徴とする請求項1から請求項4のいずれかの項に記載の楽曲リミックス可能な音楽再生装置。
  6. ユーザから音楽に関する嗜好情報を取り込むステップと、
    前記取り込んだ嗜好情報に基づいて、複数の楽曲を格納する楽曲データベースから該ユーザの嗜好に適合した複数の楽曲をリミックス対象楽曲として選択するステップと、
    前記楽曲データベースの各楽曲を周波数特性が類似する楽曲のグループに分類し、同じグループに所属する楽曲が接続されるように前記リミックス対象楽曲の再生順序を決定するステップと、
    あらかじめ用意され別個の特性を有した複数のエフェクトの中から、前記リミックス対象楽曲の音響的特徴と前記各エフェクトの前記特性とに基づいて、前記決定した再生順序における各楽曲間に挿入するエフェクトを選択するステップと、
    からなることを特徴とする楽曲リミックス方法。
  7. コンピュータに、
    ユーザから音楽に関する嗜好情報を取り込むステップと、
    前記取り込んだ嗜好情報に基づいて、複数の楽曲を格納する楽曲データベースから該ユーザの嗜好に適合した複数の楽曲をリミックス対象楽曲として選択するステップと、
    前記楽曲データベースの各楽曲を周波数特性が類似する楽曲のグループに分類し、同じグループに所属する楽曲が接続されるように前記リミックス対象楽曲の再生順序を決定するステップと、
    あらかじめ用意され別個の特性を有した複数のエフェクトの中から、前記リミックス対象楽曲の音響的特徴と前記各エフェクトの前記特性とに基づいて、前記決定した再生順序における各楽曲間に挿入するエフェクトを選択するステップと、
    を実行させるための楽曲リミックスプログラム。
JP2005165456A 2005-06-06 2005-06-06 楽曲リミックス可能な音楽再生装置ならびに楽曲リミックス方法およびプログラム Expired - Fee Related JP4364838B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005165456A JP4364838B2 (ja) 2005-06-06 2005-06-06 楽曲リミックス可能な音楽再生装置ならびに楽曲リミックス方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005165456A JP4364838B2 (ja) 2005-06-06 2005-06-06 楽曲リミックス可能な音楽再生装置ならびに楽曲リミックス方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2006337914A JP2006337914A (ja) 2006-12-14
JP4364838B2 true JP4364838B2 (ja) 2009-11-18

Family

ID=37558506

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005165456A Expired - Fee Related JP4364838B2 (ja) 2005-06-06 2005-06-06 楽曲リミックス可能な音楽再生装置ならびに楽曲リミックス方法およびプログラム

Country Status (1)

Country Link
JP (1) JP4364838B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5259075B2 (ja) * 2006-11-28 2013-08-07 ソニー株式会社 マッシュアップ装置およびコンテンツの作成方法
JP5259083B2 (ja) * 2006-12-04 2013-08-07 ソニー株式会社 マッシュアップ用データの配布方法、マッシュアップ方法、マッシュアップ用データのサーバ装置およびマッシュアップ装置
JP5217275B2 (ja) * 2007-07-17 2013-06-19 ヤマハ株式会社 楽曲を制作するための装置およびプログラム
JP2011149993A (ja) * 2010-01-19 2011-08-04 Kddi Corp 再生順序決定装置、再生順序決定方法および再生順序決定プログラム
JP5679840B2 (ja) * 2011-01-31 2015-03-04 三菱電機株式会社 プレイリスト作成装置、プレイリスト編集装置
JP6330619B2 (ja) * 2014-10-24 2018-05-30 オンキヨー株式会社 音楽編集装置、及び、音楽編集プログラム
CN106486128B (zh) * 2016-09-27 2021-10-22 腾讯科技(深圳)有限公司 一种双音源音频数据的处理方法及装置
JP6683322B2 (ja) * 2018-10-11 2020-04-15 株式会社コナミアミューズメント ゲームシステム、ゲームプログラム、及び合成楽曲の作成方法
CN111601433B (zh) * 2020-05-08 2022-10-18 中国传媒大学 舞台灯光效果控制策略的预测方法及装置

Also Published As

Publication number Publication date
JP2006337914A (ja) 2006-12-14

Similar Documents

Publication Publication Date Title
JP4364838B2 (ja) 楽曲リミックス可能な音楽再生装置ならびに楽曲リミックス方法およびプログラム
US20160267177A1 (en) Music steering with automatically detected musical attributes
US7521620B2 (en) Method of and system for browsing of music
US7899564B2 (en) Procedure and apparatus for generating automatic replay of recordings
JP4581476B2 (ja) 情報処理装置および方法、並びにプログラム
US8166044B2 (en) Method and apparatus for selecting items from a number of items
JP5594052B2 (ja) 情報処理装置、楽曲再構成方法及びプログラム
CN1838229B (zh) 重放装置和重放方法
KR20070116853A (ko) 플레이리스트를 작성하기 위한 스캔 셔플
US20200394988A1 (en) Spoken words analyzer
KR101942459B1 (ko) 음원 컨텐츠 및 메타 정보를 이용한 플레이리스트 자동 생성 방법 및 시스템
CN113691909A (zh) 具有音频处理推荐的数字音频工作站
US20140277638A1 (en) System and method of predicting user audio file preferences
JP2003084783A (ja) 音楽データ再生装置、音楽データ再生方法、音楽データ再生プログラム、並びに音楽データ再生プログラムを記録した記録媒体
JP2008216486A (ja) 音楽再生システム
KR20070048484A (ko) 음악파일 자동 분류를 위한 특징 데이터베이스 생성 장치및 그 방법과, 그를 이용한 재생 목록 자동 생성 장치 및그 방법
KR102556182B1 (ko) 사용자의 음원 소비 정보 및 맥락 정보에 기초한 적응형 음악 생성 장치 및 방법
JP6733240B2 (ja) コンテンツの一覧の更新方法
KR102031282B1 (ko) 음원 컨텐츠 및 메타 정보를 이용한 플레이리스트 자동 생성 방법 및 시스템
KR100468971B1 (ko) 멜로디 기반 검색이 가능한 음악 재생장치
Wijaya et al. Song Similarity Analysis With Clustering Method On Korean Pop Song
JP4447540B2 (ja) カラオケ唱歌録音作品の鑑賞システム
JP2007241941A (ja) コンテンツ検索装置及びコンテンツ検索プログラム
WO2024079625A1 (en) A computer assisted method for classifying digital audio files
US20100153469A1 (en) Electronic device and method of creating a sequence of content items

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071012

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071012

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080303

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20080304

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090421

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090512

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20090710

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090710

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090804

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090819

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120828

Year of fee payment: 3

R150 Certificate of patent (=grant) or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150828

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees