JP3388481B2 - 音楽情報の曲構成自動抽出方法 - Google Patents

音楽情報の曲構成自動抽出方法

Info

Publication number
JP3388481B2
JP3388481B2 JP24641995A JP24641995A JP3388481B2 JP 3388481 B2 JP3388481 B2 JP 3388481B2 JP 24641995 A JP24641995 A JP 24641995A JP 24641995 A JP24641995 A JP 24641995A JP 3388481 B2 JP3388481 B2 JP 3388481B2
Authority
JP
Japan
Prior art keywords
music
point
music information
composition
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP24641995A
Other languages
English (en)
Other versions
JPH0990978A (ja
Inventor
由美子 松浦
誠司 木ノ原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP24641995A priority Critical patent/JP3388481B2/ja
Publication of JPH0990978A publication Critical patent/JPH0990978A/ja
Application granted granted Critical
Publication of JP3388481B2 publication Critical patent/JP3388481B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、音楽情報の曲構
成自動抽出方法に関し、特に、音楽情報から楽譜情報な
しに曲構成を自動的に抽出する音楽情報の曲構成自動抽
出方法に関する。
【0002】
【従来の技術】音楽情報の曲構成を抽出する場合、音楽
情報を電子計算機を使用して電子的な音楽記述言語によ
り表現し、音楽情報の拍子、音程、拍数、コード進行を
求め、音楽情報のコード進行の規則に基づいて音楽情報
のフレーズ、曲構成を抽出することができる。曲構成は
1或は2以上のフレーズから成り、音楽1曲の内には、
一般に、複数の曲構成が存在している。
【0003】ここで、音楽情報の内から音楽のダイジェ
スト情報或はサビと呼ばれる特徴部分を切り出すには、
この曲構成を切り出しの単位としている。この場合、音
楽情報が楽譜或は音楽記述言語により表現されていれ
ば、休止符毎に分割を行なうことにより曲構成を容易に
抽出することができる。
【0004】
【発明が解決しようとする課題】以上の音楽情報の曲構
成抽出方法においては、音楽情報を電子的な音楽記述言
語により再表現しなくてはならない。これを実施するに
は、電子的な音楽記述言語を熟知している必要があるこ
とは言うまでもない。そして、原の音楽情報を電子的な
音楽記述言語により再表現するには長時間を必要とす
る。その上に、この再表現作業には、各音色について原
の音楽情報と電子的な音楽記述言語により再表現したも
のとの間の聴覚による対応付けの技術を訓練により習得
することも必要であり、この再表現作業を自動化するに
は種々の困難を伴う。
【0005】更に、電子的な音楽記述言語により再表現
された音楽情報から曲構成を抽出することができたとし
ても、電子計算機の拍は一定時間で正確に刻まれるもの
であるのに対して人間の演奏による拍には速度に変化が
伴うものであり、この点について見ても、原情報と抽出
される曲構成との間の対応づけは困難である。この発明
は、電子的な再記述を必要とせずに音楽情報の原情報か
ら音楽の曲構成を抽出し、抽出された曲構成情報のすべ
てを少ない記憶容量により格納する音楽情報の曲構成自
動抽出方法を提供するものである。
【0006】
【課題を解決するための手段】1或は2以上の音響およ
び音声を含む音楽情報からこの音楽情報における音声或
はメロディを含んだ有声部分を無声部分を使用して検出
分離し、検出された有声部分から音楽の一区切りである
フレーズを検出して、検出されたフレーズに基づいて音
楽情報を曲構成に分割する音楽情報の曲構成自動抽出方
法において、曲構成の開始点および終了点を検出し、開
始点のみを指定することにより音楽情報を曲構成に分割
する音楽情報の曲構成自動抽出方法を構成した。
【0007】そして、歌入曲である原曲Aおよび原曲A
から歌声を消去した伴奏曲Aの双方を音楽情報ファイル
として録音し、録音された音楽情報ファイルを加工して
原曲Aおよび伴奏曲A双方の音楽部分のみの解析ファイ
ルを作成し、この音楽部分のみの解析ファイルを解析す
る音楽情報の曲構成自動抽出方法を構成した。また、コ
ンパクトディスク或はレコード盤の如き媒体に収録され
ている音楽情報を使用する音楽情報の曲構成自動抽出方
法を構成した。
【0008】更に、原曲Aおよび伴奏曲Aとしてオリジ
ナルカラオケを使用する音楽情報の曲構成自動抽出方法
を構成した。
【0009】
【発明の実施の形態】この発明は、市販されているコン
パクトディスク或はレコード盤の如き媒体に収録されて
いる音楽情報について、歌声より成る音声部分の有無に
より曲構成を自動的に抽出し、各曲構成の分割点列のす
べてを蓄積しておく。この発明の実施の形態を図1を参
照して説明する。図1は曲構成自動抽出方法の全体の流
れを説明する図である。
【0010】図1において、曲構成自動抽出方法は、音
楽情報を録音することとこれを音楽情報ファイルに保存
することを行なう録音部1と、音楽情報ファイルを加工
して解析ファイルを作成する解析ファイル作成部2と、
解析ファイルを解析して曲構成の抽出を行なう音楽情報
解析部3により実行される。以下、原曲Aについて曲構
成を抽出する場合を例として説明をする。なお、原曲A
とは歌およびそれ以外の音より成る歌入曲をいう。先
ず、録音部1において音楽情報ファイルを作成する。こ
の録音部1の内部構成は図2に示される通りである。入
力部11において、歌入曲である原曲A、一般にオリジ
ナルカラオケと呼ばれている原曲Aから歌声を消去した
もの、或は音声その他の左右両チャネルの中心の位相に
録音されている音を消去する音響装置から出力される伴
奏曲Aの録音を行ない、これらをファイル変換部12に
おいてそれぞれ標本化、量子化を行ない、音楽情報ファ
イルとして蓄積する。
【0011】この録音部1に蓄積された音楽情報ファイ
ルは解析ファイル作成部2において加工される。解析フ
ァイル作成部2の内部構成は図2に示される通りであ
る。解析ファイル作成部2は、録音部1に蓄積された原
曲Aおよび伴奏曲A双方の音楽情報ファイルを解析を行
なうことができる形に加工する。解析に際して両曲のパ
ワーの差分をとる必要があるところから、両曲の同期を
とる。両曲の同期をとるには、先ず、無音検出部21に
おいて両曲の音楽情報ファイルの先頭から後方へ順に、
無音部分の判定のために引数として与えられた閾値より
大なる値をとる点である開始点を検出する。同様に、両
曲の音楽情報ファイルの最後から前方へ順に、閾値より
大なる値をとる点である終了点を検出する。次いで、音
楽部分切出部22において、無音検出部21により検出
された開始点から終了点に到るまでを音楽情報ファイル
から切り出すことにより、原曲Aおよび伴奏曲A双方の
音楽部分のみの解析ファイルを作成する。
【0012】ここで、音楽情報解析部3において解析フ
ァイルをフレーズに分割する。音楽情報解析部3の内部
構成は図2に示される通りである。音楽情報解析部3は
声の区切れる区切れ点である開始点および終了点を決定
する解析部であり、区切れ点以前の無声部分、区切れ点
以降の有声部分の割合が与えられた閾値より大きいこと
を条件とし、閾値を引数として要求する。この割合をM
として説明する。
【0013】先ず、開始点決定部31において原曲Aと
伴奏曲Aとの間の相関をとり、相関値が最も大きな値と
なった両曲の点を開始点とみて両曲の同期を確実にと
る。次いで、図5をも参照するに、差分データ算出部3
2において、両曲について音声認識合成処理において一
般に採用される200ミリ秒のフレーム長毎にフレーム
の先頭のパワーを算出し、原曲Aの先頭のパワーの対数
と伴奏曲Aの先頭のパワーの対数の差分をとり、同様
に、次のフレームの先頭のパワーの差分をとるという様
に、各フレーム毎に差分をとる。
【0014】無声部分閾値決定部33は伴奏のみで歌の
存在しない無声部分を判定する決定部であり、差分デー
タ算出部32において算出された差分が初期値として与
えられた閾値より大である点を先頭の差分から順に探
し、先頭からその点までの範囲内で最大の差分を無声部
分閾値として決定する。区切り候補検出部34は、有声
部分と無声部分とが切り替わる点である区切り点を検出
する。無声部分閾値決定部33において決定された閾値
よりも差分が大きな値をとる点である有声部分を探し、
数曲のサンプル曲から調べたその点以前に間奏が持続す
る最低限の長さ2秒分のデータ範囲について、無声部分
と判断される点と、逆にその点以降歌声が持続する最低
限の長さ2秒分のデータ範囲について、有声部分と判断
される点が検出される割合がMより大きな値をとれば、
その点は有声部分開始点、即ち、区切り点候補となる。
同様に、その点以前の2秒分のデータ範囲で有声部分と
判断される点とその点以降の2秒分のデータ範囲で無声
部分と判断される点が検出される割合がMより大きな値
をとる点も区切り点候補に挙げられる。区切り点候補は
図6において、縦点線により示される通りである。
【0015】不適切候補点検出部35は、区切り点候補
の内の特に無声部分開始に位置する区切り点に注目し、
区切り点として検出すべきではない点である撥音便或は
促音便の区切り点候補を候補から除外する。その条件と
して、当該点候補の前後の差分が図12および図13の
様に推移している場合を正しい点と考え、図7において
×の実線矢印により示される点をこの条件を満足しない
点として除外する。
【0016】カット点候補検出部36はフレーズの区切
れ目の点(以下、カット点と称す)S0 〜Sn を検出す
る。不適切候補点検出部35において、配列に残ってい
る点列の内の、区切り候補検出部34において検出の基
準とされた傾きの最大値の閾値を更に2倍することによ
り、より差分の動きの大きな点をカット点として挙げて
いく。次に、図12の場合は、長い無声部分が続くた
め、立ち上がり直前で差分の変化の上下する部分が生じ
ることを考慮して、差分の立ち上がりが急ではあるがそ
の点以前の4フレームが無声部分と判断不可能な部分は
カット点から除外して図8において縦の点線により示さ
れる点をより正確に有声部分の開始と判断可能な点とし
て選び出す。
【0017】図14および図15を参照するに、歌い出
し点選出部37は、一般に、歌詞で1番、2番といわれ
る各コーラスの開始点の候補点となる歌い出し点P0
nをカット点候補検出部36で選ばれた点列の内から
探す。先ず、コーラス開始点は歌い出し点P0 〜Pn
ら数フレームに渡って無声部分と判断される部分である
前奏部が前に持続して存在していると考える。このこと
から、1フレームを前奏部の長さLの初期値とし、カッ
ト点列の内から当該点から前にL以上無声部分が持続す
る点を選出する。ここにおいては、数曲のサンプル曲か
ら調べた結果から1曲中のコーラスは8以下と考え、全
ての点について調べた結果、開始点が8以上選出された
場合はLが短く該当する点が多く選出されたということ
に等しいため、Lを1フレーム増加させて同様に選出処
理行ない、開始点が8以下となったところで選出処理を
停止する。選出された歌い出し点は図9において、実線
矢印により示される通りである。
【0018】コーラス開始点決定部38は1コーラスお
よび2コーラスについて各コーラス開始点を決定する。
歌い出し点選出部37において選出された歌い出し点列
0〜Pn の内から1コーラスおよび2コーラスの開始
点となるものを選出する。通常は、歌い出し点列の第1
歌い出し点P0 が1コーラスの開始点、第2歌い出し点
1 が2コーラスの開始点となるが、冒頭部分に数フレ
ーズ存在している場合はこの点は1コーラスの開始点の
第1点とはならない。そのために、カット点候補検出部
36で検出されたカット点列S0 〜Sn を利用して、図
9の様に歌い出し列第1点P0 、第2点P1 がカット点
列第1点S0 、第2点S1 に一致している場合には、前
奏から、数フレーズ、1コーラス開始前の間奏、という
構成をとっていると判断し、開始点列第2点P1 を1コ
ーラス開始点とする。コーラス開始点は図10において
実線矢印により示される。
【0019】曲構成検出部39は、1コーラスと2コー
ラスが同じ構成をとっていれば、楽譜上同じ部分に休符
点が生じていることから、同じ部分でカット点が検出さ
れるという条件を満たす点を曲構成開始点として検出す
る。先ず、1コーラスの第1点(Xi )から第2点(X
i+1)までのデータ長(L1 )と、2コーラスの第1点
(Yj )から第2点(Yj+1)までのデータ長(L2)とを
比較し、L1 =L2 であれば各コーラスの第1点と第2
点に挟まれたフレーズが同じと考えられ、第1点から第
2点までが第1曲構成となる。同様に、Xi 、Yj にそ
れぞれ第2点を代入し、Xi+1 、Yj+1 にそれぞれ第3
点を代入してデータ長L1 とデータ長L2とを比較して
行く。
【0020】この際、各コーラスの間に歌法の差があっ
て、カット点にずれが生じていることも考えられる。そ
こで、両コーラスのデータ長を比較する際に、データ長
が等しいものとみなすずれ幅Wを設定する。ずれ幅Wの
初期値を0とし、 絶対値|L1 −L2W・・・・・(a) の時、同じフレーズが存在するとみなす。ここで、ずれ
幅W=0であるものと設定すると、この場合は全く同じ
ところにカット点が現れていなくては、同じフレーズが
存在しているとみなさないということになる。そこで、 絶対値|L1 −L2 |>W・・・・・(b) となる場合、Xi+1 に1コーラス第3点を代入する。即
ち、L1 を1コーラスの第1点から第3点までのデータ
長とし、L2 と比較する。この様にして式(a)が成り
立つ場合は1コーラスの第1点から第3点までと2コー
ラスの第1点から第2点までに同じフレーズが存在して
おり、第1曲構成ということになる。式(a)が成り立
たない場合、Xi+1 を第2点に戻し、Yj+1 を1増や
す。即ち、2コーラスの方の当該データ長を変化させて
同様に比較を行なう。第1曲構成部分が決定されれば、
各コーラスの第1曲構成の終止点をXi 、Yj とし、次
のカット点候補をXi+1 、Yj+1 として同様に比較決定
を行なう。
【0021】ずれ幅Wにより分割処理を進めて行き、分
割処理が終了した時点において、各コーラスが3分割以
上5分割以下の数に分割されているか否かを調べる。な
お、この3分割以上5分割以下という数は数曲のサンプ
ル曲を調査した結果得られた統計的な構成数である。該
当分割数がこの範囲内に収まっている場合、分割処理は
終了する。分割数がこの範囲内に収まっていない場合
は、ずれ幅Wを1フレーム増加させて再度第1点から分
割処理を行なっていく。以上の処理により獲得された各
曲構成の開始点のみを構成点列として記憶する。曲構成
に分割された結果は図11において、実線両方向矢印に
より示される通りである。
【0022】
【発明の効果】以上の通りであって、この発明は、曲構
成毎の開始点を自動的に獲得することができるので、曲
構成分割に使用した音楽情報と各曲構成の開始点を対応
させることにより、曲構成の開始点を指定すれば、終了
点を模索することなしに、自動的に曲構成に則ったダイ
ジェスト情報を作成することができる。
【0023】そして、指定されたダイジェスト情報をは
さみ、提示するダイジェスト情報の長さを変化させるこ
とが必要な場合でも、曲構成毎に区切られているので、
時間だけを優先し、音楽的な構成を無視して歌声の途中
で区切られるということはない。また、各曲構成の開始
点のみを点列で格納してよいことから、少ない記憶容量
で音楽情報を提示したい場合においても応用することが
できる。
【図面の簡単な説明】
【図1】この発明の曲構成分割の全体の構成を説明する
図。
【図2】録音部の処理の流れを説明する図。
【図3】解析ファイル作成部の処理の流れを説明する
図。
【図4】音楽情報解析部の処理の流れを説明する図。
【図5】差分データの変化を示す図。
【図6】検出された区切り候補点を示す図。
【図7】区切り候補点の内の曲構成の区切りとはなり得
ない不適切候補点を示す図。
【図8】カット点候補点を示す図。
【図9】歌い出し点を示す図。
【図10】コーラス開始点を示す図。
【図11】曲構成に分割された結果を示す図。
【図12】長い休符付近の差分データの変化を示す図。
【図13】短い休符付近の差分データの変化を示す図。
【図14】歌い出し点とコーラス開始点の関係を示す
図。
【図15】歌い出し点選出部の処理の流れを説明する
図。
【図16】曲構成検出部の処理の流れを説明する図。
【符号の説明】
1 録音部 11 入力部 12 ファイル変換部 2 解析ファイル作成部 21 無音検出部 22 音楽部分切出部 3 音楽情報解析部 31 開始点決定部 32 差分データ算出部 33 無声部分閾値決定部 34 区切り候補検出部 35 不適切候補点検出部 36 カット点候補検出部 37 歌い出し点選出部 38 コーラス開始点決定部 39 曲構成検出部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 15/10

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 1或は2以上の音響および音声を含む音
    楽情報からこの音楽情報における音声或はメロディを含
    んだ有声部分を無声部分を使用して検出分離し、検出さ
    れた有声部分から音楽の一区切りであるフレーズを検出
    して、検出されたフレーズに基づいて音楽情報を曲構成
    に分割する音楽情報の曲構成自動抽出方法において、 曲構成の開始点および終了点を検出し、開始点のみを指
    定することにより 音楽情報を曲構成に分割することを特
    徴とする音楽情報の曲構成自動抽出方法。
  2. 【請求項2】 請求項1に記載される音楽情報の曲構成
    自動抽出方法において、歌入曲である原曲Aおよび原曲
    Aから歌声を消去した伴奏曲Aの双方を音楽情報ファイ
    ルとして録音し、録音された音楽情報ファイルを加工し
    て原曲Aおよび伴奏曲A双方の音楽部分のみの解析ファ
    イルを作成し、この音楽部分のみの解析ファイルを解析
    することを特徴とする音楽情報の曲構成自動抽出方法。
  3. 【請求項3】 請求項1および請求項2の内の何れかに
    記載される音楽情報の曲構成自動抽出方法において、コ
    ンパクトディスク或はレコード盤の如き媒体に収録され
    ている音楽情報を使用することを特徴とする音楽情報の
    曲構成自動抽出方法。
  4. 【請求項4】 請求項3に記載される音楽情報の曲構成
    自動抽出方法において、原曲Aおよび伴奏曲Aとしてオ
    リジナルカラオケを使用することを特徴とする音楽情報
    の曲構成自動抽出方法。
JP24641995A 1995-09-25 1995-09-25 音楽情報の曲構成自動抽出方法 Expired - Fee Related JP3388481B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP24641995A JP3388481B2 (ja) 1995-09-25 1995-09-25 音楽情報の曲構成自動抽出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24641995A JP3388481B2 (ja) 1995-09-25 1995-09-25 音楽情報の曲構成自動抽出方法

Publications (2)

Publication Number Publication Date
JPH0990978A JPH0990978A (ja) 1997-04-04
JP3388481B2 true JP3388481B2 (ja) 2003-03-24

Family

ID=17148205

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24641995A Expired - Fee Related JP3388481B2 (ja) 1995-09-25 1995-09-25 音楽情報の曲構成自動抽出方法

Country Status (1)

Country Link
JP (1) JP3388481B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56103898U (ja) * 1980-01-10 1981-08-14
JP4961300B2 (ja) * 2006-08-14 2012-06-27 三洋電機株式会社 楽曲一致判定装置、楽曲記録装置、楽曲一致判定方法、楽曲記録方法、楽曲一致判定プログラム、及び楽曲記録プログラム
JP2008241850A (ja) * 2007-03-26 2008-10-09 Sanyo Electric Co Ltd 録音または再生装置
CN102754159B (zh) 2009-10-19 2016-08-24 杜比国际公司 指示音频对象的部分的元数据时间标记信息

Also Published As

Publication number Publication date
JPH0990978A (ja) 1997-04-04

Similar Documents

Publication Publication Date Title
Gómez et al. Towards computer-assisted flamenco transcription: An experimental comparison of automatic transcription algorithms as applied to a cappella singing
US7058889B2 (en) Synchronizing text/visual information with audio playback
Soulez et al. Improving polyphonic and poly-instrumental music to score alignment
EP1909263B1 (en) Exploitation of language identification of media file data in speech dialog systems
US7488886B2 (en) Music information retrieval using a 3D search algorithm
Brossier Automatic annotation of musical audio for interactive applications
EP3843083A1 (en) Method, system, and computer-readable medium for creating song mashups
JP4344499B2 (ja) 音楽データベースの検索
US10235981B2 (en) Intelligent crossfade with separated instrument tracks
McNab et al. Tune retrieval in the multimedia library
Lu Indexing and retrieval of audio: A survey
JP2002014691A (ja) ソース音声信号内の新規点の識別方法
Haus et al. An audio front end for query-by-humming systems
Ellis et al. Classification-based melody transcription
Fujihara et al. Lyrics-to-audio alignment and its application
Eggink et al. Extracting Melody Lines From Complex Audio.
Zhang et al. System and method for automatic singer identification
Rao et al. Structural Segmentation of Alap in Dhrupad Vocal Concerts.
JP3388481B2 (ja) 音楽情報の曲構成自動抽出方法
JP5131904B2 (ja) 音楽音響信号と歌詞の時間的対応付けを自動で行うシステム及び方法
Gómez Gutiérrez et al. A quantitative comparison of different approaches for melody extraction from polyphonic audio recordings
Zhang Semi-automatic approach for music classification
Zhang et al. Automatic generation of music thumbnails
CN113646756A (zh) 信息处理装置、方法以及程序
Carpenter et al. Rhythm in the speech and music of jazz and riddim musicians

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090117

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090117

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100117

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110117

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110117

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120117

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130117

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees