JPH0667654A - 自動採譜装置 - Google Patents

自動採譜装置

Info

Publication number
JPH0667654A
JPH0667654A JP4220360A JP22036092A JPH0667654A JP H0667654 A JPH0667654 A JP H0667654A JP 4220360 A JP4220360 A JP 4220360A JP 22036092 A JP22036092 A JP 22036092A JP H0667654 A JPH0667654 A JP H0667654A
Authority
JP
Japan
Prior art keywords
percussion instrument
time
percussion
frequency
pitch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4220360A
Other languages
English (en)
Inventor
Chiyuuki Kiyuu
中奇 邱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP4220360A priority Critical patent/JPH0667654A/ja
Publication of JPH0667654A publication Critical patent/JPH0667654A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Auxiliary Devices For Music (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】 【目的】 計算機による打楽器の打撃時刻の抽出及びそ
の種類の識別を自動的に行い、なおかつ、実時間的処理
を実現することのできる自動採譜装置を提供することを
目的としている。 【構成】 デジタル音楽信号の直流成分を除去する信号
をARモデルによってモデリングし、RLSアルゴリズ
ムによるARモデル係数を逐次的に推定する。また、上
記のARモデル係数列を入力とし打楽器信号の時間−周
波数スペクトルを計算し、この時間−周波数スペクトル
に対する最大パワーを持つピッチの時刻を検出する。さ
らに、上記の最大パワーを持つピッチの時刻におけるA
Rモデル係数を取り込み、ニュートン法によるARモデ
ルの極を計算し、その極によって算出したピッチの周波
数、帯域幅及びパワーに基づいて打楽器の候補を抽出す
る。最後に、上記の打楽器候補と打楽器の標準パターン
との照合によって打楽器の種類の識別を行なう。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、自動採譜装置に関する
ものである。
【0002】
【従来の技術】従来、打楽器の識別に対しては、音楽専
門家が長年訓練を積んだ知識に基づき繰り返し作業によ
って行なわれている。
【0003】近年、デジタル信号処理技術の進歩に伴
い、計算機による自動採譜の試みが行なわれるようにな
ってきたが、現在では単一楽音かつ有音程楽器(例えば
バイオリン、ピアノ等)に対しては、相当な実用的なレ
ベルまで成果が得られている。上記の有音程楽器の自動
採譜を行なうための分析手法としては、一般的に高速フ
ーリエ変換法が用いられている。しかし、打楽器の音は
一般に、他の音程を持つ楽器音に比べて、立ち上がり時
の振幅変化が急激であり、また、明確な倍音構造を持た
ず連続スペクトルを多く含むような特徴を持っている。
また、打楽器の音色は、打楽器自体の状態と演奏の状態
という二つの要素によって決定されるものと考えられる
ことができる。打楽器自体の状態とは、打楽器の材質、
構造、膜のある打楽器では、膜の張り方等を指し、これ
らは音に対してピッチや、生じるスペクトル成分の種類
等に強く影響を与えると考えられる。また、演奏の状態
とは、叩くものの材質、叩く強さ、叩き方等を指し、ス
ペクトルの時間変化、スペクトル成分の分布、振幅の時
間変化等に強く影響を与えると考えられる。それで、こ
のような特徴より、打楽器音の分析に一般的に用いられ
ている高速フーリエ法は、時間領域、周波数領域と共に
高い分解能が必要となり、打楽器の分析には適した方法
とは言えない。
【0004】また、特願平3ー305031号の出願において
は、適応ラテイスフィルタを用いた打楽器の打撃時刻を
自動的に抽出する手法を提案した。これは、音楽信号を
適応ラテイスフィルタの入力とし、その出力を打楽器打
撃時刻候補とし、さらに、打撃時刻候補を幾つかの部分
区間に分けて、しきい値処理によって打撃時刻決定候補
を選択し、さらに、各局所的な区間における最も大きな
値を持つ打撃時刻決定候補を打楽器の打撃時刻として抽
出するものである。しかし、特願平3ー305031号の出願で
は、打楽器の打撃時刻を自動的に抽出する手法に限って
おり、打楽器の種類の識別については言及していない。
【0005】
【発明が解決しようとする課題】しかしながら、人手作
業による打楽器の識別では、音楽専門家が豊富な知識を
持っていても、繰り返し聞き取りの作業に、長い時間が
かかったり、音響の小さい打楽器を聞き取りにくい時も
ある。そこで、計算機による打楽器を自動的に識別する
システム、あるいは専門家でなくても識別作業を行なう
ことのできる支援システムの開発が求められている。
【0006】本発明は、上述した問題点を解決するため
になされたものであり、立ち上がりが急激で連続スペク
トルを多く持つ打楽器の分析及び識別に、適応信号処理
手法を利用するものである。これは適応信号処理の手法
により、人手による聞き取りの作業をなくし、また、従
来の手法(高速フーリエ法など)によって処理しにくい
打楽器の時変特性を抽出することができ、計算機による
打楽器の打撃時刻の抽出及びその種類の識別を自動的に
行い、なおかつ、実時間的処理を実現することのできる
自動採譜装置を提供することを目的としている。
【0007】
【課題を解決するための手段】この目的を達成するため
に本発明の自動採譜装置は、デジタル音楽信号を微分フ
ィルタを通過させることにより直流成分を除去する前処
理部と、上記の微分フィルタの出力をARモデルによっ
てモデリングしRLSアルゴリズムによるARモデル係
数を逐次的に推定するARモデル係数列推定部と、上記
のARモデル係数列を入力とし打楽器信号の3次元スペ
クトルを計算する時間−周波数スペクトル計算部と、上
記の時間−周波数スペクトルに対する最大パワーを持つ
ピッチの時刻を抽出する検出部と、上記の最大パワーを
持つピッチの時刻におけるARモデル係数を取り込み、
ニュートン法によるARモデルの極を計算し、その極に
よって算出したピッチの周波数、帯域幅及びパワーに基
づいて打楽器かどうか判別する打楽器候補抽出部と、上
記の打楽器候補と打楽器の標準パターンとの照合によっ
て打楽器の種類を識別する打楽器種類判定部と、上記の
打楽器の標準パターンを決定するため、既知の打楽器に
対しその特性を分析し最も一般性をもつ特徴を抽出する
標準パターン決定部と、打楽器の標準パターンを蓄積す
る標準パターン格納部とを備えている。
【0008】
【作用】上記の構成を有する本発明の自動採譜装置で
は、デジタル音楽信号が微分フィルタを通過させて直流
成分を除去する信号をARモデルによってモデリング
し、RLSアルゴリズムによるARモデル係数を逐次的
に推定する。また、上記のARモデル係数列を入力とし
打楽器信号の時間−周波数スペクトルを計算し、この時
間−周波数スペクトルに対する最大パワーを持つピッチ
の時刻を検出する。さらに、上記の最大パワーを持つピ
ッチの時刻におけるARモデル係数を取り込み、ニュー
トン法によるARモデルの極を計算し、その極によって
算出したピッチの周波数、帯域幅及びパワーに基づいて
打楽器かどうか判別し、打楽器の候補を抽出する。最後
に、上記の打楽器候補と打楽器の標準パターン(これ
は、既知の打楽器に対しその特性を分析し最も一般性を
もつ特徴である)との照合によって打楽器の種類の識別
を行なう。
【0009】
【実施例】以下、本発明を具体化した一実施例を図面を
参照して説明する。
【0010】図1には、音楽源から打楽器MIDI(音
楽用標準インタフュース)データの作成及びシンセサイ
ザーの合成までの全体の構成を示したブロック図を示
す。図1において、音楽源102に接続されたA/Dコ
ンバータ104は、前処理部106においては、微分フ
ィルタによって直流成分を除去したデジタル音楽信号x
(n)108を生成する。生成されたデジタル音楽信号x
(n)108は打楽器打撃時刻の抽出部110と打楽器の
識別部112にそれぞれ入力され、打楽器の打撃時刻の
抽出と打楽器種類の識別を行う。さらに、抽出した打楽
器の打撃時刻と識別した打楽器の種類は、打楽器のMI
DI作成部114に入力され、打楽器のMIDIデータ
が作成される。最後に、作成したMIDIをシンセサイ
ザー116に入力し、音楽源に含まれる打楽器音を合成
する。
【0011】図2は図1における打楽器識別部112の
構成を示したブロック図であり、それは本発明を具体化
したものである。図2において、図1の打楽器打撃時刻
抽出部110の出力及び前処理部106によって処理し
たデジタル音楽信号x(n)をARモデル係数列推定部20
2に入力し、打撃時刻を起点とする打楽器信号をARモ
デルによってモデリングしそのARモデル係数列を求め
て、蓄積メモリ208に保存する。時間−周波数スペク
トル計算部204では、上記のARモデル係数列を取り
込み、時間−周波数パワースペクトルを計算して、蓄積
メモリ208に保存する。
【0012】最大パワーを持つピッチ時刻検出部206
では、蓄積メモリ208より時間−周波数行列を読み込
み、これに対し時間軸と周波数軸からなる平面上の最大
値をもつパワーを抽出し、この最大パワーに対応する時
刻の検出を行なう。打楽器候補抽出部210では、上記
の最大パワーを持つピッチの時刻におけるARモデル係
数を蓄積メモリ208より取り込み、ニュートン法によ
るARモデルの極を計算し、その極によって算出したピ
ッチの周波数、帯域幅及びパワーに基づいて打楽器かど
うか判別する。標準パターン決定部216では、標準打
楽器(例えば、ドラムマシンのデータ)に対し、それぞ
れの時間−周波数パワースペクトルを求めて、その最大
値をもつピッチの周波数、帯域幅およびパワーを抽出
し、標準パターン格納部214に蓄積する。
【0013】打楽器種類判定部212では、打楽器候補
抽出部210の出力となる打楽器候補と標準パターンと
の照合によって打楽器の種類を識別し、図1における打
楽器の打撃時刻抽出部110の出力と共に打楽器MID
Iの作成部114の入力とする。
【0014】図3は実際のデジタル音楽信号x(n)に対
し、ARモデルによってモデリングし、ARモデル係数
をRLS適応アルゴリズムによって逐次的に推定する原
理図である。図3のx(n)は実際のデジタル音楽信号であ
り、信号x(n-1)とy(n)は適応フィルタとも呼ばれる30
4の入力と出力信号であり、信号e(n)はx(n)とy(n)の差
で定義される予測誤差である。記号zー1302は遅れ要
素を表わし、すなわち、入力信号x(n)を1サンプル遅延
させて、信号x(n-1)を生じるものである。図3の加算器
306は、予測値y(n)が入力信号x(n)から差し引かれ、
予測誤差e(n)を生成するものである。全体の動作は、音
楽信号x(n)を望みの応答として、予測誤差e(n)=x(n)−
y(n)をある意味で最小とするように、RLS適応アルゴ
リズムによりARモデルの係数を調整することである。
適応フィルタ304の入力と出力関係は、適応フィルタ
の次数をmとするとき、次式で与えられるものとする。
【0015】 y(n)=w1nx(n-1)+w2nx(n-2)+ ・・・・・・・ wmnx(n-m) (1) ここに、win(1≦i≦m)は時刻nにおけるARモデルの係
数を表わす。
【0016】式(1)のベクトル表現は次式で与えられ
る。
【0017】 y(n)=wT(n)x(n) (2) ここに、“T”は行列及びベクトルの転置を表わし、列
ベクトルx(n)およびw(n)は次式で与えられる。
【0018】x(n)=[x(n-1) x(n-2)・・・ x(n-m)]T w(n)=[wn1 wn2 ・・・・ wnmT 図3より、予測誤差e(n)は次式で与えられる。
【0019】 e(n)=x(n)−y(n) =x(n)−xT(n)w(nー1) (3) RLS適応アルゴリズムでは、以下の手続きによりAR
モデルの係数が更新される。
【0020】RLS適応アルゴリズム 次の初期条件: 指定整数 c 単位行列 I 相関行列 Φ(0)=cI 相関行列の逆行列 P=c-1I 係数ベクトル w(0)=0 ARモデルの次数 m 忘却係数 0<λ≦1 打楽器の打撃時刻 DS 推定区間 L で出発し、以下のように進む。
【0021】(1) n=DSとする。
【0022】(2) ゲインベクトルを計算する。
【0023】
【数1】
【0024】(3) 予測誤差を計算する。
【0025】 e(n)=x(n)−y(n) =x(n)−xT(n)w(nー1) (4) 係数ベクトルの推定値を計算する。
【0026】w(n)=w(nー1)+k(n)e(n) (5) 相関行列を更新する。
【0027】 P(n)=λー1(P(n-1)−k(n)xT(n)P(n-1)) (6) nがDS+Lより小さい時、n=n+1としてス
テップ2に戻り、手続きを繰り返す。nがDS+Lより
大きい場合、推定を終了させる。
【0028】上記のRLS適応アルゴリズムにおけるパ
ラメータλは通常、忘却係数と呼ばれており、0<λ≦1
の性質を持つ。忘却係数λを用いるのは、適応アルゴリ
ズムが非定常な入力信号データに対して予測動作を行な
う時、入ってくるデータの統計的変動に追従する可能性
を得るために、遠い過去のデータを”忘れる”ためであ
る。ここで忘却係数λは1以下の正のスカラー量であ
る。おおよそ(1ーλ)の逆数が適応アルゴリズムの記憶測
度になっている。つまり、忘却係数λ=1の場合には適
応アルゴリズムにおけるk(n)とP(n)を計算する際、す
べての過去のデータに等しく重みが付けられる。一方、
忘却係数λ<1の場合、過去のデータは指数的に減衰
し、更新計算をするうえで現在のデータが過去のデータ
よりも大きな影響を持つという結果になる。
【0029】また、上述したように、打楽器の音は一般
に、他の音程を持つ楽器音に比べて、立ち上がり時の振
幅変化が急激であり、また、明確な倍音構造を持たず連
続スペクトルを多く含むような特徴を持っている。それ
で、このような特徴より、打楽器音の分析に一般的に用
いられている高速フーリエ法は、時間領域、周波数領域
と共に高い分解能が必要となり、打楽器の分析には適し
た方法とは言えない。これに対して、RLS適応アルゴ
リズムは、忘却係数λを用いるため、時間と共に変化す
るパラメータの追従に有効である。また、以下に述べる
ように、ARモデルから直接にパワースペクトルを求め
ることができることで、周波数領域においても打楽器の
時変特性を抽出することが可能である。
【0030】図2の時間−周波数スペクトル計算部20
4では、ARモデル係数列推定部202の出力となるA
Rモデル係数列を取り込み、以下のように時間−周波数
パワースペクトルを計算することができる。
【0031】すなわち、時変係数を持つARモデルの伝
達関数は次式で与えられる。
【0032】
【数2】
【0033】また、入力信号が平均値零、分散σ2の白
色雑音であるとすると、出力信号x(n)の時間−周波数パ
ワースペクトルは
【0034】
【数3】
【0035】で与えられる。すなわち、出力信号のパワ
ースペクトルを、周波数伝達関数の振幅特性と白色雑音
入力の分散で表わすことができる。以上のことから、σ
2および時間的に変化するARモデル係数a1n,a2n,・・・
・・・,amnを決めることができれば、音楽信号x(n)の時間
−周波数パワースペクトルを推定することができる。
【0036】分散σ2については、以下に述べる理由に
より正規化する必要がある。すなわち、打楽器の音色
は、打楽器自体の状態と演奏の状態という二つの要素に
よって決定されるものと考えられることができる。打楽
器自体の状態によっては、音に対してピッチや、生じる
スペクトル成分の種類等に強く影響を与え、また、演奏
の状態によっては、スペクトルの時間変化、スペクトル
成分の分布、振幅の時間変化等に強く影響を与えると考
えられる。特に、演奏の状態という叩き強度により同じ
打楽器であっても、その信号の振幅が違うため、求める
分散もそれぞれ異なっている。従って、このような演奏
の状態による影響を避けるために、分散σ2をある定数
に固定した方が良いと考えられる。
【0037】時間的に変化するARモデル係数a1n,a2n,
・・・・・・,amnについては、図3の説明に述べたように、R
LS適応アルゴリズムにより推定したARモデル係数列
wn1wn2 ・・・・ wnm (DS≦n<DS+L)は、時間的に
変化するARモデル係数a1n,a2n,・・・・・・,amnの推定値
となっており、従って、推定値列wn1 wn2 ・・・・ wnm(D
S≦n<DS+L)を順次に式(5)に代入すれば、音楽
信号の時間−周波数パワースペクトルを求めることがで
きる。
【0038】図4は図2の最大パワーを持つピッチ時刻
検出部206についての詳細を示したフローチャートで
ある。図中のステップS1では、時間−周波数パワース
ペクトル行列P(f,n)を入力し、抽出しようとする最大
値gmaxを初期化する。ステップS2は時間軸カウンタ
nを初期化するものであり、ステップ3は、カウンタn
が指定範囲Nを越えたかどうか判断するものである。指
定範囲Nの外にある場合には、ループを終了させる。指
定範囲Nの内にある場合には、ステップ5で周波数軸の
カウンタfを初期化し、ステップ6に入る。ステップ6
では、周波数軸のカウンタfが指定範囲Fを越えたかど
うか判断し、範囲Fの外の場合には、時間軸n=n+1
にし、ステップ3に戻る。指定範囲Fの内の場合には、
maxとP(f,n)との比較を行う。gmaxが大きい場合に
は、周波数カウンタfをf+1にし、ステップ6に戻
る。そうではない場合には、gmax=P(f,n), nmax
nにし、周波数カウンタfをf+1に加算し、ステップ
6に戻る。最終の結果は、最大パワーgmaxとその時刻
maxとなっており、図2の打楽器候補抽出部210の
入力とする。
【0039】図5は図2の打楽器候補抽出部210につ
いての詳細を示したフローチャートである。ステップ1
0では、最大パワーを持つピッチ時刻検出部206の結
果を受け取ると同時に、図2に示す蓄積メモリ208か
ら最大パワーを持つ時刻nma xにおけるARモデル係数
ベクトルを読み込む。ステップ11では、ニュートン法
によるARモデルの極を求める。ARモデルの極とは、
式(4)の分母をゼロにする多項方程式の解と呼ばれ、次
式で与えられる。
【0040】 1+a1nz-1+a2nz-2+ ・・・・ +amnz-m=0 (6) ステップ12では、極によるピッチの周波数、帯域幅お
よびパワーを算出する。ここでは、極を次式により表わ
されるとすると、 zi=rie(jλi) (7) それに対応する周波数及び帯域幅がそれぞれ次式で与え
られる。
【0041】 周波数fi=|λi|/2πT (8) 帯域幅bi=log(ri)/πT (9) また、周波数fiに対応するパワーは、周波数fiを式
(5)に代入すれば求めることができる。
【0042】ステップ13では、帯域幅が指定値より小
さいかどうか判断する。大きい場合には、識別しようと
する打楽器のピッチではないと考え、次のピッチへステ
ップ12に戻る。指定値より小さい場合には、ステップ
14においてそのパワーが指定した値より大きいかどう
か判断する。小さい場合には、ステップ15の次のピッ
チへステップ12に戻るが、大きい場合には、打楽器の
候補として図2の打楽器種類判定部212の入力とす
る。
【0043】図6は図2の打楽器打楽器種類判定部21
2についての詳細を示したフローチャートである。ステ
ップ16では、図2の打楽器候補抽出部210より識別
しようとする打楽器の周波数fmaxと図2の標準パター
ン格納部214から打楽器の標準ベクトルfp(i)を取り
込む。ステップ17は、打楽器の標準種類のカウンタi
を初期化するものであり、ステップ18は、カウンタi
が打楽器種類数Nを越えたかどうか判断するものであ
る。カウンタiがNより小さい場合には、ステップ19
において次式によって標準周波数との幾何距離を求め
る。すなわち、 D(i)=|fmax−fp(i)|=(f2 max−(fp(i))21/2 (10) ステップ21では、ステップ19で計算した結果D(i)
を蓄積する。同時にステップ21では、カウンタi=i
+1にし、ステップ18に戻る。
【0044】カウンタiがNより大きい場合には、ステ
ップ22では、蓄積メモリから距離系列D(i)(0≦i
<N)を読み込み、それらに対して最小値Dminを抽出
する。抽出した最小値Dminに対応するi番打楽器は識
別した結果になり、その結果を図1における打楽器MI
DI作成部114に入力し、打楽器音の合成を行なう。
【0045】図2の標準パターン決定部216では、上
述したように、打楽器の標準パターンを決定するため、
既知の打楽器に対しその特性を分析し最も一般性をもつ
特徴の抽出を行なう。手順としては、図1において、標
準打楽器音楽源102に接続されたA/Dコンバータ1
04は、前処理における微分フィルタ106によって直
流成分を除去したデジタル音楽信号x(n)108を生成す
る。生成されたデジタル音楽信号x(n)108は打楽器打
撃時刻の抽出部110と打楽器の識別部112にそれぞ
れ入力され、打楽器の打撃時刻の抽出と打楽器種類の識
別を行う。また、図2においては、打楽器打撃時刻抽出
部110の出力及び微分フィルタ106によって処理し
たデジタル音楽信号x(n)をARモデル係数列推定部20
2に入力し、打撃時刻を起点とする打楽器信号のARモ
デル係数列を求めて、蓄積メモリ208に保存する。時
間−周波数パワースペクトル計算部204では、上記の
ARモデル係数列を取り込み、時間−周波数スペクトル
を計算して、蓄積メモリ208に保存する。最大パワー
を持つピッチ時刻検出部206では、上記の時間−周波
数行列に対し、時間軸と周波数軸からなる平面上の最大
値パワーを抽出し、それに対応する時刻の検出を行な
う。打楽器候補抽出部210では、上記の最大パワーを
持つピッチの時刻におけるARモデル係数を蓄積メモリ
208より取り込み、ニュートン法によるARモデルの
極を計算し、最大パワーを持つピッチに対応する極によ
ってそのピッチの周波数、帯域幅及びパワーを算出し、
打楽器の事前知識として決定し、図2の標準パターン格
納部214に蓄積する。
【0046】図7、図8および図9は、上記の打楽器の
事前知識を如何に決定するかを説明するために実際の打
楽器の時間−周波数パワースペクトルを図示した例であ
る。
【0047】図7は打楽器CLAVESの音響信号を周波数1
2kHzでサンプリングし、上記の手順によって求めた
時間−周波数特性である。また、矢印tの方向は時間を
表わし、矢印Sの方向は周波数を表わす。この時間−周
波数パワースペクトルから判るように、打楽器CLAVES
は、打楽器の打撃時刻(スペクトルが急に上がるとこ
ろ)より全周波数領域において殆ど一つの大きなピッチ
によって表わされ、その周波数は2kHzのあたりにあり、
また、打撃時刻においては最も大きなパワーを持つこと
である。
【0048】図8は打楽器TAMBOURINEの音響信号を同じ
周波数でサンプリングし、上記の手順によって求めた時
間−周波数特性である。打楽器TAMBOURINEは打楽器の打
撃時刻より、打楽器CLAVESに比べてピッチがそんなに鋭
くないが、全周波数領域において殆ど一つの大きなピッ
チによって表わされ、その周波数は5.2kHzのあたりにあ
ることが判る。
【0049】図9は同じ打楽器信号に対し、図3のRL
Sアルゴリズムにおける忘却係数に関する考察である。
図9の(a)では忘却係数を1、図9の(b)では忘却係数を
0.99にした。図9の(a)の時間−周波数パワースペクト
ルは全体の波形が平滑で、余計のピッチが少ないが、打
楽器の特徴を表わすピッチはその周波数、帯域幅および
パワーが時間と共に殆ど変化しないことが判る。
【0050】一方、図9の(b)時間−周波数パワースペ
クトルは全体の波形がそれほど平滑でないが、打楽器の
特徴を表わすピッチはその周波数、帯域幅、特にパワー
が時間と共に変化することが判る。
【0051】打楽器の特徴は、すでに述べたようにその
振動周波数と振幅パワーが時間と共に減衰することであ
る。図9の(a)の忘却係数w=1の場合には、RLS適応
アルゴリズムにおけるk(n)とP(n)を計算する際、すべ
ての過去のデータに等しく重みが付けられるので、打楽
器の特徴の変化を追従することができなくなり、一方、
忘却係数w<1の場合、過去のデータは指数的に減衰
し、更新計算をするうえで現在のデータが過去のデータ
よりも大きな影響を持つという結果になるので、打楽器
の特徴変化が追従できると考えられる。
【0052】一方、実際の打楽器の演奏には、打楽器と
打楽器との時間間隔が極めて短い場合がある。すなわ
ち、前者の打楽器の音響はまだ消えていないうちに、後
者の打楽器の音響がすでに始まることになっている。こ
のような打楽器の音響に対し、後者の打楽器を分析し識
別しようとする場合には、上記のRLS適応アルゴリズ
ムにおける忘却係数を1にすると、前者の打楽器の音響
も一緒に処理されるため、正確な打楽器の特徴を抽出す
ることは困難であると考えられる。しかし、RLS適応
アルゴリズムにおける忘却係数を1より小さくする場合
には、適応アルゴリズムが処理しながら、前者の打楽器
の影響を“忘却”する効果を持ち、前者の打楽器からの
影響を最小限にする役割を果たすため、正確な打楽器の
特徴を抽出することは可能であると考えられる。
【0053】従って、本発明では、図3におけるRLS
適応アルゴリズムの忘却係数を1より小さい値にした。
【0054】なお、上記の説明において、適応処理手法
により立ち上がりが急激で連続スペクトルを多く持つ打
楽器の分析及び識別を考慮したが、それに限られるもの
ではなく、その特性が時間と共に変化し、一般的な手法
により処理することが困難な楽器の識別にも適用するこ
とが可能である。
【0055】
【発明の効果】従来では、人手作業による打楽器の識別
が音楽専門家の豊富な知識によって行なわれていた。こ
れには、専門家の繰り返し聞き取りの作業に、長い時間
がかかったり、音響の小さい打楽器を聞き取りにくい問
題点がある。そこで、計算機による打楽器を自動的に識
別するシステム、あるいは専門家でなくても識別作業を
行なうことのできる支援システムの開発が求められてい
る。また、打楽器の特徴より、打楽器音の分析に一般的
に用いられている高速フーリエ法は、時間領域、周波数
領域と共に高い分解能が必要となり、打楽器の分析には
適した方法とは言えない。
【0056】本発明は、上述した問題点を解決するため
になされたものであり、立ち上がりが急激で連続スペク
トルを多く持つ打楽器の分析及び識別に、適応信号処理
手法を利用するものである。これは適応信号処理の手法
により、人手による聞き取りの作業をなくし、また、従
来の手法(高速フーリエ法など)によって処理しにくい
打楽器の時変特性を抽出することができ、計算機による
打楽器の打撃時刻の抽出及びその種類の識別を自動的に
行い、なおかつ、実時間的処理を実現することが可能で
ある。
【図面の簡単な説明】
【図1】図1は打楽器MIDIデータを作成する全体の
構成を示したブロック図である。
【図2】図2は打楽器を識別するための識別部の全体の
構成を示したブロック図である。
【図3】図3はRLS適応アルゴリズムによるパラメー
タ推定の原理図である。
【図4】図4は最大ピッチ検出についての詳細を示すフ
ローチャート図である。
【図5】図5は打楽器候補抽出部についての詳細を示す
フローチャート図である。
【図6】図6は打楽器種類判定部についての詳細を示す
フローチャート図である。
【図7】図7は打楽器CLAVESの信号に対する3次元スペ
クトルを示す図である。
【図8】図8は打楽器TAMBOURINEの信号に対する3次元
スペクトルを示す図である。
【図9】図9は異なる忘却係数による打楽器CLAVES信号
の3次元スペクトルを示す図である。
【符号の説明】
102 音楽源 104 A/Dコンバータ 106 前処理部 108 デジタル音楽信号 110 打楽器打撃時刻抽出部 112 打楽器識別部 114 打楽器MIDIの作成部 116 シンセサイザー 202 ARモデル係数列推定部 204 時間−周波数スペクトル計算部 206 最大パワーを持つピッチ時刻検出部 208 蓄積メモリ 210 打楽器候補抽出部 212 打楽器種類判定部 214 標準パターン格納部 216 標準パターン決定部 302 遅延要素 304 適応アルゴリズムによるARモデル係数推定 306 加算器

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 音楽信号に対し、その打楽器を自動的に
    識別する自動採譜装置において、 デジタル音楽信号の直流成分を除去する前処理部と、 上記の微分フィルタの出力をARモデルによってモデリ
    ングしRLSアルゴリズムによるARモデル係数を逐次
    的に推定するARモデル係数列推定部と、 上記のARモデル係数列を入力とし打楽器信号の3次元
    スペクトルを計算する時間−周波数スペクトル計算部
    と、 上記の時間−周波数スペクトルに対する最大パワーを持
    つピッチの時刻を抽出する検出部と、 上記の最大パワーを持つピッチの時刻におけるARモデ
    ル係数を取り込み、ARモデルの極を計算し、その極に
    よって算出したピッチの周波数、帯域幅及びパワーに基
    づいて打楽器かどうか判別する打楽器候補抽出部と、 上記の打楽器候補と打楽器の標準パターンとの照合によ
    って打楽器の種類を識別する打楽器種類判定部と、 上記の打楽器の標準パターンを決定するため、既知の打
    楽器に対しその特性を分析し最も一般性をもつ特徴を抽
    出する標準パターン決定部と、 上記の打楽器の標準パターンを蓄積する標準パターン格
    納部とを備えていることを特徴とする自動採譜装置。
JP4220360A 1992-08-19 1992-08-19 自動採譜装置 Pending JPH0667654A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4220360A JPH0667654A (ja) 1992-08-19 1992-08-19 自動採譜装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4220360A JPH0667654A (ja) 1992-08-19 1992-08-19 自動採譜装置

Publications (1)

Publication Number Publication Date
JPH0667654A true JPH0667654A (ja) 1994-03-11

Family

ID=16749922

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4220360A Pending JPH0667654A (ja) 1992-08-19 1992-08-19 自動採譜装置

Country Status (1)

Country Link
JP (1) JPH0667654A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10228296A (ja) * 1997-02-17 1998-08-25 Nippon Telegr & Teleph Corp <Ntt> 音響信号分離方法
JP2017067901A (ja) * 2015-09-29 2017-04-06 ヤマハ株式会社 音響解析装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10228296A (ja) * 1997-02-17 1998-08-25 Nippon Telegr & Teleph Corp <Ntt> 音響信号分離方法
JP2017067901A (ja) * 2015-09-29 2017-04-06 ヤマハ株式会社 音響解析装置

Similar Documents

Publication Publication Date Title
JP4660739B2 (ja) 音分析装置およびプログラム
Virtanen Monaural sound source separation by nonnegative matrix factorization with temporal continuity and sparseness criteria
Duan et al. Multiple fundamental frequency estimation by modeling spectral peaks and non-peak regions
US20110058685A1 (en) Method of separating sound signal
EP1895507B1 (en) Pitch estimation, apparatus, pitch estimation method, and program
KR20030064733A (ko) 피치 주파수 추정 방법 및 장치 및 컴퓨터 소프트웨어 제품
Brossier et al. Fast labelling of notes in music signals.
Penttinen et al. A time-domain approach to estimating the plucking point of guitar tones obtained with an under-saddle pickup
Cogliati et al. Piano music transcription modeling note temporal evolution
JPH0675562A (ja) 自動採譜装置
JP5924968B2 (ja) 楽譜位置推定装置、及び楽譜位置推定方法
Amado et al. Pitch detection algorithms based on zero-cross rate and autocorrelation function for musical notes
JP2004287010A (ja) 波形認識方法及び装置、並びにプログラム
JPH0667654A (ja) 自動採譜装置
US20060150805A1 (en) Method of automatically detecting vibrato in music
Gowriprasad et al. Onset detection of tabla strokes using lp analysis
JP2001222289A (ja) 音響信号分析方法及び装置並びに音声信号処理方法及び装置
Derrien A very low latency pitch tracker for audio to MIDI conversion
CN113658612A (zh) 一种基于音频识别被弹奏琴键的方法及系统
Dziubiński et al. High accuracy and octave error immune pitch detection algorithms
Rao et al. A comparative study of various pitch detection algorithms
JP4625935B2 (ja) 音分析装置およびプログラム
Cheng Exploiting Piano Acoustics in Automatic Transcription
Liu et al. Time domain note average energy based music onset detection
JP4625934B2 (ja) 音分析装置およびプログラム