JPH0934448A - アタック時刻検出装置 - Google Patents

アタック時刻検出装置

Info

Publication number
JPH0934448A
JPH0934448A JP7205339A JP20533995A JPH0934448A JP H0934448 A JPH0934448 A JP H0934448A JP 7205339 A JP7205339 A JP 7205339A JP 20533995 A JP20533995 A JP 20533995A JP H0934448 A JPH0934448 A JP H0934448A
Authority
JP
Japan
Prior art keywords
time
prediction residual
frame
attack time
acoustic signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7205339A
Other languages
English (en)
Other versions
JP3531305B2 (ja
Inventor
Ichiro Shishido
一郎 宍戸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP20533995A priority Critical patent/JP3531305B2/ja
Publication of JPH0934448A publication Critical patent/JPH0934448A/ja
Application granted granted Critical
Publication of JP3531305B2 publication Critical patent/JP3531305B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Auxiliary Devices For Music (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】 【目的】 低コストで処理時間が短く、しかも検出精度
の良好なアタック時刻検出装置を提供する。 【構成】 楽曲の音響信号データを格納する音響信号デ
ータ格納手段2と、前記楽曲の音響信号データから線形
予測法により予測残差を算出する予測残差算出手段3
と、前記予測残差の局所ピーク、または前記予測残差の
時間変化量の局所ピークを判定してその時刻を楽器音の
アタック時刻とする判定手段4とを備えるように構成す
る。これにより、短時間で検出精度の良好なアタック時
刻を求める。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、楽曲の音響信号か
ら楽譜やMIDIデータを作成する自動採譜装置に関わ
り、特に各楽器音の立ち上がり時刻(以後、アタック時
刻と称す)を検出するアタック時刻検出装置に関する。
【0002】
【従来の技術】一般に、シンセサイザや電子ピアノ等の
楽器等の音源と連結して情報の交換を可能とするために
規格化された情報のファーマット化方式としてMIDI
(Musical Instrument Digit
al Interface)規格が、知られている。こ
のMIDI規格により、電子楽器等の駆動信号を効率的
に伝達して良好な音質のもとで再生が可能となった。
【0003】ところで、近年通信カラオケ等のように大
量のMIDIデータを必要とするシステムが登場してお
り、これにともなってMIDIデータ制作の効率化が求
められている。楽曲の音響信号から自動的にMIDIデ
ータが作成できれば効率の上で理想的であり、これを目
的とした自動採譜の研究や特許提案(特開平4−195
196号公報など)も行なわれている。しかしながら、
現状では、このような技術はごく限られた楽曲に対して
のみ適用可能なレベルなので、実際には人間が聴音また
は楽譜に頼ってMIDIデータを作成することがほとん
どである。
【0004】自動化が困難な理由は、自動採譜の技術に
おいて、アタック時刻を検出することが極めて重要であ
り、且つこの検出が難しいからである。この自動採譜に
おいては、アタック時刻を使って音響信号データを小さ
な領域に分割し、各領域毎に音程検出等の処理が行なわ
れる。従って、もしアタック時刻が正確に検出できない
と、それ以降の処理に支障を来してしまうことになる。
【0005】楽曲の音響信号データからアタック時刻を
検出する装置としては、例えば特開平5−273964
号公報が提案されている。これは次に示す手順(a)〜
(d)を含む技術である。 (a)楽曲の音響信号データx[n]に対し一定時間間
隔(フレーム)毎の対数パワースペクトルの時系列F
[i][m](フレーム数I、周波数帯域分割数Mとし
て、i=1〜I、m=1〜M)を求める。 (b)F[i][m]に対する時間変化量の時系列△F
[i][m]を求める。 (c)フレーム毎に△F[i][m]の正の成分の総和
S[i]を数1により算出する。
【0006】
【数1】
【0007】(d)S[i]の局所ピークを検出し、ア
タック時刻とする。
【0008】
【発明が解決しようとする課題】ところで、従来装置の
例では手順(a)において、数2及び数3を用いて、対
数パワースペクトルの時系列F[i][m]を算出して
いる。これらの数式は従来例に限らず、音響分析におい
て広く使われている計算式であるが、非常に多くの計算
量を必要とし、計算時間も長くなる。
【0009】
【数2】
【0010】
【数3】
【0011】ただし、i=1〜I、m=1〜M この従来装置例では、手順(a)〜(d)の処理をCP
Uを使ったソフトウエア処理で行なっている。ここで
は、この装置例で用いられているパラメータ値(M=2
56)を使って上記数2、3を比較的良く使われる32
ビットCPU(10〜20MIPS程度の能力)で計算
すると、1フレーム当りおよそ数10msec時間がか
かってしまう。この装置例では、音響信号の10mse
cに1つの割合でフレームを1つ設定しているので、手
順(a)だけの処理に実時間のおよそ数倍の時間が必要
となり、大量のデータを処理する場合にかなりの時間が
必要である。
【0012】勿論、高速なCPUや特殊なハードウエア
を使えば処理時間も少なくて済むが、処理装置のコスト
も高くなる。従って、比較的低コストで、処理時間が短
く、しかも検出精度の良いアタック時刻検出装置が望ま
れていた。本発明は、以上のような問題点に着目し、こ
れを有効に解決すべく創案されたものであり、本発明の
目的は、低コストで処理時間が短く、しかも検出精度の
良好なアタック時刻検出装置を提供することにある。
【0013】
【課題を解決するための手段】本発明は、上記問題点を
解決するために、楽曲の音響信号データを格納する音響
信号データ格納手段と、前記楽曲の音響信号データから
線形予測法により予測残差を算出する予測残差算出手段
と、前記予測残差の局所ピーク、または前記予測残差の
時間変化量の局所ピークを判定してその時刻を楽器音の
アタック時刻とする判定手段とを備えるように構成した
ものである。
【0014】このように構成することにより、音響信号
データ格納手段に記憶された音響信号データに基づい
て、予測残差算出手段は線形予測により、予測残差を算
出する。判定手段は、この予測残差に基づいて、この局
所ピークや予測残差の時間変化量の局所ピークを判定し
てそれをアタック時刻とする。これにより、処理時間も
少なく、検出精度も高いアタック時刻を求めることが可
能となる。
【0015】
【発明の実施の形態】以下に、本発明に係るアタック時
刻検出装置の一実施例を添付図面に基づいて詳述する。
図1は自動採譜装置等に用いられる本発明に係るアタッ
ク時刻検出装置を示すブロック構成図、図2は図1の装
置で作成されるフレームを説明する説明図、図3は予測
残差算出手段の動作を示すフロー、図4は判定手段の動
作を示すフロー、図5はアタック時刻の判定を説明する
ための説明図である。
【0016】図1に示すようにこのアタック時刻検出装
置1は、全体が例えばマイクロコンピュータ等により構
成されており、楽曲の音響信号データS1を格納する音
響信号データ格納手段2と、線形予測法により上記格納
された音響信号データから予測残差を算出する予測残差
算出手段3と、この予測残差の局所ピークや予測残差の
時間変化量の局所ピークを求めて、その時刻をアタック
時刻とする判定手段4とにより主に構成されている。上
記各手段の動作は、制御部5によりコントロールされ
る。上記音響信号データS1は、再生機がCD、DAT
(Degital Audio Tape)等のデジタ
ル再生機6の場合にはデジタルインタフェース7を介し
て入力され、再生機がアナログテープのようなアナログ
再生機8の場合には、所定の周波数、例えば12KHz
程度のサンプリング周波数でサンプリングを行なってデ
ジタル信号に変換するA/D変換器9を介して入力され
る。
【0017】上記判定手段4にて得られたアタック時刻
信号S2は、自動採譜装置の本体(図示せず)にてMI
DI信号化のために用いられると同時に、ディスプレイ
10等にも表示されて、オペレータに知らせるようにな
っている。音響信号データS1は、上述のようにデジタ
ルインタフェース7を介してCD、DATを再生するデ
ジタル再生機6から直接デジタル入力されるか、或いは
アナログ信号の場合は、再生されたアナログ信号をA/
D変換器8を介してデジタル化し、音響信号格納手段2
にデジタルデータとして格納される。音響信号データ格
納手段2は、半導体メモリ、磁気ディスク等で構成する
ことができる。
【0018】次に、予測残差算出手段3について説明す
る。予測残差算出手段3は、音響信号格納手段2より供
給される音響信号データを複数のフレームに分割し、各
フレーム毎に予測残差の代表値を算出して出力するもの
である。尚、本実施例では、予測残差の代表値として各
データサンプルの予測残差の2乗和を算出する場合につ
いて説明する。この予測残差算出手段3の動作フローを
図3に示す。まず、格納されている音響信号データを図
2に示すようなフレームFに分割してFN個のフレーム
を作成する(S11)。ここで1フレームは、FL個の
データサンプルで構成され、前後のフレーム間の間隔
は、FP個のデータサンプルに相当する。フレーム同士
は、一部重なり合っても良いし、また、離れていてもよ
い。フレームの中央のデータサンプルの時刻をそのフレ
ームの時刻とする。FL,FPの最適値は、サンプリン
グ周波数や楽曲の特性により変わるが、例えばサンプリ
ング周波数12KHzの時にFP=120とすると、1
0msecという実用上十分な精度でアタック時刻を求
めることができる。
【0019】フレームの総数をFNとすると、i=1〜
FNのフレームについて以下の処理を行い予測残差の2
乗和E[i]を算出する。まず、iを1として(S1
2)、数4に示すように、音響信号データx[n](n
=1〜FL)に窓関数w[n]を乗じる(S13)。こ
の窓関数としては数5に示すハミング窓を用いる。
【0020】
【数4】
【0021】ただし、n=1〜FL
【0022】
【数5】
【0023】窓がけしたデータX[n]に対して線形予
測法に基づく処理を行なう。線形予測法は、信号波形の
分析/合成に広く使用されている手法である。ここでは
数6に示すように、現在のデータX[n]をそれ以前の
p個のデータX[n−1],X[n−2],…,X[n
−p]の線形結合と残差e[n]との和で表し、フレー
ム内の残差e[n]の2乗和が最小となるような係数a
[k]を算出する。
【0024】
【数6】
【0025】i番目のフレームの残差の2乗和E[i]
は、数7で表わすことができ、これを求める(S1
4)。これを最小とする条件として、係数a[k]に関
する偏微分を0とおくと、数8が得られる。
【0026】
【数7】
【0027】
【数8】
【0028】ただし、1≦q≦p以上のS3とS4の動
作を、iの値がFNになるまで(S15)、iを1つず
つインクリメントしつつ繰り返し行い(S16)、残差
の2乗和を求める。一般的な線形予測法の使用例では、
信号波形をなるべく忠実に表現することを目的とするの
で、pの値をある程度大きくして波形情報をa[k]で
表現するようにし、e[n]を極力小さくするようにす
る。
【0029】一方、本発明では、信号波形を忠実に表現
することは目的でなく、フレーム内の予測残差の2乗和
を使用するという点で、一般的な使用方法とは異なる。
データサンプル毎のe[n]そのものではなく、フレー
ム内の予測残差の2乗和を使うので、pの値をかなり小
さくすることが可能となる。pを小さくすることによ
り、計算時間が短縮できるのは言うまでもない。例えば
1フレーム中のデータサンプル数FLが数100程度の
場合でも、p=2程度のアタック時刻の検出が可能であ
る。p=2の場合の係数a[1],a[2]の値は、数
8を変形し、自己相関関数R[0],R[1],R
[2]を使って表した数9、数10により算出する。
【0030】
【数9】
【0031】
【数10】
【0032】また、この場合の予測残差の2乗和E
[i]は、数7、数8を変形して自己相関関数を使って
表した数11により算出する。
【0033】
【数11】
【0034】pを他の値にする場合も全く同様に数7、
数8を変形して予測残差の2乗和E[i]を求めること
ができる。以上の処理により、フレームの予測残差の2
乗和が求まるが、この値が大きい場合は、フレーム内で
音響信号データの変動が激しく、この値が小さい場合
は、変動が少ないことになる。アタックのある場所で
は、音響信号データは急激に変化するので、フレーム内
の予測残差の2乗和も大きくなる。従って、そのような
フレームの時刻をアタック時刻とすれば良い。
【0035】また、本発明では、フレーム内の複数のデ
ータサンプルから得られる複数の予測残差値から、その
フレームの予測残差の代表値を算出して使用することに
より、アタック時刻の検出誤差を小さくしている。従っ
て、この予測残差の代表値は、予測残差の2乗和に限ら
ず、予測残差の2乗和の平方根や絶対値の総和などを予
測残差の代表値として後の処理で使用しても良い。ま
た、フレーム内の全てのサンプルの予測残差の2乗和を
求めるのではなく、例えばフレームの中央部のいくつか
のサンプルに対して予測残差の2乗和を求め、これを後
の処理で使用しても良い。
【0036】予測誤差算出手段3は、従来装置例の手順
(a)に相当するが、従来装置例に比べると計算量が少
なくて済む。従って、予測誤差算出手段3を汎用CPU
を使ったソフトウエア処理で実現した場合に、従来装置
例に比べて処理時間が短くて済む。例えばフレームデー
タサンプル数FL=240、フレーム間のデータサンプ
ル相当数EP=120、サンプリング周波数12KHz
として、従来装置例と同じくフレームの間隔を10ms
ecと仮定すると、前述した性能のCPUで計算した場
合には、1フレーム当り約数msecとなり、従来方式
の約1/10の時間で計算することができる。
【0037】判定手段4においては、図4に示すフロー
に基づいて処理を行なう。まず、予測残差の2乗和E
[i]の時間変化量△E[i]を求める。△E[i]の
算出式としては種々のものが利用できるが、例えば数1
2を用いることができる。
【0038】
【数12】
【0039】ただし、i=1〜FL、E[−1]=0、
E[FL+1]=0 まず、上記数12でi=1とし(S21)、△E[i]
を算出する(S22)。そして、この操作をiがFNに
なるまで(S23)、iを1つずつインクリメントしな
がら行い(S24)、全ての△E[i]を求める。
【0040】次に、先に求めた上記△E[i]の局所ピ
ークの判定を行なう。図5に示すように、△E[i]は
正または負の値をとる。△E[i]が正の大きな値をと
る場所は、フレームの予測残差が急激に増加している場
所であり、アタック時刻とみなせる。この判定には、数
13を使い、この条件を満たすフレームの時刻をアタッ
ク時刻とする。
【0041】
【数13】
【0042】ただし、αはある定数であり、閾値を示
す。まず、上記数13においてi=1として(S2
5)、局所ピークの判定を行なう(S26)。数13か
ら明らかなように、iを1つずつインクリメントしなが
ら連続する3つの時間変化量△E[i]の大小関係を比
較する(S27、S28)。そして、iの値がFNにな
ったならば処理を終える(S27のNO)。
【0043】これにより、図5に示すようにアタック時
刻を求めることができる。尚、楽曲によっては、△E
[i]の算出を省略し、数14に従って、E[i]の局
所ピークを判定し、これをアタック時刻としても良い。
この場合には、時間変化量△E[i]を求める演算が不
要になることから更に処理時間を短縮することができ
る。
【0044】
【数14】
【0045】ただし、βは所定の定数であり、閾値を示
す。以上説明した予測誤差算出手段3及び判定手段4
は、CPUによるソフトウエア処理でも実現可能であ
り、従来方式と比較して計算量が大幅に少ないので、コ
ストをあげることなく処理時間の大幅な短縮が可能であ
り、しかも検出精度も高く維持することができる。尚、
これらの処理手順は一例であり、その主旨を逸脱しない
範囲において種々の変更を加えることができる。
【0046】
【発明の効果】以上説明したように、本発明のアタック
時刻検出装置によれば、次のように優れた作用効果を発
揮することができる。従来用いていた対数パワースペク
トルの代わりに線形予測法による残差を使うことによ
り、計算量を大幅に削減できる。従って、特別なハード
ウエアを付加することなく 汎用CPUによるソフトウ
エア処理でも実用的な処理時間が得られ、低コストで検
出精度の良いアタック時刻検出装置を得ることができ
る。
【図面の簡単な説明】
【図1】自動採譜装置等に用いられる本発明に係るアタ
ック時刻検出装置を示すブロック構成図である。
【図2】図1の装置で作成されるフレームを説明する説
明図である。
【図3】予測残差算出手段の動作を示すフローである。
【図4】判定手段の動作を示すフローである。
【図5】アタック時刻の判定を説明するための説明図で
ある。
【符号の説明】
1…アタック時刻検出装置、2…音響信号データ格納手
段、3…予測残差算出手段、4…判定手段、5…制御
部、6…デジタル再生機、8…アナログ再生機、F…フ
レーム、S1…音響信号データ、S2…アタック時刻信
号、S3…予測残差の2乗和信号。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 楽曲の音響信号データを格納する音響信
    号データ格納手段と、前記楽曲の音響信号データから線
    形予測法により予測残差を算出する予測残差算出手段
    と、前記予測残差の局所ピーク、または前記予測残差の
    時間変化量の局所ピークを判定してその時刻を楽器音の
    アタック時刻とする判定手段とを備えるように構成した
    ことを特徴とするアタック時刻検出装置。
  2. 【請求項2】 前記予測残差算出手段は、前記音響信号
    データを一定長のフレーム単位に分割してフレーム内の
    全てのサンプル或いは一部のサンプルの各予測残差値か
    らそのフレームの予測残差の代表値を算出すると共に、
    前記判定手段は、フレームの前記予測残差の代表値の局
    所ピークまたは前記フレームの前記予測残差値の時間変
    化量の局所ピークを判定して、そのフレームの時刻を楽
    器音のアタック時刻とするように構成したことを特徴と
    する請求項1記載のアタック時刻検出装置。
JP20533995A 1995-07-19 1995-07-19 アタック時刻検出装置 Expired - Fee Related JP3531305B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20533995A JP3531305B2 (ja) 1995-07-19 1995-07-19 アタック時刻検出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20533995A JP3531305B2 (ja) 1995-07-19 1995-07-19 アタック時刻検出装置

Publications (2)

Publication Number Publication Date
JPH0934448A true JPH0934448A (ja) 1997-02-07
JP3531305B2 JP3531305B2 (ja) 2004-05-31

Family

ID=16505273

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20533995A Expired - Fee Related JP3531305B2 (ja) 1995-07-19 1995-07-19 アタック時刻検出装置

Country Status (1)

Country Link
JP (1) JP3531305B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6801898B1 (en) 1999-05-06 2004-10-05 Yamaha Corporation Time-scale modification method and apparatus for digital signals
US6835885B1 (en) 1999-08-10 2004-12-28 Yamaha Corporation Time-axis compression/expansion method and apparatus for multitrack signals
WO2010021035A1 (ja) * 2008-08-20 2010-02-25 パイオニア株式会社 情報生成装置及び情報生成方法並びに情報生成用プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6801898B1 (en) 1999-05-06 2004-10-05 Yamaha Corporation Time-scale modification method and apparatus for digital signals
US6835885B1 (en) 1999-08-10 2004-12-28 Yamaha Corporation Time-axis compression/expansion method and apparatus for multitrack signals
WO2010021035A1 (ja) * 2008-08-20 2010-02-25 パイオニア株式会社 情報生成装置及び情報生成方法並びに情報生成用プログラム
JPWO2010021035A1 (ja) * 2008-08-20 2012-01-26 パイオニア株式会社 情報生成装置及び情報生成方法並びに情報生成用プログラム

Also Published As

Publication number Publication date
JP3531305B2 (ja) 2004-05-31

Similar Documents

Publication Publication Date Title
US7485797B2 (en) Chord-name detection apparatus and chord-name detection program
US6140568A (en) System and method for automatically detecting a set of fundamental frequencies simultaneously present in an audio signal
JP4767691B2 (ja) テンポ検出装置、コード名検出装置及びプログラム
US5641927A (en) Autokeying for musical accompaniment playing apparatus
US7288710B2 (en) Music searching apparatus and method
WO2007010637A1 (ja) テンポ検出装置、コード名検出装置及びプログラム
JP4916947B2 (ja) リズム検出装置及びリズム検出用コンピュータ・プログラム
US7335834B2 (en) Musical composition data creation device and method
KR100327969B1 (ko) 음성재생속도변환장치및음성재생속도변환방법
JP3531305B2 (ja) アタック時刻検出装置
JP4132362B2 (ja) 音響信号の符号化方法およびプログラム記録媒体
JPH11259066A (ja) 音楽音響信号分離方法、その装置およびそのプログラム記録媒体
JP4581699B2 (ja) 音程認識装置およびこれを利用した音声変換装置
JP2000099009A (ja) 音響信号の符号化方法
US6314403B1 (en) Apparatus and method for generating a special effect on a digital signal
JP2003216147A (ja) 音響信号の符号化方法
JPH11305794A (ja) ピッチ検出装置及び情報媒体
JP2806047B2 (ja) 自動採譜装置
JPH11311997A (ja) 音声再生速度変換装置及びその方法
JPS61252600A (ja) Lsp型パタンマツチングボコ−ダ
JPH11175097A (ja) ピッチ検出方法及び装置、判定方法及び装置、データ伝送方法、並びに記録媒体
JP4473979B2 (ja) 音響信号の符号化方法および復号化方法ならびに当該方法を実行するプログラムを記録した記録媒体
JP2004085610A (ja) 音声データと演奏データの同期再生を行うための装置および方法
JP2003255930A (ja) 音響信号の符号化方法
JPS59176782A (ja) デジタル音響装置

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040223

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090312

Year of fee payment: 5

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090312

Year of fee payment: 5

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100312

Year of fee payment: 6

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110312

Year of fee payment: 7

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120312

Year of fee payment: 8

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120312

Year of fee payment: 8

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120312

Year of fee payment: 8

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130312

Year of fee payment: 9

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140312

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees