JP3733964B2 - 分析結果を用いた音源波形合成装置 - Google Patents
分析結果を用いた音源波形合成装置 Download PDFInfo
- Publication number
- JP3733964B2 JP3733964B2 JP2003353367A JP2003353367A JP3733964B2 JP 3733964 B2 JP3733964 B2 JP 3733964B2 JP 2003353367 A JP2003353367 A JP 2003353367A JP 2003353367 A JP2003353367 A JP 2003353367A JP 3733964 B2 JP3733964 B2 JP 3733964B2
- Authority
- JP
- Japan
- Prior art keywords
- waveform
- loop
- analysis
- frequency
- peak
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Electrophonic Musical Instruments (AREA)
Description
分析結果から元の波形を合成し、元の波形から合成波形を差し引くと、残余成分が生じるが、従来のFFTでは、この残余成分は捨てていた。そのため、ループ波形を加工、編集する際に、残余成分を無視することができず、残余成分についても加工、編集して用いなければ、ループ波形の終端と始端で振幅や周波数等を精密に合わせ込むことができなかった。
(1) 分析区間を移動させながら原波形のスペクトルを分析し、各分析区間における周波数スペクトルのピークに関して軌跡データを取り出す波形分析方法であって、前記原波形に対し、第1回目のスペクトル分析をする過程と、前記第1回目のスペクトル分析の結果から、第1の判定条件にしたがって、第1の前記軌跡データを取り出す過程と、前記第1の軌跡データに基づいて第1の合成波形を生成する過程と、前記原波形から前記第1の合成波形を減算して残余波形を生成する過程と、前記残余波形に基づく波形に対し、第2回目のスペクトル分析をする過程と、前記第2回目のスペクトル分析の結果から、前記第1の判定条件に比べて緩和された第2の判定条件にしたがって、第2の前記軌跡データを取り出す過程、を有し、少なくとも前記第1,第2の軌跡データを波形分析結果とする波形分析方法。
したがって、残余波形に基づく波形に対して、判定条件を緩和して再度のスペクトル分析を行うことにより、第1回目のスペクトル分析において隠れていた周波数成分のピーク軌跡が現れるため、第1回目のスペクトル分析では取り出せなかった、比較的小さなピーク周波数の軌跡を取り出すことが可能となり、有用な周波数成分を高精度に取り出すことができる。
この分析結果を用いて波形を合成すれば、有用な周波数成分を多数含んだ波形を合成することができ、特に、定常波形領域におけるループ波形を合成するのに好適である。
(2) 分析区間を移動させながら原波形のスペクトルを分析し、各分析区間における周波数スペクトルのピークに関して軌跡データを取り出す波形分析方法であって、前記原波形に対し、第1回目のスペクトル分析をする過程と、前記第1回目のスペクトル分析の結果から、第1の前記軌跡データを取り出す過程と、前記第1の軌跡データに基づいて第1の合成波形を生成する過程と、前記原波形から前記第1の合成波形を減算して残余波形を生成する過程と、前記残余波形に対し、前記第1の軌跡データに対応する周波数成分を少なくとも除去するフィルタ処理を施す過程と、フィルタ処理された前記残余波形に対し、第2回目のスペクトル分析をする過程と、前記第2回目のスペクトル分析の結果から、第2の前記軌跡データを取り出す過程と、を有し、少なくとも前記第1,第2の軌跡データを波形分析結果とすることを特徴とする波形分析方法。
したがって、残余波形に基づく波形に対して、判定条件を緩和して再度のスペクトル分析を行うことにより、第1回目のスペクトル分析において隠れていた周波数成分のピーク軌跡が現れるため、第1回目のスペクトル分析では取り出せなかった、比較的小さなピーク周波数の軌跡を取り出すことが可能となり、有用な周波数成分を高精度に取り出すことができる。
さらに、残余波形から、再分析不要な周波数成分が取り除かれた波形に対してスペクトル分析を行うことができるため、再分析の効率を高めることができる。
この分析結果を用いて波形を合成すれば、有用な周波数成分を多数含んだ波形を合成することができ、特に、定常波形領域におけるループ波形を合成するのに好適である。
なお、既にピーク軌跡データが得られている周波数成分の近傍の周波数成分は、既にピーク軌跡データが得られている周波数成分によるマスキング効果により、聴感上目立たない。その結果、近傍の周波数成分をピーク軌跡として取り出さずに波形を合成しても目立たない。したがって、既にピーク軌跡データが得られた周波数成分の近傍の周波数成分についても残余波形から取り除いて、再度のスペクトル分析を行えば、さらに、効率よく波形分析が行える。
図中、1は波形分析装置全体の制御を行うCPU(Central Processing Unit)、2は制御プログラムなどの各種プログラムおよび各種の制御情報などが格納されるROM、3はワークエリアやバッファ領域あるいは各種プログラムを格納する領域として使用されるRAM、4は計時動作やCPU1に対するタイマ割込を行うためのタイマ、5は各種の操作スイッチが配備されたパネルスイッチ、6は処理対象である原波形などの各種の表示を行うパネル表示器である。7は外部MIDI(Musical Instrument Digital Interface)機器との間でMIDIイベントの授受を行うためのMIDIインターフェース、8はCD−ROM(Compact Disk-Read Only Memory)、HD(ハード磁気ディスク)、FD(フレキシブル磁気ディスク)等の記録媒体9にアクセスするための駆動装置である。
上述した説明では、波形分析方法、音源波形作成方法、および、演奏処理方法をCPU1に実行させるプログラムは、ROM2あるいはRAM3に格納されていた。これに代えて、CD−ROM(記録媒体9)により外部供給を受け、ハード磁気ディスク(記録媒体9)にインストールされてプログラムが実行されてもよい。また、図示しない通信回線を介して、ネットワーク上のサーバからハード磁気ディスク(記録媒体9)にダウンロードされてプログラムが実行されてもよい。
S21において、元となる波形データ(原波形データ)が用意される。図1に示したパネルスイッチ5に設けられた録音スイッチの操作に応じて、原波形データが、例えば、外部波形入力端子12から書込回路13、アクセス管理部11を介して、波形メモリ10に書き込まれる。
S22においては、パネルスイッチ5に設けられた分析スイッチの操作に応じて、CPU1が波形メモリ10に書き込まれた原波形データを分析する。
一方、アタック部後の楽音信号は、定常的な波形となるので、前回の残余成分に対して行ったスペクトル分析結果に基づいて合成された決定論的波形を用いてループ波形を合成する。最後のスペクトル分析によって生じた残余波形、もしくは、これをフィルタ加工したものなどを加えてループ波形を作成してもよい。ループ波形を作成する際には、決定論的波形の各周波数成分(パーシャル)毎に、ループの終端と始端とで、振幅、位相の合わせ込みや、振幅の揺らぎ、位相(周波数)の揺らぎの合わせ込みを行う。
この実施の形態では、波形分析方法を、合成波形を作成するためのツールとして用いている。前提として、分析する原波形データWAVEの基本波の周波数、すなわち、基本ピッチは大体わかっているものとし、この基本ピッチに基づいて、分析のための各種の設定値を決める。原波形データWAVEは、例えば、44.1[kHz]のサンプリング周波数でサンプリングされ、図1の波形メモリ10に格納される。格納された原波形データは、あらかじめ、振幅調整、イコライズ処理、フィルタリング処理などが行われるとともに、分析範囲の設定も行われる。
。横軸はサンプル点の番号、縦軸は振幅レベルである。この波形の基本ピッチは約261.63[Hz]である。
波形分析の手順としては、原波形データWAVEから1フレームの長さの波形データを順次に切り出す。一例として、1フレームの長さは、基本波のほぼ8周期分とする。図11に示した波形の基本周期は1/261.63=3.822[msec]であり、サンプリング周波数は44.1[kHz]であるから、1フレームの長さは、1348サンプル(小数点以下四捨五入)となる。
次に、これに1フレームと同じ長さの窓関数を乗算したものに対してFFT分析を行う。FFT分析は、サンプルポイント数を2のべき数とすると効率的に演算が行えるアルゴリズムであり、かつ、サンプルポイント数は、少ないほど演算量が少なくなるので、1フレームの長さを超える最小の2のべき数を選び、ここでは、2048点とする。
1つのフレームについてFFT処理が終了すると、1フレームの期間をオーバーラップさせながら、時間軸方向に、例えば、基本波の1/8周期分だけ進めた位置に、次の1フレームを設定する。この1フレームのサンプルに1フレームと同じ幅の窓関数を乗算したものに対して同様なFFT処理を行い、以後これを繰り返す。
楽音波形には、ビブラート等の時間的に周波数成分が変化する演奏表現が含まれている。これらの演奏表現が、周波数、位相の揺れとして検出できるように、FFT処理における1フレームの長さ(時間窓)や時間分解能等を設定する。その結果、楽音波形の特性に注目した波形編集が容易になる。
S31においては、まず、原波形データWAVEを入力し、これを初回の被分析波形データIW(1)とおき、S32に処理を進める。
S32においては、分析回数を示すフラグiを1とおき、S33に処理を進め、FFTを用いて、i回目の分析(i)を行う。S33においては、被分析波形データIW(i)から、i回目の分析における分析条件(i)にしたがって、i回目の分析結果として、ピーク軌跡データDD(i)および残余波形データRW(i)を出力し、S34に処理を進める。
ピーク軌跡データDD(i)は、i回目の分析(i)において取り出された、周波数スペクトル上でピークを示す1または複数の周波数成分であって、分析フレームの移動に応じて揺らぎながらもほぼ持続して存在している周波数成分に関する、周波数、振幅、位相のデータである。このピーク軌跡データDD(i)に基づいて、これに対応する波形データを合成し、被分析波形データIW(i)から、この合成された波形データを差し引くことにより、上述した残余波形データRW(i)が作成される。
このS33における処理は、図5を参照して後述する。
また、第1回目の分析では、確実に存在するピーク軌跡により、原波形に存在する比較的小さな周波数成分のピークが隠されている可能性がある。特に、非高調波成分にその影響が大きい。さらにまた、窓関数のサイドローブによって、存在しない周波数成分(漏れ)も出力されている。第2回目の分析においては、先に検出された大きなピーク軌跡の周波数成分が原波形から取り除かれているので、この大きな周波数成分の上述した漏れも発生しないから、この点でも、比較的小さな周波数成分のピークを検出できる可能性が高くなる。
図4は、ノッチフィルタの周波数特性を示す線図である。図中、横軸は周波数、縦軸は出力レベルである。ノッチフィルタは、特定の中心周波数の近傍で急峻に減衰する特性を有するものである。
直前のS33において出力されたピーク軌跡データDD(i-1)の複数の周波数成分のそれぞれを中心周波数とする、複数のノッチフィルタを直列的に用いる。残余波形データRW(i)から、ピーク軌跡データDD(i)の周波数およびその近傍の周波数成分を除去したものを、次回の分析に対する被分析波形データIW(i)(S36においてiの値が更新されている)として出力し、再びS33に戻る。ノッチフィルタの半値幅は、例えば、基音周波数の1/6とする。
また、フレームの長さよりも長い周期の周波数成分が原波形に含まれていた場合には、FFT処理によって、直流に近い低い周波数領域に、本来あり得ない周波数スペクトルのピークが検出される場合がある。このとき、残差成分に、この不要な周波数成分が含まれることになる。したがって、ノッチフィルタ処理に加えて、低周波阻止をするローカットフィルタ処理を施すと、さらに効率的にFFT処理ができる。
また、分析(i)の結果出力される残余波形データRW(i)は、被分析波形データIW(i)からのピーク軌跡データDD(i)に相当する成分が除去された波形である。したがって、次の段の被分析波形データIW(i+1)は、IW(i)よりレベルが小さくなり、分析時に直流成分による影響を受けやすい。そのため、次段の分析に先立ちローカットフィルタにより直流成分を除去している。
まず、S41において、被分析波形データIW(i)から最初の第1フレームを切り出してセットし、S42に処理を進める。第1フレームとしては、原波形データの楽音の立ち上がりから開始させる。
S42においては、当該フレームについてFFT処理を行い、S43に処理を進める。S43においては、当該フレームについて、周波数軸上のピークを出力する周波数とその振幅および位相を出力して、S44に処理を進める。
この図において、既にピークの線状の軌跡を見てとることができるが、点がつながっているとの判定はまだ行っていない。また、線として見える部分以外はノイズであったり、一過性の周波数成分であったり、あるいはFFTの窓関数のサイドローブによる漏れであるとみなされ、これらは、有用でない周波数成分である。なお、ピーク周波数における振幅および位相のデータも出力されるが、図示を省略する。
S45においては、正の時間軸方向に所定時間ずらせて次のフレームを切り出し、S42に処理を戻す。
S46においては、各フレームに関してS43で抽出された複数のピークを、複数フレームにわたってつなぐことにより、ピークの軌跡を検出する。連続する複数のフレームで検出された各ピークについて、つながりのよいものを検出し、そのピークの周波数、振幅、位相をピークの軌跡として記憶する。
互いに隣り合った第pフレームと第rフレームについてピーク追従処理を行うものとする。まず、第pフレームにおいて検出された1番目からMp番目までの全てのピークPKp−q(PKp−1,PKp−2,…,PKp−Mp)について、第rフレームの1番目からMr番目までのすべてのピークPKr−s(PKr−1,PKr−2,…,PKr−Mr)とつながる可能性を計算する。この可能性を示す値をCP(Connection Possibility)と名付けることとする。CP(p-q,r-s)は、フレームp側から見た、フレームpのq番目のピークPKp−qとフレームrのs番目のピークPKr−sとのつながる可能性を示す数値である。
CP(p-q,r-s)=
FuncA (|PKp−q.Frequency− PKr−s.Frequency|)
×FuncB (|PKp−q.Magnitude− PKr−s.Magnitude|)
×FuncC (PredictionPhase(sign(r-p),PKp−q,PKr−s) − PKr−s.Phase) …(1)
ここで、FuncAは、周波数について近いものを捜すための関数(周波数比較関数)である。ピークPKp−qの周波数PKp−q.Frequencyと、PKr−sの周波数PKr−s.Frequencyの両者が全く同一のときに1となり、両者の差の絶対値が大きくなるほど減少し、差の絶対値の全範囲についての積分値が1となる関数を用いればよい。
PredictionPhase (sign(r-p),PKp−q,PKr−s)=
PKp−q.Phase+2π×PKp−q.Frequency/SamplingFrequency×HopSize …(2)
PKp−q.PhaseはピークPKp−qの位相である。HopSizeは、フレームの移動サンプル点数であり、図11を用いた例では21点となる。HopSize/SamplingFrequencyは、フレームの移動サンプル時間を示しており、この例では4.76msecである。この式(2)は、フレームpにおいて周波数が、PKp−q.Frequencyであったとして、次のフレームrでもこの周波数が変わらなかったとした場合に、フレームrの位相が何度であるのかを計算するものである。
sign(r-p)は、フレームの移動方向を示すものであって、正の場合には位相が進み、負の場合には位相が戻ることを示している。
FuncCは、位相間の距離が0のときに1となる関数であり、例えば、次式(3)のような形式の比較関数が用いられる。
FuncC (phase1−phase2)=(1+cos(phase1−phase2))/2 …(3)
CP(p-q,r-1),CP(p-q,r-2),…,CP(p-q,r-Mr)
を計算し、CP値が最大となるピークが、p側からr側を見たときに一番つながる可能性の高いピークであるということができる。このようにして、フレームpでのq番目のピークからのフレームrへの軌跡を追跡することができる。
この例においては、CP(p-1,r-1)が最大値0.9となっているので、PKp−1はPKr−1と最もつながる可能性があると考えられる。
なお、このときに、CPの最小値を予め決定しておき、例えば、すべてのCP値が0.001以下の場合はつながる可能性のあるピークがないとする方が現実的である。この場合のピークはフレームpで消滅したものと考えられる。この例では、CPが最小値以下になることが、軌跡の消滅条件である。
このようにして、フレームpのすべてのピークPKp−1,PKp−2,・・・について最もつながる可能性のあるフレームrでのピークが見つかったとする。
このような場合、今度はフレームr側からフレームp側を見て、最もつながる可能性のあるピークを捜すようにする。この場合においても、上述した式(1)に示したCPを用いる。ただし、位相予測関数PredictionPhaseは、時間的に逆方向を予測するものとなるため、sign(p-r)が負となり、式(2)は、次の式(4)となる。
PredictionPhase (sign(p-r),PKr−s,PKp−q)=
PKr−s.Phase−2π×PKr−s.Frequency/SamplingFrequency×Hopsize …(4)
このようにして得られる、CP(r-s,p-1),CP(r-s,p-2),…,CP(r-s,p-Mp)の値から、最大のものを見つけて、r側からp側を見たときに一番つながる可能性のあるピークを捜す。
このように双方向からのマッチングをとるようにすることにより、最適なピークの接続を見い出すことが可能となる。
図11に示した例では、振幅レベルが最大となるアタックマックスポイントが、サンプリング開始点から42.9[msec]後にあることが検出される。このアタックマックスポイントを1フレームのほぼ中央とする基準フレーム(リファレンスフレーム)において、追跡の基点となるピークを検出し、時間の正方向にピーク軌跡を追跡し原波形データの最後まで到達すると、、その後、基準フレームから、今度は、逆に時間の負方向にピーク軌跡を追跡する。なお、時間の負方向にピーク軌跡を追跡する際には、位相予測関数としては、式(4)を用いることになる。
このようにして、分析対象波形データIW(i)の最初から最後まで各フレームでの各ピークの接続が分かったものとする。
上述したように、基点としたピークは、アタックマックスポイントを1フレームのほぼ中央とする基準フレームのピークである。途中で消滅条件により消えて、つながらなくなってしまった軌跡も含まれている。また、必要でないピークまで含まれてしまっている可能性もある。例えば、図中、(a)で示したピークの軌跡(細線でつないで図示している)は、第1回目の分析では、有用でないものとみなす。
(a)所定の時間範囲の中で、ピーク軌跡の切断がa回以下
(b)所定の時間範囲の中で、ピーク軌跡の存在割合がb%以上
(c)所定の時間範囲の中で、ピーク軌跡の平均振幅レベルがc以上
(d)ピーク軌跡の連続する時間長がd以上
以上の条件の任意の2以上の組み合わせを満足すること。
そして、分析回数(i)が増えるにつれて、選択条件を緩くするように、各条件の設定値を決める。
例えば、(a)の条件において、1回目は切断が1回以下、2回目は5回以下、3回目は20回以下とする。(b)の条件において、1回目はピーク軌跡の存在割合が全フレーム数の99%以上、2回目は70%以上などとする。
2回目以降は、複数通りの分析条件を用いて分析し、各条件で取り出されたピーク軌跡の中からユーザが総合評価するなどして、最終的にピーク軌跡を選択するようにしてもよい。
図9は、ピークの軌跡が途切れている例を示す図である。図中、M番目のピーク軌跡は、フレーム(N-1)で消滅し、フレーム(N+1)で生成されているように見える。しかし、1つの軌跡は、1つの正弦波発振器に対応しており、軌跡が消滅した時点で対応する正弦波発振器は、未使用状態あるいは出力途絶、すなわち、フレーム(N-1)とフレーム(N+1)間で正弦波出力が途切れてしまい、クリックノイズの発生などの不都合が生じるおそれがある。
ピーク軌跡が途切れるような場合には、フレーム(N)に振幅0のピークがあるように補って考え、一続きの軌跡と考えるようにすればよい。あるいは、フレーム(N-1)のピークの情報とフレーム(N+1)のピークの情報を補間し、フレームのピーク情報を作り出すようにすることもできる。
S48においては、選択された複数のピークの軌跡に基づいて、軌跡データDD(i)を出力するとともに、軌跡データDD(i)に基づいて波形合成を行い、S49に処理を進める。軌跡データDD(i)は、フレームの期間が移動しても定常的に存在し続けている有用な周波数成分の軌跡である。この軌跡データDD(i)を構成する1または複数の周波数成分について、その振幅および位相を用いて、時間軸上の波形を合成することができる。この合成波形は、既に説明した決定論的波形である。 合成は、例えば、正弦波加算合成で行う。軌跡データDD(i)の1または複数の各周波数成分(非調和成分を含む)の振幅、周波数、位相をそのまま備える1または複数の正弦波を加算する。
S49においては、被分析波形IW(i)から合成波形を減算して、残余波形データRW(i)を生成し、図3のフローチャートのS34に進む。
第1回目の分析(1)から第N回目の分析(N)までの間に取り出された軌跡データDD(i)(1≦i≦N)および、第1回目の残余波形データRW(1)を、例えば、図1のRAM3から読み出す。
S51においては、ループ範囲を設定し、S52に処理を進める。この応用例では、軌跡データDD(i)として、基本周期の調和成分だけでなく、非調和成分(非倍音成分)も取り出している。この非調和成分を含めたループ波形を合成するために、決定論的波形の全ての周波数成分が、ループ範囲の開始点と終了点とにおいて同位相になるようにする。そのために、波形の基本周期に比較して十分に長いループをとる。
(a)ループ始点での各周波数成分の周波数、振幅、位相を検出する。
(b)ループ部における各周波数成分の振幅の揺らぎ、位相の揺らぎ(周波数の揺らぎでもある)を検出する。
(c)ループ部内において、各周波数成分の振幅の揺らぎ、位相の揺らぎ(周波数の揺らぎ)、それぞれの揺らぎの位相が、ループ始点とほぼ等しくなる接続ポイントを捜す。その際、ループ終点に近い点を優先的に選択する。
(e)ループ終点での各周波数成分について、振幅値、位相値が、それぞれ、ループ始点での振幅値、位相値に、ほぼ等しくなるように、そのピーク軌跡の振幅、位相を微調整する。位相に関しては、単純に時間軸の圧縮,伸長を行う。振幅については、時間に正比例する値をループ部中の振幅に加算する。ループ終点での振幅値がループス始点の振幅に等しくなるような値とする。
各周波数成分が揺らぎを含んでいる場合には、揺らぎの位相も揃えなければ、きれいなループ波形とはならない。しかしながら、倍音自体の位相と揺らぎの位相とを同時に揃えることができるようなループ始点およびループ終点を、全周波数成分に共通で1組求めることは不可能である。そこで、次のように、各周波数成分毎に独立して処理を行う。
このように、ループ部分において、各周波数成分の振幅の揺らぎを分析し、それぞれ、ループ終点になるべく近く、振幅の揺らぎおよび振幅値がループ始点とほぼ一致する接続ポイントを検出する。
図17(a)は、ある周波数成分のループ始点から接続ポイントまでの位相を示す図であり、これをループ終点まで矢印の方向に引き延ばして、図17(b)に示す位相データとする。このためには、まず、各時間(サンプル時間)における位相の傾き(次のサンプルとの位相の差、これは、その時間における周波数に等しい)を求める。ここで、時間(サンプル時間)とは、周波数分析の時間軸のことであり、具体的には、上述した時間軸を移動させながら行なっているFFT分析の各サンプルが出力される時間を示す。
図18は、位相および振幅についてのスムージング処理の説明図である。図18(a)は位相、図18(b)は振幅に関するものである。いずれも、揺らぎを省略して図示している。
図18(a)において、ある周波数成分のループ始点における位相と、ループ終点における位相との差が、図示のように2nπ(nは整数)となっていないときに、それが2nπとなるように、図中破線で示すように位相軌跡の修正を行うものである。具体的には、各位相データに位相のずれに対応する適切な係数を一律に乗算することにより行うことができる。周波数は僅かしか変化しない。
上述した説明では、ループ始点を固定し、接続ポイントをタイムストレッチによりループ終点に対応する位置に移動して、各周波数成分の揺らぎがなめらかに接続されるように調整していたが、逆にループ終点を固定し、接続ポイントをタイムストレッチでループ始点に対応する位置に移動して調整するようにしてもよい。
上述した説明では、周波数成分の振幅および位相の揺らぎについても、スムージング処理をしたが、揺らぎが少ない場合は、周波数成分の振幅値および位相値のみをスムージング処理してもよい。
上述した説明では、各周波数成分のループ終点、ループ始点での周波数の合わせ込みは省略した。
S53に続く、S54においては、同じく、ループスムージングされた後のピーク軌跡データDD(i)、(2≦i≦N)について、含まれるピーク軌跡に対応する周波数成分に基づいて、合成波形SW(i)、(2≦i≦N)を生成し、これらを加算することにより、合成波形ΣSW(i)、(2≦i≦N)を生成する。
図19は、合成波形データSW(1)、残余波形データRW(1)、合成波形データΣSW(i)、音源波形データTGWを示す線図である。
まず、波形のアタック部からループ部の全体を通して、基本的な波形成分として、第1回目の波形分析に基づいた合成波形SW(1)を使用する。
アタック部においては、この合成波形SW(1)に、第1回目の波形分析で取り出された残余波形データRW(1)を加算する。
アタック部とループ部との過渡領域においては、残余波形データRW(1)と、残余波形データRW(1)を波形分析する第2回目以降の波形分析に基づいた合成波形ΣSW(i)を、クロスフェード処理したものを合成波形SW(1)に加算する。
ループ部においては、合成波形データSW(1)に合成波形データΣSW(i)を加算する。図示の例では、ループ始点(LSA2)からループ終点(LEA)までをループ波形としているが、アタック終点(LSA1)からループ終点(LEA)までをループ波形としてもよい。
TGW=SW(1)×α+RW(1)×β+ΣSW(i)×γ …(5)
ここで、αは合成波形データSW(1)に対する重み付け係数、βは残余波形データRW(1)に対する重み付け係数、γは合成波形ΣSW(i)に対する重み付け係数である。アタック部においてはα=β,γ=0、ループ部においてはα=γ,β=0,全期間においてα+β+γ=1である。
このようにして、合成決定論的波形データである合成波形SW(1)、合成波形ΣSW(i)と、残余波形データRW(1)は、相互に時間軸を揃えて加算され、アタック始点〜ループ始点〜ループ終点の波形データが得られることとなる。この波形データは、音源波形データTGWとして図1の波形メモリ10に格納される。
なお、残余波形データRW(1)の使用をやめて、アタック部およびループ部の全体にわたって、合成波形ΣSW(i)を使用するようにしてもよい。
また、音源波形データTGWとして、合成波形データSW(1),残余波形データRW(1),合成波形データΣSW(i)等の、波形合成で得られた個々の波形データ、あるいは加算データを、個別に波形メモリ10に記憶しておいて、楽音発生時にこれらを加算合成してもよい。その際、音色やタッチ等のパラメータに応じて、それぞれの波形データの周波数特性を変更することにより、自由度の大きい音色変更を行うことができる。
しかし、波形分析の結果得られたピーク軌跡データそのものを、波形を表すデータとしてメモリに格納しておき、音源部が楽音信号を生成するときに、このピーク軌跡データに基づいて正弦波加算合成をするようにしてもよい。
本発明にかかる波形分析方法は、上述した楽音波形の合成のためだけでなく、楽器音の特徴と楽器の物理的性質との関連を明らかにするため、あるいは、楽器音の機械認識などのためにも用いることができる。
Claims (2)
- 原波形のスペクトル分析を行うことにより、基本周期の非調和成分を含む複数の周波数成分の軌跡データDD(1)を得る第1の分析手段と、
アタック部と、ループ部を規定する数百ミリ秒〜数秒の長さのループ範囲を設定する設定手段と、
複数の周波数成分の軌跡データDD(1)について、それぞれ、ループ開始点とループ終了点の位相差が2nπ(nは整数)となり、かつ、前記ループ開始点と前記ループ終了点の振幅が一致するようスムージング処理する手段と、
スムージング処理された複数の周波数成分の軌跡データDD(1)に基づいて、アタック部とループ部からなる第1の合成波形を生成する第1の合成手段を有し、
前記スムージング処理は、10ミリ秒以下の時間レベルの微調整で行われることを特徴とする分析結果を用いた音源波形合成装置。 - 前記第1の分析手段で得られた複数の周波数成分の軌跡データDD(1)に基づいて、アタック部とループ部からなる合成波形を生成し、前記原波形と生成された合成波形との残余波形を得る残余手段と、
さらに前記残余波形に第2回目以降、N回まで前記スペクトル分析を行うことにより、前記基本周期の非調和成分を含む複数の周波数成分の軌跡データDD(i)(2≦i≦N)を得る第2の分析手段と、
前記複数の周波数成分の軌跡データDD(i)について、それぞれ、前記ループ開始点と前記ループ終了点の位相差が2nπとなり、かつ、前記ループ開始点と前記ループ終了点の振幅が一致するようスムージング処理する手段と、
スムージング処理された複数の周波数成分の軌跡データDD(i)に基づいて、第2の合成波形を生成する第2の合成手段と、
前記ループ部への過渡領域を除くアタック部については、前記第1の合成波形と前記残余波形を加算することにより第3の合成波形を生成し、前記アタック部の前記ループ部への過渡領域については、前記第1の合成波形と、前記残余波形から前記第2の合成波形へのクロスフェード波形、とを加算することにより前記第3の合成波形を生成し、前記ループ部については、前記第1の合成波形と前記第2の合成波形とを加算することにより前記第3の合成波形を生成する第3の合成手段と、
を有することを特徴とする請求項1に記載の、分析結果を用いた音源波形合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003353367A JP3733964B2 (ja) | 2003-10-14 | 2003-10-14 | 分析結果を用いた音源波形合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003353367A JP3733964B2 (ja) | 2003-10-14 | 2003-10-14 | 分析結果を用いた音源波形合成装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP27669799A Division JP3534012B2 (ja) | 1999-09-29 | 1999-09-29 | 波形分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004013179A JP2004013179A (ja) | 2004-01-15 |
JP3733964B2 true JP3733964B2 (ja) | 2006-01-11 |
Family
ID=30439220
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003353367A Expired - Fee Related JP3733964B2 (ja) | 2003-10-14 | 2003-10-14 | 分析結果を用いた音源波形合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3733964B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5655273B2 (ja) * | 2009-03-17 | 2015-01-21 | ヤマハ株式会社 | 波形データ生成方法 |
JP5493408B2 (ja) * | 2009-03-17 | 2014-05-14 | ヤマハ株式会社 | 波形データ生成方法 |
CN107644632B (zh) * | 2017-08-17 | 2021-03-30 | 北京英夫美迪科技股份有限公司 | 音频缩混及波形生成方法和设备 |
-
2003
- 2003-10-14 JP JP2003353367A patent/JP3733964B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004013179A (ja) | 2004-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2264696B1 (en) | Voice converter with extraction and modification of attribute data | |
US11410637B2 (en) | Voice synthesis method, voice synthesis device, and storage medium | |
JP2906970B2 (ja) | サウンドの分析及び合成方法並びに装置 | |
JP3815347B2 (ja) | 歌唱合成方法と装置及び記録媒体 | |
US8145491B2 (en) | Techniques for enhancing the performance of concatenative speech synthesis | |
JP4839891B2 (ja) | 歌唱合成装置および歌唱合成プログラム | |
JPH06266390A (ja) | 波形編集型音声合成装置 | |
Bonada et al. | Sample-based singing voice synthesizer by spectral concatenation | |
JP3534012B2 (ja) | 波形分析方法 | |
JP3008922B2 (ja) | 楽音発生装置および楽音発生方法 | |
JP3733964B2 (ja) | 分析結果を用いた音源波形合成装置 | |
JP3511360B2 (ja) | 音楽音響信号分離方法、その装置およびそのプログラム記録媒体 | |
JP3601373B2 (ja) | 波形編集方法 | |
JP2004021027A (ja) | 演奏音制御方法及び装置 | |
JP3379348B2 (ja) | ピッチ変換器 | |
JP5552794B2 (ja) | 音響信号の符号化方法および装置 | |
EP2634769B1 (en) | Sound synthesizing apparatus and sound synthesizing method | |
JP6683103B2 (ja) | 音声合成方法 | |
JP6834370B2 (ja) | 音声合成方法 | |
JP2001242900A (ja) | 音の時間伸長装置、方法、および音の時間伸長プログラムを記録した記録媒体 | |
JP3744315B2 (ja) | 波形分析方法および波形分析装置 | |
JP3095018B2 (ja) | 楽音発生装置 | |
JP3752855B2 (ja) | 波形データ作成方法 | |
Canazza et al. | Symbolic and audio processing to change the expressive intention of a recorded music performance | |
JP2003255951A (ja) | 波形処理方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040705 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050715 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20050927 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20051010 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313532 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091028 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101028 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101028 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111028 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111028 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121028 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121028 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131028 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |