JP2001117595A - Audio signal waveform processor - Google Patents

Audio signal waveform processor

Info

Publication number
JP2001117595A
JP2001117595A JP30061499A JP30061499A JP2001117595A JP 2001117595 A JP2001117595 A JP 2001117595A JP 30061499 A JP30061499 A JP 30061499A JP 30061499 A JP30061499 A JP 30061499A JP 2001117595 A JP2001117595 A JP 2001117595A
Authority
JP
Japan
Prior art keywords
waveform
phase
audio signal
band
signal waveform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP30061499A
Other languages
Japanese (ja)
Other versions
JP4344438B2 (en
Inventor
Satoshi Kusakabe
智 日下部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Roland Corp
Original Assignee
Roland Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Roland Corp filed Critical Roland Corp
Priority to JP30061499A priority Critical patent/JP4344438B2/en
Publication of JP2001117595A publication Critical patent/JP2001117595A/en
Application granted granted Critical
Publication of JP4344438B2 publication Critical patent/JP4344438B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To allow an audio signal waveform processor, which performs a time stretching and pitch shifting by a phase vocoder system, to prevent a noise due to a pre-echo generated by band division from being generated. SOLUTION: The audio signal waveform processor has, as waveform data, the amplitudes and phases of respective band components obtained by dividing an audio signal into the bands, restores an audio signal waveform by reproducing and putting together the band components of the respective bands while performing time compression or expansion according to the waveform data, and performs phase resetting in the beginning of a pre-echo section generated in the audio signal waveform by the band division so that respective restored band components are in phase with the respective original band components shown by the above waveform data.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、位相ボコーダ方式
によりタイムストレッチ(時間圧縮/伸長)やピッチシ
フト(ピッチ変換)を行うオーディオ信号波形処理装置
に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an audio signal waveform processing apparatus for performing time stretching (time compression / expansion) and pitch shift (pitch conversion) by a phase vocoder method.

【0002】位相ボコーダ方式においては、分析系で
は、原音のオーディオ信号波形を帯域フィルタを用いて
複数の周波数帯域(バンド)に分割し、各帯域のバンド
成分をそれぞれ分析してその出力振幅と位相を特徴パラ
メータとして抽出して保持しておき、合成系では、各帯
域についてその出力振幅と位相を用いて元のバンド成分
を再生し、それら各帯域のバンド成分を加算合成して、
元のオーディオ信号波形を復元する。
In a phase vocoder system, an analysis system divides an audio signal waveform of an original sound into a plurality of frequency bands (bands) using a band filter, analyzes the band components of each band, and outputs the output amplitude and phase. Is extracted and held as a feature parameter, and in the synthesis system, the original band components are reproduced using the output amplitude and phase for each band, and the band components of each band are added and synthesized.
Restore the original audio signal waveform.

【0003】図10はこの位相ボコーダ方式によるオー
ディオ信号波形処理装置の概念を説明する。図示するよ
うに、オーディオ信号波形X(n) を複数の分析部60に
入力する。この例では、分析部60はオーディオ信号波
形の周波数を100に帯域分割した各帯域対応に設け
る。各分析部60は図11に示すようにオーディオ信号
波形の概略基本周波数をそれぞれ中心周波数とするバン
ド0〜99を持つもので、図13に示すごとくの構成を
持つ。すなわち、例えばバンドkの分析部は、入力した
オーディオ信号波形X(n) をその中心の複素周波数sin
(ωk)、cos(ωk) にて乗算(同期検波)してバンド
kの出力振幅値を得るとともに、その検波出力の位相値
を微分等して瞬間周波数の情報を得る。この瞬間周波数
は、各時点(波形の時間軸上の各位置)における単位時
間あたりの位相の変化量(微分値)であり、中心周波数
からの周波数偏差を示す情報である。
FIG. 10 explains the concept of an audio signal waveform processing apparatus using the phase vocoder method. As shown, the audio signal waveform X (n) is input to a plurality of analyzers 60. In this example, the analysis unit 60 is provided for each band obtained by dividing the frequency of the audio signal waveform into 100 bands. As shown in FIG. 11, each analysis unit 60 has bands 0 to 99 each having a center frequency substantially equal to the basic frequency of the audio signal waveform, and has a configuration as shown in FIG. That is, for example, the analysis unit of band k converts the input audio signal waveform X (n) into a complex frequency sin at the center thereof.
(ωk) and cos (ωk) are multiplied (synchronous detection) to obtain the output amplitude value of band k, and the instantaneous frequency information is obtained by differentiating the phase value of the detection output. The instantaneous frequency is an amount of change (differential value) of the phase per unit time at each time point (each position on the time axis of the waveform), and is information indicating a frequency deviation from the center frequency.

【0004】図10の波形処理装置では、このオーディ
オ信号波形X(n) の各バンドの波形データ(出力振幅と
瞬間周波数)は波形メモリ61に格納される。波形メモ
リ61への波形データ格納の態様は、図12に示すごと
く、オーディオ信号波形x(n) の時間軸上の各アドレス
addr(0) 〜addr(n) に対して、各バンド0〜99毎に、
振幅データAと瞬間周波数データfとが格納されるもの
である。
In the waveform processing apparatus shown in FIG. 10, waveform data (output amplitude and instantaneous frequency) of each band of the audio signal waveform X (n) is stored in a waveform memory 61. As shown in FIG. 12, the waveform data is stored in the waveform memory 61 at each address on the time axis of the audio signal waveform x (n).
For addr (0) to addr (n), for each band 0 to 99,
The amplitude data A and the instantaneous frequency data f are stored.

【0005】合成系は、各バンド毎に設けられたバンド
成分再生部62からなり、各バンド成分再生部62は時
間周波数変換処理部31と余弦発振器33と乗算器33
とからなる。時間周波数変換処理部31は、図14に示
すような構成からなる。すなわち、入力した出力振幅の
値に対しては、タイムストレッチ比(時間圧縮/伸長
比)に応じてサンプル点を補間部で飛越し/追加補間し
てその振幅エンベロープ(振幅値の経時的変化を示すエ
ンベロープ)を圧縮/伸長した振幅値を出力する。ま
た、入力した瞬間周波数の値に対しては、その瞬間周波
数値に中心の角周波数ωk を加算するとともに、ピッチ
変換を行う場合にはこの瞬間周波数値に周波数変換比
(ピッチシフトの度合いに応じた比)を乗算し、タイム
ストレッチ比に応じてサンプル点を補間部で飛越し/追
加補間してその周波数エンベロープ(見なし周波数値の
経時的変化を示すエンベロープ)を圧縮/伸長した瞬間
周波数の値を出力する。
The synthesizing system comprises a band component reproducing section 62 provided for each band. Each band component reproducing section 62 includes a time-frequency conversion processing section 31, a cosine oscillator 33, and a multiplier 33.
Consists of The time-frequency conversion processing unit 31 has a configuration as shown in FIG. That is, with respect to the input output amplitude value, the sampling point is skipped / additionally interpolated according to the time stretch ratio (time compression / expansion ratio), and its amplitude envelope (a temporal change of the amplitude value is obtained). And outputs an amplitude value obtained by compressing / expanding the envelope shown in FIG. Also, for the input instantaneous frequency value, the center angular frequency ωk is added to the instantaneous frequency value, and when pitch conversion is performed, the instantaneous frequency value is added to the frequency conversion ratio (depending on the degree of pitch shift). The instantaneous frequency value obtained by compressing / expanding the frequency envelope (envelope indicating the temporal change of the deemed frequency value) by interpolating / additionally interpolating the sample points by the interpolation unit according to the time stretch ratio Is output.

【0006】図15はこの振幅値と瞬間周波数の補間処
理の様子を示す図である。時間伸長する場合には、図1
5(a)に示すように、元の振幅エンベロープと周波数
エンベロープをともに引き伸ばして、時間軸を伸長した
振幅値と瞬間周波数とを生成する。また、時間圧縮する
場合には、図15(b)に示すように、元の振幅エンベ
ロープと周波数エンベロープをともに縮めて、時間軸を
圧縮した振幅値と瞬間周波数とを生成する。この補間処
理により、元のオーディオ信号波形の時間軸を任意に圧
縮/伸長することができる。
FIG. 15 is a diagram showing how the amplitude value and the instantaneous frequency are interpolated. In case of time extension,
As shown in FIG. 5A, the original amplitude envelope and the frequency envelope are both stretched to generate the amplitude value and the instantaneous frequency with the time axis expanded. In the case of time compression, as shown in FIG. 15B, the original amplitude envelope and the frequency envelope are both contracted to generate an amplitude value and an instantaneous frequency obtained by compressing the time axis. By this interpolation processing, the time axis of the original audio signal waveform can be arbitrarily compressed / expanded.

【0007】時間周波数変換処理部31で処理された瞬
間周波数値(適宜、タイムストレッチされたもの)は余
弦発振器に供給され、それにより余弦発振器はそのバン
ドの周波数の余弦波を発生し、その余弦波に、時間周波
数変換処理部31で処理された振幅エンベロープを付加
して出力する。これにより、当該バンドの成分信号が再
生される。さらに、これら各バンド0〜99のバンド成
分を加算合成することで、元のオーディオ信号波形を復
元できる。
The instantaneous frequency value (time-stretched as appropriate) processed by the time-frequency conversion processing unit 31 is supplied to a cosine oscillator, whereby the cosine oscillator generates a cosine wave of the frequency of the band, and generates the cosine wave. The wave is added with the amplitude envelope processed by the time-frequency conversion processing unit 31 and output. Thereby, the component signal of the band is reproduced. Further, the original audio signal waveform can be restored by adding and combining the band components of the respective bands 0 to 99.

【0008】[0008]

【発明が解決しようとする課題】上記の位相ボコーダ方
式で楽音のオーディオ信号波形を再生するにあたり、ピ
アノなどのオーディオ信号波形はそのアタック部分で時
間的にレベルが大きく変化する。このようなオーディオ
信号波形をディジタルフィルタを用いて帯域分割する
と、一つ一つのバンドには、アタックに先行してその痕
跡、いわゆる「プリエコー」が現れる。
In reproducing the audio signal waveform of a musical tone by the above-described phase vocoder method, the level of the audio signal waveform of a piano or the like greatly changes with time in the attack portion. When such an audio signal waveform is band-divided using a digital filter, a trace, a so-called "pre-echo", appears before each attack in each band.

【0009】図9はこのプリエコー現象を説明する図で
ある。簡単のために、図9では、元のオーディオ信号波
形を高周波帯域と低周波帯域に2分した場合について示
してある。典型的なアタックの波形(a)を、低周波成
分の波形(b)と高周波成分の波形(c)に分離し、プ
リエコーの発生する様子を示している。低周波成分波形
(b)と高周波成分波形(c)では、元のアタック波形
(a)に先行している無音部分にプリエコーが生じる様
子が分かる。低周波成分波形(b)のプリエコーと高周
波成分波形(c)のプリエコーは互いに逆相となってお
り、したがって、最終的に低周波成分波形(b)と高周
波成分波形をそのままの位相で合成すると、両者のプリ
エコーは互いに相殺され、無音部分が復元する。このこ
とは、分割する帯域(バンド)数が多い場合も同じであ
り、各バンドの成分波形を再生後に加算合成すれば、プ
リエコーは相殺し合って無音部分となる。
FIG. 9 illustrates this pre-echo phenomenon. For simplicity, FIG. 9 shows a case where the original audio signal waveform is divided into a high frequency band and a low frequency band. A typical attack waveform (a) is separated into a low-frequency component waveform (b) and a high-frequency component waveform (c), and the appearance of a pre-echo is shown. In the low-frequency component waveform (b) and the high-frequency component waveform (c), it can be seen that a pre-echo occurs in a silent portion preceding the original attack waveform (a). The pre-echo of the low-frequency component waveform (b) and the pre-echo of the high-frequency component waveform (c) are in opposite phases to each other. Therefore, if the low-frequency component waveform (b) and the high-frequency component waveform are finally combined with the same phase, The two pre-echoes cancel each other out, and the silent part is restored. This is the same when the number of bands (bands) to be divided is large. If the component waveforms of each band are added and synthesized after reproduction, the pre-echoes cancel each other out to form a silent portion.

【0010】かかるプリエコーは、使用するディジタル
フィルタ(FIRフィルタ)のタップ数が大きいほど甚
だしく発生するようになり、その発生限界はフィルタの
タップ数そのものになり、一般にフィルタの遅延量から
プリエコーの大きさを見積もることができる。
[0010] Such a pre-echo becomes more serious as the number of taps of a digital filter (FIR filter) used increases, and its generation limit becomes the number of taps of the filter itself. Can be estimated.

【0011】ところで、位相ボコーダ方式を用いてタイ
ムストレッチやピッチシフトを行うと、一般に各バンド
の波形は元波形の位相には戻らず、位相が変化してしま
う。このため、各バンドのバンド成分を再生した後に加
算合成しても、各バンドの波形のプリエコー部分も位相
が変化しているため、これらプリエコー部分が互いに相
殺し合うことにならず、この結果、合成後の信号にアタ
ッフに先行するプリエコーが残ってしまう。
When time stretching or pitch shifting is performed using the phase vocoder method, the waveform of each band generally does not return to the phase of the original waveform, but changes. For this reason, even if the band components of each band are reproduced and added and synthesized, the pre-echo portions of the waveform of each band also change in phase, so that these pre-echo portions do not cancel each other out. The pre-echo preceding the attack remains in the combined signal.

【0012】このため、通常、位相ボコーダを用いた波
形再生では、アタックの直前にプリエコーによる雑音が
生じることになり、アタック音が歯切れのよいものにな
らず、いわゆるアタック感が著しく損なわれてしまう。
For this reason, usually, in waveform reproduction using a phase vocoder, noise due to pre-echo occurs immediately before an attack, and the attack sound is not sharp and the so-called attack feeling is significantly impaired. .

【0013】本発明はかかる問題点に鑑みてなされたも
のであり、位相ボコーダ方式を用いつつも、帯域分割に
より発生するプリエコーに起因する雑音の発生を防止す
ることを目的とする。
The present invention has been made in view of the above problems, and has as its object to prevent the generation of noise due to pre-echo caused by band division while using a phase vocoder method.

【0014】[0014]

【課題を解決するための手段および作用】本発明が適用
されるオーディオ信号波形処理装置では、オーディオ信
号を複数バンドに帯域分割した各バンド成分の振幅と位
相を波形データとして持ち、この波形データに基づいて
各バンドのバンド成分を必要に応じ時間圧縮/伸長しつ
つ再生して合成することでオーディオ信号波形を復元す
る。このオーディオ信号波形処理装置において、上述の
課題を解決するために、本発明では、帯域分割によりオ
ーディオ信号波形中に発生するプリエコーの区間に対し
て、該プリエコー区間の始めにて、復元する各バンド成
分の位相を、上記波形データで示されるそれぞれに対応
する元のバンド成分の位相となるように位相リセットを
するように構成する。このプリエコーの区間にては、復
元する波形の時間圧縮/伸長を行わないようにすること
が望ましい。このようにすると、プリエコーが発生する
時点で位相リセットが行われ、その時点での各バンドの
再生波形の位相が原音のそれと同じものにセットされる
ので、これらのバンド成分を合成すると、復元したオー
ディオ信号波形においてプリエコーが相殺される。
An audio signal waveform processing apparatus to which the present invention is applied has amplitude and phase of each band component obtained by dividing an audio signal into a plurality of bands as waveform data. The audio signal waveform is restored by reproducing and synthesizing the band components of each band while compressing / expanding them as necessary based on the basis. In this audio signal waveform processing apparatus, in order to solve the above-mentioned problem, according to the present invention, each band to be restored at the beginning of the pre-echo section with respect to the pre-echo section generated in the audio signal waveform by band division. The phase of the component is reset so that it becomes the phase of the original band component corresponding to each of the waveform data. In this pre-echo section, it is desirable not to perform time compression / expansion of the restored waveform. In this way, the phase is reset at the point when the pre-echo occurs, and the phase of the reproduced waveform of each band at that point is set to the same as that of the original sound. The pre-echo is canceled in the audio signal waveform.

【0015】また、上記の位相リセットでは、それまで
再生していた波形の位相と上記波形データに基づく置き
換えるべき位相の値とをクロスフェードにより置き換え
るように構成すると一層望ましい。このようにすると、
位相リセットの際に、再生波形の位相が連続的に変化す
るようにあるから、突然位相値を変えてしまうことによ
る位相の不連続的変化に起因した雑音の発生を防止でき
る。
In the above-mentioned phase reset, it is more preferable that the phase of the waveform reproduced so far and the value of the phase to be replaced based on the waveform data be replaced by a cross fade. This way,
Since the phase of the reproduced waveform changes continuously at the time of phase reset, it is possible to prevent the generation of noise due to the discontinuous change in phase caused by suddenly changing the phase value.

【0016】また、波形再生にピッチ変換が伴う場合に
は、ピッチ変換に基づく位相変化の度合いと、波形デー
タを読み出すための読出しアドレスの歩進度合いとを合
わせるように構成すると望ましい。これにより、ピッチ
変換された波形の位相は元波形と同じになり、バンド成
分の再生波形において元の位相が再現され、各バンド成
分を合成することでプリエコーを相殺することができ
る。
When the waveform conversion is accompanied by pitch conversion, it is desirable that the degree of the phase change based on the pitch conversion and the step of the read address for reading the waveform data be matched. As a result, the phase of the pitch-converted waveform becomes the same as the original waveform, the original phase is reproduced in the reproduced waveform of the band component, and the pre-echo can be canceled by combining the band components.

【0017】[0017]

【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。図1には本発明の一実施例として
のオーディオ信号波形処理装置が示される。この実施例
は鍵盤型の電子楽器に本発明を適用したものである。図
中、2は装置全体の制御を行うCPU(中央処理装
置)、3は各種テーブルデータやCPU用の制御プログ
ラムなどを格納するROM(リード・オンリー・メモ
リ)、4は複数のオーディオ信号波形の波形データを格
納したりCPUの作業用メモリとして用いられるRAM
(ランダム・アクセス・メモリ)である。5は各種の操
作子からなる操作子群であり、この操作子としては各種
波形から再生波形を選択するための選択ボタンや後述す
る柔軟度を設定したり波形再生を開始・終了指示するな
どの各種の操作子などがある。6は鍵盤装置であり、再
生速度を調整するためのレバー61をそのパネル上に持
つ。1は波形合成部であり、波形メモリ10と各バンド
に対応して設けたバンド成分再生部11-0〜11-99 と
からなり、再生のために選択した波形データに基づいて
元のオーディオ信号波形を復元して出力する。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 shows an audio signal waveform processing apparatus as one embodiment of the present invention. In this embodiment, the present invention is applied to a keyboard-type electronic musical instrument. In the drawing, reference numeral 2 denotes a CPU (central processing unit) for controlling the entire apparatus, 3 denotes a ROM (read only memory) for storing various table data and control programs for the CPU, and 4 denotes a plurality of audio signal waveforms. RAM for storing waveform data and used as working memory for CPU
(Random access memory). Reference numeral 5 denotes an operator group composed of various operators, such as a selection button for selecting a reproduction waveform from various waveforms, a flexibility to be described later, and instructions for starting and ending waveform reproduction. There are various controls. Reference numeral 6 denotes a keyboard device having a lever 61 on its panel for adjusting the reproduction speed. Reference numeral 1 denotes a waveform synthesizing unit, which comprises a waveform memory 10 and band component reproducing units 11-0 to 11-99 provided corresponding to the respective bands, and based on waveform data selected for reproduction, an original audio signal. Restore the waveform and output.

【0018】波形合成部1の波形メモリ10は、オーデ
ィオ信号波形の波形データを格納する領域とリセットア
ドレス情報を格納する領域とを有する。
The waveform memory 10 of the waveform synthesizing section 1 has an area for storing waveform data of an audio signal waveform and an area for storing reset address information.

【0019】オーディオ信号波形の波形データは出力振
幅値と位相値とからなる。出力振幅値は前述の従来技術
で説明したものと同じである。位相値は前述の従来技術
の瞬間周波数値に代わるもので、位相ボコーダの本来の
特徴パラメータである。本実施例装置では、複数種類の
オーディオ信号波形について上記波形データ(振幅値と
位相値)を予め分析して求めておいて、RAM4に格納
してある。そして、波形選択用の選択ボタンで再生用に
選択したオーディオ信号波形の波形データが上記波形メ
モリ10の波形データ領域に格納される。
The waveform data of the audio signal waveform includes an output amplitude value and a phase value. The output amplitude value is the same as that described in the prior art. The phase value replaces the instantaneous frequency value of the prior art described above, and is an original characteristic parameter of the phase vocoder. In the present embodiment, the waveform data (amplitude value and phase value) of a plurality of types of audio signal waveforms are determined in advance by analysis and stored in the RAM 4. Then, the waveform data of the audio signal waveform selected for reproduction by the selection button for waveform selection is stored in the waveform data area of the waveform memory 10.

【0020】図2にはオーディオ信号波形を分析して各
バンドの波形の出力振幅値と位相値の波形データを抽出
する分析部の概念構成が示される。図示するように、オ
ーディオ信号波形X(n) に対して、バンド中心の複素周
波数cos(ωk,n) 、sin(ωk,n) をそれぞれ乗じてイン
パルス応答W(n) の分析フィルタを通し、その出力を二
乗演算した後に加算して平方根を計算することで振幅値
を得る。また、分析フィルタの出力Xcos 、Xsin を演
算部に通して位相値を得る。演算部では、分析フィルタ
の出力Xcos 、Xsin に応じて、 Xcos >0の時には Arctan(Xsin/Xcos) Xcos <0の時には Arctan(Xsin/Xcos)+π を演算し、その結果を位相値として出力する。
FIG. 2 shows a conceptual configuration of an analyzer for analyzing the audio signal waveform and extracting the waveform data of the output amplitude value and the phase value of the waveform of each band. As shown in the figure, the audio signal waveform X (n) is multiplied by complex frequencies cos (ωk, n) and sin (ωk, n) at the center of the band, respectively, and passed through an analysis filter of an impulse response W (n). The output is squared and then added to calculate the square root to obtain an amplitude value. Further, the outputs Xcos and Xsin of the analysis filter are passed through a calculation unit to obtain a phase value. The arithmetic unit calculates Arctan (Xsin / Xcos) when Xcos> 0 and calculates Arctan (Xsin / Xcos) + π when Xcos <0, according to the outputs Xcos and Xsin of the analysis filter, and outputs the result as a phase value. .

【0021】また、波形メモリ10のリセットアドレス
情報領域には、選択したオーディオ信号波形のリセット
アドレス情報(位相リセット情報)が格納される。この
リセットアドレス情報は、オーディオ信号波形のアタッ
クを表すアドレスよりもプリエコーが発生する分だけ前
の位置のアドレスが設定されており、オーディオ信号波
形中に時系列的に存在する各アタック波形毎に設定され
て、RstAdr(0) 、RstAdr(1) 、RstAdr(2) ・・・のよう
に連続的に付番され、その大きさの順に整列させてお
く。なお、プリエコーがアタックよりどれだけ先行する
かは帯域分割するフィルタの遅延量から推し量ることが
できる。
The reset address information area of the selected audio signal waveform (phase reset information) is stored in the reset address information area of the waveform memory 10. In this reset address information, an address at a position before the address indicating the attack of the audio signal waveform by an amount corresponding to the occurrence of the pre-echo is set, and is set for each attack waveform existing in the audio signal waveform in time series. .. Are sequentially assigned as RstAdr (0), RstAdr (1), RstAdr (2),... And are arranged in order of their size. It should be noted that how much the pre-echo precedes the attack can be estimated from the delay amount of the filter that divides the band.

【0022】本実施例装置では、複数種類のオーディオ
信号波形について上記リセットアドレス情報を予め分析
して求めておいて、RAM4に格納しておく。そして、
波形選択用の選択ボタンで再生用に選択したオーディオ
信号波形のリセットアドレス情報が上記波形メモリ10
のリセットアドレス情報領域に格納される。
In this embodiment, the reset address information is analyzed and obtained in advance for a plurality of types of audio signal waveforms and stored in the RAM 4. And
The reset address information of the audio signal waveform selected for reproduction by the selection button for waveform selection is stored in the waveform memory 10.
Is stored in the reset address information area.

【0023】バンド成分再生部11-0〜11-99 には波
形メモリ10からは振幅値と位相値と、さらにリセット
アドレスとが入力され、またCPU2側から時間位置情
報(読出しアドレスDataAdr)とピッチ情報が入力されて
おり、これらのデータに基づいて該当バンドのバンド成
分を再生し出力する。この各バンド成分再生部11-0〜
11-99 から出力されたバンド成分は互いに加算合成さ
れてオーディオ信号波形として復元されて出力される。
The amplitude and phase values from the waveform memory 10 and the reset address are input to the band component reproducing units 11-0 to 11-99, and the time position information (read address DataAdr) and the pitch are input from the CPU 2 side. Information is input, and the band component of the corresponding band is reproduced and output based on these data. Each band component reproducing unit 11-0 ~
The band components output from 11-99 are added and synthesized with each other, restored as an audio signal waveform, and output.

【0024】図3にはバンド成分再生部11の構成例が
示される。図示するごとく、波形メモリ10から読み出
された位相値は2分岐されて一方は直接に余弦発振器3
2に、もう一方は微分部30にそれぞれ入力される。微
分部30に入力された位相値は微分されることで瞬間周
波数に変換されて時間周波数変換処理部31に入力され
る。また、波形メモリ10から読み出された振幅値は時
間周波数変換処理部31に入力される。この時間周波数
変換処理部31は従来技術の項で説明したものと同じ構
成を持っており、従来構成同様、その振幅値を乗算器3
3に、瞬間周波数の値を余弦発振器32にそれぞれ送出
する。
FIG. 3 shows an example of the configuration of the band component reproducing unit 11. As shown in the figure, the phase value read from the waveform memory 10 is branched into two, one of which is directly connected to the cosine oscillator 3.
2 and the other is input to the differentiator 30. The phase value input to the differentiating unit 30 is converted into an instantaneous frequency by being differentiated, and input to the time-frequency conversion processing unit 31. The amplitude value read from the waveform memory 10 is input to the time-frequency conversion processing unit 31. The time-frequency conversion processing unit 31 has the same configuration as that described in the section of the prior art, and, like the conventional configuration, multiplies the amplitude value by the multiplier 3.
3, the value of the instantaneous frequency is sent to the cosine oscillator 32, respectively.

【0025】また、波形メモリ10から読み出されたリ
セットアドレス情報は、位相リセット信号発生部34に
入力される。この位相リセット信号発生部34には波形
メモリ10から波形データを読み出すための読出しアド
レスDataAdr (時間位置情報)が入力されている。位相
リセット信号発生部34は、波形メモリ10から読み出
したリセットアドレスRstAdrと読出しアドレスDataAdr
とを比較し、読出しアドレスDataAdr がリセットアドレ
スRstAdrを超えた時点で位相リセット信号を生成して余
弦発振器32に送出する。
The reset address information read from the waveform memory 10 is input to the phase reset signal generator 34. A read address DataAdr (time position information) for reading waveform data from the waveform memory 10 is input to the phase reset signal generator 34. The phase reset signal generator 34 includes a reset address RstAdr read from the waveform memory 10 and a read address DataAdr.
When the read address DataAdr exceeds the reset address RstAdr, a phase reset signal is generated and sent to the cosine oscillator 32.

【0026】図4にはこの位相リセット信号発生部34
での位相リセット信号送出手順のフローチャートが示さ
れる。図示するように、波形の再生にともない読出しア
ドレスDataAdr が更新されると(ステップS1)、その
読出しアドレスがリセットアドレスRstAdr(k) を超えた
か、すなわち、 RstAdr(k) <DataAdr かを判定し(ステップS2)、超えていなければ処理を
終了して、次の読出しアドレスの更新まで待ち、超えて
いれば、リセットアドレスの順番を示すパラメータkの
更新、すなわちk=k+1を行うとともに、位相リセッ
ト信号を発生して送出する(ステップS3)。
FIG. 4 shows the phase reset signal generator 34.
2 shows a flowchart of a phase reset signal transmission procedure. As shown, when the read address DataAdr is updated with the reproduction of the waveform (step S1), it is determined whether the read address has exceeded the reset address RstAdr (k), that is, whether RstAdr (k) <DataAdr ( Step S2) If not exceeded, terminate the processing and wait until the next read address is updated. If exceeded, update the parameter k indicating the order of the reset address, that is, k = k + 1, and execute the phase reset signal. Is generated and transmitted (step S3).

【0027】図5には余弦発振器32の構成例が示され
る。波形メモリ10からの位相値データは加算器42に
入力され、ここで当該ブロックの中心周波数の回転分
(角周波数)ωkが加算されてその結果値が和分器40
に入力される。この和分器40には時間周波数変換処理
部31からの瞬間周波数値が入力されており、和分する
ことで瞬間位相値に変換して、この瞬間位相値を余弦演
算器41に供給することで、当該ブロックの成分信号の
周波数と見なされる周波数を持つ余弦波を発生し出力す
る。また、和分器には位相リセット信号が入力されてお
り、位相リセット信号が到来すると、その瞬間周波数の
位相を加算器42からの絶対位相に置き換える。
FIG. 5 shows an example of the configuration of the cosine oscillator 32. The phase value data from the waveform memory 10 is input to the adder 42, where the rotation (angular frequency) ωk of the center frequency of the block is added, and the resultant value is added to the adder 40.
Is input to An instantaneous frequency value from the time-frequency conversion processing unit 31 is input to the adder 40, and the sum is converted into an instantaneous phase value by summing and supplied to the cosine calculator 41. Then, a cosine wave having a frequency regarded as the frequency of the component signal of the block is generated and output. A phase reset signal is input to the adder, and when the phase reset signal arrives, the phase of the instantaneous frequency is replaced with the absolute phase from the adder 42.

【0028】次に、この実施例装置では、オーディオ信
号波形のタイムストレッチ(時間の圧縮/伸長)を行う
ために、時間の圧縮伸長率と柔軟度を用いているので、
これらについて説明する。圧縮伸長率は、オーディオ信
号波形に対する時間圧縮伸長量を圧縮/伸長前後の時間
長の比率で表わすものである。一方、柔軟度は、オーデ
ィオ信号波形の各区間において圧縮伸長率をどのように
修正するかの修正度合を表わしたものである。
Next, in this embodiment, in order to perform time stretching (time compression / expansion) of the audio signal waveform, the time compression / expansion rate and flexibility are used.
These will be described. The compression / expansion rate indicates the amount of time compression / expansion with respect to the audio signal waveform by the ratio of the time length before and after compression / expansion. On the other hand, the flexibility indicates the degree of correction of how to correct the compression / decompression rate in each section of the audio signal waveform.

【0029】〔柔軟度〕例えば図6に示すように、楽音
波形を時間的に複数の区間(その総区間数をmとする)
に区切り、それらの各区間毎に柔軟度E(i) を設定す
る。この区間は例えばプリエコーの区間、アタックの区
間、ディケイの区間、サスティンの区間、リリースの区
間、無音の区間などに一致するよう設定すると望まし
い。
[Flexibility] For example, as shown in FIG. 6, a musical tone waveform is temporally divided into a plurality of sections (the total number of sections is m).
And the flexibility E (i) is set for each of these sections. This section is desirably set to coincide with, for example, a pre-echo section, an attack section, a decay section, a sustain section, a release section, a silent section, and the like.

【0030】ここで、柔軟度E(i) が「0」である場合
は、その区間についてはその再生速度はレバー61の設
定状態や圧縮伸長率の値いかんにかかわらず元波形のま
まに保つことになる。また、柔軟度が「1」である場
合、レバー61で設定された再生速度となる。また、柔
軟度が「1」よりも小さくなれば、レバー61で設定さ
れた再生速度よりも低くなり、柔軟度が「1」よりも大
きくなれば、レバー61で設定された再生速度よりも高
くなる。
When the flexibility E (i) is "0", the reproduction speed of the section is maintained at the original waveform regardless of the setting state of the lever 61 and the value of the compression / expansion rate. Will be. When the flexibility is “1”, the reproduction speed is set by the lever 61. When the flexibility is smaller than “1”, the playback speed is lower than the playback speed set by the lever 61. When the flexibility is larger than “1”, the playback speed is higher than the playback speed set by the lever 61. Become.

【0031】この柔軟度は、楽音波形の各区間の長さと
その区間における柔軟度との積の総和が全区間の長さと
なるように、各区間の柔軟度が設定される。これは数式
で表わすと、 ΣE(i) ×L(i) =ΣL(i) ・・・(1) 但し、Σはi=0から(m−1)までの加算 L(i) は各区間の長さ E(i) は各区間における柔軟度 mは総区間数 iは0からmまでの区間のうちの再生中の区間を示す区
間カウンタ となる。従って、柔軟度によって各区間の圧縮伸長率が
修正されても、波形データの全体の圧縮または伸長され
た時間は、圧縮伸長率に元の波形データの時間を乗算し
た値、即ち波形データ全体を単に圧縮伸長率に基づいて
圧縮/伸長したときの時間となる。
The flexibility of each section is set such that the sum of the product of the length of each section of the musical tone waveform and the flexibility in that section becomes the length of all sections. This is represented by a mathematical formula: ΣE (i) × L (i) = L (i) (1) where Σ is the addition from i = 0 to (m−1). The length E (i) is the degree of flexibility m in each section m is the total number of sections i is a section counter indicating the section being reproduced among the sections from 0 to m. Therefore, even if the compression / expansion rate of each section is corrected by the flexibility, the compression or decompression time of the entire waveform data is determined by multiplying the compression / expansion rate by the time of the original waveform data, that is, the entire waveform data. This is simply the time when compression / expansion is performed based on the compression / expansion rate.

【0032】なお、後述するが、本発明では、プリエコ
ー区間の柔軟度E(i) を「0」に設定することで本発明
による処理を可能ならしめている。
As will be described later, in the present invention, the processing according to the present invention is made possible by setting the degree of flexibility E (i) in the pre-echo section to "0".

【0033】〔圧縮伸長率〕圧縮伸長率は、再生する波
形の時間長を元波形の時間長に比べて圧縮したり伸長し
たりするための係数である。すなわち、この実施例装置
では、鍵盤6に設けたレバー61を操作することによっ
て波形の再生速度が可変できる。このレバー61は、自
動復帰点である中点位置では再生速度は元波形と同じに
なり、前後に揺動することで再生速度を速めたり遅らし
たりできる。この再生速度は、圧縮伸長率とは逆数の関
係にある。例えば、或る波形を2倍の再生速度で再生す
ると、再生にかかる時間はl/2倍となるが、これは、
即ち圧縮伸長率がl/2であることに他ならない。ま
た、この波形をl/2倍の再生速度で再生すると、再生
にかかる時間は2倍となるが、同様に、これは圧縮伸長
率が2であることを示している。
[Compression / Expansion Rate] The compression / expansion rate is a coefficient for compressing or expanding the time length of the waveform to be reproduced as compared with the time length of the original waveform. That is, in this embodiment, the waveform reproduction speed can be varied by operating the lever 61 provided on the keyboard 6. The playback speed of the lever 61 is the same as that of the original waveform at the midpoint position, which is the automatic return point, and the playback speed can be increased or decreased by swinging back and forth. This reproduction speed has a reciprocal relationship to the compression / expansion rate. For example, if a certain waveform is played back at twice the playback speed, the time required for the playback will be 1/2 times.
That is, the compression / decompression rate is 1/2. When this waveform is reproduced at a reproduction speed of l / 2 times, the time required for reproduction is doubled. Similarly, this also indicates that the compression / expansion rate is 2.

【0034】上記の再生速度は歩進量(tcomp, tcomp',
tcomp")に基づいて決まる。歩進量は、オーディオ信号
波形を再生するための時間位置(読出しアドレスDataAd
r)を歩進させる量であり、言い換えれば波形再生の速
さ、すなわち時間伸長圧縮率の逆数になる。この歩進量
は、レバー61の操作によって設定される。
The above-mentioned reproduction speed is determined by the step amount (tcomp, tcomp ',
tcomp "). The step amount is determined by a time position (read address DataAd) for reproducing the audio signal waveform.
r) is the amount by which step is advanced, in other words, the speed of waveform reproduction, that is, the reciprocal of the time expansion / compression ratio. This step amount is set by operating the lever 61.

【0035】この歩進量には、レバー61の設定位置に
より決まる基本となる基本歩進量tcomp 、この基本歩進
量tcomp を柔軟度を考慮して修正した柔軟度修正歩進量
tcomp'、この柔軟度修正歩進量tcomp'を更にピッチ変換
を考慮して修正したピッチ修正歩進量tcomp"がある。
The step amount includes a basic step amount tcomp which is a basic value determined by the setting position of the lever 61, and a flexibility-corrected step amount obtained by correcting the basic step amount tcomp in consideration of the flexibility.
There is a pitch correction step amount tcomp "obtained by further correcting the flexibility correction step amount tcomp 'in consideration of the pitch conversion.

【0036】まず、基本歩進量tcomp は、具体的にはレ
バー61が中点位置にある時に「1」、前後に倒された
時に例えば「+2」〜「0」の間で変化する値である。
この基本歩進量tcomp で読出しアドレスDataAdr を更新
する場合、基本歩進量tcompが「1」であればオーディ
オ信号波形は元の時間長のまま再生され、基本歩進量tc
omp が「2」であればオーディオ信号波形は元の時間長
の半分で再生され、基本歩進量tcomp が「0」であれば
オーディオ信号波形は同じ位置を繰り返し再生される。
First, the basic step amount tcomp is specifically a value that changes when the lever 61 is at the midpoint position and changes between, for example, “+2” and “0” when the lever 61 is tilted back and forth. is there.
When the read address DataAdr is updated with the basic step amount tcomp, if the basic step amount tcomp is “1”, the audio signal waveform is reproduced with the original time length, and the basic step amount tc
If omp is "2", the audio signal waveform is reproduced in half of the original time length, and if the basic step amount tcomp is "0", the audio signal waveform is repeatedly reproduced at the same position.

【0037】柔軟度修正歩進量tcomp'は、上記基本歩進
量tcomp を対応区間の柔軟度E(i)に基づいて下式によ
り修正したものである。 tcomp'=1/[E(i) ×{ (1/tcomp )−1}+1] ここで柔軟度E(i) を1とすると、柔軟度修正歩進量tc
omp'は基本歩進量tcomp となり、レバー61で設定され
た再生速度となる。また柔軟度E(i) をlよりも小さく
すると、柔軟度修正歩進量tcomp'の値は基本歩進量tcom
p よりも小さくなり、レバー61によって設定された再
生速度よりも低くなる。また柔軟度E(i) を1よりも大
きくすると、柔軟度修正歩進量tcomp'の値は基本歩進量
tcomp よりも大きくなり、レバー61で設定された再生
速度よりも高くなる。また柔軟度E(i) を「0」に設定
すると、柔軟度修正歩進量tcomp'は「l」となり、元波
形の再生遠度となる。従って、柔軟度E(i) を「0」に
設定することによって圧縮伸長を行っているにもかかわ
らず、その区間M(i) を元波形の再生速度で再生するこ
とができる。この場合、レバー61によって設定される
基本歩進量tcomp の値が再生の途中で変更されても、柔
軟度修正歩進量tcomp'は「1」を維持する。このように
CPU2が基本歩進量tcomp の修正を行っている。
The flexibility correction step amount tcomp 'is obtained by correcting the basic step amount tcomp by the following equation based on the flexibility E (i) of the corresponding section. tcomp ′ = 1 / [E (i) × {(1 / tcomp) −1} +1] Here, assuming that the flexibility E (i) is 1, the flexibility correction step amount tc
omp 'becomes the basic step amount tcomp, and becomes the reproduction speed set by the lever 61. When the flexibility E (i) is made smaller than 1, the value of the flexibility correction step amount tcomp ′ becomes the basic step amount tcom.
p and becomes lower than the reproduction speed set by the lever 61. When the flexibility E (i) is larger than 1, the value of the flexibility correction step amount tcomp ′ becomes the basic step amount.
It becomes larger than tcomp and becomes higher than the reproduction speed set by the lever 61. When the flexibility E (i) is set to "0", the flexibility correction step amount tcomp 'becomes "1", which is the reproduction distance of the original waveform. Therefore, the section M (i) can be reproduced at the reproduction speed of the original waveform even though the compression / expansion is performed by setting the flexibility E (i) to "0". In this case, even if the value of the basic step amount tcomp set by the lever 61 is changed during playback, the flexibility-corrected step amount tcomp 'maintains "1". Thus, the CPU 2 corrects the basic step amount tcomp.

【0038】ピッチ修正歩進量tcomp"については、詳し
くは後述するが、柔軟度修正歩進量tcomp'を更に修正し
て、 tcomp"=W×tcomp' により求める。ここに、Wは修正度であり、 W=(L/tcomp −L0)/(L/tcomp −L0/P) である。ここで、「L0」はリセットアドレスから始ま
る柔軟度0の区間、「L」は注目しているリセットアド
レスから次のリセットアドレスまでの長さである。
Although the pitch correction step amount tcomp "will be described later in detail, the flexibility correction step amount tcomp 'is further corrected, and is obtained by tcomp" = W × tcomp'. Here, W is the degree of correction, and W = (L / tcomp−L0) / (L / tcomp−L0 / P). Here, “L0” is a section of flexibility 0 starting from the reset address, and “L” is a length from the reset address of interest to the next reset address.

【0039】〔読出しアドレスDataAdr の生成〕時間の
圧縮/伸長やピッチシフトを行っていない場合、読出し
アドレスDataAdr はオーディオ信号波形のアドレス順に
歩進されて発生される。その速度は、オーディオ信号波
形データのサンプリング周波数が44.lkHzである
と、44.1kHzとなる。レバー61により再生速度
が変えられている場合には、レバー61により決定され
る基本歩進量tcomp により読出しアドレスDataAdr は歩
進される。例えば、基本歩進量tcomp が「2」であれ
ば、元のオーディオ信号波形のサンプリング点(アドレ
スAddr) を一つ置きに飛び越す読出しアドレスDataAdr
が生成される(すなわち時間圧縮される)。また、例え
ば基本歩進量tcomp が「1/2」であれば、元のオーデ
ィオ信号波形のサンプリング点間の中間点においても読
出しアドレスDataAdr が生成される(すなわち時間伸長
される)。
[Generation of Read Address DataAdr] When time compression / expansion and pitch shift are not performed, the read address DataAdr is generated by being advanced in the address order of the audio signal waveform. The sampling speed of the audio signal waveform data is 44. If it is 1 kHz, it becomes 44.1 kHz. When the reproduction speed is changed by the lever 61, the read address DataAdr is incremented by the basic increment tcomp determined by the lever 61. For example, if the basic step amount tcomp is “2”, the read address DataAdr skips every other sampling point (address Addr) of the original audio signal waveform.
Is generated (ie, time compressed). For example, if the basic step amount tcomp is "1/2", the read address DataAdr is generated (that is, time-expanded) even at an intermediate point between the sampling points of the original audio signal waveform.

【0040】以下、この実施例装置の動作を説明する。
前述したように、複数のオーディオ信号波形について、
それぞれのオーディオ信号波形中の各プリエコー部分の
先頭がリセットアドレスとして予め設定されており、こ
れらのリセットアドレスは対応するオーディオ信号波形
の波形データとともにRAM4に予め格納されている。
また、これらのオーディオ信号波形については、柔軟度
E(i) の情報も各オーディオ信号波形に対応付けてRA
M4に格納されている。本実施例では、上記各プリエコ
ーの区間に対しては柔軟度E(i)として「0」が設定さ
れている。
The operation of this embodiment will now be described.
As described above, for a plurality of audio signal waveforms,
The head of each pre-echo portion in each audio signal waveform is preset as a reset address, and these reset addresses are stored in the RAM 4 in advance together with the waveform data of the corresponding audio signal waveform.
For these audio signal waveforms, information on the flexibility E (i) is also associated with each audio signal waveform.
It is stored in M4. In this embodiment, “0” is set as the flexibility E (i) for each pre-echo section.

【0041】操作子群5中の波形選択ボタンを用いて任
意のオーディオ信号波形を選択すると、当該オーディオ
信号波形の波形データとリセットアドレス情報が波形合
成部1の波形メモリ10に転送されて格納される。ま
た、柔軟度の情報が読出しアドレスDataAdr を作成する
ためにCPU2によって参照される。
When an arbitrary audio signal waveform is selected using the waveform selection button in the operator group 5, the waveform data of the audio signal waveform and the reset address information are transferred to and stored in the waveform memory 10 of the waveform synthesizing section 1. You. The flexibility information is referred to by the CPU 2 in order to create the read address DataAdr.

【0042】波形再生の開始を指示すると、CPU2で
はその時のレバー61の設定状態や波形再生位置の柔軟
度情報、ピッチ情報などを参照して読出しアドレスData
Adrを生成し、これをバンド成分再生部11-0〜11-99
に時間位置情報として供給する。
When the start of waveform reproduction is instructed, the CPU 2 refers to the setting state of the lever 61 at that time, the flexibility information of the waveform reproduction position, the pitch information, and the like, and reads out the read address Data.
Adr is generated, and this is used as a band component reproducing unit 11-0 to 11-99.
As time position information.

【0043】バンド成分再生部11-0〜11-99 では、
この読出しアドレスDataAdr に従って波形メモリ10か
ら各バンドの波形データを読み出して、各バンド成分再
生部11-0〜11-99 でバンド成分を再生する。バンド
成分再生部11における時間周波数変換処理部31での
処理は、波形メモリ10から読み出した位相値を微分部
30で微分することにより瞬間周波数に変換して時間周
波数変換処理部31に送出している点を除けば、従来技
術で説明したと同様の処理である。
In the band component reproducing units 11-0 to 11-99,
The waveform data of each band is read from the waveform memory 10 according to the read address DataAdr, and the band components are reproduced by the band component reproducing units 11-0 to 11-99. The processing in the time-frequency conversion processing unit 31 in the band component reproduction unit 11 converts the phase value read from the waveform memory 10 into an instantaneous frequency by differentiating the phase value in the differentiation unit 30 and sends the instantaneous frequency to the time-frequency conversion processing unit 31. Except for this point, the processing is similar to that described in the related art.

【0044】また、波形メモリ10からはリセットアド
レスRstAdr(n) が読み出されて位相リセット信号発生部
34に入力され、この位相リセット信号発生部34にお
いて読出しアドレスDataAdr がこのリセットアドレスRs
tAdr(n) と比較され、両者が一致したら、位相リセット
信号を発生して余弦発振器32に送出される。余弦発振
器32では、位相リセット信号を受信すると、発生する
余弦波の位相を、その時点で波形メモリ10から入力さ
れる波形データの位相値(すなわち原音波形の位相)に
なるようリセットする。
The reset address RstAdr (n) is read out from the waveform memory 10 and input to the phase reset signal generator 34. The phase reset signal generator 34 reads the reset address DataAdr from the reset address Rs.
It is compared with tAdr (n), and if they match, a phase reset signal is generated and sent to the cosine oscillator 32. Upon receiving the phase reset signal, the cosine oscillator 32 resets the phase of the generated cosine wave to the phase value of the waveform data input from the waveform memory 10 at that time (that is, the phase of the original sound waveform).

【0045】これにより、リセットアドレスRstAdr(n)
の時間位置、すなわちプリエコー区間の先頭位置で、各
バンド成分再生部11-0〜11-99 で再生される各バン
ド成分信号の位相は、元のオーディオ信号波形を帯域分
割した各バンド成分信号のそれと一致することになるの
で、これらを加算合成すれば、各バンド成分信号のプリ
エコー波形は互いに相殺し合って、復元したオーディオ
信号波形中から無くなる。プリエコー区間では柔軟度が
「0」に設定されているため同区間を通して時間圧縮/
伸長が行われないので、再生信号中に時間圧縮/伸長処
理に起因する位相シフトは生じない。よって、上記の再
生される各バンド成分信号のプリエコー波形が互いに相
殺し合う状態は、上記プリエコー区間全体わたり続くこ
とになる。
As a result, the reset address RstAdr (n)
At the time position, that is, at the head position of the pre-echo section, the phase of each band component signal reproduced by each band component reproducing unit 11-0 to 11-99 is determined by If these are added and synthesized, the pre-echo waveforms of the respective band component signals cancel each other out and disappear from the restored audio signal waveform. Since the flexibility is set to “0” in the pre-echo section, time compression /
Since no decompression is performed, no phase shift due to the time compression / decompression processing occurs in the reproduced signal. Therefore, the state in which the pre-echo waveforms of the reproduced band component signals cancel each other continues over the entire pre-echo section.

【0046】なお、余弦発振器32中での動作は、位相
リセット信号が入力されると、和分器40において、保
持している位相をリセットし、波形メモリ10から直接
に送られている位相値に中心周波数の回転分ωknを加
えたものに置き換える。そして、この位相を置き換えた
瞬間周波数の値を余弦演算器41に与えて、その位相と
周波数の余弦波を演算で発生し出力する。上述したよう
に、予め少なくとも各リセットアドレスRstAdr(n) から
アタック区間の先頭アドレスまでは柔軟度が0の区間に
なるように設定してあるので、アタックが開始されるま
での区間では、時間位置情報(読出しアドレス)は原音
が忠実に再現されるような値になり、この区間では、初
めに帯域分割したままのプリエコー波形がそのまま再現
され、よって合成時にプリエコーが相殺される。
The operation in the cosine oscillator 32 is such that when the phase reset signal is input, the held phase is reset in the adder 40 and the phase value directly sent from the waveform memory 10 is output. And the rotational frequency ωkn of the center frequency added. Then, the value of the instantaneous frequency obtained by replacing the phase is given to the cosine calculator 41, and the cosine wave of the phase and frequency is generated and output by calculation. As described above, at least the interval from the reset address RstAdr (n) to the start address of the attack section is set so that the flexibility is 0. Therefore, in the section until the attack is started, the time position is set. The information (read address) has a value such that the original sound is faithfully reproduced. In this section, the pre-echo waveform which is initially divided into bands is reproduced as it is, so that the pre-echo is canceled at the time of synthesis.

【0047】以上の動作はピッチ変換(ピッチシフト)
を伴わない場合について説明したものであり、この発明
は、このようなピッチ変換を伴わない場合に最も効果的
に用いられるものであるが、しかし、ピッチ変換を伴う
場合にも、以下のような処理を行うことでこの発明を適
用することができる。
The above operation is performed for pitch conversion (pitch shift).
The present invention is most effectively used in the case where such a pitch conversion is not performed. The present invention can be applied by performing the processing.

【0048】まず、リセットアドレスに続く柔軟度0の
区間を仮にリジット区間と呼ぶ。便宜上、リジット区間
の長さを「L0」、注目しているリセットアドレスから
次のリセットアドレスまでの長さを「L」とする。先に
説明した柔軟度修正歩進量tcomp'に更に修正を加える。
すなわち、リセットアドレスに続く柔軟度「0」の区間
では、 tcomp"=P とする。ここに、Pはバンド成分再生部に供給されるピ
ッチ情報P(ピッチシフトさせる量を示す情報)であ
る。
First, a section having a degree of flexibility of 0 following the reset address is temporarily referred to as a rigid section. For convenience, the length of the rigid section is “L0”, and the length from the reset address of interest to the next reset address is “L”. Further correction is added to the flexibility correction step amount tcomp ′ described above.
That is, in the section of the degree of flexibility "0" following the reset address, tcomp "= P. Here, P is pitch information P (information indicating the amount of pitch shift) supplied to the band component reproducing unit.

【0049】さらに、次のリセットアドレスまでの各区
間では、歩進量として、柔軟度修正歩進量tcomp'を更に
修正した再修正ピッチ修正歩進量tcomp"、 tcomp"=W×tcomp' を用いる。ここに、Wは修正度であり、 W=(L/tcomp −L0)/(L/tcomp −L0/P) である。
Further, in each section up to the next reset address, a re-corrected pitch correction step amount tcomp ", tcomp" = W × tcomp 'obtained by further correcting the flexibility correction step amount tcomp' is used as the step amount. Used. Here, W is the degree of correction, and W = (L / tcomp−L0) / (L / tcomp−L0 / P).

【0050】これは、リジッド区間においては、ピッチ
変換がなされるために位相の進み方がP倍になる。そこ
で、基本歩進量tcomp のほうも同じ値に設定すれば、位
相の進みは元波形と同じになり、ピッチ変換した波形に
おいても元の位相が再現される。さらに、それに伴いリ
ジッド区間の長さは1/Pになるので、次のリセットア
ドレスが来るまでの残りの区間のアドレスの歩進量を修
正度Wで調整することで、リセットアドレスから次のリ
セットアドレスまでの長さを所望の時間長に修正する。
図7はこの様子を示したもので、黒い部分がリジッド区
間である。このピッチ修正歩進量tcomp"により時間位置
情報が計算される。
In the rigid section, the phase is advanced by P times because the pitch is converted. Therefore, if the basic step amount tcomp is set to the same value, the phase advance becomes the same as the original waveform, and the original phase is reproduced even in the pitch-converted waveform. Further, since the length of the rigid section becomes 1 / P accordingly, the amount of advance of the address of the remaining section until the next reset address comes is adjusted by the correction degree W, so that the next reset address is reset. Correct the length to the address to the desired time length.
FIG. 7 shows this state, in which a black portion is a rigid section. Time position information is calculated from the pitch correction step amount tcomp ".

【0051】本発明の実施にあたっては種々の変形形態
が可能である。例えば、上述した実施例では、余弦発振
器で位相リセットするときに一般に位相は不連続にな
り、そのために雑音が発生する可能性がある。一般に、
位相リセットはアタックの少し前になされ、そのときの
振幅は通常きわめて小さなものであるため、この部分の
位相が不連続であるとしても、雑音は発生しないか発生
したとしても問題にならないくらい小さなものである
が、しかし、この小さな雑音発生の可能性をさらに低減
するよう改良することも可能である。
In carrying out the present invention, various modifications are possible. For example, in the above-described embodiment, when the phase is reset by the cosine oscillator, the phase generally becomes discontinuous, which may cause noise. In general,
Since the phase reset occurs shortly before the attack, and the amplitude is usually very small, even if the phase of this part is discontinuous, no noise is generated or it is small enough to cause no problem if it occurs. However, improvements can be made to further reduce the possibility of this small noise generation.

【0052】すなわち、余弦発振器において、位相リセ
ット信号の到来のタイミングでいきなり位相リセットす
るのではなく、位相リセット信号の到来から、周波数値
の和分の値と絶対位相(波形メモリ10の波形データの
位相に応じたもの)との割合を徐々に変えながら加えて
いく、いわゆるクロスフェードにより位相を連続的に絶
対位相に近づけていくように構成する。クロスフェード
の時間はリセットアドレスからプリエコーの長さに比べ
て短い時間で十分であるが、リセットアドレスをその分
だけさらに前になるように予め設定しておくこともでき
る。
That is, in the cosine oscillator, instead of suddenly resetting the phase at the timing of the arrival of the phase reset signal, the sum of the frequency values and the absolute phase (the waveform data of the waveform The phase is continuously changed to the absolute phase by so-called cross-fade, which is performed while gradually changing the ratio of the phase to the absolute phase. It is sufficient that the cross-fade time is shorter than the length of the pre-echo from the reset address, but the reset address can be set in advance so as to be earlier by that amount.

【0053】図8は、このクロスフェードをするときの
余弦発振器の構成例を示すものである。この構成例で
は、クロスフェード演算器43を新たに設け、位相リセ
ット信号、絶対位相、和分器40の出力(瞬間位相値)
を入力するとともに、和分器40に対してクロスフェー
ド終了通知を送出するよう構成する。クロスフェード演
算器43は、通常のとき、和分器40からのデータをそ
のまま出力し、位相リセット信号が到来すると、クロス
フェードを開始する。このクロスフェードは、位相リセ
ット後、このクロスフェード演算器43の出力信号を、
和分器40の瞬間位相値から時間経過とともに絶対位相
値の比率がだんだん大きくなるようにする。クロスフェ
ードの終了時点でクロスフェード終了通知を和分器40
に送出し、和分器40の位相を絶対位相値に書き換える
とともに、この和分器40からの出力信号を瞬間位相値
として出力するよう切換えを行う。
FIG. 8 shows an example of the configuration of a cosine oscillator when performing this cross-fade. In this configuration example, a cross-fade calculator 43 is newly provided, and the phase reset signal, the absolute phase, and the output of the adder 40 (instantaneous phase value)
Is input and a crossfade end notification is sent to the adder 40. The cross-fade calculator 43 normally outputs the data from the adder 40 as it is, and starts the cross-fade when the phase reset signal arrives. After the phase reset, the output signal of the crossfade calculator 43 is
The ratio of the absolute phase value is gradually increased with the passage of time from the instantaneous phase value of the adder 40. At the end of the crossfade, the crossfade end notification is sent to the adder 40.
And rewrites the phase of the adder 40 to an absolute phase value, and switches so that the output signal from the adder 40 is output as an instantaneous phase value.

【0054】また、上述の実施例では、位相リセット信
号をプリエコー区間の開始位置で発生することでプリエ
コーの除去を可能ならしめるものであった。しかし、こ
の位相リセット信号は、例えば、再生するオーディオ信
号波形を原音を忠実に再現するものにするような場合
(すなわち時間圧縮/伸長を行わない場合)には、波形
再生の開始時点や再生途中の任意の時点にて発生するよ
うにしてもよい。このようにすると、その位相リセット
時点で、復元するオーディオ信号波形の各バンドの成分
信号の各位相が原音のそれと一致されるので、再生波形
が原音に一層忠実なものになる。
In the above-described embodiment, the pre-echo can be removed by generating the phase reset signal at the start position of the pre-echo section. However, for example, when the audio signal waveform to be reproduced faithfully reproduces the original sound (that is, when time compression / expansion is not performed), the phase reset signal is used when the waveform reproduction starts or during reproduction. May occur at any time. By doing so, at the time of the phase reset, each phase of the component signal of each band of the audio signal waveform to be restored matches that of the original sound, so that the reproduced waveform becomes more faithful to the original sound.

【0055】また、上述の実施例では、柔軟度「0」の
区間をプリエコーの区間に設定することで、プリエコー
の除去を可能ならしめていたが、この柔軟度「0」の区
間を例えばアタック区間に設定することもできる。この
ようにアタック区間を柔軟度「0」とすると、オーディ
オ信号波形の時間圧縮/伸長を行った場合にも、アタッ
ク部分は原音どうりの波形(すなわち時間圧縮/伸長さ
れていない波形)で再生されることになる。一般に、ア
タック部分はその楽音の特徴を最もよく表現するので、
このアタック部分を時間圧縮/伸長してしまうと、原音
と異なった音色のように聞こえてしまうが、上記のよう
にアタック部分を柔軟度「0」に設定することで、波形
全体を時間圧縮/伸長する場合にも、アタック部分によ
り表現されるその楽音の特徴をよく保存することができ
る。
Further, in the above-described embodiment, the pre-echo can be removed by setting the section having the degree of flexibility “0” as the section of the pre-echo. Can also be set to If the flexibility of the attack section is set to "0" in this manner, even when the audio signal waveform is time-compressed / expanded, the attack portion is reproduced with a waveform similar to the original sound (that is, a waveform that has not been time-compressed / expanded). Will be done. In general, the attack part best describes the characteristics of the musical sound,
If this attack portion is time-compressed / expanded, it sounds like a tone different from the original sound. However, by setting the attack portion to the degree of flexibility “0” as described above, the entire waveform is time-compressed / expanded. Even when decompressing, the characteristics of the musical tone expressed by the attack portion can be well preserved.

【0056】[0056]

【発明の効果】以上に説明したように、本発明によれ
ば、プリエコーが発生する時点で位相リセット信号が発
生し、その時点での位相が原音と同じものにセットされ
るので、プリエコーに起因して生じる雑音の発生を防止
し、それによりアタック音の歯切れをよいものにしてア
タック感が損なわれることを防止できる。
As described above, according to the present invention, a phase reset signal is generated at the time when a pre-echo occurs, and the phase at that time is set to the same as the original sound. This makes it possible to prevent the occurrence of noise, thereby improving the crispness of the attack sound and preventing the attack feeling from being impaired.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明にかかる一実施例としてのオーディオ信
号波形処理装置を示す図である。
FIG. 1 is a diagram showing an audio signal waveform processing device as one embodiment according to the present invention.

【図2】実施例装置におけるオーディオ信号波形から位
相値、振幅値を抽出する分析部の概念を説明する図であ
る。
FIG. 2 is a diagram for explaining the concept of an analysis unit for extracting a phase value and an amplitude value from an audio signal waveform in the apparatus according to the embodiment.

【図3】実施例装置におけるバンド成分再生部の構成例
を示す図である。
FIG. 3 is a diagram illustrating a configuration example of a band component reproducing unit in the apparatus according to the embodiment.

【図4】実施例装置のバンド成分再生部における位相リ
セット信号発生部による位相リセット信号送出の処理手
順を示すフローチャートである。
FIG. 4 is a flowchart illustrating a processing procedure of transmitting a phase reset signal by a phase reset signal generating unit in the band component reproducing unit of the embodiment device.

【図5】実施例装置のバンド成分再生部における余弦発
振器の構成例を示す図である。
FIG. 5 is a diagram illustrating a configuration example of a cosine oscillator in a band component reproducing unit of the embodiment device.

【図6】実施例装置における柔軟度の概念を説明するた
めの図である。
FIG. 6 is a diagram for explaining the concept of flexibility in the embodiment device.

【図7】実施例装置におけるピッチ変換を伴う場合の波
形形状を説明する図である。
FIG. 7 is a diagram illustrating a waveform shape when pitch conversion is involved in the embodiment device.

【図8】実施例装置におけるバンド成分再生部における
余弦発振器の他の構成例を示す図である。
FIG. 8 is a diagram illustrating another configuration example of the cosine oscillator in the band component reproducing unit in the device of the embodiment.

【図9】帯域分割されたオーディオ信号波形におけるア
タック波形とプリエコーとの関係を説明するための図で
ある。
FIG. 9 is a diagram for explaining a relationship between an attack waveform and a pre-echo in a band-divided audio signal waveform.

【図10】位相ボコーダ方式による従来のオーディオ信
号波形処理装置の全体構成概念を説明するための図であ
る。
FIG. 10 is a diagram for explaining the general configuration concept of a conventional audio signal waveform processing device using a phase vocoder method.

【図11】原音のオーディオ信号波形の成分と帯域分割
した各バンドとの関係を説明する図である。
FIG. 11 is a diagram illustrating the relationship between components of an audio signal waveform of an original sound and each band obtained by band division.

【図12】原音のオーディオ信号波形についての波形デ
ータを説明する図である。
FIG. 12 is a diagram illustrating waveform data of an audio signal waveform of an original sound.

【図13】実施例装置におけるオーディオ信号波形を分
析して振幅値と位相値を抽出する概念を説明するための
図である。
FIG. 13 is a diagram for explaining a concept of extracting an amplitude value and a phase value by analyzing an audio signal waveform in the apparatus according to the embodiment.

【図14】従来のオーディオ信号波形処理装置における
時間周波数変換処理部の構成例を示す図である。
FIG. 14 is a diagram illustrating a configuration example of a time-frequency conversion processing unit in a conventional audio signal waveform processing device.

【図15】従来のオーディオ信号波形処理装置の時間周
波数変換処理部における信号波形の処理例を示す図であ
る。
FIG. 15 is a diagram illustrating a processing example of a signal waveform in a time-frequency conversion processing unit of a conventional audio signal waveform processing device.

【符号の説明】[Explanation of symbols]

1 波形合成部 2 CPU(中央処理装置) 3 ROM〔リード・オンリー・メモリ〕 4 RAM(ランダム・アクセス・メモリ) 5 操作子群 6 鍵盤装置 61 速度調整用のレバー 10 波形メモリ 11 バンド成分再生部 30 微分部 31 時間周波数変換処理部 32 余弦発振器 33 乗算器 34 位相リセット信号発生部 40 和分器 41 余弦演算部 42 加算器 43 クロスフェード演算器 Reference Signs List 1 waveform synthesizer 2 CPU (central processing unit) 3 ROM (read only memory) 4 RAM (random access memory) 5 operator group 6 keyboard device 61 lever for speed adjustment 10 waveform memory 11 band component reproducing unit REFERENCE SIGNS LIST 30 differentiator 31 time-frequency conversion processor 32 cosine oscillator 33 multiplier 34 phase reset signal generator 40 sum divider 41 cosine calculator 42 adder 43 cross-fade calculator

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】オーディオ信号を複数バンドに帯域分割し
た各バンド成分の振幅と位相を波形データとして持ち、
この波形データに基づいて各バンドのバンド成分を必要
に応じ時間圧縮/伸長しつつ再生して合成することでオ
ーディオ信号波形を復元するオーディオ信号波形処理装
置であって、 帯域分割によりオーディオ信号波形中に発生するプリエ
コーの区間に対して、該プリエコー区間の始めにて、再
生する各バンド成分の位相を、上記波形データで示され
るそれぞれに対応する元のバンド成分の位相となるよう
に位相リセットをするように構成したオーディオ信号波
形処理装置。
An audio signal is divided into a plurality of bands and has amplitude and phase of each band component as waveform data.
An audio signal waveform processing apparatus for restoring an audio signal waveform by reproducing and synthesizing band components of each band while performing time compression / expansion as necessary based on the waveform data. At the beginning of the pre-echo section, the phase of each band component to be reproduced is reset so as to be the phase of the original band component corresponding to each of the sections indicated by the waveform data. Audio signal waveform processing device configured to perform
【請求項2】該プリエコーの区間にては、復元する波形
の時間圧縮/伸長を行わないようにした請求項1記載の
オーディオ信号波形処理装置。
2. The audio signal waveform processing apparatus according to claim 1, wherein in the section of said pre-echo, time compression / expansion of a restored waveform is not performed.
【請求項3】上記の位相リセットは、それまで再生して
いた波形の位相と上記波形データに基づく置き換えるべ
き位相の値とをクロスフェードにより置き換えるように
した請求項1または2記載のオーディオ信号波形処理装
置。
3. The audio signal waveform according to claim 1, wherein in the phase reset, the phase of the waveform reproduced so far and the value of the phase to be replaced based on the waveform data are replaced by crossfading. Processing equipment.
【請求項4】波形再生にピッチ変換が伴う場合には、ピ
ッチ変換に基づく位相変化の度合いと、波形データを読
み出すための読出しアドレスの歩進度合いとを合わせる
ようにした請求項1〜3のいずれかに記載のオーディオ
信号波形処理装置。
4. The method according to claim 1, wherein, when the waveform conversion is accompanied by pitch conversion, the degree of phase change based on the pitch conversion and the degree of increment of a read address for reading waveform data are matched. An audio signal waveform processing device according to any one of the above.
JP30061499A 1999-10-22 1999-10-22 Audio signal waveform processing device Expired - Fee Related JP4344438B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP30061499A JP4344438B2 (en) 1999-10-22 1999-10-22 Audio signal waveform processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30061499A JP4344438B2 (en) 1999-10-22 1999-10-22 Audio signal waveform processing device

Publications (2)

Publication Number Publication Date
JP2001117595A true JP2001117595A (en) 2001-04-27
JP4344438B2 JP4344438B2 (en) 2009-10-14

Family

ID=17886987

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30061499A Expired - Fee Related JP4344438B2 (en) 1999-10-22 1999-10-22 Audio signal waveform processing device

Country Status (1)

Country Link
JP (1) JP4344438B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004527000A (en) * 2001-04-13 2004-09-02 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション High quality time scaling and pitch scaling of audio signals
WO2006070768A1 (en) 2004-12-27 2006-07-06 P Softhouse Co., Ltd. Audio waveform processing device, method, and program
JP2014041241A (en) * 2012-08-22 2014-03-06 Pioneer Electronic Corp Time scaling method, pitch shift method, audio data processing device and program
US11546694B2 (en) 2020-06-18 2023-01-03 Faurecia Clarion Electronics Co., Ltd. Signal processing device for filter coefficient generation, signal processing method, and non-transitory computer-readable recording medium therefor

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004527000A (en) * 2001-04-13 2004-09-02 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション High quality time scaling and pitch scaling of audio signals
WO2006070768A1 (en) 2004-12-27 2006-07-06 P Softhouse Co., Ltd. Audio waveform processing device, method, and program
US8296143B2 (en) 2004-12-27 2012-10-23 P Softhouse Co., Ltd. Audio signal processing apparatus, audio signal processing method, and program for having the method executed by computer
KR101286168B1 (en) * 2004-12-27 2013-07-15 가부시키가이샤 피 소프트하우스 Audio signal processing device, method and recording medium storing the method
JP2014041241A (en) * 2012-08-22 2014-03-06 Pioneer Electronic Corp Time scaling method, pitch shift method, audio data processing device and program
US11546694B2 (en) 2020-06-18 2023-01-03 Faurecia Clarion Electronics Co., Ltd. Signal processing device for filter coefficient generation, signal processing method, and non-transitory computer-readable recording medium therefor

Also Published As

Publication number Publication date
JP4344438B2 (en) 2009-10-14

Similar Documents

Publication Publication Date Title
US6721711B1 (en) Audio waveform reproduction apparatus
JP4031813B2 (en) Audio signal processing apparatus, audio signal processing method, and program for causing computer to execute the method
US5412152A (en) Device for forming tone source data using analyzed parameters
US20030182106A1 (en) Method and device for changing the temporal length and/or the tone pitch of a discrete audio signal
JP2001084000A (en) Waveform reproducing device
JP4344438B2 (en) Audio signal waveform processing device
US6323797B1 (en) Waveform reproduction apparatus
JP2001255876A (en) Method for expanding and compressing musical sound waveform signal in time base direction
JP3037861B2 (en) Waveform forming device and electronic musical instrument using the output waveform
JP4868042B2 (en) Data conversion apparatus and data conversion program
JP4294179B2 (en) Waveform playback device
JPH10133665A (en) Musical sound waveform preproducing device
JP2621466B2 (en) Sampling device
JP3752855B2 (en) Waveform data creation method
JP3428230B2 (en) Method and apparatus for forming repetitive waveform of electronic musical instrument
JP3016470B2 (en) Sound source device
JP3669040B2 (en) Waveform processing device
JPH11352970A (en) Waveform compressing and expanding device
JP4087964B2 (en) Waveform playback device
JP3525482B2 (en) Sound source device
JP2990897B2 (en) Sound source device
JP2833485B2 (en) Tone generator
JP2000181452A (en) Waveform reproduction apparatus
JP4267114B2 (en) Waveform processing device
JP2968456B2 (en) Method and apparatus for forming musical sound wave

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060501

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060911

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090602

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090707

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090713

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120717

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130717

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees