JP2003233395A - Method and device for encoding audio signal and encoding and decoding system - Google Patents

Method and device for encoding audio signal and encoding and decoding system

Info

Publication number
JP2003233395A
JP2003233395A JP2002031118A JP2002031118A JP2003233395A JP 2003233395 A JP2003233395 A JP 2003233395A JP 2002031118 A JP2002031118 A JP 2002031118A JP 2002031118 A JP2002031118 A JP 2002031118A JP 2003233395 A JP2003233395 A JP 2003233395A
Authority
JP
Japan
Prior art keywords
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002031118A
Other languages
Japanese (ja)
Inventor
Sen Chon Kok
Hon Neo Sua
セン・チョン コク
ホン・ネオ スア
Original Assignee
Matsushita Electric Ind Co Ltd
松下電器産業株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Ind Co Ltd, 松下電器産業株式会社 filed Critical Matsushita Electric Ind Co Ltd
Priority to JP2002031118A priority Critical patent/JP2003233395A/en
Publication of JP2003233395A publication Critical patent/JP2003233395A/en
Application status is Pending legal-status Critical

Links

Abstract

<P>PROBLEM TO BE SOLVED: To reduce a preecho, a postecho, and an artifact in gain control over audio encoding and to adapt the gain control even to a signal of a spoken voice. <P>SOLUTION: A correction function calculation part 14b discriminates between the start position of an attack signal being a signal part including an abrupt rise of the sound of an inputted audio signal and the end position of a release signal being a signal part including an abrupt fall of the sound, calculates a target peak value desirable when the current frame to be processed is brought under gain control, and calculates a correction function for the current frame to perform the gain control. The correction function calculation part 14b detects a signal part which naturally falls with a gentle gradient characteristic of a spoken voice and a signal part which naturally rises with a gentle gradient, and reduces amplification or attenuation regarding the gain control applied to the respective detected signal parts. <P>COPYRIGHT: (C)2003,JPO

Description

【発明の詳細な説明】 【0001】 【発明の属する技術分野】本発明は、例えばATRAC BACKGROUND OF THE INVENTION [0001] [Technical Field of the Invention The present invention is, for example, ATRAC
3のような利得制御方法を採用する符号化方法に適用される、オーディオ信号の符号化方法及び装置、並びに符号化及び復号化システムに関し、特に、急激な立上がり信号であるアタック信号の前に発生するプリエコー雑音と、急激な立下がり信号であるリリース信号の後に発生するポストエコー雑音とを抑圧するためのオーディオ信号の符号化方法及び装置、並びに符号化及び復号化システムに関する。 Applied to the gain control method coding method to adopt the 3, encoding method and apparatus of an audio signal, and relates to encoding and decoding system, in particular, it occurs before the attack signal a sudden rise signal and echo noise, encoding method and apparatus for audio signal for suppressing the post-echo noise that occurs after the release signal is a sudden fall signal, and to encoding and decoding system. 【0002】 【従来の技術】プリエコー雑音及びポストエコー雑音に関する古典的な問題は、オーディオ信号の変換符号化において公知である(例えば、特開2000−25919 [0002] classic problem with pre-echo noise and post-echo noise is known in transform coding of audio signals (e.g., JP 2000-25919
7号公報参照。 7 JP reference. )。 ). 図19(a)は利得制御をせず、プリエコーやポストエコーが発生するときの従来技術のオーディオ信号の符号化及び復号化装置の構成を示すブロック図であり、図19(b)は利得制御を行い、プリエコーやポストエコーを抑圧するときの従来技術のオーディオ信号の符号化及び復号化装置の構成を示すブロック図である。 FIG. 19 (a) without gain control, a block diagram of an encoding and decoding apparatus of the prior art audio signal when the pre-echo and post-echo occurs, FIG. 19 (b) gain control was carried out, a block diagram of an encoding and decoding apparatus of the prior art audio signal when suppressing pre-echo or post-echo. 【0003】図19(a)に図示された、変形離散コサイン変換(以下、MDCTという。)処理部101及び量子化器102を備えた符号化器と、逆量子化器103 [0003] illustrated in FIG. 19 (a), the modified discrete cosine transform (hereinafter. Referred MDCT) and encoder with processing unit 101 and the quantizer 102, the inverse quantizer 103
及び逆MDCT処理部104を備えた復号化器とを参照すると、アタック信号(すなわち、急激な音の立上がりを含む信号)を含む典型的な変換ブロックが符号化器に入力されるとき、量子化器102は雑音を導入し、次いで、復号化器は復元されたブロックにおいて上記雑音を時間領域について均等に分布させる。 And Referring to the decoder having an inverse MDCT processing section 104, when a typical conversion block including an attack signal (i.e., signal including a rise of rapid sound) is input to the encoder, quantized vessel 102 introduces noise, then the decoder evenly distributed about the noise time in restored block area. すなわち、復元された変換ブロック内にプリエコー雑音とポストエコー雑音が発生する現象は、内部にアタック信号を含む変換ブロック上に、アタック信号を量子化することによって発生する量子化雑音を均等に分布させることによって引き起こされる。 That is, a phenomenon that pre-echo noise and post-echo noise reconstructed transform block is generated, on the conversion block including an attack signal therein, evenly distributed quantization noise generated by quantizing the attack signal It is caused by. アタック信号は、信号の強度の急激な増大の前に、小さい振幅の期間が存在し、それらすべてが変換ブロック内に存在するということによって特徴づけられる。 Attack signal, prior to a rapid increase in the strength of the signal, there is a period of low amplitude, all of which are characterized by the fact that present in the transform block. また一般に、信号は急激なサージに続いて短時間でテーパ状に振幅が小さくなるが、信号のこの急激な音の立下がりを含む部分はリリース信号と呼ばれ、リリース信号もまた、アタック信号と同様に、プリエコー雑音とポストエコー雑音を発生させる。 Also in general, the signal is the amplitude becomes smaller in a tapered shape in a short period of time following a sudden surge, the portion including the falling of sudden sound signal is called the release signal, the release signal is also a attack signal Similarly, to generate a pre-echo noise and post-echo noise. 【0004】プリエコーは、次の2つの理由によって、 [0004] pre-echo is, by the following two reasons,
聴覚的に、ポストエコーよりも耳障りである。 Aurally, it is annoying than the post-echo. 第1に、 In the first,
プリエコーは、大きな強度のアタック信号の部分の下に隠れてしまいがちなポストエコーとは異なり、その大きさが、重畳する小さな振幅の信号をはるかに超過している。 Pre-echo, unlike will tend to post-echo hidden under the part of the attack signal of greater strength, its size is, far exceeds the small amplitude of the signal to be superimposed. 第2に、人間の耳では、マスキングされる音がアタック信号の部分の時間的後方に存在する順方向マスキング継続時間と比較して、マスキングされる音がアタック信号の部分の時間的前方に存在する逆方向マスキング継続時間が、はるかに短いという特徴を有する。 Second, the human ear, as compared to the forward masking duration sound to be masked is present in a temporally succeeding part of the attack signal, there sound to be masked is temporally forward section of the attack signal reverse masking duration that has a characteristic that much shorter. 具体的には、順方向マスキング継続時間は約200msecであり、逆方向マスキング継続時間は約5msecである。 Specifically, the forward masking duration is about 200 msec, backward masking duration is about 5 msec. 【0005】この問題を扱うために、以下のような3つの公知の方法が存在する。 [0005] To deal with this problem, there are three known methods as follows. (a)ブロックサイズ切り換え法(b)時間方向の雑音波形整形法(c)利得制御法【0006】ブロックサイズ切り換え法は、通常の変換ブロックをより短い部分ブロックに分割し、各部分ブロックに対してより短い変換を適用する。 (A) the block size switching method (b) the time direction of a noise waveform shaping method (c) gain control method [0006] block size switching method divides the normal conversion blocks into shorter partial block, for each partial block to apply a shorter conversion Te. このことは、プリエコー雑音の拡散を、短い部分ブロック内に包含させることを援助する。 This would aid in the diffusion of the pre-echo noise, which is incorporated short section block. 時間方向の雑音波形整形法は、アタック信号が時間領域におけるその非均一性によって特徴付けられているので、スペクトルデータに予測符号化を適用することによって、時間−周波数の双対性を利用する。 Time direction noise waveform shaping method, since the attack signal is characterized by its non-uniformity in the time domain by applying predictive coding to the spectrum data, the time - using the duality of the frequency. 最後に、利得制御法は、修正関数(MF)を用いて、小さい振幅の部分の信号強度を増幅することによって、及び/又は大きい振幅の部分の信号強度を抑制することによって、時間領域における信号を修正する(利得制御する)。 Finally, the gain control method using a correction function (MF), small by amplifying the signal strength of the amplitude of the portion, and by suppressing the signal strength of the / or large amplitude portion, the signal in the time domain modifying the (gain control). 【0007】従来技術に係る利得制御法の1つの例が図19(b)に図示されている。 [0007] One example of the gain control method according to the prior art is shown in FIG. 19 (b). ここでは、図19(a) Here, FIG. 19 (a)
の符号化器及び復号化器に対して、さらに利得制御部1 Against the encoder and decoder, further gain control unit 1
05と逆利得制御部106が設けられている。 05 and inverse gain control unit 106 is provided. 図19 Figure 19
(a)と同様のアタック信号を含む変換ブロックが入力されたとき、利得制御部105は弱い信号を増幅し、及び/又は強い信号を抑圧する。 When the transform block is input include similar attack signal and (a), the gain control unit 105 amplifies the weak signal, and suppresses / or strong signals. この増幅及び/又は抑圧の情報は、符号化された信号とともに復号化器に送られ、上記情報に基づいて、逆利得制御部106は、利得制御部105において増幅された部分を抑圧し、及び/ Information of the amplifier and / or suppression, along with encoded signals sent to the decoder, based on the information, the inverse gain control unit 106 suppresses the amplified portion in the gain control unit 105, and /
又は抑圧された部分を増幅する。 Or amplifying the suppressed portion. 量子化器102は雑音を導入し、復元されたブロックにおいて上記雑音を時間領域について均等に分布させるが、逆利得制御部106 Quantizer 102 introduces noise, but evenly distributed about the reconstructed time domain the noise at block was, inverse gain control unit 106
の後段において、雑音は、図19(a)の利得制御なしの例と比較すると、信号が予め小さな振幅だった領域において抑圧されていることがわかる。 In the subsequent, noise, when compared with Example without gain control in FIG. 19 (a), it can be seen that the signal is suppressed in the area was previously a small amplitude. 【0008】 【発明が解決しようとする課題】プリエコー及びポストエコーの問題に取り組むための適正な方法では、新しい要因を考慮する必要がある。 [0008] In the [0007] pre-echo and the proper way to address the problem of the post-echo, it is necessary to take into account the new factors. アタック信号に先行する小さい振幅の信号が、早すぎず、かつ遅すぎないように増幅されるように、信号中のアタック信号の立上がりの開始位置(オンセット)を捕捉することが重要である。 Small amplitude signal preceding the attack signal is not too early, and as will be amplified so as not too late, it is important to capture the rising of the start position of the attack signal in the signal (onset). 信号をあまり早く増幅すると、プリエコー及びポストエコーは効果的に除去されない。 When the amplified too early signal, pre-echo and post-echo is not effectively removed. 信号をあまり遅く増幅すると、アタック信号自体を増幅させる危険もあり、従って、プリエコー問題をさらに悪化させる結果となる。 When signal amplification too late, there is also danger of amplifying the attack signal itself, therefore, results in further exacerbate the pre-echo problems. アタック信号がプリエコー雑音の発生に関与するのと同様に、リリース信号もまたプリエコー及びポストエコー雑音の発生に関与するので、そのようなリリース信号の影響もまた抑圧しなければならない。 Just as the attack signal is involved in the development of pre-echo noise, since the release signal is also involved in the development of pre-echo and post-echo noise, it must also be suppressed influence of such a release signal. 【0009】同様に、信号エネルギーの増大(サージ) [0009] Similarly, an increase in the signal energy (surge)
が後に続くスペクトル量子化の処理に過度の負担をかけないように、小さい振幅の信号を増幅した結果としての信号強度の増大は、大きい振幅の信号を適当な程度に減衰することによってバランスをとる必要がある。 As but not put undue strain on the subsequent spectral quantization processing after an increase in signal intensity as a result of amplifying the small amplitude signal, balanced by attenuated to a degree appropriate to a large amplitude of the signal There is a need. 減衰された信号の、復号化器で回復される際の正確さを減少させないように、減衰は過度であってはならない。 The attenuated signal, so as not to reduce the accuracy of the time to be recovered by the decoder, the damping should not be excessive. 最悪の場合、過度の減衰は、われわれが除去しようとするポストエコーよりも耳障りな、付加的な人工物(アーティファクト)を導入することがある。 In the worst case, excessive attenuation, it is jarring than post-echo to be removed, it is possible to introduce additional artifacts (artifacts). ゆえに、減衰が適用されるべき範囲を設定するための方法も同様に重要である。 Thus, a method for setting a range to attenuation is applied is equally important. 【0010】最後に、適正な利得制御方法は、アタック信号とリリース信号を豊富に含むことによって特徴付けられる、発話音声のような信号に適応するものである必要がある。 [0010] Finally, the appropriate gain control method is characterized by including an attack signal and release signal rich is required is to adapt the signals such as speech. これは、このような信号が、過度の増幅及び過度の減衰によって導入されるアーティファクトに対して非常に影響を受けやすいからである。 This is such a signal, because extremely sensitive with respect to artifacts introduced by the excessive amplification and excessive attenuation. これらのアタック及びリリースは、遷移がさほど急激でない(すなわち、より自然である)傾向があり、ゆえに、当該利得制御方法は、信号強度におけるこれらの自然な遷移を検出するとき、あまり急激でない利得制御に復帰する必要がある。 These attack and release, the transition is not very rapid (i.e., a more natural) tend, therefore, the gain control method, when detecting natural transition of the signal strength, less abrupt gain control there is a need to return to. 【0011】次に、上述の要因をすべて考慮に入れて、 [0011] Then, taking into account all of the factors described above,
利得制御を達成するために、修正関数を生成して、生成した修正関数を上記フレームに対して乗算することができる。 To achieve gain control, to generate a correction function, the generated correction function can be multiplied by the frame. この修正関数は、先行するサブバンドフレーム及び現在のサブバンドフレームのサンプル信号をオーバーフローさせるものであってはならない。 This correction function is must not overflowing the subband frame and sample signals of the current subband frame preceding. 【0012】本発明の目的は、以上の問題点を解決し、 [0012] It is an object of the present invention is to solve the above problems,
修正関数をより正確に生成して利得制御を実行することにより、プリエコー雑音及びポストエコー雑音を確実に抑圧することができるオーディオ信号の符号化方法及び装置、並びに符号化及び復号化システムを提供することにある。 By executing the gain control more accurately generate a modified function, encoding method and apparatus of an audio signal can be reliably suppressed pre-echo noise and post-echo noise, as well as encoding and decoding system It lies in the fact. 【0013】 【課題を解決するための手段】本発明の第1の態様に係るオーディオ信号の符号化方法は、入力されたオーディオ信号に基づいてフレーム毎に修正関数を計算して、計算された修正関数に従って上記オーディオ信号に対して利得制御するステップと、上記利得制御されたオーディオ信号に対して、縦続接続された互いに隣接する2つのフレーム毎に直交変換処理を行いかつ符号化処理を行うことにより符号化されたビットストリーム信号を得るステップとを含むオーディオ信号の符号化方法において、 [0013] Means for Solving the Problems] encoding method of the audio signal according to the first aspect of the present invention is to calculate a correction function for each frame based on the input audio signal, is calculated It is carried out the steps of the gain control on the audio signal according to the correction function, with respect to the gain-controlled audio signal, the orthogonal transform processing was carried out and the coding processing for each two frames adjacent to each other in cascade in the coding method of the audio signal and obtaining a bit stream signal encoded by,
上記利得制御するステップは、入力されたオーディオ信号をフレームの時間よりも短い時間の複数の区分に分割し、上記分割された各区分のピークの絶対値を計算するステップと、上記分割された区分を有するオーディオ信号に基づいて、急激な音の立上がりを含む信号の部分であるアタック信号の開始位置を含む区分を修正ポイントとして識別するステップと、上記分割された区分を有するオーディオ信号に基づいて、急激な音の立下がりを含む信号の部分であるリリース信号の終了位置を含む区分を修正ポイントとして識別するステップと、上記分割された区分を有するオーディオ信号に基づいて、上記修正関数に従って利得制御したときに所望される、処理すべき現在のフレームにおける目標ピーク値を計算するステップと、上記識別 Classification step of the gain control divides the input audio signal into a plurality of sections of time shorter than the time frame, calculating the absolute value of the peak of each segment which is the divided, which is the divided based on the audio signal having the identifying a segment containing the start position of the attack signal as a correction point is a portion of the signal containing the rise sudden sound based on the audio signal having the divided segment, identifying a fraction containing the end position of the release signal is a portion of the signal containing the fall of sudden sound as a correction point based on the audio signal having the divided segment, and gain control in accordance with the correction function calculating a target peak value in the desired current frame to be processed when, the identification れたアタック信号の開始位置を含む区分と、上記識別されたリリース信号の終了位置を含む区分と、上記計算された目標ピーク値とに基づいて、当該現在のフレームの各区分に係る修正関数値からなる修正関数を計算するステップとを含むことを特徴とする。 Section and including the start position of the attack signal, a fraction containing the end position of the identified release signal, based on the target peak value, which is calculated above, the correction function value according to each segment of the current frame characterized in that it comprises the step of calculating a correction function consisting of. 【0014】上記オーディオ信号の符号化方法において、上記アタック信号の開始位置を含む区分を識別するステップは、処理すべき現在の区分に続く次の区分のピークの絶対値と、当該現在の区分以前の予め決められた数の区分に係る各ピークの絶対値との比に基づいて、当該現在の区分がアタック信号の開始位置を含むか否かを決定するステップと、当該現在の区分が上記アタック信号の開始位置を含むと決定されたときは、アタック信号の開始位置を含むことを示す所定の第1の値を当該現在の区分に割り当てるステップとを含むことを特徴とする。 [0014] In the encoding method of the audio signal, identifying a fraction containing the start position of the attack signal, the absolute value of the peak of the subsequent next segment in the current segment to be processed, the current classification previously predetermined based on the ratio between the absolute values ​​of the peak relating to the classification of several, the steps of the current segment is to determine whether including the start position of the attack signal, the current segment is the attack when it is determined that includes a start position of the signal is characterized in that the predetermined first value indicating that it contains the start position of the attack signal and a step of assigning to the current segment. 【0015】また、上記オーディオ信号の符号化方法において、上記リリース信号の終了位置を含む区分を識別するステップは、処理すべき現在の区分と、当該現在の区分に先行する修正ポイントとの間における最大のピークの絶対値と、当該現在の区分以後の予め決められた数の区分に係る各ピークの絶対値との比に基づいて、当該現在の区分がリリース信号の終了位置を含むか否かを決定するステップと、当該現在の区分が上記リリース信号の終了位置を含むと決定されたときは、リリース信号の終了位置を含むことを示す所定の第2の値を当該現在の区分に割り当てるステップとを含むことを特徴とする。 Further, in the encoding method of the audio signal, identifying a fraction containing the end position of the release signal, current and classification to be processed, between the corrected points preceding the current segment the absolute value of the maximum peak, based on the ratio of the absolute value of each peak according to the current segment a predetermined number of sections of subsequent, whether the current segment includes an end position of the release signal determining, step the current indicator when it is determined that includes the end position of the release signal, allocating a predetermined second value indicating that it contains an end position of the release signal to the current segment characterized in that it comprises and. 【0016】さらに、上記オーディオ信号の符号化方法において、上記目標ピーク値を計算するステップは、互いに隣接する各1対の修正ポイント間の最大のピークの絶対値と、上記割り当てられた第1の値及び第2の値と、処理すべき現在のフレームに続く次のフレームの最初の区分に係るピークの絶対値とに基づいて、当該処理すべき現在のフレームのオーディオ信号を上記修正関数に従って利得制御したときに所望される目標ピーク値を計算することを特徴とする。 Furthermore, in the encoding method of the audio signal, calculating the target peak value, the absolute value of the largest peak between the pair of modified points adjacent to each other, the first assigned the a value and a second value, based on the absolute value of the peak of the first segment of the next frame following the current frame to be processed, the gain of the audio signal of the current frame to be the process in accordance with the correction function and calculating a desired target peak value when the control. 【0017】またさらに、上記オーディオ信号の符号化方法において、上記修正関数を計算するステップは、上記アタック信号の開始位置を含む区分と、当該アタック信号の開始位置を含む区分に先行する修正ポイントとの間の各区分に係る修正関数値を、当該アタック信号の開始位置を含む区分と、上記先行する修正ポイントとの間における最大のピークの絶対値が、上記目標ピーク値に等しくなるように計算し、上記リリース信号の開始位置を含む区分と、当該リリース信号の開始位置を含む区分に先行する修正ポイントとの間の各区分に係る修正関数値を、当該リリース信号の開始位置を含む区分と、上記先行する修正ポイントとの間における最大のピークの絶対値が、上記目標ピーク値に等しくなるように計算することを特徴とする [0017] Further, in the encoding method of the audio signal, calculating the modification function, section and including the start position of the attack signal, a corrected point preceding the segment containing the start position of the attack signal calculating a correction function value according to the division between the, as section and including the start position of the attack signal, the absolute value of the largest peak between the corrected points above prior becomes equal to the target peak value and, section and including the start position of the release signal, the correction function value according to the division between the modified point preceding the segment containing the start position of the release signal, the segment including the start position of the release signal , the absolute value of the largest peak between the corrected points above preceding, and calculates to be equal to the target peak value 【0018】また、上記オーディオ信号の符号化方法において、上記利得制御するステップは、上記分割された区分を有するオーディオ信号に基づいて、発話音声に含まれる所定のゆるやかな勾配で自然に降下する第1の信号部分を検出するステップと、上記分割された区分を有するオーディオ信号に基づいて、発話音声に含まれる所定のゆるやかな勾配で自然に上昇する第2の信号部分を検出するステップとの少なくとも一方を含み、上記利得制御するステップは、処理すべき現在のフレームにおいて、上記識別されたアタック信号の開始位置を含む区分と、上記識別されたリリース信号の終了位置を含む区分とに基づいて、上記検出された第1の信号部分の修正関数による利得制御を中止する一方、上記識別されたアタック信号に基づい Further, in the encoding method of the audio signal, said step of gain control, the based on the audio signal having the divided segment, falls naturally in a predetermined gradual gradient included in speech sound detecting a first signal part, based on the audio signal having the divided segment, at least the step of detecting a second signal portion naturally rises at a predetermined gradual gradient included in speech sound wherein one step of the gain control in the current frame to be processed, based on the classification and containing section and including the start position of the identified attack signal, the end position of the identified release signal, while cancel the gain control by the correction function of the detected first signal portion, based on the identified attack signal 計算される修正関数を減少させて上記第2の信号部分の修正関数を計算することにより、当該現在のフレームにおける修正関数を計算することを特徴とする。 Reduce the correction function is calculated by calculating the correction function of the second signal portion, and calculates a correction function in the current frame. 【0019】さらに、上記オーディオ信号の符号化方法において、上記第1の信号部分を検出するステップは、 Furthermore, in the encoding method of the audio signal, the step of detecting the first signal portion,
上記現在のフレームに先行するフレームにおいて修正ポイントである区分の数が所定の第1のしきい値より小さく、かつ現在のフレームにアタック信号が含まれていないときに、上記第1の信号部分が存在すると決定し、上記第2の信号部分を検出するステップは、上記アタック信号の開始位置を含む区分と、当該区分から当該区分に続く次の修正ポイントまでの間における最大のピークの絶対値が存在する区分との間の分離区分数が所定の第2 The number of division is modified points in the frame preceding the above current frame is smaller than a predetermined first threshold value, and when contains no attack signal in the current frame, is the first signal part determined to be present, the second step of detecting a signal portion, section and including the start position of the attack signal, the absolute value of the largest peak in the period from the division to the next modification point subsequent to the indicator second separation partition number is given between the segments present
のしきい値より大きいときに、上記第2の信号部分が存在すると決定することを特徴とする。 When greater than threshold, and determining with the second signal portion is present. 【0020】またさらに、上記オーディオ信号の符号化方法において、上記修正関数を計算するステップは、上記互いに隣接した2つのフレームである第1及び第2のフレームにおいて、上記利得制御後のオーディオ信号のうちの第1のフレームのピークの絶対値と第2のフレームのピークの絶対値とが異なるとき、上記各ピークの絶対値が等しくなるように、上記第2のフレームの最初の区分に係る修正関数値を補正するステップをさらに含むことを特徴とする。 [0020] Further, in the encoding method of the audio signal, calculating the correction function, in the first and second frame which is two frames adjacent above one another, of the audio signal after the gain control when the absolute value of the peak of the first frame of the out and the absolute value of the peak of the second frame are different, so that the absolute value of each peak is equal, modified according to the first segment of the second frame and further comprising the step of correcting the value of the function. 【0021】また、上記オーディオ信号の符号化方法において、上記利得制御するステップは、上記利得制御の処理の後に、上記互いに隣接した2つのフレームである第1及び第2のフレームのオーディオ信号が互いに実質的に連続するように、第1のフレームのオーディオ信号に対して第2のフレームの最初の区分に係る修正関数値を乗算して補正するステップをさらに含み、上記修正関数を計算するステップは、上記第1のフレームの各区分に係る修正関数値のうちの、オーディオ信号を増幅する最小の修正関数値に基づいて、上記オーディオ信号を増幅する修正関数により利得制御されるべき第1のフレームのオーディオ信号を、上記乗算して補正することにより減衰させることを防止するように、上記第2のフレームの最初の区分に Further, in the encoding method of the audio signal, said step of gain control, after the processing of the gain control, the first and the audio signal of the second frame which is two frames adjacent the mutually each other as substantially contiguous, further comprising a step of correcting by multiplying a correction function value according to the first section of the second frame to the audio signal of the first frame, the step of calculating the correction function is , of the correction function value according to each segment of said first frame, based on the minimum of the correction function value for amplifying the audio signal, the first frame to be gain controlled by correction function for amplifying the audio signal the audio signal, so as to prevent the attenuating by correcting by the multiplication, the first section of the second frame る修正関数値を補正するステップをさらに含むことを特徴とする。 And further comprising a step of correcting a correction function value that. 【0022】さらに、上記オーディオ信号の符号化方法において、上記修正関数を計算するステップは、処理すべき現在のフレームにおける最後の修正ポイントの区分より後方に位置する現在のフレームの各区分における最大のピークの絶対値が上記目標ピーク値と異なるときに、上記最大のピークの絶対値が上記目標ピーク値に等しくなるように、上記後方に位置する現在のフレームの各区分に係る修正関数値を補正するステップをさらに含むことを特徴とする。 Furthermore, in the encoding method of the audio signal, calculating the correction function is maximum in each segment of the current frame located behind the section of the last modification points in the current frame to be processed when the absolute value of the peak is different from the target peak value, so that the absolute value of the maximum peak is equal to the target peak value, corrects the correction function value according to each segment of the current frame located above the rear and further comprising the step of. 【0023】また、本発明の第2の態様に係るオーディオ信号の符号化方法は、入力されたオーディオ信号に基づいてフレーム毎に修正関数を計算して、計算された修正関数に従って上記オーディオ信号に対して利得制御するステップと、上記利得制御されたオーディオ信号に対して、縦続接続された互いに隣接する2つのフレーム毎に直交変換処理を行いかつ符号化処理を行うことにより符号化されたビットストリーム信号を得るステップとを含むオーディオ信号の符号化方法において、上記利得制御するステップは、入力されたオーディオ信号をフレームの時間よりも短い時間の複数の区分に分割するステップと、上記分割された区分を有するオーディオ信号に基づいて、急激な音の立上がりを含む信号の部分であるアタック信号の開始 [0023] The encoding method of the audio signal according to the second aspect of the present invention is to calculate a correction function for each frame based on the input audio signal, to the audio signal according to the calculated correction function steps and, with respect to the gain-controlled audio signal, the encoded bit stream by performing orthogonal transform processing performed and the encoding process for each two frames adjacent to each other in cascade to gain control for in the coding method of the audio signal and obtaining a signal, step includes the step of dividing the input audio signal into a plurality of sections of time shorter than the time frame, which is the divided segments to the gain control based on the audio signal with the start of a part of the signal containing the rise of sudden sound attack signal 置を含む区分を修正ポイントとして識別するステップと、上記分割された区分を有するオーディオ信号に基づいて、急激な音の立下がりを含む信号の部分であるリリース信号の終了位置を含む区分を修正ポイントとして識別するステップと、上記分割された区分を有するオーディオ信号に基づいて、発話音声に含まれる所定のゆるやかな勾配で自然に降下する第1の信号部分を検出するステップと、上記分割された区分を有するオーディオ信号に基づいて、発話音声に含まれる所定のゆるやかな勾配で自然に上昇する第2の信号部分を検出するステップとの少なくとも一方を含み、上記利得制御するステップは、処理すべき現在のフレームにおいて、上記識別されたアタック信号の開始位置を含む区分と、上記識別されたリリース信号の終 Identifying a fraction containing location as the correction point based on the audio signal having the divided segment, modifying point fraction containing the end position of a part of the signal containing the fall of sudden sound release signal identifying as based on the audio signal having the divided segment, the steps of detecting a first signal portion falls naturally in a predetermined gradual gradient included in speech sound, which is the divided segment based on the audio signal having a comprises at least one of the steps of detecting a second signal portion naturally rises at a predetermined gradual gradient included in speech, the step of the gain control is currently to be processed in the frame, section and a final of the identified release signal including the start position of the identified attack signal 位置を含む区分とに基づいて、上記検出された第1の信号部分の修正関数による利得制御を中止する一方、上記識別されたアタック信号に基づいて計算される修正関数を減少させて上記第2の信号部分の修正関数を計算することにより、当該現在のフレームにおける修正関数を計算するステップとを含むことを特徴とするオーディオ信号の符号化方法。 Based on the classification and including the position, the one to stop the detected gain control by the correction function of the first signal part, the identified reduced the correction function is calculated based on the attack signal the second by calculating the correction function of the signal portion of the encoding method of the audio signal, characterized in that it comprises the step of calculating a correction function in the current frame. 【0024】上記オーディオ信号の符号化方法において、上記第1の信号部分を検出するステップは、上記現在のフレームに先行するフレームにおいて修正ポイントである区分の数が所定の第1のしきい値より小さく、かつ現在のフレームにアタック信号が含まれていないときに、上記第1の信号部分が存在すると決定し、上記第2 [0024] In the encoding method of the audio signal, from the first step of detecting a signal portion, a first threshold number of the predetermined segment is a modification points in frame preceding to the current frame small and when not contain attack signal in the current frame, determines that the first signal portion is present, the second
の信号部分を検出するステップは、上記アタック信号の開始位置を含む区分と、当該区分から当該区分に続く次の修正ポイントまでの間における最大のピークの絶対値が存在する区分との間の分離区分数が所定の第2のしきい値より大きいときに、上記第2の信号部分が存在すると決定することを特徴とする。 Detecting a signal portion of the separation between the sections absolute value of the largest peak between the partition and including the start position of the attack signal, from the division to the next modification point subsequent to the segment is present when the number of division is larger than a predetermined second threshold value, and determines the said second signal portion is present. 【0025】本発明の第3の態様に係るオーディオ信号の符号化装置は、入力されたオーディオ信号に基づいてフレーム毎に修正関数を計算して、計算された修正関数に従って上記オーディオ信号に対して利得制御する利得制御手段と、上記利得制御されたオーディオ信号に対して、縦続接続された互いに隣接する2つのフレーム毎に直交変換処理を行いかつ符号化処理を行うことにより符号化されたビットストリーム信号を得る手段とを備えたオーディオ信号の符号化装置において、上記利得制御手段は、入力されたオーディオ信号をフレームの時間よりも短い時間の複数の区分に分割し、上記分割された各区分のピークの絶対値を計算する区分のピーク値計算手段と、上記分割された区分を有するオーディオ信号に基づいて、急激な音の The encoding apparatus of an audio signal according to the third aspect of the present invention is to calculate a correction function for each frame based on the input audio signal for the audio signal according to the calculated correction function and gain control means for gain control, with respect to the gain-controlled audio signal, the encoded bit stream by performing orthogonal transform processing performed and the encoding process for each two frames adjacent to each other in cascade in the coding apparatus of the audio signal and means for obtaining a signal, said gain control means divides the input audio signal into a plurality of sections of time shorter than the time frame, for each segment, which is the divided a peak value calculation means segments for calculating the absolute value of the peak based on the audio signal having the divided segment, the sudden sound 上がりを含む信号の部分であるアタック信号の開始位置を含む区分を修正ポイントとして識別する第1の識別手段と、上記分割された区分を有するオーディオ信号に基づいて、急激な音の立下がりを含む信号の部分であるリリース信号の終了位置を含む区分を修正ポイントとして識別する第2の識別手段と、上記分割された区分を有するオーディオ信号に基づいて、上記修正関数に従って利得制御したときに所望される、処理すべき現在のフレームにおける目標ピーク値を計算する目標ピーク値計算手段と、上記識別されたアタック信号の開始位置を含む区分と、上記識別されたリリース信号の終了位置を含む区分と、上記計算された目標ピーク値とに基づいて、当該現在のフレームの各区分に係る修正関数値からなる修正関数を計算する A first identifying means for identifying a segment including the start position of the attack signal is a portion of the signal containing up as a correction point based on the audio signal having the divided segment, including the fall of sudden sound a second identification means for identifying a fraction containing the end position of the release signal is a portion of the signal as a correction point based on the audio signal having the divided division, desired and when gain control in accordance with the correction function that, the target peak value calculating means for calculating a target peak value in the current frame to be processed, a fraction containing the start position of the identified attack signal, and a fraction containing the end position of the identified release signal, based on the above calculated target peak value, calculating a correction function consisting correction function value according to each segment of the current frame 正関数計算手段とを備えたことを特徴とする。 Characterized by comprising a positive function calculating means. 【0026】上記オーディオ信号の符号化装置において、上記第1の識別手段は、処理すべき現在の区分に続く次の区分のピークの絶対値と、当該現在の区分以前の予め決められた数の区分に係る各ピークの絶対値との比に基づいて、当該現在の区分がアタック信号の開始位置を含むか否かを決定し、当該現在の区分が上記アタック信号の開始位置を含むと決定されたときは、アタック信号の開始位置を含むことを示す所定の第1の値を当該現在の区分に割り当てることを特徴とする。 [0026] In the coding apparatus of the audio signal, the first identification means includes absolute value of the peak of the subsequent next segment in the current partition to be treated, the segment previous predetermined number of current on the basis of the ratio of the absolute value of each peak of the segment, the current segment is to determine whether including the start position of the attack signal, the current segment is determined to comprise the start position of the attack signal when it is a predetermined first value indicating that it contains the start position of the attack signal and assigns to the current segment. 【0027】また、上記オーディオ信号の符号化装置において、上記第2の識別手段は、処理すべき現在の区分と、当該現在の区分に先行する修正ポイントとの間における最大のピークの絶対値と、当該現在の区分以後の予め決められた数の区分に係る各ピークの絶対値との比に基づいて、当該現在の区分がリリース信号の終了位置を含むか否かを決定し、当該現在の区分が上記リリース信号の終了位置を含むと決定されたときは、リリース信号の終了位置を含むことを示す所定の第2の値を当該現在の区分に割り当てることを特徴とする。 Further, in the encoding apparatus of the audio signal, the second means of identification, current and classification to be treated, and the absolute value of the largest peak between the corrected points preceding the current segment , on the basis of the ratio of the absolute value of each peak according to a predetermined number of sections of the current segment after, the current segment is to determine whether including the end position of the release signal, the current indicator when it is determined that includes the end position of the release signal, the predetermined second value indicating that it contains an end position of the release signal, characterized in that assigned to the current segment. 【0028】さらに、上記オーディオ信号の符号化装置において、上記目標ピーク値計算手段は、互いに隣接する各1対の修正ポイント間の最大のピークの絶対値と、 Furthermore, in the encoding apparatus of the audio signal, the target peak value calculation means, and the absolute value of the largest peak between the pair of modified points adjacent to each other,
上記割り当てられた第1の値及び第2の値と、処理すべき現在のフレームに続く次のフレームの最初の区分に係るピークの絶対値とに基づいて、当該処理すべき現在のフレームのオーディオ信号を上記修正関数に従って利得制御したときに所望される目標ピーク値を計算することを特徴とする。 It said a first value and a second value assigned, on the basis of the absolute value of the peak of the first segment of the next frame following the current frame to be processed, the current frame audio to be the process signal and calculates a desired target peak value when gain control in accordance with the correction function. 【0029】またさらに、上記オーディオ信号の符号化装置において、上記修正関数計算手段は、上記アタック信号の開始位置を含む区分と、当該アタック信号の開始位置を含む区分に先行する修正ポイントとの間の各区分に係る修正関数値を、当該アタック信号の開始位置を含む区分と、上記先行する修正ポイントとの間における最大のピークの絶対値が、上記目標ピーク値に等しくなるように計算し、上記リリース信号の開始位置を含む区分と、当該リリース信号の開始位置を含む区分に先行する修正ポイントとの間の各区分に係る修正関数値を、当該リリース信号の開始位置を含む区分と、上記先行する修正ポイントとの間における最大のピークの絶対値が、上記目標ピーク値に等しくなるように計算することを特徴とする。 [0029] Furthermore, in the encoding apparatus of the audio signal, the correction function calculating means, between the partition and including the start position of the attack signal, and correction point preceding the segment containing the start position of the attack signal a correction function value according to the classification of classification and including the start position of the attack signal, the absolute value of the largest peak between the corrected points above preceding, calculated to be equal to the target peak value, section and including the start position of the release signal, the correction function value according to the division between the modified point preceding the segment containing the start position of the release signal, the segment including the start position of the release signal, the the absolute value of the largest peak between the preceding corrected points, and calculates to be equal to the target peak value. 【0030】また、上記オーディオ信号の符号化装置において、上記利得制御手段は、上記分割された区分を有するオーディオ信号に基づいて、発話音声に含まれる所定のゆるやかな勾配で自然に降下する第1の信号部分を検出する第1の検出手段と、上記分割された区分を有するオーディオ信号に基づいて、発話音声に含まれる所定のゆるやかな勾配で自然に上昇する第2の信号部分を検出する第2の検出手段との少なくとも一方を備え、上記利得制御手段は、処理すべき現在のフレームにおいて、 Further, in the encoding apparatus of the audio signal, said gain control means based on the audio signal having the divided segment, first descending naturally in a predetermined gradual gradient included in speech sound the detected first detection means for detecting a signal portion of, based on the audio signal having the divided segment, the second signal portion naturally rises at a predetermined gradual gradient included in speech sound comprising at least one of the second detecting means, said gain control means, in the current frame to be processed,
上記識別されたアタック信号の開始位置を含む区分と、 Section and including the start position of the identified attack signal,
上記識別されたリリース信号の終了位置を含む区分とに基づいて、上記検出された第1の信号部分の修正関数による利得制御を中止する一方、上記識別されたアタック信号に基づいて計算される修正関数を減少させて上記第2の信号部分の修正関数を計算することにより、当該現在のフレームにおける修正関数を計算することを特徴とする。 Based on the classification and including the end position of the identified release signal, while stops the gain control by the correction function of the first signal portion is the detected, correction is calculated based on the identified attack signal by decreasing the function to calculate the correction function of the second signal portion, and calculates a correction function in the current frame. 【0031】さらに、上記オーディオ信号の符号化装置において、上記第1の検出手段は、上記現在のフレームに先行するフレームにおいて修正ポイントである区分の数が所定の第1のしきい値より小さく、かつ現在のフレームにアタック信号が含まれていないときに、上記第1 Furthermore, in the encoding apparatus of the audio signal, the first detection means, the number of division is modified points in the frame preceding the above current frame is smaller than a predetermined first threshold value, and when contains no attack signal in the current frame, the first
の信号部分が存在すると決定し、上記第2の検出手段は、上記アタック信号の開始位置を含む区分と、当該区分から当該区分に続く次の修正ポイントまでの間における最大のピークの絶対値が存在する区分との間の分離区分数が所定の第2のしきい値より大きいときに、上記第2の信号部分が存在すると決定することを特徴とする。 The signal portion of the presence decision, the second detecting means, section and including the start position of the attack signal, the absolute value of the largest peak in the period from the division to the next modification point subsequent to the indicator when the number of the separation partition between the segments present are greater than a predetermined second threshold value, and determines the said second signal portion is present. 【0032】またさらに、上記オーディオ信号の符号化装置において、上記修正関数計算手段は、上記互いに隣接した2つのフレームである第1及び第2のフレームにおいて、上記利得制御後のオーディオ信号のうちの第1 [0032] Furthermore, in the encoding apparatus of the audio signal, the correction function calculating means, the first and second frame which is two frames adjacent above one another, of the audio signal after the gain control first
のフレームのピークの絶対値と第2のフレームのピークの絶対値とが異なるとき、上記各ピークの絶対値が等しくなるように、上記第2のフレームの最初の区分に係る修正関数値を補正することを特徴とする。 When the absolute value of the peak of the frame and the absolute value of the peak of the second frame are different, so that the absolute value of each peak is equal, correcting the correction function value according to the first segment of the second frame characterized in that it. 【0033】また、上記オーディオ信号の符号化装置において、上記利得制御手段は、上記利得制御の処理の後に、上記互いに隣接した2つのフレームである第1及び第2のフレームのオーディオ信号が互いに実質的に連続するように、第1のフレームのオーディオ信号に対して第2のフレームの最初の区分に係る修正関数値を乗算して補正する乗算器をさらに備え、上記修正関数計算手段は、上記第1のフレームの各区分に係る修正関数値のうちの、オーディオ信号を増幅する最小の修正関数値に基づいて、上記オーディオ信号を増幅する修正関数により利得制御されるべき第1のフレームのオーディオ信号を、上記乗算して補正することにより減衰させることを防止するように、上記第2のフレームの最初の区分に係る修正関数値を補正 Further, in the encoding apparatus of the audio signal, said gain control means, after the processing of the gain control, the first and the audio signal is substantially mutually second frame which is two frames adjacent the mutually manner so as to be continuous, further comprising a multiplier for correcting by multiplying the first correction function value according to the classification of the second frame to the audio signal of the first frame, the correction function calculating means, the of correction function value according to each segment of the first frame, based on the minimum of the correction function value for amplifying the audio signal, the audio of the first frame to be gain controlled by correction function for amplifying the audio signal signal, so as to prevent the attenuating by correcting by the multiplication, the correction a correction function value according to the first segment of the second frame ることを特徴とする。 And wherein the Rukoto. 【0034】さらに、上記オーディオ信号の符号化装置において、上記修正関数計算手段は、処理すべき現在のフレームにおける最後の修正ポイントの区分より後方に位置する現在のフレームの各区分における最大のピークの絶対値が上記目標ピーク値と異なるときに、上記最大のピークの絶対値が上記目標ピーク値に等しくなるように、上記後方に位置する現在のフレームの各区分に係る修正関数値を補正することを特徴とする。 Furthermore, in the encoding apparatus of the audio signal, the correction function calculating means, the largest peak in each section of the current frame located behind the section of the last modification points in the current frame to be processed when the absolute value is different from the target peak value, the absolute value of the maximum peak to be equal to the target peak value, corrects the correction function value according to each segment of the current frame located above the rear the features. 【0035】また、本発明の第4の態様に係るオーディオ信号の符号化装置は、入力されたオーディオ信号に基づいてフレーム毎に修正関数を計算して、計算された修正関数に従って上記オーディオ信号に対して利得制御する利得制御手段と、上記利得制御されたオーディオ信号に対して、縦続接続された互いに隣接する2つのフレーム毎に直交変換処理を行いかつ符号化処理を行うことにより符号化されたビットストリーム信号を得る手段とを備えたオーディオ信号の符号化装置において、上記利得制御手段は、入力されたオーディオ信号をフレームの時間よりも短い時間の複数の区分に分割する手段と、上記分割された区分を有するオーディオ信号に基づいて、急激な音の立上がりを含む信号の部分であるアタック信号の開始位置を含む [0035] The encoding apparatus of an audio signal according to the fourth aspect of the present invention is to calculate a correction function for each frame based on the input audio signal, to the audio signal according to the calculated correction function and gain control means for gain control for, with respect to the gain-controlled audio signal, encoded by performing the orthogonal transform processing performed and the encoding process for each two frames adjacent to each other in cascade in the coding apparatus of the audio signal and means for obtaining a bit stream signal, said gain control means includes means for dividing the input audio signal into a plurality of sections of time shorter than the time frame, is the split was based on the audio signal having a partition includes a start position of the attack signal is a portion of the signal containing the rise of rapid sound 分を修正ポイントとして識別する第3の識別手段と、上記分割された区分を有するオーディオ信号に基づいて、急激な音の立下がりを含む信号の部分であるリリース信号の終了位置を含む区分を修正ポイントとして識別する第4の識別手段と、上記分割された区分を有するオーディオ信号に基づいて、発話音声に含まれる所定のゆるやかな勾配で自然に降下する第1の信号部分を検出する第3の検出手段と、上記分割された区分を有するオーディオ信号に基づいて、発話音声に含まれる所定のゆるやかな勾配で自然に上昇する2の信号部分を検出する第4の検出手段との少なくとも一方を備え、上記利得制御手段は、処理すべき現在のフレームにおいて、上記識別されたアタック信号の開始位置を含む区分と、上記識別されたリリース信号 Fixes and third identification means for identifying a frequency as a correction point based on the audio signal having the divided segment, the fraction containing the end position of a part of the signal containing the fall of sudden sound release signal a fourth identification means for identifying a point, based on the audio signal having the divided segment, the third for detecting the first signal portion falls naturally in a predetermined gradual gradient included in speech sound detection means, based on the audio signal having the divided segment, comprising at least one of the fourth detection means for detecting a predetermined natural second signal portion which rises in gentle slopes included in speech sound the gain control means is in the current frame to be processed, a fraction containing the start position of the identified attack signal, the identified release signal 終了位置を含む区分とに基づいて、上記検出された第1の信号部分の修正関数による利得制御を中止する一方、上記識別されたアタック信号に基づいて計算される修正関数を減少させて上記第2の信号部分の修正関数を計算することにより、当該現在のフレームにおける修正関数を計算する修正関数計算手段とを備えたことを特徴とする。 Based on the classification and including the end position, while stops the gain control by the correction function of the first signal portion is the detected, said first reduces the correction function calculated on the basis of the identified attack signal by calculating the correction function of the second signal portion, characterized in that a correction function calculating means for calculating a correction function in the current frame. 【0036】上記オーディオ信号の符号化装置において、上記第3の検出手段は、上記現在のフレームに先行するフレームにおいて修正ポイントである区分の数が所定の第1のしきい値より小さく、かつ現在のフレームにアタック信号が含まれていないときに、上記第1の信号部分が存在すると決定し、上記第4の検出手段は、上記アタック信号の開始位置を含む区分と、当該区分から当該区分に続く次の修正ポイントまでの間における最大のピークの絶対値が存在する区分との間の分離区分数が所定の第2のしきい値より大きいときに、上記第2の信号部分が存在すると決定することを特徴とする。 [0036] In the coding apparatus of the audio signal, the third detection means, the number of division is modified points in the frame preceding the above current frame is smaller than a predetermined first threshold value, and the current when the frame does not include an attack signal, the determined first signal portion is present, the fourth detecting means section and including the start position of the attack signal, to the classification from the classification followed when the number of the separation partition between the next largest segment absolute value exists of peaks in until fix point is greater than a predetermined second threshold, determine that the second signal part is present characterized in that it. 【0037】本発明の第5の態様に係るオーディオ信号の符号化及び復号化システムは、上記オーディオ信号の符号化装置と、オーディオ信号の復号化装置とを備え、 The fifth encoding and decoding system for audio signals in accordance with aspects of the present invention includes a coding device of the audio signal, and a decoding apparatus of an audio signal,
上記オーディオ信号の復号化装置は、上記符号化装置により符号化されたビットストリーム信号を復号化しかつ逆直交変換処理を行うことにより、複数のフレームからなるオーディオ信号を得る手段と、上記得られたオーディオ信号に対して、上記修正関数とは逆の修正関数を用いて逆利得制御を行って逆利得制御されたオーディオ信号を得て出力する手段とを備えたことを特徴とする。 Decoding device of the audio signal by performing decoding the bit stream signals encoded and inverse orthogonal transform process by the encoding device, and means for obtaining an audio signal comprising a plurality of frames, obtained above the audio signal, and the correction function is characterized in that a means for outputting resulting inverse gain-controlled audio signal by performing inverse gain control by using the inverse of the correction function. 【0038】また、本発明の別の態様に係る符号化方法は、ディジタルオーディオ信号の複数の時間サンプルよりなるフレームに対して増幅又は減衰の利得係数である修正レベルalevcodeと上記修正レベルの位置である修正位置aloccodeとを決定して、プリエコー及びポストエコーの抑圧とアーティファクトの最小化とを達成するための方法であって、(a)複数の時間サンプルよりなる上記フレームを、それぞれが等しい個数の時間サンプルよりなる複数の区分に分割するステップと、(b)リリース信号と、フレームの境界におけるアタック信号とのより効果的な制御とに取り組むために、現在のフレームの次に続くフレーム(未来フレーム)の予め決められた数の区分をバッファリングするステップと、(c)各区分におけるすべての時間サ [0038] The encoding method according to another aspect of the present invention, at the position of the amplification or attenuation modification levels alevcode and the modification level is the gain factor for a plurality of frames consisting of time samples of the digital audio signal determines the certain correction position Aloccode, a method for achieving the minimization of suppression and artifacts of pre-echo and post-echo, (a) a plurality of times said frame consisting of samples, the number of each equal dividing into a plurality of sections made of time samples, (b) and the release signal, to address the more effective control of the attack signal in the boundary of the frame, the next subsequent frame of the current frame (future frame a step of pre-buffering of the division number which is determined in), all the time difference in each segment (c) ンプルの信号レベルに係るピークの絶対値MaxPeakを計算するステップと、(d)所定のアタック信号の基準を用いてアタック信号の立上がりの開始位置を検出するステップと、(e)増幅が実行される必要がある上記検出された開始位置を、アタックポイントとしてマーキングするステップと、(f)所定のリリース信号の基準を用いてリリース信号の立下がりの終了位置を検出するステップと、(g)上記検出された終了位置をリリースポイントとしてマーキングし、かつ上記各リリースポイントに対して望ましい減衰の利得係数を指定するステップと、(h)互いに隣接するすべての修正ポイント(すべてのアタックポイント及びリリースポイント)の間において、最大のピークの絶対値MaxP Calculating the absolute value MaxPeak peaks according to the signal level of the sample, detecting a rising edge of the start position of the attack signal, the (e) amplification is performed using the criteria of (d) a predetermined attack signal the detected start position needs a step of marking as an attack point, and detecting an end position of the fall of the release signal using the criteria of (f) a predetermined release signal, (g) the detection and steps have been end position marked as release point, and specifies a gain coefficient of the desired attenuation with respect to the respective release point, the (h) all modifications points adjacent to each other (all attack point and release point) between, the absolute value of the maximum peak MaxP
eakをそれぞれ位置決めし、上記ピークの絶対値をピーク値InterModMaxPeakに記憶し、上記ピークの絶対値の位置をピーク位置InterModMaxLocに記憶するステップと、(i)当該信号を等化させるための目標となる、信号レベルの目標ピーク値CurrFramePeakを計算するステップと、(j)当該信号が自然な降下を示しているか否かをチェックするステップと、(k)上記自然な降下に対処するステップと、(l)信号レベルの目標ピーク値 The positioning each eak, the absolute value of the peak is stored in the peak value InterModMaxPeak, and storing the peak position InterModMaxLoc the position of the absolute value of the peak, as a target for equalizing the (i) the signal , calculating a target peak value CurrFramePeak of the signal level, and checking whether shows a natural drop (j) the signal, the steps of: addressing (k) the natural descent, (l ) the target peak value of the signal level
CurrFramePeakを用いて、上記マーキングされたすべての修正ポイントに対する修正レベルを計算するステップと、(m)当該アタック信号が自然な上昇を示しているか否かをチェックするステップと、(n)上記自然な上昇に対処するステップと、(o)同一の修正レベルの利得係数を有しかつ互いに連続する修正ポイントを統合するステップと、(p)複数の時間サンプルよりなる現在のフレームの利得制御後の信号レベルが、(同様に、複数の時間サンプルよりなる)現在のフレームに先行するフレームの利得制御後の信号レベルに対して有意な差分を有するか否かをチェックするステップと、(q)上記差分に対処するステップと、(r)現在のフレームに先行するフレームの過度の減衰を防止するために、現在のフレームの最初の修正ポ Using CurrFramePeak, calculating a correction level for the marked all modifications points, and checking whether show a natural rise (m) the attack signal, (n) the natural a method to deal with raised, (o) the same steps for integrating the correction points and continuous with each other has a gain factor modification level, (p) signal after the gain control of the current frame consisting of a plurality of time samples levels, (as well as a plurality of time consisting of samples) and checking whether a significant difference with respect to the signal level after the gain control of the frame preceding the current frame, (q) the difference a method to deal with, (r) to prevent excessive attenuation of the frame preceding the current frame, the first modified port of the current frame イントの修正レベルを制限するステップと、(s)上記利得制御されたフレームの終端の信号レベルが、当該フレームの上記終端よりも前の部分に比べて弱いか否かをチェックするステップと、 A step of limiting the correction level Into the steps of checking whether (s) the signal level at the end of the gain control frame is weaker than the portion of the front than the end of the frame,
(t)信号レベルの目標ピーク値CurrFramePeakに等しくなるように、上記終端を増幅する(又は減衰する)ステップとを含むことを特徴とする。 (T) to be equal to the signal level of the target peak value CurrFramePeak, amplifying the termination (or attenuated), characterized in that it comprises a step. 【0039】上記オーディオ信号の符号化方法において、上記アタック信号の基準は、潜在的なアタックポイントに先行する予め決められた数の区分の最大のピークの絶対値MaxPeakのそれぞれに対する、当該潜在的なアタックポイントのピークの絶対値MaxPeakの比に基づき、上記潜在的なアタックポイントに先行する区分数が、上記予め決められた数を達成するには不十分であるときは、上記ピークの絶対値MaxPeakの代わりに、複数の時間サンプルよりなる利得制御された先行するフレームのピークの絶対値PrevFramePeakに基づき、この比が予め決められたしきい値を超えていることを必要とし、 [0039] In the encoding method of the audio signal, the reference of the attack signal, for each of the absolute value MaxPeak the maximum peak potential predetermined number of segments preceding the attack point, a corresponding potential based on the ratio of the absolute value MaxPeak peak attack point, the number of segments preceding the potential attack points, when the is insufficient to achieve the predetermined number can, the absolute value of said peak MaxPeak instead, based on the absolute value PrevFramePeak peak frames preceding that is a gain control comprising a plurality of time samples, it requires that this ratio exceeds a predetermined threshold,
潜在的なアタックポイントと先行するアタックポイントとの分離が、予め決められた区分数を超えていることを必要とする。 Separation of the attack point and a preceding potential attack points, requires that exceeds the number of segments that is determined in advance. 【0040】また、上記オーディオ信号の符号化方法において、アタックポイントに対する上記マーキングの動作は、予め決められた正の値を上記アタックポイントの修正レベルalevcodeに指定することと、上記アタックポイントの区分のインデックスをaloccodeに記憶することとを特徴とする。 Further, in the encoding method of the audio signal, the operation of the marking against attack point, and specifying a predetermined positive value to the correction level alevcode the attack point, the division of the attack point and in that for storing index Aloccode. 【0041】さらに、上記オーディオ信号の符号化方法において、上記リリース信号の基準は、潜在的なリリースポイント以後の予め決められた数の区分の最大のピークの絶対値MaxPeakのそれぞれに対する、当該潜在的なリリースポイントに先行するピーク値InterModMaxPeak [0041] Further, in the encoding method of the audio signal, the reference of the release signal, for each of the absolute value MaxPeak the maximum peak potential predetermined number of sections of release point after, the potential peak value InterModMaxPeak that precedes a release point
の比であり、かつ、この比が予め決められたしきい値を超えていることを必要とし、上記しきい値は、上記潜在的なリリースポイントに先行する修正ポイントのタイプが、アタックであるか又はリリースであるかに従って可変であることを特徴とする。 Is the ratio of, and requires that the ratio exceeds a predetermined threshold value, the threshold, the type of modification points preceding to the potential release point is the attack characterized in that it is a variable in accordance with a whether or release. 【0042】またさらに、上記オーディオ信号の符号化方法において、上記マーキングの動作は、上記リリースポイントより前で発見されたピーク値InterModMaxPeak [0042] Furthermore, in the encoding method of the audio signal, the operation of the marking, the found in prior to the release point peak value InterModMaxPeak
の大きさに従って当該リリースポイントの修正レベルal Modification level al of the release point according to size
evcodeを設定することと、区分のインデックスを上記リリースポイントの修正位置aloccodeに記憶することとを特徴とする。 And setting the Evcode, the index of the segment and in that stored in the correction position aloccode of the release point. 【0043】また、上記オーディオ信号の符号化方法において、上記目標ピーク値CurrFramePeakは、互いに隣接するすべての修正ポイント間のピークの絶対値InterM [0043] Also, in the encoding method of the audio signal, the target peak value CurrFramePeak the absolute value of the peak between all modifications points adjacent InterM
odMaxPeakと、現在のフレームのすべての修正レベルale And odMaxPeak, all of the modification level of the current frame ale
vcodeの係数と、未来フレームの第1の区分のピークの絶対値MaxPeakとに基づくことを特徴とする。 And the coefficient of Vcode, characterized in that based on the absolute value MaxPeak peak of the first segment of the future frame. 【0044】さらに、上記オーディオ信号の符号化方法において、上記自然な降下をチェックするための基準は、先行するフレームにおいて実行された修正の総数が所定のしきい値より小さいことと、現在のフレームにおいてマーキングされた修正ポイントがすべてリリース信号のタイプに属していることとである。 [0044] Further, in the encoding method of the audio signal, the natural reference for checking descent, and that the total number of the executed in the preceding frame corrected is smaller than a predetermined threshold, the current frame It marked modified points in it and that it belongs to the type of all release signal. 【0045】またさらに、上記オーディオ信号の符号化方法において、上記自然な降下に対処する動作は、発見されたすべてのリリースポイントの除去であることを特徴とする。 [0045] Furthermore, in the encoding method of the audio signal, the operation to cope with the natural drop, characterized in that it is a discovered removal of all release point. 【0046】また、上記オーディオ信号の符号化方法において、上記すべての修正ポイントに対する修正レベルは、目標ピーク値CurrFramePeakと、上記修正ポイントのそれぞれに先行するピーク値InterModMaxPeakとに基づいて計算され、ピーク値InterModMaxPeakがゼロであるときは、上記計算において、上記ピーク値InterModMa [0046] Also, in the encoding method of the audio signal, modification level for all of the above modifications points are calculated based on the target peak value CurrFramePeak, the peak value InterModMaxPeak preceding each of the modified point, the peak value when InterModMaxPeak is zero, in the above calculations, the peak value InterModMa
xPeakの代わりに予め決められたゼロでない小さな値が用いられることを特徴とする。 Wherein the small value not predetermined zero instead of xPeak is used. 【0047】さらに、上記オーディオ信号の符号化方法において、上記自然な上昇をチェックするための基準は、上記各アタックポイントの修正位置aloccodeと上記アタックポイントの後に続くピーク位置InterModMaxLoc [0047] Further, in the encoding method of the audio signal, said natural criteria for checking rise, peak position InterModMaxLoc following the correction position aloccode and the attack point of the respective attack point
との距離に基づくことを特徴とする。 Characterized in that based on the distance between. 【0048】またさらに、上記オーディオ信号の符号化方法において、上記自然な上昇に対処する動作は、上記アタックポイントの修正レベルalevcodeを予め決められた量だけデクリメントすることを特徴とする。 [0048] Furthermore, in the encoding method of the audio signal, the operation to cope with the natural increase is characterized by decrements predetermined amount modification level alevcode the attack point. 【0049】また、上記オーディオ信号の符号化方法において、利得制御後の先行するフレームと利得制御後の現在のフレームとの上記差分を評価するための基準は、 [0049] Also, in the encoding method of the audio signal, the reference for evaluating the difference between the current frame after the frame and a gain control that precedes after gain control,
目標ピーク値CurrFramePeakの先行するフレームのピーク値PrevFramePeakに対する比に基づくことを特徴とする。 Characterized in that based on the ratio to the peak value PrevFramePeak preceding frame of the target peak value CurrFramePeak. 【0050】さらに、上記オーディオ信号の符号化方法において、上記差分に対処する動作は、上記計算された比から導出された修正レベルalevcodeを有する新しい修正ポイントを挿入することであり、その修正位置alocco [0050] Further, in the encoding method of the audio signal, the operation to deal with the difference is to insert a new modification point with modified levels alevcode derived from the ratio which is calculated above, the correction position alocco
deはフレームの最初の区分のインデックスに等しいことを特徴とする。 de is characterized by equal to the index of the first section of the frame. 【0051】またさらに、上記オーディオ信号の符号化方法において、上記最初の修正ポイントのレベルを制限する動作は、現在のフレームに先行するフレームのすべてのアタックポイントに係る最小の修正レベルalevcode [0051] Furthermore, in the encoding method of the audio signal, the operation for limiting the level of the first modification point, minimum modification level according to any attack point of the frame preceding the current frame alevcode
に基づくことを特徴とする。 Characterized in that it is based on. 【0052】また、上記オーディオ信号の符号化方法において、上記弱い終端をチェックするための基準は、最後の修正ポイントの後に続くすべての区分の最大のピークの絶対値MaxPeakに対する、目標ピーク値CurrFramePe [0052] Also, in the encoding method of the audio signal, the reference for checking the weak termination, for the absolute value MaxPeak of the maximum peak of every segment following the last fix point, the target peak value CurrFramePe
akの比に基づくことを特徴とする。 Characterized in that based on the ratio of ak. 【0053】さらに、上記オーディオ信号の符号化方法において、上記終端を増幅する動作は、上記計算された比から導出された修正レベルalevcodeを有する新しい修正ポイントを挿入することであり、その修正位置alocco [0053] Further, in the encoding method of the audio signal, the operation of amplifying the termination is to insert a new modification point with modified levels alevcode derived from the ratio which is calculated above, the correction position alocco
deはフレームの最後の区分のインデックスに等しいことを特徴とする。 de is characterized by equal to the index of the last segment of the frame. 【0054】 【発明の実施の形態】以下、図面を参照して本発明の実施形態について説明する。 [0054] PREFERRED EMBODIMENTS Hereinafter, embodiments of the present invention will be described with reference to the drawings. 本願明細書では、ATRAC In the present specification, ATRAC
3のためのミニディスク記録再生システムを一実施形態として参照して説明するが、本発明の符号化方法は、利得制御を用いる他の符号化器にも適用することができる。 Mini disc recording and reproducing system for 3 with reference to an exemplary embodiment will be described, the encoding method of the present invention can be applied to other encoder using the gain control. 【0055】図1は、本発明の一実施形態に係るミニディスク記録再生システムの構成を示すブロック図である。 [0055] Figure 1 is a block diagram showing the configuration of a mini-disk recording and reproducing system according to an embodiment of the present invention. この実施形態は、特に、オーディオエンコーダ2内の詳細構成に特徴を有している。 This embodiment is particularly characterized in the detailed configuration of the audio encoder 2. 【0056】図1において、A/Dコンバータ1はオーディオ入力信号をA/D変換してディジタル化されたオーディオサンプル信号に変換し、次いで、オーディオエンコーダ2は、詳細後述するような利得制御方法を用いて上記変換されたオーディオサンプル信号を圧縮して符号化し、ATRAC3のビットストリーム信号を発生する。 [0056] In FIG 1, A / D converter 1 converts the audio input signal is A / D converted to digitized audio sample signal, then the audio encoder 2, a gain control method as described in detail later used to compress the audio sample signal the transformed coded to generate a bit stream signal of ATRAC3. 次いで、ミニディスク記録装置3は、ATRAC3 Then, mini-disc recording apparatus 3, ATRAC3
のビットストリーム信号を所定の変調記録信号に変調した後、上記変調記録信号をミニディスク4に記録する。 The bit stream signal after modulated in a predetermined modulation recording signal, and records the modulated recording signal to the mini disc 4.
一方、ミニディスク再生装置5は、ミニディスク4から記録信号を再生して復調することにより、ATRAC3 On the other hand, a mini disk reproducing device 5, by demodulating and reproducing the recorded signal from the mini disc 4, ATRAC3
のビットストリーム信号を再生する。 Play of the bit stream signal. さらに、オーディオデコーダ6は圧縮されているATRAC3のビットストリーム信号に対して、上記利得制御方法とは逆の逆利得制御方法を用いてその利得を制御しながらディジタルオーディオ信号に復号化した後、最後にD/Aコンバータ7はディジタルオーディオ信号をD/A変換してオーディオ出力信号を出力する。 Further, the bit stream signal ATRAC3 audio decoder 6 is compressed, after decoding the digital audio signal while controlling the gain using an inverse gain control method contrary to the above gain control method, the end D / a converter 7 outputs an audio output signal to a digital audio signal by D / a conversion on. 【0057】上述の利得制御及び逆利得制御によって、 [0057] by the gain control and inverse gain control of the above,
ディジタルオーディオ信号の符号化及び復号化の際に発生するプリエコー雑音及びポストエコー雑音を抑圧することができる。 It is possible to suppress the pre-echo noise and post-echo noise generated during the encoding and decoding of digital audio signals. この実施形態では、記録再生システムは、ATRAC3のビットストリーム信号をミニディスク4に記録するように構成されているが、本発明はこれに限らず、その他の記録媒体または伝送媒体を用いるように記録再生システムや伝送システムを構成してもよい。 In this embodiment, the recording and reproducing system is configured to record the bit stream signal ATRAC3 minidisk 4, the present invention is not limited to this, recording to use other recording medium or transmission medium it may constitute a playback system or transmission system. 【0058】図2は、図1のオーディオエンコーダ2の詳細構成を示すブロック図である。 [0058] Figure 2 is a block diagram showing a detailed configuration of the audio encoder 2 of FIG. 図2において、オーディオエンコーダ2は、ATRAC3の音声信号圧縮技術を用いた典型的な変換符号化器であるが、オーディオエンコーダ2の詳細構成のうち、特に、利得検出部14 2, the audio encoder 2 is a typical transform coding device using a speech signal compression technology ATRAC3, among detailed configuration of the audio encoder 2, in particular, the gain detector 14
及び利得制御部15−1乃至15−4の詳細構成において特徴を有している。 And it has a feature in the detailed structure of the gain control unit 15-1 to 15-4. ATRAC3は、基本的に、4 ATRAC3 is, basically, 4
4.1kHzでサンプリングされたオーディオサンプル信号のストリームに対して構成された、サブバンド符号化と変換符号化の技術のハイブリッド符号化方法である。 Configured for a stream of sampled audio sample signals at 4.1KHz, it is a hybrid coding method of sub-band coding and transform coding techniques. 【0059】図2に示すように、オーディオエンコーダ2は、時間領域においてそれぞれ1024個のサンプルを備える連続的なオーディオサンプル信号のフレームを、2ステージのQMFフィルタ10を用いて、4つの部分帯域(サブバンド)信号に周波数帯域分割し、次に、各部分帯域毎に、時間方向にそれぞれ256個のサンプル信号を有するフレームに分割した信号(以下、サブバンドフレームという。)を出力する。 As shown in FIG. 2, the audio encoder 2, a frame of continuous audio sample signals, each comprising 1024 samples in the time domain, using a QMF filter 10 of two-stage, four sub-bands ( subband) signal to frequency band division and then, for each sub-band, a signal divided into frames each having 256 samples the signal in a time direction (hereinafter, referred to as sub-band frames.) to the. ここで、QM Here, QM
F分割フィルタ10は、詳しくは、オーディオサンプル信号を低域信号と高域信号に等分するローパスフィルタ11及びハイパスフィルタ12と、上記分割された低域及び高域信号を周波数についてさらに等分するフィルタバンク13−1乃至13−4とを備えて構成される。 F dividing filter 10, particularly, a low-pass filter 11 and high-pass filter 12 for equally dividing the audio sample signal to the low frequency signal and the high-frequency signal is further equally divided for frequency bass and high signal the divided to filter bank 13-1 configured with a 13-4. 従って、QMFフィルタ10の出力は、それぞれ256個のサンプル信号を有する、4個のダウンサンプリングされたサブバンドフレームである。 Thus, the output of the QMF filter 10 each have 256 samples signals, a subband frames four downsampling. それらの各々は、時間軸上では、MDCT変換のための変換ブロックの半分の長さであり、0乃至5.5kHz、5.5kHz乃至1 Each of which, on the time axis is half the length of the transform block for MDCT conversion, 0 to 5.5 kHz, 5.5 kHz to 1
1kHz、11kHz乃至16.5kHz、及び16. 1 kHz, 11 kHz or 16.5 kHz, and 16.
5kHz乃至22kHzの4つの周波数帯のそれぞれから得られるオーディオ信号である。 An audio signal obtained from each of the four frequency bands of 5kHz to 22 kHz. 【0060】なお、フィルタバンク13−1乃至13− [0060] It should be noted that, through the filter bank 13-1 13-
4の後段にそれぞれ、ジョイントステレオ処理を実行する回路部をさらに備えてもよい。 Each subsequent stage of the 4 may further comprise a circuit portion for executing joint stereo processing. ジョイントステレオ処理の回路部は、例えば、ステレオ信号として入力されたオーディオ信号を、右チャンネル信号と左チャンネル信号との平均信号と、右チャンネル信号の利得データと、 Circuit portion of the joint stereo processing, for example, an audio signal input as a stereo signal, and the average signal of the right channel signal and the left channel signal, and the gain data of the right channel signal,
左チャンネル信号の利得データとに変換し、オーディオ信号のさらなる圧縮を達成することができる。 Converted to the gain data of the left channel signal, it is possible to achieve further compression of the audio signal. 【0061】次いで、修正関数を生成して、各サブバンドフレームに対して利得制御が実行される。 [0061] Then, generate a correction function, gain control is performed for each sub-band frames. ここで、フレーム中の各オーディオサンプル信号に対する利得制御の大きさ(すなわち増幅率又は減衰率)を定義する利得係数(又は、修正関数値と呼ぶ。)を、フレームを単位としてまとめたものを「修正関数」と呼ぶ。 Here, the gain control for each audio sample signals in the frame gain coefficients defining a magnitude (i.e. the amplification factor or attenuation factor) (or referred to. The correction function value), the summary of the frame as a unit of " It is referred to as a correction function ". フィルタバンク13−1乃至13−4から出力された各サブバンドフレームの信号は、利得検出部14と利得制御部15− Signals of each sub-band frame output from the filter bank 13-1 through 13-4, the gain detector 14 and a gain control unit 15
1乃至15−4にそれぞれ入力され、利得検出部14 It is input to the 1 to 15-4, the gain detector 14
は、バッファメモリ14aと修正関数計算部14bを備えて構成され、各サブバンドフレームに対する修正関数を計算して出力し、次いで、各利得制御部15−1乃至15−4は、上記生成された修正関数を用いて各サブバンドフレームに対して利得制御を実行する。 Is configured with a buffer memory 14a and the correction function calculating unit 14b, and outputs the calculated correction function for each sub-band frames, then the gain control unit 15-1 to 15-4 were generated as above executing a gain control for each sub-band frame using a correction function. 以下、図4 Below, as shown in FIG. 4
を参照して、特に、フィルタバンク13−1から出力される0乃至5.5kHzの周波数帯のサブバンドフレームについて説明する。 See, in particular, be described sub-band frames in the frequency band of 0 to 5.5kHz output from the filter bank 13-1. 【0062】図4は、MDCT処理部15−1に先行する利得検出部14及び利得制御部15−1における変換ブロックの生成を示すブロック図である。 [0062] Figure 4 is a block diagram illustrating the generation of a transformation block in the gain detector 14 and the gain controller 15-1 preceding the MDCT processing unit 15-1. ここで、各オーディオサンプル信号のストリームから構成される入力されたオーディオ信号のうちで、i番目のサブバンド(i=0,1,2,3)におけるn番目のオーディオフレームを「サブバンドフレーム[i][n]」として表す。 Here, among the input audio signal composed of a stream of each audio sample signal, the n-th audio frame in the i th sub-band (i = 0, 1, 2, 3) "sub-band frames [ i] expressed as [n] ". 図4では、サブバンドのインデックスi=0である。 In Figure 4, the index i = 0 for the subband. また、修正関数計算部14bは、n−1番目のサブバンドフレーム[i][n−1]の修正関数を計算するときに14b−aで図示され、n番目のサブバンドフレーム[i][n]の修正関数を計算するときに14b− Furthermore, the correction function calculating unit 14b, n-1-th sub-band frames [i] shown in 14b-a when calculating the correction function of the [n-1], n-th sub-band frames [i] [ when calculating the correction function of n] 14b-
bで図示され、かつ、n+1番目のサブバンドフレーム[i][n+1]の修正関数を計算するときに14b− Shown in b, and, n + 1-th sub-band frames [i] when calculating the correction function of the [n + 1] 14b-
cで図示されているが、これらは同一の修正関数計算部14bを便宜的に分けて図示したものである。 Is shown in c, they are those shown separately the same correction function calculating section 14b for convenience. 【0063】図4において、利得制御されるべきn番目のサブバンドフレーム[i][n]は、修正関数を計算するために、後続するサブバンドフレーム[i][n+ [0063] In FIG. 4, n-th sub-band frames to be gain control [i] [n], in order to calculate the correction function, subsequent sub-band frames [i] [n +
1]とともにバッファメモリ14aに格納される。 1] while being stored in the buffer memory 14a. 修正関数計算部14b−bは、2つのサブバンドフレーム[i][n]及び[n+1]と、利得制御されたサブバンドフレーム[i][n−1]のピーク値PrevFramePea Correction function calculating unit 14b-b includes two sub-band frames [i] [n] and [n + 1], the peak value of the gain control sub-band frames [i] [n-1] PrevFramePea
k[i]とに基づいてサブバンドフレーム[i][n] k [i] sub-band frames [i] on the basis of the [n]
のための修正関数MF[i][n]を計算し、次いで、 Correction function MF [i] to calculate the [n] for, then,
乗算器MP1bは上記修正関数MF[i][n]をサブバンドフレーム[i][n]に乗算して乗算結果のサブバンドフレーム[i][n]を縦続接続演算子CO1及び乗算器MP2bに出力する。 Multiplier MP1b the above correction function MF [i] [n] a sub-band frames [i] is multiplied by the [n] multiplied result of the sub-band frames [i] [n] cascaded operators CO1 and multiplier MP2b and outputs it to. それとともに、乗算結果のサブバンドフレーム[i][n]は、ピーク値PrevFr At the same time, the multiplication result sub-band frames [i] [n] is a peak value PrevFr
amePeak[i]として次のサブバンドフレーム[i] amePeak [i] as the next sub-band frames [i]
[n+1]の計算に用いるために、修正関数計算部14 For use in the calculation of [n + 1], the correction function calculating section 14
b−cに送られる。 It is sent to the b-c. また、修正関数計算部14b−a Furthermore, the correction function calculating section 14b-a
は、サブバンドフレーム[i][n−1]及び[n] The sub-band frames [i] [n-1] and [n]
と、利得制御されたサブバンドフレーム[i][n− When the gain control sub-band frames [i] [n-
2]のピーク値PrevFramePeak[i]とに基づいてサブバンドフレーム[i][n−1]のための修正関数MF Correction function MF for the peak value of 2] PrevFramePeak [i] sub-band frames [i] on the basis of the [n-1]
[i][n−1]を計算し、次いで、乗算器MP1aは上記修正関数MF[i][n−1]をサブバンドフレーム[i][n−1]に乗算して乗算結果のサブバンドフレーム[i][n−1]を乗算器MP2aに出力する。 [I] [n-1] is calculated, and then, the multiplier MP1a is the correction function MF [i] [n-1] the sub-band frames [i] multiplied result by multiplying the [n-1] sub and outputs the band frame [i] [n-1] to the multiplier MP2a.
それとともに、乗算結果のサブバンドフレーム[i] At the same time, the multiplication result sub-band frames [i]
[n−1]は、ピーク値PrevFramePeak[i]として次のサブバンドフレーム[i][n]の計算に用いるために、修正関数計算部14b−bに送られる。 [N-1], in order to use the calculation of the next sub-band frames [i] [n] as the peak value PrevFramePeak [i], it is sent to the correction function calculating section 14b-b. さらに、同様に、修正関数計算部14b−cは、サブバンドフレーム[i][n+1]及び[n+2]と、利得制御されたサブバンドフレーム[i][n]のピーク値PrevFrameP Further, similarly, the correction function calculating section 14b-c are sub-band frames [i] [n + 1] and [n + 2] and the peak value of the gain control sub-band frames [i] [n] PrevFrameP
eak[i]とに基づいてサブバンドフレーム[i][n eak [i] and the sub-band frame based on the [i] [n
+1]のための修正関数MF[i][n+1]を計算し、次いで、乗算器MP1cは上記修正関数MF[i] +1] correction function MF [i for] [n + 1] is calculated, and then, the multiplier MP1c the above correction function MF [i]
[n+1]をサブバンドフレーム[i][n+1]に乗算して乗算結果のサブバンドフレーム[i][n+1] [N + 1] of sub-band frames [i] of the [n + 1] to the multiplication to the multiplication result sub-band frames [i] [n + 1]
を縦続接続演算子CO2及び乗算器MP2cに出力する。 And it outputs the cascaded operators CO2 and multiplier MP2c a. 【0064】MDCT処理部16−1における変形離散コサイン変換(MDCT)処理に先行して、サブバンドフレームの境界における修正関数の連続性を保証しながら、2つの連続的なサブバンドフレームが互いに縦続接続される。 [0064] modified discrete cosine transform in the MDCT processing section 16-1 (MDCT) prior to processing, while ensuring the continuity of the correction function at the boundary of the sub-band frames, cascade two consecutive sub-band frames are mutually It is connected. 乗算器MP2aは、修正関数MF[i][n Multiplier MP2a, the correction function MF [i] [n
−1]によって利得制御されて乗算器MP1aから出力されたサブバンドフレーム[i][n−1]を、次のサブバンドフレーム[i][n]のための修正関数MF Correction function MF for the -1] by a gain controlled by sub-band frame output from the multiplier MP1a [i] [n-1], the following sub-band frames [i] [n]
[i][n]の最初の区分(本実施形態において、区分(パーティションとも呼ばれる。)とは、1つのサブバンドフレームを32個の区分に分割したときの当該区分をいう。)の利得係数(すなわち、修正関数値)MF (In the present embodiment, the partition (partition also called.), Refers to the division of time obtained by dividing one sub-band frames into 32 segments.) The first section of the [i] [n] gain factor (In other words, the correction function value) MF
[i][n][0]と乗算することにより正規化して、 [I] [n] is normalized by multiplying with [0],
乗算結果のサブバンドフレーム[i][n−1]を縦続接続演算子CO1に出力する。 And outputs the multiplication result sub-band frames [i] [n-1] to the cascaded operators CO1. 次いで、縦続接続演算子CO1は、乗算器MP2aから出力されたサブバンドフレーム[i][n−1]と、乗算器MP1bから出力されたサブバンドフレーム[i][n]とを縦続接続して、MDCT処理部16−1に出力する。 Then, cascaded operators CO1 includes multipliers and sub-band frames [i] [n-1] output from MP2a, connected in cascade and subband frame output from the multiplier MP1b [i] [n] Te, and it outputs the MDCT processing section 16-1. 同様に、乗算器MP2bは、乗算器MP1aから出力されたサブバンドフレーム[i][n]を、次のサブバンドフレーム[i][n+1]のための修正関数MF[i][n+ Similarly, the multiplier MP2b is a subband frame output from the multiplier MP1a [i] [n], the correction function MF [i] for the next sub-band frames [i] [n + 1] [n +
1]の最初の区分の利得係数MF[i][n+1] Gain factor of the first segment of 1] MF [i] [n + 1]
[0]と乗算することにより正規化して、縦続接続演算子CO2に出力する。 [0] is normalized by multiplying the outputs to the cascaded operators CO2. 次いで、縦続接続演算子CO2 Then, it cascaded operator CO2
は、乗算器MP2bから出力されたサブバンドフレーム[i][n]と、乗算器MP1cから出力されたサブバンドフレーム[i][n+1]とを縦続接続して、MD It includes multipliers and sub-band frames [i] [n] output from MP2b, subband frame output from the multiplier MP1c [i] [n + 1] and are connected in cascade, MD
CT処理部16−1に出力する。 And outputs it to the CT processing unit 16-1. すなわち、ATRAC In other words, ATRAC
3の標準は、修正関数MF[i][n]の値がサブバンドフレーム[i][n]の端点において1に等しい(すなわち、利得が1である)ことを必要とし、そのため、 3 standard, the correction is equal to 1 at the end point of the function MF [i] value of [n] is the sub-band frames [i] [n] (i.e., the gain is 1) required to be, therefore,
修正関数MF[i][n]が次の修正関数MF[i] Modify function MF [i] [n] the following correction function MF [i]
[n+1]と結合されたとき、それは、次の修正関数の最初の区分の利得係数MF[i][n+1][0]との乗算によって、サブバンドフレーム[i][n]及び[n+1]の境界において同一のレベルにするように正規化することができる。 [N + 1] and when coupled, it is, the gain factor of the first segment of the next correction function MF [i] [n + 1] by multiplying the [0], the sub-band frames [i] [n] and [n + 1] it can be normalized to the same level at the boundary. ゆえに、結合された2つのサブバンドフレームは、隣接するブロックがそれぞれ50% Thus, the two sub-band frames that are binding, 50 adjacent blocks respectively%
の重複を有するMDCTのための変換ブロック全体を形成した後、MDCT処理部16−1に出力される。 After forming the converted entire block for MDCT with overlapping, it is output to the MDCT processing section 16-1. 【0065】図4を参照して以上に説明した乗算器MP [0065] Multiplier MP as described above with reference to FIG. 4
1a,MP1b,MP1c,MP2a,MP2b及びM 1a, MP1b, MP1c, MP2a, MP2b and M
P2cと、縦続接続演算子CO1,CO2とは、本実施形態においては、利得制御部15−1に含まれるように構成されている。 And p2c, and the cascaded operators CO1, CO2, in the present embodiment is configured to include the gain control unit 15-1. 図4においては、第1のバンドに関する処理のみを図示しているが、第2乃至第4のバンドに関する処理も同様に実行される。 In FIG. 4, but shows only the processing for the first band, the process is also executed in the same manner for the second to fourth band. 【0066】再び図2を参照すると、MDCT処理部1 [0066] Referring again to FIG. 2, MDCT processing unit 1
6−1は、1つの周波数帯域で利得制御され、かつMD 6-1 are gain controlled in one frequency band, and MD
CT処理するための変換ブロックに縦続接続された少なくとも2つのサブバンドフレーム毎の信号に対してそれぞれ変形離散コサイン変換(MDCT)の処理を実行し、その結果として生じるスペクトル情報信号をトーン成分符号化器17−1に出力する。 Executing the processing of modified discrete cosine transform, respectively (MDCT) for at least two signals for each sub-band frames are cascaded to the conversion block for CT processing, tone component coding spectral information resulting signal and outputs it to the vessel 17-1. トーン成分符号化器17−1は、トーン成分検出部、スケールファクタ処理部及びビット割り当て部等を備えて構成され、MDCT Tone component encoder 17-1, the tone component detector is configured to include a scale factor processing unit and the bit allocation portion and the like, MDCT
処理された情報信号からトーン成分信号と非トーン性のスペクトル信号とを分離して、それぞれをトーン成分量子化器18−1とスペクトル量子化器19−1に出力する。 From the processed information signal by separating the spectral signals of the tonal component signal and the non-tonal, and outputs the respective tone component quantizer 18-1 and the spectral quantizer 19-1. ここで、トーン成分量子化器18−1とスペクトル量子化器19−1はトーン成分信号と非トーン性のスペクトル信号とに個別に符号化(量子化)の処理をする。 Here, the processing of the tone component quantizer 18-1 and the spectral quantizer 19-1 tone component signal and the non-tonal spectral signal and to separately encoded (quantized).
次いで、ビットストリームマルチプレクサ20は、ハフマン符号化器とマルチプレクサとを備えて構成され、トーン成分量子化器18−1とスペクトル量子化器19− Then, the bit stream multiplexer 20 is constituted by a Huffman coder and the multiplexer, the tone component quantizer 18-1 and the spectral quantizer 19
1において符号化された信号を、複数個(例えば14 The encoded signal at 1, a plurality (e.g., 14
個)のハフマンテーブルを用いて圧縮し、次いで、トーン成分符号化器17−1乃至17−4におけるトーン成分及びスペクトルの情報と、符号化された各トーン成分と、符号化された各非トーン成分と、利得検出部14− Compressed using Huffman table number), then the information of the tone components and spectrum in the tone component coding unit 17-1 to 17-4, each tone component encoded, each non-tone encoded a component, the gain detector 14
1乃至14−4から出力された修正関数のデータ(詳細後述するように、サブバンドフレーム内の修正位置のデータと、修正レベルに関するデータと、変化点の個数のデータとを含む。)を含み、ATRAC3標準に従うサイド情報とを多重化することにより、ATRAC3のビットストリーム信号を得て出力する。 1 (as described later in detail, and the data of the correction position in a sub-band frames, and data related to modification level, including. A data of the number of change points) data correction function output from 14-4 comprises , by multiplexing and side information according to the ATRAC3 standard, and outputs the resulting bit stream signal ATRAC3. 【0067】図3は、図1のオーディオデコーダ6の詳細構成を示すブロック図である。 [0067] Figure 3 is a block diagram showing a detailed configuration of the audio decoder 6 in Fig. 最初に、ビットストリームデマルチプレクサ21は、ミニディスク4等の記録媒体、又は伝送媒体から読み出された後復調されたAT First, the bit stream demultiplexer 21, the demodulated after being read from the recording medium, or a transmission medium such as a mini disc 4 AT
RAC3のビットストリーム信号を、各サブバンドごとのトーン成分の符号列及びスペクトルの符号列(非トーン成分の符号列)と、修正関数のデータを含むサイド情報とに分離する。 The bit stream signal RAC3, separated into a code sequence and the spectrum of the code sequence of the tone components of each sub-band (code sequence of the non-tone components), and side information including data of the correction function. 次いで、トーン成分逆量子化器22− Then, tone component inverse quantizer 22-
1とスペクトル逆量子化器23−1はそれぞれ、各符号列をスペクトル係数に復号化(逆量子化)し、トーン成分復号化部24−1は分離され復号化されたトーン成分信号と非トーン性のスペクトル信号とを合成する。 1 respectively spectral inverse quantizer 23-1 decodes (inverse quantization) each code sequence to the spectral coefficients, the tone component decoding unit 24-1 is separated decoded tone component signal and the non-tone combining the spectrum signals of sex. また、他のサブバンドにおけるトーン成分の符号列及びスペクトルの符号列についても同様である。 The same applies to the code string of the code sequence and the spectrum of the tone components in other subbands. 次いで、逆M Next, reverse M
DCT処理部25−1乃至25−4は、各周波数帯域ごとに逆MDCTによって時間領域のサブバンドフレームを生成し、次いで、逆利得制御部26−1乃至26−4 DCT processing section 25-1 to 25-4 generates a sub-band frames in the time domain by the inverse MDCT in each frequency band, then inverse gain control unit 26-1 to 26-4
は、ビットストリームデマルチプレクサ21から入力されたサイド情報内の修正関数のデータに基づいて、各サブバンドフレームに対して利得制御とは逆の修正関数で逆利得制御し、すなわち、利得制御によって増幅された部分を抑圧し、抑圧された部分を増幅し、逆利得制御された各バンドのサブバンドフレームをQMF合成フィルタ27に出力する。 Based on the data of the correction function in the side information input from the bit stream demultiplexer 21, inverse gain control in the reverse correction function is a gain control for each sub-band frames, i.e., amplified by a gain control It has been suppressed portion, amplifying the suppressed portion, and outputs a sub-band frames of the bands inverse gain control QMF synthesis filter 27. 最後に、QMF合成フィルタ27は各バンド(周波数帯域)毎のサブバンドフレームを合成して、合成されたディジタルオーディオ信号を出力する。 Finally, QMF synthesis filter 27 synthesizes the subband frame for each band (frequency band), and outputs the synthesized digital audio signal. 【0068】以上説明したように、図1のミニディスク記録再生システムは、オーディオ信号の符号化装置であるオーディオエンコーダ2とオーディオ信号の復号化装置であるオーディオデコーダ6とを備えたオーディオ信号の符号化及び復号化システムである。 [0068] As described above, the mini disc recording and reproducing system of Figure 1, the audio signal and an audio decoder 6 is a decoding apparatus of an audio encoder 2 and the audio signal is a coding apparatus for audio signal encoding a and decoding system. 上記オーディオエンコーダ2は、入力されたオーディオ信号に基づいてフレーム毎に修正関数を計算する利得検出部14と、計算された修正関数に従って上記オーディオ信号に対して利得制御する利得制御部15−1乃至15−4と、上記利得制御されたオーディオ信号に対して、縦続接続された互いに隣接する2つのフレーム毎に直交変換処理を行うMDCT処理部16−1乃至16−4と、上記直交変換された信号に符号化処理を行うトーン成分符号化器1 The audio encoder 2, a gain detector 14 for calculating a correction function for each frame based on the input audio signal, the gain control unit 15-1 to gain control on the audio signal according to the calculated correction function and 15-4, with respect to the gain-controlled audio signal, the MDCT processing unit 16-1 to 16-4 which performs orthogonal transform processing every two frames adjacent to each other in cascade, are the orthogonal transform tone component encoder 1 for encoding a signal
7−1乃至17−4、トーン成分量子化器18−1乃至18−4及びスペクトル量子化器19−1乃至19−4 7-1 to 17-4, tone component quantizer 18-1 to 18-4 and the spectral quantizer 19-1 to 19-4
を備えたことにより、符号化されたビットストリーム信号を得る。 By having to obtain the bitstream signal encoded. また、上記オーディオデコーダ6は、上記オーディオエンコーダ2により符号化されたビットストリーム信号を復号化するトーン成分逆量子化器22−1乃至22−4、スペクトル逆量子化器23−1乃至23− Also, the audio decoder 6, tone component inverse quantizer 22-1 to 22-4 decodes the bit stream signal encoded by the audio encoder 2, to spectrum inverse quantizer 23-1 23-
4及びトーン成分復号化器24−1乃至24−4と、上記復号化された信号に逆直交変換処理を行う逆MDCT Inverse MDCT performed with 4 and tone component decoder 24-1 through 24-4, the inverse orthogonal transform processing to the decoded signal
処理部25−1乃至25−4とを備えたことにより、複数のフレームからなるオーディオ信号を得て、上記オーディオ信号の復号化装置はさらに、上記得られたオーディオ信号に対して、上記修正関数とは逆の修正関数を用いて逆利得制御を行って逆利得制御されたオーディオ信号を得て出力する逆利得制御部26−1乃至26−4とを備えている。 By providing a processing unit 25-1 to 25-4 to obtain an audio signal comprising a plurality of frames, and further decoding apparatus of the audio signal, with respect to the resulting audio signal, the correction function and a reverse gain control unit 26-1 to 26-4 and outputs the obtained inverse gain-controlled audio signal by performing inverse gain control by using the inverse of the correction function is a. 【0069】本願明細書に開示する発明は、本願出願人によって特願2001−188067号の特許出願において開示された「オーディオ信号の符号化方法及び装置、並びに符号化及び復号化システム」と題する発明(以下、「先願の発明」と呼ぶ。)から改善されかつ拡張されたものである。 [0069] disclosed herein invention, "encoding method and apparatus of an audio signal, and encoding and decoding system" disclosed in the patent application of Japanese Patent Application No. 2001-188067 by the present applicant entitled invention (hereinafter. referred to as "prior application of the invention") is one which is improved and extended from. 先願の発明は計算面で経済的なものであるのに対して、本発明は、計算コストは上昇するがそれに相応して優れた品質を提供する。 Whereas the prior application of the invention is economical computationally, the present invention is, calculation cost is increased to provide superior quality Correspondingly. 2つの発明のキーとなる相違点と、本発明において改善されかつ拡張された改善拡張事項とを以下に列挙する。 Listed and differences as a key two inventions, improved in the present invention and the extended improved extended matter below. (1)先願の発明は、アタック信号基準において、処理すべき現在のサブバンドフレームに先行するサブバンドフレームの最後の8個の区分の各最大値であるピーク値 (1) the prior application of the invention is the attack signal standard, it is the maximum value of the last 8 sections of the sub-band frames preceding the current subband frame to be processed peak value
MaxPeakを用いた。 Using MaxPeak. 本発明は、先行するサブバンドフレームの最大値である単一のピーク値PrevFramePeakを用いる。 The present invention uses a single peak PrevFramePeak is the maximum value of the sub-band frames preceding. (2)先願の発明は、現在のサブバンドフレームに続く未来のサブバンドフレームからの区分を一切利用しない。 (2) the prior application of the invention does not use any of the division from the sub-band frame of the future following the current sub-band frame. それは、現在のサブバンドフレームの最後の区分をシフトして未来のサブバンドフレームの第1の区分を生成することにより、フレーム間の境界におけるアタック信号の問題(後述)に取り組んだ。 It by generating a first segment of the last shift the segment by future subband frame of the current sub-band frames, worked on attack signal problem at the boundary between frames (described below). 上記未来のサブバンドフレームの第1の区分は、「擬似未来」区分と呼ばれた。 The first section of the sub-band frame of the future, was called "pseudo-future" category. 本発明は、未来のサブバンドフレームの最初の8個の区分の各最大値であるピーク値MaxPeakを利用する。 The present invention utilizes the peak value MaxPeak is the maximum value of the first eight sections of future sub-band frames. (3)先願の発明は、固定されたリリース信号基準を用いた。 (3) the prior application of the invention, using a fixed release signal standards. 本発明は可変なリリース信号基準を用いる。 The present invention uses a variable release signal reference. (4)先願の発明は、利得制御すべき各修正ポイントに対して、それらが発見されるたびに修正レベルを計算した。 (4) prior application invention, for each modification point to gain control, was calculated correction level each time they are discovered. 計算された新しい修正レベルはそれぞれ、当該サブバンドフレームの先行するすべての修正レベルに加算された。 Each calculated fix level was were added to all modifications levels preceding the sub-band frames. 本発明は、すべての修正ポイントにマーキングし、まずこれらに単に指標となる修正レベルを付与してそのタイプ(「アタック信号」の立上がりの開始位置であるか、又は「リリース信号」の立下がりの終了位置であるか)を区別する。 The present invention marking all modifications points, first that type by simply applying the fix level as an index to these (whether a rising edge of the start position of the "attack signal", or the falling of the "release signal" distinguish it or) the end position. 次いで、当該サブバンドフレームの望ましい信号レベルが計算される。 Then, desired signal level of the sub-band frames are computed. 最後に、上記望ましい信号レベルに基づいて修正レベルが計算される。 Finally, modification level based on the desired signal level is calculated. (5)本発明は、発話音声における信号強度の自然な遷移(信号強度の緩やかな増大と緩やかな減少を含む。以下、それらを「自然な上昇(ascent)」及び「自然な降下(descent)」と呼ぶ。)をチェックするために特別な基準を組み込み、上記自然な遷移に合わせて修正レベルを調節する。 (5) The present invention includes a natural transition (gradual increase and gradual decrease in the signal intensity of the signal strength in the speech. Hereinafter, they "natural rise (ascent)" and "natural descent (descent) referred to as a ".) embedded special criteria to check and adjust the correction level to suit the natural transition. 先願の発明はこれを行わない。 The prior application of the invention do not do this. (6)先願の発明は、利得制御された現在のサブバンドフレームの信号レベルと利得制御された先行するサブバンドフレームの信号レベルとが大幅に異なるか否かをチェックしない。 (6) prior application of the invention, the signal level of the sub-band frames preceding and signal level and gain control of the current sub-band frames gain control does not check whether different or not significantly. 本発明はこれを実行し、適宜状況を矯正する。 The present invention does this, to correct appropriately situation. (7)本発明は、現在のサブバンドフレームの第1の区分の修正レベルを制限して、先行するサブバンドフレームの過度の減衰を防止する。 (7) The present invention limits the modification level of the first partition of the current subband frame, to prevent excessive attenuation of the preceding sub-band frames. 先願の発明はこれを行わない。 The prior application of the invention do not do this. (8)先願の発明は、利得制御された現在のサブバンドフレームの終端が弱いか否かをチェックすることによるポストエコーの直接制御を行なわない。 (8) prior application of the present invention is not performed directly control the post-echo due to the end of the current sub-band frames gain control checks weak or not. 本発明はこれを実行し、適宜状況を矯正する。 The present invention does this, to correct appropriately situation. 【0070】以下、本発明の実施形態に係る修正関数計算方法の特徴について説明する。 [0070] The following describes features of the correction function calculating method according to an embodiment of the present invention. 修正関数の生成は、A Generation of the correction function, A
TRAC3標準の仕様に準じる。 TRAC3 conform to standard specifications. 入力信号のスペクトル成分である各サブバンドの256個のオーディオサンプル信号は、32個の区分(パーティション)に分割され、そのそれぞれは8個の連続するオーディオサンプル信号でまとめられている。 256 audio sample signals of each sub-band that is a spectral component of the input signal is divided into 32 segments (partition), each of which is gathered up by 8 consecutive audio sample signal. サブバンドフレーム内の任意の区分において、利得制御されることを必要とする修正ポイントとして、アタック信号の立上がりの開始位置(以下、「アタックポイント」と呼ぶ。)か、又はリリース信号の立下がりの終了位置(以下、「リリースポイント」と呼ぶ。)を、その変数を具体化することによって決定することができる。 In any section of the sub-band frames, as a correction point that needs to be gain control, the rise of the start position of the attack signal (hereinafter, referred to as "attack point".), Or the release signal falling end position (hereinafter, referred to as "release point".) can be determined by embodying the variable. 図5は、変数を決定することによるいくつかの修正ポイントの具体化と、修正関数M Figure 5 is a detail of some of the modified point by determining the variable correction function M
F[i][n]の生成とを示したものである。 F [i] shows the generation of [n]. adjust_n adjust_n
um[i]は、サブバンドiのサブバンドフレームの修正ポイントの総数として定義され、この場合は、adjust_n um [i] is defined as the total number of modified points in the sub-band frames of the sub-band i, in this case, Adjust_n
um[i]=4である。 um [i] = 4. 修正位置aloccode[i][j] Modify position aloccode [i] [j]
は、サブバンドiのサブバンドフレームにおけるj番目の修正ポイント(図5の例では、j=0,1,…,adju In the example of the j-th corrected points (Fig. 5 in the sub-band frames of the sub-band i, j = 0,1, ..., adju
st_num[i]−1、すなわち3まで)の区分のインデックス(0,1,…,31)である。 st_num [i] -1, i.e. the index of the section of 3 to) (0,1, ..., 31) is. 修正レベルalevcode Modify level alevcode
[i][j]は、修正位置aloccode[i][j]に対応する修正ポイントの修正の大きさを表す利得係数であり、2のべき乗のべき指数を意味する。 [I] [j] is a gain factor representing the magnitude of the correction position aloccode [i] [j] corresponding to the fix point of the correction means exponent of a power of 2. ATRAC3標準が修正ポイント数adjust_num[i]、修正位置alocco ATRAC3 standard fixes the number of points adjust_num [i], correction position alocco
de[i][j]及び修正レベルalevcode[i][j]に対して割り当てたビット数はそれぞれ、3,5及び4である。 de [i] [j] and modification level alevcode [i], respectively the number of bits allocated with respect to [j], a 3, 5 and 4. 【0071】アタック信号が検出されたとき、それの修正ポイント(アタックポイント)として、信号の振幅が急激に増大する区分の位置をマーキングし、先行する修正ポイントから当該アタックポイントまでの相対的に小さい振幅の部分を増幅する。 [0071] When the attack signal has been detected, as it fixes the point (attack point), then mark the position of the segment at which the amplitude of the signal increases sharply, relatively small from the preceding corrected point to the attack point amplifying a part of the amplitude. それに対して、リリース信号が検出されたとき、それの修正ポイント(リリースポイント)として、信号の振幅が急激に減少した後の、小さい振幅が続く部分の最初の区分の位置をマーキングし、先行する修正ポイントから当該リリースポイントまでの相対的に大きい振幅の部分が減衰される。 In contrast, when the release signal is detected, as it fixes the point (release point), and the marking after the amplitude of the signal is rapidly decreased, the position of the first segment of the portion is small amplitude followed, preceding relatively large amplitude portions of up to the release point is attenuated from the modified point. ATRA ATRA
C3標準によれば、修正レベルalevcode[i][j]はすべて正の整数であり、4の値が「利得制御なし」に対応するように定義されているので、オーディオサンプル信号に実際に適用される修正レベル、すなわち増幅又は減衰の大きさは2 (alevcode[i] [j]−4)である。 According to C3 standard, modification level alevcode [i] [j] are all positive integers, the value of 4 is defined as corresponding to "no gain control" actually applied to an audio sample signal modification level being, namely the magnitude of the amplification or attenuation is 2 (alevcode [i] [j ] -4).
また、2つの異なる修正レベルの間は対数的に遷移する。 Also, during the two different modification level transitions logarithmically. 【0072】例えば、図5を参照すると、最初の修正ポイント(adjust_num[i]=0)は、修正位置aloccode [0072] For example, referring to FIG. 5, the first modification point (adjust_num [i] = 0), the correction position aloccode
[i][0]=4及び修正レベルalevcode[i][0] [I] [0] = 4 and modification level alevcode [i] [0]
=5を有するアタックポイントであり、かつ、この最初の修正ポイントについては、その効果がサブバンドフレームの先頭部分にまで及ぶように修正関数が延長されている。 = 5 is attack point having, and for this first fix point, the effect is the correction function to span up at the beginning of the sub-band frames are extended. 従って、この修正ポイントに対して、第1の区分(本実施形態では、0番目の区分として表記される。) Therefore, with respect to this correction point, the first section (in this embodiment, are denoted as 0-th segment.)
から第4の区分(本実施形態では、3番目の区分として表記される。)までの振幅が、2倍だけ増幅される。 From (in this embodiment,., Denoted as the third segment) fourth segment amplitude up is amplified by a factor of two. 同様に、第2の修正ポイント(adjust_num[i]=1) Similarly, the second modification point (adjust_num [i] = 1)
は、修正位置aloccode[i][1]=13及び修正レベルalevcode[i][1]=2を有するリリースポイントであり、この修正レベルは、先行する第1の修正ポイントと当該第2の修正ポイントとの間の区分に作用するので、この修正ポイントに対して、第6の区分から第13 Is a release point with modified positions aloccode [i] [1] = 13 and modification level alevcode [i] [1] = 2, this modification level, the first modification point and the second correction preceding since acting partitioned between points, relative to the fix point, first the section of the sixth 13
の区分までの振幅が、2 −2倍だけ増幅、すなわち4分の1に減衰される。 Amplitude until the indicator, only 2 -2 times amplification, i.e. is attenuated by a factor of four. また、第4の修正ポイント(adjust The fourth modified point (adjust
_num[i]=3)の後の最後の修正ポイントでは、修正レベルを1にする必要がある。 The last modification point after _num [i] = 3), it is necessary to make modification level to 1. 1のレベルにする理由は、図4で説明されたように、次のサブバンドフレームの修正関数MF[i][n+1]との結合を容易にすることにあり、これによって、修正関数の連続性は、修正関数MF[i][n]の全体に修正関数MF[i][n The reason for the 1 level, as described in FIG. 4, there to facilitate the binding of the correction function MF of the next sub-band frames [i] [n + 1], thereby, continuous correction function sex, correction function MF [i] modifications to the overall [n] function MF [i] [n
+1]に係る第1の区分の修正関数値(すなわち修正レベル)を乗算することによって容易に達成することができる。 It can be easily achieved by multiplying the first correction function values ​​of classification according to the +1] (i.e. modification level). 【0073】従って、修正関数計算部14bは、アタック信号の開始位置を含む区分と、当該アタック信号の開始位置を含む区分に先行する修正ポイントとの間の各区分に係る修正関数値を、当該アタック信号の開始位置を含む区分と、上記先行する修正ポイントとの間における最大のピークの絶対値InterModMaxPeak[i][j] [0073] Thus, the correction function calculating unit 14b, section and including the start position of the attack signal, a correction function value according to the division between the modified point preceding the segment containing the start position of the attack signal, the section and including the start position of the attack signal, the absolute value InterModMaxPeak of the maximum peak in between the corrected points above prior [i] [j]
が、所定の目標ピーク値CurrFramePeak[i]に等しくなるように計算し、また、リリース信号の開始位置を含む区分と、当該リリース信号の開始位置を含む区分に先行する修正ポイントとの間の各区分に係る修正関数値を、当該リリース信号の開始位置を含む区分と、上記先行する修正ポイントとの間における最大のピークの絶対値InterModMaxPeak[i][j]が、上記目標ピーク値C But equal so calculated to a predetermined target peak value CurrFramePeak [i], also section and including the start position of the release signal, each between Fixed point preceding the segment containing the start position of the release signal a correction function value according to the classification, classification and including the start position of the release signal, the absolute value InterModMaxPeak of the maximum peak in between the corrected points above prior [i] [j] is, the target peak value C
urrFramePeak[i]に等しくなるように計算することを特徴とする。 And calculating to be equal to urrFramePeak [i]. 以上のような修正関数値を計算する処理は、後述のフローチャートでは、図12のステップS2 The process of calculating a correction function value as described above, in the flowchart described below, the step S2 of FIG. 12
3の修正レベルalevcode計算処理で実行される。 It is performed in the third modification levels alevcode calculation process. 【0074】オーディオ符号化はサブバンドフレーム毎の基準で実行されるので、サブバンドフレームの先頭部分で発生する信号のアタック信号は、利得制御が先行するサブバンドフレームに適用されるときのみ、取り扱うことができる。 [0074] Since the audio encoding is performed at the reference for each sub-band frames, attack signal of the signal generated by the head portion of the sub-band frames, only when the gain control is applied to the sub-band frames preceding handles be able to. これは、「境界アタック信号」問題として知られ、「現在の」サブバンドフレームが処理されているとき「未来の」サブバンドフレームの第1の区分におけるアタック信号に対して測定が実行されるように、 This is known as "boundary attack signal" problems, as the measurement for the "Current", "Future" when the sub-band frames are processed first attack signal in the section of the sub-band frames is performed to,
余分なサブバンドフレームのバッファリングを必要とする。 It requires buffering extra sub-band frames. 本発明は、リリースのより効果的な検出のために、 The present invention is, for more effective detection of release,
未来のサブバンドフレームの最初の8個の区分を利用する。 To use the first of the eight sections of the future of the sub-band frame. アタック信号及びリリース信号の検出は、サブバンドフレームの最初(0番目)の区分から最後(31番目)の区分まで実行される。 Detection of attack signal and the release signal is carried from the section of the first (0-th) sub-band frame to the classification of the last (31 th). 【0075】ある区分においてアタック信号の立上がりの開始位置を検出するために、当該区分内のオーディオサンプル信号のピークの絶対値である区分のピーク値Ma [0075] in order to detect the rising edge of the start position of the attack signal in the segment, the peak value Ma of the segment is the absolute value of the peak of the audio sample signals in this category
xPeakは、それに先行する8個の区分のピーク値MaxPeak xPeak, the peak value of the eight segments that preceded it MaxPeak
のそれぞれと比較される。 It is the compared to each. 当該区分のピーク値MaxPeak The peak value of the division MaxPeak
は、先行する8個の区分の最大のピーク値MaxPeakを予め決められたしきい値の比(本実施形態では2)だけ上回るときのみ、アタック信号として分類される。 The ratio of the preceding eight sections maximum predetermined threshold peak value MaxPeak of (in this embodiment 2) only when the above only, classified as attack signals. 当該区分がサブバンドフレームの先頭部分の近くでありかつこれに先行して存在する区分が8個に満たないときは、現在のサブバンドフレームに先行し、すでに利得制御されたサブバンドフレームのピークの絶対値(ピーク値Prev When the indicator where the indicator exists ahead near a is and to the beginning of the sub-band frames is less than eight, prior to the current sub-band frames, already gain control peak of sub-band frames the absolute value of (peak value Prev
FramePeak[i])を考慮する必要がある。 FramePeak it is necessary to take into account the [i]). 比の要件が満たされていれば、先行するアタックポイントからの区分の分離距離(分離区分数)が十分に大きい場合にのみ、当該区分は有効なアタックポイントであるものとされる。 If satisfied that the ratio requirements, preceding separation distance segment from attack point only if (separation segment number) is sufficiently large, the segment is assumed to be valid attack point. これは、非常に微細なスケールで利得制御する利益よりも、量子化のためにより多くのビットを残しておく利益のほうが重要なためである。 This is much than profit to gain control in a fine scale, because many bits is more important benefits to leave by for quantization. 本実施形態では、1 In the present embodiment, 1
区分の分離距離を採用している。 It has adopted the separation distance of the division. 【0076】一般にアタック信号に後続して存在するリリース信号を検出するために、現在の区分の前の最後の修正ポイントと現在の区分との間の最大のピーク値MaxP [0076] Generally in order to detect a release signal present in following the attack signal, the maximum peak value during the last modification point before the current segment and the current segment MaxP
eakであるInterModMaxPeak[i][j]が、現在の区分以後の8個の区分の最大のピーク値MaxPeakをしきい値の比だけ超過している必要がある。 A eak InterModMaxPeak [i] [j] is, it is necessary that the maximum peak value MaxPeak eight segments of the current segment since exceeded only specific threshold. しきい値は、先行する修正ポイントがアタックポイントであるかリリースポイントであるかに依存して変化する。 Threshold, the preceding correction point changes depending on whether the release point or is the attack point. 先行する修正ポイントがアタックポイントであれば、より大きいしきい値(本実施形態では、減衰係数attn_ftr=4)が使用され、リリースポイントであれば、より小さいしきい値(本実施形態では、減衰係数attn_ftr=3)が使用される。 If the preceding fix point attack point greater than the threshold value (in this embodiment, the damping coefficient attn_ftr = 4) is used, if the release point, smaller than the threshold value (in this embodiment, the attenuation factor attn_ftr = 3) is used. 図6が示すように、リリース信号は、アタック信号とは異なり、最初により急激な勾配で発生し、その後すぐに、わずかにより緩やかなレートになる傾向がある。 As shown in FIG. 6, the release signal is different from attack signal, first by generated at sharp slope, then immediately, they tend to be gentle rate slightly.
可変なしきい値は、リリース信号を、異なるレベルの利得制御を適用可能な複数の領域へとより効果的に分割(セグメント化)できる。 Variable threshold, the release signal can different levels of more effectively divided the gain control to the applicable plurality of regions (segmented). 結果として、ポストエコーはより良好に抑圧される。 As a result, the post-echo is better suppressed. 【0077】すべてのアタックポイントに対して、その指標(又は、マーカー)として1の値が修正レベルalev [0077] For all of the attack point, the index (or marker) value of 1 as the correction level alev
code[i][j]に割り当てられる。 Assigned to the code [i] [j]. すべてのリリースポイントに関して、それに先行するピーク値InterModMa For all of the release point, peak value preceded it InterModMa
xPeak[i][j]の大きさを示す負の値が、修正レベルalevcode[i][j]に指標として割り当てられる。 xpeak [i] a negative value indicating the size of [j] is assigned as an indication to modify the level alevcode [i] [j].
ここで割り当てられた修正レベルalevcode[i][j] Here assigned modification level alevcode [i] [j]
は、実際に利得制御を行うための値ではない。 Is not a value for actually performing gain control. 【0078】最後(31番目)の区分が処理された後で、先に発見されたすべての修正レベルに基づいて、目標ピーク値CurrFramePeak[i]が計算される。 [0078] After the classification of the last (31 th) is processed, based on all modification level that have been previously, the target peak value CurrFramePeak [i] is computed. これは、現在のフレームの修正ポイント間のすべての信号領域が増幅され、又は減衰される目標となる「望ましい」 This is all the signal area between the modification point of the current frame is amplified, or the attenuated the target "desirable"
信号レベルである。 Is the signal level. 【0079】実際の修正レベルが計算される前に、信号は、「自然な降下」について、すなわち信号強度が発話音声に特有の自然な減衰(フェージング)の徴候を有するか否かについてチェックされる。 [0079] before the actual modification level is computed, the signal is checked whether with signs for "natural drop", i.e. natural attenuation characteristic signal strength to speech (fading) . 先行するサブバンドフレームがアタックの徴候をほとんど示さない、もしくは全く示さず、かつ現在のサブバンドフレームの修正ポイントがリリースポイントのみで構成されているときは、これは「自然な降下」として分類される。 Preceding sub-band frames are almost no signs of attack, or no not shown, and when the modified point of the current sub-band frames consists of only release point, which is classified as "natural drop" that. 有効な「自然な降下」については、すべてのリリースポイントが除去される。 Valid for "natural drop", all release point is removed. 【0080】次に、先に割り当てられた「指標となる」 [0080] Next, assigned to the earlier "serves as an indicator"
修正レベルに対して、実際の修正レベルalevcode[i] To the correction level, the actual modification level alevcode [i]
[j]が、目標ピーク値CurrFramePeak[i]を用いてすべての修正ポイントについて計算される。 [J] is calculated for all modifications point using the target peak value CurrFramePeak [i]. 従って、修正関数計算部14bは、オーディオ信号に基づいて、急激な音の立上がりを含む信号の部分であるアタック信号の開始位置を含む区分を修正ポイントとして識別し、オーディオ信号に基づいて、急激な音の立下がりを含む信号の部分であるリリース信号の終了位置を含む区分を修正ポイントとして識別し、オーディオ信号に基づいて、 Thus, the correction function calculating section 14b based on the audio signal to identify the fraction containing the start position of a portion of the signal containing the rise of sudden sound attack signal as a correction point based on the audio signal, a sudden It identifies the fraction containing the end position of the release signal is a portion of the signal containing the trailing edge of the sound as the correction point based on the audio signal,
修正関数に従って利得制御したときに所望される、処理すべき現在のフレームにおける目標ピーク値を計算し、 Desired when gain control according to a modified function, calculates the target peak value in the current frame to be processed,
識別されたアタック信号の開始位置を含む区分と、識別されたリリース信号の終了位置を含む区分と、計算された目標ピーク値とに基づいて、当該現在のフレームの各区分に係る修正関数値からなる修正関数を計算することを特徴とする。 A fraction containing the start position of the identified attack signal, and a fraction containing the end position of the identified release signal, based on the calculated target peak value, the correction function value according to each segment of the current frame and calculating a composed correction function. 【0081】信号が、発話音声に特有の「自然な上昇」 [0081] signal is, "natural increase" specific to speech
を示すとき、すなわち信号強度が次第に増大するとき、 When shown, i.e. when the signal strength increases gradually,
アタックポイントの修正レベルが調節される。 Attack point of the modification level is adjusted. 図7 Figure 7
(a)が示すように、信号の振幅がゆっくりと増大しているときは、信号がピークに到達する区分は先行するアタックポイントから十分に分離されている。 (A) shows, when the amplitude of the signal is increasing slowly, segment signal reaches the peak is sufficiently separated from the attack point preceding. このような発話音声に特有の特徴を有する信号に対して計算された修正レベル(増幅)をそのまま適用すると、図7(b) If such speech to be calculated for the signal having the characteristic feature the corrected level (amplification) is directly applied, and FIG. 7 (b)
のようにアーティファクトを発生させることがある。 It is possible to generate artifacts like. 従って、有効な「自然な上昇」が存在するならば、本実施形態の処理では修正レベルalevcode[i][j]を1だけ減少する(図7(c))。 Thus, if a valid "natural increase" exists, reducing the processing of this embodiment fixes the level alevcode [i] [j] by 1 (FIG. 7 (c)). 本実施形態で、アタック信号が「自然な上昇」として分類されるためには、修正位置aloccode[i][j]と、その後のピーク位置InterM In this embodiment, in order to attack signal is classified as "natural increase" includes a correction position aloccode [i] [j], then the peak position InterM
odMaxLoc[i][j+1]との間に5個の区分だけの分離距離が必要である。 odMaxLoc [i] is required separation distance only five division between the [j + 1]. 【0082】現在のサブバンドフレームは、MDCTのために、先行するサブバンドフレーム及び後続するサブバンドフレームとそれぞれ縦続接続されるので、目標ピーク値CurrFramePeak[i]で示すことができる利得制御された現在のサブバンドフレームの信号強度は、ピーク値PrevFramePeak[i]で示される利得制御された先行するサブバンドフレームの信号強度と同等である必要がある。 [0082] Current sub-band frames, for the MDCT, since each subband frame sub-band frames and subsequent preceding cascaded were gain control can be shown by the target peak value CurrFramePeak [i] the signal strength of the current subband frame, needs to be equal to the signal strength of the sub-band frames preceding that is gain control indicated by the peak value PrevFramePeak [i]. 一方の値が他方の値よりはるかに大きい場合は、現在のサブバンドフレームの第1の区分に特別な修正ポイントが導入される。 If one value is much larger than the other values, special modifications points in the first segment of the current subband frame is introduced. 例外的に、両方のサブバンドフレームに利得制御が実行されないときは上述の修正は実行されず、このような場合は、2つのサブバンドフレームの信号レベルの差分が「自然」であるとされる。 Exceptionally, the above-mentioned modified when the gain control in both the sub-band frames is not performed is not performed, in such a case, the difference of the signal levels of the two sub-band frames are to be "natural" . 【0083】各サブバンドフレームに対する修正関数の第1の区分に係る修正レベル(図4では修正関数値MF [0083] The first modification level of the section (in FIG. 4 correction function value MF of the correction function for each sub-band frames
[i][n][0]で示されている。 Has been shown in [i] [n] [0]. )は、先行するサブバンドフレーム全体にも及ぶので、これは先行するサブバンドフレームへの過度の減衰を引き起こすものであってはならない。 ), Since prior extends to the entire sub-band frames, this must not cause excessive attenuation to the sub-band frames preceding. ゆえに、基準に適合させるために他の修正レベルに適用される通常のクリッピング測定に加えて、第1の区分の修正レベルは、先行するサブバンドフレームのすべてのアタックポイントにおける最小の修正レベルから導出されるさらなるクリッピングを受ける。 Thus, in addition to the normal clipping measurement applied to other modification level in order to conform to the standards, modification level of the first section is derived from a minimum modification level in all preceding attack point of the sub-band frames undergo further clipping to be. 【0084】各修正ポイントに対する修正レベルalevco [0084] fix level alevco for each correction point
de[i][j]は、その修正ポイントの修正位置alocco de [i] [j], the correction position of the correction point alocco
de[i][j]と先行する修正ポイントの修正位置aloc de [i] [j] and fix the position of the preceding modified point aloc
code[i][j−1]との間の信号のみを修正するので、最後の修正ポイントよりも時間的に後の信号は、利得制御を要する場合であっても修正されないまま利得制御部15−1乃至15−4から出力されてしまうことが考えられる(図8(a),(b))。 Since only modify the signals between the code [i] [j-1], the last than modification points temporally subsequent signal, the gain control unit 15 without being corrected even when it takes a gain control it is conceivable that would be outputted from -1 to 15-4 (FIG. 8 (a), (b)). 実際に、これは、 In fact, this is,
ポストエコーの非常に一般的な原因である。 It is a very common cause of post-echo. この問題を回避するために、最後の修正ポイント以後のすべての区分における最大のピーク値MaxPeakが、目標ピーク値Cur To avoid this problem, the maximum peak value MaxPeak in all segments of the last modification point after the target peak value Cur
rFramePeak[i]の大きさに照らしてチェックされ、著しい差が存在する場合は、図8(c)のように最後の区分に新しい修正ポイントが導入される。 Are checked against the size of the rFramePeak [i], if a significant difference exists, a new modification point is introduced at the end of the segment as shown in FIG. 8 (c). 【0085】以下、本発明の実施形態に係る修正関数計算方法を、ATRAC3の利得制御方法を実施例として用いて説明するが、本方法は、他の利得制御方法に係る利得制御処理を実行する符号化器にも一般化することができる。 [0085] Hereinafter, a correction function calculating method according to an embodiment of the present invention will be described with reference by way of example the gain control method ATRAC3, the method performs the gain control process according to another gain control method it can be generalized to the encoder. 図9乃至図18は、図2の修正関数計算部14 9 through 18, the modified 2 function calculating unit 14
bによって実行される修正関数計算処理のフローチャートを示している。 It shows a flowchart of the correction function calculation process performed by b. 【0086】図9のステップS1において、まず、バッファメモリ14aから、次に処理すべき処理対象のサブバンドフレームの区分とそれに後続するサブバンドフレームの最初の8個の区分とを含む2つのサブバンドフレームの区分のサンプル信号を読み出して、すでに利得制御された先行するサブバンドフレームのピーク値PrevFr [0086] In step S1 of FIG. 9, first, from the buffer memory 14a, then the first two sub including the eight sections of the compartments and sub-band frames subsequent to that of sub-band frames to be processed to be processed reading the sample signal of the section of the band frame, the peak value of the sub-band frames preceding that already gain control PrevFr
amePeak[i]とともに、上記処理対象のサブバンドフレームのための修正関数を計算するために用いるサブバンドフレームのデータとする。 With amePeak [i], the data of the sub-band frames used to calculate the correction function for the sub-band frames of said processed. なお、バッファメモリ1 It should be noted that the buffer memory 1
4aには、フィルタバンク13−1乃至13−4から符号化すべきオーディオサンプル信号が順次時系列で入力されて格納されているものとする。 The 4a, it is assumed that the audio sample signal to be encoded from the filter bank 13-1 through 13-4 are stored is entered in sequential chronological order. 次いで、ステップS Next, step S
2において、メインループを開始させるために、iをサブバンドのインデックスとして初期化する。 In 2, in order to start the main loop, it initializes the i as an index of the sub-band. インデックスiは図13のステップS32でインクリメントされ、 Index i is incremented in step S32 in FIG. 13,
処理は、ステップS33で決定されるように、インデックスiがサブバンド数max_bandを超過するまで反復される。 Process, as determined at step S33, is repeated until the index i exceeds the number of subbands Max_band. サブバンド数max_bandは、オーディオエンコーダ2 Number of sub-bands max_band, the audio encoder 2
が利得制御を適用しようとするサブバンドi(i=0, There subband i (i = 0 to be applied to the gain control,
1,2,3)の最大の数(すなわち3)を示す。 Indicates the maximum number (i.e. 3) 1,2,3). 【0087】ステップS3は初期化処理である。 [0087] Step S3 is the initialization process. 詳しくは、図14のサブルーチンを参照すると、まずステップS41において、先行するサブバンドフレームの修正ポイント数prev_adjust_num[i]を決定するための条件をチェックする。 For details, referring to the subroutine of FIG. 14, first, in step S41, checks the condition for determining prior modification points of the sub-band frames that prev_adjust_num [i]. これは、同一のサブバンドiの先行するサブバンドフレームにおいて、修正が存在したか否かの標識である。 This is the sub-band frames preceding the same sub-band i, is whether the labeled modified exists. 先行するサブバンドフレームの修正ポイント数adjust_num[i]が0であるか、もしくはただ1 Or prior modification points of the sub-band frames that adjust_num [i] is 0, or only one
つの修正ポイントが存在しかつこれが先行するサブバンドフレームのまさに先頭部分で発生しているときは(本実施形態では、サブバンドフレームの最初の3つの区分のうちのいずれか;aloccode[i][0]<3)、ステップS42において、これは0に設定される。 One modification point exists and when this occurs at the very beginning of the sub-band frames preceding (in the present embodiment, any of the first three sections of the sub-band frames; aloccode [i] [ 0] <3), at step S42, which is set to 0. 前述の条件が満たされていない場合は、修正ポイント数prev_adj If the above conditions are not met, the correction point number prev_adj
ust_num[i]は、ステップS43で、先行するサブバンドフレームの修正ポイント数adjust_num[i]に設定される。 ust_num [i] is the step S43, is set in the prior modification points of the sub-band frames that adjust_num [i]. 【0088】ステップS44は、修正位置aloccode [0088] step S44, the correction position aloccode
[i][k]及び修正レベルalevcode[i][k]を初期化する。 Initializing a [i] [k] and modification level alevcode [i] [k]. 本発明は、ATRAC3標準に許容される最大値(7個)を超過した中間の修正ポイントを発生させることがあるので、これらの中間のデータに記憶装置を割り当てることが重要である。 The present invention, since it is possible to generate an intermediate correction points that have exceeded the maximum allowed in the ATRAC3 standards (7), to assign a storage device in these intermediate data is important. 本実施形態の修正関数計算処理では、20個の中間の修正ポイントが許容されていて、同一の修正レベルを割り当てられている互いに隣接した修正ポイントの統合(ステップS24)の後でもなお、標準よりも多く発生された中間の修正ポイントが存在するときは、ステップS25で、検出された中間の修正ポイントを削減して、ATRAC3標準に従う最終的な修正ポイントのデータとする。 In the correction function calculating process of the present embodiment, 20 pieces of the intermediate correction points is allowed, still after integration correction points adjacent to each other that are assigned the same fix level of (step S24), and from the standard when many generated intermediate correction point also exists, in step S25, to reduce the detected intermediate correction point, as the final fix point data according to ATRAC3 standards. 【0089】ステップS45において、入力信号のスペクトル成分のうちの1つであって、256個のオーディオサンプル信号にてなるサブバンドiのサブバンドフレームから、0≦k<40のkに対して(k×8)番目から始まる8個の連続するオーディオサンプル信号における最大の絶対値として定義されるピーク値MaxPeak [0089] In step S45, be one of the spectral components of the input signal, the sub-band frames of the sub-band i made at 256 audio sample signals, for k of 0 ≦ k <40 ( peak value is defined as the maximum absolute value in the k × 8) th 8 consecutive audio sample signal starting from MaxPeak
[i][k]を発生させる。 [I] to generate a [k]. 31<k<40であれば、 If the 31 <k <40,
ピーク値MaxPeak[i][k]は、未来のサブバンドフレームにおける、(k−32)×8番目から始まる8個の連続するオーディオサンプル信号から取得される。 Peak value MaxPeak [i] [k] is the future of sub-band frames are obtained from 8 consecutive audio sample signal starting from (k-32) 8 th ×. このように分割された「8個の連続するオーディオサンプル信号」は、サブバンドフレームの「k番目の区分」を構成し、従って、ピーク値MaxPeak[i][k]を区分のピーク値と呼ぶ。 Thus divided "8 consecutive audio sample signal" constitutes the "k th segment" of the sub-band frames, therefore, referred to as a peak value of dividing the peak value MaxPeak [i] [k] . 【0090】ステップS46は、3つの変数をリセットする。 [0090] step S46 resets the three variables. 修正ポイント数adjust_num[i]は、サブバンドiのサブバンドフレームで発見される修正ポイントの総数である。 Fixed points adjust_num [i] is the total number of modifications points that are found in the sub-band frames of the sub-band i. ピーク値InterModMaxPeak[i][k]は、 Peak value InterModMaxPeak [i] [k] is,
ステップS5乃至S19のループにおいて各区分を順次に調べている間は、現在の区分と(k−1)番目の修正ポイントとの間の期間における最大のピーク値MaxPeak While it is sequentially examine each section in the loop of steps S5 to S19, the maximum peak value in the period between the current segment and (k-1) -th modification point MaxPeak
として定義され、また、上記ループが終了した後の目標ピーク値CurrFramePeak計算処理(ステップS22)では、互いに隣接する各修正ポイント間の最大のピーク値 Is defined as, also, the target peak value after the loop has been completed CurrFramePeak calculation processing in (step S22), and the maximum of the peak values ​​between the modified points adjacent to each other
MaxPeakとみなされる。 It is regarded as MaxPeak. ピーク位置InterModMaxLoc Peak position InterModMaxLoc
[i][k]は、上記最大のピーク値InterModMaxPeak [I] [k] is the maximum peak value InterModMaxPeak
[i][k]が位置している区分のインデックスである。 [I] [k] is the index of the segments are located. 【0091】再び図9を参照し、ステップS4は、フローの内部ループを開始させる。 [0091] Referring again to FIG. 9, step S4 starts the internal loop flow. このループは、「区分のインデックス」jで反復される。 This loop is repeated in the "index of category" j. インデックスjは図1 Index j Figure 1
0のステップS14において1だけインクリメントされ、ステップS15においてインデックスjが32に到達すると、上記内部ループを終了して図11のステップS20に進む。 In step S14 0 is incremented by 1, the index j reaches 32 in step S15, the process proceeds to step S20 of FIG. 11 ends the inner loop. 【0092】内部ループにおいて、ステップS5で、ピーク値InterModMaxPeak[i][adjust_num[i]]が最新の区分のピーク値MaxPeak[i][j]よりも小さいときは、ステップS6で、上記最新の区分のピーク値 [0092] In the inner loop, in step S5, when the peak value InterModMaxPeak [i] [adjust_num [i]] is a peak value of the latest classification MaxPeak [i] [j] is smaller than in step S6, the latest the peak value of the division
MaxPeak[i][j]及びその位置する区分jに従って、ピーク値InterModMaxPeak[i][adjust_num MaxPeak [i] [j] and in accordance with divisions j to its location, the peak value InterModMaxPeak [i] [adjust_num
[i]]及びピーク位置InterModMaxLoc[i][adjust [I]] and the peak position InterModMaxLoc [i] [adjust
_num[i]]の値を更新してステップS7に進む。 It proceeds to step S7 to update the value of _num [i]]. そうでないときは、そのままステップS7に進む。 Otherwise, the process proceeds to step S7. 【0093】ステップS7は、ステップS8及びステップS9において減衰係数attn_ftrの値を決定するための条件をチェックする。 [0093] Step S7 checks the conditions for determining the value of the attenuation coefficient attn_ftr in step S8 and step S9. この条件は基本的に、先行する修正ポイントがアタックポイントであるとき(alevcode When this condition is basically preceding corrected point is attack point (Alevcode
[i][adjust_num[i]−1]>0)、後のリリース信号の基準(図11のステップS16)によって、信号レベルが大きく減衰する(本実施形態では、4分の1より小さくなる。)より急激なリリース信号が発見されるということを予期して、ステップS9で減衰係数attn_f By [i] [adjust_num [i] -1]> 0), after the release signal criteria (step S16 in FIG. 11), the signal level is greatly attenuated (in this embodiment, smaller than a quarter. ) expect that more rapid release signal is found, the attenuation coefficient attn_f in step S9
trを4に設定するものである。 It is to set the tr to 4. 先行する修正ポイントがすでにリリースポイントであるとき、又は少なくともアタックポイントではないとき(alevcode[i][adjust When the preceding fix point is already release point, or when at least not attack point (alevcode [i] [adjust
_num[i]−1]≦0)、ステップS8で減衰係数attn _num [i] -1] ≦ 0), the damping coefficient attn in step S8
_ftrを3に設定することによって、後続のリリースの修正ポイントは、より緩和された基準(本実施形態では、 By setting the _ftr to 3, modified point subsequent release in a more relaxed criteria (in this embodiment,
3分の1より小さくなる。 3 minutes smaller than one. )によってそれの変数を決定して具体化される必要がある。 ) By need to be embodied to determine its variables. ステップS7の背景となる原理は、時間が経つにつれて次第にテーパ状に小さくなるアタック信号を示す図6に説明されている。 Principle as a background of the step S7 is described in Figure 6 showing a progressively smaller attack signal in a tapered shape over time. 減衰係数attn_ftrの異なる値は、変数を決定することによって複数のリリースポイントを具体化することをより効果的に促進し、従ってポストエコーの制御が必要と思われる場合には、異なるレベルの増幅を適用することを可能にする。 Different values ​​of the damping coefficient attn_ftr is to more effectively promote be embodied multiple release points by determining a variable, when the control of the post-echo is deemed necessary, therefore, a different level of amplification It makes it possible to apply. 【0094】減衰係数attn_ftrが決定された後で、修正関数計算部14bは、図10のステップS10のアタック信号の基準を満足することができるか否かをチェックする。 [0094] After the attenuation coefficient attn_ftr is determined, the correction function calculating unit 14b checks whether it is possible to satisfy the criteria of the attack signal in step S10 in FIG. 10. ここで、j+1番目の区分のピーク値MaxPeak Here, the peak value of the j + 1 th segment MaxPeak
[i][j+1]が、j−7≦k≦jであるk番目の区分のピーク値MaxPeak[i][k]の2倍以上であるか否かが判断される。 [I] [j + 1] is, whether or not j-7 ≦ k ≦ j a is k-th peak value MaxPeak [i] of the segment [k] 2 times or more is determined. ただし、区分のインデックスkの下限が0より小さいとき(すなわち、j≦7のとき)、区分のピーク値MaxPeak[i][k]は、サブバンドiの先行するサブバンドフレームの区分のピーク値MaxPeak However, when the lower limit of the index k of segment is smaller than 0 (i.e., when j ≦ 7), the peak value MaxPeak segment [i] [k] is the peak value of the segment of sub-band frames preceding subband i MaxPeak
[i][k]ではなくて、サブバンドiのすでに利得制御された先行するサブバンドフレームのピークの絶対値として定義されるピーク値PrevFramePeak[i](ステップS31を参照)に置換されるということを注意する。 [I] rather than [k], that is substituted already peak value is defined as the absolute value of the peak of the sub-band frames preceding that is gain control of the sub-band i PrevFramePeak [i] (see step S31) Note that. 【0095】ステップS10の条件を満足できるならば、現在の区分は潜在的な修正ポイントである。 [0095] If it satisfies the condition of step S10, the current segment is a potential modification points. しかしながら、ビット数を節約するため、ステップS11はさらに条件を課して、新しい修正ポイントがその前にあるアタックポイントの区分(修正ポイントがアタックポイントであるとき。)から十分な距離を隔てて存在することを必要とする。 However, in order to conserve the number of bits, imposes step S11 further conditions, classification of attack point of fix point is in front of it (when corrected point is attack point.) At a sufficient distance from the present It needs to be. 本実施形態は、1区分の分離を指示している。 This embodiment is indicated the separation of a section. この分離が存在しないときは、次の区分が修正ポイントであるか否かを決定するために、ステップS1 When this separation is not present, in order to determine whether the next segment is the correcting point, step S1
4に進む。 Proceed to 4. 【0096】ステップS10及びS11の2つの基準が満たされると、新しい修正ポイントであるj番目の区分をアタックポイントとしてマーキングするために、ステップS12で修正係数expoが1に設定される。 [0096] When the two reference steps S10 and S11 are satisfied, for marking j-th segment is fix point as attack point, the correction coefficient expo in step S12 is set to 1. ステップS13では、さまざまな変数を更新する。 In the step S13, to update a variety of variables. すなわち、修正レベルalevcode[i][adjust_num[i]]を上記修正係数expoに設定し、修正位置aloccode[i][adjust That is, modification level alevcode [i] [adjust_num [i]] was set in the correction factor expo, correction position aloccode [i] [adjust
_num[i]]を区分のインデックスjに設定し、修正ポイント数adjust_num[i]を1だけインクリメントする。 Set _num [i]] in the index j of the division, is incremented by one correction point number adjust_num [i]. さらに、上記インクリメントされた修正ポイント値 Furthermore, the incremented modified point value
adjust_num[i]に対するピーク値InterModMaxPeak Peak value for the adjust_num [i] InterModMaxPeak
[i][adjust_num[i]]を、区分のピーク値MaxPea [I] the [adjust_num [i]], the peak value of the division MaxPea
k[i][j+1]に設定し、かつ、上記ピーク値InterM k [i] is set to [j + 1], and the peak value InterM
odMaxPeak[i][adjust_num[i]]のピーク位置Int odMaxPeak [i] [adjust_num [i]] of the peak position Int
erModMaxLoc[i][adjust_num[i]]をj+1に設定する。 The erModMaxLoc [i] [adjust_num [i]] is set to j + 1. ただし、このステップS13で設定される修正レベルalevcode[i][j]は単なるマーカーであり、 However, modification level alevcode set in step S13 [i] [j] is merely a marker,
実際に信号に印加される増幅ではない点を注意しておく。 It is noted no point in the amplification applied to the signal actually. 【0097】従って、ステップS10乃至ステップS1 [0097] Accordingly, steps S10 to step S1
3に係るアタック信号の開始位置を含む区分を識別する処理では、修正関数計算部14bは、処理すべき現在の区分に続く次の区分のピークの絶対値と、当該現在の区分以前の予め決められた数(8個)の区分に係る各ピークの絶対値との比に基づいて、当該現在の区分がアタック信号の開始位置を含むか否かを決定し、当該現在の区分が上記アタック信号の開始位置を含むと決定されたときは、アタック信号の開始位置を含むことを示す所定の第1の値(すなわち、1)を当該現在の区分に割り当てることを特徴とする。 In the process of identifying the segment containing the start position of the attack signal according to the 3, the correction function calculating unit 14b, and the absolute value of the peak of the next segment following the current segment to be processed, predetermined previous the current segment was based on the ratio between the absolute values ​​of each peak of the division number (8), the current segment is to determine whether to include the start position of the attack signal, the current segment is the attack signal when to include the start position determination, a predetermined first value indicating that it contains the start position of the attack signal (i.e., 1) is characterized in that assigned to the current segment. 【0098】ステップS10のアタック信号の基準を満たすことができないとき、フローはステップS16のリリース信号の基準に進む。 [0098] When it is not possible to meet the criteria of the attack signal in step S10, the flow proceeds to reference the release signal in step S16. ここでは、j≦k≦j+7のkに対して、上記減衰係数attn_ftrを乗算された区分のピーク値MaxPeak[i][k]が、先行する修正ポイントと現在の区分との間のピーク値InterModMaxPeak[i] Here, j ≦ k ≦ j + against 7 of k, the peak value InterModMaxPeak between the peak value of the division multiplied with the attenuation coefficient attn_ftr MaxPeak [i] [k] is corrected point preceding the current segment [i]
[adjust_num[i]]よりも小さいか否かを判断する。 [Adjust_num [i]] determines whether less than.
ただし、k>31であれば、使用される区分のピーク値 However, if k> 31, the peak value of the classification to be used
MaxPeak[i][k]は、ステップS45で定義された未来のサブバンドフレームの区分から導出されることを注意する。 MaxPeak [i] [k] is, to note that it is derived from the division of the sub-band frame of the future, which is defined in step S45. ステップS16の条件が満たされるならば、 If the condition of step S16 is satisfied,
ステップS17に進み、そうでないときは、次の区分が修正ポイントであるか否かを決定するために、ステップS14に進む。 The process proceeds to step S17, and if not, to determine whether the next segment is the correcting point, the process proceeds to step S14. 【0099】ステップS17で、ピーク値InterModMaxP [0099] In the step S17, the peak value InterModMaxP
eak[i][adjust_num[i]]の大きさに従って修正係数expoの値を設定する。 eak [i] to set the value of the correction coefficient expo according to the size of the [adjust_num [i]]. 当該ピーク値InterModMaxPea The peak value InterModMaxPea
k[i][adjust_num[i]]が高いほど、リリースポイントに先行する大きな信号の部分がより大きく減衰されるように、修正係数expoは負の数として小さくなる。 k [i] [adjust_num [i]] higher, as part of a larger signal preceding the release point is attenuated greater, the correction factor expo decreases as a negative number.
本実施形態では、16ビット(−32768乃至327 In the present embodiment, 16-bit (-32768 to 327
67)で表された信号強度に対して、ピーク値InterMod Relative signal strength represented by 67), the peak value InterMod
MaxPeak[i][adjust_num[i]]の大きさが400 MaxPeak [i] the size of the [adjust_num [i]] 400
0未満のとき、修正係数expoは0に設定され、ピーク値 When less than 0, the correction factor expo is set to 0, the peak value
InterModMaxPeak[i][adjust_num[i]]の大きさが4000以上20000未満のとき、修正係数expoは−1に設定され、ピーク値InterModMaxPeak[i][adj InterModMaxPeak [i] [adjust_num [i]] when the size is less than 4000 or 20000, the correction factor expo is set to -1, the peak value InterModMaxPeak [i] [adj
ust_num[i]]の大きさが20000以上のとき、修正係数expoは−2に設定される。 When ust_num [i]] of magnitude of 20,000 or more, the correction factor expo is set to -2. ステップS18は、小さな違いはあるがステップS13とほぼ同様に、さまざまな変数を更新する。 Step S18 is a small difference is but substantially similar to step S13, and updates the various variables. すなわち、修正レベルalevcode In other words, the modification level alevcode
[i][adjust_num[i]]、修正位置aloccode[i] [I] [adjust_num [i]], correction position aloccode [i]
[adjust_num[i]]、及び修正ポイント数adjust_num [Adjust_num [i]], and modify the number of points adjust_num
[i]の設定は、ステップS13と同じである。 Settings [i] is the same as step S13. ステップS18では、さらに、ピーク値InterModMaxPeak At step S18, further, a peak value InterModMaxPeak
[i][adjust_num[i]]を、区分のピーク値MaxPea [I] the [adjust_num [i]], the peak value of the division MaxPea
k[i][j]に設定し、かつ、ピーク位置InterModMaxL Set k [i] [j], and the peak position InterModMaxL
oc[i][adjust_num[i]]をjに設定する。 The oc [i] [adjust_num [i]] is set to j. ステップS13の場合と同様に、修正レベルalevcodeに割り当てられる値は、修正ポイントをリリースポイントとしてマーキングするのみである。 As in step S13, the value assigned to fix level alevcode will only mark the modified point as release point. 修正レベルの実際の値は、 The actual value of the modification level,
後に決定される。 After it is determined to. 【0100】従って、ステップS16乃至ステップS1 [0100] Accordingly, steps S16 to step S1
8に係るリリース信号の終了位置を含む区分を識別する処理では、修正関数計算部14bは、処理すべき現在の区分と、当該現在の区分に先行する修正ポイントとの間における最大のピークの絶対値InterModMaxPeak[i] In the process of identifying the fraction containing the end position of the release signal according to the 8, the correction function calculating unit 14b, current and classification to be treated, the absolute maximum of the peak between the corrected points preceding the current segment value InterModMaxPeak [i]
[j]と、当該現在の区分以後の予め決められた数(8 [J] and, the predetermined number of the current segment after (8
個)の区分に係る各ピークの絶対値との比に基づいて、 On the basis of the ratio of the absolute value of each peak according to the classification of the individual),
当該現在の区分がリリース信号の終了位置を含むか否かを決定し、当該現在の区分が上記リリース信号の終了位置を含むと決定されたときは、リリース信号の終了位置を含むことを示す所定の第2の値(0,−1,又は− The current segment is determined whether including the end position of the release signal, when the current segment is determined to contain the end position of the release signal, the predetermined indicating that it contains an end position of the release signal a second value (0, -1, or -
2)を当該現在の区分に割り当てることを特徴とする【0101】ステップS19は、それまでに発見された修正ポイントがこれらに割り当てられた合計記憶量(すなわち、20個)をすでに超過しているか否かをチェックする。 2), characterized in that assigned to the current classification [0102] Step S19, the total amount of storage discovered corrected points assigned to these so far (i.e., either already exceeded 20) to check whether or not. 超過していなければ、次の区分が修正ポイントであるか否かを決定するために、フローはステップS1 If not exceeded, to determine whether the next segment is the correcting point, the flow step S1
4に進む。 Proceed to 4. そうでなければ、プロセスはインデックスj Otherwise, the process is the index j
による内部ループを終了してピーク値CurrFramePeak Peak value and ends the inner loop by CurrFramePeak
[i]を決定する。 To determine the [i]. ピーク値CurrFramePeak[i]は、 Peak value CurrFramePeak [i] is,
現在のサブバンドフレームに対する利得制御の目標の信号レベルである「目標ピーク値」を表す。 Is a target signal level of the gain control for the current sub-band frames representing the "target peak value". 【0102】ステップS20は、先行するサブバンドフレームの修正ポイント数prev_adjust_num[i]が0であり、かつ現在のサブバンドフレームにおいて発見されたすべての修正ポイントが「リリース信号」のタイプに属するか否かをチェックする。 [0102] Step S20 is prior modification points of the sub-band frames that prev_adjust_num [i] is 0, and whether all modifications points found in the current sub-band frame belongs to the type of "release signal" Check the. 条件が真であるときは、 If the condition is true,
修正関数計算部14bは、当該サブバンドフレームにおけるオーディオサンプル信号が「自然な降下」をしていると結論する。 Correction function calculating section 14b concludes that the audio samples signal in the subband frame is a "natural descent." このような現象は発話音声の信号に共通するものであり、ポストエコーを防止するためにこのような信号に利得制御を適用したならば、望ましくないアーティファクトが引き起こされる。 Such phenomenon are those common to speech signals, if the application of the gain control in such signals to prevent post-echo, caused undesirable artifacts. ゆえに、これは、現在のサブバンドフレームの修正ポイント数adjust_num Thus, this modified points in the current sub-band frames adjust_num
[i]をゼロにリセットし、減衰制限係数min_amp The [i] is reset to zero, the damping limiting coefficient min_amp
[i]を4に設定して(ステップS21)、図13のステップS32に進む。 Set [i] to 4 (step S21), and proceeds to step S32 in FIG. 13. 減衰制限係数min_amp[i]の目的は、過度の減衰を緩和することにあるが、これについては後に詳述する。 The purpose of the attenuation limit coefficient min_amp [i] is is to mitigate excessive attenuation, which will be described later in detail. 【0103】しかしながら、「自然な降下」現象が存在しないときは、現在のサブバンドフレームは引き続き利得制御を必要とする場合もあるので、図12のステップS22の目標ピーク値CurrFramePeak計算処理に進む。 [0103] However, when the "natural drop" phenomenon does not exist, since the current sub-band frames is sometimes continue to require a gain control proceeds to the target peak value CurrFramePeak calculation processing in step S22 in FIG. 12.
ステップS22は、修正ポイントがマーキングされているか否かをチェックし、適宜に、目標ピーク値CurrFram Step S22 checks whether the modified point is marked, as appropriate, target peak value CurrFram
ePeak[i]を設定する。 Setting the ePeak [i]. 【0104】図15に図示されたステップS22のサブルーチンを参照すると、ステップS51で現在のサブバンドフレームに修正ポイントが存在すると判断されたときは、ステップS52で始まる3つのステージで現在のサブバンドフレームの目標ピーク値CurrFramePeak [0104] Referring to the subroutine of step S22 illustrated in FIG. 15, the current when the modified point is determined to exist in the sub-band frames, the current sub-band frames in three stages beginning with step S52 in step S51 target peak value CurrFramePeak of
[i]が計算される。 [I] is calculated. ステップS52の式は、次のように分析することができる。 Expression of step S52 can be analyzed as follows. すなわち、アタックポイント(alevcode[i][k]>0)が後に続くピーク値Inte That is, the attack point (alevcode [i] [k]> 0) peak value followed by Inte
rModMaxPeak[i][k]については、目標ピーク値Cur rModMaxPeak [i] for [k], the target peak value Cur
rFramePeak[i]は、修正ポイント間のピーク値InterM rFramePeak [i] is a peak value InterM between modified points
odMaxPeak[i][k]そのものとなる。 odMaxPeak [i] a [k] itself. リリースポイント(alevcode[i][k]≦0)が後に続くピーク値 Release point (alevcode [i] [k] ≦ 0) is the subsequent peak value
InterModMaxPeak[i][k]については、目標ピーク値CurrFramePeak[i]は、修正レベルalevcode[i] InterModMaxPeak [i] [k] for the target peak value CurrFramePeak [i] is modified level alevcode [i]
[k]によって減衰された修正ポイント間のピーク値In Peak value In between attenuated modified points by [k]
terModMaxPeak[i][k]となる。 terModMaxPeak [i] a [k]. ステップS52の最終的な目標ピーク値CurrFramePeak[i]は、0≦k Final target peak value in step S52 CurrFramePeak [i] is, 0 ≦ k
<adjust_num[i]のkに対するこれらすべての目標ピーク値の最大値となる。 <The maximum value of all these target peak value for k of adjust_num [i]. ステップS52で取得された目標ピーク値CurrFramePeak[i]は、ステップS53でさらに(修正ポイントが後に存在しない)最後のピーク値InterModMaxPeak[i][adjust_num[i]]と比較され、ステップS54で未来のサブバンドフレームの最初の区分のピーク値MaxPeak[i][32]と比較される。 Step S52 target peak value obtained in CurrFramePeak [i] is (no later corrected points) further in step S53 is compared with the last peak value InterModMaxPeak [i] [adjust_num [i]], the future at step S54 is compared with the peak value MaxPeak the first section of the sub-band frames [i] [32]. それらのうちの大きいほうが、最終的な目標ピーク値CurrFramePeak[i]として選択される。 More of them larger, is selected as the final target peak value CurrFramePeak [i]. ステップS Step S
54は、次のサブバンドフレームの開始位置(すなわち0番目の区分)に近接した(imminent)アタックに対するセーフガード(防護対策)として不可欠である。 54 is an essential as close to the start of the next sub-band frames (i.e. 0-th segment) (imminent) safe for attack guard (safeguards). 【0105】これに対して、修正ポイントが全く存在しないとステップS51で判断された場合は、ステップで、目標ピーク値CurrFramePeak[i]は単に、現在のサブバンドフレームにおけるすべての区分のピーク値Ma [0105] In contrast, if the modified point is determined in step S51 if not completely absent, in step, the target peak value CurrFramePeak [i] is simply the peak value Ma of all segments in the current sub-band frames
xPeak[i][k]と、未来のサブバンドフレームから導出される最初の区分のピーク値MaxPeak[i][3 xPeak [i] and [k], the peak value of the first segment is derived from the future of the sub-band frames MaxPeak [i] [3
2]との最大値から導出される。 It is derived from the maximum value of 2]. 従って、ステップS2 Thus, step S2
2に係る目標ピーク値CurrFramePeak計算処理では、修正関数計算部14bは、互いに隣接する各1対の修正ポイント間の最大のピークの絶対値InterModMaxPeak The target peak value CurrFramePeak calculation process according to 2, the correction function calculating unit 14b, the absolute value of the largest peak between the pair of modified points adjacent InterModMaxPeak
[i][j]と、割り当てられた第1の値(ステップS [I] and [j], assigned the first value (step S
13で割り当てられた修正レベルalevcode[i] Modification level alevcode assigned in 13 [i]
[j])及び第2の値(ステップS18で割り当てられた修正レベルalevcode[i][j])と、処理すべき現在のフレームに続く次のフレームの最初の区分に係るピークの絶対値MaxPeak[i][32]とに基づいて、当該処理すべき現在のフレームのオーディオ信号を修正関数に従って利得制御したときに所望される目標ピーク値 [J]) and the second value (corrected assigned in step S18 level alevcode [i] and [j]), the absolute value of the peak of the first segment of the next frame following the current frame to be processed MaxPeak [i] [32] and on the basis of, the desired target peak value when gain control in accordance with the audio signal correction function of the current frame to be the process
CurrFramePeak[i]を計算することを特徴とする。 And calculating the CurrFramePeak [i]. 【0106】目標ピーク値CurrFramePeak[i]が決定されると、ステップS56でその大きさがチェックされる。 [0106] When the target peak value CurrFramePeak [i] is determined, its magnitude is checked at step S56. これが200よりも小さいとき、処理は、全体的な信号強度が小さすぎて、利得制御しても利点がないと結論し、ビットはスペクトル量子化の際により十分に消費されるようにとっておかれる。 When this is less than 200, the process is overall signal strength is too small, also concluded that there is no advantage to gain control, bit set aside to be fully consumed by the time the spectral quantization. このため、ステップS5 For this reason, step S5
7で、当該サブバンドフレームの修正ポイント数adjust 7, corrected points of the sub-band frames adjust
_num[i]をリセットして、図12のフローにリターンし、ステップS23に進む。 Reset the _num [i], then returned to the flow of FIG. 12, the process proceeds to step S23. 【0107】目標ピーク値CurrFramePeak[i]が有意(ステップS56がNO)であれば、リターンして、ステップS23で修正レベルalevcode計算処理を実行する。 [0107] If significant target peak value CurrFramePeak [i] is (step S56 is NO), the return to execute the fix level alevcode calculation process in step S23. 図16に図示されたステップS23のサブルーチンを参照すると、ステップS61で、各修正ポイントについて1つずつ実際の修正レベルalevcode[i][j]を決定するために、jでインデックスを付与される新しい内部ループを開始する。 Referring to the subroutine of step S23 illustrated in FIG. 16, in step S61, in order to determine one actual modification level alevcode [i] [j] for each modification point, new are indexed by j to start the inner loop. 【0108】当該ループにおいて、修正関数計算部14 [0108] In the loop, the correction function calculating section 14
bは、ステップS62で、現在の修正ポイントが、区分0において具体化されているか否かをチェックする。 b in step S62, the current correction point, checks whether it is embodied in classification 0. 具体化されていれば、変数tempがステップS63において区分のピーク値MaxPeak[i][0]と先行するサブバンドフレームのピーク値PrevFramePeak[i]との大きいほうに設定され、次いで、ステップS64において上記変数tempに1の下限値が課される。 If so embodied, the variable temp is set to the larger of the peak value MaxPeak segment [i] [0] and the preceding peak value of the sub-band frames PrevFramePeak [i] in step S63, then in step S64 the lower limit of 1 to the variable temp is imposed. ステップS62がNOのときは、ステップS65において現在の修正ポイントに先行するピーク値InterModMaxPeak[i][j] When step S62 is NO, the peak value preceding the current modification points in step S65 InterModMaxPeak [i] [j]
がチェックされる。 There is checked. これが0より大きいときは、ステップS66で、変数tempはピーク値InterModMaxPeak This time is greater than 0, at step S66, the variable temp is a peak value InterModMaxPeak
[i][j]自体と等しくされる。 [I] is equal to [j] itself. これが0であるときは、ステップS68で「ゼロによって除算」されることを防止するために、変数tempは1に設定される(ステップS67)。 If this is zero, in order to prevent the "divide by zero" in step S68, the variable temp is set to 1 (step S67). ステップS64、S66、又はS67に続いて、ステップS68で、2を底とする対数の整数部で表された、目標ピーク値CurrFramePeak[i]と上記変数tempとの比として、修正係数expo1が計算される。 Step S64, S66, or subsequent to S67, in step S68, 2 was expressed in logarithm of the integer part of the bottom, the target peak value CurrFramePeak [i] and the ratio of said variable temp, calculated correction factor expo1 It is. ステップS69は上記修正係数expo1の正負をチェックし、それが0以上であるときは、ステップS70において、修正係数expo1の整数部を改めて修正係数expoとして設定し、それが負であるときは、修正係数expo1から0.5を減算した値の整数部を修正係数expoとして設定する。 Step S69 checks the sign of the correction factor Expo1, when it is 0 or more, in step S70, the setting the integer part of the correction coefficient Expo1 again as correction factor expo, when it is negative, modification setting the integer part of a value obtained by subtracting 0.5 from the coefficient expo1 as the correction coefficient expo. 異なる丸め/打切り方法はアーティファクトの可聴性に大きく影響することが観察されているので、最後のステップは重要である。 Since different rounding / truncation methods have been observed to significantly affect the audibility of artifacts, the last step is important. 【0109】ステップS72は、増幅を軽減する必要があるか否かをチェックする。 [0109] Step S72 checks whether it is necessary to reduce the amplification. このステップは、ステップS20で扱われた「自然な降下」の現象と同様の意味で発話音声の信号に共通して存在するアタック信号の「自然な上昇」の現象に対処する上で不可欠である。 This step is essential for dealing with the phenomenon of "natural increase" of attack signal that is present commonly in speech signals with the same meaning and phenomena addressed in step S20 "natural drop" . 「自然な上昇」の現象は、図7に示されている。 Phenomenon of "natural increase" is shown in Figure 7. この条件の本質は、現在のアタックポイントに続くピーク位置InterM The essence of this condition, the peak following the current attack point position InterM
odMaxLoc[i][j+1]が、アタックポイント自体から非常に「遠く離れた」位置にあれば、「自然な上昇」 odMaxLoc [i] [j + 1] is, if from the attack point itself in the very "far away" position, "natural increase"
に遭遇していると結論できるというものである。 It is that it can be concluded that the encountered. ステップS72で「自然な上昇」が存在すると判断されたときは、ステップS73において、修正レベルalevcode When it is determined that the "natural increase" exists in step S72, the in step S73, the modification level alevcode
[i][j]はexpo−1に設定される。 [I] [j] is set to expo-1. そうでないとき、ステップS74において、修正レベルalevcode Otherwise, in step S74, the modification level alevcode
[i][j]は修正指数expoに設定される。 [I] [j] is set to modification index expo. 本実施形態では、ステップS72の基準のために、5つの区分だけの分離距離を採用し、当該修正位置aloccode[i] In the present embodiment, for the criteria of step S72, the adopted separation distance only five sections, the correction position aloccode [i]
[j]がサブバンドフレームの最後の6つの区分よりも前であることを条件として課している。 [J] it is imposed the condition that is earlier than the last six sectors of sub-band frames. 【0110】従って、修正関数計算部14bは、オーディオ信号に基づいて、発話音声に含まれる所定のゆるやかな勾配で自然に降下する第1の信号部分を検出するステップS20と、オーディオ信号に基づいて、発話音声に含まれる所定のゆるやかな勾配で自然に上昇する第2 [0110] Thus, the correction function calculating section 14b based on the audio signal, a step S20 of detecting the first signal portion falls naturally in a predetermined gradual gradient included in the uttered voice based on the audio signals the second rising spontaneously at a predetermined gradual gradient included in speech sound
の信号部分を検出するステップS72とを実行し、処理すべき現在のフレームにおいて、識別されたアタック信号の開始位置を含む区分と、識別されたリリース信号の終了位置を含む区分とに基づいて、検出された第1の信号部分の修正関数による利得制御を中止する一方、識別されたアタック信号に基づいて計算される修正関数を減少させて第2の信号部分の修正関数を計算することにより、当該現在のフレームにおける修正関数を計算することを特徴とする。 Perform the step S72 of detecting the signal portion of the current frame to be processed, based on the classification and comprising a fraction containing the start position of the identified attack signal, the end position of the identified release signal, while cancel the gain control by the correction function of the detected first signal portion, by calculating a correction function of the second signal portion to reduce the correction function which is calculated based on the identified attack signal, and calculating a correction function in the current frame. ここで、修正関数計算部14bは、上記第1の信号部分を検出するステップと、上記第2の信号部分を検出するステップとのうちの一方のみを実行するように構成されていてもよい。 Here, the correction function calculating unit 14b includes the steps of detecting the first signal portion may be configured to only one execution of the step of detecting said second signal portion. また、第1の信号部分を検出する処理は、現在のフレームに先行するフレームにおいて修正ポイントである区分の数prev_adjust_num The processing of detecting the first signal portion, the number of division is modified points in the frame preceding the current frame prev_adjust_num
[i]が所定の第1のしきい値より小さく(ステップS [I] is smaller than a predetermined first threshold value (step S
41の条件に従って、prev_adjust_num[i]=0である)、かつ現在のフレームにアタック信号が含まれていないときに、第1の信号部分が存在すると決定し、第2 According 41 conditions, prev_adjust_num [i] = 0), and when does not contain an attack signal in the current frame, determines that the first signal portion exists, the second
の信号部分を検出する処理は、アタック信号の開始位置を含む区分と、当該区分から当該区分に続く次の修正ポイントまでの間における最大のピークの絶対値InterMod The process of detecting the signal portion of section and including the start position of the attack signal, the absolute value of the largest peak in the period from the division to the next modification point subsequent to the division InterMod
MaxPeak[i][j]が存在する区分との間の分離区分数が所定の第2のしきい値(すなわち、5)より大きいときに、第2の信号部分が存在すると決定することを特徴とする。 MaxPeak [i] a second threshold separation partition number is given between the sections [j] is present (i.e., 5) when greater than comprising determining that the second signal part is present to. 【0111】ステップS75は、ATRAC3標準によって要求される通り、計算された修正レベルalevcode [0111] Step S75, as required by the ATRAC3 standards, calculated modification level alevcode
[i][j]を−3から11までに制限する。 [I] a [j] is limited to from -3 to 11. 次に修正関数計算部14bは、ステップS76で内部ループのインデックスjを1だけインクリメントし、次いで、ステップS77においてすべての修正ポイントが処理されたか否かを判断する。 Then the correction function calculating unit 14b, the index j of the inner loop is incremented by 1 at step S76, then all modifications point determines whether or not processed in step S77. 次の修正ポイントに対する修正レベルalevcode[i][j]を計算するときはステップS6 Step when calculating a correction for the next fix point level alevcode [i] [j] S6
2に戻り、そうでないときはリターンしてステップS2 To return to the 2, and return Otherwise step S2
4に進む。 Proceed to 4. 【0112】ステップS24では、同一の修正レベルal [0112] In the step S24, the same modification level al
evcodeを共有する連続的なポイントを統合することにより、余分な修正ポイントの数を調整する。 By integrating a continuous point to share Evcode, adjusting the number of extra modification points. 特に連続する2つの修正ポイントが同一の修正レベルalevcodeを共有しているときは、第1の修正ポイントを除去することができ、第2の修正ポイントの修正レベルalevcodeの値は、除去された第1の修正ポイントに先行する修正ポイントと、当該第2の修正ポイントとの間の区分に対する修正関数値を定義することができる。 The particularly when the two modifications consecutive points share the same modification level Alevcode, it is possible to remove the first modification point, the value of the modification level Alevcode the second correction point was removed it can be defined and modified points preceding the first fix point, a correction function value for division between the second correction points. 余分な修正ポイントを除去するとともに、修正ポイント数adjust_num To remove the excess fix points, corrected points adjust_num
[i]、修正位置aloccode[i][j]、及び修正レベルalevcode[i][j]を、それぞれ、再び各修正ポイントに対して対応させることが必要である。 [I], the correction position aloccode [i] [j], and modification level alevcode [i] [j], respectively, it is necessary to cope with each modification point again. 次に、ステップS25で、ATRAC3標準に適合させるために、 Next, in step S25, in order to adapt to the ATRAC3 standards,
発見された修正ポイント数adjust_num[i]を、7以下になるように制限する。 The discovered corrected points adjust_num [i], is limited to be below 7. 従って、ステップS24の統合の後でもなお存在する8番目以後の修正ポイントは、除去される。 Therefore, 8 th subsequent modifications points still exist after the integration of step S24 is removed. 【0113】次いで、ステップS26のサブバンドフレーム間の差分制限処理を実行し、先行するサブバンドフレームの信号レベルを目標ピーク値CurrFramePeak [0113] Then, perform a differential limiting process between sub-band frames in step S26, the preceding target peak value signal level of the sub-band frames CurrFramePeak
[i]と同様の大きさの信号レベルにまで変化させるために、0番目の区分に修正ポイントを配置する必要があるか否かをチェックする。 [I] in order to change to a similar magnitude signal level and to check whether it is necessary to place the corrected points 0-th segment. 図4に図示されたように、一連の修正が実行された後に、MDCTのために先行するサブバンドフレームが現在のサブバンドフレームに縦続接続される符号化のステップが存在するので、このサブバンドフレーム間の差分制限処理は不可欠である。 As shown in Figure 4, after a series of modifications have been performed, since the step of encoding the sub-band frames are cascade-connected to the current subband frame preceding to the MDCT is present, this sub-band the difference limiting process between frames is essential. 【0114】図17のステップS26のサブルーチンを参照すると、ステップS81では、先行するサブバンドフレーム又は現在のサブバンドフレームの何れかが修正ポイントを含み、かつ、ATRAC3標準に従って、さらに余分の修正ポイントを収容する余地がある(すなわち、adjust_num[i]≦6)ならば、YESと応答する。 [0114] Referring to the subroutine of step S26 of FIG. 17, in step S81, any one of the preceding sub-band frame or the current subband frame includes a correction point, and, in accordance with ATRAC3 standards, a further extra modification points there is room to accommodate (i.e., adjust_num [i] ≦ 6) If, YES to respond. これがYESであるときは、ステップS82及びS If this is YES, a step S82 and S
83は、ステップS63及びS64と同様の方法で変数 83 is variable in the same manner as in step S63 and S64
tempの値を決定する。 To determine the value of temp. ステップS84は、変数tempの振幅と目標ピーク値CurrFramePeak[i]の振幅をチェックする。 Step S84 checks the amplitude of the target peak value CurrFramePeak variable temp [i]. 変数tempが目標ピーク値CurrFramePeak[i] Variable temp is the target peak value CurrFramePeak [i]
よりも大きくかつ目標ピーク値CurrFramePeak[i]が比較的小さければ(この場合の基準は500未満であるか否か。)、目標ピーク値CurrFramePeak[i]と変数t If large and the target peak value CurrFramePeak [i] is relatively smaller than (whether the reference in this case is less than 500.), The target peak value CurrFramePeak [i] and the variable t
empの比の2倍の、2を底とする対数として、修正係数e Of 2 times the ratio of the emp, as logarithm to base 2, the correction factor e
xpo1を計算する。 xpo1 to calculate. そうでないときは、より小さい増幅係数を生成するように、目標ピーク値CurrFramePeak Otherwise, to generate a smaller amplification factor, the target peak value CurrFramePeak
[i]と変数tempの比の、2を底とする対数として、修正係数expo1を計算する。 The ratio of [i] and the variable temp, as logarithm to base 2, to calculate the correction factor Expo1. ステップS87乃至S89は修正係数expo1の大きさをチェックし、ステップS88 Step S87 through S89 checks the size of the correction factor Expo1, step S88
及びステップS89において、適宜に修正係数expoが計算される。 And in step S89, appropriate correction factor expo is calculated. 言及したこのステップは、ステップS69乃至S71に類似するものであり、同様の丸め/打切り論理に従っている。 I mentioned this step, which similar to the step S69 to S71, follows the same rounding / truncation logic. ステップS90は、ATRAC3標準が要求する通りに修正係数expoの下限(−3)及び上限(11)を設定する。 Step S90 sets a lower limit (-3) and upper (11) of the modification coefficient expo to as ATRAC3 standards requires. 【0115】従って、ステップS26において、修正関数計算部14bは、互いに隣接した2つのフレームである第1及び第2のフレームにおいて、利得制御後のオーディオ信号のうちの第1のフレームのピークの絶対値Pr [0115] Thus, in step S26, the correction function calculating unit 14b, the first and second frame which is two frames adjacent to each other, the absolute peak of the first frame of the audio signal after the gain control value Pr
evFramePeak[i]と第2のフレームのピークの絶対値C evFramePeak [i] and the absolute value C of a peak of the second frame
urrFramePeak[i]とが異なるとき、上記各ピークの絶対値が等しくなるように、上記第2のフレームの最初の区分に係る修正関数値を補正することを特徴とする。 urrFramePeak [i] and when different, the as the absolute value of the peak is equal, and correcting the first correction function value according to the classification of the second frame. 【0116】ステップS91は、この追加の修正ポイントを挿入できるようになる前に満足される必要がある第2の条件を表している。 [0116] Step S91 represents a second condition that must be satisfied before it can insert a corrected point of the additional. 現在のサブバンドフレームが修正ポイントを持たないか、もしくは、もともとサブバンドフレームの先頭部分に同じ修正係数expoを生じる修正ポイントが存在していないときに、この条件はYESである。 If the current subband frame has no fix point, or, when not present fix points originally produce the same correction factor expo at the beginning of the sub-band frames, this condition is YES. 実際にそうであれば、ステップS92で新しい修正ポイントが挿入され、すべての既存の修正ポイントを後にシフトさせて、adjust_num[i]を1だけインクリメントし、フローはステップS27に進む。 If indeed so, is inserted fix point in step S92, all is shifted after the existing modification point, it is incremented by 1 to adjust_num [i], the flow proceeds to step S27. 【0117】ステップS91がNOの応答をするとき、 [0117] When the step S91 is the response of NO,
これは、現在の及び過去のサブバンドフレームの信号強度の差分(もしあれば)に関わらず、遷移は本質的に緩やかであることを含意している。 This is regardless of the current and the difference between the signal strength of the previous sub-band frames (if any), the transition has implies that essentially slowly. ゆえに、従属接続されるサブバンドフレーム間を結合する修正ポイントは不要であり、フローはステップS27に進む。 Thus, modification point coupling intersubband frames cascaded is not necessary, the flow proceeds to step S27. 【0118】第1の修正ポイントが減衰ポイント(すなわち、リリースポイント)であると判明したときは、ステップS27は、下限−min_amp[i]−1を課すことによって、アーティファクトを発生させがちな、先行するサブバンドフレームに対する潜在的に過度な減衰を緩和する。 [0118] The first modification point attenuation point (i.e., release point) when found to be the step S27, by imposing a lower limit -min_amp [i] -1, tend to generate artifacts, prior mitigate the potentially excessive attenuation for subband frame. 減衰制限係数min_amp[i]は、先行するサブバンドフレームのアタックポイントに対して適用される、最小の修正レベルalevcode[i][k]として定義されている。 Attenuation limit coefficient min_amp [i] is applied to the preceding attack point of the sub-band frames, is defined as the minimum modification level alevcode [i] [k]. 従って、ステップS27において、修正関数計算部14bは、上記利得制御部15−1乃至15− Thus, in step S27, the correction function calculating unit 14b, the gain control unit 15-1 to 15-
4の処理の後段において、上記互いに隣接した2つのフレームである第1及び第2のフレームのオーディオ信号が互いに実質的に連続するように、第1のフレームのオーディオ信号に対して第2のフレームの最初の区分に係る修正関数値を乗算して補正し、修正関数計算部14b In the subsequent fourth processing, so that the first and the audio signal of the second frame which is two frames adjacent the mutually substantially contiguous with each other, the second frame with respect to the audio signal of the first frame the first correction function value is corrected by multiplying according to division, the correction function calculating section 14b of the
は、上記第1のフレームの各区分に係る修正関数値のうちの、オーディオ信号を増幅する最小の修正関数値min_ The smallest correction function value for amplifying one of the correction function value according to each segment of the first frame, the audio signal min_
amp[i]に基づいて、上記オーディオ信号を増幅する修正関数により利得制御されるべき第1のフレームのオーディオ信号を、上記乗算して補正することにより減衰させることを防止するように、上記第2のフレームの最初の区分に係る修正関数値を補正することを特徴とする。 Based on # 038 [i], the audio signal of the first frame to be gain controlled by correction function for amplifying the audio signal, so as to prevent the attenuating by correcting by the multiplication, the first and correcting a correction function value according to the first section of the second frame. 【0119】次に、ステップS28においてサブバンドフレームの終端部利得制御処理を実行して、ポストエコー制御の開始位置をマーキングする。 Next, by executing the termination gain control process of the sub-band frames at step S28, marking the start of the post-echo control. 図18を参照すると、ステップS101において、余分の修正ポイントの受入れがいまだ可能か否か(修正ポイント数adjust_num Referring to FIG. 18, in step S101, it is whether still possible or accept extra correction point (corrected points adjust_num
[i]がATRAC3標準によって決められた上限よりも小さいか。 Or [i] is smaller than the upper limit that is determined by the ATRAC3 standards. )、及び現在の最後の修正ポイントがすでにサブバンドフレームの終わりにかなり近づいているか否か(サブバンドフレームの最後の3つの区分よりも前か。)をチェックする。 ), And to check the current of whether or not the end of the correction point is already much closer to the end of the sub-band frame (or before the last of the three sections of the sub-band frame.). 条件が許せば、プロセスはステップS102に進み、ここで、サブバンドフレームの最後の修正位置の後におけるすべての区分のピーク値MaxP If conditions permit, the process proceeds to step S102, where the peak values ​​of all segments in after the last correction position of the sub-band frames MaxP
eak[i][k]に基づいて上記ピーク値の最大値MaxVa eak [i] maximum MaxVa said peak value on the basis of the [k]
lueが生成され、次いで、ステップS103で修正係数e lue is produced, then the correction factor e at step S103
xpoが計算され(2を底とする対数の整数部で表された、目標ピーク値CurrFramePeak[i]と上記最大値Max xpo is logarithmic integer portion to the base is calculated (2, target peak value CurrFramePeak [i] and the maximum value Max
Valueとの比)、最後にステップS104に進み、ここで、修正係数expoによる新しい修正が31番目の区分に挿入される。 The ratio of the Value), finally proceeds to step S104, where the new correction by the correction factor expo is inserted into 31 th segment. このステップは、図8に示されている。 This step is illustrated in Figure 8. 【0120】従って、修正関数計算部14bは、ステップS28で、処理すべき現在のフレームにおける最後の修正ポイントの区分aloccode[i][adjust_num[i] [0120] Thus, the correction function calculating unit 14b, in step S28, division of last modification points in the current frame to be processed aloccode [i] [adjust_num [i]
−1]より後方に位置する現在のフレームの各区分における最大のピークの絶対値MaxValueが上記目標ピーク値 Maximum absolute value MaxValue is the target peak value of peaks in each segment of the current frame to be positioned behind the -1]
CurrFramePeak[i]と異なるときに、上記最大のピークの絶対値MaxValueが上記目標ピーク値CurrFramePeak At different times and CurrFramePeak [i], the absolute value MaxValue is the target peak value of the maximum peak CurrFramePeak
[i]に等しくなるように、上記後方に位置する現在のフレームの各区分に係る修正関数値を補正することを特徴とする。 [I] to be equal to, and correcting a correction function value according to each segment of the current frame located above the rear. 【0121】ステップS101の条件が許可しない場合、もしくはステップS104で新しい修正ポイントがその変数を決定することによって具体化された後は、プロセスはステップS29に進み、ここで、減衰制限係数 [0121] If the condition of step S101 is not permitted, or after being embodied by fix points in step S104 determines that variable, the process proceeds to step S29, where the attenuation limit coefficient
min_amp[i]の値が導出される。 The value of min_amp [i] is derived. 繰り返すと、減衰制限係数min_amp[i]は、ステップS27で過度の減衰を緩和するために必要なものである。 Again, the attenuation limit coefficient min_amp [i] are necessary to mitigate excessive attenuation in step S27. 【0122】ステップS30は、ATRAC3標準によって要求される表現と適合させるために、すべての修正レベルalevcode[i][j]に4を加算する。 [0122] Step S30 is to adapt the representation required by the ATRAC3 standards, adding 4 to all modification level alevcode [i] [j]. ステップS31は、計算された修正位置及び修正レベルに基づいて、当該サブバンドフレームの修正関数を計算する。 Step S31, based on the calculated correction position and correction levels, calculates the correction function of the sub-band frames. ステップS31ではまた、次のサブバンドフレームの修正関数の計算で使用するために、修正関数によって利得制御された当該サブバンドフレームのピーク値(すなわち、次のサブバンドフレームに対して「先行する」サブバンドフレームの利得制御されたピーク値)PrevFrameP In step S31 also for use in the calculation of the correction function of the next sub-band frames, gain control peak value of the sub-band frames by the correction function (i.e., "precedes" for the next sub-band frames gain control peak value of the sub-band frames) PrevFrameP
eak[i]の値を計算する。 To calculate the value of eak [i]. その後はステップS32でインデックスiを1だけインクリメントして、ステップS33がYESならば、別のサブバンド(i+1)のサブバンドフレームを処理する。 Then increments the index i by 1 in step S32, step S33 is If YES, the processing sub-band frames of another sub-band (i + 1). 【0123】当該オーディオフレームのすべてのサブバンドが処理されると、ステップS34で入力信号のすべてのオーディオフレーム(また、それらのサブバンドフレーム)が処理されたか否かをチェックする。 [0123] Once all of the subbands of the audio frame is processed, all the audio frames of the input signal (also those sub-band frames) at step S34 it is checked whether or not processed. 処理すべきサブバンドフレームがまだ残っているときは、ステップS1に戻って、バッファメモリ14から次のサブバンドフレームのサンプル信号を読み出し、一方、すべてのサブバンドフレームが処理されたときは、修正関数計算処理を終了する。 When sub-band frames to be processed still remain, the process returns to step S1, reads the sample signal of the next sub-band frames from the buffer memory 14, whereas, when all the sub-band frames have been processed, corrected to end the function calculation processing. 【0124】計算された修正関数は、利得制御部15− [0124] The calculated correction function, the gain control unit 15
1乃至15−4に送られて、オーディオサンプル信号に乗算されるとともに、サイド情報としてビットストリームマルチプレクサに送られる。 1 to be sent to 15-4, while being multiplied to the audio sample signal is sent as side information to the bit stream multiplexer. 【0125】以上説明したように、本発明に係る実施形態のオーディオ信号の符号化方法及び装置、並びに符号化及び複合化システムによれば、修正関数をより正確に生成して利得制御を実行することにより、プリエコー雑音及びポストエコー雑音を確実に抑圧することができる。 [0125] As described above, the encoding method and apparatus of the audio signal of the embodiment of the present invention, as well as according to the encoding and compositing system, to perform more accurately generate and gain control correction function it is thereby possible to reliably suppress the pre-echo noise and post-echo noise. また、本実施形態に係るオーディオ信号の符号化方法及び装置によれば、発話音声に対する基準を特別に組込むことにより、利得制御によるアーティファクトを除去することができる。 Further, according to the encoding method and apparatus of an audio signal according to the present embodiment, by incorporating the criteria for speech special, it is possible to remove artifacts due to the gain control. 【0126】本発明は、上述の8つの改善拡張事項に対応して以下の特有の効果を有する。 [0126] The present invention has a specific effect of the following in response to the eight improving extension matters described above. まず、現在のサブバンドフレームの後に続く未来のサブバンドフレームをより自由に用いることは、リリース信号のより良好な検出をもたらすと同時に、「境界アタック」の制御も引き続き達成している(改善拡張事項(2)参照)。 First of all, the use of the future of the sub-band frame following the current sub-band frames more freely and, at the same time provide better detection of the release signal, also control of the "boundary attack" have achieved continued (Improvement and Expansion matters (2) reference). また、その可変なリリース信号の基準とポストエコーに対する直接の制御とは、長時間にわたって続くリリース信号の分割及び制御をより効果的に援助している(改善拡張事項(3)及び(8)参照)。 Also, the variable direct control over criteria and post-echo release signal is more effectively aid the division and control of the subsequent release signal over time (improved Extended Area (3) and (8) see ). さらに、目標ピーク値CurrFr In addition, the target peak value CurrFr
amePeakを用いることは、サブバンドフレーム全体の尺度で望ましい信号レベルに調整することを援助し、間接的には、先願の発明によって利得制御されたサブバンドフレームよりも、利得制御されたサブバンドフレームをより滑らかに変化させる結果となる(改善拡張事項(4)参照)。 The use of amePeak is to aid in adjusting to the desired signal level on a scale of the whole sub-band frames, Indirectly, than subband frames gain controlled by the invention of the prior application, the gain control subband results to more smoothly change the frame (see improve extended Area (4)). これは、連続する2つのサブバンドフレームの信号レベルを、互いに大きな差が出ないように同様のレベルに設定する試みによってさらに強化される(改善拡張事項(1)、(6)及び(7)参照)。 This signal level of the two subbands consecutive frames, is further enhanced by attempting to set the same level as a large difference does not appear together (improved expansion Matters (1), (6) and (7) reference). 最後に、自然な上昇と自然な降下を検出することで、過剰な制御によってこうむるアーティファクトに脆弱な発話音声の信号が特別に配慮される(改善拡張事項(5)参照)。 Finally, detecting the natural rise and natural descent, signal artifacts vulnerable speech incurred by excessive control is consideration particularly (improved extended Area (5) see). 【0127】余分なコード及び計算にも関わらず、本アルゴリズムは、その低い計算及び記憶要件のために、L [0127] Despite the extra code and calculation, the algorithm, because of its low computational and memory requirements, L
SI実装が実現可能なものである。 SI implementation are those that can be achieved. 【0128】以上の実施形態においては、MDCT処理を行っているが、本発明はこれに限らず、種々の直交変換処理を行ってもよい。 [0128] In the above embodiments have been MDCT processing, the present invention is not limited thereto, it may be carried out various orthogonal transform processing. 【0129】以上の実施形態においては、修正関数を計算するときに2つのサブバンドフレームに基づいて計算しているが、本発明はこれに限らず、少なくとも2つのサブバンドフレーム、又はサブバンドに分割されていない少なくとも2つのフレームに基づいて計算してもよい。 [0129] In the above embodiment has been calculated based on the two sub-band frames when calculating the correction function, the present invention is not limited to this, at least two sub-band frames, or sub-band based on at least two frames is not divided may be calculated. 【0130】 【発明の効果】以上詳述したように、本発明に係るオーディオ信号の符号化方法又は装置によれば、入力されたオーディオ信号に基づいてフレーム毎に修正関数を計算して、計算された修正関数に従って上記オーディオ信号に対して利得制御するステップと、上記利得制御されたオーディオ信号に対して、縦続接続された互いに隣接する2つのフレーム毎に直交変換処理を行いかつ符号化処理を行うことにより符号化されたビットストリーム信号を得るステップとを実行し、上記利得制御するステップは、入力されたオーディオ信号をフレームの時間よりも短い時間の複数の区分に分割し、上記分割された各区分のピークの絶対値を計算するステップと、上記分割された区分を有するオーディオ信号に基づいて、急激な音の立上 [0130] As has been described above in detail, according to the encoding method or apparatus of the audio signal according to the present invention, by calculating a correction function for each frame based on the input audio signal, calculates a step of gain control with respect to the audio signal according to the correction function which is, relative to the gain-controlled audio signal, the orthogonal transform processing was carried out and the coding processing for each two frames adjacent to each other in cascade perform obtaining a bit stream signal encoded by performing the steps of the gain control divides the input audio signal into a plurality of sections of time shorter than the time frame, which is the divided calculating the absolute value of the peak of each segment, based on the audio signal having the divided segment, the sudden sound rising がりを含む信号の部分であるアタック信号の開始位置を含む区分を修正ポイントとして識別するステップと、上記分割された区分を有するオーディオ信号に基づいて、急激な音の立下がりを含む信号の部分であるリリース信号の終了位置を含む区分を修正ポイントとして識別するステップと、上記分割された区分を有するオーディオ信号に基づいて、上記修正関数に従って利得制御したときに所望される、処理すべき現在のフレームにおける目標ピーク値を計算するステップと、上記識別されたアタック信号の開始位置を含む区分と、上記識別されたリリース信号の終了位置を含む区分と、上記計算された目標ピーク値とに基づいて、当該現在のフレームの各区分に係る修正関数値からなる修正関数を計算するステップとを含む。 Identifying a fraction containing the start position of the attack signal is a portion of the signal containing the rising as a correction point based on the audio signal having the divided segment, the portion of the signal containing the fall of sudden sound and identifying steps fraction containing the end position of a release signal as a correction point based on the audio signal having the divided segment, the desired current frame to be processed when the gain control in accordance with the correction function calculating a target peak value in, section and including the start position of the identified attack signal, section and including the end position of the identified release signal, based on the target peak value, which is calculated above, and calculating a correction function consisting correction function value according to said each segment of the current frame. 【0131】従って、本発明では、先願の発明のように区分毎に修正ポイントの有無を決定してその修正レベルを計算するのではなく、まず修正ポイントの有無を決定し、次いでフレームの目標ピーク値を計算し、その後に修正レベルを計算することによって、フレーム全体を考慮した利得制御が可能になる。 [0131] Thus, in the present invention, rather than computing the modification levels to determine the presence or absence of modified points in each category as the prior application of the invention, first to determine the presence or absence of modified points, then target frame the peak value is calculated, by calculating the subsequent modification level allows gain control in consideration of the entire frame. これにより、修正関数をより正確に生成して利得制御を実行して、プリエコー雑音及びポストエコー雑音を確実に抑圧することができる。 Thus, by performing the gain control more accurately generate a modified function, it is possible to reliably suppress the pre-echo noise and post-echo noise. 【0132】また、本発明に係るオーディオ信号の符号化方法又は装置によれば、入力されたオーディオ信号に基づいてフレーム毎に修正関数を計算して、計算された修正関数に従って上記オーディオ信号に対して利得制御するステップと、上記利得制御されたオーディオ信号に対して、縦続接続された互いに隣接する2つのフレーム毎に直交変換処理を行いかつ符号化処理を行うことにより符号化されたビットストリーム信号を得るステップとを実行し、上記利得制御するステップは、入力されたオーディオ信号をフレームの時間よりも短い時間の複数の区分に分割するステップと、上記分割された区分を有するオーディオ信号に基づいて、急激な音の立上がりを含む信号の部分であるアタック信号の開始位置を含む区分を修正ポイントと [0132] Further, according to the encoding method or apparatus of the audio signal according to the present invention, by calculating a correction function for each frame based on the input audio signal, to the audio signal according to the calculated correction function a step of gain control Te, with respect to the gain-controlled audio signal, cascaded coded bit stream signal by performing orthogonal transform processing performed and the encoding process for each two adjacent frames to each other perform obtaining a step of the gain control comprises the steps of dividing the input audio signal into a plurality of sections of time shorter than the time frame, based on the audio signal having the divided segment , a modified point fraction containing the start position of a portion of the signal containing the rise of sudden sound attack signal て識別するステップと、上記分割された区分を有するオーディオ信号に基づいて、急激な音の立下がりを含む信号の部分であるリリース信号の終了位置を含む区分を修正ポイントとして識別するステップと、上記分割された区分を有するオーディオ信号に基づいて、発話音声に含まれる所定のゆるやかな勾配で自然に降下する第1の信号部分を検出するステップと、上記分割された区分を有するオーディオ信号に基づいて、発話音声に含まれる所定のゆるやかな勾配で自然に上昇する第2の信号部分を検出するステップとの少なくとも一方を含み、上記利得制御するステップは、処理すべき現在のフレームにおいて、上記識別されたアタック信号の開始位置を含む区分と、上記識別されたリリース信号の終了位置を含む区分とに基づいて、 Identifying Te, identifying on the basis of the audio signal having the divided segment, the fraction containing the end position of a part of the signal containing the fall of sudden sound release signal as a correction point, the based on the audio signal with the divided segment, the steps of detecting a first signal portion falls naturally in a predetermined gradual gradient included in the uttered voice based on the audio signal having the divided segment includes at least one of the steps of detecting a second signal portion naturally rises at a predetermined gradual gradient included in speech, the step of the gain control in the current frame to be processed, the identification section and including the start position of the attack signal on the basis of the classification and including the end position of the identified release signal, 記検出された第1 The first, which is the serial detection
の信号部分の修正関数による利得制御を中止する一方、 While cancel the gain control by the correction function of the signal portions,
上記識別されたアタック信号に基づいて計算される修正関数を減少させて上記第2の信号部分の修正関数を計算することにより、当該現在のフレームにおける修正関数を計算するステップとを含む。 The identified reduced the correction function is calculated based on the attack signal by calculating a correction function of the second signal portion, and calculating a correction function in the current frame. 【0133】従って、本発明によれば、発話音声に特有な信号レベルに係る自然な上昇及び自然な降下を検出し、オーディオ信号に過度の増幅及び過度の減衰が適用されることを防止するので、発話音声であるオーディオ信号に対してアーティファクトの発生を抑制することができる。 [0133] Therefore, according to the present invention, to detect the natural increase and natural drop according to specific signal level speech, so to prevent excessive amplification and excessive attenuation is applied to the audio signal , it is possible to suppress the occurrence of artifacts to the audio signal is a speech. これにより、修正関数をより正確に生成して利得制御を実行して、プリエコー雑音及びポストエコー雑音を確実に抑圧することができる。 Thus, by performing the gain control more accurately generate a modified function, it is possible to reliably suppress the pre-echo noise and post-echo noise.

【図面の簡単な説明】 【図1】 本発明の一実施形態に係るミニディスク記録再生システムの構成を示すブロック図である。 It is a block diagram showing the configuration of a mini-disk recording and reproducing system according to an embodiment of the BRIEF DESCRIPTION OF THE DRAWINGS [Figure 1] present invention. 【図2】 図1のオーディオエンコーダ2の詳細構成を示すブロック図である。 2 is a block diagram showing a detailed configuration of the audio encoder 2 of FIG. 【図3】 図1のオーディオデコーダ6の詳細構成を示すブロック図である。 3 is a block diagram showing a detailed configuration of the audio decoder 6 in Fig. 【図4】 図2のMDCT処理部16−1に先行する利得検出部14及び利得制御部15−1における変換ブロックの生成を示すブロック図である。 4 is a block diagram illustrating the generation of a transformation block in the gain detector 14 and the gain controller 15-1 preceding the MDCT processing section 16-1 of FIG. 【図5】 入力されたオーディオサンプル信号と、図2 [5] and audio samples signal input, 2
の修正関数計算部14bが上記オーディオサンプル信号を処理して配置された修正ポイントと、結果的に得られた修正関数とを図示するグラフである。 The correction function calculator 14b is a graph illustrating the corrected point disposed to process the audio sample signal, and a resultant corrective function. 【図6】 図5の入力されたオーディオサンプル信号に対するアタック信号の基準とリリース信号の基準を表す概略図である。 6 is a schematic diagram representing the reference standards and releases signal attack signal to the input audio sample signal of FIG. 【図7】 (a)は自然な上昇を示すアタック信号を含むオーディオサンプル信号を示す図であり、(b)は(a)の信号を増幅することによって発生したアーティファクトを含む信号を示す図であり、(c)は(b)の増幅を緩和することによってアーティファクトが低減された信号を示す図である。 7 (a) is a diagram showing an audio sample signal containing the attack signal indicating a natural rise, (b) is a diagram showing a signal containing artifacts generated by amplifying the signal of (a) Yes, (c) is a diagram showing a signal artifact has been reduced by relaxing the amplification of (b). 【図8】 (a)はアタック信号及びリリース信号を含むサブバンドフレームの終端を示す図であり、(b)は(a)のアタック信号及びリリース信号に対して利得制御した後のサブバンドフレームを示す図であり、(c) 8 (a) is a diagram showing the end of the sub-band frame including an attack signal and a release signal, (b) the sub-band frames after gain control against attack signal and release signal (a) is a diagram showing a, (c)
はポストエコーに対抗するために(b)の弱い終端を増幅したサブバンドフレームを示す図である。 Is a diagram showing a subband frame obtained by amplifying the weak end of (b) to combat post-echo. 【図9】 図2の修正関数計算部14によって実行される修正関数計算処理の第1の部分を示すフローチャートである。 9 is a flowchart showing a first part of the correction function calculation process performed by the correction function calculating unit 14 of FIG. 【図10】 図2の修正関数計算部14によって実行される修正関数計算処理の第2の部分を示すフローチャートである。 10 is a flowchart showing a second part of the correction function calculation process performed by the correction function calculating unit 14 of FIG. 【図11】 図2の修正関数計算部14によって実行される修正関数計算処理の第3の部分を示すフローチャートである。 11 is a flowchart showing a third part of the correction function calculation process performed by the correction function calculating unit 14 of FIG. 【図12】 図2の修正関数計算部14によって実行される修正関数計算処理の第4の部分を示すフローチャートである。 12 is a flowchart showing a fourth part of the correction function calculation process performed by the correction function calculating unit 14 of FIG. 【図13】 図2の修正関数計算部14によって実行される修正関数計算処理の第5の部分を示すフローチャートである。 13 is a flowchart showing a fifth part of the correction function calculation process performed by the correction function calculating unit 14 of FIG. 【図14】 図9のステップS3の初期化処理のサブルーチンを示すフローチャートである。 14 is a flowchart showing a subroutine of initialization process in step S3 in FIG. 【図15】 図12のステップS22の目標ピーク値Cu [15] the target peak value Cu in step S22 in FIG. 12
rrFramePeak計算処理のサブルーチンを示すフローチャートである。 It is a flowchart showing a subroutine of rrFramePeak calculation processing. 【図16】 図12のステップS23の修正レベルalev [16] modification level in step S23 in FIG. 12 alev
code計算処理のサブルーチンを示すフローチャートである。 It is a flowchart showing a subroutine of code calculation process. 【図17】 図12のステップS26のサブバンドフレーム間のレベルの差分制限処理のサブルーチンを示すフローチャートである。 17 is a flowchart showing a subroutine of the difference limiting process in level between sub-band frames in step S26 in FIG. 12. 【図18】 図12のステップS28のサブバンドフレームの終端部利得制御処理のサブルーチンを示すフローチャートである。 18 is a flowchart showing a subroutine of termination gain control process of the sub-band frames in step S28 in FIG. 12. 【図19】 (a)は、利得制御をせず、プリエコーやポストエコーが発生するときの従来技術のオーディオ信号の符号化及び復号化装置の構成を示すブロック図であり、(b)は、利得制御を行い、プリエコーやポストエコーを抑圧するときの従来技術のオーディオ信号の符号化及び復号化装置の構成を示すブロック図である。 19 (a) is, without gain control is a block diagram of an encoding and decoding apparatus of the prior art audio signal when the pre-echo and post-echo occurs, (b), the performs gain control, a block diagram of an encoding and decoding apparatus of the prior art audio signal when suppressing pre-echo or post-echo. 【符号の説明】 1…A/Dコンバータ、 2…オーディオエンコーダ、 3…ミニディスク記録装置、 4…ミニディスク、 5…ミニディスク再生装置、 6…オーディオデコーダ、 7…D/Aコンバータ、 10…QMF分割フィルタ、 11…ローパスフィルタ、 12…ハイパスフィルタ、 13−1乃至13−4…フィルタバンク、 14…利得検出部、 14a…バッファメモリ、 14b,14b−a,14b−b,14b−c…修正関数計算部、 15−1乃至15−4…利得制御部、 16−1乃至16−4…MDCT処理部、 17−1乃至17−4…トーン成分符号化器、 18−1乃至18−4…トーン成分量子化器、 19−1乃至19−4…スペクトル量子化器、 20…ビットストリームマルチプレクサ、 21…ビットストリームデ [Reference Numerals] 1 ... A / D converter, 2 ... audio encoder, 3 ... minidisc recorder, 4 ... minidisk, 5 ... mini disc player, 6 ... audio decoder, 7 ... D / A converter, 10 ... QMF dividing filter, 11 ... low-pass filter, 12 ... high-pass filter, 13-1 to 13-4 ... filterbank, 14 ... gain detecting unit, 14a ... buffer memory, 14b, 14b-a, 14b-b, 14b-c ... correction function calculating unit, 15-1 to 15-4 ... gain control unit, 16-1 to 16-4 ... MDCT processor, 17-1 to 17-4 ... tone component encoder 18-1 to 18-4 ... tone component quantizer, 19-1 to 19-4 ... spectral quantizer, 20 ... bit stream multiplexer, 21 ... bit stream de ルチプレクサ、 22−1乃至22−4…トーン成分逆量子化器、 23−1乃至23−4…スペクトル逆量子化器、 24−1乃至24−4…トーン成分復号化器、 25−1乃至25−4…逆MDCT処理部、 26−1乃至26−4…逆利得制御部、 27…QMF合成フィルタ、 CO1,CO2…縦続接続演算子、 MP1a,MP1b,MP1c,MP2a,MP2b, Multiplexer, 22-1 to 22-4 ... tone component inverse quantizer, 23-1 to 23-4 ... spectral inverse quantizer, 24-1 through 24-4 ... tone component decoder, 25-1 to 25 -4 ... inverse MDCT processor, 26-1 to 26-4 ... inverse gain control unit, 27 ... QMF synthesis filter, CO1, CO2 ... cascaded operators, MP1a, MP1b, MP1c, MP2a, MP2b,
MP2c…乗算器。 MP2c ... multiplier.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 スア ホン・ネオ シンガポール534415シンガポール、タイ・ セン・アベニュー、ブロック1022、04− 3530番、タイ・セン・インダストリアル・ エステイト、パナソニック・シンガポール 研究所株式会社内Fターム(参考) 5D045 DA20 5J064 BA16 BB07 BB12 BC01 BC02 BC06 BC07 BC09 BC12 BC16 BC25 BC29 BD03 ────────────────────────────────────────────────── ─── of the front page continued (72) inventor Sua Hong Neo Singapore 534415 Singapore, Thailand Sen Avenue, block 1022,04- 3530 number, Thailand Sen Industrial Estate, Panasonic Singapore Institute within Co., Ltd. F-term (reference) 5D045 DA20 5J064 BA16 BB07 BB12 BC01 BC02 BC06 BC07 BC09 BC12 BC16 BC25 BC29 BD03

Claims (1)

  1. 【特許請求の範囲】 【請求項1】 入力されたオーディオ信号に基づいてフレーム毎に修正関数を計算して、計算された修正関数に従って上記オーディオ信号に対して利得制御するステップと、 上記利得制御されたオーディオ信号に対して、縦続接続された互いに隣接する2つのフレーム毎に直交変換処理を行いかつ符号化処理を行うことにより符号化されたビットストリーム信号を得るステップとを含むオーディオ信号の符号化方法において、 上記利得制御するステップは、 入力されたオーディオ信号をフレームの時間よりも短い時間の複数の区分に分割し、上記分割された各区分のピークの絶対値を計算するステップと、 上記分割された区分を有するオーディオ信号に基づいて、急激な音の立上がりを含む信号の部分であるアタック信 [Claims 1] to calculate the correction function for each frame based on the input audio signal, comprising the steps of gain control with respect to the audio signal according to the calculated correction function, the gain control against audio signals, the sign of the audio signal and obtaining a bit stream signal encoded by performing the orthogonal transform processing performed and the encoding process for each two frames adjacent to each other in cascade in method, said step of gain control, calculating a dividing an input audio signal into a plurality of sections of time shorter than the time frame, the absolute value of the peak of each segment is the split, the based on the audio signal with the divided segment is a portion of the signal containing the rise of sudden sound attack Shin の開始位置を含む区分を修正ポイントとして識別するステップと、 上記分割された区分を有するオーディオ信号に基づいて、急激な音の立下がりを含む信号の部分であるリリース信号の終了位置を含む区分を修正ポイントとして識別するステップと、 上記分割された区分を有するオーディオ信号に基づいて、上記修正関数に従って利得制御したときに所望される、処理すべき現在のフレームにおける目標ピーク値を計算するステップと、 上記識別されたアタック信号の開始位置を含む区分と、 Of identifying a fraction containing the starting position as a correction point based on the audio signal having the divided segment, the segment including the end position of the release signal is a portion of the signal containing the fall of sudden sound calculating and identifying as a correction point based on the audio signal having the divided segment, is desired when the gain control in accordance with the correction function, the target peak value in the current frame to be processed, section and including the start position of the identified attack signal,
    上記識別されたリリース信号の終了位置を含む区分と、 Section and including the end position of the identified release signal,
    上記計算された目標ピーク値とに基づいて、当該現在のフレームの各区分に係る修正関数値からなる修正関数を計算するステップとを含むことを特徴とするオーディオ信号の符号化方法。 Based on the above calculated target peak value, the method of encoding an audio signal, characterized in that it comprises the step of calculating a correction function consisting correction function value according to each segment of the current frame. 【請求項2】 上記アタック信号の開始位置を含む区分を識別するステップは、 処理すべき現在の区分に続く次の区分のピークの絶対値と、当該現在の区分以前の予め決められた数の区分に係る各ピークの絶対値との比に基づいて、当該現在の区分がアタック信号の開始位置を含むか否かを決定するステップと、 当該現在の区分が上記アタック信号の開始位置を含むと決定されたときは、アタック信号の開始位置を含むことを示す所定の第1の値を当該現在の区分に割り当てるステップとを含むことを特徴とする請求項1記載のオーディオ信号の符号化方法。 Wherein identifying a fraction containing the start position of the attack signal, the absolute value of the peak of the next segment following the current segment to be processed, the partition previous predetermined number of current on the basis of the ratio of the absolute value of each peak of the partition, the steps of the current segment is to determine whether including the start position of the attack signal, when the current segment includes the start position of the attack signal when determined, the coding method according to claim 1, wherein the audio signal, characterized in that it comprises the step of assigning a predetermined first value indicating that it contains the start position of the attack signal to the current segment. 【請求項3】 上記リリース信号の終了位置を含む区分を識別するステップは、 処理すべき現在の区分と、当該現在の区分に先行する修正ポイントとの間における最大のピークの絶対値と、当該現在の区分以後の予め決められた数の区分に係る各ピークの絶対値との比に基づいて、当該現在の区分がリリース信号の終了位置を含むか否かを決定するステップと、 当該現在の区分が上記リリース信号の終了位置を含むと決定されたときは、リリース信号の終了位置を含むことを示す所定の第2の値を当該現在の区分に割り当てるステップとを含むことを特徴とする請求項1又は2記載のオーディオ信号の符号化方法。 Identifying a fraction containing the end position of wherein said release signal is present and classification to be treated, and the absolute value of the largest peak between the corrected points preceding the current segment, the on the basis of the ratio of the absolute value of each peak according to a predetermined number of sections of the current segment after, the current segment is determining whether including the end position of the release signal, the current when the indicator is determined to contain the end position of the release signal, wherein the predetermined second value indicating that it contains an end position of the release signal, characterized in that it comprises the step of assigning to the current segment coding method in claim 1 or 2, wherein the audio signal. 【請求項4】 上記目標ピーク値を計算するステップは、互いに隣接する各1対の修正ポイント間の最大のピークの絶対値と、上記割り当てられた第1の値及び第2 Wherein the step of calculating the target peak value, the absolute value of the largest peak between the pair of modified points adjacent to each other, the first value and the second assigned the
    の値と、処理すべき現在のフレームに続く次のフレームの最初の区分に係るピークの絶対値とに基づいて、当該処理すべき現在のフレームのオーディオ信号を上記修正関数に従って利得制御したときに所望される目標ピーク値を計算することを特徴とする、請求項2に従属した請求項3記載のオーディオ信号の符号化方法。 And values, based on the absolute value of the peak of the first segment of the next frame following the current frame to be processed, the audio signal of the current frame to be the process when gain control in accordance with the correction function desirable and calculates the target peak value is, the coding method of claim 3 wherein the audio signal dependent on claim 2. 【請求項5】 上記修正関数を計算するステップは、 上記アタック信号の開始位置を含む区分と、当該アタック信号の開始位置を含む区分に先行する修正ポイントとの間の各区分に係る修正関数値を、当該アタック信号の開始位置を含む区分と、上記先行する修正ポイントとの間における最大のピークの絶対値が、上記目標ピーク値に等しくなるように計算し、 上記リリース信号の開始位置を含む区分と、当該リリース信号の開始位置を含む区分に先行する修正ポイントとの間の各区分に係る修正関数値を、当該リリース信号の開始位置を含む区分と、上記先行する修正ポイントとの間における最大のピークの絶対値が、上記目標ピーク値に等しくなるように計算することを特徴とする請求項1 Calculating wherein said modifying function, section and including the start position of the attack signal, correction function value according to the division between the modified point preceding the segment containing the start position of the attack signal a section and including the start position of the attack signal, the absolute value of the largest peak between the corrected points above preceding, calculated to be equal to the target peak value, including a start position of the release signal section and, a correction function value according to the division between the modified point preceding the segment containing the start position of the release signal, section and including the start position of the release signal, between the modified point to the preceding claim absolute value of the maximum peak, and calculates to be equal to the target peak value 1
    乃至4のうちの1つに記載のオーディオ信号の符号化方法。 Or the coding method of the audio signal according to one of the 4. 【請求項6】 上記利得制御するステップは、上記分割された区分を有するオーディオ信号に基づいて、発話音声に含まれる所定のゆるやかな勾配で自然に降下する第1の信号部分を検出するステップと、上記分割された区分を有するオーディオ信号に基づいて、発話音声に含まれる所定のゆるやかな勾配で自然に上昇する第2の信号部分を検出するステップとの少なくとも一方を含み、 上記利得制御するステップは、処理すべき現在のフレームにおいて、上記識別されたアタック信号の開始位置を含む区分と、上記識別されたリリース信号の終了位置を含む区分とに基づいて、上記検出された第1の信号部分の修正関数による利得制御を中止する一方、上記識別されたアタック信号に基づいて計算される修正関数を減少させて上記第2の信 6. A step of the gain control based on the audio signal having the divided segment, the steps of detecting a first signal portion falls naturally in a predetermined gradual gradient included in speech sound , steps on the basis of the audio signal having the divided segment comprises at least one of the steps of detecting a second signal portion naturally rises at a predetermined gradual gradient included in speech, and the gain control , in the current frame to be processed, classified and including the start position of the identified attack signal, based on the classification and including the end position of the identified release signal, the first signal portion is the detected of one to cancel the gain control by the correction function, the identified attack signal to reduce the correction function which is calculated on the basis of the second signal 部分の修正関数を計算することにより、当該現在のフレームにおける修正関数を計算することを特徴とする請求項1乃至5のうちの1つに記載のオーディオ信号の符号化方法。 By calculating the correction function part, the coding method of the audio signal according to one of claims 1 to 5, characterized in that to calculate the correction function in the current frame. 【請求項7】 上記第1の信号部分を検出するステップは、上記現在のフレームに先行するフレームにおいて修正ポイントである区分の数が所定の第1のしきい値より小さく、かつ現在のフレームにアタック信号が含まれていないときに、上記第1の信号部分が存在すると決定し、 上記第2の信号部分を検出するステップは、上記アタック信号の開始位置を含む区分と、当該区分から当該区分に続く次の修正ポイントまでの間における最大のピークの絶対値が存在する区分との間の分離区分数が所定の第2のしきい値より大きいときに、上記第2の信号部分が存在すると決定することを特徴とする請求項6記載のオーディオ信号の符号化方法。 7. A step of detecting the first signal portion, the number of division is modified points in the frame preceding the above current frame is smaller than a predetermined first threshold value, and the current frame when contains no attack signal, said first determines that the signal portion exists, the second step of detecting a signal portion, section and, the segment from the segment containing the start position of the attack signal when the maximum number of separate partitioned between segments absolute value exists in the peak is larger than a predetermined second threshold value in until the next modification point subsequent to, when the second signal portion is present coding method of claim 6, wherein the audio signal, characterized in that the determining. 【請求項8】 上記修正関数を計算するステップは、上記互いに隣接した2つのフレームである第1及び第2のフレームにおいて、上記利得制御後のオーディオ信号のうちの第1のフレームのピークの絶対値と第2のフレームのピークの絶対値とが異なるとき、上記各ピークの絶対値が等しくなるように、上記第2のフレームの最初の区分に係る修正関数値を補正するステップをさらに含むことを特徴とする請求項1乃至7のうちの1つに記載のオーディオ信号の符号化方法。 8. calculating the correction function, in the first and second frame which is two frames adjacent the other, the absolute peak of the first frame of the audio signal after the gain control when the value and the absolute value of the peak of the second frame are different, so that the absolute value of each peak is equal, further comprising the step of correcting the correction function value according to the first segment of the second frame method of encoding an audio signal according to one of claims 1 to 7, characterized in. 【請求項9】 上記利得制御するステップは、上記利得制御の処理の後に、上記互いに隣接した2つのフレームである第1及び第2のフレームのオーディオ信号が互いに実質的に連続するように、第1のフレームのオーディオ信号に対して第2のフレームの最初の区分に係る修正関数値を乗算して補正するステップをさらに含み、 上記修正関数を計算するステップは、上記第1のフレームの各区分に係る修正関数値のうちの、オーディオ信号を増幅する最小の修正関数値に基づいて、上記オーディオ信号を増幅する修正関数により利得制御されるべき第1のフレームのオーディオ信号を、上記乗算して補正することにより減衰させることを防止するように、上記第2のフレームの最初の区分に係る修正関数値を補正するステップをさらに含む The step of 9. The gain control, after the processing of the gain control, so that the first and the audio signal of the second frame which is two frames adjacent the mutually substantially contiguous with each other, the further comprises the step of correcting by multiplying a correction function value with respect to the audio signal of one frame according to the first section of the second frame, the step of calculating the correction function, each segment of the first frame of correction function value according to, based on the minimum of the correction function value for amplifying the audio signal, the audio signal of the first frame to be gain controlled by correction function for amplifying the audio signal, and the multiplication so as to prevent attenuating by correcting, further comprising the step of correcting the correction function value according to the first segment of the second frame とを特徴とする請求項1乃至8 Claims 1 to 8, wherein the door
    のうちの1つに記載のオーディオ信号の符号化方法。 Method of encoding an audio signal according to one of the. 【請求項10】 上記修正関数を計算するステップは、 10. A step of calculating the correction function is
    処理すべき現在のフレームにおける最後の修正ポイントの区分より後方に位置する現在のフレームの各区分における最大のピークの絶対値が上記目標ピーク値と異なるときに、上記最大のピークの絶対値が上記目標ピーク値に等しくなるように、上記後方に位置する現在のフレームの各区分に係る修正関数値を補正するステップをさらに含むことを特徴とする請求項1乃至9のうちの1つに記載のオーディオ信号の符号化方法。 When the absolute value of the largest peak in each section of the current frame located behind the section of the last modification points in the current frame to be processed is different from the target peak value, the absolute value of the maximum peak above to be equal to the target peak value, according to one of claims 1 to 9, further comprising the step of correcting the correction function value according to each segment of the current frame located above the rear method of encoding an audio signal. 【請求項11】 入力されたオーディオ信号に基づいてフレーム毎に修正関数を計算して、計算された修正関数に従って上記オーディオ信号に対して利得制御するステップと、 上記利得制御されたオーディオ信号に対して、縦続接続された互いに隣接する2つのフレーム毎に直交変換処理を行いかつ符号化処理を行うことにより符号化されたビットストリーム信号を得るステップとを含むオーディオ信号の符号化方法において、 上記利得制御するステップは、 入力されたオーディオ信号をフレームの時間よりも短い時間の複数の区分に分割するステップと、 上記分割された区分を有するオーディオ信号に基づいて、急激な音の立上がりを含む信号の部分であるアタック信号の開始位置を含む区分を修正ポイントとして識別するステップと、 11. Calculate the correction function for each frame based on the input audio signal, comprising the steps of gain control with respect to the audio signal according to the calculated correction function with respect to the gain-controlled audio signal Te, the coding method of the audio signal and obtaining a bit stream signal encoded by performing the orthogonal transform processing performed and the encoding process for each two frames adjacent to each other in cascade, the gain control to step includes the steps of dividing the input audio signal into a plurality of sections of time shorter than the time frame, based on the audio signal having the divided segment, the signal including a rise of rapid sound portion identifying a segment containing the start position of the attack signal as a correction point is, 記分割された区分を有するオーディオ信号に基づいて、急激な音の立下がりを含む信号の部分であるリリース信号の終了位置を含む区分を修正ポイントとして識別するステップと、 上記分割された区分を有するオーディオ信号に基づいて、発話音声に含まれる所定のゆるやかな勾配で自然に降下する第1の信号部分を検出するステップと、上記分割された区分を有するオーディオ信号に基づいて、発話音声に含まれる所定のゆるやかな勾配で自然に上昇する第2の信号部分を検出するステップとの少なくとも一方を含み、 上記利得制御するステップは、処理すべき現在のフレームにおいて、上記識別されたアタック信号の開始位置を含む区分と、上記識別されたリリース信号の終了位置を含む区分とに基づいて、上記検出された第1の信号 Based on the audio signal having a serial split division, and a step of identifying a fraction containing the end position of a part of the signal containing the fall of sudden sound release signal as a correction point was the split segment based on the audio signal, and detecting a first signal portion falls naturally in a predetermined gradual gradient included in the uttered voice based on the audio signal having the divided segment, it is included in the speech sound wherein at least one of the steps of detecting a second signal portion which naturally increases at a predetermined gradual gradient step in the current frame to be processed, the start position of the identified attack signal to the gain control section and comprising, based on the classification and including the end position of the identified release signal, the detected first signal 部分の修正関数による利得制御を中止する一方、上記識別されたアタック信号に基づいて計算される修正関数を減少させて上記第2の信号部分の修正関数を計算することにより、当該現在のフレームにおける修正関数を計算するステップとを含むことを特徴とするオーディオ信号の符号化方法。 While cancel the gain control by the correction function part, by decreasing the correction function which is calculated on the basis of the identified attack signal to calculate a correction function of the second signal part, in the current frame method of encoding an audio signal, characterized in that it comprises the step of calculating a correction function. 【請求項12】 上記第1の信号部分を検出するステップは、上記現在のフレームに先行するフレームにおいて修正ポイントである区分の数が所定の第1のしきい値より小さく、かつ現在のフレームにアタック信号が含まれていないときに、上記第1の信号部分が存在すると決定し、 上記第2の信号部分を検出するステップは、上記アタック信号の開始位置を含む区分と、当該区分から当該区分に続く次の修正ポイントまでの間における最大のピークの絶対値が存在する区分との間の分離区分数が所定の第2のしきい値より大きいときに、上記第2の信号部分が存在すると決定することを特徴とする請求項11記載のオーディオ信号の符号化方法。 12. A step of detecting the first signal portion, the number of division is modified points in the frame preceding the above current frame is smaller than a predetermined first threshold value, and the current frame when contains no attack signal, said first determines that the signal portion exists, the second step of detecting a signal portion, section and, the segment from the segment containing the start position of the attack signal when the maximum number of separate partitioned between segments absolute value exists in the peak is larger than a predetermined second threshold value in until the next modification point subsequent to, when the second signal portion is present coding method of claim 11, wherein the audio signal, characterized in that the determining. 【請求項13】 入力されたオーディオ信号に基づいてフレーム毎に修正関数を計算して、計算された修正関数に従って上記オーディオ信号に対して利得制御する利得制御手段と、 上記利得制御されたオーディオ信号に対して、縦続接続された互いに隣接する2つのフレーム毎に直交変換処理を行いかつ符号化処理を行うことにより符号化されたビットストリーム信号を得る手段とを備えたオーディオ信号の符号化装置において、 上記利得制御手段は、 入力されたオーディオ信号をフレームの時間よりも短い時間の複数の区分に分割し、上記分割された各区分のピークの絶対値を計算する区分のピーク値計算手段と、 上記分割された区分を有するオーディオ信号に基づいて、急激な音の立上がりを含む信号の部分であるアタック信号の開始 13. Calculate the correction function for each frame based on the input audio signal, and gain control means for gain control on said audio signal according to the calculated correction function, the gain-controlled audio signal respect, the encoder of the audio signal and means for obtaining a bit stream signal encoded by performing the orthogonal transform processing performed and the encoding process for each two frames adjacent to each other in cascade the gain control means divides the input audio signal into a plurality of sections of time shorter than the time frame, and the peak value calculation means segments for calculating the absolute value of the peak of each segment which is the divided, based on the audio signal having the divided segment, the start of a part of the signal containing the rise of sudden sound attack signal 置を含む区分を修正ポイントとして識別する第1の識別手段と、 上記分割された区分を有するオーディオ信号に基づいて、急激な音の立下がりを含む信号の部分であるリリース信号の終了位置を含む区分を修正ポイントとして識別する第2の識別手段と、 上記分割された区分を有するオーディオ信号に基づいて、上記修正関数に従って利得制御したときに所望される、処理すべき現在のフレームにおける目標ピーク値を計算する目標ピーク値計算手段と、 上記識別されたアタック信号の開始位置を含む区分と、 Comprising a first identifying means for identifying a fraction containing location as the correction point based on the audio signal having the divided segment, the end position of the release signal is a portion of the signal containing the fall of sudden sound a second identification means for identifying a classification as a correction point, the on the basis of the audio signal having the divided division, desired when gain control in accordance with the correction function, the target peak value in the current frame to be processed a target peak value calculating means for calculating a fraction containing the start position of the identified attack signal,
    上記識別されたリリース信号の終了位置を含む区分と、 Section and including the end position of the identified release signal,
    上記計算された目標ピーク値とに基づいて、当該現在のフレームの各区分に係る修正関数値からなる修正関数を計算する修正関数計算手段とを備えたことを特徴とするオーディオ信号の符号化装置。 Based on the above calculated target peak value, the encoding apparatus of an audio signal, characterized in that a correction function calculating means for calculating a correction function consisting correction function value according to each segment of the current frame . 【請求項14】 上記第1の識別手段は、 処理すべき現在の区分に続く次の区分のピークの絶対値と、当該現在の区分以前の予め決められた数の区分に係る各ピークの絶対値との比に基づいて、当該現在の区分がアタック信号の開始位置を含むか否かを決定し、 当該現在の区分が上記アタック信号の開始位置を含むと決定されたときは、アタック信号の開始位置を含むことを示す所定の第1の値を当該現在の区分に割り当てることを特徴とする請求項13記載のオーディオ信号の符号化装置。 14. The first means of identification, the absolute value of the peak of the next segment following the current segment to be processed, the absolute of the peak relating to the current segment previously predetermined number of sections of on the basis of the ratio of the value, the current segment is to determine whether including the start position of the attack signal, when said current segment is determined to include the start position of the attack signal, the attack signal encoding apparatus of an audio signal according to claim 13, wherein assigning a predetermined first value to the current partition to indicate that includes a start position. 【請求項15】 上記第2の識別手段は、 処理すべき現在の区分と、当該現在の区分に先行する修正ポイントとの間における最大のピークの絶対値と、当該現在の区分以後の予め決められた数の区分に係る各ピークの絶対値との比に基づいて、当該現在の区分がリリース信号の終了位置を含むか否かを決定し、 当該現在の区分が上記リリース信号の終了位置を含むと決定されたときは、リリース信号の終了位置を含むことを示す所定の第2の値を当該現在の区分に割り当てることを特徴とする請求項13又は14記載のオーディオ信号の符号化装置。 15. The second means of identification, current and classification to be treated, the absolute value of the largest peak between the modified point preceding the current segment, predetermined for the current segment after on the basis of the ratio of the absolute value of each peak of the number of classes that are, the current segment is to determine whether including the end position of the release signal, the current segment is the end position of the release signal when it is determined that comprises the coding apparatus of the audio signal according to claim 13 or 14, wherein assigning a predetermined second value to the current partition to indicate that including the end position of the release signal. 【請求項16】 上記目標ピーク値計算手段は、互いに隣接する各1対の修正ポイント間の最大のピークの絶対値と、上記割り当てられた第1の値及び第2の値と、処理すべき現在のフレームに続く次のフレームの最初の区分に係るピークの絶対値とに基づいて、当該処理すべき現在のフレームのオーディオ信号を上記修正関数に従って利得制御したときに所望される目標ピーク値を計算することを特徴とする、請求項14に従属した請求項15 16. The target peak value calculation means, and the absolute value of the largest peak between the pair of modified points adjacent to each other, the first and second values ​​assigned above, to be processed based on the absolute value of the peak of the first segment of the next frame following the current frame, a desired target peak value when gain control according to the audio signal to the correction function of the current to be the process frame and calculating, according to claim 15 dependent on claim 14
    記載のオーディオ信号の符号化装置。 Encoding apparatus of an audio signal according. 【請求項17】 上記修正関数計算手段は、 上記アタック信号の開始位置を含む区分と、当該アタック信号の開始位置を含む区分に先行する修正ポイントとの間の各区分に係る修正関数値を、当該アタック信号の開始位置を含む区分と、上記先行する修正ポイントとの間における最大のピークの絶対値が、上記目標ピーク値に等しくなるように計算し、 上記リリース信号の開始位置を含む区分と、当該リリース信号の開始位置を含む区分に先行する修正ポイントとの間の各区分に係る修正関数値を、当該リリース信号の開始位置を含む区分と、上記先行する修正ポイントとの間における最大のピークの絶対値が、上記目標ピーク値に等しくなるように計算することを特徴とする請求項1 17. The correction function calculating means, division and including the start position of the attack signal, a correction function value according to the division between the modified point preceding the segment containing the start position of the attack signal, section and including the start position of the attack signal, the absolute value of the largest peak between the corrected points above preceding, calculated to be equal to the target peak value, the fraction containing the start position of the release signal , a correction function value according to the division between the modified point preceding the segment containing the start position of the release signal, section and including the start position of the release signal, the maximum between the modified point to the preceding claim 1, the absolute value of the peak, and calculates to be equal to the target peak value
    3乃至16のうちの1つに記載のオーディオ信号の符号化装置。 Encoding apparatus of an audio signal according to one of 3 to 16. 【請求項18】 上記利得制御手段は、上記分割された区分を有するオーディオ信号に基づいて、発話音声に含まれる所定のゆるやかな勾配で自然に降下する第1の信号部分を検出する第1の検出手段と、上記分割された区分を有するオーディオ信号に基づいて、発話音声に含まれる所定のゆるやかな勾配で自然に上昇する第2の信号部分を検出する第2の検出手段との少なくとも一方を備え、 上記利得制御手段は、処理すべき現在のフレームにおいて、上記識別されたアタック信号の開始位置を含む区分と、上記識別されたリリース信号の終了位置を含む区分とに基づいて、上記検出された第1の信号部分の修正関数による利得制御を中止する一方、上記識別されたアタック信号に基づいて計算される修正関数を減少させて上記第2の信号 18. The gain control means based on the audio signal having the divided segment, the first detecting the first signal portion falls naturally in a predetermined gradual gradient included in speech sound detection means, based on the audio signal having the divided segment, at least one of the second detecting means for detecting a second signal portion naturally rises at a predetermined gradual gradient included in speech sound provided, said gain control means, in the current frame to be processed, classified and including the start position of the identified attack signal, based on the classification and including the end position of the identified release signal is the detected first one to stop the gain control by the correction function of the signal portion, thereby decreasing the correction function calculated on the basis of the identified attack signal said second signal 分の修正関数を計算することにより、当該現在のフレームにおける修正関数を計算することを特徴とする請求項13乃至17のうちの1つに記載のオーディオ信号の符号化装置。 By calculating the amount of correction function, the encoding apparatus of an audio signal according to one of claims 13 to 17, characterized in that to calculate the correction function in the current frame. 【請求項19】 上記第1の検出手段は、上記現在のフレームに先行するフレームにおいて修正ポイントである区分の数が所定の第1のしきい値より小さく、かつ現在のフレームにアタック信号が含まれていないときに、上記第1の信号部分が存在すると決定し、 上記第2の検出手段は、上記アタック信号の開始位置を含む区分と、当該区分から当該区分に続く次の修正ポイントまでの間における最大のピークの絶対値が存在する区分との間の分離区分数が所定の第2のしきい値より大きいときに、上記第2の信号部分が存在すると決定することを特徴とする請求項18記載のオーディオ信号の符号化装置。 19. The first detecting means, the number of division is modified points in the frame preceding the above current frame is smaller than a predetermined first threshold value, and includes an attack signal in the current frame when that is not, the determined first signal portion is present, the second detecting means, section and including the start position of the attack signal, from the division to the next modification point subsequent to this category claims number of separating partition between the maximum and segments absolute value exists peak between is at greater than a predetermined second threshold value, and determines the said second signal portion is present encoding apparatus of an audio signal to claim 18. 【請求項20】 上記修正関数計算手段は、上記互いに隣接した2つのフレームである第1及び第2のフレームにおいて、上記利得制御後のオーディオ信号のうちの第1のフレームのピークの絶対値と第2のフレームのピークの絶対値とが異なるとき、上記各ピークの絶対値が等しくなるように、上記第2のフレームの最初の区分に係る修正関数値を補正することを特徴とする請求項13乃至19のうちの1つに記載のオーディオ信号の符号化装置。 20. The correction function calculating means, the first and second frame which is two frames adjacent the other, and the absolute value of the peak of the first frame of the audio signal after the gain control when the absolute value of the peak of the second frame are different claims, characterized in that the absolute value of the each peak to be equal, for correcting the correction function value according to the first segment of the second frame encoding apparatus of an audio signal according to one of 13 to 19. 【請求項21】 上記利得制御手段は、上記利得制御の処理の後に、上記互いに隣接した2つのフレームである第1及び第2のフレームのオーディオ信号が互いに実質的に連続するように、第1のフレームのオーディオ信号に対して第2のフレームの最初の区分に係る修正関数値を乗算して補正する乗算器をさらに備え、 上記修正関数計算手段は、上記第1のフレームの各区分に係る修正関数値のうちの、オーディオ信号を増幅する最小の修正関数値に基づいて、上記オーディオ信号を増幅する修正関数により利得制御されるべき第1のフレームのオーディオ信号を、上記乗算して補正することにより減衰させることを防止するように、上記第2のフレームの最初の区分に係る修正関数値を補正することを特徴とする請求項13乃至20のう 21. The gain control means, after the processing of the gain control, so that the first and the audio signal of the second frame which is two frames adjacent the mutually substantially contiguous with each other, the first multiplying the first correction function value according to the classification further comprises a multiplier for correcting the second frame to the audio signal of the frame, the correction function calculating means, according to each section of the first frame of the correction function values, based on the minimum of the correction function value for amplifying the audio signal, the audio signal of the first frame to be gain controlled by correction function for amplifying the audio signal, corrected by the multiplication so as to prevent attenuating by claim 13 or 20, characterized in that to correct the correction function value according to the first segment of the second frame の1つに記載のオーディオ信号の符号化装置。 Encoding apparatus of an audio signal according to one of. 【請求項22】 上記修正関数計算手段は、処理すべき現在のフレームにおける最後の修正ポイントの区分より後方に位置する現在のフレームの各区分における最大のピークの絶対値が上記目標ピーク値と異なるときに、上記最大のピークの絶対値が上記目標ピーク値に等しくなるように、上記後方に位置する現在のフレームの各区分に係る修正関数値を補正することを特徴とする請求項1 22. The correction function calculating means, the absolute value of the largest peak in each section of the current frame located behind the section of the last modification points in the current frame to be processed is different from the target peak value when, claim 1, the absolute value of the maximum peak to be equal to the target peak value, and correcting a correction function value according to each segment of the current frame located above the rear
    3乃至21のうちの1つに記載のオーディオ信号の符号化装置。 Encoding apparatus of an audio signal according to one of 3 to 21. 【請求項23】 入力されたオーディオ信号に基づいてフレーム毎に修正関数を計算して、計算された修正関数に従って上記オーディオ信号に対して利得制御する利得制御手段と、 上記利得制御されたオーディオ信号に対して、縦続接続された互いに隣接する2つのフレーム毎に直交変換処理を行いかつ符号化処理を行うことにより符号化されたビットストリーム信号を得る手段とを備えたオーディオ信号の符号化装置において、 上記利得制御手段は、 入力されたオーディオ信号をフレームの時間よりも短い時間の複数の区分に分割する手段と、 上記分割された区分を有するオーディオ信号に基づいて、急激な音の立上がりを含む信号の部分であるアタック信号の開始位置を含む区分を修正ポイントとして識別する第3の識別手段と、 上記 23. Calculate the correction function for each frame based on the input audio signal, and gain control means for gain control on said audio signal according to the calculated correction function, the gain-controlled audio signal respect, the encoder of the audio signal and means for obtaining a bit stream signal encoded by performing the orthogonal transform processing performed and the encoding process for each two frames adjacent to each other in cascade the gain control means includes means for dividing the input audio signal into a plurality of sections of time shorter than the time frame, based on the audio signal having the divided segment, including the rise of rapid sound and third identification means for identifying a segment including the start position of the attack signal is a portion of the signal as a correction point, the 割された区分を有するオーディオ信号に基づいて、急激な音の立下がりを含む信号の部分であるリリース信号の終了位置を含む区分を修正ポイントとして識別する第4の識別手段と、 上記分割された区分を有するオーディオ信号に基づいて、発話音声に含まれる所定のゆるやかな勾配で自然に降下する第1の信号部分を検出する第3の検出手段と、 Based on the audio signal having a split has been divided, and the fourth identification means for identifying a fraction containing the end position of the release signal is a portion of the signal containing the fall of sudden sound as corrected point was the split based on the audio signal having the division, a third detection means for detecting the first signal portion falls naturally in a predetermined gradual gradient contained in uttered speech,
    上記分割された区分を有するオーディオ信号に基づいて、発話音声に含まれる所定のゆるやかな勾配で自然に上昇する2の信号部分を検出する第4の検出手段との少なくとも一方を備え、 上記利得制御手段は、処理すべき現在のフレームにおいて、上記識別されたアタック信号の開始位置を含む区分と、上記識別されたリリース信号の終了位置を含む区分とに基づいて、上記検出された第1の信号部分の修正関数による利得制御を中止する一方、上記識別されたアタック信号に基づいて計算される修正関数を減少させて上記第2の信号部分の修正関数を計算することにより、当該現在のフレームにおける修正関数を計算する修正関数計算手段とを備えたことを特徴とするオーディオ信号の符号化装置。 Based on the audio signal having the divided segment, at least one comprises a, the gain control of the fourth detection means for detecting a second signal portion which naturally rises at a predetermined gradual gradient included in speech sound It means, in the current frame to be processed, classified and including the start position of the identified attack signal, based on the classification and including the end position of the identified release signal, a first signal the detected while cancel the gain control by the correction function part, by decreasing the correction function which is calculated on the basis of the identified attack signal to calculate a correction function of the second signal part, in the current frame encoding apparatus of an audio signal, characterized in that a correction function calculating means for calculating a correction function. 【請求項24】 上記第3の検出手段は、上記現在のフレームに先行するフレームにおいて修正ポイントである区分の数が所定の第1のしきい値より小さく、かつ現在のフレームにアタック信号が含まれていないときに、上記第1の信号部分が存在すると決定し、 上記第4の検出手段は、上記アタック信号の開始位置を含む区分と、当該区分から当該区分に続く次の修正ポイントまでの間における最大のピークの絶対値が存在する区分との間の分離区分数が所定の第2のしきい値より大きいときに、上記第2の信号部分が存在すると決定することを特徴とする請求項23記載のオーディオ信号の符号化装置。 24. The third detection means, the number of division is modified points in the frame preceding the above current frame is smaller than a predetermined first threshold value, and includes an attack signal in the current frame when that is not, the determined first signal portion is present, the fourth detecting means section and including the start position of the attack signal, from the division to the next modification point subsequent to this category claims number of separating partition between the maximum and segments absolute value exists peak between is at greater than a predetermined second threshold value, and determines the said second signal portion is present encoding apparatus of an audio signal to claim 23, wherein. 【請求項25】 請求項13乃至24のうちの1つに記載のオーディオ信号の符号化装置と、 オーディオ信号の復号化装置とを備えたオーディオ信号の符号化及び復号化システムであって、 上記オーディオ信号の復号化装置は、 上記符号化装置により符号化されたビットストリーム信号を復号化しかつ逆直交変換処理を行うことにより、複数のフレームからなるオーディオ信号を得る手段と、 上記得られたオーディオ信号に対して、上記修正関数とは逆の修正関数を用いて逆利得制御を行って逆利得制御されたオーディオ信号を得て出力する手段とを備えたことを特徴とするオーディオ信号の符号化及び復号化システム。 25. A coding and decoding system of the audio signal with a coding apparatus of an audio signal according to one and a decoding apparatus of an audio signal of the claims 13 to 24, the decoding device of the audio signal by performing decoding the bit stream signals encoded and inverse orthogonal transform process by the encoding device, and means for obtaining an audio signal comprising a plurality of frames, the resulting audio with respect to the signal, the encoded audio signal, characterized in that a means for outputting resulting inverse gain-controlled audio signal by performing inverse gain control by using the inverse of the correction function and the correction function and decoding system.
JP2002031118A 2002-02-07 2002-02-07 Method and device for encoding audio signal and encoding and decoding system Pending JP2003233395A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002031118A JP2003233395A (en) 2002-02-07 2002-02-07 Method and device for encoding audio signal and encoding and decoding system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002031118A JP2003233395A (en) 2002-02-07 2002-02-07 Method and device for encoding audio signal and encoding and decoding system

Publications (1)

Publication Number Publication Date
JP2003233395A true JP2003233395A (en) 2003-08-22

Family

ID=27774612

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002031118A Pending JP2003233395A (en) 2002-02-07 2002-02-07 Method and device for encoding audio signal and encoding and decoding system

Country Status (1)

Country Link
JP (1) JP2003233395A (en)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008209646A (en) * 2007-02-26 2008-09-11 Sony Corp Noise reduction device and noise reduction method
JP2008309955A (en) * 2007-06-13 2008-12-25 Toshiba Corp Noise suppresser
US7643562B2 (en) 2005-10-05 2010-01-05 Lg Electronics Inc. Signal processing using pilot based coding
US7646319B2 (en) 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7653533B2 (en) 2005-10-24 2010-01-26 Lg Electronics Inc. Removing time delays in signal paths
US7663513B2 (en) 2005-10-05 2010-02-16 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7696907B2 (en) 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7751485B2 (en) 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7752053B2 (en) 2006-01-13 2010-07-06 Lg Electronics Inc. Audio signal processing using pilot based coding
US7761303B2 (en) 2005-08-30 2010-07-20 Lg Electronics Inc. Slot position coding of TTT syntax of spatial audio coding application
US8073702B2 (en) 2005-06-30 2011-12-06 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8082157B2 (en) 2005-06-30 2011-12-20 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
JP2013156667A (en) * 2008-12-29 2013-08-15 Huawei Technologies Co Ltd Transient signal encoding method, decoding method, and computer readable medium

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8073702B2 (en) 2005-06-30 2011-12-06 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8494667B2 (en) 2005-06-30 2013-07-23 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8082157B2 (en) 2005-06-30 2011-12-20 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US7783494B2 (en) 2005-08-30 2010-08-24 Lg Electronics Inc. Time slot position coding
US7765104B2 (en) 2005-08-30 2010-07-27 Lg Electronics Inc. Slot position coding of residual signals of spatial audio coding application
US7831435B2 (en) 2005-08-30 2010-11-09 Lg Electronics Inc. Slot position coding of OTT syntax of spatial audio coding application
US7761303B2 (en) 2005-08-30 2010-07-20 Lg Electronics Inc. Slot position coding of TTT syntax of spatial audio coding application
US8103514B2 (en) 2005-08-30 2012-01-24 Lg Electronics Inc. Slot position coding of OTT syntax of spatial audio coding application
US8060374B2 (en) 2005-08-30 2011-11-15 Lg Electronics Inc. Slot position coding of residual signals of spatial audio coding application
US7822616B2 (en) 2005-08-30 2010-10-26 Lg Electronics Inc. Time slot position coding of multiple frame types
US7783493B2 (en) 2005-08-30 2010-08-24 Lg Electronics Inc. Slot position coding of syntax of spatial audio application
US7663513B2 (en) 2005-10-05 2010-02-16 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7696907B2 (en) 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7675977B2 (en) 2005-10-05 2010-03-09 Lg Electronics Inc. Method and apparatus for processing audio signal
US7743016B2 (en) 2005-10-05 2010-06-22 Lg Electronics Inc. Method and apparatus for data processing and encoding and decoding method, and apparatus therefor
US8068569B2 (en) 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
US7751485B2 (en) 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7671766B2 (en) 2005-10-05 2010-03-02 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7684498B2 (en) 2005-10-05 2010-03-23 Lg Electronics Inc. Signal processing using pilot based coding
US7756702B2 (en) 2005-10-05 2010-07-13 Lg Electronics Inc. Signal processing using pilot based coding
US7660358B2 (en) 2005-10-05 2010-02-09 Lg Electronics Inc. Signal processing using pilot based coding
US7646319B2 (en) 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7643561B2 (en) 2005-10-05 2010-01-05 Lg Electronics Inc. Signal processing using pilot based coding
US7774199B2 (en) 2005-10-05 2010-08-10 Lg Electronics Inc. Signal processing using pilot based coding
US7643562B2 (en) 2005-10-05 2010-01-05 Lg Electronics Inc. Signal processing using pilot based coding
US7680194B2 (en) 2005-10-05 2010-03-16 Lg Electronics Inc. Method and apparatus for signal processing, encoding, and decoding
US7756701B2 (en) 2005-10-05 2010-07-13 Lg Electronics Inc. Audio signal processing using pilot based coding
US7761289B2 (en) 2005-10-24 2010-07-20 Lg Electronics Inc. Removing time delays in signal paths
US7840401B2 (en) 2005-10-24 2010-11-23 Lg Electronics Inc. Removing time delays in signal paths
US8095357B2 (en) 2005-10-24 2012-01-10 Lg Electronics Inc. Removing time delays in signal paths
US7742913B2 (en) 2005-10-24 2010-06-22 Lg Electronics Inc. Removing time delays in signal paths
US7716043B2 (en) 2005-10-24 2010-05-11 Lg Electronics Inc. Removing time delays in signal paths
US7653533B2 (en) 2005-10-24 2010-01-26 Lg Electronics Inc. Removing time delays in signal paths
US8095358B2 (en) 2005-10-24 2012-01-10 Lg Electronics Inc. Removing time delays in signal paths
US7752053B2 (en) 2006-01-13 2010-07-06 Lg Electronics Inc. Audio signal processing using pilot based coding
US7865369B2 (en) 2006-01-13 2011-01-04 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
JP2008209646A (en) * 2007-02-26 2008-09-11 Sony Corp Noise reduction device and noise reduction method
JP2008309955A (en) * 2007-06-13 2008-12-25 Toshiba Corp Noise suppresser
JP2013156667A (en) * 2008-12-29 2013-08-15 Huawei Technologies Co Ltd Transient signal encoding method, decoding method, and computer readable medium

Similar Documents

Publication Publication Date Title
AU774862B2 (en) Scalable coding method for high quality audio
RU2387023C2 (en) Lossless multichannel audio codec
US6823310B2 (en) Audio signal processing device and audio signal high-rate reproduction method used for audio visual equipment
JP5248625B2 (en) System for adjusting the perceived loudness of an audio signal
JP3646939B1 (en) Audio decoding apparatus and audio decoding method
EP1334484B1 (en) Enhancing the performance of coding systems that use high frequency reconstruction methods
JP4741476B2 (en) Encoding device
CN1324558C (en) Coding device and decoding device and audio-data distribute device
JP3185413B2 (en) Orthogonal transform computation and the inverse orthogonal transform operation method and apparatus, a digital signal encoding and / or decoding device
JP2906646B2 (en) Audio sub-band coding apparatus
US5864800A (en) Methods and apparatus for processing digital signals by allocation of subband signals and recording medium therefor
US5684922A (en) Encoding and decoding apparatus causing no deterioration of sound quality even when sine-wave signal is encoded
CN1992533B (en) Signal encoding device and signal encoding method, signal decoding device and signal decoding method, program, and medium
US6484137B1 (en) Audio reproducing apparatus
JP3508146B2 (en) Digital signal coding and decoding apparatus, a digital signal coding apparatus and digital signal decoding apparatus
JP4589366B2 (en) Fidelity optimization variable frame length coding
JP3283413B2 (en) Coding decoding method, encoding apparatus and decoding apparatus
JP4095679B2 (en) Redundancy reduction method
US6950794B1 (en) Feedforward prediction of scalefactors based on allowable distortion for noise shaping in psychoacoustic-based compression
US5974379A (en) Methods and apparatus for gain controlling waveform elements ahead of an attack portion and waveform elements of a release portion
JP4219898B2 (en) Voice enhancement devices
JP3498375B2 (en) Digital audio signal recording apparatus
EP1715476B1 (en) Low-bitrate encoding/decoding method and system
JP3721582B2 (en) Signal encoding apparatus and method, and signal decoding apparatus and method
NL1029619C2 (en) Method and device for recovering a high frequency component of audio data.