JP3064471B2 - Orthogonal transform coding method and inverse orthogonal transform decoding device - Google Patents

Orthogonal transform coding method and inverse orthogonal transform decoding device

Info

Publication number
JP3064471B2
JP3064471B2 JP9154791A JP9154791A JP3064471B2 JP 3064471 B2 JP3064471 B2 JP 3064471B2 JP 9154791 A JP9154791 A JP 9154791A JP 9154791 A JP9154791 A JP 9154791A JP 3064471 B2 JP3064471 B2 JP 3064471B2
Authority
JP
Japan
Prior art keywords
orthogonal transform
window
block
signal
analysis window
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP9154791A
Other languages
Japanese (ja)
Other versions
JPH04302539A (en
Inventor
京弥 筒井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP9154791A priority Critical patent/JP3064471B2/en
Publication of JPH04302539A publication Critical patent/JPH04302539A/en
Application granted granted Critical
Publication of JP3064471B2 publication Critical patent/JP3064471B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、入力信号に分析窓をか
けて切り出して直交変換する直交変換符号化方法及び直
交変換された信号を逆直交変換し合成窓をかけて隣接ブ
ロックと接続して元の波形を復元する逆直交変換復号化
装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an orthogonal transform coding method for extracting and orthogonally transforming an input signal by applying an analysis window, and performing inverse orthogonal transform on an orthogonally transformed signal, applying a synthesis window, and connecting to an adjacent block. And to an inverse orthogonal transform decoding device for restoring an original waveform.

【0002】[0002]

【従来の技術】直交変換符号化について簡単に説明する
と、オーディオ信号やビデオ信号等をディジタル化した
ディジタル信号を、一定のサンプル数(ブロック、ある
いはフレーム)毎に例えば離散的フーリエ変換(DF
T)等の直交変換を施し、得られた周波数軸上の係数デ
ータを量子化するようなものである。
2. Description of the Related Art Briefly describing orthogonal transform coding, a digital signal obtained by digitizing an audio signal, a video signal, or the like is converted into, for example, a discrete Fourier transform (DF) for each predetermined number of samples (blocks or frames).
T) or the like, and quantizes the obtained coefficient data on the frequency axis.

【0003】ここで、上記ブロック化の際には、例えば
図8に示すように隣接ブロックとの間で重複部分(オー
バーラップ部分)OLが生ずるように分析窓(ウィンド
ウ)AWをかけること、いわゆるウィンドウイング(Win
dowing) を施すことが多い。この図8においては、分析
窓AWの具体例として、値が1.0の直線部分aと、両
端の傾斜部bとから成るいわゆる台形状を有する窓関数
が用いられている。この窓関数の値が0.0となる一端
部から傾斜部b、直線部分a、傾斜部bを経て再び値が
0.0となる他端部までの間が上記1ブロック(あるい
は1フレーム)BLであり、この1ブロックBL内のサ
ンプルデータに対して上記DFT等の直交変換処理が施
されるわけである。
Here, in the above-mentioned block formation, an analysis window (window) AW is applied so that an overlap portion (overlap portion) OL occurs between adjacent blocks as shown in FIG. Windowing (Win
dowing). In FIG. 8, as a specific example of the analysis window AW, a window function having a so-called trapezoidal shape including a linear portion a having a value of 1.0 and inclined portions b at both ends is used. One block (or one frame) extends from one end where the value of the window function is 0.0 to the other end where the value becomes 0.0 again through the inclined portion b, the straight line portion a, and the inclined portion b. The sample data in one block BL is subjected to the orthogonal transform processing such as the DFT.

【0004】このような分析窓AWを用いる理由は、隣
接ブロック間で重複させずに分割して直交変換すると、
逆直交変換した後のブロック端部の信号が回り込むよう
な現象、いわゆるエンドエフェクトが生じ、聴感上ある
いは視覚上で悪影響が生ずるからである。従って、一般
に直交変換符号化処理は図9のAのような手順で、また
逆直交変換復号化処理は図9のBのような手順で、それ
ぞれ行われる。
[0004] The reason for using such an analysis window AW is that when an adjacent block is divided without overlapping and orthogonally transformed,
This is because a phenomenon in which the signal at the end of the block after the inverse orthogonal transform is wrapped around, that is, a so-called end effect occurs, and adversely affects the sense of hearing or the sense of sight. Therefore, generally, the orthogonal transform encoding process is performed in a procedure as shown in FIG. 9A, and the inverse orthogonal transform decoding process is performed in a procedure as shown in FIG. 9B.

【0005】すなわち、図9のAに示すエンコーダ側に
おいて、波形切り出し部111では入力波形データから
上記重複部分OLを含むブロック毎にデータを取り出
し、次の分析窓かけ部112で取り出された1ブロック
分のデータに対して上記分析窓AWをかける。次に、直
交変換部113にて上記DFT等の直交変換を施し、符
号化部114にて量子化等の符号化を施すことによっ
て、周波数軸上の符号化データが得られる。このように
直交変換を行う前に分析窓をかけること (いわゆる分析
Windowing)により、スペクトルが拡がることを抑えてい
る。
That is, on the encoder side shown in FIG. 9A, the waveform extracting section 111 extracts data from the input waveform data for each block including the overlapping portion OL, and the next analysis windowing section 112 extracts one block. The above analysis window AW is applied to the minute data. Next, orthogonal transform such as DFT is performed by the orthogonal transform unit 113, and encoding such as quantization is performed by the encoding unit 114, so that encoded data on the frequency axis is obtained. Applying an analysis window before performing the orthogonal transformation (so-called analysis
Windowing) prevents the spectrum from spreading.

【0006】次に図9のBにおいて、復号化部121に
て上記周波数軸上の符号化データが復号化処理され、逆
直交変換部122にて逆直交変換された後、合成窓かけ
部123にて合成窓SWがかけられる (いわゆる合成Wi
ndowing)。この合成窓SWは上記分析窓AWと同様な形
状を有しており、ブロック両端部でのノイズを小さく抑
えるためのものである。この合成窓SWがかけられた各
ブロックの信号は波形接続部124に送られ、上記重複
部分が足し合わされ接続されて元の波形に復元される。
[0009] Next, in FIG. 9 B, the coded data on the frequency axis is decoded by a decoding unit 121, subjected to inverse orthogonal transformation by an inverse orthogonal transformation unit 122, and then to a synthesis windowing unit 123. The synthesis window SW is set at
ndowing). The synthesis window SW has the same shape as the analysis window AW, and is for suppressing noise at both ends of the block. The signal of each block to which the synthesis window SW has been applied is sent to the waveform connection unit 124, and the above overlapped portions are added and connected to restore the original waveform.

【0007】ここで、上記分析窓AW及び合成窓SWの
各関数の具体例について、図10を参照しながら説明す
る。この図10の分析窓AWは次の(1)式の関数w
1(n)により表され、また合成窓SWは次の(2)式の関
数w2(n)により表されるものを用いている。また、これ
らの分析窓関数w1(n)と合成窓関数w2(n)とを乗算した
関数w(n)を次の(3)式に示し、図10にこの乗算波
形ASWを示す。
Here, a specific example of each function of the analysis window AW and the synthesis window SW will be described with reference to FIG. The analysis window AW of FIG. 10 is a function w of the following equation (1).
1 (n), and the synthesis window SW uses the function w 2 (n) of the following equation (2). Further, a function w (n) obtained by multiplying the analysis window function w 1 (n) and the composite window function w 2 (n) is shown in the following equation (3), and FIG. 10 shows the multiplied waveform ASW.

【数1】 (Equation 1)

【0008】[0008]

【発明が解決しようとする課題】ところで、従来におい
ては、上記(1)式、(2)式からも明らかなように、
上記分析窓関数w1(n)と合成窓関数w2(n)とに同じ関数
を用いている。これらの(1)式、(2)式に示す関数
は、非オーバーラップ部分NOLが1.0の値をとり、
両端のオーバーラップ部分OLは、いわゆるハニングウ
ィンドウ(HanningWindow)関数を中心で左右に2分割し
た部分のそれぞれ平方根をとったものであり、これらを
乗算した(3)式に示す関数w(n) が、両端のオーバー
ラップ部分OLでそれぞれ上記2分割Hanning Window関
数の左右の部分となっている。
By the way, conventionally, as is apparent from the above equations (1) and (2),
The same function is used for the analysis window function w 1 (n) and the composite window function w 2 (n). In the functions shown in the equations (1) and (2), the non-overlapping portion NOL takes a value of 1.0,
The overlap portion OL at both ends is obtained by taking the square root of each of the two portions divided left and right around a so-called Hanning Window function, and a function w (n) shown in the equation (3) obtained by multiplying the two is obtained. , Overlapped portions OL at both ends are left and right portions of the above-described two-part Hanning Window function.

【0009】しかしながら、このような従来の窓かけに
おいては、分析窓関数w1(n)として上記Hanning Window
関数の平方根をとっており、1.0以外の値をとるいわ
ゆる関数波形の肩部が上記両端のオーバーラップ部分O
Lのみで短いことから、両端で充分に滑らかに0に収束
させることができていない。このため、このような分析
窓を用いて直交変換された出力のスペクトルは周波数軸
上で広がってしまい、これらのスペクトル出力データを
精度良く符号化しようとすると多くのビットが必要とな
ってしまうという欠点がある。
However, in such a conventional windowing, the Hanning Window function is used as the analysis window function w 1 (n).
The shoulder of the function waveform, which takes the square root of the function and takes a value other than 1.0, is the overlapped portion O at the both ends.
Since only L is short, it cannot be sufficiently smoothly converged to 0 at both ends. For this reason, the spectrum of the output that has been orthogonally transformed using such an analysis window is spread on the frequency axis, and many bits are required to accurately encode these spectrum output data. There are drawbacks.

【0010】また、上記肩部が短いことを考慮して、上
記オーバーラップ部分OLを長くして上記肩部を長くし
ようとすると、各ブロック毎の直交変換出力のスペクト
ルは周波数軸上で集中するが、時間軸上で隣接ブロック
間の重複部分が増えることより一定時間当たりのブロッ
ク数が増加することになり、所定のS/Nを確保するの
に必要なビットレートが増えることになって好ましくな
い。逆に上記オーバーラップ部分OLを短くすると、周
波数軸上のスペクトルが広がって、所定精度で符号化す
るために必要なビット数が増えてしまう。
Also, considering that the shoulder portion is short, if the overlap portion OL is lengthened to increase the shoulder portion, the spectrum of the orthogonal transform output for each block is concentrated on the frequency axis. However, the number of blocks per fixed time increases due to an increase in the overlapping portion between adjacent blocks on the time axis, and the bit rate required to secure a predetermined S / N increases, which is preferable. Absent. Conversely, when the overlap portion OL is shortened, the spectrum on the frequency axis is widened, and the number of bits required for encoding with predetermined accuracy increases.

【0011】本発明は、上述のような実情に鑑みて提案
されたものであり、隣接ブロックとの重複(オーバーラ
ップ)部分の幅を長くすることなく、分析窓の肩部をよ
り滑らかにして周波数軸上でのスペクトルを集中させ、
悪影響を与えることなくビット低減効果が高め得るよう
な直交変換符号化方法及び逆直交変換復号化装置を提供
することを目的とするものである。
The present invention has been proposed in view of the above-described circumstances, and has a smoother shoulder portion of an analysis window without increasing the width of an overlapping portion with an adjacent block. Focus the spectrum on the frequency axis,
It is an object of the present invention to provide an orthogonal transform coding method and an inverse orthogonal transform decoding device that can enhance the bit reduction effect without giving any adverse effect.

【0012】[0012]

【課題を解決するための手段】本発明に係る直交変換符
号化方法は、入力信号に対して分析窓をかけることによ
り時間軸上でブロック化し、各ブロック毎に直交変換を
施して符号化する直交変換符号化方法において、上記分
析窓として、両端部には時間軸上で隣接するブロックと
の重複部分よりも広い幅の肩部を有する形状の窓関数を
用い、直交変換後の周波数軸上でのスペクトルを集中さ
せることにより、上述の課題を解決するものである。
According to the orthogonal transform coding method of the present invention, an input signal is divided into blocks on a time axis by applying an analysis window, and each block is subjected to orthogonal transform and encoded. In the orthogonal transform coding method, as the analysis window, a window function having a shoulder having a width wider than an overlapping portion with a block adjacent on the time axis is used at both ends, and on the frequency axis after the orthogonal transform. The above-mentioned problem is solved by concentrating the spectrum at.

【0013】また、本発明に係る逆直交変換復号化装置
は、両端部に時間軸上で隣接するブロックとの重複部分
よりも広い幅の肩部を有する分析窓がかけられた後に直
交変換符号化された周波数軸上の信号が入力され、この
入力信号に対して逆直交変換を施して時間軸上の信号に
変換し、上記分析窓の窓関数と乗算した結果が隣接ブロ
ックの重複部分と足し合わせたときに1となるような窓
関数の合成窓を上記逆直交変換された信号に対してかけ
るようになし、この合成窓がかけられた信号を隣接ブロ
ックの信号と接続して元の時間軸上の信号に復元するこ
とにより、上述の課題を解決するものである。
Further, the inverse orthogonal transform decoding apparatus according to the present invention provides an orthogonal transform code after applying an analysis window having a shoulder wider at both ends than a portion overlapping with a block adjacent on the time axis. The signal on the converted frequency axis is input, the input signal is subjected to inverse orthogonal transform to be converted into a signal on the time axis, and the result of multiplication with the window function of the analysis window is used as the overlapped portion of the adjacent block. A composite window of a window function that becomes 1 when added is applied to the signal subjected to the inverse orthogonal transform, and the signal applied with the composite window is connected to a signal of an adjacent block to form an original signal. The above-mentioned problem is solved by restoring the signal on the time axis.

【0014】[0014]

【作用】分析窓と合成窓とを異ならせ、分析窓には隣接
するブロックとの重複部分よりも広い幅の肩部を有する
ものを用いて窓かけ(Windowing) を施してブロック化し
ているため、直交変換後のスペクトルを周波数軸上でよ
り集中的に分布させることができ、少ないビット数で精
度のよい符号化を実現することができる。この場合、上
記重複部分の幅を長くしているわけではないので、隣接
ブロック間の重複による冗長度は増えず、ビットレート
の増大がない。
Since the analysis window and the synthesis window are different, and the analysis window is windowed by using a window having a shoulder wider than an overlapping portion of an adjacent block, the block is formed by windowing. In addition, the spectrum after the orthogonal transform can be more intensively distributed on the frequency axis, and accurate coding can be realized with a small number of bits. In this case, since the width of the overlapping portion is not increased, the redundancy due to the overlapping between adjacent blocks does not increase, and the bit rate does not increase.

【0015】[0015]

【実施例】以下、本発明を適用した実施例について図面
を参照しながら説明する。図1には、エンコード(直交
変換符号化)の際に周波数軸上の入力信号に対して窓か
け(Windowing) するための分析窓AWと、デコード(逆
直交変換復号化)の際に逆直交変換されて得られた周波
数軸上の信号に対して窓かけするための合成窓SWと、
これらの分析窓AW及び合成窓SWの各窓関数を乗算し
て得られた乗算波形ASWとが、それぞれ1ブロックB
L分示されている。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 shows an analysis window AW for windowing an input signal on the frequency axis at the time of encoding (orthogonal transform coding) and an inverse orthogonal at the time of decoding (inverse orthogonal transform decoding). A synthesis window SW for windowing the signal on the frequency axis obtained by the conversion,
A multiplied waveform ASW obtained by multiplying each of the window functions of the analysis window AW and the synthesis window SW is one block B
L is shown.

【0016】この図1から明らかなように、分析窓AW
は隣接ブロックとの重複(オーバーラップ)部分OLよ
りも広い肩部(すなわち値が1より小さく0より大きい
両端の部分)SHを有している。この分析窓AWに対す
る合成窓SWは、これらの各窓関数を乗算した関数の波
形ASWとして、該乗算波形ASWのオーバーラップ部
分OLが隣接ブロックのオーバーラップ部分OLと足し
合わせたときに1となるようになっている。
As is apparent from FIG. 1, the analysis window AW
Has a shoulder SH wider than an overlapping portion OL with an adjacent block (that is, both ends having a value smaller than 1 and larger than 0). The composite window SW for the analysis window AW becomes 1 when the overlap portion OL of the multiplication waveform ASW is added to the overlap portion OL of the adjacent block as a waveform ASW of a function obtained by multiplying these window functions. It has become.

【0017】図2はエンコード(直交変換符号化)のた
めの構成例を示しており、入力端子11に供給された時
間軸上の信号、例えばオーディオPCM信号等の波形デ
ータは、メモリ12に一時的に蓄えられ、上記ブロック
BL毎にオーバーラップOLの部分を前のブロックのデ
ータと重複するようにして読み出され、いわゆる波形切
り出しによるブロック化処理が施される。メモリ12か
ら読み出された各ブロックBL毎のデータは、分析窓か
け回路13に送られることにより、分析窓発生回路14
からの上記分析窓AWがかけられる。この分析窓AWが
かけられたデータは、直交変換回路、例えばFFT(高
速フーリエ変換)回路15に送られ、各ブロック単位で
FFT処理が施されることにより、周波数軸のスペクト
ルデータとなる。この周波数軸の直交変換出力データが
符号化器16に送られて符号化され、出力端子17を介
して取り出される。
FIG. 2 shows an example of a configuration for encoding (orthogonal transform coding). A signal on a time axis supplied to an input terminal 11, for example, waveform data such as an audio PCM signal is temporarily stored in a memory 12. The overlap OL portion is read out so as to overlap the data of the previous block for each block BL, and is subjected to a so-called waveform cutout into a block. The data for each block BL read from the memory 12 is sent to the analysis windowing circuit 13 so that the analysis window generation circuit 14
The above analysis window AW is applied. The data to which the analysis window AW has been applied is sent to an orthogonal transform circuit, for example, an FFT (fast Fourier transform) circuit 15, and subjected to FFT processing for each block, thereby becoming spectrum data on the frequency axis. The orthogonally transformed output data on the frequency axis is sent to the encoder 16 where it is encoded and extracted via the output terminal 17.

【0018】図3はデコード(逆直交変換復号化)のた
めの構成例を示している。この図3において、入力端子
21には上記図2のデコード構成により直交変換符号化
された符号化データが供給され、復号化器22に送られ
て復号化され、周波数軸上のスペクトル・データあるい
はいわゆるFFT係数データとなる。このデータは、逆
直交変換回路、例えばIFFT(逆高速フーリエ変換)
回路23に送られて、上記FFT処理の逆の処理、すな
わち周波数軸から時間軸への変換処理が施され、上記ブ
ロック単位の時間軸上のデータとなる。このブロック単
位のデータが合成窓かけ回路24に送られ、合成窓発生
回路25からの上記合成窓SWがかけられる。この合成
窓かけ回路24からの出力は、元の波形データに対して
上記乗算波形ASWがかけられたものとなり、次の波形
接続回路26に送られて隣接するブロックとの間で上記
重畳(オーバーラップ)部分OLが足し合わされて接続
されることにより、元の時間軸上で連続的な波形データ
が復元される。
FIG. 3 shows a configuration example for decoding (inverse orthogonal transform decoding). 3, the input terminal 21 is supplied with coded data orthogonally coded by the decoding configuration shown in FIG. 2 and sent to a decoder 22 to be decoded. This is so-called FFT coefficient data. This data is converted into an inverse orthogonal transform circuit, for example, IFFT (Inverse Fast Fourier Transform)
The data is sent to the circuit 23 and subjected to the reverse processing of the FFT processing, that is, the conversion processing from the frequency axis to the time axis, and becomes data on the time axis in block units. The data in block units is sent to the composition windowing circuit 24, and the composition window generation circuit 25 applies the composition window SW. The output from the synthesis windowing circuit 24 is obtained by multiplying the original waveform data by the multiplied waveform ASW, and is sent to the next waveform connection circuit 26 to be superimposed on the adjacent block. By adding and connecting the (lap) portions OL, continuous waveform data on the original time axis is restored.

【0019】ところで、分析窓AWの窓関数w1(n)の具
体例を次の(4)式に、合成窓SWの関数w2(n)の具体
例を次の(5)式にそれぞれ示している。また、これら
の分析窓関数w1(n)と合成窓関数w2(n)とを乗算した関
数w(n) を次の(6)式に示している。
A specific example of the window function w 1 (n) of the analysis window AW is shown in the following equation (4), and a specific example of the function w 2 (n) of the synthesis window SW is shown in the following equation (5). Is shown. A function w (n) obtained by multiplying the analysis window function w 1 (n) and the composite window function w 2 (n) is shown in the following equation (6).

【数2】 (Equation 2)

【0020】これらの(4)〜(6)式において、Nは
1ブロックBLの長さをサンプル数で表したものであ
り、図1の横軸(時間軸)をサンプル番号で表しブロッ
クBLの先端(図中左端)を0とするとき、ブロックB
Lの終端(図中右端)がNとなる。M1 は隣接ブロック
との重複(オーバーラップ)部分OLの幅をサンプル数
で表したものであり、M2 は分析窓の肩部(すなわち関
数形状の両端で0と1との間の値をとる部分)SHの幅
をサンプル数で表したものである。そして、肩部SHの
幅M2 はオーバーラップ部分OLの幅M1 よりも広く
(M2 >M1 )設定されており、図1の具体例では、M
2 =1.5M1 となっている。また、(4)式の窓関数
1(n)の時間軸(サンプル番号)上で0〜M2 、N−M
2 〜Nの各部分(図1の分析窓AWの左右両端の各肩部
SHに相当)は、幅が2M2 のいわゆるハニング窓(Ha
nning Window)関数を中央で2分割した左右の各部分に
相当しており、(6)式の乗算関数w(n) の0〜M1
N−M1 〜Nの各部分(図1の乗算波形ASWの各オー
バーラップ部分OL)は、幅が2M1 のハニング窓関数
を中央で2分割した左右の各部分に相当している。
In these equations (4) to (6), N represents the length of one block BL by the number of samples, and the horizontal axis (time axis) in FIG. When the leading end (left end in the figure) is 0, block B
The end of L (the right end in the figure) is N. M 1 represents the width of the overlapping portion OL with the adjacent block (overlap) by the number of samples, and M 2 represents the shoulder of the analysis window (that is, the value between 0 and 1 at both ends of the function shape). (Part to be taken) The width of SH is represented by the number of samples. Then, the width M 2 of the shoulder portion SH is widely (M 2> M 1) setting than the width M 1 of the overlap portion OL, in the specific example of FIG. 1, M
2 = and has a 1.5M 1. Also, on the time axis (sample number) of the window function w 1 (n) in equation (4), 0 to M 2 , NM
2 the parts of to N (corresponding to the shoulder portion SH of the left and right ends of the analysis window AW of Fig. 1) is a so-called Hanning window (Ha width of 2M 2
n (nning Window) function corresponds to the left and right parts obtained by dividing the function into two in the center, and 0 to M 1 of the multiplication function w (n) in the equation (6).
Each of the portions NM 1 to N (each overlap portion OL of the multiplied waveform ASW in FIG. 1) corresponds to each of left and right portions obtained by dividing a Hanning window function having a width of 2M 1 into two at the center.

【0021】ここで図4は、入力信号である例えば1k
Hzの正弦波信号に対して、図1の分析窓AWをかけた後
に直交変換した周波数軸上のスペクトル分布を示すもの
であり、これに対して図5は、同じ入力信号に対して従
来の(図10の)分析窓AWをかけた後に直交変換した
周波数軸上のスペクトル分布を示すものである。これら
の図4、図5から明らかなように、本発明の実施例の図
1に示す分析窓AWを用いて窓かけ(Windowing) 処理を
行わせた場合には、従来に比べてスペクトル・データが
周波数軸上で集中している。従って、このようなスペク
トル・データを再量子化処理等を含む符号化処理を施し
て伝送する際には、少ないビット数で精度の高い符号化
処理を行わせることができる。換言すれば、従来の窓か
け処理を行った図5に示すようなスペクトル・データの
場合には、スペクトルが周波数軸上で広がっているた
め、個々のスペクトル・データを精度良く符号化するた
めに割り当てるビット数が増大するのに対して、本発明
実施例の窓かけ処理を行った図4の例では、スペクトル
の集中度が高いため、同じ精度を得るための割当ビット
数を低減できるわけである。しかも隣接ブロック間のオ
ーバーラップ幅は従来と同じであるため、時間軸上での
ブロック重複による冗長度の増大がなく、ビットレート
増大を回避できる。
FIG. 4 shows an input signal, for example, 1 k
FIG. 5 shows a spectrum distribution on the frequency axis obtained by applying the analysis window AW of FIG. 1 to the sine wave signal of Hz and then orthogonally transforming the sine wave signal. FIG. 12 shows a spectrum distribution on a frequency axis obtained by applying an analysis window AW (of FIG. 10) and then performing orthogonal transformation. As is apparent from FIGS. 4 and 5, when the windowing process is performed using the analysis window AW shown in FIG. 1 of the embodiment of the present invention, the spectral data Are concentrated on the frequency axis. Therefore, when such spectrum data is subjected to encoding processing including requantization processing and the like and transmitted, highly accurate encoding processing can be performed with a small number of bits. In other words, in the case of the spectrum data as shown in FIG. 5 in which the conventional windowing process is performed, since the spectrum is spread on the frequency axis, it is necessary to encode each spectrum data with high accuracy. In the example of FIG. 4 in which the windowing process according to the embodiment of the present invention is performed while the number of bits to be allocated increases, the number of bits to be allocated to obtain the same accuracy can be reduced because the degree of spectral concentration is high. is there. In addition, since the overlap width between adjacent blocks is the same as in the related art, there is no increase in redundancy due to block overlap on the time axis, and an increase in bit rate can be avoided.

【0022】次に図6は、本発明を適用可能な直交変換
符号化装置として、帯域分割符号化と適応変換符号化と
を混合した高能率符号化装置の一具体例を示している。
この図6において、入力端子30には例えば0〜20k
HzのオーディオPCM信号が供給されている。この入力
信号は、例えばいわゆるQMFフィルタ等の帯域分割フ
ィルタ31により0〜10kHz帯域と10k〜20kHz
帯域とに分割され、0〜10kHz帯域の信号は同じくQ
MFフィルタ等の帯域分割フィルタ32により0〜5k
Hz帯域と5k〜10kHz帯域とに分割される。帯域分割
フィルタ31からの10k〜20kHz帯域の信号は直交
変換回路である高速フーリエ変換(FFT)回路33に
送られ、帯域分割フィルタ32からの5k〜10kHz帯
域の信号はFFT回路34に送られ、帯域分割フィルタ
32からの0〜5kHz帯域の信号はFFT回路35に送
られることにより、それぞれFFT処理される。
Next, FIG. 6 shows a specific example of a high-efficiency coding apparatus which mixes band division coding and adaptive conversion coding as an orthogonal transform coding apparatus to which the present invention can be applied.
In FIG. 6, for example, 0 to 20 k
Hz audio PCM signal is supplied. This input signal is divided into a band of 0 to 10 kHz and a band of 10 to 20 kHz by a band division filter 31 such as a so-called QMF filter.
And the signal in the 0 to 10 kHz band is also Q
0-5k by band division filter 32 such as MF filter
It is divided into a Hz band and a 5 kHz to 10 kHz band. The signal in the 10 kHz to 20 kHz band from the band division filter 31 is sent to a fast Fourier transform (FFT) circuit 33 which is an orthogonal transformation circuit, and the signal in the 5 kHz to 10 kHz band from the band division filter 32 is sent to an FFT circuit 34. The signals in the 0 to 5 kHz band from the band division filter 32 are sent to the FFT circuit 35 to be subjected to FFT processing.

【0023】ここで、各FFT回路33、34、35に
供給する各帯域毎のブロック化の具体例を図7に示す。
この図7の具体例においては、高域側ほど周波数帯域を
広げると共に時間分解能を高め(ブロック長を短くし)
ている。すなわち、低域側の0〜5kHz帯域の信号に対
しては1ブロックBLL1を例えば1024サンプルと
し、両端にそれぞれオーバーラップ部分OLを設け、こ
れらの間に非オーバーラップ部分NOLを設けている。
また中域の5k〜10kHz帯域の信号に対しては、上記
低域のブロックBLL1のそれぞれ半分の長さのブロック
BLM1、BLM2でブロック化し、高域側の10k〜20
kHz帯域の信号に対しては、上記低域のブロックBLL1
のそれぞれ1/4の長さのブロックBLH1、BLH2、B
H3及びBLH4でブロック化している。なお、ブロック
化の際の分析窓の実際の形状としては、図7中のオーバ
ーラップ部分OLよりも長い肩部を有することは勿論で
ある。また、入力信号として0〜22kHzの帯域を考慮
する場合には、低域が0〜5.5kHz、中域が5.5k
〜11kHz、高域が11k〜22kHzとなる。
FIG. 7 shows a specific example of blocking for each band supplied to each of the FFT circuits 33, 34 and 35.
In the specific example of FIG. 7, the frequency band is widened and the time resolution is increased (the block length is shortened) toward the higher frequency side.
ing. That is, for a signal in the 0 to 5 kHz band on the low frequency side, one block BL L1 is, for example, 1024 samples, overlap portions OL are provided at both ends, and a non-overlap portion NOL is provided therebetween.
Further, the signal in the 5 kHz to 10 kHz band in the middle band is divided into blocks BL M1 and BL M2 each having a half length of the block BL L1 in the low band, and the blocks 10 M to 20 M in the high band are used.
For signals in the kHz band, the low-frequency block BL L1
Of blocks BL H1 , BL H2 , B each having a length of 1 /
Blocked by L H3 and BL H4 . The actual shape of the analysis window at the time of blocking is, of course, a shoulder portion longer than the overlap portion OL in FIG. When a band of 0 to 22 kHz is considered as an input signal, the low band is 0 to 5.5 kHz and the middle band is 5.5 kHz.
1111 kHz, and the high frequency range is 11 to 22 kHz.

【0024】再び図6において、各FFT回路33、3
4、35からのFFT処理された周波数軸上のスペクト
ル・データあるいはFFT係数データは、いわゆる臨界
帯域(クリティカルバンド)毎にまとめられてビット適
応割当符号化回路36に送られている。このクリティカ
ルバンドとは、人間の聴覚特性を考慮して分割された周
波数帯域であり、ある純音の周波数近傍の同じ強さの狭
帯域バンドノイズによって当該純音がマスクされるとき
のそのノイズの持つ帯域のことである。このクリティカ
ルバンドは、高域ほど帯域幅が広くなっており、上記0
〜20kHzの全周波数帯域は例えば25のクリティカル
バンドに分割されている。
Referring again to FIG. 6, each of the FFT circuits 33, 3
The spectrum data or FFT coefficient data on the frequency axis subjected to the FFT processing from Nos. 4 and 35 are collected for each so-called critical band (critical band) and sent to the bit adaptive allocation encoding circuit 36. The critical band is a frequency band divided in consideration of human auditory characteristics, and a band of a pure tone when the pure tone is masked by a narrow band noise near the frequency of the pure tone. That is. In this critical band, the higher the band, the wider the bandwidth.
The entire frequency band of 2020 kHz is divided into, for example, 25 critical bands.

【0025】許容雑音算出回路37は、上記クリティカ
ルバンドに分割されたスペクトル・データ(FFT係数
データ)に基づき、いわゆるマスキング効果等を考慮し
た各クリティカルバンド毎の許容ノイズ量を求め、この
許容ノイズ量と各クリティカルバンド毎のエネルギある
いはピーク値等に基づいて、各クリティカルバンド毎に
割当ビット数を求めて、ビット適応割当符号化回路36
により各クリティカルバンド毎に割り当てられたビット
数に応じて各スペクトル・データ(FFT係数データ)
を再量子化するようにしている。このようにして符号化
されたデータは、出力端子38を介して取り出される。
The allowable noise calculating circuit 37 calculates an allowable noise amount for each critical band in consideration of a so-called masking effect and the like based on the spectrum data (FFT coefficient data) divided into the critical band. And the number of bits to be allocated for each critical band based on the energy or the peak value for each critical band, and the like.
, Each spectrum data (FFT coefficient data) according to the number of bits allocated to each critical band
Is requantized. The data encoded in this manner is taken out via the output terminal 38.

【0026】なお、本発明は上記実施例のみに限定され
るものではなく、例えば、分析窓関数等は上記ハニング
窓関数に限定されず、台形状や他の種々の形状の窓関数
で、上記オーバーラップ部分よりも長い(幅広の)肩部
を有するものを使用できる。また、分析窓の肩部の幅
は、オーバーラップ部分の幅の1.5倍とする以外にも
種々の倍率で広くすることができる。ただし、倍率を高
めると、合成窓の窓関数の値が両端で大きくなり、デコ
ード時のノイズが増大するため、例えば2〜3倍程度ま
でに制限するのが好ましい。
The present invention is not limited to the above embodiment. For example, the analysis window function and the like are not limited to the Hanning window function, but may be trapezoidal or other various window functions. One with a longer (wider) shoulder than the overlap may be used. In addition, the width of the shoulder of the analysis window can be increased at various magnifications other than 1.5 times the width of the overlap portion. However, when the magnification is increased, the value of the window function of the synthesis window becomes large at both ends, and noise at the time of decoding increases. Therefore, it is preferable to limit the window function to, for example, about 2 to 3 times.

【0027】[0027]

【発明の効果】本発明に係る直交変換符号化方法によれ
ば、入力信号に対して窓かけ(いわゆるWindowing)する
ための分析窓として、両端部に隣接ブロックとの重複部
分よりも広い幅の肩部を有するものを用いることによ
り、直交変換後の周波数軸上でのスペクトルを集中さ
せ、少ないビット数で精度の良い符号化を実現すること
ができる。この場合、上記重複部分の幅を長くしている
わけではないので、隣接ブロック間の重複による冗長度
は増えず、ビットレートの増大がない。
According to the orthogonal transform coding method according to the present invention, an analysis window for windowing an input signal (so-called windowing) is provided at both ends with a width wider than an overlapping portion with an adjacent block. By using the one having the shoulder, it is possible to concentrate the spectrum on the frequency axis after the orthogonal transform, and realize highly accurate encoding with a small number of bits. In this case, since the width of the overlapping portion is not increased, the redundancy due to the overlapping between adjacent blocks does not increase, and the bit rate does not increase.

【0028】また、本発明に係る逆直交変換復号化装置
によれば、両端部に時間軸上で隣接するブロックとの重
複部分よりも広い幅の肩部を有する分析窓がかけられた
後に直交変換符号化された周波数軸上の信号を逆直交変
換復号化する装置であって、上記分析窓の窓関数と乗算
した結果が隣接ブロックの重複部分と足し合わせたとき
に1となるような窓関数の合成窓を上記逆直交変換され
た信号に対してかけるようになし、この合成窓がかけら
れた信号を隣接ブロックの信号と接続して元の時間軸上
の信号に復元するようにしているため、波形接続等に悪
影響を与えることなく符号化効率を高めることができ
る。
Further, according to the inverse orthogonal transform decoding apparatus of the present invention, after the analysis window having a shoulder wider at both ends than the overlap with the block adjacent on the time axis is applied, the orthogonal orthogonal transform is performed. What is claimed is: 1. An apparatus for performing inverse orthogonal transform decoding on a signal on a frequency axis which has been transformed and encoded, wherein a window obtained by multiplying the signal by the window function of the analysis window becomes 1 when added to an overlapping portion of an adjacent block. A function synthesis window is applied to the signal subjected to the inverse orthogonal transform, and the signal subjected to the synthesis window is connected to a signal of an adjacent block to restore the original signal on the time axis. Therefore, the coding efficiency can be improved without adversely affecting the waveform connection and the like.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例を説明するための分析窓、合
成窓、及びこれらを乗算した関数形状を示す図である。
FIG. 1 is a diagram showing an analysis window, a synthesis window, and a function shape obtained by multiplying the analysis window and the synthesis window for explaining an embodiment of the present invention.

【図2】本発明の一実施例となる直交変換復号化装置の
概略構成を示すブロック回路図である。
FIG. 2 is a block circuit diagram illustrating a schematic configuration of an orthogonal transform decoding apparatus according to an embodiment of the present invention.

【図3】本発明の一実施例となる逆直交変換復号化装置
の概略構成を示すブロック回路図である。
FIG. 3 is a block circuit diagram illustrating a schematic configuration of an inverse orthogonal transform decoding device according to an embodiment of the present invention.

【図4】本発明の一実施例による直交変換後の周波数軸
上のスペクトル分布を示す図である。
FIG. 4 is a diagram illustrating a spectrum distribution on a frequency axis after orthogonal transformation according to an embodiment of the present invention.

【図5】従来における直交変換後の周波数軸上のスペク
トル分布を示す図である。
FIG. 5 is a diagram showing a spectrum distribution on a frequency axis after orthogonal transformation in the related art.

【図6】本発明の一実施例を適用可能な帯域分割適応変
換符号化装置の具体例の概略構成を示すブロック回路図
である。
FIG. 6 is a block circuit diagram showing a schematic configuration of a specific example of a band division adaptive transform coding apparatus to which an embodiment of the present invention can be applied.

【図7】図6の装置における帯域分割及び各帯域毎の時
間軸上でのブロック化の具体例を示す図である。
FIG. 7 is a diagram illustrating a specific example of band division and blocking on the time axis for each band in the apparatus of FIG. 6;

【図8】入力信号に対する窓かけ処理を説明するための
タイムチャートである。
FIG. 8 is a time chart for explaining windowing processing on an input signal.

【図9】直交変換符号化及び逆直交変換復号化の各処理
手順を示す図である。
FIG. 9 is a diagram showing each processing procedure of orthogonal transform coding and inverse orthogonal transform decoding.

【図10】従来の直交変換符号化及び逆直交変換復号化
の際に用いられる分析窓、合成窓、及びこれらを乗算し
た関数形状の具体例を示す図である。
FIG. 10 is a diagram illustrating a specific example of an analysis window and a synthesis window used in conventional orthogonal transform coding and inverse orthogonal transform decoding, and a function shape obtained by multiplying the analysis window and the synthesis window.

【符号の説明】[Explanation of symbols]

12・・・・・・・・ブロック化用メモリ回路 13・・・・・・・・分析窓かけ回路 14・・・・・・・・分析窓発生回路 15・・・・・・・・FFT回路 16・・・・・・・・符号化器 22・・・・・・・・復号化器 23・・・・・・・・IFFT回路 24・・・・・・・・合成窓かけ回路 25・・・・・・・・合成窓発生回路 26・・・・・・・・波形接続回路 12 Blocking memory circuit 13 Analysis windowing circuit 14 Analysis window generation circuit 15 FFT Circuit 16: Encoder 22: Decoder 23: IFFT circuit 24: Composite windowing circuit 25 ········ Synthesis window generating circuit 26 ······ Waveform connection circuit

───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭61−201526(JP,A) 特開 平3−263925(JP,A) 国際公開90/14719(WO,A1) 電子情報通信学会技術研究報告、Vo l.84,No.330、CS84−181、「窓 関数の系列化と評価」、石井他、1985年 3月、(社)電子通信学会発行 (58)調査した分野(Int.Cl.7,DB名) H03M 7/30 ────────────────────────────────────────────────── ─── Continuation of the front page (56) References JP-A-61-201526 (JP, A) JP-A-3-263925 (JP, A) International publication 90/14719 (WO, A1) IEICE technical research Report, Vol. 84, no. 330, CS84-181, "Sequencing and Evaluation of Window Functions", Ishii et al., March 1985, published by The Institute of Electronics, Information and Communication Engineers. (58) Fields surveyed (Int. Cl. 7 , DB name) H03M 7 / 30

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 入力信号に対して分析窓をかけることに
より時間軸上でブロック化し、各ブロック毎に直交変換
を施して符号化する直交変換符号化方法において、 上記分析窓として、両端部には時間軸上で隣接するブロ
ックとの重複部分よりも広い幅の肩部を有する形状の窓
関数を用い、 直交変換後の周波数軸上でのスペクトルを集中させるこ
とを特徴とする直交変換符号化方法。
1. An orthogonal transform coding method for applying an analysis window to an input signal to form a block on a time axis, and performing orthogonal transform for each block to encode the input signal. Is characterized by using a window function that has a shoulder with a width wider than the overlap with the adjacent block on the time axis, and concentrates the spectrum on the frequency axis after the orthogonal transform. Method.
【請求項2】 両端部に時間軸上で隣接するブロックと
の重複部分よりも広い幅の肩部を有する分析窓がかけら
れた後に直交変換符号化された周波数軸上の信号が入力
され、この入力信号に対して逆直交変換を施して時間軸
上の信号に変換し、上記分析窓の窓関数と乗算した結果
が隣接ブロックの重複部分と足し合わせたときに1とな
るような窓関数の合成窓を上記逆直交変換された信号に
対してかけるようになし、この合成窓がかけられた信号
を隣接ブロックの信号と接続して元の時間軸上の信号に
復元することを特徴とする逆直交変換復号化装置。
2. A signal on a frequency axis which is orthogonally transformed and coded after an analysis window having a shoulder wider than an overlapping portion with a block adjacent on the time axis is applied to both ends, A window function such that the input signal is subjected to inverse orthogonal transform to be converted into a signal on the time axis, and the result of multiplication with the window function of the analysis window becomes 1 when the result of addition with the overlapping portion of the adjacent block is added. The composite window is applied to the signal subjected to the inverse orthogonal transformation, and the composite window is connected to a signal of an adjacent block to restore the original signal on the time axis. Inverse orthogonal transform decoding device.
JP9154791A 1991-03-29 1991-03-29 Orthogonal transform coding method and inverse orthogonal transform decoding device Expired - Lifetime JP3064471B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9154791A JP3064471B2 (en) 1991-03-29 1991-03-29 Orthogonal transform coding method and inverse orthogonal transform decoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9154791A JP3064471B2 (en) 1991-03-29 1991-03-29 Orthogonal transform coding method and inverse orthogonal transform decoding device

Publications (2)

Publication Number Publication Date
JPH04302539A JPH04302539A (en) 1992-10-26
JP3064471B2 true JP3064471B2 (en) 2000-07-12

Family

ID=14029516

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9154791A Expired - Lifetime JP3064471B2 (en) 1991-03-29 1991-03-29 Orthogonal transform coding method and inverse orthogonal transform decoding device

Country Status (1)

Country Link
JP (1) JP3064471B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3213584B2 (en) * 1997-09-19 2001-10-02 シャープ株式会社 Image encoding device and image decoding device
DK1072089T3 (en) * 1998-03-25 2011-06-27 Dolby Lab Licensing Corp Method and apparatus for processing audio signals

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
電子情報通信学会技術研究報告、Vol.84,No.330、CS84−181、「窓関数の系列化と評価」、石井他、1985年3月、(社)電子通信学会発行

Also Published As

Publication number Publication date
JPH04302539A (en) 1992-10-26

Similar Documents

Publication Publication Date Title
EP0698876B1 (en) Method of decoding encoded speech signals
US8615390B2 (en) Low-delay transform coding using weighting windows
EP1914724B1 (en) Dual-transform coding of audio signals
JP3446216B2 (en) Audio signal processing method
US6681204B2 (en) Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
US20160088415A1 (en) Method and apparatus for compressing and decompressing a higher order ambisonics representation
US20150332679A1 (en) Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
US20040028244A1 (en) Audio signal decoding device and audio signal encoding device
EP1073038B1 (en) Subband audio coding system
JPH07297726A (en) Information coding method and device, information decoding method and device and information recording medium and information transmission method
JPH07273665A (en) Data compression coding method, data compression coder and data recording medium
JPH11510274A (en) Method and apparatus for generating and encoding line spectral square root
JP2003526123A (en) Audio decoder and method for decoding audio
JPH0846518A (en) Information coding and decoding method, information coder and decoder and information recording medium
JP3557674B2 (en) High efficiency coding method and apparatus
JP3064471B2 (en) Orthogonal transform coding method and inverse orthogonal transform decoding device
US5687281A (en) Bark amplitude component coder for a sampled analog signal and decoder for the coded signal
US20020040299A1 (en) Apparatus and method for performing orthogonal transform, apparatus and method for performing inverse orthogonal transform, apparatus and method for performing transform encoding, and apparatus and method for encoding data
US5588089A (en) Bark amplitude component coder for a sampled analog signal and decoder for the coded signal
JP2004325633A (en) Method and program for encoding signal, and recording medium therefor
JP3255047B2 (en) Encoding device and method
JP2958726B2 (en) Apparatus for coding and decoding a sampled analog signal with repeatability
JP3336619B2 (en) Signal processing device
JP3593201B2 (en) Audio decoding equipment
JP2905155B2 (en) Audio coding device

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000411

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090512

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100512

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100512

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110512

Year of fee payment: 11

EXPY Cancellation because of completion of term