WO2011010876A2 - Method and apparatus for window processing for interconnecting between an mdct frame and a heterogeneous frame, and encoding/decoding apparatus and method using same - Google Patents

Method and apparatus for window processing for interconnecting between an mdct frame and a heterogeneous frame, and encoding/decoding apparatus and method using same Download PDF

Info

Publication number
WO2011010876A2
WO2011010876A2 PCT/KR2010/004806 KR2010004806W WO2011010876A2 WO 2011010876 A2 WO2011010876 A2 WO 2011010876A2 KR 2010004806 W KR2010004806 W KR 2010004806W WO 2011010876 A2 WO2011010876 A2 WO 2011010876A2
Authority
WO
WIPO (PCT)
Prior art keywords
window
frame
folded
block
aliasing
Prior art date
Application number
PCT/KR2010/004806
Other languages
French (fr)
Korean (ko)
Other versions
WO2011010876A3 (en
Inventor
백승권
이태진
김민제
강경옥
장대영
서정일
김진웅
홍진우
박호종
박영철
Original Assignee
한국전자통신연구원
광운대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020100069548A external-priority patent/KR101380003B1/en
Application filed by 한국전자통신연구원, 광운대학교 산학협력단 filed Critical 한국전자통신연구원
Publication of WO2011010876A2 publication Critical patent/WO2011010876A2/en
Publication of WO2011010876A3 publication Critical patent/WO2011010876A3/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Definitions

  • the present invention relates to the field of speech / audio coding, and more particularly, to an apparatus and method for processing a window for heterogeneous inter-frame connection, and an encoding apparatus and method, a decoding apparatus and a method using the same.
  • MDCT has been used for audio / voice coding.
  • an aliasing interval occurs in the time domain due to overlap-add. This aliasing interval must be removed before the original signal can be recovered.
  • the aliasing section of the current frame to be restored is removed through overlapping with the previous frame or the subsequent frame. However, if the frame connected to the current frame does not have an aliasing period, the aliasing period of the current frame is not removed even if the overlapping is performed. Then, the original signal cannot be recovered from the current frame.
  • the present invention provides a window processing apparatus and method for connecting an MDCT frame and a heterogeneous frame having no aliasing interval, and an encoding apparatus and method, a decoding apparatus and a method using a window.
  • a window processing method performed by a window processing apparatus of an encoding apparatus includes applying a window to a frame composed of a plurality of blocks; And folding the window based on whether a subsequent frame or a previous frame linked with the frame is a frame including an aliasing term.
  • the window processing method may further include setting a region of the window in which the window is folded to a zero value.
  • An encoding method comprises the steps of receiving a frame consisting of a plurality of blocks, applying a window to the frame, a later frame or a previous frame interworking with the frame includes an aliasing term. Folding the window based on whether the frame is a frame; processing the folded window into the frame, performing frequency conversion, and encoding the frequency-converted frame to generate a bitstream. .
  • a window processing method performed by a window processing apparatus of a decoding apparatus includes extracting a frame in which a folded first window is processed from a bitstream; Generating a second window having a value opposite that of the folded window; And restoring an original signal from the frame by applying a second window to the first window.
  • a decoding method includes decoding a coded bit stream to extract a frame processed by a folded first window, performing inverse frequency transform on the extracted frame, Generating a second window having an opposite value and applying a second window to the first window to restore an original signal from the frame.
  • Window processing apparatus of the encoding apparatus includes a frame applying unit for applying a window to a frame composed of a plurality of blocks; And a window folding unit for folding the window based on whether a subsequent frame or a previous frame linked with the frame is a frame including an aliasing term.
  • the window processing apparatus of the encoding apparatus may further include a zero setting unit configured to set a region in which the window is folded in the frame to which the window is applied to a zero value.
  • An encoding apparatus includes a frame receiving unit for receiving a frame composed of a plurality of blocks, a window applying unit for applying a window to the frame, and an aliasing period in which a subsequent frame or a previous frame interworking with the frame is aliased.
  • a window folding unit for folding the window based on whether the frame includes a frame, a frequency converting unit performing frequency conversion after processing the folded window in the frame, and encoding the frequency-converted frame to encode a bitstream. It may include a bitstream generator to generate.
  • a window processing apparatus of a decoding apparatus includes a frame extracting unit for extracting a frame processed by a folded first window from a bitstream; A window generator generating a second window having a value opposite to the folded window; And a signal recovery unit which restores an original signal from the frame by applying a second window to the first window.
  • a decoding apparatus includes: a frame extractor configured to decode an encoded bit stream and extract a frame processed by a folded first window, an inverse frequency transform unit that performs inverse frequency transform on the extracted frame; And a window generator for generating a second window having a value opposite to that of the folded window, and a signal recovery unit for restoring an original signal from the frame by applying a second window to the first window.
  • FIG. 1 is a block diagram illustrating a configuration of a USAC apparatus to which an encoding apparatus and a decoding apparatus according to an embodiment of the present invention are applied.
  • FIG. 2 is a diagram for describing a process in which an aliasing interval occurs as the MDCT is performed.
  • FIG. 3 is a diagram illustrating a case in which a previous frame is not an MDCT frame that does not include an aliasing period.
  • FIG. 4 is a diagram illustrating a case where a previous frame is a CELP frame that does not include an aliasing period.
  • FIG. 5 illustrates additionally necessary transmission data when a previous frame is a CELP frame that does not include an aliasing period.
  • FIG. 6 is a diagram illustrating a window processing apparatus of an encoding apparatus and a decoding apparatus according to an embodiment of the present invention.
  • FIG. 7 illustrates an example of a window applied to an MDCT frame according to an embodiment of the present invention.
  • FIG. 8 is a diagram illustrating a process of generating a bitstream by an encoding apparatus according to an embodiment of the present invention.
  • FIG. 9 is a diagram illustrating a process of extracting an MDCT frame from a bitstream by a decoding apparatus according to an embodiment of the present invention.
  • FIG. 10 is a diagram illustrating a process of restoring an original signal by applying a window to a restored MDCT frame according to an embodiment of the present invention.
  • FIG. 11 is a diagram illustrating a process of generating a window applied to a restored MDCT frame according to an embodiment of the present invention.
  • FIG. 12 illustrates an operation performed by a window processing apparatus of an encoding apparatus according to an embodiment of the present invention when the previous frame is an MDCT frame that does not include an aliasing interval.
  • FIG. 13 is a diagram illustrating an operation performed by a window processing apparatus of a decoding apparatus according to an embodiment of the present invention when the previous frame is an MDCT frame that does not include an aliasing interval.
  • FIG. 14 is a diagram illustrating a process of restoring an original signal by applying a window to a reconstructed MDCT frame according to an embodiment of the present invention when the previous frame is an MDCT frame that does not include an aliasing interval.
  • 15 is a diagram illustrating a process of generating a window applied to a reconstructed MDCT frame according to an embodiment of the present invention when the previous frame is an MDCT frame that does not include an aliasing interval.
  • 16 is a flowchart illustrating a window processing method performed by a window processing apparatus of an encoding apparatus according to an embodiment of the present invention.
  • FIG. 17 is a flowchart illustrating a window processing method performed by a window processing apparatus of a decoding apparatus according to an embodiment of the present invention.
  • FIG. 1 is a block diagram illustrating a configuration of a USAC apparatus to which an encoding apparatus and a decoding apparatus according to an embodiment of the present invention are applied.
  • Unified Speech and Audio coding relates to a device for integrally coding speech and audio.
  • the USAC device may be viewed as a combination of the encoding device 100 and the decoding device 108.
  • an input signal to be encoded into a transform coded excitation (TCX) frame is filtered by a weighted LPC filtering unit 101, and a de-amphasis is applied by the de-emphasis unit 102 to apply a residual. It becomes a signal.
  • the encoding apparatus 100 excludes a Zero Input Response (ZIR).
  • the window processing apparatus 103 may apply a window suitable for the TCX mode, and the MDCT execution unit 104 may perform a Modified Discrete Cosine Transform (MDCT).
  • MDCT Modified Discrete Cosine Transform
  • the spectral shaping unit 105 performs spectral shaping for quantization. Then, the quantization and encoding unit 106 performs lossless coding after quantization.
  • the quantization gain calculator 111 may calculate the quantization gain based on the result of inverse MDCT performed by the IMDCT execution unit 105.
  • the spectral deshaping unit 109 performs spectral de-shaping, and the IMDCT performing unit 110 performs reverse MDCT.
  • the decoding apparatus 108 then multiplies the original signal by the quantization gain calculated from the level difference between the quantized signal and the original signal.
  • the window processing apparatus 112 applies the same window applied before performing MDCT. Thereafter, the pre-emphasis unit 113 performs pre-amphasis on the signal to which the window is applied, and the de-weighted LPC filtering unit 114 performs LPC filtering to generate a final output signal. .
  • One embodiment of the present invention relates to the window processing apparatus 103 of the encoding apparatus 100 and the window processing apparatus 112 of the decoding apparatus 108.
  • FIG. 2 is a diagram for describing a process in which an aliasing interval occurs as the MDCT is performed.
  • TDAC Time Domain Aliasing Cancellation
  • the operator is a sample-based addition operator.
  • an aliasing term occurs as shown in FIG. 2.
  • the aliasing interval is canceled through overlap-add with the previous frame, so that the original signal can be restored.
  • the aliasing section may be removed by connecting the current frame, which is an MDCT frame, with the previous frame or with the subsequent frame.
  • the previous frame and the subsequent frame should be an MDCT transform frame having the same aliasing interval as the MDCT frame.
  • FIG. 3 is a diagram illustrating a case in which a previous frame is not an MDCT frame that does not include an aliasing period.
  • the current frame is an MDCT frame including an aliasing section and the previous frame is an MDCT frame not including an aliasing section, even if the current frame and the previous frame are overlapped and added, the aliasing section of the current frame is not removed and the original signal is restored. It doesn't work.
  • FIG. 4 is a diagram illustrating a case where a previous frame is a CELP frame that does not include an aliasing period.
  • the current frame is an MDCT frame including an aliasing interval and the previous frame is a CELP frame not including the aliasing interval, even if the current frame and the previous frame are overlapped and added, the aliasing interval of the current frame is not removed and the original signal is restored. It doesn't work. This is because the CELP frame does not have data for overlapping with the current frame.
  • FIG. 5 illustrates additionally necessary transmission data when a previous frame is a CELP frame that does not include an aliasing period.
  • the current frame is an MDCT frame including an aliasing interval and the previous frame is a CELP frame that does not include the aliasing interval
  • Additional transmission data is required.
  • the transmission data is used to overlap the previous frame and the current frame and to remove the aliasing interval of the current frame.
  • a problem arises in that a bit rate is further needed due to additional transmission data.
  • the present invention provides a method of connecting a heterogeneous frame different from an MDCT frame and a previous frame or a previous frame, without requiring additional transmission data.
  • FIG. 6 is a diagram illustrating a window processing apparatus of an encoding apparatus and a decoding apparatus according to an embodiment of the present invention.
  • the window processing apparatus 103 of the encoding apparatus 100 may include a frame applying unit 601, a window folding unit 602, and a zero setting unit 603.
  • the frame applying unit 601 may apply a window to a current frame composed of a plurality of blocks.
  • the window applied by the frame applying unit 601 to the current frame will be described in detail with reference to FIG. 7.
  • the window folding unit 602 may fold the window based on whether the next frame or the previous frame interworking with the current frame is a frame including an aliasing period. A specific example of folding the window will be described with reference to FIG. 8.
  • the zero setting unit 603 may set an area in which the window is folded in the current frame to which the window is applied as a zero value.
  • the window processing apparatus 112 of the decoding apparatus 108 may include a frame extractor 604, a window generator 605, and a signal restorer 606.
  • the frame extractor 604 may extract a frame in which the folded first window is processed from the bitstream.
  • the window generator 605 may generate a second window having a value opposite to that of the folded window.
  • the signal recovery unit 606 may restore the original signal from the frame by applying the second window to the first window.
  • FIG. 7 illustrates an example of a window applied to an MDCT frame according to an embodiment of the present invention.
  • the MDCT frame may be composed of four blocks divided by the full length N into 4 / N.
  • the window of FIG. 7 may also be divided into four sections to correspond to the current frame.
  • the left region of the window corresponding to the first block of the MDCT frame and the right region corresponding to the fourth block represent a trigonometric function form.
  • the left region of the window and the right region of the window have the same value, but may be symmetrical with each other.
  • the middle region of the window corresponding to the second block and the third block of the MDCT frame may indicate a value of 1.
  • FIG. 8 is a diagram illustrating a process of generating a bitstream by an encoding apparatus according to an embodiment of the present invention.
  • the frame applying unit 601 may apply the window of FIG. 7 to an MDCT frame that is a current frame.
  • the window folding unit 602 may fold the window based on whether the next frame or the previous frame is a frame including an aliasing period in the current frame to which the window is applied. 8 assumes that a previous frame and a subsequent frame do not include an aliasing period.
  • the window folding unit 602 may fold the left region of the window corresponding to the first block into the middle region of the window.
  • the window folding unit 602 may fold the right region of the window corresponding to the second block into the middle region of the window.
  • the zero setting unit 603 may set an area in which the window is folded in the current frame to which the window is applied, to a zero value. That is, the zero setting unit 603 may set the left region and the right region folded in the window to zero values.
  • the window processing apparatus 103 may process a window in the current frame.
  • the encoding apparatus 100 may perform MDCT on the current frame processed by the window, perform quantization, and generate a bitstream.
  • the generated bitstream is transmitted to the decoding device 108.
  • FIG. 9 is a diagram illustrating a process of extracting an MDCT frame from a bitstream by a decoding apparatus according to an embodiment of the present invention.
  • the decoding apparatus 108 may receive a bitstream including the current frame in which the window is processed through the window processing apparatus 103 of the encoding apparatus 100.
  • the decoding apparatus 108 may dequantize the received bitstream and perform inverse MDCT to extract an MDCT frame that is a current frame.
  • the extracted MDCT frame is the same as the MDCT frame before the bitstream is generated in FIG. 8.
  • FIG. 10 is a diagram illustrating a process of restoring an original signal by applying a window to a restored MDCT frame according to an embodiment of the present invention.
  • the frame extractor 604 may extract a current frame in which the folded first window is processed.
  • the first window may be folded depending on whether a subsequent frame or a previous frame interworking with the current frame is a frame including an aliasing period.
  • the window processing unit 103 is the same as the window processed.
  • the frame consists of four blocks, and when the folded first window is not a frame including an aliasing interval, the left region of the window corresponding to the first block of the frame is folded into the middle region of the window. . When the first frame is not a frame including an aliasing section, the right area of the window corresponding to the second block is folded into the middle area of the window.
  • the window generator 605 may generate a second window having a value opposite to that of the folded window.
  • the second window means a window inside the dotted box in FIG. 10.
  • the process of generating the second window is described in detail with reference to FIG. 11.
  • the signal recovery unit 606 may restore the original signal from the current frame by applying the second window to the first window. That is, the original signal may be restored by removing the aliasing interval in the current frame by the second window.
  • FIG. 11 is a diagram illustrating a process of generating a window applied to a restored MDCT frame according to an embodiment of the present invention.
  • the window generator 605 may generate a second window using a window corresponding to the first block of the current frame and a window corresponding to the fourth block of the frame. This means that the previous frame and the subsequent frame of the current frame are frames that do not include an aliasing period.
  • the window generator 605 may include a window W1 (z) corresponding to the first block of the frame and a window (-W1 (z) corresponding to the fourth block of the frame) corresponding to the middle region of the frame.
  • the second window may be generated by folding to the third block. At this time, it may have a value opposite to the first frame of the frame.
  • the method of FIG. 11 refers to a case in which the previous frame and the subsequent frame of the current frame do not include an aliasing interval. However, the method of FIG. 11 is similarly similar to the case in which either the previous frame or the subsequent frame does not include the aliasing interval. Can be applied.
  • FIG. 12 illustrates an operation performed by a window processing apparatus of an encoding apparatus according to an embodiment of the present invention when the previous frame is an MDCT frame that does not include an aliasing interval.
  • the window folding unit 602 may fold only a section overlapping with the previous frame to remove the aliasing section as shown in FIG. 12. That is, only the left region of the window corresponding to the first frame of the current frame may be folded. The left region of the window may be set to zero. In contrast, if the subsequent frame is an MDCT frame including an aliasing interval, it is not necessary to fold the right area of the window to remove the aliasing interval. The rest of the procedure is the same as described in FIG.
  • FIG. 13 is a diagram illustrating an operation performed by a window processing apparatus of a decoding apparatus according to an embodiment of the present invention when the previous frame is an MDCT frame that does not include an aliasing interval.
  • FIG. 13 corresponds to FIG. 9, and the frame extractor 604 may extract a current frame processed by the first window, in which only the left region of the window corresponding to the previous frame is processed, from the bitstream.
  • FIG. 14 is a diagram illustrating a process of restoring an original signal by applying a window to a reconstructed MDCT frame according to an embodiment of the present invention when the previous frame is an MDCT frame that does not include an aliasing interval.
  • FIG. 14 corresponds to FIG. 10, and the window generator 605 may generate a second window corresponding to the first window in which only the left region of the window is folded in FIG. 13. Then, the signal recovery unit 606 may restore the original signal by applying the second window to the first window.
  • 15 is a diagram illustrating a process of generating a window applied to a reconstructed MDCT frame according to an embodiment of the present invention when the previous frame is an MDCT frame that does not include an aliasing interval.
  • FIG. 15 corresponds to FIG. 11, and unlike FIG. 11, only an area corresponding to a previous frame is folded to generate a second window. If the subsequent frame is an MDCT frame that does not include an aliasing interval, a window of a form opposite to the second window shown in FIG. 15 will be generated.
  • 16 is a flowchart illustrating a window processing method performed by a window processing apparatus of an encoding apparatus according to an embodiment of the present invention.
  • the window processing apparatus 103 may apply a window to a frame composed of a plurality of blocks (S1601). In one example, the frame may consist of four blocks. Then, the window processing apparatus 103 may apply a triangular function type window to the first block in the left region of the window and the fourth block corresponding to the right region of the window. The window processing apparatus 103 may apply a window having a value of 1 to the second block and the third block corresponding to the middle region of the window.
  • the window processing apparatus 103 may fold the window based on whether a subsequent frame or a previous frame that interlocks with the frame is a frame including an aliasing term (S1602).
  • the window processing apparatus 103 may fold the left region of the window corresponding to the first block into the middle region of the window. If the frame is not a frame including an aliasing period, the window processing apparatus 103 may fold the right region of the window corresponding to the second block into the middle region of the window.
  • the window processing apparatus 103 may set an area in which the window is folded in the frame to which the window is applied to a zero value (S1603).
  • FIG. 17 is a flowchart illustrating a window processing method performed by a window processing apparatus of a decoding apparatus according to an embodiment of the present invention.
  • the window processing apparatus 112 may extract a frame in which the folded first window is processed from the bitstream (S1701).
  • the folded first window may be folded depending on whether a subsequent frame or a previous frame interworking with the frame is a frame including an aliasing term.
  • the frame may consist of four blocks. If the previous frame is not a frame including an aliasing interval, the folded first window is a region in which the left region of the window corresponding to the first block of the frame is folded into the middle region of the window. Then, when the frame is not a frame including an aliasing interval, the folded first window is a right region of the window corresponding to the second block is folded into the middle region of the window.
  • the window processing apparatus 112 may generate a second window having a value opposite to that of the folded window (S1702). For example, the window processing apparatus 112 may generate the window using the window corresponding to the first block of the frame or the window corresponding to the fourth block of the frame. At this time, the window corresponding to the fourth block of the frame may have a value opposite to the first frame of the frame. In detail, the window processing apparatus 112 may generate a second window by folding a window corresponding to the first block of the frame or a window corresponding to the fourth block of the frame into a second block and a third block corresponding to the middle region of the frame. have.
  • the window processing apparatus 112 may restore the original signal from the frame by applying the second window to the first window (S1703).
  • Methods according to an embodiment of the present invention can be implemented in the form of program instructions that can be executed by various computer means and recorded in a computer readable medium.
  • the computer readable medium may include program instructions, data files, data structures, and the like, alone or in combination.
  • Program instructions recorded on the media may be those specially designed and constructed for the purposes of the present invention, or they may be of the kind well-known and available to those having skill in the computer software arts.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Disclosed are an apparatus and method for window processing for connecting between an MDCT frame and a heterogeneous frame, an encoding apparatus and encoding method, and a decoding apparatus and decoding method. The window processing method involves applying, to the MDCT frame, a window for interconnection between the MDCT frame and a frame having no aliasing term, so as to satisfy TDAC conditions for the recovery of an original signal.

Description

MDCT 프레임과 이종의 프레임 연결을 위한 윈도우 처리 방법 및 장치, 이를 이용한 부호화/복호화 장치 및 방법Window processing method and device for connecting MDCT frame and heterogeneous frame, encoding / decoding device and method using same
본 발명은 음성/오디오 코딩 분야에 관한 것으로, 특히 이종의 프레임 간 연결을 위해 윈도우를 처리하는 장치 및 방법, 그리고 이를 이용한 부호화 장치 및 방법, 복호화 장치 및 방법에 관한 것이다.TECHNICAL FIELD The present invention relates to the field of speech / audio coding, and more particularly, to an apparatus and method for processing a window for heterogeneous inter-frame connection, and an encoding apparatus and method, a decoding apparatus and a method using the same.
오디오/음성 부호화를 위해 MDCT가 사용되어 왔다. 이 때, MDCT를 적용하면 오버랩 애드(overlap-add)로 인해 시간 도메인에서 앨리어싱 구간이 발생한다. 이러한 앨리어싱 구간을 제거해야 원래 신호가 복원될 수 있다.MDCT has been used for audio / voice coding. In this case, when the MDCT is applied, an aliasing interval occurs in the time domain due to overlap-add. This aliasing interval must be removed before the original signal can be recovered.
복원하고자 하는 현재 프레임의 앨리어싱 구간은 이전 프레임 또는 이후 프레임과의 오버랩을 통해 제거된다. 그러나, 현재 프레임과 연결된 프레임이 앨리어싱 구간을 갖지 않는 경우, 오버랩을 수행하더라도 현재 프레임의 앨리어싱 구간이 제거되지 않는다. 그러면, 현재 프레임으로부터 원래 신호를 복원할 수 없다.The aliasing section of the current frame to be restored is removed through overlapping with the previous frame or the subsequent frame. However, if the frame connected to the current frame does not have an aliasing period, the aliasing period of the current frame is not removed even if the overlapping is performed. Then, the original signal cannot be recovered from the current frame.
결국, 앨리어싱 구간을 갖는 MDCT 프레임에 이종의 프레임이 연결되더라도 원래 신호를 복원할 수 있는 방법이 요구된다.As a result, even if a heterogeneous frame is connected to an MDCT frame having an aliasing interval, a method for restoring an original signal is required.
본 발명은 MDCT 프레임과 앨리어싱 구간을 갖지 않는 이종의 프레임과 연결하기 위한 윈도우 처리 장치 및 방법, 그리고 윈도우를 이용한 부호화 장치 및 방법, 복호화 장치 및 방법을 제공한다.The present invention provides a window processing apparatus and method for connecting an MDCT frame and a heterogeneous frame having no aliasing interval, and an encoding apparatus and method, a decoding apparatus and a method using a window.
본 발명의 일실시예에 따른 부호화 장치의 윈도우 처리 장치가 수행하는 윈도우 처리 방법은 복수의 블록으로 구성된 프레임에 윈도우를 적용하는 단계; 및 상기 프레임과 연동하는 이후 프레임 또는 이전 프레임이 앨리어싱 구간(aliasing term)을 포함하는 프레임인지 여부에 기초하여 상기 윈도우를 폴딩하는 단계를 포함할 수 있다.A window processing method performed by a window processing apparatus of an encoding apparatus according to an embodiment of the present invention includes applying a window to a frame composed of a plurality of blocks; And folding the window based on whether a subsequent frame or a previous frame linked with the frame is a frame including an aliasing term.
본 발명의 일측면에 따르면, 상기 윈도우 처리 방법은 상기 윈도우가 적용된 프레임에서 상기 윈도우를 폴딩한 영역을 제로 값으로 설정하는 단계를 더 포함할 수 있다.According to an aspect of the present invention, the window processing method may further include setting a region of the window in which the window is folded to a zero value.
본 발명의 일실시예에 따른 부호화 방법은 복수의 블록으로 구성된 프레임을 수신하는 단계, 상기 프레임에 윈도우를 적용하는 단계, 상기 프레임과 연동하는 이후 프레임 또는 이전 프레임이 앨리어싱 구간(aliasing term)을 포함하는 프레임인지 여부에 기초하여 상기 윈도우를 폴딩하는 단계 상기 폴딩된 윈도우를 상기 프레임에 처리한 후 주파수 변환을 수행하는 단계 및 상기 주파수 변환된 프레임을 부호화하여 비트스트림을 생성하는 단계를 포함할 수 있다.An encoding method according to an embodiment of the present invention comprises the steps of receiving a frame consisting of a plurality of blocks, applying a window to the frame, a later frame or a previous frame interworking with the frame includes an aliasing term. Folding the window based on whether the frame is a frame; processing the folded window into the frame, performing frequency conversion, and encoding the frequency-converted frame to generate a bitstream. .
본 발명의 일실시예에 따른 복호화 장치의 윈도우 처리 장치가 수행하는 윈도우 처리 방법은 비트스트림으로부터 폴딩된 제1 윈도우가 처리된 프레임을 추출하는 단계; 상기 폴딩된 윈도우와 반대되는 값을 가지는 제2 윈도우를 생성하는 단계; 및 상기 제1 윈도우에 제2 윈도우를 적용하여 상기 프레임으로부터 원래 신호를 복원하는 단계를 포함할 수 있다.A window processing method performed by a window processing apparatus of a decoding apparatus according to an embodiment of the present invention includes extracting a frame in which a folded first window is processed from a bitstream; Generating a second window having a value opposite that of the folded window; And restoring an original signal from the frame by applying a second window to the first window.
본 발명의 일실시예에 따른 복호화 방법은 부호화된 비트 스트림을 디코딩하여 폴딩된 제1 윈도우가 처리된 프레임을 추출하는 단계, 상기 추출된 프레임에 역 주파수 변환을 수행하는 단계, 상기 폴딩된 윈도우와 반대되는 값을 가지는 제2 윈도우를 생성하는 단계 및 상기 제1 윈도우에 제2 윈도우를 적용하여 상기 프레임으로부터 원래 신호를 복원하는 단계를 포함할 수 있다.A decoding method according to an embodiment of the present invention includes decoding a coded bit stream to extract a frame processed by a folded first window, performing inverse frequency transform on the extracted frame, Generating a second window having an opposite value and applying a second window to the first window to restore an original signal from the frame.
본 발명의 일실시예에 따른 부호화 장치의 윈도우 처리 장치는 복수의 블록으로 구성된 프레임에 윈도우를 적용하는 프레임 적용부; 및 상기 프레임과 연동하는 이후 프레임 또는 이전 프레임이 앨리어싱 구간(aliasing term)을 포함하는 프레임인지 여부에 기초하여 상기 윈도우를 폴딩하는 윈도우 폴딩부를 포함할 수 있다.Window processing apparatus of the encoding apparatus according to an embodiment of the present invention includes a frame applying unit for applying a window to a frame composed of a plurality of blocks; And a window folding unit for folding the window based on whether a subsequent frame or a previous frame linked with the frame is a frame including an aliasing term.
본 발명의 일실시예에 따른 부호화 장치의 윈도우 처리 장치는 상기 윈도우가 적용된 프레임에서 상기 윈도우를 폴딩한 영역을 제로 값으로 설정하는 제로 설정부를 더 포함할 수 있다.The window processing apparatus of the encoding apparatus according to the embodiment of the present invention may further include a zero setting unit configured to set a region in which the window is folded in the frame to which the window is applied to a zero value.
본 발명의 일실시예에 따른 부호화 장치는 복수의 블록으로 구성된 프레임을 수신하는 프레임 수신부, 상기 프레임에 윈도우를 적용하는 윈도우 적용부, 상기 프레임과 연동하는 이후 프레임 또는 이전 프레임이 앨리어싱 구간(aliasing term)을 포함하는 프레임인지 여부에 기초하여 상기 윈도우를 폴딩하는 윈도우 폴딩부, 상기 폴딩된 윈도우를 상기 프레임에 처리한 후 주파수 변환을 수행하는 주파수 변환부 및 상기 주파수 변환된 프레임을 부호화하여 비트스트림을 생성하는 비트스트림 생성부를 포함할 수 있다.An encoding apparatus according to an embodiment of the present invention includes a frame receiving unit for receiving a frame composed of a plurality of blocks, a window applying unit for applying a window to the frame, and an aliasing period in which a subsequent frame or a previous frame interworking with the frame is aliased. A window folding unit for folding the window based on whether the frame includes a frame, a frequency converting unit performing frequency conversion after processing the folded window in the frame, and encoding the frequency-converted frame to encode a bitstream. It may include a bitstream generator to generate.
본 발명의 일실시예에 따른 복호화 장치의 윈도우 처리 장치는 비트스트림으로부터 폴딩된 제1 윈도우가 처리된 프레임을 추출하는 프레임 추출부; 상기 폴딩된 윈도우와 반대되는 값을 가지는 제2 윈도우를 생성하는 윈도우 생성부; 및 상기 제1 윈도우에 제2 윈도우를 적용하여 상기 프레임으로부터 원래 신호를 복원하는 신호 복원부를 포함할 수 있다.A window processing apparatus of a decoding apparatus according to an embodiment of the present invention includes a frame extracting unit for extracting a frame processed by a folded first window from a bitstream; A window generator generating a second window having a value opposite to the folded window; And a signal recovery unit which restores an original signal from the frame by applying a second window to the first window.
본 발명의 일실시예에 따른 복호화 장치는 부호화된 비트 스트림을 디코딩하여 폴딩된 제1 윈도우가 처리된 프레임을 추출하는 프레임 추출부, 상기 추출된 프레임에 역 주파수 변환을 수행하는 역 주파수 변환부, 상기 폴딩된 윈도우와 반대되는 값을 가지는 제2 윈도우를 생성하는 윈도우 생성부 및 상기 제1 윈도우에 제2 윈도우를 적용하여 상기 프레임으로부터 원래 신호를 복원하는 신호 복원부를 포함할 수 있다.According to an embodiment of the present invention, a decoding apparatus includes: a frame extractor configured to decode an encoded bit stream and extract a frame processed by a folded first window, an inverse frequency transform unit that performs inverse frequency transform on the extracted frame; And a window generator for generating a second window having a value opposite to that of the folded window, and a signal recovery unit for restoring an original signal from the frame by applying a second window to the first window.
본 발명의 일실시예에 따르면, 앨리어싱 구간을 제거하기 위한 추가적인 전송 데이터를 요구하지 않아 비트레이트 증가를 방지할 수 있다.According to one embodiment of the present invention, it is possible to prevent the increase of the bit rate by not requiring additional transmission data for removing the aliasing interval.
도 1은 본 발명의 일실시예에 따른 부호화 장치 및 복호화 장치가 적용되는 USAC 장치의 구성을 도시한 블록 다이어그램이다.1 is a block diagram illustrating a configuration of a USAC apparatus to which an encoding apparatus and a decoding apparatus according to an embodiment of the present invention are applied.
도 2는 MDCT를 수행함에 따라 앨리어싱 구간이 발생하는 과정을 설명하기 위한 도면이다.2 is a diagram for describing a process in which an aliasing interval occurs as the MDCT is performed.
도 3은 이전 프레임이 앨리어싱 구간을 포함하지 않는 MDCT 프레임이 아닌 경우를 나타내는 도면이다.3 is a diagram illustrating a case in which a previous frame is not an MDCT frame that does not include an aliasing period.
도 4는 이전 프레임이 앨리어싱 구간을 포함하지 않는 CELP 프레임인 경우를 나타내는 도면이다.4 is a diagram illustrating a case where a previous frame is a CELP frame that does not include an aliasing period.
도 5는 이전 프레임이 앨리어싱 구간을 포함하지 않는 CELP 프레임인 경우, 추가적으로 필요한 전송 데이터를 도시한 도면이다.FIG. 5 illustrates additionally necessary transmission data when a previous frame is a CELP frame that does not include an aliasing period.
도 6은 본 발명의 일실시예에 따른 부호화 장치 및 복호화 장치의 윈도우 처리 장치를 도시한 도면이다.6 is a diagram illustrating a window processing apparatus of an encoding apparatus and a decoding apparatus according to an embodiment of the present invention.
도 7은 본 발명의 일실시예에 따라 MDCT 프레임에 적용하는 윈도우의 일례를 도시한 도면이다.7 illustrates an example of a window applied to an MDCT frame according to an embodiment of the present invention.
도 8은 본 발명의 일실시예에 따라 부호화 장치가 비트스트림을 생성하는 과정을 도시한 도면이다.8 is a diagram illustrating a process of generating a bitstream by an encoding apparatus according to an embodiment of the present invention.
도 9는 본 발명의 일실시예에 따라 복호화 장치가 비트스트림으로부터 MDCT 프레임을 추출하는 과정을 도시한 도면이다.9 is a diagram illustrating a process of extracting an MDCT frame from a bitstream by a decoding apparatus according to an embodiment of the present invention.
도 10은 본 발명의 일실시예에 따라 복원된 MDCT 프레임에 윈도우를 적용하여 원래 신호를 복원하는 과정을 도시한 도면이다.10 is a diagram illustrating a process of restoring an original signal by applying a window to a restored MDCT frame according to an embodiment of the present invention.
도 11은 본 발명의 일실시예에 따라 복원된 MDCT 프레임에 적용하는 윈도우를 생성하는 과정을 도시한 도면이다.11 is a diagram illustrating a process of generating a window applied to a restored MDCT frame according to an embodiment of the present invention.
도 12는 이전 프레임이 앨리어싱 구간을 포함하지 않는 MDCT 프레임인 경우, 본 발명의 일실시예에 따라 부호화 장치의 윈도우 처리 장치가 수행하는 동작을 도시한 도면이다.12 illustrates an operation performed by a window processing apparatus of an encoding apparatus according to an embodiment of the present invention when the previous frame is an MDCT frame that does not include an aliasing interval.
도 13은 이전 프레임이 앨리어싱 구간을 포함하지 않는 MDCT 프레임인 경우, 본 발명의 일실시예에 따라 복호화 장치의 윈도우 처리 장치가 수행하는 동작을 도시한 도면이다.13 is a diagram illustrating an operation performed by a window processing apparatus of a decoding apparatus according to an embodiment of the present invention when the previous frame is an MDCT frame that does not include an aliasing interval.
도 14는 이전 프레임이 앨리어싱 구간을 포함하지 않는 MDCT 프레임인 경우, 본 발명의 일실시예에 따라 복원된 MDCT 프레임에 윈도우를 적용하여 원래 신호를 복원하는 과정을 도시한 도면이다.14 is a diagram illustrating a process of restoring an original signal by applying a window to a reconstructed MDCT frame according to an embodiment of the present invention when the previous frame is an MDCT frame that does not include an aliasing interval.
도 15는 이전 프레임이 앨리어싱 구간을 포함하지 않는 MDCT 프레임인 경우, 본 발명의 일실시예에 따라 복원된 MDCT 프레임에 적용하는 윈도우를 생성하는 과정을 도시한 도면이다.15 is a diagram illustrating a process of generating a window applied to a reconstructed MDCT frame according to an embodiment of the present invention when the previous frame is an MDCT frame that does not include an aliasing interval.
도 16은 본 발명의 일실시예에 따른 부호화 장치의 윈도우 처리 장치가 수행하는 윈도우 처리 방법을 도시한 플로우차트이다.16 is a flowchart illustrating a window processing method performed by a window processing apparatus of an encoding apparatus according to an embodiment of the present invention.
도 17은 본 발명의 일실시예에 따른 복호화 장치의 윈도우 처리 장치가 수행하는 윈도우 처리 방법을 도시한 플로우차트이다.17 is a flowchart illustrating a window processing method performed by a window processing apparatus of a decoding apparatus according to an embodiment of the present invention.
이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 1은 본 발명의 일실시예에 따른 부호화 장치 및 복호화 장치가 적용되는 USAC 장치의 구성을 도시한 블록 다이어그램이다.1 is a block diagram illustrating a configuration of a USAC apparatus to which an encoding apparatus and a decoding apparatus according to an embodiment of the present invention are applied.
USAC(Unified Speech and Audio coding)은 음성 및 오디오를 통합적으로 코딩하는 장치에 관한 것이다. 도 1을 참고하면, USAC 장치는 부호화 장치(100)와 복호화 장치(108)가 결합된 형태로 볼 수 있다.Unified Speech and Audio coding (USAC) relates to a device for integrally coding speech and audio. Referring to FIG. 1, the USAC device may be viewed as a combination of the encoding device 100 and the decoding device 108.
부호화 장치(100)는 TCX (Transform Coded Excitation) 프레임으로 부호화될 입력 신호는 가중 LPC 필터링부(101)에 의해 필터링되고, 디엠퍼시스부(102)에 의해 디엠퍼시스(De-Amphasis)가 적용되어 잔차 신호가 된다. 이 때, 이전 프레임이 CELP (Code Excited Linear Prediction)였다면, 부호화 장치(100)는 ZIR(Zero Input Response)를 제외한다. 이후, 윈도우 처리 장치(103)는 TCX 모드에 맞는 윈도우를 적용하고, MDCT 수행부(104)는 MDCT(Modified Discrete Cosine Transform)를 수행할 수 있다.In the encoding apparatus 100, an input signal to be encoded into a transform coded excitation (TCX) frame is filtered by a weighted LPC filtering unit 101, and a de-amphasis is applied by the de-emphasis unit 102 to apply a residual. It becomes a signal. At this time, if the previous frame was a CELP (Code Excited Linear Prediction), the encoding apparatus 100 excludes a Zero Input Response (ZIR). Thereafter, the window processing apparatus 103 may apply a window suitable for the TCX mode, and the MDCT execution unit 104 may perform a Modified Discrete Cosine Transform (MDCT).
스펙트럴 쉐이핑부(105)는 양자화를 위한 스펙트럴 쉐이핑(spectral shaping)을 수행한다. 그러면, 양자화 및 부호화부(106)는 양자화를 수행하고 난 후 Lossless Coding을 수행한다.The spectral shaping unit 105 performs spectral shaping for quantization. Then, the quantization and encoding unit 106 performs lossless coding after quantization.
복호화 장치(108)에서, 양자화 게인 계산부(111)는 IMDCT 수행부(105)를 통해 역 MDCT 수행된 결과를 통해 양자화 게인을 계산할 수 있다. 그리고, 스펙트럴 디쉐이핑부(109)는 스펙트럴 디쉐이핑(spectral de-shaping)을 수행하고, IMDCT 수행부(110)는 역 MDCT를 수행한다. 그러면, 복호화 장치(108)는 양자화된 신호와 원래 신호 간의 레벨차로부터 계산된 양자화 게인을 원래 신호에 곱한다. 윈도우 처리 장치(112)는 MDCT 수행하기 이전에 적용한 동일한 윈도우를 적용한다. 이 후, 프리엠퍼시스부(113)는 윈도우가 적용된 신호에 프리 엠퍼시스(Pre-Amphasis)를 수행하고, 디가중 LPC 필터링부(114)는 LPC 필터링을 수행하여 최종적인 출력 신호를 생성한다.In the decoding apparatus 108, the quantization gain calculator 111 may calculate the quantization gain based on the result of inverse MDCT performed by the IMDCT execution unit 105. The spectral deshaping unit 109 performs spectral de-shaping, and the IMDCT performing unit 110 performs reverse MDCT. The decoding apparatus 108 then multiplies the original signal by the quantization gain calculated from the level difference between the quantized signal and the original signal. The window processing apparatus 112 applies the same window applied before performing MDCT. Thereafter, the pre-emphasis unit 113 performs pre-amphasis on the signal to which the window is applied, and the de-weighted LPC filtering unit 114 performs LPC filtering to generate a final output signal. .
본 발명의 일실시예들은 부호화 장치(100)의 윈도우 처리 장치(103)와 복호화 장치(108)의 윈도우 처리 장치(112)에 관한 것이다. One embodiment of the present invention relates to the window processing apparatus 103 of the encoding apparatus 100 and the window processing apparatus 112 of the decoding apparatus 108.
도 2는 MDCT를 수행함에 따라 앨리어싱 구간이 발생하는 과정을 설명하기 위한 도면이다.2 is a diagram for describing a process in which an aliasing interval occurs as the MDCT is performed.
도 2는 MDCT를 수행하려는 MDCT 프레임 간의 오버랩 애드 과정을 나타내며, 이전 프레임 및 이후 프레임이 MDCT 프레임과 연결되기 위해서는 TDAC(Time Domain Aliasing Cancellation)을 만족해야 한다.2 illustrates an overlap add process between MDCT frames to perform MDCT, and in order for a previous frame and a subsequent frame to be connected to an MDCT frame, TDAC (Time Domain Aliasing Cancellation) must be satisfied.
Figure PCTKR2010004806-appb-I000001
에서, org는 부호화 되기 이전의 원래 신호임을 나타내며, z는 z-transform domain을 나타낸다.
Figure PCTKR2010004806-appb-I000002
기호는 블록 단위로 곱하기 연산을 수행하는 연산자로,
Figure PCTKR2010004806-appb-I000003
는 복원된 신호라고 가정한다. 도 2를 수식으로 표현하면, 하기 수학식 1과 같다.
Figure PCTKR2010004806-appb-I000001
Where org represents the original signal before encoding and z represents the z-transform domain.
Figure PCTKR2010004806-appb-I000002
Symbols are operators that perform multiply operations on a block basis.
Figure PCTKR2010004806-appb-I000003
Is assumed to be the recovered signal. 2 is expressed by an equation, and is equal to Equation 1 below.
Figure PCTKR2010004806-appb-I000004
Figure PCTKR2010004806-appb-I000004
Figure PCTKR2010004806-appb-I000005
연산자는 샘플단위 덧셈 연산자로 다음과 같다.
Figure PCTKR2010004806-appb-I000005
The operator is a sample-based addition operator.
Figure PCTKR2010004806-appb-I000006
Figure PCTKR2010004806-appb-I000006
부호화하려는 현재 프레임(current frame)에 대해서 윈도우(W)를 곱해주고 MDCT 변환/역변환을 수행하면, 도 2와 같이 앨리어싱 구간(aliasing term)이 발생한다. 앨리어싱 구간은 이전 프레임과 오버랩 애드(overlap-add)를 통해 상쇄됨으로써, 원래 신호가 복원될 수 있다. 이렇게, MDCT 변환을 적용하면 시간 축 상에서 앨리어싱 구간이 발생하며, 이러한 앨리어싱 구간이 제거되어야 원래 신호가 복원될 수 있다. 이 때, 앨리어싱 구간은 MDCT 프레임인 현재 프레임이 이전 프레임과 연결되거나 이후 프레임과 연결됨으로써 제거될 수 있다. 이 때, 이전 프레임과 이후 프레임은 MDCT 프레임과 동일한 앨리어싱 구간을 갖는 MDCT 변환 프레임이어야 한다. 이런 조건이 만족했을 때, TDAC가 성립되어 앨리어싱 구간이 제거될 수 있다. When the current frame to be encoded is multiplied by the window W and MDCT transform / inverse transform is performed, an aliasing term occurs as shown in FIG. 2. The aliasing interval is canceled through overlap-add with the previous frame, so that the original signal can be restored. In this way, when the MDCT transformation is applied, an aliasing interval is generated on the time axis, and the original signal may be restored when the aliasing interval is removed. In this case, the aliasing section may be removed by connecting the current frame, which is an MDCT frame, with the previous frame or with the subsequent frame. At this time, the previous frame and the subsequent frame should be an MDCT transform frame having the same aliasing interval as the MDCT frame. When this condition is satisfied, the TDAC can be established and the aliasing interval can be eliminated.
도 3은 이전 프레임이 앨리어싱 구간을 포함하지 않는 MDCT 프레임이 아닌 경우를 나타내는 도면이다.3 is a diagram illustrating a case in which a previous frame is not an MDCT frame that does not include an aliasing period.
만약, 현재 프레임이 앨리어싱 구간을 포함하는 MDCT 프레임이고, 이전 프레임이 앨리어싱 구간을 포함하지 않는 MDCT 프레임인 경우, 현재 프레임과 이전 프레임이 오버랩 애드되더라도 현재 프레임의 앨리어싱 구간이 제거되지 않아 원래 신호가 복원되지 않는다.If the current frame is an MDCT frame including an aliasing section and the previous frame is an MDCT frame not including an aliasing section, even if the current frame and the previous frame are overlapped and added, the aliasing section of the current frame is not removed and the original signal is restored. It doesn't work.
도 4는 이전 프레임이 앨리어싱 구간을 포함하지 않는 CELP 프레임인 경우를 나타내는 도면이다.4 is a diagram illustrating a case where a previous frame is a CELP frame that does not include an aliasing period.
만약, 현재 프레임이 앨리어싱 구간을 포함하는 MDCT 프레임이고, 이전 프레임이 앨리어싱 구간을 포함하지 않는 CELP 프레임인 경우, 현재 프레임과 이전 프레임이 오버랩 애드되더라도 현재 프레임의 앨리어싱 구간이 제거되지 않아 원래 신호가 복원되지 않는다. 왜냐하면, CELP 프레임은 현재 프레임과 오버랩 애드하기 위한 데이터가 존재하지 않기 때문이다.If the current frame is an MDCT frame including an aliasing interval and the previous frame is a CELP frame not including the aliasing interval, even if the current frame and the previous frame are overlapped and added, the aliasing interval of the current frame is not removed and the original signal is restored. It doesn't work. This is because the CELP frame does not have data for overlapping with the current frame.
도 5는 이전 프레임이 앨리어싱 구간을 포함하지 않는 CELP 프레임인 경우, 추가적으로 필요한 전송 데이터를 도시한 도면이다.FIG. 5 illustrates additionally necessary transmission data when a previous frame is a CELP frame that does not include an aliasing period.
앞서 설명하였듯이, 현재 프레임이 앨리어싱 구간을 포함하는 MDCT 프레임이고, 이전 프레임이 앨리어싱 구간을 포함하지 않는 CELP 프레임인 경우, CELP 프레임에 현재 프레임인 MDCT 프레임과 연결하기 위한
Figure PCTKR2010004806-appb-I000007
의 추가적인 전송 데이터가 요구된다. 그러면, 전송 데이터는 이전 프레임과 현재 프레임을 오버랩 애드하고, 현재 프레임의 앨리어싱 구간을 제거하는 데 사용된다. 이 경우, 추가적인 전송 데이터로 인해서 비트레이트가 더 필요하게 되는 문제가 발생한다. 본 발명에서는 추가적인 전송 데이터를 요구하지 않고도 현재 프레임인 MDCT 프레임과 이전 프레임 또는 이후 프레임이 MDCT 프레임과 다른 이종의 프레임을 연결하는 방법을 제시한다.
As described above, when the current frame is an MDCT frame including an aliasing interval and the previous frame is a CELP frame that does not include the aliasing interval,
Figure PCTKR2010004806-appb-I000007
Additional transmission data is required. Then, the transmission data is used to overlap the previous frame and the current frame and to remove the aliasing interval of the current frame. In this case, a problem arises in that a bit rate is further needed due to additional transmission data. The present invention provides a method of connecting a heterogeneous frame different from an MDCT frame and a previous frame or a previous frame, without requiring additional transmission data.
도 6은 본 발명의 일실시예에 따른 부호화 장치 및 복호화 장치의 윈도우 처리 장치를 도시한 도면이다.6 is a diagram illustrating a window processing apparatus of an encoding apparatus and a decoding apparatus according to an embodiment of the present invention.
본 발명의 일실시예에 따른 부호화 장치(100)의 윈도우 처리 장치(103)는 프레임 적용부(601), 윈도우 폴딩부(602) 및 제로 설정부(603)를 포함할 수 있다.The window processing apparatus 103 of the encoding apparatus 100 according to an embodiment of the present invention may include a frame applying unit 601, a window folding unit 602, and a zero setting unit 603.
프레임 적용부(601)는 복수의 블록으로 구성된 현재 프레임에 윈도우를 적용할 수 있다. 프레임 적용부(601)가 현재 프레임에 적용하는 윈도우는 도 7에서 구체적으로 설명하기로 한다.The frame applying unit 601 may apply a window to a current frame composed of a plurality of blocks. The window applied by the frame applying unit 601 to the current frame will be described in detail with reference to FIG. 7.
윈도우 폴딩부(602)는 현재 프레임과 연동하는 이후 프레임 또는 이전 프레임이 앨리어싱 구간을 포함하는 프레임인지 여부에 기초하여 윈도우를 폴딩할 수 있다. 윈도우를 폴딩하는 구체적인 예는 도 8에서 설명하기로 한다.The window folding unit 602 may fold the window based on whether the next frame or the previous frame interworking with the current frame is a frame including an aliasing period. A specific example of folding the window will be described with reference to FIG. 8.
제로 설정부(603)는 윈도우가 적용된 현재 프레임에서 윈도우를 폴딩한 영역을 제로 값으로 설정할 수 있다.The zero setting unit 603 may set an area in which the window is folded in the current frame to which the window is applied as a zero value.
본 발명의 일실시예에 따른 복호화 장치(108)의 윈도우 처리 장치(112)는 프레임 추출부(604), 윈도우 생성부(605) 및 신호 복원부(606)를 포함할 수 있다.The window processing apparatus 112 of the decoding apparatus 108 according to an embodiment of the present invention may include a frame extractor 604, a window generator 605, and a signal restorer 606.
프레임 추출부(604)는 비트스트림으로부터 폴딩된 제1 윈도우가 처리된 프레임을 추출할 수 있다.The frame extractor 604 may extract a frame in which the folded first window is processed from the bitstream.
윈도우 생성부(605)는 폴딩된 윈도우와 반대되는 값을 가지는 제2 윈도우를 생성할 수 있다.The window generator 605 may generate a second window having a value opposite to that of the folded window.
신호 복원부(606)는 제1 윈도우에 제2 윈도우를 적용하여 프레임으로부터 원래 신호를 복원할 수 있다.The signal recovery unit 606 may restore the original signal from the frame by applying the second window to the first window.
도 7은 본 발명의 일실시예에 따라 MDCT 프레임에 적용하는 윈도우의 일례를 도시한 도면이다.7 illustrates an example of a window applied to an MDCT frame according to an embodiment of the present invention.
도 7을 참고하면, 현재 프레임인 MDCT 프레임에 적용되는 윈도우를 나타낸다. MDCT 프레임은 전체 길이 N을 4/N으로 분할한 4개의 블록으로 구성될 수 있다. 도 7의 윈도우도 현재 프레임에 대응되도록 4개의 구간으로 구분될 수 있다. 이 때, MDCT 프레임의 첫번째 블록에 대응하는 윈도우의 왼쪽 영역과 네번째 블록에 대응하는 오른쪽 영역은 삼각 함수 형태를 나타낸다. 이 때, 윈도우의 왼쪽 영역과 윈도우의 오른쪽 영역은 동일한 값을 가지지만, 서로 대칭될 수 있다. 그리고, MDCT 프레임의 두번째 블록과 세번째 블록에 대응하는 윈도우의 중간 영역은 1의 값을 나타낼 수 있다. Referring to FIG. 7, a window applied to an MDCT frame that is a current frame is shown. The MDCT frame may be composed of four blocks divided by the full length N into 4 / N. The window of FIG. 7 may also be divided into four sections to correspond to the current frame. At this time, the left region of the window corresponding to the first block of the MDCT frame and the right region corresponding to the fourth block represent a trigonometric function form. At this time, the left region of the window and the right region of the window have the same value, but may be symmetrical with each other. The middle region of the window corresponding to the second block and the third block of the MDCT frame may indicate a value of 1.
도 8은 본 발명의 일실시예에 따라 부호화 장치가 비트스트림을 생성하는 과정을 도시한 도면이다.8 is a diagram illustrating a process of generating a bitstream by an encoding apparatus according to an embodiment of the present invention.
프레임 적용부(601)는 도 7의 윈도우를 현재 프레임인 MDCT 프레임에 적용할 수 있다. 그리고, 윈도우 폴딩부(602)는 윈도우가 적용된 현재 프레임에서 이후 프레임 또는 이전 프레임이 앨리어싱 구간을 포함하는 프레임인지 여부에 기초하여 윈도우를 폴딩할 수 있다. 도 8은 이전 프레임 및 이후 프레임이 앨리어싱 구간을 포함하지 않는 프레임으로 가정한다.The frame applying unit 601 may apply the window of FIG. 7 to an MDCT frame that is a current frame. The window folding unit 602 may fold the window based on whether the next frame or the previous frame is a frame including an aliasing period in the current frame to which the window is applied. 8 assumes that a previous frame and a subsequent frame do not include an aliasing period.
그러면, 윈도우 폴딩부(602)는 이전 프레임이 앨리어싱 구간을 포함하는 프레임이 아닌 경우, 첫번째 블록에 대응하는 윈도우의 왼쪽 영역을 윈도우의 중간 영역으로 폴딩할 수 있다. 그리고 윈도우 폴딩부(602)는 이후 프레임이 앨리어싱 구간을 포함하는 프레임이 아닌 경우, 두번째 블록에 대응하는 윈도우의 오른쪽 영역을 윈도우의 중간 영역으로 폴딩할 수 있다.Then, when the previous frame is not a frame including an aliasing period, the window folding unit 602 may fold the left region of the window corresponding to the first block into the middle region of the window. When the frame is not a frame including an aliasing interval, the window folding unit 602 may fold the right region of the window corresponding to the second block into the middle region of the window.
이 후, 제로 설정부(603)는 윈도우가 적용된 현재 프레임에서 윈도우를 폴딩한 영역을 제로(zero) 값으로 설정할 수 있다. 즉, 제로 설정부(603)는 윈도우에서 폴딩된 왼쪽 영역과 오른쪽 영역을 제로 값으로 설정할 수 있다. 이러한 과정을 통해 윈도우 처리 장치(103)는 현재 프레임에 윈도우를 처리할 수 있다.Thereafter, the zero setting unit 603 may set an area in which the window is folded in the current frame to which the window is applied, to a zero value. That is, the zero setting unit 603 may set the left region and the right region folded in the window to zero values. Through this process, the window processing apparatus 103 may process a window in the current frame.
그러면, 부호화 장치(100)는 윈도우가 처리된 현재 프레임에 MDCT를 수행하고, 양자화를 수행한 후 비트스트림을 생성할 수 있다. 생성된 비트스트림은 복호화 장치(108)에 전송된다.Then, the encoding apparatus 100 may perform MDCT on the current frame processed by the window, perform quantization, and generate a bitstream. The generated bitstream is transmitted to the decoding device 108.
도 9는 본 발명의 일실시예에 따라 복호화 장치가 비트스트림으로부터 MDCT 프레임을 추출하는 과정을 도시한 도면이다.9 is a diagram illustrating a process of extracting an MDCT frame from a bitstream by a decoding apparatus according to an embodiment of the present invention.
복호화 장치(108)는 부호화 장치(100)의 윈도우 처리 장치(103)를 통해 윈도우가 처리된 현재 프레임을 포함하는 비트스트림을 수신할 수 있다. 그리고, 복호화 장치(108)는 수신된 비트스트림을 역양자화하고, 역MDCT를 수행하여 현재 프레임인 MDCT 프레임을 추출할 수 있다. 추출된 MDCT 프레임은 도 8에서 비트스트림이 생성되기 이전의 MDCT 프레임과 동일하다.The decoding apparatus 108 may receive a bitstream including the current frame in which the window is processed through the window processing apparatus 103 of the encoding apparatus 100. The decoding apparatus 108 may dequantize the received bitstream and perform inverse MDCT to extract an MDCT frame that is a current frame. The extracted MDCT frame is the same as the MDCT frame before the bitstream is generated in FIG. 8.
도 10은 본 발명의 일실시예에 따라 복원된 MDCT 프레임에 윈도우를 적용하여 원래 신호를 복원하는 과정을 도시한 도면이다.10 is a diagram illustrating a process of restoring an original signal by applying a window to a restored MDCT frame according to an embodiment of the present invention.
프레임 추출부(604)는 폴딩된 제1 윈도우가 처리된 현재 프레임을 추출할 수 있다. 제1 윈도우는 현재 프레임과 연동하는 이후 프레임 또는 이전 프레임이 얼러어싱 구간을 포함하는 프레임인지 여부에 따라 폴딩될 수 있다. 도 8에서 윈도우 처리부(103)가 처리한 윈도우와 동일하다. The frame extractor 604 may extract a current frame in which the folded first window is processed. The first window may be folded depending on whether a subsequent frame or a previous frame interworking with the current frame is a frame including an aliasing period. In FIG. 8, the window processing unit 103 is the same as the window processed.
구체적으로, 프레임은 4개의 블록으로 구성되고, 폴딩된 제1 윈도우는 이전 프레임이 앨리어싱 구간을 포함하는 프레임이 아닌 경우, 프레임의 첫번째 블록에 대응하는 윈도우의 왼쪽 영역이 윈도우의 중간 영역으로 폴딩된다. 그리고, 폴딩된 제1 윈도우는 이후 프레임이 앨리어싱 구간을 포함하는 프레임이 아닌 경우, 두번째 블록에 대응하는 윈도우의 오른쪽 영역이 윈도우의 중간 영역으로 폴딩된다.Specifically, the frame consists of four blocks, and when the folded first window is not a frame including an aliasing interval, the left region of the window corresponding to the first block of the frame is folded into the middle region of the window. . When the first frame is not a frame including an aliasing section, the right area of the window corresponding to the second block is folded into the middle area of the window.
윈도우 생성부(605)는 폴딩된 윈도우와 반대되는 값을 가지는 제2 윈도우를 생성할 수 있다. 제2 윈도우는 도 10에서 점선 박스 내부의 윈도우를 의미한다. 제2 윈도우를 생성하는 과정은 도 11에서 구체적으로 설명된다. 신호 복원부(606)는 제1 윈도우에 제2 윈도우를 적용하여 현재 프레임으로부터 원래 신호를 복원할 수 있다. 즉, 제2 윈도우에 의해 현재 프레임에서의 앨리어싱 구간이 제거됨으로써 원래 신호가 복원될 수 있다The window generator 605 may generate a second window having a value opposite to that of the folded window. The second window means a window inside the dotted box in FIG. 10. The process of generating the second window is described in detail with reference to FIG. 11. The signal recovery unit 606 may restore the original signal from the current frame by applying the second window to the first window. That is, the original signal may be restored by removing the aliasing interval in the current frame by the second window.
도 11은 본 발명의 일실시예에 따라 복원된 MDCT 프레임에 적용하는 윈도우를 생성하는 과정을 도시한 도면이다.11 is a diagram illustrating a process of generating a window applied to a restored MDCT frame according to an embodiment of the present invention.
윈도우 생성부(605)는 현재 프레임의 첫번째 블록에 대응하는 윈도우와 프레임의 네번째 블록에 대응하는 윈도우를 이용하여 제2 윈도우를 생성할 수 있다. 이는 현재 프레임의 이전 프레임과 이후 프레임이 앨리어싱 구간을 포함하지 않는 프레임인 경우를 의미한다. 구체적으로, 윈도우 생성부(605)는 프레임의 첫번째 블록에 대응하는 윈도우(W1(z))와 프레임의 네번째 블록에 대응하는 윈도우(-W1(z))를 프레임의 중간 영역에 대응하는 두번째 블록과 세번째 블록으로 폴딩하여 제2 윈도우를 생성할 수 있다. 이 때, 프레임의 첫번째 프레임과 반대되는 값을 가질 수 있다.The window generator 605 may generate a second window using a window corresponding to the first block of the current frame and a window corresponding to the fourth block of the frame. This means that the previous frame and the subsequent frame of the current frame are frames that do not include an aliasing period. In detail, the window generator 605 may include a window W1 (z) corresponding to the first block of the frame and a window (-W1 (z) corresponding to the fourth block of the frame) corresponding to the middle region of the frame. The second window may be generated by folding to the third block. At this time, it may have a value opposite to the first frame of the frame.
도 11의 방법은 현재 프레임의 이전 프레임과 이후 프레임이 앨리어싱 구간을 포함하지 않는 프레임인 경우를 의미하나, 이전 프레임 또는 이후 프레임 중 어느 하나만 앨리어싱 구간을 포함하지 않는 경우에도 도 11의 방법이 유사하게 적용될 수 있다.The method of FIG. 11 refers to a case in which the previous frame and the subsequent frame of the current frame do not include an aliasing interval. However, the method of FIG. 11 is similarly similar to the case in which either the previous frame or the subsequent frame does not include the aliasing interval. Can be applied.
도 12는 이전 프레임이 앨리어싱 구간을 포함하지 않는 MDCT 프레임인 경우, 본 발명의 일실시예에 따라 부호화 장치의 윈도우 처리 장치가 수행하는 동작을 도시한 도면이다.12 illustrates an operation performed by a window processing apparatus of an encoding apparatus according to an embodiment of the present invention when the previous frame is an MDCT frame that does not include an aliasing interval.
윈도우 폴딩부(602)는 앨리어싱 구간을 제거하기 위해 이전 프레임과 오버랩되는 구간에 대해서만 도 12와 같이 폴딩할 수 있다. 즉, 현재 프레임의 첫번째 프레임에 대응하는 윈도우의 왼쪽 영역만 폴딩될 수 있다. 그리고, 윈도우의 왼쪽 영역은 제로로 설정될 수 있다. 반대로, 이후 프레임은 앨리어싱 구간을 포함하는 MDCT 프레임이라면, 앨리어싱 구간을 제거하기 위해 윈도우의 오른쪽 영역을 폴딩할 필요가 없다. 나머지 과정은 도 8에서 설명된 것과 동일하게 적용된다. The window folding unit 602 may fold only a section overlapping with the previous frame to remove the aliasing section as shown in FIG. 12. That is, only the left region of the window corresponding to the first frame of the current frame may be folded. The left region of the window may be set to zero. In contrast, if the subsequent frame is an MDCT frame including an aliasing interval, it is not necessary to fold the right area of the window to remove the aliasing interval. The rest of the procedure is the same as described in FIG.
도 13은 이전 프레임이 앨리어싱 구간을 포함하지 않는 MDCT 프레임인 경우, 본 발명의 일실시예에 따라 복호화 장치의 윈도우 처리 장치가 수행하는 동작을 도시한 도면이다.13 is a diagram illustrating an operation performed by a window processing apparatus of a decoding apparatus according to an embodiment of the present invention when the previous frame is an MDCT frame that does not include an aliasing interval.
도 13은 도 9에 대응하며, 프레임 추출부(604)는 이전 프레임에 대응하는 윈도우의 왼쪽 영역만 폴딩된 제1 윈도우가 처리된 현재 프레임을 비트스트림으로부터 추출할 수 있다.FIG. 13 corresponds to FIG. 9, and the frame extractor 604 may extract a current frame processed by the first window, in which only the left region of the window corresponding to the previous frame is processed, from the bitstream.
도 14는 이전 프레임이 앨리어싱 구간을 포함하지 않는 MDCT 프레임인 경우, 본 발명의 일실시예에 따라 복원된 MDCT 프레임에 윈도우를 적용하여 원래 신호를 복원하는 과정을 도시한 도면이다.14 is a diagram illustrating a process of restoring an original signal by applying a window to a reconstructed MDCT frame according to an embodiment of the present invention when the previous frame is an MDCT frame that does not include an aliasing interval.
도 14는 도 10에 대응하며, 윈도우 생성부(605)는 도 13에서 윈도우의 왼쪽 영역만 폴딩된 제1 윈도우에 대응하는 제2 윈도우를 생성할 수 있다. 그러면, 신호 복원부(606)는 제1 윈도우에 제2 윈도우를 적용하여 원래 신호를 복원할 수 있다.FIG. 14 corresponds to FIG. 10, and the window generator 605 may generate a second window corresponding to the first window in which only the left region of the window is folded in FIG. 13. Then, the signal recovery unit 606 may restore the original signal by applying the second window to the first window.
도 15는 이전 프레임이 앨리어싱 구간을 포함하지 않는 MDCT 프레임인 경우, 본 발명의 일실시예에 따라 복원된 MDCT 프레임에 적용하는 윈도우를 생성하는 과정을 도시한 도면이다.15 is a diagram illustrating a process of generating a window applied to a reconstructed MDCT frame according to an embodiment of the present invention when the previous frame is an MDCT frame that does not include an aliasing interval.
도 15는 도11에 대응하며, 도 11과 달리 이전 프레임에 대응하는 영역만 폴딩되어 제2 윈도우가 생성된다. 만약, 이후 프레임이 앨리어싱 구간을 포함하지 않는 MDCT 프레임인 경우, 도 15에 도시된 제2 윈도우와 반대 형태의 윈도우가 생성될 것이다.FIG. 15 corresponds to FIG. 11, and unlike FIG. 11, only an area corresponding to a previous frame is folded to generate a second window. If the subsequent frame is an MDCT frame that does not include an aliasing interval, a window of a form opposite to the second window shown in FIG. 15 will be generated.
도 16은 본 발명의 일실시예에 따른 부호화 장치의 윈도우 처리 장치가 수행하는 윈도우 처리 방법을 도시한 플로우차트이다.16 is a flowchart illustrating a window processing method performed by a window processing apparatus of an encoding apparatus according to an embodiment of the present invention.
윈도우 처리 장치(103)는 복수의 블록으로 구성된 프레임에 윈도우를 적용할 수 있다(S1601). 일례로, 프레임은 4개의 블록으로 구성될 수 있다. 그러면, 윈도우 처리 장치(103)는 윈도우의 왼쪽 영역에 첫번째 블록과 윈도우의 오른쪽 영역에 대응하는 네번째 블록에 삼각 함수 형태의 윈도우를 적용할 수 있다. 그리고, 윈도우 처리 장치(103)는 윈도우의 중간 영역에 대응하는 두번째 블록과 세번째 블록에 1의 값을 가지는 윈도우를 적용할 수 있다.The window processing apparatus 103 may apply a window to a frame composed of a plurality of blocks (S1601). In one example, the frame may consist of four blocks. Then, the window processing apparatus 103 may apply a triangular function type window to the first block in the left region of the window and the fourth block corresponding to the right region of the window. The window processing apparatus 103 may apply a window having a value of 1 to the second block and the third block corresponding to the middle region of the window.
윈도우 처리 장치(103)는 프레임과 연동하는 이후 프레임 또는 이전 프레임이 앨리어싱 구간(aliasing term)을 포함하는 프레임인지 여부에 기초하여 윈도우를 폴딩할 수 있다(S1602).The window processing apparatus 103 may fold the window based on whether a subsequent frame or a previous frame that interlocks with the frame is a frame including an aliasing term (S1602).
일례로, 이전 프레임이 앨리어싱 구간을 포함하는 프레임이 아닌 경우, 윈도우 처리 장치(103)는 첫번째 블록에 대응하는 윈도우의 왼쪽 영역을 윈도우의 중간 영역으로 폴딩할 수 있다. 그리고, 이후 프레임이 앨리어싱 구간을 포함하는 프레임이 아닌 경우, 윈도우 처리 장치(103)는 두번째 블록에 대응하는 윈도우의 오른쪽 영역을 상기 윈도우의 중간 영역으로 폴딩할 수 있다.For example, if the previous frame is not a frame including an aliasing period, the window processing apparatus 103 may fold the left region of the window corresponding to the first block into the middle region of the window. If the frame is not a frame including an aliasing period, the window processing apparatus 103 may fold the right region of the window corresponding to the second block into the middle region of the window.
윈도우 처리 장치(103)는 윈도우가 적용된 프레임에서 상기 윈도우를 폴딩한 영역을 제로 값으로 설정할 수 있다(S1603).The window processing apparatus 103 may set an area in which the window is folded in the frame to which the window is applied to a zero value (S1603).
도 17은 본 발명의 일실시예에 따른 복호화 장치의 윈도우 처리 장치가 수행하는 윈도우 처리 방법을 도시한 플로우차트이다.17 is a flowchart illustrating a window processing method performed by a window processing apparatus of a decoding apparatus according to an embodiment of the present invention.
윈도우 처리 장치(112)는 비트스트림으로부터 폴딩된 제1 윈도우가 처리된 프레임을 추출할 수 있다(S1701). 이 때, 폴딩된 제1 윈도우는 프레임과 연동하는 이후 프레임 또는 이전 프레임이 앨리어싱 구간(aliasing term)을 포함하는 프레임인지 여부에 따라 폴딩된 것일 수 있다.The window processing apparatus 112 may extract a frame in which the folded first window is processed from the bitstream (S1701). In this case, the folded first window may be folded depending on whether a subsequent frame or a previous frame interworking with the frame is a frame including an aliasing term.
구체적으로, 프레임은 4개의 블록으로 구성될 수 있다. 이전 프레임이 앨리어싱 구간을 포함하는 프레임이 아닌 경우, 폴딩된 제1 윈도우는 프레임의 첫번째 블록에 대응하는 윈도우의 왼쪽 영역이 윈도우의 중간 영역으로 폴딩된 것이다. 그리고, 이후 프레임이 앨리어싱 구간을 포함하는 프레임이 아닌 경우, 폴딩된 제1 윈도우는 두번째 블록에 대응하는 윈도우의 오른쪽 영역이 윈도우의 중간 영역으로 폴딩된 것이다.In detail, the frame may consist of four blocks. If the previous frame is not a frame including an aliasing interval, the folded first window is a region in which the left region of the window corresponding to the first block of the frame is folded into the middle region of the window. Then, when the frame is not a frame including an aliasing interval, the folded first window is a right region of the window corresponding to the second block is folded into the middle region of the window.
윈도우 처리 장치(112)는 폴딩된 윈도우와 반대되는 값을 가지는 제2 윈도우를 생성할 수 있다(S1702). 일례로, 윈도우 처리 장치(112)는 프레임의 첫번째 블록에 대응하는 윈도우 또는 프레임의 네번째 블록에 대응하는 윈도우를 이용하여 생성할 수 있다. 이 때, 프레임의 네번째 블록에 대응하는 윈도우는 프레임의 첫번째 프레임과 반대되는 값을 가질 수 있다. 구체적으로, 윈도우 처리 장치(112)는 프레임의 첫번째 블록에 대응하는 윈도우 또는 프레임의 네번째 블록에 대응하는 윈도우를 프레임의 중간 영역에 대응하는 두번째 블록과 세번째 블록으로 폴딩하여 제2 윈도우를 생성할 수 있다.The window processing apparatus 112 may generate a second window having a value opposite to that of the folded window (S1702). For example, the window processing apparatus 112 may generate the window using the window corresponding to the first block of the frame or the window corresponding to the fourth block of the frame. At this time, the window corresponding to the fourth block of the frame may have a value opposite to the first frame of the frame. In detail, the window processing apparatus 112 may generate a second window by folding a window corresponding to the first block of the frame or a window corresponding to the fourth block of the frame into a second block and a third block corresponding to the middle region of the frame. have.
윈도우 처리 장치(112)는 제1 윈도우에 제2 윈도우를 적용하여 프레임으로부터 원래 신호를 복원할 수 있다(S1703).The window processing apparatus 112 may restore the original signal from the frame by applying the second window to the first window (S1703).
본 발명의 실시 예에 따른 방법들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. Methods according to an embodiment of the present invention can be implemented in the form of program instructions that can be executed by various computer means and recorded in a computer readable medium. The computer readable medium may include program instructions, data files, data structures, and the like, alone or in combination. Program instructions recorded on the media may be those specially designed and constructed for the purposes of the present invention, or they may be of the kind well-known and available to those having skill in the computer software arts.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.As described above, although the present invention has been described with reference to limited embodiments and drawings, the present invention is not limited to the above embodiments, and those skilled in the art to which the present invention pertains various modifications and variations from such descriptions. This is possible.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.Therefore, the scope of the present invention should not be limited to the described embodiments, but should be determined not only by the claims below but also by the equivalents of the claims.

Claims (20)

  1. 부호화 장치의 윈도우 처리 장치가 수행하는 부호화를 위한 윈도우 처리 방법에 있어서,In the window processing method for encoding performed by the window processing apparatus of the encoding apparatus,
    복수의 블록으로 구성된 프레임에 윈도우를 적용하는 단계; 및 Applying a window to a frame consisting of a plurality of blocks; And
    상기 프레임과 연동하는 이후 프레임 또는 이전 프레임이 앨리어싱 구간(aliasing term)을 포함하는 프레임인지 여부에 기초하여 상기 윈도우를 폴딩하는 단계Folding the window based on whether a subsequent frame or a previous frame associated with the frame is a frame including an aliasing term.
    를 포함하는 부호화를 위한 윈도우 처리 방법.Window processing method for encoding comprising a.
  2. 제1항에 있어서,The method of claim 1,
    상기 윈도우가 적용된 프레임에서 상기 윈도우를 폴딩한 영역을 제로 값으로 설정하는 단계Setting an area of the window to which the window is folded in the frame to which the window is applied to a zero value
    를 더 포함하는 부호화를 위한 윈도우 처리 방법.Window processing method for encoding further comprising.
  3. 제1항에 있어서,The method of claim 1,
    상기 프레임에 윈도우를 적용하는 단계는,Applying a window to the frame,
    상기 윈도우의 왼쪽 영역에 첫번째 블록과 상기 윈도우의 오른쪽 영역에 대응하는 네번째 블록에 삼각 함수 형태의 윈도우를 적용하는 단계; 및Applying a triangular function window to a first block in a left region of the window and a fourth block corresponding to a right region of the window; And
    상기 윈도우의 중간 영역에 대응하는 두번째 블록과 세번째 블록에 1의 값을 가지는 윈도우를 적용하는 단계Applying a window having a value of 1 to a second block and a third block corresponding to the middle region of the window;
    를 포함하는 부호화를 위한 윈도우 처리 방법.Window processing method for encoding comprising a.
  4. 제3항에 있어서,The method of claim 3,
    상기 윈도우를 폴딩하는 단계는,Folding the window includes:
    상기 이전 프레임이 앨리어싱 구간을 포함하는 프레임이 아닌 경우, 상기 첫번째 블록에 대응하는 윈도우의 왼쪽 영역을 상기 윈도우의 중간 영역으로 폴딩하는 단계; 또는If the previous frame is not a frame including an aliasing period, folding a left region of a window corresponding to the first block into a middle region of the window; or
    상기 이후 프레임이 앨리어싱 구간을 포함하는 프레임이 아닌 경우, 상기 두번째 블록에 대응하는 윈도우의 오른쪽 영역을 상기 윈도우의 중간 영역으로 폴딩하는 단계Folding the right region of the window corresponding to the second block into the middle region of the window if the subsequent frame is not a frame including an aliasing interval
    를 포함하는 부호화를 위한 윈도우 처리 방법.Window processing method for encoding comprising a.
  5. 복수의 블록으로 구성된 프레임을 수신하는 단계;Receiving a frame consisting of a plurality of blocks;
    상기 프레임에 윈도우를 적용하는 단계; Applying a window to the frame;
    상기 프레임과 연동하는 이후 프레임 또는 이전 프레임이 앨리어싱 구간(aliasing term)을 포함하는 프레임인지 여부에 기초하여 상기 윈도우를 폴딩하는 단계;Folding the window based on whether a subsequent frame or a previous frame associated with the frame is a frame including an aliasing term;
    상기 폴딩된 윈도우를 상기 프레임에 처리한 후 주파수 변환을 수행하는 단계; 및Processing the folded window in the frame and performing frequency conversion; And
    상기 주파수 변환된 프레임을 부호화하여 비트스트림을 생성하는 단계Generating a bitstream by encoding the frequency-converted frame
    를 포함하는 부호화 방법.Encoding method comprising a.
  6. 복호화 장치의 윈도우 처리 장치가 수행하는 복호화를 위한 윈도우 처리 방법에 있어서,In the window processing method for decoding performed by the window processing apparatus of the decoding apparatus,
    비트스트림으로부터 폴딩된 제1 윈도우가 처리된 프레임을 추출하는 단계;Extracting a frame processed by the folded first window from the bitstream;
    상기 폴딩된 윈도우와 반대되는 값을 가지는 제2 윈도우를 생성하는 단계; 및Generating a second window having a value opposite that of the folded window; And
    상기 제1 윈도우에 제2 윈도우를 적용하여 상기 프레임으로부터 원래 신호를 복원하는 단계Restoring the original signal from the frame by applying a second window to the first window;
    를 포함하는 복호화를 위한 윈도우 처리 방법. Window processing method for decoding comprising a.
  7. 제6항에 있어서,The method of claim 6,
    상기 폴딩된 제1 윈도우는,The folded first window,
    상기 프레임과 연동하는 이후 프레임 또는 이전 프레임이 앨리어싱 구간(aliasing term)을 포함하는 프레임인지 여부에 따라 폴딩된 것을 특징으로 하는 복호화를 위한 윈도우 처리 방법.And a subsequent frame or a previous frame interworking with the frame is folded according to whether the frame includes an aliasing term.
  8. 제7항에 있어서,The method of claim 7, wherein
    상기 폴딩된 제1 윈도우는,The folded first window,
    상기 이전 프레임이 앨리어싱 구간을 포함하는 프레임이 아닌 경우, 상기 프레임의 첫번째 블록에 대응하는 윈도우의 왼쪽 영역이 상기 윈도우의 중간 영역으로 폴딩되고,If the previous frame is not a frame including an aliasing interval, the left region of the window corresponding to the first block of the frame is folded into the middle region of the window,
    상기 이후 프레임이 앨리어싱 구간을 포함하는 프레임이 아닌 경우, 상기 두번째 블록에 대응하는 윈도우의 오른쪽 영역이 상기 윈도우의 중간 영역으로 폴딩된 것을 특징으로 하는 복호화를 위한 윈도우 처리 방법.And if the subsequent frame is not a frame including an aliasing interval, a right region of the window corresponding to the second block is folded into an intermediate region of the window.
  9. 제6항에 있어서,The method of claim 6,
    상기 제2 윈도우를 생성하는 단계는,Generating the second window,
    상기 프레임의 첫번째 블록에 대응하는 윈도우 또는 상기 프레임의 네번째 블록에 대응하는 윈도우를 이용하여 생성하는 것을 특징으로 하는 복호화를 위한 윈도우 처리 방법.And a window corresponding to the first block of the frame or a window corresponding to the fourth block of the frame.
  10. 부호화된 비트 스트림을 디코딩하여 폴딩된 제1 윈도우가 처리된 프레임을 추출하는 단계;Decoding the encoded bit stream to extract a frame processed by the folded first window;
    상기 추출된 프레임에 역 주파수 변환을 수행하는 단계;Performing inverse frequency transform on the extracted frame;
    상기 폴딩된 윈도우와 반대되는 값을 가지는 제2 윈도우를 생성하는 단계; 및Generating a second window having a value opposite that of the folded window; And
    상기 제1 윈도우에 제2 윈도우를 적용하여 상기 프레임으로부터 원래 신호를 복원하는 단계Restoring the original signal from the frame by applying a second window to the first window;
    를 포함하는 복호화 방법.Decryption method comprising a.
  11. 부호화 장치의 윈도우 처리 장치에 있어서,  In the window processing apparatus of the encoding apparatus,
    복수의 블록으로 구성된 프레임에 윈도우를 적용하는 프레임 적용부; 및 A frame applying unit applying a window to a frame composed of a plurality of blocks; And
    상기 프레임과 연동하는 이후 프레임 또는 이전 프레임이 앨리어싱 구간(aliasing term)을 포함하는 프레임인지 여부에 기초하여 상기 윈도우를 폴딩하는 윈도우 폴딩부A window folding unit for folding the window based on whether a subsequent frame or a previous frame linked with the frame is a frame including an aliasing term
    를 포함하는 부호화를 위한 윈도우 처리 장치.Window processing apparatus for encoding comprising a.
  12. 제11항에 있어서,The method of claim 11,
    상기 윈도우가 적용된 프레임에서 상기 윈도우를 폴딩한 영역을 제로 값으로 설정하는 제로 설정부Zero setting unit for setting the area of the window is folded to the zero value in the frame to which the window is applied
    를 더 포함하는 부호화를 위한 윈도우 처리 장치.Window processing apparatus for encoding further comprising.
  13. 제11항에 있어서,The method of claim 11,
    상기 프레임 적용부는,The frame applying unit,
    상기 윈도우의 왼쪽 영역에 첫번째 블록과 상기 윈도우의 오른쪽 영역에 대응하는 네번째 블록에 삼각 함수 형태의 윈도우를 적용하고,Applying a triangular function window to a first block in a left region of the window and a fourth block corresponding to a right region of the window,
    상기 윈도우의 중간 영역에 대응하는 두번째 블록과 세번째 블록에 1의 값을 가지는 윈도우를 적용하는 것을 특징으로 하는 부호화를 위한 윈도우 처리 장치.And a window having a value of 1 to the second block and the third block corresponding to the middle region of the window.
  14. 제13항에 있어서,The method of claim 13,
    상기 윈도우 폴딩부는,The window folding unit,
    상기 이전 프레임이 앨리어싱 구간을 포함하는 프레임이 아닌 경우, 상기 첫번째 블록에 대응하는 윈도우의 왼쪽 영역을 상기 윈도우의 중간 영역으로 폴딩하고,If the previous frame is not a frame including an aliasing period, the left area of the window corresponding to the first block is folded into the middle area of the window,
    상기 이후 프레임이 앨리어싱 구간을 포함하는 프레임이 아닌 경우, 상기 두번째 블록에 대응하는 윈도우의 오른쪽 영역을 상기 윈도우의 중간 영역으로 폴딩하는 것을 특징으로 하는 부호화를 위한 윈도우 처리 장치.And when the subsequent frame is not a frame including an aliasing period, folding the right region of the window corresponding to the second block into the middle region of the window.
  15. 복수의 블록으로 구성된 프레임을 수신하는 프레임 수신부;A frame receiving unit which receives a frame composed of a plurality of blocks;
    상기 프레임에 윈도우를 적용하는 윈도우 적용부;A window applying unit applying a window to the frame;
    상기 프레임과 연동하는 이후 프레임 또는 이전 프레임이 앨리어싱 구간(aliasing term)을 포함하는 프레임인지 여부에 기초하여 상기 윈도우를 폴딩하는 윈도우 폴딩부;A window folding unit for folding the window based on whether a subsequent frame or a previous frame linked with the frame is a frame including an aliasing term;
    상기 폴딩된 윈도우를 상기 프레임에 처리한 후 주파수 변환을 수행하는 주파수 변환부; 및A frequency converter configured to perform frequency conversion after processing the folded window in the frame; And
    상기 주파수 변환된 프레임을 부호화하여 비트스트림을 생성하는 비트스트림 생성부A bitstream generator which generates a bitstream by encoding the frequency-converted frame
    를 포함하는 부호화 장치.Encoding apparatus comprising a.
  16. 복호화 장치의 윈도우 처리 장치에 있어서,In the window processing apparatus of the decoding apparatus,
    비트스트림으로부터 폴딩된 제1 윈도우가 처리된 프레임을 추출하는 프레임 추출부;A frame extracting unit which extracts a frame processed by the folded first window from the bitstream;
    상기 폴딩된 윈도우와 반대되는 값을 가지는 제2 윈도우를 생성하는 윈도우 생성부; 및A window generator generating a second window having a value opposite to the folded window; And
    상기 제1 윈도우에 제2 윈도우를 적용하여 상기 프레임으로부터 원래 신호를 복원하는 신호 복원부A signal recovery unit for restoring an original signal from the frame by applying a second window to the first window
    를 포함하는 복호화를 위한 윈도우 처리 장치. Window processing apparatus for decoding comprising a.
  17. 제16항에 있어서,The method of claim 16,
    상기 폴딩된 제1 윈도우는,The folded first window,
    상기 프레임과 연동하는 이후 프레임 또는 이전 프레임이 앨리어싱 구간(aliasing term)을 포함하는 프레임인지 여부에 따라 폴딩된 것을 특징으로 하는 복호화를 위한 윈도우 처리 장치.And a later frame or a previous frame linked with the frame is folded depending on whether the frame includes an aliasing term.
  18. 제17항에 있어서,The method of claim 17,
    상기 폴딩된 제1 윈도우는,The folded first window,
    상기 이전 프레임이 앨리어싱 구간을 포함하는 프레임이 아닌 경우, 상기 프레임의 첫번째 블록에 대응하는 윈도우의 왼쪽 영역이 상기 윈도우의 중간 영역으로 폴딩되고,If the previous frame is not a frame including an aliasing interval, the left region of the window corresponding to the first block of the frame is folded into the middle region of the window,
    상기 이후 프레임이 앨리어싱 구간을 포함하는 프레임이 아닌 경우, 상기 두번째 블록에 대응하는 윈도우의 오른쪽 영역이 상기 윈도우의 중간 영역으로 폴딩된 것을 특징으로 하는 복호화를 위한 윈도우 처리 장치.And if the subsequent frame is not a frame including an aliasing period, the right region of the window corresponding to the second block is folded into the middle region of the window.
  19. 제16항에 있어서,The method of claim 16,
    상기 윈도우 생성부는,The window generator,
    상기 프레임의 첫번째 블록에 대응하는 윈도우 또는 상기 프레임의 네번째 블록에 대응하는 윈도우를 이용하여 생성하는 것을 특징으로 하는 복호화를 위한 윈도우 처리 장치.And a window corresponding to the first block of the frame or a window corresponding to the fourth block of the frame.
  20. 부호화된 비트 스트림을 디코딩하여 폴딩된 제1 윈도우가 처리된 프레임을 추출하는 프레임 추출부;A frame extractor configured to decode the encoded bit stream and extract a frame processed by the folded first window;
    상기 추출된 프레임에 역 주파수 변환을 수행하는 역 주파수 변환부;An inverse frequency transform unit performing inverse frequency transform on the extracted frame;
    상기 폴딩된 윈도우와 반대되는 값을 가지는 제2 윈도우를 생성하는 윈도우 생성부; 및A window generator generating a second window having a value opposite to the folded window; And
    상기 제1 윈도우에 제2 윈도우를 적용하여 상기 프레임으로부터 원래 신호를 복원하는 신호 복원부A signal recovery unit for restoring an original signal from the frame by applying a second window to the first window
    를 포함하는 복호화 장치.Decoding apparatus comprising a.
PCT/KR2010/004806 2009-07-24 2010-07-22 Method and apparatus for window processing for interconnecting between an mdct frame and a heterogeneous frame, and encoding/decoding apparatus and method using same WO2011010876A2 (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR20090067634 2009-07-24
KR10-2009-0067634 2009-07-24
KR1020100069548A KR101380003B1 (en) 2009-07-24 2010-07-19 Method and apparatus for linking mdct frame and different kind of frame, and encoding apparatus and method and decoding apparatus and method using therof
KR10-2010-0069548 2010-07-19

Publications (2)

Publication Number Publication Date
WO2011010876A2 true WO2011010876A2 (en) 2011-01-27
WO2011010876A3 WO2011010876A3 (en) 2011-04-21

Family

ID=43499548

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2010/004806 WO2011010876A2 (en) 2009-07-24 2010-07-22 Method and apparatus for window processing for interconnecting between an mdct frame and a heterogeneous frame, and encoding/decoding apparatus and method using same

Country Status (1)

Country Link
WO (1) WO2011010876A2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI480860B (en) * 2011-03-18 2015-04-11 Fraunhofer Ges Forschung Frame element length transmission in audio coding

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5890106A (en) * 1996-03-19 1999-03-30 Dolby Laboratories Licensing Corporation Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5890106A (en) * 1996-03-19 1999-03-30 Dolby Laboratories Licensing Corporation Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HO CHONG PARK ET AL.: 'MPEG AUDIO STANDARD TECHNOLOGY:USAC' KOREA SOCIETY BROADCAST ENGINEERS MAGAZINE vol. 14, no. 2, June 2009, pages 63 - 74 *
LECOMTE, J. ET AL.: 'Audio Engineering Society Convention Paper 7712, presented at the 126th Convention, 2009 May 7 - 10 Munich, Germany', May 2009, MUNICH, GERMANY article 'Efficient cross-fade windows for transitions between LPC-based and non-LPC based audio coding' *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI480860B (en) * 2011-03-18 2015-04-11 Fraunhofer Ges Forschung Frame element length transmission in audio coding
US9524722B2 (en) 2011-03-18 2016-12-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Frame element length transmission in audio coding
US9773503B2 (en) 2011-03-18 2017-09-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder and decoder having a flexible configuration functionality
US9779737B2 (en) 2011-03-18 2017-10-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Frame element positioning in frames of a bitstream representing audio content

Also Published As

Publication number Publication date
WO2011010876A3 (en) 2011-04-21

Similar Documents

Publication Publication Date Title
WO2010008175A2 (en) Apparatus for encoding and decoding of integrated speech and audio
WO2011049416A2 (en) Apparatus and method encoding/decoding with phase information and residual information
WO2013183928A1 (en) Audio encoding method and device, audio decoding method and device, and multimedia device employing same
RU2011102426A (en) DEVICE AND METHOD FOR CODING / DECODING THE AUDIO SIGNAL BY USING A NAME MECHANISM SWITCHING SCHEME
WO2010005272A2 (en) Method and apparatus for multi-channel encoding and decoding
WO2010008179A1 (en) Apparatus and method for encoding and decoding of integrated speech and audio
WO2011021845A2 (en) Method and apparatus for encoding multi-channel audio signal and method and apparatus for decoding multi-channel audio signal
WO2009110751A2 (en) Method and apparatus for processing an audio signal
WO2009096717A2 (en) Method and apparatus for encoding and decoding audio signal
WO2014077591A1 (en) Method and apparatus for determining encoding mode, method and apparatus for encoding audio signals, and method and apparatus for decoding audio signals
KR950702762A (en) Signal encoding apparatus and signal encoding method, signal decoding apparatus and signal decoding method, and recording medium on which signals encoded by such encoding apparatus or method are recorded
WO2023282520A1 (en) Method and system for constructing training database by using voice personal-information protection technology
WO2014021587A1 (en) Device and method for processing audio signal
EP2630641A2 (en) Apparatus and method for determining weighting function having low complexity for linear predictive coding (lpc) coefficients quantization
CN102592598A (en) Apparatus and method for restoring multi-channel audio signal
WO2021010613A1 (en) Deep neural network-based non-autoregressive voice synthesizing method and system using multiple decoders
WO2011021790A2 (en) Multi-channel audio decoding method and apparatus therefor
WO2011055982A2 (en) Apparatus and method for encoding/decoding a multi-channel audio signal
CN111107284B (en) Real-time generation system and generation method for video subtitles
WO2011010876A2 (en) Method and apparatus for window processing for interconnecting between an mdct frame and a heterogeneous frame, and encoding/decoding apparatus and method using same
WO2015126228A1 (en) Signal classifying method and device, and audio encoding method and device using same
WO2014092460A1 (en) Method of encoding and decoding audio signal and apparatus for encoding and decoding audio signal
WO2015034115A1 (en) Method and apparatus for encoding and decoding audio signal
WO2010134759A2 (en) Window processing method and apparatus for interworking between mdct-tcx frame and celp frame
KR101380003B1 (en) Method and apparatus for linking mdct frame and different kind of frame, and encoding apparatus and method and decoding apparatus and method using therof

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10802469

Country of ref document: EP

Kind code of ref document: A2

NENP Non-entry into the national phase in:

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 10802469

Country of ref document: EP

Kind code of ref document: A2