KR101178222B1 - 오디오 부호화 및 복호화 방법과 그 장치 - Google Patents

오디오 부호화 및 복호화 방법과 그 장치 Download PDF

Info

Publication number
KR101178222B1
KR101178222B1 KR1020050127794A KR20050127794A KR101178222B1 KR 101178222 B1 KR101178222 B1 KR 101178222B1 KR 1020050127794 A KR1020050127794 A KR 1020050127794A KR 20050127794 A KR20050127794 A KR 20050127794A KR 101178222 B1 KR101178222 B1 KR 101178222B1
Authority
KR
South Korea
Prior art keywords
signal
layer
overlap
decoding
encoded
Prior art date
Application number
KR1020050127794A
Other languages
English (en)
Other versions
KR20070066514A (ko
Inventor
이강은
성호상
박호종
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020050127794A priority Critical patent/KR101178222B1/ko
Publication of KR20070066514A publication Critical patent/KR20070066514A/ko
Application granted granted Critical
Publication of KR101178222B1 publication Critical patent/KR101178222B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

오디오 부호화 및 복호화 방법과 그 장치가 개시된다. 본 발명에 의한 오디오 부호화 방법은, (a) 원 오디오 신호를 윈도윙(windowing)하는 단계, (b) 윈도윙된 신호를 인코딩(encoding)하고 오버랩-애드(overlap-add)를 수행하여 제1 계층을 생성하는 단계, (c) 인코딩된 신호를 디코딩(decoding)하는 단계, (d) 오버랩-애드를 수행하지 않은 디코딩된 신호와 원 오디오 신호 간의 차에 해당하는 레지듀얼(residual) 신호를 생성하는 단계 및 (e) 생성된 레지듀얼 신호를 인코딩하여 제2 계층을 생성하는 단계를 포함하는 것을 특징으로 한다.
본 발명에 의하면, 보상 신호의 계산과 보상을 위한 약간의 추가적인 계산을 통하여 오류 성분없이 단위 프레임에 해당하는 시간의 딜레이를 감소시킬 수 있는 효과를 거둘 수 있다.

Description

오디오 부호화 및 복호화 방법과 그 장치{Method for encoding and decoding audio and apparatus thereof}
도 1 및 도 2는 종래의 오디오 부호화 및 복호화 방법을 나타내는 개념도를 도시한 것이다.
도 3은 본 발명에 의한 오디오 부호화 장치의 일 실시예를 블록도로 도시한 것이다.
도 4는 본 발명에 의한 오디오 복호화 장치의 일 실시예를 블록도로 도시한 것이다.
도 5은 본 발명에 의한 오디오 부호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
도 6a 및 도 6b는 본 발명에 의한 오디오 부호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
도 7은 본 발명에 의한 오디오 부호화와 복호화 장치 및 방법을 설명하기 위한 참고도를 도시한 것이다.
〈도면의 주요 부호에 대한 간단한 설명〉
300: 윈도윙부 310: 제1 계층 생성부
320: 레지듀얼신호 생성부 330: 제2 계층 생성부
400: 제1 디코더 410: 제1 처리부
420: 제2 디코더 430: 제2 처리부
440: 오차 보상부 450: 가산부
본 발명은 오디오 신호를 부호화 및 복호화하는 장치 및 방법에 관한 것으로, 보다 상세하게는 오버랩-애드(overlap-add)를 수행하지 않은 디코딩된 신호와 원 신호 간의 레지듀얼(residual) 신호를 생성하여 부호화하고, 부호화하는 과정에서 발생하는 신호의 오차를 보상하여 복호화함으로써 딜레이(delay)를 감소시키는 오디오 부호화 및 복호화 방법과 그 장치에 관한 것이다.
변환(Transform)을 포함하는 코덱(Codec)은 일반적으로 프레임(Frame) 경계에서의 불연속 문제를 해결하기 위하여 룩-어헤드(Look-Ahead)를 포함하는 오버랩 윈도우(Overlap Window)를 사용하며 그에 따라 코덱 동작에 딜레이가 발생한다. 만일 여러 계층(Layer)를 가지는 스케일러블 코덱(Scalable Codec)에서 각 계층 코덱이 오버랩 윈도우를 사용하고 각 계층이 이전 계층의 레지듀얼 신호를 처리하는 케스케이드(cascade) 연결 구조를 가지면, 전체 코덱의 딜레이는 각 계층의 딜레이가 누적되어 매우 길어지는 문제점을 갖는다.
도 1 및 도 2는 종래의 오디오 부호화 및 복호화 방법을 나타내는 개념도를 도시한 것이다.
먼저, 입력되는 원 신호를 윈도윙(windowing)한다(제101단계). 제101단계에서 윈도윙된 신호를 FFT(Fast Fourier Transform) 제1 계층 인코더(encoder)에 의하여 인코딩(encoding)하고, FFT 제2 계층 디코더(decoder)에 의해 디코딩(decoding)한다(제102단계). 제102단계에서 디코딩된 신호를 윈도윙한다(제103단계). 제103단계에서 윈도윙된 현재 프레임(frame)의
Figure 112005075319273-pat00001
신호와 이전 프레임의
Figure 112005075319273-pat00002
신호를 도 2에 도시된 바와 같이 제1 오버랩-애드(overlab-add)하여
Figure 112005075319273-pat00003
신호를 생성한다(제104단계).
제104단계에서 제1 오버랩-애드된 신호를 윈도윙한다(제111단계). 제111단계에서 윈도윙된 신호를 MDCT 제2 계층 인코더에 의해 인코딩하고, MDCT 제2 계층 디코더에 의해 디코딩한다(제112단계). 제112단계에서 디코딩된 신호를 윈도윙한다(제113단계). 제113단계에서 윈도윙된 현재 프레임의
Figure 112005075319273-pat00004
신호와 이전 프레임의
Figure 112005075319273-pat00005
신호를 도 2에 도시된 바와 같이 제2 오버랩-애드하여 Y 신호를 생성한다(제114단계).
전술한 종래의 오디오 부호화 및 복호화 방법을 살펴보면, 제104단계에서 오버랩-애드된 윈도우를 제2 계층(110)에서 사용하므로 한 프레임에 해당하는 시간만큼 딜레이되며, 제114단계에서 오버랩-애드된 윈도우를 출력하므로 또 한 프레임에 해당하는 시간만큼 딜레이되기 때문에 결과적으로 두 프레임에 해당하는 딜레이가 발생하는 문제점을 갖는다.
본 발명이 이루고자 하는 기술적 과제는, 오버랩-애드를 수행하지 않은 디코딩된 신호와 원 신호 간의 레지듀얼 신호를 생성하여 부호화하고, 부호화하는 과정에서 발생하는 신호의 오차를 보상하여 복호화함으로써 딜레이를 감소시키는 오디오 부호화 및 복호화 방법과 그 장치를 제공하는 것이다.
상기의 과제를 이루기 위한 본 발명에 의한 오디오 부호화 방법은, (a) 원 오디오 신호를 윈도윙(windowing)하는 단계, (b) 상기 윈도윙된 신호를 인코딩(encoding)하는 단계, (c) 오버랩-애드(overlap-add)를 수행하지 않은 상기 인코딩된 신호를 디코딩(decoding)하는 단계, (d) 상기 디코딩된 신호와 상기 원 오디오 신호 간의 차에 해당하는 레지듀얼(residual) 신호를 생성하는 단계, (e) 상기 인코딩된 신호를 오버랩-애드하여 제1 계층을 생성하는 단계 및 (f) 상기 생성된 레지듀얼 신호를 인코딩하여 제2 계층을 생성하는 단계를 포함하는 것을 특징으로 한다.
상기 (f) 단계는 상기 생성된 레지듀얼 신호에 MDCT를 적용하여 제2 계층을 생성하는 것이 바람직하다.
상기 (c) 단계는 상기 인코딩된 이전 프레임 및 현재 프레임을 디코딩하고, 상기 (d) 단계는 상기 디코딩된 이전 프레임 및 현재 프레임과 상기 원 오디오 신호 간의 각 레지듀얼 신호를 생성하는 단계를 포함하는 것이 바람직하다.
상기 (f) 단계는 상기 이전 프레임과 상기 현재 프레임에 대한 각 레지듀얼 신호에 MDCT를 적용하여 제2 계층을 생성하는 것이 바람직하다.
상기의 과제를 이루기 위한 본 발명에 의한 오디오 복호화 방법은, (a) 상기 제1 계층을 디코딩하여 윈도윙하고 오버랩-애드하는 단계, (b) 상기 제2 계층을 디코딩하여 윈도윙하고 오버랩-애드하는 단계 및 (c) 상기 제1 계층의 디코딩된 신호를 이용하여 상기 제2 계층의 오버랩-애드된 신호에 대한 오차를 보상하는 단계를 포함하는 것을 특징으로 한다.
상기 (c) 단계에서 오차는 다음과 같은 수학식에 해당하는 것이 바람직하다.
[수학식 1]
Figure 112005075319273-pat00006
(여기서, 각 프레임은 길이가 2N이고, N/2의 크기로 분할하여 각 구간을
Figure 112005075319273-pat00007
라고 정의한다. 이전 프레임에서 세 번째 구간의 신호를 A라 하고, 네 번째 구간의 신호를 B라 한다. 현재 프레임에서 첫 번째 구간의 신호를 C라 하고, 두 번째 구간의 신호를 D라 한다.
Figure 112005075319273-pat00008
은 A 신호를 해당 구간에서 시간에 대하여 반전(time reverse)시킨 신호이다.)
전술된 발명을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체인 것이 바람직하다.
상기의 과제를 이루기 위한 본 발명에 의한 오디오 부호화 장치는, 원 오디오 신호를 윈도윙하는 윈도윙부, 상기 윈도윙된 신호를 인코딩하고, 오버랩-애드를 수행하여 제1 계층을 생성하며, 오버랩-애드를 수행하지 않은 상기 인코딩된 신호 를 디코딩하는 제1 계층 생성부, 상기 디코딩된 신호와 상기 원 오디오 신호 간의 차에 해당하는 레지듀얼 신호를 생성하는 레지듀얼신호 생성부 및 상기 생성된 레지듀얼 신호를 인코딩하여 제2 계층을 생성하는 제2 계층 생성부를 포함하는 것을 특징으로 한다.
상기 제2 계층 생성부는 상기 생성된 레지듀얼 신호에 MDCT를 적용하여 제2 계층을 생성하는 것이 바람직하다.
상기 제1 계층 생성부는 상기 윈도윙된 이전 프레임 및 현재 프레임을 인코딩하는 제1 인코더, 상기 인코딩된 이전 프레임 및 현재 프레임을 디코딩하는 제1 디코더 및 상기 인코딩된 이전 프레임과 현재 프레임을 오버랩-애드를 수행하여 제1 계층을 생성하는 계층 생성부를 포함하는 것이 바람직하다.
상기 레지듀얼신호 생성부는 상기 디코딩된 이전 프레임 및 현재 프레임과 상기 원 오디오 신호 간의 각 레지듀얼 신호를 생성하는 것이 바람직하다.
상기 제2 계층 생성부는 상기 이전 프레임과 상기 현재 프레임에 대한 각 레지듀얼 신호에 MDCT를 적용하여 제2 계층을 생성하는 것이 바람직하다.
상기의 과제를 이루기 위한 본 발명에 의한 오디오 복호화 장치는, 상기 제1 계층을 디코딩하는 제1 디코더, 상기 제1 계층의 디코딩된 신호를 윈도윙하고 오버랩-애드하는 제1 처리부, 상기 제2 계층을 디코딩하는 제2 디코더, 상기 제2 계층의 디코딩된 신호를 윈도윙하고 오버랩-애드하는 제2 처리부 및 상기 제1 계층의 디코딩된 신호를 이용하여 상기 제2 계층의 오버랩-애드된 신호에 대한 오차를 보상하는 오차 보상부를 포함하는 것을 특징으로 한다.
상기 오차 보상부에서 오차는 다음과 같은 수학식에 해당하는 것이 바람직하다.
[수학식 2]
Figure 112005075319273-pat00009
(여기서, 각 프레임은 길이가 2N이고, N/2의 크기로 분할하여 각 구간을
Figure 112005075319273-pat00010
라고 정의한다. 이전 프레임에서 세 번째 구간의 신호를 A라 하고, 네 번째 구간의 신호를 B라 한다. 현재 프레임에서 첫 번째 구간의 신호를 C라 하고, 두 번째 구간의 신호를 D라 한다.
Figure 112005075319273-pat00011
은 A 신호를 해당 구간에서 시간에 대하여 반전(time reverse)시킨 신호이다.)
이하, 첨부된 도면들을 참조하여 본 발명에 따른 오디오 부호화 및 복호화 방법과 그 장치에 대해 상세히 설명한다.
도 3은 본 발명에 의한 오디오 부호화 장치의 일 실시예를 블록도로 도시한 것으로서, 상기 오디오 부호화 장치는 윈도윙부(300), 제1 계층 생성부(310), 레지듀얼신호 생성부(320) 및 제2 계층 생성부(330)를 포함하여 이루어진다. 도 7을 참조하여 본 발명에 의한 오디오 부호화 장치의 동작을 설명하기로 한다.
먼저, 도 7에 도시된 바와 같이 각 프레임은 길이가 2N이고, 오버랩 윈도우를 N/2의 크기로 분할하여 각 구간을
Figure 112005075319273-pat00012
라고 정의한다. 그리고 신호의 상단에 도시된 프레임을 이전 프레임이라 하고, 신호의 하단에 도시된 프레임 을 현재 프레임이라 한다. 여기서 사용되는 신호의 표기법에 대하여 정의한다. 두 신호를 연속으로 표기할 경우 윈도우의 신호인
Figure 112005075319273-pat00013
에 대하여서는 앞 신호와의 곱을 의미하고 나머지 N/2 길이의 두 신호가 시간적으로 연결된 것을 의미한다. 즉,
Figure 112005075319273-pat00014
Figure 112005075319273-pat00015
Figure 112005075319273-pat00016
를 연결하여 만든 길이 N인 신호를 의미하고,
Figure 112005075319273-pat00017
Figure 112005075319273-pat00018
에 윈도우 조각
Figure 112005075319273-pat00019
을 곱하고
Figure 112005075319273-pat00020
에 윈도우 조각
Figure 112005075319273-pat00021
를 곱하고 두 신호를 연결하여 만들어진 길이 N 신호를 의미한다.
윈도윙부(300)는 입력되는 원 신호 (0)를 윈도윙한다.
제1 계층 생성부(310)는 윈도윙부(300)에서 윈도윙된 신호를 FFT 등과 같은 소정의 방식에 의하여 인코딩하거나 디코딩한다. 상기 제1 계층 생성부(310)는 제1 인코더(313), 제1 디코더(316) 및 계층 생성부(319)를 포함하여 이루어진다.
제1 인코더(313)는 윈도윙부(300)에서 윈도윙된 신호를 소정의 방식에 의하여 인코딩한다.
제1 디코더(316)는 오버랩-애드를 수행하지 않은 인코딩된 신호를 다시 디코딩한다. 여기서, 제1 디코더(316)는 제1 인코더(313)에서 각 인코딩된 이전 프레임 및 현재 프레임을 다시 디코딩하여 레지듀얼신호 생성부(320)로 신호 (1)을 출력한다.
계층 생성부(319)는 오버랩-애드를 수행하여 제1 계층을 생성하고, 생성된 제1 계층 OUT 0를 출력한다.
레지듀얼신호 생성부(320)는 오버랩-애드 수행하지 않은 제1 디코더(316)에서 디코딩된 신호 (1)과 원 신호 (0) 간의 차에 해당하는 각 레지듀얼 신호 (2)를 생성한다. 여기서, 레지듀얼 신호 생성부(320)는 디코딩된 이전 프레임 및 현재 프레임과 원 신호 (0) 간의 각 레지듀얼 신호 (2)를 생성한다.
제2 계층 생성부(330)는 레지듀얼신호 생성부(320)에서 생성된 각 레지듀얼 신호 (2)에 MDCT를 적용하여 계수를 양자화하고, 양자화된 신호 OUT 1을 출력한다.
도 4는 본 발명에 의한 오디오 복호화 장치의 일 실시예를 블록도로 도시한 것으로서, 상기 오디오 복호화 장치는 제1 디코더(400), 제1 처리부(410), 제2 디코더(420), 제2 처리부(430), 오차 보상부(440) 및 가산부(450)를 포함하여 이루어진다.
제1 디코더(400)는 오디오 부호화 장치에서 출력된 신호에서 제1 계층 IN 0를 입력으로 하여 디코딩하고, 디코딩된 신호 (1)을 출력한다.
제1 처리부(410)는 제1 디코더(400)에서 디코딩된 신호 (1)을 처리한다. 여기서, 제1 처리부(410)는 제1 윈도윙부(413) 및 제1 오버랩-애드부(416)를 포함하여 이루어진다.
제1 윈도윙부(413)는 제1 디코더(400)에서 출력된 신호 (1)을 윈도윙한다.
제1 오버랩-애드부(416)는 제1 윈도윙부(413)에서 윈도윙된 신호를 제1 오버랩-애드한다. 여기서, 제1 오버랩-애드부(416)는 제1 계층에 대한 출력 신호 OUT 2(또는 신호 (7))를 출력하고, 제1 오버랩-애드된 신호를 가산부(450)로 출력한다.
제2 디코더(420)는 MDCT를 적용하여 인코딩된 제2 계층을 디코딩하고, 디코 딩된 신호 (3)을 출력한다.
제2 처리부(430)는 제2 디코더(420)에서 디코딩된 신호 (3)를 처리한다. 여기서, 제2 처리부(430)는 제2 윈도윙부(433) 및 제2 오버랩-애드부(436)를 포함하여 이루어진다.
제2 윈도윙부(433)는 제2 디코더(420)에서 출력된 신호 (3)을 윈도윙한다.
제2 오버랩-애드부(436)는 제2 윈도윙부(433)에서 윈도윙된 신호 (4)를 제2 오버랩-애드하고, 제2 오버랩-애드된 신호 (5)를 출력한다.
오차 보상부(440)는 제1 디코더(400)에서 디코딩된 신호 (1)을 이용하여 제2 오버랩-애드부(436)에서 제2 오버랩-애드된 신호 (5)의 오차를 보상하여 제거하고, 오차가 보상된 신호 (6)을 출력한다. 여기서, 오차는 다음과 같은 수학식에 해당하는 신호로서 이 성분을 오차 보상부(440)에서 제거함으로써 정상적인 출력이 구하여진다.
[수학식 1]
Figure 112005075319273-pat00022
여기서, 각 프레임은 길이가 2N이고, N/2의 크기로 분할하여 각 구간을
Figure 112005075319273-pat00023
라고 정의한다. 이전 프레임에서 세 번째 구간의 신호를 A라 하고, 네 번째 구간의 신호를 B라 한다. 현재 프레임에서 첫 번째 구간의 신호를 C라 하고, 두 번째 구간의 신호를 D라 한다.
Figure 112005075319273-pat00024
은 A 신호를 해당 구간에서 시간에 대하여 반전(time reverse)시킨 신호이다.
가산부(450)는 오차 보상부(440)에서 오차가 보상된 신호(6)와 제1 오버랩-애드부(416)에서 출력된 신호를 가산하고, 가산된 신호 OUT 3를 최종 신호로 하여 출력한다.
도 5는 본 발명에 의한 오디오 부호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다. 도 7을 참조하여 본 발명에 의한 오디오 부호화 방법의 수행을 설명하기로 한다.
먼저, 입력되는 원 신호 (0)를 윈도윙한다(제500단계).
제500단계에서 윈도윙된 신호를 FFT 등과 같은 소정의 방식에 의하여 인코딩하고, 인코딩된 신호를 출력한다(제510단계). 또한, 제510단계에서는 인코딩된 신호를 다시 디코딩하여 신호 (1)을 출력한다. 여기서, 제510단계는 윈도윙된 이전 프레임 및 현재 프레임을 인코딩하고, 인코딩된 이전 프레임 및 현재 프레임을 다시 디코딩한다. 신호 (1)을 출력한 후, 인코딩된 신호를 오버랩-애드하여 제1 계층을 생성한다.
제510단계 후에, 오버랩-애드를 수행하지 않은 제510단계에서 디코딩된 신호 (1)과 제500단계의 원 신호 (0) 간의 레지듀얼 신호 (2)를 생성한다(제520단계). 제520단계에서는 디코딩된 이전 프레임 및 현재 프레임과 원 신호 (0) 간의 각 레지듀얼 신호 (2)를 생성한다.
제520단계에서 생성된 각 레지듀얼 신호에 MDCT를 적용하여 계수를 양자화한다(제530단계).
도 6a는 본 발명에 의한 오디오 복호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다. 도 7을 참조하여 본 발명에 의한 오디오 복호화 방법의 수행을 설명하기로 한다.
먼저, 소정의 방식에 의하여 인코딩된 제1 계층 IN 0를 입력으로 하여 디코딩하고, 디코딩된 신호 (1)을 출력한다(제600단계).
제600단계에서 디코딩된 신호 (1)을 윈도윙한다(제601단계).
제610단계에서 윈도윈된 신호를 오버랩-애드한다(제602단계).
도 6b는 본 발명에 의한 오디오 복호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다. 도 6a 및 도 7을 참조하여 본 발명에 의한 오디오 복호화 방법의 수행을 설명하기로 한다.
먼저, MDCT를 적용하여 인코딩된 제2 계층 IN 1을 입력으로 하여 디코딩하고, 디코딩된 신호 (3)을 출력한다(제610단계).
제610단계에서 디코딩된 신호 (3)을 윈도윙하고, 윈도윙된 신호 (4)를 출력한다(제611단계).
제611단계에서 윈도윙된 신호 (4)를 제2 오버랩-애드하고, 제2 오버랩-애드된 신호 (5)를 출력한다(제612단계).
제612단계 후에, 제600단계의 신호 (1)을 이용하여 제612단계에서 제2 오버랩-애드된 신호 (5)의 오차를 보상하여 제거하고, 오차가 제거된 신호 (6)을 출력한다(제613단계). 여기서, 오차는 다음과 같은 수학식에 해당하는 신호로서 이 성분을 제613단계에서 제거함으로써 정상적인 출력이 구하여진다.
[수학식 2]
Figure 112005075319273-pat00025
여기서, 각 프레임은 길이가 2N이고, N/2의 크기로 분할하여 각 구간을
Figure 112005075319273-pat00026
라고 정의한다. 이전 프레임에서 세 번째 구간의 신호를 A라 하고, 네 번째 구간의 신호를 B라 한다. 현재 프레임에서 첫 번째 구간의 신호를 C라 하고, 두 번째 구간의 신호를 D라 한다.
Figure 112005075319273-pat00027
은 A 신호를 해당 구간에서 시간에 대하여 반전(time reverse)시킨 신호이다.
제613단계에서 오차가 보상된 신호 (6)과 제602단계에서 오버랩-애드된 신호를 가산하고, 가산된 신호 OUT 3를 최종 신호로 하여 출력한다(제614단계).
본 발명은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터(정보 처리 기능을 갖는 장치를 모두 포함한다)가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 장치의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장 장치 등이 있다.
이러한 본원 발명인 오디오 부호화 및 복호화 방법과 그 장치는 이해를 돕기 위하여 도면에 도시된 실시예를 참고로 설명되었으나, 이는 예시적인 것에 불과하며, 당해 분야에서 통상적 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위에 의해 정해져야 할 것이다.
본 발명에 의한 오디오 부호화 및 복호화 방법과 그 장치에 의하면, 오버랩-애드를 수행하지 않은 디코딩된 신호와 원 신호 간의 레지듀얼 신호를 생성하여 부호화하고, 부호화하는 과정에서 발생하는 신호의 오차를 보상하여 복호화한다.
이렇게 함으로써 보상 신호의 계산과 보상을 위한 약간의 추가적인 계산을 통하여 오류 성분없이 단위 프레임에 해당하는 시간의 딜레이를 감소시킬 수 있는 효과를 거둘 수 있다.

Claims (14)

  1. (a) 원 오디오 신호를 윈도윙(windowing)하는 단계;
    (b) 상기 윈도윙된 신호를 인코딩(encoding)하는 단계;
    (c) 오버랩-애드(overlap-add)를 수행하지 않은 상기 인코딩된 신호를 디코딩(decoding)하는 단계;
    (d) 상기 디코딩된 신호와 상기 원 오디오 신호 간의 차에 해당하는 레지듀얼(residual) 신호를 생성하는 단계;
    (e) 상기 인코딩된 신호를 오버랩-애드하여 제1 계층을 생성하는 단계; 및
    (f) 상기 생성된 레지듀얼 신호를 인코딩하여 제2 계층을 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 부호화 방법.
  2. 제1항에 있어서, 상기 (f) 단계는
    상기 생성된 레지듀얼 신호에 MDCT를 적용하여 제2 계층을 생성하는 것을 특징으로 하는 오디오 부호화 방법.
  3. 제2항에 있어서, 상기 (c) 단계는
    상기 인코딩된 이전 프레임 및 현재 프레임을 디코딩하고,
    상기 (d) 단계는
    상기 디코딩된 이전 프레임 및 현재 프레임과 상기 원 오디오 신호 간의 각 레지듀얼 신호를 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 부호화 방법.
  4. 제3항에 있어서, 상기 (f) 단계는
    상기 이전 프레임과 상기 현재 프레임에 대한 각 레지듀얼 신호에 MDCT를 적용하여 제2 계층을 생성하는 것을 특징으로 하는 오디오 부호화 방법.
  5. 제1 계층과 MDCT를 적용하여 인코딩된 제2 계층을 포함하는 부호화된 오디오 신호를 복호화하는 방법에 있어서,
    (a) 상기 제1 계층을 디코딩하여 윈도윙하고 오버랩-애드하는 단계;
    (b) 상기 제2 계층을 디코딩하여 윈도윙하고 오버랩-애드하는 단계; 및
    (c) 상기 제1 계층의 디코딩된 신호를 이용하여 상기 제2 계층의 오버랩-애드된 신호에 대한 오차를 보상하는 단계를 포함하는 것을 특징으로 하는 오디오 복호화 방법.
  6. 제5항에 있어서, 상기 (c) 단계에서 오차는
    다음과 같은 수학식에 해당하는 것을 특징으로 하는 오디오 복호화 방법.
    [수학식 1]
    Figure 112005075319273-pat00028
    (여기서, 각 프레임은 길이가 2N이고, N/2의 크기로 분할하여 각 구간을
    Figure 112005075319273-pat00029
    라고 정의한다. 이전 프레임에서 세 번째 구간의 신호를 A라 하고, 네 번째 구간의 신호를 B라 한다. 현재 프레임에서 첫 번째 구간의 신호를 C라 하고, 두 번째 구간의 신호를 D라 한다.
    Figure 112005075319273-pat00030
    은 A 신호를 해당 구간에서 시간에 대하여 반전(time reverse)시킨 신호이다.)
  7. 제1항 내지 제6항 중 어느 한 항에 기재된 발명을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.
  8. 원 오디오 신호를 윈도윙하는 윈도윙부;
    상기 윈도윙된 신호를 인코딩하고, 오버랩-애드를 수행하여 제1 계층을 생성하며, 오버랩-애드를 수행하지 않은 상기 인코딩된 신호를 디코딩하는 제1 계층 생성부;
    상기 디코딩된 신호와 상기 원 오디오 신호 간의 차에 해당하는 레지듀얼 신호를 생성하는 레지듀얼신호 생성부; 및
    상기 생성된 레지듀얼 신호를 인코딩하여 제2 계층을 생성하는 제2 계층 생성부를 포함하는 것을 특징으로 하는 오디오 부호화 장치.
  9. 제8항에 있어서, 상기 제2 계층 생성부는
    상기 생성된 레지듀얼 신호에 MDCT를 적용하여 제2 계층을 생성하는 것을 특징으로 하는 오디오 부호화 장치.
  10. 제9항에 있어서, 상기 제1 계층 생성부는
    상기 윈도윙된 이전 프레임 및 현재 프레임을 인코딩하는 제1 인코더;
    상기 인코딩된 이전 프레임 및 현재 프레임을 디코딩하는 제1 디코더; 및
    상기 인코딩된 이전 프레임과 현재 프레임을 오버랩-애드를 수행하여 제1 계층을 생성하는 계층 생성부를 포함하는 것을 특징으로 하는 오디오 부호화 장치.
  11. 제10항에 있어서, 상기 레지듀얼신호 생성부는
    상기 디코딩된 이전 프레임 및 현재 프레임과 상기 원 오디오 신호 간의 각 레지듀얼 신호를 생성하는 것을 특징으로 하는 오디오 부호화 장치.
  12. 제11항에 있어서, 상기 제2 계층 생성부는
    상기 이전 프레임과 상기 현재 프레임에 대한 각 레지듀얼 신호에 MDCT를 적용하여 제2 계층을 생성하는 것을 특징으로 하는 오디오 부호화 장치.
  13. 제1 계층 및 MDCT를 적용하여 인코딩된 제2 계층을 포함하는 부호화된 오디오 신호를 복호화하는 장치에 있어서,
    상기 제1 계층을 디코딩하는 제1 디코더;
    상기 제1 계층의 디코딩된 신호를 윈도윙하고 오버랩-애드하는 제1 처리부;
    상기 제2 계층을 디코딩하는 제2 디코더;
    상기 제2 계층의 디코딩된 신호를 윈도윙하고 오버랩-애드하는 제2 처리부; 및
    상기 제1 계층의 디코딩된 신호를 이용하여 상기 제2 계층의 오버랩-애드된 신호에 대한 오차를 보상하는 오차 보상부를 포함하는 것을 특징으로 하는 오디오 복호화 장치.
  14. 제13항에 있어서, 상기 오차 보상부에서 오차는
    다음과 같은 수학식에 해당하는 것을 특징으로 하는 오디오 복호화 장치.
    [수학식 2]
    Figure 112005075319273-pat00031
    (여기서, 각 프레임은 길이가 2N이고, N/2의 크기로 분할하여 각 구간을
    Figure 112005075319273-pat00032
    라고 정의한다. 이전 프레임에서 세 번째 구간의 신호를 A라 하고, 네 번째 구간의 신호를 B라 한다. 현재 프레임에서 첫 번째 구간의 신호를 C라 하고, 두 번째 구간의 신호를 D라 한다.
    Figure 112005075319273-pat00033
    은 A 신호를 해당 구간에서 시간에 대하여 반전(time reverse)시킨 신호이다.)
KR1020050127794A 2005-12-22 2005-12-22 오디오 부호화 및 복호화 방법과 그 장치 KR101178222B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020050127794A KR101178222B1 (ko) 2005-12-22 2005-12-22 오디오 부호화 및 복호화 방법과 그 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050127794A KR101178222B1 (ko) 2005-12-22 2005-12-22 오디오 부호화 및 복호화 방법과 그 장치

Publications (2)

Publication Number Publication Date
KR20070066514A KR20070066514A (ko) 2007-06-27
KR101178222B1 true KR101178222B1 (ko) 2012-08-29

Family

ID=38365567

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050127794A KR101178222B1 (ko) 2005-12-22 2005-12-22 오디오 부호화 및 복호화 방법과 그 장치

Country Status (1)

Country Link
KR (1) KR101178222B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100228554A1 (en) * 2007-10-22 2010-09-09 Electronics And Telecommunications Research Institute Multi-object audio encoding and decoding method and apparatus thereof

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003323199A (ja) 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003323199A (ja) 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法

Also Published As

Publication number Publication date
KR20070066514A (ko) 2007-06-27

Similar Documents

Publication Publication Date Title
JP5323164B2 (ja) 音声信号のタイムワープ処理改良変換符号化
JP5208901B2 (ja) 音声信号および音楽信号を符号化する方法
RU2557455C2 (ru) Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
US9093066B2 (en) Forward time-domain aliasing cancellation using linear-predictive filtering to cancel time reversed and zero input responses of adjacent frames
KR20230148130A (ko) Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치
EP2591470B1 (en) Coder using forward aliasing cancellation
TWI398854B (zh) 用於計算轉換值及執行定窗運算之方法、裝置、電路及電腦可讀媒體,及用於提供一解碼器之方法
RU2584463C2 (ru) Кодирование звука с малой задержкой, содержащее чередующиеся предсказательное кодирование и кодирование с преобразованием
JP2008539462A (ja) オーディオエンコーダを並列に動作させる方法及びシステム
KR102322867B1 (ko) Mdct기반의 코더와 이종의 코더 간 변환에서의 인코딩 장치 및 디코딩 장치
JP5547813B2 (ja) オーディオ信号を処理する方法及び装置
TWI581252B (zh) 使用截斷分析或合成窗段重疊部分處理音訊信號的方法及處理器
EP2772914A1 (en) Hybrid sound-signal decoder, hybrid sound-signal encoder, sound-signal decoding method, and sound-signal encoding method
KR102386644B1 (ko) Fd/lpd 전이 컨텍스트에서 프레임 손실 관리
US11581000B2 (en) Apparatus and method for encoding/decoding audio signal using information of previous frame
CN106663442A (zh) 使用零输入响应以获得平滑过渡的音频解码器、方法及计算机程序
JP6510566B2 (ja) オーディオ信号の時間包絡線を処理するための方法および装置、ならびにエンコーダ
WO2012070866A2 (ko) 스피치 시그널 부호화 방법 및 복호화 방법
KR101178222B1 (ko) 오디오 부호화 및 복호화 방법과 그 장치
TWI420511B (zh) 提供一分析濾過器群及一合成濾過器群之方法、設備及電路以及機器可讀媒體
JP6654236B2 (ja) オーディオ変換コーディングにおけるオーバーラップ率の信号適応スイッチングのための符号化器、復号器および方法
US20240087577A1 (en) Apparatus and method for audio encoding/decoding robust to transition segment encoding distortion
US20210166701A1 (en) Device and method for encoding / decoding audio signal using filter bank
JP7123911B2 (ja) オーディオコーデックにおける長期予測のためのシステム及び方法
US9620139B2 (en) Adaptive linear predictive coding/decoding

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150730

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160728

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170728

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee