KR101441896B1 - 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치 - Google Patents

적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치 Download PDF

Info

Publication number
KR101441896B1
KR101441896B1 KR1020080009009A KR20080009009A KR101441896B1 KR 101441896 B1 KR101441896 B1 KR 101441896B1 KR 1020080009009 A KR1020080009009 A KR 1020080009009A KR 20080009009 A KR20080009009 A KR 20080009009A KR 101441896 B1 KR101441896 B1 KR 101441896B1
Authority
KR
South Korea
Prior art keywords
current frame
audio signal
lpc
transient
frame
Prior art date
Application number
KR1020080009009A
Other languages
English (en)
Other versions
KR20090083070A (ko
Inventor
정종훈
이건형
이철우
이남숙
문한길
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020080009009A priority Critical patent/KR101441896B1/ko
Priority to US12/361,940 priority patent/US8438017B2/en
Priority to PCT/KR2009/000431 priority patent/WO2009096713A2/ko
Publication of KR20090083070A publication Critical patent/KR20090083070A/ko
Application granted granted Critical
Publication of KR101441896B1 publication Critical patent/KR101441896B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

적응적으로 선형 예측 코딩 계수의 보간을 수행하여 오디오 신호를 부호화하거나 복호화하는 방법 및 장치가 개시된다. 본 발명에 따르면, 현재 프레임 내에 트랜지언트 구간의 존재 여부에 따라 선형 예측 코딩 계수의 보간을 선택적으로 수행함으로써 트랜지언트 구간에서의 선형 예측 코딩 계수의 보간을 통해 불필요한 잡음이 생기는 것을 방지한다.
LPC, 윈도우, 트랜지언트, 보간

Description

적응적 LPC 계수 보간을 이용한 오디오 신호의 부호화, 복호화 방법 및 장치{Method and apparatus for encoding/decoding audio signal using adaptive LPC coefficient interpolation}
본 발명은 오디오 신호의 부호화 및 복호화에 관한 것으로, 보다 상세하게는 현재 프레임 내의 오디오 신호에 트랜지언트 신호가 존재하는지 여부에 따라서 적응적으로 선형 예측 코딩(Linear Predictive Coding: LPC) 계수의 보간을 수행하여 오디오 신호를 부호화하거나 복호화하는 방법 및 장치에 관한 것이다.
일반적으로 오디오 신호는 프레임이라고 불리는 일정한 시간 단위로 분할되어 처리된다. 프레임 단위로 오디오 신호를 처리하는 경우 양자화 에러 등에 의하여 연속되는 프레임 사이의 불연속점이 발생되어 음질이 열화될 수 있다. 따라서 인접한 프레임 사이의 불연속을 방지하기 위해서 다양한 알고리즘이 제안되었는데, 선형 예측 코딩의 경우에는 선형 예측 코딩 계수 사이의 급격한 변화에 의한 음질 열화를 방지하기 위해서 인접한 프레임의 선형 예측 코딩 계수 사이의 보간을 수행한다.
선형 예측 코딩 계수 사이의 보간은 입력 오디오 신호의 분석을 통해 생성된 소스 모델의 변화를 방지하기 위한 것으로, 선형 예측 코딩 계수들이 위치하는 Z-도메인 상의 극점(pole)들의 궤적 변화를 트래이싱(tracing)하여 이루어진다. 일반적으로 선형 예측 코딩 계수의 보간은 LSF(Line Spectral Frequency) 또는 LSP(Line Spectral Pair) 변환을 통해 수행된다.
도 1a 및 1b는 종래 기술에 따른 선형 예측 코딩 계수의 보간시에 발생되는 문제점을 설명하기 위한 참조도이다.
도 1a 및 1b를 참조하면, 입력 오디오 신호에 신호의 크기가 갑자기 변화되는 트랜지언트(transient) 신호가 존재하는 경우, 선형 예측 코딩 계수의 보간을 수행하여 복원된 신호는 트랜지언트 구간의 뒷부분의 큰 신호가 이전의 작은 크기의 신호에 영향을 미치게 되어 잡음이 발생하는 프리-에코(pre-echo) 현상이 발생한다.
이와 같이, 종래 선형 예측 코딩 계수의 보간 방식에 따르면 트랜지언트 구간에서 선형 예측 코딩 계수의 불일치로 인해 에러가 증가하며 불필요한 잡음을 유발하는 문제점이 있다.
본 발명이 해결하고자 하는 과제는 트랜지언트 신호가 존재하는 프레임 내에서 선형 예측 코딩 계수의 보간을 선택적으로 수행함으로써 선형 예측 코딩의 예측 모델링의 효율을 향상시키는 오디오 신호의 부호화, 복호화 방법 및 장치를 제공하는 것이다.
전술한 과제를 해결하기 위한 본 발명에 따른 오디오 신호의 부호화 방법은 현재 프레임의 오디오 신호의 특성에 따라서 상기 현재 프레임에 적용되는 윈도우를 결정하는 단계; 상기 현재 프레임의 오디오 신호에 상기 결정된 윈도우를 적용하여 윈도우잉(windowing)을 수행하는 단계; 상기 윈도우잉된 현재 프레임의 오디오 신호에 대한 선형 예측 코딩(Linear Predictive Coding:LPC) 분석을 수행함으로써 상기 현재 프레임의 오디오 신호의 선형 예측 계수를 출력하는 단계; 및 상기 현재 프레임의 오디오 신호의 특성에 따라서 상기 현재 프레임의 오디오 신호의 선형 예측 코딩 계수와 인접 프레임의 오디오 신호의 선형 예측 코딩 계수를 이용한 선형 예측 코딩 계수의 보간을 선택적으로 수행하는 단계를 포함하는 것을 특징으로 한다.
전술한 과제를 해결하기 위한 본 발명에 따른 오디오 신호의 부호화 장치는 현재 프레임의 오디오 신호의 특성에 따라서 상기 현재 프레임에 적용되는 윈도우를 결정하는 윈도우 결정부; 상기 현재 프레임의 오디오 신호에 상기 결정된 윈도 우를 적용하여 윈도우잉(windowing)을 수행하는 윈도우 적용부; 상기 윈도우잉된 현재 프레임의 오디오 신호에 대한 선형 예측 코딩(Linear Predictive Coding:LPC) 분석을 수행함으로써 상기 현재 프레임의 오디오 신호의 선형 예측 계수를 출력하는 선형 예측 코딩 분석부; 및 상기 현재 프레임의 오디오 신호의 특성에 따라서 상기 현재 프레임의 오디오 신호의 선형 예측 코딩 계수와 인접 프레임의 오디오 신호의 선형 예측 코딩 계수를 이용한 선형 예측 코딩 계수의 보간을 선택적으로 수행하는 선형 예측 코딩 합성부를 포함하는 것을 특징으로 한다.
전술한 과제를 해결하기 위한 본 발명에 따른 오디오 신호의 복호화 방법은 비트스트림에 구비된 트랜지언트 구간 정보를 이용하여 복호화되는 현재 프레임 내에 트랜지언트 구간이 존재하는지를 판단하는 단계; 및 상기 현재 프레임 내에 트랜지언트 구간이 존재하는지 여부에 따라서 상기 비트스트림으로부터 추출된 현재 프레임의 선형 예측 코딩 계수와 인접 프레임의 선형 예측 코딩 계수의 보간을 선택적으로 수행하는 단계를 포함하는 것을 특징으로 한다.
전술한 과제를 해결하기 위한 본 발명에 따른 오디오 신호의 복호화 장치는 비트스트림에 구비된 트랜지언트 구간 정보를 이용하여 복호화되는 현재 프레임 내에 트랜지언트 구간이 존재하는지를 판단하는 트랜지언트 위치 판단부; 및 상기 현재 프레임 내에 트랜지언트 구간이 존재하는지 여부에 따라서 상기 비트스트림으로부터 추출된 현재 프레임의 선형 예측 코딩 계수와 인접 프레임의 선형 예측 코딩 계수의 보간을 선택적으로 수행하는 선형 예측 코딩 합성 수행부를 포함하는 것을 특징으로 한다.
본 발명에 따르면 트랜지언트 구간을 기준으로 적응적으로 윈도우의 크기를 변화시킴으로써, 트랜지언트 구간에서 선형 예측 코딩 계수의 보간시에 발생하는 프리-에코 등의 불필요한 잡음을 제거할 수 있다. 또한, 본 발명에 따르면 트랜지언트 구간의 신호에 대해서 선형 예측 코딩 계수를 보간하지 않고 인접한 각 프레임의 선형 예측 코딩 계수를 이용한 선형 예측 코딩 합성을 통해 생성된 신호를 더함으로써 트랜지언트 구간에서의 오디오 신호의 불연속을 방지하여 음질을 향상시킨다.
이하, 첨부된 도면들을 참조하여 본 발명의 바람직한 실시예에 대하여 구체적으로 설명한다.
도 2는 본 발명에 따른 오디오 신호의 부호화 장치의 구성을 나타낸 블록도이다.
도 2를 참조하면, 본 발명에 따른 오디오 신호의 부호화 장치(200)는 분할부(210), 윈도우 결정부(220), 윈도우 적용부(230), 선형 예측 코딩 분석부(240), 선형 예측 코딩 합성부(260) 및 다중화부(270)를 포함한다.
분할부(210)는 입력 오디오 신호를 소정 길이의 프레임들로 분할한다. 윈도우 결정부(220)는 현재 프레임의 오디오 신호의 특성에 따라서 현재 프레임에 적용되는 윈도우를 결정한다. 연속적인 오디오 신호를 처리하기 위해서, 분할부(210)는 오디오 신호를 소정 길이를 갖는 프레임 단위로 분할한다. 일반적으로 윈도우 는 직사각형(retangular) 윈도우 대신에 다음의 수학식 1로 정의되는 해밍(hamming) 윈도우와 같이 점차 증가하다가 감소하는 형태의 윈도우(tapered window)를 이용한다.
Figure 112008007425426-pat00001
이는 직사각형 윈도우에 비하여 해밍 윈도우와 같은 형태를 갖는 윈도우의 주파수 스펙트럼 특성이 더 좋기 때문이다. 다만, 해밍 윈도우와 같은 형태의 윈도우들은 시간 영역 측면에서, 인접한 프레임 사이에 윈도우가 중첩되는 구간이 발생한다. 트랜지언트 구간에서 선형 예측 계수의 보간시에 발생하는 프리-에코는 이러한 윈도우의 중첩에 의하여 트랜지언트 구간의 뒷 부분의 신호가 앞 부분의 신호에 영향을 미쳐 발생하는 것이다. 따라서, 본 발명에 따른 윈도우 결정부(220)는 일차적으로 트랜지언트 구간을 기준으로 윈도우의 형태를 가변적으로 결정함으로써 서로 다른 특성의 신호가 연결되는 구간인 트랜지언트 구간을 기준으로 윈도우가 분리되는 형태를 가지도록 함으로써 트랜지언트 구간에서 발생하는 신호의 불연속성을 방지한다.
도 3은 도 2의 윈도우 결정부(220)의 구성을 구체적으로 나타낸 블록도이다.
도 3을 참조하면, 윈도우 결정부(220)은 트랜지언트 구간 판단부(221) 및 윈 도우 선택부(222)를 포함한다.
트랜지언트 구간 판단부(221)은 현재 프레임의 오디오 신호를 복수 개의 서브 프레임들로 분할하고, 분할된 서브 프레임들 사이의 유사도 또는 평균 에너지의 차이를 계산하여 현재 프레임 내에 트랜지언트 구간이 존재하는지를 판단한다. 이러한 트랜지언트 구간 판단부(221)는 오디오 신호 부호화기 자체에 트랜지언트 구간의 판별 기능이 있는 경우에는 별도로 구비될 필요가 없다. 예를 들어 AAC(Advanced Audio Coding), MP3 등과 같은 파형 코더(wave coder)나 파라메트릭 코더와 같이 부호화기 자체에 트랜지언트 구간을 판별하는 기능이 구비된 경우 해당 기능을 이용하면 된다.
윈도우 선택부(222)는 현재 프레임 내에 트랜지언트 구간이 존재하는 것으로 판단되면, 트랜지언트 구간 내에서만 다른 프레임의 윈도우와 중첩되고, 트랜지언트 구간을 제외한 나머지 구간에서는 중첩되지 않도록 현재 프레임에 적용되는 윈도우의 형태를 선택한다. 만약, 현재 프레임 내에 트랜지언트 구간이 존재하지 않는 경우, 윈도우 선택부(222)는 윈도우의 형태 및 크기 등을 변경하지 않고 미리 설정된 윈도우를 그대로 선택한다. 이하에서는 도 4 내지 도 6을 참조하여 본 발명에 따른 현재 프레임에 적용될 윈도우 결정 과정을 상세히 설명한다.
도 4는 본 발명에 따른 현재 프레임에 적용될 윈도우를 결정하는 과정을 나타낸 플로우 차트이며, 도 5는 본 발명에 따라 현재 프레임에 존재하는 트랜지언트 구간을 판단하는 과정을 설명하기 위한 참조도이다.
도 3 및 도 4를 참조하면, 단계 410에서 트랜지언트 구간 판단부(221)은 현 재 프레임을 복수 개의 서브 프레임들로 분할하고, 분할된 서브 프레임들 중 인접한 서브 프레임들 사이의 유사도 또는 인접한 서브 프레임들 사이의 평균 에너지의 차이를 계산한다. 예를 들어, 도 5를 참조하면, 트랜지언트 구간 판단부(221)은 현재 N 프레임을 4개의 서브 프레임들(Ns1, Ns2, Ns3 및 Ns4 )로 분할한다. 그리고, 단계 420에서, 트랜지언트 구간 판단부(221)는 인접한 서브 프레임들 사이의 상관도를 계산하여 인접한 서브 프레임에 구비된 신호가 얼마나 유사한지를 판단한다. 일 예로, 트랜지언트 구간 판단부(221)는 다음의 수학식 2와 같이 인접한 제 2 및 제 3 서브 프레임들(Ns2, Ns3) 사이의 상관도(correlation)를 나타내는 R(Ns2, Ns3)를 계산한다.
Figure 112008007425426-pat00002
수학식 2에서 C(Ns2, Ns3)=E[(Ns2 - ms2)(Ns3 - ms3)]이며, ms2, ms3 는 각각 제 2 서브 프레임(Ns2) 내의 신호 및 제 3 서브 프레임(Ns3) 내의 신호의 평균값을 나타낸다. 수학식 2를 참조하면, R(Ns2, Ns3)의 절대값이 1에 근접할수록 두 서브 프레임들(Ns2, Ns3)의 신호가 유사한 것을 의미하며, R(Ns2, Ns3)의 절대값이 0에 근접할수록 두 서브 프레임들(Ns2, Ns3)의 신호 특성이 다름을 나타낸다. 즉, 인접한 서브 프레임들 사이의 상관도가 소정 임계치(Th1)보다 작은 경우에는 현재 프레임 내에 트랜지언트가 존재하는 것으로 판단할 수 있다. 도 5의 경우, 도시된 바와 같이 제 2 서브 프레임(Ns2)과 제 3 서브 프레임(Ns3) 사이는 신호의 진폭이 급격하게 변화되는 트랜지언트 구간에 해당하기 때문에 R(Ns2, Ns3)의 절대값은 소정 임계치(Th1)보다 작은 0에 가까운 값을 갖는다.
유사하게, 트랜지언트 구간 판단부(221)는 4개의 서브 프레임들(Ns1, Ns2, Ns3 및 Ns4 ) 각각의 평균 에너지를 계산한 다음, 인접한 서브 프레임들 사이의 평균 에너지의 차이가 소정 임계값(Th2) 보다 큰 경우에는 인접한 서브 프레임들 사이에 트랜지언트 구간이 존재하는 것으로 판단할 수 있다.
한편, 트랜지언트 구간 판단부(221)는 서로 다른 신호 특성을 갖는 것으로 판단된 서브 프레임 사이의 위치를 트랜지언트 위치로 결정하고, 이러한 트랜지언트 위치 정보를 부호화된 비트스트림에 부가하여 전송함으로써, 복호화기에서도 현재 프레임 내에 구비된 트랜지언트 위치를 결정할 수 있도록 할 수 있다. 이 때, 가능한 적은 비트를 이용하여 현재 프레임 내에 구비된 트랜지언트 위치를 전송하기 위해서, 현재 프레임을 2의 지수승의 값을 갖는 소정의 SF개(SF는 양의 정수로서 2의 지수승)의 서브 프레임으로 분할하면, 인접한 서브 프레임들의 위치는 (log2(SF)-1) 개의 위치 중 하나의 위치로 표현 가능하다. 구체적으로, 트랜지언트 구간 판단부(221)는 현재 프레임 내에 트랜지언트 구간이 존재하지 않는 경우는 0 의 값을 할당하고, 나머지 서브 프레임들 사이의 각각의 위치에 1~(log2(SF)-1)의 값을 할당하여 비트스트림에 트랜지언트 구간의 위치 정보로 전송할 수 있다. 예를 들어, 도 5에서는 SF의 값이 4인 경우에 해당하며, 이 경우 2비트를 트랜지언트 구간의 위치를 나타내는 정보로 활용하면 트랜지언트 구간이 제 1 서브 프레임(Ns1)과 제 2 서브 프레임(Ns2) 사이에 위치하는 경우, 제 2 서브 프레임(Ns2)과 제 3 서브 프레임(Ns3) 사이에 위치하는 경우, 제 3 서브 프레임(Ns3)과 제 4 서브 프레임(Ns4) 사이에 위치하는 경우 등 총 3개의 경우와 트랜지언트 구간이 존재하지 않는 경우를 더하여 총 4가지 경우의 현재 프레임의 트랜지언트 구간 정보를 2bits의 부가 정보를 통해 전송할 수 있다.
다시 도 4를 참조하면, 단계 430에서 현재 프레임 내에 트랜지언트 구간이 존재하는 것으로 판단된 경우, 윈도우 선택부(222)는 현재 프레임 내에 존재하는 트랜지언트 구간의 위치를 기준으로 현재 프레임의 윈도우와 인접한 프레임에 적용되는 윈도우의 중첩되는 구간이 현재 프레임 내에 존재하는 트랜지언트 구간에 한정되도록 현재 프레임 및 인접한 프레임의 윈도우의 형태를 조절한다. 다시 말해서, 윈도우 선택부(222)는 현재 프레임에 트랜지언트 구간이 존재하는 경우, 현재 프레임에 적용되는 윈도우가 트랜지언트 구간 내에서만 다른 프레임의 윈도우와 중첩되고, 트랜지언트 구간을 제외한 나머지 구간에서는 중첩되지 않고 평평한(flat) 형태를 갖도록 현재 프레임에 적용되는 윈도우의 크기 및 형태를 결정한다.
단계 440에서 현재 프레임 내에 트랜지언트 구간이 존재하지 않는 것으로 판단된 경우, 윈도우 선택부(222)는 미리 설정된 윈도우의 크기 및 형태를 유지한다. 예를 들어, 윈도우 선택부(222)는 미리 설정된 해밍 윈도우 등의 크기 및 형태를 조절하지 않고 그대로 현재 프레임에 적용한다.
도 6은 본 발명에 따른 현재 프레임에 적용될 윈도우를 결정하는 과정의 일 실시예를 설명하기 위한 참조도이다. 도 6에서 S는 프레임의 길이, SF는 서브 프레임의 개수를 나타낸다.
도 6을 참조하면, 4개의 서브 프레임으로 분할된 N 프레임에서 제 2 및 제 3 서브 프레임 사이에 트랜지언트 구간이 존재하는 것으로 판단되었다고 가정한다. 윈도우 선택부(222)는 트랜지언트 구간이 존재하는 것으로 판단된 2개의 인접한 서브 프레임이 결정되면, 서브 프레임들 각각의 중간 지점을 연결한 구간 사이에서 중첩되는 윈도우의 크기를 감소하거나 증가시킴으로써 중간 구간에서만 윈도우가 중첩되도록 윈도우의 크기를 조절한다. 예를 들어, 도 6에서 현재 N 프레임에는 2개의 윈도우들(610, 620)이 중첩되는 구간이 발생하는데, 윈도우 선택부(222)는 현재 N 프레임에 적용되는 2개의 윈도우들(610, 620)이 중첩되는 구간을 트랜지언트 구간에만 한정되도록 윈도우의 크기를 조정한다. 이러한 경우 트랜지언트 구간의 전후의 신호 특성은 서로 분리되게 되며, 트랜지언트 구간에서는 중첩된 윈도우를 적용하게 되므로 신호의 연속성이 보장될 수 있다.
다시 도 2를 참조하면, 전술한 과정을 통해 현재 프레임 내에 적용되는 윈도우가 선택되면, 윈도우 적용부(230)는 현재 프레임 내의 오디오 신호와 선택된 윈 도우를 곱하는 윈도우잉(windowing)을 수행한다.
선형 예측 코딩 분석부(240)는 윈도우잉된 현재 프레임의 오디오 신호에 대한 선형 예측 코딩 분석을 수행함으로써 현재 프레임의 오디오 신호의 선형 예측 계수를 출력한다. 선형 예측 코딩 분석부(240)는 공분산 방식(covariance method), 자기 상관 방식(autocorrelation method), 래티스 필터(Lattice filter), 레빈슨-더빈 알고리즘(Levinson-Durbin algorithm) 등을 이용하여 현재 프레임의 오디오 신호로부터 선형 예측 코딩 계수(LPC 계수)를 추출하여 출력한다.
구체적으로, 선형 예측 코딩 분석부(240)은 현재 프레임의 오디오 신호 샘플값을 s(n)은 다음과 같이 그 이전의 p(p는 양의 정수)개의 오디오 신호 샘플들(s(n-1), s(n-2),..., s(n-p))을 이용하여 다음의 수학식 3과 같이 모델링된다고 가정한다.
Figure 112008007425426-pat00003
수학식 3에서 u(n)은 선형 예측 코딩 분석에 따라서 이전의 p개의 오디오 신호 샘플들로부터 현재 프레임의 오디오 신호 샘플값을 예측하였을 때의 예측 오차값에 해당하는 것으로 여기 신호(excitation signal) 또는 잔차 신호(residual signal)라고 한다. G는 잔차 신호의 에너지에 따른 이득값(gain)을 의미한다. ai는 선형 예측 코딩 계수(LPC 계수)를 나타내며, p는 선형 예측 코딩 계수의 차수로서 일반적으로 10~16의 값을 갖는다.
수학식 3을 z-변환을 통해 변환하면 다음의 수학식 4와 같다.
Figure 112008007425426-pat00004
수학식 4에서 전달함수 H(z)의 분모 부분을 A(z)로 표시하였다.
선형 예측 코딩 합성부(250)는 선형 예측 코딩 계수들을 이용하여 현재 프레임의 오디오 신호의 예측 신호를 생성한다. 구체적으로, 선형 예측 코딩 합성부(250)는 현재 프레임 내에 트랜지언트 구간이 존재하지 않을 경우, 현재 프레임의 선형 예측 코딩 계수와 이전 프레임의 선형 예측 코딩 계수 사이의 보간을 수행하여 보간된 선형 예측 코딩 계수를 생성한다. 다음 선형 예측 코딩 합성부(250)는 보간된 선형 예측 코딩 계수를 이용한 선형 예측 코딩 합성을 수행하여 현재 프레임 내의 오디오 신호의 예측 신호를 생성한다.
만약, 현재 프레임 내에 트랜지언트 구간이 존재할 경우, 선형 예측 코딩 합성부(250)은 인접한 이전 프레임의 선형 예측 코딩 계수를 이용한 선형 예측 코딩 합성을 수행하여 제 1 예측 오디오 신호를 생성하고, 현재 프레임의 선형 예측 코딩 계수를 이용한 선형 예측 코딩 합성을 수행하여 제 2 예측 오디오 신호를 생성한 다음, 제 1 예측 오디오 신호 및 제 2 예측 오디오 신호를 결합하는 중첩 및 가산 연산을 수행하여 현재 프레임 내의 오디오 신호의 예측 신호를 생성한다.
도 9는 본 발명에 따른 선택적 선형 예측 코딩 계수의 보간 및 중첩/가산 연산 과정을 설명하기 위한 참조도이다.
도 9를 참조하면, 선형 예측 코딩 합성부(250)는 N+1 프레임과 같이 트랜지언트 구간이 존재하지 않는 프레임에 대한 선형 예측 코딩 합성을 수행하는 경우, N 프레임으로부터 추출된 시간 영역에서의 선형 예측 코딩 계수들(LN)과 N+1 프레임으로부터 추출된 시간 영역에서의 선형 예측 코딩 계수들(LN +1) 각각을 LSP 변환을 통해 주파수 영역에서의 LSP 계수들(PN, PN +1)로 변환하고, LSP 계수들(PN, PN +1)에 가중치를 부여하여 보간을 수행하여 각 서브 프레임별 LSP 계수들(CN +1,0, CN +1,1, CN +1,2, CN +1,3)을 생성한다. 여기서, 각 프레임은 4개의 서브 프레임으로 분할되는 경우를 가정하였다. 다음, 선형 예측 코딩 합성부(250)는 각 서브 프레임별 LSP 계수들(CN +1,0, CN +1,1, CN +1,2, CN +1,3)을 다시 선형 예측 코딩 계수(LPC 계수)들로 변환하여 시간 영역에서의 각 서브 프레임별 LPC 계수(TN +1,0, TN+1,1, TN +1,2, TN +1,3)들을 생성하고, 이를 이용하여 선형 예측 코딩 합성을 수행하여 N+1 프레임의 예측 오디오 신호를 생성한다.
그러나, N 프레임과 같이 트랜지언트 구간(900)이 포함되어 있는 프레임의 오디오 신호에 대한 선형 예측 코딩 분석을 수행하는 경우, 선형 예측 코딩 합성부(250)는 전술한 선형 예측 코딩 계수들의 보간 과정을 수행하지 않는다. 대신에, 선형 예측 코딩 합성부(250)는 N-1 프레임의 오디오 신호로부터 추출된 선형 예측 코딩 계수들(LN -1)을 이용한 선형 예측 코딩 합성을 수행하여 제 1 예측 오디오 신호를 생성하고, N 프레임의 오디오 신호로부터 추출된 선형 예측 코딩 계수들(LN)을 이용한 선형 예측 코딩 합성을 수행하여 제 2 예측 오디오 신호를 생성한다. 다음 선형 예측 코딩 합성부(250)는 제 1 예측 오디오 신호와 제 2 예측 오디오 신호를 중첩 가산(OverLap & Add:OLA)한다. 도 9에 도시된 바와 같이 N 프레임 내에 속하는 제 1 예측 오디오 신호의 구간(910) 및 제 2 예측 오디오 신호의 구간(920)은 트랜지언트 구간 내에서만 중첩되며, 트랜지언트 구간 이외에서는 중첩되지 않게 된다.
다시 도 2를 참조하면, 감산부(260)는 선형 예측 코딩 합성부(260)에서 출력된 예측 신호와 입력 오디오 신호 사이의 차이를 계산하여 잔차(residual) 신호를 생성한다.
다중화부(270)는 윈도우 결정부(220)에서 판단된 트랜지언트 구간의 위치 정보, 현재 프레임의 선형 예측 코딩 계수 및 잔차 신호의 정보를 다중화하여 비트스트림을 생성한다.
도 7은 본 발명에 따른 오디오 신호의 부호화 방법을 나타낸 플로우 차트이다.
단계 710에서, 현재 프레임의 오디오 신호의 특성에 따라서 현재 프레임에 적용되는 윈도우를 결정한다. 전술한 바와 같이, 현재 프레임을 서브 프레임들로 분할하고 인접한 서브 프레임들 사이의 유사도 또는 인접한 서브 프레임들 사이의 평균 에너지의 차이를 계산함으로써 현재 프레임에 트랜지언트 구간이 존재하는지를 판단할 수 있다. 그리고, 트랜지언트 구간의 존재하지 않는 경우에는 기 설정된 윈도우를 그대로 이용하고, 트랜지언트 구간이 존재하는 경우에는 트랜지언트 구간 내에서만 다른 프레임의 윈도우와 중첩되고, 트랜지언트 구간을 제외한 나머지 구간에서는 중첩되지 않는 형태를 갖도록 현재 프레임에 적용되는 윈도우를 결정한다.
단계 720에서, 현재 프레임의 오디오 신호에 결정된 윈도우를 적용하여 윈도우잉(windowing)을 수행한다.
단계 730에서, 윈도우잉된 현재 프레임의 오디오 신호에 대한 선형 예측 코딩 분석을 수행함으로써 현재 프레임의 오디오 신호의 선형 예측 계수를 출력한다.
단계 740에서, 현재 프레임의 오디오 신호의 특성, 즉 트랜지언트 구간의 존재 여부에 따라서 현재 프레임의 오디오 신호의 선형 예측 코딩 계수와 인접 프레임의 오디오 신호의 선형 예측 코딩 계수를 이용한 선형 예측 코딩 계수의 보간을 선택적으로 수행하여 현재 프레임의 오디오 신호의 예측 신호를 생성하는 선형 예측 코딩 합성을 수행한다. 구체적으로, 현재 프레임 내에 트랜지언트 구간이 존재하지 않을 경우, 현재 프레임의 선형 예측 코딩 계수와 이전 프레임의 선형 예측 코딩 계수 사이의 보간을 수행하여 보간된 선형 예측 코딩 계수를 생성하며, 현재 프레임 내에 트랜지언트 구간이 존재할 경우 보간을 수행하지 않는다. 다음 보간된 선형 예측 계수들을 이용한 선형 예측 코딩 합성을 통해 현재 프레임의 오디오 신호의 예측 신호를 생성한다.
트랜지언트 구간이 존재할 경우에는 보간을 수행하는 대신에 인접 프레임의 선형 예측 코딩 계수를 이용한 선형 예측 코딩 합성을 수행하여 제 1 예측 오디오 신호를 생성하고, 현재 프레임의 선형 예측 코딩 계수를 이용한 선형 예측 코딩 합성을 수행하여 제 2 예측 오디오 신호를 생성한 다음, 제 1 예측 오디오 신호 및 제 2 예측 오디오 신호를 결합하는 중첩 및 가산 연산을 수행하여 현재 프레임 내의 오디오 신호의 예측 신호를 생성한다.
단계 750에서, 선형 예측 코딩 합성을 통해 생성된 예측 신호와 입력 오디오 신호 사이의 차이값을 계산하여 잔차 신호를 생성한다.
단계 760에서, 트랜지언트 구간 정보, 선형 예측 코딩 계수 및 잔차 신호의 정보를 다중화하여 비트스트림을 생성한다.
도 8은 본 발명에 따른 오디오 신호의 복호화 장치를 나타낸 블록도이다.
도 8을 참조하면, 본 발명에 따른 오디오 신호의 복호화 장치(800)는 역다중화부(810), 트랜지언트 위치 판단부(820), 선형 예측 코딩 합성 수행부(830) 및 중첩 가산(OverLap and Add:OLA) 수행부(840)를 포함한다.
역다중화부(810)는 비트스트림에 대한 역다중화를 수행하여 복호화되는 현재 프레임의 트랜지언트 구간 정보, 선형 예측 코딩 계수 및 잔차 정보 등을 추출한다.
트랜지언트 위치 판단부(820)는 추출된 트랜지언트 구간 정보를 이용하여 복호화되는 현재 프레임 내에 트랜지언트 구간이 존재하는지를 판단한다.
선형 예측 코딩 합성부(830)는 도 2의 선형 예측 코딩 합성부(250)와 유사한 동작을 수행한다. 즉, 선형 예측 코딩 합성 수행부(830)는 현재 프레임 내에 트랜지언트 구간이 존재하는지 여부에 따라서 비트스트림으로부터 추출된 현재 프레임의 선형 예측 코딩 계수와 인접 프레임의 선형 예측 코딩 계수의 보간을 선택적으로 수행한다. 구체적으로 선형 예측 코딩 합성부(830)는 현재 프레임 내에 트랜지언트 구간이 존재하지 않는 경우, 현재 프레임의 선형 예측 코딩 계수와 이전 프레임의 선형 예측 코딩 계수 사이의 보간을 수행하여 보간된 선형 예측 코딩 계수를 생성하고, 보간된 선형 예측 코딩 계수를 이용한 선형 예측 코딩 합성을 수행하여 현재 프레임 내의 오디오 신호를 복호화한다.
또한 선형 예측 코딩 합성 수행부(830)는 현재 프레임 내에 트랜지언트 구간이 존재하는 경우, 인접 프레임의 선형 예측 코딩 계수를 이용한 선형 예측 코딩 합성을 수행하여 제 1 예측 오디오 신호를 생성하고, 현재 프레임의 선형 예측 코딩 계수를 이용한 선형 예측 코딩 합성을 수행하여 제 2 예측 오디오 신호를 생성한다. 그리고, 중첩 가산 수행부(840)는 제 1 예측 오디오 신호 및 제 2 예측 오디오 신호를 결합하는 중첩 및 가산 연산을 수행하여 현재 프레임 내의 오디오 신호를 복호화한다.
도 10은 본 발명에 따른 오디오 신호의 복호화 방법을 나타낸 플로우 차트이다.
도 10을 참조하면, 단계 1010에서 비트스트림에 구비된 트랜지언트 구간 정보를 추출하고, 단계 1020에서 추출된 트랜지언트 구간 정보를 이용하여 복호화되는 현재 프레임 내에 트랜지언트 구간이 존재하는지를 판단한다.
단계 1020의 판단 결과, 현재 프레임 내에 트랜지언트 구간이 존재하지 않는 경우, 단계 1030에서 현재 프레임의 선형 예측 코딩 계수와 이전 프레임의 선형 예측 코딩 계수 사이의 보간을 수행하여 보간된 선형 예측 코딩 계수를 생성하고, 보간된 선형 예측 코딩 계수를 이용한 선형 예측 코딩 합성을 수행하여 현재 프레임 내의 오디오 신호를 복호화한다.
단계 1020의 판단 결과, 현재 프레임 내에 트랜지언트 구간이 존재하는 경우, 인접 프레임의 선형 예측 코딩 계수를 이용한 선형 예측 코딩 합성을 수행하여 제 1 예측 오디오 신호를 생성하고, 현재 프레임의 선형 예측 코딩 계수를 이용한 선형 예측 코딩 합성을 수행하여 제 2 예측 오디오 신호를 생성한다. 그리고, 단계 1050에서 제 1 예측 오디오 신호 및 제 2 예측 오디오 신호를 결합하는 중첩 및 가산 연산을 수행하여 현재 프레임 내의 오디오 신호를 복호화한다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명이 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 사상은 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이와 균등하거나 또는 등가적인 변형 모두는 본 발명 사상의 범주에 속한다 할 것이다. 또한, 본 발명에 따른 시스템은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
도 1a 및 1b는 종래 기술에 따른 선형 예측 코딩 계수의 보간시에 발생되는 문제점을 설명하기 위한 참조도이다.
도 2는 본 발명에 따른 오디오 신호의 부호화 장치의 구성을 나타낸 블록도이다.
도 3은 도 2의 윈도우 결정부(220)의 구성을 구체적으로 나타낸 블록도이다.
도 4는 본 발명에 따른 현재 프레임에 적용될 윈도우를 결정하는 과정을 나타낸 플로우 차트이며, 도 5는 본 발명에 따라 현재 프레임에 존재하는 트랜지언트 구간을 판단하는 과정을 설명하기 위한 참조도이다.
도 6은 본 발명에 따른 현재 프레임에 적용될 윈도우를 결정하는 과정의 일 실시예를 설명하기 위한 참조도이다.
도 7은 본 발명에 따른 오디오 신호의 부호화 방법을 나타낸 플로우 차트이다.
도 8은 본 발명에 따른 오디오 신호의 복호화 장치를 나타낸 블록도이다.
도 9는 본 발명에 따를 선택적 선형 예측 코딩 계수의 보간 및 중첩/가산 연산 과정을 설명하기 위한 참조도이다.
도 10은 본 발명에 따른 오디오 신호의 복호화 방법을 나타낸 플로우 차트이다.

Claims (24)

  1. 현재 프레임의 오디오 신호의 특성에 따라서 상기 현재 프레임에 적용되는 윈도우를 결정하는 단계;
    상기 현재 프레임의 오디오 신호에 상기 결정된 윈도우를 적용하여 윈도우잉(windowing)을 수행하는 단계;
    상기 윈도우잉된 현재 프레임의 오디오 신호에 대한 선형 예측 코딩(Linear Predictive Coding:LPC) 분석을 수행함으로써 상기 현재 프레임의 오디오 신호의 선형 예측 계수를 출력하는 단계; 및
    상기 현재 프레임의 오디오 신호의 특성에 따라서 상기 현재 프레임의 오디오 신호의 선형 예측 코딩 계수와 인접 프레임의 오디오 신호의 선형 예측 코딩 계수를 이용한 선형 예측 코딩 계수의 보간을 선택적으로 수행하는 단계를 포함하는 것을 특징으로 하는 오디오 신호의 부호화 방법.
  2. 제 1항에 있어서,
    상기 현재 프레임 내의 오디오 신호 특성은 상기 현재 프레임 내에 트랜지언트 구간의 존재 여부인 것을 특징으로 하는 오디오 신호의 부호화 방법.
  3. 제 1항에 있어서,
    상기 현재 프레임에 적용되는 윈도우는
    상기 현재 프레임에 트랜지언트 구간이 존재하는 경우, 상기 트랜지언트 구간 내에서만 다른 프레임의 윈도우와 중첩되고, 상기 트랜지언트 구간을 제외한 나머지 구간에서는 중첩되지 않는 형태를 갖는 것을 특징으로 하는 오디오 신호의 부호화 방법.
  4. 제 1항에 있어서,
    상기 현재 프레임에 적용되는 윈도우를 결정하는 단계는
    상기 현재 프레임의 오디오 신호를 복수 개의 서브 프레임들로 분할하는 단계;
    상기 서브 프레임들 각각에 구비된 오디오 신호의 특성에 기초하여 상기 현재 프레임 내에 트랜지언트(transient) 구간의 존재 여부를 판단하는 단계; 및
    상기 판단에 기초하여 상기 현재 프레임에 적용될 윈도우의 크기를 결정하는 단계를 포함하는 것을 특징으로 하는 오디오 신호의 부호화 방법.
  5. 제 4항에 있어서,
    상기 현재 프레임 내에 트랜지언트 구간의 존재 여부를 판단하는 단계는
    인접한 상기 서브 프레임들 사이의 유사도 및 평균 에너지 중 적어도 하나를 이용하는 것을 특징으로 하는 오디오 신호의 부호화 방법.
  6. 제 4항에 있어서,
    상기 현재 프레임 내에 트랜지언트 구간의 존재하는 것으로 판단된 경우, 상기 서브 프레임의 위치를 기준으로 상기 트랜지언트 구간을 위치를 결정하고, 상기 트랜지언트 구간 위치를 부호화된 비트스트림의 소정 영역에 부가하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호의 부호화 방법.
  7. 제 1항에 있어서,
    상기 선형 예측 코딩 계수의 보간을 선택적으로 수행하는 단계는
    상기 현재 프레임 내에 트랜지언트 구간이 존재하지 않을 경우, 상기 현재 프레임의 선형 예측 코딩 계수와 이전 프레임의 선형 예측 코딩 계수 사이의 보간을 수행하여 보간된 선형 예측 코딩 계수를 생성하며,
    상기 현재 프레임 내에 트랜지언트 구간이 존재할 경우, 상기 보간을 수행하지 않는 것을 특징으로 하는 오디오 신호의 부호화 방법.
  8. 제 7항에 있어서,
    상기 보간된 선형 예측 코딩 계수를 이용한 선형 예측 코딩 합성을 수행하여 상기 현재 프레임 내의 오디오 신호의 예측 신호를 생성하는 단계; 및
    상기 예측 신호와 원 오디오 신호의 차이인 잔차 신호를 계산하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호의 부호화 방법.
  9. 제 7항에 있어서,
    상기 현재 프레임 내에 트랜지언트 구간이 존재할 경우, 상기 보간을 수행하는 대신에 인접 프레임의 선형 예측 코딩 계수를 이용한 선형 예측 코딩 합성을 수행하여 제 1 예측 오디오 신호를 생성하는 단계;
    상기 현재 프레임의 선형 예측 코딩 계수를 이용한 선형 예측 코딩 합성을 수행하여 제 2 예측 오디오 신호를 생성하는 단계;
    상기 제 1 예측 오디오 신호 및 제 2 예측 오디오 신호를 결합하는 중첩 및 가산 연산을 수행하여 상기 현재 프레임 내의 오디오 신호의 예측 신호를 생성하는 단계; 및
    상기 예측 신호와 원 오디오 신호의 차이인 잔차 신호를 계산하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호의 부호화 방법.
  10. 현재 프레임의 오디오 신호의 특성에 따라서 상기 현재 프레임에 적용되는 윈도우를 결정하는 윈도우 결정부;
    상기 현재 프레임의 오디오 신호에 상기 결정된 윈도우를 적용하여 윈도우잉(windowing)을 수행하는 윈도우 적용부;
    상기 윈도우잉된 현재 프레임의 오디오 신호에 대한 선형 예측 코딩(Linear Predictive Coding:LPC) 분석을 수행함으로써 상기 현재 프레임의 오디오 신호의 선형 예측 계수를 출력하는 선형 예측 코딩 분석부; 및
    상기 현재 프레임의 오디오 신호의 특성에 따라서 상기 현재 프레임의 오디오 신호의 선형 예측 코딩 계수와 인접 프레임의 오디오 신호의 선형 예측 코딩 계수를 이용한 선형 예측 코딩 계수의 보간을 선택적으로 수행하는 선형 예측 코딩 합성부를 포함하는 것을 특징으로 하는 오디오 신호의 부호화 장치.
  11. 제 10항에 있어서,
    상기 현재 프레임 내의 오디오 신호 특성은 상기 현재 프레임 내에 트랜지언트 구간의 존재 여부인 것을 특징으로 하는 오디오 신호의 부호화 장치.
  12. 제 10항에 있어서,
    상기 윈도우 결정부는
    상기 현재 프레임에 트랜지언트 구간이 존재하는 경우, 상기 트랜지언트 구간 내에서만 다른 프레임의 윈도우와 중첩되고, 상기 트랜지언트 구간을 제외한 나머지 구간에서는 중첩되지 않는 형태를 갖도록 상기 윈도우의 형태를 결정하는 것을 특징으로 하는 오디오 신호의 부호화 장치.
  13. 제 10항에 있어서,
    상기 윈도우 결정부는
    상기 현재 프레임을 분할한 복수 개의 서브 프레임들 중에서 인접한 서브 프레임들 사이의 유사도 및 평균 에너지 중 적어도 하나에 기초하여 상기 현재 프레 임 내에 트랜지언트(transient) 구간의 존재 여부를 판단하며, 상기 판단에 기초하여 상기 현재 프레임에 적용될 윈도우의 크기를 결정하는 것을 특징으로 하는 오디오 신호의 부호화 장치.
  14. 제 13항에 있어서,
    상기 윈도우 결정부는
    상기 현재 프레임 내에 트랜지언트 구간의 존재하는 것으로 판단된 경우, 상기 서브 프레임의 위치를 기준으로 상기 트랜지언트 구간을 위치를 결정하고, 상기 트랜지언트 구간 위치를 부호화된 비트스트림의 소정 영역에 부가하는 것을 특징으로 하는 오디오 신호의 부호화 장치.
  15. 제 10항에 있어서,
    상기 선형 예측 코딩 합성부는
    상기 현재 프레임 내에 트랜지언트 구간이 존재하지 않을 경우, 상기 현재 프레임의 선형 예측 코딩 계수와 이전 프레임의 선형 예측 코딩 계수 사이의 보간을 수행하여 보간된 선형 예측 코딩 계수를 생성하며,
    상기 현재 프레임 내에 트랜지언트 구간이 존재할 경우, 상기 보간을 수행하지 않는 것을 특징으로 하는 오디오 신호의 부호화 장치.
  16. 제 15항에 있어서,
    상기 선형 예측 코딩 합성부는
    상기 현재 프레임 내에 트랜지언트 구간이 존재하지 않을 경우 상기 보간된 선형 예측 코딩 계수를 이용한 선형 예측 코딩 합성을 수행하여 상기 현재 프레임 내의 오디오 신호의 예측 신호를 생성하는 것을 특징으로 하는 오디오 신호의 부호화 장치.
  17. 제 15항에 있어서,
    상기 선형 예측 코딩 합성부는
    상기 현재 프레임 내에 트랜지언트 구간이 존재할 경우, 인접 프레임의 선형 예측 코딩 계수를 이용한 선형 예측 코딩 합성을 수행하여 제 1 예측 오디오 신호를 생성하고, 상기 현재 프레임의 선형 예측 코딩 계수를 이용한 선형 예측 코딩 합성을 수행하여 제 2 예측 오디오 신호를 생성하며, 상기 제 1 예측 오디오 신호 및 제 2 예측 오디오 신호를 결합하는 중첩 및 가산 연산을 수행하여 상기 현재 프레임 내의 오디오 신호의 예측 신호를 생성하는 것을 특징으로 하는 오디오 신호의 부호화 장치.
  18. 비트스트림에 구비된 트랜지언트 구간 정보를 이용하여 복호화되는 현재 프레임 내에 트랜지언트 구간이 존재하는지를 판단하는 단계; 및
    상기 현재 프레임 내에 트랜지언트 구간이 존재하는지 여부에 따라서 상기 비트스트림으로부터 추출된 현재 프레임의 선형 예측 코딩 계수와 인접 프레임의 선형 예측 코딩 계수의 보간을 선택적으로 수행하는 단계를 포함하는 것을 특징으로 하는 오디오 신호의 복호화 방법.
  19. 제 18항에 있어서,
    상기 선택적으로 수행하는 단계는
    상기 현재 프레임 내에 트랜지언트 구간이 존재하는 경우, 인접 프레임의 선형 예측 코딩 계수를 이용한 선형 예측 코딩 합성을 수행하여 제 1 예측 오디오 신호를 생성하는 단계;
    상기 현재 프레임의 선형 예측 코딩 계수를 이용한 선형 예측 코딩 합성을 수행하여 제 2 예측 오디오 신호를 생성하는 단계; 및
    상기 제 1 예측 오디오 신호 및 제 2 예측 오디오 신호를 결합하는 중첩 및 가산 연산을 수행하여 상기 현재 프레임 내의 오디오 신호를 복호화하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호의 복호화 방법.
  20. 제 18항에 있어서,
    상기 선택적으로 수행하는 단계는
    상기 판단 결과 상기 현재 프레임 내에 트랜지언트 구간이 존재하지 않는 경우, 상기 현재 프레임의 선형 예측 코딩 계수와 이전 프레임의 선형 예측 코딩 계수 사이의 보간을 수행하여 보간된 선형 예측 코딩 계수를 생성하는 단계; 및
    상기 보간된 선형 예측 코딩 계수를 이용한 선형 예측 코딩 합성을 수행하여 상기 현재 프레임 내의 오디오 신호를 복호화하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호의 복호화 방법.
  21. 비트스트림에 구비된 트랜지언트 구간 정보를 이용하여 복호화되는 현재 프레임 내에 트랜지언트 구간이 존재하는지를 판단하는 트랜지언트 위치 판단부; 및
    상기 현재 프레임 내에 트랜지언트 구간이 존재하는지 여부에 따라서 상기 비트스트림으로부터 추출된 현재 프레임의 선형 예측 코딩 계수와 인접 프레임의 선형 예측 코딩 계수의 보간을 선택적으로 수행하는 선형 예측 코딩 합성 수행부를 포함하는 것을 특징으로 하는 오디오 신호의 복호화 장치.
  22. 제 21항에 있어서,
    상기 선형 예측 코딩 합성 수행부는
    상기 현재 프레임 내에 트랜지언트 구간이 존재하는 경우, 인접 프레임의 선형 예측 코딩 계수를 이용한 선형 예측 코딩 합성을 수행하여 제 1 예측 오디오 신호를 생성하고, 상기 현재 프레임의 선형 예측 코딩 계수를 이용한 선형 예측 코딩 합성을 수행하여 제 2 예측 오디오 신호를 생성하는 것을 특징으로 하는 오디오 신호의 복호화 장치.
  23. 제 22항에 있어서,
    상기 제 1 예측 오디오 신호 및 제 2 예측 오디오 신호를 결합하는 중첩 및 가산 연산을 수행하여 상기 현재 프레임 내의 오디오 신호를 복호화하는 중첩 및 가산 수행부를 더 포함하는 것을 특징으로 하는 오디오 신호의 복호화 장치.
  24. 제 21항에 있어서,
    상기 선형 예측 코딩 합성 수행부는
    상기 판단 결과 상기 현재 프레임 내에 트랜지언트 구간이 존재하지 않는 경우, 상기 현재 프레임의 선형 예측 코딩 계수와 이전 프레임의 선형 예측 코딩 계수 사이의 보간을 수행하여 보간된 선형 예측 코딩 계수를 생성하고,상기 보간된 선형 예측 코딩 계수를 이용한 선형 예측 코딩 합성을 수행하여 상기 현재 프레임 내의 오디오 신호를 복호화하는 것을 특징으로 하는 오디오 신호의 복호화 장치.
KR1020080009009A 2008-01-29 2008-01-29 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치 KR101441896B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020080009009A KR101441896B1 (ko) 2008-01-29 2008-01-29 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치
US12/361,940 US8438017B2 (en) 2008-01-29 2009-01-29 Method and apparatus for encoding/decoding audio signal using adaptive LPC coefficient interpolation
PCT/KR2009/000431 WO2009096713A2 (ko) 2008-01-29 2009-01-29 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화, 복호화 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080009009A KR101441896B1 (ko) 2008-01-29 2008-01-29 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20090083070A KR20090083070A (ko) 2009-08-03
KR101441896B1 true KR101441896B1 (ko) 2014-09-23

Family

ID=40913415

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080009009A KR101441896B1 (ko) 2008-01-29 2008-01-29 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치

Country Status (3)

Country Link
US (1) US8438017B2 (ko)
KR (1) KR101441896B1 (ko)
WO (1) WO2009096713A2 (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008071353A2 (en) * 2006-12-12 2008-06-19 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V: Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream
CN102067211B (zh) * 2009-03-11 2013-04-17 华为技术有限公司 一种线性预测分析方法、装置及系统
JP4648474B2 (ja) * 2009-08-18 2011-03-09 株式会社エヌ・ティ・ティ・ドコモ 移動通信方法
KR101137652B1 (ko) * 2009-10-14 2012-04-23 광운대학교 산학협력단 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법
WO2011046329A2 (ko) * 2009-10-14 2011-04-21 한국전자통신연구원 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
US8990094B2 (en) * 2010-09-13 2015-03-24 Qualcomm Incorporated Coding and decoding a transient frame
JP6009547B2 (ja) 2011-05-26 2016-10-19 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. オーディオ・システム及びオーディオ・システムのための方法
WO2012177067A2 (ko) * 2011-06-21 2012-12-27 삼성전자 주식회사 오디오 신호 처리방법 및 장치와 이를 채용하는 단말기
JP5799707B2 (ja) * 2011-09-26 2015-10-28 ソニー株式会社 オーディオ符号化装置およびオーディオ符号化方法、オーディオ復号装置およびオーディオ復号方法、並びにプログラム
EP2830062B1 (en) * 2012-03-21 2019-11-20 Samsung Electronics Co., Ltd. Method and apparatus for high-frequency encoding/decoding for bandwidth extension
SG11201505898XA (en) * 2013-01-29 2015-09-29 Fraunhofer Ges Forschung Concept for coding mode switching compensation
KR101621778B1 (ko) 2014-01-24 2016-05-17 숭실대학교산학협력단 음주 판별 방법, 이를 수행하기 위한 기록매체 및 단말기
KR101621774B1 (ko) 2014-01-24 2016-05-19 숭실대학교산학협력단 음주 판별 방법, 이를 수행하기 위한 기록매체 및 단말기
US9916844B2 (en) 2014-01-28 2018-03-13 Foundation Of Soongsil University-Industry Cooperation Method for determining alcohol consumption, and recording medium and terminal for carrying out same
KR101569343B1 (ko) 2014-03-28 2015-11-30 숭실대학교산학협력단 차신호 고주파 신호의 비교법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치
KR101621780B1 (ko) 2014-03-28 2016-05-17 숭실대학교산학협력단 차신호 주파수 프레임 비교법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치
KR101621797B1 (ko) 2014-03-28 2016-05-17 숭실대학교산학협력단 시간 영역에서의 차신호 에너지법에 의한 음주 판별 방법, 이를 수행하기 위한 기록 매체 및 장치
KR102546098B1 (ko) * 2016-03-21 2023-06-22 한국전자통신연구원 블록 기반의 오디오 부호화/복호화 장치 및 그 방법
CN109427338B (zh) * 2017-08-23 2021-03-30 华为技术有限公司 立体声信号的编码方法和编码装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1160770A2 (en) * 2000-06-02 2001-12-05 Lucent Technologies Inc. Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction
US20060031075A1 (en) 2004-08-04 2006-02-09 Yoon-Hark Oh Method and apparatus to recover a high frequency component of audio data

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5388221A (en) * 1992-05-05 1995-02-07 Meitner; Edmund Adaptive digital audio interpolation system
JP2747956B2 (ja) * 1992-05-20 1998-05-06 国際電気株式会社 音声復号装置
JP3572769B2 (ja) 1995-11-30 2004-10-06 ソニー株式会社 ディジタルオーディオ信号処理装置および方法
JPH1020891A (ja) * 1996-07-09 1998-01-23 Sony Corp 音声符号化方法及び装置
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
FR2884989A1 (fr) * 2005-04-26 2006-10-27 France Telecom Procede d'adaptation pour une interoperabilite entre modeles de correlation a court terme de signaux numeriques.
US7987089B2 (en) * 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1160770A2 (en) * 2000-06-02 2001-12-05 Lucent Technologies Inc. Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction
US20060031075A1 (en) 2004-08-04 2006-02-09 Yoon-Hark Oh Method and apparatus to recover a high frequency component of audio data

Also Published As

Publication number Publication date
WO2009096713A3 (ko) 2009-09-24
KR20090083070A (ko) 2009-08-03
WO2009096713A2 (ko) 2009-08-06
US20090198501A1 (en) 2009-08-06
US8438017B2 (en) 2013-05-07

Similar Documents

Publication Publication Date Title
KR101441896B1 (ko) 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치
RU2439720C1 (ru) Способ и устройство для обработки звукового сигнала
RU2470384C1 (ru) Кодирование сигнала с использованием кодирования с регуляризацией основных тонов и без регуляризации основных тонов
KR101452722B1 (ko) 신호 부호화 및 복호화 방법 및 장치
JP6450802B2 (ja) 音声符号化装置および方法
KR101505831B1 (ko) 멀티 채널 신호의 부호화/복호화 방법 및 장치
RU2680352C1 (ru) Способ и устройство для определения режима кодирования, способ и устройство для кодирования аудиосигналов и способ и устройство для декодирования аудиосигналов
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
KR20120128136A (ko) 일반 오디오 및 음성 프레임을 포함하는 오디오 신호용 디코더
EP3579228A1 (en) Audio coding device, audio coding method, audio coding program, audio decoding device, audio decoding method, and audio decoding program
KR20130126708A (ko) 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
JPH08179795A (ja) 音声のピッチラグ符号化方法および装置
JPH10177398A (ja) 音声符号化装置
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
KR101629661B1 (ko) 복호 방법, 복호 장치, 프로그램 및 그 기록매체
JP3353852B2 (ja) 音声の符号化方法
JP2615548B2 (ja) 高能率音声符号化方式とその装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP2956068B2 (ja) 音声符号化復号化方式
JP3299099B2 (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JPH08185199A (ja) 音声符号化装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP2001147700A (ja) 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
JP2508002B2 (ja) 音声符号化方法とその装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee