KR20080075409A - 오디오 부호화 및 복호화 장치와 그 방법 - Google Patents

오디오 부호화 및 복호화 장치와 그 방법 Download PDF

Info

Publication number
KR20080075409A
KR20080075409A KR1020070014558A KR20070014558A KR20080075409A KR 20080075409 A KR20080075409 A KR 20080075409A KR 1020070014558 A KR1020070014558 A KR 1020070014558A KR 20070014558 A KR20070014558 A KR 20070014558A KR 20080075409 A KR20080075409 A KR 20080075409A
Authority
KR
South Korea
Prior art keywords
frequency
audio signal
sine wave
encoded
audio
Prior art date
Application number
KR1020070014558A
Other languages
English (en)
Other versions
KR101149448B1 (ko
Inventor
이건형
오재원
이철우
정종훈
이남숙
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020070014558A priority Critical patent/KR101149448B1/ko
Priority to US12/023,410 priority patent/US8055506B2/en
Priority to EP08712351.9A priority patent/EP2115738A4/en
Priority to CN2008800047316A priority patent/CN101606193B/zh
Priority to PCT/KR2008/000700 priority patent/WO2008100034A1/en
Publication of KR20080075409A publication Critical patent/KR20080075409A/ko
Application granted granted Critical
Publication of KR101149448B1 publication Critical patent/KR101149448B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/093Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 오디오 신호에 대한 정현파를 연결하여 부호화할 때, 음질을 유지하면서 압축율을 향상시킬 수 있는 오디오 부호화 및 복호화 장치와 그 방법에 관한 것으로, 본 발명의 한 유형에 따른 오디오 부호화 방법은, 입력되는 오디오 신호의 정현파를 연결하는 단계;상기 연결된 정현파의 주파수를 심리 음향적인 주파수로 변환하는 단계; 상기 심리 음향적인 주파수를 부호화하는 제 1 부호화 단계; 상기 연결된 정현파의 진폭을 부호화하는 제 2 부호화 단계; 및 상기 제 1 부호화 단계에서 부호화된 결과와 상기 제 2 부호화 단계에서 부호화된 결과를 혼합하여 부호화된 오디오 신호로서 출력하는 단계를 포함한다.

Description

오디오 부호화 및 복호화 장치와 그 방법{Audio encoding and decoding apparatus and method thereof}
도 1은 본 발명의 일 실시 예에 따른 오디오 부호화 장치의 기능 블록도이다.
도 2는 도 1의 주파수 변환부에 정의된 정현파의 주파수와 심리 음향적인 주파수간의 관계 예시도이다.
도 3은 본 발명의 다른 실시 예에 따른 오디오 부호화 장치의 기능 블록도이다.
도 4는 본 발명의 또 다른 실시 예에 따른 오디오 부호화 장치의 기능 블록도이다.
도 5는 본 발명의 또 다른 실시 예에 따른 오디오 부호화 장치의 기능 블록도이다.
도 6은 본 발명의 일 실시 예에 따른 오디오 복호화 장치의 기능 블록도이다.
도 7은 본 발명이 다른 실시 예에 따른 오디오 복호화 장치의 기능 블록도이다.
도 8은 본 발명의 또 다른 실시 예에 따른 오디오 복호화 장치의 기능 블록 도이다.
도 9는 본 발명의 또 다른 실시 예에 따른 오디오 복호화 장치의 기능 블록도이다.
도 10은 본 발명의 일 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다.
도 11은 본 발명의 다른 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다.
도 12는 본 발명의 또 다른 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다.
도 13은 본 발명의 또 다른 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다.
도 14는 본 발명의 일 실시 예에 따른 오디오 복호화 방법의 동작 흐름도이다.
도 15는 본 발명이 다른 실시 예에 따른 오디오 복호화 방법의 동작 흐름도이다.
도 16은 본 발명의 또 다른 실시 예에 따른 오디오 복호화 방법의 동작 흐름도이다.
도 17은 본 발명의 또 다른 실시 예에 따른 오디오 복호화 방법의 동작 흐름도이다.
본 발명은 오디오 부호화 및 복호화 장치와 그 방법에 관한 것으로, 특히, 오디오 신호에 대한 정현파(sinusoidal)를 연결하여 부호화하는 오디오 부호화 및 복호화 장치와 그 방법에 관한 것이다.
파라메트릭 부호화(parametric coding)는 입력되는 오디오 신호를 시간적으로 특정 길이만큼 세그먼트(segment)하고, 세그먼트된 오디오 신호에 대한 정현파(sinusoidal)를 추출한다. 정현파를 추출한 결과, 주파수가 유사한 정현파가 시간적으로 여러 세그먼트에 지속되는 경우에, 파라메트릭 부호화는 주파수가 유사한 정현파를 연결하여 부호화한다.
주파수가 유사한 정현파를 연결하여 부호화할 때, 파라메트릭 부호화는 처음 정현파에 대해 주파수, 위상 및 진폭을 각각 부호화하고, 그 다음에 연결된 정현파에 대해 위상값과 진폭차를 부호화한다.
위상값을 부호화하는 경우에, 기존의 파라메트릭 부호화는 이전 세그먼트(또는 이전 프레임)의 주파수와 위상으로부터 현재 세그먼트의 위상을 예측하고, 예측된 위상과 현재 세그먼트의 위상간의 오차를 ADPCM(Adaptive Differential Pulse Code Modulation)한다. 그러나 ADPCM은 오차가 작은 경우에 오차 신호 측정 스케일을 작게 조정함으로써, 같은 비트를 이용하여 다음 세그먼트에 대해 더욱 정밀하게 부호화하는 방식이다.
따라서 입력되는 오디오 신호의 주파수가 급격하게 변하고, 주파수가 변하기 직전의 오차 신호 측정 스케일이 매우 작은 경우에, 검출된 오차가 ADPCM의 비트로 표현할 수 있는 범위를 넘어 잘못된 부호화 결과를 얻게 됨으로써, 음질이 저하될 수 있다.
본 발명이 이루고자 하는 기술적 과제는 오디오 신호에 대한 정현파를 연결하여 부호화할 때, 음질을 유지하면서 압축율을 향상시킬 수 있는 오디오 부호화 및 복호화 장치와 그 방법을 제공하는데 있다.
본 발명이 이루고자 하는 다른 기술적 과제는 복수의 세그먼트에 대해 연결된 정현파와 연결되지 않는 정현파를 분리하여 부호화 및 복호화 할 수 있는 오디오 부호화 및 복호화 장치와 그 방법을 제공하는데 있다.
상술한 기술적 과제들을 달성하기 위하여 본 발명의 한 유형에 따른 방법은,오디오 부호화 방법에 있어서, 입력되는 오디오 신호의 정현파를 연결하는 단계; 상기 연결된 정현파의 주파수를 심리 음향적인 주파수로 변환하는 단계; 상기 심리 음향적인 주파수를 부호화하는 제 1 부호화 단계; 상기 연결된 정현파의 진폭을 부호화하는 제 2 부호화 단계; 및 상기 제 1 부호화 단계에서 부호화된 결과와 상기 제 2 부호화 단계에서 부호화된 결과를 혼합하여 부호화된 오디오 신호로서 출력하는 단계를 포함하는 오디오 부호화 방법을 제공한다.
상기 오디오 부호화 방법은, 상기 심리 음향적인 주파수와 이전 세그먼트의 심리 음향적인 주파수를 토대로 예측된 주파수간의 차를 검출하는 단계를 더 포함 하고, 상기 제 1 부호화 단계는 상기 심리 음향적인 주파수 대신 상기 차를 부호화하는 것이 바람직하다.
상기 오디오 부호화 방법은, 상기 입력되는 오디오 신호에 대한 심리 음향 모델을 이용하여 계산된 마스킹 레벨과 상기 연결된 정현파의 진폭을 토대로 양자화 스텝 사이즈를 설정하는 단계; 및 상기 설정된 양자화 스텝 사이즈로 상기 차를 양자화하는 단계를 더 포함하고, 상기 제 1 부호화 단계는 상기 차 대신 상기 양자화된 차를 부호화하는 것이 바람직하고, 상기 부호화된 오디오 신호 출력 단계는 상기 설정된 양자화 스텝 사이즈에 대한 정보를 제어 파라미터로서 혼합하여 출력하는 것이 바람직하다.
상기 오디오 부호화 방법은, 상기 입력되는 오디오 신호를 특정 길이로 세그먼트하는 단계; 상기 세그먼트된 오디오 신호의 정현파를 추출하는 단계; 상기 추출된 정현파의 주파수와 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수를 비교하는 단계; 상기 비교결과, 상기 추출된 정현파중에서 적어도 하나의 정현파가 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수와 유사하지 않은 주파수를 가지면, 상기 추출된 정현파를 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결된 정현파와 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않은 정현파로 분리하여 부호화하는 단계를 더 포함하고, 상기 연결된 정현파에 대해 상기 정현파 연결 단계, 상기 주파수 변환 단계, 상기 제 1 부호화 단계, 상기 제 2 부호화 단계 및 상기 부호화된 오디오 신호를 출력하는 단계를 순차적으로 수행하고, 상기 비교결과, 상기 추출된 정현파가 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수와 유사한 주파수를 가지면, 상기 추출된 정현파에 대해 상기 정현파 연결 단계, 상기 주파수 변환 단계, 상기 제 1 부호화 단계, 상기 제 2 부호화 단계 및 상기 부호화된 오디오 신호를 출력하는 단계를 순차적으로 수행하는 것이 바람직하다.
상술한 기술적 과제들을 달성하기 위하여 본 발명의 한 유형에 따른 방법은, 오디오 신호 복호화 방법에 있어서, 부호화된 오디오 신호를 파싱하여 부호화된 심리 음향적인 주파수와 부호화된 정현파의 진폭을 각각 검출하는 단계; 상기 검출된 부호화된 심리 음향적인 주파수를 복호화하는 제 1 복호화 단계; 상기 복호화된 심리 음향적인 주파수를 정현파의 주파수로 변환하는 단계; 상기 검출된 부호화된 정현파의 진폭을 복호화하는 제 2 복호화 단계; 상기 복호화된 정현파의 진폭과 상기 정현파의 주파수를 토대로 정현파의 위상을 검출하는 단계; 및 상기 검출된 정현파의 위상, 상기 복호화된 정현파의 진폭 및 상기 정현파의 주파수를 토대로 정현파를 복원하고, 복원된 정현파를 이용하여 오디오 신호를 복원하는 단계를 포함하는 오디오 복호화 방법을 제공한다.
상술한 기술적 과제들을 달성하기 위하여 본 발명의 한 유형에 따른 장치는, 오디오 부호화 장치에 있어서, 입력되는 오디오 신호를 특정 길이로 세그먼트 하는 세그먼테이션부; 상기 세그먼테이션부로부터 출력되는 오디오 신호로부터 적어도 하나의 정현파를 추출하는 정현파 추출부; 상기 정현파 추출부에서 추출된 정현파를 연결하는 정현파 연결부; 상기 연결된 정현파의 주파수를 심리 음향적인 주파수로 변환하는 주파수 변환부; 상기 심리 음향적인 주파수를 부호화하는 제 1 부호화 부; 상기 연결된 정현파의 진폭을 부호화하는 제 2 부호화부; 및 상기 제 1 부호화부에서 부호화된 결과와 상기 제 2 부호화부에서 부호화된 결과를 혼합하여 부호화된 오디오 신호로서 출력하는 혼합부를 포함하는 오디오 신호 부호화 장치를 제공한다.
상술한 기술적 과제들을 달성하기 위하여 본 발명의 한 유형에 따른 장치는, 오디오 복호화 장치에 있어서, 부호화된 오디오 신호를 파싱하는 파싱부; 상기 파싱부로부터 출력되는 부호화된 심리 음향적인 주파수를 복호화하는 제 1 복호화부;상기 복호화된 심리 음향적인 주파수를 정현파의 주파수로 변환하는 주파수 역변환부; 상기 파싱부로부터 출력되는 부호화된 정현파의 진폭을 복호화하는 제 2 복호화부; 상기 정현파 주파수와 상기 복호화된 정현파의 진폭을 토대로 정현파의 위상을 검출하는 위상 검출부; 및 상기 위상 검출부에서 검출된 정현파의 위상, 상기 복호화된 정현파의 진폭 및 상기 정현파의 주파수를 토대로 정현파를 복원하고 상기 복원된 정현파를 이용하여 오디오 신호를 복원하는 오디오 복원부를 포함하는 오디오 복호화 장치를 제공한다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시 예를 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시 예에 따른 오디오 부호화 장치(100)의 기능 블록도이다. 도 1을 참조하면, 오디오 부호화 장치(100)는 세그먼테이션(segmentation)부(101), 정현파 추출부(102), 정현파 연결부(103), 주파수 변환부(104), 제 1 부호화부(105), 제 2 부호화부(106), 및 혼합부(107)를 포함한다.
세그먼테이션부(101)는 입력되는 오디오 신호를 시간에 따라 특정 길이 L로 세그먼트한다. 상기 특정 길이 L은 정수이다. 따라서, 세그먼테이션부(101)로부터 출력되는 오디오 신호가 S(n)이면, 상기 n은 시간에 따른 인덱스로서, n=1∼L로 정의될 수 있다. 입력되는 오디오 신호를 특정 길이 L로 세그먼트할 때, 세그먼트된 오디오 신호들은 L/2 또는 특정 길이만큼 이전 세그먼트와 겹칠 수 있다.
정현파 추출부(102)는 매칭 추적 방식으로 세그먼테이션부(101)로부터 출력되는 세그먼트된 오디오 신호로부터 적어도 하나의 정현파를 추출한다. 즉, 정현파 추출부(102)는 우선, 세그먼트된 오디오 신호 S(n)으로부터 가장 큰 진폭(amplitude)을 갖는 정현파를 추출한다. 다음, 정현파 추출부(102)는 상기 추출된 정현파를 제외한 세그먼트된 오디오 신호로부터 그 다음으로 큰 진폭을 갖는 정현파를 추출한다. 정현파 추출부(102)는 사전에 설정된 정현파의 진폭(amplitude)에 도달할 때까지 세그먼트된 오디오 신호로부터 정현파를 추출하는 과정을 반복적으로 수행할 수 있다. 상기 사전에 설정된 정현파의 진폭은 타겟 비트율(target bit rate)에 따라 결정될 수 있다. 그러나, 정현파 추출부(102)는 정현파의 진폭에 사전에 설정하지 않고, 세그먼트된 오디오 신호로부터 정현파를 추출할 수 있다. `
정현파 추출부(102)에서 추출되는 정현파는 수학식 1과 같이 정의할 수 있다.
Figure 112007012924212-PAT00001
수학식 1에서
Figure 112007012924212-PAT00002
는 검출된 정현파의 진폭이고,
Figure 112007012924212-PAT00003
는 하기 수학식 2와 같이 주파수가
Figure 112007012924212-PAT00004
이고, 위상이
Figure 112007012924212-PAT00005
인 정현파이다.
Figure 112007012924212-PAT00006
수학식 2에서 A는
Figure 112007012924212-PAT00007
의 크기를 1로 만들기 위한 규격화 상수이다. 여기서 i는 검출된 정현파의 개수와 대응되는 것으로, 서로 다른 정현파를 지칭하는 인덱스이다. 정현파 추출부(102)에서 하나의 세그먼트에 대해 추출된 정현파의 개수가 K개이면, i는 i=1∼K의 값을 갖는다.
정현파 연결부(103)는 현재 세그먼트된 오디오 신호로부터 추출된 정현파의 주파수와 이전 세그먼트된 오디오 신호로부터 추출된 정현파의 주파수를 토대로 현재 세그먼트된 오디오 신호로부터 추출된 정현파를 이전 세그먼트된 오디오 신호로부터 추출된 정현파에 연결한다. 이러한 정현파의 연결은 주파수 트랙킹이라고 정의할 수 있다.
주파수 변환부(104)는 상기 연결된 정현파의 주파수를 심리 음향적인 주파수로 변환한다. 주파수가 높은 경우에 심리 음향의 특성상 정확한 주파수를 들을 수 없을 뿐 아니라 위상도 느끼지 못한다. 따라서, 낮은 주파수는 정밀하게 부호화하고, 높은 주파수는 정밀하게 부호화하지 않기 위하여, 주파수 변환부(104)는 도 2에 도시된 바와 같이 정현파의 주파수와 심리 음향적인 주파수간의 관계를 정의하 고, 이를 토대로 상기 연결된 정현파의 주파수를 심리 음향적인 주파수로 변환시킨다. 도 2에 도시된 바와 같이 정현파의 주파수가 높을수록, 심리 음향적인 주파수의 변화 폭은 작다.
또한, 주파수 변환부(104)는 ERB(Equivalent Rectangular Band) 스케일(Scale), 바크 밴드 스케일(Bark Band Scale), 크리티컬 밴드(Critical Band) 등을 이용하여 주파수를 변환할 수 있다. ERB 스케일을 사용할 경우에, 주파수 변환부(104)는 정현파 주파수 f를 수학식 3에 의해 변환시켜 심리 음향적인 주파수 S(f)를 출력할 수 있다.
S(f)=log(0.00437×f+1)
정현파 연결부(303)로부터 출력되는 정현파가 K개인 경우에, 주파수 변환부(104)는 K개의 정현파 각각의 주파수를 심리 음향적인 주파수로 변환시킨다.
제 1 부호화부(105)는 심리 음향적인 주파수를 부호화한다. 제 2 부호화부(106)는 정현파 연결부(103)로부터 출력되는 연결된 정현파의 진폭(
Figure 112007012924212-PAT00008
)을 부호화한다. 제 1 부호화부(105) 및 제 2 부호화부(106)는 허프만 부호화 방식을 이용하여 부호화를 수행할 수 있다.
혼합부(107)는 제 1 부호화부(105)로부터 출력된 부호화된 심리 음향적인 주파수와 제 2 부호화부(106)로부터 출력되는 부호화된 진폭을 혼합하여 부호화된 오디오 신호로서 출력한다. 부호화된 오디오 신호는 비트스트림 형태를 가질 수 있 다.
도 3은 본 발명의 다른 실시 예에 따른 오디오 부호화 장치(300)의 기능 블록도이다. 도 3의 오디오 부호화 장치(300)는 세그먼테이션부(301), 정현파 추출부(302), 정현파 연결부(303), 주파수 변환부(304), 차 검출기(305), 제 1 부호화부(306), 예측부(307), 제 2 부호화부(308), 및 혼합부(309)를 포함한다.
도 3의 오디오 부호화 장치(300)는 도 1의 오디오 부호화 장치(100)에 예측 기능을 더 부가한 실시 예이다. 따라서, 오디오 부호화 장치(300)에 포함되는 세그먼테이션부(301), 정현파 추출부(302), 정현파 연결부(303), 주파수 변환부(304), 제 2 부호화부(308) 및 혼합부(309)는 도 1의 오디오 부호화 장치(100)에 포함되는 세그먼테이션부(101), 정현파 추출부(102), 정현파 연결부(103), 주파수 변환부(104), 제 2 부호화부(106) 및 혼합부(107)와 유사하게 구성 및 동작한다.
도 3의 차 검출기(305)는 이전 세그먼트의 심리 음향적인 주파수를 토대로 예측된 주파수와 주파수 변환부(304)로부터 출력되는 심리 음향적인 주파수간의 차를 검출하고, 검출된 차를 제 1 부호화부(306)로 전송한다. 예측된 주파수가 K개인 경우에, 차 검출기(305)는 주파수 변환부(304)로부터 출력되는 심리 음향적인 주파수에 대응되는 예측된 주파수를 이용하여 상기 차를 검출한다.
제 1 부호화부(306)는 차 검출기(305)로부터 출력되는 차를 부호화한다. 제 1 부호화부(306)는 허프만 부호화 방식을 이용하여 입력되는 차를 부호화할 수 있다. 제 1 부호화부(306)에서 부호화된 결과는 혼합부(309)로 전송된다.
예측부(307)는 제 1 부호화부(306)로부터 전송되는 부호화되기 전의 심리 음 향적인 주파수를 토대로 현재 세그먼트에서의 심리 음향적인 주파수를 예측한다. 예를 들어, 이후의 심리 음향적인 주파수는 이전 값과 유사할 확률이 가장 크므로 이전 값을 예측치로 사용할 수 있다. 예측된 심리 음향적인 주파수를 상기 예측된 주파수로서 차 검출기(205)로 제공된다.
도 4는 본 발명의 또 다른 실시 예에 따른 오디오 부호화 장치(400)의 기능 블록도이다. 도 4에 도시된 오디오 부호화 장치(400)는 세그먼테이션부(401), 정현파 추출부(402), 정현파 연결부(403), 주파수 변환부(404), 차 검출기(405), 양자화부(406), 예측부(407), 마스킹 레벨 제공부(408), 제 1 부호화부(409), 제 2 부호화부(410), 및 혼합부(411)를 포함한다.
도 4의 오디오 부호화 장치(400)는 도 3의 오디오 부호화 장치(300)에 양자화 기능을 더 부가한 실시 예이다. 따라서, 도 4의 오디오 부호화 장치(400)에 포함되는 세그먼테이션부(401), 정현파 추출부(402), 정현파 연결부(403), 주파수 변환부(404), 차 검출기(405), 제 2 부호화부(410)는 도 3의 오디오 부호화 장치(300)에 포함되는 세그먼테이션부(301), 정현파 추출부(302), 정현파 연결부(303), 주파수 변환부(304), 차 검출기(305), 제 2 부호화부(308)와 유사하게 구성 및 동작한다.
도 4의 마스킹 레벨 제공부(408)는 세그먼테이션부(401)로부터 출력되는 현재 세그먼트된 오디오 신호에 대한 심리음향 모델을 토대로 마스킹 레벨을 계산하고, 계산된 마스킹 레벨을 현재 세그먼트된 오디오 신호의 마스킹 레벨로서 제공한다.
양자화부(406)는 마스킹 레벨 제공부(408)로부터 제공되는 마스킹 레벨과 정현파 연결부(404)로부터 출력되는 연결된 정현파의 진폭(
Figure 112007012924212-PAT00009
)을 토대로 양자화 스텝 사이즈(step size)를 설정한다. 즉, 양자화부(406)는 상기 연결된 정현파의 진폭(
Figure 112007012924212-PAT00010
)이 상기 마스킹 레벨 이상이면, 양자화 스텝 사이즈를 작게 설정하고, 상기 연결된 정현파의 진폭이 상기 마스킹 레벨 이상이 아니면, 양자화 스텝 사이즈를 크게 설정한다. 양자화부(406)는 설정된 양자화 스텝 사이즈를 이용하여 차 검출기(405)로부터 출력되는 차를 양자화 한다. 또한, 양자화부(406)는 양자화 하기전의 차를 이전 세그먼트의 심리 음향적인 주파수로서 예측부(407)로 전송하고, 설정된 양자화 스텝 사이즈를 혼합부(411)로 전송한다.
예측부(407)는 차를 토대로 현재 세그먼트의 심리 음향적인 주파수를 예측하고, 예측된 주파수를 차 검출기(405)로 제공한다.
제 1 부호화부(409)는 양자화부(406)로부터 출력되는 양자화된 차 신호를 부호화한다. 혼합부(411)는 제 1 부호화부(409)와 제 2 부호화부(410)로부터 출력되는 부호화된 결과와 양자화부(406)로부터 출력되는 양자화 스텝 사이즈를 혼합하고, 혼합된 결과를 부호화된 오디오 신호로서 출력한다. 상기 양자화 스텝 사이즈는 부호화된 오디오 신호의 제어 파라미터(control parameter)로서 혼합된다.
도 5는 본 발명의 또 다른 실시 예에 따른 오디오 부호화 장치(500)의 기능 블록도이다. 도 5에 도시된 오디오 부호화 장치(500)는 세그먼테이션부(501), 정현파 추출부(502), 정현파 연결부(503), 주파수 변환부(504), 차 검출기(505), 양자 화부(506), 예측부(507), 마스킹 레벨 제공부(508), 제 1 부호화부(509), 제 2 부호화부(510), 제 3 부호화부(511), 및 혼합부(512)를 포함한다.
도 5의 오디오 부호화 장치(500)는 도 4의 오디오 부호화 장치(400)에 연결된 정현파와 연결되지 않은 정현파를 구분하여 부호화하는 기능을 더 부가한 실시 예이다. 따라서, 도 5의 오디오 부호화 장치(500)에 포함되는 세그먼테이션부(501), 정현파 추출부(502), 주파수 변환부(504), 차 검출기(505), 양자화부(506), 예측부(507), 마스킹 레벨 제공부(508), 제 1 부호화부(509), 제 2 부호화부(510)는 도 4에 도시된 오디오 부호화 장치(400)에 포함되는 세그먼테이션부(401), 정현파 추출부(402), 주파수 변환부(404), 차 검출기(405), 양자화부(406), 예측부(407), 마스킹 레벨 제공부(408), 제 1 부호화부(409), 제 2 부호화부(410)와 유사하게 구성 및 동작한다.
도 5의 정현파 연결부(503)는 정현파 추출부(502)에서 현재 추출된 정현파의 주파수와 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수를 비교한다. 비교결과, 현재 추출된 정현파의 주파수중에서 적어도 하나의 정현파가 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수와 유사하지 않은 주파수를 가지면, 정현파 연결부(503)는 주파수가 유사하지 않은 정현파의 주파수, 위상, 및 진폭을 제 3 부호화부(511)로 전송한다. 반면에 현재 추출된 정현파중에서 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수와 유사한 주파수를 갖는 정현파에 대해 정현파 연결부(503)는 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결하고, 연결된 정현파의 주파수를 주파수 변환부(504)로 전송하고, 연결된 정현파의 진폭을 제 2 부호화부(510)로 전송한다.
제 3 부호화부(511)는 정현파 연결부(503)로부터 전송되는 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않는 정현파의 주파수, 위상 및 진폭을 각각 부호화한다.
혼합부(512)는 제 1 부호화부(509), 제 2 부호화부(510), 및 제 3 부호화부(511)로부터 각각 출력되는 부호화 결과와 양자화부(506)로부터 출력되는 양자화 스텝 사이즈를 혼합하고, 혼합된 결과를 부호화된 오디오 신호로서 출력한다.
도 5의 오디오 부호화 장치(500)에서 정의한 연결된 정현파와 연결되지 않은 정현파를 구분하여 부호화하는 기능은 도 1의 오디오 부호화 장치(100) 및 도 3의 오디오 부호화 장치(300)에도 각각 추가되도록 구현할 수 있다. 이에 따라 오디오 부호화 장치(100)의 정현파 연결부(103)와 도 3의 정현파 연결부(303)는 각각 도 5의 정현파 연결부(503)와 유사하게 구성 및 동작하도록 구현할 수 있고, 도 1의 오디오 부호화 장치(100)와 도 3의 오디오 부호화 장치(300)는 도 5의 제 3 부호화 부(511)를 더 포함하도록 구현할 수 있다.
도 6은 본 발명의 일 실시 예에 따른 오디오 복호화 장치(600)의 기능 블록도이다. 도 6의 오디오 복호화 장치(600)는 파싱부(601), 제 1 복호화부(602), 주파수 역변환부(603), 제 2 복호화부(604), 위상 검출부(605), 및 오디오 신호 복원부(606)를 포함한다. 도 6의 오디오 복호화 장치(600)는 도 1의 오디오 부호화 장치(100)에 대응되는 장치이다.
부호화된 오디오 신호가 입력되면, 파싱부(601)는 입력되는 부호화된 오디오 신호를 파싱한다. 입력되는 부호화된 오디오 신호는 비트스트림 형태를 가질 수 있다. 이에 따라 파싱부(601)는 부호화된 심리 음향적인 주파수를 제 1 복호화부(602)로 전송하고, 부호화된 정현파의 진폭을 제 2 복호화부(604)로 전송한다.
제 1 복호화부(602)는 파싱부(601)로부터 전송되는 부호화된 심리 음향적인 주파수를 복호화한다. 제 1 복호화부(602)는 도 1의 제 1 부호화부(105)에서 수행되는 부호화에 대응되는 복호화 방식으로 주파수를 복호화한다.
주파수 역변환부(603)는 제 1 복호화부(602)로부터 전송되는 복호화된 심리 음향적인 주파수를 정현파의 주파수로 역변환한다. 주파수 역변환부(603)는 도 1의 주파수 변환부(104)에서 수행되는 변환에 대응되는 역변환방식을 사용하여 상기 복호화된 심리 음향적인 주파수를 정현파의 주파수로 역변환한다.
제 2 복호화부(604)는 파싱부(601)로부터 전송되는 부호화된 정현파의 진폭을 복호화한다. 제 2 복호화부(604)는 도 1의 제 2 부호화부(106)에서 수행되는 부호화에 대응되는 복호화 방식으로 주파수를 복호화한다.
위상 검출부(605)는 주파수 역변환부(603)로부터 출력되는 정현파의 주파수와 제 2 복호화부(604)로부터 출력되는 복호화된 정현파의 진폭을 토대로 정현파의 위상을 검출한다. 즉, 위상 검출부(605)는 수학식 4에 의해 정현파의 위상을 검출할 수 있다.
Figure 112007012924212-PAT00011
정현파의 위상 =
수학식 4에서
Figure 112007012924212-PAT00012
는 이전 연결된 정현파의 위상이며,
Figure 112007012924212-PAT00013
은 각각 이전 연결된 정현파의 주파수(bin으로 정의된 주파수)와 현재 정현파의 주파수(bin으로 정의된 주파수)이다.
오디오 신호 복원부(606)는 위상 검출부(605)에서 검출된 정현파의 위상, 위상 검출부(605)를 통해 전송되는 정현파의 주파수 및 정현파의 진폭을 이용하여 정현파를 복원하고, 복원된 정현파를 이용하여 오디오 신호를 복원한다.
도 7은 본 발명의 다른 실시 예에 따른 오디오 복호화 장치(700)의 기능 블록도이다. 도 7의 오디오 복호화 장치(700)는 파싱부(701), 제 1 복호화부(702), 가산기(703), 예측부(704), 주파수 역변환부(705), 제 2 복호화부(706), 위상 검출부(707), 및 오디오 신호 복원부(708)를 포함한다. 도 7의 오디오 복호화 장치(700)는 도 3의 오디오 부호화 장치(300)에 대응되는 장치로서, 도 6의 오디오 복호화 장치(600)에 예측 기능을 더 부가한 실시 예이다.
따라서, 도 7에 도시된 파싱부(701), 제 1 복호화부(702), 제 2 복호화부(706), 위상 검출부(707) 및 오디오 신호 복원부(708)는 도 6에 도시된 파싱부(601), 제 1 복호화부(602), 제 2 복호화부(606), 위상 검출부(607) 및 오디오 신호 복원부(608)와 유사하게 구성 및 동작한다.
도 7의 가산기(703)는 제 1 복호화부(702)로부터 출력되는 복호화된 심리 음 향적인 주파수에 예측된 주파수를 가산하고, 가산된 결과를 주파수 역변환부(705)로 전송한다. 주파수 역변환부(705)는 가산기(703)로부터 전송되는 가산된 주파수를 정현파의 주파수로 역변환한다. 주파수 역변환부(705)로부터 출력되는 정현파 주파수는 위상 검출부(707)로 전송된다.
주파수 역변환부(705)에서 주파수 역변환되기 전의 주파수가 전송되면, 예측부(704)는 주파수 역변환부(705)로부터 전송되는 주파수를 이전 세그먼트의 복호화된 심리 음향적인 주파수로 하여 현재 세그먼트의 심리 음향적인 주파수를 예측한다. 예측 방식은 도 3의 예측부(307)와 유사한 방식으로 수행될 수 있다.
도 8은 본 발명의 또 다른 실시 예에 따른 오디오 복호화 장치(800)의 기능 블록도이다. 도 8의 오디오 복호화 장치(800)는 파싱부(801), 제 1 복호화부(802), 역양자화부(803), 가산기(804), 예측부(805), 주파수 역변환부(806), 제 2 복호화부(807), 위상 검출부(808), 및 오디오 신호 복원부(809)를 포함한다. 도 8의 오디오 복호화 장치(800)는 도 4의 오디오 부호화 장치(400)에 대응되는 장치로서, 도 7의 오디오 복호화 장치(700)에 역양자화 기능을 더 부가한 실시 예이다.
따라서, 도 8에 도시된 제 1 복호화부(802), 예측부(805), 주파수 역변환부(806), 제 2 복호화부(807), 위상 검출부(808) 및 오디오 신호 복원부(809)는 도 7에 도시된 제 1 복호화부(702), 예측부(705), 주파수 역변환부(706), 제 2 복호화부(707), 위상 검출부(708) 및 오디오 신호 복원부(709)와 유사하게 구성 및 동작한다.
도 8의 파싱부(801)는 입력되는 부호화된 오디오 신호를 파싱하여 부호화된 심리 음향적인 주파수를 제 1 복호화부(802)로 전송하고, 부호화된 정현파의 진폭을 제 2 복호화부(807)로 전송하고, 상기 부호화된 오디오 신호의 제어 파라미터로 포함된 양자화 스텝 사이즈 정보를 역양자화부(803)로 전송한다.
도 8의 역양자화부(803)는 제 1 복호화부(802)로부터 전송되는 복호화된 심리 음향적인 주파수를 양자화 스텝 사이즈에 따라 역양자화 한다. 가산기(804)는 역양자화부(803)로부터 출력되는 역양자화된 심리 음향적인 주파수와 예측부(805)로부터 전송되는 예측된 주파수를 가산하여 출력한다.
도 9는 본 발명의 또 다른 실시 예에 따른 오디오 복호화 장치(900)의 기능 블록도이다. 도 9의 오디오 복호화 장치(900)는 파싱부(901), 제 1 복호화부(902), 역양자화부(903), 가산기(904), 예측부(905), 주파수 역변환부(906), 제 2 복호화부(907), 위상 검출부(908), 제 3 복호화부(909) 및 오디오 신호 복원부(910)를 포함한다. 도 9의 오디오 복호화 장치(900)는 도 5의 오디오 부호화 장치(500)에 대응되는 장치로서, 도 8의 오디오 복호화 장치(800)에 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결된 정현파와 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않은 정현파를 구분하여 복호화하는 기능을 더 부가한 실시 예이다.
따라서, 도 9에 도시된 제 1 복호화부(902), 역양자화부(903), 가산기(904), 예측부(905), 주파수 역변환부(906), 제 2 복호화부(907), 위상 검출부(908)는 도 8에 도시된 제 1 복호화부(802), 역양자화부(803), 가산기(804), 예측부(805), 주파수 역변환부(806), 제 2 복호화부(807), 위상 검출부(808)와 유사하게 구성 및 동작한다.
도 9의 파싱부(901)는 입력되는 부호화된 오디오 신호를 파싱하여 부호화된 심리 음향적인 주파수를 제 1 복호화부(902)로 전송하고, 부호화된 정현파의 진폭을 제 2 복호화부(907)로 전송하고, 상기 부호화된 오디오 신호의 제어 파라미터로 포함된 양자화 스텝 사이즈 정보를 역양자화부(903)로 전송한다. 또한, 파싱부(901)는 입력되는 부호화된 오디오 신호에 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않은 정현파의 부호화된 주파수, 진폭 및 위상이 포함되어 있으면, 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않는 정현파의 부호화된 주파수, 진폭 및 위상을 제 3 복호화부(909)로 전송한다.
제 3 복호화부(909)는 도 5의 제 3 부호화부(511)에 대응되는 복호화 방식으로 상기 부호화된 정현파의 주파수, 진폭, 및 위상을 복호화한다. 제 3 복호화부(909)에서 복호화된 정현파의 주파수, 진폭 및 위상은 오디오 신호 복원부(910)로 전송된다.
오디오 신호 복원부(910)는 위상 검출부(908)로부터 전송되는 이전 세그먼트와 연결된 정현파의 주파수, 진폭, 및 위상으로 정현파를 복원하고, 제 3 복호화부(909)로부터 전송되는 이전 세그먼트와 연결되지 않은 정현파의 주파수, 진폭, 및 위상으로 정현파를 복원한다. 그 다음, 오디오 신호 복원부(910)는 복원된 정현파들을 이용하여 오디오 신호를 복원한다. 즉, 오디오 신호 복원부(910)는 복원된 정현파들을 결합하여 오디오 신호를 복원한다.
도 6 및 도 7에 도시된 오디오 복호화 장치는 도 9에 도시된 제 3 복호화 부(909)를 더 포함하도록 변형할 수 있다. 만약 도 6 및 도 7에 도시된 오디오 복호화 장치가 제 3 복호화부(909)를 포함할 경우에, 도 6 및 도 8의 파싱부(601, 701)는 각각 도 9의 파싱부(901)와 같이 입력되는 부호화된 오디오 신호에 이전 세그먼트와 연결되지 않은 정현파의 주파수, 진폭 및 위상이 포함되어 있는지 체크하여 파싱하도록 구현된다.
도 10은 본 발명의 일 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다. 도 1을 참조하여 도 10의 오디오 부호화 방법의 동작을 설명하면 다음과 같다.
우선, 상기 방법은, 입력되는 오디오 신호로부터 추출된 정현파를 연결한다(1001). 정현파 연결은 도 1의 정현파 연결부(103)에서 설명한 바와 같이 수행된다.
그 다음, 상기 방법은 도 1의 주파수 변환부(104)에서와 같이 연결된 정현파의 주파수를 심리 음향적인 주파수로 변환한다(1002). 상기 방법은 심리 음향적인 주파수를 도 1의 제 1 부호화부(105)에서와 같이 부호화한다(1003). 제 1001 단계에서 연결된 정현파의 진폭을 도 1의 제 2 부호화부(106)에서와 같이 부호화한다(1004). 상기 방법은, 제 1003 단계에서 부호화된 주파수와 제 1004 단계에서 부호화된 진폭을 혼합하여 부호화된 오디오 신호로서 출력한다(1005).
도 11은 본 발명의 다른 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다. 도 11은 도 10의 오디오 부호화 방법에 예측 기능을 더 부가한 실시 예이다. 따라서, 도 11의 제 1101, 1102, 및 1105 단계는 도 10의 제 1001, 1002, 및 1004 단계와 각각 유사하게 동작된다.
도 11의 제 1103 단계에서 상기 오디오 부호화 방법은 심리 음향적인 주파수와 예측된 주파수간의 차를 검출한다. 예측된 주파수는 도 3의 예측부(307)에서와 같이 이전 세그먼트의 심리 음향적인 주파수를 토대로 예측된다.
상기 차가 검출되면, 상기 오디오 부호화 방법은, 제 1104 단계에서 검출된 차를 도 3의 제 1 부호화부(306)에서와 같이 부호화한다. 이에 따라 상기 오디오 부호화 방법은 제 1106 단계에서 부호화된 차와 부호화된 정현파의 진폭을 혼합하여 부호화된 오디오 신호를 출력한다.
도 12는 본 발명의 또 다른 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다. 도 12는 도 11의 오디오 부호화 방법에 양자화 기능을 더 부가한 실시 예이다. 따라서, 도 12의 제 1201, 1202, 1203, 및 1207 단계는 도 11의 1101, 1102, 1103, 및 1105 단계와 각각 유사하게 동작된다.
도 12의 제 1204 단계에서 상기 오디오 부호화 방법은 양자화 스텝 사이즈를 설정한다. 양자화 스텝 사이즈는 도 4의 마스킹 레벨 제공부(408)와 양자화부(406)에서 설명한 바와 같은 방식으로 설정된다.
양자화 스텝 사이즈가 설정되면, 제 1205 단계에서 상기 오디오 부호화 방법은 상기 양자화 스텝 사이즈를 이용하여 제 1203 단계에서 검출된 차를 양자화한다. 다음, 상기 오디오 부호화 방법은 제 1206 단계에서 양자화된 차를 부호화한다.
제 1208 단계에서 상기 오디오 부호화 방법은 부호화된 차와 부호화된 진폭을 혼합할 때, 양자화 스텝 사이즈 정보를 부호화된 오디오 신호의 제어 파라미터 로서 혼합한다. 이에 따라 부호화된 오디오 신호는 양자화 스텝 사이즈 정보를 제어 파라미터로서 포함하게 된다.
도 13은 본 발명의 또 다른 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다. 도 13은 입력되는 오디오 신호를 특정 길이로 세그먼트하여 정현파를 추출할 때, 추출된 정현파가 이전 세그먼트로부터 추출된 정현파와 연결 가능한 정현파인지를 체크하여 오디오 신호를 부호화하는 실시 예이다.
도 13을 참조하면, 상기 오디오 부호화 방법은, 입력되는 오디오 신호를 도 1의 세그먼테이션부(101)에서와 같이 특정 길이로 세그먼트한다(1301). 다음, 상기 오디오 부호화 방법은, 세그먼트된 오디오 신호의 정현파를 추출한다(1302). 정현파는 도 1의 정현파 추출부(102)에서와 같이 추출된다.
상기 오디오 부호화 방법은, 추출된 정현파의 주파수와 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수를 비교한다(1303). 이 때, 현재 세그먼트의 오디오 신호로부터 추출된 정현파의 수와 이전 세그먼트의 오디오 신호로부터 추출되는 정현파의 수는 상이할 수 있다.
비교결과, 현재 세그먼트의 오디오 신호로부터 추출된 정현파중에서 적어도 하나의 정현파가 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수와 유사하지 않은 주파수를 가지면, 상기 오디오 부호화 방법은 제 1302 단계에서 추출된 정현파를 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결된 정현파와 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않은 정현파로 분리하여 부호화한다(1304, 1305).
정현파 주파수의 유사 여부는, 예를 들어, 현재 세그먼트의 오디오 신호로부터 추출된 정현파가 20Hz, 30Hz, 35Hz이고, 사전에 설정된 오차 범위가 ±0.2일 때, 이전 세그먼트로부터 추출된 정현파의 주파수중 (20±0.2)Hz, (30±0.2)Hz, (35±0.2)Hz범위에 포함되는 주파수가 모두 존재하면, 현재 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수는 모두 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수와 유사한 경우이다. 반면에, 이전 세그먼트로부터 추출된 정현파의 주파수중 (20±0.2)Hz에 포함되는 주파수가 존재하지 않으면, 현재 세그먼트의 오디오 신호로부터 추출된 정현파중 20Hz의 정현파의 주파수는 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수와 유사하지 않은 경우이다. 따라서, 현재 세그먼트의 오디오 신호로부터 추출된 20Hz의 주파수를 갖는 정현파는 이전 세그먼트와 연결되지 않은 정현파로 분리되고, 30Hz와 35Hz의 주파수를 갖는 정현파는 이전 세그먼트와 연결된 정현파로 분리된다.
상기 오디오 부호화 방법은, 도 10의 제 1001 내지 1004 단계 또는 도 11의 제 1101 내지 1105 단계 또는 도 12의 제 1201 내지 1207 단계를 순차적으로 수행하여 상기 이전 세그먼트와 연결된 정현파를 부호화하고, 상기 이전 세그먼트와 연결되지 않은 정현파를 도 5의 제 3 부호화부(511)와 같이 부호화한다. 그리고, 상기 오디오 부호화 방법은, 상기 이전 세그먼트와 연결된 정현파를 부호화한 결과와 상기 이전 세그먼트와 연결되지 않은 정현파를 부호화한 결과를 혼합한 결과를 부호화된 오디오 신호로서 출력한다.
한편, 현재 세그먼트의 오디오 신호로부터 추출된 정현파가 모두 이전 세그 먼트의 오디오 신호로부터 추출된 정현파의 주파수와 유사한 주파수를 가지면, 상기 오디오 신호 부호화 방법은, 현재 세그먼트로부터 추출된 정현파에 대해 도 10의 제 1001 내지 1005 단계 또는 도 11의 제 1101 내지 1106 단계 또는 도 12의 제 1201 내지 1208 단계를 순차적으로 수행하여 상기 이전 세그먼트와 연결된 정현파를 부호화한다(1304, 1306).
도 14는 본 발명의 일 실시 예에 따른 오디오 복호화 방법의 동작 흐름도이다. 상기 오디오 복호화 방법은, 부호화된 오디오 신호를 파싱하여 부호화된 심리 음향적인 주파수와 부호화된 정현파의 진폭을 각각 검출한다(1401). 다음, 오디오 복호화 방법은, 검출된 부호화된 심리 음향적인 주파수를 복호화하고(1402), 도 6의 주파수 역변환부(603)와 같이 상기 복호화된 심리 음향적인 주파수를 정현파의 주파수로 변환한다(1403).
상기 오디오 복호화 방법은, 검출된 부호화된 정현파의 진폭을 복호화하고(1404), 복호화된 정현파의 진폭과 정현파의 주파수를 토대로 정현파의 위상을 검출한다(1405). 상기 상기 오디오 복호화 방법은 검출된 정현파의 위상, 상기 복호화된 정현파의 진폭 및 정현파의 주파수를 토대로 정현파를 복원하고, 복원된 정현파를 이용하여 오디오 신호를 복원한다(1406).
도 15는 본 발명의 다른 실시 예에 따른 오디오 복호화 방법의 동작 흐름도이다. 도 15는 도 14의 오디오 복호화 방법에 예측 기능을 더 부가한 예이다. 따라서, 도 15의 제 1501, 1502, 1505 1506, 1507 단계는 도 14의 1401, 1402, 1404, 1405, 1406 단계와 유사하게 동작된다.
상기 오디오 복호화 방법은 도 15의 제 1503 단계에서 이전 세그먼트의 복호화된 심리 음향적인 주파수를 토대로 예측된 주파수와 제 1502 단계에서 복호화된 심리 음향적인 주파수를 가산한다. 다음, 상기 오디오 복호화 방법은 제 1504 단계에서 가산된 결과를 정현파의 주파수로 변환한다.
도 16은 본 발명의 또 다른 실시 예에 따른 오디오 복호화 방법의 동작 흐름도이다. 도 16은 도 15의 오디오 복호화 방법에 역양자화 기능을 더 부가한 예이다. 따라서, 도 16의 제 1601, 1602, 1605, 1606, 1607, 1608 단계는 도 15의 1501, 1502, 1504, 1505, 1506, 1507 단계와 유사하게 동작된다.
상기 오디오 복호화 방법은 제 1603 단계에서 양자화 스텝 사이즈를 이용하여 복호화된 심리 음향적인 주파수를 역양자화한다. 양자화 스텝 사이즈는 제 1601 단계에서 부호화된 오디오 신호를 파싱할 때, 상기 부호화된 오디오 신호로부터 검출된다. 다음 상기 오디오 복호화 방법은 제 1604 단계에서 예측된 주파수와 상기 역양자화된 결과를 가산한다.
도 17은 본 발명의 또 다른 실시 예에 따른 오디오 복호화 방법의 동작 흐름도이다. 도 17의 오디오 복호화 방법은 부호화된 오디오 신호를 복호화할 때, 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결된 정현파와 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않은 정현파를 분리하여 복호화하는 실시 예이다.
도 17을 참조하면, 상기 오디오 복호화 방법은, 부호화된 오디오 신호를 파싱하여 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않은 정현 파(이하 연결되지 않은 정현파라고 약함)가 존재하는지 체크한다(1701, 1702). 즉, 부호화된 오디오 신호에 상기 연결되지 않은 정현파의 주파수, 진폭 및 위상이 존재하면, 상기 오디오 복호화 방법은 부호화된 오디오 신호에 상기 연결되지 않은 정현파가 존재하는 것으로 판단한다.
상기 부호화된 오디오 신호에 상기 연결되지 않은 정현파가 존재하면, 상기 부호화된 오디오 신호를 상기 연결되지 않은 정현파와 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결된 정현파(이하 연결된 정현파라고 약함)로 분리하여 복호화한다(1703).
즉, 오디오 복호화 방법은 제 1703 단계에서 상기 부호화된 오디오 신호를 파싱하여 상기 연결된 정현파와 상기 연결되지 않은 정현파를 분리하고, 상기 연결된 정현파에 대해 도 14의 제 1402, 1403, 1404, 및 1405 단계, 또는 도 15의 제 1502 내지 1506 단계 또는 도 16의 제 1602 내지 1607 단계를 순차적으로 수행하여 정현파의 주파수, 진폭 및 위상을 각각 검출하고, 상기 연결되지 않은 정현파에 대해 도 9의 제 3 복호화부(909)에서와 같이 복호화하여 정현파의 주파수, 진폭 및 위상을 각각 검출한다. 다음 상기 오디오 복호화 방법은, 검출된 상기 연결된 정현파의 주파수, 진폭, 및 위상을 토대로 상기 연결된 정현파를 복원하고, 상기 연결되지 않은 정현파의 주파수, 진폭 및 위상을 토대로 상기 연결되지 않은 정현파를 복원하고, 상기 복원된 연결된 정현파와 상기 복원된 연결되지 않는 정현파를 결합하여 오디오 신호를 복원한다.
한편, 오디오 복호화 방법은, 부호화된 오디오 신호를 파싱한 결과, 상기 부 호화된 오디오 신호에 상기 연결되지 않은 정현파가 존재하지 않으면, 제 1704 단계에서 연결된 정현파를 복호화한다. 상기 연결된 정현파에 대한 복호화는 상술한 제 1703 단계에서 연결된 정현파에 대한 복호화와 유사한 방식으로 수행된다.
본원 발명에 따른 오디오 부호화 및 복호화 방법을 수행하기 위한 프로그램은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드로서 저장되고 실행될 수 있다.
이제까지 본 발명에 대하여 그 바람직한 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
상술한 바와 같이 본 발명은 오디오 신호에 대한 정현파를 연결하여 부호화할 때, 연결된 정현파의 주파수를 심리음향 주파수로 변환시켜 부호화함으로써, 오디오 신호의 음질을 유지하면서 오디오 신호에 대한 압축율을 향상시킬 수 있다.
또한, 상기 심리 음향 주파수와 예측된 주파수간의 차를 부호화함으로써, 오디오 신호에 대한 압축율을 더 향상시킬 수 있고, 심리 음향 모델을 이용하여 계산된 마스킹 레벨과 연결된 정현파의 진폭을 이용하여 양자화 스텝 사이즈를 설정하고, 설정된 양자화 스텝 사이즈를 이용하여 상기 차를 부호화함으로써, 오디오 신호에 대한 압축율을 더 향상시킬 수 있다.
그리고, 현재 세그먼트된 오디오 신호로부터 추출된 정현파중에서 이전 세그먼트된 오디오 신호로부터 추출된 정현파의 주파수와 유사하지 않은 주파수를 갖는 정현파가 존재할 경우에, 현재 세그먼트된 오디오 신호로부터 추출된 정현파를 이전의 세그먼트된 오디오 신호로부터 추출된 정현파와 연결된 정현파와 이전의 세그먼트된 오디오 신호로부터 추출된 정현파와 연결되지 않은 정현파로 분리하여 부호화함으로써, 잘못된 부호화로 음질이 저하되는 것을 방지할 수 있다.

Claims (18)

  1. 오디오 부호화 방법에 있어서,
    입력되는 오디오 신호의 정현파를 연결하는 단계;
    상기 연결된 정현파의 주파수를 심리 음향적인 주파수로 변환하는 단계;
    상기 심리 음향적인 주파수를 부호화하는 제 1 부호화 단계;
    상기 연결된 정현파의 진폭을 부호화하는 제 2 부호화 단계; 및
    상기 제 1 부호화 단계에서 부호화된 결과와 상기 제 2 부호화 단계에서 부호화된 결과를 혼합하여 부호화된 오디오 신호로서 출력하는 단계를 포함하는 오디오 부호화 방법.
  2. 제 1 항에 있어서, 상기 오디오 부호화 방법은,
    상기 심리 음향적인 주파수와 이전 세그먼트의 심리 음향적인 주파수를 토대로 예측된 주파수간의 차를 검출하는 단계를 더 포함하고,
    상기 제 1 부호화 단계는 상기 심리 음향적인 주파수 대신 상기 차를 부호화하는 것을 특징으로 하는 오디오 부호화 방법.
  3. 제 2 항에 있어서, 상기 오디오 부호화 방법은,
    상기 입력되는 오디오 신호에 대한 심리 음향 모델을 이용하여 계산된 마스킹 레벨과 상기 연결된 정현파의 진폭을 토대로 양자화 스텝 사이즈를 설정하는 단 계; 및
    상기 설정된 양자화 스텝 사이즈로 상기 차를 양자화하는 단계를 더 포함하고,
    상기 제 1 부호화 단계는 상기 차 대신 상기 양자화된 차를 부호화하는 것을 특징으로 하고,
    상기 부호화된 오디오 신호 출력 단계는 상기 설정된 양자화 스텝 사이즈에 대한 정보를 제어 파라미터로서 혼합하여 출력하는 것을 특징으로 하는 오디오 부호화 방법.
  4. 제 3 항에 있어서, 상기 양자화 스텝 사이즈를 설정하는 단계는,
    상기 연결된 정현파의 진폭이 상기 마스킹 레벨 이상이면, 상기 양자화 스텝 사이즈를 작게 설정하고,
    상기 연결된 정현파의 진폭이 상기 마스킹 레벨 이상이 아니면, 상기 양자화 스텝 사이즈를 크게 설정하는 것을 특징으로 하는 오디오 부호화 방법.
  5. 제 1 항 내지 제 4 항중 어느 한 항에 있어서, 상기 오디오 부호화 방법은,
    상기 입력되는 오디오 신호를 특정 길이로 세그먼트하는 단계;
    상기 세그먼트된 오디오 신호의 정현파를 추출하는 단계;
    상기 추출된 정현파의 주파수와 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수를 비교하는 단계;
    상기 비교결과, 상기 추출된 정현파중에서 적어도 하나의 정현파가 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수와 유사하지 않은 주파수를 가지면, 상기 추출된 정현파를 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결된 정현파와 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않은 정현파로 분리하여 부호화하는 단계를 더 포함하고,
    상기 연결된 정현파에 대해 상기 정현파 연결 단계, 상기 주파수 변환 단계, 상기 제 1 부호화 단계, 상기 제 2 부호화 단계 및 상기 부호화된 오디오 신호를 출력하는 단계를 순차적으로 수행하고,
    상기 비교결과, 상기 추출된 정현파가 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수와 유사한 주파수를 가지면, 상기 추출된 정현파에 대해 상기 정현파 연결 단계, 상기 주파수 변환 단계, 상기 제 1 부호화 단계, 상기 제 2 부호화 단계 및 상기 부호화된 오디오 신호를 출력하는 단계를 순차적으로 수행하는 것을 특징으로 하는 오디오 부호화 방법.
  6. 오디오 신호 복호화 방법에 있어서,
    부호화된 오디오 신호를 파싱하여 부호화된 심리 음향적인 주파수와 부호화된 정현파의 진폭을 각각 검출하는 단계;
    상기 검출된 부호화된 심리 음향적인 주파수를 복호화하는 제 1 복호화 단계;
    상기 복호화된 심리 음향적인 주파수를 정현파의 주파수로 변환하는 단계;
    상기 검출된 부호화된 정현파의 진폭을 복호화하는 제 2 복호화 단계;
    상기 복호화된 정현파의 진폭과 상기 정현파의 주파수를 토대로 정현파의 위상을 검출하는 단계; 및
    상기 검출된 정현파의 위상, 상기 복호화된 정현파의 진폭 및 상기 정현파의 주파수를 토대로 정현파를 복원하고, 복원된 정현파를 이용하여 오디오 신호를 복원하는 단계를 포함하는 오디오 복호화 방법.
  7. 제 6 항에 있어서, 상기 오디오 복호화 방법은,
    상기 복호화된 심리 음향적인 주파수와 이전 세그먼트의 복호화된 심리 음향적인 주파수를 토대로 예측된 주파수를 가산하는 단계를 더 포함하고,
    상기 정현파의 주파수로 변환하는 단계는, 상기 복호화된 심리 음향적인 주파수 대신 상기 가산된 결과를 상기 정현파의 주파수로 변환하는 것을 특징으로 하는 오디오 복호화 방법.
  8. 제 7 항에 있어서, 상기 오디오 복호화 방법은,
    상기 부호화된 오디오 신호를 파싱하여 양자화 스텝 사이즈가 검출되면, 상기 검출된 양자화 스텝 사이즈를 이용하여 상기 복호화된 심리 음향적인 주파수를 역 양자화 하는 단계를 더 포함하고,
    상기 가산 단계는 상기 복호화된 심리 음향적인 주파수 대신 상기 역 양자화된 결과와 상기 예측된 주파수를 가산하는 것을 특징으로 하는 오디오 복호화 방 법.
  9. 제 6 항 내지 제 8 항중 어느 한 항에 있어서, 상기 오디오 복호화 방법은,
    상기 부호화된 오디오 신호를 파싱한 결과, 상기 부호화된 오디오 신호에 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않은 정현파가 존재하면, 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결된 정현파와 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않은 정현파를 분리하는 단계;
    상기 연결된 정현파에 대해 상기 검출 단계, 상기 제 1 복호화 단계, 상기 변환 단계, 제 2 복호화 단계, 및 상기 위상 검출 단계를 순차적으로 수행하여 상기 연결된 정현파의 진폭, 주파수 및 위상을 각각 검출하는 제 1 검출 단계;
    상기 연결되지 않는 정현파를 복호화하여 상기 연결되지 않은 정현파의 진폭, 주파수 및 위상을 각각 검출하는 제 2 검출 단계; 및
    상기 오디오 신호 복원 단계는, 상기 제 1 검출 단계와 상기 제 2 검출단계에서 각각 검출된 정현파의 진폭, 주파수 및 위상을 토대로 정현파를 복원하고, 상기 복원된 정현파를 이용하여 오디오 신호를 복원하는 것을 특징으로 하는 오디오 복호화 방법.
  10. 오디오 부호화 장치에 있어서,
    입력되는 오디오 신호를 특정 길이로 세그먼트 하는 세그먼테이션부;
    상기 세그먼테이션부로부터 출력되는 오디오 신호로부터 적어도 하나의 정현파를 추출하는 정현파 추출부;
    상기 정현파 추출부에서 추출된 정현파를 연결하는 정현파 연결부;
    상기 연결된 정현파의 주파수를 심리 음향적인 주파수로 변환하는 주파수 변환부;
    상기 심리 음향적인 주파수를 부호화하는 제 1 부호화부;
    상기 연결된 정현파의 진폭을 부호화하는 제 2 부호화부; 및
    상기 제 1 부호화부에서 부호화된 결과와 상기 제 2 부호화부에서 부호화된 결과를 혼합하여 부호화된 오디오 신호로서 출력하는 혼합부를 포함하는 오디오 신호 부호화 장치.
  11. 제 10 항에 있어서, 상기 오디오 부호화 장치는,
    이전 세그먼트의 심리 음향적인 주파수를 토대로 주파수를 예측하는 예측부;
    상기 예측부에서 예측된 주파수와 상기 주파수 변환부로부터 출력되는 심리 음향적인 주파수간의 차를 검출하는 차 검출기를 더 포함하고,
    상기 제 1 부호화부는 상기 심리 음향적인 주파수 대신 상기 차를 부호화하는 것을 특징으로 하는 오디오 부호화 장치.
  12. 제 11 항에 있어서, 상기 오디오 부호화 장치는,
    상기 세그먼테이션부로부터 출력되는 오디오 신호에 대한 심리 음향 모델을 이용하여 계산된 마스킹 레벨을 제공하는 마스킹 레벨 제공부;
    상기 정현파 연결부로부터 출력되는 상기 연결된 정현파의 진폭과 상기 마스킹 레벨을 토대로 양자화 스텝 사이즈를 설정하고, 상기 설정된 양자화 스텝 사이즈를 이용하여 상기 차 검출기로부터 출력되는 신호를 양자화하면서, 상기 차 검출기로부터 출력되는 신호를 상기 이전 세그먼트의 심리 음향적인 주파수로서 상기 예측부로 전송하는 양자화부를 더 포함하고,
    상기 제 1 부호화부는 상기 차 대신 상기 양자화부로부터 출력되는 양자화된 신호를 부호화하고,
    상기 혼합부는 상기 양자화부로부터 출력되는 상기 양자화 스텝 사이즈를 상기 부호화된 오디오 신호의 제어 파라미터로서 혼합하는 것을 특징으로 하는 오디오 부호화 장치.
  13. 제 12 항에 있어서, 상기 양자화부는 상기 연결된 정현파의 진폭이 상기 마스킹 레벨 이상이면, 상기 양자화 스텝 사이즈를 작게 설정하고, 상기 연결된 정현파의 진폭이 상기 마스킹 레벨 이상이 아니면, 상기 양자화 스텝 사이즈를 크게 설정하는 것을 특징으로 하는 오디오 부호화 장치.
  14. 제 10 항 내지 제 13 항중 어느 한 항에 있어서,
    상기 정현파 연결부는 상기 추출된 정현파의 주파수와 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수를 비교하여 상기 추출된 정현파중에서 적어 도 하나의 정현파가 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파의 주파수와 유사하지 않으면, 상기 주파수가 유사하지 않은 정현파의 주파수, 진폭 및 위상을 부호화하는 제 3 부호화부를 더 포함하는 오디오 부호화 장치.
  15. 오디오 복호화 장치에 있어서,
    부호화된 오디오 신호를 파싱하는 파싱부;
    상기 파싱부로부터 출력되는 부호화된 심리 음향적인 주파수를 복호화하는 제 1 복호화부;
    상기 복호화된 심리 음향적인 주파수를 정현파의 주파수로 변환하는 주파수 역변환부;
    상기 파싱부로부터 출력되는 부호화된 정현파의 진폭을 복호화하는 제 2 복호화부;
    상기 정현파 주파수와 상기 복호화된 정현파의 진폭을 토대로 정현파의 위상을 검출하는 위상 검출부; 및
    상기 위상 검출부에서 검출된 정현파의 위상, 상기 복호화된 정현파의 진폭 및 상기 정현파의 주파수를 토대로 정현파를 복원하고 상기 복원된 정현파를 이용하여 오디오 신호를 복원하는 오디오 복원부를 포함하는 오디오 복호화 장치.
  16. 제 15 항에 있어서, 상기 오디오 복호화 장치는,
    이전 세그먼트의 복호화된 심리 음향적인 주파수를 토대로 주파수를 예측하 는 예측부;
    상기 제 1 복호화부에서 복호화된 심리 음향적인 주파수와 상기 예측부로부터 출력되는 예측된 주파수를 가산하는 가산기를 더 포함하고,
    상기 주파수 역변환부는 상기 복호화된 심리 음향적인 주파수 대신 상기 가산기로부터 출력되는 가산 결과를 상기 정현파의 주파수로 변환하는 것을 특징으로 하는 오디오 복호화 장치.
  17. 제 16 항에 있어서, 상기 오디오 복호화 장치는,
    상기 파싱부로부터 양자화 스텝 사이즈 정보가 출력되면, 상기 양자화 스텝 사이즈에 따라 상기 제 1 복호화부로부터 출력되는 복호화된 심리 음향적인 주파수를 역양자화 하는 역양자화부를 더 포함하고,
    상기 가산기는 상기 역양자화로부터 출력되는 역양자화된 결과와 상기 예측된 주파수를 가산하는 것을 특징으로 오디오 복호화 장치.
  18. 제 15 항 내지 제 17 항중 어느 한 항에 있어서, 상기 오디오 복호화 장치는
    상기 파싱부로부터 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않은 정현파의 부호화된 주파수, 진폭 및 위상이 출력되면, 상기 이전 세그먼트의 오디오 신호로부터 추출된 정현파와 연결되지 않은 정현파의 부호화된 주파수, 진폭 및 위상을 복호화하는 제 3 복호화부를 더 포함하고,
    상기 오디오 신호 복원부는 상기 제 3 복호화부에서 복호화된 정현파의 주파 수, 진폭 및 위상으로 정현파를 복원하여 상기 오디오 신호를 복원하는데 이용하는 것을 특징으로 하는 오디오 복호화 장치.
KR1020070014558A 2007-02-12 2007-02-12 오디오 부호화 및 복호화 장치와 그 방법 KR101149448B1 (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020070014558A KR101149448B1 (ko) 2007-02-12 2007-02-12 오디오 부호화 및 복호화 장치와 그 방법
US12/023,410 US8055506B2 (en) 2007-02-12 2008-01-31 Audio encoding and decoding apparatus and method using psychoacoustic frequency
EP08712351.9A EP2115738A4 (en) 2007-02-12 2008-02-05 DEVICE AND METHOD FOR AUDIO-CODING AND AUDIO-DECODING
CN2008800047316A CN101606193B (zh) 2007-02-12 2008-02-05 音频编码和解码装置和方法
PCT/KR2008/000700 WO2008100034A1 (en) 2007-02-12 2008-02-05 Audio encoding and decoding apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070014558A KR101149448B1 (ko) 2007-02-12 2007-02-12 오디오 부호화 및 복호화 장치와 그 방법

Publications (2)

Publication Number Publication Date
KR20080075409A true KR20080075409A (ko) 2008-08-18
KR101149448B1 KR101149448B1 (ko) 2012-05-25

Family

ID=39686606

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070014558A KR101149448B1 (ko) 2007-02-12 2007-02-12 오디오 부호화 및 복호화 장치와 그 방법

Country Status (5)

Country Link
US (1) US8055506B2 (ko)
EP (1) EP2115738A4 (ko)
KR (1) KR101149448B1 (ko)
CN (1) CN101606193B (ko)
WO (1) WO2008100034A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110018107A (ko) * 2009-08-17 2011-02-23 삼성전자주식회사 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
IL302061B2 (en) 2013-01-08 2024-05-01 Dolby Int Ab Prediction based on a model in a critically modeled filter bank
WO2014187987A1 (en) 2013-05-24 2014-11-27 Dolby International Ab Methods for audio encoding and decoding, corresponding computer-readable media and corresponding audio encoder and decoder
WO2018120545A1 (zh) * 2016-12-30 2018-07-05 华为技术有限公司 一种测试音频回路时延的方法及设备
EP3576088A1 (en) 2018-05-30 2019-12-04 Fraunhofer Gesellschaft zur Förderung der Angewand Audio similarity evaluator, audio encoder, methods and computer program

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW358925B (en) * 1997-12-31 1999-05-21 Ind Tech Res Inst Improvement of oscillation encoding of a low bit rate sine conversion language encoder
ATE354850T1 (de) * 2000-11-03 2007-03-15 Koninkl Philips Electronics Nv Kodierung von audiosignalen
DE10217297A1 (de) 2002-04-18 2003-11-06 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten
CN1717718A (zh) * 2002-11-27 2006-01-04 皇家飞利浦电子股份有限公司 正弦波音频编码
US7640156B2 (en) 2003-07-18 2009-12-29 Koninklijke Philips Electronics N.V. Low bit-rate audio encoding
EP1719117A1 (en) 2004-02-16 2006-11-08 Koninklijke Philips Electronics N.V. A transcoder and method of transcoding therefore
DE102004009955B3 (de) * 2004-03-01 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite
WO2006000952A1 (en) 2004-06-21 2006-01-05 Koninklijke Philips Electronics N.V. Method and apparatus to encode and decode multi-channel audio signals
MX2007003063A (es) 2004-09-17 2007-05-16 Koninkl Philips Electronics Nv Codificacion combinada de audio que minimiza la distorsion perceptual.
US7805314B2 (en) 2005-07-13 2010-09-28 Samsung Electronics Co., Ltd. Method and apparatus to quantize/dequantize frequency amplitude data and method and apparatus to audio encode/decode using the method and apparatus to quantize/dequantize frequency amplitude data

Also Published As

Publication number Publication date
US8055506B2 (en) 2011-11-08
EP2115738A4 (en) 2013-07-24
KR101149448B1 (ko) 2012-05-25
CN101606193A (zh) 2009-12-16
EP2115738A1 (en) 2009-11-11
US20080195398A1 (en) 2008-08-14
WO2008100034A1 (en) 2008-08-21
CN101606193B (zh) 2013-11-13

Similar Documents

Publication Publication Date Title
CN101790756B (zh) 瞬态检测器以及用于支持音频信号的编码的方法
EP2439737B1 (en) Compression coding and decoding method, coder, decoder and coding device
KR101428487B1 (ko) 멀티 채널 부호화 및 복호화 방법 및 장치
CN101223577B (zh) 对低比特率音频信号进行编码/解码的方法和设备
WO2008069468A1 (en) Method and apparatus to extract important frequency component of audio signal and method and apparatus to encode and/or decode audio signal using the same
KR20080092623A (ko) 정현파 성분의 진폭 코딩 및 디코딩 방법과 그 장치
KR101149448B1 (ko) 오디오 부호화 및 복호화 장치와 그 방법
CN101521010A (zh) 一种音频信号的编解码方法和装置
KR100738109B1 (ko) 입력 신호의 양자화 및 역양자화 방법과 장치, 입력신호의부호화 및 복호화 방법과 장치
KR101299155B1 (ko) 오디오 부호화 및 복호화 장치와 그 방법
JPH08204576A (ja) 信号符号化装置及び信号復号化装置
US20120123788A1 (en) Coding method, decoding method, and device and program using the methods
KR20080072224A (ko) 오디오 부호화 및 복호화 장치와 그 방법
KR100928966B1 (ko) 저비트율 부호화/복호화방법 및 장치
KR101001748B1 (ko) 오디오신호 복호화 방법 및 장치
KR100685974B1 (ko) 워터마크 삽입/검출을 위한 장치 및 방법
CN101071570A (zh) 耦合声道的编、解码处理方法、音频编码装置及解码装置
US20090063162A1 (en) Parametric audio encoding and decoding apparatus and method thereof
EP2179588B1 (en) Encoding method and apparatus for efficiently encoding sinusoidal signal whose magnitude is less than masking value according to psychoacoustic model and decoding method and apparatus for decoding encoded sinusoidal signal
KR20080092823A (ko) 부호화/복호화 장치 및 방법
Lakhdhar et al. Context-based adaptive arithmetic encoding of EAVQ indices
EP2176859A1 (en) Method and apparatus for encoding and decoding continuation sinusoidal signal of audio signal
KR100940532B1 (ko) 저비트율 복호화방법 및 장치
KR20100114484A (ko) 오디오 신호 처리 방법 및 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
J201 Request for trial against refusal decision
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150429

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160428

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170427

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20180427

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee