KR20080062705A - 오디오 부호화 및 복호화 장치와 그 방법 - Google Patents

오디오 부호화 및 복호화 장치와 그 방법 Download PDF

Info

Publication number
KR20080062705A
KR20080062705A KR1020060138785A KR20060138785A KR20080062705A KR 20080062705 A KR20080062705 A KR 20080062705A KR 1020060138785 A KR1020060138785 A KR 1020060138785A KR 20060138785 A KR20060138785 A KR 20060138785A KR 20080062705 A KR20080062705 A KR 20080062705A
Authority
KR
South Korea
Prior art keywords
additional basis
basis vector
additional
audio signal
vector component
Prior art date
Application number
KR1020060138785A
Other languages
English (en)
Other versions
KR101299155B1 (ko
Inventor
이건형
오재원
이철우
정종훈
이남숙
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020060138785A priority Critical patent/KR101299155B1/ko
Priority to US11/954,286 priority patent/US8725519B2/en
Priority to PCT/KR2007/006914 priority patent/WO2008082165A1/en
Priority to EP07851812A priority patent/EP2100379A4/en
Priority to CN2007800472335A priority patent/CN101563848B/zh
Publication of KR20080062705A publication Critical patent/KR20080062705A/ko
Application granted granted Critical
Publication of KR101299155B1 publication Critical patent/KR101299155B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/093Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 저 비트율로 고음질의 오디오 표현이 가능하여 MDCT 부호화 방식과 파라메트릭 부호화 방식에서의 문제점을 해결할 수 있는 오디오 부호화 및 복호화 장치와 그 방법에 관한 것으로, 본 발명의 한 유형에 따른 방법은, 오디오 부호화 방법에 있어서, 입력되는 오디오 신호로부터 적어도 하나의 정현파를 검출하는 단계; 나머지 오디오 신호와 정현파의 추가 기저벡터를 이용하여 추가 기저벡터 성분을 계산하는 단계; 상기 추가 기저벡터 성분 전송 여부를 결정하는 단계; 및 상기 추가 기저벡터 성분에 대한 전송이 결정되면, 상기 정현파의 주파수 및/또는 위상과 진폭 및 상기 추가 기저 벡터 성분을 부호화하는 단계를 포함하고, 상기 나머지 오디오 신호는 상기 입력되는 오디오 신호로부터 검출된 정현파를 제외한 오디오 신호인 것을 특징으로 한다.

Description

오디오 부호화 및 복호화 장치와 그 방법{Audio encoding and decoding apparatus and method thereof}
도 1은 본 발명의 일 실시 예에 따른 오디오 부호화 장치의 기능 블록도이다.
도 2는 도 1에 도시된 추가 기저벡터 성분 전송 결정부의 상세한 기능 블록도의 일 예이다.
도 3은 도 1에 도시된 추가 기저벡터 성분 전송 결정부의 상세한 기능 블록도의 다른 예이다.
도 4는 본 발명의 일 실시 예에 따른 오디오 복호화 장치의 기능 블록도이다.
도 5는 본 발명의 다른 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다.
도 6은 도 5의 오디오 부호화 방법에 대응되는 오디오 복호화 방법의 동작 흐름도이다.
도 7은 본 발명의 다른 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다.
도 8은 도 7에 도시된 추가 기저벡터 성분 전송 여부를 결정하는 과정의 상 세한 동작 흐름도이다.
도 9는 도 7의 오디오 부호화 방법에 대응되는 오디오 복호화 방법의 동작 흐름도이다.
본 발명은 오디오 부호화 및 복호화 장치와 그 방법에 관한 것으로, 특히, 저 비트율(Low bit rate)로 고음질(High-quality)의 오디오 신호를 표현할 수 있는 오디오 부호화 및 복호화 장치와 그 방법에 관한 것이다.
기존의 고음질의 오디오 부호화 장치는 대부분 시간-주파수 변환(Time-Frequency Transform) 부호화 방식을 사용하고 있다. 이 방식은 MDCT(Modified Discrete Cosine Transform)와 같은 변환을 이용하여 입력되는 오디오 신호를 주파수 공간으로 변환하여 얻은 계수를 부호화하는 방식이다. 그러나, 이 부호화 방식은 타겟 비트율(target bit rate)이 낮아질수록 표현되는 음질이 저하되는 단점을 갖고 있다.
저 비트율로 오디오 신호를 부호화 방식으로 파라메트릭(Parametric) 부호화 방식이 알려져 있다. 이 파라메트릭 부호화 방식은 입력되는 오디오 신호로부터 정현파(partial)를 검출하고, 검출된 정현파의 주파수(frequency), 위상(phase) 및 진폭(amplitude)을 부호화하는 방식이다. 특히, 이 파라메트릭 부호화 방식은 입력되는 오디오 신호로부터 진폭이 큰 몇 개의 정현파를 검출하여 부호화 하여도 많은 MDCT계수를 부호화하는 효과를 얻을 수 있기 때문에 입력되는 오디오 신호를 저비트율로 부호화하는 것이 가능하다.
그러나 파라메트릭 부호화 방식으로 고음질의 오디오 신호를 표현하기 위해서는 입력되는 오디오 신호로부터 많은 개수의 정현파를 검출하여 부호화하여야 한다. 즉, 입력되는 오디오 신호의 주파수와 진폭이 고정된 하나의 정현파로 구성된 경우에, 파라메트릭 부호화 방식은 하나의 진폭, 하나의 주파수, 및 하나의 위상을 부호화하는 것으로 오디오 신호를 충분히 표현할 수 있다.
반면에 입력되는 오디오 신호의 주파수와 진폭이 다수개의 정현파로 구성된 경우에, 고음질의 오디오 신호를 표현하기 위해서, 파라메트릭 부호화 방식은 입력되는 오디오 신호로부터 다수개의 정현파를 검출하고, 검출되는 각 정현파들의 진폭, 주파수 및 위상을 부호화하여야 하므로, 부호화 효율이 저하된다.
또한, 파라메트릭 부호화 방식은 오디오 신호로부터 검출되는 정현파의 주파수가 시간에 따라 변하지 않는 안정된 주파수를 갖는 경우에 유리하다. 그러나 잡음 등의 이유로 인하여 정현파의 주파수나 진폭이 시간에 따라 변하면 검출해야 할 정현파의 수가 증가하므로, 파라메트릭 부호화 방식은 매우 비효율적이다.
상술한 경우에 파라메트릭 부호화 방식이 비효율적인 것은 파라메트릭 부호화 방식의 경우에 검출되는 정현파의 개수가 많을수록 부호화하여야 하는 진폭, 주파수 및 위상이 많기 때문이다. 따라서, 파라메트릭 부호화 방식은 타겟 비트율이 낮은 오디오 부호화 및 복호화 장치(또는 오디오 코덱(codec))에 적합하나 고음질 또는 타겟 비트율이 높은 오디오 부호화 및 복호화 장치에는 부적합하다.
본 발명이 이루고자 하는 기술적 과제는 저 비트율로 고음질의 오디오 표현이 가능하여 MDCT 부호화 방식과 파라메트릭 부호화 방식에서의 문제점을 해결할 수 있는 오디오 부호화 및 복호화 장치와 그 방법을 제공하는데 있다.
상술한 기술적 과제들을 달성하기 위하여 본 발명의 한 유형에 따른 방법은, 오디오 부호화 방법에 있어서, 입력되는 오디오 신호로부터 적어도 하나의 정현파를 검출하는 단계; 나머지 오디오 신호와 정현파의 추가 기저벡터를 이용하여 추가 기저벡터 성분을 계산하는 단계; 상기 추가 기저벡터 성분 전송 여부를 결정하는 단계; 및 상기 추가 기저벡터 성분에 대한 전송이 결정되면, 상기 정현파의 주파수 및/또는 위상과 진폭 및 상기 추가 기저 벡터 성분을 부호화하는 단계를 포함하고, 상기 나머지 오디오 신호는 상기 입력되는 오디오 신호로부터 검출된 정현파를 제외한 오디오 신호인 것을 특징으로 하는 오디오 부호화 방법을 제공한다.
상술한 기술적 과제들을 달성하기 위하여 본 발명의 한 유형에 따른 방법은, 오디오 복호화 방법에 있어서, 부호화된 오디오 신호를 파싱하는 단계; 상기 파싱에 의해 얻어진 부호화된 주파수 및/또는 위상과 진폭을 복호화하여 정현파를 복원하는 단계; 상기 파싱에 의해 얻어진 추가 기저벡터 성분을 복호화하여 나머지 오디오 신호를 복원하는 단계; 및 상기 복원된 정현파와 상기 복원된 나머지 오디오 신호를 혼합하여 복원된 오디오 신호를 생성하는 단계를 포함하고, 상기 나머지 오디오 신호는 오디오 신호를 부호화할 때 오디오 신호로부터 검출된 정현파를 제외 한 오디오 신호인 것을 특징으로 하는 오디오 복호화 방법을 제공한다.
상술한 기술적 과제들을 달성하기 위하여 본 발명의 한 유형에 따른 방법은, 오디오 부호화 방법에 있어서, 입력되는 오디오 신호를 특정 길이로 세그먼트 하는 단계; 상기 세그먼트된 오디오 신호로부터 적어도 하나의 정현파를 검출하는 단계; 상기 검출된 정현파의 주파수 및/또는 위상과 진폭을 양자화 하는 단계; 상기 양자화된 주파수 및/또는 위상과 진폭을 역양자화 하는 단계; 상기 역양자화된 주파수 및/또는 위상과 진폭, 나머지 오디오 신호, 및 사전에 설정된 참조 값을 토대로 상기 검출된 각 정현파의 추가 기저벡터 성분을 전송할지 여부를 결정하는 단계; 및 상기 양자화된 주파수 및/또는 위상과 진폭 및 상기 추가 기저벡터 성분을 전송할지 여부를 결정함에 따라 생성되는 신호를 부호화하는 단계를 포함하고, 상기 나머지 오디오 신호는 상기 세그먼트된 오디오 신호중에서 상기 검출된 정현파를 제외한 오디오 신호인 것을 특징으로 하는 오디오 부호화 방법을 제공한다.
상술한 기술적 과제들을 달성하기 위하여 본 발명의 한 유형에 따른 방법은, 오디오 복호화 방법에 있어서, 부호화된 오디오 신호를 파싱하는 단계; 상기 파싱에 따라 얻어진 양자화된 주파수 및/또는 위상과 진폭을 역양자화하는 단계; 상기 파싱에 따라 얻어진 제어 파라미터를 복호화 하는 단계; 상기 파싱에 따라 얻어진 추가 기저벡터 성분을 복호화 하는 단계; 상기 역양자화된 주파수 및/또는 위상과 진폭을 토대로 정현파를 복원하는 단계; 상기 역양자화된 주파수 및/또는 위상과 진폭 및 복호화된 제어 파라미터를 토대로 추가 기저벡터를 유도하는 단계; 상기 유도된 추가 기저벡터와 복호화된 추가 기저벡터 성분을 토대로 나머지 오디오 신 호를 복원하는 단계; 및 복원된 정현파와 상기 복원된 나머지 오디오 신호를 혼합하여 오디오 신호를 복원하는 단계를 포함하고, 상기 나머지 오디오 신호는 오디오 부호화시 세그먼트된 오디오 신호로부터 검출된 정현파를 제외한 오디오 신호인 것을 특징으로 하는 오디오 복호화 방법을 제공한다.
상술한 기술적 과제들을 달성하기 위하여 본 발명의 한 유형에 따른 장치는,오디오 부호화 장치에 있어서, 입력되는 오디오 신호를 특정 길이로 세그먼트 하는 세그먼테이션부; 상기 세그먼트된 오디오 신호로부터 적어도 하나의 정현파를 검출하는 정현파 검출부; 상기 정현파 검출부에 의해 검출된 상기 정현파의 주파수 및 /또는 위상과 진폭을 양자화 하는 양자화부; 상기 양자화부에서 양자화된 주파수 및/또는 위상과 진폭을 역양자화 하는 역양자화부; 상기 역양자화부로부터 출력되는 역양자화된 주파수 및/또는 위상과 진폭, 나머지 오디오 신호, 및 사전에 설정된 참조 값을 토대로 상기 검출된 정현파의 추가 기저벡터 성분을 전송할지 여부를 결정하는 추가 기저벡터 성분 전송 결정부; 및 상기 양자화부로부터 출력되는 양자화된 주파수 또는/ 및 위상과 진폭, 상기 추가 기저벡터 성분 전송 결정부로부터 출력되는 신호를 부호화하는 부호화부를 포함하고, 상기 나머지 오디오 신호는 상기 세그먼트된 오디오 신호중 상기 정현파 검출부에서 검출된 정현파를 제외한 오디오 신호인 것을 특징으로 하는 오디오 부호화 장치를 제공한다.
상술한 기술적 과제들을 달성하기 위하여 본 발명의 한 유형에 따른 장치는, 오디오 복호화 장치에 있어서, 부호화된 오디오 신호를 파싱하는 파싱부; 상기 파싱부로부터 출력되는 양자화된 주파수 및/또는 위상과 진폭을 역양자화하는 역양자 화부; 상기 역양자화부로부터 출력되는 역양자화된 주파수 및/또는 위상과 진폭을 토대로 정현파를 복원하는 정현파 복원부; 상기 파싱부로부터 출력되는 제어 파라미터를 복호화 하는 제어 파라미터 복호화부; 상기 역양자화부에서 역양자화된 주파수 및/또는 위상과 진폭 및 복호화된 제어 파라미터를 토대로 추가 기저벡터를 유도하는 추가 기저벡터 유도부; 상기 파싱부로부터 출력되는 추가 기저벡터 성분을 복호화 하는 추가 기저벡터 성분 복호화부; 상기 추가 기저벡터 유도부에서 유도된 추가 기저벡터와 복호화된 추가 기저벡터 성분을 토대로 나머지 오디오 신호를 복원하는 나머지 오디오 신호 복원부; 및 정현파 복원부로부터 복원된 정현파와 상기 나머지 오디오 신호 복원부에서 복원된 나머지 오디오 신호를 혼합하여 복원된 오디오 신호를 출력하는 혼합부를 포함하고, 상기 나머지 오디오 신호는 오디오 부호화시 세그먼트된 오디오 신호로부터 검출된 정현파를 제외한 오디오 신호인 것을 특징으로 하는 오디오 복호화 장치를 제공한다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시 예를 상세히 설명하기로 한다.
도 1은 본 발명의 일 실시 예에 따른 오디오 부호화 장치(100)의 기능 블록도이다. 도 1을 참조하면, 오디오 부호화 장치(100)는 세그먼테이션(segmentation) 부(110), 정현파 검출부(120), 양자화부(130), 역양자화부(140), 추가 기저벡터(basis vector) 성분 전송 결정부(150), 및 부호화부(160)를 포함한다.
세그먼테이션부(110)는 입력되는 오디오 신호를 시간에 따라 특정 길이 L로 세그먼트한다. 따라서, 세그먼테이션부(110)로부터 출력되는 오디오 신호가 S(n)이 면, 상기 n은 시간에 따른 인덱스로서, n=1∼L로 정의될 수 있다. 입력되는 오디오 신호를 특정 길이 L로 세그먼트할 때, 세그먼트된 오디오 신호들은 L/2 또는 특정 길이만큼 이전 세그먼트와 겹칠 수 있다.
정현파 검출부(120)는 매칭 추적 방식으로 세그먼트된 오디오 신호로부터 적어도 하나의 정현파를 검출한다. 즉, 정현파 검출부(120)는 우선 세그먼트된 오디오 신호로부터 가장 큰 진폭(amplitude)을 갖는 정현파를 검출한다. 다음, 정현파 검출부(120)는 상기 검출된 정현파를 제외한 세그먼트된 오디오 신호로부터 그 다음으로 큰 진폭을 갖는 정현파를 검출한다. 검출하려는 정현파의 진폭이 타겟 비트율(target bit rate)에 따라 사전에 설정된 정현파의 진폭(amplitude)에 도달할 때까지 정현파 검출부(120)는 세그먼트된 오디오 신호로부터 정현파를 검출하는 과정을 반복적으로 수행한다.
따라서, 정현파 검출부(120)는 고음질의 오디오 신호를 표현할 경우에도 사전에 설정된 정현파의 진폭 보다 작은 진폭을 갖는 정현파를 세그먼트된 오디오 신호로부터 검출하지 않는다.
정현파 검출부(120)에서 검출되는 각 정현파는 수학식 1과 같이 정의할 수 있다.
Figure 112006098528776-PAT00001
수학식 1에서
Figure 112006098528776-PAT00002
는 검출된 정현파의 진폭으로, 정현파의 기저 벡 터(basis vector)의 성분(component)이고,
Figure 112006098528776-PAT00003
는 하기 수학식 2와 같이 주파수가
Figure 112006098528776-PAT00004
이고, 위상이
Figure 112006098528776-PAT00005
인 정현파의 기저 벡터(basis vector)이다.
Figure 112006098528776-PAT00006
수학식 2에서 A는
Figure 112006098528776-PAT00007
의 크기를 1로 만들기 위한 규격화 상수이다. 여기서 i는 검출된 정현파의 개수와 대응되는 것으로, 서로 다른 정현파를 지칭하는 인덱스이다. 정현파 검출부(110)에서 검출된 정현파의 개수가 K개이면, i는 i=1∼K의 값을 갖는다.
양자화부(130)는 정현파 검출부(120)에서 검출된 각 정현파의 주파수
Figure 112006098528776-PAT00008
및/또는 위상
Figure 112006098528776-PAT00009
과 진폭
Figure 112006098528776-PAT00010
을 각각 양자화한다.
역양자화부(140)는 양자화부(130)에서 양자화된 주파수
Figure 112006098528776-PAT00011
및/또는 위상
Figure 112006098528776-PAT00012
과 진폭
Figure 112006098528776-PAT00013
을 역양자화한다.
추가 기저 벡터 성분 전송 결정부(150)는 각 검출된 정현파의 추가 기저 벡터(basis vector) 성분(component)을 전송할지 여부를 결정한다. 즉, 역양자화부(140)로부터 출력되는 역양자화된 주파수 및/또는 위상과 진폭, 정현파 검출부(120)로부터 제공되는 나머지 오디오 신호(residual audio signal)(
Figure 112006098528776-PAT00014
), 및 사 전에 설정된 참조 값을 토대로 검출된 각 정현파의 추가 기저 벡터(basis vector) 성분(component)을 전송할지 여부를 결정한다.
상기 나머지 오디오 신호
Figure 112006098528776-PAT00015
는 세그먼트된 오디오 신호중 정현파 검출부(120)에서 검출된 정현파를 제외한 오디오 신호이다. 따라서 나머지 오디오 신호
Figure 112006098528776-PAT00016
는 수학식 3과 같이 정의된다.
Figure 112006098528776-PAT00017
수학식 3에서
Figure 112006098528776-PAT00018
는 세그먼트된 오디오 신호로부터 K개의 정현파가 검출된 것을 의미한다.
사전에 설정된 참조 값은 유도할 기저 벡터의 수(F)와 유도할 기저 벡터의 수(F)에 따라 결정되는 주파수 변동분(k0), 및 추가 기저벡터 성분을 사용하는 것이 효율적인지를 판단하기 위한 기준 값을 포함한다. 만약 추가 기저벡터 성분이 전송되는 것으로 판단되면, 추가 기저 벡터 성분 전송 결정부(150)로부터 출력되는 신호는 제어 파라미터(control parameter)와 추가 기저 벡터 성분을 포함한다. 제어 파라미터는 추가 기저 벡터 성분 전송 여부를 나타내는 파라미터를 포함하거나 추가 기저 벡터 성분 전송여부를 나타내는 파라미터와 추가 기저벡터 유도 방식을 나타내는 파라미터를 포함할 수 있다.
추가 기저 벡터 성분 전송 결정부(150)는 도 2에 도시된 바와 같이 구성될 수 있다. 도 2를 참조하면, 추가 기저 벡터 성분 전송 결정부(150)는 추가 기저 벡터 유도기(210), 추가 기저벡터 성분 계산기(220), 부호화 효율(efficiency) 계산기(230), 및 추가 기저 벡터 성분 전송 결정기(240)를 포함한다.
추가 기저 벡터 유도기(210)는 정현파 검출부(120)에서 검출된 각 정현파의 추가 기저 벡터를 유도한다. 즉, 추가 기저 벡터 유도기(210)는 사전에 설정된 유도할 기저 벡터의 수(F)와 유도할 기저 벡터의 수(F)에 따라 결정되는 주파수 변동분(k0)과 역양자화된 주파수
Figure 112006098528776-PAT00019
및/또는 위상
Figure 112006098528776-PAT00020
을 이용하여 각 정현파에 대한 추가 기저 벡터를 유도한다. 하나의 정현파에 대해 기저 벡터는 다수개가 유도될 수 있다. 만약 유도할 기저 벡터의 수(F)가 2로 설정된 경우에 추가 기저벡터 유도기(210)는 수학식 4와 같은 추가 기저 벡터
Figure 112006098528776-PAT00021
를 유도할 수 있다.
Figure 112006098528776-PAT00022
에서
Figure 112006098528776-PAT00023
는 유도된 추가 기저벡터의 인덱스이다.
Figure 112006098528776-PAT00024
수학식 4의 경우에 추가 기저 벡터의 수 F가 2로 설정됨에 따라 유도할 기저 벡터의 수에 따라 결정되는 주파수 변동분(k0)이 ±1/2로 설정된 경우이다. 수학식 4에서 위상
Figure 112006098528776-PAT00025
는 수학식 5의 조건을 만족하도록 오디오 부호화 장치와 오디오 복호화 장치에서 각각 결정된다.
Figure 112006098528776-PAT00026
수학식 5에서
Figure 112006098528776-PAT00027
은 추가 기저 벡터로서, 수학식 5를 통해 추가 기저 벡터가 정현파에 수직이 되며, 수학식 4와 5를 토대로 유도된 기저 벡터는 검출된 정현파와 약간 다른 주파수를 가지면서 검출된 정현파에 수직인 벡터임을 알 수 있다.
또한, 추가 기저벡터 유도기(210)는 상기 유도할 추가 기저벡터의 수 F가 4로 설정된 경우에, 하기 수학식 6과 같이 추가 기저벡터를 유도할 수 있다.
Figure 112006098528776-PAT00028
수학식 6에서 주파수 변동분 k0가 1이면, 검출된 정현파에 대해 주파수가 1만큼 크고 작은 사인파와 코사인파가 추가 기저벡터로서 유도된 것이다.
추가 기저벡터 성분 계산기(220)는 나머지 오디오 신호
Figure 112006098528776-PAT00029
과 추가 기저벡터 유도기(210)에서 유도된 추가 기저 벡터
Figure 112006098528776-PAT00030
를 수학식 7과 같이 연산하여 추가 기저벡터 성분
Figure 112006098528776-PAT00031
을 계산한다.
Figure 112006098528776-PAT00032
수학식 7에서
Figure 112006098528776-PAT00033
는 상기 추가 기저벡터 성분
Figure 112006098528776-PAT00034
이 특정 길이 L로 세그먼트된 오디오 신호의 추가 기저벡터
Figure 112006098528776-PAT00035
에 대한 성분(component)임을 의미한다. 즉, 추가 기저벡터 성분
Figure 112006098528776-PAT00036
은 유도된 추가 기저벡터당 하나의 추가 기저벡터 성분이 계산된다. 예를 들어, 유도된 추가 기저벡터가 수학식 4와 같이 2개인 경우에 추가 기저벡터 성분
Figure 112006098528776-PAT00037
은 2개(즉,
Figure 112006098528776-PAT00038
,
Figure 112006098528776-PAT00039
)가 계산된다. 유도된 추가 기저벡터가 수학식 6과 같이 4개인 경우에 추가 기저벡터 성분
Figure 112006098528776-PAT00040
은 4개(즉,
Figure 112006098528776-PAT00041
Figure 112006098528776-PAT00042
,
Figure 112006098528776-PAT00043
,
Figure 112006098528776-PAT00044
)가 계산된다.
추가 기저 벡터 성분 계산기(220)는 계산된 추가 기저 벡터 성분을 우선, 효율 계산기(230)로 전송하고, 추가 기저 벡터 성분 전송 결정기(240)로부터 추가 기저 벡터 성분이 전송되는 것으로 결정되면, 계산된 추가 기저벡터 성분을 부호화부(160)로 전송한다.
부호화 효율 계산기(230)는 추가 기저벡터 성분 계산기(220)에서 계산된 추가 기저벡터 성분
Figure 112006098528776-PAT00045
과 역양자화된 진폭
Figure 112006098528776-PAT00046
, 사전에 설정된 유도된 기저 벡터의 수 F를 이용하여 수학식 8과 같이 각 정현파에 대한 부호화 효율(efficiency)을 계산한다.
Figure 112006098528776-PAT00047
추가 기저벡터 성분 전송 결정기(240)는 사전에 설정된 기준 값과 부호화 효율 계산기(230)에서 계산된 부호화 효율을 비교한다. 상기 기준 값은 추가 기저벡터 성분을 사용하는 것이 효율적인지를 판단할 수 있는 것으로 사전에 설정된다.
비교결과, 계산된 부호화 효율이 상기 기준 값보다 크면, 추가 기저벡터 성분 전송 결정기(240)는 해당되는 추가 기저벡터 성분을 전송하는 것이 효율적이라고 판단한다. 이에 따라 추가 기저벡터 성분 전송 결정기(240)는 추가 기저벡터 성분 계산기(220)로 계산된 추가 기저벡터 성분을 출력하도록 제어하면서 추가 기저벡터 성분이 전송됨을 나타내는 파라미터를 포함하는 제어 파라미터를 부호화부(160)로 전송한다.
만약 추가 기저벡터 성분 전송 결정기(240)에서 추가 기저벡터 성분을 전송하지 않는 것이 효율적이라고 판단되면, 추가 기저벡터 성분 전송 결정기(240)는 추가 기저벡터 성분 계산기(220)에서 계산된 추가 기저벡터 성분을 부호화부(160)로 전송시키지 않는다. 이 때, 추가 기저벡터 성분 전송 결정기(240)로부터 출력되는 제어 파라미터는 추가 기저벡터 성분이 전송되지 않음을 나타내는 파라미터를 포함한다.
한편, 추가 기저벡터 성분 전송 결정부(150)는 도 3에 도시된 바와 같이 구성될 수 있다. 도 3을 참조하면, 추가 기저 벡터 성분 전송 결정부(150)는 제 1 내지 제 J 추가 기저 벡터 유도기(310_1∼310_J), 제 1 내지 제 J 추가 기저벡터 성분 계산기(320_1∼320_J), 제 1 내지 제 J 부호화 효율(efficiency) 계산기(330_1∼330_J), 및 추가 기저 벡터 성분 전송 결정기(340)를 포함한다.
제 1 내지 제 J 추가 기저 벡터 유도기(310_1∼310_J)는 도 2의 추가 기저벡터 유도기(210)와 유사하게 구성되어 동작한다. 그러나, 제 1 내지 제 J 추가 기저 벡터 유도기(310_1∼310_J)는 추가 기저 벡터 수(F)와 추가 기저벡터 수(F)에 따라 결정된 주파수 변동분(k0)이 다르게 설정되어 운영된다. 예를 들어, 제 1 추가 기저 벡터 유도기(310_1)는 추가 기저 벡터 수 F가 2로 설정되고, 주파수 변동분 k0가 ±1/2로 설정되어 수학식 4와 같이 추가 기저벡터를 유도할 수 있다. 반면에 제 J 추가 기저 벡터 유도기(310_J)는 추가 기저벡터 수 F가 4로 설정되고, 주파수 변동분 k0가 ±1로 설정되어 수학식 6과 같이 추가 기저벡터를 유도할 수 있다. 제 1 추가 기저벡터 유도기(310_1)와 제 J 추가 기저벡터 유도기(310_J) 사이에 존재하는 미 도시된 추가 기저벡터 유도기들은 제 1 및 제 J 추가 기저벡터 유도기(310_1, 310_J)에 설정된 추가 기저벡터 수 F 및 주파수 변동분 k0과 다른 추가 기저벡터 수 F와 주파수 변동분 k0이 설정되어 운영된다.
제 1 내지 제 J 추가 기저 벡터 성분 계산기(320_1∼320_J)는 도 2의 추가 기저벡터 성분 계산기(220)와 유사하게 나머지 오디오 신호
Figure 112006098528776-PAT00048
과 제 1 내지 제 J 추가 기저벡터 유도기(310_1∼310_J)중 해당되는 추가 기저벡터 유도기에서 유도된 추가 기저 벡터
Figure 112006098528776-PAT00049
을 수학식 7과 같이 연산하여 추가 기저벡터 성분
Figure 112006098528776-PAT00050
을 계산한다. 예를 들어, 제 1 추가 기저 벡터 성분 계산기(320_1)의 경우에 상기 해당되는 추가 기저 벡터 유도기는 제 1 추가 기저 벡터 유도기(310_1)이다.
제 1 내지 제 J 부호화 효율 계산기(330_1∼330_J)는 제 1 내지 제 J 추가 기저벡터 성분 계산기(320_1∼320_J)중 해당되는 추가 기저벡터 성분 계산기에서 계산된 추가 기저벡터 성분
Figure 112006098528776-PAT00051
과 역양자화된 진폭
Figure 112006098528776-PAT00052
, 사전에 설정된 유도된 기저 벡터의 수 F를 이용하여 수학식 8과 같이 각 정현파에 대한 부호화 효율(efficiency)을 계산한다. 제 1 부호화 효율 계산기(330_1)의 경우에 상기 해당되는 추가 기저벡터 성분 계산기는 제 1 추가 기저벡터 성분 계산기(320_1)이다.
추가 기저벡터 성분 전송 결정기(340)는 제 1 내지 제 J 부호화 효율 계산기(330_1∼330_J)에서 계산된 부호화 효율을 각각 비교하여 가장 높은 부호화 효율을 검출한다. 그 다음, 추가 기저벡터 성분 전송 결정기(340)는 검출된 가장 높은 부호화 효율과 사전에 설정된 기준 값을 비교한다. 사전에 설정된 기준 값은 추가 기저벡터 성분을 사용하는 것이 효율적인지를 판단할 수 있는 것으로 사전에 설정된다.
비교결과, 가장 높은 부호화 효율이 상기 기준 값보다 크면, 추가 기저벡터 성분 전송 결정기(340)는 해당되는 정현파에 대한 추가 기저벡터 성분을 전송하는 것이 효율적이라고 판단한다. 이에 따라 추가 기저벡터 성분 전송 결정기(340)는 제 1 내지 제 J 추가 기저벡터 성분 계산기(320_1∼320_J)중 상기 가장 높은 부호화 효율이 검출된 부호화 효율 계산기에 대응되는 추가 기저벡터 성분 계산기에서 계산된 추가 기저벡터 성분이 출력되도록 제어한다.
이 때, 추가 기저벡터 성분 전송 결정기(340)로부터 출력되는 제어 파라미터는 추가 기저벡터 성분이 전송됨을 나타내는 파라미터와 사용된 추가 기저벡터 유도 방식을 나타내는 파라미터를 포함한다. 사용된 추가 기저벡터 유도 방식을 나타내는 파라미터는 제 1 내지 제 J 추가 기저 벡터 유도기(310_1∼310_J)중 상기 가장 높은 부호화 효율이 검출된 부호화 효율 계산기에 대응되는 추가 기저 벡터 유도기에 대한 식별 정보를 포함한다. 예를 들어, 제 1 추가 기저 벡터 유도기(310_1)에 대응되는 제 1 부호화 효율 계산기(330_1)에서 계산된 부호화 효율이 가장 높은 부호화 효율을 가지면, 상기 사용된 추가 기저벡터 유도 방식을 나타내는 파라미터는 제 1 추가 기저벡터 유도기(310_1)의 식별 정보를 포함한다.
만약 추가 기저벡터 성분 전송 결정기(340)에서 추가 기저벡터 성분을 전송하지 않는 것이 효율적이라고 판단되면, 추가 기저벡터 성분 전송 결정기(340)는 제 1 내지 제 J 추가 기저벡터 성분 계산기(320_1∼320_J)에서 계산된 추가 기저벡터 성분을 부호화부(160)로 전송시키지 않는다. 이 때, 추가 기저벡터 성분 전송 결정기(340)로부터 출력되는 제어 파라미터는 추가 기저벡터 성분이 전송되지 않음을 나타내는 파라미터를 포함한다.
도 1의 부호화부(160)는 양자화부(130)로부터 출력되는 양자화된 주파수 또는/ 및 위상과 진폭, 상기 추가 기저벡터 성분 전송 결정부(150)로부터 출력되는 신호를 부호화하여 부호화된 오디오 신호로서 출력한다. 추가 기저벡터 성분이 전송될 때, 추가 기저벡터 성분 전송 결정부(150)로부터 출력되는 신호는 상술한 바와 같이 추가 기저벡터 성분 및 제어 파라미터를 포함한다. 추가 기저벡터 성분 전송 결정부(150)가 도 2와 같이 구성될 때, 상기 제어 파라미터는 추가 기저벡터 성분 전송을 나타내는 파라미터를 포함한다. 반면에 추가 기저벡터 성분 전송 결정부(150)가 도 3과 같이 구성될 때, 상기 제어 파라미터는 추가 기저벡터 성분 전송을 나타내는 파라미터 및 추가 기저 벡터 유도 방식을 나타내는 파라미터를 포함한다.
한편, 추가 기저벡터 성분이 전송되지 않을 때, 추가 기저벡터 성분 전송 결정부(150)로부터 출력되는 신호는 제어 파라미터를 포함하나 추가 기저벡터 성분을 포함하지 않는다. 이 때, 제어 파라미터는 추가 기저벡터 성분이 전송되지 않음을 나타내는 파라미터를 포함한다.
도 4는 본 발명의 실시 예에 따른 오디오 복호화 장치(400)의 기능 블록도이다. 도 4를 참조하면, 오디오 복호화 장치(400)는 파싱부(410), 역 양자화부(420), 정현파 복원부(430), 제어 파라미터 복호화부(440), 추가 기저벡터 유도부(450), 추가 기저벡터 성분 복호화부(460), 나머지 오디오 신호 복원부(470), 및 혼합부(480)를 포함한다.
파싱부(410)는 부호화된 오디오 신호가 입력되면, 이를 파싱하여 양자화된 주파수 및/또는 위상과 진폭을 역양자화부(420)로 전송하고, 제어 파라미터를 제어 파라미터 복호화부(440)로 전송하고, 추가 기저벡터 성분을 추가 기저벡터 성분 복 호화부(460)로 전송한다.
역양자화부(420)는 양자화된 주파수 및/또는 위상과 진폭을 역양자화한다. 제어 파라미터 복호화부(440)는 제어 파라미터를 복호화 한다. 정현파 복원부(430)는 역양자화된 주파수 및/또는 위상과 진폭을 토대로 정현파를 복원한다. 만약 오디오 부호화시 K개의 정현파가 검출되었으면, K개의 역양자화된 주파수 및/또는 위상과 진폭을 토대로 정현파를 복원한다.
추가 기저벡터 유도부(450)는 역양자화부(420)로부터 제공되는 역양자화된 주파수 및/또는 위상과 진폭 및 제어 파라미터 복호화부(440)로부터 제공되는 제어 파라미터를 토대로 추가 기저벡터를 유도한다. 오디오 부호화 장치가 도 2에 도시된 추가 기저벡터 성분 전송 결정부(150)와 같이 구성되면, 추가 기저벡터 유도부(450)는 도 2의 추가 기저벡터 유도기(210)와 같이 구성되어 추가 기저벡터를 유도한다.
반면에 오디오 부호화 장치가 도 3에 도시된 추가 기저벡터 성분 전송 결정부(150)와 같이 구성되면, 추가 기저벡터 유도부(450)는 도 3의 제 1 내지 제 J 추가 기저벡터 유도기(310_1∼310_J)와 같이 구성되고, 복호화된 제어 파라미터에 의해 제 1 내지 제 J 추가 기저벡터 유도기(310_1∼310_J)중 하나를 선택하여 추가 기저벡터를 유도한다. 추가 기저벡터 유도는 수학식 4 및 6과 같이 유도된다. 이를 위하여 추가 기저벡터 유도부(450)는 추가 기저벡터 수(F)와 상기 추가 기저벡터 수(F)에 따라 결정된 주파수 변동분(k0)이 사전에 설정될 수 있다. 그러나, 오디오 부호화 장치(100)가 사용된 추가 기저벡터 수(F)와 상기 주파수 변동분(k0)을 제어 파라미터에 포함시켜 전송할 경우에, 추가 기저벡터 유도부(450)는 제어 파라미터 복호화부(440)로부터 제공되는 추가 기저벡터 수(F)와 주파수 변동분(k0)을 이용하도록 구현할 수 있다. 추가 기저벡터 유도부(450)에서 유도된 추가 기저 벡터는 나머지 오디오 신호 복원부(470)로 전송된다.
추가 기저벡터 성분 복호화부(460)는 파싱부(410)로부터 제공되는 추가 기저벡터 성분을 복호화 한다.
나머지 오디오 신호 복원부(470)는 추가 기저벡터 성분 복호화부(460)로부터 전송되는 추가 기저벡터 성분과 추가 기저벡터 유도부(450)로부터 유도된 추가 기저벡터를 토대로 나머지 오디오 신호
Figure 112006098528776-PAT00053
을 복원한다.
혼합부(480)는 정현파 복원부(430)에서 복원된 정현파와 나머지 오디오 신호 복원부(470)에서 복원된 나머지 오디오 신호를 혼합하여 복원된 오디오 신호를 출력한다.
도 5는 본 발명의 다른 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다.
오디오 부호화 방법은 우선, 입력되는 오디오 신호로부터 적어도 하나의 정현파를 검출한다(501). 정현파 검출은 타겟 비트율에 따라 결정된 진폭 이상의 진폭을 갖는 정현파를 검출한다. 정현파 검출 방식은 도 1의 정현파 검출부(120)와 유사하게 수행될 수 있다.
다음, 오디오 부호화방법은 나머지 오디오 신호와 각 정현파의 추가 기저벡 터를 이용하여 추가 기저벡터 성분을 계산한다(502). 즉, 제 501 단계에서 검출된 각 정현파의 추가 기저벡터를 유도한다. 추가 기저벡터는 도 2의 추가 기저벡터 유도기(210)에서 설명한 것과 유사하게 유도될 수 있다. 각 정현파의 추가 기저벡터가 유도되면, 나머지 오디오 신호를 이용하여 유도된 추가 기저벡터의 성분을 계산한다. 나머지 오디오 신호는 입력되는 오디오 신호로부터 검출된 정현파를 제외한 오디오 신호이다. 추가 기저벡터의 성분은 도 2의 추가 기저벡터 성분 계산기(220)에서 설명한 것과 유사하게 계산될 수 있다.
다음, 오디오 부호화 방법은 추가 기저벡터 성분에 대한 전송 여부를 결정한다(503). 즉, 제 502 단계에서 계산된 추가 기저벡터 성분을 토대로 각 정현파의 부호화 효율을 계산한다. 부호화 효율은 도 2의 부호화 효율 계산기(230)에서 설명한 바와 유사하게 계산될 수 있다. 그리고, 계산된 부호화 효율이 사전에 설정된 기준치보다 높으면, 상기 오디오 부호화 방법은 추가 기저벡터 성분을 전송하는 것으로 결정한다. 상기 기준치는 도 2의 추가 기저벡터 성분 전송 결정기(240)에서 설명한 바와 유사한 기준치이다.
추가 기저벡터 성분이 전송되는 것으로 결정되면, 오디오 부호화 방법은 검출된 정현파의 주파수 및/또는 위상과 진폭, 및 제 502 단계에서 계산된 추가 기저벡터 성분을 부호화하여 부호화된 오디오 신호를 생성한다(504).
한편, 도 5의 오디오 부호화 방법에 대응되는 오디오 복호화 방법은 도 6에 도시된 바와 같다. 도 6은 본 발명의 다른 실시 예에 따른 오디오 복호화 방법의 동작 흐름도이다.
도 6을 참조하면, 오디오 복호화 방법은 우선, 부호화된 오디오 신호가 입력되면, 이를 파싱한다(601). 파싱에 의해 부호화된 주파수 및/또는 위상과 진폭이 얻어지면, 오디오 복호화 방법은 이를 복호화하여 정현파를 복원하면서(602), 파싱에 의해 추가 기저벡터 성분이 얻어지면, 오디오 복호화 방법은 이를 복호화하여 나머지 오디오 신호를 복원한다(603). 여기서 나머지 오디오 신호는 오디오 신호를 부호화할 때 오디오 신호로부터 검출된 정현파를 제외한 오디오 신호이다.
다음, 오디오 복호화 방법은 복원된 정현파와 복원된 나머지 오디오 신호를 혼합하여 복원된 오디오 신호를 생성한다(604).
도 7은 본 발명의 다른 오디오 부호화 방법의 동작 흐름도이다. 도 1을 참조하여 도 7의 동작 흐름도를 설명하면 다음과 같다.
우선, 상기 오디오 부호화 방법은 입력되는 오디오 신호를 도 1의 세그먼테이션부(110)에서 설명한 바와 같이 특정 길이로 세그먼트한다(701). 다음, 오디오 부호화 방법은, 도 1의 정현파 검출부(120)에서 설명한 바와 같이 세그먼트된 오디오 신호로부터 적어도 하나의 정현파를 검출한다(702).
오디오 부호화 방법은, 도 1의 양자화부(130)에서 설명한 바와 같이 검출된 정현파의 주파수 및/또는 위상과 진폭을 양자화 한다(703). 상기 오디오 부호화 방법은, 도 1의 역양자화부(140)와 같이 양자화된 주파수 및/또는 위상과 진폭을 역양자화 한다(704).
다음, 오디오 부호화 방법은 도 1의 추가 기저벡터 성분 전송 결정부(150)에서 설명한 바와 같이 역양자화된 주파수 및/또는 위상과 진폭, 나머지 오디오 신 호, 및 사전에 설정된 참조 값을 토대로 검출된 각 정현파의 추가 기저벡터 성분을 전송할지 여부를 결정한다(705).
제 705 단계는 도 8에 도시된 바와 같이 수행될 수 있다. 도 8은 제 705 단계의 추가 기저벡터 성분을 전송할지 여부를 결정하는 프로세스에 대한 상세한 동작 흐름도이다. 도 8을 참조하면, 추가 기저벡터 성분을 전송할지 여부를 결정하는 프로세스는, 우선, 검출된 각 정현파에 대해 도 2의 추가 기저벡터 유도기(210)와 같이 복수의 추가 기저벡터를 유도한다(801).
다음, 상기 프로세스는 도 2의 추가 기저벡터 성분 계산기(220)와 같이 유도된 각 추가 기저벡터의 성분을 계산한다(802). 상기 프로세스는 도 2의 부호화 효율 계산기(230)에서 설명한 바와 같이 검출된 각 정현파에 대해 상기 계산된 추가 기저벡터 성분을 사용함에 따른 부호화 효율을 계산한다(803).
다음, 상기 프로세스는 도 2의 추가 기저벡터 성분 전송 결정기(240)에서 설명한 바와 같이 각 정현파에 대해 계산된 부호화 효율을 토대로 추가 기저벡터 성분의 전송 여부를 결정한다(804).
도 8의 제 801 단계는 도 3의 제 1 내지 제 J 추가 기저벡터 성분 유도기(310_1∼310_J)에서 설명한 바와 같이 추가 기저벡터를 유도하도록 변형될 수 있다. 따라서 제 801 단계는 적어도 2개 이상의 추가 기저벡터 수(F)와 상기 2개 이상의 추가 기저벡터 수(F)에 따라 결정된 주파수 변동분(k0) 각각에 대해 복수의 추가 기저벡터를 유도하는 단계로 정의될 수 있다.
도 8의 제 802 단계는 도 3의 제 1 내지 제 J 기저벡터 성분 계산기(320_1∼ 320_J)에서 설명한 바와 같이 추가 기저벡터 성분을 계산하도록 변형될 수 있다. 따라서, 도 8의 제 802 단계는, 상기 적어도 2개 이상의 추가 기저벡터 수(F)와 상기 2개 이상의 추가 기저벡터 수(F)에 따라 결정된 주파수 변동분(k0) 각각에 대해 유도된 복수의 추가 기저벡터의 성분을 계산하는 단계로 정의될 수 있다.
도 8의 제 803 단계는 도 3의 제 1 내지 제 J 부호화 효율 계산기(330_1∼330_J)에서 설명한 바와 같이 각 정현파에 대한 부호화 효율을 계산하도록 변형될 수 있다. 따라서 제 803 단계는 상기 적어도 2개 이상의 추가 기저벡터 수(F)와 상기 2개 이상의 추가 기저벡터 수(F)에 따라 결정된 주파수 변동분(k0) 각각에 대해 상기 검출된 정현파에 대해 상기 추가 기저벡터 성분을 사용함에 따른 부호화 효율을 계산하는 단계로 정의될 수 있다.
도 8의 제 804 단계는 도 3의 추가 기저벡터 성분 전송 결정기(340)에서 설명한 바와 같이 추가 기저벡터 성분에 대한 전송 여부를 결정하도록 변형될 수 있다. 따라서, 제 804 단계는 상기 적어도 2개 이상의 추가 기저벡터 수(F)와 상기 2개 이상의 추가 기저벡터 수(F)에 따라 결정된 주파수 변동분(k0) 각각에 대해 계산된 부호화 효율중 가장 부호화 효율이 높은 부호화 효율을 토대로 상기 추가 기저벡터 성분의 전송 여부를 결정하는 단계로 정의될 수 있다.
상술한 바와 같이 추가 기저벡터 성분 전송 여부가 결정되면, 도 7의 오디오 부호화 방법은, 양자화된 주파수 및/또는 위상과 진폭 및 추가 기저벡터 성분을 전송할지 여부를 결정함에 따라 생성되는 신호를 부호화한다(706). 추가 기저벡터 성분을 전송할지 여부를 결정함에 따라 생성되는 신호는 도 1 내지 도 3에서 설명한 제어 파라미터와 추가 기저벡터 성분을 포함한다.
도 9는 도 7의 오디오 부호화 방법에 대응되는 오디오 복호화 방법의 동작 흐름도이다. 도 4를 참조하여 도 9의 동작 흐름도를 설명하면 다음과 같다.
먼저, 상기 오디오 복호화 방법은, 부호화된 오디오 신호를 도 4의 파싱부(410)와 같이 파싱한다(701). 다음, 상기 오디오 복호화 방법은, 파싱에 따라 얻어진 양자화된 주파수 및/또는 위상과 진폭을 도 4의 역양자화부(420)와 유사하게 역양자화하고(702), 파싱에 따라 얻어진 제어 파라미터를 도 4의 제어 파라미터 복호화부(440)와 유사하게 복호화하고(703), 상기 파싱에 따라 얻어진 추가 기저벡터 성분을 도 4의 추가 기저벡터 성분 복호화부(406)와 유사하게 복호화한다(904).
다음 오디오 복호화 방법은, 도 4의 정현파 복원부(430)와 유사하게 역양자화된 주파수 및/또는 위상과 진폭을 토대로 정현파를 복원한다(905). 다음 오디오 복호화 방법은 도 4의 추가 기저벡터 유도부(450)와 유사하게 역양자화된 주파수 및/또는 위상과 진폭 및 복호화된 제어 파라미터를 토대로 추가 기저벡터를 유도한다(906). 그리고, 오디오 복호화 방법은 도 4의 나머지 오디오 신호 복원부(470)와 유사하게 유도된 추가 기저벡터와 복호화된 추가 기저벡터 성분을 토대로 나머지 오디오 신호를 복원한다(907). 오디오 복호화 방법은 도 4의 혼합부(480)와 같이 복원된 정현파와 복원된 나머지 오디오 신호를 혼합하여 오디오 신호를 복원하여(908), 복원된 오디오 신호를 출력한다.
본원 발명에 따른 오디오 부호화 및 복호화 방법을 수행하기 위한 프로그램은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드로서 저장되고 실행될 수 있다.
이제까지 본 발명에 대하여 그 바람직한 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
상술한 바와 같이 본 발명은 세그먼트된 오디오 신호로부터 타겟 비트율에 따라 결정된 진폭 이상의 진폭을 갖는 정현파를 검출하여 부호화하고, 검출된 각 정현파에 대해 유도된 추가 기저벡터와 나머지 오디오 신호를 토대로 추가 기저벡터의 성분을 계산하고, 계산된 추가 기저벡터 성분을 이용한 각 정현파의 부호화 효율을 토대로 추가 기저벡터 성분의 전송 여부를 결정하여 추가 기저벡터 성분을 부호화하는 오디오 부호화 기술과 그에 대응되는 오디오 복호화 기술을 제공함으로써, 낮은 비트율로 고음질의 오디오 신호를 표현할 수 있는 오디오 부호화 및 복호화 기술(또는 오디오 코덱)을 제공할 수 있다.

Claims (28)

  1. 오디오 부호화 방법에 있어서,
    입력되는 오디오 신호로부터 적어도 하나의 정현파를 검출하는 단계;
    나머지 오디오 신호와 상기 정현파의 추가 기저벡터를 이용하여 추가 기저벡터 성분을 계산하는 단계;
    상기 추가 기저벡터 성분 전송 여부를 결정하는 단계; 및
    상기 추가 기저벡터 성분에 대한 전송이 결정되면, 상기 정현파의 주파수 및/또는 위상과 진폭 및 상기 추가 기저 벡터 성분을 부호화하는 단계를 포함하고,
    상기 나머지 오디오 신호는 상기 입력되는 오디오 신호로부터 검출된 정현파를 제외한 오디오 신호인 것을 특징으로 하는 오디오 부호화 방법.
  2. 제 1 항에 있어서, 상기 추가 기저벡터 성분 계산 단계는,
    상기 검출된 정현파의 추가 기저벡터를 유도하는 단계; 및
    상기 나머지 오디오 신호를 이용하여 상기 유도된 추가 기저벡터의 성분을 계산하는 단계를 포함하는 것을 특징으로 하는 오디오 부호화 방법.
  3. 제 2 항에 있어서, 상기 추가 기저벡터 성분 전송 여부를 결정하는 단계는,
    상기 추가 기저벡터의 성분을 토대로 각 정현파의 부호화 효율을 계산하는 단계; 및
    상기 계산된 부호화 효율이 사전에 설정된 기준치보다 높으면, 상기 추가 기저벡터 성분을 전송하는 것으로 결정하는 단계를 포함하는 오디오 부호화 방법.
  4. 오디오 복호화 방법에 있어서,
    부호화된 오디오 신호를 파싱하는 단계;
    상기 파싱에 의해 얻어진 부호화된 주파수 및/또는 위상과 진폭을 복호화하여 정현파를 복원하는 단계;
    상기 파싱에 의해 얻어진 추가 기저벡터 성분을 복호화하여 나머지 오디오 신호를 복원하는 단계; 및
    상기 복원된 정현파와 상기 복원된 나머지 오디오 신호를 혼합하여 복원된 오디오 신호를 생성하는 단계를 포함하고,
    상기 나머지 오디오 신호는 오디오 신호를 부호화할 때 오디오 신호로부터 검출된 정현파를 제외한 오디오 신호인 것을 특징으로 하는 오디오 복호화 방법.
  5. 오디오 부호화 방법에 있어서,
    입력되는 오디오 신호를 특정 길이로 세그먼트 하는 단계;
    상기 세그먼트된 오디오 신호로부터 적어도 하나의 정현파를 검출하는 단계;
    상기 검출된 정현파의 주파수 및/또는 위상과 진폭을 양자화 하는 단계;
    상기 양자화된 주파수 및/또는 위상과 진폭을 역양자화 하는 단계;
    상기 역양자화된 주파수 및/또는 위상과 진폭, 나머지 오디오 신호, 및 사전 에 설정된 참조 값을 토대로 상기 검출된 정현파의 추가 기저벡터 성분을 전송할지 여부를 결정하는 단계; 및
    상기 양자화된 주파수 및/또는 위상과 진폭 및 상기 추가 기저벡터 성분을 전송할지 여부를 결정함에 따라 생성되는 신호를 부호화하는 단계를 포함하고,
    상기 나머지 오디오 신호는 상기 세그먼트된 오디오 신호중에서 상기 검출된 정현파를 제외한 오디오 신호인 것을 특징으로 하는 오디오 부호화 방법.
  6. 제 5 항에 있어서, 상기 추가 기저벡터 성분을 전송할지 여부를 결정하는 단계는,
    상기 검출된 정현파에 대해 복수의 추가 기저벡터를 유도하는 단계;
    상기 유도된 추가 기저벡터의 성분을 계산하는 단계;
    상기 추가 기저벡터 성분을 토대로 상기 정현파에 대한 부호화 효율을 계산하는 단계; 및
    상기 계산된 부호화 효율을 토대로 상기 추가 기저벡터 성분의 전송 여부를 결정하는 단계를 포함하는 오디오 부호화 방법.
  7. 제 6 항에 있어서, 상기 추가 기저벡터를 유도하는 단계는 사전에 설정된 추가 기저벡터 수(F)와 상기 추가 기저벡터 수(F)에 따라 결정된 주파수 변동분(k0)을 토대로 상기 복수의 추가 기저벡터를 유도하는 것을 특징으로 하는 오디오 부호화 방법.
  8. 제 7 항에 있어서, 상기 추가 기저벡터를 유도하는 단계는 상기 검출된 정현파에 수직인 위상을 갖는 추가 기저 벡터를 유도하는 것을 특징으로 하는 오디오 부호화 방법.
  9. 제 6 항에 있어서, 상기 추가 기저벡터 성분을 계산하는 단계는 상기 나머지 오디오 신호와 상기 복수의 추가 기저벡터를 승산한 결과를 추가 기저벡터 성분으로서 계산하는 것을 특징으로 하는 오디오 부호화 방법.
  10. 제 6 항에 있어서, 상기 부호화 효율을 계산하는 단계는, 상기 추가 기저 벡터 성분
    Figure 112006098528776-PAT00054
    과 사전에 설정된 추가 기저 벡터 수(F) 및 역양자화된 진폭
    Figure 112006098528776-PAT00055
    을 하기 식과 같이 연산하여 상기 부호화 효율을 계산하는 것을 특징으로 하는 오디오 부호화 방법.
    Figure 112006098528776-PAT00056
  11. 제 6 항에 있어서, 상기 추가 기저벡터 성분의 전송여부를 결정하는 단계는, 상기 계산된 부호화 효율이 사전에 설정된 기준 값보다 크면, 상기 추가 기저벡터 성분을 전송하는 것으로 결정하는 것을 특징으로 하는 오디오 부호화 방법.
  12. 제 5 항에 있어서, 상기 추가 기저벡터 성분을 전송할지 여부를 결정하는 단계는,
    적어도 2개 이상의 추가 기저벡터 수(F)와 상기 2개 이상의 추가 기저벡터 수(F)에 따라 결정된 주파수 변동분(k0) 각각에 대해 복수의 추가 기저벡터를 유도하는 단계;
    상기 적어도 2개 이상의 추가 기저벡터 수(F)와 상기 2개 이상의 추가 기저벡터 수(F)에 따라 결정된 주파수 변동분(k0) 각각에 대해 유도된 복수의 추가 기저벡터의 성분을 계산하는 단계;
    상기 적어도 2개 이상의 추가 기저벡터 수(F)와 상기 2개 이상의 추가 기저벡터 수(F)에 따라 결정된 주파수 변동분(k0) 각각에 대해 상기 검출된 정현파에 대해 상기 추가 기저벡터 성분을 사용함에 따른 부호화 효율을 계산하는 단계; 및
    상기 적어도 2개 이상의 추가 기저벡터 수(F)와 상기 2개 이상의 추가 기저벡터 수(F)에 따라 결정된 주파수 변동분(k0) 각각에 대해 계산된 부호화 효율중 가장 부호화 효율이 높은 부호화 효율을 토대로 상기 추가 기저벡터 성분의 전송 여부를 결정하는 단계를 포함하는 오디오 부호화 방법.
  13. 제 12 항에 있어서, 상기 추가 기저 벡터 성분의 전송 여부를 결정하는 단계는, 상기 가장 높은 부호화 효율이 사전에 설정된 기준 값보다 크면, 상기 추가 기 저벡터 성분을 전송하는 것으로 결정하는 것을 특징으로 하는 오디오 부호화 방법.
  14. 오디오 복호화 방법에 있어서,
    부호화된 오디오 신호를 파싱하는 단계;
    상기 파싱에 따라 얻어진 양자화된 주파수 및/또는 위상과 진폭을 역양자화하는 단계;
    상기 파싱에 따라 얻어진 제어 파라미터를 복호화 하는 단계;
    상기 파싱에 따라 얻어진 추가 기저벡터 성분을 복호화 하는 단계;
    상기 역양자화된 주파수 및/또는 위상과 진폭을 토대로 정현파를 복원하는 단계;
    상기 역양자화된 주파수 및/또는 위상과 진폭 및 복호화된 제어 파라미터를 토대로 추가 기저벡터를 유도하는 단계;
    상기 유도된 추가 기저벡터와 복호화된 추가 기저벡터 성분을 토대로 나머지 오디오 신호를 복원하는 단계; 및
    복원된 정현파와 상기 복원된 나머지 오디오 신호를 혼합하여 오디오 신호를 복원하는 단계를 포함하고,
    상기 나머지 오디오 신호는 오디오 부호화시 세그먼트된 오디오 신호로부터 검출된 정현파를 제외한 오디오 신호인 것을 특징으로 하는 오디오 복호화 방법.
  15. 제 14 항에 있어서, 상기 추가 기저벡터를 유도하는 단계는 적어도 2개의 추 가 기저벡터 수(F)와 상기 적어도 2개의 추가 기저벡터 수(F)에 따라 결정된 주파수 변동분(k0) 각각에 대해 복수의 추가 기저벡터를 유도하는 경우에, 상기 복호화된 제어 파라미터를 토대로 상기 적어도 2개의 추가 기저벡터 수(F)중 하나를 선택하여 추가 기저벡터를 유도하는 것을 특징으로 하는 오디오 복호화 방법.
  16. 오디오 부호화 장치에 있어서,
    입력되는 오디오 신호를 특정 길이로 세그먼트 하는 세그먼테이션부;
    상기 세그먼트된 오디오 신호로부터 적어도 하나의 정현파를 검출하는 정현파 검출부;
    상기 정현파 검출부에 의해 검출된 정현파의 주파수 및 /또는 위상과 진폭을 양자화 하는 양자화부;
    상기 양자화부에서 양자화된 주파수 및/또는 위상과 진폭을 역양자화 하는 역양자화부;
    상기 역양자화부로부터 출력되는 역양자화된 주파수 및/또는 위상과 진폭, 나머지 오디오 신호, 및 사전에 설정된 참조 값을 토대로 상기 검출된 정현파의 추가 기저벡터 성분을 전송할지 여부를 결정하는 추가 기저벡터 성분 전송 결정부; 및
    상기 양자화부로부터 출력되는 양자화된 주파수 또는/ 및 위상과 진폭, 상기 추가 기저벡터 성분 전송 결정부로부터 출력되는 신호를 부호화하는 부호화부를 포함하고,
    상기 나머지 오디오 신호는 상기 세그먼트된 오디오 신호중 상기 정현파 검출부에서 검출된 정현파를 제외한 오디오 신호인 것을 특징으로 하는 오디오 부호화 장치.
  17. 제 16 항에 있어서, 상기 추가 기저벡터 성분이 전송되는 것으로 결정되면, 상기 추가 기저벡터 성분 전송 결정부로부터 출력되는 신호는 제어 파라미터, 및 상기 추가 기저벡터 성분을 포함하고,
    상기 제어 파라미터는 상기 추가 기저 벡터 성분 전송 여부를 나타내는 파라미터를 포함하거나
    상기 추가 기저벡터 성분 전송 여부를 나타내는 파라미터 및 사용된 추가 기저벡터 유도 방식을 나타내는 파라미터를 포함하는 것을 특징으로 하는 오디오 부호화 장치.
  18. 제 16 항에 있어서, 상기 정현파 검출부는 매칭 추적 방식에 의해 상기 정현파를 검출하는 것을 특징으로 하는 오디오 부호화 장치.
  19. 제 16 항에 있어서, 상기 추가 기저벡터 성분 전송 결정부는
    상기 정현파 검출부에서 검출된 정현파에 대해 복수의 추가 기저 벡터를 유도하는 추가 기저 벡터 유도기;
    상기 정현파에 대해 상기 추가 기저 벡터 유도기에서 유도된 추가 기저 벡터 의 성분을 계산하는 추가 기저 벡터 성분 계산기;
    상기 정현파에 대해 상기 계산된 추가 기저 벡터 성분을 사용함에 따른 부호화 효율을 계산하는 부호화 효율 계산기; 및
    상기 계산된 부호화 효율을 토대로 상기 추가 기저 벡터 성분의 전송 여부를 결정하는 추가 기저벡터 성분 전송 결정기를 포함하는 오디오 부호화 장치.
  20. 제 19 항에 있어서, 상기 추가 기저 벡터 유도기는 사전에 설정된 추가 기저 벡터 수(F)와 상기 추가 기저 벡터 수(F)에 따라 결정된 주파수 변동분(k0)을 토대로 상기 복수의 추가 기저 벡터를 유도하는 것을 특징으로 하는 오디오 부호화 장치.
  21. 제 20 항에 있어서, 상기 추가 기저 벡터 유도기는 상기 검출된 정현파에 수직인 위상을 갖는 추가 기저 벡터를 유도하는 것을 특징으로 하는 오디오 부호화 장치
  22. 제 19 항에 있어서, 상기 추가 기저 벡터 성분 계산기는 상기 나머지 오디오 신호와 상기 유도된 추가 기저 벡터를 승산한 결과를 추가 기저 벡터 성분으로서 계산하는 것을 특징으로 하는 오디오 부호화 장치.
  23. 제 19 항에 있어서, 상기 부호화 효율 계산기는 상기 추가 기저 벡터 성분
    Figure 112006098528776-PAT00057
    과 사전에 설정된 추가 기저 벡터 수(F) 및 역양자화된 진폭
    Figure 112006098528776-PAT00058
    을 하기 식과 같이 연산하여 상기 부호화 효율을 계산하는 것을 특징으로 하는 오디오 부호화 장치.
    Figure 112006098528776-PAT00059
  24. 제 19 항에 있어서, 상기 추가 기저벡터 성분 전송 결정기는 상기 계산된 부호화 효율이 사전에 설정된 기준 값보다 크면, 상기 추가 기저벡터 성분을 전송하는 것으로 결정하는 것을 특징으로 하는 오디오 부호화 장치.
  25. 제 16 항에 있어서, 상기 추가 기저벡터 성분 전송 결정부는
    상기 정현파 검출부에서 검출된 정현파에 대해 복수의 추가 기저 벡터를 유도하는 적어도 2개의 추가 기저벡터 유도기;
    상기 적어도 2개의 추가 기저벡터 유도기에 대응되어 상기 유도된 추가 기저 벡터의 성분을 계산하는 적어도 2개의 추가 기저벡터 성분 계산기;
    상기 적어도 2개의 추가 기저벡터 성분 계산기에 대응되어 상기 검출된 정현파에 대해 상기 계산된 추가 기저벡터의 성분을 사용함에 따른 부호화 효율을 계산하는 적어도 2개의 부호화 효율 계산기; 및
    상기 적어도 2개의 부호화 효율 계산기에서 계산된 부호화 효율중 가장 높은 부호화 효율을 토대로 상기 추가 기저벡터 성분의 전송 여부를 결정하는 추가 기저벡터 성분 전송 결정기를 포함하는 오디오 부호화 장치.
  26. 제 25 항에 있어서, 상기 추가 기저 벡터 성분 전송 결정기는 상기 가장 높은 부호화 효율이 사전에 설정된 기준 값보다 크면, 상기 가장 높은 부호화 효율을 검출한 부호화 효율 계산기에 대응되는 추가 기저벡터 성분 계산기에서 계산된 추가 기저벡터 성분이 전송되도록 결정하는 것을 특징으로 하는 오디오 부호화 장치.
  27. 오디오 복호화 장치에 있어서,
    부호화된 오디오 신호를 파싱하는 파싱부;
    상기 파싱부로부터 출력되는 양자화된 주파수 및/또는 위상과 진폭을 역양자화하는 역양자화부;
    상기 역양자화부로부터 출력되는 역양자화된 주파수 및/또는 위상과 진폭을 토대로 정현파를 복원하는 정현파 복원부;
    상기 파싱부로부터 출력되는 제어 파라미터를 복호화 하는 제어 파라미터 복호화부;
    상기 역양자화부에서 역양자화된 주파수 및/또는 위상과 진폭 및 복호화된 제어 파라미터를 토대로 추가 기저벡터를 유도하는 추가 기저벡터 유도부;
    상기 파싱부로부터 출력되는 추가 기저벡터 성분을 복호화 하는 추가 기저벡 터 성분 복호화부;
    상기 추가 기저벡터 유도부에서 유도된 추가 기저벡터와 복호화된 추가 기저벡터 성분을 토대로 나머지 오디오 신호를 복원하는 나머지 오디오 신호 복원부; 및
    정현파 복원부로부터 복원된 정현파와 상기 나머지 오디오 신호 복원부에서 복원된 나머지 오디오 신호를 혼합하여 복원된 오디오 신호를 출력하는 혼합부를 포함하고,
    상기 나머지 오디오 신호는 오디오 부호화시 세그먼트된 오디오 신호로부터 검출된 정현파를 제외한 오디오 신호인 것을 특징으로 하는 오디오 복호화 장치.
  28. 제 27 항에 있어서, 상기 추가 기저벡터 유도부에 복수개의 추가 기저벡터 유도기가 포함되면, 상기 복호화된 제어 파라미터를 토대로 상기 복수개의 추가 기저벡터 유도기중 하나를 선택하여 추가 기저벡터를 유도하는 것을 특징으로 하는 오디오 복호화 장치.
KR1020060138785A 2006-12-29 2006-12-29 오디오 부호화 및 복호화 장치와 그 방법 KR101299155B1 (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020060138785A KR101299155B1 (ko) 2006-12-29 2006-12-29 오디오 부호화 및 복호화 장치와 그 방법
US11/954,286 US8725519B2 (en) 2006-12-29 2007-12-12 Audio encoding and decoding apparatus and method thereof
PCT/KR2007/006914 WO2008082165A1 (en) 2006-12-29 2007-12-28 Audio encoding and decoding apparatus and method thereof
EP07851812A EP2100379A4 (en) 2006-12-29 2007-12-28 AUDIOCODING AND DECODING DEVICE AND METHOD THEREFOR
CN2007800472335A CN101563848B (zh) 2006-12-29 2007-12-28 音频编码与解码装置及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060138785A KR101299155B1 (ko) 2006-12-29 2006-12-29 오디오 부호화 및 복호화 장치와 그 방법

Publications (2)

Publication Number Publication Date
KR20080062705A true KR20080062705A (ko) 2008-07-03
KR101299155B1 KR101299155B1 (ko) 2013-08-22

Family

ID=39585209

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060138785A KR101299155B1 (ko) 2006-12-29 2006-12-29 오디오 부호화 및 복호화 장치와 그 방법

Country Status (5)

Country Link
US (1) US8725519B2 (ko)
EP (1) EP2100379A4 (ko)
KR (1) KR101299155B1 (ko)
CN (1) CN101563848B (ko)
WO (1) WO2008082165A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130137235A (ko) * 2012-01-20 2013-12-16 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 사인곡선 대체를 이용하여 오디오 인코딩 및 디코딩하기 위한 장치 및 방법

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110018107A (ko) * 2009-08-17 2011-02-23 삼성전자주식회사 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
CN102103855B (zh) * 2009-12-16 2013-08-07 北京中星微电子有限公司 一种检测音频片段的方法及装置
US9236063B2 (en) * 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5347305A (en) * 1990-02-21 1994-09-13 Alkanox Corporation Video telephone system
US5956373A (en) 1995-11-17 1999-09-21 Usa Digital Radio Partners, L.P. AM compatible digital audio broadcasting signal transmision using digitally modulated orthogonal noise-like sequences
US5886276A (en) * 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US6266644B1 (en) 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
SE522261C2 (sv) * 2000-05-10 2004-01-27 Global Ip Sound Ab Kodning och avkodning av en digital signal
WO2001099097A1 (en) * 2000-06-20 2001-12-27 Koninklijke Philips Electronics N.V. Sinusoidal coding
US6947888B1 (en) * 2000-10-17 2005-09-20 Qualcomm Incorporated Method and apparatus for high performance low bit-rate coding of unvoiced speech
KR20020070373A (ko) 2000-11-03 2002-09-06 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 신호들의 사인 곡선 모델 기초 코딩
AU2003274524A1 (en) * 2002-11-27 2004-06-18 Koninklijke Philips Electronics N.V. Sinusoidal audio coding
US20050010396A1 (en) * 2003-07-08 2005-01-13 Industrial Technology Research Institute Scale factor based bit shifting in fine granularity scalability audio coding
WO2006018748A1 (en) 2004-08-17 2006-02-23 Koninklijke Philips Electronics N.V. Scalable audio coding
CN1815894A (zh) * 2005-02-06 2006-08-09 许牧 一种音频信号编码的方法和设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130137235A (ko) * 2012-01-20 2013-12-16 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 사인곡선 대체를 이용하여 오디오 인코딩 및 디코딩하기 위한 장치 및 방법

Also Published As

Publication number Publication date
US8725519B2 (en) 2014-05-13
CN101563848B (zh) 2013-02-13
CN101563848A (zh) 2009-10-21
US20080162149A1 (en) 2008-07-03
EP2100379A1 (en) 2009-09-16
WO2008082165A1 (en) 2008-07-10
KR101299155B1 (ko) 2013-08-22
EP2100379A4 (en) 2011-10-05

Similar Documents

Publication Publication Date Title
KR101083572B1 (ko) 넓은-뜻의 지각적 유사성을 이용하는 디지털 미디어스펙트럼 데이터의 효과적인 코딩
US9355646B2 (en) Method and apparatus to encode and decode an audio/speech signal
KR101412115B1 (ko) 비트 스트림 도메인 내의 코딩된 오디오 프레임들의 레벨 추정을 위한 장치 및 방법
US20070094035A1 (en) Audio coding
KR20080092623A (ko) 정현파 성분의 진폭 코딩 및 디코딩 방법과 그 장치
KR20070009340A (ko) 저비트율 오디오 신호 부호화/복호화 방법 및 장치
CN101236745A (zh) 用于带宽扩展编码和解码的方法、设备和介质
US10734009B2 (en) Periodic-combined-envelope-sequence generation device, periodic-combined-envelope-sequence generation method, periodic-combined-envelope-sequence generation program and recording medium
US20190096413A1 (en) Encoder, decoder, coding method, decoding method, coding program, decoding program and recording medium
KR101299155B1 (ko) 오디오 부호화 및 복호화 장치와 그 방법
US20130082850A1 (en) Data encoding apparatus, data decoding apparatus and methods thereof
US9711150B2 (en) Audio encoding apparatus and method, and audio decoding apparatus and method
KR100668319B1 (ko) 오디오 신호의 변환방법 및 장치와 오디오 신호에적응적인 부호화방법 및 장치, 오디오 신호의 역변환 방법및 장치와 오디오 신호에 적응적인 복호화 방법 및 장치
KR101149448B1 (ko) 오디오 부호화 및 복호화 장치와 그 방법
US20080189120A1 (en) Method and apparatus for parametric encoding and parametric decoding
US20080228500A1 (en) Method and apparatus for encoding/decoding audio signal containing noise at low bit rate
US8473302B2 (en) Parametric audio encoding and decoding apparatus and method thereof having selective phase encoding for birth sine wave
KR20080092823A (ko) 부호화/복호화 장치 및 방법
JP2009193015A (ja) 符号化装置、復号化装置、符号化方法、復号化方法及びプログラム
KR20080107669A (ko) 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치
Matta et al. Distributed Audio Coding with Efficient Source Correlation Extraction
KR20080034817A (ko) 부호화/복호화 장치 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee