KR20080107669A - 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치 - Google Patents

정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치 Download PDF

Info

Publication number
KR20080107669A
KR20080107669A KR1020070055717A KR20070055717A KR20080107669A KR 20080107669 A KR20080107669 A KR 20080107669A KR 1020070055717 A KR1020070055717 A KR 1020070055717A KR 20070055717 A KR20070055717 A KR 20070055717A KR 20080107669 A KR20080107669 A KR 20080107669A
Authority
KR
South Korea
Prior art keywords
sinusoidal
component
frequency value
value
mode
Prior art date
Application number
KR1020070055717A
Other languages
English (en)
Other versions
KR101317269B1 (ko
Inventor
이남숙
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020070055717A priority Critical patent/KR101317269B1/ko
Priority to US12/030,275 priority patent/US9076444B2/en
Priority to CN200880101939XA priority patent/CN101772805B/zh
Priority to PCT/KR2008/001222 priority patent/WO2008150061A1/en
Publication of KR20080107669A publication Critical patent/KR20080107669A/ko
Application granted granted Critical
Publication of KR101317269B1 publication Critical patent/KR101317269B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/093Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

신생 모드 정현파 성분의 효율적인 코딩 및 디코딩을 위한 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오 디코딩 방법 및 장치가 개시된다. 본 발명에 따른 정현파 오디오 코딩 방법은, 입력 오디오 신호에 대하여 정현파 분석을 수행하여 현재 프레임의 정현파 성분들을 추출하는 단계, 추출된 현재 프레임의 정현파 성분들 중 연속 모드(continuation mode) 정현파 성분에 대하여, 연속 모드 정현파 성분과 연속하는 이전 프레임의 정현파 성분을 트랙킹하여 코딩하는 단계, 현재 프레임의 정현파 성분들 중 신생 모드(birth mode) 정현파 성분에 대하여, 신생 모드 정현파 성분의 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계, 신생 모드 정현파 성분의 진폭 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값의 차이를 구하고 코딩하는 단계, 및 신생 모드 정현파 성분의 주파수 값을 코딩하는 단계를 포함한다. 신생 모드 정현파 신호의 진폭 값을 코딩함에 있어서, 신생 모드 정현파 신호와 연속 모드 정현파 신호 모두를 이용하여 가장 가까운 주파수 값을 가지는 정현파 신호를 찾고, 이들의 진폭 값의 차이를 구하여 코딩함에 의하여, 코딩된 진폭 값이 작은 비트 수를 가지도록 한다.

Description

정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오 디코딩 방법 및 장치{Method and apparatus for sinusoidal audio coding, and method and apparatus for sinusoidal audio decoding}
도 1은 파라메트릭 코딩 방식을 설명하기 위한 도면이다.
도 2는 관련 기술에 따른 오디오 코딩 방법의 일 예를 나타낸 흐름도이다.
도 3은 도 2의 방법이 적용되는 일 예를 나타낸 도면이다.
도 4는 본 발명의 일 실시예에 따른 정현파 오디오 코딩 장치의 구성을 나타낸 블록도이다.
도 5는 본 발명의 일 실시예에 따른 정현파 오디오 코딩 방법을 나타낸 흐름도이다.
도 6은 본 발명의 일 실시예에 따른 정현파 오디오 디코딩 장치의 구성을 나타낸 블록도이다.
도 7은 본 발명에 따른 정현파 오디오 코딩 방법이 적용되는 일 예를 나타낸 도면이다.
도 8은 본 발명에 따른 정현파 오디오 코딩 방법이 적용되는 다른 일 예를 나타낸 도면이다.
도 9는 본 발명에 따른 정현파 오디오 코딩 방식을 적용하는 경우, 관련 기 술과 비교한 코딩의 이득(Gain)을 나타낸 테이블이다.
본 발명은 오디오 신호의 코딩 및 디코딩에 관한 것으로서, 특히 신생 모드(birth mode) 정현파 성분의 효율적인 코딩 및 디코딩을 위한 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오 디코딩 방법 및 장치에 관한 것이다.
파라메트릭 코딩(parametric coding)은 특정한 파라미터로 오디오 신호를 표현하는 코딩 방식이다. 파라메트릭 코딩은 MPEG-4(Moving Picture Experts Group 4) 표준에서 이용되고 있다.
도 1은 파라메트릭 코딩 방식을 설명하기 위한 도면이다. 파라메트릭 코딩 방식에서는 입력 신호를 분석하여 파라미터화한다. 먼저 입력된 오디오 신호에 대하여 적절한 필터링을 수행한다(Audio reading and filtering). 입력된 오디오 신호에 대하여 트랜지언트(transient) 분석, 정현파(sinusoidal) 분석 및 노이즈(noise) 분석의 세 가지 분석을 수행하여 각각의 영역에서의 오디오 성분들에 대한 파라미터들을 추출한다. 트랜지언트 분석은 매우 역동적인(dynamic) 오디오의 변화에 대응한다. 정현파 분석은 결정적인(deterministic) 오디오의 변화에 대응한다. 노이즈 분석은 스토캐스틱(stochastic) 또는 비결정적인(non-deterministic) 오디오의 변화에 대응한다.
추출된 파라미터들은 비트 스트림으로 포맷팅한다(bit-stream formatting).
정현파 분석을 수행한 후에 정현파 성분들(sinusoids)에 대하여 ADPCM이나 DPCM 코딩을 하기 위하여 정현파 성분에 대한 트랙킹을 수행한다. 트랙킹이란 이전 프레임의 정현파 성분들과 연속되는 정현파 성분을 찾아내고 대응 관계를 설정하는 것을 의미한다. 이전 프레임의 정현파 성분에서 트랙킹이 가능한 현재 프레임의 전형파 성분을 연속 모드(continuation mode) 정현파 성분이라고 한다. 연속 모드 정현파 성분에 대하여는 대응하는 이전 프레임의 정현파 성분을 이용하여 효율적인 코딩이 가능하다.
반면, 이전 프레임의 정현파 성분들로부터 트랙킹이 가능하지 않은 현재 프레임의 정현파 성분을 신생 모드(birth mode) 정현파 성분이라고 한다. 신생 모드란 이전 프레임의 정현파 성분으로부터 연속되지 않고 현재 프레임에서 새로이 생겨난다는 의미를 가진다. 일반적으로 신생 모드 정현파 성분에 대하여는 이전 프레임의 정현파 성분을 이용하여 코딩할 수 없으며, 따라서 코딩을 위하여 많은 비트 수가 필요하게 된다.
따라서, 신생 모드 정현파 성분의 코딩에 필요한 비트 수를 줄이기 위한 방식이 요청되고 있다.
도 2는 관련 기술에 따른 오디오 코딩 방법의 일 예를 나타낸 흐름도이다.
먼저, 정현파 분석을 수행하고, 추출된 정현파 신호들의 정보를 이용하여 정현파 성분 트랙킹(sinusoid tracking)을 수행한다(S100). 정현파 성분 트랙킹은 현재 프레임의 정현파 성분들 중에서 이전 프레임의 정현파 성분과 연결된 것들을 찾고 대응 관계를 설정하는 과정이다. 정현파 성분 트랙킹 과정에서 연속 모드 정현 파 성분에 대한 코딩을 수행한다.
현재 프레임의 정현파 성분들 중에서 신생 모드 정현파 성분들을 주파수의 오름 차순으로 정렬한다(S110). 이때 정현파 성분들(partial이라고도 한다)의 수를 n개라고 가정한다.
주파수가 낮은 정현파 성분들부터 차례로 다음 과정을 수행한다(S120). 이때 각 정현파 성분의 주파수 값을 f(i), 진폭 값을 a(i)라고 한다.
1. 진폭 값에 대하여 양자화(quantization)을 수행한다(S130). 양자화된 진폭 값을 q_a(i)라고 한다.
2. 가장 낮은 주파수에 해당하는 정현파 성분인지를 판단하고(S140), 가장 낮은 주파수인 경우 양자화된 진폭 값을 절대 코딩(absolute coding)한다(S150, S170).
3. 가장 낮은 주파수가 아닌 나머지 주파수에 해당하는 정현파 성분들에 대하여는, 현재 파셜의 양자화된 진폭 값 q_a(i)과 바로 이전에 양자화된 진폭 값 q_a(i-1)과의 차를 구하고(S160), 구한 차를 코딩한다(S170).
도 3은 도 2의 방법이 적용되는 일 예를 나타낸 도면이다.
현재 프레임의 정현파 성분 p30, p31, p32, p33, p34, p35 및 p36 중에서 연속 모드 정현파 성분은 p31, p32, p34 및 p36이다. p31은 p20으로부터 연속되고, p32는 p21로부터 연속되고, p34는 p22로부터 연속되고, p36은 p23으로부터 연속된다.
반면, 신생 모드 정현파 성분은 p30, p33 및 p35이다.
이때 관련 기술에 따른 방법을 적용하면, p30의 진폭 값 a30에 대하여는 절대 코딩을 하지만, p33의 진폭 값 a33에 대하여는 diff33 = a33 - a30을 취하여 diff33을 코딩한다. 또한 p35의 진폭 값 a35에 대하여는 diff35 = a35 - a33을 취하여 diff35를 코딩한다.
본 발명에서는 이러한 관련 기술에 따른 방법보다도 코딩에 필요한 비트 수를 더 줄일 수 있는 효율적인 정현파 오디오 코딩 및 디코딩 방식을 제안하고자 한다.
본 발명이 이루고자 하는 기술적 과제는 신생 모드(birth mode) 정현파 성분의 효율적인 코딩이 가능하도록 하는 정현파 오디오 코딩 방법 및 장치, 그리고 상기 정현파 오디오 코딩 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공하는 것이다.
본 발명이 이루고자 하는 다른 기술적 과제는 신생 모드(birth mode) 정현파 성분의 효율적인 디코딩이 가능하도록 하는 정현파 오디오 디코딩 방법 및 장치, 그리고 상기 정현파 오디오 디코딩 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공하는 것이다.
본 발명은 언급된 관련 기술에서 신생 모드 정현파 성분들 간에서만 차이값 코딩(difference coding)이 수행되는 것을 개선하여 더 효율적인 코딩이 가능하도록 한다.
오디오 신호에 있어서는 주파수 값이 가까운 정현파 신호들은 진폭 값이 유사한 특징을 가지고 있다. 따라서, 진폭 값에 대하여 차이 값 코딩(difference coding)을 수행할 때 주파수가 가까운 신호와의 차이값(difference)을 구하는 것이 유리하다. 그런데, 도 2의 관련 기술에서는 신생 모드 정현파 성분들(즉 birth partial들) 간에만 차이 값 코딩이 수행되므로, 주파수 간격이 큰 경우에는 차이값 코딩의 효율이 떨어지게 된다. 예를 들어 도 3에서 p33의 코딩의 경우, p30과 p33의 주파수 간격이 크므로 두 신호의 진폭 값은 차이가 클 수가 있다. 이 경우, 두 진폭 값의 차이를 코딩하면, 코딩된 값은 비트 수가 많아지게 된다. 예를 들어, a33은 크기가 3비트이고, a30은 크기가 10비트인 경우, 그 차이값은 a33보다 그 크기가 더 커지게 된다.
차이값 코딩을 하는 이유는 정현파 성분들의 진폭 값 간에 상관 관계가 있는 경우 이를 이용하면 절대 코딩(absolute coding)을 하는 경우보다 비트 수가 적기 때문이다. 그런데, 상기 언급한 예에서는 오히려 절대 코딩을 하는 경우가 더 효율적일 수도 있다.
본 발명에서는 신생 모드 정현파 신호를 코딩할 때 정현파 신호 간의 상관 관계가 큰 정현파 신호를 이용하여 차이값 코딩을 수행하여 비트 수를 줄이고자 한다.
이를 위하여 본 발명에 따른 정현파 오디오 코딩 방법은, 입력 오디오 신호에 대하여 정현파 분석을 수행하여 현재 프레임의 정현파 성분들을 추출하는 단계; 상기 추출된 현재 프레임의 정현파 성분들 중 연속 모드(continuation mode) 정현 파 성분에 대하여, 상기 연속 모드 정현파 성분과 연속하는 이전 프레임의 정현파 성분을 트랙킹하여 코딩하는 단계; 상기 현재 프레임의 정현파 성분들 중 신생 모드(birth mode) 정현파 성분에 대하여, 상기 신생 모드 정현파 성분의 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계; 상기 신생 모드 정현파 성분의 진폭 값과 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값의 차이를 구하고 코딩하는 단계; 및 상기 신생 모드 정현파 성분의 주파수 값을 코딩하는 단계를 포함하는 것이 바람직하다.
상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계는, 상기 신생 모드 정현파 성분의 주파수 값보다 작은 주파수 값을 가지는 정현파 성분들 중에서 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 단계를 포함하는 것이 바람직하다.
상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계는, 이미 코딩된 정현파 성분들 중에서 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 단계를 포함하는 것이 바람직하다.
상기 신생 모드 정현파 성분의 진폭 값과 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값의 차이를 구하고 코딩하는 단계는, 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값을 양자화하는 단계; 상기 양자화된 진폭 값을 역양자화하는 단계; 상기 신생 모드 정현파 성분의 진폭 값과 상기 역양자화된 값의 차이 값을 구하는 단계; 상기 구한 차이 값을 양자화하는 단계; 및 상기 양자화된 차이 값을 코딩하는 단계를 포함하는 것이 바람직하다.
상기 기술적 과제를 이루기 위한 정현파 오디오 코딩 장치는, 입력 오디오 신호에 대하여 정현파 분석을 수행하여 현재 프레임의 정현파 성분들을 추출하는 정현파 분석부; 상기 추출된 현재 프레임의 정현파 성분들 중 연속 모드(continuation mode) 정현파 성분에 대하여, 상기 연속 모드 정현파 성분과 연속하는 이전 프레임의 정현파 성분을 트랙킹하여 코딩하는 정현파 성분 트랙킹부; 상기 현재 프레임의 정현파 성분들 중 신생 모드(birth mode) 정현파 성분에 대하여, 상기 신생 모드 정현파 성분의 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾아서, 상기 신생 모드 정현파 성분의 진폭 값과 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값의 차이를 구하고 코딩하는 신생 모드 진폭 코딩부; 및 상기 신생 모드 정현파 성분의 주파수 값을 코딩하는 신생 모드 주파수 코딩부를 포함하는 것이 바람직하다.
상기 신생 모드 진폭 코딩부는, 상기 신생 모드 정현파 성분의 주파수 값보다 작은 주파수 값을 가지는 정현파 성분들 중에서 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 것이 바람직하다.
상기 신생 모드 진폭 코딩부는, 이미 코딩된 정현파 성분들 중에서 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 것이 바람직하다.
상기 신생 모드 진폭 코딩부는, 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값을 양자화하고, 상기 양자화된 진폭 값을 역양자화하고, 상기 신생 모드 정현파 성분의 진폭 값과 상기 역양자화된 값의 차이 값을 구하고 양자화하여, 상기 양자화된 차이 값을 코딩하는 것이 바람직하다.
상기 다른 기술적 과제를 이루기 위한 정현파 오디오 디코딩 방법은, 현재 프레임의 코딩된 정현파 성분들 중 연속 모드(continuation mode) 정현파 성분을 디코딩하는 단계; 상기 현재 프레임의 신생 모드(continuation mode) 정현파 성분의 주파수 값을 디코딩하는 단계; 상기 디코딩된 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계; 상기 신생 모드 정현파 성분의 코딩된 진폭 차이 값을 디코딩하는 단계; 및 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값에 상기 디코딩된 진폭 차이 값을 더하여 상기 신생 모드 정현파 성분의 진폭 값을 구하는 단계를 포함하는 것이 바람직하다.
상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계는, 상기 신생 모드 정현파 성분의 주파수 값보다 작은 주파수 값을 가지는 정현파 성분들 중에서 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 단계를 포함하는 것이 바람직하다.
상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계는, 이미 디코딩된 정현파 성분들 중에서 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 단계를 포함하는 것이 바람직하다.
상기 다른 기술적 과제를 이루기 위한 정현파 오디오 디코딩 장치는, 현재 프레임의 코딩된 정현파 성분들 중 연속 모드(continuation mode) 정현파 성분을 디코딩하는 연속 모드 성분 디코딩부; 상기 현재 프레임의 신생 모드(continuation mode) 정현파 성분의 주파수 값을 디코딩하는 신생 모드 주파수 디코딩부; 및 상기 디코딩된 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾고, 상기 신생 모드 정현파 성분의 코딩된 진폭 차이 값을 디코딩하고, 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값에 상기 디코딩된 진폭 차이 값을 더하여 상기 신생 모드 정현파 성분의 진폭 값을 구하는 신생 모드 진폭 디코딩부를 포함하는 것이 바람직하다.
상기 신생 모드 진폭 디코딩부는, 상기 신생 모드 정현파 성분의 주파수 값보다 작은 주파수 값을 가지는 정현파 성분들 중에서 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 것이 바람직하다.
상기 신생 모드 진폭 디코딩부는, 이미 디코딩된 정현파 성분들 중에서 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 것이 바람직하다.
이하 첨부된 도면들을 참조하여 본 발명에 따른 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오 디코딩 방법 및 장치에 대하여 상세히 설명한다.
도 4는 본 발명의 일 실시예에 따른 정현파 오디오 코딩 장치의 구성을 나타낸 블록도이다.
도 4를 참조하면, 본 발명에 따른 정현파 오디오 코딩 장치(100)는 정현파 분석부(110), 정현파 성분 트랙킹부(120), 신생 모드 진폭 코딩부(130) 및 신생 모드 주파수 코딩부(140)를 포함하는 것이 바람직하다.
정현파 분석부(110)는 입력 오디오 신호에 대하여 정현파 분석을 수행하여 현재 프레임의 정현파 성분들을 추출한다.
정현파 성분 트랙킹부(120)는 추출된 현재 프레임의 정현파 성분들 중 연속 모드(continuation mode) 정현파 성분에 대하여, 상기 연속 모드 정현파 성분과 연 속하는 이전 프레임의 정현파 성분을 트랙킹하여 코딩한다.
신생 모드 진폭 코딩부(130)는, 현재 프레임의 정현파 성분들 중 신생 모드(birth mode) 정현파 성분에 대하여, 상기 신생 모드 정현파 성분의 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾아서, 상기 신생 모드 정현파 성분의 진폭 값과 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값의 차이를 구하고 코딩한다.
신생 모드 주파수 코딩부(140)는 신생 모드 정현파 성분의 주파수 값을 코딩한다.
도 5는 본 발명의 일 실시예에 따른 정현파 오디오 코딩 방법을 나타낸 흐름도이다.
먼저 정현파 분석부(110)에서 입력 오디오 신호에 대하여 정현파 분석을 수행하여 현재 프레임의 정현파 성분들을 추출한다(도시되지 않음).
정현파 성분 트랙킹부(120)는 연속 모드 정현파 성분에 대하여 정현파 성분 트랙킹(sinusoid tracking)을 수행하고 코딩한다(S200). 정현파 성분 트랙킹(sinusoid tracking)은 현재 프레임의 정현파 성분(파셜, partial)이 이전 프레임의 정현파 성분(파셜)과 연속되는지를 판단하는 과정이다.
이전 프레임의 정현파 성분과 트랙킹되지 않은 정현파 성분들은 현재 프레임에서 새로 생긴 정현파 성분들이다. 이들을 신생 모드 정현파 성분이라고 한다. 이러한 신생 모드 정현파 성분, 또는 신생 파셜(birth partial)을 주파수의 오름 차순으로 정렬한다(S210). 이때 신생 파셜의 수를 n개라고 가정한다.
주파수가 낮은 것부터 순서대로 각각의 정현파 성분에 대하여 다음의 과정을 수행한다(S220). 이때 각각의 정현파 성분은 p(i), 주파수 값은 f(i), 진폭 값은 a(i)라고 한다.
1. 먼저, 주파수 값 f(i)에 대하여 양자화를 수행한다(S230). 양자화된 주파수 값을 q_f(i)라고 한다.
2. 양자화된 주파수 값에 대하여 역양자화(inverse quantization)을 수행한다(S240). 역양자화된 값을 iq_f(i)라고 한다.
3. 정현파 성분들 중에서 p(i)의 주파수 값과 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는다(S250). S250 단계에서 찾은 가장 가까운 주파수 값을 가지는 정현파 성분을 pnf(i)라고 한다.
4. 현재 코딩하고자 하는 정현파 성분 p(i)의 진폭 값 a(i)와 pnf(i)의 진폭 값 b(i)와의 차이를 구하고 이를 코딩한다(S260).
상기 S230 단계 및 S240 단계를 수행하는 이유는, 주파수 값을 디코딩 측에서 사용하는 값과 동일한 값이 되도록 하기 위해서이다.
도 6은 본 발명의 일 실시예에 따른 정현파 오디오 디코딩 장치의 구성을 나타낸 블록도이다.
도 6을 참조하면, 본 발명에 따른 정현파 오디오 디코딩 장치(200)는 연속 모드 성분 디코딩부(210), 신생 모드 주파수 디코딩부(220) 및 신생 모드 진폭 디코딩부(230)를 포함하는 것이 바람직하다.
연속 모드 성분 디코딩부(210)는 현재 프레임의 코딩된 정현파 성분들 중 연 속 모드(continuation mode) 정현파 성분을 디코딩한다.
신생 모드 주파수 디코딩부(220)는 현재 프레임의 신생 모드(continuation mode) 정현파 성분의 주파수 값을 디코딩한다.
신생 모드 진폭 디코딩부(230)는 디코딩된 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾고, 상기 신생 모드 정현파 성분의 코딩된 진폭 차이 값을 디코딩하고, 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값에 상기 디코딩된 진폭 차이 값을 더하여 상기 신생 모드 정현파 성분의 진폭 값을 구한다.
도 7은 본 발명에 따른 정현파 오디오 코딩 방법이 적용되는 일 예를 나타낸 도면이다.
현재 프레임의 정현파 성분 p30, p31, p32, p33, p34, p35 및 p36 중에서 연속 모드 정현파 성분은 p31, p32, p34 및 p36이다. p31은 p20으로부터 연속되고, p32는 p21로부터 연속되고, p34는 p22로부터 연속되고, p36은 p23으로부터 연속된다.
반면, 신생 모드 정현파 성분은 p30, p33 및 p35이다.
도 3에 도시된 관련 기술에 따른 방법의 경우에는, p33의 진폭 값 a33을 코딩하기 위하여 신생 모드 정현파 신호들 중에서 가장 주파수 값이 가까운 p30을 찾고, 진폭 값의 차이 diff33_related = a33 - a30을 구하여 코딩하였다.
반면 본 발명에 따른 오디오 코딩 방법에서는 신생 모드 정현파 신호뿐만 아니라 연속 모드 정현파 신호들을 포함하는 모든 정현파 신호들 중에서 가장 주파수 값이 가까운 p32를 찾아서, 진폭 값의 차이 diff33_present = a33 - a32를 구하여 코딩한다(10).
p33과 p30은 주파수 차이가 크므로 diff33_related는 큰 값을 가지게 된다. 반면 p33과 p32는 주파수 차이가 작으므로 diff33_present는 작은 값을 가지게 된다. 따라서, 본 발명에 따른 정현파 오디오 코딩 방식을 적용하면, 신생 모드 정현파 신호의 진폭 값을 코딩하는데 필요한 비트 수가 줄어들게 된다.
도 5의 S250 단계에서 가장 가까운 주파수 값을 가지는 정현파 성분 pnf(i)를 찾는 방식에는 다음과 같은 여러 방식이 가능하다.
1. 바로 이전 프레임과 현재 프레임의 이미 코딩된 정현파 성분들 중에서 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 방식.
2. 이전에 코딩되어 저장부에 저장되어 있는 정현파 성분들, 즉 이전의 모든 프레임들과 현재 프레임의 이미 코딩된 정현파 성분들 중에서 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 방식.
3. 이전에 코딩된 정현파 성분들 중에서 현재 프레임의 정현파 성분들을 제외한 것들 중에서, 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 방식.
4. 현재 프레임에서 이미 코딩된 정현파 성분들 중에서 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 방식.
5. 바로 이전 프레임과 현재 프레임의 이미 코딩된 정현파 성분들 중에서 코딩하고자 하는 정현파 성분보다 작은 주파수를 가지는 것들 중 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 방식.
6. 이전에 코딩되어 저장부에 저장되어 있는 정현파 성분들, 즉 이전의 모든 프레임들과 현재 프레임의 이미 코딩된 정현파 성분들 중에서 코딩하고자 하는 정현파 성분보다 작은 주파수를 가지는 것들 중 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 방식.
7. 이전에 코딩된 정현파 성분들 중 현재 프레임의 정현파 성분들을 제외하고, 그것들 중에서 코딩하고자 하는 정현파 성분보다 작은 주파수를 가지는 것들 중, 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 방식.
8. 현재 프레임에서 이미 코딩된 정현파 성분들 중에서 코딩하고자 하는 정현파 성분보다 작은 주파수를 가지는 것들 중 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 방식.
현재 프레임의 정현파 성분들뿐만 아니라 이전 프레임의 정현파 성분들을 더 이용하는 것은 다음과 같은 장점이 있다. 도 8을 참조하여 이를 설명한다.
도 8은 본 발명에 따른 정현파 오디오 코딩 방법이 적용되는 다른 일 예를 나타낸 도면이다.
도 8을 참조하면, p33'를 코딩하는 경우에 있어서, 현재 프레임에서 가장 가까운 주파수 값을 가지는 정현파 신호는 p32'이지만, 이전 프레임의 정현파 성분들을 포함하는 모든 정현파 성분들 중에서 가장 가까운 주파수 값을 가지는 정현파 신호는 p21'이다. 따라서, 현재 프레임의 정현파 신호들만을 사용하는 경우에는 p33'은 p32'를 이용하여 진폭 값을 코딩하지만(21), 이전 프레임의 정현파 신호들도 사용하는 경우에 p33'은 p21'을 이용하여 진폭 값을 코딩한다(20).
또한 도 5의 S260 단계에서 진폭 값의 차이를 구하는 방식은 다음과 같은 여러 방식이 가능하다.
1. 코딩하고자 하는 정현파 성분의 진폭 값 a(i)과 가장 가까운 주파수 값을 가지는 정현파 성분의 진폭 값 b(i)를 각각 양자화한 후(양자화된 값을 각각 qa 및 qb라고 한다) 양자화된 진폭 값들의 차이(y = qa - qb)를 구하여 코딩하는 방식.
이때 디코더에서는 qb와 y를 알고 있으며, 이로부터 qa = qb + y를 구할 수 있다.
2. 가장 가까운 주파수 값을 가지는 정현파 성분의 진폭 값 b(i)을 양자화한 후(양자화된 값을 qb라고 한다), 코딩하고자 하는 정현파 성분의 진폭 값 a(i)와 상기 양자화된 값 b의 차이(d = a(i) - qb)를 구하고, 구한 차이 값(d)을 양자화하여 코딩하는 방식.
이때 디코더에서는 양자화된 차이 값을 역양자화하여 d를 구하고, 이로부터 정현파 성분의 진폭 값 a(i) = d + qb를 구할 수 있다.
본 발명에 따른 정현파 오디오 코딩 방식과 관련 기술에 따른 정현파 오디오 코딩 방식에서의 코딩의 효율성을 실험 결과를 통하여 살펴본다.
도 9는 본 발명에 따른 정현파 오디오 코딩 방식을 적용하는 경우, 관련 기술과 비교한 코딩의 이득(Gain)을 나타낸 테이블이다.
도 9에서 이득(gain)이란 코딩 후의 비트 수가 줄어든 비율을 나타낸다. 예를 들어, 15.89 퍼센트의 이익이란 비트 수가 15.89 퍼센트 줄어듦을 의미한다.
도 9를 참조하면, 8개의 테스트 시퀀스(Bass, Brahms, Dongwoo, Dust, Harp, Horn, Hotel 및 Trilogy)를 이용하여 테스트를 수행하였다.
첫번째 항목인 birth에서 amplitude의 gain이란, 신생 모드(birth mode) 정현파 신호의 진폭 값을 코딩하기 위하여 사용된 비트 수의 감소를 나타낸다. 도 9를 참조하면 관련 기술과 비교하여 평균적으로 15.89 퍼센트의 이득이 있음을 알 수 있다.
두번째 항목인 birth에서 Gain이란, 신생 모드 정현파 신호의 진폭 값, 주파수 값 및 위상 값을 코딩하기 위하여 사용된 비트 수의 감소를 나타낸다. 도 9를 참조하면, 신생 모드 정현파 신호 전체를 코딩하기 위하여 사용되는 비트 수가 평균적으로 4.28 퍼센트 감소하였음을 알 수 있다.
세번째 항목인 전체 bit rate에서 gain이란, 신생 모드 및 연속 모드 정현파 신호 모두를 코딩하기 위하여 사용된 비트 수의 감소를 나타낸다. 도 9를 참조하면, 전체 코딩된 비트 수가 관련 기술과 비교하여 2.11 퍼센트 감소하였음을 알 수 있다.
본 발명은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터(정보 처리 기능을 갖는 장치를 모두 포함한다)가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 장치의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장 장치 등이 있다.
비록 상기 설명이 다양한 실시예들에 적용되는 본 발명의 신규한 특징들에 초점을 맞추어 설명되었지만, 본 기술 분야에 숙달된 기술을 가진 사람은 본 발명의 범위를 벗어나지 않으면서도 상기 설명된 장치 및 방법의 형태 및 세부 사항에서 다양한 삭제, 대체, 및 변경이 가능함을 이해할 것이다. 따라서, 본 발명의 범위는 상기 설명에서보다는 첨부된 특허청구범위에 의해 정의된다. 특허청구범위의 균등 범위 안의 모든 변형은 본 발명의 범위에 포섭된다.
본 발명에 따른 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오 디코딩 방법 및 장치에 의하면, 신생 모드 정현파 신호의 진폭 값을 코딩함에 있어서, 신생 모드 정현파 신호뿐만 아니라 연속 모드 정현파 신호 모두를 포함한 정현파 신호들 중에서 가장 가까운 주파수 값을 가지는 정현파 신호를 찾고, 이들의 진폭 값의 차이를 구하여 코딩함에 의하여, 코딩된 진폭 값이 낮은 비트 레이트를 가지도록 한다. 따라서, 효율적인 오디오 신호의 코딩이 가능하게 된다.

Claims (20)

  1. 입력 오디오 신호에 대하여 정현파 분석을 수행하여 현재 프레임의 정현파 성분들을 추출하는 단계;
    상기 추출된 현재 프레임의 정현파 성분들 중 연속 모드(continuation mode) 정현파 성분에 대하여, 상기 연속 모드 정현파 성분과 연속하는 이전 프레임의 정현파 성분을 트랙킹하여 코딩하는 단계;
    상기 현재 프레임의 정현파 성분들 중 신생 모드(birth mode) 정현파 성분에 대하여, 상기 신생 모드 정현파 성분의 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계;
    상기 신생 모드 정현파 성분의 진폭 값과 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값의 차이를 구하고 코딩하는 단계; 및
    상기 신생 모드 정현파 성분의 주파수 값을 코딩하는 단계를 포함하는 것을 특징으로 하는 정현파 오디오 코딩 방법.
  2. 제1항에 있어서,
    상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계는,
    상기 신생 모드 정현파 성분의 주파수 값보다 작은 주파수 값을 가지는 정현파 성분들 중에서 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 단계를 포함하는 것을 특징으로 하는 정현파 오디오 코딩 방법.
  3. 제1항에 있어서,
    상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계는,
    이미 코딩된 정현파 성분들 중에서 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 단계를 포함하는 것을 특징으로 하는 정현파 오디오 코딩 방법.
  4. 제3항에 있어서,
    상기 이미 코딩된 정현파 성분들 중에서 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 단계는,
    상기 이미 코딩된 정현파 성분들 중 상기 현재 프레임의 정현파 성분인 것들 중에서만 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 단계를 포함하는 것을 특징으로 하는 정현파 오디오 코딩 방법.
  5. 제3항에 있어서,
    상기 이미 코딩된 정현파 성분들 중에서 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 단계는,
    상기 이미 코딩된 정현파 성분들 중 상기 현재 프레임의 정현파 성분이 아닌 것들 중에서만 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 단계를 포함하는 것을 특징으로 하는 정현파 오디오 코딩 방법.
  6. 제1항에 있어서,
    상기 신생 모드 정현파 성분의 진폭 값과 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값의 차이를 구하고 코딩하는 단계는,
    상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값을 양자화하는 단계;
    상기 양자화된 진폭 값을 역양자화하는 단계;
    상기 신생 모드 정현파 성분의 진폭 값과 상기 역양자화된 값의 차이 값을 구하는 단계;
    상기 구한 차이 값을 양자화하는 단계; 및
    상기 양자화된 차이 값을 코딩하는 단계를 포함하는 것을 특징으로 하는 정현파 오디오 코딩 방법.
  7. 입력 오디오 신호에 대하여 정현파 분석을 수행하여 현재 프레임의 정현파 성분들을 추출하는 정현파 분석부;
    상기 추출된 현재 프레임의 정현파 성분들 중 연속 모드(continuation mode) 정현파 성분에 대하여, 상기 연속 모드 정현파 성분과 연속하는 이전 프레임의 정현파 성분을 트랙킹하여 코딩하는 정현파 성분 트랙킹부;
    상기 현재 프레임의 정현파 성분들 중 신생 모드(birth mode) 정현파 성분에 대하여, 상기 신생 모드 정현파 성분의 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾아서, 상기 신생 모드 정현파 성분의 진폭 값과 상기 가 장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값의 차이를 구하고 코딩하는 신생 모드 진폭 코딩부; 및
    상기 신생 모드 정현파 성분의 주파수 값을 코딩하는 신생 모드 주파수 코딩부를 포함하는 것을 특징으로 하는 정현파 오디오 코딩 장치.
  8. 제7항에 있어서,
    상기 신생 모드 진폭 코딩부는,
    상기 신생 모드 정현파 성분의 주파수 값보다 작은 주파수 값을 가지는 정현파 성분들 중에서 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 것을 특징으로 하는 정현파 오디오 코딩 장치.
  9. 제7항에 있어서,
    상기 신생 모드 진폭 코딩부는,
    이미 코딩된 정현파 성분들 중에서 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 것을 특징으로 하는 정현파 오디오 코딩 장치.
  10. 제9항에 있어서,
    상기 신생 모드 진폭 코딩부는,
    상기 이미 코딩된 정현파 성분들 중 상기 현재 프레임의 정현파 성분인 것들 중에서만 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 것을 특징으로 하는 정현파 오디오 코딩 장치.
  11. 제9항에 있어서,
    상기 신생 모드 진폭 코딩부는,
    상기 이미 코딩된 정현파 성분들 중 상기 현재 프레임의 정현파 성분이 아닌 것들 중에서만 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 것을 특징으로 하는 정현파 오디오 코딩 장치.
  12. 제7항에 있어서,
    상기 신생 모드 진폭 코딩부는,
    상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값을 양자화하고, 상기 양자화된 진폭 값을 역양자화하고, 상기 신생 모드 정현파 성분의 진폭 값과 상기 역양자화된 값의 차이 값을 구하고 양자화하여, 상기 양자화된 차이 값을 코딩하는 것을 특징으로 하는 정현파 오디오 코딩 장치.
  13. 현재 프레임의 코딩된 정현파 성분들 중 연속 모드(continuation mode) 정현파 성분을 디코딩하는 단계;
    상기 현재 프레임의 신생 모드(continuation mode) 정현파 성분의 주파수 값을 디코딩하는 단계;
    상기 디코딩된 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성 분을 찾는 단계;
    상기 신생 모드 정현파 성분의 코딩된 진폭 차이 값을 디코딩하는 단계; 및
    상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값에 상기 디코딩된 진폭 차이 값을 더하여 상기 신생 모드 정현파 성분의 진폭 값을 구하는 단계를 포함하는 것을 특징으로 하는 정현파 오디오 디코딩 방법.
  14. 제13항에 있어서,
    상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계는,
    상기 신생 모드 정현파 성분의 주파수 값보다 작은 주파수 값을 가지는 정현파 성분들 중에서 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 단계를 포함하는 것을 특징으로 하는 정현파 오디오 디코딩 방법.
  15. 제13항에 있어서,
    상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계는,
    이미 디코딩된 정현파 성분들 중에서 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 단계를 포함하는 것을 특징으로 하는 정현파 오디오 디코딩 방법.
  16. 현재 프레임의 코딩된 정현파 성분들 중 연속 모드(continuation mode) 정현파 성분을 디코딩하는 연속 모드 성분 디코딩부;
    상기 현재 프레임의 신생 모드(continuation mode) 정현파 성분의 주파수 값을 디코딩하는 신생 모드 주파수 디코딩부; 및
    상기 디코딩된 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾고, 상기 신생 모드 정현파 성분의 코딩된 진폭 차이 값을 디코딩하고, 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값에 상기 디코딩된 진폭 차이 값을 더하여 상기 신생 모드 정현파 성분의 진폭 값을 구하는 신생 모드 진폭 디코딩부를 포함하는 것을 특징으로 하는 정현파 오디오 디코딩 장치.
  17. 제16항에 있어서,
    상기 신생 모드 진폭 디코딩부는,
    상기 신생 모드 정현파 성분의 주파수 값보다 작은 주파수 값을 가지는 정현파 성분들 중에서 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 것을 특징으로 하는 정현파 오디오 디코딩 장치.
  18. 제16항에 있어서,
    상기 신생 모드 진폭 디코딩부는,
    이미 디코딩된 정현파 성분들 중에서 상기 가장 가까운 주파수 값을 가지는 정현파 성분을 찾는 것을 특징으로 하는 정현파 오디오 디코딩 장치.
  19. 정현파 오디오 코딩 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체에 있어서,
    상기 정현파 오디오 코딩 방법은,
    입력 오디오 신호에 대하여 정현파 분석을 수행하여 현재 프레임의 정현파 성분들을 추출하는 단계;
    상기 추출된 현재 프레임의 정현파 성분들 중 연속 모드(continuation mode) 정현파 성분에 대하여, 상기 연속 모드 정현파 성분과 연속하는 이전 프레임의 정현파 성분을 트랙킹하여 코딩하는 단계;
    상기 현재 프레임의 정현파 성분들 중 신생 모드(birth mode) 정현파 성분에 대하여, 상기 신생 모드 정현파 성분의 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계;
    상기 신생 모드 정현파 성분의 진폭 값과 상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값의 차이를 구하고 코딩하는 단계; 및
    상기 신생 모드 정현파 성분의 주파수 값을 코딩하는 단계를 포함하는 것을 특징으로 하는 컴퓨터로 읽을 수 있는 기록 매체.
  20. 정현파 오디오 디코딩 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체에 있어서,
    상기 정현파 오디오 디코딩 방법은,
    현재 프레임의 코딩된 정현파 성분들 중 연속 모드(continuation mode) 정현파 성분을 디코딩하는 단계;
    상기 현재 프레임의 신생 모드(continuation mode) 정현파 성분의 주파수 값을 디코딩하는 단계;
    상기 디코딩된 주파수 값과 가장 가까운 주파수 값을 가지는 다른 정현파 성분을 찾는 단계;
    상기 신생 모드 정현파 성분의 코딩된 진폭 차이 값을 디코딩하는 단계; 및
    상기 가장 가까운 주파수 값을 가지는 다른 정현파 성분의 진폭 값에 상기 디코딩된 진폭 차이 값을 더하여 상기 신생 모드 정현파 성분의 진폭 값을 구하는 단계를 포함하는 것을 특징으로 하는 컴퓨터로 읽을 수 있는 기록 매체.
KR1020070055717A 2007-06-07 2007-06-07 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치 KR101317269B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020070055717A KR101317269B1 (ko) 2007-06-07 2007-06-07 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치
US12/030,275 US9076444B2 (en) 2007-06-07 2008-02-13 Method and apparatus for sinusoidal audio coding and method and apparatus for sinusoidal audio decoding
CN200880101939XA CN101772805B (zh) 2007-06-07 2008-03-04 正弦音频编码的方法和装置及正弦音频解码的方法和装置
PCT/KR2008/001222 WO2008150061A1 (en) 2007-06-07 2008-03-04 Method and apparatus for sinusoidal audio coding and method and apparatus for sinusoidal audio decoding

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070055717A KR101317269B1 (ko) 2007-06-07 2007-06-07 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20080107669A true KR20080107669A (ko) 2008-12-11
KR101317269B1 KR101317269B1 (ko) 2013-10-14

Family

ID=40093845

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070055717A KR101317269B1 (ko) 2007-06-07 2007-06-07 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치

Country Status (4)

Country Link
US (1) US9076444B2 (ko)
KR (1) KR101317269B1 (ko)
CN (1) CN101772805B (ko)
WO (1) WO2008150061A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101325760B1 (ko) * 2009-12-17 2013-11-08 한국전자통신연구원 오디오/음성 신호 처리 장치의 복부호화 장치 및 방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110018107A (ko) * 2009-08-17 2011-02-23 삼성전자주식회사 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5054072A (en) * 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
US5179626A (en) * 1988-04-08 1993-01-12 At&T Bell Laboratories Harmonic speech coding arrangement where a set of parameters for a continuous magnitude spectrum is determined by a speech analyzer and the parameters are used by a synthesizer to determine a spectrum which is used to determine senusoids for synthesis
US6266644B1 (en) * 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
FR2784218B1 (fr) 1998-10-06 2000-12-08 Thomson Csf Procede de codage de la parole a bas debit
KR100297832B1 (ko) * 1999-05-15 2001-09-26 윤종용 음성 신호 위상 정보 처리 장치 및 그 방법
CN1154975C (zh) * 2000-03-15 2004-06-23 皇家菲利浦电子有限公司 用于声频编码的拉盖尔函数
KR100927842B1 (ko) 2001-04-18 2009-11-23 아이피지 일렉트로닉스 503 리미티드 오디오 신호를 인코딩하고 디코딩하는 방법, 오디오 코더, 오디오 플레이어, 그러한 오디오 코더와 그러한 오디오 플레이어를 포함하는 오디오 시스템 및 오디오 스트림을 저장하기 위한 저장 매체
JP2004519741A (ja) * 2001-04-18 2004-07-02 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声の符号化
MXPA03002115A (es) * 2001-07-13 2003-08-26 Matsushita Electric Ind Co Ltd DISPOSITIVO DE DECODIFICACION Y CODIFICACION DE SEnAL DE AUDIO.
WO2003036619A1 (en) * 2001-10-19 2003-05-01 Koninklijke Philips Electronics N.V. Frequency-differential encoding of sinusoidal model parameters
EP1446796A1 (en) * 2001-10-26 2004-08-18 Koninklijke Philips Electronics N.V. Tracking of sinusoidal parameters in an audio coder
EP1318611A1 (en) * 2001-12-06 2003-06-11 Deutsche Thomson-Brandt Gmbh Method for retrieving a sensitive criterion for quantized spectra detection
US6915256B2 (en) 2003-02-07 2005-07-05 Motorola, Inc. Pitch quantization for distributed speech recognition
WO2005008628A1 (en) * 2003-07-18 2005-01-27 Koninklijke Philips Electronics N.V. Low bit-rate audio encoding
WO2005024783A1 (en) * 2003-09-05 2005-03-17 Koninklijke Philips Electronics N.V. Low bit-rate audio encoding
US7599840B2 (en) * 2005-07-15 2009-10-06 Microsoft Corporation Selectively using multiple entropy models in adaptive coding and decoding

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101325760B1 (ko) * 2009-12-17 2013-11-08 한국전자통신연구원 오디오/음성 신호 처리 장치의 복부호화 장치 및 방법

Also Published As

Publication number Publication date
US20080305752A1 (en) 2008-12-11
CN101772805A (zh) 2010-07-07
CN101772805B (zh) 2013-02-27
WO2008150061A1 (en) 2008-12-11
KR101317269B1 (ko) 2013-10-14
US9076444B2 (en) 2015-07-07

Similar Documents

Publication Publication Date Title
KR100661040B1 (ko) 정보 처리 장치 및 방법, 정보 기록 장치 및 방법, 기록 매체 및 제공 매체
KR20010021226A (ko) 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체
US20060015329A1 (en) Apparatus and method for audio coding
Eriksson et al. Exploiting interframe correlation in spectral quantization: a study of different memory VQ schemes
JP4550176B2 (ja) 音声符号化方法
KR101317269B1 (ko) 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치
US8224659B2 (en) Audio encoding method and apparatus, and audio decoding method and apparatus, for processing death sinusoid and general continuation sinusoid
CN101454829B (zh) 搜索固定码本的方法和设备以及使用搜索固定码本的方法和设备对语音信号编码/解码的方法和设备
JP2011008135A (ja) 情報処理装置およびプログラム
JP2008107629A (ja) オーディオ信号の符号化復号化方法、この方法を実施するための装置及びプログラム
KR101080421B1 (ko) 정현파 오디오 코딩 방법 및 장치
US8160869B2 (en) Method and apparatus for encoding continuation sinusoid signal information of audio signal and method and apparatus for decoding same
JP3435310B2 (ja) 音声符号化方法および装置
US20090024396A1 (en) Audio signal encoding method and apparatus
KR101425354B1 (ko) 오디오 신호의 연속 정현파 신호를 인코딩하는 방법 및장치와 디코딩 방법 및 장치
JP4438654B2 (ja) 符号化装置、復号装置、符号化方法及び復号方法
US8165871B2 (en) Encoding method and apparatus for efficiently encoding sinusoidal signal whose magnitude is less than masking value according to psychoacoustic model and decoding method and apparatus for decoding encoded sinusoidal signal
US20010044716A1 (en) Encoding and decoding system using code books
Kamamoto et al. A Multichannel Linear Prediction Method for the MPEG-4 ALS Compliant Encoder
JPH09269798A (ja) 音声符号化方法および音声復号化方法

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160929

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170927

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee