KR100707184B1 - 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체 - Google Patents

오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체 Download PDF

Info

Publication number
KR100707184B1
KR100707184B1 KR1020050020136A KR20050020136A KR100707184B1 KR 100707184 B1 KR100707184 B1 KR 100707184B1 KR 1020050020136 A KR1020050020136 A KR 1020050020136A KR 20050020136 A KR20050020136 A KR 20050020136A KR 100707184 B1 KR100707184 B1 KR 100707184B1
Authority
KR
South Korea
Prior art keywords
harmonic
audio signal
encoding
linear prediction
module
Prior art date
Application number
KR1020050020136A
Other languages
English (en)
Other versions
KR20060099107A (ko
Inventor
성호상
라케쉬 타오리
이강은
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020050020136A priority Critical patent/KR100707184B1/ko
Priority to US11/333,342 priority patent/US20060206316A1/en
Publication of KR20060099107A publication Critical patent/KR20060099107A/ko
Application granted granted Critical
Publication of KR100707184B1 publication Critical patent/KR100707184B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/093Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 하모닉이 포함된 오디오 신호의 질을 최적화시킬 수 있는 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체에 관한 것으로, 본 발명에 따른 부호화 장치는, 2차의 하모닉 부호화 모듈과 캘프 모듈을 결합한 구조로 입력되는 오디오 신호를 부호화하고, 1차 하모닉 부호화 모듈은 LPC 계수를 분석하지 않고 입력되는 오디오 신호에 대한 하모닉 부호화를 수행하고, 2차 하모닉 부호화 모듈은 LPC 계수를 분석하여 입력되는 오디오 신호에 대한 하모닉 부호화를 하도록 구성된다.

Description

오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체{Audio coding and decoding apparatus and method, and recoding medium thereof }
도 1은 본 발명의 바람직한 실시 예에 따른 오디오 부호화 장치의 기능 블록도이다.
도 2는 도 1의 제 1 하모닉 부호화 모듈의 상세 블록도이다.
도 3은 도 1의 제 2 하모닉 부호화 모듈의 상세 블록도이다.
도 4는 도 1의 CELP 모듈의 상세 블록도이다.
도 5는 본 발명의 바람직한 실시 예에 따른 오디오 복호화 장치의 기능 블록 도이다.
도 6은 본 발명의 바람직한 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다.
도 7은 본 발명의 바람직한 실시 예에 따른 오디오 복호화 방법의 동작 흐름도이다.
본 발명은 오디오 부호화 및 복호화 장치와 그 방법 및 기록매체에 관한 것 으로서, 특히 하모닉(Harmonic)을 포함한 오디오 신호의 질(quality)을 최적화시킬 수 있는 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체에 관한 것이다.
음성 부호화기 응용 분야가 다양해지면서 저전송률 부호화기에 대한 요구가 증대되었다. 이에 따라 4kbps 이상의 전송률에서 CLEP(Code Excited Linear Prediction)방식의 부호화기가 사용되고, 4kbps 미만의 전송률에서 하모닉-CELP 방식의 부호화기가 사용되고 있다. 4kbps 미만의 전송률에서 하모닉-CELP 방식의 부호화기를 사용하는 이유는 CELP 부호화 알고리즘이 양자화 비트가 부족하여 음질이 저하되는데 반해 하모닉 부호화 알고리즘은 적은 비트로도 음질에 큰 영향을 주는 유성음의 주기성을 잘 모델링하기 때문이다.
하모닉-CELP 부호화기의 대표적인 예로 MPEG-4의 음성부호화 표준안인 HVXC(Harmonic Vector eXcitation Coder)가 있다. HVXC는 가변차원 하모닉 벡터의 양자화와 고속 하모닉 합성, 실수 피치를 이용한 하모닉 크기 추정, 잡음 혼합을 통한 자연성 제어 등을 특징으로 한다.
그러나 하모닉-CELP 부호화기에서 하모닉이 포함된 오디오 신호 구간(또는 유성음 구간)은 과거 프레임과 현재 프레임의 표준 파형을 보간하여 이루어지므로 전이 구간에서 피치 주기가 반으로 주는 피치 해빙(pitch halving) 예측이 이루어지거나 피치 주기가 두배로 늘어나는 피치 더블링(pitch doubling) 예측이 이루어질 가능성이 높다. 상기 피치 해빙 예측이나 피치 더블링 예측이 이루어질 경우에, 피치 주기의 심한 변화량에 의해 파형 왜곡 및 프레임 경계에서의 불연속이 발생된다.
또한, 하모닉 합성을 할 때 삼각 윈도우에 의한 중첩-합산(overlap-add) 방법을 사용하기 때문에 전이 구간에서의 하모닉이 포함된 오디오 신호 구간의 신호가 순간적으로 증가 또는 감소할 경우 삼각 윈도우의 영향으로 합성 여기 신호가 선형 증가 또는 감소하는 단점이 있다.
본 발명이 이루고자 하는 기술적 과제는 하모닉이 포함된 오디오 신호의 질을 최적화시킬 수 있는 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체를 제공하는데 있다.
본 발명이 이루고자 하는 다른 기술적 과제는 하모닉이 포함된 오디오 신호 구간에서의 피치 해빙 예측이나 피치 더블링 예측을 방지할 수 있는 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체를 제공하는데 있다.
본 발명이 이루고자 하는 또 다른 기술적 과제는 하모닉 크기 정보를 LPC 계수영역으로 변환하여 양자화하고, 양자화된 LPC 계수를 2차 하모닉 부호화 모듈과 캘프 모듈에서 필요한 LPC 계수를 추출하는데 사용하는 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체를 제공하는데 있다.
본 발명이 이루고자 하는 또 다른 기술적 과제는 입력되는 오디오 신호에 하모닉 포함여부에 따라 복수개의 부호화 모듈에 대한 비트 할당을 다르게 하는 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체를 제공하는데 있다.
본 발명이 이루고자 하는 또 다른 기술적 과제는 확장성(scalability) 적용이 용이한 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체를 제공하는데 있 다.
상기 기술적 과제들을 달성하기 위하여 본 발명은, 입력되는 오디오 신호의 피치 주기를 이용하여 상기 입력되는 오디오 신호에 대한 하모닉 부호화를 수행하는 제 1 하모닉 부호화 모듈; 상기 제 1 하모닉 부호화 모듈에서 출력되는 오디오 신호와 상기 입력되는 오디오 신호간의 차이 오디오 신호를 제 1 차이 오디오 신호로 검출하는 제 1 검출기; 상기 제 1 하모닉 부호화 모듈에서 얻은 양자화된 선형 예측 코딩 계수와 이전의 하모닉 부호화 결과를 이용하여 상기 제 1 차이 오디오 신호를 하모닉 부호화하는 제 2 하모닉 부호화 모듈; 상기 제 2 하모닉 부호화 모듈에서 출력되는 오디오 신호와 상기 제 1 차이 오디오 신호간의 차이 오디오 신호를 제 2 차이 영상 신호로 검출하는 제 2 검출기; 상기 제 1 하모닉 부호화 모듈에서 얻은 양자화된 선형 예측 코딩 계수를 이용하여 상기 제 2 차이 오디오 신호를 켈프 부호화하는 켈프 모듈; 상기 입력되는 오디오 신호가 하모닉을 포함하는 오디오 신호인지 여부에 따라 상기 제 1 하모닉 부호화 모듈, 제 2 하모닉 부호화 모듈 및 켈프 모듈에 대한 비트를 할당하는 비트 할당부를 포함하고,
제 1 하모닉 부호화 모듈은 하모닉 크기를 선형 예측 코딩 계수로 변환하고, 선형 예측 코딩 계수를 양자화하여 제 2 하모닉 부호화 모듈 및 켈프 모듈로 제공하고, 양자화된 선형 예측 코딩 계수를 하모닉 크기 벡터로 변환하여 하모닉 합성을 수행하고,
상기 제 2 하모닉 부호화 모듈 및 켈프 모듈은 상기 양자화된 선형 예측 코 딩 계수를 이용하여 각각 부호화시 필요한 선형 예측 코딩 계수를 추출하는 오디오 부호화 장치를 제공한다.
상기 기술적 과제들을 달성하기 위하여 본 발명은, 상기 오디오 신호를 복원하기 위한 복수의 파라미터들을 각각 역양자화하는 역양자화 유니트; 상기 역양자화 유니트로부터 출력되는 선형 예측 코딩 계수와 위상 값을 이용하여 하모닉 복호화를 수행하는 제 1 하모닉 복호화 모듈; 상기 역양자화 유니트로부터 출력되는 상기 선형 예측 코딩 계수와 하모닉 인덱스, 및 제 1 이득 값을 토대로 하모닉 복호화를 수행하는 제 2 하모닉 복호화 모듈; 상기 제 1 하모닉 복호화 모듈에서 출력되는 신호와 상기 제 2 하모닉 복호화 모듈에서 출력되는 신호를 가산하는 제 1 가산기; 상기 역양자화 유니트로부터 출력되는 스토캐스틱 코드북 인덱스 및 제 2 이득 값을 토대로 켈프 복호화를 수행하는 켈프 복호화 모듈; 및 상기 제 1 가산기로부터 출력되는 신호와 상기 켈프 복호화 모듈로부터 출력되는 신호를 가산하여 복원된 오디오 신호를 출력하는 제 2 가산기를 포함하는 오디오 복호화 장치를 제공한다.
상기 기술적 과제들을 달성하기 위하여 본 발명은, 상기 입력되는 오디오 신호에 대한 선형 예측 코딩 계수 분석 없이 하모닉 부호화하는 단계; 상기 입력되는 오디오 신호와 상기 하모닉 부호화 결과간의 차이 오디오 신호에 대한 선형 예측 코딩 계수를 분석하면서 상기 차이 오디오 신호에 대한 하모닉 부호화하는 단계; 상기 차이 오디오 신호에 대한 하모닉 부호화 결과와 상기 입력되는 오디오 신호간의 차이 오디오 신호를 켈프 부호화하는 단계를 포함하는 오디오 부호화 방법을 제 공한다.
상기 기술적 과제들을 달성하기 위하여 본 발명은, 오디오 신호를 복원하기 위한 복수의 파라미터를 역양자화하는 단계; 상기 역양자화 단계에 의해 얻어진 선형 예측 코딩 계수와 위상 값을 토대로 하모닉 복호화를 수행하는 1차 하모닉 복호화 단계; 상기 역양자화 단계에 의해 얻어진 선형 예측 코딩 계수와 하모닉 인덱스, 및 제 1 이득 값을 토대로 하모닉 복호화를 수행하는 2차 하모닉 복호화 단계; 상기 1차 하모닉 복호화 결과와 상기 2차 하모닉 복호화 결과를 가산하는 단계; 상기 역양자화 단계에 의해 얻어진 스토캐스틱 인덱스와 제 2 이득값을 토대로 캘프 복호화를 수행하는 캘프 복호화 단계; 및 상기 가산단계에서 얻어진 결과와 상기 캘프 복호화 단계에서 얻어진 결과를 가산하여 복원된 오디오 신호를 얻은 단계를 포함하는 오디오 복호화 방법을 제공한다.
상기 기술적 과제들을 달성하기 위하여 본 발명은, 오디오 부호화 방법을 수행하는 프로그램이 기록된 기록 매체에 있어서, 상기 오디오 부호화 방법은, 상기 입력되는 오디오 신호에 대한 선형 예측 코딩 계수 분석 없이 하모닉 부호화하는 단계; 상기 입력되는 오디오 신호와 상기 하모닉 부호화 결과간의 차이 오디오 신호에 대한 선형 예측 코딩 계수를 분석하면서 상기 차이 오디오 신호에 대한 하모닉 부호화하는 단계; 상기 차이 오디오 신호에 대한 하모닉 부호화 결과와 상기 입력되는 오디오 신호간의 차이 오디오 신호를 켈프 부호화하는 단계를 포함하는 기록 매체를 제공한다.
이하 본 발명에 따른 오디오 부호화 및 복호화 장치와 그 방법을 살펴보면 다음과 같다.
도 1은 본 발명의 바람직한 실시 예에 따른 오디오 부호화 장치의 기능 블록도이다. 도 1을 참조하면, 오디오 부호화 장치는 피치 분석부(110), 신호 분류부(120), 비트 할당부(130), 제 1 하모닉 부호화 모듈(140), 제 1 검출기(150), 제 2 하모닉 부호화 모듈(160), 제 2 검출기(170), 및 켈프(CELP, Code Excited Linear Prediction) 모듈(180)을 포함한다.
피치 분석부(110)는 입력되는 오디오 신호의 피치를 분석하여 피치 주기(pitch lag) tp를 검출한다. 피치 주기 tp는 수학식 1과 같이 정규화된 자기 상관 함수(normalized auto-correlation)를 이용하여 구한다.
Figure 112005012762962-pat00001
수학식 1에서 s(n)은 입력되는 오디오 신호이고, Lf는 오디오 신호 s(n)에서 분석할 부분의 길이, LMIN 및 LMAX는 각각 피치의 최대 및 최소를 나타낸다. 일반적인 경우에 LMIN과 LMAX는 각각 20과 143의 값을 갖는다. R(i)가 최대가 되는 i를 범위 LMIN-LMIN+19, LMIN+20 ~ LMIN+39, LMIN+40 ~ LMAX에서 각각 하나씩 찾는다. 상기 범위에서 찾아진 i를 각각 t3, t2, t1이라 하면 수학식 2와 같은 관계식을 토대로 t3, t2, t1중 하나의 값이 피치 주기 tp로 선택된다.
tp=t1
R(tp) = R(t1)
if R(t2) = 0.85 R(tp)
R(tp) = R(t2)
tp = t2
End
if R(t3) = 0.85R(tp)
R(tp) = R(t3)
tp = t3
end
피치 분석부(110)에서 검출된 피치 주기는 제 1 하모닉 부호화 모듈(140)로 제공된다.
신호 분류부(120)는 입력되는 오디오 신호에 하모닉이 포함되어 있는지를 판단한다. 즉, 신호 분류부(120)는 입력되는 오디오 신호 s(n)의 선명함 비율(sharpness rate), 좌우 에너지 비율, 영 교차율(zero-crossing rate), 및 1차 예측 계수(First-order Prediction Coefficient)와 같은 특성 값을 검출하고, 사전에 설정된 각 특성 값에 대한 문턱 값과 검출된 특성 값들을 비교하고, 그 비교결과가 사전에 정의된 조건을 만족하면 입력되는 오디오 신호에 하모닉 성분이 포함된 것으로 판단할 수 있다. 상기 비교는 부 프레임 단위로 수행될 수 있다. 신호 분류부(120)의 판단 결과는 비트 할당부(130)로 제공된다.
비트 할당부(130)는 신호 분류부(120)에서 제공되는 판단 결과에 따라 제 1 하모닉 부호화 모듈(140), 제 2 하모닉 부호화 모듈(150) 및 켈프 모듈(180)에 대한 할당 비트 정보를 제공한다. 비트 할당부(130)는 만약 신호 분류부(120)로부터 입력되는 오디오 신호에 하모닉이 포함된 것을 나타내는 신호가 제공되면, 상기 제 1 하모닉 부호화 모듈(140), 제 2 하모닉 부호화 모듈(150) 및 켈프 모듈(180)에 대해 예를 들어 3:3:2비율로 비트를 할당한 정보를 제공할 수 있다. 만약 신호 분류부(120)로부터 입력되는 오디오 신호에 하모닉이 포함되지 않은 것을 나타내는 신호가 제공되면, 상기 제 1 하모닉 부호화 모듈(140), 제 2 하모닉 부호화 모듈(150) 및 켈프 모듈(180)에 대해 예를 들어 2:2:4비율로 비트를 할당한 정보를 제공할 수 있다. 상기 비트 할당 정보는 사전에 설정될 수 있다.
제 1 하모닉 부호화 모듈(140)은 피치 주기를 이용하여 입력되는 오디오 신호에 대한 하모닉 부호화를 수행하고, 오디오 복호화를 위하여 양자화된 선형 예측 코딩(Linear Prediction Coding, LPC라고 약함) 계수, 양자화된 LPC 계수 인덱스 및 양자화된 위상 인덱스를 출력한다.
이를 위하여 제 1 하모닉 부호화 모듈(140)은 도 2에 도시된 바와 같이 제 1 하모닉 분석부(201), 크기/LPC 계수 변환기(202), LPC 계수 양자화기(203), QLPC/크기 변환기(204), 위상 양자화기(205), 및 제 1 하모닉 합성부(206)를 포함한다.
제 1 하모닉 분석부(201)는 피치 주기(또는 피치 딜레이)를 이용하여 입력되는 오디오 신호의 하모닉을 분석한다. 즉, 피치 주기를 이용하여 기본 주파수(fundamental frequency) ω0를 찾고, 정현파 사전(sine dictionary)을 사용하여 하모닉 파라미터를 탐색한다. 하모닉 파라미터는 크기 A와 위상 φ를 포함한다.
정현파 사전의 크기 A와 위상 φ는 오디오 신호 s(n)을 목적신호로 한 MP(Matching Pursuit) 알고리즘을 이용하여 탐색된다. 정현파 사전으로 표현된 오디오 신호 sH(n)은 수학식 3과 같이 정의할 수 있다.
Figure 112005012762962-pat00002
수학식 3에서 Ak는 k번째 정현파의 크기, ωk는 k번째 정현파의 각 주파수, φk는 k번째 정현파의 위상, wham(n)은 해밍 윈도우(hamming window), K는 정현파 사전의 개수를 나타내며 일반적으로 수학식 4와 같다.
Figure 112005012762962-pat00003
정현파 사전의 각 주파수 ωk는 수학식 5에 의해 구할 수 있다.
Figure 112005012762962-pat00004
MP알고리즘을 이용한 탐색은 k번째 목적 신호를 k번째 사전에 투영하여 성분 크기(component amplitude)를 추출하는 과정과 추출된 성분 크기를 k번째 목적 신호에 상쇄시켜 새로운 k+1번째 목적 신호를 만들어 내는 과정을 반복적으로 수행한다. 상기 MP 알고리즘을 이용한 정현파 사전의 크기와 위상 탐색은 수학식 6과 같이 정의할 수 있다.
Figure 112005012762962-pat00005
수학식 6에서 rh,k는 k번째 목적신호이고, Ek는 rh,k와 k번째 정현파 사전과의 평균 자승 에러(mean squared error)에 해밍 윈도우(hamming window) wham을 취한 값이다. k=0이라면, rh,k(n)는 원래 오디오 신호 s(n)과 동일하다. Ek가 최소가 되는 Ak와 φk는 수학식 7과 같이 정의할 수 있다.
Figure 112005012762962-pat00006
제 1 하모닉 분석부(201)는 상기 정현파 사전의 크기는 크기/LPC 계수 변환기(202)로 전송하고, 상기 정현파 사전의 위상은 위상 양자화기(205)로 전송한다.
크기/LPC계수 변환기(202)는 입력된 정현파 사전의 크기 A를 LPC 계수로 변환한다. LPC 계수 양자화기(203)는 비트 할당부(130)로부터 제공되는 할당된 비트 정보를 이용하여 상기 선형 예측 코딩 계수를 양자화하고, 양자화된 선형 예측 코딩 계수(QLPC)와 양자화된 선형 예측 계수 인덱스를 출력한다.
QLPC/크기 변환기(204)는 상기 양자화된 선형 예측 코딩 계수를 양자화된 정현파 사전의 크기 벡터
Figure 112005012762962-pat00007
로 변환하여 출력한다.
위상 양자화기(205)는 비트 할당부(130)로부터 제공되는 할당된 비트 정보를 토대로 제 1 하모닉 분석부(201)로부터 출력되는 위상을 양자화하고, 양자화된 위상 벡터
Figure 112005012762962-pat00008
와 양자화된 위상 인덱스를 출력한다.
제 1 하모닉 합성부(206)는 QLPC/크기 변환기(204)로부터 출력되는 양자화된 정현파 사전의 크기 벡터
Figure 112005012762962-pat00009
와 위상 양자화기(205)로부터 출력되는 양자화된 위상 벡터
Figure 112005012762962-pat00010
을 수학식 8에 의해 합성하여 상기 입력되는 오디오 신호에 대한 합성된 오디오 신호
Figure 112005012762962-pat00011
을 얻는다.
Figure 112005012762962-pat00012
제 1 하모닉 합성부(206)는 합성된 오디오 신호
Figure 112005012762962-pat00013
를 제 1 검출기(150)로 전송한다.
제 1 검출기(150)는 입력되는 오디오 신호와 제 1 하모닉 부호화 모듈(140)로부터 출력되는 합성된 오디오 신호간의 제 1 차이 오디오 신호를 검출하여 출력한다.
제 2 하모닉 부호화 모듈(160)은 제 1 하모닉 부호화 모듈(140)에서 얻은 양자화된 LPC 계수와 제 2 하모닉 부호화 모듈(160)의 이전 출력신호를 이용하여 제 1 검출기(150)에서 검출된 제 1 차이 오디오 신호를 하모닉 부호화하여 합성된 오디오 신호를 출력하면서 오디오 신호 복호화를 위하여 양자화된 하모닉 인덱스 및 양자화된 제 1 이득 인덱스를 출력한다.
이를 위하여 제 2 하모닉 부호화 모듈(160)은 도 3에 도시된 바와 같이 LPC계수 분석기(301), 역합성 필터(inverse synthesis filter)(302), 제 2 하모닉 분 석부(303), 인덱스 양자화기(304), 제 2 하모닉 합성부(305), 및 합성 필터(306)를 포함한다.
LPC 계수 분석기(301)는 제 1 하모닉 부호화 모듈(140)로부터 제공되는 양자화된 선형 예측 코딩 계수를 이용하여 상기 제 1 검출기(150)로부터 출력되는 제 1차이 오디오 신호에 대한 선형 예측 코딩 계수를 분석하여 제 2 하모닉 부호화 모듈(160)에서 필요한 LPC 계수를 추출한다.
LPC 계수 분석기(301)는 해당되는 음성 부호화 장치의 동작 조건에 따라 제 1 하모닉 부호화 모듈(140)로부터 제공된 양자화된 선형 예측 코딩 계수의 차수를 줄일 필요가 있을 때 필요한 만큼 줄인 LPC 계수를 추출하도록 구성될 수 있다. LPC 계수를 줄이는 방식은 전송된 계수에서 앞부분의 필요한 만큼만 취하는 방식으로 구현될 수 있다. 예를 들어, 상기 양자화된 LPC계수의 차수가 P차이고 제 2 하모닉 부호화 모듈(160)에서 사용하고 싶은 LPC 계수의 차수가 Q차라고 할 때, 전체 P개의 LPC 계수 중에서 앞부분의 Q개의 LPC 계수를 추출하면 된다. 이 때, LPC 계수의 개수는 반드시 짝수를 유지하여야 한다. 추출된 LPC 계수는 역합성 필터(302)와 합성 필터(306)로 각각 제공된다.
역합성 필터(302)는 제 1 검출기(150)에 의해 검출된 제 1 차이 오디오 신호에 대해 합성 필터의 역과정을 수행하여 제 1 차이 오디오 신호의 여기 신호를 생성하고, 생성된 여기신호를 제 2 하모닉 분석부(303)로 전송한다.
제 2 하모닉 분석부(303)는 도 2의 제 1 하모닉 분석부(201)와 동일하게 구성되어 상기 역합성 필터(302)로부터 출력되는 여기 신호에 대한 정현파 사전의 크 기 A와 위상 φ를 탐색하고, 탐색된 정현파 사전의 크기 A와 위상 φ를 포함하는 하모닉 인덱스를 출력한다. 출력된 하모닉 인덱스는 인덱스 양자화기(304)로 전송된다.
인덱스 양자화기(304)는 비트 할당부(130)로부터 제공되는 할당된 비트 정보를 이용하여 제 2 하모닉 분석부(303)로부터 출력되는 하모닉 인덱스를 양자화하고, 양자화된 하모닉 인덱스와 양자화된 이득 인덱스를 출력한다.
제 2 하모닉 합성부(305)는 도 2의 제 1 하모닉 합성부(206)와 동일하게 구성되어 인덱스 양자화기(304)로부터 출력되는 상기 양자화된 하모닉 인덱스를 합성하여 합성된 오디오 신호를 출력한다.
합성 필터(308)는 상기 LPC 계수 분석기(301)로부터 출력되는 양자화된 선형 예측 코딩 계수를 이용하여 상기 제 2 하모닉 합성부(305)로부터 출력되는 합성된 오디오 신호를 합성 필터링하여 합성된 제 1 차이 오디오 신호를 출력한다. 출력되는 합성된 제 1 차이 오디오 신호는 제 2 검출기(170)로 출력된다.
제 2 검출기(170)는 제 1 검출기(150)에서 출력되는 제 1 차이 오디오 신호와 제 2 하모닉 부호화 모듈(160)로부터 출력되는 합성된 제 1 차이 오디오 신호간의 차이 오디오 신호를 검출하여 제 2 차이 오디오 신호로 출력한다.
캘프 모듈(180)은 제 1 하모닉 부호화 모듈(140)에서 얻은 양자화된 LPC 계수를 이용하여 제 2 검출기(170)로부터 출력되는 제 2 차이 오디오 신호를 캘프 부호화하면서, 오디오 신호 복호화를 위하여 양자화된 스토캐스틱 인덱스와 양자화된 제 2 이득 인덱스를 출력한다.
이를 위하여 캘프 모듈(180)은 도 4에 도시된 바와 같이 제 3 검출기(401), 인지가중 필터(402), 스토캐스틱 코드북 탐색기(403), 인덱스 양자화기(404), 스토캐스틱 코드북(405), 승산기(406), LPC 계수 분석기(407), 및 합성 필터(408)를 포함한다.
제 3 검출기(401)는 제 2 검출기(170)로부터 출력되는 재 2 차이 오디오 신호와 상기 켈프 모듈(180)에 의해 이전에 얻은 합성된 오디오 신호간의 차이 오디오 신호를 검출한다.
인지 가중 필터(402)는 청취적 마스킹 효과를 이용하여 제 4 검출기(401)로부터 출력되는 차이 오디오 신호에 대한 양자화 잡음이 마스킹 레벨 이하가 되도록, LPC 계수 분석기(407)로부터 제공되는 LPC계수를 이용하여 상기 차이 오디오 신호를 인지 가중 필터링한다.
스토캐스틱 코드북 탐색기(403)는 인지 가중 필터(402)로부터 출력되는 신호를 토대로 상응하는 하나의 스토캐스틱 코드북을 탐색하고, 탐색된 스토캐스틱 코드북의 인덱스를 출력한다.
인덱스 양자화기(404)는 스토캐스틱 코드북 탐색기(403)로부터 제공되는 인덱스를 양자화하고, 양자화된 스토캐스틱 코드북 인덱스 및 양자화된 이득 인덱스를 출력한다.
스토캐스틱 코드북(405)은 복수개의 스토캐스틱 코드북을 구비하고, 인덱스 양자화기(404)로부터 제공되는 양자화된 스토캐스틱 코드북 인덱스에 대응된 스토캐스틱 코드북을 출력한다.
승산기(406)는 인덱스 양자화기(404)로부터 출력되는 양자화된 이득을 상기 스토캐스틱 코드북(405)으로부터 출력되는 스토캐스틱 코드북에 승산한다.
LPC 계수 분석기(407)는 제 1 하모닉 부호화 모듈(140)로부터 제공되는 양자화된 선형 예측 코딩 계수에 의해 상기 제 3 검출기(401)로부터 출력되는 신호의 양자화된 선형 예측 코딩 계수를 분석하여 양자화된 LPC 계수를 추출한다. 양자화된 LPC 계수 추출 방식은 상기 제 2 하모닉 부호화 모듈(160)에 구비되어 있는 LPC 계수 분석기(301)에서와 같다.
추출된 LPC 계수는 인지가중 필터(402)와 합성 필터(408)로 각각 제공된다.
합성 필터(408)는 상기 LPC 계수 분석기(407)로부터 출력되는 양자화된 LPC 계수에 의해 상기 승산기(406)로부터 출력되는 신호를 합성 필터링하고, 합성 필터링된 결과를 제 3 검출기(401)로 제공한다. 상기 합성 필터링은 양자화된 LPC 계수로부터 합성 필터의 임펄스 응답을 구한 후, 상기 임펄스 응답과 상기 승산기(406)로부터 출력되는 신호의 컨벌루션을 수행하여 합성된 오디오 신호를 얻는다.
도 5는 본 발명의 바람직한 실시 예에 따른 오디오 복호화 장치의 기능 블록도이다. 도 5를 참조하면, 상기 오디오 복호화 장치는 LPC 계수 역양자화기(501), 위상 인덱스 역양자화기(502), 하모닉 인덱스 역양자화기(503), 제 1 이득 인덱스 역양자화기(504), 스토캐스틱 인덱스 역양자화기(505), 및 제 2 이득 인덱스 역양자화기(506), 제 1 하모닉 복호화 모듈(510), 제 2 하모닉 복호화 모듈(520), 제 1 가산기(530), 캘프 복호화 모듈(540), 및 제 2 가산기(550)를 포함한다.
상기 역양자화기들(501∼506)은 오디오 신호를 복원하기 위한 복수의 파라미 터들을 각각 역양자화하는 역양자화 유니트로 정의할 수 있다.
제 1 하모닉 복호화 모듈(510)은 LPC 계수 역양자화기(501)로부터 출력되는LPC 계수와 위상 인덱스 역양자화기(502)로부터 출력되는 위상 값을 이용하여 하모닉 복호화를 수행하여, 하모닉을 포함한 복원된 오디오 신호를 출력한다.
이를 위하여, 제 1 하모닉 복호화 모듈(510)은 LPC 계수/크기 변환부(511)와 하모닉 합성부(512)를 포함한다.
LCP 계수/크기 변환부(511)는 LPC 계수를 정현파 사전의 크기 벡터
Figure 112005012762962-pat00014
로 변환한다. 하모닉 합성부(512)는 위상 인덱스 역양자화기(502)로부터 출력되는 위상 벡터
Figure 112005012762962-pat00015
와 LPC/크기 변환기(511)로부터 출력되는 정현파 사전의 크기 벡터
Figure 112005012762962-pat00016
를 상기 수학식 8에 의해 합성하여 하모닉을 포함한 오디오 신호를 출력한다. 출력된 하모닉을 포함한 오디오 신호는 제 1 가산기(530)로 출력된다.
제 2 하모닉 복호화 모듈(520)은 LPC 계수 역양자화기(501)로부터 출력되는 LPC 계수, 하모닉 인덱스 역양자화기(503)로부터 출력되는 하모닉 인덱스 및 제 1 이득 인덱스 역양자화기(504)로부터 출력되는 제 1 이득 값을 토대로 하모닉 복호화를 수행한다.
이를 위하여 제 2 하모닉 복호화 모듈(520)은 하모닉 코드 생성기(521), 제 1 승산기(522), 및 제 1 합성 필터(523)를 포함한다.
하모닉 코드 생성기(521)는 복수개의 하모닉 코드를 구비하고, 입력되는 하모닉 인덱스를 토대로 하모닉 코드를 생성한다. 제 1 승산기(522)는 생성된 하모닉 코드와 제 1 이득값을 승산한다.
제 1 합성 필터(523)는 입력되는 LPC 계수를 토대로 제 1 승산기(522)로부터 출력되는 신호를 합성 필터링하고, 합성된 필터링된 오디오 신호를 제 1 가산기(530)로 출력한다. 제 1 승산기(522)로부터 출력되는 오디오 신호를 sh(n), LPC 계수를 a, 합성 필터링된 오디오 신호를 s1(n)라 하면 상기 합성 필터링 과정은 수학식 9와 같이 정의될 수 있다.
Figure 112005012762962-pat00017
수학식 9에서 p는 LPC 계수의 차수를 나타낸다.
제 1 가산기(530)는 제 1 하모닉 복호화 모듈(510)에서 출력되는 신호와 제 2 하모닉 복호화 모듈(520)에서 출력되는 신호를 가산하여 출력한다. 출력된 신호는 제 2 가산기(550)로 전송된다.
캘프 복호화 모듈(540)은 스토캐스틱 인덱스 역양자화기(505)로부터 출력되는 스토캐스틱 인덱스와 제 2 이득 인덱스 역양자화기(506)로부터 출력되는 제 2 이득 값을 토대로 켈프 복호화를 수행한다.
이를 위하여 캘프 복호화 모듈(540)은 스토캐스틱 코드북(541), 승산기(542) 및 제 2 합성 필터(543)를 포함한다.
스토캐스틱 코드북(541)은 복수개의 스토캐스틱 코드북을 구비하고, 스토캐스틱 인덱스를 토대로 상응하는 스토캐스틱 코드북을 출력한다.
제 2 승산기(542)는 제 2 이득 값과 스토캐스틱 코드북을 승산한다. 제 2 합성 필터(543)는 LPC 계수를 토대로 제 2 승산기(542)로부터 출력되는 신호를 상기 수학식 9에 의해 합성 필터링하여 얻어진 합성된 오디오 신호를 상기 제 2 가산기(550)로 제공한다.
제 2 가산기(550)는 제 1 가산기(530)로부터 출력되는 신호와 상기 켈프 복호화 모듈(540)로부터 출력되는 신호를 가산하여 복원된 오디오 신호를 출력한다.
도 6은 본 발명의 바람직한 실시 예에 따른 오디오 부호화 방법의 동작 흐름도이다. 도 1를 참조하여 설명하면 다음과 같다.
입력되는 오디오 신호의 피치를 분석하여 피치 주기를 구한다(601).
입력되는 오디오 신호에 하모닉이 포함되어 있는지 여부를 판단하여 입력되는 오디오 신호를 분류하고, 분류된 결과를 토대로 제 1 하모닉 부호화 모듈(140), 제 2 하모닉 부호화 모듈(160) 및 캘프 모듈(180)에 대한 비트를 할당한다(602).
LPC 계수를 분석하지 않고, 601 단계에서 얻은 피치 주기를 이용하여 입력되는 오디오 신호에 대한 하모닉 부호화를 제 1 하모닉 부호화 모듈(140)에서와 같이 수행한다(603). 즉, 입력되는 오디오 신호에 대한 하모닉 분석을 수행하고, 하모닉 분석에 의해 검출되는 정현파 사전의 크기를 LPC계수로 변환하고, 변환된 LPC 계수를 양자화하고, 이를 다시 크기 벡터로 변환하여 하모닉 합성을 수행한다. 양자화된 LPC계수는 2차 하모닉 부호화 및 켈프 부호화시 이용된다.
입력되는 오디오 신호와 603 단계에서의 하모닉 부호화 결과간의 차이 오디오 신호를 제 1 차이 오디오 신호로 하고, 상기 제 1 차이 오디오 신호에 대한 선 형 예측 코딩 계수를 분석하면서 상기 제 1 차이 오디오 신호에 대한 하모닉 부호화를 제 2 하모닉 부호화 모듈(160)에서와 같이 수행한다(604). 이 때, 제 1 차이 오디오 신호에 대한 선형 예측 코딩 계수는 제 603 단계에서 검출된 양자화된 LPC 계수를 이용하여 추출된다.
그 다음, 상기 제 1 차이 오디오 신호에 대한 하모닉 부호화 결과와 입력되는 오디오 신호간의 차이 오디오 신호를 제 2 차이 오디오 신호로 하고, 상기 제 2 차이 오디오 신호를 켈프 모듈(180)에서와 같이 켈프 부호화한다(605). 켈프 부호화 시, 제 2 차이 오디오 신호에 대한 선형 예측 코딩 계수는 제 603 단계에서 검출된 양자화된 LPC계수를 이용하여 추출된다.
603 단계, 604 단계 및 605 단계에서 각각 얻은 복수의 파라미터들을 오디오 신호 복호화를 위해 전송한다(606). 상기 복수의 파라미터들은 양자화된 LPC 계수 인덱스, 양자화된 위상 인덱스, 양자화된 하모닉 인덱스, 양자화된 제 1 이득 인덱스, 양자화된 스토캐스틱 인덱스, 및 양자화된 제 2 이득 인덱스를 포함한다.
도 7은 본 발명의 바람직한 실시 예에 따른 오디오 복호화 방법의 동작 흐름도이다. 도5를 참조하여 설명하면 다음과 같다.
오디오 신호를 복원하기 위한 복수의 파라미터가 수신되면(701), 수신된 복수의 파라미터들을 각각 역양자화한다(702).
702 단계에 의해 얻어진 LPC 계수와 위상 값을 토대로 하모닉 복호화를 도 5의 제 1 하모닉 복호화 모듈(510)과 같이 수행한다(703). 702 단계에 의해 얻어진 LPC 계수와 하모닉 인덱스, 및 제 1 이득 값을 토대로 하모닉 복호화를 도 5의 제 2 하모닉 복호화 모듈(520)과 같이 수행한다(704). 703 단계에서 얻은 1차 하모닉 복호화 결과와 704 단계에서 얻은 2차 하모닉 복호화 결과를 가산한 오디오 신호를 얻는다(705). 상기 702 단계에 의해 얻어진 스토캐스틱 인덱스와 제 2 이득값을 토대로 캘프 복호화를 도 5의 캘프 복호화 모듈(540)과 같이 수행한다(706).
705 단계에서 얻은 가산 결과와 706 단계에서 얻은 캘프 복호화 결과를 가산하여 오디오 신호를 복원한다(707).
본원 발명에 따른 고대역 오디오 부호화 및 복호화 방법을 수행하기 위한 프로그램은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다.
또한 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 상기 사용자 추적 방법을 구현하기 위한 기능적인(function) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.
이제까지 본 발명에 대하여 그 바람직한 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본 질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
상술한 본 발명에 따르면, 2차에 걸쳐 하모닉 분석을 수행함으로써 동일한 비트를 이용하여 더 많은 하모닉을 찾을 수 있다.
입력되는 오디오 신호에 하모닉 포함여부에 따라 하모닉 부호화시 이용되는 비트의 할당을 가변적으로 운영함으로써, CGS(Coarse Granularity Scalability) 기능을 용이하게 지원할 수 있을 뿐 아니라 하모닉 음질을 최적화시킬 수 있다.
또한, 하모닉 부호화를 LPC 계수를 분석하지 않는 하모닉 부호화 후, LPC 계수를 분석하는 하모닉 부호화를 수행한 후, 켈프 부호화를 수행함으로써, 피치 해빙 예측이나 피치 더블링 예측을 방지할 있어 음질 저하를 최소화 할 수 있다.

Claims (25)

  1. 오디오 부호화 장치에 있어서,
    입력되는 오디오 신호의 피치 주기를 이용하여 상기 입력되는 오디오 신호에 대한 하모닉 부호화를 수행하는 제 1 하모닉 부호화 모듈;
    상기 제 1 하모닉 부호화 모듈에서 출력되는 오디오 신호와 상기 입력되는 오디오 신호간의 차이 오디오 신호를 제 1 차이 오디오 신호로 검출하는 제 1 검출기;
    상기 제 1 하모닉 부호화 모듈에서 얻은 양자화된 선형 예측 코딩 계수와 이전의 하모닉 부호화 결과를 이용하여 상기 제 1 차이 오디오 신호를 하모닉 부호화하는 제 2 하모닉 부호화 모듈;
    상기 제 2 하모닉 부호화 모듈에서 출력되는 오디오 신호와 상기 제 1 차이 오디오 신호간의 차이 오디오 신호를 제 2 차이 오디오 신호로 검출하는 제 2 검출기;
    상기 제 1 하모닉 부호화 모듈에서 얻은 양자화된 선형 예측 코딩 계수를 이용하여 상기 제 2 차이 오디오 신호를 켈프 부호화하는 켈프 모듈을 포함하는 오디오 부호화 장치.
  2. 제 1 항에 있어서, 상기 제 1 하모닉 부호화 모듈은 상기 입력되는 오디오 신호의 하모닉의 크기를 선형 예측 코딩 계수로 변환하고, 상기 변환된 선형 예측 코딩 계수를 양자화하고, 상기 양자화된 선형 예측 코딩 계수를 상기 제 2 하모닉 부호화 모듈과 상기 켈프 모듈로 각각 제공하는 것을 특징으로 하는 오디오 부호화 장치.
  3. 제 1 항 또는 제 2 항에 있어서, 상기 제 2 하모닉 부호화 모듈은 상기 양자화된 선형 예측 코딩 계수를 이용하여 제 2 하모닉 부호화에 필요한 양자화된 선형 예측 코딩 계수를 추출하는 것을 특징으로 하는 오디오 부호화 장치.
  4. 제 3 항에 있어서, 상기 켈프 모듈은 상기 양자화된 선형 예측 코딩 계수를 이용하여 상기 켈프 부호화에 필요한 양자화된 선형 예측 코딩 계수를 추출하는 것을 특징으로 하는 오디오 부호화 장치.
  5. 제 1 항에 있어서, 상기 켈프 모듈은 상기 양자화된 선형 예측 코딩 계수를 이용하여 상기 켈프 부호화에 필요한 양자화된 선형 예측 코딩 계수를 추출하는 것을 특징으로 하는 오디오 부호화 장치.
  6. 제 1 항 또는 제 2 항에 있어서, 상기 오디오 부호화 장치는,
    상기 입력되는 오디오 신호가 하모닉을 포함하는 오디오 신호인지 여부에 따라 상기 제 1 하모닉 부호화 모듈, 제 2 하모닉 부호화 모듈 및 켈프 모듈에 대한 비트를 할당하는 비트 할당부를 더 포함하는 오디오 부호화 장치.
  7. 제 6 항에 있어서, 상기 입력되는 오디오 신호가 하모닉을 포함하면, 상기 비트 할당부는 상기 제 1 하모닉 부호화 모듈, 상기 제 2 하모닉 부호화 모듈, 및 상기 켈프 모듈중 상기 켈프 모듈에 가장 작은 비트를 할당하고, 상기 입력되는 오디오 신호가 하모닉을 포함하지 않으면, 상기 제 1 하모닉 부호화 모듈, 상기 제 2 하모닉 부호화 모듈, 및 상기 켈프 모듈중 상기 켈프 모듈에 가장 많은 비트를 할당하는 것을 특징으로 하는 오디오 부호화 장치.
  8. 제 6 항에 있어서, 상기 제 1 하모닉 부호화 모듈은,
    상기 피치 주기를 이용하여 상기 입력되는 오디오 신호의 하모닉을 분석하는 제 1 하모닉 분석부;
    상기 제 1 하모닉 분석부로부터 출력되는 오디오 신호의 크기를 선형 예측 코딩 계수로 변환하는 제 1 변환기;
    상기 비트 할당부로부터 제공되는 할당된 비트 정보를 이용하여 상기 선형 예측 코딩 계수를 양자화하여 상기 양자화된 선형 예측 코딩 계수와 양자화된 선형 예측 계수 인덱스를 출력하는 선형 예측 코딩 계수 양자화기;
    상기 양자화된 선형 예측 코딩 계수를 크기로 변환하여 양자화된 크기 값을 출력하는 제 2 변환기;
    상기 비트 할당부로부터 제공되는 할당된 비트 정보를 토대로 상기 제 1 하모닉 분석부로부터 출력되는 위상을 양자화하여 양자화된 위상과 양자화된 위상 인덱스를 출력하는 위상 양자화기; 및
    상기 양자화된 위상과 상기 제 2 변환기로부터 출력되는 양자화된 크기를 합성하여 상기 입력되는 오디오 신호에 대한 합성된 오디오 신호를 출력하는 제 1 하모닉 합성부를 포함하는 오디오 부호화 장치.
  9. 제 8 항에 있어서, 상기 제 2 하모닉 부호화 모듈은,
    상기 양자화된 선형 예측 코딩 계수를 이용하여 상기 제 1 차이 오디오 신호에 대한 양자화된 선형 예측 코딩 계수를 얻는 선형 예측 코딩 계수 분석기;
    상기 선형 예측 코딩 계수 분석기로부터 제공되는 선형 예측 코딩 계수를 이용하여 상기 제 1 차이 오디오 신호를 역합성 필터링하는 상기 제 1 차이 오디오 신호의 여기신호를 출력하는 역합성 필터;
    상기 여기신호의 하모닉을 분석하는 제 2 하모닉 분석부;
    상기 제 2 하모닉 분석부로부터 출력되는 하모닉 인덱스를 양자화하는 인덱스 양자화기;
    상기 인덱스 양자화기로부터 출력되는 상기 양자화된 하모닉 인덱스를 토대로 하모닉 합성을 수행하는 제 2 하모닉 합성부; 및
    상기 선형 예측 코딩 계수를 토대로 상기 제 2 하모닉 합성부로부터 출력되는 하모닉 합성된 신호를 합성 필터링하여 상기 제 1 차이 오디오 신호에 대한 합성된 오디오 신호를 출력하는 합성 필터를 포함하는 오디오 부호화 장치.
  10. 제 9 항에 있어서, 상기 켈프 모듈은,
    상기 제 2 차이 오디오 신호와 상기 켈프 모듈에 의해 이전에 얻은 합성된 오디오 신호간의 차이 오디오 신호를 검출하는 제 3 검출기;
    상기 제 1 하모닉 부호화 모듈로부터 제공되는 양자화된 선형 예측 코딩 계수에 의해 상기 제 3 검출기로부터 출력되는 신호의 선형 예측 코딩 계수를 추출하는 선형 예측 코딩 계수 분석기;
    상기 선형 예측 코딩 계수 분석기로부터 제공되는 선형 예측 코딩 계수를 이용하여 상기 제 3 검출기로부터 출력되는 차이 오디오 신호를 인지 가중 필터링하는 인지 가중 필터;
    상기 인지 가중 필터로부터 출력되는 신호를 토대로 스토캐스틱 코드북을 탐색하는 스토캐스틱 코드북 탐색기;
    상기 스토캐스틱 코드북 탐색기로부터 제공되는 인덱스를 양자화하여, 양자화된 스토캐스틱 코드북 인덱스 및 양자화된 이득 인덱스를 출력하는 인덱스 양자화기;
    인덱스 양자화기로부터 제공되는 양자화된 스토캐스틱 코드북 인덱스에 대응된 스토캐스틱 코드북을 출력하는 스토캐스틱 코드북;
    상기 인덱스 양자화기로부터 출력되는 양자화된 이득을 상기 스토캐스틱 코드북으로부터 출력되는 스토캐스틱 코드북에 승산하는 승산기; 및
    상기 선형 예측 코딩 계수 분석기로부터 출력되는 선형 예측 코딩 계수에 의해 상기 승산기로부터 출력되는 신호를 합성 필터링하여 상기 제 2 차이 신호에 대 한 합성된 오디오 신호를 얻고, 상기 합성된 오디오 신호를 제 3 검출기로 제공하는 합성 필터를 포함하는 오디오 부호화 장치.
  11. 제 1 항 또는 제 2 항에 있어서, 상기 제 2 하모닉 부호화 모듈은,
    상기 양자화된 선형 예측 코딩 계수를 이용하여 상기 제 1 차이 오디오 신호에 대한 양자화된 선형 예측 코딩 계수를 얻는 선형 예측 코딩 계수 분석기;
    상기 선형 예측 코딩 계수 분석기로부터 제공되는 선형 예측 코딩 계수를 이용하여 상기 제 1 차이 오디오 신호를 역합성 필터링하는 상기 제 1 차이 오디오 신호의 여기신호를 출력하는 역합성 필터;
    상기 여기신호의 하모닉을 분석하는 제 2 하모닉 분석부;
    상기 제 2 하모닉 분석부로부터 출력되는 하모닉 인덱스를 양자화하는 인덱스 양자화기;
    상기 인덱스 양자화기로부터 출력되는 상기 양자화된 하모닉 인덱스를 토대로 하모닉 합성을 수행하는 제 2 하모닉 합성부; 및
    상기 선형 예측 코딩 계수를 토대로 상기 제 2 하모닉 합성부로부터 출력되는 하모닉 합성된 신호를 합성 필터링하여 상기 제 1 차이 오디오 신호에 대한 합성된 오디오 신호를 출력하는 합성 필터를 포함하는 오디오 부호화 장치.
  12. 제 6 항에 있어서, 상기 음성 부호화 장치는,
    상기 입력되는 오디오 신호의 피치를 분석하여 상기 피치 주기를 출력하는 피치 분석부;
    상기 입력되는 오디오 신호에 하모닉이 포함되어 있는지를 판별하고, 판별결과를 상기 비트 할당부로 제공하는 신호 분류부를 더 포함하는 오디오 부호화 장치.
  13. 제 6 항에 있어서, 상기 음성 부호화 장치는,
    상기 입력되는 오디오 신호의 피치를 분석하여 상기 피치 주기를 출력하는 피치 분석부;
    상기 입력되는 오디오 신호에 하모닉이 포함되어 있는지를 판별하고, 판별결과를 상기 비트 할당부로 제공하는 신호 분류부를 더 포함하는 오디오 부호화 장치.
  14. 오디오 복호화 장치에 있어서,
    상기 오디오 신호를 복원하기 위한 복수의 파라미터들을 각각 역양자화하는 역양자화 유니트;
    상기 역양자화 유니트로부터 출력되는 선형 예측 코딩 계수와 위상 값을 이용하여 하모닉 복호화를 수행하는 제 1 하모닉 복호화 모듈;
    상기 역양자화 유니트로부터 출력되는 상기 선형 예측 코딩 계수와 하모닉 인덱스, 및 제 1 이득 값을 토대로 하모닉 복호화를 수행하는 제 2 하모닉 복호화 모듈;
    상기 제 1 하모닉 복호화 모듈에서 출력되는 신호와 상기 제 2 하모닉 복호화 모듈에서 출력되는 신호를 가산하는 제 1 가산기;
    상기 역양자화 유니트로부터 출력되는 스토캐스틱 코드북 인덱스 및 제 2 이득 값을 토대로 켈프 복호화를 수행하는 켈프 복호화 모듈; 및
    상기 제 1 가산기로부터 출력되는 신호와 상기 켈프 복호화 모듈로부터 출력되는 신호를 가산하여 복원된 오디오 신호를 출력하는 제 2 가산기를 포함하는 오디오 복호화 장치.
  15. 제 14 항에 있어서, 상기 제 1 하모닉 복호화 모듈은,
    상기 선형 예측 코딩 계수를 크기로 변환하는 변환기; 및
    상기 위상 값과 상기 변환기로부터 출력되는 크기를 합성하여 하모닉을 포함한 오디오 신호를 상기 제 1 가산기로 출력하는 하모닉 합성부를 포함하는 오디오 복호화 장치.
  16. 제 14 항 또는 제 15 항에 있어서, 상기 제 2 하모닉 복호화 모듈은,
    상기 하모닉 인덱스를 토대로 하모닉 코드를 생성하는 하모닉 코드 생성기;
    상기 하모닉 코드와 상기 제 1 이득값을 승산하는 제 1 승산기; 및
    상기 선형 예측 코딩 계수를 토대로 상기 제 1 승산기로부터 출력되는 신호를 합성 필터링하여 얻어진 합성된 오디오 신호를 상기 제 1 가산기로 제공하는 제 1 합성 필터를 포함하는 오디오 복호화 장치.
  17. 제 16 항에 있어서, 상기 켈프 복호화 모듈은,
    상기 스토캐스틱 인덱스를 토대로 스토캐스틱 코드북을 출력하는 스토캐스틱 코드북;
    상기 제 2 이득 값과 상기 스토캐스틱 코드북을 승산하는 제 2 승산기; 및
    상기 선형 예측 코딩 계수를 토대로 상기 제 2 승산기로부터 출력되는 신호를 합성 필터링하여 얻어진 합성된 오디오 신호를 상기 제 2 가산기로 제공하는 제 2 합성 필터를 포함하는 오디오 복호화 장치.
  18. 제 14 항 또는 제 15 항에 있어서, 상기 켈프 복호화 모듈은,
    상기 스토캐스틱 인덱스를 토대로 스토캐스틱 코드북을 출력하는 스토캐스틱 코드북;
    상기 제 2 이득 값과 상기 스토캐스틱 코드북을 승산하는 제 2 승산기; 및
    상기 선형 예측 코딩 계수를 토대로 상기 제 2 승산기로부터 출력되는 신호를 합성 필터링하여 얻어진 합성된 오디오 신호를 상기 제 2 가산기로 제공하는 제 2 합성 필터를 포함하는 오디오 복호화 장치.
  19. 오디오 부호화 방법에 있어서,
    입력되는 오디오 신호에 대한 선형 예측 코딩 계수 분석 없이 하모닉 부호화하는 단계;
    상기 입력되는 오디오 신호와 상기 하모닉 부호화 결과간의 차이 오디오 신호에 대한 선형 예측 코딩 계수를 분석하면서 상기 차이 오디오 신호에 대한 하모닉 부호화하는 단계;
    상기 차이 오디오 신호에 대한 하모닉 부호화 결과와 상기 입력되는 오디오 신호간의 차이 오디오 신호를 켈프 부호화하는 단계를 포함하는 오디오 부호화 방법.
  20. 제 19 항에 있어서, 상기 하모닉 부호화 단계는,
    상기 입력되는 오디오 신호의 하모닉의 크기를 선형 예측 코딩 계수로 변환하고,
    상기 변환된 선형 예측 코딩 계수를 양자화하는 단계를 더 포함하고,
    상기 차이 오디오 신호에 대한 하모닉 부호화 단계 및 상기 켈프 부호화 단계는 상기 양자화된 선형 예측 코딩 계수를 이용하여 각각의 부호화 시 필요한 선형 예측 코딩 계수를 추출하는 것을 특징으로 하는 오디오 부호화 방법.
  21. 제 19 항 또는 제 20 항에 있어서, 오디오 부호화 방법은,
    상기 입력되는 오디오 신호에 하모닉이 포함되었는지 여부를 판단하여 상기 부호화 단계들에 대한 비트를 할당하는 단계를 더 포함하는 오디오 부호화 방법.
  22. 제 19 항 또는 제 20 항에 있어서, 상기 오디오 부호화 방법은,
    상기 입력되는 오디오 신호의 피치를 분석하여 피치 주기를 얻는 단계를 더 포함하고,
    상기 선형 예측 코딩 계수 분석 없는 하모닉 부호화 단계는 상기 피치 주기를 이용하여 상기 입력되는 오디오 신호에 대한 하모닉 분석을 수행하는 것을 특징으로 하는 오디오 부호화 방법.
  23. 오디오 복호화 방법에 있어서,
    오디오 신호를 복원하기 위한 복수의 파라미터를 역양자화하는 단계;
    상기 역양자화 단계에 의해 얻어진 선형 예측 코딩 계수와 위상 값을 토대로 하모닉 복호화를 수행하는 1차 하모닉 복호화 단계;
    상기 역양자화 단계에 의해 얻어진 선형 예측 코딩 계수와 하모닉 인덱스, 및 제 1 이득 값을 토대로 하모닉 복호화를 수행하는 2차 하모닉 복호화 단계;
    상기 1차 하모닉 복호화 결과와 상기 2차 하모닉 복호화 결과를 가산하는 단계;
    상기 역양자화 단계에 의해 얻어진 스토캐스틱 인덱스와 제 2 이득값을 토대로 캘프 복호화를 수행하는 캘프 복호화 단계; 및
    상기 가산단계에서 얻어진 결과와 상기 캘프 복호화 단계에서 얻어진 결과를 가산하여 복원된 오디오 신호를 얻은 단계를 포함하는 오디오 복호화 방법.
  24. 오디오 부호화 방법을 수행하는 프로그램이 기록된 기록 매체에 있어서,
    상기 오디오 부호화 방법은,
    입력되는 오디오 신호에 대한 선형 예측 코딩 계수 분석 없이 하모닉 부호화하는 단계;
    상기 입력되는 오디오 신호와 상기 하모닉 부호화 결과간의 차이 오디오 신호에 대한 선형 예측 코딩 계수를 분석하면서 상기 차이 오디오 신호에 대한 하모닉 부호화하는 단계;
    상기 차이 오디오 신호에 대한 하모닉 부호화 결과와 상기 입력되는 오디오 신호간의 차이 오디오 신호를 켈프 부호화하는 단계를 포함하는 기록 매체.
  25. 오디오 복호화 방법을 수행하는 프로그램이 저장된 기록 매체에 있어서,
    상기 오디오 복호화 방법은,
    오디오 신호를 복원하기 위한 복수의 파라미터를 역양자화하는 단계;
    상기 역양자화 단계에 의해 얻어진 선형 예측 코딩 계수와 위상 값을 토대로 하모닉 복호화를 수행하는 1차 하모닉 복호화 단계;
    상기 역양자화 단계에 의해 얻어진 선형 예측 코딩 계수와 하모닉 인덱스, 및 제 1 이득 값을 토대로 하모닉 복호화를 수행하는 2차 하모닉 복호화 단계;
    상기 1차 하모닉 복호화 결과와 상기 2차 하모닉 복호화 결과를 가산하는 단계;
    상기 역양자화 단계에 의해 얻어진 스토캐스틱 인덱스와 제 2 이득값을 토대로 캘프 복호화를 수행하는 캘프 복호화 단계; 및
    상기 가산단계에서 얻어진 결과와 상기 캘프 복호화 단계에서 얻어진 결과를 가산하여 복원된 오디오 신호를 얻은 단계를 포함하는 기록 매체.
KR1020050020136A 2005-03-10 2005-03-10 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체 KR100707184B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020050020136A KR100707184B1 (ko) 2005-03-10 2005-03-10 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
US11/333,342 US20060206316A1 (en) 2005-03-10 2006-01-18 Audio coding and decoding apparatuses and methods, and recording mediums storing the methods

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050020136A KR100707184B1 (ko) 2005-03-10 2005-03-10 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체

Publications (2)

Publication Number Publication Date
KR20060099107A KR20060099107A (ko) 2006-09-19
KR100707184B1 true KR100707184B1 (ko) 2007-04-13

Family

ID=36972148

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050020136A KR100707184B1 (ko) 2005-03-10 2005-03-10 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체

Country Status (2)

Country Link
US (1) US20060206316A1 (ko)
KR (1) KR100707184B1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100868763B1 (ko) * 2006-12-04 2008-11-13 삼성전자주식회사 오디오 신호의 중요 주파수 성분 추출 방법 및 장치와 이를이용한 오디오 신호의 부호화/복호화 방법 및 장치
FR2938688A1 (fr) * 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
US8532803B2 (en) * 2009-03-06 2013-09-10 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
GB2474076B (en) * 2009-10-05 2014-03-26 Sonnox Ltd Audio repair methods and apparatus
EP2369861B1 (en) * 2010-03-25 2016-07-27 Nxp B.V. Multi-channel audio signal processing
CN106409300B (zh) * 2014-03-19 2019-12-24 华为技术有限公司 用于信号处理的方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09127991A (ja) * 1995-10-26 1997-05-16 Sony Corp 音声符号化方法及び装置、音声復号化方法及び装置
KR19980042556A (ko) * 1996-11-19 1998-08-17 이데이노브유끼 음성부호화방법, 음성복호화방법, 음성부호화장치, 음성복호화장치, 전화장치, 피치변환방법 및 매체
KR20020022257A (ko) * 2000-09-19 2002-03-27 오길록 캡스트럼 분석을 이용한 하모닉 노이즈 음성 부호화기 및부호화 방법
JP2002366195A (ja) 2001-06-04 2002-12-20 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化パラメータ符号化方法及び装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6188979B1 (en) * 1998-05-28 2001-02-13 Motorola, Inc. Method and apparatus for estimating the fundamental frequency of a signal
US6691082B1 (en) * 1999-08-03 2004-02-10 Lucent Technologies Inc Method and system for sub-band hybrid coding
JP4290917B2 (ja) * 2002-02-08 2009-07-08 株式会社エヌ・ティ・ティ・ドコモ 復号装置、符号化装置、復号方法、及び、符号化方法
DE60214599T2 (de) * 2002-03-12 2007-09-13 Nokia Corp. Skalierbare audiokodierung
US7027980B2 (en) * 2002-03-28 2006-04-11 Motorola, Inc. Method for modeling speech harmonic magnitudes
KR100446242B1 (ko) * 2002-04-30 2004-08-30 엘지전자 주식회사 음성 부호화기에서 하모닉 추정 방법 및 장치
US20060015329A1 (en) * 2004-07-19 2006-01-19 Chu Wai C Apparatus and method for audio coding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09127991A (ja) * 1995-10-26 1997-05-16 Sony Corp 音声符号化方法及び装置、音声復号化方法及び装置
KR19980042556A (ko) * 1996-11-19 1998-08-17 이데이노브유끼 음성부호화방법, 음성복호화방법, 음성부호화장치, 음성복호화장치, 전화장치, 피치변환방법 및 매체
KR20020022257A (ko) * 2000-09-19 2002-03-27 오길록 캡스트럼 분석을 이용한 하모닉 노이즈 음성 부호화기 및부호화 방법
JP2002366195A (ja) 2001-06-04 2002-12-20 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化パラメータ符号化方法及び装置

Also Published As

Publication number Publication date
KR20060099107A (ko) 2006-09-19
US20060206316A1 (en) 2006-09-14

Similar Documents

Publication Publication Date Title
US8548801B2 (en) Adaptive time/frequency-based audio encoding and decoding apparatuses and methods
JP4599558B2 (ja) ピッチ周期等化装置及びピッチ周期等化方法、並びに音声符号化装置、音声復号装置及び音声符号化方法
KR101413968B1 (ko) 오디오 신호의 부호화, 복호화 방법 및 장치
US7599833B2 (en) Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same
KR102626320B1 (ko) 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치
KR20080101873A (ko) 부호화/복호화 장치 및 방법
US20090192789A1 (en) Method and apparatus for encoding/decoding audio signals
KR102593442B1 (ko) 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치
KR20130007485A (ko) 대역폭 확장신호 생성장치 및 방법
JP6763849B2 (ja) スペクトル符号化方法
KR100707184B1 (ko) 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
KR101216098B1 (ko) 신호 처리 방법 및 장치
KR100789368B1 (ko) 잔차 신호 부호화 및 복호화 장치와 그 방법
KR100651712B1 (ko) 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법
KR102052144B1 (ko) 음성 신호의 대역 선택적 양자화 방법 및 장치
KR101413969B1 (ko) 오디오 신호의 복호화 방법 및 장치
KR101377667B1 (ko) 오디오/스피치 신호의 시간 도메인에서의 부호화 방법
KR20080092823A (ko) 부호화/복호화 장치 및 방법
KR20080034818A (ko) 부호화/복호화 장치 및 방법
Matmti et al. Low Bit Rate Speech Coding Using an Improved HSX Model
KR20080034817A (ko) 부호화/복호화 장치 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment
FPAY Annual fee payment
FPAY Annual fee payment

Payment date: 20160330

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee