KR101413967B1 - 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치 - Google Patents

오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치 Download PDF

Info

Publication number
KR101413967B1
KR101413967B1 KR1020080009007A KR20080009007A KR101413967B1 KR 101413967 B1 KR101413967 B1 KR 101413967B1 KR 1020080009007 A KR1020080009007 A KR 1020080009007A KR 20080009007 A KR20080009007 A KR 20080009007A KR 101413967 B1 KR101413967 B1 KR 101413967B1
Authority
KR
South Korea
Prior art keywords
signal
noise
frequency
audio signal
residual
Prior art date
Application number
KR1020080009007A
Other languages
English (en)
Other versions
KR20090083068A (ko
Inventor
이건형
이철우
정종훈
이남숙
문한길
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020080009007A priority Critical patent/KR101413967B1/ko
Priority to US12/362,060 priority patent/US20090192789A1/en
Priority to PCT/KR2009/000433 priority patent/WO2009096715A2/ko
Publication of KR20090083068A publication Critical patent/KR20090083068A/ko
Application granted granted Critical
Publication of KR101413967B1 publication Critical patent/KR101413967B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/093Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models

Abstract

입력 오디오 신호에서 정현파 성분을 제외한 나머지 성분의 신호를 효율적으로 부호화하거나 복호화하는 방법 및 장치가 개시된다. 본 발명에 따른 오디오 신호의 부호화 방법 및 장치는 소정 임계 주파수 이하의 저주파수 신호에 대한 정현파 분석을 수행하여 정현파 신호들을 추출한 다음 입력 오디오 신호에서 정현파 신호를 제외한 나머지 차신호에 대하여 선형 예측 코딩 분석을 이용한 부호화를 수행하는 것을 특징으로 한다.
Figure R1020080009007
정현파, 선형 예측 코딩(LPC)

Description

오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치{ENCODING METHOD AND DECODING METHOD OF AUDIO SIGNAL, AND RECORDING MEDIUM THEREOF, ENCODING APPARATUS AND DECODING APPARATUS OF AUDIO SIGNAL}
본 발명은 오디오 신호를 부호화하거나 복호화하는 방법 및 장치에 관한 것으로, 보다 상세하게는 입력 오디오 신호에서 정현파 성분을 제외한 나머지 차신호를 선형 예측 코딩 분석을 통해 부호화하거나 복호화하는 방법 및 장치에 관한 것이다.
기존의 고음질의 오디오 부호화 장치는 대부분 시간-주파수 변환(Time-Frequency Transform) 부호화 방식을 사용하고 있다. 이 방식은 MDCT(Modified Discrete Cosine Transform)와 같은 변환을 이용하여 입력되는 오디오 신호를 주파수 공간으로 변환하여 얻은 계수를 부호화하는 방식이다. 그러나, 이 부호화 방식은 타겟 비트율(target bit rate)이 낮아질수록 표현되는 음질이 저하되는 단점을 가지고 있어서, 저 비트율로 오디오 신호를 부호화하는 것이 어렵다.
저 비트율로 오디오 신호를 부호화하는 방식으로 파라메트릭(Parametric) 부호화 방식이 알려져 있다. 파라메트릭 부호화 방식에는 HINL(Harmonic and Individual Lines plus Noise), SSC(Sinusoidal Coding) 등이 있다. 이 파라메트 릭 부호화 방식은 원래의 오디오 신호가 특정 성질을 가지는 성분 신호들로 구성된 것으로 모델링하고, 오디오 신호로부터 성분 신호들을 검출한 후, 검출된 성분 신호의 특성을 나타내는 파라미터를 부호화하는 방식이다. 예를 들면, 오디오 신호가 복수 개의 정현파로 구성된 경우, 오디오 신호로부터 정현파들을 검출하고, 검출된 정현파들의 주파수(frequency), 위상(phase) 및 진폭(amplitude)만을 부호화하면, 오디오 신호를 저비트율로 부호화하는 것이 가능하다.
도 1은 일반적인 파라메트릭 오디오 신호의 부호화 장치의 개략적인 블록도이다. 도 1에 도시된 파라메트릭 오디오 신호의 부호화 장치(100)는 오디오 신호를 트랜지언트(Transient) 신호, 정현파(Sinusoidal) 및 노이즈로 구성된 것으로 가정한다. 트랜지언트 부호화부(110)는 입력 오디오 신호에 포함된 트랜지언트 성분들에 대한 파라미터를 추출하여 부호화하고, 정현파 부호화부(120)는 입력 오디오 신호에 포함된 정현파 신호들에 대한 파라미터를 추출하여 부호화하며, 노이즈 부호화부(130)는 입력 오디오 신호에 포함된 노이즈 성분에 대한 파라미터를 추출하여 부호화한다. 추출된 파라미터들은 비트스트림 포맷팅(150)에 의하여 비트 스트림으로 포맷팅된다.
이와 같이 종래 기술에 따른 파라메트릭 오디오 신호의 부호화 장치는 입력 오디오 신호를 정현파와 노이즈 성분으로 부호화하는 한편, 음질의 개선을 위해 부가적으로 트랜지언트 성분을 부호화한다. 그러나, 종래 기술에 따르면 이용가능한 비트레이트가 제한되는 경우, 즉 저비트율로 오디오 신호를 부호화해야 하는 경우에는 심리음향적(Psychoacoustic)으로 사람에게 상대적으로 중요하지 않은 고주파 대역의 정현파 신호에 할당되는 비트량을 줄이게 된다. 이러한 경우 복호화된 고주파수 신호에는 단지 노이즈 성분이나 트랜지언트 성분만이 포함되게 되어 원음에 비해 많은 음질의 손실이 발생한다.
본 발명이 해결하고자 하는 과제는 큰 음질의 손실없이 적은 비트레이트로 오디오 신호에 구비된 정현파 성분의 신호를 제외한 나머지 성분의 신호, 특히 고주파수 성분의 신호를 효율적으로 부호화하거나 복호화하는 방법 및 장치를 제공하는 것이다.
전술한 과제를 해결하기 위한 본 발명에 따른 오디오 신호의 부호화 방법은 상기 오디오 신호에 구비된 소정 임계 주파수 이하의 저주파수 신호에 대한 정현파 분석을 수행하여 정현파 신호들을 추출하는 단계, 상기 오디오 신호에서 상기 정현파 신호들을 제외한 나머지 차신호에 대하여 선형 예측 코딩 분석(Linear Predictive Coding:LPC)을 수행함으로써 상기 차신호의 선형 예측 코딩 계수 및 잔차 신호를 생성하는 단계, 상기 차신호의 잔차 신호의 이득 정보를 추출하는 단계 및 상기 정현파 신호, 상기 차신호의 선형 예측 코딩 계수 및 상기 차신호의 잔차 신호의 이득 정보를 다중화하는 단계를 포함하는 것을 특징으로 한다.
본 발명에 따른 오디오 신호의 부호화 장치는 상기 오디오 신호에 구비된 소정 임계 주파수 이하의 저주파수 신호에 대한 정현파 분석을 수행하여 정현파 신호들을 추출하는 정현파 추출부와, 상기 오디오 신호에서 상기 정현파 신호들을 제외한 나머지 차신호에 대하여 선형 예측 코딩 분석(Linear Predictive Coding:LPC)을 수행함으로써 상기 차신호의 선형 예측 코딩 계수 및 잔차 신호를 생성하는 선형 예측 코딩 분석부와, 상기 차신호의 잔차 신호의 이득 정보를 추출하는 포락선 부호화부 및 상기 정현파 신호, 상기 차신호의 선형 예측 코딩 계수 및 상기 차신호의 잔차 신호의 이득 정보를 다중화부를 포함하는 것을 특징으로 한다.
본 발명에 따른 오디오 신호의 복호화 방법은 비트스트림에 구비된 소정 임계 주파수 이하의 저주파수 신호로부터 추출되어 부호화된 정현파 신호에 대한 복호화를 수행하는 단계, 소정의 랜덤 함수를 이용하여 상기 저주파수 신호의 노이즈를 생성하고 상기 정현파 신호와 결합하여 상기 저주파수 신호를 복호화하는 단계, 상기 복호화된 저주파수 신호를 이용하여 상기 오디오 신호의 고주파수 신호의 잔차 신호를 생성하는 단계, 상기 비트스트림에 구비된 상기 고주파수 신호의 선형 예측 코딩 계수 및 상기 고주파수 신호의 잔차 신호를 이용한 선형 예측 코딩 합성을 수행하여 상기 고주파 신호를 복호화하는 단계 및 상기 복호화된 저주파수 신호와 상기 고주파수 신호를 결합하여 상기 오디오 신호를 복호화하는 단계를 포함하는 것을 특징으로 한다.
본 발명에 따른 오디오 신호의 복호화 장치는 비트스트림에 구비된 소정 임계 주파수 이하의 저주파수 신호로부터 추출되어 부호화된 정현파 신호에 대한 복호화하고, 소정의 랜덤 함수를 이용하여 생성된 상기 저주파수 신호의 노이즈와 상기 정현파 신호와 결합하여 상기 저주파수 신호를 복호화하는 저주파수 신호 복호화부와, 상기 복호화된 저주파수 신호를 이용하여 상기 오디오 신호의 고주파수 신호의 잔차 신호를 생성하는 고주파수 잔차 신호 생성부와, 상기 비트스트림에 구비된 상기 고주파수 신호의 선형 예측 코딩 계수 및 상기 고주파수 신호의 잔차 신호 를 이용한 선형 예측 코딩 합성을 수행하여 상기 고주파 신호를 복호화하는 선형 예측 코딩 합성부 및 상기 복호화된 저주파수 신호와 상기 고주파수 신호를 결합하여 상기 오디오 신호를 복호화하는 결합부를 포함하는 것을 특징으로 한다.
본 발명에 따르면 발생되는 비트량을 감소시키면서 입력 오디오 신호에 구비된 고주파수 성분의 신호에 대한 효율적인 코딩이 가능하다.
이하, 첨부된 도면들을 참조하여 본 발명의 바람직한 실시예에 대하여 구체적으로 설명한다.
본 발명에 따른 오디오 신호의 부호화 방법 및 장치에서는 입력된 오디오 신호로부터 정현파 신호를 추출하여 부호화하고, 입력 오디오 신호에서 정현파 신호를 제외한 나머지 차신호를 선형 예측 코딩(Linear Prediction Coding:LPC)을 이용해서 부호화 및 복호화를 수행하는 방법 및 장치를 제안한다.
도 2는 본 발명에 따른 오디오 신호의 부호화 장치의 일 실시예를 나타낸 블록도이다.
도 2를 참조하면, 본 발명에 따른 오디오 신호의 부호화 장치(200)는 프레임 버퍼(210), 정현파 추출부(220), 감산부(230), 선형 예측 코딩 분석부(240), 포락선 부호화부(250), 톤/노이즈 계산부(260) 및 다중화부(270)를 포함한다.
프레임 버퍼(240)는 입력 오디오 신호를 처리 단위인 소정 길이의 프레임 단위로 분할하여 저장한 다음 출력한다. 정현파 추출부(220)는 입력된 오디오 신호 에 구비된 소정 임계 주파수 이하의 저주파수 신호에 대한 정현파 분석을 수행하여 정현파 신호들을 추출하여 부호화한다. 즉, 정현파 추출부(220)는 소정 임계 주파수 이하의 저주파수 신호에 구비된 정현파 신호들을 추출하여 부호화한다. 정현파 신호는 MP(Matching Pursuit) 또는 FFT(Fast Fourier Transform) 방법을 이용하여 검출될 수 있다.
FFT 방법을 이용한 정현파 검출 방식을 적용하는 경우, 입력되는 저주파수 신호를 FFT한 후 서로 다른 주파수를 갖는 각 정현파의 피크를 찾아서 각 정현파의 크기와 위상을 검출한다. MP 방법을 이용한 정현파 검출 방식은 피치 주기를 이용하여 기본 주파수(fundamental frequency)를 찾고, 소정의 정현파 사전(sinusoidal dictionary)를 이용하여 정현파의 파라미터를 검색한다. 여기서 정현파의 파라미터로는 크기 및 위상 정보가 포함된다. 전술한 FFT 방법 및 MP 방법 이외에도 널리 알려진 다양한 정현파 추출 알고리즘을 이용하여 소정 임계 주파수 이하의 저주파수 신호에 구비된 정현파 신호 성분을 추출할 수 있다.
저주파수 신호로부터 정현파 신호가 추출되면, 감산부(230)는 입력 오디오 신호로부터 추출된 정현파 신호를 빼서 차신호(difference signal)를 생성한다. 여기서, 차신호에는 저주파 노이즈 성분, 고주파 톤(tone), 고주파 노이즈 성분이 포함된다. 본 발명에서는 이와 같은 저주파 정현파 신호를 제외한 나머지 성분의 신호들을 선형 예측 코딩 분석을 통해 모델링하여 부호화함으로써, 종래 구체적으로 부호화되지 않은 상기 성분들을 부호화하여 음질을 향상시킬 수 있다.
이를 위해 선형 예측 코딩 분석부(240)는 차신호에 대하여 선형 예측 코딩 분석을 수행함으로써 차신호의 선형 예측 코딩 계수 및 잔차 신호(residual signal)를 출력한다. 선형 예측 코딩 분석은 음성의 기본적인 파라미터를 음성 발생의 선형적인 모델에 기초하여 추출해내는 방법으로, 현재의 음성 신호 샘플값은 과거 M개(M은 양의 정수)의 음성 출력 샘플 값과의 선형 결합으로 근사할 수 있다는 가정에 기반한 음성 신호 모델링 방식을 말한다. 본 발명에 따른 오디오 신호의 부호화 방법 및 장치에서는 이러한 선형 예측 코딩 분석 방식을 차신호에 적용한다. 선형 예측 코딩 분석부(240)는 공분산 방식(covariance method), 자기 상관 방식(autocorrelation method), 래티스 필터(Lattice filter), 레빈슨-더빈 알고리즘(Levinson-Durbin algorithm) 등을 이용하여 차신호로부터 선형 예측 코딩 계수(LPC 계수) 및 잔차 신호를 추출하여 출력한다.
구체적으로, 본 발명에 따른 선형 예측 코딩 분석부(240)은 현재의 차신호 샘플값을 s(n)은 다음과 같이 그 이전의 p(p는 양의 정수)개의 차신호 샘플들(s(n-1), s(n-2),..., s(n-p))을 이용하여 다음의 수학식 1과 같이 모델링된다고 가정한다.
Figure 112008007425235-pat00001
수학식 1에서 u(n)은 선형 예측 코딩 분석에 따라서 이전의 p개의 차신호 샘플들로부터 현재의 차신호 샘플값을 예측하였을 때의 예측 오차값에 해당하는 것으로 여기 신호(excitation signal) 또는 잔차 신호(residual signal)라고 한다. 이 하, 본 발명을 설명함에 있어서 Gu(n)은 차신호의 잔차 신호로 정의하기로 한다. G는 잔차 신호의 에너지에 따른 이득값(gain)을 의미한다. ai는 선형 예측 코딩 계수(LPC 계수)를 나타내며, p는 선형 예측 코딩 계수의 차수로서 일반적으로 10~16의 값을 갖는다.
수학식 1을 z-변환을 통해 변환하면 다음의 수학식 2와 같다.
Figure 112008007425235-pat00002
수학식 2에서 전달함수 H(z)의 분모 부분을 A(z)로 표시하였다.
한편, 수학식 1로부터 잔차 신호 Gu(n)(또는 e(n))으로 표시함)은 다음의 수학식 3와 같다.
Figure 112008007425235-pat00003
예측 오차에 해당하는 잔차 신호의 전달 함수는 다음의 수학식 4와 같이 표현될 수 있다.
Figure 112008007425235-pat00004
수학식 2와 수학식 4를 고려할 때, 잔차 신호의 전달 함수는 전달 함수 H(z)의 분모 부분에 해당됨을 알 수 있다. 따라서, 선형 예측 코딩 분석을 통해 선형 예측 코딩 계수 ai들을 계산하여 A(z)를 결정하고, A(z)에 고주파수 신호를 입력하여 필터링하면 잔차 신호 Gu(n)이 추출된다.
이와 같이, 선형 예측 코딩 분석부(240)는 차신호에 대하여 선형 예측 코딩 분석을 수행하여 차신호의 예측 신호를 생성하기 위한 선형 예측 코딩 계수 및 예측 에러에 해당하는 잔차 신호를 출력한다.
포락선 부호화부(250)는 잔차 신호로부터 이득값(G)을 추출하여 부호화한다. 구체적으로 포락선 부호화부(250)는 잔차 신호의 시간 포락선을 소정 시간 단위로 분할하고, 분할된 각 구간의 에너지를 이용하여 잔차 신호의 시간 포락선의 진폭 변화를 나타내는 파라미터를 생성한다. 일 예로 포락선 부호화부(250)는 잔차 신호의 분할된 각 구간의 평균 에너지를 계산하고, 이를 잔차 신호의 각 분할된 구간의 진폭을 나타내는 대표값으로 이용할 수 있다.
톤/노이즈 계산부(260)는 부가적인 음질 향상을 위해서 입력 오디오 신호의 전주파수 대역에서 톤과 노이즈 성분 사이의 비율을 계산하고 이를 다중화부(270)로 출력한다.
다중화부(270)는 저주파수 대역의 정현파 신호의 부호화된 데이터, 차신호의 선형 예측 코딩 계수, 이득 정보 및 톤/노이즈 비율 정보 등을 다중화하여 비트스트림을 생성하여 출력한다.
이와 같이 본 발명에 따른 오디오 신호의 부호화 장치에 따르면, 입력 오디오 신호로부터 저주파수 대역의 정현파를 추출하여 부호화한 다음, 입력 오디오 신호에 구비된 나머지 차신호들을 선형 예측 코딩 분석을 통해 부호화함으로써 종래 단순히 노이즈로 간주되어 간략한 파라미터를 통해서만 부호화되었던 저주파수 노이즈, 고주파수의 톤과 노이즈 성분을 효율적으로 코딩할 수 있다.
도 3은 본 발명에 따른 오디오 신호의 부호화 방법을 나타낸 플로우 차트이다.
도 3을 참조하면, 단계 310에서 오디오 신호에 구비된 소정 임계 주파수 이하의 저주파수 신호에 대한 정현파 분석을 수행하여 정현파 신호들을 추출하여 부호화한다.
단계 320에서 정현파 신호들을 제외한 나머지 차신호에 대하여 선형 예측 코딩 분석을 수행함으로써 차신호의 선형 예측 코딩 계수 및 잔차 신호를 생성한다. 여기서, 차신호에는 저주파수 신호의 노이즈 성분, 고주파수 신호의 톤 성분 및 고주파수 신호의 노이즈 성분이 포함된다.
단계 330에서, 선형 예측 코딩 분석 결과 생성된 차신호의 잔차 신호의 이득 정보를 추출한다. 이득 정보로서 잔차 신호의 시간 포락선을 모델링한 파라미터 정보를 이용할 수 있다. 이 경우 잔차 신호의 시간 포락선을 소정 구간으로 분할 하고, 분할된 각 구간의 평균 에너지를 계산하여 계산된 평균 에너지를 잔차 신호의 시간 포락선의 진폭 변화를 나타내는 파라미터로 이용할 수 있다.
단계 340에서 입력 오디오 신호의 톤과 노이즈 사이의 비율(tone to noise ratio)을 계산한다. 구체적으로, 오디오 신호를 주파수 영역으로 변환한 다음, 소정의 주파수 밴드 단위로 톤과 노이즈 성분 사이의 비율을 계산하여 각 주파수 밴드 단위로 톤과 노이즈 성분 사이의 비율을 나타내는 파라미터를 설정할 수 있다. 이러한 톤/노이즈 성분 비율에 대한 파라미터는 비트스트림에 다중화되어, 음질의 향상을 위한 향상 계층 정보로서 이용된다.
단계 350에서, 저주파수 신호로부터 추출된 정현파 신호, 차신호의 선형 예측 코딩 계수, 차신호의 잔차 신호의 이득 정보를 다중화하여 비트스트림을 생성한다.
도 4는 본 발명에 따른 오디오 신호의 복호화 장치의 일 실시예를 나타낸 블록도이다.
도 4를 참조하면, 본 발명에 따른 오디오 신호의 복호화 장치(400)는 역다중화부(410), 저주파수 신호 복호화부(420), 고주파수 잔차 신호 생성부(430) 및 선형 예측 코딩 합성부(440)을 포함한다.
역다중화부(410)는 비트스트림에 대한 역다중화를 수행하여, 부호화된 저주파수 대역의 정현파 신호, 차신호의 선형 예측 코딩 계수 및 이득 정보 등을 추출하여 출력한다.
저주파수 신호 복호화부(420)는 비트스트림으로부터 추출된 저주파수 대역의 정현파 신호를 복호화하고, 소정의 랜덤 함수를 이용하여 저주파수 대역의 노이즈를 생성한 다음, 복호화된 저주파수 대역의 정현파 신호와 노이즈를 결합하여 저주파수 대역의 신호를 복호화하여 출력한다. 구체적으로 도 4의 저주파수 신호 복호화부(420)의 구성을 구체적으로 나타낸 도 5를 참조하면, 저주파수 신호 복호화부(420)는 정현파 신호 복호화부(421), 노이즈 발생부(422), 포락선 조정부(423) 및 저주파수 노이즈 생성부(424)를 포함한다. 정현파 신호 복호화부(421)는 비트스트림에 구비된 저주파수 대역의 정현파 신호들의 주파수 정보, 진폭, 위상 정보 등을 추출하여 저주파수 정현파 신호를 생성하여 출력한다. 노이즈 발생부(422)는 랜덤 함수를 이용하여 랜덤 신호를 발생하고, 포락선 조정부(423)는 비트스트림으로부터 차신호의 잔차 신호의 이득 정보를 추출하고, 추출된 이득 정보를 이용하여 상기 랜덤 신호의 포락선을 조정함으로써 상기 저주파수 신호의 예측 노이즈 신호를 생성한다. 저주파수 노이즈 생성부(424)는 비트스트림으로부터 추출된 선형 예측 코딩 계수와 예측 노이즈 신호를 이용한 선형 예측 코딩 합성을 수행하여 저주파수 대역의 노이즈를 생성한다. 이와 같이 생성된 저주파수 대역의 노이즈와 저주파수 대역의 정현파 신호를 결합되어 저주파수 신호가 복호화된다.
다시 도 4를 참조하면, 고주파수 잔차 신호 생성부(430)는 복호화된 저주파수 신호를 이용하여 고주파수 대역의 잔차 신호를 생성한다. 구체적으로, 도 4의 고주파수 잔차 신호 생성부(430)의 구성을 구체적으로 나타낸 블록도인 도 6을 참조하면, 고주파수 잔차 신호 생성부(430)는 스펙트럴 화이트닝(spectral whitening) 수행부(431), 고주파수 대역 복사부(432), 톤/노이즈 조절부(433) 및 포락선 조정부(434)를 포함한다.
스펙트럴 화이트닝 수행부(431)는 복호화된 저주파수 신호로부터 포락선을 제거하고 남은 잔차 신호를 추출한다. 일 예로, 스펙트럴 화이트닝 수행부(431)는 선형 예측 코딩 분석을 수행하여 복호화된 저주파수 신호의 잔차 신호를 생성할 수 있다. 이 때, 스펙트럴 화이트닝 수행부(431)는 비트스트림으로부터 출력된 선형 예측 코딩 계수의 차수 정보를 이용하여 부호화된 차신호와 동일한 선형 예측 코딩 계수 차수를 적용하여 선형 예측 코딩 분석을 수행하는 것이 바람직하다.
고주파수 대역 복사부(432)는 스펙트럴 화이트닝 수행부(431)에서 출력된 저주파수 신호의 잔차 신호를 소정의 고주파수 대역으로 복사한다. 고주파수 대역 복사부(432)를 통해 저주파수 잔차 신호로부터 복사된 고주파수 신호는 고주파수 대역에 위치한 차신호의 잔차 신호를 예측한 예측 신호에 해당한다.
톤/노이즈 조절부(433)는 비트스트림에 구비된 톤과 노이즈 사이의 비율 정보를 이용하여 고주파수 대역으로 복사된 신호에 톤과 노이즈를 부가한다.
포락선 조정부(434)는 비트스트림으로부터 추출된 이득 정보를 이용하여, 복사된 톤/노이즈 조절부(433)로부터 출력된 신호를 소정 구간으로 분할하고, 각 구간이 비트스트림으로부터 추출된 해당 구간의 이득 정보와 동일하게 되도록 출력 신호의 진폭을 조정한다. 이득 정보로서 각 구간의 평균 에너지를 이용하는 경우, 각 구간의 평균 에너지가 이득 정보에 구비된 해당 구간의 평균 에너지와 일치되도록 신호의 진폭을 조정한다. 이와 같이 복사된 고주파수 신호의 진폭을 이득 정보를 통해 조정하여 시간 포락선을 조정함으로써 고주파수 신호의 잔차 신호가 생성 된다.
다시 도 4를 참조하면, 선형 예측 코딩 합성부(440)는 선형 예측 코딩 분석의 역과정인 선형 예측 코딩 합성을 통해 비트스트림으로부터 추출된 고주파수 신호의 선형 예측 코딩 계수 및 상기 고주파수 잔차 신호 생성부(430)에서 생성된 고주파수 신호의 잔차 신호로부터 고주파수 신호를 복원한다. 한편, 선형 예측 코딩 합성부(440)는 선형 예측 코딩 계수를 라인 스펙트럼 주파수(Line Spectral Frequencies:LSF)로 변환하고, 변환된 라인 스펙트럼 주파수를 보간하여 선형 예측 코딩 합성을 수행하는 것이 바람직하다.
저주파수 신호 복호화부(420)에 의하여 복원된 저주파수 신호와 선형 예측 코딩 합성부(440)를 통해 복원된 고주파수 신호를 결합하여 오디오 신호가 복원된다.
도 7은 본 발명에 따른 오디오 신호의 복호화 방법을 나타낸 플로우 차트이다.
도 7을 참조하면, 단계 710에서 비트스트림에 구비된 소정 임계 주파수 이하의 저주파수 신호로부터 추출되어 부호화된 정현파 신호에 대한 복호화를 수행한다.
단계 720에서 소정의 랜덤 함수를 이용하여 저주파수 신호의 노이즈를 생성하고 복호화된 정현파 신호와 결합하여 저주파수 신호를 복호화한다. 전술한 바와 같이, 저주파수 신호의 노이즈는 랜덤 함수를 이용하여 랜덤 신호를 생성한 다음, 차신호의 잔차 신호의 이득 정보를 이용하여 랜덤 신호의 포락선을 조정함으로써 저주파수 신호의 예측 노이즈 신호를 생성한 다음, 비트스트림으로부터 추출된 선형 예측 코딩 계수 및 예측 노이즈 신호를 이용한 선형 예측 코딩 합성을 수행하여 생성될 수 있다.
단계 730에서 복호화된 저주파수 신호를 이용하여 오디오 신호의 고주파수 신호의 잔차 신호를 생성한다. 전술한 바와 같이, 고주파수 신호의 잔차 신호는 복호화된 저주파수 신호에 대한 스펙트럴 화이트닝을 수행하여 생성된 저주파수 신호의 잔차 신호를 소정의 고주파수 대역으로 복사한 다음, 비트스트림에 구비된 톤과 노이즈 사이의 비율 정보를 이용하여 복사된 신호에 톤과 노이즈를 부가하고, 비트스트림에 구비된 고주파수 신호의 이득 정보를 이용하여 복사된 신호의 포락선을 조정함으로써 생성될 수 있다.
단계 740에서 비트스트림에 구비된 고주파수 신호의 선형 예측 코딩 계수 및 고주파수 신호의 잔차 신호를 이용한 선형 예측 코딩 합성을 수행하여 고주파 신호를 복호화한다.
단계 750에서 복호화된 저주파수 신호와 복호화된 고주파수 신호를 결합하여 오디오 신호를 복호화한다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명이 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 사상은 아래에 기재된 특허청구범위에 의해서만 파악되어야 하 고, 이와 균등하거나 또는 등가적인 변형 모두는 본 발명 사상의 범주에 속한다 할 것이다. 또한, 본 발명에 따른 시스템은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
도 1은 일반적인 파라메트릭 오디오 신호의 부호화 장치의 개략적인 블록도이다.
도 2는 본 발명에 따른 오디오 신호의 부호화 장치의 일 실시예를 나타낸 블록도이다.
도 3은 본 발명에 따른 오디오 신호의 부호화 방법을 나타낸 플로우 차트이다.
도 4는 본 발명에 따른 오디오 신호의 복호화 장치의 일 실시예를 나타낸 블록도이다.
도 5는 도 4의 저주파수 신호 복호화부(420)의 구성을 구체적으로 나타낸 블록도이다.
도 6은 도 4의 고주파수 잔차 신호 생성부(430)의 구성을 구체적으로 나타낸 블록도이다.
도 7은 본 발명에 따른 오디오 신호의 복호화 방법을 나타낸 플로우 차트이다.

Claims (20)

  1. 오디오 신호에 구비된 소정 임계 주파수 이하의 저주파수 신호에 대한 정현파 분석을 수행하여 정현파 신호들을 추출하는 단계;
    상기 오디오 신호에서 상기 정현파 신호들을 제외한 나머지 차신호에 대하여 선형 예측 코딩(Linear Predictive Coding:LPC) 분석을 수행함으로써 상기 차신호의 선형 예측 코딩 계수 및 잔차 신호를 생성하는 단계;
    상기 차신호의 잔차 신호의 이득 정보를 추출하는 단계; 및
    상기 정현파 신호, 상기 차신호의 선형 예측 코딩 계수 및 상기 차신호의 잔차 신호의 이득 정보를 다중화하는 단계를 포함하고,
    상기 차신호는 상기 저주파수 신호의 노이즈 성분, 상기 오디오 신호에 구비된 고주파수 신호의 톤 성분 및 상기 고주파수 신호의 노이즈 성분을 포함하는 것을 특징으로 하는 오디오 신호의 부호화 방법.
  2. 삭제
  3. 제 1항에 있어서,
    상기 다중화하는 단계는,
    상기 오디오 신호의 톤과 노이즈 성분 사이의 비율을 계산하는 단계; 및
    상기 톤과 노이즈 성분 사이의 비율을 상기 다중화 결과 생성된 비트스트림에 부가하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호의 부호화 방법.
  4. 제 3항에 있어서,
    상기 오디오 신호의 톤과 노이즈 성분 사이의 비율을 계산하는 단계는
    상기 오디오 신호를 주파수 영역으로 변환하는 단계; 및
    상기 주파수 영역으로 변환된 오디오 신호의 주파수 밴드 단위로 상기 톤과 노이즈 성분 비율을 계산하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호의 부호화 방법.
  5. 제 1항에 있어서,
    상기 이득 정보는 상기 잔차신호의 시간 포락선을 모델링한 파라미터 정보인 것을 특징으로 하는 오디오 신호의 부호화 방법.
  6. 제 1항에 있어서,
    상기 차신호의 잔차 신호의 이득 정보를 추출하는 단계는
    상기 잔차 신호의 시간 포락선을 소정 구간으로 분할하는 단계; 및
    상기 분할된 각 구간의 에너지를 이용하여 상기 잔차 신호의 시간 포락선의 진폭 변화를 나타내는 파라미터를 생성하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호의 부호화 방법.
  7. 오디오 신호에 구비된 소정 임계 주파수 이하의 저주파수 신호에 대한 정현파 분석을 수행하여 정현파 신호들을 추출하는 정현파 추출부(220);
    상기 오디오 신호에서 상기 정현파 신호들을 제외한 나머지 차신호에 대하여 선형 예측 코딩(Linear Predictive Coding:LPC) 분석을 수행함으로써 상기 차신호의 선형 예측 코딩 계수 및 잔차 신호를 생성하는 선형 예측 코딩 분석부(240);
    상기 차신호의 잔차 신호의 이득 정보를 추출하는 포락선 부호화부(250); 및
    상기 정현파 신호, 상기 차신호의 선형 예측 코딩 계수 및 상기 차신호의 잔차 신호의 이득 정보를 다중화하는 다중화부(270)를 포함하고,
    상기 차신호는 상기 저주파수 신호의 노이즈 성분, 상기 오디오 신호에 구비된 고주파수 신호의 톤 성분 및 상기 고주파수 신호의 노이즈 성분을 포함하는 것을 특징으로 하는 오디오 신호의 부호화 장치.
  8. 삭제
  9. 제 7항에 있어서,
    상기 오디오 신호의 톤과 노이즈 성분 사이의 비율을 계산하는 톤/노이즈 계산부(260)를 더 포함하는 것을 특징으로 하는 오디오 신호의 부호화 장치.
  10. 제 9항에 있어서,
    상기 톤/노이즈 계산부(260)는 상기 오디오 신호를 주파수 영역으로 변환하고, 상기 주파수 영역으로 변환된 오디오 신호의 주파수 밴드 단위로 상기 톤과 노이즈 성분 비율을 계산하는 것을 특징으로 하는 오디오 신호의 부호화 장치.
  11. 제 7항에 있어서,
    상기 이득 정보는 상기 잔차신호의 시간 포락선을 모델링한 파라미터 정보인 것을 특징으로 하는 오디오 신호의 부호화 장치.
  12. 제 7항에 있어서,
    상기 포락선 부호화부(250)는 상기 잔차 신호의 시간 포락선을 소정 구간으로 분할하고, 상기 분할된 각 구간의 에너지를 이용하여 상기 잔차 신호의 시간 포락선의 진폭 변화를 나타내는 파라미터를 생성하는 것을 특징으로 하는 오디오 신호의 부호화 장치.
  13. 오디오 신호의 복호화 방법에 있어서,
    비트스트림에 구비된 소정 임계 주파수 이하의 저주파수 신호로부터 추출되어 부호화된 정현파 신호에 대한 복호화를 수행하는 단계;
    소정의 랜덤 함수를 이용하여 상기 저주파수 신호의 노이즈를 생성하고 상기 정현파 신호와 결합하여 상기 저주파수 신호를 복호화하는 단계;
    상기 복호화된 저주파수 신호를 이용하여 상기 오디오 신호의 고주파수 신호의 잔차 신호를 생성하는 단계;
    상기 비트스트림에 구비된 상기 고주파수 신호의 선형 예측 코딩 계수 및 상기 고주파수 신호의 잔차 신호를 이용한 선형 예측 코딩 합성을 수행하여 상기 고주파 신호를 복호화하는 단계; 및
    상기 복호화된 저주파수 신호와 상기 고주파수 신호를 결합하여 상기 오디오 신호를 복호화하는 단계를 포함하는 것을 특징으로 하는 오디오 신호의 복호화 방법.
  14. 제 13항에 있어서,
    상기 저주파수 신호의 노이즈를 생성하는 단계는
    상기 랜덤 함수를 이용하여 랜덤 신호를 생성하는 단계;
    상기 비트스트림으로부터 상기 오디오 신호와 상기 정현파 신호의 차이인 차신호의 잔차 신호의 이득 정보를 추출하고, 추출된 이득 정보를 이용하여 상기 랜덤 신호의 포락선을 조정함으로써 상기 저주파수 신호의 예측 노이즈 신호를 생성하는 단계; 및
    상기 비트스트림으로부터 추출된 상기 선형 예측 코딩 계수 및 상기 예측 노이즈 신호를 이용한 선형 예측 코딩 합성을 수행하여 상기 저주파수 신호의 노이즈를 생성하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호의 복호화 방법.
  15. 제 13항에 있어서,
    상기 오디오 신호의 고주파수 신호의 잔차 신호를 생성하는 단계는
    상기 복호화된 저주파수 신호에 대한 스펙트럴 화이트닝(spectral whitening)을 수행하여 상기 복호화된 저주파수 신호의 잔차 신호를 생성하는 단계;
    상기 저주파수 신호의 잔차 신호를 소정의 고주파수 대역으로 복사하는 단계;
    상기 비트스트림에 구비된 톤과 노이즈 사이의 비율 정보를 이용하여 상기 고주파수 대역으로 복사된 신호에 톤과 노이즈를 부가하는 단계; 및
    상기 비트스트림에 구비된 상기 고주파수 신호의 이득 정보를 이용하여 상기 고주파수 대역으로 복사된 신호의 포락선을 조정하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호의 복호화 방법.
  16. 오디오 신호의 복호화 장치에 있어서,
    비트스트림에 구비된 소정 임계 주파수 이하의 저주파수 신호로부터 추출되어 부호화된 정현파 신호에 대한 복호화하고, 소정의 랜덤 함수를 이용하여 생성된 상기 저주파수 신호의 노이즈와 상기 정현파 신호와 결합하여 상기 저주파수 신호를 복호화하는 저주파수 신호 복호화부(420);
    상기 복호화된 저주파수 신호를 이용하여 상기 오디오 신호의 고주파수 신호의 잔차 신호를 생성하는 고주파수 잔차 신호 생성부(430);
    상기 비트스트림에 구비된 상기 고주파수 신호의 선형 예측 코딩 계수 및 상기 고주파수 신호의 잔차 신호를 이용한 선형 예측 코딩 합성을 수행하여 상기 고주파 신호를 복호화하는 선형 예측 코딩 합성부(440); 및
    상기 복호화된 저주파수 신호와 상기 고주파수 신호를 결합하여 상기 오디오 신호를 복호화하는 결합부를 포함하는 것을 특징으로 하는 오디오 신호의 복호화 장치.
  17. 제 16항에 있어서,
    상기 저주파수 신호 복호화부(420)는
    상기 정현파 신호를 복호화하는 정현파 신호 복호화부(421);
    상기 랜덤 함수를 이용하여 랜덤 신호를 생성하는 노이즈 발생부(422);
    상기 비트스트림으로부터 상기 오디오 신호와 상기 정현파 신호의 차이인 차신호의 잔차 신호의 이득 정보를 추출하고, 추출된 이득 정보를 이용하여 상기 랜덤 신호의 포락선을 조정함으로써 상기 저주파수 신호의 예측 노이즈 신호를 생성하는 포락선 조정부(423); 및
    상기 비트스트림으로부터 추출된 선형 예측 코딩 계수와 상기 예측 노이즈 신호를 이용한 선형 예측 코딩 합성을 수행하여 상기 저주파수 신호의 노이즈를 생성하는 저주파수 노이즈 생성부(424)를 더 포함하는 것을 특징으로 하는 오디오 신호의 복호화 장치.
  18. 제 16항에 있어서,
    상기 고주파 잔차 신호 생성부(430)는
    상기 복호화된 저주파수 신호에 대한 스펙트럴 화이트닝(spectral whitening)을 수행하여 상기 복호화된 저주파수 신호의 잔차 신호를 생성하는 스펙트럴 화이트닝 수행부(431);
    상기 저주파수 신호의 잔차 신호를 소정의 고주파수 대역으로 복사하는 고주파수 대역 복사부(432);
    상기 비트스트림에 구비된 톤과 노이즈 사이의 비율 정보를 이용하여 상기 고주파수 대역으로 복사된 신호에 톤과 노이즈를 부가하는 톤/노이즈 조절부(433); 및
    상기 비트스트림에 구비된 상기 고주파수 신호의 이득 정보를 이용하여 상기 고주파수 대역으로 복사된 신호의 포락선을 조정하는 포락선 조정부(434)를 더 포함하는 것을 특징으로 하는 오디오 신호의 복호화 장치.
  19. 제1항과, 제3항 내지 제6항 중 어느 한 항에 기재된 오디오 신호의 부호화 방법을 구현하기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체.
  20. 제13항 내지 제15항 중 어느 한 항에 기재된 오디오 신호의 복호화 방법을 구현하기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체.
KR1020080009007A 2008-01-29 2008-01-29 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치 KR101413967B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020080009007A KR101413967B1 (ko) 2008-01-29 2008-01-29 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
US12/362,060 US20090192789A1 (en) 2008-01-29 2009-01-29 Method and apparatus for encoding/decoding audio signals
PCT/KR2009/000433 WO2009096715A2 (ko) 2008-01-29 2009-01-29 오디오 신호의 부호화, 복호화 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080009007A KR101413967B1 (ko) 2008-01-29 2008-01-29 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치

Publications (2)

Publication Number Publication Date
KR20090083068A KR20090083068A (ko) 2009-08-03
KR101413967B1 true KR101413967B1 (ko) 2014-07-01

Family

ID=40900106

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080009007A KR101413967B1 (ko) 2008-01-29 2008-01-29 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치

Country Status (3)

Country Link
US (1) US20090192789A1 (ko)
KR (1) KR101413967B1 (ko)
WO (1) WO2009096715A2 (ko)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
KR20110018107A (ko) * 2009-08-17 2011-02-23 삼성전자주식회사 레지듀얼 신호 인코딩 및 디코딩 방법 및 장치
US8781844B2 (en) * 2009-09-25 2014-07-15 Nokia Corporation Audio coding
MY165328A (en) 2009-09-29 2018-03-21 Fraunhofer Ges Forschung Audio signal decoder, audio signal encoder, method for providing an upmix signal representation, method for providing a downmix signal representation, computer program and bitstream using a common inter-object-correlation parameter value
PL2800094T3 (pl) * 2009-10-21 2018-03-30 Dolby International Ab Nadpróbkowanie w banku filtrów z połączonym modułem transpozycji
WO2012144128A1 (ja) * 2011-04-20 2012-10-26 パナソニック株式会社 音声音響符号化装置、音声音響復号装置、およびこれらの方法
US8941955B2 (en) * 2011-06-29 2015-01-27 Hamilton Sundstrand Corporation Overvoltage prevention in an aircraft electrical power generation system
CN103581603B (zh) * 2012-07-24 2017-06-27 联想(北京)有限公司 一种多媒体数据的传输方法及电子设备
US10467197B2 (en) 2013-04-22 2019-11-05 Bacula Systems Sa Creating a universally deduplicatable archive volume
CN107818789B (zh) * 2013-07-16 2020-11-17 华为技术有限公司 解码方法和解码装置
EP2830054A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
CN108172239B (zh) * 2013-09-26 2021-01-12 华为技术有限公司 频带扩展的方法及装置
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19980042556A (ko) * 1996-11-19 1998-08-17 이데이노브유끼 음성부호화방법, 음성복호화방법, 음성부호화장치, 음성복호화장치, 전화장치, 피치변환방법 및 매체
WO2005122146A1 (en) 2004-06-08 2005-12-22 Koninklijke Philips Electronics N.V. Audio encoding
WO2006051451A1 (en) 2004-11-09 2006-05-18 Koninklijke Philips Electronics N.V. Audio coding and decoding
US20070106505A1 (en) * 2003-12-01 2007-05-10 Koninkijkle Phillips Electronics N.V. Audio coding

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5504833A (en) * 1991-08-22 1996-04-02 George; E. Bryan Speech approximation using successive sinusoidal overlap-add models and pitch-scale modifications
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JPH10149199A (ja) * 1996-11-19 1998-06-02 Sony Corp 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体
US5886276A (en) * 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
US5963897A (en) * 1998-02-27 1999-10-05 Lernout & Hauspie Speech Products N.V. Apparatus and method for hybrid excited linear prediction speech encoding
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
JP4438127B2 (ja) * 1999-06-18 2010-03-24 ソニー株式会社 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体
US7110953B1 (en) * 2000-06-02 2006-09-19 Agere Systems Inc. Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction
EP1701340B1 (en) * 2001-11-14 2012-08-29 Panasonic Corporation Decoding device, method and program
DE60212696T2 (de) * 2001-11-23 2007-02-22 Koninklijke Philips Electronics N.V. Bandbreitenvergrösserung für audiosignale
EP1570463A1 (en) * 2002-11-27 2005-09-07 Koninklijke Philips Electronics N.V. Sinusoidal audio coding
AU2003295178A1 (en) * 2002-12-19 2004-07-14 Koninklijke Philips Electronics N.V. Sinusoid selection in audio encoding
RU2244386C2 (ru) * 2003-03-28 2005-01-10 Корпорация "Самсунг Электроникс" Способ восстановления высокочастотной составляющей аудиосигнала и устройство для его реализации
KR100587953B1 (ko) * 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
US20060015329A1 (en) * 2004-07-19 2006-01-19 Chu Wai C Apparatus and method for audio coding
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
WO2006107833A1 (en) * 2005-04-01 2006-10-12 Qualcomm Incorporated Method and apparatus for vector quantizing of a spectral envelope representation
US9043214B2 (en) * 2005-04-22 2015-05-26 Qualcomm Incorporated Systems, methods, and apparatus for gain factor attenuation
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19980042556A (ko) * 1996-11-19 1998-08-17 이데이노브유끼 음성부호화방법, 음성복호화방법, 음성부호화장치, 음성복호화장치, 전화장치, 피치변환방법 및 매체
US20070106505A1 (en) * 2003-12-01 2007-05-10 Koninkijkle Phillips Electronics N.V. Audio coding
WO2005122146A1 (en) 2004-06-08 2005-12-22 Koninklijke Philips Electronics N.V. Audio encoding
WO2006051451A1 (en) 2004-11-09 2006-05-18 Koninklijke Philips Electronics N.V. Audio coding and decoding

Also Published As

Publication number Publication date
WO2009096715A3 (ko) 2009-09-24
KR20090083068A (ko) 2009-08-03
US20090192789A1 (en) 2009-07-30
WO2009096715A2 (ko) 2009-08-06

Similar Documents

Publication Publication Date Title
KR101413967B1 (ko) 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
KR101413968B1 (ko) 오디오 신호의 부호화, 복호화 방법 및 장치
KR101373004B1 (ko) 고주파수 신호 부호화 및 복호화 장치 및 방법
KR101747918B1 (ko) 고주파수 신호 복호화 방법 및 장치
KR100958144B1 (ko) 오디오 압축
JP5628163B2 (ja) 帯域幅拡張出力データを生成するための装置および方法
JP6170520B2 (ja) オーディオ及び/またはスピーチ信号符号化及び/または復号化方法及び装置
US10984810B2 (en) Noise filling without side information for CELP-like coders
KR20100086000A (ko) 오디오 신호 처리 방법 및 장치
KR101375582B1 (ko) 대역폭 확장 부호화 및 복호화 방법 및 장치
KR101411900B1 (ko) 오디오 신호의 부호화 및 복호화 방법 및 장치
KR20090083070A (ko) 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치
KR101792712B1 (ko) 주파수 도메인 내의 선형 예측 코딩 기반 코딩을 위한 저주파수 강조
US20120296659A1 (en) Encoding device, decoding device, spectrum fluctuation calculation method, and spectrum amplitude adjustment method
JP6526091B2 (ja) 低複雑度の調性適応音声信号量子化
JP6042900B2 (ja) 音声信号の帯域選択的量子化方法及び装置
KR101413969B1 (ko) 오디오 신호의 복호화 방법 및 장치
KR20080034819A (ko) 부호화/복호화 장치 및 방법
KR101352608B1 (ko) 음성 신호의 대역폭 확장 방법 및 그 장치
KR20100006491A (ko) 무성음 부호화 및 복호화 방법 및 장치
KR20080092823A (ko) 부호화/복호화 장치 및 방법
JP2007505346A (ja) 遷移のオーディオ信号成分の符号化
KR20080034817A (ko) 부호화/복호화 장치 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E902 Notification of reason for refusal
E601 Decision to refuse application
AMND Amendment
J201 Request for trial against refusal decision
E902 Notification of reason for refusal
B701 Decision to grant
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee