KR101413968B1 - 오디오 신호의 부호화, 복호화 방법 및 장치 - Google Patents

오디오 신호의 부호화, 복호화 방법 및 장치 Download PDF

Info

Publication number
KR101413968B1
KR101413968B1 KR1020080009008A KR20080009008A KR101413968B1 KR 101413968 B1 KR101413968 B1 KR 101413968B1 KR 1020080009008 A KR1020080009008 A KR 1020080009008A KR 20080009008 A KR20080009008 A KR 20080009008A KR 101413968 B1 KR101413968 B1 KR 101413968B1
Authority
KR
South Korea
Prior art keywords
signal
frequency signal
high frequency
residual signal
lpc
Prior art date
Application number
KR1020080009008A
Other languages
English (en)
Other versions
KR20090083069A (ko
Inventor
이건형
이철우
정종훈
이남숙
문한길
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020080009008A priority Critical patent/KR101413968B1/ko
Priority to PCT/KR2009/000435 priority patent/WO2009096717A2/ko
Priority to US12/361,999 priority patent/US20090192792A1/en
Publication of KR20090083069A publication Critical patent/KR20090083069A/ko
Application granted granted Critical
Publication of KR101413968B1 publication Critical patent/KR101413968B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Abstract

오디오 신호 중 소정 임계 주파수 이상의 고주파수 대역의 신호를 보다 효율적으로 부호화하거나 복호화하는 방법 및 장치가 개시된다. 본 발명에 따른 오디오 신호의 부호화 방법 및 장치는 고주파수 신호에 대한 선형 예측 코딩 분석을 통해 생성된 선형 예측 코딩 계수 및 잔차 신호의 이득 정보를 부호화함으로써 적은 비트를 이용하면서도 향상된 음질을 갖도록 고주파수 신호를 부호화한다.
Figure R1020080009008
오디오, SBR, LPC

Description

오디오 신호의 부호화, 복호화 방법 및 장치{Method and apparatus for encoding audio signal, and method and apparatus for decoding audio signal}
본 발명은 오디오 신호를 부호화하거나 복호화하는 방법 및 장치에 관한 것으로, 보다 상세하게는 오디오 신호 중 소정 크로스 오버 주파수 이상의 고주파수 대역의 신호를 보다 효율적으로 부호화하거나 복호화하는 방법 및 장치에 관한 것이다.
오디오 신호 중에서 고주파수 신호는 저주파수 신호에 비하여 인간의 심리음향적인(Psychoacoustic) 특성상 상대적으로 덜 중요하다. 따라서, 오디오 신호를 부호화할 때 이용가능한 비트량의 한계를 극복하면서 코딩 효율을 향상시키기 위해서, 저주파수 신호에 많은 비트를 할당하고 고주파수 신호에는 적은 비트를 할당하여 부호화를 수행하는 방식이 도입되었다. 이러한 방식의 일 예로 SBR(Spectral Band Replication)이 있다.
도 1은 종래 기술에 따른 SBR을 설명하기 위한 참조도이다.
SBR은 오디오 신호의 고주파수 신호와 저주파수 신호 사이에 높은 연관성이 존재한다는 가정에 기반을 둔다. 따라서, SBR에 따르면 이러한 연관성을 이용하여 저주파 대역의 정보를 이용해 고주파 대역 성분을 추정할 수 있다고 가정하여, 저주파수 신호는 소정의 코어 코덱으로 부호화하고 고주파수 신호는 저주파수 신호로부터 추정할 때 필요한 부가 정보만을 부호화한다. 여기서, 코어 코덱으로는 mp3, AAC(Advanced Audio Coding)에 기반한 코덱이 이용되며, 고주파수 신호의 복원을 위해 이용되는 부가 정보로는 저주파수 신호를 복사할 고주파수 신호의 대역 정보 등이 포함된다.
도 1을 참조하면, 부호화기에서는 오디오 신호에 포함된 소정의 크로스 오버 주파수(fc) 이하의 저주파수 신호 A(10)는 코어 코덱을 이용하여 부호화하고, 크로스 오버 주파수(fc) 이상의 고주파수 신호 B(11)는 직접 부호화하지 않고 저주파수 신호로부터 추정될 때 필요한 부가 정보만을 부호화한다.
복호화기에서는 이러한 SBR 방식에 의하여 부호화된 비트스트림을 수신하고, 코어 코덱을 이용하여 저주파수 신호 A'(20)를 복원하며, 복원된 저주파수 신호 A'(20)를 고주파수 대역으로 복사한 후 비트스트림에 구비된 부가 정보를 이용하여 복사된 고주파수 대역의 신호를 조정함으로써 고주파수 신호 B'(21)을 생성한다.
이러한 SBR과 같이 저주파수 신호로부터 고주파수 신호를 추정하여 부호화하는 방식은 저주파수 신호의 하모닉스(harmonics)가 고주파수 신호에 비해서 강하거나, 저주파수 신호의 주파수 대역별 에너지의 편차가 심한 경우에는 음질이 열화되는 문제점이 있다.
그러므로 고주파수 영역에 해당하는 신호를 부호화함에 있어서 적은 비트를 이용하고도 인간이 인식하는 음질을 최대한 향상시킬 수 있는 방법 및 장치가 요구 된다.
본 발명이 해결하고자 하는 과제는 큰 음질의 손실없이 적은 비트레이트로 오디오 신호의 고주파수 성분을 효율적으로 부호화하거나 복호화하는 방법 및 장치를 제공하는 것이다.
전술한 과제를 해결하기 위한 본 발명에 따른 오디오 신호의 부호화 방법은 상기 오디오 신호에 구비된 소정 임계 주파수 이상의 고주파수 신호에 대하여 선형 예측 코딩(Linear Predictive Coding:LPC) 분석을 수행함으로써 상기 고주파수 신호의 선형 예측 코딩 계수 및 잔차 신호를 출력하는 단계, 상기 잔차 신호의 진폭 변화를 나타내는 이득 정보를 추출하는 단계 및 상기 고주파수 신호의 선형 예측 코딩 계수 및 상기 잔차 신호의 이득 정보를 다중화하는 단계를 포함하는 것을 특징으로 한다.
본 발명에 따른 오디오 신호의 부호화 장치는 상기 오디오 신호에 구비된 소정 임계 주파수 이상의 고주파수 신호에 대하여 선형 예측 코딩(Linear Predictive Coding:LPC) 분석을 수행함으로써 상기 고주파수 신호의 선형 예측 코딩 계수 및 잔차 신호를 출력하는 선형 예측 코딩 분석부, 상기 잔차 신호의 진폭 변화를 나타내는 이득 정보를 추출하는 이득 정보 추출부 및 상기 고주파수 신호의 선형 예측 코딩 계수 및 상기 잔차 신호의 이득 정보를 다중화하는 다중화부를 포함하는 것을 특징으로 한다.
본 발명에 따른 오디오 신호의 복호화 방법은 소정의 코어 디코더를 이용하여 상기 오디오 신호의 저주파수 신호에 대한 복호화를 수행하는 단계, 상기 복호화된 저주파 신호를 이용하여 상기 오디오 신호의 고주파수 신호의 잔차 신호를 생성하는 단계, 비트스트림에 구비된 상기 고주파수 신호의 선형 예측 코딩 계수 및 상기 잔차 신호를 이용한 선형 예측 코딩 합성을 수행하여 상기 고주파수 신호를 복호화하는 단계 및 상기 복호화된 저주파 신호와 고주파 신호를 결합하여 상기 오디오 신호를 복원하는 단계를 포함하는 것을 특징으로 한다.
본 발명에 따르면 선형 예측 코딩 분석을 이용하여 고주파수 신호에 대한 부호화를 수행함으로써 발생되는 비트량을 상대적으로 감소시키면서 고주파수 신호에 대한 음질의 열화를 방지할 수 있다.
이하, 첨부된 도면들을 참조하여 본 발명의 바람직한 실시예에 대하여 구체적으로 설명한다.
본 발명에서는 종래 SBR과 같이 저주파 신호를 기반으로 고주파수 신호를 복사함으로써 고주파수 신호를 생성하는 대신에, 선형 예측 코딩(Linear Prediction Coding:LPC)을 이용해서 고주파수 신호의 부호화 및 복호화를 수행하는 방법 및 장치를 제안한다.
도 2는 본 발명에 따른 오디오 신호의 부호화 장치의 일 실시예를 나타낸 블록도이다.
도 2를 참조하면, 본 발명에 따른 오디오 신호의 부호화 장치(200)는 필터부(210), 코어 코더(220), 감산부(230), 선형 예측 코딩 분석부(240), 이득 정보 추출부(250), 양자화부(260) 및 다중화부(270)를 포함한다.
필터부(210)는 입력된 오디오 신호를 소정의 크로스 오버 주파수(임계 주파수)를 기준으로 하여 저주파수 신호와 고주파수 신호로 분할한다. 코어 코더(220)는 소정의 크로스 오버 주파수 이하의 저주파수 신호를 코어 코덱을 이용하여 부호화한다. 여기서, 코어 코덱으로는 MP3, AAC 등의 다양한 오디오 압축 코덱이 이용될 수 있다.
선형 예측 코딩 분석부(240)는 오디오 신호에 구비된 크로스 오버 주파수 이상의 고주파수 신호에 대하여 선형 예측 코딩(Linear Predictive Coding:LPC) 분석을 수행함으로써 고주파수 신호의 선형 예측 코딩 계수 및 잔차 신호를 출력한다. 여기서, 고주파수 신호로서 필터부(210)를 통해 필터링된 고주파수 신호를 이용하거나, 감산부(230)을 통해서 입력 오디오 신호로부터 코어 코더(220)에서 부호화된 후 복원된 저주파수 신호를 뺌으로서 생성된 고주파수 성분의 신호를 이용할 수 있다.
선형 예측 분석은 음성의 기본적인 파라미터를 음성 발생의 선형적인 모델에 기초하여 추출해내는 방법으로, 현재의 음성 신호 샘플값은 과거 M개(M은 양의 정수)의 음성 출력 샘플 값과의 선형 결합으로 근사할 수 있다는 가정에 기반한 음성 신호 모델링 방식을 말한다. 본 발명에 따른 오디오 신호의 부호화 방법 및 장치에서는 이러한 선형 예측 코딩 분석 방식을 코어 코더(220)에 의해 부호화되지 못 한 고주파수 신호에 적용하여 고주파수 신호를 부호화한다. 선형 예측 코딩 분석부(240)는 공분산 방식(covariance method), 자기 상관 방식(autocorrelation method), 래티스 필터(Lattice filter), 레빈슨-더빈 알고리즘(Levinson-Durbin algorithm) 등을 이용하여 고주파수 신호로부터 선형 예측 코딩 계수(LPC 계수) 및 잔차 신호를 추출하여 출력한다.
구체적으로, 본 발명에 따른 선형 예측 코딩 분석부(240)은 현재의 고주파수 신호 샘플값을 s(n)은 다음과 같이 그 이전의 p(p는 양의 정수)개의 고주파수 신호 샘플들(s(n-1), s(n-2),..., s(n-p))을 이용하여 다음의 수학식 1과 같이 모델링된다고 가정한다.
Figure 112008007425381-pat00001
수학식 1에서 u(n)은 선형 예측 코딩 분석에 따라서 이전의 p개의 고주파수 신호 샘플들로부터 현재의 고주파수 신호 샘플값을 예측하였을 때의 예측 오차값에 해당하는 것으로 여기 신호(excitation signal) 또는 잔차 신호(residual signal)라고 한다. 이하, 본 발명을 설명함에 있어서 Gu(n)은 잔차 신호로 정의하기로 한다. G는 잔차 신호의 에너지에 따른 이득값(gain)을 의미한다. ai는 선형 예측 코딩 계수(LPC 계수)를 나타내며, p는 선형 예측 코딩 계수의 차수로서 일반적으로 10~16의 값을 갖는다.
수학식 1을 z-변환을 통해 변환하면 다음의 수학식 2와 같다.
Figure 112008007425381-pat00002
수학식 2에서 전달함수 H(z)의 분모 부분을 A(z)로 표시하였다.
한편, 수학식 1로부터 잔차 신호 Gu(n)(또는 e(n))으로 표시함)은 다음의 수학식 3와 같다.
Figure 112008007425381-pat00003
예측 오차에 해당하는 잔차 신호의 전달 함수는 다음의 수학식 4와 같이 표현될 수 있다.
Figure 112008007425381-pat00004
수학식 2와 수학식 4를 고려할 때, 잔차 신호의 전달 함수는 전달 함수 H(z)의 분모 부분에 해당됨을 알 수 있다. 따라서, 선형 예측 코딩 분석을 통해 선형 예측 코딩 계수 ai들을 계산하여 A(z)를 결정하고, A(z)에 고주파수 신호를 입력하여 필터링하면 잔차 신호 Gu(n)이 추출된다.
이와 같이, 선형 예측 코딩 분석부(240)는 고주파수 신호에 대하여 선형 예측 코딩 분석을 수행하여 고주파수 신호의 예측 신호를 생성하기 위한 선형 예측 코딩 계수 및 예측 에러에 해당하는 잔차 신호를 출력한다.
이득 정보 추출부(250)는 잔차 신호로부터 이득값(G)을 추출하여 부호화한다.
도 3은 본 발명에 따른 잔차 신호의 시간 포락선의 일 예를 나타낸 도면이며, 도 4는 도 2의 이득 정보 추출부(250)의 구성을 구체적으로 나타낸 블록도이다.
도 3 및 도 4를 참조하면, 잔차 신호의 진폭 변화는 잔차 신호의 개략적인 외형을 나타내는 시간 포락선(time envelope)을 모델링함으로써 표현될 수 있다. 따라서, 이득 정보 추출부(250)에 구비된 분할부(251)는 잔차 신호의 시간 포락선을 소정 시간 단위로 분할하고, 포락선 파라미터 검출부(252)는 분할된 각 구간의 에너지를 이용하여 잔차 신호의 시간 포락선의 진폭 변화를 나타내는 파라미터를 생성한다. 일 예로 포락선 파라미터 검출부(252)는 잔차 신호의 분할된 각 구간의 평균 에너지를 계산하고, 이를 각 구간의 진폭을 나타내는 대표값으로 이용할 수 있다.
양자화부(260)는 선형 예측 코딩 분석부(240)에서 출력된 고주파수 신호의 선형 예측 코딩 계수 및 이득 정보 추출부(250)에서 출력된 이득 정보를 양자화하여 출력한다.
다중화부(270)는 저주파수 신호의 부호화된 데이터, 고주파수 신호의 선형 예측 코딩 계수 및 이득 정보 등을 다중화하여 비트스트림을 생성하여 출력한다. 이 때, 다중화부(270)는 선형 예측 코딩 분석의 역과정인 선형 예측 코딩 합성 과정을 통해 고주파수 신호의 복원을 위해 필요한 다양한 파라미터 정보들, 예를 들어 선형 예측 코딩 계수의 차수 정보, 복사 대역 정보 등을 부호화된 비트스트림에 부가하는 것이 바람직하다.
이와 같이 본 발명에 따른 오디오 신호의 부호화 장치에 따르면, 코어 코더에 의하여 부호화되지 않는 고주파수 신호를 선형 예측 코딩 분석을 통해 부호화함으로써 비트량의 큰 증가없이 고주파수 신호의 코딩 효율을 향상시킨다.
도 5는 본 발명에 따른 오디오 신호의 부호화 방법을 나타낸 플로우 차트이다.
도 5를 참조하면, 단계 510에서 오디오 신호에 구비된 임계 주파수 이상의 고주파수 신호에 대하여 선형 예측 코딩 분석을 수행함으로써 고주파수 신호의 선형 예측 코딩 계수 및 잔차 신호를 출력한다. 전술한 바와 같이, 고주파수 신호로서 필터링된 고주파수 신호를 이용하거나, 입력 오디오 신호로부터 코어 코덱을 이용하여 부호화된 후 복원된 저주파수 신호를 뺌으로서 생성된 고주파수 성분의 신호를 이용할 수 있다.
단계 520에서 잔차 신호의 진폭 변화를 나타내는 이득 정보를 추출한다. 이득 정보로서 잔차 신호의 시간 포락선을 모델링한 파라미터 정보를 이용할 수 있다. 이 경우 잔차 신호의 시간 포락선을 소정 구간으로 분할하고, 분할된 각 구간의 평균 에너지를 계산하여 계산된 평균 에너지를 잔차 신호의 시간 포락선의 진폭 변화를 나타내는 파라미터로 이용할 수 있다.
단계 540에서 고주파수 신호의 선형 예측 코딩 분석을 통해 생성된 선형 예측 코딩 계수 및 잔차 신호의 이득 정보를 양자화한다.
단계 550에서, 부호화된 저주파수 신호의 데이터, 양자화된 고주파수 신호의 선형 예측 코딩 계수 및 잔차 신호의 이득 정보를 다중화한다. 이 때, 선형 예측 코딩 분석의 역과정인 선형 예측 코딩 합성 과정을 통해 고주파수 신호의 복원을 위해 필요한 다양한 파라미터 정보들, 예를 들어 선형 예측 코딩 계수의 차수 정보, 복사 대역 정보 등을 부호화된 비트스트림에 부가한다.
도 6은 본 발명에 따른 오디오 신호의 복호화 장치의 일 실시예를 나타낸 블록도이다.
도 6을 참조하면, 본 발명에 따른 오디오 신호의 복호화 장치는 역다중화부(610), 코어 디코더(620), 스펙트럼 화이트닝 수행부(630), 고주파수 대역 복사부(640), 포락선 조정부(650), 선형 예측 코딩 합성부(660) 및 결합부(670)를 포함한다. 여기서, 스펙트럼 화이트닝 수행부(630), 고주파수 대역 복사부(640), 포락선 조정부(650)는 복호화된 저주파수 신호를 이용하여 고주파수 신호의 잔차 신호를 생성하는데에 이용된다.
역다중화부(610)는 비트스트림에 대한 역다중화를 수행하여, 부호화된 저주파수 신호의 데이터, 고주파수 신호의 복원을 위해 필요한 선형 예측 코딩 계수의 차수(LPC 차수) 정보, 복사 대역 정보, 이득 정보 및 부호화시에 고주파수 신호에 대한 선형 예측 코딩 분석을 통해 생성된 선형 예측 코딩 계수(LPC 계수) 정보 등 을 추출하여 출력한다.
코어 디코더(620)는 코어 코덱을 이용하여 부호화된 오디오 신호의 저주파수 신호를 복호화한다.
스펙트럴 화이트닝 수행부(630)는 복호화된 저주파수 신호로부터 포락선을 제거하고 남은 잔차 신호를 추출한다. 일 예로, 스펙트럴 화이트닝 수행부(630)는 선형 예측 코딩 분석을 수행하여 복호화된 저주파수 신호의 잔차 신호를 생성할 수 있다. 이 때, 스펙트럴 화이트닝 수행부(630)는 비트스트림으로부터 출력된 선형 예측 코딩 계수의 차수 정보를 이용하여 부호화된 고주파수 신호와 동일한 선형 예측 코딩 계수 차수를 적용하여 선형 예측 코딩 분석을 수행하는 것이 바람직하다.
고주파수 대역 복사부(640)는 스펙트럴 화이트닝 수행부(630)에서 출력된 저주파수 신호의 잔차 신호를 소정의 고주파수 대역으로 복사한다. 이때, 고주파수 대역 복사부(640)는 소정의 크로스 오버 주파수 이상의 고주파수 대역들 중 부호화화된 고주파수 대역을 나타내는 복사 대역 정보를 이용하여 해당 복사 대역에 저주파수 신호의 잔차 신호를 복사한다. 고주파수 대역 복사부(640)를 통해 저주파수 잔차 신호로부터 복사된 고주파수 신호는 고주파수 신호의 잔차 신호의 예측 신호에 해당하게 된다.
포락선 조정부(650)는 비트스트림으로부터 추출된 이득 정보를 이용하여, 복사된 고주파수 신호를 소정 구간으로 분할하고, 각 구간이 비트스트림으로부터 추출된 해당 구간의 이득 정보와 동일하게 되도록 복사된 고주파수 신호의 진폭을 조정한다. 전술한 바와 같이, 이득 정보로서 각 구간의 평균 에너지를 이용하는 경 우, 복사된 고주파수 신호를 분할한 각 구간의 평균 에너지가 이득 정보에 구비된 해당 구간의 평균 에너지와 일치되도록 복사된 고주파수 신호의 진폭을 조정한다. 이와 같이 복사된 고주파수 신호의 진폭을 이득 정보를 통해 조정하여 시간 포락선을 조정함으로써 고주파수 신호의 잔차 신호가 생성된다.
선형 예측 코딩 합성부(660)는 선형 예측 코딩 분석의 역과정인 선형 예측 코딩 합성을 통해 비트스트림으로부터 추출된 고주파수 신호의 선형 예측 코딩 계수 및 잔차 신호로부터 고주파수 신호를 복원한다. 전술한 수학식 1을 참조하면, 현재 고주파수 신호의 샘플값은 선형 예측 코딩 계수(ai) 및 잔차 신호(Gu(n))가 결정되면 이전의 고주파수 신호의 샘플값을 통해 복원될 수 있다. 한편, 선형 예측 코딩 합성부(660)는 선형 예측 코딩 계수를 라인 스펙트럼 주파수(Line Spectral Frequencies:LSF)로 변환하고, 변환된 라인 스펙트럼 주파수를 보간하여 선형 예측 코딩 합성을 수행하는 것이 바람직하다.
결합부(670)는 코어 디코더(620)를 통해 복원된 저주파수 신호와 선형 예측 코딩 합성부(660)를 통해 복원된 고주파수 신호를 결합하여 복호화된 오디오 신호를 출력한다.
도 7은 본 발명에 따른 오디오 신호의 복호화 방법을 나타낸 플로우 차트이다.
도 7을 참조하면, 단계 710에서 코어 코덱을 이용하여 부호화된 비트스트림에 구비된 오디오 신호의 저주파수 신호에 대한 복호화를 수행한다.
단계 720에서, 복호화된 저주파 신호를 이용하여 오디오 신호의 고주파수 신호의 잔차 신호를 생성한다. 구체적으로, 도 7의 단계 720을 구체화한 도 8을 참조하면 단계 721에서, 복호화된 저주파수 신호에 대한 스펙트럴 화이트닝을 수행하여 복호화된 저주파수 신호의 잔차 신호를 생성한다. 전술한 바와 같이, 선형 예측 코딩 분석을 이용하여 복호화된 저주파수 신호에서 포락선을 제거한 잔차 신호를 생성할 수 있다. 단계 722에서, 저주파수 신호의 잔차 신호를 복사 대역 정보를 이용하여 소정의 고주파수 대역으로 복사한다. 단계 723에서, 비트스트림에 구비된 고주파수 신호의 잔차 신호의 이득 정보를 이용하여 고주파수 대역으로 복사된 신호의 포락선을 조정한다.
다시 도 7을 참조하면, 단계 730에서 비트스트림에 구비된 고주파수 신호의 선형 예측 코딩 계수와 포락선이 조정 과정을 통해 생성된 고주파수 신호의 잔차 신호를 이용한 선형 예측 코딩 합성을 수행하여 고주파수 신호를 복호화한다. 선형 예측 코딩 합성시에 선형 예측 코딩 계수를 라인 스펙트럼 주파수(LSF)로 변환하고, 변환된 라인 스펙트럼 주파수를 보간하여 선형 예측 코딩 합성을 수행하는 것이 바람직하다.
단계 740에서 복호화된 저주파 신호와 고주파 신호를 결합하여 오디오 신호를 복원한다.
본 발명에 따르면 고주파수 신호에 대한 선형 예측 코딩 분석을 통해서 고주파수 대역의 톤 성분 등을 효율적으로 부호화할 수 있으며, 이를 통해 종래 SBR 방식 등에서는 부호화되지 않았던 고주파수 신호의 성분을 부호화할 수 있으므로 전 체 오디오 신호의 음질이 향상된다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명이 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 사상은 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이와 균등하거나 또는 등가적인 변형 모두는 본 발명 사상의 범주에 속한다 할 것이다. 또한, 본 발명에 따른 시스템은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
도 1은 종래 기술에 따른 SBR을 설명하기 위한 참조도이다.
도 2는 본 발명에 따른 오디오 신호의 부호화 장치의 일 실시예를 나타낸 블록도이다.
도 3은 본 발명에 따른 잔차 신호의 시간 포락선의 일 예를 나타낸 도면이다.
도 4는 도 2의 이득 정보 추출부(250)의 구성을 구체적으로 나타낸 블록도이다.
도 5는 본 발명에 따른 오디오 신호의 부호화 방법을 나타낸 플로우 차트이다.
도 6은 본 발명에 따른 오디오 신호의 복호화 장치의 일 실시예를 나타낸 블록도이다.
도 7은 본 발명에 따른 오디오 신호의 복호화 방법을 나타낸 플로우 차트이다.
도 8은 도 7의 단계 720을 구체화한 플로우차트이다.

Claims (18)

  1. 오디오 신호의 부호화 방법에 있어서,
    상기 오디오 신호를 소정 임계 주파수 이상의 고주파수 신호와 상기 고주파수 신호를 제외한 저주파수 신호로 분할하는 단계;
    상기 분할된 고주파수 신호에 대하여 선형 예측 코딩(Linear Predictive Coding:LPC) 분석을 수행함으로써 상기 고주파수 신호의 선형 예측 코딩 계수 및 잔차 신호를 출력하는 단계;
    상기 잔차 신호의 진폭 변화를 나타내는 이득 정보를 추출하는 단계;
    상기 고주파수 신호의 선형 예측 코딩 계수 및 상기 잔차 신호의 이득 정보를 다중화하는 단계; 및
    상기 분할된 저주파수 신호를 소정의 오디오 압축 코덱을 이용하여 부호화하는 단계를 포함하는 것을 특징으로 하는 오디오 신호의 부호화 방법.
  2. 제 1항에 있어서,
    상기 이득 정보는 상기 잔차 신호의 시간 포락선을 모델링한 파라미터 정보인 것을 특징으로 하는 오디오 신호의 부호화 방법.
  3. 제 1항에 있어서,
    상기 잔차 신호의 진폭 변화를 나타내는 이득 정보를 추출하는 단계는
    상기 잔차 신호의 시간 포락선을 소정 구간으로 분할하는 단계; 및
    상기 분할된 각 구간의 에너지를 이용하여 상기 잔차 신호의 시간 포락선의 진폭 변화를 나타내는 파라미터를 생성하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호의 부호화 방법.
  4. 삭제
  5. 오디오 신호의 부호화 장치에 있어서,
    상기 오디오 신호를 소정 임계 주파수 이상의 고주파수 신호와 상기 고주파수 신호를 제외한 저주파수 신호로 분할하는 필터부(210);
    상기 분할된 고주파수 신호에 대하여 선형 예측 코딩(Linear Predictive Coding:LPC) 분석을 수행함으로써 상기 고주파수 신호의 선형 예측 코딩 계수 및 잔차 신호를 출력하는 선형 예측 코딩 분석부(240);
    상기 잔차 신호의 진폭 변화를 나타내는 이득 정보를 추출하는 이득 정보 추출부(250);
    상기 고주파수 신호의 선형 예측 코딩 계수 및 상기 잔차 신호의 이득 정보를 다중화하는 다중화부(270); 및
    상기 분할된 저주파수 신호를 부호화하는 소정의 코어 코더(220)를 포함하고,
    상기 코어 코더(220)는 상기 저주파수 신호를 소정의 오디오 압축 코덱을 이용하여 부호화하는 것을 특징으로 하는 오디오 신호의 부호화 장치.
  6. 제 5항에 있어서,
    상기 이득 정보 추출부(250)는 상기 잔차 신호의 시간 포락선을 모델링한 파라미터 정보를 상기 이득 정보로서 추출하는 것을 특징으로 하는 오디오 신호의 부호화 장치.
  7. 제 5항에 있어서,
    상기 이득 정보 추출부(250)는
    상기 잔차 신호의 시간 포락선을 소정 구간으로 분할하는 분할부(251); 및
    상기 분할된 각 구간의 에너지를 이용하여 상기 잔차 신호의 시간 포락선의 진폭 변화를 나타내는 파라미터를 생성하는 포락선 파라미터 생성부(252)를 포함하는 것을 특징으로 하는 오디오 신호의 부호화 장치.
  8. 삭제
  9. 삭제
  10. 삭제
  11. 삭제
  12. 삭제
  13. 삭제
  14. 삭제
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
KR1020080009008A 2008-01-29 2008-01-29 오디오 신호의 부호화, 복호화 방법 및 장치 KR101413968B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020080009008A KR101413968B1 (ko) 2008-01-29 2008-01-29 오디오 신호의 부호화, 복호화 방법 및 장치
PCT/KR2009/000435 WO2009096717A2 (ko) 2008-01-29 2009-01-29 오디오 신호의 부호화, 복호화 방법 및 장치
US12/361,999 US20090192792A1 (en) 2008-01-29 2009-01-29 Methods and apparatuses for encoding and decoding audio signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080009008A KR101413968B1 (ko) 2008-01-29 2008-01-29 오디오 신호의 부호화, 복호화 방법 및 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020120149763A Division KR101413969B1 (ko) 2012-12-20 2012-12-20 오디오 신호의 복호화 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20090083069A KR20090083069A (ko) 2009-08-03
KR101413968B1 true KR101413968B1 (ko) 2014-07-01

Family

ID=40900107

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080009008A KR101413968B1 (ko) 2008-01-29 2008-01-29 오디오 신호의 부호화, 복호화 방법 및 장치

Country Status (3)

Country Link
US (1) US20090192792A1 (ko)
KR (1) KR101413968B1 (ko)
WO (1) WO2009096717A2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11804230B2 (en) 2021-07-30 2023-10-31 Electronics And Telecommunications Research Institute Audio encoding/decoding apparatus and method using vector quantized residual error feature

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
WO2011059254A2 (en) * 2009-11-12 2011-05-19 Lg Electronics Inc. An apparatus for processing a signal and method thereof
WO2011073201A2 (en) 2009-12-16 2011-06-23 Dolby International Ab Sbr bitstream parameter downmix
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
KR102632248B1 (ko) * 2010-07-19 2024-02-02 돌비 인터네셔널 에이비 고주파 복원 동안 오디오 신호들의 프로세싱
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5704397B2 (ja) * 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
CN108172239B (zh) * 2013-09-26 2021-01-12 华为技术有限公司 频带扩展的方法及装置
US9620134B2 (en) 2013-10-10 2017-04-11 Qualcomm Incorporated Gain shape estimation for improved tracking of high-band temporal characteristics
WO2015098564A1 (ja) 2013-12-27 2015-07-02 ソニー株式会社 復号化装置および方法、並びにプログラム
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
CN105225671B (zh) * 2014-06-26 2016-10-26 华为技术有限公司 编解码方法、装置及系统
US11295753B2 (en) * 2015-03-03 2022-04-05 Continental Automotive Systems, Inc. Speech quality under heavy noise conditions in hands-free communication
TW202341126A (zh) * 2017-03-23 2023-10-16 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
KR20210003507A (ko) 2019-07-02 2021-01-12 한국전자통신연구원 오디오 코딩을 위한 잔차 신호 처리 방법 및 오디오 처리 장치

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19980042556A (ko) * 1996-11-19 1998-08-17 이데이노브유끼 음성부호화방법, 음성복호화방법, 음성부호화장치, 음성복호화장치, 전화장치, 피치변환방법 및 매체
US20060277038A1 (en) * 2005-04-01 2006-12-07 Qualcomm Incorporated Systems, methods, and apparatus for highband excitation generation
US20070106505A1 (en) * 2003-12-01 2007-05-10 Koninkijkle Phillips Electronics N.V. Audio coding

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
US5781880A (en) * 1994-11-21 1998-07-14 Rockwell International Corporation Pitch lag estimation using frequency-domain lowpass filtering of the linear predictive coding (LPC) residual
JPH10149199A (ja) * 1996-11-19 1998-06-02 Sony Corp 音声符号化方法、音声復号化方法、音声符号化装置、音声復号化装置、電話装置、ピッチ変換方法及び媒体
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
US6988066B2 (en) * 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
JPWO2006025313A1 (ja) * 2004-08-31 2008-05-08 松下電器産業株式会社 音声符号化装置、音声復号化装置、通信装置及び音声符号化方法
CA2558595C (en) * 2005-09-02 2015-05-26 Nortel Networks Limited Method and apparatus for extending the bandwidth of a speech signal
US20070099541A1 (en) * 2005-10-19 2007-05-03 Glenn Yu Hand-launchable fluid-boosted toy vehicle
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US9454974B2 (en) * 2006-07-31 2016-09-27 Qualcomm Incorporated Systems, methods, and apparatus for gain factor limiting

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19980042556A (ko) * 1996-11-19 1998-08-17 이데이노브유끼 음성부호화방법, 음성복호화방법, 음성부호화장치, 음성복호화장치, 전화장치, 피치변환방법 및 매체
US20070106505A1 (en) * 2003-12-01 2007-05-10 Koninkijkle Phillips Electronics N.V. Audio coding
US20060277038A1 (en) * 2005-04-01 2006-12-07 Qualcomm Incorporated Systems, methods, and apparatus for highband excitation generation

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MELTZER, S. et al. MPEG-4 HE-AAC v2 - AUDIO CODING FOR TODAY’S DIGITAL MEDIA WORLD. white paper of Coding Technologies. 2006.01. (제1면 내지 제12면)*
MELTZER, S. et al. MPEG-4 HE-AAC v2 - AUDIO CODING FOR TODAY'S DIGITAL MEDIA WORLD. white paper of Coding Technologies. 2006.01. (제1면 내지 제12면) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11804230B2 (en) 2021-07-30 2023-10-31 Electronics And Telecommunications Research Institute Audio encoding/decoding apparatus and method using vector quantized residual error feature

Also Published As

Publication number Publication date
WO2009096717A3 (ko) 2009-09-24
WO2009096717A2 (ko) 2009-08-06
KR20090083069A (ko) 2009-08-03
US20090192792A1 (en) 2009-07-30

Similar Documents

Publication Publication Date Title
KR101413968B1 (ko) 오디오 신호의 부호화, 복호화 방법 및 장치
JP6423460B2 (ja) フレームエラー隠匿装置
KR101413967B1 (ko) 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
JP6170520B2 (ja) オーディオ及び/またはスピーチ信号符号化及び/または復号化方法及び装置
KR101373004B1 (ko) 고주파수 신호 부호화 및 복호화 장치 및 방법
KR101171098B1 (ko) 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
JP5343098B2 (ja) スーパーフレーム構造のlpcハーモニックボコーダ
KR101428487B1 (ko) 멀티 채널 부호화 및 복호화 방법 및 장치
KR101435893B1 (ko) 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
KR100721537B1 (ko) 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법
KR20120128136A (ko) 일반 오디오 및 음성 프레임을 포함하는 오디오 신호용 디코더
KR20080050900A (ko) 오디오 신호의 중요 주파수 성분 추출 방법 및 장치와 이를이용한 오디오 신호의 부호화/복호화 방법 및 장치
KR20120125513A (ko) 일반 오디오 및 음성 프레임들을 포함하는 오디오 신호를 위한 인코더
CN102150202A (zh) 对音频/语音信号进行编码和解码的方法和设备
JP6181773B2 (ja) Celp状コーダのためのサイド情報を用いないノイズ充填
US20130103394A1 (en) Device and method for efficiently encoding quantization parameters of spectral coefficient coding
KR101413969B1 (ko) 오디오 신호의 복호화 방법 및 장치
KR102052144B1 (ko) 음성 신호의 대역 선택적 양자화 방법 및 장치
KR101387808B1 (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
JP5451603B2 (ja) デジタルオーディオ信号の符号化
KR100902332B1 (ko) 변형 선형예측 부호화를 이용한 오디오 부호화 및 복호화장치 및 그 방법
KR20080092823A (ko) 부호화/복호화 장치 및 방법
KR20080034819A (ko) 부호화/복호화 장치 및 방법
KR20070008211A (ko) 스케일러블 대역 확장 음성 부호화/복호화 방법 및 장치
KR20100006491A (ko) 무성음 부호화 및 복호화 방법 및 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
A107 Divisional application of patent
AMND Amendment
J201 Request for trial against refusal decision
E902 Notification of reason for refusal
E902 Notification of reason for refusal
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170529

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180530

Year of fee payment: 5