KR101376100B1 - 대역폭 확장 복호화 방법 및 장치 - Google Patents

대역폭 확장 복호화 방법 및 장치 Download PDF

Info

Publication number
KR101376100B1
KR101376100B1 KR1020130106346A KR20130106346A KR101376100B1 KR 101376100 B1 KR101376100 B1 KR 101376100B1 KR 1020130106346 A KR1020130106346 A KR 1020130106346A KR 20130106346 A KR20130106346 A KR 20130106346A KR 101376100 B1 KR101376100 B1 KR 101376100B1
Authority
KR
South Korea
Prior art keywords
spectrum
frequency
signal
excitation
high frequency
Prior art date
Application number
KR1020130106346A
Other languages
English (en)
Other versions
KR20130114039A (ko
Inventor
주기현
오은미
손창용
김중회
레이 미아오
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Publication of KR20130114039A publication Critical patent/KR20130114039A/ko
Application granted granted Critical
Publication of KR101376100B1 publication Critical patent/KR101376100B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 오디오 신호를 부호화하거나 복호화하는 방법 및 장치에 관한 것으로 시간 영역 또는 주파수 영역에서 부호화된 저주파수 신호에 대한 여기 신호 또는 여기 스펙트럼을 이용하여 고주파수 신호를 부호화하거나 복호화함으로써 적은 비트를 이용하여 오디오 신호를 부호화하거나 복호화함에도 불구하고 고주파수 영역에 해당하는 신호의 음질을 저하시키지 않으므로 코딩 효율을 극대화할 수 있는 효과를 거둘 수 있다.

Description

대역폭 확장 복호화 방법 및 장치{Method and apparatus for bandwidth extension decoding}
본 발명은 음성 신호 또는 음악 신호와 같은 오디오 신호를 부호화하거나 복호화하는 방법 및 장치에 관한 것으로, 보다 상세하게는 오디오 신호 가운데 고주파수 영역에 해당하는 신호를 부호화하거나 복호화하는 방법 및 장치에 관한 것이다.
고주파수 영역에 해당하는 신호는 저주파수 영역에 해당하는 신호에 비하여 인간이 소리로서 인식하는 데 중요성이 떨어지는 것이 일반적이다. 그러므로 오디오 신호를 부호화함에 있어서 가용한 비트에 대한 제약이 있어 코딩의 효율을 높여야 할 경우 저주파수 영역에 해당하는 신호에는 많은 비트를 할당하여 부호화하지만 이에 비하여 고주파수 영역에 해당하는 신호에는 적은 비트를 할당하여 부호화한다.
그러므로 고주파수 영역에 해당하는 신호를 부호화함에 있어서 적은 비트를 이용하고도 인간이 인식하는 음질을 최대한 향상시킬 수 있는 방법 및 장치가 요구된다.
본 발명이 이루고자 하는 기술적 과제는, 시간 영역 또는 주파수 영역에서 부호화된 저주파수 신호에 대한 여기 신호 또는 여기 스펙트럼을 이용하여 고주파수 신호를 부호화하거나 복호화하는 방법 및 장치를 제공하는 것이다.
상기의 과제를 이루기 위한 본 발명에 의한 대역폭 확장 복호화 방법은, 기 설정된 주파수 보다 작은 영역에 해당하는 저주파수 신호가 시간 영역에서 복호화되었다면 여기 신호를 복호화하여 주파수 영역으로 변환하는 단계, 상기 저주파수 신호가 주파수 영역에서 복호화되었다면 여기 스펙트럼을 복호화하는 단계, 상기 변환된 여기 신호의 스펙트럼 또는 상기 복호화된 여기 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 스펙트럼을 생성하는 단계 및 이득값을 복호화하여 상기 생성된 스펙트럼에 적용하는 단계를 포함하는 것을 특징으로 한다.
상기의 과제를 이루기 위한 본 발명에 의한 대역폭 확장 복호화 장치는, 기 설정된 주파수 보다 작은 영역에 해당하는 저주파수 신호가 시간 영역에서 복호화되었다면 여기 신호를 복호화하여 주파수 영역으로 변환하는 시간영역 복호화부, 상기 저주파수 신호가 주파수 영역에서 복호화되었다면 여기 스펙트럼을 복호화하는 주파수영역 복호화부, 상기 변환된 여기 신호의 스펙트럼 또는 상기 복호화된 여기 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 스펙트럼을 생성하는 스펙트럼 생성부 및 이득값을 복호화하여 상기 생성된 스펙트럼에 적용하는 이득값 적용부를 포함하는 것을 특징으로 한다.
상기의 과제를 이루기 위한 본 발명에 의한 기록 매체는, 기 설정된 주파수 보다 작은 영역에 해당하는 저주파수 신호가 시간 영역에서 복호화되었다면 여기 신호를 복호화하여 주파수 영역으로 변환하는 단계, 상기 저주파수 신호가 주파수 영역에서 복호화되었다면 여기 스펙트럼을 복호화하는 단계, 상기 변환된 여기 신호의 스펙트럼 또는 상기 복호화된 여기 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 스펙트럼을 생성하는 단계 및 이득값을 복호화하여 상기 생성된 스펙트럼에 적용하는 단계를 포함하는 발명을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있다.
본 발명에 의한 대역폭 확장 부호화 및 복호화 방법 및 장치에 의하면, 시간 영역 또는 주파수 영역에서 부호화된 저주파수 신호에 대한 여기 신호 또는 여기 스펙트럼을 이용하여 고주파수 신호를 부호화하거나 복호화한다.
이렇게 함으로써 적은 비트를 이용하여 오디오 신호를 부호화하거나 복호화함에도 불구하고 고주파수 영역에 해당하는 신호의 음질을 저하시키지 않으므로 코딩 효율을 극대화할 수 있는 효과를 거둘 수 있다.
도 1은 본 발명에 의한 대역폭 확장 부호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
도 2는 본 발명에 의한 대역폭 확장 부호화 장치에 대한 일 실시예를 블록도로 도시한 것이다.
도 3은 본 발명에 의한 대역폭 확장 복호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
도 4는 본 발명에 의한 대역폭 확장 복호화 장치에 대한 일 실시예를 블록도로 도시한 것
도 5는 본 발명에 의한 대역폭 확장 부호화 및 복호화 장치에서 폴딩하는 방식에 대한 일 실시예를 그래프로 도시한 것이다.
도 6은 본 발명에 의한 대역폭 확장 부호화 및 복호화 장치에서 폴딩하는 방식에 대한 다른 일 실시예를 그래프로 도시한 것이다.
이하, 첨부된 도면들을 참조하여 본 발명에 따른 대역폭 확장 부호화 및 복호화 방법 및 장치에 대해 상세히 설명한다.
도 1은 본 발명에 의한 대역폭 확장 부호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
먼저, 입력된 신호를 기 설정된 주파수를 기준으로 하여 저주파수 신호와 고주파수 신호로 분할한다(제100단계). 여기서, 저주파수 신호는 기 설정된 제1 주파수 보다 작은 영역에 해당하는 신호이며, 고주파수 신호는 기 설정된 제2 주파수 보다 큰 영역에 해당하는 신호를 말한다. 제1 주파수와 제2 주파수는 서로 동일한 값으로 설정되는 것이 바람직하지만, 반드시 동일한 값으로 설정하여 실시해야 하는 것은 아니다.
제100단계에서 분할된 저주파수 신호를 기 설정된 기준에 따라 시간 영역에서 부호화할지 주파수 영역에서 부호화할지 결정한다(제110단계).
만일 제100단계에서 분할된 저주파수 신호를 시간 영역에서 부호화하는 것으로 제110단계에서 결정되면, 제100단계에서 분할된 저주파수 신호를 시간 영역에서 부호화한다(제120단계). 제120단계에서 저주파수 신호를 시간 영역에서 부호화하는 방식의 예로 CELP(Code Excited Linear Prediction) 및 ACELP(Algebraic Code Excited Linear Prediction)가 있다.
제120단계에서는 제100단계에서 분할된 저주파수 신호를 시간 영역에서 부호화하는 과정에서 포락선(envelope)을 제거한 여기 신호(excitation signal)를 추출한다. 제120단계에서 포락선을 제거하는 실시예로 LPC(Linear Predictive Coding) 분석을 수행함으로써 포락선을 제거하여 여기 신호를 추출할 수 있다.
제120단계에서 추출된 여기 신호를 시간 영역에서 주파수 영역으로 변환하여 저주파수 신호에 대한 여기 신호의 스펙트럼을 생성한다(제125단계). 제125단계에서 시간 영역으로 마련된 여기 신호를 주파수 영역으로 변환하는 방식의 예로 FFT(Fast Fourier Transform) 또는 MDCT(Modified Discrete Cosine Transform) 등이 있다.
만일 제100단계에서 분할된 저주파수 신호를 주파수 영역에서 부호화하는 것으로 제110단계에서 결정되면, 제100단계에서 분할된 저주파수 신호를 주파수 영역에서 부호화한다(제130단계). 제130단계에서 저주파수 신호를 주파수 영역에서 부호화하는 예로 TCX(Transform Coded eXcitation)가 있다.
제130단계에서는 제100단계에서 분할된 저주파수 신호를 주파수 영역에서 부호화하는 과정에서 포락선(envelope)을 제거한 여기 스펙트럼(excitation spectrum)을 추출한다.
제130단계에서 TCX에 의해 부호화하는 과정에서 여기 스펙트럼을 추출하는 방식으로 다음 기재된 두 실시예가 있다. 첫째, TCX에서 웨이티드 스피치 도메인(weighted speech domain)의 스펙트럼을 이용하여 여기 스펙트럼을 추출할 수 있다. 둘째, TCX를 수행하는 과정에서 소정의 구성요소를 수행하지 않음으로써 퍼셉추얼 웨이팅(Perceptual weighting)을 제거하여 여기 스펙트럼을 추출할 수 있다.
제130단계는 FFT(Fast Fourier Transform) 혹은 MDCT(Modified Discrete Cosine Transform)에서도 수행될 수 있다. 이 경우 ACELP 부호화 방식과 동일한 여기 신호의 스펙트럼을 이용하여 고주파수 스펙트럼을 복원한다.
제125단계에서 생성된 여기 신호의 스펙트럼 또는 제130단계에서 추출된 여기 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 고주파수 영역에 여기 스펙트럼을 생성한다(제135단계). 제135단계에서는 제125단계에서 생성된 여기 신호의 스펙트럼 또는 제130단계에서 추출된 여기 스펙트럼을 고주파수 영역에 패치(patch)하거나 기 설정된 주파수를 기준으로 고주파수 영역에 대칭적으로 폴딩(folding)하여 여기 스펙트럼을 생성할 수 있다.
제100단계에서 분할된 고주파수 신호를 시간 영역에서 주파수 영역으로 변환하여 고주파수 스펙트럼을 생성한다(제140단계). 제140단계에서 시간 영역으로 마련된 고주파수 신호를 주파수 영역으로 변환하는 방식의 예로 FFT 또는 MDCT 등이 있다.
제135단계에서 생성된 여기 스펙트럼과 제140단계에서 생성된 고주파수 스펙트럼을 이용하여 이득값(gain)을 계산한다(제150단계). 제150단계에서 계산된 이득값은 복호화기에서 복호화된 저주파수에 대한 여기 신호의 스펙트럼을 이용하여 고주파수 스펙트럼을 복원하는 데 이용된다. 즉, 복호화기에서 저주파수에 대한 여기 신호의 스펙트럼을 이용하여 고주파수 스펙트럼을 생성함에 있어서, 고주파수 스펙트럼의 포락선(envelope)을 조절하기 위하여 이득값을 구한다.
제150단계에서는 제135단계에서 생성된 여기 스펙트럼에 대한 각 밴드의 에너지 값과 제140단계에서 생성된 고주파수 스펙트럼에 대한 각 밴드의 에너지 값에 대한 비율을 이득값으로 다음 기재된 수학식 1에 의해 계산할 수 있다.
[수학식 1]
Figure 112013081110346-pat00001
여기서, g(n)은 제150단계에서 계산된 이득값이며, n은 밴드의 인덱스(band index)이고, i는 스펙트럴 라인 인덱스(spectral line index)이며,
Figure 112013081110346-pat00002
은 제135단계에서 생성된 여기 스펙트럼이고,
Figure 112013081110346-pat00003
는 제140단계에서 생성된 고주파수 스펙트럼이며, N은 기 설정된 상수이다.
제150단계에서 계산된 이득값을 양자화(Quantization)하여 부호화한다(제160단계). 제160단계는 ACELP, TCX 256 및 TCX 512에 대하여 4차원 벡터-양자화(vector quantization)을 수행하고, TCX 1024에 대하여 2차원 벡터-양자화를 수행할 수 있다. 또한, 제160단계는 제150단계에서 계산된 이득값을 스칼라 양자화에 의해서 수행할 수도 있다.
제120단계 또는 제130단계에서 저주파수 신호가 부호화된 결과 및 제150단계에서 양자화된 이득값을 포함하여 다중화함으로써 비트스트림(bitstream)을 생성한다(제170단계).
그러나 도 1에 도시된 개-루프(open-loop) 방식 이외에 제120단계 내지 130단계를 모두 수행한 후 부호화된 결과를 비교하여 시간 영역에서 부호화할지 주파수 영역에서 부호화할지를 결정하는 폐-루프(close-loop) 방식으로도 실시할 수 있다.
도 2는 본 발명에 의한 대역폭 확장 부호화 장치에 대한 일 실시예를 블록도로 도시한 것으로서, 상기 대역폭 확장 부호화 장치는 영역 분할부(200), 영역 결정부(210), 시간영역 부호화부(220), 제1 변환부(225), 주파수영역 부호화부(230), 여기스펙트럼 생성부(235), 제2 변환부(240), 이득값 계산부(250), 이득값 부호화부(260) 및 다중화부(270)를 포함하여 이루어진다.
영역 분할부(200)는 입력단자 IN을 통해 입력된 신호를 기 설정된 주파수를 기준으로 하여 저주파수 신호와 고주파수 신호로 분할한다. 여기서, 저주파수 신호는 기 설정된 제1 주파수 보다 작은 영역에 해당하는 신호이며, 고주파수 신호는 기 설정된 제2 주파수 보다 큰 영역에 해당하는 신호를 말한다. 제1 주파수와 제2 주파수는 서로 동일한 값으로 설정되는 것이 바람직하지만, 반드시 동일한 값으로 설정하여 실시해야 하는 것은 아니다.
영역 결정부(210)는 영역 분할부(200)에서 분할된 저주파수 신호를 기 설정된 기준에 따라 시간 영역에서 부호화할지 주파수 영역에서 부호화할지 결정한다.
시간영역 부호화부(220)는 영역 분할부(200)에서 분할된 저주파수 신호를 시간 영역에서 부호화하는 것으로 영역 결정부(210)에서 결정되면 영역분할부(200)에서 분할된 저주파수 신호를 시간 영역에서 부호화한다. 시간영역 부호화부(220)에서 저주파수 신호를 시간 영역에서 부호화하는 방식의 예로 CELP(Code Excited Linear Prediction) 및 ACELP(Algebraic Code Excited Linear Prediction)가 있다.
시간영역 부호화부(220)에서는 영역 분할부(200)에서 분할된 저주파수 신호를 시간 영역에서 부호화하는 과정에서 포락선(envelope)을 제거한 여기 신호(excitation signal)를 추출한다. 시간영역 부호화부(220)에서 포락선을 제거하는 실시예로 LPC(Linear Predictive Coding) 분석을 수행함으로써 포락선을 제거하여 여기 신호를 추출할 수 있다.
제1 변환부(225)는 시간영역 부호화부(220)에서 추출된 여기 신호를 시간 영역에서 주파수 영역으로 변환하여 저주파수 신호에 대한 여기 신호의 스펙트럼을 생성한다. 제1 변환부(225)에서 시간 영역으로 마련된 여기 신호를 주파수 영역으로 변환하는 방식의 예로 FFT(Fast Fourier Transform) 또는 MDCT(Modified Discrete Cosine Transform) 등이 있다.
주파수영역 부호화부(230)는 영역 분할부(200)에서 분할된 저주파수 신호를 주파수 영역에서 부호화하는 것으로 영역 결정부(210)에서 결정되면 영역 분할부(200)에서 분할된 저주파수 신호를 주파수 영역에서 부호화한다. 주파수영역 부호화부(230)에서 저주파수 신호를 주파수 영역에서 부호화하는 방식의 예로 TCX(Transform Coded eXcitation)가 있다.
주파수영역 부호화부(230)에서는 영역 분할부(200)에서 분할된 저주파수 신호를 주파수 영역에서 부호화하는 과정에서 포락선(envelope)을 제거한 여기 스펙트럼(excitation spectrum)을 추출한다.
주파수영역 부호화부(230)에서 TCX에 의해 부호화하는 과정에서 여기 스펙트럼을 추출하는 방식으로 다음 기재된 두 실시예가 있다. 첫째, TCX에서 웨이티드 스피치 도메인(weighted speech domain)의 스펙트럼을 이용하여 여기 스펙트럼을 추출할 수 있다. 둘째, TCX를 수행하는 과정에서 소정의 구성요소를 수행하지 않음으로써 퍼셉추얼 웨이팅(Perceptual weighting)을 제거하여 여기 스펙트럼을 추출할 수 있다.
주파수영역 부호화부(230)는 FFT(Fast Fourier Transform) 혹은 MDCT(Modified Discrete Cosine Transform)에서도 수행될 수 있다. 이 경우 ACELP 부호화 방식과 동일한 여기 신호의 스펙트럼을 이용하여 고주파수 스펙트럼을 복원한다.
여기스펙트럼 생성부(235)는 제1 변환부(225)에서 생성된 여기 신호의 스펙트럼 또는 주파수영역 부호화부(230)에서 추출된 여기 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 고주파수 영역에 여기 스펙트럼을 생성한다. 여기스펙트럼 생성부(235)는 제1 변환부(225)에서 생성된 여기 신호의 스펙트럼 또는 주파수영역 부호화부(230)에서 추출된 여기 스펙트럼을 고주파수 영역에 패치(patch)하거나 기 설정된 주파수를 기준으로 고주파수 영역에 대칭적으로 폴딩(folding)하여 여기 스펙트럼을 생성할 수 있다.
제2 변환부(240)는 영역 분할부(200)에서 분할된 고주파수 신호를 시간 영역에서 주파수 영역으로 변환하여 고주파수 스펙트럼을 생성한다. 제2 변환부(240)에서 시간 영역으로 마련된 고주파수 신호를 주파수 영역으로 변환하는 방식의 예로 FFT 또는 MDCT 등이 있다.
이득값 계산부(250)는 여기스펙트럼 생성부(235)에서 생성된 스펙트럼과 제2 변환부(240)에서 생성된 고주파수 스펙트럼을 이용하여 이득값(gain)을 계산한다. 이득값 계산부(250)에서 계산된 이득값은 복호화기에서 복호화된 저주파수에 대한 여기 신호의 스펙트럼을 이용하여 고주파수 스펙트럼을 복원하는 데 이용된다. 즉, 복호화기에서 저주파수에 대한 여기 신호의 스펙트럼을 이용하여 고주파수 스펙트럼을 생성함에 있어서, 고주파수 스펙트럼의 포락선(envelope)을 조절하기 위하여 이득값을 구한다.
이득값 계산부(250)에서는 여기스펙트럼 생성부(235)에서 생성된 스펙트럼에 대한 각 밴드의 에너지 값과 제2 변환부(240)에서 생성된 고주파수 스펙트럼에 대한 각 밴드의 에너지 값에 대한 비율을 이득값으로 다음 기재된 수학식 2에 의해 계산할 수 있다.
[수학식 2]
Figure 112013081110346-pat00004
여기서, g(n)은 이득값 계산부(250)에서 계산된 이득값이며, n은 밴드의 인덱스(band index)이고, i는 스펙트럴 라인 인덱스(spectral line index)이며,
Figure 112013081110346-pat00005
은 여기스펙트럼 생성부(235)에서 생성된 스펙트럼이고,
Figure 112013081110346-pat00006
는 제2 변환부(240)에서 생성된 고주파수 스펙트럼이며, N은 기 설정된 상수이다.
이득값 부호화부(260)는 이득값 계산부(250)에서 계산된 이득값을 양자화(Quantization)하여 부호화한다. 이득값 부호화부(260)에서는 ACELP, TCX 256 및 TCX 512에 대하여 4차원 벡터-양자화(vector quantization)을 수행하고, TCX 1024에 대하여 2차원 벡터-양자화를 수행할 수 있다. 또한, 이득값 부호화부(260)에서는 이득값 계산부(250)에서 계산된 이득값을 스칼라 양자화에 의해서 수행할 수도 있다.
다중화부(270)는 시간영역 부호화부(220) 또는 주파수영역 부호화부(230)에서 저주파수 신호가 부호화된 결과 및 이득값 부호화부(260)에서 양자화된 이득값을 포함하여 다중화함으로써 비트스트림(bitstream)을 생성하고 출력단자 OUT을 통해 출력한다.
그러나 도 2에 도시된 개-루프(open-loop) 방식 이외에 시간영역 부호화부(220) 및 주파수 영역 부호화부(230)에서 부호화를 모두 수행한 후 부호화된 결과를 비교한 후 시간 영역에서 부호화할지 주파수 영역에서 부호화할지를 영역 결정부(210)에서 결정하는 폐-루프(close-loop) 방식으로도 실시할 수 있다.
도 3은 본 발명에 의한 대역폭 확장 복호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
먼저, 부호화기로부터 비트스트림을 입력받아 역다중화한다(제300단계). 제300단계에서 역다중화하는 비트스트림에는 저주파수 신호가 시간 영역 또는 주파수 영역에서 부호화된 결과 및 부호화기에서 부호화된 이득값을 포함한다. 여기서, 저주파수 신호는 기 설정된 제1 주파수 보다 작은 영역에 해당하는 신호를 말한다.
제300단계에서 역다중화된 저주파수 신호가 부호화기에서 시간 영역에서 부호화되었는지 주파수 영역에서 부호화되었는지 판단한다(제305단계).
만일 제305단계에서 저주파수 신호가 시간 영역에서 부호화되었다고 판단되면, 제300단계에서 역다중화된 저주파수 신호와 저주파수 신호에 대한 여기 신호(excitation signal)를 시간 영역에서 복호화한다(제310단계). 제310단계에서 저주파수 신호를 시간 영역에서 부호화하는 방식의 예로 CELP(Code Excited Linear Prediction) 및 ACELP(Algebraic Code Excited Linear Prediction)가 있다.
제310단계에서 복호화된 여기 신호를 시간 영역에서 주파수 영역으로 변환하여 저주파수 신호에 대한 여기 신호의 스펙트럼을 생성한다(제315단계). 제315단계에서 시간 영역으로 마련된 여기 신호를 주파수 영역으로 변환하는 방식의 예로 FFT(Fast Fourier Transform) 또는 MDCT(Modified Discrete Cosine Transform) 등이 있다.
만일 제305단계에서 저주파수 신호가 주파수 영역에서 부호화되었다고 판단되면, 제300단계에서 역다중화된 저주파수 신호와 저주파수 신호에 대한 여기 스펙트럼(excitation spectrum)을 주파수 영역에서 복호화한다(제320단계). 제320단계에서 저주파수 신호를 주파수 영역에서 부호화하는 예로 TCX(Transform Coded eXcitation)가 있다.
제315단계에서 생성된 여기 신호의 스펙트럼 또는 제320단계에서 복호화된 여기 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 고주파수 영역에 고주파수 스펙트럼을 생성한다(제325단계). 여기서, 고주파수 스펙트럼은 기 설정된 제2 주파수 보다 큰 영역에 해당하는 스펙트럼을 말한다. 제1 주파수와 제2 주파수는 서로 동일한 값으로 설정되는 것이 바람직하지만, 반드시 동일한 값으로 설정하여 실시해야 하는 것은 아니다.
제325단계에서는 제315단계에서 생성된 여기 신호의 스펙트럼 또는 제320단계에서 복호화된 여기 스펙트럼을 고주파수 영역에 패치(patch)하거나 기 설정된 주파수를 기준으로 고주파수 영역에 대칭적으로 폴딩(folding)하여 여기 스펙트럼을 생성할 수 있다.
여기서, 패치하는 방식은 스펙트럼을 그대로 복사하는 것을 말하며, 폴딩하는 방식은 스펙트럼을 기준이 되는 주파수를 중심으로 대칭적으로 스펙트럼의 역상을 생성하는 것을 말한다.
폴딩하는 방식의 구체적인 예를 도 5 및 도 6에 도시하였다. 저주파수 신호와 고주파수 신호로 분할하는 기준이 되는 주파수를 중심으로 하여 LB 4에 대칭하는 HB 1을 생성하고, LB 3에 대칭하는 HB 2을 생성하며, LB 2에 대칭하는 HB 3을 생성하고, LB 1에 대칭하는 HB 4를 생성한다. 제325단계에서는 제315단계에서 생성된 여기 신호의 스펙트럼 또는 제320단계에서 복호화된 여기 스펙트럼을 폴딩하여 다음 기재된 두 가지 실시예에 의해 고주파수 스펙트럼을 생성한다.
첫째, 제315단계에서 생성된 여기 신호의 스펙트럼 또는 제320단계에서 복호화된 여기 스펙트럼의 모든 주파수 대역을 그대로 이용하여 제2 주파수 보다 큰 영역에 폴딩한다. 여기서 폴딩하는 각 밴드에는 실수 부분(real part)과 허수 부분(imaginary part)을 포함하며, 부호화하는 방식에 따라 다음 기재된 표 1와 같은 밴드의 수로 구성하여 실시할 수 있다.
부호화하는 방식 밴드의 수
ACELP 4
TCX 256 4
TCX 512 8
TCX 1024 8
둘째, 제315단계에서 생성된 여기 신호의 스펙트럼 또는 제320단계에서 복호화된 여기 스펙트럼에서 0~1KHz과 같은 특정 주파수 대역에 해당하는 부분을 제외한 후 폴딩하여 고주파수 스펙트럼을 생성한다. 폴딩함에 있어서 제외된 부분은 도 5에 도시된 바와 같이 LB 2의 일부분을 이용하여 폴딩한다. 다음 기재된 수학식 3을 이용하여 특정 주파수 대역에 해당하는 부분을 제외한 후 폴딩하여 고주파수 스펙트럼을 생성할 수 있다.
[수학식 3]
Figure 112013081110346-pat00007
단, StantFreq는 폴딩을 시작하는 주파수이고,
Figure 112013081110346-pat00008
는 72이다.
제300단계에서 역다중화한 각 밴드에 대한 이득값을 복호화한다(제330단계).
제330단계에서 복호화한 각 밴드에 대한 이득값을 제325단계에서 생성된 각 밴드에 대한 고주파수 스펙트럼에 적용한다(제335단계). 제335단계에서 이득값을 고주파수 스펙트럼에 적용함으로써 포락선이 조절된다.
제335단계에서 이득값이 적용된 고주파수 스펙트럼에 지각적인 노이즈(noise)를 부가한다(제340단계).
제340단계에서는 부호화단으로부터 전송된 정보(parameter)를 이용하여 노이즈를 부가할 수 있지만 복호화기에서 저주파수 신호가 복호화된 방식에 따라 적응적으로 노이즈를 북할 수 있다.
다음 기재된 수학식과 같은 복호화기에 기 설정된 방법에 의해 생성된 노이즈를 부가한다.
[수학식 4]
Figure 112013081110346-pat00009
단,
Figure 112013081110346-pat00010
은 평균값이 0이고 표준편차가 1인 난수이고, HBCoef는 고주파수 스펙트럼이다. 또한, 여기서 scale은 복호화기에서 저주파수 신호가 복호화된 각 방식에 따라 다음과 기재된 수학식들을 이용하여 계산한다.
만일 제310단계 또는 제320단계에서 저주파수 신호가 복호화된 방식이 ACELP 또는 TCX 256일 경우 다음 기재된 수학식 5를 이용하여 scale을 계산한다.
[수학식 5]
Figure 112013081110346-pat00011
여기서, bandIdx는 0 내지
Figure 112013081110346-pat00012
에서 1을 감산한 값이다.
만일 제310단계 또는 제320단계에서 저주파수 신호가 복호화된 방식이 TCX 512 또는 TCX 1024일 경우 다음 기재된 수학식 6을 이용하여 scale을 계산한다.
[수학식 6]
Figure 112013081110346-pat00013
여기서, bandIdx는 0 내지
Figure 112013081110346-pat00014
에서 1을 감산한 값이고, n은 0 내지 71이다.
제340단계에서 노이즈가 부가된 고주파수 스펙트럼을 주파수 영역에서 시간 영역으로 변환하여 고주파수 신호를 생성한다(제345단계).
제310단계 또는 제320단계에서 복호화된 저주파수 신호와 제345단계에서 생성된 고주파수 신호를 합성한다(제350단계).
도 4는 본 발명에 의한 대역폭 확장 복호화 장치에 대한 일 실시예를 블록도로 도시한 것으로서, 상기 대역폭 확장 복호화 장치는 역다중화부(400), 영역 판단부(405), 시간영역 복호화부(410), 변환부(415), 주파수영역 복호화부(420), 고주파수스펙트럼 생성부(425), 이득값 복호화부(430), 이득값 적용부(435), 노이즈 부가부(440), 역변환부(445) 및 영역 합성부(450)를 포함하여 이루어진다.
역다중화부(400)는 입력단자 IN을 통해 부호화기로부터 비트스트림을 입력받아 역다중화한다. 역다중화부(400)에서 역다중화하는 비트스트림에는 저주파수 신호가 시간 영역 또는 주파수 영역에서 부호화된 결과 및 부호화기에서 부호화된 이득값을 포함한다. 여기서, 저주파수 신호는 기 설정된 제1 주파수 보다 작은 영역에 해당하는 신호를 말한다.
영역 판단부(405)는 역다중화부(400)에서 역다중화된 저주파수 신호가 부호화기에서 시간 영역에서 부호화되었는지 주파수 영역에서 부호화되었는지 판단한다.
시간영역 복호화부(410)는 영역 판단부(405)에서 저주파수 신호가 시간 영역에서 부호화되었다고 판단되면 역다중화부(400)에서 역다중화된 저주파수 신호와 저주파수 신호에 대한 여기 신호(excitation signal)를 시간 영역에서 복호화한다. 시간영역 복호화부(410)에서 저주파수 신호를 시간 영역에서 부호화하는 방식의 예로 CELP(Code Excited Linear Prediction) 및 ACELP(Algebraic Code Excited Linear Prediction)가 있다.
변환부(415)는 시간영역 복호화부(410)에서 복호화된 여기 신호를 시간 영역에서 주파수 영역으로 변환하여 저주파수 신호에 대한 여기 신호의 스펙트럼을 생성한다. 변환부(415)에서 시간 영역으로 마련된 여기 신호를 주파수 영역으로 변환하는 방식의 예로 FFT(Fast Fourier Transform) 또는 MDCT(Modified Discrete Cosine Transform) 등이 있다.
주파수영역 복호화부(420)는 영역 판단부(405)에서 저주파수 신호가 주파수 영역에서 부호화되었다고 판단되면 역다중화부(400)에서 역다중화된 저주파수 신호와 저주파수 신호에 대한 여기 스펙트럼(excitation spectrum)을 주파수 영역에서 복호화한다. 주파수영역 복호화부(420)에서 저주파수 신호를 주파수 영역에서 부호화하는 예로 TCX(Transform Coded eXcitation)가 있다.
고주파수스펙트럼 생성부(425)는 변환부(415)에서 생성된 여기 신호의 스펙트럼 또는 주파수영역 복호화부(420)에서 복호화된 여기 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 고주파수 영역에 고주파수 스펙트럼을 생성한다(제325단계). 여기서, 고주파수 스펙트럼은 기 설정된 제2 주파수 보다 큰 영역에 해당하는 스펙트럼을 말한다. 제1 주파수와 제2 주파수는 서로 동일한 값으로 설정되는 것이 바람직하지만, 반드시 동일한 값으로 설정하여 실시해야 하는 것은 아니다.
고주파수스펙트럼 생성부(425)에서는 변환부(415)에서 생성된 여기 신호의 스펙트럼 또는 주파수영역 복호화부(420)에서 복호화된 여기 스펙트럼을 고주파수 영역에 패치(patch)하거나 기 설정된 주파수를 기준으로 고주파수 영역에 대칭적으로 폴딩(folding)하여 여기 스펙트럼을 생성할 수 있다.
여기서, 패치하는 방식은 스펙트럼을 그대로 복사하는 것을 말하며, 폴딩하는 방식은 스펙트럼을 기준이 되는 주파수를 중심으로 대칭적으로 스펙트럼의 역상을 생성하는 것을 말한다.
폴딩하는 방식의 구체적인 예를 도 5 및 6에 도시하였다. 저주파수 신호와 고주파수 신호로 분할하는 기준이 되는 주파수를 중심으로 하여 LB 4에 대칭하는 HB 1을 생성하고, LB 3에 대칭하는 HB 2을 생성하며, LB 2에 대칭하는 HB 3을 생성하고, LB 1에 대칭하는 HB 4를 생성한다. 고주파수스펙트럼 생성부(425)에서는 변환부(415)에서 생성된 여기 신호의 스펙트럼 또는 주파수영역 복호화부(420)에서 복호화된 여기 스펙트럼을 폴딩하여 다음 기재된 두 가지 실시예에 의해 고주파수 스펙트럼을 생성한다.
첫째, 변환부(415)에서 생성된 여기 신호의 스펙트럼 또는 주파수영역 복호화부(420)에서 복호화된 여기 스펙트럼의 모든 주파수 대역을 그대로 이용하여 제2 주파수 보다 큰 영역에 폴딩한다. 여기서 폴딩하는 각 밴드에는 실수 부분(real part)과 허수 부분(imaginary part)을 포함하며, 부호화하는 방식에 따라 다음 기재된 표 2와 같은 밴드의 수로 구성하여 실시할 수 있다.
부호화하는 방식 밴드의 수
ACELP 4
TCX 256 4
TCX 512 8
TCX 1024 8
둘째, 변환부(415)에서 생성된 여기 신호의 스펙트럼 또는 주파수영역 복호화부(420)에서 복호화된 여기 스펙트럼에서 0~1KHz과 같은 특정 주파수 대역에 해당하는 부분을 제외한 후 폴딩하여 고주파수 스펙트럼을 생성한다. 폴딩함에 있어서 제외된 부분은 도 7에 도시된 바와 같이 LB 2의 일부분을 이용하여 폴딩한다. 다음 기재된 수학식 3을 이용하여 특정 주파수 대역에 해당하는 부분을 제외한 후 폴딩하여 고주파수 스펙트럼을 생성할 수 있다.
[수학식 7]
Figure 112013081110346-pat00015
단, StartFreq는 폴딩을 지삭하는 주파수이고,
Figure 112013081110346-pat00016
는 72이다.
이득값 복호화부(430)는 역다중화부(400)에서 역다중화한 각 밴드에 대한 이득값을 복호화한다.
이득값 적용부(435)는 이득값 복호화부(430)에서 복호화한 각 밴드에 대한 이득값을 고주파수스펙트럼 생성부(425)에서 생성된 각 밴드에 대한 고주파수 스펙트럼에 적용한다. 이득값 적용부(435)에서 이득값을 고주파수 스펙트럼에 적용함으로써 포락선이 조절된다.
노이즈 부가부(440)는 이득값 적용부(435)에서 이득값이 적용된 고주파수 스펙트럼에 지각적인 노이즈(noise)를 부가한다.
노이즈 부가부(440)에서는 부호화단으로부터 전송된 정보(parameter)를 이용하여 노이즈를 부가할 수 있지만 복호화기에서 저주파수 신호가 복호화된 방식에 따라 적응적으로 노이즈를 부가할 수 있다.
다음 기재된 수학식과 같은 복호화기에 기 설정된 방법에 의해 생성된 노이즈를 부가한다.
[수학식 8]
Figure 112013081110346-pat00017
단,
Figure 112013081110346-pat00018
은 평균값이 0이고 표준편차가 1인 난수이고, HBCoef는 고주파수 스펙트럼이다. 또한, 여기서 scale은 복호화기에서 저주파수 신호가 복호화된 각 방식에 따라 다음과 기재된 수학식들을 이용하여 계산한다.
만일 시간영역 부호화부(410) 또는 주파수영역 부호화부(420)에서 저주파수 신호가 복호화된 방식이 ACELP 또는 TCX 256일 경우 다음 기재된 수학식 9를 이용하여 scale을 계산한다.
[수학식 9]
Figure 112013081110346-pat00019
여기서, bandIdx는 0 내지
Figure 112013081110346-pat00020
에서 1을 감산한 값이다.
만일 시간영역 부호화부(410) 또는 주파수영역 부호화부(420)에서 저주파수 신호가 복호화된 방식이 TCX 512 또는 TCX 1024일 경우 다음 기재된 수학식 10을 이용하여 scale을 계산한다.
[수학식 10]
Figure 112013081110346-pat00021
여기서, bandIdx는 0 내지
Figure 112013081110346-pat00022
에서 1을 감산한 값이고, n은 0 내지 71이다.
역변환부(445)는 노이즈 부가부(440)에서 노이즈가 부가된 고주파수 스펙트럼을 주파수 영역에서 시간 영역으로 역변환하여 고주파수 신호를 생성한다.
영역 합성부(450)는 시간영역 복호화부(410) 또는 주파수영역 복호화부(420)에서 복호화된 저주파수 신호와 역변환부(445)에서 생성된 고주파수 신호를 합성한다.
본 발명은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터(정보 처리 기능을 갖는 장치를 모두 포함한다)가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 장치의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장 장치 등이 있다.
이러한 본 발명에 대한 이해를 돕기 위하여 도면에 도시된 실시예를 참고로 설명되었으나, 이는 예시적인 것에 불과하며, 당해 분야에서 통상적 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위에 의해 정해져야 할 것이다.
200: 영역 분할부 210: 영역 결정부
220: 시간 결정부 220: 시간영역 부호화부
225: 제1 변환부 230: 주파수영역 부호화부
235: 여기스펙트럼 생성부 240: 제2 변환부
250: 이득값 계산부 260: 이득값 계산부
270: 다중화부

Claims (1)

  1. 기 설정된 주파수보다 작은 영역에 해당하는 저주파수 신호가 시간 영역에서 복호화되었다면 여기 신호를 복호화하여 주파수 영역으로 변환하는 단계;
    상기 저주파수 신호가 주파수 영역에서 복호화되었다면 여기 스펙트럼을 복호화하는 단계;
    상기 변환된 여기 신호의 스펙트럼 또는 상기 복호화된 여기 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 스펙트럼을 생성하는 단계; 및
    신호의 에너지와 관련된 정보를 복호화하여 상기 생성된 스펙트럼에 적용하는 단계를 포함하는 것을 특징으로 하는 대역폭 확장 복호화 방법.
KR1020130106346A 2006-06-03 2013-09-04 대역폭 확장 복호화 방법 및 장치 KR101376100B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020060050124 2006-06-03
KR20060050124 2006-06-03

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020070049947A Division KR20070115637A (ko) 2006-06-03 2007-05-22 대역폭 확장 부호화 및 복호화 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20130114039A KR20130114039A (ko) 2013-10-16
KR101376100B1 true KR101376100B1 (ko) 2014-03-19

Family

ID=38912598

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020070049947A KR20070115637A (ko) 2006-06-03 2007-05-22 대역폭 확장 부호화 및 복호화 방법 및 장치
KR1020130106346A KR101376100B1 (ko) 2006-06-03 2013-09-04 대역폭 확장 복호화 방법 및 장치

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020070049947A KR20070115637A (ko) 2006-06-03 2007-05-22 대역폭 확장 부호화 및 복호화 방법 및 장치

Country Status (5)

Country Link
US (1) US7864843B2 (ko)
EP (1) EP2036080A4 (ko)
KR (2) KR20070115637A (ko)
CN (2) CN102456349A (ko)
WO (1) WO2007142434A1 (ko)

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9159333B2 (en) * 2006-06-21 2015-10-13 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
KR101393298B1 (ko) * 2006-07-08 2014-05-12 삼성전자주식회사 적응적 부호화/복호화 방법 및 장치
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
PT2571024E (pt) 2007-08-27 2014-12-23 Ericsson Telefon Ab L M Frequência de transição adaptativa entre preenchimento de ruído e extensão da largura de banda
US9177569B2 (en) 2007-10-30 2015-11-03 Samsung Electronics Co., Ltd. Apparatus, medium and method to encode and decode high frequency signal
CN101458930B (zh) * 2007-12-12 2011-09-14 华为技术有限公司 带宽扩展中激励信号的生成及信号重建方法和装置
CN101903944B (zh) * 2007-12-18 2013-04-03 Lg电子株式会社 用于处理音频信号的方法和装置
EP2077551B1 (en) * 2008-01-04 2011-03-02 Dolby Sweden AB Audio encoder and decoder
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
CN101751926B (zh) * 2008-12-10 2012-07-04 华为技术有限公司 信号编码、解码方法及装置、编解码系统
DK2211339T3 (en) * 2009-01-23 2017-08-28 Oticon As listening System
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
CO6440537A2 (es) * 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
CN101990253A (zh) * 2009-07-31 2011-03-23 数维科技(北京)有限公司 一种带宽扩展方法及其装置
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
US20110087494A1 (en) * 2009-10-09 2011-04-14 Samsung Electronics Co., Ltd. Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
TR201904117T4 (tr) * 2010-04-16 2019-05-21 Fraunhofer Ges Forschung Kılavuzlu bant genişliği uzantısı ve gözü kapalı bant genişliği uzantısı kullanılarak bir geniş bantlı sinyal üretilmesine yönelik aparat, yöntem ve bilgisayar programı.
KR101696632B1 (ko) 2010-07-02 2017-01-16 돌비 인터네셔널 에이비 선택적인 베이스 포스트 필터
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
EP2657933B1 (en) * 2010-12-29 2016-03-02 Samsung Electronics Co., Ltd Coding apparatus and decoding apparatus with bandwidth extension
JP5704397B2 (ja) 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
KR102078865B1 (ko) * 2011-06-30 2020-02-19 삼성전자주식회사 대역폭 확장신호 생성장치 및 방법
EP3611728A1 (en) * 2012-03-21 2020-02-19 Samsung Electronics Co., Ltd. Method and apparatus for high-frequency encoding/decoding for bandwidth extension
KR101398189B1 (ko) * 2012-03-27 2014-05-22 광주과학기술원 음성수신장치 및 음성수신방법
CN103368682B (zh) * 2012-03-29 2016-12-07 华为技术有限公司 信号编码和解码的方法和设备
KR101740219B1 (ko) * 2012-03-29 2017-05-25 텔레폰악티에볼라겟엘엠에릭슨(펍) 고조파 오디오 시그널의 대역폭 연장
CN105976830B (zh) * 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
CN103928031B (zh) 2013-01-15 2016-03-30 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
CN106847297B (zh) 2013-01-29 2020-07-07 华为技术有限公司 高频带信号的预测方法、编/解码设备
EP3067890B1 (en) * 2013-01-29 2018-01-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension
US9601125B2 (en) 2013-02-08 2017-03-21 Qualcomm Incorporated Systems and methods of performing noise modulation and gain adjustment
ES2872024T3 (es) * 2013-03-04 2021-11-02 Voiceage Evs Llc Dispositivo y método para reducir ruido de cuantificación en un decodificador de dominio de tiempo
CN104103276B (zh) * 2013-04-12 2017-04-12 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
CN104217727B (zh) * 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
CN103413557B (zh) * 2013-07-08 2017-03-15 深圳Tcl新技术有限公司 语音信号带宽扩展的方法和装置
EP2830064A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
JP6531649B2 (ja) 2013-09-19 2019-06-19 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
CN104517611B (zh) 2013-09-26 2016-05-25 华为技术有限公司 一种高频激励信号预测方法及装置
US20150149157A1 (en) * 2013-11-22 2015-05-28 Qualcomm Incorporated Frequency domain gain shape estimation
US10163447B2 (en) * 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
CN105849801B (zh) 2013-12-27 2020-02-14 索尼公司 解码设备和方法以及程序
CN111370008B (zh) * 2014-02-28 2024-04-09 弗朗霍弗应用研究促进协会 解码装置、编码装置、解码方法、编码方法、终端装置、以及基站装置
KR102386736B1 (ko) * 2014-03-03 2022-04-14 삼성전자주식회사 대역폭 확장을 위한 고주파 복호화 방법 및 장치
EP3115991A4 (en) 2014-03-03 2017-08-02 Samsung Electronics Co., Ltd. Method and apparatus for high frequency decoding for bandwidth extension
WO2015162500A2 (ko) 2014-03-24 2015-10-29 삼성전자 주식회사 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치
US9685164B2 (en) * 2014-03-31 2017-06-20 Qualcomm Incorporated Systems and methods of switching coding technologies at a device
EP3182412B1 (en) * 2014-08-15 2023-06-07 Samsung Electronics Co., Ltd. Sound quality improving method and device, sound decoding method and device, and multimedia device employing same
CN104269173B (zh) * 2014-09-30 2018-03-13 武汉大学深圳研究院 切换模式的音频带宽扩展装置与方法
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
KR102250472B1 (ko) * 2016-03-07 2021-05-12 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 하이브리드 은닉 방법: 오디오 코덱들에서 주파수 및 시간 도메인 패킷 손실 은닉의 결합
KR20180056032A (ko) 2016-11-18 2018-05-28 삼성전자주식회사 신호 처리 프로세서 및 신호 처리 프로세서의 제어 방법
CN108198571B (zh) * 2017-12-21 2021-07-30 中国科学院声学研究所 一种基于自适应带宽判断的带宽扩展方法及系统
CN118215959A (zh) * 2022-09-05 2024-06-18 北京小米移动软件有限公司 一种音频信号频带扩展方法、装置、设备及存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
US5774837A (en) * 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
JPH10124088A (ja) * 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
US5999897A (en) * 1997-11-14 1999-12-07 Comsat Corporation Method and apparatus for pitch estimation using perception based analysis by synthesis
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US20020128839A1 (en) * 2001-01-12 2002-09-12 Ulf Lindgren Speech bandwidth extension
JP2005509928A (ja) * 2001-11-23 2005-04-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号帯域幅拡張
JP3861770B2 (ja) * 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
WO2007148925A1 (en) * 2006-06-21 2007-12-27 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
QIAN, Y. et al. 'Combining Equalization and Estimation for Bandwidth Extension of Narrowband Speech' In: Proceedings of the 2004 IEEE International Conference *

Also Published As

Publication number Publication date
US7864843B2 (en) 2011-01-04
KR20130114039A (ko) 2013-10-16
CN101083076B (zh) 2012-03-14
EP2036080A1 (en) 2009-03-18
US20070282599A1 (en) 2007-12-06
CN101083076A (zh) 2007-12-05
EP2036080A4 (en) 2012-05-30
WO2007142434A1 (en) 2007-12-13
CN102456349A (zh) 2012-05-16
KR20070115637A (ko) 2007-12-06

Similar Documents

Publication Publication Date Title
KR101376100B1 (ko) 대역폭 확장 복호화 방법 및 장치
KR101376098B1 (ko) 대역폭 확장 복호화 방법 및 장치
US10115407B2 (en) Method and apparatus for encoding and decoding high frequency signal
KR101379263B1 (ko) 대역폭 확장 복호화 방법 및 장치
KR101373004B1 (ko) 고주파수 신호 부호화 및 복호화 장치 및 방법
KR101355376B1 (ko) 고주파수 영역 부호화 및 복호화 방법 및 장치
KR101434198B1 (ko) 신호 복호화 방법
KR101390188B1 (ko) 적응적 고주파수영역 부호화 및 복호화 방법 및 장치
KR101411900B1 (ko) 오디오 신호의 부호화 및 복호화 방법 및 장치
KR20080027129A (ko) 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
US9847095B2 (en) Method and apparatus for adaptively encoding and decoding high frequency band
US20090037180A1 (en) Transcoding method and apparatus
KR101457897B1 (ko) 대역폭 확장 부호화 및 복호화 방법 및 장치
KR20130012972A (ko) 오디오/스피치 신호 부호화방법
KR20120089230A (ko) 신호 복호화 장치

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee