KR20130114039A - 대역폭 확장 복호화 방법 및 장치 - Google Patents

대역폭 확장 복호화 방법 및 장치 Download PDF

Info

Publication number
KR20130114039A
KR20130114039A KR1020130106346A KR20130106346A KR20130114039A KR 20130114039 A KR20130114039 A KR 20130114039A KR 1020130106346 A KR1020130106346 A KR 1020130106346A KR 20130106346 A KR20130106346 A KR 20130106346A KR 20130114039 A KR20130114039 A KR 20130114039A
Authority
KR
South Korea
Prior art keywords
spectrum
signal
frequency
excitation
low frequency
Prior art date
Application number
KR1020130106346A
Other languages
English (en)
Other versions
KR101376100B1 (ko
Inventor
주기현
오은미
손창용
김중회
레이 미아오
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Publication of KR20130114039A publication Critical patent/KR20130114039A/ko
Application granted granted Critical
Publication of KR101376100B1 publication Critical patent/KR101376100B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 오디오 신호를 부호화하거나 복호화하는 방법 및 장치에 관한 것으로 시간 영역 또는 주파수 영역에서 부호화된 저주파수 신호에 대한 여기 신호 또는 여기 스펙트럼을 이용하여 고주파수 신호를 부호화하거나 복호화함으로써 적은 비트를 이용하여 오디오 신호를 부호화하거나 복호화함에도 불구하고 고주파수 영역에 해당하는 신호의 음질을 저하시키지 않으므로 코딩 효율을 극대화할 수 있는 효과를 거둘 수 있다.

Description

대역폭 확장 복호화 방법 및 장치{Method and apparatus for bandwidth extension decoding}
본 발명은 음성 신호 또는 음악 신호와 같은 오디오 신호를 부호화하거나 복호화하는 방법 및 장치에 관한 것으로, 보다 상세하게는 오디오 신호 가운데 고주파수 영역에 해당하는 신호를 부호화하거나 복호화하는 방법 및 장치에 관한 것이다.
고주파수 영역에 해당하는 신호는 저주파수 영역에 해당하는 신호에 비하여 인간이 소리로서 인식하는 데 중요성이 떨어지는 것이 일반적이다. 그러므로 오디오 신호를 부호화함에 있어서 가용한 비트에 대한 제약이 있어 코딩의 효율을 높여야 할 경우 저주파수 영역에 해당하는 신호에는 많은 비트를 할당하여 부호화하지만 이에 비하여 고주파수 영역에 해당하는 신호에는 적은 비트를 할당하여 부호화한다.
그러므로 고주파수 영역에 해당하는 신호를 부호화함에 있어서 적은 비트를 이용하고도 인간이 인식하는 음질을 최대한 향상시킬 수 있는 방법 및 장치가 요구된다.
본 발명이 이루고자 하는 기술적 과제는, 시간 영역 또는 주파수 영역에서 부호화된 저주파수 신호에 대한 여기 신호 또는 여기 스펙트럼을 이용하여 고주파수 신호를 부호화하거나 복호화하는 방법 및 장치를 제공하는 것이다.
상기의 과제를 이루기 위한 본 발명에 의한 대역폭 확장 복호화 방법은, 기 설정된 주파수 보다 작은 영역에 해당하는 저주파수 신호가 시간 영역에서 복호화되었다면 여기 신호를 복호화하여 주파수 영역으로 변환하는 단계, 상기 저주파수 신호가 주파수 영역에서 복호화되었다면 여기 스펙트럼을 복호화하는 단계, 상기 변환된 여기 신호의 스펙트럼 또는 상기 복호화된 여기 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 스펙트럼을 생성하는 단계 및 이득값을 복호화하여 상기 생성된 스펙트럼에 적용하는 단계를 포함하는 것을 특징으로 한다.
상기의 과제를 이루기 위한 본 발명에 의한 대역폭 확장 복호화 장치는, 기 설정된 주파수 보다 작은 영역에 해당하는 저주파수 신호가 시간 영역에서 복호화되었다면 여기 신호를 복호화하여 주파수 영역으로 변환하는 시간영역 복호화부, 상기 저주파수 신호가 주파수 영역에서 복호화되었다면 여기 스펙트럼을 복호화하는 주파수영역 복호화부, 상기 변환된 여기 신호의 스펙트럼 또는 상기 복호화된 여기 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 스펙트럼을 생성하는 스펙트럼 생성부 및 이득값을 복호화하여 상기 생성된 스펙트럼에 적용하는 이득값 적용부를 포함하는 것을 특징으로 한다.
상기의 과제를 이루기 위한 본 발명에 의한 기록 매체는, 기 설정된 주파수 보다 작은 영역에 해당하는 저주파수 신호가 시간 영역에서 복호화되었다면 여기 신호를 복호화하여 주파수 영역으로 변환하는 단계, 상기 저주파수 신호가 주파수 영역에서 복호화되었다면 여기 스펙트럼을 복호화하는 단계, 상기 변환된 여기 신호의 스펙트럼 또는 상기 복호화된 여기 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 스펙트럼을 생성하는 단계 및 이득값을 복호화하여 상기 생성된 스펙트럼에 적용하는 단계를 포함하는 발명을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있다.
본 발명에 의한 대역폭 확장 부호화 및 복호화 방법 및 장치에 의하면, 시간 영역 또는 주파수 영역에서 부호화된 저주파수 신호에 대한 여기 신호 또는 여기 스펙트럼을 이용하여 고주파수 신호를 부호화하거나 복호화한다.
이렇게 함으로써 적은 비트를 이용하여 오디오 신호를 부호화하거나 복호화함에도 불구하고 고주파수 영역에 해당하는 신호의 음질을 저하시키지 않으므로 코딩 효율을 극대화할 수 있는 효과를 거둘 수 있다.
도 1은 본 발명에 의한 대역폭 확장 부호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
도 2는 본 발명에 의한 대역폭 확장 부호화 장치에 대한 일 실시예를 블록도로 도시한 것이다.
도 3은 본 발명에 의한 대역폭 확장 복호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
도 4는 본 발명에 의한 대역폭 확장 복호화 장치에 대한 일 실시예를 블록도로 도시한 것
도 5는 본 발명에 의한 대역폭 확장 부호화 및 복호화 장치에서 폴딩하는 방식에 대한 일 실시예를 그래프로 도시한 것이다.
도 6은 본 발명에 의한 대역폭 확장 부호화 및 복호화 장치에서 폴딩하는 방식에 대한 다른 일 실시예를 그래프로 도시한 것이다.
이하, 첨부된 도면들을 참조하여 본 발명에 따른 대역폭 확장 부호화 및 복호화 방법 및 장치에 대해 상세히 설명한다.
도 1은 본 발명에 의한 대역폭 확장 부호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
먼저, 입력된 신호를 기 설정된 주파수를 기준으로 하여 저주파수 신호와 고주파수 신호로 분할한다(제100단계). 여기서, 저주파수 신호는 기 설정된 제1 주파수 보다 작은 영역에 해당하는 신호이며, 고주파수 신호는 기 설정된 제2 주파수 보다 큰 영역에 해당하는 신호를 말한다. 제1 주파수와 제2 주파수는 서로 동일한 값으로 설정되는 것이 바람직하지만, 반드시 동일한 값으로 설정하여 실시해야 하는 것은 아니다.
제100단계에서 분할된 저주파수 신호를 기 설정된 기준에 따라 시간 영역에서 부호화할지 주파수 영역에서 부호화할지 결정한다(제110단계).
만일 제100단계에서 분할된 저주파수 신호를 시간 영역에서 부호화하는 것으로 제110단계에서 결정되면, 제100단계에서 분할된 저주파수 신호를 시간 영역에서 부호화한다(제120단계). 제120단계에서 저주파수 신호를 시간 영역에서 부호화하는 방식의 예로 CELP(Code Excited Linear Prediction) 및 ACELP(Algebraic Code Excited Linear Prediction)가 있다.
제120단계에서는 제100단계에서 분할된 저주파수 신호를 시간 영역에서 부호화하는 과정에서 포락선(envelope)을 제거한 여기 신호(excitation signal)를 추출한다. 제120단계에서 포락선을 제거하는 실시예로 LPC(Linear Predictive Coding) 분석을 수행함으로써 포락선을 제거하여 여기 신호를 추출할 수 있다.
제120단계에서 추출된 여기 신호를 시간 영역에서 주파수 영역으로 변환하여 저주파수 신호에 대한 여기 신호의 스펙트럼을 생성한다(제125단계). 제125단계에서 시간 영역으로 마련된 여기 신호를 주파수 영역으로 변환하는 방식의 예로 FFT(Fast Fourier Transform) 또는 MDCT(Modified Discrete Cosine Transform) 등이 있다.
만일 제100단계에서 분할된 저주파수 신호를 주파수 영역에서 부호화하는 것으로 제110단계에서 결정되면, 제100단계에서 분할된 저주파수 신호를 주파수 영역에서 부호화한다(제130단계). 제130단계에서 저주파수 신호를 주파수 영역에서 부호화하는 예로 TCX(Transform Coded eXcitation)가 있다.
제130단계에서는 제100단계에서 분할된 저주파수 신호를 주파수 영역에서 부호화하는 과정에서 포락선(envelope)을 제거한 여기 스펙트럼(excitation spectrum)을 추출한다.
제130단계에서 TCX에 의해 부호화하는 과정에서 여기 스펙트럼을 추출하는 방식으로 다음 기재된 두 실시예가 있다. 첫째, TCX에서 웨이티드 스피치 도메인(weighted speech domain)의 스펙트럼을 이용하여 여기 스펙트럼을 추출할 수 있다. 둘째, TCX를 수행하는 과정에서 소정의 구성요소를 수행하지 않음으로써 퍼셉추얼 웨이팅(Perceptual weighting)을 제거하여 여기 스펙트럼을 추출할 수 있다.
제130단계는 FFT(Fast Fourier Transform) 혹은 MDCT(Modified Discrete Cosine Transform)에서도 수행될 수 있다. 이 경우 ACELP 부호화 방식과 동일한 여기 신호의 스펙트럼을 이용하여 고주파수 스펙트럼을 복원한다.
제125단계에서 생성된 여기 신호의 스펙트럼 또는 제130단계에서 추출된 여기 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 고주파수 영역에 여기 스펙트럼을 생성한다(제135단계). 제135단계에서는 제125단계에서 생성된 여기 신호의 스펙트럼 또는 제130단계에서 추출된 여기 스펙트럼을 고주파수 영역에 패치(patch)하거나 기 설정된 주파수를 기준으로 고주파수 영역에 대칭적으로 폴딩(folding)하여 여기 스펙트럼을 생성할 수 있다.
제100단계에서 분할된 고주파수 신호를 시간 영역에서 주파수 영역으로 변환하여 고주파수 스펙트럼을 생성한다(제140단계). 제140단계에서 시간 영역으로 마련된 고주파수 신호를 주파수 영역으로 변환하는 방식의 예로 FFT 또는 MDCT 등이 있다.
제135단계에서 생성된 여기 스펙트럼과 제140단계에서 생성된 고주파수 스펙트럼을 이용하여 이득값(gain)을 계산한다(제150단계). 제150단계에서 계산된 이득값은 복호화기에서 복호화된 저주파수에 대한 여기 신호의 스펙트럼을 이용하여 고주파수 스펙트럼을 복원하는 데 이용된다. 즉, 복호화기에서 저주파수에 대한 여기 신호의 스펙트럼을 이용하여 고주파수 스펙트럼을 생성함에 있어서, 고주파수 스펙트럼의 포락선(envelope)을 조절하기 위하여 이득값을 구한다.
제150단계에서는 제135단계에서 생성된 여기 스펙트럼에 대한 각 밴드의 에너지 값과 제140단계에서 생성된 고주파수 스펙트럼에 대한 각 밴드의 에너지 값에 대한 비율을 이득값으로 다음 기재된 수학식 1에 의해 계산할 수 있다.
[수학식 1]
Figure pat00001
여기서, g(n)은 제150단계에서 계산된 이득값이며, n은 밴드의 인덱스(band index)이고, i는 스펙트럴 라인 인덱스(spectral line index)이며,
Figure pat00002
은 제135단계에서 생성된 여기 스펙트럼이고,
Figure pat00003
는 제140단계에서 생성된 고주파수 스펙트럼이며, N은 기 설정된 상수이다.
제150단계에서 계산된 이득값을 양자화(Quantization)하여 부호화한다(제160단계). 제160단계는 ACELP, TCX 256 및 TCX 512에 대하여 4차원 벡터-양자화(vector quantization)을 수행하고, TCX 1024에 대하여 2차원 벡터-양자화를 수행할 수 있다. 또한, 제160단계는 제150단계에서 계산된 이득값을 스칼라 양자화에 의해서 수행할 수도 있다.
제120단계 또는 제130단계에서 저주파수 신호가 부호화된 결과 및 제150단계에서 양자화된 이득값을 포함하여 다중화함으로써 비트스트림(bitstream)을 생성한다(제170단계).
그러나 도 1에 도시된 개-루프(open-loop) 방식 이외에 제120단계 내지 130단계를 모두 수행한 후 부호화된 결과를 비교하여 시간 영역에서 부호화할지 주파수 영역에서 부호화할지를 결정하는 폐-루프(close-loop) 방식으로도 실시할 수 있다.
도 2는 본 발명에 의한 대역폭 확장 부호화 장치에 대한 일 실시예를 블록도로 도시한 것으로서, 상기 대역폭 확장 부호화 장치는 영역 분할부(200), 영역 결정부(210), 시간영역 부호화부(220), 제1 변환부(225), 주파수영역 부호화부(230), 여기스펙트럼 생성부(235), 제2 변환부(240), 이득값 계산부(250), 이득값 부호화부(260) 및 다중화부(270)를 포함하여 이루어진다.
영역 분할부(200)는 입력단자 IN을 통해 입력된 신호를 기 설정된 주파수를 기준으로 하여 저주파수 신호와 고주파수 신호로 분할한다. 여기서, 저주파수 신호는 기 설정된 제1 주파수 보다 작은 영역에 해당하는 신호이며, 고주파수 신호는 기 설정된 제2 주파수 보다 큰 영역에 해당하는 신호를 말한다. 제1 주파수와 제2 주파수는 서로 동일한 값으로 설정되는 것이 바람직하지만, 반드시 동일한 값으로 설정하여 실시해야 하는 것은 아니다.
영역 결정부(210)는 영역 분할부(200)에서 분할된 저주파수 신호를 기 설정된 기준에 따라 시간 영역에서 부호화할지 주파수 영역에서 부호화할지 결정한다.
시간영역 부호화부(220)는 영역 분할부(200)에서 분할된 저주파수 신호를 시간 영역에서 부호화하는 것으로 영역 결정부(210)에서 결정되면 영역분할부(200)에서 분할된 저주파수 신호를 시간 영역에서 부호화한다. 시간영역 부호화부(220)에서 저주파수 신호를 시간 영역에서 부호화하는 방식의 예로 CELP(Code Excited Linear Prediction) 및 ACELP(Algebraic Code Excited Linear Prediction)가 있다.
시간영역 부호화부(220)에서는 영역 분할부(200)에서 분할된 저주파수 신호를 시간 영역에서 부호화하는 과정에서 포락선(envelope)을 제거한 여기 신호(excitation signal)를 추출한다. 시간영역 부호화부(220)에서 포락선을 제거하는 실시예로 LPC(Linear Predictive Coding) 분석을 수행함으로써 포락선을 제거하여 여기 신호를 추출할 수 있다.
제1 변환부(225)는 시간영역 부호화부(220)에서 추출된 여기 신호를 시간 영역에서 주파수 영역으로 변환하여 저주파수 신호에 대한 여기 신호의 스펙트럼을 생성한다. 제1 변환부(225)에서 시간 영역으로 마련된 여기 신호를 주파수 영역으로 변환하는 방식의 예로 FFT(Fast Fourier Transform) 또는 MDCT(Modified Discrete Cosine Transform) 등이 있다.
주파수영역 부호화부(230)는 영역 분할부(200)에서 분할된 저주파수 신호를 주파수 영역에서 부호화하는 것으로 영역 결정부(210)에서 결정되면 영역 분할부(200)에서 분할된 저주파수 신호를 주파수 영역에서 부호화한다. 주파수영역 부호화부(230)에서 저주파수 신호를 주파수 영역에서 부호화하는 방식의 예로 TCX(Transform Coded eXcitation)가 있다.
주파수영역 부호화부(230)에서는 영역 분할부(200)에서 분할된 저주파수 신호를 주파수 영역에서 부호화하는 과정에서 포락선(envelope)을 제거한 여기 스펙트럼(excitation spectrum)을 추출한다.
주파수영역 부호화부(230)에서 TCX에 의해 부호화하는 과정에서 여기 스펙트럼을 추출하는 방식으로 다음 기재된 두 실시예가 있다. 첫째, TCX에서 웨이티드 스피치 도메인(weighted speech domain)의 스펙트럼을 이용하여 여기 스펙트럼을 추출할 수 있다. 둘째, TCX를 수행하는 과정에서 소정의 구성요소를 수행하지 않음으로써 퍼셉추얼 웨이팅(Perceptual weighting)을 제거하여 여기 스펙트럼을 추출할 수 있다.
주파수영역 부호화부(230)는 FFT(Fast Fourier Transform) 혹은 MDCT(Modified Discrete Cosine Transform)에서도 수행될 수 있다. 이 경우 ACELP 부호화 방식과 동일한 여기 신호의 스펙트럼을 이용하여 고주파수 스펙트럼을 복원한다.
여기스펙트럼 생성부(235)는 제1 변환부(225)에서 생성된 여기 신호의 스펙트럼 또는 주파수영역 부호화부(230)에서 추출된 여기 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 고주파수 영역에 여기 스펙트럼을 생성한다. 여기스펙트럼 생성부(235)는 제1 변환부(225)에서 생성된 여기 신호의 스펙트럼 또는 주파수영역 부호화부(230)에서 추출된 여기 스펙트럼을 고주파수 영역에 패치(patch)하거나 기 설정된 주파수를 기준으로 고주파수 영역에 대칭적으로 폴딩(folding)하여 여기 스펙트럼을 생성할 수 있다.
제2 변환부(240)는 영역 분할부(200)에서 분할된 고주파수 신호를 시간 영역에서 주파수 영역으로 변환하여 고주파수 스펙트럼을 생성한다. 제2 변환부(240)에서 시간 영역으로 마련된 고주파수 신호를 주파수 영역으로 변환하는 방식의 예로 FFT 또는 MDCT 등이 있다.
이득값 계산부(250)는 여기스펙트럼 생성부(235)에서 생성된 스펙트럼과 제2 변환부(240)에서 생성된 고주파수 스펙트럼을 이용하여 이득값(gain)을 계산한다. 이득값 계산부(250)에서 계산된 이득값은 복호화기에서 복호화된 저주파수에 대한 여기 신호의 스펙트럼을 이용하여 고주파수 스펙트럼을 복원하는 데 이용된다. 즉, 복호화기에서 저주파수에 대한 여기 신호의 스펙트럼을 이용하여 고주파수 스펙트럼을 생성함에 있어서, 고주파수 스펙트럼의 포락선(envelope)을 조절하기 위하여 이득값을 구한다.
이득값 계산부(250)에서는 여기스펙트럼 생성부(235)에서 생성된 스펙트럼에 대한 각 밴드의 에너지 값과 제2 변환부(240)에서 생성된 고주파수 스펙트럼에 대한 각 밴드의 에너지 값에 대한 비율을 이득값으로 다음 기재된 수학식 2에 의해 계산할 수 있다.
[수학식 2]
Figure pat00004
여기서, g(n)은 이득값 계산부(250)에서 계산된 이득값이며, n은 밴드의 인덱스(band index)이고, i는 스펙트럴 라인 인덱스(spectral line index)이며,
Figure pat00005
은 여기스펙트럼 생성부(235)에서 생성된 스펙트럼이고,
Figure pat00006
는 제2 변환부(240)에서 생성된 고주파수 스펙트럼이며, N은 기 설정된 상수이다.
이득값 부호화부(260)는 이득값 계산부(250)에서 계산된 이득값을 양자화(Quantization)하여 부호화한다. 이득값 부호화부(260)에서는 ACELP, TCX 256 및 TCX 512에 대하여 4차원 벡터-양자화(vector quantization)을 수행하고, TCX 1024에 대하여 2차원 벡터-양자화를 수행할 수 있다. 또한, 이득값 부호화부(260)에서는 이득값 계산부(250)에서 계산된 이득값을 스칼라 양자화에 의해서 수행할 수도 있다.
다중화부(270)는 시간영역 부호화부(220) 또는 주파수영역 부호화부(230)에서 저주파수 신호가 부호화된 결과 및 이득값 부호화부(260)에서 양자화된 이득값을 포함하여 다중화함으로써 비트스트림(bitstream)을 생성하고 출력단자 OUT을 통해 출력한다.
그러나 도 2에 도시된 개-루프(open-loop) 방식 이외에 시간영역 부호화부(220) 및 주파수 영역 부호화부(230)에서 부호화를 모두 수행한 후 부호화된 결과를 비교한 후 시간 영역에서 부호화할지 주파수 영역에서 부호화할지를 영역 결정부(210)에서 결정하는 폐-루프(close-loop) 방식으로도 실시할 수 있다.
도 3은 본 발명에 의한 대역폭 확장 복호화 방법에 대한 일 실시예를 흐름도로 도시한 것이다.
먼저, 부호화기로부터 비트스트림을 입력받아 역다중화한다(제300단계). 제300단계에서 역다중화하는 비트스트림에는 저주파수 신호가 시간 영역 또는 주파수 영역에서 부호화된 결과 및 부호화기에서 부호화된 이득값을 포함한다. 여기서, 저주파수 신호는 기 설정된 제1 주파수 보다 작은 영역에 해당하는 신호를 말한다.
제300단계에서 역다중화된 저주파수 신호가 부호화기에서 시간 영역에서 부호화되었는지 주파수 영역에서 부호화되었는지 판단한다(제305단계).
만일 제305단계에서 저주파수 신호가 시간 영역에서 부호화되었다고 판단되면, 제300단계에서 역다중화된 저주파수 신호와 저주파수 신호에 대한 여기 신호(excitation signal)를 시간 영역에서 복호화한다(제310단계). 제310단계에서 저주파수 신호를 시간 영역에서 부호화하는 방식의 예로 CELP(Code Excited Linear Prediction) 및 ACELP(Algebraic Code Excited Linear Prediction)가 있다.
제310단계에서 복호화된 여기 신호를 시간 영역에서 주파수 영역으로 변환하여 저주파수 신호에 대한 여기 신호의 스펙트럼을 생성한다(제315단계). 제315단계에서 시간 영역으로 마련된 여기 신호를 주파수 영역으로 변환하는 방식의 예로 FFT(Fast Fourier Transform) 또는 MDCT(Modified Discrete Cosine Transform) 등이 있다.
만일 제305단계에서 저주파수 신호가 주파수 영역에서 부호화되었다고 판단되면, 제300단계에서 역다중화된 저주파수 신호와 저주파수 신호에 대한 여기 스펙트럼(excitation spectrum)을 주파수 영역에서 복호화한다(제320단계). 제320단계에서 저주파수 신호를 주파수 영역에서 부호화하는 예로 TCX(Transform Coded eXcitation)가 있다.
제315단계에서 생성된 여기 신호의 스펙트럼 또는 제320단계에서 복호화된 여기 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 고주파수 영역에 고주파수 스펙트럼을 생성한다(제325단계). 여기서, 고주파수 스펙트럼은 기 설정된 제2 주파수 보다 큰 영역에 해당하는 스펙트럼을 말한다. 제1 주파수와 제2 주파수는 서로 동일한 값으로 설정되는 것이 바람직하지만, 반드시 동일한 값으로 설정하여 실시해야 하는 것은 아니다.
제325단계에서는 제315단계에서 생성된 여기 신호의 스펙트럼 또는 제320단계에서 복호화된 여기 스펙트럼을 고주파수 영역에 패치(patch)하거나 기 설정된 주파수를 기준으로 고주파수 영역에 대칭적으로 폴딩(folding)하여 여기 스펙트럼을 생성할 수 있다.
여기서, 패치하는 방식은 스펙트럼을 그대로 복사하는 것을 말하며, 폴딩하는 방식은 스펙트럼을 기준이 되는 주파수를 중심으로 대칭적으로 스펙트럼의 역상을 생성하는 것을 말한다.
폴딩하는 방식의 구체적인 예를 도 5 및 도 6에 도시하였다. 저주파수 신호와 고주파수 신호로 분할하는 기준이 되는 주파수를 중심으로 하여 LB 4에 대칭하는 HB 1을 생성하고, LB 3에 대칭하는 HB 2을 생성하며, LB 2에 대칭하는 HB 3을 생성하고, LB 1에 대칭하는 HB 4를 생성한다. 제325단계에서는 제315단계에서 생성된 여기 신호의 스펙트럼 또는 제320단계에서 복호화된 여기 스펙트럼을 폴딩하여 다음 기재된 두 가지 실시예에 의해 고주파수 스펙트럼을 생성한다.
첫째, 제315단계에서 생성된 여기 신호의 스펙트럼 또는 제320단계에서 복호화된 여기 스펙트럼의 모든 주파수 대역을 그대로 이용하여 제2 주파수 보다 큰 영역에 폴딩한다. 여기서 폴딩하는 각 밴드에는 실수 부분(real part)과 허수 부분(imaginary part)을 포함하며, 부호화하는 방식에 따라 다음 기재된 표 1와 같은 밴드의 수로 구성하여 실시할 수 있다.
부호화하는 방식 밴드의 수
ACELP 4
TCX 256 4
TCX 512 8
TCX 1024 8
둘째, 제315단계에서 생성된 여기 신호의 스펙트럼 또는 제320단계에서 복호화된 여기 스펙트럼에서 0~1KHz과 같은 특정 주파수 대역에 해당하는 부분을 제외한 후 폴딩하여 고주파수 스펙트럼을 생성한다. 폴딩함에 있어서 제외된 부분은 도 5에 도시된 바와 같이 LB 2의 일부분을 이용하여 폴딩한다. 다음 기재된 수학식 3을 이용하여 특정 주파수 대역에 해당하는 부분을 제외한 후 폴딩하여 고주파수 스펙트럼을 생성할 수 있다.
[수학식 3]
Figure pat00007
단, StantFreq는 폴딩을 시작하는 주파수이고,
Figure pat00008
는 72이다.
제300단계에서 역다중화한 각 밴드에 대한 이득값을 복호화한다(제330단계).
제330단계에서 복호화한 각 밴드에 대한 이득값을 제325단계에서 생성된 각 밴드에 대한 고주파수 스펙트럼에 적용한다(제335단계). 제335단계에서 이득값을 고주파수 스펙트럼에 적용함으로써 포락선이 조절된다.
제335단계에서 이득값이 적용된 고주파수 스펙트럼에 지각적인 노이즈(noise)를 부가한다(제340단계).
제340단계에서는 부호화단으로부터 전송된 정보(parameter)를 이용하여 노이즈를 부가할 수 있지만 복호화기에서 저주파수 신호가 복호화된 방식에 따라 적응적으로 노이즈를 북할 수 있다.
다음 기재된 수학식과 같은 복호화기에 기 설정된 방법에 의해 생성된 노이즈를 부가한다.
[수학식 4]
Figure pat00009
단,
Figure pat00010
은 평균값이 0이고 표준편차가 1인 난수이고, HBCoef는 고주파수 스펙트럼이다. 또한, 여기서 scale은 복호화기에서 저주파수 신호가 복호화된 각 방식에 따라 다음과 기재된 수학식들을 이용하여 계산한다.
만일 제310단계 또는 제320단계에서 저주파수 신호가 복호화된 방식이 ACELP 또는 TCX 256일 경우 다음 기재된 수학식 5를 이용하여 scale을 계산한다.
[수학식 5]
Figure pat00011
여기서, bandIdx는 0 내지
Figure pat00012
에서 1을 감산한 값이다.
만일 제310단계 또는 제320단계에서 저주파수 신호가 복호화된 방식이 TCX 512 또는 TCX 1024일 경우 다음 기재된 수학식 6을 이용하여 scale을 계산한다.
[수학식 6]
Figure pat00013
여기서, bandIdx는 0 내지
Figure pat00014
에서 1을 감산한 값이고, n은 0 내지 71이다.
제340단계에서 노이즈가 부가된 고주파수 스펙트럼을 주파수 영역에서 시간 영역으로 변환하여 고주파수 신호를 생성한다(제345단계).
제310단계 또는 제320단계에서 복호화된 저주파수 신호와 제345단계에서 생성된 고주파수 신호를 합성한다(제350단계).
도 4는 본 발명에 의한 대역폭 확장 복호화 장치에 대한 일 실시예를 블록도로 도시한 것으로서, 상기 대역폭 확장 복호화 장치는 역다중화부(400), 영역 판단부(405), 시간영역 복호화부(410), 변환부(415), 주파수영역 복호화부(420), 고주파수스펙트럼 생성부(425), 이득값 복호화부(430), 이득값 적용부(435), 노이즈 부가부(440), 역변환부(445) 및 영역 합성부(450)를 포함하여 이루어진다.
역다중화부(400)는 입력단자 IN을 통해 부호화기로부터 비트스트림을 입력받아 역다중화한다. 역다중화부(400)에서 역다중화하는 비트스트림에는 저주파수 신호가 시간 영역 또는 주파수 영역에서 부호화된 결과 및 부호화기에서 부호화된 이득값을 포함한다. 여기서, 저주파수 신호는 기 설정된 제1 주파수 보다 작은 영역에 해당하는 신호를 말한다.
영역 판단부(405)는 역다중화부(400)에서 역다중화된 저주파수 신호가 부호화기에서 시간 영역에서 부호화되었는지 주파수 영역에서 부호화되었는지 판단한다.
시간영역 복호화부(410)는 영역 판단부(405)에서 저주파수 신호가 시간 영역에서 부호화되었다고 판단되면 역다중화부(400)에서 역다중화된 저주파수 신호와 저주파수 신호에 대한 여기 신호(excitation signal)를 시간 영역에서 복호화한다. 시간영역 복호화부(410)에서 저주파수 신호를 시간 영역에서 부호화하는 방식의 예로 CELP(Code Excited Linear Prediction) 및 ACELP(Algebraic Code Excited Linear Prediction)가 있다.
변환부(415)는 시간영역 복호화부(410)에서 복호화된 여기 신호를 시간 영역에서 주파수 영역으로 변환하여 저주파수 신호에 대한 여기 신호의 스펙트럼을 생성한다. 변환부(415)에서 시간 영역으로 마련된 여기 신호를 주파수 영역으로 변환하는 방식의 예로 FFT(Fast Fourier Transform) 또는 MDCT(Modified Discrete Cosine Transform) 등이 있다.
주파수영역 복호화부(420)는 영역 판단부(405)에서 저주파수 신호가 주파수 영역에서 부호화되었다고 판단되면 역다중화부(400)에서 역다중화된 저주파수 신호와 저주파수 신호에 대한 여기 스펙트럼(excitation spectrum)을 주파수 영역에서 복호화한다. 주파수영역 복호화부(420)에서 저주파수 신호를 주파수 영역에서 부호화하는 예로 TCX(Transform Coded eXcitation)가 있다.
고주파수스펙트럼 생성부(425)는 변환부(415)에서 생성된 여기 신호의 스펙트럼 또는 주파수영역 복호화부(420)에서 복호화된 여기 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 고주파수 영역에 고주파수 스펙트럼을 생성한다(제325단계). 여기서, 고주파수 스펙트럼은 기 설정된 제2 주파수 보다 큰 영역에 해당하는 스펙트럼을 말한다. 제1 주파수와 제2 주파수는 서로 동일한 값으로 설정되는 것이 바람직하지만, 반드시 동일한 값으로 설정하여 실시해야 하는 것은 아니다.
고주파수스펙트럼 생성부(425)에서는 변환부(415)에서 생성된 여기 신호의 스펙트럼 또는 주파수영역 복호화부(420)에서 복호화된 여기 스펙트럼을 고주파수 영역에 패치(patch)하거나 기 설정된 주파수를 기준으로 고주파수 영역에 대칭적으로 폴딩(folding)하여 여기 스펙트럼을 생성할 수 있다.
여기서, 패치하는 방식은 스펙트럼을 그대로 복사하는 것을 말하며, 폴딩하는 방식은 스펙트럼을 기준이 되는 주파수를 중심으로 대칭적으로 스펙트럼의 역상을 생성하는 것을 말한다.
폴딩하는 방식의 구체적인 예를 도 5 및 6에 도시하였다. 저주파수 신호와 고주파수 신호로 분할하는 기준이 되는 주파수를 중심으로 하여 LB 4에 대칭하는 HB 1을 생성하고, LB 3에 대칭하는 HB 2을 생성하며, LB 2에 대칭하는 HB 3을 생성하고, LB 1에 대칭하는 HB 4를 생성한다. 고주파수스펙트럼 생성부(425)에서는 변환부(415)에서 생성된 여기 신호의 스펙트럼 또는 주파수영역 복호화부(420)에서 복호화된 여기 스펙트럼을 폴딩하여 다음 기재된 두 가지 실시예에 의해 고주파수 스펙트럼을 생성한다.
첫째, 변환부(415)에서 생성된 여기 신호의 스펙트럼 또는 주파수영역 복호화부(420)에서 복호화된 여기 스펙트럼의 모든 주파수 대역을 그대로 이용하여 제2 주파수 보다 큰 영역에 폴딩한다. 여기서 폴딩하는 각 밴드에는 실수 부분(real part)과 허수 부분(imaginary part)을 포함하며, 부호화하는 방식에 따라 다음 기재된 표 2와 같은 밴드의 수로 구성하여 실시할 수 있다.
부호화하는 방식 밴드의 수
ACELP 4
TCX 256 4
TCX 512 8
TCX 1024 8
둘째, 변환부(415)에서 생성된 여기 신호의 스펙트럼 또는 주파수영역 복호화부(420)에서 복호화된 여기 스펙트럼에서 0~1KHz과 같은 특정 주파수 대역에 해당하는 부분을 제외한 후 폴딩하여 고주파수 스펙트럼을 생성한다. 폴딩함에 있어서 제외된 부분은 도 7에 도시된 바와 같이 LB 2의 일부분을 이용하여 폴딩한다. 다음 기재된 수학식 3을 이용하여 특정 주파수 대역에 해당하는 부분을 제외한 후 폴딩하여 고주파수 스펙트럼을 생성할 수 있다.
[수학식 7]
Figure pat00015
단, StartFreq는 폴딩을 지삭하는 주파수이고,
Figure pat00016
는 72이다.
이득값 복호화부(430)는 역다중화부(400)에서 역다중화한 각 밴드에 대한 이득값을 복호화한다.
이득값 적용부(435)는 이득값 복호화부(430)에서 복호화한 각 밴드에 대한 이득값을 고주파수스펙트럼 생성부(425)에서 생성된 각 밴드에 대한 고주파수 스펙트럼에 적용한다. 이득값 적용부(435)에서 이득값을 고주파수 스펙트럼에 적용함으로써 포락선이 조절된다.
노이즈 부가부(440)는 이득값 적용부(435)에서 이득값이 적용된 고주파수 스펙트럼에 지각적인 노이즈(noise)를 부가한다.
노이즈 부가부(440)에서는 부호화단으로부터 전송된 정보(parameter)를 이용하여 노이즈를 부가할 수 있지만 복호화기에서 저주파수 신호가 복호화된 방식에 따라 적응적으로 노이즈를 부가할 수 있다.
다음 기재된 수학식과 같은 복호화기에 기 설정된 방법에 의해 생성된 노이즈를 부가한다.
[수학식 8]
Figure pat00017
단,
Figure pat00018
은 평균값이 0이고 표준편차가 1인 난수이고, HBCoef는 고주파수 스펙트럼이다. 또한, 여기서 scale은 복호화기에서 저주파수 신호가 복호화된 각 방식에 따라 다음과 기재된 수학식들을 이용하여 계산한다.
만일 시간영역 부호화부(410) 또는 주파수영역 부호화부(420)에서 저주파수 신호가 복호화된 방식이 ACELP 또는 TCX 256일 경우 다음 기재된 수학식 9를 이용하여 scale을 계산한다.
[수학식 9]
Figure pat00019
여기서, bandIdx는 0 내지
Figure pat00020
에서 1을 감산한 값이다.
만일 시간영역 부호화부(410) 또는 주파수영역 부호화부(420)에서 저주파수 신호가 복호화된 방식이 TCX 512 또는 TCX 1024일 경우 다음 기재된 수학식 10을 이용하여 scale을 계산한다.
[수학식 10]
Figure pat00021
여기서, bandIdx는 0 내지
Figure pat00022
에서 1을 감산한 값이고, n은 0 내지 71이다.
역변환부(445)는 노이즈 부가부(440)에서 노이즈가 부가된 고주파수 스펙트럼을 주파수 영역에서 시간 영역으로 역변환하여 고주파수 신호를 생성한다.
영역 합성부(450)는 시간영역 복호화부(410) 또는 주파수영역 복호화부(420)에서 복호화된 저주파수 신호와 역변환부(445)에서 생성된 고주파수 신호를 합성한다.
본 발명은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터(정보 처리 기능을 갖는 장치를 모두 포함한다)가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 장치의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장 장치 등이 있다.
이러한 본 발명에 대한 이해를 돕기 위하여 도면에 도시된 실시예를 참고로 설명되었으나, 이는 예시적인 것에 불과하며, 당해 분야에서 통상적 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 특허청구범위에 의해 정해져야 할 것이다.
200: 영역 분할부 210: 영역 결정부
220: 시간 결정부 220: 시간영역 부호화부
225: 제1 변환부 230: 주파수영역 부호화부
235: 여기스펙트럼 생성부 240: 제2 변환부
250: 이득값 계산부 260: 이득값 계산부
270: 다중화부

Claims (1)

  1. 기 설정된 주파수보다 작은 영역에 해당하는 저주파수 신호가 시간 영역에서 복호화되었다면 여기 신호를 복호화하여 주파수 영역으로 변환하는 단계;
    상기 저주파수 신호가 주파수 영역에서 복호화되었다면 여기 스펙트럼을 복호화하는 단계;
    상기 변환된 여기 신호의 스펙트럼 또는 상기 복호화된 여기 스펙트럼을 이용하여 기 설정된 주파수 보다 큰 영역에 스펙트럼을 생성하는 단계; 및
    신호의 에너지와 관련된 정보를 복호화하여 상기 생성된 스펙트럼에 적용하는 단계를 포함하는 것을 특징으로 하는 대역폭 확장 복호화 방법.
KR1020130106346A 2006-06-03 2013-09-04 대역폭 확장 복호화 방법 및 장치 KR101376100B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020060050124 2006-06-03
KR20060050124 2006-06-03

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020070049947A Division KR20070115637A (ko) 2006-06-03 2007-05-22 대역폭 확장 부호화 및 복호화 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20130114039A true KR20130114039A (ko) 2013-10-16
KR101376100B1 KR101376100B1 (ko) 2014-03-19

Family

ID=38912598

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020070049947A KR20070115637A (ko) 2006-06-03 2007-05-22 대역폭 확장 부호화 및 복호화 방법 및 장치
KR1020130106346A KR101376100B1 (ko) 2006-06-03 2013-09-04 대역폭 확장 복호화 방법 및 장치

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020070049947A KR20070115637A (ko) 2006-06-03 2007-05-22 대역폭 확장 부호화 및 복호화 방법 및 장치

Country Status (5)

Country Link
US (1) US7864843B2 (ko)
EP (1) EP2036080A4 (ko)
KR (2) KR20070115637A (ko)
CN (2) CN101083076B (ko)
WO (1) WO2007142434A1 (ko)

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9159333B2 (en) * 2006-06-21 2015-10-13 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
KR101393298B1 (ko) * 2006-07-08 2014-05-12 삼성전자주식회사 적응적 부호화/복호화 방법 및 장치
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
KR101379263B1 (ko) 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
ES2403410T3 (es) * 2007-08-27 2013-05-17 Telefonaktiebolaget L M Ericsson (Publ) Frecuencia de transición adaptativa entre el rellenado con ruido y la extensión del ancho de banda
US9177569B2 (en) 2007-10-30 2015-11-03 Samsung Electronics Co., Ltd. Apparatus, medium and method to encode and decode high frequency signal
CN101458930B (zh) * 2007-12-12 2011-09-14 华为技术有限公司 带宽扩展中激励信号的生成及信号重建方法和装置
JP5400059B2 (ja) * 2007-12-18 2014-01-29 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
ATE500588T1 (de) 2008-01-04 2011-03-15 Dolby Sweden Ab Audiokodierer und -dekodierer
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
CN101751926B (zh) * 2008-12-10 2012-07-04 华为技术有限公司 信号编码、解码方法及装置、编解码系统
EP2211339B1 (en) * 2009-01-23 2017-05-31 Oticon A/s Listening system
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
CO6440537A2 (es) * 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
CN101990253A (zh) * 2009-07-31 2011-03-23 数维科技(北京)有限公司 一种带宽扩展方法及其装置
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
US20110087494A1 (en) * 2009-10-09 2011-04-14 Samsung Electronics Co., Ltd. Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
RU2527735C2 (ru) * 2010-04-16 2014-09-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство, способ и компьютерная программа для выработки широкополосного сигнала с использованием управляемого расширения ширины полосы и слепого расширения ширины полосы
CA3093517C (en) 2010-07-02 2021-08-24 Dolby International Ab Audio decoding with selective post filtering
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
CA2929800C (en) * 2010-12-29 2017-12-19 Samsung Electronics Co., Ltd. Apparatus and method for encoding/decoding for high-frequency bandwidth extension
JP5704397B2 (ja) * 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
BR122021019883B1 (pt) * 2011-06-30 2023-03-14 Samsung Electronics Co., Ltd Método de gerar um sinal estendido de largura de banda, e mídia não transitória legível por computador
CN104321815B (zh) * 2012-03-21 2018-10-16 三星电子株式会社 用于带宽扩展的高频编码/高频解码方法和设备
KR101398189B1 (ko) * 2012-03-27 2014-05-22 광주과학기술원 음성수신장치 및 음성수신방법
JP5945626B2 (ja) * 2012-03-29 2016-07-05 テレフオンアクチーボラゲット エルエム エリクソン(パブル) ハーモニックオーディオ信号の帯域幅拡張
CN106409299B (zh) * 2012-03-29 2019-11-05 华为技术有限公司 信号编码和解码的方法和设备
CN105976830B (zh) 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
CN105551497B (zh) 2013-01-15 2019-03-19 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
CN106847297B (zh) * 2013-01-29 2020-07-07 华为技术有限公司 高频带信号的预测方法、编/解码设备
MY185176A (en) * 2013-01-29 2021-04-30 Fraunhofer Ges Forschung Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension
US9601125B2 (en) * 2013-02-08 2017-03-21 Qualcomm Incorporated Systems and methods of performing noise modulation and gain adjustment
HRP20231248T1 (hr) * 2013-03-04 2024-02-02 Voiceage Evs Llc Uređaj i postupak za smanјenјe šuma kvantizacije u dekoderu vremenskog domena
CN104103276B (zh) * 2013-04-12 2017-04-12 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
CN104217727B (zh) 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
CN103413557B (zh) * 2013-07-08 2017-03-15 深圳Tcl新技术有限公司 语音信号带宽扩展的方法和装置
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
JP6531649B2 (ja) 2013-09-19 2019-06-19 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
CN104517611B (zh) 2013-09-26 2016-05-25 华为技术有限公司 一种高频激励信号预测方法及装置
US20150149157A1 (en) * 2013-11-22 2015-05-28 Qualcomm Incorporated Frequency domain gain shape estimation
US10163447B2 (en) * 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
CN105849801B (zh) 2013-12-27 2020-02-14 索尼公司 解码设备和方法以及程序
MX361028B (es) * 2014-02-28 2018-11-26 Fraunhofer Ges Forschung Dispositivo de decodificación, dispositivo de codificación, método de decodificación, método de codificación, dispositivo de terminal y dispositivo de estación de base.
WO2015133795A1 (ko) * 2014-03-03 2015-09-11 삼성전자 주식회사 대역폭 확장을 위한 고주파 복호화 방법 및 장치
JP6383000B2 (ja) * 2014-03-03 2018-08-29 サムスン エレクトロニクス カンパニー リミテッド 帯域幅拡張のための高周波復号方法及びその装置
KR102653849B1 (ko) 2014-03-24 2024-04-02 삼성전자주식회사 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치
US9685164B2 (en) * 2014-03-31 2017-06-20 Qualcomm Incorporated Systems and methods of switching coding technologies at a device
EP3182412B1 (en) * 2014-08-15 2023-06-07 Samsung Electronics Co., Ltd. Sound quality improving method and device, sound decoding method and device, and multimedia device employing same
CN104269173B (zh) * 2014-09-30 2018-03-13 武汉大学深圳研究院 切换模式的音频带宽扩展装置与方法
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
BR112018067944B1 (pt) * 2016-03-07 2024-03-05 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Unidade de ocultação de erro, método de ocultação de erro,decodificador de áudio, codificador de áudio, método para fornecer uma representação de áudio codificada e sistema
KR20180056032A (ko) 2016-11-18 2018-05-28 삼성전자주식회사 신호 처리 프로세서 및 신호 처리 프로세서의 제어 방법
CN108198571B (zh) * 2017-12-21 2021-07-30 中国科学院声学研究所 一种基于自适应带宽判断的带宽扩展方法及系统
WO2024050673A1 (zh) * 2022-09-05 2024-03-14 北京小米移动软件有限公司 一种音频信号频带扩展方法、装置、设备及存储介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
US5774837A (en) * 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
JPH10124088A (ja) * 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
US5999897A (en) * 1997-11-14 1999-12-07 Comsat Corporation Method and apparatus for pitch estimation using perception based analysis by synthesis
US6704711B2 (en) 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US20020128839A1 (en) * 2001-01-12 2002-09-12 Ulf Lindgren Speech bandwidth extension
US20050004803A1 (en) * 2001-11-23 2005-01-06 Jo Smeets Audio signal bandwidth extension
JP3861770B2 (ja) * 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US8010352B2 (en) * 2006-06-21 2011-08-30 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding

Also Published As

Publication number Publication date
WO2007142434A1 (en) 2007-12-13
EP2036080A4 (en) 2012-05-30
KR101376100B1 (ko) 2014-03-19
CN102456349A (zh) 2012-05-16
KR20070115637A (ko) 2007-12-06
CN101083076A (zh) 2007-12-05
US20070282599A1 (en) 2007-12-06
CN101083076B (zh) 2012-03-14
US7864843B2 (en) 2011-01-04
EP2036080A1 (en) 2009-03-18

Similar Documents

Publication Publication Date Title
KR101376100B1 (ko) 대역폭 확장 복호화 방법 및 장치
KR101376098B1 (ko) 대역폭 확장 복호화 방법 및 장치
KR101379263B1 (ko) 대역폭 확장 복호화 방법 및 장치
JP6170520B2 (ja) オーディオ及び/またはスピーチ信号符号化及び/または復号化方法及び装置
KR101373004B1 (ko) 고주파수 신호 부호화 및 복호화 장치 및 방법
KR101355376B1 (ko) 고주파수 영역 부호화 및 복호화 방법 및 장치
KR101435413B1 (ko) 고주파수 신호 복호화 방법 및 장치
JP6386634B2 (ja) オーディオ信号の符号化及び復号化方法並びにその装置
KR101390188B1 (ko) 적응적 고주파수영역 부호화 및 복호화 방법 및 장치
KR20080027129A (ko) 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
US20090037180A1 (en) Transcoding method and apparatus
KR101457897B1 (ko) 대역폭 확장 부호화 및 복호화 방법 및 장치
KR101434209B1 (ko) 오디오/스피치 신호 부호화장치
KR101434207B1 (ko) 오디오/스피치 신호 부호화방법
KR101434206B1 (ko) 신호 복호화 장치

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee