KR20120031957A - 대역폭 확장 인코더, 대역폭 확장 디코더 및 위상 보코더 - Google Patents

대역폭 확장 인코더, 대역폭 확장 디코더 및 위상 보코더 Download PDF

Info

Publication number
KR20120031957A
KR20120031957A KR1020117031327A KR20117031327A KR20120031957A KR 20120031957 A KR20120031957 A KR 20120031957A KR 1020117031327 A KR1020117031327 A KR 1020117031327A KR 20117031327 A KR20117031327 A KR 20117031327A KR 20120031957 A KR20120031957 A KR 20120031957A
Authority
KR
South Korea
Prior art keywords
signal
window
low frequency
bandwidth extension
analysis
Prior art date
Application number
KR1020117031327A
Other languages
English (en)
Other versions
KR101425157B1 (ko
Inventor
프레드리크 나겔
마르쿠스 물트루스
사샤 디쉬
제레미 르콩트
크리스티안 에르텔
패트릭 밤볼트
Original Assignee
프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. filed Critical 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Publication of KR20120031957A publication Critical patent/KR20120031957A/ko
Application granted granted Critical
Publication of KR101425157B1 publication Critical patent/KR101425157B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

오디오 신호를 인코딩하기 위한 대역폭 확장 인코더는 신호 분석기, 코어 인코더 및 파라미터 계산기를 포함한다. 오디오 신호는 코어 주파수 대역을 포함하는 저주파 신호 및 상위 주파수 대역을 포함하는 고주파 신호를 포함한다. 신호 분석기는 특정 시간 길이를 갖는, 오디오 샘플들의 블록을 지닌, 오디오 신호를 분석하기 위해 구성된다. 신호 분석기는 대역폭 확장 디코더에서 대역폭 확장을 수행하기 위해 사용되는 분석 윈도우를 복수의 분석 윈도우들로부터 결정하기 위해 추가로 구성된다. 코어 인코더는 인코딩된 또는 주파수 신호를 얻기 위해 저주파 신호를 인코딩하도록 구성된다. 파라미터 계산기는 고주파 신호로부터 대역폭 확장 파라미터들을 계산해 내기 위해 구성된다.

Description

대역폭 확장 인코더, 대역폭 확장 디코더 및 위상 보코더{BANDWIDTH EXTENSION ENCODER, BANDWIDTH EXTENSION DECODER AND PHASE VOCODER}
본 발명은 오디오 신호 프로세싱에 관한 것으로, 특히, 대역폭 확장 인코더, 오디오 신호 인코딩 방법, 대역폭 확장 디코더, 인코딩된 오디오 신호 디코딩 방법, 위상 보코더(phase vocoder) 및 오디오 신호에 관한 것이다.
또한, 본 발명의 실시예들은 순수 시간 스트레칭(pure time stretching), 독립적 대역폭 확장을 위한 위상 보코더(phase vocoder)의 응용에 관한 것이다.
오디오 신호들의 저장 또는 전송은 종종 엄격한 비트 레이트(bit rate) 제약을 받는다. 이러한 제약은 보통 신호를 저장 또는 전송하기 위해 필요한 정보 레이트의 면에서 오디오 신호를 효율적으로 압축하는 인코더들/디코더들("코덱들(codecs)")의 사용이 원인이 된다. 과거에, 코더들은 오직 매우 낮은 비트 레이트만이 가능한 경우에 오디오 대역폭을 대폭적으로 줄이도록 했었다. 현대의 오디오 코덱들은 M. Dietz, L. Liljeryd, K. Kjorling 및 O. Kunz, "스펙트럼 대역 복사, 오디오 코딩에 대한 새로운 접근법(Spectral Band Replication, a novel approach in audio coding)", 제112회 AES 컨벤션, 뮌헨, 2002년 5월; S. Meltzer, R. Bohm 및 F. Henn, ""Digital Radio Mondiale"(DRM)과 같은 디지털 방송을 위한 SBR 향상 오디오 코덱들(SBR enhanced audio codes for digital broadcasting such as "Digital Radio Mondiale"(DRM)), 제112회 AES 컨벤션, 뮌헨, 2002년 5월; T. Ziegler, A. Ehret, P. Ekstrand 및 M. Lutzky, "SBR을 이용한 향상된 mp3: 새로운 mp3프로 알고리즘의 특징 및 가능성(Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm)", 제112회 AES 컨벤션, 뮌헨, 2002년 5월; 국제 표준 ISO/IEC 14496-3:2001/FPDAM 1, "대역폭 확장(Bandwidth Extension)", ISO/IEC, 2002년; "음성 대역폭 확장 방법 및 장치(Speech bandwidth extension method and appratus", Vasu Iyengar 외, 미국 특허 제5,455,888호; E. Larsen, R. M. Aarts, 및 M. Danessis. 음원 및 음성에 대한 효율적인 고주파 대역폭 확장(Efficient high-frequency bandwidth extension of music and speech), 제112회 AES 컨벤션, 독일 뮌헨, 2002년 5월; R. M. Aarts, E. Larsen, 및 O. Ouweltjes. 저 및 고주파 대역폭 확장에 대한 통합 접근법(A unified approach to low- and high frequency bandwidth extension), 제115회 컨벤션, 미국 뉴욕, 2003년 10월; K. Kayhko. 협대역 음성 신호에 대한 강력한 광대역 향상(A Robust Wideband Enhancement for Narrowband Speech Signal). 연구 논문, 헬싱키 공과대학, 음향 및 오디오 신호 프로세싱 연구실, 2001년; E. Larsen 및 R. M. Aarts. 오디오 대역폭 확장 - 음향심리학, 신호 처리 및 확성기 설계에의 응용(Audio Bandwidth Extension - Application to psychoacoustics, Signal Processing and Loudspeaker Design). John Wiley & Sons, Ltd, 2004년; E. Larsen, R. M. Aarts, 및 M. Danessis. 음원 및 음성에 대한 효율적인 고주파 대역폭 확장(Efficient high-frequency bandwidth extension of music and speech). 제112회 AES 컨벤션, 독일 뮌헨, 2002년 5월; J. Makhoul. 선형 예측에 의한 음성의 스펙트럼 분석(Spectral Analysis of Speech by Linear Prediction). 오디오 및 전기 음향학에 대한 IEEE 트랙젝션, AU-21(3), 1973년 6월; 미국 특허 출원 제08/951,029, Ohmori, 외. 오디오 대역 폭 확장 시스템 및 방법(Audio band width extending system and method); 미국 특허 제6895375호, Malah, D & Cox, R.V.: 협대역 음성의 대역폭 확장을 위한 시스템(System for bandwidth extension of Narrow-band speech) 및 Frederik Nagel, Sascha Disch, "오디오 코덱들에 대한 고조파 대역폭 확장 방법(A harmonic bandwidth extension method for audio codecs)", 음향, 음성 및 신호 프로세싱에 대한 ICASSP 국제 회의, IEEE CNF, 대만 타이페이, 2009년 4월;에 기술된 바와 같은 대역폭 확장(bandwidth extension, BWE) 방법들을 이용하여 광대역 신호들을 코딩하는 것이 가능하다.
이러한 알고리즘들은 고주파 콘텐츠(HF)에 대한 파라미터의 표현에 의존한다. 이러한 표현은 HF 스펙트럼 구역으로의 전위("패칭(patching)") 및 파라미터 구동 후 프로세싱(parameter driven post processing)의 응용을 이용하여 디코딩된 신호의 저주파 부분(LF)으로부터 발생된다.
공지의 기술에, 스펙트럼 대역 복사(SBR) 또는 고조파 대역폭 확장(HBE)과 같은 대역폭 확장에 대한 방법들이 알려져 있다. 다음에서, 이러한 두 개의 BWE 방법들이 간략히 기술된다.
한편, 스펙트럼 대역 복사(SBR)는, M. Dietz, L. Liljeryd, K. Kjorling 및 O. Kunz, "스펙트럼 대역 복사, 오디오 코딩에 대한 새로운 접근법", 제112회 AES 컨벤션, 뮌헨, 2002년 5월에 기술된 바와 같이, HF 정보를 발생시키기 위해 쿼드러쳐 미러 필터뱅크(quadrature mirror filterbank, QMF)를 사용한다. 이른바 "패칭" 알고리즘을 적용하면, 더 낮은 QMF 대역 신호들이 더 높은 QMF 대역들로 복사되어, HF 부분에서 LF 부분에 대한 정보가 복사되게 한다. 이어서, 발생된 HF 부분은 스펙트럼 포락선(spectral envelope) 및 음조를 조절하는 파라미터들의 도움으로 원래의 HF 부분과 거의 매칭되게(match) 적응된다.
다른 한편으로, 고조파 대역폭 확장(HBE)은 위상 보코더들에 기초하는 대안적인 대역폭 확장 기법이다. HBE는 비-고조파 스펙트럼 편이(shift)에 의존하는 SBR과는 반대로 스펙트럼의 고조파 연속을 가능하게 한다. 이는 SBR 패칭 알고리즘을 대체하거나 수정하기 위해 이용될 수 있다.
출원번호 제US 61/079,841호의 미국 가출원은 주파수 도메인 또는 시간 도메인에서 작동하는 대안적인 패칭 알고리즘들 사이에서 선택할 수 있는 BWE 방법을 게시하고 있다. 필터뱅크(filterbank)에 의한 시간-주파수 변환에서, 특정한 미리 결정된 분석 윈도우가 적용된다. 또한, 종래기술에 따른 고전적인 위상 보코더 구현들은 상승형 코사인 윈도우(raised-cosine window) 또는 바틀렛(Barlett) 윈도우와 같은 하나의 미리 정해진 윈도우 형태를 사용한다.
그러나, 보코더 애플리케이션들에 대하여 하나의 미리 결정된 분석 윈도우를 선택하는 것은 항상 서로 다른 오디오 신호들의 종류에 대해 얻어지는 전반적인 지각의(perceptual) 오디오 품질 면에서 애플리케이션 설계자들에 의해 이루어지는 상충관계(trade-off)를 포함한다. 그러므로, 비록 평균 오디오 품질이 특정 윈도우의 초기 선택에 따라 최적화될 수 있더라도, 각각 개개의 신호들의 종류에 대한 오디오 품질은 차상위로 최적화된 채로 남아 있다.
또한, 특정 신호들은 특히 피치(pitch)의 변형 없이 오디오 신호를 시간적으로 확산시키기 위해 사용될 수 있는 위상 보코더에 대한 특수한 분석 윈도우들을 사용함으로써 이득을 얻음이 알려졌다.
그러므로, BWE 기법 내에서와 같은 최적의 분석 윈도우들을 선택하는 것에 대한 구상이 요구된다. 그러나, 방금 언급한 지각적 오디오 품질의 저하에 맞서는 방법이 바람직하게는 사용된 코덱들의 상당히 증가된 계산 복잡도를 초래해서는 안된다.
인코딩 및/또는 디코딩 구상 또는 개선된 오디오 품질을 제공하는 위상 보코더 구상을 제공하는 것이 본 발명의 목적이다.
이러한 목적은 청구항 1에 따른 대역폭 확장 인코더, 청구항 2에 따른 대역폭 확장 디코더, 청구항 12에 따른 위상 보코더, 청구항 13에 따른 인코딩하기 위한 방법, 청구항 14에 따른 디코딩하기 위한 방법, 청구항 15에 따른 인코딩된 오디오 신호 또는 청구항 16에 따른 컴퓨터 프로그램에 의해 달성된다.
본 발명의 근본적인 발상은 특정 시간 길이를 갖는 오디오 샘플들의 블록을 지닌 오디오 신호가 대역폭 확장 디코더에서 대역폭 확장을 수행하기 위해 이용되는 분석 윈도우를 복수의 분석 윈도우들로부터 결정하기 위해 분석되는 경우 개선된 지각적 품질이 달성될 수 있다는 것이다. 이러한 방법으로, 미리 결정된 분석 윈도우의 적용에서 초래되는 오디오 품질의 저하가 방지될 수 있고, 결과적으로, 선행 기술의 BWE 방법들과 비교하여 상대적으로 적은 노력으로 지각적 오디오 품질이 개선될 수 있다.
본 발명의 실시예에 따라, 오디오 신호를 인코딩하기 위한 대역폭 확장 인코더는 신호 분석기, 코어 인코더 및 파라미터 계산기를 포함한다. 오디오 신호는 코어 주파수 대역을 포함하는 저주파 신호 및 상위 주파수 대역을 포함하는 고주파 신호를 포함한다. 신호 분석기는 오디오 신호를 분석하기 위해 구성되고, 상기 오디오 신호는 오디오 샘플들의 블록을 가지며, 상기 블록은 특정 시간 길이를 갖는다. 신호 분석기는 대역폭 확장 디코더에서 대역폭 확장을 수행하기 위해 사용되는 분석 윈도우를 복수의 분석 윈도우들로부터 결정하기 위해 추가로 구성된다. 코어 인코더는 인코딩된 저주파 신호를 얻기 위해 저주파 신호를 인코딩하도록 구성된다. 파라미터 계산기는 고주파 신호로부터 대역폭 확장 파라미터들을 계산해 내기 위해 구성된다.
본 발명의 다른 실시예에 따라, 인코딩된 오디오 신호를 디코딩하기 위한 대역폭 확장 디코더는 코어 디코더, 패치 모듈 및 결합기(combiner)를 포함한다. 인코딩된 오디오 신호는 인코딩된 저주파 신호 및 상위 대역 파라미터들을 포함한다. 코어 디코더는 인코딩된 저주파 신호를 디코딩하기 위해 구성되는데, 여기서 상기 디코딩된 저주파 신호는 코어 주파수 대역을 포함한다. 패치 모듈은 디코딩된 저주파 신호 및 상위 대역 파라미터들에 기초하여 패칭된 신호를 발생시키기 위해 구성되는데, 여기서 패칭된 신호는 코어 주파수 대역으로부터 발생되는 상위 주파수 대역을 포함한다. 결합기는 결합된 출력 신호를 얻기 위해 패칭된 신호와 디코딩된 저주파 신호를 결합하도록 구성된다.
또 다른 실시예에 따라, 오디오 신호를 프로세싱하기 위한 위상 보코더 프로세서는 분석 윈도우어(analysis windower), 시간/스펙트럼 변환기, 주파수 도메인 프로세서, 주파수/시간 변환기, 합성 윈도우어, 비교기 및 중첩 가산기(overlap adder)를 포함한다. 분석 윈도우어는 복수의 윈도윙된 오디오 신호들을 얻기 위해, 특정 시간 길이를 갖는, 오디오 샘플들의 블록을 지닌 오디오 신호 또는 상기 오디오 신호에서 파생된 신호에 복수의 분석 윈도우 함수들을 적용시키도록 구성된다. 시간/스펙트럼 변환기는 윈도윙된 오디오 신호들을 스펙트럼들로 변환하기 위해 구성된다. 주파수 도메인 프로세서는 변형된 스펙트럼들을 얻기 위해 주파수 도메인에서 스펙트럼들을 프로세싱하기 위해 구성된다. 주파수/시간 변환기는 변형된 스펙트럼들을 변형된 시간 도메인 신호들로 변환하기 위해 구성된다. 합성 윈도우어는 변형된 시간 도메인 신호들에 복수의 합성 윈도우 함수들을 적용하기 위해 구성되는데, 여기서 상기 합성 윈도우 함수들은 윈도윙되고 변형된 시간 도메인 신호들을 얻기 위해 분석 윈도우 함수들에 매칭된다. 비교기는 복수의 윈도윙되고 변형된 시간 도메인 신호들과, 오디오 신호 또는 상기 오디오 신호에서 파생된 신호의 비교에 기초하여 복수의 비교 파라미터들을 결정하기 위해 구성되는데, 여기서 복수의 비교 파라미터들은 복수의 분석 윈도우 함수들에 상응한다. 비교기는 비교 파라미터가 미리 결정된 조건을 만족시키는 분석 윈도우 함수 및 합성 윈도우 함수를 선택하기 위해 추가로 구성된다. 중첩 가산기는 시간적으로 확산된 신호를 얻기 위해 윈도윙되고 변형된 시간 도메인 신호의 중첩 블록들을 가산하기 위해 구성된다. 중첩 가산기는 비교기에 의해 선택된 분석 윈도우 함수 및 합성 윈도우 함수에 의해 변형된 윈도윙되고 변형된 시간 도메인 신호의 블록들을 프로세싱하기 위해 추가로 구성된다.
본 발명의 실시예들은 복수의 패칭된 신호들이 코어 주파수 대역을 포함하는 오디오 신호에 적용되는 복수의 분석 윈도우 함수들로부터 발생될 수 있다는 구상에 기초한다. 복수의 패칭된 신호들은 원래의 오디오 신호인 기준 신호(reference signal) 또는 상기 오디오 신호에서 파생된 신호와 비교될 수 있다. 이는 오디오 품질에 대한 측정과 관련될 수 있는 복수의 비교 파라미터들을 가져온다. 또한, 복수의 분석 윈도우 함수들로부터, 비교 파라미터가 미리 결정된 조건을 만족시키는 분석 윈도우 함수가 선택될 수 있다. 그러므로, 선택된 분석 윈도우 함수를 사용하는 것은 오디오 품질에 대한 최소의 감소를 보장할 수 있어, BWE 시나리오의 측면에서 최적의 지각적 오디오 품질을 가져온다.
본 발명의 다른 실시예들은 신호 분류기(signal classifier)를 포함하는 신호 분석기에 관련되는데, 여기서 상기 신호 분류기는 오디오 신호 또는 상기 오디오 신호에서 파생된 신호를 분석/분류하기 위해 구성된다. 이 경우에, 대역폭 확장 디코더에서 대역폭 확장을 수행하기 위해 사용되는 분석 윈도우 함수는 분석된/분류된 신호의 신호 특성에 기초하여 선택된다.
그러므로, 실시예들은 디코더에서 대역폭 확장을 위한 최적의 분석 윈도우를 선택하는 방법을 제공한다. 어떤 분석 윈도우가 가장 적합한지를 정하기 위해 제어 파라미터들이 평가될 수 있다. 이를 달성하기 위해, 합성에 의한 분석(analysis-by-synthesis) 기법이 사용될 수 있는데; 즉, 한 셋트의 윈도우들이 적용될 수 있고 알맞은 목적에 따른 최상의 것이 선택된다. 본 발명의 바람직한 방식에서, 그 목적은 복원에 대해서 최적의 지각적 오디오 품질을 보장하는 것이다. 대안적인 방식에서, 목적 함수가 최적화될 수 있다. 예를 들어, 상기 목적은 가능한 한 가깝게 원래의 HF의 스펙트럼 평탄도(flatness)를 유지하는 것일 수 있다.
한편, 윈도우 선택은 원래의 신호, 합성된 신호 또는 두 신호 모두를 고려하여 오직 인코더에서만 행해질 수 있다. 결정(윈도우 표시)이 그리고 나서 디코더로 전송된다. 한편, 상기 선택은 오직 디코딩된 신호의 코어 대역폭만을 고려하여 인코더 및 디코더 측에서 동시에 수행될 수 있다. 후자의 방법은 추가적인 사이드 정보(side information)을 발생시킬 필요가 없는데, 이는 코덱의 비트레이트 효율성 면에서 좋다.
본 발명은 보코더 출력 신호의 지각적 품질을 최적화한다는 점에서 장점이 있다. 실시예들은 보코딩 프로세스를 위해 적절한 분석 및 합성 윈도우들의 선택에 적응된 신호를 제공하는데, 여기서 분석 및/또는 합성 윈도우들에 대한 서로 다른 시간 응답들 또는 주파수 응답들이 가능하다.
본 발명의 다른 이점은 상기에서 언급한 저하의 감소 및 BWE 기법 내에서와 같은 계산 복잡도 사이에 더 나은 상충효과(trade-off)를 가능하게 한다는 것이다.
다음에서, 본 발명의 실시예들이 첨부되는 도면들을 참조하여 설명되는데:
도 1은 대역폭 확장 인코더의 실시예에 대한 블록도를 도시하며;
도 2는 대역폭 확장 디코더의 실시예에 대한 블록도를 도시하며;
도 3은 대역폭 확장 인코더의 다른 실시예에 대한 블록도를 도시하며;
도 4는 대역폭 확장 디코더의 다른 실시예에 대한 블록도를 도시하며;
도 5는 대역폭 확장 인코더의 다른 실시예에 대한 블록도를 도시하며;
도 6은 대역폭 확장 디코더의 다른 실시예의 블록도를 도시하며;
도 7은 비교기의 구현에 대한 블록도를 도시하며;
도 8은 대역폭 확장 인코더의 다른 실시예에 대한 블록도를 도시하며;
도 9는 신호 분류기의 구현에 대한 블록도를 도시하며;
도 10은 대역폭 확장 인코더의 다른 실시예에 대한 블록도를 도시하며;
도 11은 대역폭 확장 디코더의 다른 실시예에 대한 블록도를 도시하며;
도 12는 위상 보코더 프로세서의 실시예에 대한 블록도를 도시하며;
도 13은 제어 정보에 따라 서로 다른 분석 및 합성 윈도우들 사이에서 스위칭하기 위한 장치에 대한 실시예의 블록도를 도시하고;
도 14는 위상 보코더 구동 대역폭 확장 디코더의 실시예에 대한 개관을 도시한다.
도 1은 본 발명의 일 실시예에 따라 오디오 신호(101-1)를 인코딩하기 위한 대역폭 확장 인코더(100)에 대한 블록도를 도시한다. 오디오 신호(101-1)는 코어 주파수 대역(101-3)을 포함하는 저주파 신호(101-2) 및 상위 주파수 대역(101-5)을 포함하는 고주파 신호(101-4)를 포함한다. 대역폭 확장 인코더(100)는 신호 분석기(110), 코더 인코더(120) 및 파라미터 계산기(130)를 포함한다. 신호 분석기(110)는 오디오 신호(101-1)를 분석하기 위해 구성되며, 상기 오디오 신호(101-1)는 오디오 샘플들의 블록(101-6)을 가지고, 상기 블록(101-6)은 특정 시간 길이를 갖는다. 신호 분석기(110)는 대역폭 확장 디코더(200)에서와 같이 대역폭 확장을 수행하기 위해 사용되는 분석 윈도우(111-2)를 복수(111-1)의 분석 윈도우들로부터 결정하기 위해 추가로 구성된다. 코어 인코더(120)는 인코딩된 저주파 신호(121)를 얻기 위해 저주파 신호(101-2)를 인코딩하기 위해 구성된다. 마지막으로, 파라미터 계산기(130)는 고주파 신호(101-4)로부터 대역폭 확장 파라미터들(131)을 계산해 내기 위해 구성된다. 대역폭 확장 파라미터들(131), 대역폭 확장 디코더(200)에서 사용되는 분석 윈도우(111-2) 및 인코딩된 저주파 신호(121)는 대역폭 확장 인코더(100)에 의해 제공되는 인코딩된 오디오 신호(103-1)를 구성한다.
도 2는 본 발명의 다른 실시예에 따른 인코딩된 오디오 신호(201-1)를 디코딩하기 위한 대역폭 확장 디코더(200)에 대한 블록도를 도시한다. 인코딩된 오디오 신호(201-1)는 인코딩된 저주파 신호(201-2) 및 상위 대역 파라미터들(201-3)을 포함한다. 여기서, 인코딩된 오디오 신호(201-1)는 도 1에 도시된 대역폭 확장 인코더(100)에 의해 제공되는 인코딩된 오디오 신호(103-1)에 상응할 수 있다. 대역폭 확장 디코더(200)는 코어 디코더(210), 패치 모듈(220) 및 결합기(230)를 포함한다. 코어 디코더(210)는 디코딩된 저주파 신호(211-1)를 얻기 위해 인코딩된 저주파 신호(201-2)를 디코딩하도록 구성된다. 디코딩된 저주파 신호(211-1)는 코어 주파수 대역(211-2)를 포함한다. 패치 모듈(220)은 디코딩된 저주파 신호(211-1) 및 상위 대역 파라미터들(201-3)에 기초하여 패칭된 신호(221-1)을 발생시키기 위해 구성되는데, 여기서 패칭된 신호(221-1)는 코어 주파수 대역(211-2)으로부터 발생되는 상위 주파수 대역(221-2)을 포함한다. 마지막으로, 결합기(230)는 결합된 출력 신호(231-1)를 얻기 위해 패칭된 신호(221-1) 및 디코딩된 저주파 신호(211-1)를 결합하도록 구성된다. 특히, 패칭된 신호(221-1)는 대역폭 확장 알고리즘의 목표 주파수 영역 내의 신호일 수 있고, 반면 대역폭 확장 디코더(200)에 의해 제공되는 결합된 출력 신호(231-1)는 확장된 대역(231-2)을 이용하여 조작된 신호일 수 있다.
도 3은 대역폭 확장 인코더(300)의 다른 실시예에 대한 블록도를 도시한다. 대역폭 확장 인코더(300)는 저역 통과(low pass, LP) 필터 및 고역 통과(high pass, HP) 필터를 포함할 수 있다. 필터들은 저주파 신호(101-2)인 오디오 신호(101-1)의 저역 통과 필터링된 버전(version) 및 고주파 신호(101-4)인 오디오 신호(101-1)의 고역 통과 필터링된 버전을 발생시키도록 구현될 수 있다. 도 3에 도시된 바와 같이, 대역폭 확장 인코더(300)는 파라미터 계산기(320) 및 패치 모듈(330)에 의해 사용되는 윈도우 제어 정보(311)를 제공하기 위한 윈도우 제어기(310)를 더 포함할 수 있다. 윈도우 제어기(310)에 의해 제공되는 윈도우 제어 정보(311)는 오디오 신호(101-1)에서 파생된 오디오 샘플들의 블록(101-6)에 적용되는 복수(111-1)의 분석 윈도우 함수들을 표시할 수 있다. 파라미터 계산기(320)는, 특히, 윈도우 제어기(310)에 의해 제어되는 윈도우어(windower)를 포함할 수 있는데, 여기서 파라미터 계산기(320)의 윈도우어는 고주파 신호(101-4)에 복수(111-1)의 분석 윈도우 함수들 및 비교기(340)에 의해 선택되는 분석 윈도우 함수(111-2)를 적용하기 위해 구성된다. 여기서, 윈도우 제어 정보(311)에 표시되는 복수(111-1)의 분석 윈도우 함수들에 상응하고, 비교기(340)의 출력에서 윈도우 표시(340-1)에 의해 제공되는 선택된 분석 윈도우 함수(111-2)에 상응하는 대역폭 확장 파라미터들(321-1, 321-2)이 각각, 얻어진다.
도 3에 도시된 실시예에서, 신호 분석기(110)는 저주파 신호(101-2), 윈도우 제어 정보(311) 및 대역폭 확장 파라미터들(321-1)에 기초하여 복수(331-1)의 패칭된 신호들을 발생시키기 위해 구성되는 패치 모듈(330)을 포함한다. 여기서, 패칭된 신호들(331-1)은 코어 주파수 대역(101-3)으로부터 발생되는 상위 주파수 대역들(331-2)을 포함한다. 패칭된 모듈(330)은, 특히, 윈도우 제어기(310)에 의해 제어되는 윈도우어를 포함하는데, 여기서 패치 모듈(330)의 윈도우어는 저주파 신호(101-2)에 복수(111-1)의 분석 윈도우 함수들을 적용하기 위해 구성된다.
또한, 대역폭 확장 인코더(300)의 신호 분석기(110)는 패칭된 신호들(331-1)과, 오디오 신호(101-1) 또는 대시 기호로 된 선에 의해 표시되는 고주파 신호(101-4)와 같은 상기 오디오 신호에서 파생된 신호인 기준 신호의 비교에 기초하여 복수(341-2)의 비교 파라미터들을 결정하기 위해 구성되는 비교기(340)를 포함하는데, 여기서 복수(341-2)의 비교 파라미터들은 복수(111-1)의 분석 윈도우 함수들에 상응한다. 비교기(340)는 또한 비교 파라미터가 미리 결정된 조건을 만족시키는 분석 윈도우 함수(111-2)에 상응하는 윈도우 표시(341-1)를 제공하기 위해 구성된다. 마지막으로, 대역폭 확장 인코더(300)는 윈도우 표시(341-1)를 포함하는 인코딩된 오디오 신호(351)를 제공하기 위한 출력 인터페이스(350)를 포함한다.
상기 비교에 대한 구현와 관련하여, 도 7은 스펙트럼 평탄도 측정(spectral flatness measure, SFM) 파라미터 계산기(710), SFM 파라미터 비교기(720) 및 윈도우 표시 추출기(730)를 포함할 수 있는 비교기(700)의 실시예에 대한 블록도를 도시한다. SFM 파라미터 계산기(710)는, 예를 들어, 복수(701-1)의 입력 신호들로부터 복수(703-1)의 SFM 파라미터들 및 기준 입력 신호(701-2)로부터 기준 SFM 파라미터(703-2)를 계산하기 위해 구현될 수 있다. 특히, 각각의 SFM 파라미터는 상응하는 입력 신호에서 파생된 전력 스펙트럼(power spectrum)의 산술 평균으로 전력 스펙트럼의 기하 평균을 나눔으로써 계산될 수 있는데, 여기서 상대적으로 높은 SFM 파라미터는 스펙트럼이 모든 스펙트럼 대역들에서 유사한 양의 전력을 갖는 것을 표시하고, 반면 상대적으로 낮은 SFM 파라미터는 스펙트럼 전력이 상대적으로 적은 수의 대역들에 집중되어 있음을 표시한다. 더불어, SFM 파라미터는 또한 입력 신호의 전체 대역에 걸치는 대신에 특정 부분 대역(하위대역) 내에서 측정될 수 있다. SFM 파라미터 비교기(720)는 복수(705)의 비교 파라미터들을 얻기 위해 기준 SFM 파라미터(703-2)를 이용하여 SFM 파라미터들(703-1)을 비교하도록 구현될 수 있는데, 여기서 비교 파라미터들(705)은, 예를 들어, 비교된 SFM 파라미터들에서의 편차에 기초할 수 있다. 윈도우 표시 추출기(730)는 미리 결정된 조건이 만족될 비교 파라미터를, 복수의 비교 파라미터들(705)로부터, 선택하기 위해 구현될 수 있다. 상기 미리 결정된 조건은, 예를 들어, 선택된 비교 파라미터가 복수의 비교 파라미터들(705) 중 최소가 되도록 선택될 수 있다. 이 경우에, 선택된 비교 파라미터는 스펙트럼 평탄도 면에서 기준 입력 신호(701-2)로부터 최소 편차로 특징지어지는 복수의 입력 신호들(701-1)로부터의 입력 신호에 상응할 것이다.
특히, 입력 신호들(701-1)은 오디오 신호(101-1) 또는 저주파 신호(101-2)와 같은 오디오 신호(101-1)에서 파생된 신호에 복수(111-1)의 분석 윈도우 함수들을 적용시킨 후에 얻어지는 패칭된 신호들(331-1)에 상응할 수 있고, 반면 기준 입력 신호(701-2)는 원래의 오디오 신호(101-1)에 상응할 수 있다. 또한, 비교기(700)의 복수(705)의 비교 파라미터들은 대역폭 확장 인코더(300)의 복수(341-2)의 비교 파라미터들에 상응할 수 있다. 그러므로, 분석 윈도우 함수(111-2)는 패칭된 신호들(331-1)과 원래의 오디오 신호(101-1)의 SFM 파라미터에서의 편차가, 예를 들어, 최소가 되게, 선택된 비교 파라미터에 상응하여 선택될 수 있다. 선택된 분석 윈도우 함수(111-2)는 또한, 각각, 비교기 700 또는 비교기 340의 출력에서 제공되는 윈도우 표시(341-1)에 상응할 수 있는 윈도우 표시(707)에 의해 참조될 수 있다. 그 결과, 스펙트럼 평탄도에 의해 측정된 지각적 오디오 품질은, 예를 들어, 선택된 분석 윈도우 함수(111-2)가 대역폭 확장 디코더 내에서와 같은 대역폭 확장을 수행하기 위해 선택된 경우에 가능한 한 적게 변경되거나 감소될 것이다.
또한, 윈도우 제어기(310)의 출력에서 윈도우 제어 정보(311)에 의해 표시되는 복수(111-1)의 분석 윈도우 함수들은 블록 101-6과 동일한 윈도우 시간 길이를 갖는 서로 다른 윈도우 특성들을 지닌 서로 다른 분석 윈도우 함수들을 포함할 수 있다. 특히, 서로 다른 분석 윈도우 함수들은 스펙트럼 분석으로부터 얻어지는 서로 다른 주파수 응답 함수들("전송 함수들")에 의해 특징지어질 수 있다. 전송 함수들은, 차례로, 그것들의 메인 로브(main lobe) 너비들, 사이드 로브 레벨 또는 사이드 로브 감소와 같은 특징적인 특성들에 의해 구별될 수 있다. 서로 다른 분석 윈도우 함수들은 또한 스펙트럼 해상도 또는 동적 범위와 같은 그것들의 수행 특성들에 대해 여러 개의 그룹들로 나눠질 수 있다. 예를 들어, 높고 보통의 해상도 윈도우들은 직사각형, 삼각형, 코사인, 상승형 코사인, 해밍(Hamming), 한(Hann), 바틀렛(Bartlett), 블랙맨(Blackman), 가우시안(Gaussian), 카이저(Kaiser) 또는 바틀렛-한 윈도우 함수들로 나타내어질 수 있고, 반면 낮은 해상도 또는 높은 동적 범위 윈도우들은 평탄형(flat-top), 블랙맨-해리스(Blackman-Harris) 또는 투키(Tukey) 윈도우 함수들로 나타내어질 수 있다. 대안적인 실시예들에서, 또한 서로 다른 수의 샘플들(즉, 서로 다른 윈도 길이들의 윈도우들)을 갖는 윈도우 함수들을 사용하는 것이 가능하다.
특히, 패치 모듈(330)을 사용하여 오디오 샘플들의 블록(101-6)에, 분석 윈도우 함수들의 서로 다른 그룹들에 속할 수 있는 서로 다른 분석 윈도우 함수들(111-1)을 적용하는 것은, 예를 들어, 서로 다른 SFM 파라미터들과 같은 서로 다른 특징적인 특성들을 갖는 패칭된 신호들(331-1)을 야기할 수 있다.
도 4는, 예를 들어, 도 3에 도시된 대역폭 확장 인코더(300)에 의해 제공되는 윈도우 표시(341-1)를 명백히 이용할 수 있는 대역폭 확장 디코더(400)의 다른 실시예에 대한 블록도를 도시한다. 대역폭 확장 디코더(400)는, 특히, 인코딩된 저주파 신호(401-2) 및 상위 대역 파라미터들(401-3)뿐만 아니라, 윈도우 표시(401-4)를 포함하는 인코딩된 오디오 신호(401-1)로 작동되도록 구현된다. 여기서, 인코딩된 저주파 신호(401-2), 상위 대역 파라미터들(401-3) 및 윈도우 표시(401-4)는 각각, 대역폭 확장 인코더(300)의 출력 인터페이스(350)로부터 출력되는 인코딩된 저주파 신호(121), 대역폭 확장 파라미터들(321-2) 및 윈도우 표시(341-1)에 상응할 수 있다. 도 4에 도시된 실시예에서, 대역폭 확장 디코더(400)는 대역폭 확장 디코더(200)의 코어 디코더(210)에 상응할 수 있는 코어 디코더(410)를 포함하며, 상기 코어 디코더(410)는 인코딩된 저주파 신호(401-2)를 디코딩하기 위해 구성되고, 여기서 디코딩된 저주파 신호(411-1)는 코어 주파수 대역(411-2)을 포함한다. 또한, 대역폭 확장 디코더(400)는 대역폭 확장 디코더(200)의 패치 모듈(220)에 상응할 수 있는 패치 모듈(420)을 포함하는데, 여기서 패치 모듈(420)은 윈도우 표시(401-4)에 기초하여 복수의 분석 윈도우 함수들로부터 분석 윈도우 함수를 선택하고, 디코딩된 저주파 신호(411-1)에 선택된 분석 윈도우 함수를 적용하기 위한 제어 가능한 윈도우어를 포함한다. 이렇게 하여, 패칭된 신호(421)가 패치 모듈(420)의 출력에서 얻어질 것이다. 패칭된 신호(421)는 결합된 출력 신호(431)가 대역폭 확장 디코더(400)로부터 출력되도록 결합기(430)에 의해 저주파 신호(411-1)와 추가로 결합될 수 있다. 여기서, 패칭된 신호(421), 디코딩된 저주파 신호(411-1), 결합기(430) 및 결합된 출력 신호(431)는, 각각, 패칭된 신호(221-1), 디코딩된 저주파 신호(211-1), 결합기(230) 및 결합된 출력 신호(231-1)에 상응할 수 있다. 앞서와 마찬가지로, 결합된 출력 신호(431)는 확장된 대역폭을 이용하여 조작된 신호일 수 있다.
도 3 및 4에 대해, 인코더 측(도 3)에서 신호 분석을 이용하여 얻어진 최적 분석 윈도우 함수에 상응하는 윈도우 표시(341-1; 401-4)가, 인코딩된 오디오 신호(351; 401-1) 내에 전송되고, 이어서 대역폭 확장이 디코더 측(도 4)에서의 추가적 신호 분석을 요구하지 않으며 수행될 수 있도록 패치 모듈(420)에 의해 사용될 수 있어 이로울 것이다.
도 5는 대역폭 확장 인코더(500)의 다른 실시예에 대한 블록도를 도시한다. 대역폭 확장 인코더(500)는 도 3의 대역폭 확장 인코더(300)와 동일한 블록들을 기본적으로 포함한다. 그러므로, 유사한 구현들 및/또는 기능들을 갖는 동일한 블록들이 동일한 도면 부호들로 나타내어진다. 그러나, 도 3에 도시된 실시예와 달리, 대역폭 확장 인코더(500)는 복수의 패칭된 신호들(333-1)을 오디오 신호(101-1)에서 파생된 기준 저주파 신호와 비교하도록 구성되는 비교기(510)를 포함한다. 대역폭 확장 인코더(500)는 코어 인코더(120)의 출력으로부터 인코딩된 저주파 신호(121)를 디코딩함으로써 디코딩된 저주파 신호(521)를 제공하기 위해 구현되는 코어 디코더(520)를 또한 선택적으로 포함할 수 있다. 기준 저주파 신호로, 예를 들어, 오디오 신호(101-1)의 저역 통과 필터링된 버전인 저주파 신호(101-2) 또는 코어 디코더(520)의 출력으로부터의 디코딩된 저주파 신호(521)가, 이용될 수 있다. 또한, 비교기(510)가 선택된(최적) 분석 윈도우 함수에 상응하는 윈도우 표시(511)를 제공하기 위해 구성되는데, 여기서, 이 경우에, 윈도우 선택은 기준 저주파 신호(101-2 또는 521)와 패칭된 신호들(331-1)의 비교에 기초한다. 도 3에 도시된 실시예에서의 윈도우 표시(341-1)와 같이, 오직 윈도우 표시(511)에 상응하는 BWE 파라미터들(321-2)만이 얻어지도록 윈도우 표시(511)가 파라미터 계산기(320)에 공급될 수 있다. 인코딩된 저주파 신호(121)와 함께 BWE 파라미터들(321-2)이, 출력 인터페이스(530)에 공급될 수 있다. 여기서, 윈도우 표시(511)는, 그러나, 출력 인터페이스(530)에 공급되지 않을 수 있다. 마지막으로, 출력 인터페이스(530)는 윈도우 표시(511)를 포함하지 않는 인코딩된 오디오 신호(531)를 제공하기 위해 구성된다.
도 6은 대역폭 확장 디코더(600)의 다른 실시예에 대한 블록도를 도시한다. 대역폭 확장 디코더(600)는, 특히, 인코딩된 저주파 신호(601-2) 및 상위 대역 파라미터들(601-3)을 포함하는 인코딩된 오디오 신호(601-1)로 작동되기 위해 구현된다. 여기서, 인코딩된 오디오 신호(601-1), 인코딩된 저주파 신호(601-2) 및 상위 대역 파라미터들(601-3)은, 각각, 인코딩된 오디오 신호(201-1), 인코딩된 저주파 신호(201-2) 및 상위 대역 파라미터들(201-3)에 상응할 수 있다. 특히 도 6에 도시된 실시예에서, 대역폭 확장 디코더(600)로 공급되는 인코딩된 오디오 신호(601-1)는, 윈도우 표시를 포함하지 않는다. 이러한 이유로, 대역폭 확장 기법 내에서와 같이 적용되는 적절한 윈도우 함수를 선택하는 것이 목적인 신호 분석이 이 경우에 디코더 측에서 요구된다(도 6).
도 6에 도시된 바와 같이, 대역폭 확장 디코더(600)의 패치 모듈(220)은 분석 윈도우어(610), 시간/스펙트럼 변환기(620), 주파수 도메인 프로세서(630), 주파수/시간 변환기(640), 합성 윈도우어(650), 비교기(660) 및 대역폭 확장 모듈(670)을 포함한다. 또한, 대역폭 확장 디코더(600)는 인코딩된 저주파 신호(601-2)를 디코딩하기 위한 코어 디코더(680)를 포함하는데, 여기서 디코딩된 저주파 신호(681-1)는 코어 주파수 대역(681-2)을 포함한다. 여기서, 코어 디코더(680) 및 디코딩된 저주파 신호(681-1)는, 각각, 코어 디코더(210) 및 디코딩된 저주파 신호(211-1)에 상응할 수 있다.
분석 윈도우어(610)는 복수(611)의 윈도윙된 저주파 신호들을 얻기 위해 디코딩된 저주파 신호(681-1)에 대역폭 확장 인코더들(300; 500)에 대한 실시예들에서의 분석 윈도우 함수들(111-1)과 같은 복수의 분석 윈도우 함수들을 적용하기 위해 구성된다. 시간/스펙트럼 변환기(620)는 윈도윙된 저주파 신호들(611)을 스펙트럼들(621)로 변환하기 위해 구성된다. 주파수 도메인 프로세서(630)는 변형된 스펙트럼들(631)을 얻기 위해 주파수 도메인에서 스펙트럼들(621)을 프로세싱하도록 구성된다. 주파수/시간 변환기(640)는 변형된 스펙트럼들(631)을 변형된 시간 도메인 신호들(641)로 변환하기 위해 구성된다. 합성 윈도우어(650)는 변형된 시간 도메인 신호들(641)에 복수의 합성 윈도우 함수들을 적용하기 위해 구성되는데, 여기서 합성 윈도우 함수들은 윈도윙되고 변형된 시간 도메인 신호들(651)을 얻기 위해, 분석 윈도우 함수들에 매칭된다. 특히, 합성 윈도우 함수들을 적용하는 것이 상응하는 분석 윈도우 함수들의 영향을 보상하도록, 합성 윈도우 함수들이 분석 윈도우 함수들에 매칭될 수 있다. 비교기(660)는 복수(651)의 윈도윙되고 변형된 시간 도메인 신호들과 디코딩된 저주파 신호(681-1)의 비교에 기초하여 복수의 비교 파라미터들을 결정하기 위해 구성되는데, 여기서 복수의 비교 파라미터들은 분석 윈도우어(610)에 의해 디코딩된 저주파 신호(681-1)에 적용된 복수(111-1)의 분석 윈도우 함수들에 상응한다. 비교기(660)는 비교 파라미터가 미리 결정된 조건을 만족시키는 분석 윈도우 함수 및 합성 윈도우 함수를 선택하기 위해 추가로 구성된다. 여기서, 비교기(660)는 특히 도 7에 따라 앞서 설명한 바와 같이 구성될 수 있다. 선택된 분석 윈도우 함수 및 합성 윈도우 함수는 비교기(660)의 출력에서 제공되는 윈도우 표시(661)를 구성할 수 있다. 그러나, 도 4에 도시된 대역폭 확장 디코더(400)에 대한 실시예와 달리, 여기서 디코더 측에서 대역폭 확장을 수행하기 위해 사용되는 윈도우 표시(401-4)는 인코딩된 오디오 신호(401-1)에 들어 있으며, 윈도우 표시(661)가 처음의 인코딩된 오디오 신호(601-1)에서 파생된 디코딩된 저주파 신호(681-1)를 분석함으로써 결정되도록, 도 6에 도시된 대역폭 확장 디코더(600)의 윈도우 표시(661)는 인코딩된 오디오 신호(601-1)에서 이용가능하지 않다. 또한, 대역폭 확장 디코더(600)의 패치 모듈(220)은 대역폭 확장 모듈(670)을 포함할 수 있는데, 이는 패치 모듈(220)이 디코딩된 저주파 신호(681-1), 비교기(660)에 의해 선택되는 분석 윈도우 함수와 합성 윈도우 함수, 및 상위 대역 파라미터(601-3)에 기초하여 패칭된 신호(671)를 발생시킬 대역폭 확장 알고리즘을 수행하기 위해 구성된다. 마지막으로, 패칭된 신호들(671) 및 디코딩된 저주파 신호(681-1)는 확장된 대역폭을 갖는 결합된 출력 신호(691)를 얻기 위해 결합기(690)에 의해 결합될 수 있다. 여기서, 패칭된 신호(671), 디코딩된 저주파 신호(681-1), 결합기(690) 및 결합된 출력 신호(691)는, 각각, 도 2에 도시된 대역폭 확장 디코더(200)의 패칭된 신호(221-1), 디코딩된 저주파 신호(211-1), 결합기(230) 및 결합된 출력 신호(231-1)에 상응할 수 있다.
앞서 나타내어진 대역폭 확장 인코더들/디코더들의 실시예들에서, 사용된 비교기들은 도 7에서 묘사되는 비교기(700)에 상응할 수 있다. 구체적으로, 비교기(700)는, 복수의 입력 신호들(701-1)로써, 도 3 및 5에서 대역폭 확장 인코더들(300 및 500)의 복수(331-1)의 패칭된 신호들 또는 도 6에서 대역폭 확장 디코더의 복수(651)의 윈도윙되고 변형된 시간 도메인 신호들이, 그리고, 기준 입력 신호(701-2)로써, 도 3에서 '기준 신호'로 나타내어지는 오디오 신호(101-1) 또는 도 3에서 대시 기호로 된 선에 의해 표시되는 고주파 신호(101-4), 도 5에서 '기준 저주파 신호'로 나타내어지는 저주파 신호(101-2) 또는 도 5에서 대시 기호로 된 선에 의해 표시되는 디코딩된 저주파 신호(521) 또는 도 6에서 대역폭 확장 디코더(600)의 디코딩된 저주파 신호(681-1)가 수신되도록 구현될 수 있다. 비교기(700)는 윈도우 표시(707)를 제공하기 위해 추가로 구성되는데, 이는 도 3에서 대역폭 확장 인코더(300)의 윈도우 표시(341-1), 도 5에서 대역폭 확장 인코더(500)의 윈도우 표시(511) 또는 도 6에서 대역폭 확장 디코더(600)의 윈도우 표시(661)에 상응할 수 있다. 앞서 기술한 바와 같이, 비교는, 예를 들어, 입력 신호들에 대한 SFM 파라미터들의 계산에 기초할 수 있다. 대안으로, 입력 신호들(701-1)은 또한 오디오 신호 값에서의 차이에 대한 샘플 방식 계산에 기초하여 기준 입력 신호들(701-2)과 비교될 수 있다.
이전의 실시예들에서, 윈도우 선택은, 복수의 서로 다른 분석 윈도우 함수들이, 복수의 서로 다른 패칭된(합성된) 신호들을 발생시키는, 오디오 신호 또는 오디오 신호에서 파생된 신호에 적용되는, 신호 분석에 의해 수행된다. 이러한 복수의 합성된 신호들로부터, 최적 윈도우 함수가 합성 신호들과, 원래의 오디오 신호 또는 오디오 신호에서 파생된 신호와의 비교에 기초한 미리 결정된 기준에 기초하여 선택된다. 선택된 윈도우 함수는, 그러면, 특정 패칭된(합성된) 신호가 발생되도록, 대역폭 확장 기법 내에서와 같이 오디오 신호 또는 오디오 신호에서 파생된 신호에 적용된다. 상기의 절차는, 특히, 폐쇄 루프에 상응하고 '합성에 의한 분석' 기법으로 불릴 수 있다. 대안으로, 윈도우 선택은 또한, 오디오 신호 또는 오디오 신호에서 파생된 신호인 입력 신호에 대한 직접적인 분석에 의해 수행될 수 있는데, 여기서 원래의 입력 신호는 음조의 측정과 같은 특정 신호 특성과 관련하여 분석/분류된다. 개방 루프(open loop)에 상응하는 이러한 분석 기법이 다음의 실시예들에서 제시될 것이다.
도 8은 대역폭 확장 인코더(800)의 다른 실시예에 대한 블록도를 도시한다. 여기서, 대역폭 확장 인코더(800)의 기본 구조는 도 3에 도시된 대역폭 확장 인코더(300)의 그것에 상응한다. 그러므로, 도 3 및 8에 도시된 동일한 블록들은 동일한 도면 부호들로 표시될 수 있다.
대역폭 확장 인코더(800)의 신호 분석기(110)는 신호 분류기(810)를 포함하는데, 여기서 신호 분류기(810)는 분류되 신호의 신호 특성에 기초하여 분석 윈도우 함수에 상응하는 윈도우 표시(811)를 결정하기 위해 오디오 신호(101-1) 또는 고주파 신호(101-4, 대시 기호로 된 선)와 같은 오디오 신호에서 파생된 신호를 분류하기 위해 구성된다. 예를 들어, 신호 분류기(810)는 오디오 신호(101-1) 또는 고주파 신호(101-4)로부터의 음조 측정을 계산하여 윈도우 표시(811)를 결정하기 위해 구현될 수 있는데, 여기서 음조 측정은 스펙트럼 에너지가 대역들에 어떻게 분포되어 있는지를 표시할 수 있다. 스펙트럼 에너지가 대역 내에서 상대적으로 균일하게 분포되는 경우에, 다소 비-음조 신호('잡음 신호')가 이 대역 내에 존재하고, 윈도우 표시(811)는 비-음조 신호에 적용되게 적응된 제1 특성을 갖는 제1 윈도우 함수에 관련될 수 있으며, 반면 스펙트럼 에너지가 이 대역에서 특정 위치에 상대적으로 강하게 집중되어 있는 경우에, 다소 음조 신호가 이 대역에 존재하고, 윈도우 표시(811)는 음조 신호에 적용되게 적응된 제2 특성을 갖는 제2 윈도우 함수에 관련될 수 있다. 또한, 인코더(800)는 신호 분류기(810)에 의해 결정되는 윈도우 표시(811)에 기초하여 윈도우 제어 정보(821)를 제공하기 위한 윈도우 제어기(820)를 포함한다. 인코더(800)의 파라미터 계산기(830)는 윈도우 제어기(820)에 의해 제어되는 윈도우어를 포함할 수 있는데, 여기서 파라미터 계산기(830)의 윈도우어는 BWE 파라미터들(831)을 얻기 위헤 고주파 신호(101-4)에 윈도우 제어 정보(821)에 기초하여 분석 윈도우 함수를 적용하기 위해 구성된다. 윈도우 제어기(820)는, 예를 들어, 결정된 음조 측정이 미리 결정된 임계값 아래이면, 메인 로브의 제1 너비를 갖는 전송 윈도우에 의해 특징지어지는 제1 윈도우가 파라미터 계산기(830)의 윈도우어에 의해 적용되며, 또는 결정된 음조 측정이 미리 결정된 임계값과 동일하거나 그보다 위이면, 메인 로브의 제2 너비를 갖는 전송 윈도우에 의해 특징지어지는 제2 윈도우가 파라미터 계산기(830)의 윈도우어에 의해 적용되도록, 파라미터 계산기(830)를 위해 윈도우 제어 정보(821)를 제공하기 위해 구현될 수 있는데, 여기서 전송 함수의 메인 로브의 제1 너비는 전송 함수의 메인 로브의 제2 너비보다 더 크다. 특히, 대역폭 확장 기법의 면에서, 비-음조 신호인 경우에는 전송 함수에 대한 약간 큰 메인 로브를, 그리고 음조 신호인 경우에는 전송 함수에 대한 약간 작은 메인 로브를 갖는 윈도우 함수를 이용하는 것이 유리할 것이다.
대역폭 확장 인코더(800)의 코어 인코더(120)는 인코딩된 저주파 신호(121)를 얻기 위해 저주파 신호(101-2)를 인코딩하도록 구성된다. 도 3에 도시된 실시예에서와 같이, 인코딩된 저주파 신호(121), 윈도우 표시(811) 및 BWE 파라미터들(831)은 윈도우 표시(811)를 포함하는 인코딩된 오디오 신호(841)를 제공하기 위해 출력 인터페이스(840)에 공급될 수 있다.
도 9는 도 8, 10 및 11의 실시예에서 오디오 신호(101-1)에 대한 직접적 분석을 위해 사용될 수 있는 신호 분류기(900)의 구현에 대한 블록도를 도시한다. 신호 분류기(900)는 음조 측정기(910), 신호 특성화기(920) 및 윈도우 선택기(930)를 포함할 수 있다. 음조 측정기(910)는 오디오 신호(101-1)의 음조 측정(911)을 결정하기 위해 오디오 신호(101-1)를 분석하도록 구성될 수 있다. 신호 특성화기(920)는 음조 측정기(910)에 의해 제공되는 음조 측정(911)에 기초하여 오디오 신호(101-1)의 신호 특성(921)을 결정하기 위해 구성될 수 있다. 특히, 신호 특성화기(920)는 오디오 신호(101-1)가 잡음 신호 또는 아니면 음조 신호에 상응하는지를 결정하기 위해 구성된다. 마지막으로, 윈도우 선택기(930)는 신호 특성(921)에 기초하여 윈도우 표시(811)를 제공하기 위해 구현된다.
도 10은, 도 5에 도시된 대역폭 확장 인코더(500)에 상응할 수 있는 대역폭 확장 인코더(1000)의 다른 실시예에 대한 블록도를 도시한다. 상응하도록, 도 5 및 10에 도시된 실시예들에서 동일한 블록들은 동일한 도면 부호들로 표시된다. 대역폭 확장 인코더(1000)의 신호 분석기(110)는 신호 분류기(1010)를 포함하는데, 여기서 신호 분류기(1010)는 신호 분류기(1010)에 의해 제공되는 분류된 신호의 신호 특성에 기초하여 분석 윈도우 함수에 상응하는 윈도우 표시(1011)를 결정하기 위해 오디오 신호(101-1)에서 파생된 저주파 신호(101-2)를 분류하도록 구성된다. 또한, 인코더(1000)는 신호 분류기(1010)에 의해 결정되는 윈도우 표시(1011)에 기초하여 윈도우 제어 정보(1021)를 제공하기 위한 윈도우 제어기(1020)를 포함한다. 대역폭 확장 인코더(1000)의 파라미터 계산기(1030)는 윈도우 제어기(1020)에 의해 제어되는 윈도우어를 포함하는데, 여기서 파라미터 계산기(1030)의 윈도우어는 BWE 파라미터(1031)를 얻기 위해 고주파 신호(101-4)에 윈도우 제어 정보(1021)에 기초하여 분석 윈도우 함수를 적용하기 위해 구성된다. 대역폭 확장 인코더(1000)는 인코딩된 저주파 신호(121)를 얻기 위해 저주파 신호(101-2)를 인코딩하기 위한 코어 인코더(120)를 포함할 수 있다. 또한, 대역폭 확장 인코더(1000)는 또한 대시 기호로 된 블록으로 표시되는 코더 디코더(1050)를 선택적으로 포함할 수 있는데, 이는 디코딩된 저주파 신호(1051, 대시 기호로 된 화살표)를 얻기 위해 인코딩된 저주파 신호(121)를 디코딩하도록 구성된다. 상응하게, 신호 분류기(1010)는 윈도우 표시(1011)를 결정하기 위해 디코딩된 저주파 신호(1051)를 분석/분류하도록 선택적으로 구성될 수 있다. 인코딩된 저주파 신호(121) 및 BWE 파라미터들(1031)은, 윈도우 표시(1011)를 포함하지 않는 인코딩된 오디오 신호(1041)를 제공하기 위해 구성되는 출력 인터페이스(1040)에 추가로 공급될 수 있다. 여기서, 인코딩된 오디오 신호(1041)는 도 5에 도시된 인코딩된 오디오 신호(531)에 상응할 수 있다.
이 경우에, 윈도우 표시는 인코더 측(도 10)에서 인코딩된 오디오 신호에 들어 있지 않은데, 이는 다음에서 설명될 것으로, 윈도우 표시가 디코더 측(도 11)에서 또한 결정되어야 하는 것을 의미한다.
도 11은, 도 6에 도시된 대역폭 확장 디코더(600)에 상응할 수 있는, 대역폭 확장 디코더(1100)의 다른 실시예에 대한 블록도를 도시한다. 상응하도록, 도 6 및 11의 실시들예에서 동일한 블록들은 동일한 도면 부호들로 표시된다. 특히, 대역폭 확장 디코더(1100)는 디코딩된 저주파 신호(681-1)를 얻기 위해 인코딩된 저주파 신호(601-2)를 디코딩하도록 하는 코어 디코더(680)를 포함한다. 대역폭 확장 디코더(1100)의 패치 모듈(220)은, 분석된 신호의 신호 특성에 기초하여 분석 윈도우 함수에 상응하는 윈도우 표시(1111)를 결정하기 위해 디코딩된 저주파 신호(681-1)를 분석/분류하도록 구성되는 신호 분류기(1110)을 포함한다. 또한, 디코더(1100)는 신호 분류기(1110)에 의해 결정되는 윈도우 표시(1111)에 기초하여 윈도우 제어 정보(1121)를 제공하기 위한 윈도우 제어기(1120)를 포함한다. 또한, 디코더(1100)는, 패치 모듈(220)이 디코딩된 저주파 신호(681-1), 윈도우 제어 정보(1121)에 기초하는 분석 윈도우 함수 및 상위 대역 파라미터(601-3)에 기초하여 패칭된 신호(671)를 발생시키도록 구성될 수 있는 BWE 모듈(1130)을 포함할 수 있다. 패칭된 신호(671) 및 디코딩된 저주파 신호(681-1)는 결합된 출력 신호(691)를 얻기 위해 결합기(690)에 의해 추가로 결합될 수 있다.
이전의 실시예들에서의 합성의 의한 분석 기법은 또한 위상 보코더(phase vocoder)의 구현에 있어서도 사용될 수 있다. 이에 따라, 도 12는 위상 보코더 프로세서(1200)의 실시예에 대한 블록도를 도시한다. 오디오 신호(1201)를 프로세싱하기 위한 위상 보코더 프로세서(1200)는 분석 윈도우어(1210), 시간/스펙트럼 변환기(1220), 주파수 도메인 프로세서(1230), 주파수/시간 변환기(1240), 합성 윈도우어(1250), 비교기(1260) 및 중첩 가산기(1270)를 포함할 수 있다. 특히, 분석 윈도우어(1210)는, 복수(1211)의 윈도윙된 오디오 신호들을 얻기 위해, 오디오 신호(1201) 또는 대시 기호로 된 화살표로 표시되는 디코딩된 저주파 신호(1202)와 같은 오디오 신호에서 파생된 신호에 복수(111-1)의 분석 윈도우 함수들을 적용하도록 구성될 수 있는데, 상기 오디오 신호(1201)는 특정 시간 길이를 갖는 오디오 샘플들의 블록을 갖는다. 시간/스펙트럼 변환기(1220)는 윈도윙된 오디오 신호들(1211)을 스펙트럼들(1221)로 변환하기 위해 구성될 수 있다. 주파수 도메인 프로세서(1230)는 변형된 스펙트럼들(1231)을 얻기 위해 주파수 도메인에서 스펙트럼들(1221)을 프로세싱하기 위해 구성될 수 있다. 주파수/시간 변환기(1240)는 변형된 스펙트럼들(1231)을 변형된 시간 도메인 신호들(1241)로 변환하기 위해 구성될 수 있다. 합성 윈도우어(1250)는 변형된 시간 도메인 신호들(1241)에 복수의 합성 윈도우 함수들을 적용하기 위해 구성될 수 있는데, 여기서 합성 윈도우 함수들은 윈도윙되고 변형된 시간 도메인 신호들(1251)을 얻기 위해, 분석 윈도우 함수들에 매칭된다. 비교기(1260)는 복수의 윈도윙되고 변형된 시간 도메인 신호들(1251)과, 오디오 신호(1201) 또는 디코딩된 저주파 신호(1202, 대시 기호로 된 선)와 같은 오디오 신호에서 파생된 신호의 비교에 기초하여 복수의 비교 파라미터들을 결정하기 위해 추가로 구성될 수 있는데, 여기서 복수의 비교 파라미터들은 복수의 분석 윈도우 함수들에 상응하고, 여기서 비교기(1260)는 비교 파라미터가 미리 결정된 조건을 만족시키는 분석 윈도우 함수 및 합성 윈도우 함수를 선택하기 위해 추가로 구성된다. 여기서, 비교기(1260)에 의해 선택되는 분석 윈도우 함수 및 합성 윈도우 함수가 이전의 실시예들의 면에서 앞서 설명된 바와 유사한 방식으로 결정될 수 있음이 주목된다. 특히, 비교기(1260)는 도 7에 도시된 실시예와 같이 구현될 수 있다. 이어서, 선택된 분석 윈도우 함수 및 합성 윈도우 함수가, 특정(최적화된) 윈도윙되고 변형된 시간 도메인 신호(1255)가 합성 윈도우어(1250)의 출력에서 얻어지도록, 도 12에 도시된 프로세싱 체인(processing chain)에서 비교기(1260) 앞의 분석 윈도우어(1210)에서 시작되고 합성 윈도우어(1250)에서 종료되는 신호 경로에 대해 사용될 수 있다. 마지막으로, 중첩 가산기(1270)가, 시간적으로 확산된 신호(1271)를 얻기 위해 비교기(1260)에 의해 선택된 분석 윈도우 함수 및 합성 윈도우 함수에 의해 변형된, 윈도윙되고 변형된 시간 도메인 신호(1255)의 중첩되는 연속 블록들을 가산하기 위해 구성될 수 있다.
특히, 시간적으로 확산된 신호(1271)는 원래의 오디오 신호(1201) 또는 디코딩된 저주파 신호(1202)의 상응하는 블록들보다 서로 좀더 떨어지도록, 윈도윙되고 변형된 시간 도메인 신호(1255)의 중첩되는 연속 블록들 사이에 간격을 둠으로써 얻어질 수 있다. 또한, 여기서 신호 확산기(signal spreader)로 작동하는 중첩 가산기(1270)는, 그것의 피치(pitch)가 변하지 않으며, 오디오 신호(1201) 또는 디코딩된 저주파 신호(1202)를 시간적으로 확산시키도록 구성될 수도 있는데, 이는 "순수 시간 스트레칭(pure time stretching)"의 시나리오를 가져온다.
대안으로서, 또한 비교기(1260)가 후자가 또한 합성에 의한 분석 기법 내에 포함될 것과 같이, 프로세싱 체인 내의 중첩 가산기(1270) 뒤에 위치될 수 있는데, 이는 이 경우에 있어서는 이로울 수 있으며, 중첩 가산기(1270)에 의해 프로세싱되는 서로 다른 윈도윙되고 변형된 시간 도메인 신호들(1251)에 대한 효과가 이어지는 비교/윈도우 선택에 의해 또한 설명될 수 있다.
또 다른 대안의 실시예들에서, 위상 보코더 프로세서(1200)는 또한 예를 들면 간단한 샘플 비율 변환기 형태의 데시메이터(decimator)를 포함할 수 있는데, 여기서 상기 데시메이터는 대역폭 확장 알고리즘의 타겟 주파수 영역 내의 데시메이팅된(decimated) 신호가 획득되도록 확산된 신호를 데시메이트(압축)하기 위해 구성될 수 있다.
또 다른 대안의 실시예에서, 위상 보코더 프로세서는 또한 분석된 오디오 신호의 신호 특성에 적응된 최적 분석 윈도우 함수를 선택할 목적으로 입력 오디오 신호에 대한 직접적 분석을 수행하도록 구현될 수 있다. 특히, 특정 신호들이 위상 보코더에 대한 특성화된 분석 윈도우의 사용으로 이득을 얻음이 알려졌다. 예를 들면, 잡음 신호들은 예를 들면 투키 윈도우(Turkey window) 애플리케이션에 의해 더 잘 분석되며, 반면에 대부분 음조 신호들은 예를 들면 바틀렛 윈도우에 의해 제공되는 것과 같은 전송 함수의 작은 메인 로부터 이득을 얻는다.
요약하면, 최적 윈도우 함수를 선택하는 과정은, 제공되는 윈도우 표시가 도 4의 대역폭 확장 디코더(400)에서와 같이 디코더 측에 전송되는, 도 3 및 8의 대역폭 확장 인코더들(300 및 800) 내에서와 같은 인코더 측 상에서만 수행될 수 있거나, 도 5 및 6의 대역폭 확장 인코더들/디코더들(500 및 600) 또는 도 10 및 11의 대역폭 확장 인코더들/디코더들(1000 및 1100)에 대한 것과 같이 인코더 및 디코더 두 측에서 수행될 수 있음을 알 수 있다.
이런 면에서, 후자의 경우에 윈도우 표시는 인코딩된 오디오 신호의 저장 혹은 전송을 위한 비트 레이트가 감소될 수 있도록 인코딩된 오디오 신호 내에 추가적인 사이드 정보로서 저장되지 않는 것이 바람직할 수 있다.
도 13은 장치(1300)의 실시예를 도시하는데, 이는 위상 보코더 애플리케이션에 적용가능한 시간-주파수 변환의 면에서 제어 정보에 따라 서로 다른 분석 및 합성 윈도우들 사이의 스위칭을 위하여 사용될 수 있다. 입력되는 비트스트림(incoming bitstream, 1301-1)은 오디오 데이터(1301-3)로부터 제어 정보(1301-2)를 분리하도록 구현되는 데이터스트림 해석기(interpreter)에 의해 해석될 수 있다. 게다가, 제어 정보(1301-2)에 따라, 복수의 분석 윈도우들(1311-2)로부터의 분석 윈도우 함수(1311-1)는 오디오 데이터(1301-3)에 적용될 수 있다. 여기서, 바람직하게는, 복수(1311-2)의 분석 윈도우들은 블록 "분석 윈도우 1" 내지 "분석 윈도우 4"로 나타내어지는 네 개의 서로 다른 분석 윈도우들을 포함하는데, 여기서 상기 블록 "분석 윈도우 1"은 적용된 분석 윈도우(1311-1)를 나타낸다. 제어 정보(1301-2)는 특히, 이전에 상응하게 설명된 것과 같이 신호 특성의 직접적인 계산 혹은 합성에 의한 분석 기법에 의해 얻어질 수 있다. 잡음 신호의 경우에 있어서, 예를 들면, 투키 윈도우가 선택될 수 있는데, 반면에 음조 신호의 경우에 있어서는, 예를 들면, 바틀렛 윈도우가 선택될 수 있다. 또한 코사인 테이퍼드(cosine-tapered) 윈도우로 나타내어질 수 있는, 투키 윈도우는 폭(N, 1.0-α?2)의 직사각형 윈도우로 감기는 폭(N, α?2)의 코사인 로브(cosine lobe)로서 표현될 수 있다. 투키 윈도우는 아래에 의해 정의될 수 있다:
Figure pct00001

여기서 윈도우는 파라미터(α)가 0에서부터 1로 변경함에 따라 직사각형 윈도우로부터 해닝 윈도우로 진전한다. 삼각형 윈도우를 나타내는 바틀렛 윈도우는 아래와 같이 정의될 수 있다:
Figure pct00002

방정식 (1) 및 (2)에서, n은 정수 값이며 N은 시간-이산 윈도우 함수(w(n))의 (샘플들에서의) 너비이다.
분석 윈도우(1311-1)를 적용한 후에 얻어진 윈도윙된 오디오 신호는 나아가 시간 도메인으로부터 주파수 도메인으로의 "시간-주파수 변환"으로 나타내어지는 블록(1320)에서 추가로 변환될 수 있다. 얻어진 스펙트럼은 그리고 나서 "주파수 도메인 프로세싱"으로 나타내어지는 블록(1330) 내에 프로세싱될 수 있다. 특히, 블록(1330)은 스펙트럼의 스펙트럼 값의 위상들을 변형하기 위한 위상 변형기(phase modifier)를 포함할 수 있다. 그리고 나서, 프로세싱된 스펙트럼은 변형된 시간 도메인 신호를 얻기 위하여 다시 시간 도메인 내로 "주파수-시간 변환"으로 나타내어지는 블록(1340)에서 변환될 수 있다. 마지막으로, 제어 정보(1301-2)에 따라, "합성 윈도우 1" 내지 "합성 윈도우 4"로 나타내어지는 복수의 합성 윈도우들(1351-2)로부터의 합성 윈도우(1351-1)는 플러스 부호로 표시되는 블록(1360) 내의 모든 가능한 신호 경로들로부터 기부(contribution)를 더한 후에, 장치(1300)의 출력에서 윈도윙되고 변형된 시간 도메인 신호(1361)를 얻기 위하여 변형된 시간 도메인 신호로 적용될 수 있다.
도 14는 위상 보코더 구동 대역폭 확장 디코더(1400)의 실시예의 개요를 도시한다. 특히, 데이터 오디오 스트림(1411-1)은 인코딩된 저주파수 신호(1411-2) 및 HBE/SBR 데이터(1411-3)로 분리될 수 있다. 인코딩된 저주파수 신호(1411-2)는 코어 주파수 대역(1425)을 포함하는 디코딩된 저주파수 신호(1421)를 얻기 위하여 코어 디코더(1420)에 의해 디코딩될 수 있다. 디코딩된 저주파수 신호(1421)는 예를 들면, 1024의 프레임 크기를 갖는 펄스 코드 변조 데이터를 나타낼 수 있다. 디코딩된 저주파수 신호(1421)는 뒤에 지연 신호(1431)를 얻기 위하여 지연 단계(1430)에 추가로 공급될 수 있다. 그 다음으로, 지연 신호(1431)는 예를 들면, 지연 신호(1431)의 32 주파수 부대역(1441)을 발생시키는, 32 대역 QMF 분석 뱅크(1440)로 입력된다. HBE/SBR 데이터(1411-3)는 패치 스위치(1450)를 제어하기 위한 제어 정보를 포함할 수 있는데, 상기 패치 스위치(1450)는 SBR 패칭 알고리즘 및 HBE 패칭 알고리즘 사이에서 스위칭하도록 구성된다. SBR 패칭 알고리즘의 경우에 있어서, 주파수 부대역들(1441)은 패칭된 QMF 데이터(1461)를 얻기 위하여 SBR 패칭 장치(1460-1)에 제공된다. SBR 패칭 장치(1460-1)의 출력에서 나타나는 패칭된 QMF 데이터(1461)는 예를 들면, 잡음 충전 유닛(1470-2), 손실 고조파 복원 유닛(1470-3) 혹은 역 필터링 유닛(1470-4)을 포함하는, HBE/SBR 공구(1470-1)에 제공된다. 특히 HBE/SBR 공구(1470-1)는 패칭된 QMF 데이터(1461) 상에 사용되는 알려진 스펙트럼 대역 복제 기법을 구현할 수 있다. SBR 패칭 장치((1460-1)에 의해 사용되는 패칭 알고리즘은 예를 들면, 주파수 도메인 내의 스펙트럼 데이터의 미러링(mirroring) 및 복사(copying)를 사용할 수 있다. 게다가, HBE/SBR 공구(1470-1)는 HBE/SBR 데이터(1411-3)에 의해 제어된다. HBE/SBR 공구(1470-1)의 패칭된 QMF 데이터(1461) 및 출력(1471)은 포락선 포맷기(envelope formatter, 1470)에 제공된다. 포락선 포맷기(1470)는 상부 주파수 대역을 포함하는 포락선이 조절된 패칭 신호(1471)가 생성되는 것과 같이 발생된 패치를 위한 포락선을 조절하도록 구현된다. 포락선이 조절된 신호(1471)는 QMF 합성 뱅크(1480)에 제공되는데, 이는 주파수 도메인(1441) 내의 오디오 신호를 갖는 상부 주파수 대역의 성분을 결합하도록 구성된다. 마지막으로, "파형"으로 표시되는 합성 오디오 신호(1481)가 획득된다.
HBE 패칭 알고리즘(블록 1460-2)의 경우에 있어서, 디코딩된 저주파 신호(1421)는 예를 들면 디코딩된 저주파수 신호(1491)의 다운 샘플링된 버젼(version)을 얻기 위하여 2의 팩터(factor)에 의해, 다운 샘플러(1490, down sampler)에 의해 다운 샘플링될 수 있다. 다운 샘플링된 신호(1491)는 나아가 위상 보코더를 사용하여 고조파 대역폭 확장 알고리즘의 고급 프로세싱 기법으로 프로세싱될 수 있다.
반면에, 순간 이벤트가 순간 탐지기(1485, transient detector)에 의해 디코딩된 저주파수 신호(1421)의 블록 내에 탐지되지 않을 때 "아니오"로 나타내어지는 신호 경로(1500)에 의해 나타낸 것과 같은 표준 알고리즘 및 순간 이벤트가 블록 내에 탐지될 때 0 패딩 작동(블록 1515)으로부터 시작하여 "예"로 나타내어지는 신호 경로(1510)에 의해 나타낸 것과 같은 고급 알고리즘(advanced algorithm) 사이의 스위칭을 이용하여, 신호 의존적 프로세싱 기법이 이용될 수 있다.
반면에, 본질적으로, 시간-주파수 변환 구현에서의 위상 보코더 내의 분석 윈도우 특성의 신호 의존적 스위칭은 이전에 상세히 설명된 것과 같이 수행될 수 있다. 특히, 도 14에서, 1520;1530으로 표시된 점선의 테두리를 갖는 박스는 시그널링에 의해 변경될 수 있는 윈도우를 나타낸다. 기본적으로, 도 14는 위상 보코더 주도의 대역폭 확장 내의 도 13의 실시예의 애플리케이션을 도시한다.
여기서, "FFT(Fast Fourier Transform)", "위상 적응" 및 "iFFT(inverse Fast Fourier Transform)"에 의해 나타낸 블록은 각각 도 13에 도시된 블록 1320, 1330 및 1340과 상응할 수 있다. 구체적으로, FFT 및 iFFT 프로세싱 블록은 각각 단시간 푸리에 변환 혹은 이산 푸리에 변환 및 역 단시간 푸리에 변환 혹은 역 이산 푸리에 변환을 디코딩된 저주파수 신호(1421)의 블록에 적용하기 위하여 구현될 수 있다. 부가적으로, 도 14에 도시된 대역폭 확장 디코더(1400)는 또한 업샘플링(up-sampling) 단계(1540), 오버랩 가산 단계(1550) 및 데시메이션 단계(1560)를 포함할 수 있다.
위의 개념과 함께, 오디오 신호 내의 임의 위치 상의 서로 다른 윈도우 사이에서 전환하는 것이 가능하다는 것을 명기할 필요가 있다.
비록 본 발명이 실제 혹은 논리 하드웨어 부품을 나타낸 블록 다이어그램에서 설명되었으나, 본 발명은 또한 컴퓨터로 구현되는 방법에 의해 구현될 수 있다. 후자의 경우에 있어서, 블록은 상응하는 방법 단계를 나타내는데, 이러한 단계들은 상응하는 논리적 혹은 실제 하드웨어 블록에 의해 수행되는 기능들을 나타낸다.
설명된 실시예들은 단지 본 발명의 원리를 설명하기 위한 것이다. 여기에 설명된 배열 및 상세한 설명들의 변형 및 변경들은 통상의 지식을 가진 자들에게 자명할 것이라는 것을 이해하여야 한다. 따라서, 여기 실시예들의 설명으로 나타낸 구체적인 상세한 설명들에 의한 것이 아니라 다음의 특허 청구항에 의해서만 한정된다.
본 발명의 방법의 특정 구현 요구사항에 따라, 본 발명의 방법은 하드웨어 혹은 소프트웨어에서 구현될 수 있다. 구현은 디지털 저장 매체, 특히 본 발명의 방법이 실행되는 것과 같이, 프로그래밍할 수 있는 컴퓨터 시스템과 협력하는, 그 위에 전자적으로 판독가능한 제어 신호를 갖는 디스크(disc), 디브이디(DVD) 혹은 시디(CD)를 사용하여 실행될 수 있다. 일반적으로, 본 발명은 따라서 기계-판독가능 캐리어 상에 저장된 프로그램 코드를 갖는 컴퓨터 프로그램 제품으로서 구현될 수 있는데, 상기 프로그램 코드는 컴퓨터 프로그램 제품이 컴퓨터 상에 구동할 때 본 발명의 방법을 실행하기 위하여 작동된다. 바꾸어 말하면, 본 발명의 방법은 따라서 컴퓨터 프로그램 제품이 컴퓨터 상에 구동할 때 본 발명의 방법 중 적어도 하나를 실행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램이다. 본 발명의 인코딩된 오디오 신호는 디지털 저장 매체와 같이, 모든 기계-판독가능 저장 매체 상에 저장될 수 있다.
새로운 프로세싱의 장점은 위에서 설명된 실시예들, 즉, 본 출원서에 설명된 장치, 방법 혹은 컴퓨터 프로그램들이 대역폭 확장 애플리케이션의 지각적 오디오 품질의 향상을 허용한다. 특히, 그것은 위상 보코더 구동 대역폭 확장 내에서와 같이 분석 윈도우 특성의 신호 의존적 스위칭을 이용한다.
신규의 프로세싱은 또한 최적 분석 혹은 합성 윈도우의 선택을 위한 신호 특성을 고려하는 것이 유익할 때마다 순수 시간 스트레칭과 같은 다른 위상 보코더 애플리케이션에서 사용될 수 있다
본 발명의 구상은 대역폭 확장이 패칭 프로세스를 위한 신호 특성을 고려하도록 허용한다. 가장 적합한 분석 윈도우를 위한 결정은 개방 혹은 폐쇄 루프 내에서 행해질 수 있다. 그러므로, 복원 품질은 최적화될 수 있으며, 따라서 더 향상될 수 있다.
가장 중요한 애플리케이션은 대역폭 화장 원리를 기초로 한 오디오 디코더들이다. 그러나 본 발명의 프로세싱은 또한 음악 제작 혹은 오디오 후처리를 위한 위상 보코더 애플리케이션을 향상시킬 수 있다.

Claims (16)

  1. 코어 주파수 대역(101-3)을 포함하는 저주파 신호(101-2) 및 상위 주파수 대역(101-5)을 포함하는 고주파 신호(101-4)를 포함하는 오디오 신호(101-1)를 인코딩을 위한 대역폭 확장 인코더(100; 300; 500; 800; 1000)에 있어서,
    특정 시간 길이를 갖는 오디오 샘플들의 블록(101-6)을 지닌 상기 오디오 신호(101-1)를 분석하기 위한 신호 분석기(110);
    인코딩된 저주파 신호(121)를 얻기 위해 상기 저주파 신호(101-2)를 인코딩하기 위한 코어 인코더(core encoder, 120); 및
    상기 고주파 신호(101-4)로부터 대역폭 확장 파라미터들(parameters, 131; 321-2; 831; 1031)을 계산해 내기 위한 파라미터 계산기(parameter calculator, 130; 320; 830; 1030);
    를 포함하되,
    상기 신호 분석기(110)는,
    대역폭 확장 디코더(bandwidth extension decoder, 200; 400; 1400)에서 대역폭 확장을 수행하기 위해 사용되는 분석 윈도우(analysis window, 111-2)를, 복수(111-1)의 분석 윈도우들로부터, 결정하기 위해 구성되는 것을 특징으로 하는 오디오 신호(101-1)를 인코딩하기 위한 대역폭 확장 인코더(100; 300; 500; 800; 1000).
  2. 인코딩된 저주파 신호(201-2; 401-2; 601-2; 1411-2) 및 상위 대역 파라미터들(201-3; 401-3; 601-3; 1141-3)을 포함하는 인코딩된 오디오 신호(201-1; 401-1; 601-1; 1411-1)를 디코딩하기 위한 대역폭 확장 디코더(200; 400; 600; 1100; 1400)에 있어서,
    상기 인코딩된 저주파 신호(201-2; 401-2; 601-2; 1411-2)를 디코딩하기 위한, 디코딩된 저주파 신호(211-1; 411-1; 681-1; 1421)는 코어 주파수 대역(211-2; 411-2; 681-2; 1425)을 포함하는, 코어 디코더(210; 410; 680; 1420);
    상기 디코딩된 저주파 신호(211-1; 411-1; 681-1; 1421) 및 상기 상위 대역 파라미터들(201-3; 401-3; 601-3; 1411-3)에 기초하여 패칭된 신호(221-1; 421; 671; 1461)를 발생시키기 위해 구성되며, 상기 패칭된 신호(221-1; 421; 671; 1461)는 상기 코어 주파수 대역(211-2; 411-2; 681-2; 1425)으로부터 발생되는 상위 주파수 대역(221-2)을 포함하는, 패치 모듈(patch module, 220; 420; 1460-2); 및
    결합된 출력 신호(231-1; 431; 691; 1481)를 얻기 위해 상기 패칭된 신호(221-1; 421; 671; 1461) 및 상기 디코딩된 저주파 신호(211-1; 411-1; 681-1; 1421)를 결합하기 위해 구성되는 결합기(combiner, 230; 430; 690; 1480);
    를 포함하는 인코딩된 오디오 신호(201-1; 401-1; 601-1; 1411-1)를 디코딩하기 위한 대역폭 확장 디코더(200; 400; 600; 1100; 1400).
  3. 청구항 1에 있어서,
    복수(111-1)의 분석 윈도우 함수들(analysis window functions)을 표시하는 윈도우 제어 정보(311)를 제공하기 위한, 상기 파라미터 계산기(320)는 상기 윈도우 제어기(310)에 의해 제어되는 윈도우어(windower)를 포함하며, 상기 윈도우어는 상기 고주파 신호(101-4)에 비교기(comparator, 340)에 의해 선택되는 상기 복수(111-1)의 분석 윈도우 함수들 및 하나의 분석 윈도우 함수(111-2)를 적용하기 위해 구성되며, 상기 신호 분석기(110)는 상기 저주파 신호(101-2), 상기 윈도우 제어 정보(311) 및 BWE 파라미터들(321-1)에 기초하여 복수(331-1)의 패칭된 신호들을 발생시키기 위해 구성되는 패치 모듈(330)을 포함하며, 상기 패칭된 신호들(331-1)은 상기 코어 주파수 대역(101-3)으로부터 발생되는 상위 주파수 대역들(331-2)을 포함하는, 윈도우 제어기(310);
    상기 패칭된 신호들(331-1)과 상기 오디오 신호(101-1)이거나 상기 오디오 신호에서 파생된 신호(101-4)인 기준 신호의 비교에 기초하여 복수(341-2)의 비교 파라미터들을 결정하기 위해 구성되며, 상기 복수(341-2)의 비교 파라미터들은 상기 복수(111-1)의 분석 윈도우 함수들에 상응하고, 상기 비교기(340)는 비교 파라미터가 미리 결정된 조건을 만족시키는 분석 윈도우 함수(111-2)에 상응하는 윈도우 표시(window indication, 341-1)를 제공하기 위해 더 구성되는, 비교기(comparator, 340); 및
    인코딩된 오디오 신호(351)를 제공하기 위한, 상기 인코딩된 오디오 신호(351)는 상기 윈도우 표시(341-1)를 포함하는, 출력 인터페이스(350);
    를 더 포함하는 것을 특징으로 하는 대역폭 확장 인코더(300).
  4. 청구항 2에 있어서,
    상기 인코딩된 오디오 신호(401-1)는 윈도우 표시(401-4)를 포함하고, 상기 패치 모듈(420)은 상기 윈도우 표시(401-4)에 기초하여 복수의 분석 윈도우 함수들로부터 분석 윈도우 함수를 선택하고 상기 디코딩된 저주파 신호(411-1)에 상기 선택된 분석 윈도우 함수를 적용하기 위한 제어가능한 윈도우어를 포함하는 것을 특징으로 하는 대역폭 확장 디코더(400).
  5. 청구항 1에 있어서,
    복수(111-1)의 분석 윈도우 함수들을 표시하는 윈도우 제어 정보(311)를 제공하기 위한, 상기 파라미터 계산기(320)는 상기 윈도우 제어기(310)에 의해 제어되는 윈도우어를 포함하며, 상기 윈도우어는 상기 고주파 신호(101-4)에 비교기(510)에 의해 선택되는 상기 복수(111-1)의 분석 윈도우 함수들 및 하나의 분석 윈도우 함수(111-2)를 적용하기 위해 구성되며, 상기 신호 분석기(110)는 상기 저주파 신호(101-2), 상기 윈도우 제어 정보(311) 및 대역폭 확장 파라미터들(321-1)에 기초하여 복수(331-1)의 패칭된 신호들을 발생시키기 위해 구성되는 패치 모듈(330)을 포함하며, 상기 패칭된 신호들(331-1)은 상기 코어 주파수 대역(101-3)으로부터 발생되는 상위 주파수 대역들(331-2)을 포함하며, 상기 패치 모듈(330)은 상기 윈도우 제어기(310)에 의해 제어되는 윈도우어를 포함하며, 상기 윈도우어는 상기 저주파 신호(101-2)에 상기 복수(111-1)의 분석 윈도우 함수들을 적용하기 위해 구성되는, 윈도우 제어기(310);
    상기 패칭된 신호들(331-1)과 상기 오디오 신호에서 파생된 기준 저주파 신호(101-2)의 비교에 기초하여 복수의 비교 파라미터들을 결정하기 위해 구성되며, 상기 복수의 비교 파라미터들은 상기 복수(111-1)의 분석 윈도우 함수들에 상응하고, 상기 비교기(510)는 비교 파라미터가 미리 결정된 조건을 만족시키는 분석 윈도우 함수에 상응하는 윈도우 표시(511)를 제공하기 위해 추가로 구성되는, 비교기(510); 및
    인코딩된 오디오 신호를 제공하기 위한, 상기 인코딩된 오디오 신호(531)는 상기 윈도우 표시(511)를 포함하지 않는, 출력 인터페이스(530);
    를 더 포함하는 것을 특징으로 하는 대역폭 확장 인코더(500).
  6. 청구항 2에 있어서,
    상기 패치 모듈(220)은:
    복수(611)의 윈도윙된(windowed) 저주파 신호들을 얻기 위해 상기 디코딩된 저주파 신호(681-1)에 복수(111-1)의 분석 윈도우 함수들을 적용하기 위한 분석 윈도우어(610);
    상기 윈도윙된 저주파 신호들(611)을 스펙트럼들(621)로 변환시키기 위한 시간/스펙트럼 변환기(time/spectrum converter, 620);
    변형된 스펙트럼들(631)을 얻기 위해 주파수 도메인에서 상기 스펙트럼들(621)을 프로세싱하기 위한 주파수 도메인 프로세서(frequency domain processor, 630);
    상기 변형된 스펙트럼들(631)을 변형된 시간 도메인 신호들(641)로 변환시키기 위한 주파수/시간 변환기(640);
    변형된 시간 도메인 신호들(641)에 복수의 윈도우 함수들을 적용하기 위한, 합성 윈도우 함수들은 윈도윙되고 변형된 시간 도메인 신호들(651)을 얻기 위해 상기 분석 윈도우 함수들에 매칭되는, 합성 윈도우어(synthesis windower, 650); 및
    상기 복수(651)의 윈도윙되고 변형된 시간 도메인 신호들과 상기 디코딩된 저주파 신호(681-1)의 비교에 기초하여 복수의 비교 파라미터들을 결정하기 위해 구성되며, 상기 복수의 비교 매개변수들은 상기 복수(111-1)의 분석 윈도우 함수들에 상응하고, 상기 비교기(660)는 비교 파라미터가 미리 결정된 조건을 만족시키는 분석 윈도우 함수 및 합성 윈도우 함수를 선택하기 위해 추가로 구성되고, 상기 패치 모듈(220)은 상기 디코딩된 저주파 신호(681-1), 상기 비교기(660)에 의해 선택되는 상기 분석 윈도우 함수와 상기 합성 윈도우 함수, 및 상기 상위 대역 파라미터들(601-3)에 기초하여 패칭된 신호(671)를 발생시키기 위해 구성되는, 비교기(660);
    를 포함하는 것을 특징으로 하는 대역폭 확장 디코더(600).
  7. 청구항 3, 5 또는 6의 어느 한 항에 있어서,
    상기 비교기(340; 510; 660; 700)는 상기 패칭된 신호들(331-1) 또는 상기 윈도윙되고 변형된 시간 도메인 신호들(651)에 대한 복수(703-1)의 SFM 파라미터들 및 상기 오디오 신호(101-1) 또는 상기 디코딩된 저주파 신호(681-1)에서 파생된 기준 SFM 파라미터(703-2)를 계산하고, 상기 SFM 파라미터들(703-1)과 상기 기준 SFM 파라미터(703-2)의 비교에 기초하여 상기 복수(705)의 비교 파라미터들을 결정하기 위해 구성되는 것을 특징으로 하는 대역폭 확장 인코더(300; 500) 또는 디코더(600).
  8. 청구항 1에 있어서,
    상기 신호 분석기(110)는 분류된 신호의 신호 특성에 기초하여 분석 윈도우 함수에 상응하는 윈도우 표시(811)를 결정하기 위해 상기 오디오 신호(101-1) 또는 상기 오디오 신호(101-4)에서 파생된 신호를 분류하도록 구성되는 신호 분류기(signal classifier, 810; 900)를 포함하며, 상기 인코더(800)는 상기 신호 분류기(810)에 의해 결정되는 상기 윈도우 표시(811)에 기초하여 윈도우 제어 정보(821)를 제공하기 위한 윈도우 제어기(820)를 포함하고, 상기 파라미터 계산기(830)는 상기 윈도우 제어기(820)에 의해 제어되는 윈도우어를 포함하며, 상기 윈도우어는 상기 고주파 신호(101-4)에 상기 윈도우 제어 정보(821)에 기초하여 분석 윈도우 함수를 적용하기 위해 구성되고, 상기 인코더(800)는 상기 윈도우 표시(811)를 포함하는 인코딩된 오디오 신호(841)를 제공하기 위한 출력 인터페이스(840)를 더 포함하는 것을 특징으로 하는 대역폭 확장 인코더(800).
  9. 청구항 1에 있어서,
    상기 신호 분석기(110)는 분류된 신호의 신호 특성에 기초하여 분석 윈도우 함수에 상응하는 윈도우 표시(1011)를 결정하기 위해 상기 오디오 신호(101-1)에서 파생된 저주파 신호(101-2)를 분류하도록 구성되는 신호 분류기(900; 1010)를 포함하며, 상기 인코더(1000)는 상기 신호 분류기(900; 1010)에 의해 결정되는 상기 윈도우 표시(1011)에 기초하여 윈도우 제어 정보(1021)를 제공하기 위한 윈도우 제어기(1020)를 포함하고, 상기 파라미터 계산기(1030)는 상기 윈도우 제어기(1020)에 의해 제어되는 윈도우어를 포함하며, 상기 윈도우어는 상기 고주파 신호(101-4)에 상기 윈도우 제어 정보(1021)에 기초하여 분석 윈도우 함수를 적용하기 위해 구성되고, 상기 인코더(1000)는 상기 윈도우 표시(1011)를 포함하지 않는 인코딩된 오디오 신호(1041)를 제공하기 위한 출력 인터페이스(1040)를 더 포함하는 것을 특징으로 하는 대역폭 확장 인코더(1000).
  10. 청구항 5 또는 9에 있어서,
    디코딩된 저주파 신호(521; 1051)를 얻기 위해 상기 인코딩된 저주파 신호(121)를 디코딩하기 위한 코어 디코더(520; 1050);를 더 포함하는 것을 특징으로 하는 대역폭 확장 인코더(500; 1000).
  11. 청구항 2에 있어서,
    상기 패치 모듈(220)은:
    분류된 신호의 신호 특성에 기초하여 분석 윈도우 함수에 상응하는 윈도우 표시(1111)를 결정하기 위해 상기 디코딩된 저주파 신호(681-1)를 분류하도록 구성되며, 상기 디코더(1100)는 상기 신호 분류기(900;1110)에 의해 결정되는 상기 윈도우 표시(1111)에 기초하여 윈도우 제어 정보(1121)를 제공하기 위한 윈도우 제어기(1120)를 포함하고, 상기 패치 모듈(220)은 상기 디코딩된 저주파 신호(681-1), 상기 윈도우 제어 정보(1121)에 기초한 분석 윈도우 함수, 및 상기 상위 대역 파라미터들(601-3)에 기초하여 패칭된 신호(671)를 발생시키기 위해 구성되는 신호 분류기(900; 1110);
    를 포함하는 대역폭 확장 디코더(1100).
  12. 오디오 신호(1201) 또는 오디오 샘플들의 블록(101-6)을 갖는 상기 오디오 신호(1201)에서 파생된 신호(1202)에 복수(111-1)의 분석 윈도우 함수들을 적용하기 위한, 상기 블록(101-6)은 복수(1211)의 윈도윙된 오디오 신호들을 얻기 위해 특정 시간 길이를 가지는, 분석 윈도우어(1210);
    상기 윈도윙된 오디오 신호들(1211)을 스펙트럼들(1221)로 변환하기 위한 시간/스펙트럼 변환기(1220);
    변형된 스펙트럼들(1231)을 얻기 위해 주파수 도메인에서 상기 스펙트럼들(1221)을 프로세싱하기 위한 주파수 도메인 프로세서(1230);
    상기 변형된 스펙트럼들(1231)을 변형된 시간 도메인 신호들(1241)로 변환시키기 위한 주파수/시간 변환기(1240);
    상기 변형된 시간 도메인 신호들(1241)에 복수의 합성 윈도우 함수들을 적용하기 위한, 상기 합성 윈도우 함수들은 윈도윙되고 변형된 시간 도메인 신호들(1251)를 얻기 위해 상기 분석 윈도우 함수들에 매칭되는, 합성 윈도우어(1250);
    상기 복수(1251)의 윈도윙되고 변형된 시간 도메인 신호들과 상기 오디오 신호(1201) 또는 상기 오디오 신호에서 파생된 신호(1202)의 비교에 기초하여 복수의 비교 파라미터들을 결정하기 위해 구성되며, 상기 복수의 비교 파라미터들은 상기 복수의 분석 윈도우 함수들에 상응하고, 상기 비교기(1260)는 비교 파라미터가 미리 결정된 조건을 만족시키는 분석 윈도우 함수 및 합성 윈도우 함수를 선택하기 위해 추가로 구성되는, 비교기(1260); 및
    시간적으로 확산된 신호(1271)를 얻기 위해 윈도윙되고 변형된 시간 도메인 신호(1255)의 중첩 블록들(overlapping blocks)을 가산하기 위한, 상기 비교기(1260)에 의해 선택되는 분석 윈도우 함수 및 합성 윈도우 함수에 의해 변형되는 상기 윈도윙되고 변형된 시간 도메인 신호(1255)의 블록들을 프로세싱하기 위해 구성되는 중첩 가산기(overlap adder, 1270);
    를 포함하는 오디오 신호(1201)를 프로세싱하기 위한 위상 보코더 프로세서(phase vocoder processor, 1200).
  13. 코어 주파수 대역(101-3)을 포함하는 저주파 신호(101-2) 및 상위 주파수 대역(101-5)을 포함하는 고주파 신호(101-4)를 포함하는 오디오 신호(101-1)를 인코딩하기 위한 방법(100; 300; 500; 1000)에 있어서,
    대역폭 확장 디코더(200; 400; 1400)에서 대역폭 확장을 수행하기 위해 사용되는 분석 윈도우(111-2)를 복수(111-1)의 분석 윈도우들로부터 결정하기 위해 특정 시간 길이를 가지는 오디오 샘플들의 블록(101-6)을 갖는 상기 오디오 신호(101-1)를 분석하는 단계(110);
    인코딩된 저주파 신호(121)를 얻기 위해 상기 저주파 신호(102-2)를 인코딩하는 단계(120); 및
    상기 고주파 신호(101-4)로부터 대역폭 확장 파라미터들을 계산해내는 단계(130; 320; 830; 1030);
    를 포함하는 오디오 신호(101-1)를 인코딩하기 위한 방법(100; 300; 500; 1000).
  14. 인코딩된 저주파 신호(201-2; 401-2; 601-2; 1411-2) 및 상위 대역 파라미터들(201-3; 401-3; 601-3; 1411-3)을 포함하는 인코딩된 오디오 신호(201-1; 401-1; 601-1; 1411-1)를 디코딩하기 위한 방법(200; 400; 600; 1100; 1400)에 있어서,
    상기 인코딩된 저주파 신호(201-2; 401-2; 601-2; 1411-2)를 디코딩하는 단계(210; 410; 680; 1420)로, 디코딩된 저주파 신호(211-1; 411-1; 681-1; 1421)는 코어 주파수 대역(211-2; 411-2; 681-2; 1425)을 포함하는 단계;
    상기 디코딩된 저주파 신호(211-1; 411-1; 681-1; 1421) 및 상기 상위 대역 파라미터들(201-3; 401-3; 601-3; 1411-3)에 기초하여, 상기 코어 주파수 대역(211-2; 411-2; 681-2; 1425)으로부터 발생되는 상위 주파수 대역(221-2)을 포함하는 패칭된 신호(221-1; 421; 671; 1461)를 발생시키는 단계(220; 420; 1460-2); 및
    결합된 출력 신호(231-1; 431; 691; 1481)를 얻기 위해 상기 패칭된 신호(221-1; 421; 671; 1461) 및 상기 디코딩된 저주파 신호(211-1; 411-1; 681-1; 1421)를 결합하는 단계(230; 430; 690; 1480);
    를 포함하는 인코딩된 오디오 신호(201-1; 401-1; 601-1; 1411-1)를 디코딩하기 위한 방법(200; 400; 600; 1100; 1400).
  15. 인코딩된 저주파 신호(121);
    대역폭 확장 파라미터들(131; 321-2; 831); 및
    대역폭 확장 디코더(200; 400; 1400)에서 대역폭 확장을 수행하기 위해 이용되는 분석 윈도우(111-2);
    를 포함하는 인코딩된 오디오 신호(103-1; 351; 841).
  16. 컴퓨터 프로그램이 컴퓨터에서 실행되는 경우 상기 청구항 13 또는 14의 방법을 수행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램.
KR1020117031327A 2009-06-29 2010-06-24 대역폭 확장 인코더, 대역폭 확장 디코더 및 위상 보코더 KR101425157B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US22144209P 2009-06-29 2009-06-29
US61/221,442 2009-06-29
EP10153530.0 2010-02-12
EP10153530A EP2273493B1 (en) 2009-06-29 2010-02-12 Bandwidth extension encoding and decoding
PCT/EP2010/059025 WO2011000780A1 (en) 2009-06-29 2010-06-24 Bandwidth extension encoder, bandwidth extension decoder and phase vocoder

Publications (2)

Publication Number Publication Date
KR20120031957A true KR20120031957A (ko) 2012-04-04
KR101425157B1 KR101425157B1 (ko) 2014-08-01

Family

ID=42537947

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020117031327A KR101425157B1 (ko) 2009-06-29 2010-06-24 대역폭 확장 인코더, 대역폭 확장 디코더 및 위상 보코더

Country Status (14)

Country Link
US (1) US8606586B2 (ko)
EP (2) EP2273493B1 (ko)
JP (1) JP5329714B2 (ko)
KR (1) KR101425157B1 (ko)
CN (1) CN102473414B (ko)
AU (1) AU2010268160B2 (ko)
BR (1) BRPI1010165B1 (ko)
CA (2) CA2766573C (ko)
ES (2) ES2400661T3 (ko)
HK (2) HK1153035A1 (ko)
MX (1) MX2011013610A (ko)
PL (2) PL2273493T3 (ko)
RU (1) RU2563164C2 (ko)
WO (1) WO2011000780A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150131901A (ko) * 2014-05-14 2015-11-25 삼성전자주식회사 통신 시스템에서 송신 신호 처리 장치 및 방법

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102473417B (zh) 2010-06-09 2015-04-08 松下电器(美国)知识产权公司 频带扩展方法、频带扩展装置、集成电路及音频解码装置
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
JP5704397B2 (ja) * 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
US9177570B2 (en) * 2011-04-15 2015-11-03 St-Ericsson Sa Time scaling of audio frames to adapt audio processing to communications network timing
US9697840B2 (en) * 2011-11-30 2017-07-04 Dolby International Ab Enhanced chroma extraction from an audio codec
CN108831501B (zh) 2012-03-21 2023-01-10 三星电子株式会社 用于带宽扩展的高频编码/高频解码方法和设备
RU2725416C1 (ru) 2012-03-29 2020-07-02 Телефонактиеболагет Лм Эрикссон (Пабл) Расширение полосы частот гармонического аудиосигнала
CN106409299B (zh) * 2012-03-29 2019-11-05 华为技术有限公司 信号编码和解码的方法和设备
EP2709106A1 (en) 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
EP2720222A1 (en) * 2012-10-10 2014-04-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns
ES2768179T3 (es) * 2013-01-29 2020-06-22 Fraunhofer Ges Forschung Codificador de audio, decodificador de audio, método para proporcionar una información de audio codificada, método para proporcionar una información de audio decodificada, programa informático y representación codificada utilizando una ampliación de ancho de banda adaptada a la señal
RU2676242C1 (ru) * 2013-01-29 2018-12-26 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Декодер для формирования аудиосигнала с улучшенной частотной характеристикой, способ декодирования, кодер для формирования кодированного сигнала и способ кодирования с использованием компактной дополнительной информации для выбора
RU2625945C2 (ru) 2013-01-29 2017-07-19 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для генерирования сигнала с улучшенным спектром, используя операцию ограничения энергии
US9319510B2 (en) * 2013-02-15 2016-04-19 Qualcomm Incorporated Personalized bandwidth extension
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
CA2927990C (en) 2013-10-31 2018-08-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain
EP2881943A1 (en) 2013-12-09 2015-06-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal with low computational resources
CN103714822B (zh) * 2013-12-27 2017-01-11 广州华多网络科技有限公司 基于silk编解码器的子带编解码方法及装置
WO2015133795A1 (ko) * 2014-03-03 2015-09-11 삼성전자 주식회사 대역폭 확장을 위한 고주파 복호화 방법 및 장치
CN106463143B (zh) 2014-03-03 2020-03-13 三星电子株式会社 用于带宽扩展的高频解码的方法及设备
SG11201609834TA (en) 2014-03-24 2016-12-29 Samsung Electronics Co Ltd High-band encoding method and device, and high-band decoding method and device
CN111710342B (zh) * 2014-03-31 2024-04-16 弗朗霍弗应用研究促进协会 编码装置、解码装置、编码方法、解码方法及程序
CN104007977A (zh) * 2014-06-09 2014-08-27 威盛电子股份有限公司 电子装置及音频播放方法
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
JP2016038435A (ja) * 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
CN104269173B (zh) * 2014-09-30 2018-03-13 武汉大学深圳研究院 切换模式的音频带宽扩展装置与方法
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
US10117247B2 (en) * 2015-03-13 2018-10-30 Futurewei Technologies, Inc. Windowing methods for efficient channel aggregation and deaggregation
KR101642112B1 (ko) 2015-10-29 2016-07-22 주식회사 님버스 이동통신망에서 실시간 멀티미디어를 송수신하기 위한 모뎀 본딩 시스템 및 방법
US10504530B2 (en) 2015-11-03 2019-12-10 Dolby Laboratories Licensing Corporation Switching between transforms
KR101688647B1 (ko) 2016-04-04 2016-12-22 주식회사 님버스 이동통신망에서 실시간 저지연 전송을 위한 모뎀 본딩 시스템 및 방법
RU169931U1 (ru) * 2016-11-02 2017-04-06 Акционерное Общество "Объединенные Цифровые Сети" Устройство сжатия аудиосигнала для передачи по каналам распространения данных
CN110062945B (zh) * 2016-12-02 2023-05-23 迪拉克研究公司 音频输入信号的处理
US11527256B2 (en) * 2018-04-25 2022-12-13 Dolby International Ab Integration of high frequency audio reconstruction techniques
CA3152262A1 (en) * 2018-04-25 2019-10-31 Dolby International Ab Integration of high frequency reconstruction techniques with reduced post-processing delay
WO2020094263A1 (en) 2018-11-05 2020-05-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs
CN113593586A (zh) * 2020-04-15 2021-11-02 华为技术有限公司 音频信号编码方法、解码方法、编码设备以及解码设备

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
US5848391A (en) * 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6921740B1 (en) * 1999-08-31 2005-07-26 Mitsubishi Paper Miils Ltd. Electron-receiving compound and thermal recording material
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US6636830B1 (en) * 2000-11-22 2003-10-21 Vialta Inc. System and method for noise reduction using bi-orthogonal modified discrete cosine transform
US20020128839A1 (en) * 2001-01-12 2002-09-12 Ulf Lindgren Speech bandwidth extension
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US7389226B2 (en) * 2002-10-29 2008-06-17 Ntt Docomo, Inc. Optimized windows and methods therefore for gradient-descent based window optimization for linear prediction analysis in the ITU-T G.723.1 speech coding standard
EP1595247B1 (en) * 2003-02-11 2006-09-13 Koninklijke Philips Electronics N.V. Audio coding
DE602004030594D1 (de) * 2003-10-07 2011-01-27 Panasonic Corp Verfahren zur entscheidung der zeitgrenze zur codierung der spektro-hülle und frequenzauflösung
JP2007508623A (ja) 2003-10-08 2007-04-05 ユニシス コーポレーション 複数のノードにわたってシステムリソースを割り当てて管理する仮想データセンタ
DE102004009954B4 (de) * 2004-03-01 2005-12-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
JP2007304258A (ja) * 2006-05-10 2007-11-22 Matsushita Electric Ind Co Ltd オーディオ信号符号化およびその復号化装置、方法ならびにプログラム
US8463412B2 (en) * 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150131901A (ko) * 2014-05-14 2015-11-25 삼성전자주식회사 통신 시스템에서 송신 신호 처리 장치 및 방법

Also Published As

Publication number Publication date
EP2273493B1 (en) 2012-12-19
KR101425157B1 (ko) 2014-08-01
RU2012102411A (ru) 2013-08-20
CA2856587C (en) 2016-09-13
CA2766573C (en) 2015-06-23
CN102473414B (zh) 2013-11-06
US20120158409A1 (en) 2012-06-21
MX2011013610A (es) 2012-03-26
WO2011000780A1 (en) 2011-01-06
US8606586B2 (en) 2013-12-10
CA2766573A1 (en) 2011-01-06
EP2449554B1 (en) 2015-03-25
BRPI1010165B1 (pt) 2021-01-05
CN102473414A (zh) 2012-05-23
JP2012531632A (ja) 2012-12-10
PL2273493T3 (pl) 2013-07-31
HK1153035A1 (en) 2012-03-16
ES2534944T3 (es) 2015-04-30
AU2010268160A1 (en) 2012-02-02
BRPI1010165A2 (pt) 2016-03-29
ES2400661T3 (es) 2013-04-11
PL2449554T3 (pl) 2015-08-31
JP5329714B2 (ja) 2013-10-30
AU2010268160B2 (en) 2014-03-06
HK1170331A1 (en) 2013-02-22
RU2563164C2 (ru) 2015-09-20
CA2856587A1 (en) 2011-01-06
EP2449554A1 (en) 2012-05-09
EP2273493A1 (en) 2011-01-12

Similar Documents

Publication Publication Date Title
KR101425157B1 (ko) 대역폭 확장 인코더, 대역폭 확장 디코더 및 위상 보코더
US11915712B2 (en) Audio encoder and decoder using a frequency domain processor, a time domain processor, and a cross processing for continuous initialization
US12080310B2 (en) Audio encoder and decoder using a frequency domain processor with full-band gap filling and a time domain processor
JP5227459B2 (ja) 合成オーディオ信号を生成する装置及び方法並びにオーディオ信号を符号化する装置及び方法
AU2014201331B2 (en) Bandwidth extension encoder, bandwidth extension decoder and phase vocoder

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180716

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190716

Year of fee payment: 6