KR102497366B1 - 중간 샘플링 레이트를 사용한 오디오 디코딩 - Google Patents

중간 샘플링 레이트를 사용한 오디오 디코딩 Download PDF

Info

Publication number
KR102497366B1
KR102497366B1 KR1020187037310A KR20187037310A KR102497366B1 KR 102497366 B1 KR102497366 B1 KR 102497366B1 KR 1020187037310 A KR1020187037310 A KR 1020187037310A KR 20187037310 A KR20187037310 A KR 20187037310A KR 102497366 B1 KR102497366 B1 KR 102497366B1
Authority
KR
South Korea
Prior art keywords
sampling rate
signal
domain
band signal
band
Prior art date
Application number
KR1020187037310A
Other languages
English (en)
Other versions
KR20190021253A (ko
Inventor
벤카타 수브라마니암 찬드라 세카르 체비얌
벤카트라만 아티
Original Assignee
퀄컴 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 퀄컴 인코포레이티드 filed Critical 퀄컴 인코포레이티드
Priority to KR1020237004017A priority Critical patent/KR20230023821A/ko
Publication of KR20190021253A publication Critical patent/KR20190021253A/ko
Application granted granted Critical
Publication of KR102497366B1 publication Critical patent/KR102497366B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

신호를 프로세싱하는 방법은 디코더에서 입력 오디오 비트스트림의 제 1 프레임을 수신하는 단계를 포함한다. 제 1 프레임은 주파수 범위와 연관된 적어도 하나의 신호를 포함한다. 방법은 또한, 적어도 하나의 신호를 디코딩하여 중간 샘플링 레이트를 갖는 적어도 하나의 디코딩된 신호를 생성하는 단계를 포함한다. 중간 샘플링 레이트는 제 1 프레임과 연관된 코딩 정보에 기초한다. 방법은 적어도 하나의 디코딩된 신호에 적어도 부분적으로 기초하여 리샘플링된 신호를 생성하는 단계를 더 포함한다. 리샘플링된 신호는 디코더의 출력 샘플링 레이트를 갖는다.

Description

중간 샘플링 레이트를 사용한 오디오 디코딩
우선권의 주장
본 출원은 공동 소유의, 발명의 명칭이 "AUDIO DECODING USING INTERMEDIATE SAMPLING RATE" 인 2016 년 6 월 27 일자로 출원된 미국 가특허출원 제 62/355,138 호 및 발명의 명칭이 "AUDIO DECODING USING INTERMEDIATE SAMPLING RATE" 인 2017 년 6 월 12 일자로 출원된 미국 정규특허출원 제 15/620,685 호로부터 우선권의 이익을 주장하며, 전술된 출원들 각각의 내용들은 그 전체가 참조로서 본원에 명백하게 포함된다.
분야
본 개시물은 일반적으로 오디오 디코딩에 관련된다.
컴퓨팅 디바이스는 인코딩된 오디오 신호들을 디코딩 및 프로세싱하기 위한 디코더를 포함할 수도 있다. 예를 들어, 디코더는 인코더로부터 인코딩된 오디오 신호들을 수신할 수도 있다. 인코딩된 오디오 신호들은 상이한 샘플링 레이트들에서 인코딩될 수도 있다. 예시하기 위해, 제 1 인코딩된 신호 (예를 들어, 광대역 신호) 는 16 kHz 샘플링 레이트에서 인코딩될 수도 있고, 제 2 인코딩된 신호 (예를 들어, 초-광대역 신호) 는 32 kHz 샘플링 레이트에서 인코딩될 수도 있고, 제 3 인코딩된 신호 (예를 들어, 풀-대역 신호) 는 40 kHz 샘플링 레이트에서 인코딩될 수도 있으며, 제 4 인코딩된 신호 (예를 들어, 초-광대역 신호) 는 48 kHz 샘플링 레이트에서 인코딩될 수도 있다. 디코딩 동작들 동안, 디코더는 각각의 인코딩된 신호를 디코더의 출력 샘플링 레이트로 리샘플링할 수도 있다. 비-제한적 예로서, 디코더는 각각의 인코딩된 신호를 48 kHz 샘플링 레이트로 리샘플링할 수도 있다.
그러나, 디코딩 동작들 동안, 디코더는 출력 샘플링 레이트에서 각각의 인코딩된 신호의 코어 (예를 들어, 저-대역) 를 별개로 리샘플링하고 출력 샘플링 레이트에서 각각의 인코딩된 신호의 고-대역을 별개로 리샘플링할 수도 있다. 코어 및 고-대역이 출력 샘플링 레이트에서 리샘플링된 후에, 리샘플링된 코어 및 고-대역 신호들 상에서 출력 샘플링 레이트로 일부 포스트-프로세싱이 수행될 수도 있다. 결과의 신호들은 결합되어 프로세싱 동작들에 대한 추가의 회로부에 제공될 수도 있다. 코어 및 고-대역을 별개로 리샘플링하고 출력 샘플링 레이트에서 포스트-프로세싱을 불필요하게 수행하는 것은 상대적으로 긴 신호 프로세싱 시간들을 초래한다.
일 구현에 따르면, 장치는 인코더로부터 중간 채널 오디오 비트스트림의 제 1 프레임을 수신하도록 구성되는 수신기를 포함한다. 장치는 또한, 제 1 프레임과 연관된 제 1 코딩 정보에 기초하여 제 1 프레임의 제 1 대역폭을 결정하도록 구성된 디코더를 포함한다. 제 1 코딩 정보는 제 1 프레임을 인코딩하도록 인코더에 의해 사용된 제 1 코딩 모드를 나타낸다. 제 1 대역폭은 제 1 코딩 모드에 기초한다. 디코더는 또한, 제 1 대역폭의 나이퀴스트 (Nyquist) 샘플링 레이트에 기초하여 중간 샘플링 레이트를 결정하도록 구성된다. 디코더는 또한, 제 1 프레임의 인코딩된 중간 채널을 디코딩하여 디코딩된 중간 채널을 생성하도록 구성된다. 디코더는 또한, 디코딩된 중간 채널 상에서 주파수-도메인 업믹스 동작을 수행하여 좌측 주파수-도메인 저-대역 신호 및 우측 주파수-도메인 저-대역 신호를 생성하도록 구성된다. 디코더는 또한, 좌측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 중간 샘플링 레이트를 갖는 좌측 시간-도메인 저-대역 신호를 생성하도록 구성된다. 디코더는 또한, 우측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 중간 샘플링 레이트를 갖는 우측 시간-도메인 저-대역 신호를 생성하도록 구성된다. 디코더는 또한, 인코딩된 중간 채널에 적어도 기초하여, 중간 샘플링 레이트를 갖는 좌측 시간-도메인 고-대역 신호 및 중간 샘플링 레이트를 갖는 우측 시간-도메인 고-대역 신호를 생성하도록 구성된다. 디코더는 또한, 좌측 시간-도메인 저-대역 신호 및 좌측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 좌측 신호를 생성하도록 구성된다. 디코더는 또한, 우측 시간-도메인 저-대역 신호 및 우측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 우측 신호를 생성하도록 구성된다. 디코더는 또한, 디코더의 출력 샘플링 레이트를 갖는 좌측 리샘플링된 신호 및 출력 샘플링 레이트를 갖는 우측 리샘플링된 신호를 생성하도록 구성된다. 좌측 리샘플링된 신호는 좌측 신호에 적어도 부분적으로 기초하고, 우측 리샘플링된 신호는 우측 신호에 적어도 부분적으로 기초한다.
다른 구현에 따르면, 신호를 프로세싱하는 방법은, 디코더에서, 인코더로부터 중간 채널 오디오 비트스트림의 제 1 프레임을 수신하는 단계를 포함한다. 방법은 또한, 제 1 프레임과 연관된 제 1 코딩 정보에 기초하여 제 1 프레임의 제 1 대역폭을 결정하는 단계를 포함한다. 제 1 코딩 정보는 제 1 프레임을 인코딩하도록 인코더에 의해 사용된 제 1 코딩 모드를 나타낸다. 제 1 대역폭은 제 1 코딩 모드에 기초한다. 방법은 또한, 제 1 대역폭의 나이퀴스트 샘플링 레이트에 기초하여 중간 샘플링 레이트를 결정하는 단계를 포함한다. 방법은 또한, 제 1 프레임의 인코딩된 중간 채널을 디코딩하여 디코딩된 중간 채널을 생성하는 단계를 포함한다. 방법은 또한, 디코딩된 중간 채널 상에서 주파수-도메인 업믹스 동작을 수행하여 좌측 주파수-도메인 저-대역 신호 및 우측 주파수-도메인 저-대역 신호를 생성하는 단계를 포함한다. 방법은 또한, 좌측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 중간 샘플링 레이트를 갖는 좌측 시간-도메인 저-대역 신호를 생성하는 단계를 포함한다. 방법은 또한, 우측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 중간 샘플링 레이트를 갖는 우측 시간-도메인 저-대역 신호를 생성하는 단계를 포함한다. 방법은 또한, 인코딩된 중간 채널에 적어도 기초하여, 중간 샘플링 레이트를 갖는 좌측 시간-도메인 고-대역 신호 및 중간 샘플링 레이트를 갖는 우측 시간-도메인 고-대역 신호를 생성하는 단계를 포함한다. 방법은 또한, 좌측 시간-도메인 저-대역 신호 및 좌측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 좌측 신호를 생성하는 단계를 포함한다. 방법은 또한, 우측 시간-도메인 저-대역 신호 및 우측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 우측 신호를 생성하는 단계를 포함한다. 방법은 또한, 디코더의 출력 샘플링 레이트를 갖는 좌측 리샘플링된 신호 및 출력 샘플링 레이트를 갖는 우측 리샘플링된 신호를 생성하는 단계를 포함한다. 좌측 리샘플링된 신호는 좌측 신호에 적어도 부분적으로 기초하여, 우측 리샘플링된 신호는 우측 신호에 적어도 부분적으로 기초한다.
다른 구현에 따르면, 비일시적 컴퓨터 판독가능 매체는 신호를 프로세싱하기 위한 명령들을 포함한다. 명령들은, 디코더 내의 프로세서에 의해 실행되는 경우, 프로세서로 하여금 인코더로부터 중간 채널 오디오 비트스트림의 제 1 프레임을 수신하는 것을 포함하는 동작들을 수행하게 한다. 동작들은 또한, 제 1 프레임과 연관된 제 1 코딩 정보에 기초하여 제 1 프레임의 제 1 대역폭을 결정하는 것을 포함한다. 제 1 코딩 정보는 제 1 프레임을 인코딩하도록 인코더에 의해 사용된 제 1 코딩 모드를 나타낸다. 제 1 대역폭은 제 1 코딩 모드에 기초한다. 동작들은 또한, 제 1 대역폭의 나이퀴스트 샘플링 레이트에 기초하여 중간 샘플링 레이트를 결정하는 것을 포함한다. 동작들은 또한, 제 1 프레임의 인코딩된 중간 채널을 디코딩하여 디코딩된 중간 채널을 생성하는 것을 포함한다. 동작들은 또한, 디코딩된 중간 채널 상에서 주파수-도메인 업믹스 동작을 수행하여 좌측 주파수-도메인 저-대역 신호 및 우측 주파수-도메인 저-대역 신호를 생성하는 것을 포함한다. 동작들은 또한, 좌측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 중간 샘플링 레이트를 갖는 좌측 시간-도메인 저-대역 신호를 생성하는 것을 포함한다. 동작들은 또한, 우측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 중간 샘플링 레이트를 갖는 우측 시간-도메인 저-대역 신호를 생성하는 것을 포함한다. 동작들은 또한, 인코딩된 중간 채널에 적어도 기초하여, 중간 샘플링 레이트를 갖는 좌측 시간-도메인 고-대역 신호 및 중간 샘플링 레이트를 갖는 우측 시간-도메인 고-대역 신호를 생성하는 것을 포함한다. 동작들은 또한, 좌측 시간-도메인 저-대역 신호 및 좌측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 좌측 신호를 생성하는 것을 포함한다. 동작들은 또한, 우측 시간-도메인 저-대역 신호 및 우측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 우측 신호를 생성하는 것을 포함한다. 동작들은 또한, 디코더의 출력 샘플링 레이트를 갖는 좌측 리샘플링된 신호 및 출력 샘플링 레이트를 갖는 우측 리샘플링된 신호를 생성하는 것을 포함한다. 좌측 리샘플링된 신호는 좌측 신호에 적어도 부분적으로 기초하고, 우측 리샘플링된 신호는 우측 신호에 적어도 부분적으로 기초한다.
다른 구현에 따르면, 장치는 인코더로부터 중간 채널 오디오 비트스트림의 제 1 프레임을 수신하기 위한 수단을 포함한다. 장치는 또한, 제 1 프레임과 연관된 제 1 코딩 정보에 기초하여 제 1 프레임의 제 1 대역폭을 결정하기 위한 수단을 포함한다. 제 1 코딩 정보는 제 1 프레임을 인코딩하도록 인코더에 의해 사용된 제 1 코딩 모드를 나타낸다. 제 1 대역폭은 제 1 코딩 모드에 기초한다. 장치는 또한, 제 1 대역폭의 나이퀴스트 샘플링 레이트에 기초하여 중간 샘플링 레이트를 결정하기 위한 수단을 포함한다. 장치는 또한, 제 1 프레임의 인코딩된 중간 채널을 디코딩하여 디코딩된 중간 채널을 생성하기 위한 수단을 포함한다. 장치는 또한, 디코딩된 중간 채널 상에서 주파수-도메인 업믹스 동작을 수행하여 좌측 주파수-도메인 저-대역 신호 및 우측 주파수-도메인 저-대역 신호를 생성하기 위한 수단을 포함한다. 장치는 또한, 좌측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 중간 샘플링 레이트를 갖는 좌측 시간-도메인 저-대역 신호를 생성하기 위한 수단을 포함한다. 장치는 또한, 우측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 중간 샘플링 레이트를 갖는 우측 시간-도메인 저-대역 신호를 생성하기 위한 수단을 포함한다. 장치는 또한, 인코딩된 중간 채널에 적어도 기초하여, 중간 샘플링 레이트를 갖는 좌측 시간-도메인 고-대역 신호 및 중간 샘플링 레이트를 갖는 우측 시간-도메인 고-대역 신호를 생성하기 위한 수단을 포함한다. 장치는 또한, 좌측 시간-도메인 저-대역 신호 및 좌측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 좌측 신호를 생성하기 위한 수단을 포함한다. 장치는 또한, 우측 시간-도메인 저-대역 신호 및 우측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 우측 신호를 생성하기 위한 수단을 포함한다. 장치는 또한, 디코더의 출력 샘플링 레이트를 갖는 좌측 리샘플링된 신호 및 출력 샘플링 레이트를 갖는 우측 리샘플링된 신호를 생성하기 위한 수단을 포함한다. 좌측 리샘플링된 신호는 좌측 신호에 적어도 부분적으로 기초하고, 우측 리샘플링된 신호는 우측 신호에 적어도 부분적으로 기초한다.
다른 구현에 따르면, 신호를 프로세싱하는 방법은 디코더에서 입력 오디오 비트스트림의 제 1 프레임을 수신하는 단계를 포함한다. 제 1 프레임은 주파수 범위와 연관된 적어도 하나의 신호를 포함한다. 방법은 또한, 적어도 하나의 신호를 디코딩하여 중간 샘플링 레이트를 갖는 적어도 하나의 디코딩된 신호를 생성하는 단계를 포함한다. 중간 샘플링 레이트는 제 1 프레임과 연관된 코딩 정보에 기초한다. 방법은 적어도 하나의 디코딩된 신호에 적어도 부분적으로 기초하여 리샘플링된 신호를 생성하는 단계를 더 포함한다. 리샘플링된 신호는 디코더의 출력 샘플링 레이트를 갖는다.
다른 구현에 따르면, 신호를 프로세싱하기 위한 장치는 디코더에서 입력 오디오 비트스트림의 제 1 프레임을 수신하도록 구성된 디멀티플렉서를 포함한다. 제 1 프레임은 주파수 범위와 연관된 적어도 하나의 신호를 포함한다. 장치는 또한, 적어도 하나의 신호를 디코딩하여 중간 샘플링 레이트를 갖는 적어도 하나의 디코딩된 신호를 생성하도록 구성된 적어도 하나의 디코더를 포함한다. 중간 샘플링 레이트는 제 1 프레임과 연관된 코딩 정보에 기초한다. 장치는 적어도 하나의 디코딩된 신호에 적어도 부분적으로 기초하여 리샘플링된 신호를 생성하도록 구성된 샘플러를 더 포함한다. 리샘플링된 신호는 디코더의 출력 샘플링 레이트를 갖는다.
다른 구현에 따르면, 비일시적 컴퓨터 판독가능 매체는 신호를 프로세싱하기 위한 명령들을 포함한다. 명령들은, 디코더 내의 프로세서에 의해 실행되는 경우, 프로세서로 하여금 디코더에서 입력 오디오 비트스트림의 제 1 프레임을 수신하는 것을 포함하는 동작들을 수행하게 한다. 제 1 프레임은 주파수 범위와 연관된 적어도 하나의 신호를 포함한다. 동작들은 또한, 적어도 하나의 신호를 디코딩하여 중간 샘플링 레이트를 갖는 적어도 하나의 디코딩된 신호를 생성하는 것을 포함한다. 중간 샘플링 레이트는 제 1 프레임과 연관된 코딩 정보에 기초한다. 동작들은 적어도 하나의 디코딩된 신호에 적어도 부분적으로 기초하여 리샘플링된 신호를 생성하는 것을 더 포함한다. 리샘플링된 신호는 디코더의 출력 샘플링 레이트를 갖는다.
대안의 구현에 따르면, 신호를 프로세싱하는 방법은 디코더에서 입력 오디오 비트스트림의 제 1 프레임을 수신하는 단계를 포함한다. 제 1 프레임은 주파수 범위와 연관된 적어도 하나의 신호를 포함한다. 방법은 또한, 신호 중 적어도 하나의 각각과 연관된 대역 당 중간 샘플링 레이트를 결정하는 단계를 포함한다. 적어도 하나의 신호와 연관된 각각의 대역 당 중간 샘플링 레이트는 제 1 프레임과 연관된 코딩 정보에 기초하여 결정된 단일의 중간 샘플링 레이트 이하이다. 방법은 또한, 적어도 하나의 신호를 디코딩하여 대응하는 대역 당 중간 샘플링 레이트를 갖는 적어도 하나의 디코딩된 신호를 생성하는 단계를 포함한다. 방법은 적어도 하나의 디코딩된 신호에 적어도 부분적으로 기초하여 리샘플링된 신호를 생성하는 단계를 더 포함한다. 리샘플링된 신호는 디코더의 출력 샘플링 레이트를 갖는다.
다른 구현에 따르면, 신호를 프로세싱하는 방법은 디코더에서 입력 오디오 비트스트림의 제 1 프레임을 수신하는 단계를 포함한다. 제 1 프레임은 적어도, 제 1 주파수 범위와 연관된 저-대역 신호 및 제 2 주파수 범위와 연관된 고-대역 신호를 포함한다. 방법은 또한, 저-대역 신호를 디코딩하여 중간 샘플링 레이트를 갖는 디코딩된 저-대역 신호를 생성하는 단계를 포함한다. 중간 샘플링 레이트는 제 1 프레임과 연관된 코딩 정보에 기초한다. 방법은 고-대역 신호를 디코딩하여 중간 샘플링 레이트를 갖는 디코딩된 고-대역 신호를 생성하는 단계를 더 포함한다. 방법은 또한, 적어도 디코딩된 저-대역 신호 및 디코딩된 고-대역 신호를 결합하여 중간 샘플링 레이트를 갖는 결합 신호를 생성하는 단계를 포함한다. 방법은 결합 신호에 적어도 부분적으로 기초하여 리샘플링된 신호를 생성하는 단계를 더 포함한다. 리샘플링된 신호는 디코더의 출력 샘플링 레이트에서 샘플링된다.
다른 구현에 따르면, 신호를 프로세싱하기 위한 장치는 디코더에서 입력 오디오 비트스트림의 제 1 프레임을 수신하도록 구성된 디멀티플렉서를 포함한다. 제 1 프레임은 적어도, 제 1 주파수 범위와 연관된 저-대역 신호 및 제 2 주파수 범위와 연관된 고-대역 신호를 포함한다. 장치는 또한, 저-대역 신호를 디코딩하여 중간 샘플링 레이트를 갖는 디코딩된 저-대역 신호를 생성하도록 구성된 저-대역 디코더를 포함한다. 중간 샘플링 레이트는 제 1 프레임과 연관된 코딩 정보에 기초한다. 장치는 고-대역 신호를 디코딩하여 중간 샘플링 레이트를 갖는 디코딩된 고-대역 신호를 생성하도록 구성된 고-대역 디코더를 더 포함한다. 장치는 또한, 적어도 디코딩된 저-대역 신호 및 디코딩된 고-대역 신호를 결합하여 중간 샘플링 레이트를 갖는 결합 신호를 생성하도록 구성된 가산기를 포함한다. 장치는 결합 신호에 적어도 부분적으로 기초하여 리샘플링된 신호를 생성하도록 구성된 샘플러를 더 포함한다. 리샘플링된 신호는 디코더의 출력 샘플링 레이트에서 샘플링된다.
다른 구현에 따르면, 비일시적 컴퓨터 판독가능 매체는 신호를 프로세싱하기 위한 명령들을 포함한다. 명령들은, 디코더 내의 프로세서에 의해 실행되는 경우, 프로세서로 하여금 입력 오디오 비트스트림의 제 1 프레임을 수신하는 것을 포함하는 동작들을 수행하게 한다. 제 1 프레임은 적어도, 제 1 주파수 범위와 연관된 저-대역 신호 및 제 2 주파수 범위와 연관된 고-대역 신호를 포함한다. 동작들은 또한, 저-대역 신호를 디코딩하여 중간 샘플링 레이트를 갖는 디코딩된 저-대역 신호를 생성하는 것을 포함한다. 중간 샘플링 레이트는 제 1 프레임과 연관된 코딩 정보에 기초한다. 동작들은 고-대역 신호를 디코딩하여 중간 샘플링 레이트를 갖는 디코딩된 고-대역 신호를 생성하는 것을 더 포함한다. 동작들 또한, 적어도 디코딩된 저-대역 신호 및 디코딩된 고-대역 신호를 결합하여 중간 샘플링 레이트를 갖는 결합 신호를 생성하는 것을 포함한다. 동작들은 결합 신호에 적어도 부분적으로 기초하여 리샘플링된 신호를 생성하는 것을 더 포함한다. 리샘플링된 신호는 디코더의 출력 샘플링 레이트에서 샘플링된다.
다른 구현에 따르면, 신호를 프로세싱하기 위한 장치는 입력 오디오 비트스트림의 제 1 프레임을 수신하기 위한 수단을 포함한다. 제 1 프레임은 적어도, 제 1 주파수 범위와 연관된 저-대역 신호 및 제 2 주파수 범위와 연관된 고-대역 신호를 포함한다. 장치는 또한, 저-대역 신호를 디코딩하여 중간 샘플링 레이트를 갖는 디코딩된 저-대역 신호를 생성하기 위한 수단을 포함한다. 중간 샘플링 레이트는 제 1 프레임과 연관된 코딩 정보에 기초한다. 장치는 고-대역 신호를 디코딩하여 중간 샘플링 레이트를 갖는 디코딩된 고-대역 신호를 생성하기 위한 수단을 더 포함한다. 장치는 또한, 적어도 디코딩된 저-대역 신호 및 디코딩된 고-대역 신호를 결합하여 중간 샘플링 레이트를 갖는 결합 신호를 생성하기 위한 수단을 포함한다. 장치는 결합 신호에 적어도 부분적으로 기초하여 리샘플링된 신호를 생성하기 위한 수단을 더 포함한다. 리샘플링된 신호는 디코더의 출력 샘플링 레이트에서 샘플링된다.
도 1 은 오디오 프레임의 코딩 모드와 연관된 중간 샘플링 레이트를 사용하여 오디오 프레임을 디코딩하도록 동작 가능한 디코더를 포함하는 시스템을 도시하고;
도 2 는 오디오 프레임의 코딩 모드와 연관된 중간 샘플링 레이트를 사용하여 오디오 프레임을 디코딩하도록 동작 가능한 디코딩 시스템을 도시하고;
도 3 은 오디오 프레임의 코딩 모드와 연관된 중간 샘플링 레이트를 사용하여 오디오 프레임의 저-대역 부분을 디코딩하도록 동작 가능한 더-대역 디코더 및 중간 샘플링 레이트를 사용하여 오디오 프레임의 고-대역 부분을 디코딩하도록 동작 가능한 고-대역 디코더를 도시하고;
도 4 는 중간 샘플링 레이트들을 사용하여 디코딩되는 오디오 프레임들과 연관된 신호들을 예시하고;
도 5 는 중간 샘플링 레이트들을 사용하여 디코딩되는 오디오 프레임들과 연관된 추가의 신호들을 예시하고;
도 6 은 오디오 프레임의 코딩 모드와 연관된 중간 샘플링 레이트를 사용하여 오디오 프레임을 디코딩하도록 동작 가능한 다른 디코딩 시스템을 도시하고;
도 7 은 오디오 프레임의 코딩 모드와 연관된 중간 샘플링 레이트를 사용하여 오디오 프레임의 풀-대역 부분을 디코딩하도록 동작 가능한 풀-대역 디코더를 도시하고;
도 8a 는 프레임의 코딩 모드와 연관된 중간 샘플링 레이트를 사용하여 프레임을 디코딩하는 방법을 도시하고;
도 8b 는 프레임의 코딩 모드와 연관된 중간 샘플링 레이트를 사용하여 프레임을 디코딩하는 다른 방법을 도시하고;
도 9 는 오디오 프레임의 코딩 모드와 연관된 중간 샘플링 레이트를 사용하여 오디오 프레임을 디코딩하도록 동작 가능한 시스템을 도시하고;
도 10 은 중첩-가산 (overlap-add) 동작을 도시하고;
도 11a 및 도 11b 는 프레임의 코딩 모드와 연관된 중간 샘플링 레이트를 사용하여 프레임을 디코딩하는 방법을 도시하고;
도 12 는 프레임의 코딩 모드와 연관된 중간 샘플링 레이트를 사용하여 프레임을 디코딩하도록 동작 가능한 컴포넌트들을 포함하는 디바이스를 도시하며;
도 13 은 프레임의 코딩 모드와 연관된 중간 샘플링 레이트를 사용하여 프레임을 디코딩하도록 동작 가능한 컴포넌트들을 포함하는 기지국을 도시한다.
본 개시물의 특정 구현들은 도면들을 참조하여 이하에서 설명된다. 설명에서, 공통의 피처들은 공통의 참조 부호들에 의해 지정된다. 본원에 사용된 바와 같이, 다양한 전문용어는 단지 특정 구현들을 설명하는 목적을 위해 사용되고 구현들의 제한인 것으로 의도되지 않는다. 예를 들어, 단수 형태들 "a", "an", 및 "the" 는, 콘텍스트가 달리 명확히 나타내지 않는 한, 또한 복수 형태들도 포함하도록 의도된다. 또한, 용어들 "포함하다 (comprises)" 및 "포함하는" 은 "포함하다 (includes)" 및 "포함하는" 과 상호 교환적으로 사용될 수도 있다는 것으로 이해될 수도 있다. 부가적으로, 용어 "여기에" 는 "여기서" 와 상호 교환적으로 사용될 사용될 수도 있다는 것으로 이해될 것이다. 본원에 사용된 바와 같이, 구조물, 컴포넌트, 동작 등과 같은 엘리먼트를 수정하는데 사용된 서수적 용어 (예를 들어, "제 1", "제 2", "제 3" 등) 는 다른 엘리먼트에 대하여 엘리먼트의 임의의 우선순위 또는 순서를 그 자체로 나타내지 않고, 차라리 동일한 명칭을 갖는 (하지만 서수적 용어의 사용을 위해) 다른 엘리먼트로부터 그 엘리먼트를 단지 구별한다. 본원에 사용된 바와 같이, 용어 "세트" 는 하나 이상의 특정 엘리먼트를 지칭하고, 용어 "복수" 는 다수 (예를 들어, 2 이상) 의 특정 엘리먼트를 지칭한다.
도 1 은 네트워크 (120) 를 통해 제 2 디바이스 (106) 에 통신 가능하게 커플링된 제 1 디바이스 (104) 를 포함하는 시스템 (100) 의 특정 예시적 예를 도시한다. 네트워크 (120) 는 하나 이상의 무선 네트워크들, 하나 이상의 유선 네트워크들, 또는 이들의 조합을 포함할 수도 있다.
제 1 디바이스 (104) 는 인코더 (114), 송신기 (110), 하나 이상의 입력 인터페이스들 (112), 또는 이들의 조합을 포함한다. 입력 인터페이스(들) (112) 의 제 1 입력 인터페이스는 제 1 마이크로폰 (146) 에 커플링될 수도 있다. 입력 인터페이스(들) (112) 의 제 2 입력 인터페이스는 제 2 마이크로폰 (148) 에 커플링될 수도 있다. 인코더 (114) 는 본원에 설명된 바와 같이, 코딩 정보를 생성하도록 동작 가능한 코딩 모드 정보 생성기 (108) 를 포함한다. 제 1 디바이스 (104) 는 또한, 메모리 (153) 를 포함할 수도 있다.
제 2 디바이스 (106) 는 디코더 (118), 메모리 (175), 수신기 (178), 하나 이상의 출력 인터페이스들 (177), 또는 이들의 조합을 포함한다. 제 2 디바이스 (106) 의 수신기 (178) 는 인코딩된 오디오 신호 (예를 들어, 하나 이상의 비트스트림들), 하나 이상의 파라미터들, 또는 양자 모두를 제 1 디바이스 (104) 로부터 네트워크 (120) 를 통해 수신할 수도 있다. 디코더 (118) 는 상이한 프레임들의 코딩 모드들을 결정하고 코딩 모드들과 연관된 샘플링 레이트들 (예를 들어, "중간 샘플링 레이트들") 을 결정하도록 동작 가능한 중간 샘플링 레이트 결정 회로부 (172) 를 포함한다. 디코더 (118) 는 프레임과 연관된 중간 샘플링 레이트를 사용하여 각각의 프레임을 디코딩할 수도 있다. 예를 들어, 디코더 (118) 는 중간 샘플링 레이트를 사용하여 각각의 프레임의 고-대역 및 각각의 프레임의 코어 (예를 들어, 저-대역) 을 디코딩할 수도 있다. 코어 및 고-대역이 디코딩된 후에, 디코더 (118) 는 결과의 신호들을 결합하고 결합 신호를 디코더 (118) 의 출력 샘플 레이트에서 리샘플링할 수도 있다. 중간 샘플링 레이트들을 사용하는 디코딩 동작들은 도 2 내지 도 8 에 대하여 더 상세히 설명된다.
동작 동안, 제 1 디바이스 (104) 는 제 1 마이크로폰 (146) 으로부터 제 1 입력 인터페이스를 통해 제 1 오디오 신호 (130) 를 수신할 수도 있고 제 2 마이크로폰 (148) 으로부터 제 2 입력 인터페이스를 통해 제 2 오디오 신호 (132) 를 수신할 수도 있다. 제 1 오디오 신호 (130) 는 우측 채널 신호 또는 좌측 채널 신호 중 하나에 대응할 수도 있다. 제 2 오디오 신호 (132) 는 우측 채널 신호 또는 좌측 채널 신호 중 다른 하나에 대응할 수도 있다. 일부 구현들에서, 사운드 소스 (152)(예를 들어, 사용자, 스피커, 주변 잡음, 악기 등) 는 제 2 마이크로폰 (148) 보다는 제 1 마이크로폰 (146) 에 더 가까울 수도 있다. 따라서, 사운드 소스 (152) 로부터의 오디오 신호는 제 2 마이크로폰 (148) 을 통한 것보다 더 이른 시간에 제 1 마이크로폰 (146) 을 통해 입력 인터페이스(들)(112) 에서 수신될 수도 있다. 다수의 마이크로폰들을 통한 멀티-채널 신호 포착에서 이 자연스러운 지연은 제 1 오디오 신호 (130) 와 제 2 오디오 신호 (132) 간의 시간적 시프트를 도입할 수도 있다. 일부 구현들에서, 인코더 (114) 는 제 1 오디오 신호 (130) 또는 제 2 오디오 신호 (132) 중 적어도 하나를 조정 (예를 들어, 시프트) 하여 제 1 오디오 신호 (130) 및 제 2 오디오 신호 (132) 를 시간적으로 정렬하도록 구성될 수도 있다. 예를 들어, 인코더 (114) 는 (제 2 오디오 신호 (132) 의) 제 2 프레임에 대하여 (제 1 오디오 신호 (130) 의) 제 1 프레임을 시간적으로 시프트 또는 지연시킬 수도 있다.
인코더 (114) 는 오디오 신호들 (130, 132) 을 주파수-도메인 신호들로 변환할 수도 있다. 주파수-도메인 신호들은 스테레오 큐들 (162) 을 추정하는데 사용될 수도 있다. 스테레오 큐들 (162) 은 좌측 채널들 및 우측 채널들과 연관된 공간적 특성들의 렌더링을 가능하게 하는 파라미터들을 포함할 수도 있다. 일부 구현들에 따라, 스테레오 큐들 (162) 은 파라미터들, 예컨대 인터채널 세기 차이 (IID) 파라미터들 (예를 들어, 예시적인 비제한적 예들로서 인터채널 레벨 차이들 (ILD), 인터채널 시간 차이 (ITD), 파라미터들, 인터채널 위상 차이 (IPD) 파라미터들, 인터채널 상관 (ICC) 파라미터들, 비-캐주얼 시프트 파라미터들, 스펙트럼 틸트 파라미터들, 인터-채널 유성 파라미터들, 인터-채널 피치 파라미터들, 인터-채널 이득 파라미터들 등) 을 포함할 수도 있다. 스테레오 큐들 (162) 은 또한, 인코딩된 신호의 부분으로서 송신될 수도 있다.
인코더 (114) 는 또한, 주파수-도메인 신호들에 적어도 부분적으로 기초하여 사이드-대역 비트스트림 (164) 및 중간-대역 비트스트림 (166) 을 생성할 수도 있다. 송신기 (110) 는 스테레오 큐들 (162), 사이드-대역 비트스트림 (164), 중간-대역 비트스트림 (166), 또는 이들의 조합을 네트워크 (120) 를 통해 제 2 디바이스 (106) 로 송신할 수도 있다. 대안으로, 또는 추가하여, 송신기 (110) 는 스테레오 큐들 (162), 사이드-대역 비트스트림 (164), 중간-대역 비트스트림 (166), 또는 이들의 조합을 네트워크 디바이스 (예를 들어, 기지국) 에서 저장할 수도 있다.
디코더 (118) 는 스테레오 큐들 (162), 사이드-대역 비트스트림 (164), 및 중간-대역 비트스트림 (166) 에 기초하여 디코딩 동작들을 수행할 수도 있다. 디코더 (118) 는 (예를 들어, 제 1 오디오 신호 (130) 에 대응하는) 제 1 출력 신호 (126), (예를 들어, 제 2 오디오 신호 (132) 에 대응하는) 제 2 출력 신호 (128), 또는 양자 모두를 생성할 수도 있다. 제 2 디바이스 (106) 는 제 1 라우드스피커 (142) 를 통해 제 1 출력 신호 (126) 를 출력할 수도 있다. 제 2 디바이스 (106) 는 제 2 라우드스피커 (144) 를 통해 제 2 출력 신호 (128) 를 출력할 수도 있다. 대안의 예들에서, 제 1 출력 신호 (126) 및 제 2 출력 신호 (128) 는 스테레오 신호 쌍으로서 단일의 출력 라우드스피커로 송신될 수도 있다.
제 1 디바이스 (104) 및 제 2 디바이스 (106) 는 별개의 디바이스들로서 설명되었지만, 다른 구현들에서 제 1 디바이스 (104) 는 제 2 디바이스 (106) 를 참조하여 설명된 하나 이상의 컴포넌트들을 포함할 수도 있다. 부가적으로 또는 대안으로, 제 2 디바이스 (106) 는 제 1 디바이스 (104) 를 참조하여 설명된 하나 이상의 컴포넌트들을 포함할 수도 있다. 예를 들어, 단일의 디바이스는 인코더 (114), 디코더 (118), 송신기 (110), 수신기 (178), 하나 이상의 입력 인터페이스들 (112), 하나 이상의 출력 인터페이스들 (177), 및 메모리를 포함할 수도 있다.
시스템 (100) 은, 오디오 프레임들이 (예를 들어, 프레임들의 코딩 모드들과 연관된 샘플링 레이트들에 기초하여) 인코딩되는 샘플링 레이트들에 기초하는 중간 샘플링 레이트들에서 상이한 오디오 프레임들을 디코딩할 수도 있다. 예를 들어, 특정 오디오 프레임이 32 kHz 샘플링 레이트에서 인코딩되면, 디코더 (118) 는 32 kHz 샘플링 레이트에서 특정 오디오 프레임의 코어를 디코딩할 수도 있고 32 kHz 샘플링 레이트에서 특정 오디오 프레임의 고-대역을 디코딩할 수도 있다. 코어 및 고-대역이 디코딩된 후에, 결과의 신호들은 결합되어 디코더 (118) 의 출력 샘플링 레이트로 리샘플링될 수도 있다. 디코더의 출력 샘플링 레이트와 대조적으로 중간 샘플링 레이트들 (예를 들어, 32 kHz) 에서 특정 오디오 프레임을 디코딩하는 것은 도 2 내지 도 8 에 대하여 추가로 설명된 바와 같이, 샘플링 및 리샘플링 동작들의 양을 감소시킬 수도 있다.
도 2 를 참조하면, 오디오 신호를 프로세싱하기 위한 시스템 (200) 이 도시된다. 시스템 (200) 은 디코딩 시스템 (예를 들어, 오디오 디코더) 일 수도 있다. 예를 들어, 시스템 (200) 은 도 1 의 디코더 (118) 에 대응할 수도 있다.
시스템 (200) 은 디멀티플렉서 (DEMUX) (202), 중간 샘플링 레이트 결정 회로부 (204), 저-대역 디코더 (206), 고-대역 디코더 (208), 가산기 (210), 포스트-프로세싱 회로부 (212), 및 샘플러 (214) 를 포함한다. 중간 샘플링 레이트 결정 회로부 (204) 는 도 1 의 중간 샘플링 레이트 결정 회로부 (172) 에 대응할 수도 있다. 다른 구현들에 따르면, 시스템 (200) 은 추가의 (또는 더 적은) 회로 컴포넌트들을 포함할 수도 있다. 비-제한적 예로서, 다른 구현에 따르면, 시스템 (200) 은 사이드 채널 디코더 (미도시) 을 포함할 수도 있다. 설명된 기법들 모두는 또한, 유용하고 적용 가능한 사이드 채널 디코딩 프로세스에 적용될 수도 있다.
디멀티플렉서 (202) 는 인코더 (미도시) 로부터 송신되는 입력 오디오 비트스트림 (220) 을 수신하도록 구성될 수도 있다. 일 구현에 따르면, 입력 오디오 비트스트림 (220) 은 도 1 의 중간-대역 비트스트림 (166) 에 대응할 수도 있다. 입력 오디오 비트스트림 (220) 은 복수의 프레임들을 포함할 수도 있다. 예를 들어, 입력 오디오 비트스트림 (220) 은 스피치 프레임들 및 넌-스피치 프레임들을 포함할 수도 있다. 도 2 에서, 입력 오디오 비트스트림 (220) 은 제 1 프레임 (222) 및 제 2 프레임 (224) 을 포함한다. 제 1 프레임 (222) 은 제 1 시간 (T1) 에서 디멀티플렉서 (202) 에 의해 수신될 수도 있고, 제 2 프레임 (224) 은 제 1 시간 (T1) 후인 제 2 시간 (T2) 에서 디멀티플렉서 (202) 에 의해 수신될 수도 있다.
일 구현에 따르면, 입력 오디오 비트스트림 (220) 에서 상이한 프레임들은 상이한 코딩 모드들을 사용하여 인코딩될 수도 있다. 비-제한적 예들로서, 입력 오디오 비트스트림 (220) 의 특정 프레임들은 광대역 (WB) 코딩 모드에 따라 인코딩될 수도 있고, 입력 오디오 비트스트림 (220) 의 다른 프레임들은 초-광대역 (SWB) 코딩 모드에 따라 인코딩될 수도 있으며, 입력 오디오 비트스트림 (220) 의 다른 프레임들은 풀-대역 (FB) 코딩 모드에 따라 인코딩될 수도 있다. 인코더 (미도시) 는, 프레임이 대략 0 헤르츠 (Hz) 내지 8 킬로헤르츠 (kHz) 의 콘텐트를 포함한다면 광대역 코딩 모드를 사용하여 프레임을 인코딩할 수도 있다. 광대역 코딩 모드에 따라 인코딩되는 프레임의 저-대역 부분은 대략 0 Hz 내지 4 kHz 에 걸쳐 있을 수도 있고, 광대역 코딩 모드에 따라 인코딩되는 프레임의 고-대역 부분은 대략 4 kHz 내지 8 kHz 에 걸쳐 있을 수도 있다. 인코더는, 프레임이 대략 0 Hz 내지 16 kHz 의 콘텐트를 포함하면 초-광대역 코딩 모드를 사용하여 프레임을 인코딩할 수도 있다. 초-광대역 코딩 모드에 따라 인코딩되는 프레임의 저-대역 부분은 대략 0 Hz 내지 8 kHz 에 걸쳐 있을 수도 있고, 초-광대역 코딩 모드에 따라 인코딩되는 프레임의 고-대역 부분은 대략 8 kHz 내지 16 kHz 에 걸쳐 있을 수도 있다. 인코더는, 프레임이 대략 0 Hz 내지 20 kHz 의 콘텐트를 포함하면 풀-대역 코딩 모드를 사용하여 프레임을 인코딩할 수도 있다. 풀-대역 코딩 모드에 따라 인코딩되는 프레임의 저-대역 부분은 대략 0 Hz 내지 8 kHz 에 걸쳐 있을 수도 있고, 풀-대역 코딩 모드에 따라 인코딩되는 프레임의 고-대역 부분은 대략 8 kHz 내지 16 kHz 에 걸쳐 있을 수도 있으며, 풀-대역 코딩 모드에 따라 인코딩되는 프레임의 풀-대역 부분은 대략 16 kHz 내지 20 kHz 에 걸쳐 있을 수도 있다.
전술된 주파수 범위들은 예시적 목적들을 위한 것이고 제한하는 것으로서 해석되지 않아야 한다는 것이 이해되어야 한다. 각각의 코딩 모드에 대한 고-대역 및 저-대역 부분들은 다른 구현들에서 변할 수도 있다. 또 다른 구현에서, 단일의 대역은 전체 대역폭 범위에 걸쳐 있을 수도 있다. 따라서, 본원에 설명된 기법들은, 신호들이 별개의 고-대역 및 저-대역 부분들을 포함하는 시나리오들에 제한되지 않을 수도 있다. 예시의 용이함을 위해, 제 1 프레임 (222) 은 광대역 코딩 모드에 따라 인코딩될 수도 있고, 제 2 프레임 (224) 은 초-광대역 코딩 모드에 따라 인코딩될 수도 있다. 예를 들어, 제 1 프레임 (222) 은 대략 0 Hz 내지 8 kHz 의 콘텐트를 포함할 수도 있고, 제 2 프레임 (224) 은 대략 0 Hz 내지 16 kHz 의 콘텐트를 포함할 수도 있다. 상세한 설명은 제 1 프레임 (222) 을 광대역 프레임으로서 그리고 제 2 프레임 (224) 을 초-광대역 프레임으로서 설명하지만, 이하에 설명된 기법들은 프레임 유형들의 임의의 조합에 적용될 수도 있다.
제 1 및 제 2 프레임들 (222, 224) 을 수신 시에, 시스템 (200) 은 "중간 샘플링 레이트" 를 사용하여 프레임들 (222, 224) 을 디코딩하고 출력 샘플링 레이트를 갖는 디코딩된 신호들을 생성하도록 동작 가능할 수도 있다. 예를 들어, 시스템 (200) 은 프레임들 (222, 224) 을 디코딩하여 디코더의 출력 샘플링 레이트를 갖는 신호들을 생성하도록 동작 가능할 수도 있다. 본원에 사용된 바와 같이, "중간 샘플링 레이트" 는 특정 프레임의 코딩 모드와 연관된 샘플링 레이트에 대응할 수도 있다. 일 구현에 따르면, 특정 프레임의 중간 샘플링 레이트는 특정 프레임의 나이퀴스트 샘플링 레이트에 대응할 수도 있다. 예를 들어, 특정 프레임의 중간 샘플링 레이트는 특정 프레임의 대역폭의 2 배와 대략 동일할 수도 있다. 이하에서 설명되는 바와 같이, 디코더의 출력 샘플링 레이트는 48 kHz 와 동일하다. 그러나, 출력 샘플링 레이트가 단지 예시적 목적들을 위한 것이고 기법들은 상이한 출력 샘플링 레이트들 또는 가변 출력 샘플링 레이트들을 갖는 디코더들에 적용될 수도 있다는 것이 이해되어야 한다.
다음의 상세한 설명은 저-대역 디코더 (206) 및 고-대역 디코더 (208) 를 사용하여 제 1 프레임 (222)(예를 들어, 광대역 프레임) 을 디코딩하는 것을 설명한다. 그러나, 소정 구현들에서, 제 1 프레임 (222) 은 저-대역 디코더 (206) 를 사용하여 (그리고 고-대역 디코더 (208) 를 바이패스하여) 디코딩될 수도 있다. 예를 들어, 광대역 프레임의 콘텐트가 대략 0 Hz 내지 8 kHz 의 범위이기 때문에, 저-대역 디코더 (206) 는 전체 제 1 프레임 (222) 을 인코딩할 대역폭 능력들을 가질 수도 있다. 다른 구현들에서, 이하에서 설명되는 바와 같이, 저-대역 디코더 (206) 및 고-대역 디코더 (208) 는 연관된 프레임의 코딩 모드에 기초하여 가변하는 주파수 범위들의 신호들을 디코딩하도록 동적으로 구성 가능할 수도 있다. 일반적으로, 디코더가 전체 대역폭 콘텐트를 디코딩할 능력들을 갖는 경우, HB 디코더는 그 특정 프레임에 관련되지 않을 수도 있고 LB 는 전체 신호 대역폭에 대응할 수도 있다.
제 1 프레임 (222) 을 디코딩하기 위해, 디멀티플렉서 (202) 는 제 1 프레임 (222) 과 연관된 제 1 코딩 정보 (230), 제 1 저-대역 신호 (232), 및 제 1 고-대역 신호 (234) 를 생성하도록 구성될 수도 있다. 제 1 코딩 정보 (230) 는 중간 샘플링 레이트 결정 회로부 (204) 에 제공될 수도 있고, 제 1 저-대역 신호 (232) 는 저-대역 디코더 (206) 에 제공될 수도 있으며, 제 1 고-대역 신호 (234) 는 고-대역 디코더 (208) 에 제공될 수도 있다.
중간 샘플링 레이트 결정 회로부 (204) 는 제 1 코딩 정보 (230) 에 기초하여 제 1 프레임 (222) 의 제 1 중간 샘플링 레이트 (236) 를 결정하도록 구성될 수도 있다. 예를 들어, 중간 샘플링 레이트 결정 회로부 (204) 는 제 1 코딩 정보 (230) 에 기초하여 제 1 프레임 (222) 의 제 1 비트레이트를 결정할 수도 있다. 제 1 비트레이트는 제 1 프레임 (222) 의 제 1 대역폭에 기초할 수도 있다. 따라서, 제 1 프레임 (222) 이 (예를 들어, 0 Hz 내지 8 kHz 에 걸쳐 있는 주파수 범위 내의 콘텐트를 갖는) 대략 8 kHz 의 사이의 제 1 대역폭을 갖는 광대역 프레임이면, 제 1 프레임 (222) 의 제 1 비트레이트는 16 kHz 의 최대 샘플 레이트 (예를 들어, 8 kHz 대역폭을 갖는 신호의 나이퀴스트 샘플링 레이트) 과 연관될 수도 있다. 중간 샘플링 레이트 결정 회로부 (204) 는 제 1 비트레이트 (예를 들어, 16 kHz 의 최대 샘플 레이트와 연관된 비트레이트) 를 출력 샘플링 레이트 (예를 들어, 48 kHz) 에 비교할 수도 있다. 제 1 중간 샘플링 레이트 (236) 는, 제 1 비트레이트와 연관된 최대 샘플 레이트가 출력 샘플링 레이트보다 작은 경우 제 1 프레임 (222) 의 제 1 대역폭에 기초할 수도 있다.
중간 샘플링 레이트 결정 회로부 (204) 는 또한, 제 1 중간 샘플링 레이트 (236) 를 결정하도록 대안이지만, 실질적으로 등가의 측정치들을 사용할 수도 있다. 예를 들어, 중간 샘플링 레이트 결정 회로부 (204) 는 제 1 코딩 정보 (230) 에 기초하여 제 1 프레임 (222) 의 제 1 대역폭을 결정할 수도 있다. 중간 샘플링 레이트 결정 회로부 (204) 는 출력 샘플링 레이트를 2 와 제 1 대역폭의 곱에 비교할 수도 있다. 중간 샘플링 레이트 결정 회로부 (204) 는 그 곱이 출력 샘플링 레이트보다 작은 경우 제 1 중간 샘플링 레이트 (236) 로서 곱을 선택할 수도 있고, 중간 샘플링 레이트 결정 회로부 (204) 는 출력 샘플링 레이트가 곱보다 작은 경우 제 1 중간 샘플링 레이트 (236) 로서 출력 샘플링 레이트를 선택할 수도 있다.
설명의 간략함을 위해, 제 1 중간 샘플링 레이트 (236) 는 16 kHz (예를 들어, 8 kHz 대역폭을 갖는 광대역 프레임에 대한 나이퀴스트 샘플링 레이트) 이다. 그러나, 16 kHz 는 단지 예시적인 예라는 것이 이해되어야 하고 제한하는 것으로서 해석되지 않아야 한다. 다른 구현들에서, 제 1 중간 샘플링 레이트 (236) 는 변할 수도 있다. 제 1 중간 샘플링 레이트 (236) 는 저-대역 디코더 (206) 에 그리고 고-대역 디코더 (208) 에 제공될 수도 있다.
저-대역 디코더 (206) 는 제 1 저-대역 신호 (232) 를 디코딩하여 제 1 중간 샘플링 레이트 (236) 를 갖는 제 1 디코딩된 저-대역 신호 (238) 를 생성하도록 구성될 수도 있고, 고-대역 디코더 (208) 는 제 1 고-대역 신호 (234) 를 디코딩하여 제 1 중간 샘플링 레이트 (236) 를 갖는 제 1 디코딩된 고-대역 신호 (240) 를 생성하도록 구성될 수도 있다. 저-대역 디코더 (206) 및 고-대역 디코더 (208) 의 동작들은 도 3 및 도 4 에 대하여 더 상세히 설명된다.
도 3 을 참조하면, 저-대역 디코더 (206) 및 고-대역 디코더 (208) 의 다이어그램이 도시된다. 저-대역 디코더 (206) 는 저-대역 신호 디코더 (302) 및 저-대역 신호 중간 샘플 레이트 컨버터 (304) 를 포함한다. 고-대역 디코더 (208) 는 고-대역 신호 디코더 (306) 및 고-대역 신호 중간 샘플 레이트 컨버터 (308) 를 포함한다.
제 1 저-대역 신호 (232) 는 저-대역 신호 디코더 (302) 에 제공될 수도 있다. 저-대역 신호 디코더 (302) 는 제 1 저-대역 신호 (232) 를 디코딩하여 디코딩된 저-대역 신호 (330) 를 생성할 수도 있다. 디코딩된 저-대역 신호 (330) 의 예시는 도 4 에 도시된다. 디코딩된 저-대역 신호 (330) 는 대략 0 Hz 내지 4 kHz (예를 들어, 광대역 신호의 저-대역 부분) 에 걸쳐 있는 콘텐트를 포함한다. 디코딩된 저-대역 신호 (330) 및 제 1 중간 샘플링 레이트 (236) 는 저-대역 신호 중간 샘플 레이트 컨버터 (304) 에 제공될 수도 있다. 저-대역 신호 중간 샘플 레이트 컨버터 (304) 는 제 1 중간 샘플링 레이트 (236)(예를 들어, 16 kHz) 에서 디코딩된 저-대역 신호 (330) 를 샘플링하여 제 1 중간 샘플링 레이트 (236) 를 갖는 제 1 디코딩된 저-대역 신호 (238) 를 생성하도록 구성될 수도 있다. 제 1 디코딩된 저-대역 신호 (238) 의 예시는 도 4 에 도시된다. 제 1 디코딩된 저-대역 신호 (238) 는 대략 0 Hz 내지 4 kHz 에 걸쳐 있는 콘텐트를 포함하고, 16 kHz 중간 샘플링 레이트 (예를 들어, 8 kHz 대역폭 신호에 대한 나이퀴스트 샘플링 레이트) 를 갖는다.
제 1 고-대역 신호 (234) 는 고-대역 신호 디코더 (306) 에 제공될 수도 있다. 고-대역 신호 디코더 (306) 는 제 1 고-대역 신호 (234) 를 디코딩하여 디코딩된 고-대역 신호 (332) 를 생성할 수도 있다. 디코딩된 고-대역 신호 (332) 의 예시는 도 4 에 도시된다. 디코딩된 고-대역 신호 (332) 는 대략 4 Hz 내지 8 kHz (예를 들어, 광대역 신호의 고-대역 부분) 에 걸쳐 있는 콘텐트를 포함한다. 디코딩된 고-대역 신호 (332) 및 제 1 중간 샘플링 레이트 (236) 는 고-대역 신호 중간 샘플 레이트 컨버터 (308) 에 제공될 수도 있다. 고-대역 신호 중간 샘플 레이트 컨버터 (308) 는 제 1 중간 샘플링 레이트 (236)(예를 들어, 16 kHz) 에서 디코딩된 고-대역 신호 (332) 를 샘플링하여 제 1 중간 샘플링 레이트 (236) 를 갖는 제 1 디코딩된 고-대역 신호 (240) 를 생성하도록 구성될 수도 있다. 제 1 디코딩된 고-대역 신호 (240) 의 예시는 도 4 에 도시된다. 제 1 디코딩된 고-대역 신호 (240) 는 대략 4 Hz 내지 8 kHz 에 걸쳐 있는 콘텐트를 포함하고, 16 kHz 중간 샘플링 레이트 (예를 들어, 8 kHz 대역폭 신호에 대한 나이퀴스트 샘플링 레이트) 를 갖는다.
일 구현에 따르면, 멀티-대역 접근법을 사용하는 경우, 중간 샘플 레이트는 저-대역 및 고-대역을 디코딩하는데 사용되지 않을 수도 있다. 대신에, 이산 푸리에 변환 (DFT) 분석이 사용될 수 있다. DFT 분석이 사용되는 경우, 저-대역 및 고-대역은 중간 샘플 레이트에서 유지할 수도 있다. 대안의 구현, 저-대역은 동작 코어의 동작 샘플 레이트 (예를 들어, 16 kHz 또는 12.8 kHz) 에서 샘플링될 수도 있고, 고-대역은 중간 샘플 레이트에서 샘플링될 수도 있으며, DFT 분석은 샘플링된 신호들 상에서 수행될 수도 있다. 다른 구현에서, 신호 대역 디코딩이 수행되는 경우 (예를 들어, TCX/MDCT 프레임), TCX/MDCT 디코더는 중간 샘플 레이트에서 동작하도록 구성될 수도 있다. 상기 구현들 각각은 DFT 분석 프로세스의 복잡성을 감소시킬 수도 있다. 예를 들어, 더 낮은 샘플 레이트에서 신호들 상에서 DFT 분석을 수행하는 것은 출력 샘플 레이트에서 신호들, 포스트-프로세싱 신호들, 또는 양자 모두 상에서 DFT 분석을 수행하는 것보다 덜 복잡할 수도 있다.
도 2 를 다시 참조하면, 저-대역 디코더 (206) 는 제 1 디코딩된 저-대역 신호 (238) 를 가산기 (210) 에 제공할 수도 있고, 고-대역 디코더 (208) 는 제 1 디코딩된 고-대역 신호 (240) 를 가산기 (210) 에 제공할 수도 있다. 가산기 (210) 는 제 1 디코딩된 저-대역 신호 (238) 및 제 1 디코딩된 고-대역 신호 (240) 를 결합하여 제 1 중간 샘플링 레이트 (236) 를 갖는 제 1 결합 신호 (242) 를 생성하도록 구성될 수도 있다. 제 1 결합 신호 (242) 의 예시는 도 4 에 도시된다. 제 1 결합 신호 (242) 는 대략 0 Hz 내지 8 kHz 에 걸쳐 있는 콘텐트를 포함하고 (예를 들어, 제 1 결합 신호 (242) 는 광대역 신호임), 제 1 결합 신호 (242) 는 16 kHz 중간 샘플링 레이트 (예를 들어, 나이퀴스트 샘플링 레이트) 를 갖는다. 제 1 결합 신호 (242) 는 포스트-프로세싱 회로부 (212) 에 제공될 수도 있다.
포스트-프로세싱 회로부 (212) 는 제 1 결합 신호 (242) 상에서 하나 이상의 프로세싱 동작들을 수행하여 제 1 중간 샘플링 레이트 (236) 를 갖는 제 1 디코딩된 출력 신호 (244) 를 생성하도록 구성될 수도 있다. 비-제한적 예로서, 포스트-프로세싱 회로부 (212) 는 도 1 의 스테레오 큐들 (162) 과 같은 스테레오 큐들을 제 1 결합 신호 (242) 에 적용하여 제 1 디코딩된 출력 신호 (244) 를 생성할 수도 있다. 대안의 구현들에서, 포스트-프로세싱 회로부는 또한, 스테레오 큐들 적용 프로세스의 부분으로서 스테레오 업믹스를 수행할 수도 있다. 제 1 디코딩된 출력 신호 (244) 는 샘플러 (214) 에 제공될 수도 있다. 샘플러 (214) 는 제 1 디코딩된 출력 신호 (244) 에 기초하여 출력 샘플링 레이트 (예를 들어, 48 kHz) 를 갖는 제 1 리샘플링된 신호 (246) 를 생성하도록 구성될 수도 있다. 예를 들어, 샘플러 (214) 는 출력 샘플링 레이트에서 제 1 디코딩된 출력 신호 (244) 를 샘플링하여 제 1 리샘플링된 신호 (246) 를 생성하도록 구성될 수도 있다. 따라서, 시스템 (200) 은 제 1 중간 샘플링 레이트 (236)(예를 들어, 인코더가 제 1 프레임 (222) 을 인코딩하는 샘플링 레이트) 에서 제 1 프레임 (222) 을 프로세싱하고, 제 1 프레임 (222) 이 프로세싱된 후에 (샘플러 (214) 를 사용하여) 출력 샘플링 레이트에서 단일의 리샘플링 동작을 수행할 수도 있다.
제 2 프레임 (224) 을 디코딩하기 위해, 디멀티플렉서 (202) 는 제 2 프레임 (224) 과 연관된 제 2 코딩 정보 (250), 제 2 저-대역 신호 (252), 및 제 2 고-대역 신호 (254) 를 생성하도록 구성될 수도 있다. 제 2 코딩 정보 (250) 는 중간 샘플링 레이트 결정 회로부 (204) 에 제공될 수도 있고, 제 2 저-대역 신호 (252) 는 저-대역 디코더 (206) 에 제공될 수도 있으며, 제 2 고-대역 신호 (254) 는 고-대역 디코더 (208) 에 제공될 수도 있다.
중간 샘플링 레이트 결정 회로부 (204) 는 제 2 코딩 정보 (250) 에 기초하여 제 2 프레임 (224) 의 제 2 중간 샘플링 레이트 (256) 를 결정하도록 구성될 수도 있다. 예를 들어, 중간 샘플링 레이트 결정 회로부 (204) 는 제 2 코딩 정보 (250) 에 기초하여 제 2 프레임 (224) 의 제 2 비트레이트를 결정할 수도 있다. 제 2 비트레이트는 제 2 프레임 (224) 의 제 2 대역폭에 기초할 수도 있다. 따라서, 제 2 프레임 (224) 이 (예를 들어, 0 Hz 내지 16 kHz 에 걸쳐 있는 주파수 범위 내의 콘텐트를 갖는) 대략 16 kHz 의 사이의 제 2 대역폭을 갖는 초-광대역 프레임이면, 제 2 프레임 (224) 의 제 2 비트레이트는 32 kHz 의 최대 샘플 레이트 (예를 들어, 16 kHz 대역폭을 갖는 신호의 나이퀴스트 샘플링 레이트) 와 연관될 수도 있다. 중간 샘플링 레이트 결정 회로부 (204) 는 제 2 비트레이트 (예를 들어, 32 kHz 의 최대 샘플 레이트와 연관된 비트레이트) 를 출력 샘플링 레이트 (예를 들어, 48 kHz) 에 비교할 수도 있다. 제 2 중간 샘플링 레이트 (256) 는, 제 2 비트레이트와 연관된 최대 샘플 레이트가 출력 샘플링 레이트보다 작은 경우 제 2 프레임 (224) 의 제 2 대역폭에 기초할 수도 있다.
중간 샘플링 레이트 결정 회로부 (204) 는 또한, 제 2 중간 샘플링 레이트 (256) 를 결정하도록 대안이지만, 실질적으로 등가의 측정치들을 사용할 수도 있다. 예를 들어, 중간 샘플링 레이트 결정 회로부 (204) 는 제 2 코딩 정보 (250) 에 기초하여 제 2 프레임 (224) 의 제 2 대역폭을 결정할 수도 있다. 중간 샘플링 레이트 결정 회로부 (204) 는 출력 샘플링 레이트를 2 와 제 2 대역폭의 곱에 비교할 수도 있다. 중간 샘플링 레이트 결정 회로부 (204) 는 그 곱이 출력 샘플링 레이트보다 작은 경우 제 2 중간 샘플링 레이트 (256) 로서 곱을 선택할 수도 있고, 중간 샘플링 레이트 결정 회로부 (204) 는 출력 샘플링 레이트가 곱보다 작은 경우 제 2 중간 샘플링 레이트 (256) 로서 출력 샘플링 레이트를 선택할 수도 있다.
설명의 간략함을 위해, 제 2 중간 샘플링 레이트 (256) 는 32 kHz (예를 들어, 16 kHz 대역폭을 갖는 초-광대역 프레임에 대한 나이퀴스트 샘플링 레이트) 이다. 그러나, 32 kHz 는 단지 예시적인 예라는 것이 이해되어야 하고 제한하는 것으로서 해석되지 않아야 한다. 다른 구현들에서, 제 2 중간 샘플링 레이트 (256) 는 변할 수도 있다. 제 2 중간 샘플링 레이트 (256) 는 저-대역 디코더 (206) 에 그리고 고-대역 디코더 (208) 에 제공될 수도 있다.
저-대역 디코더 (206) 는 제 2 저-대역 신호 (252) 를 디코딩하여 제 2 중간 샘플링 레이트 (256) 를 갖는 제 2 디코딩된 저-대역 신호 (258) 를 생성하도록 구성될 수도 있고, 고-대역 디코더 (208) 는 제 2 고-대역 신호 (254) 를 디코딩하여 제 2 중간 샘플링 레이트 (256) 를 갖는 제 2 디코딩된 고-대역 신호 (260) 를 생성하도록 구성될 수도 있다. 도 3 을 참조하면, 제 2 저-대역 신호 (252) 는 저-대역 신호 디코더 (302) 에 제공될 수도 있다. 저-대역 신호 디코더 (302) 는 제 2 저-대역 신호 (252) 를 디코딩하여 디코딩된 저-대역 신호 (350) 를 생성할 수도 있다. 디코딩된 저-대역 신호 (350) 의 예시는 도 5 에 도시된다. 디코딩된 저-대역 신호 (350) 는 대략 0 Hz 내지 8 kHz (예를 들어, 초-광대역 신호의 저-대역 부분) 에 걸쳐 있는 콘텐트를 포함한다. 디코딩된 저-대역 신호 (350) 및 제 2 중간 샘플링 레이트 (256) 는 저-대역 신호 중간 샘플 레이트 컨버터 (304) 에 제공될 수도 있다. 저-대역 신호 중간 샘플 레이트 컨버터 (304) 는 제 2 중간 샘플링 레이트 (256)(예를 들어, 32 kHz) 에서 디코딩된 저-대역 신호 (350) 를 샘플링하여 제 2 중간 샘플링 레이트 (256) 를 갖는 제 2 디코딩된 저-대역 신호 (258) 를 생성하도록 구성될 수도 있다. 제 2 디코딩된 저-대역 신호 (258) 의 예시는 도 5 에 도시된다. 제 2 디코딩된 저-대역 신호 (258) 는 대략 0 Hz 내지 8 kHz 에 걸쳐 있는 콘텐트를 포함하고, 32 kHz 중간 샘플링 레이트 (예를 들어, 16 kHz 대역폭 신호에 대한 나이퀴스트 샘플링 레이트) 를 갖는다.
제 2 고-대역 신호 (254) 는 고-대역 신호 디코더 (306) 에 제공될 수도 있다. 고-대역 신호 디코더 (306) 는 제 2 고-대역 신호 (254) 를 디코딩하여 디코딩된 고-대역 신호 (352) 를 생성할 수도 있다. 디코딩된 고-대역 신호 (352) 의 예시는 도 5 에 도시된다. 디코딩된 고-대역 신호 (352) 는 대략 8 Hz 내지 16 kHz (예를 들어, 초-광대역 신호의 고-대역 부분) 에 걸쳐 있는 콘텐트를 포함한다. 디코딩된 고-대역 신호 (352) 및 제 2 중간 샘플링 레이트 (256) 는 고-대역 신호 중간 샘플 레이트 컨버터 (308) 에 제공될 수도 있다. 고-대역 신호 중간 샘플 레이트 컨버터 (308) 는 제 2 중간 샘플링 레이트 (256)(예를 들어, 32 kHz) 에서 디코딩된 고-대역 신호 (352) 를 샘플링하여 제 2 중간 샘플링 레이트 (256) 를 갖는 제 2 디코딩된 고-대역 신호 (260) 를 생성하도록 구성될 수도 있다. 제 2 디코딩된 고-대역 신호 (260) 의 예시는 도 5 에 도시된다. 제 2 디코딩된 고-대역 신호 (260) 는 대략 8 Hz 내지 16 kHz 에 걸쳐 있는 콘텐트를 포함하고, 32 kHz 중간 샘플링 레이트 (예를 들어, 16 kHz 대역폭 신호에 대한 나이퀴스트 샘플링 레이트) 를 갖는다.
도 1 을 다시 참조하면, 저-대역 디코더 (206) 는 제 2 디코딩된 저-대역 신호 (258) 를 가산기 (210) 에 제공할 수도 있고, 고-대역 디코더 (208) 는 제 2 디코딩된 고-대역 신호 (260) 를 가산기 (210) 에 제공할 수도 있다. 가산기 (210) 는 제 2 디코딩된 저-대역 신호 (258) 및 제 2 디코딩된 고-대역 신호 (260) 를 결합하여 제 2 중간 샘플링 레이트 (256) 를 갖는 제 2 결합 신호 (262) 를 생성하도록 구성될 수도 있다. 제 2 결합 신호 (262) 의 예시는 도 5 에 도시된다. 제 2 결합 신호 (262) 는 대략 0 Hz 내지 16 kHz 에 걸쳐 있는 콘텐트를 포함하고 (예를 들어, 제 2 결합 신호 (262) 는 초-광대역 신호임), 제 2 결합 신호 (262) 는 32 kHz 중간 샘플링 레이트 (예를 들어, 나이퀴스트 샘플링 레이트) 를 갖는다. 제 2 결합 신호 (262) 는 포스트-프로세싱 회로부 (212) 에 제공될 수도 있다.
포스트-프로세싱 회로부 (212) 는 제 2 결합 신호 (262) 상에서 하나 이상의 프로세싱 동작들을 수행하여 제 2 중간 샘플링 레이트 (256) 를 갖는 제 2 디코딩된 출력 신호 (264) 를 생성하도록 구성될 수도 있다. 제 2 디코딩된 출력 신호 (264) 는 샘플러 (214) 에 제공될 수도 있다. 샘플러 (214) 는 제 2 디코딩된 출력 신호 (264) 에 기초하여 출력 샘플링 레이트 (예를 들어, 48 kHz) 를 갖는 제 2 리샘플링된 신호 (266) 를 생성하도록 구성될 수도 있다. 예를 들어, 샘플러 (214) 는 출력 샘플링 레이트에서 제 2 디코딩된 출력 신호 (264) 를 샘플링하여 제 2 리샘플링된 신호 (266) 를 생성하도록 구성될 수도 있다. 따라서, 시스템 (200) 은 제 2 중간 샘플링 레이트 (256)(예를 들어, 인코더가 제 2 프레임 (224) 을 인코딩하는 샘플링 레이트) 에서 제 2 프레임 (224) 을 프로세싱하고, 제 2 프레임 (224) 이 프로세싱된 후에 (샘플러 (214) 를 사용하여) 출력 샘플링 레이트에서 단일의 리샘플링 동작을 수행할 수도 있다.
전술된 바와 같이, 중간 샘플링 레이트 결정 회로부 (204) 는, 제 1 프레임 (222) 이 제 1 중간 샘플링 레이트 (236) 를 갖고 제 2 프레임 (224) 이 제 2 중간 샘플링 레이트 (256) 를 갖는다고 결정할 수도 있다. 따라서, 중간 샘플링 레이트는 프레임에서 프레임으로 스위칭할 수도 있다. 중간 샘플링 레이트가 스위칭하는 경우, 메모리들 (예를 들어, 이산 푸리에 변환 (DFT) 합성 동작들의 중첩-가산 (OLA) 메모리) 은 프레임에서 프레임으로 평활한 연속적인 트랜지션들을 제공하도록 조정 (예를 들어, 계산, 재-계산, 리샘플링, 근사화, 등) 될 수도 있다.
OLA 메모리를 조정하기 위한 하나의 기법은 OLA 메모리를 현재 프레임의 중간 샘플링 레이트로 보간 (또는 데시메이트) 하는 것일 수도 있다. OLA 메모리의 보간/데시메이션은 중간 샘플링 레이트에서의 (예를 들어, 선행하는 또는 뒤따르는) 변화들에 대응하는 프레임들에 대해 수행될 수도 있고, 또는 모든 유효한 중간 샘플링 레이트들에 대한 각각의 프레임에서 수행될 수도 있다 (그리고 결과는 다음의 프레임을 위해 저장될 수도 있다). 다음 프레임의 중간 샘플링 레이트에 대응하는 현재 프레임의 저장된 보간된 메모리들이 사용될 수도 있다.
OLA 를 조정하기 위한 다른 기법은 다중 중간 샘플링 레이트들에서 DFT 합성을 수행하는 것일 수도 있다. DFT 합성은 후속의 프레임에서 스위치를 예상하여 중간 샘플링 레이트의 스위치에 앞서 현재 프레임에서 수행될 수도 있다. OLA 메모리는 중간 샘플링 레이트들의 스위치의 이벤트에서 후속의 프레임에서 사용하기 위해 다수의 샘플링 레이트들에서 "백 업"될 수도 있다. 대안으로, DFT 합성은 후속의 프레임 (예를 들어, "스위칭 프레임") 에 수행될 수도 있다. DFT 빈 정보는 DFT 합성에 앞설 수도 있다. 스위치가 발생하면, 추가의 DFT 합성이 중간 샘플링 레이트에서 수행될 수도 있다.
프레임들에 걸쳐 중간 샘플링 레이트들의 스위칭을 관리하는 다른 대안의 기법은 각각의 프레임에 대한 출력 샘플 레이트로 윈도잉된 역 변환된 신호들의 출력들을 리샘플링하는 것 및 리샘플링 후에 OLA 를 수행하는 것을 포함한다. 이 구현에서, 디코더 동작의 ICBWE 분기는 동작적이지 않을 수도 있다.
샘플러 (214) 의 출력에서 신호는 연속성을 달성하도록 조정될 수도 있다. 예를 들어, 샘플러 (214) 의 구성 및 상태는 중간 샘플링 레이트가 스위칭하는 경우 조정될 수도 있다. 그렇지 않으면, 좌측 및 우측 리샘플링된 채널들에서의 프레임 경계들에서 불연속성들이 보여질 수도 있다. 이 가능한 불연속성의 이슈들을 어드레싱하기 위해, 샘플러 (214) 는 좌측 및 우측 채널들의 부분 상에서 중복적으로 실행되어 샘플들을 제 1 프레임의 중간 샘플링 레이트로부터 출력 샘플링 레이트로 리샘플링하고 제 2 프레임의 중간 샘플링 레이트를 출력 샘플링 레이트로 리샘플링할 수도 있다. 좌측 및 우측 채널들의 일부는 제 1 프레임의 부분, 제 2 프레임의 부분, 또는 양자 모두를 포함할 수도 있다. 신호의 동일한 부분 상에서 2 번 생성되는 신호들의 중복 부분들은 윈도잉 및 중첩 가산되어 프레임 경계의 부근의 리샘플링된 채널들에서 평활한 트랜지션을 생성할 수도 있다.
도 2 내지 도 5 에 대하여 설명된 기법들은 시스템 (200) 이, 프레임들이 (예를 들어, 프레임들의 코딩 모드들과 연관된 샘플링 레이트들에 기초하여) 인코딩되는 샘플링 레이트들 (또는 대역폭) 에 기초하는 중간 샘플링 레이트들에서 상이한 프레임들을 디코딩하게 할 수도 있다. (디코더의 출력 샘플링 레이트와 대조적으로) 중간 샘플링 레이트들에서 프레임들을 디코딩하는 것은 샘플링 및 리샘플링 동작들의 양을 감소시킬 수도 있다. 이것은 또한, 디코딩된 신호들을 원하는 샘플링 레이트 (이 경우에서, 더 높은 출력 샘플링 레이트와 대조적으로 중간 샘플링 레이트) 로 리샘플링하는 것을 수반하는 저-대역 및 고-대역 디코딩 단계들의 복잡성 뿐만 아니라 포스트 프로세싱 회로부의 동작의 복잡성을 감소시킨다. 예를 들어, 저-대역 및 고-대역은 중간 샘플링 레이트들에서 프로세싱 및 결합될 수도 있다. 저-대역 및 고-대역이 결합된 후에, 단일의 샘플링 동작이 출력 샘플링 레이트에서 신호를 생성하도록 수행될 수도 있다. 이들 기법들은, 저-대역이 출력 샘플링 레이트 (예를 들어, 제 1 샘플링 동작) 에서 리샘플링되고, 고-대역이 출력 샘플링 레이트 (예를 들어, 제 2 샘플링 동작) 에서 리샘플링되며, 리샘플링된 신호들이 결합되는 종래의 기법들과 비교하여 샘플링 동작들의 수를 감소시킬 수도 있다. 리샘플링 동작들의 수를 감소시키는 것은 비용 및 연산 복잡성을 감소시킬 수도 있다.
도 6 을 참조하면, 오디오 신호를 프로세싱하기 위한 시스템 (600) 이 도시된다. 시스템 (600) 은 디코딩 시스템 (예를 들어, 오디오 디코더) 일 수도 있다. 예를 들어, 시스템 (600) 은 도 1 의 디코더 (118) 에 대응할 수도 있다. 시스템 (600) 은 디멀티플렉서 (202), 중간 샘플링 레이트 결정 회로부 (204), 저-대역 디코더 (206), 고-대역 디코더 (208), 풀-대역 디코더 (608), 가산기 (210), 포스트-프로세싱 회로부 (212), 및 샘플러 (214) 를 포함한다.
디멀티플렉서 (202) 는 입력 오디오 비트스트림 (220) 을 수신하도록 구성될 수도 있다. 입력 오디오 비트스트림 (220) 은 도 2 의 제 2 프레임 (224) 후에 수신되는 제 3 프레임 (622) 을 포함할 수도 있다. 도 6 에 따르면, 제 3 프레임 (622) 은 풀-대역 코딩 모드에 따라 인코딩될 수도 있다. 예를 들어, 제 3 프레임 (622) 은 대략 0 Hz 내지 20 kHz 의 콘텐트를 포함할 수도 있다. 시스템 (600) 은 중간 샘플링 레이트를 사용하여 제 3 프레임 (622) 을 디코딩하도록 동작 가능할 수도 있다.
제 3 프레임 (622) 을 디코딩하기 위해, 디멀티플렉서 (202) 는 제 3 프레임 (622) 과 연관된 제 3 코딩 정보 (630), 제 3 저-대역 신호 (632), 제 3 고-대역 신호 (634), 및 풀-대역 신호 (635) 를 생성하도록 구성될 수도 있다. 제 3 코딩 정보 (630) 는 중간 샘플링 레이트 결정 회로부 (204) 에 제공될 수도 있고, 제 3 저-대역 신호 (632) 는 저-대역 디코더 (206) 에 제공될 수도 있고, 제 3 고-대역 신호 (634) 는 고-대역 디코더 (208) 에 제공될 수도 있으며, 풀-대역 신호 (635) 는 풀-대역 디코더 (608) 에 제공될 수도 있다.
중간 샘플링 레이트 결정 회로부 (204) 는 제 3 코딩 정보 (630) 에 기초하여 제 3 프레임 (622) 의 제 3 중간 샘플링 레이트 (636) 를 결정하도록 구성될 수도 있다. 예를 들어, 중간 샘플링 레이트 결정 회로부 (204) 는 제 3 코딩 정보 (630) 에 기초하여 제 3 프레임 (622) 의 제 3 비트레이트를 결정할 수도 있다. 제 3 비트레이트는 제 3 프레임 (622) 의 제 3 대역폭에 기초할 수도 있다. 따라서, 제 3 프레임 (622) 이 (예를 들어, 0 Hz 내지 20 kHz 에 걸쳐 있는 주파수 범위 내의 콘텐트를 갖는) 대략 20 kHz 의 사이의 제 3 대역폭을 갖는 풀-대역 프레임이면, 제 3 프레임 (622) 의 제 3 비트레이트는 40 kHz 의 최대 샘플 레이트 (예를 들어, 20 kHz 대역폭을 갖는 신호의 나이퀴스트 샘플링 레이트) 과 연관될 수도 있다. 일부 대안의 구현에서, 제 3 샘플링 레이트는, 구현이 40 kHz 샘플링 레이트에서 동작을 지원하지 않는 경우 48 kHz 로서 선택될 수도 있다. 중간 샘플링 레이트 결정 회로부 (204) 는 제 3 비트레이트 (예를 들어, 40 kHz 의 최대 샘플 레이트와 연관된 비트레이트) 를 출력 샘플링 레이트 (예를 들어, 48 kHz) 에 비교할 수도 있다. 제 3 중간 샘플링 레이트 (636) 는, 제 3 비트레이트가 출력 샘플링 레이트보다 작은 경우 제 3 프레임 (622) 의 제 3 대역폭에 기초할 수도 있다.
설명의 간략함을 위해, 제 3 중간 샘플링 레이트 (636) 는 40 kHz (예를 들어, 20 kHz 대역폭을 갖는 풀-대역 프레임에 대한 나이퀴스트 샘플링 레이트) 이다. 그러나, 40 kHz 는 단지 예시적인 예라는 것이 이해되어야 하고 제한하는 것으로서 해석되지 않아야 한다. 다른 구현들에서, 제 3 중간 샘플링 레이트 (636) 는 변할 수도 있다. 제 3 중간 샘플링 레이트 (636) 는 저-대역 디코더 (206) 에, 고-대역 디코더 (208) 에, 그리고 풀-대역 디코더 (608) 에 제공될 수도 있다.
저-대역 디코더 (206) 는 제 3 저-대역 신호 (632) 를 디코딩하여 제 3 중간 샘플링 레이트 (636) 를 갖는 제 3 디코딩된 저-대역 신호 (638) 를 생성하도록 구성될 수도 있고, 고-대역 디코더 (208) 는 제 3 고-대역 신호 (634) 를 디코딩하여 제 3 중간 샘플링 레이트 (636) 를 갖는 제 3 디코딩된 고-대역 신호 (640) 를 생성하도록 구성될 수도 있다. 저-대역 디코더 (206) 및 고-대역 디코더 (208) 는 도 2 및 도 3 에 대하여 설명된 바와 실질적으로 유사한 방식으로 동작할 수도 있다; 그러나, 디코딩된 신호들 (638, 640) 은 제 3 중간 샘플링 레이트 (636) 에 기초하여 (16 kHz 와는 대조적으로) 20 kHz 의 대역폭을 가질 수도 있다.
풀-대역 디코더 (608) 는 풀-대역 신호 (635) 를 디코딩하여 대략 16 kHz 과 20 kHz 사이의 콘텐트를 갖는 디코딩된 풀-대역 신호 (641) 를 생성하도록 구성될 수도 있다. 예를 들어, 도 7 을 참조하면, 풀-대역 디코더 (608) 의 특정 구현의 다이어그램이 도시된다. 풀-대역 디코더 (608) 는 풀-대역 신호 디코더 (702) 및 풀-대역 신호 중간 샘플 레이트 컨버터 (704) 를 포함한다.
풀-대역 신호 (635) 는 풀-대역 신호 디코더 (702) 에 제공될 수도 있다. 풀-대역 신호 디코더 (702) 는 풀-대역 신호 (635) 를 디코딩하여 디코딩된 풀-대역 신호 (732) 를 생성할 수도 있다. 디코딩된 풀-대역 신호 (732) 의 예시는 도 7 에 도시된다. 디코딩된 풀-대역 신호 (732) 는 대략 16 kHz 내지 20 kHz (예를 들어, 풀-대역 신호의 풀-대역 부분) 에 걸쳐 있는 콘텐트를 포함한다. 디코딩된 풀-대역 신호 (732) 및 제 3 중간 샘플링 레이트 (636) 는 풀-대역 신호 중간 샘플 레이트 컨버터 (704) 에 제공될 수도 있다. 풀-대역 신호 중간 샘플 레이트 컨버터 (704) 는 제 3 중간 샘플링 레이트 (636)(예를 들어, 40 kHz) 에서 디코딩된 풀-대역 신호 (730) 를 샘플링하여 제 3 중간 샘플링 레이트 (636) 를 갖는 디코딩된 풀-대역 신호 (641) 를 생성하도록 구성될 수도 있다. 디코딩된 풀-대역 신호 (641) 의 예시는 도 7 에 도시된다. 디코딩된 풀-대역 신호 (641) 는 대략 16 Hz 내지 20 kHz 에 걸쳐 있는 콘텐트를 포함하고, 40 kHz 중간 샘플링 레이트 (예를 들어, 20 kHz 대역폭 신호에 대한 나이퀴스트 샘플링 레이트) 를 갖는다. 특정 구현에서, 디코딩된 풀-대역 신호 (732) 는 시간-도메인 풀-대역 신호들을 포함한다.
도 6 을 다시 참조하면, 저-대역 디코더 (206) 는 제 3 디코딩된 저-대역 신호 (638) 를 가산기 (210) 에 제공할 수도 있고, 고-대역 디코더 (208) 는 제 3 디코딩된 고-대역 신호 (640) 를 가산기 (210) 에 제공할 수도 있으며, 풀-대역 디코더 (608) 는 디코딩된 풀-대역 신호 (641) 를 가산기 (210) 에 제공할 수도 있다. 가산기 (210) 는 제 3 디코딩된 저-대역 신호 (638), 제 3 디코딩된 고-대역 신호 (640), 및 디코딩된 풀-대역 신호 (641) 를 결합하여, 제 3 중간 샘플링 레이트 (636) 를 갖는 제 3 결합 신호 (642) 를 생성하도록 구성될 수도 있다. 제 3 결합 신호 (642) 의 예시는 도 7 에 도시된다. 제 3 디코딩된 저-대역 신호 (638), 제 3 디코딩된 고-대역 신호 (640), 및 디코딩된 풀-대역 신호 (641) 의 조합은 상이한 순서로 수행될 수도 있다. 비-제한적 예로서, 제 3 디코딩된 저-대역 신호 (638) 는 제 3 디코딩된 고-대역 신호 (640) 와 결합될 수도 있고, 결과의 신호는 디코딩된 풀-대역 신호 (641) 와 결합될 수도 있다. 다른 비-제한적 예로서, 제 3 디코딩된 고-대역 신호 (640) 는 디코딩된 풀-대역 신호 (641) 와 결합될 수도 있고, 결과의 신호는 제 3 디코딩된 저-대역 신호 (638) 와 결합될 수도 있다. 제 3 결합 신호 (642) 는 대략 0 Hz 내지 20 kHz 에 걸쳐 있는 콘텐트를 포함하고 (예를 들어, 제 3 결합 신호 (242) 는 풀-대역 신호임), 제 3 결합 신호 (642) 는 40 kHz 중간 샘플링 레이트 (예를 들어, 나이퀴스트 샘플링 레이트) 를 갖는다. 제 3 결합 신호 (642) 는 포스트-프로세싱 회로부 (212) 에 제공될 수도 있다.
포스트-프로세싱 회로부 (212) 는 제 3 결합 신호 (642) 상에서 하나 이상의 프로세싱 동작들을 수행하여 제 3 중간 샘플링 레이트 (636) 를 갖는 제 3 디코딩된 출력 신호 (644) 를 생성하도록 구성될 수도 있다. 제 3 디코딩된 출력 신호 (644) 는 샘플러 (214) 에 제공될 수도 있다. 샘플러 (214) 는 제 3 디코딩된 출력 신호 (644) 에 기초하여 출력 샘플링 레이트 (예를 들어, 48 kHz) 를 갖는 제 3 리샘플링된 신호 (646) 를 생성하도록 구성될 수도 있다. 예를 들어, 샘플러 (614) 는 출력 샘플링 레이트에서 제 3 디코딩된 출력 신호 (644) 를 샘플링하여 제 3 리샘플링된 신호 (246) 를 생성하도록 구성될 수도 있다.
따라서, 시스템 (600) 은 제 3 중간 샘플링 레이트 (636)(예를 들어, 인코더가 제 3 프레임 (622) 을 인코딩하는 샘플링 레이트) 에서 제 3 프레임 (622) 을 프로세싱하고, 제 3 프레임 (622) 이 프로세싱된 후에 (샘플러 (214) 를 사용하여) 출력 샘플링 레이트에서 단일의 리샘플링 동작을 수행할 수도 있다.
도 8a 를 참조하면, 신호를 프로세싱하는 방법 (800) 이 도시된다. 방법 (800) 은 도 1 의 디코더 (118), 도 2 의 시스템 (200), 도 3 의 저-대역 디코더 (206), 도 3 의 고-대역 디코더 (208), 도 6 의 시스템 (600), 도 7 의 풀-대역 디코더 (608), 또는 이들의 조합에 의해 수행될 수도 있다.
방법 (800) 은 802 에서, 디코더에서 입력 오디오 비트스트림의 제 1 프레임을 수신하는 단계를 포함한다. 제 1 프레임은 적어도, 제 1 주파수 범위와 연관된 저-대역 신호 및 제 2 주파수 범위와 연관된 고-대역 신호를 포함한다. 예를 들어, 도 2 를 참조하면, 디멀티플렉서 (202) 는 인코더로부터 송신된 입력 오디오 비트스트림 (220) 의 제 1 프레임 (222) 을 수신할 수도 있다. 제 1 프레임 (222) 은 제 1 주파수 범위 (예를 들어, 0 Hz 내지 4 kHz) 와 연관된 제 1 저-대역 신호 (232) 및 제 2 주파수 범위 (예를 들어, 4 kHz 내지 8 kHz) 와 연관된 제 1 고-대역 신호 (234) 를 포함한다.
방법 (800) 은 또한, 804 에서, 저-대역 신호를 디코딩하여 중간 샘플링 레이트를 갖는 디코딩된 저-대역 신호를 생성하는 단계를 포함한다. 중간 샘플링 레이트는 제 1 프레임과 연관된 코딩 정보에 기초할 수도 있다. 예를 들어, 도 2 를 참조하면, 저-대역 디코더 (206) 는 제 1 저-대역 신호 (232) 를 디코딩하여 제 1 중간 샘플링 레이트 (236)(예를 들어, 16 kHz) 를 갖는 제 1 디코딩된 저-대역 신호 (238) 를 생성할 수도 있다.
방법 (800) 은 또한, 806 에서, 고-대역 신호를 디코딩하여 중간 샘플링 레이트를 갖는 디코딩된 고-대역 신호를 생성하는 단계를 더 포함한다. 예를 들어, 도 2 를 참조하면, 고-대역 디코더 (208) 는 제 1 고-대역 신호 (234) 를 디코딩하여 제 1 중간 샘플링 레이트 (236) 를 갖는 제 1 디코딩된 고-대역 신호 (240) 를 생성할 수도 있다.
방법 (800) 은 또한, 808 에서, 적어도 디코딩된 저-대역 신호 및 디코딩된 고-대역 신호를 결합하여 중간 샘플링 레이트를 갖는 결합 신호를 생성하는 단계를 포함한다. 예를 들어, 도 2 를 참조하면, 가산기 (210) 는 제 1 디코딩된 저-대역 신호 (238) 및 제 1 디코딩된 고-대역 신호 (240) 를 결합하여 제 1 중간 샘플링 레이트 (236) 를 갖는 제 1 결합 신호 (242) 를 생성할 수도 있다.
방법 (800) 은, 810 에서, 결합 신호에 적어도 부분적으로 기초하여 리샘플링된 신호를 생성하는 단계를 더 포함한다. 리샘플링된 신호는 디코더의 출력 샘플링 레이트를 가질 수도 있다. 예를 들어, 도 2 를 참조하면, 포스트-프로세싱 회로부 (212) 는 제 1 결합 신호 (242) 상에서 하나 이상의 프로세싱 동작들을 수행하여 제 1 중간 샘플링 레이트 (236) 를 갖는 제 1 디코딩된 출력 신호 (244) 를 생성할 수도 있고, 샘플러 (214) 는 제 1 디코딩된 출력 신호 (244) 에 기초하여 출력 샘플링 레이트 (예를 들어, 48 kHz) 를 갖는 제 1 리샘플링된 신호 (246) 를 생성할 수도 있다. 예를 들어, 샘플러 (214) 는 출력 샘플링 레이트에서 제 1 디코딩된 출력 신호 (244) 를 샘플링하여 제 1 리샘플링된 신호 (246) 를 생성하도록 구성될 수도 있다.
방법 (800) 의 일 구현에 따르면, 제 1 프레임은 또한, 제 3 주파수 범위 (예를 들어, 16 kHz 내지 20 kHz) 와 연관된 풀-대역 신호를 포함할 수도 있다. 방법 (800) 은 또한, 풀-대역 신호를 디코딩하여 중간 샘플링 레이트를 갖는 디코딩된 풀-대역 신호를 생성하는 단계를 포함할 수도 있다. 디코딩된 풀-대역 신호는 디코딩된 저-대역 신호 및 디코딩된 고-대역 신호와 결합되어 결합 신호를 생성할 수도 있다.
일 구현에 따르면, 방법 (800) 은 또한, 디코더에서 입력 오디오 비트스트림의 제 2 프레임을 수신하는 단계를 포함할 수도 있다. 제 2 프레임은 적어도, 제 3 주파수 범위와 연관된 제 2 저-대역 신호 및 제 4 주파수 범위와 연관된 제 2 고-대역 신호를 포함할 수도 있다. 예를 들어, 도 2 를 참조하면, 디멀티플렉서 (202) 는 입력 오디오 비트스트림 (220) 의 제 2 프레임 (224) 을 수신할 수도 있다. 제 2 프레임 (224) 은 제 3 주파수 범위 (예를 들어, 0 Hz 내지 8 kHz) 와 연관된 제 2 저-대역 신호 (252) 및 제 4 주파수 범위 (예를 들어, 8 kHz 내지 16 kHz) 와 연관된 제 2 고-대역 신호 (254) 를 포함할 수도 있다.
방법 (800) 은 또한, 제 2 저-대역 신호를 디코딩하여 제 2 중간 샘플링 레이트를 갖는 제 2 디코딩된 저-대역 신호를 생성하는 단계를 포함할 수도 있다. 제 2 중간 샘플링 레이트는 제 2 프레임과 연관된 코딩 정보에 기초할 수도 있고, 제 2 중간 샘플링 레이트는 중간 샘플링 레이트와 상이할 수도 있다. 예를 들어, 도 2 를 참조하면, 저-대역 디코더 (206) 는 제 2 저-대역 신호 (252) 를 디코딩하여 제 2 중간 샘플링 레이트 (256)(예를 들어, 32 kHz) 를 갖는 제 2 디코딩된 저-대역 신호 (258) 를 생성할 수도 있다.
방법 (800) 은 또한, 제 2 고-대역 신호를 디코딩하여 제 2 중간 샘플링 레이트를 갖는 제 2 디코딩된 고-대역 신호를 생성하는 단계를 포함할 수도 있다. 예를 들어, 도 2 를 참조하면, 고-대역 디코더 (208) 는 제 2 고-대역 신호 (254) 를 디코딩하여 제 2 중간 샘플링 레이트 (256) 를 갖는 제 2 디코딩된 고-대역 신호 (260) 를 생성할 수도 있다.
방법 (800) 은 또한, 적어도 제 2 디코딩된 저-대역 신호 및 제 2 디코딩된 고-대역 신호를 결합하여 제 2 중간 샘플링 레이트를 갖는 결합 신호를 생성하는 단계를 포함할 수도 있다. 예를 들어, 도 2 를 참조하면, 가산기 (210) 는 제 2 디코딩된 저-대역 신호 (258) 및 제 2 디코딩된 고-대역 신호 (260) 를 결합하여 제 2 중간 샘플링 레이트 (256) 를 갖는 제 2 결합 신호 (262) 를 생성할 수도 있다.
방법 (800) 은 제 2 결합 신호에 적어도 부분적으로 기초하여 제 2 리샘플링된 신호를 생성하는 단계를 더 포함할 수도 있다. 제 2 리샘플링된 신호는 디코더의 출력 샘플링 레이트를 가질 수도 있다. 예를 들어, 도 2 를 참조하면, 포스트-프로세싱 회로부 (212) 는 제 2 결합 신호 (262) 상에서 하나 이상의 프로세싱 동작들을 수행하여 제 2 중간 샘플링 레이트 (256) 를 갖는 제 2 디코딩된 출력 신호 (264) 를 생성할 수도 있고, 샘플러 (214) 는 제 2 디코딩된 출력 신호 (264) 에 기초하여 출력 샘플링 레이트 (예를 들어, 48 kHz) 를 갖는 제 2 리샘플링된 신호 (266) 를 생성할 수도 있다. 예를 들어, 샘플러 (214) 는 출력 샘플링 레이트에서 제 2 디코딩된 출력 신호 (264) 를 샘플링하여 제 2 리샘플링된 신호 (266) 를 생성할 수도 있다.
도 8b 를 참조하면, 신호를 프로세싱하는 다른 방법 (850) 이 도시된다. 방법 (850) 은 도 1 의 디코더 (118), 도 2 의 시스템 (200), 도 3 의 저-대역 디코더 (206), 도 3 의 고-대역 디코더 (208), 도 6 의 시스템 (600), 도 7 의 풀-대역 디코더 (608), 또는 이들의 조합에 의해 수행될 수도 있다.
방법 (850) 은 852 에서, 디코더에서 입력 오디오 비트스트림의 제 1 프레임을 수신하는 단계를 포함한다. 제 1 프레임은 주파수 범위와 연관된 적어도 하나의 신호를 포함할 수도 있다. 방법 (850) 은 또한, 854 에서, 적어도 하나의 신호를 디코딩하여 중간 샘플링 레이트를 갖는 적어도 하나의 디코딩된 신호를 생성하는 단계를 포함한다. 중간 샘플링 레이트는 제 1 프레임과 연관된 코딩 정보에 기초할 수도 있다. 방법 (850) 은 또한, 적어도 하나의 디코딩된 신호에 적어도 부분적으로 기초하여 리샘플링된 신호를 생성하는 단계를 포함한다. 리샘플링된 신호는 디코더의 출력 샘플링 레이트를 가질 수도 있다.
도 8a 및 도 8b 의 방법들 (800, 850) 은 프레임들이 (예를 들어, 프레임들의 코딩 모드들과 연관된 샘플링 레이트들에 기초하여) 인코딩되는 샘플링 레이트들에 기초하는 중간 샘플링 레이트들에서 상이한 프레임들이 디코딩되게 할 수도 있다. (디코더의 출력 샘플링 레이트와 대조적으로) 중간 샘플링 레이트들에서 프레임들을 디코딩하는 것은 샘플링 및 리샘플링 동작들의 양을 감소시킬 수도 있다. 예를 들어, 저-대역 및 고-대역은 중간 샘플링 레이트들에서 프로세싱 및 결합될 수도 있다. 저-대역 및 고-대역이 결합된 후에, 단일의 샘플링 동작이 출력 샘플링 레이트에서 신호를 생성하도록 수행될 수도 있다. 이들 기법들은, 저-대역이 출력 샘플링 레이트에서 리샘플링되고 (예를 들어, 제 1 샘플링 동작), 고-대역이 출력 샘플링 레이트에서 리샘플링되며 (예를 들어, 제 2 샘플링 동작), 리샘플링된 신호들이 결합되는 종래의 기법들과 비교하여 샘플링 동작들의 수를 감소시킬 수도 있다. 리샘플링 동작들의 수를 감소시키는 것은 비용 및 연산 복잡성을 감소시킬 수도 있다.
풀 시스템을 설명하는 예시의 구현이 제시된다. 스피치의 프레임에 관한 인코딩된 정보를 디코딩하도록 설계된 디코더가 수신될 수도 있다. 인코딩된 정보는 인코더 상에서 인코딩된 대역폭에 관한 정보를 포함할 수도 있다. 이 정보는 비트스트림의 부분으로서 전달되거나, 또는 코딩 모드, 비트레이트 등으로부터 간접적으로 도출될 수 있다. 일 예로서, CODEC 의 동작 스킴의 지식을 갖고, 특정 프레임의 비트레이트가 제 1 값인 경우, 비트레이트에서 지원된 코딩의 연관된 최대 대역폭이 존재할 수 있다. 이것은, 실제 인코딩된 대역폭이 특정 프레임의 비트레이트에서 지원된 최대 대역폭 이하라는 표시이다. (직접적으로나 간접적으로 추론된) 이 대역폭 정보는 디코더의 원하는 출력 샘플링 레이트 이하일 수도 있는 동작의 중간 샘플링 레이트를 결정하는데 사용될 수도 있다. 각각의 대역으로부터 디코딩된 스피치의 샘플링 레이트는 이 중간 샘플링 레이트 이하인 것으로 제한될 수 있다.
예를 들어, 도 2 에서, 중간 샘플링 레이트 결정 회로부 (204) 는 중간 샘플링 레이트를 결정할 수도 있다. 코더가 다수의 대역들 (예를 들어, 저-대역, 고-대역 등) 에서 동작하고 있는 특정 구현에서, 저-대역 디코더 (206) 는 중간 샘플링 레이트 이하인 샘플 레이트 (예를 들어, 이것은 저-대역 코어 - 16 kHz 또는 12.8 kHz 의 동작 샘플링 레이트일 수 있음) 에서 디코딩된 저-대역 신호를 샘플링할 수도 있다. 유사하게, 고-대역은 중간 샘플링 레이트 이하인 샘플링 레이트 (예를 들어, 이것은 중간 샘플링 레이트 그 자체일 수 있음) 에서 디코딩된 고-대역 신호를 제공할 수 있다. 대안의 구현에서, 디코딩 프로세스는 저-대역 디코더가 인코딩된 신호의 전체 대역폭을 망라하고 고-대역 디코딩이 이 상황에서 존재하지 않는 신호 대역에서 수행될 수 있다. 일부 구현들에서, 저-대역 및 고-대역 디코더들 다음에 시간 도메인 디코딩된 저-대역 및 고-대역 신호들을 DFT 도메인으로 컨버팅할 수 있는 DFT 분석 모듈이 뒤따를 수도 있다. 디코딩된 저-대역 및 디코딩된 고-대역 신호들이 출력 샘플링 레이트 이하인 중간 샘플링 레이트 이하인 레이트들에서 샘플링되기 때문에, DFT 분석 프로세싱은 더 적은 수의 명령들을 요구할 수도 있고 따라서 디코딩 프로세스의 시간 및 동작 전력을 절감한다.
중간 샘플 레이트는 수신된 인코딩된 비트스트림에 기초하여 각각의 프레임에서 결정되고 따라서 프레임에서 프레임으로 변동하는 경향이 있는 것이 주목되어야 한다. 일단 DFT 분석 단계가 수행되면, 포스트 프로세싱 단계들은 스테레오 큐들 및 추가의 업믹스의 적용을 포함하여 DFT 분석 도메인에서 멀티-채널 정보를 획득할 수도 있는 것이 주목되어야 한다. 스테레오 큐들 및 업믹스의 적용을 위한 DFT 분석 도메인에서의 프로세싱은 중간 샘플링 레이트나 출력 샘플링 레이트에서 선택적으로 수행될 수도 있다. 이 스테레오 업믹스 단계 다음에 포스트-프로세싱 모듈 그 자체 안에 있을 수도 있는 DFT 합성 단계가 뒤따를 수도 있다. 특정 구현에서, DFT 합성은 출력 샘플링 레이트에서 직접적으로 샘플링된 디코딩된 출력 신호를 생성할 수도 있다. 이 구현에서, 샘플러 (214) 에서 수행된 동작들은 바이패스될 수도 있고 디코딩된 출력 신호는 리샘플링된 신호로서 직접적으로 사용될 수도 있다. 다른 대안의 구현에서, DFT 합성 단계는 중간 샘플링 레이트에서 디코딩된 출력을 생성할 수도 있다. 이 특정 구현에서, 포스트-프로세싱 회로부 (212) 다음에, 디코딩된 출력 신호를 원하는 출력 샘플링 레이트로 리샘플링하여 리샘플링된 신호를 생성하도록 (샘플러 (214) 에서) 샘플링 동작들이 뒤따를 수도 있다. 이 시나리오에서, 동작들은 중간 샘플 레이트가 스위칭되는 경우 DFT 합성 단계들의 OLA 메모리들을 핸들링하도록 수행될 수도 있다.
일 특정 구현에서, 프레임 유형이 제 1 프레임에서의 일 모드 (예를 들어, TCX 또는 ACELP 코딩 모드) 로부터 제 2 프레임에서의 다른 모드 (예를 들어, ACELP 또는 TCX 코딩 모드) 로 스위칭한 경우, 코딩 모드들의 디코딩 단계들의 상이한 지연들로 인해 양자 모두의 프레임들은 특정한 인터-프레임 중첩 영역에 대응하는 샘플들을 중복적으로 추정할 수도 있다. 이를 수용하기 위해, DFT 분석 이전에 "페이드-인 페이드-아웃" 단계가 수행된다. 페이드-인은, 제 2 프레임의 샘플들이 중첩 영역에서 증가하는 윈도우로 윈도잉되는 것을 나타내고, 페이드-아웃은, 제 1 프레임의 샘플들이 중첩 영역에서 감소하는 상보적 윈도우로 윈도잉되는 것을 나타낸다. 스위칭된 코딩 모드 뿐만 아니라 중간 샘플링 레이트가 제 1 프레임 다음에 동일한 제 2 프레임에서 동시에 스위칭되고 있는 경우에서, 제 1 프레임에 대응하는 페이드-아웃 부분은 제 1 프레임의 중간 샘플 레이트에서 추정되었고 이것은 제 2 프레임의 중간 샘플 레이트로 리샘플링될 필요가 있다. 다른 대안의 방법들에서, 코딩 모드 및 중간 샘플 레이트의 동시적 변화는 허용되지 않을 수도 있고 제 1 프레임의 중간 샘플 레이트는 제 2 프레임의 코딩 모드가 제 1 프레임의 코딩 모드와 상이한 경우 제 2 프레임에서 유지될 수도 있다.
특정 구현들에서, 도 8a 및 도 8b 의 방법들 (800, 850) 은 필드-프로그래머블 게이트 어레이 (FPGA) 디바이스, 주문형 집적 회로 (ASIC), 프로세싱 유닛, 예컨대 중앙 처리 장치 (CPU), 디지털 신호 프로세서 (DSP), 제어기, 다른 하드웨어 디바이스, 펌웨어 디바이스, 또는 이들의 임의의 조합에 의해 구현될 수도 있다. 일 예로서, 도 8a 및 도 8b 의 방법들 (800, 850) 은 도 12 에 대하여 설명된 바와 같이 명령들을 실행하는 프로세서에 의해 수행될 수도 있다.
도 9 를 참조하면, 오디오 신호를 디코딩하기 위한 시스템 (900) 의 특정 구현이 도시된다. 일 구현에 따르면, 시스템 (900) 은 도 1 의 디코더 (118) 에 대응할 수도 있다. 시스템 (900) 은 중간 채널 디코더 (902), 변환 유닛 (904), 업믹서 (906), 역 변환 유닛 (908), 대역폭 확장 (BWE) 유닛 (910), 인터-채널 BWE (ICBWE) 유닛 (912), 및 리-샘플러 (914) 를 포함한다. 일부 구현들에서, 시스템 (900) 에서의 컴포넌트들 중 하나 이상이 존재하지 않을 수도 있고 또는 유사한 목적을 담당하는 다른 컴포넌트에 의해 대체될 수도 있다. 예를 들어, 일부 구현들에서 ICBWE 경로는 존재하지 않을 수도 있다.
중간-대역 비트스트림 (166)(예를 들어, 중간 채널 오디오 비트스트림) 은 중간 채널 디코더 (902) 에 제공될 수도 있다. 중간-대역 비트스트림 (166) 은 제 1 프레임 (915) 및 제 2 프레임 (917) 을 포함할 수도 있다. 제 1 프레임 (915) 은 제 1 프레임 (915) 과 연관된 제 1 코딩 정보 (916) 에 기초하는 제 1 대역폭을 가질 수도 있다. 제 1 코딩 정보 (916) 는 제 1 프레임 (915) 을 인코딩하도록 인코더 (114) 에 의해 사용된 제 1 코딩 모드를 나타내는 2-비트 표시자일 수도 있다. 제 1 코딩 모드는 광대역 코딩 모드, 초-광대역 코딩 모드, 또는 풀-대역 코딩 모드를 포함할 수도 있다. 예시의 용이함을 위해, 본원에 사용된 바와 같이, 제 1 코딩 모드는 광대역 코딩 모드에 대응한다. 그러나, 다른 구현들에서, 제 1 코딩 모드는 초-광대역 코딩 모드 또는 풀-대역 코딩 모드일 수도 있다. 제 1 대역폭은 제 1 코딩 모드에 기초할 수도 있다.
제 2 프레임 (917) 은 제 2 프레임 (917) 과 연관된 제 2 코딩 정보 (918) 에 기초하는 제 2 대역폭을 가질 수도 있다. 제 2 코딩 정보 (918) 는 제 2 프레임 (917) 을 인코딩하도록 인코더 (114) 에 의해 사용된 제 2 코딩 모드를 나타내는 2-비트 표시자일 수도 있다. 제 2 코딩 모드는 광대역 코딩 모드, 초-광대역 코딩 모드, 또는 풀-대역 코딩 모드를 포함할 수도 있다. 예시의 용이함을 위해, 본원에 사용된 바와 같이, 제 2 코딩 모드는 초-광대역 코딩 모드에 대응한다. 그러나, 다른 구현들에서, 제 2 코딩 모드는 광대역 코딩 모드 또는 풀-대역 코딩 모드일 수도 있다. 따라서, 시스템 (900) 은 코딩 모드가 프레임에서 프레임으로 변하는 다수의 프레임들을 디코딩할 수도 있다. 제 2 대역폭은 제 2 코딩 모드에 기초할 수도 있다.
제 1 프레임 (915) 을 디코딩하기 위해, 제 1 프레임 (915) 의 제 1 대역폭이 결정될 수도 있다. 예를 들어, 도 1 의 중간 샘플링 레이트 결정 회로부 (172) 는, 제 1 프레임 (915) 이 광대역 프레임이기 때문에 제 1 대역폭이 8 kHz 라는 것을 결정할 수도 있다. 중간 샘플링 레이트 결정 회로부 (172) 는 제 1 대역폭의 나이퀴스트 샘플링 레이트에 기초하여 제 1 중간 샘플링 레이트 (fⅠ1) 를 결정할 수도 있다. 예를 들어, 제 1 대역폭이 8 kHz 이기 때문에, 제 1 중간 샘플링 레이트는 16 kHz 와 동일할 수도 있다.
중간 채널 디코더 (902) 는 제 1 프레임 (915) 의 제 1 인코딩된 중간 채널을 디코딩하여 제 1 중간 샘플링 레이트를 갖는 제 1 디코딩된 중간 채널 (920) 을 생성하도록 구성될 수도 있다. 제 1 디코딩된 중간 채널 (920) 은 변환 유닛 (904) 에 제공될 수도 있다. 변환 유닛 (904) 은 제 1 디코딩된 중간 채널 (920) 상에서 시간-투-주파수 도메인 컨버전 동작을 수행하여 제 1 중간 샘플링 레이트를 갖는 제 1 주파수-도메인 디코딩된 중간 채널 (922) 을 생성하도록 구성될 수도 있다. 예를 들어, 시간-투-주파수 도메인 컨버전 동작은 이산 푸리에 변환 (DFT) 컨버전 동작을 포함할 수도 있다. 제 1 주파수-도메인 디코딩된 중간 채널 (922) 은 업믹서 (906) 에 제공될 수도 있다. 주파수 도메인 변환이 지정되지만, 주파수 도메인 변환은 또한, 다른 변환들, 예컨대 서브-대역 변환들, 웨이블릿 변환들, 또는 임의의 다른 의사 주파수-도메인 또는 서브-대역 도메인 변환에 대응할 수도 있다.
업믹서 (906) 는 제 1 주파수-도메인 디코딩된 중간 채널 (922) 상에서 주파수-도메인 업믹스 동작을 수행하여 제 1 중간 샘플링 레이트를 갖는 제 1 좌측 주파수-도메인 저-대역 채널 (924) 및 제 1 중간 샘플링 레이트를 갖는 제 1 우측 주파수-도메인 저-대역 채널 (926) 을 생성하도록 구성될 수도 있다. 예를 들어, 업믹서 (906) 는 스테레오 큐들 (162) 중 하나 이상을 사용하여 제 1 주파수-도메인 디코딩된 중간 채널 (922) 상에서 주파수-도메인 업믹스 동작을 수행할 수도 있다. 제 1 좌측 주파수-도메인 저-대역 채널 (924) 은 역 변환 유닛 (908) 에 제공될 수도 있고, 제 1 우측 주파수-도메인 저-대역 채널 (926) 은 역 변환 유닛 (908) 에 제공될 수도 있다.
역 변환 유닛 (908) 은 제 1 좌측 주파수-도메인 저-대역 채널 (924) 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 제 1 중간 샘플링 레이트를 갖는 제 1 좌측 시간-도메인 저-대역 채널 (928) 을 생성하도록 구성될 수도 있다. 제 1 좌측 시간-도메인 저-대역 채널 (928) 은 윈도잉 동작 (950) 및 중첩-가산 (OLA) 동작 (952) 을 겪을 수도 있다. 일 구현에 따르면, 주파수-투-시간 도메인 컨버전 동작은 역 DFT (IDFT) 동작을 포함할 수도 있다. 역 변환 유닛 (908) 은 제 1 우측 주파수-도메인 저-대역 채널 (926) 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 제 1 중간 샘플링 레이트를 갖는 제 1 우측 시간-도메인 저-대역 채널 (930) 을 생성하도록 구성될 수도 있다. 제 1 우측 시간-도메인 저-대역 채널 (930) 은 윈도잉 동작 (954) 및 OLA 동작 (956) 을 겪을 수도 있다.
중간 채널 디코더 (902) 는 또한, 제 1 프레임 (915) 의 제 1 인코딩된 중간 채널에 기초하여 제 1 중간 샘플링 레이트를 갖는 제 1 중간 채널 여기 (932) 를 생성하도록 구성될 수도 있다. 제 1 중간 채널 여기 (932) 는 BWE 유닛 (910) 에 제공될 수도 있다. BWE 유닛 (910) 은 제 1 중간 채널 여기 (932) 상에서 대역폭 확장 동작을 수행하여 제 1 중간 샘플링 레이트를 갖는 제 1 BWE 중간 채널 (933) 을 생성하도록 구성될 수도 있다. 제 1 BWE 중간 채널 (933) 은 ICBWE 유닛 (912) 에 제공될 수도 있다.
ICBWE 유닛 (912) 은 제 1 BWE 중간 채널 (933) 에 기초하여 제 1 중간 샘플링 레이트를 갖는 제 1 좌측 시간-도메인 고-대역 채널 (934) 을 생성하도록 구성될 수도 있다. 예를 들어, ICBWE 유닛 (912) 은 스테레오 큐들 (162)(예를 들어, ICBWE 이득 스테레오 큐) 을 사용하여 제 1 좌측 시간-도메인 고-대역 채널 (934) 을 생성할 수도 있다. ICBWE 유닛 (912) 은 또한, 제 1 BWE 중간 채널 (933) 에 기초하여 제 1 중간 샘플링 레이트를 갖는 제 1 우측 시간-도메인 고-대역 채널 (936) 을 생성하도록 구성될 수도 있다.
제 1 좌측 시간-도메인 저-대역 채널 (928) 은 제 1 좌측 시간-도메인 고-대역 채널 (934) 과 결합되어 제 1 중간 샘플링 레이트를 갖는 제 1 좌측 채널 (938) 을 생성할 수도 있다. 예를 들어, 하나 이상의 가산기들은 제 1 좌측 시간-도메인 저-대역 채널 (928) 을 제 1 좌측 시간-도메인 고-대역 채널 (934) 과 결합하도록 구성될 수도 있다. 제 1 좌측 채널 (938) 은 리-샘플러 (914) 에 제공될 수도 있다. 제 1 우측 시간-도메인 저-대역 채널 (930) 은 제 1 우측 시간-도메인 고-대역 채널 (936) 과 결합되어 제 1 중간 샘플링 레이트를 갖는 제 1 우측 채널 (940) 을 생성할 수도 있다. 예를 들어, 하나 이상의 가산기들은 제 1 우측 시간-도메인 저-대역 채널 (930) 을 제 1 우측 시간-도메인 고-대역 채널 (936) 과 결합하도록 구성될 수도 있다. 제 1 우측 채널 (940) 은 리-샘플러 (914) 에 제공될 수도 있다.
특정 구현에서, 하나 이상의 가산기들은 도 6 의 가산기 (210) 를 포함하거나 또는 이에 대응할 수도 있다. 예시하기 위해, 풀-대역 디코더, 예컨대 도 6 의 풀-대역 디코더 (608) 는 인코딩된 중간 채널 (예를 들어, 제 1 프레임 (915)) 상에서 디코드 동작들을 수행하여 좌측 시간-도메인 풀-대역 채널 (예를 들어, 좌측 시간-도메인 풀-대역 신호) 및 우측 시간-도메인 풀-대역 채널 (예를 들어, 우측 시간-도메인 풀-대역 신호) 을 생성할 수도 있다. 하나 이상의 가산기들은 제 1 좌측 시간-도메인 저-대역 채널 (928), 제 1 좌측 시간-도메인 고-대역 채널 (934), 및 좌측 시간-도메인 풀-대역 채널을 결합하여 제 1 좌측 채널 (938) 을 생성하도록 구성될 수도 있고, 하나 이상의 가산기들은 제 1 우측 시간-도메인 저-대역 채널 (930), 제 1 우측 시간-도메인 고-대역 채널 (936), 및 우측 시간-도메인 풀-대역 채널을 결합하여 제 1 우측 채널 (940) 을 생성하도록 구성될 수도 있다.
리-샘플러 (914) 는 디코더 (118) 의 출력 샘플링 레이트 (fo) 를 갖는 제 1 좌측 리샘플링된 채널 (942) 을 생성하도록 구성될 수도 있다. 예를 들어, 리-샘플러 (914) 는 제 1 좌측 채널 (938) 을 출력 샘플링 레이트로 리샘플링하여 제 1 좌측 리샘플링된 채널 (942) 을 생성할 수도 있다. 부가적으로, 리-샘플러 (914) 는 제 1 우측 채널 (940) 을 출력 샘플링 레이트로 리샘플링함으로써 출력 샘플링 레이트를 갖는 제 1 우측 리샘플링된 채널 (944) 을 생성하도록 구성될 수도 있다.
제 2 프레임 (917) 을 디코딩하기 위해, 제 2 프레임 (917) 의 제 2 대역폭이 결정될 수도 있다. 예를 들어, 도 1 의 중간 샘플링 레이트 결정 회로부 (172) 는, 제 2 프레임 (917) 이 초-광대역 프레임이기 때문에 제 2 대역폭이 16 kHz 라는 것을 결정할 수도 있다. 중간 샘플링 레이트 결정 회로부 (172) 는 제 2 대역폭의 나이퀴스트 샘플링 레이트에 기초하여 제 2 중간 샘플링 레이트 (fⅠ2) 를 결정할 수도 있다. 예를 들어, 제 2 대역폭이 16 kHz 이기 때문에, 제 2 중간 샘플링 레이트는 32 kHz 와 동일할 수도 있다.
중간 채널 디코더 (902) 는 제 2 프레임 (917) 의 제 2 인코딩된 중간 채널을 디코딩하여 제 2 중간 샘플링 레이트를 갖는 제 2 디코딩된 중간 채널 (970) 을 생성하도록 구성될 수도 있다. 제 2 디코딩된 중간 채널 (970) 은 변환 유닛 (904) 에 제공될 수도 있다. 변환 유닛 (904) 은 제 2 디코딩된 중간 채널 (970) 상에서 시간-투-주파수 도메인 컨버전 동작을 수행하여 제 2 중간 샘플링 레이트를 갖는 제 2 주파수-도메인 디코딩된 중간 채널 (972) 을 생성하도록 구성될 수도 있다. 예를 들어, 시간-투-주파수 도메인 컨버전 동작은 DFT 컨버전 동작을 포함할 수도 있다. 제 2 주파수-도메인 디코딩된 중간 채널 (972) 은 업믹서 (906) 에 제공될 수도 있다.
업믹서 (906) 는 제 2 주파수-도메인 디코딩된 중간 채널 (972) 상에서 주파수-도메인 업믹스 동작을 수행하여 제 2 중간 샘플링 레이트를 갖는 제 2 좌측 주파수-도메인 저-대역 채널 (974) 및 제 2 중간 샘플링 레이트를 갖는 제 2 우측 주파수-도메인 저-대역 채널 (976) 을 생성하도록 구성될 수도 있다. 예를 들어, 업믹서 (906) 는 스테레오 큐들 (162) 중 하나 이상을 사용하여 제 2 주파수-도메인 디코딩된 중간 채널 (972) 상에서 주파수-도메인 업믹스 동작을 수행할 수도 있다. 제 2 좌측 주파수-도메인 저-대역 채널 (974) 은 역 변환 유닛 (908) 에 제공될 수도 있고, 제 2 우측 주파수-도메인 저-대역 채널 (976) 은 역 변환 유닛 (908) 에 제공될 수도 있다.
역 변환 유닛 (908) 은 제 2 좌측 주파수-도메인 저-대역 채널 (974) 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 제 2 중간 샘플링 레이트를 갖는 제 2 좌측 시간-도메인 저-대역 채널 (978) 을 생성하도록 구성될 수도 있다. 제 2 좌측 시간-도메인 저-대역 채널 (978) 은 윈도잉 동작 (954) 및 OLA 동작 (956) 을 겪을 수도 있다. 일 구현에 따르면, 주파수-투-시간 도메인 컨버전 동작은 IDFT 동작을 포함할 수도 있다. 역 변환 유닛 (908) 은 또한, 제 2 우측 주파수-도메인 저-대역 채널 (976) 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 제 2 중간 샘플링 레이트를 갖는 제 2 우측 시간-도메인 저-대역 채널 (980) 을 생성하도록 구성될 수도 있다. 제 2 우측 시간-도메인 저-대역 채널 (980) 은 윈도잉 동작 (954) 및 OLA 동작 (956) 을 겪을 수도 있다.
중간 채널 디코더 (902) 는 또한, 제 2 프레임 (917) 의 제 2 인코딩된 중간 채널에 기초하여 제 2 중간 샘플링 레이트를 갖는 제 2 중간 채널 여기 (982) 를 생성하도록 구성될 수도 있다. 제 2 중간 채널 여기 (982) 는 BWE 유닛 (910) 에 제공될 수도 있다. BWE 유닛 (910) 은 제 2 중간 채널 여기 (982) 상에서 대역폭 확장 동작을 수행하여 제 2 중간 샘플링 레이트를 갖는 제 2 BWE 중간 채널 (983) 을 생성하도록 구성될 수도 있다. 제 2 BWE 중간 채널 (983) 은 ICBWE 유닛 (912) 에 제공될 수도 있다.
ICBWE 유닛 (912) 은 제 2 BWE 중간 채널 (983) 에 기초하여 제 2 중간 샘플링 레이트를 갖는 제 2 좌측 시간-도메인 고-대역 채널 (984) 을 생성하도록 구성될 수도 있다. 예를 들어, ICBWE 유닛 (912) 은 스테레오 큐들 (162)(예를 들어, ICBWE 이득 스테레오 큐) 을 사용하여 제 2 좌측 시간-도메인 고-대역 채널 (984) 을 생성할 수도 있다. ICBWE 유닛 (912) 은 또한, 제 2 BWE 중간 채널 (983) 에 기초하여 제 2 중간 샘플링 레이트를 갖는 제 2 우측 시간-도메인 고-대역 채널 (986) 을 생성하도록 구성될 수도 있다.
제 2 좌측 시간-도메인 저-대역 채널 (978) 은 제 2 좌측 시간-도메인 고-대역 채널 (984) 과 결합되어 제 2 중간 샘플링 레이트를 갖는 제 2 좌측 채널 (988) 을 생성할 수도 있다. 제 2 좌측 채널 (988) 은 리-샘플러 (914) 에 제공될 수도 있다. 예를 들어, 하나 이상의 가산기들은 제 2 좌측 시간-도메인 저-대역 채널 (978) 을 제 2 좌측 시간-도메인 고-대역 채널 (984) 과 결합하도록 구성될 수도 있다. 제 2 우측 시간-도메인 저-대역 채널 (980) 은 제 2 우측 시간-도메인 고-대역 채널 (986) 과 결합되어 제 2 중간 샘플링 레이트를 갖는 제 2 우측 채널 (990) 을 생성할 수도 있다. 예를 들어, 하나 이상의 가산기들은 제 2 우측 시간-도메인 저-대역 채널 (980) 을 제 2 우측 시간-도메인 고-대역 채널 (986) 과 결합하도록 구성될 수도 있다. 제 2 우측 채널 (990) 은 리-샘플러 (914) 에 제공될 수도 있다.
특정 구현에서, 하나 이상의 가산기들은 도 6 의 가산기 (210) 를 포함하거나 또는 이에 대응할 수도 있다. 예시하기 위해, 풀-대역 디코더, 예컨대 도 6 의 풀-대역 디코더 (608) 는 인코딩된 중간 채널 (예를 들어, 제 2 프레임 (917)) 상에서 디코드 동작들을 수행하여 제 2 좌측 시간-도메인 풀-대역 채널 및 제 2 우측 시간-도메인 풀-대역 채널을 생성할 수도 있다. 하나 이상의 가산기들은 제 2 좌측 시간-도메인 저-대역 채널 (978), 제 2 좌측 시간-도메인 고-대역 채널 (984), 및 제 2 좌측 시간-도메인 풀-대역 채널을 결합하여 제 2 좌측 채널 (988) 을 생성하도록 구성될 수도 있고, 하나 이상의 가산기들은 제 2 우측 시간-도메인 저-대역 채널 (980), 제 2 우측 시간-도메인 고-대역 채널 (986), 및 제 2 우측 시간-도메인 풀-대역 채널을 결합하여 제 2 우측 채널 (990) 을 생성할 수도 있다.
리-샘플러 (914) 는 디코더 (118) 의 출력 샘플링 레이트 (fo) 를 갖는 제 2 좌측 리샘플링된 채널 (992) 을 생성하도록 구성될 수도 있다. 예를 들어, 리-샘플러 (914) 는 제 2 좌측 채널 (988) 을 출력 샘플링 레이트로 리샘플링하여 제 2 좌측 리샘플링된 채널 (992) 을 생성할 수도 있다. 부가적으로, 리-샘플러 (914) 는 제 2 우측 채널 (990) 을 출력 샘플링 레이트로 리샘플링함으로써 출력 샘플링 레이트를 갖는 제 2 우측 리샘플링된 채널 (994) 을 생성하도록 구성될 수도 있다.
리-샘플러 (914) 의 출력에서 신호는 연속성을 달성하도록 조정될 수도 있다. 예를 들어, 리-샘플러 (914) 의 구성 및 상태는 중간 샘플링 레이트가 스위칭하는 경우 조정될 수도 있다. 그렇지 않으면, 좌측 및 우측 리샘플링된 채널들에서의 프레임 경계들에서 불연속성들이 보여질 수도 있다. 이 가능한 불연속성의 이슈들을 처리하기 위해, 리-샘플러 (914) 는 좌측 및 우측 채널들의 일부 상에서 중복적으로 실행되어 샘플들을 제 1 프레임 (예를 들어, 프레임 (915)) 의 중간 샘플링 레이트로부터 출력 샘플링 레이트로 리샘플링하고 제 2 프레임 (예를 들어, 프레임 (917)) 의 중간 샘플링 레이트로부터 출력 샘플링 레이트로 리샘플링할 수도 있다. 좌측 및 우측 채널들의 일부는 프레임 (915) 의 부분, 프레임 (917) 의 부분, 또는 양자 모두를 포함할 수도 있다.
도 9 의 시스템 (900) 은 프레임들이 (예를 들어, 프레임들의 코딩 모드들과 연관된 샘플링 레이트들에 기초하여) 인코딩되는 샘플링 레이트들에 기초하는 중간 샘플링 레이트들에서 상이한 프레임들이 디코딩되게 할 수도 있다. (디코더의 출력 샘플링 레이트와 대조적으로) 중간 샘플링 레이트들에서 프레임들을 디코딩하는 것은 샘플링 및 리샘플링 동작들의 양을 감소시킬 수도 있다. 예를 들어, 저-대역 및 고-대역은 중간 샘플링 레이트들에서 프로세싱 및 결합될 수도 있다. 저-대역 및 고-대역이 결합된 후에, 단일의 샘플링 동작은 출력 샘플링 레이트에서 신호를 생성하도록 수행될 수도 있다. 이들 기법들은, 저-대역이 출력 샘플링 레이트 (예를 들어, 제 1 샘플링 동작) 에서 리샘플링되고, 고-대역이 출력 샘플링 레이트 (예를 들어, 제 2 샘플링 동작) 에서 리샘플링되며, 리샘플링된 신호들이 결합되는 종래의 기법들과 비교하여 샘플링 동작들의 수를 감소시킬 수도 있다. 리샘플링 동작들의 수를 감소시키는 것은 비용 및 시스템 (900) 의 연산 복잡성을 감소시킬 수도 있다.
도 10 을 참조하면, 중첩-가산 동작을 예시하는 다이어그램 (1000) 이 도시된다. 다이어그램에 따르면, 제 1 프레임 (915) 은 실선을 사용하여 도시되고, 제 2 프레임 (917) 은 점선을 사용하여 도시된다. 다이어그램 (1000) 은 제 1 프레임 (915) 의 제 1 좌측 시간-도메인 저-대역 채널 (928) 및 제 2 프레임 (917) 의 제 2 좌측 시간-도메인 저-대역 채널 (978) 을 도시한다. 그러나, 다른 구현들에서, 도 10 에 대하여 설명된 기법들은 프레임들 (915, 917) 의 다른 채널들과 연관되어 사용될 수도 있다. 비-제한적 예로서, 도 10 에 대하여 설명된 기법들은 제 1 우측 시간-도메인 저-대역 채널 (930), 제 2 우측 시간-도메인 저-대역 채널 (980), 제 1 좌측 시간-도메인 고-대역 채널 (934), 제 2 좌측 시간-도메인 고-대역 채널 (984), 제 1 우측 시간-도메인 고-대역 채널 (936), 제 2 우측 시간-도메인 고-대역 채널 (986), 제 1 좌측 채널 (938), 제 2 좌측 채널 (988), 제 1 우측 채널 (940), 또는 제 2 우측 채널 (990) 과 연관되어 사용될 수도 있다.
제 1 좌측 시간-도메인 저-대역 채널 (928) 은 0 ms 내지 30 ms 에 걸쳐 있을 수도 있고, 제 2 좌측 시간-도메인 저-대역 채널 (978) 은 20 ms 내지 50 ms 에 걸쳐 있을 수도 있다. 제 1 좌측 시간-도메인 저-대역 채널 (928) 의 제 1 부분은 0 ms 내지 20 ms 에 걸쳐 있을 수도 있고, 제 1 좌측 시간-도메인 저-대역 채널 (928) 의 제 2 부분은 20 ms 내지 30 ms 에 걸쳐 있을 수도 있다. 제 2 좌측 시간-도메인 저-대역 채널 (978) 의 제 1 부분은 20 ms 내지 30 ms 에 걸쳐 있을 수도 있고, 제 2 좌측 시간-도메인 저-대역 채널 (978) 의 제 2 부분은 30 ms 내지 50 ms 에 걸쳐 있을 수도 있다. 따라서, 제 1 좌측 시간-도메인 저-대역 채널 (928) 의 제 2 부분 및 제 2 좌측 시간-도메인 저-대역 채널 (978) 의 제 1 부분은 중첩할 수도 있다.
디코더 (118) 는 제 2 중간 샘플링 레이트 (예를 들어, 제 2 프레임 (917) 의 샘플링 레이트) 에 기초하여 제 1 좌측 시간-도메인 저-대역 채널 (928) 의 제 2 부분을 리샘플링하여 제 2 샘플링 레이트를 갖는 좌측 시간-도메인 저-대역 채널 (928) 의 리샘플링된 제 2 부분을 생성할 수도 있다. 디코더 (118) 는 또한, 좌측 시간-도메인 저-대역 채널 (928) 의 리샘플링된 제 2 부분 및 제 2 좌측 시간-도메인 저-대역 채널 (978) 의 제 1 부분 상에서 중첩-가산 동작을 수행하여, 프레임들 (915, 917) 의 중첩하는 부분들이 동일한 샘플링 레이트 (예를 들어, 제 2 중간 샘플링 레이트) 를 가질 수도 있다. 결과적으로, 프레임들 (915, 917) 의 중첩하는 부분들이 플레이 (예를 들어, 하나 이상의 스피커들에 의해 출력) 되는 경우 아티팩트들이 감소될 수도 있다.
특정 구현에서, 채널 (또는 다른 신호) 의 일부를 리샘플링하는 것은 업샘플링을 포함할 수도 있다. 예를 들어, 제 1 좌측 시간-도메인 저-대역 채널 (928) 이 제 1 중간 샘플링 레이트와 연관되고 제 2 좌측 시간-도메인 저-대역 채널 (978) 이 제 1 중간 샘플링 레이트보다 더 높은 제 2 중간 샘플링 레이트와 연관되면, 하나 이상의 보간 동작들 (또는 다른 업샘플링 동작들) 이 제 1 좌측 시간-도메인 저-대역 채널 (928) 의 제 2 부분 상에서 수행되어 제 2 중간 샘플링 레이트를 갖는 좌측 시간-도메인 저-대역 채널 (928) 의 리샘플링된 제 2 부분 (예를 들어, 좌측 시간-도메인 저-대역 채널 (928) 의 리샘플링된 제 2 부분은 좌측 시간-도메인 저-대역 채널 (928) 의 제 2 부분보다 더 큰 수의 샘플들을 포함) 을 생성할 수도 있다.
다른 예로서, 제 1 좌측 시간-도메인 저-대역 채널 (928) 이 제 1 중간 샘플링 레이트와 연관되고 제 2 좌측 시간-도메인 저-대역 채널 (978) 이 제 1 중간 샘플링 레이트보다 더 낮은 제 2 중간 샘플링 레이트와 연관되면, 하나 이상의 다운샘플링 및 필터링 동작들이 제 1 좌측 시간-도메인 저-대역 채널 (928) 의 제 2 부분 상에서 수행되어 제 2 중간 샘플링 레이트를 갖는 좌측 시간-도메인 저-대역 채널 (928) 의 리샘플링된 제 2 부분 (예를 들어, 좌측 시간-도메인 저-대역 채널 (928) 의 리샘플링된 제 2 부분은 좌측 시간-도메인 저-대역 채널 (928) 의 제 2 부분보다 더 작은 수의 샘플들을 포함) 을 생성할 수도 있다. 생성한 후에, 좌측 시간-도메인 저-대역 채널 (928) 의 리샘플링된 제 2 부분 및 제 2 좌측 시간-도메인 저-대역 채널 (978) 의 제 1 부분은 동일한 중간 레이트 (예를 들어, 제 2 중간 샘플링 레이트) 를 갖고 중첩-가산 동작에 의해 결합될 수도 있다. 제 1 좌측 시간-도메인 저-대역 채널 (928)(예를 들어, 제 1 입력) 의 제 2 부분의 리샘플링이 설명되었지만, 다른 구현들에서 디코더 (118) 는 제 2 좌측 시간-도메인 저-대역 채널 (978)(예를 들어, 제 2 입력) 의 제 1 부분 상에서 리샘플링 동작을 수행하여 중첩-가산 동작을 사용하여 제 1 좌측 시간-도메인 저-대역 채널 (928) 의 제 2 부분과 결합되도록 제 2 좌측 시간-도메인 저-대역 채널 (978) 의 리샘플링된 제 1 부분을 생성할 수도 있다.
도 11a 및 도 11b 를 참조하면, 신호를 프로세싱하는 방법 (1100) 이 도시된다. 방법 (1100) 은 도 1 의 디코더 (118), 도 2 의 시스템 (200), 도 3 의 저-대역 디코더 (206), 도 3 의 고-대역 디코더 (208), 도 6 의 시스템 (600), 도 7 의 풀-대역 디코더 (608), 도 9 의 시스템 (900), 또는 이들의 조합에 의해 수행될 수도 있다.
방법 (1100) 은 1102 에서, 인코더로부터 중간 채널 오디오 비트스트림의 제 1 프레임을 수신하는 단계를 포함한다. 예를 들어, 도 9 를 참조하면, 중간 채널 디코더 (902) 는 중간-대역 비트스트림 (166)(예를 들어, 중간-대역 비트스트림 (166)) 의 제 1 프레임 (915) 을 수신할 수도 있다.
방법 (1100) 은 또한, 1104 에서, 제 1 프레임과 연관된 제 1 코딩 정보에 기초하여 제 1 프레임의 제 1 대역폭을 결정하는 단계를 포함한다. 제 1 코딩 정보는 제 1 프레임을 인코딩하도록 인코더에 의해 사용된 제 1 코딩 모드를 나타낼 수도 있고, 제 1 대역폭은 제 1 코딩 모드에 기초할 수도 있다. 예를 들어, 도 1 및 도 9 를 참조하면, 중간 샘플링 레이트 결정 회로부 (172) 는 제 1 프레임 (915) 과 연관된 제 1 코딩 정보 (916) 에 기초하여 제 1 프레임 (915) 의 제 1 대역폭을 결정할 수도 있다.
방법 (1100) 은 1106 에서, 제 1 대역폭의 나이퀴스트 샘플링 레이트에 기초하여 중간 샘플링 레이트를 결정하는 단계를 포함한다. 예를 들어, 도 1 및 도 9 를 참조하면, 중간 샘플링 레이트 결정 회로부 (172) 는 제 1 대역폭의 나이퀴스트 샘플링 레이트에 기초하여 제 1 중간 샘플링 레이트를 결정할 수도 있다.
방법 (1100) 은 또한, 1108 에서, 제 1 프레임의 인코딩된 중간 채널을 디코딩하여 디코딩된 중간 채널을 생성하는 단계를 포함한다. 예를 들어, 도 9 를 참조하면, 중간 채널 디코더 (902) 는 제 1 프레임 (915) 의 제 1 인코딩된 중간 채널을 디코딩하여 제 1 중간 샘플링 레이트를 갖는 제 1 디코딩된 중간 채널 (920) 을 생성할 수도 있고, 변환 유닛 (904) 은 제 1 디코딩된 중간 채널 (920) 상에서 시간-투-주파수 도메인 컨버전 동작을 수행하여 제 1 중간 샘플링 레이트를 갖는 제 1 주파수-도메인 디코딩된 중간 채널 (922) 을 생성할 수도 있다.
방법 (1100) 은 또한, 1110 에서, 디코딩된 중간 채널 상에서 주파수-도메인 업믹스 동작을 수행하여 좌측 주파수-도메인 저-대역 신호 및 우측 주파수-도메인 저-대역 신호를 생성하는 단계를 포함한다. 예를 들어, 도 9 를 참조하면, 업믹서 (906) 는 제 1 주파수-도메인 디코딩된 중간 채널 (922) 상에서 주파수-도메인 업믹스 동작을 수행하여 제 1 중간 샘플링 레이트를 갖는 제 1 좌측 주파수-도메인 저-대역 채널 (924) 및 제 1 중간 샘플링 레이트를 갖는 제 1 우측 주파수-도메인 저-대역 채널 (926) 을 생성할 수도 있다. 예를 들어, 업믹서 (906) 는 스테레오 큐들 (162) 중 하나 이상을 사용하여 제 1 주파수-도메인 디코딩된 중간 채널 (922) 상에서 주파수-도메인 업믹스 동작을 수행할 수도 있다.
방법 (1100) 은 또한, 1112 에서, 좌측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 중간 샘플링 레이트를 갖는 좌측 시간-도메인 저-대역 신호를 생성하는 단계를 포함한다. 예를 들어, 도 9 를 참조하면, 역 변환 유닛 (908) 은 제 1 좌측 주파수-도메인 저-대역 채널 (924) 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 제 1 중간 샘플링 레이트를 갖는 제 1 좌측 시간-도메인 저-대역 채널 (928) 을 생성할 수도 있다. 방법 (1100) 은 또한, 1114 에서, 우측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 제 1 중간 샘플링 레이트를 갖는 우측 시간-도메인 저-대역 신호를 생성하는 단계를 포함한다. 예를 들어, 도 9 를 참조하면, 역 변환 유닛 (908) 은 제 1 우측 주파수-도메인 저-대역 채널 (926) 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 제 1 중간 샘플링 레이트를 갖는 제 1 우측 시간-도메인 저-대역 채널 (930) 을 생성할 수도 있다. 본원에 설명된 바와 같이, "주파수-투-시간 도메인 컨버전 동작" 의 일부 구현들은 윈도잉 동작 및 중첩-가산 동작을 포함할 수도 있다. 좌측 시간-도메인 저-대역 신호 및 우측 시간-도메인 저-대역 신호는 또한, 중간 샘플링 레이트를 갖는 저-대역 신호들로서 지칭될 수도 있다.
방법 (1100) 은 또한, 1116 에서, 인코딩된 중간 채널에 적어도 기초하여, 중간 샘플링 레이트를 갖는 좌측 시간-도메인 고-대역 신호 및 중간 샘플 레이트를 갖는 우측 시간-도메인 고-대역 신호를 생성하는 단계를 포함한다. 예를 들어, 도 9 를 참조하면, 중간 채널 디코더 (902) 는 제 1 프레임 (915) 의 제 1 인코딩된 중간 채널에 기초하여 제 1 중간 샘플링 레이트를 갖는 제 1 중간 채널 여기 (932) 를 생성할 수도 있고, BWE 유닛 (910) 은 제 1 중간 채널 여기 (932) 상에서 대역폭 확장 동작을 수행하여 제 1 중간 샘플링 레이트를 갖는 제 1 BWE 중간 채널 (933) 을 생성할 수도 있다. ICBWE 유닛 (912) 은 제 1 BWE 중간 채널 (933) 에 기초하여 제 1 중간 샘플링 레이트를 갖는 제 1 좌측 시간-도메인 고-대역 채널 (934) 을 생성할 수도 있고, 제 1 BWE 중간 채널 (933) 에 기초하여 제 1 중간 샘플링 레이트를 갖는 제 1 우측 시간-도메인 고-대역 채널 (936) 을 생성할 수도 있다.
방법 (1100) 은 또한, 1118 에서, 좌측 시간-도메인 저-대역 신호 및 좌측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 좌측 신호를 생성하는 단계를 포함한다. 예를 들어, 도 9 를 참조하면, 제 1 좌측 시간-도메인 저-대역 채널 (928) 은 제 1 좌측 시간-도메인 고-대역 채널 (934) 과 결합되어 제 1 중간 샘플링 레이트를 갖는 제 1 좌측 채널 (938) 을 생성할 수도 있다. 방법 (1100) 은 또한, 1120 에서, 우측 시간-도메인 저-대역 신호 및 우측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 우측 신호를 생성하는 단계를 포함한다. 예를 들어, 도 9 를 참조하면, 제 1 우측 시간-도메인 저-대역 채널 (930) 은 제 1 우측 시간-도메인 고-대역 채널 (936) 과 결합되어 제 1 중간 샘플링 레이트를 갖는 제 1 우측 채널 (940) 을 생성할 수도 있다.
방법 (1100) 은 또한, 1122 에서, 디코더의 출력 샘플링 레이트를 갖는 좌측 리샘플링된 신호 및 출력 샘플링 레이트를 갖는 우측 리샘플링된 신호를 생성하는 단계를 포함한다. 좌측 리샘플링된 신호는 좌측 신호에 적어도 부분적으로 기초할 수도 있고, 우측 리샘플링된 신호는 우측 신호에 적어도 부분적으로 기초할 수도 있다. 예를 들어, 도 9 를 참조하면, 리-샘플러 (914) 는 제 1 좌측 채널 (938) 을 출력 샘플링 레이트로 리샘플링함으로써 디코더 (118) 의 출력 샘플링 레이트 (f0) 를 갖는 제 1 좌측 리샘플링된 채널 (942) 을 생성할 수도 있다. 부가적으로, 리-샘플러 (914) 는 제 1 우측 채널 (940) 을 출력 샘플링 레이트로 리샘플링함으로써 출력 샘플링 레이트를 갖는 제 1 우측 리샘플링된 채널 (944) 을 생성할 수도 있다.
방법 (1100) 은 프레임들이 인코딩되는 샘플링 레이트들에 기초하는 (예를 들어, 프레임들의 코딩 모드들과 연관된 샘플링 레이트들에 기초하는) 중간 샘플링 레이트들에서 상이한 프레임들이 디코딩되게 할 수도 있다. (디코더의 출력 샘플링 레이트와 대조적으로) 중간 샘플링 레이트들에서 프레임들을 디코딩하는 것은 샘플링 및 리샘플링 동작들의 양을 감소시킬 수도 있다. 예를 들어, 저-대역 및 고-대역은 중간 샘플링 레이트들에서 프로세싱 및 결합될 수도 있다. 저-대역 및 고-대역이 결합된 후에, 단일의 샘플링 동작은 출력 샘플링 레이트에서 신호를 생성하도록 수행될 수도 있다. 이들 기법들은, 저-대역이 출력 샘플링 레이트에서 리샘플링되고 (예를 들어, 제 1 샘플링 동작), 고-대역이 출력 샘플링 레이트에서 리샘플링되며 (예를 들어, 제 2 샘플링 동작), 리샘플링된 신호들이 결합되는 종래의 기법들과 비교하여 샘플링 동작들의 수를 감소시킬 수도 있다. 리샘플링 동작들의 수를 감소시키는 것은 비용 및 연산 복잡성을 감소시킬 수도 있다.
도 12 을 참조하면, 디바이스 (예를 들어, 무선 통신 디바이스) 의 특정의 예시적인 예의 블록도가 도시되고, 일반적으로 1200 으로 지정된다. 다양한 구현들에서, 디바이스 (1200) 는 도 12 에서 예시된 것보다 더 많은 또는 더 적은 컴포넌트들을 가질 수도 있다. 예시적 예에서, 디바이스 (1200) 는 도 1 의 시스템에 대응할 수도 있다. 예를 들어, 디바이스 (1200) 는 도 1 의 제 1 디바이스 (104) 또는 제 2 디바이스 (106) 에 대응할 수도 있다. 예시적 예에서, 디바이스 (1200) 는 도 8a 및 도 8b 의 방법들 (800, 850) 또는 도 11a 및 도 11b 의 방법 (110) 에 따라 동작할 수도 있다.
특정 구현에서, 디바이스 (1200) 는 프로세서 (1206)(예를 들어, CPU) 를 포함한다. 디바이스 (1200) 는 하나 이상의 추가의 프로세서들, 예컨대 프로세서 (1210)(예를 들어, DSP) 를 포함할 수도 있다. 프로세서 (1210) 는 CODEC (1208), 예컨대 스피치 CODEC, 뮤직 CODEC, 또는 이들의 조합을 포함할 수도 있다. 프로세서 (1210) 는 스피치/뮤직 CODEC (1208) 의 동작들을 수행하도록 구성된 하나 이상의 컴포넌트들 (예를 들어, 회로부) 을 포함할 수도 있다. 다른 예로서, 프로세서 (1210) 는 스피치/뮤직 CODEC (1208) 의 동작들을 수행하도록 하나 이상의 컴퓨터-판독가능 명령들을 실행하도록 구성될 수도 있다. 따라서, CODEC (1208) 은 하드웨어 및 소프트웨어를 포함할 수도 있다. 스피치/뮤직 CODEC (1208) 이 프로세서 (1210) 의 컴포넌트로서 예시되지만, 다른 예들에서 스피치/뮤직 CODEC (1208) 의 하나 이상의 컴포넌트들은 프로세서 (1206), CODEC (1234), 다른 프로세싱 컴포넌트, 또는 이들의 조합에 포함될 수도 있다.
스피치/뮤직 CODEC (1208) 은 디코더 (1292), 예컨대 보코더 디코더를 포함할 수도 있다. 예를 들어, 디코더 (1292) 는 도 1 의 디코더 (118), 도 2 의 시스템 (200), 도 6 의 시스템 (600), 도 9 의 시스템 (900), 또는 이들의 조합에 대응할 수도 있다. 특정 구현에서, 디코더 (1292) 는 프레임들의 코딩 모드들과 연관된 중간 샘플링 레이트들을 사용하여 프레임들을 디코딩하도록 구성된다. 스피치/뮤직 CODEC (1208) 은 도 1 의 인코더 (114) 와 같은 인코더 (1291) 를 포함할 수도 있다.
디바이스 (1200) 는 메모리 (1232) 및 CODEC (1234) 을 포함할 수도 있다. CODEC (1234) 은 디지털-투-아날로그 컨버터 (DAC)(1202) 및 아날로그-투-디지털 컨버터 (ADC)(1204) 를 포함할 수도 있다. 스피커 (1236), 마이크로폰 (128) (예를 들어, 마이크로폰 어레이 (1238)), 또는 양자 모두는 CODEC (1234) 에 커플링될 수도 있다. CODEC (1234) 은 마이크로폰 어레이 (1238) 로부터 아날로그 신호들을 수신하고, 아날로그-투-디지털 컨버터 (1204) 를 사용하여 아날로그 신호들을 디지털 신호들로 컨버팅하며, 디지털 신호들을 스피치/뮤직 CODEC (1208) 에 제공할 수도 있다. 스피치/뮤직 CODEC (1208) 은 디지털 신호들을 프로세싱할 수도 있다. 일부 구현들에서, 스피치/뮤직 CODEC (1208) 은 디지털 신호들을 CODEC (1234) 에 제공할 수도 있다. CODEC (1234) 은 디지털-투-아날로그 컨버터 (1202) 를 사용하여 디지털 신호들을 아날로그 신호들로 컨버팅할 수도 있고, 아날로그 신호들을 스피커 (1236) 에 제공할 수도 있다.
디바이스 (1200) 는 트랜시버 (1250)(예를 들어, 송신기, 수신기, 또는 양자 모두) 를 통해 안테나 (1242) 에 커플링된 무선 제어기 (1240) 를 포함할 수도 있다. 디바이스 (1200) 는 메모리 (1232), 예컨대 컴퓨터-판독가능 저장 디바이스를 포함할 수도 있다. 메모리 (1232) 는 도 1 내지 도 7, 도 9, 도 10, 도 8a 및 도 8b 의 방법들 (800, 850), 도 11a 및 도 11b 의 방법 (1100), 또는 이들의 조합에 대하여 설명된 기법들 중 하나 이상을 수행하도록 명령들 (1260), 예컨대 프로세서 (1206), 프로세서 (1210), 또는 이들의 조합에 의해 실행되는 하나 이상의 명령들을 포함할 수도 있다.
메모리 (1232) 는 본원에 개시된 방법들 및 프로세스들을 수행하도록, 프로세서 (1206), 프로세서 (1210), CODEC (1234), 디바이스 (1200) 의 다른 프로세싱 유닛, 또는 이들의 조합에 의해 실행 가능한 명령들 (1260) 을 포함할 수도 있다. 도 1 의 시스템 (100) 의 하나 이상의 컴포넌트들은 하나 이상의 태스크들, 또는 이들의 조합을 수행하기 위한 명령들을 실행하는 프로세서에 의해 전용 하드웨어 (예를 들어, 회로부) 를 통해 구현될 수도 있다. 일 예로서, 메모리 (1232) 또는 프로세서 (1206), 프로세서 (1210), CODEC (1234), 또는 이들의 조합의 하나 이상의 컴포넌트들은 메모리 디바이스, 예컨대 랜덤 액세스 메모리 (RAM), 자기저항 랜덤 액세스 메모리 (MRAM), 스핀-토크 트랜스퍼 MRAM (STT-MRAM), 플래시 메모리, 판독-전용 메모리 (ROM), 프로그래머블 판독-전용 메모리 (PROM), 소거 가능한 프로그래머블 판독-전용 메모리 (EPROM), 전기적으로 소거 가능한 프로그래머블 판독-전용 메모리 (EEPROM), 레지스터들, 하드 디스크, 착탈형 디스크, 또는 컴팩트 디스크 판독-전용 메모리 (CD-ROM) 일 수도 있다. 메모리 디바이스는, 컴퓨터 (예를 들어, CODEC (1234) 에서의 프로세서, 프로세서 (1206), 프로세서 (1210), 또는 이들의 조합) 에 의해 실행되는 경우 컴퓨터로 하여금 도 8a 및 도 8b 의 방법들 (800, 850), 또는 도 11a 및 도 11b 의 방법 (1100) 의 적어도 일부를 수행하게 할 수도 있는 명령들 (예를 들어, 명령들 (1260)) 을 포함할 수도 있다.
특정 구현에서, 디바이스 (1200) 는 시스템-인-패키지 또는 시스템-온-칩 디바이스 (1222) 에 포함될 수도 있다. 일부 구현들에서, 메모리 (1232), 프로세서 (1206), 프로세서 (1210), 디스플레이 제어기 (1226), CODEC (1234), 무선 제어기 (1240), 및 트랜시버 (1250) 가 시스템-인-패키지 또는 시스템-온-칩 디바이스 (1222) 에 포함된다. 일부 구현들에서, 입력 디바이스 (1230) 및 전력 공급기 (1244) 는 시스템-온-칩 디바이스 (1222) 에 커플링된다. 더욱이, 특정 구현에서, 도 12 에 예시된 바와 같이, 디스플레이 (1228), 입력 디바이스 (1230), 스피커 (1236), 마이크로폰 어레이 (1238), 안테나 (1242), 및 전력 공급기 (1244) 는 시스템-온-칩 디바이스 (1222) 외부에 있다. 다른 구현들에서, 디스플레이 (1228), 입력 디바이스 (1230), 스피커 (1236), 마이크로폰 어레이 (1238), 안테나 (1242), 및 전력 공급기 (1244) 각각은 시스템-온-칩 디바이스 (1222) 의 컴포넌트, 예컨대 시스템-온-칩 디바이스 (1222) 의 인터페이스 또는 제어기에 커플링될 수도 있다. 예시적 예에서, 디바이스 (1200) 는 이동 디바이스, 통신 디바이스, 이동 통신 디바이스, 스마트폰, 셀룰러 폰, 랩톱 컴퓨터, 컴퓨터, 태블릿 컴퓨터, 퍼스널 디지털 보조기, 셋톱 박스, 디스플레이 디바이스, 텔레비전, 게이밍 콘솔, 뮤직 플레이어, 라디오, 디지털 비디오 플레이어, 디지털 비디오 디스크 (DVD) 플레이어, 광학 디스크 플레이어, 튜너, 카메라, 네비게이션 디바이스, 디코더 시스템, 인코더 시스템, 기지국, 비히클, 또는 이들의 임의의 조합에 대응한다.
설명된 구현들과 연관되어, 신호를 프로세싱하기 위한 장치는 입력 오디오 비트스트림의 제 1 프레임을 수신하기 위한 수단을 포함할 수도 있다. 제 1 프레임은 적어도, 제 1 주파수 범위와 연관된 저-대역 신호 및 제 2 주파수 범위와 연관된 고-대역 신호를 포함할 수도 있다. 예를 들어, 제 1 프레임을 수신하기 위한 수단은 도 1 의 디코더 (118), 도 2 및 도 6 의 디멀티플렉서 (202), 도 12 의 디코더 (1292), 하나 이상의 다른 구조물들, 디바이스들, 회로들, 또는 이들의 조합을 포함할 수도 있다.
장치는 또한, 저-대역 신호를 디코딩하여 중간 샘플링 레이트를 갖는 디코딩된 저-대역 신호를 생성하기 위한 수단을 포함할 수도 있다. 중간 샘플링 레이트는 제 1 프레임과 연관된 코딩 정보에 기초할 수도 있다. 예를 들어, 저-대역 신호를 디코딩하기 위한 수단은 도 1 의 디코더 (118), 도 2, 도 3, 및 도 6 의 저-대역 디코더 (206), 도 9 의 중간 채널 디코더 (902), 도 12 의 디코더 (1292), 하나 이상의 다른 구조물들, 디바이스들, 회로들, 또는 이들의 조합을 포함할 수도 있다.
장치는 또한, 중간 샘플링 레이트를 갖는 디코딩된 고-대역 신호를 생성하도록 고-대역 신호를 디코딩하기 위한 수단을 포함할 수도 있다. 예를 들어, 고-대역 신호를 디코딩하기 위한 수단은 도 1 의 디코더 (118), 도 2, 도 3, 및 도 6 의 고-대역 디코더 (208), 도 9 의 중간 채널 디코더 (902), 도 9 의 BWE (190), 도 9 의 ICBWE 유닛 (912), 도 12 의 디코더 (1292), 하나 이상의 다른 구조물들, 디바이스들, 회로들, 또는 이들의 조합을 포함한다.
장치는 또한, 중간 샘플링 레이트를 갖는 결합 신호를 생성하도록 적어도 디코딩된 저-대역 신호 및 디코딩된 고-대역 신호를 결합하기 위한 수단을 포함할 수도 있다. 예를 들어, 결합하기 위한 수단은 도 1 의 디코더 (118), 도 2, 도 3, 및 도 6 의 가산기 (210), 도 9 의 가산기들, 도 12 의 디코더 (1292), 하나 이상의 다른 구조물들, 디바이스들, 회로들, 또는 이들의 조합을 포함할 수도 있다.
장치는 또한, 결합 신호에 적어도 부분적으로 기초하여 리샘플링된 신호를 생성하기 위한 수단을 포함할 수도 있다. 리샘플링된 신호는 디코더의 출력 샘플링 레이트를 가질 수도 있다. 예를 들어, 리샘플링된 신호를 생성하기 위한 수단은 도 1 의 디코더 (118), 도 2 및 도 6 의 포스트-프로세싱 회로부 (212), 도 2 및 도 6 의 샘플러 (214), 도 9 의 리-샘플러 (914), 도 12 의 디코더 (1292), 하나 이상의 다른 구조물들, 디바이스들, 회로들, 또는 이들의 조합을 포함할 수도 있다.
설명된 구현들과 연관되어, 제 2 장치는 인코더로부터 중간 채널 오디오 비트스트림의 제 1 프레임을 수신하기 위한 수단을 포함할 수도 있다. 예를 들어, 제 1 프레임을 수신하기 위한 수단은 도 9 의 중간 채널 디코더 (902), 도 1 의 디코더 (118), 도 2 및 도 6 의 디멀티플렉서 (202), 도 12 의 디코더 (1292), 하나 이상의 구조들, 디바이스들, 회로들, 또는 이들의 조합을 포함할 수도 있다.
제 2 장치 또한, 제 1 프레임과 연관된 제 1 코딩 정보에 기초하여 제 1 프레임의 제 1 대역폭을 결정하기 위한 수단을 포함할 수도 있다. 제 1 코딩 정보는 제 1 프레임을 인코딩하도록 인코더에 의해 사용된 제 1 코딩 모드를 나타낼 수도 있고, 제 1 대역폭은 제 1 코딩 모드에 기초할 수도 있다. 예를 들어, 제 1 대역폭을 결정하기 위한 수단은 도 1 의 중간 샘플링 레이트 결정 회로부 (172), 도 1 의 디코더 (118), 도 12 의 디코더 (1292), 하나 이상의 다른 구조물들, 디바이스들, 회로들, 또는 이들의 조합을 포함할 수도 있다.
제 2 장치는 또한, 제 1 대역폭의 나이퀴스트 샘플링 레이트에 기초하여 중간 샘플링 레이트를 결정하기 위한 수단을 포함할 수도 있다. 예를 들어, 중간 샘플링 레이트를 결정하기 위한 수단은 도 1 의 중간 샘플링 레이트 결정 회로부 (172), 도 1 의 디코더 (118), 도 12 의 디코더 (1292), 하나 이상의 다른 구조물들, 디바이스들, 회로들, 또는 이들의 조합을 포함할 수도 있다.
제 2 장치는 또한, 디코딩된 중간 채널을 생성하도록 제 1 프레임의 인코딩된 중간 채널을 디코딩하기 위한 수단을 포함할 수도 있다. 예를 들어, 인코딩된 중간 채널을 디코딩하기 위한 수단은 도 1 의 디코더 (118), 도 2, 도 3, 및 도 6 의 저-대역 디코더 (206), 도 9 의 중간 채널 디코더 (902), 도 9 의 변환 유닛 (904), 도 12 의 디코더 (1292), 하나 이상의 다른 구조물들, 디바이스들, 회로들, 또는 이들의 조합을 포함할 수도 있다.
제 2 장치는 또한, 좌측 주파수-도메인 저-대역 신호 및 우측 주파수-도메인 저-대역 신호를 생성하도록 디코딩된 중간 채널 상에서 주파수-도메인 업믹스 동작을 수행하기 위한 수단을 포함할 수도 있다. 예를 들어, 주파수-도메인 업믹스 동작을 수행하기 위한 수단은 도 9 의 업믹서 (906), 도 12 의 디코더 (1292), 하나 이상의 다른 구조물들, 디바이스들, 회로들, 또는 이들의 조합을 포함할 수도 있다.
제 2 장치는 또한, 중간 샘플링 레이트를 갖는 좌측 시간-도메인 저-대역 신호를 생성하도록 좌측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하기 위한 수단을 포함할 수도 있다. 예를 들어, 주파수-투-시간 도메인 컨버전 동작을 수행하기 위한 수단은 도 9 의 역 변환 유닛 (908), 도 12 의 디코더 (1292), 하나 이상의 다른 구조물들, 디바이스들, 회로들, 또는 이들의 조합을 포함할 수도 있다.
제 2 장치는 또한, 중간 샘플링 레이트를 갖는 우측 시간-도메인 저-대역 신호를 생성하도록 우측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하기 위한 수단을 포함할 수도 있다. 예를 들어, 주파수-투-시간 도메인 컨버전 동작을 수행하기 위한 수단은 도 9 의 역 변환 유닛 (908), 도 12 의 디코더 (1292), 하나 이상의 다른 구조물들, 디바이스들, 회로들, 또는 이들의 조합을 포함할 수도 있다.
제 2 장치는 또한, 인코딩된 중간 채널에 적어도 기초하여, 중간 샘플링 레이트를 갖는 좌측 시간-도메인 고-대역 신호 및 중간 샘플 레이트를 갖는 우측 시간-도메인 고-대역 신호를 생성하기 위한 수단을 포함할 수도 있다. 예를 들어, 좌측 시간-도메인 고-대역 신호 및 우측 시간-도메인 고-대역 신호를 생성하기 위한 수단은 도 1 의 디코더 (118), 도 2, 도 3 및 도 6 의 고-대역 디코더 (208), 도 9 의 중간 채널 디코더 (902), 도 9 의 BWE 유닛 (910), 도 9 의 ICBWE 유닛 (912), 도 12 의 디코더 (1292), 하나 이상의 다른 구조물들, 디바이스들, 회로들, 또는 이들의 조합을 포함할 수도 있다.
제 2 장치는 또한, 좌측 시간-도메인 저-대역 신호 및 좌측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 좌측 신호를 생성하기 위한 수단을 포함할 수도 있다. 예를 들어, 좌측 신호를 생성하기 위한 수단은 도 1 의 디코더 (118), 도 2, 도 3, 및 도 6 의 가산기 (210), 도 9 의 가산기들, 도 12 의 디코더 (1292), 하나 이상의 다른 구조물들, 디바이스들, 회로들, 또는 이들의 조합을 포함할 수도 있다.
제 2 장치는 또한, 우측 시간-도메인 저-대역 신호 및 우측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 우측 신호를 생성하기 위한 수단을 포함할 수도 있다. 예를 들어, 우측 신호를 생성하기 위한 수단은 도 1 의 디코더 (118), 도 2, 도 3, 및 도 6 의 가산기 (210), 도 9 의 가산기들, 도 12 의 디코더 (1292), 하나 이상의 다른 구조물들, 디바이스들, 회로들, 또는 이들의 조합을 포함할 수도 있다.
제 2 장치는 또한, 디코더의 출력 샘플링 레이트를 갖는 좌측 리샘플링된 신호 및 출력 샘플링 레이트를 갖는 우측 리샘플링된 신호를 생성하기 위한 수단을 포함할 수도 있다. 좌측 리샘플링된 신호는 좌측 신호에 적어도 부분적으로 기초할 수도 있고, 우측 리샘플링된 신호는 우측 신호에 적어도 부분적으로 기초할 수도 있다. 예를 들어, 좌측 리샘플링된 신호 및 우측 리샘플링된 신호를 생성하기 위한 수단은 도 1 의 디코더 (118), 도 2 및 도 6 의 포스트-프로세싱 회로부 (212), 도 2 및 도 6 의 샘플러 (214), 도 9 의 리-샘플러 (914), 도 12 의 디코더 (1292), 하나 이상의 다른 구조물들, 디바이스들, 회로들, 또는 이들의 조합을 포함할 수도 있다.
도 13 을 참조하면, 기지국 (1300) 의 특정 예시적 예의 블록도가 도시된다. 다양한 구현들에서, 기지국 (1300) 은 도 13 에 예시된 것보다 더 많은 컴포넌트들 또는 더 적은 컴포넌트들을 가질 수도 있다. 예시적 예에서, 기지국 (1300) 은 도 1 의 시스템 (100) 을 포함할 수도 있다. 예시적 예에서, 기지국 (1300) 은 도 8a 및 도 8b 의 방법들 (800, 850) 또는 도 11a 및 도 11b 의 방법 (1100) 에 따라 동작할 수도 있다.
기지국 (1300) 은 무선 통신 시스템의 부분일 수도 있다. 무선 통신 시스템은 다수의 기지국들 및 다수의 무선 디바이스들을 포함할 수도 있다. 무선 통신 시스템은 롱 텀 에볼루션 (LTE) 시스템, 코드 분할 다중 액세스 (CDMA) 시스템, 모바일 통신용 글로벌 시스템 (GSM) 시스템, 무선 로컬 영역 네트워크 (WLAN) 시스템, 또는 일부 다른 무선 시스템일 수도 있다. CDMA 시스템은 광대역 CDMA (WCDMA), CDMA 1X, 에볼루션-데이터 최적화 (EVDO), 시간 분할 동기식 CDMA (TD-SCDMA), 또는 CDMA 의 일부 다른 버전을 구현할 수도 있다.
무선 디바이스들은 또한, 사용자 장비 (UE), 이동국, 단말기, 액세스 단말기, 가입자 유닛, 스테이션 등으로서 지칭될 수도 있다. 무선 디바이스들은 셀룰러 폰, 스마트폰, 태블릿, 무선 모뎀, 개인 휴대 정보단말 (PDA), 핸드헬드 디바이스, 랩톱 컴퓨터, 스마트북, 넷북, 태블릿, 코드리스 폰, 무선 로컬 루프 (WLL) 스테이션, 블루투스 디바이스 등을 포함할 수도 있다. 무선 디바이스들은 도 12 의 디바이스 (1200) 를 포함하거나 또는 이에 대응할 수도 있다.
다양한 기능들은 메시지들 및 데이터 (예를 들어, 오디오 데이터) 를 전송 및 수신하는 것과 같이, 기지국 (1300) 의 하나 이상의 컴포넌트들에 의해 (및/또는 도시되지 않은 다른 컴포넌트들에서) 수행될 수도 있다. 특정 예에서, 기지국 (1300) 은 프로세서 (1306)(예를 들어, CPU) 를 포함한다. 기지국 (1300) 은 트랜스코더 (1310) 를 포함할 수도 있다. 트랜스코더 (1310) 는 오디오 CODEC (1308) 을 포함할 수도 있다. 예를 들어, 트랜스코더 (1310) 는 오디오 CODEC (1308) 의 동작들을 수행하도록 구성된 하나 이상의 컴포넌트들 (예를 들어, 회로부) 을 포함할 수도 있다. 다른 예로서, 트랜스코더 (1310) 는 오디오 CODEC (1308) 의 동작들을 수행하기 위한 하나 이상의 컴퓨터-판독가능 명령들을 실행하도록 구성될 수도 있다. 오디오 CODEC (1308) 은 트랜스코더 (1310) 의 컴포넌트로서 예시되지만, 다른 예들에서 오디오 CODEC (1308) 의 하나 이상의 컴포넌트들은 프로세서 (1306), 다른 프로세싱 컴포넌트, 또는 이들의 조합에 포함될 수도 있다. 예를 들어, 보코더 디코더 (1338) 는 수신기 데이터 프로세서 (1364) 에 포함될 수도 있다. 다른 예로서, 보코더 인코더 (1336) 는 송신 데이터 프로세서 (1367) 에 포함될 수도 있다. 특정 구현에서, 보코더 디코더 (1338) 는 비-제한적 예들로서 도 1 의 디코더 (118), 도 2 의 시스템 (200), 도 3 의 저-대역 디코더 (206), 도 3 의 고-대역 디코더 (208), 도 6 의 시스템 (600), 도 7 의 풀-대역 디코더 (608), 도 9 의 시스템 (900), 또는 이들의 조합을 포함하거나 또는 이들에 대응할 수도 있다.
트랜스코더 (1310) 는 2 이상의 네트워크들 간에 메시지들 및 데이터를 트랜스코딩하도록 기능할 수도 있다. 트랜스코더 (1310) 는 메시지 및 오디오 데이터를 제 1 포맷 (예를 들어, 디지털 포맷) 에서 제 2 포맷으로 컨버팅하도록 구성될 수도 있다. 예시하기 위해, 보코더 디코더 (1338) 는 제 1 포맷을 갖는 인코딩된 신호들을 디코딩할 수도 있고 보코더 인코더 (1336) 는 디코딩된 신호들을 제 2 포맷을 갖는 인코딩된 신호들로 인코딩할 수도 있다. 부가적으로 또는 대안으로, 트랜스코더 (1310) 는 데이터 레이트 적응을 수행하도록 구성될 수도 있다. 예를 들어, 트랜스코더 (1310) 는 오디오 데이터의 포맷을 변화시키지 않고 데이터 레이트를 다운컨버팅 또는 데이터 레이트를 업컨버팅할 수도 있다. 예시하기 위해, 트랜스코더 (1310) 는 64 kbit/s 신호들을 16 kbit/s 신호들로 다운컨버팅할 수도 있다.
오디오 CODEC (1308) 은 보코더 인코더 (1336) 및 보코더 디코더 (1338) 를 포함할 수도 있다. 보코더 인코더 (1336) 는 인코드 선택기, 스피치 인코더, 및 뮤직 인코더를 포함할 수도 있다. 보코더 디코더 (1338) 는 디코더 선택기, 스피치 디코더, 및 뮤직 디코더를 포함할 수도 있다.
기지국 (1300) 은 메모리 (1332) 를 포함할 수도 있다. 메모리 (1332), 예컨대 컴퓨터 판독가능 저장 디바이스는 명령들을 포함할 수도 있다. 명령들은 도 8a 및 도 8b 의 방법들 (800, 850) 을 수행하도록 프로세서 (1306), 트랜스코더 (1310), 또는 이들의 조합에 의해 실행 가능한 하나 이상의 명령들을 포함할 수도 있다. 기지국 (1300) 은 안테나들의 어레이에 커플링된, 다수의 송신기들 및 수신기들 (예를 들어, 트랜시버들), 예컨대 제 1 트랜시버 (1352) 및 제 2 트랜시버 (1354) 를 포함할 수도 있다. 안테나들의 어레이는 제 1 안테나 (1342) 및 제 2 안테나 (1344) 를 포함할 수도 있다. 안테나들의 어레이는 하나 이상의 무선 디바이스들, 예컨대 도 12 의 디바이스 (1200) 와 무선으로 통신하도록 구성될 수도 있다. 예를 들어, 제 2 안테나 (1344) 는 무선 디바이스로부터 데이터 스트림 (1314)(예를 들어, 비트 스트림) 을 수신할 수도 있다. 데이터 스트림 (1314) 은 메시지들, 데이터 (예를 들어, 인코딩된 스피치 데이터), 또는 이들의 조합을 포함할 수도 있다.
기지국 (1300) 은 네트워크 접속 (1360), 예컨대 백홀 접속을 포함할 수도 있다. 네트워크 접속 (1360) 은 무선 통신 네트워크의 하나 이상의 기지국들 또는 코어 네트워크와 통신하도록 구성될 수도 있다. 예를 들어, 기지국 (1300) 은 네트워크 접속 (1360) 을 통해 코어 네트워크로부터 제 2 데이터 스트림 (예를 들어, 메시지들 또는 오디오 데이터) 을 수신할 수도 있다. 기지국 (1300) 은 제 2 데이터 스트림을 프로세싱하여 메시지들 또는 오디오 데이터를 생성하고 메시지들 또는 오디오 데이터를 안테나들의 어레이의 하나 이상의 안테나들을 통해 하나 이상의 무선 디바이스에 또는 네트워크 접속 (1360) 을 통해 다른 기지국에 제공할 수도 있다. 특정 구현에서, 네트워크 접속 (1360) 은 예시적인, 비-제한적 예로서 광역 네트워크 (WAN) 접속일 수도 있다. 일부 구현들에서, 코어 네트워크는 공중 전화 교환망 (PSTN), 패킷 백본 네트워크, 또는 양자 모두를 포함하거나 또는 이에 대응할 수도 있다.
기지국 (1300) 은 네트워크 접속 (1360) 및 프로세서 (1306) 에 커플링되는 매체 게이트웨이 (1370) 를 포함할 수도 있다. 매체 게이트웨이 (1370) 는 상이한 텔레통신 기술들의 매체 스트림들 사이에서 컨버팅하도록 구성될 수도 있다. 예를 들어, 매체 게이트웨이 (1370) 는 상이한 송신 프로토콜들, 상이한 코딩 스킴들, 또는 양자 모두 사이에서 컨버팅할 수도 있다. 예시하기 위해, 매체 게이트웨이 (1370) 는, 예시적인 비-제한적 예로서, PCM 신호들을 실시간 이송 프로토콜 (RTP) 신호들로 컨버팅할 수도 있다. 매체 게이트웨이 (1370) 는 패킷 스위칭된 네트워크들 (예를 들어, VoIP (Voice Over Internet Protocol) 네트워크, IP 멀티미디어 서브시스템 (IMS), 제 4 세대 (4G) 무선 네트워크, 예컨대 LTE, WiMax, 및 UMB, 등), 회선 교환 네트워크들 (예를 들어, PSTN), 및 하이브리드 네트워크들 (예를 들어, 제 2 세대 (2G) 무선 네트워크, 예컨대 GSM, GPRS, 및 EDGE, 제 3 세대 (3G) 무선 네트워크, 예컨대 WCDMA, EV-DO, 및 HSPA, 등) 사이에서 데이터를 컨버팅할 수도 있다.
부가적으로, 매체 게이트웨이 (1370) 는 트랜스코더, 예컨대 트랜스코더 (1310) 를 포함할 수도 있고, 코덱들이 호환 가능한 경우 데이터를 트랜스코딩하도록 구성될 수도 있다. 예를 들어, 매체 게이트웨이 (1370) 는 예시적인, 비-제한적 예로서 적응적 멀티-레이트 (AMR) 코덱과 G.711 코덱 사이에서 트랜스코딩할 수도 있다. 매체 게이트웨이 (1370) 는 라우터 및 복수의 물리적 인터페이스들을 포함할 수도 있다. 일부 구현들에서, 매체 게이트웨이 (1370) 는 또한 제어기 (미도시) 를 포함할 수도 있다. 특정 구현에서, 매체 게이트웨이 제어기는 매체 게이트웨이 (1370) 외부, 기지국 (1300) 외부, 또는 양자 모두에 있을 수도 있다. 매체 게이트웨이 제어기는 다수의 매체 게이트웨이들의 동작들을 제어 및 코디네이트할 수도 있다. 매체 게이트웨이 (1370) 는 매체 게이트웨이 제어기로부터 제어 신호들을 수신할 수도 있고 상이한 송신 기술들 간의 브리지로 기능할 수도 있으며 엔드-사용자 능력들 및 접속들에 서비스를 추가할 수도 있다.
기지국 (1300) 은 트랜시버들 (1352, 1354) 에 커플링되는 복조기 (1362), 수신기 데이터 프로세서 (1364), 및 프로세서 (1306) 를 포함할 수도 있고, 수신기 데이터 프로세서 (1364) 는 프로세서 (1306) 에 커플링될 수도 있다. 복조기 (1362) 는 트랜시버들 (1352, 1354) 로부터 수신된 변조된 신호들을 복조하고, 복조된 데이터를 수신기 데이터 프로세서 (1364) 에 제공하도록 구성될 수도 있다. 수신기 데이터 프로세서 (1364) 는 복조된 데이터로부터 메시지 또는 오디오 데이터를 추출하고, 메시지 또는 오디오 데이터를 프로세서 (1306) 로 전송하도록 구성될 수도 있다.
기지국 (1300) 은 송신 데이터 프로세서 (1367) 및 송신 다중 입력-다중 출력 (MIMO) 프로세서 (1368) 를 포함할 수도 있다. 송신 데이터 프로세서 (1367) 는 프로세서 (1306) 및 송신 MIMO 프로세서 (1368) 에 커플링될 수도 있다. 송신 MIMO 프로세서 (1368) 는 트랜시버들 (1352, 1354) 및 프로세서 (1306) 에 커플링될 수도 있다. 일부 구현들에서, 송신 MIMO 프로세서 (1368) 는 매체 게이트웨이 (1370) 에 커플링될 수도 있다. 송신 데이터 프로세서 (1367) 는 프로세서 (1306) 로부터 오디오 데이터 또는 메시지들을 수신하고 예시적인 비-제한적 예들로서, CDMA 또는 직교 주파수-분할 멀티플렉싱 (OFDM) 과 같은 코딩 스킴에 기초하여 메시지들 또는 오디오 데이터를 코딩하도록 구성될 수도 있다. 송신 데이터 프로세서 (1367) 는 코딩된 데이터를 송신 MIMO 프로세서 (1368) 에 제공할 수도 있다.
코딩된 데이터는 CDMA 또는 OFDM 기법들을 사용하여 파일롯 데이터와 같은 다른 데이터와 멀티플렉싱되어, 멀티플렉싱된 데이터를 생성할 수도 있다. 멀티플렉싱된 데이터는 그 후, 특정 변조 스킴 (예를 들어, 바이너리 위상-시프트 키잉 ("BPSK"), 쿼드러처 위상-시프트 키잉 ("QSPK"), M-ary 위상-시프트 키잉 ("M-PSK"), M-ary 쿼드러처 진폭 변조 ("M-QAM"), 등) 에 기초하여 송신 데이터 프로세서 (1367) 에 의해 변조 (즉, 심볼 맵핑) 되어 변조 심볼들을 생성할 수도 있다. 특정 구현에서, 코딩된 데이터 및 다른 데이터는 상이한 변조 스킴들을 사용하여 변조될 수도 있다. 각각의 데이터 스트림에 대한 데이터 레이트, 코딩, 및 변조는 프로세서 (1306) 에 의해 실행된 명령들에 의해 결정될 수도 있다.
송신 MIMO 프로세서 (1368) 는 송신 데이터 프로세서 (1367) 로부터 변조 심볼들을 수신하도록 구성될 수도 있고, 변조 심볼들을 더 프로세싱할 수도 있으며 데이터 상에서 빔포밍을 수행할 수도 있다. 예를 들어, 송신 MIMO 프로세서 (1368) 는 변조 심볼들에 빔포밍 가중치들을 적용할 수도 있다. 빔포밍 가중치들은, 변조 심볼들이 송신되는 안테나들의 어레이의 하나 이상의 안테나들에 대응할 수도 있다.
동작 동안, 기지국 (1300) 의 제 2 안테나 (1344) 는 데이터 스트림 (1314) 을 수신할 수도 있다. 제 2 트랜시버 (1354) 는 제 2 안테나 (1344) 로부터 데이터 스트림 (1314) 을 수신할 수도 있고 데이터 스트림 (1314) 을 복조기 (1362) 에 제공할 수도 있다. 복조기 (1362) 는 데이터 스트림 (1314) 의 변조된 신호들을 복조하고 복조된 데이터를 수신기 데이터 프로세서 (1364) 에 제공할 수도 있다. 수신기 데이터 프로세서 (1364) 는 복조된 데이터로부터 오디오 데이터를 추출하고, 추출된 오디오 데이터를 프로세서 (1306) 에 제공할 수도 있다.
프로세서 (1306) 는 오디오 데이터를 트랜스코딩을 위해 트랜스코더 (1310) 에 제공할 수도 있다. 트랜스코더 (1310) 의 보코더 디코더 (1338) 는 오디오 데이터를 제 1 포맷으로부터 디코딩된 오디오 데이터로 디코딩할 수도 있고 보코더 인코더 (1336) 는 디코딩된 오디오 데이터를 제 2 포맷으로 인코딩할 수도 있다. 일부 구현들에서, 보코더 인코더 (1336) 는 무선 디바이스로부터 수신된 것보다 더 높은 데이터 레이트 (예를 들어, 업컨버팅) 또는 더 낮은 데이터 레이트 (예를 들어, 다운컨버팅) 를 사용하여 오디오 데이터를 인코딩할 수도 있다. 다른 구현들에서, 오디오 데이터는 트랜스코딩되지 않을 수도 있다. 트랜스코딩 (예를 들어, 디코딩 및 인코딩) 은 트랜스코더 (1310) 에 의해 수행되는 것으로서 예시되지만, 트랜스코딩 동작들 (예를 들어, 디코딩 및 인코딩) 은 기지국 (1300) 의 다수의 컴포넌트들에 의해 수행될 수도 있다. 예를 들어, 디코딩은 수신기 데이터 프로세서 (1364) 에 의해 수행될 수도 있고 인코딩은 송신 데이터 프로세서 (1367) 에 의해 수행될 수도 있다. 다른 구현들에서, 프로세서 (1306) 는 다른 송신 프로토콜, 코딩 스킴, 또는 양자 모두로의 컨버전을 위해 매체 게이트웨이 (1370) 에 오디오 데이터를 제공할 수도 있다. 매체 게이트웨이 (1370) 는 컨버팅된 데이터를 네트워크 접속 (1360) 을 통해 다른 기지국 또는 코어 네트워크에 제공할 수도 있다.
보코더 디코더 (1338), 보코더 인코더 (1336), 또는 양자 모두는 파라미터 데이터를 수신할 수도 있고, 프레임 별 단위로 파라미터 데이터를 식별할 수도 있다. 보코더 디코더 (1338), 보코더 인코더 (1336), 또는 양자 모두는 프레임별 단위로, 파라미터 데이터에 기초하여 합성된 신호를 분류할 수도 있다. 합성된 신호는 스피치 신호, 넌-스피치 신호, 뮤직 신호, 잡음 스피치 신호, 백그라운드 잡음 신호, 또는 이들의 조합으로서 분류될 수도 있다. 보코더 디코더 (1338), 보코더 인코더 (1336), 또는 양자 모두는 이 분류에 기초하여 특정 디코더, 인코더, 또는 양자 모두를 선택할 수도 있다. 보코더 인코더 (1336) 에서 생성된 인코딩된 오디오 데이터, 예컨대 트랜스코딩된 데이터는 프로세서 (1306) 를 통해 송신 데이터 프로세서 (1367) 또는 네트워크 접속 (1360) 에 제공될 수도 있다.
트랜스코더 (1310) 로부터의 트랜스코딩된 오디오 데이터는 변조 스킴, 예컨대 OFDM 에 따른 코딩을 위해 송신 데이터 프로세서 (1367) 에 제공되어, 변조 심볼들을 생성할 수도 있다. 송신 데이터 프로세서 (1367) 는 추가의 프로세싱 및 빔포밍을 위해 변조 심볼들을 송신 MIMO 프로세서 (1368) 에 제공할 수도 있다. 송신 MIMO 프로세서 (1368) 는 빔포밍 가중치들을 적용할 수도 있고 변조 심볼들을 안테나들의 어레이의 하나 이상의 안테나들, 예컨대 제 1 트랜시버 (1352) 를 통한 제 1 안테나 (1342) 에 제공할 수도 있다. 따라서, 기지국 (1300) 은, 무선 디바이스로부터 수신된 데이터 스트림 (1314) 에 대응하는 트랜스코딩된 데이터 스트림 (1316) 을 다른 무선 디바이스에 제공할 수도 있다. 트랜스코딩된 데이터 스트림 (1316) 은 데이터 스트림 (1314) 과 상이한 인코딩 포맷, 데이터 레이트, 또는 양자 모두를 가질 수도 있다. 다른 구현들에서, 트랜스코딩된 데이터 스트림 (1316) 은 다른 기지국 또는 코어 네트워크로의 송신을 위해 네트워크 접속 (1360) 에 제공될 수도 있다.
기지국 (1300) 은 따라서, 프로세서 (예를 들어, 프로세서 (1306) 또는 트랜스코더 (1310)) 에 의해 실행되는 경우 프로세서로 하여금 입력 오디오 비트스트림의 제 1 프레임을 수신하는 것으로서, 제 1 프레임은 적어도 제 1 주파수 범위와 연관된 저-대역 신호 및 제 2 주파수 범위와 연관된 고-대역 신호를 포함하는, 상기 제 1 프레임을 수신하는 것, 저-대역 신호를 디코딩하여 중간 샘플링 레이트를 갖는 디코딩된 저-대역 신호를 생성하는 것으로서, 중간 샘플링 레이트는 제 1 프레임과 연관된 코딩 정보에 기초하는, 디코딩된 저-대역 신호를 생성하는 것, 고-대역 신호를 디코딩하여 중간 샘플링 레이트를 갖는 디코딩된 고-대역 신호를 생성하는 것, 고-대역 신호를 디코딩하여 중간 샘플링 레이트를 갖는 디코딩된 고-대역 신호를 생성하는 것, 적어도 디코딩된 저-대역 신호 및 디코딩된 고-대역 신호를 결합하여 중간 샘플링 레이트를 갖는 결합 신호를 생성하는 것, 및 결합 신호에 적어도 부분적으로 기초하여 디코더의 출력 샘플링 레이트를 갖는 리샘플링된 신호를 생성하는 것을 포함하는 동작들을 수행하게 하는 명령들을 저장하는 컴퓨터 판독가능 저장 디바이스 (예를 들어, 메모리 (1332)) 를 포함할 수도 있다.
전술된 설명의 구현들에서, 다양한 기능들은 도 1 의 시스템 (100) 의 컴포넌트들 또는 모듈과 같은 소정의 컴포넌트들 또는 모듈들에 의해 수행되는 것으로서 설명되어 있다. 그러나, 컴포넌트들 및 모듈들의 이 분할은 단지 예시를 위한 것이다. 대안의 예들에서, 특정 컴포넌트 또는 모듈에 의해 수행된 기능은 다수의 컴포넌트들 또는 모듈들 사이에 분할될 수도 있다. 더욱이, 다른 대안의 예들에서, 도 1 의 2 이상의 컴포넌트들 또는 모듈들은 단일의 컴포넌트 또는 모듈로 통합될 수도 있다. 도 1 에 예시된 각각의 컴포넌트 또는 모듈은 하드웨어 (예를 들어, ASIC, DSP, 제어기, FPGA 디바이스, 등), 소프트웨어 (예를 들어, 프로세서에 의해 실행 가능한 명령들), 또는 이들의 임의의 조합을 사용하여 구현될 수도 있다.
당업자는 또한, 본원에 개시된 구현들과 연관되어 설명된 다양한 예시적인 논리 블록들, 구성들, 모듈들, 회로들, 및 알고리즘 단계들이 전자 하드웨어, 프로세서에 의해 실행된 컴퓨터 소프트웨어, 또는 양자 모두의 조합으로서 구현될 수도 있음을 인지할 것이다. 다양한 예시적인 컴포넌트들, 블록들, 구성들, 모듈들, 회로들, 및 단계들은 그 기능에 관하여 일반적으로 전술되어 있다. 그러한 기능이 하드웨어 또는 프로세서 실행 가능 명령들로서 구현되는지 여부는 특정 애플리케이션 및 전체 시스템에 부과되는 설계 제약들에 의존한다. 당업자는, 설명된 기능성을 각각의 특정 애플리케이션에 대해 다양한 방식으로 구현할 수도 있지만, 이러한 구현 결정들은 본 개시물의 범위를 벗어나게 하는 것으로 해석되지 않아야 한다.
본원에서 개시된 구현들과 연관되어 설명된 방법 또는 알고리즘의 단계들은 하드웨어에, 프로세서에 의해 실행된 소프트웨어 모듈에, 또는 이들 둘의 조합에 직접적으로 포함될 수도 있다. 소프트웨어 모듈은 RAM, 플래시 메모리, ROM, PROM, EPROM, EEPROM, 레지스터들, 하드 디스크, 착탈형 디스크, CD-ROM 또는 당해 기술에 알려진 임의의 다른 형태의 비일시적 저장 매체에 수도 있다. 특정 저장 매체는, 프로세서가 저장 매체로부터 정보를 판독하고, 저장 매체에 정보를 기입하도록 프로세서에 커플링될 수도 있다. 대안에서, 저장 매체는 프로세서와 통합될 수도 있다. 프로세서 및 저장 매체는 ASIC 내에 있을 수도 있다. ASIC 는 컴퓨팅 디바이스 또는 사용자 단말 내에 있을 수도 있다. 대안에서, 프로세서와 저장 매체는 컴퓨팅 디바이스 또는 사용자 단말기에서 별개의 컴포넌트들로 있을 수도 있다.
이전 설명은 당업자가 개시된 구현들을 실시하거나 사용하는 것을 가능하게 하도록 제공된다. 이들 구현들에 대한 다양한 수정들이 당업자에게는 자명할 것이고, 본원에서 정의된 원리들은 본 개시물의 범위를 벗어나지 않으면서 다른 구현들에 적용될 수도 있다. 따라서, 본 개시물은 본원에서 보여진 구현들에 제한되도록 의도되지 않고, 다음의 청구항들에 의해 정의된 바와 같은 원리들 및 신규의 특성들과 가능한 일치하는 최광의 범위를 따르기 위한 것이다.

Claims (30)

  1. 오디오 디코딩을 위한 장치로서,
    인코더로부터 중간 채널 오디오 비트스트림의 제 1 프레임을 수신하도록 구성된 수신기; 및
    디코더를 포함하고,
    상기 디코더는,
    상기 제 1 프레임과 연관된 제 1 코딩 정보에 기초하여 상기 제 1 프레임의 제 1 대역폭을 결정하는 것으로서, 상기 제 1 코딩 정보는 상기 제 1 프레임을 인코딩하도록 상기 인코더에 의해 사용된 제 1 코딩 모드를 나타내고, 상기 제 1 대역폭은 상기 제 1 코딩 모드에 기초하는, 상기 제 1 프레임의 제 1 대역폭을 결정하고;
    상기 제 1 대역폭의 나이퀴스트 샘플링 레이트 및 상기 디코더의 출력 샘플링 레이트에 기초하여 중간 샘플링 레이트를 결정하고;
    상기 제 1 프레임의 인코딩된 중간 채널을 디코딩하여 상기 중간 샘플링 레이트로 디코딩된 중간 채널을 생성하고;
    상기 디코딩된 중간 채널 상에서 주파수-도메인 업믹스 동작을 수행하여 좌측 주파수-도메인 저-대역 신호 및 우측 주파수-도메인 저-대역 신호를 생성하고;
    상기 좌측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 상기 중간 샘플링 레이트를 갖는 좌측 시간-도메인 저-대역 신호를 생성하고;
    상기 우측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 상기 중간 샘플링 레이트를 갖는 우측 시간-도메인 저-대역 신호를 생성하고;
    상기 인코딩된 중간 채널에 적어도 기초하여, 상기 중간 샘플링 레이트를 갖는 좌측 시간-도메인 고-대역 신호 및 상기 중간 샘플링 레이트를 갖는 우측 시간-도메인 고-대역 신호를 생성하고;
    상기 좌측 시간-도메인 저-대역 신호 및 상기 좌측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 좌측 신호를 생성하고;
    상기 우측 시간-도메인 저-대역 신호 및 상기 우측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 우측 신호를 생성하며;
    상기 디코더의 출력 샘플링 레이트를 갖는 좌측 리샘플링된 신호 및 상기 출력 샘플링 레이트를 갖는 우측 리샘플링된 신호를 생성하는 것으로서, 상기 좌측 리샘플링된 신호는 상기 좌측 신호에 적어도 부분적으로 기초하고, 상기 우측 리샘플링된 신호는 상기 우측 신호에 적어도 부분적으로 기초하는, 상기 좌측 리샘플링된 신호 및 우측 리샘플링된 신호를 생성하도록 구성되고,
    상기 중간 샘플링 레이트는, 상기 나이퀴스트 샘플링 레이트가 상기 출력 샘플링 레이트보다 작은 경우 상기 나이퀴스트 샘플링 레이트와 동일하고, 상기 중간 샘플링 레이트는, 상기 출력 샘플링 레이트가 상기 나이퀴스트 샘플링 레이트 이하인 경우 상기 출력 샘플링 레이트와 동일한, 오디오 디코딩을 위한 장치.
  2. 제 1 항에 있어서,
    상기 디코더는 또한,
    제 1 인코딩된 중간 채널 상에서 디코딩 동작들을 수행하여 좌측 시간-도메인 풀-대역 신호 및 우측 시간-도메인 풀-대역 신호를 생성하도록 구성되고,
    상기 좌측 시간-도메인 풀-대역 신호는 상기 좌측 시간-도메인 저-대역 신호 및 상기 좌측 시간-도메인 고-대역 신호와 결합되어 상기 좌측 신호를 생성하며, 상기 우측 시간-도메인 풀-대역 신호는 상기 우측 시간-도메인 저-대역 신호 및 상기 우측 시간-도메인 고-대역 신호와 결합되어 상기 우측 신호를 생성하는, 오디오 디코딩을 위한 장치.
  3. 제 1 항에 있어서,
    상기 주파수-도메인 업믹스 동작은 이산 푸리에 변환 (DFT) 업믹스 동작을 포함하는, 오디오 디코딩을 위한 장치.
  4. 제 1 항에 있어서,
    상기 제 1 코딩 모드는 광대역 코딩 모드, 초-광대역 코딩 모드, 또는 풀-대역 코딩 모드를 포함하는, 오디오 디코딩을 위한 장치.
  5. 제 1 항에 있어서,
    상기 수신기는 또한, 상기 인코더로부터 상기 중간 채널 오디오 비트스트림의 제 2 프레임을 수신하도록 구성되며;
    상기 디코더는 또한,
    상기 제 2 프레임과 연관된 제 2 코딩 정보에 기초하여 상기 제 2 프레임의 제 2 대역폭을 결정하는 것으로서, 상기 제 2 코딩 정보는 상기 제 2 프레임을 인코딩하도록 상기 인코더에 의해 사용된 제 2 코딩 모드를 나타내고, 상기 제 2 대역폭은 상기 제 2 코딩 모드에 기초하는, 상기 제 2 프레임의 제 2 대역폭을 결정하고;
    상기 제 2 대역폭의 제 2 나이퀴스트 샘플링 레이트에 기초하여 제 2 중간 샘플링 레이트를 결정하고;
    상기 제 2 프레임의 제 2 인코딩된 중간 채널을 디코딩하여 제 2 디코딩된 중간 채널을 생성하고;
    상기 제 2 디코딩된 중간 채널 상에서 주파수-도메인 업믹스 동작을 수행하여 제 2 좌측 주파수-도메인 저-대역 신호 및 제 2 우측 주파수-도메인 저-대역 신호를 생성하고;
    상기 제 2 좌측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 상기 중간 샘플링 레이트를 갖는 제 2 좌측 시간-도메인 저-대역 신호를 생성하고;
    상기 제 2 우측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 상기 중간 샘플링 레이트를 갖는 제 2 우측 시간-도메인 저-대역 신호를 생성하고;
    상기 제 2 인코딩된 중간 채널에 적어도 기초하여, 상기 제 2 중간 샘플링 레이트를 갖는 제 2 좌측 시간-도메인 고-대역 신호 및 상기 제 2 중간 샘플링 레이트를 갖는 제 2 우측 시간-도메인 고-대역 신호를 생성하고;
    상기 제 2 좌측 시간-도메인 저-대역 신호 및 상기 제 2 좌측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 제 2 좌측 신호를 생성하고;
    상기 제 2 우측 시간-도메인 저-대역 신호 및 상기 제 2 우측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 제 2 우측 신호를 생성하며;
    상기 출력 샘플링 레이트를 갖는 제 2 좌측 리샘플링된 신호 및 상기 출력 샘플링 레이트를 갖는 제 2 우측 리샘플링된 신호를 생성하도록 구성되고,
    상기 제 2 좌측 리샘플링된 신호는 상기 제 2 좌측 신호에 적어도 부분적으로 기초하고, 상기 제 2 우측 리샘플링된 신호는 상기 제 2 우측 신호에 적어도 부분적으로 기초하는, 오디오 디코딩을 위한 장치.
  6. 제 5 항에 있어서,
    상기 제 2 중간 샘플링 레이트는, 상기 제 2 나이퀴스트 샘플링 레이트가 상기 출력 샘플링 레이트보다 작은 경우 상기 제 2 나이퀴스트 샘플링 레이트와 동일하고, 상기 제 2 중간 샘플링 레이트는, 상기 출력 샘플링 레이트가 상기 제 2 나이퀴스트 샘플링 레이트 이하인 경우 상기 출력 샘플링 레이트와 동일한, 오디오 디코딩을 위한 장치.
  7. 제 5 항에 있어서,
    상기 디코더는 또한,
    상기 제 2 중간 샘플링 레이트에 기초하여 상기 좌측 시간-도메인 저-대역 신호의 제 2 부분을 리샘플링하며;
    상기 좌측 시간-도메인 저-대역 신호의 리샘플링된 상기 제 2 부분 및 상기 제 2 좌측 시간-도메인 저-대역 신호의 제 1 부분 상에서 중첩-가산 (overlap-add) 동작을 수행하도록 구성되는, 오디오 디코딩을 위한 장치.
  8. 제 5 항에 있어서,
    상기 제 2 중간 샘플링 레이트는 상기 중간 샘플링 레이트와 상이한, 오디오 디코딩을 위한 장치.
  9. 제 1 항에 있어서,
    상기 수신기 및 상기 디코더는 기지국 또는 이동 디바이스를 포함하는 디바이스 안에 통합되는, 오디오 디코딩을 위한 장치.
  10. 오디오 신호를 디코딩하는 방법으로서,
    디코더에서, 인코더로부터 중간 채널 오디오 비트스트림의 제 1 프레임을 수신하는 단계;
    상기 제 1 프레임과 연관된 제 1 코딩 정보에 기초하여 상기 제 1 프레임의 제 1 대역폭을 결정하는 단계로서, 상기 제 1 코딩 정보는 상기 제 1 프레임을 인코딩하도록 상기 인코더에 의해 사용된 제 1 코딩 모드를 나타내고, 상기 제 1 대역폭은 상기 제 1 코딩 모드에 기초하는, 상기 제 1 프레임의 제 1 대역폭을 결정하는 단계;
    상기 제 1 대역폭의 나이퀴스트 샘플링 레이트 및 상기 디코더의 출력 샘플링 레이트에 기초하여 중간 샘플링 레이트를 결정하는 단계;
    상기 중간 샘플링 레이트를 갖는 저-대역 신호들을 생성하는 단계로서, 상기 저-대역 신호들은 좌측 시간-도메인 저-대역 신호 및 우측 시간-도메인 저-대역 신호를 포함하고, 상기 저-대역 신호들을 생성하는 단계는,
    상기 제 1 프레임의 인코딩된 중간 채널을 디코딩하여 상기 중간 샘플링 레이트로 디코딩된 중간 채널을 생성하는 단계;
    상기 디코딩된 중간 채널 상에서 주파수-도메인 업믹스 동작을 수행하여 좌측 주파수-도메인 저-대역 신호 및 우측 주파수-도메인 저-대역 신호를 생성하는 단계;
    상기 좌측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 상기 좌측 시간-도메인 저-대역 신호를 생성하는 단계; 및
    상기 우측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 상기 우측 시간-도메인 저-대역 신호를 생성하는 단계를 포함하는, 상기 저-대역 신호들을 생성하는 단계;
    상기 인코딩된 중간 채널에 적어도 기초하여, 상기 중간 샘플링 레이트를 갖는 좌측 시간-도메인 고-대역 신호 및 상기 중간 샘플링 레이트를 갖는 우측 시간-도메인 고-대역 신호를 생성하는 단계;
    상기 좌측 시간-도메인 저-대역 신호 및 상기 좌측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 좌측 신호를 생성하는 단계;
    상기 우측 시간-도메인 저-대역 신호 및 상기 우측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 우측 신호를 생성하는 단계; 및
    상기 디코더의 출력 샘플링 레이트를 갖는 좌측 리샘플링된 신호 및 상기 출력 샘플링 레이트를 갖는 우측 리샘플링된 신호를 생성하는 단계로서, 상기 좌측 리샘플링된 신호는 상기 좌측 신호에 적어도 부분적으로 기초하고, 상기 우측 리샘플링된 신호는 상기 우측 신호에 적어도 부분적으로 기초하는, 상기 좌측 리샘플링된 신호 및 우측 리샘플링된 신호를 생성하는 단계를 포함하고,
    상기 중간 샘플링 레이트는, 상기 나이퀴스트 샘플링 레이트가 상기 출력 샘플링 레이트보다 작은 경우 상기 나이퀴스트 샘플링 레이트와 동일하고, 상기 중간 샘플링 레이트는, 상기 출력 샘플링 레이트가 상기 나이퀴스트 샘플링 레이트 이하인 경우 상기 출력 샘플링 레이트와 동일한, 오디오 신호를 디코딩하는 방법.
  11. 제 10 항에 있어서,
    제 1 인코딩된 중간 채널 상에서 디코딩 동작들을 수행하여 좌측 시간-도메인 풀-대역 신호 및 우측 시간-도메인 풀-대역 신호를 생성하는 단계를 더 포함하고,
    상기 좌측 시간-도메인 풀-대역 신호는 상기 좌측 시간-도메인 저-대역 신호 및 상기 좌측 시간-도메인 고-대역 신호와 결합되어 상기 좌측 신호를 생성하며, 상기 우측 시간-도메인 풀-대역 신호는 상기 우측 시간-도메인 저-대역 신호 및 상기 우측 시간-도메인 고-대역 신호와 결합되어 상기 우측 신호를 생성하는, 오디오 신호를 디코딩하는 방법.
  12. 제 10 항에 있어서,
    상기 주파수-도메인 업믹스 동작은 이산 푸리에 변환 (DFT) 업믹스 동작을 포함하는, 오디오 신호를 디코딩하는 방법.
  13. 제 10 항에 있어서,
    상기 제 1 코딩 모드는 광대역 코딩 모드, 초-광대역 코딩 모드, 또는 풀-대역 코딩 모드를 포함하는, 오디오 신호를 디코딩하는 방법.
  14. 제 10 항에 있어서,
    상기 디코더에서, 상기 인코더로부터 상기 중간 채널 오디오 비트스트림의 제 2 프레임을 수신하는 단계;
    상기 제 2 프레임과 연관된 제 2 코딩 정보에 기초하여 상기 제 2 프레임의 제 2 대역폭을 결정하는 단계로서, 상기 제 2 코딩 정보는 상기 제 2 프레임을 인코딩하도록 상기 인코더에 의해 사용된 제 2 코딩 모드를 나타내고, 상기 제 2 대역폭은 상기 제 2 코딩 모드에 기초하는, 상기 제 2 프레임의 제 2 대역폭을 결정하는 단계;
    상기 제 2 대역폭의 제 2 나이퀴스트 샘플링 레이트에 기초하여 제 2 중간 샘플링 레이트를 결정하는 단계;
    상기 제 2 중간 샘플링 레이트를 갖는 제 2 저-대역 신호들을 생성하는 단계로서, 상기 제 2 저-대역 신호들은 제 2 좌측 시간-도메인 저-대역 신호 및 제 2 우측 시간-도메인 저-대역 신호를 포함하고, 상기 제 2 저-대역 신호들을 생성하는 단계는,
    상기 제 2 프레임의 제 2 인코딩된 중간 채널을 디코딩하여 제 2 디코딩된 중간 채널을 생성하는 단계;
    상기 제 2 디코딩된 중간 채널 상에서 주파수-도메인 업믹스 동작을 수행하여 제 2 좌측 주파수-도메인 저-대역 신호 및 제 2 우측 주파수-도메인 저-대역 신호를 생성하는 단계;
    상기 제 2 좌측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 상기 제 2 좌측 시간-도메인 저-대역 신호를 생성하는 단계; 및
    상기 제 2 우측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 상기 제 2 우측 시간-도메인 저-대역 신호를 생성하는 단계를 포함하는, 상기 제 2 저-대역 신호들을 생성하는 단계;
    상기 제 2 인코딩된 중간 채널에 적어도 기초하여, 상기 제 2 중간 샘플링 레이트를 갖는 제 2 좌측 시간-도메인 고-대역 신호 및 상기 제 2 중간 샘플링 레이트를 갖는 제 2 우측 시간-도메인 고-대역 신호를 생성하는 단계;
    상기 제 2 좌측 시간-도메인 저-대역 신호 및 상기 제 2 좌측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 제 2 좌측 신호를 생성하는 단계;
    상기 제 2 우측 시간-도메인 저-대역 신호 및 상기 제 2 우측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 제 2 우측 신호를 생성하는 단계; 및
    상기 출력 샘플링 레이트를 갖는 제 2 좌측 리샘플링된 신호 및 상기 출력 샘플링 레이트를 갖는 제 2 우측 리샘플링된 신호를 생성하는 단계를 더 포함하고,
    상기 제 2 좌측 리샘플링된 신호는 상기 제 2 좌측 신호에 적어도 부분적으로 기초하고, 상기 제 2 우측 리샘플링된 신호는 상기 제 2 우측 신호에 적어도 부분적으로 기초하는, 오디오 신호를 디코딩하는 방법.
  15. 제 14 항에 있어서,
    상기 제 2 중간 샘플링 레이트는, 상기 제 2 나이퀴스트 샘플링 레이트가 상기 출력 샘플링 레이트보다 작은 경우 상기 제 2 나이퀴스트 샘플링 레이트와 동일하고, 상기 제 2 중간 샘플링 레이트는, 상기 출력 샘플링 레이트가 상기 제 2 나이퀴스트 샘플링 레이트 이하인 경우 상기 출력 샘플링 레이트와 동일한, 오디오 신호를 디코딩하는 방법.
  16. 제 14 항에 있어서,
    상기 제 2 중간 샘플링 레이트에 기초하여 상기 좌측 시간-도메인 저-대역 신호의 제 2 부분을 리샘플링하는 단계; 및
    상기 좌측 시간-도메인 저-대역 신호의 리샘플링된 상기 제 2 부분 및 상기 제 2 좌측 시간-도메인 저-대역 신호의 제 1 부분 상에서 중첩-가산 동작을 수행하는 단계를 더 포함하는, 오디오 신호를 디코딩하는 방법.
  17. 제 14 항에 있어서,
    상기 제 2 중간 샘플링 레이트는 상기 중간 샘플링 레이트와 상이한, 오디오 신호를 디코딩하는 방법.
  18. 제 10 항에 있어서,
    상기 저-대역 신호들을 생성하는 단계, 상기 좌측 시간-도메인 고-대역 신호를 생성하는 단계, 상기 우측 시간-도메인 고-대역 신호를 생성하는 단계, 상기 좌측 신호를 생성하는 단계, 상기 우측 신호를 생성하는 단계, 상기 좌측 리샘플링된 신호를 생성하는 단계, 및 상기 우측 리샘플링된 신호를 생성하는 단계는, 기지국 또는 이동 디바이스를 포함하는 디바이스 내에서 수행되는, 오디오 신호를 디코딩하는 방법.
  19. 오디오 신호를 디코딩하기 위한 명령들을 포함하는 비일시적 컴퓨터 판독가능 저장 매체로서,
    상기 명령들은, 디코더 내의 프로세서에 의해 실행되는 경우, 상기 프로세서로 하여금,
    인코더로부터 중간 채널 오디오 비트스트림의 제 1 프레임을 수신하는 것;
    상기 제 1 프레임과 연관된 제 1 코딩 정보에 기초하여 상기 제 1 프레임의 제 1 대역폭을 결정하는 것으로서, 상기 제 1 코딩 정보는 상기 제 1 프레임을 인코딩하도록 상기 인코더에 의해 사용된 제 1 코딩 모드를 나타내고, 상기 제 1 대역폭은 상기 제 1 코딩 모드에 기초하는, 상기 제 1 프레임의 제 1 대역폭을 결정하는 것;
    상기 제 1 대역폭의 나이퀴스트 샘플링 레이트 및 상기 디코더의 출력 샘플링 레이트에 기초하여 중간 샘플링 레이트를 결정하는 것;
    상기 중간 샘플링 레이트를 갖는 저-대역 신호들을 생성하는 것으로서, 상기 저-대역 신호들은 좌측 시간-도메인 저-대역 신호 및 우측 시간-도메인 저-대역 신호를 포함하고, 상기 저-대역 신호들을 생성하는 것은,
    상기 제 1 프레임의 인코딩된 중간 채널을 디코딩하여 상기 중간 샘플링 레이트로 디코딩된 중간 채널을 생성하는 것;
    상기 디코딩된 중간 채널 상에서 주파수-도메인 업믹스 동작을 수행하여 좌측 주파수-도메인 저-대역 신호 및 우측 주파수-도메인 저-대역 신호를 생성하는 것;
    상기 좌측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 상기 좌측 시간-도메인 저-대역 신호를 생성하는 것; 및
    상기 우측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 상기 우측 시간-도메인 저-대역 신호를 생성하는 것을 포함하는, 상기 저-대역 신호들을 생성하는 것;
    상기 인코딩된 중간 채널에 적어도 기초하여, 상기 중간 샘플링 레이트를 갖는 좌측 시간-도메인 고-대역 신호 및 상기 중간 샘플링 레이트를 갖는 우측 시간-도메인 고-대역 신호를 생성하는 것;
    상기 좌측 시간-도메인 저-대역 신호 및 상기 좌측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 좌측 신호를 생성하는 것;
    상기 우측 시간-도메인 저-대역 신호 및 상기 우측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 우측 신호를 생성하는 것; 및
    상기 디코더의 출력 샘플링 레이트를 갖는 좌측 리샘플링된 신호 및 상기 출력 샘플링 레이트를 갖는 우측 리샘플링된 신호를 생성하는 것으로서, 상기 좌측 리샘플링된 신호는 상기 좌측 신호에 적어도 부분적으로 기초하고, 상기 우측 리샘플링된 신호는 상기 우측 신호에 적어도 부분적으로 기초하는, 상기 좌측 리샘플링된 신호 및 우측 리샘플링된 신호를 생성하는 것을 포함하는 동작들을 수행하게 하고,
    상기 중간 샘플링 레이트는, 상기 나이퀴스트 샘플링 레이트가 상기 출력 샘플링 레이트보다 작은 경우 상기 나이퀴스트 샘플링 레이트와 동일하고, 상기 중간 샘플링 레이트는, 상기 출력 샘플링 레이트가 상기 나이퀴스트 샘플링 레이트 이하인 경우 상기 출력 샘플링 레이트와 동일한, 비일시적 컴퓨터 판독가능 저장 매체.
  20. 제 19 항에 있어서,
    상기 동작들은,
    제 1 인코딩된 중간 채널 상에서 디코딩 동작들을 수행하여 좌측 시간-도메인 풀-대역 신호 및 우측 시간-도메인 풀-대역 신호를 생성하는 것을 더 포함하고,
    상기 좌측 시간-도메인 풀-대역 신호는 상기 좌측 시간-도메인 저-대역 신호 및 상기 좌측 시간-도메인 고-대역 신호와 결합되어 상기 좌측 신호를 생성하며, 상기 우측 시간-도메인 풀-대역 신호는 상기 우측 시간-도메인 저-대역 신호 및 상기 우측 시간-도메인 고-대역 신호와 결합되어 상기 우측 신호를 생성하는, 비일시적 컴퓨터 판독가능 저장 매체.
  21. 제 19 항에 있어서,
    상기 주파수-도메인 업믹스 동작은 이산 푸리에 변환 (DFT) 업믹스 동작을 포함하는, 비일시적 컴퓨터 판독가능 저장 매체.
  22. 제 19 항에 있어서,
    상기 제 1 코딩 모드는 광대역 코딩 모드, 초-광대역 코딩 모드, 또는 풀-대역 코딩 모드를 포함하는, 비일시적 컴퓨터 판독가능 저장 매체.
  23. 제 19 항에 있어서,
    상기 동작들은,
    상기 인코더로부터 상기 중간 채널 오디오 비트스트림의 제 2 프레임을 수신하는 것;
    상기 제 2 프레임과 연관된 제 2 코딩 정보에 기초하여 상기 제 2 프레임의 제 2 대역폭을 결정하는 것으로서, 상기 제 2 코딩 정보는 상기 제 2 프레임을 인코딩하도록 상기 인코더에 의해 사용된 제 2 코딩 모드를 나타내고, 상기 제 2 대역폭은 상기 제 2 코딩 모드에 기초하는, 상기 제 2 프레임의 제 2 대역폭을 결정하는 것;
    상기 제 2 대역폭의 제 2 나이퀴스트 샘플링 레이트에 기초하여 제 2 중간 샘플링 레이트를 결정하는 것;
    상기 제 2 중간 샘플링 레이트를 갖는 제 2 저-대역 신호들을 생성하는 것으로서, 상기 제 2 저-대역 신호들은 제 2 좌측 시간-도메인 저-대역 신호 및 제 2 우측 시간-도메인 저-대역 신호를 포함하고, 상기 제 2 저-대역 신호들을 생성하는 것은,
    상기 제 2 프레임의 제 2 인코딩된 중간 채널을 디코딩하여 제 2 디코딩된 중간 채널을 생성하는 것;
    상기 제 2 디코딩된 중간 채널 상에서 주파수-도메인 업믹스 동작을 수행하여 제 2 좌측 주파수-도메인 저-대역 신호 및 제 2 우측 주파수-도메인 저-대역 신호를 생성하는 것;
    상기 제 2 좌측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 상기 제 2 좌측 시간-도메인 저-대역 신호를 생성하는 것; 및
    상기 제 2 우측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 상기 제 2 우측 시간-도메인 저-대역 신호를 생성하는 것을 포함하는, 상기 제 2 저-대역 신호들을 생성하는 것;
    상기 제 2 인코딩된 중간 채널에 적어도 기초하여, 상기 제 2 중간 샘플링 레이트를 갖는 제 2 좌측 시간-도메인 고-대역 신호 및 상기 제 2 중간 샘플링 레이트를 갖는 제 2 우측 시간-도메인 고-대역 신호를 생성하는 것;
    상기 제 2 좌측 시간-도메인 저-대역 신호 및 상기 제 2 좌측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 제 2 좌측 신호를 생성하는 것;
    상기 제 2 우측 시간-도메인 저-대역 신호 및 상기 제 2 우측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 제 2 우측 신호를 생성하는 것; 및
    상기 출력 샘플링 레이트를 갖는 제 2 좌측 리샘플링된 신호 및 상기 출력 샘플링 레이트를 갖는 제 2 우측 리샘플링된 신호를 생성하는 것을 더 포함하고,
    상기 제 2 좌측 리샘플링된 신호는 상기 제 2 좌측 신호에 적어도 부분적으로 기초하고, 상기 제 2 우측 리샘플링된 신호는 상기 제 2 우측 신호에 적어도 부분적으로 기초하는, 비일시적 컴퓨터 판독가능 저장 매체.
  24. 제 23 항에 있어서,
    상기 제 2 중간 샘플링 레이트는, 상기 제 2 나이퀴스트 샘플링 레이트가 상기 출력 샘플링 레이트보다 작은 경우 상기 제 2 나이퀴스트 샘플링 레이트와 동일하고, 상기 제 2 중간 샘플링 레이트는, 상기 출력 샘플링 레이트가 상기 제 2 나이퀴스트 샘플링 레이트 이하인 경우 상기 출력 샘플링 레이트와 동일한, 비일시적 컴퓨터 판독가능 저장 매체.
  25. 제 23 항에 있어서,
    상기 동작들은,
    상기 제 2 중간 샘플링 레이트에 기초하여 상기 좌측 시간-도메인 저-대역 신호의 제 2 부분을 리샘플링하는 것; 및
    상기 좌측 시간-도메인 저-대역 신호의 리샘플링된 상기 제 2 부분 및 상기 제 2 좌측 시간-도메인 저-대역 신호의 제 1 부분 상에서 중첩-가산 동작을 수행하는 것을 더 포함하는, 비일시적 컴퓨터 판독가능 저장 매체.
  26. 오디오 디코딩을 위한 장치로서,
    인코더로부터 중간 채널 오디오 비트스트림의 제 1 프레임을 수신하기 위한 수단;
    상기 제 1 프레임과 연관된 제 1 코딩 정보에 기초하여 상기 제 1 프레임의 제 1 대역폭을 결정하기 위한 수단으로서, 상기 제 1 코딩 정보는 상기 제 1 프레임을 인코딩하도록 상기 인코더에 의해 사용된 제 1 코딩 모드를 나타내고, 상기 제 1 대역폭은 상기 제 1 코딩 모드에 기초하는, 상기 제 1 프레임의 제 1 대역폭을 결정하기 위한 수단;
    상기 제 1 대역폭의 나이퀴스트 샘플링 레이트 및 디코더의 출력 샘플링 레이트에 기초하여 중간 샘플링 레이트를 결정하기 위한 수단;
    상기 제 1 프레임의 인코딩된 중간 채널을 디코딩하여 상기 중간 샘플링 레이트로 디코딩된 중간 채널을 생성하기 위한 수단;
    상기 디코딩된 중간 채널 상에서 주파수-도메인 업믹스 동작을 수행하여 좌측 주파수-도메인 저-대역 신호 및 우측 주파수-도메인 저-대역 신호를 생성하기 위한 수단;
    상기 좌측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 상기 중간 샘플링 레이트를 갖는 좌측 시간-도메인 저-대역 신호를 생성하기 위한 수단;
    상기 우측 주파수-도메인 저-대역 신호 상에서 주파수-투-시간 도메인 컨버전 동작을 수행하여 상기 중간 샘플링 레이트를 갖는 우측 시간-도메인 저-대역 신호를 생성하기 위한 수단;
    상기 인코딩된 중간 채널에 적어도 기초하여, 상기 중간 샘플링 레이트를 갖는 좌측 시간-도메인 고-대역 신호 및 상기 중간 샘플링 레이트를 갖는 우측 시간-도메인 고-대역 신호를 생성하기 위한 수단;
    상기 좌측 시간-도메인 저-대역 신호 및 상기 좌측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 좌측 신호를 생성하기 위한 수단;
    상기 우측 시간-도메인 저-대역 신호 및 상기 우측 시간-도메인 고-대역 신호를 결합하는 것에 적어도 기초하여 우측 신호를 생성하기 위한 수단; 및
    출력 샘플링 레이트를 갖는 좌측 리샘플링된 신호 및 상기 출력 샘플링 레이트를 갖는 우측 리샘플링된 신호를 생성하기 위한 수단으로서, 상기 좌측 리샘플링된 신호는 상기 좌측 신호에 적어도 부분적으로 기초하고, 상기 우측 리샘플링된 신호는 상기 우측 신호에 적어도 부분적으로 기초하는, 상기 좌측 리샘플링된 신호 및 우측 리샘플링된 신호를 생성하는 수단을 포함하고,
    상기 중간 샘플링 레이트는, 상기 나이퀴스트 샘플링 레이트가 상기 출력 샘플링 레이트보다 작은 경우 상기 나이퀴스트 샘플링 레이트와 동일하고, 상기 중간 샘플링 레이트는, 상기 출력 샘플링 레이트가 상기 나이퀴스트 샘플링 레이트 이하인 경우 상기 출력 샘플링 레이트와 동일한, 오디오 디코딩을 위한 장치.
  27. 제 26 항에 있어서,
    상기 중간 샘플링 레이트를 결정하기 위한 수단은 이동 디바이스 또는 기지국을 포함하는 디바이스 안에 통합되는, 오디오 디코딩을 위한 장치.
  28. 삭제
  29. 삭제
  30. 삭제
KR1020187037310A 2016-06-27 2017-06-13 중간 샘플링 레이트를 사용한 오디오 디코딩 KR102497366B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020237004017A KR20230023821A (ko) 2016-06-27 2017-06-13 중간 샘플링 레이트를 사용한 오디오 디코딩

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662355138P 2016-06-27 2016-06-27
US62/355,138 2016-06-27
US15/620,685 US10249307B2 (en) 2016-06-27 2017-06-12 Audio decoding using intermediate sampling rate
US15/620,685 2017-06-12
PCT/US2017/037190 WO2018005079A1 (en) 2016-06-27 2017-06-13 Audio decoding using intermediate sampling rate

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020237004017A Division KR20230023821A (ko) 2016-06-27 2017-06-13 중간 샘플링 레이트를 사용한 오디오 디코딩

Publications (2)

Publication Number Publication Date
KR20190021253A KR20190021253A (ko) 2019-03-05
KR102497366B1 true KR102497366B1 (ko) 2023-02-07

Family

ID=60677798

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020187037310A KR102497366B1 (ko) 2016-06-27 2017-06-13 중간 샘플링 레이트를 사용한 오디오 디코딩
KR1020237004017A KR20230023821A (ko) 2016-06-27 2017-06-13 중간 샘플링 레이트를 사용한 오디오 디코딩

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020237004017A KR20230023821A (ko) 2016-06-27 2017-06-13 중간 샘플링 레이트를 사용한 오디오 디코딩

Country Status (9)

Country Link
US (2) US10249307B2 (ko)
EP (1) EP3475945B1 (ko)
JP (1) JP6873165B2 (ko)
KR (2) KR102497366B1 (ko)
CN (1) CN109328383B (ko)
AU (1) AU2017288254B2 (ko)
BR (1) BR112018076546A2 (ko)
TW (1) TWI725202B (ko)
WO (1) WO2018005079A1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10249307B2 (en) * 2016-06-27 2019-04-02 Qualcomm Incorporated Audio decoding using intermediate sampling rate
US10573326B2 (en) * 2017-04-05 2020-02-25 Qualcomm Incorporated Inter-channel bandwidth extension
KR102526699B1 (ko) * 2018-09-13 2023-04-27 라인플러스 주식회사 통화 품질 정보를 제공하는 방법 및 장치
KR102194595B1 (ko) 2019-02-22 2020-12-23 엘지전자 주식회사 워터 디스펜싱 장치
TWI703559B (zh) * 2019-07-08 2020-09-01 瑞昱半導體股份有限公司 音效編碼解碼電路及音頻資料的處理方法
CN111354365B (zh) * 2020-03-10 2023-10-31 苏宁云计算有限公司 一种纯语音数据采样率识别方法、装置、系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160055864A1 (en) 2013-04-05 2016-02-25 Dolby Laboratories Licensing Corporation Audio encoder and decoder
US20160055855A1 (en) 2013-04-05 2016-02-25 Dolby Laboratories Licensing Corporation Audio processing system

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6100164B2 (ja) * 2010-10-06 2017-03-22 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオ信号を処理し、音声音響統合符号化方式(usac)のためにより高い時間粒度を供給するための装置および方法
EP2676265B1 (en) * 2011-02-14 2019-04-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using an aligned look-ahead portion
US20140214431A1 (en) * 2011-07-01 2014-07-31 Dolby Laboratories Licensing Corporation Sample rate scalable lossless audio coding
US9570083B2 (en) * 2013-04-05 2017-02-14 Dolby International Ab Stereo audio encoder and decoder
FR3007563A1 (fr) 2013-06-25 2014-12-26 France Telecom Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
EP2830065A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980791A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions
US10249307B2 (en) 2016-06-27 2019-04-02 Qualcomm Incorporated Audio decoding using intermediate sampling rate

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160055864A1 (en) 2013-04-05 2016-02-25 Dolby Laboratories Licensing Corporation Audio encoder and decoder
US20160055855A1 (en) 2013-04-05 2016-02-25 Dolby Laboratories Licensing Corporation Audio processing system

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Bertrand Fatus. Parametric Coding for Spatial Audio. Master’s Thesis, KTH, Stockholm, Sweden. 2015.12.

Also Published As

Publication number Publication date
AU2017288254A1 (en) 2018-12-13
US10902858B2 (en) 2021-01-26
EP3475945A1 (en) 2019-05-01
AU2017288254B2 (en) 2022-02-24
US20190180761A1 (en) 2019-06-13
KR20230023821A (ko) 2023-02-17
WO2018005079A1 (en) 2018-01-04
JP6873165B2 (ja) 2021-05-19
BR112018076546A2 (pt) 2019-04-02
TW201810250A (zh) 2018-03-16
TWI725202B (zh) 2021-04-21
EP3475945B1 (en) 2021-08-18
US20170372708A1 (en) 2017-12-28
JP2019519002A (ja) 2019-07-04
CN109328383B (zh) 2023-05-26
KR20190021253A (ko) 2019-03-05
US10249307B2 (en) 2019-04-02
CN109328383A (zh) 2019-02-12

Similar Documents

Publication Publication Date Title
US11094330B2 (en) Encoding of multiple audio signals
US9978381B2 (en) Encoding of multiple audio signals
KR102497366B1 (ko) 중간 샘플링 레이트를 사용한 오디오 디코딩
US10115403B2 (en) Encoding of multiple audio signals
US10885925B2 (en) High-band residual prediction with time-domain inter-channel bandwidth extension
US20190147896A1 (en) Encoding of multiple audio signals
CN110770825A (zh) 时域通道间预测
KR102264105B1 (ko) 멀티 채널 디코딩

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant